2 整合子的结构和分2.1 整合子的结构整合子的结构如图1所示,由3个部分组成:5′保守末端(5′conserved segment,5′CS)、3′保守末端(3′conserved segment,3′CS)和两者之间的可变区(vari�able region)。5′CS是整合子的基本结构,包括编码整合酶(integrase,IntI)的基因(intI)、整合子重组位点attI和整合子可变区
启动子(Pant)[6]。IntI属于
酪氨酸整合酶家族,催化基因盒在整合子重组位点attI和基因盒重组位点attC之间的整合和剪切。整合酶基因带有自己的启动子Pint。attI位于整合酶基因的上游,是外源基因盒整合到整合子上的位点。启动子Pant指导下游可变区中自身不带有启动子的基因盒中基因的表达。启动子Pant的方向与Pint的方向相反。可变区带有不同数量和功能的基因盒,但可变区并不是整合子的基本结构,有的整合子在5′CS和3′CS之间没有基因盒插入[7]。3′CS因整合子的种类不同而异。 2.2 整合子的分类
整合子常根据intI基DNA序列的不同进行分类,研究较多的主要有以下4类: 第一类整合子最常见,从临床菌株中发现的整合子大多属于此类。其整合酶IntI1含有337个
氨基酸。5′CS有编码IntI1的基因intI1、重组位点attI1和启动子Pant。其中Pant位于IntI1的编码框内,有的整合子还有启动子P2[1]。大多数第一类整合子的3′CS包括3个开放读码框(ORF):
磺胺耐药基因(sul1),
季铵盐化合物及溴乙锭的耐受基因(qacE△1)及功能不明的ORF5[8]。可变区带有不同数量的基因盒,大部分是编码各种抗生素抗性的耐药基因盒。第二类整合子存在于Tn7或它的衍生物上,其整合酶基因intI2被一个
终止密码子中断,是缺陷的整合酶基因,它的产物IntI2约有318个氨基酸,与IntI1有40%的同源性[9,10]。IntI2不能催化基因盒的整合与剪切。目前仅发现核苷转移酶基因aadAla、
甲氧苄啶耐药基因dhfr及链丝霉素耐药基因sat位于该类整合子上。现已在
沙门菌、志贺菌和不动杆菌中发现第二类整合子。
第三类整合子最初由Arakawa在耐
碳青霉烯类抗生素的粘质沙雷菌的质粒上发现的,其整合酶IntI3有346个氨基酸,与IntI1有60.9%的同源性。目前仅在粘质沙雷菌、
肺炎克雷伯菌等细菌中分离出第三类整合子,只发现碳青霉烯耐药基因位于该整合子上[11,12]。
以上三类整合子与细菌耐药基因的播散密切相关,常被合称为耐药整合子(resistance integron,RI)。第四类整合子是Mazel等[13]在
霍乱弧菌基因组中首次发现,其整合酶IntI4有320个氨基酸,与前三类整合子的整合酶有45%~50%的同源性。此类整合子的可变区可带有上百个基因盒,故又称为超级整合子(superintegron,SI)。SI基因盒中的基因除了与细菌耐药有关外,还与细菌的代谢和毒力有关[14]。除霍乱弧菌外,在梅氏弧菌、费氏弧菌、拟态弧菌等细菌的染色体基因组中也发现了超级整合子。
此外,可根据整合子是否具有可移动性将整合子分为移动性整合子(mobile integrons)和超级整合子[14]。移动性整合子与移动性基因元件结合在一起,可伴随移动性基因元件一起移动,与细菌耐药基因的播散密切相关。超级整合子位于染色体上并成为染色体的一部分而不能自由移动。
3 基因盒的结构3.1 基因盒的结构基因盒是一种可移动性基因元件,可以环状的形式独立存在,也可整合入整合子中而成为整合子结构的一部分[1]。基因盒的结构如图2,由单一基因(结构基因)和一个整合位点attC组成。由于第一个被发现的attC长度为59bp,所以attC又称为59碱基元件(59 base elements,59be)。第四类整合子的attC位点称为霍乱弧菌重复序列(Vibrio cholera repetitive sequences,VCRs)。attC位点的长度为57~141bp,是一个不完全的反向重复序列,并含有可被整合酶识别的特异性整合位点。attC位点的两端分别为一7碱基对的保守片段,分别称为核心位点(core site,CS)和反向核心位点(inverse core site,ICS)。核心位点的共同序列为GTTRRRY(R:嘌吟,Y:
嘧啶),核心位点位于attC位点的右侧,互补的反向核心位点序列为RYYYAAC,位于attC位点的左侧。当游离的环状基
A:环状基因盒; B:线性基因盒 基因盒的结构因盒在整合酶的催化下与整合子的attI发生位点特异性重组时