CN1462801A - 对大肠杆菌052的0-抗原特异的核苷酸 - Google Patents

对大肠杆菌052的0-抗原特异的核苷酸 Download PDF

Info

Publication number
CN1462801A
CN1462801A CN 03129936 CN03129936A CN1462801A CN 1462801 A CN1462801 A CN 1462801A CN 03129936 CN03129936 CN 03129936 CN 03129936 A CN03129936 A CN 03129936A CN 1462801 A CN1462801 A CN 1462801A
Authority
CN
China
Prior art keywords
gene
nucleotide
bases
antigen
intestinal bacteria
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 03129936
Other languages
English (en)
Other versions
CN1274825C (zh
Inventor
王磊
杨静华
冯露
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nankai University
Original Assignee
Nankai University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nankai University filed Critical Nankai University
Priority to CN 03129936 priority Critical patent/CN1274825C/zh
Publication of CN1462801A publication Critical patent/CN1462801A/zh
Application granted granted Critical
Publication of CN1274825C publication Critical patent/CN1274825C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供一种对大肠杆菌052(Escherichia coli052)的0-抗原特异的核苷酸,它是大肠杆菌052中控制0-抗原合成的基因簇的核苷酸全序列,如SEQ ID NO:1所示的分离的核苷酸,全长18900个碱基;或者具有一个或多个插入、缺失或取代的碱基,同时保持所述分离的核苷酸功能的SEQ IDNO:1的核苷酸;还包括源于大肠杆菌052的0-抗原基因簇中的糖基转移酶基因和寡糖单位处理基因的寡核苷酸,本发明通过PCR证实寡核苷酸对大肠杆菌052的0-抗原有高度的特异性;本发明还公开了用本发明的寡核苷酸检测和鉴定人体及环境中的大肠杆菌052的方法。

Description

对大肠杆菌O52的O-抗原特异的核苷酸
技术领域
本发明涉及大肠杆菌O52(Escherichia coli O52)中控制O-抗原合成的基因簇的核苷酸全序列,特别是涉及大肠杆菌O52中控制O-抗原合成的基因簇中的寡核苷酸,可利用这些对O-抗原特异的寡核苷酸快速、准确地检测人体及环境中的大肠杆菌O52,并鉴定这一致病菌中的O-抗原。
背景技术
大肠杆菌是引起人尿道感染和许多肠胃疾病如婴幼儿腹泻、旅行者腹泻等的最常见的原因之一,位于大肠杆菌表面的脂多糖是其致病的诱因,而O-抗原是脂多糖最外层结构,是免疫系统识别的目标和噬菌体吸附的位点。O-抗原的缺失会造成许多病原体的血清敏感,或者严重削弱病原体的毒力[Frank et a1(1987)“The function of antibody and complement in the lysisof bacteria”.Rev Infect Dis 177:1750-1753.Pluschke G et al“Role ofthe capsule and the O-antigen in resistance of O18:KlEscherichia colito complement-mediated king.J Bacteriol 42:907-913]。大肠杆菌是一个种,种内的菌株一般通过O-抗原和H-抗原(有时通过K-抗原)来鉴定。其中O-抗原具有高度多样性,大肠杆菌有166种不同的O-抗原,O-抗原的变化可能是大肠杆菌的起源和维持其多样性的主要原因[Reeves,P.R(1992)“Variation in antigens,niche specific selection and bacterialpopulations”.FEMS Microbiol.Lett,100:509-516]。有些O-抗原如O157,O111,O26具有强烈的致病性。大肠杆菌O52:H19属于STEC(Shiga toxin-producing Escherichia coli),即产Shiga毒素(stx)的大肠杆菌[SabineFurst etal(2000)“Identification and characterisation of Escherichiacoli strain of O157 and non-O157 serogroups containing three distinctShiga toxin genes”.J.Med.Microbiol.Vol 49,383-388]。STEC菌株是引起出血性结肠炎和溶血尿毒综合症(HUS)的常见原因,大量证据表明Shiga毒素在HUS的致病性上扮演重要角色[Obrif TG,Del Vecchio P J,Brown J Eetal.(1988).“Diret cytotoxic action of Shiga toxin on human vascularendothelial cells”.Infect Immun,56:2372-2378.Louse CB,ObrigTG(1995).Specific interaction of Escherichia xoli O157:H7 derivedShiga-like toxin II with human renal endothelical cells.J.InfectDis,172:1397-1401]。而大肠杆菌O52:H10属于产肠毒素的大肠杆菌(enterotoxigenic Escherichia coli,ETEC)。以前的流行病工作表明ETEC在婴幼儿腹泻中常表现出来[Begaud E,Mondet D,Germani Y.(1993)“Molecular characterization of enterotoxigenic Escherichia coli(ETEC)isolated in New Caledonia(value of potential protectiveantigens in oral vaccine candidates)”,Res Microbiol,Nov-Dec;144(9):721-728]。而ETEC又常出现在社会经济地位低,卫生条件差,有水及食物污染源的情况下,并在夏季多发。ETEC也是旅行者腹泻和在成人中几次爆发的主要的初始原因,在发展中国家ETEC的感染高峰是在两岁以内[Black RE,(1981)“Enterotoxigenic Escherichia coli diarrhoea:acquiredimmunity and transmission in an endemicarea”BULL WHO.159:253-258.N.Taneja etal(2003)“Nosocomial outbreak of diarrhoea byenterotoxigenic Escherichia coli among preterm neonates in a tertiarycare hospital in India:pitfalls in healthcare”Journal of HospitalInfection,53:193-197]。
O-抗原是革兰氏阴性细菌脂多糖中的O特异性多糖成分,它由许多重复的寡糖单位组成。O-抗原的合成过程研究得较清楚:先由糖基转移酶将核苷二磷酸单糖转移到一个固定在细胞内膜的脂分子上,然后在内膜的内侧合成寡糖单位,O-抗原的寡糖单位再通过转运酶被转移到内膜外侧,而后通过聚合酶聚合成多糖,再被连接到一个糖脂分子上形成脂多糖分子[Whitfield,C.(1995)“Biosynthesis of lipopolysaccharide Oantigens”.Trends in Microbiology.3:178-185;Schnaitman,C.A.andJ.D.Klena.(1993)“Genetics of lipopolysaccharide biosynthesis inentericbacteria”.Microbiological Reviews,57(3):655-682]。编码负责O-抗原合成的所有酶分子的基因一般在染色体上相邻排列,形成一个基因簇[Reeves,P.R.,et al.(1996)“Bacterial polysaccharide synthesis and genenomenclature”Trends in Microbiology,4:495-503]。在大肠杆菌和沙门氏菌中,O-抗原基因簇位于galF和gnd基因之间[Lei Wang.et al(2001)“Sequenceanalysis of four Shigella boydii O-antigen loci:implication forEscherichia coli and Shigella relationships”.Infection andImmunity,11:6923-6930;Lei Wang and Peter Reeves(2000)“TheEscherichia coli O111 and Salmonella enterica O35 gene clusters:geneclusters encoding the same colitose-containing O antigen are highlyconserved”.Journal of Bacteriology.182:5256-5261]。O-抗原基因簇含有三类基因:糖合成路径基因,糖基转移酶基因,寡糖单位处理基因。其中糖合成路径基因编码的酶合成O-抗原所需的核苷二磷酸单糖;糖基转移酶基因编码的酶将核苷二磷酸单糖及其它分子转到单糖上从而使单糖聚合成寡糖单位;寡糖单位处理基因包括转运酶基因和聚合酶基因,它们将寡糖单位转移到细菌内膜外侧,再聚合成多糖。糖基转移酶基因和寡糖单位处理基因只存在于携带这些基因的基因簇里。O-抗原中单糖的不同,单糖间联结键的不同和寡糖单位之间联结键的不同构成了O-抗原的多样性,而单糖的组成、单糖间的联结键及寡糖单位之间的联结键是由O-抗原基因簇中的基因控制着,所以O-抗原基因簇决定了O-抗原的合成,也决定了O-抗原的多样性。
目前在大肠杆菌中发现寡糖单位处理基因有两类。一类是wzx和wzy基因,它们分别编码转运酶和聚合酶,它们是在绝大多数大肠杆菌的O-抗原基因簇中从事寡糖单位转移和聚合的基因,是最常见的寡糖单位处理基因。另一类是ABC转运系统(ATP-binding cassette transport system),包括ABC转运子(ABC transporter)和结合ATP的ABC转运蛋白(ABC transportprotein),它们在大肠杆菌的O-抗原基因簇中分别由wzm基因和wzt基因编码。在大肠杆菌中,目前只发现在O8、O9的O-抗原基因簇中有ABC转运系统[NKido et al(1995)”Expression of the O9 polysaccharide of Eschefichiacoli:sequencing of the E.coli O9 rfb gene cluster,characterizationof mannosyl transferases,and evidence for an ATP-binding cassettetransport system”J.Bacteriol,2178-2187,Vol 177,No.8]。研究表明,组成O-抗原的多糖是在细胞膜的内膜面向细胞质一面进行组装,然后通过ABC转运系统转到膜外。在ABC转运系统中,聚合和转位机制似乎是协同作用的。而且这种聚合转位机制可能和膜结合的多糖的生物合成机制相联系,并形成一个巨大的分子复合物。[Joanne Young and I.Barry Holland(1999)“ABCtransporters:bacterial exporters-revisited five years on”Biochimica et Biophysica Acta.1461:177-200;W.Saurin,E.Dassa(1994),Protein Sci.3:325-344]。
因为O-抗原是极强的抗原,是大肠杆菌重要的致病因素之一,同时它又具有极强的多样性,这启示我们能研究一种快速、准确地检测大肠杆菌及其O-抗原的特异性好、灵敏度高的方法。以表面多糖为目标的血清学免疫反应自上世纪30年代以来一直被用于对细菌的分型和鉴定,是鉴定致病菌的唯一的手段。这种诊断方法需要大量的抗血清,而抗血清一般种类不全,数量不足,大量的抗血清在制备和储存中也存在一些困难。另一方面此法耗时长、灵敏度低、漏检率高、准确性差,所以,现在普遍认为这种传统的血清学检测方法将为现代分子生物学方法取代。1993年,Luk,J.M.C et.al用沙门氏菌(S.enterica)O-抗原基因簇的特异核苷酸序列通过PCR方法鉴定了沙门氏菌的O-抗原[Luk,J.M.C.et.al.(1993)“Selective amplification ofabequose and paratose synthase genes(rfb)by polymerase chain reactionfor identification of S.enterica ma jor serogroups(A,B,C2,and D)”,J.Clin.Microbiol.31:2118-2123]。Luk,et.al的方法是将相应于沙门氏菌血清型E1,D1,A,B和C2的O-抗原内的CDP-阿比可糖和CDP-泰威糖的合成基因的核苷酸序列排列后得到对不同血清型的沙门氏菌特异的寡核苷酸。1996年,Paton,A.W et.al用对E.coli O111的O-抗原特异的源于wbdI基因的寡核苷酸鉴定了一株产毒素的E.coli O111的血清型[“Molecularmicrobiological investigation of an outbreak of Hemolytic-UremicSyndrome caused by dry fermented sausage contaminated with Shiga-liketoxin producing Escherichia coli”J.Clin.Microbiol.34:1622-1627],但是后来的研究表明Paton,A.W et.al的用源于wbdI基因的寡核苷酸鉴定E.coli O111的血清型的方法有假阳性结果出现。Bastin D.A.and Reeves,P.R.认为,这是由于wbdI基因是一个推测的糖合成路径基因[Bastin D.A.andReeves,P.R.(1995)Sequence and analysis of the O antigen gene(rfb)cluster of Escherichia coli O111.Gene 164:17-23],在其它细菌的O-抗原的结构中也可能有这个糖,所以糖合成路径基因对于O-抗原并不是高度特异的。
发明内容
本发明的目的是提供了一种对大肠杆菌O52的O-抗原特异的核苷酸。它是大肠杆菌O52的O-抗原基因簇中的核苷酸,是源于糖基转移酶基因和ABC转运系统基因的特异的核苷酸。
本发明的一个目的是提供了大肠杆菌O52的O-抗原基因簇的全长核苷酸序列。
本发明的次一目的是提供了构成大肠杆菌O52的O-抗原基因簇的基因:ABC转运系统的基因wzm,wzt;糖基转移酶基因,包括orf5、orf14、orf15、orf16;糖合成路径基因,包括rmlB、rmlA、galE、glf、dmhB、dmhA、hddA、gmhA、hddC、gmhB。
本发明的又一目的是提供了寡核苷酸,它们分别源于大肠杆菌O52的O-抗原基因簇中编码糖基转移酶的基因包括orf5、orf14、orf15、orf16;源于编码ABC转运系统的wzm基因;它们是上述基因内的寡核苷酸,长度在10-20nt;它们对大肠杆菌O52的O-抗原是特异的;尤其是表1中列出的寡核苷酸,它们对大肠杆菌O52的O-抗原是高度特异的,而且这些寡核苷酸还可重新组合,组合后的寡核苷酸对大肠杆菌O52的O-抗原也是高度特异的。
本发明的另一个目的是提供的上述寡核苷酸可作为引物用于核酸扩增反应,或者作为探针用于杂交反应,或者用于制造基因芯片或微阵列,从而通过这些方法来检测和鉴定大肠杆菌O52的O-抗原及检测和鉴定大肠杆菌O52。
本发明的再一个目的是提供了分离大肠杆菌O52的O-抗原基因簇全序列的方法,按照本方法操作可以获得其他细菌的O-抗原基因簇全序列,也可以获得编码其他多糖抗原的细菌的基因簇的全序列。
本发明的目的是由以下技术方案实现的。
本发明是对大肠杆菌O52的O-抗原特异的核苷酸,其特征在于,其是如SEQ ID NO:1所示的分离的核苷酸,全长18900个碱基;或者具有一个或多个插入、缺失或取代的碱基,同时保持所述分离的核苷酸功能的SEQ ID NO:1的核苷酸。
前述的对大肠杆菌O52的O-抗原特异的核苷酸,其特征在于,其由16个基因组成,都位于galF基因和gnd基因之间。
前述的对大肠杆菌O52的O-抗原特异的核苷酸,其特征在于,所述的基因是:ABC转运系统的wzm基因;糖基转移酶基因,包括orf5、orf14、orf15、orf16基因;其中所述的基因orf5是SEQ ID NO:1中的5239至6093碱基的核苷酸;wzm是SEQ ID NO:1中的6095至6868碱基的核苷酸;orf14是SEQID NO:1中的12608至13936碱基的核苷酸;orf15是SEQ ID NO:1中的13929至16088碱基的核苷酸;orf16是SEQ ID NO:1中的16244至17389碱基的核苷酸。
前述的对大肠杆菌O52的O-抗原特异的核苷酸,其特征在于,其源于所述的ABC转运系统的基因或糖基转移酶基因;或糖合成路径基因中的寡核苷酸;以及它们的混合或它们的重组。
前述的对大肠杆菌O52的O-抗原特异的核苷酸,其特征在于,所述的
源于orf5基因的寡核苷酸对是:
SEQ ID NO:1中的5445至5462碱基的核苷酸和5970至5988碱基的核苷酸;SEQ ID NO:1中的5266至5283碱基的核苷酸和5651至5668碱基的核苷酸;SEQ ID NO:1中的5362至5379碱基的核苷酸和5783至5800碱基的核苷酸;
源于wzm基因的寡核苷酸对是:
SEQ ID NO:1中的6314至6331碱基的核苷酸和6840至6857碱基的核苷酸;SEQ ID NO:1中的6180至6197碱基的核苷酸和6689至6705碱基的核苷酸;SEQ ID NO:1中的6422至6439碱基的核苷酸和6711至6728碱基的核苷酸;
源于orf14基因的寡核苷酸对是:
SEQ ID NO:1中的12940至12958碱基的核苷酸和13869至13886碱基的核苷酸;SEQ ID NO:1中的13003至13020碱基的核苷酸和13743至13762碱基的核苷酸;SEQ ID NO:1中的13853至13872碱基的核苷酸和13345至13363碱基的核苷酸;
源于orf15基因的寡核苷酸对是:
SEQ ID NO:1中的14317至14335碱基的核苷酸和15064至15080碱基的核苷酸;SEQ ID NO:1中的14518至145 35碱基的核苷酸和15248至15267碱基的核苷酸;SEQ ID NO:1中的14421至14438碱基的核苷酸和14845至14864碱基的核苷酸;
源于orf16基因的寡核苷酸对是:
SEQ ID NO:1中的16286至16304碱基的核苷酸和16935至16952碱基的核苷酸;SEQ ID NO:1中的16305至16321碱基的核苷酸和16813至16831碱基的核苷酸;SEQ ID NO:1中的16588至16605碱基的核苷酸和17257至17273碱基的核苷酸。
前述的对大肠杆菌O52的O-抗原特异的核苷酸在检测表达O-抗原的细菌、在诊断中鉴定细菌的O-抗原和细菌的其它多糖抗原的应用。
前述的对大肠杆菌O52的O-抗原特异的核苷酸的重组分子,而且通过插入表达可提供表达大肠杆菌O52的O-抗原,并成为细菌疫苗。
前述的对大肠杆菌O52的O-抗原特异的核苷酸的应用,其特征在于它作为引物用于PCR、作为探针用于杂交反应与荧光检测、或用于制造基因芯片或微阵列,可用这些方法检测人体和环境中的细菌。
前述的对大肠杆菌O52的O-抗原特异的核苷酸的分离方法,其特征在于,包括下述步骤:
(1)基因组的提取:在5mL的LB培养基中37℃过夜培养大肠杆菌O52,离心收集细胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重悬细胞,37℃温育20分钟,然后加入10ul 10mg/ml的溶菌酶继续保温20分钟。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃温育2小时,再加入3ul 10mg/ml的RNase,65℃温育30分钟。加等体积酚抽提混合物,取上清液再用等体积的酚∶氯仿∶异戊醇(25∶24∶1)混合溶液抽提两次,取上清液再用等体积的乙醚抽提以除去残余的酚;上清液用2倍体积乙醇沉淀DNA,用玻璃丝卷出DNA并用70%乙醇洗DNA,将DNA重悬于30ul TE中,基因组DNA通过0.4%的琼脂糖凝胶电泳检测;
(2)通过PCR扩增大肠杆菌O52中的O-抗原基因簇:大肠杆菌O52的O-抗原基因簇通过Long PCR扩增;首先根据经常发现于O-抗原基因簇启动子区的JumpStart序列设计上游引物(#1523-ATT GTG GCT GCA GGG ATC AAAGAA AT),再根据O-抗原基因簇下游的gnd基因设计下游引物(#1524-TAG TCGCGT GNG CCT GGA TTA AGT TCG C);用Boehringer Mannheim公司的Expand LongTemplate PCR方法扩增O-抗原基因簇,PCR反应程序如下:在94℃预变性2分钟;然后94℃变性10秒,60℃退火30秒,68℃延伸15分钟,这样进行30个循环;最后,在68℃继续延伸7分钟,得到PCR产物,用0.8%的琼脂糖凝胶电泳检测PCR产物的大小及其特异性;合并6管long PCR产物,并用Promega公司的Wizard PCR Preps纯化试剂盒纯化PCR产物;
(3)构建O-抗原基因簇文库:用被修改的Novagen DNaseI Shot Gun法构建O-抗原基因簇文库;反应体系是300ng PCR纯化产物,0.9ul 0.1M MnCl2,1ul 1∶2000稀释的1mg/ml的DNaseI,反应在室温中进行;酶切10分钟使DNA片段大小集中在1kb-3kb之间,而后加入2ul 0.1M EDTA终止反应;合并4管同样的反应体系,用等体积的酚抽提一次,用等体积的酚∶氯仿∶异戊醇(25∶24∶1)溶液抽提一次,再用等体积的乙醚抽提一次后,用2.5倍体积的无水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重悬于18ul水中。随后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mM DTT和5单位的T4DNA聚合酶,11℃反应30分钟,将酶切产物补成平端,75℃终止反应后,加入5单位的Tth DNA聚合酶及其相应的缓冲液并将体系扩大为80ul,70℃反应20分钟,使DNA的3′端加dA尾;此混合物经等体积氯仿∶异戊醇(24∶1)溶液抽提和等体积乙醚抽提后与Promega公司的3×10-3的pGEM-T-Easy载体于16℃连接24小时,总体积为90ul,其中有9ul的10×buffer和25单位的T4DNA连接酶;最后用1/10体积的3MNaAc(pH5.2)和2倍体积的无水乙醇沉淀连接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到连接产物;
(4)对文库中的克隆测序:从文库中挑选插入片段在750b以上的120个克隆由上海生物工程有限公司用ABI377型DNA自动测序仪对克隆中的插入片段进行单向测序,使序列达到80%的覆盖率,再通过将相联系的序列进行反向测序及测通得到剩余20%的序列,从而获得O-抗原基因簇的所有序列。
(5)核苷酸序列的拼接及分析:用英国剑桥MRC(Medical ResearchCouncil)分子生物学实验室出版的Staden package软件包的Pregap4和Gap4软件拼接和编辑所有的序列,从而得到大肠杆菌O52的O-抗原基因簇的核苷酸全长序列,序列的质量主要由两个方面来保证:1)对大肠杆菌O52的基因组作6个Long PCR反应,然后混合这些产物以产生文库。2)对每个碱基,保证3个以上高质量的覆盖率;在得到大肠杆菌O52的O-抗原基因簇的核苷酸序列后,用美国国家生物技术信息学中心(The National Center forBiotechnology Information,NCBI)的orffinder发现基因,找到16个开放的阅读框,用blast系列软件与GenBank中的基因比较以发现这些开放的阅读框的功能并确定它们是什么基因,再用英国sanger中心的Artemis软件完成基因注释,用Clustral W软件做DNA和蛋白质序列间的精确比对,最后得到大肠杆菌O52的O-抗原基因簇的结构;
(6)特异基因的筛选:针对大肠杆菌O52的O-抗原基因簇中的ABC转运系统基因(包括wzm、wzt基因)和糖基转移酶基因(包括orf5、orf14、orf15、orf16基因)设计引物;在每个基因内各设计了三对引物,每对引物分布在相应基因内的不同地方以确保其特异性;用这些引物以表2中所列的166株大肠杆菌和43株志贺氏菌的基因组为模板进行PCR,所有引物都在大肠杆菌O52中得到阳性结果;其中,源于wzt基因的三对引物被发现除了在大肠杆菌O52中得到了预期大小的正确的一条带外,在第24、26、27组中也都得到同样大小的特异性带。以第24、26、27组中的每个菌的基因组DNA做模板PCR后,发现在痢疾志贺氏菌8型、所有弗氏志贺氏菌、所有宋内志贺氏菌中都得到了阳性结果;此外在第8组的大肠杆菌O43中也得到阳性结果;所以wzt基因对大肠杆菌O52并不是特异的;而源于orf5、wzm、orf14、orf15、or16基因的每对引物除了在大肠杆菌O52中得到预期大小的正确的PCR产物带外,在表2中所列的其他基因组中都没有扩增到大小正确的带。也就是说,在大多数组中没有得到任何PCR产物带,虽然在少数组中得到PCR产物带,但其大小不符合预期大小,所以orf5、wzm、orf14、orf15、or16基因对大肠杆菌O52及其O-抗原都是高度特异的。
也就是,本发明的第一个方面,提供了大肠杆菌O52的O-抗原基因簇的全长核苷酸序列,它的全序列如SEQ ID NO:1所示,全长18900个碱基;或者具有一个或多个插入、缺失或取代的碱基,同时保持所述分离的核苷酸功能的SEQ ID NO:1的核苷酸。通过本发明的方法得到了大肠杆菌O52的O-抗原基因簇的结构,如表3所述,它总共由16个基因组成,都位于galF基因和gnd基因之间。
本发明的第二个方面,提供了大肠杆菌O52的O-抗原基因簇中的基因,即ABC转运系统的基因,包括wzm、wzt基因;糖基转移酶基因,包括orf5、orf14、orf15、orf16基因;细菌多糖抗原中特殊的糖合成路径基因,包括rmlB、rmlA、galE、glf、dmhB、dmhA、hddA、gmhA、hddC、gmhB基因。它们在O-抗原基因簇中的起始位置和终止位置及核苷酸序列都列在图2中。本发明尤其涉及到糖基转移酶基因、ABC转运系统的基因,因为糖合成路径基因即合成核苷二磷酸单糖的基因现在被预示对较多胞外多糖是常见的、共同的,对细菌的O-抗原并不是很特异的,而本发明涉及到的糖基转移酶基因、ABC转运系统的基因对大肠杆菌O52的O-抗原是高度特异的。
本发明的第三个方面,提供了源于大肠杆菌O52的O-抗原基因簇中的ABC转运系统的wzm基因和糖基转移酶基因,包括orf5、orf14、orf15、orf16基因的寡核苷酸,它们是这些基因中的任何一段寡核苷酸。但是,优先被用的是列于表1中的寡核苷酸对,在表1中也列出了这些寡核苷酸对在O-抗原基因簇中的位置及以这些寡核苷酸对为引物所做的PCR反应的产物的大小,这些PCR反应可用表1中的退火温度进行。用这些引物以表2中所列的166株大肠杆菌和43株志贺氏菌的基因组为模板进行PCR,所有引物都在大肠杆菌O52中得到阳性结果即得到预期大小的正确的PCR产物带。其中,源于wzt的三对引物被发现在大肠杆菌O43、痢疾志贺氏菌8型、弗氏志贺氏菌、宋内志贺氏菌中也得到阳性结果。所以源于wzt的三对引物及wzt基因对大肠杆菌O52并不是特异的,因此源于wzt的三对引物没有被列于表1中。而源于orf5、wzm、orf14、orf15、or16基因的每对引物除了在大肠杆菌O52中得到预期大小的正确的PCR产物带外,在表2中所列的其他基因组中都没有扩增到大小正确的带。也就是说,在大多数组中没有得到任何PCR产物带,虽然在少数组中得到PCR产物带,但其大小不符合预期大小,所以源于orf5、wzm、orf14、orf15、or16基因的寡核苷酸对大肠杆菌O52及其O-抗原都是高度特异的。更详细地说,以这些寡核苷酸对为引物所做的PCR反应在大多数细菌中均未得到任何产物,虽然在有些菌中得到了PCR产物带,但其大小不符合预期大小,这是由于引物结合到基因组的别的位置造成,这种问题可通过用基因内的其它引物做PCR来避免。所以,可以确定这些引物即表1所列的寡核苷酸对大肠杆菌O52及它的O-抗原是高度特异的。
所述的对大肠杆菌O52的O-抗原特异的核苷酸的分离方法包括下述步骤:1)基因组的提取;2)PCR扩增大肠杆菌O52中的O-抗原基因簇;3)O-抗原基因簇文库的构建;4)对文库中的克隆测序;5)核苷酸序列的拼接及分析,最终获得O-抗原基因簇的结构;6)特异基因的筛选。
本发明的其他方面由于本文的技术的公开,对本领域的技术人员而言是显而易见的。
如本发明所用,“寡核苷酸”主要是指来源于O-抗原基因簇中的编码糖基转移酶的基因、编码转运酶的基因和编码聚合酶的基因内的一段核苷酸分子,它们在长度上可改变,一般在10到20个核苷酸范围内改变。更确切的说这些寡核苷酸是源于orf5基因(核苷酸位置是从SEQ ID NO:1的5239至6093碱基),wzm基因(核苷酸位置是从SEQ ID NO:1的6095至6868碱基),orf14基因(核苷酸位置是从SEQ ID NO:1的12608至13936碱基),orf15基因(核苷酸位置是从SEQ ID NO:1的13929至16088碱基),orf16基因(核苷酸位置是从SEQ ID NO:1的16244至17389碱基的核苷酸)。源于以上基因内的寡核苷酸对大肠杆菌O52是高度特异的。
此外,有时两个遗传相似的编码不同O-抗原的基因簇通过基因重组或突变产生新的O-抗原,从而产生新的细菌类型,新的突变株。在这种环境中,需要筛选出多对寡核苷酸同重组基因杂交以提高检测的特异性。因此,本发明提供了一整套多对寡核苷酸的混合物,它们源于糖基转移酶基因;源于ABC转运系统的wzm基因;也源于糖合成路径基因。这些基因的混合物对一个特殊的细菌多糖抗原来说是特异的,从而使这套寡核苷酸对这个细菌的多糖抗原是特异的。更具体地说,这些寡核苷酸的混合物是源于糖基转移酶基因、源于ABC转运系统的基因中的寡核苷酸与源于糖合成路径基因中的寡核苷酸的组合。
在另一方面,本发明涉及寡核苷酸的鉴定,它们可以用于检测表达O-抗原的细菌和在诊断中鉴定细菌的O-抗原。
本发明涉及到一种检测食品中的一个或多个细菌多糖抗原的方法,这些抗原可以使样品能与以下至少一个基因的寡核苷酸特异性杂交,这些基因是:(i)编码糖基转移酶的基因(ii)编码源于ABC转运系统的wzm基因。在条件许可的情况下至少一个寡核苷酸能与至少一个表达特殊的O-抗原的细菌的一个以上的那样的基因特异性杂交,这些细菌是大肠杆菌O52。可用PCR方法检测,更可以将本发明方法中的核苷酸标记后作为探针通过杂交反应如southern-blot或荧光检测,或者通过基因芯片或微阵列检测样品中的抗原及细菌。
本发明者考虑到以下情况:当单个的特异的寡核苷酸检测无效时,寡核苷酸的混合物能与靶区域特异性杂交以检测样品。因此本发明提供了一套寡核苷酸用于本发明所述的检测方法。这里所说的寡核苷酸是指源于编码糖基转移酶的基因、编码ABC转运系统的wzm基因的寡核苷酸。这套寡核苷酸对一个特殊的细菌的O-抗原来说是特异的,这一特殊的细菌O-抗原是由大肠杆菌O52表达的。
另一方面,本发明涉及到一种检测排泄物中的一个或多个细菌多糖抗原的方法,这些抗原可以使样品能与以下至少一个基因的寡核苷酸特异性杂交,这些基因是:(i)编码糖基转移酶的基因(ii)编码源于ABC转运系统的wzm基因。在条件许可的情况下至少一个寡核苷酸能与至少一个表达特殊的O-抗原的细菌的一个以上的那样的基因特异性杂交。这些细菌是大肠杆菌O52。可用本发明中的寡核苷酸作引物通过PCR的方法检测样品,也可将本发明中的寡核苷酸分子标记后作为探针通过杂交反应如southern-blot或荧光检测,或者通过基因芯片或微阵列检测样品中的抗原及细菌。
一般,一对寡核苷酸可能与同样的基因杂交也可与不同的基因杂交,但它们中必须有一个寡核苷酸能特异性杂交到特殊抗原型的特异序列上,另一个寡核苷酸可杂交于非特异性区域。因此,当特殊的多糖抗原基因簇中的寡核苷酸被重新组合时,至少能选出一对寡核苷酸与多糖抗原基因簇中特异基因混合物杂交,或者选出多对寡核苷酸与特异基因的混合物杂交。甚至即使当一个特殊的基因簇中所有基因都独一无二时,此方法也能应用于识别此基因簇内的基因混合物的核苷酸分子。因此本发明提供了一整套用于检测本发明方法的多对寡核苷酸,在这里多对寡核苷酸是源于编码糖基转移酶的基因、编码ABC转运系统的wzm基因,这套寡核苷酸对一个特殊的细菌多糖来说是特异的,这套寡核苷酸可能是糖合成中必须基因的核苷酸。
另一方面,本发明也涉及到一种检测源于病人的样品中的一个或多个细菌多糖抗原的方法。样品中的一个或多个细菌多糖抗原可以使样品能与以下至少一个基因中的一对寡核苷酸中的一个特异性杂交,这些基因是:(i)编码糖基转移酶的基因(ii)源于ABC转运系统的wzm基因。在条件许可的情况下至少一个寡核苷酸能与样品中的至少一个表达特殊的O-抗原的细菌的一个以上的那样的基因特异性杂交,这些细菌是大肠杆菌O52。可用本发明中的寡核苷酸作引物通过PCR的方法检测样品,也可将本发明中的寡核苷酸标记后作为探针通过杂交反应,或者通过基因芯片或微阵列检测样品中的抗原及细菌。
更详细地说,以上描述的方法可以理解为当寡核苷酸对被使用时,其中的一个寡核苷酸分子能杂交到一个并不是来源于糖基转移酶基因和源于ABC转运系统的wzm基因的序列上。此外,当两个寡核苷酸都能杂交上时,它们可能杂交于同一基因也可能杂交到不同基因上。也即,当交叉反应出现问题时,可选择寡核苷酸的混合物来检测混合的基因以提供检测的特异性。
本发明者相信本发明不必限于以上所提的核苷酸序列编码的特定的O-抗原,而且广泛应用于检测所有表达O-抗原和鉴定O-抗原的细菌。而且,由于O-抗原合成和其他多糖抗原(如细菌胞外抗原)合成之间的相似性,发明者相信本发明的方法和分子也应用于这些其他的多糖抗原。
本发明首次公开了大肠杆菌O52的O-抗原基因簇的全长序列,而且可从这个未被克隆的全长基因簇的序列中产生重组分子,通过插入表达可产生表达大肠杆菌O52的O-抗原,并成为有用的疫苗。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(NewYork:Cold Spring Harbor Laboratory Press,1989)中所述的条件。
实施例1:基因组的提取,在5mL的LB培养基中37℃过夜培养志贺氏菌,离心收集细胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重悬细胞,37℃温育20分钟,然后加入10ul 10mg/ml的溶菌酶继续保温20分钟。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃温育2小时,再加入3ul 10mg/ml的RNase,65℃温育30分钟。加等体积酚抽提混合物,取上清再用等体积的酚∶氯仿∶异戊醇(25∶24∶1)混合溶液抽提两次,取上清液,再用等体积的乙醚抽提以除去残余的酚。上清液用2倍体积乙醇沉淀DNA,用玻璃丝卷出DNA并用70%乙醇洗DNA,最后将DNA重悬于30ul TE中。基因组DNA通过0.4%的琼脂糖凝胶电泳检测。
实施例2:通过PCR扩增大肠杆菌O52中的O-抗原基因簇,大肠杆菌O52的O-抗原基因簇通过Long PCR扩增。首先根据经常发现于O-抗原基因簇启动子区的JumpStart序列设计上游引物(#1523-ATT GTG GCT GCA GGG ATC AAAGAA AT),再根据O-抗原基因簇下游的gnd基因设计下游引物(#1524-TAG TCGCGT GNG CCT GGA TTA AGT TCG C)。用Boehringer Mannheim公司的Expand LongTemplate PCR方法扩增O-抗原基因簇,PCR反应程序如下:在94℃预变性2分钟;然后94℃变性10秒,60℃退火30秒,68℃延伸15分钟,这样进行30个循环。最后,在68℃继续延伸7分钟,得到PCR产物,用0.8%的琼脂糖凝胶电泳检测PCR产物的大小及其特异性。合并6管long PCR产物,并用Promega公司的Wizard PCR Preps纯化试剂盒纯化PCR产物。
实施例3:O-抗原基因簇文库的构建,用被修改的Novagen DNaseI shotgun法构建O-抗原基因簇文库。反应体系是300ng PCR纯化产物,0.9ul 0.1MMnCl2,1ul 1∶2000稀释的1mg/ml的DNaseI,反应在室温中进行。酶切10分钟使DNA片段大小集中在1kb-3kb之间,而后加入2ul 0.1M EDTA终止反应。合并4管同样的反应体系,用等体积的酚抽提一次,用等体积的酚∶氯仿∶异戊醇(25∶24∶1)溶液抽提一次,再用等体积的乙醚抽提一次后,用2.5倍体积的无水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重悬于18ul水中。随后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mM DTT和5单位的T4DNA聚合酶,11℃反应30分钟,将酶切产物补成平端,75℃终止反应后,加入5单位的Tth DNA聚合酶及其相应的缓冲液并将体系扩大为80ul,70℃反应20分钟,使DNA的3′端加dA尾。此混合物经等体积氯仿∶异戊醇(24∶1)溶液抽提和等体积乙醚抽提后与Promega公司的3×10-3的pGEM-T-Easy载体于16℃连接24小时,总体积为90ul。其中有9ul的10×buffer和25单位的T4DNA连接酶。最后用1/10体积的3M NaAc(pH5.2)和2倍体积的无水乙醇沉淀连接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到连接产物。
实施例4:感受态细胞的制备,参照Bio-Rad公司提供的方法制备感受态细胞大肠杆菌DH5□。取一环大肠杆菌DH5□单菌落于5ml的LB培养基中,180rpm培养10小时后,取2ml培养物转接到200ml的LB培养基中,37℃250rpm剧烈振荡培养到OD600 0.5左右,然后冰浴冷却20分钟,于4℃4000rpm离心15分钟。倾尽上清,用冷的冰预冷的去离子灭菌水200ml吹散菌体,于4℃4000rpm离心15分钟。再用冷的冰预冷的去离子灭菌水100ml吹散菌体,于4℃4000rpm离心15分钟。用冷的冰预冷的10%的甘油悬浮细胞,4℃6000rpm离心10分钟,弃上清液,最后沉淀用1ml冰预冷的10%的甘油悬浮细胞,即为感受态细胞。将制得的感受态细胞分装为50ul一管,-70℃保存。
实施例5:电转化感受态细胞,取2-3ul连接产物与50ul感受态大肠杆菌DH5□混合后,转到Bio-Rad公司的0.2cm的电击杯中电击,电压为2.5千伏,时间为5.0毫秒-6.0毫秒。电击后立即在杯中加入1ml的SOC培养基使菌复苏。然后立即将菌涂在含有氨苄青霉素、X-Gal和IPTG的LB固体培养基上37℃倒置过夜培养,次日得到蓝白菌落。将得到的白色菌落即白色克隆转到含有氨苄青霉素的LB固体培养基上培养,同时从每个克隆中提取质粒并用EcoR I酶切鉴定其中的插入片段的大小,得到的白色克隆群构成了大肠杆菌O52的O-抗原基因簇文库。
实施例6:对文库中的克隆测序,从文库中挑选插入片段在750b以上的120个克隆由上海生物工程有限公司用ABI377型DNA自动测序仪对克隆中的插入片段单向进行测序,使序列达到80%的覆盖率。剩余20%的序列再进行反向测序及测通,从而获得O-抗原基因簇的所有序列。
实施例7:核苷酸序列的拼接及分析,用英国剑桥MRC(Medical ResearchCouncil)分子生物学实验室出版的Staden package软件包的Pregap4和Gap4软件拼接和编辑所有的序列,从而得到大肠杆菌O52的O-抗原基因簇的核苷酸全长序列(见序列列表)。序列的质量主要由两个方面来保证:1)对大肠杆菌O52的基因组作6个Long PCR反应,然后混合这些产物以产生文库。2)对每个碱基,保证3个以上高质量的覆盖率。在得到大肠杆菌O52的O-抗原基因簇的核苷酸序列后,用美国国家生物技术信息学中心(The NationalCenter for Biotechnology Information,NCBI)的orffinder发现基因,找到16个开放的阅读框,用blast系列软件与GenBank中的基因比较以发现这些开放的阅读框的功能并确定它们是什么基因,再用英国sanger中心的Artemis软件完成基因注释,用Clustral W软件做DNA和蛋白质序列间的精确比对,最后得到大肠杆菌O52的O-抗原基因簇的结构(见图1)。
通过检索和比较,发现orf1与Escherichia coli的rmlB基因在297个氨基酸的序列中有97%的相同性,表明它们之间有高度的同源性。所以可以确定orf1是rmlB基因。orf2与Vibrio cholerae的rmlA基因在289个氨基酸的序列中有82%的相同性,表明它们之间有高度的同源性。所以,可以确定orf2是rmlA基因。orf3与Thermotoga maritima的gaiE基因在316个氨基酸的序列中有30%的相同性,表明它们之间有高度的同源性。所以,可以确定orf3是gaiE基因。orf4与Klebsiella pneumoniae的glf基因在375个氨基酸的序列中都有60%的相同性,表明它们之间也有高度的同源性。此外它与其他菌的glf基因的序列也表现出较高的相同性。所以,可以确定orf4是glf基因。以上四个基因都属于糖合成路径基因。orf5与Salmonella typhimurium LT2的糖基转移酶在266个氨基酸的序列中有28%的相同性,47%的相似性,这个糖基转移酶属于糖基转移酶家族2(Glycos_transf_2 pfam00535),orf5也与Streptococcus pneumoniae推测的鼠李糖的糖基转移酶在279个氨基酸的序列中有24%的相同性,45%的相似性,所以orf5也是一个糖基转移酶基因,命名为orf5。orf6与Bacillushalodurans的ABC转运子的转位酶在233个氨基酸中有31%的相同性,与Klebsiella pneumoniae的整合到膜上的O-抗原转位蛋白在241个氨基酸中有26%的相同性,也与Escherichia coli的ABC转运子的整合的膜蛋白在236个氨基酸中有25%的相同性,这个膜蛋白由wzm基因编码,所以确定orf6是ABC转运子的转位酶基因,命名为wzm。orf7与Actinobacillusactinomycetemcomitans的转运蛋白TagH在202个氨基酸中有44%的相同性,这个蛋白是ABC转运系统中结合ATP的亚单位,是转运多糖的具有ATP酶活性的蛋白。orf7也与Klebsiella pneumoniae的ABC转运系统中的转运蛋白在219个氨基酸中有42%的相同性,所以确定orf7是ABC转运系统中结合ATP的具有ATP酶活性的转运蛋白,命名为wzt。Orf8与Yersiniapseudotuberculosis的DmhB在276个氨基酸序列中有63%的相同性;orf9与Yersinia pseudotuberculosis中的DmhA在342个氨基酸序列中有91%的相同性;orf10与Yersinia pseudotuberculosis中的HddA在342个氨基酸序列中有85%的相同性;orf11与Yersinia pseudotuberculosis中的GmhA在195个氨基酸序列中有85%的相同性;orf12与Yersiniapseudotuberculosis中的HddC在225个氨基酸序列中有71%的相同性;orf13与Yersinia pseudotuberculosis中的GmhB在176个氨基酸序列中有62%的相同性。而在Yersinia pseudotuberculosis中,orf8、orf9、orf10、orf11、orf12和orf13这五个基因编码的酶是负责合成6-脱氧-D-甘露己糖(6d-Hepp)的。因此分别将orf8、orf9、orf10、orf11、orf12、orf13命名为dmhB、dmhA、hddA、gmhA、hddC、gmhB。虽然大肠杆菌O52的O-抗原结构未知,但从我们的试验可以推测在大肠杆菌O52的O-抗原结构中也含有6-脱氧-D-甘露己糖。orf14与Agrobacterium tumefaciens str.C58的一个糖基转移酶在240个氨基酸序列中有27%的相同性,48%的相似性。这个糖基转移酶属于糖基转移酶家族1(pfam00534,Glycos_transf_1),可以确定orf14是一个糖基转移酶基因,命名为orf14。orf15与Campylobacterjejuni的一个糖基转移酶在282个氨基酸序列中有28%的相同性,48%的相似性。这个糖基转移酶属于糖基转移酶家族2(pfam00535,Glycos_transf_2),可以确定orf15也是一个糖基转移酶基因,命名为orf15。orf16与Serratiamarcescens的rfbF基因编码的蛋白在371个氨基酸序列中有44%的相同性,67%的相似性;与Klebsiella pneumoniae的888基因编码的蛋白在370个氨基酸中有45%的相同性,65%的相似性。而这两个蛋白都是半乳糖转移酶,所以可以确定orf16也是一个糖基转移酶,命名为orf16。从以上分析可知,大肠杆菌O52的O-抗原基因簇由16个基因组成,它们都位于galF基因和gnd基因之间,且具有同样的转录方向。
实施例8:特异基因的筛选,针对大肠杆菌O52的O-抗原基因簇中的orf5、wzm、orf14、orf15、or16基因设计引物,这些基因在核苷酸序列中的位置见表1。
表1列出了大肠杆菌O52的O抗原基因簇中糖基转移酶基因和ABC转运系统的wzm基因及基因内的引物及PCR数据。在表中列出了大肠杆菌O52的O抗原基因簇的糖基转移酶基因、wzm基因及它们的相应的功能和大小。在每个基因内,我们各设计了三对引物,每对引物分布在相应基因内的不同地方以确保其特异性。在表中还列出了每个引物在SEQ ID NO:1中的位置和大小。以每对引物用表1中所列的相应的退火温度以表2中的所有菌的基因组为模板进行PCR,得到了相应的PCR产物,其大小也列于表中。
mdh(mala te dehydrogenase)基因是存在于所有的大肠杆菌的基因组中且高度保守的一个基因,所以我们根据mdh基因设计了引物#101(-TTC ATC CTAAAC TCC TTA TT)和#102(-TAA TCG CAG GGG AAA GCA GG),然后从166株大肠杆菌中提取基因组,方法如前所述。用这对引物从166株大肠杆菌的基因组中PCR以鉴定大肠杆菌并检测其基因组的质量。
表2是用于筛选特异基因的166株大肠杆菌和43株志贺氏菌及它们的来源,为了检测的方便,我们将它们每8-10个菌分为一组,总共27组,它们的来源都列于表中。
在第8组中含有大肠杆菌O52的基因组DNA作为阳性对照。以每组菌做模板,用表1中的每对引物按如下条件做PCR:在94℃预变性2分钟后,94℃变性15秒,退火温度因引物的不同而不同(参照表1),退火时间是50秒,72℃延伸2分钟,这样进行30个循环。最后在72℃继续延伸10分钟,反应体系是25ul。反应完毕后,取10ulPCR产物通过0.8%琼脂糖凝胶电泳检测扩增出的片段。
对于orf5、wzm、wzt、orf14、orf15、or16基因,每个基因都有三对引物被检测。其中,源于wzt的三对引物在用表2中所列的基因组为模板PCR后,发现除了在大肠杆菌O52中得到了预期大小的正确的一条带外,在第24、26、27组中也都得到同样大小的特异性带。以第24、26、27组中的每个菌的基因组DNA做模板PCR后,发现在痢疾志贺氏菌8型、所有弗氏志贺氏菌、所有宋内志贺氏菌中都得到了阳性结果;此外在第8组的大肠杆菌O43中也得到阳性结果。所以wzt基因对大肠杆菌O52并不是特异的。而源于orf5、wzm、orf14、orf15、or16基因的每对引物除了在大肠杆菌O52中得到预期大小的正确的PCR产物带外,在表2中所列的其他基因组中都没有扩增到大小正确的带。也就是说,在大多数组中没有得到任何PCR产物带,虽然在少数组中得到PCR产物带,但其大小不符合预期大小,所以orf5、wzm、orf14、orf15、or16基因对大肠杆菌O52及其O-抗原都是高度特异的。
最后,通过PCR从大肠杆菌O52中筛选到对大肠杆菌O52的O-抗原高度特异的基因:orf5、wzm、orf14、orf15、or16基因。这些基因内的任何一段10-20nt的寡核苷酸对大肠杆菌O52的O-抗原是特异的,尤其是上述每个基因中的引物即寡核苷酸对经PCR检测后证实对大肠杆菌O52是高度特异的。所有这些寡核苷酸都可用于快速准确地检测人体和环境中的大肠杆菌O52,并能鉴定它们的O-抗原。
表3是大肠杆菌O52的O-抗原基因簇的结构表,在表中列出了大肠杆菌O52的O-抗原基因簇的结构,共由16个基因组成,每个基因用方框表示,并在方框内写入基因的名称,数字表示的是O-抗原基因簇中的开放阅读框(orf)的顺序。在O-抗原基因簇的两端是galF基因和gnd基因,它们不属于O-抗原基因簇,我们只是用它们的一段序列设计引物来扩增O-抗原基因簇的全长序列。
表4是大肠杆菌O52的O-抗原基因簇中的基因的位置表,在表中列出了大肠杆菌O52的O-抗原基因簇中的所有开放阅读框在全序列中的准确位置,在每个开放阅读框的起始密码子和终止密码子的下面划线。在细菌中开放阅读框的起始密码子有两个:ATG和GTG。
序列列表
                       SEQUENCE LISTING<110>南开大学
<120>对大肠杆菌O52的O-抗原特异的核苷酸
<160>1
<170>PatentIn version 3.1
<210>1
<211> 18900
<212>DNA
<213>Escherichia coli
<400>1
attgtggctg cagggatcaa agaaatcgtt ctggtcacac acgcatcgaa aaactcggtg    60
gaaaaccact tcgatacctc gtatgaactg gaagcactgc ttgagcagcg cgtgaagcgt    120
cagctgctgg ctgaagttca atctatctgt cctcctggcg tgaccatcat gaacgttcgc    180
caggcgcagc cgttgggcct gggacactct atcctgtgcg cacatccgat tgtcggcgat    240
aacccgtttg tggttgtgtt gccggatatc gtgctggaca acgcaagcgc cgacccgctg    300
cgctacaacc ttgccgccat ggtagcgcgt ttcaacgaaa ccgggcgtag ccaggtgctg    360
gcgaaacgta tgccgggcga cctgtctgaa tactccgtca tcaaaacgaa agagccgctg    420
gatgtcgaag gtaaagttag ccgtatcgtt gattttatcg aaaaacctga ccagccgcag    480
acgctggaat ccgatctgat ggccgtaggc cgctatgtac tttccgctga tatctggcct    540
gaactggcga agaccgtgcc gggggcgtgg ggccgaattc aactgacgga tgcgatcgcc    600
gaactggcga ataagcagtc tgttgacgcg atgctgatga cgggtgagag ctacgactgc    660
gggaagaaga tggggtatat gcaggcgttt gtgcagtatg ggttgcgcaa cctgaaggaa    720
ggggctaaga tcaggaaaag tattgaaaag ttgttatctt aagtcgtttc tcagtaaacg    780
ataaagcaaa tttaagaacg gcgttttaga acggcagatg ggcataagta tgtagggtaa    840
cctactacta gcttcactgc ctttttattt cataaaacaa agtaaaaaat aacaataggt    900
tagaaatgta ggcgttgcat atcgtttata agatttttcc ttgagttcaa atgcatttaa    960
gacgaaaata gttgccgaaa ttttttgggt ttgcaggtgg gagtcgttgc ggatttttgc    1020
cttgacataa atgattttta tcattgaagg tgcagtgcgc tggtagctgg agagccaggg    1080
gcggtagcgt gtctaatcat aagtgtcttt tataatattc agattgttct taacaaacat    1140
tcatattatc aagccataag ttataagtca tagcggaaat tcaaagtgaa aatactggtt    1200
acaggtggtg caggttttat tgggtctgca gttgttcgtc atataattaa taatacgcaa    1260
gactctgtca tcaatgttga taaacttacc tatgcaggta atttggaatc tctgacagag    1320
attgagaata acgagcggta taaatttgag catgcggata tttgcgacag cgttgcaata    1380
gccaatattt ttgcacatca ccaaccagat gcaataatgc atttggcagc cgaaagccac    1440
gttgatcgtt caatcacagg ccctgcagac tttattgaaa ccaatattgt tggaacatat    1500
atcttactag aagaagctcg taagtattgg ctagcactta gtgaagatcg caaaggtgca    1560
tttcgcttcc accatatttc tacggatgag gtttatggtg accttcctca tccggatgaa    1620
gtatcgtcag atacaatatt gccattgttt acagaacaaa cttcatattc ccctagcagt    1680
ccatattccg cctctaaggc atccagtgat cacttagttc gtgcatggcg gcgtacatat    1740
ggattaccca ccatagtgac aaattgttct aataattatg ggccgtacca tttccctgaa    1800
aaactcattc cgttaattat tctgaatgca attgcgggta aacttttacc tgtttatggg    1860
aacggtgagc aaattcgaga ttggttatat gttgaagatc atgcccgggc actttatgaa    1920
gtcgtcacaa agggtgtgcc gggagaaaca tataatattg gtggtcataa cgaacgtaaa    1980
aatatcgatg tagtgaaaac tatttgtcgc attctcgatg aattgattgc agataaacca    2040
gatggcattg aaaattttga acagttgatt cggtatgtta gcgatcgtcc agggcatgac    2100
cttagatatg ccattgacgc cagtaaaatt aaacaagatt taggttgggt gccgcaagaa    2160
acgtttgaaa cgggtatcac taaaaccatt cactggtatt taaataataa agaatggtgg    2220
cagcgtgtga tggatggttc gtacgctggt gaacgcttag ggctcgtaga gtagtaagga    2280
taaaagatga aaggtattat tttagcaggc ggctctggca ctagattgta tccaataact    2340
cgtggtgtat caaaacaact attaccaatc tatgataaac caatgattta ttacccgctt    2400
tccacactta tgctagcggg tattcaagat atattaataa taaccactga agaagataat    2460gcgagtttcc agcggttact cggtgatggc agtaattttg gtattcggct taattatgcc   2520gtgcaaccca gccctgatgg attagcgcag gcattcctca ttggtgagaa atttatagga   2580aacgataaag tttgtttggt gctgggtgat aatatttttt atggccaatc atttatcaaa   2640atcctgcaga atgctgttgc aagagaatac ggtgcaacag tatttggtta tcaagtgaaa   2700gaccctgaac gcttcggtgt agttgaattt gatagcgaga tgcgggctgt atctattgaa   2760gaaaaaccgt caaaaccaaa atcaaattat gcagtcactg gactttactt ctatgataat   2820cgcgttatcg atttcgctaa aaaagttaaa ccttcagtga gaggggagct ggagattact   2880gatcttaatg acatgtatct caaagaaggt actcttaacg tagagctact ggggcgtggt   2940tttgcttggt tggatacagg gacccacgaa agtttgcatg aagcgtcatc cttcgtgcaa   3000accatccaga atgttcaggg cctcaaggtt gcatgtcttg aagagattgc attaagaaat   3060ggttggttaa gcaaagaaga agcaataaaa aatgcactac ctatgaagaa aaatgattat   3120ggtcaataca ttatagcacg tgcaaaaggt gaatgatgga tgctagaaaa aatggagtcc   3180tgattacagg cggtgctggg tttataggta aagcattgat caccgaaatg gtcgaaaggc   3240agatcccact agtgtcgttc gatatttcgg ataaaccaga ctcgttgcct gagctaagtg   3300aatattttaa ctggtataaa tttagctacc tcgaatcttc tcagcgtata aaagaactgc   3360atgagatagt tagccgccac aatattaaga cagttattca tttggcaaca actatgtttc   3420cacatgaatc gaaaaaaaat atcgataaag attgtctgga aaatgtttat gcgaatgtct   3480gttttttcaa aaacctatat gaaaatggtt gtgagaaaat tatatttgca tcatcgggtg   3540gcactgttta cggaaaatcc gatacaccat tttctgaaga tgatgcactt ttaccagaga   3600tcagttatgg cttaagcaaa gttatgactg agacatactt acgatttatt gctaaagaac   3660tcaatggtaa atccatatca ttgcggatct caaatcctta tggagaaggg cagagaatag   3720atggtaagca aggtgtaata ccaatatttt taaataaaat ctcaaatgat attccaattg   3780atattattgg ttcaattgag agtaaaagag attatattta tataagtgat cttgtacaag   3840ccttcatgtg ttcattagaa tatgaaggac atgaagatat ttttaacata ggttctggag   3900aatctattac gttaaaaaaa cttattgaaa ctatcgaatt taaattgaat aaaaaggcag   3960taatcggttt tcaagatcct atccatacca atgctaacgg aattatttta gatattaagc   4020gagctatggc tgagttagga tggcgtccga cggttgtact cgatgatggc attgataaat   4080taataaaatc aattaggtgt aagtaattat gaataaggtc cttatcattg gtagtggatt   4140tagcggtgca acaatagcaa gactgttggc tgaagagaat attaaagtaa agataataga   4200cgacagaaag catattggtg gtaactgcta tgatgagcgg gatgagaaaa caggcattaa   4260tgtccacgtt tatggaccgc atattttcca tacggataat gaagatgtat ggaattttgt   4320gaataaatat gggacattcc agccatatac aacgaggctt aaagcgaatg caaaaggcca   4380gatttattcg ttacctgtaa atcttcatac aattaatcaa tactataaaa cagcattgtc   4440tcctactgaa gccaggaaac tgattgcgag caaaggtgat cagacaatta atgatcctca   4500gtcttttgaa gaacaagctt taaaatttgt tggtgaagat ttatacaaaa cattctttta   4560tggctatcct aaaaaacagt ggggtatgga gccaaaggaa ataccagcat ctgtattaaa   4620gcgtctccca gtacgtttta actatgatga taactatttt ttccataaat tccagggcat   4680acctcgtgat ggctacacac cattatttca aaatttactg aaccacccaa atatagagtt   4740tgaattagga aagaaagtaa atagagcaac tgttgaagaa ttaatcacct ccgagcaata   4800cggacatgta tttttctctg gagcgattga tcatttctac gactatgaat ttggcatgtt   4860gcaatatcgt acgctggatt ttgaaaagtt ttacagcgaa gacgatgatt atcagggttg   4920tgttgtaatg tcttattgtg atgaagatgt tccttatacc cgcgtaacgg aacataaata   4980tttcacgcca tgggaagagc ataaaggaag cgtgttatac aaagagttta gtcgtagttg   5040cgataaagaa gatattccat attatccagt tagacttgtc tctggaaata gcatatggaa   5100caaatatgaa caaaaggcaa aagaagagac taatataaca ttcatcgggc gtttggctac   5160atatcgctat ctcgatatgg atgtctgtat taaagaagct attgaatgtg ctcaattgta   5220tataaagaat aataaagaat gatatatacg gtagtcatgg tctcgtataa tcggacgagc   5280aagttaaaag aatcgatagt acagctttta gcaacaaata ttaatgaaat tattattgtt   5340gacaatcatt caggtaaaga aacaagagcc atattagagg aagcctcact tcaggatgaa   5400cgtgttaaaa tcataaatct tgatgagaat agaggagcat catttggttt cagcattggg   5460ttgaactacg ttgaagaaaa atatgagcag tctgtgacga ctttcctaga tgatgatgcg   5520tattttgatc aagtattcct tgataactta aaaatcgaat gtaagcacta tgaatatcga   5580tttcctttta taacccccaa ggttatcaat aaaaaaggaa tgcgtttaac gatgaatcgg   5640ccaatgacct gcattcccag gtccttgttc aaagtagtaa aatatttaaa aaatagaaga   5700cagtttgggg agaaaaatga gcttgtggaa gcagcaagtt ttatagggtt aacgattgtt   5760aacactgctg atgataaaaa atcattactt atcccgattg attattttat ttattatgat   5820gatctcacct tcactcatcg attagctaaa aaaaatggtg aactaggtat ttatcttaat   5880gatctagttg tcatgcatga tattgagggg ggcgtgagga aatatgatgc ctttaggttg   5940tcatatttac tatcaaacag tattaaattt agcaaagagg ttggtgatac actatatatt   6000tattctatgt ttattcactg ctatcatttt ttaaattgcc tgaagaattt aaaactgaca   6060gtctttgtta gagctctatt gagaaaaagg taacatgagt atcatgtcgt taaaaaccct   6120tgaattggtt tgggttaaag caaagcttaa tctaaaatca gaagcatcaa taaactattt   6180aagttatgct tggtggatta tcgaaccagt ccttcaaatg gcaatttact atttggtttt   6240tgcatatctt cttaagcaag gtggtcatga ttacgtccca ttcctgttaa ctggactgat   6300cccctggata tggtttggtc gcagcgttag tcatgcgcaa gggagtatca ttcaaggaaa   6360gtacctaatg aatcaggtac atatttctaa gatattcttc cctttgacat ttatattgca   6420ggatgcgtta aagcagatac ttgtatttat tctgctattt atttttttag tcttgtacgg   6480ctatgattat actcttggct tgctttggat tattccagtc atttttgttc agctattatt   6540aatagttgca ttttctttga tagtgtcaat cattgttccc tttgtcagag atttttcatt   6600tgtaattgaa accggccttc aaattatgat gttttgctca ggtatatttt tcaattacaa   6660aagtataccg gcgatggaat cgaagatttt cttcattaac ccgatggcag taattcttag   6720ttcgtaccgt gatgtattga tgtatcataa tgcaccaaat attaagctgc tcgcatatgt   6780agttctgctt tctttaatta tgatttctat ttcgttgtat gcatttaaga gattagaatt   6840catcttccca cgagttgttc agaaatgaag aatgaaaaga ttattgagct aaaaaacgta   6900ggtttagttt atagagaaaa gaaaacactc tttacttacg atgaatatga agctttgaca   6960aacattacat tcgatgttta tcgtggcgaa actcttggaa taattgggcg taatggagca   7020gggaaatcta cattactacg agttctggcg ggtattatta agcctgattc tgggcaaata   7080actattcatt caaacagtat ttctctaatg gcccttcagg caggatttga tcccaactta   7140tcaggtcgtc agaatactat ctttagtgga atggtcctcg gtcatagatt gtcttatatc   7200aaatcaatta ttgaagacat caaagtatat tcagagctta atgagttctt cgaaaaacca   7260attaaaaatt attcatcagg tatgctagca cgtttgggtt tctcaattgc catgtatact   7320acccctgaag ttctgttaat tgatgaagta ctgggtgtcg gtgacgtgac ttttgcagag   7380aaagcacaaa aaagcattcg tgaaaaaata aagtcagaca caacagtcgt catcgtttcg   7440catgacgaac accagttgaa gctcctttcc gatcgacttg tttgcattga aaacggtgtt   7500gttctggatg aaggtccaag agacagtgta tacaataaat ataatttgat tatgaaactg   7560acaagttatg ggcttaagct cctggaatac aaaaatactg aaacagtagc ttttaaggtt   7620ggagatataa atccaacagc tgaatattca gatgttaatt ttaatattga tgttgatgtg   7680gtctccgtca gttttaaaac cacaacaagt gattgggaaa gagtatccat taaagacaac   7740agtttctggc ttcgccttaa tcataataaa atttataaaa ttaaatttaa agataccaaa   7800gatcatgacg gtgtatttga gctatccgtc ggttattaaa atggcagata aaattgtctt   7860catagcattt tatgtgcata catcttcact tcgtataatt tggtaactga gtatgagaaa   7920agtattcatt ctagggtcta ctggttacgt tggtaatcat cttaaatcat ttcttagtga   7980tgctttttcg ctggtaacag ttggaagaaa aaattcagat attcattttg atctggaaac   8040tggtgaattt aatgatttac tggatcaagt aaacaatgat gacaccatca tttttctttc   8100agcagtctct gcgcctgatc aatgtgagaa aaactatgac gttgcgcata agattaatgt   8160gaaaaataca attactttga tatctgaatt acttaaaaaa aatgcgcgag tgattttctc   8220atcaagtgat gttgtatttg gtggtacatc tgatgtgtgc actgaaatgt cagaacgaaa   8280accatttggc aaatatggtc aaatgaaatg tgaagttgaa gaacattttt caaataaccc   8340tgggttcttc gtaatacgat tttcgtacat tttagggaaa ggtgataaat tctctgaaat   8400ggtaaaagag cacagtttga atagtaaatt attagatgta tttgatggtt ttgagcgcag   8460tgttgtttca attaatgatg tattgttagg catcaaaaat attatattga attggagcca   8520aattgatact cgcatcgtta atttctccgg cccggatctt gtcagtcgac aacagattgt   8580tttggcgcta gcgcaggaaa aatttccaga actgcagtat caatttacag atgcgccaga   8640atcattttgg ctgggtaggc caaaaaaaat taataccaaa agtcgttttc tcgaatctat   8700tcttgataga tcatgtgaat catatttaaa cgttattaag gggtaagcat atatgaataa   8760tgtattaatt acaggattca ctggacaagt tggttctcaa ttagcagatt atattttaga   8820gaatacaacc gacacagtaa ttggaatgat gcgttggcaa gagccaatgg ataatatcta   8880tcatttaaca gaccggatta ataaaaagga tagagtattc atccaatacg cagaccttaa   8940tgactatact tccatgtata acttaattga agcgaagcgt ccaaaattca ttttccacct   9000tgctgcgcag tcatttcccc gcacctcatt cgatattccg atcgagacct tgcagaccaa   9060tattattggt actgccaatc tgttggaatg cattaaaaaa ctaaaacaac aagatggtta   9120tgatcctgtt gttcatgttt gttcttctag tgaagtttat ggtagagcaa aagtaggtga   9180agctttaaac gaagatacgc agttccatgg cgctagccct tacagcatta gtaaaattgg   9240taccgattat ttagggcgtt tttatggcga ggcatatggg ttgcgtacat ttatcactcg   9300catgggcaca catacaggcc cacgccgtag tgatgtattt ttcgaaagta ctgttgccaa   9360gcagattgcc ttgatcgaag ctggacatca ggaaccaaaa ttaaaagttg gcaatttagc   9420aagcgtacgt actttccaag atgctagaga cgctgtgcgt gcatactatt tattagctct   9480ggagagcgaa aaagggaatg ttcctttcgg cgaagcattt aatattgcag gtgaagaagc   9540attcaaactt cctgaggtta tagacctttt actgagcttt agcactcgtg acgatattga   9600agttgttaca gatacagatc gcctgcgtcc tattgatgcc gattaccaaa tgtttgataa   9660tactaaaatc aggaatttca ttgactggaa accggaaata aaagcgacag atatgtttcg   9720tgatttactc cagcactgga gaaaagaaat cgcatctggc cgcattcctc tgaatcgtta   9780atagggattc ttttgttatg aaagttagaa gcaaagcgcc tctacgttta ggcattgcag   9840gaggtgggac agatgtttca ccttatagcg atacattcgg tgggtgtgta ctgaatgcga   9900ccatcaatat gtatgcgtat gcttacattg atgatgagct tgaaggtagt aaagttattt   9960ttgaggcaac cgaccttaat atcagagaag agattgatct taccaatggt gtaacgattg  10020aggggaagct aaaactgcat cgagcagttt accttcgagt catgaatgat tattttgacg  10080gcgaattaaa accggttcgt atcattactc attctgacgc tcctgcaggt agcggtttgg  10140ggtcatcatc gacggttgtt gtttcaatgc ttgaaggact acggcaaatg tattctctgc  10200ctcttggaga atatgatctg gcccagttag cattcaagat tgagcgagta gactgtggtt  10260tatcaggtgg taaacaagat cagtatgctg caacatttgg tggttttaat ttcatggagt  10320tttatgaagg taatcgcgtt attgttaacc cacttagaat tcgtagatat ataataaatg  10380agttagagtc atccctgatt ctttatttta caggggcttc gagagactct gcgaaaatta  10440ttgatgacca gattagatct ttagagagtg acaaagagtc taaactgatg gctatgcata  10500aagttaaaga atcagcatat cagattaaag aacacttact caaatctgat atcgatgcta  10560tggccgcgac attcctggat gcatgggaaa gtaagaaaaa cacctcatcg tcaatcagta  10620atccgatgat tgagaaaatc gagaaggaag tgtttagtat cggtgttaag tcaatgaaag  10680tttcaggtgc cggtggcggt ggttttatga tgctattcgt tgaaccggag cgaaaacagt  10740tgatcgaacg taaactacaa gagtttggtg gcgaagtcta taaattccaa tttgtcgagg  10800atggagcata ttcatggaca atgtaaatta tattaaagca tatcttgatg acagcattgc  10860agtaaaaaaa ttgcttcagg aatctgacag tgtattgagc caaatctctt tagttgcaga  10920tttgattatc aatgcatata aaaacgggaa taaagtaatt cttgccggga atggtggtag  10980tgctgctgat tctcagcata tcgcggctga gttcgtcagt cgcttctttt tcgatagacc  11040aggattacca gccattgcta tcaccactga tacctcgatg ctaacggcta tcggcaatga  11100ctacggattt gataaactat ttgcaagaca actgcaagct caaagcaagc caggtgatgt  11160tttcattggc atcagtactt caggtaactc cgttaatatc attaacgcga tggaactggc  11220aaaagaactg ggtgtgacaa gcgtggcgct atgtggtgaa gcaggtaagc ttaaagattt  11280ggtagactat tcaattaatg taccttctaa aattacacca tacattcaag aatgccatat  11340ttgcattggt catatgatct gcgcaattgt tgaacgtgcc attttcaaac cagaagataa  11400ataattatgt atgatgtagt tattttggca ggagggctag gtactcgtct gaagagtgtt  11460agtggcgagc ttcctaagcc aatggtagat atttcagggc aaccatttct ttatcgtcta  11520atgacgtatc ttgaaaaaca aggagctacc agaattatac tatcattatc ctacaaagct  11580gactatatca tcgacagggt tgtccatgac aaccctgttg gttgtgaggt tgactttgtt  11640gtcgaaaaag aacctctagg aactggtggc gcaattaaat atgccagttc taaagtcaga  11700acggataaat tcattgttct taatggtgat acgtactgcg agcttaatta tagtgacttc  11760atagaagctt cgaagggaac agatcttcta atatctggtg tcgaagttaa tgatgtcgct  11820cgttatggta gtttagattt agatgagaaa tctaatgtta atgctatggt agaaaaggga  11880agaactggcc ctggaattat taacagtgga atttatattg tctcaaagga aattatgagc  11940aagtttgctg ggaataaatt ttcttttgaa tctgattttt tgcctaaatt caaaggagag  12000tttaaggcct acgttaattc ctcatatttt atcgatatag gaattcctga agattatttc  12060attgcatgtg agagatttaa atgaaagtgg catttcttga tcgcgatggt gtaattaata  12120aggaagtcaa ttatctatat aaaattgaag attttgaatt taccaaaaac tgtatcagtg  12180gcatgaaaag atttattgct catggttata aaataatcat tgtgacaaat caggccggaa  12240ttgccaaagg atattacacc ttatctgatt atgataaatt gacaaagtgg tataggggta  12300tcttgaaatc acagggtatc gatatattag atatctatta ttgccctcat catccagatg  12360gaattggccc tgaatatcga tgtgattgtc cgtgccgcaa acctaatacg ggtatgttcg  12420agtctgcagc tcgtgattat tccattgact taaaacaatc ttttattgtt ggtgataaac  12480tgggtgatgt agaagccgga ttaaagtttg ggttgggccg agttttttta gttgagacgg  12540gccatcagat tcctgctgta ggttatgcca catatccagt ttattctgat ctgttatcta  12600ttccattatg aaaaacacaa tcaccagatt tttgaagaaa gcttttgtta aattcaggta  12660taccaggctc gcacgtaagc tttggaaatt atttgccctc atggttaacg ctcattaccc  12720aaggcggtta ttaattaaag cgttgaacgt taatgctgaa caaaatgcaa atgaatttac  12780tgtttttcca aaaattttaa agtcaagttc agataaaaat gcgctagtca ttatgccttt  12840ttatggaaat gatgccgtcg ggaaaaatat tgatacaaaa attgcgacat taaaatccct  12900aggattcaca attcacgcta ttgttttcaa taattcacct tgggattcaa atagtgttga  12960ttgggattat acttataata taaaatgtcg gaacggaaag ttcggcactc taagacacga  13020tgtcaatcag caaataattc ctgatggaaa taaaattgac gattggcttg atgatgaaat  13080atgtcaattt gttgctgcac tttctgcgat gaataattat cagattgcaa ttgttaatta  13140tgtcttcctg tcaaaattgt gtttatatct taaacctaat acagtctcag tgatcgatac  13200tcacgatgtt tttgctaaga ggaacactcg aatggcaaaa attggtattt cacaagataa  13260attctatttc tctacatcga agaaagaaga aaccattggg ttatcaagag ctaattatat  13320atttgctatt caagaagcag aaggccgtta cttcagggag aatgttagtt cccaagtcat  13380tgttcagcca cctattctgg acgtaaactt tattgattat gtcccaacat ccaataaaaa  13440gatcgttgtt ggctttatgg cctctgggca ctatccaaat gtcgttgcga tcaacaattt  13500tatcgatagc ttaagtaaac ttgatcataa tgtaagactc gatatttcag gaacaatttg  13560cggagctctt gaaggtagac agtaccctgg ttttgttaat atcctcggtt tttgtgagag  13620ccttgataag ttctaccatt cctgcgatgt aattatcaat ccagatgaat tactttcagg  13680gttgaaagtt aaatgtctgg aggcgctttc ttatggtgtt ccattagttt caactaaagc  13740tgctatggaa gggattgagt cgacagaaga gtaccatcag atcgaatctg cgcaaaagtg  13800tgctgagttc attacatcgc ttaaaaaaga tgagctcatt aacatggcta ctcatagtcg  13860aaatgtcttt gccaacttta atcagcgcta taatttccaa tccactttgc gaaaggtttt  13920gaaagacaat gggtgatgat atctttaaaa tttccgttat tttacctgta tacggcggcg  13980aagtttattt agagcaatgt ctcgacagtg ttctgtctca aacatataag aatctggaaa  14040taataatagt caatgacggt agccctgatg cttgccctca gattattgat cgatacgctt  14100cgagcgatac aagaatcatt gctatccata aaaaaaacgc aggttacgga gctgcaatca  14160actctgggct agatgttgca agcggcgatt ttatttctat catcgaaaca gacgattggg  14220ttcagcttga tatgtttgag cgtctaatag acgcttataa taaaatcccg aatccggtca  14280ttaaagcaag tttcaataga ataagtaatg aagttgtaat caatactcag tcccttgcgc  14340atttatgtac atttgataat gataacttgg cagaaattgt accagaaaat tcagttgagc  14400ttttcttgct tgaatcatca atctggactg gcttgtatag aagagatttt cttgaagaaa  14460atcatattcg cttctatgaa agtcctgggg cttcatatca ggatatgccc tttaaattca  14520tcacctatgc ctctgtagaa aagataactc ttttgaatgt gcctgtttat aactacaggg  14580tcatgaacgt gggctcatcc agtgctagtg ctgacaaggc attaatatct tttaataatt  14640atgatattat aaaaaaacac cttcttagtg ttggaacgtt tcaaaaatac ctgaatcatt  14700tttattttca ccatcttttt gatttagttt tccattattc tcgtttgaga ggcgatggat  14760tgaagtcata tcaggaagct gctattgctg tttttgaaca ggctaaagaa gaaggtttcc  14820agccagtaac ttctaatgtt tcattttcct ccgatacaaa tgactattat tataatcatg  14880ttcttccaat ttataatgag ttgatgagta acaggattat aaaaacagtt cagacaagaa  14940acaggattaa aaagaaagtc gtttccaaac tacgttttat tactaacaaa ttaataattg  15000aaccaattat taatgctgtt tcatcaaaaa tggattcctc ctcatcttta ctttccaaac  15060attttcggga ggagttagat tcttcatttt tgaagatgtc gaaagaactt actgataaag  15120tcgatgtcat ttcaggacag aataaaaatg gttctgtact aataaaagta gcgcctacta  15180accagtttta ttattacatg aaggtaaatt cctctcggat ctctaaacta cgtgaagaat  15240tcaaacgcgg ccttgatgaa tttagccttc aaaatgagag gaaattattt ggtttttatg  15300aattactgcc atactttgaa catcaaggca ttgagttgga attaccttta tctttaacat  15360tatttacgga tgaagataga gttatattgt caaatattga ttcaatctta cgtcacgaaa  15420aagaattaat tcagcatctt gatctatctg aattaccggt tactctagca accaactatt  15480tcaaagctgg cttgaagtat cttccaggcc gattcactga agaattcaaa ggctctgttg  15540ctatagattg tggggcttgg gttggtgata cagctatcat gttcgctagc tttggattta  15600aagaagtact tgccttagaa cctgtagctg ataattataa ctgtatggtt cggaatcttg  15660agcgtaatca tcaatattta aatgatacta ttaaaccctt aaatgttgct gtcagcaatg  15720tatctggcga actttcgatg atgaaagttg gggatgatgg agtaggctca tgtgttgttg  15780aagacgagca gtctgacatt aaagttcaat cggtcactat tgatagtctg acgtttgaag  15840atcgtgttgg tttgattaaa ttcgatattg aaggctatga gattaatgcc cttaatggtg  15900caatcgagac aatcaaaaaa cacaagcccg tgttgctgat ttctgtttat cacttgtggt  15960tgcagccaga gcaaattttt gaatgtaaga aatttgttga aaatctcaat atgggttatc  16020aattcaagtt tgttcacctc cagcctgagc gtgatctggt gtatgaatac atgcttgtgt  16080gttggtgatt tgtaatagtc tttattttga ttcacaaaca aatcagggat gatttgtttt  16140gctttattta aaactgatat tttcttcgaa gtataagatg acgtgctgag gttttaaatt  16200ttaacaggat aatagcttaa ggaaggagat gtgagtttta aatatgaaaa taaagatatg  16260ttattttgtg aactccgctt ggtatttcga attacattgg ttagatcgtg ccttatcagt  16320tctggaagca ggatatgatg tctatatttt tgcgaattat tctgacaagt ctattctgga  16380tcgctttact agtttaggat ttaagtgtat tgatagtaaa ataaaagagc aaaatatcaa  16440tcctgttgtt ttcttttgcg atataactcg ctcatttaga acattgaata aaattaatcc  16500tgatattgtg catagccgca cgattaaacc tggtgtgatt agttgtttat gggccagaat  16560ccgaaacaaa aaaatggtct atagttttgt tgggttaggt agagtttttg aaagcaataa  16620ggtcatttac caaatggtta agttcttaat tgctaatatg tatagaagat ttttcttaaa  16680tattgattgt tgtatcctct ttgaacataa aaaagatcag caaaaaataa ttgaactatt  16740agatattcca aaaaataaaa ctgaagttat tgatggcgca ggtattaata tagactattt  16800ttgttatagt acaccaccta ataataccaa ggttaaagtt ttttttgcaa gtcgcatgct  16860ttggagtaaa gggctacgca cgttaattga tgctagtaga attttaaaat tacaaggcat  16920cgaatttgag atattagttg cgggcattct tgttgacaat gatcgcgacg ctataagtat  16980aactcagata gaagagtggc ataactccgg tgatatcatt tggctgggca agcgtagcga  17040tatcaaggaa ttaattgaaa gtgtggatat agtcgctttg ccatctgttt actctgaagg  17100tattcctcga attcttttag aagccggtgc aatcggtcgt cctgttataa gttttgacac  17160tggtggttgt gggagtttaa tacttgacgg ttataacggt ttccttgtgc ctaaaggaaa  17220tgtgaaccta ttttctcaga agcttggtat ccttattagc gatcctcttg agcgcactaa  17280gatggggcag aatgccagaa agcgagtaga ggaaaagtat tcatctaccg ttgtcatacg  17340aaaaaccgtt caaatctata ataaactcac aatgcaagaa gtgctctaat attgagcaac  17400aacttatctg agcttgtcgc tatgcgtttt tttagttact tatgacagtt attaatttca  17460ctcaaacatc tatttcttta tacaacttgt cgttctccta atatataatt tcttaaattc  17520tgtctgttca tagacagata ctacctgaca ggagtatgta atgtctaagc aacaaatcgg  17580cgtagtcggt atggctgtga tggggcgcaa cctggcgctc aacatcgaaa gccgtggtta  17640taccgtctct atcttcaacc gctcccgtga aaaaaccgaa gaagttgtcg ctgagaatcc  17700aggcaaaaag ctggttcctc actacacggt caaggagttc gtcgagtctc ttgagacccc  17760acgtcgtatc ctgttaatgg tgaaagcagg cgcgggcacc gatgctgcca tcgattccct  17820gaaaccttac cttgataaag gtgacatcat cattgatggt ggtaacacct tcttccagga  17880taccattcgt cgtaaccgtg agctgtctgc tgaaggcttt aacttcatcg gtaccggcgt  17940atccggcggc gaagagggcg cgctgaaggg cccatctatc atgcctggcg gccagaaaga  18000agcgtatgag ttggttgcgc ctatcctgac caagattgct gctgtagctg aagacggcga  18060gccttgcgta acctacatcg gtgctgacgg tgcgggtcat tacgtgaaaa tggtccacaa  18120cggtatcgaa tacggcgaca tgcagctgat tgctgaagcc tattctctgc tgaaaggcgg  18180cctgaacctg tctaacgaag agctggcaac caccttcacc gagtggaatg aaggcgagct  18240gagcagctac ctgatcgaca tcaccaaaga catcttcacc aaaaaagatg aagacggtaa  18300atacctggtt gatgtgatcc tcgacgaagc ggcgaacaaa ggcaccggta aatggactag  18360ccagagctct ctggacctgg gcgaaccgct gtcgctgatc actgaatctg ttttcgcgcg  18420ctacatctcc tccctgaaag accagcgcgt ggcggcatct aaagtgctga ctggcccgca  18480ggctaaactg gctggcgata aagcagagtt cgttgagaaa gtgcgtcgcg cactgtacct  18540gggtaaaatc gtctcctacg cgcagggctt ctctcagctg cgtgccgcgt ctgacgagta  18600caactgggat ctgaactacg gcgaaatcgc gaagatcttc cgcgcgggct gcatcattcg  18660tgcacagttc ctgcagaaaa tcaccgacgc ctacgctgaa aacgcgagta tcgccaacct  18720gctgctggca ccgtacttca aaaatatcgc tgatgaatac cagcaggcgc tgcgtgacgt  18780ggtggcctat gctgtgcaga acggtattcc ggtaccgacc ttctctgcag cagtggcgta  18840ctacgatagc taccgcgctg cggtactgcc ggcgaacctg atccaggcac agcgcgacta  18900表1大肠杆菌O52的O-抗原基因簇中糖基转移酶基因和ABC转运系统wzm基因及其中引物及PCR数据
基因 功能 基因的碱基位置 正向引物 反向引物 PCR产物长度   产生正确大小电泳带的组数   PCR的退火温度(℃)
  Orf5 糖基转移酶     5239-6093   #329(5445-5462)     #330(5970-5988)     542bp     0**     58
  #331(5266-5283)     #332(5651-5668)     404bp     0     58
  #333(5362-5379)     #334(5783-5800)     439bp     0     53
  wzm ABC转运子     6095-6868   #311(6314-6331)     #312(6840-6857)     544bp     0*     58
  #313(6180-6197)     #314(6689-6705)     526bp     0     55
  #315(6422-6439)     #316(6711-6728)     361bp     0     58
  Orf14 糖基转移酶     12608-13936   #305(12940-12958)   #306(13869-13886)     946bp     0     53
  #307(13003-13020)   #308(13743-13762)     760bp     0     56
  #309(13853-13872)   #310(13345-13363)     491bp     0**     50
  Orf15 糖基转移酶     13929-16088   #323(14317=14335)   #324(15064-15080)     764bp     0     55
  #325(14518-14535)   #326(15248-15267)     750bp     0     50
  #327(14421-14438)   #328(14845-14864)     444bp     0     55
  Orf16 糖基转移酶     16244-17389   #317(16286-16304)   #318(16935-16952)     685bp     0     58
  #319(16305-16321)   #320(16813-16831)     527bp     0     55
  #321(16588-16605)   #322(17257-17273)     686bp     0     56
*在一组中产生一条错误大小的带;**在一组中产生两条错误大小的带。表2 166株大肠杆菌和43株志贺氏菌及它们的来源组号                该组中含有的菌株                                     来源1    野生型大肠杆菌O1,O2,O3,O4,O10,O16,O18,O39                   IMVSa2    野生型大肠杆菌O40,O41,O48,O49,O71,O73,O88,O100              IMVS3    野生型大肠杆菌O102,O109,O119,O120,O121,O125,O126,O137       IMVS4    野生型大肠杆菌O138,O139,O149,O7,O5,O6,O11,O12               IMVS5    野生型大肠杆菌O13,O14,O15,O17,O19ab,O20,O21,O22             IMVS6    野生型大肠杆菌O23,O24,O25,O26,O27,O28,O29,O30               IMVS7    野生型大肠杆菌O32,O33,O34,O35,O36,O37,O38,O42               IMVS8    野生型大肠杆菌O43,O44,O45,O46,O50,O51,O52,O53               IMVS9    野生型大肠杆菌O54,O55,O56,O57,O58,O59,O60,O61               IMVS10   野生型大肠杆菌O62,O63,O64,O65,O66,O68,O69,O70               IMVS11    野生型大肠杆菌O74,O75,O76,O77,O78,O79,O80,O81                  IMVS12    野生型大肠杆菌O82,O83,O84,O85,O86,O87,O89,O90                  IMVS13    野生型大肠杆菌O91,O92,O95,O96,O97,O98,O99,O101                 IMVS14    野生型大肠杆菌O112,O162,O113,O114,O115,O116,O117,O118          IMVS15    野生型大肠杆菌O123,O165,O166,O167,O168,O169,O170,O171          See b16    野生型大肠杆菌O172,O173,O127,O128,O129,O130,O131,O132,        See c17    野生型大肠杆菌O133,O134,O135,O136,O140,O141,O142,O143          IMVS18    野生型大肠杆菌O144,O145,O146,O147,O148,O150,O151,O152          IMVS19    野生型大肠杆菌O153,O154,O155,O156,O157,O158,O159,O164          IMVS20    野生型大肠杆菌O160,O161,O163,O8,O9,O 24,O111                    IMVS21    野生型大肠杆菌O103,O104,O105,O106,O107,O108,O110                IMVS22    鲍氏志贺氏菌血清型B4,B5,B6,B8,B9,B11,B12,B14                   See d23    鲍氏志贺氏菌血清型B1,B3,B7,B8,B10,B13,B15,B16,B17,B18        See d24    痢疾志贺氏菌血清型D1,D2,D3,D4,D5,D6,D7,D8                      See d25    痢疾志贺氏菌血清D9,D10,D11,D12,D13                                See d26    弗氏志贺氏菌F6a,F1a,F1b,F2a,F2b,F3,F4a,F4b,F5(v:7)F5(v:4)   See d27    宋内氏志贺氏菌D5,DR                                                  See da.    Institude of Medical and Veterinary Science,Anelaide,Australiab.    O123 from IMVS;the rest from Statens Serum Institut,Copenhagen,Denmarkc.    172 and 173 from Statens Serum Institut,Copenhagen,Denmark,the rest from IMVSd.    中国预防医学科学院流行病学研究所表3是大肠杆菌O52的O-抗原基因簇的结构表
Figure A0312993600281
表4是大肠杆菌O52的O-抗原基因簇中的基因的位置表ATTGTGGCTG CAGGGATCAA AGAAATCGTT CTGGTCACAC ACGCATCGAA AAACTCGGTG    60GAAAACCACT TCGATACCTC GTATGAACTG GAAGCACTGC TTGAGCAGCG CGTGAAGCGT    120CAGCTGCTGG CTGAAGTTCA ATCTATCTGT CCTCCTGGCG TGACCATCAT GAACGTTCGC    180CAGGCGCAGC CGTTGGGCCT GGGACACTCT ATCCTGTGCG CACATCCGAT TGTCGGCGAT    240AACCCGTTTG TGGTTGTGTT GCCGGATATC GTGCTGGACA ACGCAAGCGC CGACCCGCTG    300CGCTACAACC TTGCCGCCAT GGTAGCGCGT TTCAACGAAA CCGGGCGTAG CCAGGTGCTG    360GCGAAACGTA TGCCGGGCGA CCTGTCTGAA TACTCCGTCA TCAAAACGAA AGAGCCGCTG    420GATGTCGAAG GTAAAGTTAG CCGTATCGTT GATTTTATCG AAAAACCTGA CCAGCCGCAG    480ACGCTGGAAT CCGATCTGAT GGCCGTAGGC CGCTATGTAC TTTCCGCTGA TATCTGGCCT    540GAACTGGCGA AGACCGTGCC GGGGGCGTGG GGCCGAATTC AACTGACGGA TGCGATCGCC    600GAACTGGCGA ATAAGCAGTC TGTTGACGCG ATGCTGATGA CGGGTGAGAG CTACGACTGC    660GGGAAGAAGA TGGGGTATAT GCAGGCGTTT GTGCAGTATG GGTTGCGCAA CCTGAAGGAA    720GGGGCTAAGA TCAGGAAAAG TATTGAAAAG TTGTTATCTT AAGTCGTTTC TCAGTAAACG    780ATAAAGCAAA TTTAAGAACG GCGTTTTAGA ACGGCAGATG GGCATAAGTA TGTAGGGTAA    840CCTACTACTA GCTTCACTGC CTTTTTATTT CATAAAACAA AGTAAAAAAT AACAATAGGT    900TAGAAATGTA GGCGTTGCAT ATCGTTTATA AGATTTTTCC TTGAGTTCAA ATGCATTTAA    960GACGAAAATA GTTGCCGAAA TTTTTTGGGT TTGCAGGTGG GAGTCGTTGC GGATTTTTGC    1020CTTGACATAA ATGATTTTTA TCATTGAAGG TGCAGTGCGC TGGTAGCTGG AGAGCCAGGG    1080GCGGTAGCGT GTCTAATCAT AAGTGTCTTT TATAATATTC AGATTGTTCT TAACAAACAT    1140TCATATTATC AAGCCATAAG TTATAAGTCA TAGCGGAAAT TCAAAGTGAA AATACTGGTT    1200ACAGGTGGTG CAGGTTTTAT TGGGTCTGCA GTTGTTCGTC ATATAATTAA TAATACGCAA    1260GACTCTGTCA TCAATGTTGA TAAACTTACC TATGCAGGTA ATTTGGAATC TCTGACAGAG    1320ATTGAGAATA ACGAGCGGTA TAAATTTGAG CATGCGGATA TTTGCGACAG CGTTGCAATA    1380
                                rmlB基因的起始GCCAATATTT TTGCACATCA CCAACCAGAT GCAATA ATGC ATTTGGCAGC CGAAAGCCAC  1440GTTGATCGTT CAATCACAGG CCCTGCAGAC TTTATTGAAA CCAATATTGT TGGAACATAT    1500ATCTTACTAG AAGAAGCTCG TAAGTATTGG CTAGCACTTA GTGAAGATCG CAAAGGTGCA    1560TTTCGCTTCC ACCATATTTC TACGGATGAG GTTTATGGTG ACCTTCCTCA TCCGGATGAA    1620GTATCGTCAG ATACAATATT GCCATTGTTT ACAGAACAAA CTTCATATTC CCCTAGCAGT    1680CCATATTCCG CCTCTAAGGC ATCCAGTGAT CACTTAGTTC GTGCATGGCG GCGTACATAT    1740GGATTACCCA CCATAGTGAC AAATTGTTCT AATAATTATG GGCCGTACCA TTTCCCTGAA    1800AAACTCATTC CGTTAATTAT TCTGAATGCA ATTGCGGGTA AACTTTTACC TGTTTATGGG    1860AACGGTGAGC AAATTCGAGA TTGGTTATAT GTTGAAGATC ATGCCCGGGC ACTTTATGAA    1920GTCGTCACAA AGGGTGTGCC GGGAGAAACA TATAATATTG GTGGTCATAA CGAACGTAAA    1980AATATCGATG TAGTGAAAAC TATTTGTCGC ATTCTCGATG AATTGATTGC AGATAAACCA    2040GATGGCATTG AAAATTTTGA ACAGTTGATT CGGTATGTTA GCGATCGTCC AGGGCATGAC    2100CTTAGATATG CCATTGACGC CAGTAAAATT AAACAAGATT TAGGTTGGGT GCCGCAAGAA    2160ACGTTTGAAA CGGGTATCAC TAAAACCATT CACTGGTATT TAAATAATAA AGAATGGTGG    2220
                                                    rmlB基因的终止CAGCGTGTGA TGGATGGTTC GTACGCTGGT GAACGCTTAG GGCTCGTAGA GTAG TAAGGA  2280rmiA基因的起始TAAAAG ATGA AAGGTATTAT TTTAGCAGGC GGCTCTGGCA CTAGATTGTA TCCAATAACT  2340CGTGGTGTAT CAAAACAACT ATTACCAATC TATGATAAAC CAATGATTTA TTACCCGCTT    2400TCCACACTTA TGCTAGCGGG TATTCAAGAT ATATTAATAA TAACCACTGA AGAAGATAAT    2460GCGAGTTTCC AGCGGTTACT CGGTGATGGC AGTAATTTTG GTATTCGGCT TAATTATGCC    2520GTGCAACCCA GCCCTGATGG ATTAGCGCAG GCATTCCTCA TTGGTGAGAA ATTTATAGGA    2580AACGATAAAG TTTGTTTGGT GCTGGGTGAT AATATTTTTT ATGGCCAATC ATTTATCAAA    2640ATCCTGCAGA ATGCTGTTGC AAGAGAATAC GGTGCAACAG TATTTGGTTA TCAAGTGAAA    2700GACCCTGAAC GCTTCGGTGT AGTTGAATTT GATAGCGAGA TGCGGGCTGT ATCTATTGAA    2760GAAAAACCGT CAAAACCAAA ATCAAATTAT GCAGTCACTG GACTTTACTT CTATGATAAT    2820CGCGTTATCG ATTTCGCTAA AAAAGTTAAA CCTTCAGTGA GAGGGGAGCT GGAGATTACT    2880GATCTTAATG ACATGTATCT CAAAGAAGGT ACTCTTAACG TAGAGCTACT GGGGCGTGGT    2940TTTGCTTGGT TGGATACAGG GACCCACGAA AGTTTGCATG AAGCGTCATC CTTCGTGCAA    3000ACCATCCAGA ATGTTCAGGG CCTCAAGGTT GCATGTCTTG AAGAGATTGC ATTAAGAAAT    3060GGTTGGTTAA GCAAAGAAGA AGCAATAAAA AATGCACTAC CTATGAAGAA AAATGATTAT    3120
                   galE基因的起始rmlA基因的终止GGTCAATACA TTATAGCACG TGCAAAAGGT GA ATGATGGA TGCTAGAAAA AATGGAGTCC  3180TGATTACAGG CGGTGCTGGG TTTATAGGTA AAGCATTGAT CACCGAAATG GTCGAAAGGC    3240AGATCCCACT AGTGTCGTTC GATATTTCGG ATAAACCAGA CTCGTTGCCT GAGCTAAGTG    3300AATATTTTAA CTGGTATAAA TTTAGCTACC TCGAATCTTC TCAGCGTATA AAAGAACTGC    3360ATGAGATAGT TAGCCGCCAC AATATTAAGA CAGTTATTCA TTTGGCAACA ACTATGTTTC    3420CACATGAATC GAAAAAAAAT ATCGATAAAG ATTGTCTGGA AAATGTTTAT GCGAATGTCT    3480GTTTTTTCAA AAACCTATAT GAAAATGGTT GTGAGAAAAT TATATTTGCA TCATCGGGTG    3540GCACTGTTTA CGGAAAATCC GATACACCAT TTTCTGAAGA TGATGCACTT TTACCAGAGA    3600TCAGTTATGG CTTAAGCAAA GTTATGACTG AGACATACTT ACGATTTATT GCTAAAGAAC    3660TCAATGGTAA ATCCATATCA TTGCGGATCT CAAATCCTTA TGGAGAAGGG CAGAGAATAG    3720ATGGTAAGCA AGGTGTAATA CCAATATTTT TAAATAAAAT CTCAAATGAT ATTCCAATTG    3780ATATTATTGG TTCAATTGAG AGTAAAAGAG ATTATATTTA TATAAGTGAT CTTGTACAAG    3840CCTTCATGTG TTCATTAGAA TATGAAGGAC ATGAAGATAT TTTTAACATA GGTTCTGGAG    3900AATCTATTAC GTTAAAAAAA CTTATTGAAA CTATCGAATT TAAATTGAAT AAAAAGGCAG    3960TAATCGGTTT TCAAGATCCT ATCCATACCA ATGCTAACGG AATTATTTTA GATATTAAGC    4020GAGCTATGGC TGAGTTAGGA TGGCGTCCGA CGGTTGTACT CGATGATGGC ATTGATAAAT    4080
            galE基因的终止glf基因的起始TAATAAAATC AATTAGGTGT AAG TAATT AT GAATAAGGTC CTTATCATTG GTAGTGGATT4140TAGCGGTGCA ACAATAGCAA GACTGTTGGC TGAAGAGAAT ATTAAAGTAA AGATAATAGA    4200CGACAGAAAG CATATTGGTG GTAACTGCTA TGATGAGCGG GATGAGAAAA CAGGCATTAA    4260TGTCCACGTT TATGGACCGC ATATTTTCCA TACGGATAAT GAAGATGTAT GGAATTTTGT    4320GAATAAATAT GGGACATTCC AGCCATATAC AACGAGGCTT AAAGCGAATG CAAAAGGCCA    4380GATTTATTCG TTACCTGTAA ATCTTCATAC AATTAATCAA TACTATAAAA CAGCATTGTC    4440TCCTACTGAA GCCAGGAAAC TGATTGCGAG CAAAGGTGAT CAGACAATTA ATGATCCTCA    4500GTCTTTTGAA GAACAAGCTT TAAAATTTGT TGGTGAAGAT TTATACAAAA CATTCTTTTA    4560TGGCTATCCT AAAAAACAGT GGGGTATGGA GCCAAAGGAA ATACCAGCAT CTGTATTAAA    4620GCGTCTCCCA GTACGTTTTA ACTATGATGA TAACTATTTT TTCCATAAAT TCCAGGGCAT    4680ACCTCGTGAT GGCTACACAC CATTATTTCA AAATTTACTG AACCACCCAA ATATAGAGTT    4740TGAATTAGGA AAGAAAGTAA ATAGAGCAAC TGTTGAAGAA TTAATCACCT CCGAGCAATA    4800CGGACATGTA TTTTTCTCTG GAGCGATTGA TCATTTCTAC GACTATGAAT TTGGCATGTT    4860GCAATATCGT ACGCTGGATT TTGAAAAGTT TTACAGCGAA GACGATGATT ATCAGGGTTG    4920TGTTGTAATG TCTTATTGTG ATGAAGATGT TCCTTATACC CGCGTAACGG AACATAAATA    4980TTTCACGCCA TGGGAAGAGC ATAAAGGAAG CGTGTTATAC AAAGAGTTTA GTCGTAGTTG    5040CGATAAAGAA GATATTCCAT ATTATCCAGT TAGACTTGTC TCTGGAAATA GCATATGGAA    5100CAAATATGAA CAAAAGGCAA AAGAAGAGAC TAATATAACA TTCATCGGGC GTTTGGCTAC    5160ATATCGCTAT CTCGATATGG ATGTCTGTAT TAAAGAAGCT ATTGAATGTG CTCAATTGTA    5220
        Orf5基因的起始glf基因的终止TATAAAGAAT AATAAAGA AT GATATATACG GTAGTCATGG TCTCGTATAA TCGGACGAGC  5280AAGTTAAAAG AATCGATAGT ACAGCTTTTA GCAACAAATA TTAATGAAAT TATTATTGTT    5340GACAATCATT CAGGTAAAGA AACAAGAGCC ATATTAGAGG AAGCCTCACT TCAGGATGAA    5400CGTGTTAAAA TCATAAATCT TGATGAGAAT AGAGGAGCAT CATTTGGTTT CAGCATTGGG    5460TTGAACTACG TTGAAGAAAA ATATGAGCAG TCTGTGACGA CTTTCCTAGA TGATGATGCG    5520TATTTTGATC AAGTATTCCT TGATAACTTA AAAATCGAAT GTAAGCACTA TGAATATCGA    5580TTTCCTTTTA TAACCCCCAA GGTTATCAAT AAAAAAGGAA TGCGTTTAAC GATGAATCGG    5640CCAATGACCT GCATTCCCAG GTCCTTGTTC AAAGTAGTAA AATATTTAAA AAATAGAAGA    5700CAGTTTGGGG AGAAAAATGA GCTTGTGGAA GCAGCAAGTT TTATAGGGTT AACGATTGTT    5760AACACTGCTG ATGATAAAAA ATCATTACTT ATCCCGATTG ATTATTTTAT TTATTATGAT    5820GATCTCACCT TCACTCATCG ATTAGCTAAA AAAAATGGTG AACTAGGTAT TTATCTTAAT    5880GATCTAGTTG TCATGCATGA TATTGAGGGG GGCGTGAGGA AATATGATGC CTTTAGGTTG    5940TCATATTTAC TATCAAACAG TATTAAATTT AGCAAAGAGG TTGGTGATAC ACTATATATT    6000TATTCTATGT TTATTCACTG CTATCATTTT TTAAATTGCC TGAAGAATTT AAAACTGACA    6060
                   orf5基因的终止wzm因的起始GTCTTTGTTA GAGCTCTATT GAGAAAAAGG  TAAC ATGAGT ATCATGTCGT TAAAAACCCT6120TGAATTGGTT TGGGTTAAAG CAAAGCTTAA TCTAAAATCA GAAGCATCAA TAAACTATTT    6180AAGTTATGCT TGGTGGATTA TCGAACCAGT CCTTCAAATG GCAATTTACT ATTTGGTTTT    6240TGCATATCTT CTTAAGCAAG GTGGTCATGA TTACGTCCCA TTCCTGTTAA CTGGACTGAT    6300CCCCTGGATA TGGTTTGGTC GCAGCGTTAG TCATGCGCAA GGGAGTATCA TTCAAGGAAA    6360GTACCTAATG AATCAGGTAC ATATTTCTAA GATATTCTTC CCTTTGACAT TTATATTGCA    6420GGATGCGTTA AAGCAGATAC TTGTATTTAT TCTGCTATTT ATTTTTTTAG TCTTGTACGG    6480CTATGATTAT ACTCTTGGCT TGCTTTGGAT TATTCCAGTC ATTTTTGTTC AGCTATTATT    6540AATAGTTGCA TTTTCTTTGA TAGTGTCAAT CATTGTTCCC TTTGTCAGAG ATTTTTCATT    6600TGTAATTGAA ACCGGCCTTC AAATTATGAT GTTTTGCTCA GGTATATTTT TCAATTACAA    6660AAGTATACCG GCGATGGAAT CGAAGATTTT CTTCATTAAC CCGATGGCAG TAATTCTTAG    6720TTCGTACCGT GATGTATTGA TGTATCATAA TGCACCAAAT ATTAAGCTGC TCGCATATGT    6780AGTTCTGCTT TCTTTAATTA TGATTTCTAT TTCGTTGTAT GCATTTAAGA GATTAGAATT    6840
            wzt基因的起始wzm基因的终止CATCTTCCCA CGAGTTGTTC AGAA ATGAAG AATGAAAAGA TTATTGAGCT AAAAAACGTA  6900GGTTTAGTTT ATAGAGAAAA GAAAACACTC TTTACTTACG ATGAATATGA AGCTTTGACA    6960AACATTACAT TCGATGTTTA TCGTGGCGAA ACTCTTGGAA TAATTGGGCG TAATGGAGCA    7020GGGAAATCTA CATTACTACG AGTTCTGGCG GGTATTATTA AGCCTGATTC TGGGCAAATA    7080ACTATTCATT CAAACAGTAT TTCTCTAATG GCCCTTCAGG CAGGATTTGA TCCCAACTTA    7140TCAGGTCGTC AGAATACTAT CTTTAGTGGA ATGGTCCTCG GTCATAGATT GTCTTATATC    7200AAATCAATTA TTGAAGACAT CAAAGTATAT TCAGAGCTTA ATGAGTTCTT CGAAAAACCA    7260ATTAAAAATT ATTCATCAGG TATGCTAGCA CGTTTGGGTT TCTCAATTGC CATGTATACT    7320ACCCCTGAAG TTCTGTTAAT TGATGAAGTA CTGGGTGTCG GTGACGTGAC TTTTGCAGAG    7380AAAGCACAAA AAAGCATTCG TGAAAAAATA AAGTCAGACA CAACAGTCGT CATCGTTTCG    7440CATGACGAAC ACCAGTTGAA GCTCCTTTCC GATCGACTTG TTTGCATTGA AAACGGTGTT    7500GTTCTGGATG AAGGTCCAAG AGACAGTGTA TACAATAAAT ATAATTTGAT TATGAAACTG    7560ACAAGTTATG GGCTTAAGCT CCTGGAATAC AAAAATACTG AAACAGTAGC TTTTAAGGTT    7620GGAGATATAA ATCCAACAGC TGAATATTCA GATGTTAATT TTAATATTGA TGTTGATGTG    7680GTCTCCGTCA GTTTTAAAAC CACAACAAGT GATTGGGAAA GAGTATCCAT TAAAGACAAC    7740AGTTTCTGGC TTCGCCTTAA TCATAATAAA ATTTATAAAA TTAAATTTAA AGATACCAAA    7800
                           wzt基因的终止GATCATGACG GTGTATTTGA GCTATCCGTC GGTTAT TAAA ATGGCAGATA AAATTGTCTT  7860
                                              dmhB基因的起始CATAGCATTT TATGTGCATA CATCTTCACT TCGTATAATT TGGTAACTGA GT ATGAGAAA  7920AGTATTCATT CTAGGGTCTA CTGGTTACGT TGGTAATCAT CTTAAATCAT TTCTTAGTGA    7980TGCTTTTTCG CTGGTAACAG TTGGAAGAAA AAATTCAGAT ATTCATTTTG ATCTGGAAAC    8040TGGTGAATTT AATGATTTAC TGGATCAAGT AAACAATGAT GACACCATCA TTTTTCTTTC    8100AGCAGTCTCT GCGCCTGATC AATGTGAGAA AAACTATGAC GTTGCGCATA AGATTAATGT    8160GAAAAATACA ATTACTTTGA TATCTGAATT ACTTAAAAAA AATGCGCGAG TGATTTTCTC    8220ATCAAGTGAT GTTGTATTTG GTGGTACATC TGATGTGTGC ACTGAAATGT CAGAACGAAA    8280ACCATTTGGC AAATATGGTC AAATGAAATG TGAAGTTGAA GAACATTTTT CAAATAACCC    8340TGGGTTCTTC GTAATACGAT TTTCGTACAT TTTAGGGAAA GGTGATAAAT TCTCTGAAAT    8400GGTAAAAGAG CACAGTTTGA ATAGTAAATT ATTAGATGTA TTTGATGGTT TTGAGCGCAG    8460TGTTGTTTCA ATTAATGATG TATTGTTAGG CATCAAAAAT ATTATATTGA ATTGGAGCCA    8520AATTGATACT CGCATCGTTA ATTTCTCCGG CCCGGATCTT GTCAGTCGAC AACAGATTGT    8580TTTGGCGCTA GCGCAGGAAA AATTTCCAGA ACTGCAGTAT CAATTTACAG ATGCGCCAGA    8640ATCATTTTGG CTGGGTAGGC CAAAAAAAAT TAATACCAAA AGTCGTTTTC TCGAATCTAT    8700
                                    dmhB基因的终止dmhA基因的起始TCTTGATAGA TCATGTGAAT CATATTTAAA CGTTATTAAG GGG TAAGCAT AT ATGAATAA  8760TGTATTAATT ACAGGATTCA CTGGACAAGT TGGTTCTCAA TTAGCAGATT ATATTTTAGA    8820GAATACAACC GACACAGTAA TTGGAATGAT GCGTTGGCAA GAGCCAATGG ATAATATCTA    8880TCATTTAACA GACCGGATTA ATAAAAAGGA TAGAGTATTC ATCCAATACG CAGACCTTAA    8940TGACTATACT TCCATGTATA ACTTAATTGA AGCGAAGCGT CCAAAATTCA TTTTCCACCT    9000TGCTGCGCAG TCATTTCCCC GCACCTCATT CGATATTCCG ATCGAGACCT TGCAGACCAA    9060TATTATTGGT ACTGCCAATC TGTTGGAATG CATTAAAAAA CTAAAACAAC AAGATGGTTA    9120TGATCCTGTT GTTCATGTTT GTTCTTCTAG TGAAGTTTAT GGTAGAGCAA AAGTAGGTGA    9180AGCTTTAAAC GAAGATACGC AGTTCCATGG CGCTAGCCCT TACAGCATTA GTAAAATTGG    9240TACCGATTAT TTAGGGCGTT TTTATGGCGA GGCATATGGG TTGCGTACAT TTATCACTCG    9300CATGGGCACA CATACAGGCC CACGCCGTAG TGATGTATTT TTCGAAAGTA CTGTTGCCAA    9360GCAGATTGCC TTGATCGAAG CTGGACATCA GGAACCAAAA TTAAAAGTTG GCAATTTAGC    9420AAGCGTACGT ACTTTCCAAG ATGCTAGAGA CGCTGTGCGT GCATACTATT TATTAGCTCT    9480GGAGAGCGAA AAAGGGAATG TTCCTTTCGG CGAAGCATTT AATATTGCAG GTGAAGAAGC    9540ATTCAAACTT CCTGAGGTTA TAGACCTTTT ACTGAGCTTT AGCACTCGTG ACGATATTGA    9600AGTTGTTACA GATACAGATC GCCTGCGTCC TATTGATGCC GATTACCAAA TGTTTGATAA    9660TACTAAAATC AGGAATTTCA TTGACTGGAA ACCGGAAATA AAAGCGACAG ATATGTTTCG    9720
                                                dmhA基因的终止TGATTTACTC CAGCACTGGA GAAAAGAAAT CGCATCTGGC CGCATTCCTC TGAATCGT TA  9780
          hddA基因的起始ATAGGGATTC TTTTGTT ATG AAAGTTAGAA GCAAAGCGCC TCTACGTTTA GGCATTGCAG  9840GAGGTGGGAC AGATGTTTCA CCTTATAGCG ATACATTCGG TGGGTGTGTA CTGAATGCGA    9900CCATCAATAT GTATGCGTAT GCTTACATTG ATGATGAGCT TGAAGGTAGT AAAGTTATTT    9960TTGAGGCAAC CGACCTTAAT ATCAGAGAAG AGATTGATCT TACCAATGGT GTAACGATTG    10020AGGGGAAGCT AAAACTGCAT CGAGCAGTTT ACCTTCGAGT CATGAATGAT TATTTTGACG    10080GCGAATTAAA ACCGGTTCGT ATCATTACTC ATTCTGACGC TCCTGCAGGT AGCGGTTTGG    10140GGTCATCATC GACGGTTGTT GTTTCAATGC TTGAAGGACT ACGGCAAATG TATTCTCTGC    10200CTCTTGGAGA ATATGATCTG GCCCAGTTAG CATTCAAGAT TGAGCGAGTA GACTGTGGTT    10260TATCAGGTGG TAAACAAGAT CAGTATGCTG CAACATTTGG TGGTTTTAAT TTCATGGAGT    10320TTTATGAAGG TAATCGCGTT ATTGTTAACC CACTTAGAAT TCGTAGATAT ATAATAAATG    10380AGTTAGAGTC ATCCCTGATT CTTTATTTTA CAGGGGCTTC GAGAGACTCT GCGAAAATTA    10440TTGATGACCA GATTAGATCT TTAGAGAGTG ACAAAGAGTC TAAACTGATG GCTATGCATA    10500AAGTTAAAGA ATCAGCATAT CAGATTAAAG AACACTTACT CAAATCTGAT ATCGATGCTA    10560TGGCCGCGAC ATTCCTGGAT GCATGGGAAA GTAAGAAAAA CACCTCATCG TCAATCAGTA    10620ATCCGATGAT TGAGAAAATC GAGAAGGAAG TGTTTAGTAT CGGTGTTAAG TCAATGAAAG    10680TTTCAGGTGC CGGTGGCGGT GGTTTTATGA TGCTATTCGT TGAACCGGAG CGAAAACAGT    10740TGATCGAACG TAAACTACAA GAGTTTGGTG GCGAAGTCTA TAAATTCCAA TTTGTCGAGG    10800
    gmhA基因的起始hddA基因的终止ATGGAGCATA TTC ATGGACA ATG TAAATTA TATTAAAGCA TATCTTGATG ACAGCATTGC10860AGTAAAAAAA TTGCTTCAGG AATCTGACAG TGTATTGAGC CAAATCTCTT TAGTTGCAGA    10920TTTGATTATC AATGCATATA AAAACGGGAA TAAAGTAATT CTTGCCGGGA ATGGTGGTAG    10980TGCTGCTGAT TCTCAGCATA TCGCGGCTGA GTTCGTCAGT CGCTTCTTTT TCGATAGACC    11040AGGATTACCA GCCATTGCTA TCACCACTGA TACCTCGATG CTAACGGCTA TCGGCAATGA    11100CTACGGATTT GATAAACTAT TTGCAAGACA ACTGCAAGCT CAAAGCAAGC CAGGTGATGT    11160TTTCATTGGC ATCAGTACTT CAGGTAACTC CGTTAATATC ATTAACGCGA TGGAACTGGC    11220AAAAGAACTG GGTGTGACAA GCGTGGCGCT ATGTGGTGAA GCAGGTAAGC TTAAAGATTT    11280GGTAGACTAT TCAATTAATG TACCTTCTAA AATTACACCA TACATTCAAG AATGCCATAT    11340TTGCATTGGT CATATGATCT GCGCAATTGT TGAACGTGCC ATTTTCAAAC CAGAAGATAA    11400gmhA基因的终止hddC基因的起始A TAATT ATGT ATGATGTAGT TATTTTGGCA GGAGGGCTAG GTACTCGTCT GAAGAGTGTT11460AGTGGCGAGC TTCCTAAGCC AATGGTAGAT ATTTCAGGGC AACCATTTCT TTATCGTCTA    11520ATGACGTATC TTGAAAAACA AGGAGCTACC AGAATTATAC TATCATTATC CTACAAAGCT    11580GACTATATCA TCGACAGGGT TGTCCATGAC AACCCTGTTG GTTGTGAGGT TGACTTTGTT    11640GTCGAAAAAG AACCTCTAGG AACTGGTGGC GCAATTAAAT ATGCCAGTTC TAAAGTCAGA    11700ACGGATAAAT TCATTGTTCT TAATGGTGAT ACGTACTGCG AGCTTAATTA TAGTGACTTC    11760ATAGAAGCTT CGAAGGGAAC AGATCTTCTA ATATCTGGTG TCGAAGTTAA TGATGTCGCT    11820CGTTATGGTA GTTTAGATTT AGATGAGAAA TCTAATGTTA ATGCTATGGT AGAAAAGGGA    11880AGAACTGGCC CTGGAATTAT TAACAGTGGA ATTTATATTG TCTCAAAGGA AATTATGAGC    11940AAGTTTGCTG GGAATAAATT TTCTTTTGAA TCTGATTTTT TGCCTAAATT CAAAGGAGAG    12000TTTAAGGCCT ACGTTAATTC CTCATATTTT ATCGATATAG GAATTCCTGA AGATTATTTC    12060
         gmhB基因的起始hddC基因的终止ATTGCATGTG AGAGATTTAA  ATGAAAGTGG CATTTCTTGA TCGCGATGGT GTAATTAATA  12120AGGAAGTCAA TTATCTATAT AAAATTGAAG ATTTTGAATT TACCAAAAAC TGTATCAGTG    12180GCATGAAAAG ATTTATTGCT CATGGTTATA AAATAATCAT TGTGACAAAT CAGGCCGGAA    12240TTGCCAAAGG ATATTACACC TTATCTGATT ATGATAAATT GACAAAGTGG TATAGGGGTA    12300TCTTGAAATC ACAGGGTATC GATATATTAG ATATCTATTA TTGCCCTCAT CATCCAGATG    12360GAATTGGCCC TGAATATCGA TGTGATTGTC CGTGCCGCAA ACCTAATACG GGTATGTTCG    12420AGTCTGCAGC TCGTGATTAT TCCATTGACT TAAAACAATC TTTTATTGTT GGTGATAAAC    12480TGGGTGATGT AGAAGCCGGA TTAAAGTTTG GGTTGGGCCG AGTTTTTTTA GTTGAGACGG    12540GCCATCAGAT TCCTGCTGTA GGTTATGCCA CATATCCAGT TTATTCTGAT CTGTTATCTA    12600orf14基因的起始gmhB基因的终止TTCCA TTATG AAAAACACAA TCACCAGATT TTTGAAGAAA GCTTTTGTTA AATTCAGGTA  12660TACCAGGCTC GCACGTAAGC TTTGGAAATT ATTTGCCCTC ATGGTTAACG CTCATTACCC    12720AAGGCGGTTA TTAATTAAAG CGTTGAACGT TAATGCTGAA CAAAATGCAA ATGAATTTAC    12780TGTTTTTCCA AAAATTTTAA AGTCAAGTTC AGATAAAAAT GCGCTAGTCA TTATGCCTTT    12840TTATGGAAAT GATGCCGTCG GGAAAAATAT TGATACAAAA ATTGCGACAT TAAAATCCCT    12900AGGATTCACA ATTCACGCTA TTGTTTTCAA TAATTCACCT TGGGATTCAA ATAGTGTTGA    12960TTGGGATTAT ACTTATAATA TAAAATGTCG GAACGGAAAG TTCGGCACTC TAAGACACGA    13020TGTCAATCAG CAAATAATTC CTGATGGAAA TAAAATTGAC GATTGGCTTG ATGATGAAAT    13080ATGTCAATTT GTTGCTGCAC TTTCTGCGAT GAATAATTAT CAGATTGCAA TTGTTAATTA    13140TGTCTTCCTG TCAAAATTGT GTTTATATCT TAAACCTAAT ACAGTCTCAG TGATCGATAC    13200TCACGATGTT TTTGCTAAGA GGAACACTCG AATGGCAAAA ATTGGTATTT CACAAGATAA    13260ATTCTATTTC TCTACATCGA AGAAAGAAGA AACCATTGGG TTATCAAGAG CTAATTATAT    13320ATTTGCTATT CAAGAAGCAG AAGGCCGTTA CTTCAGGGAG AATGTTAGTT CCCAAGTCAT    13380TGTTCAGCCA CCTATTCTGG ACGTAAACTT TATTGATTAT GTCCCAACAT CCAATAAAAA    13440GATCGTTGTT GGCTTTATGG CCTCTGGGCA CTATCCAAAT GTCGTTGCGA TCAACAATTT    13500TATCGATAGC TTAAGTAAAC TTGATCATAA TGTAAGACTC GATATTTCAG GAACAATTTG    13560CGGAGCTCTT GAAGGTAGAC AGTACCCTGG TTTTGTTAAT ATCCTCGGTT TTTGTGAGAG    13620CCTTGATAAG TTCTACCATT CCTGCGATGT AATTATCAAT CCAGATGAAT TACTTTCAGG    13680GTTGAAAGTT AAATGTCTGG AGGCGCTTTC TTATGGTGTT CCATTAGTTT CAACTAAAGC    13740TGCTATGGAA GGGATTGAGT CGACAGAAGA GTACCATCAG ATCGAATCTG CGCAAAAGTG    13800TGCTGAGTTC ATTACATCGC TTAAAAAAGA TGAGCTCATT AACATGGCTA CTCATAGTCG    13860AAATGTCTTT GCCAACTTTA ATCAGCGCTA TAATTTCCAA TCCACTTTGC GAAAGGTTTT    13920orf15基因的起始orf14基因的终止GAAAGACA AT GGG TGATGAT ATCTTTAAAA TTTCCGTTAT TTTACCTGTA TACGGCGGCG  13980AAGTTTATTT AGAGCAATGT CTCGACAGTG TTCTGTCTCA AACATATAAG AATCTGGAAA    14040TAATAATAGT CAATGACGGT AGCCCTGATG CTTGCCCTCA GATTATTGAT CGATACGCTT    14100CGAGCGATAC AAGAATCATT GCTATCCATA AAAAAAACGC AGGTTACGGA GCTGCAATCA    14160ACTCTGGGCT AGATGTTGCA AGCGGCGATT TTATTTCTAT CATCGAAACA GACGATTGGG    14220TTCAGCTTGA TATGTTTGAG CGTCTAATAG ACGCTTATAA TAAAATCCCG AATCCGGTCA    14280TTAAAGCAAG TTTCAATAGA ATAAGTAATG AAGTTGTAAT CAATACTCAG TCCCTTGCGC    14340ATTTATGTAC ATTTGATAAT GATAACTTGG CAGAAATTGT ACCAGAAAAT TCAGTTGAGC    14400TTTTCTTGCT TGAATCATCA ATCTGGACTG GCTTGTATAG AAGAGATTTT CTTGAAGAAA    14460ATCATATTCG CTTCTATGAA AGTCCTGGGG CTTCATATCA GGATATGCCC TTTAAATTCA    14520TCACCTATGC CTCTGTAGAA AAGATAACTC TTTTGAATGT GCCTGTTTAT AACTACAGGG    14580TCATGAACGT GGGCTCATCC AGTGCTAGTG CTGACAAGGC ATTAATATCT TTTAATAATT    14640ATGATATTAT AAAAAAACAC CTTCTTAGTG TTGGAACGTT TCAAAAATAC CTGAATCATT    14700TTTATTTTCA CCATCTTTTT GATTTAGTTT TCCATTATTC TCGTTTGAGA GGCGATGGAT    14760TGAAGTCATA TCAGGAAGCT GCTATTGCTG TTTTTGAACA GGCTAAAGAA GAAGGTTTCC    14820AGCCAGTAAC TTCTAATGTT TCATTTTCCT CCGATACAAA TGACTATTAT TATAATCATG    14880TTCTTCCAAT TTATAATGAG TTGATGAGTA ACAGGATTAT AAAAACAGTT CAGACAAGAA    14940ACAGGATTAA AAAGAAAGTC GTTTCCAAAC TACGTTTTAT TACTAACAAA TTAATAATTG    15000AACCAATTAT TAATGCTGTT TCATCAAAAA TGGATTCCTC CTCATCTTTA CTTTCCAAAC    15060ATTTTCGGGA GGAGTTAGAT TCTTCATTTT TGAAGATGTC GAAAGAACTT ACTGATAAAG    15120TCGATGTCAT TTCAGGACAG AATAAAAATG GTTCTGTACT AATAAAAGTA GCGCCTACTA    15180ACCAGTTTTA TTATTACATG AAGGTAAATT CCTCTCGGAT CTCTAAACTA CGTGAAGAAT    15240TCAAACGCGG CCTTGATGAA TTTAGCCTTC AAAATGAGAG GAAATTATTT GGTTTTTATG    15300AATTACTGCC ATACTTTGAA CATCAAGGCA TTGAGTTGGA ATTACCTTTA TCTTTAACAT    15360TATTTACGGA TGAAGATAGA GTTATATTGT CAAATATTGA TTCAATCTTA CGTCACGAAA    15420AAGAATTAAT TCAGCATCTT GATCTATCTG AATTACCGGT TACTCTAGCA ACCAACTATT    15480TCAAAGCTGG CTTGAAGTAT CTTCCAGGCC GATTCACTGA AGAATTCAAA GGCTCTGTTG    15540CTATAGATTG TGGGGCTTGG GTTGGTGATA CAGCTATCAT GTTCGCTAGC TTTGGATTTA    15600AAGAAGTACT TGCCTTAGAA CCTGTAGCTG ATAATTATAA CTGTATGGTT CGGAATCTTG    15660AGCGTAATCA TCAATATTTA AATGATACTA TTAAACCCTT AAATGTTGCT GTCAGCAATG    15720TATCTGGCGA ACTTTCGATG ATGAAAGTTG GGGATGATGG AGTAGGCTCA TGTGTTGTTG    15780AAGACGAGCA GTCTGACATT AAAGTTCAAT CGGTCACTAT TGATAGTCTG ACGTTTGAAG    15840ATCGTGTTGG TTTGATTAAA TTCGATATTG AAGGCTATGA GATTAATGCC CTTAATGGTG    15900CAATCGAGAC AATCAAAAAA CACAAGCCCG TGTTGCTGAT TTCTGTTTAT CACTTGTGGT    15960TGCAGCCAGA GCAAATTTTT GAATGTAAGA AATTTGTTGA AAATCTCAAT ATGGGTTATC    16020AATTCAAGTT TGTTCACCTC CAGCCTGAGC GTGATCTGGT GTATGAATAC ATGCTTGTGT    16080orf15基因的终止GTTGG TGATT TGTAATAGTC TTTATTTTGA TTCACAAACA AATCAGGGAT GATTTGTTTT  16140GCTTTATTTA AAACTGATAT TTTCTTCGAA GTATAAGATG ACGTGCTGAG GTTTTAAATT    16200orf16基因的起始T TAACAGGAT AATAGCTTAA GGAAGGAGAT GTGAGTTTTA AATATGAAAA TAAAGATATG  16260TTATTTTGTG AACTCCGCTT GGTATTTCGA ATTACATTGG TTAGATCGTG CCTTATCAGT    16320TCTGGAAGCA GGATATGATG TCTATATTTT TGCGAATTAT TCTGACAAGT CTATTCTGGA    16380TCGCTTTACT AGTTTAGGAT TTAAGTGTAT TGATAGTAAA ATAAAAGAGC AAAATATCAA    16440TCCTGTTGTT TTCTTTTGCG ATATAACTCG CTCATTTAGA ACATTGAATA AAATTAATCC    16500TGATATTGTG CATAGCCGCA CGATTAAACC TGGTGTGATT AGTTGTTTAT GGGCCAGAAT    16560CCGAAACAAA AAAATGGTCT ATAGTTTTGT TGGGTTAGGT AGAGTTTTTG AAAGCAATAA    16620GGTCATTTAC CAAATGGTTA AGTTCTTAAT TGCTAATATG TATAGAAGAT TTTTCTTAAA    16680TATTGATTGT TGTATCCTCT TTGAACATAA AAAAGATCAG CAAAAAATAA TTGAACTATT    16740AGATATTCCA AAAAATAAAA CTGAAGTTAT TGATGGCGCA GGTATTAATA TAGACTATTT    16800TTGTTATAGT ACACCACCTA ATAATACCAA GGTTAAAGTT TTTTTTGCAA GTCGCATGCT    16860TTGGAGTAAA GGGCTACGCA CGTTAATTGA TGCTAGTAGA ATTTTAAAAT TACAAGGCAT    16920CGAATTTGAG ATATTAGTTG CGGGCATTCT TGTTGACAAT GATCGCGACG CTATAAGTAT    16980AACTCAGATA GAAGAGTGGC ATAACTCCGG TGATATCATT TGGCTGGGCA AGCGTAGCGA    17040TATCAAGGAA TTAATTGAAA GTGTGGATAT AGTCGCTTTG CCATCTGTTT ACTCTGAAGG    17100TATTCCTCGA ATTCTTTTAG AAGCCGGTGC AATCGGTCGT CCTGTTATAA GTTTTGACAC    17160TGGTGGTTGT GGGAGTTTAA TACTTGACGG TTATAACGGT TTCCTTGTGC CTAAAGGAAA    17220TGTGAACCTA TTTTCTCAGA AGCTTGGTAT CCTTATTAGC GATCCTCTTG AGCGCACTAA    17280GATGGGGCAG AATGCCAGAA AGCGAGTAGA GGAAAAGTAT TCATCTACCG TTGTCATACG    17340
                                     orf16基因的终止AAAAACCGTT CAAATCTATA ATAAACTCAC AATGCAAGAA GTGCTC TAAT ATTGAGCAAC  17400AACTTATCTG AGCTTGTCGC TATGCGTTTT TTTAGTTACT TATGACAGTT ATTAATTTCA    17460CTCAAACATC TATTTCTTTA TACAACTTGT CGTTCTCCTA ATATATAATT TCTTAAATTC    17520TGTCTGTTCA TAGACAGATA CTACCTGACA GGAGTATGTA ATGTCTAAGC AACAAATCGG    17580CGTAGTCGGT ATGGCTGTGA TGGGGCGCAA CCTGGCGCTC AACATCGAAA GCCGTGGTTA    17640TACCGTCTCT ATCTTCAACC GCTCCCGTGA AAAAACCGAA GAAGTTGTCG CTGAGAATCC    17700AGGCAAAAAG CTGGTTCCTC ACTACACGGT CAAGGAGTTC GTCGAGTCTC TTGAGACCCC    17760ACGTCGTATC CTGTTAATGG TGAAAGCAGG CGCGGGCACC GATGCTGCCA TCGATTCCCT    17820GAAACCTTAC CTTGATAAAG GTGACATCAT CATTGATGGT GGTAACACCT TCTTCCAGGA    17880TACCATTCGT CGTAACCGTG AGCTGTCTGC TGAAGGCTTT AACTTCATCG GTACCGGCGT    17940ATCCGGCGGC GAAGAGGGCG CGCTGAAGGG CCCATCTATC ATGCCTGGCG GCCAGAAAGA    18000AGCGTATGAG TTGGTTGCGC CTATCCTGAC CAAGATTGCT GCTGTAGCTG AAGACGGCGA    18060GCCTTGCGTA ACCTACATCG GTGCTGACGG TGCGGGTCAT TACGTGAAAA TGGTCCACAA    18120CGGTATCGAA TACGGCGACA TGCAGCTGAT TGCTGAAGCC TATTCTCTGC TGAAAGGCGG    18180CCTGAACCTG TCTAACGAAG AGCTGGCAAC CACCTTCACC GAGTGGAATG AAGGCGAGCT    18240GAGCAGCTAC CTGATCGACA TCACCAAAGA CATCTTCACC AAAAAAGATG AAGACGGTAA    18300ATACCTGGTT GATGTGATCC TCGACGAAGC GGCGAACAAA GGCACCGGTA AATGGACTAG    18360CCAGAGCTCT CTGGACCTGG GCGAACCGCT GTCGCTGATC ACTGAATCTG TTTTCGCGCG    18420CTACATCTCC TCCCTGAAAG ACCAGCGCGT GGCGGCATCT AAAGTGCTGA CTGGCCCGCA    18480GGCTAAACTG GCTGGCGATA AAGCAGAGTT CGTTGAGAAA GTGCGTCGCG CACTGTACCT    18540GGGTAAAATC GTCTCCTACG CGCAGGGCTT CTCTCAGCTG CGTGCCGCGT CTGACGAGTA    18600CAACTGGGAT CTGAACTACG GCGAAATCGC GAAGATCTTC CGCGCGGGCT GCATCATTCG    18660TGCACAGTTC CTGCAGAAAA TCACCGACGC CTACGCTGAA AACGCGAGTA TCGCCAACCT    18720GCTGCTGGCA CCGTACTTCA AAAATATCGC TGATGAATAC CAGCAGGCGC TGCGTGACGT    18780GGTGGCCTAT GCTGTGCAGA ACGGTATTCC GGTACCGACC TTCTCTGCAG CAGTGGCGTA    18840CTACGATAGC TACCGCGCTG CGGTACTGCC GGCGAACCTG ATCCAGGCAC AGCGCGACTA    18900
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (9)

1、一种对大肠杆菌O52的O-抗原特异的核苷酸,其特征在于,其是如SEQ ID NO:1所示的分离的核苷酸,全长18900个碱基;或者具有一个或多个插入、缺失或取代的碱基,同时保持所述分离的核苷酸功能的SEQ ID NO:1的核苷酸。
2、按照权利要求1所述的对大肠杆菌O52的O-抗原特异的核苷酸,其特征在于,其由16个基因组成,都位于galF基因和gnd基因之间。
3、按照权利要求2所述的对大肠杆菌O52的O-抗原特异的核苷酸,其特征在于,所述的基因是:ABC转运系统的wzm基因;糖基转移酶基因,包括orf5、orf14、orf15、orf16基因;其中所述的基因orf5是SEQ ID NO:1中的5239至6093碱基的核苷酸;wzm是SEQ ID NO:1中的6095至6868碱基的核苷酸;orf14是SEQ ID NO:1中的12608至13936碱基的核苷酸;orf15是SEQ ID NO:1中的13929至16088碱基的核苷酸;orf16是SEQ ID NO:1中的16244至17389碱基的核苷酸。
4、按照权利要求1或2所述的对大肠杆菌O52的O-抗原特异的核苷酸,其特征在于,其源于所述的ABC转运系统的基因或糖基转移酶基因;或糖合成路径基因中的寡核苷酸;以及它们的混合或它们的重组。
5、按照权利要求4所述的对大肠杆菌O52的O-抗原特异的核苷酸,其特征在于,所述的源于orf5基因的寡核苷酸对是:SEQ ID NO:1中的5445至5462碱基的核苷酸和5970至5988碱基的核苷酸;SEQ ID NO:1中的5266至5283碱基的核苷酸和5651至5668碱基的核苷酸;SEQ ID NO:1中的5362至5379碱基的核苷酸和5783至5800碱基的核苷酸;源于wzm基因的寡核苷酸对是:SEQ ID NO:1中的6314至6331碱基的核苷酸和6840至6857碱基的核苷酸;SEQ ID NO:1中的6180至6197碱基的核苷酸和6689至6705碱基的核苷酸;SEQ ID NO:1中的6422至6439碱基的核苷酸和6711至6728碱基的核苷酸;源于orf14基因的寡核苷酸对是:SEQ ID NO:1中的12940至12958碱基的核苷酸和13869至13886碱基的核苷酸;SEQ ID NO:1中的13003至13020碱基的核苷酸和13743至13762碱基的核苷酸;SEQ ID NO:1中的13853至13872碱基的核苷酸和13345至13363碱基的核苷酸;源于orf15基因的寡核苷酸对是:SEQ ID NO:1中的14317至14335碱基的核苷酸和15064至15080碱基的核苷酸;SEQ ID NO:1中的14518至14535碱基的核苷酸和15248至15267碱基的核苷酸;SEQ ID NO:1中的14421至14438碱基的核苷酸和14845至14864碱基的核苷酸;源于orf16基因的寡核苷酸对是:SEQ ID NO:1中的16286至16304碱基的核苷酸和16935至16952碱基的核苷酸;SEQ ID NO:1中的16305至16321碱基的核苷酸和16813至16831碱基的核苷酸;SEQ ID NO:1中的16588至16605碱基的核苷酸和17257至17273碱基的核苷酸。
6、权利要求1所述的对大肠杆菌O52的O-抗原特异的核苷酸在检测表达O-抗原的细菌、在诊断中鉴定细菌的O-抗原和细菌的其它多糖抗原的应用。
7、权利要求1所述的对大肠杆菌O52的O-抗原特异的核苷酸的重组分子,而且通过插入表达可提供表达大肠杆菌O52的O-抗原,并成为细菌疫苗。
8、权利要求1所述的对大肠杆菌O52的O-抗原特异的核苷酸的应用,其特征在于,它作为引物用于PCR、作为探针用于杂交反应与荧光检测、或者用于制造基因芯片或微阵列,检测人体和环境中的细菌。
9、权利要求1所述的对大肠杆菌O52的O-抗原特异的核苷酸的分离方法,其特征在于,它包括下述步骤:
(1)基因组的提取:在5mL的LB培养基中37℃过夜培养大肠杆菌O52,离心收集细胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重悬细胞,37℃温育20分钟,然后加入10ul 10mg/ml的溶菌酶继续保温20分钟。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃温育2小时,再加入3ul 10mg/ml的RNase,65℃温育30分钟;加等体积酚抽提混合物,取上清液再用等体积的酚∶氯仿∶异戊醇(25∶24∶1)溶液抽提两次,取上清液再用等体积的乙醚抽提以除去残余的酚;上清液用2倍体积乙醇沉淀DNA,用玻璃丝卷出DNA并用70%乙醇洗DNA,将DNA重悬于30ul TE中,基因组DNA通过0.4%的琼脂糖凝胶电泳检测;
(2)通过PCR扩增大肠杆菌O52中的O-抗原基因簇:大肠杆菌O52的O-抗原基因簇通过Long PCR扩增;首先根据经常发现于O-抗原基因簇启动子区的JumpStart序列设计上游引物(#152 3-ATT GTG GCT GCA GGG ATC AAA GAAAT),再根据O-抗原基因簇下游的gnd基因设计下游引物(#1524-TAG TCG CGTGNG CCT GGA TTA AGT TCG C);用Boehringer Mannheim公司的Expand LongTemplate PCR方法扩增O-抗原基因簇,PCR反应程序如下:在94℃预变性2分钟;然后94℃变性10秒,60℃退火30秒,68℃延伸15分钟,这样进行30个循环;最后,在68℃继续延伸7分钟,得到PCR产物,用0.8%的琼脂糖凝胶电泳检测PCR产物的大小及其特异性;合并6管long PCR产物,并用Promega公司的Wizard PCR Preps纯化试剂盒纯化PCR产物;
(3)构建O-抗原基因簇文库:用被修改的Novagen DNaseI Shot Gun法构建O-抗原基因簇文库。反应体系是300ng PCR纯化产物,0.9ul 0.1M MnCl2,1ul 1∶2000稀释的1mg/ml的DNaseI,反应在室温中进行;酶切10分钟使DNA片段大小集中在1kb-3kb之间,而后加入2ul 0.1M EDTA终止反应;合并4管同样的反应体系,用等体积的酚抽提一次,用等体积的酚∶氯仿∶异戊醇(25∶24∶1)溶液抽提一次,再用等体积的乙醚抽提一次后,用2.5倍体积的无水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重悬于18ul水中;随后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mM DTT和5单位的T4DNA聚合酶,11℃反应30分钟,将酶切产物补成平端,75℃终止反应后,加入5单位的Tth DNA聚合酶及其相应的缓冲液并将体系扩大为80ul,70℃反应20分钟,使DNA的3′端加dA尾;此混合物经等体积氯仿∶异戊醇(24∶1)溶液抽提和等体积乙醚抽提后与Promega公司的3×10-3的pGEM-T-Easy载体于16℃连接24小时,总体积为90ul,其中有9ul的10×buffer和25单位的T4DNA连接酶;最后用1/10体积的3MNaAc(pH5.2)和2倍体积的无水乙醇沉淀连接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到连接产物;
(4)对文库中的克隆测序:从文库中挑选插入片段在750b以上的120个克隆,由上海生物工程有限公司用ABI377型DNA自动测序仪对克隆中的插入片段进行单向测序,使序列达到80%的覆盖率,再通过将相联系的序列进行反向测序及测通得到剩余20%的序列,从而获得O-抗原基因簇的所有序列。
(5)核苷酸序列的拼接及分析:用英国剑桥MRC(Medical ResearchCouncil)分子生物学实验室出版的Staden package软件包的Pregap4和Gap4软件拼接和编辑所有的序列,从而得到大肠杆菌O52的O-抗原基因簇的核苷酸全长序列,序列的质量主要由两个方面来保证:1)对大肠杆菌O52的基因组作6个Long PCR反应,然后混合这些产物以产生文库;2)对每个碱基,保证3个以上高质量的覆盖率;在得到大肠杆菌O52的O-抗原基因簇的核苷酸序列后,用美国国家生物技术信息学中心(The National Center forBiotechnology Information,NCBI)的orffinder发现基因,找到16个开放的阅读框,用blast系列软件与GenBank中的基因比较以发现这些开放的阅读框的功能并确定它们是什么基因,再用英国sanger中心的Artemis软件完成基因注释,用Clustral W软件做DNA和蛋白质序列间的精确比对,最后得到大肠杆菌O52的O-抗原基因簇的结构;
(6)特异基因的筛选:针对大肠杆菌O52的O-抗原基因簇中的ABC转运系统基因(包括wzm、wzt基因)和糖基转移酶基因(包括orf5、orf14、orf15、orf16基因)设计引物;在每个基因内各设计了三对引物,每对引物分布在相应基因内的不同地方以确保其特异性;用这些引物以表2中所列的166株大肠杆菌和43株志贺氏菌的基因组为模板进行PCR,所有引物都在大肠杆菌O52中得到阳性结果;其中,源于ABC转运系统的wzt基因的三对引物被发现除了在大肠杆菌O52中得到了预期大小的正确的一条带外,在第24、26、27组中也都得到同样大小的特异性带。以第24、26、27组中的每个菌的基因组DNA做模板PCR后,发现在痢疾志贺氏菌8型、所有弗氏志贺氏菌和所有宋内志贺氏菌中都得到了阳性结果;此外在第8组的大肠杆菌O43中也得到阳性结果,所以源于ABC转运系统的wzt基因对大肠杆菌O52并不是特异的。而源于orf5、wzm、orf14、orf15、or16基因的每对引物除了在大肠杆菌O52中得到预期大小的正确的PCR产物带外,在表2中所列的其他基因组中都没有扩增到大小正确的带,也就是说,在大多数组中没有得到任何PCR产物带,虽然在少数组中得到PCR产物带,但其大小不符合预期大小,所以orf5、wzm、orf14、orf15、or16基因对大肠杆菌O52及其O-抗原都是高度特异的。
CN 03129936 2003-05-27 2003-05-27 对大肠杆菌o52的o-抗原特异的核苷酸 Expired - Fee Related CN1274825C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 03129936 CN1274825C (zh) 2003-05-27 2003-05-27 对大肠杆菌o52的o-抗原特异的核苷酸

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 03129936 CN1274825C (zh) 2003-05-27 2003-05-27 对大肠杆菌o52的o-抗原特异的核苷酸

Publications (2)

Publication Number Publication Date
CN1462801A true CN1462801A (zh) 2003-12-24
CN1274825C CN1274825C (zh) 2006-09-13

Family

ID=29748465

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 03129936 Expired - Fee Related CN1274825C (zh) 2003-05-27 2003-05-27 对大肠杆菌o52的o-抗原特异的核苷酸

Country Status (1)

Country Link
CN (1) CN1274825C (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100345969C (zh) * 2004-04-19 2007-10-31 天津生物芯片技术有限责任公司 对大肠杆菌o41的o-抗原特异的核苷酸
CN100345968C (zh) * 2004-04-19 2007-10-31 天津生物芯片技术有限责任公司 对大肠杆菌o15型的o-抗原特异的核苷酸
CN117187207A (zh) * 2023-03-08 2023-12-08 中国科学院华南植物园 广金钱草黄酮碳苷糖基转移酶及其编码基因的应用

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100345969C (zh) * 2004-04-19 2007-10-31 天津生物芯片技术有限责任公司 对大肠杆菌o41的o-抗原特异的核苷酸
CN100345968C (zh) * 2004-04-19 2007-10-31 天津生物芯片技术有限责任公司 对大肠杆菌o15型的o-抗原特异的核苷酸
CN117187207A (zh) * 2023-03-08 2023-12-08 中国科学院华南植物园 广金钱草黄酮碳苷糖基转移酶及其编码基因的应用
CN117187207B (zh) * 2023-03-08 2024-03-15 中国科学院华南植物园 广金钱草黄酮碳苷糖基转移酶及其编码基因的应用

Also Published As

Publication number Publication date
CN1274825C (zh) 2006-09-13

Similar Documents

Publication Publication Date Title
Dewhirst et al. 'Flexispira rappini'strains represent at least 10 Helicobacter taxa.
CN1442423A (zh) 对大肠杆菌o107型的o-抗原特异的核苷酸
CN1442421A (zh) 对大肠杆菌o150型的o-抗原特异的核苷酸
CN1462801A (zh) 对大肠杆菌052的0-抗原特异的核苷酸
CN1442424A (zh) 对大肠杆菌o172型的o-抗原特异的核苷酸
CN1442422A (zh) 对痢疾志贺氏菌3型、大肠杆菌o124与o164的o-抗原特异的核苷酸
CN1432576A (zh) 对痢疾志贺氏菌12型和大肠杆菌o152的o-抗原特异的核苷酸
CN1307305C (zh) 对大肠杆菌o76型的o-抗原特异的核苷酸序列
CN1316020C (zh) 对大肠杆菌o74型的o-抗原特异的核苷酸
CN1453358A (zh) 对大肠杆菌059的o-抗原特异的核苷酸
CN1451662A (zh) 对鲍氏志贺氏菌1型和大肠杆菌0149的o-抗原特异的核苷酸
CN1429831A (zh) 对鲍氏志贺氏菌11型和大肠杆菌0105的o-抗原特异的核苷酸
CN1429832A (zh) 鲍氏志贺氏菌7型的o-抗原特异的核苷酸
CN1307308C (zh) 对大肠杆菌o85型的o-抗原特异的核苷酸
CN1429833A (zh) 对痢疾志贺氏菌8型的o-抗原特异的核苷酸
CN1328384C (zh) 对大肠杆菌o177型的o-抗原特异的核苷酸
CN1307306C (zh) 对大肠杆菌o11型的o-抗原特异的核苷酸
CN1316025C (zh) 对大肠杆菌o86型的o-抗原特异的核苷酸
CN1451663A (zh) 对痢疾志贺氏菌7型和大肠杆菌0121的o-抗原特异的核苷酸
CN100359016C (zh) 对大肠杆菌o108型的o-抗原特异的核苷酸
CN1438230A (zh) 对鲍氏志贺氏菌15型、痢疾志贺氏菌2型和大肠杆菌0112的o-抗原特异的核苷酸
CN1438229A (zh) 对鲍氏志贺氏菌13型的o-抗原特异的核苷酸及其应用
CN100355890C (zh) 对大肠杆菌o78型的o-抗原特异的核苷酸
CN1439645A (zh) 对鲍氏志贺氏菌8型和大肠杆菌0143的o-抗原特异的核苷酸
CN1307307C (zh) 对鲍氏志贺氏菌b14型的o-抗原特异的核苷酸

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20060913

Termination date: 20150527

EXPY Termination of patent right or utility model