具体实施方式:
下面结合具体实施例,进一步阐述本发明。应理解这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如sambrook等人,分子克隆:实验室手册(NewYork:Cold Spring Harbor Laboratory Press,1989)中所述的条件。
实施例1:基因组的提取。
在5mL的LB培养基中37℃过夜培养大肠杆菌O61,离心收集细胞。用500ul50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重悬细胞,37℃温育20分钟,然后加入10ul 10mg/ml的溶菌酶继续保温20分钟。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃温育2小时,再加入3ul 10mg/ml的RNase,65℃温育30分钟。加等体积酚抽提混合物,取上清液,再用等体积的酚:氯仿:异戊醇(25∶24∶1)溶液抽提两次,取上清液,再用等体积的乙醚抽提以除去残余的酚。上清液用2倍体积乙醇沉淀DNA,用玻璃丝卷出DNA并用70%乙醇洗DNA,最后将DNA重悬于30ul TE中。基因组DNA通过0.4%的琼脂糖凝胶电泳检测。
实施例2:通过PCR扩增大肠杆菌O61中的O-抗原基因簇
以大肠杆菌O61的基因组为模板通过Long PCR扩增其O-抗原基因簇。首先根据经常发现于O-抗原基因簇上游的galF基因设计上游引物(5’-ATTGTG GCT GCA GGG ATC AAA GAA ATC-3’),再根据O-抗原基因簇下游的gnd基因设计下游引物(5’-TAG TCG CGC TGN GCC TGG ATT AAG TTC GC-3’)。用Boehringer Mannheim公司的Expand Long Template PCR方法扩增O-抗原基因簇,PCR反应程序如下:在94℃预变性2分钟;然后94℃变性10秒,60℃退火30秒,68℃延伸15分钟,这样进行30个循环;最后,在68℃继续延伸7分钟,得到PCR产物,用0.8%的琼脂糖凝胶电泳检测PCR产物的大小及其特异性。合并6管long PCR产物,并用Promega公司的Wizard PCR Preps纯化试剂盒纯化PCR严物。
实施例3:构建O-抗原基因簇文库。
首先是连接产物的获得:用被修改的Novagen DNaseI shot gun法构建O-抗原基因簇文库。反应体系是300ng PCR纯化产物,0.9ul 0.1M MnCl2,1ul 1∶2000稀释的1mg/ml的DNaseI,反应在室温中进行。酶切10分钟使DNA片段大小集中在1kb-3kb之间,而后加入2ul 0.1M EDTA终止反应。合并4管同样的反应体系,用等体积的酚抽提一次,用等体积的酚:氯仿:异戊醇(25∶24∶1)混合溶液抽提一次,再用等体积的乙醚抽提一次后,用2.5倍体积的无水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重悬于18ul水中。随后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mM DTT和5单位的T4DNA聚合酶,11℃反应30分钟,将酶切产物补成平端,75℃终止反应后,加入5单位的Tth DNA聚合酶及其相应的缓冲液并将体系扩大为80ul,70℃反应20分钟,使DNA的3′端加dA尾。此混合物经等体积氯仿:异戊醇(24∶1)混合溶液抽提和等体积乙醚抽提后与Promega公司的3×10-3的pGEM-T-Easy载体于16℃连接24小时,总体积为90ul。其中有9ul的10×buffer和25单位的T4DNA连接酶。最后用1/10体积的3M NaAc(pH5.2)和2倍体积的无水乙醇沉淀连接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到连接产物。
其次是感受态细胞的制备:参照Bio-Rad公司提供的方法制备感受态细胞大肠杆菌DH5α。取一环大肠杆菌DH5α单菌落于5ml的LB培养基中,180rpm培养10小时后,取2ml培养物转接到200ml的LB培养基中,37℃250rpm剧烈振荡培养到OD600 0.5左右,然后冰浴冷却20分钟,于4℃4000rpm离心15分钟。倾尽上清液,用冷的冰预冷的去离子灭菌水200ml吹散菌体,于4℃4000rpm离心15分钟。再用冷的冰预冷的去离子灭菌水100ml吹散菌体,于4℃4000rpm离心15分钟。用冷的冰预冷的10%的甘油悬浮细胞,4℃6000rpm离心10分钟,弃上清液,最后沉淀用1ml冰预冷的10%的甘油悬浮细胞,即为感受态细胞。将制得的感受态细胞分装为50ul一管,-70℃保存。
最后是电转化感受态细胞:取2-3ul连接产物与50ul感受态大肠杆菌DH5α混合后,转到Bio-Rad公司的0.2cm的电击杯中电击,电压为2.5千伏,时间为5.0毫秒-6.0毫秒。电击后立即在杯中加入1ml的SOC培养基使菌复苏。然后立即将菌涂在含有氨苄青霉素、X-Gal和IPTG的LB固体培养基上37℃倒置过夜培养,次日得到蓝白菌落。将得到的白色菌落即白色克隆转到含有氨苄青霉素的LB固体培养基上培养,同时从每个克隆中提取质粒并用EcoRI酶切鉴定其中的插入片段的大小,得到白色克隆群构成了大肠杆菌O61的O-抗原基因簇文库。
实施例4:对文库中的克隆测序。
从文库中挑选插入片段在1000bp以上的100个克隆由上海生物工程有限公司用ABI377型DNA自动测序仪对克隆中的插入片段单向进行测序,使序列达到80%的覆盖率。剩余20%的序列再通过反向测序及将有些序列测通得到,最后获得O-抗原基因簇的所有序列。
实施例5:核苷酸序列的拼接及分析。
用英国剑桥MRC(Medical Research Council)分子生物学实验室出版的staden package软件包的Pregap4和Gap4软件拼接和编辑所有的序列,从而得到大肠杆菌O61的O-抗原基因簇的核苷酸全长序列(见序列列表)。序列的质量主要由两个方面来保证:1)对大肠杆菌O61的基因组作6个Long PCR反应,然后混合这些产物以产生文库。2)对每个碱基,保证3个以上高质量的覆盖率。在得到大肠杆菌O61的O-抗原基因簇的核苷酸序列后,用美国国家生物技术信息学中心(The National Center for Biot echnologyInformation,NCBI)的orffinder发现基因,找到14个开放的阅读框,用blast系列软件与GenBank中的基因比较以发现这些开放的阅读框的功能并确定它们是什么基因,再用英国sanger中心的Artemis软件完成基因注释,用Clustral W软件做DNA和蛋白质序列间的精确比对,最后得到大肠杆菌O61的O-抗原基因簇的结构,如表3所示。
通过检索和比较,发现orf1与Vibrio vulnificus CMCP6的变位酶在396个氨基酸中有86%的相同性,91%的相似性;高度的相同性表明orf1也是一个编码变位酶的基因,暂命名为orf1。Orf2与Vibrio parahaemolyticus的氨基转移酶在380个氨基酸中有73%的相同性,86%的相似性,高度的相同性表明orf2也是一个编码氨基转移酶的基因,暂命名为orf2。orf3与Vibrio parahaemolyticus的NeuC在386个氨基酸中有77%的相同性,88%的相似性,高度的相同性表明orf3也一个编码NeuC的基因,它是变位酶,将orf3命名为nnaA。Orf4与Vibrio parahaemolyticus的NeuB在357个氨基酸中有77%的相同性,84%的相似性,高度的相同性表明orf4也是一个编码NeuB的基因,将orf4命名为nnaB。Orf5与Vibrio parahaemolyticus的NeuD在195个氨基酸中有45%的相同性,67%的相似性,较高的相同性表明orf5也编码一个NeuD,因此将orf5命名为wckD。orf6与Vibrioparahaemolyticus的dNTP-转移酶在351个氨基酸中有68%的相同性,84%的相似性,较高的相同性表明orf6也编码一个dNTP-转移酶,在genbank中寻找保守的功能域,发现orf6与核苷酸转移酶PF00483的E值为3.3×e-30,因此将orf6暂命名为orf6。Orf7与Pseudomonas aeruginosa的氧化还原酶在336个氨基酸中有35%的相同性,59%的相似性,在genbank中寻找保守的功能域,发现Orf7与氧化还原酶家族PF01408的E值为4×e-05,因此将orf7暂命名为orf7。orf8与Pseudomonas aeruginosa的NeuA在223个氨基酸中有55%的相同性,70%的相似性,较高的相同性表明orf8也是一个编码NeuA的基因,命名为nnaC。Orf9与VIbrio parahaemolyticus的脱氢酶在253个氨基酸中有64%的相同性,80%的相似性,在genbank中寻找保守的功能域,发现Orf9与脱氢酶家族PF00106的E值为2.8×e-08,将orf9暂命名为orf9。Orf10与Methanosarcina acetivorans C2A的乙酰基转移酶在174个氨基酸中有32%的相同性,54%的相似性,在genbank中寻找保守的功能域,发现Orf10与细菌的己肽转移酶PF00132的E值为6.3×e-11,将orf10暂命名为orf10。Orf11与Versinia enterocolitica type O8的O-抗原转运酶在398个氨基酸的序列中有24%的相同性,44%的相似性。并且通过Eisenberg等人的算法[Eisenberg,D,Schwa rz,E.etal(1984).Analysis ofmembrane and surface protein sequences with the hydrophobic momentplot.J.Mol.Biol.179:125-142]发现orf11有12个潜在的穿膜区,它与许多Wzx蛋白相似,而且在Wzx蛋白的氨基端有一个大约40个氨基酸的保守基序,所以可以确定orf11是wzx基因,命名为wzx。Orf12与Bacillussubtilis的糖磷酸转移酶在206个氨基酸中有26%的相同性,43%的相似性,将Orf12暂命名为Orf12。blast比较表明orf13与许多Wzy蛋白相似,例如,和Escherichia coli O157:H7在304个氨基酸中有26%的相同性,44%相似性。另外通过Eisenberg算法得知orf13有10个潜在的穿膜区,与其他的O-抗原聚合酶有相似的二级结构,有一个大的loop,具有典型的O-抗原聚合酶的特征,所以确定orf13是wzy基因,命名为wzy。在genbank中寻找保守的功能域,发现orf14与糖基转移酶家族PF00535的糖基转移酶相似,E值为1.3×e-39,通过进行blast比较发现,orf14与Escherichia coli的糖基转移酶在242个氨基酸中分别有48%的相同性,69%的相似性,说明它们之间有较高的同源性,因此推测orf14也是一个糖基转移酶基因,暂命名为orf14。
实施例6:特异基因的筛选
针对大肠杆菌O61的O-抗原基因簇中的wzx、wzy基因设计引物,这些基因在核苷酸序列中的位置见表1。
在表1中列出了大肠杆菌O61的O抗原基因簇的转运酶基因、聚合酶基因及它们的相应的功能和大小。在每个基因内,我们各设计了两对引物,每对引物分布在相应基因内的不同地方以确保其特异性。在表中还列出了每个引物在SEQ ID NO:1中的位置和大小。以每对引物用表中所列的相应的退火温度以表2中的所有菌的基因组为模板进行PCR,得到了相应的PCR产物,其大小也列于表中。
mdh(malate dehydrogenase)基因是存在于所有的大肠杆菌的基因组中且高度保守的一个基因,所以我们根据mdh基因设计了引物(5′-TTC ATC CTA AACTCC TTA TT-3′)和(5′-TAA TCG CAG GGG AAA GCA GG-3′),然后从166种血清型的大肠杆菌中提取基因组,方法如前所述。用这对引物从166种血清型的大肠杆菌的基因组中PCR以鉴定大肠杆菌并检测其基因组的质量。
表2是用于筛选特异基因的166种血清型的大肠杆菌和43株志贺氏菌及它们的来源,为了检测的方便,我们将它们每12-19个菌分为一组,总共13组。它们的来源都列于表中。
在第3组中含有大肠杆菌O61的基因组DNA作为阳性对照。第13组中是不含有大肠杆菌O61的基因组DNA,作为阴性对照。以每组菌做模板,用表1中的每对引物按如下条件做PCR:在95℃预变性2分钟后,95℃变性15秒,退火温度因引物的不同而不同(参照表1),退火时间是50秒,72℃延伸2分钟,这样进行30个循环。最后在72℃继续延伸10分钟,反应体系是25ul。反应完毕后,取10ul PCR产物通过0.8%琼脂糖凝胶电泳检测扩增出的片段。
对于wzx、wzy基因,每个基因都有两对引物被检测,每对引物除了在第3组中做PCR后得到了预期大小的正确的一条带外,在其他组中都没有扩增到任何大小正确的带。所以wzx、wzy基因对大肠杆菌O61及其O-抗原都是高度特异的。
最后,通过PCR从大肠杆菌O61中筛选到对大肠杆菌O61的O-抗原高度特异的基因:wzx、wzy基因。而这些基因内的任何一段10-20nt的寡核苷酸对大肠杆菌O61的O-抗原是特异的,尤其是上述每个基因中的引物即寡核苷酸对经PCR检测后证实对大肠杆菌O61是高度特异的。所有的这些寡核苷酸都可用于快速准确地检测人体和环境中的大肠杆菌O61,并能鉴定它们的O-抗原。
实施例7:引物灵敏度的检测。
购买市场上的生猪肉馅,搅拌均匀,分成20g一份,存在-40℃冰箱中备用。将10μl大肠杆菌O61的冻存菌液接种到有20ml LB培养基的三角瓶中,于37℃,200转/分,培养12小时至饱和,取少量培养好的菌液作106和107倍的稀释,其余的菌液放于4℃的冰箱中备用,取50μl稀释菌液涂布LB琼脂平板,37度,培养12h,对所涂平板计数,计算原液中活菌浓度。在5份生猪肉馅中分别掺入5×103,5×102,5×101,5个和0个活菌,搅拌均匀,加入200ml LB培养基,经6层纱布过滤,过滤液于37℃,200转/分,培养12h。从培养好的菌液中取3ml菌液于6,000g离心5分钟,去上清,加100μl MQ超纯水吹开沉淀并混匀,放入100度沸水中煮15分钟,裂解液于12,000g离心8分钟,取1μ上清做为PCR模板。用4对寡核苷酸对,SEQ ID NO:1中的10333至10350碱基的核苷酸和10869至10886碱基的核苷酸,SEQ IDNO:1中的10020至10037碱基的核苷酸和10980至10997碱基的核苷酸,SEQID NO:1中的12267至12284碱基的核苷酸和12870至12887碱基的核苷酸,SEQ ID NO:1中的12536至12553碱基的核苷酸和12874至12891碱基的核苷酸,进行PCR反应,PCR反应体系如下:MQ:15.7μl,Mg2+:2.5μl,Buffer:2.5μl,dNTP:1μl,Taq酶:0.3μl,P1:1μl,P2:1μl,模板DNA:1μl。PCR反应条件为:95℃:5′,95℃:30″,56℃:45″,72℃:1′,72℃:5′,共30个循环。反应结束后,取10μl反应产物电泳,若有与预期大小相符的扩增带,则结果为阳性,若没有,则结果为阴性。参入了5×103,5×102,5×101,和5个活菌的每份猪肉馅均在4对引物的PCR反应中得到阳性结果。参入0个活菌的猪肉馅在4对引物的PCR反应中得到阴性结果。说明使用上述方法时,这4对引物对猪肉馅中的大肠杆菌O61的检测灵敏度均为0.25个菌/g。
通过对O抗原基因簇的克隆和在减毒的疫苗菌株中的表达,可以组建重组疫苗。O抗原为最主要的革兰氏阴性菌的表面抗原,可以引起强烈的免疫反应,是制造重组疫苗的最好的靶分子之一。在1993年Viret实验室成功的将志贺氏菌Sonnei的O抗原基因簇在一株沙门氏菌Tyziai疫苗菌中表达,动物实验证明可以引起兔子的免疫反应(Molecular Microbiology1993,7:239-252)。中国军事医学科学院的小组也在从事与Viret实验室类似的工作。王磊实验室在1999年成功的将大肠杆菌O111的O抗原基因簇在沙门氏菌疫苗STM-1中表达,并证明组建成的菌株可以引起小鼠的血液和体液反应(Microbial Pathogenesis 1999,27:55-59)。所以本发明O61的O抗原特异基因序列可以应用于组建重组疫苗。
根据本发明的对大肠杆菌O61型的O-抗原特异的核苷酸序列(SEQ ID NO:1所示),构造特异核酸探针,将其固定到芯片的载体上制成生物芯片,将要检测的样品适当处理后,与生物芯片进行杂交反应,然后利用生物芯片信号分析设备就可以得到样品中相应的细菌情况。这种大肠杆菌O抗原鉴定的DNA芯片将可以直接用于临床和其它检验场所(如食品加工和生产行业,畜牧兽医行业海关检疫等的微生物检验)。这种芯片只需要扩大产量,在完全相同的条件下就可以产业化。
表3是大肠杆菌O61的O-抗原基因簇的结构表,在表中列出了大肠杆菌O61的O-抗原基因簇的结构,共由14个基因组成,每个基因用方框表示,并在方框内写入基因的名称。在O-抗原基因簇的两端是galF基因和gnd基因,它们不属于O-抗原基因簇,我们只是用它们的一段序列设计引物来扩增O-抗原基因簇的全长序列。
表4是大肠杆菌O61的O-抗原基因簇中的基因的位置表,在表中列出了大肠杆菌O61的O-抗原基因簇中的所有开放阅读框在全序列中的准确位置,在每个开放阅读框的起始密码子和终止密码子的下面划线。在细菌中开放阅读框的起始密码子有两个:ATG和GTG。
SEQ ID NO:1序列(SEQUENCE LISTING)
<110>天津生物芯片技术有限责任公司
<120>对大肠杆菌O61的O-抗原特异的核苷酸
<160>1
<170>Patent In version 3.1
<210>1
<211>15461
<212>DNA
<213>Escherichia coli
<400>1
attcagctga ctgatgctat tgccgaactg gcgaaaaaac agtccgttga cgccatgctg 60
atgaccggcg acagctacga ctgcggtaaa aaaatgggct atatgcaggc gttcgtgaag 120
tatggactac gcaacctcaa agaaggggcg aagttccgta aaggtattga gaagctgtta 180
agcgaataat gaaaatctga ccgaatgtaa cggttgataa gaaaattata acggcggtga 240
agattcgtgg cgaaagtaat ttgttgcgaa tattcctgcc gttattttat ataaacaatc 300
agaataacaa cgagttagca ataggatttt agtcaaagtt ttccaggatt ttccttgttt 360
ccatagctga ttggtaagac aattagtgtt tgaatttttc aggtttagcg cgagtgtgta 420
acgctcgtca catcgtaggc atgtacgcag tgctctggta gctataaagc caggggcggt 480
agcgtgtgca aatctgagtt aaggcagcga ttgtgggggc tataggtatg tatagctgct 540
cgttctgtag atatgcttga accagagcag cttctgactc aggcatgtcg tcgcaataat 600
atttaatcaa cgggatcgta aaatgggtaa tattctccaa cttattggac gcaataaagc 660
attattcggt gatgatgtat ctgaaaatga agaagaatta caaagaattg tcgctacatc 720
ccgttttttg gttctgggcg gtgcaggctc tatcgggcag gctgttacaa aagagatatt 780
taaacgtaat cctcaaaagc tccatgttgt cgatattagt gaaaataata tggttgagct 840
ggtacgagat atacgtagct ctttcggtta tattgatggg gatttccaaa cctttgctct 900
ggatattggt tcggttgagt atgacgcatt tatcaaagct gatggaaaat acgattatgt 960
cctgaatttg tcagcgctta agcatgttcg cagtgaaaaa gatccgttta ctttaatgcg 1020
tatgattgaa gtaaacatcc ttaatacaga gaaaactatt caacaatcta ttgcagccgg 1080
tgttaagaaa tttttctgtg tttctaccga taaagccgca aaccctgtga atatgatggg 1140
ggcttccaag cgtattatgg aaatgttcct gatgcgcaag agcgaagaga tcgctatttc 1200
tactgctcgt tttgcaaatg tagcattttc agatggctca ctgcttcatg gttttaatca 1260
gcgactgcag aaacaacagc caattgtggc tcctcacgat atcaagcgct attttgtgac 1320
tccacaggaa tctggtgagt tgtgtttgat gtcctgtatc ttcggcgaga atcgtgacat 1380
ctttttcccc aaattaaatg aggcactgca tcttatctcc tttgccgata tcgcagtttt 1440
gtatttgaaa cagcgtggct acgaacctca tctctgtgag acggaagatg aggctcgtgt 1500
gttggcgaaa actttgccag cgcagggaaa gtggccatgc cttttcacat ccagcgacac 1560
cactggtgaa aaagatttcg aggaattttt taccgacaaa gaggtgcttg atatgaagcg 1620
ctttattaat ctcggcatta tcaagaatga tccactttac gatcccatgc ttttagacca 1680
ttttaaagaa aaaattgagc acatgagggc gtcgctggag tggagtaaaa aagacattgt 1740
aaaactgttt tttgaaatga ttccagattt tgggcataaa gaaacaggta aatatcttga 1800
cagtaaaatg taagtaggcc tcctcgtatg aatatcaatt caattatcga atttgtccga 1860
gacgtataca aaacgaatga gtttattcct ttgcatgcgc cagtttttga tggcaatgaa 1920
aaaaaatatg tattagatac acttgaaagc accttcgttt caagcgtagg caaatatgtc 1980
gatgactttg ggcgcaagat ggaggcttat actggaacgg cgagagctgt tgcgacagta 2040
aatggtactg cggcattaag tgctgcgctg tatctggctg gggtgaagcg cggcgactta 2100
gtggttaccc aagcgctgac ttttgttgca acctgtaatg ccctttatca tttgggggct 2160
gaacctgtat ttatagatgt ctcgcctgtc agtctcggtc tttgccctgt tgcgctggat 2220
agctggcttt ctgaaaatac cgagctgact gagcatgggt gccagcatcg tacaacacat 2280
cagattgttc gcgctgtggt gccaatgcac acttttggtc atcctgttga aatggatgaa 2340
cttattgcgg tctgcaagaa gtggcgaatt gttctggtag aagatgcggc agaaagcttg 2400
ggttcctttt ataaggggct gcatactggt acgcttggtg agtatggggc tctgagtttt 2460
aatggaaata agattatcac tactggtggt ggtggtatgg ttttttgtcg cgcgtctgag 2520
gaaggtgtgc gagcgaagca tgtcaccaca accgccaagg ttccacatcc atatgagttt 2580
taccacgatg agcctggttt taactaccgt atgcccaacc tgaatgctgc tctgggatgt 2640
ggacaaatgg aacgattgga tatgttttta aagcaaaaac gcacgcttgc ccagcgttat 2700
caaacattct tcgaagggtc tgagtttaaa ttcgttaaag aacctcaata tgctcagtct 2760
aattactggc ttaatgccgt aatctgtgaa aacttggatt cacgtgacgc tattttggca 2820
caaatgaatg aagcaaaagt gatgacacgc ccgatatgga aactgatgca ccgcttacca 2880
atgtttgagc acgcaatgcg ggatgatctt aaaaactctg agcaaattga ggctcgcttg 2940
gtcaacttgc ctagctctcc tgtggaataa gtgcgatgac aacaacaaca cgcaaggtcg 3000
cagtttttac cggaactcga gcagaatatg gattactcta ttggttaatg aaggacatcc 3060
agagcgacga ggagctgcaa ctgcaactgc tcgtcagtgg tatgcacctt tcccctgaat 3120
ttggcagtac atggcaacag atcgagcagg atggtttttc aattgatgag aaaattgaaa 3180
ttttgctctc ctctgattct ccggtcggta tagcaaaaag catggggttg ggggttctgg 3240
ggtttgctga tgcattatcc cggctgaaac ctgatgtttt ggtcattctt ggcgatcgtt 3300
ttgaagctct tgcggcggcg caaaccgcga tgattcttcg tattcctgtt ttccatctac 3360
atggcggtga aattactgaa ggtgcctacg atgatgctat taggcacgcc atcacgaaat 3420
tgagttattt acacggtact tccacggaag aatataaaaa ccgtgtcgtt cagttgggtg 3480
aaaatccggc tcgtgttact aatgtgggtg ctattgggtt agagcatctg aagcgtagca 3540
agtttatgac ggtcgaagag ttatcaacat cattgaattt ttcgctaaaa aagccgtatg 3600
tagttgtcac atatcatccg gttactttag gtgatgagcc tgctgaggcg agctttacag 3660
cattgctgga cgcgcttgat aaatttcccg agcttcaggt tatcctgacc tacccgaatg 3720
cggatgatgg cggcagaaaa attattcctt tacttgaagc ttatgctgct aaatcacctg 3780
aacgcgtcaa agctatcccg tcacttggac agatgcgtta tctaagtgcg gttaaatatg 3840
cttcagcggt ggtgggaaac tcttccagcg gcataattga ggtgcctgct ctcgacgttc 3900
ctacggtaaa tattggcgtg cgtcaaaaag ggcgtattgc cgcgcaaagc gtactcaatt 3960
gtgatgctac aacggaatct atcactgctg cactaacgag tgcgatttcg cgaagttaca 4020
taagggaagg agaaaaaata tccaatcctt atgggcaagg gaatgcgagt gctaagatca 4080
ttgagatgat caaatccatg aattttgtac cgagcaagac attctacgac attaagtgaa 4140
attgtatgac gcttattatt gctgaagccg gtgttaacca caacggcgac gaaaaactgg 4200
cttttaaact tgttgatgct gctcataaag caggtgctga tatcgtcaaa tttcagacgt 4260
tcaaggcgaa aaacttggta acagctgaag cagtacaggc ggactatcag gttgcgaaca 4320
ctaagaagca agaatcacag ttagaaatgc taagtcggtt ggagctttca tgggaagctc 4380
accacaagct ggttagttat tgtaataaac ttggtatcga attcctttca accgcctttg 4440
attccgagag cttggatttt cttgttaatg agcttggcgt caaaaggcta aagttacctt 4500
caggtgaatt gactaacgcg cctttggtac ttgagcatgc gcgcactggt tgcgacatta 4560
ttgtctcaac gggaatggcg acattggctg agattgaggc cgcgttgggt gttattgctt 4620
tcggatatac agcgcctgaa gaggcagtgc cgagtattga agcttttcag cgtgcgtact 4680
cgtctgaggt tggtcaaaaa gcgcttaagg aaaaggttat cgttcttcat tgcactacgg 4740
aatatcctgc gccagtggaa gagattaatc tacgtgctat ggatacgttg cgtcaggcgt 4800
ttggattacc tgtggggtat tccgatcaca gtgaagggat aatgattcct gtggccgctg 4860
ttgcacgtgg tgcggttgtg atcgaaaaac acttcacact tgataaaaac atggaaggac 4920
cggaccacaa agcatcgctg gagcccgttg aactggaggc aatgattgcc gctattcatc 4980
agatagaaaa agcgctaggg aatagcatta aagcgcctac tgtgtcagaa atcaaaaaca 5040
agagtgttgc gcgaaaaagc ctagttgctg caaaaactat tatagcgggg gaaagcttca 5100
catccgataa tctggcaata aagcgccctg gtacaggtat gtctccttat ttatattgga 5160
atttaataaa tgaagtttct gaaaatgatt atttaccggg ggagttgatt agtgaatgat 5220
aatcttcaga gaaaaccact tgttattatt ggtgggggag ggcacgctag cgtaattgtt 5280
gatattttga aaagacagaa gcgagagatt gttgctatta ttagccctga tgatatcact 5340
cagcgaaagg tatattcagg aattgatgtt ttttcgaatg ataatgaaat ctttcgtttc 5400
caaccaaagg atattcgctt aattaatgga attggtgcct taccagactc ggaagttagg 5460
tataaagtta atttgtactt tgaaaaaatg ggctattgtt ttgaaacaat tgtagctgat 5520
aacgcatatg tgtcaccctt tgcctttttg gaagaaggag tacagatatt tcctggtgcc 5580
ataattcaac cagggacaca tattggtgcc catactatta ttaatacccg tgtagtcatt 5640
gagcatgatg tatctctcgg tgcatataac gcaatctctc ctggggctat aatatgtggg 5700
cagtgtaaaa ctgaagagcg tgtattcatt ggtgcaggtg caattgttat tcagaatatt 5760
gaaatcggat caagagccac aatcatggcg aacgcactgg tagcagaaaa tatacatccc 5820
caacaaaaag tttatgcttc acgcggtata gtcagataat gtttcagaag gtatataatg 5880
aatcagcaat ggaaaaatgt attaatctca ccagatagct cgatacttga agcactcgaa 5940
attatcaata acgaagcatt aagagttgcg ctggtagtta atgagaataa cacgttatta 6000
ggagtcatta ccgatggtga tattcgaaga ggaattttga aaaacctgcc tctgactgca 6060
gaagtacacc aggttatgaa taaaaaaccc gtaacggcaa gtccagttct ttccaaaaaa 6120
gaactcaata atctgatgtc atcgcatggg atactgtcta taccaatagt cgataagggt 6180
atcattgtgg ggctggagac tattacaagc atcgctgcaa cggaaaaata tgataatcct 6240
gtttttatta tggccggagg gtttggtact cgtttgagac cactcactga taattgccct 6300
aaaccaatgc ttaaagtagg tgataaacct attttagaga cagtggtaag aagctttgtt 6360
aaagcagggt ttagtaattt atatatatca acccattttc tgccagatat gattcatcag 6420
cacttcggtg atggtgatgc gtttaatgca aaaatcacct atatacatga agaaactccc 6480
ttaggtacgg gaggagcgct gggattgctt cctgactcct tatcagattc tttgccactc 6540
attatgatca atggtgatgt gcttaccaat attgattttg agcggttact atcatttcat 6600
aataataaca atgcggatgc tacaatctgc gtaagaaaat atgactacca gatcccatat 6660
ggtgttataa caggtaatgg taataaaata gtcagtatgg ttgaaaagcc agtacatcat 6720
ttctttgtta atgcaggaat ctatgttgtt tctcccgata tttttaaatc agtacccaaa 6780
aaccatcgaa ttgatatgcc gacgttactc gaacaattta tgagtaagaa taaagagata 6840
ctaatgttcc cgattcatga gtattggctt gatatagggc gaatagatga ttttaatcgg 6900
gcacaggccg atattcattc tttagggctg gattaaaaat gaaaaaggtc gctgtaatcg 6960
ggctgggaaa tatcgcaaca agacatcgcc acaatcttaa aaaacttttt ccaggaatta 7020
ttgttttttc tatgtcttca agtgagcgag tgctatccga gttagtgagt gactgtgatg 7080
gtcacttagc taatgtagat gctatcatac aagagcaagt cgattttgta attgtagcat 7140
caccagcaac ttaccattta cggcatagtg aaaaactttt ggcagcagga attccctact 7200
ttttattgaa aaaccctgtt acagcttcgt ttgatgacgc taagaagtta catgaaatag 7260
ctgaaagaca cgcaactccg gtggctatag gatattgttt acgctatttg ccttctgcaa 7320
aaataattaa aaaaataatt gaggataaat ttattggcag tatttacaat gtcaatattg 7380
agattggtca atatctgccg gattggagac cgtcaaaatc atatcgtgaa agtgtatcag 7440
caagtaaagt tttgggtggc ggagcgctac tcgaattaag tcatgagctg gattatgcgc 7500
aatggctatt tggtgaactg aaacttgtga attcagtgct acggacttcg tcagaacttg 7560
aaatggatgt cgaatcttta gctgatatta tagtgataaa ttccgccggt tcgcttatta 7620
atatccatct tgatttcctt caaaagaaac catggcgaca atgtcatatt attggcagta 7680
agggacgaat tgtctgggat cttatccgca atgaaatcat tcatcatact cgacagagta 7740
ccgatattat ctttagtgat cctggctggg ataaaaatgg tatgtataca gatatgctgc 7800
tcgacttcat tgcggaaata tccgggagtg ataacaactg tgtgacattg gagtcatcaa 7860
taaatattgt tagcttaatt gataagataa aagaaacaag tcaatgcctt ggagaagttc 7920
aatgaaaata aacgctttta tatttgcacg tgggggatca aaaggattac ctggtaaaaa 7980
tattaaacct ctagcaggca aacctctcct gcaatactct attgagactg ccaaacagag 8040
tccttcgatt tcctctatat atgtttcaac cgacgatgat gatattgctc tcgttgcaga 8100
aaattgtggt gctactgtta ttcgtagacc ggcggagctt gccggagata ctagtccaga 8160
atggttggca tggcgtcacg caattgagtg ggttcagaag gaagtggggg atttcgatgg 8220
ctttgtaagt ttaccgacta caagcccttt gcgaagtgtc gatgatgtcg aatgtgctat 8280
tgctaaaaga gtcgagtctg gtgctgacat atgcatttca gtcactccgg cgagcagaag 8340
tccttatttt aatatggtaa aatttcacga aagtggttat gtgaggcttg tcaatgaacc 8400
ggaagggaaa gtgctcagac ggcaggattc accagacgta tttgatatta ctactgttgt 8460
gtacgcgaca acgccaaaat ttgttttgaa taattatggg ctattctcag gcaaagttgc 8520
aagcattatt gttcctaaag aacgtgccgt tgatatagat gatatttttg atttttacat 8580
ggcggaaatt ttacttaagg aattgaatcg tggctaatat acttaaaggg aaaaaaatcc 8640
ttattgctgg tgccggtgga ttgctaggca ctcatcttgt taaaaaagtc atagatgaag 8700
gtggttatgt tattgccggt gattttgact tagtgtcaac acagaacaaa ttaaatgagc 8760
tgggtatcac aactggatat gaattacatc aacttgatgt aacaagtctt gaatctgttc 8820
aggaaatact agccattgca cctgatctgg atggtgctat taatacgact tatcctcgaa 8880
ataaaactta tggtgcccac ttttacgatg taacgctgga aagtttcaac gaaaatcttt 8940
cgttgcatct tggaagttca tttcttttct cacaacagtg tgcagcatat ttcaaaaaaa 9000
atcagcgttc attttcactt gtaaatattt cttctattta tggtgtcgtg gcaccaaaat 9060
tcgaaatata cgaaaatact aaaatgacga tgcctgttga atatgcggca ataaaatcgg 9120
cattgttaca tttaaacaaa tatattgtag cttatgttag agatagtcga tttagagtta 9180
atgctgtaag ccctggcggt atttttgatc atcaaccaga tgctttttta gaagcatata 9240
aaaaagaaac taatggtgca gggatgcttg gtgttacaga aatgcttgga agtattgtat 9300
ttttgctttc tgatgcgtca aaatatgtaa cgggacaaaa tattattgtt gatgacggct 9360
tttcattatg atttctttta taaaaaaaat aaaattttgg attgtgtgca acaggttagg 9420
acctgatata ccacttagtc acttattatt atattcacgt cgcttggggc gtatgatttg 9480
taaacggaaa ttcaaaagtt ttggcaataa ctcttctttt cggccttttg catatgctat 9540
tgaaacacaa aagattgcta tcggtgataa tgttgttatc aggcctggta caatgttatt 9600
tgcttcacca tatggtgaag aaaaaaaact tcatatcctt attgaagatg atgttttaat 9660
tggttcttct gtacatattt atgtatccaa ccataagttt tttgatataa cattacctat 9720
ctctaagcaa ggtcattcag tggtgaaacc tgttattctg aaaaaaggtt gttggattgg 9780
tgctaatgta accattttac ctggagtggt agtcggtgaa aattcggttg ttggtgcaaa 9840
tagtgtagtt acgaaaagta tctctccttt tacagttgtt gcaggaaacc cagccaaaat 9900
tataaagaaa ttaaatgagt gaatataaaa gaatttttca gtatttagca tttgacctta 9960
caaataaggt tttaccattc gtagttccat actttattgc ttcctatttg agttcagtag 10020
agttagggta ttatacaact aaacagcttt tatttttact gttctttaat atcataagta 10080
tggggggagg cgcaaaatta ctagtctcta tctcaaagaa agatggagag gagaaaaaaa 10140
tctcatccat tttattaaaa atgttttgtt ttaatgcctg tgttatttta tttttttatg 10200
tattacttcc ttttttcatt gttagtgaaa atgtaattaa agattatata ccattggtaa 10260
tatgctcttt attttattct attatacagc tgcaattgtc gatttataga ggatataata 10320
gaataaatgc ttacgggatg ttaaatctaa gcctctcagt ttgtgtttgt atcgtgatat 10380
tcagttatat attatatttc aaaacgcaac tagggttatg gtattggcta attataccat 10440
atgcactttt ttctattaaa tttttgaaata ttatctgac agagcgagta ttatcatctg 10500
ctgttttact tgatacatta aaattttgtt tttatcaatt tcctcatgtg ctaagttcgt 10560
ggtgtcgttt aggtattgat aggctatttt tggctaatat attcgctatg tcattggttg 10620
gatactactc aatgatgctt cagtttggtt tgattgttag cgcagtactt cagtcattga 10680
ataattatta ttccccttat ctcttcagag ttctctcaga aagacaatcg tataaaaaac 10740
tgtctctatt tagtaaaaat aataaagctg ctcgttcatc gtttctgttt tttgtagcct 10800
cttttgttat cgttatagtg gtgaatattt ttgcatatgt cgttgttcat tattttttac 10860
ccagcgagta ttctccatat tactatctgg taccattggt tacttttgcc tatggattgc 10920
aaggatgcta ctttgcagtt gttaattata tttatttttg ggggaagact cagtatctta 10980
atatcccatc gatattatca tgcttatttc aggtggtaat tggctacttc tttatcttac 11040
atttctctct attgggagca tcattaagtt tattaatgtc ttggagtttg caactgctat 11100
ttacattagg gggggtgatg tatgttgcaa aaaacaaata aaaagggatt tcaattggct 11160
ttagttgagt ccttactgca actaaaaact ttagatagtt attctggaaa taataaaaat 11220
aacattcatc tttttgttcg actaaatggt gagcagaaaa atgaggagga gatactcaat 11280
tttattaaac caagagcatg tcattattct tcagttcaat ttgtaagcat tcgacgaaat 11340
gataagttct ctttactctt taatattctg aaattaagat tatttctttt ttgtaaacga 11400
aaggtaattt tgatcattgg tgatccacgc gctctgtgga tgaatatgat atcatcgttt 11460
aaaaatgttc atgatgtaat atacttagag gatggaatgt caacagtcct cttttatcag 11520
acctttaaac ctaagtaccc acataaacat tataaactgg ttacacgcct gaaactggat 11580
ggtaatgcct ttctgtctct tattcctttg gaagtaaaaa agaatacggt tatgcggatc 11640
gacaatgatg tggctttgtt catcggtatg ccgatgattg aaaataacgc gttgagtaaa 11700
aagaaatatt tatcttatct gcataaaatt attatgtctt tgaagaatat gaagataaca 11760
aagttttatt atgctcccca tagatatgaa aatgaaaata atttttattt atatgagaat 11820
ttgggttttc atatgttaga tacagattgt gctattgaag attatctcaa cagcaagaac 11880
attatcccgg cggtgtatgc tagtttttat tcaacagcct tattacagat agatacttta 11940
ttttatggag ttagtgttat ttgttatgta attaatgttg aagagttgaa ttatgacttt 12000
cgtaatccag cattatatgc atatgaatat tataacaaaa ctccctctat tataaaggtt 12060
gatttgcatg attgaatttt tattgttcat attatgtagc tttatcttat atcaggtttt 12120
ttatgttact aaggaattta agagtaatct tttcttaatc atgtgggggt atacttttct 12180
attcgtaact cccgttatat acatttttta tggtggtgag aaatatcgtg tctttagtga 12240
tgaaagtgca ttaacatttt atttgttggg ttgtctctcc gctgcgttta taattttaat 12300
gcttctgttc aaggtttcac ttaaccgaat aaaaatatgt aaaatcaatt tatttatctc 12360
cgattttata ttaaaaatta tattttcttt ctgtataatg tttgttgttc tttatattct 12420
attttattgg agggagtggc ctttttttga ttttgtctcg ggagatatct cagaccgtcc 12480
ggatattgta aaaggaacct ttcaaggttt ttttatctat tctttattta cgagcataat 12540
aatccccggg atatattttc atttaaaaga taaaaaagga aaattgttta atttactttt 12600
ctttattttt gtttgtttta gtatggtggt aagtggtaat aaaggtgttt ttctatattt 12660
tattattttt aatgtgttat ttgaatggaa aaagatacgt ctaagtacgt attt9attat 12720
tatcgtaggt ctgatggcta tctatgcctt aattcgtctg ccatttatag gtgacaattt 12780
ttctttatca tatctaattg aatcgatatc tgagaggatt tttttaacgc aagggatggc 12840
tatgccagcc gttatcgagt tagcaaagtc aaccgatgtg acaatgatga actctaatga 12900
tctaaaatac acacttttta atttcgttta tggctatagc cccggttcga tgcctctttt 12960
ttatacagct gaattatatg tcaggtatgg ttggttaatg atgtctttca tatctgtaat 13020
aatttcgctt gtatttggat ttggtgcatt tgttattaat aagacaaagg attctgccat 13080
tagatgggtt tattatatct ctttatatgc actaataatg ggaggggtag gaagtgctaa 13140
tcttttcttt tttattgtgg caattttatg gtggttatta ttaactctca gtaatggaac 13200
aattacaagt aggagtggca agtgattgca gaagtatcaa taattatgcc gatgtacaat 13260
gctgaacatt atgtcagagc gtcaatttgt tcaattttaa atcagacgtt taaaaatttt 13320
ttattatata ttattgacga ctgctctacg gattcatcaa agcagattgc tgaatctttt 13380
aacgacccgc gaataatcat tatttcgaat gctatcaatg ttggagttgc tcgaactcgt 13440
aataaaggaa tagagcttgc gcagacgaaa tatatcgcat tttgtgatag tgatgatatc 13500
tggcatgagc aaaaactgga aaaacaaatc tcactacttg atagtgggaa atataatgtt 13560
gttggaagtt tttactcaac ttttaaggat ggaaagtttg aaagtgcaaa gttaatatct 13620
gcgcctgaac ttgtttgtta tcgtgatatg cttaaatcta attggattgg taatcttact 13680
ggcatttata atgcttatgt tttaggtaag gtttttcaac aagaaattgg tcatgaagat 13740
tatgtaatgt ggttgaaact tattgaaaaa agtcgagttg cttacattat tcaagaacct 13800
ttggcttatt ataggattag gtcctcatct ctttcttcga ataaaatgaa agcttgcttg 13860
tggcagtgga gaatttatcg gaaaatgctt cattttaata tttttagaac ttcttgttat 13920
atgttctttt atattattgc tgcattaaat aaaagacggt aattatttaa tgcacatatt 13980
ttataagtga gtaaatttta caattactgg gttaatttaa ggggtggaat atttctgtta 14040
ttgtttatgt ttttaatata gaatcgatgt aaattaaaac ctcacaggtc gtgtggagac 14100
cgcatctgac aggagtaaac aatgtcaaag caacagatcg gcgtcgtcgg tatggcagag 14160
atggggcgca accttgcgct caacatcgaa agccgtggtt ataccgtctc tattttcaac 14220
cgttcccgtg aaaagacgga agaagtgatt gccgaaaatc caggcaagaa actggttcct 14280
tactatacgg tgaaagagtt tgttgaatct ctggaaacgc ctcgtcgcat cctgttaatg 14340
gtgaaagcag gtgcaggcac ggatgctgct attgattccc tcaagccata cctcgataaa 14400
ggtgacatca tcattgatgg tggtaacacc ttcttccagg acaccattcg tcgtaaccgt 14460
gagctttctg cagaaggctt taactttatc ggtaccggtg tttccggtgg tgaagaaggc 14520
gcgctgaaag gtccttccat tatgcctggt gggcagaaag aagcctatga actggttgcg 14580
ccgatcctga ccaaaatcgc cgcagtggct gaagacggtg agccatgcgt tacctatatt 14640
ggtgccgatg gtgcaggtca ctatgtgaag atggttcaca acggtattga atacggtgat 14700
atgcaactga ttgctgaagc ctattctctg cttaaaggtg gtctgaacct ctccaacgaa 14760
gaactggcgc agacctttac cgagtggaat aacggtgaac tgagcagcta cctgattgac 14820
atcactaaag acatcttcac taaaaaagat gaagacggta actacctggt tgatgtgatt 14880
ctggatgaag cagctaacaa aggtaccggt aaatggacca gccagagcgc gctggatctc 14940
ggtgaaccgc tgtcgctgat taccgagtct gtgtttgcac gttatatctc ttctctgaaa 15000
gatcagcgtg ttgccgcatc taaagttctc tctggcccgc aagcacagcc agcaggcgac 15060
aaggctgagt tcatcgaaaa agttcgccgt gcgctgtatc tgggcaaaat cgtttcttac 15120
gctcagggct tctctcagct acgcgccgcg tctgaagagt acaactggga tctgaactac 15180
ggtgaaatcg cgaagatttt ccgtgctggc tgcatcatcc gtgcgcagtt cctgcagaaa 15240
atcaccgatg catatgccga aaatccgcag atcgctaacc tgatgctggc tccgtacttc 15300
aagcaaatcg ccgatgacta ccagcaggcg ctgcgcgatg tcgtcgctta cgcggtacag 15360
aacggtatcc cggttccgac cttcgccgct gcggttgcct attatgacag ctaccgcgcc 15420
gctgttctgc ctgcgaacct gatccaggcc cagcgcgact a 15461
表1大肠杆菌O61的O抗原基因簇中wzx基因、wzy基因及其中的引物及PCR数据
基因 | 功能 | 基因的碱基位置 | 正向引物位置 | 反向引物位置 | PCR产物长度 |
产生正确大小电泳带的组数 |
PCR的退火温度(℃) |
wzx |
O-抗原转运酶 |
9915-11141 |
10333-1035010020-10037 |
10869-1088610980-10997 |
544bp978bp |
00 |
6060 |
wzy |
O-抗原聚合酶 |
12068-13225 |
12267-1228412536-12553 |
12870-1288712874-12891 |
621bp356bp |
00 |
6060 |
表2166种血清型的大肠杆菌和43株志贺氏菌及它们的来源
组号 该组中含有的菌株 来源
1、野生型大肠杆菌 O1,O2,O5,O7,08,O9,O12,O13,O14,O15,O16,O17,O18, IMVSa
O19ab,O20,O21,O22,O23,O24
2、野生型大肠杆菌 O4,O10,O25,O26,O27,O28,O29,O30,O32,O33,O34,O35, IMVSa
O36,O37,O38,O40,O41,O42,O43
3、野生型大肠杆菌 O6,O44,O45,O46,O48,O49,O50,O51,O52,O54,O55,O56, IMVSa
O57,O58,O60,O61,O62,O53
4、野生型大肠杆菌 O63,O65,O66,O69,O70,O71,O74,O75,O76,O77,O78, IMVSa
O79,O80,O81,O82,O83,O68
5、野生型大肠杆菌 O84,O85,O86,O87,O88,O89,O90,O91,O92,O98,O99, IMVSa
O101,O102,O103,0104,O105,O106,O97,
6、野生型大肠杆菌 O107,O108,O109,O110,O111,O112ab,O112ac,O113, IMVSa
O115,O116,O118,O120,O123,O125,O126,O128,O117
7、野生型大肠杆菌 O129,O130,O131,O132,O133,O134,O135,O136,O137, IMVSa
O138,O139,O141,O142,O143,O144,O145,O140
8、野生型大肠杆菌 O146,O147,O148,O150,O152,O154,O156,O157,O158, IMVSa
O159,O160,O161,O163,O164,O165,O166,O153 b
9、野生型大肠杆菌 O168,O169,O170,O171,O172,O173, c
痢疾志贺氏菌 D1,D2,D3,D4,D5,D6,D7,D8,D9,D10,D11,D12,D13 d
10、鲍氏志贺氏菌 B1,B2,B3,B4,B6,B7,B8,B9,B10,B11,B12,B13,B14,B15, d
B16,B17,B18
11、福氏志贺氏菌 F1a,F1b,F2a,F2b,F3,F4a,F4b,F5(v:4),F5(v:7),F6, d
DS,DR
12、野生型大肠杆菌 O3,O11,O39,O59,O64,O73,O96,O95,O100,O114,O151,O155,IMVSa
O124,O167,O162,O121,O127,O149,O119
13、野生型大肠杆菌 去除大肠杆菌061的第3组菌
为了检测的方便,每12-19个菌分为一组,总共12组,第13组作为阴性对照
a.Institude of Medical and Veterinary Science,Analaide,Australia
b.Statens Serum Institut,Copenhagen,Denmark
c.O172和O173来自于Statens Serum Institut,Copenhagen,Denmark,其余来自
于IMVS
d.中国预防医学科学院流行病学研究所
表3是大肠杆菌O61的O-抗原基因簇的结构表
orf1 orf2 nnaA nnaB wckDorf6 orf7 nnaC orf9 orf10 wzx orf12 wzy orf14
1kh
表4是大肠杆菌O61的O-抗原基因簇中的基因的位置表
ATTCAGCTGA CTGATGCTAT TGCCGAACTG GCGAAAAAAC AGTCCGTTGA CGCCATGCTG 60
ATGACCGGCG ACAGCTACGA CTGCGGTAAA AAAATGGGCT ATATGCAGGC GTTCGTGAAG 120
TATGGACTAC GCAACCTCAA AGAAGGGGCG AAGTTCCGTA AAGGTATTGA GAAGCTGTTA 180
AGCGAATAAT GAAAATCTGA CCGAATGTAA CGGTTGATAA GAAAATTATA ACGGCGGTGA 240
AGATTCGTGG CGAAAGTAAT TTGTTGCGAA TATTCCTGCC GTTATTTTAT ATAAACAATC 300
AGAATAACAA CGAGTTAGCA ATAGGATTTT AGTCAAAGTT TTCCAGGATT TTCCTTGTTT 360
CCATAGCTGA TTGGTAAGAC AATTAGTGTT TGAATTTTTC AGGTTTAGCG CGAGTGTGTA 420
ACGCTCGTCA CATCGTAGGC ATGTACGCAG TGCTCTGGTA GCTATAAAGC CAGGGGCGGT 480
AGCGTGTGCA AATCTGAGTT AAGGCAGCGA TTGTGGGGGC TATAGGTATG TATAGCTGCT 540
CGTTCTGTAG ATATGCTTGA ACCAGAGCAG CTTCTGACTC AGGCATGTCG TCGCAATAAT 600
Orf1的起始
ATTTAATCAA CGGGATCGTA AA
ATGGGTAA TATTCTCCAA CTTATTGGAC GCAATAAAGC 660
ATTATTCGGT GATGATGTAT CTGAAAATGA AGAAGAATTA CAAAGAATTG TCGCTACATC 720
CCGTTTTTTG GTTCTGGGCG GTGCAGGCTC TATCGGGCAG GCTGTTACAA AAGAGATATT 780
TAAACGTAAT CCTCAAAAGC TCCATGTTGT CGATATTAGT GAAAATAATA TGGTTGAGCT 840
GGTACGAGAT ATACGTAGCT CTTTCGGTTA TATTGATGGG GATTTCCAAA CCTTTGCTCT 900
GGATATTGGT TCGGTTGAGT ATGACGCATT TATCAAAGCT GATGGAAAAT ACGATTATGT 960
CCTGAATTTG TCAGCGCTTA AGCATGTTCG CAGTGAAAAA GATCCGTTTA CTTTAATGCG 1020
TATGATTGAA GTAAACATCC TTAATACAGA GAAAACTATT CAACAATCTA TTGCAGCCGG 1080
TGTTAAGAAA TTTTTCTGTG TTTCTACCGA TAAAGCCGCA AACCCTGTGA ATATGATGGG 1140
GGCTTCCAAG CGTATTATGG AAATGTTCCT GATGCGCAAG AGCGAAGAGA TCGCTATTTC 1200
TACTGCTCGT TTTGCAAATG TAGCATTTTC AGATGGCTCA CTGCTTCATG GTTTTAATCA 1260
GCGACTGCAG AAACAACAGC CAATTGTGGC TCCTCACGAT ATCAAGCGCT ATTTTGTGAC 1320
TCCACAGGAA TCTGGTGAGT TGTGTTTGAT GTCCTGTATC TTCGGCGAGA ATCGTGACAT 1380
CTTTTTCCCC AAATTAAATG AGGCACTGCA TCTTATCTCC TTTGCCGATA TCGCAGTTTT 1440
GTATTTGAAA CAGCGTGGCT ACGAACCTCA TCTCTGTGAG ACGGAAGATG AGGCTCGTGT 1500
GTTGGCGAAA ACTTTGCCAG CGCAGGGAAA GTGGCCATGC CTTTTCACAT CCAGCGACAC 1560
CACTGGTGAA AAAGATTTCG AGGAATTTTT TACCGACAAA GAGGTGCTTG ATATGAAGCG 1620
CTTTATTAAT CTCGGCATTA TCAAGAATGA TCCACTTTAC GATCCCATGC TTTTAGACCA 1680
TTTTAAAGAA AAAATTGAGC ACATGAGGGC GTCGCTGGAG TGGAGTAAAA AAGACATTGT 1740
AAAACTGTTT TTTGAAATGA TTCCAGATTT TGGGCATAAA GAAACAGGTA AATATCTTGA 1800
Orf1的终止 Orf2的起始
CAGTAAAATG
TAAGTAGGCC TCCTCGT
ATG AATATCAATT CAATTATCGA ATTTGTCCGA 1860
GACGTATACA AAACGAATGA GTTTATTCCT TTGCATGCGC CAGTTTTTGA TGGCAATGAA 1920
AAAAAATATG TATTAGATAC ACTTGAAAGC ACCTTCGTTT CAAGCGTAGG CAAATATGTC 1980
GATGACTTTG GGCGCAAGAT GGAGGCTTAT ACTGGAACGG CGAGAGCTGT TGCGACAGTA 2040
AATGGTACTG CGGCATTAAG TGCTGCGCTG TATCTGGCTG GGGTGAAGCG CGGCGACTTA 2100
GTGGTTACCC AAGCGCTGAC TTTTGTTGCA ACCTGTAATG CCCTTTATCA TTTGGGGGCT 2160
GAACCTGTAT TTATAGATGT CTCGCCTGTC AGTCTCGGTC TTTGCCCTGT TGCGCTGGAT 2220
AGCTGGCTTT CTGAAAATAC CGAGCTGACT GAGCATGGGT GCCAGCATCG TACAACACAT 2280
CAGATTGTTC GCGCTGTGGT GCCAATGCAC ACTTTTGGTC ATCCTGTTGA AATGGATGAA 2340
CTTATTGCGG TCTGCAAGAA GTGGCGAATT GTTCTGGTAG AAGATGCGGC AGAAAGCTTG 2400
GGTTCCTTTT ATAAGGGGCT GCATACTGGT ACGCTTGGTG AGTATGGGGC TCTGAGTTTT 2460
AATGGAAATA AGATTATCAC TACTGGTGGT GGTGGTATGG TTTTTTGTCG CGCGTCTGAG 2520
GAAGGTGTGC GAGCGAAGCA TGTCACCACA ACCGCCAAGG TTCCACATCC ATATGAGTTT 2580
TACCACGATG AGCCTGGTTT TAACTACCGT ATGCCCAACC TGAATGCTGC TCTGGGATGT 2640
GGACAAATGG AACGATTGGA TATGTTTTTA AAGCAAAAAC GCACGCTTGC CCAGCGTTAT 2700
CAAACATTCT TCGAAGGGTC TGAGTTTAAA TTCGTTAAAG AACCTCAATA TGCTCAGTC T 2760
AATTACTGGC TTAATGCCGT AATCTGTGAA AACTTGGATT CACGTGACGC TATTTTGGCA 2820
CAAATGAATG AAGCAAAAGT GATGACACGC CCGATATGGA AACTGATGCA CCGCTTACCA 2880
ATGTTTGAGC ACGCAATGCG GGATGATCTT AAAAACTCTG AGCAAATTGA GGCTCGCTTG 2940
Orf2的终止 Orf3的起始
GTCAACTTGC CTAGCTCTCC TGTGGAA
TAA GTGCG
ATGAC AACAACAACA CGCAAGGTCG 3000
CAGTTTTTAC CGGAACTCGA GCAGAATATG GATTACTCTA TTGGTTAATG AAGGACATCC 3060
AGAGCGACGA GGAGCTGCAA CTGCAACTGC TCGTCAGTGG TATGCACCTT TCCCCTGAAT 3120
TTGGCAGTAC ATGGCAACAG ATCGAGCAGG ATGGTTTTTC AATTGATGAG AAAATTGAAA 3180
TTTTGCTCTC CTCTGATTCT CCGGTCGGTA TAGCAAAAAG CATGGGGTTG GGGGTTCTGG 3240
GGTTTGCTGA TGCATTATCC CGGCTGAAAC CTGATGTTTT GGTCATTCTT GGCGATCGTT 3300
TTGAAGCTCT TGCGGCGGCG CAAACCGCGA TGATTCTTCG TATTCCTGTT TTCCATCTAC 3360
ATGGCGGTGA AATTACTGAA GGTGCCTACG ATGATGCTAT TAGGCACGCC ATCACGAAAT 3420
TGAGTTATTT ACACGGTACT TCCACGGAAG AATATAAAAA CCGTGTCGTT CAGTTGGGTG 3480
AAAATCCGGC TCGTGTTACT AATGTGGGTG CTATTGGGTT AGAGCATCTG AAGCGTAGCA 3540
AGTTTATGAC GGTCGAAGAG TTATCAACAT CATTGAATTT TTCGCTAAAA AAGCCGTATG 3600
TAGTTGTCAC ATATCATCCG GTTACTTTAG GTGATGAGCC TGCTGAGGCG AGCTTTACAG 3660
CATTGCTGGA CGCGCTTGAT AAATTTCCCG AGCTTCAGGT TATCCTGACC TACCCGAATG 3720
CGGATGATGG CGGCAGAAAA ATTATTCCTT TACTTGAAGC TTATGCTGCT AAATCACCTG 3780
AACGCGTCAA AGCTATCCCG TCACTTGGAC AGATGCGTTA TCTAAGTGCG GTTAAATATG 3840
CTTCAGCGGT GGTGGGAAAC TCTTCCAGCG GCATAATTGA GGTGCCTGCT CTCGACGTTC 3900
CTACGGTAAA TATTGGCGTG CGTCAAAAAG GGCGTATTGC CGCGCAAAGC GTACTCAATT 3960
GTGATGCTAC AACGGAATCT ATCACTGCTG CACTAACGAG TGCGATTTCG CGAAGTTACA 4020
TAAGGGAAGG AGAAAAAATA TCCAATCCTT ATGGGCAAGG GAATGCGAGT GCTAAGATCA 4080
Orf3的终止
TTGAGATGAT CAAATCCATG AATTTTGTAC CGAGCAAGAC ATTCTACGAC ATTAAG
TGAA 4140
Orf4的起始
ATTGT
ATGAC GCTTATTATT GCTGAAGCCG GTGTTAACCA CAACGGCGAC GAAAAACTGG 4200
CTTTTAAACT TGTTGATGCT GCTCATAAAG CAGGTGCTGA TATCGTCAAA TTTCAGACGT 4260
TCAAGGCGAA AAACTTGGTA ACAGCTGAAG CAGTACAGGC GGACTATCAG GTTGCGAACA 4320
CTAAGAAGCA AGAATCACAG TTAGAAATGC TAAGTCGGTT GGAGCTTTCA TGGGAAGCTC 4380
ACCACAAGCT GGTTAGTTAT TGTAATAAAC TTGGTATCGA ATTCCTTTCA ACCGCCTTTG 4440
ATTCCGAGAG CTTGGATTTT CTTGTTAATG AGCTTGGCGT CAAAAGGCTA AAGTTACCTT 4500
CAGGTGAATT GACTAACGCG CCTTTGGTAC TTGAGCATGC GCGCACTGGT TGCGACATTA 4560
TTGTCTCAAC GGGAATGGCG ACATTGGCTG AGATTGAGGC CGCGTTGGGT GTTATTGCTT 4620
TCGGATATAC AGCGCCTGAA GAGGCAGTGC CGAGTATTGA AGCTTTTCAG CGTGCGTACT 4680
CGTCTGAGGT TGGTCAAAAA GCGCTTAAGG AAAAGGTTAT CGTTCTTCAT TGCACTACGG 4740
AATATCCTGC GCCAGTGGAA GAGATTAATC TACGTGCTAT GGATACGTTG CGTCAGGCGT 4800
TTGGATTACC TGTGGGGTAT TCCGATCACA GTGAAGGGAT AATGATTCCT GTGGCCGCTG 4860
TTGCACGTGG TGCGGTTGTG ATCGAAAAAC ACTTCACACT TGATAAAAAC ATGGAAGGAC 4920
CGGACCACAA AGCATCGCTG GAGCCCGTTG AACTGGAGGC AATGATTGCC GCTATTCATC 4980
AGATAGAAAA AGCGCTAGGG AATAGCATTA AAGCGCCTAC TGTGTCAGAA ATCAAAAACA 5040
AGAGTGTTGC GCGAAAAAGC CTAGTTGCTG CAAAAACTAT TATAGCGGGG GAAAGCTTCA 5100
CATCCGATAA TCTGGCAATA AAGCGCCCTG GTACAGGTAT GTCTCCTTAT TTATATTGGA 5160
Orf5的起始 Orf4的终止
ATTTAATAAA TGAAGTTTCT GAAAATGATT ATTTACCGGG GGAGTTGATT A
GTGAA
TGAT 5220
AATCTTCAGA GAAAACCACT TGTTATTATT GGTGGGGGAG GGCACGCTAG CGTAATTGTT 5280
GATATTTTGA AAAGACAGAA GCGAGAGATT GTTGCTATTA TTAGCCCTGA TGATATCACT 5340
CAGCGAAAGG TATATTCAGG AATTGATGTT TTTTCGAATG ATAATGAAAT CTTTCGTTTC 5400
CAACCAAAGG ATATTCGCTT AATTAATGGA ATTGGTGCCT TACCAGACTC GGAAGTTAGG 5460
TATAAAGTTA ATTTGTACTT TGAAAAAATG GGCTATTGTT TTGAAACAAT TGTAGCTGAT 5520
AACGCATATG TGTCACCCTT TGCCTTTTTG GAAGAAGGAG TACAGATATT TCCTGGTGCC 5580
ATAATTCAAC CAGGGACACA TATTGGTGCC CATACTATTA TTAATACCCG TGTAGTCATT 5640
GAGCATGATG TATCTCTCGG TGCATATAAC GCAATCTCTC CTGGGGCTAT AATATGTGGG 5700
CAGTGTAAAA CTGAAGAGCG TGTATTCATT GGTGCAGGTG CAATTGTTAT TCAGAATATT 5760
GAAATCGGAT CAAGAGCCAC AATCATGGCG AACGCACTGG TAGCAGAAAA TATACATCCC 5820
Orf5的终止 Orf6的起始
CAACAAAAAG TTTATGCTTC ACGCGGTATA GTCAGA
TAAT GTTTCAGAAG GTATATA
ATG 5880
AATCAGCAAT GGAAAAATGT ATTAATCTCA CCAGATAGCT CGATACTTGA AGCACTCGAA 5940
ATTATCAATA ACGAAGCATT AAGAGTTGCG CTGGTAGTTA ATGAGAATAA CACGTTATTA 6000
GGAGTCATTA CCGATGGTGA TATTCGAAGA GGAATTTTGA AAAACCTGCC TCTGACTGCA 6060
GAAGTACACC AGGTTATGAA TAAAAAACCC GTAACGGCAA GTCCAGTTCT TTCCAAAAAA 6120
GAACTCAATA ATCTGATGTC ATCGCATGGG ATACTGTCTA TACCAATAGT CGATAAGGGT 6180
ATCATTGTGG GGCTGGAGAC TATTACAAGC ATCGCTGCAA CGGAAAAATA TGATAATCCT 6240
GTTTTTATTA TGGCCGGAGG GTTTGGTACT CGTTTGAGAC CACTCACTGA TAATTGCCCT 6300
AAACCAATGC TTAAAGTAGG TGATAAACCT ATTTTAGAGA CAGTGGTAAG AAGCTTTGTT 6360
AAAGCAGGGT TTAGTAATTT ATATATATCA ACCCATTTTC TGCCAGATAT GATTCATCAG 6420
CACTTCGGTG ATGGTGATGC GTTTAATGCA AAAATCACCT ATATACATGA AGAAACTCCC 6480
TTAGGTACGG GAGGAGCGCT GGGATTGCTT CCTGACTCCT TATCAGATTC TTTGCCACTC 6540
ATTATGATCA ATGGTGATGT GCTTACCAAT ATTGATTTTG AGCGGTTACT ATCATTTCAT 6600
AATAATAACA ATGCGGATGC TACAATCTGC GTAAGAAAAT ATGACTACCA GATCCCATAT 6660
GGTGTTATAA CAGGTAATGG TAATAAAATA GTCAGTATGG TTGAAAAGCC AGTACATCAT 6720
TTCTTTGTTA ATGCAGGAAT CTATGTTGTT TCTCCCGATA TTTTTAAATC AGTACCCAAA 6780
AACCATCGAA TTGATATGCC GACGTTACTC GAACAATTTA TGAGTAAGAA TAAAGAGATA 6840
CTAATGTTCC CGATTCATGA GTATTGGCTT GATATAGGGC GAATAGATGA TTTTAATCGG 6900
Orf6的终止 Orf7的起始
GCACAGGCCG ATATTCATTC TTTAGGGCTG GAT
TAAAA
AT GAAAAAGGTC GCTGTAATCG 6960
GGTTGGGAAA TATCGCAACA AGACATCGCC ACAATCTTAA AAAACTTTTT CCAGGAATTA 7020
TTGTTTTTTC TATGTCTTCA AGTGAGCGAG TGCTATCCGA GTTAGTGAGT GACTGTGATG 7080
GTTACTTAGC TAATGTAGAT GCTATCATAC AAGAGCAAGT CGATTTTGTA ATTGTAGCAT 7140
CACCAGCAAC TTACCATTTA CGGCATAGTG AAAAACTTTT GGCAGCAGGA ATTCCCTACT 7200
TTTTATTGAA AAACCCTGTT ACAGCTTCGT TTGATGACGC TAAGAAGTTA CATGAAATAG 7260
CTGAAAGACA CGCAACTCCG GTGGCTATAG GATATTGTTT ACGCTATTTG CCTTCTGCAA 7320
AAATAATTAA AAAAATAATT GAGGATAAAT TTATTGGCAG TATTTACAAT GTCAATATTG 7380
AGATTGGTCA ATATCTGCCG GATTGGAGAC CGTCAAAATC ATATCGTGAA AGTGTATCAG 7440
CAAGTAAAGT TTTGGGTGGC GGAGCGCTAC TCGAATTAAG TCATGAGCTG GATTATGCGC 7500
AATGGCTATT TGGTGAACTG AAACTTGTGA ATTCAGTGCT ACGGACTTCG TCAGAACTTG 7560
AAATGGATGT CGAATCTTTA GCTGATATTA TAGTGATAAA TTCCGCCGGT TCGCTTATTA 7620
ATATCCATCT TGATTTCCTT CAAAAGAAAC CATGGCGACA ATGTCATATT ATTGGCAGTA 7680
AGGGACGAAT TGTCTGGGAT CTTATCCGCA ATGAAATCAT TCATCATACT CGACAGAGTA 7740
CCGATATTAT CTTTAGTGAT CCTGGCTGGG ATAAAAATGG TATGTATACA GATATGCTGC 7800
TCGACTTCAT TGCGGAAATA TCCGGGAGTG ATAACAACTG TGTGACATTG GAGTCATCAA 7860
Orf8的起始
TAAATATTGT TAGCTTAATT GATAAGATAA AAGAAACAAG TCA
ATGCCTT GGAGAAGTTC 7920
Orf7的终止
AA
TGAAAATA AACGCTTTTA TATTTGCACG TGGGGGATCA AAAGGATTAC CTGGTAAAAA 7980
TATTAAACCT CTAGCAGGCA AACCTCTCCT GCAATACTCT ATTGAGACTG CCAAACAGAG 8040
TCCTTCGATT TCCTCTATAT ATGTTTCAAC CGACGATGAT GATATTGCTC TCGTTGCAGA 8100
AAATTGTGGT GCTACTGTTA TTCGTAGACC GGCGGAGCTT GCCGGAGATA CTAGTCCAGA 8160
ATGGTTGGCA TGGCGTCACG CAATTGAGTG GGTTCAGAAG GAAGTGGGGG ATTTCGATGG 8220
CTTTGTAAGT TTACCGACTA CAAGCCCTTT GCGAAGTGTC GATGATGTCG AATGTGCTAT 8280
TGCTAAAAGA GTCGAGTCTG GTGCTGACAT ATGCATTTCA GTCACTCCGG CGAGCAGAAG 8340
TCCTTATTTT AATATGGTAA AATTTCACGA AAGTGGTTAT GTGAGGCTTG TCAATGAACC 8400
GGAAGGGAAA GTGCTCAGAC GGCAGGATTC ACCAGACGTA TTTGATATTA CTACTGTTGT 8460
GTACGCGACA ACGCCAAAAT TTGTTTTGAA TAATTATGGG CTATTCTCAG GCAAAGTTGC 8520
AAGCATTATT GTTCCTAAAG AACGTGCCGT TGATATAGAT GATATTTTTG ATTTTTACAT 8580
Orf9的起始Orf8的终止
GGCGGAAATT TTACTTAAGG AATTGAATC
G TGGC
TAATAT ACTTAAAGGG AAAAAAATCC 8640
TTATTGCTGG TGCCGGTGGA TTGCTAGGCA CTCATCTTGT TAAAAAAGTC ATAGATGAAG 8700
GTGGTTATGT TATTGCCGGT GATTTTGACT TAGTGTCAAC ACAGAACAAA TTAAATGAGC 8760
TGGGTATCAC AACTGGATAT GAATTACATC AACTTGATGT AACAAGTCTT GAATCTGTTC 8820
AGGAAATACT AGCCATTGCA CCTGATCTGG ATGGTGCTAT TAATACGACT TATCCTCGAA 8880
ATAAAACTTA TGGTGCCCAC TTTTACGATG TAACGCTGGA AAGTTTCAAC GAAAATCTTT 8940
CGTTGCATCT TGGAAGTTCA TTTCTTTTCT CACAACAGTG TGCAGCATAT TTCAAAAAAA 9000
ATCAGCGTTC ATTTTCACTT GTAAATATTT CTTCTATTTA TGGTGTCGTG GCACCAAAAT 9060
TCGAAATATA CGAAAATACT AAAATGACGA TGCCTGTTGA ATATGCGGCA ATAAAATCGG 9120
CATTGTTACA TTTAAACAAA TATATTGTAG CTTATGTTAG AGATAGTCGA TTTAGAGTTA 9180
ATGCTGTAAG CCCTGGCGGT ATTTTTGATC ATCAACCAGA TGCTTTTTTA GAAGCATATA 9240
AAAAAGAAAC TAATGGTGCA GGGATGCTTG GTGTTACAGA AATGCTTGGA AGTATTGTAT 9300
TTTTGCTTTC TGATGCGTCA AAATATGTAA CGGGACAAAA TATTATTGTT GATGACGGCT 9360
Orf10的起始Orf9的终止
TTTCATT
ATG ATTTCTTTTA TAAAAAAAAT AAAATTTTGG ATTGTGTGCA ACAGGTTAGG 9420
ACCTGATATA CCACTTAGTC ACTTATTATT ATATTCACGT CGCTTGGGGC GTATGATTTG 9480
TAAACGGAAA TTCAAAAGTT TTGGCAATAA CTCTTCTTTT CGGCCTTTTG CATATGCTAT 9540
TGAAACACAA AAGATTGCTA TCGGTGATAA TGTTGTTATC AGGCCTGGTA CAATGTTATT 9600
TGCTTCACCA TATGGTGAAG AAAAAAAACT TCATATCCTT ATTGAAGATG ATGTTTTAAT 9660
TGGTTCTTCT GTACATATTT ATGTATCCAA CCATAAGTTT TTTGATATAA CATTACCTAT 9720
CTCTAAGCAA GGTCATTCAG TGGTGAAACC TGTTATTCTG AAAAAAGGTT GTTGGATTGG 9780
TGCTAATGTA ACCATTTTAC CTGGAGTGGT AGTCGGTGAA AATTCGGTTG TTGGTGCAAA 9840
TAGTGTAGTT ACGAAAAGTA TCTCTCCTTT TACAGTTGTT GCAGGAAACC CAGCCAAAAT 9900
Orf11的起始 Orf10的终止
TATAAAGAAA TTAA
ATGAG
T GAATATAAAA GAATTTTTCA GTATTTAGCA TTTGACCTTA 9960
CAAATAAGGT TTTACCATTC GTAGTTCCAT ACTTTATTGC TTCCTATTTG AGTTCAGTAG 10020
AGTTAGGGTA TTATACAACT AAACAGCTTT TATTTTTACT GTTCTTTAAT ATCATAAGTA 10080
TGGGGGGAGG CGCAAAATTA CTAGTCTCTA TCTCAAAGAA AGATGGAGAG GAGAAAAAAA 10140
TCTCATCCAT TTTATTAAAA ATGTTTTGTT TTAATGCCTG TGTTATTTTA TTTTTTTATG 10200
TATTACTTCC TTTTTTCATT GTTAGTGAAA ATGTAATTAA AGATTATATA CCATTGGTAA 10260
TATGCTCTTT ATTTTATTCT ATTATACAGC TGCAATTGTC GATTTATAGA GGATATAATA 10320
GAATAAATGC TTACGGGATG TTAAATCTAA GCCTCTCAGT TTGTGTTTGT ATCGTGATAT 10380
TCAGTTATAT ATTATATTTC AAAACGCAAC TAGGGTTATG GTATTGGCTA ATTATACCAT 10440
ATGCACTTTT TTCTATTAAA TTTTTGAAAT ATTATCTGAC AGAGCGAGTA TTATCATCTG 10500
CTGTTTTACT TGATACATTA AAATTTTGTT TTTATCAATT TCCTCATGTG CTAAGTTCGT 10560
GGTGTCGTTT AGGTATTGAT AGGCTATTTT TGGCTAATAT ATTCGCTATG TCATTGGTTG 10620
GATACTACTC AATGATGCTT CAGTTTGGTT TGATTGTTAG CGCAGTACTT CAGTCATTGA 10680
ATAATTATTA TTCCCCTTAT CTCTTCAGAG TTCTCTCAGA AAGACAATCG TATAAAAAAC 10740
TGTCTCTATT TAGTAAAAAT AATAAAGCTG CTCGTTCATC GTTTCTGTTT TTTGTAGCCT 10800
CTTTTGTTAT CGTTATAGTG GTGAATATTT TTGCATATGT CGTTGTTCAT TATTTTTTAC 10860
CCAGCGAGTA TTCTCCATAT TACTATCTGG TACCATTGGT TACTTTTGCC TATGGATTGC 10920
AAGGATGCTA CTTTGCAGTT GTTAATTATA TTTATTTTTG GGGGAAGACT CAGTATCTTA 10980
ATATCCCATC GATATTATCA TGCTTATTTC AGGTGGTAAT TGGCTACTTC TTTATCTTAC 11040
ATTTCTCTCT ATTGGGAGCA TCATTAAGTT TATTAATGTC TTGGAGTTTG CAACTGCTAT 11100
Orf12的起始 Orf11的终止
TTACATTAGG GGGGGTGATG T
ATGTTGCAA AAAACAAA
TA AAAAGGGATT TCAATTGGCT 11160
TTAGTTGAGT CCTTACTGCA ACTAAAAACT TTAGATAGTT ATTCTGGAAA TAATAAAAAT 11220
AACATTCATC TTTTTGTTCG ACTAAATGGT GAGCAGAAAA ATGAGGAGGA GATACTCAAT 11280
TTTATTAAAC CAAGAGCATG TCATTATTCT TCAGTTCAAT TTGTAAGCAT TCGACGAAAT 11340
GATAAGTTCT CTTTACTCTT TAATATTCTG AAATTAAGAT TATTTCTTTT TTGTAAACGA 11400
AAGGTAATTT TGATCATTGG TGATCCACGC GCTCTGTGGA TGAATATGAT ATCATCGTTT 11460
AAAAATGTTC ATGATGTAAT ATACTTAGAG GATGGAATGT CAACAGTCCT CTTTTATCAG 11520
ACCTTTAAAC CTAAGTACCC ACATAAACAT TATAAACTGG TTACACGCCT GAAACTGGAT 11580
GGTAATGCCT TTCTGTCTCT TATTCCTTTG GAAGTAAAAA AGAATACGGT TATGCGGATC 11640
GACAATGATG TGGCTTTGTT CATCGGTATG CCGATGATTG AAAATAACGC GTTGAGTAAA 11700
AAGAAATATT TATCTTATCT GCATAAAATT ATTATGTCTT TGAAGAATAT GAAGATAACA 11760
AAGTTTTATT ATGCTCCCCA TAGATATGAA AATGAAAATA ATTTTTATTT ATATGAGAAT 11820
TTGGGTTTTC ATATGTTAGA TACAGATTGT GCTATTGAAG ATTATCTCAA CAGCAAGAAC 11880
ATTATCCCGG CGGTGTATGC TAGTTTTTAT TCAACAGCCT TATTACAGAT AGATACTTTA 11940
TTTTATGGAG TTAGTGTTAT TTGTTATGTA ATTAATGTTG AAGAGTTGAA TTATGACTTT 12000
CGTAATCCAG CATTATATGC ATATGAATAT TATAACAAAA CTCCCTCTAT TATAAAGGTT 12060
Orf13的起始Orf12的终止
GATTTGC
ATG AT
TGAATTTT TATTGTTCAT ATTATGTAGC TTTATCTTAT ATCAGGTTTT 12120
TTATGTTACT AAGGAATTTA AGAGTAATCT TTTCTTAATC ATGTGGGGGT ATACTTTTCT 12180
ATTCGTAACT CCCGTTATAT ACATTTTTTA TGGTGGTGAG AAATATCGTG TCTTTAGTGA 12240
TGAAAGTGCA TTAACATTTT ATTTGTTGGG TTGTCTCTCC GCTGCGTTTA TAATTTTAAT 12300
GCTTCTGTTC AAGGTTTCAC TTAACCGAAT AAAAATATGT AAAATCAATT TATTTATCTC 12360
CGATTTTATA TTAAAAATTA TATTTTCTTT CTGTATAATG TTTGTTGTTC TTTATATTCT 12420
ATTTTATTGG AGGGAGTGGC CTTTTTTTGA TTTTGTCTCG GGAGATATCT CAGACCGTCC 12480
GGATATTGTA AAAGGAACCT TTCAAGGTTT TTTTATCTAT TCTTTATTTA CGAGCATAAT 12540
AATCCCCGGG ATATATTTTC ATTTAAA GA TAAAAAAGGA AAATTGTTTA ATTTACTTTT 12600
CTTTATTTTT GTTTGTTTTA GTATGGTGGT AAGTGGTAAT AAAGGTGTTT TTCTATATTT 12660
TATTATTTTT AATGTGTTAT TTGAATGGAA AAAGATACGT CTAAGTACGT ATTTGATTAT 12720
TATCGTAGGT CTGATGGCTA TCTATGCCTT AATTCGTCTG CCATTTATAG GTGACAATTT 12780
TTCTTTATCA TATCTAATTG AATCGATATC TGAGAGGATT TTTTTAACGC AAGGGATGGC 12840
TATGCCAGCC GTTATCGAGT TAGCAAAGTC AACCGATGTG ACAATGATGA ACTCTAATGA 12900
TCTAAAATAC ACACTTTTTA ATTTCGTTTA TGGCTATAGC CCCGGTTCGA TGCCTCTTTT 12960
TTATACAGCT GAATTATATG TCAGGTATGG TTGGTTAATG ATGTCTTTCA TATCTGTAAT 13020
AATTTCGCTT GTATTTGGAT TTGGTGCATT TGTTATTAAT AAGACAAAGG ATTCTGCCAT 13080
TAGATGGGTT TATTATATCT CTTTATATGC ACTAATAATG GGAGGGGTAG GAAGTGCTAA 13140
TCTTTTCTTT TTTATTGTGG CAATTTTATG GTGGTTATTA TTAACTCTCA GTAATGGAAC 13200
Orf13的终止 Orf14的起始
AATTACAAGT AGGAGTGGCA AG
TGATTGCA GAAGTATCAA TAATT
ATGCC GATGTACAAT 13260
GCTGAACATT ATGTCAGAGC GTCAATTTGT TCAATTTTAA ATCAGACGTT TAAAAATTTT 13320
TTATTATATA TTATTGACGA CTGCTCTACG GATTCATCAA AGCAGATTGC TGAATCTTTT 13380
AACGACCCGC GAATAATCAT TATTTCGAAT GCTATCAATG TTGGAGTTGC TCGAACTCGT 13440
AATAAAGGAA TAGAGCTTGC GCAGACGAAA TATATCGCAT TTTGTGATAG TGATGATATC 13500
TGGCATGAGC AAAAACTGGA AAAACAAATC TCACTACTTG ATAGTGGGAA ATATAATGTT 13560
GTTGGAAGTT TTTACTCAAC TTTTAAGGAT GGAAAGTTTG AAAGTGCAAA GTTAATATCT 13620
GCGCCTGAAC TTGTTTGTTA TCGTGATATG CTTAAATCTA ATTGGATTGG TAATCTTACT 13680
GGCATTTATA ATGCTTATGT TTTAGGTAAG GTTTTTCAAC AAGAAATTGG TCATGAAGAT 13740
TATGTAATGT GGTTGAAACT TATTGAAAAA AGTCGAGTTG CTTACATTAT TCAAGAACCT 13800
TTGGCTTATT ATAGGATTAG GTCCTCATCT CTTTCTTCGA ATAAAATGAA AGCTTGCTTG 13860
TGGCAGTGGA GAATTTATCG GAAAATGCTT CATTTTAATA TTTTTAGAAC TTCTTGTTAT 13920
Orf14的终止
ATGTTCTTTT ATATTATTGC TGCATTAAAT AAAAGACGG
T AATTATTTAA TGCACATATT 13980
TTATAAGTGA GTAAATTTTA CAATTACTGG GTTAATTTAA GGGGTGGAAT ATTTCTGTTA 14040
TTGTTTATGT TTTTAATATA GAATCGATGT AAATTAAAAC CTCACAGGTC GTGTGGAGAC 14100
CGCATCTGAC AGGAGTAAAC AATGTCAAAG CAACAGATCG GCGTCGTCGG TATGGCAGAG 14160
ATGGGGCGCA ACCTTGCGCT CAACATCGAA AGCCGTGGTT ATACCGTCTC TATTTTCAAC 14220
CGTTCCCGTG AAAAGACGGA AGAAGTGATT GCCGAAAATC CAGGCAAGAA ACTGGTTCCT 14280
TACTATACGG TGAAAGAGTT TGTTGAATCT CTGGAAACGC CTCGTCGCAT CCTGTTAATG 14340
GTGAAAGCAG GTGCAGGCAC GGATGCTGCT ATTGATTCCC TCAAGCCATA CCTCGATAAA 14400
GGTGACATCA TCATTGATGG TGGTAACACC TTCTTCCAGG ACACCATTCG TCGTAACCGT 14460
GAGCTTTCTG CAGAAGGCTT TAACTTTATC GGTACCGGTG TTTCCGGTGG TGAAGAAGGC 14520
GCGCTGAAAG GTCCTTCCAT TATGCCTGGT GGGCAGAAAG AAGCCTATGA ACTGGTTGCG 14580
CCGATCCTGA CCAAAATCGC CGCAGTGGCT GAAGACGGTG AGCCATGCGT TACCTATATT 14640
GGTGCCGATG GTGCAGGTCA CTATGTGAAG ATGGTTCACA ACGGTATTGA ATACGGTGAT 14700
ATGCAACTGA TTGCTGAAGC CTATTCTCTG CTTAAAGGTG GTCTGAACCT CTCCAACGAA 14760
GAACTGGCGC AGACCTTTAC CGAGTGGAAT AACGGTGAAC TGAGCAGCTA CCTGATTGAC 14820
ATCACTAAAG ACATCTTCAC TAAAAAAGAT GAAGACGGTA ACTACCTGGT TGATGTGATT 14880
CTGGATGAAG CAGCTAACAA AGGTACCGGT AAATGGACCA GCCAGAGCGC GCTGGATCTC 14940
GGTGAACCGC TGTCGCTGAT TACCGAGTCT GTGTTTGCAC GTTATATCTC TTCTCTGAAA 15000
GATCAGCGTG TTGCCGCATC TAAAGTTCTC TCTGGCCCGC AAGCACAGCC AGCAGGCGAC 15060
AAGGCTGAGT TCATCGAAAA AGTTCGCCGT GCGCTGTATC TGGGCAAAAT CGTTTCTTAC 15120
GCTCAGGGCT TCTCTCAGCT ACGCGCCGCG TCTGAAGAGT ACAACTGGGA TCTGAACTAC 15180
GGTGAAATCG CGAAGATTTT CCGTGCTGGC TGCATCATCC GTGCGCAGTT CCTGCAGAAA 15240
ATCACCGATG CATATGCCGA AAATCCGCAG ATCGCTAACC TGATGCTGGC TCCGTACTTC 15300
AAGCAAATCG CCGATGACTA CCAGCAGGCG CTGCGCGATG TCGTCGCTTA CGCGGTACAG 15360
AACGGTATCC CGGTTCCGAC CTTCGCCGCT GCGGTTGCCT ATTATGACAG CTACCGCGCC 15420
GCTGTTCTGC CTGCGAACCT GATCCAGGCC CAGCGCGACT A 15461
以上仅是本发明较佳实施例,并非对本发明作任何限制,凡依本发明技术实质对以上实施例作修改、等同变化与修饰,均属本发明技术方案范围内。