具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(NewYork:Cold Spring Harbor Laboratory Press,1989)中所述的条件。
实施例1:基因组的提取:
在5mL的LB培养基中37℃过夜培养大肠杆菌O66型,离心收集细胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重悬细胞,37℃温育20分钟,然后加入10ul 10mg/ml的溶菌酶继续保温20分钟。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃温育2小时,再加入3 ul10mg/ml的RNase,65℃温育30分钟。加等体积酚抽提混合物,取上清再用等体积的酚∶氯仿∶异戊醇抽(25∶24∶1)混合溶液提两次,取上清再用等体积的乙醚抽提以除去残余的酚,上清用2倍体积乙醇沉淀DNA,用玻璃丝卷出DNA并用70%乙醇洗DNA,最后将DNA重悬于30ul TE中。基因组DNA通过0.4%的琼脂糖凝胶电泳检测。
实施例2:通过PCR扩增大肠杆菌O66型中的O-抗原基因簇:
以大肠杆菌O66型的基因组为模板通过LongPCR扩增其O-抗原基因簇。首先根据经常发现于O-抗原基因簇启动子区的galF序列设计上游引物(#1523-ATT GTG GCT GCA GGG ATC AAA GAA AT),再根据O-抗原基因簇下游的gnd基因设计下游引物(#1524-TAG TCG CGT GNG CCT GGA TTA AGTTCG C);用Boehringer Mannheim公司的Expand Long Template PCR方法扩增O-抗原基因簇,PCR反应程序如下:在94℃预变性2分钟;然后94℃变性10秒,60℃退火15秒,68℃延伸15分钟,这样进行30个循环。最后,在68℃继续延伸7分钟,得到PCR产物,用0.8%的琼脂糖凝胶电泳检测PCR产物的大小及其特异性。合并5管long PCR产物,并用Promega公司的Wizard PCRPreps纯化试剂盒纯化PCR产物。
实施例3:构建O-抗原基因簇文库:
首先是连接产物的获得:用被修改的Novagen DNaseI shot gun法构建O-抗原基因簇文库。反应体系是300ng PCR纯化产物,0.9ul 0.1M MnCl2,1ul1∶2000稀释的1mg/ml的DNaseI,反应在室温中进行。酶切10分钟使DNA片段大小集中在1.5kb-3kb之间,而后加入2ul 0.1M EDTA终止反应。合并4管同样的反应体系,用等体积的酚抽提一次,用等体积的酚∶氯仿∶异戊醇(25∶24∶1)混合溶液抽提一次,再用等体积的乙醚抽提一次后,用2.5倍体积的无水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重悬于18ul水中。随后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mMDTT和5单位的T4DNA聚合酶,11℃30分钟,将酶切产物补成平端,75℃终止反应后,加入5单位的Tth DNA聚合酶及其相应的缓冲液并将体系扩大为80ul,70℃反应20分钟,使DNA的3′端加dA尾。此混合物经等体积氯仿∶异戊醇(24∶1)混合溶液抽提和等体积乙醚抽提后与Promega公司的3×10-3的pGEM-T-Easy载体于16℃连接10小时,总体积为90ul。其中有9ul的10×buffer和25单位的T4DNA连接酶。最后用1/10体积的3M NaAc(pH5.2)和2倍体积的无水乙醇沉淀连接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到连接产物。
其次是感受态细胞的制备:参照Bio-Rad公司提供的方法制备感受态细胞大肠杆菌DH5α。取一环大肠杆菌DH5α单菌落于5ml的LB培养基中,180rpm培养10小时后,取2ml培养物转接到200ml的LB培养基中,37℃250rpm剧烈振荡培养到OD600 0.5左右,然后冰浴冷却20分钟,于4℃4000rpm离心15分钟。倾尽上清,用冷的冰预冷的去离子灭菌水200ml吹散菌体,于4℃4000rpm离心15分钟。再用冷的冰预冷的去离子灭菌水100ml吹散菌体,于4℃4000rpm离心15分钟。用冷的冰预冷的10%的甘油悬浮细胞,4℃6000rpm离心10分钟,弃上清,最后沉淀用1ml冰预冷的10%的甘油悬浮细胞,即为感受态细胞。将制得的感受态细胞分装为50ul一管,-70℃保存。
最后是电转化感受态细胞:取2-3ul连接产物与50ul感受态大肠杆菌DH5α混合后,转到Bio-Rad公司的0.2cm的电击杯中电击,电压为2.5千伏,时间为5.0毫秒-6.0毫秒。电击后立即在杯中加入1ml的SOC培养基使菌复苏。然后立即将菌涂在含有氨苄青霉素、X-Gal和IPTG的LB固体培养基上37℃倒置过夜培养,次日得到蓝白菌落。将得到的白色菌落即白色克隆转到含有氨苄青霉素的LB固体培养基上培养,同时从每个克隆中提取质粒并用EcoRI酶切鉴定其中的插入片段的大小,得到白色克隆群构成了大肠杆菌O66型的O-抗原基因簇文库。
实施例4:对文库中的克隆测序:
从文库中挑选插入片段在1kb以上的96个克隆用本实验室ABI3730型DNA自动测序仪对克隆中的插入片段单向进行测序,使序列达到100%的覆盖率,从而获得O-抗原基因簇的所有序列。
实施例5:核苷酸序列的拼接及分析:
用英国剑桥MRC(Medical Research Council)分子生物学实验室出版的Staden package软件包的Pregap4和Gap4软件拼接和编辑所有的序列,从而得到大肠杆菌O66型的O-抗原基因簇的核苷酸全长序列(见序列列表)。序列的质量主要由两个方面来保证:1)对大肠杆菌O66型的基因组作5个LongPCR反应,然后混合这些产物以产生文库。2)对每个碱基,保证3个以上高质量的覆盖率。在得到大肠杆菌O66型O-抗原基因簇的核苷酸序列后,用美国国家生物技术信息学中心(The National Center for BiotechnologyInformation,NCBI)的orffinder发现基因,找到13个开放的阅读框,用blast系列软件与GenBank中的基因比较以发现这些开放的阅读框的功能并确定它们是什么基因,再用英国sanger中心的Artemis软件完成基因注释,用ClustralW软件做DNA和蛋白质序列间的精确比对,最后得到大肠杆菌O66型的O-抗原基因簇的结构,如表3所示。
通过检索和比较,发现orf5和orf7是大肠杆菌O66种仅有的两个编码存在跨膜片段的蛋白的基因。orf5编码的蛋白与Yersinia pseudotuberculosis(typeO:1b)(CAB63295)的O-抗原转移酶有31%的序列一致性,通过HMMTOP2.0程序分析蛋白的拓扑结构发现其含有10个均匀的跨膜片段,这是Wzx蛋白的典型特征。所以命名orf5为wzx。orf7编码的蛋白与Yersiniapseudotuberculosis(type O:1b)(CAB63298)的O-抗原聚合酶有22%的一致性,40%的相似性,通过HMMTOP2.0程序分析蛋白的拓扑结构发现其含有11个跨膜片段,并且有一个大的胞质内亲水环(loop),这是Wzy蛋白的典型特征。所以命名orf7为wzy。
orf 6,8,9,11四个基因编码的蛋白与其他已知的糖基转移酶有21-35%的序列一致性和44-57%的序列相似性。通过对Pfam中糖基转移酶基序数据库的搜索,这四个基因编码的蛋白与已知的糖基转移酶家族1和2的共有序列的同源性预期值很高,因此我们推测这四个基因编码糖基转移酶,而且由于每个糖基转移酶特异性催化形成一种二糖键,因此我们推测大肠杆菌O66的O-抗原的寡糖单位可能由五个单糖组成。由于这四个基因的确切功能还不能确定,因此我们将这四个基因暂命名为orf6,orf8,orf9和orf11。
orf1编码的蛋白与大肠杆菌(AAK60448)O-抗原基因簇中rmlB基因编码的蛋白有97%的氨基酸序列一致性,通过对Pfam蛋白基序数据库的搜索,发现orf1编码的蛋白与已知的RmlB的共有序列的同源性预期值非常高(Evalue=1.3×e-213)。orf2基因编码的蛋白与Aeromonas hydrophila(AAM74475)O-抗原基因簇中rmlA基因编码的蛋白有76%的氨基酸序列一致性,通过对Pfam蛋白基序数据库的搜索,发现orf2编码的蛋白与已知的RmlA的共有序列的同源性预期值非常高(Evalue=3.7×e-108)。oRF3基因编码的蛋白与Aeromonashydrophila(AAM22546)O-抗原基因簇中rmlC基因编码的蛋白有71%的氨基酸序列一致性,通过对Pfam蛋白基序数据库的搜索,发现orf3编码的蛋白与已知的RmlC的共有序列的同源性预期值非常高(Evalue=4.2×e-93)。rmlBDAC负责合成鼠李糖O-抗原中的一种稀有单糖。因此我们将这三个基因命名为rmlB,A,和C。
orf12编码的蛋白与大肠杆菌CFT073(AAN81013)O-抗原基因簇中编码的Mannose-1-phosphate guanylyltransferase有很高的氨基酸序列一致性(60%),通过对Pfam蛋白基序数据库的搜索,发现orf12编码的蛋白与已知的Mannose-1-phosphate guanylyltransferase的共有序列的同源性预期值很高(Evalue=5.6×e-120)。因此我们将这个基因暂命名为manC。orf13编码的蛋白与大肠杆菌CFT073(AAG41754)O-抗原基因簇中编码的phosphomannomutase有很高的氨基酸序列一致性(98%),通过对Pfam蛋白基序数据库的搜索,发现orf13编码的蛋白与已知的phosphomannomutase的共有序列的同源性预期值很高(Evalue=5.9×e-59)。因此我们将这个基因暂命名为manB。
orf4编码的蛋白与Aeromonas hydrophila(AAM22547)O-抗原基因簇中编码的dTDP-glucose-4,6-dehydratase有很高的氨基酸序列一致性(55%),通过对Pfam蛋白基序数据库的搜索,发现orf4编码的蛋白与已知的dTDP-glucose-4,6-dehydratase的共有序列的同源性预期值很高。因此我们将这个基因暂命名为tll。orf10编码的蛋白与PatA Proteus mirabilis(AAK38353)O-抗原基因簇中编码的O-antigen acetylase有很高的氨基酸序列一致性(44%),通过对Pfam蛋白基序数据库的搜索,发现orf10编码的蛋白与已知的O-antigenacetylase的共有序列的同源性预期值很高。由于这个基因的确切功能还不能确定,因此我们将这个基因暂命名为orf10。
实施例6:特异基因的筛选:
针对大肠杆菌O66型的O-抗原基因簇中的wzx、wzy基因设计引物,在每个基因内各设计了两对引物,每对引物分布在相应基因内的不同地方,以确保其特异性;用这些引物以166株大肠杆菌和43株志贺氏菌的基因组为模板进行PCR,除在含大肠杆菌O66的第13组中得到了预期大小的一条带外,在其他组中都没有扩增到预期片段大小的正确产物,所以wzx、wzy基因对大肠杆菌O66型的O-抗原都是高度特异的;这些基因在核苷酸序列中的位置见表1。
实施例7:引物灵敏度的检测。
购买市场上的生猪肉馅,搅拌均匀,分成20g一份,存在-40℃冰箱中备用。将10μl大肠杆菌O66的冻存菌液接种到有20mlLB培养基的三角瓶中,于37℃,200转/分,培养12小时至饱和,取少量培养好的菌液作106和107倍的稀释,其余的菌液放于4℃的冰箱中备用,取50μl稀释菌液涂布LB琼脂平板,37度,培养12h,对所涂平板计数,计算原液中活菌浓度。在5份生猪肉馅中分别掺入5×103,5×102,5×101,5个和0个活菌,搅拌均匀,加入200ml LB培养基,经6层纱布过滤,过滤液于37℃,200转/分,培养12h。从培养好的菌液中取3ml菌液于6,000g离心5分钟,去上清,加100μl MQ超纯水吹开沉淀并混匀,放入100度沸水中煮15分钟,裂解液于12,000g离心8分钟,取1μ上清做为PCR模板。用4对寡核苷酸对,SEQ ID NO:1中的4592至4609碱基的核苷酸和5043至5060碱基的核苷酸;SEQ ID NO:1中的5027至5044碱基的核苷酸和5354至5371碱基的核苷酸;SEQ ID NO:1中的7252至7269碱基的核苷酸和7535至7552碱基的核苷酸;SEQ ID NO:1中的6983至7004碱基的核苷酸和7251至7272碱基的核苷酸,进行PCR反应,PCR反应体系如下:MQ:15.7μl,Mg2+:2.5μl,Buffer:2.5μl,dNTP:1μl,Taq酶:0.3μl,P1:1μl,P2:1μl,模板DNA:1μl。PCR反应条件为:95℃:5′,95℃:30″,56℃:45″,72℃:1′,72℃:5′,共30个循环。反应结束后,取10μl反应产物电泳,若有与预期大小相符的扩增带,则结果为阳性,若没有,则结果为阴性。参入了5×103,5×102,5×101,和5个活菌的每份猪肉馅均在4对引物的PCR反应中得到阳性结果。参入0个活菌的猪肉馅在4对引物的PCR反应中得到阴性结果。说明使用上述方法时,这4对引物对猪肉馅中的大肠杆菌O66的检测灵敏度均为0.25个菌/g。
通过对O抗原基因簇的克隆和在减毒的疫苗菌株中的表达,可以组建重组疫苗。O抗原为最主要的革兰氏阴性菌的表面抗原,可以引起强烈的免疫反应,是制造重组疫苗的最好的靶分子之一。在1993年Viret实验室成功的将志贺氏菌Sonnei的O抗原基因簇在一株沙门氏菌Tyziai疫苗菌中表达,动物实验证明可以引起兔子的免疫反应(Molecular Microbiology 1993,7:239-252)。中国军事医学科学院的小组也在从事与Viret实验室类似的工作。王磊实验室在1999年成功的将大肠杆菌O111的O抗原基因簇在沙门氏菌疫苗STM-1中表达,并证明组建成的菌株可以引起小鼠的血液和体液反应(Microbial Pathogenesis 1999,27:55-59)。所以本发明O66的O抗原特异基因序列可以应用于组建重组疫苗。
根据本发明的对大肠杆菌O66型的O-抗原特异的核苷酸序列(SEQ IDNO:1所示),构造特异核酸探针,将其固定到芯片的载体上制成生物芯片,将要检测的样品适当处理后,与生物芯片进行杂交反应,然后利用生物芯片信号分析设备就可以得到样品中相应的细菌情况。这种大肠杆菌O抗原鉴定的DNA芯片将可以直接用于临床和其它检验场所(如食品加工和生产行业,畜牧兽医行业海关检疫等的微生物检验)。这种芯片只需要扩大产量,在完全相同的条件下就可以产业化。
表1列出了大肠杆菌O66型的O抗原基因簇中糖基转移酶基因和寡糖单位处理基因及基因内的引物及PCR数据。在表中列出了大肠杆菌O66型的O抗原基因簇的糖基转移酶基因、转运酶基因和聚合酶基因及它们的相应的功能和大小。在每个基因内,我们各设计了两对引物,每对引物分布在相应基因内的不同地方以确保其特异性。在表中还列出了每个引物在SEQ IDNO:1中的位置和大小。以每对引物用表中所列的相应的退火温度以表2中的所有菌的基因组为模板进行PCR,得到了相应的PCR产物,其大小也列于表中。
表2是用于筛选特异基因的166株大肠杆菌和43株志贺氏菌及它们的来源,为了检测的方便,我们将它们每12-19个菌分为一组,总共12组,它们的来源都列于表中。
在第13组中含有大肠杆菌O66型的基因组DNA作为阳性对照。以每组菌做模板,用表1中的每对引物按如下条件做PCR:在95℃预变性5分钟后,95℃变性30秒,退火时间是30秒,温度见表1,72℃延伸2分钟,这样进行25个循环。最后在72℃继续延伸5分钟,反应体系是25ul。模板为1∶20稀释,取1μl。反应完毕后,取10ulPCR产物通过0.8%琼脂糖凝胶电泳检测扩增出的片段。
对于wzx、wzy基因,每个基因都有两对引物被检测,每对引物除了在第13组中做PCR后得到了预期大小的正确的一条带外,在其他组中都没有扩增到任何大小正确的带,也就是说,在大多数组中没有得到任何PCR产物带,所以wzx、wzy基因对大肠杆菌O66型及其O-抗原是高度特异的。
最后,通过PCR从大肠杆菌O66型中筛选到对大肠杆菌O66型的O-抗原高度特异的基因:wzx、wzy。而这些基因内的任何一段10-20nt的寡核苷酸对大肠杆菌O66型的O-抗原是特异的,尤其是上述每个基因中的引物即寡核苷酸对经PCR检测后证实对大肠杆菌O66型是高度特异的。所有的这些寡核苷酸都可用于快速准确地检测人体和环境中的大肠杆菌O66型,并能鉴定它们的O-抗原。
表3是大肠杆菌O66型的O-抗原基因簇的结构表,在表中列出了大肠杆菌O66型的O-抗原基因簇的结构,共由13个基因组成,每个基因用方框表示,并在方框内写入基因的名称,数字表示的是O-抗原基因簇中的开放阅读框(orf)的顺序。在O-抗原基因簇的两端是galF基因和gnd基因,它们不属于O-抗原基因簇,我们只是用它们的一段序列设计引物来扩增O-抗原基因簇的全长序列。
表4是大肠杆菌O66型的O-抗原基因簇中的基因的位置图,在图中列出了大肠杆菌O66型的O-抗原基因簇中的所有开放阅读框在全序列中的准确位置,在每个开放阅读框的起始密码子和终止密码子的下面划线。在大肠杆菌中开放阅读框的起始密码子有两个:ATG和GTG。
SEQ ID NO:1序列(SEQUENCE LISTING)
<110>天津生物芯片技术有限责任公司
<120>对大肠杆菌O66型的O抗原特异的核苷酸
<130>对大肠杆菌O66型的O抗原特异的核苷酸
<160>1
<170>PatentIn version 3.2
<210>1
<211>15137
<212>DNA
<213>Escherichia coli
<400>1
attgtggctg cagggatcaa agaaatcctc ctggtaactc acgcgtccaa gaacgcggtc 60
gaaaaccact tcgacacctc ttatgaatta gaatctctcc ttgagcagcg cgtgaagcgt 120
caactgcttg cggaagtgca gtccatctgt ccaccgggcg tgaccattat gaacgtgcgt 180
cagggcgaac ctttaggttt gggccactcc attttatgtg cacgacctgc tattggtgac 240
aatccatttg tcgtggtgct gccagacgtt gtgatcgatg acgccagcgc cgacccgctg 300
cgctacaacc ttgcggccat gattgcgcgc ttcaacgaaa cgggccgcag ccaggtgctg 360
gcaaaacgta tgccgggtga cctctctgaa tactccgtca ttcagaccaa agaaccgctg 420
gatcgtgaag gtaaagtcag ccgcattgtt gaatttatcg aaaaaccgga tcagccgcag 480
acgctggact cagatattat ggccgttggt cgctatgtgc tttctgccga tatttggccg 540
gaacttgaac gcactcagcc tggtgcatgg ggacgtattc agctgactga tgccatcgct 600
gaactggcga aaaaacagtc cgttgatgcc atgctgatga caggtgacag ctacgactgc 660
ggtaaaaaaa tgggttatat gcaggcgttt gtgaagtatg gactacgcaa cctcaaagaa 720
ggggcgaagt tccgtaaagg gattgagaag ctgttaagcg aataatgaaa atctgaccgg 780
atgtaacggt tgataagaaa attataacgg cagtgaagat tcgtggcgaa agtaatttgt 840
tgcgaatatt cctgccgttg ttttatataa acaatcagga taacaacgag ttagcaatag 900
gattttagtc aaagttttcc aggattttcc ttgtttccag agcggattgg taagacaatt 960
agcgtttgaa tttttcgggt ttagcgcgag tgggtaacgc tcgtcacatc gtaggcatgc 1020
atgcagtgct ctggtagctg taaagccagg ggcggtagcg tgcgttaata cctctattaa 1080
tcaaactgag agccgcttat ttcacagcat gctctgaagt aatatggaat aataaagtga 1140
agatacttgt tactggtggc gcaggattta ttggttctgc tgtagttcgt cacattataa 1200
ataatactca ggatagtgtt gttaatgtcg ataaattaac gtacgccgga aacctggaat 1260
cacttgctga tgtttctgat tctgaacgct atgtctttga acatgcggat atttgtgata 1320
cagctgcaat ggcacggatt tttgctcagc atcagccgga tgcagtgatg cacctggcag 1380
ctgaaagcca tgttgaccgt tcaattacag gccctgcggc atttattgaa accaatattg 1440
ttggtactta tgtcctttta gaagcggctc ggaattactg gtctgcactt gatggcgaca 1500
agaaaaacag cttccgtttt catcatattt ctactgacga agtctatggt gatttgcctc 1560
atccagatga agtaaataat acagaagaat tacccttatt tactgagacg acagcttacg 1620
cgccaagcag cccttattcc gcatccaaag catccagcga tcatttagtc cgcgcgtgga 1680
aacgtaccta tggtttaccg accattgtga ctaattgctc taacaattat ggtccttatc 1740
atttcccgga aaaacttatt ccattggtta ttctcaatgc tctggaaggt aaagcattac 1800
ctatttatgg taaaggggat caaattcgcg actggttgta tgttgaagat catgcgcgtg 1860
cgttatatac agtcgtaacc gaaggtaaag cgggtgaaac ttataacatt ggtggacaca 1920
acgaaaagaa aaacatagat gtagtgctca ctatttgtga tttgttggat gagattgtac 1980
cgaaagagaa atcttatcgc gagcaaatta cttatgttgc cgatcgtccg ggacacgatc 2040
gccgttatgc gattgatgct gagaagattg gtcgcgaatt gggatggaaa ccacaggaaa 2100
cgtttgagag cgggattcgg aagacagtgg aatggtattt gaataatagt gattggtgcc 2160
gacgagttca agatggctct tatcaacgtg agcgtttggg gttagttaaa tgaaaggaat 2220
tattttagcc ggtggttctg ggacaaggct ttatccaatt acaatggggg tttcaaagca 2280
gctattgccc atttatgata aaccgatgat ttattatccg ttatcggtgt tactattagc 2340
aaaaatcagg gatatactga taataacaac accggaagat catgcttctt ttatcagatt 2400
attaggcgat ggttctcgat ttggtattaa cttaagttat gctgttcaag aaaaaccaga 2460
aggattagct caggcatttt taataggttc tgaatttatt ggggctgata aggtttgctt 2520
agtgctagga gataatatct tttttggaca agcatttggc aagcaattat ctaaagtgat 2580
aaaagagtta gaaggtgcca ctgtatttgg atataaagta cgagacccag aaagatttgg 2640
tgtggttgaa tttgataatg ataataaagc tgtatcaata gaagaaaaac ctgttaaagc 2700
aaaatcaaat tgggcagtaa caggattata tttttatgat aatacagttg tggatatagc 2760
gaagaatgta aaaccttcag aaagaggtga gttagaaata acctcgatta acgaaacata 2820
cctaagtcaa ggaaaactaa aagttgaaca attagggcga ggatttgcgt ggcttgatac 2880
tggaactcat gattctctat tagacgcttc gcattttgta gagactgttg agaaaagaca 2940
aggttataaa atagcatgtc tggaggagat agcatataat aataattggt taactaagga 3000
ggatatacgg tttcttgcaa aaaaactaac aaaaacagat tatgggaaat atttattgga 3060
gttgattaaa tgaatgttat taaaacaaaa atagaagatc ttgttattat tgagccaaaa 3120
atatataatg atgaaagagg ttatttttat gagttttata ataaaaataa atttactgag 3180
cttggtataa atctagattt tgtacaagat aatagatcaa gttcgtcaca aaacgttctg 3240
agaggtctac attttcaaaa aacaaaacct cagggaaaac tcgttacggt aaccaaaggt 3300
gaagtatttg atgttgcagt tgatttacgt aaagattcac gaacatttgg gcaatatgaa 3360
tcagttattc tgacagagga aaataaaaaa atattttata taccaccagg ctttgcacat 3420
ggattttgtg tattaagtaa taaggctgat tttttataca aatgtactga cttttatgac 3480
ccaaatgatg aaggggggat tatatggaat gactcttcat tatcgattga atggcctgtt 3540
aatgctccta tattgtctaa aaaagacatg gagcttccaa cattaaaaaa tattagacaa 3600
tcgttattgg atggatttta aaatgtcgca gtttacaatt tttggtggtt ctggatttat 3660
aggttctgaa atagtaaaaa agttaaaatc agaaaaaaaa gatgtatatg tgccaaggcg 3720
tgatgaagac ttatgcttcg gtaaagattt aggaatagtt atatactgtg caggaaatgg 3780
tgattgtgta aatacgccta gaagtgttta cgatgcaaat ataaggtatt taactgatat 3840
tttatttgaa tgtaattata aagtacttgt ctatgtatcc tcaactaggg tttatataaa 3900
taatgactct tcattagaag gcaatgatat catagttaca tcttgtgatg agcgtagatt 3960
atttaatctt acaaagttgg tatctgaaga actttgtaac cgaagtggta aaccagtaat 4020
tatcgtgagg ccgagcaatg tttatggcct ggcaataaaa agccctctat tcttacccac 4080
aataacaaga aatgcaatac ttaatggaag tgttgatatg tttgttgagg aagaatacga 4140
gaaagattat gtgtcagtta atgatgtagt tgattgtatt attaagttaa gtatgatgga 4200
taaggctatt ggaaaaacta tcaatattgc atcaggctat aatatagcag caaaagattt 4260
agcggatatt cttcgaaata aaaccaattg tattattaat tggcatggta attcaggtaa 4320
acgagaaaac tttccgatta ttaatataga attattgaag agttttattc ctgaatacaa 4380
acctcgttct gttttagctg atctcgaata tatgattaaa gagtttaaac ataacattga 4440
ctcaaaagta ttatgaatta tttagtgaac aggaaagata taatttgggg gtatctatca 4500
cagttcttaa atatatcttc aagtttattg cttcttcctt ttatattgaa atgccttaat 4560
gaggaagaaa taggtctatg gtatgttttt gttgcgatgg caggaataat acagctttta 4620
gaatttggcc tattaccaac gatttcaagg tttatatcat atgtatatag tggcgcacta 4680
aatttagagt atggaaaaat tcctaaatgt aatataggtg atttcaacaa agagttacta 4740
aatgatgtgg ttgtgacctg taggtgtatt tattttaaga tcgctttatt tgctcttgtt 4800
ggaattttga tacttggtaa tgcatatata tatacattgt caacatcgat taataaatat 4860
tatatacttt gctgttggtc ggtttatggc ttaagtattt gtattcaact atactttggt 4920
tattataatg caatattaaa aggtcgaggt gatcaaacat tattaaataa aataattgtc 4980
gtcgctaaat taacgttact gttgattagt ataccattgt taatcgctgg atgtgggtta 5040
gtttcactag ccgttggagc tgtaatatct gtaattattg ataggatctt aattcggaaa 5100
tatgtgtact ctcaagaaag tggattaatt cggaacttag aaaaaagcaa taaaacagta 5160
tcgttaaaaa aagtcatttg gcaaagtgca agagatatgg gggtagttca gcttggcaat 5220
tatttaagtg tgcgggcggg ggtattgata gtctcaagct ttgtgaattt ggatgctgct 5280
gcaagttatg gtttaaccgt ccaagttact atggttattg tgataattgc atctatgttc 5340
tttgggttaa acatacccag aattacatca gagcaagcac atgagaatat gttagttgtt 5400
aagaatttaa tgaaaaaatc attgctcatt gctaattgta tctatatttt tgccgcttta 5460
attcttgttg cgatcggaga tgatattctc gcttttttaa caaaaaatac gactttgctc 5520
ccaaaagaac tcctcatttt gtaccttgtc acagcgttgt ttgaaatgaa ttactctatc 5580
tgcacatcct acttgacgac taggaatgaa gtgatattta taaaaagtat gttgtacact 5640
ggcgttgcaa ttgttttgtt ctcatttata tcaacgtaca ttgcggaaat gggagcgtta 5700
ggggttatat tatcacaatt attaatgcaa tcattatata ataattggca ttggccatta 5760
aaagtatatc aggaattaaa gaatgactaa tactaaagta aaagtaattg atctgcttcg 5820
aaaaaatgaa gaacattatg tttttaatag cctttcaatt aaagcaatac atgagaaata 5880
tgacactgag atatgggtat ctgaagattc aacttatttg gatgaactgg atgtaggcgt 5940
taaagtcaat catgttcaag ttaaaagaag taaaacatat aattggataa tatcatcatt 6000
taacttgtca aaattgattt tgcaaaacat aggagagaac actaaaataa ttgtcctgtc 6060
tgcgactcca atacaatata cattaattag tctaattagt atgatgattc ctaataatat 6120
atatttattt atgcatggtg aattggcgta tttaaagtgg agttcttgta ttggtcaaaa 6180
aataggtcgt ctatttataa aaatagccat gaaaatggga cgggtaaaat ttatttgcat 6240
cggtcattct atacaagaaa gcttagcaaa gattttccct aaaagatcat ttcaatatgt 6300
ccagcatcca attgtttcta atttgtgttc caagggctta actgttccac ttacatttgg 6360
tagttttggt attcactcac aggataaagg tagcaataaa gtatacgatt tggcatgttg 6420
tattgaaaat atgcatttta ccaattgtaa aataattacc gttggcataa gcgacggaag 6480
ttttaaatat gatttgcata ataaggtgag tcactattgc aaaggtaatt tgaagaaaca 6540
gctaatagct aaggagctgt tttatgagtt tttgttaaaa attgatgtgg cgttaatttt 6600
ttcaaatgtt gatgaggaaa atgatagtaa atatgacctt atctcaagcg gtgtacttgc 6660
agattgcatt gcatttggta tgcctgttat tgctttaaaa aataaacagt tagttagcta 6720
ctttaaaaag tatggtgagt ttggatttct ttgtgacact gtaaacgata tggctgttgc 6780
tgttagagaa ttatcgaata accccaagct tatattatca ttcaaagatg ttctgaaaaa 6840
aataagaaaa gactttgagt tcgagatgtt taaatcaaga atgaatgaga taattaatga 6900
aaaataagat atcattctat attgcatata tatatatagc accaataata ttatcgttgt 6960
actatatttc aacaacaaac tcattattag gtgattttcg aacttatagt tataaacttg 7020
aatgggagtc ttcattatta ttcttaatat tgtatttcat ccctttaatt atcatatttt 7080
gtgttgtgaa aatgactgga aaaataaagg ttgatacatt tgagagtatt aaacttgaaa 7140
agtttgcatt ttattcaatt attataacag gtctgattac tcttatattc ggggcaaatg 7200
ccataggcca tcccgcacaa acaggtatag ctggtgtaat tataaaaata gcgagcaaat 7260
taaatccact tgtgttattg ccattattaa cattcacaaa tgtgtcggta agaaaatttt 7320
ttttctgtgc tgcagttgtt attttttatg gatatatgca acaatctttg caaggtatat 7380
atattagcgt tctttgtgcg ggggcgtttt ttttactgaa agttagattg aatggcgcca 7440
tattcatcct aatgcttttg tcgccaatta tatttttggg gccacttctt gatattataa 7500
cacacctata tacaattaga aatgaaattc gtggcgtttc gtttagtgtt gaagaaattt 7560
tttcactagc acttggccgt atatcaacca cgtcatcatt aatatatact attagtaata 7620
gttttaatac tacaggagtt tcggactact ttgtttttgg tattgtgatt gaacgtctaa 7680
ttggggtgca tatactggat acagtttctc cttctcaagt attcaataca tatatacttg 7740
gcgctaatgc tgattatagt atttttatgg gcttggcagg ttttttgtat tttattaaag 7800
acttcacctg cagtgtttat tgtaaatgct gcgtgtttga tcttggtact gattcttata 7860
tacttggcgc taatgctgat tatagtattt ttatgggctt ggcaggtttt tttgtatttt 7920
tattaaagac ttcacctgca gtgtttattg taaatgctgc gtgtttgatc ttggtactga 7980
ttcttatata cttattgatt ccagttaaca atgttaaata taggacatct gttttttttc 8040
ttataatgta tcttccattt ttatcatttg atatttggga gatttccata gtttttcaaa 8100
caattattat ctggcgagta tttcttttgc tatctaagat ttcttttggg ctaaaataat 8160
gaaaagtatt ttattcgtaa ttccttctat ggcaccagcg ggagggatag aaagagttgt 8220
tagcacgata attaataaaa taagtaaatc atatgattgt tcaatcttga cttttgacga 8280
tttaccttat ttttatcatg tcaatgataa aataatgaaa agtagtctaa atgttgattc 8340
tgttcttgat atgaagagta gagctagaag aattatccaa gtatctaagc taatactttt 8400
agcggtaata aggctgagaa agcactttaa aaataataat tatgactatg tatatacgac 8460
acatccttta aatcactgta ttctattact ggcaggaata aatcataaga aaattgtcat 8520
tggtgaacat ggcgctaata ataactataa cttgatttat cgattattaa aaagagtgac 8580
ttataaatat tgccatgctt attgtcttcc aacaaggagt gattatctgt tttacagaga 8640
aaaaggattg ccagttaaat atacgcctca ttacaaacca gaactgcctt atgaaatgca 8700
taagcaaaat agcaaaacga tattgtgtgt tggaagacta acagctgata aacaacatct 8760
gttgttatta aagatgtgga aaaatataat taatgaaatc ccatttggat ggacacttca 8820
tattgttggt gatggagagt tgaaaccaat tcttaaagat tttattaacg aaaacggact 8880
tagtcagtca gtgagattaa gtgattcgac gaagaatatt agtaaatatt atattgattc 8940
atcttttttt gcattaacat caaaaagtga aggatttggg atggtgatac ttgaagctct 9000
ttcatttggg ttacctatca tttcattcga ttgcccttct ggtccgagag acatgattaa 9060
tgataataat ggatttctta ttcagccagg agatgaagta ttgtatcaaa atactcttgt 9120
aaaattaatt aagcatgaaa aattaagaaa gagcttaacc ttaggtgccc ttgaatttgc 9180
tgcgaattgg aatgatgata acataacaga acattggcgg gacatctata aatgaatata 9240
tcagtaataa ttcctgttta taatggtgct gcaaccatca tagaggcaat tgactcagta 9300
atcaaacaaa aaatagatgg agatataaca tacaatattg aaataattgt agttaatgat 9360
ggctcgcaag ataatacgct aaatatttta gctcgttaca tagaggaaat aaaagctaaa 9420
aatattaagg ttataaatac agaaaatggt ggggtttcgt gtgcaagaaa tattggtatt 9480
aaagctgcga aatatgaatg ggttgctttt cttgatgctg atgatgtttg gtgtgaaaat 9540
aaattaagca ttcagataaa acatatcaaa tccattaaat ctcctgttaa ttttattggc 9600
tcagctcgta atcatgaaga gctatattta tatggtaaaa aaataacttc attatataaa 9660
gttaaacctc tggacctatt gattaaaatt ttccctcaaa cttcaactgc attagtaaaa 9720
aaggaggctt tgcttaattg tgggttatac gatgttaata tgactcattg tgaggatgca 9780
gacttatgga tcaggatatg ctcactgaat ggtggttttt attaccatcc agaatctaca 9840
gttattacag ggggaggaaa gtataatgta ggtgtgtctg gcttgtcatc agatttaaaa 9900
aaaatggagg ccggaatctg ccaaatgtta agaaaaacat atttgcgggg tcagatatca 9960
tacttttcat acatattttt ttatatgttt tacaaagtta aatatataag aagattgaca 10020
attgtgtgga ttaggaggtt tatgtgatct tcaaaattaa gtggttattt tcagcgttaa 10080
tactttcttt ttttctgaaa aaaatatcat tcccatcatt tttcgctttt cctgtttttt 10140
ttaaaggctt gagaagagtt tccattggta aacatgttag aatatttccg gggtgtcgtt 10200
tcgagactca tggtaccggt gaaatcatca tagaggatga tgtttcaatt gcccaaaatg 10260
tacatattac atcaggtacc aaactagtta tcgggcaagg gacgttgata actgctaata 10320
gttatattac atcaatagat catgattatg aaactatcgg agttcctatc ccacgtcagc 10380
atctagatta taaagagaca cgtattggta aaaattgctt tatcggtatg ggggttgcta 10440
ttcaggccgg tacaattctt ggagaacaat gtgttgtcgg tgctaactct gttgtcagag 10500
gagtttaccc tgactattgt gtaatagcag gtgtaccagc gaagattata aaagtttatg 10560
ataaaaactc gggagaatgg attcgtgtct gatgtaaaga atgtactgat tttttgccca 10620
aagtttttta attacgacat taatattcgg aatgctgtcc aaaaaaatgg atatactgta 10680
agcttattta atgagcgccc ttttgataat ataattgggc gtgctttaat aagactgggt 10740
ttcgattttt ttttgaagcg tcagattttt aaatattaca aaaatatata tgacaatatt 10800
tttgcagata tagattattt gattgtgata aatcctgaat gtataacccc tgaaatattg 10860
gagatttatc ggaataaatg caataatatc attgtatata tgtgggattc atttgaaaat 10920
aaaccgcagg caaaaaaact catacgacac gctgacttat tttatacatt tgatccaaat 10980
gatgcaaaaa ataacaacat tatatttaaa ccactttttt atacaaaagc atatcgtgaa 11040
atcccttcta aacctcaact tgaatacgat atttctttca ttggtactat tcattcatct 11100
cgctatcaat atgttaagtc tatagcgaca gtaaaaaaca aatttatatt tttttattgt 11160
ccaagtcttt ttgttttttt atttaaaaaa tatattgcaa gagagattga atgtataaaa 11220
ttaaaggacg tttcttttaa atctttaagt gaaagtgagg ttttaaatgt tatcaaaaga 11280
tcaaggtgta tactcgatgt tgttcatcca aaacagaatg gactaacaat aagaactatt 11340
gaagcgcttg gggccaataa aaaaatcatc acaactaatc ggaatgtcgt taaatatgat 11400
ttttataatc cttcaaacat attagtttta gatgacacag tgaatgatgt tgctattgct 11460
aagtttatta atcaagagta tgtacatcct gatgacgaaa tataccagag ttactatatc 11520
gaaaactggg ttaaggactt attgagagag taaattatga agattgttcc tgtagtatta 11580
gctggaggta gtggtacaag actttggcca ttatcgagaa cgatgtatcc taaacaattt 11640
ctgaaaatat ttggtcacat gaccatgtta caaaccactt tatctagaat gaatagtttt 11700
catgatgcaa ctgatgctat cgttatatgt aatgaagctc accgtttcgt ggttgctgaa 11760
cagctaaatc agattgataa aaaaagtact atcattcttg aaccttgtgg caggagtaca 11820
gctcctgctg tcgcgttagc tgctatgcat attgtcgaaa ctatcaacgc tgatcaagac 11880
gtgctattgt tagttctccc ggcagaccat ataataaaag atctagacac ctttcatcag 11940
gccgtaaaag tagctagctc ctttgcatgt ggtgggaaac ttgtaacttt tggcattcct 12000
cctctaacac ctgagaccgg atatggttac attcaacgtg gtaatagcat tggcaccgta 12060
gagggaagtg aatgctttga ggtttctaaa tttgtcgaaa agccagacgt aaatactgca 12120
acgcaatttt taaatgattc caattactat tggaatagtg gtatgtttat gtttagcgcc 12180
cgaacttatc ttgaagaatt acaaaaatac tgtcctgata ttgtgagtgt atgtcagaag 12240
tcttacgata attctgtctg tgacttggat tttatccgta ttgatgaaaa acaattctcg 12300
aattgtctgg atttatctat tgattatgct ttaatggagc atactaatga ggccatagtt 12360
gtacctatgg atggtgattg gagtgacgtg ggctcttggg catcattatg ggatataact 12420
aataaagata ataacggaaa tgttctttgg ggcgatatac ttactagaga tagttcgaat 12480
aattatatct acggtgaatc aggacttatt acaactctgg gcgttgaaga tttagtcata 12540
gttcaaacaa aagatgctct tcttgtagct aatcgaaaat ctgttcagga tattaagcaa 12600
cttgttgagc aattaaagtt acgcgacaga agtgaatatt atattcatcg cgagacttac 12660
cgaccttggg gtaaatgcga taccattgat aaaggcaaaa gataccaagt gaagagaatt 12720
gaggttaagc ctggtgaagg aatatcgttg caacttcatc atcatcggtc tgagcactgg 12780
gtagttgtct ctggtaccgc aaagattaca attaatggcg ttgaaaaaat aatcagtgaa 12840
aatgaatcca tctatatacc actaggtgcc aagcactgtt tggaaaaccc tggaaaaatc 12900
acactcgaat taatcgagat acgttcagga agttatcttg ctgaagatga cataattcga 12960
ttttttgata aatatggtag gatataacaa ggttaatata cttatgctaa tttgttttaa 13020
agcctatgat attcgcggaa aattaggcga agaactgaat gaagatatcg cctggcgcat 13080
tggtcgcgcc tatggcgaat ttcttaaacc gaaaaccatt gtgttaggcg gtgatgtccg 13140
cctcaccagc gaaaccttaa aactggcgct ggcaaaaggt ttacaggatg cgggcgtcga 13200
tgtgctggat atcggcatgt ccggcaccga agagatctat ttcgccactt tccatctcgg 13260
cgtcgatggc ggtatcgaag tcaccgccag ccataatccg atggattaca acggcatgaa 13320
gctggtgcgc gaaggtgctc gcccgatcag cggcgatacc ggactgcgcg acgtccagcg 13380
tctggcagaa gccaacgact tcccgcctgt cgatgaaaca acacgcggta gttatcagca 13440
aatcaacctg cgcgacgcct acattgatca cctgttcggc tatatcaacg tcaaaaacct 13500
cacgccgctc aaactggtga tcaactcagg gaacggcgca gcgggtccgg tggtggacgc 13560
cattgaagcc cgctttaaag ccctcggcgc acctgtggaa ttgatcaaag tgcacaacac 13620
gccggacggc aatttcccca atggtattcc taatcctttg ctgccggaat gtcgcgacga 13680
cactcgcaat gcggtcatca aacacggtgc ggacatgggc attgcctttg atggcgattt 13740
tgaccgctgc ttcctgtttg acgaaaaagg gcagtttatc gagggctact acattgtcgg 13800
tttgctggca gaagcgttcc tcgaaaaaaa tcccggcgcg aagattatcc acgatccgcg 13860
tctttcctgg aacactgtcg atgtggtgac tgccgcaggc ggcataccgg tgatgtcgaa 13920
aaccggacac gcctttatta aagaacggat gcgcaaggaa gacgccatct acggtggcga 13980
aatgagcgcg caccactact tccgtgattt tgcttactgc gacagcggca tgatcccgtg 14040
gctgctggtc gctgaactgg tgtgcctgaa agagaaaacg ctgggcgaac tggtgcgcga 14100
ccggatggcg gcgttcccgg caagcggtga gatcaacagc aaactggcgc aacccgttga 14160
ggcgattaac cgcgtggaac agcactttag ccgcgaggcg ctggcggtgg atcgtactga 14220
tggcgtcagc atgacctttg ccgactggcg ctttaacctg cgctcttcca acaccgaacc 14280
ggtcgtacgc ctgaatgtgg agtcgcgcgg tgatgtgccg ctgatggaag aaaaaacaca 14340
attaattctt gatttactca gaaattaagt agactgaaga atgagcggta cacaggttca 14400
tatataaaat gttaatgcta tgagtgtgat aaagcatatg tacctctatt catcatgact 14460
ctgtctgagt taacatctgc atcacattca agccgcgcaa ccccgcggag accaccactg 14520
acaggagtaa acaatgtcaa agcaacagat cggcgtcgtc ggtatggcag tgatgggacg 14580
caacctcgcg ctcaacatcg aaagccgtgg ttataccgtc tctattttca accgctcccg 14640
tgaaaagacg gaagaagtta ttgccgaaaa tccaggcaag aaactggttc cttactatac 14700
ggtgaaagag ttcgttgaat ctcttgaaac gcctcgtcgc atcctgttaa tggtgaaagc 14760
aggtgcgggc acggatgctg ctattgattc cctgaaacca tatctcgata aaggcgatat 14820
catcattgat ggtggtaata ccttcttcca ggacaccatt cgtcgtaacc gcgagctttc 14880
tgcagaaggc tttaacttca tcggtacggg tgtttccggt ggtgaagagg gcgcgctgaa 14940
aggaccttct atcatgcctg gtgggcagaa agaagcctat gaactggttg ctcctatcct 15000
gaccaaaatc gccgccgtgg ctgaagatgg cgaaccgtgc gttacctata ttggtgccga 15060
tggcgcaggt cactatgtga agatggttca caacggtatt gaatacggtg atatgcaact 15120
gattgctgaa gcctatt 15137
表1大肠杆菌O66型的O抗原基因簇中的寡糖单位处理基因及其中的引物及PCR数据
基因 | 功能 |
基因的碱基位置 | 正向引物 | 反向引物 |
PCR产物的长度 |
产生正确大小电泳带的组数 |
PCR的退火温度(℃) |
Wzx |
O-抗原转运酶 |
4453-5790 |
45924609 |
5043-5060 |
469bp |
0* |
66 |
| | |
5027-5044 |
5354-5371 |
345bp |
0* |
60 |
Wzy |
O-抗原聚合酶 |
6897-8159 |
7252-7269 |
7535-7552 |
301bp |
0* |
60 |
| | |
6983-7004 |
7251-7272 |
290bp |
0* |
60 |
*只在大肠杆菌O66型中得到正确的一条带
表2166株大肠杆菌和43株志贺氏菌及它们的来源
组号 |
该组中含有的菌株 |
来源 |
1、野生型大肠杆菌2、野生型大肠杆菌3、野生型大肠杆菌4、野生型大肠杆菌5、野生型大肠杆菌6、野生型大肠杆菌7、野生型大肠杆菌8、野生型大肠杆菌9、野生型大肠杆菌痢疾志贺氏菌10、鲍氏志贺氏菌11、福氏志贺氏菌12、野生型大肠杆菌13、第4组菌株加上大肠杆菌标准菌株 |
O1,O2,O5,O7,O8,O9,O12,O13,O14,O15,O16,O17,O18,O19ab,O20,O21,O22,O23,O24O4,O10,O25,O26,O27,O28,O29,O30,O32,O33,O34,O35,O36,O37,O38,O40,O41,O42,O43O6,O44,O45,O46,O48,O49,O50,O51,O52,O54,O55,O56,O57,O58,O60,O61,O62,O53O63,O65,O69,O70,O71,O74,O75,O76,O77,O78,O79,O80,O81,O82,O83,O68O84,O85,O86,O87,O88,O89,O90,O91,O92,O98,O99,O101,O102,O103,O104,O105,O106,O97O107,O108,O109,O110,O111,O112ab,O112ac,O113,O115,O116,O118,O120,O123,O125,O126,O128,O117O129,O130,O131,O132,O133,O134,O135,O136,O137,O138,O139,O141,O142,O143,O144,O145,O140O146,O147,O148,O150,O152,O154,O156,O157,O158,O159,O160,O161,O163,O164,O165,O166,O153O168,O169,O170,O171,O172,O173,D1,D2,D3,D4,D5,D6,D7,D8,D9,D10,D11,D12,D13B1,B2,B3,B4,B6,B7,B8,B9,B10,B11,B12,B13,B14,B15,B16,B17,B18F1a,F1b,F2a,F2b,F3,F4a,F4b,F5(v:4),F5(v:7),F6,DS,DRO3,O11,O39,59,O64,O73,O96,O95,O100,O114,O151,O155O124,O167,O162,O121,O127,O149,O119O66 |
IMVSaIMVSaIMVSaIMVSaIMVSaIMVSaIMVSaIMVSabcdddIMVSaIMVSa |
为了检测的方便,每12-19个菌分为一组,总共12组,第13组作为阳性对照
a.Institute of Medical and Veterinary Science(IMVS),Anelaide,Australia
b.Statens Serum Institut,Copenhagen,Denmark
c.O172和O173来自于Statens Serum Institut,Copenhagen,Denmark,其余来自于IMVS
d.中国预防医学科学院流行病学研究所
表3.大肠杆菌O66型O抗原基因结构图
E.coli O66 O-antigen gene clusters
#orf galF rmlB rmlA rmlC orf4 wzx orf6 wzy orf8 orf9 orf10 orf11 manC manB gnd
G+C% 42.7 34.1 29.7 30.7 32.2 30.2 30.6 31.3 31.4 37.0 28.9 37.8 53.7
content
表4大肠杆菌O66型O抗原基因簇基因位置
ATTGTGGCTG CAGGGATCAA AGAAATCCTC CTGGTAACTC ACGCGTCCAA GAACGCGGTC 60
GAAAACCACT TCGACACCTC TTATGAATTA GAATCTCTCC TTGAGCAGCG CGTGAAGCGT 120
CAACTGCTTG CGGAAGTGCA GTCCATCTGT CCACCGGGCG TGACCATTAT GAACGTGCGT 180
CAGGGCGAAC CTTTAGGTTT GGGCCACTCC ATTTTATGTG CACGACCTGC TATTGGTGAC 240
AATCCATTTG TCGTGGTGCT GCCAGACGTT GTGATCGATG ACGCCAGCGC CGACCCGCTG 300
CGCTACAACC TTGCGGCCAT GATTGCGCGC TTCAACGAAA CGGGCCGCAG CCAGGTGCTG 360
GCAAAACGTA TGCCGGGTGA CCTCTCTGAA TACTCCGTCA TTCAGACCAA AGAACCGCTG 420
GATCGTGAAG GTAAAGTCAG CCGCATTGTT GAATTTATCG AAAAACCGGA TCAGCCGCAG 480
ACGCTGGACT CAGATATTAT GGCCGTTGGT CGCTATGTGC TTTCTGCCGA TATTTGGCCG 540
GAACTTGAAC GCACTCAGCC TGGTGCATGG GGACGTATTC AGCTGACTGA TGCCATCGCT 600
GAACTGGCGA AAAAACAGTC CGTTGATGCC ATGCTGATGA CAGGTGACAG CTACGACTGC 660
GGTAAAAAAA TGGGTTATAT GCAGGCGTTT GTGAAGTATG GACTACGCAA CCTCAAAGAA 720
GGGGCGAAGT TCCGTAAAGG GATTGAGAAG CTGTTAAGCG AATAATGAAA ATCTGACCGG 780
ATGTAACGGT TGATAAGAAA ATTATAACGG CAGTGAAGAT TCGTGGCGAA AGTAATTTGT 840
TGCGAATATT CCTGCCGTTG TTTTATATAA ACAATCAGGA TAACAACGAG TTAGCAATAG 900
GATTTTAGTC AAAGTTTTCC AGGATTTTCC TTGTTTCCAG AGCGGATTGG TAAGACAATT 960
AGCGTTTGAA TTTTTCGGGT TTAGCGCGAG TGGGTAACGC TCGTCACATC GTAGGCATGC 1020
ATGCAGTGCT CTGGTAGCTG TAAAGCCAGG GGCGGTAGCG TGCGTTAATA CCTCTATTAA 1080
orf1的起始
TCAAACTGAG AGCCGCTTAT TTCACAGCAT GCTCTGAAGT AATATGGAAT AATAA
AGTGA 1140
AGATACTTGT TACTGGTGGC GCAGGATTTA TTGGTTCTGC TGTAGTTCGT CACATTATAA 1200
ATAATACTCA GGATAGTGTT GTTAATGTCG ATAAATTAAC GTACGCCGGA AACCTGGAAT 1260
CACTTGCTGA TGTTTCTGAT TCTGAACGCT ATGTCTTTGA ACATGCGGAT ATTTGTGATA 1320
CAGCTGCAAT GGCACGGATT TTTGCTCAGC ATCAGCCGGA TGCAGTGATG CACCTGGCA6 1380
CTGAAAGCCA TGTTGACCGT TCAATTACAG GCCCTGCGGC ATTTATTGAA ACCAATATTG 1440
TTGGTACTTA TGTCCTTTTA GAAGCGGCTC GGAATTACTG GTCTGCACTT GATGGCGACA 1500
AGAAAAACAG CTTCCGTTTT CATCATATTT CTACTGACGA AGTCTATGGT GATTTGCCTC 1560
ATCCAGATGA AGTAAATAAT ACAGAAGAAT TACCCTTATT TACTGAGACG ACAGCTTACG 1620
CGCCAAGCAG CCCTTATTCC GCATCCAAAG CATCCAGCGA TCATTTAGTC CGCGCGTGGA 1680
AACGTACCTA TGGTTTACCG ACCATTGTGA CTAATTGCTC TAACAATTAT GGTCCTTATC 1740
ATTTCCCGGA AAAACTTATT CCATTGGTTA TTCTCAATGC TCTGGAAGGT AAAGCATTAC 1800
CTATTTATGG TAAAGGGGAT CAAATTCGCG ACTGGTTGTA TGTTGAAGAT CATGCGCGTG 1860
CGTTATATAC AGTCGTAACC GAAGGTAAAG CGGGTGAAAC TTATAACATT GGTGGACACA 1920
ACGAAAAGAA AAACATAGAT GTAGTGCTCA CTATTTGTGA TTTGTTGGAT GAGATTGTAC 1980
CGAAAGAGAA ATCTTATCGC GAGCAAATTA CTTATGTTGC CGATCGTCCG GGACACGATC 2040
GCCGTTATGC GATTGATGCT GAGAAGATTG GTCGCGAATT GGGATGGAAA CCACAGGAAA 2100
CGTTTGAGAG CGGGATTCGG AAGACAGTGG AATGGTATTT GAATAATAGT GATTGGTGCC 2160
orf2的起始 orf1的终止
GACGAGTTCA AGATGGCTCT TATCAACGTG AGCGTTTGGG GTTAGTTAA
A TGAAAGGAAT 2220
TATTTTAGCC GGTGGTTCTG GGACAAGGCT TTATCCAATT ACAATGGGGG TTTCAAAGCA 2280
GCTATTGCCC ATTTATGATA AACCGATGAT TTATTATCCG TTATCGGTGT TACTATTAGC 2340
AAAAATCAGG GATATACTGA TAATAACAAC ACCGGAAGAT CATGCTTCTT TTATCAGATT 2400
ATTAGGCGAT GGTTCTCGAT TTGGTATTAA CTTAAGTTAT GCTGTTCAAG AAAAACCAGA 2460
AGGATTAGCT CAGGCATTTT TAATAGGTTC TGAATTTATT GGGGCTGATA AGGTTTGCTT 2520
AGTGCTAGGA GATAATATCT TTTTTGGACA AGCATTTGGC AAGCAATTAT CTAAAGTGAT 2580
AAAAGAGTTA GAAGGTGCCA CTGTATTTGG ATATAAAGTA CGAGACCCAG AAAGATTTGG 2640
TGTGGTTGAA TTTGATAATG ATAATAAAGC TGTATCAATA GAAGAAAAAC CTGTTAAAGC 2700
AAAATCAAAT TGGGCAGTAA CAGGATTATA TTTTTATGAT AATACAGTTG TGGATATAGC 2760
GAAGAATGTA AAACCTTCAG AAAGAGGTGA GTTAGAAATA ACCTCGATTA ACGAAACATA 2820
CCTAAGTCAA GGAAAACTAA AAGTTGAACA ATTAGGGCGA GGATTTGCGT GGCTTGATAC 2880
TGGAACTCAT GATTCTCTAT TAGACGCTTC GCATTTTGTA GAGACTGTTG AGAAAAGACA 2940
AGGTTATAAA ATAGCATGTC TGGAGGAGAT AGCATATAAT AATAATTGGT TAACTAAGGA 3000
GGATATACGG TTTCTTGCAA AAAAACTAAC AAAAACAGAT TATGGGAAAT ATTTATTGGA 3060
orf3的起始 orf2的终止
GTTGATTAA
A TGAATGTTAT TAAAACAAAA ATAGAAGATC TTGTTATTAT TGAGCCAAAA 3120
ATATATAATG ATGAAAGAGG TTATTTTTAT GAGTTTTATA ATAAAAATAA ATTTACTGAG 3180
CTTGGTATAA ATCTAGATTT TGTACAAGAT AATAGATCAA GTTCGTCACA AAACGTTCTG 3240
AGAGGTCTAC ATTTTCAAAA AACAAAACCT CAGGGAAAAC TCGTTACGGT AACCAAAGGT 3300
GAAGTATTTG ATGTTGCAGT TGATTTACGT AAAGATTCAC GAACATTTGG GCAATATGAA 3360
TCAGTTATTC TGACAGAGGA AAATAAAAAA ATATTTTATA TACCACCAGG CTTTGCACAT 3420
GGATTTTGTG TATTAAGTAA TAAGGCTGAT TTTTTATACA AATGTACTGA CTTTTATGAC 3480
CCAAATGATG AAGGGGGGAT TATATGGAAT GACTCTTCAT TATCGATTGA ATGGCCTGTT 3540
AATGCTCCTA TATTGTCTAA AAAAGACATG GAGCTTCCAA CATTAAAAAA TATTAGACAA 3600
orf4的起始 orf3的终止
TCGTTATTGG
ATGGATTT
TA AAATGTCGCA GTTTACAATT TTTGGTGGTT CTGGATTTAT3660
AGGTTCTGAA ATAGTAAAAA AGTTAAAATC AGAAAAAAAA GATGTATATG TGCCAAGGCG 3720
TGATGAAGAC TTATGCTTCG GTAAAGATTT AGGAATAGTT ATATACTGTG CAGGAAATGG 3780
TGATTGTGTA AATACGCCTA GAAGTGTTTA CGATGCAAAT ATAAGGTATT TAACTGATAT 3840
TTTATTTGAA TGTAATTATA AAGTACTTGT CTATGTATCC TCAACTAGGG TTTATATAAA 3900
TAATGACTCT TCATTAGAAG GCAATGATAT CATAGTTACA TCTTGTGATG AGCGTAGATT 3960
ATTTAATCTT ACAAAGTTGG TATCTGAAGA ACTTTGTAAC CGAAGTGGTA AACCAGTAAT 4020
TATCGTGAGG CCGAGCAATG TTTATGGCCT GGCAATAAAA AGCCCTCTAT TCTTACCCAC 4080
AATAACAAGA AATGCAATAC TTAATGGAAG TGTTGATATG TTTGTTGAGG AAGAATACGA 4140
GAAAGATTAT GTGTCAGTTA ATGATGTAGT TGATTGTATT ATTAAGTTAA GTATGATGGA 4200
TAAGGCTATT GGAAAAACTA TCAATATTGC ATCAGGCTAT AATATAGCAG CAAAAGATTT 4260
AGCGGATATT CTTCGAAATA AAACCAATTG TATTATTAAT TGGCATGGTA ATTCAGGTAA 4320
ACGAGAAAAC TTTCCGATTA TTAATATAGA ATTATTGAAG AGTTTTATTC CTGAATACAA 4380
ACCTCGTTCT GTTTTAGCTG ATCTCGAATA TATGATTAAA GAGTTTAAAC ATAACATTGA 4440
orf5的起始 orf4的终止
CTCAAAAGTA TT
ATGAATTA TTTAGTGAAC AGGAAAGATA TAATTTGGGG GTATCTATCA 4500
CAGTTCTTAA ATATATCTTC AAGTTTATTG CTTCTTCCTT TTATATTGAA ATGCCTTAAT 4560
GAGGAAGAAA TAGGTCTATG GTATGTTTTT GTTGCGATGG CAGGAATAAT ACAGCTTTTA 4620
GAATTTGGCC TATTACCAAC GATTTCAAGG TTTATATCAT ATGTATATAG TGGCGCACTA 4680
AATTTAGAGT ATGGAAAAAT TCCTAAATGT AATATAGGTG ATTTCAACAA AGAGTTACTA 4740
AATGATGTGG TTGTGACCTG TAGGTGTATT TATTTTAAGA TCGCTTTATT TGCTCTTGTT 4800
GGAATTTTGA TACTTGGTAA TGCATATATA TATACATTGT CAACATCGAT TAATAAATAT 4860
TATATACTTT GCTGTTGGTC GGTTTATGGC TTAAGTATTT GTATTCAACT ATACTTTGGT 4920
TATTATAATG CAATATTAAA AGGTCGAGGT GATCAAACAT TATTAAATAA AATAATTGTC 4980
GTCGCTAAAT TAACGTTACT GTTGATTAGT ATACCATTGT TAATCGCTGG ATGTGGGTTA 5040
GTTTCACTAG CCGTTGGAGC TGTAATATCT GTAATTATTG ATAGGATCTT AATTCGGAAA 5100
TATGTGTACT CTCAAGAAAG TGGATTAATT CGGAACTTAG AAAAAAGCAA TAAAACAGTA 5160
TCGTTAAAAA AAGTCATTTG GCAAAGTGCA AGAGATATGG GGGTAGTTCA GCTTGGCAAT 5220
TATTTAAGTG TGCGGGCGGG GGTATTGATA GTCTCAAGCT TTGTGAATTT GGATGCTGCT 5280
GCAAGTTATG GTTTAACCGT CCAAGTTACT ATGGTTATTG TGATAATTGC ATCTATGTTC 5340
TTTGGGTTAA ACATACCCAG AATTACATCA GAGCAAGCAC ATGAGAATAT GTTAGTTGTT 5400
AAGAATTTAA TGAAAAAATC ATTGCTCATT GCTAATTGTA TCTATATTTT TGCCGCTTTA 5460
ATTCTTGTTG CGATCGGAGA TGATATTCTC GCTTTTTTAA CAAAAAATAC GACTTTGCTC 5520
CCAAAAGAAC TCCTCATTTT GTACCTTGTC ACAGCGTTGT TTGAAATGAA TTACTCTATC 5580
TGCACATCCT ACTTGACGAC TAGGAATGAA GTGATATTTA TAAAAAGTAT GTTGTACACT 5640
GGCGTTGCAA TTGTTTTGTT CTCATTTATA TCAACGTACA TTGCGGAAAT GGGAGCGTTA 5700
GGGGTTATAT TATCACAATT ATTAATGCAA TCATTATATA ATAATTGGCA TTGGCCATTA 5760
orf6的起始 orf5的终止
AAAGTATATC AGGAATTAAA GA
ATGAC
TAA TACTAAAGTA AAAGTAATTG ATCTGCTTCG5820
AAAAAATGAA GAACATTATG TTTTTAATAG CCTTTCAATT AAAGCAATAC ATGAGAAATA 5880
TGACACTGAG ATATGGGTAT CTGAAGATTC AACTTATTTG GATGAACTGG ATGTAGGCGT 5940
TAAAGTCAAT CATGTTCAAG TTAAAAGAAG TAAAACATAT AATTGGATAA TATCATCATT 6000
TAACTTGTCA AAATTGATTT TGCAAAACAT AGGAGAGAAC ACTAAAATAA TTGTCCTGTC 6060
TGCGACTCCA ATACAATATA CATTAATTAG TCTAATTAGT ATGATGATTC CTAATAATAT 6120
ATATTTATTT ATGCATGGTG AATTGGCGTA TTTAAAGTGG AGTTCTTGTA TTGGTCAAAA 6180
AATAGGTCGT CTATTTATAA AAATAGCCAT GAAAATGGGA CGGGTAAAAT TTATTTGCAT 6240
CGGTCATTCT ATACAAGAAA GCTTAGCAAA GATTTTCCCT AAAAGATCAT TTCAATATGT 6300
CCAGCATCCA ATTGTTTCTA ATTTGTGTTC CAAGGGCTTA ACTGTTCCAC TTACATTTGG 6360
TAGTTTTGGT ATTCACTCAC AGGATAAAGG TAGCAATAAA GTATACGATT TGGCATGTTG 6420
TATTGAAAAT ATGCATTTTA CCAATTGTAA AATAATTACC GTTGGCATAA GCGACGGAAG 6480
TTTTAAATAT GATTTGCATA ATAAGGTGAG TCACTATTGC AAAGGTAATT TGAAGAAACA 6540
GCTAATAGCT AAGGAGCTGT TTTATGAGTT TTTGTTAAAA ATTGATGTGG CGTTAATTTT 6600
TTCAAATGTT GATGAGGAAA ATGATAGTAA ATATGACCTT ATCTCAAGCG GTGTACTTGC 6660
AGATTGCATT GCATTTGGTA TGCCTGTTAT TGCTTTAAAA AATAAACAGT TAGTTAGCTA 6720
CTTTAAAAAG TATGGTGAGT TTGGATTTCT TTGTGACACT GTAAACGATA TGGCTGTTGC 6780
TGTTAGAGAA TTATCGAATA ACCCCAAGCT TATATTATCA TTCAAAGATG TTCTGAAAAA 6840
orf7的起始
AATAAGAAAA GACTTTGAGT TCGAGATGTT TAAATCAAGA ATGAATGAGA TAATTA
ATGA 6900
orf6的终止
AAAA
TAAGAT ATCATTCTAT ATTGCATATA TATATATAGC ACCAATAATA TTATCGTTGT 6960
ACTATATTTC AACAACAAAC TCATTATTAG GTGATTTTCG AACTTATAGT TATAAACTTG 7020
AATGGGAGTC TTCATTATTA TTCTTAATAT TGTATTTCAT CCCTTTAATT ATCATATTTT 7080
GTGTTGTGAA AATGACTGGA AAAATAAAGG TTGATACATT TGAGAGTATT AAACTTGAAA 7140
AGTTTGCATT TTATTCAATT ATTATAACAG GTCTGATTAC TCTTATATTC GGGGCAAATG 7200
CCATAGGCCA TCCCGCACAA ACAGGTATAG CTGGTGTAAT TATAAAAATA GCGAGCAAAT 7260
TAAATCCACT TGTGTTATTG CCATTATTAA CATTCACAAA TGTGTCGGTA AGAAAATTTT 7320
TTTTCTGTGC TGCAGTTGTT ATTTTTTATG GATATATGCA ACAATCTTTG CAAGGTATAT 7380
ATATTAGCGT TCTTTGTGCG GGGGCGTTTT TTTTACTGAA AGTTAGATTG AATGGCGCCA 7440
TATTCATCCT AATGCTTTTG TCGCCAATTA TATTTTTGGG GCCACTTCTT GATATTATAA 7500
CACACCTATA TACAATTAGA AATGAAATTC GTGGCGTTTC GTTTAGTGTT GAAGAAATTT 7560
TTTCACTAGC ACTTGGCCGT ATATCAACCA CGTCATCATT AATATATACT ATTAGTAATA 7620
GTTTTAATAC TACAGGAGTT TCGGACTACT TTGTTTTTGG TATTGTGATT GAACGTCTAA 7680
TTGGGGTGCA TATACTGGAT ACAGTTTCTC CTTCTCAAGT ATTCAATACA TATATACTTG 7740
GCGCTAATGC TGATTATAGT ATTTTTATGG GCTTGGCAGG TTTTTTGTAT TTTATTAAAG 7800
ACTTCACCTG CAGTGTTTAT TGTAAATGCT GCGTGTTTGA TCTTGGTACT GATTCTTATA 7860
TACTTGGCGC TAATGCTGAT TATAGTATTT TTATGGGCTT GGCAGGTTTT TTTGTATTTT 7920
TATTAAAGAC TTCACCTGCA GTGTTTATTG TAAATGCTGC GTGTTTGATC TTGGTACTGA 7980
TTCTTATATA CTTATTGATT CCAGTTAACA ATGTTAAATA TAGGACATCT GTTTTTTTTC 8040
TTATAATGTA TCTTCCATTT TTATCATTTG ATATTTGGGA GATTTCCATA GTTTTTCAAA 8100
orf7的终止 orf8的起始
CAATTATTAT CTGGCGAGTA TTTCTTTTGC TATCTAAGAT TTCTTTTGGG CTAAAA
TAAT 8160
GAAAAGTATT TTATTCGTAA TTCCTTCTAT GGCACCAGCG GGAGGGATAG AAAGAGTTGT 8220
TAGCACGATA ATTAATAAAA TAAGTAAATC ATATGATTGT TCAATCTTGA CTTTTGACGA 8280
TTTACCTTAT TTTTATCATG TCAATGATAA AATAATGAAA AGTAGTCTAA ATGTTGATTC 8340
TGTTCTTGAT ATGAAGAGTA GAGCTAGAAG AATTATCCAA GTATCTAAGC TAATACTTTT 8400
AGCGGTAATA AGGCTGAGAA AGCACTTTAA AAATAATAAT TATGACTATG TATATACGAC 8460
ACATCCTTTA AATCACTGTA TTCTATTACT GGCAGGAATA AATCATAAGA AAATTGTCAT 8520
TGGTGAACAT GGCGCTAATA ATAACTATAA CTTGATTTAT CGATTATTAA AAAGAGTGAC 8580
TTATAAATAT TGCCATGCTT ATTGTCTTCC AACAAGGAGT GATTATCTGT TTTACAGAGA 8640
AAAAGGATTG CCAGTTAAAT ATACGCCTCA TTACAAACCA GAACTGCCTT ATGAAATGCA 8700
TAAGCAAAAT AGCAAAACGA TATTGTGTGT TGGAAGACTA ACAGCTGATA AACAACATCT 8760
GTTGTTATTA AAGATGTGGA AAAATATAAT TAATGAAATC CCATTTGGAT GGACACTTCA 8820
TATTGTTGGT GATGGAGAGT TGAAACCAAT TCTTAAAGAT TTTATTAACG AAAACGGACT 8880
TAGTCAGTCA GTGAGATTAA GTGATTCGAC GAAGAATATT AGTAAATATT ATATTGATTC 8940
ATCTTTTTTT GCATTAACAT CAAAAAGTGA AGGATTTGGG ATGGTGATAC TTGAAGCTCT 9000
TTCATTTGGG TTACCTATCA TTTCATTCGA TTGCCCTTCT GGTCCGAGAG ACATGATTAA 9060
TGATAATAAT GGATTTCTTA TTCAGCCAGG AGATGAAGTA TTGTATCAAA ATACTCTTGT 9120
AAAATTAATT AAGCATGAAA AATTAAGAAA GAGCTTAACC TTAGGTGCCC TTGAATTTGC 9180
orf9的起始 orf8的终止
TGCGAATTGG AATGATGATA ACATAACAGA ACATTGGCGG GACATCTATA A
ATGAATATA 9240
TCAGTAATAA TTCCTGTTTA TAATGGTGCT GCAACCATCA TAGAGGCAAT TGACTCAGTA 9300
ATCAAACAAA AAATAGATGG AGATATAACA TACAATATTG AAATAATTGT AGTTAATGAT 9360
GGCTCGCAAG ATAATACGCT AAATATTTTA GCTCGTTACA TAGAGGAAAT AAAAGCTAAA 9420
AATATTAAGG TTATAAATAC AGAAAATGGT GGGGTTTCGT GTGCAAGAAA TATTGGTATT 9480
AAAGCTGCGA AATATGAATG GGTTGCTTTT CTTGATGCTG ATGATGTTTG GTGTGAAAAT 9540
AAATTAAGCA TTCAGATAAA ACATATCAAA TCCATTAAAT CTCCTGTTAA TTTTATTGGC 9600
TCAGCTCGTA ATCATGAAGA GCTATATTTA TATGGTAAAA AAATAACTTC ATTATATAAA 9660
GTTAAACCTC TGGACCTATT GATTAAAATT TTCCCTCAAA CTTCAACTGC ATTAGTAAAA 9720
AAGGAGGCTT TGCTTAATTG TGGGTTATAC GATGTTAATA TGACTCATTG TGAGGATGCA 9780
GACTTATGGA TCAGGATATG CTCACTGAAT GGTGGTTTTT ATTACCATCC AGAATCTACA 9840
GTTATTACAG GGGGAGGAAA GTATAATGTA GGTGTGTCTG GCTTGTCATC AGATTTAAAA 9900
AAAATGGAGG CCGGAATCTG CCAAATGTTA AGAAAAACAT ATTTGCGGGG TCAGATATCA 9960
TACTTTTCAT ACATATTTTT TTATATGTTT TACAAAGTTA AATATATAAG AAGATTGACA 10020
orf10的起始 orf9的终止
ATTGTGTGGA TTAGGAGGTT TAT
GTGATCT TCAAAATTAA GTGGTTATTT TCAGCGTTAA 10080
TACTTTCTTT TTTTCTGAAA AAAATATCAT TCCCATCATT TTTCGCTTTT CCTGTTTTTT 10140
TTAAAGGCTT GAGAAGAGTT TCCATTGGTA AACATGTTAG AATATTTCCG GGGTGTCGTT 10200
TCGAGACTCA TGGTACCGGT GAAATCATCA TAGAGGATGA TGTTTCAATT GCCCAAAATG 10260
TACATATTAC ATCAGGTACC AAACTAGTTA TCGGGCAAGG GACGTTGATA ACTGCTAATA 10320
GTTATATTAC ATCAATAGAT CATGATTATG AAACTATCGG AGTTCCTATC CCACGTCAGC 10380
ATCTAGATTA TAAAGAGACA CGTATTGGTA AAAATTGCTT TATCGGTATG GGGGTTGCTA 10440
TTCAGGCCGG TACAATTCTT GGAGAACAAT GTGTTGTCGG TGCTAACTCT GTTGTCAGAG 10500
orf11的起始
GAGTTTACCC TGACTATTGT GTAATAGCAG GTGTACCAGC GAAGATTATA AAAGTTT
ATG 10560
orf10的终止
ATAAAAACTC GGGAGAATGG ATTCGTGTC
T GATGTAAAGA ATGTACTGAT TTTTTGCCCA 10620
AAGTTTTTTA ATTACGACAT TAATATTCGG AATGCTGTCC AAAAAAATGG ATATACTGTA 10680
AGCTTATTTA ATGAGCGCCC TTTTGATAAT ATAATTGGGC GTGCTTTAAT AAGACTGGGT 10740
TTCGATTTTT TTTTGAAGCG TCAGATTTTT AAATATTACA AAAATATATA TGACAATATT 10800
TTTGCAGATA TAGATTATTT GATTGTGATA AATCCTGAAT GTATAACCCC TGAAATATTG 10860
GAGATTTATC GGAATAAATG CAATAATATC ATTGTATATA TGTGGGATTC ATTTGAAAAT 10920
AAACCGCAGG CAAAAAAACT CATACGACAC GCTGACTTAT TTTATACATT TGATCCAAAT 10980
GATGCAAAAA ATAACAACAT TATATTTAAA CCACTTTTTT ATACAAAAGC ATATCGTGAA 11040
ATCCCTTCTA AACCTCAACT TGAATACGAT ATTTCTTTCA TTGGTACTAT TCATTCATCT 11100
CGCTATCAAT ATGTTAAGTC TATAGCGACA GTAAAAAACA AATTTATATT TTTTTATTGT 11160
CCAAGTCTTT TTGTTTTTTT ATTTAAAAAA TATATTGCAA GAGAGATTGA ATGTATAAAA 11220
TTAAAGGACG TTTCTTTTAA ATCTTTAAGT GAAAGTGAGG TTTTAAATGT TATCAAAAGA 11280
TCAAGGTGTA TACTCGATGT TGTTCATCCA AAACAGAATG GACTAACAAT AAGAACTATT 11340
GAAGCGCTTG GGGCCAATAA AAAAATCATC ACAACTAATC GGAATGTCGT TAAATATGAT 11400
TTTTATAATC CTTCAAACAT ATTAGTTTTA GATGACACAG TGAATGATGT TGCTATTGCT 11460
AAGTTTATTA ATCAAGAGTA TGTACATCCT GATGACGAAA TATACCAGAG TTACTATATC 11520
orf11的终止 orf12的起始
GAAAACTGGG TTAAGGACTT ATTGAGAGAG
TAAATT
ATGA AGATTGTTCC TGTAGTATTA11580
GCTGGAGGTA GTGGTACAAG ACTTTGGCCA TTATCGAGAA CGATGTATCC TAAACAATTT 11640
CTGAAAATAT TTGGTCACAT GACCATGTTA CAAACCACTT TATCTAGAAT GAATAGTTTT 11700
CATGATGCAA CTGATGCTAT CGTTATATGT AATGAAGCTC ACCGTTTCGT GGTTGCTGAA 11760
CAGCTAAATC AGATTGATAA AAAAAGTACT ATCATTCTTG AACCTTGTGG CAGGAGTACA 11820
GCTCCTGCTG TCGCGTTAGC TGCTATGCAT ATTGTCGAAA CTATCAACGC TGATCAAGAC 11880
GTGCTATTGT TAGTTCTCCC GGCAGACCAT ATAATAAAAG ATCTAGACAC CTTTCATCAG 11940
GCCGTAAAAG TAGCTAGCTC CTTTGCATGT GGTGGGAAAC TTGTAACTTT TGGCATTCCT 12000
CCTCTAACAC CTGAGACCGG ATATGGTTAC ATTCAACGTG GTAATAGCAT TGGCACCGTA 12060
GAGGGAAGTG AATGCTTTGA GGTTTCTAAA TTTGTCGAAA AGCCAGACGT AAATACTGCA 12120
ACGCAATTTT TAAATGATTC CAATTACTAT TGGAATAGTG GTATGTTTAT GTTTAGCGCC 12180
CGAACTTATC TTGAAGAATT ACAAAAATAC TGTCCTGATA TTGTGAGTGT ATGTCAGAAG 12240
TCTTACGATA ATTCTGTCTG TGACTTGGAT TTTATCCGTA TTGATGAAAA ACAATTCTCG 12300
AATTGTCTGG ATTTATCTAT TGATTATGCT TTAATGGAGC ATACTAATGA GGCCATAGTT 12360
GTACCTATGG ATGGTGATTG GAGTGACGTG GGCTCTTGGG CATCATTATG GGATATAACT 12420
AATAAAGATA ATAACGGAAA TGTTCTTTGG GGCGATATAC TTACTAGAGA TAGTTCGAAT 12480
AATTATATCT ACGGTGAATC AGGACTTATT ACAACTCTGG GCGTTGAAGA TTTAGTCATA 12540
GTTCAAACAA AAGATGCTCT TCTTGTAGCT AATCGAAAAT CTGTTCAGGA TATTAAGCAA 12600
CTTGTTGAGC AATTAAAGTT ACGCGACAGA AGTGAATATT ATATTCATCG CGAGACTTAC 12660
CGACCTTGGG GTAAATGCGA TACCATTGAT AAAGGCAAAA GATACCAAGT GAAGAGAATT 12720
GAGGTTAAGC CTGGTGAAGG AATATCGTTG CAACTTCATC ATCATCGGTC TGAGCACTGG 12780
GTAGTTGTCT CTGGTACCGC AAAGATTACA ATTAATGGCG TTGAAAAAAT AATCAGTGAA 12840
AATGAATCCA TCTATATACC ACTAGGTGCC AAGCACTGTT TGGAAAACCC TGGAAAAATC 12900
ACACTCGAAT TAATCGAGAT ACGTTCAGGA AGTTATCTTG CTGAAGATGA CATAATTCGA 12960
orf13的起始 orf12的终止
TTTTTTGATA AAT
ATGGTAG GATA
TAACAA GGTTAATATA CTTATGCTAA TTTGTTTTAA13020
AGCCTATGAT ATTCGCGGAA AATTAGGCGA AGAACTGAAT GAAGATATCG CCTGGCGCAT 13080
TGGTCGCGCC TATGGCGAAT TTCTTAAACC GAAAACCATT GTGTTAGGCG GTGATGTCCG 13140
CCTCACCAGC GAAACCTTAA AACTGGCGCT GGCAAAAGGT TTACAGGATG CGGGCGTCGA 13200
TGTGCTGGAT ATCGGCATGT CCGGCACCGA AGAGATCTAT TTCGCCACTT TCCATCTCGG 13260
CGTCGATGGC GGTATCGAAG TCACCGCCAG CCATAATCCG ATGGATTACA ACGGCATGAA 13320
GCTGGTGCGC GAAGGTGCTC GCCCGATCAG CGGCGATACC GGACTGCGCG ACGTCCAGCG 13380
TCTGGCAGAA GCCAACGACT TCCCGCCTGT CGATGAAACA ACACGCGGTA GTTATCAGCA 13440
AATCAACCTG CGCGACGCCT ACATTGATCA CCTGTTCGGC TATATCAACG TCAAAAACCT 13500
CACGCCGCTC AAACTGGTGA TCAACTCAGG GAACGGCGCA GCGGGTCCGG TGGTGGACGC 13560
CATTGAAGCC CGCTTTAAAG CCCTCGGCGC ACCTGTGGAA TTGATCAAAG TGCACAACAC 13620
GCCGGACGGC AATTTCCCCA ATGGTATTCC TAATCCTTTG CTGCCGGAAT GTCGCGACGA 13680
CACTCGCAAT GCGGTCATCA AACACGGTGC GGACATGGGC ATTGCCTTTG ATGGCGATTT 13740
TGACCGCTGC TTCCTGTTTG ACGAAAAAGG GCAGTTTATC GAGGGCTACT ACATTGTCGG 13800
TTTGCTGGCA GAAGCGTTCC TCGAAAAAAA TCCCGGCGCG AAGATTATCC ACGATCCGCG 13860
TCTTTCCTGG AACACTGTCG ATGTGGTGAC TGCCGCAGGC GGCATACCGG TGATGTCGAA 13920
AACCGGACAC GCCTTTATTA AAGAACGGAT GCGCAAGGAA GACGCCATCT ACGGTGGCGA 13980
AATGAGCGCG CACCACTACT TCCGTGATTT TGCTTACTGC GACAGCGGCA TGATCCCGTG 14040
GCTGCTGGTC GCTGAACTGG TGTGCCTGAA AGAGAAAACG CTGGGCGAAC TGGTGCGCGA 14100
CCGGATGGCG GCGTTCCCGG CAAGCGGTGA GATCAACAGC AAACTGGCGC AACCCGTTGA 14160
GGCGATTAAC CGCGTGGAAC AGCACTTTAG CCGCGAGGCG CTGGCGGTGG ATCGTACTGA 14220
TGGCGTCAGC ATGACCTTTG CCGACTGGCG CTTTAACCTG CGCTCTTCCA ACACCGAACC 14280
GGTCGTACGC CTGAATGTGG AGTCGCGCGG TGATGTGCCG CTGATGGAAG AAAAAACACA 14340
orf13的终止
ATTAATTCTT GATTTACTCA GAAAT
TAAGT AGACTGAAGA ATGAGCGGTA CACAGGTTCA 14400
TATATAAAAT GTTAATGCTA TGAGTGTGAT AAAGCATATG TACCTCTATT CATCATGACT 14460
CTGTCTGAGT TAACATCTGC ATCACATTCA AGCCGCGCAA CCCCGCGGAG ACCACCACTG 14520
ACAGGAGTAA ACAATGTCAA AGCAACAGAT CGGCGTCGTC GGTATGGCAG TGATGGGACG 14580
CAACCTCGCG CTCAACATCG AAAGCCGTGG TTATACCGTC TCTATTTTCA ACCGCTCCCG 14640
TGAAAAGACG GAAGAAGTTA TTGCCGAAAA TCCAGGCAAG AAACTGGTTC CTTACTATAC 14700
GGTGAAAGAG TTCGTTGAAT CTCTTGAAAC GCCTCGTCGC ATCCTGTTAA TGGTGAAAGC 14760
AGGTGCGGGC ACGGATGCTG CTATTGATTC CCTGAAACCA TATCTCGATA AAGGCGATAT 14820
CATCATTGAT GGTGGTAATA CCTTCTTCCA GGACACCATT CGTCGTAACC GCGAGCTTTC 14880
TGCAGAAGGC TTTAACTTCA TCGGTACGGG TGTTTCCGGT GGTGAAGAGG GCGCGCTGAA 14940
AGGACCTTCT ATCATGCCTG GTGGGCAGAA AGAAGCCTAT GAACTGGTTG CTCCTATCCT 15000
GACCAAAATC GCCGCCGTGG CTGAAGATGG CGAACCGTGC GTTACCTATA TTGGTGCCGA 15060
TGGCGCAGGT CACTATGTGA AGATGGTTCA CAACGGTATT GAATACGGTG ATATGCAACT 15120
GATTGCTGAA GCCTATT 15137
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。