CN110835633B - 利用优化的基因密码子扩展系统制备ptc稳定细胞系及应用 - Google Patents

利用优化的基因密码子扩展系统制备ptc稳定细胞系及应用 Download PDF

Info

Publication number
CN110835633B
CN110835633B CN201810914299.XA CN201810914299A CN110835633B CN 110835633 B CN110835633 B CN 110835633B CN 201810914299 A CN201810914299 A CN 201810914299A CN 110835633 B CN110835633 B CN 110835633B
Authority
CN
China
Prior art keywords
trna
amino acid
unnatural amino
vector
synthetase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810914299.XA
Other languages
English (en)
Other versions
CN110835633A (zh
Inventor
夏青
杨琦
王宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN201810914299.XA priority Critical patent/CN110835633B/zh
Publication of CN110835633A publication Critical patent/CN110835633A/zh
Application granted granted Critical
Publication of CN110835633B publication Critical patent/CN110835633B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/66Microorganisms or materials therefrom
    • A61K35/76Viruses; Subviral particles; Bacteriophages
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/525Virus
    • A61K2039/5254Virus avirulent or attenuated
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/32011Picornaviridae
    • C12N2770/32311Enterovirus
    • C12N2770/32321Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/32011Picornaviridae
    • C12N2770/32311Enterovirus
    • C12N2770/32334Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein

Abstract

本发明属于生物制药领域,具体涉及PTC稳定细胞系制备方法及应用。基于基因密码子扩展/PTC扩展技术,利用正交的非天然氨基酸(UAA)和tRNA/氨酰tRNA合成酶通读提前终止密码子(PTC,UAG/UAA/UGA),并在蛋白质中定点引入非天然氨基酸。本发明进一步涉及稳定细胞系的应用,如包装复制缺陷型(PTC)病毒疫苗。

Description

利用优化的基因密码子扩展系统制备PTC稳定细胞系及应用
技术领域
本发明属于生物制药领域,具体涉及提前终止密码子(Premature terminationcodons,PTC)稳定细胞系、其制备方法及其用途。本发明的PTC稳定细胞系可基于基因密码子扩展技术,利用正交的非天然氨基酸(non-canonical Amino Acids,ncAAs)和tRNA/氨酰tRNA合成酶通读提前终止密码子(包含TAG、TAA和TGA),并在蛋白质中定点引入非天然氨基酸。本发明进一步涉及PTC稳定细胞系的用途,如包装复制缺陷型病毒疫苗等。
背景技术
PTC技术及其应用瓶颈
经过数年的研究,人们对原核生物核糖体的翻译机制已有较全面的理解,多种核糖体不同功能状态的晶体和电镜结构已得到解析,大多数氨酰tRNA合成酶的结构也已获得。基于这些研究成果,近年来发展起来了遗传密码子扩展的技术——在基因组中引入琥珀终止密码子(TAG),利用外源非天然氨基酸生物正交翻译系统来编码多种非天然氨基酸,并在生物活体内将其定点插入。到目前为止,这一技术已经将数种非天然氨基酸(包括亲和标记和光致异构化的氨基酸、羰基氨基酸和糖基化氨基酸)成功地定点表达在活细胞的蛋白质当中,赋予了这些蛋白质新颖的物理、化学和生理性质(L.Wang等,2001,Science 292:498-500;J.W.Chin等,2002,Journal of the American Chemical Society 124:9026-9027;J.W.Chin,&P.G.Schultz,2002,ChemBioChem 11:1135-1137)。这些研究表明,该技术可以有选择性将羰基、炔基和叠氮基团等特殊化学基团引入蛋白质中,实现蛋白质的定点特异修饰,改善蛋白质的性质。同时,该技术还可应用在活体生物体(如病毒、细菌等)的定点标记、定点修饰、复制的控制等方面(Si L等,2016,Science 354:1170-1173)。
PTC技术即为在病毒基因组中引入提前终止密码子(Premature terminationcodons,PTC),以控制病毒的复制、蛋白表达,使其依赖于外源非天然氨基酸的病毒疫苗开发技术。PTC技术真正应用于病毒疫苗的开发上,一个亟待解决的问题就是如何构建稳定整合且大量表达正交tRNA/氨酰tRNA合成酶/GFP报告基因的工程细胞。实现稳定整合正交tRNA/氨酰tRNA合成酶/GFP报告基因的工程细胞的构建,将大大促进PTC技术在病毒疫苗研发中的应用。但是目前的该工程细胞的构建技术仍存在以下难点:
首先由于tRNA的转录和加工有异于蛋白质,因此如何在真核细胞中实现正交的原核tRNA的高效稳定表达依旧是个国际难题;其次,按照传统的方法,同时稳定表达三个不同的外源基因元件的工程细胞,需要先后经过三轮基因转染或病毒转导以及相应的三种不同抗生素的筛选过程,由于在多种抗生素压力下细胞状态不佳、难以成活,同时筛选所用抗生素价格昂贵,造成细胞系构建过程繁琐,成功率低且成本高昂;目前成功构建的稳定整合正交tRNA/氨酰tRNA合成酶/GFP报告基因的工程细胞其细胞来源为人胚肾HEK293T细胞,该细胞适应性较强,但在病毒疫苗的拯救和开发过程中的应用局限于艾滋病毒和流感病毒,多数病毒在这种细胞系中的拯救效率较低,难以得到广泛应用;另外,传统的基因密码子扩展技术多局限于琥珀终止密码子(TAG),这是基于在研究基因密码子扩展技术的大肠杆菌模型中琥珀终止密码子(TAG)的使用频率最低而决定的,但是研究表明,某些病毒基因的密码子使用频率和宿主细胞不完全匹配,这也是PTC技术应用于研发病毒疫苗的又一局限。
Vero细胞在疫苗生产中的应用
1963年,日本千叶大学的Y.Yasumura和Y.Kawakita两位学者研制出Vero细胞系,来源于非洲绿猴(Cercopithecus aethiops)肾上皮细胞。1964年,Simizu博士将第93代的Vero细胞提供给英国的Tripical病毒实验室(NIAID,NIH)。1979年,第113代Vero细胞提供给美国标准菌种保藏中心(America Type Culture Collection,ATCC),传代至第121代建立细胞库。Vero细胞为连续细胞系,可在体外连续传代,并对多种病毒敏感,包括SV-40、SV-5、麻疹病毒、虫媒病毒、逆转录病毒、风疹病毒、猴病毒、腺病毒、脊髓灰质炎病毒、流感病毒、副流感病毒、呼吸道合胞病毒、牛痘病毒等多品种病毒。因此,Vero细胞制备后被就广泛应用实验室的相关生物学检测,如病毒扩增和空斑检测等。
Vero细胞用于疫苗研制发展是自二十世纪九十年代以来快速发展的,并得到世界卫生组织和我国生物制品规程批准认可。近十年,我国病毒性疫苗的研究也取得了快速发展,新型疫苗不断涌现。随着先进的细胞培养技术,如生物反应器、发酵罐细胞悬浮培养技术的推广应用,也使得更多的生产企业倾向选择Vero细胞进行病毒性疫苗的生产。
与用作疫苗生产的原代细胞、二倍体细胞和其他一些传代细胞基质相比,Vero细胞具有以下特点:①来源方便,可连续传代,生长速度快;②对多种病毒的感染敏感、病毒增殖滴度高;③遗传性状稳定,恶性转化程度低,生物安全性较高;④培养条件要求不苛刻,易于在生物反应器实施大规模培养。
发明内容
发明人经过对现有技术的思考和研究,为了应用PTC技术进行广泛的病毒疫苗研发、同时提高病毒的包装效率和将来工业化生产的可能,将可识别并通读提前终止密码子(包含TAG、TAA和TGA)的外源生物正交蛋白质翻译系统整合到Vero细胞基因组中。由于不同的生物正交翻译系统可插入的非天然氨基酸不同,其对于不同核酸序列的插入效率也不尽相同,因此发明人通过对现有文献研究,选择并优化了具有可改造的功能性非天然氨基酸且其插入效率相对较高的四种生物正交翻译系统如下:
1.来源于巴氏甲烷八叠球菌(Methanosarcina barkeri)的
Figure BDA0001762559430000041
(SEQ IDNO:1)和吡咯赖氨酰tRNA合成酶(MbPylRS_NAEK)(SEQ ID NO:2),非天然氨基酸N-ε-2-叠氮乙氧羰基-L-赖氨酸(N-ε-2-azidoethyloxycarbonyl-L-lysine,NAEK);
2.来源于马氏甲烷八叠球菌(Methanosarcina mazei)的
Figure BDA0001762559430000042
(SEQ ID NO:3)、四氯乙烯降解菌(Desulfitobacterium hafniense)的
Figure BDA0001762559430000043
(SEQ ID NO:4)和巴氏甲烷八叠球菌的吡咯赖氨酰tRNA合成酶(MbPylRS_eBK)(SEQ ID NO:5),非天然氨基酸N-ε-叔丁氧羰基赖氨酸(e-tBoc-lysine,eBK);
3.来源于大肠杆菌的
Figure BDA0001762559430000044
(SEQ ID NO:6)和嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)的
Figure BDA0001762559430000045
(SEQ ID NO:7)和氧甲基酪氨酰tRNA合成酶(OMeYRS)(SEQ ID NO:8),非天然氨基酸对乙酰苯丙氨酸(p-acetylphenylalanine,pAcF);
4.来源于大肠杆菌的
Figure BDA0001762559430000046
(SEQ ID NO:9)和亮氨酰tRNA合成酶(LeuRS)(SEQID NO:10),非天然氨基酸3-(6-乙酰萘基)氨基丙酸(3-(6-acetylnaphthalen-2-ylamino)-2-aminopropanoic acid,Anap)。
发明人应用目前唯一在脊椎动物体内有自主转座活性并可携带大片段DNA转座的DNA转座子系统Tol2,对应于每一种生物正交翻译系统,构建了一套带有真核细胞筛选常用的抗性标记例如潮霉素、博来霉素、嘌呤霉素(优选嘌呤霉素)抗性的、携带外源DNA的转座载体质粒,该载体携带正交的氨酰tRNA合成酶、具有一定拷贝数(例如12个或更多个拷贝数)的tRNA以及引入提前终止密码子的报告基因(例如以TAG为例,在Y39位引入提前终止密码子的报告基因GFP,SEQ ID NO:11)。通过将转座载体质粒与转座酶质粒共同电转染宿主细胞例如Vero细胞并使用本领域常规筛选方法例如使用嘌呤霉素进行筛选,使正交tRNA/氨酰tRNA合成酶/报告基因整合到宿主细胞中,建立了稳定表达正交tRNA/氨酰tRNA合成酶/报告基因(GFP)的特殊工程细胞系。该工程细胞系例如Vero工程细胞系能使特定功能性非天然氨基酸定点插入到特定病毒蛋白结构,从而能够得到定点突变、复制可控的PTC病毒疫苗。
相比于其它方法,本发明的优点可体现在如下中的一个或几个:
1.建立了一种通过一轮筛选稳定整合多个外源基因串联的长片段建立工程细胞系的方法,提高了多基因稳定整合细胞系构建的成功率,同时降低大量成本;
2.对应于每一种生物正交翻译系统,构建了一套同时携带高拷贝数正交tRNA、氨酰tRNA合成酶以及突变型EGFP报告基因的转座载体质粒;
3.对应于每一种生物正交翻译系统,获得了携带正交tRNA/氨酰tRNA合成酶/GFP报告基因的Vero细胞稳定细胞系Vero-Tol2-NAEK、Vero-Tol2-eBK、Vero-Tol2-pAcF和Vero-Tol2-Anap,通用名称为Vero-Tol2-ncAA;
4.稳定细胞系拓展了该系统可应用的病毒种类,可以实现在大多数的病毒蛋白任意位点引入非天然氨基酸,从而高效拯救PTC病毒,为PTC病毒疫苗的筛选创造条件;
5.利用稳定细胞系,可以在病毒蛋白上引入具有特定活性基团的非天然氨基酸,可以实现对病毒高效、特异性修饰的目的。
具体地,在本发明的一个具体的实施方案中,在宿主细胞Vero细胞中整合了正交tRNA/氨酰tRNA合成酶/GFP报告基因,主要通过以下步骤:(1)在Tol2-puro载体中连接氨酰tRNA合成酶,并用内部核糖体进入位点(Internal Ribosome Entry Site,IRES)连接突变型GFP报告基因,构建转座载体质粒Tol2-RS-IRES-*GFP-puro;(2)步骤(1)转座载体质粒Tol2-RS-IRES-*GFP-puro中连接12个拷贝数的Pol III启动子启动的tRNA,获得同时串联正交多拷贝tRNA、氨酰tRNA合成酶和GFP报告基因的转座载体质粒Tol-RS-IRES-*GFP-12tRNA-puro;(3)步骤(2)中得到的转座载体质粒Tol2-RS-IRES-*GFP-12tRNA-puro和pCMV-Tol2(SEQ ID NO:12)转座酶质粒共同电转染Vero细胞,在培养基中加入非天然氨基酸和嘌呤霉素抗生素进行筛选,挑取带有绿色荧光的单克隆,并扩大培养,获得同时整合了正交tRNA、氨酰tRNA合成酶基因和突变型GFP报告基因的稳定细胞系,继续用含有嘌呤霉素扩大培养,最终得到稳定细胞系Vero-Tol2-ncAA。
该稳定细胞系能在报告基因上插入特定功能性非天然氨基酸的原理在于,以非天然氨基酸NAEK为例,整合的突变型
Figure BDA0001762559430000061
/MbPylRS满足下列关系:(1)突变型的
Figure BDA0001762559430000062
不能利用宿主细胞的赖氨酰tRNA合成酶,只能被突变型的MbPylRS酰化;(2)突变型的MbPylRS只能酰化
Figure BDA0001762559430000063
不能酰化其它tRNA,因此,突变型
Figure BDA0001762559430000064
和MbPylRS之间的关系是正交性的,即突变型的MbPylRS只能酰化突变型
Figure BDA0001762559430000065
同时突变型的
Figure BDA0001762559430000066
只能被突变型的MbPylRS酰化,也就是说同一质粒中的突变型的
Figure BDA0001762559430000067
和MbPylRS是绝对的相互专一的。这种正交性的酶并且是只有这种酶可以把非天然氨基酸NAEK酰化到这种正交的tRNA上,并且只能酰化这种tRNA,而不能酰化其它的tRNA。获得的正交
Figure BDA0001762559430000068
/MbPylRS系统,使非天然氨基酸NAEK与相应的提前终止密码子相对应,从而将非天然氨基酸NAEK定点引入到报告蛋白GFP或其它目的蛋白上。
更为具体地,本发明提供了:
1.四种功能性非天然氨基酸生物正交翻译系统的转座载体质粒,分别是
(1)NAEK系统Tol2-MbPylRS-IRES-*GFP-12
Figure BDA0001762559430000069
-puro(S EQ ID NO:13),
(2)eBK系统Tol2-MbPylRS-IRES-*GFP-6
Figure BDA00017625594300000610
–puro(SEQ IDNO:14),
(3)pAcF系统Tol2-OMeYRS-IRES-*GFP-6
Figure BDA00017625594300000611
-puro(SEQ IDNO:15),
(4)Anap系统Tol2-LeuRS-IRES-*GFP-12
Figure BDA00017625594300000612
-puro(SEQ ID NO:16);这些载体携带嘌呤霉素抗性基因,可用于进行包含这四种正交翻译系统的任意真核细胞系的筛选和构建。
2.稳定细胞系Vero-Tol2-NAEK,该细胞系由1轮质粒稳定电转染获得,携带有正交的突变型
Figure BDA0001762559430000071
/MbPylRS基因,利用该稳定细胞系,可以在目的病毒蛋白质任意位点引入非天然氨基酸NAEK,从而高效率拯救定点突变的PTC病毒疫苗。
3.稳定细胞系Vero-Tol2-eBK,该细胞系由1轮质粒稳定电转染获得,携带有正交的突变型
Figure BDA0001762559430000072
/MbPylRS基因,利用该稳定细胞系,可以在目的病毒蛋白质任意位点引入非天然氨基酸eBK,从而高效率拯救定点突变的PTC病毒疫苗。
4.稳定细胞系Vero-Tol2-pAcF,该细胞系由1轮质粒稳定电转染获得,携带有正交的突变型
Figure BDA0001762559430000073
/OMeYRS基因,利用该稳定细胞系,可以在目的病毒蛋白质任意位点引入非天然氨基酸pAcF,从而高效率拯救定点突变的PTC病毒疫苗。
5.稳定细胞系Vero-Tol2-Anap,该细胞系由1轮质粒稳定电转染获得,携带有正交的突变型
Figure BDA0001762559430000074
/LeuRS基因,利用该稳定细胞系,可以在目的病毒蛋白质任意位点引入非天然氨基酸Anap,从而高效率拯救定点突变的PTC病毒疫苗。
6.制备含有特定功能性非天然氨基酸的目的蛋白(例如EGFP)的方法,包括步骤:
(1)获得携带有与特定功能性非天然氨基酸的相应的突变型正交tRNA/氨酰tRNA合成酶基因的稳定细胞系Vero-Tol2-ncAA。
(2)选择位点:在目的蛋白的氨基酸序列中选择期望突变的一个或多个特定氨基酸位点;
(3)基因突变:将编码对应于(2)中选择的位点的目的蛋白的氨基酸的密码子用基因工程方法突变为提前终止密码子UAG、UAA或UGA;
(4)表达载体构建:将(3)基因突变步骤得到的突变的目的蛋白的编码序列与合适的载体可操作地连接,得到突变序列表达载体;
(5)蛋白表达:将步骤(4)得到的突变序列表达载体转染到步骤(1)中的稳定细胞系Vero-Tol2-ncAA中,将转染成功后的宿主细胞在含有相应功能性非天然氨基酸的培养基中培养,在适当的时间收集细胞;
(6)裂解细胞,检测含有非天然氨基酸的目的蛋白(例如GFP)蛋白表达量。
7.制备含有特定功能性非天然氨基酸的复制缺陷型PTC病毒疫苗方法,包括步骤:
(1)获得携带有与特定功能性非天然氨基酸的相应的突变型正交tRNA/氨酰tRNA合成酶基因的稳定细胞系Vero-Tol2-ncAA。
(2)在病毒目的蛋白的氨基酸序列中选择期望突变的一个氨基酸位点;
(3)在步骤(2)所述的目的蛋白的核酸分子中将步骤(2)中所选择的位点的氨基酸的密码子突变为提前终止密码子UAG、UAA或UGA;
(4)将步骤(3)中得到的突变的核酸与合适的载体可操作地连接,得到核酸的表达载体;
(5)将步骤(4)得到的突变的核酸的表达载体转染步骤(1)所述的细胞系,将转染成功后的宿主细胞在含有相应功能性非天然氨基酸的培养基中培养,在适当的时间收集病毒;
(6)检测病毒的包装滴度和活性。
在一个方面,本发明提供一种用于在蛋白质或肽的任意位点引入非天然氨基酸的细胞系,其特征在于所述细胞系携带有吡咯赖氨酰-tRNA合成酶基因和源自古甲烷球菌的tRNA(tRNAPyl)。
在一个实施方案中,其中所述的tRNAPyl是多个拷贝数的启动子-tRNA Pyl。
在又一个实施方案中,其中所述的tRNAPyl是12个拷贝数的type-3Pol III启动子启动的tRNAPyl
在一个实施方案中,其中所述的吡咯赖氨酰-tRNA合成酶基因如SEQ ID NO:2所示。
在又一个实施方案中,其中所述的tRNAPyl来自于序列如SEQ ID NO:13所示的载体12tRNA。
在一个实施方案中,其中所述细胞系是通过下述的步骤获得的:
(1)在tol2-puro上连接吡咯赖氨酸氨酰-tRNA合成酶基因和IRES连接突变的绿色荧光蛋白基因,获得携带的转座子载体Tol2-pylRS-IRES-*GFP-puro;
(2)在Tol2-pylRS-IRES-*GFP-puro上连接12个拷贝数的type-3 Pol III启动子启动的tRNAPyl,获得病毒载体Tol2-pylRS-IRES-*GFP-12tRNA-puro;
(3)将(2)中所述的转座子载体tol2-pylRS-IRES-*GFP-12tRNA-puro,转导Vero细胞,用嘌呤霉素筛选,在培养基中加入非天然氨基酸,挑取带有绿色荧光的单克隆,并扩大培养,最终得到稳定细胞系,获得整合了吡咯赖氨酸-tRNA合成酶基因、突变型绿色荧光蛋白报告基因和12个拷贝数tRNA Pyl的稳定细胞系。
在又一个方面,本发明提供利用本发明的稳定细胞系制备含有非天然氨基酸的复制缺陷型(PTC)病毒疫苗方法,包括步骤:
(1)在病毒目的蛋白的氨基酸序列中选择期望突变的一个氨基酸位点;
(2)在编码(1)所述的目的蛋白的核酸分子中将(1)中所选择的位点的氨基酸的密码子突变为终止密码子UAG、UAA或UGA;
(3)将(2)中得到的突变的核酸与合适的载体可操作地连接,得到核酸的表达载体;
(4)将(3)得到的突变的核酸的表达载体转染权利要求1-5中任一项所述的细胞系,将转染成功后的宿主细胞在含有非天然氨基酸的培养基中培养,在适当的时间收集病毒;
(5)检测病毒的包装滴度和活性。
在一个实施方案中,本发明所获得的定点突变的病毒,其特征在于将选自病毒至少一个蛋白的至少一个位点的氨基酸突变为非天然氨基酸,所述非天然氨基酸选自:
Figure BDA0001762559430000101
(I)所示的Lys-diazirine,
Figure BDA0001762559430000102
(II)所示的Lys-azido,或其它含有双吖丙啶、叠氮结构的非天然氨基酸中的至少1种。
在另一个实施方案中,本发明所获得的定点突变的病毒,其中所述的非天然氨基酸是位于第N位的Lys-diazirine,其在病毒蛋白中的连接方式如下式所示:
Figure BDA0001762559430000103
其中,由R1到R2的方向为氨基酸序列的N末端到C末端方向,第N位可以是病毒的蛋白中的任意一位,相应地,R1为第1至第N-1位氨基酸残基,R2为第N+1位至C末端的氨基酸残基,
R3
Figure BDA0001762559430000104
在又一个实施方案中,本发明所获得的定点突变的病毒,其中所述的非天然氨基酸是位于第N位的Lys-azido,其在病毒蛋白中的连接方式如下式所示:
Figure BDA0001762559430000105
其中,由R1到R2的方向为氨基酸序列的N末端到C末端方向,第N位可以是病毒的蛋白中的任意一位,相应地,R1为第1至第N-1位氨基酸残基,R2为第N+1位至C末端的氨基酸残基,
R4
Figure BDA0001762559430000111
在另一方面,本发明提供突变蛋白或肽的核酸分子。
在一个实施方案中,本发明提供的突变病毒蛋白或肽的核酸分子,其特征在于编码非天然氨基酸的密码子为终止密码子UAG、UAA或UGA。
在又一方面,本发明提供使用本发明的方法制备的含有定点突变的病毒。
在另一方面,本发明提供含有有效量的本发明的定点突变的病毒的组合物。
在又一方面,本发明提供含有有效量的本发明的定点突变的病毒的疫苗。
在另一方面,本发明提供药物组合物,其含有有效量的本发明的定点突变的病毒,以及药学上可接受的赋形剂。
在又一方面,本发明提供本发明的定点突变的病毒在制备减毒活疫苗、制备预防和治疗病毒感染相关药物中的用途。
在另一方面,本发明提供本发明的定点突变的病毒在预防和治疗感染中的用途。
在一方面,本发明提供生物正交翻译系统,所述系统包含:正交的tRNA和氨酰tRNA合成酶;所述tRNA来源于原核生物,其反密码子环对应于提前终止密码子;所述氨酰tRNA合成酶能够将非天然氨基酸与所述tRNA结合;其中所述tRNA和氨酰tRNA合成酶位于同一载体上。
在一个实施方案中,所述载体是转座载体;在一个实施方案中,该转座载体是Tol2转座载体。
在另一个实施方案中,所述tRNA为来源于巴氏甲烷八叠球菌(Methanosarcinabarkeri)的
Figure BDA0001762559430000112
所述氨酰tRNA合成酶为来源于巴氏甲烷八叠球菌的吡咯赖氨酰tRNA合成酶(MbPylRS_NAEK);在一个实施方案中,所述
Figure BDA0001762559430000113
为SEQ ID NO:1,所述MbPylRS_NAEK为SEQ ID NO:2;或者,所述tRNA为来源于马氏甲烷八叠球菌(Methanosarcina mazei)的
Figure BDA0001762559430000121
或来源于四氯乙烯降解菌(Desulfitobacteriumhafniense)的
Figure BDA0001762559430000122
所述氨酰tRNA合成酶为来源于巴氏甲烷八叠球菌的吡咯赖氨酰tRNA合成酶(MbPylRS_eBK);在一个实施方案中,
Figure BDA0001762559430000123
为SEQ ID NO:3,所述MbPylRS_eBK为SEQ ID NO:5;在一个实施方案中,所述
Figure BDA0001762559430000124
为SEQ ID NO:4,所述MbPylRS_eBK为SEQ ID NO:5;或者,所述tRNA为来源于大肠杆菌的
Figure BDA0001762559430000125
或来源于嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)的
Figure BDA0001762559430000126
所述氨酰tRNA合成酶为来源于嗜热脂肪芽孢杆菌的氧甲基酪氨酰tRNA合成酶(OMeYRS);在一个实施方案中,所述
Figure BDA0001762559430000127
为SEQID NO:6,所述OMeYRS为SEQ ID NO:8;在一个实施方案中,所述
Figure BDA0001762559430000128
为SEQ ID NO:7,所述OMeYRS为SEQ ID NO:8;或者,所述tRNA为来源于大肠杆菌的
Figure BDA0001762559430000129
所述氨酰tRNA合成酶为来源于大肠杆菌的亮氨酰tRNA合成酶(LeuRS);在一个实施方案中,所述
Figure BDA00017625594300001210
为SEQ ID NO:9,所述LeuRS为SEQ ID NO:10。
在又一个实施方案中,本发明的生物正交翻译系统还包含非天然氨基酸和真核细胞;在一个实施方案中,非天然氨基酸选自NAEK、eBK、pAcF、Anap或其组合;在一个实施方案中,真核细胞选自293T、BHK-21、MDCK、RD、Vero或CHO细胞。
在另一方面,本发明提供真核细胞,其包含:正交的tRNA和氨酰tRNA合成酶;所述tRNA来源于原核生物,其反密码子环对应于提前终止密码子;其中所述氨酰tRNA合成酶能够将非天然氨基酸与所述tRNA结合;其中所述tRNA和氨酰tRNA合成酶以位于同一载体的方式导入所述真核细胞。
在一个实施方案中,所述载体是转座载体;在一个实施方案中,该转座载体是Tol2转座载体。
在又一个实施方案中,所述tRNA为来源于巴氏甲烷八叠球菌的
Figure BDA00017625594300001211
所述氨酰tRNA合成酶为来源于巴氏甲烷八叠球菌的吡咯赖氨酰tRNA合成酶(MbPylRS_NAEK);在一个实施方案中,所述
Figure BDA0001762559430000131
为SEQ ID NO:1,所述MbPylRS_NAEK为SEQ ID NO:2;或者,所述tRNA为来源于马氏甲烷八叠球菌的
Figure BDA0001762559430000132
或来源于四氯乙烯降解菌的
Figure BDA0001762559430000133
所述氨酰tRNA合成酶为来源于巴氏甲烷八叠球菌的吡咯赖氨酰tRNA合成酶(MbPylRS_eBK);在一个实施方案中,
Figure BDA0001762559430000134
为SEQ ID NO:3,所述MbPylRS_eBK为SEQ ID NO:5;在一个实施方案中,所述
Figure BDA0001762559430000135
为SEQ ID NO:4,所述MbPylRS_eBK为SEQ ID NO:5;或者,所述tRNA为来源于大肠杆菌的
Figure BDA0001762559430000136
或来源于嗜热脂肪芽孢杆菌的
Figure BDA0001762559430000137
所述氨酰tRNA合成酶为来源于嗜热脂肪芽孢杆菌的氧甲基酪氨酰tRNA合成酶(OMeYRS);在一个实施方案中,所述
Figure BDA0001762559430000138
为SEQ ID NO:6,所述OMeYRS为SEQ ID NO:8;在一个实施方案中,所述
Figure BDA00017625594300001312
为SEQ ID NO:7,所述OMeYRS为SEQ ID NO:8;或者,所述tRNA为来源于大肠杆菌的
Figure BDA00017625594300001310
所述氨酰tRNA合成酶为来源于大肠杆菌的亮氨酰tRNA合成酶(LeuRS);在一个实施方案中,所述
Figure BDA00017625594300001311
为SEQ ID NO:9,所述LeuRS为SEQ ID NO:10。
在另一个实施方案中,本发明的真核细胞选自293T、BHK-21、MDCK、RD、Vero或CHO细胞。
在又一方面,本发明提供制备本发明的真核细胞的方法,其包括:
(1)提供在同一载体中包含tRNA和氨酰tRNA合成酶的载体;在一个实施方案中,所述载体是转座载体;在一个实施方案中,该转座载体是Tol2转座载体;
(2)将包含tRNA和氨酰tRNA合成酶的载体导入真核细胞;
(3)获得稳定整合tRNA和氨酰tRNA合成酶基因的真核细胞。
在另一方面,本发明提供制备含有非天然氨基酸的目的蛋白的方法,其包括:
(1)在目的蛋白的氨基酸序列中选择期望导入非天然氨基酸的一个或多个氨基酸位点;
(2)将目的蛋白中编码步骤(1)中所选择的氨基酸位点的密码子突变为提前终止密码子;
(3)将编码突变的目的蛋白的基因导入本发明的真核细胞;
(4)在含有非天然氨基酸的培养基中培养导入了编码突变的目的蛋白的基因的真核细胞,使含有非天然氨基酸的目的蛋白得到表达;
(5)收获表达的含有非天然氨基酸的目的蛋白。
在一个实施方案中,所述非天然氨基酸选自NAEK、eBK、pAcF、Anap或其组合。
在另一方面,本发明提供制备含有非天然氨基酸的复制缺陷型PTC病毒的方法,其包括:
(1)在病毒目的蛋白的氨基酸序列中选择期望突变的一个或多个氨基酸位点;
(2)在编码(1)所述的目的蛋白的核酸分子中将(1)中所选择的位点的氨基酸的密码子突变为提前终止密码子UAG、UAA或UGA;
(3)将(2)中得到的突变的核酸与合适的载体可操作地连接,得到核酸的表达载体;
(4)将(3)得到的突变的核酸的表达载体转染本发明的真核细胞,将转染成功后的真核细胞在含有非天然氨基酸的培养基中培养,在适当的时间收集病毒;
(5)检测病毒的包装滴度和活性。
在一个实施方案中,非天然氨基酸选自NAEK、eBK、pAcF、Anap或其组合。
在又一方面,本发明提供使用本发明的制备方法制备的复制缺陷型PTC病毒。
在另一方面,本发明提供药物组合物,其含有有效量的本发明的复制缺陷型PTC病毒以及药学上可接受的赋形剂。
在又一方面,本发明提供本发明的复制缺陷型PTC病毒在制备减毒活疫苗、制备预防和治疗病毒感染相关药物中的用途。
在另一方面,本发明提供本发明的复制缺陷型PTC病毒在预防和治疗感染中的用途。
附图说明
本发明采用以下附图来举例说明本发明的有益效果。应当理解的是,这些仅用于说明本发明的具体实施方案,并不意图限制本发明的范围。
图1:Tol2-PylRS-IRES-*GFP-12tRNA-puro转座载体和pCMV-Tol2转座酶质粒结构示意图
图2:筛选稳定细胞系的流程(非天然氨基酸NAEK为例)
携带有突变型正交
Figure BDA0001762559430000151
/MbPylRS基因的稳定细胞系Vero-Tol2-NAEK通过1轮筛选获得,将Tol2-MbPylRS-IRES-*GFP-12
Figure BDA0001762559430000152
-puro转座载体质粒和pCMV-Tol2转座酶质粒共同电转染Vero细胞,用浓度为5μg/ml的嘌呤霉素进行筛选,在培养基中加入非天然氨基酸NAEK,挑取带有绿色荧光的单克隆,并扩大培养,获得同时整合了正交
Figure BDA0001762559430000153
MbPylRS基因和突变型GFP报告基因的稳定细胞系,继续用5μg/ml的嘌呤霉素扩大培养,最终得到稳定细胞系Vero-Tol2-NAEK。
图3:稳定细胞系的鉴定
A:稳定细胞系培养中加入的四种功能性非天然氨基酸结构示意图;
B:
Figure BDA0001762559430000154
在Vero-Tol2-NAEK细胞中基因拷贝数标准曲线;
C:稳定细胞系加入(+NAEK)/未加入(-NAEK)非天然氨基酸后的绿色荧光蛋白成像,只有加入非天然氨基酸后,才能使带有提前终止密码子突变的GFP基因通读;在未加入非天然氨基酸10天的细胞中再次加入非天然氨基酸(-+NAEK)后,荧光成像显示提前终止密码子重新被通读;
D:蛋白质印迹检测稳定细胞系加入/未加入非天然氨基酸后正交氨酰tRNA合成酶和绿色荧光蛋白的表达,加入/未加入非天然氨基酸均可以检测到氨酰tRNA合成酶的表达,而只有加入非天然氨基酸后,才能检测到全长的绿色荧光蛋白。
具体实施方式
为了促进对本发明的理解,以下将参考某些实施方式,并且将使用特定语言来描述本发明。然而,应当理解的是,这些具体实施方式不意图限制本发明的范围。所描述的实施方式中的任何改变和进一步的修改,以及本发明的任何进一步应用,均为本领域技术人员通常会想到的。何与本发明等价的变体或者实施方案都包括在本发明中。
除非特别说明,本发明采用的试剂、方法和设备为本技术领域常规试剂、方法和设备。
除非特别说明,本发明实施例所用培养基和试验条件为本领域常规培养基和试验条件。除非特别说明,本发明实施例所用试剂均为市购。
下述实施例中,所述百分含量如无特别说明,均为质量百分含量。
实施例1:Tol2-RS-IRES-*GFP-12tRNA-puro转座载体的构建及获得
为了保证生物正交的tRNA和氨酰-tRNA合成酶的表达量、阳性细胞的筛选效率以及基因的整合效率,需要将多拷贝串联表达的启动子-tRNA、pylRS和单点突变的GFP报告基因克隆到一个转座载体上。
因此,发明人设计了如图1中左图所示的Tol2-RS-IRES-*GFP-12tRNA-puro转座载体,首先在Tol2-puro转座子载体中引入CAG启动子启动的氨酰tRNA合成酶,并用内部核糖体进入位点连接引入提前终止密码子的突变型GFP报告基因;同时设计了12个拷贝数的PolIII启动子启动的tRNA,并将多拷贝串联的tRNA片段交付北京百奥赛图基因生物技术有限公司(Beijing Biocytogen Co.,Ltd.)进行基因合成,合成完成后克隆至转座载体中即获得同时串联正交多拷贝tRNA、氨酰tRNA合成酶和GFP报告基因的转座载体质粒Tol-RS-IRES-*GFP-12tRNA-puro。
实施例2:Vero-Tol2-NAEK稳定细胞系的筛选
(1)制备细胞悬液:
Vero细胞(ATCC,CCL-81)用完全培养基(MEM,Gibco,11095080;10%胎牛血清,PAN,P30-3302;1%青/链霉素,Macgene,CC004)培养至汇合度为70%~80%时消化、收集细胞,用Opti-MEM(Gibco,31985070)漂洗三次,以洗去培养基中的抗生素和血清,然后用Opti-MEM重悬,上下吹打细胞使之无结团,取少量悬液进行细胞计数并算出总细胞数量。
(2)制备细胞和质粒的混合液:
将一定量的细胞与质粒DNA混合,充分混匀,使其最终浓度达到每管100μl混合液中含有1×106细胞和10μg质粒DNA(转座载体与转座酶质粒DNA比例为3:2),其中细胞体积为90μl,质粒DNA体积为10μl。
(3)电转实验参数设置:
使用NEPA21高效基因转染系统(NEPA GENE,Japan)和EC-002S中号电转杯进行实验,电转仪参数如表1所示:
表1.Vero细胞质粒电转染程序参数
Figure BDA0001762559430000171
(4)电转实验:
将细胞/DNA混合液分装至电转杯中,100μl/杯,并做好标记;敲打电转杯,清除体系内的气泡后将电转杯放入电转杯腔;按下“Ω”键,测定并记录电阻值(测量得到的电阻值应处于30-50Ω之间);按下“start”键,执行电转程序;电转程序结束后迅速取出电转杯,用配备的吸管,从预先准备好的10cm培养皿中吸取少量培养基(约200-300μl)加入电转杯中轻微吹打2-3下,然后将悬液全部吸出,加入到10cm培养皿中;一个10cm培养皿需要重复电转5-7次以达到筛选所需细胞量。
(5)抗生素筛选:
质粒电转48小时后换液,并加入非天然氨基酸NAEK和嘌呤霉素抗生素筛选,筛选浓度要根据具体细胞的杀伤曲线来决定,Vero细胞嘌呤霉素筛选浓度为5μg/ml;隔天换液,抗生素筛选10天,直至电转野生型EGFP质粒的空白组全部死亡,电转转座子系统转座载体和转座酶的实验组形成克隆;经过多轮流式细胞分选分离纯化GFP阳性克隆,扩大培养得到稳定细胞系Vero-Tol2-NAEK。
实施例3:Vero-Tol2-ncAA稳定细胞系的鉴定(以Vero-Tol2-NAEK为例)
本发明中构建的稳定细胞系Vero-Tol2-NAEK中含有源自巴氏甲烷八叠球菌的tRNA
Figure BDA0001762559430000181
和吡咯赖氨酰-tRNA合成酶(MbPylRS),在稳定细胞系的蛋白表达中,以提前终止密码子(包含TAG、TAA和TGA)为有义编码子,能够使非天然氨基酸NAEK掺入到蛋白中。下面,发明人对NAEK的掺入可能性和突变蛋白质的生产性能进行了检测。
(1)非天然氨基酸NAEK的合成和鉴定:
非天然氨基酸NAEK的化学合成反应式如下:
Figure BDA0001762559430000182
如上式所述,将原料1(2-溴乙醇)2.3mL溶于90mL丙酮以及15mL水的混合溶液,加入NaN3 3.12g,60℃油浴加热回流反应20h。冷却至室温,旋蒸除去丙酮,无水乙醚萃取(30mL×8),无水Na2SO4干燥,旋蒸除去溶剂得2.62g无色液体产物2。
将产物2(500mg,5.74mmol)加入到三光气(1.70g,5.74mmol)的THF(10ml)溶液中。0℃搅拌反应8h,溶剂蒸干。剩余物在真空下干燥1h,得到无色油状产物3。
将3溶解在1.5ml的THF中并缓慢加入Boc-Lys-OH(1.7g,6.88mmol)的1M NaOH(20ml)/THF(5ml)的溶液中。0℃搅拌反应12h并逐渐升温到室温。重新将反应液冷却到0℃并用0℃的1M的盐酸溶液将反应液pH值调整至2~3。反应液用EtOAc萃取(30mL×5),有机层用2×100ml的饱和食盐水洗涤。无水Na2SO4干燥有机层、过滤、旋蒸除去溶剂得到1.65g无色粘稠液体产物4不用进一步纯化。
将4溶于15mL CH2Cl2中,搅拌下缓慢滴加15mL TFA,室温下反应30min后蒸出溶剂,剩余液体产物用5mL甲醇溶解,加入100mL乙醚,析出大量白色固体沉淀,过滤干燥得到1.38g白色固体终产物5。1H NMR(D2O):δ=1.22-1.45(m,4H),1.67-1.73(m,2H),2.99(m,2H),3.38(m,2H),3.70(m,1H),4.09(m,2H).13C NMR(D2O):δ=21.4,28.4,29.6,39.5,53.4,56.2,57.8,116.0(TFA),153.1,162.3(TFA),172.9.HRMS:m/z calcd for C9H17N5O4[M]+:259.1281;found:259.1283,证明得到的NAEK结构(图3A)正确。
(2)
Figure BDA0001762559430000191
在Vero-Tol2-NAEK细胞中基因拷贝数的检测:
a.标准曲线的建立:
将含有外源转座载体质粒Tol2-MbPylRS-IRES-*GFP-12
Figure BDA0001762559430000192
-puro与Vero细胞的基因组DNA混合,设置含有12个、24个、48个、96个及192个外源基因质粒拷贝数的标准品对照,方法如下:
①假设Vero细胞的基因组DNA用量为x ng;
②含有外源基因的质粒的大小为y bp;
③Vero细胞的基因组DNA大小为2.97Gb;
④每个转座载体质粒中都有12个
Figure BDA0001762559430000201
串联,外源基因片段完全随机的头尾相连的插入在一条染色体上,则
Figure BDA0001762559430000202
Figure BDA0001762559430000203
⑤设计引物分别扩增转座载体质粒上的12-tRNAPyl以及管家基因是甘油醛-3-磷酸脱氢酶(Glyceraldehyde-3-phosphate dehydrogenase,GAPDH)基因片段,应用
Figure BDA00017625594300002011
qPCR Master Mix(Promega,A6001)和Stratagene Mx3005PTM Real-Time PCR扩增仪进行实验,每个样品做三次重复,PCR反应体系如表2所示,反应结果取平均C(t),数值用Mean±SD表示。将C(t)12-tRNAPyl-C(t)GAPDH得到ΔC(t),再对样品拷贝数除以12后以2为底的对数值即
Figure BDA0001762559430000205
作图,得到绝对定量标准曲线(图3B)。
b.
Figure BDA0001762559430000206
实时荧光定量PCR检测
按照天根基因组DNA提取试剂盒(DP304,天根生化科技(北京)有限公司)提取待检测细胞基因组DNA,设计引物分别扩增外源基因12-tRNAPyl以及管家基因GAPDH基因片段。应用
Figure BDA00017625594300002012
qPCR Master Mix(Promega,A6001)和Stratagene Mx3005PTM Real-TimePCR扩增仪进行实验,每个样品做三次重复,PCR反应体系如表2所示,反应结果取平均C(t),数值用Mean±SD表示。得到的外源基因C(t)代入标准曲线中可计算得到外源基因
Figure BDA0001762559430000208
的拷贝数。
表2.外源基因12-
Figure BDA0001762559430000209
的检测PCR反应体系
Figure BDA00017625594300002010
(3)吡咯赖氨酰-tRNA合成酶(MbPylRS)表达鉴定:
本发明中构建的稳定细胞系Vero-Tol2-NAEK中含有源自巴氏甲烷八叠球菌的吡咯赖氨酰-tRNA合成酶(MbPylRS),在Vero-Tol2-NAEK的培养过程中加入或不加NAEK至终浓度1mM,37℃,5%CO2表达48小时后裂解细胞,进行免疫印迹实验检测,结果如图3D所示。由此结果可见,加入或不加非天然氨基酸,均能检测到吡咯赖氨酰-tRNA合成酶的表达。
(4)突变型绿色荧光蛋白的NAEK掺入表达鉴定:
本发明中构建的稳定细胞系Vero-Tol2-NAEK中含有引入提前终止密码子的绿色荧光蛋白的突变型,在Vero-Tol2-NAEK的培养过程中加入或不加入NAEK至终浓度1mM,37℃,5%CO2表达48小时后荧光显微镜观察绿色荧光蛋白的表达,并裂解细胞进行免疫印迹实验检测,结果如图3C和图3D所示。由此结果可见,加入非天然氨基酸后,才能检测到全长有活性的突变型绿色荧光蛋白的表达;且在未加入非天然氨基酸10天的细胞中再次加入非天然氨基酸后,荧光成像显示提前终止密码子重新被通读,突变型绿色荧光蛋白表达。
实施例4:非天然氨基酸依赖的PTC EV71病毒疫苗的拯救
(1)野生型EV71病毒的质粒获得
基于人肠道病毒EV71国内流行株AH/08/06(Genbank登录号:HQ611148.1),利用莫洛尼氏鼠白血病毒逆转录酶(M-MLV Reverse Transcriptase,Invitrogen,C28025011)和高保真DNA聚合酶(NEB,M0536L),将病毒基因组进行全长RT-PCR扩增,同时在基因组5’端上游引入SP6启动子序列和SnaBⅠ单克隆位点,在3’端polyA下游引入MluⅠ单克隆位点。然后将全长基因组经双酶切后克隆至基于pBR22载体改造的pEV载体,经酶切鉴定及核酸序列测定验证,构建了EV71基因组全长感染性cDNA克隆EV71-A12。
(2)复制缺陷位点的选择
通过生物信息学工具Consurf对EV71病毒各个蛋白的氨基酸的保守性进行分析,同时根据已被解析的流感病毒蛋白的晶体结构(VP1-VP3-PDB:3VBF;2A-PDB:4FVB;2C-PDB:5GRB;3C-PDB:4GHQ;3D-PDB:3N6L),保持其重要的功能结构域的完整性。从中选择不影响蛋白功能的保守、相对保守、相对不保守、不保守的氨基酸位点进行突变。
(2)PTC EV71病毒疫苗的拯救:以Vero-Tol2-NAEK为例
按照正常的拯救EV71病毒而方法,将野生型或引入相应PTC位点的EV71-A12质粒用Mlu I(Fermentas,FD0564)进行线性化并进行体外转录(Promega,P1280),对得到的mRNA进行富集纯化后转染Vero-Tol2-NAEK稳定细胞系,mRNA转染量为6孔板每孔3μg。转染后,每天观察细胞在加入/未加入非天然氨基酸的条件下的病变情况并测定病毒滴度。
虽然用上述实施方式描述了本发明,应当理解的是,在不背离本发明的精神的前提下,本发明可进行进一步的修饰和变动,且这些修饰和变动均属于本发明的保护范围之内。例如,本申请虽然以EV71病毒为例对稳定细胞系的应用进行了说明,但是很显然,本发明不应当仅仅限于EV71病毒,本发明适用于任何目的病毒插入非天然氨基酸。
本文提供的任何和所有实施例或示例性语言的使用仅旨在更好地说明本发明,而不对本发明的范围构成限制,除非另有要求。说明书中的语言不应被解释为指示任何未要求保护的元素对于实施本发明是必要的。
本说明书中引用的所有出版物和专利申请通过引用并入本文,如同每个单独的出版物或专利申请被具体地和单独地指明通过引用并入。此外,本文所述的任何理论、机制、证明或发现旨在进一步增强对本发明的理解,并且不意图以任何方式将本发明限制到这样的理论、机制、证明或发现。尽管已经在附图和前面的描述中详细地示出和描述了本发明,但是本发明应当被认为是说明性的而不是限制性的。
序列表
<110> 北京大学
<120> 利用优化的基因密码子扩展系统制备PTC稳定细胞系及应用
<130> IDC180058
<160> 16
<170> PatentIn version 3.5
<210> 1
<211> 72
<212> DNA
<213> 人工序列
<400> 1
ggaaacctga tcatgtagat cgaatggact ctaaatccgt tcagccgggt tagattcccg 60
gggtttccgc ca 72
<210> 2
<211> 1394
<212> DNA
<213> 人工序列
<400> 2
atggagcaaa agctcatttc tgaagaggac ttggataaaa aaccactaaa cactctgata 60
tctgcaaccg ggctctggat gtccaggacc ggaacaattc ataaaataaa acaccacgaa 120
gtctctcgaa gcaaaatcta tattgaaatg gcatgcggag accaccttgt tgtaaacaac 180
tccaggagca gcaggactgc aagagcgctc aggcaccaca aatacaggaa gacctgcaaa 240
cgctgcaggg tttcggatga ggatctcaat aagttcctca caaaggcaaa cgaagaccag 300
acaagcgtaa aagtcaaggt cgtttctgcc cctaccagaa cgaaaaaggc aatgccaaaa 360
tccgttgcga gagccccgaa acctcttgag aatacagaag cggcacaggc tcaaccttct 420
ggatctaaat tttcacctgc gataccggtt tccacccaag agtcagtttc tgtcccggca 480
tctgtttcaa catcaatatc aagcatttct acaggagcaa ctgcatccgc actggtaaaa 540
gggaatacga accccattac atccatgtct gcccctgttc aggcaagtgc ccccgcactt 600
acgaagagcc agactgacag gcttgaagtc ctgttaaacc caaaagatga gatttccctg 660
aattccggca agcctttcag ggagcttgag tccgaattgc tctctcgcag aaaaaaagac 720
ctgcagcaga tctacgcgga agaaagggag aattatctgg ggaaactcga gcgtgaaatt 780
accaggttct ttgtggacag gggttttctg gaaataaaat ccccgatcct gatccctctt 840
gagtatatcg aaaggatggg cattgataat gataccgaac tttcaaaaca gatcttcagg 900
gttgacaaga acttctgcct gagacccatg cttgctccaa acctttacaa ctacctgcgc 960
aagcttgaca gggccctgcc tgatccaata aaaatttttg aaataggccc atgctacaga 1020
aaagagtccg acggcaaaga acacctcgaa gagtttacca tgctgaactt ctgccagatg 1080
ggatcgggat gcacacggga aaatcttgaa agcataatta cggacttcct gaaccacctg 1140
ggaattgatt tcaagatcgt aggcgattcc tgcatggtct atggggatac ccttgatgta 1200
atgcacggag acctggaact ttcctctgca gtagtcggac ccataccgct tgaccgggaa 1260
tggggtattg ataaaccctg gataggggca ggtttcgggc tcgaacgcct tctaaaggtt 1320
aaacacgact ttaaaaatat caagagagct gcaaggtccg agtcttacta taacgggatt 1380
tctaccaacc tgta 1394
<210> 3
<211> 69
<212> DNA
<213> 人工序列
<400> 3
ggaaacctga tcatgtagat cgaacggact ctaaatccgt tcagccgggt tagattcccg 60
gggtttccg 69
<210> 4
<211> 69
<212> DNA
<213> 人工序列
<400> 4
ggggggtgga tcgaatagat cacacggact ctaaatccgt gcaggcgggt gaaactcccg 60
caccccccg 69
<210> 5
<211> 1260
<212> DNA
<213> 人工序列
<400> 5
atggataaaa aaccattaga tgttttaata tctgcgaccg ggctctggat gtccaggact 60
ggcacgctcc acaaaatcaa gcaccatgag gtctcaagaa gtaaaatata cattgaaatg 120
gcgtgtggag accatcttgt tgtgaataat tccaggagtt gtagaacagc cagagcattc 180
agacatcata agtacagaaa aacctgcaaa cgatgtaggg tttcggacga ggatatcaat 240
aattttctca caagatcaac cgaaagcaaa aacagtgtga aagttagggt agtttctgct 300
ccaaaggtca aaaaagctat gccgaaatca gtttcaaggg ctccgaagcc tctggaaaat 360
tctgtttctg caaaggcatc aacgaacaca tccagatctg taccttcgcc tgcaaaatca 420
actccaaatt cgtctgttcc cgcatcggct cctgctcctt cacttacaag aagccagctt 480
gatagggttg aggctctctt aagtccagag gataaaattt ctctaaatat ggcaaagcct 540
ttcagggaac ttgagcctga acttgtgaca agaagaaaaa acgattttca gcggctctat 600
accaatgata gagaagacta cctcggtaaa ctcgaacgtg atattacgaa atttttcgta 660
gaccggggtt ttctggagat aaagtctcct atccttattc cggcggaata cgtggagaga 720
atgggtatta ataatgatac tgaactttca aaacagatct tccgggtgga taaaaatctc 780
tgcttgaggc caatgcttgc cccgactctt tacaactatc tgcgaaaact cgataggatt 840
ttaccaggcc caataaaaat tttcgaagtc ggaccttgtt accggaaaga gtctgacggc 900
aaagagcacc tggaagaatt tactatggtg aacttctgtc agatgggttc gggatgtact 960
cgggaaaatc ttgaagctct catcaaagag tttctggact atctggaaat cgacttcgaa 1020
atcgtaggag attcctgtat ggtctttggg gatactcttg atataatgca cggggacctg 1080
gagctttctt cggcagtcgt cgggccagtt tctcttgata gagaatgggg tattgacaaa 1140
ccatggatag gtgcaggttt tggtcttgaa cgcttgctca aggttatgca cggctttaaa 1200
aacattaaga gggcatcaag gtccgaatct tactataatg ggatttcaac caatctgtaa 1260
<210> 6
<211> 82
<212> DNA
<213> 人工序列
<400> 6
ggtggggttc ccgagcggcc aaagggagca gactctaaat ctgccgtcac agacttcgaa 60
ggttcgaatc cttcccccac ca 82
<210> 7
<211> 82
<212> DNA
<213> 人工序列
<400> 7
ggaggggtag cgaagtggct aaacgcggcg gactctaaat ccgctccctt tgggttcggc 60
ggttcgaatc cgtccccctc ca 82
<210> 8
<211> 1284
<212> DNA
<213> 人工序列
<400> 8
atggcaagca gtaacttgat taaacaattg caagagcggg ggctggtagc ccaggtgacg 60
gacgaggaag cgttagcaga gcgactggcg caaggcccga tcgcactcgt gtgtggcttc 120
gatcctaccg ctgacagctt gcatttgggg catcttgttc cattgttatg cctgaaacgc 180
ttccagcagg cgggccacaa gccggttgcg ctggtaggcg gcgcgacggg tctgattggc 240
gacccgagct tcaaagctgc cgagcgtaag ctgaacaccg aagaaactgt tcaggagtgg 300
gtggacaaaa tccgtaagca ggttgccccg ttcctcgatt tcgactgtgg agaaaactct 360
gctatcgcgg ccaataatta tgactggttc ggcaatatga atgtgctgac cttcctgcgc 420
gatattggca aacacttctc cgttaaccag atgatcaaca aagaagcggt taagcagcgt 480
ctcaaccgtg aagatcaggg gatttcgttc actgagtttt cctacaacct gctgcagggt 540
tatagtatgg cctgtttgaa caaacagtac ggtgtggtgc tgcaaattgg tggttctgac 600
cagtggggta acatcacttc tggtatcgac ctgacccgtc gtctgcatca gaatcaggtg 660
tttggcctga ccgttccgct gatcactaaa gcagatggca ccaaatttgg taaaactgaa 720
ggcggcgcag tctggttgga tccgaagaaa accagcccgt acaaattcta ccagttctgg 780
atcaacactg cgcgtgccga cgtttaccgc ttcctgaagt tcttcacctt tatgagcatt 840
gaagagatca acgccctgga agaagaagat aaaaacagcg gtaaagcacc gcgcgcccag 900
tatgtactgg cggagcaggt gactcgtctg gttcacggtg aagaaggttt acaggcggca 960
aaacgtatta ccgaatgcct gttcagcggt tctttgagtg cgctgagtga agcggacttc 1020
gaacagctgg cgcaggacgg cgtaccgatg gttgagatgg aaaagggcgc agacctgatg 1080
caggcactgg tcgattctga actgcaacct tcccgtggtc aggcacgtaa aactatcgcc 1140
tccaatgcca tcaccattaa cggtgaaaaa cagtccgatc ctgaatactt ctttaaagaa 1200
gaagatcgtc tgtttggtcg ttttacctta ctgcgtcgcg gtaaaaagaa ttactgtctg 1260
atttgctgga aagggcccgt ttaa 1284
<210> 9
<211> 84
<212> DNA
<213> 人工序列
<400> 9
gcccggatgg tggaatcggt agacacaagg gattctaaat ccctcggcgt tcgcgctgtg 60
cgggttcaag tcccgctccg ggta 84
<210> 10
<211> 2592
<212> DNA
<213> 人工序列
<400> 10
atggaagagc aataccgccc ggaagagata gaatccaaag tacagcttca ttgggatgag 60
aagcgcacat ttgaagtaac cgaagacgag agcaaagaga agtattactg cttttctggc 120
cctccctatc cttctggtcg actacacatg ggccacgtac gtaactacac catcggtgac 180
gtgatcgccc gctaccagcg tatgctgggc aaaaacgtcc tgcagccgat cggctgggac 240
gcgtttggtc tgcctgcgga aggcgcggcg gtgaaaaaca acaccgctcc ggcaccgtgg 300
acgtacgaca acatcgcgta tatgaaaaac cagctcaaaa tgctgggctt tggttatgac 360
tggagccgcg agctggcaac ctgtacgccg gaatactacc gttgggaaca gaaattcttc 420
accgagctgt ataaaaaagg cctggtatat aagaagactt ctgcggtcaa ctggtgtccg 480
aacgaccaga ccgtactggc gaacgaacaa gttatcgacg gctgctgctg gcgctgcgat 540
accaaagttg aacgtaaaga gatcccgcag tggtttatca aaatcactgc ttacgctgac 600
gagctgctca acgatctgga taaactggat cactggcctg acaccgttaa aaccatgcag 660
cgtaactgga tcggtcgttc cgaaggcgtg gagatcacct tcaacgttaa cgactatgac 720
aacacgctga ccgtttacac tacccgcccg gacaccttta tgggttgtac ctacctggcg 780
gtagctgcgg gtcatccgct ggcgcagaaa gcggcggaaa ataatcctga actggcggcc 840
tttattgacg aatgccgtaa caccaaagtt gccgaagctg aaatggcgac gatggagaaa 900
aaaggcgtcg atactggctt taaagcggtt cacccattaa cgggcgaaga aattcccgtt 960
tgggcagcaa acttcgtatt gatggagtac ggcacgggcg cagttatggc ggtaccgggg 1020
cacgaccagc gcgactacga gtttgcctct aaatacggcc tgaacatcaa accggttatc 1080
ctggcagctg acggctctga gccagatctt tctcagcaag ccctgactga aaaaggcgtg 1140
ctgttcaact ctggcgagtt caacggtctt gaccatgaag cggccttcaa cgccatcgcc 1200
gataaactga ctgcgatggg cgttggcgag cgtaaagtga actaccgcct gcgcgactgg 1260
ggtgtttccc gtcagcgtta ctggggcgcg ccgattccga tggtgactct agaagacggt 1320
accgtaatgc cgaccccgga cgaccagctg ccggtgatcc tgccggagga tgtggtaatg 1380
gacggcatta ccagcccgat taaagcagat ccggagtggg cgaaaactac cgttaacggt 1440
atgccagcac tgcgtgaaac cgacactttc gacaccttta tggagtcctc ctgggttctt 1500
gcgcgctaca cttgcccgca gtacaaagaa ggtatgctgg attccgaagc ggctaactac 1560
tggctgccgg tggatatcgc gattggtggt attgaacacg ccattatgga gagtctctac 1620
tgtcgcttct tccacaaact gatgcgtgat gcaggcatgg tgaactctga cgaaccagtt 1680
aaacagttgc tgtgtcaggg tatggtgctg gcagatgcct tctactatgt tggcgaaaac 1740
ggcgaacgta actgggtttc cccggttgat gctatcgttg aacgtgacga gaaaggccgt 1800
atcgtgaaag cgaaagatgc ggcaggccat gaactggttt ataccggcat gagcaaaatg 1860
tccaagtcga agaacaacgg tatcgacccg caggtgatgg ttgaacgtta cggcgcggac 1920
accgttcgtc tgtttatgat gtttgcttct ccggctgata tgactctcga atggcaggaa 1980
tccggtgtgg aaggggctaa ccgcttcctg aaacgtgtct ggaaactggt ttacgagcac 2040
acagcaaaaa gtgatgttgc ggcactgaac gttgatgcgc tgactgaaaa tcagaaagcg 2100
ctgcgtcgcg atgtgcataa aacgatcgct aaagtgaccg atgatatcgg ccgtcgtcag 2160
accttcaaca ccgcaattgc ggcgattatg gagctgatga acaaactggc gaaagcacca 2220
accgatggcg agcaggatcg cgctctgatg caggaagcac tgctggccgt tgtccgtatg 2280
cttaacccgt tcaccccgca catctgcttc acgctgtggc aggaactgaa aggcgaaggc 2340
gatatcgaca acgcgccgtg gccggttgct gacgaaaaag cgatggtgga agactccacg 2400
ctggtcgtgg tgcaggttaa cggtaaagtc cgtgccaaaa tcaccgttcc ggtggacgca 2460
acggaagaac aggttcgcga acgtgctggc caggaacatc tggtagcaaa atatcttgat 2520
ggcgttactg tacgtaaagt gatttacgta ccaggtaaac tcctcaatct ggtcgttggc 2580
gggcccgttt aa 2592
<210> 11
<211> 720
<212> DNA
<213> 人工序列
<400> 11
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctag 120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480
ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600
tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtag 720
<210> 12
<211> 5693
<212> DNA
<213> 人工序列
<400> 12
aattcgagct tgcatgcctg caggtcgtta cataacttac ggtaaatggc ccgcctggct 60
gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 120
caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 180
cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 240
ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 300
tctacgtatt agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc 360
gtggatagcg gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga 420
gtttgttttg gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat 480
tgacgcaaat gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctcgtttag 540
tgaaccgtca gatcgcctgg agacgccatc cacgctgttt tgacctccat agaagacacc 600
gggaccgatc cagcctccgg actctagagg atccggtact cgaggaactg aaaaaccaga 660
aagttaactg gtaagtttag tctttttgtc ttttatttca ggtcccggat ccggtggtgg 720
tgcaaatcaa agaactgctc ctcagtggat gttgccttta cttctaggcc tgtacggaag 780
tgttacttct gctctaaaag ctgcggaatt gtacccgcgg ccgccaccat ggaggaagta 840
tgtgattcat cagcagctgc gagcagcaca gtccaaaatc agccacagga tcaagagcac 900
ccgtggccgt atcttcgcga attcttttct ttaagtggtg taaataaaga ttcattcaag 960
atgaaatgtg tcctctgtct cccgcttaat aaagaaatat cggccttcaa aagttcgcca 1020
tcaaacctaa ggaagcatat tgagagaatg cacccaaatt acctcaaaaa ctactctaaa 1080
ttgacagcac agaagagaaa gatcgggacc tccacccatg cttccagcag taagcaactg 1140
aaagttgact cagttttccc agtcaaacat gtgtctccag tcactgtgaa caaagctata 1200
ttaaggtaca tcattcaagg acttcatcct ttcagcactg ttgatctgcc atcatttaaa 1260
gagctgatta gtacactgca gcctggcatt tctgtcatta caaggcctac tttacgctcc 1320
aagatagctg aagctgctct gatcatgaaa cagaaagtga ctgctgccat gagtgaagtt 1380
gaatggattg caaccacaac ggattgttgg actgcacgta gaaagtcatt cattggtgta 1440
actgctcact ggatcaaccc tggaagtctt gaaagacatt ccgctgcact tgcctgcaaa 1500
agattaatgg gctctcatac ttttgaggta ctggccagtg ccatgaatga tatccactca 1560
gagtatgaaa tacgtgacaa ggttgtttgc acaaccacag acagtggttc caactttatg 1620
aaggctttca gagtttttgg tgtggaaaac aatgatatcg agactgaggc aagaaggtgt 1680
gaaagtgatg acactgattc tgaaggctgt ggtgagggaa gtgatggtgt ggaattccaa 1740
gatgcctcac gagtcctgga ccaagacgat ggcttcgaat tccagctacc aaaacatcaa 1800
aagtgtgcct gtcacttact taacctagtc tcaagcgttg atgcccaaaa agctctctca 1860
aatgaacact acaagaaact ctacagatct gtctttggca aatgccaagc tttatggaat 1920
aaaagcagcc gatcggctct agcagctgaa gctgttgaat cagaaagccg gcttcagctt 1980
ttaaggccaa accaaacgcg gtggaattca acttttatgg ctgttgacag aattcttcaa 2040
atttgcaaag aagcaggaga aggcgcactt cggaatatat gcacctctct tgaggttcca 2100
atgtttaatc cagcagaaat gctgttcttg acagagtggg ccaacacaat gcgtccagtt 2160
gcaaaagtac tcgacatctt gcaagcggaa acgaatacac agctggggtg gctgctgcct 2220
agtgtccatc agttaagctt gaaacttcag cgactccacc attctctcag gtactgtgac 2280
ccacttgtgg atgccctaca acaaggaatc caaacacgat tcaagcatat gtttgaagat 2340
cctgagatca tagcagctgc catccttctc cctaaatttc ggacctcttg gacaaatgat 2400
gaaaccatca taaaacgagg catggactac atcagagtgc atctggagcc tttggaccac 2460
aagaaggaat tggccaacag ttcatctgat gatgaagatt ttttcgcttc tttgaaaccg 2520
acaacacatg aagccagcaa agagttggat ggatatctgg cctgtgtttc agacaccagg 2580
gagtctctgc tcacgtttcc tgctatttgc agcctctcta tcaagactaa tacacctctt 2640
cccgcatcgg ctgcctgtga gaggcttttc agcactgcag gattgctttt cagccccaaa 2700
agagctaggc ttgacactaa caattttgag aatcagcttc tactgaagtt aaatctgagg 2760
ttttacaact ttgagtagac tagtctgaag ggcgaattct gcagatatcc atcacactgg 2820
cggccgcggg gatccagaca tgataagata cattgatgag tttggacaaa ccacaactag 2880
aatgcagtga aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac 2940
cattataagc tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt 3000
tcagggggag gtgtgggagg ttttttcgga tcctctagag tcgacctgca ggcatgcaag 3060
cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc 3120
acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat gagtgagcta 3180
actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca 3240
gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc 3300
cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc 3360
tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat 3420
gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt 3480
ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg 3540
aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc 3600
tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt 3660
ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa 3720
gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta 3780
tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa 3840
caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa 3900
ctacggctac actagaagga cagtatttgg tatctgcgct ctgctgaagc cagttacctt 3960
cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt 4020
ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat 4080
cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat 4140
gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc 4200
aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc 4260
acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta 4320
gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga 4380
cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg 4440
cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc 4500
tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat 4560
cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag 4620
gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat 4680
cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa 4740
ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa 4800
gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga 4860
taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg 4920
gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc 4980
acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg 5040
aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact 5100
cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat 5160
atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt 5220
gccacctgac gtctaagaaa ccattattat catgacatta acctataaaa ataggcgtat 5280
cacgaggccc tttcgtctcg cgcgtttcgg tgatgacggt gaaaacctct gacacatgca 5340
gctcccggag acggtcacag cttgtctgta agcggatgcc gggagcagac aagcccgtca 5400
gggcgcgtca gcgggtgttg gcgggtgtcg gggctggctt aactatgcgg catcagagca 5460
gattgtactg agagtgcacc atatgcggtg tgaaataccg cacagatgcg taaggagaaa 5520
ataccgcatc aggcgccatt cgccattcag gctgcgcaac tgttgggaag ggcgatcggt 5580
gcgggcctct tcgctattac gccagctggc gaaaggggga tgtgctgcaa ggcgattaag 5640
ttgggtaacg ccagggtttt cccagtcacg acgttgtaaa acgacggcca gtg 5693
<210> 13
<211> 17983
<212> DNA
<213> 人工序列
<400> 13
gggcgaattg ggcccagagg tgtaaagtac ttgagtaatt ttacttgatt actgtactta 60
agtattattt ttggggattt ttactttact tgagtacaat taaaaatcaa tacttttact 120
tttacttaat tacatttttt tagaaaaaaa agtacttttt actccttaca attttattta 180
cagtcaaaaa gtacttattt tttggagatc acttcattct attttccctt gctattacca 240
aaccaattga attgcgctga tgcccagttt aatttaaata gatctggcca tctagacatg 300
gaatcgatgt caggtaccga gctcacgggg acagcccccc cccaaagccc ccagggatgt 360
aattacgtcc ctcccccgct agggggcagc agcgagccgc ccggggctcc gctccggtcc 420
ggcgctcccc ccgcatcccc gagccggcag cgtgcgggga cagcccgggc acggggaagg 480
tggcacggga tcgctttcct ctgaacgctt ctcgctgctc tttgagcctg cagacacctg 540
gggggatacg gggaaaaagc tttaggctga aagagagatt tagaatgaca gaatcataga 600
acggcctggg ttgcaaagga gcacagtgct catccagatc caaccccctg ctatgtgcag 660
ggtcatcaac cagcagccca ggctgcccag agccacatcc agcctggcct tgaatgcctg 720
cagggatggg gcatccacag cctccttggg caacctgttc agtgcgtcac caccctctgg 780
gggaaaaact gcctcctcat atccaaccca aacctcccct gtctcagtgt aaagccattc 840
ccccttgtcc tatcaagggg gagtttgctg tgacattgtt ggtctggggt gacacatgtt 900
tgccaattca gtgcatcacg gagaggcaga tcttggggat aaggaagtgc aggacagcat 960
ggacgtggga catgcaggtg ttgagggctc tgggacactc tccaagtcac agcgttcaga 1020
acagccttaa ggataagaag ataggataga aggacaaaga gcaagttaaa acccagcatg 1080
gagaggagca caaaaaggcc acagacactg ctggtccctg tgtctgagcc tgcatgtttg 1140
atggtgtctg gatgcaagca gaaggggtgg aagagcttgc ctggagagat acagctgggt 1200
cagtaggact gggacaggca gctggagaat tgccatgtag atgttcatac aatcgtcaaa 1260
tcatgaaggc tggaaaagcc ctccaagatc cccaagacca accccaaccc acccaccgtg 1320
cccactggcc atgtccctca gtgccacatc cccacagttc ttcatcacct ccagggacgg 1380
tgaccccccc acctccgtgg gcagctgtgc cactgcagca ccgctctttg gagaaggtaa 1440
atcttgctaa atccagcccg accctcccct ggcacaacgt aaggccatta tctctcatcc 1500
aactccagga cggagtcagt gagaatattc tcgacggtac cgagctcacg gggacagccc 1560
ccccccaaag cccccaggga tgtaattacg tccctccccc gctagggggc agcagcgagc 1620
cgcccggggc tccgctccgg tccggcgctc cccccgcatc cccgagccgg cagcgtgcgg 1680
ggacagcccg ggcacgggga aggtggcacg ggatcgcttt cctctgaacg cttctcgctg 1740
ctctttgagc ctgcagacac ctggggggat acggggaaaa agctttaggc tgaaagagag 1800
atttagaatg acagaatcat agaacggcct gggttgcaaa ggagcacagt gctcatccag 1860
atccaacccc ctgctatgtg cagggtcatc aaccagcagc ccaggctgcc cagagccaca 1920
tccagcctgg ccttgaatgc ctgcagggat ggggcatcca cagcctcctt gggcaacctg 1980
ttcagtgcgt caccaccctc tgggggaaaa actgcctcct catatccaac ccaaacctcc 2040
cctgtctcag tgtaaagcca ttcccccttg tcctatcaag ggggagtttg ctgtgacatt 2100
gttggtctgg ggtgacacat gtttgccaat tcagtgcatc acggagaggc agatcttggg 2160
gataaggaag tgcaggacag catggacgtg ggacatgcag gtgttgaggg ctctgggaca 2220
ctctccaagt cacagcgttc agaacagcct taaggataag aagataggat agaaggacaa 2280
agagcaagtt aaaacccagc atggagagga gcacaaaaag gccacagaca ctgctggtcc 2340
ctgtgtctga gcctgcatgt ttgatggtgt ctggatgcaa gcagaagggg tggaagagct 2400
tgcctggaga gatacagctg ggtcagtagg actgggacag gcagctggag aattgccatg 2460
tagatgttca tacaatcgtc aaatcatgaa ggctggaaaa gccctccaag atccccaaga 2520
ccaaccccaa cccacccacc gtgcccactg gccatgtccc tcagtgccac atccccacag 2580
ttcttcatca cctccaggga cggtgacccc cccacctccg tgggcagctg tgccactgca 2640
gcaccgctct ttggagaagg taaatcttgc taaatccagc ccgaccctcc cctggcacaa 2700
cgtaaggcca ttatctctca tccaactcca ggacggagtc agtgagaata ttctcgagga 2760
tccgcggccg cttaattaac cgtttaaaca attctgcagg aatctagtta ttaatagtaa 2820
tcaattacgg ggtcattagt tcatagccca tatatggagt tccgcgttac ataacttacg 2880
gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc aataatgacg 2940
tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt ggagtattta 3000
cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac gccccctatt 3060
gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac cttatgggac 3120
tttcctactt ggcagtacat ctacgtatta gtcatcgcta ttaccatggt cgaggtgagc 3180
cccacgttct gcttcactct ccccatctcc cccccctccc cacccccaat tttgtattta 3240
tttatttttt aattattttg tgcagcgatg ggggcggggg gggggggggg gcgcgcgcca 3300
ggcggggcgg ggcggggcga ggggcggggc ggggcgaggc ggagaggtgc ggcggcagcc 3360
aatcagagcg gcgcgctccg aaagtttcct tttatggcga ggcggcggcg gcggcggccc 3420
tataaaaagc gaagcgcgcg gcgggcgggg agtcgctgcg acgctgcctt cgccccgtgc 3480
cccgctccgc cgccgcctcg cgccgcccgc cccggctctg actgaccgcg ttactcccac 3540
aggtgagcgg gcgggacggc ccttctcctc cgggctgtaa ttagcgcttg gtttaatgac 3600
ggcttgtttc ttttctgtgg ctgcgtgaaa gccttgaggg gctccgggag ggccctttgt 3660
gcggggggag cggctcgggg ggtgcgtgcg tgtgtgtgtg cgtggggagc gccgcgtgcg 3720
gctccgcgct gcccggcggc tgtgagcgct gcgggcgcgg cgcggggctt tgtgcgctcc 3780
gcagtgtgcg cgaggggagc gcggccgggg gcggtgcccc gcggtgcggg gggggctgcg 3840
aggggaacaa aggctgcgtg cggggtgtgt gcgtgggggg gtgagcaggg ggtgtgggcg 3900
cgtcggtcgg gctgcaaccc cccctgcacc cccctccccg agttgctgag cacggcccgg 3960
cttcgggtgc ggggctccgt acggggcgtg gcgcggggct cgccgtgccg ggcggggggt 4020
ggcggcaggt gggggtgccg ggcggggcgg ggccgcctcg ggccggggag ggctcggggg 4080
aggggcgcgg cggcccccgg agcgccggcg gctgtcgagg cgcggcgagc cgcagccatt 4140
gccttttatg gtaatcgtgc gagagggcgc agggacttcc tttgtcccaa atctgtgcgg 4200
agccgaaatc tgggaggcgc cgccgcaccc cctctagcgg gcgcggggcg aagcggtgcg 4260
gcgccggcag gaaggaaatg ggcggggagg gccttcgtgc gtcgccgcgc cgccgtcccc 4320
ttctccctct ccagcctcgg ggctgtccgc ggggggacgg ctgccttcgg gggggacggg 4380
gcagggcggg gttcggcttc tggcgtgtga ccggcggctc tagagcctct gctaaccatg 4440
ttcatgcctt cttctttttc ctacagctcc tgggcaacgt gctggttatt gtgctgtctc 4500
atcattttgg caaagaattg atttgatacc gcatttaaat gccaccatgg agcaaaagct 4560
catttctgaa gaggacttgg ataaaaaacc actaaacact ctgatatctg caaccgggct 4620
ctggatgtcc aggaccggaa caattcataa aataaaacac cacgaagtct ctcgaagcaa 4680
aatctatatt gaaatggcat gcggagacca ccttgttgta aacaactcca ggagcagcag 4740
gactgcaaga gcgctcaggc accacaaata caggaagacc tgcaaacgct gcagggtttc 4800
ggatgaggat ctcaataagt tcctcacaaa ggcaaacgaa gaccagacaa gcgtaaaagt 4860
caaggtcgtt tctgccccta ccagaacgaa aaaggcaatg ccaaaatccg ttgcgagagc 4920
cccgaaacct cttgagaata cagaagcggc acaggctcaa ccttctggat ctaaattttc 4980
acctgcgata ccggtttcca cccaagagtc agtttctgtc ccggcatctg tttcaacatc 5040
aatatcaagc atttctacag gagcaactgc atccgcactg gtaaaaggga atacgaaccc 5100
cattacatcc atgtctgccc ctgttcaggc aagtgccccc gcacttacga agagccagac 5160
tgacaggctt gaagtcctgt taaacccaaa agatgagatt tccctgaatt ccggcaagcc 5220
tttcagggag cttgagtccg aattgctctc tcgcagaaaa aaagacctgc agcagatcta 5280
cgcggaagaa agggagaatt atctggggaa actcgagcgt gaaattacca ggttctttgt 5340
ggacaggggt tttctggaaa taaaatcccc gatcctgatc cctcttgagt atatcgaaag 5400
gatgggcatt gataatgata ccgaactttc aaaacagatc ttcagggttg acaagaactt 5460
ctgcctgaga cccatgcttg ctccaaacct ttacaactac ctgcgcaagc ttgacagggc 5520
cctgcctgat ccaataaaaa tttttgaaat aggcccatgc tacagaaaag agtccgacgg 5580
caaagaacac ctcgaagagt ttaccatgct gaacttctgc cagatgggat cgggatgcac 5640
acgggaaaat cttgaaagca taattacgga cttcctgaac cacctgggaa ttgatttcaa 5700
gatcgtaggc gattcctgca tggtctatgg ggataccctt gatgtaatgc acggagacct 5760
ggaactttcc tctgcagtag tcggacccat accgcttgac cgggaatggg gtattgataa 5820
accctggata ggggcaggtt tcgggctcga acgccttcta aaggttaaac acgactttaa 5880
aaatatcaag agagctgcaa ggtccgagtc ttactataac gggatttcta ccaacctgta 5940
acccctctcc ctcccccccc cctaacgtta ctggccgaag ccgcttggaa taaggccggt 6000
gtgcgtttgt ctatatgtta ttttccacca tattgccgtc ttttggcaat gtgagggccc 6060
ggaaacctgg ccctgtcttc ttgacgagca ttcctagggg tctttcccct ctcgccaaag 6120
gaatgcaagg tctgttgaat gtcgtgaagg aagcagttcc tctggaagct tcttgaagac 6180
aaacaacgtc tgtagcgacc ctttgcaggc agcggaaccc cccacctggc gacaggtgcc 6240
tctgcggcca aaagccacgt gtataagata cacctgcaaa ggcggcacaa ccccagtgcc 6300
acgttgtgag ttggatagtt gtggaaagag tcaaatggct ctcctcaagc gtattcaaca 6360
aggggctgaa ggatgcccag aaggtacccc attgtatggg atctgatctg gggcctcggt 6420
gcacatgctt tacatgtgtt tagtcgaggt taaaaaaacg tctaggcccc ccgaaccacg 6480
gggacgtggt tttcctttga aaaacacgat gataatatgg ccacaaccat ggtgagcaag 6540
ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg agctggacgg cgacgtaaac 6600
ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg ccacctaggg caagctgacc 6660
ctgaagttca tctgcaccac cggcaagctg cccgtgccct ggcccaccct cgtgaccacc 6720
ctgacctacg gcgtgcagtg cttcagccgc taccccgacc acatgaagca gcacgacttc 6780
ttcaagtccg ccatgcccga aggctacgtc caggagcgca ccatcttctt caaggacgac 6840
ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt gaaccgcatc 6900
gagctgaagg gcatcgactt caaggaggac ggcaacatcc tggggcacaa gctggagtac 6960
aactacaaca gccacaacgt ctatatcatg gccgacaagc agaagaacgg catcaaggtg 7020
aacttcaaga tccgccacaa catcgaggac ggcagcgtgc agctcgccga ccactaccag 7080
cagaacaccc ccatcggcga cggccccgtg ctgctgcccg acaaccacta cctgagcacc 7140
cagtccgccc tgagcaaaga ccccaacgag aagcgcgatc acatggtcct gctggagttc 7200
gtgaccgccg ccgggatcac tctcggcatg gacgagctgt acaagtaggc gatcgccaaa 7260
ttcgatatca agcttatcga taatcaacct ctggattaca aaatttgtga aagattgact 7320
ggtattctta actatgttgc tccttttacg ctatgtggat acgctgcttt aatgcctttg 7380
tatcatgcta ttgcttcccg tatggctttc attttctcct ccttgtataa atcctggttg 7440
ctgtctcttt atgaggagtt gtggcccgtt gtcaggcaac gtggcgtggt gtgcactgtg 7500
tttgctgacg caacccccac tggttggggc attgccacca cctgtcagct cctttccggg 7560
actttcgctt tccccctccc tattgccacg gcggaactca tcgccgcctg ccttgcccgc 7620
tgctggacag gggctcggct gttgggcact gacaattccg tggtgttgtc ggggaaatca 7680
tcgtcctttc cttggctgct cgcctgtgtt gccacctgga ttctgcgcgg gacgtccttc 7740
tgctacgtcc cttcggccct caatccagcg gaccttcctt cccgcggcct gctgccggct 7800
ctgcggcctc ttccgcgtct tcgccttcgc cctcagacga gtcggatctc cctttgggcc 7860
gcctccccgc atcgataccg tcgacctcga ctgtgccttc tagttgccag ccatctgttg 7920
tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct 7980
aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg 8040
gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggaac 8100
tagtggcgcg cctgcatgcc tgcaggtcga cgaacgctga cgtcatcaac ccgctccaag 8160
gaatcgcggg cccagtgtca ctaggcggga acacccagcg cgcgtgcgcc ctggcaggaa 8220
gatggctgtg agggacaggg gagtggcgcc ctgcaatatt tgcatgtcgc tatgtgttct 8280
gggaaatcac cataaacgtg aaatgtcttt ggatttggga atcttataag ttctgtatga 8340
gaccacagat ccccggaaac ctgatcatgt agatcgaatg gactctaaat ccgttcagcc 8400
gggttagatt cccggggttt ccgccatttt tctcgacgac gccgccatct ctaggcccgc 8460
gccggccccc tcgcacagac ttgtgggaga agctcggcta ctcccctgcc ccggttaatt 8520
tgcatataat atttcctagt aactatagag gcttaatgtg cgataaaaga cagataatct 8580
gttcttttta atactagcta cattttacat gataggcttg gatttctata agagatacaa 8640
atactaaatt attattttaa aaaacagcac aaaaggaaac tcaccctaac tgtaaagtaa 8700
ttgtgtgttt tgagactata aatatccctt ggagaaaagc cttgtttgga aacctgatca 8760
tgtagatcga atggactcta aatccgttca gccgggttag attcccgggg tttccgccat 8820
ttttctcgac aaggtcgggc aggaagaggg cctatttccc atgattcctt catatttgca 8880
tatacgatac aaggctgtta gagagataat tagaattaat ttgactgtaa acacaaagat 8940
attagtacaa aatacgtgac gtagaaagta ataatttctt gggtagtttg cagttttaaa 9000
attatgtttt aaaatggact atcatatgct taccgtaact tgaaagtatt tcgatttctt 9060
ggctttatat atcttgtgga aaggacgaaa caccggaaac ctgatcatgt agatcgaatg 9120
gactctaaat ccgttcagcc gggttagatt cccggggttt ccgccatttt tctcgacgaa 9180
cgctgacgtc atcaacccgc tccaaggaat cgcgggccca gtgtcactag gcgggaacac 9240
ccagcgcgcg tgcgccctgg caggaagatg gctgtgaggg acaggggagt ggcgccctgc 9300
aatatttgca tgtcgctatg tgttctggga aatcaccata aacgtgaaat gtctttggat 9360
ttgggaatct tataagttct gtatgagacc acagatcccc ggaaacctga tcatgtagat 9420
cgaatggact ctaaatccgt tcagccgggt tagattcccg gggtttccgc catttttctc 9480
gacgacgccg ccatctctag gcccgcgccg gccccctcgc acagacttgt gggagaagct 9540
cggctactcc cctgccccgg ttaatttgca tataatattt cctagtaact atagaggctt 9600
aatgtgcgat aaaagacaga taatctgttc tttttaatac tagctacatt ttacatgata 9660
ggcttggatt tctataagag atacaaatac taaattatta ttttaaaaaa cagcacaaaa 9720
ggaaactcac cctaactgta aagtaattgt gtgttttgag actataaata tcccttggag 9780
aaaagccttg tttggaaacc tgatcatgta gatcgaatgg actctaaatc cgttcagccg 9840
ggttagattc ccggggtttc cgccattttt ctcgacaagg tcgggcagga agagggccta 9900
tttcccatga ttccttcata tttgcatata cgatacaagg ctgttagaga gataattaga 9960
attaatttga ctgtaaacac aaagatatta gtacaaaata cgtgacgtag aaagtaataa 10020
tttcttgggt agtttgcagt tttaaaatta tgttttaaaa tggactatca tatgcttacc 10080
gtaacttgaa agtatttcga tttcttggct ttatatatct tgtggaaagg acgaaacacc 10140
ggaaacctga tcatgtagat cgaatggact ctaaatccgt tcagccgggt tagattcccg 10200
gggtttccgc catttttctc gactctagag gatccctgca gtatttagca tgccccaccc 10260
atctgcaagg cattctggat agtgtcaaaa cagccggaaa tcaagtccgt ttatctcaaa 10320
ctttagcatt ttgggaataa atgatatttg ctatgctggt taaattagat tttagttaaa 10380
tttcctgctg aagctctagt acgataagta acttgaccta agtgtaaagt tgagatttcc 10440
ttcaggttta tatagcttgt gcgccgcctg ggtacctcgg aaacctgatc atgtagatcg 10500
aatggactct aaatccgttc agccgggtta gattcccggg gtttccgcca tttttggatc 10560
taaggtcggg caggaagagg gcctatttcc catgattcct tcatatttgc atatacgata 10620
caaggctgtt agagagataa ttagaattaa tttgactgta aacacaaaga tattagtaca 10680
aaatacgtga cgtagaaagt aataatttct tgggtagttt gcagttttaa aattatgttt 10740
taaaatggac tatcatatgc ttaccgtaac ttgaaagtat ttcgatttct tggctttata 10800
tatcttgtgg aaaggacgaa acaccggaaa cctgatcatg tagatcgaat ggactctaaa 10860
tccgttcagc cgggttagat tcccggggtt tccgccattt ttggatctga acgctgacgt 10920
catcaacccg ctccaaggaa tcgcgggccc agtgtcacta ggcgggaaca cccagcgcgc 10980
gtgcgccctg gcaggaagat ggctgtgagg gacaggggag tggcgccctg caatatttgc 11040
atgtcgctat gtgttctggg aaatcaccat aaacgtgaaa tgtctttgga tttgggaatc 11100
ttataagttc tgtatgagac cacagatccc cggaaacctg atcatgtaga tcgaatggac 11160
tctaaatccg ttcagccggg ttagattccc ggggtttccg ccatttttgg atctctgcag 11220
tatttagcat gccccaccca tctgcaaggc attctggata gtgtcaaaac agccggaaat 11280
caagtccgtt tatctcaaac tttagcattt tgggaataaa tgatatttgc tatgctggtt 11340
aaattagatt ttagttaaat ttcctgctga agctctagta cgataagtaa cttgacctaa 11400
gtgtaaagtt gagatttcct tcaggtttat atagcttgtg cgccgcctgg gtacctcgga 11460
aacctgatca tgtagatcga atggactcta aatccgttca gccgggttag attcccgggg 11520
tttccgccat ttttggatct aaggtcgggc aggaagaggg cctatttccc atgattcctt 11580
catatttgca tatacgatac aaggctgtta gagagataat tagaattaat ttgactgtaa 11640
acacaaagat attagtacaa aatacgtgac gtagaaagta ataatttctt gggtagtttg 11700
cagttttaaa attatgtttt aaaatggact atcatatgct taccgtaact tgaaagtatt 11760
tcgatttctt ggctttatat atcttgtgga aaggacgaaa caccggaaac ctgatcatgt 11820
agatcgaatg gactctaaat ccgttcagcc gggttagatt cccggggttt ccgccatttt 11880
tggatctgaa cgctgacgtc atcaacccgc tccaaggaat cgcgggccca gtgtcactag 11940
gcgggaacac ccagcgcgcg tgcgccctgg caggaagatg gctgtgaggg acaggggagt 12000
ggcgccctgc aatatttgca tgtcgctatg tgttctggga aatcaccata aacgtgaaat 12060
gtctttggat ttgggaatct tataagttct gtatgagacc acagatcccc ggaaacctga 12120
tcatgtagat cgaatggact ctaaatccgt tcagccgggt tagattcccg gggtttccgc 12180
catttttgga tctccgggta ccctgtgcgc tagcatcgag cgctatcgct cgagatggta 12240
ccgatcatcg atatgtcgac gggcccataa cttcgtataa tgtatgctat acgaagttat 12300
cgtgctagat cgactgctag agtgacagat ctcatacaaa tccatagagc ccaccgcatc 12360
cccagcatgc ctgctattgt cttcccaatc ctcccccttg ctgtcctgcc ccaccccacc 12420
ccccagaata gaatgacacc tactcagaca atgcgatgca atttcctcat tttattagga 12480
aaggacagtg ggagtggcac cttccagggt caaggaaggc acgggggagg ggcaaacaac 12540
agatggctgg caactagaag gcacagtcga ggctgatcag cgagctctag agctcagtta 12600
gcctccccca tctcccgggc aaacgtgcgc gccaggtcgc agatcgtcgg tatggagccg 12660
ggggtggtga cgtgggtctg gaccatcccg gaggtaagtt gcagcagggc gtcccggcag 12720
ccggcgggcg attggtcgta atccaggata aagacgtgca tgggacggag gcgtttggcc 12780
aagacgtcca aggcccaggc aaacacgttg tacaggtcgc cgttgggggc cagcaactcg 12840
ggggcccgaa acagggtaaa taacgtgtcc ccgatatggg gtcgtgggcc cgcgttgctc 12900
tggggctcgg caccctgggg cggcacggcc gtccccgaaa gctgtcccca atcctcccgc 12960
cacgacccgc cgccctgcag ataccgcacc gtattggcaa gcagcccgta aacgcggcga 13020
atcgcggcca gcatagccag gtcaagccgc tcgccggggc gctggcgttt ggccaggcgg 13080
tcgatgtgtc tgtcctccgg aagggccccc aacacgatgt ttgtgccggg caaggtcggc 13140
gggatgaggg ccacgaacgc cagcacggcc tggggggtca tgctgcccat aaggtatcgc 13200
gcggccgggt agcacaggag ggcggcgatg ggatggcggt cgaagatgag ggtgagggcc 13260
gggggcgggg catgtgagct cccagcctcc cccccgatat gaggagccag aacggcgtcg 13320
gtcacggcat aaggcatgcc cattgttatc tgggcgcttg tcattaccac cgccgcgtcc 13380
ccggccgata tctcaccctg gtcgaggcgg tgttgtgtgg tgtagatgtt cgcgattgtc 13440
tcggaagccc ccagcacctg ccagtaagtc atcggctcgg gtacgtagac gatatcgtcg 13500
cgcgaaccca gggccaccag cagttgcgtg gtggtggttt tccccatccc gtgaggaccg 13560
tctatataaa cccgcagtag cgtgggcatg gatccggcac cgggcttgcg ggtcatgcac 13620
caggtgcgcg gtccttcggg cacctcgacg tcggcggtga cggtgaagcc gagccgctcg 13680
tagaagggga ggttgcgggg cgcggaggtc tccaggaagg cgggcacccc ggcgcgctcg 13740
gccgcctcca ctccggggag cacgacggcg ctgcccagac ccttgccctg gtggtcgggc 13800
gagacgccga cggtggccag gaaccacgcg ggctccttgg gccggtgcgg cgccaggagg 13860
ccttccatct gttgctgcgc ggccagccgg gaaccgctca actcggccat gcgcgggccg 13920
atctcggcga acaccgcccc cgcttcgacg ctctccggcg tggtccagac cgccaccgcg 13980
gcgccgtcgt ccgcgaccca caccttgccg atgtcgagcc cgacgcgcgt gaggaagagt 14040
tcttgcagct cggtgacccg ctcgatgtgg cggtccggat cgacggtgtg gcgcgtggcg 14100
gggtagtcgg cgaacgcggc ggcgagggtg cgtacggccc tggggacgtc gtcgcgggtg 14160
gcgaggcgca ccgtgggctt gtactcggtc cccatggtgg cgttggctgc aggtcgaaag 14220
gcccggagat gaggaagagg agaacagcgc ggcagacgtg cgcttttgaa gcgtgcagaa 14280
tgccgggcct ccggaggacc ttcgggcgcc cgccccgccc ctgagcccgc ccctgagccc 14340
gcccccggac ccaccccttc ccagcctctg agcccagaaa gcgaaggagc aaagctgcta 14400
ttggccgctg ccccaaaggc ctacccgctt ccattgctca gcggtgctgt ccatctgcac 14460
gagactagtg agacgtgcta cttccatttg tcacgtcctg cacgacgcga gctgcggggc 14520
gggggggaac ttcctgacta ggggaggagt agaaggtggc gcgaaggggc caccaaagaa 14580
cggagccggt tggcgcctac cggtggatgt ggaatgtgtg cgaggccaga ggccacttgt 14640
gtagcgccaa gtgcccagcg gggctgctaa agcgcatgct ccagactgcc ttgggaaaag 14700
cgcctcccct accccagctg agagtagcac aatctaggcg tcataacttc gtataatgta 14760
tgctatacga agttatacgc gtatcgggat cccagtgcgg ccgcactgtc gcgaatcgcc 14820
atggatcgct gcagatcgca attccatgga tatcaagctt aaacaagaat ctctagtttt 14880
ctttcttgct tttactttta cttccttaat actcaagtac aattttaatg gagtactttt 14940
ttacttttac tcaagtaaga ttctagccag atacttttac ttttaattga gtaaaatttt 15000
ccctaagtac ttgtactttc acttgagtaa aatttttgag tactttttac acctctgctc 15060
gaccatatgg gagagctccc aacgcgttgg atgcatagct tgagtattct atagtgtcac 15120
ctaaatagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc 15180
acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga 15240
gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg 15300
tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg 15360
cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg 15420
gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga 15480
aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg 15540
gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag 15600
aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc 15660
gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg 15720
ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt 15780
cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc 15840
ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc 15900
actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg 15960
tggcctaact acggctacac tagaagaaca gtatttggta tctgcgctct gctgaagcca 16020
gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc 16080
ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat 16140
cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt 16200
ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt 16260
tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc 16320
agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc 16380
gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata 16440
ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg 16500
gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc 16560
cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct 16620
acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa 16680
cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt 16740
cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca 16800
ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac 16860
tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca 16920
atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt 16980
tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc 17040
actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca 17100
aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata 17160
ctcatactct tcctttttca atattattga agcatttatc agggttattg tctcatgagc 17220
ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc 17280
cgaaaagtgc cacctgatgc ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg 17340
catcaggaaa ttgtaagcgt taatattttg ttaaaattcg cgttaaattt ttgttaaatc 17400
agctcatttt ttaaccaata ggccgaaatc ggcaaaatcc cttataaatc aaaagaatag 17460
accgagatag ggttgagtgt tgttccagtt tggaacaaga gtccactatt aaagaacgtg 17520
gactccaacg tcaaagggcg aaaaaccgtc tatcagggcg atggcccact acgtgaacca 17580
tcaccctaat caagtttttt ggggtcgagg tgccgtaaag cactaaatcg gaaccctaaa 17640
gggagccccc gatttagagc ttgacgggga aagccggcga acgtggcgag aaaggaaggg 17700
aagaaagcga aaggagcggg cgctagggcg ctggcaagtg tagcggtcac gctgcgcgta 17760
accaccacac ccgccgcgct taatgcgccg ctacagggcg cgtccattcg ccattcaggc 17820
tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc gctattacgc cagctggcga 17880
aagggggatg tgctgcaagg cgattaagtt gggtaacgcc agggttttcc cagtcacgac 17940
gttgtaaaac gacggccagt gaattgtaat acgactcact ata 17983
<210> 14
<211> 16960
<212> DNA
<213> 人工序列
<400> 14
gggcgaattg ggcccagagg tgtaaagtac ttgagtaatt ttacttgatt actgtactta 60
agtattattt ttggggattt ttactttact tgagtacaat taaaaatcaa tacttttact 120
tttacttaat tacatttttt tagaaaaaaa agtacttttt actccttaca attttattta 180
cagtcaaaaa gtacttattt tttggagatc acttcattct attttccctt gctattacca 240
aaccaattga attgcgctga tgcccagttt aatttaaata gatctggcca tctagacatg 300
gaatcgatgt caggtaccga gctcacgggg acagcccccc cccaaagccc ccagggatgt 360
aattacgtcc ctcccccgct agggggcagc agcgagccgc ccggggctcc gctccggtcc 420
ggcgctcccc ccgcatcccc gagccggcag cgtgcgggga cagcccgggc acggggaagg 480
tggcacggga tcgctttcct ctgaacgctt ctcgctgctc tttgagcctg cagacacctg 540
gggggatacg gggaaaaagc tttaggctga aagagagatt tagaatgaca gaatcataga 600
acggcctggg ttgcaaagga gcacagtgct catccagatc caaccccctg ctatgtgcag 660
ggtcatcaac cagcagccca ggctgcccag agccacatcc agcctggcct tgaatgcctg 720
cagggatggg gcatccacag cctccttggg caacctgttc agtgcgtcac caccctctgg 780
gggaaaaact gcctcctcat atccaaccca aacctcccct gtctcagtgt aaagccattc 840
ccccttgtcc tatcaagggg gagtttgctg tgacattgtt ggtctggggt gacacatgtt 900
tgccaattca gtgcatcacg gagaggcaga tcttggggat aaggaagtgc aggacagcat 960
ggacgtggga catgcaggtg ttgagggctc tgggacactc tccaagtcac agcgttcaga 1020
acagccttaa ggataagaag ataggataga aggacaaaga gcaagttaaa acccagcatg 1080
gagaggagca caaaaaggcc acagacactg ctggtccctg tgtctgagcc tgcatgtttg 1140
atggtgtctg gatgcaagca gaaggggtgg aagagcttgc ctggagagat acagctgggt 1200
cagtaggact gggacaggca gctggagaat tgccatgtag atgttcatac aatcgtcaaa 1260
tcatgaaggc tggaaaagcc ctccaagatc cccaagacca accccaaccc acccaccgtg 1320
cccactggcc atgtccctca gtgccacatc cccacagttc ttcatcacct ccagggacgg 1380
tgaccccccc acctccgtgg gcagctgtgc cactgcagca ccgctctttg gagaaggtaa 1440
atcttgctaa atccagcccg accctcccct ggcacaacgt aaggccatta tctctcatcc 1500
aactccagga cggagtcagt gagaatattc tcgacggtac cgagctcacg gggacagccc 1560
ccccccaaag cccccaggga tgtaattacg tccctccccc gctagggggc agcagcgagc 1620
cgcccggggc tccgctccgg tccggcgctc cccccgcatc cccgagccgg cagcgtgcgg 1680
ggacagcccg ggcacgggga aggtggcacg ggatcgcttt cctctgaacg cttctcgctg 1740
ctctttgagc ctgcagacac ctggggggat acggggaaaa agctttaggc tgaaagagag 1800
atttagaatg acagaatcat agaacggcct gggttgcaaa ggagcacagt gctcatccag 1860
atccaacccc ctgctatgtg cagggtcatc aaccagcagc ccaggctgcc cagagccaca 1920
tccagcctgg ccttgaatgc ctgcagggat ggggcatcca cagcctcctt gggcaacctg 1980
ttcagtgcgt caccaccctc tgggggaaaa actgcctcct catatccaac ccaaacctcc 2040
cctgtctcag tgtaaagcca ttcccccttg tcctatcaag ggggagtttg ctgtgacatt 2100
gttggtctgg ggtgacacat gtttgccaat tcagtgcatc acggagaggc agatcttggg 2160
gataaggaag tgcaggacag catggacgtg ggacatgcag gtgttgaggg ctctgggaca 2220
ctctccaagt cacagcgttc agaacagcct taaggataag aagataggat agaaggacaa 2280
agagcaagtt aaaacccagc atggagagga gcacaaaaag gccacagaca ctgctggtcc 2340
ctgtgtctga gcctgcatgt ttgatggtgt ctggatgcaa gcagaagggg tggaagagct 2400
tgcctggaga gatacagctg ggtcagtagg actgggacag gcagctggag aattgccatg 2460
tagatgttca tacaatcgtc aaatcatgaa ggctggaaaa gccctccaag atccccaaga 2520
ccaaccccaa cccacccacc gtgcccactg gccatgtccc tcagtgccac atccccacag 2580
ttcttcatca cctccaggga cggtgacccc cccacctccg tgggcagctg tgccactgca 2640
gcaccgctct ttggagaagg taaatcttgc taaatccagc ccgaccctcc cctggcacaa 2700
cgtaaggcca ttatctctca tccaactcca ggacggagtc agtgagaata ttctcgagga 2760
tccgcggccg cttaattaac cgtttaaaca attctgcagg aatctagtta ttaatagtaa 2820
tcaattacgg ggtcattagt tcatagccca tatatggagt tccgcgttac ataacttacg 2880
gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc aataatgacg 2940
tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt ggagtattta 3000
cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac gccccctatt 3060
gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac cttatgggac 3120
tttcctactt ggcagtacat ctacgtatta gtcatcgcta ttaccatggt cgaggtgagc 3180
cccacgttct gcttcactct ccccatctcc cccccctccc cacccccaat tttgtattta 3240
tttatttttt aattattttg tgcagcgatg ggggcggggg gggggggggg gcgcgcgcca 3300
ggcggggcgg ggcggggcga ggggcggggc ggggcgaggc ggagaggtgc ggcggcagcc 3360
aatcagagcg gcgcgctccg aaagtttcct tttatggcga ggcggcggcg gcggcggccc 3420
tataaaaagc gaagcgcgcg gcgggcgggg agtcgctgcg acgctgcctt cgccccgtgc 3480
cccgctccgc cgccgcctcg cgccgcccgc cccggctctg actgaccgcg ttactcccac 3540
aggtgagcgg gcgggacggc ccttctcctc cgggctgtaa ttagcgcttg gtttaatgac 3600
ggcttgtttc ttttctgtgg ctgcgtgaaa gccttgaggg gctccgggag ggccctttgt 3660
gcggggggag cggctcgggg ggtgcgtgcg tgtgtgtgtg cgtggggagc gccgcgtgcg 3720
gctccgcgct gcccggcggc tgtgagcgct gcgggcgcgg cgcggggctt tgtgcgctcc 3780
gcagtgtgcg cgaggggagc gcggccgggg gcggtgcccc gcggtgcggg gggggctgcg 3840
aggggaacaa aggctgcgtg cggggtgtgt gcgtgggggg gtgagcaggg ggtgtgggcg 3900
cgtcggtcgg gctgcaaccc cccctgcacc cccctccccg agttgctgag cacggcccgg 3960
cttcgggtgc ggggctccgt acggggcgtg gcgcggggct cgccgtgccg ggcggggggt 4020
ggcggcaggt gggggtgccg ggcggggcgg ggccgcctcg ggccggggag ggctcggggg 4080
aggggcgcgg cggcccccgg agcgccggcg gctgtcgagg cgcggcgagc cgcagccatt 4140
gccttttatg gtaatcgtgc gagagggcgc agggacttcc tttgtcccaa atctgtgcgg 4200
agccgaaatc tgggaggcgc cgccgcaccc cctctagcgg gcgcggggcg aagcggtgcg 4260
gcgccggcag gaaggaaatg ggcggggagg gccttcgtgc gtcgccgcgc cgccgtcccc 4320
ttctccctct ccagcctcgg ggctgtccgc ggggggacgg ctgccttcgg gggggacggg 4380
gcagggcggg gttcggcttc tggcgtgtga ccggcggctc tagagcctct gctaaccatg 4440
ttcatgcctt cttctttttc ctacagctcc tgggcaacgt gctggttatt gtgctgtctc 4500
atcattttgg caaagaattg atttgatacc gcatttaaat gccaccatgg agcaaaagct 4560
catttctgaa gaggacttga tggataaaaa accattagat gttttaatat ctgcgaccgg 4620
gctctggatg tccaggactg gcacgctcca caaaatcaag caccatgagg tctcaagaag 4680
taaaatatac attgaaatgg cgtgtggaga ccatcttgtt gtgaataatt ccaggagttg 4740
tagaacagcc agagcattca gacatcataa gtacagaaaa acctgcaaac gatgtagggt 4800
ttcggacgag gatatcaata attttctcac aagatcaacc gaaagcaaaa acagtgtgaa 4860
agttagggta gtttctgctc caaaggtcaa aaaagctatg ccgaaatcag tttcaagggc 4920
tccgaagcct ctggaaaatt ctgtttctgc aaaggcatca acgaacacat ccagatctgt 4980
accttcgcct gcaaaatcaa ctccaaattc gtctgttccc gcatcggctc ctgctccttc 5040
acttacaaga agccagcttg atagggttga ggctctctta agtccagagg ataaaatttc 5100
tctaaatatg gcaaagcctt tcagggaact tgagcctgaa cttgtgacaa gaagaaaaaa 5160
cgattttcag cggctctata ccaatgatag agaagactac ctcggtaaac tcgaacgtga 5220
tattacgaaa tttttcgtag accggggttt tctggagata aagtctccta tccttattcc 5280
ggcggaatac gtggagagaa tgggtattaa taatgatact gaactttcaa aacagatctt 5340
ccgggtggat aaaaatctct gcttgaggcc aatgcttgcc ccgactcttt acaactatct 5400
gcgaaaactc gataggattt taccaggccc aataaaaatt ttcgaagtcg gaccttgtta 5460
ccggaaagag tctgacggca aagagcacct ggaagaattt actatggtga acttctgtca 5520
gatgggttcg ggatgtactc gggaaaatct tgaagctctc atcaaagagt ttctggacta 5580
tctggaaatc gacttcgaaa tcgtaggaga ttcctgtatg gtctttgggg atactcttga 5640
tataatgcac ggggacctgg agctttcttc ggcagtcgtc gggccagttt ctcttgatag 5700
agaatggggt attgacaaac catggatagg tgcaggtttt ggtcttgaac gcttgctcaa 5760
ggttatgcac ggctttaaaa acattaagag ggcatcaagg tccgaatctt actataatgg 5820
gatttcaacc aatctgtaac ccctctccct cccccccccc taacgttact ggccgaagcc 5880
gcttggaata aggccggtgt gcgtttgtct atatgttatt ttccaccata ttgccgtctt 5940
ttggcaatgt gagggcccgg aaacctggcc ctgtcttctt gacgagcatt cctaggggtc 6000
tttcccctct cgccaaagga atgcaaggtc tgttgaatgt cgtgaaggaa gcagttcctc 6060
tggaagcttc ttgaagacaa acaacgtctg tagcgaccct ttgcaggcag cggaaccccc 6120
cacctggcga caggtgcctc tgcggccaaa agccacgtgt ataagataca cctgcaaagg 6180
cggcacaacc ccagtgccac gttgtgagtt ggatagttgt ggaaagagtc aaatggctct 6240
cctcaagcgt attcaacaag gggctgaagg atgcccagaa ggtaccccat tgtatgggat 6300
ctgatctggg gcctcggtgc acatgcttta catgtgttta gtcgaggtta aaaaaacgtc 6360
taggcccccc gaaccacggg gacgtggttt tcctttgaaa aacacgatga taatatggcc 6420
acaaccatgg tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 6480
ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 6540
acctagggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg 6600
cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac 6660
atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 6720
atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 6780
accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 6840
gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag 6900
aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag 6960
ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 7020
aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac 7080
atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 7140
aagtaggcga tcgccaaatt cgatatcaag cttatcgata atcaacctct ggattacaaa 7200
atttgtgaaa gattgactgg tattcttaac tatgttgctc cttttacgct atgtggatac 7260
gctgctttaa tgcctttgta tcatgctatt gcttcccgta tggctttcat tttctcctcc 7320
ttgtataaat cctggttgct gtctctttat gaggagttgt ggcccgttgt caggcaacgt 7380
ggcgtggtgt gcactgtgtt tgctgacgca acccccactg gttggggcat tgccaccacc 7440
tgtcagctcc tttccgggac tttcgctttc cccctcccta ttgccacggc ggaactcatc 7500
gccgcctgcc ttgcccgctg ctggacaggg gctcggctgt tgggcactga caattccgtg 7560
gtgttgtcgg ggaaatcatc gtcctttcct tggctgctcg cctgtgttgc cacctggatt 7620
ctgcgcggga cgtccttctg ctacgtccct tcggccctca atccagcgga ccttccttcc 7680
cgcggcctgc tgccggctct gcggcctctt ccgcgtcttc gccttcgccc tcagacgagt 7740
cggatctccc tttgggccgc ctccccgcat cgataccgtc gacctcgact gtgccttcta 7800
gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg gaaggtgcca 7860
ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg agtaggtgtc 7920
attctattct ggggggtggg gtggggcagg acagcaaggg ggaggattgg gaagacaata 7980
gcaggcatgc tggggaacta gtggcgcgcc tgcatgcctg caggtcgacg agggcctatt 8040
tcccatgatt ccttcatatt tgcatatacg atacaaggct gttagagaga taattagaat 8100
taatttgact gtaaacacaa agatattagt acaaaatacg tgacgtagaa agtaataatt 8160
tcttgggtag tttgcagttt taaaattatg ttttaaaatg gactatcata tgcttaccgt 8220
aacttgaaag tatttcgatt tcttggcttt atatatcttg tggaaaggac gaaacaccgg 8280
aaacctgatc atgtagatcg aacggactct aaatccgttc agccgggtta gattcccggg 8340
gtttccgttt tttaatattt gcatgtcgct atgtgttctg ggaaatcacc ataaacgtga 8400
aatccctatc agtgatagag acttataagt tccctatcag tgatagagac accggggggt 8460
ggatcgaata gatcacacgg actctaaatc cgtgcaggcg ggtgaaactc ccgcaccccc 8520
cgttttttgc taggagatcc gaaccaattg tgcttgagcc taggtcgggc aggaagaggg 8580
cctatttccc atgattcctt catatttgca tatacgatac aaggctgtta gagagataat 8640
tagaattaat ttgactgtaa acacaaagat attagtacaa aatacgtgac gtagaaagta 8700
ataatttctt gggtagtttg cagttttaaa attatgtttt aaaatggact atcatatgct 8760
taccgtaact tgaaagtatt tcgatttctt ggctttatat atcttgtgga aaggacgaaa 8820
caccggaaac ctgatcatgt agatcgaacg gactctaaat ccgttcagcc gggttagatt 8880
cccggggttt ccgtttttta atatttgcat gtcgctatgt gttctgggaa atcaccataa 8940
acgtgaaatc cctatcagtg atagagactt ataagttccc tatcagtgat agagacaccg 9000
gggggtggat cgaatagatc acacggactc taaatccgtg caggcgggtg aaactcccgc 9060
accccccgtt ttttgagggc ctatttccca tgattccttc atatttgcat atacgataca 9120
aggctgttag agagataatt agaattaatt tgactgtaaa cacaaagata ttagtacaaa 9180
atacgtgacg tagaaagtaa taatttcttg ggtagtttgc agttttaaaa ttatgtttta 9240
aaatggacta tcatatgctt accgtaactt gaaagtattt cgatttcttg gctttatata 9300
tcttgtggaa aggacgaaac accggaaacc tgatcatgta gatcgaacgg actctaaatc 9360
cgttcagccg ggttagattc ccggggtttc cgttttttaa tatttgcatg tcgctatgtg 9420
ttctgggaaa tcaccataaa cgtgaaatcc ctatcagtga tagagactta taagttccct 9480
atcagtgata gagacaccgg ggggtggatc gaatagatca cacggactct aaatccgtgc 9540
aggcgggtga aactcccgca ccccccgttt tttgctagga gatccgaacc aattgtgctt 9600
gagcctaggt cgggcaggaa gagggcctat ttcccatgat tccttcatat ttgcatatac 9660
gatacaaggc tgttagagag ataattagaa ttaatttgac tgtaaacaca aagatattag 9720
tacaaaatac gtgacgtaga aagtaataat ttcttgggta gtttgcagtt ttaaaattat 9780
gttttaaaat ggactatcat atgcttaccg taacttgaaa gtatttcgat ttcttggctt 9840
tatatatctt gtggaaagga cgaaacaccg gaaacctgat catgtagatc gaacggactc 9900
taaatccgtt cagccgggtt agattcccgg ggtttccgtt ttttaatatt tgcatgtcgc 9960
tatgtgttct gggaaatcac cataaacgtg aaatccctat cagtgataga gacttataag 10020
ttccctatca gtgatagaga caccgggggg tggatcgaat agatcacacg gactctaaat 10080
ccgtgcaggc gggtgaaact cccgcacccc ccgttttttg agggcctatt tcccatgatt 10140
ccttcatatt tgcatatacg atacaaggct gttagagaga taattagaat taatttgact 10200
gtaaacacaa agatattagt acaaaatacg tgacgtagaa agtaataatt tcttgggtag 10260
tttgcagttt taaaattatg ttttaaaatg gactatcata tgcttaccgt aacttgaaag 10320
tatttcgatt tcttggcttt atatatcttg tggaaaggac gaaacaccgg aaacctgatc 10380
atgtagatcg aacggactct aaatccgttc agccgggtta gattcccggg gtttccgttt 10440
tttaatattt gcatgtcgct atgtgttctg ggaaatcacc ataaacgtga aatccctatc 10500
agtgatagag acttataagt tccctatcag tgatagagac accggggggt ggatcgaata 10560
gatcacacgg actctaaatc cgtgcaggcg ggtgaaactc ccgcaccccc cgttttttgc 10620
taggagatcc gaaccaattg tgcttgagcc taggtcgggc aggaagaggg cctatttccc 10680
atgattcctt catatttgca tatacgatac aaggctgtta gagagataat tagaattaat 10740
ttgactgtaa acacaaagat attagtacaa aatacgtgac gtagaaagta ataatttctt 10800
gggtagtttg cagttttaaa attatgtttt aaaatggact atcatatgct taccgtaact 10860
tgaaagtatt tcgatttctt ggctttatat atcttgtgga aaggacgaaa caccggaaac 10920
ctgatcatgt agatcgaacg gactctaaat ccgttcagcc gggttagatt cccggggttt 10980
ccgtttttta atatttgcat gtcgctatgt gttctgggaa atcaccataa acgtgaaatc 11040
cctatcagtg atagagactt ataagttccc tatcagtgat agagacaccg gggggtggat 11100
cgaatagatc acacggactc taaatccgtg caggcgggtg aaactcccgc accccccgtt 11160
ttttggatct ccgggtaccc tgtgcgctag catcgagcgc tatcgctcga gatggtaccg 11220
atcatcgata tgtcgacggg cccataactt cgtataatgt atgctatacg aagttatcgt 11280
gctagatcga ctgctagagt gacagatctc atacaaatcc atagagccca ccgcatcccc 11340
agcatgcctg ctattgtctt cccaatcctc ccccttgctg tcctgcccca ccccaccccc 11400
cagaatagaa tgacacctac tcagacaatg cgatgcaatt tcctcatttt attaggaaag 11460
gacagtggga gtggcacctt ccagggtcaa ggaaggcacg ggggaggggc aaacaacaga 11520
tggctggcaa ctagaaggca cagtcgaggc tgatcagcga gctctagagc tcagttagcc 11580
tcccccatct cccgggcaaa cgtgcgcgcc aggtcgcaga tcgtcggtat ggagccgggg 11640
gtggtgacgt gggtctggac catcccggag gtaagttgca gcagggcgtc ccggcagccg 11700
gcgggcgatt ggtcgtaatc caggataaag acgtgcatgg gacggaggcg tttggccaag 11760
acgtccaagg cccaggcaaa cacgttgtac aggtcgccgt tgggggccag caactcgggg 11820
gcccgaaaca gggtaaataa cgtgtccccg atatggggtc gtgggcccgc gttgctctgg 11880
ggctcggcac cctggggcgg cacggccgtc cccgaaagct gtccccaatc ctcccgccac 11940
gacccgccgc cctgcagata ccgcaccgta ttggcaagca gcccgtaaac gcggcgaatc 12000
gcggccagca tagccaggtc aagccgctcg ccggggcgct ggcgtttggc caggcggtcg 12060
atgtgtctgt cctccggaag ggcccccaac acgatgtttg tgccgggcaa ggtcggcggg 12120
atgagggcca cgaacgccag cacggcctgg ggggtcatgc tgcccataag gtatcgcgcg 12180
gccgggtagc acaggagggc ggcgatggga tggcggtcga agatgagggt gagggccggg 12240
ggcggggcat gtgagctccc agcctccccc ccgatatgag gagccagaac ggcgtcggtc 12300
acggcataag gcatgcccat tgttatctgg gcgcttgtca ttaccaccgc cgcgtccccg 12360
gccgatatct caccctggtc gaggcggtgt tgtgtggtgt agatgttcgc gattgtctcg 12420
gaagccccca gcacctgcca gtaagtcatc ggctcgggta cgtagacgat atcgtcgcgc 12480
gaacccaggg ccaccagcag ttgcgtggtg gtggttttcc ccatcccgtg aggaccgtct 12540
atataaaccc gcagtagcgt gggcatggat ccggcaccgg gcttgcgggt catgcaccag 12600
gtgcgcggtc cttcgggcac ctcgacgtcg gcggtgacgg tgaagccgag ccgctcgtag 12660
aaggggaggt tgcggggcgc ggaggtctcc aggaaggcgg gcaccccggc gcgctcggcc 12720
gcctccactc cggggagcac gacggcgctg cccagaccct tgccctggtg gtcgggcgag 12780
acgccgacgg tggccaggaa ccacgcgggc tccttgggcc ggtgcggcgc caggaggcct 12840
tccatctgtt gctgcgcggc cagccgggaa ccgctcaact cggccatgcg cgggccgatc 12900
tcggcgaaca ccgcccccgc ttcgacgctc tccggcgtgg tccagaccgc caccgcggcg 12960
ccgtcgtccg cgacccacac cttgccgatg tcgagcccga cgcgcgtgag gaagagttct 13020
tgcagctcgg tgacccgctc gatgtggcgg tccggatcga cggtgtggcg cgtggcgggg 13080
tagtcggcga acgcggcggc gagggtgcgt acggccctgg ggacgtcgtc gcgggtggcg 13140
aggcgcaccg tgggcttgta ctcggtcccc atggtggcgt tggctgcagg tcgaaaggcc 13200
cggagatgag gaagaggaga acagcgcggc agacgtgcgc ttttgaagcg tgcagaatgc 13260
cgggcctccg gaggaccttc gggcgcccgc cccgcccctg agcccgcccc tgagcccgcc 13320
cccggaccca ccccttccca gcctctgagc ccagaaagcg aaggagcaaa gctgctattg 13380
gccgctgccc caaaggccta cccgcttcca ttgctcagcg gtgctgtcca tctgcacgag 13440
actagtgaga cgtgctactt ccatttgtca cgtcctgcac gacgcgagct gcggggcggg 13500
ggggaacttc ctgactaggg gaggagtaga aggtggcgcg aaggggccac caaagaacgg 13560
agccggttgg cgcctaccgg tggatgtgga atgtgtgcga ggccagaggc cacttgtgta 13620
gcgccaagtg cccagcgggg ctgctaaagc gcatgctcca gactgccttg ggaaaagcgc 13680
ctcccctacc ccagctgaga gtagcacaat ctaggcgtca taacttcgta taatgtatgc 13740
tatacgaagt tatacgcgta tcgggatccc agtgcggccg cactgtcgcg aatcgccatg 13800
gatcgctgca gatcgcaatt ccatggatat caagcttaaa caagaatctc tagttttctt 13860
tcttgctttt acttttactt ccttaatact caagtacaat tttaatggag tactttttta 13920
cttttactca agtaagattc tagccagata cttttacttt taattgagta aaattttccc 13980
taagtacttg tactttcact tgagtaaaat ttttgagtac tttttacacc tctgctcgac 14040
catatgggag agctcccaac gcgttggatg catagcttga gtattctata gtgtcaccta 14100
aatagcttgg cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta tccgctcaca 14160
attccacaca acatacgagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg 14220
agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg 14280
tgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc 14340
tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 14400
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 14460
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 14520
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 14580
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 14640
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 14700
agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 14760
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 14820
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 14880
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 14940
cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 15000
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 15060
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 15120
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 15180
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 15240
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 15300
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 15360
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 15420
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 15480
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 15540
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 15600
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 15660
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 15720
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 15780
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 15840
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 15900
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 15960
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 16020
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 16080
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 16140
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 16200
tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 16260
aaagtgccac ctgatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat 16320
caggaaattg taagcgttaa tattttgtta aaattcgcgt taaatttttg ttaaatcagc 16380
tcatttttta accaataggc cgaaatcggc aaaatccctt ataaatcaaa agaatagacc 16440
gagatagggt tgagtgttgt tccagtttgg aacaagagtc cactattaaa gaacgtggac 16500
tccaacgtca aagggcgaaa aaccgtctat cagggcgatg gcccactacg tgaaccatca 16560
ccctaatcaa gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa ccctaaaggg 16620
agcccccgat ttagagcttg acggggaaag ccggcgaacg tggcgagaaa ggaagggaag 16680
aaagcgaaag gagcgggcgc tagggcgctg gcaagtgtag cggtcacgct gcgcgtaacc 16740
accacacccg ccgcgcttaa tgcgccgcta cagggcgcgt ccattcgcca ttcaggctgc 16800
gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag ctggcgaaag 16860
ggggatgtgc tgcaaggcga ttaagttggg taacgccagg gttttcccag tcacgacgtt 16920
gtaaaacgac ggccagtgaa ttgtaatacg actcactata 16960
<210> 15
<211> 16996
<212> DNA
<213> 人工序列
<400> 15
gggcgaattg ggcccagagg tgtaaagtac ttgagtaatt ttacttgatt actgtactta 60
agtattattt ttggggattt ttactttact tgagtacaat taaaaatcaa tacttttact 120
tttacttaat tacatttttt tagaaaaaaa agtacttttt actccttaca attttattta 180
cagtcaaaaa gtacttattt tttggagatc acttcattct attttccctt gctattacca 240
aaccaattga attgcgctga tgcccagttt aatttaaata gatctggcca tctagacatg 300
gaatcgatgt caggtaccga gctcacgggg acagcccccc cccaaagccc ccagggatgt 360
aattacgtcc ctcccccgct agggggcagc agcgagccgc ccggggctcc gctccggtcc 420
ggcgctcccc ccgcatcccc gagccggcag cgtgcgggga cagcccgggc acggggaagg 480
tggcacggga tcgctttcct ctgaacgctt ctcgctgctc tttgagcctg cagacacctg 540
gggggatacg gggaaaaagc tttaggctga aagagagatt tagaatgaca gaatcataga 600
acggcctggg ttgcaaagga gcacagtgct catccagatc caaccccctg ctatgtgcag 660
ggtcatcaac cagcagccca ggctgcccag agccacatcc agcctggcct tgaatgcctg 720
cagggatggg gcatccacag cctccttggg caacctgttc agtgcgtcac caccctctgg 780
gggaaaaact gcctcctcat atccaaccca aacctcccct gtctcagtgt aaagccattc 840
ccccttgtcc tatcaagggg gagtttgctg tgacattgtt ggtctggggt gacacatgtt 900
tgccaattca gtgcatcacg gagaggcaga tcttggggat aaggaagtgc aggacagcat 960
ggacgtggga catgcaggtg ttgagggctc tgggacactc tccaagtcac agcgttcaga 1020
acagccttaa ggataagaag ataggataga aggacaaaga gcaagttaaa acccagcatg 1080
gagaggagca caaaaaggcc acagacactg ctggtccctg tgtctgagcc tgcatgtttg 1140
atggtgtctg gatgcaagca gaaggggtgg aagagcttgc ctggagagat acagctgggt 1200
cagtaggact gggacaggca gctggagaat tgccatgtag atgttcatac aatcgtcaaa 1260
tcatgaaggc tggaaaagcc ctccaagatc cccaagacca accccaaccc acccaccgtg 1320
cccactggcc atgtccctca gtgccacatc cccacagttc ttcatcacct ccagggacgg 1380
tgaccccccc acctccgtgg gcagctgtgc cactgcagca ccgctctttg gagaaggtaa 1440
atcttgctaa atccagcccg accctcccct ggcacaacgt aaggccatta tctctcatcc 1500
aactccagga cggagtcagt gagaatattc tcgacggtac cgagctcacg gggacagccc 1560
ccccccaaag cccccaggga tgtaattacg tccctccccc gctagggggc agcagcgagc 1620
cgcccggggc tccgctccgg tccggcgctc cccccgcatc cccgagccgg cagcgtgcgg 1680
ggacagcccg ggcacgggga aggtggcacg ggatcgcttt cctctgaacg cttctcgctg 1740
ctctttgagc ctgcagacac ctggggggat acggggaaaa agctttaggc tgaaagagag 1800
atttagaatg acagaatcat agaacggcct gggttgcaaa ggagcacagt gctcatccag 1860
atccaacccc ctgctatgtg cagggtcatc aaccagcagc ccaggctgcc cagagccaca 1920
tccagcctgg ccttgaatgc ctgcagggat ggggcatcca cagcctcctt gggcaacctg 1980
ttcagtgcgt caccaccctc tgggggaaaa actgcctcct catatccaac ccaaacctcc 2040
cctgtctcag tgtaaagcca ttcccccttg tcctatcaag ggggagtttg ctgtgacatt 2100
gttggtctgg ggtgacacat gtttgccaat tcagtgcatc acggagaggc agatcttggg 2160
gataaggaag tgcaggacag catggacgtg ggacatgcag gtgttgaggg ctctgggaca 2220
ctctccaagt cacagcgttc agaacagcct taaggataag aagataggat agaaggacaa 2280
agagcaagtt aaaacccagc atggagagga gcacaaaaag gccacagaca ctgctggtcc 2340
ctgtgtctga gcctgcatgt ttgatggtgt ctggatgcaa gcagaagggg tggaagagct 2400
tgcctggaga gatacagctg ggtcagtagg actgggacag gcagctggag aattgccatg 2460
tagatgttca tacaatcgtc aaatcatgaa ggctggaaaa gccctccaag atccccaaga 2520
ccaaccccaa cccacccacc gtgcccactg gccatgtccc tcagtgccac atccccacag 2580
ttcttcatca cctccaggga cggtgacccc cccacctccg tgggcagctg tgccactgca 2640
gcaccgctct ttggagaagg taaatcttgc taaatccagc ccgaccctcc cctggcacaa 2700
cgtaaggcca ttatctctca tccaactcca ggacggagtc agtgagaata ttctcgagga 2760
tccgcggccg cttaattaac cgtttaaaca attctgcagg aatctagtta ttaatagtaa 2820
tcaattacgg ggtcattagt tcatagccca tatatggagt tccgcgttac ataacttacg 2880
gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc aataatgacg 2940
tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt ggagtattta 3000
cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac gccccctatt 3060
gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac cttatgggac 3120
tttcctactt ggcagtacat ctacgtatta gtcatcgcta ttaccatggt cgaggtgagc 3180
cccacgttct gcttcactct ccccatctcc cccccctccc cacccccaat tttgtattta 3240
tttatttttt aattattttg tgcagcgatg ggggcggggg gggggggggg gcgcgcgcca 3300
ggcggggcgg ggcggggcga ggggcggggc ggggcgaggc ggagaggtgc ggcggcagcc 3360
aatcagagcg gcgcgctccg aaagtttcct tttatggcga ggcggcggcg gcggcggccc 3420
tataaaaagc gaagcgcgcg gcgggcgggg agtcgctgcg acgctgcctt cgccccgtgc 3480
cccgctccgc cgccgcctcg cgccgcccgc cccggctctg actgaccgcg ttactcccac 3540
aggtgagcgg gcgggacggc ccttctcctc cgggctgtaa ttagcgcttg gtttaatgac 3600
ggcttgtttc ttttctgtgg ctgcgtgaaa gccttgaggg gctccgggag ggccctttgt 3660
gcggggggag cggctcgggg ggtgcgtgcg tgtgtgtgtg cgtggggagc gccgcgtgcg 3720
gctccgcgct gcccggcggc tgtgagcgct gcgggcgcgg cgcggggctt tgtgcgctcc 3780
gcagtgtgcg cgaggggagc gcggccgggg gcggtgcccc gcggtgcggg gggggctgcg 3840
aggggaacaa aggctgcgtg cggggtgtgt gcgtgggggg gtgagcaggg ggtgtgggcg 3900
cgtcggtcgg gctgcaaccc cccctgcacc cccctccccg agttgctgag cacggcccgg 3960
cttcgggtgc ggggctccgt acggggcgtg gcgcggggct cgccgtgccg ggcggggggt 4020
ggcggcaggt gggggtgccg ggcggggcgg ggccgcctcg ggccggggag ggctcggggg 4080
aggggcgcgg cggcccccgg agcgccggcg gctgtcgagg cgcggcgagc cgcagccatt 4140
gccttttatg gtaatcgtgc gagagggcgc agggacttcc tttgtcccaa atctgtgcgg 4200
agccgaaatc tgggaggcgc cgccgcaccc cctctagcgg gcgcggggcg aagcggtgcg 4260
gcgccggcag gaaggaaatg ggcggggagg gccttcgtgc gtcgccgcgc cgccgtcccc 4320
ttctccctct ccagcctcgg ggctgtccgc ggggggacgg ctgccttcgg gggggacggg 4380
gcagggcggg gttcggcttc tggcgtgtga ccggcggctc tagagcctct gctaaccatg 4440
ttcatgcctt cttctttttc ctacagctcc tgggcaacgt gctggttatt gtgctgtctc 4500
atcattttgg caaagaattg atttgatacc gcatttaaat gccaccatgg agcaaaagct 4560
catttctgaa gaggacttgg caagcagtaa cttgattaaa caattgcaag agcgggggct 4620
ggtagcccag gtgacggacg aggaagcgtt agcagagcga ctggcgcaag gcccgatcgc 4680
actcgtgtgt ggcttcgatc ctaccgctga cagcttgcat ttggggcatc ttgttccatt 4740
gttatgcctg aaacgcttcc agcaggcggg ccacaagccg gttgcgctgg taggcggcgc 4800
gacgggtctg attggcgacc cgagcttcaa agctgccgag cgtaagctga acaccgaaga 4860
aactgttcag gagtgggtgg acaaaatccg taagcaggtt gccccgttcc tcgatttcga 4920
ctgtggagaa aactctgcta tcgcggccaa taattatgac tggttcggca atatgaatgt 4980
gctgaccttc ctgcgcgata ttggcaaaca cttctccgtt aaccagatga tcaacaaaga 5040
agcggttaag cagcgtctca accgtgaaga tcaggggatt tcgttcactg agttttccta 5100
caacctgctg cagggttata gtatggcctg tttgaacaaa cagtacggtg tggtgctgca 5160
aattggtggt tctgaccagt ggggtaacat cacttctggt atcgacctga cccgtcgtct 5220
gcatcagaat caggtgtttg gcctgaccgt tccgctgatc actaaagcag atggcaccaa 5280
atttggtaaa actgaaggcg gcgcagtctg gttggatccg aagaaaacca gcccgtacaa 5340
attctaccag ttctggatca acactgcgcg tgccgacgtt taccgcttcc tgaagttctt 5400
cacctttatg agcattgaag agatcaacgc cctggaagaa gaagataaaa acagcggtaa 5460
agcaccgcgc gcccagtatg tactggcgga gcaggtgact cgtctggttc acggtgaaga 5520
aggtttacag gcggcaaaac gtattaccga atgcctgttc agcggttctt tgagtgcgct 5580
gagtgaagcg gacttcgaac agctggcgca ggacggcgta ccgatggttg agatggaaaa 5640
gggcgcagac ctgatgcagg cactggtcga ttctgaactg caaccttccc gtggtcaggc 5700
acgtaaaact atcgcctcca atgccatcac cattaacggt gaaaaacagt ccgatcctga 5760
atacttcttt aaagaagaag atcgtctgtt tggtcgtttt accttactgc gtcgcggtaa 5820
aaagaattac tgtctgattt gctggaaagg gcccgtttaa cccctctccc tccccccccc 5880
ctaacgttac tggccgaagc cgcttggaat aaggccggtg tgcgtttgtc tatatgttat 5940
tttccaccat attgccgtct tttggcaatg tgagggcccg gaaacctggc cctgtcttct 6000
tgacgagcat tcctaggggt ctttcccctc tcgccaaagg aatgcaaggt ctgttgaatg 6060
tcgtgaagga agcagttcct ctggaagctt cttgaagaca aacaacgtct gtagcgaccc 6120
tttgcaggca gcggaacccc ccacctggcg acaggtgcct ctgcggccaa aagccacgtg 6180
tataagatac acctgcaaag gcggcacaac cccagtgcca cgttgtgagt tggatagttg 6240
tggaaagagt caaatggctc tcctcaagcg tattcaacaa ggggctgaag gatgcccaga 6300
aggtacccca ttgtatggga tctgatctgg ggcctcggtg cacatgcttt acatgtgttt 6360
agtcgaggtt aaaaaaacgt ctaggccccc cgaaccacgg ggacgtggtt ttcctttgaa 6420
aaacacgatg ataatatggc cacaaccatg gtgagcaagg gcgaggagct gttcaccggg 6480
gtggtgccca tcctggtcga gctggacggc gacgtaaacg gccacaagtt cagcgtgtcc 6540
ggcgagggcg agggcgatgc cacctagggc aagctgaccc tgaagttcat ctgcaccacc 6600
ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc tgacctacgg cgtgcagtgc 6660
ttcagccgct accccgacca catgaagcag cacgacttct tcaagtccgc catgcccgaa 6720
ggctacgtcc aggagcgcac catcttcttc aaggacgacg gcaactacaa gacccgcgcc 6780
gaggtgaagt tcgagggcga caccctggtg aaccgcatcg agctgaaggg catcgacttc 6840
aaggaggacg gcaacatcct ggggcacaag ctggagtaca actacaacag ccacaacgtc 6900
tatatcatgg ccgacaagca gaagaacggc atcaaggtga acttcaagat ccgccacaac 6960
atcgaggacg gcagcgtgca gctcgccgac cactaccagc agaacacccc catcggcgac 7020
ggccccgtgc tgctgcccga caaccactac ctgagcaccc agtccgccct gagcaaagac 7080
cccaacgaga agcgcgatca catggtcctg ctggagttcg tgaccgccgc cgggatcact 7140
ctcggcatgg acgagctgta caagtaggcg atcgccaaat tcgatatcaa gcttatcgat 7200
aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 7260
ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 7320
atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 7380
tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 7440
ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 7500
attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 7560
ttgggcactg acaattccgt ggtgttgtcg gggaaatcat cgtcctttcc ttggctgctc 7620
gcctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 7680
aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 7740
cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgca tcgataccgt 7800
cgacctcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt 7860
ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat 7920
cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg 7980
gggaggattg ggaagacaat agcaggcatg ctggggaact agtggcgcgc ctgcatgcct 8040
gcaggtcgac gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc 8100
tgttagagag ataattagaa ttaatttgac tgtaaacaca aagatattag tacaaaatac 8160
gtgacgtaga aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat 8220
ggactatcat atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt 8280
gtggaaagga cgaaacaccg gtggggttcc cgagcggcca aagggagcag actctaaatc 8340
tgccgtcaca gacttcgaag gttcgaatcc ttcccccacc attttttaat atttgcatgt 8400
cgctatgtgt tctgggaaat caccataaac gtgaaatccc tatcagtgat agagacttat 8460
aagttcccta tcagtgatag agacaccgga ggggtagcga agtggctaaa cgcggcggac 8520
tctaaatccg ctccctttgg gttcggcggt tcgaatccgt ccccctccat tttttgaggg 8580
cctatttccc atgattcctt catatttgca tatacgatac aaggctgtta gagagataat 8640
tagaattaat ttgactgtaa acacaaagat attagtacaa aatacgtgac gtagaaagta 8700
ataatttctt gggtagtttg cagttttaaa attatgtttt aaaatggact atcatatgct 8760
taccgtaact tgaaagtatt tcgatttctt ggctttatat atcttgtgga aaggacgaaa 8820
caccggtggg gttcccgagc ggccaaaggg agcagactct aaatctgccg tcacagactt 8880
cgaaggttcg aatccttccc ccaccatttt ttaatatttg catgtcgcta tgtgttctgg 8940
gaaatcacca taaacgtgaa atccctatca gtgatagaga cttataagtt ccctatcagt 9000
gatagagaca ccggaggggt agcgaagtgg ctaaacgcgg cggactctaa atccgctccc 9060
tttgggttcg gcggttcgaa tccgtccccc tccatttttt gagggcctat ttcccatgat 9120
tccttcatat ttgcatatac gatacaaggc tgttagagag ataattagaa ttaatttgac 9180
tgtaaacaca aagatattag tacaaaatac gtgacgtaga aagtaataat ttcttgggta 9240
gtttgcagtt ttaaaattat gttttaaaat ggactatcat atgcttaccg taacttgaaa 9300
gtatttcgat ttcttggctt tatatatctt gtggaaagga cgaaacaccg gtggggttcc 9360
cgagcggcca aagggagcag actctaaatc tgccgtcaca gacttcgaag gttcgaatcc 9420
ttcccccacc attttttaat atttgcatgt cgctatgtgt tctgggaaat caccataaac 9480
gtgaaatccc tatcagtgat agagacttat aagttcccta tcagtgatag agacaccgga 9540
ggggtagcga agtggctaaa cgcggcggac tctaaatccg ctccctttgg gttcggcggt 9600
tcgaatccgt ccccctccat tttttgaggg cctatttccc atgattcctt catatttgca 9660
tatacgatac aaggctgtta gagagataat tagaattaat ttgactgtaa acacaaagat 9720
attagtacaa aatacgtgac gtagaaagta ataatttctt gggtagtttg cagttttaaa 9780
attatgtttt aaaatggact atcatatgct taccgtaact tgaaagtatt tcgatttctt 9840
ggctttatat atcttgtgga aaggacgaaa caccggtggg gttcccgagc ggccaaaggg 9900
agcagactct aaatctgccg tcacagactt cgaaggttcg aatccttccc ccaccatttt 9960
ttaatatttg catgtcgcta tgtgttctgg gaaatcacca taaacgtgaa atccctatca 10020
gtgatagaga cttataagtt ccctatcagt gatagagaca ccggaggggt agcgaagtgg 10080
ctaaacgcgg cggactctaa atccgctccc tttgggttcg gcggttcgaa tccgtccccc 10140
tccatttttt gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc 10200
tgttagagag ataattagaa ttaatttgac tgtaaacaca aagatattag tacaaaatac 10260
gtgacgtaga aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat 10320
ggactatcat atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt 10380
gtggaaagga cgaaacaccg gtggggttcc cgagcggcca aagggagcag actctaaatc 10440
tgccgtcaca gacttcgaag gttcgaatcc ttcccccacc attttttaat atttgcatgt 10500
cgctatgtgt tctgggaaat caccataaac gtgaaatccc tatcagtgat agagacttat 10560
aagttcccta tcagtgatag agacaccgga ggggtagcga agtggctaaa cgcggcggac 10620
tctaaatccg ctccctttgg gttcggcggt tcgaatccgt ccccctccat tttttgaggg 10680
cctatttccc atgattcctt catatttgca tatacgatac aaggctgtta gagagataat 10740
tagaattaat ttgactgtaa acacaaagat attagtacaa aatacgtgac gtagaaagta 10800
ataatttctt gggtagtttg cagttttaaa attatgtttt aaaatggact atcatatgct 10860
taccgtaact tgaaagtatt tcgatttctt ggctttatat atcttgtgga aaggacgaaa 10920
caccggtggg gttcccgagc ggccaaaggg agcagactct aaatctgccg tcacagactt 10980
cgaaggttcg aatccttccc ccaccatttt ttaatatttg catgtcgcta tgtgttctgg 11040
gaaatcacca taaacgtgaa atccctatca gtgatagaga cttataagtt ccctatcagt 11100
gatagagaca ccggaggggt agcgaagtgg ctaaacgcgg cggactctaa atccgctccc 11160
tttgggttcg gcggttcgaa tccgtccccc tccatttttt ggatctccgg gtaccctgtg 11220
cgctagcatc gagcgctatc gctcgagatg gtaccgatca tcgatatgtc gacgggccca 11280
taacttcgta taatgtatgc tatacgaagt tatcgtgcta gatcgactgc tagagtgaca 11340
gatctcatac aaatccatag agcccaccgc atccccagca tgcctgctat tgtcttccca 11400
atcctccccc ttgctgtcct gccccacccc accccccaga atagaatgac acctactcag 11460
acaatgcgat gcaatttcct cattttatta ggaaaggaca gtgggagtgg caccttccag 11520
ggtcaaggaa ggcacggggg aggggcaaac aacagatggc tggcaactag aaggcacagt 11580
cgaggctgat cagcgagctc tagagctcag ttagcctccc ccatctcccg ggcaaacgtg 11640
cgcgccaggt cgcagatcgt cggtatggag ccgggggtgg tgacgtgggt ctggaccatc 11700
ccggaggtaa gttgcagcag ggcgtcccgg cagccggcgg gcgattggtc gtaatccagg 11760
ataaagacgt gcatgggacg gaggcgtttg gccaagacgt ccaaggccca ggcaaacacg 11820
ttgtacaggt cgccgttggg ggccagcaac tcgggggccc gaaacagggt aaataacgtg 11880
tccccgatat ggggtcgtgg gcccgcgttg ctctggggct cggcaccctg gggcggcacg 11940
gccgtccccg aaagctgtcc ccaatcctcc cgccacgacc cgccgccctg cagataccgc 12000
accgtattgg caagcagccc gtaaacgcgg cgaatcgcgg ccagcatagc caggtcaagc 12060
cgctcgccgg ggcgctggcg tttggccagg cggtcgatgt gtctgtcctc cggaagggcc 12120
cccaacacga tgtttgtgcc gggcaaggtc ggcgggatga gggccacgaa cgccagcacg 12180
gcctgggggg tcatgctgcc cataaggtat cgcgcggccg ggtagcacag gagggcggcg 12240
atgggatggc ggtcgaagat gagggtgagg gccgggggcg gggcatgtga gctcccagcc 12300
tcccccccga tatgaggagc cagaacggcg tcggtcacgg cataaggcat gcccattgtt 12360
atctgggcgc ttgtcattac caccgccgcg tccccggccg atatctcacc ctggtcgagg 12420
cggtgttgtg tggtgtagat gttcgcgatt gtctcggaag cccccagcac ctgccagtaa 12480
gtcatcggct cgggtacgta gacgatatcg tcgcgcgaac ccagggccac cagcagttgc 12540
gtggtggtgg ttttccccat cccgtgagga ccgtctatat aaacccgcag tagcgtgggc 12600
atggatccgg caccgggctt gcgggtcatg caccaggtgc gcggtccttc gggcacctcg 12660
acgtcggcgg tgacggtgaa gccgagccgc tcgtagaagg ggaggttgcg gggcgcggag 12720
gtctccagga aggcgggcac cccggcgcgc tcggccgcct ccactccggg gagcacgacg 12780
gcgctgccca gacccttgcc ctggtggtcg ggcgagacgc cgacggtggc caggaaccac 12840
gcgggctcct tgggccggtg cggcgccagg aggccttcca tctgttgctg cgcggccagc 12900
cgggaaccgc tcaactcggc catgcgcggg ccgatctcgg cgaacaccgc ccccgcttcg 12960
acgctctccg gcgtggtcca gaccgccacc gcggcgccgt cgtccgcgac ccacaccttg 13020
ccgatgtcga gcccgacgcg cgtgaggaag agttcttgca gctcggtgac ccgctcgatg 13080
tggcggtccg gatcgacggt gtggcgcgtg gcggggtagt cggcgaacgc ggcggcgagg 13140
gtgcgtacgg ccctggggac gtcgtcgcgg gtggcgaggc gcaccgtggg cttgtactcg 13200
gtccccatgg tggcgttggc tgcaggtcga aaggcccgga gatgaggaag aggagaacag 13260
cgcggcagac gtgcgctttt gaagcgtgca gaatgccggg cctccggagg accttcgggc 13320
gcccgccccg cccctgagcc cgcccctgag cccgcccccg gacccacccc ttcccagcct 13380
ctgagcccag aaagcgaagg agcaaagctg ctattggccg ctgccccaaa ggcctacccg 13440
cttccattgc tcagcggtgc tgtccatctg cacgagacta gtgagacgtg ctacttccat 13500
ttgtcacgtc ctgcacgacg cgagctgcgg ggcggggggg aacttcctga ctaggggagg 13560
agtagaaggt ggcgcgaagg ggccaccaaa gaacggagcc ggttggcgcc taccggtgga 13620
tgtggaatgt gtgcgaggcc agaggccact tgtgtagcgc caagtgccca gcggggctgc 13680
taaagcgcat gctccagact gccttgggaa aagcgcctcc cctaccccag ctgagagtag 13740
cacaatctag gcgtcataac ttcgtataat gtatgctata cgaagttata cgcgtatcgg 13800
gatcccagtg cggccgcact gtcgcgaatc gccatggatc gctgcagatc gcaattccat 13860
ggatatcaag cttaaacaag aatctctagt tttctttctt gcttttactt ttacttcctt 13920
aatactcaag tacaatttta atggagtact tttttacttt tactcaagta agattctagc 13980
cagatacttt tacttttaat tgagtaaaat tttccctaag tacttgtact ttcacttgag 14040
taaaattttt gagtactttt tacacctctg ctcgaccata tgggagagct cccaacgcgt 14100
tggatgcata gcttgagtat tctatagtgt cacctaaata gcttggcgta atcatggtca 14160
tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat acgagccgga 14220
agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt aattgcgttg 14280
cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc 14340
caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc gctcactgac 14400
tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata 14460
cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa 14520
aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct 14580
gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa 14640
agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg 14700
cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca 14760
cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa 14820
ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg 14880
gtaagacacg acttatcgcc actggcagca gccactggta acaggattag cagagcgagg 14940
tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta cactagaaga 15000
acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc 15060
tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag 15120
attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac 15180
gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc 15240
ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag tatatatgag 15300
taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt 15360
ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac gatacgggag 15420
ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc accggctcca 15480
gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg tcctgcaact 15540
ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag tagttcgcca 15600
gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg 15660
tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac atgatccccc 15720
atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag aagtaagttg 15780
gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac tgtcatgcca 15840
tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg agaatagtgt 15900
atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc gccacatagc 15960
agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc 16020
ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg atcttcagca 16080
tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa 16140
aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt tcaatattat 16200
tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 16260
aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga tgcggtgtga 16320
aataccgcac agatgcgtaa ggagaaaata ccgcatcagg aaattgtaag cgttaatatt 16380
ttgttaaaat tcgcgttaaa tttttgttaa atcagctcat tttttaacca ataggccgaa 16440
atcggcaaaa tcccttataa atcaaaagaa tagaccgaga tagggttgag tgttgttcca 16500
gtttggaaca agagtccact attaaagaac gtggactcca acgtcaaagg gcgaaaaacc 16560
gtctatcagg gcgatggccc actacgtgaa ccatcaccct aatcaagttt tttggggtcg 16620
aggtgccgta aagcactaaa tcggaaccct aaagggagcc cccgatttag agcttgacgg 16680
ggaaagccgg cgaacgtggc gagaaaggaa gggaagaaag cgaaaggagc gggcgctagg 16740
gcgctggcaa gtgtagcggt cacgctgcgc gtaaccacca cacccgccgc gcttaatgcg 16800
ccgctacagg gcgcgtccat tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg 16860
tgcgggcctc ttcgctatta cgccagctgg cgaaaggggg atgtgctgca aggcgattaa 16920
gttgggtaac gccagggttt tcccagtcac gacgttgtaa aacgacggcc agtgaattgt 16980
aatacgactc actata 16996
<210> 16
<211> 17503
<212> DNA
<213> 人工序列
<400> 16
gggcgaattg ggcccagagg tgtaaagtac ttgagtaatt ttacttgatt actgtactta 60
agtattattt ttggggattt ttactttact tgagtacaat taaaaatcaa tacttttact 120
tttacttaat tacatttttt tagaaaaaaa agtacttttt actccttaca attttattta 180
cagtcaaaaa gtacttattt tttggagatc acttcattct attttccctt gctattacca 240
aaccaattga attgcgctga tgcccagttt aatttaaata gatctggcca tctagacatg 300
gaatcgatgt caggtaccga gctcacgggg acagcccccc cccaaagccc ccagggatgt 360
aattacgtcc ctcccccgct agggggcagc agcgagccgc ccggggctcc gctccggtcc 420
ggcgctcccc ccgcatcccc gagccggcag cgtgcgggga cagcccgggc acggggaagg 480
tggcacggga tcgctttcct ctgaacgctt ctcgctgctc tttgagcctg cagacacctg 540
gggggatacg gggaaaaagc tttaggctga aagagagatt tagaatgaca gaatcataga 600
acggcctggg ttgcaaagga gcacagtgct catccagatc caaccccctg ctatgtgcag 660
ggtcatcaac cagcagccca ggctgcccag agccacatcc agcctggcct tgaatgcctg 720
cagggatggg gcatccacag cctccttggg caacctgttc agtgcgtcac caccctctgg 780
gggaaaaact gcctcctcat atccaaccca aacctcccct gtctcagtgt aaagccattc 840
ccccttgtcc tatcaagggg gagtttgctg tgacattgtt ggtctggggt gacacatgtt 900
tgccaattca gtgcatcacg gagaggcaga tcttggggat aaggaagtgc aggacagcat 960
ggacgtggga catgcaggtg ttgagggctc tgggacactc tccaagtcac agcgttcaga 1020
acagccttaa ggataagaag ataggataga aggacaaaga gcaagttaaa acccagcatg 1080
gagaggagca caaaaaggcc acagacactg ctggtccctg tgtctgagcc tgcatgtttg 1140
atggtgtctg gatgcaagca gaaggggtgg aagagcttgc ctggagagat acagctgggt 1200
cagtaggact gggacaggca gctggagaat tgccatgtag atgttcatac aatcgtcaaa 1260
tcatgaaggc tggaaaagcc ctccaagatc cccaagacca accccaaccc acccaccgtg 1320
cccactggcc atgtccctca gtgccacatc cccacagttc ttcatcacct ccagggacgg 1380
tgaccccccc acctccgtgg gcagctgtgc cactgcagca ccgctctttg gagaaggtaa 1440
atcttgctaa atccagcccg accctcccct ggcacaacgt aaggccatta tctctcatcc 1500
aactccagga cggagtcagt gagaatattc tcgacggtac cgagctcacg gggacagccc 1560
ccccccaaag cccccaggga tgtaattacg tccctccccc gctagggggc agcagcgagc 1620
cgcccggggc tccgctccgg tccggcgctc cccccgcatc cccgagccgg cagcgtgcgg 1680
ggacagcccg ggcacgggga aggtggcacg ggatcgcttt cctctgaacg cttctcgctg 1740
ctctttgagc ctgcagacac ctggggggat acggggaaaa agctttaggc tgaaagagag 1800
atttagaatg acagaatcat agaacggcct gggttgcaaa ggagcacagt gctcatccag 1860
atccaacccc ctgctatgtg cagggtcatc aaccagcagc ccaggctgcc cagagccaca 1920
tccagcctgg ccttgaatgc ctgcagggat ggggcatcca cagcctcctt gggcaacctg 1980
ttcagtgcgt caccaccctc tgggggaaaa actgcctcct catatccaac ccaaacctcc 2040
cctgtctcag tgtaaagcca ttcccccttg tcctatcaag ggggagtttg ctgtgacatt 2100
gttggtctgg ggtgacacat gtttgccaat tcagtgcatc acggagaggc agatcttggg 2160
gataaggaag tgcaggacag catggacgtg ggacatgcag gtgttgaggg ctctgggaca 2220
ctctccaagt cacagcgttc agaacagcct taaggataag aagataggat agaaggacaa 2280
agagcaagtt aaaacccagc atggagagga gcacaaaaag gccacagaca ctgctggtcc 2340
ctgtgtctga gcctgcatgt ttgatggtgt ctggatgcaa gcagaagggg tggaagagct 2400
tgcctggaga gatacagctg ggtcagtagg actgggacag gcagctggag aattgccatg 2460
tagatgttca tacaatcgtc aaatcatgaa ggctggaaaa gccctccaag atccccaaga 2520
ccaaccccaa cccacccacc gtgcccactg gccatgtccc tcagtgccac atccccacag 2580
ttcttcatca cctccaggga cggtgacccc cccacctccg tgggcagctg tgccactgca 2640
gcaccgctct ttggagaagg taaatcttgc taaatccagc ccgaccctcc cctggcacaa 2700
cgtaaggcca ttatctctca tccaactcca ggacggagtc agtgagaata ttctcgagga 2760
tccgcggccg cttaattaac cgtttaaaca attctgcagg aatctagtta ttaatagtaa 2820
tcaattacgg ggtcattagt tcatagccca tatatggagt tccgcgttac ataacttacg 2880
gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc aataatgacg 2940
tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt ggagtattta 3000
cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac gccccctatt 3060
gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac cttatgggac 3120
tttcctactt ggcagtacat ctacgtatta gtcatcgcta ttaccatggt cgaggtgagc 3180
cccacgttct gcttcactct ccccatctcc cccccctccc cacccccaat tttgtattta 3240
tttatttttt aattattttg tgcagcgatg ggggcggggg gggggggggg gcgcgcgcca 3300
ggcggggcgg ggcggggcga ggggcggggc ggggcgaggc ggagaggtgc ggcggcagcc 3360
aatcagagcg gcgcgctccg aaagtttcct tttatggcga ggcggcggcg gcggcggccc 3420
tataaaaagc gaagcgcgcg gcgggcgggg agtcgctgcg acgctgcctt cgccccgtgc 3480
cccgctccgc cgccgcctcg cgccgcccgc cccggctctg actgaccgcg ttactcccac 3540
aggtgagcgg gcgggacggc ccttctcctc cgggctgtaa ttagcgcttg gtttaatgac 3600
ggcttgtttc ttttctgtgg ctgcgtgaaa gccttgaggg gctccgggag ggccctttgt 3660
gcggggggag cggctcgggg ggtgcgtgcg tgtgtgtgtg cgtggggagc gccgcgtgcg 3720
gctccgcgct gcccggcggc tgtgagcgct gcgggcgcgg cgcggggctt tgtgcgctcc 3780
gcagtgtgcg cgaggggagc gcggccgggg gcggtgcccc gcggtgcggg gggggctgcg 3840
aggggaacaa aggctgcgtg cggggtgtgt gcgtgggggg gtgagcaggg ggtgtgggcg 3900
cgtcggtcgg gctgcaaccc cccctgcacc cccctccccg agttgctgag cacggcccgg 3960
cttcgggtgc ggggctccgt acggggcgtg gcgcggggct cgccgtgccg ggcggggggt 4020
ggcggcaggt gggggtgccg ggcggggcgg ggccgcctcg ggccggggag ggctcggggg 4080
aggggcgcgg cggcccccgg agcgccggcg gctgtcgagg cgcggcgagc cgcagccatt 4140
gccttttatg gtaatcgtgc gagagggcgc agggacttcc tttgtcccaa atctgtgcgg 4200
agccgaaatc tgggaggcgc cgccgcaccc cctctagcgg gcgcggggcg aagcggtgcg 4260
gcgccggcag gaaggaaatg ggcggggagg gccttcgtgc gtcgccgcgc cgccgtcccc 4320
ttctccctct ccagcctcgg ggctgtccgc ggggggacgg ctgccttcgg gggggacggg 4380
gcagggcggg gttcggcttc tggcgtgtga ccggcggctc tagagcctct gctaaccatg 4440
ttcatgcctt cttctttttc ctacagctcc tgggcaacgt gctggttatt gtgctgtctc 4500
atcattttgg caaagaattg atttgatacc gcatttaaat gccaccatgg agcaaaagct 4560
catttctgaa gaggacttgg aagagcaata ccgcccggaa gagatagaat ccaaagtaca 4620
gcttcattgg gatgagaagc gcacatttga agtaaccgaa gacgagagca aagagaagta 4680
ttactgcttt tctggccctc cctatccttc tggtcgacta cacatgggcc acgtacgtaa 4740
ctacaccatc ggtgacgtga tcgcccgcta ccagcgtatg ctgggcaaaa acgtcctgca 4800
gccgatcggc tgggacgcgt ttggtctgcc tgcggaaggc gcggcggtga aaaacaacac 4860
cgctccggca ccgtggacgt acgacaacat cgcgtatatg aaaaaccagc tcaaaatgct 4920
gggctttggt tatgactgga gccgcgagct ggcaacctgt acgccggaat actaccgttg 4980
ggaacagaaa ttcttcaccg agctgtataa aaaaggcctg gtatataaga agacttctgc 5040
ggtcaactgg tgtccgaacg accagaccgt actggcgaac gaacaagtta tcgacggctg 5100
ctgctggcgc tgcgatacca aagttgaacg taaagagatc ccgcagtggt ttatcaaaat 5160
cactgcttac gctgacgagc tgctcaacga tctggataaa ctggatcact ggcctgacac 5220
cgttaaaacc atgcagcgta actggatcgg tcgttccgaa ggcgtggaga tcaccttcaa 5280
cgttaacgac tatgacaaca cgctgaccgt ttacactacc cgcccggaca cctttatggg 5340
ttgtacctac ctggcggtag ctgcgggtca tccgctggcg cagaaagcgg cggaaaataa 5400
tcctgaactg gcggccttta ttgacgaatg ccgtaacacc aaagttgccg aagctgaaat 5460
ggcgacgatg gagaaaaaag gcgtcgatac tggctttaaa gcggttcacc cattaacggg 5520
cgaagaaatt cccgtttggg cagcaaactt cgtattgatg gagtacggca cgggcgcagt 5580
tatggcggta ccggggcacg accagcgcga ctacgagttt gcctctaaat acggcctgaa 5640
catcaaaccg gttatcctgg cagctgacgg ctctgagcca gatctttctc agcaagccct 5700
gactgaaaaa ggcgtgctgt tcaactctgg cgagttcaac ggtcttgacc atgaagcggc 5760
cttcaacgcc atcgccgata aactgactgc gatgggcgtt ggcgagcgta aagtgaacta 5820
ccgcctgcgc gactggggtg tttcccgtca gcgttactgg ggcgcgccga ttccgatggt 5880
gactctagaa gacggtaccg taatgccgac cccggacgac cagctgccgg tgatcctgcc 5940
ggaggatgtg gtaatggacg gcattaccag cccgattaaa gcagatccgg agtgggcgaa 6000
aactaccgtt aacggtatgc cagcactgcg tgaaaccgac actttcgaca cctttatgga 6060
gtcctcctgg gttcttgcgc gctacacttg cccgcagtac aaagaaggta tgctggattc 6120
cgaagcggct aactactggc tgccggtgga tatcgcgatt ggtggtattg aacacgccat 6180
tatggagagt ctctactgtc gcttcttcca caaactgatg cgtgatgcag gcatggtgaa 6240
ctctgacgaa ccagttaaac agttgctgtg tcagggtatg gtgctggcag atgccttcta 6300
ctatgttggc gaaaacggcg aacgtaactg ggtttccccg gttgatgcta tcgttgaacg 6360
tgacgagaaa ggccgtatcg tgaaagcgaa agatgcggca ggccatgaac tggtttatac 6420
cggcatgagc aaaatgtcca agtcgaagaa caacggtatc gacccgcagg tgatggttga 6480
acgttacggc gcggacaccg ttcgtctgtt tatgatgttt gcttctccgg ctgatatgac 6540
tctcgaatgg caggaatccg gtgtggaagg ggctaaccgc ttcctgaaac gtgtctggaa 6600
actggtttac gagcacacag caaaaagtga tgttgcggca ctgaacgttg atgcgctgac 6660
tgaaaatcag aaagcgctgc gtcgcgatgt gcataaaacg atcgctaaag tgaccgatga 6720
tatcggccgt cgtcagacct tcaacaccgc aattgcggcg attatggagc tgatgaacaa 6780
actggcgaaa gcaccaaccg atggcgagca ggatcgcgct ctgatgcagg aagcactgct 6840
ggccgttgtc cgtatgctta acccgttcac cccgcacatc tgcttcacgc tgtggcagga 6900
actgaaaggc gaaggcgata tcgacaacgc gccgtggccg gttgctgacg aaaaagcgat 6960
ggtggaagac tccacgctgg tcgtggtgca ggttaacggt aaagtccgtg ccaaaatcac 7020
cgttccggtg gacgcaacgg aagaacaggt tcgcgaacgt gctggccagg aacatctggt 7080
agcaaaatat cttgatggcg ttactgtacg taaagtgatt tacgtaccag gtaaactcct 7140
caatctggtc gttggcgggc ccgtttaacc cctctccctc ccccccccct aacgttactg 7200
gccgaagccg cttggaataa ggccggtgtg cgtttgtcta tatgttattt tccaccatat 7260
tgccgtcttt tggcaatgtg agggcccgga aacctggccc tgtcttcttg acgagcattc 7320
ctaggggtct ttcccctctc gccaaaggaa tgcaaggtct gttgaatgtc gtgaaggaag 7380
cagttcctct ggaagcttct tgaagacaaa caacgtctgt agcgaccctt tgcaggcagc 7440
ggaacccccc acctggcgac aggtgcctct gcggccaaaa gccacgtgta taagatacac 7500
ctgcaaaggc ggcacaaccc cagtgccacg ttgtgagttg gatagttgtg gaaagagtca 7560
aatggctctc ctcaagcgta ttcaacaagg ggctgaagga tgcccagaag gtaccccatt 7620
gtatgggatc tgatctgggg cctcggtgca catgctttac atgtgtttag tcgaggttaa 7680
aaaaacgtct aggccccccg aaccacgggg acgtggtttt cctttgaaaa acacgatgat 7740
aatatggcca caaccatggt gagcaagggc gaggagctgt tcaccggggt ggtgcccatc 7800
ctggtcgagc tggacggcga cgtaaacggc cacaagttca gcgtgtccgg cgagggcgag 7860
ggcgatgcca cctagggcaa gctgaccctg aagttcatct gcaccaccgg caagctgccc 7920
gtgccctggc ccaccctcgt gaccaccctg acctacggcg tgcagtgctt cagccgctac 7980
cccgaccaca tgaagcagca cgacttcttc aagtccgcca tgcccgaagg ctacgtccag 8040
gagcgcacca tcttcttcaa ggacgacggc aactacaaga cccgcgccga ggtgaagttc 8100
gagggcgaca ccctggtgaa ccgcatcgag ctgaagggca tcgacttcaa ggaggacggc 8160
aacatcctgg ggcacaagct ggagtacaac tacaacagcc acaacgtcta tatcatggcc 8220
gacaagcaga agaacggcat caaggtgaac ttcaagatcc gccacaacat cgaggacggc 8280
agcgtgcagc tcgccgacca ctaccagcag aacaccccca tcggcgacgg ccccgtgctg 8340
ctgcccgaca accactacct gagcacccag tccgccctga gcaaagaccc caacgagaag 8400
cgcgatcaca tggtcctgct ggagttcgtg accgccgccg ggatcactct cggcatggac 8460
gagctgtaca agtaggcgat cgccaaattc gatatcaagc ttatcgataa tcaacctctg 8520
gattacaaaa tttgtgaaag attgactggt attcttaact atgttgctcc ttttacgcta 8580
tgtggatacg ctgctttaat gcctttgtat catgctattg cttcccgtat ggctttcatt 8640
ttctcctcct tgtataaatc ctggttgctg tctctttatg aggagttgtg gcccgttgtc 8700
aggcaacgtg gcgtggtgtg cactgtgttt gctgacgcaa cccccactgg ttggggcatt 8760
gccaccacct gtcagctcct ttccgggact ttcgctttcc ccctccctat tgccacggcg 8820
gaactcatcg ccgcctgcct tgcccgctgc tggacagggg ctcggctgtt gggcactgac 8880
aattccgtgg tgttgtcggg gaaatcatcg tcctttcctt ggctgctcgc ctgtgttgcc 8940
acctggattc tgcgcgggac gtccttctgc tacgtccctt cggccctcaa tccagcggac 9000
cttccttccc gcggcctgct gccggctctg cggcctcttc cgcgtcttcg ccttcgccct 9060
cagacgagtc ggatctccct ttgggccgcc tccccgcatc gataccgtcg acctcgactg 9120
tgccttctag ttgccagcca tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg 9180
aaggtgccac tcccactgtc ctttcctaat aaaatgagga aattgcatcg cattgtctga 9240
gtaggtgtca ttctattctg gggggtgggg tggggcagga cagcaagggg gaggattggg 9300
aagacaatag caggcatgct ggggaactag tggcgcgcct gcatgcctgc aggtcgacga 9360
tctaatattt gcatgtcgct atgtgttctg ggaaatcacc ataaacgtga aatccctatc 9420
agtgatagag acttataagt tccctatcag tgatagagac accgcccgga tggtggaatc 9480
ggtagacaca agggattcta aatccctcgg cgttcgcgct gtgcgggttc aagtcccgct 9540
ccgggtattt tttggatcta atatttgcat gtcgctatgt gttctgggaa atcaccataa 9600
acgtgaaatc cctatcagtg atagagactt ataagttccc tatcagtgat agagacaccg 9660
cccggatggt ggaatcggta gacacaaggg attctaaatc cctcggcgtt cgcgctgtgc 9720
gggttcaagt cccgctccgg gtattttttg gatctaatat ttgcatgtcg ctatgtgttc 9780
tgggaaatca ccataaacgt gaaatcccta tcagtgatag agacttataa gttccctatc 9840
agtgatagag acaccgcccg gatggtggaa tcggtagaca caagggattc taaatccctc 9900
ggcgttcgcg ctgtgcgggt tcaagtcccg ctccgggtat tttttggatc taatatttgc 9960
atgtcgctat gtgttctggg aaatcaccat aaacgtgaaa tccctatcag tgatagagac 10020
ttataagttc cctatcagtg atagagacac cgcccggatg gtggaatcgg tagacacaag 10080
ggattctaaa tccctcggcg ttcgcgctgt gcgggttcaa gtcccgctcc gggtattttt 10140
tgatctaata tttgcatgtc gctatgtgtt ctgggaaatc accataaacg tgaaatccct 10200
atcagtgata gagacttata agttccctat cagtgataga gacaccgccc ggatggtgga 10260
atcggtagac acaagggatt ctaaatccct cggcgttcgc gctgtgcggg ttcaagtccc 10320
gctccgggta ttttttggat ctaatatttg catgtcgcta tgtgttctgg gaaatcacca 10380
taaacgtgaa atccctatca gtgatagaga cttataagtt ccctatcagt gatagagaca 10440
ccgcccggat ggtggaatcg gtagacacaa gggattctaa atccctcggc gttcgcgctg 10500
tgcgggttca agtcccgctc cgggtatttt ttggatctaa tatttgcatg tcgctatgtg 10560
ttctgggaaa tcaccataaa cgtgaaatcc ctatcagtga tagagactta taagttccct 10620
atcagtgata gagacaccgc ccggatggtg gaatcggtag acacaaggga ttctaaatcc 10680
ctcggcgttc gcgctgtgcg ggttcaagtc ccgctccggg tattttttgg atctaatatt 10740
tgcatgtcgc tatgtgttct gggaaatcac cataaacgtg aaatccctat cagtgataga 10800
gacttataag ttccctatca gtgatagaga caccgcccgg atggtggaat cggtagacac 10860
aagggattct aaatccctcg gcgttcgcgc tgtgcgggtt caagtcccgc tccgggtatt 10920
ttttgatcta atatttgcat gtcgctatgt gttctgggaa atcaccataa acgtgaaatc 10980
cctatcagtg atagagactt ataagttccc tatcagtgat agagacaccg cccggatggt 11040
ggaatcggta gacacaaggg attctaaatc cctcggcgtt cgcgctgtgc gggttcaagt 11100
cccgctccgg gtattttttg gatctaatat ttgcatgtcg ctatgtgttc tgggaaatca 11160
ccataaacgt gaaatcccta tcagtgatag agacttataa gttccctatc agtgatagag 11220
acaccgcccg gatggtggaa tcggtagaca caagggattc taaatccctc ggcgttcgcg 11280
ctgtgcgggt tcaagtcccg ctccgggtat tttttggatc taatatttgc atgtcgctat 11340
gtgttctggg aaatcaccat aaacgtgaaa tccctatcag tgatagagac ttataagttc 11400
cctatcagtg atagagacac cgcccggatg gtggaatcgg tagacacaag ggattctaaa 11460
tccctcggcg ttcgcgctgt gcgggttcaa gtcccgctcc gggtattttt tggatctaat 11520
atttgcatgt cgctatgtgt tctgggaaat caccataaac gtgaaatccc tatcagtgat 11580
agagacttat aagttcccta tcagtgatag agacaccgcc cggatggtgg aatcggtaga 11640
cacaagggat tctaaatccc tcggcgttcg cgctgtgcgg gttcaagtcc cgctccgggt 11700
attttttgga tctccgggta ccctgtgcgc tagcatcgag cgctatcgct cgagatggta 11760
ccgatcatcg atatgtcgac gggcccataa cttcgtataa tgtatgctat acgaagttat 11820
cgtgctagat cgactgctag agtgacagat ctcatacaaa tccatagagc ccaccgcatc 11880
cccagcatgc ctgctattgt cttcccaatc ctcccccttg ctgtcctgcc ccaccccacc 11940
ccccagaata gaatgacacc tactcagaca atgcgatgca atttcctcat tttattagga 12000
aaggacagtg ggagtggcac cttccagggt caaggaaggc acgggggagg ggcaaacaac 12060
agatggctgg caactagaag gcacagtcga ggctgatcag cgagctctag agctcagtta 12120
gcctccccca tctcccgggc aaacgtgcgc gccaggtcgc agatcgtcgg tatggagccg 12180
ggggtggtga cgtgggtctg gaccatcccg gaggtaagtt gcagcagggc gtcccggcag 12240
ccggcgggcg attggtcgta atccaggata aagacgtgca tgggacggag gcgtttggcc 12300
aagacgtcca aggcccaggc aaacacgttg tacaggtcgc cgttgggggc cagcaactcg 12360
ggggcccgaa acagggtaaa taacgtgtcc ccgatatggg gtcgtgggcc cgcgttgctc 12420
tggggctcgg caccctgggg cggcacggcc gtccccgaaa gctgtcccca atcctcccgc 12480
cacgacccgc cgccctgcag ataccgcacc gtattggcaa gcagcccgta aacgcggcga 12540
atcgcggcca gcatagccag gtcaagccgc tcgccggggc gctggcgttt ggccaggcgg 12600
tcgatgtgtc tgtcctccgg aagggccccc aacacgatgt ttgtgccggg caaggtcggc 12660
gggatgaggg ccacgaacgc cagcacggcc tggggggtca tgctgcccat aaggtatcgc 12720
gcggccgggt agcacaggag ggcggcgatg ggatggcggt cgaagatgag ggtgagggcc 12780
gggggcgggg catgtgagct cccagcctcc cccccgatat gaggagccag aacggcgtcg 12840
gtcacggcat aaggcatgcc cattgttatc tgggcgcttg tcattaccac cgccgcgtcc 12900
ccggccgata tctcaccctg gtcgaggcgg tgttgtgtgg tgtagatgtt cgcgattgtc 12960
tcggaagccc ccagcacctg ccagtaagtc atcggctcgg gtacgtagac gatatcgtcg 13020
cgcgaaccca gggccaccag cagttgcgtg gtggtggttt tccccatccc gtgaggaccg 13080
tctatataaa cccgcagtag cgtgggcatg gatccggcac cgggcttgcg ggtcatgcac 13140
caggtgcgcg gtccttcggg cacctcgacg tcggcggtga cggtgaagcc gagccgctcg 13200
tagaagggga ggttgcgggg cgcggaggtc tccaggaagg cgggcacccc ggcgcgctcg 13260
gccgcctcca ctccggggag cacgacggcg ctgcccagac ccttgccctg gtggtcgggc 13320
gagacgccga cggtggccag gaaccacgcg ggctccttgg gccggtgcgg cgccaggagg 13380
ccttccatct gttgctgcgc ggccagccgg gaaccgctca actcggccat gcgcgggccg 13440
atctcggcga acaccgcccc cgcttcgacg ctctccggcg tggtccagac cgccaccgcg 13500
gcgccgtcgt ccgcgaccca caccttgccg atgtcgagcc cgacgcgcgt gaggaagagt 13560
tcttgcagct cggtgacccg ctcgatgtgg cggtccggat cgacggtgtg gcgcgtggcg 13620
gggtagtcgg cgaacgcggc ggcgagggtg cgtacggccc tggggacgtc gtcgcgggtg 13680
gcgaggcgca ccgtgggctt gtactcggtc cccatggtgg cgttggctgc aggtcgaaag 13740
gcccggagat gaggaagagg agaacagcgc ggcagacgtg cgcttttgaa gcgtgcagaa 13800
tgccgggcct ccggaggacc ttcgggcgcc cgccccgccc ctgagcccgc ccctgagccc 13860
gcccccggac ccaccccttc ccagcctctg agcccagaaa gcgaaggagc aaagctgcta 13920
ttggccgctg ccccaaaggc ctacccgctt ccattgctca gcggtgctgt ccatctgcac 13980
gagactagtg agacgtgcta cttccatttg tcacgtcctg cacgacgcga gctgcggggc 14040
gggggggaac ttcctgacta ggggaggagt agaaggtggc gcgaaggggc caccaaagaa 14100
cggagccggt tggcgcctac cggtggatgt ggaatgtgtg cgaggccaga ggccacttgt 14160
gtagcgccaa gtgcccagcg gggctgctaa agcgcatgct ccagactgcc ttgggaaaag 14220
cgcctcccct accccagctg agagtagcac aatctaggcg tcataacttc gtataatgta 14280
tgctatacga agttatacgc gtatcgggat cccagtgcgg ccgcactgtc gcgaatcgcc 14340
atggatcgct gcagatcgca attccatgga tatcaagctt aaacaagaat ctctagtttt 14400
ctttcttgct tttactttta cttccttaat actcaagtac aattttaatg gagtactttt 14460
ttacttttac tcaagtaaga ttctagccag atacttttac ttttaattga gtaaaatttt 14520
ccctaagtac ttgtactttc acttgagtaa aatttttgag tactttttac acctctgctc 14580
gaccatatgg gagagctccc aacgcgttgg atgcatagct tgagtattct atagtgtcac 14640
ctaaatagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc 14700
acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga 14760
gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg 14820
tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg 14880
cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg 14940
gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga 15000
aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg 15060
gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag 15120
aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc 15180
gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg 15240
ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt 15300
cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc 15360
ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc 15420
actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg 15480
tggcctaact acggctacac tagaagaaca gtatttggta tctgcgctct gctgaagcca 15540
gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc 15600
ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat 15660
cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt 15720
ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt 15780
tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc 15840
agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc 15900
gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata 15960
ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg 16020
gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc 16080
cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct 16140
acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa 16200
cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt 16260
cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca 16320
ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac 16380
tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca 16440
atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt 16500
tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc 16560
actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca 16620
aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata 16680
ctcatactct tcctttttca atattattga agcatttatc agggttattg tctcatgagc 16740
ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc 16800
cgaaaagtgc cacctgatgc ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg 16860
catcaggaaa ttgtaagcgt taatattttg ttaaaattcg cgttaaattt ttgttaaatc 16920
agctcatttt ttaaccaata ggccgaaatc ggcaaaatcc cttataaatc aaaagaatag 16980
accgagatag ggttgagtgt tgttccagtt tggaacaaga gtccactatt aaagaacgtg 17040
gactccaacg tcaaagggcg aaaaaccgtc tatcagggcg atggcccact acgtgaacca 17100
tcaccctaat caagtttttt ggggtcgagg tgccgtaaag cactaaatcg gaaccctaaa 17160
gggagccccc gatttagagc ttgacgggga aagccggcga acgtggcgag aaaggaaggg 17220
aagaaagcga aaggagcggg cgctagggcg ctggcaagtg tagcggtcac gctgcgcgta 17280
accaccacac ccgccgcgct taatgcgccg ctacagggcg cgtccattcg ccattcaggc 17340
tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc gctattacgc cagctggcga 17400
aagggggatg tgctgcaagg cgattaagtt gggtaacgcc agggttttcc cagtcacgac 17460
gttgtaaaac gacggccagt gaattgtaat acgactcact ata 17503

Claims (5)

1.生物正交翻译系统,所述系统包含:
正交的tRNA和氨酰tRNA合成酶;
所述tRNA来源于原核生物;
所述tRNA的反密码子环对应于提前终止密码子;
所述氨酰tRNA合成酶能够将非天然氨基酸与所述tRNA结合;
其中所述tRNA和氨酰tRNA合成酶位于同一载体上,
其中:
所述tRNA为来源于巴氏甲烷八叠球菌(Methanosarcina barkeri)的
Figure FDA0003200493090000011
所述氨酰tRNA合成酶为来源于巴氏甲烷八叠球菌的吡咯赖氨酰tRNA合成酶MbPylRS;其中,所述
Figure FDA0003200493090000012
为SEQ ID NO:1,所述MbPylRS为SEQ ID NO:2;
其中所述载体是
Figure FDA0003200493090000013
转座载体,*GFP为单点突变的GFP报告基因;
其中所述系统还包含非天然氨基酸和真核细胞,所述真核细胞是转入上述转座载体的Vero细胞;
其中非天然氨基酸是NAEK。
2.真核细胞,其包含:
正交的tRNA和氨酰tRNA合成酶;
所述tRNA来源于原核生物;
所述tRNA的反密码子环对应于提前终止密码子;
其中所述氨酰tRNA合成酶能够将非天然氨基酸与所述tRNA结合;
其中所述tRNA和氨酰tRNA合成酶以位于同一载体的方式导入所述真核细胞,
其中:
所述tRNA为来源于巴氏甲烷八叠球菌(Methanosarcina barkeri)的
Figure FDA0003200493090000021
所述氨酰tRNA合成酶为来源于巴氏甲烷八叠球菌的吡咯赖氨酰tRNA合成酶MbPylRS;其中,所述
Figure FDA0003200493090000022
为SEQ ID NO:1,所述MbPylRS为SEQ ID NO:2;
其中所述载体是
Figure FDA0003200493090000023
转座载体,*GFP为单点突变的GFP报告基因;
其中所述真核细胞是转入上述转座载体的Vero细胞。
3.制备权利要求2所述的真核细胞的方法,其包括:
(1)提供在同一载体中包含tRNA和氨酰tRNA合成酶的载体,所述载体是Tol2转座载体;
(2)将包含tRNA和氨酰tRNA合成酶的载体导入真核细胞;
(3)获得稳定整合tRNA和氨酰tRNA合成酶基因的真核细胞。
4.制备含有非天然氨基酸的目的蛋白的方法,其包括:
(1)在目的蛋白的氨基酸序列中选择期望导入非天然氨基酸的一个或多个氨基酸位点;
(2)将目的蛋白中编码步骤(1)中所选择的氨基酸位点的密码子突变为提前终止密码子;
(3)将编码突变的目的蛋白的基因导入权利要求2所述的真核细胞;
(4)在含有非天然氨基酸的培养基中培养导入了编码突变的目的蛋白的基因的真核细胞,使含有非天然氨基酸的目的蛋白得到表达;
(5)收获表达的含有非天然氨基酸的目的蛋白,
其中所述非天然氨基酸是NAEK。
5.制备含有非天然氨基酸的复制缺陷型PTC病毒的方法,其包括:
(1)在病毒目的蛋白的氨基酸序列中选择期望突变的一个或多个氨基酸位点;
(2)在编码(1)所述的目的蛋白的核酸分子中将(1)中所选择的位点的氨基酸的密码子突变为提前终止密码子UAG、UAA或UGA;
(3)将(2)中得到的突变的核酸与合适的载体可操作地连接,得到核酸的表达载体;
(4)将(3)得到的突变的核酸的表达载体转染权利要求2所述的真核细胞,将转染成功后的真核细胞在含有非天然氨基酸的培养基中培养,在适当的时间收集病毒;
(5)检测病毒的包装滴度和活性,
其中所述非天然氨基酸是NAEK。
CN201810914299.XA 2018-08-13 2018-08-13 利用优化的基因密码子扩展系统制备ptc稳定细胞系及应用 Active CN110835633B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810914299.XA CN110835633B (zh) 2018-08-13 2018-08-13 利用优化的基因密码子扩展系统制备ptc稳定细胞系及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810914299.XA CN110835633B (zh) 2018-08-13 2018-08-13 利用优化的基因密码子扩展系统制备ptc稳定细胞系及应用

Publications (2)

Publication Number Publication Date
CN110835633A CN110835633A (zh) 2020-02-25
CN110835633B true CN110835633B (zh) 2021-10-01

Family

ID=69572947

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810914299.XA Active CN110835633B (zh) 2018-08-13 2018-08-13 利用优化的基因密码子扩展系统制备ptc稳定细胞系及应用

Country Status (1)

Country Link
CN (1) CN110835633B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111304234A (zh) * 2020-02-27 2020-06-19 江南大学 一种适用于枯草芽孢杆菌的非天然氨基酸利用工具
CN113699124B (zh) * 2021-09-08 2022-04-12 北京大学 一种含非天然氨基酸蛋白的制备方法
CN114134141B (zh) * 2021-11-03 2024-01-30 杭州嵌化合生医药科技有限公司 一种引入非天然氨基酸的嵌合体苯丙氨酸翻译系统及其构建方法
CN114717204B (zh) * 2022-03-08 2023-12-26 中国农业科学院哈尔滨兽医研究所(中国动物卫生与流行病学中心哈尔滨分中心) 复制缺陷型伪狂犬病病毒及其构建方法和应用
CN115074330B (zh) * 2022-04-19 2023-12-29 中国医学科学院医学生物学研究所 一种基于遗传密码子扩展技术的改造Vero细胞系
CN114908066B (zh) * 2022-05-17 2024-01-23 杭州嵌化合生医药科技有限公司 一种正交翻译系统及其在再分配密码子恢复ptc疾病中功能蛋白表达方面的应用
CN115261344B (zh) * 2022-08-29 2023-07-21 北京大学 基于非天然氨基酸的离子液体、其制备方法及应用

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102838671A (zh) * 2011-06-23 2012-12-26 北京大学 定点突变和定点修饰的生长激素、其制备方法及其应用
CN104099360A (zh) * 2013-04-12 2014-10-15 北京大学 非天然氨基酸标记的目的蛋白或肽的制备
CN105026574A (zh) * 2012-09-24 2015-11-04 米迪缪尼有限公司 细胞系
CN106929482A (zh) * 2015-12-31 2017-07-07 北京大学 定点突变的流感病毒、其活疫苗及其制备方法和应用
CN107012121A (zh) * 2016-01-27 2017-08-04 北京大学 携带正交tRNA/氨酰tRNA合成酶的稳定细胞系的构建
CN107022568A (zh) * 2016-02-01 2017-08-08 北京大学 哺乳动物细胞中高效多点插入非天然氨基酸的系统
CN107177593A (zh) * 2016-03-10 2017-09-19 北京大学 利用优化的基因密码子扩展系统通读提前终止密码子疾病中的截短蛋白

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102838671A (zh) * 2011-06-23 2012-12-26 北京大学 定点突变和定点修饰的生长激素、其制备方法及其应用
CN105026574A (zh) * 2012-09-24 2015-11-04 米迪缪尼有限公司 细胞系
CN104099360A (zh) * 2013-04-12 2014-10-15 北京大学 非天然氨基酸标记的目的蛋白或肽的制备
CN106929482A (zh) * 2015-12-31 2017-07-07 北京大学 定点突变的流感病毒、其活疫苗及其制备方法和应用
CN107012121A (zh) * 2016-01-27 2017-08-04 北京大学 携带正交tRNA/氨酰tRNA合成酶的稳定细胞系的构建
CN107022568A (zh) * 2016-02-01 2017-08-08 北京大学 哺乳动物细胞中高效多点插入非天然氨基酸的系统
CN107177593A (zh) * 2016-03-10 2017-09-19 北京大学 利用优化的基因密码子扩展系统通读提前终止密码子疾病中的截短蛋白

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Tol2: a versatile gene transfer vector in vertebrates;Koichi Kawakami;《Genome Biology》;20071031;第8卷(第Suppl 1期);第1-9页 *

Also Published As

Publication number Publication date
CN110835633A (zh) 2020-02-25

Similar Documents

Publication Publication Date Title
CN110835633B (zh) 利用优化的基因密码子扩展系统制备ptc稳定细胞系及应用
KR102370675B1 (ko) 표적 핵산의 변형을 위한 개선된 방법
CN109439708B (zh) 一种抗酸型高密度生长的大肠杆菌生产可拉酸的方法
AU2023226754A1 (en) Compositions and methods for modifying genomes
RU2128227C1 (ru) Способ активации транскрипционно-молчащего гена
CN101213203A (zh) 在转录后水平调节核酸表达的方法和组合物
KR20170096998A (ko) 파킨슨병의 치료를 위한 aadc 폴리뉴클레오티드
KR20170026358A (ko) 리소좀 저장 장애의 치료를 위한 아데노연관 바이러스 벡터
CN1938428A (zh) 多基因表达的质粒系统
DK2828384T3 (en) PROCEDURE FOR SURVIVING SENSITIVITY TO CHEMICAL DNA MODIFICATIONS OF CONSTRUCTED SPEECH DNA BINDING DOMAINS
US20040146996A1 (en) Microorganisms and processes for enhanced production of pantothenate
CN109996874A (zh) 10-甲基硬脂酸的异源性产生
KR20220007155A (ko) 코로나바이러스 스파이크 단백질의 변형된 s1 서브유닛
CN115698297A (zh) 多模块生物合成酶基因组合文库的制备方法
CN113584062B (zh) 融合成像基因及其慢病毒表达质粒、慢病毒、细胞,其制备方法和用途
CN100455669C (zh) 用于提高泛酸产量的微生物和方法
CN109468244B (zh) 一种抗酸型高密度生长的大肠杆菌及其应用
CN107760705B (zh) 一种穿梭质粒载体及其构建方法和应用
CN113166779A (zh) 调控的基因编辑系统
CN110777147A (zh) 一种ikzf3基因沉默的t细胞及其应用
WO2022241455A1 (en) A synthetic circuit for buffering gene dosage variation between individual mammalian cells
CN116200368A (zh) 一种基于c2c9核酸酶的新型基因组编辑系统及其应用
CN112209883B (zh) 一种与rna特异性结合的荧光素染料及其应用
CN114196700A (zh) 使肝细胞直接重编程为胰岛样细胞的方法和试剂盒
CN113249399B (zh) pAM基因及其植物表达载体和应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant