发明内容
本发明针对现有原核和真核生物为宿主的生物反应器表达量低、可溶性差、无生物活性和不安全等缺点,利用谷物作物的非储藏蛋白的内质网结合蛋白(Bip)和蛋白二硫键异构酶(PDI)的C-末端的分子伴侣的功能,以此作为融合蛋白,与小分子目标多肽基因融合,采用水稻胚乳特异性表达的启动子和信号肽,介导融合蛋白表达后进入水稻胚乳细胞的内膜系统,并储存到水稻胚乳的蛋白体中,从而使融合蛋白能在水稻种子内大量积累,最终达到较高水平。本发明不仅有效地解决了其他表达系统的表达量低、可溶性差、无生物活性等问题,还可以完全杜绝动物病原菌的污染问题。
本发明的目的是在于提供了一种利用种子谷物储藏醇溶谷蛋白基因Gt13a的启动子和信号肽介导融合蛋白在胚乳细胞特异性表达并储存在水稻胚乳细胞的蛋白体内的方法,使融合蛋白不受细胞质内的蛋白酶攻击,在水稻胚乳内大量积累,最终获得较高融合蛋白产量的表达方法。
本发明的再一个目的是利用谷物非储藏蛋白-Bip和PDI的C末端分子伴侣的功能结构域作为融合蛋白,同时解决提高融合蛋白在胚乳细胞的表达量和可溶性两个关键问题,建立水稻或大麦等谷物胚乳细胞高效表达小分子多肽的新技术平台,利用该平台生产小分子多肽,不仅比转基因奶牛和转基因鸡表达系统更安全、无病毒污染,而且容易规模化;比其他植物表达体系具有更高的产量和更低的生产成本。
本发明的第三个目的利用谷物非储藏蛋白为融合蛋白载体在水稻和大麦胚乳表达IGF-1的应用,即将融合蛋白基因和目的基因的遗传密码子转换为水稻偏爱的遗传密码子,从而提高了重组蛋白质的翻译水平,最终提高融合蛋白在水稻胚乳细胞的表达与积累。
下面对本发明的方法进行详细描述:
A、水稻特异性启动子及信号肽的获得:为了获得较强的水稻胚乳特异性表达的启动子和信号肽,根据生物信息学分析,采用水稻储藏蛋白的醇溶谷蛋白基因家簇中的一个成员Gt13a基因的启动子具有较高活性。为了获得Gt13a启动子和它的信号肽序列,根据基因数据库的Gt13a(基因库登记号AP003256)合成了一对核苷酸引物(引物序列见专利申请号200510019084.4的序列1和2)用于PCR扩增。为了便于基因克隆,在正向引物的5’端加入了一个粘性末端的酶切位点,在反向引物的5’端加了一个平末端的酶切位点。从水稻品种台北309叶片中提取基因组DNA,以此DNA为模版,按照标准的PCR程序,利用上述引物扩增出了一个1284碱基的DNA片段。经DNA序列分析,此DNA片段具有明显的启动子结构,得到了一种可介导重组蛋白在谷物胚乳中表达的启动子和信号肽,其具有SEQ ID NO.1所示核苷酸序列。
B、水稻胚乳细胞特异性表达载体的构建:经PCR获得Gt13a启动子和信号肽的序列后,PCR产物经粘性末端和平末端内切酶消化后,将这个片段与经粘性末端和平末端内切酶消化的pBI221片段连接(美国克隆技术(Clontech)有限公司),然后导入大肠杆菌品系DH10B(美国Invitrogen生物技术公司的产品),形成了含有Gt13a启动子、Gt13a信号肽和Nos终止子的水稻胚乳特异性表达的基本载体,并将这个载体质粒命名为pOsPMP2,见图1,其具有SEQ ID NO.2所示的核苷酸序列。
C、融合蛋白和目的基因的密码子优化与基因合成:从美国生物技术信息中心(NCBI)基因库里获得了水稻Bip(基因库登录号为AAB63469)、小麦的PDI基因(基因库登录号为AJ277377为)和类胰岛素生长因子基因(基因库登录号为CAA01955)的氨基酸序列,由DNA分析软件马克载体(MacVector,英国的阿克尔勒斯(Accelrys)公司产品)将这些基因的氨基酸序列转换成含有优化水稻遗传密码子的核苷酸序列,由美国商业化的BlueHeron Biotechnology公司人工合成了这些基因,这种经水稻密码子优化的水稻Bip基因的C末端片段,其具有SEQ ID NO.3和一种经水稻密码子优化的小麦PDI基因的C末端片段;其具有SEQ ID NO.4和一种经水稻密码子优化的人IGF-1基因;其具有SEQ ID NO.5所示的核苷酸序列。经密码子优化后的这些基因的核苷酸序列比原始基因序列改变了11.2-21.4%,遗传密码改变了30.5-54.3%,但其氨基酸的序列不变(见表1)。
表1、密码子优化后的融合蛋白基因的比较
项目 |
Bip-C |
PDI-C |
IGF-1 |
遗传密码总数 |
256 |
133 |
70 |
改变遗传密码子数 |
78 |
64 |
38 |
改变遗传密码子百分比(%) |
30.5 |
48.1 |
54.3 |
氧核苷酸总数 |
768 |
399 |
210 |
改变脱氧核苷酸数 |
86 |
67 |
45 |
改变脱氧核苷酸百分比(%) |
11.2 |
16.8 |
21.4 |
氨基酸序列改变(%) |
0 |
0 |
0 |
在人工合成基因时,在基因合成的引物5’和3’末端分别加上平末端和粘性末端的限制性内切酶,便于基因克隆。
D、各种表达融合蛋白载体的构建:
1)、pOsPMP25(Gt13a-PDIC-IGF-1-Nos)的构建:首先,pOsPMP2质粒DNA用MscI和XhoI进行双酶切,然后将经PCR扩增的密码子优化的人类胰岛素样生长因子(humanIGF-1)基因片段克隆到pOsPMP2载体中。转化E.coli宿主细胞DH10B,产生一个含有IGF-1基因的中间质粒pOsPMP3;用限制性内切酶NaeI和NcoI消化pOsPMP3质粒DNA,将PCR扩增的PDIC的DNA片段克隆到中间质粒载体,最终形成了水稻特异性表达的融合蛋白表达载体pOsPMP25(Gt13a-BipC-IGF-1-Nos)。
2)、pOsPMP26(Gt13a-BipC-IGF-1-Nos)的构建:用限制性内切酶NaeI和NcoI消化pOsPMP3质粒DNA,将PCR扩增的BipC DNA片段克隆到pOsPMP3质粒载体,最终形成了水稻种子特异性表达的融合蛋白表达载体pOsPMP26(Gt13A-BipC-IGF-1-Nos)。
3)、选择性标记基因载体的构建:为了使选择性标记基因在水稻愈伤组织内高效表达而提高转基因的选择效果,采用水稻半胱氨酸蛋白酶基因(Cysteine proteinase β,CP)的启动子介导选择性标记基因(抗潮草霉素基因--潮霉素磷酸转移酶)在愈伤组织中特异表达。首先,合成了一对PCR引物,请见SEQ ID NO.6和SEQ ID NO.7,在PCR引物的两端加了HindIII和SmaI位点;以水稻品种台北309的基因组DNA为模版,采用标准PCR反应,扩增出一个长度为1103碱基含有启动子的片断,PCR产物经HindIII和SmaI消化后,该PCR片段与克隆载体pBI221(美国的克隆技术(Clontech)有限公司.)连接,然后转化大肠杆菌品系DH10B,产生了中间质粒pOsPMP4。选择性标记基因采用潮霉素磷酸转移酶基因(Hygromycin βPhosphotransferas,Hpt),该基因从质粒pCAMBIA1301(澳大利亚的哥仑比亚(CAMBIA)公司)扩增,在正向引物,请见SEQ ID NO.8和SEQ ID NO.9的5’末端加上了一个平末端限制性内切酶为位点SmaI,在反向引物的5’末端加上了一个粘性末端的限制性内切酶位点XhoI,以pCAMBIA1301质粒为模版,采用标准PCR反应,扩增出潮霉素磷酸转移酶基因片断,PCR产物用SmaI和XhoI消化,pOsPMP4DNA用NaeI和XhoI消化,然后将潮霉素磷酸转移酶基因片断与具有CP(Cysteine proteinase β,CP)启动子的pOsPMP4质粒经NaeI和XhoI消化的DNA片段连接,转化大肠杆菌菌系DH10B,最终产生了水稻组织特异性表达的选择性标记表达载体,命名为pOsPMP5。
水稻基因遗传转化:水稻种子去壳后,在20%次氯酸钠中消毒20分钟,用灭菌水漂洗3次,然后在愈伤组织诱导培养基上诱导20-25天,诱导的愈伤组织转移到预处理培养基上生长9-10天后,用于遗传转化。将0.5微克的表达载体质粒pOsPMP25和pOsPMP26和具有选择性标记质粒pOsPMP5的DNA,与50微升的金粉、250微升的1M氯化钙和50微升的0.1M亚精胺混合后,反应30分钟,用酒精洗三次,将DNA包裹在金粉上,然后按照美国杜邦公司的基因枪方法,将两个质粒共转化到台北309产生的愈伤组织。在含有潮霉素B的选择培养基上经45天的筛选,具有潮霉素B抗性的愈伤组织在再生培养基上,在光照下经20天左右的诱导,愈伤组织分化成绿色植株,然后将幼小植株转到生根培养基上,经15-20天的诱导,形成完整的植株,获得转基因植株,这些转基因植株经PCR检测,证明其含有融合蛋白基因后,转到试验田生长发育成成熟的种子,此为T1种子。
高表达转基因植株的筛选:转基因水稻经过4个月左右的生长和发育,抽穗开花后,经一个月的时间,形成成熟的转基因水稻T1代种子。其中有50-60%的转基因植株正常结实。当T1种子收获后,从水稻成熟胚乳的粗提取物,采用蛋白质印迹法,筛选高效表达的转基因单株,利用蛋白质定量检测的酶联免疫(ELISA)技术(美国的R&D system公司产品)定量分析表达量,从T1种子中筛选表达融合蛋白高的转基因个体,经T1代的继续选择,形成稳定表达融合蛋白的转基因品系。供大面积生产融合蛋白之用。
本发明是利用水稻、大麦等谷物胚乳作为生物反应器来生产可溶的、具有生物活性的重组小分子多肽的融合蛋白,使其表达水平至少达到水稻种子重量的0.3%以上,即每公斤种子的多肽融合蛋白产量达到3克以上,其表达量是叶绿体表达体系得最高量的~20倍和马铃薯块茎表达体系的最高量的~500倍。
本发明利用水稻、大麦等谷物作物的胚乳细胞作为生物反应器生产小分子多肽,克服了动物、微生物和其他植物表达体系存在的表达量低、生产成本高、可溶性差和安全性低等弊病。
本发明利用谷物作物非重组储藏蛋白作为融合蛋白载体,能有效地克服了现有美国的国际专利—“利用水稻储藏蛋白作为融合蛋白在植物种子高效表达小分子多肽”的技术(美国专利申请号:US60/527-753,题目是:High-Level Expression ofFusion Polypeptides in Plant SeedsUtilizing Seed-Storage Proteins as Fusion Carriers)所存在的表达融合蛋白的不溶性问题。
本发明利用非储藏蛋白融合蛋白体系由于其表达量高,比现有技术的表达量高20-500倍、重组蛋白可溶性好,有效地解决了在高量表达时的可溶性问题;表达的融合目标多肽可在不经切割的情况下,仍具有生物学活性,可节省生产成本40-50%,其特点是:
a、谷物作物种子的非储藏蛋白作为融合蛋白载体在谷物种子中表达各种医药或保健用途的多肽,其表达量达到0.3%种子重量以上。
b、利用单子叶作物种子储藏蛋白基因的启动子和信号肽,在种子中特异性表达各种医药、保健用途的多肽,例如在水稻胚乳表达IGF-1融合蛋白达到0.75%的种子干重。
c、在种子中表达各种医药的多肽指氨基酸序列在20-100之间的多肽。包括:人血液中各种具有医用和保健用途的多肽、各种抗肿瘤的多肽、各种抗菌多肽和其他具有对人体具有治疗和保健作用的多肽。
d、在水稻/大麦种子中表达重组人的类胰岛素生长因子-1。
将表达载体质粒的代号及其内涵对照如下:
pOsPMP2----水稻胚乳特异性表达的基本载体
pOsBipC-----带有重组Bip-IGF-1融合蛋白基因的载体
pOsPDIC-----带有重组PDI-IGF-1融合蛋白基因的载体
pOsPMP3-----带有水稻密码子优化的IGF-1基因的载体
pOsPMP25------水稻胚乳特异性表达重组融合蛋白基因(Bip-C-IGF)的载体质粒
pOsPMP26------水稻胚乳特异性表达重组融合蛋白基因(PDI-C-IGF)的载体质粒
pOsPMP5-----水稻组织特异性表达的选择性标记表达载体
具体实施方式
[实施例1]克隆Gt13a启动子和信号肽
为了从水稻基因组序列里克隆醇溶谷蛋白的Gt13a基因的启动子与信号肽,利用序列1的引物,采用标准的多聚酶链(PCR)反应,从台北309品种的基因组DNA中扩增到了1284碱基的DNA片段,扩增的片段经限制性内切酶NaeI和XhoI消化,克隆到载体质粒pBI221中,产生了水稻胚乳细胞特异性表达的表达载体pOsPMP2,见图1,经DNA序列分析,这个DNA片段具有明显的启动子特征和信号肽的序列(SEQ ID NO.1)。
[实施例2]人工合成含有优化水稻遗传密码子的融合蛋白和目的基因。
从NIBC数据库获取了水稻Bip基因(基因库登记号为AAB63469)、小麦PDI基因(基因库登记号为CAI30637)和目的基因人的类胰岛素生长因子-1(基因库登记号为CAA01955)的氨基酸序列,使用DNA分析软件马克载体Mac Vector将融合蛋白基因转换成水稻遗传密码子的核苷酸序列,其优化后的融合蛋白和目的基因的脱氧核苷酸序列和遗传密码改变结果见表1,但其氨基酸序列完全相同。由美国的Blue Heron Biotechnology公司人工合成了这些重组融合蛋白和目的基因。在基因合成过程中,在基因两端加上了MylI和XhoI酶切位点,克隆到p UC119(美国Blue Heron Biotechnology克隆载体)质粒载体,产生了含有水稻密码子优化的BipC、PDIC和IGF-1基因(SEQ ID NO.3、SEQ ID NO.4和SEQ ID NO.5)的pOsBipC、pOsPDIC和pOsPMP3质粒。
[实施例3]构建水稻特异性表达融合蛋白的载体。
首先,密码子优化的人类胰岛素样生长因子(human IGF-1)基因通过PCR的方法扩增,克隆到经限制性内切酶MscI和XhoI消化的pOsPMP2质粒DNA,转化E.coli宿主细胞DH10B,产生一个中间质粒pOsPMP3。pOsPMP3质粒D NA用限制性内切酶NaeI和NcoI消化,同时用适合的内切酶消化pOsPMP2(见SEQ ID NO.2)、pOsBipC和pOsPDIC质粒DNA,将融合蛋白基因与表达载体质粒pOsPMP2连接,然后转化大肠杆菌品系DH10B,产生表达载体质粒为pOsPMP25和pOsPMP26。其质粒的限制性内切酶图谱见图2和图3。
[实施例4]克隆水稻半胱氨酸蛋白酶β(Cysteine proteinase β)启动子。
采用PCR的方法从水稻基因组DNA克隆水稻半胱氨酸蛋白酶β基因的启动子,根据基因库的核苷酸序列设计了两个PCR引物,引物序列见SEQ ID NO.6和SEQ ID NO.7,利用标准PCR反应,从水稻人工细菌染色体文库中,筛选到一个阳性克隆42M2(BAC克隆编号)。BAC克隆经XhoI消化后,一个5kb的片断Southern杂交证实含有半胱氨酸蛋白酶β基因的全序列,以这个BAC克隆DNA为模板,采用标准PCR反应,获得了一个1113碱基的DNA片段,将这个片段克隆到pBI221载体中,产生了一个中间载体pOsPMP04。
[实施例5]构建选择性标记基因载体。
以pCAMBIA-1301质粒DNA为模版,应用引物(见SEQ ID NO.8和SEQ ID NO.9),用标准PCR方法,扩增出的PCR片段经SmaI和XhoI消化,然后克隆到经用限制性内切酶NaeI和XhoI消化的pOsPMP4载体上,产生了水稻特异性表达的选择性标记的载体pOsPMP5(图4)。
[实施例6]基因枪介导的基因转化
水稻品种台北309种子,脱去谷壳后,经20%的次氯酸钠消毒20分钟,经无菌水漂洗3次,每次10分钟,然后放在愈伤组织诱导培养基上经20-30天的诱导,产生愈伤组织。将0.5微克的质粒pOsPMP25或pOsPMP26和0.5微克具有选择性标记质粒pOsPMP5的DNA,与50微升的金粉、250微升的1M氯化钙和50微升的0.1M亚精胺混合后,在室温(20-25℃)下反应30分钟,用酒精洗三次,然后按照杜邦公司的基因枪方法,将包裹有两个质粒DNA金粉,共转化到台北309愈伤组织的细胞中;在含有50微克/毫升的潮霉素B的选择培养基上经45天的筛选,继续生长的愈伤组织为抗潮霉素B的阳性愈伤组织,潮霉素B抗性的愈伤组织转移到再生培养基上,在光照下经20天左右的诱导,愈伤组织分化成绿色的小植株,然后将幼小植株转到生根培养基上,经15-20天的诱导,形成完整的植株,最后转到温室或试验田生长发育成成熟的种子。
[实施例7]筛选表达融合蛋白高的转基因植株。
转基因植株在温室或大田经生长与发育,然后开花结种子,形成转基因T1代种子,当T1种子收获后,每株转基因植株取10粒种子,加入10毫升的提取缓冲液(50mM Tris,pH8.0,50mM NaCl,10mM EDTA)匀浆,在离心机上每分钟14000转离心10分钟,上清液用ELISA定量药盒进行酶联免疫检测。经检测每粒种子的Bip-IGF-1融合蛋白表达水平达到150微克左右。折合成每克水稻种子含有~7.5mg重组融合蛋白,即占0.75%的种子干重。从T1种子中筛选表达融合蛋白高的转基因个体,经T1代的继续选择,形成稳定表达融合蛋白的转基因品系,供大面积生产融合蛋白之用。
从T1种子中筛选表达重组融合蛋白最高的转基因个体。为了验证高效表达融合蛋白的转基因株系,不同转基因品系的T 1代种子的粗提取液经SDS-PAGE聚丙烯凝胶电泳,考马斯亮蓝染色和蛋白质印迹法检测。图五-七是转基因植株#26-13的11个单株表达融合蛋白与遗传分离的结果。泳道1-11为转基因单株,其中泳道2,4和10为遗传分离的阴性单株,泳道12为非转基因植株(阴性对照),融合蛋白在聚丙烯凝胶中清晰可见(见图5箭头所示),当采用IGF-1抗体检测时,在转基因胚乳可见与预测分子量相同的融合蛋白,而在非转基因台北309和遗传分离的阴性个体中缺乏融合蛋白带,表现出典型的孟德尔的遗传分离比例(见图6);当利用水稻Bip抗体时,在台北309和分离的个体种子只有内源Bip蛋白质,而在转基因中存在内源Bip和重组Bip-IGF-1融合蛋白两条蛋白质带(见图7)。
SEQUENCE LISTING
<110>武汉大学
<120>利用谷物非储藏蛋白为融合载体在胚乳表达多肽的方法及应用
<130>利用谷物非储藏蛋白为融合载体在胚乳表达多肽的方法及应用
<160>9
<170>PatentIn version 3.3
<210>1
<211>1223
<212>DNA
<213>Oryza sativa
<400>1
gaagaacaac tgacggtcat aaggagaggg agcttttcga taggtgccgt gcagttcaaa 60
gagttagtta gcagtaggat gaagattttt gcacatggca atgagaagtt aattatggtg 120
taggcaaccc aaatgaaaca ccaaaatatg cacaagacag tttgttgtat tctgtagtac 180
agaataaact aaagtaatga aagaagatgg tgttagaaaa tgaaacaata ttatgagtaa 240
tgtgtgagca ttatgggacc acgaaataaa aaaagaacat ttttatgagc agtgtgttct 300
caatgagcct tgaatgttat cacccaggat aagaaaccct taagcaatga aacatgcaag 360
cgtttaatgt gcaaagttgg cattctccac gacataatgc aaaagaagat ataatctatg 420
acatagcaag tcatgcatca tttcatgcct ctgtcaacct attcatttct agtcatctag 480
gtaagtatct taagctaaag tgttagaact tcccatacat aagtcataac tgatgacaat 540
tgggtgtaac acatgacaaa ccagagagtc aagcaagata aagcaaaagg atgtgtacat 600
aaaactacag agctatatgt catgttgcga aaagaggaga gcttataaga caagccatga 660
ctcaaaaaaa attcacatgc ctactgtggc ccatatatca tgcaacaatc caaaaactca 720
caggtctcgg tgttgatcgt gtcaacatgt gaccacccta aaaactcttc actaaatatt 780
aaagtattgc tagaacagag cttcaagata taagtcatga tcaccaacaa ccatgttcaa 840
aaagaaatag aaagctatgg cacagcaaca aaaagcaaaa gcatgcatgg atataatctt 900
taacatcatc catgtcatat tgcaaaagaa agaaagagag aacaatacaa atgatgtgtc 960
aattacacat ccatcattat ccatccacct tccgtgtacc acacttcata tatcatgagt 1020
cacttcatgt ctggacatta acaaactcta tcttaacatt caaatgcatg agactttatc 1080
tcactataaa tgcacaatga tttagcattg tttctcacaa aaccattcaa gttcattagt 1140
actacaacaa catggcatcc ataaatcgcc ccatagtttt cttcacagtt tgcttgttcc 1200
tcttgtgcaa tggctctcta gcc 1223
<210>2
<211>6038
<212>DNA
<213>Escherichia coli
<400>2
aagcttcaac ctgctgagaa gaacaactga cggtcataag gagagggagc ttttcgatag 60
gtgccgtgca gttcaaagag ttagttagca gtaggatgaa gatttttgca catggcaatg 120
agaagttaat tatggtgtag gcaacccaaa tgaaacacca aaatatgcac aagacagttt 180
gttgtattct gtagtacaga ataaactaaa gtaatgaaag aagatggtgt tagaaaatga 240
aacaatatta tgagtaatgt gtgagcatta tgggaccacg aaataaaaaa agaacatttt 300
tatgagcagt gtgttctcaa tgagccttga atgttatcac ccaggataag aaacccttaa 360
gcaatgaaac atgcaagcgt ttaatgtgca aagttggcat tctccacgac ataatgcaaa 420
agaagatata atctatgaca tagcaagtca tgcatcattt catgcctctg tcaacctatt 480
catttctagt catctaggta agtatcttaa gctaaagtgt tagaacttcc catacataag 540
tcataactga tgacaattgg gtgtaacaca tgacaaacca gagagtcaag caagataaag 600
caaaaggatg tgtacataaa actacagagc tatatgtcat gttgcgaaaa gaggagagct 660
tataagacaa gccatgactc aaaaaaaatt cacatgccta ctgtggccca tatatcatgc 720
aacaatccaa aaactcacag gtctcggtgt tgatcgtgtc aacatgtgac caccctaaaa 780
actcttcact aaatattaaa gtattgctag aacagagctt caagatataa gtcatgatca 840
ccaacaacca tgttcaaaaa gaaatagaaa gctatggcac agcaacaaaa agcaaaagca 900
tgcatggata taatctttaa catcatccat gtcatattgc aaaagaaaga aagagagaac 960
aatacaaatg atgtgtcaat tacacatcca tcattatcca tccaccttcc gtgtaccaca 1020
cttcatatat catgagtcac ttcatgtctg gacattaaca aactctatct taacattcaa 1080
atgcatgaga ctttatctca ctataaatgc acaatgattt agcattgttt ctcacaaaac 1140
cattcaagtt cattagtact acaacaacat ggcatccata aatcgcccca tagttttctt 1200
cacagtttgc ttgttcctct tgtgcaatgg ctctctagcc ggccccggcg gggtggtcag 1260
tcccttatgt tacgtcctgt agaaacccca acccgtgaaa tcaaaaaact cgacggcctg 1320
tgggcattca gtctggatcg cgaaaactgt ggaattgatc agcgttggtg ggaaagcgcg 1380
ttacaagaaa gccgggcaat tgctgtgcca ggcagtttta acgatcagtt cgccgatgca 1440
gatattcgta attatgcggg caacgtctgg tatcagcgcg aagtctttat accgaaaggt 1500
tgggcaggcc agcgtatcgt gctgcgtttc gatgcggtca ctcattacgg caaagtgtgg 1560
gtcaataatc aggaagtgat ggagcatcag ggcggctata cgccatttga agccgatgtc 1620
acgccgtatg ttattgccgg gaaaagtgta cgtatcaccg tttgtgtgaa caacgaactg 1680
aactggcaga ctatcccgcc gggaatggtg attaccgacg aaaacggcaa gaaaaagcag 1740
tcttacttcc atgatttctt taactatgcc ggaatccatc gcagcgtaat gctctacacc 1800
acgccgaaca cctgggtgga cgatatcacc gtggtgacgc atgtcgcgca agactgtaac 1860
cacgcgtctg ttgactggca ggtggtggcc aatggtgatg tcagcgttga actgcgtgat 1920
gcggatcaac aggtggttgc aactggacaa ggcactagcg ggactttgca agtggtgaat 1980
ccgcacctct ggcaaccggg tgaaggttat ctctatgaac tgtgcgtcac agccaaaagc 2040
cagacagagt gtgatatcta cccgcttcgc gtcggcatcc ggtcagtggc agtgaagggc 2100
gaacagttcc tgattaacca caaaccgttc tactttactg gctttggtcg tcatgaagat 2160
gcggacttgc gtggcaaagg attcgataac gtgctgatgg tgcacgacca cgcattaatg 2220
gactggattg gggccaactc ctaccgtacc tcgcattacc cttacgctga agagatgctc 2280
gactgggcag atgaacatgg catcgtggtg attgatgaaa ctgctgctgt cggctttaac 2340
ctctctttag gcattggttt cgaagcgggc aacaagccga aagaactgta cagcgaagag 2400
gcagtcaacg gggaaactca gcaagcgcac ttacaggcga ttaaagagct gatagcgcgt 2460
gacaaaaacc acccaagcgt ggtgatgtgg agtattgcca acgaaccgga tacccgtccg 2520
caaggtgcac gggaatattt cgcgccactg gcggaagcaa cgcgtaaact cgacccgacg 2580
cgtccgatca cctgcgtcaa tgtaatgttc tgcgacgctc acaccgatac catcagcgat 2640
ctctttgatg tgctgtgcct gaaccgttat tacggatggt atgtccaaag cggcgatttg 2700
gaaacggcag agaaggtact ggaaaaagaa cttctggcct ggcaggagaa actgcatcag 2760
ccgattatca tcaccgaata cggcgtggat acgttagccg ggctgcactc aatgtacacc 2820
gacatgtgga gtgaagagta tcagtgtgca tggctggata tgtatcaccg cgtctttgat 2880
cgcgtcagcg ccgtcgtcgg tgaacaggta tggaatttcg ccgattttgc gacctcgcaa 2940
ggcatattgc gcgttggcgg taacaagaaa gggatcttca ctcgcgaccg caaaccgaag 3000
tcggcggctt ttctgctgca aaaacgctgg actggcatga acttcggtga aaaaccgcag 3060
cagggaggca aacaatgaat caacaactct cctggcgcac catcgtcggc tacagcctcg 3120
ggaattgctc tcgagctcga atttccccga tcgttcaaac atttggcaat aaagtttctt 3180
aagattgaat cctgttgccg gtcttgcgat gattatcata taatttctgt tgaattacgt 3240
taagcatgta ataattaaca tgtaatgcat gacgttattt atgagatggg tttttatgat 3300
tagagtcccg caattataca tttaatacgc gatagaaaac aaaatatagc gcgcaaacta 3360
ggataaatta tcgcgcgcgg tgtcatctat gttactagat cgggaattca ctggccgtcg 3420
ttttacaacg tcgtgactgg gaaaaccctg gcgttaccca acttaatcgc cttgcagcac 3480
atcccccttt cgccagctgg cgtaatagcg aagaggcccg caccgatcgc ccttcccaac 3540
agttgcgcag cctgaatggc gaatggcgcc tgatgcggta ttttctcctt acgcatctgt 3600
gcggtatttc acaccgcata tggtgcactc tcagtacaat ctgctctgat gccgcatagt 3660
taagccagcc ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc 3720
cggcatccgc ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt 3780
caccgtcatc accgaaacgc gcgagacgaa agggcctcgt gatacgccta tttttatagg 3840
ttaatgtcat gataataatg gtttcttaga cgtcaggtgg cacttttcgg ggaaatgtgc 3900
gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg ctcatgagac 3960
aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt attcaacatt 4020
tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt gctcacccag 4080
aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg ggttacatcg 4140
aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa cgttttccaa 4200
tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc 4260
aagagcaact cggtcgccgc atacactatt ctcagaatga cttggttgag tactcaccag 4320
tcacagaaaa gcatcttacg gatggcatga cagtaagaga attatgcagt gctgccataa 4380
ccatgagtga taacactgcg gccaacttac ttctgacaac gatcggagga ccgaaggagc 4440
taaccgcttt tttgcacaac atgggggatc atgtaactcg ccttgatcgt tgggaaccgg 4500
agctgaatga agccatacca aacgacgagc gtgacaccac gatgcctgta gcaatggcaa 4560
caacgttgcg caaactatta actggcgaac tacttactct agcttcccgg caacaattaa 4620
tagactggat ggaggcggat aaagttgcag gaccacttct gcgctcggcc cttccggctg 4680
gctggtttat tgctgataaa tctggagccg gtgagcgtgg gtctcgcggt atcattgcag 4740
cactggggcc agatggtaag ccctcccgta tcgtagttat ctacacgacg gggagtcagg 4800
caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg attaagcatt 4860
ggtaactgtc agaccaagtt tactcatata tactttagat tgatttaaaa cttcattttt 4920
aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa atcccttaac 4980
gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag 5040
atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg 5100
tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact ggcttcagca 5160
gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac cacttcaaga 5220
actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg gctgctgcca 5280
gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg gataaggcgc 5340
agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga acgacctaca 5400
ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc gaagggagaa 5460
aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg agggagcttc 5520
cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc 5580
gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg 5640
cctttttacg gttcctggcc ttttgctggc cttttgctca catgttcttt cctgcgttat 5700
cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc gctcgccgca 5760
gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca 5820
aaccgcctct ccccgcgcgt tggccgattc attaatgcag ctggcacgac aggtttcccg 5880
actggaaagc gggcagtgag cgcaacgcaa ttaatgtgag ttagctcact cattaggcac 5940
cccaggcttt acactttatg cttccggctc gtatgttgtg tggaattgtg agcggataac 6000
aatttcacac aggaaacagc tatgaccatg attacgcc 6038
<210>3
<211>768
<212>DNA
<213>人工合成]
<400>3
atcctctccg gcgagggcgg cgacgagacc aaggacatcc tcctcctcga cgtggccccg 60
ctcaccctcg gcatcgagac cgtgggcggc gtgatgacca agctcatccc gcgcaacacc 120
gtgatcccga ccaagaagtc ccaggtgttc accacctacc aggaccagca gaccaccgtg 180
tccatccagg tgttcgaggg cgagcgctcc atgaccaagg actgccgcct cctcggcaag 240
ttcgacctct ccggcatccc ggccgccccg cgcggcaccc cgcagatcga ggtgaccttc 300
gaggtggacg ccaacggcat cctcaacgtg aaggccgagg acaagggcac cggcaagtcc 360
gagaagatca ccatcaccaa cgagaagggc cgcctctccc aggaggagat cgaccgcatg 420
gtgcgcgagg ccgaggagtt cgccgaggag gacaagaagg tgaaggagcg catcgacgcc 480
cgcaaccagc tggagaccta cgtgtacaac atgaagaaca ccgtgggcga caaggacaag 540
ctcgccgaca agctggagtc cgaggagaag gagaaggtgg aggaggccct caaggaggcc 600
ctggagtggc tcgacgagaa ccagaccgcc gagaaggagg agtacgagga gaagctcaag 660
gaggtggagg ccgtgtgcaa cccgatcatc tccgccgtgt accagcgcac cggcggcgcg 720
ccgggcggcc gccgccgcgg ccgcctcgac gacgagcacg acgagctc 768
<210>4
<211>399
<212>DNA
<213>人工合成
<400>4
ccggtgaagg tggtggtggc cgacaacatc cacgacgtgg tgttcaagtc cggcaagaac 60
gtgctcatcg agttctacgc cccgtggtgc ggccactgca agaagctcgc cccgatcctc 120
gacgaggccg ccgccaccct ccagtccgag gaggacgtgg tgatcgccaa gatcgacgcc 180
accgccaacg acgtgccggg cgagttcgac gtgcagggct acccgaccct ctacttcgtg 240
accccgtccg gcaagaaggt gtcctacgag ggcggccgca ccgccgacga gatcgtggac 300
tacatcaaga agaacaagga gaccgccggc caggccgccg ccgccgccac cgagaaggcc 360
gccgagccgg ccgccaccga gccgctcaag gacgagctc 399
<210>5
<211>399
<212>DNA
<213>人工合成
<400>5
ccggtgaagg tggtggtggc cgacaacatc cacgacgtgg tgttcaagtc cggcaagaac 60
gtgctcatcg agttctacgc cccgtggtgc ggccactgca agaagctcgc cccgatcctc 120
gacgaggccg ccgccaccct ccagtccgag gaggacgtgg tgatcgccaa gatcgacgcc 180
accgccaacg acgtgccggg cgagttcgac gtgcagggct acccgaccct ctacttcgtg 240
accccgtccg gcaagaaggt gtcctacgag ggcggccgca ccgccgacga gatcgtggac 300
tacatcaaga agaacaagga gaccgccggc caggccgccg ccgccgccac cgagaaggcc 360
gccgagccgg ccgccaccga gccgctcaag gacgagctc 399
<210>6
<211>34
<212>DNA
<213>人工合成
<400>6
cccaagcttc aacctgctga gaagaacaac tgac 34
<210>7
<211>31
<212>DNA
<213>人工合成
<400>7
cggtgccggc tagagagcca ttgcacaaga g 31
<210>8
<211>33
<212>DNA
<213>人工合成
<400>8
aaagtactat gaaaaagcct gaactcaccg cga 33
<210>9
<211>35
<212>DNA
<213>人工合成
<400>9
ggagaaactc gagcttgtcg atcgacagat ccggt 35