CN114134141A - 一种引入非天然氨基酸的嵌合体苯丙氨酸翻译系统及其构建方法 - Google Patents

一种引入非天然氨基酸的嵌合体苯丙氨酸翻译系统及其构建方法 Download PDF

Info

Publication number
CN114134141A
CN114134141A CN202111293920.3A CN202111293920A CN114134141A CN 114134141 A CN114134141 A CN 114134141A CN 202111293920 A CN202111293920 A CN 202111293920A CN 114134141 A CN114134141 A CN 114134141A
Authority
CN
China
Prior art keywords
phenylalanine
chimeric
trna
translation system
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111293920.3A
Other languages
English (en)
Other versions
CN114134141B (zh
Inventor
林世贤
赵红霞
丁文龙
柳光龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Chihua Hesheng Pharmaceutical Technology Co ltd
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202111293920.3A priority Critical patent/CN114134141B/zh
Publication of CN114134141A publication Critical patent/CN114134141A/zh
Application granted granted Critical
Publication of CN114134141B publication Critical patent/CN114134141B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/65Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y601/00Ligases forming carbon-oxygen bonds (6.1)
    • C12Y601/01Ligases forming aminoacyl-tRNA and related compounds (6.1.1)
    • C12Y601/0102Phenylalanine-tRNA ligase (6.1.1.20)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/55Vectors comprising a special translation-regulating system from bacteria

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明公开了一种引入非天然氨基酸的嵌合体苯丙氨酸翻译系统及其构建方法。本发明提供了一种引入非天然氨基酸的嵌合体苯丙氨酸翻译系统的构建方法,以及由该构建方法构建得到的AzF依赖的大肠杆菌菌株和嵌合体苯丙氨酸翻译系统。本发明提供的翻译系统建立的定向进化策略具有广谱适用性,可应用于其他遗传密码扩展系统的定向进化;另外,本发明提供的翻译系统建立的识别4‑叠氮‑苯丙氨酸(AzF)的嵌合体苯丙氨酸翻译系统的信噪比高达65倍。

Description

一种引入非天然氨基酸的嵌合体苯丙氨酸翻译系统及其构建 方法
技术领域
本发明属于分子生物学技术领域,具体涉及一种引入非天然氨基酸的嵌合体苯丙氨酸翻译系统及其构建方法。
背景技术
遗传密码扩展技术利用正交化的氨酰-tRNA合成酶/tRNA对(Aminoacyl-tRNAsynthetases/tRNA pairs)将非天然氨基酸定点的插入到蛋白质中,已经广泛的应用于蛋白质功能的研究、蛋白质功能改造、蛋白质功能重塑等方面。遗传密码扩展技术还可以通过非天然氨基酸的添加与否控制蛋白质的翻译,进而起到分子开关的作用,已经应用于构建减毒型大肠杆菌中。但是由于缺乏在真核生物和原核生物广谱正交、高效率、高信噪比的氨酰-tRNA合成酶/tRNA对,不仅导致含非天然氨基酸蛋白质的制备成本高昂、操作繁琐,商业转化困难;且难以作为分子开关应用在真核生物中。
自遗传密码扩展技术诞生开始,提升非天然氨基酸插入效率,达到生物体内源识别天然氨基酸的效率,一直是本领域孜孜以求的。这一目标的达成不仅可以极大的降低含非天然氨基酸蛋白质生成成本、还可以应用于重编码密码子信息,以及应用于构建非天然生物体。国内外同行,针对不同的氨酰-tRNA合成酶/tRNA对开发了一系列的方法。剑桥大学的Jason Chin教授通过改造SepRS的tRNA的结合结构域和tRNASep的非密码子环,将磷酸化丝氨酸的插入效率提升了18倍,后来通过改造tRNASep的受体臂区进一步提升了磷酸化丝氨酸的插入效率。其他研究组对Mj-TyrRS/tRNA、PylRS/tRNA对的相应tRNA进行改造,有限的提升了非天然氨基酸的引入效率。Diter Soll和David R Liu构建了Mm和Mb 两个物种嵌合体的PylRS,并通过PACE(phage-assisted continuous evolution,噬菌体辅助的连续进化) 的方法对这个嵌合蛋白进行了改造,提高活性。Farren J Isaacs教授构建MAGE系统改造Mj-TyrRS的底物结合口袋,获得一个高效识别4-叠氮-苯丙氨酸的突变体。以上大部分研究只针对性的改造tRNA或氨酰-RNA合成酶,且尚未有研究对氨酰-tRNA合成酶的催化结构域定向改造,未探究远端突变对活性提高的作用。
本发明人在之前的研究中通过嵌合设计构建了一系列广谱正交的嵌合对,并利用嵌合苯丙氨酸翻译系统在大肠杆菌和哺乳动物细胞中引入了一系列苯丙氨酸和色氨酸的衍生物。但是其非天然氨基酸插入效率还未达到内源氨酰-tRNA合成酶识别天然氨基酸的水平,且信噪比还需要进一步提高。此系统与现在常用的非天然氨基酸引入系统的相互正交性未知,整合到基因组上的非天然氨基酸插入效率也未知,这些都阻碍了嵌合苯丙氨酸翻译系统的广泛应用。
发明内容
发明要解决的问题
基于现有技术存在的问题,本发明建立一套系统性进化氨酰-tRNA合成酶/tRNA对,显著提升非天然氨基酸插入效率的体系。通过对嵌合体苯丙氨酰-tRNA合成酶/tRNA对的系统改造,获得了:(1) 一套高效率(达到内源氨酰-tRNA合成酶/tRNA对引入天然氨基酸水平)引入3-苯并噻吩基-丙氨酸 (BTA)、6-甲基-色氨酸(6MW)、7-甲基-色氨酸(7MW)、4-叠氮-苯丙氨酸(AzF)、4-乙酰基-苯丙氨酸(AcF)、2-萘基-丙氨酸(NapA)等非天然氨基酸(具体参见图2)的翻译系统(命名为 12D4-chPheRS/2*3C11);(2)一套高信噪比,低使用剂量引入4-叠氮-苯丙氨酸(AzF)的翻译系统(命名为AzFRS-2/2*3C11);(3)一套高信噪比,低使用剂量引入3-苯并噻吩基-丙氨酸(BTA)的翻译系统(命名为BTARS/2*3C11)。并利用上述翻译系统AzFRS-2/2*3C11开发了一个简单易行、高效安全和普适性的生物遏制策略,构建了减毒型大肠杆菌。
本发明还构建了评估嵌合体苯丙氨酸翻译系统与Mj-TyrRS/tRNA系统[1],Ma-PylRS/tRNA系统[2]相互正交性的体系,并在GFP上同时引入了2个不同的非天然氨基酸,证明了本发明构建的嵌合体苯丙氨酸翻译系统与这两个系统的相互正交性。本发明进一步的将上述翻译系统12D4-AzFRS-2/2*3C11 整合到大肠杆菌DH10B的基因组上,构建了一个底盘菌株。
用于解决问题的方案
[1]本发明提供了一种嵌合体苯丙氨酸-tRNA的定向进化策略,包括选择嵌合体苯丙氨酸-tRNA 的受体臂区第2到第7碱基对进行文库构建,利用氯霉素和GFP荧光双报告系统筛选显著性提高嵌合体苯丙氨酸翻译系统活性的嵌合体苯丙氨酸-tRNA(具体构建方法参见图3)。
(1)一些实施方案中,筛选得到显著性提高嵌合体苯丙氨酸翻译系统活性的嵌合体苯丙氨酸 -tRNA有1C6、2F6、3C11、4E3、11H1、16C2,其中3C11的活性最高(具体参见图4)。用于该系统的嵌合体苯丙氨酸-tRNA:1C6、2F6、3C11、4E3、11H1、16C2包含的核苷酸序列分别为SEQ ID NO: 2~7。
(2)在一些具体的实施方案中,以上筛选所得的嵌合体苯丙氨酸-tRNA与任何嵌合体苯丙氨酰 -tRNA合成酶组合都能提高嵌合体苯丙氨酸翻译系统的效率。
(3)在另外一些具体的实施方案中,两个拷贝的嵌合体苯丙氨酸-tRNA-3C11能显著性提高嵌合体苯丙氨酸翻译系统引入非天然氨基酸的效率(具体参见图6)。
[2]本发明提供了一种嵌合体苯丙氨酰-tRNA合成酶的C端催化结构域定向进化策略,包括通过易错PCR建立嵌合体苯丙氨酰-tRNA合成酶的随机突变文库,利用正负筛选策略筛选显著性提高嵌合体苯丙氨酸翻译系统的突变体(分别命名为2B11、7D1、10F1、12D4和13E3),最终获得两个显著性提高非天然氨基酸引入效率的突变体,即:12D4和13E3。通过GFP荧光信号报告实验可以看出:12D4 和13E3分别提高嵌合体苯丙氨酸翻译系统引入非天然氨基酸的效率达到6.2倍和5.6倍。筛选所得的突变体12D4的突变位点不是氨基酸结合口袋,以上12D4和13E3的突变位点可以转移到其他嵌合体苯丙氨酰-tRNA合成酶中提高对不同非天然氨基酸的识别效率(具体参见图5)。
[3]本发明提供了一系列高效率、高信噪比识别4-叠氮-苯丙氨酸(AzF)和3-苯并噻吩基-丙氨酸 (BTA)的嵌合体苯丙氨酰-tRNA合成酶突变体。
(1)通过对嵌合体苯丙氨酰-tRNA合成酶氨基酸结合口袋的氨基酸(F464、T467和A507)构建饱和诱变基因文库,通过正负筛选策略筛选特异性识别AzF和BTA的嵌合体苯丙氨酰-tRNA合成酶突变体,最终获得AzFRS-2和BTARS突变体。其中,AzFRS-2包含F464I、T467G和A507G三个突变, BTARS包含F464V、T467G和A507G三个突变。
(2)在一些具体的实施方案中,筛选所得的AzFRS-2和BTARS表现出极高的信噪比,AzFRS-2 和BTARS的信噪比分别达到65.3和22.9(具体参见图9)。
[4]本发明提供了一种高效率、高信噪比引入非天然氨基酸的嵌合体苯丙氨酸翻译系统,包括整合本发明在第二方面、第三方面和第四方面的内容,建立高效率、高信噪比的嵌合体苯丙氨酸翻译系统,(1)实现在3个琥珀终止子(TAG)位点引入AzF,引入效率达到内源氨酰-tRNA合成酶识别天然氨基酸的效率(具体参见图8);(2)实现在不同蛋白的随机位点引入非天然氨基酸的效率达到野生型蛋白表达水平,如:FLUC、ADK、TyrRS、UBE2K、Neo2/15、PHD、GID4等蛋白(具体参见图15)。目标蛋白的核苷酸序列分别为SEQ ID NO:51-62。其中,SEQ ID NO:51-62分别示出了Fluc-D234TAG、 Fluc-Y266TAG、ADK-E114TAG、ADK-V142TAG、TyrRS-E240TAG、TyrRS-Y301TAG、UBE2K-D48TAG、 UBE2K-Y134TAG、Neo2/15-Y14TAG、BPTF(2583-2751)-GST-Y2587TAG、BPTF(2583-2751)-GST-W2609TAG和GID4-(116-300)-F128TAG的核苷酸序列。
[5]本发明提供了一种利用高效率、高信噪比的嵌合体苯丙氨段翻译系统AzFRS-2/3C11构建得到的AzF依赖型大肠杆菌菌株(具体参见图10)。具体步骤如下:
(1)选择大肠杆菌必需基因dnaN,在N端连接一段含有4个TAG密码子的序列,连接好的 dnaN-4TAGs的核苷酸序列见SEQ ID NO:12。
(2)将dnaN-4TAGs、AzFRS-2、2*3C11装载到载体pChira上,分别在tac、oxb20、lpp启动子控制下,构建质粒名称为pChira-4*TAG-DnaN-AzFRS-2-2*chPheT(具体参见图1),完整序列见SEQ ID NO: 13。
(3)将pChira-4*TAG-DnaN-AzFRS-2-2*chPheT与pTKred(Addgene,plasmid#41062)共转化到大肠杆菌DH10B,挑取单克隆制备含有这个质粒的电转化感受态细胞。
(4)获取携带基因组dnaN基因上下游同源臂的卡那霉素基因片段,完整序列Upstream100bp-△dnaN::KanR-Dowmstream100bp见SEQ ID NO:14。
(5)将携带基因组dnaN基因同源臂的抗性基因片段电转化到(3)中制备的电转化感受态细胞,并将菌液涂布在含有50μg/ml卡那霉素,30μg/ml氯霉素和1mM AzF的平板上,放置在30℃培养。
(6)挑取单克隆在AzF条件下培养,菌落PCR鉴定大肠杆菌菌株敲除dnaN基因。
(7)将(6)中鉴定成功的菌株分别在含AzF和不含AzF条件下培养,并测定AzF依赖型大肠杆菌菌株的生长曲线。
(8)将(6)中鉴定成功的菌株在含AzF的培养基中培养,待OD600=0.6-0.8时,利用PBS清洗菌液后将菌液涂布在不含AzF的培养平板上,放置14天后测定菌株的逃逸率。
(9)构建一个表达荧光素酶的质粒pGEX-trp-fLuc(其核苷酸序列为SEQ ID NO:16),转化到 (8)中鉴定获得的低逃逸率的AzF依赖的大肠杆菌中。在通过体外测定加减AzF生物发光的信号,指示大肠杆菌的死活,并将这一菌株注射到小鼠的皮下(具体参见图11)。
[6]本发明对嵌合体苯丙氨酸翻译系统与Mj-TyrRS/tRNA系统以及Ma-PylRS/tRNA系统具备相互正交性进行了验证。具体包括通过GFP荧光报告实验和LC-MS鉴定本发明提供的嵌合体苯丙氨酸翻译系统分别与Mj-TyrRS/tRNA系统以及Ma-PylRS/tRNA系统具备正交性(具体参见图12)。
[7]本发明提供了一种将高效率、高信噪比的嵌合体苯丙氨酸翻译系统整合到大肠杆菌基因组上的方法,整合后该系统的效率依然保持高效率、高信噪比的特性(具体参见图13)。具体操作如下:
(1)通过PCR扩增含有同源臂(即HA1和HA2)、12D4-AzFRS-2、2*3C11、氯霉素抗性基因的串联序列,得到完整序列HA1-12D4-AzFRS-2-2*3C11-CmR-HA2,其核苷酸序列参见SEQID NO:15。
(2)将pTKred共转化到大肠杆菌DH10B,挑取单克隆制备含有这个质粒的电转化感受态细胞。
(3)将(1)中所述HA1-12D4-AzFRS-2-2*3C11-CmR-HA2基因片段电转化到(2)中制备的电转化感受态细胞,并将菌液涂布在含有30μg/ml氯霉素的平板上,放置在30℃培养。
(4)挑取单克隆培养,菌落PCR鉴定基因组成功整合12D4-AzFRS-2-2*3C11-CmR基因片段的大肠杆菌菌株。
(5)将(4)中鉴定成功的菌株制备化学转化感受态,转化报告基因质粒pNEG-chPheT-GFP190TAG,其核苷酸序列参见SEQ ID NO:45(具体参见图1)。
(6)通过GFP荧光报告实验测定菌株的琥珀抑制效率。
更具体的,本发明提供了以下技术方案:
本发明在第一方面提供了一种引入非天然氨基酸的嵌合体苯丙氨酸翻译系统的构建方法,其特征在于,所述方法包括以下步骤:
(1)以核苷酸序列如SEQ ID NO:1所示的嵌合体苯丙氨酸-tRNA为基础,构建嵌合体苯丙氨酸-tRNA的文库;
(2)筛选嵌合体苯丙氨酸-tRNA突变体,并测试筛选到的苯丙氨酸-tRNA突变体引入非天然氨基酸的效率;
(3)选择嵌合体苯丙氨酰-tRNA合成酶的催化结构域、构建随机突变文库,筛选催化活性提高的嵌合体苯丙氨酰-tRNA合成酶突变体,获得非天然氨基酸插入活性提高的突变体;
(4)选择嵌合体苯丙氨酰-tRNA合成酶识别4-叠氮-苯丙氨酸(AzF)和3-苯并噻吩基-丙氨酸 (BTA)的氨基酸,构建饱和诱变文库,筛选高信噪比的嵌合体苯丙氨酰-tRNA合成酶突变体,所述突变体的基因序列分别如SEQ ID NO:9和SEQ ID NO:10所示;
(5)将步骤(2)中筛选得到的嵌合体苯丙氨酸-tRNA突变体和步骤(3)中筛选得到的嵌合体苯丙氨酰-tRNA合成酶突变体整合,获得包含嵌合体苯丙氨酰-tRNA合成酶、苯丙氨酸-tRNA突变体和非天然氨基酸的翻译系统。
在一些具体的实施方式中,其中所述非天然氨基酸选自由3-苯并噻吩基-丙氨酸(BTA)、6-甲基 -色氨酸(6MW)、7-甲基-色氨酸(7MW)、4-叠氮-苯丙氨酸(AzF)、4-乙酰基-苯丙氨酸(AcF)、2- 萘基-丙氨酸(NapA)、叔丁氧羰基-赖氨酸(BocK)和3-硝基-酪氨酸(3NT)组成的组中的一种或多种。
在另外一些具体的实施方式中,其中步骤(2)中筛选得到的嵌合体苯丙氨酸-tRNA突变体的核苷酸序列分别如SEQ ID NO:2~7所示。其中步骤(3)中筛选得到的嵌合体苯丙氨酰-tRNA合成酶突变体的核苷酸序列分别如SEQ ID NO:63和SEQ ID NO:64所示。
在一些优选的实施方式中,在本发明第一方面提供的构建方法中,通过使用两个拷贝的核苷酸序列如SEQ ID NO:4所示的嵌合体苯丙氨酸-tRNA突变体,实现引入非天然氨基酸效率达到细胞内源天然氨基酸插入的水平。并且,在选自由FLUC、ADK、TyrRS、UBE2K、Neo2/15、PHD和GID4组成的组中的任一种蛋白质上引入非天然氨基酸的效率能够达到野生型蛋白的表达水平。
在另外一些优选的实施方式中,在本发明第一方面提供的构建方法中,其中步骤(5)中所述包含嵌合体苯丙氨酰-tRNA合成酶、苯丙氨酸-tRNA突变体和非天然氨基酸的翻译系统的基因序列分别如SEQ ID NO:9和SEQ ID NO:4所示。
本发明在第二方面提供了一种由本发明第一方面所述的构建方法构建得到的AzF依赖的大肠杆菌菌株。
本发明在第三方面提供了一种由本发明第一方面所述的构建方法构建得到的嵌合体苯丙氨酸翻译系统。
在一些优选的实施方式中,所述翻译系统与Mj-TyrRS/tRNA系统以及Ma-PylRS/tRNA系统具备交互正交性和/或所述翻译系统能够整合到大肠杆菌的基因组上
发明定义
本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。除非另有定义,否则本文中使用的所有技术和科学术语均具有与本领域一般技术人员通常所理解的含义相同的含义。为了本发明的目的,下文定义了以下术语。
术语“约”在与数字数值联合使用时意为涵盖具有比指定数字数值小5%的下限和比指定数字数值大于5%的上限的范围内的数字数值。
术语“和/或”当用于连接两个或多个可选项时,应理解为意指可选项中的任一项或可选项中的任意两项或多项。
如本文中所用,术语“包括”意指包括所述的要素、整数或步骤,但是不排除任意其他要素、整数或步骤。在本文中,当使用术语“包括”时,除非另有指明,否则也涵盖由所述及的要素、整数或步骤组成的情形。
术语“数值A~数值B”表示的数值范围是指包含端点数值A、B的范围。
术语“以上”或“以下”表示的数值范围是指包含本数的数值范围。
术语“可以”表示的含义包括了进行某种处理以及不进行某种处理两方面的含义。
术语“任选”或“任选的”表示某些物质、组分、执行步骤、施加条件等因素使用或者不使用。
本说明书中,所提及的“一些具体/优选的实施方案”、“另一些具体/优选的实施方案”、“实施方案”等是指所描述的与该实施方案有关的特定要素(例如,特征、结构、性质和/或特性)包括在此处所述的至少一种实施方案中,并且可存在于其它实施方案中或者可不存在于其它实施方案中。另外,应理解,所述要素可以任何合适的方式组合在各种实施方案中。
发明的效果
由本发明的技术方案可见,本发明的技术方案与现有技术相比,具有以下有益效果:
(1)本发明通过对嵌合体苯丙氨酸tRNA和苯丙氨酰-tRNA合成酶的定向进化成功提高嵌合体苯丙氨酸翻译系统对非天然氨基酸的识别效率,同时该系统表现出高活性、高信噪比的特征在目标蛋白的单个或者多个位点特异性引入非天然氨基酸,特别注意的是,该系统表达非天然氨基酸标记的蛋白表达量接近于野生型蛋白的表达水平。
(2)本发明提供的翻译系统广谱正交性与真核生物和原核生物系统,因此该系统在哺乳动物细胞中依然保持高活性、高信噪比的特点,远远优于已报道的遗传密码扩展系统。
(3)本发明提供的翻译系统建立的定向进化策略具有广谱适用性,可应用于其他遗传密码扩展系统的定向进化。
(4)本发明提供的翻译系统建立的识别4-叠氮-苯丙氨酸(AzF)的嵌合体苯丙氨酸翻译系统的信噪比高达65倍,成为建立非天然氨基酸依赖型的减毒型大肠杆菌的首要选择,该系统将为发展减毒型菌株用于治疗疾病提供一个工具。
(5)本发明提供的翻译系统的高效率和高信噪比的特征扩展了该系统在蛋白质生产、减毒型菌株开发等实验室研究或者产业研究等提供一个工具。
附图说明
图1示出了重组载体pChira-4*TAG-DnaN-AzFRS-2-2*chPheT(SEQ ID NO:13),pNEG-chPheT-GFP190TAG(SEQ ID NO:45),pBK-chPheRS(SEQ ID NO:46), pNEG-chPheT-CAT112TAG-GFP190TAG(SEQ ID NO:47),pNEG-chPheT-Barnase-2*TAG(SEQ ID NO:48),pCDNA3.1-12D4-AzFRS-2-2*3C11(SEQ ID NO:49),pEGFP-mCherry-T2A-EGFP(SEQ ID NO:50)质粒图谱。
图2示出了本发明引入的非天然氨基酸4-叠氮基-苯丙氨酸(AzF)、4-乙酰基-苯丙氨酸(AcF)、 2-萘基-丙氨酸(NapA)、6-甲基-色氨酸(6MW)、7-甲基-色氨酸(7MW)、3-苯并噻吩基-丙氨酸(BTA)、叔丁氧羰基-赖氨酸(BocK)和3-硝基-酪氨酸(3NT)的结构式。
图3本发明嵌合体苯丙氨酸-tRNA的定向进化策略的具体流程。其中,(A)图为嵌合体苯丙氨酰 -tRNA合成酶和嵌合体苯丙氨酸-tRNA的结构示意图,(B)嵌合体苯丙氨酸-tRNA的文库构建流程图。
图4示出了本发明提供的嵌合体苯丙氨酸-tRNA突变体的琥珀抑制效率。其中,(A)示出了筛选所得的嵌合体苯丙氨酸-tRNA突变体受体臂区的序列。(B)示出了以非天然氨基酸4-叠氮-苯丙氨酸为例。GFP荧光信号报告实验验证嵌合体苯丙氨酸-tRNA突变体/嵌合体苯丙氨酰-tRNA合成酶对识别4- 叠氮-苯丙氨酸的效率,得到嵌合体苯丙氨酸-tRNA-3C11的活性最高。(C)示出了GFP荧光信号报告实验表明嵌合体苯丙氨酸-tRNA-3C11显著性提高不同嵌合体苯丙氨酸翻译系统的琥珀抑制效率,其中以2-萘基-丙氨酸(NapA)、6-甲基-色氨酸(6MW)和4-乙酰基-苯丙氨酸(AcF)为例。
图5示出了本发明提供的嵌合苯丙氨酰-tRNA合成酶的C端催化结构域定向进化结果。其中,(A) 示出了嵌合体苯丙氨酰-tRNA合成酶的C端催化结构域定向进化流程图。(B)示出了筛选所得的嵌合体苯丙氨酰-tRNA合成酶突变体的突变位点,琥珀抑制效率实验表明12D4(K290L、Y294N、R300S、 F301S、S333C、S397T、L455P和M490L)和13E3(Y294N、G299D、R300C、P328T、S333C、K335R、 S397T、L411Q、T426S、L455P、C462S和M490L)显著提高嵌合体苯丙氨酸翻译系统的效率,分别提高了6.2倍和5.6倍。(C)示出了人源线粒体苯丙氨酰-tRNA合成酶的催化结构域的结构示意图,筛选所得的嵌合体苯丙氨酰-tRNA合成酶12D4的突变位点用棍状结构表示。(D)示出以4-叠氮-苯丙氨酸(AzF)为例,GFP荧光信号报告实验表明筛选所得的嵌合体苯丙氨酰-tRNA合成酶12D4和13E3与嵌合体苯丙氨酸-tRNA-3C11组合后能显著提高嵌合体苯丙氨酸翻译系统的琥珀抑制效率,嵌合体苯丙氨酰-tRNA合成酶12D4/嵌合体苯丙氨酸-tRNA-3C11对提高嵌合体苯丙氨酸翻译系统的琥珀抑制效率达到12.3倍。
图6示出了本发明提供的两个拷贝的嵌合体苯丙氨酸-tRNA-3C11显著提高嵌合体苯丙氨酸翻译系统的琥珀抑制效率。以识别4-叠氮-苯丙氨酸的AzFRS-2为例,当oxb20调控AzFRS-2表达时,嵌合体苯丙氨酸翻译系统的琥珀抑制效率达到内源氨酰-tRNA合成酶识别天然氨基酸的效率。
图7示出了本发明基于12D4突变的高效率嵌合体苯丙氨酸翻译系统。其中,(A)示出了GFP荧光信号报告实验探索基于12D4突变的嵌合体苯丙氨酸翻译系统识别不同非天然氨基酸的琥珀抑制效率,从GFP荧光信号报告实验可以看出进化后的嵌合体苯丙氨酸翻译系统识别非天然氨基酸的效率接近于内源氨酰-tRNA合成酶识别天然氨基酸的效率。(B)示出了质谱鉴定高效率嵌合体苯丙氨酸翻译系统识别非天然氨基酸的保真度。
图8示出了本发明的高效率嵌合体苯丙氨酸翻译系统识别多位点琥珀终止子的琥珀抑制效率。其中,(A)示出了嵌合体苯丙氨酸翻译系统的荧光信号报告实验示意图。(B)示出了GFP荧光信号报告实验表明高效率嵌合体苯丙氨酸翻译系统识别多位点琥珀终止子的琥珀抑制效率,从结果看出嵌合体苯丙氨酸翻译系统识别3个琥珀终止子的琥珀抑制效率接近于内源氨酰tRNA合成酶识别天然氨基酸的效率。
图9示出了本发明的高信噪比嵌合体苯丙氨酸翻译系统的琥珀抑制效率。其中,(A)示出了GFP 荧光信号报告实验表明高信噪比的嵌合体苯丙氨酸-AzF系统识别不同浓度AzF的琥珀抑制效率。从结果看出嵌合体苯丙氨酸AzFRS-2翻译系统的信噪比达到65.3倍。(B)示出了GFP荧光信号报告实验表明高信噪比的嵌合体苯丙氨酸-BTA系统识别不同浓度BTA的琥珀抑制效率。从结果看出嵌合体苯丙氨酸BTA翻译系统的信噪比达到22.9倍。
图10示出了本发明的构建非天然氨基酸依赖型的大肠杆菌菌株及其试验结果。以非天然氨基酸 AzF为例。其中,(A)示出了构建基于必需基因dnaN的AzF依赖的大肠杆菌菌株的流程图。以大肠杆菌必需基因dnaN为例,利用λ-重组系统使用卡那霉素基因替换大肠杆菌内源必需基因dnaN,同时过表达含有琥珀终止子的dnaN基因构建AzF依赖型的大肠杆菌菌株。(B)示出了基于必需基因dnaN的AzF 依赖型大肠杆菌的逃逸率。AzF依赖型大肠杆菌菌株分别含有2、3和4琥珀抑制子。(C)示出了基于必需基因dnaN的AzF依赖型大肠杆菌的生长曲线。(D)示出了基于必需基因pgsA、TyrS和adk的AzF 依赖型大肠杆菌菌株的逃逸率。
图11示出了本发明提供的4-叠氮-苯丙氨酸(AzF)依赖型的大肠杆菌菌株在小鼠活体应用中的试验结果。其中,(A)示出了于必需基因dnaN的含有3个琥珀终止子的AzF依赖型菌株在添加AzF和不添加AzF条件下的生物发光强度。(B)示出了活体成像检测小鼠体内AzF依赖型菌株在供给AzF和不供给AzF时生物发光强度,从结果看出在给小鼠供给AzF时,小鼠体内的AzF依赖型菌株显著生长。 (C)示出了统计学分析(B)中生物发光强度。
图12示出了本发明提供的高效率、高信噪比嵌合体苯丙氨酸翻译系统与Mj-TyrRS/tRNA系统以及Ma-PylRS/tRNA系统的交互正交性试验结果。其中,(A)和(C)分别示出了GFP荧光信号报告实验检测嵌合体苯丙氨酸翻译系统与Ma-PylRS/tRNA系统交互识别4-叠氮-苯丙氨酸(AzF)和叔丁氧羰基-赖氨酸(BocK)的琥珀抑制效率和嵌合体苯丙氨酸翻译系统与Mj-TyrRS/tRNA系统交互识别4-叠氮 -苯丙氨酸(AzF)和3-硝基-酪氨酸(3NT)的琥珀抑制效率的结果。(B)和(D)分别通过质谱证明了嵌合体苯丙氨酸翻译系统与Mj-TyrRS/tRNA系统以及Ma-PylRS/tRNA系统的交互正交性。
图13示出了本发明提供的高效率、高信噪比嵌合体苯丙氨酸翻译系统整合到大肠杆菌基因组后识别非天然氨基酸的效率。其中,(A)示出了GFP荧光信号报告实验比较嵌合体苯丙氨酸翻译系统整合到大肠杆菌基因组(chPheRS/T-G)和瞬时过表达嵌合体苯丙氨酸翻译系统(chPheRS/T-p)识别非天然氨基酸的效率,结果表明chPheRS/T-G识别非天然氨基酸的效率达到野生型蛋白表达水平的50%左右。(B)示出了GFP荧光信号报告实验比较嵌合体苯丙氨酸翻译系统整合到大肠杆菌基因组不同位点的琥珀抑制效率,实验结果表明在大肠杆菌基因组上同时整合双倍的嵌合体苯丙氨酸翻译系统时,该嵌合体苯丙氨酸翻译识别非天然氨基酸的效率达到野生型蛋白表达水平的90%。
图14示出了本发明提供的高效率、高信噪比嵌合体苯丙氨酸翻译系统在哺乳动物细胞中识别非天然氨基酸的效率。(A)图为该实验操作流程,以HEK 293T为阴性对照设置前向散射和侧向散射,野生型EGFP设置FITC的电压和门,野生型mCherry设置PE的电压和门。(B)图为进化前的嵌合体苯丙氨酸翻译系统(AzFRS-2/3C11)在哺乳动物细胞中识别4-叠氮-苯丙氨酸(AzF)的效率。(C)进化后的嵌合体苯丙氨酸翻译系统(12D4-AzFRS-2/3C11或者13E3-AzFRS-2/3C11)哺乳动物细胞中识别 4-叠氮-苯丙氨酸(AzF)的效率。
图15示出了本发明提供的高效率、高信噪比嵌合体苯丙氨酸翻译系统(12D4-AzFRS-2/2*3C11) 在不同蛋白的随机位点引入非天然氨基酸的效率接近于野生型蛋白的表达水平,具体的蛋白有FLUC、 ADK、TyrRS、UBE2K、Neo2/15、PHD、GID4等蛋白。
具体实施方式
以下结合具体实施例对本发明作进一步详细说明,本发明所列举的具体实施例只作为本发明的范例,本发明并不限制于下文所描述的具体实施例。对于本领域技术人员而言,任何对下文所述的实施例进行的等同修改和替代也都在本发明的范畴之中。因此,在不脱离本发明的精神和范围下所作的均等变换和修改,都应涵盖在本发明的范围内。
本发明实施例中所使用的试验材料、试验试剂和仪器均可市购获得。
本发明在具体实施例中构建载体过程中使用的引物序列如表1所示:
表1:构建载体的引物序列
Figure BDA0003335942150000111
Figure BDA0003335942150000121
实施例1.嵌合体苯丙氨酸-tRNA的文库构建
(1)野生型苯丙氨酸-tRNA的核苷酸序列如SEQ ID NO:1所示;选定嵌合体苯丙氨酸-tRNA受体臂区域的第2到第7碱基对,以pNEG-chPheT-GFP190TAG(具体参见图1,核苷酸序列参见SEQ ID NO:45)为模板,以引物PheT-Lib-AU-F/R(即表1中所示SEQ ID NO:17和SEQ ID NO:18)饱和诱变产生大约1.7x107的突变文库,并将突变文库通过Gibson组装克隆到pNEG-CAT-112TAG-GFP-190TAG-tRNA 载体上。
(2)转化pBK-chPheRS-1到大肠杆菌DH10B中,制备电转化感受态细胞。
(3)将(1)中制备所得的突变文库电转化到(2)中的电转化感受态细胞中,添加1mMAzF 在37℃培养3h,随即将菌液涂布在含有50μg/ml卡那霉素、100μg/ml氨苄霉素、10μg/ml氯霉素、0.2% L-阿拉伯糖和1mM AzF的LB平板上,37℃培养12h。
(4)待长出单克隆后,将平板放置在30℃培养直至单克隆具有荧光信号。
本实施例所述的具体构建方法流程图参见图3。
实施例2.通过GFP荧光报告实验筛选嵌合体苯丙氨酸-tRNA突变体
(1)挑取实施例1中具有荧光信号的单克隆过夜培养。
(2)按照1:100的比例接种(1)中的菌液,37℃培养至OD600=0.6-0.8时,添加0.2%的阿拉伯糖诱导表达,同时取1ml菌液添加1mM AzF,在30℃表达20h。
(3)取750μl(2)中的菌液离心后,加入150μl的1×Bugbuster(Millipore,Lot:3492682)放置在25℃裂菌30min,随后离心,取100μl上清至96孔板中,同时取100μl(2)中的菌液,通过酶标仪测定GFP荧光信号强度和OD600,计算出突变体识别非天然氨基酸的效率。
(4)对明显提高嵌合体苯丙氨酸翻译系统效率的嵌合体苯丙氨酸-tRNA突变体测序获得具体突变体序列。
试验结果:通过筛选1800个单克隆,测序近200个单克隆,最后得到1C6、2F6、3C11、4E3、11H1 和16C2六个突变体(具体参见图4中的A)。上述6个突变体包含的核苷酸序列分别为SEQ ID NO:2~7。其中,3C11突变体提高嵌合体苯丙氨酸翻译系统的活性最高(具体参见图4中的B)
(5)分别将识别2-萘基-丙氨酸(NapA)、6-甲基-色氨酸(6MW)和4-乙酰基-苯丙氨酸(AcF) 的嵌合体苯丙氨酰-tRNA合成酶与嵌合体苯丙氨酸-tRNA-3C11(具体参见SEQ IDNO:4)或嵌合体苯丙氨酰-tRNA(具体参见SEQ ID NO:1)共转化,按照以上(1)-(4)操作流程测定3C11与不同的嵌合体苯丙氨酰-tRNA合成酶识别非天然氨基酸的效率,该效率用GFP荧光信号的强弱表示。
试验结果:以2-萘基-丙氨酸(NapA)、6-甲基-色氨酸(6MW)和4-乙酰基-苯丙氨酸(AcF)为例,GFP荧光信号报告实验表明嵌合体苯丙氨酸-tRNA-3C11显著性提高不同嵌合体苯丙氨酸翻译系统的琥珀抑制效率(具体参见图4中的C)。
实施例3.嵌合体苯丙氨酰-tRNA合成酶的催化结构域的定向进化
(1)以嵌合体苯丙氨酰-tRNA合成酶(chPheRS)的C端催化结构域序列(SEQ ID NO:8)为模板,进行易错PCR扩增,得到chPheRS的C端催化结构域突变文库,通过Gibson组装将突变文库克隆到pBK载体上。
(2)将pNEG-chPheT-CAT112TAG-GFP190TAG(具体图谱见图1,核苷酸序列为SEQ IDNO:47) 质粒转化到大肠杆菌DH10B中,制备电转化感受态细胞。
(3)将(1)中的嵌合体苯丙氨酰-tRNA合成酶的突变文库电转化到(2)中的电转化感受态细胞中,培养得到单克隆。
(4)通过GFP荧光信号报告实验(具体操作参照实施例2)鉴定明显提高嵌合体苯丙氨酸翻译系统效率的突变体并测序得到突变体序列(具体流程参见图5中的A)。
(5)以(4)中得到的最佳突变体再重复以上步骤,经过4轮筛选,共筛选超过130000个克隆,利用正负筛选策略筛选显著性提高嵌合体苯丙氨酸翻译系统的突变体,将这些突变体分别命名为2B11、 7D1、10F1、12D4和13E3。最终筛选得到两个明显提高嵌合体苯丙氨酸翻译系统效率的嵌合体苯丙氨酰-tRNA合成酶突变体,即12D4和13E3(具体参见图5中B)。其中,12D4-AzFRS和13E3-AzFRS的核苷酸序列分别如SEQ ID NO:63和SEQ ID NO:64所示。琥珀抑制效率实验表明12D4(K290L、Y294N、 R300S、F301S、S333C、S397T、L455P和M490L)和13E3(Y294N、G299D、R300C、P328T、S333C、 K335R、S397T、L411Q、T426S、L455P、C462S和M490L)显著提高嵌合体苯丙氨酸翻译系统的效率,分别提高了6.2倍和5.6倍。
(6)以人源线粒体苯丙氨酰-tRNA合成酶(PDB ID:3TUP)为例,利用Pymol分析12D4突变位点的位置,推测基于12D4的突变体并不参与识别非天然氨基酸的识别(具体参见图5中的C)。
(7)以4-叠氮-苯丙氨酸(AzF)为例,GFP荧光信号报告实验表明筛选所得的嵌合体苯丙氨酰 -tRNA合成酶12D4和13E3与嵌合体苯丙氨酸-tRNA-3C11组合后能显著提高嵌合体苯丙氨酸翻译系统的琥珀抑制效率,嵌合体苯丙氨酰-tRNA合成酶12D4/嵌合体苯丙氨酸-tRNA-3C11对提高嵌合体苯丙氨酸翻译系统的琥珀抑制效率达到12.3倍(具体参见图5中的D)。
实施例4.筛选特异性识别AzF和BTA的嵌合体苯丙氨酰-tRNA合成酶突变体
本实施例中嵌合体苯丙氨酰-tRNA合成酶AzFRS-2和嵌合体苯丙氨酰-tRNA合成酶-BTARS的基因序列分别如SEQ ID NO:9和SEQ ID NO:10所示。
(1)以人源线粒体苯丙氨酰-tRNA合成酶的结构为参考,选中嵌合体苯丙氨酰-tRNA合成酶的氨基酸结合位点:F464、T467和A507。
(2)以嵌合体苯丙氨酰-tRNA合成酶(T467G和A507G)为模板,以引物PBK-F464NNK-V-R/F (具体参见表1中的SEQ ID NO:19和SEQ ID NO:20)为模板饱和诱变将该三个位点突变成20种氨基酸构建嵌合体苯丙氨酰-tRNA合成酶突变体文库。通过Gibson组装将突变文库克隆到pBK载体。
(3)将pNEG-chPheT-Barnase-2*TAG(具体质粒图谱见图1,核苷酸序列为SEQ IDNO:48)转化到大肠杆菌DH10B,制备负筛选感受态细胞;将pNEG-3C11-CAT-112TAG-GFP190TAG转化到大肠杆菌DH10B,制备正筛选感受态细胞。
(4)将(2)中的筛选文库转化到负筛选感受态细胞中,将菌液涂布在含有50μg/ml卡那霉素,100 μg/ml氨苄霉素和0.2%L-阿拉伯糖的LB平板上,放置在37℃培养。
(5)将(4)中的克隆收集抽提质粒,并将质粒转化到正筛选感受态细胞,并分别将菌液涂布在含有50μg/ml卡那霉素,100μg/ml氨苄霉素,10μg/ml氯霉素,0.2%L-阿拉伯糖和1mM的4-叠氮-苯丙氨酸(AzF)(或者3-苯并噻吩基-丙氨酸(BTA)的平板,放置在37℃培养。
(6)利用GFP荧光报告实验筛选特异性识别AzF或者BTA的嵌合体苯丙氨酰-tRNA合成酶突变体,最后鉴定得到识别AzF的嵌合体苯丙氨酰-tRNA合成酶含有F464I、T467G和A507G突变;识别BTA 的嵌合体苯丙氨酰-tRNA合成酶含有F464V、T467G和A507G突变体。
(7)利用GFP荧光报告实验测定嵌合体苯丙氨酸翻译系统在不同非天然氨基酸浓度条件下识别非天然氨基酸的效率。
试验结果:GFP荧光信号报告实验表明高信噪比的嵌合体苯丙氨酸-AzF系统识别不同浓度AzF 的琥珀抑制效率。从结果看出嵌合体苯丙氨酸AzFRS-2翻译系统的信噪比达到65.3倍(具体参见图9中的A)。GFP荧光信号报告实验表明高信噪比的嵌合体苯丙氨酸-BTA系统识别不同浓度BTA的琥珀抑制效率。从结果看出嵌合体苯丙氨酸BTA翻译系统的信噪比达到22.9倍(具体参见图9中的B)。
实施例5.构建两个拷贝的嵌合体苯丙氨酸-tRNA-3C11
(1)以pNEG-3C11-GFP190TAG载体为模板,以pNEG-tRNA-Ins-R/F(即表1中的SEQID NO: 29和SEQ ID NO:30)扩增lpp-3C11-terminator片段,以pNEG-tRNA-Vec-R/F(即表1中的SEQ ID NO: 31和SEQ ID NO:32)扩增载体,通过Gibson组装克隆获得pNEG-2*3C11-GFP190TAG载体。
(2)通过GFP荧光信号报告实验测定tRNA拷贝数对嵌合体苯丙氨酸翻译系统的效率影响。
试验结果:本实施例构建的两个拷贝的嵌合体苯丙氨酸-tRNA-3C11能显著提高嵌合体苯丙氨酸翻译系统的琥珀抑制效率。以识别4-叠氮-苯丙氨酸的AzFRS-2为例,当oxb20调控AzFRS-2时,嵌合体苯丙氨酸翻译系统的琥珀抑制效率达到内源氨酰-tRNA合成酶识别天然氨基酸的效率(具体参见图6)。
实施例6.搭建高效率、高信噪比的嵌合体苯丙氨酸翻译系统
(1)将实施例3中构建的12D4突变体的突变平行转移到不同的嵌合体苯丙氨酰-tRNA合成酶突变体中(即AzFRS-2、AcFRS、6MWRS、7MWRS、NapARS和BTARS)。
表2.嵌合体苯丙氨酸氨酰-tRNA合成酶突变表
Figure BDA0003335942150000161
(2)分别转化实施例5中所述pNEG-2*3C11-GFP190TAG载体和本实施例在(1)构建的pBK-12D4-AzFRS-2、pBK-12D4-AcFRS、pBK-12D4-6MWRS、pBK-12D4-7MWRS、pBK-12D4-NapARS 和pBK-12D4-BTARS)至大肠杆菌DH10B。
(3)GFP荧光报告实验测定不同嵌合体苯丙氨酸翻译系统分别识别非天然氨基酸的效率。
(4)按照蛋白表达纯化的流程纯化不同嵌合体苯丙氨酸翻译系统表达的GFP变体蛋白 (GFP-AcF、GFP-6MW、GFP-7MW、GFP-NapA和GFP-BTA)
(5)LC-MS方法鉴定GFP变体蛋白的分子量。以上蛋白变体预期分子量为27797,27808, 27808,27805和27812Da,实际测定的蛋白分子量为27798,27809,27809,27806和27811Da。
(6)以该实施例中的AzFRS-2为例,将pBK-12D4-AzFRS-2与pNEG-2*3C11-Fluc-D234TAG等(表 3中所示蛋白)共转化,表达组氨酸标签的蛋白,通过NTA-Ni(GE)纯化目标蛋白,通过考马斯亮蓝染色鉴定蛋白表达纯度和nanodrop(微量分光光度计和荧光分光光度计,赛默飞)测定蛋白表达量。
表3.嵌合体苯丙氨酸翻译系统表达蛋白的产量
Figure BDA0003335942150000171
实验结果:利用GFP荧光信号报告实验,探索基于12D4突变的嵌合体苯丙氨酸翻译系统识别不同非天然氨基酸的琥珀抑制效率,从GFP荧光信号报告实验可以看出进化后的嵌合体苯丙氨酸翻译系统识别非天然氨基酸的效率接近于内源氨酰-tRNA合成酶识别天然氨基酸的效率(具体参见图7中A)。另外,通过质谱鉴定高效率嵌合体苯丙氨酸翻译系统识别非天然氨基酸的保真度(具体参见图7中的B)。通过考马斯亮蓝染色实验表示进化后的嵌合体苯丙氨酸翻译系统在不同蛋白的随机位点引入非天然氨基酸的效率接近于野生型蛋白表达水平(具体参见图15和表3)。
实施例7.GFP荧光信号报告实验测定嵌合体苯丙氨酸翻译系统识别多个TAG的效率和保真度
本实施例中所述含有3个TAG的荧光报告基因的基因序列如SEQ ID NO:11所示。
(1)构建多个TAG的荧光报告基因,在GFP的N端串联ELP基因,以实施例5中构建的pNEG-2*3C11-GFP190TAG为模板,以引物pNEG-ELPGFP-F/R(即表1中的SEQ ID NO:33和SEQID NO:34)扩增该载体,通过
Figure BDA0003335942150000181
Site-Directed Mutagenesis Kit Protocol(NEB)构建pNEG-2*3C11-ELP-GFP-190TAG载体。同时以pNEG-2*3C11-GFP(即未发生突变的载体)模板,以引物pNEG-ELPGFP-F/R(即表1中的SEQ ID NO:33和SEQ ID NO:34)扩增该载体,通过
Figure BDA0003335942150000182
Site-Directed Mutagenesis Kit Protocol(NEB)构建pNEG-2*3C11-ELPGFP载体,该载体作为实验的阳性对照。
(2)构建含有3个TAG的荧光报告基因。以本实施例(1)中所述pNEG-2*3C11-ELP-GFP-190TAG 为模板,以ELP-P8-G14-TAG-F/R(即表1中的SEQ ID NO:35和SEQ ID NO:36)扩增载体,通过Gibson 组装构建pNEG-2*3C11-ELP-GFP-3*TAG。
(3)将(2)中所述pNEG-2*3C11-ELP-GFP-3*TAG和(1)中所述pNEG-2*3C11-ELPGFP分别与pBK-12D4-AzFRS-2共转化到C321.△A.exp(NCBI accession#number:CP006698.1)菌株。
(4)利用GFP荧光报告实验测定嵌合体苯丙氨酰-tRNA合成酶识别3个TAG的琥珀抑制效率,使用的非天然氨基酸是AzF。
(5)LC-MS鉴定ELP-GFP-3*AzF的分子量,ELP-GFP-3*AzF的预期分子量为27798Da,实际测定的分子量为27799Da。
试验结果:GFP荧光信号报告实验表明高效率嵌合体苯丙氨酸翻译系统识别多位点琥珀终止子的琥珀抑制效率,从结果看出嵌合体苯丙氨酸翻译系统识别3个琥珀终止子的琥珀抑制效率接近于内源氨酰tRNA合成酶识别天然氨基酸的效率(具体参见图8中的B)。
实施例8.流式细胞术分析高效率、高信噪比的嵌合体苯丙氨酸翻译系统在哺乳动物细胞中的效率
(1)转染细胞。按照标准的质粒瞬时转染流程转染细胞,实验组为共转表达嵌合体苯丙氨酸翻译系统的质粒pCDNA3.1-12D4-AzFRS-2-2*3C11(具体参见图1,核苷酸序列具体参见SEQ ID NO:49) 和荧光报告质粒pEGFP-mCherry-T2A-EGFP(具体参见图1,核苷酸序列具体参见SEQ ID NO:50)的细胞,对照组为单独传染pEGFP-Mcherry和pEGFP-GFP的细胞。
(2)细胞转染48h后吸掉培养基,加入1x PBS洗去残留的培养基。
(3)吸掉PBS溶液,加入胰酶消化细胞,加入1mL DMEM培养基重悬细胞,将细胞转移到1.5mL 离心管中。
(4)用293T细胞设置流式细胞仪的前向散射和侧向散射门,用表达mCherry的细胞设置PE通道的参数和门,用表达EGFP的细胞设置FITC通道的参数和门。
(5)测定实验组细胞,设置每个样品收集50000个细胞。使用软件FlowJo分析数据。
试验结果:流式细胞术实验结果显示12D4-AzFRS-2/3C11和13E3-AzFRS-2/3C11在哺乳动物细胞内进化后的嵌合体苯丙氨酸翻译系统识别非天然氨基酸(4-叠氮-苯丙氨酸(AzF))的效率显著性提高。(具体见图14)
实施例9.构建AzF依赖的大肠杆菌菌株
(1)选择大肠杆菌必需基因dnaN,在N端连接一段含有4个TAG密码子的序列,连接好的序列 dnaN-4TAGs见SEQ ID NO:12。
(2)将dnaN-4TAGs、AzFRS-2(SEQ ID NO:9)、2*3C11(SEQ ID No:4的两次重复)装载到载体pChira上,分别在tac、oxb20、lpp启动子控制下,构建质粒名称为 pChira-4*TAG-DnaN-AzFRS-2-2*chPheT,完整序列见SEQ ID NO:13。
(3)将pChira-4*TAG-dnaN-AzFRS-2*chPheT与pTKred共转化到大肠杆菌DH10B,挑取单克隆制备含有这个质粒的电转化感受态细胞。
(4)获取携带基因组dnaN基因上下游同源臂的卡那霉素基因片段,完整序列Upstream100bp-△dnaN::KanR-Dowmstream100bp见SEQ ID NO:14。以pKD4为模板,以引物FRT-DnaN-F0/R0(SEQ ID NO:23-24)、FRT-DnaN-R1/F1(SEQ ID NO:25-26)和FRT-DnaN-F2/R2 (SEQ ID NO:27-28)扩增含大约100bp同源臂的抗性片段。
(5)将携带基因组dnaN基因同源臂的抗性基因片段电转化到(3)中制备的电转化感受态细胞,并将菌液涂布在含有卡那霉素、氯霉素和AzF的平板上,放置在30℃培养。
(6)挑取单克隆在AzF条件下培养,用引物DnaN-Seq-F/R(SEQ ID NO:21-22)菌落PCR鉴定大杆菌菌株敲除dnaN基因。野生型DH10B基因组会扩增出一条大约1.3kb的条带,而成功敲除danN的菌株会扩增出一条大约1.6kb的条带即为:△dnaN::KanR。
(7)将(6)中鉴定成功的菌株分别涂布在含AzF和不含AzF的平板上培养。AzF依赖的菌株只在含有AzF的平板上生长。本实施例的构建流程图具体参见图10中的A。
实施例10.测定AzF依赖的大肠杆菌菌株的生长曲线
(1)将实施例9中鉴定得到的AzF依赖型的大肠杆菌菌株划线在含有30μg/ml氯霉素和1mM AzF的LB平板上,30℃培养。
(2)挑取单克隆到培养基中,吹散克隆,离心取上清,加入PBS洗大肠杆菌,洗三次。
(3)加入20μl PBS重悬菌液,分别取5μl菌液涂布在含有AzF和不含AzF的LB平板上,放置在 30℃培养48h。
(4)分析只在含有AzF平板生长的克隆保存于-80℃。
(5)取(3)中的菌液分别接种到含有AzF和不含AzF的液体LB培养基中,在37℃培养,每3h 分别取样,酶标仪测定菌株的OD600,最终使用GraphPad处理数据。
具体生长曲线参见图10中的C。
实施例11.测定AzF依赖的大肠杆菌菌株的逃逸率
(1)将实例9中鉴定得到的AzF依赖型的大肠杆菌菌株划线在含有30μg/ml氯霉素和1mM AzF 的平板上,30℃培养。
(2)挑取单克隆在含有1mM AzF的培养基在37℃培养。
(3)待菌液OD600=0.6-0.8时,离心收菌,并用PBS清洗三次。
(4)用500μl PBS重悬菌液,并将菌液涂布在含有30μg/ml氯霉素、50μg/ml卡那霉素的平板上,放置在37℃培养14天。
(5)统计平板上的克隆数,并计算逃逸率,AzF依赖型大肠杆菌的逃逸率=克隆数/总细胞数。
图10中的B示出了基于必需基因dnaN的AzF依赖型大肠杆菌的逃逸率。AzF依赖型大肠杆菌菌株分别含有2、3和4琥珀抑制子。图10中的D示出了基于必需基因pgsA、TyrS和adk的AzF依赖型大肠杆菌菌株的逃逸率,菌株含有3个琥珀抑制子。
实施例12.AzF依赖的大肠杆菌菌株应用于小鼠活体
(1)将AzF依赖型大肠杆菌菌株做成感受态细胞。
(2)将pGEX-trp-fLuc(核苷酸序列如SEQ ID NO:16所示)质粒转化到AzF依赖型大肠杆菌,并涂布在含有30μg/ml氯霉素、100μg/ml氨苄霉素、50μg/ml卡那霉素和1mM AzF的平板上,放置在 37℃过夜培养。
(3)挑取单克隆与2ml含有1mM AzF的培养基于37℃培养,待OD600约为0.8时,收集菌液,并用PBS洗四次。
(4)分别取20μl菌液接种到含有AzF和不含有AzF的培养基中,37℃培养18h。
(5)取100μl菌液于96孔板中,同时加入总浓度为200μM的荧光素,酶标仪测定生物发光强度。
(6)取(3)处理后的菌液(约为1×108cells/50μl)注射到小鼠的右腿,同时在小鼠的左腿注射DH10B菌液。同时尾静脉注射非天然氨基酸AzF。
(7)注射后24h成像。首先腹腔注射荧光素,等待10min后,使用活体成像仪检测化学发光强度。
试验结果:基于必需基因dnaN的含有3个琥珀终止子的AzF依赖型菌株在添加AzF和不添加AzF 条件下的生物发光强度(具体参见图11中的A)。活体成像检测小鼠体内AzF依赖型菌株在供给AzF和不供给AzF时生物发光强度,从结果看出在给小鼠供给AzF时,小鼠体内的AzF依赖型菌株显著生长(具体参见图11中的B)。统计学分析(B)中生物发光强度(具体参见图11中的C)。
实施例13.分析嵌合体苯丙氨酸翻译系统与Mj-TyrRS/tRNA系统以及Ma-PylRS/tRNA系统具备相互正交性
(1)重新分配密码子。分配嵌合体苯丙氨酸翻译系统的密码子为琥珀密码子(TAG),相应地突变chPheT-3C11的反密码子为CUA,相应地GFP的第190位突变为TAG,Mj-TyrRS/tRNA系统和 Ma-PylRS/tRNA系统的密码子为蛋白石密码子(TGA),相应地突变Mj-tRNATyr和Ma-tRNAPyl的反密码子为UCA,相应地GFP的第152位突变为TGA。
(2)GFP荧光报告实验测定嵌合体苯丙氨酸翻译系统与Mj-TyrRS/tRNA系统和嵌合体苯丙氨酸翻译系统与Ma-PylRS/tRNA系统的正交性。在测定嵌合体苯丙氨酸翻译系统与Mj-TyrRS/tRNA系统正交实验中分别设置三组实验组,分别添加AzF、3NT和同时添加AzF和3NT。在测定嵌合体苯丙氨酸翻译系统与Ma-PylRS/tRNA系统正交实验中分别设置三组实验组,分别添加AzF、BocK和同时添加AzF 和BocK。
(3)LC-MS检测(2)中的GFP蛋白样品,GFP-150-3NT-190-AzF的分子量理论上是27841Da, GFP-150-BocK-190-AzF的分子量理论上是27860Da。
实验结果:GFP荧光信号报告实验检测嵌合体苯丙氨酸翻译系统与Ma-PylRS/tRNA系统交互识别AzF和BocK的琥珀抑制效率和嵌合体苯丙氨酸翻译系统与Mj-TyrRS/tRNA系统交互识别AzF和3NT 的琥珀抑制效率(具体参见图12中的A和C)。质谱证明嵌合体苯丙氨酸翻译系统与Mj-TyrRS/tRNA系统以及Ma-PylRS/tRNA系统的交互正交性(具体参见图12中的B和D)。
实施例14.整合嵌合体苯丙氨酸翻译系统至大肠杆菌基因组
(1)选择嵌合体苯丙氨酸翻译系统敲入大肠杆菌基因组的位点,分别选择三个位点:Site1 (NC_000913:17231)、Site2(NC_000913:20629)和Site3(NC_000913:2048789)。
(2)以Site1为例。以DH10B为模板,以引物Site1-HA1-F/R和Site1-HA2-F/R(表1中的SEQ ID NO: 41-42)扩增基因组同源片段;以pChira-4*TAG-DnaN-12D4-AzFRS-2*chPheT为模板,用引物 Site1-eles-F/R(表1中的SEQ ID NO:37-38)和Site1-chT/RS-F/R(表1中的SEQ ID NO:39-40)扩增 12D4-AzFRS-2-2*3C11-CmR片段和载体。HA1-12D4-AzFRS-2-2*3C11-CmR-HA2的基因序列参见SEQ ID NO:15。
(3)利用Gibson组装方法将同源片段、12D4-AzFRS-2-2*3C11-CmR片段和载体构建成 pChira-HA1-12D4-AzFRS-2*chPheT-HA2。
(4)将pTKred共转化到大肠杆菌DH10B,挑取单克隆制备含有这个质粒的电转化感受态细胞。
(5)PCR扩增HA1-12D4-AzFRS-2-2*3C11-CmR-HA2基因片段。
(6)将HA1-12D4-AzFRS-2-2*3C11-CmR-HA2基因片段电转化到(4)中制备的电转化感受态细胞,并将菌液涂布在含有30μg/ml氯霉素的LB平板上,放置在30℃培养。
(7)挑取单克隆培养,菌落PCR鉴定基因组成功整合12D4-AzFRS-2-2*3C11-CmR基因片段的大肠杆菌菌株。
(8)将(7)中的菌株制备化学转化感受态,转化报告基因质粒pNEG-GFP190TAG。
(9)通过GFP荧光报告实验测定菌株的琥珀抑制效率。使用的非天然氨基酸为4-叠氮-苯丙氨酸 (AzF)。
(10)为了探索不同拷贝数的12D4-AzFRS-2*3C11对嵌合体苯丙氨酸翻译系统识别非天然氨基酸的效率,将(7)中的菌株重新转化pTKred质粒,并重新制备电化学感受态,获得Site2同源臂的 HA1-12D4-AzFRS-2-2*3C11-KanR-HA2,将该片段同时整合在大肠杆菌基因组的Site1和Site2位点。
试验结果:GFP荧光信号报告实验比较嵌合体苯丙氨酸翻译系统整合到大肠杆菌基因组 (chPheRS/T-G)和瞬时过表达嵌合体苯丙氨酸翻译系统(chPheRS/T-p)识别非天然氨基酸的效率,结果表明chPheRS/T-G识别非天然氨基酸的效率达到chPheRS/T-p的50%左右(具体参见图13中的A)。 GFP荧光信号报告实验比较嵌合体苯丙氨酸翻译系统整合到大肠杆菌基因组不同位点的琥珀抑制效率,实验结果表明在大肠杆菌基因组上同时整合双倍的嵌合体苯丙氨酸翻译系统时,该嵌合体苯丙氨酸翻译识别非天然氨基酸的效率达到野生型蛋白表达水平的90%(具体参见图13中的B)。
产业上的可利用性
本发明提供的引入非天然氨基酸的嵌合体苯丙氨酸翻译系统及其构建方法可以在工业上应用。
【参考文献】
[1]R.B.Cooley,J.L.Feldman,C.M.Driggers,T.A.Bundy,A.L.Stokes,P.A.Karplus,R.A.Mehl, Biochemistry-Us 2014,53,1916-1924.
[2]J.C.W.Willis,J.W.Chin,Nat Chem 2018,10,831-837。
序列表
<110> 浙江大学
<120> 一种引入非天然氨基酸的嵌合体苯丙氨酸翻译系统及其构建方法
<160> 64
<170> SIPOSequenceListing 1.0
<210> 1
<211> 72
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
gccgagatga tcatgtagat cgaacggact ctaaatccgt tcagccgggt tagattcccg 60
gtctcggcac ca 72
<210> 2
<211> 72
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
gtgaatgtga tcatgtagat cgaacggact ctaaatccgt tcagccgggt tagattcccg 60
gcgttcacac ca 72
<210> 3
<211> 72
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gtgaaagtga tcatgtagat cgaacggact ctaaatccgt tcagccgggt tagattcccg 60
gctttcacac ca 72
<210> 4
<211> 72
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
gtgagagtga tcatgtagat cgaacggact ctaaatccgt tcagccgggt tagattcccg 60
gctctcacac ca 72
<210> 5
<211> 72
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
gtatctgtga tcatgtagat cgaacggact ctaaatccgt tcagccgggt tagattcccg 60
gcagatacac ca 72
<210> 6
<211> 72
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
gtaaaagtga tcatgtagat cgaacggact ctaaatccgt tcagccgggt tagattcccg 60
gcttttacac ca 72
<210> 7
<211> 72
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
gtgtttgtga tcatgtagat cgaacggact ctaaatccgt tcagccgggt tagattcccg 60
gcaaacacac ca 72
<210> 8
<211> 990
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
caggcctggg gatcgaggcc tcctgcagca gagtgtgcca cccaaagagc tccaggcagt 60
gtggtggagc tgctgggcaa atcctaccct caggacgacc acagcaacct cacccggaag 120
gtcctcacca gagttggcag gaacctgcac aaccagcagc atcaccctct gtggctgatc 180
aaggagaggg tgaaggagca cttctacaag cagtatgtgg gccgctttgg gaccccgttg 240
ttctcggtct acgacaacct ttctccagtg gtcacgacct ggcagaactt tgacagcctg 300
ctcatcccag ctgatcaccc cagcaggaag aagggggaca actattacct gaatcggact 360
cacatgctga gagcgcacac gtctgcacac cagtgggact tgctgcacgc gggactggat 420
gccttcctgg tggtgggtga tgtctacagg cgtgaccaga tcgactccca gcactaccct 480
attttccacc agctggaggc cgtgcggctc ttctccaagc atgagttatt tgctggtata 540
aaggatggag aaagcctgca gctctttgaa caaagttctc gctctgcgca taaacaagag 600
acacacacca tggaggccgt gaagcttgta gagtttgatc ttaagcaaac gcttaccagg 660
ctcatggcac atctttttgg agatgagctg gagataagat gggtagactg ctacttccct 720
tttacacatc cttcctttga gatggagatc aactttcatg gagaatggct ggaagttctt 780
ggctgcgggg tgatggaaca acaactggtc aattcagctg gtgctcaaga ccgaatcggc 840
tgggcttttg gcctaggatt agaaaggcta gccatgatcc tctacgacat ccctgatatc 900
cgtctcttct ggtgtgagga cgagcgcttc ctgaagcagt tctgtgtatc caacattaat 960
cagaaggtga agtttcagcc tcttagcaaa 990
<210> 9
<211> 1668
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
atggataaga agccgctgga tgttctgatc tctgcgaccg gtctgtggat gtcccgtacc 60
ggcacgctgc acaagatcaa gcactatgag atttctcgtt ctaaaatcta catcgaaatg 120
gcgtgtggtg accatctggt tgtgaacaac tctcgttctt gtcgtcccgc acgtgcattc 180
cgttatcata aataccgtaa aacctgcaaa cgttgtcgtg tttctgacga agatatcaac 240
aacttcctga cccgttctac cgaaggcaaa acctctgtta aagttaaagt tgtttctgag 300
ccgaaagtga aaaaagcgat gccgaaatct gtttctcgtg cgccgaaacc gctggaaaat 360
ccggtttctg cgaaagcgtc taccgacacc tctcgttctg ttccgtctcc ggcgaaatct 420
accccgaact ctccggttcc gacctctgca agcgccccag ctctgactaa atcccagacg 480
gaccgtctgg aggtgctgct gaacccaaag gatgaaatct ctctgaacag cggcaagcct 540
ttccgtgagc tggaaagcga gctgctgtct cgtcgtaaaa aggatctgca acagatctac 600
gctgaggaac gcgagggtgg cggaagcggc ggcggtggcg gaagcggcgg cggtggcgga 660
agcggcggcg gtggacaggc ctggggatcg aggcctcctg cagcagagtg tgccacccaa 720
agagctccag gcagtgtggt ggagctgctg ggcaaatcct accctcagga cgaccacagc 780
aacctcaccc ggaaggtcct caccagagtt ggcaggaacc tgcacaacca gcagcatcac 840
cctctgtggc tgatcaagga gagggtgaag gagcacttct acaagcagta tgtgggccgc 900
tttgggaccc cgttgttctc ggtctacgac aacctttctc cagtggtcac gacctggcag 960
aactttgaca gcctgctcat cccagctgat caccccagca ggaagaaggg ggacaactat 1020
tacctgaatc ggactcacat gctgagatcg cacacgtctg cacaccagtg ggacttgctg 1080
cacgcgggac tggatgcctt cctggtggtg ggtgatgtct acaggcgtga ccagatcgac 1140
tcccagcact accctatttt ccaccagctg gaggccgtgc ggctcttctc caagcatgag 1200
ttatttgctg gtataaagga tggagaaagc ctgcagctct ttgaacaaag ttctcgctct 1260
gcgcataaac aagagacaca caccatggag gccgtgaagc ttgtagagtt tgatcttaag 1320
caaacgctta ccaggctcat ggcacatctt tttggagatg agctggagat aagatgggta 1380
gactgctaca ttccttttgg tcatccttct tttgagatgg agatcaactt tcatggagaa 1440
tggctggaag ttcttggctg cggggtgatg gaacaacaac tggtcaattc agctggtgct 1500
caagaccgaa tcggctgggg atttggccta ggattagaaa ggctagccat gatcctctac 1560
gacatccctg atatccgtct cttctggtgt gaggacgagc gcttcctgaa gcagttctgt 1620
gtatccaaca ttaatcagaa ggtgaagttt cagcctctta gcaaataa 1668
<210> 10
<211> 1668
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
atggataaga agccgctgga tgttctgatc tctgcgaccg gtctgtggat gtcccgtacc 60
ggcacgctgc acaagatcaa gcactatgag atttctcgtt ctaaaatcta catcgaaatg 120
gcgtgtggtg accatctggt tgtgaacaac tctcgttctt gtcgtcccgc acgtgcattc 180
cgttatcata aataccgtaa aacctgcaaa cgttgtcgtg tttctgacga agatatcaac 240
aacttcctga cccgttctac cgaaggcaaa acctctgtta aagttaaagt tgtttctgag 300
ccgaaagtga aaaaagcgat gccgaaatct gtttctcgtg cgccgaaacc gctggaaaat 360
ccggtttctg cgaaagcgtc taccgacacc tctcgttctg ttccgtctcc ggcgaaatct 420
accccgaact ctccggttcc gacctctgca agcgccccag ctctgactaa atcccagacg 480
gaccgtctgg aggtgctgct gaacccaaag gatgaaatct ctctgaacag cggcaagcct 540
ttccgtgagc tggaaagcga gctgctgtct cgtcgtaaaa aggatctgca acagatctac 600
gctgaggaac gcgagggtgg cggaagcggc ggcggtggcg gaagcggcgg cggtggcgga 660
agcggcggcg gtggacaggc ctggggatcg aggcctcctg cagcagagtg tgccacccaa 720
agagctccag gcagtgtggt ggagctgctg ggcaaatcct accctcagga cgaccacagc 780
aacctcaccc ggaaggtcct caccagagtt ggcaggaacc tgcacaacca gcagcatcac 840
cctctgtggc tgatcaagga gagggtgaag gagcacttct acaagcagta tgtgggccgc 900
tttgggaccc cgttgttctc ggtctacgac aacctttctc cagtggtcac gacctggcag 960
aactttgaca gcctgctcat cccagctgat caccccagca ggaagaaggg ggacaactat 1020
tacctgaatc ggactcacat gctgagagcg cacacgtctg cacaccagtg ggacttgctg 1080
cacgcgggac tggatgcctt cctggtggtg ggtgatgtct acaggcgtga ccagatcgac 1140
tcccagcact accctatttt ccaccagctg gaggccgtgc ggctcttctc caagcatgag 1200
ttatttgctg gtataaagga tggagaaagc ctgcagctct ttgaacaaag ttctcgctct 1260
gcgcataaac aagagacaca caccatggag gccgtgaagc ttgtagagtt tgatcttaag 1320
caaacgctta ccaggctcat ggcacatctt tttggagatg agctggagat aagatgggta 1380
gactgctacg ttccttttgg tcatccttct tttgagatgg agatcaactt tcatggagaa 1440
tggctggaag ttcttggctg cggggtgatg gaacaacaac tggtcaattc agctggtgct 1500
caagaccgaa tcggctgggg atttggccta ggattagaaa ggctagccat gatcctctac 1560
gacatccctg atatccgtct cttctggtgt gaggacgagc gcttcctgaa gcagttctgt 1620
gtatccaaca ttaatcagaa ggtgaagttt cagcctctta gcaaataa 1668
<210> 11
<211> 795
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
atgagcaaag gtccgggtgt ttagggtggt ggtgttccgt aggcaggtgt tccgggcggt 60
aaaggagaag aacttttcac tggagttgtc ccaattcttg ttgaattaga tggtgatgtt 120
aatgggcaca aattttctgt cagtggagag ggtgaaggtg atgcaacata cggaaaactt 180
acccttaaat ttatttgcac tactggaaaa ctacctgttc catggccaac acttgtcact 240
actttctctt atggtgttca atgcttttcc cgttatccgg atcacatgaa acggcatgac 300
tttttcaaga gtgccatgcc cgaaggttat gtacaggaac gcactatatc tttcaaagat 360
gacgggaact acaagacgcg tgctgaagtc aagtttgaag gtgataccct tgttaatcgt 420
atcgagttaa aaggtattga ttttaaagaa gatggaaaca ttctcggaca caaactcgag 480
tacaactata actcacacaa cgtatacatc acggcagaca aacaaaagaa tggaatcaaa 540
gctaacttca aaattcgcca caacattgaa gatggatccg ttcaactagc agaccattat 600
caacaaaata ctccaattgg ctagggccct gtccttttac cagacaacca ttacctgtcg 660
acacaatctg ccctttcgaa agatcccaac gaaaagcgtg accacatggt ccttcttgag 720
tttgtaactg ctgctgggat tacacatggc atggatgaac tctacaaagg gccccatcat 780
caccatcacc attga 795
<210> 12
<211> 1140
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
atgtaggttt agggttaggg ttagaaattt accgtagaac gtgagcattt attaaaaccg 60
ctacaacagg tgagcggtcc gttaggtggt cgtcctacgc taccgattct cggtaatctg 120
ctgttacagg ttgctgacgg tacgttgtcg ctgaccggta ctgatctcga gatggaaatg 180
gtggcacgtg ttgcgctggt tcagccacac gagccaggag cgacgaccgt tccggcgcgc 240
aaattctttg atatctgccg tggtctgcct gaaggcgcgg aaattgccgt gcagctggaa 300
ggtgaacgga tgctggtacg ctccgggcgt agccgttttt cgctgtctac cctgccagcg 360
gcggatttcc cgaacctcga tgactggcag agtgaagtcg aatttaccct gccgcaggca 420
acgatgaagc gtctgattga agcgacccag ttttctatgg cgcatcagga cgttcgctat 480
tacttaaatg gtatgctgtt tgaaaccgaa ggtgaagaac tgcgcaccgt ggcaaccgac 540
ggccaccgtc tggcggtctg ttcaatgcca attggtcaat ctttgccaag ccattcggtg 600
atcgtaccgc gtaaaggcgt gattgaactg atgcgtatgc tcgacggcgg cgacaatccg 660
ctgcgcgtac agattggcag caacaacatt cgcgcccacg ttggcgactt tatcttcacc 720
tccaaactgg tggatggtcg cttcccggat tatcgccgcg ttctgccgaa gaacccggac 780
aaacatctgg aagctggctg cgatctgctc aagcaggcgt ttgctcgcgc ggcgattctc 840
tctaacgaga aattccgcgg cgtacgtctt tatgtcagcg aaaaccagct gaaaatcacc 900
gccaacaacc cggaacagga agaagcggaa gagatcctcg acgttaccta tagcggtgcg 960
gagatggaaa tcggcttcaa cgtcagttat gtgctggatg ttctgaacgc gctgaaatgc 1020
gaaaacgtcc gcatgatgct gaccgattcg gtttccagcg tgcagattga agatgcggcc 1080
agccagagcg cggcttatgt tgtcatgcca atgagactgc atcatcacca tcaccattaa 1140
<210> 13
<211> 6788
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
gttggcactg atgagggtgt cagtgaagtg cttcatgtgg caggagaaaa aaggctgcac 60
cggtgcgtca gcagaatatg tgatacagga tatattccgc ttcctcgctc actgactcgc 120
tacgctcggt cgttcgactg cggcgagcgg aaatggctta cgaacggggc ggagatttcc 180
tggaagatgc caggaagata cttaacaggg aagtgagagg gccgcggcaa agccgttttt 240
ccataggctc cgcccccctg acaagcatca cgaaatctga cgctcaaatc agtggtggcg 300
aaacccgaca ggactataaa gataccaggc gtttccccct ggcggctccc tcgtgcgctc 360
tcctgttcct gcctttcggt ttaccggtgt cattccgctg ttatggccgc gtttgtctca 420
ttccacgcct gacactcagt tccgggtagg cagttcgctc caagctggac tgtatgcacg 480
aaccccccgt tcagtccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc 540
cggaaagaca tgcaaaagca ccactggcag cagccactgg taattgattt agaggagtta 600
gtcttgaagt catgcgccgg ttaaggctaa actgaaagga caagttttgg tgactgcgct 660
cctccaagcc agttacctcg gttcaaagag ttggtagctc agagaacctt cgaaaaaccg 720
ccctgcaagg cggttttttc gttttcagag caagagatta cgcgcagacc aaaacgatct 780
caagaagatc atcttattaa tcagataaaa tatttctaga tttcagtgca atttatctct 840
tcaaatgtag cacctgaagt cagctaacaa tgcgctcatc gtcatcctcg gcaccgtcac 900
cctggatgct gtaggcatag gcttggttat gccggtactg ccgggcttga caattaatca 960
tcggctcgta taatgcatac ccgttttttt gggctagaaa taattttgtt taactttaag 1020
aaggagatat acatatgtag gtttagggtt agggttagaa atttaccgta gaacgtgagc 1080
atttattaaa accgctacaa caggtgagcg gtccgttagg tggtcgtcct acgctaccga 1140
ttctcggtaa tctgctgtta caggttgctg acggtacgtt gtcgctgacc ggtactgatc 1200
tcgagatgga aatggtggca cgtgttgcgc tggttcagcc acacgagcca ggagcgacga 1260
ccgttccggc gcgcaaattc tttgatatct gccgtggtct gcctgaaggc gcggaaattg 1320
ccgtgcagct ggaaggtgaa cggatgctgg tacgctccgg gcgtagccgt ttttcgctgt 1380
ctaccctgcc agcggcggat ttcccgaacc tcgatgactg gcagagtgaa gtcgaattta 1440
ccctgccgca ggcaacgatg aagcgtctga ttgaagcgac ccagttttct atggcgcatc 1500
aggacgttcg ctattactta aatggtatgc tgtttgaaac cgaaggtgaa gaactgcgca 1560
ccgtggcaac cgacggccac cgtctggcgg tctgttcaat gccaattggt caatctttgc 1620
caagccattc ggtgatcgta ccgcgtaaag gcgtgattga actgatgcgt atgctcgacg 1680
gcggcgacaa tccgctgcgc gtacagattg gcagcaacaa cattcgcgcc cacgttggcg 1740
actttatctt cacctccaaa ctggtggatg gtcgcttccc ggattatcgc cgcgttctgc 1800
cgaagaaccc ggacaaacat ctggaagctg gctgcgatct gctcaagcag gcgtttgctc 1860
gcgcggcgat tctctctaac gagaaattcc gcggcgtacg tctttatgtc agcgaaaacc 1920
agctgaaaat caccgccaac aacccggaac aggaagaagc ggaagagatc ctcgacgtta 1980
cctatagcgg tgcggagatg gaaatcggct tcaacgtcag ttatgtgctg gatgttctga 2040
acgcgctgaa atgcgaaaac gtccgcatga tgctgaccga ttcggtttcc agcgtgcaga 2100
ttgaagatgc ggccagccag agcgcggctt atgttgtcat gccaatgaga ctgcatcatc 2160
accatcacca ttaagcatgc accattcctt gcggcggcgg tgctcaacgg cctcaaccta 2220
ctactgggct gcttcctaat gcaggagtcg cataagggag agcgtctggc gaaaggggga 2280
tgtgctgcaa ggcgattaag ttgggtaacg ccagggtttt cccagtcacg acgttgtaaa 2340
acgacggcca gtgccaagct taaaaaaaat ccttagcttt cgctaaggat ctgcagtggt 2400
gtgagagccg ggaatctaac ccggctgaac ggatttagag tccgttcgat ctacatgatc 2460
actctcacga attcagcgtt acaagtatta cacaaagttt tttatgttga gaatattttt 2520
ttgatgggac tagttaaaaa aaatccttag ctttcgctaa ggatctgcag tggtgtgaga 2580
gccgggaatc taacccggct gaacggattt agagtccgtt cgatctacat gatcactctc 2640
acgaattcag cgttacaagt attacacaaa gttttttatg ttgagaatat ttttttgatg 2700
gggcgccact tatttttgat cgttcgctca aagaagcggc gccagggttg tttttctttt 2760
caccagtgag acgggcaaca gaacgccatg agcggcctca tttcttattc tgagttacaa 2820
cagtccgcac cgctgccggt agctccttcc ggtgggcgcg gggcatgact atcgtcgccg 2880
cacttatgac tgtcttcttt atcatgcaac tcgtaggaca ggtgccggca gcgcccaaca 2940
gtcccccggc cacggggcct gccaccatac ccacgccgaa acaagcgccc tgcaccatta 3000
tgttccggat ctgcatcgca ggatgctgct ggctaccctg tggaacacct acatctgtat 3060
taacgaagcg ctaaccgttt ttatcatgct ctgggaggca gaataaatgg ctgagttgaa 3120
ggatcctcgg gttgtcagcc tgtcccgctt ataaaagctg ttgtgaccgc ttgctctagc 3180
cagctatcga gttgtgaacc gatccatcta gcaattggtc tcgatctagc gataggcttc 3240
gatctagcta tgtagaaacg ccgtgtgctc gatcgcttga taaggtccac gtagctgcta 3300
taattgcttc aacagaacat attgactatc cggtattacc cggccgccgt tatacgttgt 3360
ttacgctttg aggaatccca tatggataag aagccgctgg atgttctgat ctctgcgacc 3420
ggtctgtgga tgtcccgtac cggcacgctg cacaagatca agcactatga gatttctcgt 3480
tctaaaatct acatcgaaat ggcgtgtggt gaccatctgg ttgtgaacaa ctctcgttct 3540
tgtcgtcccg cacgtgcatt ccgttatcat aaataccgta aaacctgcaa acgttgtcgt 3600
gtttctgacg aagatatcaa caacttcctg acccgttcta ccgaaggcaa aacctctgtt 3660
aaagttaaag ttgtttctga gccgaaagtg aaaaaagcga tgccgaaatc tgtttctcgt 3720
gcgccgaaac cgctggaaaa tccggtttct gcgaaagcgt ctaccgacac ctctcgttct 3780
gttccgtctc cggcgaaatc taccccgaac tctccggttc cgacctctgc aagcgcccca 3840
gctctgacta aatcccagac ggaccgtctg gaggtgctgc tgaacccaaa ggatgaaatc 3900
tctctgaaca gcggcaagcc tttccgtgag ctggaaagcg agctgctgtc tcgtcgtaaa 3960
aaggatctgc aacagatcta cgctgaggaa cgcgagggtg gcggaagcgg cggcggaagc 4020
ggtggcggaa gtggtggcgg aagcggcggc ggaagccagg cctggggatc gaggcctcct 4080
gcagcagagt gtgccaccca aagagctcca ggcagtgtgg tggagctgct gggcaaatcc 4140
taccctcagg acgaccacag caacctcacc cggaaggtcc tcaccagagt tggcaggaac 4200
ctgcacaacc agcagcatca ccctctgtgg ctgatcaagg agagggtgaa ggagcacttc 4260
tacaagcagt atgtgggccg ctttgggacc ccgttgttct cggtctacga caacctttct 4320
ccagtggtca cgacctggca gaactttgac agcctgctca tcccagctga tcaccccagc 4380
aggaagaagg gggacaacta ttacctgaat cggactcaca tgctgagatc gcacacgtct 4440
gcacaccagt gggacttgct gcacgcggga ctggatgcct tcctggtggt gggtgatgtc 4500
tacaggcgtg accagatcga ctcccagcac taccctattt tccaccagct ggaggccgtg 4560
cggctcttct ccaagcatga gttatttgct ggtataaagg atggagaaag cctgcagctc 4620
tttgaacaaa gttctcgctc tgcgcataaa caagagacac acaccatgga ggccgtgaag 4680
cttgtagagt ttgatcttaa gcaaacgctt accaggctca tggcacatct ttttggagat 4740
gagctggaga taagatgggt agactgctac attccttttg gtcatccttc gtttgagatg 4800
gagatcaact ttcatggaga atggctggaa gttcttggct gcggggtgat ggaacaacaa 4860
ctggtcaatt cagctggtgc tcaagaccga atcggctggg gatttggcct aggattagaa 4920
aggctagcca tgatcctcta cgacatccct gatatccgtc tcttctggtg tgaggacgag 4980
cgcttcctga agcagttctg tgtatccaac attaatcaga aggtgaagtt tcagcctctt 5040
agcaaataac tgcagtttca aacgctaaat tgcctgatgc gctacgctta tcaggcctac 5100
atgatctctg caatatattg agtttgcgtg cttttgtagg ccggataagg cgttcacgcc 5160
gcatccggca agaaacagca aacaatccaa aacgccgcgt tcagcggcgt tttttctgct 5220
tttcttcgcg aattaattcc gcttcgcaca tgtgagcaaa aggccagcaa aaggccagat 5280
catatcgtca attattacct ccacggggag agcctgagca aactggcctc aggcatttga 5340
gaagcacacg gtcacactgc ttccggtagt caataaaccg gtaaaccagc aatagacata 5400
agcggctatt taacgaccct gccctgaacc gacgaccggg tcgaatttgc tttcgaattt 5460
ctgccattca tccgcttatt atcacttatt caggcgtagc aaccaggcgt ttaagggcac 5520
caataactgc cttaaaaaaa ttacgccccg ccctgccact catcgcagta ctgttgtaat 5580
tcattaagca ttctgccgac atggaagcca tcacaaacgg catgatgaac ctgaatcgcg 5640
aatttgcttt cgaatttctg ccattcatcc gcttattatc acttattcag gcgtagcaac 5700
caggcgttta agggcaccaa taactgcctt aaaaaaatta cgccccgccc tgccactcat 5760
cgcagtactg ttgtaattca ttaagcattc tgccgacatg gaagccatca caaacggcat 5820
gatgaacctg aatcgccagc ggcatcagca ccttgtcgcc ttgcgtataa tatttgccca 5880
tggtgaaaac gggggcgaag aagttgtcca tattggccac gtttaaatca aaactggtga 5940
aactcaccca gggattggct gagacgaaaa acatattctc aataaaccct ttagggaaat 6000
aggccaggtt ttcaccgtaa cacgccacat cttgcgaata tatgtgtaga aactgccgga 6060
aatcgtcgtg gtattcactc cagagcgatg aaaacgtttc agtttgctca tggaaaacgg 6120
tgtaacaagg gtgaacacta tcccatatca ccagctcacc gtctttcatt gccatacgga 6180
attccggatg agcattcatc aggcgggcaa gaatgtgaat aaaggccgga taaaacttgt 6240
gcttattttt ctttacggtc tttaaaaagg ccgtaatatc cagctgaacg gtctggttat 6300
aggtacattg agcaactgac tgaaatgcct caaaatgttc tttacgatgc cattgggata 6360
tatcaacggt ggtatatcca gtgatttttt tctccatttt agcttcctta gctcctgaaa 6420
atctcgataa ctcaaaaaat acgcccggta gtgatcttat ttcattatgg tgaaagttgg 6480
aacctcttac gtgccgatca acgtctcatt ttcgccaaaa gttggcccag ggcttcccgg 6540
tatcaacagg gacaccagga tttatttatt ctgcgaagtg atcttccgtc acaggtattt 6600
attcggcgca aagtgcgtcg ggtgatgctg ccaacttact gatttagtgt atgatggtgt 6660
ttttgaggtg ctccagtggc ttctgtttct atcagctgtc cctcctgttc agctactgac 6720
ggggtggtgc gtaacggcaa aagcaccgcc ggacatcagc gctagcggag tgtatactgg 6780
cttactat 6788
<210> 14
<211> 1627
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
gtgcttcatg cctgccgtaa gatcgagcag ttgcgtgaag agagccacga tatcaaagaa 60
gatttttcaa atttaatcag aacattgtca tcgtaaacct gaagttccta tactttctag 120
agaataggaa cttcggaata ggaacttcaa gatcccctca cgctgccgca agcactcagg 180
gcgcaagggc tgctaaagga agcggaacac gtagaaagcc agtccgcaga aacggtgctg 240
accccggatg aatgtcagct actgggctat ctggacaagg gaaaacgcaa gcgcaaagag 300
aaagcaggta gcttgcagtg ggcttacatg gcgatagcta gactgggcgg ttttatggac 360
agcaagcgaa ccggaattgc cagctggggc gccctctggt aaggttggga agccctgcaa 420
agtaaactgg atggctttct tgccgccaag gatctgatgg cgcaggggat caagatctga 480
tcaagagaca ggatgaggat cgtttcgcat gattgaacaa gatggattgc acgcaggttc 540
tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga caatcggctg 600
ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac 660
cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat cgtggctggc 720
cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg gaagggactg 780
gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg ctcctgccga 840
gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc cggctacctg 900
cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga tggaagccgg 960
tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt 1020
cgccaggctc aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc 1080
ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg actgtggccg 1140
gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata ttgctgaaga 1200
gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg ctcccgattc 1260
gcagcgcatc gccttctatc gccttcttga cgagttcttc tgagcgggac tctggggttc 1320
gaaatgaccg accaagcgac gcccaacctg ccatcacgag atttcgattc caccgccgcc 1380
ttctatgaaa ggttgggctt cggaatcgtt ttccgggacg ccggctggat gatcctccag 1440
cgcggggatc tcatgctgga gttcttcgcc caccccagct tcaaaagcgc tctgaagttc 1500
ctatactttc tagagaatag gaacttctgt ccctcacccg cttgttgatc cgcgatttcc 1560
gcaacattga aaccgcggat ctcgccttat ctcccggctt taactttctg gtaggtgcca 1620
acggcag 1627
<210> 15
<211> 4826
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
agtaagaggc actctacatg tgttcagcat ataggaggcc tcgggttgat ggtaaaatat 60
cactcggggc ttttctctat ctgccgttca gctaatgcct gagacagaca gcctcaagca 120
cccgccgcta ttatatcgct ctctttaacc cattttgttt tatcgattct aatcctgaag 180
acgcctcgca tttttgtggc gtaatttttt aatgatttaa ttatttaact ttaatttatc 240
tcttcatcgc aattattgac gacaagctgg attatttttg aaatattggc ctaacaagca 300
ttttcccagt cacgacgttg taaaacgacg gccagtgcca agcttaaaaa aaatccttag 360
ctttcgctaa ggatctgcag tggtgtgaga gccgggaatc taacccggct gaacggattt 420
agagtccgtt cgatctacat gatcactctc acgaattcag cgttacaagt attacacaaa 480
gttttttatg ttgagaatat ttttttgatg ggactagtta aaaaaaatcc ttagctttcg 540
ctaaggatct gcagtggtgt gagagccggg aatctaaccc ggctgaacgg atttagagtc 600
cgttcgatct acatgatcac tctcacgaat tcagcgttac aagtattaca caaagttttt 660
tatgttgaga atattttttt gatggggcgc cacttatttt tgatcgttcg ctcaaagaag 720
cggcgccagg gttgtttttc ttttcaccag tgagacgggc aacagaacgc catgagcggc 780
ctcatttctt attctgagtt acaacagtcc gcaccgctgc cggtagctcc ttccggtggg 840
cgcggggcat gactatcgtc gccgcactta tgactgtctt ctttatcatg caactcgtag 900
gacaggtgcc ggcagcgccc aacagtcccc cggccacggg gcctgccacc atacccacgc 960
cgaaacaagc gccctgcacc attatgttcc ggatctgcat cgcaggatgc tgctggctac 1020
cctgtggaac acctacatct gtattaacga agcgctaacc gtttttatca tgctctggga 1080
ggcagaataa atggctgagt tgaaggatcc tcgggttgtc agcctgtccc gcttataaaa 1140
gctgttgtga ccgcttgctc tagccagcta tcgagttgtg aaccgatcca tctagcaatt 1200
ggtctcgatc tagcgatagg cttcgatcta gctatgtaga aacgccgtgt gctcgatcgc 1260
ttgataaggt ccacgtagct gctataattg cttcaacaga acatattgac tatccggtat 1320
tacccggccg ccgttatacg ttgtttacgc tttgaggaat cccatatgga taagaagccg 1380
ctggatgttc tgatctctgc gaccggtctg tggatgtccc gtaccggcac gctgcacaag 1440
atcaagcact atgagatttc tcgttctaaa atctacatcg aaatggcgtg tggtgaccat 1500
ctggttgtga acaactctcg ttcttgtcgt cccgcacgtg cattccgtta tcataaatac 1560
cgtaaaacct gcaaacgttg tcgtgtttct gacgaagata tcaacaactt cctgacccgt 1620
tctaccgaag gcaaaacctc tgttaaagtt aaagttgttt ctgagccgaa agtgaaaaaa 1680
gcgatgccga aatctgtttc tcgtgcgccg aaaccgctgg aaaatccggt ttctgcgaaa 1740
gcgtctaccg acacctctcg ttctgttccg tctccggcga aatctacccc gaactctccg 1800
gttccgacct ctgcaagcgc cccagctctg actaaatccc agacggaccg tctggaggtg 1860
ctgctgaacc caaaggatga aatctctctg aacagcggca agcctttccg tgagctggaa 1920
agcgagctgc tgtctcgtcg taaaaaggat ctgcaacaga tctacgctga ggaacgcgag 1980
ggtggcggaa gcggcggcgg aagccaggcc tggggatcga ggcctcctgc agcagagtgt 2040
gccacccaaa gagctccagg cagtgtggtg gagctgctgg gcaaatccta ccctcaggac 2100
gaccacagca acctcacccg gaaggtcctc accagagttg gcaggaacct gcacaaccag 2160
cagcatcacc ctctgtggct gatcaaggag agggtgttgg agcacttcaa caagcagtat 2220
gtgggcagct ctgggacccc gttgttctcg gtctatgaca acctttcgcc agtggtcacg 2280
acctggcaga actttgacag cctgctcatc ccagctgatc acccctgcag gaagaagggg 2340
gacaactatt acctgaatcg gactcacatg ctgagatccc acacgtccgc acaccagtgg 2400
gacttgctgc acgcgggact ggatgccttc ctggtggtgg gtgatgtcta caggcgtgac 2460
cagatcgact cccagcacta ccctattttc caccagctgg aggccgtgcg gctcttcacc 2520
aagcatgagt tatttgctgg tataaaggat ggggaaagcc tgcagctctt tgaacaaagt 2580
tctcgctctg cgcataaaca agagacacac accatggagg ccgtgaagct tgttgagttt 2640
gatcttaagc aaacgcttac caggctcatg gcacatcttt ttggagatga gccggagata 2700
aggtgggtag actgctacat tccttttgga catccttcct ttgagatgga gatcaacttt 2760
catggagaat ggctggaagt tcttggctgc ggggtgttgg aacaacaact ggtcaattca 2820
gctggtgctc aagaccgaat cggctgggga tttggcctag ggttagaaag gctagccatg 2880
atcctctacg acatccctga tatccgtctc ttctggtgtg aggacgagcg cttcctgaag 2940
cagttctgtg tatccaacat taatcagaag gtgaagtttc agcctcttag caaataactg 3000
cagtttcaaa cgctaaattg cctgatgcgc tacgcttatc aggcctacat gatctctgca 3060
atatattgag tttgcgtgct tttgtaggcc ggataaggcg ttcacgccgc atccggcaag 3120
aaacagcaaa caatccaaaa cgccgcgttc agcggcgttt tttctgcttt tcttcgcgaa 3180
ttaattccgc ttcgcacatg tgagcaaaag gccagcaaaa ggccagatca tatcgtcaat 3240
tattacctcc acggggagag cctgagcaaa ctggcctcag gcatttgaga agcacacggt 3300
cacactgctt ccggtagtca ataaaccggt aaaccagcaa tagacataag cggctattta 3360
acgaccctgc cctgaaccga cgaccgggtc gaatttgctt tcgaatttct gccattcatc 3420
cgcttattat cacttattca ggcgtagcaa ccaggcgttt aagggcacca ataactgcct 3480
taaaaaaatt acgccccgcc ctgccactca tcgcagtact gttgtaattc attaagcatt 3540
ctgccgacat ggaagccatc acaaacggca tgatgaacct gaatcgcgaa tttgctttcg 3600
aatttctgcc attcatccgc ttattatcac ttattcaggc gtagcaacca ggcgtttaag 3660
ggcaccaata actgccttaa aaaaattacg ccccgccctg ccactcatcg cagtactgtt 3720
gtaattcatt aagcattctg ccgacatgga agccatcaca aacggcatga tgaacctgaa 3780
tcgccagcgg catcagcacc ttgtcgcctt gcgtataata tttgcccatg gtgaaaacgg 3840
gggcgaagaa gttgtccata ttggccacgt ttaaatcaaa actggtgaaa ctcacccagg 3900
gattggctga gacgaaaaac atattctcaa taaacccttt agggaaatag gccaggtttt 3960
caccgtaaca cgccacatct tgcgaatata tgtgtagaaa ctgccggaaa tcgtcgtggt 4020
attcactcca gagcgatgaa aacgtttcag tttgctcatg gaaaacggtg taacaagggt 4080
gaacactatc ccatatcacc agctcaccgt ctttcattgc catacggaat tccggatgag 4140
cattcatcag gcgggcaaga atgtgaataa aggccggata aaacttgtgc ttatttttct 4200
ttacggtctt taaaaaggcc gtaatatcca gctgaacggt ctggttatag gtacattgag 4260
caactgactg aaatgcctca aaatgttctt tacgatgcca ttgggatata tcaacggtgg 4320
tatatccagt gatttttttc tccattttag cttccttagc tcctgaaaat ctcgataact 4380
caaaaaatac gcccggtagt gatcttattt cattatggtg aaagttggaa cctcttacgt 4440
gccgatcaac gtctcatttt cgccaaaagt tggcccaggg cttcccggta tcaacaggga 4500
caccaggatt tatttattct gcgaagtcgc cgactgacaa caaattaatt attacttttc 4560
ctaattaatc cctcaggaat cctcacctta agctatgatt atctaggctt agggtcactc 4620
gtgagcgctt acagccgtca aaaacgcatc tcaccgctga tggcgcaaat tcttcaatag 4680
ctcgtaaaaa acgaattatt cctacactat aatctgattt taacgatgat tcgtgcgggg 4740
taaaatagta aaaacgatct attcacctga aagagaaata aaaagtgaaa catctgcatc 4800
gattctttag cagtgatgcc tcggga 4826
<210> 16
<211> 3984
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
gatggaggcg gataaagttg caggaccact tctgcgctcg gcccttccgg ctggctggtt 60
tattgctgat aaatctggag ccggtgagcg tgggtctcgc ggtatcattg cagcactggg 120
gccagatggt aagccctccc gtatcgtagt tatctacacg acggggagtc aggcaactat 180
ggatgaacga aatagacaga tcgctgagat aggtgcctca ctgattaagc attggtaact 240
gtcagaccaa gtttactcat atatacttta gattgattta aaacttcatt tttaatttaa 300
aaggatctag gtgaagatcc tttttgataa tctcatgacc aaaatccctt aacgtgagtt 360
ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt gagatccttt 420
ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg 480
tttgccggat caagagctac caactctttt tccgaaggta actggcttca gcagagcgca 540
gataccaaat actgtccttc tagtgtagcc gtagttaggc caccacttca agaactctgt 600
agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg ccagtggcga 660
taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg cgcagcggtc 720
gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct acaccgaact 780
gagataccta cagcgtgagc tatgagaaag cgccacgctt cccgaaggga gaaaggcgga 840
caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc ttccaggggg 900
aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt 960
tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg cggccttttt 1020
acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt tatcccctga 1080
ttctgtggat aaccgtatta ccgcctttga gtgagctgat accgctcgcc gcagccgaac 1140
gaccgagcgc agcgagtcag tgagcgagga agcggaagag cgcctgatgc ggaacttttg 1200
ctgagttgaa ggatcctcgg gctgttgaca attaatcatc gaactagttt aatgtgtgga 1260
agcggtcgct ttcataagga ggtcgcaaat ggaagatgcc aaaaacatta agaagggccc 1320
agcgccattc tacccactcg aagacgggac cgccggcgag cagctgcaca aagccatgaa 1380
gcgctacgcc ctggtgcccg gcaccatcgc ctttaccgac gcacatatcg aggtggacat 1440
tacctacgcc gagtacttcg agatgagcgt tcggctggca gaagctatga agcgctatgg 1500
gctgaataca aaccatcgga tcgtggtgtg cagcgagaat agcttgcagt tcttcatgcc 1560
cgtgttgggt gccctgttca tcggtgtggc tgtggcccca gctaacgaca tctacaacga 1620
gcgcgagctg ctgaacagca tgggcatcag ccagcccacc gtcgtattcg tgagcaagaa 1680
agggctgcaa aagatcctca acgtgcaaaa gaagctaccg atcatacaaa agatcatcat 1740
catggatagc aagaccgact accagggctt ccaaagcatg tacaccttcg tgacttccca 1800
tttgccaccc ggcttcaacg agtacgactt cgtgcccgag agcttcgacc gggacaaaac 1860
catcgccctg atcatgaaca gtagtggcag taccggattg cccaagggcg tagccctacc 1920
gcaccgcacc gcttgtgtcc gattcagtca tgcccgcgac cccatcttcg gcaaccagat 1980
catccccgac accgctatcc tcagcgtggt gccatttcac cacggcttcg gcatgttcac 2040
cacgctgggc tacttgatct gcggctttcg ggtcgtgctc atgtaccgct tcgaggagga 2100
gctattcttg cgcagcttgc aagactataa gattcaatct gccctgctgg tgcccacact 2160
atttagcttc ttcgctaaga gcactctcat cgacaagtac gacctaagca acttgcacga 2220
gatcgccagc ggcggggcgc cgctcagcaa ggaggtaggt gaggccgtgg ccaaacgctt 2280
ccacctacca ggcatccgcc agggctacgg cctgacagaa acaaccagcg ccattctgat 2340
cacccccgaa ggggacgaca agcctggcgc agtaggcaag gtggtgccct tcttcgaggc 2400
taaggtggtg gacttggaca ccggtaagac actgggtgtg aaccagcgcg gcgagctgtg 2460
cgtccgtggc cccatgatca tgagcggcta cgttaacaac cccgaggcta caaacgctct 2520
catcgacaag gacggctggc tgcacagcgg cgacatcgcc tactgggacg aggacgagca 2580
cttcttcatc gtggaccggc tgaagagcct gatcaaatac aagggctacc aggtagcccc 2640
agccgaactg gagagcatcc tgctgcaaca ccccaacatc ttcgacgccg gggtcgccgg 2700
cctgcccgac gacgatgccg gcgagctgcc cgccgcagtc gtcgtgctgg aacacggtaa 2760
aaccatgacc gagaaggaga tcgtggacta tgtggccagc caggttacaa ccgccaagaa 2820
gctgcgcggt ggtgttgtgt tcgtggacga ggtgcctaaa ggactgaccg gcaagttgga 2880
cgcccgcaag atccgcgaga ttctcattaa ggccaagaag ggcggcaaga tcgccgtgca 2940
tcatcaccat caccattaac tgactgacga tctgcctcgc gcgtttcggt gatgacggtg 3000
aaaacctctg acacatgcag ctcccgagac ggtcacagct tgtctgtaag cggatgccgg 3060
gagcagacaa gcccgtcagg gcgcgtcagc gggtgttggc gggtgtcggg gcgcagccat 3120
gacccagtca cgtagcgata gcggagtgta taattcttga agacgaaagg gcctcgtgat 3180
acgcctattt ttataggtta atgtcatgat aataatggtt tcttagacgt caggtggcac 3240
ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac attcaaatat 3300
gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa aaaggaagag 3360
tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat tttgccttcc 3420
tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc agttgggtgc 3480
acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga gttttcgccc 3540
cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg cggtattatc 3600
ccgtgttgac gccgggcaag agcaactcgg tcgccgcata cactattctc agaatgactt 3660
ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag taagagaatt 3720
atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc tgacaacgat 3780
cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg taactcgcct 3840
tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg acaccacgat 3900
gcctgcagca atggcaacaa cgttgcgcaa actattaact ggcgaactac ttactctagc 3960
ttcccggcaa caattaatag actg 3984
<210> 17
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
ctttcgctaa ggatctgcag tggtgannnn nccgggaatc taacccggc 49
<210> 18
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
atacttgtaa cgctgaattc gannnnntga tcatgtagat cgaacggact c 51
<210> 19
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
aggatgacca aaaggmnngt agcagtctac ccatcttatc tccag 45
<210> 20
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
ccttttggtc atccttcctt tgagatgg 28
<210> 21
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
gtgcttcatg cctgccgtaa gat 23
<210> 22
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
gttggcacct accagaaagt taaagc 26
<210> 23
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
attgtcatcg taaacctgaa gttcctatac tttctagaga ataggaactt cggaatagg 59
<210> 24
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
caacaagcgg gtgagggaca gaagttccta ttctctagaa agtataggaa cttcagagc 59
<210> 25
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
gagccacgat atcaaagaag atttttcaaa tttaatcaga acattgtcat cgtaaacct 59
<210> 26
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
cgggagataa ggcgagatcc gcggtttcaa tgttgcggaa atcgcggatc aacaagcgg 59
<210> 27
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
cctgccgtaa gatcgagcag ttgcgtgaag agagccacga tatcaaagaa gatttttca 59
<210> 28
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
ctgccgttgg cacctaccag aaagttaaag ccgggagata aggcgagatc cg 52
<210> 29
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
taaaaaaaat ccttagcttt cgctaagga 29
<210> 30
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
actagtccca tcaaaaaaat attctcaaca taaaaaactt 40
<210> 31
<211> 58
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
atttttttga tgggactagt taaaaaaaat ccttagcttt cgctaaggat ctgcagtg 58
<210> 32
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
gcgaaagcta aggatttttt ttaagcttgg cactggccgt cgt 43
<210> 33
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
ggtgttccgg gtgcaggtgt tccgggcggt aaaggagaag aacttttcac t 51
<210> 34
<211> 59
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
accacctgga acacccggac ctttgctcat atgtatatct ccttcttaaa gttaaacaa 59
<210> 35
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
tacggaacac caccacccta aacacccgga cctttgctca tatgtatatc 50
<210> 36
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
gtttagggtg gtggtgttcc gtaggcaggt gttccgggcg gtaaa 45
<210> 37
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
tgatcttccg tcacaggtat ttattcg 27
<210> 38
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
ccctggcgtt acccaactta at 22
<210> 39
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
ttttcccagt cacgacgttg taa 23
<210> 40
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
cttcgcagaa taaataaatc ctggtgtc 28
<210> 41
<211> 42
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
taagttgggt aacgccaggg agtaagaggc actctacatg tg 42
<210> 42
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
caacgtcgtg actgggaaaa tgcttgttag gccaatattt caaa 44
<210> 43
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
gatttattta ttctgcgaag tcgccgactg acaacaaatt aatta 45
<210> 44
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
atacctgtga cggaagatca tcccgaggca tcactgctaa a 41
<210> 45
<211> 5783
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
aaaccaattg tccatattgc atcagacatt gccgtcactg cgtcttttac tggctcttct 60
cgctaaccaa accggtaacc ccgcttatta aaagcattct gtaacaaagc gggaccaaag 120
ccatgacaaa aacgcgtaac aaaagtgtct ataatcacgg cagaaaagtc cacattgatt 180
atttgcacgg cgtcacactt tgctatgcca tagcattttt atccataaga ttagcggatc 240
ctacctgacg ctttttatcg caactctcta ctgtttctcc atacccgttt ttttgggcta 300
gaaataattt tgtttaactt taagaaggag atatacatat gggtaaagga gaagaacttt 360
tcactggagt tgtcccaatt cttgttgaat tagatggtga tgttaatggg cacaaatttt 420
ctgtcagtgg agagggtgaa ggtgatgcaa catacggaaa acttaccctt aaatttattt 480
gcactactgg aaaactacct gttccatggc caacacttgt cactactttc tcttatggtg 540
ttcaatgctt ttcccgttat ccggatcaca tgaaacggca tgactttttc aagagtgcca 600
tgcccgaagg ttatgtacag gaacgcacta tatctttcaa agatgacggg aactacaaga 660
cgcgtgctga agtcaagttt gaaggtgata cccttgttaa tcgtatcgag ttaaaaggta 720
ttgattttaa agaagatgga aacattctcg gacacaaact cgagtacaac tataactcac 780
acaacgtata catcacggca gacaaacaaa agaatggaat caaagctaac ttcaaaattc 840
gccacaacat tgaagatgga tccgttcaac tagcagacca ttatcaacaa aatactccaa 900
ttggctaggg ccctgtcctt ttaccagaca accattacct gtcgacacaa tctgcccttt 960
cgaaagatcc caacgaaaag cgtgaccaca tggtccttct tgagtttgta actgctgctg 1020
ggattacaca tggcatggat gaactctaca aagggcccca tcatcaccat caccattgag 1080
catgcaccat tccttgcggc ggcggtgctc aacggcctca acctactact gggctgcttc 1140
ctaatgcagg agtcgcataa gggagagcgt ctggcgaaag ggggatgtgc tgcaaggcga 1200
ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac ggccagtgcc 1260
aagcttaaaa aaaatcctta gctttcgcta aggatctgca gtggtgccga aaccgggaat 1320
ctaacccggc tgaacggatt tagagtccgt tcgatctaca tgatcatctc ggcgaattca 1380
gcgttacaag tattacacaa agttttttat gttgagaata tttttttgat ggggcgccac 1440
ttatttttga tcgttcgctc aaagaagcgg cgccagggtt gtttttcttt tcaccagtga 1500
gacgggcaac agaacgccat gagcggcctc atttcttatt ctgagttaca acagtccgca 1560
ccgctgccgg tagctccttc cggtgggcgc ggggcatgac tatcgtcgcc gcacttatga 1620
ctgtcttctt tatcatgcaa ctcgtaggac aggtgccggc agcgcccaac agtcccccgg 1680
ccacggggcc tgccaccata cccacgccga aacaagcgcc ctgcaccatt atgttccgga 1740
tctgcatcgc aggatgctgc tggctaccct gtggaacacc tacatctgta ttaacgaagc 1800
gctaaccgtt tttatcatgc tctgggaggc agaataaatg atcatatcgt caattattac 1860
ctccacgggg agagcctgag caaactggcc tcaggcattt gagaagcaca cggtcacact 1920
gcttccggta gtcaataaac cggtaaacca gcaatagaca taagcggcta tttaacgacc 1980
ctgccctgaa ccgacgaccg ggtcgaattt gctttcgaat ttctgccatt catccgctta 2040
ttatcactta ttcaggcgta gcaaccaggc gtttaagggc accaataact gccttaaaaa 2100
aattacgccc cgccctgcca ctcatcgcag tactgttgta attcattaag cattctgccg 2160
acatggaagc catcacaaac ggcatgatga acctgaatcg ccagcggcat cagcaccttg 2220
tcgccttgcg tataatattt gcccatgggg aacgaaaact cacgttaagg gattttggtc 2280
atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa 2340
tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag 2400
gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg 2460
tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga 2520
gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag 2580
cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa 2640
gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctgcaggc 2700
atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca 2760
aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg 2820
atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat 2880
aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc 2940
aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaacacgg 3000
gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg 3060
gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt 3120
gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca 3180
ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata 3240
ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac 3300
atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgtacg 3360
tgccgatcaa cgtctcattt tcgccaaaag ttggcccagg gcttcccggt atcaacaggg 3420
acaccaggat ttatttattc tgcgaagtga tcttccgtca caggtattta ttcggcgcaa 3480
agtgcgtcgg gtgatgctgc caacttactg atttagtgta tgatggtgtt tttgaggtgc 3540
tccagtggct tctgtttcta tcagctgtcc ctcctgttca gctactgacg gggtggtgcg 3600
taacggcaaa agcaccgccg gacatcagcg ctagcggagt gtatactggc ttactatgtt 3660
ggcactgatg agggtgtcag tgaagtgctt catgtggcag gagaaaaaag gctgcaccgg 3720
tgcgtcagca gaatatgtga tacaggatat attccgcttc ctcgctcact gactcgctac 3780
gctcggtcgt tcgactgcgg cgagcggaaa tggcttacga acggggcgga gatttcctgg 3840
aagatgccag gaagatactt aacagggaag tgagagggcc gcggcaaagc cgtttttcca 3900
taggctccgc ccccctgaca agcatcacga aatctgacgc tcaaatcagt ggtggcgaaa 3960
cccgacagga ctataaagat accaggcgtt tccccctggc ggctccctcg tgcgctctcc 4020
tgttcctgcc tttcggttta ccggtgtcat tccgctgtta tggccgcgtt tgtctcattc 4080
cacgcctgac actcagttcc gggtaggcag ttcgctccaa gctggactgt atgcacgaac 4140
cccccgttca gtccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 4200
aaagacatgc aaaagcacca ctggcagcag ccactggtaa ttgatttaga ggagttagtc 4260
ttgaagtcat gcgccggtta aggctaaact gaaaggacaa gttttggtga ctgcgctcct 4320
ccaagccagt tacctcggtt caaagagttg gtagctcaga gaaccttcga aaaaccgccc 4380
tgcaaggcgg ttttttcgtt ttcagagcaa gagattacgc gcagaccaaa acgatctcaa 4440
gaagatcatc ttattaatca gataaaatat ttctagattt cagtgcaatt tatctcttca 4500
aatgtagcac ctgaagtcag ccccatacga tataagttgt aattctcatg tttgacagca 4560
ttatcatcga taagctttaa tgcggtagtt tatcacagtt aaattgctaa cgcagtcagg 4620
caccgtgtat gaaatctaac aatgcgctca tcgtcatcct cggcaccgtc accctggatg 4680
ctgtaggcat aggcttggtt atgccggtac tgccgggcct cttgcgggat ggccacgatg 4740
cgtccggcgt agaggatctg ctcatgtttg acagcttatc atcgatgcat aatgtgcctg 4800
tcaaatggac gaagcaggga ttctgcaaac cctatgctac tccgtcaagc cgtcaattgt 4860
ctgattcgtt accaattatg acaacttgac ggctacatca ttcacttttt cttcacaacc 4920
ggcacggaac tcgctcgggc tggccccggt gcatttttta aatacccgcg agaaatagag 4980
ttgatcgtca aaaccaacat tgcgaccgac ggtggcgata ggcatccggg tggtgctcaa 5040
aagcagcttc gcctggctga tacgttggtc ctcgcgccag cttaagacgc taatccctaa 5100
ctgctggcgg aaaagatgtg acagacgcga cggcgacaag caaacatgct gtgcgacgct 5160
ggcgatatca aaattgctgt ctgccaggtg atcgctgatg tactgacaag cctcgcgtac 5220
ccgattatcc atcggtggat ggagcgactc gttaatcgct tccatgcgcc gcagtaacaa 5280
ttgctcaagc agatttatcg ccagcagctc cgaatagcgc ccttcccctt gcccggcgtt 5340
aatgatttgc ccaaacaggt cgctgaaatg cggctggtgc gcttcatccg ggcgaaagaa 5400
ccccgtattg gcaaatattg acggccagtt aagccattca tgccagtagg cgcgcggacg 5460
aaagtaaacc cactggtgat accattcgcg agcctccgga tgacgaccgt agtgatgaat 5520
ctctcctggc gggaacagca aaatatcacc cggtcggcaa acaaattctc gtccctgatt 5580
tttcaccacc ccctgaccgc gaatggtgag attgagaata taacctttca ttcccagcgg 5640
tcggtcgata aaaaaatcga gataaccgtt ggcctcaatc ggcgttaaac ccgccaccag 5700
atgggcatta aacgagtatc ccggcagcag gggatcattt tgcgcttcag ccatactttt 5760
catactcccg ccattcagag aag 5783
<210> 46
<211> 3129
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
tattgatgtt ggacgagtcg gaatcgcaga ccgataccag gatcttgcca tcctatggaa 60
ctgcctcggt gagttttctc cttcattaca gaaacggctt tttcaaaaat atggtattga 120
taatcctgat atgaataaat tgcagtttca tttgatgctc gatgagtttt tctaatcaga 180
attggttaat tggttgtaac actggcagag cattacgctg acttgacggg acggcggctt 240
tgttgaataa atcgaacttt tgctgagttg aaggatcctc gggttgtcag cctgtcccgc 300
ttataaaagc tgttgtgacc gcttgctcta gccagctatc gagttgtgaa ccgatccatc 360
tagcaattgg tctcgatcta gcgataggct tcgatctagc tatgtagaaa cgccgtgtgc 420
tcgatcgctt gataaggtcc acgtagctgc tataattgct tcaacagaac atattgacta 480
tccggtatta cccggccgcc gttatacgtt gtttacgctt tgaggaatcc catatggata 540
agaagccgct ggatgttctg atctctgcga ccggtctgtg gatgtcccgt accggcacgc 600
tgcacaagat caagcactat gagatttctc gttctaaaat ctacatcgaa atggcgtgtg 660
gtgaccatct ggttgtgaac aactctcgtt cttgtcgtcc cgcacgtgca ttccgttatc 720
ataaataccg taaaacctgc aaacgttgtc gtgtttctga cgaagatatc aacaacttcc 780
tgacccgttc taccgaaggc aaaacctctg ttaaagttaa agttgtttct gagccgaaag 840
tgaaaaaagc gatgccgaaa tctgtttctc gtgcgccgaa accgctggaa aatccggttt 900
ctgcgaaagc gtctaccgac acctctcgtt ctgttccgtc tccggcgaaa tctaccccga 960
actctccggt tccgacctct gcaagcgccc cagctctgac taaatcccag acggaccgtc 1020
tggaggtgct gctgaaccca aaggatgaaa tctctctgaa cagcggcaag cctttccgtg 1080
agctggaaag cgagctgctg tctcgtcgta aaaaggatct gcaacagatc tacgctgagg 1140
aacgcgaggg tggcggaagc ggcggccagg cctggggatc gaggcctcct gcagcagagt 1200
gtgccaccca aagagctcca ggcagtgtgg tggagctgct gggcaaatcc taccctcagg 1260
acgaccacag caacctcacc cggaaggtcc tcaccagagt tggcaggaac ctgcacaacc 1320
agcagcatca ccctctgtgg ctgatcaagg agagggtgaa ggagcacttc tacaagcagt 1380
atgtgggccg ctttgggacc ccgttgttct cggtctacga caacctttct ccagtggtca 1440
cgacctggca gaactttgac agcctgctca tcccagctga tcaccccagc aggaagaagg 1500
gggacaacta ttacctgaat cggactcaca tgctgagagc gcacacgtct gcacaccagt 1560
gggacttgct gcacgcggga ctggatgcct tcctggtggt gggtgatgtc tacaggcgtg 1620
accagatcga ctcccagcac taccctattt tccaccagct ggaggccgtg cggctcttct 1680
ccaagcatga gttatttgct ggtataaagg atggagaaag cctgcagctc tttgaacaaa 1740
gttctcgctc tgcgcataaa caagagacac acaccatgga ggccgtgaag cttgtagagt 1800
ttgatcttaa gcaaacgctt accaggctca tggcacatct ttttggagat gagctggaga 1860
taagatgggt agactgctac ttccctttta cacatccttc ctttgagatg gagatcaact 1920
ttcatggaga atggctggaa gttcttggct gcggggtgat ggaacaacaa ctggtcaatt 1980
cagctggtgc tcaagaccga atcggctggg cttttggcct aggattagaa aggctagcca 2040
tgatcctcta cgacatccct gatatccgtc tcttctggtg tgaggacgag cgcttcctga 2100
agcagttctg tgtatccaac attaatcaga aggtgaagtt tcagcctctt agcaaataac 2160
tgcagtttca aacgctaaat tgcctgatgc gctacgctta tcaggcctac atgatctctg 2220
caatatattg agtttgcgtg cttttgtagg ccggataagg cgttcacgcc gcatccggca 2280
agaaacagca aacaatccaa aacgccgcgt tcagcggcgt tttttctgct tttcttcgcg 2340
aattaattcc gcttcgcaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa 2400
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 2460
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 2520
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 2580
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 2640
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 2700
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 2760
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 2820
gttcttgaag tggtggccta actacggcta cactagaagg acagtatttg gtatctgcgc 2880
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 2940
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 3000
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 3060
acgttaaggg attttggtca tgaacaataa aactgtctgc ttacataaac agtaatacaa 3120
ggggtgtta 3129
<210> 47
<211> 6807
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
cagcggcatc agcaccttgt cgccttgcgt ataatatttg cccatgggga acgaaaactc 60
acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa 120
ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta 180
ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 240
tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag 300
tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag caataaacca 360
gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc 420
tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt 480
tgttgccatt gctgcaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag 540
ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt 600
tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat 660
ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt 720
gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc 780
ttgcccggcg tcaacacggg ataataccgc gccacatagc agaactttaa aagtgctcat 840
cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag 900
ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt 960
ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg 1020
gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta 1080
ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 1140
gcgcacattt ccccgtacgt gccgatcaac gtctcatttt cgccaaaagt tggcccaggg 1200
cttcccggta tcaacaggga caccaggatt tatttattct gcgaagtgat cttccgtcac 1260
aggtatttat tcggcgcaaa gtgcgtcggg tgatgctgcc aacttactga tttagtgtat 1320
gatggtgttt ttgaggtgct ccagtggctt ctgtttctat cagctgtccc tcctgttcag 1380
ctactgacgg ggtggtgcgt aacggcaaaa gcaccgccgg acatcagcgc tagcggagtg 1440
tatactggct tactatgttg gcactgatga gggtgtcagt gaagtgcttc atgtggcagg 1500
agaaaaaagg ctgcaccggt gcgtcagcag aatatgtgat acaggatata ttccgcttcc 1560
tcgctcactg actcgctacg ctcggtcgtt cgactgcggc gagcggaaat ggcttacgaa 1620
cggggcggag atttcctgga agatgccagg aagatactta acagggaagt gagagggccg 1680
cggcaaagcc gtttttccat aggctccgcc cccctgacaa gcatcacgaa atctgacgct 1740
caaatcagtg gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggcg 1800
gctccctcgt gcgctctcct gttcctgcct ttcggtttac cggtgtcatt ccgctgttat 1860
ggccgcgttt gtctcattcc acgcctgaca ctcagttccg ggtaggcagt tcgctccaag 1920
ctggactgta tgcacgaacc ccccgttcag tccgaccgct gcgccttatc cggtaactat 1980
cgtcttgagt ccaacccgga aagacatgca aaagcaccac tggcagcagc cactggtaat 2040
tgatttagag gagttagtct tgaagtcatg cgccggttaa ggctaaactg aaaggacaag 2100
ttttggtgac tgcgctcctc caagccagtt acctcggttc aaagagttgg tagctcagag 2160
aaccttcgaa aaaccgccct gcaaggcggt tttttcgttt tcagagcaag agattacgcg 2220
cagaccaaaa cgatctcaag aagatcatct tattaatcag ataaaatatt tctagatttc 2280
agtgcaattt atctcttcaa atgtagcacc tgaagtcagc cccatacgat ataagttgta 2340
attctcatgt ttgacagcat tatcatcgat aagctttaat gcggtagttt atcacagtta 2400
aattgctaac gcagtcaggc accgtgtatg aaatctaaca atgcgctcat cgtcatcctc 2460
ggcaccgtca ccctggatgc tgtaggcata ggcttggtta tgccggtact gccgggcctc 2520
ttgcgggatg gccacgatgc gtccggcgta gaggatctgc tcatgtttga cagcttatca 2580
tcgatgcata atgtgcctgt caaatggacg aagcagggat tctgcaaacc ctatgctact 2640
ccgtcaagcc gtcaattgtc tgattcgtta ccgctgttga caattaatca tcgaactagt 2700
ttaatgtgtg gaagcggtcg ctttcataag gaggtcgcaa atggagaaaa aaatcactgg 2760
atataccacc gttgatatat cccaatggca tcgtaaagaa cattttgagg catttcagtc 2820
agttgctcaa tgtacctata accagaccgt tcagctggat attacggcct ttttaaagac 2880
cgtaaagaaa aataagcaca agttttatcc ggcctttatt cacattcttg cccgcctgat 2940
gaatgctcat ccggagttcc gtatggcaat gaaagacggt gagctggtga tatgggatag 3000
tgttcaccct tgttacaccg ttttccatga gcaaactgaa acgttttcat cgctctggag 3060
tgaataccac gactagttcc ggcagtttct acacatatat tcgcaagatg tggcgtgtta 3120
cggtgaaaac ctggcctatt tccctaaagg gtttattgag aatatgtttt tcgtctcagc 3180
caatccctgg gtgagtttca ccagttttga tttaaacgtg gccaatatgg acaacttctt 3240
cgcccccgtt ttcactatgg gcaaatatta tacgcaaggc gacaaggtgc tgatgccgct 3300
ggcgattcag gttcatcatg ccgtctgtga tggcttccat gtcggcagaa tgcttaatga 3360
attacaacag tactgcgatg agtggcaggg cggggcgtaa gcatgcacca ttccttgcgg 3420
cggcggtgct caacggcctc aacctactac tgggctgctt cctaatgcag gagtcgcata 3480
agggagagcg tctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 3540
ggttttccca gtcacgacgt tgtaaaacga cggccagtgc caagcttaaa aaaaatcctt 3600
agctttcgct aaggatctgc agtggtgtga gagccgggaa tctaacccgg ctgaacggat 3660
ttagagtccg ttcgatctac atgatcactc tcacgaattc agcgttacaa gtattacaca 3720
aagtttttta tgttgagaat atttttttga tggggcgcca cttatttttg atcgttcgct 3780
caaagaagcg gcgccagggt tgtttttctt ttcaccagtg agacgggcaa cagaacgcca 3840
tgagcggcct catttcttat tctgagttac aacagtccgc accgctgccg gtagctcctt 3900
ccggtgggcg cggggcatga ctatcgtcgc cgcacttatg actgtcttct ttatcatgca 3960
actcgtagga caggtgccgg cagcgcccaa cagtcccccg gccacggggc ctgccaccat 4020
acccacgccg aaacaagcgc cctgcaccat tatgttccgg atctgcatcg caggatgctg 4080
ctggctaccc tgtggaacac ctacatctgt attaacgaag cgctaaccgt ttttatcatg 4140
ctctgggagg cagaataaat gatcatatcg acgatgcgtc cggcgtagag gatctgctca 4200
tgtttgacag cttatcatcg atgcataatg tgcctgtcaa atggacgaag cagggattct 4260
gcaaacccta tgctactccg tcaagccgtc aattgtctga ttcgttacca attatgacaa 4320
cttgacggct acatcattca ctttttcttc acaaccggca cggaactcgc tcgggctggc 4380
cccggtgcat tttttaaata cccgcgagaa atagagttga tcgtcaaaac caacattgcg 4440
accgacggtg gcgataggca tccgggtggt gctcaaaagc agcttcgcct ggctgatacg 4500
ttggtcctcg cgccagctta agacgctaat ccctaactgc tggcggaaaa gatgtgacag 4560
acgcgacggc gacaagcaaa catgctgtgc gacgctggcg atatcaaaat tgctgtctgc 4620
caggtgatcg ctgatgtact gacaagcctc gcgtacccga ttatccatcg gtggatggag 4680
cgactcgtta atcgcttcca tgcgccgcag taacaattgc tcaagcagat ttatcgccag 4740
cagctccgaa tagcgccctt ccccttgccc ggcgttaatg atttgcccaa acaggtcgct 4800
gaaatgcggc tggtgcgctt catccgggcg aaagaacccc gtattggcaa atattgacgg 4860
ccagttaagc cattcatgcc agtaggcgcg cggacgaaag taaacccact ggtgatacca 4920
ttcgcgagcc tccggatgac gaccgtagtg atgaatctct cctggcggga acagcaaaat 4980
atcacccggt cggcaaacaa attctcgtcc ctgatttttc accaccccct gaccgcgaat 5040
ggtgagattg agaatataac ctttcattcc cagcggtcgg tcgataaaaa aatcgagata 5100
accgttggcc tcaatcggcg ttaaacccgc caccagatgg gcattaaacg agtatcccgg 5160
cagcagggga tcattttgcg cttcagccat acttttcata ctcccgccat tcagagaaga 5220
aaccaattgt ccatattgca tcagacattg ccgtcactgc gtcttttact ggctcttctc 5280
gctaaccaaa ccggtaaccc cgcttattaa aagcattctg taacaaagcg ggaccaaagc 5340
catgacaaaa acgcgtaaca aaagtgtcta taatcacggc agaaaagtcc acattgatta 5400
tttgcacggc gtcacacttt gctatgccat agcattttta tccataagat tagcggatcc 5460
tacctgacgc tttttatcgc aactctctac tgtttctcca tacccgtttt tttgggctag 5520
aaataatttt gtttaacttt aagaaggaga tatacatatg ggtaaaggag aagaactttt 5580
cactggagtt gtcccaattc ttgttgaatt agatggtgat gttaatgggc acaaattttc 5640
tgtcagtgga gagggtgaag gtgatgcaac atacggaaaa cttaccctta aatttatttg 5700
cactactgga aaactacctg ttccatggcc aacacttgtc actactttct cttatggtgt 5760
tcaatgcttt tcccgttatc cggatcacat gaaacggcat gactttttca agagtgccat 5820
gcccgaaggt tatgtacagg aacgcactat atctttcaaa gatgacggga actacaagac 5880
gcgtgctgaa gtcaagtttg aaggtgatac ccttgttaat cgtatcgagt taaaaggtat 5940
tgattttaaa gaagatggaa acattctcgg acacaaactc gagtacaact ataactcaca 6000
caacgtatac atcacggcag acaaacaaaa gaatggaatc aaagctaact tcaaaattcg 6060
ccacaacatt gaagatggat ccgttcaact agcagaccat tatcaacaaa atactccaat 6120
tggctagggc cctgtccttt taccagacaa ccattacctg tcgacacaat ctgccctttc 6180
gaaagatccc aacgaaaagc gtgaccacat ggtccttctt gagtttgtaa ctgctgctgg 6240
gattacacat ggcatggatg aactctacaa agggccccat catcaccatc accattgagc 6300
atgcaccatt ccttgcggcg gcggtgctca acggcctcaa cctactactg ggctgcttcc 6360
taatgcagga gtcgcataag ggagagcgtc tggcgaaagg gggatgtgct gcaaggcgat 6420
taagttgggt aacgccaggg ttttcccagt cacgatcaat tattacctcc acggggagag 6480
cctgagcaaa ctggcctcag gcatttgaga agcacacggt cacactgctt ccggtagtca 6540
ataaaccggt aaaccagcaa tagacataag cggctattta acgaccctgc cctgaaccga 6600
cgaccgggtc gaatttgctt tcgaatttct gccattcatc cgcttattat cacttattca 6660
ggcgtagcaa ccaggcgttt aagggcacca ataactgcct taaaaaaatt acgccccgcc 6720
ctgccactca tcgcagtact gttgtaattc attaagcatt ctgccgacat ggaagccatc 6780
acaaacggca tgatgaacct gaatcgc 6807
<210> 48
<211> 5379
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
aaaccaattg tccatattgc atcagacatt gccgtcactg cgtcttttac tggctcttct 60
cgctaaccaa accggtaacc ccgcttatta aaagcattct gtaacaaagc gggaccaaag 120
ccatgacaaa aacgcgtaac aaaagtgtct ataatcacgg cagaaaagtc cacattgatt 180
atttgcacgg cgtcacactt tgctatgcca tagcattttt atccataaga ttagcggatc 240
ctacctgacg ctttttatcg caactctcta ctgtttctcc atacccgttt ttttgggcta 300
gaaataattt tgtttaactt taagaaggag atatacatat ggcataggtt atcaacacgt 360
ttgacggggt tgcggattat cttcagacat atcataagct acctgataat tacattacaa 420
aatcagaagc acaagccctc ggctgggtgg catcaaaagg gaaccttgca taggtcgctc 480
cggggaaaag catcggcgga gacatcttct caaacaggga aggcaaactc ccgggcaaaa 540
gcggacgaac atggcgtgaa gcggatatta actatacatc aggcttcaga aattcagacc 600
ggattcttta ctcaagcgac tggctgattt acaaaacaac ggaccattat cagaccttta 660
caaaaatcag ataaagcatg caccattcct tgcggcggcg gtgctcaacg gcctcaacct 720
actactgggc tgcttcctaa tgcaggagtc gcataaggga gagcgtctgg cgaaaggggg 780
atgtgctgca aggcgattaa gttgggtaac gccagggttt tcccagtcac gacgttgtaa 840
aacgacggcc agtgccaagc ttaaaaaaaa tccttagctt tcgctaagga tctgcagtgg 900
tgccgaaacc gggaatctaa cccggctgaa cggatttaga gtccgttcga tctacatgat 960
catctcggcg aattcagcgt tacaagtatt acacaaagtt ttttatgttg agaatatttt 1020
tttgatgggg cgccacttat ttttgatcgt tcgctcaaag aagcggcgcc agggttgttt 1080
ttcttttcac cagtgagacg ggcaacagaa cgccatgagc ggcctcattt cttattctga 1140
gttacaacag tccgcaccgc tgccggtagc tccttccggt gggcgcgggg catgactatc 1200
gtcgccgcac ttatgactgt cttctttatc atgcaactcg taggacaggt gccggcagcg 1260
cccaacagtc ccccggccac ggggcctgcc accataccca cgccgaaaca agcgccctgc 1320
accattatgt tccggatctg catcgcagga tgctgctggc taccctgtgg aacacctaca 1380
tctgtattaa cgaagcgcta accgttttta tcatgctctg ggaggcagaa taaatgatca 1440
tatcgtcaat tattacctcc acggggagag cctgagcaaa ctggcctcag gcatttgaga 1500
agcacacggt cacactgctt ccggtagtca ataaaccggt aaaccagcaa tagacataag 1560
cggctattta acgaccctgc cctgaaccga cgaccgggtc gaatttgctt tcgaatttct 1620
gccattcatc cgcttattat cacttattca ggcgtagcaa ccaggcgttt aagggcacca 1680
ataactgcct taaaaaaatt acgccccgcc ctgccactca tcgcagtact gttgtaattc 1740
attaagcatt ctgccgacat ggaagccatc acaaacggca tgatgaacct gaatcgccag 1800
cggcatcagc accttgtcgc cttgcgtata atatttgccc atggggaacg aaaactcacg 1860
ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta 1920
aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca 1980
atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc 2040
ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc 2100
tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc 2160
agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat 2220
taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt 2280
tgccattgct gcaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc 2340
cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag 2400
ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt 2460
tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac 2520
tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg 2580
cccggcgtca acacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat 2640
tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc 2700
gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc 2760
tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa 2820
atgttgaata ctcatactct tcctttttca atattattga agcatttatc agggttattg 2880
tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg 2940
cacatttccc cgtacgtgcc gatcaacgtc tcattttcgc caaaagttgg cccagggctt 3000
cccggtatca acagggacac caggatttat ttattctgcg aagtgatctt ccgtcacagg 3060
tatttattcg gcgcaaagtg cgtcgggtga tgctgccaac ttactgattt agtgtatgat 3120
ggtgtttttg aggtgctcca gtggcttctg tttctatcag ctgtccctcc tgttcagcta 3180
ctgacggggt ggtgcgtaac ggcaaaagca ccgccggaca tcagcgctag cggagtgtat 3240
actggcttac tatgttggca ctgatgaggg tgtcagtgaa gtgcttcatg tggcaggaga 3300
aaaaaggctg caccggtgcg tcagcagaat atgtgataca ggatatattc cgcttcctcg 3360
ctcactgact cgctacgctc ggtcgttcga ctgcggcgag cggaaatggc ttacgaacgg 3420
ggcggagatt tcctggaaga tgccaggaag atacttaaca gggaagtgag agggccgcgg 3480
caaagccgtt tttccatagg ctccgccccc ctgacaagca tcacgaaatc tgacgctcaa 3540
atcagtggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggcggct 3600
ccctcgtgcg ctctcctgtt cctgcctttc ggtttaccgg tgtcattccg ctgttatggc 3660
cgcgtttgtc tcattccacg cctgacactc agttccgggt aggcagttcg ctccaagctg 3720
gactgtatgc acgaaccccc cgttcagtcc gaccgctgcg ccttatccgg taactatcgt 3780
cttgagtcca acccggaaag acatgcaaaa gcaccactgg cagcagccac tggtaattga 3840
tttagaggag ttagtcttga agtcatgcgc cggttaaggc taaactgaaa ggacaagttt 3900
tggtgactgc gctcctccaa gccagttacc tcggttcaaa gagttggtag ctcagagaac 3960
cttcgaaaaa ccgccctgca aggcggtttt ttcgttttca gagcaagaga ttacgcgcag 4020
accaaaacga tctcaagaag atcatcttat taatcagata aaatatttct agatttcagt 4080
gcaatttatc tcttcaaatg tagcacctga agtcagcccc atacgatata agttgtaatt 4140
ctcatgtttg acagcattat catcgataag ctttaatgcg gtagtttatc acagttaaat 4200
tgctaacgca gtcaggcacc gtgtatgaaa tctaacaatg cgctcatcgt catcctcggc 4260
accgtcaccc tggatgctgt aggcataggc ttggttatgc cggtactgcc gggcctcttg 4320
cgggatggcc acgatgcgtc cggcgtagag gatctgctca tgtttgacag cttatcatcg 4380
atgcataatg tgcctgtcaa atggacgaag cagggattct gcaaacccta tgctactccg 4440
tcaagccgtc aattgtctga ttcgttacca attatgacaa cttgacggct acatcattca 4500
ctttttcttc acaaccggca cggaactcgc tcgggctggc cccggtgcat tttttaaata 4560
cccgcgagaa atagagttga tcgtcaaaac caacattgcg accgacggtg gcgataggca 4620
tccgggtggt gctcaaaagc agcttcgcct ggctgatacg ttggtcctcg cgccagctta 4680
agacgctaat ccctaactgc tggcggaaaa gatgtgacag acgcgacggc gacaagcaaa 4740
catgctgtgc gacgctggcg atatcaaaat tgctgtctgc caggtgatcg ctgatgtact 4800
gacaagcctc gcgtacccga ttatccatcg gtggatggag cgactcgtta atcgcttcca 4860
tgcgccgcag taacaattgc tcaagcagat ttatcgccag cagctccgaa tagcgccctt 4920
ccccttgccc ggcgttaatg atttgcccaa acaggtcgct gaaatgcggc tggtgcgctt 4980
catccgggcg aaagaacccc gtattggcaa atattgacgg ccagttaagc cattcatgcc 5040
agtaggcgcg cggacgaaag taaacccact ggtgatacca ttcgcgagcc tccggatgac 5100
gaccgtagtg atgaatctct cctggcggga acagcaaaat atcacccggt cggcaaacaa 5160
attctcgtcc ctgatttttc accaccccct gaccgcgaat ggtgagattg agaatataac 5220
ctttcattcc cagcggtcgg tcgataaaaa aatcgagata accgttggcc tcaatcggcg 5280
ttaaacccgc caccagatgg gcattaaacg agtatcccgg cagcagggga tcattttgcg 5340
cttcagccat acttttcata ctcccgccat tcagagaag 5379
<210> 49
<211> 7611
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
ggccagatat acgccaatat tggccattag ccatattatt cattggttat atagcataaa 60
tcaatattgg ctattggcca ttgcatacgt tgtatctata tcataatatg tacatttata 120
ttggctcatg tccaatatga ccgccatgtt ggcattgatt attgactagt tattaatagt 180
aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 240
cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 300
cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 360
tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt ccgcccccta 420
ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttacggg 480
actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt 540
tttggcagta caccaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 600
accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 660
gtcgtaataa ccccgccccg ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 720
atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt 780
ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg 840
gaacgcggat tccccgtgcc aagagtgacg taagtaccgc ctatagagtc tataggccca 900
cccccttggc ttcgttagaa cgcggctaca attaatacat aaccttatgt atcatacaca 960
tacgatttag gtgacactat agaataacat ccactttgcc tttctctcca caggtgtcca 1020
ctcccaggtc caactgcacg gaagcttgcc accatggata agaagccgct ggatgttctg 1080
atctctgcga ccggtctgtg gatgtcccgt accggcacgc tgcacaagat caagcactat 1140
gagatttctc gttctaaaat ctacatcgaa atggcgtgtg gtgaccatct ggttgtgaac 1200
aactctcgtt cttgtcgtcc cgcacgtgca ttccgttatc ataaataccg taaaacctgc 1260
aaacgttgtc gtgtttctga cgaagatatc aacaacttcc tgacccgttc taccgaaggc 1320
aaaacctctg ttaaagttaa agttgtttct gagccgaaag tgaaaaaagc gatgccgaaa 1380
tctgtttctc gtgcgccgaa accgctggaa aatccggttt ctgcgaaagc gtctaccgac 1440
acctctcgtt ctgttccgtc tccggcgaaa tctaccccga actctccggt tccgacctct 1500
gcaagcgccc cagctctgac taaatcccag acggaccgtc tggaggtgct gctgaaccca 1560
aaggatgaaa tctctctgaa cagcggcaag cctttccgtg agctggaaag cgagctgctg 1620
tctcgtcgta aaaaggatct gcaacagatc tacgctgagg aacgcgaggg tggcggaagc 1680
ggcggcggaa gccaggcctg gggatcgagg cctcctgcag cagagtgtgc cacccaaaga 1740
gctccaggca gtgtggtgga gctgctgggc aaatcctacc ctcaggacga ccacagcaac 1800
ctcacccgga aggtcctcac cagagttggc aggaacctgc acaaccagca gcatcaccct 1860
ctgtggctga tcaaggagag ggtgttggag cacttcaaca agcagtatgt gggcagctct 1920
gggaccccgt tgttctcggt ctatgacaac ctttcgccag tggtcacgac ctggcagaac 1980
tttgacagcc tgctcatccc agctgatcac ccctgcagga agaaggggga caactattac 2040
ctgaatcgga ctcacatgct gagatcgcac acgtccgcac accagtggga cttgctgcac 2100
gcgggactgg atgccttcct ggtggtgggt gatgtctaca ggcgtgacca gatcgactcc 2160
cagcactacc ctattttcca ccagctggag gccgtgcggc tcttcaccaa gcatgagtta 2220
tttgctggta taaaggatgg ggaaagcctg cagctctttg aacaaagttc tcgctctgcg 2280
cataaacaag agacacacac catggaggcc gtgaagcttg ttgagtttga tcttaagcaa 2340
acgcttacca ggctcatggc acatcttttt ggagatgagc cggagataag gtgggtagac 2400
tgctacattc cttttggaca tccttccttt gagatggaga tcaactttca tggagaatgg 2460
ctggaagttc ttggctgcgg ggtgttggaa caacaactgg tcaattcagc tggtgctcaa 2520
gaccgaatcg gctggggatt tggcctaggg ttagaaaggc tagccatgat cctctacgac 2580
atccctgata tccgtctctt ctggtgtgag gacgagcgct tcctgaagca gttctgtgta 2640
tccaacatta atcagaaggt gaagtttcag cctcttagca aataaacccg ctgatcagcc 2700
tcgactgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt gccttccttg 2760
accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat tgcatcgcat 2820
tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag caagggggag 2880
gattgggaag acaatagcag gcatgctggg gatgcggtgg gctctatggc ttctgaggcg 2940
gaaagaacca gctggggctc tagggggtat ccccacgcgc cctgtagcgg cgcattaagc 3000
gcggcgggtg tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc 3060
gctcctttcg ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct 3120
ctaaatcggg gcatcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa 3180
aaacttgatt agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc 3240
cctttgacgt tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca 3300
ctcaacccta tctcggtcta ttcttttgat ttataaggga ttttggggat ttcggcctat 3360
tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attaattctg tggaatgtgt 3420
gtcagttagg gtgtggaaag tccccaggct ccccaggcag gcagaagtat gcaaagcatg 3480
catctcaatt agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt 3540
atgcaaagca tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc 3600
ccgcccctaa ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt 3660
atttatgcag aggccgaggc cgcctctgcc tctgagctat tccagaagta gtgaggaggc 3720
ttttttggag gcctaggctt ttgcaaaaag ctcccgggag cttgtatatc cattttcgga 3780
tctgatcagc acgtgatgaa aaagcctgaa ctcaccgcga cgtctgtcga gaagtttctg 3840
atcgaaaagt tcgacagcgt ctccgacctg atgcagctct cggagggcga agaatctcgt 3900
gctttcagct tcgatgtagg agggcgtgga tatgtcctgc gggtaaatag ctgcgccgat 3960
ggtttctaca aagatcgtta tgtttatcgg cactttgcat cggccgcgct cccgattccg 4020
gaagtgcttg acattgggga attcagcgag agcctgacct attgcatctc ccgccgtgca 4080
cagggtgtca cgttgcaaga cctgcctgaa accgaactgc ccgctgttct gcagccggtc 4140
gcggaggcca tggatgcgat cgctgcggcc gatcttagcc agacgagcgg gttcggccca 4200
ttcggaccgc aaggaatcgg tcaatacact acatggcgtg atttcatatg cgcgattgct 4260
gatccccatg tgtatcactg gcaaactgtg atggacgaca ccgtcagtgc gtccgtcgcg 4320
caggctctcg atgagctgat gctttgggcc gaggactgcc ccgaagtccg gcacctcgtg 4380
cacgcggatt tcggctccaa caatgtcctg acggacaatg gccgcataac agcggtcatt 4440
gactggagcg aggcgatgtt cggggattcc caatacgagg tcgccaacat cttcttctgg 4500
aggccgtggt tggcttgtat ggagcagcag acgcgctact tcgagcggag gcatccggag 4560
cttgcaggat cgccgcggct ccgggcgtat atgctccgca ttggtcttga ccaactctat 4620
cagagcttgg ttgacggcaa tttcgatgat gcagcttggg cgcagggtcg atgcgacgca 4680
atcgtccgat ccggagccgg gactgtcggg cgtacacaaa tcgcccgcag aagcgcggcc 4740
gtctggaccg atggctgtgt agaagtactc gccgatagtg gaaaccgacg ccccagcact 4800
cgtccgaggg caaaggaata gcacgtgcta cgagatttcg attccaccgc cgccttctat 4860
gaaaggttgg gcttcggaat cgttttccgg gacgccggct ggatgatcct ccagcgcggg 4920
gatctcatgc tggagttctt cgcccacccc aacttgttta ttgcagctta taatggttac 4980
aaataaagca atagcatcac aaatttcaca aataaagcat ttttttcact gcattctagt 5040
tgtggtttgt ccaaactcat caatgtatct tatcatgtct gtataccgtc gacctctagc 5100
tagagcttgg cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta tccgctcaca 5160
attccacaca acatacgagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg 5220
agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg 5280
tgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc 5340
tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 5400
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 5460
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 5520
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 5580
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 5640
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 5700
agcgtggcgc tttctcaatg ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 5760
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 5820
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 5880
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 5940
cctaactacg gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt 6000
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 6060
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 6120
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 6180
gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 6240
aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 6300
gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 6360
gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 6420
cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 6480
gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 6540
gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 6600
ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 6660
tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 6720
ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 6780
cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 6840
accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 6900
cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 6960
tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 7020
cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 7080
acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 7140
atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 7200
tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 7260
aaaatggtgt gagagccggg aatctaaccc ggctgaacgg atttagagtc cgttcgatct 7320
acatgatcac tctcacggtg tttcgtcctt tccacaagat atataaagcc aagaaatcga 7380
aatactttca agttacggta agcatatgat agtccatttt aaaacataat tttaaaactg 7440
caaactaccc aagaaattat tactttctac gtcacgtatt ttgtactaat atctttgtgt 7500
ttacagtcaa attaattcta attatctctc taacagcctt gtatcgtata tgcaaatatg 7560
aaggaatcat gggaaatagg ccctcttcct gcccgacctt cgcgatgtac g 7611
<210> 50
<211> 5530
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540
acggtgggag gtctatataa gcagagctgg tttagtgaac cgtcagatcc gctagcgcta 600
ccggtcgcca ccatggtgag caagggcgag gaggataaca tggccatcat caaggagttc 660
atgcgcttca aggtgcacat ggagggctcc gtgaacggcc acgagttcga gatcgagggc 720
gagggcgagg gccgccccta cgagggcacc cagaccgcca agctgaaggt gaccaagggt 780
ggccccctgc ccttcgcctg ggacatcctg tcccctcagt tcatgtacgg ctccaaggcc 840
tacgtgaagc accccgccga catccccgac tacttgaagc tgtccttccc cgagggcttc 900
aagtgggagc gcgtgatgaa cttcgaggac ggcggcgtgg tgaccgtgac ccaggactcc 960
tccctgcagg acggcgagtt catctacaag gtgaagctgc gcggcaccaa cttcccctcc 1020
gacggccccg taatgcagaa gaagaccatg ggctgggagg cctcctccga gcggatgtac 1080
cccgaggacg gcgccctgaa gggcgagatc aagcagaggc tgaagctgaa ggacggcggc 1140
cactacgacg ctgaggtcaa gaccacctac aaggccaaga agcccgtgca gctgcccggc 1200
gcctacaacg tcaacatcaa gttggacatc acctcccaca acgaggacta caccatcgtg 1260
gaacagtacg aacgcgccga gggccgccac tccaccggcg gcatggacga gctgtacaag 1320
ggaagcggag aggggagagg aagtctgcta acatgcggtg acgtcgagga gaatcctggc 1380
ccaatggtga gcaagggcga ggagctgttc accggggtgg tgcccatcct ggtcgagctg 1440
gacggcgacg taaacggcca caagttcagc gtgtccggcg agggcgaggg cgatgccacc 1500
tacggcaagc tgaccctgaa gttcatctgc accaccggca agctgcccgt gccctggccc 1560
accctcgtga ccaccctgac ctacggcgtg cagtgcttca gccgctaccc cgaccacatg 1620
aagcagcacg acttcttcaa gtccgccatg cccgaaggct acgtccagga gcgcaccatc 1680
ttcttcaagg acgacggcaa ctacaagacc cgcgccgagg tgaagttcga gggcgacacc 1740
ctggtgaacc gcatcgagct gaagggcatc gacttcaagg aggacggcaa catcctgggg 1800
cacaagctgg agtacaacta caacagccac aacgtctata tcatggccga caagcagaag 1860
aacggcatca aggtgaactt caagatccgc cacaacatcg aggacggcag cgtgcagctc 1920
gccgaccact accagcagaa cacccccatc ggctagggcc ccgtgctgct gcccgacaac 1980
cactacctga gcacccagtc cgccctgagc aaagacccca acgagaagcg cgatcacatg 2040
gtcctgctgg agttcgtgac cgccgccggg atcactctcg gcatggacga gctgtacaag 2100
catcatcacc atcaccatta ataatccggc cggactcaga tctcgagctc aagcttcgaa 2160
ttctgcagtc gacggtaccg cgggcccggg atccaccgga tctagataac tgatcataat 2220
cagccatacc acatttgtag aggttttact tgctttaaaa aacctcccac acctccccct 2280
gaacctgaaa cataaaatga atgcaattgt tgttgttaac ttgtttattg cagcttataa 2340
tggttacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca 2400
ttctagttgt ggtttgtcca aactcatcaa tgtatcttaa cgcgtaaatt gtaagcgtta 2460
atattttgtt aaaattcgcg ttaaattttt gttaaatcag ctcatttttt aaccaatagg 2520
ccgaaatcgg caaaatccct tataaatcaa aagaatagac cgagataggg ttgagtgttg 2580
ttccagtttg gaacaagagt ccactattaa agaacgtgga ctccaacgtc aaagggcgaa 2640
aaaccgtcta tcagggcgat ggcccactac gtgaaccatc accctaatca agttttttgg 2700
ggtcgaggtg ccgtaaagca ctaaatcgga accctaaagg gagcccccga tttagagctt 2760
gacggggaaa gccggcgaac gtggcgagaa aggaagggaa gaaagcgaaa ggagcgggcg 2820
ctagggcgct ggcaagtgta gcggtcacgc tgcgcgtaac caccacaccc gccgcgctta 2880
atgcgccgct acagggcgcg tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta 2940
tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat 3000
aaatgcttca ataatattga aaaaggaaga gtcctgaggc ggaaagaacc agctgtggaa 3060
tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca gcaggcagaa gtatgcaaag 3120
catgcatctc aattagtcag caaccaggtg tggaaagtcc ccaggctccc cagcaggcag 3180
aagtatgcaa agcatgcatc tcaattagtc agcaaccata gtcccgcccc taactccgcc 3240
catcccgccc ctaactccgc ccagttccgc ccattctccg ccccatggct gactaatttt 3300
ttttatttat gcagaggccg aggccgcctc ggcctctgag ctattccaga agtagtgagg 3360
aggctttttt ggaggcctag gcttttgcaa agatcgatca agagacagga tgaggatcgt 3420
ttcgcatgat tgaacaagat ggattgcacg caggttctcc ggccgcttgg gtggagaggc 3480
tattcggcta tgactgggca caacagacaa tcggctgctc tgatgccgcc gtgttccggc 3540
tgtcagcgca ggggcgcccg gttctttttg tcaagaccga cctgtccggt gccctgaatg 3600
aactgcaaga cgaggcagcg cggctatcgt ggctggccac gacgggcgtt ccttgcgcag 3660
ctgtgctcga cgttgtcact gaagcgggaa gggactggct gctattgggc gaagtgccgg 3720
ggcaggatct cctgtcatct caccttgctc ctgccgagaa agtatccatc atggctgatg 3780
caatgcggcg gctgcatacg cttgatccgg ctacctgccc attcgaccac caagcgaaac 3840
atcgcatcga gcgagcacgt actcggatgg aagccggtct tgtcgatcag gatgatctgg 3900
acgaagagca tcaggggctc gcgccagccg aactgttcgc caggctcaag gcgagcatgc 3960
ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg cttgccgaat atcatggtgg 4020
aaaatggccg cttttctgga ttcatcgact gtggccggct gggtgtggcg gaccgctatc 4080
aggacatagc gttggctacc cgtgatattg ctgaagagct tggcggcgaa tgggctgacc 4140
gcttcctcgt gctttacggt atcgccgctc ccgattcgca gcgcatcgcc ttctatcgcc 4200
ttcttgacga gttcttctga gcgggactct ggggttcgaa atgaccgacc aagcgacgcc 4260
caacctgcca tcacgagatt tcgattccac cgccgccttc tatgaaaggt tgggcttcgg 4320
aatcgttttc cgggacgccg gctggatgat cctccagcgc ggggatctca tgctggagtt 4380
cttcgcccac cctaggggga ggctaactga aacacggaag gagacaatac cggaaggaac 4440
ccgcgctatg acggcaataa aaagacagaa taaaacgcac ggtgttgggt cgtttgttca 4500
taaacgcggg gttcggtccc agggctggca ctctgtcgat accccaccga gaccccattg 4560
gggccaatac gcccgcgttt cttccttttc cccaccccac cccccaagtt cgggtgaagg 4620
cccagggctc gcagccaacg tcggggcggc aggccctgcc atagcctcag gttactcata 4680
tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 4740
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 4800
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 4860
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 4920
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtccttct 4980
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 5040
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 5100
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 5160
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 5220
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 5280
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 5340
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 5400
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 5460
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 5520
cgccatgcat 5530
<210> 51
<211> 1650
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
atggaagatg ccaaaaacat taagaagggc ccagcgccat tctacccact cgaagacggg 60
accgccggcg agcagctgca caaagccatg aagcgctacg ccctggtgcc cggcaccatc 120
gcctttaccg acgcacatat cgaggtggac attacctacg ccgagtactt cgagatgagc 180
gttcggctgg cagaagctat gaagcgctat gggctgaata caaaccatcg gatcgtggtg 240
tgcagcgaga atagcttgca gttcttcatg cccgtgttgg gtgccctgtt catcggtgtg 300
gctgtggccc cagctaacga catctacaac gagcgcgagc tgctgaacag catgggcatc 360
agccagccca ccgtcgtatt cgtgagcaag aaagggctgc aaaagatcct caacgtgcaa 420
aagaagctac cgatcataca aaagatcatc atcatggata gcaagaccga ctaccagggc 480
ttccaaagca tgtacacctt cgtgacttcc catttgccac ccggcttcaa cgagtacgac 540
ttcgtgcccg agagcttcga ccgggacaaa accatcgccc tgatcatgaa cagtagtggc 600
agtaccggat tgcccaaggg cgtagcccta ccgcaccgca ccgcttgtgt ccgattcagt 660
catgcccgcg accccatctt cggcaaccag atcatcccct agaccgctat cctcagcgtg 720
gtgccatttc accacggctt cggcatgttc accacgctgg gctacttgat ctgcggcttt 780
cgggtcgtgc tcatgtaccg cttcgaggag gagctattct tgcgcagctt gcaagactat 840
aagattcaat ctgccctgct ggtgcccaca ctatttagct tcttcgctaa gagcactctc 900
atcgacaagt acgacctaag caacttgcac gagatcgcca gcggcggggc gccgctcagc 960
aaggaggtag gtgaggccgt ggccaaacgc ttccacctac caggcatccg ccagggctac 1020
ggcctgacag aaacaaccag cgccattctg atcacccccg aaggggacga caagcctggc 1080
gcagtaggca aggtggtgcc cttcttcgag gctaaggtgg tggacttgga caccggtaag 1140
acactgggtg tgaaccagcg cggcgagctg tgcgtccgtg gccccatgat catgagcggc 1200
tacgttaaca accccgaggc tacaaacgct ctcatcgaca aggacggctg gctgcacagc 1260
ggcgacatcg cctactggga cgaggacgag cacttcttca tcgtggaccg gctgaagagc 1320
ctgatcaaat acaagggcta ccaggtagcc ccagccgaac tggagagcat cctgctgcaa 1380
caccccaaca tcttcgacgc cggggtcgcc ggcctgcccg acgacgatgc cggcgagctg 1440
cccgccgcag tcgtcgtgct ggaacacggt aaaaccatga ccgagaagga gatcgtggac 1500
tatgtggcca gccaggttac aaccgccaag aagctgcgcg gtggtgttgt gttcgtggac 1560
gaggtgccta aaggactgac cggcaagttg gacgcccgca agatccgcga gattctcatt 1620
aaggccaaga agggcggcaa gatcgccgtg 1650
<210> 52
<211> 1650
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
atggaagatg ccaaaaacat taagaagggc ccagcgccat tctacccact cgaagacggg 60
accgccggcg agcagctgca caaagccatg aagcgctacg ccctggtgcc cggcaccatc 120
gcctttaccg acgcacatat cgaggtggac attacctacg ccgagtactt cgagatgagc 180
gttcggctgg cagaagctat gaagcgctat gggctgaata caaaccatcg gatcgtggtg 240
tgcagcgaga atagcttgca gttcttcatg cccgtgttgg gtgccctgtt catcggtgtg 300
gctgtggccc cagctaacga catctacaac gagcgcgagc tgctgaacag catgggcatc 360
agccagccca ccgtcgtatt cgtgagcaag aaagggctgc aaaagatcct caacgtgcaa 420
aagaagctac cgatcataca aaagatcatc atcatggata gcaagaccga ctaccagggc 480
ttccaaagca tgtacacctt cgtgacttcc catttgccac ccggcttcaa cgagtacgac 540
ttcgtgcccg agagcttcga ccgggacaaa accatcgccc tgatcatgaa cagtagtggc 600
agtaccggat tgcccaaggg cgtagcccta ccgcaccgca ccgcttgtgt ccgattcagt 660
catgcccgcg accccatctt cggcaaccag atcatccccg acaccgctat cctcagcgtg 720
gtgccatttc accacggctt cggcatgttc accacgctgg gctacttgat ctgcggcttt 780
cgggtcgtgc tcatgtagcg cttcgaggag gagctattct tgcgcagctt gcaagactat 840
aagattcaat ctgccctgct ggtgcccaca ctatttagct tcttcgctaa gagcactctc 900
atcgacaagt acgacctaag caacttgcac gagatcgcca gcggcggggc gccgctcagc 960
aaggaggtag gtgaggccgt ggccaaacgc ttccacctac caggcatccg ccagggctac 1020
ggcctgacag aaacaaccag cgccattctg atcacccccg aaggggacga caagcctggc 1080
gcagtaggca aggtggtgcc cttcttcgag gctaaggtgg tggacttgga caccggtaag 1140
acactgggtg tgaaccagcg cggcgagctg tgcgtccgtg gccccatgat catgagcggc 1200
tacgttaaca accccgaggc tacaaacgct ctcatcgaca aggacggctg gctgcacagc 1260
ggcgacatcg cctactggga cgaggacgag cacttcttca tcgtggaccg gctgaagagc 1320
ctgatcaaat acaagggcta ccaggtagcc ccagccgaac tggagagcat cctgctgcaa 1380
caccccaaca tcttcgacgc cggggtcgcc ggcctgcccg acgacgatgc cggcgagctg 1440
cccgccgcag tcgtcgtgct ggaacacggt aaaaccatga ccgagaagga gatcgtggac 1500
tatgtggcca gccaggttac aaccgccaag aagctgcgcg gtggtgttgt gttcgtggac 1560
gaggtgccta aaggactgac cggcaagttg gacgcccgca agatccgcga gattctcatt 1620
aaggccaaga agggcggcaa gatcgccgtg 1650
<210> 53
<211> 642
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
atgcgtatca ttctgcttgg cgctccgggc gcggggaaag ggactcaggc tcagttcatc 60
atggagaaat atggtattcc gcaaatctcc actggcgata tgctgcgtgc tgcggtcaaa 120
tctggctccg agctgggtaa acaagcaaaa gacattatgg atgctggcaa actggtcacc 180
gacgaactgg tgatcgcgct ggttaaagag cgcattgctc aggaagactg ccgtaatggt 240
ttcctgttgg acggcttccc gcgtaccatt ccgcaggcag acgcgatgaa agaagcgggc 300
atcaatgttg attacgttct ggaattcgac gtaccggact agctgatcgt tgaccgtatc 360
gtcggtcgcc gcgttcatgc gccgtctggt cgtgtttatc acgttaaatt caatccgccg 420
aaagtcgaag gcaaagacga cgttaccggt gaagaactga ctacccgtaa agatgatcag 480
gaagagaccg tacgtaaacg tctggttgaa taccatcaga tgacagcacc gctgatcggc 540
tactactcca aagaagcaga agcgggtaat accaaatacg cgaaagttga cggcaccaag 600
ccggttgctg aagttcgcgc tgatctggaa aaaatcctcg gc 642
<210> 54
<211> 642
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
atgcgtatca ttctgcttgg cgctccgggc gcggggaaag ggactcaggc tcagttcatc 60
atggagaaat atggtattcc gcaaatctcc actggcgata tgctgcgtgc tgcggtcaaa 120
tctggctccg agctgggtaa acaagcaaaa gacattatgg atgctggcaa actggtcacc 180
gacgaactgg tgatcgcgct ggttaaagag cgcattgctc aggaagactg ccgtaatggt 240
ttcctgttgg acggcttccc gcgtaccatt ccgcaggcag acgcgatgaa agaagcgggc 300
atcaatgttg attacgttct ggaattcgac gtaccggacg agctgatcgt tgaccgtatc 360
gtcggtcgcc gcgttcatgc gccgtctggt cgtgtttatc acgttaaatt caatccgccg 420
aaataggaag gcaaagacga cgttaccggt gaagaactga ctacccgtaa agatgatcag 480
gaagagaccg tacgtaaacg tctggttgaa taccatcaga tgacagcacc gctgatcggc 540
tactactcca aagaagcaga agcgggtaat accaaatacg cgaaagttga cggcaccaag 600
ccggttgctg aagttcgcgc tgatctggaa aaaatcctcg gc 642
<210> 55
<211> 1272
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
atggcaagca gtaacttgat taaacaattg caagagcggg ggctggtagc ccaggtgacg 60
gacgaggaag cgttagcaga gcgactggcg caaggcccga tcgcgctcta ttgcggcttc 120
gatcctaccg ctgacagctt gcatttgggg catcttgttc cattgttatg cctgaaacgc 180
ttccagcagg cgggccacaa gccggttgcg ctggtaggcg gcgcgacggg tctgattggc 240
gacccgagct tcaaagctgc cgagcgtaag ctgaacaccg aagaaactgt tcaggagtgg 300
gtggacaaaa tccgtaagca ggttgccccg ttcctcgatt tcgactgtgg agaaaactct 360
gctatcgcgg cgaacaacta tgactggttc ggcaatatga atgtgctgac cttcctgcgc 420
gatattggca aacacttctc cgttaaccag atgatcaaca aagaagcggt taagcagcgt 480
ctcaaccgtg aagatcaggg gatttcgttc actgagtttt cctacaacct gttgcagggt 540
tatgacttcg cctgtctgaa caaacagtac ggtgtggtgc tgcaaattgg tggttctgac 600
cagtggggta acatcacttc tggtatcgac ctgacccgtc gtctgcatca gaatcaggtg 660
tttggcctga ccgttccgct gatcactaaa gcagatggca ccaaatttgg taaaacttag 720
ggcggcgcag tctggttgga tccgaagaaa accagcccgt acaaattcta ccagttctgg 780
atcaacactg cggatgccga cgtttaccgc ttcctgaagt tcttcacctt tatgagcatt 840
gaagagatca acgccctgga agaagaagat aaaaacagcg gtaaagcacc gcgcgcccag 900
tatgtactgg cggagcaggt gactcgtctg gttcacggtg aagaaggttt acaggcggca 960
aaacgtatta ccgaatgcct gttcagcggt tctttgagtg cgctgagtga agcggacttc 1020
gaacagctgg cgcaggacgg cgtaccgatg gttgagatgg aaaagggcgc agacctgatg 1080
caggcactgg tcgattctga actgcaacct tcccgtggtc aggcacgtaa aactatcgcc 1140
tccaatgcca tcaccattaa cggtgaaaaa cagtccgatc ctgaatactt ctttaaagaa 1200
gaagatcgtc tgtttggtcg ttttacctta ctgcgtcgcg gtaaaaagaa ttactgtctg 1260
atttgctgga aa 1272
<210> 56
<211> 1272
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
atggcaagca gtaacttgat taaacaattg caagagcggg ggctggtagc ccaggtgacg 60
gacgaggaag cgttagcaga gcgactggcg caaggcccga tcgcgctcta ttgcggcttc 120
gatcctaccg ctgacagctt gcatttgggg catcttgttc cattgttatg cctgaaacgc 180
ttccagcagg cgggccacaa gccggttgcg ctggtaggcg gcgcgacggg tctgattggc 240
gacccgagct tcaaagctgc cgagcgtaag ctgaacaccg aagaaactgt tcaggagtgg 300
gtggacaaaa tccgtaagca ggttgccccg ttcctcgatt tcgactgtgg agaaaactct 360
gctatcgcgg cgaacaacta tgactggttc ggcaatatga atgtgctgac cttcctgcgc 420
gatattggca aacacttctc cgttaaccag atgatcaaca aagaagcggt taagcagcgt 480
ctcaaccgtg aagatcaggg gatttcgttc actgagtttt cctacaacct gttgcagggt 540
tatgacttcg cctgtctgaa caaacagtac ggtgtggtgc tgcaaattgg tggttctgac 600
cagtggggta acatcacttc tggtatcgac ctgacccgtc gtctgcatca gaatcaggtg 660
tttggcctga ccgttccgct gatcactaaa gcagatggca ccaaatttgg taaaactgaa 720
ggcggcgcag tctggttgga tccgaagaaa accagcccgt acaaattcta ccagttctgg 780
atcaacactg cggatgccga cgtttaccgc ttcctgaagt tcttcacctt tatgagcatt 840
gaagagatca acgccctgga agaagaagat aaaaacagcg gtaaagcacc gcgcgcccag 900
taggtactgg cggagcaggt gactcgtctg gttcacggtg aagaaggttt acaggcggca 960
aaacgtatta ccgaatgcct gttcagcggt tctttgagtg cgctgagtga agcggacttc 1020
gaacagctgg cgcaggacgg cgtaccgatg gttgagatgg aaaagggcgc agacctgatg 1080
caggcactgg tcgattctga actgcaacct tcccgtggtc aggcacgtaa aactatcgcc 1140
tccaatgcca tcaccattaa cggtgaaaaa cagtccgatc ctgaatactt ctttaaagaa 1200
gaagatcgtc tgtttggtcg ttttacctta ctgcgtcgcg gtaaaaagaa ttactgtctg 1260
atttgctgga aa 1272
<210> 57
<211> 600
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
atggccaaca tcgcggtgca gcgaatcaag cgggagttca aggaggtgct gaagagcgag 60
gagacgagca aaaatcaaat taaagtagat cttgtagatg agaattttac agaattaaga 120
ggagaaatag caggacctcc atagacacca tatgaaggag gaagatacca actagagata 180
aaaataccag aaacataccc atttaatccc cctaaggtcc ggtttatcac taaaatatgg 240
catcctaata ttagttccgt cacaggggct atttgtttgg atatcctgaa agatcaatgg 300
gcagctgcaa tgactctccg cacggtatta ttgtcattgc aagcactatt ggcagctgca 360
gagccagatg atccacagga tgctgtagta gcaaatcagt acaaacaaaa tcccgaaatg 420
ttcaaacaga cagctcgact ttgggcacat gtgtatgctg gagcaccagt ttctagtcca 480
gaatacacca aaaaaataga aaacctatgt gctatgggct ttgataggaa tgcagtaata 540
gtggccttgt cttcaaaatc atgggatgta gagactgcaa cagaattgct tctgagtaac 600
<210> 58
<211> 600
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
atggccaaca tcgcggtgca gcgaatcaag cgggagttca aggaggtgct gaagagcgag 60
gagacgagca aaaatcaaat taaagtagat cttgtagatg agaattttac agaattaaga 120
ggagaaatag caggacctcc agacacacca tatgaaggag gaagatacca actagagata 180
aaaataccag aaacataccc atttaatccc cctaaggtcc ggtttatcac taaaatatgg 240
catcctaata ttagttccgt cacaggggct atttgtttgg atatcctgaa agatcaatgg 300
gcagctgcaa tgactctccg cacggtatta ttgtcattgc aagcactatt ggcagctgca 360
gagccagatg atccacagga tgctgtagta gcaaatcagt agaaacaaaa tcccgaaatg 420
ttcaaacaga cagctcgact ttgggcacat gtgtatgctg gagcaccagt ttctagtcca 480
gaatacacca aaaaaataga aaacctatgt gctatgggct ttgataggaa tgcagtaata 540
gtggccttgt cttcaaaatc atgggatgta gagactgcaa cagaattgct tctgagtaac 600
<210> 59
<211> 360
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 59
atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccct 60
aaaaagaaaa tccagctgca cgctgaacat gcactgtagg atgcactgat gatcctgaat 120
atcgtcaaaa ccaacagccc gccggcagaa gaaaaactgg aagattatgc atttaacttt 180
gaactgatcc tggaagaaat tgcacgtctg tttgaaagcg gtgatcagaa agatgaagca 240
gaaaaagcaa aacgtatgaa agaatggatg aaacgcatta aaaccaccgc aagcgaagat 300
gaacaggaag aaatggcaaa tgcaattatt accattctgc agagctggat ttttagttaa 360
<210> 60
<211> 849
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 60
atggatacaa aactgtagtg catctgtaaa acgccgtatg atgaaagcaa attttatatt 60
ggttgcgatc gttgtcagaa ttggtatcat ggtcgttgtg tgggtattct gcagtctgaa 120
gcagaactga ttgatgaata tgtgtgtccg cagtgtcaga gcaccgaaga tgcgctggtg 180
ccgcgcggca gcatgtcccc tatactaggt tattggaaaa ttaagggcct tgtgcaaccc 240
actcgacttc ttttggaata tcttgaagaa aaatatgaag agcatttgta tgagcgcgat 300
gaaggtgata aatggcgaaa caaaaagttt gaattgggtt tggagtttcc caatcttcct 360
tattatattg atggtgatgt taaattaaca cagtctatgg ccatcatacg ttatatagct 420
gacaagcaca acatgttggg tggttgtcca aaagagcgtg cagagatttc aatgcttgaa 480
ggagcggttt tggatattag atacggtgtt tcgagaattg catatagtaa agactttgaa 540
actctcaaag ttgattttct tagcaagcta cctgaaatgc tgaaaatgtt cgaagatcgt 600
ttatgtcata aaacatattt aaatggtgat catgtaaccc atcctgactt catgttgtat 660
gacgctcttg atgttgtttt atacatggac ccaatgtgcc tggatgcgtt cccaaaatta 720
gtttgtttta aaaaacgtat tgaagctatc ccacaaattg ataagtactt gaaatccagc 780
aagtatatag catggccttt gcagggctgg caagccacgt ttggtggtgg cgaccatcct 840
ccaaaatga 849
<210> 61
<211> 852
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 61
atggatacaa aactgtattg catctgtaaa acgccgtatg atgaaagcaa attttatatt 60
ggttgcgatc gttgtcagaa ttagtatcat ggtcgttgtg tgggtattct gcagtctgaa 120
gcagaactga ttgatgaata tgtgtgtccg cagtgtcaga gcaccgaaga tgcgatgctg 180
gtgccgcgcg gcagcatgtc ccctatacta ggttattgga aaattaaggg ccttgtgcaa 240
cccactcgac ttcttttgga atatcttgaa gaaaaatatg aagagcattt gtatgagcgc 300
gatgaaggtg ataaatggcg aaacaaaaag tttgaattgg gtttggagtt tcccaatctt 360
ccttattata ttgatggtga tgttaaatta acacagtcta tggccatcat acgttatata 420
gctgacaagc acaacatgtt gggtggttgt ccaaaagagc gtgcagagat ttcaatgctt 480
gaaggagcgg ttttggatat tagatacggt gtttcgagaa ttgcatatag taaagacttt 540
gaaactctca aagttgattt tcttagcaag ctacctgaaa tgctgaaaat gttcgaagat 600
cgtttatgtc ataaaacata tttaaatggt gatcatgtaa cccatcctga cttcatgttg 660
tatgacgctc ttgatgttgt tttatacatg gacccaatgt gcctggatgc gttcccaaaa 720
ttagtttgtt ttaaaaaacg tattgaagct atcccacaaa ttgataagta cttgaaatcc 780
agcaagtata tagcatggcc tttgcagggc tggcaagcca cgtttggtgg tggcgaccat 840
cctccaaaat ga 852
<210> 62
<211> 582
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 62
atgggcgtgg ccaccagcct gctctacagc ggctccaagt agcgcggcca ccagaagagc 60
aaggggaact cgtacgacgt agaggtggtg ctgcagcacg tggacacggg gaactcttac 120
ctttgtgggt acttgaagat taaaggcctt actgaggagt atccaaccct tacaaccttc 180
ttcgaaggag aaataatcag caaaaaacac cctttcttaa ctcgcaagtg ggatgcagat 240
gaagatgttg atcggaaaca ctggggcaag tttctggctt tttatcagta tgcaaaatca 300
tttaactcag atgactttga ttatgaagag ctgaagaatg gagactacgt cttcatgagg 360
tggaaggaac agtttctggt cccagatcac acgatcaaag acatcagtgg tgcttctttt 420
gccgggttct actacatctg ctttcagaag tcagcagcct ccatagaggg ctactactac 480
cataggagtt cagaatggta tcagtccctc aatctaaccc atgttcctga acacagtgca 540
cccatctatg aattccgggg tcatcatcac catcaccatt ga 582
<210> 63
<211> 1629
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 63
atggataaga agccgctgga tgttctgatc tctgcgaccg gtctgtggat gtcccgtacc 60
ggcacgctgc acaagatcaa gcactatgag atttctcgtt ctaaaatcta catcgaaatg 120
gcgtgtggtg accatctggt tgtgaacaac tctcgttctt gtcgtcccgc acgtgcattc 180
cgttatcata aataccgtaa aacctgcaaa cgttgtcgtg tttctgacga agatatcaac 240
aacttcctga cccgttctac cgaaggcaaa acctctgtta aagttaaagt tgtttctgag 300
ccgaaagtga aaaaagcgat gccgaaatct gtttctcgtg cgccgaaacc gctggaaaat 360
ccggtttctg cgaaagcgtc taccgacacc tctcgttctg ttccgtctcc ggcgaaatct 420
accccgaact ctccggttcc gacctctgca agcgccccag ctctgactaa atcccagacg 480
gaccgtctgg aggtgctgct gaacccaaag gatgaaatct ctctgaacag cggcaagcct 540
ttccgtgagc tggaaagcga gctgctgtct cgtcgtaaaa aggatctgca acagatctac 600
gctgaggaac gcgagggtgg cggaagcggc ggcggaagcc aggcctgggg atcgaggcct 660
cctgcagcag agtgtgccac ccaaagagct ccaggcagtg tggtggagct gctgggcaaa 720
tcctaccctc aggacgacca cagcaacctc acccggaagg tcctcaccag agttggcagg 780
aacctgcaca accagcagca tcaccctctg tggctgatca aggagagggt gttggagcac 840
ttcaacaagc agtatgtggg cagctctggg accccgttgt tctcggtcta tgacaacctt 900
tcgccagtgg tcacgacctg gcagaacttt gacagcctgc tcatcccagc tgatcacccc 960
tgcaggaaga agggggacaa ctattacctg aatcggactc acatgctgag agcgcacacg 1020
tccgcacacc agtgggactt gctgcacgcg ggactggatg ccttcctggt ggtgggtgat 1080
gtctacaggc gtgaccagat cgactcccag cactacccta ttttccacca gctggaggcc 1140
gtgcggctct tcaccaagca tgagttattt gctggtataa aggatgggga aagcctgcag 1200
ctctttgaac aaagttctcg ctctgcgcat aaacaagaga cacacaccat ggaggccgtg 1260
aagcttgttg agtttgatct taagcaaacg cttaccaggc tcatggcaca tctttttgga 1320
gatgagccgg agataaggtg ggtagactgc tacttccctt ttggacatcc ttcctttgag 1380
atggagatca actttcatgg agaatggctg gaagttcttg gctgcggggt gttggaacaa 1440
caactggtca attcagctgg tgctcaagac cgaatcggct ggggatttgg cctagggtta 1500
gaaaggctag ccatgatcct ctacgacatc cctgatatcc gtctcttctg gtgtgaggac 1560
gagcgcttcc tgaagcagtt ctgtgtatcc aacattaatc agaaggtgaa gtttcagcct 1620
cttagcaaa 1629
<210> 64
<211> 1665
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 64
atggataaga agccgctgga tgttctgatc tctgcgaccg gtctgtggat gtcccgtacc 60
ggcacgctgc acaagatcaa gcactatgag atttctcgtt ctaaaatcta catcgaaatg 120
gcgtgtggtg accatctggt tgtgaacaac tctcgttctt gtcgtcccgc acgtgcattc 180
cgttatcata aataccgtaa aacctgcaaa cgttgtcgtg tttctgacga agatatcaac 240
aacttcctga cccgttctac cgaaggcaaa acctctgtta aagttaaagt tgtttctgag 300
ccgaaagtga aaaaagcgat gccgaaatct gtttctcgtg cgccgaaacc gctggaaaat 360
ccggtttctg cgaaagcgtc taccgacacc tctcgttctg ttccgtctcc ggcgaaatct 420
accccgaact ctccggttcc gacctctgca agcgccccag ctctgactaa atcccagacg 480
gaccgtctgg aggtgctgct gaacccaaag gatgaaatct ctctgaacag cggcaagcct 540
ttccgtgagc tggaaagcga gctgctgtct cgtcgtaaaa aggatctgca acagatctac 600
gctgaggaac gcgagggtgg cggaagcggc ggcggaagcg gtggcggaag tggtggcgga 660
agcggcggcg gaagccaggc ctggggatcg aggcctcctg cagcagagtg tgccacccaa 720
agagctccag gcagtgtggt ggagctgctg ggcaaatcct accctcagga cgaccacagc 780
aacctcaccc ggaaggtcct caccagagtt ggcaggaacc tgcacaacca gcagcatcac 840
cctctgtggc tgatcaagga gagggtgaag gagcacttca acaagcagta tgtggactgc 900
tttgggaccc cgttgttctc ggtctacgac aacctttctc cagtggtcac gacctggcag 960
aactttgaca gcctgctcat cacagctgat cacccctgca ggaggaaggg ggacaactat 1020
tacctgaatc ggactcacat gctgagagcg cacacgtccg cacaccagtg ggacttgctg 1080
cacgcgggac tggatgcctt cctggtggtg ggtgatgtct acaggcgaga ccagatcgac 1140
tcccagcact accctatttt ccaccagctg gaggccgtgc ggctcttcac caagcatgag 1200
ttatttgctg gtataaagga tggagaaagc cagcagctct ttgaacaaag ttctcgctct 1260
gcgcataaac aagagtcaca caccatggag gccgtgaagc ttgtagagtt tgatcttaag 1320
caaacgctta ccaggctcat ggcacatctt tttggagatg agccggagat aagatgggta 1380
gacagctact tcccttttgg acatccttcc tttgagatgg agatcaactt tcatggagaa 1440
tggctggaag ttcttggctg cggggtgttg gaacaacaac tggtcaattc agctggtgct 1500
caagaccgaa tcggctgggg attcggccta ggattagaaa ggctggccat gatcctctac 1560
gacatccctg atatccgtct cttctggtgt gaggacgagc gcttcctgaa gcagttctgt 1620
gtatccaaca ttaatcagaa ggtgaagttt cagcctctta gcaaa 1665

Claims (10)

1.一种引入非天然氨基酸的嵌合体苯丙氨酸翻译系统的构建方法,其特征在于,所述方法包括以下步骤:
(1)以核苷酸序列如SEQ ID NO:1所示的嵌合体苯丙氨酸-tRNA为基础,构建嵌合体苯丙氨酸-tRNA的文库;
(2)筛选嵌合体苯丙氨酸-tRNA突变体,并测试筛选到的苯丙氨酸-tRNA突变体引入非天然氨基酸的效率;
(3)选择嵌合体苯丙氨酰-tRNA合成酶的催化结构域、构建随机突变文库,筛选催化活性提高的嵌合体苯丙氨酰-tRNA合成酶突变体,获得非天然氨基酸插入活性提高的突变体;
(4)选择嵌合体苯丙氨酰-tRNA合成酶识别4-叠氮-苯丙氨酸(AzF)和3-苯并噻吩基-丙氨酸(BTA)的氨基酸,构建饱和诱变文库,筛选高信噪比的嵌合体苯丙氨酰-tRNA合成酶突变体,所述突变体的基因序列分别如SEQ ID NO:9和SEQ ID NO:10所示;
(5)将步骤(2)中筛选得到的嵌合体苯丙氨酸-tRNA突变体和步骤(3)中筛选得到的嵌合体苯丙氨酰-tRNA合成酶突变体整合,获得包含嵌合体苯丙氨酰-tRNA合成酶、苯丙氨酸-tRNA突变体和非天然氨基酸的翻译系统。
2.如权利要求1所述的构建方法,其中所述非天然氨基酸选自由3-苯并噻吩基-丙氨酸(BTA)、6-甲基-色氨酸(6MW)、7-甲基-色氨酸(7MW)、4-叠氮-苯丙氨酸(AzF)、4-乙酰基-苯丙氨酸(AcF)、2-萘基-丙氨酸(NapA)、叔丁氧羰基-赖氨酸(BocK)和3-硝基-酪氨酸(3NT)组成的组中的一种或多种。
3.如权利要求1或2所述的构建方法,其中步骤(2)中筛选得到的嵌合体苯丙氨酸-tRNA突变体的核苷酸序列分别如SEQ ID NO:2~7所示。
4.如权利要求1~3任一项所述的构建方法,其中步骤(3)中筛选得到的嵌合体苯丙氨酰-tRNA合成酶突变体的核苷酸序列分别如SEQ ID NO:63和SEQ ID NO:64所示。
5.如权利要求1~4任一项所述的构建方法,其中,通过使用两个拷贝的核苷酸序列如SEQ ID NO:4所示的嵌合体苯丙氨酸-tRNA突变体,实现引入非天然氨基酸效率达到细胞内源天然氨基酸插入的水平。
6.如权利要求1~5任一项所述的构建方法,其中,在选自由FLUC、ADK、TyrRS、UBE2K、Neo2/15、PHD和GID4组成的组中的任一种蛋白质上引入非天然氨基酸的效率能够达到野生型蛋白的表达水平。
7.如权利要求1~6任一项所述的构建方法,其中步骤(5)中所述包含嵌合体苯丙氨酰-tRNA合成酶、苯丙氨酸-tRNA突变体和非天然氨基酸的翻译系统的基因序列分别如SEQ IDNO:9和SEQ ID NO:4所示。
8.利用权利要求1~7任一项所述的构建方法构建得到的AzF依赖的大肠杆菌菌株。
9.利用权利要求1~7任一项所述的构建方法构建得到的嵌合体苯丙氨酸翻译系统。
10.根据权利要求9所述的翻译系统,其特征在于,所述翻译系统与Mj-TyrRS/tRNA系统以及Ma-PylRS/tRNA系统具备交互正交性和/或所述翻译系统能够整合到大肠杆菌的基因组上。
CN202111293920.3A 2021-11-03 2021-11-03 一种引入非天然氨基酸的嵌合体苯丙氨酸翻译系统及其构建方法 Active CN114134141B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111293920.3A CN114134141B (zh) 2021-11-03 2021-11-03 一种引入非天然氨基酸的嵌合体苯丙氨酸翻译系统及其构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111293920.3A CN114134141B (zh) 2021-11-03 2021-11-03 一种引入非天然氨基酸的嵌合体苯丙氨酸翻译系统及其构建方法

Publications (2)

Publication Number Publication Date
CN114134141A true CN114134141A (zh) 2022-03-04
CN114134141B CN114134141B (zh) 2024-01-30

Family

ID=80392397

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111293920.3A Active CN114134141B (zh) 2021-11-03 2021-11-03 一种引入非天然氨基酸的嵌合体苯丙氨酸翻译系统及其构建方法

Country Status (1)

Country Link
CN (1) CN114134141B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024059139A3 (en) * 2022-09-13 2024-04-25 University Of Cincinnati Engineered probiotics expressing anti-inflammatory molecules

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070178554A1 (en) * 2006-02-01 2007-08-02 Nima Shiva Orthogonal Aminoacyl Synthetase-tRNA Pairs for Incorporating Unnatural Amino Acids Into Proteins
CA2665678A1 (en) * 2006-10-18 2008-06-19 The Scripps Research Institute Genetic incorporation of unnatural amino acids into proteins in mammalian cells
CN102827827A (zh) * 2004-10-27 2012-12-19 斯克利普斯研究院 体内掺入非天然氨基酸的正交翻译组分
CN104059891A (zh) * 2013-03-22 2014-09-24 中国科学院生物物理研究所 8-羟基喹啉丙氨酸翻译系统及其应用
CN110117580A (zh) * 2018-02-05 2019-08-13 中国科学院生物物理研究所 硒代酪氨酸翻译系统及其应用
CN110172467A (zh) * 2019-05-24 2019-08-27 浙江大学 一种利用嵌合设计方法构建正交的氨酰-tRNA合成酶/tRNA体系
CN110835633A (zh) * 2018-08-13 2020-02-25 北京大学 利用优化的基因密码子扩展系统制备ptc稳定细胞系及应用
CN111118048A (zh) * 2019-11-11 2020-05-08 浙江大学 嵌合苯丙氨酰-tRNA合成酶/tRNA的应用
CN111849929A (zh) * 2019-04-30 2020-10-30 苏州鲲鹏生物技术有限公司 高效引入赖氨酸衍生物的氨酰基—tRNA合成酶
US20210054040A1 (en) * 2019-08-23 2021-02-25 Synthorx, Inc. Novel il-15 conjugates and uses thereof

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102827827A (zh) * 2004-10-27 2012-12-19 斯克利普斯研究院 体内掺入非天然氨基酸的正交翻译组分
US20070178554A1 (en) * 2006-02-01 2007-08-02 Nima Shiva Orthogonal Aminoacyl Synthetase-tRNA Pairs for Incorporating Unnatural Amino Acids Into Proteins
CA2665678A1 (en) * 2006-10-18 2008-06-19 The Scripps Research Institute Genetic incorporation of unnatural amino acids into proteins in mammalian cells
CN101535338A (zh) * 2006-10-18 2009-09-16 斯克利普斯研究院 在哺乳动物细胞中将非天然氨基酸遗传掺入蛋白质
CN104059891A (zh) * 2013-03-22 2014-09-24 中国科学院生物物理研究所 8-羟基喹啉丙氨酸翻译系统及其应用
CN110117580A (zh) * 2018-02-05 2019-08-13 中国科学院生物物理研究所 硒代酪氨酸翻译系统及其应用
CN110835633A (zh) * 2018-08-13 2020-02-25 北京大学 利用优化的基因密码子扩展系统制备ptc稳定细胞系及应用
CN111849929A (zh) * 2019-04-30 2020-10-30 苏州鲲鹏生物技术有限公司 高效引入赖氨酸衍生物的氨酰基—tRNA合成酶
CN110172467A (zh) * 2019-05-24 2019-08-27 浙江大学 一种利用嵌合设计方法构建正交的氨酰-tRNA合成酶/tRNA体系
US20210054040A1 (en) * 2019-08-23 2021-02-25 Synthorx, Inc. Novel il-15 conjugates and uses thereof
CN111118048A (zh) * 2019-11-11 2020-05-08 浙江大学 嵌合苯丙氨酰-tRNA合成酶/tRNA的应用

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
HONGXIAO ZHAO等: "Directed-evolution of translation system for efficient unnatural amino acids incorporation and generalizable synthetic auxotroph construction", 《NATURE COMMUNICATIONS》, vol. 12, no. 1 *
JULIAN C等: "Mutually orthogonal pyrrolysyl-tRNA synthetase/tRNA pairs", 《NAT CHEM》, vol. 10, pages 831 - 837, XP036551735, DOI: 10.1038/s41557-018-0052-5 *
KLIPCAN L等: "Crystal Structure of Human Mitochondrial PheRS Complexed with tRNA(Phe) in the Active "Open" State", 《JOURNAL OF MOLECULAR BIOLOGY》, vol. 415, no. 3, pages 527 - 537 *
MIYAZAKI, K等: "Molecular engineering of a PheS counterselection marker for improved operating efficiency in Escherichia coli", 《BIOTECHIQUES》, vol. 58, no. 2, XP002786571 *
杜方川;王芬;神应强;陈灿玉;王安明;: "非天然氨基酸修饰蛋白质研究进展", 杭州师范大学学报(自然科学版), no. 05 *
林军等: "苯丙氨酰-tRNA合成酶的进化与结构域丢失", 《生物化学与生物物理学》, vol. 35, no. 12, pages 1061 - 1065 *
王猛;杨胜波;: "甘氨酰-tRNA合成酶的结构、功能和致病机制研究进展", 解剖学杂志, no. 01 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024059139A3 (en) * 2022-09-13 2024-04-25 University Of Cincinnati Engineered probiotics expressing anti-inflammatory molecules

Also Published As

Publication number Publication date
CN114134141B (zh) 2024-01-30

Similar Documents

Publication Publication Date Title
KR102606929B1 (ko) 동족 항원과 t-세포 수용체 상호작용의 발견 및 특징규명을 위한 조작된 2-부분 세포 디바이스
DK2788478T3 (en) Multiplex IMMUNSCREENINGSASSAY
KR102606810B1 (ko) 오토펄린을 발현시키기 위한 조성물 및 방법
KR100886312B1 (ko) 단백질-단백질의 상호작용을 분석하는 방법
US20040003420A1 (en) Modified recombinase
KR102614328B1 (ko) T-세포 수용체 합성 및 tcr-제시 세포에 대한 안정적인 게놈 통합을 위한 2-부분 디바이스
CN101868241A (zh) 表达生物治疗分子的治疗基因开关构建物和生物反应器以及它们的应用
KR102584628B1 (ko) T-세포 수용체, t-세포 항원 및 이들의 기능성 상호작용의 식별 및 특징규명을 위한 조작된 다성분 시스템
CN110023500A (zh) 作为选择标记的减毒谷氨酰胺合成酶
JP2003534775A (ja) タンパク質を不安定化する方法とその使用
AU2016378480A1 (en) Endothelium-specific nucleic acid regulatory elements and methods and use thereof
KR20230056630A (ko) 신규의 omni-59, 61, 67, 76, 79, 80, 81 및 82 crispr 뉴클레아제
JP2023025182A (ja) T細胞レセプター及びt細胞抗原の同定及び特徴決定のための遺伝子操作された多成分システム
CN111094569A (zh) 光控性病毒蛋白质、其基因及包含该基因的病毒载体
CN114134141B (zh) 一种引入非天然氨基酸的嵌合体苯丙氨酸翻译系统及其构建方法
CN113215195B (zh) 一种在肌源性细胞特异性高表达sia的重组表达载体及其应用
EP1395612A2 (en) Modified recombinase
KR20240021906A (ko) 발현 벡터, 박테리아 서열-무함유 벡터, 및 이를 제조하고 사용하는 방법
CN114292873A (zh) 永生化猪骨髓巨噬细胞、其构建方法及应用
KR20230054840A (ko) rAAV 비리온의 유도 생산을 위한 안정화된 세포주
CN112063655A (zh) 一种端粒基因治疗产品和哺乳动物广泛性启动子的用途
CN110777147A (zh) 一种ikzf3基因沉默的t细胞及其应用
KR102543504B1 (ko) 세포 손상 관찰을 위한 형광 단백질 변이체 및 이를 이용한 약물 독성 평가 방법
KR20240022571A (ko) Rna-가이드된 이펙터 동원을 위한 시스템, 방법 및 성분
KR20240029020A (ko) Dna 변형을 위한 crispr-트랜스포손 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20230119

Address after: 311100 Room 520, Building 2, No. 366, Tongyun Street, Liangzhu Street, Yuhang District, Hangzhou City, Zhejiang Province

Applicant after: Hangzhou Chihua Hesheng Pharmaceutical Technology Co.,Ltd.

Address before: 310058 Yuhang Tang Road, Xihu District, Hangzhou, Zhejiang 866

Applicant before: ZHEJIANG University

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant