CN108495932B - 用于特异性转换靶向dna序列的核酸碱基的单子叶植物的基因组序列的转换方法、及其使用的分子复合体 - Google Patents

用于特异性转换靶向dna序列的核酸碱基的单子叶植物的基因组序列的转换方法、及其使用的分子复合体 Download PDF

Info

Publication number
CN108495932B
CN108495932B CN201680079887.5A CN201680079887A CN108495932B CN 108495932 B CN108495932 B CN 108495932B CN 201680079887 A CN201680079887 A CN 201680079887A CN 108495932 B CN108495932 B CN 108495932B
Authority
CN
China
Prior art keywords
nucleic acid
lys
leu
glu
ile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680079887.5A
Other languages
English (en)
Other versions
CN108495932A (zh
Inventor
西田敬二
岛古善平
近藤昭彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kobe University NUC
Original Assignee
Kobe University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kobe University NUC filed Critical Kobe University NUC
Publication of CN108495932A publication Critical patent/CN108495932A/zh
Application granted granted Critical
Publication of CN108495932B publication Critical patent/CN108495932B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8202Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation by biological means, e.g. cell mediated or natural vector
    • C12N15/8205Agrobacterium mediated transformation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2523/00Culture process characterised by temperature
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04005Cytidine deaminase (3.5.4.5)

Abstract

本发明提供修饰单子叶植物细胞所具有的双链DNA的靶向位点的方法,其包括以下步骤,使(由核酸碱基转变酶和与所选择的双链DNA中的靶核苷酸序列特异性结合的核酸序列识别模块结合而成的)复合体与该双链DNA接触,在该靶向位点中不切割该双链DNA的至少一个链,将该靶向位点的1个以上的核苷酸缺失或转换为其它1个以上的核苷酸,或者向该靶向位点插入1个以上的核苷酸的步骤,其中,该双链DNA与该复合体的接触通过向该单子叶植物细胞导入的编码该复合体的核酸来进行。进一步,也提供用于在该方法中使用的复合体,其由核酸碱基转变酶和与单子叶植物细胞具有的双链DNA中的靶核苷酸序列特异性结合的核酸序列识别模块结合而成。

Description

用于特异性转换靶向DNA序列的核酸碱基的单子叶植物的基 因组序列的转换方法、及其使用的分子复合体
技术领域
本发明涉及基因组序列的修饰方法,及其使用的核酸碱基转变酶和核酸序列识别模块的复合体,其不伴随DNA的双链切割(无切割或者单链切割),而能够进行单子叶植物基因组的特定区域内的核酸碱基的修饰。
背景技术
单子叶植物是指在被子植物中的一组具有1枚子叶的植物,水稻、小麦、玉米这三大谷物分类于该组。因此,虽然以前对单子叶植物的分子育种进行了热烈的研究,但由于单子叶植物不是农杆菌的宿主,因此作为植物的转化法无法长期利用最一般的农杆菌法,而使用了直接导入法。到了1990年代中旬,从报告了通过使细胞分裂旺盛的细胞感染农杆菌,由此可有效地使水稻转化以来,基于基因导入进行的单子叶植物的分子育种有了大幅进步。
另一方面,近年来,作为在各种生物种类中修饰目标的基因、基因组区域的技术,基因组编辑受到了关注。目前,作为基因组编辑的方法,提出了利用由具有非序列依赖性的DNA切割能力的分子、与具有序列识别能力的分子组合而成的人工核酸酶的方法(非专利文献1)。
例如,使用由锌指DNA结合结构域与非特异性DNA切割结构域连接而成的锌指核酸酶(ZFN),来进行在宿主的植物细胞或昆虫细胞中的DNA中的、在目标基因座(gene locus)位置的重组的方法(专利文献1),使用由DNA核酸内切酶和转录激活子样(TAL)效应子(其为植物病原菌黄单胞菌属所具有的DNA结合模块)连接而成的TALEN,在特定的核苷酸序列内或与其相邻的位点中切割、修饰靶基因的方法(专利文献2),或者,已报告了利用CRISPR-Cas9系统的方法,CRISPR-Cas9系统由(在真细菌、古细菌所具有的获得性免疫系统中起作用的)DNA序列CRISPR(Clustered Regularly interspaced short palindromic repeats)和与CRISPR一起具有重要作用的核酸酶Cas(CRISPR-associated)蛋白家族所组合而成(专利文献3)等。另外,最近报告了Cpf1作为CRISPR-Cas系统的新的核酸内切酶(非专利文献2)。进一步,也有报告了使用由核酸酶和PPR蛋白质所连接而成的人工核酸酶,其中,所述PPR蛋白质被构成为利用PPR基序(PPR基序可识别包括35个氨基酸的1个核酸碱基)的连续来识别特定的核苷酸序列的方式,从而在该特定序列的附近切割靶基因的方法(专利文献4)。
但是,这些基因组编辑技术基本上以基于核酸酶的DNA双链切割(double-stranded DNA breaks:DSB)为前提,但存在这样的课题:由于DSB伴随了意想不到的基因组修饰,因此存在强细胞毒性、染色体的重排等副作用,细胞存活数极其少,根据细胞种类不同,本来就难以进行基因修饰。
对于上述课题,本发明人报告了:使用了催化脱氨基反应的脱氨酶,通过将其与具有DNA序列识别能力的分子连接而成的复合体导入宿主细胞,成功地在包括酵母、大肠杆菌的各种生物种类中,不伴随DSB,而在包含特定的DNA序列的区域中进行了基于核酸碱基转变的基因组序列的修饰(专利文献5)。
但是,在如单子叶植物这样的高等植物中使用该方法的情况下,为了进一步提高导入突变效率,期望将待导入的分子复合体的构成、导入后的植物细胞的培养条件等进行进一步优化。另外,在酵母、原核生物中,如从脱氨酶的使用所预测的那样,突变方式主要为碱基取代,而插入/缺失突变的频率较低,因此,需要开发可有效地导入不同方式的突变的技术。
现有技术文献
专利文献
专利文献1:日本专利第4968498号公报
专利文献2:日本特表2013-513389号公报
专利文献3:日本特表2010-519929号公报
专利文献4:日本特开2013-128413号公报
专利文献5:国际公开第2015/133554号
非专利文献
非专利文献1:Kelvin M Esvelt,Harris H Wang(2013)Genome-scaleengineering for systems and synthetic biology,Molecular Systems Biology 9:641
非专利文献2:Bernd Zetsche et al.(2015)Cpf1Is a Single RNA-GuidedEndonuclease of a Class 2CRISPR-Cas System,Cell 163:759-771
发明内容
发明要解决的问题
因此,本发明的第1目的在于提供新型基因组编辑的方法、以及用于此目的的核酸碱基转变酶和经进一步优化的核酸序列识别模块的复合体,其不伴随DSB,即,通过不切割双链DNA或者单链切割,可有效地修饰单子叶植物的基因组基因的特定序列的核酸碱基。另外,本发明的第2目的在于提供:可在使用脱氨酶而不伴随DSB的基因组编辑中,以与碱基取代不同的方式有效地向宿主细胞导入突变的办法。
解决问题的方法
本发明人为了完成上述第1目的,首先将作为人工核酸酶的CRISPR/Cas9系统针对水稻进行最优化而成的靶向载体pZH_OsU6gRNA_MMCas9(Plant Mol Biol(2015)88:561-572)与脱氨酶进行了组合(参考图1B)。即,向上述靶向载体中的针对水稻的密码子使用而最优化的Cas9编码序列(OsCas9),导入使目标DNA双链或者一条链的切割能力失活的突变,并且使该编码序列与针对植物的密码子使用而最优化的胞苷脱氨酶编码序列(AtPmCDA)进行融合。进一步,由于植物细胞比酵母等的细胞尺寸大,所以在细胞质中合成的Cas9/脱氨酶融合蛋白的向核的转移效率可能降低的假说下,不仅在Cas9的上游、在脱氨酶的两末端也分别加上了核定位信号(NLS)。将该改良型载体导入水稻愈伤组织,结果可以将靶核苷酸序列内的目标碱基顺利取代为其它碱基。进一步,惊讶地发现,在使用目标DNA的一个链的切割能力失活的(具有切口酶活性)Cas9(D10A)的情况下,主要发生在由脱氨酶而脱氨基的碱基为中心的区域中的缺失突变。
另外,本发明人在导入突变株的选择步骤中,以比通常使用的培养温度比更低温的温度来培养基因导入后的水稻愈伤组织,结果成功地将导入突变效率进一步提高。
本发明人基于这些见解进一步反复研究,结果完成了本发明。
即,本发明如下所述。
[1]修饰单子叶植物细胞所具有的双链DNA的靶向位点的方法,其包括:使由核酸碱基转变酶、和与所选择的双链DNA中的靶核苷酸序列特异性结合的核酸序列识别模块结合而成的复合体,与该双链DNA接触,在该靶向位点中不切割的该双链DNA的至少一个链,而使该靶向位点的1个以上的核苷酸缺失或转换为其它1个以上的核苷酸,或者向该靶向位点插入1个以上的核苷酸的步骤,其中,该双链DNA与该复合体的接触通过向该单子叶植物细胞导入编码该复合体的核酸,培养该单子叶植物细胞而使该复合体在细胞内表达来进行。
[2]上述[1]所述的方法,其中,上述培养步骤中的至少一部分在与该单子叶植物细胞的最适培养温度比更低温的温度下进行。
[3]上述[1]或[2]所述的方法,其中,上述核酸序列识别模块选自:Cas的至少1个DNA切割能力失活的CRISPR-Cas系统、锌指基序、TAL效应子及PPR基序。
[4]上述[1]或[2]所述的方法,其中,上述核酸序列识别模块我Cas的至少1个DNA切割能力失活的CRISPR-Cas系统。
[5]上述[4]所述的方法,其中,上述核酸序列识别模块为与指导RNA形成互补链的链的相反链的切割能力失活的CRISPR-Cas系统。
[6]上述[5]所述的方法,其使靶向位点的1个以上的核苷酸缺失。
[7]上述[1]~[6]中任一项所述的方法,其中,上述核酸碱基转变酶为脱氨酶。
[8]上述[7]所述的方法,其中,上述脱氨酶为胞苷脱氨酶。
[9]上述[8]所述的方法,其中,上述胞苷脱氨酶为源自七腮鳗的PmCDA1。
[10]上述[1]~[9]中任一项所述的方法,其中,编码核酸序列识别模块及核酸碱基转变酶的核酸序列针对被子植物或者单子叶植物的密码子使用而最优化。
[11]上述[1]~[10]中任一项所述的方法,其中,在核酸序列识别模块及核酸碱基转变酶的两末端添加了核定位信号。
[12]上述[1]~[11]中任一项所述的方法,其中,单子叶植物为水稻、小麦或玉米。
[13]上述[12]所述的方法,其中,单子叶植物为水稻。
[14]核酸修饰酶复合体,其为核酸碱基转变酶和与单子叶植物细胞具有的双链DNA中的靶核苷酸序列特异性结合的核酸序列识别模块结合而成的复合体,所述核酸修饰酶复合体在该靶向位点中,不切割该双链DNA的至少一个链,该靶向位点的1个以上的核苷酸缺失或转换为其它1个以上的核苷酸,或者向该靶向位点插入1个以上的核苷酸而在该单子叶植物细胞中起作用。
[15]上述[14]所述的核酸修饰酶复合体,其中,核酸序列识别模块为Cas的至少1个DNA切割能力失活的CRISPR-Cas系统,核酸碱基转变酶为胞苷脱氨酶。
[16]上述[14]或[15]所述的核酸修饰酶复合体,其中,在核酸序列识别模块及核酸碱基转变酶的两末端添加了核定位信号。
[17]编码上述[14]~[16]中任一项所述的核酸修饰酶复合体的核酸。
[18]上述[17]所述的核酸,其中编码核酸序列识别模块及核酸碱基转变酶的核酸序列针对被子植物或者单子叶植物的密码子使用而最优化。
发明效果
根据本发明的基因组编辑技术,由于不伴随DNA双链切割因而安全性优异,且能够以较高的突变导入效率进行单子叶植物的基因修饰。
附图说明
[图1]示意地示出实施例中使用的载体质粒的结构的图。A:Target-AID评价用载体。B:Target-AID载体。
[图2]示出在导入了两种Target-AID评价用载体的水稻愈伤组织中的EGFP的表达的图。
[图3]示出通过对导入pRIT3-mEGFP和2409所得到的双重转化体的PCR分析,确认了mEGFP及hpt基因的并入的结果的图。
[图4]示出导入pRIT3-mEGFP和2409所得到的双重转化克隆No.6中的EGFP表达的图。
[图5]示出导入pRIT3-mEGFP和2409所得到的双重转化克隆No.3中的EGFP表达的图。
[图6]示出导入pRIT3-mEGFP和2409所得到的两种双重转化克隆(A及B)中的靶核苷酸序列附近的测序分析结果的图。
[图7]示出导入pRIT3-mEGFP和2409所得到的双重转化克隆No.39中的靶核苷酸序列附近的测序分析结果的图。
[图8]示出导入pRIT3-mEGFP和2408所得到的双重转化克隆No.1中的靶核苷酸序列附近的测序分析结果的图。
[图9]示出导入pRIT3-mEGFP和2408所得到的双重转化克隆No.2中的靶核苷酸序列附近的测序分析结果的图。
[图10]示出导入pRIT3-mEGFP和2408所得到的双重转化克隆No.4中的靶核苷酸序列附近的测序分析结果的图。
[图11]示出导入pRIT3-mEGFP和2408所得到的双重转化克隆No.1的亚克隆No.1D(GFP信号阴性)中的靶核苷酸序列附近的测序分析结果的图。
[图12]示出甲氧咪草烟(Imazamox)对水稻愈伤组织的有效浓度的评价的结果的图。上图为将水稻愈伤组织接芽至添加了甲氧咪草烟的培养基的当天,下图为培养28天时间之后的照片。
[图13]甲氧咪草烟抗性赋予试验中使用的野生型ALS及突变型ALS A96V的表达载体的模式图。
[图14]示出基于Target-AID的水稻ALS A96V的修饰的靶序列的图。
[图15]示出基于Target-AID的水稻ALS基因的修饰的图。
[图16]是基于Target-AID的水稻ALS A96V修饰愈伤组织进行再分化而成的T0植物体的照片。
[图17]示出由基于Target-AID的水稻ALS A96V修饰愈伤组织进行再分化而成的T0植物体,保持了与原始的愈伤组织相同的ALS基因修饰的图。
[图18]示出基于Target-AID的多个基因的同时修饰的图。
具体实施方式
本发明提供不切割单子叶植物细胞内的待修饰的双链DNA,通过将该双链DNA中的靶核苷酸序列及其附近的核苷酸转换为其它核苷酸等,从而修饰该双链DNA的该靶向位点的方法(以下也称为“本发明的方法”)。该方法包括:通过使由核酸碱基转变酶和与该双链DNA中的靶核苷酸序列进行特异性结合的核酸序列识别模块结合而成的复合体在宿主单子叶植物细胞内与该双链DNA接触,而使该靶向位点(即,靶核苷酸序列及其附近的核苷酸)转换为其它核苷酸等的步骤。
对在本发明的方法中可使用的单子叶植物没有特别的限制,例如:水稻、小麦、玉米、大麦、黑麦等谷物类,百合等园艺植物,更优选为水稻、小麦、玉米,特别优选为水稻。
在本发明中,双链DNA的“修饰”是指使DNA链上具有的核苷酸(例如:dC)缺失或转换为其它核苷酸(例如:dT、dA或dG),或者向DNA链上具有的核苷酸之间插入核苷酸或者核苷酸序列。这里,对待修饰的双链DNA而言,只要是宿主细胞内存在的双链DNA即可,没有特别限制,优选为基因组DNA、特别是核基因组DNA。另外,双链DNA的“靶向位点”是指,核酸序列识别模块可特异性识别并结合的“靶核苷酸序列”的全部或者一部分,或指该靶核苷酸序列的附近(5'上游及3'下游的任意一种或两种)。另外,“靶核苷酸序列”是指双链DNA中的核酸序列识别模块可结合的序列。
在本发明中“核酸序列识别模块”是指具有特异性识别并结合DNA链上的特定的核苷酸序列(即靶核苷酸序列)的能力的分子或分子复合体。核酸序列识别模块可以通过与靶核苷酸序列结合,使与该模块连接的核酸碱基转变酶在双链DNA的靶向位点发挥特异性的作用。
在本发明中,“核酸碱基转变酶”是指,可以通过催化DNA碱基的嘌呤或嘧啶环上的取代基转换为其它基团或原子的反应,而不切割DNA链从而将靶核苷酸转换为其它核苷酸的酶。
在本发明中,“核酸修饰酶复合体”是指,包含由上述核酸序列识别模块和核酸碱基转变酶连接而成的复合体,赋予了特定的核苷酸序列识别能力的具有核酸碱基转变酶活性的分子复合体。在此,“复合体”不仅包括由多个分子构成的形式,也包括像融合蛋白那样在单个分子内具有核酸序列识别模块和核酸碱基转变酶的形式。
就用于本发明的方法的核酸碱基转变酶而言,只要可以催化上述反应即可,没有特别限制,可列举例如:催化氨基转换为羰基的脱氨基反应的,属于核酸/核苷酸脱氨酶超家族的脱氨酶。可列举优选:可以将胞嘧啶或5-甲基胞嘧啶分别转换为尿嘧啶或胸腺嘧啶的胞苷脱氨酶,可以将腺嘌呤转换为次黄嘌呤的腺苷脱氨酶,可以将鸟嘌呤转换为黄嘌呤的鸟苷脱氨酶等。作为胞苷脱氨酶,更优选可列举活化诱导的胞苷脱氨酶(以下也称为AID)等,其为在脊椎动物的获得性免疫中在免疫球蛋白基因中导入突变的酶。
对核酸碱基转变酶的来源没有特别限制,例如,只要是胞苷脱氨酶即可,可以使用源自七腮鳗的PmCDA1(Petromyzon marinus cytosine deaminase1)、源自脊椎动物(例如:人、猪、牛、犬、黑猩猩等哺乳动物,鸡等鸟类,非洲爪蟾(Xenopus laevis)等两栖类,斑马鱼、香鱼、布氏鲶鱼等鱼类等)的AID(激活诱导的胞苷脱氨酶,Activation-inducedcytidine deaminase;AICDA)。
对由本发明的核酸修饰酶复合体的核酸序列识别模块所识别的双链DNA中的靶核苷酸序列而言,只要可以与该模块特异性结合即可,没有特别限制,可以为双链DNA中的任意序列。就靶核苷酸序列的长度而言,只要足以与核酸序列识别模块进行特异性结合即可,根据单子叶植物的基因组尺寸,例如为12个核苷酸以上、优选为15个核苷酸以上、更优选为18个核苷酸以上。对长度的上限没有特别限制,优选为25个核苷酸以下,更优选为22个核苷酸以下。
作为本发明的核酸修饰酶复合体的核酸序列识别模块,可以使用例如:Cas的至少1种DNA切割能力失活的CRISPR-Cas系统(CRISPR-突变Cas)、锌指基序、TAL效应子及PPR基序等,除此以外,可以使用包含限制酶、转录因子、RNA聚合酶等可与DNA进行特异性结合的蛋白质的DNA结合结构域且不具有DNA双链切割能力的片段等,但不限于这些。优选可列举:CRISPR-突变Cas、锌指基序、TAL效应子、PPR基序等。
锌指基序为由3~6个不同的Cys2His2型锌指单元(1个手指识别约3个碱基)连接而成,可以识别9~18个碱基的靶核苷酸序列。锌指基序可以根据Modular assembly法(NatBiotechnol(2002)20:135-141)、OPEN法(Mol Cell(2008)31:294-301)、CoDA法(NatMethods(2011)8:67-69)、大肠杆菌单杂交法(Nat Biotechnol(2008)26:695-701)等公知的方法产生。对于产生锌指基序的细节,可以参照上述专利文献1。
对TAL效应子而言,其具有以约34个氨基酸作为单位的模块的重复结构,利用1个模块的第12及13个氨基酸残基(称为RVD)来确定结合稳定性和碱基特异性。由于各个模块的独立性较高,因此可以仅将模块相连来产生对靶核苷酸序列特异性的TAL效应子。TAL效应子可以由利用Open resource的产生方法(REAL法(Curr Protoc Mol Biol(2012)Chapter 12:Unit12.15)、FLASH法(Nat Biotechnol(2012)30:460-465)、Golden Gate法(Nucleic Acids Res(2011)39:e82)等)进行构建,比较简便地设计相对于靶核苷酸序列的TAL效应子。对于产生TAL效应子的细节,可以参照上述专利文献2。
构建PPR基序进而特定的核苷酸序列由PPR基序的连续识别,所述PPR基序各包含35个氨基酸并识别1个核酸碱基,且仅由每个基序的1、4和ii(-2)氨基酸识别靶向碱基。由于对基序构成没有依赖性,不受两侧的基序的干涉,因此与TAL效应子同样可以仅将PPR基序相连,来产生对靶核苷酸序列特异性的PPR蛋白质。对于产生PPR基序的细节,可以参照上述专利文献4。
另外,在使用限制酶、转录因子、RNA聚合酶等片段的情况下,由于它们的蛋白质的DNA结合结构域是众所周知的,因此可以容易地设计、构建包含该结构域且不具有DNA双链切割能力的片段。
上述任意核酸序列识别模块也可以以与上述核酸碱基转变酶的融合蛋白的形式提供,或者,也可以将SH3结构域、PDZ结构域、GK结构域、GB结构域等蛋白质结合结构域和它们的结合配偶体,分别与核酸序列识别模块和与核酸碱基转变酶融合,通过该结构域和它们的结合配偶体的相互作用而以蛋白质复合体的形式提供。或者,也可以将核酸序列识别模块与核酸碱基转变酶和与内含肽(intein)分别融合,通过各蛋白质合成后的连接(Ligation)将两者连接。
就包含核酸碱基转变酶与核酸序列识别模块结合而成的复合体(包括融合蛋白)的本发明的核酸修饰酶复合体,与双链DNA的接触而言,通过向具有目标的双链DNA(例如,核基因组DNA)的单子叶植物细胞导入编码该复合体的核酸来实施。
因此,对核酸序列识别模块与核酸碱基转变酶而言,以编码它们的融合蛋白的核酸的形式进行制备,或以使得利用结合结构域、内含肽等翻译成蛋白质之后可以在宿主细胞内形成复合体的形态,以分别编码它们的核酸的形式进行制备。在此,核酸可以为DNA也可以为RNA,优选为DNA。在为DNA时,优选为双链DNA,并以在宿主细胞内在功能性的启动子的操纵下配置的表达载体的形态提供。
由于核酸序列识别模块和核酸碱基转变酶结合而成的本发明的复合体不伴随DNA双链切割(DSB),因此,能够进行毒性较低的基因组编辑,本发明的基因修饰方法可以广泛适用于单子叶植物全体。
对编码锌指基序、TAL效应子、PPR基序等核酸序列识别模块的DNA而言,对于各模块,可以通过上述任意方法获得。对编码限制酶、转录因子、RNA聚合酶等序列识别模块的DNA而言,可以通过以下进行克隆:例如基于它们的cDNA序列信息,而合成使得覆盖编码该蛋白质的期望部分(包含DNA结合结构域的部分)的区域的寡DNA引物,并利用由产生该蛋白质的细胞制备的总RNA或者mRNA级分作为模板,通过RT-PCR法进行扩增。
编码核酸碱基转变酶的DNA也可以同样地通过以下进行克隆:基于待使用的酶的cDNA序列信息来合成寡DNA引物,使用由产生该酶的细胞制备的总RNA或者mRNA级分作为模板,通过RT-PCR法进行扩增。例如,就编码七腮鳗的PmCDA1的DNA而言,可以基于NCBI数据库中登记的cDNA序列(登记号.EF094822),针对CDS的上游及下游设计适当的引物,从源自七腮鳗的mRNA通过RT-PCR法进行克隆。另外,就编码人AID的DNA而言,可以基于NCBI数据库登记的cDNA序列(登记号.AB040431),针对CDS的上游及下游设计适当的引物,例如从源自人淋巴结的mRNA通过RT-PCR法进行克隆。其它源自脊椎动物的AID同源也可以基于公知的cDNA序列信息(例如:猪(登记号.CU582981)、牛(登记号.NM_110138682)、犬(登记号.NM_001003380)、黑猩猩(登记号.NM_001071809)、鸡(登记号.NM_001243222)、非洲爪蟾(登记号.NM_001095712)、斑马鱼(登记号.AAI62573)、香鱼(登记号.AB619797)、布氏鲶鱼(登记号.NM_001200185)等),与上述同样地进行而克隆。
经克隆的DNA可以直接或根据需要利用限制酶进行消化,或在加上适当的接头和/或核定位信号(在目标的双链DNA为线粒体、叶绿体DNA时,为各细胞器定位信号)之后,与编码核酸序列识别模块的DNA进行连接,来制备编码融合蛋白的DNA。在优选实施方式中,优选在编码核酸序列识别模块的DNA和编码核酸碱基转变酶的DNA这两者的两末端,加上编码核定位信号等细胞器定位信号的DNA序列。由于单子叶植物细胞的尺寸大于酵母细胞,因此合成蛋白质的细胞质与核之间的距离变大。因此,对于如核酸碱基转变酶与核酸序列识别模块的复合体这样的分子量较大的蛋白质分子有效地输送至核,优选在核酸序列识别模块和核酸碱基转变酶的两者均加上核定位信号。在将核酸碱基转变酶与核酸序列识别模块以融合蛋白的形式表达的情况下,可以在融合蛋白的两末端、和核酸序列识别模块与核酸碱基转变酶之间加上核定位信号。作为核定位信号,只要可以在单子叶植物中起作用即可,没有特别的限制,可列举例如源自SV40的核定位信号(PKKKRKV;SEQ ID NO:6)。
或者,编码核酸序列识别模块的DNA和编码核酸碱基转变酶的DNA可以分别与编码结合结构域或其的结合配偶体的DNA进行融合,或也可以通过使两种DNA与编码分离内含肽的DNA进行融合,从而使得核酸序列识别转变模块和核酸碱基转变酶在宿主细胞内翻译后再形成复合体。在这些情况下,也可以根据需要在一方或双方DNA的适当的位置连接接头及/或核定位信号。
对编码核酸序列识别模块的DNA和编码核酸碱基转变酶的DNA而言,可以化学合成DNA链,或者也可以通过将合成的部分重叠的寡DNA短链利用PCR法、Gibson Assembly法进行连接,从而构建编码其全长的DNA。利用化学合成或PCR法或者Gibson Assembly法的组合来构建全长DNA的优点在于,可以在整个CDS全长上设计与待导入该DNA的宿主配合的使用密码子。在表达异种DNA时,通过将该DNA序列转换为在宿主生物中使用频率较高的密码子,可以期待使蛋白质表达量增大。就待使用的宿主中的密码子使用频率的数据而言,可以使用例如在(公财)Kazusa DNA研究所的主页上公开的遗传密码使用频率数据库(http://www.kazusa.or.jp/codon/index.html),也可以参照记载了各宿主中的密码子的使用频率的文献。只要参照取得的数据和准备导入的DNA序列,将该DNA序列中使用的密码子中的在宿主中使用频率较低的密码子,转换为编码同一氨基酸且使用频率较高的密码子即可。例如,在宿主细胞为水稻细胞的情况下,可以使用针对水稻等单子叶植物,或者拟南芥等被子植物的一般的密码子使用而最优化的核酸序列识别模块和/或编码核酸碱基转变酶的序列。例如,作为具有适于在被子植物中的表达的密码子使用的PmCDA1DNA,可列举具有以SEQID NO:1表示的核苷酸序列的DNA。
含有编码核酸序列识别模块和/或核酸碱基转变酶的DNA的表达载体,例如可以通过以下制造:在包含在单子叶植物细胞中可发挥作用的启动子的载体中,将该DNA连接于该启动子的下游。
作为在单子叶植物细胞中可复制的载体,只要是具有在单子叶植物细胞中起作用的复制起点(例如,Ti质粒、Ri质粒的ori等)的那些即可,没有特别的限制,优选也具有大肠杆菌的复制起点(例如,ColE1ori等)。在作为基因导入法使用了农杆菌法的情况,需要进一步包含Ti质粒、Ri质粒的已除去致病性基因的T-DNA片段(包括边界序列RB及LB),可列举例如:源自pBIN193的pBI101、pBI121(Clontech)、以它们为骨架的改良型载体(例如,pRI909、pRI910、pRI101、pRI201(TAKARABio)等),但不限于这些。
作为启动子,只要是在单子叶植物细胞中可发挥作用的启动子即可,可以是任意启动子。由于伴随DSB的常规法有毒性,因此宿主细胞的生存率可能显著降低,所以优选在使用诱导启动子(例如,被受伤、水杨酸处理所诱导的PR1α基因启动子,被干燥、低温、脱落酸处理所诱导的rd29A基因启动子、被二氯丙烯胺(dichlormid)处理所诱导的GST-27基因启动子等)事先增加细胞数量至开始诱导为止,但本发明的核酸修饰酶复合体即使表达也可得到充分的细胞增殖,所以可以不限制地使用构成启动子。作为构成启动子,可列举花椰菜花叶病毒(cauliflower mosaic virus)(CaMV)35S启动子、CaMV19S启动子、胭脂碱合成酶(nopaline synthetase)(NOS)启动子、源自欧芹的泛素启动子(Pcubi4-2)等。也可以使用这些启动子或其片段串联相连而成的片段(例如,2x35S)。
在表达载体中,可以根据需要含有终止子(例如,NOS终止子、豌豆rbcS3A终止子、热休克蛋白质(HSP)17.3终止子等),翻译增强子(例如,源自水稻的醇脱氢酶5'非翻译区(Os ADH-5'UTR)、CaMV、源自烟草花叶病毒(TMV)的Ω序列等),3'调节区(例如,源自水稻的肌动蛋白基因(Act1)3'UTR等),polyA加成信号,药物抗性基因(例如,G418抗性基因(nPtII),潮霉素抗性基因(hpt)等)选择标记等。
编码核酸序列识别模块和/或核酸碱基转变酶的RNA可以通过例如以下制备:以编码上述核酸序列识别模块和/或核酸碱基转变酶的DNA编码的载体作为模板,通过本身公知的体外转录系统转录为mRNA。
可以通过将包含编码核酸序列识别模块及/或核酸碱基转变酶的DNA表达载体导入宿主单子叶植物细胞,并培养该宿主细胞,从而使核酸碱基转变酶与核酸序列识别模块的复合体在细胞内表达。
对作为宿主的单子叶植物细胞而言,可以使用例如:从水稻、小麦、玉米、大麦、黑麦等谷物,百合等花卉园艺植物等制备的悬浮培养细胞、愈伤组织、原生质体、叶切片、根切片、种子(不成熟的胚等)等。
单子叶植物细胞可以为单倍体(一倍体)、也可以为多倍体(例如,二倍体、三倍体、四倍体等)。在常规的突变导入方法中,作为原则仅向同源染色体的一条中导入突变而形成杂合基因型,因此,如果不是优势突变,就不会表达需要的特性,而纯合化耗时耗力,大多情况不方便。与此相对,根据本发明,由于存在可以对基因组内的同源染色体上的等位基因全部导入突变的可能性,所以即使为劣势突变,也可以在该代中表达期望的表现,可克服常规法的问题。
表达载体的导入可以根据单子叶植物的种类,相对于适当的组织(例如,愈伤组织、根、叶、种子、生长点等),依照公知的方法(例如:农杆菌法、PEG法、电穿孔法、粒子枪法等)实施。例如,在为水稻的情况下,通常可以使用农杆菌法、Whisker直接导入法等,但不限于这些。例如,在农杆菌法的情况下,依照常规方法从水稻种子诱导愈伤组织,使该愈伤组织感染已导入农杆菌表达用载体的农杆菌,3天后进行灭菌,其中,在所述农杆菌表达用载体的T-DNA片段中,内置了编码核酸序列识别模块和/或核酸碱基转变酶的DNA的表达盒。另一方面,在Whisker直接导入法的情况下,将表达载体与多聚鸟氨酸进行混合而制成复合体后,与钛酸钾制成的Whisker一起添加至水稻愈伤组织并混合,之后进行超声波处理。
在为小麦、玉米的情况下,可以例如将从不成熟的种子收集的不成熟的胚作为植物材料,同样地使用农杆菌法导入表达载体。
在使用PEG法、电穿孔法的情况下,从适当的细胞、组织依照常规方法制备原生质体,向其导入表达载体。在粒子枪法的情况下,可以使用粒子枪对愈伤组织、不成熟的胚、存在于茎尖、腋芽的生长点等,导入吸附于金微粒的表达载体。
在粒子枪法、农杆菌法中,基因导入大多情况为嵌合,所以为了进行转化需要使用向生殖系列(germ line)的细胞高频率地导入了上述核酸的试样细胞。可列举例如:胚、胚轴切片、胚形成愈伤组织(embryogenic callus),分离的生长点等。
导入了载体的单子叶植物细胞的培养,可以根据其种类依照公知的方法实施。作为用于培养的培养基,优选为固态培养基(例如,琼脂培养基、琼脂糖培养基、结冷胶培养基等)。另外,培养基优选含有转化体的生长所必需的碳源、氮源、无机物等。例如,作为基础培养基,可以使用N6培养基、MS培养基、LS培养基、B5培养基等。也可以在培养基中适当添加植物生长物质(例如,生长素类、细胞分裂素类等)等。培养基的pH优选为约5~约8。培养温度可以根据单子叶植物细胞的种类,在通常约20℃~约35℃的范围内适当选择。例如,在为水稻愈伤组织的情况下,可以通常在28~33℃、优选在30~33℃中培养。
如上所述操作,可以在细胞内表达核酸序列识别模块和核酸碱基转变酶的复合体,即核酸修饰酶复合体。
稳定地表达导入的核酸碱基转变酶与核酸序列识别模块的转化体的选择可以通过以下进行:在添加了与导入的表达载体中包含的选择标记基因(例如,nptII、hpt等药物抗性基因)相对应的药品的培养基上,培养单子叶植物细胞,并选择药物抗性菌落。对选择培养的时期没有特别限制,通常在3-6周左右出现药物抗性菌落。
在可以可视化目标导入突变的情况下,也可以例如,在通过该导入突变而赋予单子叶植物细胞以药物抗性,对产生色素的能力发生变化的情况下,不进行使用选择标记的初步筛选,而是以基于目标导入突变的特质的变化作为指标,直接选择该导入突变株。
转化体可以根据适于其培养的本身公知的方法进行传代培养。例如,可以使用与上述转化体的选择培养中所使用的同样的方法。这里,可以通过将转化体在比通常更低的温度(例如,在为水稻愈伤组织的情况下为20-26℃、优选为约25℃)中培养,使导入突变效率升高。虽然不愿以任何理论来进行限制,但作为1种解释,作为本发明中的优选核酸碱基转变酶之一的PmCDA1,源自于変温动物七腮鳗,因此对PmCDA1的酶活性的最适温度而言,存在比普通酶的最适温度(约37℃)更低的可能性,因此,可考虑通过低温培养增大酶活性。因此,在本发明的优选一实施方式中,作为核酸碱基转变酶使用了PmCDA1,并且将导入了编码核酸序列识别模块/PmCDA1复合体的核酸的单子叶植物细胞在低温下培养。
另外,也可以通过将转化体以比通常更高的密度条件(例如,在为水稻愈伤组织的情况下,通过使愈伤组织之间可相接程度的密度,从而限定与培养基的接触,细胞受到应激这样的条件)下进行培养,使导入突变效率升高。
是否在转化体的目标双链DNA中顺利导入突变的确认,在由于导入突变而可以可视化表现型的变化的情况下,可以通过检查表现型来进行,但最终的确认优选通过以下来进行:将包含靶核苷酸序列的目标DNA区域通过基因组PCR进行扩增,确定扩增片段的碱基序列。由于即使是1个转化体克隆,根据细胞不同,导入突变的方式也可能不同,所以例如在作为植物材料使用愈伤组织的情况下,例如可以通过重复进行以下操作而得到具有均一的导入突变方式的克隆:将转化愈伤组织悬浊于液体培养基中,并再接种至固态培养基上,对形成的亚克隆确认导入突变方式。
确认了导入突变的转化体克隆,可以根据本身公知的再分化法,使其再分化为植物体。在杂合性地导入了突变的情况下,可以通过将使得到的植物体进行自体受粉所得到的R1植物,进一步进行自体受粉而得到R2植物,从而得到纯合性导入突变的植物体。
由导入至细胞内的表达载体,表达核酸碱基转变酶与核酸序列识别模块的复合体时,该核酸序列识别模块特异性识别并结合于目标的双链DNA(例如,基因组DNA)内的靶核苷酸序列,利用连接于该核酸序列识别模块的核酸碱基转变酶的作用,在靶向位点(在靶核苷酸序列的全部或者一部分或它们的附近)的有义链或者反义链发生碱基转变,在双链DNA内发生错配(例如,在将PmCDA1、AID等胞苷脱氨酶作为核酸碱基转变酶使用的情况下,靶向位点的有义链或者反义链上的胞嘧啶被转换为尿嘧啶,发生U:G或者G:U错配)。该错配未被正确修复,而修复使得相反链的碱基与转换后的链的碱基成对(上述例子中,为T-A或者A-T),或修复时进一步取代为其它核苷酸(例如:U→A、G),或者发生1个~数十个碱基的缺失或者插入,由此导入了各种突变。
对锌指基序而言,由于与靶核苷酸序列特异性结合的锌指的产生效率不高,另外,结合特异性高的锌指的筛选较为复杂,因此,产生多个实际发挥作用的锌指基序并不容易。就TAL效应子、PPR基序而言,比锌指基序的靶核酸序列识别的自由度高,但需要每次根据靶核苷酸序列设计并构建巨大的蛋白质,因此在效率方面存在问题。
与此相对,由于CRISPR-Cas系统是通过相对于与靶核苷酸序列互补的指导RNA来识别目标的双链DNA的序列,因此可以仅通过合成可与靶核苷酸序列形成特异性的杂合的寡DNA,而将任意序列靶向化。
因此,在本发明的更优选的实施方式中,作为核酸序列识别模块,可以使用Cas效应子蛋白质的至少1个DNA切割能力失活的CRISPR-Cas系统(CRISPR-突变Cas)。
使用了CRISPR-突变Cas的本发明的核酸序列识别模块,是以包含与靶核苷酸序列互补的序列的CRISPR-RNA(crRNA)、(根据需要)trans-activating RNA(tracrRNA)、与突变Cas效应子蛋白质的复合体的形式提供的,其中,tracrRNA为在突变Cas效应子蛋白质的募集中所需要(在需要tracrRNA时,可以以与crRNA的嵌合RNA形式来提供)。将与突变Cas效应子蛋白质进行组合而构成核酸序列识别模块的、仅包括crRNA或者包括crRNA与tracrRNA的嵌合RNA的RNA分子总称为“指导RNA”。
本发明使用的Cas效应子蛋白质,只要与指导RNA形成复合体,可识别并结合靶基因中的靶核苷酸序列和与其相邻的protospacer adjacent motif(PAM)即可,没有特别限制、优选为Cas9或Cpf1。作为Cas9,可列举例如:源自化脓性链球菌(Streptococcuspyogenes)的Cas9(SpCas9;PAM序列NGG(N为A、G、T或C。以下相同))、源自嗜热链球菌(Streptococcus thermophilus)的Cas9(StCas9;PAM序列NNAGAAW)、源自脑膜炎奈瑟菌(Neisseria meningitidis)的Cas9(MmCas9;PAM序列NNNNGATT)等,但不限于这些。优选为基于PAM的限制较少的SpCas9(实质上为2个碱基,理论上可以靶向于基因组上的基本所有位置)。另外,作为Cpf1,可列举例如:源自土拉热弗朗西丝菌(Francisella novicida)的Cpf1(FnCpf1;PAM序列NTT)、源自氨基酸球菌属种(Acidaminococcus sp.)的Cpf1(AsCpf1;PAM序列NTTT)、源自毛螺菌科的细菌(Lachnospiraceae bacterium)的Cpf1(LbCpf1;PAM序列NTTT)等,但不限于这些。作为本发明中使用的突变Cas效应子蛋白质(有时简称为突变Cas),能够使用Cas效应子蛋白质的双链DNA的两条链的切割能力失活的那些,和具有仅一条链的切割能力失活的切口酶活性的那些中的任意。例如,在为SpCas9的情况下,可以使用将第10位的Asp残基转换为Ala残基,欠缺与指导RNA形成互补链的链的相反链的切割能力(因此,具有针对与指导RNA形成互补链的链的切口酶活性)的D10A突变体,或者将第840位的His残基转换为Ala残基,欠缺与指导RNA形成互补链的链的切割能力(因此,具有针对与指导RNA形成互补链的链的相反链的切口酶活性)的H840A突变体,进一步及其双重突变体(dCas9)。另外,在为FnCpf1的情况下,可以使用将第917位的Asp残基转换为Ala残基(D917A)、或者将第1006位的Glu残基转换为Ala残基(E1006A)的,欠缺两条链的切割能力的突变体。只要欠缺对双链DNA的至少一条链的切割能力即可,也同样可以使用其它突变Cas。
对核酸碱基转变酶而言,通过与上述锌指等之间的连接方式相同的方法,以突变Cas的复合体的形式提供。或者,核酸碱基转变酶和突变Cas也可以利用RNA适体的MS2F6、PP7等、由它们的结合蛋白质构成的RNA支架进行结合。指导RNA中的靶向序列与靶核苷酸序列形成互补链,指导RNA中的其它区域(即,crRNA中的除了靶向序列以外的序列,或者与crRNA连续的tracrRNA)募集突变Cas而识别PAM,不切割一方或者两者的DNA,利用连接于突变Cas的核酸碱基转变酶的作用,使靶向位点(可以在靶核苷酸序列的全部或者一部分包含的几百个碱基的范围内适当调节)发生碱基转变,在双链DNA内发生错配。该错配未被正确修复,而修复使得相反链的碱基与转换后的链的碱基成对,或修复时进一步转换为其它核苷酸,发生1个~数十个碱基缺失或者插入由此导入了各种突变。
在将CRISPR-突变Cas用作核酸序列识别模块的情况下,也与将锌指等作为核酸序列识别模块的情况相同地,核酸序列识别模块和核酸碱基转变酶,以编码它们的核酸(优选为DNA)的形态,导入具有目标的双链DNA单子叶植物细胞。
对编码Cas效应子蛋白质(例如,Cas9、Cpf1)的DNA而言,可以根据与编码核酸碱基转变酶的DNA的上述的同样的方法,从产生该酶的细胞进行克隆。另外,突变Cas可以通过以下获得:在编码克隆的Cas的DNA中,使用本身公知的位点特异性的突变诱发法,以将对DNA切割活性重要的位点的氨基酸残基(例如:在为SpCas9的情况下,可列举第10位的Asp残基、第840位的His残基,在为FnCpf1的情况下,可列举第917位的Asp残基、第1006位的Glu残基等,但不限于这些)转换为其它氨基酸的方式导入突变。
或者,对编码突变Cas的DNA而言,也可以针对编码核酸序列识别模块的DNA、编码核酸碱基转变酶的DNA,通过与上述相同的方法和化学合成或PCR法或者Gibson Assembly法的组合,构建具有适于使用的宿主单子叶植物细胞的表达的密码子使用的DNA形式。例如,作为具有适于在水稻中的表达的密码子使用的SpCas9DNA,可列举具有以SEQ ID NO:3表示的核苷酸序列的DNA。
对编码突变Cas的DNA和编码核酸碱基转变酶的DNA而言,可以连接使得以融合蛋白的形式表达,也可以设计成使得使用结合结构域、内含肽等分别进行表达,并通过蛋白质间相互作用、蛋白质连接而在宿主细胞内形成复合体。在以上任一种情况下,均对编码突变Cas的DNA和编码核酸碱基转变酶的DNA而言,优选在各自的两末端加上编码在单子叶植物细胞中可发挥作用的核定位信号(NLS)的序列(例如,源自SV40的NLS编码序列;SEQ ID NO:5)。在突变Cas和核酸碱基转变酶以融合蛋白的形式表达的情况下,可以在一个蛋白质的C末端和另一个蛋白质的N末端作为添加的NLS而共有1个NLS序列。在对于真核细胞适用CRISPR-Cas技术的情况下,为了改善Cas效应子蛋白质的核定位的效率而加上NLS为传统方法,由于基于本发明是以突变Cas与核酸碱基转变酶的复合体形式进行表达,因此分子量变大,在将尺寸大于本发明人等先前报告的酵母细胞的单子叶植物细胞用作宿主的情况下,存在该复合体的核定位的效率降低的可能性。因此,本发明人为了改善该复合体的核定位效率,构思在突变Cas效应子蛋白质和核酸碱基转变酶的各两末端加上NLS,由此即使是在单子叶植物细胞中,也成功地使用本发明的基因组编辑技术而得到较高的导入突变效率。
得到的编码突变Cas和/或核酸碱基转变酶的DNA可以插入于与上述相同的表达载体的启动子的下游,例如:CaMV35S启动子、CaMV19S启动子、NOS启动子、Pcubi4-2启动子、2x35S启动子等。在表达载体中,如上所述,可以根据需要含有:终止子(例如,NOS终止子、豌豆rbcS3A终止子、热休克蛋白质(HSP)17.3终止子等),翻译增强子(例如,源自水稻的醇脱氢酶5'非翻译区(Os ADH-5'UTR)、CaMV、源自烟草花叶病毒(TMV)的Ω序列等),3'调节区(例如,源自水稻的肌动蛋白基因(Act1)3'UTR等),polyA加成信号,药物抗性基因(例如,G418抗性基因(nPtII)、潮霉素抗性基因(hpt)等)的选择标记等。在优选的实施方式中,为了提高在单子叶植物细胞中的翻译效率,可以将Os ADH-5'UTR插入启动子和编码突变Cas和/或核酸碱基转变酶的DNA之间。
另一方面,编码指导RNA的DNA可以通过设计(1)或(2)而使用DNA/RNA合成仪进行化学合成:(1)包含与靶核苷酸序列的“目标链(targeted strand)”互补的核苷酸序列(也称为“靶向序列(targeting sequence)”)的crRNA序列(例如,在作为Cas效应子蛋白质募集FnCpf1时,可使用在靶向序列的5'侧包括AAUUUCUACUGUUGUAGAU(SEQ ID NO:7;下划线部的序列之间形成碱基对而形成茎-环结构)的crRNA)的编码序列;(2)将crRNA编码序列根据需要与已知的tracrRNA编码序列(例如,作为作为Cas效应子蛋白质募集Cas9时的tracrRNA编码序列,为gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtggtgctttt;SEQ ID NO:8)连接而成的寡DNA序列。
在此“目标链”是指与靶核苷酸序列的crRNA杂交的链,将其的相反链而通过目标链与crRNA的杂交而成为一条链状的链称为“非目标链(non-targeted strand)”。另外,由于推定核酸碱基转换反应通常大多情况在已成为一条链状的非目标链上发生,所以在将靶核苷酸序列以一条链的形式表现时(例如在标记PAM序列时,表示靶核苷酸序列与PAM的位置关系时等),用非目标链的序列进行代表。
对靶向序列的长度而言,只要是可相对于靶核苷酸序列特异性结合即可,没有特别限制,例如为15~30个核苷酸、优选为18~25个核苷酸。靶核苷酸序列的选择受到该序列的3'侧(在Cas9的情况下)或者5'侧(在Cpf1的情况下)相邻的PAM的存在所限制,根据酵母等中的见解,在将CRISPR-突变Cas9与胞苷脱氨酶进行组合的本发明的系统中,不论靶核苷酸序列的长度如何,也存在容易对位于其从5'端向3'方向7个核苷酸以内的位置的C进行取代的规律性,所以可以通过适当选择靶核苷酸序列(作为其互补链的靶向序列)的长度,而使可导入突变碱基的位点移位。由此,可以至少部分解除基于PAM(在SpCas9中为NGG)的限制,进一步提高导入突变的自由度。
靶向序列的设计可以例如通过以下进行:在作为Cas效应子蛋白质使用Cas9的情况下,使用公开的指导RNA设计网站(CRISPR Design Tool,CRISPRdirect等),从靶基因的CDS序列中列表出与PAM(例如:在为SpCas9的情况下,为NGG)在3'侧相邻的20mer序列,在将其从5'端向3'方向7个核苷酸以内的C转换为T的情况下,选择使得靶基因所编码的蛋白质发生氨基酸变化的序列。进一步,在使靶向序列的长度在例如18~25个核苷酸的范围中变化的情况下,同理选择存在从其5'端向3'方向7个核苷酸以内的通过变为T的碱基转变而发生氨基酸变化的C的序列。可以从这些候选中,将目标的单子叶植物基因组中脱靶位点数量较少的候选序列用作靶向序列。在使用的指导RNA设计软件中没有检索单子叶植物基因组的脱靶位点的功能的情况下,例如可以通过针对候选序列的3'侧的8~12个核苷酸(靶核苷酸序列的识别能力高的seed序列),对作为宿主的单子叶植物基因组进行Blast检索来检索脱靶位点。
编码指导RNA的DNA也可以插入至与上述相同的表达载体,作为启动子,优选使用pol III类的启动子(例如,SNR6、SNR52、SCR1、RPR1、U3、U6、H1启动子等)及终止子(例如,polyT序列(T6序列等))。例如,在宿主细胞为水稻细胞的情况下,可使用源自水稻的U6或U3启动子,更优选为U6启动子。在使用pol III类启动子的情况下,应该使得不将具有连续4个以上的T的核苷酸序列选择为靶向序列。
对编码指导RNA(crRNA或crRNA-tracrRNA嵌合)的DNA而言,可以设计与靶核苷酸序列的目标链互补的序列与已知的tracrRNA序列(募集Cas9时)或crRNA的直接重复序列(募集Cpf1时)连接而成的寡RNA序列,并使用DNA/RNA合成仪进行化学合成。
编码突变Cas和/或核酸碱基转变酶的DNA、编码指导RNA(crRNA或crRNA-tracrRNA嵌合)的DNA可以根据宿主单子叶植物细胞,而利用与上述同样的方法导入细胞。稳定表达突变Cas及核酸碱基转变酶的转化体的选择、对所选择的转化体的保持培养(maintenanceculture),也可以与上述同样操作而进行。
在常规型的人工核酸酶中,由于伴随DNA双链切割(DSB),因此,对基因组内的序列进行靶向时,发生认为由染色体的无序切割(脱靶切割)而导致的增殖阻碍和细胞死亡。在本发明中,由于通过不切割DNA的对DNA碱基上的取代基的转换反应(特别是脱氨基反应)进行突变导入,因此,可以实现毒性的大幅降低。
需要说明的是,在本发明的双链DNA的修饰中,除了靶向位点(可以在包含靶核苷酸序列的全部或者一部分的几百个碱基的范围内适当调节)以外,不会妨碍该双链DNA的切割的发生。然而,考虑到本发明的最大的一个优点是避免了由脱靶切割导致的毒性,则在优选的一种实施形态中,本发明的双链DNA的修饰,不仅在选择的双链DNA的靶向位点中,在其以外的位点中也不伴随DNA链的切割。
如下文的实施例所示,在作为突变Cas使用了具有仅可切割双链DNA中的一个链的切口酶(nickase)活性的Cas9的情况下,与在使用不能切割两条链的突变Cas9的情况下的导入突变方式的倾向明显不同。如果作为突变Cas,使用了欠缺对与指导RNA形成互补链的链的相反链(非目标链)的切割能力(因此,具有对目标链的切口酶活性)的D10A突变体,则比起碱基取代,导入1至20个核苷酸左右的缺失突变的倾向更强。缺失大多情况下在以碱基取代位点(靶核苷酸序列的从5'末端向3'方向的7个核苷酸以内)为中心的区域发生,而不是在基于Cas的切割位点(PAM的上游2-3个核苷酸),另外,也存在与该缺失同时,伴随插入1或多个核苷酸的情况。虽然不愿以任何理论来进行限制,但在除去修复受到非目标链上的碱基取代的核苷酸时,在单子叶植物中,可考虑将周边的碱基也一总除去,并且以相反链(目标链)作为模板进行延长反应。此时,推测如果在目标链产生了缺口,则除去修复机制在目标链也发挥作用,变成在两条链中发生核苷酸的脱落的状态,无法进行正常的延长反应而勉强发生连接,由此结果是导致容易发生缺失突变。
另一方面,在使用不能切割两条链的突变Cas9时,导入突变方式与芽殖酵母、大肠杆菌等的情况相同,以碱基取代为主。其中,导入突变位点的范围比芽殖酵母的情况下更广泛一些,达到靶核苷酸序列的5'末端的更上游(例如:PAM序列的上游21个核苷酸)为止。虽然不愿以任何理论来进行限制,但基于上述假说,可认为由于在目标链中不产生缺口,因此以目标链为模板的延长反应正常进展,结果导致碱基取代成为主要的突变。同样地,在使用欠缺目标链的切割能力(因此,具有对非目标链的切口酶活性)的H840A突变体的情况下,推定由于以作为相反链的目标链作为模板的延长反应也正常进展,因此作为导入突变方式,以碱基取代为主。
因此,通过适当选择突变Cas的DNA链切割能力,能够向双链DNA的特定的核苷酸或核苷酸区域中对针点导入碱基取代,或者导入以碱基取代位点为中心的约20个核苷酸以内的缺失突变,也可以根据目标不同而分开使用。
本发明人另外使用芽殖酵母确认了:与以单独的核苷酸序列为靶相比,通过产生针对相邻的多个靶核苷酸序列的序列的识别模块并同时使用,导入突变效率大幅升高,在单子叶植物细胞中也可以期待同样的效果。对其效果而言,由使得两个靶核苷酸序列的一部分发生重复的情况可知,即使在两者分开600bp左右的情况下,也同样实现了突变诱导。另外,在靶核苷酸序列存在于相同方向(目标链为相同链)、以及对向(以双链DNA的两条链为目标链)的两种情况下,均可发生。
另外,也能够以完全不同位置的多个DNA区域为靶进行修饰。因此,在本发明优选的一种实施方式中,可以使用与不同的靶核苷酸序列(可以在1个靶基因内,也可以在不同的2个以上的靶基因内。)分别特异性结合的、两种以上的核酸序列识别模块。在该情况下,核酸碱基转变酶与每个这些核酸序列识别模块的1个形成核酸修饰酶复合体。在此核酸碱基转变酶为共通的东西可以使用。例如,在作为核酸序列识别模块使用CRISPR-Cas系统的情况下,可以使用与Cas效应子蛋白质和核酸碱基转变酶的复合体(融合蛋白包含)共通的那些,作为指导RNA(crRNA或crRNA-tracrRNA嵌合)可以产生并使用两种以上的嵌合RNA,所述嵌合RNA为由与不同靶核苷酸序列分别形成互补链的2种以上的crRNA,或者2种以上的crRNA每一种分别与tracrRNA形成的嵌合RNA。另一方面,在使用锌指基序、TAL效应子等作为核酸序列识别模块的情况下,例如可以将与不同的靶核苷酸特异性结合的各核酸序列识别模块,与核酸碱基转变酶进行融合。
为了使本发明的核酸修饰酶复合体在宿主细胞内表达,因此如上所述将包含编码该核酸修饰酶复合体的DNA的表达载体导入单子叶植物细胞,但为了有效地导入突变,因此优选能保持规定时期以上、规定水平以上的核酸修饰酶复合体的表达。从该观点出发,对该表达载体而言,虽然确实被组装入宿主基因组,但由于核酸修饰酶复合体的持续表达使脱靶切割的风险增大,所以优选在顺利完成导入突变后将其迅速除去。作为用于去除组装在宿主基因组中的DNA的方法,可列举使用Cre-loxP类的方法、使用转座子的方法等。
或者,通过仅在用于在期望的时期发生核酸碱基转换反应、固定靶向位点的修饰所需要的时期一过性地使本发明的核酸修饰酶复合体在宿主细胞内表达,由此避免脱靶切割的风险并且可以有效地实现宿主基因组的编辑。对用于发生核酸碱基转换反应、固定靶向位点的修饰所需要的时期而言,根据宿主细胞的种类、培养条件等而不同,但由于至少需要经过数代的细胞分裂,因此可认为需要2-3天左右。本领域技术人员可以基于使用培养条件等而适当确定优选的表达诱导期。对编码本发明的核酸修饰酶复合体的核酸的表达诱导期而言,在对宿主细胞不产生副作用,且可保持宿主细胞的再分化能力的范围,可以超出上述“固定靶位点的修饰所需要的时期”并延长。
作为将本发明的核酸修饰酶复合体在期望的时期进行一过性地表达的方法,可列举产生以能够控制表达期的形态,包含编码该核酸修饰酶复合体的核酸(在CRISPR-Cas系统中,编码指导RNA-的DNA、和编码突变Cas及核酸碱基置换酶的DNA)的构建体(表达载体),并导入单子叶植物細胞的方法。作为“能够控制表达期的形态”,具体而言,可列举将编码本发明的核酸修饰酶复合体的DNA置于诱导性的调节区的操纵下的形态。对“诱导性的调节区”没有特别限制,可列举例如:上述诱导启动子(例如,PR1α基因启动子、rd29A基因启动子、GST-27基因启动子等)。
以下,根据实施例对本发明进行说明。但是,本发明并不限于这些实施例。
实施例
1.载体构建
(1)Target-AID评价用载体的构建
利用常规方法产生了具有图1A所示的结构的pRIT3-EGFP(具有EGFP ORF;SEQ IDNO:9)和pRIT3-mEGFP(在EGFP开始密码子后直接存在终始密码子;SEQ ID NO:10)。
(2)Target-AID载体的构建
通过以下产生了具有图1B所示的结构的Target-AID载体2408(编码dCas9的;SEQID NO:11)和2409(编码D10A突变体的;SEQ ID NO:12):将pZH_OsU6gRNA_MMCas9(PlantMol Biol(2015)88:561-572)的OS Opt.Cas9取代为编码(具有H840A及D10A的双重突变、或仅D10A突变的)突变Cas9的DNA,在其下游在两末端加上了编码源自SV40的核定位信号(NLS)的序列,并使其与编码针对拟南芥的密码子使用而最优化的PmCDA1的DNA融合。
2.向农杆菌细菌导入Target-AID及评价用载体
将作为Target-AID载体的2408和2409(图1B)、作为评价用载体的pRIT3-EGFP和pRIT3-mEGFP(图1A),通过电穿孔(Bio Rad公司MicroPulser电穿孔系统)导入农杆菌细菌(根癌土壤杆菌(Agrobacterium tumefaciens)EHA101株)。
首先,以下述的顺序进行了农杆菌细菌的感受态细胞的产生。
将农杆菌菌株涂布于YEB琼脂培养基(牛肉提取物5g/L、酵母提取物1g/L、Bacto蛋白胨1g/L、蔗糖5g/L、MgSO42mM、Bacto琼脂12g(1.2%)),于28℃、暗处培养2天时间。将得到的单一菌落接菌至YEB液体培养基5mL后,于28℃、暗处振荡培养12小时,将悬浊液200μL加入200mL的YEB液体培养基,于28℃、暗处进行振荡培养,增殖至OD600=0.2-0.4。然后将菌体进行离心(3000rpm,4℃、10分钟)收集细菌,悬浊于20mL的10mM HEPES(pH 8.0),重复离心2-3次。将通过离心回收的菌体悬浊于灭菌的10%丙三醇水溶液2mL,制成了感受态细胞。下面,以后述的顺序将各载体导入农杆菌。将各载体以1μg/μL的浓度溶解于灭菌水,与上述的农杆菌细菌悬浊液50μL混合,移至微脉冲比色皿(0.1cm间隙,BioRad公司)进行了电穿孔(2.2kV,5.8ms)。然后,向该液体添加800μL的YEB液体培养基,于28℃、暗处2小时振荡培养,涂布于包含100mg/L大观霉素的YEB琼脂培养基,于28℃、暗处培养36~48小时。将得到的细菌菌落在包含100mg/L大观霉素的YEB液体培养基5mL中增殖,以丙三醇(最终浓度35%)储存液形式移液至微管,于-80℃保存。
3.将Target-AID评价用载体导入水稻培养细胞
水稻的转化基本依照Terada等的方法(Terada,R.,Urawa,H.,Inagaki,Y.,Tsugane,K.,and Iida,S.(2002)Efficient gene targeting by homologousrecombination in rice.Nat.Biotechnol.20,1030-1034)进行。
3-1.准备转化用的水稻愈伤组织
摘除约100粒水稻(Oryza sativa.L Japonica品种;日本晴)的种子的稻壳,在70%乙醇中振荡1分钟后,在2.5%次氯酸钠中浸渍20-30分钟进行灭菌。之后,用灭菌用水涮洗,接芽于2N6培养基(N6培养基用混合盐(Sigma-Aldrich公司)4.0g/L、酪蛋白氨基酸300mg/L、肌肉肌醇100mg/L、烟酸0.5mg/L、吡哆醇盐酸盐0.5mg/L、盐酸硫胺0.5mg/L、L-脯氨酸2878mg/L、蔗糖30.0g/L、2,4-D(2,4-二氯苯氧乙酸)2mg/L、Gelrite 4.0g/L、pH 5.8)上,于暗处、31.5℃培养3周,诱导成源自胚盘细胞的去分化细胞团块(愈伤组织)。之后,每1个月选择细胞分裂活性高的愈伤组织进行传代培养,将从培养开始经历4个月的愈伤组织用于转化。
3-2.准备转化用的农杆菌细菌
在冰上溶解导入了Target-AID评价用载体的各农杆菌菌液,将其中300μL涂布于添加了100mg/L大观霉素的AB培养基(NH4Cl 1g/L、MgSO4·7H2O 3g/L、KCl 0.15g/L、CaCl2·2H2O 0.012g/L、FeSO4·7H2O 0.0025g/L、K2HPO43g/L、NaH2PO4·H2O 1.15g/L、蔗糖5.5g/L、琼脂糖6.0g/L、pH 7.2),于28℃、暗处培养3天时间。之后,将增殖的农杆菌细菌悬浊于添加了40mg/L的乙酰丁香酮(3',5'-二甲氧基-4'-羟基-苯乙酮)的AAI液体培养基(MgSO4·7H2O 5g/L、CaCl2·2H2O 1.5g/L、NaH2PO4·H2O 1.5g/L、KCl 29.5g/L、MnSO4·4H2O10g/L、ZnSO4·7H2O 2g/L、H3BO33g/L、KI 0.75g/L、Na2MoO4·2H2O 0.25g/L、CoCl2·6H2O25mg/L、CuSO4·5H2O 25mg/L、FeSO4·7H2O 13.9g/L、Na2EDTA 18.7g/L、肌肉肌醇100mg/L、盐酸硫胺0.01g/L、烟酸1mg/L、吡哆醇盐酸盐1mg/L)于25℃振荡培养2小时。将该悬浊液用包含40mg/ml的乙酰丁香酮的AAI液体培养基进行稀释,制备了为OD600=0.008的悬浊液120ml。
3-3.pRIT3-EGFP、pRIT3-mEGFP导入水稻愈伤组织(农杆菌细菌接种、共存培养、灭 菌、水稻重组体愈伤组织选择)
将水稻愈伤组织约5g收集于灭菌的玻璃烧杯,加入导入了各载体的农杆菌细菌悬浊液(上述),振荡3-5分钟同时进行接种。将悬浊液用不锈钢网(接缝开口1.5mm)过滤,除去多余的农杆菌细菌。然后,在2N6共存培养基(N6培养基用混合盐(Sigma公司制)4.0g/L、酪蛋白氨基酸300mg/L、肌肉肌醇100mg/L、烟酸0.5mg/L、吡哆醇盐酸盐0.5mg/L、盐酸硫胺0.5mg/L、蔗糖30.0g/L、葡萄糖10g/L、2,4-D 2mg/L、Gelrite 4.0g/L、乙酰丁香酮40mg/L,pH 5.2)上铺上灭菌滤纸,在其上用镊子以等间隔排列愈伤组织,于25℃、暗处共存培养3天时间。之后,为了将共存培养后的愈伤组织进行农杆菌细菌灭菌,将愈伤组织收集于500ml的烧杯,使用灭菌液1(包含万古霉素200mg/L、Tween2020μl/L的灭菌水)300ml,在搅拌的同时洗涤30分钟。之后,将愈伤组织收集于不锈钢网,用纸巾除去愈伤组织周边的水分后,使用灭菌液2(包含万古霉素200mg/L、Tween2020μl/L的灭菌水)300ml,重复四次同样的灭菌操作。然后,将灭菌后的愈伤组织用2N6NU培养基(N6培养基用混合盐[Sigma公司制]4.0g/L、酪蛋白氨基酸300mg/L、肌肉肌醇100mg/L、烟酸0.5mg/L、吡哆醇盐酸盐0.5mg/L、盐酸硫胺0.5mg/L、L-脯氨酸2878mg/L、蔗糖30.0g/L、2,4-D 2mg/L、Gelrite 4.0g/L、万古霉素100mg/L、美洛培南25mg/L,pH 5.8)调养培养5天时间。之后,用包含巴龙霉素(Paromomycin)50mg/L的选择培养基2N6SEPa50(N6培养基用混合盐[Sigma公司制]4.0g/L、酪蛋白氨基酸300mg/L、肌肉肌醇100mg/L、烟酸0.5mg/L、吡哆醇盐酸盐0.5mg/L、盐酸硫胺0.5mg/L、L-脯氨酸2878mg/L、蔗糖30.0g/L、2,4-D 2mg/L、琼脂糖8.0g/L、万古霉素100mg/L、美洛培南25mg/L、pH 5.8)上以等间隔排列,于31.5℃的暗处进行培养约6周。其结果选择出了多个谱系(lineages)的巴龙霉素抗性愈伤组织。
3-4.对导入了pRIT3-EGFP、pRIT3-mEGFP的水稻愈伤组织的分析
从导入pRIT3-EGFP并显示巴龙霉素抗性的愈伤组织中任意选择96个谱系,用于以后的分析。从各谱系的愈伤组织的一部分利用自动核酸提取装置(Kurabo株式会社PX-80)提取基因组DNA,进行了使用引物组”SbfI-p35S-F”(SEQ ID NO:13)和“EGFP-NotI-R”(SEQID NO:14)(表1)的PCR分析,结果检测到源自pRIT3-EGFP的1238bp的DNA片段,确认了基因重组体。然后,对其进行使用实体荧光显微镜的观察,结果全部检测到EGFP信号(图2)。对导入了pRIT3-mEGFP的愈伤组织也进行了同样的分析,通过PCR分析确认了基因重组体。对它们进行了实体荧光显微镜下的观察,结果完全未检测到EGFP信号(图2)。
[表1]
Figure BDA0001740949190000261
3-5.将pRIT3-mEGFP和2408、或pRIT3-mEGFP和2409同时导入水稻愈伤组织(农杆 菌细菌接种、共存培养、灭菌、水稻重组体愈伤组织选择)
基本操作根据3-3。将具有pRIT3-mEGFP的农杆菌的菌液和具有2408或2409的农杆菌的菌液等量混合,接种了水稻愈伤组织约30g。以后至调养培养为止的操作,参照上述。在选择培养中,使用了包含潮霉素(Hygromycin)40mg/L、巴龙霉素(Paromomycin)50mg/L的2N6SEH40Pa50培养基。在约6周的选择培养之后,可以确认对潮霉素和巴龙霉素显示抗性的愈伤组织有多个谱系,在导入pRIT3-mEGFP和2408的情况下得到了14个谱系,在导入pRIT3-mEGFP和2409的情况下得到了56个谱系。
3-6.对导入了pRIT3-mEGFP和2408、或pRIT3-mEGFP和2409的水稻愈伤组织的分析
从选择的各谱系的愈伤组织提取基因组DNA,进行了使用引物组“SbfI-p35S-F”和“EGFP-NotI-R”、及”Hmr-F”(SEQ ID NO:15)和“Hmr2408R-1”(SEQ ID NO:16)(表1)的PCR分析,结果内置了pRIT3-mEGFP的双重转化体有269个谱系,内置了pRIT3-mEGFP和2409的双重转化体有264个谱系(表2、图3)。
[表2]
Figure BDA0001740949190000271
然后,对全部双重转化体愈伤组织使用实体荧光显微镜进行观察,结果通过内置了pRIT3-mEGFP和2409的2个谱系(No.6、3)确认了EGFP的表达(图4、5)。为了确认这些愈伤组织中的基于Target-AID的基因组序列修饰,在各谱系中从表达EGFP的愈伤组织提取基因组DNA,使用引物组“SbfI-p35S-F”和“EGFP-NotI-R”(表1)的PCR产物通过MonoFas DNA纯化试剂盒I(GL Sciences公司)进行纯化,克隆至pCR4Blunt TOPO载体(ThermoFisher公司)SbfI-NotI位点之间。对总和111个克隆利用DNA测序来解读碱基序列,结果在一部分中确认了基于Target-AID的碱基序列修饰(表3、图6A、B)。在切口酶型的2409中,发生较短的缺失突变(1-20个核苷酸)的频率较高,但也发生了单纯的碱基取代(图7)。
[表3]
Figure BDA0001740949190000281
另一方面,在使用欠缺两条链的切割能力的Cas9(2408)的情况下,作为导入突变方式以碱基取代为主(图8、9、10),对发生碱基取代的区域而言,比芽殖酵母的情况下更宽,确认到至靶核苷酸序列外(PAM序列的上游21个核苷酸)为止(图10)。另外,在GFP信号阴性细胞中,未在靶核苷酸序列及其附近导入突变(图11)。
4.对水稻的内源性基因ALS(乙酰乳酸合成酶(Acetolactate synthase))的修饰
迄今为止,基于Target-AID的外源性报告基因的修饰已经成功,因此下面实施了对水稻内源性基因的修饰。作为对象选择了ALS(乙酰乳酸合成酶)基因,尝试了通过基因序列内的靶向碱基取代,创建使第96位的氨基酸从丙氨酸(A)变化为缬氨酸(V)的突变型ALS基因(ALS A96V)。根据其他种类植物的已有报告,预测表达ALS A96V的水稻的植物体及愈伤组织将获得对除草剂(甲氧咪草烟(Imazamox))的抗性,但没有先例。另外,也没有试验过甲氧咪草烟对在无菌培养条件下的水稻植物体及愈伤组织的的效果的例子。因此,本实施例中首先作为初步研究,在确认了甲氧咪草烟对无菌培养条件下的水稻的种子及愈伤组织的有效浓度检验(下述4-1、4-2)、基于ALS A96V的对甲氧咪草烟的抗性获得(下述4-3)的基础上,实施了基于Target-AID的ALS A96V修饰(下述4-4)。
4-1.无细菌培养条件中的甲氧咪草烟对水稻植物体的有效浓度的验证
以1/2MS固态培养基(MS mix(Sigma)、蔗糖15.0g/L、Gelrite(和光纯药)4.0g/L、pH 5.8)为基础,产生了甲氧咪草烟浓度不同的9个梯度(0mg/L、0.5mg/L、1mg/L、2mg/L、4mg/L、5mg/L、10mg/L、20mg/L、30mg/L)的培养基。接下来,摘除水稻(Oryza sativa.LJaponica品种;日本晴)的种子的稻壳,在70%乙醇中振荡1分钟后,在2.5%次氯酸钠中渗透同时浸渍20-30分钟进行灭菌。在每个处理区接芽24粒已灭菌的种子,于25℃、明11小时(8000lux)/暗13小时条件下培养7天时间,观察发芽情况。其结果,在不含有甲氧咪草烟的1/2MS培养基中,24粒种子中有23粒发芽,显示出顺利生长,与此相对,在添加了甲氧咪草烟0.5mg/L或其以上的浓度的培养基中,在全部种子中确认到胚基部变褐,子叶鞘变白,保持在伸长了5mm左右为止(表4)。
从以上判断,在水稻植物体的无菌培养条件下的甲氧咪草烟的有效浓度为0.5mg/L。
[表4]甲氧咪草烟对水稻植物体的有效浓度的评价
Figure BDA0001740949190000291
4-2.对无细菌培养条件下的甲氧咪草烟对水稻愈伤组织的有效浓度的验证
以2N6固态培养基(上述)为基础,产生了甲氧咪草烟浓度不同的4个梯度(0mg/L、30mg/L、50mg/L、70mg/L)的培养基。从水稻种子的胚盘部诱导愈伤组织(上述),接芽于添加了甲氧咪草烟的2N6固态培养基,于31.5℃、整日暗处培养28天时间,确认了愈伤组织的增殖情况。其结果,在添加了甲氧咪草烟70mg/L的培养基中,愈伤组织发生一定程度的肥大化,阻碍了分裂增殖,与此相对,在50mg/L以下的浓度下确认了愈伤组织的分裂增殖(图12)。
从以上判断,甲氧咪草烟对水稻愈伤组织的有效浓度为70mg/L。
4-3.由突变型ALS基因(ALS A96V)对水稻愈伤组织赋予甲氧咪草烟抗性
为了评价由突变型ALS A96V对水稻愈伤组织赋予的甲氧咪草烟抗性,构建了pRIT4-ALS WT及pRIT4-ALS A96V的(图13)。pRIT4为水稻转化用双载体,作为植物用正标记基因具有潮霉素磷酸转移酶(Hygromycin phosphotransferase)(hpt)。pRIT4-ALS WT为以从野生型水稻(Oryza sativa.L Japonica品种;日本晴)提取的基因组DNA为基础,通过PCR克隆分离了ALS基因和其启动子和转录终止区,并组装入pRIT4。pRIT4-ALS A96V为通过利用PCR的位点特异性的导入突变法,产生人为地导入了A96V突变的ALS基因,并组装入pRIT4。将这2种载体导入(上述)农杆菌细菌EHA101谱系,转化(上述)为源自水稻种子胚盘的愈伤组织。之后,将愈伤组织在添加了潮霉素(Hygromycin)40mg/L的选择培养基(2N6SEH50;N6培养基用混合盐[Sigma公司制]4.0g/L、酪蛋白氨基酸1000mg/L、肌肉肌醇100mg/L、烟酸0.5mg/L、吡哆醇盐酸盐0.5mg/L、盐酸硫胺0.5mg/L、L-脯氨酸2878mg/L、蔗糖30.0g/L、2,4-D 2mg/L、Gelrite 4.0g/L、万古霉素100mg/L、美洛培南(Meropenem)25mg/L、pH 5.8)上等间隔排列,于31.5℃、暗处培养约4周。结果得到了导入了pRIT4-ALS WT的愈伤组织169个谱系、导入了pRIT4-ALS A96V的愈伤组织263个谱系(表5)。在以后的步骤中,这些愈伤组织每个谱系个别进行培养。将在2N6SEH50培养基上增殖的各愈伤组织谱系传代于在2N6SEH40中添加了甲氧咪草烟70mg/L的选择培养基(2N6SEH40IMZ70),于31.5℃、暗处培养约6周。其结果,在导入了pRIT4-ALS WT的愈伤组织中,对甲氧咪草烟70mg/L显示抗性的愈伤组织仅有6个谱系(3.6%),与此相对,在导入了pRIT4-ALS A96V的情况下,有261个谱系(99.2%)显示抗性(表5)。
根据以上确认了由突变型ALS A96V赋予水稻愈伤组织的甲氧咪草烟抗性。
[表5]由突变型ALS A96V对水稻愈伤组织赋予甲氧咪草烟抗性
Figure BDA0001740949190000301
4-4.基于Target-AID的ALS A96V修饰
Target-AID载体1476(dCas-AID)及1477(nCas-AID)被设计为:经过对水稻基因组中的ALS基因的靶向碱基取代(C287T)而修饰为ALS A96V(图14)。将1476、1477导入(上述)农杆菌细菌EHA101谱系,用于源自水稻种子胚的愈伤组织约8g的转化(上述)。经过农杆菌细菌的接种、灭菌的愈伤组织,利用2N6NU培养基调养培养14天时间后,在添加了潮霉素(Hygromycin)40mg/L的选择培养基(2N6SEH40)上等间隔排列,于31.5℃、暗处培养约3周。然后以同样的培养基进行传代,在25℃的暗处培养约10周,得到了导入了1476的愈伤组织155个谱系、导入了1477的愈伤组织203个谱系。在以后的步骤中,每个谱系个别进行培养。将各谱系的愈伤组织分为二,传代于添加了潮霉素(Hygromycin)50mg/L的培养基(2N6SEH50)和添加了甲氧咪草烟70mg/L的培养基(2N6SEH50IMZ70),与31.5℃的暗处选择培养约6周。在2N6SEH50上培养的结果为,所有谱系的愈伤组织发生增殖,与此相对,在2N6SEH50IMZ70上培养的情况下,在导入了1476的愈伤组织中有3个谱系、在导入了1477的愈伤组织中有6个谱系确认增殖。为了确认在这9个谱系的愈伤组织中的ALS基因序列,提取基因组DNA,通过使用引物组“ALS cloning-F”(SEQ ID NO:17)和“ALS cloning-R”(SEQ IDNO:18)的PCR扩增DNA片段,并加上了SbfI及NotI识别位点。得到的PCR产物利用MonoFasDNA纯化试剂盒I(GL Sciences公司)进行纯化,克隆至修饰pDONRZeo(Thermo FisherScientific公司)而成的克隆用载体的SbfI-NotI位点之间。使用引物“ALS F-1”(SEQ IDNO:19)利用DNA测序(ABI,3130XL)对得到的质粒克隆分析了碱基序列。使用了的引物序列示于表1。
其结果,在导入1477并显示甲氧咪草烟抗性的6个谱系中,在4个谱系中导入了ALS基因中的A96V突变。其中的3个谱系中,确认了发生A96V突变的靶向碱基的取代(C287T)(图15B)。其余1个谱系中,确认了C287T以及氨基酸序列不发生变化的C285T(图15C)。这些均为在载体1477的靶序列内的从C变为T的碱基取代。另外,对这些谱系确认了ALS基因及其启动子和转录终止区的基因组序列,但未确认到除了C285T及C287T以外的突变。因此,判断成功实现了基于Target-AID的水稻内在性ALS伝子的修饰和基于其的除草剂抗性的赋予。需要说明的是,对于成功地导入对ALS基因的A96V突变的4个谱系中的3个谱系,T0植物体成功地进行了再分化(图16)。对得到的T0植物体,对通过使用了“ALS cloning-F”和“ALScloning-R”的PCR所扩增的DNA片段使用“ALS F-1”进行直接测序,结果确认了在与全部源自T0植物体的愈伤组织中相同的突变(C287T或C285T/C287T)(图17)。
5.基于Target-AID的多个基因的同时修饰
Target-AID载体2455(dCas-AID)被产生用于同时修饰pRIT3-mEGFP上的mEGFP基因及水稻内源性的ALS基因,分别与2408/2409及1476/1477表达相同的gRNA。将导入了pRIT3-mEGFP的愈伤组织约17g通过上述的方法导入2455,得到了124个谱系的双重转化谱系(double transformant lineage)。对它们进行了利用实体荧光显微镜的观察,结果在3个谱系中确认了EGFP的表达。进一步,将这3个谱系的愈伤组织传代至2N6SEH40IMZ70培养基,于31.5℃的暗处中培养约6周,结果均显示了甲氧咪草烟的抗性,活跃地增殖。从3个谱系的愈伤组织提取基因组DNA,通过使用引物组“SbfI-p35S-F”和“EGFP-NotI-R”,或“ALSCloning-F”和“ALS Cloning-R”的PCR,扩增了mEGFP基因区域及ALS基因区域。得到的PCR产物利用MonoFas DNA纯化试剂盒I(GL Sciences公司)纯化,供直接测序用。结果在1个谱系中确认了在mEGFP基因和ALS基因两者中的基于Target-AID的靶向碱基取代(图18)。直接设定在mEGFP基因的开始密码子后的终止密码子(TAG)被修饰为与酪氨酸相对应的TAT,紧接其后的GTG被修饰为与甲硫氨酸相对应的ATG(图18A)。在ALS基因中确认了C287T(图18B)。
根据以上,验证了可以利用Target-AID同时修饰水稻基因组中的多个靶序列。
工业实用性
根据本发明,可以不伴随DNA双链的切割,安全地向任意单子叶植物导入位点特异性的突变。如上得到的基因修饰单子叶植物,在以水稻等主要谷物为首的单子叶植物的分子育种中极其有用。
本申请以在日本申请的日本特愿2015-232379(申请日:2015年11月27日)及日本特愿2016-134613(申请日:2016年7月6日)为基础,并将其内容全部并入本说明书。
SEQUENCE LISTING
<110> 国立大学法人神户大学(NATIONAL UNIVERSITY CORPORATION KOBE UNIVERSITY)
<120> 用于特异性转换靶向DNA序列的核酸碱基的单子叶植物的基因组序列的转换方法、及其使用的分子复合体
<130> 092545
<150> JP 2015-232379
<151> 2015-11-27
<150> JP 2016-134613
<151> 2016-07-06
<160> 19
<170> PatentIn 3.5版
<210> 1
<211> 627
<212> DNA
<213> 人工序列
<220>
<223> 针对拟南芥(Arabidopsis thaliana)优化的PmCDA密码子。
<220>
<221> CDS
<222> (1)..(627)
<400> 1
atg aca gat gct gaa tat gtc aga atc cac gaa aag ttg gac att tac 48
Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr
1 5 10 15
acg ttt aag aag cag ttc ttc aac aac aag aaa tct gtt tcg cat agg 96
Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His Arg
20 25 30
tgc tat gtg ctt ttc gaa cta aaa cgt cgt gga gaa aga cgg gct tgc 144
Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys
35 40 45
ttt tgg ggt tac gcg gtt aac aaa cca caa tca ggt act gaa cga gga 192
Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly
50 55 60
ata cac gct gaa atc ttt tct atc cga aag gtt gag gaa tat cta cgt 240
Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg
65 70 75 80
gac aat cct gga cag ttc act atc aat tgg tat tct agc tgg tca cca 288
Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro
85 90 95
tgt gca gat tgt gct gag aag att ctc gaa tgg tac aat caa gag ctt 336
Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu
100 105 110
aga ggc aat gga cat aca ttg aaa ata tgg gca tgc aag ctc tac tac 384
Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr
115 120 125
gaa aag aat gcc aga aac caa att ggg ctt tgg aac ttg agg gat aat 432
Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn
130 135 140
gga gtt ggg ctt aat gtc atg gtt tct gag cac tat caa tgt tgt cgg 480
Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg
145 150 155 160
aag atc ttc ata caa agt tcc cat aac cag ttg aat gag aac aga tgg 528
Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp
165 170 175
tta gag aaa acc ctt aaa aga gcc gag aag aga aga tcc gaa ctg agc 576
Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu Leu Ser
180 185 190
att atg ata cag gtc aaa att ctg cat acc act aag agt cca gct gta 624
Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val
195 200 205
ggt 627
Gly
<210> 2
<211> 209
<212> PRT
<213> 人工序列
<220>
<223> 合成结构
<400> 2
Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr
1 5 10 15
Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His Arg
20 25 30
Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys
35 40 45
Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly
50 55 60
Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg
65 70 75 80
Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro
85 90 95
Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu
100 105 110
Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr
115 120 125
Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn
130 135 140
Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg
145 150 155 160
Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp
165 170 175
Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu Leu Ser
180 185 190
Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val
195 200 205
Gly
<210> 3
<211> 4104
<212> DNA
<213> 人工序列
<220>
<223> 针对小鼠优化的Cas9密码子。
<220>
<221> CDS
<222> (1)..(4101)
<400> 3
atg gac aag aag tac tcg atc ggg ctg gmc atc gga aca aat tct gta 48
Met Asp Lys Lys Tyr Ser Ile Gly Leu Xaa Ile Gly Thr Asn Ser Val
1 5 10 15
ggc tgg gct gta ata acc gat gag tac aag gtg ccc tct aaa aaa ttt 96
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
aag gtc ctt ggc aat acg gat aga cat tcc ata aag aag aat ctt atc 144
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
ggt gcg ctg ctc ttt gac agc ggc gag acc gcg gag gcg acc cgg ttg 192
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
aaa cgc acc gcg aga cgc cgt tac aca agg cgt aag aat aga atc tgt 240
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
tat ctc cag gag ata ttc tct aat gaa atg gcg aag gta gac gat tcc 288
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
ttc ttt cac cgt ctg gag gaa agt ttt ctc gtt gag gaa gat aag aaa 336
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
cat gaa aga cac ccg atc ttc gga aac att gtc gac gag gtc gct tat 384
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
cat gaa aag tac cct acc atc tac cat ctt aga aag aaa ctt gtt gac 432
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
agc acg gat aag gct gat ctc agg ctg ata tac ctg gct ctg gca cat 480
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
atg att aag ttc aga ggg cat ttc ctt atc gaa ggc gac ctg aat cca 528
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
gat aat tca gat gta gac aag ctc ttc att caa ctt gtg cag act tat 576
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
aat cag ctc ttc gaa gaa aat cca ata aac gcg tcg ggt gta gac gca 624
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
aag gcc ata ctg tcc gct agg ctt tct aag tca cgt aga ctt gag aat 672
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
ctc att gcc caa ctc ccc ggc gag aag aag aac ggc ttg ttt gga aat 720
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
ctg ata gcg ctg tcc ctg ggt ctt aca cca aat ttc aag agt aat ttc 768
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
gat ttg gca gaa gat gct aag ttg cag ctc agt aaa gac acc tac gat 816
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
gac gat ctt gat aat ttg ttg gct cag att ggc gat cag tat gca gat 864
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
ctt ttc ttg gcc gct aag aat ttg tct gat gca att ctg ctt agc gac 912
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
att ttg agg gtt aat aca gaa atc acc aag gca ccc ttg tcg gcg tca 960
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
atg ata aag agg tat gat gag cac cac caa gac ctg acg ctc ctc aag 1008
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
gct ctt gtt cgg cag caa ttg ccg gag aag tac aaa gag atc ttc ttc 1056
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
gac cag tct aag aac gga tat gcg ggc tac ata gac ggt gga gcg agt 1104
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
cag gag gaa ttc tac aag ttc ata aag ccc att ctc gag aag atg gat 1152
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
ggt acg gaa gaa ctg ctt gtg aaa ctt aac aga gaa gat ctt ttg cgg 1200
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
aag cag aga act ttc gac aac gga agt ata cca cac cag ata cat ctc 1248
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
gga gag ctt cat gct att ctc aga aga caa gag gat ttc tac cct ttc 1296
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
ttg aag gat aac aga gaa aag ata gag aag atc ctc acg ttt agg atc 1344
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
cct tac tac gta ggt cct ctt gct cgc ggc aat agt agg ttc gcc tgg 1392
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
atg acc cgc aag tct gaa gaa act atc acc cct tgg aat ttc gaa gag 1440
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
gtt gta gac aaa ggt gct tca gca cag agt ttc att gag agg atg acc 1488
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
aac ttc gac aag aac ctc ccc aac gaa aag gtc ctg cct aag cac agc 1536
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
ctc ctc tac gaa tac ttt act gtc tat aat gag ctt aca aaa gtt aag 1584
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
tac gtg aca gag gga atg cgg aag ccc gca ttc ctt tcc gga gaa caa 1632
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
aag aag gcg atc gtg gat ctt ctc ttc aag acg aac cgc aag gtg acg 1680
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
gtt aaa cag ttg aag gaa gat tac ttc aag aag ata gaa tgt ttt gat 1728
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
agc gtg gaa atc agc ggc gtc gaa gat agg ttc aac gct tcc ctg gga 1776
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
acg tac cac gat ctc ctc aag att atc aaa gat aag gac ttt ctt gat 1824
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
aac gaa gag aat gag gac atc ttg gaa gac att gtt ctg acg ctc acc 1872
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
ctg ttc gaa gat cgc gag atg att gag gaa cgc ttg aag acc tac gca 1920
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
cac ctg ttc gat gac aag gtt atg aag caa ctt aaa cgg cgc cgg tat 1968
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
acg ggc tgg gga cgg ctt tcg cgg aag ctg ata aat gga atc cgt gac 2016
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
aag cag tct ggc aag aca ata ctc gac ttc ttg aag tcg gat ggt ttt 2064
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
gcc aat aga aat ttt atg caa ctc att cat gat gac tcg ctt act ttt 2112
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
aag gag gac atc cag aag gcc cag gta tca gga cag ggt gac tct ttg 2160
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
cac gaa cac atc gcg aac ctg gcg ggc tcc ccc gcg att aag aag gga 2208
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
att ttg cag act gtc aag gtg gtc gat gaa ctc gtg aag gtt atg gga 2256
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
cgt cat aag ccg gaa aat att gtg att gag atg gct cgc gag aat caa 2304
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
aca aca cag aag ggc caa aag aac agt aga gaa cgc atg aag cgc atc 2352
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
gaa gag ggc atc aaa gag ctg ggc agt cag atc ctt aaa gaa cat cca 2400
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
gtc gag aat aca cag ctt cag aac gaa aag ctg tac ctt tat tac ctt 2448
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
caa aat ggg cgt gat atg tat gtg gat cag gaa ctc gat atc aat agg 2496
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
ctg agt gac tat gat gtc gac smt atc gtc ccg caa agt ttc ctc aag 2544
Leu Ser Asp Tyr Asp Val Asp Xaa Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
gac gac agt ata gac aac aaa gtt ctc aca cgg tca gat aag aat cgc 2592
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
ggc aag agc gat aat gta ccg tcg gag gag gta gtc aag aag atg aag 2640
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
aat tac tgg cgc cag ttg ctc aac gcc aag ctc atc act cag agg aaa 2688
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
ttt gac aac ctt acg aaa gcc gag cgg ggc gga ctc tct gaa ctg gac 2736
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
aag gcc ggt ttc ata aag cgc cag ctc gtt gag aca cgt caa att act 2784
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
aag cac gtc gct caa ata ttg gat tcc cgc atg aat act aag tac gat 2832
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
gag aat gat aag ctc ata cgt gaa gtt aag gtc att act ctc aag tcc 2880
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
aag ctt gta tcg gac ttc cgt aag gac ttc caa ttc tac aag gtc cgg 2928
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
gaa atc aat aat tat cac cat gcc cat gac gct tat ctg aac gcg gtc 2976
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
gtg ggc acg gca ctc att aag aaa tac cca aaa ctt gag tca gaa ttt 3024
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
gtt tac ggg gac tat aaa gtt tat gac gtg cgg aag atg ata gcg 3069
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
aag tcg gaa caa gag ata gga aag gcg act gca aag tac ttt ttt 3114
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
tac tcc aac ata atg aat ttc ttt aag acc gaa ata acc ctt gca 3159
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
aac ggt gaa atc aga aag cgg cct ctg att gaa aca aat ggc gag 3204
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
acg ggc gag atc gtc tgg gac aag ggg agg gac ttc gca acg gtt 3249
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
cgc aag gtc ctt agc atg ccg caa gta aat ata gtt aag aag acg 3294
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
gaa gtt cag acc ggc ggc ttt agt aaa gaa agc ata ctt cct aaa 3339
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
agg aat tcc gac aaa ctg ata gcg cgc aag aag gac tgg gat cca 3384
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
aag aag tat gga gga ttt gac tcc cca acc gtt gct tat agc gtg 3429
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
ttg gta gta gcc aag gtg gaa aag ggt aag tct aag aaa ttg aag 3474
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
tcg gtg aag gag ttg ttg ggg ata act ata atg gag cgg agt tcg 3519
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
ttc gag aag aac cca att gac ttt ctc gaa gcc aaa ggc tac aag 3564
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
gag gtc aag aag gac ctg att att aag ttg cca aag tac tcg ctc 3609
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
ttc gaa ctc gag aac ggg aga aag cgt atg ctg gcg tcg gcg ggc 3654
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
gag ctg cag aaa gga aac gag ctg gct ttg cca tcg aaa tac gta 3699
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
aat ttc ctg tac ctc gcc tca cat tat gag aag ctt aaa ggg tct 3744
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
cca gaa gac aat gaa cag aag cag ctg ttt gtt gaa cag cac aag 3789
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
cac tac ttg gac gag att ata gaa caa atc tcc gag ttc tct aaa 3834
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
cgg gtt atc ctt gca gac gcc aat ttg gat aag gtc ctc tcg gct 3879
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
tat aat aag cat aga gat aag cca atc cgg gag cag gct gaa aat 3924
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
atc ata cac ctc ttt acg ttg act aat ttg ggt gcg cca gcg gca 3969
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
ttc aag tac ttc gat aca aca atc gat cgt aag cgc tac aca agc 4014
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
act aag gaa gtc ctg gac gcg acg ctg ata cac cag tcc att act 4059
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
gga ctg tat gaa acc aga ata gat ctt agc cag ctc ggc ggt gat 4104
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1355 1360 1365
<210> 4
<211> 1367
<212> PRT
<213> 人工序列
<220>
<221> misc_feature
<222> (10)..(10)
<223> 位于定位10的'Xaa'代表Asp或Ala。
<220>
<221> misc_feature
<222> (840)..(840)
<223> 位于定位840的 'Xaa'代表Asp、Ala、His或Pro。
<220>
<223> 合成结构
<400> 4
Met Asp Lys Lys Tyr Ser Ile Gly Leu Xaa Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Xaa Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1355 1360 1365
<210> 5
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> SV40衍生的核定位信号。
<220>
<221> CDS
<222> (1)..(21)
<400> 5
cct aag aag aar mgk aar gtw 21
Pro Lys Lys Lys Xaa Lys Xaa
1 5
<210> 6
<211> 7
<212> PRT
<213> 人工序列
<220>
<221> misc_feature
<222> (5)..(5)
<223> 位于定位5的 'Xaa' 代表Arg或Ser。
<220>
<221> misc_feature
<222> (7)..(7)
<223> 位于定位7的'Xaa' 代表Val。
<220>
<223> 合成结构
<400> 6
Pro Lys Lys Lys Xaa Lys Xaa
1 5
<210> 7
<211> 19
<212> RNA
<213> Francisella novicida
<220>
<221> misc_structure
<222> (1)..(19)
<223> crRNA直接重复序列。
<400> 7
aauuucuacu guuguagau 19
<210> 8
<211> 83
<212> DNA
<213> 化脓性链球菌(Streptococcus pyogenes)
<220>
<221> misc_structure
<222> (1)..(83)
<223> tracrRNA
<400> 8
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60
ggcaccgagt cggtggtgct ttt 83
<210> 9
<211> 14551
<212> DNA
<213> 人工序列
<220>
<223> pRIT3-EGFP的完整核苷酸序列。
<400> 9
agatggttgt tcaagacgat ctacgaacgc agtggcagcg ccggagagtt caagaagttc 60
tgtttcaccg tgcgcaagct gatcgggtca aatgacctgc cggagtacga tttgaaggag 120
gaggcggggc aggctggccc gatcctagtc atgcgctacc gcaacctgat cgagggcgaa 180
gcatccgccg gttcctaatg tacggagcag atgctagggc aaattgccct agcaggggaa 240
aaaggtcgaa aaggtctctt tcctgtggat agcacgtaca ttgggaaccc aaagccgtac 300
attgggaacc ggaacccgta cattgggaac ccaaagccgt acattgggaa ccggtcacac 360
atgtaagtga ctgatataaa agagaaaaaa ggcgattttt ccgcctaaaa ctctttaaaa 420
cttattaaaa ctcttaaaac ccgcctggcc tgtgcataac tgtctggcca gcgcacagcc 480
gaagagctgc aaaaagcgcc tacccttcgg tcgctgcgct ccctacgccc cgccgcttcg 540
cgtcggccta tcgcggccgc tggccgctca aaaatggctg gcctacggcc aggcaatcta 600
ccagggcgcg gacaagccgc gccgtcgcca ctcgaccgcc ggcgcccaca tcaaggcacc 660
ctgcctcgcg cgtttcggtg atgacggtga aaacctctga cacatgcagc tcccggagac 720
ggtcacagct tgtctgtaag cggatgccgg gagcagacaa gcccgtcagg gcgcgtcagc 780
gggtgttggc gggtgtcggg gcgcagccat gacccagtca cgtagcgata gcggagtgta 840
tactggctta actatgcggc atcagagcag attgtactga gagtgcacca tatgcggtgt 900
gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggcgctcttc cgcttcctcg 960
ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag 1020
gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa 1080
ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc 1140
cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca 1200
ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg 1260
accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct 1320
catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt 1380
gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag 1440
tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc 1500
agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac 1560
actagaagga cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga 1620
gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc 1680
aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg 1740
gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca 1800
aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt 1860
atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca 1920
gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg 1980
atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca 2040
ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt 2100
cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt 2160
agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca 2220
cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca 2280
tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga 2340
agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact 2400
gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga 2460
gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caacacggga taataccgcg 2520
ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc 2580
tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga 2640
tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat 2700
gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt 2760
caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt 2820
atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac 2880
gtctaagaaa ccattattat catgacatta acctataaaa ataggcgtat cacgaggccc 2940
tttcgtcttc gaataaatac ctgtgacgga agatcacttc gcagaataaa taaatcctgg 3000
tgtccctgtt gataccggga agccctgggc caacttttgg cgaaaatgag acgttgatcg 3060
gcacgtaaga ggttccaact ttcaccataa tgaaataaga tcactaccgg gcgtattttt 3120
tgagttatcg agattttcag gagctaagga agctaaaatg gagaaaaaaa tcactggata 3180
taccaccgtt gatatatccc aatggcatcg taaagaacat tttgaggcat ttcagtcagt 3240
tgctcaatgt acctataacc agaccgttcc tggatattac ggccttttta aagaccgtaa 3300
agaaaaataa gcacaagttt tatccggcct ttattcacat tcttgcccgc ctgatgaatg 3360
ctcatccgga ataattcgaa gctcggtccc gtgggtgttc tgtcgtctcg ttgtacaacg 3420
aaatccattc ccattccgcg ctcaagatgg cttcccctcg gcagttcatc agggctaaat 3480
caatctagcc gacttgtccg gtgaaatggg ctgcactcca acagaaacaa tcaaacaaac 3540
atacacagcg acttattcac acgagctcaa attacaacgg tatatatcct gccagtcagc 3600
atcatcacac caaaagttag gcccgaatag tttgaaatta gaaagctcgc aattgaggtc 3660
tacaggccaa attcgctctt agccgtacaa tattactcac cggtgcgatg ccccccatcg 3720
taggtgaagg tggaaattaa tgatccatct tgagaccaca ggcccacaac agctaccagt 3780
ttcctcaagg gtccaccaaa aacgtaagcg cttacgtaca tggtcgataa gaaaaggcaa 3840
tttgtagatg ttaattccca tcttgaaaga aatatagttt aaatatttat tgataaaata 3900
acaagtcagg tattatagtc caagcaaaaa cataaattta ttgatgcaag tttaaattca 3960
gaaatatttc aataactgat tatatcagct ggtacattgc cgtagatgaa agactgagtg 4020
cgatattatg tgtaatacat aaattgatga tatagctagc ttagctcatc gggggatccg 4080
tcgacctgca gccaagctgg gatcccagct gggatcccag cttgtcgacg gtaccccctc 4140
tagagttcct tctagacccg atctagtaac atagatgaca ccgcgcgcga taatttatcc 4200
tagtttgcgc gctatatttt gttttctatc gcgtattaaa tgtataattg cgggactcta 4260
atcataaaaa cccatctcat aaataacgtc atgcattaca tgttaattat tacatgctta 4320
acgtaattca acagaaatta tatgataatc atcgcaagac cggcaacagg attcaatctt 4380
aagaaacttt attgccaaat gtttgaacga tcggggatca tccgggtctg tggcgggaac 4440
tccacgaaaa tatccgaacg cagcaagata tcgcggtgca tctcggtctt gcctgggcag 4500
tcgccgccga cgccgttgat gtggacgccg ggcccgatca tattgtcgct caggatcgtg 4560
gcgttgtgct tgtcggccgt tgctgtcgta atgatatcgg caccttcgac cgcctgttcc 4620
gcagagatcc cgtgggcgaa gaactccagc atgagatccc cgcgctggag gatcatccag 4680
ccggcgtccc ggaaaacgat tccgaagccc aacctttcat agaaggcggc ggtggaatcg 4740
aaatctcgtg atggcaggtt gggcgtcgct tggtcggtca tttcgaaccc cagagtcccg 4800
ctcagaagaa ctcgtcaaga aggcgataga aggcgatgcg ctgcgaatcg ggagcggcga 4860
taccgtaaag cacgaggaag cggtcagccc attcgccgcc aagctcttca gcaatatcac 4920
gggtagccaa cgctatgtcc tgatagcggt ccgccacacc cagccggcca cagtcgatga 4980
atccagaaaa gcggccattt tccaccatga tattcggcaa gcaggcatcg ccatgggtca 5040
cgacgagatc atcgccgtcg ggcatgcgcg ccttgagcct ggcgaacagt tcggctggcg 5100
cgagcccctg atgctcttcg tccagatcat cctgatcgac aagaccggct tccatccgag 5160
tacgtgctcg ctcgatgcga tgtttcgctt ggtggtcgaa tgggcaggta gccggatcaa 5220
gcgtatgcag ccgccgcatt gcatcagcca tgatggatac tttctcggca ggagcaaggt 5280
gagatgacag gagatcctgc cccggcactt cgcccaatag cagccagtcc cttcccgctt 5340
cagtgacaac gtcgagcaca gctgcgcaag gaacgcccgt cgtggccagc cacgatagcc 5400
gcgctgcctc gtcctgcagt tcattcaggg caccggacag gtcggtcttg acaaaaagaa 5460
ccgggcgccc ctgcgctgac agccggaaca cggcggcatc agagcagccg attgtctgtt 5520
gtgcccagtc atagccgaat agcctctcca cccaagcggc cggagaacct gcgtgcaatc 5580
catcttgttc aatcatatct cattgccccc cggtctacct acaaaaaagc tccgcacgag 5640
gctgcatttg tcacaaatca tgaaaagaaa aactaccgat gaacaatgct gagggattca 5700
aattctaccc acaaaaagaa gaaagaaaga tctagcacat ctaagcctga cgaagcagca 5760
gaaatatata aaaatataaa ccatagtgcc cttttcccct cttcctgatc ttgtttagca 5820
tggcggaaat tttaaacccc ccatcatctc ccccaacaac ggcggatcgc agatctacat 5880
ccgagagccc cattccccgc gagatccggg ccggatccac gccggcgaga gccccagccg 5940
cgagatcccg cccctcccgc gcaccgatct gggcgcgcac gaagccgcct ctcgcccacc 6000
caaactacca aggccaaaga tcgagaccga gacggaaaaa aaaaacggag aaagaaagag 6060
gagaggggcg gggtggttac cggcgcggcg gcggcggagg gggagggggg aggagctcgt 6120
cgtccggcag cgagggggga ggaggtggag gtggtggtgg tggtggtggt agggttgggg 6180
ggatgggagg agaggggggg gtatgtatat agtggcgatg gggggcgttt ctttggaagc 6240
ggagggaggg ccggcctcgt cgctggctcg cgatcctcct cgcgtttccg gcccccacga 6300
cccggaccca cctgctgttt tttctttttc ttttttttct ttcttttttt ttttttggct 6360
gcgagacgtg cggtgcgtgc ggacaactca cggtgatagt gggggggtgt ggagactatt 6420
gtccagttgg ctggactggg gtgggttggg ttgggttggg ttgggctggg cttgctatgg 6480
atcgtggata gcactttggg ctttaggaac tttaggggtt gtttttgtaa atgttttgag 6540
tctaagttta tcttttattt ttactagaaa aaatacccat gcgctgcaac gggggaaagc 6600
tattttaatc ttattattgt tcattgtgag aattcgcctg aatatatatt tttctcaaaa 6660
attatgtcaa attagcatat gggttttttt aaagatattt cttatacaaa tccctctgta 6720
tttacaaaag caaacgaact taaaacccga ctcaaataca gatatgcatt tccaaaagcg 6780
aataaactta aaaaccaatt catacaaaaa tgacgtatca aagtaccgac aaaaacatcc 6840
tcaattttta taatagtaga aaagagtaaa tttcactttg ggccaccttt tattaccgat 6900
attttacttt ataccacctt ttaactgatg ttttcacttt tgaccaggta atcttacctt 6960
tgttttattt tggactatcc cgactctctt ctcaagcata tgaatgaccg tatgctagtg 7020
cggccgcaag cttgactact agtctctctt aaggtagcat cacaagtttg tacaaaaaag 7080
caggctcctg caggtgagac ttttcaacaa agggtaatat cgggaaacct cctcggattc 7140
cattgcccag ctatctgtca cttcatcgaa aggacagtag aaaaggaagg tggctcctac 7200
aaatgccatc attgcgataa aggaaaggct atcgttcaag atgcctctac cgacagtggt 7260
cccaaagatg gacccccacc cacgaggaac atcgtggaaa aagaagacgt tccaaccacg 7320
tcttcaaagc aagtggattg atgtgatatc tccactgacg taagggatga cgcacaatcc 7380
cactatcctt cgcaagaccc ttcctctata taaggaagtt catttcattt ggagaggaca 7440
ggcttcttga gatccttcaa caattaccaa caacaacaaa caacaaacaa cattacaatt 7500
actatttaca attacagtcg actctagagg atccatggtg agcaagggcg aggagctgtt 7560
caccggggtg gtgcccatcc tggtcgagct ggacggcgac gtaaacggcc acaagttcag 7620
cgtgtccggc gagggcgagg gcgatgccac ctacggcaag ctgaccctga agttcatctg 7680
caccaccggc aagctgcccg tgccctggcc caccctcgtg accaccttca cctacggcgt 7740
gcagtgcttc agccgctacc ccgaccacat gaagcagcac gacttcttca agtccgccat 7800
gcccgaaggc tacgtccagg agcgcaccat cttcttcaag gacgacggca actacaagac 7860
ccgcgccgag gtgaagttcg agggcgacac cctggtgaac cgcatcgagc tgaagggcat 7920
cgacttcaag gaggacggca acatcctggg gcacaagctg gagtacaact acaacagcca 7980
caacgtctat atcatggccg acaagcagaa gaacggcatc aaggtgaact tcaagatccg 8040
ccacaacatc gaggacggca gcgtgcagct cgccgaccac taccagcaga acacccccat 8100
cggcgacggc cccgtgctgc tgcccgacaa ccactacctg agcacccagt ccgccctgag 8160
caaagacccc aacgagaagc gcgatcacat ggtcctgctg gagttcgtga ccgccgccgg 8220
gatcactcac ggcatggacg agctgtacaa gtaaagcggc cgcccggctg cattcgagta 8280
ttatggcatt gggaaaactg tttttcttgt accatttgtt gtgcttgtaa tttactgtgt 8340
tttttattcg gttttcgcta tcgaactgtg aaatggaaat ggatggagaa gagttaatga 8400
atgatatggt ccttttgttc attctcaaat taatattatt tgttttttct cttatttgtt 8460
gtgtgttgaa tttgaaatta taagagatat gcaaacattt tgttttgagt aaaaatgtgt 8520
caaatcgtgg cctctaatga ccgaagttaa tatgaggagt aaaacactag acccagcttt 8580
cttgtacaaa gtggtgatgt tgtggtcgac ccatcgatgg gcatgcaagc tgggatccca 8640
gcttggtacc agatcttata attaaatggc cttcgctgcc catattattg gtaactcaac 8700
agcatcaatc acgggatttt tctcgaatta attgcgtcga atctcagcat cgaaatattc 8760
gcctttttcg tccattagac tatctattgt gatggtggat ttatcacaaa tgggacccgc 8820
cgccgacaga ggtgtgatgt taggccagga ctttgaaaat ttgcgcaact atcgtatagt 8880
ggccgacaaa ttgacgccga gttgacagac tgcctagcat ttgagtgaat tatgtaaggt 8940
aatgggctac actgaattgg tagctcaaac tgtcagtatt tatgtatatg agtgtatatt 9000
ttcgcataat ctcagaccaa tctgaagatg aaatgggtat ctgggaatgg cgaaatcaag 9060
gcatcgatcg tgaagtttct catctaagcc cccatttgga cgtgaatgta gacacgtcga 9120
aataaagatt tccgaattag aataatttgt ttattgcttt cgcctataaa tacgacggat 9180
cgtaatttgt cgttttatca aaatgtactt tcattttata ataacgctgc ggacatctac 9240
atttttgaat tgaaaaaaaa ttggtaatta ctctttcttt ttctccatat tgaccatcat 9300
actcattgct gatccatgta gatttcccgg acatgaagcc atttacaatt gaatatatcc 9360
tgccgccgct gccgctttgc acccggtgga gcttgcatgt tggtttctac gcagaactga 9420
gccggttagg cagataattt ccattgagaa ctgagccatg tgcaccttcc ccccaacacg 9480
gtgagcgacg gggcaacgga gtgatccaca tgggactttt aaacatcatc cgtcggatgg 9540
cgttgcgaga gaagcagtcg atccgtgaga tcagccgacg caccgggcag gcgcgcaaca 9600
cgatcgcaaa gtatttgaac gcaggtacaa tcgagccgac gttcacggta ccggaacgac 9660
caagcaagct agcttagtaa agccctcgct agattttaat gcggatgttg cgattacttc 9720
gccaactatt gcgataacaa gaaaaagcca gcctttcatg atatatctcc caatttgtgt 9780
agggcttatt atgcacgctt aaaaataata aaagcagact tgacctgata gtttggctgt 9840
gagcaattat gtgcttagtg catctaacgc ttgagttaag ccgcgccgcg aagcggcgtc 9900
ggcttgaacg aattgttaga cattatttgc cgactacctt ggtgatctcg cctttcacgt 9960
agtggacaaa ttcttccaac tgatctgcgc gcgaggccaa gcgatcttct tcttgtccaa 10020
gataagcctg tctagcttca agtatgacgg gctgatactg ggccggcagg cgctccattg 10080
cccagtcggc agcgacatcc ttcggcgcga ttttgccggt tactgcgctg taccaaatgc 10140
gggacaacgt aagcactaca tttcgctcat cgccagccca gtcgggcggc gagttccata 10200
gcgttaaggt ttcatttagc gcctcaaata gatcctgttc aggaaccgga tcaaagagtt 10260
cctccgccgc tggacctacc aaggcaacgc tatgttctct tgcttttgtc agcaagatag 10320
ccagatcaat gtcgatcgtg gctggctcga agatacctgc aagaatgtca ttgcgctgcc 10380
attctccaaa ttgcagttcg cgcttagctg gataacgcca cggaatgatg tcgtcgtgca 10440
caacaatggt gacttctaca gcgcggagaa tctcgctctc tccaggggaa gccgaagttt 10500
ccaaaaggtc gttgatcaaa gctcgccgcg ttgtttcatc aagccttacg gtcaccgtaa 10560
ccagcaaatc aatatcactg tgtggcttca ggccgccatc cactgcggag ccgtacaaat 10620
gtacggccag caacgtcggt tcgagatggc gctcgatgac gccaactacc tctgatagtt 10680
gagtcgatac ttcggcgatc accgcttccc tcatgatgtt taactttgtt ttagggcgac 10740
tgccctgctg cgtaacatcg ttgctgctcc ataacatcaa acatcgaccc acggcgtaac 10800
gcgcttgctg cttggatgcc cgaggcatag actgtacccc aaaaaaacag tcataacaag 10860
ccatgaaaac cgccactgcg ccgttaccac cgctgcgttc ggtcaaggtt ctggaccagt 10920
tgcgtgagcg catacgctac ttgcattaca gcttacgaac cgaacaggct tatgtccact 10980
gggttcgtgc cttcatccgt ttccacggtg tgcgtcaccc ggcaaccttg ggcagcagcg 11040
aagtcgaggc atttctgtcc tggctggcga acgagcgcaa ggtttcggtc tccacgcatc 11100
gtcaggcatt ggcggccttg ctgttcttct acggcaaggt gctgtgcacg gatctgccct 11160
ggcttcagga gatcggaaga cctcggccgt cgcggcgctt gccggtggtg ctgaccccgg 11220
atgaagtggt tcgcatcctc ggttttctgg aaggcgagca tcgtttgttc gcccagcttc 11280
tgtatggaac gggcatgcgg atcagtgagg gtttgcaact gcgggtcaag gatctggatt 11340
tcgatcacgg cacgatcatc gtgcgggagg gcaagggctc caaggatcgg gccttgatgt 11400
tacccgagag cttggcaccc agcctgcgcg agcaggatcg atccaacccc tccgctgcta 11460
tagtgcagtc ggcttctgac gttcagtgca gccgtcttct gaaaacgaca tgtcgcacaa 11520
gtcctaagtt acgcgacagg ctgccgccct gcccttttcc tggcgttttc ttgtcgcgtg 11580
ttttagtcgc ataaagtaga atacttgcga ctagaaccgg agacattacg ccatgaacaa 11640
gagcgccgcc gctggcctgc tgggctatgc ccgcgtcagc accgacgacc aggacttgac 11700
caaccaacgg gccgaactgc acgcggccgg ctgcaccaag ctgttttccg agaagatcac 11760
cggcaccagg cgcgaccgcc cggagctggc caggatgctt gaccacctac gccctggcga 11820
cgttgtgaca gtgaccaggc tagaccgcct ggcccgcagc acccgcgacc tactggacat 11880
tgccgagcgc atccaggagg ccggcgcggg cctgcgtagc ctggcagagc cgtgggccga 11940
caccaccacg ccggccggcc gcatggtgtt gaccgtgttc gccggcattg ccgagttcga 12000
gcgttcccta atcatcgacc gcacccggag cgggcgcgag gccgccaagg cccgaggcgt 12060
gaagtttggc ccccgcccta ccctcacccc ggcacagatc gcgcacgccc gcgagctgat 12120
cgaccaggaa ggccgcaccg tgaaagaggc ggctgcactg cttggcgtgc atcgctcgac 12180
cctgtaccgc gcacttgagc gcagcgagga agtgacgccc accgaggcca ggcggcgcgg 12240
tgccttccgt gaggacgcat tgaccgaggc cgacgccctg gcggccgccg agaatgaacg 12300
ccaagaggaa caagcatgaa accgcaccag gacggccagg acgaaccgtt tttcattacc 12360
gaagagatcg aggcggagat gatcgcggcc gggtacgtgt tcgagccgcc cgcgcacgtc 12420
tcaaccgtgc ggctgcatga aatcctggcc ggtttgtctg atgccaagct ggcggcctgg 12480
ccggccagct tggccgctga agaaaccgag cgccgccgtc taaaaaggtg atgtgtattt 12540
gagtaaaaca gcttgcgtca tgcggtcgct gcgtatatga tgcgatgagt aaataaacaa 12600
atacgcaagg ggaacgcatg aaggttatcg ctgtacttaa ccagaaaggc gggtcaggca 12660
agacgaccat cgcaacccat ctagcccgcg ccctgcaact cgccggggcc gatgttctgt 12720
tagtcgattc cgatccccag ggcagtgccc gcgattgggc ggccgtgcgg gaagatcaac 12780
cgctaaccgt tgtcggcatc gaccgcccga cgattgaccg cgacgtgaag gccatcggcc 12840
ggcgcgactt cgtagtgatc gacggagcgc cccaggcggc ggacttggct gtgtccgcga 12900
tcaaggcagc cgacttcgtg ctgattccgg tgcagccaag cccttacgac atatgggcca 12960
ccgccgacct ggtggagctg gttaagcagc gcattgaggt cacggatgga aggctacaag 13020
cggcctttgt cgtgtcgcgg gcgatcaaag gcacgcgcat cggcggtgag gttgccgagg 13080
cgctggccgg gtacgagctg cccattcttg agtcccgtat cacgcagcgc gtgagctacc 13140
caggcactgc cgccgccggc acaaccgttc ttgaatcaga acccgagggc gacgctgccc 13200
gcgaggtcca ggcgctggcc gctgaaatta aatcaaaact catttgagtt aatgaggtaa 13260
agagaaaatg agcaaaagca caaacacgct aagtgccggc cgtccgagcg cacgcagcag 13320
caaggctgca acgttggcca gcctggcaga cacgccagcc atgaagcggg tcaactttca 13380
gttgccggcg gaggatcaca ccaagctgaa gatgtacgcg gtacgccaag gcaagaccat 13440
taccgagctg ctatctgaat acatcgcgca gctaccagag taaatgagca aatgaataaa 13500
tgagtagatg aattttagcg gctaaaggag gcggcatgga aaatcaagaa caaccaggca 13560
ccgacgccgt ggaatgcccc atgtgtggag gaacgggcgg ttggccaggc gtaagcggct 13620
gggttgtctg ccggccctgc aatggcactg gaacccccaa gcccgaggaa tcggcgtgag 13680
cggtcgcaaa ccatccggcc cggtacaaat cggcgcggcg ctgggtgatg acctggtgga 13740
gaagttgaag gccgcgcagg ccgcccagcg gcaacgcatc gaggcagaag cacgccccgg 13800
tgaatcgtgg caagcggccg ctgatcgaat ccgcaaagaa tcccggcaac cgccggcagc 13860
cggtgcgccg tcgattagga agccgcccaa gggcgacgag caaccagatt ttttcgttcc 13920
gatgctctat gacgtgggca cccgcgatag tcgcagcatc atggacgtgg ccgttttccg 13980
tctgtcgaag cgtgaccgac gagctggcga ggtgatccgc tacgagcttc cagacgggca 14040
cgtagaggtt tccgcagggc cggccggcat ggccagtgtg tgggattacg acctggtact 14100
gatggcggtt tcccatctaa ccgaatccat gaaccgatac cgggaaggga agggagacaa 14160
gcccggccgc gtgttccgtc cacacgttgc ggacgtactc aagttctgcc ggcgagccga 14220
tggcggaaag cagaaagacg acctggtaga aacctgcatt cggttaaaca ccacgcacgt 14280
tgccatgcag cgtacgaaga aggccaagaa cggccgcctg gtgacggtat ccgagggtga 14340
agccttgatt agccgctaca agatcgtaaa gagcgaaacc gggcggccgg agtacatcga 14400
gatcgagcta gctgattgga tgtaccgcga gatcacagaa ggcaagaacc cggacgtgct 14460
gacggttcac cccgattact ttttgatcga tcccggcatc ggccgttttc tctaccgcct 14520
ggcacgccgc gccgcaggca aggcagaagc c 14551
<210> 10
<211> 14569
<212> DNA
<213> 人工序列
<220>
<223> pRIT3-mEGFP的完整核苷酸序列。
<400> 10
agatggttgt tcaagacgat ctacgaacgc agtggcagcg ccggagagtt caagaagttc 60
tgtttcaccg tgcgcaagct gatcgggtca aatgacctgc cggagtacga tttgaaggag 120
gaggcggggc aggctggccc gatcctagtc atgcgctacc gcaacctgat cgagggcgaa 180
gcatccgccg gttcctaatg tacggagcag atgctagggc aaattgccct agcaggggaa 240
aaaggtcgaa aaggtctctt tcctgtggat agcacgtaca ttgggaaccc aaagccgtac 300
attgggaacc ggaacccgta cattgggaac ccaaagccgt acattgggaa ccggtcacac 360
atgtaagtga ctgatataaa agagaaaaaa ggcgattttt ccgcctaaaa ctctttaaaa 420
cttattaaaa ctcttaaaac ccgcctggcc tgtgcataac tgtctggcca gcgcacagcc 480
gaagagctgc aaaaagcgcc tacccttcgg tcgctgcgct ccctacgccc cgccgcttcg 540
cgtcggccta tcgcggccgc tggccgctca aaaatggctg gcctacggcc aggcaatcta 600
ccagggcgcg gacaagccgc gccgtcgcca ctcgaccgcc ggcgcccaca tcaaggcacc 660
ctgcctcgcg cgtttcggtg atgacggtga aaacctctga cacatgcagc tcccggagac 720
ggtcacagct tgtctgtaag cggatgccgg gagcagacaa gcccgtcagg gcgcgtcagc 780
gggtgttggc gggtgtcggg gcgcagccat gacccagtca cgtagcgata gcggagtgta 840
tactggctta actatgcggc atcagagcag attgtactga gagtgcacca tatgcggtgt 900
gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggcgctcttc cgcttcctcg 960
ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag 1020
gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa 1080
ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc 1140
cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca 1200
ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg 1260
accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct 1320
catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt 1380
gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag 1440
tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc 1500
agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac 1560
actagaagga cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga 1620
gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc 1680
aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg 1740
gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca 1800
aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt 1860
atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca 1920
gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg 1980
atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca 2040
ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt 2100
cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt 2160
agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca 2220
cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca 2280
tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga 2340
agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact 2400
gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga 2460
gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caacacggga taataccgcg 2520
ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc 2580
tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga 2640
tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat 2700
gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt 2760
caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt 2820
atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac 2880
gtctaagaaa ccattattat catgacatta acctataaaa ataggcgtat cacgaggccc 2940
tttcgtcttc gaataaatac ctgtgacgga agatcacttc gcagaataaa taaatcctgg 3000
tgtccctgtt gataccggga agccctgggc caacttttgg cgaaaatgag acgttgatcg 3060
gcacgtaaga ggttccaact ttcaccataa tgaaataaga tcactaccgg gcgtattttt 3120
tgagttatcg agattttcag gagctaagga agctaaaatg gagaaaaaaa tcactggata 3180
taccaccgtt gatatatccc aatggcatcg taaagaacat tttgaggcat ttcagtcagt 3240
tgctcaatgt acctataacc agaccgttcc tggatattac ggccttttta aagaccgtaa 3300
agaaaaataa gcacaagttt tatccggcct ttattcacat tcttgcccgc ctgatgaatg 3360
ctcatccgga ataattcgaa gctcggtccc gtgggtgttc tgtcgtctcg ttgtacaacg 3420
aaatccattc ccattccgcg ctcaagatgg cttcccctcg gcagttcatc agggctaaat 3480
caatctagcc gacttgtccg gtgaaatggg ctgcactcca acagaaacaa tcaaacaaac 3540
atacacagcg acttattcac acgagctcaa attacaacgg tatatatcct gccagtcagc 3600
atcatcacac caaaagttag gcccgaatag tttgaaatta gaaagctcgc aattgaggtc 3660
tacaggccaa attcgctctt agccgtacaa tattactcac cggtgcgatg ccccccatcg 3720
taggtgaagg tggaaattaa tgatccatct tgagaccaca ggcccacaac agctaccagt 3780
ttcctcaagg gtccaccaaa aacgtaagcg cttacgtaca tggtcgataa gaaaaggcaa 3840
tttgtagatg ttaattccca tcttgaaaga aatatagttt aaatatttat tgataaaata 3900
acaagtcagg tattatagtc caagcaaaaa cataaattta ttgatgcaag tttaaattca 3960
gaaatatttc aataactgat tatatcagct ggtacattgc cgtagatgaa agactgagtg 4020
cgatattatg tgtaatacat aaattgatga tatagctagc ttagctcatc gggggatccg 4080
tcgacctgca gccaagctgg gatcccagct gggatcccag cttgtcgacg gtaccccctc 4140
tagagttcct tctagacccg atctagtaac atagatgaca ccgcgcgcga taatttatcc 4200
tagtttgcgc gctatatttt gttttctatc gcgtattaaa tgtataattg cgggactcta 4260
atcataaaaa cccatctcat aaataacgtc atgcattaca tgttaattat tacatgctta 4320
acgtaattca acagaaatta tatgataatc atcgcaagac cggcaacagg attcaatctt 4380
aagaaacttt attgccaaat gtttgaacga tcggggatca tccgggtctg tggcgggaac 4440
tccacgaaaa tatccgaacg cagcaagata tcgcggtgca tctcggtctt gcctgggcag 4500
tcgccgccga cgccgttgat gtggacgccg ggcccgatca tattgtcgct caggatcgtg 4560
gcgttgtgct tgtcggccgt tgctgtcgta atgatatcgg caccttcgac cgcctgttcc 4620
gcagagatcc cgtgggcgaa gaactccagc atgagatccc cgcgctggag gatcatccag 4680
ccggcgtccc ggaaaacgat tccgaagccc aacctttcat agaaggcggc ggtggaatcg 4740
aaatctcgtg atggcaggtt gggcgtcgct tggtcggtca tttcgaaccc cagagtcccg 4800
ctcagaagaa ctcgtcaaga aggcgataga aggcgatgcg ctgcgaatcg ggagcggcga 4860
taccgtaaag cacgaggaag cggtcagccc attcgccgcc aagctcttca gcaatatcac 4920
gggtagccaa cgctatgtcc tgatagcggt ccgccacacc cagccggcca cagtcgatga 4980
atccagaaaa gcggccattt tccaccatga tattcggcaa gcaggcatcg ccatgggtca 5040
cgacgagatc atcgccgtcg ggcatgcgcg ccttgagcct ggcgaacagt tcggctggcg 5100
cgagcccctg atgctcttcg tccagatcat cctgatcgac aagaccggct tccatccgag 5160
tacgtgctcg ctcgatgcga tgtttcgctt ggtggtcgaa tgggcaggta gccggatcaa 5220
gcgtatgcag ccgccgcatt gcatcagcca tgatggatac tttctcggca ggagcaaggt 5280
gagatgacag gagatcctgc cccggcactt cgcccaatag cagccagtcc cttcccgctt 5340
cagtgacaac gtcgagcaca gctgcgcaag gaacgcccgt cgtggccagc cacgatagcc 5400
gcgctgcctc gtcctgcagt tcattcaggg caccggacag gtcggtcttg acaaaaagaa 5460
ccgggcgccc ctgcgctgac agccggaaca cggcggcatc agagcagccg attgtctgtt 5520
gtgcccagtc atagccgaat agcctctcca cccaagcggc cggagaacct gcgtgcaatc 5580
catcttgttc aatcatatct cattgccccc cggtctacct acaaaaaagc tccgcacgag 5640
gctgcatttg tcacaaatca tgaaaagaaa aactaccgat gaacaatgct gagggattca 5700
aattctaccc acaaaaagaa gaaagaaaga tctagcacat ctaagcctga cgaagcagca 5760
gaaatatata aaaatataaa ccatagtgcc cttttcccct cttcctgatc ttgtttagca 5820
tggcggaaat tttaaacccc ccatcatctc ccccaacaac ggcggatcgc agatctacat 5880
ccgagagccc cattccccgc gagatccggg ccggatccac gccggcgaga gccccagccg 5940
cgagatcccg cccctcccgc gcaccgatct gggcgcgcac gaagccgcct ctcgcccacc 6000
caaactacca aggccaaaga tcgagaccga gacggaaaaa aaaaacggag aaagaaagag 6060
gagaggggcg gggtggttac cggcgcggcg gcggcggagg gggagggggg aggagctcgt 6120
cgtccggcag cgagggggga ggaggtggag gtggtggtgg tggtggtggt agggttgggg 6180
ggatgggagg agaggggggg gtatgtatat agtggcgatg gggggcgttt ctttggaagc 6240
ggagggaggg ccggcctcgt cgctggctcg cgatcctcct cgcgtttccg gcccccacga 6300
cccggaccca cctgctgttt tttctttttc ttttttttct ttcttttttt ttttttggct 6360
gcgagacgtg cggtgcgtgc ggacaactca cggtgatagt gggggggtgt ggagactatt 6420
gtccagttgg ctggactggg gtgggttggg ttgggttggg ttgggctggg cttgctatgg 6480
atcgtggata gcactttggg ctttaggaac tttaggggtt gtttttgtaa atgttttgag 6540
tctaagttta tcttttattt ttactagaaa aaatacccat gcgctgcaac gggggaaagc 6600
tattttaatc ttattattgt tcattgtgag aattcgcctg aatatatatt tttctcaaaa 6660
attatgtcaa attagcatat gggttttttt aaagatattt cttatacaaa tccctctgta 6720
tttacaaaag caaacgaact taaaacccga ctcaaataca gatatgcatt tccaaaagcg 6780
aataaactta aaaaccaatt catacaaaaa tgacgtatca aagtaccgac aaaaacatcc 6840
tcaattttta taatagtaga aaagagtaaa tttcactttg ggccaccttt tattaccgat 6900
attttacttt ataccacctt ttaactgatg ttttcacttt tgaccaggta atcttacctt 6960
tgttttattt tggactatcc cgactctctt ctcaagcata tgaatgaccg tatgctagtg 7020
cggccgcaag cttgactact agtctctctt aaggtagcat cacaagtttg tacaaaaaag 7080
caggctcctg caggtgagac ttttcaacaa agggtaatat cgggaaacct cctcggattc 7140
cattgcccag ctatctgtca cttcatcgaa aggacagtag aaaaggaagg tggctcctac 7200
aaatgccatc attgcgataa aggaaaggct atcgttcaag atgcctctac cgacagtggt 7260
cccaaagatg gacccccacc cacgaggaac atcgtggaaa aagaagacgt tccaaccacg 7320
tcttcaaagc aagtggattg atgtgatatc tccactgacg taagggatga cgcacaatcc 7380
cactatcctt cgcaagaccc ttcctctata taaggaagtt catttcattt ggagaggaca 7440
ggcttcttga gatccttcaa caattaccaa caacaacaaa caacaaacaa cattacaatt 7500
actatttaca attacagtcg actctagagg atccggccca gttggaatgt aggtggtgag 7560
caagggcgag gagctgttca ccggggtggt gcccatcctg gtcgagctgg acggcgacgt 7620
aaacggccac aagttcagcg tgtccggcga gggcgagggc gatgccacct acggcaagct 7680
gaccctgaag ttcatctgca ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac 7740
caccttcacc tacggcgtgc agtgcttcag ccgctacccc gaccacatga agcagcacga 7800
cttcttcaag tccgccatgc ccgaaggcta cgtccaggag cgcaccatct tcttcaagga 7860
cgacggcaac tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg 7920
catcgagctg aagggcatcg acttcaagga ggacggcaac atcctggggc acaagctgga 7980
gtacaactac aacagccaca acgtctatat catggccgac aagcagaaga acggcatcaa 8040
ggtgaacttc aagatccgcc acaacatcga ggacggcagc gtgcagctcg ccgaccacta 8100
ccagcagaac acccccatcg gcgacggccc cgtgctgctg cccgacaacc actacctgag 8160
cacccagtcc gccctgagca aagaccccaa cgagaagcgc gatcacatgg tcctgctgga 8220
gttcgtgacc gccgccggga tcactcacgg catggacgag ctgtacaagt aaagcggccg 8280
cccggctgca ttcgagtatt atggcattgg gaaaactgtt tttcttgtac catttgttgt 8340
gcttgtaatt tactgtgttt tttattcggt tttcgctatc gaactgtgaa atggaaatgg 8400
atggagaaga gttaatgaat gatatggtcc ttttgttcat tctcaaatta atattatttg 8460
ttttttctct tatttgttgt gtgttgaatt tgaaattata agagatatgc aaacattttg 8520
ttttgagtaa aaatgtgtca aatcgtggcc tctaatgacc gaagttaata tgaggagtaa 8580
aacactagac ccagctttct tgtacaaagt ggtgatgttg tggtcgaccc atcgatgggc 8640
atgcaagctg ggatcccagc ttggtaccag atcttataat taaatggcct tcgctgccca 8700
tattattggt aactcaacag catcaatcac gggatttttc tcgaattaat tgcgtcgaat 8760
ctcagcatcg aaatattcgc ctttttcgtc cattagacta tctattgtga tggtggattt 8820
atcacaaatg ggacccgccg ccgacagagg tgtgatgtta ggccaggact ttgaaaattt 8880
gcgcaactat cgtatagtgg ccgacaaatt gacgccgagt tgacagactg cctagcattt 8940
gagtgaatta tgtaaggtaa tgggctacac tgaattggta gctcaaactg tcagtattta 9000
tgtatatgag tgtatatttt cgcataatct cagaccaatc tgaagatgaa atgggtatct 9060
gggaatggcg aaatcaaggc atcgatcgtg aagtttctca tctaagcccc catttggacg 9120
tgaatgtaga cacgtcgaaa taaagatttc cgaattagaa taatttgttt attgctttcg 9180
cctataaata cgacggatcg taatttgtcg ttttatcaaa atgtactttc attttataat 9240
aacgctgcgg acatctacat ttttgaattg aaaaaaaatt ggtaattact ctttcttttt 9300
ctccatattg accatcatac tcattgctga tccatgtaga tttcccggac atgaagccat 9360
ttacaattga atatatcctg ccgccgctgc cgctttgcac ccggtggagc ttgcatgttg 9420
gtttctacgc agaactgagc cggttaggca gataatttcc attgagaact gagccatgtg 9480
caccttcccc ccaacacggt gagcgacggg gcaacggagt gatccacatg ggacttttaa 9540
acatcatccg tcggatggcg ttgcgagaga agcagtcgat ccgtgagatc agccgacgca 9600
ccgggcaggc gcgcaacacg atcgcaaagt atttgaacgc aggtacaatc gagccgacgt 9660
tcacggtacc ggaacgacca agcaagctag cttagtaaag ccctcgctag attttaatgc 9720
ggatgttgcg attacttcgc caactattgc gataacaaga aaaagccagc ctttcatgat 9780
atatctccca atttgtgtag ggcttattat gcacgcttaa aaataataaa agcagacttg 9840
acctgatagt ttggctgtga gcaattatgt gcttagtgca tctaacgctt gagttaagcc 9900
gcgccgcgaa gcggcgtcgg cttgaacgaa ttgttagaca ttatttgccg actaccttgg 9960
tgatctcgcc tttcacgtag tggacaaatt cttccaactg atctgcgcgc gaggccaagc 10020
gatcttcttc ttgtccaaga taagcctgtc tagcttcaag tatgacgggc tgatactggg 10080
ccggcaggcg ctccattgcc cagtcggcag cgacatcctt cggcgcgatt ttgccggtta 10140
ctgcgctgta ccaaatgcgg gacaacgtaa gcactacatt tcgctcatcg ccagcccagt 10200
cgggcggcga gttccatagc gttaaggttt catttagcgc ctcaaataga tcctgttcag 10260
gaaccggatc aaagagttcc tccgccgctg gacctaccaa ggcaacgcta tgttctcttg 10320
cttttgtcag caagatagcc agatcaatgt cgatcgtggc tggctcgaag atacctgcaa 10380
gaatgtcatt gcgctgccat tctccaaatt gcagttcgcg cttagctgga taacgccacg 10440
gaatgatgtc gtcgtgcaca acaatggtga cttctacagc gcggagaatc tcgctctctc 10500
caggggaagc cgaagtttcc aaaaggtcgt tgatcaaagc tcgccgcgtt gtttcatcaa 10560
gccttacggt caccgtaacc agcaaatcaa tatcactgtg tggcttcagg ccgccatcca 10620
ctgcggagcc gtacaaatgt acggccagca acgtcggttc gagatggcgc tcgatgacgc 10680
caactacctc tgatagttga gtcgatactt cggcgatcac cgcttccctc atgatgttta 10740
actttgtttt agggcgactg ccctgctgcg taacatcgtt gctgctccat aacatcaaac 10800
atcgacccac ggcgtaacgc gcttgctgct tggatgcccg aggcatagac tgtaccccaa 10860
aaaaacagtc ataacaagcc atgaaaaccg ccactgcgcc gttaccaccg ctgcgttcgg 10920
tcaaggttct ggaccagttg cgtgagcgca tacgctactt gcattacagc ttacgaaccg 10980
aacaggctta tgtccactgg gttcgtgcct tcatccgttt ccacggtgtg cgtcacccgg 11040
caaccttggg cagcagcgaa gtcgaggcat ttctgtcctg gctggcgaac gagcgcaagg 11100
tttcggtctc cacgcatcgt caggcattgg cggccttgct gttcttctac ggcaaggtgc 11160
tgtgcacgga tctgccctgg cttcaggaga tcggaagacc tcggccgtcg cggcgcttgc 11220
cggtggtgct gaccccggat gaagtggttc gcatcctcgg ttttctggaa ggcgagcatc 11280
gtttgttcgc ccagcttctg tatggaacgg gcatgcggat cagtgagggt ttgcaactgc 11340
gggtcaagga tctggatttc gatcacggca cgatcatcgt gcgggagggc aagggctcca 11400
aggatcgggc cttgatgtta cccgagagct tggcacccag cctgcgcgag caggatcgat 11460
ccaacccctc cgctgctata gtgcagtcgg cttctgacgt tcagtgcagc cgtcttctga 11520
aaacgacatg tcgcacaagt cctaagttac gcgacaggct gccgccctgc ccttttcctg 11580
gcgttttctt gtcgcgtgtt ttagtcgcat aaagtagaat acttgcgact agaaccggag 11640
acattacgcc atgaacaaga gcgccgccgc tggcctgctg ggctatgccc gcgtcagcac 11700
cgacgaccag gacttgacca accaacgggc cgaactgcac gcggccggct gcaccaagct 11760
gttttccgag aagatcaccg gcaccaggcg cgaccgcccg gagctggcca ggatgcttga 11820
ccacctacgc cctggcgacg ttgtgacagt gaccaggcta gaccgcctgg cccgcagcac 11880
ccgcgaccta ctggacattg ccgagcgcat ccaggaggcc ggcgcgggcc tgcgtagcct 11940
ggcagagccg tgggccgaca ccaccacgcc ggccggccgc atggtgttga ccgtgttcgc 12000
cggcattgcc gagttcgagc gttccctaat catcgaccgc acccggagcg ggcgcgaggc 12060
cgccaaggcc cgaggcgtga agtttggccc ccgccctacc ctcaccccgg cacagatcgc 12120
gcacgcccgc gagctgatcg accaggaagg ccgcaccgtg aaagaggcgg ctgcactgct 12180
tggcgtgcat cgctcgaccc tgtaccgcgc acttgagcgc agcgaggaag tgacgcccac 12240
cgaggccagg cggcgcggtg ccttccgtga ggacgcattg accgaggccg acgccctggc 12300
ggccgccgag aatgaacgcc aagaggaaca agcatgaaac cgcaccagga cggccaggac 12360
gaaccgtttt tcattaccga agagatcgag gcggagatga tcgcggccgg gtacgtgttc 12420
gagccgcccg cgcacgtctc aaccgtgcgg ctgcatgaaa tcctggccgg tttgtctgat 12480
gccaagctgg cggcctggcc ggccagcttg gccgctgaag aaaccgagcg ccgccgtcta 12540
aaaaggtgat gtgtatttga gtaaaacagc ttgcgtcatg cggtcgctgc gtatatgatg 12600
cgatgagtaa ataaacaaat acgcaagggg aacgcatgaa ggttatcgct gtacttaacc 12660
agaaaggcgg gtcaggcaag acgaccatcg caacccatct agcccgcgcc ctgcaactcg 12720
ccggggccga tgttctgtta gtcgattccg atccccaggg cagtgcccgc gattgggcgg 12780
ccgtgcggga agatcaaccg ctaaccgttg tcggcatcga ccgcccgacg attgaccgcg 12840
acgtgaaggc catcggccgg cgcgacttcg tagtgatcga cggagcgccc caggcggcgg 12900
acttggctgt gtccgcgatc aaggcagccg acttcgtgct gattccggtg cagccaagcc 12960
cttacgacat atgggccacc gccgacctgg tggagctggt taagcagcgc attgaggtca 13020
cggatggaag gctacaagcg gcctttgtcg tgtcgcgggc gatcaaaggc acgcgcatcg 13080
gcggtgaggt tgccgaggcg ctggccgggt acgagctgcc cattcttgag tcccgtatca 13140
cgcagcgcgt gagctaccca ggcactgccg ccgccggcac aaccgttctt gaatcagaac 13200
ccgagggcga cgctgcccgc gaggtccagg cgctggccgc tgaaattaaa tcaaaactca 13260
tttgagttaa tgaggtaaag agaaaatgag caaaagcaca aacacgctaa gtgccggccg 13320
tccgagcgca cgcagcagca aggctgcaac gttggccagc ctggcagaca cgccagccat 13380
gaagcgggtc aactttcagt tgccggcgga ggatcacacc aagctgaaga tgtacgcggt 13440
acgccaaggc aagaccatta ccgagctgct atctgaatac atcgcgcagc taccagagta 13500
aatgagcaaa tgaataaatg agtagatgaa ttttagcggc taaaggaggc ggcatggaaa 13560
atcaagaaca accaggcacc gacgccgtgg aatgccccat gtgtggagga acgggcggtt 13620
ggccaggcgt aagcggctgg gttgtctgcc ggccctgcaa tggcactgga acccccaagc 13680
ccgaggaatc ggcgtgagcg gtcgcaaacc atccggcccg gtacaaatcg gcgcggcgct 13740
gggtgatgac ctggtggaga agttgaaggc cgcgcaggcc gcccagcggc aacgcatcga 13800
ggcagaagca cgccccggtg aatcgtggca agcggccgct gatcgaatcc gcaaagaatc 13860
ccggcaaccg ccggcagccg gtgcgccgtc gattaggaag ccgcccaagg gcgacgagca 13920
accagatttt ttcgttccga tgctctatga cgtgggcacc cgcgatagtc gcagcatcat 13980
ggacgtggcc gttttccgtc tgtcgaagcg tgaccgacga gctggcgagg tgatccgcta 14040
cgagcttcca gacgggcacg tagaggtttc cgcagggccg gccggcatgg ccagtgtgtg 14100
ggattacgac ctggtactga tggcggtttc ccatctaacc gaatccatga accgataccg 14160
ggaagggaag ggagacaagc ccggccgcgt gttccgtcca cacgttgcgg acgtactcaa 14220
gttctgccgg cgagccgatg gcggaaagca gaaagacgac ctggtagaaa cctgcattcg 14280
gttaaacacc acgcacgttg ccatgcagcg tacgaagaag gccaagaacg gccgcctggt 14340
gacggtatcc gagggtgaag ccttgattag ccgctacaag atcgtaaaga gcgaaaccgg 14400
gcggccggag tacatcgaga tcgagctagc tgattggatg taccgcgaga tcacagaagg 14460
caagaacccg gacgtgctga cggttcaccc cgattacttt ttgatcgatc ccggcatcgg 14520
ccgttttctc taccgcctgg cacgccgcgc cgcaggcaag gcagaagcc 14569
<210> 11
<211> 18695
<212> DNA
<213> 人工序列
<220>
<223> 2408的完整核苷酸序列。
<400> 11
taaacgctct tttctcttag gtttacccgc caatatatcc tgtcaaacac tgatagttta 60
aactgaaggc gggaaacgac aatctgatcc aagctcaagc tccaatacgc aaaccgcctc 120
tccccgcgcg ttggccgatt cattaatgca gctggcacga caggtttccc gactggaaag 180
cgggcagtga gcgcaacgca attaatgtga gttagctcac tcattaggca ccccaggctt 240
tacactttat gcttccggct cgtatgttgt gtggaattgt gagcggataa caatttcaca 300
caggaaacag ctatgaccat gattacgaat ttcaggtgac tgatagtgac ctgttcgttg 360
caacaaattg atgagcaatg cttttttata atgccaactt tgtacaaaaa agcaggcggc 420
gcgtcctgca ggatagggat aacagggtaa tggcgcgcca agcttatcga taccgtcgac 480
ctcgagcggc cgccagtgtg atggatatct gcagaattgc ccttcgaagg gacaaaaaaa 540
gcaccgactc ggtgccactt tttcaagttg ataacggact agccttattt taacttgcta 600
tttctagctc taaaacgccc agttggaatg taggtgcaac acaagcgaca gcgcgcgggt 660
ttataagttg gtcgcgttcg agttagctgg gcaatgtggt actaaactgt tcctcccgcc 720
tctcgcgctc acactcgccc tgtgggccgc tcaccgtgca cgtacttggg cctcccgctc 780
ccccgcatgc atccagccca tcacagcgaa gagaatcggg cttttcttct ccccatctcc 840
ctacacaacc accaaataca gccaggccgt tggttcatga tccaagggca attccagcac 900
actggcggcc gttactagtg gatccgagct cggtacctta attaaattac cctgttatcc 960
ctatcctgca ggattaacac ccaacttttc tatccaagct tgccaacatg gtggagcacg 1020
acactctcgt ctactccaag aatatcaaag atacagtctc agaagaccaa agggctattg 1080
agacttttca acaaagggta atatcgggaa acctcctcgg attccattgc ccagctatct 1140
gtcacttcat caaaaggaca gtagaaaagg aaggtggcac ctacaaatgc catcattgcg 1200
ataaaggaaa ggctatcgtt caagatgcct ctgccgacag tggtcccaaa gatggacccc 1260
cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 1320
attgatgtga taacatggtg gagcacgaca ctctcgtcta ctccaagaat atcaaagata 1380
cagtctcaga agaccaaagg gctattgaga cttttcaaca aagggtaata tcgggaaacc 1440
tcctcggatt ccattgccca gctatctgtc acttcatcaa aaggacagta gaaaaggaag 1500
gtggcaccta caaatgccat cattgcgata aaggaaaggc tatcgttcaa gatgcctctg 1560
ccgacagtgg tcccaaagat ggacccccac ccacgaggag catcgtggaa aaagaagacg 1620
ttccaaccac gtcttcaaag caagtggatt gatgtgatat ctccactgac gtaagggatg 1680
acgcacaatc ccactatcct tcgcaagacc cttcctctat ataaggaagt tcatttcatt 1740
tggagaggcc ggtctagaga attccaagca acgaactgcg agtgattcaa gaaaaaagaa 1800
aacctgagct ttcgatctct acggagtggt ttcttgttct ttgaaaaaga gggggattac 1860
atatggctcc taagaagaag cggaaggttg gtattcacgg ggtgcctgcg gctatggaca 1920
agaagtactc gatcgggctg gccatcggaa caaattctgt aggctgggct gtaataaccg 1980
atgagtacaa ggtgccctct aaaaaattta aggtccttgg caatacggat agacattcca 2040
taaagaagaa tcttatcggt gcgctgctct ttgacagcgg cgagaccgcg gaggcgaccc 2100
ggttgaaacg caccgcgaga cgccgttaca caaggcgtaa gaatagaatc tgttatctcc 2160
aggagatatt ctctaatgaa atggcgaagg tagacgattc cttctttcac cgtctggagg 2220
aaagttttct cgttgaggaa gataagaaac atgaaagaca cccgatcttc ggaaacattg 2280
tcgacgaggt cgcttatcat gaaaagtacc ctaccatcta ccatcttaga aagaaacttg 2340
ttgacagcac ggataaggct gatctcaggc tgatatacct ggctctggca catatgatta 2400
agttcagagg gcatttcctt atcgaaggcg acctgaatcc agataattca gatgtagaca 2460
agctcttcat tcaacttgtg cagacttata atcagctctt cgaagaaaat ccaataaacg 2520
cgtcgggtgt agacgcaaag gccatactgt ccgctaggct ttctaagtca cgtagacttg 2580
agaatctcat tgcccaactc cccggcgaga agaagaacgg cttgtttgga aatctgatag 2640
cgctgtccct gggtcttaca ccaaatttca agagtaattt cgatttggca gaagatgcta 2700
agttgcagct cagtaaagac acctacgatg acgatcttga taatttgttg gctcagattg 2760
gcgatcagta tgcagatctt ttcttggccg ctaagaattt gtctgatgca attctgctta 2820
gcgacatttt gagggttaat acagaaatca ccaaggcacc cttgtcggcg tcaatgataa 2880
agaggtatga tgagcaccac caagacctga cgctcctcaa ggctcttgtt cggcagcaat 2940
tgccggagaa gtacaaagag atcttcttcg accagtctaa gaacggatat gcgggctaca 3000
tagacggtgg agcgagtcag gaggaattct acaagttcat aaagcccatt ctcgagaaga 3060
tggatggtac ggaagaactg cttgtgaaac ttaacagaga agatcttttg cggaagcaga 3120
gaactttcga caacggaagt ataccacacc agatacatct cggagagctt catgctattc 3180
tcagaagaca agaggatttc taccctttct tgaaggataa cagagaaaag atagagaaga 3240
tcctcacgtt taggatccct tactacgtag gtcctcttgc tcgcggcaat agtaggttcg 3300
cctggatgac ccgcaagtct gaagaaacta tcaccccttg gaatttcgaa gaggttgtag 3360
acaaaggtgc ttcagcacag agtttcattg agaggatgac caacttcgac aagaacctcc 3420
ccaacgaaaa ggtcctgcct aagcacagcc tcctctacga atactttact gtctataatg 3480
agcttacaaa agttaagtac gtgacagagg gaatgcggaa gcccgcattc ctttccggag 3540
aacaaaagaa ggcgatcgtg gatcttctct tcaagacgaa ccgcaaggtg acggttaaac 3600
agttgaagga agattacttc aagaagatag aatgttttga tagcgtggaa atcagcggcg 3660
tcgaagatag gttcaacgct tccctgggaa cgtaccacga tctcctcaag attatcaaag 3720
ataaggactt tcttgataac gaagagaatg aggacatctt ggaagacatt gttctgacgc 3780
tcaccctgtt cgaagatcgc gagatgattg aggaacgctt gaagacctac gcacacctgt 3840
tcgatgacaa ggttatgaag caacttaaac ggcgccggta tacgggctgg ggacggcttt 3900
cgcggaagct gataaatgga atccgtgaca agcagtctgg caagacaata ctcgacttct 3960
tgaagtcgga tggttttgcc aatagaaatt ttatgcaact cattcatgat gactcgctta 4020
cttttaagga ggacatccag aaggcccagg tatcaggaca gggtgactct ttgcacgaac 4080
acatcgcgaa cctggcgggc tcccccgcga ttaagaaggg aattttgcag actgtcaagg 4140
tggtcgatga actcgtgaag gttatgggac gtcataagcc ggaaaatatt gtgattgaga 4200
tggctcgcga gaatcaaaca acacagaagg gccaaaagaa cagtagagaa cgcatgaagc 4260
gcatcgaaga gggcatcaaa gagctgggca gtcagatcct taaagaacat ccagtcgaga 4320
atacacagct tcagaacgaa aagctgtacc tttattacct tcaaaatggg cgtgatatgt 4380
atgtggatca ggaactcgat atcaataggc tgagtgacta tgatgtcgac gctatcgtcc 4440
cgcaaagttt cctcaaggac gacagtatag acaacaaagt tctcacacgg tcagataaga 4500
atcgcggcaa gagcgataat gtaccgtcgg aggaggtagt caagaagatg aagaattact 4560
ggcgccagtt gctcaacgcc aagctcatca ctcagaggaa atttgacaac cttacgaaag 4620
ccgagcgggg cggactctct gaactggaca aggccggttt cataaagcgc cagctcgttg 4680
agacacgtca aattactaag cacgtcgctc aaatattgga ttcccgcatg aatactaagt 4740
acgatgagaa tgataagctc atacgtgaag ttaaggtcat tactctcaag tccaagcttg 4800
tatcggactt ccgtaaggac ttccaattct acaaggtccg ggaaatcaat aattatcacc 4860
atgcccatga cgcttatctg aacgcggtcg tgggcacggc actcattaag aaatacccaa 4920
aacttgagtc agaatttgtt tacggggact ataaagttta tgacgtgcgg aagatgatag 4980
cgaagtcgga acaagagata ggaaaggcga ctgcaaagta ctttttttac tccaacataa 5040
tgaatttctt taagaccgaa ataacccttg caaacggtga aatcagaaag cggcctctga 5100
ttgaaacaaa tggcgagacg ggcgagatcg tctgggacaa ggggagggac ttcgcaacgg 5160
ttcgcaaggt ccttagcatg ccgcaagtaa atatagttaa gaagacggaa gttcagaccg 5220
gcggctttag taaagaaagc atacttccta aaaggaattc cgacaaactg atagcgcgca 5280
agaaggactg ggatccaaag aagtatggag gatttgactc cccaaccgtt gcttatagcg 5340
tgttggtagt agccaaggtg gaaaagggta agtctaagaa attgaagtcg gtgaaggagt 5400
tgttggggat aactataatg gagcggagtt cgttcgagaa gaacccaatt gactttctcg 5460
aagccaaagg ctacaaggag gtcaagaagg acctgattat taagttgcca aagtactcgc 5520
tcttcgaact cgagaacggg agaaagcgta tgctggcgtc ggcgggcgag ctgcagaaag 5580
gaaacgagct ggctttgcca tcgaaatacg taaatttcct gtacctcgcc tcacattatg 5640
agaagcttaa agggtctcca gaagacaatg aacagaagca gctgtttgtt gaacagcaca 5700
agcactactt ggacgagatt atagaacaaa tctccgagtt ctctaaacgg gttatccttg 5760
cagacgccaa tttggataag gtcctctcgg cttataataa gcatagagat aagccaatcc 5820
gggagcaggc tgaaaatatc atacacctct ttacgttgac taatttgggt gcgccagcgg 5880
cattcaagta cttcgataca acaatcgatc gtaagcgcta cacaagcact aaggaagtcc 5940
tggacgcgac gctgatacac cagtccatta ctggactgta tgaaaccaga atagatctta 6000
gccagctcgg cggtgatgga ggagggccta gggctgatcc taagaagaag aggaaggttg 6060
gaggagggcc aggagcagag tatgttagag cgttgtttga ttttaacggt aacgatgaag 6120
aggatttacc ctttaagaaa ggcgacattc tcaggattag ggataaacct gaagagcaat 6180
ggtggaatgc tgaggatagt gaaggcaaac gaggaatgat tttagtgccg tatgtggaga 6240
aatattcggg tgactacaaa gatcatgatg gtgattacaa agaccatgac atcgactaca 6300
aggatgatga tgataagtca gggatgacag atgctgaata tgtcagaatc cacgaaaagt 6360
tggacattta cacgtttaag aagcagttct tcaacaacaa gaaatctgtt tcgcataggt 6420
gctatgtgct tttcgaacta aaacgtcgtg gagaaagacg ggcttgcttt tggggttacg 6480
cggttaacaa accacaatca ggtactgaac gaggaataca cgctgaaatc ttttctatcc 6540
gaaaggttga ggaatatcta cgtgacaatc ctggacagtt cactatcaat tggtattcta 6600
gctggtcacc atgtgcagat tgtgctgaga agattctcga atggtacaat caagagctta 6660
gaggcaatgg acatacattg aaaatatggg catgcaagct ctactacgaa aagaatgcca 6720
gaaaccaaat tgggctttgg aacttgaggg ataatggagt tgggcttaat gtcatggttt 6780
ctgagcacta tcaatgttgt cggaagatct tcatacaaag ttcccataac cagttgaatg 6840
agaacagatg gttagagaaa acccttaaaa gagccgagaa gagaagatcc gaactgagca 6900
ttatgataca ggtcaaaatt ctgcatacca ctaagagtcc agctgtaggt cctaagaaga 6960
aacgtaaagt agggccctga tccaggcctc ccagctttcg tccgtatcat cggtttcgac 7020
aacgttcgtc aagttcaatg catcagtttc attgcccaca caccagaatc ctactaagtt 7080
tgagtattat ggcattggaa aagctgtttt cttctatcat ttgttctgct tgtaatttac 7140
tgtgttcttt cagtttttgt tttcggacat caaaatgcaa atggatggat aagagttaat 7200
aaatgatatg gtccttttgt tcattctcaa attattatta tctgttgttt ttactttaat 7260
gggttgaatt taagtaagaa aggaactaac agtgtgatat taaggtgcaa tgttagacat 7320
ataaaacagt ctttcacctc tctttggtta tgtcttgaat tggtttgttt cttcacttat 7380
ctgtgtaatc aagtttacta tgagtctatg atcaagtaat tatgcaatca agttaagtac 7440
agtataggct tgagctccct aggcccctag gtaattcttc ggacccaaga atgctaagcc 7500
aagaggagct gttatcgccg tcctcctgct tgtttctctc tttttgttgc tgtttcttca 7560
ttagcgtgga caaagttttc aaccggccta tctgttatca ttttcttcta ttcaaagact 7620
gtaataccta ttgctacctg tggttctcac ttgtgatttt ggacacatat gttcggttta 7680
ttcaaattta atcagatgcc tgatgagggt accagaaaaa atacgtgttc tggttgtttt 7740
tgagttgcga ttattctatg aaatgaataa catcgaagtt atcatcccag tattttcgca 7800
tgaatgttct tttcttctgt cttgtgcatc agtgatctag tgcatgggag tttgtattgt 7860
gatgttcgac atcacgtaac ttccactttg cctttgctgt tcgatatttt aatgacatgt 7920
cacacacact tctgatactt ttctttcttg gctattgtgc cagcatgatg caagatgcat 7980
cacagcatca gatatattct catcgtcagg ctttagcagc acacgagcac gctttgccgc 8040
ttaaaagttg tacggcgcag cttagacatc ccctgtagaa gtgataatct tttcactttt 8100
ccttaaacaa attgagaggg gaaatggaac catgtggatc agagaagctt ttgtttcttt 8160
acacaagaat atttggtaca gtgggggtcc tatgttcgtg ggttcgtggc ttggctgcct 8220
gtcttcaacc aagtgttttc agttcaacat gttagcgtgt agaaagagca caattctgtt 8280
tatctccaag gtaaaatgtg gcattctgtt aaagaacatg atcctgccaa ttttttaagt 8340
ttcaatggaa gaggaatgta aagctttcta tggtttgtgt acacaacaca gtggaagagg 8400
agtgcaagct ttctatggtt tgtgtgcgcg ttgtgtgtca gcacttcaat tttgttagaa 8460
aatgaaagaa aaaaaaggat gatcatgctt atagtaaatc actctttttc ctcgccttct 8520
gtacgttttg acttgacaag attttaaaat ctgtacatga cctttgtttt aaaattactt 8580
tatgtatttc catctttcaa gttatgcaga tgtcatcaca aattgttaca ccaatcacca 8640
ggctggctgt ttatatatta tcagaccagg ctatatagag tatactatac taactgttca 8700
tattatctgg aaatcttgct tgctacttga gcggtaaaag ggtatagata tgagggtccc 8760
cagattagcc ttttcaattt cagaaagaat gctaacccac agatggttag agaggcttac 8820
gcagcaggtc tcatcaagac gatctacccg agcaataatc tccaggaaat caaatacctt 8880
cccaagaagg ttaaagatgc agtcaaaaga ttcaggacta actgcatcaa gaacacagag 8940
aaagatatat ttctcaagat cagaagtact attccagtat ggacgattca aggcttgctt 9000
cacaaaccaa ggcaagtaat agagattgga gtctctaaaa aggtagttcc cactgaatca 9060
aaggccatgg agtcaaagat tcaaatagag gacctaacag aactcgccgt aaagactggc 9120
gaacagttca tacagagtct cttacgactc aatgacaaga agaaaatctt cgtcaacatg 9180
gtggagcacg acacacttgt ctactccaaa aatatcaaag atacagtctc agaagaccaa 9240
agggcaattg agacttttca acaaagggta atatccggaa acctcctcgg attccattgc 9300
ccagctatct gtcactttat tgtgaagata gtggaaaagg aaggtggctc ctacaaatgc 9360
catcattgcg ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa 9420
gatggacccc cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca 9480
aagcaagtgg attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat 9540
ccttcgcaag acccttcctc tatataagga agttcatttc atttggagag aacacggggg 9600
actctagaat gaaaaagcct gaactcaccg cgacgtctgt cgagaagttt ctgatcgaaa 9660
agttcgacag cgtctccgac ctgatgcagc tctcggaggg cgaagaatct cgtgctttca 9720
gcttcgatgt aggagggcgt ggatatgtcc tgcgggtaaa tagctgcgcc gatggtttct 9780
acaaagatcg ttatgtttat cggcactttg catcggccgc gctcccgatt ccggaagtgc 9840
ttgacattgg ggagtttagc gagagcctga cctattgcat ctcccgccgt tcacagggtg 9900
tcacgttgca agacctgcct gaaaccgaac tgcccgctgt tctacaaccg gtcgcggagg 9960
ctatggatgc gatcgctgcg gccgatctta gccagacgag cgggttcggc ccattcggac 10020
cgcaaggaat cggtcaatac actacatggc gtgatttcat atgcgcgatt gctgatcccc 10080
atgtgtatca ctggcaaact gtgatggacg acaccgtcag tgcgtccgtc gcgcaggctc 10140
tcgatgagct gatgctttgg gccgaggact gccccgaagt ccggcacctc gtgcacgcgg 10200
atttcggctc caacaatgtc ctgacggaca atggccgcat aacagcggtc attgactgga 10260
gcgaggcgat gttcggggat tcccaatacg aggtcgccaa catcttcttc tggaggccgt 10320
ggttggcttg tatggagcag cagacgcgct acttcgagcg gaggcatccg gagcttgcag 10380
gatcgccacg actccgggcg tatatgctcc gcattggtct tgaccaactc tatcagagct 10440
tggttgacgg caatttcgat gatgcagctt gggcgcaggg tcgatgcgac gcaatcgtcc 10500
gatccggagc cgggactgtc gggcgtacac aaatcgcccg cagaagcgcg gccgtctgga 10560
ccgatggctg tgtagaagta ctcgccgata gtggaaaccg acgccccagc actcgtccga 10620
gggcaaagaa ataggagctc tgggctaatc taaaacgatt tatctgtggc ttcaagtgta 10680
tcgatcactt atgtgaggtg taattactgg tgtttttggt gtgctctggt tcctttcaag 10740
tgtgttgttg ccgctcgaac tactccgcta tgtaaaacgg taaaacctgt tgtctcatta 10800
tgaaagtgaa ctatattatg ttctactact actctactta gtcaattttc ttcaccttga 10860
ttagtgtaaa tatgaatctt atattcttat gtcttaagaa attagcacat gtgaagcctc 10920
caagtgcata ttttctcgat cgcgagacgc acaatgcgtg agaaattcag ctggttatac 10980
tcaaatatat taatatatct agcagcagct catggagatt caggaaactt ggcatcccta 11040
atccctacca tttccattct tccgagattg acagttcaat acaagtacag taatctcctg 11100
gtaagtttct tattaacttg acatgtagta gtaataattt gtacgtagca tagatacata 11160
gacacaaaaa tgtcctcccc attgagctag ccgattggag ccgaacaccg caggaatgaa 11220
tttacataat ctgcaaagaa taaatggaat gtgcctccac aggaaaacca gcggcagtgt 11280
ggcgttttca agagcagccg taagtcgaag cctattctga atcgtagaaa tcactggggc 11340
atggtgtaat tacatccgac tccaacatct gtaccaccct gtgcattgta ggccgctcct 11400
ctggcaaaga acttacacat tgtttagcaa gagaaagtag agcatccaag gtctcaatct 11460
gcactccctc acaatatgga tcgacaattt ccctctcccg attctcaccg accaggaaat 11520
tcaactgcca cagagcaagt agattatttc aagaatacat taaatcaatt gaaggcatac 11580
gtaattcata tcagaaaact gtggatatga aatggaagga cataaaggtc atacataccc 11640
atccaacaat gttcaatccc ttttcaataa atgatgcatc agtaggtcgt tttccgctta 11700
gtatttcaag tagcaaaact ccaaaactgt agacgtcagt cttttcggtg gctctgccac 11760
tttgcatata ctcctgcagg tcgaccatag tgactggata tgttgtgttt tacagtatta 11820
tgtagtctgt tttttatgca aaatctaatt taatatattg atatttatat cattttacgt 11880
ttctcgttca gctttcttgt acaaagtggt gatatcccgc ggaaatacgt agaattcggg 11940
aagcttggca ctggccgtcg ttttacaacg tcgtgactgg gaaaaccctg gcgttaccca 12000
acttaatcgc cttgcagcac atcccccttt cgccagctgg cgtaatagcg aagaggcccg 12060
caccgatcgc ccttcccaac agttgcgcag cctgaatggc gaatgctaga gcaattcggc 12120
gttaattcag tacattaaaa acgtccgcaa tgtgttatta agttgtctaa gcgtcaattt 12180
gtttacacca caatatatcc tgccaccagc cagccaacag ctccccgacc ggcagctcgg 12240
cacaaaatca ccactcgata caggcagccc atcagtccgg gacggcgtca gcgggagagc 12300
cgttgtaagg cggcagactt tgctcatgtt accgatgcta ttcggaagaa cggcaactaa 12360
gctgccgggt ttgaaacacg gatgatctcg cggagggtag catgttgatt gtaacgatga 12420
cagagcgttg ctgcctgtga tcaattcggg cacgaaccca gtggacataa gcctcgttcg 12480
gttcgtaagc tgtaatgcaa gtagcgtaac tgccgtcacg caactggtcc agaaccttga 12540
ccgaacgcag cggtggtaac ggcgcagtgg cggttttcat ggcttcttgt tatgacatgt 12600
ttttttgggg tacagtctat gcctcgggca tccaagcagc aagcgcgtta cgccgtgggt 12660
cgatgtttga tgttatggag cagcaacgat gttacgcagc agggcagtcg ccctaaaaca 12720
aagttaaaca tcatggggga agcggtgatc gccgaagtat cgactcaact atcagaggta 12780
gttggcgtca tcgagcgcca tctcgaaccg acgttgctgg ccgtacattt gtacggctcc 12840
gcagtggatg gcggcctgaa gccacacagt gatattgatt tgctggttac ggtgaccgta 12900
aggcttgatg aaacaacgcg gcgagctttg atcaacgacc ttttggaaac ttcggcttcc 12960
cctggagaga gcgagattct ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc 13020
attccgtggc gttatccagc taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac 13080
attcttgcag gtatcttcga gccagccacg atcgacattg atctggctat cttgctgaca 13140
aaagcaagag aacatagcgt tgccttggta ggtccagcgg cggaggaact ctttgatccg 13200
gttcctgaac aggatctatt tgaggcgcta aatgaaacct taacgctatg gaactcgccg 13260
cccgactggg ctggcgatga gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc 13320
gcagtaaccg gcaaaatcgc gccgaaggat gtcgctgccg actgggcaat ggagcgcctg 13380
ccggcccagt atcagcccgt catacttgaa gctagacagg cttatcttgg acaagaagaa 13440
gatcgcttgg cctcgcgcgc agatcagttg gaagaatttg tccactacgt gaaaggcgag 13500
atcaccaagg tagtcggcaa ataatgtcta gctagaaatt cgttcaagcc gacgccgctt 13560
cgccggcgtt aaatcaagcg attagatgca ctaagcacat aattgctcac agccaaacta 13620
tcaggtcaag tctgctttta ttatttttaa gcgtgcataa taagccctac acaaattggg 13680
agatatatca tgcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 13740
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 13800
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 13860
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtccttct 13920
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 13980
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 14040
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 14100
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 14160
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 14220
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 14280
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 14340
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 14400
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 14460
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 14520
gagcgaggaa gcggaagagc gcctgatgcg gtattttctc cttacgcatc tgtgcggtat 14580
ttcacaccgc atatggtgca ctctcagtac aatctgctct gatgccgcat agttaagcca 14640
gtatacactc cgctatcgct acgtgactgg gtcatggctg cgccccgaca cccgccaaca 14700
cccgctgacg cgccctgacg ggcttgtctg ctcccggcat ccgcttacag acaagctgtg 14760
accgtctccg ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa acgcgcgagg 14820
cagggtgcct tgatgtgggc gccggcggtc gagtggcgac ggcgcggctt gtccgcgccc 14880
tggtagattg cctggccgta ggccagccat ttttgagcgg ccagcggccg cgataggccg 14940
acgcgaagcg gcggggcgta gggagcgcag cgaccgaagg gtaggcgctt tttgcagctc 15000
ttcggctgtg cgctggccag acagttatgc acaggccagg cgggttttaa gagttttaat 15060
aagttttaaa gagttttagg cggaaaaatc gccttttttc tcttttatat cagtcactta 15120
catgtgtgac cggttcccaa tgtacggctt tgggttccca atgtacgggt tccggttccc 15180
aatgtacggc tttgggttcc caatgtacgt gctatccaca ggaaagagac cttttcgacc 15240
tttttcccct gctagggcaa tttgccctag catctgctcc gtacattagg aaccggcgga 15300
tgcttcgccc tcgatcaggt tgcggtagcg catgactagg atcgggccag cctgccccgc 15360
ctcctccttc aaatcgtact ccggcaggtc atttgacccg atcagcttgc gcacggtgaa 15420
acagaacttc ttgaactctc cggcgctgcc actgcgttcg tagatcgtct tgaacaacca 15480
tctggcttct gccttgcctg cggcgcggcg tgccaggcgg tagagaaaac ggccgatgcc 15540
gggatcgatc aaaaagtaat cggggtgaac cgtcagcacg tccgggttct tgccttctgt 15600
gatctcgcgg tacatccaat cagctagctc gatctcgatg tactccggcc gcccggtttc 15660
gctctttacg atcttgtagc ggctaatcaa ggcttcaccc tcggataccg tcaccaggcg 15720
gccgttcttg gccttcttcg tacgctgcat ggcaacgtgc gtggtgttta accgaatgca 15780
ggtttctacc aggtcgtctt tctgctttcc gccatcggct cgccggcaga acttgagtac 15840
gtccgcaacg tgtggacgga acacgcggcc gggcttgtct cccttccctt cccggtatcg 15900
gttcatggat tcggttagat gggaaaccgc catcagtacc aggtcgtaat cccacacact 15960
ggccatgccg gccggccctg cggaaacctc tacgtgcccg tctggaagct cgtagcggat 16020
cacctcgcca gctcgtcggt cacgcttcga cagacggaaa acggccacgt ccatgatgct 16080
gcgactatcg cgggtgccca cgtcatagag catcggaacg aaaaaatctg gttgctcgtc 16140
gcccttgggc ggcttcctaa tcgacggcgc accggctgcc ggcggttgcc gggattcttt 16200
gcggattcga tcagcggccg cttgccacga ttcaccgggg cgtgcttctg cctcgatgcg 16260
ttgccgctgg gcggcctgcg cggccttcaa cttctccacc aggtcatcac ccagcgccgc 16320
gccgatttgt accgggccgg atggtttgcg accgtcacgc cgattcctcg ggcttggggg 16380
ttccagtgcc attgcagggc cggcagacaa cccagccgct tacgcctggc caaccgcccg 16440
ttcctccaca catggggcat tccacggcgt cggtgcctgg ttgttcttga ttttccatgc 16500
cgcctccttt agccgctaaa attcatctac tcatttattc atttgctcat ttactctggt 16560
agctgcgcga tgtattcaga tagcagctcg gtaatggtct tgccttggcg taccgcgtac 16620
atcttcagct tggtgtgatc ctccgccggc aactgaaagt tgacccgctt catggctggc 16680
gtgtctgcca ggctggccaa cgttgcagcc ttgctgctgc gtgcgctcgg acggccggca 16740
cttagcgtgt ttgtgctttt gctcattttc tctttacctc attaactcaa atgagttttg 16800
atttaatttc agcggccagc gcctggacct cgcgggcagc gtcgccctcg ggttctgatt 16860
caagaacggt tgtgccggcg gcggcagtgc ctgggtagct cacgcgctgc gtgatacggg 16920
actcaagaat gggcagctcg tacccggcca gcgcctcggc aacctcaccg ccgatgcgcg 16980
tgcctttgat cgcccgcgac acgacaaagg ccgcttgtag ccttccatcc gtgacctcaa 17040
tgcgctgctt aaccagctcc accaggtcgg cggtggccca tatgtcgtaa gggcttggct 17100
gcaccggaat cagcacgaag tcggctgcct tgatcgcgga cacagccaag tccgccgcct 17160
ggggcgctcc gtcgatcact acgaagtcgc gccggccgat ggccttcacg tcgcggtcaa 17220
tcgtcgggcg gtcgatgccg acaacggtta gcggttgatc ttcccgcacg gccgcccaat 17280
cgcgggcact gccctgggga tcggaatcga ctaacagaac atcggccccg gcgagttgca 17340
gggcgcgggc tagatgggtt gcgatggtcg tcttgcctga cccgcctttc tggttaagta 17400
cagcgataac cttcatgcgt tccccttgcg tatttgttta tttactcatc gcatcatata 17460
cgcagcgacc gcatgacgca agctgtttta ctcaaataca catcaccttt ttagacggcg 17520
gcgctcggtt tcttcagcgg ccaagctggc cggccaggcc gccagcttgg catcagacaa 17580
accggccagg atttcatgca gccgcacggt tgagacgtgc gcgggcggct cgaacacgta 17640
cccggccgcg atcatctccg cctcgatctc ttcggtaatg aaaaacggtt cgtcctggcc 17700
gtcctggtgc ggtttcatgc ttgttcctct tggcgttcat tctcggcggc cgccagggcg 17760
tcggcctcgg tcaatgcgtc ctcacggaag gcaccgcgcc gcctggcctc ggtgggcgtc 17820
acttcctcgc tgcgctcaag tgcgcggtac agggtcgagc gatgcacgcc aagcagtgca 17880
gccgcctctt tcacggtgcg gccttcctgg tcgatcagct cgcgggcgtg cgcgatctgt 17940
gccggggtga gggtagggcg ggggccaaac ttcacgcctc gggccttggc ggcctcgcgc 18000
ccgctccggg tgcggtcgat gattagggaa cgctcgaact cggcaatgcc ggcgaacacg 18060
gtcaacacca tgcggccggc cggcgtggtg gtgtcggccc acggctctgc caggctacgc 18120
aggcccgcgc cggcctcctg gatgcgctcg gcaatgtcca gtaggtcgcg ggtgctgcgg 18180
gccaggcggt ctagcctggt cactgtcaca acgtcgccag ggcgtaggtg gtcaagcatc 18240
ctggccagct ccgggcggtc gcgcctggtg ccggtgatct tctcggaaaa cagcttggtg 18300
cagccggccg cgtgcagttc ggcccgttgg ttggtcaagt cctggtcgtc ggtgctgacg 18360
cgggcatagc ccagcaggcc agcggcggcg ctcttgttca tggcgtaatg tctccggttc 18420
tagtcgcaag tattctactt tatgcgacta aaacacgcga caagaaaacg ccaggaaaag 18480
ggcagggcgg cagcctgtcg cgtaacttag gacttgtgcg acatgtcgtt ttcagaagac 18540
ggctgcactg aacgtcagaa gccgactgca ctatagcagc ggaggggttg gatcaaagta 18600
ctttgatccc gaggggaacc ctgtggttgg catgcacata caaatggacg aacggataaa 18660
ccttttcacg cccttttaaa tatccgttat tctaa 18695
<210> 12
<211> 18695
<212> DNA
<213> 人工序列
<220>
<223> 2409的完整核苷酸序列。
<400> 12
taaacgctct tttctcttag gtttacccgc caatatatcc tgtcaaacac tgatagttta 60
aactgaaggc gggaaacgac aatctgatcc aagctcaagc tccaatacgc aaaccgcctc 120
tccccgcgcg ttggccgatt cattaatgca gctggcacga caggtttccc gactggaaag 180
cgggcagtga gcgcaacgca attaatgtga gttagctcac tcattaggca ccccaggctt 240
tacactttat gcttccggct cgtatgttgt gtggaattgt gagcggataa caatttcaca 300
caggaaacag ctatgaccat gattacgaat ttcaggtgac tgatagtgac ctgttcgttg 360
caacaaattg atgagcaatg cttttttata atgccaactt tgtacaaaaa agcaggcggc 420
gcgtcctgca ggatagggat aacagggtaa tggcgcgcca agcttatcga taccgtcgac 480
ctcgagcggc cgccagtgtg atggatatct gcagaattgc ccttcgaagg gacaaaaaaa 540
gcaccgactc ggtgccactt tttcaagttg ataacggact agccttattt taacttgcta 600
tttctagctc taaaacgccc agttggaatg taggtgcaac acaagcgaca gcgcgcgggt 660
ttataagttg gtcgcgttcg agttagctgg gcaatgtggt actaaactgt tcctcccgcc 720
tctcgcgctc acactcgccc tgtgggccgc tcaccgtgca cgtacttggg cctcccgctc 780
ccccgcatgc atccagccca tcacagcgaa gagaatcggg cttttcttct ccccatctcc 840
ctacacaacc accaaataca gccaggccgt tggttcatga tccaagggca attccagcac 900
actggcggcc gttactagtg gatccgagct cggtacctta attaaattac cctgttatcc 960
ctatcctgca ggattaacac ccaacttttc tatccaagct tgccaacatg gtggagcacg 1020
acactctcgt ctactccaag aatatcaaag atacagtctc agaagaccaa agggctattg 1080
agacttttca acaaagggta atatcgggaa acctcctcgg attccattgc ccagctatct 1140
gtcacttcat caaaaggaca gtagaaaagg aaggtggcac ctacaaatgc catcattgcg 1200
ataaaggaaa ggctatcgtt caagatgcct ctgccgacag tggtcccaaa gatggacccc 1260
cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 1320
attgatgtga taacatggtg gagcacgaca ctctcgtcta ctccaagaat atcaaagata 1380
cagtctcaga agaccaaagg gctattgaga cttttcaaca aagggtaata tcgggaaacc 1440
tcctcggatt ccattgccca gctatctgtc acttcatcaa aaggacagta gaaaaggaag 1500
gtggcaccta caaatgccat cattgcgata aaggaaaggc tatcgttcaa gatgcctctg 1560
ccgacagtgg tcccaaagat ggacccccac ccacgaggag catcgtggaa aaagaagacg 1620
ttccaaccac gtcttcaaag caagtggatt gatgtgatat ctccactgac gtaagggatg 1680
acgcacaatc ccactatcct tcgcaagacc cttcctctat ataaggaagt tcatttcatt 1740
tggagaggcc ggtctagaga attccaagca acgaactgcg agtgattcaa gaaaaaagaa 1800
aacctgagct ttcgatctct acggagtggt ttcttgttct ttgaaaaaga gggggattac 1860
atatggctcc taagaagaag cggaaggttg gtattcacgg ggtgcctgcg gctatggaca 1920
agaagtactc gatcgggctg gccatcggaa caaattctgt aggctgggct gtaataaccg 1980
atgagtacaa ggtgccctct aaaaaattta aggtccttgg caatacggat agacattcca 2040
taaagaagaa tcttatcggt gcgctgctct ttgacagcgg cgagaccgcg gaggcgaccc 2100
ggttgaaacg caccgcgaga cgccgttaca caaggcgtaa gaatagaatc tgttatctcc 2160
aggagatatt ctctaatgaa atggcgaagg tagacgattc cttctttcac cgtctggagg 2220
aaagttttct cgttgaggaa gataagaaac atgaaagaca cccgatcttc ggaaacattg 2280
tcgacgaggt cgcttatcat gaaaagtacc ctaccatcta ccatcttaga aagaaacttg 2340
ttgacagcac ggataaggct gatctcaggc tgatatacct ggctctggca catatgatta 2400
agttcagagg gcatttcctt atcgaaggcg acctgaatcc agataattca gatgtagaca 2460
agctcttcat tcaacttgtg cagacttata atcagctctt cgaagaaaat ccaataaacg 2520
cgtcgggtgt agacgcaaag gccatactgt ccgctaggct ttctaagtca cgtagacttg 2580
agaatctcat tgcccaactc cccggcgaga agaagaacgg cttgtttgga aatctgatag 2640
cgctgtccct gggtcttaca ccaaatttca agagtaattt cgatttggca gaagatgcta 2700
agttgcagct cagtaaagac acctacgatg acgatcttga taatttgttg gctcagattg 2760
gcgatcagta tgcagatctt ttcttggccg ctaagaattt gtctgatgca attctgctta 2820
gcgacatttt gagggttaat acagaaatca ccaaggcacc cttgtcggcg tcaatgataa 2880
agaggtatga tgagcaccac caagacctga cgctcctcaa ggctcttgtt cggcagcaat 2940
tgccggagaa gtacaaagag atcttcttcg accagtctaa gaacggatat gcgggctaca 3000
tagacggtgg agcgagtcag gaggaattct acaagttcat aaagcccatt ctcgagaaga 3060
tggatggtac ggaagaactg cttgtgaaac ttaacagaga agatcttttg cggaagcaga 3120
gaactttcga caacggaagt ataccacacc agatacatct cggagagctt catgctattc 3180
tcagaagaca agaggatttc taccctttct tgaaggataa cagagaaaag atagagaaga 3240
tcctcacgtt taggatccct tactacgtag gtcctcttgc tcgcggcaat agtaggttcg 3300
cctggatgac ccgcaagtct gaagaaacta tcaccccttg gaatttcgaa gaggttgtag 3360
acaaaggtgc ttcagcacag agtttcattg agaggatgac caacttcgac aagaacctcc 3420
ccaacgaaaa ggtcctgcct aagcacagcc tcctctacga atactttact gtctataatg 3480
agcttacaaa agttaagtac gtgacagagg gaatgcggaa gcccgcattc ctttccggag 3540
aacaaaagaa ggcgatcgtg gatcttctct tcaagacgaa ccgcaaggtg acggttaaac 3600
agttgaagga agattacttc aagaagatag aatgttttga tagcgtggaa atcagcggcg 3660
tcgaagatag gttcaacgct tccctgggaa cgtaccacga tctcctcaag attatcaaag 3720
ataaggactt tcttgataac gaagagaatg aggacatctt ggaagacatt gttctgacgc 3780
tcaccctgtt cgaagatcgc gagatgattg aggaacgctt gaagacctac gcacacctgt 3840
tcgatgacaa ggttatgaag caacttaaac ggcgccggta tacgggctgg ggacggcttt 3900
cgcggaagct gataaatgga atccgtgaca agcagtctgg caagacaata ctcgacttct 3960
tgaagtcgga tggttttgcc aatagaaatt ttatgcaact cattcatgat gactcgctta 4020
cttttaagga ggacatccag aaggcccagg tatcaggaca gggtgactct ttgcacgaac 4080
acatcgcgaa cctggcgggc tcccccgcga ttaagaaggg aattttgcag actgtcaagg 4140
tggtcgatga actcgtgaag gttatgggac gtcataagcc ggaaaatatt gtgattgaga 4200
tggctcgcga gaatcaaaca acacagaagg gccaaaagaa cagtagagaa cgcatgaagc 4260
gcatcgaaga gggcatcaaa gagctgggca gtcagatcct taaagaacat ccagtcgaga 4320
atacacagct tcagaacgaa aagctgtacc tttattacct tcaaaatggg cgtgatatgt 4380
atgtggatca ggaactcgat atcaataggc tgagtgacta tgatgtcgac catatcgtcc 4440
cgcaaagttt cctcaaggac gacagtatag acaacaaagt tctcacacgg tcagataaga 4500
atcgcggcaa gagcgataat gtaccgtcgg aggaggtagt caagaagatg aagaattact 4560
ggcgccagtt gctcaacgcc aagctcatca ctcagaggaa atttgacaac cttacgaaag 4620
ccgagcgggg cggactctct gaactggaca aggccggttt cataaagcgc cagctcgttg 4680
agacacgtca aattactaag cacgtcgctc aaatattgga ttcccgcatg aatactaagt 4740
acgatgagaa tgataagctc atacgtgaag ttaaggtcat tactctcaag tccaagcttg 4800
tatcggactt ccgtaaggac ttccaattct acaaggtccg ggaaatcaat aattatcacc 4860
atgcccatga cgcttatctg aacgcggtcg tgggcacggc actcattaag aaatacccaa 4920
aacttgagtc agaatttgtt tacggggact ataaagttta tgacgtgcgg aagatgatag 4980
cgaagtcgga acaagagata ggaaaggcga ctgcaaagta ctttttttac tccaacataa 5040
tgaatttctt taagaccgaa ataacccttg caaacggtga aatcagaaag cggcctctga 5100
ttgaaacaaa tggcgagacg ggcgagatcg tctgggacaa ggggagggac ttcgcaacgg 5160
ttcgcaaggt ccttagcatg ccgcaagtaa atatagttaa gaagacggaa gttcagaccg 5220
gcggctttag taaagaaagc atacttccta aaaggaattc cgacaaactg atagcgcgca 5280
agaaggactg ggatccaaag aagtatggag gatttgactc cccaaccgtt gcttatagcg 5340
tgttggtagt agccaaggtg gaaaagggta agtctaagaa attgaagtcg gtgaaggagt 5400
tgttggggat aactataatg gagcggagtt cgttcgagaa gaacccaatt gactttctcg 5460
aagccaaagg ctacaaggag gtcaagaagg acctgattat taagttgcca aagtactcgc 5520
tcttcgaact cgagaacggg agaaagcgta tgctggcgtc ggcgggcgag ctgcagaaag 5580
gaaacgagct ggctttgcca tcgaaatacg taaatttcct gtacctcgcc tcacattatg 5640
agaagcttaa agggtctcca gaagacaatg aacagaagca gctgtttgtt gaacagcaca 5700
agcactactt ggacgagatt atagaacaaa tctccgagtt ctctaaacgg gttatccttg 5760
cagacgccaa tttggataag gtcctctcgg cttataataa gcatagagat aagccaatcc 5820
gggagcaggc tgaaaatatc atacacctct ttacgttgac taatttgggt gcgccagcgg 5880
cattcaagta cttcgataca acaatcgatc gtaagcgcta cacaagcact aaggaagtcc 5940
tggacgcgac gctgatacac cagtccatta ctggactgta tgaaaccaga atagatctta 6000
gccagctcgg cggtgatgga ggagggccta gggctgatcc taagaagaag aggaaggttg 6060
gaggagggcc aggagcagag tatgttagag cgttgtttga ttttaacggt aacgatgaag 6120
aggatttacc ctttaagaaa ggcgacattc tcaggattag ggataaacct gaagagcaat 6180
ggtggaatgc tgaggatagt gaaggcaaac gaggaatgat tttagtgccg tatgtggaga 6240
aatattcggg tgactacaaa gatcatgatg gtgattacaa agaccatgac atcgactaca 6300
aggatgatga tgataagtca gggatgacag atgctgaata tgtcagaatc cacgaaaagt 6360
tggacattta cacgtttaag aagcagttct tcaacaacaa gaaatctgtt tcgcataggt 6420
gctatgtgct tttcgaacta aaacgtcgtg gagaaagacg ggcttgcttt tggggttacg 6480
cggttaacaa accacaatca ggtactgaac gaggaataca cgctgaaatc ttttctatcc 6540
gaaaggttga ggaatatcta cgtgacaatc ctggacagtt cactatcaat tggtattcta 6600
gctggtcacc atgtgcagat tgtgctgaga agattctcga atggtacaat caagagctta 6660
gaggcaatgg acatacattg aaaatatggg catgcaagct ctactacgaa aagaatgcca 6720
gaaaccaaat tgggctttgg aacttgaggg ataatggagt tgggcttaat gtcatggttt 6780
ctgagcacta tcaatgttgt cggaagatct tcatacaaag ttcccataac cagttgaatg 6840
agaacagatg gttagagaaa acccttaaaa gagccgagaa gagaagatcc gaactgagca 6900
ttatgataca ggtcaaaatt ctgcatacca ctaagagtcc agctgtaggt cctaagaaga 6960
aacgtaaagt agggccctga tccaggcctc ccagctttcg tccgtatcat cggtttcgac 7020
aacgttcgtc aagttcaatg catcagtttc attgcccaca caccagaatc ctactaagtt 7080
tgagtattat ggcattggaa aagctgtttt cttctatcat ttgttctgct tgtaatttac 7140
tgtgttcttt cagtttttgt tttcggacat caaaatgcaa atggatggat aagagttaat 7200
aaatgatatg gtccttttgt tcattctcaa attattatta tctgttgttt ttactttaat 7260
gggttgaatt taagtaagaa aggaactaac agtgtgatat taaggtgcaa tgttagacat 7320
ataaaacagt ctttcacctc tctttggtta tgtcttgaat tggtttgttt cttcacttat 7380
ctgtgtaatc aagtttacta tgagtctatg atcaagtaat tatgcaatca agttaagtac 7440
agtataggct tgagctccct aggcccctag gtaattcttc ggacccaaga atgctaagcc 7500
aagaggagct gttatcgccg tcctcctgct tgtttctctc tttttgttgc tgtttcttca 7560
ttagcgtgga caaagttttc aaccggccta tctgttatca ttttcttcta ttcaaagact 7620
gtaataccta ttgctacctg tggttctcac ttgtgatttt ggacacatat gttcggttta 7680
ttcaaattta atcagatgcc tgatgagggt accagaaaaa atacgtgttc tggttgtttt 7740
tgagttgcga ttattctatg aaatgaataa catcgaagtt atcatcccag tattttcgca 7800
tgaatgttct tttcttctgt cttgtgcatc agtgatctag tgcatgggag tttgtattgt 7860
gatgttcgac atcacgtaac ttccactttg cctttgctgt tcgatatttt aatgacatgt 7920
cacacacact tctgatactt ttctttcttg gctattgtgc cagcatgatg caagatgcat 7980
cacagcatca gatatattct catcgtcagg ctttagcagc acacgagcac gctttgccgc 8040
ttaaaagttg tacggcgcag cttagacatc ccctgtagaa gtgataatct tttcactttt 8100
ccttaaacaa attgagaggg gaaatggaac catgtggatc agagaagctt ttgtttcttt 8160
acacaagaat atttggtaca gtgggggtcc tatgttcgtg ggttcgtggc ttggctgcct 8220
gtcttcaacc aagtgttttc agttcaacat gttagcgtgt agaaagagca caattctgtt 8280
tatctccaag gtaaaatgtg gcattctgtt aaagaacatg atcctgccaa ttttttaagt 8340
ttcaatggaa gaggaatgta aagctttcta tggtttgtgt acacaacaca gtggaagagg 8400
agtgcaagct ttctatggtt tgtgtgcgcg ttgtgtgtca gcacttcaat tttgttagaa 8460
aatgaaagaa aaaaaaggat gatcatgctt atagtaaatc actctttttc ctcgccttct 8520
gtacgttttg acttgacaag attttaaaat ctgtacatga cctttgtttt aaaattactt 8580
tatgtatttc catctttcaa gttatgcaga tgtcatcaca aattgttaca ccaatcacca 8640
ggctggctgt ttatatatta tcagaccagg ctatatagag tatactatac taactgttca 8700
tattatctgg aaatcttgct tgctacttga gcggtaaaag ggtatagata tgagggtccc 8760
cagattagcc ttttcaattt cagaaagaat gctaacccac agatggttag agaggcttac 8820
gcagcaggtc tcatcaagac gatctacccg agcaataatc tccaggaaat caaatacctt 8880
cccaagaagg ttaaagatgc agtcaaaaga ttcaggacta actgcatcaa gaacacagag 8940
aaagatatat ttctcaagat cagaagtact attccagtat ggacgattca aggcttgctt 9000
cacaaaccaa ggcaagtaat agagattgga gtctctaaaa aggtagttcc cactgaatca 9060
aaggccatgg agtcaaagat tcaaatagag gacctaacag aactcgccgt aaagactggc 9120
gaacagttca tacagagtct cttacgactc aatgacaaga agaaaatctt cgtcaacatg 9180
gtggagcacg acacacttgt ctactccaaa aatatcaaag atacagtctc agaagaccaa 9240
agggcaattg agacttttca acaaagggta atatccggaa acctcctcgg attccattgc 9300
ccagctatct gtcactttat tgtgaagata gtggaaaagg aaggtggctc ctacaaatgc 9360
catcattgcg ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa 9420
gatggacccc cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca 9480
aagcaagtgg attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat 9540
ccttcgcaag acccttcctc tatataagga agttcatttc atttggagag aacacggggg 9600
actctagaat gaaaaagcct gaactcaccg cgacgtctgt cgagaagttt ctgatcgaaa 9660
agttcgacag cgtctccgac ctgatgcagc tctcggaggg cgaagaatct cgtgctttca 9720
gcttcgatgt aggagggcgt ggatatgtcc tgcgggtaaa tagctgcgcc gatggtttct 9780
acaaagatcg ttatgtttat cggcactttg catcggccgc gctcccgatt ccggaagtgc 9840
ttgacattgg ggagtttagc gagagcctga cctattgcat ctcccgccgt tcacagggtg 9900
tcacgttgca agacctgcct gaaaccgaac tgcccgctgt tctacaaccg gtcgcggagg 9960
ctatggatgc gatcgctgcg gccgatctta gccagacgag cgggttcggc ccattcggac 10020
cgcaaggaat cggtcaatac actacatggc gtgatttcat atgcgcgatt gctgatcccc 10080
atgtgtatca ctggcaaact gtgatggacg acaccgtcag tgcgtccgtc gcgcaggctc 10140
tcgatgagct gatgctttgg gccgaggact gccccgaagt ccggcacctc gtgcacgcgg 10200
atttcggctc caacaatgtc ctgacggaca atggccgcat aacagcggtc attgactgga 10260
gcgaggcgat gttcggggat tcccaatacg aggtcgccaa catcttcttc tggaggccgt 10320
ggttggcttg tatggagcag cagacgcgct acttcgagcg gaggcatccg gagcttgcag 10380
gatcgccacg actccgggcg tatatgctcc gcattggtct tgaccaactc tatcagagct 10440
tggttgacgg caatttcgat gatgcagctt gggcgcaggg tcgatgcgac gcaatcgtcc 10500
gatccggagc cgggactgtc gggcgtacac aaatcgcccg cagaagcgcg gccgtctgga 10560
ccgatggctg tgtagaagta ctcgccgata gtggaaaccg acgccccagc actcgtccga 10620
gggcaaagaa ataggagctc tgggctaatc taaaacgatt tatctgtggc ttcaagtgta 10680
tcgatcactt atgtgaggtg taattactgg tgtttttggt gtgctctggt tcctttcaag 10740
tgtgttgttg ccgctcgaac tactccgcta tgtaaaacgg taaaacctgt tgtctcatta 10800
tgaaagtgaa ctatattatg ttctactact actctactta gtcaattttc ttcaccttga 10860
ttagtgtaaa tatgaatctt atattcttat gtcttaagaa attagcacat gtgaagcctc 10920
caagtgcata ttttctcgat cgcgagacgc acaatgcgtg agaaattcag ctggttatac 10980
tcaaatatat taatatatct agcagcagct catggagatt caggaaactt ggcatcccta 11040
atccctacca tttccattct tccgagattg acagttcaat acaagtacag taatctcctg 11100
gtaagtttct tattaacttg acatgtagta gtaataattt gtacgtagca tagatacata 11160
gacacaaaaa tgtcctcccc attgagctag ccgattggag ccgaacaccg caggaatgaa 11220
tttacataat ctgcaaagaa taaatggaat gtgcctccac aggaaaacca gcggcagtgt 11280
ggcgttttca agagcagccg taagtcgaag cctattctga atcgtagaaa tcactggggc 11340
atggtgtaat tacatccgac tccaacatct gtaccaccct gtgcattgta ggccgctcct 11400
ctggcaaaga acttacacat tgtttagcaa gagaaagtag agcatccaag gtctcaatct 11460
gcactccctc acaatatgga tcgacaattt ccctctcccg attctcaccg accaggaaat 11520
tcaactgcca cagagcaagt agattatttc aagaatacat taaatcaatt gaaggcatac 11580
gtaattcata tcagaaaact gtggatatga aatggaagga cataaaggtc atacataccc 11640
atccaacaat gttcaatccc ttttcaataa atgatgcatc agtaggtcgt tttccgctta 11700
gtatttcaag tagcaaaact ccaaaactgt agacgtcagt cttttcggtg gctctgccac 11760
tttgcatata ctcctgcagg tcgaccatag tgactggata tgttgtgttt tacagtatta 11820
tgtagtctgt tttttatgca aaatctaatt taatatattg atatttatat cattttacgt 11880
ttctcgttca gctttcttgt acaaagtggt gatatcccgc ggaaatacgt agaattcggg 11940
aagcttggca ctggccgtcg ttttacaacg tcgtgactgg gaaaaccctg gcgttaccca 12000
acttaatcgc cttgcagcac atcccccttt cgccagctgg cgtaatagcg aagaggcccg 12060
caccgatcgc ccttcccaac agttgcgcag cctgaatggc gaatgctaga gcaattcggc 12120
gttaattcag tacattaaaa acgtccgcaa tgtgttatta agttgtctaa gcgtcaattt 12180
gtttacacca caatatatcc tgccaccagc cagccaacag ctccccgacc ggcagctcgg 12240
cacaaaatca ccactcgata caggcagccc atcagtccgg gacggcgtca gcgggagagc 12300
cgttgtaagg cggcagactt tgctcatgtt accgatgcta ttcggaagaa cggcaactaa 12360
gctgccgggt ttgaaacacg gatgatctcg cggagggtag catgttgatt gtaacgatga 12420
cagagcgttg ctgcctgtga tcaattcggg cacgaaccca gtggacataa gcctcgttcg 12480
gttcgtaagc tgtaatgcaa gtagcgtaac tgccgtcacg caactggtcc agaaccttga 12540
ccgaacgcag cggtggtaac ggcgcagtgg cggttttcat ggcttcttgt tatgacatgt 12600
ttttttgggg tacagtctat gcctcgggca tccaagcagc aagcgcgtta cgccgtgggt 12660
cgatgtttga tgttatggag cagcaacgat gttacgcagc agggcagtcg ccctaaaaca 12720
aagttaaaca tcatggggga agcggtgatc gccgaagtat cgactcaact atcagaggta 12780
gttggcgtca tcgagcgcca tctcgaaccg acgttgctgg ccgtacattt gtacggctcc 12840
gcagtggatg gcggcctgaa gccacacagt gatattgatt tgctggttac ggtgaccgta 12900
aggcttgatg aaacaacgcg gcgagctttg atcaacgacc ttttggaaac ttcggcttcc 12960
cctggagaga gcgagattct ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc 13020
attccgtggc gttatccagc taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac 13080
attcttgcag gtatcttcga gccagccacg atcgacattg atctggctat cttgctgaca 13140
aaagcaagag aacatagcgt tgccttggta ggtccagcgg cggaggaact ctttgatccg 13200
gttcctgaac aggatctatt tgaggcgcta aatgaaacct taacgctatg gaactcgccg 13260
cccgactggg ctggcgatga gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc 13320
gcagtaaccg gcaaaatcgc gccgaaggat gtcgctgccg actgggcaat ggagcgcctg 13380
ccggcccagt atcagcccgt catacttgaa gctagacagg cttatcttgg acaagaagaa 13440
gatcgcttgg cctcgcgcgc agatcagttg gaagaatttg tccactacgt gaaaggcgag 13500
atcaccaagg tagtcggcaa ataatgtcta gctagaaatt cgttcaagcc gacgccgctt 13560
cgccggcgtt aaatcaagcg attagatgca ctaagcacat aattgctcac agccaaacta 13620
tcaggtcaag tctgctttta ttatttttaa gcgtgcataa taagccctac acaaattggg 13680
agatatatca tgcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 13740
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 13800
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 13860
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtccttct 13920
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 13980
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 14040
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 14100
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 14160
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 14220
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 14280
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 14340
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 14400
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 14460
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 14520
gagcgaggaa gcggaagagc gcctgatgcg gtattttctc cttacgcatc tgtgcggtat 14580
ttcacaccgc atatggtgca ctctcagtac aatctgctct gatgccgcat agttaagcca 14640
gtatacactc cgctatcgct acgtgactgg gtcatggctg cgccccgaca cccgccaaca 14700
cccgctgacg cgccctgacg ggcttgtctg ctcccggcat ccgcttacag acaagctgtg 14760
accgtctccg ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa acgcgcgagg 14820
cagggtgcct tgatgtgggc gccggcggtc gagtggcgac ggcgcggctt gtccgcgccc 14880
tggtagattg cctggccgta ggccagccat ttttgagcgg ccagcggccg cgataggccg 14940
acgcgaagcg gcggggcgta gggagcgcag cgaccgaagg gtaggcgctt tttgcagctc 15000
ttcggctgtg cgctggccag acagttatgc acaggccagg cgggttttaa gagttttaat 15060
aagttttaaa gagttttagg cggaaaaatc gccttttttc tcttttatat cagtcactta 15120
catgtgtgac cggttcccaa tgtacggctt tgggttccca atgtacgggt tccggttccc 15180
aatgtacggc tttgggttcc caatgtacgt gctatccaca ggaaagagac cttttcgacc 15240
tttttcccct gctagggcaa tttgccctag catctgctcc gtacattagg aaccggcgga 15300
tgcttcgccc tcgatcaggt tgcggtagcg catgactagg atcgggccag cctgccccgc 15360
ctcctccttc aaatcgtact ccggcaggtc atttgacccg atcagcttgc gcacggtgaa 15420
acagaacttc ttgaactctc cggcgctgcc actgcgttcg tagatcgtct tgaacaacca 15480
tctggcttct gccttgcctg cggcgcggcg tgccaggcgg tagagaaaac ggccgatgcc 15540
gggatcgatc aaaaagtaat cggggtgaac cgtcagcacg tccgggttct tgccttctgt 15600
gatctcgcgg tacatccaat cagctagctc gatctcgatg tactccggcc gcccggtttc 15660
gctctttacg atcttgtagc ggctaatcaa ggcttcaccc tcggataccg tcaccaggcg 15720
gccgttcttg gccttcttcg tacgctgcat ggcaacgtgc gtggtgttta accgaatgca 15780
ggtttctacc aggtcgtctt tctgctttcc gccatcggct cgccggcaga acttgagtac 15840
gtccgcaacg tgtggacgga acacgcggcc gggcttgtct cccttccctt cccggtatcg 15900
gttcatggat tcggttagat gggaaaccgc catcagtacc aggtcgtaat cccacacact 15960
ggccatgccg gccggccctg cggaaacctc tacgtgcccg tctggaagct cgtagcggat 16020
cacctcgcca gctcgtcggt cacgcttcga cagacggaaa acggccacgt ccatgatgct 16080
gcgactatcg cgggtgccca cgtcatagag catcggaacg aaaaaatctg gttgctcgtc 16140
gcccttgggc ggcttcctaa tcgacggcgc accggctgcc ggcggttgcc gggattcttt 16200
gcggattcga tcagcggccg cttgccacga ttcaccgggg cgtgcttctg cctcgatgcg 16260
ttgccgctgg gcggcctgcg cggccttcaa cttctccacc aggtcatcac ccagcgccgc 16320
gccgatttgt accgggccgg atggtttgcg accgtcacgc cgattcctcg ggcttggggg 16380
ttccagtgcc attgcagggc cggcagacaa cccagccgct tacgcctggc caaccgcccg 16440
ttcctccaca catggggcat tccacggcgt cggtgcctgg ttgttcttga ttttccatgc 16500
cgcctccttt agccgctaaa attcatctac tcatttattc atttgctcat ttactctggt 16560
agctgcgcga tgtattcaga tagcagctcg gtaatggtct tgccttggcg taccgcgtac 16620
atcttcagct tggtgtgatc ctccgccggc aactgaaagt tgacccgctt catggctggc 16680
gtgtctgcca ggctggccaa cgttgcagcc ttgctgctgc gtgcgctcgg acggccggca 16740
cttagcgtgt ttgtgctttt gctcattttc tctttacctc attaactcaa atgagttttg 16800
atttaatttc agcggccagc gcctggacct cgcgggcagc gtcgccctcg ggttctgatt 16860
caagaacggt tgtgccggcg gcggcagtgc ctgggtagct cacgcgctgc gtgatacggg 16920
actcaagaat gggcagctcg tacccggcca gcgcctcggc aacctcaccg ccgatgcgcg 16980
tgcctttgat cgcccgcgac acgacaaagg ccgcttgtag ccttccatcc gtgacctcaa 17040
tgcgctgctt aaccagctcc accaggtcgg cggtggccca tatgtcgtaa gggcttggct 17100
gcaccggaat cagcacgaag tcggctgcct tgatcgcgga cacagccaag tccgccgcct 17160
ggggcgctcc gtcgatcact acgaagtcgc gccggccgat ggccttcacg tcgcggtcaa 17220
tcgtcgggcg gtcgatgccg acaacggtta gcggttgatc ttcccgcacg gccgcccaat 17280
cgcgggcact gccctgggga tcggaatcga ctaacagaac atcggccccg gcgagttgca 17340
gggcgcgggc tagatgggtt gcgatggtcg tcttgcctga cccgcctttc tggttaagta 17400
cagcgataac cttcatgcgt tccccttgcg tatttgttta tttactcatc gcatcatata 17460
cgcagcgacc gcatgacgca agctgtttta ctcaaataca catcaccttt ttagacggcg 17520
gcgctcggtt tcttcagcgg ccaagctggc cggccaggcc gccagcttgg catcagacaa 17580
accggccagg atttcatgca gccgcacggt tgagacgtgc gcgggcggct cgaacacgta 17640
cccggccgcg atcatctccg cctcgatctc ttcggtaatg aaaaacggtt cgtcctggcc 17700
gtcctggtgc ggtttcatgc ttgttcctct tggcgttcat tctcggcggc cgccagggcg 17760
tcggcctcgg tcaatgcgtc ctcacggaag gcaccgcgcc gcctggcctc ggtgggcgtc 17820
acttcctcgc tgcgctcaag tgcgcggtac agggtcgagc gatgcacgcc aagcagtgca 17880
gccgcctctt tcacggtgcg gccttcctgg tcgatcagct cgcgggcgtg cgcgatctgt 17940
gccggggtga gggtagggcg ggggccaaac ttcacgcctc gggccttggc ggcctcgcgc 18000
ccgctccggg tgcggtcgat gattagggaa cgctcgaact cggcaatgcc ggcgaacacg 18060
gtcaacacca tgcggccggc cggcgtggtg gtgtcggccc acggctctgc caggctacgc 18120
aggcccgcgc cggcctcctg gatgcgctcg gcaatgtcca gtaggtcgcg ggtgctgcgg 18180
gccaggcggt ctagcctggt cactgtcaca acgtcgccag ggcgtaggtg gtcaagcatc 18240
ctggccagct ccgggcggtc gcgcctggtg ccggtgatct tctcggaaaa cagcttggtg 18300
cagccggccg cgtgcagttc ggcccgttgg ttggtcaagt cctggtcgtc ggtgctgacg 18360
cgggcatagc ccagcaggcc agcggcggcg ctcttgttca tggcgtaatg tctccggttc 18420
tagtcgcaag tattctactt tatgcgacta aaacacgcga caagaaaacg ccaggaaaag 18480
ggcagggcgg cagcctgtcg cgtaacttag gacttgtgcg acatgtcgtt ttcagaagac 18540
ggctgcactg aacgtcagaa gccgactgca ctatagcagc ggaggggttg gatcaaagta 18600
ctttgatccc gaggggaacc ctgtggttgg catgcacata caaatggacg aacggataaa 18660
ccttttcacg cccttttaaa tatccgttat tctaa 18695
<210> 13
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 13
atgcatcctg caggctctag aggatccccc ctcag 35
<210> 14
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 14
agccgggcgg ccgctttact tgtacagctc gtcca 35
<210> 15
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 15
atgaaaaagc ctgaactcac cgcgacgtct 30
<210> 16
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 16
cctcgctcca gtcaatgacc gctgttatgc 30
<210> 17
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 17
agtccctgca ggttaattaa cttgcgctgc gtttgtgcgg gtgcg 45
<210> 18
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 18
tgacggtacc actagttagt agtacccaat aagatcgacc gaagaga 47
<210> 19
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 19
ccgtaagaac caccagcgac accacgtcct 30

Claims (11)

1.修饰单子叶植物细胞的双链DNA的靶向位点的方法,其包括以下步骤,使由核酸碱基转变酶和与所选择的双链DNA中的靶核苷酸序列特异性结合的核酸序列识别模块结合而成的复合体与该双链DNA接触,将该靶向位点的1个或多个核苷酸缺失或转换为其它1个或多个核苷酸,或者向该靶向位点插入1个或多个核苷酸,而在该靶向位点中不切割该双链DNA的至少一个链,其中,该双链DNA与该复合体的接触通过向该单子叶植物细胞导入编码该复合体的核酸,以及培养该单子叶植物细胞以使该复合体在细胞内表达来进行,且其中在核酸序列识别模块及核酸碱基转变酶的两末端各添加一个编码源自SV40的核定位信号的序列,其中所述核酸序列识别模块是CRISPR-Cas系统,其中Cas的至少1个DNA切割能力是失活的,且其中所述核酸碱基转变酶为胞苷脱氨酶。
2.根据权利要求1所述的方法,其中,所述培养步骤的至少一部分在与该单子叶植物细胞的最适培养温度比更低的温度下进行。
3.根据权利要求1所述的方法,其中,所述核酸序列识别模块为与指导RNA形成互补链的链的相反链的切割能力失活的CRISPR-Cas系统。
4.根据权利要求3所述的方法,其中使靶向位点的1个或多个核苷酸缺失。
5.根据权利要求1所述的方法,其中,所述胞苷脱氨酶为源自七腮鳗的PmCDA1。
6.根据权利要求1~5中任一项所述的方法,其中,编码核酸序列识别模块及核酸碱基转变酶的核酸序列针对被子植物或者单子叶植物的密码子使用而最优化。
7.根据权利要求1~5中任一项所述的方法,其中,单子叶植物为水稻、小麦或玉米。
8.根据权利要求7所述的方法,其中,单子叶植物为水稻。
9.核酸修饰酶复合体,其为核酸碱基转变酶和与单子叶植物细胞的双链DNA中的靶核苷酸序列特异性结合的核酸序列识别模块结合而成的复合体,其在该单子叶植物细胞中起作用,且使该靶向位点的1个或多个核苷酸缺失或转换为其它1个或多个核苷酸,或者向该靶向位点插入1个或多个核苷酸,而在靶向位点中不切割该双链DNA的至少一个链,且其中在核酸序列识别模块及核酸碱基转变酶的两末端各添加一个编码源自SV40的核定位信号的序列,其中所述核酸识别序列识别模块是CRISPR-Cas系统,其中Cas的至少1个DNA切割能力是失活的,且其中所述核酸碱基转变酶为胞苷脱氨酶。
10.编码权利要求9所述的核酸修饰酶复合体的核酸。
11.根据权利要求10所述的核酸,其中编码核酸序列识别模块及核酸碱基转变酶的核酸序列针对被子植物或者单子叶植物的密码子使用而最优化。
CN201680079887.5A 2015-11-27 2016-11-25 用于特异性转换靶向dna序列的核酸碱基的单子叶植物的基因组序列的转换方法、及其使用的分子复合体 Active CN108495932B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2015-232379 2015-11-27
JP2015232379 2015-11-27
JP2016134613 2016-07-06
JP2016-134613 2016-07-06
PCT/JP2016/085075 WO2017090761A1 (ja) 2015-11-27 2016-11-25 標的化したdna配列の核酸塩基を特異的に変換する、単子葉植物のゲノム配列の変換方法、及びそれに用いる分子複合体

Publications (2)

Publication Number Publication Date
CN108495932A CN108495932A (zh) 2018-09-04
CN108495932B true CN108495932B (zh) 2022-08-09

Family

ID=58764366

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680079887.5A Active CN108495932B (zh) 2015-11-27 2016-11-25 用于特异性转换靶向dna序列的核酸碱基的单子叶植物的基因组序列的转换方法、及其使用的分子复合体

Country Status (10)

Country Link
US (1) US11220693B2 (zh)
EP (1) EP3382019B1 (zh)
JP (1) JP6923205B2 (zh)
KR (1) KR102061438B1 (zh)
CN (1) CN108495932B (zh)
BR (1) BR112018010681A8 (zh)
DK (1) DK3382019T3 (zh)
ES (1) ES2914623T3 (zh)
HK (1) HK1256888A1 (zh)
WO (1) WO2017090761A1 (zh)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2947941C (en) 2014-03-05 2021-02-23 National University Corporation Kobe University Genome sequence modification method for specifically converting nucleic acid bases of targeted dna sequence, and molecular complex for use in same
BR112018004636A2 (pt) 2015-09-09 2018-10-30 National University Corporation Kobe University método para modificação de um sítio alvejado em um dna de fita dupla de uma bactéria gram-positiva, complexo de enzima modificadora de ácido nucleico, e, ácido nucleico
KR102061438B1 (ko) 2015-11-27 2019-12-31 고쿠리츠다이가쿠호진 고베다이가쿠 표적화 dna 서열 중의 핵산 염기가 특이적으로 전환되어 있는 단자엽식물 게놈 서열을 전환시키는 방법, 및 그것에 사용되는 분자 복합체
WO2017183724A1 (ja) * 2016-04-21 2017-10-26 国立大学法人神戸大学 ゲノム配列改変技術における変異導入効率の向上方法、及びそれに用いる分子複合体
US11499158B2 (en) 2016-05-13 2022-11-15 Kaneka Corporation Method for modifying plant
EP3456825A4 (en) * 2016-05-13 2020-03-18 Kaneka Corporation METHOD FOR PLANT GENE EDITING
JP6967217B2 (ja) 2016-05-13 2021-11-17 株式会社カネカ 形質転換植物の作製方法
CN107043779B (zh) * 2016-12-01 2020-05-12 中国农业科学院作物科学研究所 一种CRISPR/nCas9介导的定点碱基替换在植物中的应用
WO2018143477A1 (ja) * 2017-02-06 2018-08-09 国立大学法人 筑波大学 双子葉植物のゲノムの改変方法
CN110157727A (zh) 2017-12-21 2019-08-23 中国科学院遗传与发育生物学研究所 植物碱基编辑方法
KR102287880B1 (ko) * 2018-03-26 2021-08-09 고쿠리츠다이가쿠호진 고베다이가쿠 세포에서 이중 가닥 dna의 표적 부위를 변형시키기 위한 방법
CN112105732A (zh) * 2018-05-10 2020-12-18 先正达参股股份有限公司 用于多核苷酸的靶向编辑的方法和组合物
US11834686B2 (en) 2018-08-23 2023-12-05 Sangamo Therapeutics, Inc. Engineered target specific base editors
CN110607320B (zh) * 2018-11-23 2023-05-12 电子科技大学 一种植物基因组定向碱基编辑骨架载体及其应用
CN110257406B (zh) * 2019-06-21 2022-07-22 安徽省农业科学院水稻研究所 密码子植物化改造的Plant Nme2Cas9基因及其应用
WO2021046155A1 (en) 2019-09-03 2021-03-11 Voyager Therapeutics, Inc. Vectorized editing of nucleic acids to correct overt mutations
WO2021049388A1 (ja) * 2019-09-10 2021-03-18 株式会社カネカ 腋芽メリステムを用いた植物の改変方法
EP4086353A4 (en) * 2020-01-03 2024-03-06 Kaneka Corp METHOD FOR PLANT MODIFICATION
JPWO2022158561A1 (zh) * 2021-01-22 2022-07-28
CN117157399A (zh) * 2021-02-26 2023-12-01 国立大学法人神户大学 植物基因组进化工程半理性方法
CA3219711A1 (en) * 2021-05-26 2022-12-01 Stephen P. Long C4 plants with increased photosynthetic efficiency
WO2022266439A2 (en) * 2021-06-17 2022-12-22 The Board Of Trustees Of The University Of Illinois Crispr cascade

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014093595A1 (en) * 2012-12-12 2014-06-19 The Broad Institute, Inc. Crispr-cas component systems, methods and compositions for sequence manipulation
WO2015133554A1 (ja) * 2014-03-05 2015-09-11 国立大学法人神戸大学 標的化したdna配列の核酸塩基を特異的に変換するゲノム配列の改変方法及びそれに用いる分子複合体

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2300376A1 (en) 1997-08-26 1999-03-04 Ariad Gene Therapeutics, Inc. Fusion proteins comprising a dimerization, trimerization or tetramerization domain and an additional heterologous transcription activation, transcription repression, dna binding or ligand binding domain
AU2003251286B2 (en) 2002-01-23 2007-08-16 The University Of Utah Research Foundation Targeted chromosomal mutagenesis using zinc finger nucleases
ES2719789T3 (es) 2007-03-02 2019-07-16 Dupont Nutrition Biosci Aps Cultivos con resistencia mejorada a fagos
WO2010132092A2 (en) 2009-05-12 2010-11-18 The Scripps Research Institute Cytidine deaminase fusions and related methods
US8772008B2 (en) 2009-05-18 2014-07-08 Sangamo Biosciences, Inc. Methods and compositions for increasing nuclease activity
US20110104787A1 (en) 2009-11-05 2011-05-05 President And Fellows Of Harvard College Fusion Peptides That Bind to and Modify Target Nucleic Acid Sequences
TR201815882T4 (tr) 2009-12-10 2018-11-21 Univ Iowa State Res Found Inc Tal efektörü aracılı dna modifikasyonu.
JP2013128413A (ja) 2010-03-11 2013-07-04 Kyushu Univ Pprモチーフを利用したrna結合性蛋白質の改変方法
DK2784157T3 (da) 2011-10-21 2019-10-21 Univ Kyushu Nat Univ Corp Designfremgangsmåde til et rna-bindende protein under anvendelse af ppr-motiv og anvendelse deraf
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
JP6212535B2 (ja) 2012-03-23 2017-10-11 セレクティスCellectis 工学的に操作されたtaledna結合性ドメインの化学的dna改変感受性を変更する方法
JP6343605B2 (ja) 2012-05-25 2018-06-13 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア Rna依存性標的dna修飾およびrna依存性転写調節のための方法および組成物
US20150315576A1 (en) 2012-11-01 2015-11-05 Massachusetts Institute Of Technology Genetic device for the controlled destruction of dna
RU2701850C2 (ru) * 2012-12-12 2019-10-01 Те Брод Инститьют, Инк. Конструирование систем, способы и оптимизированные направляющие композиции для манипуляции с последовательностями
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
WO2014165612A2 (en) 2013-04-05 2014-10-09 Dow Agrosciences Llc Methods and compositions for integration of an exogenous sequence within the genome of plants
US9873907B2 (en) * 2013-05-29 2018-01-23 Agilent Technologies, Inc. Method for fragmenting genomic DNA using CAS9
US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
US11053481B2 (en) * 2013-12-12 2021-07-06 President And Fellows Of Harvard College Fusions of Cas9 domains and nucleic acid-editing domains
EP3215168B1 (en) 2014-10-31 2023-08-02 The Trustees of the University of Pennsylvania Altering gene expression in modified t cells and uses thereof
JP6153180B2 (ja) 2014-11-04 2017-06-28 国立大学法人神戸大学 脱塩基反応により標的化したdna配列に特異的に変異を導入する、ゲノム配列の改変方法、並びにそれに用いる分子複合体
CA2998087A1 (en) 2015-09-09 2017-03-16 National University Corporation Kobe University Method for modifying genome sequence that specifically converts nucleobase of targeted dna sequence, and molecular complex used in said method
BR112018004636A2 (pt) 2015-09-09 2018-10-30 National University Corporation Kobe University método para modificação de um sítio alvejado em um dna de fita dupla de uma bactéria gram-positiva, complexo de enzima modificadora de ácido nucleico, e, ácido nucleico
WO2017070632A2 (en) 2015-10-23 2017-04-27 President And Fellows Of Harvard College Nucleobase editors and uses thereof
KR102061438B1 (ko) 2015-11-27 2019-12-31 고쿠리츠다이가쿠호진 고베다이가쿠 표적화 dna 서열 중의 핵산 염기가 특이적으로 전환되어 있는 단자엽식물 게놈 서열을 전환시키는 방법, 및 그것에 사용되는 분자 복합체
WO2017183724A1 (ja) 2016-04-21 2017-10-26 国立大学法人神戸大学 ゲノム配列改変技術における変異導入効率の向上方法、及びそれに用いる分子複合体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014093595A1 (en) * 2012-12-12 2014-06-19 The Broad Institute, Inc. Crispr-cas component systems, methods and compositions for sequence manipulation
WO2015133554A1 (ja) * 2014-03-05 2015-09-11 国立大学法人神戸大学 標的化したdna配列の核酸塩基を特異的に変換するゲノム配列の改変方法及びそれに用いる分子複合体

Also Published As

Publication number Publication date
US11220693B2 (en) 2022-01-11
BR112018010681A2 (pt) 2018-11-13
BR112018010681A8 (pt) 2019-02-26
JPWO2017090761A1 (ja) 2018-10-25
DK3382019T3 (da) 2022-05-30
EP3382019A1 (en) 2018-10-03
US20190085342A1 (en) 2019-03-21
ES2914623T3 (es) 2022-06-14
CN108495932A (zh) 2018-09-04
KR20180081811A (ko) 2018-07-17
WO2017090761A1 (ja) 2017-06-01
EP3382019A4 (en) 2019-04-24
KR102061438B1 (ko) 2019-12-31
JP6923205B2 (ja) 2021-08-18
EP3382019B1 (en) 2022-05-04
HK1256888A1 (zh) 2019-10-04

Similar Documents

Publication Publication Date Title
CN108495932B (zh) 用于特异性转换靶向dna序列的核酸碱基的单子叶植物的基因组序列的转换方法、及其使用的分子复合体
CN109957569B (zh) 基于cpf1蛋白的碱基编辑系统和方法
JP4264703B2 (ja) 合成遺伝子、およびCpGを欠く細菌プラスミド
CN101365788B (zh) Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途
CN110157727A (zh) 植物碱基编辑方法
CN108138155A (zh) 经由指导cas系统恢复非功能性基因产物的功能及使用方法
BRPI0806354A2 (pt) plantas oleaginosas transgências, sementes, óleos, produtos alimentìcios ou análogos a alimento, produtos alimentìcios medicinais ou análogos alimentìcios medicinais, produtos farmacêuticos, bebidas fórmulas para bebês, suplementos nutricionais, rações para animais domésticos, alimentos para aquacultura, rações animais, produtos de sementes inteiras, produtos de óleos misturados, produtos, subprodutos e subprodutos parcialmente processados
JP2020505005A (ja) 5’−イノシン酸を生産する微生物及びこれを用いた5’−イノシン酸の生産方法
CN112204147A (zh) 基于Cpf1的植物转录调控系统
KR20130138760A (ko) 고농도의 에이코사펜타엔산 생성을 위한 재조합 미생물 숙주 세포
KR20180074610A (ko) 동물 배아의 염기 교정용 조성물 및 염기 교정 방법
CN110066824B (zh) 一套用于水稻的碱基编辑人工系统
WO2023069900A1 (en) Custom bacterial strain for recombinant protein production
EP2383337B1 (en) Novel promoter for use in transformation of algae
WO2013080934A1 (ja) ヒト遺伝子由来プロモーター
KR102026067B1 (ko) 목적 유전자 발현 조절을 위한 대장균 및 코리네박테리움 글루타미쿰 셔틀 벡터
Khromov et al. Delivery of CRISPR/Cas9 ribonucleoprotein complex to apical meristem cells for DNA-free editing of potato Solanum tuberosum genome
CN103305541A (zh) 一种激活标签Ac/Ds转座系统及其在植物突变体库构建中的应用
CN110747186B (zh) 在植物中高效生成不携带转基因元件的突变体的CRISPR/Cas9系统和方法
CN114150001A (zh) 一种用于弓形虫基因编辑的CRISPR/Cas9载体的构建方法
CN112080513A (zh) 一套编辑范围扩展的水稻人工基因组编辑系统及其应用
KR102247462B1 (ko) 리보플라빈 생성능이 향상된 재조합 유산균
CN101300358A (zh) 真核细胞中变胞藻黄素的生物合成
KR101970471B1 (ko) Ctx 파지에 감염되고 콜레라 독소를 생산할 수 있는 비브리오 콜레라 균주
CN117178056A (zh) 用于生产无缝dna载体的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant