CN108495932B

CN108495932B - 用于特异性转换靶向dna序列的核酸碱基的单子叶植物的基因组序列的转换方法、及其使用的分子复合体

Info

Publication number: CN108495932B
Application number: CN201680079887.5A
Authority: CN
Inventors: 西田敬二; 岛古善平; 近藤昭彦
Original assignee: Kobe University NUC
Current assignee: Kobe University NUC
Priority date: 2015-11-27
Filing date: 2016-11-25
Publication date: 2022-08-09
Anticipated expiration: 2036-11-25
Also published as: US11220693B2; BR112018010681A2; BR112018010681A8; JPWO2017090761A1; DK3382019T3; EP3382019A1; US20190085342A1; ES2914623T3; CN108495932A; KR20180081811A; WO2017090761A1; EP3382019A4; KR102061438B1; JP6923205B2; EP3382019B1; HK1256888A1

Abstract

本发明提供修饰单子叶植物细胞所具有的双链DNA的靶向位点的方法，其包括以下步骤，使(由核酸碱基转变酶和与所选择的双链DNA中的靶核苷酸序列特异性结合的核酸序列识别模块结合而成的)复合体与该双链DNA接触，在该靶向位点中不切割该双链DNA的至少一个链，将该靶向位点的1个以上的核苷酸缺失或转换为其它1个以上的核苷酸，或者向该靶向位点插入1个以上的核苷酸的步骤，其中，该双链DNA与该复合体的接触通过向该单子叶植物细胞导入的编码该复合体的核酸来进行。进一步，也提供用于在该方法中使用的复合体，其由核酸碱基转变酶和与单子叶植物细胞具有的双链DNA中的靶核苷酸序列特异性结合的核酸序列识别模块结合而成。

Description

用于特异性转换靶向DNA序列的核酸碱基的单子叶植物的基因组序列的转换方法、及其使用的分子复合体

技术领域

本发明涉及基因组序列的修饰方法，及其使用的核酸碱基转变酶和核酸序列识别模块的复合体，其不伴随DNA的双链切割(无切割或者单链切割)，而能够进行单子叶植物基因组的特定区域内的核酸碱基的修饰。

背景技术

单子叶植物是指在被子植物中的一组具有1枚子叶的植物，水稻、小麦、玉米这三大谷物分类于该组。因此，虽然以前对单子叶植物的分子育种进行了热烈的研究，但由于单子叶植物不是农杆菌的宿主，因此作为植物的转化法无法长期利用最一般的农杆菌法，而使用了直接导入法。到了1990年代中旬，从报告了通过使细胞分裂旺盛的细胞感染农杆菌，由此可有效地使水稻转化以来，基于基因导入进行的单子叶植物的分子育种有了大幅进步。

另一方面，近年来，作为在各种生物种类中修饰目标的基因、基因组区域的技术，基因组编辑受到了关注。目前，作为基因组编辑的方法，提出了利用由具有非序列依赖性的DNA切割能力的分子、与具有序列识别能力的分子组合而成的人工核酸酶的方法(非专利文献1)。

例如，使用由锌指DNA结合结构域与非特异性DNA切割结构域连接而成的锌指核酸酶(ZFN)，来进行在宿主的植物细胞或昆虫细胞中的DNA中的、在目标基因座(gene locus)位置的重组的方法(专利文献1)，使用由DNA核酸内切酶和转录激活子样(TAL)效应子(其为植物病原菌黄单胞菌属所具有的DNA结合模块)连接而成的TALEN，在特定的核苷酸序列内或与其相邻的位点中切割、修饰靶基因的方法(专利文献2)，或者，已报告了利用CRISPR-Cas9系统的方法，CRISPR-Cas9系统由(在真细菌、古细菌所具有的获得性免疫系统中起作用的)DNA序列CRISPR(Clustered Regularly interspaced short palindromic repeats)和与CRISPR一起具有重要作用的核酸酶Cas(CRISPR-associated)蛋白家族所组合而成(专利文献3)等。另外,最近报告了Cpf1作为CRISPR-Cas系统的新的核酸内切酶(非专利文献2)。进一步，也有报告了使用由核酸酶和PPR蛋白质所连接而成的人工核酸酶，其中，所述PPR蛋白质被构成为利用PPR基序(PPR基序可识别包括35个氨基酸的1个核酸碱基)的连续来识别特定的核苷酸序列的方式，从而在该特定序列的附近切割靶基因的方法(专利文献4)。

但是，这些基因组编辑技术基本上以基于核酸酶的DNA双链切割(double-stranded DNA breaks:DSB)为前提，但存在这样的课题：由于DSB伴随了意想不到的基因组修饰，因此存在强细胞毒性、染色体的重排等副作用，细胞存活数极其少，根据细胞种类不同，本来就难以进行基因修饰。

对于上述课题，本发明人报告了：使用了催化脱氨基反应的脱氨酶，通过将其与具有DNA序列识别能力的分子连接而成的复合体导入宿主细胞，成功地在包括酵母、大肠杆菌的各种生物种类中，不伴随DSB，而在包含特定的DNA序列的区域中进行了基于核酸碱基转变的基因组序列的修饰(专利文献5)。

但是，在如单子叶植物这样的高等植物中使用该方法的情况下，为了进一步提高导入突变效率，期望将待导入的分子复合体的构成、导入后的植物细胞的培养条件等进行进一步优化。另外，在酵母、原核生物中，如从脱氨酶的使用所预测的那样，突变方式主要为碱基取代，而插入/缺失突变的频率较低，因此，需要开发可有效地导入不同方式的突变的技术。

现有技术文献

专利文献

专利文献1：日本专利第4968498号公报

专利文献2：日本特表2013-513389号公报

专利文献3：日本特表2010-519929号公报

专利文献4：日本特开2013-128413号公报

专利文献5：国际公开第2015/133554号

非专利文献

非专利文献1：Kelvin M Esvelt,Harris H Wang(2013)Genome-scaleengineering for systems and synthetic biology,Molecular Systems Biology 9:641

非专利文献2：Bernd Zetsche et al.(2015)Cpf1Is a Single RNA-GuidedEndonuclease of a Class 2CRISPR-Cas System,Cell 163:759-771

发明内容

发明要解决的问题

因此，本发明的第1目的在于提供新型基因组编辑的方法、以及用于此目的的核酸碱基转变酶和经进一步优化的核酸序列识别模块的复合体，其不伴随DSB，即，通过不切割双链DNA或者单链切割，可有效地修饰单子叶植物的基因组基因的特定序列的核酸碱基。另外，本发明的第2目的在于提供：可在使用脱氨酶而不伴随DSB的基因组编辑中，以与碱基取代不同的方式有效地向宿主细胞导入突变的办法。

解决问题的方法

本发明人为了完成上述第1目的，首先将作为人工核酸酶的CRISPR/Cas9系统针对水稻进行最优化而成的靶向载体pZH_OsU6gRNA_MMCas9(Plant Mol Biol(2015)88:561-572)与脱氨酶进行了组合(参考图1B)。即，向上述靶向载体中的针对水稻的密码子使用而最优化的Cas9编码序列(OsCas9)，导入使目标DNA双链或者一条链的切割能力失活的突变，并且使该编码序列与针对植物的密码子使用而最优化的胞苷脱氨酶编码序列(AtPmCDA)进行融合。进一步，由于植物细胞比酵母等的细胞尺寸大，所以在细胞质中合成的Cas9/脱氨酶融合蛋白的向核的转移效率可能降低的假说下，不仅在Cas9的上游、在脱氨酶的两末端也分别加上了核定位信号(NLS)。将该改良型载体导入水稻愈伤组织，结果可以将靶核苷酸序列内的目标碱基顺利取代为其它碱基。进一步，惊讶地发现，在使用目标DNA的一个链的切割能力失活的(具有切口酶活性)Cas9(D10A)的情况下，主要发生在由脱氨酶而脱氨基的碱基为中心的区域中的缺失突变。

另外，本发明人在导入突变株的选择步骤中，以比通常使用的培养温度比更低温的温度来培养基因导入后的水稻愈伤组织，结果成功地将导入突变效率进一步提高。

本发明人基于这些见解进一步反复研究，结果完成了本发明。

即，本发明如下所述。

[1]修饰单子叶植物细胞所具有的双链DNA的靶向位点的方法，其包括：使由核酸碱基转变酶、和与所选择的双链DNA中的靶核苷酸序列特异性结合的核酸序列识别模块结合而成的复合体，与该双链DNA接触，在该靶向位点中不切割的该双链DNA的至少一个链，而使该靶向位点的1个以上的核苷酸缺失或转换为其它1个以上的核苷酸，或者向该靶向位点插入1个以上的核苷酸的步骤，其中，该双链DNA与该复合体的接触通过向该单子叶植物细胞导入编码该复合体的核酸，培养该单子叶植物细胞而使该复合体在细胞内表达来进行。

[2]上述[1]所述的方法，其中，上述培养步骤中的至少一部分在与该单子叶植物细胞的最适培养温度比更低温的温度下进行。

[3]上述[1]或[2]所述的方法，其中，上述核酸序列识别模块选自：Cas的至少1个DNA切割能力失活的CRISPR-Cas系统、锌指基序、TAL效应子及PPR基序。

[4]上述[1]或[2]所述的方法，其中，上述核酸序列识别模块我Cas的至少1个DNA切割能力失活的CRISPR-Cas系统。

[5]上述[4]所述的方法，其中，上述核酸序列识别模块为与指导RNA形成互补链的链的相反链的切割能力失活的CRISPR-Cas系统。

[6]上述[5]所述的方法，其使靶向位点的1个以上的核苷酸缺失。

[7]上述[1]～[6]中任一项所述的方法，其中，上述核酸碱基转变酶为脱氨酶。

[8]上述[7]所述的方法，其中，上述脱氨酶为胞苷脱氨酶。

[9]上述[8]所述的方法，其中，上述胞苷脱氨酶为源自七腮鳗的PmCDA1。

[10]上述[1]～[9]中任一项所述的方法，其中，编码核酸序列识别模块及核酸碱基转变酶的核酸序列针对被子植物或者单子叶植物的密码子使用而最优化。

[11]上述[1]～[10]中任一项所述的方法，其中，在核酸序列识别模块及核酸碱基转变酶的两末端添加了核定位信号。

[12]上述[1]～[11]中任一项所述的方法，其中，单子叶植物为水稻、小麦或玉米。

[13]上述[12]所述的方法，其中，单子叶植物为水稻。

[14]核酸修饰酶复合体，其为核酸碱基转变酶和与单子叶植物细胞具有的双链DNA中的靶核苷酸序列特异性结合的核酸序列识别模块结合而成的复合体，所述核酸修饰酶复合体在该靶向位点中，不切割该双链DNA的至少一个链，该靶向位点的1个以上的核苷酸缺失或转换为其它1个以上的核苷酸，或者向该靶向位点插入1个以上的核苷酸而在该单子叶植物细胞中起作用。

[15]上述[14]所述的核酸修饰酶复合体，其中，核酸序列识别模块为Cas的至少1个DNA切割能力失活的CRISPR-Cas系统，核酸碱基转变酶为胞苷脱氨酶。

[16]上述[14]或[15]所述的核酸修饰酶复合体，其中，在核酸序列识别模块及核酸碱基转变酶的两末端添加了核定位信号。

[17]编码上述[14]～[16]中任一项所述的核酸修饰酶复合体的核酸。

[18]上述[17]所述的核酸，其中编码核酸序列识别模块及核酸碱基转变酶的核酸序列针对被子植物或者单子叶植物的密码子使用而最优化。

发明效果

根据本发明的基因组编辑技术，由于不伴随DNA双链切割因而安全性优异，且能够以较高的突变导入效率进行单子叶植物的基因修饰。

附图说明

[图1]示意地示出实施例中使用的载体质粒的结构的图。A：Target-AID评价用载体。B：Target-AID载体。

[图2]示出在导入了两种Target-AID评价用载体的水稻愈伤组织中的EGFP的表达的图。

[图3]示出通过对导入pRIT3-mEGFP和2409所得到的双重转化体的PCR分析，确认了mEGFP及hpt基因的并入的结果的图。

[图4]示出导入pRIT3-mEGFP和2409所得到的双重转化克隆No.6中的EGFP表达的图。

[图5]示出导入pRIT3-mEGFP和2409所得到的双重转化克隆No.3中的EGFP表达的图。

[图6]示出导入pRIT3-mEGFP和2409所得到的两种双重转化克隆(A及B)中的靶核苷酸序列附近的测序分析结果的图。

[图7]示出导入pRIT3-mEGFP和2409所得到的双重转化克隆No.39中的靶核苷酸序列附近的测序分析结果的图。

[图8]示出导入pRIT3-mEGFP和2408所得到的双重转化克隆No.1中的靶核苷酸序列附近的测序分析结果的图。

[图9]示出导入pRIT3-mEGFP和2408所得到的双重转化克隆No.2中的靶核苷酸序列附近的测序分析结果的图。

[图10]示出导入pRIT3-mEGFP和2408所得到的双重转化克隆No.4中的靶核苷酸序列附近的测序分析结果的图。

[图11]示出导入pRIT3-mEGFP和2408所得到的双重转化克隆No.1的亚克隆No.1D(GFP信号阴性)中的靶核苷酸序列附近的测序分析结果的图。

[图12]示出甲氧咪草烟(Imazamox)对水稻愈伤组织的有效浓度的评价的结果的图。上图为将水稻愈伤组织接芽至添加了甲氧咪草烟的培养基的当天，下图为培养28天时间之后的照片。

[图13]甲氧咪草烟抗性赋予试验中使用的野生型ALS及突变型ALS A96V的表达载体的模式图。

[图14]示出基于Target-AID的水稻ALS A96V的修饰的靶序列的图。

[图15]示出基于Target-AID的水稻ALS基因的修饰的图。

[图16]是基于Target-AID的水稻ALS A96V修饰愈伤组织进行再分化而成的T0植物体的照片。

[图17]示出由基于Target-AID的水稻ALS A96V修饰愈伤组织进行再分化而成的T0植物体，保持了与原始的愈伤组织相同的ALS基因修饰的图。

[图18]示出基于Target-AID的多个基因的同时修饰的图。

具体实施方式

本发明提供不切割单子叶植物细胞内的待修饰的双链DNA，通过将该双链DNA中的靶核苷酸序列及其附近的核苷酸转换为其它核苷酸等，从而修饰该双链DNA的该靶向位点的方法(以下也称为“本发明的方法”)。该方法包括：通过使由核酸碱基转变酶和与该双链DNA中的靶核苷酸序列进行特异性结合的核酸序列识别模块结合而成的复合体在宿主单子叶植物细胞内与该双链DNA接触，而使该靶向位点(即，靶核苷酸序列及其附近的核苷酸)转换为其它核苷酸等的步骤。

对在本发明的方法中可使用的单子叶植物没有特别的限制，例如：水稻、小麦、玉米、大麦、黑麦等谷物类，百合等园艺植物，更优选为水稻、小麦、玉米，特别优选为水稻。

在本发明中，双链DNA的“修饰”是指使DNA链上具有的核苷酸(例如：dC)缺失或转换为其它核苷酸(例如：dT、dA或dG)，或者向DNA链上具有的核苷酸之间插入核苷酸或者核苷酸序列。这里，对待修饰的双链DNA而言，只要是宿主细胞内存在的双链DNA即可，没有特别限制，优选为基因组DNA、特别是核基因组DNA。另外，双链DNA的“靶向位点”是指，核酸序列识别模块可特异性识别并结合的“靶核苷酸序列”的全部或者一部分，或指该靶核苷酸序列的附近(5'上游及3'下游的任意一种或两种)。另外，“靶核苷酸序列”是指双链DNA中的核酸序列识别模块可结合的序列。

在本发明中“核酸序列识别模块”是指具有特异性识别并结合DNA链上的特定的核苷酸序列(即靶核苷酸序列)的能力的分子或分子复合体。核酸序列识别模块可以通过与靶核苷酸序列结合，使与该模块连接的核酸碱基转变酶在双链DNA的靶向位点发挥特异性的作用。

在本发明中，“核酸碱基转变酶”是指，可以通过催化DNA碱基的嘌呤或嘧啶环上的取代基转换为其它基团或原子的反应，而不切割DNA链从而将靶核苷酸转换为其它核苷酸的酶。

在本发明中，“核酸修饰酶复合体”是指，包含由上述核酸序列识别模块和核酸碱基转变酶连接而成的复合体，赋予了特定的核苷酸序列识别能力的具有核酸碱基转变酶活性的分子复合体。在此，“复合体”不仅包括由多个分子构成的形式，也包括像融合蛋白那样在单个分子内具有核酸序列识别模块和核酸碱基转变酶的形式。

就用于本发明的方法的核酸碱基转变酶而言，只要可以催化上述反应即可，没有特别限制，可列举例如：催化氨基转换为羰基的脱氨基反应的，属于核酸/核苷酸脱氨酶超家族的脱氨酶。可列举优选：可以将胞嘧啶或5-甲基胞嘧啶分别转换为尿嘧啶或胸腺嘧啶的胞苷脱氨酶，可以将腺嘌呤转换为次黄嘌呤的腺苷脱氨酶，可以将鸟嘌呤转换为黄嘌呤的鸟苷脱氨酶等。作为胞苷脱氨酶，更优选可列举活化诱导的胞苷脱氨酶(以下也称为AID)等，其为在脊椎动物的获得性免疫中在免疫球蛋白基因中导入突变的酶。

对核酸碱基转变酶的来源没有特别限制，例如，只要是胞苷脱氨酶即可，可以使用源自七腮鳗的PmCDA1(Petromyzon marinus cytosine deaminase1)、源自脊椎动物(例如：人、猪、牛、犬、黑猩猩等哺乳动物，鸡等鸟类，非洲爪蟾(Xenopus laevis)等两栖类，斑马鱼、香鱼、布氏鲶鱼等鱼类等)的AID(激活诱导的胞苷脱氨酶，Activation-inducedcytidine deaminase；AICDA)。

对由本发明的核酸修饰酶复合体的核酸序列识别模块所识别的双链DNA中的靶核苷酸序列而言，只要可以与该模块特异性结合即可，没有特别限制，可以为双链DNA中的任意序列。就靶核苷酸序列的长度而言，只要足以与核酸序列识别模块进行特异性结合即可，根据单子叶植物的基因组尺寸，例如为12个核苷酸以上、优选为15个核苷酸以上、更优选为18个核苷酸以上。对长度的上限没有特别限制，优选为25个核苷酸以下，更优选为22个核苷酸以下。

作为本发明的核酸修饰酶复合体的核酸序列识别模块，可以使用例如：Cas的至少1种DNA切割能力失活的CRISPR-Cas系统(CRISPR-突变Cas)、锌指基序、TAL效应子及PPR基序等，除此以外，可以使用包含限制酶、转录因子、RNA聚合酶等可与DNA进行特异性结合的蛋白质的DNA结合结构域且不具有DNA双链切割能力的片段等，但不限于这些。优选可列举：CRISPR-突变Cas、锌指基序、TAL效应子、PPR基序等。

锌指基序为由3～6个不同的Cys2His2型锌指单元(1个手指识别约3个碱基)连接而成，可以识别9～18个碱基的靶核苷酸序列。锌指基序可以根据Modular assembly法(NatBiotechnol(2002)20:135-141)、OPEN法(Mol Cell(2008)31:294-301)、CoDA法(NatMethods(2011)8:67-69)、大肠杆菌单杂交法(Nat Biotechnol(2008)26:695-701)等公知的方法产生。对于产生锌指基序的细节，可以参照上述专利文献1。

对TAL效应子而言，其具有以约34个氨基酸作为单位的模块的重复结构，利用1个模块的第12及13个氨基酸残基(称为RVD)来确定结合稳定性和碱基特异性。由于各个模块的独立性较高，因此可以仅将模块相连来产生对靶核苷酸序列特异性的TAL效应子。TAL效应子可以由利用Open resource的产生方法(REAL法(Curr Protoc Mol Biol(2012)Chapter 12:Unit12.15)、FLASH法(Nat Biotechnol(2012)30:460-465)、Golden Gate法(Nucleic Acids Res(2011)39：e82)等)进行构建，比较简便地设计相对于靶核苷酸序列的TAL效应子。对于产生TAL效应子的细节，可以参照上述专利文献2。

构建PPR基序进而特定的核苷酸序列由PPR基序的连续识别，所述PPR基序各包含35个氨基酸并识别1个核酸碱基，且仅由每个基序的1、4和ii(-2)氨基酸识别靶向碱基。由于对基序构成没有依赖性，不受两侧的基序的干涉，因此与TAL效应子同样可以仅将PPR基序相连，来产生对靶核苷酸序列特异性的PPR蛋白质。对于产生PPR基序的细节，可以参照上述专利文献4。

另外，在使用限制酶、转录因子、RNA聚合酶等片段的情况下，由于它们的蛋白质的DNA结合结构域是众所周知的，因此可以容易地设计、构建包含该结构域且不具有DNA双链切割能力的片段。

上述任意核酸序列识别模块也可以以与上述核酸碱基转变酶的融合蛋白的形式提供，或者，也可以将SH3结构域、PDZ结构域、GK结构域、GB结构域等蛋白质结合结构域和它们的结合配偶体，分别与核酸序列识别模块和与核酸碱基转变酶融合，通过该结构域和它们的结合配偶体的相互作用而以蛋白质复合体的形式提供。或者，也可以将核酸序列识别模块与核酸碱基转变酶和与内含肽(intein)分别融合，通过各蛋白质合成后的连接(Ligation)将两者连接。

就包含核酸碱基转变酶与核酸序列识别模块结合而成的复合体(包括融合蛋白)的本发明的核酸修饰酶复合体，与双链DNA的接触而言，通过向具有目标的双链DNA(例如，核基因组DNA)的单子叶植物细胞导入编码该复合体的核酸来实施。

因此，对核酸序列识别模块与核酸碱基转变酶而言，以编码它们的融合蛋白的核酸的形式进行制备，或以使得利用结合结构域、内含肽等翻译成蛋白质之后可以在宿主细胞内形成复合体的形态，以分别编码它们的核酸的形式进行制备。在此，核酸可以为DNA也可以为RNA，优选为DNA。在为DNA时，优选为双链DNA，并以在宿主细胞内在功能性的启动子的操纵下配置的表达载体的形态提供。

由于核酸序列识别模块和核酸碱基转变酶结合而成的本发明的复合体不伴随DNA双链切割(DSB)，因此，能够进行毒性较低的基因组编辑，本发明的基因修饰方法可以广泛适用于单子叶植物全体。

对编码锌指基序、TAL效应子、PPR基序等核酸序列识别模块的DNA而言，对于各模块，可以通过上述任意方法获得。对编码限制酶、转录因子、RNA聚合酶等序列识别模块的DNA而言，可以通过以下进行克隆：例如基于它们的cDNA序列信息，而合成使得覆盖编码该蛋白质的期望部分(包含DNA结合结构域的部分)的区域的寡DNA引物，并利用由产生该蛋白质的细胞制备的总RNA或者mRNA级分作为模板，通过RT-PCR法进行扩增。

编码核酸碱基转变酶的DNA也可以同样地通过以下进行克隆：基于待使用的酶的cDNA序列信息来合成寡DNA引物，使用由产生该酶的细胞制备的总RNA或者mRNA级分作为模板，通过RT-PCR法进行扩增。例如，就编码七腮鳗的PmCDA1的DNA而言，可以基于NCBI数据库中登记的cDNA序列(登记号.EF094822)，针对CDS的上游及下游设计适当的引物，从源自七腮鳗的mRNA通过RT-PCR法进行克隆。另外，就编码人AID的DNA而言，可以基于NCBI数据库登记的cDNA序列(登记号.AB040431)，针对CDS的上游及下游设计适当的引物，例如从源自人淋巴结的mRNA通过RT-PCR法进行克隆。其它源自脊椎动物的AID同源也可以基于公知的cDNA序列信息(例如：猪(登记号.CU582981)、牛(登记号.NM_110138682)、犬(登记号.NM_001003380)、黑猩猩(登记号.NM_001071809)、鸡(登记号.NM_001243222)、非洲爪蟾(登记号.NM_001095712)、斑马鱼(登记号.AAI62573)、香鱼(登记号.AB619797)、布氏鲶鱼(登记号.NM_001200185)等)，与上述同样地进行而克隆。

经克隆的DNA可以直接或根据需要利用限制酶进行消化，或在加上适当的接头和/或核定位信号(在目标的双链DNA为线粒体、叶绿体DNA时，为各细胞器定位信号)之后，与编码核酸序列识别模块的DNA进行连接，来制备编码融合蛋白的DNA。在优选实施方式中，优选在编码核酸序列识别模块的DNA和编码核酸碱基转变酶的DNA这两者的两末端，加上编码核定位信号等细胞器定位信号的DNA序列。由于单子叶植物细胞的尺寸大于酵母细胞，因此合成蛋白质的细胞质与核之间的距离变大。因此，对于如核酸碱基转变酶与核酸序列识别模块的复合体这样的分子量较大的蛋白质分子有效地输送至核，优选在核酸序列识别模块和核酸碱基转变酶的两者均加上核定位信号。在将核酸碱基转变酶与核酸序列识别模块以融合蛋白的形式表达的情况下，可以在融合蛋白的两末端、和核酸序列识别模块与核酸碱基转变酶之间加上核定位信号。作为核定位信号，只要可以在单子叶植物中起作用即可，没有特别的限制，可列举例如源自SV40的核定位信号(PKKKRKV；SEQ ID NO:6)。

或者，编码核酸序列识别模块的DNA和编码核酸碱基转变酶的DNA可以分别与编码结合结构域或其的结合配偶体的DNA进行融合，或也可以通过使两种DNA与编码分离内含肽的DNA进行融合，从而使得核酸序列识别转变模块和核酸碱基转变酶在宿主细胞内翻译后再形成复合体。在这些情况下，也可以根据需要在一方或双方DNA的适当的位置连接接头及/或核定位信号。

对编码核酸序列识别模块的DNA和编码核酸碱基转变酶的DNA而言，可以化学合成DNA链，或者也可以通过将合成的部分重叠的寡DNA短链利用PCR法、Gibson Assembly法进行连接，从而构建编码其全长的DNA。利用化学合成或PCR法或者Gibson Assembly法的组合来构建全长DNA的优点在于，可以在整个CDS全长上设计与待导入该DNA的宿主配合的使用密码子。在表达异种DNA时，通过将该DNA序列转换为在宿主生物中使用频率较高的密码子，可以期待使蛋白质表达量增大。就待使用的宿主中的密码子使用频率的数据而言，可以使用例如在(公财)Kazusa DNA研究所的主页上公开的遗传密码使用频率数据库(http://www.kazusa.or.jp/codon/index.html)，也可以参照记载了各宿主中的密码子的使用频率的文献。只要参照取得的数据和准备导入的DNA序列，将该DNA序列中使用的密码子中的在宿主中使用频率较低的密码子，转换为编码同一氨基酸且使用频率较高的密码子即可。例如，在宿主细胞为水稻细胞的情况下，可以使用针对水稻等单子叶植物，或者拟南芥等被子植物的一般的密码子使用而最优化的核酸序列识别模块和/或编码核酸碱基转变酶的序列。例如，作为具有适于在被子植物中的表达的密码子使用的PmCDA1DNA，可列举具有以SEQID NO:1表示的核苷酸序列的DNA。

含有编码核酸序列识别模块和/或核酸碱基转变酶的DNA的表达载体，例如可以通过以下制造：在包含在单子叶植物细胞中可发挥作用的启动子的载体中，将该DNA连接于该启动子的下游。

作为在单子叶植物细胞中可复制的载体，只要是具有在单子叶植物细胞中起作用的复制起点(例如，Ti质粒、Ri质粒的ori等)的那些即可，没有特别的限制，优选也具有大肠杆菌的复制起点(例如，ColE1ori等)。在作为基因导入法使用了农杆菌法的情况，需要进一步包含Ti质粒、Ri质粒的已除去致病性基因的T-DNA片段(包括边界序列RB及LB)，可列举例如：源自pBIN193的pBI101、pBI121(Clontech)、以它们为骨架的改良型载体(例如，pRI909、pRI910、pRI101、pRI201(TAKARABio)等)，但不限于这些。

作为启动子，只要是在单子叶植物细胞中可发挥作用的启动子即可，可以是任意启动子。由于伴随DSB的常规法有毒性，因此宿主细胞的生存率可能显著降低，所以优选在使用诱导启动子(例如，被受伤、水杨酸处理所诱导的PR1α基因启动子，被干燥、低温、脱落酸处理所诱导的rd29A基因启动子、被二氯丙烯胺(dichlormid)处理所诱导的GST-27基因启动子等)事先增加细胞数量至开始诱导为止，但本发明的核酸修饰酶复合体即使表达也可得到充分的细胞增殖，所以可以不限制地使用构成启动子。作为构成启动子，可列举花椰菜花叶病毒(cauliflower mosaic virus)(CaMV)35S启动子、CaMV19S启动子、胭脂碱合成酶(nopaline synthetase)(NOS)启动子、源自欧芹的泛素启动子(Pcubi4-2)等。也可以使用这些启动子或其片段串联相连而成的片段(例如，2x35S)。

在表达载体中，可以根据需要含有终止子(例如，NOS终止子、豌豆rbcS3A终止子、热休克蛋白质(HSP)17.3终止子等)，翻译增强子(例如，源自水稻的醇脱氢酶5'非翻译区(Os ADH-5'UTR)、CaMV、源自烟草花叶病毒(TMV)的Ω序列等)，3'调节区(例如，源自水稻的肌动蛋白基因(Act1)3'UTR等)，polyA加成信号，药物抗性基因(例如，G418抗性基因(nPtII)，潮霉素抗性基因(hpt)等)选择标记等。

编码核酸序列识别模块和/或核酸碱基转变酶的RNA可以通过例如以下制备：以编码上述核酸序列识别模块和/或核酸碱基转变酶的DNA编码的载体作为模板，通过本身公知的体外转录系统转录为mRNA。

可以通过将包含编码核酸序列识别模块及/或核酸碱基转变酶的DNA表达载体导入宿主单子叶植物细胞，并培养该宿主细胞，从而使核酸碱基转变酶与核酸序列识别模块的复合体在细胞内表达。

对作为宿主的单子叶植物细胞而言，可以使用例如：从水稻、小麦、玉米、大麦、黑麦等谷物，百合等花卉园艺植物等制备的悬浮培养细胞、愈伤组织、原生质体、叶切片、根切片、种子(不成熟的胚等)等。

单子叶植物细胞可以为单倍体(一倍体)、也可以为多倍体(例如，二倍体、三倍体、四倍体等)。在常规的突变导入方法中，作为原则仅向同源染色体的一条中导入突变而形成杂合基因型，因此，如果不是优势突变，就不会表达需要的特性，而纯合化耗时耗力，大多情况不方便。与此相对，根据本发明，由于存在可以对基因组内的同源染色体上的等位基因全部导入突变的可能性，所以即使为劣势突变，也可以在该代中表达期望的表现，可克服常规法的问题。

表达载体的导入可以根据单子叶植物的种类，相对于适当的组织(例如，愈伤组织、根、叶、种子、生长点等)，依照公知的方法(例如：农杆菌法、PEG法、电穿孔法、粒子枪法等)实施。例如，在为水稻的情况下，通常可以使用农杆菌法、Whisker直接导入法等，但不限于这些。例如，在农杆菌法的情况下，依照常规方法从水稻种子诱导愈伤组织，使该愈伤组织感染已导入农杆菌表达用载体的农杆菌，3天后进行灭菌，其中，在所述农杆菌表达用载体的T-DNA片段中，内置了编码核酸序列识别模块和/或核酸碱基转变酶的DNA的表达盒。另一方面，在Whisker直接导入法的情况下，将表达载体与多聚鸟氨酸进行混合而制成复合体后，与钛酸钾制成的Whisker一起添加至水稻愈伤组织并混合，之后进行超声波处理。

在为小麦、玉米的情况下，可以例如将从不成熟的种子收集的不成熟的胚作为植物材料，同样地使用农杆菌法导入表达载体。

在使用PEG法、电穿孔法的情况下，从适当的细胞、组织依照常规方法制备原生质体，向其导入表达载体。在粒子枪法的情况下，可以使用粒子枪对愈伤组织、不成熟的胚、存在于茎尖、腋芽的生长点等，导入吸附于金微粒的表达载体。

在粒子枪法、农杆菌法中，基因导入大多情况为嵌合，所以为了进行转化需要使用向生殖系列(germ line)的细胞高频率地导入了上述核酸的试样细胞。可列举例如：胚、胚轴切片、胚形成愈伤组织(embryogenic callus)，分离的生长点等。

导入了载体的单子叶植物细胞的培养，可以根据其种类依照公知的方法实施。作为用于培养的培养基，优选为固态培养基(例如，琼脂培养基、琼脂糖培养基、结冷胶培养基等)。另外，培养基优选含有转化体的生长所必需的碳源、氮源、无机物等。例如，作为基础培养基，可以使用N6培养基、MS培养基、LS培养基、B5培养基等。也可以在培养基中适当添加植物生长物质(例如，生长素类、细胞分裂素类等)等。培养基的pH优选为约5～约8。培养温度可以根据单子叶植物细胞的种类，在通常约20℃～约35℃的范围内适当选择。例如，在为水稻愈伤组织的情况下，可以通常在28～33℃、优选在30～33℃中培养。

如上所述操作，可以在细胞内表达核酸序列识别模块和核酸碱基转变酶的复合体，即核酸修饰酶复合体。

稳定地表达导入的核酸碱基转变酶与核酸序列识别模块的转化体的选择可以通过以下进行：在添加了与导入的表达载体中包含的选择标记基因(例如，nptII、hpt等药物抗性基因)相对应的药品的培养基上，培养单子叶植物细胞，并选择药物抗性菌落。对选择培养的时期没有特别限制，通常在3-6周左右出现药物抗性菌落。

在可以可视化目标导入突变的情况下，也可以例如，在通过该导入突变而赋予单子叶植物细胞以药物抗性，对产生色素的能力发生变化的情况下，不进行使用选择标记的初步筛选，而是以基于目标导入突变的特质的变化作为指标，直接选择该导入突变株。

转化体可以根据适于其培养的本身公知的方法进行传代培养。例如，可以使用与上述转化体的选择培养中所使用的同样的方法。这里，可以通过将转化体在比通常更低的温度(例如，在为水稻愈伤组织的情况下为20-26℃、优选为约25℃)中培养，使导入突变效率升高。虽然不愿以任何理论来进行限制，但作为1种解释，作为本发明中的优选核酸碱基转变酶之一的PmCDA1，源自于変温动物七腮鳗，因此对PmCDA1的酶活性的最适温度而言，存在比普通酶的最适温度(约37℃)更低的可能性，因此，可考虑通过低温培养增大酶活性。因此，在本发明的优选一实施方式中，作为核酸碱基转变酶使用了PmCDA1，并且将导入了编码核酸序列识别模块/PmCDA1复合体的核酸的单子叶植物细胞在低温下培养。

另外，也可以通过将转化体以比通常更高的密度条件(例如，在为水稻愈伤组织的情况下，通过使愈伤组织之间可相接程度的密度，从而限定与培养基的接触，细胞受到应激这样的条件)下进行培养，使导入突变效率升高。

是否在转化体的目标双链DNA中顺利导入突变的确认，在由于导入突变而可以可视化表现型的变化的情况下，可以通过检查表现型来进行，但最终的确认优选通过以下来进行：将包含靶核苷酸序列的目标DNA区域通过基因组PCR进行扩增，确定扩增片段的碱基序列。由于即使是1个转化体克隆，根据细胞不同，导入突变的方式也可能不同，所以例如在作为植物材料使用愈伤组织的情况下，例如可以通过重复进行以下操作而得到具有均一的导入突变方式的克隆：将转化愈伤组织悬浊于液体培养基中，并再接种至固态培养基上，对形成的亚克隆确认导入突变方式。

确认了导入突变的转化体克隆，可以根据本身公知的再分化法，使其再分化为植物体。在杂合性地导入了突变的情况下，可以通过将使得到的植物体进行自体受粉所得到的R1植物，进一步进行自体受粉而得到R2植物，从而得到纯合性导入突变的植物体。

由导入至细胞内的表达载体，表达核酸碱基转变酶与核酸序列识别模块的复合体时，该核酸序列识别模块特异性识别并结合于目标的双链DNA(例如，基因组DNA)内的靶核苷酸序列，利用连接于该核酸序列识别模块的核酸碱基转变酶的作用，在靶向位点(在靶核苷酸序列的全部或者一部分或它们的附近)的有义链或者反义链发生碱基转变，在双链DNA内发生错配(例如，在将PmCDA1、AID等胞苷脱氨酶作为核酸碱基转变酶使用的情况下，靶向位点的有义链或者反义链上的胞嘧啶被转换为尿嘧啶，发生U:G或者G:U错配)。该错配未被正确修复，而修复使得相反链的碱基与转换后的链的碱基成对(上述例子中，为T-A或者A-T)，或修复时进一步取代为其它核苷酸(例如：U→A、G)，或者发生1个～数十个碱基的缺失或者插入，由此导入了各种突变。

对锌指基序而言，由于与靶核苷酸序列特异性结合的锌指的产生效率不高，另外，结合特异性高的锌指的筛选较为复杂，因此，产生多个实际发挥作用的锌指基序并不容易。就TAL效应子、PPR基序而言，比锌指基序的靶核酸序列识别的自由度高，但需要每次根据靶核苷酸序列设计并构建巨大的蛋白质，因此在效率方面存在问题。

与此相对，由于CRISPR-Cas系统是通过相对于与靶核苷酸序列互补的指导RNA来识别目标的双链DNA的序列，因此可以仅通过合成可与靶核苷酸序列形成特异性的杂合的寡DNA，而将任意序列靶向化。

因此，在本发明的更优选的实施方式中，作为核酸序列识别模块，可以使用Cas效应子蛋白质的至少1个DNA切割能力失活的CRISPR-Cas系统(CRISPR-突变Cas)。

使用了CRISPR-突变Cas的本发明的核酸序列识别模块，是以包含与靶核苷酸序列互补的序列的CRISPR-RNA(crRNA)、(根据需要)trans-activating RNA(tracrRNA)、与突变Cas效应子蛋白质的复合体的形式提供的，其中，tracrRNA为在突变Cas效应子蛋白质的募集中所需要(在需要tracrRNA时，可以以与crRNA的嵌合RNA形式来提供)。将与突变Cas效应子蛋白质进行组合而构成核酸序列识别模块的、仅包括crRNA或者包括crRNA与tracrRNA的嵌合RNA的RNA分子总称为“指导RNA”。

本发明使用的Cas效应子蛋白质，只要与指导RNA形成复合体，可识别并结合靶基因中的靶核苷酸序列和与其相邻的protospacer adjacent motif(PAM)即可，没有特别限制、优选为Cas9或Cpf1。作为Cas9，可列举例如：源自化脓性链球菌(Streptococcuspyogenes)的Cas9(SpCas9；PAM序列NGG(N为A、G、T或C。以下相同))、源自嗜热链球菌(Streptococcus thermophilus)的Cas9(StCas9；PAM序列NNAGAAW)、源自脑膜炎奈瑟菌(Neisseria meningitidis)的Cas9(MmCas9；PAM序列NNNNGATT)等，但不限于这些。优选为基于PAM的限制较少的SpCas9(实质上为2个碱基，理论上可以靶向于基因组上的基本所有位置)。另外，作为Cpf1，可列举例如：源自土拉热弗朗西丝菌(Francisella novicida)的Cpf1(FnCpf1；PAM序列NTT)、源自氨基酸球菌属种(Acidaminococcus sp.)的Cpf1(AsCpf1；PAM序列NTTT)、源自毛螺菌科的细菌(Lachnospiraceae bacterium)的Cpf1(LbCpf1；PAM序列NTTT)等，但不限于这些。作为本发明中使用的突变Cas效应子蛋白质(有时简称为突变Cas)，能够使用Cas效应子蛋白质的双链DNA的两条链的切割能力失活的那些，和具有仅一条链的切割能力失活的切口酶活性的那些中的任意。例如，在为SpCas9的情况下，可以使用将第10位的Asp残基转换为Ala残基，欠缺与指导RNA形成互补链的链的相反链的切割能力(因此，具有针对与指导RNA形成互补链的链的切口酶活性)的D10A突变体，或者将第840位的His残基转换为Ala残基，欠缺与指导RNA形成互补链的链的切割能力(因此，具有针对与指导RNA形成互补链的链的相反链的切口酶活性)的H840A突变体，进一步及其双重突变体(dCas9)。另外，在为FnCpf1的情况下，可以使用将第917位的Asp残基转换为Ala残基(D917A)、或者将第1006位的Glu残基转换为Ala残基(E1006A)的，欠缺两条链的切割能力的突变体。只要欠缺对双链DNA的至少一条链的切割能力即可，也同样可以使用其它突变Cas。

对核酸碱基转变酶而言，通过与上述锌指等之间的连接方式相同的方法，以突变Cas的复合体的形式提供。或者，核酸碱基转变酶和突变Cas也可以利用RNA适体的MS2F6、PP7等、由它们的结合蛋白质构成的RNA支架进行结合。指导RNA中的靶向序列与靶核苷酸序列形成互补链，指导RNA中的其它区域(即，crRNA中的除了靶向序列以外的序列，或者与crRNA连续的tracrRNA)募集突变Cas而识别PAM，不切割一方或者两者的DNA，利用连接于突变Cas的核酸碱基转变酶的作用，使靶向位点(可以在靶核苷酸序列的全部或者一部分包含的几百个碱基的范围内适当调节)发生碱基转变，在双链DNA内发生错配。该错配未被正确修复，而修复使得相反链的碱基与转换后的链的碱基成对，或修复时进一步转换为其它核苷酸，发生1个～数十个碱基缺失或者插入由此导入了各种突变。

在将CRISPR-突变Cas用作核酸序列识别模块的情况下，也与将锌指等作为核酸序列识别模块的情况相同地，核酸序列识别模块和核酸碱基转变酶，以编码它们的核酸(优选为DNA)的形态，导入具有目标的双链DNA单子叶植物细胞。

对编码Cas效应子蛋白质(例如，Cas9、Cpf1)的DNA而言，可以根据与编码核酸碱基转变酶的DNA的上述的同样的方法，从产生该酶的细胞进行克隆。另外，突变Cas可以通过以下获得：在编码克隆的Cas的DNA中，使用本身公知的位点特异性的突变诱发法，以将对DNA切割活性重要的位点的氨基酸残基(例如：在为SpCas9的情况下，可列举第10位的Asp残基、第840位的His残基，在为FnCpf1的情况下，可列举第917位的Asp残基、第1006位的Glu残基等，但不限于这些)转换为其它氨基酸的方式导入突变。

或者，对编码突变Cas的DNA而言，也可以针对编码核酸序列识别模块的DNA、编码核酸碱基转变酶的DNA，通过与上述相同的方法和化学合成或PCR法或者Gibson Assembly法的组合，构建具有适于使用的宿主单子叶植物细胞的表达的密码子使用的DNA形式。例如，作为具有适于在水稻中的表达的密码子使用的SpCas9DNA，可列举具有以SEQ ID NO:3表示的核苷酸序列的DNA。

对编码突变Cas的DNA和编码核酸碱基转变酶的DNA而言，可以连接使得以融合蛋白的形式表达，也可以设计成使得使用结合结构域、内含肽等分别进行表达，并通过蛋白质间相互作用、蛋白质连接而在宿主细胞内形成复合体。在以上任一种情况下，均对编码突变Cas的DNA和编码核酸碱基转变酶的DNA而言，优选在各自的两末端加上编码在单子叶植物细胞中可发挥作用的核定位信号(NLS)的序列(例如，源自SV40的NLS编码序列；SEQ ID NO:5)。在突变Cas和核酸碱基转变酶以融合蛋白的形式表达的情况下，可以在一个蛋白质的C末端和另一个蛋白质的N末端作为添加的NLS而共有1个NLS序列。在对于真核细胞适用CRISPR-Cas技术的情况下，为了改善Cas效应子蛋白质的核定位的效率而加上NLS为传统方法，由于基于本发明是以突变Cas与核酸碱基转变酶的复合体形式进行表达，因此分子量变大，在将尺寸大于本发明人等先前报告的酵母细胞的单子叶植物细胞用作宿主的情况下，存在该复合体的核定位的效率降低的可能性。因此，本发明人为了改善该复合体的核定位效率，构思在突变Cas效应子蛋白质和核酸碱基转变酶的各两末端加上NLS，由此即使是在单子叶植物细胞中，也成功地使用本发明的基因组编辑技术而得到较高的导入突变效率。

得到的编码突变Cas和/或核酸碱基转变酶的DNA可以插入于与上述相同的表达载体的启动子的下游，例如：CaMV35S启动子、CaMV19S启动子、NOS启动子、Pcubi4-2启动子、2x35S启动子等。在表达载体中，如上所述，可以根据需要含有：终止子(例如，NOS终止子、豌豆rbcS3A终止子、热休克蛋白质(HSP)17.3终止子等)，翻译增强子(例如，源自水稻的醇脱氢酶5'非翻译区(Os ADH-5'UTR)、CaMV、源自烟草花叶病毒(TMV)的Ω序列等)，3'调节区(例如，源自水稻的肌动蛋白基因(Act1)3'UTR等)，polyA加成信号，药物抗性基因(例如，G418抗性基因(nPtII)、潮霉素抗性基因(hpt)等)的选择标记等。在优选的实施方式中，为了提高在单子叶植物细胞中的翻译效率，可以将Os ADH-5'UTR插入启动子和编码突变Cas和/或核酸碱基转变酶的DNA之间。

另一方面，编码指导RNA的DNA可以通过设计(1)或(2)而使用DNA/RNA合成仪进行化学合成：(1)包含与靶核苷酸序列的“目标链(targeted strand)”互补的核苷酸序列(也称为“靶向序列(targeting sequence)”)的crRNA序列(例如，在作为Cas效应子蛋白质募集FnCpf1时，可使用在靶向序列的5'侧包括AAUUUCUACUGUUGUAGAU(SEQ ID NO:7；下划线部的序列之间形成碱基对而形成茎-环结构)的crRNA)的编码序列；(2)将crRNA编码序列根据需要与已知的tracrRNA编码序列(例如，作为作为Cas效应子蛋白质募集Cas9时的tracrRNA编码序列，为gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtggtgctttt；SEQ ID NO:8)连接而成的寡DNA序列。

在此“目标链”是指与靶核苷酸序列的crRNA杂交的链，将其的相反链而通过目标链与crRNA的杂交而成为一条链状的链称为“非目标链(non-targeted strand)”。另外，由于推定核酸碱基转换反应通常大多情况在已成为一条链状的非目标链上发生，所以在将靶核苷酸序列以一条链的形式表现时(例如在标记PAM序列时，表示靶核苷酸序列与PAM的位置关系时等)，用非目标链的序列进行代表。

对靶向序列的长度而言，只要是可相对于靶核苷酸序列特异性结合即可，没有特别限制，例如为15～30个核苷酸、优选为18～25个核苷酸。靶核苷酸序列的选择受到该序列的3'侧(在Cas9的情况下)或者5'侧(在Cpf1的情况下)相邻的PAM的存在所限制，根据酵母等中的见解，在将CRISPR-突变Cas9与胞苷脱氨酶进行组合的本发明的系统中，不论靶核苷酸序列的长度如何，也存在容易对位于其从5'端向3'方向7个核苷酸以内的位置的C进行取代的规律性，所以可以通过适当选择靶核苷酸序列(作为其互补链的靶向序列)的长度，而使可导入突变碱基的位点移位。由此，可以至少部分解除基于PAM(在SpCas9中为NGG)的限制，进一步提高导入突变的自由度。

靶向序列的设计可以例如通过以下进行：在作为Cas效应子蛋白质使用Cas9的情况下，使用公开的指导RNA设计网站(CRISPR Design Tool，CRISPRdirect等)，从靶基因的CDS序列中列表出与PAM(例如：在为SpCas9的情况下，为NGG)在3'侧相邻的20mer序列，在将其从5'端向3'方向7个核苷酸以内的C转换为T的情况下，选择使得靶基因所编码的蛋白质发生氨基酸变化的序列。进一步，在使靶向序列的长度在例如18～25个核苷酸的范围中变化的情况下，同理选择存在从其5'端向3'方向7个核苷酸以内的通过变为T的碱基转变而发生氨基酸变化的C的序列。可以从这些候选中，将目标的单子叶植物基因组中脱靶位点数量较少的候选序列用作靶向序列。在使用的指导RNA设计软件中没有检索单子叶植物基因组的脱靶位点的功能的情况下，例如可以通过针对候选序列的3'侧的8～12个核苷酸(靶核苷酸序列的识别能力高的seed序列)，对作为宿主的单子叶植物基因组进行Blast检索来检索脱靶位点。

编码指导RNA的DNA也可以插入至与上述相同的表达载体，作为启动子，优选使用pol III类的启动子(例如，SNR6、SNR52、SCR1、RPR1、U3、U6、H1启动子等)及终止子(例如，polyT序列(T₆序列等))。例如，在宿主细胞为水稻细胞的情况下，可使用源自水稻的U6或U3启动子，更优选为U6启动子。在使用pol III类启动子的情况下，应该使得不将具有连续4个以上的T的核苷酸序列选择为靶向序列。

对编码指导RNA(crRNA或crRNA-tracrRNA嵌合)的DNA而言，可以设计与靶核苷酸序列的目标链互补的序列与已知的tracrRNA序列(募集Cas9时)或crRNA的直接重复序列(募集Cpf1时)连接而成的寡RNA序列，并使用DNA/RNA合成仪进行化学合成。

编码突变Cas和/或核酸碱基转变酶的DNA、编码指导RNA(crRNA或crRNA-tracrRNA嵌合)的DNA可以根据宿主单子叶植物细胞，而利用与上述同样的方法导入细胞。稳定表达突变Cas及核酸碱基转变酶的转化体的选择、对所选择的转化体的保持培养(maintenanceculture)，也可以与上述同样操作而进行。

在常规型的人工核酸酶中，由于伴随DNA双链切割(DSB)，因此，对基因组内的序列进行靶向时，发生认为由染色体的无序切割(脱靶切割)而导致的增殖阻碍和细胞死亡。在本发明中，由于通过不切割DNA的对DNA碱基上的取代基的转换反应(特别是脱氨基反应)进行突变导入，因此，可以实现毒性的大幅降低。

需要说明的是，在本发明的双链DNA的修饰中，除了靶向位点(可以在包含靶核苷酸序列的全部或者一部分的几百个碱基的范围内适当调节)以外，不会妨碍该双链DNA的切割的发生。然而，考虑到本发明的最大的一个优点是避免了由脱靶切割导致的毒性，则在优选的一种实施形态中，本发明的双链DNA的修饰，不仅在选择的双链DNA的靶向位点中，在其以外的位点中也不伴随DNA链的切割。

如下文的实施例所示，在作为突变Cas使用了具有仅可切割双链DNA中的一个链的切口酶(nickase)活性的Cas9的情况下，与在使用不能切割两条链的突变Cas9的情况下的导入突变方式的倾向明显不同。如果作为突变Cas，使用了欠缺对与指导RNA形成互补链的链的相反链(非目标链)的切割能力(因此，具有对目标链的切口酶活性)的D10A突变体，则比起碱基取代，导入1至20个核苷酸左右的缺失突变的倾向更强。缺失大多情况下在以碱基取代位点(靶核苷酸序列的从5'末端向3'方向的7个核苷酸以内)为中心的区域发生，而不是在基于Cas的切割位点(PAM的上游2-3个核苷酸)，另外，也存在与该缺失同时，伴随插入1或多个核苷酸的情况。虽然不愿以任何理论来进行限制，但在除去修复受到非目标链上的碱基取代的核苷酸时，在单子叶植物中，可考虑将周边的碱基也一总除去，并且以相反链(目标链)作为模板进行延长反应。此时，推测如果在目标链产生了缺口，则除去修复机制在目标链也发挥作用，变成在两条链中发生核苷酸的脱落的状态，无法进行正常的延长反应而勉强发生连接，由此结果是导致容易发生缺失突变。

另一方面，在使用不能切割两条链的突变Cas9时，导入突变方式与芽殖酵母、大肠杆菌等的情况相同，以碱基取代为主。其中，导入突变位点的范围比芽殖酵母的情况下更广泛一些，达到靶核苷酸序列的5'末端的更上游(例如：PAM序列的上游21个核苷酸)为止。虽然不愿以任何理论来进行限制，但基于上述假说，可认为由于在目标链中不产生缺口，因此以目标链为模板的延长反应正常进展，结果导致碱基取代成为主要的突变。同样地，在使用欠缺目标链的切割能力(因此，具有对非目标链的切口酶活性)的H840A突变体的情况下，推定由于以作为相反链的目标链作为模板的延长反应也正常进展，因此作为导入突变方式，以碱基取代为主。

因此，通过适当选择突变Cas的DNA链切割能力，能够向双链DNA的特定的核苷酸或核苷酸区域中对针点导入碱基取代，或者导入以碱基取代位点为中心的约20个核苷酸以内的缺失突变，也可以根据目标不同而分开使用。

本发明人另外使用芽殖酵母确认了：与以单独的核苷酸序列为靶相比，通过产生针对相邻的多个靶核苷酸序列的序列的识别模块并同时使用，导入突变效率大幅升高，在单子叶植物细胞中也可以期待同样的效果。对其效果而言，由使得两个靶核苷酸序列的一部分发生重复的情况可知，即使在两者分开600bp左右的情况下，也同样实现了突变诱导。另外，在靶核苷酸序列存在于相同方向(目标链为相同链)、以及对向(以双链DNA的两条链为目标链)的两种情况下，均可发生。

另外，也能够以完全不同位置的多个DNA区域为靶进行修饰。因此，在本发明优选的一种实施方式中，可以使用与不同的靶核苷酸序列(可以在1个靶基因内，也可以在不同的2个以上的靶基因内。)分别特异性结合的、两种以上的核酸序列识别模块。在该情况下，核酸碱基转变酶与每个这些核酸序列识别模块的1个形成核酸修饰酶复合体。在此核酸碱基转变酶为共通的东西可以使用。例如，在作为核酸序列识别模块使用CRISPR-Cas系统的情况下，可以使用与Cas效应子蛋白质和核酸碱基转变酶的复合体(融合蛋白包含)共通的那些，作为指导RNA(crRNA或crRNA-tracrRNA嵌合)可以产生并使用两种以上的嵌合RNA，所述嵌合RNA为由与不同靶核苷酸序列分别形成互补链的2种以上的crRNA，或者2种以上的crRNA每一种分别与tracrRNA形成的嵌合RNA。另一方面，在使用锌指基序、TAL效应子等作为核酸序列识别模块的情况下，例如可以将与不同的靶核苷酸特异性结合的各核酸序列识别模块，与核酸碱基转变酶进行融合。

为了使本发明的核酸修饰酶复合体在宿主细胞内表达，因此如上所述将包含编码该核酸修饰酶复合体的DNA的表达载体导入单子叶植物细胞，但为了有效地导入突变，因此优选能保持规定时期以上、规定水平以上的核酸修饰酶复合体的表达。从该观点出发，对该表达载体而言，虽然确实被组装入宿主基因组，但由于核酸修饰酶复合体的持续表达使脱靶切割的风险增大，所以优选在顺利完成导入突变后将其迅速除去。作为用于去除组装在宿主基因组中的DNA的方法，可列举使用Cre-loxP类的方法、使用转座子的方法等。

或者，通过仅在用于在期望的时期发生核酸碱基转换反应、固定靶向位点的修饰所需要的时期一过性地使本发明的核酸修饰酶复合体在宿主细胞内表达，由此避免脱靶切割的风险并且可以有效地实现宿主基因组的编辑。对用于发生核酸碱基转换反应、固定靶向位点的修饰所需要的时期而言，根据宿主细胞的种类、培养条件等而不同，但由于至少需要经过数代的细胞分裂，因此可认为需要2-3天左右。本领域技术人员可以基于使用培养条件等而适当确定优选的表达诱导期。对编码本发明的核酸修饰酶复合体的核酸的表达诱导期而言，在对宿主细胞不产生副作用，且可保持宿主细胞的再分化能力的范围，可以超出上述“固定靶位点的修饰所需要的时期”并延长。

作为将本发明的核酸修饰酶复合体在期望的时期进行一过性地表达的方法，可列举产生以能够控制表达期的形态，包含编码该核酸修饰酶复合体的核酸(在CRISPR-Cas系统中，编码指导RNA-的DNA、和编码突变Cas及核酸碱基置换酶的DNA)的构建体(表达载体)，并导入单子叶植物細胞的方法。作为“能够控制表达期的形态”，具体而言，可列举将编码本发明的核酸修饰酶复合体的DNA置于诱导性的调节区的操纵下的形态。对“诱导性的调节区”没有特别限制，可列举例如：上述诱导启动子(例如，PR1α基因启动子、rd29A基因启动子、GST-27基因启动子等)。

以下，根据实施例对本发明进行说明。但是，本发明并不限于这些实施例。

实施例

1.载体构建

(1)Target-AID评价用载体的构建

利用常规方法产生了具有图1A所示的结构的pRIT3-EGFP(具有EGFP ORF；SEQ IDNO:9)和pRIT3-mEGFP(在EGFP开始密码子后直接存在终始密码子；SEQ ID NO:10)。

(2)Target-AID载体的构建

通过以下产生了具有图1B所示的结构的Target-AID载体2408(编码dCas9的；SEQID NO:11)和2409(编码D10A突变体的；SEQ ID NO:12)：将pZH_OsU6gRNA_MMCas9(PlantMol Biol(2015)88:561-572)的OS Opt.Cas9取代为编码(具有H840A及D10A的双重突变、或仅D10A突变的)突变Cas9的DNA，在其下游在两末端加上了编码源自SV40的核定位信号(NLS)的序列，并使其与编码针对拟南芥的密码子使用而最优化的PmCDA1的DNA融合。

2.向农杆菌细菌导入Target-AID及评价用载体

将作为Target-AID载体的2408和2409(图1B)、作为评价用载体的pRIT3-EGFP和pRIT3-mEGFP(图1A)，通过电穿孔(Bio Rad公司MicroPulser电穿孔系统)导入农杆菌细菌(根癌土壤杆菌(Agrobacterium tumefaciens)EHA101株)。

首先，以下述的顺序进行了农杆菌细菌的感受态细胞的产生。

将农杆菌菌株涂布于YEB琼脂培养基(牛肉提取物5g/L、酵母提取物1g/L、Bacto蛋白胨1g/L、蔗糖5g/L、MgSO₄2mM、Bacto琼脂12g(1.2％))，于28℃、暗处培养2天时间。将得到的单一菌落接菌至YEB液体培养基5mL后，于28℃、暗处振荡培养12小时，将悬浊液200μL加入200mL的YEB液体培养基，于28℃、暗处进行振荡培养，增殖至OD600＝0.2-0.4。然后将菌体进行离心(3000rpm，4℃、10分钟)收集细菌，悬浊于20mL的10mM HEPES(pH 8.0)，重复离心2-3次。将通过离心回收的菌体悬浊于灭菌的10％丙三醇水溶液2mL，制成了感受态细胞。下面，以后述的顺序将各载体导入农杆菌。将各载体以1μg/μL的浓度溶解于灭菌水，与上述的农杆菌细菌悬浊液50μL混合，移至微脉冲比色皿(0.1cm间隙，BioRad公司)进行了电穿孔(2.2kV，5.8ms)。然后，向该液体添加800μL的YEB液体培养基，于28℃、暗处2小时振荡培养，涂布于包含100mg/L大观霉素的YEB琼脂培养基，于28℃、暗处培养36～48小时。将得到的细菌菌落在包含100mg/L大观霉素的YEB液体培养基5mL中增殖，以丙三醇(最终浓度35％)储存液形式移液至微管，于-80℃保存。

3.将Target-AID评价用载体导入水稻培养细胞

水稻的转化基本依照Terada等的方法(Terada,R.,Urawa,H.,Inagaki,Y.,Tsugane,K.,and Iida,S.(2002)Efficient gene targeting by homologousrecombination in rice.Nat.Biotechnol.20,1030-1034)进行。

3-1.准备转化用的水稻愈伤组织

摘除约100粒水稻(Oryza sativa.L Japonica品种；日本晴)的种子的稻壳，在70％乙醇中振荡1分钟后，在2.5％次氯酸钠中浸渍20-30分钟进行灭菌。之后，用灭菌用水涮洗，接芽于2N6培养基(N6培养基用混合盐(Sigma-Aldrich公司)4.0g/L、酪蛋白氨基酸300mg/L、肌肉肌醇100mg/L、烟酸0.5mg/L、吡哆醇盐酸盐0.5mg/L、盐酸硫胺0.5mg/L、L-脯氨酸2878mg/L、蔗糖30.0g/L、2,4-D(2,4-二氯苯氧乙酸)2mg/L、Gelrite 4.0g/L、pH 5.8)上，于暗处、31.5℃培养3周，诱导成源自胚盘细胞的去分化细胞团块(愈伤组织)。之后，每1个月选择细胞分裂活性高的愈伤组织进行传代培养，将从培养开始经历4个月的愈伤组织用于转化。

3-2.准备转化用的农杆菌细菌

在冰上溶解导入了Target-AID评价用载体的各农杆菌菌液，将其中300μL涂布于添加了100mg/L大观霉素的AB培养基(NH₄Cl 1g/L、MgSO₄·7H₂O 3g/L、KCl 0.15g/L、CaCl₂·2H₂O 0.012g/L、FeSO₄·7H₂O 0.0025g/L、K₂HPO₄3g/L、NaH₂PO₄·H₂O 1.15g/L、蔗糖5.5g/L、琼脂糖6.0g/L、pH 7.2)，于28℃、暗处培养3天时间。之后，将增殖的农杆菌细菌悬浊于添加了40mg/L的乙酰丁香酮(3',5'-二甲氧基-4'-羟基-苯乙酮)的AAI液体培养基(MgSO₄·7H₂O 5g/L、CaCl₂·2H₂O 1.5g/L、NaH₂PO4·H₂O 1.5g/L、KCl 29.5g/L、MnSO₄·4H₂O10g/L、ZnSO₄·7H₂O 2g/L、H₃BO₃3g/L、KI 0.75g/L、Na₂MoO₄·2H₂O 0.25g/L、CoCl₂·6H₂O25mg/L、CuSO₄·5H₂O 25mg/L、FeSO₄·7H₂O 13.9g/L、Na₂EDTA 18.7g/L、肌肉肌醇100mg/L、盐酸硫胺0.01g/L、烟酸1mg/L、吡哆醇盐酸盐1mg/L)于25℃振荡培养2小时。将该悬浊液用包含40mg/ml的乙酰丁香酮的AAI液体培养基进行稀释，制备了为OD600＝0.008的悬浊液120ml。

3-3.pRIT3-EGFP、pRIT3-mEGFP导入水稻愈伤组织(农杆菌细菌接种、共存培养、灭菌、水稻重组体愈伤组织选择)

将水稻愈伤组织约5g收集于灭菌的玻璃烧杯，加入导入了各载体的农杆菌细菌悬浊液(上述)，振荡3-5分钟同时进行接种。将悬浊液用不锈钢网(接缝开口1.5mm)过滤，除去多余的农杆菌细菌。然后，在2N6共存培养基(N6培养基用混合盐(Sigma公司制)4.0g/L、酪蛋白氨基酸300mg/L、肌肉肌醇100mg/L、烟酸0.5mg/L、吡哆醇盐酸盐0.5mg/L、盐酸硫胺0.5mg/L、蔗糖30.0g/L、葡萄糖10g/L、2,4-D 2mg/L、Gelrite 4.0g/L、乙酰丁香酮40mg/L，pH 5.2)上铺上灭菌滤纸，在其上用镊子以等间隔排列愈伤组织，于25℃、暗处共存培养3天时间。之后，为了将共存培养后的愈伤组织进行农杆菌细菌灭菌，将愈伤组织收集于500ml的烧杯，使用灭菌液1(包含万古霉素200mg/L、Tween2020μl/L的灭菌水)300ml，在搅拌的同时洗涤30分钟。之后，将愈伤组织收集于不锈钢网，用纸巾除去愈伤组织周边的水分后，使用灭菌液2(包含万古霉素200mg/L、Tween2020μl/L的灭菌水)300ml，重复四次同样的灭菌操作。然后，将灭菌后的愈伤组织用2N6NU培养基(N6培养基用混合盐[Sigma公司制]4.0g/L、酪蛋白氨基酸300mg/L、肌肉肌醇100mg/L、烟酸0.5mg/L、吡哆醇盐酸盐0.5mg/L、盐酸硫胺0.5mg/L、L-脯氨酸2878mg/L、蔗糖30.0g/L、2,4-D 2mg/L、Gelrite 4.0g/L、万古霉素100mg/L、美洛培南25mg/L,pH 5.8)调养培养5天时间。之后，用包含巴龙霉素(Paromomycin)50mg/L的选择培养基2N6SEPa50(N6培养基用混合盐[Sigma公司制]4.0g/L、酪蛋白氨基酸300mg/L、肌肉肌醇100mg/L、烟酸0.5mg/L、吡哆醇盐酸盐0.5mg/L、盐酸硫胺0.5mg/L、L-脯氨酸2878mg/L、蔗糖30.0g/L、2,4-D 2mg/L、琼脂糖8.0g/L、万古霉素100mg/L、美洛培南25mg/L、pH 5.8)上以等间隔排列，于31.5℃的暗处进行培养约6周。其结果选择出了多个谱系(lineages)的巴龙霉素抗性愈伤组织。

3-4.对导入了pRIT3-EGFP、pRIT3-mEGFP的水稻愈伤组织的分析

从导入pRIT3-EGFP并显示巴龙霉素抗性的愈伤组织中任意选择96个谱系，用于以后的分析。从各谱系的愈伤组织的一部分利用自动核酸提取装置(Kurabo株式会社PX-80)提取基因组DNA，进行了使用引物组”SbfI-p35S-F”(SEQ ID NO:13)和“EGFP-NotI-R”(SEQID NO:14)(表1)的PCR分析，结果检测到源自pRIT3-EGFP的1238bp的DNA片段，确认了基因重组体。然后，对其进行使用实体荧光显微镜的观察，结果全部检测到EGFP信号(图2)。对导入了pRIT3-mEGFP的愈伤组织也进行了同样的分析，通过PCR分析确认了基因重组体。对它们进行了实体荧光显微镜下的观察，结果完全未检测到EGFP信号(图2)。

[表1]

3-5.将pRIT3-mEGFP和2408、或pRIT3-mEGFP和2409同时导入水稻愈伤组织(农杆菌细菌接种、共存培养、灭菌、水稻重组体愈伤组织选择)

基本操作根据3-3。将具有pRIT3-mEGFP的农杆菌的菌液和具有2408或2409的农杆菌的菌液等量混合，接种了水稻愈伤组织约30g。以后至调养培养为止的操作，参照上述。在选择培养中，使用了包含潮霉素(Hygromycin)40mg/L、巴龙霉素(Paromomycin)50mg/L的2N6SEH40Pa50培养基。在约6周的选择培养之后，可以确认对潮霉素和巴龙霉素显示抗性的愈伤组织有多个谱系，在导入pRIT3-mEGFP和2408的情况下得到了14个谱系，在导入pRIT3-mEGFP和2409的情况下得到了56个谱系。

3-6.对导入了pRIT3-mEGFP和2408、或pRIT3-mEGFP和2409的水稻愈伤组织的分析

从选择的各谱系的愈伤组织提取基因组DNA，进行了使用引物组“SbfI-p35S-F”和“EGFP-NotI-R”、及”Hmr-F”(SEQ ID NO:15)和“Hmr2408R-1”(SEQ ID NO:16)(表1)的PCR分析，结果内置了pRIT3-mEGFP的双重转化体有269个谱系，内置了pRIT3-mEGFP和2409的双重转化体有264个谱系(表2、图3)。

[表2]

然后，对全部双重转化体愈伤组织使用实体荧光显微镜进行观察，结果通过内置了pRIT3-mEGFP和2409的2个谱系(No.6、3)确认了EGFP的表达(图4、5)。为了确认这些愈伤组织中的基于Target-AID的基因组序列修饰，在各谱系中从表达EGFP的愈伤组织提取基因组DNA，使用引物组“SbfI-p35S-F”和“EGFP-NotI-R”(表1)的PCR产物通过MonoFas DNA纯化试剂盒I(GL Sciences公司)进行纯化，克隆至pCR4Blunt TOPO载体(ThermoFisher公司)SbfI-NotI位点之间。对总和111个克隆利用DNA测序来解读碱基序列，结果在一部分中确认了基于Target-AID的碱基序列修饰(表3、图6A、B)。在切口酶型的2409中，发生较短的缺失突变(1-20个核苷酸)的频率较高，但也发生了单纯的碱基取代(图7)。

[表3]

另一方面，在使用欠缺两条链的切割能力的Cas9(2408)的情况下，作为导入突变方式以碱基取代为主(图8、9、10)，对发生碱基取代的区域而言，比芽殖酵母的情况下更宽，确认到至靶核苷酸序列外(PAM序列的上游21个核苷酸)为止(图10)。另外，在GFP信号阴性细胞中，未在靶核苷酸序列及其附近导入突变(图11)。

4.对水稻的内源性基因ALS(乙酰乳酸合成酶(Acetolactate synthase))的修饰

迄今为止，基于Target-AID的外源性报告基因的修饰已经成功，因此下面实施了对水稻内源性基因的修饰。作为对象选择了ALS(乙酰乳酸合成酶)基因，尝试了通过基因序列内的靶向碱基取代，创建使第96位的氨基酸从丙氨酸(A)变化为缬氨酸(V)的突变型ALS基因(ALS A96V)。根据其他种类植物的已有报告，预测表达ALS A96V的水稻的植物体及愈伤组织将获得对除草剂(甲氧咪草烟(Imazamox))的抗性，但没有先例。另外，也没有试验过甲氧咪草烟对在无菌培养条件下的水稻植物体及愈伤组织的的效果的例子。因此，本实施例中首先作为初步研究，在确认了甲氧咪草烟对无菌培养条件下的水稻的种子及愈伤组织的有效浓度检验(下述4-1、4-2)、基于ALS A96V的对甲氧咪草烟的抗性获得(下述4-3)的基础上，实施了基于Target-AID的ALS A96V修饰(下述4-4)。

4-1.无细菌培养条件中的甲氧咪草烟对水稻植物体的有效浓度的验证

以1/2MS固态培养基(MS mix(Sigma)、蔗糖15.0g/L、Gelrite(和光纯药)4.0g/L、pH 5.8)为基础，产生了甲氧咪草烟浓度不同的9个梯度(0mg/L、0.5mg/L、1mg/L、2mg/L、4mg/L、5mg/L、10mg/L、20mg/L、30mg/L)的培养基。接下来，摘除水稻(Oryza sativa.LJaponica品种；日本晴)的种子的稻壳，在70％乙醇中振荡1分钟后，在2.5％次氯酸钠中渗透同时浸渍20-30分钟进行灭菌。在每个处理区接芽24粒已灭菌的种子，于25℃、明11小时(8000lux)/暗13小时条件下培养7天时间，观察发芽情况。其结果，在不含有甲氧咪草烟的1/2MS培养基中，24粒种子中有23粒发芽，显示出顺利生长，与此相对，在添加了甲氧咪草烟0.5mg/L或其以上的浓度的培养基中，在全部种子中确认到胚基部变褐，子叶鞘变白，保持在伸长了5mm左右为止(表4)。

从以上判断，在水稻植物体的无菌培养条件下的甲氧咪草烟的有效浓度为0.5mg/L。

[表4]甲氧咪草烟对水稻植物体的有效浓度的评价

4-2.对无细菌培养条件下的甲氧咪草烟对水稻愈伤组织的有效浓度的验证

以2N6固态培养基(上述)为基础，产生了甲氧咪草烟浓度不同的4个梯度(0mg/L、30mg/L、50mg/L、70mg/L)的培养基。从水稻种子的胚盘部诱导愈伤组织(上述)，接芽于添加了甲氧咪草烟的2N6固态培养基，于31.5℃、整日暗处培养28天时间，确认了愈伤组织的增殖情况。其结果，在添加了甲氧咪草烟70mg/L的培养基中，愈伤组织发生一定程度的肥大化，阻碍了分裂增殖，与此相对，在50mg/L以下的浓度下确认了愈伤组织的分裂增殖(图12)。

从以上判断，甲氧咪草烟对水稻愈伤组织的有效浓度为70mg/L。

4-3.由突变型ALS基因(ALS A96V)对水稻愈伤组织赋予甲氧咪草烟抗性

为了评价由突变型ALS A96V对水稻愈伤组织赋予的甲氧咪草烟抗性，构建了pRIT4-ALS WT及pRIT4-ALS A96V的(图13)。pRIT4为水稻转化用双载体，作为植物用正标记基因具有潮霉素磷酸转移酶(Hygromycin phosphotransferase)(hpt)。pRIT4-ALS WT为以从野生型水稻(Oryza sativa.L Japonica品种；日本晴)提取的基因组DNA为基础，通过PCR克隆分离了ALS基因和其启动子和转录终止区，并组装入pRIT4。pRIT4-ALS A96V为通过利用PCR的位点特异性的导入突变法，产生人为地导入了A96V突变的ALS基因，并组装入pRIT4。将这2种载体导入(上述)农杆菌细菌EHA101谱系，转化(上述)为源自水稻种子胚盘的愈伤组织。之后，将愈伤组织在添加了潮霉素(Hygromycin)40mg/L的选择培养基(2N6SEH50；N6培养基用混合盐[Sigma公司制]4.0g/L、酪蛋白氨基酸1000mg/L、肌肉肌醇100mg/L、烟酸0.5mg/L、吡哆醇盐酸盐0.5mg/L、盐酸硫胺0.5mg/L、L-脯氨酸2878mg/L、蔗糖30.0g/L、2,4-D 2mg/L、Gelrite 4.0g/L、万古霉素100mg/L、美洛培南(Meropenem)25mg/L、pH 5.8)上等间隔排列，于31.5℃、暗处培养约4周。结果得到了导入了pRIT4-ALS WT的愈伤组织169个谱系、导入了pRIT4-ALS A96V的愈伤组织263个谱系(表5)。在以后的步骤中，这些愈伤组织每个谱系个别进行培养。将在2N6SEH50培养基上增殖的各愈伤组织谱系传代于在2N6SEH40中添加了甲氧咪草烟70mg/L的选择培养基(2N6SEH40IMZ70)，于31.5℃、暗处培养约6周。其结果，在导入了pRIT4-ALS WT的愈伤组织中，对甲氧咪草烟70mg/L显示抗性的愈伤组织仅有6个谱系(3.6％)，与此相对，在导入了pRIT4-ALS A96V的情况下，有261个谱系(99.2％)显示抗性(表5)。

根据以上确认了由突变型ALS A96V赋予水稻愈伤组织的甲氧咪草烟抗性。

[表5]由突变型ALS A96V对水稻愈伤组织赋予甲氧咪草烟抗性

4-4.基于Target-AID的ALS A96V修饰

Target-AID载体1476(dCas-AID)及1477(nCas-AID)被设计为：经过对水稻基因组中的ALS基因的靶向碱基取代(C287T)而修饰为ALS A96V(图14)。将1476、1477导入(上述)农杆菌细菌EHA101谱系，用于源自水稻种子胚的愈伤组织约8g的转化(上述)。经过农杆菌细菌的接种、灭菌的愈伤组织，利用2N6NU培养基调养培养14天时间后，在添加了潮霉素(Hygromycin)40mg/L的选择培养基(2N6SEH40)上等间隔排列，于31.5℃、暗处培养约3周。然后以同样的培养基进行传代，在25℃的暗处培养约10周，得到了导入了1476的愈伤组织155个谱系、导入了1477的愈伤组织203个谱系。在以后的步骤中，每个谱系个别进行培养。将各谱系的愈伤组织分为二，传代于添加了潮霉素(Hygromycin)50mg/L的培养基(2N6SEH50)和添加了甲氧咪草烟70mg/L的培养基(2N6SEH50IMZ70)，与31.5℃的暗处选择培养约6周。在2N6SEH50上培养的结果为，所有谱系的愈伤组织发生增殖，与此相对，在2N6SEH50IMZ70上培养的情况下，在导入了1476的愈伤组织中有3个谱系、在导入了1477的愈伤组织中有6个谱系确认增殖。为了确认在这9个谱系的愈伤组织中的ALS基因序列，提取基因组DNA，通过使用引物组“ALS cloning-F”(SEQ ID NO:17)和“ALS cloning-R”(SEQ IDNO:18)的PCR扩增DNA片段，并加上了SbfI及NotI识别位点。得到的PCR产物利用MonoFasDNA纯化试剂盒I(GL Sciences公司)进行纯化，克隆至修饰pDONRZeo(Thermo FisherScientific公司)而成的克隆用载体的SbfI-NotI位点之间。使用引物“ALS F-1”(SEQ IDNO:19)利用DNA测序(ABI，3130XL)对得到的质粒克隆分析了碱基序列。使用了的引物序列示于表1。

其结果，在导入1477并显示甲氧咪草烟抗性的6个谱系中，在4个谱系中导入了ALS基因中的A96V突变。其中的3个谱系中，确认了发生A96V突变的靶向碱基的取代(C287T)(图15B)。其余1个谱系中，确认了C287T以及氨基酸序列不发生变化的C285T(图15C)。这些均为在载体1477的靶序列内的从C变为T的碱基取代。另外，对这些谱系确认了ALS基因及其启动子和转录终止区的基因组序列，但未确认到除了C285T及C287T以外的突变。因此，判断成功实现了基于Target-AID的水稻内在性ALS伝子的修饰和基于其的除草剂抗性的赋予。需要说明的是，对于成功地导入对ALS基因的A96V突变的4个谱系中的3个谱系，T0植物体成功地进行了再分化(图16)。对得到的T0植物体，对通过使用了“ALS cloning-F”和“ALScloning-R”的PCR所扩增的DNA片段使用“ALS F-1”进行直接测序，结果确认了在与全部源自T0植物体的愈伤组织中相同的突变(C287T或C285T/C287T)(图17)。

5.基于Target-AID的多个基因的同时修饰

Target-AID载体2455(dCas-AID)被产生用于同时修饰pRIT3-mEGFP上的mEGFP基因及水稻内源性的ALS基因，分别与2408/2409及1476/1477表达相同的gRNA。将导入了pRIT3-mEGFP的愈伤组织约17g通过上述的方法导入2455，得到了124个谱系的双重转化谱系(double transformant lineage)。对它们进行了利用实体荧光显微镜的观察，结果在3个谱系中确认了EGFP的表达。进一步，将这3个谱系的愈伤组织传代至2N6SEH40IMZ70培养基，于31.5℃的暗处中培养约6周，结果均显示了甲氧咪草烟的抗性，活跃地增殖。从3个谱系的愈伤组织提取基因组DNA，通过使用引物组“SbfI-p35S-F”和“EGFP-NotI-R”，或“ALSCloning-F”和“ALS Cloning-R”的PCR，扩增了mEGFP基因区域及ALS基因区域。得到的PCR产物利用MonoFas DNA纯化试剂盒I(GL Sciences公司)纯化，供直接测序用。结果在1个谱系中确认了在mEGFP基因和ALS基因两者中的基于Target-AID的靶向碱基取代(图18)。直接设定在mEGFP基因的开始密码子后的终止密码子(TAG)被修饰为与酪氨酸相对应的TAT，紧接其后的GTG被修饰为与甲硫氨酸相对应的ATG(图18A)。在ALS基因中确认了C287T(图18B)。

根据以上，验证了可以利用Target-AID同时修饰水稻基因组中的多个靶序列。

工业实用性

根据本发明，可以不伴随DNA双链的切割，安全地向任意单子叶植物导入位点特异性的突变。如上得到的基因修饰单子叶植物，在以水稻等主要谷物为首的单子叶植物的分子育种中极其有用。

本申请以在日本申请的日本特愿2015-232379(申请日：2015年11月27日)及日本特愿2016-134613(申请日：2016年7月6日)为基础，并将其内容全部并入本说明书。

SEQUENCE LISTING

<110> 国立大学法人神户大学(NATIONAL UNIVERSITY CORPORATION KOBE UNIVERSITY)

<120> 用于特异性转换靶向DNA序列的核酸碱基的单子叶植物的基因组序列的转换方法、及其使用的分子复合体

<130> 092545

<150> JP 2015-232379

<151> 2015-11-27

<150> JP 2016-134613

<151> 2016-07-06

<160> 19

<170> PatentIn 3.5版

<210> 1

<211> 627

<212> DNA

<213> 人工序列

<220>

<223> 针对拟南芥(Arabidopsis thaliana)优化的PmCDA密码子。

<220>

<221> CDS

<222> (1)..(627)

<400> 1

atg aca gat gct gaa tat gtc aga atc cac gaa aag ttg gac att tac 48

Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr

1 5 10 15

acg ttt aag aag cag ttc ttc aac aac aag aaa tct gtt tcg cat agg 96

Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His Arg

20 25 30

tgc tat gtg ctt ttc gaa cta aaa cgt cgt gga gaa aga cgg gct tgc 144

Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys

35 40 45

ttt tgg ggt tac gcg gtt aac aaa cca caa tca ggt act gaa cga gga 192

Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly

50 55 60

ata cac gct gaa atc ttt tct atc cga aag gtt gag gaa tat cta cgt 240

Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg

65 70 75 80

gac aat cct gga cag ttc act atc aat tgg tat tct agc tgg tca cca 288

Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro

85 90 95

tgt gca gat tgt gct gag aag att ctc gaa tgg tac aat caa gag ctt 336

Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu

100 105 110

aga ggc aat gga cat aca ttg aaa ata tgg gca tgc aag ctc tac tac 384

Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr

115 120 125

gaa aag aat gcc aga aac caa att ggg ctt tgg aac ttg agg gat aat 432

Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn

130 135 140

gga gtt ggg ctt aat gtc atg gtt tct gag cac tat caa tgt tgt cgg 480

Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg

145 150 155 160

aag atc ttc ata caa agt tcc cat aac cag ttg aat gag aac aga tgg 528

Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp

165 170 175

tta gag aaa acc ctt aaa aga gcc gag aag aga aga tcc gaa ctg agc 576

Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu Leu Ser

180 185 190

att atg ata cag gtc aaa att ctg cat acc act aag agt cca gct gta 624

Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val

195 200 205

ggt 627

Gly

<210> 2

<211> 209

<212> PRT

<213> 人工序列

<220>

<223> 合成结构

<400> 2

Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr

1 5 10 15

Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His Arg

20 25 30

Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys

35 40 45

Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly

50 55 60

Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg

65 70 75 80

Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro

85 90 95

Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu

100 105 110

Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr

115 120 125

Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn

130 135 140

Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg

145 150 155 160

Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp

165 170 175

Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu Leu Ser

180 185 190

Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val

195 200 205

Gly

<210> 3

<211> 4104

<212> DNA

<213> 人工序列

<220>

<223> 针对小鼠优化的Cas9密码子。

<220>

<221> CDS

<222> (1)..(4101)

<400> 3

atg gac aag aag tac tcg atc ggg ctg gmc atc gga aca aat tct gta 48

Met Asp Lys Lys Tyr Ser Ile Gly Leu Xaa Ile Gly Thr Asn Ser Val

1 5 10 15

ggc tgg gct gta ata acc gat gag tac aag gtg ccc tct aaa aaa ttt 96

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

aag gtc ctt ggc aat acg gat aga cat tcc ata aag aag aat ctt atc 144

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

ggt gcg ctg ctc ttt gac agc ggc gag acc gcg gag gcg acc cgg ttg 192

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

aaa cgc acc gcg aga cgc cgt tac aca agg cgt aag aat aga atc tgt 240

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

tat ctc cag gag ata ttc tct aat gaa atg gcg aag gta gac gat tcc 288

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

ttc ttt cac cgt ctg gag gaa agt ttt ctc gtt gag gaa gat aag aaa 336

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

cat gaa aga cac ccg atc ttc gga aac att gtc gac gag gtc gct tat 384

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

cat gaa aag tac cct acc atc tac cat ctt aga aag aaa ctt gtt gac 432

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

agc acg gat aag gct gat ctc agg ctg ata tac ctg gct ctg gca cat 480

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

atg att aag ttc aga ggg cat ttc ctt atc gaa ggc gac ctg aat cca 528

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

gat aat tca gat gta gac aag ctc ttc att caa ctt gtg cag act tat 576

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

aat cag ctc ttc gaa gaa aat cca ata aac gcg tcg ggt gta gac gca 624

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

aag gcc ata ctg tcc gct agg ctt tct aag tca cgt aga ctt gag aat 672

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

ctc att gcc caa ctc ccc ggc gag aag aag aac ggc ttg ttt gga aat 720

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

225 230 235 240

ctg ata gcg ctg tcc ctg ggt ctt aca cca aat ttc aag agt aat ttc 768

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

gat ttg gca gaa gat gct aag ttg cag ctc agt aaa gac acc tac gat 816

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

gac gat ctt gat aat ttg ttg gct cag att ggc gat cag tat gca gat 864

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

ctt ttc ttg gcc gct aag aat ttg tct gat gca att ctg ctt agc gac 912

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

att ttg agg gtt aat aca gaa atc acc aag gca ccc ttg tcg gcg tca 960

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

atg ata aag agg tat gat gag cac cac caa gac ctg acg ctc ctc aag 1008

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

gct ctt gtt cgg cag caa ttg ccg gag aag tac aaa gag atc ttc ttc 1056

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

gac cag tct aag aac gga tat gcg ggc tac ata gac ggt gga gcg agt 1104

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

cag gag gaa ttc tac aag ttc ata aag ccc att ctc gag aag atg gat 1152

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

ggt acg gaa gaa ctg ctt gtg aaa ctt aac aga gaa gat ctt ttg cgg 1200

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

aag cag aga act ttc gac aac gga agt ata cca cac cag ata cat ctc 1248

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

gga gag ctt cat gct att ctc aga aga caa gag gat ttc tac cct ttc 1296

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

ttg aag gat aac aga gaa aag ata gag aag atc ctc acg ttt agg atc 1344

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

cct tac tac gta ggt cct ctt gct cgc ggc aat agt agg ttc gcc tgg 1392

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

atg acc cgc aag tct gaa gaa act atc acc cct tgg aat ttc gaa gag 1440

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

gtt gta gac aaa ggt gct tca gca cag agt ttc att gag agg atg acc 1488

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

aac ttc gac aag aac ctc ccc aac gaa aag gtc ctg cct aag cac agc 1536

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

ctc ctc tac gaa tac ttt act gtc tat aat gag ctt aca aaa gtt aag 1584

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

tac gtg aca gag gga atg cgg aag ccc gca ttc ctt tcc gga gaa caa 1632

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

aag aag gcg atc gtg gat ctt ctc ttc aag acg aac cgc aag gtg acg 1680

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

gtt aaa cag ttg aag gaa gat tac ttc aag aag ata gaa tgt ttt gat 1728

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

agc gtg gaa atc agc ggc gtc gaa gat agg ttc aac gct tcc ctg gga 1776

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

acg tac cac gat ctc ctc aag att atc aaa gat aag gac ttt ctt gat 1824

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

aac gaa gag aat gag gac atc ttg gaa gac att gtt ctg acg ctc acc 1872

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

ctg ttc gaa gat cgc gag atg att gag gaa cgc ttg aag acc tac gca 1920

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

cac ctg ttc gat gac aag gtt atg aag caa ctt aaa cgg cgc cgg tat 1968

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

acg ggc tgg gga cgg ctt tcg cgg aag ctg ata aat gga atc cgt gac 2016

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

aag cag tct ggc aag aca ata ctc gac ttc ttg aag tcg gat ggt ttt 2064

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

gcc aat aga aat ttt atg caa ctc att cat gat gac tcg ctt act ttt 2112

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

aag gag gac atc cag aag gcc cag gta tca gga cag ggt gac tct ttg 2160

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

cac gaa cac atc gcg aac ctg gcg ggc tcc ccc gcg att aag aag gga 2208

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

att ttg cag act gtc aag gtg gtc gat gaa ctc gtg aag gtt atg gga 2256

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

cgt cat aag ccg gaa aat att gtg att gag atg gct cgc gag aat caa 2304

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

aca aca cag aag ggc caa aag aac agt aga gaa cgc atg aag cgc atc 2352

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

gaa gag ggc atc aaa gag ctg ggc agt cag atc ctt aaa gaa cat cca 2400

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

gtc gag aat aca cag ctt cag aac gaa aag ctg tac ctt tat tac ctt 2448

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

caa aat ggg cgt gat atg tat gtg gat cag gaa ctc gat atc aat agg 2496

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

ctg agt gac tat gat gtc gac smt atc gtc ccg caa agt ttc ctc aag 2544

Leu Ser Asp Tyr Asp Val Asp Xaa Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

gac gac agt ata gac aac aaa gtt ctc aca cgg tca gat aag aat cgc 2592

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

850 855 860

ggc aag agc gat aat gta ccg tcg gag gag gta gtc aag aag atg aag 2640

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

aat tac tgg cgc cag ttg ctc aac gcc aag ctc atc act cag agg aaa 2688

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

ttt gac aac ctt acg aaa gcc gag cgg ggc gga ctc tct gaa ctg gac 2736

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

aag gcc ggt ttc ata aag cgc cag ctc gtt gag aca cgt caa att act 2784

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

aag cac gtc gct caa ata ttg gat tcc cgc atg aat act aag tac gat 2832

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

gag aat gat aag ctc ata cgt gaa gtt aag gtc att act ctc aag tcc 2880

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

aag ctt gta tcg gac ttc cgt aag gac ttc caa ttc tac aag gtc cgg 2928

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

965 970 975

gaa atc aat aat tat cac cat gcc cat gac gct tat ctg aac gcg gtc 2976

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

980 985 990

gtg ggc acg gca ctc att aag aaa tac cca aaa ctt gag tca gaa ttt 3024

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe

995 1000 1005

gtt tac ggg gac tat aaa gtt tat gac gtg cgg aag atg ata gcg 3069

Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala

1010 1015 1020

aag tcg gaa caa gag ata gga aag gcg act gca aag tac ttt ttt 3114

Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe

1025 1030 1035

tac tcc aac ata atg aat ttc ttt aag acc gaa ata acc ctt gca 3159

Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala

1040 1045 1050

aac ggt gaa atc aga aag cgg cct ctg att gaa aca aat ggc gag 3204

Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu

1055 1060 1065

acg ggc gag atc gtc tgg gac aag ggg agg gac ttc gca acg gtt 3249

Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val

1070 1075 1080

cgc aag gtc ctt agc atg ccg caa gta aat ata gtt aag aag acg 3294

Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr

1085 1090 1095

gaa gtt cag acc ggc ggc ttt agt aaa gaa agc ata ctt cct aaa 3339

Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys

1100 1105 1110

agg aat tcc gac aaa ctg ata gcg cgc aag aag gac tgg gat cca 3384

Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro

1115 1120 1125

aag aag tat gga gga ttt gac tcc cca acc gtt gct tat agc gtg 3429

Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val

1130 1135 1140

ttg gta gta gcc aag gtg gaa aag ggt aag tct aag aaa ttg aag 3474

Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys

1145 1150 1155

tcg gtg aag gag ttg ttg ggg ata act ata atg gag cgg agt tcg 3519

Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser

1160 1165 1170

ttc gag aag aac cca att gac ttt ctc gaa gcc aaa ggc tac aag 3564

Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys

1175 1180 1185

gag gtc aag aag gac ctg att att aag ttg cca aag tac tcg ctc 3609

Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu

1190 1195 1200

ttc gaa ctc gag aac ggg aga aag cgt atg ctg gcg tcg gcg ggc 3654

Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly

1205 1210 1215

gag ctg cag aaa gga aac gag ctg gct ttg cca tcg aaa tac gta 3699

Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val

1220 1225 1230

aat ttc ctg tac ctc gcc tca cat tat gag aag ctt aaa ggg tct 3744

Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser

1235 1240 1245

cca gaa gac aat gaa cag aag cag ctg ttt gtt gaa cag cac aag 3789

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys

1250 1255 1260

cac tac ttg gac gag att ata gaa caa atc tcc gag ttc tct aaa 3834

His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys

1265 1270 1275

cgg gtt atc ctt gca gac gcc aat ttg gat aag gtc ctc tcg gct 3879

Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala

1280 1285 1290

tat aat aag cat aga gat aag cca atc cgg gag cag gct gaa aat 3924

Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn

1295 1300 1305

atc ata cac ctc ttt acg ttg act aat ttg ggt gcg cca gcg gca 3969

Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala

1310 1315 1320

ttc aag tac ttc gat aca aca atc gat cgt aag cgc tac aca agc 4014

Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser

1325 1330 1335

act aag gaa gtc ctg gac gcg acg ctg ata cac cag tcc att act 4059

Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr

1340 1345 1350

gga ctg tat gaa acc aga ata gat ctt agc cag ctc ggc ggt gat 4104

Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly

1355 1360 1365

<210> 4

<211> 1367

<212> PRT

<213> 人工序列

<220>

<221> misc_feature

<222> (10)..(10)

<223> 位于定位10的'Xaa'代表Asp或Ala。

<220>

<221> misc_feature

<222> (840)..(840)

<223> 位于定位840的 'Xaa'代表Asp、Ala、His或Pro。

<220>

<223> 合成结构

<400> 4

Met Asp Lys Lys Tyr Ser Ile Gly Leu Xaa Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

225 230 235 240

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

Leu Ser Asp Tyr Asp Val Asp Xaa Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

850 855 860

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

965 970 975

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

980 985 990

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe

995 1000 1005

Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala

1010 1015 1020

Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe

1025 1030 1035

Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala

1040 1045 1050

Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu

1055 1060 1065

Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val

1070 1075 1080

Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr

1085 1090 1095

Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys

1100 1105 1110

Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro

1115 1120 1125

Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val

1130 1135 1140

Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys

1145 1150 1155

Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser

1160 1165 1170

Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys

1175 1180 1185

Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu

1190 1195 1200

Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly

1205 1210 1215

Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val

1220 1225 1230

Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser

1235 1240 1245

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys

1250 1255 1260

His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys

1265 1270 1275

Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala

1280 1285 1290

Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn

1295 1300 1305

Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala

1310 1315 1320

Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser

1325 1330 1335

Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr

1340 1345 1350

Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly

1355 1360 1365

<210> 5

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> SV40衍生的核定位信号。

<220>

<221> CDS

<222> (1)..(21)

<400> 5

cct aag aag aar mgk aar gtw 21

Pro Lys Lys Lys Xaa Lys Xaa

1 5

<210> 6

<211> 7

<212> PRT

<213> 人工序列

<220>

<221> misc_feature

<222> (5)..(5)

<223> 位于定位5的 'Xaa' 代表Arg或Ser。

<220>

<221> misc_feature

<222> (7)..(7)

<223> 位于定位7的'Xaa' 代表Val。

<220>

<223> 合成结构

<400> 6

Pro Lys Lys Lys Xaa Lys Xaa

1 5

<210> 7

<211> 19

<212> RNA

<213> Francisella novicida

<220>

<221> misc_structure

<222> (1)..(19)

<223> crRNA直接重复序列。

<400> 7

aauuucuacu guuguagau 19

<210> 8

<211> 83

<212> DNA

<213> 化脓性链球菌(Streptococcus pyogenes)

<220>

<221> misc_structure

<222> (1)..(83)

<223> tracrRNA

<400> 8

gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60

ggcaccgagt cggtggtgct ttt 83

<210> 9

<211> 14551

<212> DNA

<213> 人工序列

<220>

<223> pRIT3-EGFP的完整核苷酸序列。

<400> 9

agatggttgt tcaagacgat ctacgaacgc agtggcagcg ccggagagtt caagaagttc 60

tgtttcaccg tgcgcaagct gatcgggtca aatgacctgc cggagtacga tttgaaggag 120

gaggcggggc aggctggccc gatcctagtc atgcgctacc gcaacctgat cgagggcgaa 180

gcatccgccg gttcctaatg tacggagcag atgctagggc aaattgccct agcaggggaa 240

aaaggtcgaa aaggtctctt tcctgtggat agcacgtaca ttgggaaccc aaagccgtac 300

attgggaacc ggaacccgta cattgggaac ccaaagccgt acattgggaa ccggtcacac 360

atgtaagtga ctgatataaa agagaaaaaa ggcgattttt ccgcctaaaa ctctttaaaa 420

cttattaaaa ctcttaaaac ccgcctggcc tgtgcataac tgtctggcca gcgcacagcc 480

gaagagctgc aaaaagcgcc tacccttcgg tcgctgcgct ccctacgccc cgccgcttcg 540

cgtcggccta tcgcggccgc tggccgctca aaaatggctg gcctacggcc aggcaatcta 600

ccagggcgcg gacaagccgc gccgtcgcca ctcgaccgcc ggcgcccaca tcaaggcacc 660

ctgcctcgcg cgtttcggtg atgacggtga aaacctctga cacatgcagc tcccggagac 720

ggtcacagct tgtctgtaag cggatgccgg gagcagacaa gcccgtcagg gcgcgtcagc 780

gggtgttggc gggtgtcggg gcgcagccat gacccagtca cgtagcgata gcggagtgta 840

tactggctta actatgcggc atcagagcag attgtactga gagtgcacca tatgcggtgt 900

gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggcgctcttc cgcttcctcg 960

ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag 1020

gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa 1080

ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc 1140

cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca 1200

ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg 1260

accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct 1320

catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt 1380

gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag 1440

tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc 1500

agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac 1560

actagaagga cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga 1620

gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc 1680

aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg 1740

gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca 1800

aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt 1860

atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca 1920

gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg 1980

atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca 2040

ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt 2100

cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt 2160

agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca 2220

cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca 2280

tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga 2340

agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact 2400

gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga 2460

gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caacacggga taataccgcg 2520

ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc 2580

tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga 2640

tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat 2700

gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt 2760

caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt 2820

atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac 2880

gtctaagaaa ccattattat catgacatta acctataaaa ataggcgtat cacgaggccc 2940

tttcgtcttc gaataaatac ctgtgacgga agatcacttc gcagaataaa taaatcctgg 3000

tgtccctgtt gataccggga agccctgggc caacttttgg cgaaaatgag acgttgatcg 3060

gcacgtaaga ggttccaact ttcaccataa tgaaataaga tcactaccgg gcgtattttt 3120

tgagttatcg agattttcag gagctaagga agctaaaatg gagaaaaaaa tcactggata 3180

taccaccgtt gatatatccc aatggcatcg taaagaacat tttgaggcat ttcagtcagt 3240

tgctcaatgt acctataacc agaccgttcc tggatattac ggccttttta aagaccgtaa 3300

agaaaaataa gcacaagttt tatccggcct ttattcacat tcttgcccgc ctgatgaatg 3360

ctcatccgga ataattcgaa gctcggtccc gtgggtgttc tgtcgtctcg ttgtacaacg 3420

aaatccattc ccattccgcg ctcaagatgg cttcccctcg gcagttcatc agggctaaat 3480

caatctagcc gacttgtccg gtgaaatggg ctgcactcca acagaaacaa tcaaacaaac 3540

atacacagcg acttattcac acgagctcaa attacaacgg tatatatcct gccagtcagc 3600

atcatcacac caaaagttag gcccgaatag tttgaaatta gaaagctcgc aattgaggtc 3660

tacaggccaa attcgctctt agccgtacaa tattactcac cggtgcgatg ccccccatcg 3720

taggtgaagg tggaaattaa tgatccatct tgagaccaca ggcccacaac agctaccagt 3780

ttcctcaagg gtccaccaaa aacgtaagcg cttacgtaca tggtcgataa gaaaaggcaa 3840

tttgtagatg ttaattccca tcttgaaaga aatatagttt aaatatttat tgataaaata 3900

acaagtcagg tattatagtc caagcaaaaa cataaattta ttgatgcaag tttaaattca 3960

gaaatatttc aataactgat tatatcagct ggtacattgc cgtagatgaa agactgagtg 4020

cgatattatg tgtaatacat aaattgatga tatagctagc ttagctcatc gggggatccg 4080

tcgacctgca gccaagctgg gatcccagct gggatcccag cttgtcgacg gtaccccctc 4140

tagagttcct tctagacccg atctagtaac atagatgaca ccgcgcgcga taatttatcc 4200

tagtttgcgc gctatatttt gttttctatc gcgtattaaa tgtataattg cgggactcta 4260

atcataaaaa cccatctcat aaataacgtc atgcattaca tgttaattat tacatgctta 4320

acgtaattca acagaaatta tatgataatc atcgcaagac cggcaacagg attcaatctt 4380

aagaaacttt attgccaaat gtttgaacga tcggggatca tccgggtctg tggcgggaac 4440

tccacgaaaa tatccgaacg cagcaagata tcgcggtgca tctcggtctt gcctgggcag 4500

tcgccgccga cgccgttgat gtggacgccg ggcccgatca tattgtcgct caggatcgtg 4560

gcgttgtgct tgtcggccgt tgctgtcgta atgatatcgg caccttcgac cgcctgttcc 4620

gcagagatcc cgtgggcgaa gaactccagc atgagatccc cgcgctggag gatcatccag 4680

ccggcgtccc ggaaaacgat tccgaagccc aacctttcat agaaggcggc ggtggaatcg 4740

aaatctcgtg atggcaggtt gggcgtcgct tggtcggtca tttcgaaccc cagagtcccg 4800

ctcagaagaa ctcgtcaaga aggcgataga aggcgatgcg ctgcgaatcg ggagcggcga 4860

taccgtaaag cacgaggaag cggtcagccc attcgccgcc aagctcttca gcaatatcac 4920

gggtagccaa cgctatgtcc tgatagcggt ccgccacacc cagccggcca cagtcgatga 4980

atccagaaaa gcggccattt tccaccatga tattcggcaa gcaggcatcg ccatgggtca 5040

cgacgagatc atcgccgtcg ggcatgcgcg ccttgagcct ggcgaacagt tcggctggcg 5100

cgagcccctg atgctcttcg tccagatcat cctgatcgac aagaccggct tccatccgag 5160

tacgtgctcg ctcgatgcga tgtttcgctt ggtggtcgaa tgggcaggta gccggatcaa 5220

gcgtatgcag ccgccgcatt gcatcagcca tgatggatac tttctcggca ggagcaaggt 5280

gagatgacag gagatcctgc cccggcactt cgcccaatag cagccagtcc cttcccgctt 5340

cagtgacaac gtcgagcaca gctgcgcaag gaacgcccgt cgtggccagc cacgatagcc 5400

gcgctgcctc gtcctgcagt tcattcaggg caccggacag gtcggtcttg acaaaaagaa 5460

ccgggcgccc ctgcgctgac agccggaaca cggcggcatc agagcagccg attgtctgtt 5520

gtgcccagtc atagccgaat agcctctcca cccaagcggc cggagaacct gcgtgcaatc 5580

catcttgttc aatcatatct cattgccccc cggtctacct acaaaaaagc tccgcacgag 5640

gctgcatttg tcacaaatca tgaaaagaaa aactaccgat gaacaatgct gagggattca 5700

aattctaccc acaaaaagaa gaaagaaaga tctagcacat ctaagcctga cgaagcagca 5760

gaaatatata aaaatataaa ccatagtgcc cttttcccct cttcctgatc ttgtttagca 5820

tggcggaaat tttaaacccc ccatcatctc ccccaacaac ggcggatcgc agatctacat 5880

ccgagagccc cattccccgc gagatccggg ccggatccac gccggcgaga gccccagccg 5940

cgagatcccg cccctcccgc gcaccgatct gggcgcgcac gaagccgcct ctcgcccacc 6000

caaactacca aggccaaaga tcgagaccga gacggaaaaa aaaaacggag aaagaaagag 6060

gagaggggcg gggtggttac cggcgcggcg gcggcggagg gggagggggg aggagctcgt 6120

cgtccggcag cgagggggga ggaggtggag gtggtggtgg tggtggtggt agggttgggg 6180

ggatgggagg agaggggggg gtatgtatat agtggcgatg gggggcgttt ctttggaagc 6240

ggagggaggg ccggcctcgt cgctggctcg cgatcctcct cgcgtttccg gcccccacga 6300

cccggaccca cctgctgttt tttctttttc ttttttttct ttcttttttt ttttttggct 6360

gcgagacgtg cggtgcgtgc ggacaactca cggtgatagt gggggggtgt ggagactatt 6420

gtccagttgg ctggactggg gtgggttggg ttgggttggg ttgggctggg cttgctatgg 6480

atcgtggata gcactttggg ctttaggaac tttaggggtt gtttttgtaa atgttttgag 6540

tctaagttta tcttttattt ttactagaaa aaatacccat gcgctgcaac gggggaaagc 6600

tattttaatc ttattattgt tcattgtgag aattcgcctg aatatatatt tttctcaaaa 6660

attatgtcaa attagcatat gggttttttt aaagatattt cttatacaaa tccctctgta 6720

tttacaaaag caaacgaact taaaacccga ctcaaataca gatatgcatt tccaaaagcg 6780

aataaactta aaaaccaatt catacaaaaa tgacgtatca aagtaccgac aaaaacatcc 6840

tcaattttta taatagtaga aaagagtaaa tttcactttg ggccaccttt tattaccgat 6900

attttacttt ataccacctt ttaactgatg ttttcacttt tgaccaggta atcttacctt 6960

tgttttattt tggactatcc cgactctctt ctcaagcata tgaatgaccg tatgctagtg 7020

cggccgcaag cttgactact agtctctctt aaggtagcat cacaagtttg tacaaaaaag 7080

caggctcctg caggtgagac ttttcaacaa agggtaatat cgggaaacct cctcggattc 7140

cattgcccag ctatctgtca cttcatcgaa aggacagtag aaaaggaagg tggctcctac 7200

aaatgccatc attgcgataa aggaaaggct atcgttcaag atgcctctac cgacagtggt 7260

cccaaagatg gacccccacc cacgaggaac atcgtggaaa aagaagacgt tccaaccacg 7320

tcttcaaagc aagtggattg atgtgatatc tccactgacg taagggatga cgcacaatcc 7380

cactatcctt cgcaagaccc ttcctctata taaggaagtt catttcattt ggagaggaca 7440

ggcttcttga gatccttcaa caattaccaa caacaacaaa caacaaacaa cattacaatt 7500

actatttaca attacagtcg actctagagg atccatggtg agcaagggcg aggagctgtt 7560

caccggggtg gtgcccatcc tggtcgagct ggacggcgac gtaaacggcc acaagttcag 7620

cgtgtccggc gagggcgagg gcgatgccac ctacggcaag ctgaccctga agttcatctg 7680

caccaccggc aagctgcccg tgccctggcc caccctcgtg accaccttca cctacggcgt 7740

gcagtgcttc agccgctacc ccgaccacat gaagcagcac gacttcttca agtccgccat 7800

gcccgaaggc tacgtccagg agcgcaccat cttcttcaag gacgacggca actacaagac 7860

ccgcgccgag gtgaagttcg agggcgacac cctggtgaac cgcatcgagc tgaagggcat 7920

cgacttcaag gaggacggca acatcctggg gcacaagctg gagtacaact acaacagcca 7980

caacgtctat atcatggccg acaagcagaa gaacggcatc aaggtgaact tcaagatccg 8040

ccacaacatc gaggacggca gcgtgcagct cgccgaccac taccagcaga acacccccat 8100

cggcgacggc cccgtgctgc tgcccgacaa ccactacctg agcacccagt ccgccctgag 8160

caaagacccc aacgagaagc gcgatcacat ggtcctgctg gagttcgtga ccgccgccgg 8220

gatcactcac ggcatggacg agctgtacaa gtaaagcggc cgcccggctg cattcgagta 8280

ttatggcatt gggaaaactg tttttcttgt accatttgtt gtgcttgtaa tttactgtgt 8340

tttttattcg gttttcgcta tcgaactgtg aaatggaaat ggatggagaa gagttaatga 8400

atgatatggt ccttttgttc attctcaaat taatattatt tgttttttct cttatttgtt 8460

gtgtgttgaa tttgaaatta taagagatat gcaaacattt tgttttgagt aaaaatgtgt 8520

caaatcgtgg cctctaatga ccgaagttaa tatgaggagt aaaacactag acccagcttt 8580

cttgtacaaa gtggtgatgt tgtggtcgac ccatcgatgg gcatgcaagc tgggatccca 8640

gcttggtacc agatcttata attaaatggc cttcgctgcc catattattg gtaactcaac 8700

agcatcaatc acgggatttt tctcgaatta attgcgtcga atctcagcat cgaaatattc 8760

gcctttttcg tccattagac tatctattgt gatggtggat ttatcacaaa tgggacccgc 8820

cgccgacaga ggtgtgatgt taggccagga ctttgaaaat ttgcgcaact atcgtatagt 8880

ggccgacaaa ttgacgccga gttgacagac tgcctagcat ttgagtgaat tatgtaaggt 8940

aatgggctac actgaattgg tagctcaaac tgtcagtatt tatgtatatg agtgtatatt 9000

ttcgcataat ctcagaccaa tctgaagatg aaatgggtat ctgggaatgg cgaaatcaag 9060

gcatcgatcg tgaagtttct catctaagcc cccatttgga cgtgaatgta gacacgtcga 9120

aataaagatt tccgaattag aataatttgt ttattgcttt cgcctataaa tacgacggat 9180

cgtaatttgt cgttttatca aaatgtactt tcattttata ataacgctgc ggacatctac 9240

atttttgaat tgaaaaaaaa ttggtaatta ctctttcttt ttctccatat tgaccatcat 9300

actcattgct gatccatgta gatttcccgg acatgaagcc atttacaatt gaatatatcc 9360

tgccgccgct gccgctttgc acccggtgga gcttgcatgt tggtttctac gcagaactga 9420

gccggttagg cagataattt ccattgagaa ctgagccatg tgcaccttcc ccccaacacg 9480

gtgagcgacg gggcaacgga gtgatccaca tgggactttt aaacatcatc cgtcggatgg 9540

cgttgcgaga gaagcagtcg atccgtgaga tcagccgacg caccgggcag gcgcgcaaca 9600

cgatcgcaaa gtatttgaac gcaggtacaa tcgagccgac gttcacggta ccggaacgac 9660

caagcaagct agcttagtaa agccctcgct agattttaat gcggatgttg cgattacttc 9720

gccaactatt gcgataacaa gaaaaagcca gcctttcatg atatatctcc caatttgtgt 9780

agggcttatt atgcacgctt aaaaataata aaagcagact tgacctgata gtttggctgt 9840

gagcaattat gtgcttagtg catctaacgc ttgagttaag ccgcgccgcg aagcggcgtc 9900

ggcttgaacg aattgttaga cattatttgc cgactacctt ggtgatctcg cctttcacgt 9960

agtggacaaa ttcttccaac tgatctgcgc gcgaggccaa gcgatcttct tcttgtccaa 10020

gataagcctg tctagcttca agtatgacgg gctgatactg ggccggcagg cgctccattg 10080

cccagtcggc agcgacatcc ttcggcgcga ttttgccggt tactgcgctg taccaaatgc 10140

gggacaacgt aagcactaca tttcgctcat cgccagccca gtcgggcggc gagttccata 10200

gcgttaaggt ttcatttagc gcctcaaata gatcctgttc aggaaccgga tcaaagagtt 10260

cctccgccgc tggacctacc aaggcaacgc tatgttctct tgcttttgtc agcaagatag 10320

ccagatcaat gtcgatcgtg gctggctcga agatacctgc aagaatgtca ttgcgctgcc 10380

attctccaaa ttgcagttcg cgcttagctg gataacgcca cggaatgatg tcgtcgtgca 10440

caacaatggt gacttctaca gcgcggagaa tctcgctctc tccaggggaa gccgaagttt 10500

ccaaaaggtc gttgatcaaa gctcgccgcg ttgtttcatc aagccttacg gtcaccgtaa 10560

ccagcaaatc aatatcactg tgtggcttca ggccgccatc cactgcggag ccgtacaaat 10620

gtacggccag caacgtcggt tcgagatggc gctcgatgac gccaactacc tctgatagtt 10680

gagtcgatac ttcggcgatc accgcttccc tcatgatgtt taactttgtt ttagggcgac 10740

tgccctgctg cgtaacatcg ttgctgctcc ataacatcaa acatcgaccc acggcgtaac 10800

gcgcttgctg cttggatgcc cgaggcatag actgtacccc aaaaaaacag tcataacaag 10860

ccatgaaaac cgccactgcg ccgttaccac cgctgcgttc ggtcaaggtt ctggaccagt 10920

tgcgtgagcg catacgctac ttgcattaca gcttacgaac cgaacaggct tatgtccact 10980

gggttcgtgc cttcatccgt ttccacggtg tgcgtcaccc ggcaaccttg ggcagcagcg 11040

aagtcgaggc atttctgtcc tggctggcga acgagcgcaa ggtttcggtc tccacgcatc 11100

gtcaggcatt ggcggccttg ctgttcttct acggcaaggt gctgtgcacg gatctgccct 11160

ggcttcagga gatcggaaga cctcggccgt cgcggcgctt gccggtggtg ctgaccccgg 11220

atgaagtggt tcgcatcctc ggttttctgg aaggcgagca tcgtttgttc gcccagcttc 11280

tgtatggaac gggcatgcgg atcagtgagg gtttgcaact gcgggtcaag gatctggatt 11340

tcgatcacgg cacgatcatc gtgcgggagg gcaagggctc caaggatcgg gccttgatgt 11400

tacccgagag cttggcaccc agcctgcgcg agcaggatcg atccaacccc tccgctgcta 11460

tagtgcagtc ggcttctgac gttcagtgca gccgtcttct gaaaacgaca tgtcgcacaa 11520

gtcctaagtt acgcgacagg ctgccgccct gcccttttcc tggcgttttc ttgtcgcgtg 11580

ttttagtcgc ataaagtaga atacttgcga ctagaaccgg agacattacg ccatgaacaa 11640

gagcgccgcc gctggcctgc tgggctatgc ccgcgtcagc accgacgacc aggacttgac 11700

caaccaacgg gccgaactgc acgcggccgg ctgcaccaag ctgttttccg agaagatcac 11760

cggcaccagg cgcgaccgcc cggagctggc caggatgctt gaccacctac gccctggcga 11820

cgttgtgaca gtgaccaggc tagaccgcct ggcccgcagc acccgcgacc tactggacat 11880

tgccgagcgc atccaggagg ccggcgcggg cctgcgtagc ctggcagagc cgtgggccga 11940

caccaccacg ccggccggcc gcatggtgtt gaccgtgttc gccggcattg ccgagttcga 12000

gcgttcccta atcatcgacc gcacccggag cgggcgcgag gccgccaagg cccgaggcgt 12060

gaagtttggc ccccgcccta ccctcacccc ggcacagatc gcgcacgccc gcgagctgat 12120

cgaccaggaa ggccgcaccg tgaaagaggc ggctgcactg cttggcgtgc atcgctcgac 12180

cctgtaccgc gcacttgagc gcagcgagga agtgacgccc accgaggcca ggcggcgcgg 12240

tgccttccgt gaggacgcat tgaccgaggc cgacgccctg gcggccgccg agaatgaacg 12300

ccaagaggaa caagcatgaa accgcaccag gacggccagg acgaaccgtt tttcattacc 12360

gaagagatcg aggcggagat gatcgcggcc gggtacgtgt tcgagccgcc cgcgcacgtc 12420

tcaaccgtgc ggctgcatga aatcctggcc ggtttgtctg atgccaagct ggcggcctgg 12480

ccggccagct tggccgctga agaaaccgag cgccgccgtc taaaaaggtg atgtgtattt 12540

gagtaaaaca gcttgcgtca tgcggtcgct gcgtatatga tgcgatgagt aaataaacaa 12600

atacgcaagg ggaacgcatg aaggttatcg ctgtacttaa ccagaaaggc gggtcaggca 12660

agacgaccat cgcaacccat ctagcccgcg ccctgcaact cgccggggcc gatgttctgt 12720

tagtcgattc cgatccccag ggcagtgccc gcgattgggc ggccgtgcgg gaagatcaac 12780

cgctaaccgt tgtcggcatc gaccgcccga cgattgaccg cgacgtgaag gccatcggcc 12840

ggcgcgactt cgtagtgatc gacggagcgc cccaggcggc ggacttggct gtgtccgcga 12900

tcaaggcagc cgacttcgtg ctgattccgg tgcagccaag cccttacgac atatgggcca 12960

ccgccgacct ggtggagctg gttaagcagc gcattgaggt cacggatgga aggctacaag 13020

cggcctttgt cgtgtcgcgg gcgatcaaag gcacgcgcat cggcggtgag gttgccgagg 13080

cgctggccgg gtacgagctg cccattcttg agtcccgtat cacgcagcgc gtgagctacc 13140

caggcactgc cgccgccggc acaaccgttc ttgaatcaga acccgagggc gacgctgccc 13200

gcgaggtcca ggcgctggcc gctgaaatta aatcaaaact catttgagtt aatgaggtaa 13260

agagaaaatg agcaaaagca caaacacgct aagtgccggc cgtccgagcg cacgcagcag 13320

caaggctgca acgttggcca gcctggcaga cacgccagcc atgaagcggg tcaactttca 13380

gttgccggcg gaggatcaca ccaagctgaa gatgtacgcg gtacgccaag gcaagaccat 13440

taccgagctg ctatctgaat acatcgcgca gctaccagag taaatgagca aatgaataaa 13500

tgagtagatg aattttagcg gctaaaggag gcggcatgga aaatcaagaa caaccaggca 13560

ccgacgccgt ggaatgcccc atgtgtggag gaacgggcgg ttggccaggc gtaagcggct 13620

gggttgtctg ccggccctgc aatggcactg gaacccccaa gcccgaggaa tcggcgtgag 13680

cggtcgcaaa ccatccggcc cggtacaaat cggcgcggcg ctgggtgatg acctggtgga 13740

gaagttgaag gccgcgcagg ccgcccagcg gcaacgcatc gaggcagaag cacgccccgg 13800

tgaatcgtgg caagcggccg ctgatcgaat ccgcaaagaa tcccggcaac cgccggcagc 13860

cggtgcgccg tcgattagga agccgcccaa gggcgacgag caaccagatt ttttcgttcc 13920

gatgctctat gacgtgggca cccgcgatag tcgcagcatc atggacgtgg ccgttttccg 13980

tctgtcgaag cgtgaccgac gagctggcga ggtgatccgc tacgagcttc cagacgggca 14040

cgtagaggtt tccgcagggc cggccggcat ggccagtgtg tgggattacg acctggtact 14100

gatggcggtt tcccatctaa ccgaatccat gaaccgatac cgggaaggga agggagacaa 14160

gcccggccgc gtgttccgtc cacacgttgc ggacgtactc aagttctgcc ggcgagccga 14220

tggcggaaag cagaaagacg acctggtaga aacctgcatt cggttaaaca ccacgcacgt 14280

tgccatgcag cgtacgaaga aggccaagaa cggccgcctg gtgacggtat ccgagggtga 14340

agccttgatt agccgctaca agatcgtaaa gagcgaaacc gggcggccgg agtacatcga 14400

gatcgagcta gctgattgga tgtaccgcga gatcacagaa ggcaagaacc cggacgtgct 14460

gacggttcac cccgattact ttttgatcga tcccggcatc ggccgttttc tctaccgcct 14520

ggcacgccgc gccgcaggca aggcagaagc c 14551

<210> 10

<211> 14569

<212> DNA

<213> 人工序列

<220>

<223> pRIT3-mEGFP的完整核苷酸序列。

<400> 10

agatggttgt tcaagacgat ctacgaacgc agtggcagcg ccggagagtt caagaagttc 60

tgtttcaccg tgcgcaagct gatcgggtca aatgacctgc cggagtacga tttgaaggag 120

gaggcggggc aggctggccc gatcctagtc atgcgctacc gcaacctgat cgagggcgaa 180

gcatccgccg gttcctaatg tacggagcag atgctagggc aaattgccct agcaggggaa 240

aaaggtcgaa aaggtctctt tcctgtggat agcacgtaca ttgggaaccc aaagccgtac 300

attgggaacc ggaacccgta cattgggaac ccaaagccgt acattgggaa ccggtcacac 360

atgtaagtga ctgatataaa agagaaaaaa ggcgattttt ccgcctaaaa ctctttaaaa 420

cttattaaaa ctcttaaaac ccgcctggcc tgtgcataac tgtctggcca gcgcacagcc 480

gaagagctgc aaaaagcgcc tacccttcgg tcgctgcgct ccctacgccc cgccgcttcg 540

cgtcggccta tcgcggccgc tggccgctca aaaatggctg gcctacggcc aggcaatcta 600

ccagggcgcg gacaagccgc gccgtcgcca ctcgaccgcc ggcgcccaca tcaaggcacc 660

ctgcctcgcg cgtttcggtg atgacggtga aaacctctga cacatgcagc tcccggagac 720

ggtcacagct tgtctgtaag cggatgccgg gagcagacaa gcccgtcagg gcgcgtcagc 780

gggtgttggc gggtgtcggg gcgcagccat gacccagtca cgtagcgata gcggagtgta 840

tactggctta actatgcggc atcagagcag attgtactga gagtgcacca tatgcggtgt 900

gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggcgctcttc cgcttcctcg 960

ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag 1020

gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa 1080

ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc 1140

cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca 1200

ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg 1260

accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct 1320

catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt 1380

gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag 1440

tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc 1500

agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac 1560

actagaagga cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga 1620

gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc 1680

aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg 1740

gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca 1800

aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt 1860

atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca 1920

gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg 1980

atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca 2040

ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt 2100

cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt 2160

agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca 2220

cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca 2280

tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga 2340

agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact 2400

gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga 2460

gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caacacggga taataccgcg 2520

ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc 2580

tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga 2640

tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat 2700

gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt 2760

caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt 2820

atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac 2880

gtctaagaaa ccattattat catgacatta acctataaaa ataggcgtat cacgaggccc 2940

tttcgtcttc gaataaatac ctgtgacgga agatcacttc gcagaataaa taaatcctgg 3000

tgtccctgtt gataccggga agccctgggc caacttttgg cgaaaatgag acgttgatcg 3060

gcacgtaaga ggttccaact ttcaccataa tgaaataaga tcactaccgg gcgtattttt 3120

tgagttatcg agattttcag gagctaagga agctaaaatg gagaaaaaaa tcactggata 3180

taccaccgtt gatatatccc aatggcatcg taaagaacat tttgaggcat ttcagtcagt 3240

tgctcaatgt acctataacc agaccgttcc tggatattac ggccttttta aagaccgtaa 3300

agaaaaataa gcacaagttt tatccggcct ttattcacat tcttgcccgc ctgatgaatg 3360

ctcatccgga ataattcgaa gctcggtccc gtgggtgttc tgtcgtctcg ttgtacaacg 3420

aaatccattc ccattccgcg ctcaagatgg cttcccctcg gcagttcatc agggctaaat 3480

caatctagcc gacttgtccg gtgaaatggg ctgcactcca acagaaacaa tcaaacaaac 3540

atacacagcg acttattcac acgagctcaa attacaacgg tatatatcct gccagtcagc 3600

atcatcacac caaaagttag gcccgaatag tttgaaatta gaaagctcgc aattgaggtc 3660

tacaggccaa attcgctctt agccgtacaa tattactcac cggtgcgatg ccccccatcg 3720

taggtgaagg tggaaattaa tgatccatct tgagaccaca ggcccacaac agctaccagt 3780

ttcctcaagg gtccaccaaa aacgtaagcg cttacgtaca tggtcgataa gaaaaggcaa 3840

tttgtagatg ttaattccca tcttgaaaga aatatagttt aaatatttat tgataaaata 3900

acaagtcagg tattatagtc caagcaaaaa cataaattta ttgatgcaag tttaaattca 3960

gaaatatttc aataactgat tatatcagct ggtacattgc cgtagatgaa agactgagtg 4020

cgatattatg tgtaatacat aaattgatga tatagctagc ttagctcatc gggggatccg 4080

tcgacctgca gccaagctgg gatcccagct gggatcccag cttgtcgacg gtaccccctc 4140

tagagttcct tctagacccg atctagtaac atagatgaca ccgcgcgcga taatttatcc 4200

tagtttgcgc gctatatttt gttttctatc gcgtattaaa tgtataattg cgggactcta 4260

atcataaaaa cccatctcat aaataacgtc atgcattaca tgttaattat tacatgctta 4320

acgtaattca acagaaatta tatgataatc atcgcaagac cggcaacagg attcaatctt 4380

aagaaacttt attgccaaat gtttgaacga tcggggatca tccgggtctg tggcgggaac 4440

tccacgaaaa tatccgaacg cagcaagata tcgcggtgca tctcggtctt gcctgggcag 4500

tcgccgccga cgccgttgat gtggacgccg ggcccgatca tattgtcgct caggatcgtg 4560

gcgttgtgct tgtcggccgt tgctgtcgta atgatatcgg caccttcgac cgcctgttcc 4620

gcagagatcc cgtgggcgaa gaactccagc atgagatccc cgcgctggag gatcatccag 4680

ccggcgtccc ggaaaacgat tccgaagccc aacctttcat agaaggcggc ggtggaatcg 4740

aaatctcgtg atggcaggtt gggcgtcgct tggtcggtca tttcgaaccc cagagtcccg 4800

ctcagaagaa ctcgtcaaga aggcgataga aggcgatgcg ctgcgaatcg ggagcggcga 4860

taccgtaaag cacgaggaag cggtcagccc attcgccgcc aagctcttca gcaatatcac 4920

gggtagccaa cgctatgtcc tgatagcggt ccgccacacc cagccggcca cagtcgatga 4980

atccagaaaa gcggccattt tccaccatga tattcggcaa gcaggcatcg ccatgggtca 5040

cgacgagatc atcgccgtcg ggcatgcgcg ccttgagcct ggcgaacagt tcggctggcg 5100

cgagcccctg atgctcttcg tccagatcat cctgatcgac aagaccggct tccatccgag 5160

tacgtgctcg ctcgatgcga tgtttcgctt ggtggtcgaa tgggcaggta gccggatcaa 5220

gcgtatgcag ccgccgcatt gcatcagcca tgatggatac tttctcggca ggagcaaggt 5280

gagatgacag gagatcctgc cccggcactt cgcccaatag cagccagtcc cttcccgctt 5340

cagtgacaac gtcgagcaca gctgcgcaag gaacgcccgt cgtggccagc cacgatagcc 5400

gcgctgcctc gtcctgcagt tcattcaggg caccggacag gtcggtcttg acaaaaagaa 5460

ccgggcgccc ctgcgctgac agccggaaca cggcggcatc agagcagccg attgtctgtt 5520

gtgcccagtc atagccgaat agcctctcca cccaagcggc cggagaacct gcgtgcaatc 5580

catcttgttc aatcatatct cattgccccc cggtctacct acaaaaaagc tccgcacgag 5640

gctgcatttg tcacaaatca tgaaaagaaa aactaccgat gaacaatgct gagggattca 5700

aattctaccc acaaaaagaa gaaagaaaga tctagcacat ctaagcctga cgaagcagca 5760

gaaatatata aaaatataaa ccatagtgcc cttttcccct cttcctgatc ttgtttagca 5820

tggcggaaat tttaaacccc ccatcatctc ccccaacaac ggcggatcgc agatctacat 5880

ccgagagccc cattccccgc gagatccggg ccggatccac gccggcgaga gccccagccg 5940

cgagatcccg cccctcccgc gcaccgatct gggcgcgcac gaagccgcct ctcgcccacc 6000

caaactacca aggccaaaga tcgagaccga gacggaaaaa aaaaacggag aaagaaagag 6060

gagaggggcg gggtggttac cggcgcggcg gcggcggagg gggagggggg aggagctcgt 6120

cgtccggcag cgagggggga ggaggtggag gtggtggtgg tggtggtggt agggttgggg 6180

ggatgggagg agaggggggg gtatgtatat agtggcgatg gggggcgttt ctttggaagc 6240

ggagggaggg ccggcctcgt cgctggctcg cgatcctcct cgcgtttccg gcccccacga 6300

cccggaccca cctgctgttt tttctttttc ttttttttct ttcttttttt ttttttggct 6360

gcgagacgtg cggtgcgtgc ggacaactca cggtgatagt gggggggtgt ggagactatt 6420

gtccagttgg ctggactggg gtgggttggg ttgggttggg ttgggctggg cttgctatgg 6480

atcgtggata gcactttggg ctttaggaac tttaggggtt gtttttgtaa atgttttgag 6540

tctaagttta tcttttattt ttactagaaa aaatacccat gcgctgcaac gggggaaagc 6600

tattttaatc ttattattgt tcattgtgag aattcgcctg aatatatatt tttctcaaaa 6660

attatgtcaa attagcatat gggttttttt aaagatattt cttatacaaa tccctctgta 6720

tttacaaaag caaacgaact taaaacccga ctcaaataca gatatgcatt tccaaaagcg 6780

aataaactta aaaaccaatt catacaaaaa tgacgtatca aagtaccgac aaaaacatcc 6840

tcaattttta taatagtaga aaagagtaaa tttcactttg ggccaccttt tattaccgat 6900

attttacttt ataccacctt ttaactgatg ttttcacttt tgaccaggta atcttacctt 6960

tgttttattt tggactatcc cgactctctt ctcaagcata tgaatgaccg tatgctagtg 7020

cggccgcaag cttgactact agtctctctt aaggtagcat cacaagtttg tacaaaaaag 7080

caggctcctg caggtgagac ttttcaacaa agggtaatat cgggaaacct cctcggattc 7140

cattgcccag ctatctgtca cttcatcgaa aggacagtag aaaaggaagg tggctcctac 7200

aaatgccatc attgcgataa aggaaaggct atcgttcaag atgcctctac cgacagtggt 7260

cccaaagatg gacccccacc cacgaggaac atcgtggaaa aagaagacgt tccaaccacg 7320

tcttcaaagc aagtggattg atgtgatatc tccactgacg taagggatga cgcacaatcc 7380

cactatcctt cgcaagaccc ttcctctata taaggaagtt catttcattt ggagaggaca 7440

ggcttcttga gatccttcaa caattaccaa caacaacaaa caacaaacaa cattacaatt 7500

actatttaca attacagtcg actctagagg atccggccca gttggaatgt aggtggtgag 7560

caagggcgag gagctgttca ccggggtggt gcccatcctg gtcgagctgg acggcgacgt 7620

aaacggccac aagttcagcg tgtccggcga gggcgagggc gatgccacct acggcaagct 7680

gaccctgaag ttcatctgca ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac 7740

caccttcacc tacggcgtgc agtgcttcag ccgctacccc gaccacatga agcagcacga 7800

cttcttcaag tccgccatgc ccgaaggcta cgtccaggag cgcaccatct tcttcaagga 7860

cgacggcaac tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg 7920

catcgagctg aagggcatcg acttcaagga ggacggcaac atcctggggc acaagctgga 7980

gtacaactac aacagccaca acgtctatat catggccgac aagcagaaga acggcatcaa 8040

ggtgaacttc aagatccgcc acaacatcga ggacggcagc gtgcagctcg ccgaccacta 8100

ccagcagaac acccccatcg gcgacggccc cgtgctgctg cccgacaacc actacctgag 8160

cacccagtcc gccctgagca aagaccccaa cgagaagcgc gatcacatgg tcctgctgga 8220

gttcgtgacc gccgccggga tcactcacgg catggacgag ctgtacaagt aaagcggccg 8280

cccggctgca ttcgagtatt atggcattgg gaaaactgtt tttcttgtac catttgttgt 8340

gcttgtaatt tactgtgttt tttattcggt tttcgctatc gaactgtgaa atggaaatgg 8400

atggagaaga gttaatgaat gatatggtcc ttttgttcat tctcaaatta atattatttg 8460

ttttttctct tatttgttgt gtgttgaatt tgaaattata agagatatgc aaacattttg 8520

ttttgagtaa aaatgtgtca aatcgtggcc tctaatgacc gaagttaata tgaggagtaa 8580

aacactagac ccagctttct tgtacaaagt ggtgatgttg tggtcgaccc atcgatgggc 8640

atgcaagctg ggatcccagc ttggtaccag atcttataat taaatggcct tcgctgccca 8700

tattattggt aactcaacag catcaatcac gggatttttc tcgaattaat tgcgtcgaat 8760

ctcagcatcg aaatattcgc ctttttcgtc cattagacta tctattgtga tggtggattt 8820

atcacaaatg ggacccgccg ccgacagagg tgtgatgtta ggccaggact ttgaaaattt 8880

gcgcaactat cgtatagtgg ccgacaaatt gacgccgagt tgacagactg cctagcattt 8940

gagtgaatta tgtaaggtaa tgggctacac tgaattggta gctcaaactg tcagtattta 9000

tgtatatgag tgtatatttt cgcataatct cagaccaatc tgaagatgaa atgggtatct 9060

gggaatggcg aaatcaaggc atcgatcgtg aagtttctca tctaagcccc catttggacg 9120

tgaatgtaga cacgtcgaaa taaagatttc cgaattagaa taatttgttt attgctttcg 9180

cctataaata cgacggatcg taatttgtcg ttttatcaaa atgtactttc attttataat 9240

aacgctgcgg acatctacat ttttgaattg aaaaaaaatt ggtaattact ctttcttttt 9300

ctccatattg accatcatac tcattgctga tccatgtaga tttcccggac atgaagccat 9360

ttacaattga atatatcctg ccgccgctgc cgctttgcac ccggtggagc ttgcatgttg 9420

gtttctacgc agaactgagc cggttaggca gataatttcc attgagaact gagccatgtg 9480

caccttcccc ccaacacggt gagcgacggg gcaacggagt gatccacatg ggacttttaa 9540

acatcatccg tcggatggcg ttgcgagaga agcagtcgat ccgtgagatc agccgacgca 9600

ccgggcaggc gcgcaacacg atcgcaaagt atttgaacgc aggtacaatc gagccgacgt 9660

tcacggtacc ggaacgacca agcaagctag cttagtaaag ccctcgctag attttaatgc 9720

ggatgttgcg attacttcgc caactattgc gataacaaga aaaagccagc ctttcatgat 9780

atatctccca atttgtgtag ggcttattat gcacgcttaa aaataataaa agcagacttg 9840

acctgatagt ttggctgtga gcaattatgt gcttagtgca tctaacgctt gagttaagcc 9900

gcgccgcgaa gcggcgtcgg cttgaacgaa ttgttagaca ttatttgccg actaccttgg 9960

tgatctcgcc tttcacgtag tggacaaatt cttccaactg atctgcgcgc gaggccaagc 10020

gatcttcttc ttgtccaaga taagcctgtc tagcttcaag tatgacgggc tgatactggg 10080

ccggcaggcg ctccattgcc cagtcggcag cgacatcctt cggcgcgatt ttgccggtta 10140

ctgcgctgta ccaaatgcgg gacaacgtaa gcactacatt tcgctcatcg ccagcccagt 10200

cgggcggcga gttccatagc gttaaggttt catttagcgc ctcaaataga tcctgttcag 10260

gaaccggatc aaagagttcc tccgccgctg gacctaccaa ggcaacgcta tgttctcttg 10320

cttttgtcag caagatagcc agatcaatgt cgatcgtggc tggctcgaag atacctgcaa 10380

gaatgtcatt gcgctgccat tctccaaatt gcagttcgcg cttagctgga taacgccacg 10440

gaatgatgtc gtcgtgcaca acaatggtga cttctacagc gcggagaatc tcgctctctc 10500

caggggaagc cgaagtttcc aaaaggtcgt tgatcaaagc tcgccgcgtt gtttcatcaa 10560

gccttacggt caccgtaacc agcaaatcaa tatcactgtg tggcttcagg ccgccatcca 10620

ctgcggagcc gtacaaatgt acggccagca acgtcggttc gagatggcgc tcgatgacgc 10680

caactacctc tgatagttga gtcgatactt cggcgatcac cgcttccctc atgatgttta 10740

actttgtttt agggcgactg ccctgctgcg taacatcgtt gctgctccat aacatcaaac 10800

atcgacccac ggcgtaacgc gcttgctgct tggatgcccg aggcatagac tgtaccccaa 10860

aaaaacagtc ataacaagcc atgaaaaccg ccactgcgcc gttaccaccg ctgcgttcgg 10920

tcaaggttct ggaccagttg cgtgagcgca tacgctactt gcattacagc ttacgaaccg 10980

aacaggctta tgtccactgg gttcgtgcct tcatccgttt ccacggtgtg cgtcacccgg 11040

caaccttggg cagcagcgaa gtcgaggcat ttctgtcctg gctggcgaac gagcgcaagg 11100

tttcggtctc cacgcatcgt caggcattgg cggccttgct gttcttctac ggcaaggtgc 11160

tgtgcacgga tctgccctgg cttcaggaga tcggaagacc tcggccgtcg cggcgcttgc 11220

cggtggtgct gaccccggat gaagtggttc gcatcctcgg ttttctggaa ggcgagcatc 11280

gtttgttcgc ccagcttctg tatggaacgg gcatgcggat cagtgagggt ttgcaactgc 11340

gggtcaagga tctggatttc gatcacggca cgatcatcgt gcgggagggc aagggctcca 11400

aggatcgggc cttgatgtta cccgagagct tggcacccag cctgcgcgag caggatcgat 11460

ccaacccctc cgctgctata gtgcagtcgg cttctgacgt tcagtgcagc cgtcttctga 11520

aaacgacatg tcgcacaagt cctaagttac gcgacaggct gccgccctgc ccttttcctg 11580

gcgttttctt gtcgcgtgtt ttagtcgcat aaagtagaat acttgcgact agaaccggag 11640

acattacgcc atgaacaaga gcgccgccgc tggcctgctg ggctatgccc gcgtcagcac 11700

cgacgaccag gacttgacca accaacgggc cgaactgcac gcggccggct gcaccaagct 11760

gttttccgag aagatcaccg gcaccaggcg cgaccgcccg gagctggcca ggatgcttga 11820

ccacctacgc cctggcgacg ttgtgacagt gaccaggcta gaccgcctgg cccgcagcac 11880

ccgcgaccta ctggacattg ccgagcgcat ccaggaggcc ggcgcgggcc tgcgtagcct 11940

ggcagagccg tgggccgaca ccaccacgcc ggccggccgc atggtgttga ccgtgttcgc 12000

cggcattgcc gagttcgagc gttccctaat catcgaccgc acccggagcg ggcgcgaggc 12060

cgccaaggcc cgaggcgtga agtttggccc ccgccctacc ctcaccccgg cacagatcgc 12120

gcacgcccgc gagctgatcg accaggaagg ccgcaccgtg aaagaggcgg ctgcactgct 12180

tggcgtgcat cgctcgaccc tgtaccgcgc acttgagcgc agcgaggaag tgacgcccac 12240

cgaggccagg cggcgcggtg ccttccgtga ggacgcattg accgaggccg acgccctggc 12300

ggccgccgag aatgaacgcc aagaggaaca agcatgaaac cgcaccagga cggccaggac 12360

gaaccgtttt tcattaccga agagatcgag gcggagatga tcgcggccgg gtacgtgttc 12420

gagccgcccg cgcacgtctc aaccgtgcgg ctgcatgaaa tcctggccgg tttgtctgat 12480

gccaagctgg cggcctggcc ggccagcttg gccgctgaag aaaccgagcg ccgccgtcta 12540

aaaaggtgat gtgtatttga gtaaaacagc ttgcgtcatg cggtcgctgc gtatatgatg 12600

cgatgagtaa ataaacaaat acgcaagggg aacgcatgaa ggttatcgct gtacttaacc 12660

agaaaggcgg gtcaggcaag acgaccatcg caacccatct agcccgcgcc ctgcaactcg 12720

ccggggccga tgttctgtta gtcgattccg atccccaggg cagtgcccgc gattgggcgg 12780

ccgtgcggga agatcaaccg ctaaccgttg tcggcatcga ccgcccgacg attgaccgcg 12840

acgtgaaggc catcggccgg cgcgacttcg tagtgatcga cggagcgccc caggcggcgg 12900

acttggctgt gtccgcgatc aaggcagccg acttcgtgct gattccggtg cagccaagcc 12960

cttacgacat atgggccacc gccgacctgg tggagctggt taagcagcgc attgaggtca 13020

cggatggaag gctacaagcg gcctttgtcg tgtcgcgggc gatcaaaggc acgcgcatcg 13080

gcggtgaggt tgccgaggcg ctggccgggt acgagctgcc cattcttgag tcccgtatca 13140

cgcagcgcgt gagctaccca ggcactgccg ccgccggcac aaccgttctt gaatcagaac 13200

ccgagggcga cgctgcccgc gaggtccagg cgctggccgc tgaaattaaa tcaaaactca 13260

tttgagttaa tgaggtaaag agaaaatgag caaaagcaca aacacgctaa gtgccggccg 13320

tccgagcgca cgcagcagca aggctgcaac gttggccagc ctggcagaca cgccagccat 13380

gaagcgggtc aactttcagt tgccggcgga ggatcacacc aagctgaaga tgtacgcggt 13440

acgccaaggc aagaccatta ccgagctgct atctgaatac atcgcgcagc taccagagta 13500

aatgagcaaa tgaataaatg agtagatgaa ttttagcggc taaaggaggc ggcatggaaa 13560

atcaagaaca accaggcacc gacgccgtgg aatgccccat gtgtggagga acgggcggtt 13620

ggccaggcgt aagcggctgg gttgtctgcc ggccctgcaa tggcactgga acccccaagc 13680

ccgaggaatc ggcgtgagcg gtcgcaaacc atccggcccg gtacaaatcg gcgcggcgct 13740

gggtgatgac ctggtggaga agttgaaggc cgcgcaggcc gcccagcggc aacgcatcga 13800

ggcagaagca cgccccggtg aatcgtggca agcggccgct gatcgaatcc gcaaagaatc 13860

ccggcaaccg ccggcagccg gtgcgccgtc gattaggaag ccgcccaagg gcgacgagca 13920

accagatttt ttcgttccga tgctctatga cgtgggcacc cgcgatagtc gcagcatcat 13980

ggacgtggcc gttttccgtc tgtcgaagcg tgaccgacga gctggcgagg tgatccgcta 14040

cgagcttcca gacgggcacg tagaggtttc cgcagggccg gccggcatgg ccagtgtgtg 14100

ggattacgac ctggtactga tggcggtttc ccatctaacc gaatccatga accgataccg 14160

ggaagggaag ggagacaagc ccggccgcgt gttccgtcca cacgttgcgg acgtactcaa 14220

gttctgccgg cgagccgatg gcggaaagca gaaagacgac ctggtagaaa cctgcattcg 14280

gttaaacacc acgcacgttg ccatgcagcg tacgaagaag gccaagaacg gccgcctggt 14340

gacggtatcc gagggtgaag ccttgattag ccgctacaag atcgtaaaga gcgaaaccgg 14400

gcggccggag tacatcgaga tcgagctagc tgattggatg taccgcgaga tcacagaagg 14460

caagaacccg gacgtgctga cggttcaccc cgattacttt ttgatcgatc ccggcatcgg 14520

ccgttttctc taccgcctgg cacgccgcgc cgcaggcaag gcagaagcc 14569

<210> 11

<211> 18695

<212> DNA

<213> 人工序列

<220>

<223> 2408的完整核苷酸序列。

<400> 11

taaacgctct tttctcttag gtttacccgc caatatatcc tgtcaaacac tgatagttta 60

aactgaaggc gggaaacgac aatctgatcc aagctcaagc tccaatacgc aaaccgcctc 120

tccccgcgcg ttggccgatt cattaatgca gctggcacga caggtttccc gactggaaag 180

cgggcagtga gcgcaacgca attaatgtga gttagctcac tcattaggca ccccaggctt 240

tacactttat gcttccggct cgtatgttgt gtggaattgt gagcggataa caatttcaca 300

caggaaacag ctatgaccat gattacgaat ttcaggtgac tgatagtgac ctgttcgttg 360

caacaaattg atgagcaatg cttttttata atgccaactt tgtacaaaaa agcaggcggc 420

gcgtcctgca ggatagggat aacagggtaa tggcgcgcca agcttatcga taccgtcgac 480

ctcgagcggc cgccagtgtg atggatatct gcagaattgc ccttcgaagg gacaaaaaaa 540

gcaccgactc ggtgccactt tttcaagttg ataacggact agccttattt taacttgcta 600

tttctagctc taaaacgccc agttggaatg taggtgcaac acaagcgaca gcgcgcgggt 660

ttataagttg gtcgcgttcg agttagctgg gcaatgtggt actaaactgt tcctcccgcc 720

tctcgcgctc acactcgccc tgtgggccgc tcaccgtgca cgtacttggg cctcccgctc 780

ccccgcatgc atccagccca tcacagcgaa gagaatcggg cttttcttct ccccatctcc 840

ctacacaacc accaaataca gccaggccgt tggttcatga tccaagggca attccagcac 900

actggcggcc gttactagtg gatccgagct cggtacctta attaaattac cctgttatcc 960

ctatcctgca ggattaacac ccaacttttc tatccaagct tgccaacatg gtggagcacg 1020

acactctcgt ctactccaag aatatcaaag atacagtctc agaagaccaa agggctattg 1080

agacttttca acaaagggta atatcgggaa acctcctcgg attccattgc ccagctatct 1140

gtcacttcat caaaaggaca gtagaaaagg aaggtggcac ctacaaatgc catcattgcg 1200

ataaaggaaa ggctatcgtt caagatgcct ctgccgacag tggtcccaaa gatggacccc 1260

cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 1320

attgatgtga taacatggtg gagcacgaca ctctcgtcta ctccaagaat atcaaagata 1380

cagtctcaga agaccaaagg gctattgaga cttttcaaca aagggtaata tcgggaaacc 1440

tcctcggatt ccattgccca gctatctgtc acttcatcaa aaggacagta gaaaaggaag 1500

gtggcaccta caaatgccat cattgcgata aaggaaaggc tatcgttcaa gatgcctctg 1560

ccgacagtgg tcccaaagat ggacccccac ccacgaggag catcgtggaa aaagaagacg 1620

ttccaaccac gtcttcaaag caagtggatt gatgtgatat ctccactgac gtaagggatg 1680

acgcacaatc ccactatcct tcgcaagacc cttcctctat ataaggaagt tcatttcatt 1740

tggagaggcc ggtctagaga attccaagca acgaactgcg agtgattcaa gaaaaaagaa 1800

aacctgagct ttcgatctct acggagtggt ttcttgttct ttgaaaaaga gggggattac 1860

atatggctcc taagaagaag cggaaggttg gtattcacgg ggtgcctgcg gctatggaca 1920

agaagtactc gatcgggctg gccatcggaa caaattctgt aggctgggct gtaataaccg 1980

atgagtacaa ggtgccctct aaaaaattta aggtccttgg caatacggat agacattcca 2040

taaagaagaa tcttatcggt gcgctgctct ttgacagcgg cgagaccgcg gaggcgaccc 2100

ggttgaaacg caccgcgaga cgccgttaca caaggcgtaa gaatagaatc tgttatctcc 2160

aggagatatt ctctaatgaa atggcgaagg tagacgattc cttctttcac cgtctggagg 2220

aaagttttct cgttgaggaa gataagaaac atgaaagaca cccgatcttc ggaaacattg 2280

tcgacgaggt cgcttatcat gaaaagtacc ctaccatcta ccatcttaga aagaaacttg 2340

ttgacagcac ggataaggct gatctcaggc tgatatacct ggctctggca catatgatta 2400

agttcagagg gcatttcctt atcgaaggcg acctgaatcc agataattca gatgtagaca 2460

agctcttcat tcaacttgtg cagacttata atcagctctt cgaagaaaat ccaataaacg 2520

cgtcgggtgt agacgcaaag gccatactgt ccgctaggct ttctaagtca cgtagacttg 2580

agaatctcat tgcccaactc cccggcgaga agaagaacgg cttgtttgga aatctgatag 2640

cgctgtccct gggtcttaca ccaaatttca agagtaattt cgatttggca gaagatgcta 2700

agttgcagct cagtaaagac acctacgatg acgatcttga taatttgttg gctcagattg 2760

gcgatcagta tgcagatctt ttcttggccg ctaagaattt gtctgatgca attctgctta 2820

gcgacatttt gagggttaat acagaaatca ccaaggcacc cttgtcggcg tcaatgataa 2880

agaggtatga tgagcaccac caagacctga cgctcctcaa ggctcttgtt cggcagcaat 2940

tgccggagaa gtacaaagag atcttcttcg accagtctaa gaacggatat gcgggctaca 3000

tagacggtgg agcgagtcag gaggaattct acaagttcat aaagcccatt ctcgagaaga 3060

tggatggtac ggaagaactg cttgtgaaac ttaacagaga agatcttttg cggaagcaga 3120

gaactttcga caacggaagt ataccacacc agatacatct cggagagctt catgctattc 3180

tcagaagaca agaggatttc taccctttct tgaaggataa cagagaaaag atagagaaga 3240

tcctcacgtt taggatccct tactacgtag gtcctcttgc tcgcggcaat agtaggttcg 3300

cctggatgac ccgcaagtct gaagaaacta tcaccccttg gaatttcgaa gaggttgtag 3360

acaaaggtgc ttcagcacag agtttcattg agaggatgac caacttcgac aagaacctcc 3420

ccaacgaaaa ggtcctgcct aagcacagcc tcctctacga atactttact gtctataatg 3480

agcttacaaa agttaagtac gtgacagagg gaatgcggaa gcccgcattc ctttccggag 3540

aacaaaagaa ggcgatcgtg gatcttctct tcaagacgaa ccgcaaggtg acggttaaac 3600

agttgaagga agattacttc aagaagatag aatgttttga tagcgtggaa atcagcggcg 3660

tcgaagatag gttcaacgct tccctgggaa cgtaccacga tctcctcaag attatcaaag 3720

ataaggactt tcttgataac gaagagaatg aggacatctt ggaagacatt gttctgacgc 3780

tcaccctgtt cgaagatcgc gagatgattg aggaacgctt gaagacctac gcacacctgt 3840

tcgatgacaa ggttatgaag caacttaaac ggcgccggta tacgggctgg ggacggcttt 3900

cgcggaagct gataaatgga atccgtgaca agcagtctgg caagacaata ctcgacttct 3960

tgaagtcgga tggttttgcc aatagaaatt ttatgcaact cattcatgat gactcgctta 4020

cttttaagga ggacatccag aaggcccagg tatcaggaca gggtgactct ttgcacgaac 4080

acatcgcgaa cctggcgggc tcccccgcga ttaagaaggg aattttgcag actgtcaagg 4140

tggtcgatga actcgtgaag gttatgggac gtcataagcc ggaaaatatt gtgattgaga 4200

tggctcgcga gaatcaaaca acacagaagg gccaaaagaa cagtagagaa cgcatgaagc 4260

gcatcgaaga gggcatcaaa gagctgggca gtcagatcct taaagaacat ccagtcgaga 4320

atacacagct tcagaacgaa aagctgtacc tttattacct tcaaaatggg cgtgatatgt 4380

atgtggatca ggaactcgat atcaataggc tgagtgacta tgatgtcgac gctatcgtcc 4440

cgcaaagttt cctcaaggac gacagtatag acaacaaagt tctcacacgg tcagataaga 4500

atcgcggcaa gagcgataat gtaccgtcgg aggaggtagt caagaagatg aagaattact 4560

ggcgccagtt gctcaacgcc aagctcatca ctcagaggaa atttgacaac cttacgaaag 4620

ccgagcgggg cggactctct gaactggaca aggccggttt cataaagcgc cagctcgttg 4680

agacacgtca aattactaag cacgtcgctc aaatattgga ttcccgcatg aatactaagt 4740

acgatgagaa tgataagctc atacgtgaag ttaaggtcat tactctcaag tccaagcttg 4800

tatcggactt ccgtaaggac ttccaattct acaaggtccg ggaaatcaat aattatcacc 4860

atgcccatga cgcttatctg aacgcggtcg tgggcacggc actcattaag aaatacccaa 4920

aacttgagtc agaatttgtt tacggggact ataaagttta tgacgtgcgg aagatgatag 4980

cgaagtcgga acaagagata ggaaaggcga ctgcaaagta ctttttttac tccaacataa 5040

tgaatttctt taagaccgaa ataacccttg caaacggtga aatcagaaag cggcctctga 5100

ttgaaacaaa tggcgagacg ggcgagatcg tctgggacaa ggggagggac ttcgcaacgg 5160

ttcgcaaggt ccttagcatg ccgcaagtaa atatagttaa gaagacggaa gttcagaccg 5220

gcggctttag taaagaaagc atacttccta aaaggaattc cgacaaactg atagcgcgca 5280

agaaggactg ggatccaaag aagtatggag gatttgactc cccaaccgtt gcttatagcg 5340

tgttggtagt agccaaggtg gaaaagggta agtctaagaa attgaagtcg gtgaaggagt 5400

tgttggggat aactataatg gagcggagtt cgttcgagaa gaacccaatt gactttctcg 5460

aagccaaagg ctacaaggag gtcaagaagg acctgattat taagttgcca aagtactcgc 5520

tcttcgaact cgagaacggg agaaagcgta tgctggcgtc ggcgggcgag ctgcagaaag 5580

gaaacgagct ggctttgcca tcgaaatacg taaatttcct gtacctcgcc tcacattatg 5640

agaagcttaa agggtctcca gaagacaatg aacagaagca gctgtttgtt gaacagcaca 5700

agcactactt ggacgagatt atagaacaaa tctccgagtt ctctaaacgg gttatccttg 5760

cagacgccaa tttggataag gtcctctcgg cttataataa gcatagagat aagccaatcc 5820

gggagcaggc tgaaaatatc atacacctct ttacgttgac taatttgggt gcgccagcgg 5880

cattcaagta cttcgataca acaatcgatc gtaagcgcta cacaagcact aaggaagtcc 5940

tggacgcgac gctgatacac cagtccatta ctggactgta tgaaaccaga atagatctta 6000

gccagctcgg cggtgatgga ggagggccta gggctgatcc taagaagaag aggaaggttg 6060

gaggagggcc aggagcagag tatgttagag cgttgtttga ttttaacggt aacgatgaag 6120

aggatttacc ctttaagaaa ggcgacattc tcaggattag ggataaacct gaagagcaat 6180

ggtggaatgc tgaggatagt gaaggcaaac gaggaatgat tttagtgccg tatgtggaga 6240

aatattcggg tgactacaaa gatcatgatg gtgattacaa agaccatgac atcgactaca 6300

aggatgatga tgataagtca gggatgacag atgctgaata tgtcagaatc cacgaaaagt 6360

tggacattta cacgtttaag aagcagttct tcaacaacaa gaaatctgtt tcgcataggt 6420

gctatgtgct tttcgaacta aaacgtcgtg gagaaagacg ggcttgcttt tggggttacg 6480

cggttaacaa accacaatca ggtactgaac gaggaataca cgctgaaatc ttttctatcc 6540

gaaaggttga ggaatatcta cgtgacaatc ctggacagtt cactatcaat tggtattcta 6600

gctggtcacc atgtgcagat tgtgctgaga agattctcga atggtacaat caagagctta 6660

gaggcaatgg acatacattg aaaatatggg catgcaagct ctactacgaa aagaatgcca 6720

gaaaccaaat tgggctttgg aacttgaggg ataatggagt tgggcttaat gtcatggttt 6780

ctgagcacta tcaatgttgt cggaagatct tcatacaaag ttcccataac cagttgaatg 6840

agaacagatg gttagagaaa acccttaaaa gagccgagaa gagaagatcc gaactgagca 6900

ttatgataca ggtcaaaatt ctgcatacca ctaagagtcc agctgtaggt cctaagaaga 6960

aacgtaaagt agggccctga tccaggcctc ccagctttcg tccgtatcat cggtttcgac 7020

aacgttcgtc aagttcaatg catcagtttc attgcccaca caccagaatc ctactaagtt 7080

tgagtattat ggcattggaa aagctgtttt cttctatcat ttgttctgct tgtaatttac 7140

tgtgttcttt cagtttttgt tttcggacat caaaatgcaa atggatggat aagagttaat 7200

aaatgatatg gtccttttgt tcattctcaa attattatta tctgttgttt ttactttaat 7260

gggttgaatt taagtaagaa aggaactaac agtgtgatat taaggtgcaa tgttagacat 7320

ataaaacagt ctttcacctc tctttggtta tgtcttgaat tggtttgttt cttcacttat 7380

ctgtgtaatc aagtttacta tgagtctatg atcaagtaat tatgcaatca agttaagtac 7440

agtataggct tgagctccct aggcccctag gtaattcttc ggacccaaga atgctaagcc 7500

aagaggagct gttatcgccg tcctcctgct tgtttctctc tttttgttgc tgtttcttca 7560

ttagcgtgga caaagttttc aaccggccta tctgttatca ttttcttcta ttcaaagact 7620

gtaataccta ttgctacctg tggttctcac ttgtgatttt ggacacatat gttcggttta 7680

ttcaaattta atcagatgcc tgatgagggt accagaaaaa atacgtgttc tggttgtttt 7740

tgagttgcga ttattctatg aaatgaataa catcgaagtt atcatcccag tattttcgca 7800

tgaatgttct tttcttctgt cttgtgcatc agtgatctag tgcatgggag tttgtattgt 7860

gatgttcgac atcacgtaac ttccactttg cctttgctgt tcgatatttt aatgacatgt 7920

cacacacact tctgatactt ttctttcttg gctattgtgc cagcatgatg caagatgcat 7980

cacagcatca gatatattct catcgtcagg ctttagcagc acacgagcac gctttgccgc 8040

ttaaaagttg tacggcgcag cttagacatc ccctgtagaa gtgataatct tttcactttt 8100

ccttaaacaa attgagaggg gaaatggaac catgtggatc agagaagctt ttgtttcttt 8160

acacaagaat atttggtaca gtgggggtcc tatgttcgtg ggttcgtggc ttggctgcct 8220

gtcttcaacc aagtgttttc agttcaacat gttagcgtgt agaaagagca caattctgtt 8280

tatctccaag gtaaaatgtg gcattctgtt aaagaacatg atcctgccaa ttttttaagt 8340

ttcaatggaa gaggaatgta aagctttcta tggtttgtgt acacaacaca gtggaagagg 8400

agtgcaagct ttctatggtt tgtgtgcgcg ttgtgtgtca gcacttcaat tttgttagaa 8460

aatgaaagaa aaaaaaggat gatcatgctt atagtaaatc actctttttc ctcgccttct 8520

gtacgttttg acttgacaag attttaaaat ctgtacatga cctttgtttt aaaattactt 8580

tatgtatttc catctttcaa gttatgcaga tgtcatcaca aattgttaca ccaatcacca 8640

ggctggctgt ttatatatta tcagaccagg ctatatagag tatactatac taactgttca 8700

tattatctgg aaatcttgct tgctacttga gcggtaaaag ggtatagata tgagggtccc 8760

cagattagcc ttttcaattt cagaaagaat gctaacccac agatggttag agaggcttac 8820

gcagcaggtc tcatcaagac gatctacccg agcaataatc tccaggaaat caaatacctt 8880

cccaagaagg ttaaagatgc agtcaaaaga ttcaggacta actgcatcaa gaacacagag 8940

aaagatatat ttctcaagat cagaagtact attccagtat ggacgattca aggcttgctt 9000

cacaaaccaa ggcaagtaat agagattgga gtctctaaaa aggtagttcc cactgaatca 9060

aaggccatgg agtcaaagat tcaaatagag gacctaacag aactcgccgt aaagactggc 9120

gaacagttca tacagagtct cttacgactc aatgacaaga agaaaatctt cgtcaacatg 9180

gtggagcacg acacacttgt ctactccaaa aatatcaaag atacagtctc agaagaccaa 9240

agggcaattg agacttttca acaaagggta atatccggaa acctcctcgg attccattgc 9300

ccagctatct gtcactttat tgtgaagata gtggaaaagg aaggtggctc ctacaaatgc 9360

catcattgcg ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa 9420

gatggacccc cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca 9480

aagcaagtgg attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat 9540

ccttcgcaag acccttcctc tatataagga agttcatttc atttggagag aacacggggg 9600

actctagaat gaaaaagcct gaactcaccg cgacgtctgt cgagaagttt ctgatcgaaa 9660

agttcgacag cgtctccgac ctgatgcagc tctcggaggg cgaagaatct cgtgctttca 9720

gcttcgatgt aggagggcgt ggatatgtcc tgcgggtaaa tagctgcgcc gatggtttct 9780

acaaagatcg ttatgtttat cggcactttg catcggccgc gctcccgatt ccggaagtgc 9840

ttgacattgg ggagtttagc gagagcctga cctattgcat ctcccgccgt tcacagggtg 9900

tcacgttgca agacctgcct gaaaccgaac tgcccgctgt tctacaaccg gtcgcggagg 9960

ctatggatgc gatcgctgcg gccgatctta gccagacgag cgggttcggc ccattcggac 10020

cgcaaggaat cggtcaatac actacatggc gtgatttcat atgcgcgatt gctgatcccc 10080

atgtgtatca ctggcaaact gtgatggacg acaccgtcag tgcgtccgtc gcgcaggctc 10140

tcgatgagct gatgctttgg gccgaggact gccccgaagt ccggcacctc gtgcacgcgg 10200

atttcggctc caacaatgtc ctgacggaca atggccgcat aacagcggtc attgactgga 10260

gcgaggcgat gttcggggat tcccaatacg aggtcgccaa catcttcttc tggaggccgt 10320

ggttggcttg tatggagcag cagacgcgct acttcgagcg gaggcatccg gagcttgcag 10380

gatcgccacg actccgggcg tatatgctcc gcattggtct tgaccaactc tatcagagct 10440

tggttgacgg caatttcgat gatgcagctt gggcgcaggg tcgatgcgac gcaatcgtcc 10500

gatccggagc cgggactgtc gggcgtacac aaatcgcccg cagaagcgcg gccgtctgga 10560

ccgatggctg tgtagaagta ctcgccgata gtggaaaccg acgccccagc actcgtccga 10620

gggcaaagaa ataggagctc tgggctaatc taaaacgatt tatctgtggc ttcaagtgta 10680

tcgatcactt atgtgaggtg taattactgg tgtttttggt gtgctctggt tcctttcaag 10740

tgtgttgttg ccgctcgaac tactccgcta tgtaaaacgg taaaacctgt tgtctcatta 10800

tgaaagtgaa ctatattatg ttctactact actctactta gtcaattttc ttcaccttga 10860

ttagtgtaaa tatgaatctt atattcttat gtcttaagaa attagcacat gtgaagcctc 10920

caagtgcata ttttctcgat cgcgagacgc acaatgcgtg agaaattcag ctggttatac 10980

tcaaatatat taatatatct agcagcagct catggagatt caggaaactt ggcatcccta 11040

atccctacca tttccattct tccgagattg acagttcaat acaagtacag taatctcctg 11100

gtaagtttct tattaacttg acatgtagta gtaataattt gtacgtagca tagatacata 11160

gacacaaaaa tgtcctcccc attgagctag ccgattggag ccgaacaccg caggaatgaa 11220

tttacataat ctgcaaagaa taaatggaat gtgcctccac aggaaaacca gcggcagtgt 11280

ggcgttttca agagcagccg taagtcgaag cctattctga atcgtagaaa tcactggggc 11340

atggtgtaat tacatccgac tccaacatct gtaccaccct gtgcattgta ggccgctcct 11400

ctggcaaaga acttacacat tgtttagcaa gagaaagtag agcatccaag gtctcaatct 11460

gcactccctc acaatatgga tcgacaattt ccctctcccg attctcaccg accaggaaat 11520

tcaactgcca cagagcaagt agattatttc aagaatacat taaatcaatt gaaggcatac 11580

gtaattcata tcagaaaact gtggatatga aatggaagga cataaaggtc atacataccc 11640

atccaacaat gttcaatccc ttttcaataa atgatgcatc agtaggtcgt tttccgctta 11700

gtatttcaag tagcaaaact ccaaaactgt agacgtcagt cttttcggtg gctctgccac 11760

tttgcatata ctcctgcagg tcgaccatag tgactggata tgttgtgttt tacagtatta 11820

tgtagtctgt tttttatgca aaatctaatt taatatattg atatttatat cattttacgt 11880

ttctcgttca gctttcttgt acaaagtggt gatatcccgc ggaaatacgt agaattcggg 11940

aagcttggca ctggccgtcg ttttacaacg tcgtgactgg gaaaaccctg gcgttaccca 12000

acttaatcgc cttgcagcac atcccccttt cgccagctgg cgtaatagcg aagaggcccg 12060

caccgatcgc ccttcccaac agttgcgcag cctgaatggc gaatgctaga gcaattcggc 12120

gttaattcag tacattaaaa acgtccgcaa tgtgttatta agttgtctaa gcgtcaattt 12180

gtttacacca caatatatcc tgccaccagc cagccaacag ctccccgacc ggcagctcgg 12240

cacaaaatca ccactcgata caggcagccc atcagtccgg gacggcgtca gcgggagagc 12300

cgttgtaagg cggcagactt tgctcatgtt accgatgcta ttcggaagaa cggcaactaa 12360

gctgccgggt ttgaaacacg gatgatctcg cggagggtag catgttgatt gtaacgatga 12420

cagagcgttg ctgcctgtga tcaattcggg cacgaaccca gtggacataa gcctcgttcg 12480

gttcgtaagc tgtaatgcaa gtagcgtaac tgccgtcacg caactggtcc agaaccttga 12540

ccgaacgcag cggtggtaac ggcgcagtgg cggttttcat ggcttcttgt tatgacatgt 12600

ttttttgggg tacagtctat gcctcgggca tccaagcagc aagcgcgtta cgccgtgggt 12660

cgatgtttga tgttatggag cagcaacgat gttacgcagc agggcagtcg ccctaaaaca 12720

aagttaaaca tcatggggga agcggtgatc gccgaagtat cgactcaact atcagaggta 12780

gttggcgtca tcgagcgcca tctcgaaccg acgttgctgg ccgtacattt gtacggctcc 12840

gcagtggatg gcggcctgaa gccacacagt gatattgatt tgctggttac ggtgaccgta 12900

aggcttgatg aaacaacgcg gcgagctttg atcaacgacc ttttggaaac ttcggcttcc 12960

cctggagaga gcgagattct ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc 13020

attccgtggc gttatccagc taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac 13080

attcttgcag gtatcttcga gccagccacg atcgacattg atctggctat cttgctgaca 13140

aaagcaagag aacatagcgt tgccttggta ggtccagcgg cggaggaact ctttgatccg 13200

gttcctgaac aggatctatt tgaggcgcta aatgaaacct taacgctatg gaactcgccg 13260

cccgactggg ctggcgatga gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc 13320

gcagtaaccg gcaaaatcgc gccgaaggat gtcgctgccg actgggcaat ggagcgcctg 13380

ccggcccagt atcagcccgt catacttgaa gctagacagg cttatcttgg acaagaagaa 13440

gatcgcttgg cctcgcgcgc agatcagttg gaagaatttg tccactacgt gaaaggcgag 13500

atcaccaagg tagtcggcaa ataatgtcta gctagaaatt cgttcaagcc gacgccgctt 13560

cgccggcgtt aaatcaagcg attagatgca ctaagcacat aattgctcac agccaaacta 13620

tcaggtcaag tctgctttta ttatttttaa gcgtgcataa taagccctac acaaattggg 13680

agatatatca tgcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 13740

ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 13800

cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 13860

aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtccttct 13920

agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 13980

tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 14040

ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 14100

cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 14160

atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 14220

ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 14280

tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 14340

gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 14400

gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 14460

cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 14520

gagcgaggaa gcggaagagc gcctgatgcg gtattttctc cttacgcatc tgtgcggtat 14580

ttcacaccgc atatggtgca ctctcagtac aatctgctct gatgccgcat agttaagcca 14640

gtatacactc cgctatcgct acgtgactgg gtcatggctg cgccccgaca cccgccaaca 14700

cccgctgacg cgccctgacg ggcttgtctg ctcccggcat ccgcttacag acaagctgtg 14760

accgtctccg ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa acgcgcgagg 14820

cagggtgcct tgatgtgggc gccggcggtc gagtggcgac ggcgcggctt gtccgcgccc 14880

tggtagattg cctggccgta ggccagccat ttttgagcgg ccagcggccg cgataggccg 14940

acgcgaagcg gcggggcgta gggagcgcag cgaccgaagg gtaggcgctt tttgcagctc 15000

ttcggctgtg cgctggccag acagttatgc acaggccagg cgggttttaa gagttttaat 15060

aagttttaaa gagttttagg cggaaaaatc gccttttttc tcttttatat cagtcactta 15120

catgtgtgac cggttcccaa tgtacggctt tgggttccca atgtacgggt tccggttccc 15180

aatgtacggc tttgggttcc caatgtacgt gctatccaca ggaaagagac cttttcgacc 15240

tttttcccct gctagggcaa tttgccctag catctgctcc gtacattagg aaccggcgga 15300

tgcttcgccc tcgatcaggt tgcggtagcg catgactagg atcgggccag cctgccccgc 15360

ctcctccttc aaatcgtact ccggcaggtc atttgacccg atcagcttgc gcacggtgaa 15420

acagaacttc ttgaactctc cggcgctgcc actgcgttcg tagatcgtct tgaacaacca 15480

tctggcttct gccttgcctg cggcgcggcg tgccaggcgg tagagaaaac ggccgatgcc 15540

gggatcgatc aaaaagtaat cggggtgaac cgtcagcacg tccgggttct tgccttctgt 15600

gatctcgcgg tacatccaat cagctagctc gatctcgatg tactccggcc gcccggtttc 15660

gctctttacg atcttgtagc ggctaatcaa ggcttcaccc tcggataccg tcaccaggcg 15720

gccgttcttg gccttcttcg tacgctgcat ggcaacgtgc gtggtgttta accgaatgca 15780

ggtttctacc aggtcgtctt tctgctttcc gccatcggct cgccggcaga acttgagtac 15840

gtccgcaacg tgtggacgga acacgcggcc gggcttgtct cccttccctt cccggtatcg 15900

gttcatggat tcggttagat gggaaaccgc catcagtacc aggtcgtaat cccacacact 15960

ggccatgccg gccggccctg cggaaacctc tacgtgcccg tctggaagct cgtagcggat 16020

cacctcgcca gctcgtcggt cacgcttcga cagacggaaa acggccacgt ccatgatgct 16080

gcgactatcg cgggtgccca cgtcatagag catcggaacg aaaaaatctg gttgctcgtc 16140

gcccttgggc ggcttcctaa tcgacggcgc accggctgcc ggcggttgcc gggattcttt 16200

gcggattcga tcagcggccg cttgccacga ttcaccgggg cgtgcttctg cctcgatgcg 16260

ttgccgctgg gcggcctgcg cggccttcaa cttctccacc aggtcatcac ccagcgccgc 16320

gccgatttgt accgggccgg atggtttgcg accgtcacgc cgattcctcg ggcttggggg 16380

ttccagtgcc attgcagggc cggcagacaa cccagccgct tacgcctggc caaccgcccg 16440

ttcctccaca catggggcat tccacggcgt cggtgcctgg ttgttcttga ttttccatgc 16500

cgcctccttt agccgctaaa attcatctac tcatttattc atttgctcat ttactctggt 16560

agctgcgcga tgtattcaga tagcagctcg gtaatggtct tgccttggcg taccgcgtac 16620

atcttcagct tggtgtgatc ctccgccggc aactgaaagt tgacccgctt catggctggc 16680

gtgtctgcca ggctggccaa cgttgcagcc ttgctgctgc gtgcgctcgg acggccggca 16740

cttagcgtgt ttgtgctttt gctcattttc tctttacctc attaactcaa atgagttttg 16800

atttaatttc agcggccagc gcctggacct cgcgggcagc gtcgccctcg ggttctgatt 16860

caagaacggt tgtgccggcg gcggcagtgc ctgggtagct cacgcgctgc gtgatacggg 16920

actcaagaat gggcagctcg tacccggcca gcgcctcggc aacctcaccg ccgatgcgcg 16980

tgcctttgat cgcccgcgac acgacaaagg ccgcttgtag ccttccatcc gtgacctcaa 17040

tgcgctgctt aaccagctcc accaggtcgg cggtggccca tatgtcgtaa gggcttggct 17100

gcaccggaat cagcacgaag tcggctgcct tgatcgcgga cacagccaag tccgccgcct 17160

ggggcgctcc gtcgatcact acgaagtcgc gccggccgat ggccttcacg tcgcggtcaa 17220

tcgtcgggcg gtcgatgccg acaacggtta gcggttgatc ttcccgcacg gccgcccaat 17280

cgcgggcact gccctgggga tcggaatcga ctaacagaac atcggccccg gcgagttgca 17340

gggcgcgggc tagatgggtt gcgatggtcg tcttgcctga cccgcctttc tggttaagta 17400

cagcgataac cttcatgcgt tccccttgcg tatttgttta tttactcatc gcatcatata 17460

cgcagcgacc gcatgacgca agctgtttta ctcaaataca catcaccttt ttagacggcg 17520

gcgctcggtt tcttcagcgg ccaagctggc cggccaggcc gccagcttgg catcagacaa 17580

accggccagg atttcatgca gccgcacggt tgagacgtgc gcgggcggct cgaacacgta 17640

cccggccgcg atcatctccg cctcgatctc ttcggtaatg aaaaacggtt cgtcctggcc 17700

gtcctggtgc ggtttcatgc ttgttcctct tggcgttcat tctcggcggc cgccagggcg 17760

tcggcctcgg tcaatgcgtc ctcacggaag gcaccgcgcc gcctggcctc ggtgggcgtc 17820

acttcctcgc tgcgctcaag tgcgcggtac agggtcgagc gatgcacgcc aagcagtgca 17880

gccgcctctt tcacggtgcg gccttcctgg tcgatcagct cgcgggcgtg cgcgatctgt 17940

gccggggtga gggtagggcg ggggccaaac ttcacgcctc gggccttggc ggcctcgcgc 18000

ccgctccggg tgcggtcgat gattagggaa cgctcgaact cggcaatgcc ggcgaacacg 18060

gtcaacacca tgcggccggc cggcgtggtg gtgtcggccc acggctctgc caggctacgc 18120

aggcccgcgc cggcctcctg gatgcgctcg gcaatgtcca gtaggtcgcg ggtgctgcgg 18180

gccaggcggt ctagcctggt cactgtcaca acgtcgccag ggcgtaggtg gtcaagcatc 18240

ctggccagct ccgggcggtc gcgcctggtg ccggtgatct tctcggaaaa cagcttggtg 18300

cagccggccg cgtgcagttc ggcccgttgg ttggtcaagt cctggtcgtc ggtgctgacg 18360

cgggcatagc ccagcaggcc agcggcggcg ctcttgttca tggcgtaatg tctccggttc 18420

tagtcgcaag tattctactt tatgcgacta aaacacgcga caagaaaacg ccaggaaaag 18480

ggcagggcgg cagcctgtcg cgtaacttag gacttgtgcg acatgtcgtt ttcagaagac 18540

ggctgcactg aacgtcagaa gccgactgca ctatagcagc ggaggggttg gatcaaagta 18600

ctttgatccc gaggggaacc ctgtggttgg catgcacata caaatggacg aacggataaa 18660

ccttttcacg cccttttaaa tatccgttat tctaa 18695

<210> 12

<211> 18695

<212> DNA

<213> 人工序列

<220>

<223> 2409的完整核苷酸序列。

<400> 12

taaacgctct tttctcttag gtttacccgc caatatatcc tgtcaaacac tgatagttta 60

aactgaaggc gggaaacgac aatctgatcc aagctcaagc tccaatacgc aaaccgcctc 120

tccccgcgcg ttggccgatt cattaatgca gctggcacga caggtttccc gactggaaag 180

cgggcagtga gcgcaacgca attaatgtga gttagctcac tcattaggca ccccaggctt 240

tacactttat gcttccggct cgtatgttgt gtggaattgt gagcggataa caatttcaca 300

caggaaacag ctatgaccat gattacgaat ttcaggtgac tgatagtgac ctgttcgttg 360

caacaaattg atgagcaatg cttttttata atgccaactt tgtacaaaaa agcaggcggc 420

gcgtcctgca ggatagggat aacagggtaa tggcgcgcca agcttatcga taccgtcgac 480

ctcgagcggc cgccagtgtg atggatatct gcagaattgc ccttcgaagg gacaaaaaaa 540

gcaccgactc ggtgccactt tttcaagttg ataacggact agccttattt taacttgcta 600

tttctagctc taaaacgccc agttggaatg taggtgcaac acaagcgaca gcgcgcgggt 660

ttataagttg gtcgcgttcg agttagctgg gcaatgtggt actaaactgt tcctcccgcc 720

tctcgcgctc acactcgccc tgtgggccgc tcaccgtgca cgtacttggg cctcccgctc 780

ccccgcatgc atccagccca tcacagcgaa gagaatcggg cttttcttct ccccatctcc 840

ctacacaacc accaaataca gccaggccgt tggttcatga tccaagggca attccagcac 900

actggcggcc gttactagtg gatccgagct cggtacctta attaaattac cctgttatcc 960

ctatcctgca ggattaacac ccaacttttc tatccaagct tgccaacatg gtggagcacg 1020

acactctcgt ctactccaag aatatcaaag atacagtctc agaagaccaa agggctattg 1080

agacttttca acaaagggta atatcgggaa acctcctcgg attccattgc ccagctatct 1140

gtcacttcat caaaaggaca gtagaaaagg aaggtggcac ctacaaatgc catcattgcg 1200

ataaaggaaa ggctatcgtt caagatgcct ctgccgacag tggtcccaaa gatggacccc 1260

cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 1320

attgatgtga taacatggtg gagcacgaca ctctcgtcta ctccaagaat atcaaagata 1380

cagtctcaga agaccaaagg gctattgaga cttttcaaca aagggtaata tcgggaaacc 1440

tcctcggatt ccattgccca gctatctgtc acttcatcaa aaggacagta gaaaaggaag 1500

gtggcaccta caaatgccat cattgcgata aaggaaaggc tatcgttcaa gatgcctctg 1560

ccgacagtgg tcccaaagat ggacccccac ccacgaggag catcgtggaa aaagaagacg 1620

ttccaaccac gtcttcaaag caagtggatt gatgtgatat ctccactgac gtaagggatg 1680

acgcacaatc ccactatcct tcgcaagacc cttcctctat ataaggaagt tcatttcatt 1740

tggagaggcc ggtctagaga attccaagca acgaactgcg agtgattcaa gaaaaaagaa 1800

aacctgagct ttcgatctct acggagtggt ttcttgttct ttgaaaaaga gggggattac 1860

atatggctcc taagaagaag cggaaggttg gtattcacgg ggtgcctgcg gctatggaca 1920

agaagtactc gatcgggctg gccatcggaa caaattctgt aggctgggct gtaataaccg 1980

atgagtacaa ggtgccctct aaaaaattta aggtccttgg caatacggat agacattcca 2040

taaagaagaa tcttatcggt gcgctgctct ttgacagcgg cgagaccgcg gaggcgaccc 2100

ggttgaaacg caccgcgaga cgccgttaca caaggcgtaa gaatagaatc tgttatctcc 2160

aggagatatt ctctaatgaa atggcgaagg tagacgattc cttctttcac cgtctggagg 2220

aaagttttct cgttgaggaa gataagaaac atgaaagaca cccgatcttc ggaaacattg 2280

tcgacgaggt cgcttatcat gaaaagtacc ctaccatcta ccatcttaga aagaaacttg 2340

ttgacagcac ggataaggct gatctcaggc tgatatacct ggctctggca catatgatta 2400

agttcagagg gcatttcctt atcgaaggcg acctgaatcc agataattca gatgtagaca 2460

agctcttcat tcaacttgtg cagacttata atcagctctt cgaagaaaat ccaataaacg 2520

cgtcgggtgt agacgcaaag gccatactgt ccgctaggct ttctaagtca cgtagacttg 2580

agaatctcat tgcccaactc cccggcgaga agaagaacgg cttgtttgga aatctgatag 2640

cgctgtccct gggtcttaca ccaaatttca agagtaattt cgatttggca gaagatgcta 2700

agttgcagct cagtaaagac acctacgatg acgatcttga taatttgttg gctcagattg 2760

gcgatcagta tgcagatctt ttcttggccg ctaagaattt gtctgatgca attctgctta 2820

gcgacatttt gagggttaat acagaaatca ccaaggcacc cttgtcggcg tcaatgataa 2880

agaggtatga tgagcaccac caagacctga cgctcctcaa ggctcttgtt cggcagcaat 2940

tgccggagaa gtacaaagag atcttcttcg accagtctaa gaacggatat gcgggctaca 3000

tagacggtgg agcgagtcag gaggaattct acaagttcat aaagcccatt ctcgagaaga 3060

tggatggtac ggaagaactg cttgtgaaac ttaacagaga agatcttttg cggaagcaga 3120

gaactttcga caacggaagt ataccacacc agatacatct cggagagctt catgctattc 3180

tcagaagaca agaggatttc taccctttct tgaaggataa cagagaaaag atagagaaga 3240

tcctcacgtt taggatccct tactacgtag gtcctcttgc tcgcggcaat agtaggttcg 3300

cctggatgac ccgcaagtct gaagaaacta tcaccccttg gaatttcgaa gaggttgtag 3360

acaaaggtgc ttcagcacag agtttcattg agaggatgac caacttcgac aagaacctcc 3420

ccaacgaaaa ggtcctgcct aagcacagcc tcctctacga atactttact gtctataatg 3480

agcttacaaa agttaagtac gtgacagagg gaatgcggaa gcccgcattc ctttccggag 3540

aacaaaagaa ggcgatcgtg gatcttctct tcaagacgaa ccgcaaggtg acggttaaac 3600

agttgaagga agattacttc aagaagatag aatgttttga tagcgtggaa atcagcggcg 3660

tcgaagatag gttcaacgct tccctgggaa cgtaccacga tctcctcaag attatcaaag 3720

ataaggactt tcttgataac gaagagaatg aggacatctt ggaagacatt gttctgacgc 3780

tcaccctgtt cgaagatcgc gagatgattg aggaacgctt gaagacctac gcacacctgt 3840

tcgatgacaa ggttatgaag caacttaaac ggcgccggta tacgggctgg ggacggcttt 3900

cgcggaagct gataaatgga atccgtgaca agcagtctgg caagacaata ctcgacttct 3960

tgaagtcgga tggttttgcc aatagaaatt ttatgcaact cattcatgat gactcgctta 4020

cttttaagga ggacatccag aaggcccagg tatcaggaca gggtgactct ttgcacgaac 4080

acatcgcgaa cctggcgggc tcccccgcga ttaagaaggg aattttgcag actgtcaagg 4140

tggtcgatga actcgtgaag gttatgggac gtcataagcc ggaaaatatt gtgattgaga 4200

tggctcgcga gaatcaaaca acacagaagg gccaaaagaa cagtagagaa cgcatgaagc 4260

gcatcgaaga gggcatcaaa gagctgggca gtcagatcct taaagaacat ccagtcgaga 4320

atacacagct tcagaacgaa aagctgtacc tttattacct tcaaaatggg cgtgatatgt 4380

atgtggatca ggaactcgat atcaataggc tgagtgacta tgatgtcgac catatcgtcc 4440

cgcaaagttt cctcaaggac gacagtatag acaacaaagt tctcacacgg tcagataaga 4500

atcgcggcaa gagcgataat gtaccgtcgg aggaggtagt caagaagatg aagaattact 4560

ggcgccagtt gctcaacgcc aagctcatca ctcagaggaa atttgacaac cttacgaaag 4620

ccgagcgggg cggactctct gaactggaca aggccggttt cataaagcgc cagctcgttg 4680

agacacgtca aattactaag cacgtcgctc aaatattgga ttcccgcatg aatactaagt 4740

acgatgagaa tgataagctc atacgtgaag ttaaggtcat tactctcaag tccaagcttg 4800

tatcggactt ccgtaaggac ttccaattct acaaggtccg ggaaatcaat aattatcacc 4860

atgcccatga cgcttatctg aacgcggtcg tgggcacggc actcattaag aaatacccaa 4920

aacttgagtc agaatttgtt tacggggact ataaagttta tgacgtgcgg aagatgatag 4980

cgaagtcgga acaagagata ggaaaggcga ctgcaaagta ctttttttac tccaacataa 5040

tgaatttctt taagaccgaa ataacccttg caaacggtga aatcagaaag cggcctctga 5100

ttgaaacaaa tggcgagacg ggcgagatcg tctgggacaa ggggagggac ttcgcaacgg 5160

ttcgcaaggt ccttagcatg ccgcaagtaa atatagttaa gaagacggaa gttcagaccg 5220

gcggctttag taaagaaagc atacttccta aaaggaattc cgacaaactg atagcgcgca 5280

agaaggactg ggatccaaag aagtatggag gatttgactc cccaaccgtt gcttatagcg 5340

tgttggtagt agccaaggtg gaaaagggta agtctaagaa attgaagtcg gtgaaggagt 5400

tgttggggat aactataatg gagcggagtt cgttcgagaa gaacccaatt gactttctcg 5460

aagccaaagg ctacaaggag gtcaagaagg acctgattat taagttgcca aagtactcgc 5520

tcttcgaact cgagaacggg agaaagcgta tgctggcgtc ggcgggcgag ctgcagaaag 5580

gaaacgagct ggctttgcca tcgaaatacg taaatttcct gtacctcgcc tcacattatg 5640

agaagcttaa agggtctcca gaagacaatg aacagaagca gctgtttgtt gaacagcaca 5700

agcactactt ggacgagatt atagaacaaa tctccgagtt ctctaaacgg gttatccttg 5760

cagacgccaa tttggataag gtcctctcgg cttataataa gcatagagat aagccaatcc 5820

gggagcaggc tgaaaatatc atacacctct ttacgttgac taatttgggt gcgccagcgg 5880

cattcaagta cttcgataca acaatcgatc gtaagcgcta cacaagcact aaggaagtcc 5940

tggacgcgac gctgatacac cagtccatta ctggactgta tgaaaccaga atagatctta 6000

gccagctcgg cggtgatgga ggagggccta gggctgatcc taagaagaag aggaaggttg 6060

gaggagggcc aggagcagag tatgttagag cgttgtttga ttttaacggt aacgatgaag 6120

aggatttacc ctttaagaaa ggcgacattc tcaggattag ggataaacct gaagagcaat 6180

ggtggaatgc tgaggatagt gaaggcaaac gaggaatgat tttagtgccg tatgtggaga 6240

aatattcggg tgactacaaa gatcatgatg gtgattacaa agaccatgac atcgactaca 6300

aggatgatga tgataagtca gggatgacag atgctgaata tgtcagaatc cacgaaaagt 6360

tggacattta cacgtttaag aagcagttct tcaacaacaa gaaatctgtt tcgcataggt 6420

gctatgtgct tttcgaacta aaacgtcgtg gagaaagacg ggcttgcttt tggggttacg 6480

cggttaacaa accacaatca ggtactgaac gaggaataca cgctgaaatc ttttctatcc 6540

gaaaggttga ggaatatcta cgtgacaatc ctggacagtt cactatcaat tggtattcta 6600

gctggtcacc atgtgcagat tgtgctgaga agattctcga atggtacaat caagagctta 6660

gaggcaatgg acatacattg aaaatatggg catgcaagct ctactacgaa aagaatgcca 6720

gaaaccaaat tgggctttgg aacttgaggg ataatggagt tgggcttaat gtcatggttt 6780

ctgagcacta tcaatgttgt cggaagatct tcatacaaag ttcccataac cagttgaatg 6840

agaacagatg gttagagaaa acccttaaaa gagccgagaa gagaagatcc gaactgagca 6900

ttatgataca ggtcaaaatt ctgcatacca ctaagagtcc agctgtaggt cctaagaaga 6960

aacgtaaagt agggccctga tccaggcctc ccagctttcg tccgtatcat cggtttcgac 7020

aacgttcgtc aagttcaatg catcagtttc attgcccaca caccagaatc ctactaagtt 7080

tgagtattat ggcattggaa aagctgtttt cttctatcat ttgttctgct tgtaatttac 7140

tgtgttcttt cagtttttgt tttcggacat caaaatgcaa atggatggat aagagttaat 7200

aaatgatatg gtccttttgt tcattctcaa attattatta tctgttgttt ttactttaat 7260

gggttgaatt taagtaagaa aggaactaac agtgtgatat taaggtgcaa tgttagacat 7320

ataaaacagt ctttcacctc tctttggtta tgtcttgaat tggtttgttt cttcacttat 7380

ctgtgtaatc aagtttacta tgagtctatg atcaagtaat tatgcaatca agttaagtac 7440

agtataggct tgagctccct aggcccctag gtaattcttc ggacccaaga atgctaagcc 7500

aagaggagct gttatcgccg tcctcctgct tgtttctctc tttttgttgc tgtttcttca 7560

ttagcgtgga caaagttttc aaccggccta tctgttatca ttttcttcta ttcaaagact 7620

gtaataccta ttgctacctg tggttctcac ttgtgatttt ggacacatat gttcggttta 7680

ttcaaattta atcagatgcc tgatgagggt accagaaaaa atacgtgttc tggttgtttt 7740

tgagttgcga ttattctatg aaatgaataa catcgaagtt atcatcccag tattttcgca 7800

tgaatgttct tttcttctgt cttgtgcatc agtgatctag tgcatgggag tttgtattgt 7860

gatgttcgac atcacgtaac ttccactttg cctttgctgt tcgatatttt aatgacatgt 7920

cacacacact tctgatactt ttctttcttg gctattgtgc cagcatgatg caagatgcat 7980

cacagcatca gatatattct catcgtcagg ctttagcagc acacgagcac gctttgccgc 8040

ttaaaagttg tacggcgcag cttagacatc ccctgtagaa gtgataatct tttcactttt 8100

ccttaaacaa attgagaggg gaaatggaac catgtggatc agagaagctt ttgtttcttt 8160

acacaagaat atttggtaca gtgggggtcc tatgttcgtg ggttcgtggc ttggctgcct 8220

gtcttcaacc aagtgttttc agttcaacat gttagcgtgt agaaagagca caattctgtt 8280

tatctccaag gtaaaatgtg gcattctgtt aaagaacatg atcctgccaa ttttttaagt 8340

ttcaatggaa gaggaatgta aagctttcta tggtttgtgt acacaacaca gtggaagagg 8400

agtgcaagct ttctatggtt tgtgtgcgcg ttgtgtgtca gcacttcaat tttgttagaa 8460

aatgaaagaa aaaaaaggat gatcatgctt atagtaaatc actctttttc ctcgccttct 8520

gtacgttttg acttgacaag attttaaaat ctgtacatga cctttgtttt aaaattactt 8580

tatgtatttc catctttcaa gttatgcaga tgtcatcaca aattgttaca ccaatcacca 8640

ggctggctgt ttatatatta tcagaccagg ctatatagag tatactatac taactgttca 8700

tattatctgg aaatcttgct tgctacttga gcggtaaaag ggtatagata tgagggtccc 8760

cagattagcc ttttcaattt cagaaagaat gctaacccac agatggttag agaggcttac 8820

gcagcaggtc tcatcaagac gatctacccg agcaataatc tccaggaaat caaatacctt 8880

cccaagaagg ttaaagatgc agtcaaaaga ttcaggacta actgcatcaa gaacacagag 8940

aaagatatat ttctcaagat cagaagtact attccagtat ggacgattca aggcttgctt 9000

cacaaaccaa ggcaagtaat agagattgga gtctctaaaa aggtagttcc cactgaatca 9060

aaggccatgg agtcaaagat tcaaatagag gacctaacag aactcgccgt aaagactggc 9120

gaacagttca tacagagtct cttacgactc aatgacaaga agaaaatctt cgtcaacatg 9180

gtggagcacg acacacttgt ctactccaaa aatatcaaag atacagtctc agaagaccaa 9240

agggcaattg agacttttca acaaagggta atatccggaa acctcctcgg attccattgc 9300

ccagctatct gtcactttat tgtgaagata gtggaaaagg aaggtggctc ctacaaatgc 9360

catcattgcg ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa 9420

gatggacccc cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca 9480

aagcaagtgg attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat 9540

ccttcgcaag acccttcctc tatataagga agttcatttc atttggagag aacacggggg 9600

actctagaat gaaaaagcct gaactcaccg cgacgtctgt cgagaagttt ctgatcgaaa 9660

agttcgacag cgtctccgac ctgatgcagc tctcggaggg cgaagaatct cgtgctttca 9720

gcttcgatgt aggagggcgt ggatatgtcc tgcgggtaaa tagctgcgcc gatggtttct 9780

acaaagatcg ttatgtttat cggcactttg catcggccgc gctcccgatt ccggaagtgc 9840

ttgacattgg ggagtttagc gagagcctga cctattgcat ctcccgccgt tcacagggtg 9900

tcacgttgca agacctgcct gaaaccgaac tgcccgctgt tctacaaccg gtcgcggagg 9960

ctatggatgc gatcgctgcg gccgatctta gccagacgag cgggttcggc ccattcggac 10020

cgcaaggaat cggtcaatac actacatggc gtgatttcat atgcgcgatt gctgatcccc 10080

atgtgtatca ctggcaaact gtgatggacg acaccgtcag tgcgtccgtc gcgcaggctc 10140

tcgatgagct gatgctttgg gccgaggact gccccgaagt ccggcacctc gtgcacgcgg 10200

atttcggctc caacaatgtc ctgacggaca atggccgcat aacagcggtc attgactgga 10260

gcgaggcgat gttcggggat tcccaatacg aggtcgccaa catcttcttc tggaggccgt 10320

ggttggcttg tatggagcag cagacgcgct acttcgagcg gaggcatccg gagcttgcag 10380

gatcgccacg actccgggcg tatatgctcc gcattggtct tgaccaactc tatcagagct 10440

tggttgacgg caatttcgat gatgcagctt gggcgcaggg tcgatgcgac gcaatcgtcc 10500

gatccggagc cgggactgtc gggcgtacac aaatcgcccg cagaagcgcg gccgtctgga 10560

ccgatggctg tgtagaagta ctcgccgata gtggaaaccg acgccccagc actcgtccga 10620

gggcaaagaa ataggagctc tgggctaatc taaaacgatt tatctgtggc ttcaagtgta 10680

tcgatcactt atgtgaggtg taattactgg tgtttttggt gtgctctggt tcctttcaag 10740

tgtgttgttg ccgctcgaac tactccgcta tgtaaaacgg taaaacctgt tgtctcatta 10800

tgaaagtgaa ctatattatg ttctactact actctactta gtcaattttc ttcaccttga 10860

ttagtgtaaa tatgaatctt atattcttat gtcttaagaa attagcacat gtgaagcctc 10920

caagtgcata ttttctcgat cgcgagacgc acaatgcgtg agaaattcag ctggttatac 10980

tcaaatatat taatatatct agcagcagct catggagatt caggaaactt ggcatcccta 11040

atccctacca tttccattct tccgagattg acagttcaat acaagtacag taatctcctg 11100

gtaagtttct tattaacttg acatgtagta gtaataattt gtacgtagca tagatacata 11160

gacacaaaaa tgtcctcccc attgagctag ccgattggag ccgaacaccg caggaatgaa 11220

tttacataat ctgcaaagaa taaatggaat gtgcctccac aggaaaacca gcggcagtgt 11280

ggcgttttca agagcagccg taagtcgaag cctattctga atcgtagaaa tcactggggc 11340

atggtgtaat tacatccgac tccaacatct gtaccaccct gtgcattgta ggccgctcct 11400

ctggcaaaga acttacacat tgtttagcaa gagaaagtag agcatccaag gtctcaatct 11460

gcactccctc acaatatgga tcgacaattt ccctctcccg attctcaccg accaggaaat 11520

tcaactgcca cagagcaagt agattatttc aagaatacat taaatcaatt gaaggcatac 11580

gtaattcata tcagaaaact gtggatatga aatggaagga cataaaggtc atacataccc 11640

atccaacaat gttcaatccc ttttcaataa atgatgcatc agtaggtcgt tttccgctta 11700

gtatttcaag tagcaaaact ccaaaactgt agacgtcagt cttttcggtg gctctgccac 11760

tttgcatata ctcctgcagg tcgaccatag tgactggata tgttgtgttt tacagtatta 11820

tgtagtctgt tttttatgca aaatctaatt taatatattg atatttatat cattttacgt 11880

ttctcgttca gctttcttgt acaaagtggt gatatcccgc ggaaatacgt agaattcggg 11940

aagcttggca ctggccgtcg ttttacaacg tcgtgactgg gaaaaccctg gcgttaccca 12000

acttaatcgc cttgcagcac atcccccttt cgccagctgg cgtaatagcg aagaggcccg 12060

caccgatcgc ccttcccaac agttgcgcag cctgaatggc gaatgctaga gcaattcggc 12120

gttaattcag tacattaaaa acgtccgcaa tgtgttatta agttgtctaa gcgtcaattt 12180

gtttacacca caatatatcc tgccaccagc cagccaacag ctccccgacc ggcagctcgg 12240

cacaaaatca ccactcgata caggcagccc atcagtccgg gacggcgtca gcgggagagc 12300

cgttgtaagg cggcagactt tgctcatgtt accgatgcta ttcggaagaa cggcaactaa 12360

gctgccgggt ttgaaacacg gatgatctcg cggagggtag catgttgatt gtaacgatga 12420

cagagcgttg ctgcctgtga tcaattcggg cacgaaccca gtggacataa gcctcgttcg 12480

gttcgtaagc tgtaatgcaa gtagcgtaac tgccgtcacg caactggtcc agaaccttga 12540

ccgaacgcag cggtggtaac ggcgcagtgg cggttttcat ggcttcttgt tatgacatgt 12600

ttttttgggg tacagtctat gcctcgggca tccaagcagc aagcgcgtta cgccgtgggt 12660

cgatgtttga tgttatggag cagcaacgat gttacgcagc agggcagtcg ccctaaaaca 12720

aagttaaaca tcatggggga agcggtgatc gccgaagtat cgactcaact atcagaggta 12780

gttggcgtca tcgagcgcca tctcgaaccg acgttgctgg ccgtacattt gtacggctcc 12840

gcagtggatg gcggcctgaa gccacacagt gatattgatt tgctggttac ggtgaccgta 12900

aggcttgatg aaacaacgcg gcgagctttg atcaacgacc ttttggaaac ttcggcttcc 12960

cctggagaga gcgagattct ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc 13020

attccgtggc gttatccagc taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac 13080

attcttgcag gtatcttcga gccagccacg atcgacattg atctggctat cttgctgaca 13140

aaagcaagag aacatagcgt tgccttggta ggtccagcgg cggaggaact ctttgatccg 13200

gttcctgaac aggatctatt tgaggcgcta aatgaaacct taacgctatg gaactcgccg 13260

cccgactggg ctggcgatga gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc 13320

gcagtaaccg gcaaaatcgc gccgaaggat gtcgctgccg actgggcaat ggagcgcctg 13380

ccggcccagt atcagcccgt catacttgaa gctagacagg cttatcttgg acaagaagaa 13440

gatcgcttgg cctcgcgcgc agatcagttg gaagaatttg tccactacgt gaaaggcgag 13500

atcaccaagg tagtcggcaa ataatgtcta gctagaaatt cgttcaagcc gacgccgctt 13560

cgccggcgtt aaatcaagcg attagatgca ctaagcacat aattgctcac agccaaacta 13620

tcaggtcaag tctgctttta ttatttttaa gcgtgcataa taagccctac acaaattggg 13680

agatatatca tgcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 13740

ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 13800

cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 13860

aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtccttct 13920

agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 13980

tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 14040

ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 14100

cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 14160

atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 14220

ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 14280

tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 14340

gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 14400

gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 14460

cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 14520

gagcgaggaa gcggaagagc gcctgatgcg gtattttctc cttacgcatc tgtgcggtat 14580

ttcacaccgc atatggtgca ctctcagtac aatctgctct gatgccgcat agttaagcca 14640

gtatacactc cgctatcgct acgtgactgg gtcatggctg cgccccgaca cccgccaaca 14700

cccgctgacg cgccctgacg ggcttgtctg ctcccggcat ccgcttacag acaagctgtg 14760

accgtctccg ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa acgcgcgagg 14820

cagggtgcct tgatgtgggc gccggcggtc gagtggcgac ggcgcggctt gtccgcgccc 14880

tggtagattg cctggccgta ggccagccat ttttgagcgg ccagcggccg cgataggccg 14940

acgcgaagcg gcggggcgta gggagcgcag cgaccgaagg gtaggcgctt tttgcagctc 15000

ttcggctgtg cgctggccag acagttatgc acaggccagg cgggttttaa gagttttaat 15060

aagttttaaa gagttttagg cggaaaaatc gccttttttc tcttttatat cagtcactta 15120

catgtgtgac cggttcccaa tgtacggctt tgggttccca atgtacgggt tccggttccc 15180

aatgtacggc tttgggttcc caatgtacgt gctatccaca ggaaagagac cttttcgacc 15240

tttttcccct gctagggcaa tttgccctag catctgctcc gtacattagg aaccggcgga 15300

tgcttcgccc tcgatcaggt tgcggtagcg catgactagg atcgggccag cctgccccgc 15360

ctcctccttc aaatcgtact ccggcaggtc atttgacccg atcagcttgc gcacggtgaa 15420

acagaacttc ttgaactctc cggcgctgcc actgcgttcg tagatcgtct tgaacaacca 15480

tctggcttct gccttgcctg cggcgcggcg tgccaggcgg tagagaaaac ggccgatgcc 15540

gggatcgatc aaaaagtaat cggggtgaac cgtcagcacg tccgggttct tgccttctgt 15600

gatctcgcgg tacatccaat cagctagctc gatctcgatg tactccggcc gcccggtttc 15660

gctctttacg atcttgtagc ggctaatcaa ggcttcaccc tcggataccg tcaccaggcg 15720

gccgttcttg gccttcttcg tacgctgcat ggcaacgtgc gtggtgttta accgaatgca 15780

ggtttctacc aggtcgtctt tctgctttcc gccatcggct cgccggcaga acttgagtac 15840

gtccgcaacg tgtggacgga acacgcggcc gggcttgtct cccttccctt cccggtatcg 15900

gttcatggat tcggttagat gggaaaccgc catcagtacc aggtcgtaat cccacacact 15960

ggccatgccg gccggccctg cggaaacctc tacgtgcccg tctggaagct cgtagcggat 16020

cacctcgcca gctcgtcggt cacgcttcga cagacggaaa acggccacgt ccatgatgct 16080

gcgactatcg cgggtgccca cgtcatagag catcggaacg aaaaaatctg gttgctcgtc 16140

gcccttgggc ggcttcctaa tcgacggcgc accggctgcc ggcggttgcc gggattcttt 16200

gcggattcga tcagcggccg cttgccacga ttcaccgggg cgtgcttctg cctcgatgcg 16260

ttgccgctgg gcggcctgcg cggccttcaa cttctccacc aggtcatcac ccagcgccgc 16320

gccgatttgt accgggccgg atggtttgcg accgtcacgc cgattcctcg ggcttggggg 16380

ttccagtgcc attgcagggc cggcagacaa cccagccgct tacgcctggc caaccgcccg 16440

ttcctccaca catggggcat tccacggcgt cggtgcctgg ttgttcttga ttttccatgc 16500

cgcctccttt agccgctaaa attcatctac tcatttattc atttgctcat ttactctggt 16560

agctgcgcga tgtattcaga tagcagctcg gtaatggtct tgccttggcg taccgcgtac 16620

atcttcagct tggtgtgatc ctccgccggc aactgaaagt tgacccgctt catggctggc 16680

gtgtctgcca ggctggccaa cgttgcagcc ttgctgctgc gtgcgctcgg acggccggca 16740

cttagcgtgt ttgtgctttt gctcattttc tctttacctc attaactcaa atgagttttg 16800

atttaatttc agcggccagc gcctggacct cgcgggcagc gtcgccctcg ggttctgatt 16860

caagaacggt tgtgccggcg gcggcagtgc ctgggtagct cacgcgctgc gtgatacggg 16920

actcaagaat gggcagctcg tacccggcca gcgcctcggc aacctcaccg ccgatgcgcg 16980

tgcctttgat cgcccgcgac acgacaaagg ccgcttgtag ccttccatcc gtgacctcaa 17040

tgcgctgctt aaccagctcc accaggtcgg cggtggccca tatgtcgtaa gggcttggct 17100

gcaccggaat cagcacgaag tcggctgcct tgatcgcgga cacagccaag tccgccgcct 17160

ggggcgctcc gtcgatcact acgaagtcgc gccggccgat ggccttcacg tcgcggtcaa 17220

tcgtcgggcg gtcgatgccg acaacggtta gcggttgatc ttcccgcacg gccgcccaat 17280

cgcgggcact gccctgggga tcggaatcga ctaacagaac atcggccccg gcgagttgca 17340

gggcgcgggc tagatgggtt gcgatggtcg tcttgcctga cccgcctttc tggttaagta 17400

cagcgataac cttcatgcgt tccccttgcg tatttgttta tttactcatc gcatcatata 17460

cgcagcgacc gcatgacgca agctgtttta ctcaaataca catcaccttt ttagacggcg 17520

gcgctcggtt tcttcagcgg ccaagctggc cggccaggcc gccagcttgg catcagacaa 17580

accggccagg atttcatgca gccgcacggt tgagacgtgc gcgggcggct cgaacacgta 17640

cccggccgcg atcatctccg cctcgatctc ttcggtaatg aaaaacggtt cgtcctggcc 17700

gtcctggtgc ggtttcatgc ttgttcctct tggcgttcat tctcggcggc cgccagggcg 17760

tcggcctcgg tcaatgcgtc ctcacggaag gcaccgcgcc gcctggcctc ggtgggcgtc 17820

acttcctcgc tgcgctcaag tgcgcggtac agggtcgagc gatgcacgcc aagcagtgca 17880

gccgcctctt tcacggtgcg gccttcctgg tcgatcagct cgcgggcgtg cgcgatctgt 17940

gccggggtga gggtagggcg ggggccaaac ttcacgcctc gggccttggc ggcctcgcgc 18000

ccgctccggg tgcggtcgat gattagggaa cgctcgaact cggcaatgcc ggcgaacacg 18060

gtcaacacca tgcggccggc cggcgtggtg gtgtcggccc acggctctgc caggctacgc 18120

aggcccgcgc cggcctcctg gatgcgctcg gcaatgtcca gtaggtcgcg ggtgctgcgg 18180

gccaggcggt ctagcctggt cactgtcaca acgtcgccag ggcgtaggtg gtcaagcatc 18240

ctggccagct ccgggcggtc gcgcctggtg ccggtgatct tctcggaaaa cagcttggtg 18300

cagccggccg cgtgcagttc ggcccgttgg ttggtcaagt cctggtcgtc ggtgctgacg 18360

cgggcatagc ccagcaggcc agcggcggcg ctcttgttca tggcgtaatg tctccggttc 18420

tagtcgcaag tattctactt tatgcgacta aaacacgcga caagaaaacg ccaggaaaag 18480

ggcagggcgg cagcctgtcg cgtaacttag gacttgtgcg acatgtcgtt ttcagaagac 18540

ggctgcactg aacgtcagaa gccgactgca ctatagcagc ggaggggttg gatcaaagta 18600

ctttgatccc gaggggaacc ctgtggttgg catgcacata caaatggacg aacggataaa 18660

ccttttcacg cccttttaaa tatccgttat tctaa 18695

<210> 13

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 13

atgcatcctg caggctctag aggatccccc ctcag 35

<210> 14

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 14

agccgggcgg ccgctttact tgtacagctc gtcca 35

<210> 15

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 15

atgaaaaagc ctgaactcac cgcgacgtct 30

<210> 16

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 16

cctcgctcca gtcaatgacc gctgttatgc 30

<210> 17

<211> 45

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 17

agtccctgca ggttaattaa cttgcgctgc gtttgtgcgg gtgcg 45

<210> 18

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 18

tgacggtacc actagttagt agtacccaat aagatcgacc gaagaga 47

<210> 19

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 19

ccgtaagaac caccagcgac accacgtcct 30

Claims

1.修饰单子叶植物细胞的双链DNA的靶向位点的方法，其包括以下步骤，使由核酸碱基转变酶和与所选择的双链DNA中的靶核苷酸序列特异性结合的核酸序列识别模块结合而成的复合体与该双链DNA接触，将该靶向位点的1个或多个核苷酸缺失或转换为其它1个或多个核苷酸，或者向该靶向位点插入1个或多个核苷酸，而在该靶向位点中不切割该双链DNA的至少一个链，其中，该双链DNA与该复合体的接触通过向该单子叶植物细胞导入编码该复合体的核酸，以及培养该单子叶植物细胞以使该复合体在细胞内表达来进行，且其中在核酸序列识别模块及核酸碱基转变酶的两末端各添加一个编码源自SV40的核定位信号的序列，其中所述核酸序列识别模块是CRISPR-Cas系统，其中Cas的至少1个DNA切割能力是失活的，且其中所述核酸碱基转变酶为胞苷脱氨酶。

2.根据权利要求1所述的方法，其中，所述培养步骤的至少一部分在与该单子叶植物细胞的最适培养温度比更低的温度下进行。

3.根据权利要求1所述的方法，其中，所述核酸序列识别模块为与指导RNA形成互补链的链的相反链的切割能力失活的CRISPR-Cas系统。

4.根据权利要求3所述的方法，其中使靶向位点的1个或多个核苷酸缺失。

5.根据权利要求1所述的方法，其中，所述胞苷脱氨酶为源自七腮鳗的PmCDA1。

6.根据权利要求1~5中任一项所述的方法，其中，编码核酸序列识别模块及核酸碱基转变酶的核酸序列针对被子植物或者单子叶植物的密码子使用而最优化。

7.根据权利要求1~5中任一项所述的方法，其中，单子叶植物为水稻、小麦或玉米。

8.根据权利要求7所述的方法，其中，单子叶植物为水稻。

9.核酸修饰酶复合体，其为核酸碱基转变酶和与单子叶植物细胞的双链DNA中的靶核苷酸序列特异性结合的核酸序列识别模块结合而成的复合体，其在该单子叶植物细胞中起作用，且使该靶向位点的1个或多个核苷酸缺失或转换为其它1个或多个核苷酸，或者向该靶向位点插入1个或多个核苷酸，而在靶向位点中不切割该双链DNA的至少一个链，且其中在核酸序列识别模块及核酸碱基转变酶的两末端各添加一个编码源自SV40的核定位信号的序列，其中所述核酸识别序列识别模块是CRISPR-Cas系统，其中Cas的至少1个DNA切割能力是失活的，且其中所述核酸碱基转变酶为胞苷脱氨酶。

10.编码权利要求9所述的核酸修饰酶复合体的核酸。

11.根据权利要求10所述的核酸，其中编码核酸序列识别模块及核酸碱基转变酶的核酸序列针对被子植物或者单子叶植物的密码子使用而最优化。