CN111471674A

CN111471674A - 特异性转变靶向dna序列的核酸碱基的基因组序列的修饰方法、及其使用的分子复合体

Info

Publication number: CN111471674A
Application number: CN202010158487.1A
Authority: CN
Inventors: 西田敬二; 近藤昭彦; 小嶋聪美
Original assignee: Kobe University NUC
Current assignee: Kobe University NUC
Priority date: 2014-03-05
Filing date: 2015-03-04
Publication date: 2020-07-31
Also published as: PT3115457T; CN111500570A; US20170073670A1; US10655123B2; JP2022191368A; US20200248174A1; JP2020167998A; EP3115457A1; CA2947941C; US11718846B2; CN111471675A; EP3115457A4; DK3115457T3; CN111500569A; CN106459957B; ES2752175T3; JP6206893B2; JP6462069B2; WO2015133554A1; EP3613854A1

Abstract

本发明涉及特异性转变靶向DNA序列的核酸碱基的基因组序列的修饰方法、及其使用的分子复合体。本发明提供一种修饰双链DNA的靶向位点的方法，其包括：使由核酸碱基转变酶、和可与选择的双链DNA中的靶核苷酸序列进行特异性结合的核酸序列识别模块连接而成的复合体，与该双链DNA接触，不切割该靶向位点中的该双链DNA的至少一条链，而使该靶向位点的1个以上的核苷酸缺失或转变为其它的1个以.上的核苷酸，或者向该靶向位点插入1个以上的核苷酸的工序。

Description

特异性转变靶向DNA序列的核酸碱基的基因组序列的修饰方法、及其使用的分子复合体

本申请是申请号为CN201580023875.6，申请日为2015年3月4日，发明名称为“用于特异性转变靶向DNA序列的核酸碱基的基因组序列的修饰方法、及其使用的分子复合体”的发明的分案申请。

技术领域

本发明涉及基因组序列的修饰方法、及其使用的核酸序列识别模块与核酸碱基转变酶的复合体，该基因组序列的修饰方法能够不伴随DNA的双链的切割(无切割或者切割一根链)也不进行外源DNA片段的插入，而修饰基因组的特定区域内的核酸碱基。

背景技术

近年来，作为在各种生物种类中修饰关注的基因、基因组区域的技术，基因组编辑受到关注。以往，作为基因组编辑的方法，提出了利用将具有序列非依赖的DNA切割能力的分子与具有序列识别能力的分子的组合的人工核酸酶的方法(非专利文献1)。

已有报告例如，使用由锌指DNA结合结构域与非特异性DNA切割结构域连接而成的锌指核酸酶(ZFN)，在作为宿主的植物细胞或昆虫细胞中，进行DNA中的靶基因座的重组的方法(专利文献1)；使用由作为植物病原菌黄单胞菌属具有的DNA结合模块的转录激活子样(TAL)效应子，与DNA核酸内切酶连接而成的TALEN，在特定的核苷酸序列内或其相邻部位进行切割、修饰靶基因的方法(专利文献2)；或者，利用由在真细菌和古细菌具有的获得性免疫系统中起作用的DNA序列CRISPR(Clustered Regularly interspaced shortpalindromic repeats)，和与CRISPR一起具有重要的作用的核酸酶Cas(CRISPR-associated)蛋白家族组合而成的CRISPR-Cas9系统的方法(专利文献3)。进一步，也报告了使用PPR蛋白质与核酸酶连接而成的人工核酸酶，在该特定序列的附近切割靶基因的方法(专利文献4)，其中，PPR蛋白质构建为使得利用串联的包括35个氨基酸的并识别1个核酸碱基的PPR基序，来识别特定的核苷酸序列。

现有技术文献

专利文献

专利文献1：日本专利第4968498号公报

专利文献2：日本特表2013-513389号公报

专利文献3：日本特表2010-519929号公报

专利文献4：日本特开2013-128413号公报

非专利文献

非专利文献1：Kelvin M Esvelt,Harris H Wang(2013)Genome-scaleengineering for systems and synthetic biology,Molecular Systems Biology 9:641

发明内容

发明要解决的问题

迄今为止提出的基因组编辑技术，基本上是以DNA双链切割(double-DNA breaks:DSB)为前提的，但由于伴随意想不到的基因组修饰，因此有强细胞毒性、染色体重排等副作用，存在诸如以下共通问题：在基因治疗中的可靠性受损、通过核苷酸修饰的细胞存活数极少、在灵长类卵细胞、单细胞微生物中基因修饰本身难以进行。

因此，本发明的目的在于，提供一种不DSB、不伴随外源DNA片段的插入，即通过不切割双链DNA或者切割一条链来修饰基因的特定序列的核酸碱基的新型基因组编辑方法，以及用于其的核酸序列识别模块及核酸碱基转变酶的复合体。

解决问题的方法

本发明人等为了解决上述课题反复进行了深入研究，结果构思了不伴随DSB，采用基于DNA碱基的转变反应的碱基转变。虽然已经知晓基于DNA碱基的脱氨基反应的碱基转变反应本身，但尚未实现用其对DNA的特定的序列进行识别而对任意部位靶向化，并通过DNA碱基的碱基转变而特异性修饰被靶向化的DNA。

因此，通过使用催化脱氨基反应的脱氨酶作为进行这样的核酸碱基转变的酶并将其与具有DNA序列识别能力的分子连接，从而在包含特定的DNA序列的区域中进行基于核酸碱基转变的基因组序列的修饰。

具体而言，使用CRISPR-Cas系统(CRISPR-突变Cas)进行。即，制作了用于编码将用于募集Cas蛋白质的RNA(反式-激活crRNA:tracrRNA)连接至包含与待修饰的基因的靶序列互补的序列的、基因组特异性CRISPR-RNA：crRNA(gRNA)而成的RNA分子的DNA。另一方面，制作了由编码双链DNA的任意一条或两条链的切割能力已失活的突变Cas蛋白质的DNA(dCas)与脱氨酶基因连接而成的DNA。将这些DNA导入包含待修饰的基因的宿主酵母细胞。结果，成功地在包括靶序列的关注的基因的几百个核苷酸范围内随机导入突变。与使用对双链DNA的DNA链均不切割的双重突变Cas蛋白质的情况相比，使用切割任意一条链的突变Cas蛋白质的情况下，突变导入效率升高。另外，明确了根据切割DNA双链中的哪条不同，突变区域的面积和突变的多样性也发生变化。此外，通过对关注的基因中的多个区域进行靶向化，可以有效地引入突变。即，确认了将已导入DNA的宿主细胞接种于非选择性培养基，针对随机选择的菌落检查关注的基因的序列，结果几乎针对全部菌落导入了突变。另外，也确认了通过分别对2个以上的关注的基因中具有的区域进行靶向化，可同时进行多个部位的基因组编辑。进一步证实：该方法可以同时向二倍体或多倍体基因组的等位基因中引入突变；不仅可以向真核细胞引入突变，而且可以在原核细胞如大肠杆菌中引入突变；不论生物种类如何均可广泛应用。另外，通过在期望的时期一过性地进行核酸碱基转变反应，可有效地进行迄今为止效率较低的必需基因的编辑。

本发明人等基于这些见解进一步反复研究，从而完成了本发明。

即，本发明如下所述。

[1]一种修饰双链DNA的靶向位点的方法，其包括：使由核酸碱基转变酶、和与选择的双链DNA中的靶核苷酸序列进行特异性结合的核酸序列识别模块连接而成的复合体，与该双链DNA接触，不切割该靶向位点中的该双链DNA的至少一条链，而使该靶向位点的1个以上的核苷酸缺失或转变为其它的1个以上的核苷酸，或者向该靶向位点插入1个以上的核苷酸的工序。

[2]根据[1]所述的方法，其中，核酸序列识别模块选自：Cas的至少1种DNA切割能力已失活的CRISPR-Cas系统、锌指基序、TAL效应子及PPR基序。

[3]根据[1]所述的方法，其中，核酸序列识别模块为Cas的至少1种DNA切割能力已失活的CRISPR-Cas系统。

[4]根据[1]～[3]中任一项所述的方法，其中，使用与不同的靶核苷酸序列分别进行特异性结合的两种以上的核酸序列识别模块。

[5]根据[4]所述的方法，其中，不同的靶核苷酸序列存在于不同的基因内。

[6]根据[1]～[5]中任一项所述的方法，其中，核酸碱基转变酶为脱氨酶。

[7]根据[6]所述的方法，其中，脱氨酶为AID(AICDA)。

[8]根据[1]～[7]中任一项所述的方法，其中，所述双链DNA与所述复合体的接触，通过向具有所述双链DNA的细胞中导入编码所述复合体的核酸来进行。

[9]根据[8]所述的方法，其中，细胞是原核生物细胞。

[10]根据[8]所述的方法，其中，细胞是真核生物细胞。

[11]根据[8]所述的方法，其中，细胞是微生物细胞。

[12]根据[8]所述的方法，其中，细胞是植物细胞。

[13]根据[8]所述的方法，其中，细胞是昆虫细胞。

[14]根据[8]所述的方法，其中，细胞是动物细胞。

[15]根据[8]所述的方法，其中，细胞是脊椎动物细胞。

[16]根据[8]所述的方法，其中，细胞是哺乳动物细胞。

[17]根据[9]～[16]中任一项所述的方法，其中，细胞为多倍体细胞，并且对同源染色体上的全部靶向化的等位基因内的位点进行修饰。

[18]根据[8]～[17]中任一项所述的方法，其包括：将以能够控制表达时期的形式包含编码复合体的核酸的表达载体，导入细胞的步骤，以及在需要使双链DNA的靶位点的修饰稳定的时期，诱导该核酸的表达的步骤。

[19]根据[18]所述的方法，其中，双链DNA中的靶核苷酸序列存在于对于细胞必需的基因内。

[20]核酸修饰酶复合体，该复合体由与双链DNA中的靶核苷酸序列特异性结合的核酸序列识别模块，和核酸碱基转变酶连接而成，在靶向位点中，不切割该双链DNA的至少一条链，使该靶向位点的1个以上的核苷酸缺失或转变为其它的1个以上的核苷酸，或者向该靶向位点插入1个以上的核苷酸。

[21]编码[20]所述的核酸修饰酶复合体的核酸。

发明的效果

根据本发明的基因组编辑技术，由于与外来DNA的插入或双链DNA切割不关联，因此安全性方面优异。即使在常规方法中以基因重组的形式而在生物学上或者法律上存在争议的情况中，技术可能提供解决方案。另外，理论上能够将突变导入的范围从一个碱基的针点(pin point)至几百个碱基的范围进行广泛设定，也可以应用于利用向迄今为止几乎不可能进行的特定的限定区域随机导入突变来进行的局部进化诱导。

附图说明

[图1]示出了使用CRISPR-Cas系统的本发明的基因修饰方法的机理的示意性说明。

[图2]示出了使用芽殖酵母(budding yeast)，对包含CRISPR-Cas系统与来自七腮鳗(Petromyzon marinus)的PmCDA1脱氨酶的组合的本发明的基因修饰方法的效果进行验证的结果。

[图3]示出了由使用具有切口酶(nickase)活性的Cas9的D10A突变体的CRISPR-Cas9系统、与脱氨酶和PmCDA1进行组合的情况(nCas9D10A-PmCDA1)下，和使用具有DNA双链裂解能力的常规型Cas9的情况下，进行表达诱导后的细胞存活数的变化的图。

[图4]示出了使用源自人的AID脱氨酶，以与dCas9隔着SH3结构域及其结合配体进行连接的方式构建了多重表达构建体，其中将表达构建体与两种gRNA(以target4及target5的序列为靶)一起导入芽殖酵母的结果的图。

[图5]示出了通过使用切割任一DNA单链的Cas9，突变导入效率提高的图。

[图6]示出了在不切割双链DNA的情况下，根据切割哪条单链，突变导入区域的大小和频率发生变化的图。

[图7]示出通过对邻近的2个区域进行靶向，可以实现极高的突变导入效率的图。

[图8]示出本发明的基因修饰方法不需要基于标记进行选择的图。确定了序列的全部菌落导入了突变。

[图9]示出根据本发明的基因修饰方法，可以对基因组中多个部位进行同时编辑的图。上图示出了各基因的靶向部位的核苷酸序列及氨基酸序列，该核苷酸序列上方的箭头指示靶核苷酸序列。箭尾或者箭头的数字表示靶核苷酸序列末端在ORF上的位置。下图示出了红色(R)及白色(W)菌落的各个5克隆中的靶向部位的测序结果。显示序列中在利用轮廓字体的字母表示的核苷酸中发生了碱基转变。需要说明的是，对刀豆氨酸的反应性(Can^R)而言，R显示抗性、S显示敏感性。

[图10]显示根据本发明的基因修饰方法，可以同时向二倍体基因组的同源染色体上的两个等位基因导入突变的图。图10A显示对于ade1基因(上图)及can1基因的各自的同源突变导入效率，图10B显示在红色菌落中实际导入了同源突变(下图)。另外，显示在白色菌落中也发生了异源突变(上图)。

[图11]显示根据本发明的基因修饰方法，能够进行作为原核细胞的大肠杆菌的基因组编辑的图。图11A为显示使用的质粒的示意性说明。图11B显示可以将galK基因内的区域作为靶标，有效地导入突变(CAA→TAA)。图11C显示对于利用非选择性培养基(none)、含有25μg/ml利福平(rifampicin)(Rif 25)或含有50μg/ml利福平(Rif 50)的培养基各自的菌落，各2个克隆进行测序分析的结果。确认导入了赋予利福平抗性的突变(上图)。估计利福平抗性株的出现频率为10％左右(下图)。

[图12]显示基于指导RNA的长度而调节编辑的碱基部位的图。图12A显示在使靶核苷酸序列长为20碱基的情况下、为24碱基的情况下的编辑的碱基部位的概念图。图12B显示以gsiA基因为靶标，改变靶核苷酸序列长度进行编辑的结果。突变部位为粗体，“T”及“A”表示在克隆内完全导入了突变(C→T或G→A)；“t”表示以50％以上的比例在克隆内导入了突变(C→T)(不完全克隆)；“c”表示在克隆内，突变(C→T)的导入效率低于50％。

[图13]显示实施例11使用的突变导入用温度敏感性质粒的示意性说明。

[图14]显示实施例11中的突变导入的方案的图。

[图15]显示实施例11中向rpoB基因导入突变的结果的图。

[图16]显示实施例11中向galK基因导入突变的结果的图。

具体实施方式

本发明提供：不切割待修饰的双链DNA的至少一条链，而是通过将该双链DNA中靶核苷酸序列及其附近的核苷酸转变为其它核苷酸，从而修饰该双链DNA的该靶向位点的方法。该方法包括：通过使由核酸碱基转变酶、和可与该双链DNA中的靶核苷酸序列特异性结合的核酸序列识别模块连接而成的复合体，与该双链DNA接触，而使该靶向位点，即靶核苷酸序列及其附近的核苷酸转变为其它核苷酸的工序。

在本发明中，对双链DNA的“修饰”是指使DNA链上的某核苷酸(例如：dC)缺失或转变为其它核苷酸(例如：dT、dA或dG)，或者向DNA链上的核苷酸之间插入核苷酸或者核苷酸序列。这里，对待修饰的双链DNA没有特别限制，优选为基因组DNA。另外，双链DNA的“靶向位点”是指，核酸序列识别模块可特异性识别并结合的“靶核苷酸序列”的全部或者一部分，或指其和该靶核苷酸序列的附近(5’上游及3’下游中任意一种或两种)，根据目的不同，该范围可以在1碱基～几百个碱基的长度之间适当调节。

在本发明中，“核酸序列识别模块”是指，具有对DNA链上的特定的核苷酸序列(即，靶核苷酸序列)进行特异性识别并结合的能力的分子或分子复合体。核酸序列识别模块可以通过与靶核苷酸序列结合，使与该模块连接的核酸碱基转变酶在双链DNA的靶向位点发挥特异性的作用。

在本发明中，“核酸碱基转变酶”是指，可以通过催化DNA碱基的嘌呤或嘧啶环上的取代基转变为其它基团或原子的反应，不切割DNA链，将靶核苷酸转变为其它核苷酸的酶。

在本发明中，“核酸修饰酶复合体”是指，包含由上述核酸序列识别模块和核酸碱基转变酶连接而成的复合体，其中复合体具有核酸碱基转变酶活性并且赋予了特定的核苷酸序列识别能力。本申请使用的“复合体”不仅包括由多个分子构成的形式，也包括像融合蛋白那样的具有核酸序列识别模块和核酸碱基转变酶的单个分子。

用于本发明的核酸碱基转变酶只要可以催化上述反应即可，没有特别限制，可列举例如，催化氨基转变为羰基的脱氨基反应的、属于核酸/核苷酸脱氨酶超家族的脱氨酶。优选的核酸碱基转变酶可列举：可以将胞嘧啶或5-甲基胞嘧啶分别转变为尿嘧啶或胸腺嘧啶的胞苷脱氨酶、可以将腺嘌呤转变为次黄嘌呤的腺苷脱氨酶、可以将鸟嘌呤转变为黄嘌呤的鸟苷脱氨酶等。作为胞苷脱氨酶，可列举更优选作为在脊椎动物的获得性免疫中在免疫球蛋白基因中导入突变的酶的活化诱导的胞苷脱氨酶(下文，也称为AID)等。

对核酸碱基转变酶的来源没有特别限制，可以使用例如：来自七腮鳗的PmCDA1(Petromyzon marinus cytosine deaminase 1)、来自哺乳动物(例如：人、猪、牛、马、猴等)的AID(Activation-induced cytidine deaminase；AICDA)。分别将PmCDA1的CDS的碱基序列及氨基酸序列显示于序列编号1和2中，分别将人AID的CDS的碱基序列及氨基酸序列显示于序列编号3和4中。

对利用本发明的核酸修饰酶复合体的核酸序列识别模块进行识别的双链DNA中的靶核苷酸序列而言，只要可以与该模块特异性结合即可，没有特别的限制，可以为双链DNA中的任意序列。就靶核苷酸序列的长度而言，只要足以与核酸序列识别模块进行特异性结合即可，例如：在向哺乳动物的基因组DNA中特定的部位导入突变时，根据其基因组尺寸为12个核苷酸以上，优选为15个核苷酸以上，更优选为17个核苷酸以上。对长度的上限没有特别的限制，优选为25个核苷酸以下，更优选为22个核苷酸以下。

作为本发明的核酸修饰酶复合体的核酸序列识别模块，可以使用例如：Cas的至少1种DNA切割能力已失活的CRISPR-Cas系统(CRISPR-突变Cas)、锌指基序、TAL效应子及PPR基序等，除此以外，包含限制酶、转录因子、RNA聚合酶等可与DNA进行特异性结合的蛋白质的DNA结合结构域且不具有DNA双链切割能力的片段等，但不限于这些。模块优选包括：CRISPR-突变Cas、锌指基序、TAL效应子、PPR基序等。

锌指基序由3～6个Cys2His2不同型的锌指单元(1个手指识别约3个碱基)连接而成，可以识别9～18个碱基的靶核苷酸序列。锌指基序可以根据Modular assembly法(NatBiotechnol(2002)20:135-141)、OPEN法(Mol Cell(2008)31:294-301)、CoDA法(NatMethods(2011)8:67-69)、大肠杆菌单杂交法(Nat Biotechnol(2008)26:695-701)等公知的方法制作。对于制作锌指基序的的细节，可以参照上述专利文献1。

对TAL效应子而言，具有以约34氨基酸作为单位的模块的重复结构，利用1个模块的第12及13个氨基酸残基(称为RVD)确定结合稳定性和碱基特异性。由于各个模块的独立性较高，因此可以仅将模块相连接来制作对靶核苷酸序列特异性的的TAL效应子。TAL效应子可以利用Open resource的制作方法(REAL法(Curr Protoc Mol Biol(2012)Chapter12:Unit12.15)、FLASH法(Nat Biotechnol(2012)30:460-465)、Golden Gate法(NucleicAcids Res(2011)39：e82)等)进行构建，相对容易地设计相对于靶核苷酸序列的TAL效应子。对于制作TAL效应子的细节，可以参照上述专利文献2。

对PPR基序而言，构建为使得通过串联的包含35个氨基酸的1个核酸碱基识别PPR基序来识别特定的核苷酸序列，仅利用各基序的第1、4及第ii(倒数第2)的氨基酸识别靶向碱基。由于对基序构型没有依赖性，不受两侧的基序的干涉，因此与TAL效应子相似地，可以仅将PPR基序相连接来制作对靶核苷酸序列特异性的PPR蛋白质。对于制作PPR基序的细节，可以参照上述专利文献4。

另外，在使用限制酶、转录因子、RNA聚合酶等片段的情况下，由于它们的蛋白质的DNA结合结构域是众所周知的，因此可以容易地设计、构建包含所述结构域且不具有DNA双链切割能力的片段。

上述任意核酸序列识别模块也可以以上述核酸碱基转变酶的融合蛋白的形式提供，或者，也可以将SH3结构域、PDZ结构域、GK结构域、GB结构域等蛋白质结合结构域和它们的结合配偶体，分别与核酸序列识别模块和与核酸碱基转变酶融合，通过该结构域和它们的结合配体的相互作用而以蛋白质复合体的形式提供。或者，也可以将核酸序列识别模块与核酸碱基转变酶和与内含肽(intein)分别融合，利用各蛋白质合成后的接合将两者连接。

就包含核酸序列识别模块与核酸碱基转变酶连接而成的复合体(包括融合蛋白)的本发明的核酸修饰酶复合体与双链DNA的接触而言，虽然可以以无细胞体系的酶反应的形式进行，但鉴于本发明的主要的目的，需要通过向具有关注的双链DNA(例如，基因组DNA)的细胞导入编码该复合体的核酸来进行接触。

因此，对核酸序列识别模块与核酸碱基转变酶而言，优选以编码它们的融合蛋白的核酸的形式制备，或者，以分别编码它们的核酸的形式以使得利用结合结构域、内含肽等翻译成蛋白质之后，能够在宿主细胞内形成复合体的形态进行制备。在此，核酸可以是DNA也可以是RNA。在为DNA时，优选为双链DNA，并且以在宿主细胞内配置为在功能性的启动子的控制下的表达载体的形态提供。在为RNA时，优选为单链RNA。

由于核酸序列识别模块和核酸碱基转变酶连接而成的本发明的复合体与DNA双链切割(DSB)不相关联，因此，能够进行毒性较低的基因组编辑，本发明的基因修饰方法可以适用于范围较广的生物材料。因此，就导入核酸序列识别模块及/或核酸碱基转变酶编码核酸的细胞而言，从作为原核生物的大肠杆菌等细菌、作为低等真核生物的酵母等微生物的细胞，到昆虫、植物等高等真核生物的细胞、包括人等哺乳动物的脊椎动物的细胞，可以包括所有生物种类的细胞。

对编码锌指基序、TAL效应子、PPR基序等核酸序列识别模块的DNA而言，可以通过上述任意方法获得各模块。对编码限制酶、转录因子、RNA聚合酶等序列识别模块的DNA而言，可以通过以下进行克隆：例如基于它们的cDNA序列信息，来合成使得覆盖编码该蛋白质的期望部分(包含DNA结合结构域的部分)的区域的寡DNA引物，并利用从产生该蛋白质的细胞制备的总RNA或者mRNA级分作为模板，通过RT-PCR法扩增。

编码核酸碱基转变酶的DNA也可以同样地通过以下进行克隆：基于待使用的酶的cDNA序列信息来合成寡DNA引物，使用由产生该酶的细胞制备的总RNA或者mRNA级分作为模板，通过RT-PCR法扩增。例如，就编码七腮鳗的PmCDA1的DNA而言，可以基于NCBI数据库登记的cDNA序列(accession No.EF094822)，针对CDS的上游及下游设计适当的引物，通过RT-PCR法从来自七腮鳗的mRNA进行克隆。另外，就编码人AID的DNA而言，可以基于NCBI数据库登记的cDNA序列(accession No.AB040431)，针对CDS的上游及下游设计适当的引物，例如通过RT-PCR法从来自人淋巴结的mRNA进行克隆。

已克隆的DNA可以直接或根据需要利用限制酶进行消化，或在加入适当的接头及/或核定位信号(在关注的双链DNA为线粒体、或叶绿体DNA的情况下，为各细胞器转移信号)之后，与编码核酸序列识别模块的DNA进行接合，来制备编码融合蛋白的DNA。或者，可以通过将编码核酸序列识别模块的DNA和编码核酸碱基转变酶的DNA分别与编码结合结构域或者其结合配偶体的DNA进行融合，或也可以将两种DNA通过与编码分离内含肽的DNA进行融合，使得核酸序列识别转变模块和核酸碱基转变酶在宿主细胞内翻译，然后再形成复合体。在这些情况下，也可以根据需要，在一方或双方DNA的适当的位置连接接头及/或核定位信号。

对编码核酸序列识别模块的DNA和编码核酸碱基转变酶的DNA而言，可以化学合成DNA链，或者也可以通过将部分重叠的合成的寡DNA短链利用PCR法、Gibson Assembly法进行连接，构建编码其全长的DNA。利用组合化学合成或PCR法或者Gibson Assembly法来构建全长DNA的优点在于，可以在整个CDS全长上设计与待导入该DNA的宿主配合的使用密码子。通过在表达异种DNA时，将该DNA序列转变为在宿主生物中使用频率高的密码子，可以期待使蛋白质表达量增大。就使用的宿主中的密码子使用频率的数据而言，可以使用例如在(公财)Kazusa DNA研究所的主页上公开的遗传密码使用频率数据库(http://www.kazusa.or.jp/codon/index.html)，还可以参照记载在各宿主中密码子的使用频率的文献。只要参照取得的数据和准备导入的DNA序列，将该DNA序列中使用的密码子中在宿主中使用频率低的密码子，转变为编码同一氨基酸且使用频率高的密码子即可。

包含编码核酸序列识别模块及/或核酸碱基转变酶的DNA表达载体，可以通过例如将该DNA连接至适当的表达载体的启动子的下游来制造。

作为表达载体，可以使用来自大肠杆菌的质粒(例如，pBR322、pBR325、pUC12、pUC13)；来自枯草杆菌的质粒(例如，pUB110、pTP5、pC194)；来自酵母的质粒(例如，pSH19、pSH15)；昆虫细胞表达质粒(例如：pFast-Bac)；动物细胞表达质粒(例如：pA1-11、pXT1、pRc/CMV、pRc/RSV、pcDNAI/Neo)；λ噬菌体等噬菌体；杆状病毒等昆虫病毒载体(例如：BmNPV、AcNPV)；逆转录病毒、痘苗病毒、腺病毒等动物病毒载体等。

作为启动子，只要是对应于基因表达的宿主的适当的启动子即可。由于涉及DSB的常规法的毒性的缘故，有时宿主细胞的存活率显著降低，因此期望通过使用诱导启动子增加诱导开始为止的细胞数量，但由于表达本发明的核酸修饰酶复合体也可实现充分的细胞增殖，因此可以无限制地使用构成启动子。

例如，在宿主为动物细胞的情况下，可以使用SRα启动子、SV40启动子、LTR启动子、CMV(巨细胞病毒)启动子、RSV(劳斯肉瘤病毒)启动子、MoMuLV(Moloney小鼠白血病病毒)LTR、HSV-TK(单纯疱疹病毒胸苷激酶)启动子等。其中，优选CMV启动子、SRα启动子等。

当宿主是大肠杆菌的情况下，优选trp启动子、lac启动子、recA启动子、λPL启动子、lpp启动子、T7启动子等。

当宿主是芽孢杆菌属的情况下，优选SPO1启动子、SPO2启动子、penP启动子等。

当宿主是酵母的情况下，优选Gal1/10启动子、PHO5启动子、PGK启动子、GAP启动子、ADH启动子等。

当宿主是昆虫细胞的情况下，优选多角体蛋白启动子、P10启动子等。

当宿主是植物细胞的情况下，优选CaMV35S启动子、CaMV19S启动子、NOS启动子等。

作为表达载体，除了上述以外，可以根据需要使用含有增强子、剪接信号、终止子、polyA添加信号、选择标记如药物抗性基因、营养缺陷型互补基因等、复制起点等的载体。

编码核酸序列识别模块及/或核酸碱基转变酶的RNA，可以通过例如以编码上述核酸序列识别模块及/或核酸碱基转变酶的DNA编码载体作为模板，通过本身已知的体外转录系统转录为mRNA来制备。

可以通过将包含编码核酸序列识别模块及/或核酸碱基转变酶的DNA表达载体导入宿主细胞并培养该宿主细胞，在细胞内表达核酸序列识别模块和核酸碱基转变酶的复合体。

作为宿主，可以使用例如：埃希氏菌属、芽孢杆菌属、酵母、昆虫细胞、昆虫、动物细胞等。

作为埃希氏杆菌属，可以使用例如：大肠杆菌(Escherichia coli)K12？DH1[Proc.Natl.Acad.Sci.USA,60，160(1968)]、大肠杆菌JM103[Nucleic Acids Research,9，309(1981)]、大肠杆菌JA221[Journal of Molecular Biology,120，517(1978)]、大肠杆菌HB101[Journal of Molecular Biology,41，459(1969)]、大肠杆菌C600[Genetics,39，440(1954)]等。

作为芽孢杆菌属，可以使用例如：枯草芽孢杆菌(Bacillus subtilis)MI114[Gene,24，255(1983)]、枯草芽孢杆菌207-21[Journal of Biochemistry,95,87(1984)]等。

作为酵母，可以使用例如：酿酒酵母(Saccharomyces cerevisiae)AH22、AH22R-、NA87-11A、DKD-5D、20B-12、粟酒裂殖酵母(Schizosaccharomyces pombe)NCYC1913、NCYC2036、巴斯德毕赤酵母(Pichia pastoris)KM71等。

作为昆虫细胞，可以使用例如：在病毒为AcNPV的情况下，来自甘蓝夜蛾的幼虫来源的株系细胞(Spodoptera frugiperda cell；Sf细胞)、来自Trichoplusia ni的中肠MG1细胞、来自Trichoplusia ni的卵的High FiveTM细胞、来自Mamestra brassicae的细胞、来自Estigmena acrea的细胞等。在病毒为BmNPV的情况下，作为昆虫细胞，可以使用来自蚕的株系细胞(Bombyx mori N细胞；BmN细胞)等。作为该Sf细胞，可以使用例如：Sf9细胞(ATCCCRL1711)、Sf21细胞[以上，In Vivo,13,213-217(1977)]等。

作为昆虫，可以使用例如：蚕的幼虫、果蝇、蟋蟀等[Nature,315,592(1985)]。

作为动物细胞，可以使用例如：猴COS-7细胞、猴Vero细胞、中国仓鼠卵巣(CHO)细胞、dhfr基因缺陷CHO细胞、小鼠L细胞、小鼠AtT-20细胞、小鼠骨髓瘤细胞、大鼠GH3细胞、人FL细胞等细胞株、人及其它哺乳动物的iPS细胞、ES细胞等多功能性干细胞、由各种组织制备的初代培养细胞。进一步，也可以使用斑马鱼胚胎、非洲爪蟾卵母细胞等。

作为植物细胞，可以使用从各种植物(例如：水稻、小麦、玉米等谷物，番茄、黄瓜、茄子等商品作物，康乃馨、洋桔梗等园艺植物，烟草、拟南芥等实验植物等)制备的悬浮培养细胞、愈伤组织、原生质体、叶切片、根切片等。

上述任意宿主细胞可以为单倍体(一倍体)、多倍体(例如，二倍体、三倍体、四倍体等)。常规的突变导入方法中，作为原则仅向同源染色体的一条中导入突变而形成异源基因型，因此，如果不是显性突变，就不会表达需要的特征，而使其同源耗时耗力，大多情况不方便。与此相对，根据本发明，由于可以对基因组内的同源染色体上的全部等位基因导入突变，因此即使为隐性突变，也可以在该代表达需要的特征(图10)，从克服了常规法的症结的方面考虑，极其有用。

对表达载体的导入而言，可以根据宿主的种类，按照公知的方法(例如：溶菌酶法、感受态法、PEG法、CaCl₂共沉淀法、电穿孔法、显微注射法、粒子枪法、脂质转化法、农杆菌法等)进行实施。

对于大肠杆菌，可以按照例如：Proc.Natl.Acad.Sci.USA,69,2110(1972)、Gene,17，107(1982)等中记载的方法进行转化。

可以按照例如：Molecular&General Genetics,168，111(1979)等中记载的方法，将载体导入芽孢杆菌属。

可以按照例如：Methods in Enzymology,194，182-187(1991)，Proc.Natl.Acad.Sci.USA,75,1929(1978)等中记载的方法，将载体导入酵母。

可以按照例如：Bio/Technology,6,47-55(1988)等中记载的方法，将载体导入昆虫细胞及昆虫。

可以按照例如：细胞工程学增刊8新细胞工程学实验方案,263-267(1995)(秀润公司发行)，Virology,52,456(1973)中记载的方法，将载体导入动物细胞。

就已导入载体的细胞的培养而言，可以根据宿主的种类，按照公知的方法实施。

例如，在培养大肠杆菌或芽孢杆菌的情况下，作为用于培养的培养基优选液体培养基。另外，培养基优选含有转化体的生长所必需的碳源、氮源、无机物等。这里，作为碳源，可以举出例如：葡萄糖、糊精、可溶性淀粉、蔗糖等；作为氮源，可以举出例如：铵盐类、硝酸盐类、玉米浆、蛋白胨、酪蛋白、肉浸膏、大豆饼、马铃薯提取液等无机或有机物质；作为无机物，可以举出例如：氯化钙、磷酸二氢钠、氯化镁等。另外，也可以向培养基添加酵母提取物、维生素类、生长促进因子等。培养基的pH优选为约5～约8。

作为培养大肠杆菌时的培养基，例如，优选包含葡萄糖、酪蛋白氨基酸的M9培养基[Journal of Experiments in Molecular Genetics,431-433,Cold Spring HarborLaboratory,New York 1972]。根据需要，为了使启动子有效地工作，例如也可以向培养基添加3β-吲哚基丙烯酸的那样的试剂。大肠杆菌的培养通常在约15～约43℃进行。根据需要，可以进行通气、搅拌。

芽孢杆菌的培养通常在约30～约40℃进行。根据需要，可以进行通气、搅拌。

作为培养酵母时的培养基，可列举例如：Burkholder最小培养基[Proc.Natl.Acad.Sci.USA,77,4505(1980)]、0.5％含酪蛋白氨基酸的SD培养基[Proc.Natl.Acad.Sci.USA,81,5330(1984)]等。培养基的pH优选为约5～约8。培养通常在约20℃～约35℃进行。可以根据需要进行通气、搅拌。

作为培养昆虫细胞或昆虫时的培养基，可以使用例如向Grace's Insect Medium[Nature,195，788(1962)]中适当添加了灭活的10％牛血清等添加物的培养基等。培养基的pH优选为约6.2～约6.4。培养通常在约27℃进行。可以根据需要进行通气、搅拌。

作为培养动物细胞时的培养基，可以使用例如：包含约5～约20％的胎牛血清的最小必要培养基(MEM)[Science,122，501(1952)]、Dulbecco改良的Eagle培养基(DMEM)[Virology,8，396(1959)]、RPMI 1640培养基[The Journal of the American MedicalAssociation,199，519(1967)]、199培养基[Proceeding of the Society for theBiological Medicine,73,1(1950)]等。培养基的pH优选为约6～约8。培养通常在约30℃～约40℃进行。可以根据需要进行通气、搅拌。

作为培养植物细胞的培养基，可以使用MS培养基、LS培养基、B5培养基等。培养基的pH优选为约5～约8。培养通常在约20℃～约30℃进行。可以根据需要进行通气、搅拌。

如上所述操作，可以在细胞内表达核酸序列识别模块和核酸碱基转变酶的复合体，即核酸修饰酶复合体。

编码核酸序列识别模块及/或核酸碱基转变酶RNA向宿主细胞的导入，可以通过显微注射法、脂质转化法等进行。RNA的导入可以1次或者隔着适当的间隔进行多次(例如：2～5次)。

由导入至细胞内的表达载体或RNA分子，表达核酸序列识别模块和核酸碱基转变酶的复合体时，该核酸序列识别模块特异性识别并结合目的的双链DNA(例如，基因组DNA)内的靶核苷酸序列，利用连接于该核酸序列识别模块的核酸碱基转变酶的作用，靶向位点(可以在包含靶核苷酸序列的全部或者一部分或它们的附近的几百个碱基的范围内适当调节)的有义链或者反义链发生碱基转变，在双链DNA内产生错配(例如：将PmCDA1、AID等胞苷脱氨酶作为核酸碱基转变酶使用的情况下，靶向位点的有义链或者反义链上的胞嘧啶被转变为尿嘧啶，产生U:G或者G:U错配)。通过以下导入各种突变：该错配未被正确修复，或修复使得相反链的碱基与已转变的链的碱基成对(上述的例子中，为T-A或者A-T)，修复时进一步取代为其它核苷酸(例如：U→A、G)，或者发生1个～数十个碱基的缺失或者插入。

对锌指基序而言，由于与靶核苷酸序列特异性结合的锌指的制作效率不高，另外，结合特异性高的锌指的筛选并不容易，因此，制作实际发挥功能的多个锌指基序并不容易。就TAL效应子、PPR基序而言，比锌指基序的靶核酸序列识别的自由度高，但需要每次根据靶核苷酸序列设计并构建巨大的蛋白质，因此在效率方面存在问题。

与此相对，由于CRISPR-Cas系统是通过相对于靶核苷酸序列互补的指导RNA来识别关注的双链DNA的序列，因此可以通过仅合成可与靶核苷酸序列形成特异性的Hybrid的寡DNA，以任意序列为靶标。

因此，在本发明更优选的实施形态中，使用了Cas的至少1种DNA切割能力已失活的CRISPR-Cas系统(CRISPR-突变Cas)作为核酸序列识别模块。

图1为显示将CRISPR-突变Cas用作核酸序列识别模块的，本发明的双链DNA修饰方法的示意性说明。

使用了CRISPR-突变Cas的本发明的核酸序列识别模块，是以RNA分子与突变Cas蛋白质的复合体的形式提供的，其中，所述RNA分子由与靶核苷酸序列互补的指导RNA、对突变Cas蛋白质的募集必需的tracrRNA组成。

本发明使用的Cas蛋白质只要属于CRISPR系统即可，没有特别限制，优选为Cas9。作为Cas9，可列举例如，来自化脓性链球菌(Streptococcus pyogenes)的Cas9(SpCas9)、来自嗜热链球菌(Streptococcus thermophilus)的Cas9(StCas9)等，但不限于这些。优选为SpCas9。作为本发明使用的突变Cas，具有使双链DNA的两条链失活的切割能力的Cas、或仅使一条链失活的切割能力的具有切口酶活性的Cas均可以使用。例如，在为SpCas9的情况下，可以使用第10位的Asp残基转变为Ala残基的、欠缺对形成与指导RNA互补的链的相反链的切割能力的D10A突变体，或者，第840位的His残基转变为Ala残基的、欠缺与指导RNA互补的链的切割能力的H840A突变体，进一步可使用其双突变体，但也可以使用其它突变Cas。

对核酸碱基转变酶而言，通过与上述锌指等的连接方式相同的方法，以突变Cas的复合体的形式提供。或者，也可以将核酸碱基转变酶和突变Cas，利用与作为RNA适体的MS2F6、PP7等和由它们的结合蛋白质构成的RNA支架进行连接。指导RNA与靶核苷酸序列形成互补链，接着tracrRNA募集突变Cas，对DNA切割部位识别序列PAM(protospaceradjacent motif)(当使用SpCas9的情况下，PAM为NGG(N为任意碱基)3个碱基，理论上，基因组上的任意部位都可以被靶向化)进行识别，不切割一条或者两条DNA，利用连接于突变Cas的核酸碱基转变酶的作用，使靶向部位(可以在包含靶核苷酸序列的全部或者一部分的几百个碱基的范围内适当调节)产生碱基转变，在双链DNA内产生错配。通过以下导入各种突变：该错配未被正确修复，修复使得相反链的碱基与已转变链的碱基成对，修复时进一步被转变为其它核苷酸，或者发生1个～数十个碱基的缺失或者插入，(例如：参照图2)。

在将CRISPR-突变Cas用作核酸序列识别模块的情况下，也与将锌指等用作核酸序列识别模块的情况相同地，优选将核酸序列识别模块和核酸碱基转变酶，以编码它们的核酸的形态导入具有关注的双链DNA的细胞。

编码Cas的DNA，可以通过与对于编码核酸碱基转变酶的DNA的上述方法同样的方法从产生该酶的细胞进行克隆。另外，突变Cas可以通过以下获得：在已克隆的Cas编码DNA中，使用本身公知的部位特异性的突变诱发法，以将对DNA切割活性重要的部位的氨基酸残基(例如：在为Cas9的情况下，可列举第10位的Asp残基、第840位的His残基，但不限于这些)转变为其它氨基酸的方式导入突变。

或者，对编码突变Cas的DNA而言，也可以针对编码核酸序列识别模块的DNA、编码核酸碱基转变酶的DNA，利用与上述相同的方法和化学合成或PCR法或Gibson Assembly法的组合，构建成具有适于使用的宿主细胞的表达的密码子使用的DNA形式。例如：将为了在真核细胞中表达SpCas9的最优化的CDS序列及氨基酸序列示于序列编号5及6。如果将序列编号5所示的序列中的碱基编号29的“A”转变为“C”，则可以得到编码D10A突变体的DNA，如果将碱基编号2518-2519的“CA”转变为“GC”，则可以得到编码H840A突变体的DNA。

对编码突变CasDNA和编码核酸碱基转变酶的DNA而言，可以连接成使得作为融合蛋白表达，也可以设计成使得使用结合结构域、内含肽等分别进行表达，通过蛋白质间相互作用、蛋白质接合在宿主细胞内形成复合体。

对得到的编码突变Cas及/或核酸碱基转变酶的DNA而言，可以根据宿主不同，插入至与上述相同的表达载体的启动子的下游。

另一方面，编码指导RNA及tracrRNA的DNA可以设计成，将相对于靶核苷酸序列互补的指导RNA序列与已知的tracrRNA序列(例如：gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtggtg ctttt；序列编号7)连接而成的寡DNA序列，并用DNA/RNA合成仪进行化学合成。

对指导RNA序列的长度而言，只要是可相对于靶核苷酸序列特异性结合即可，没有特别限制，例如为15～30个核苷酸，优选为18～24个核苷酸。

编码指导RNA及tracrRNA的DNA也可以根据宿主不同，插入至与上述相同的表达载体，作为启动子，优选使用pol III类的启动子(例如，SNR6、SNR52、SCR1、RPR1、U6、H1启动子等)及终止子(例如，T6序列)。

对编码突变Cas及/或核酸碱基转变酶的RNA而言，可以通过例如，以对编码上述突变Cas及/或核酸碱基转变酶的DNA进行编码的载体作为模板，通过本身公知的体外转录系统转录为mRNA来制备。

可以将指导RNA-tracrRNA设计成由与靶核苷酸序列互补的序列与已知的tracrRNA序列连接而成的寡RNA序列，并用DNA/RNA合成仪进行化学合成。

对编码突变Cas及/或核酸碱基转变酶的DNA或者RNA、指导RNA-tracrRNA或编码其的DNA而言，可以根据宿主不同，通过与上述相同的方法导入宿主细胞。

常规型的人工核酸酶中，由于伴随DNA双链切割(DSB)，因此，对基因组内的序列进行靶向时，发生染色体的无序的切割(脱靶切割)导致的增殖障碍和细胞死亡。该影响对很多微生物、原核生物是特别致命的，阻碍了其适用性。在本发明中，由于通过不切割DNA的对DNA碱基上的取代基的转变反应(特别是脱氨基反应)进行突变导入，因此，可以实现毒性的大幅降低。实际上，如下文的实施例所示，在将芽殖酵母作为宿主使用的比较试验中，确认在使用了具有常规型的DSB活性的Cas9的情况下，由表达诱导导致细胞存活数减少，与此相对，在组合了突变Cas和核酸碱基转变酶的本发明的技术中，细胞继续增殖，细胞存活数增加(图3)。

需要说明的是，本发明的双链DNA的修饰不会妨碍在靶向位点(可以在包含靶核苷酸序列的全部或者一部分的几百个碱基的范围内适当调节)以外产生该双链DNA的切割。然而，本发明的最大的优点之一，是避免了由脱靶(off-target)切割导致的毒性，如果考虑到原则上可以适用于任何生物种类，则在一种优选的实施形态中，本发明的双链DNA的修饰不仅在选择的双链DNA的靶向位点与DNA链的切割不相关联，在其它部位也是。

另外，如下文的实施例所示，与使用两条链均不能切断的突变Cas的情况相比，作为突变Cas使用了具有仅能切割双链DNA之中的一条链的切口酶(nickase)活性的Cas的情况下(图5)，突变导入效率升高。因此，例如，可以通过在核酸序列识别模块和核酸碱基转变酶以外，进一步连接具有切口酶活性的蛋白质，从而在靶核苷酸序列的附近仅切割DNA一根链，在避免基于DSB的强毒性的同时，使突变导入效率提高。

进一步，对具有切割不同链的两种切口酶活性的突变Cas的效果进行比较，结果显示使用一种突变Cas导致突变部位累积于靶核苷酸序列的中央附近，使用另一种突变Cas导致向从靶核苷酸序列到达几百个碱基的区域随机导入了多种突变(图6)。因此，通过选择切口酶待切割的链，可以向特定的核苷酸或核苷酸区域导入点性突变，或者向比较宽的范围随机导入多种突变，可以根据目的不同而适当使用。例如，如果将前者的技术用于基因疾病iPS细胞，则可以通过在修复了由患者自身的细胞制作的iPS细胞中的病原基因的突变之后，通过使其分化为关注的体细胞，制作排斥风险更低的细胞移植疗法剂。

在下文的实施例7和随后的实施例中，示出了可以对特定的核苷酸中几乎在针点上导入突变。像这样，为了对期望的核苷酸针点性导入突变，只要设定靶核苷酸序列使得希望导入突变的核苷酸和靶核苷酸序列的位置关系存在规律性即可。使用CRIPR-Cas系统作为核酸序列识别模块、且使用AID作为核酸碱基转变酶，可以设计靶核苷酸序列，使得希望导入突变的C(或者其相反链的G)在离靶核苷酸序列的5’端2～5个核苷酸的位置。如上所述，指导RNA序列的长度可以在15～30个核苷酸，优选为18～24个核苷酸之间适当设定。由于指导RNA序列为与靶核苷酸序列互补的序列，因此改变指导RNA序列的长度，导致靶核苷酸序列的长度也发生变化，但无论核苷酸长度如何，都保持对存在于离5’端2～5个核苷酸的位置的C或G可能导入突变的规律性(图12)。因此，通过适当选择靶核苷酸序列(作为其互补链的指导RNA)的长度，可以移动能够导入突变碱基的部位。由此，也可以解除由DNA切割部位识别序列PAM(NGG)导致的限制，进一步提高突变导入的自由度。

如下文的实施例所示，相对于当单独的核苷酸序列用作靶时，通过相对于邻近的多个靶核苷酸序列而制作序列识别模块并同时使用，突变导入效率大幅升高(图7)。效果是，从使得两个靶核苷酸序列的一部分发生重复的情到即使两者分开600bp左右的情况下，都同样实现突变诱导。另外，在靶核苷酸序列存在于相同方向(靶核苷酸序列存在于相同链上)(图7)、以及在对向(靶核苷酸序列存在于双链DNA的各自链上)(图4)的两种情况下，均可发生。

如下文的实施例所示，就本发明的基因组序列的修饰方法而言，如果选择适当的靶核苷酸序列，则可以在表达本发明的核酸修饰酶复合体的几乎全部的细胞中导入突变(图8)。因此，不需要在常规基因组编辑中所必需的选择标识基因的插入和选择。其在使基因操作显著地变得简便的同时，由于没有了重组外源DNA的生物，因此对作物育种等的适用性大幅变宽。

另外，由于突变导入效率极高，且不需要利用标识的选择，因此在本发明的基因组序列的修饰方法中，可以对完全不同的位置的多个DNA区域作为靶进行修饰(图9)。因此，在本发明优选的一种实施形态中，可以使用与不同的靶核苷酸序列(可以在1个关注的基因内，也可以在不同的2个以上关注的基因内。这些目的基因可以位置在相同的染色体上，也可以在不同的染色体上。)分别特异性结合的、两种以上的核酸序列识别模块。在这种情况下，将这些核酸序列识别模块的各1个与核酸碱基转变酶形成核酸修饰酶复合体。这里，核酸碱基编辑酶可以使用共通的酶。例如，在使用CRISPR-Cas系统作为核酸序列识别模块的情况下，可以对于Cas蛋白质和核酸碱基转变酶的复合体(包含融合蛋白)使用共通的物质，制作并使用两种以上的嵌合RNA作为指导RNA-tracrRNA，所述嵌合RNA使是由与不同的靶核苷酸序列分别形成互补链的2种以上的指导RNA的每一种分别与tracrRNA形成的。另一方面，在使用锌指基序、TAL效应子等作为核酸序列识别模块的情况下，例如可以将与不同靶核苷酸特异性结合的各核酸序列识别模块，与核酸碱基转变酶进行融合。

为了使本发明的核酸修饰酶复合体在宿主细胞内表达，如上所述将包含编码该核酸修饰酶复合体的DNA的表达载体、编码该核酸修饰酶复合体的RNA导入宿主细胞，但为了有效地导入突变，优选能保持规定时期以上、规定水平以上的核酸修饰酶复合体的表达。从该观点出发，确定在宿主细胞内导入能够自主复制的表达载体(质粒等)，但由于该质粒等为外源DNA，因此，优选在顺利实现了导入突变后迅速地将其除去。因此，虽然根据宿主细胞的种类等不同而改变，但优选例如：从导入表达载体到经过6小时～2天后，使用在本技术领域周知的各种质粒除去法，从宿主细胞除去已导入的质粒。

或者，只要可实现足以进行突变导入的核酸修饰酶复合体的表达，也优选使用在宿主细胞内不具有自主复制能力的表达载体(例如：缺乏在宿主细胞中发挥功能的复制起点及/或编码对复制必须的蛋白质的基因的载体等)、RNA，通过一过性地的表达向关注的双链DNA导入突变。

由于在使本发明的核酸修饰酶复合体在宿主细胞内进行表达，并进行核酸碱基转变反应的时期，靶基因的表达被抑制，因此，迄今为止难以将对宿主细胞的生存所必需的基因作为靶基因直接编辑(产生宿主的生长障碍、突变导入效率不稳定、对与靶标不同的部位的突变等副作用)。本发明通过在期望的时期发生核酸碱基转变反应，在使靶向位点的修饰稳定所需的时期，使本发明的核酸修饰酶复合体一过性地在宿主细胞内表达，从而成功有效地实现必需基因的直接编辑。需要发生核酸碱基转变反应、使靶向位点的修饰稳定的时期根据宿主细胞的种类、培养条件等不同，但认为通常需要2～20代。例如，在宿主细胞为酵母、细菌(例如，大肠杆菌)的情况下，需要在5～10代之间诱导核酸修饰酶复合体的表达。本领域技术人员可以基于使用的培养条件下的宿主细胞的倍增时间，适当确定适宜的表达诱导期。例如，将芽殖酵母在0.02％半乳糖诱导培养基中进行液体培养时，可举例为20～40小时的表达诱导期。就本发明的编码核酸修饰酶复合体的核酸的表达诱导期而言，也可以在对宿主细胞不产生副作用的范围内，超出上述“需要使靶向位点的修饰稳定的时期”并延长。

作为将本发明的核酸修饰酶复合体在期望的时期进行一过性地表达的方法，可使用包括制作以能够控制表达期的形态，包含编码该核酸修饰酶复合体的核酸(在CRISPR-Cas系统中，为编码指导RNA-tracrRNA的DNA、和编码突变Cas及核酸碱基取代酶的DNA)的构建体(表达载体)，并将构建体导入宿主细胞内的方法。“以能够控制表达期的形态”，具体而言，可列举将编码本发明的核酸修饰酶复合体的核酸，置于诱导性的调节区域的控制下的形态。对“诱导性的调节区域”没有特别限制，例如，在细菌(例如，大肠杆菌)、酵母等微生物细胞中，可列举温度敏感性(ts)突变阻遏物和控制其的操纵基因(operator)的控制子(operon)。作为ts突变阻遏物，可列举例如来自λ噬菌体的cI阻遏物的ts突变体，但不限于这些。在为λ噬菌体cI阻遏物(ts)的情况下，在30℃以下(例如，28℃)与操纵基因连接而抑制下游的基因表达，但在37℃以上(例如，42℃)的高温从操纵基因解离，因此可诱导基因表达(图13及14)。因此，通过将已导入编码核酸修饰酶复合体的核酸的宿主细胞，通常在30℃以下培养，在适当的时期将温度升高至37℃以上并培养一定时期，使其进行核酸碱基转变反应，并在向靶基因导入突变后迅速降回30℃以下，从而可以使得抑制靶基因表达的时期最短，即使在对宿主细胞所必需的基因进行靶向的情况下，也可以压抑副作用并有效地进行编辑(图15)。

在利用温度敏感性突变的情况下，可以通过例如，将对载体的自主复制所必须的蛋白质的温度敏感性突变体，包括于包含编码本发明的核酸修饰酶复合体的DNA载体，使该核酸修饰酶复合体表达之后，该载体不能迅速地自主复制，并在细胞分裂期间自然脱落。作为这样的温度敏感性突变蛋白质，可列举pSC101 ori的复制所必须的Rep101 ori的温度敏感性突变体，但不限于这些。对Rep101 ori(ts)而言，虽然在30℃以下(例如，28℃)能够作用于pSC101 ori并进行质粒的自主复制，但处于37℃以上(例如，42℃)时丧失功能，质粒不能自主复制。因此，通过与上述λ噬菌体的cI阻遏物(ts)组合使用，可以使本发明的核酸修饰酶复合体的一过性地表达和质粒除去同时进行。

另一方面，将动物细胞、昆虫细胞、植物细胞等高等真核细胞作为宿主细胞的情况下，在诱导启动子(例如，金属硫蛋白启动子(利用重金属离子诱导)、热休克蛋白质启动子(利用热休克诱导)、Tet-ON/Tet-OFF类启动子(利用添加或除去四环素或其衍生物进行诱导)、类固醇响应启动子(利用类固醇激素或其衍生物进行诱导)等)的控制下，将编码本发明的核酸修饰酶复合体的DNA导入宿主细胞内，在适当的时期向培养基添加诱导物质(或从培养基除去)来诱导该核酸修饰酶复合体的表达，培养一定时期，进行核酸碱基转变反应，可以实现向靶基因导入突变后的核酸修饰酶复合体的一过性地表达。

需要说明的是，在大肠杆菌等原核细胞中也可以利用诱导启动子。作为这样的诱导启动子，可列举例如：lac启动子(利用IPTG诱导)、cspA启动子(利用冷休克诱导)、araBAD启动子(利用阿拉伯糖诱导)等，但不限于这些。

或者，也可以将上述的诱导启动子用作在以动物细胞、昆虫细胞、植物细胞等高等真核细胞作为宿主细胞时的载体除去方法。即，通过使其搭载宿主细胞发挥功能的复制起点、和编码对其复制所必须的蛋白质的核酸(例如，如果为动物细胞，则为SV40 ori和大T抗原、oriP和EBNA-1等)，利用上述诱导启动子来控制编码该蛋白质的核酸的表达，虽然在诱导物质的存在下载体能够进行自主复制，但如果除去诱导物质则不能进行自主复制，在细胞分裂期间，载体将自然脱落(在Tet-OFF类载体中，相反地，通过添加四环素、多西环素导致不能进行自主复制)。

以下，根据实施例对本发明进行说明。但是，本发明并不限于这些实施例。

实施例

在下文的实施例1～6中，如下所述地进行了实验。

<细胞株、培养、转化(transformation)、表达诱导>

使用芽殖酵母Saccharomyces cerevisiae BY4741株(需要亮氨酸及尿嘧啶)，利用标准的YPDA培养基或满足营养要求的撤出成分(Dropout)组成的SD培养基进行培养。培养在从25℃到30℃之间，通过利用琼脂板的静置培养或利用液体培养基的振荡培养进行。对转化而言，使用乙酸锂法，利用符合适当的营养要求的SD培养基进行选择。对基于半乳糖的表达诱导而言，利用适当的SD培养基预培养一夜，然后接种于将碳源从2％葡萄糖代替为2％棉子糖的SR培养基继续培养一夜，进一步接种于将碳源代替为0.2～2％半乳糖的SGal培养基继续培养3小时到二夜左右，进行表达诱导。

对于细胞存活数及Can1突变率的测定，将细胞悬浊液适当稀释并涂布于SD平板培养基及SD-Arg+60mg/l刀豆氨酸平板培养基或者SD+300mg/l刀豆氨酸平板培养基上，将3天后出现的菌落数量作为细胞存活数进行计数。将SD平板中的生存菌落数作为总细胞数，将刀豆氨酸平板中的生存菌落数量作为抗性突变株数，计算并评价突变率。对突变导入部位而言，通过菌落PCR法扩增包含各株的靶标基因区域的DNA片段，然后进行DNA测序，以酵母基因组数据库(http://www.yeastgenome.org/)的序列为基础进行比对分析，并进行鉴定。

<核酸操作>

对DNA而言，利用PCR法、限制酶处理、接合、Gibson Assembly法/人工化学合成中的任一种方法进行加工、构建。对质粒而言，作为酵母-大肠杆菌穿梭载体，使用亮氨酸选择用的pRS315、及尿嘧啶选择用的pRS426作为主链。对质粒而言，利用大肠杆菌株XL-10gold或DH5α进行扩增，通过乙酸锂法导入酵母。

<构建体>

对诱导表达而言，使用了为半乳糖诱导型且为双向启动子的芽殖酵母pGal1/10(序列编号8)。将核定位信号(Nuclear localization signal)(ccc aag aag aag agg aaggtg；序列编号9(PKKKRV；编码序列编号10))添加至已最优化为真核表达用的密码子的来自化脓性链球菌(Streptococcus pyogenes)的Cas9基因ORF(序列编号5)，将添加而成的产物连至启动子下游，通过接头序列与脱氨酶基因(来自七腮鳗(Petromyzon marinus)的PmCDA1或来自人的hAID)的ORF(序列编号1或3)相连，以融合蛋白的形式进行表达。作为接头序列，虽然选择、组合使用了GS接头(ggt gga gga ggt tct；序列编号11(编码GGGGS；序列编号12)的重复)、Flag标签(gac tat aag gac cacgac gga gac tac aag gat cat gatatt gat tac aaa gac gat gac gat aag；序列编号13(编码DYKDHDGDYKDHDIDYKDDDDK；序列编号14))、Strep-标签(tgg agc cac ccg cag ttc gaa aaa；序列编号15(编码WSHPQFEK；序列编号16))、其它结构域，但这里，特别使用了2xGS、SH3结构域(序列编号17及18)、Flag标签相连而成的。作为终止子，与来自芽殖酵母的ADH1终止子(序列编号19)及Top2终止子(序列编号20)相连。另外，在结构域结合方式中，将Cas9基因ORF通过2xGS接头与SH3结构域相连并作为一个蛋白质，将SH3ligand序列(序列编号21及22)添加至脱氨酶并作为另一蛋白质，使其连接至Gal1/10启动子的两个方向。并且使它们同时表达。将它们装配至pRS315质粒。

为了除去各自单侧的DNA链的切割能力，向Cas9中导入了将第10位的天冬氨酸转变为丙氨酸的突变(D10A，对应DNA序列突变a29c)、及第840位的组氨酸转变为丙氨酸的突变(H840A，对应DNA序列突变ca2518gc)。

对gRNA而言，以与tracrRNA(来自Streptococcus pyogenes；序列编号7)的嵌合结构的形式配置在SNR52启动子(序列编号23)和Sup4终止子(序列编号24)之间，装配至pRS426质粒。作为gRNA靶碱基序列，使用了CAN1基因ORF的187-206(gatacgttctctatggagga；序列编号25)(target1)、786-805(ttggagaaacccaggtgcct；序列编号26)(target3)、793-812(aacccaggtgcctggggtcc；序列编号27)(target4)、563-582(ttggccaagtcattcaattt；序列编号28)(target2)及767-786的互补链序列(ataacggaatccaactgggc；序列编号29)(target5r)。在同时表达多个靶标的情况下，使用从启动子到终止子的序列作为1组，并将多个组装配至同一质粒。与Cas9-脱氨酶表达用质粒一起导入细胞，并使其在细胞内表达，形成gRNA-tracrRNA与Cas9-脱氨酶的复合体。

实施例1利用将CRISPR-Cas的DNA序列识别能力与脱氨酶PmCDA1连接来修饰基因组序列

为了试验利用了脱氨酶和CRISPR-Cas的核酸序列识别能力的本发明的基因组序列的修饰技术的效果，尝试了向编码刀豆氨酸转运蛋白的CAN1基因导入突变，其基因缺陷产生刀豆氨酸抗性。使用与CAN1基因ORF的187-206(target1)互补的序列作为gRNA，构建用该gRNA与来自Streptococcus pyogenes的tracrRNA连接而成的嵌合RNA的表达载体，构建表达向来自Streptococcus pyogenes的Cas9(SpCas9)导入突变(D10A及H840A)从而丧失了核酸酶活性的dCas9，与作为脱氨酶的来自七腮鳗的PmCDA1进行融合而成的蛋白质的载体，并利用乙酸锂法导入芽殖酵母内，使它们共表达。结果示于图2。在含有刀豆氨酸的SD平板上培养，则仅导入并表达gRNA-tracrRNA和dCas9-PmCDA1的细胞形成了菌落。选取抗性菌落并测序了CAN1基因区域的序列，结果确认在靶核苷酸序列(target1)内及其附近导入了突变。

实施例2大幅减轻副作用、毒性

在常规型的Cas9及其它人工核酸酶(ZFN、TALEN)中，如果以基因组内的序列为靶标，则产生认为由染色体的无规律切割引起的增殖障碍和细胞死亡。该影响在很多的微生物、原核生物中是特别致命的，阻碍了适用性。

因此，为了验证本发明的基因组序列的修饰技术的安全性及对细胞的毒性，进行了常规型的CRISPR-Cas9的比较实验。通过以CAN1基因内序列(target 3、4)作为gRNA靶标，从半乳糖表达诱导开始后立即到诱导后6小时的生存细胞在SD平板上的菌落形成能力进行了测定。结果示于图3。在常规型Cas9中，由于增殖受到阻碍而诱导细胞死亡，因此细胞存活数减少，与此相对，在本技术(nCas9 D10A-PmCDA1)中，细胞可以持续增殖，细胞存活数大幅增加。

实施例3不同连接类型的使用

检查了如果Cas9和脱氨酶不是融合蛋白形式，而是通过结合结构域和其配体而形成核酸修饰酶复合体，是否也能进行向靶向基因的突变导入。使用了实施例1使用的dCas9作为Cas9，代替PmCDA1使用了人AID作为脱氨酶。将前者与SH3结构域、后者与其结合配体融合，制作成图4所示的各种构建体。另外，使用CAN1基因内序列(target 4、5r)作为gRNA靶标。将它们的构建体导入芽殖酵母。其结果，即使在通过结合结构域将dCas9与脱氨酶连接的情况下，也向CAN1基因的靶向位点有效地导入了突变(图4)。通过向dCas9导入多个结合结构域，突变导入效率显著提高。主要的突变导入部位为ORF的第782位(g782c)。

实施例4由使用切口酶(Nickase)引起的高效化和突变模式的变化

代替dCas9使用了仅切割与gRNA互补的链的D10A突变体nCas9(D10A)、或仅切割与gRNA互补的链的相反链的H840A突变体nCas9(H840A)，除此以外，与实施例1同样地进行，向CAN1基因导入突变，检查含有刀豆氨酸的SD平板上产生的菌落的CAN1基因区域的序列，结果发现在前者(nCas9(D10A))中，效率比dCas9升高(图5)，并且突变集中在靶标序列的中央(图6)。因此，根据该方法可以进行点性突变导入。另一方面，结果发现，在后者(nCas9(H840A))中，效率比dCas9升高(图5)，并且在从靶向的核苷酸到达几百个碱基的区域导入了多个随机突变(图6)。

即使改变靶核苷酸序列，也可以确认同样显著的突变导入，在使用CRISPR-Cas9系统和胞苷脱氨酶的本基因组编辑体系中，确认到如表1所示，在存在于从靶核苷酸序列(20bp)的5’侧到2～5bp左右的范围内的胞嘧啶优先进行脱氨基化。因此，通过基于该规律性设定靶核苷酸序列，并进一步与nCas9(D10A)组合，能够进行1个核苷酸单位的精密的基因组编辑。另一方面，如果使用nCas9(H840A)，则可以在靶核苷酸序列的附近的几百个bp左右的范围同时插入多个突变。进一步，存在通过改变脱氨酶的连接类型，而进一步改变部位特异性的可能性。

根据这些结果显示，可以根据目的不同，适当使用Cas9蛋白质的种类。

[表1]

实施例5通过将邻近的多个DNA序列作为靶标，效率协同性地升高

与单独的靶标相比，通过同时使用邻近的多个靶标，效率大幅升高(图7)。事实上，10～20％的细胞具有刀豆氨酸抗性突变(target3、4)。图中的gRNA1和gRNA2分别以target3和target4为靶。使用PmCDA1作为脱氨酶。确认了不仅在序列的一部分重复的情况下(target3、4)产生该效果，在分离600bp的情况下(target1、3)也产生该效果。另外，在DNA序列为相同方向(target3、4)，和对向(target4、5)(图4)的两种情况下均产生该效果。

实施例6不需要选择标识的基因修饰

对于实施例5中以target3和target4为靶的细胞(Target3、4)，从非选择性(不含刀豆氨酸)的平板(不含有Leu及Ura的SD平板)上长出的菌落中，随机选出10个测序了CAN1基因区域的序列。结果，检查的全部菌落均在CAN1基因的靶向位点导入了突变(图8)。即，根据本发明，如果选择适当的靶向序列，可以期待在表达的细胞的基本全部中发生编辑。因此，不需要常规基因操作中必需的标识基因的插入和选择。其在使基因操作显著地变得简便的同时，由于不是外来DNA重组生物，因此对作物育种等的适用性大幅变宽。

在以下的实施例中，对与实施例1～6共同的实验技术，与上述同样地进行。

实施例7多个部位(不同基因)的同时编辑

在通常的基因操作方法中，由于有各种限制，因此通常在一次操作中只能进行一个部位的突变。因此，试验了使用本发明的方法是否能能够同时进行多个部位的突变操作。

将芽殖酵母株BY4741株的Ade1基因ORF的3-22位作为第1靶核苷酸序列(Ade1target5:GTCAATTACGAAGACTGAAC；序列编号30)，将Can1基因ORF的767-786位(互补链)作为第2靶核苷酸序列(Can1target8(786-767；ATAACGGAATCCAACTGGGC；序列编号29)，使分别包含编码与它们互补的核苷酸序列的两种gRNA与tracrRNA(序列编号7)的嵌合RNA的DNA两者，搭载于同一质粒(pRS426)，并与包含编码突变Cas9与PmCDA1的融合蛋白的核酸的质粒nCas9 D10A-PmCDA1一起，导入BY4741株并使其表达，验证对两个基因的突变导入。以保持质粒的SD撤除成分培养基(Dropout,尿嘧啶及亮氨酸缺陷；SD-UL)为基础，培养细胞。适当稀释细胞，涂布至SD-UL及添加刀豆氨酸的培养基，形成菌落。于28℃培养2天后，观察菌落，分别计数由ade1突变引起的红色菌落的发生率，和在刀豆氨酸培养基中的存活率。将结果示于表2中。

[表2]

作为表型，向Ade1基因及Can1基因的两者均导入了突变的比例高，为约31％。

下面，利用PCR对SD-UL培养基上的菌落进行扩增并测序分析。对包含Ade1和Can1各自的ORF区域进行拓宽，获得靶标序列周边500b左右的序列的测序信息。具体而言，分析了红菌落5个和白菌落5个，结果全部红菌落的Ade1基因ORF的第5位的C转变为G，全部白菌落的第5位的C转变为T(图9)。虽然靶标的突变率为100％，但由于作为目的在于基因破坏的突变率，需要使第5位的C变为G而成为终止密码子，因此，认为期望的突变率为50％。相同地，对于Can1基因，虽然确认在全部克隆中，发生了ORF的第782位的G的突变(图9)，但由于仅变为C的突变能提供刀豆氨酸抗性，因此，作为期望的突变率为70％。在检查的范围内，对于两种基因同时得到期望的突变的比例为40％克隆(10个克隆中占4个克隆)，事实上得到了较高的效率。

实施例8多倍体基因组的编辑

虽然很多生物具有二倍体或多倍体的基因组，但在常规的突变导入方法中，作为原则仅向同源染色体的一条中导入突变而形成异源基因型，因此，如果不是显性突变，就得不到需要的特征，而使其同源则耗时耗力。因此，试验了根据本发明的技术，是否能够向基因组内的同源染色体上的全部靶等位基因内导入突变。

即，在二倍体株的芽殖酵母YPH501株中，进行Ade1及Can1基因的同时编辑。由于这些基因突变的表型(红色菌落及刀豆氨酸抗性)是劣势表型，因此，如果不是导入了基因的两方的突变(同源突变)，则这些表型不会表现。

将Ade1基因ORF的1173-1154位(互补链)(Ade1 target1：GTCAATAGGATCCCCTTTT；序列编号31)或者3-22位(Ade1 target5：GTCAATTACGAAGACTGAAC；序列编号30)作为第1靶核苷酸序列，将Can1基因ORF的767-786位(互补链)作为第2靶核苷酸序列(Can1 target8：ATAACGGAATCCAACTGGGC；序列编号29)，使分别包含编码与它们互补的核苷酸序列的两种gRNA与tracrRNA(序列编号7)的嵌合RNA的DNA两者，搭载于同一质粒(pRS426)，并与包含编码突变Cas9与PmCDA1的融合蛋白的核酸的质粒nCas9 D10A-PmCDA1一起，导入BY4741株并使其表达，验证了向各基因的突变导入。

菌落计数的结果可知，可以以高概率(40％～70％)获得每个表型的特征(图10A)。

进一步，为了确认突变，进行了白菌落和红菌落各自的Ade1靶区域的测序，结果在白菌落中靶向部位确认到显示异源突变的测序信号的重叠(图10B的上图，↓处G和T的信号发生重叠)。确认在异源突变的菌落中没有出现表型。另一方面，在红菌落中，确认了没有重叠的信号，为同源突变(图10B下图，↓处为T的信号)。

实施例9大肠杆菌中的基因组编辑

在本实施例中，验证在作为细菌的代表性模型生物的大肠杆菌中，本技术有效地发挥功能。特别是，由于在细菌中，常规的核酸酶型的基因组编辑技术是致死的而难以适用，因此强调本技术的优越性。另外，与作为真核生物的模型细胞的酵母一起，显示无论在原核还是真核生物种类中均可广泛适用。

向包含双向启动子区域的Streptococcus pyogenes Cas9基因导入D10A及H840A的氨基酸突变(dCas9)，构建通过接头序列以与PmCDA1的融合蛋白的形式表达的构建体，进一步制作了同时包括编码与各靶核苷酸序列互补的序列的嵌合gRNA的质粒(全长核苷酸序列示于序列编号32。向该序列中n₂₀的部分导入与各靶标序列互补的序列)(图11A)。

首先，将以大肠杆菌galK基因ORF的426-445位(T CAA TGG GCT AAC TAC GTT C；序列编号33)为靶核苷酸序列导入的质粒，利用钙法或电穿孔法转化至各种大肠杆菌株(XL10-gold、DH5a、MG1655、BW25113)，添加SOC培养基恢复培养一夜，然后通过含有氨苄青霉素LB培养基选择负载质粒的细胞，使其形成菌落。通过由菌落PCR直接测序，验证了突变导入。结果示于图11B。

随机选出独立的菌落(1～3)，进行测序分析，结果确认了有60％以上的概率将ORF的427位的C转变为T(克隆2、3)，从而产生终止密码子(TAA)的基因发生破坏。

下面，以作为必需基因的rpoB基因ORF的1530-1549碱基区域的互补序列(5’-GGTCCATAAACTGAGACAGC-3’；序列编号34)作为靶标，通过与上述同样的方法导入特定的点突变，尝试了对大肠杆菌赋予利福平抗性功能。对利用含有非选择性培养基(none)、25μg/ml利福平(Rif25)及50μg/ml利福平(Rif50)的培养基中选择的菌落进行测序分析，结果确认，通过将ORF的1546位的G转变为A，导入了将Asp(GAC)变为Asn(AAC)的氨基酸突变，赋予了利福平抗性(图11C，上图)。将经转化处理后的细胞悬浊液的10倍稀释系列，分别点在含有非选择性培养基(none)、25μg/ml利福平(Rif25)及50μg/ml利福平(Rif50)培养基上并培养，结果可见以约10％的频率得到了利福平抗性株(图11C，下图)。

像这样，根据本技术，不仅可以破坏基因，还可以通过特定的点突变来添加新的功能。另外，在直接编辑必需基因的方面，也显示了本技术的优越性。

实施例10利用gRNA长度来调节编辑碱基部位

以往，针对靶核苷酸序列的gRNA长度以20b为基础，并以存在于从其5’末端到2～5b(PAM序列的上游15～19b)的部位的胞嘧啶(或相反链的鸟嘌呤)作为突变靶标。检查了如果表达使该gRNA长度改变的核酸，与其对应的作为靶标的碱基的部位是否移动(图12A)。

将利用大肠杆菌进行的实验例示于图12B。检索在大肠杆菌基因组上的胞嘧啶多个排列的部位，使用作为putative ABC-转运蛋白的gsiA基因进行实验。检查了将靶的长度变为24bp、22bp、20bp、18bp时的取代的胞嘧啶，结果在20bp(标准长度)的情况下，第898、899位的胞嘧啶被取代为胸腺嘧啶。可知，在靶向部位长于20bp的情况下，第896和897位的胞嘧啶也被取代，在靶向部位较短的情况下，第900和901位的胞嘧啶也可被取代，实际上可以通过改变gRNA的长度使靶向部位移动。

实施例11温度依赖性基因组编辑质粒的开发

将本发明的核酸修饰酶复合体设计为利用高温条件进行表达诱导的方式的质粒。目的在于通过限定表达状态进行控制而将效率最优化，并且减轻副作用(产生宿主的生长障碍、突变导入效率不稳定、对与靶标不同的部位的突变)。同时，通过组合利用高温停止质粒的复制的机制，意图在编辑后同时且容易地进行质粒的除去。以下示出实验的细节。

将温度敏感性质粒pSC101-Rep101系(pSC101 ori的序列示于序列编号35，温度敏感性Rep101的序列示于序列编号36)作为主链(backbone)，使用温度敏感性的λ阻遏物(cI857)系统表达诱导。向基因组编辑用的λ阻遏物导入RecA抗性的G113E突变，使得在SOS应答下也正常发挥功能(序列编号37)。将dCas9-PmCDA1(序列编号38)连接至RightOperator(序列编号39)、gRNA(序列编号40)连接至Left Operator(序列编号41)的下游，使得控制表达(构建成的表达载体的所有核苷酸序列示于序列编号42)。在30℃以下培养时期，由于分别抑制了gRNA的转录和dCas9-PmCDA1的表达，因此细胞可以正常增殖。当在37℃以上培养时，诱导gRNA的转录和dCas9-PmCDA1的表达，而与此同时抑制质粒的复制，因此，一过性地地供给对基因组编辑所必须的核酸修饰酶复合体，可以在编辑之后容易地除去质粒(图13)。

碱基取代的具体的方案示于图14。

进行质粒构建时的培养温度设为28℃左右，首先建立保持所需质粒的大肠杆菌菌落。下面，直接使用菌落，或当菌株改变的情况下提取质粒，再次进行向靶菌株的转化，使用得到的菌落。在28℃进行液体培养一夜。随后，利用培养基稀释，在42℃进行从1小时到一夜左右的诱导培养，适当稀释细胞悬浊液并铺展或点在板上，得到单个菌落。

作为验证实验，进行了向作为必需基因的rpoB的点突变导入。作为RNA聚合酶的构成因素之一的rpoB如果缺失或失能，则大肠杆菌将不能存活。一方面，已知通过向特定的部位引入点突变，获得相对于作为抗生素的利福平(Rif)的抗性。因此，为了导入这样的点突变而选定靶向部位，并进行测定。

结果示于图15。左上图的左为LB(添加氯霉素)平板，右为添加了利福平的LB(添加氯霉素)平板，利用这些平板准备了在28℃*42℃培养时有或无氯霉素的样品。虽然在28℃培养的情况下，Rif抗性的比例较低，但在42℃培养的情况下，以极高的效率得到了利福平抗性。对实际LB上得到的菌落(非选择)的8个菌落测序，结果可知，在42℃培养的菌株有60％以上的比例的第1546位的鸟嘌呤(g)被取代为腺嘌呤(A)(左下及右上图)。可知在实际的测序谱(右下图)中，碱基也被完全取代了。

类似地，进行对参与半乳糖代谢的因素之一的galK的碱基取代。由于对大肠杆菌而言，galK通过代谢作为半乳糖的类似物的2-脱氧半乳糖(2DOG)而致死，因此，将其用作选择方法。分别设定了靶向位点，使得对target 8引起错义突变，target 12成为终止密码子(图16右下)。

结果示于图16。在左上和左下图中，左侧为LB(添加氯霉素)平板，右侧为添加了2-DOG的LB(添加氯霉素)平板，利用这些平板准备了在28℃、42℃培养时有或无氯霉素的样品。在target 8中，在添加2-DOG的平板中仅轻微产生菌落(左上图)，但对LB上的菌落(红框)3个菌落测序，确定全部菌落中的第61位胞嘧啶(C)被取代为胸腺嘧啶(T)(右上)。推测该突变不足以造成galK的失能。另一方面，在target 12中，在28℃、42℃培养的任一情况下，在2-DOG添加板中均得到菌落(左下图)。对LB上的3个菌落进行测序，确定全部菌落中的第271位胞嘧啶被胸腺嘧啶取代(右下)。显示即使在这样的不同的靶中，也可以更稳定且高效地导入突变。

包含在此提到的专利及专利申请说明书的全部出版物中记载的内容，通过在此引用，将其整体与已写明的程度相同地并入本说明书。

本申请分别基于2014年3月5日及同年9月30日在日本提交的日本特愿2014-43348及日本特愿2014-201859，通过引用将其内容全部并入本说明书。

工业实用性

根据本发明，可以没有外源DNA的插入也没有DNA双链的切割，安全地向任意生物种类导入部位特异性的突变。另外，能够将突变导入的范围在从一个碱基的针点(pinpoint)至几百个碱基的范围进行广泛设定，也可以应用于利用向迄今为止几乎不可能进行的特定的限定区域随机导入突变的局部进化诱导，极其有用。

SEQUENCE LISTING

<110> 国立大学法人神户大学(NATIONAL UNIVERSITY CORPORATION KOBEUNIVERSITY)

<120> 特异性转变靶向DNA序列的核酸碱基的基因组序列的修饰方法、及其使用的分子复合体(Method of modifying genomic sequence comprising specifically

converting nucleobase in targeted DNA sequence and molecular complex usedtherefor)

<130> 092301

<150> JP 2014-043348

<151> 2014-03-05

<150> JP 2014-201859

<151> 2014-09-30

<160> 42

<170> PatentIn version 3.5

<210> 1

<211> 624

<212> DNA

<213> 七腮鳗(Petromyzon marinus)

<220>

<221> CDS

<222> (1)..(624)

<400> 1

atg acc gac gct gag tac gtg aga atc cat gag aag ttg gac atc tac 48

Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr

1 5 10 15

acg ttt aag aaa cag ttt ttc aac aac aaa aaa tcc gtg tcg cat aga 96

Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His Arg

20 25 30

tgc tac gtt ctc ttt gaa tta aaa cga cgg ggt gaa cgt aga gcg tgt 144

Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys

35 40 45

ttt tgg ggc tat gct gtg aat aaa cca cag agc ggg aca gaa cgt ggc 192

Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly

50 55 60

att cac gcc gaa atc ttt agc att aga aaa gtc gaa gaa tac ctg cgc 240

Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg

65 70 75 80

gac aac ccc gga caa ttc acg ata aat tgg tac tca tcc tgg agt cct 288

Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro

85 90 95

tgt gca gat tgc gct gaa aag atc tta gaa tgg tat aac cag gag ctg 336

Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu

100 105 110

cgg ggg aac ggc cac act ttg aaa atc tgg gct tgc aaa ctc tat tac 384

Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr

115 120 125

gag aaa aat gcg agg aat caa att ggg ctg tgg aac ctc aga gat aac 432

Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn

130 135 140

ggg gtt ggg ttg aat gta atg gta agt gaa cac tac caa tgt tgc agg 480

Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg

145 150 155 160

aaa ata ttc atc caa tcg tcg cac aat caa ttg aat gag aat aga tgg 528

Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp

165 170 175

ctt gag aag act ttg aag cga gct gaa aaa cga cgg agc gag ttg tcc 576

Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu Leu Ser

180 185 190

att atg att cag gta aaa ata ctc cac acc act aag agt cct gct gtt 624

Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val

195 200 205

<210> 2

<211> 208

<212> PRT

<213> 七腮鳗

<400> 2

Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr

1 5 10 15

Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His Arg

20 25 30

Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys

35 40 45

Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly

50 55 60

Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg

65 70 75 80

Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro

85 90 95

Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu

100 105 110

Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr

115 120 125

Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn

130 135 140

Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg

145 150 155 160

Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp

165 170 175

Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu Leu Ser

180 185 190

Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val

195 200 205

<210> 3

<211> 600

<212> DNA

<213> 人(Homo sapiens)

<220>

<221> CDS

<222> (1)..(600)

<400> 3

atg gac agc ctc ttg atg aac cgg agg aag ttt ctt tac caa ttc aaa 48

Met Asp Ser Leu Leu Met Asn Arg Arg Lys Phe Leu Tyr Gln Phe Lys

1 5 10 15

aat gtc cgc tgg gct aag ggt cgg cgt gag acc tac ctg tgc tac gta 96

Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys Tyr Val

20 25 30

gtg aag agg cgt gac agt gct aca tcc ttt tca ctg gac ttt ggt tat 144

Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp Phe Gly Tyr

35 40 45

ctt cgc aat aag aac ggc tgc cac gtg gaa ttg ctc ttc ctc cgc tac 192

Leu Arg Asn Lys Asn Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr

50 55 60

atc tcg gac tgg gac cta gac cct ggc cgc tgc tac cgc gtc acc tgg 240

Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp

65 70 75 80

ttc acc tcc tgg agc ccc tgc tac gac tgt gcc cga cat gtg gcc gac 288

Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp

85 90 95

ttt ctg cga ggg aac ccc tac ctc agt ctg agg atc ttc acc gcg cgc 336

Phe Leu Arg Gly Asn Pro Tyr Leu Ser Leu Arg Ile Phe Thr Ala Arg

100 105 110

ctc tac ttc tgt gag gac cgc aag gct gag ccc gag ggg ctg cgg cgg 384

Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg

115 120 125

ctg cac cgc gcc ggg gtg caa ata gcc atc atg acc ttc aaa gat tat 432

Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp Tyr

130 135 140

ttt tac tgc tgg aat act ttt gta gaa aac cat gaa aga act ttc aaa 480

Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His Glu Arg Thr Phe Lys

145 150 155 160

gcc tgg gaa ggg ctg cat gaa aat tca gtt cgt ctc tcc aga cag ctt 528

Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln Leu

165 170 175

cgg cgc atc ctt ttg ccc ctg tat gag gtt gat gac tta cga gac gca 576

Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp Ala

180 185 190

ttt cgt act ttg gga ctt ctc gac 600

Phe Arg Thr Leu Gly Leu Leu Asp

195 200

<210> 4

<211> 200

<212> PRT

<213> 人

<400> 4

Met Asp Ser Leu Leu Met Asn Arg Arg Lys Phe Leu Tyr Gln Phe Lys

1 5 10 15

Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys Tyr Val

20 25 30

Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp Phe Gly Tyr

35 40 45

Leu Arg Asn Lys Asn Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr

50 55 60

Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp

65 70 75 80

Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp

85 90 95

Phe Leu Arg Gly Asn Pro Tyr Leu Ser Leu Arg Ile Phe Thr Ala Arg

100 105 110

Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg

115 120 125

Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp Tyr

130 135 140

Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His Glu Arg Thr Phe Lys

145 150 155 160

Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln Leu

165 170 175

Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp Ala

180 185 190

Phe Arg Thr Leu Gly Leu Leu Asp

195 200

<210> 5

<211> 4116

<212> DNA

<213> 人工序列

<220>

<223> 化脓性链球菌来源的Cas9 CDS, 优化用于真核生物表达

<220>

<221> CDS

<222> (1)..(4116)

<400> 5

atg gac aag aag tac tcc att ggg ctc gat atc ggc aca aac agc gtc 48

Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val

1 5 10 15

ggt tgg gcc gtc att acg gac gag tac aag gtg ccg agc aaa aaa ttc 96

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

aaa gtt ctg ggc aat acc gat cgc cac agc ata aag aag aac ctc att 144

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

ggc gcc ctc ctg ttc gac tcc ggg gag acg gcc gaa gcc acg cgg ctc 192

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

aaa aga aca gca cgg cgc aga tat acc cgc aga aag aat cgg atc tgc 240

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

tac ctg cag gag atc ttt agt aat gag atg gct aag gtg gat gac tct 288

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

ttc ttc cat agg ctg gag gag tcc ttt ttg gtg gag gag gat aaa aag 336

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

cac gag cgc cac cca atc ttt ggc aat atc gtg gac gag gtg gcg tac 384

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

cat gaa aag tac cca acc ata tat cat ctg agg aag aag ctt gta gac 432

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

agt act gat aag gct gac ttg cgg ttg atc tat ctc gcg ctg gcg cat 480

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

atg atc aaa ttt cgg gga cac ttc ctc atc gag ggg gac ctg aac cca 528

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

gac aac agc gat gtc gac aaa ctc ttt atc caa ctg gtt cag act tac 576

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

aat cag ctt ttc gaa gag aac ccg atc aac gca tcc gga gtt gac gcc 624

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

aaa gca atc ctg agc gct agg ctg tcc aaa tcc cgg cgg ctc gaa aac 672

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

ctc atc gca cag ctc cct ggg gag aag aag aac ggc ctg ttt ggt aat 720

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

225 230 235 240

ctt atc gcc ctg tca ctc ggg ctg acc ccc aac ttt aaa tct aac ttc 768

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

gac ctg gcc gaa gat gcc aag ctt caa ctg agc aaa gac acc tac gat 816

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

gat gat ctc gac aat ctg ctg gcc cag atc ggc gac cag tac gca gac 864

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

ctt ttt ttg gcg gca aag aac ctg tca gac gcc att ctg ctg agt gat 912

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

att ctg cga gtg aac acg gag atc acc aaa gct ccg ctg agc gct agt 960

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

atg atc aag cgc tat gat gag cac cac caa gac ttg act ttg ctg aag 1008

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

gcc ctt gtc aga cag caa ctg cct gag aag tac aag gaa att ttc ttc 1056

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

gat cag tct aaa aat ggc tac gcc gga tac att gac ggc gga gca agc 1104

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

cag gag gaa ttt tac aaa ttt att aag ccc atc ttg gaa aaa atg gac 1152

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

ggc acc gag gag ctg ctg gta aag ctt aac aga gaa gat ctg ttg cgc 1200

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

aaa cag cgc act ttc gac aat gga agc atc ccc cac cag att cac ctg 1248

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

ggc gaa ctg cac gct atc ctc agg cgg caa gag gat ttc tac ccc ttt 1296

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

ttg aaa gat aac agg gaa aag att gag aaa atc ctc aca ttt cgg ata 1344

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

ccc tac tat gta ggc ccc ctc gcc cgg gga aat tcc aga ttc gcg tgg 1392

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

atg act cgc aaa tca gaa gag acc atc act ccc tgg aac ttc gag gaa 1440

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

gtc gtg gat aag ggg gcc tct gcc cag tcc ttc atc gaa agg atg act 1488

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

aac ttt gat aaa aat ctg cct aac gaa aag gtg ctt cct aaa cac tct 1536

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

ctg ctg tac gag tac ttc aca gtt tat aac gag ctc acc aag gtc aaa 1584

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

tac gtc aca gaa ggg atg aga aag cca gca ttc ctg tct gga gag cag 1632

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

aag aaa gct atc gtg gac ctc ctc ttc aag acg aac cgg aaa gtt acc 1680

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

gtg aaa cag ctc aaa gaa gac tat ttc aaa aag att gaa tgt ttc gac 1728

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

tct gtt gaa atc agc gga gtg gag gat cgc ttc aac gca tcc ctg gga 1776

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

acg tat cac gat ctc ctg aaa atc att aaa gac aag gac ttc ctg gac 1824

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

aat gag gag aac gag gac att ctt gag gac att gtc ctc acc ctt acg 1872

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

ttg ttt gaa gat agg gag atg att gaa gaa cgc ttg aaa act tac gct 1920

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

cat ctc ttc gac gac aaa gtc atg aaa cag ctc aag agg cgc cga tat 1968

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

aca gga tgg ggg cgg ctg tca aga aaa ctg atc aat ggg atc cga gac 2016

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

aag cag agt gga aag aca atc ctg gat ttt ctt aag tcc gat gga ttt 2064

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

gcc aac cgg aac ttc atg cag ttg atc cat gat gac tct ctc acc ttt 2112

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

aag gag gac atc cag aaa gca caa gtt tct ggc cag ggg gac agt ctt 2160

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

cac gag cac atc gct aat ctt gca ggt agc cca gct atc aaa aag gga 2208

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

ata ctg cag acc gtt aag gtc gtg gat gaa ctc gtc aaa gta atg gga 2256

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

agg cat aag ccc gag aat atc gtt atc gag atg gcc cga gag aac caa 2304

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

act acc cag aag gga cag aag aac agt agg gaa agg atg aag agg att 2352

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

gaa gag ggt ata aaa gaa ctg ggg tcc caa atc ctt aag gaa cac cca 2400

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

gtt gaa aac acc cag ctt cag aat gag aag ctc tac ctg tac tac ctg 2448

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

cag aac ggc agg gac atg tac gtg gat cag gaa ctg gac atc aat cgg 2496

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

ctc tcc gac tac gac gtg gat cat atc gtg ccc cag tct ttt ctc aaa 2544

Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

gat gat tct att gat aat aaa gtg ttg aca aga tcc gat aaa aat aga 2592

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

850 855 860

ggg aag agt gat aac gtc ccc tca gaa gaa gtt gtc aag aaa atg aaa 2640

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

aat tat tgg cgg cag ctg ctg aac gcc aaa ctg atc aca caa cgg aag 2688

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

ttc gat aat ctg act aag gct gaa cga ggt ggc ctg tct gag ttg gat 2736

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

aaa gcc ggc ttc atc aaa agg cag ctt gtt gag aca cgc cag atc acc 2784

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

aag cac gtg gcc caa att ctc gat tca cgc atg aac acc aag tac gat 2832

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

gaa aat gac aaa ctg att cga gag gtg aaa gtt att act ctg aag tct 2880

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

aag ctg gtc tca gat ttc aga aag gac ttt cag ttt tat aag gtg aga 2928

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

965 970 975

gag atc aac aat tac cac cat gcg cat gat gcc tac ctg aat gca gtg 2976

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

980 985 990

gta ggc act gca ctt atc aaa aaa tat ccc aag ctt gaa tct gaa ttt 3024

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe

995 1000 1005

gtt tac gga gac tat aaa gtg tac gat gtt agg aaa atg atc gca 3069

Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala

1010 1015 1020

aag tct gag cag gaa ata ggc aag gcc acc gct aag tac ttc ttt 3114

Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe

1025 1030 1035

tac agc aat att atg aat ttt ttc aag acc gag att aca ctg gcc 3159

Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala

1040 1045 1050

aat gga gag att cgg aag cga cca ctt atc gaa aca aac gga gaa 3204

Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu

1055 1060 1065

aca gga gaa atc gtg tgg gac aag ggt agg gat ttc gcg aca gtc 3249

Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val

1070 1075 1080

cgg aag gtc ctg tcc atg ccg cag gtg aac atc gtt aaa aag acc 3294

Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr

1085 1090 1095

gaa gta cag acc gga ggc ttc tcc aag gaa agt atc ctc ccg aaa 3339

Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys

1100 1105 1110

agg aac agc gac aag ctg atc gca cgc aaa aaa gat tgg gac ccc 3384

Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro

1115 1120 1125

aag aaa tac ggc gga ttc gat tct cct aca gtc gct tac agt gta 3429

Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val

1130 1135 1140

ctg gtt gtg gcc aaa gtg gag aaa ggg aag tct aaa aaa ctc aaa 3474

Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys

1145 1150 1155

agc gtc aag gaa ctg ctg ggc atc aca atc atg gag cga tca agc 3519

Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser

1160 1165 1170

ttc gaa aaa aac ccc atc gac ttt ctc gag gcg aaa gga tat aaa 3564

Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys

1175 1180 1185

gag gtc aaa aaa gac ctc atc att aag ctt ccc aag tac tct ctc 3609

Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu

1190 1195 1200

ttt gag ctt gaa aac ggc cgg aaa cga atg ctc gct agt gcg ggc 3654

Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly

1205 1210 1215

gag ctg cag aaa ggt aac gag ctg gca ctg ccc tct aaa tac gtt 3699

Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val

1220 1225 1230

aat ttc ttg tat ctg gcc agc cac tat gaa aag ctc aaa ggg tct 3744

Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser

1235 1240 1245

ccc gaa gat aat gag cag aag cag ctg ttc gtg gaa caa cac aaa 3789

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys

1250 1255 1260

cac tac ctt gat gag atc atc gag caa ata agc gaa ttc tcc aaa 3834

His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys

1265 1270 1275

aga gtg atc ctc gcc gac gct aac ctc gat aag gtg ctt tct gct 3879

Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala

1280 1285 1290

tac aat aag cac agg gat aag ccc atc agg gag cag gca gaa aac 3924

Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn

1295 1300 1305

att atc cac ttg ttt act ctg acc aac ttg ggc gcg cct gca gcc 3969

Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala

1310 1315 1320

ttc aag tac ttc gac acc acc ata gac aga aag cgg tac acc tct 4014

Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser

1325 1330 1335

aca aag gag gtc ctg gac gcc aca ctg att cat cag tca att acg 4059

Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr

1340 1345 1350

ggg ctc tat gaa aca aga atc gac ctc tct cag ctc ggt gga gac 4104

Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp

1355 1360 1365

agc agg gct gac 4116

Ser Arg Ala Asp

1370

<210> 6

<211> 1372

<212> PRT

<213> 人工序列

<220>

<223> 合成构建物(Synthetic Construct)

<400> 6

Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

225 230 235 240

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

850 855 860

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

965 970 975

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

980 985 990

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe

995 1000 1005

Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala

1010 1015 1020

Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe

1025 1030 1035

Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala

1040 1045 1050

Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu

1055 1060 1065

Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val

1070 1075 1080

Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr

1085 1090 1095

Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys

1100 1105 1110

Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro

1115 1120 1125

Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val

1130 1135 1140

Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys

1145 1150 1155

Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser

1160 1165 1170

Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys

1175 1180 1185

Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu

1190 1195 1200

Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly

1205 1210 1215

Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val

1220 1225 1230

Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser

1235 1240 1245

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys

1250 1255 1260

His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys

1265 1270 1275

Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala

1280 1285 1290

Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn

1295 1300 1305

Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala

1310 1315 1320

Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser

1325 1330 1335

Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr

1340 1345 1350

Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp

1355 1360 1365

Ser Arg Ala Asp

1370

<210> 7

<211> 83

<212> DNA

<213> 化脓性链球菌

<400> 7

gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60

ggcaccgagt cggtggtgct ttt 83

<210> 8

<211> 665

<212> DNA

<213> 酿酒酵母(Saccharomyces cerevisiae)

<400> 8

tttcaaaaat tcttactttt tttttggatg gacgcaaaga agtttaataa tcatattaca 60

tggcattacc accatataca tatccatata catatccata tctaatctta cttatatgtt 120

gtggaaatgt aaagagcccc attatcttag cctaaaaaaa ccttctcttt ggaactttca 180

gtaatacgct taactgctca ttgctatatt gaagtacgga ttagaagccg ccgagcgggt 240

gacagccctc cgaaggaaga ctctcctccg tgcgtcctcg tcttcaccgg tcgcgttcct 300

gaaacgcaga tgtgcctcgc gccgcactgc tccgaacaat aaagattcta caatactagc 360

ttttatggtt atgaagagga aaaattggca gtaacctggc cccacaaacc ttcaaatgaa 420

cgaatcaaat taacaaccat aggatgataa tgcgattagt tttttagcct tatttctggg 480

gtaattaatc agcgaagcga tgatttttga tctattaaca gatatataaa tgcaaaaact 540

gcataaccac tttaactaat actttcaaca ttttcggttt gtattacttc ttattcaaat 600

gtaataaaag tatcaacaaa aaattgttaa tatacctcta tactttaacg tcaaggagaa 660

aaaac 665

<210> 9

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 核跃迁信号(Nuclear transition signal).

<220>

<221> CDS

<222> (1)..(21)

<400> 9

ccc aag aag aag agg aag gtg 21

Pro Lys Lys Lys Arg Lys Val

1 5

<210> 10

<211> 7

<212> PRT

<213> 人工序列

<220>

<223> 合成构建物

<400> 10

Pro Lys Lys Lys Arg Lys Val

1 5

<210> 11

<211> 15

<212> DNA

<213> 人工序列

<220>

<223> GS linker

<220>

<221> CDS

<222> (1)..(15)

<400> 11

ggt gga gga ggt tct 15

Gly Gly Gly Gly Ser

1 5

<210> 12

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> 合成构建物

<400> 12

Gly Gly Gly Gly Ser

1 5

<210> 13

<211> 66

<212> DNA

<213> 人工序列

<220>

<223> Flag tag

<220>

<221> CDS

<222> (1)..(66)

<400> 13

gac tat aag gac cac gac gga gac tac aag gat cat gat att gat tac 48

Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr

1 5 10 15

aaa gac gat gac gat aag 66

Lys Asp Asp Asp Asp Lys

20

<210> 14

<211> 22

<212> PRT

<213> 人工序列

<220>

<223> 合成构建物

<400> 14

Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr

1 5 10 15

Lys Asp Asp Asp Asp Lys

20

<210> 15

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> Strep-tag

<220>

<221> CDS

<222> (1)..(24)

<400> 15

tgg agc cac ccg cag ttc gaa aaa 24

Trp Ser His Pro Gln Phe Glu Lys

1 5

<210> 16

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 合成构建物

<400> 16

Trp Ser His Pro Gln Phe Glu Lys

1 5

<210> 17

<211> 171

<212> DNA

<213> 人工序列

<220>

<223> SH3 结构域

<220>

<221> CDS

<222> (1)..(171)

<400> 17

gca gag tat gtg cgg gcc ctc ttt gac ttt aat ggg aat gat gaa gaa 48

Ala Glu Tyr Val Arg Ala Leu Phe Asp Phe Asn Gly Asn Asp Glu Glu

1 5 10 15

gat ctt ccc ttt aag aaa gga gac atc ctg aga atc cgg gat aag cct 96

Asp Leu Pro Phe Lys Lys Gly Asp Ile Leu Arg Ile Arg Asp Lys Pro

20 25 30

gaa gag cag tgg tgg aat gca gag gac agc gaa gga aag agg ggg atg 144

Glu Glu Gln Trp Trp Asn Ala Glu Asp Ser Glu Gly Lys Arg Gly Met

35 40 45

att cct gtc cct tac gtg gag aag tat 171

Ile Pro Val Pro Tyr Val Glu Lys Tyr

50 55

<210> 18

<211> 57

<212> PRT

<213> 人工序列

<220>

<223> 合成构建物

<400> 18

Ala Glu Tyr Val Arg Ala Leu Phe Asp Phe Asn Gly Asn Asp Glu Glu

1 5 10 15

Asp Leu Pro Phe Lys Lys Gly Asp Ile Leu Arg Ile Arg Asp Lys Pro

20 25 30

Glu Glu Gln Trp Trp Asn Ala Glu Asp Ser Glu Gly Lys Arg Gly Met

35 40 45

Ile Pro Val Pro Tyr Val Glu Lys Tyr

50 55

<210> 19

<211> 188

<212> DNA

<213> Saccharomyces cerevisiae

<400> 19

gcgaatttct tatgatttat gatttttatt attaaataag ttataaaaaa aataagtgta 60

tacaaatttt aaagtgactc ttaggtttta aaacgaaaat tcttattctt gagtaactct 120

ttcctgtagg tcaggttgct ttctcaggta tagcatgagg tcgctcttat tgaccacacc 180

tctaccgg 188

<210> 20

<211> 417

<212> DNA

<213> Saccharomyces cerevisiae

<400> 20

ataccaggca tggagcttat ctggtccgtt cgagttttcg acgagtttgg agacattctt 60

tatagatgtc cttttttttt aatgatattc gttaaagaac aaaaagtcaa agcagtttaa 120

cctaacacct gttgttgatg ctacttgaaa caaggcttct aggcgaatac ttaaaaaggt 180

aatttcaata gcggtttata tatctgtttg cttttcaaga tattatgtaa acgcacgatg 240

tttttcgccc aggctttatt ttttttgttg ttgttgtctt ctcgaagaat tttctcgggc 300

agatctttgt cggaatgtaa aaaagcgcgt aattaaactt tctattatgc tgactaaaat 360

ggaagtgatc accaaaggct atttctgatt atataatcta gtcattactc gctcgag 417

<210> 21

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> SH3-结合配体

<220>

<221> CDS

<222> (1)..(33)

<400> 21

cct cca cct gct ctg cca cct aag aga agg aga 33

Pro Pro Pro Ala Leu Pro Pro Lys Arg Arg Arg

1 5 10

<210> 22

<211> 11

<212> PRT

<213> 人工序列

<220>

<223> 合成构建物

<400> 22

Pro Pro Pro Ala Leu Pro Pro Lys Arg Arg Arg

1 5 10

<210> 23

<211> 269

<212> DNA

<213> 酿酒酵母

<400> 23

tctttgaaaa gataatgtat gattatgctt tcactcatat ttatacagaa acttgatgtt 60

ttctttcgag tatatacaag gtgattacat gtacgtttga agtacaactc tagattttgt 120

agtgccctct tgggctagcg gtaaaggtgc gcattttttc acaccctaca atgttctgtt 180

caaaagattt tggtcaaacg ctgtagaagt gaaagttggt gcgcatgttt cggcgttcga 240

aacttctccg cagtgaaaga taaatgatc 269

<210> 24

<211> 14

<212> DNA

<213> 酿酒酵母

<400> 24

tgttttttat gtct 14

<210> 25

<211> 20

<212> DNA

<213> 酿酒酵母

<400> 25

gatacgttct ctatggagga 20

<210> 26

<211> 20

<212> DNA

<213> 酿酒酵母

<400> 26

ttggagaaac ccaggtgcct 20

<210> 27

<211> 20

<212> DNA

<213> 酿酒酵母

<400> 27

aacccaggtg cctggggtcc 20

<210> 28

<211> 20

<212> DNA

<213> 酿酒酵母

<400> 28

ttggccaagt cattcaattt 20

<210> 29

<211> 20

<212> DNA

<213> 酿酒酵母

<400> 29

ataacggaat ccaactgggc 20

<210> 30

<211> 20

<212> DNA

<213> 酿酒酵母

<400> 30

gtcaattacg aagactgaac 20

<210> 31

<211> 19

<212> DNA

<213> 酿酒酵母

<400> 31

gtcaatagga tcccctttt 19

<210> 32

<211> 10126

<212> DNA

<213> 人工序列

<220>

<223> 质粒搭载dCas9-PmCDA1融合蛋白和嵌合RNA

靶向E.coli的galK基因

<220>

<221> misc_feature

<222> (5561)..(5580)

<223> n is a, c, g, or t

<400> 32

atcgccattc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt 60

cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt tgggtaacgc 120

cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattcgag ctcggtaccc 180

ggccgcaaac aacagataaa acgaaaggcc cagtctttcg actgagcctt tcgttttatt 240

tgatgcctgt caagtaacag caggactctt agtggtgtgg agtattttta cctgaatcat 300

aatggacaac tcgctccgtc gtttttcagc tcgcttcaaa gtcttctcaa gccatctatt 360

ctcattcaat tgattgtgcg acgattggat gaatattttc ctgcaacatt ggtagtgttc 420

acttaccatt acattcaacc caaccccgtt atctctgagg ttccacagcc caatttgatt 480

cctcgcattt ttctcgtaat agagtttgca agcccagatt ttcaaagtgt ggccgttccc 540

ccgcagctcc tggttatacc attctaagat cttttcagcg caatctgcac aaggactcca 600

ggatgagtac caatttatcg tgaattgtcc ggggttgtcg cgcaggtatt cttcgacttt 660

tctaatgcta aagatttcgg cgtgaatgcc acgttctgtc ccgctctgtg gtttattcac 720

agcatagccc caaaaacacg ctctacgttc accccgtcgt tttaattcaa agagaacgta 780

gcatctatgc gacacggatt ttttgttgtt gaaaaactgt ttcttaaacg tgtagatgtc 840

caacttctca tggattctca cgtactcagc gtcggtcatc ctagacttat cgtcatcgtc 900

tttgtaatca atatcatgat ccttgtagtc tccgtcgtgg tccttatagt ctccggactc 960

gagcctagac ttatcgtcat cgtctttgta atcaatatca tgatccttgt agtctccgtc 1020

gtggtcctta tagtctccgg aatacttctc cacgtaaggg acaggaatca tccccctctt 1080

tccttcgctg tcctctgcat tccaccactg ctcctcaggc ttatcccgga ttctcaggat 1140

gtctcctttc ttaaagggaa gatcctcttc atcattccca ttaaagtcaa agagggctcg 1200

cacatactca gcagaacctc cacctccaga acctcctcca ccgtcacctc ctagctgact 1260

caaatcaatg cgtgtttcat aaagaccagt gatggattga tggataagag tggcatctaa 1320

aacttctttt gtagacgtat atcgtttacg atcaattgtt gtatcaaaat atttaaaagc 1380

agcgggagct ccaagattcg tcaacgtaaa taaatgaata atattttctg cttgttcacg 1440

tattggtttg tctctatgtt tgttatatgc actaagaact ttatctaaat tggcatctgc 1500

taaaataaca cgcttagaaa attcactgat ttgctcaata atctcatcta aataatgctt 1560

atgctgctcc acaaacaatt gtttttgttc gttatcttct ggactaccct tcaacttttc 1620

ataatgacta gctaaatata aaaaattcac atatttgctt ggcagagcca gctcatttcc 1680

tttttgtaat tctccggcac tagccagcat ccgtttacga ccgttttcta actcaaaaag 1740

actatattta ggtagtttaa tgattaagtc ttttttaact tccttatatc ctttagcttc 1800

taaaaagtca atcggatttt tttcaaagga acttctttcc ataattgtga tccctagtaa 1860

ctctttaacg gattttaact tcttcgattt ccctttttcc accttagcaa ccactaggac 1920

tgaataagct accgttggac tatcaaaacc accatatttt tttggatccc agtctttttt 1980

acgagcaata agcttgtccg aatttctttt tggtaaaatt gactccttgg agaatccgcc 2040

tgtctgtact tctgttttct tgacaatatt gacttggggc atggacaata ctttgcgcac 2100

tgtggcaaaa tctcgccctt tatcccagac aatttctcca gtttccccat tagtttcgat 2160

tagagggcgt ttgcgaatct ctccatttgc aagtgtaatt tctgttttga agaagttcat 2220

gatattagag taaaagaaat attttgcggt tgctttgcct atttcttgct cagacttagc 2280

aatcatttta cgaacatcat aaactttata atcaccatag acaaactccg attcaagttt 2340

tggatatttc ttaatcaaag cagttccaac gacggcattt agatacgcat catgggcatg 2400

atggtaattg ttaatctcac gtactttata gaattggaaa tcttttcgga agtcagaaac 2460

taatttagat tttaaggtaa tcactttaac ctctcgaata agtttatcat tttcatcgta 2520

tttagtattc atgcgactat ccaaaatttg tgccacatgc ttagtgattt ggcgagtttc 2580

aaccaattgg cgtttgataa aaccagcttt atcaagttca ctcaaacctc cacgttcagc 2640

tttcgttaaa ttatcaaact tacgttgagt gattaacttg gcgtttagaa gttgtctcca 2700

atagtttttc atctttttga ctacttcttc acttggaacg ttatccgatt taccacgatt 2760

tttatcagaa cgcgttaaga ccttattgtc tattgaatcg tctttaagga aactttgtgg 2820

aacaatggca tcgacatcat aatcacttaa acgattaata tctaattctt ggtccacata 2880

catgtctctt ccattttgga gataatagag atagagcttt tcattttgca attgagtatt 2940

ttcaacagga tgctctttaa gaatctgact tcctaattct ttgatacctt cttcgattcg 3000

tttcatacgc tctcgcgaat ttttctggcc cttttgagtt gtctgatttt cacgtgccat 3060

ttcaataacg atattttctg gcttatgccg ccccattact ttgaccaatt catcaacaac 3120

ttttacagtc tgtaaaatac cttttttaat agcagggcta ccagctaaat ttgcaatatg 3180

ttcatgtaaa ctatcgcctt gtccagacac ttgtgctttt tgaatgtctt ctttaaatgt 3240

caaactatca tcatggatca gctgcataaa attgcgattg gcaaaaccat ctgatttcaa 3300

aaaatctaat attgttttgc cagattgctt atccctaata ccattaatca attttcgaga 3360

caaacgtccc caaccagtat aacggcgacg tttaagctgt ttcatcacct tatcatcaaa 3420

gaggtgagca tatgttttaa gtctttcctc aatcatctcc ctatcttcaa ataaggtcaa 3480

tgttaaaaca atatcctcta agatatcttc attttcttca ttatccaaaa aatctttatc 3540

tttaataatt tttagcaaat catggtaggt acctaatgaa gcattaaatc tatcttcaac 3600

tcctgaaatt tcaacactat caaaacattc tatttttttg aaataatctt cttttaattg 3660

cttaacggtt acttttcgat ttgttttgaa gagtaaatca acaatggctt tcttctgttc 3720

acctgaaaga aatgctggtt ttcgcattcc ttcagtaaca tatttgacct ttgtcaattc 3780

gttataaacc gtaaaatact cataaagcaa actatgtttt ggtagtactt tttcatttgg 3840

aagattttta tcaaagtttg tcatgcgttc aataaatgat tgagctgaag cacctttatc 3900

gacaacttct tcaaaattcc atggggtaat tgtttcttca gacttccgag tcatccatgc 3960

aaaacgacta ttgccacgcg ccaatggacc aacataataa ggaattcgaa aagtcaagat 4020

tttttcaatc ttctcacgat tgtcttttaa aaatggataa aagtcttctt gtcttctcaa 4080

aatagcatgc agctcaccca agtgaatttg atggggaata gagccgttgt caaaggtccg 4140

ttgcttgcgc agcaaatctt cacgatttag tttcaccaat aattcctcag taccatccat 4200

tttttctaaa attggtttga taaatttata aaattcttct tggctagctc ccccatcaat 4260

ataacctgca tatccgtttt ttgattgatc aaaaaagatt tctttatact tttctggaag 4320

ttgttgtcga actaaagctt ttaaaagagt caagtcttga tgatgttcat cgtagcgttt 4380

aatcattgaa gctgataggg gagccttagt tatttcagta tttactctta ggatatctga 4440

aagtaaaata gcatctgata aattcttagc tgccaaaaac aaatcagcat attgatctcc 4500

aatttgcgcc aataaattat ctaaatcatc atcgtaagta tcttttgaaa gctgtaattt 4560

agcatcttct gccaaatcaa aatttgattt aaaattaggg gtcaaaccca atgacaaagc 4620

aatgagattc ccaaataagc catttttctt ctcaccgggg agctgagcaa tgagattttc 4680

taatcgtctt gatttactca atcgtgcaga aagaatcgct ttagcatcta ctccacttgc 4740

gttaataggg ttttcttcaa ataattgatt gtaggtttgt accaactgga taaatagttt 4800

gtccacatca ctattatcag gatttaaatc tccctcaatc aaaaaatgac cacgaaactt 4860

aatcatatgc gctaaggcca aatagattaa gcgcaaatcc gctttatcag tagaatctac 4920

caattttttt cgcagatgat agatagttgg atatttctca tgataagcaa cttcatctac 4980

tatatttcca aaaataggat gacgttcatg cttcttgtct tcttccacca aaaaagactc 5040

ttcaagtcga tgaaagaaac tatcatctac tttcgccatc tcatttgaaa aaatctcctg 5100

tagataacaa atacgattct tccgacgtgt ataccttcta cgagctgtcc gtttgagacg 5160

agtcgcttcc gctgtctctc cactgtcaaa taaaagagcc cctataagat tttttttgat 5220

actgtggcgg tctgtatttc ccagaacctt gaacttttta gacggaacct tatattcatc 5280

agtgatcacc gcccatccga cgctatttgt gccgatagct aagcctattg agtatttctt 5340

atccattttt gcctcctaaa atgggccctt taaattaaat ccataatgag tttgatgatt 5400

tcaataatag ttttaatgac ctccgaaatt agtttaatat gctttaattt ttctttttca 5460

aaatatctct tcaaaaaata ttacccaata cttaataata aatagattat aacacaaaat 5520

tcttttgaca agtagtttat tttgttataa ttctatagta nnnnnnnnnn nnnnnnnnnn 5580

gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 5640

ggcaccgagt cggtgctttt tttgatactt ctattctact ctgactgcaa accaaaaaaa 5700

caagcgcttt caaaacgctt gttttatcat ttttagggaa attaatctct taatcctttt 5760

atcattctac atttaggcgc tgccatcttg ctaaacctac taagctccac aggatgattt 5820

cgtaatcccg caagaggccc ggcagtaccg gcataaccaa gcctatgcct acagcatcca 5880

gggtgacggt gccgaggatg acgatgagcg cattgttaga tttcatacac ggtgcctgac 5940

tgcgttagca atttaactgt gataaactac cgcattaaag cttatcgatg ataagctgtc 6000

aaacatgaga attacaactt atatcgtatg gggctgactt caggtgctac atttgaagag 6060

ataaattgca ctgaaatcta gtcggatcct cgctcactga ctcgctgcgc tcggtcgttc 6120

ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag 6180

gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa 6240

aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc 6300

gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc 6360

ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg 6420

cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt 6480

cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc 6540

gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc 6600

cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 6660

agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 6720

ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 6780

ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 6840

gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 6900

cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 6960

attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 7020

accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 7080

ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 7140

gtgctgcaat gataccgcga gaaccacgct caccggctcc agatttatca gcaataaacc 7200

agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 7260

ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 7320

ttgttgccat tgctgcaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 7380

gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 7440

ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 7500

tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 7560

tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 7620

cttgcccggc gtcaacacgg gataataccg cgccacatag cagaacttta aaagtgctca 7680

tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 7740

gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 7800

tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 7860

ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 7920

attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 7980

cgcgcacatt tccccgaaaa gtgccacctg acgtcaatgc cgagcgaaag cgagccgaag 8040

ggtagcattt acgttagata accccctgat atgctccgac gctttatata gaaaagaaga 8100

ttcaactagg taaaatctta atataggttg agatgataag gtttataagg aatttgtttg 8160

ttctaatttt tcactcattt tgttctaatt tcttttaaca aatgttcttt tttttttaga 8220

acagttatga tatagttaga atagtttaaa ataaggagtg agaaaaagat gaaagaaaga 8280

tatggaacag tctataaagg ctctcagagg ctcatagacg aagaaagtgg agaagtcata 8340

gaggtagaca agttataccg taaacaaacg tctggtaact tcgtaaaggc atatatagtg 8400

caattaataa gtatgttaga tatgattggc ggaaaaaaac ttaaaatcgt taactatatc 8460

ctagataatg tccacttaag taacaataca atgatagcta caacaagaga aatagcaaaa 8520

gctacaggaa caagtctaca aacagtaata acaacactta aaatcttaga agaaggaaat 8580

attataaaaa gaaaaactgg agtattaatg ttaaaccctg aactactaat gagaggcgac 8640

gaccaaaaac aaaaatacct cttactcgaa tttgggaact ttgagcaaga ggcaaatgaa 8700

atagattgac ctcccaataa caccacgtag ttattgggag gtcaatctat gaaatgcgat 8760

taagcttttt ctaattcaca taagcgtgca ggtttaaagt acataaaaaa tataatgaaa 8820

aaaagcatca ttatactaac gttataccaa cattatactc tcattatact aattgcttat 8880

tccaatttcc tattggttgg aaccaacagg cgttagtgtg ttgttgagtt ggtactttca 8940

tgggattaat cccatgaaac ccccaaccaa ctcgccaaag ctttggctaa cacacacgcc 9000

attccaacca atagttttct cggcataaag ccatgctctg acgcttaaat gcactaatgc 9060

cttaaaaaaa cattaaagtc taacacacta gacttattta cttcgtaatt aagtcgttaa 9120

accgtgtgct ctacgaccaa aagtataaaa cctttaagaa ctttcttttt tcttgtaaaa 9180

aaagaaacta gataaatctc tcatatcttt tattcaataa tcgcatcaga ttgcagtata 9240

aatttaacga tcactcatca tgttcatatt tatcagagct cgtgctataa ttatactaat 9300

tttataagga ggaaaaaata aagagggtta taatgaacga gaaaaatata aaacacagtc 9360

aaaactttat tacttcaaaa cataatatag ataaaataat gacaaatata agattaaatg 9420

aacatgataa tatctttgaa atcggctcag gaaaagggca ttttaccctt gaattagtac 9480

agaggtgtaa tttcgtaact gccattgaaa tagaccataa attatgcaaa actacagaaa 9540

ataaacttgt tgatcacgat aatttccaag ttttaaacaa ggatatattg cagtttaaat 9600

ttcctaaaaa ccaatcctat aaaatatttg gtaatatacc ttataacata agtacggata 9660

taatacgcaa aattgttttt gatagtatag ctgatgagat ttatttaatc gtggaatacg 9720

ggtttgctaa aagattatta aatacaaaac gctcattggc attattttta atggcagaag 9780

ttgatatttc tatattaagt atggttccaa gagaatattt tcatcctaaa cctaaagtga 9840

atagctcact tatcagatta aatagaaaaa aatcaagaat atcacacaaa gataaacaga 9900

agtataatta tttcgttatg aaatgggtta acaaagaata caagaaaata tttacaaaaa 9960

atcaatttaa caattcctta aaacatgcag gaattgacga tttaaacaat attagctttg 10020

aacaattctt atctcttttc aatagctata aattatttaa taagtaagtt aagggatgca 10080

taaactgcat cccttaactt gtttttcgtg tacctatttt ttgtga 10126

<210> 33

<211> 20

<212> DNA

<213> 大肠杆菌(Escherichia coli)

<400> 33

tcaatgggct aactacgttc 20

<210> 34

<211> 20

<212> DNA

<213> 大肠杆菌

<400> 34

ggtccataaa ctgagacagc 20

<210> 35

<211> 223

<212> DNA

<213> 大肠杆菌

<400> 35

gagttataca cagggctggg atctattctt tttatctttt tttattcttt ctttattcta 60

taaattataa ccacttgaat ataaacaaaa aaaacacaca aaggtctagc ggaatttaca 120

gagggtctag cagaatttac aagttttcca gcaaaggtct agcagaattt acagataccc 180

acaactcaaa ggaaaaggac tagtaattat cattgactag ccc 223

<210> 36

<211> 951

<212> DNA

<213> 大肠杆菌

<400> 36

atgtctgaat tagttgtttt caaagcaaat gaactagcga ttagtcgcta tgacttaacg 60

gagcatgaaa ccaagctaat tttatgctgt gtggcactac tcaaccccac gattgaaaac 120

cctacaatga aagaacggac ggtatcgttc acttataacc aatacgttca gatgatgaac 180

atcagtaggg aaaatgctta tggtgtatta gctaaagcaa ccagagagct gatgacgaga 240

actgtggaaa tcaggaatcc tttggttaaa ggctttgaga ttttccagtg gacaaactat 300

gccaagttct caagcgaaaa attagaatta gtttttagtg aagagatatt gccttatctt 360

ttccagttaa aaaaattcat aaaatataat ctggaacatg ttaagtcttt tgaaaacaaa 420

tactctatga ggatttatga gtggttatta aaagaactaa cacaaaagaa aactcacaag 480

gcaaatatag agattagcct tgatgaattt aagttcatgt taatgcttga aaataactac 540

catgagttta aaaggcttaa ccaatgggtt ttgaaaccaa taagtaaaga tttaaacact 600

tacagcaata tgaaattggt ggttgataag cgaggccgcc cgactgatac gttgattttc 660

caagttgaac tagatagaca aatggatctc gtaaccgaac ttgagaacaa ccagataaaa 720

atgaatggtg acaaaatacc aacaaccatt acatcagatt cctacctaca taacggacta 780

agaaaaacac tacacgatgc tttaactgca aaaattcagc tcaccagttt tgaggcaaaa 840

tttttgagtg acatgcaaag taagcatgat ctcaatggtt cgttctcatg gctcacgcaa 900

aaacaacgaa ccacactaga gaacatactg gctaaatacg gaaggatctg a 951

<210> 37

<211> 714

<212> DNA

<213> λ噬菌体(Bacteriophage lambda)

<400> 37

tcagccaaac gtctcttcag gccactgact agcgataact ttccccacaa cggaacaact 60

ctcattgcat gggatcattg ggtactgtgg gtttagtggt tgtaaaaaca cctgaccgct 120

atccctgatc agtttcttga aggtaaactc atcaccccca agtctggcta tgcagaaatc 180

acctggctca acagcctgct cagggtcaac gagaattaac attccgtcag gaaagcttgg 240

cttggagcct gttggtgcgg tcatggaatt accttcaacc tcaagccaga atgcagaatc 300

actggctttt ttggttgtgc ttacccatct ctccgcatca cctttggtaa aggttctaag 360

cttaggtgag aacatccctg cctgaacatg agaaaaaaca gggtactcat actcacttct 420

aagtgacggc tgcatactaa ccgcttcata catctcgtag atttctctgg cgattgaagg 480

gctaaattct tcaacgctaa ctttgagaat ttttgtaagc aatgcggcgt tataagcatt 540

taatgcattg atgccattaa ataaagcacc aacgcctgac tgccccatcc ccatcttgtc 600

tgcgacagat tcctgggata agccaagttc atttttcttt ttttcataaa ttgctttaag 660

gcgacgtgcg tcctcaagct gctcttgtgt taatggtttc ttttttgtgc tcat 714

<210> 38

<211> 5097

<212> DNA

<213> 人工序列

<220>

<223> dCas9-PmCDA1

<400> 38

atggataaga aatactcaat aggcttagct atcggcacaa atagcgtcgg atgggcggtg 60

atcactgatg aatataaggt tccgtctaaa aagttcaagg ttctgggaaa tacagaccgc 120

cacagtatca aaaaaaatct tataggggct cttttatttg acagtggaga gacagcggaa 180

gcgactcgtc tcaaacggac agctcgtaga aggtatacac gtcggaagaa tcgtatttgt 240

tatctacagg agattttttc aaatgagatg gcgaaagtag atgatagttt ctttcatcga 300

cttgaagagt cttttttggt ggaagaagac aagaagcatg aacgtcatcc tatttttgga 360

aatatagtag atgaagttgc ttatcatgag aaatatccaa ctatctatca tctgcgaaaa 420

aaattggtag attctactga taaagcggat ttgcgcttaa tctatttggc cttagcgcat 480

atgattaagt ttcgtggtca ttttttgatt gagggagatt taaatcctga taatagtgat 540

gtggacaaac tatttatcca gttggtacaa acctacaatc aattatttga agaaaaccct 600

attaacgcaa gtggagtaga tgctaaagcg attctttctg cacgattgag taaatcaaga 660

cgattagaaa atctcattgc tcagctcccc ggtgagaaga aaaatggctt atttgggaat 720

ctcattgctt tgtcattggg tttgacccct aattttaaat caaattttga tttggcagaa 780

gatgctaaat tacagctttc aaaagatact tacgatgatg atttagataa tttattggcg 840

caaattggag atcaatatgc tgatttgttt ttggcagcta agaatttatc agatgctatt 900

ttactttcag atatcctaag agtaaatact gaaataacta aggctcccct atcagcttca 960

atgattaaac gctacgatga acatcatcaa gacttgactc ttttaaaagc tttagttcga 1020

caacaacttc cagaaaagta taaagaaatc ttttttgatc aatcaaaaaa cggatatgca 1080

ggttatattg atgggggagc tagccaagaa gaattttata aatttatcaa accaatttta 1140

gaaaaaatgg atggtactga ggaattattg gtgaaactaa atcgtgaaga tttgctgcgc 1200

aagcaacgga cctttgacaa cggctctatt ccccatcaaa ttcacttggg tgagctgcat 1260

gctattttga gaagacaaga agacttttat ccatttttaa aagacaatcg tgagaagatt 1320

gaaaaaatct tgacttttcg aattccttat tatgttggtc cattggcgcg tggcaatagt 1380

cgttttgcat ggatgactcg gaagtctgaa gaaacaatta ccccatggaa ttttgaagaa 1440

gttgtcgata aaggtgcttc agctcaatca tttattgaac gcatgacaaa ctttgataaa 1500

aatcttccaa atgaaaaagt actaccaaaa catagtttgc tttatgagta ttttacggtt 1560

tataacgaat tgacaaaggt caaatatgtt actgaaggaa tgcgaaaacc agcatttctt 1620

tcaggtgaac agaagaaagc cattgttgat ttactcttca aaacaaatcg aaaagtaacc 1680

gttaagcaat taaaagaaga ttatttcaaa aaaatagaat gttttgatag tgttgaaatt 1740

tcaggagttg aagatagatt taatgcttca ttaggtacct accatgattt gctaaaaatt 1800

attaaagata aagatttttt ggataatgaa gaaaatgaag atatcttaga ggatattgtt 1860

ttaacattga ccttatttga agatagggag atgattgagg aaagacttaa aacatatgct 1920

cacctctttg atgataaggt gatgaaacag cttaaacgtc gccgttatac tggttgggga 1980

cgtttgtctc gaaaattgat taatggtatt agggataagc aatctggcaa aacaatatta 2040

gattttttga aatcagatgg ttttgccaat cgcaatttta tgcagctgat ccatgatgat 2100

agtttgacat ttaaagaaga cattcaaaaa gcacaagtgt ctggacaagg cgatagttta 2160

catgaacata ttgcaaattt agctggtagc cctgctatta aaaaaggtat tttacagact 2220

gtaaaagttg ttgatgaatt ggtcaaagta atggggcggc ataagccaga aaatatcgtt 2280

attgaaatgg cacgtgaaaa tcagacaact caaaagggcc agaaaaattc gcgagagcgt 2340

atgaaacgaa tcgaagaagg tatcaaagaa ttaggaagtc agattcttaa agagcatcct 2400

gttgaaaata ctcaattgca aaatgaaaag ctctatctct attatctcca aaatggaaga 2460

gacatgtatg tggaccaaga attagatatt aatcgtttaa gtgattatga tgtcgatgcc 2520

attgttccac aaagtttcct taaagacgat tcaatagaca ataaggtctt aacgcgttct 2580

gataaaaatc gtggtaaatc ggataacgtt ccaagtgaag aagtagtcaa aaagatgaaa 2640

aactattgga gacaacttct aaacgccaag ttaatcactc aacgtaagtt tgataattta 2700

acgaaagctg aacgtggagg tttgagtgaa cttgataaag ctggttttat caaacgccaa 2760

ttggttgaaa ctcgccaaat cactaagcat gtggcacaaa ttttggatag tcgcatgaat 2820

actaaatacg atgaaaatga taaacttatt cgagaggtta aagtgattac cttaaaatct 2880

aaattagttt ctgacttccg aaaagatttc caattctata aagtacgtga gattaacaat 2940

taccatcatg cccatgatgc gtatctaaat gccgtcgttg gaactgcttt gattaagaaa 3000

tatccaaaac ttgaatcgga gtttgtctat ggtgattata aagtttatga tgttcgtaaa 3060

atgattgcta agtctgagca agaaataggc aaagcaaccg caaaatattt cttttactct 3120

aatatcatga acttcttcaa aacagaaatt acacttgcaa atggagagat tcgcaaacgc 3180

cctctaatcg aaactaatgg ggaaactgga gaaattgtct gggataaagg gcgagatttt 3240

gccacagtgc gcaaagtatt gtccatgccc caagtcaata ttgtcaagaa aacagaagta 3300

cagacaggcg gattctccaa ggagtcaatt ttaccaaaaa gaaattcgga caagcttatt 3360

gctcgtaaaa aagactggga tccaaaaaaa tatggtggtt ttgatagtcc aacggtagct 3420

tattcagtcc tagtggttgc taaggtggaa aaagggaaat cgaagaagtt aaaatccgtt 3480

aaagagttac tagggatcac aattatggaa agaagttcct ttgaaaaaaa tccgattgac 3540

tttttagaag ctaaaggata taaggaagtt aaaaaagact taatcattaa actacctaaa 3600

tatagtcttt ttgagttaga aaacggtcgt aaacggatgc tggctagtgc cggagaatta 3660

caaaaaggaa atgagctggc tctgccaagc aaatatgtga attttttata tttagctagt 3720

cattatgaaa agttgaaggg tagtccagaa gataacgaac aaaaacaatt gtttgtggag 3780

cagcataagc attatttaga tgagattatt gagcaaatca gtgaattttc taagcgtgtt 3840

attttagcag atgccaattt agataaagtt cttagtgcat ataacaaaca tagagacaaa 3900

ccaatacgtg aacaagcaga aaatattatt catttattta cgttgacgaa tcttggagct 3960

cccgctgctt ttaaatattt tgatacaaca attgatcgta aacgatatac gtctacaaaa 4020

gaagttttag atgccactct tatccatcaa tccatcactg gtctttatga aacacgcatt 4080

gatttgagtc agctaggagg tgacggtgga ggaggttctg gaggtggagg ttctgctgag 4140

tatgtgcgag ccctctttga ctttaatggg aatgatgaag aggatcttcc ctttaagaaa 4200

ggagacatcc tgagaatccg ggataagcct gaggagcagt ggtggaatgc agaggacagc 4260

gaaggaaaga gggggatgat tcctgtccct tacgtggaga agtattccgg agactataag 4320

gaccacgacg gagactacaa ggatcatgat attgattaca aagacgatga cgataagtct 4380

aggctcgagt ccggagacta taaggaccac gacggagact acaaggatca tgatattgat 4440

tacaaagacg atgacgataa gtctaggatg accgacgctg agtacgtgag aatccatgag 4500

aagttggaca tctacacgtt taagaaacag tttttcaaca acaaaaaatc cgtgtcgcat 4560

agatgctacg ttctctttga attaaaacga cggggtgaac gtagagcgtg tttttggggc 4620

tatgctgtga ataaaccaca gagcgggaca gaacgtggca ttcacgccga aatctttagc 4680

attagaaaag tcgaagaata cctgcgcgac aaccccggac aattcacgat aaattggtac 4740

tcatcctgga gtccttgtgc agattgcgct gaaaagatct tagaatggta taaccaggag 4800

ctgcggggga acggccacac tttgaaaatc tgggcttgca aactctatta cgagaaaaat 4860

gcgaggaatc aaattgggct gtggaacctc agagataacg gggttgggtt gaatgtaatg 4920

gtaagtgaac actaccaatg ttgcaggaaa atattcatcc aatcgtcgca caatcaattg 4980

aatgagaata gatggcttga gaagactttg aagcgagctg aaaaacgacg gagcgagttg 5040

tccattatga ttcaggtaaa aatactccac accactaaga gtcctgctgt tacttga 5097

<210> 39

<211> 105

<212> DNA

<213> 大肠杆菌

<400> 39

acgttaaatc tatcaccgca agggataaat atctaacacc gtgcgtgttg actattttac 60

ctctggcggt gataatggtt gcagggccca ttttaggagg caaaa 105

<210> 40

<211> 247

<212> DNA

<213> 人工序列

<220>

<223> gRNA

<400> 40

ggtttagcaa gatggcagcg cctaaatgta gaatgataaa aggattaaga gattaatttc 60

cctaaaaatg ataaaacaag cgttttgaaa gcgcttgttt ttttggtttg cagtcagagt 120

agaatagaag tatcaaaaaa agcaccgact cggtgccact ttttcaagtt gataacggac 180

tagccttatt ttaacttgct atttctagct ctaaaactga gaccatcccg ggtctctact 240

gcagaat 247

<210> 41

<211> 64

<212> DNA

<213> 大肠杆菌

<400> 41

tatcaccgcc agtggtattt atgtcaacac cgccagagat aatttatcac cgcagatggt 60

tatc 64

<210> 42

<211> 10867

<212> DNA

<213> 人工序列

<220>

<223> 质粒

<400> 42

gtcggaactg actaaagtag tgagttatac acagggctgg gatctattct ttttatcttt 60

ttttattctt tctttattct ataaattata accacttgaa tataaacaaa aaaaacacac 120

aaaggtctag cggaatttac agagggtcta gcagaattta caagttttcc agcaaaggtc 180

tagcagaatt tacagatacc cacaactcaa aggaaaagga ctagtaatta tcattgacta 240

gcccatctca attggtatag tgattaaaat cacctagacc aattgagatg tatgtctgaa 300

ttagttgttt tcaaagcaaa tgaactagcg attagtcgct atgacttaac ggagcatgaa 360

accaagctaa ttttatgctg tgtggcacta ctcaacccca cgattgaaaa ccctacaatg 420

aaagaacgga cggtatcgtt cacttataac caatacgttc agatgatgaa catcagtagg 480

gaaaatgctt atggtgtatt agctaaagca accagagagc tgatgacgag aactgtggaa 540

atcaggaatc ctttggttaa aggctttgag attttccagt ggacaaacta tgccaagttc 600

tcaagcgaaa aattagaatt agtttttagt gaagagatat tgccttatct tttccagtta 660

aaaaaattca taaaatataa tctggaacat gttaagtctt ttgaaaacaa atactctatg 720

aggatttatg agtggttatt aaaagaacta acacaaaaga aaactcacaa ggcaaatata 780

gagattagcc ttgatgaatt taagttcatg ttaatgcttg aaaataacta ccatgagttt 840

aaaaggctta accaatgggt tttgaaacca ataagtaaag atttaaacac ttacagcaat 900

atgaaattgg tggttgataa gcgaggccgc ccgactgata cgttgatttt ccaagttgaa 960

ctagatagac aaatggatct cgtaaccgaa cttgagaaca accagataaa aatgaatggt 1020

gacaaaatac caacaaccat tacatcagat tcctacctac ataacggact aagaaaaaca 1080

ctacacgatg ctttaactgc aaaaattcag ctcaccagtt ttgaggcaaa atttttgagt 1140

gacatgcaaa gtaagcatga tctcaatggt tcgttctcat ggctcacgca aaaacaacga 1200

accacactag agaacatact ggctaaatac ggaaggatct gaggttctta tggctcttgt 1260

atctatcagt gaagcatcaa gactaacaaa caaaagtaga acaactgttc accgttacat 1320

atcaaaggga aaactgtcca tatgcacaga gataatctca tgaccaaaac cggtagctag 1380

aggggccgca ttaggcaccc caggctttac actttatgct tccggctcgt ataatgtgtg 1440

gattttgagt taggatccgg cgagattttc aggagctaag gaagctaaaa tggagaaaaa 1500

aatcactgga tataccaccg ttgatatatc ccaatggcat cgtaaagaac attttgaggc 1560

atttcagtca gttgctcaat gtacctataa ccagaccgtt cagctggata ttacggcctt 1620

tttaaagacc gtaaagaaaa ataagcacaa gttttatccg gcctttattc acattcttgc 1680

ccgcctgatg aatgctcatc cggaattccg tatggcaatg aaagacggtg agctggtgat 1740

atgggatagt gttcaccctt gttacaccgt tttccatgag caaactgaaa cgttttcatc 1800

gctctggagt gaataccacg acgatttccg gcagtttcta cacatatatt cgcaagatgt 1860

ggcgtgttac ggtgaaaacc tggcctattt ccctaaaggg tttattgaga atatgttttt 1920

cgtctcagcc aatccctggg tgagtttcac cagttttgat ttaaacgtgg ccaatatgga 1980

caacttcttc gcccccgttt tcaccatggg caaatattat acgcaaggcg acaaggtgct 2040

gatgccgctg gcgattcagg ttcatcatgc cgtctgtgat ggcttccatg tcggcagaat 2100

gcttaatgaa ttacaacagt actgcgatga gtggcagggc ggggcgtaaa cgcgtggatc 2160

cggcttacta aaagccagat aacagtatgc gtatttgcgc gctgattttt gcggtctaga 2220

ggtttagcaa gatggcagcg cctaaatgta gaatgataaa aggattaaga gattaatttc 2280

cctaaaaatg ataaaacaag cgttttgaaa gcgcttgttt ttttggtttg cagtcagagt 2340

agaatagaag tatcaaaaaa agcaccgact cggtgccact ttttcaagtt gataacggac 2400

tagccttatt ttaacttgct atttctagct ctaaaactga gaccatcccg ggtctctact 2460

gcagaattat caccgccagt ggtatttatg tcaacaccgc cagagataat ttatcaccgc 2520

agatggttat cgatgaagat tcttgctcaa ttgttatcag ctatgcgccg accagaacac 2580

cttgccgatc agccaaacgt ctcttcaggc cactgactag cgataacttt ccccacaacg 2640

gaacaactct cattgcatgg gatcattggg tactgtgggt ttagtggttg taaaaacacc 2700

tgaccgctat ccctgatcag tttcttgaag gtaaactcat cacccccaag tctggctatg 2760

cagaaatcac ctggctcaac agcctgctca gggtcaacga gaattaacat tccgtcagga 2820

aagcttggct tggagcctgt tggtgcggtc atggaattac cttcaacctc aagccagaat 2880

gcagaatcac tggctttttt ggttgtgctt acccatctct ccgcatcacc tttggtaaag 2940

gttctaagct taggtgagaa catccctgcc tgaacatgag aaaaaacagg gtactcatac 3000

tcacttctaa gtgacggctg catactaacc gcttcataca tctcgtagat ttctctggcg 3060

attgaagggc taaattcttc aacgctaact ttgagaattt ttgtaagcaa tgcggcgtta 3120

taagcattta atgcattgat gccattaaat aaagcaccaa cgcctgactg ccccatcccc 3180

atcttgtctg cgacagattc ctgggataag ccaagttcat ttttcttttt ttcataaatt 3240

gctttaaggc gacgtgcgtc ctcaagctgc tcttgtgtta atggtttctt ttttgtgctc 3300

atacgttaaa tctatcaccg caagggataa atatctaaca ccgtgcgtgt tgactatttt 3360

acctctggcg gtgataatgg ttgcagggcc cattttagga ggcaaaaatg gataagaaat 3420

actcaatagg cttagctatc ggcacaaata gcgtcggatg ggcggtgatc actgatgaat 3480

ataaggttcc gtctaaaaag ttcaaggttc tgggaaatac agaccgccac agtatcaaaa 3540

aaaatcttat aggggctctt ttatttgaca gtggagagac agcggaagcg actcgtctca 3600

aacggacagc tcgtagaagg tatacacgtc ggaagaatcg tatttgttat ctacaggaga 3660

ttttttcaaa tgagatggcg aaagtagatg atagtttctt tcatcgactt gaagagtctt 3720

ttttggtgga agaagacaag aagcatgaac gtcatcctat ttttggaaat atagtagatg 3780

aagttgctta tcatgagaaa tatccaacta tctatcatct gcgaaaaaaa ttggtagatt 3840

ctactgataa agcggatttg cgcttaatct atttggcctt agcgcatatg attaagtttc 3900

gtggtcattt tttgattgag ggagatttaa atcctgataa tagtgatgtg gacaaactat 3960

ttatccagtt ggtacaaacc tacaatcaat tatttgaaga aaaccctatt aacgcaagtg 4020

gagtagatgc taaagcgatt ctttctgcac gattgagtaa atcaagacga ttagaaaatc 4080

tcattgctca gctccccggt gagaagaaaa atggcttatt tgggaatctc attgctttgt 4140

cattgggttt gacccctaat tttaaatcaa attttgattt ggcagaagat gctaaattac 4200

agctttcaaa agatacttac gatgatgatt tagataattt attggcgcaa attggagatc 4260

aatatgctga tttgtttttg gcagctaaga atttatcaga tgctatttta ctttcagata 4320

tcctaagagt aaatactgaa ataactaagg ctcccctatc agcttcaatg attaaacgct 4380

acgatgaaca tcatcaagac ttgactcttt taaaagcttt agttcgacaa caacttccag 4440

aaaagtataa agaaatcttt tttgatcaat caaaaaacgg atatgcaggt tatattgatg 4500

ggggagctag ccaagaagaa ttttataaat ttatcaaacc aattttagaa aaaatggatg 4560

gtactgagga attattggtg aaactaaatc gtgaagattt gctgcgcaag caacggacct 4620

ttgacaacgg ctctattccc catcaaattc acttgggtga gctgcatgct attttgagaa 4680

gacaagaaga cttttatcca tttttaaaag acaatcgtga gaagattgaa aaaatcttga 4740

cttttcgaat tccttattat gttggtccat tggcgcgtgg caatagtcgt tttgcatgga 4800

tgactcggaa gtctgaagaa acaattaccc catggaattt tgaagaagtt gtcgataaag 4860

gtgcttcagc tcaatcattt attgaacgca tgacaaactt tgataaaaat cttccaaatg 4920

aaaaagtact accaaaacat agtttgcttt atgagtattt tacggtttat aacgaattga 4980

caaaggtcaa atatgttact gaaggaatgc gaaaaccagc atttctttca ggtgaacaga 5040

agaaagccat tgttgattta ctcttcaaaa caaatcgaaa agtaaccgtt aagcaattaa 5100

aagaagatta tttcaaaaaa atagaatgtt ttgatagtgt tgaaatttca ggagttgaag 5160

atagatttaa tgcttcatta ggtacctacc atgatttgct aaaaattatt aaagataaag 5220

attttttgga taatgaagaa aatgaagata tcttagagga tattgtttta acattgacct 5280

tatttgaaga tagggagatg attgaggaaa gacttaaaac atatgctcac ctctttgatg 5340

ataaggtgat gaaacagctt aaacgtcgcc gttatactgg ttggggacgt ttgtctcgaa 5400

aattgattaa tggtattagg gataagcaat ctggcaaaac aatattagat tttttgaaat 5460

cagatggttt tgccaatcgc aattttatgc agctgatcca tgatgatagt ttgacattta 5520

aagaagacat tcaaaaagca caagtgtctg gacaaggcga tagtttacat gaacatattg 5580

caaatttagc tggtagccct gctattaaaa aaggtatttt acagactgta aaagttgttg 5640

atgaattggt caaagtaatg gggcggcata agccagaaaa tatcgttatt gaaatggcac 5700

gtgaaaatca gacaactcaa aagggccaga aaaattcgcg agagcgtatg aaacgaatcg 5760

aagaaggtat caaagaatta ggaagtcaga ttcttaaaga gcatcctgtt gaaaatactc 5820

aattgcaaaa tgaaaagctc tatctctatt atctccaaaa tggaagagac atgtatgtgg 5880

accaagaatt agatattaat cgtttaagtg attatgatgt cgatgccatt gttccacaaa 5940

gtttccttaa agacgattca atagacaata aggtcttaac gcgttctgat aaaaatcgtg 6000

gtaaatcgga taacgttcca agtgaagaag tagtcaaaaa gatgaaaaac tattggagac 6060

aacttctaaa cgccaagtta atcactcaac gtaagtttga taatttaacg aaagctgaac 6120

gtggaggttt gagtgaactt gataaagctg gttttatcaa acgccaattg gttgaaactc 6180

gccaaatcac taagcatgtg gcacaaattt tggatagtcg catgaatact aaatacgatg 6240

aaaatgataa acttattcga gaggttaaag tgattacctt aaaatctaaa ttagtttctg 6300

acttccgaaa agatttccaa ttctataaag tacgtgagat taacaattac catcatgccc 6360

atgatgcgta tctaaatgcc gtcgttggaa ctgctttgat taagaaatat ccaaaacttg 6420

aatcggagtt tgtctatggt gattataaag tttatgatgt tcgtaaaatg attgctaagt 6480

ctgagcaaga aataggcaaa gcaaccgcaa aatatttctt ttactctaat atcatgaact 6540

tcttcaaaac agaaattaca cttgcaaatg gagagattcg caaacgccct ctaatcgaaa 6600

ctaatgggga aactggagaa attgtctggg ataaagggcg agattttgcc acagtgcgca 6660

aagtattgtc catgccccaa gtcaatattg tcaagaaaac agaagtacag acaggcggat 6720

tctccaagga gtcaatttta ccaaaaagaa attcggacaa gcttattgct cgtaaaaaag 6780

actgggatcc aaaaaaatat ggtggttttg atagtccaac ggtagcttat tcagtcctag 6840

tggttgctaa ggtggaaaaa gggaaatcga agaagttaaa atccgttaaa gagttactag 6900

ggatcacaat tatggaaaga agttcctttg aaaaaaatcc gattgacttt ttagaagcta 6960

aaggatataa ggaagttaaa aaagacttaa tcattaaact acctaaatat agtctttttg 7020

agttagaaaa cggtcgtaaa cggatgctgg ctagtgccgg agaattacaa aaaggaaatg 7080

agctggctct gccaagcaaa tatgtgaatt ttttatattt agctagtcat tatgaaaagt 7140

tgaagggtag tccagaagat aacgaacaaa aacaattgtt tgtggagcag cataagcatt 7200

atttagatga gattattgag caaatcagtg aattttctaa gcgtgttatt ttagcagatg 7260

ccaatttaga taaagttctt agtgcatata acaaacatag agacaaacca atacgtgaac 7320

aagcagaaaa tattattcat ttatttacgt tgacgaatct tggagctccc gctgctttta 7380

aatattttga tacaacaatt gatcgtaaac gatatacgtc tacaaaagaa gttttagatg 7440

ccactcttat ccatcaatcc atcactggtc tttatgaaac acgcattgat ttgagtcagc 7500

taggaggtga cggtggagga ggttctggag gtggaggttc tgctgagtat gtgcgagccc 7560

tctttgactt taatgggaat gatgaagagg atcttccctt taagaaagga gacatcctga 7620

gaatccggga taagcctgag gagcagtggt ggaatgcaga ggacagcgaa ggaaagaggg 7680

ggatgattcc tgtcccttac gtggagaagt attccggaga ctataaggac cacgacggag 7740

actacaagga tcatgatatt gattacaaag acgatgacga taagtctagg ctcgagtccg 7800

gagactataa ggaccacgac ggagactaca aggatcatga tattgattac aaagacgatg 7860

acgataagtc taggatgacc gacgctgagt acgtgagaat ccatgagaag ttggacatct 7920

acacgtttaa gaaacagttt ttcaacaaca aaaaatccgt gtcgcataga tgctacgttc 7980

tctttgaatt aaaacgacgg ggtgaacgta gagcgtgttt ttggggctat gctgtgaata 8040

aaccacagag cgggacagaa cgtggcattc acgccgaaat ctttagcatt agaaaagtcg 8100

aagaatacct gcgcgacaac cccggacaat tcacgataaa ttggtactca tcctggagtc 8160

cttgtgcaga ttgcgctgaa aagatcttag aatggtataa ccaggagctg cgggggaacg 8220

gccacacttt gaaaatctgg gcttgcaaac tctattacga gaaaaatgcg aggaatcaaa 8280

ttgggctgtg gaacctcaga gataacgggg ttgggttgaa tgtaatggta agtgaacact 8340

accaatgttg caggaaaata ttcatccaat cgtcgcacaa tcaattgaat gagaatagat 8400

ggcttgagaa gactttgaag cgagctgaaa aacgacggag cgagttgtcc attatgattc 8460

aggtaaaaat actccacacc actaagagtc ctgctgttac ttgacaggca tcaaataaaa 8520

cgaaaggctc agtcgaaaga ctgggccttt cgttttatct gttgtttgcg gccgggtacc 8580

gagctcgaat tcactggccg tcgttttaca acgtcgtgac tgggaaaacc ctggcgttac 8640

ccaacttaat cgccttgcag cacatccccc tttcgccagc tggcgtaata gcgaagaggc 8700

ccgcaccgat cgcccttccc aacagttgcg cagcctgaat ggcgaatggc gattcacaaa 8760

aaataggtac acgaaaaaca agttaaggga tgcagtttat gcatccctta acttacttat 8820

taaataattt atagctattg aaaagagata agaattgttc aaagctaata ttgtttaaat 8880

cgtcaattcc tgcatgtttt aaggaattgt taaattgatt ttttgtaaat attttcttgt 8940

attctttgtt aacccatttc ataacgaaat aattatactt ctgtttatct ttgtgtgata 9000

ttcttgattt ttttctattt aatctgataa gtgagctatt cactttaggt ttaggatgaa 9060

aatattctct tggaaccata cttaatatag aaatatcaac ttctgccatt aaaaataatg 9120

ccaatgagcg ttttgtattt aataatcttt tagcaaaccc gtattccacg attaaataaa 9180

tctcatcagc tatactatca aaaacaattt tgcgtattat atccgtactt atgttataag 9240

gtatattacc aaatatttta taggattggt ttttaggaaa tttaaactgc aatatatcct 9300

tgtttaaaac ttggaaatta tcgtgatcaa caagtttatt ttctgtagtt ttgcataatt 9360

tatggtctat ttcaatggca gttacgaaat tacacctctg tactaattca agggtaaaat 9420

gcccttttcc tgagccgatt tcaaagatat tatcatgttc atttaatctt atatttgtca 9480

ttattttatc tatattatgt tttgaagtaa taaagttttg actgtgtttt atatttttct 9540

cgttcattat aaccctcttt attttttcct ccttataaaa ttagtataat tatagcacga 9600

gctctgataa atatgaacat gatgagtgat cgttaaattt atactgcaat ctgatgcgat 9660

tattgaataa aagatatgag agatttatct agtttctttt tttacaagaa aaaagaaagt 9720

tcttaaaggt tttatacttt tggtcgtaga gcacacggtt taacgactta attacgaagt 9780

aaataagtct agtgtgttag actttaatgt ttttttaagg cattagtgca tttaagcgtc 9840

agagcatggc tttatgccga gaaaactatt ggttggaatg gcgtgtgtgt tagccaaagc 9900

tttggcgagt tggttggggg tttcatggga ttaatcccat gaaagtacca actcaacaac 9960

acactaacgc ctgttggttc caaccaatag gaaattggaa taagcaatta gtataatgag 10020

agtataatgt tggtataacg ttagtataat gatgcttttt ttcattatat tttttatgta 10080

ctttaaacct gcacgcttat gtgaattaga aaaagcttaa tcgcatttca tagattgacc 10140

tcccaataac tacgtggtgt tattgggagg tcaatctatt tcatttgcct cttgctcaaa 10200

gttcccaaat tcgagtaaga ggtatttttg tttttggtcg tcgcctctca ttagtagttc 10260

agggtttaac attaatactc cagtttttct ttttataata tttccttctt ctaagatttt 10320

aagtgttgtt attactgttt gtagacttgt tcctgtagct tttgctattt ctcttgttgt 10380

agctatcatt gtattgttac ttaagtggac attatctagg atatagttaa cgattttaag 10440

tttttttccg ccaatcatat ctaacatact tattaattgc actatatatg cctttacgaa 10500

gttaccagac gtttgtttac ggtataactt gtctacctct atgacttctc cactttcttc 10560

gtctatgagc ctctgagagc ctttatagac tgttccatat ctttctttca tctttttctc 10620

actccttatt ttaaactatt ctaactatat cataactgtt ctaaaaaaaa aagaacattt 10680

gttaaaagaa attagaacaa aatgagtgaa aaattagaac aaacaaattc cttataaacc 10740

ttatcatctc aacctatatt aagattttac ctagttgaat cttcttttct atataaagcg 10800

tcggagcata tcagggggtt atctaacgta aatgctaccc ttcggctcgc tttcgctcgg 10860

cattgac 10867

Claims

1.一种修饰双链DNA的靶向位点的非疾病治疗目的的方法，其包括：使由核酸碱基转变酶、和与选择的双链DNA中的靶核苷酸序列进行特异性结合的核酸序列识别模块连接而成的复合体，与该双链DNA接触，不切割该靶向位点中的该双链DNA的至少一条链，而使该靶向位点的1个以上的核苷酸缺失或转变为其它的1个以上的核苷酸，或者向该靶向位点插入1个以上的核苷酸的工序。

2.根据权利要求1所述的方法，其中，所述核酸序列识别模块选自由Cas的至少1种DNA切割能力失活的CRISPR-Cas系统、锌指基序、TAL效应子及PPR基序组成的组。

3.根据权利要求1所述的方法，其中，所述核酸序列识别模块为Cas的至少1种DNA切割能力失活的CRISPR-Cas系统。

4.根据权利要求1-3任一项所述的方法，其中，使用与不同的靶核苷酸序列分别进行特异性结合的两种以上的核酸序列识别模块。

5.根据权利要求4所述的方法，其中，所述不同的靶核苷酸序列存在于不同的基因内。

6.根据权利要求1-3中任一项所述的方法，其中，双链DNA与复合体的接触，通过向具有所述双链DNA的细胞中导入编码所述复合体的核酸来进行。

7.根据权利要求6所述的方法，其中，所述细胞是原核生物细胞。

8.根据权利要求6所述的方法，其中，所述细胞是真核生物细胞。

9.根据权利要求6所述的方法，其中，所述细胞是微生物细胞。

10.根据权利要求6所述的方法，其中，所述细胞是植物细胞。

11.根据权利要求6所述的方法，其中，所述细胞是昆虫细胞。

12.根据权利要求6所述的方法，其中，所述细胞是动物细胞。

13.根据权利要求6所述的方法，其中，所述细胞是脊椎动物细胞。

14.根据权利要求6所述的方法，其中，所述细胞是哺乳动物细胞。

15.根据权利要求7所述的方法，其中，所述细胞为多倍体细胞，并且对同源染色体上的全部靶向化的等位基因内的位点进行修饰。

16.根据权利要求6所述的方法，其包括：将以能够控制表达时期的形式包含编码所述复合体的核酸的表达载体，导入所述细胞的工序，以及在需要使双链DNA的靶向位点的修饰稳定的时期，诱导该核酸的表达的步骤。

17.根据权利要求16所述的方法，其中，双链DNA中的靶核苷酸序列存在于对于所述细胞必需的基因内。

18.核酸修饰酶复合体，该复合体由与双链DNA中的靶核苷酸序列特异性结合的核酸序列识别模块，和核酸碱基转变酶连接而成，在靶向位点中，不切割该双链DNA的至少一条链，使该靶向位点的1个以上的核苷酸缺失或转变为其它的1个以上的核苷酸，或者向该靶向位点插入1个以上的核苷酸。

19.编码权利要求18所述的核酸修饰酶复合体的核酸。

20.核酸序列识别模块在制备用于修饰双链DNA的靶向位点的试剂中的用途，其中双链DNA的靶向位点通过包含以下步骤的方法修饰：使由核酸碱基转变酶、和与选择的双链DNA中的靶核苷酸序列进行特异性结合的核酸序列识别模块连接而成的复合体，与该双链DNA接触，不切割该靶向位点中的该双链DNA的至少一条链，而使该靶向位点的1个以上的核苷酸缺失或转变为其它的1个以上的核苷酸，或者向该靶向位点插入1个以上的核苷酸的工序。

21.根据权利要求20所述的用途，其中，所述核酸序列识别模块选自由Cas的至少1种DNA切割能力失活的CRISPR-Cas系统、锌指基序、TAL效应子及PPR基序组成的组。

22.根据权利要求20所述的用途，其中，所述核酸序列识别模块为Cas的至少1种DNA切割能力失活的CRISPR-Cas系统。

23.根据权利要求20-22任一项所述的用途，其中，使用与不同的靶核苷酸序列分别进行特异性结合的两种以上的核酸序列识别模块。

24.根据权利要求23所述的用途，其中，所述不同的靶核苷酸序列存在于不同的基因内。

25.根据权利要求20-22任一项所述的用途，其中，双链DNA与复合体的接触，通过向具有所述双链DNA的细胞中导入编码所述复合体的核酸来进行。

26.根据权利要求25所述的用途，其中，所述细胞是原核生物细胞。

27.根据权利要求25所述的用途，其中，所述细胞是真核生物细胞。

28.根据权利要求25所述的用途，其中，所述细胞是微生物细胞。

29.根据权利要求25所述的用途，其中，所述细胞是植物细胞。

30.根据权利要求25所述的用途，其中，所述细胞是昆虫细胞。

31.根据权利要求25所述的用途，其中，所述细胞是动物细胞。

32.根据权利要求25所述的用途，其中，所述细胞是脊椎动物细胞。

33.根据权利要求25所述的用途，其中，所述细胞是哺乳动物细胞。

34.根据权利要求26所述的用途，其中，所述细胞为多倍体细胞，并且对同源染色体上的全部靶向化的等位基因内的位点进行修饰。

35.根据权利要求25所述的用途，其包括：将以能够控制表达时期的形式包含编码所述复合体的核酸的表达载体，导入所述细胞的工序，以及在需要使双链DNA的靶向位点的修饰稳定的时期，诱导该核酸的表达的步骤。

36.根据权利要求35所述的用途，其中，双链DNA中的靶核苷酸序列存在于对于所述细胞必需的基因内。

37.根据权利要求1-3任一项所述的方法，权利要求18所述的核酸修饰酶复合体或权利要求20-22所述的用途，其中，所述核酸序列识别模块为CRISPR-Cas系统，其中该CRISPR-Cas系统包含具有切口酶活性的Cas。

38.根据权利要求1-3任一项所述的方法，权利要求18所述的核酸修饰酶复合体或权利要求20-22所述的用途，其中，所述Cas为Cas9。