CN111148833A

CN111148833A - 改变细胞具有的双链dna的目标部位的方法

Info

Publication number: CN111148833A
Application number: CN201980003718.7A
Authority: CN
Inventors: 西田敬二
Original assignee: Kobe University NUC
Current assignee: Kobe University NUC
Priority date: 2018-03-26
Filing date: 2019-03-26
Publication date: 2020-05-12
Anticipated expiration: 2039-03-26
Also published as: JP2020191879A; WO2019189147A1; US11041169B2; CA3095291C; EP3660152A1; CA3095291A1; SG11202009319YA; JP6727680B2; KR102287880B1; EP3660152A4; JP7250349B2; US20200270631A1; JPWO2019189147A1; BR112020019301A2; KR20200123255A; JP2023063448A; CN111148833B

Abstract

本发明提供一种改变细胞具有的双链DNA的目标部位的方法，该方法包括以下工序：使与选择的双链DNA中的目标核苷酸序列特异性结合的核酸序列识别模块和核酸碱基转换酶或DNA糖苷酶结合而成的复合体、包含插入序列的供体DNA与所述双链DNA接触，将所述目标部位置换为所述插入序列或者在所述目标部位插入所述插入序列，在所述目标部位不会切断所述双链DNA的至少一条链。

Description

改变细胞具有的双链DNA的目标部位的方法

技术领域

本发明涉及能够使用同源重组来改变细胞具有的双链DNA的特定区域内的目标部位而不伴随DNA的双链断裂(无断裂或单链断裂)的双链DNA的改变方法。

背景技术

已知CRISPR(成簇的规律间隔的短回文重复序列，clustered regularlyinterspaced short palindromic repeats)及CRISPR相关(CRISPR-associated；Cas)蛋白质以依赖于单向导RNA(sgRNA)和前间区序列邻近基序(PAM)的方式切断目标DNA从而作为细菌的适应性免疫系统发挥作用。在具有DNA双链断裂(DSB)的修复路径的真核生物中，来自酿脓链球菌(Streptococcus pyogenes)的Cas9核酸酶作为强有力的基因组编辑工具被广泛使用(例如，非专利文献1、2)。在采用非同源末端连接(NHEJ)路径的DSB修复过程中，在目标DNA中导入小的插入和/或缺失(indels)，产生部位特异性突变或基因破坏。虽然效率依赖于宿主细胞，但是，通过提供包含目标区域的同源臂的供体DNA，能够促进同源重组修复(HDR)以更准确地进行编辑。然而，采用上述以往的方法时，由于随着双链DNA的断裂，会伴随预期以外的基因组改变，因此，存在具有强细胞毒性、染色体易位等副作用、损害基因治疗的可靠性、核苷酸改变导致的存活细胞数量极少等共同的课题。另外，也报告了使用Cas9切口酶(nCas9)的同源重组(非专利文献1、2)，但与Cas9核酸酶相比，重组发生效率大多非常低(非专利文献3)。另外，在本发明人已知的范围内，并没有报告使用两种核酸酶活性失活的Cas9(dCas9)的同源重组。

最近，验证了在目标基因座直接编辑核苷酸而不使用包含目标区域的同源臂的供体DNA、且由脱氨酶介导的目标碱基编辑(例如，专利文献1、非专利文献4～6)。该技术利用DNA脱氨化来代替核酸酶介导的DNA断裂，因此，对细胞的毒性低，而且能够在精确位置导入突变。

现有技术文献

专利文献

专利文献1：国际公开第2015/133554号。

非专利文献

非专利文献1：Mali,P.et al.,Science 339：823-827(2013)；

非专利文献2：Cong,L.et al.,Science 339：819-823(2013)；

非专利文献3：Ran,F.A.et al.,Nat Protoc,8：2281-2308(2013)；

非专利文献4：Komor,A.C.et al.,Nature 61：5985-91(2016)；

非专利文献5：Nishida,K.et al.,Science 102：553-563(2016)；

非专利文献6：Ma,Y.et al.,Nat.Methods 1-9(2016)doi：10.1038/nmeth.4027。

发明内容

发明所要解决的问题

然而，由于该技术使用脱氨酶，因此，对能够导入的突变的类型、突变部位产生制约，另外，不能改变基因的方向、组合，不能敲入基因片段等。因此，本发明的课题在于提供使用脱氨酶等核酸碱基转换酶或DNA糖苷酶的新的DNA改变技术，该新的DNA改变技术在不受能够导入的突变的类型、突变部位制约的情况下能够改变基因的方向、组合或者敲入基因片段。

解决问题的技术手段

对于分裂的细胞，特别严重的DNA损伤方式是DNA双链的两条链被切断的障碍，作为修复该障碍的机构，已知同源重组和非同源末端再连接。另一方面，在DNA双链的一条链损伤的情况下，主要通过作为对由烷基化、脱氨化导致的损伤进行修复的机构的碱基切除修复、涉及几十对碱基的较大规模的对双链变形那样的损伤进行的修复机构即核苷酸切除修复(nucleotide excision repair：NER)进行修复。虽然没有针对比例等进行验证，但是已知即使在DNA双链的一条链损伤的情况下也会诱导互补链修复。

然而，并没有对互补链修复相对于碱基切除修复的活性的程度进行充分的验证，并没有积极地进行利用碱基切除修复且采用同源重组的DNA编辑。在本发明人已知的范围内，并没有这样的DNA编辑的报告。在这种情况下，本发明人得到了以下构思：通过使用核酸碱基转换酶使细胞内DNA引起脱氨化、脱碱基，从而能够诱导互补链修复，此时通过使供体DNA与该DNA接触，能进行使用同源重组的DNA重组。基于该构思进行研究，结果发现了通过使核酸序列识别模块和核酸碱基转换酶结合而成的复合体、包含插入序列的供体DNA与目标DNA接触，能够抑制对细胞的毒性并且进行DNA同源重组，而且，在优选的实施方式中，令人惊讶的是，在目标部位产生了接近100％的同源重组活性。本发明人基于这些认识进一步进行专心研究，结果完成了本发明。

即，本发明如下所述。

[1]一种改变细胞具有的双链DNA的目标部位的方法，包括以下工序：使与选择的双链DNA中的目标核苷酸序列特异性结合的核酸序列识别模块和核酸碱基转换酶或DNA糖苷酶结合而成的复合体、包含插入序列的供体DNA与所述双链DNA接触，将所述目标部位置换为所述插入序列或者在所述目标部位插入所述插入序列，在所述目标部位不会切断所述双链DNA的至少一条链。

[2]如[1]所述的方法，所述供体DNA包含与目标部位的邻接区域相同的序列。

[3]如[1]或[2]所述的方法，所述核酸序列识别模块选自由Cas效应蛋白质的至少一种DNA切断能力失活的CRISPR-Cas系统、锌指基序、TAL效应因子以及PPR基序组成的组。

[4]如[1]～[3]中任一项所述的方法，所述核酸序列识别模块是Cas效应蛋白质的两种DNA切断能力中的仅一种DNA切断能力失活的CRISPR-Cas系统。

[5]如[1]～[3]中任一项所述的方法，所述核酸序列识别模块是Cas效应蛋白质的两种DNA切断能力失活的CRISPR-Cas系统。

[6]如[1]～[5]中任一项所述的方法，所述核酸碱基转换酶为脱氨酶。

[7]如[6]所述的方法，所述脱氨酶为胞苷脱氨酶。

[8]如[7]所述的方法，所述胞苷脱氨酶为PmCDA1。

[9]如[1]～[8]中任一项所述的方法，双链DNA与复合体的接触通过向所述细胞导入编码所述复合体的核酸来进行。

[10]如[1]～[9]中任一项所述的方法，所述细胞为原核生物细胞或真核生物细胞。

[11]如[10]所述的方法，所述细胞为微生物细胞。

[12]如[10]所述的方法，所述细胞为植物细胞、昆虫细胞或动物细胞。

[13]如[12]所述的方法，所述动物细胞为脊椎动物细胞。

[14]如[13]所述的方法，所述脊椎动物细胞为哺乳类动物细胞。

发明效果

根据本发明，提供一种使用脱氨酶等核酸碱基转换酶或DNA糖苷酶的新的DNA改变技术，其能够改变基因的方向、组合，或敲入基因片段，而不受能够导入的突变的类型、突变部位制约。本发明的DNA改变技术能够改变目标部位而不切断双链DNA，因此，能将伴随断裂的预期以外的改编、毒性抑制得较低，而且，与以往的方法相比，能更高效地改变目标部位。

附图说明

图1表示由互补链修饰引起的基因组改变的机制的概略图。通过将核酸序列识别模块与核酸碱基转换酶或DNA糖苷酶结合而成的复合体、重组用供体DNA导入细胞，能够进行插入序列的高效敲入。

图2表示使用dCas9-CDA或nCas9-CDA、以及供体DNA，能够导入目标部位的突变。载体1525：pRS415_dCas9-CDA+CAN(mut)；载体1526：pRS415_nCas9-CDA+CAN(mut)；载体1059：pRS426_SNR52-Can7R-sgRNA；载体1149：pRS426_SNR52-Can10R-sgRNA

图3表示使用预先在Ade1与Ade1的启动子区域之间导入了标志物开关(markerswitch)的酿酒酵母(BY4741株)的重组的评价系统。如果标志物开关在同源区域通过重组而翻转，则Ade1的功能恢复，菌落的颜色从红变为白。

图4表示使用图3的重组的评价系统的重组反应的验证实验的结果。质粒载体(以下，有时简称为“载体”)1553：nCas9-CDA_UraAde target 2(目标核苷酸序列：cctttagcggcttaactgtg(序列号9))；载体1557：nCas9-CDA_UraAde target 6(目标核苷酸序列：ggcccaggtattgttagcgg(序列号10))、载体1559：nCas9-CDA_UraAde target 8(目标核苷酸序列：ttggcggataatgcctttag(序列号11))；载体1560：nCas9-CDA_UraAde target 9(目标核苷酸序列：tgcagttgggttaagaatac(序列号12))、载体1562：nCas9-CDA_UraAdetarget 11(目标核苷酸序列：gctaacatcaaaaggcctct(序列号13))；载体1565：dCas9-CDA_UraAde target 3(目标核苷酸序列：ttggcggataatgcctttag(序列号14))。上述载体(1553、1557、1559、1560、1562、1565)相当于将载体1059(序列号5)的序列的第3890个～第3909个的碱基序列置换为上述各目标核苷酸序列后的载体。另外，载体编号的最后两位与图4的目标部位的数字对应。

图5表示使用本发明的DNA改变方法的敲入或敲除方法的示意图。

图6表示使用图5的方法的敲入或敲除的验证实验的结果。

图7表示实施例5中进行的使用动物细胞的重组的评价系统的概略图和实验条件。

图8表示使用图7的重组的评价系统的重组反应的验证实验的结果。图的横轴表示同源重组率(％)。

图9表示实施例6中进行的使用动物细胞的重组的评价系统的概略图和实验条件。

图10表示使用图9的重组的评价系统的重组反应的验证实验的结果。图的纵轴表示同源重组率(％)。

图11表示实施例7中进行的使用动物细胞的重组的评价系统的概略图和实验条件。

图12表示使用图11的重组的评价系统的重组反应的验证实验的结果。图的横轴表示同源重组率(％)。

具体实施方式

本发明提供在不切断要改变的双链DNA(例如，染色体DNA、线粒体DNA、叶绿体DNA；以下，也将它们统称为“基因组DNA”)的至少一条链的情况下通过将该双链DNA中的目标部位置换为外源的供体DNA所含的插入序列、或者在所述目标部位插入所述插入序列来改变所述双链DNA的该目标部位的方法(以下，有时简称为“本发明的方法”)。该方法的特征在于，包括使与所述双链DNA中的目标核苷酸序列特异性结合的核酸序列识别模块和核酸碱基转换酶或DNA糖苷酶(以下，有时简称为“核酸碱基转换酶等”)结合而成的复合体、包含插入序列的供体DNA与所述双链DNA接触的工序。

在本发明中，双链DNA的“改变”是指DNA链上的某一核苷酸(例如，dA、dC、dG或dT)或核苷酸序列被置换为其他核苷酸或核苷酸序列、或者在DNA链上的某一核苷酸之间插入其他核苷酸或核苷酸序列。此处，对待改变的双链DNA没有特别的限制，优选为基因组DNA。

在本发明中，“供体DNA”是指包含外源的插入序列的DNA，通常，在供体DNA中包含与邻接于目标部位的目标部位的上游侧和下游侧两处区域(以下，也称为“邻接区域”)的序列相同的两种序列(以下，也称为“同源臂”)。在区别各同源臂的情况下，有时以“5’同源臂”和“3’同源臂”来区别。另外，双链DNA的“目标部位”是指被供体DNA所含的插入序列置换的区域或者该插入序列被插入的核苷酸之间，在该目标部位不包含所述邻接序列。

与目标部位的邻接区域相同的序列不仅可以为完全相同的序列，只要在细胞内能引起同源重组，也可以是相对于完全相同的序列具有优选80％以上(例如85％以上、90％以上、95％以上、96％以上、97％以上、98％以上、99％以上)的同一性的序列。

根据需要，在插入序列中能够包含药剂抗性基因(例如，卡那霉素抗性基因、氨苄西林抗性基因、嘌呤霉素抗性基因等)、胸苷激酶基因、白喉毒素基因等选择标志物序列、绿色荧光蛋白质(GFP)、红色荧光蛋白质、β葡萄糖醛酸酶(GUS)、FLAG等报告基因序列等。另外，在细胞筛选等结束后等，为了能够切除这些基因，在它们前后也可以具有LoxP序列、FRT序列或转座子特异性末端反向序列(PiggyBac末端重复序列)。作为优选的转座子，例如，可举出来自鳞翅目昆虫的转座子piggyBac等(Kaji,K.et al.,Nature,458:771-775(2009),Woltjen et al.,Nature,458:766-770(2009),WO 2010/012077)。或者，也可以像Oji A etal.,Sci Rep,6:31666(2016)等所记载那样，共转导包含上述药剂抗性基因的表达载体，进行短暂性(几天左右的)药剂选择。对于插入序列是否插入目标部位、是否与目标部位置换，除了能够通过对序列进行解读来确认，也能够通过Southern印迹杂交或PCR法筛选从细胞中分离提取的染色体DNA等来确认，在供体DNA中存在上述药剂抗性基因等的情况下，也能够将它们的表达作为指标来确认。

供体DNA可以为直链状(例如，合成双链DNA)，可以为环状(例如，质粒DNA)，另外，也可以为单链DNA(例如，单链寡聚脱氧核苷酸(ssODN))，还可以为双链DNA。供体DNA能够根据插入序列的碱基长度、宿主细胞的同源重组活性等适当设计。例如，插入序列为100个碱基长度以下的情况下，通常使用ssODN或合成双链DNA，在比100个碱基更长的情况下，通常使用合成双链DNA或质粒DNA。对供体DNA的长度也没有特别的限制，能够根据插入序列的长度等适当设计。对插入序列的长度没有特别的限制，通常在1个碱基长度～几万个碱基长度的范围(例如，在ssODN的情况下，为100个碱基长度以下(例如，70碱基以下、50碱基以下))内能够根据目的适当设计。另外，对各同源臂的长度也没有特别的限制，当供体DNA为ssODN时，通常使用10个碱基长度～150个碱基长度的同源臂，当供体DNA为合成双链DNA时，通常使用10～5000个碱基长度的同源臂，当供体DNA为质粒DNA时，通常使用100个碱基长度～5000个碱基长度的同源臂，优选使用500个碱基长度～1000个碱基长度的同源臂。这些供体DNA能够参照公知文献(例如，Ochiai H,Int J Mol Sci,16:21128-21137(2015),Hockemeyer D et al.,Nat Biotefchnol,27:851-857(2009))来设计。

在本发明中，“核酸序列识别模块”是指具有特异性识别并结合DNA链上的特定核苷酸序列(即，目标核苷酸序列)的能力的分子或分子复合体。通过核酸序列识别模块与目标核苷酸序列结合，与该模块连接的核酸碱基转换酶等能够特异性作用于双链DNA中的核酸碱基转换酶等的目标部位(即，目标核苷酸序列及其附近的核苷酸)。

如后述的实施例所述，通过将核酸碱基转换酶和核酸序列识别模块的复合体、供体DNA导入细胞来验证目标部位能够改变。并不希望其受到任何理论的限制，作为采用该方法改变目标部位的机制，如下推测。该核酸碱基转换酶将存在于目标部位的碱基转换为其他碱基，通过DNA糖苷酶去除该转换的碱基，通过AP核酸内切酶、DNA聚合酶、DNA连接酶等碱基切除修复(base excision repair：BER)路径的下游酶对由脱碱基反应而产生的无碱基部位(无嘌呤或嘧啶的(AP)位点)进行处理。另一方面，认为未完成BER而存在的异常核苷酸、错配结构导致互补链修复路径也被活化，在目标部位和供体DNA所含的区域引起同源重组，目标部位产生改变。因此，推测即使在使用DNA糖苷酶的情况下，该酶也使目标部位产生脱碱基，从而产生同样的改变，因此，不仅核酸碱基转换酶，DNA糖苷酶也适用于本发明的方法。

在本发明中，“核酸碱基转换酶”是指通过催化将DNA碱基的嘌呤或嘧啶环上的取代基转换为其他基团或原子的反应从而能够在不切断DNA链的情况下将目标核苷酸转换为其他核苷酸的酶。

在本发明中，“DNA糖苷酶”是指水解DNA的N-糖苷键的酶。DNA糖苷酶本来在BER中发挥从DNA中去除损伤的碱基的作用，但是，在本发明中，优选其能作用于DNA中的正常碱基(即，dC、dT、dA或dG或者它们受到表观遗传修饰的碱基)。本来不与正常的碱基反应或反应性低、但因突变而获得对正常碱基的反应性或反应性提高的突变DNA糖苷酶也包括在本发明中的DNA糖苷酶中，能够优选使用。对于采用该酶的脱碱基反应而产生的无碱基部位(无嘌呤或嘧啶的(AP)位点)，通过AP核酸内切酶、DNA聚合酶、DNA连接酶等BER路径的下游的酶进行处理。

另外，“对无变形的双螺旋结构的DNA的反应性足够低”是指，仅以将细胞毒性抑制至对细胞存活没有影响的程度的频率引起在形成无变形的双螺旋结构的DNA的区域内的脱碱基反应。此处，“无变形的双螺旋结构的DNA”是指处于形成牢固的双螺旋结构的状态(即，非松弛双螺旋DNA(或者，也简称为非松弛DNA))，不仅不包括形成对的碱基完全解离的单链DNA状态的DNA，而且不包括虽然形成碱基对但双螺旋结构解开并松懈的双链(松弛双链DNA)的状态的DNA。作为对无变形的双螺旋结构的DNA的反应性足够低的DNA糖苷酶，可举出对无变形的双螺旋结构的DNA的反应性天生足够低的DNA糖苷酶、与野生型相比导入了使对无变形的双螺旋结构的DNA的反应性更低的突变的突变DNA糖苷酶等。进一步，切成两个片段的作为分裂酶(split enzyme)的DNA糖苷酶也包括在本发明中的“对无变形的双螺旋结构的DNA的反应性足够低的DNA糖苷酶”中，该DNA糖苷酶设计成各片段与切成两个核酸序列识别模块中的任意一个结合而形成两个复合体，两个复合体重折叠时，该核酸序列识别模块能够与目标核苷酸序列特异性结合，通过该特异性结合该DNA糖苷酶能够催化脱碱基反应。

在本发明中，“核酸改变酶复合体”是指包括上述核酸序列识别模块与核酸碱基转换酶或DNA糖苷酶连接而成的复合体、且赋予了特定的核苷酸序列识别能力的具有核酸碱基转换反应或脱碱基反应的催化功能的分子复合体。此处，“复合体”不仅包括由多个分子构成的复合体，还包括像融合蛋白质那样在单一分子内具有核酸序列识别模块和核酸碱基转换酶等的复合体。

对于本发明中使用的核酸碱基转换酶而言，只要能够催化上述反应，就没有特别的限制，例如，可举出催化将氨基转换为羰基的脱氨化反应的、属于核酸/核苷酸脱氨酶超家族的脱氨酶。优选地，可举出能够将胞嘧啶或5-甲基胞嘧啶分别转换为尿嘧啶或胸腺嘧啶的胞苷脱氨酶、能够将腺嘌呤转换为次黄嘌呤的腺苷脱氨酶、能够将鸟嘌呤转换为黄嘌呤的鸟苷脱氨酶等。作为胞苷脱氨酶，更优选地，可举出在脊椎动物的获得性免疫中在免疫球蛋白基因中导入突变的酶即活化诱导胞苷脱氨酶(以下，也称为“AID”)等。

对核酸碱基转换酶的来源没有特别的限制，例如，能够使用来自七鳃鳗的PmCDA1(Petromyzon marinus cytosine deaminase 1)、来自哺乳动物(例如，人、猪、牛、马、猴等)的AID(Activation-induced cytidine deaminase；AICDA)。例如，PmCDA1的cDNA的碱基序列和氨基酸序列能够参照基因银行登记号EF094822和ABO15149，人AID的cDNA的碱基序列和氨基酸序列能够参照基因银行登记号NM_020661和NP_065712。从酶活性的观点出发，优选PmCDA1。

只要本发明中使用的DNA糖苷酶能够催化水解DNA的N-糖苷键并使碱基脱离的反应，就没有特别的限制，从提高基因组编辑技术的通用性的观点出发，优选能够作用于正常碱基(即，dC、dT、dA或dG、或者它们经过表观遗传修饰后的碱基，例如，5-甲基胞嘧啶等)的DNA糖苷酶。作为这种酶，例如，可举出具有催化使胞嘧啶脱离的反应的CDG活性的酶、具有催化使胸腺嘧啶脱离的反应的TDG活性的酶、具有催化使5-甲基胞嘧啶脱离的反应的活性(5-mCDG活性)的酶等，具体而言，可举出胸腺嘧啶DNA糖苷酶、氧鸟嘌呤糖基化酶、烷基腺嘌呤DNA糖苷酶(例如，酵母3-甲基腺嘌呤-DNA糖苷酶(MAG1)等)等。以往，本发明人报告了通过使用对无变形的双螺旋结构的DNA(非松弛DNA)的反应性足够低的DNA糖苷酶作为DNA糖苷酶，能够降低细胞毒性并高效地改变目标序列(国际公开第2016/072399号)。因此，作为DNA糖苷酶，优选使用对无变形的双螺旋结构的DNA的反应性足够低的DNA糖苷酶。作为这种DNA糖苷酶，可举出国际公开第2016/072399号记载的具有胞嘧啶-DNA糖苷酶(CDG)活性和/或胸腺嘧啶-DNA糖苷酶(TDG)活性的UNG(尿嘧啶-DNA糖苷酶)突变体、来自牛痘病毒的UDG突变体。

作为所述UNG突变体的具体例，可举出酵母UNG1的N222D/L304A双重突变体、N222D/R308E双重突变体、N222D/R308C双重突变体、Y164A/L304A双重突变体、Y164A/R308E双重突变体、Y164A/R308C双重突变体、Y164G/L304A双重突变体、Y164G/R308E双重突变体、Y164G/R308C双重突变体、N222D/Y164A/L304A三重突变体、N222D/Y164A/R308E三重突变体、N222D/Y164A/R308C三重突变体、N222D/Y164G/L304A三重突变体、N222D/Y164G/R308E三重突变体、N222D/Y164G/R308C三重突变体等。当使用其他UNG来代替酵母UNG1的情况下，只要使用在上述各突变体对应的氨基酸中导入了同样突变的突变体即可。例如，作为赋予TDG活性能的突变即与酵母UNG1的Y164A或Y164G突变对应的大肠杆菌的UNG突变，可举出Y66A或Y66G，作为人的UNG突变，可举出Y147A或Y147G。作为赋予CDG活性能的突变即与酵母UNG1的N222D突变对应的大肠杆菌的UNG突变，可举出N123D，作为人的UNG突变，可举出N204D。作为对无变形的双螺旋结构的DNA的反应性低的、且与酵母UNG1的L304A、R308E或R308C突变对应的大肠杆菌的UNG突变，可举出L191A、R195E或R195C，作为人的UNG突变，可举出L272A、R276E或R276C。作为来自牛痘病毒的UDG突变体，可举出N120D突变体(赋予CDG活性能)、Y70G突变体(赋予TDG活性能)、Y70A突变体(赋予TDG活性能)、N120D/Y70G双重突变体、N120D/Y70A双重突变体等。或者，也可以是切成两个片段的作为分裂酶的DNA糖苷酶，其设计成各片段与切成两个的核酸序列识别模块中的任意一个结合而形成两个复合体，两个复合体重折叠时，该核酸序列识别模块能够与目标核苷酸序列特异性结合，通过该特异性结合该DNA糖苷酶能够催化脱碱基反应。对分裂酶而言，例如能够参照国际公开第2016/072399号，Nat Biotechnol.33(2)：139-142(2015)、PNAS 112(10)：2984-2989(2015)的记载来设计和制备。

对UNG的来源没有特别的限制，例如，能够使用来自大肠杆菌的ung(Varshney,U.et al.(1988)J.Biol.Chem.,263,7776-7784)、来自酵母、哺乳动物(例如，人、小鼠、猪、牛、马、猴等)等的UNG1或UNG2、或者来自病毒(例如，痘病毒科(牛痘病毒等)、疱疹病毒科等)的UDG。

对于通过本发明的核酸改变酶复合体的核酸序列识别模块识别的双链DNA中的目标核苷酸序列而言，只要该模块能特异性结合，就没有特别的限制，可以是双链DNA中的任意的序列。对于目标核苷酸序列的长度而言，只要核酸序列识别模块足以特异性结合即可，例如，当在哺乳动物的基因组DNA中的特定部位导入突变时，根据该基因组大小，目标核苷酸序列的长度为12个核苷酸以上，优选为15个核苷酸以上，更优选为17个核苷酸以上。对于长度的上限没有特别的限制，优选为25个核苷酸以下，更优选为22个核苷酸以下。如后述的实施例所示，在目标核苷酸序列存在于目标部位、与同源臂相同的序列以及包含一部分与同源臂相同的序列的区域的任意一种实验体系中，均验证了高改变效率，因此，目标核苷酸序列可以存在于目标部位，也可以存在于与同源臂相同的序列的至少一部分区域，还可以存在于与同源臂相同的序列的附近区域。

作为本发明的核酸改变酶复合体的核酸序列识别模块，例如，除了Cas效应蛋白质(也称Cas核酸酶)中的至少一种DNA切断能力失活的CRISPR-Cas系统(以下，也称“CRISPR-突变Cas”)、锌指基序、TAL(transcription activator-like，转录激活因子样)效应因子和PPR(pentatricopeptide repeat，五肽重复)基序等以外，能够使用包括限制性酶、转录因子、RNA聚合酶等能与DNA特异性结合的蛋白质的DNA结合域且不具有DNA双链断裂能力的片段等，但并不限定于此。优选地，可举出CRISPR-突变Cas、锌指基序、TAL效应因子、PPR基序等。在本说明书中，也将所述至少一种DNA切断能力失活的Cas效应蛋白质称为Cas效应蛋白质的突变体。

锌指基序是将3～6个Cys2His2型的不同锌指单元(一个锌指识别约3个碱基)连接而成的，能够识别9～18个碱基的目标核苷酸序列。锌指基序能够通过模块化组装(Modularassembly)法Nat Biotechnol(2002)20：135-141)、OPEN法(Mol Cell(2008)31：294-301)、CoDA法(Nat Methods(2011)8：67-69)、大肠杆菌单杂交法(Nat Biotechnol(2008)26：695-701)等公知的方法来制备。对于锌指基序的制备的详细情况，能够参照日本专利第4968498号公报。

TAL效应因子具有以约34个氨基酸为单位的模块的重复结构，通过一个模块的第12个和第13个的氨基酸残基(称为RVD)来确定结合稳定性和碱基特异性。各模块的独立性高，因此，仅通过连接模块能够制备对于目标核苷酸序列具有特异性的TAL效应因子。对于TAL效应因子而言，建立利用开放资源的制备方法(REAL法(Curr Protoc Mol Biol(2012)Chapter 12：Unit 12.15)、FLASH法(Nat Biotechnol(2012)30：460-465)、Golden Gate法(Nucleic Acids Res(2011)39：e82)等)，能够比较简单地设计针对目标核苷酸序列的TAL效应因子。对于TAL效应因子的制备的详细情况，能够参照日本特表2013-513389号公报。

PPR基序配置为通过由35氨基酸构成且识别一个核酸碱基的PPR基序的连续来识别特定的核苷酸序列，仅通过各基序的第1、4和ii(-2)个氨基酸来识别目标碱基。由于不依赖于基序构成，没有来自两侧基序的干扰，因此，与TAL效应因子同样地，仅通过连接PPR基序就能够制备对于目标核苷酸序列具有特异性的PPR蛋白质。对于PPR基序的制备的详细情况，能够参照日本特开2013-128413号公报。

另外，在使用限制性酶、转录因子、RNA聚合酶等片段的情况下，由于这些蛋白质的DNA结合域是众所周知的，因此，能够容易地设计并构建包含该结构域且不具有DNA双链断裂能力的片段。

上述任意一种核酸序列识别模块也能够以与上述核酸碱基转换酶等的融合蛋白质的形式提供，或者也可以使SH3结构域、PDZ结构域、GK结构域、GB结构域等蛋白质结合域和各自的结合伙伴分别与核酸序列识别模块和核酸碱基转换酶等融合，并通过该结构域与其结合伙伴的相互作用以蛋白质复合体的形式提供。或者，也能够分别使内含肽(intein)与核酸序列识别模块和核酸碱基转换酶等融合，通过各蛋白质合成后的连接来连接二者。

包含核酸序列识别模块和核酸碱基转换酶等结合而得的复合体(包含融合蛋白质)而成的本发明的核酸改变酶复合体与双链DNA的接触通过在具有目标双链DNA(例如，基因组DNA)的细胞中导入编码该复合体的核酸来实施。在本说明书中，编码核酸改变酶复合体的核酸包含编码核酸序列识别模块的碱基序列以及编码核酸碱基转换酶或DNA糖苷酶的碱基序列，在该核酸序列识别模块为CRISPR-Cas系统的情况下，还包含编码向导RNA的序列。

因此，对于核酸序列识别模块和核酸碱基转换酶等而言，优选的是，以核酸的形式来制备，所述核酸为编码核酸序列识别模块和核酸碱基转换酶的融合蛋白质的核酸，或者为以在利用结合域、内含肽等翻译成蛋白质后能在宿主细胞内形成复合体那样的形式分别编码核酸序列识别模块和核酸碱基转换酶的核酸。此处，核酸既可以是DNA，也可以是RNA。在DNA的情况下，优选为双链DNA，以在宿主细胞内在功能性启动子的控制下配置的表达载体的形式提供。在RNA的情况下，优选为单链RNA。

核酸序列识别模块和核酸碱基转换酶等结合而得的本发明的复合体并不伴随DNA双链断裂(DSB)，因此，能够进行毒性低的基因组编辑，本发明的方法能够适用于范围宽的生物材料。因此，导入编码核酸序列识别模块和/或核酸碱基转换酶等的核酸的细胞也能够包括从作为原核生物的大肠杆菌等细菌、作为低等真核生物的酵母等微生物的细胞到包括人等哺乳动物的脊椎动物、昆虫、植物等高等真核生物的细胞在内的所有生物种的细胞。

编码锌指基序、TAL效应因子、PPR基序等核酸序列识别模块的DNA能够通过针对各模块的上述任意一种方法来获得。编码限制性酶、转录因子、RNA聚合酶等序列识别模块的DNA例如通过如下方法进行克隆：基于它们的cDNA序列信息，以覆盖编码该蛋白质的所期望的部分(包括DNA结合域的部分)的区域的方式合成寡DNA引物，使用由产生该蛋白质的细胞制备的总RNA或mRNA组分作为模板，通过RT-PCR法进行扩增。

编码核酸碱基转换酶等的DNA(即，编码核酸碱基转换酶的DNA或编码DNA糖苷酶的DNA)也同样地通过如下方法进行克隆：以使用的酶的cDNA序列信息为基础合成寡DNA引物，使用由产生该酶的细胞制备的总RNA或mRNA组分作为模板，通过RT-PCR法进行扩增。例如，编码七鳃鳗的PmCDA1的DNA通过如下方法进行克隆：以在NCBI数据库中登记的cDNA序列(登记号EF094822)为基础针对CDS的上游和下游设计适当的引物，能够通过RT-PCR法由来自七鳃鳗的mRNA进行克隆。另外，编码人AID的DNA通过如下方法进行克隆：以在NCBI数据库中登记的cDNA序列(登记号AB040431)为基础针对CDS的上游和下游设计适当的引物，例如能够通过RT-PCR法由来自人淋巴结的mRNA进行克隆。另外，供体DNA也能够基于目标部位的序列信息等与上述同样地进行克隆。

克隆化的DNA保持原状态或根据期望通过限制性酶消化、或者在附加适当的连接子和/或核定位信号(在目标双链DNA为线粒体、叶绿体DNA的情况下，为各细胞器定位信号)后，与编码核酸序列识别模块的DNA连接，从而能够制备编码融合蛋白质的DNA。或者，也可以通过分别使编码结合域或其结合伙伴的DNA与编码核酸序列识别模块的DNA和编码核酸碱基转换酶等的DNA融合、或者使编码分离内含肽的DNA与两个DNA融合，由此，能够使核酸序列识别转换模块和核酸碱基转换酶等在宿主细胞内被翻译后形成复合体。在这些情况下，根据期望也能够在一个或两个DNA的适当位置连接连接子和/或核定位信号。另外，供体DNA可以作为单一DNA制备，也可以以编码核酸序列识别模块和/或核酸碱基转换酶等的核酸和单一DNA的形式提供。

对于编码核酸序列识别模块的DNA、编码核酸碱基转换酶等的DNA、供体DNA，也能够通过化学合成DNA链或者利用PCR法、无缝克隆(Gibson Assembly)法将合成的一部分重叠的寡DNA短链连接，来构建编码其全长的DNA。在供体DNA为单链核酸的情况下，作为除化学合成DNA链以外的方法，例如，通过限制性酶将包含该DNA的质粒DNA消化为单链，用RNA聚合酶合成RNA后，通过逆转录酶合成cDNA，通过RNaseH将RNA链分化，从而能够制备。或者，也能够通过切口酶型限制性酶消化包含供体DNA的质粒，并经过采用电泳的分离/纯化来制备。通过与化学合成或PCR法或无缝克隆法的组合构建全长DNA的优点在于，根据导入该DNA的宿主能够在CDS全长设计使用密码子。在异源DNA表达时，通过将该DNA序列转换为宿主生物中使用频率高的密码子，能够期待蛋白质表达量增大。对于使用的宿主中的密码子使用频率的数据，例如能够使用日本(公益财团法人)KazusaDNA研究所的主页公开的遗传密码使用频率数据库(http：//www.kazusa.or.jp/codon/index.html)、或者也可以参照记载各宿主中的密码子使用频率的文献。只要参照获得的数据和要导入的DNA序列，在该DNA序列中使用的密码子中将在宿主中使用频率低的密码子转换为编码同一氨基酸且使用频率高的密码子即可。

另外，在将除目标核苷酸序列和PAM序列以外的部位作为目标部位的情况下，有可能在改变后还剩余这些序列，因核酸改变酶等而发生核酸碱基转换反应或脱碱基反应，因此，优选的是，以使这些序列被去除的方式设计供体DNA、或者在同源臂上的目标核苷酸序列或PAM序列中导入沉默突变。

包含编码核酸序列识别模块和/或核酸碱基转换酶等的DNA的表达载体例如能够通过将该DNA与适当的表达载体中的启动子的下游连接来制备。

作为表达载体，能够使用来自大肠杆菌的质粒(例如，pBR322、pBR325、pUC12、pUC13)；来自枯草菌的质粒(例如，pUB110、pTP5、pC194)；来自酵母的质粒(例如，pSH19、pSH15)；昆虫细胞表达质粒(例如pFast-Bac)；动物细胞表达质粒(例如，pA1-11、pXT1、pRc/CMV、pRc/RSV、pcDNAI/Neo)；λ噬菌体等噬菌体；杆状病毒等昆虫病毒载体(例如，BmNPV、AcNPV)；逆转录病毒、牛痘病毒、腺病毒等动物病毒载体等。

作为启动子，只要其是与基因的表达中使用的宿主相应的适当的启动子，就可以使用任意一种。在伴随DSB的以往方法中，存在毒性导致宿主细胞的存活率显著降低的情况，因此，优选使用诱导启动子来增加细胞数量直至诱导开始，但是，由于即便使本发明的核酸改变酶复合体表达也能得到充分的细胞增殖，因此，组成型启动子也能够没有限定地使用。

例如，当宿主为动物细胞时，能够使用SRα启动子、SV40启动子、LTR启动子、CMV(巨细胞病毒)启动子、RSV(劳氏肉瘤病毒)启动子、MoMuLV(莫洛尼氏鼠白血病病毒)LTR、HSV-TK(单纯疱疹病毒胸苷激酶)启动子等。其中，优选CMV启动子、SRα启动子等。

当宿主为大肠杆菌时，优选trp启动子、lac启动子、recA启动子、λP_L启动子、lpp启动子、T7启动子等。

当宿主为芽孢杆菌属菌时，优选SPO1启动子、SPO2启动子、penP启动子等。

当宿主为酵母时，优选Gal1/10启动子、PHO5启动子、PGK启动子、GAP启动子、ADH启动子等。

当宿主为昆虫细胞时，优选多角体启动子、P10启动子等。

当宿主为植物细胞时，优选CaMV35S启动子、CaMV19S启动子、NOS启动子等。

作为表达载体，除了上述以外，根据期望能够使用含有增强子、剪接信号、终止子、poly-A加接信号、药剂抗性基因、营养缺陷型互补基因等选择标志物、复制起点等的表达载体。

例如，以对编码上述核酸序列识别模块和/或核酸碱基转换酶等的DNA进行编码的载体为模板，通过本领域公知的体外转录系统转录为mRNA，从而能够制备编码核酸序列识别模块和/或核酸碱基转换酶等的RNA。

将包含编码核酸序列识别模块和/或核酸碱基转换酶等的DNA的表达载体导入宿主细胞并培养该宿主细胞，从而能够使核酸序列识别模块与核酸碱基转换酶等的复合体在细胞内表达。

作为宿主，例如，能够使用埃希氏杆菌属菌、芽孢杆菌属菌、酵母、昆虫细胞、昆虫、动物细胞等。

作为埃希氏杆菌属菌，例如，能够使用大肠杆菌(Escherichia coli)K12·DH1〔Proc.Natl.Acad.Sci.USA，60，160(1968)〕、大肠杆菌JM103〔Nucleic Acids Research，9，309(1981)〕、大肠杆菌JA221〔Journal of Molecular Biology，120，517(1978)〕、大肠杆菌HB101〔Journal of Molecular Biology，41，459(1969)〕、大肠杆菌C600〔Genetics，39，440(1954)〕等。

作为芽孢杆菌属菌，例如，能够使用枯草杆菌(Bacillus subtilis)MI114〔Gene，24，255(1983)〕、枯草杆菌207-21〔Journal of Biochemistry，95，87(1984)〕等。

作为酵母，例如，能够使用酿酒酵母(Saccharomyces cerevisiae)AH22、AH22R^-、NA87-11A、DKD-5D、20B-12、粟酒裂殖酵母(Schizosaccharomyces pombe)NCYC1913、NCYC2036、毕赤酵母(Pichia pastoris)KM71等。

作为昆虫细胞，例如，当病毒为AcNPV时，能够使用来自甘蓝夜蛾的幼虫的确立细胞株(草地贪夜蛾细胞；Sf细胞)、来自粉纹夜蛾(Trichoplusia ni)的中肠的MG1细胞、来自粉纹夜蛾卵的High Five^TM细胞、来自甘蓝夜蛾(Mamestra brassicae)的细胞、来自盐泽灯蛾(Estigmena acrea)的细胞等。当病毒为BmNPV时，作为昆虫细胞，能够使用来自蚕的确立细胞株(家蚕N细胞；BmN细胞)等。作为该Sf细胞，例如，能够使用Sf9细胞(ATCC CRL1711)、Sf21细胞〔以上，In Vivo，13，213-217(1977)〕等。

作为昆虫，例如，能够使用蚕的幼虫、果蝇、蟋蟀等〔Nature，315，592(1985)〕。

作为动物细胞，例如，能够使用猴COS-7细胞、猴Vero细胞、中国地鼠卵巢(CHO)细胞、dhfr基因缺失CHO细胞、小鼠L细胞，小鼠AtT-20细胞、小鼠骨髓瘤细胞、大鼠GH3细胞、人胚胎肾细胞(例如HEK293细胞)、人肝癌细胞(例如HepG2)、人FL细胞等细胞株、人及其他哺乳动物的iPS细胞、ES细胞等多能干细胞、由各种组织制备的原代培养细胞。进一步，也能够使用斑马鱼胚胎、非洲爪蟾卵母细胞等。

作为植物细胞，能够使用由各种植物(例如，稻、小麦、玉米等谷物；番茄、黄瓜、茄子等经济作物；康乃馨、洋桔梗等园艺植物；烟草、拟南芥等实验植物等)制备的悬浮培养细胞、愈伤组织、原生质体、叶切片、根切片等。

表达载体的导入能够根据宿主的种类按照公知的方法(例如，溶菌酶法、感受态法、PEG法、CaCl₂共沉淀法、电穿孔法、微注射法、基因枪法、脂转染法、农杆菌法等)来实施。也能够通过同样的方法将供体DNA导入细胞。当以不同分子的形式导入表达载体和供体DNA时，表达载体和供体DNA的导入既可以同时进行，也可以在不同的时机进行。

大肠杆菌例如能够按照Proc.Natl.Acad.Sci.USA，69，2110(1972)、Gene，17，107(1982)等记载的方法进行转化。

芽孢杆菌属菌例如能够按照Molecular&General Genetics，168，111(1979)等记载的方法进行载体导入。

酵母例如能够按照Methods in Enzymology，194，182-187(1991)、Proc.Natl.Acad.Sci.USA，75，1929(1978)等记载的方法进行载体导入。

昆虫细胞和昆虫例如能够按照Bio/Technology，6，47-55(1988)等记载的方法进行载体导入。

动物细胞例如能够按照细胞工学附册8新细胞工学实验方案，263-267(1995)(秀润社发行)、Virology，52，456(1973)记载的方法进行载体导入。

导入载体和供体DNA的细胞的培养能够根据宿主的种类按照公知的方法来实施。

例如，当培养大肠杆菌或芽孢杆菌属菌时，作为用于培养的培养基，优选液体培养基。另外，优选培养基含有转化体的生长所需的碳源、氮源、无机物等。此处，作为碳源，例如，可举出葡萄糖、糊精、可溶性淀粉、蔗糖等；作为氮源，例如，可举出铵盐类、硝酸盐类、玉米浆、蛋白胨、酪蛋白、肉提取物、豆粉、马铃薯提取液等无机或有机物质；作为无机物，例如，可举出氯化钙、磷酸二氢钠、氯化镁等。另外，也可以在培养基中添加酵母提取物、维生素类、生长促进因子等。培养基的pH优选为约5～约8。

作为培养大肠杆菌的培养基，例如，优选包含葡萄糖、酪蛋白氨基酸的M9培养基〔Journal of Experiments in Molecular Genetics，431-433，Cold Spring HarborLaboratory，New York 1972〕。根据需要，为了使启动子高效地发挥作用，例如，也可以在培养基中添加像3β-吲哚丙烯酸那样的药剂。大肠杆菌的培养通常在约15～约43℃的条件下进行。根据需要，也可以进行通气、搅拌。

芽孢杆菌属菌的培养通常在约30～约40℃的条件下进行。根据需要，也可以进行通气、搅拌。

作为培养酵母的培养基，例如，可举出伯克霍尔德(Burkholder)基础培养基〔Proc.Natl.Acad.Sci.USA，77，4505(1980)〕、含有0.5％酪蛋白氨基酸的SD培养基〔Proc.Natl.Acad.Sci.USA，81，5330(1984)〕等。培养基的pH优选为约5～约8。培养通常在约20℃～约35℃的条件下进行。根据需要，也可以进行通气、搅拌。

作为培养昆虫细胞或昆虫的培养基，例如能够使用在Grace's昆虫培养基〔Nature，195，788(1962)〕中适当加入失活的10％牛血清等添加物的培养基等。培养基的pH优选为约6.2～约6.4。培养通常在约27℃的条件下进行。根据需要，也可以进行通气、搅拌。

作为培养动物细胞的培养基，例如，能够使用含有约5～约20％的胎牛血清的最低必需培养基(MEM)〔Science，122，501(1952)〕、杜尔贝科(Dulbecco)改良伊格尔(Eagle)培养基(DMEM)〔Virology，8，396(1959)〕、RPMI 1640培养基〔The Journal of the AmericanMedical Association，199，519(1967)〕、199培养基〔Proceeding of the Society forthe Biological Medicine，73，1(1950)〕等。培养基的pH优选为约6～约8。培养通常在约30℃～约40℃的条件下进行。根据需要，也可以进行通气、搅拌。

作为培养植物细胞的培养基，能够使用MS培养基、LS培养基、B5培养基等。培养基的pH优选为约5～约8。培养通常在约20℃～约30℃的条件下进行。根据需要，也可以进行通气、搅拌。

如上所述，能够使核酸序列识别模块与核酸碱基转换酶等的复合体即核酸改变酶复合体在细胞内表达。

通过微注射法、脂转染法等能够将编码核酸序列识别模块和/或核酸碱基转换酶等的RNA导入宿主细胞。RNA导入能够进行一次、或者隔开适当的间隔反复进行多次(例如，2～5次)。

对于锌指基序而言，与目标核苷酸序列特异性结合的锌指的制备效率不高，而且，结合特异性高的锌指的筛选繁杂，因此，大量制备实际发挥作用的锌指基序并不容易。与锌指基序相比，TAL效应因子、PPR基序的目标核酸序列识别的自由度高，但由于需要每次根据目标核苷酸序列设计并构建巨大的蛋白质，因此，在效率方面仍存在问题。

相对于此，CRISPR-Cas系统通过与目标核苷酸序列互补的向导RNA识别目标双链DNA的序列，因此，仅合成能与目标核苷酸序列特异性杂交的寡DNA，就能够靶向任意的序列。

因此，在本发明的更优选实施方式中，作为核酸序列识别模块，能够仅使用Cas效应蛋白质的仅一种DNA切断能力失活或两种DNA切断能力失活的CRISPR-Cas系统(CRISPR-突变Cas)。

使用CRISPR-突变Cas的本发明的核酸序列识别模块以包含与目标核苷酸序列互补的序列的CRISPR-RNA(crRNA)、根据需要招募突变Cas效应蛋白质所需的反式激活RNA(tracrRNA)(在需要tracrRNA的情况下，能够以与crRNA的嵌合RNA的形式提供)、以及突变Cas效应蛋白质的复合体的形式提供。将与突变Cas效应蛋白质结合来构成核酸序列识别模块的、由crRNA单独构成或由crRNA与tracrRNA的嵌合RNA构成的RNA分子统称为“向导RNA”。使用不导入突变的CRISPR/Cas系统的情况也是同样的。

对于本发明中使用的Cas效应蛋白质而言，只要能与向导RNA形成复合体并且能识别并结合于目的基因中的目标核苷酸序列和与其邻接的前间区序列邻近基序(PAM)，就没有特别的限定，优选为Cas9(也称为Cas9核酸酶)或Cpf1(也称为Cpf1核酸酶)。作为Cas9，例如，可举出来自酿脓链球菌(Streptococcus pyogenes)的Cas9(SpCas9；PAM序列NGG(N为A、G、T或C。以下相同))、来自嗜热链球菌(Streptococcus thermophilus)的Cas9(StCas9；PAM序列NNAGAAW)、来自脑膜炎双球菌(Neisseria meningitidis)的Cas9(MmCas9；PAM序列NNNNGATT)等，但并不限定于此。优选为PAM的制约少的SpCas9(实质为2个碱基，理论上几乎能够靶向基因组上的任何位置)。另外，作为Cpf1，例如，可举出来自新凶手弗朗西丝氏菌(Francisella novicida)的Cpf1(FnCpf1；PAM序列NTT)、来自氨基酸球菌属(Acidaminococcus sp.)的Cpf1(AsCpf1；PAM序列NTTT)、来自毛螺科菌(Lachnospiraceaebacterium)的Cpf1(LbCpf1；PAM序列NTTT)等，但并不限定于此。作为本发明中使用的突变Cas效应蛋白质(有时简称为突变Cas)，能够使用Cas效应蛋白质的双链DNA的两条链的切断能力失活的突变Cas效应蛋白质以及具有仅使一条链的切断能力失活的切口酶活性的突变Cas效应蛋白质中的任意一种。例如，在SpCas9的情况下，能够使用第10个Asp残基转换为Ala残基且缺乏与向导RNA形成互补链的链的相反链的切断能力的(因此，对与向导RNA形成互补链的链具有切口酶活性)D10A突变体、或者第840个His残基用Ala残基转换且缺乏与向导RNA形成互补链的链的切断能力的(因此，对与向导RNA形成互补链的链的相反链具有切口酶活性)H840A突变体及其双重突变体(dCas9)。另外，在FnCpf1的情况下，能够使用第917个Asp残基转换为Ala残基(D917A)或者第1006个Glu残基转换为Ala残基(E1006A)、且缺乏两条链的切断能力的突变体。只要缺乏双链DNA的至少一条链的切断能力即可，其他突变Cas也同样地能够使用。

编码Cas效应蛋白质(包含突变Cas，以下同样)的DNA能够通过与针对编码碱基切除修复的抑制剂的DNA的上述方法同样的方法，由产生该酶的细胞克隆。另外，突变Cas能够通过以下方法获取：使用本领域公知的定向诱变法在克隆化的编码Cas的DNA中导入突变，使得用其他氨基酸转换对DNA切断活性重要的部位的氨基酸残基(例如，在SpCas9的情况下，可举出第10个的Asp残基、第840个的His残基；在FnCpf1的情况下，可举出第917个的Asp残基、第1006个的Glu残基等，但并不限定于此)。

或者，编码Cas效应蛋白质的DNA也能够通过与针对编码核酸序列识别模块的DNA、编码核酸碱基转换酶的DNA的上述方法同样的方法，采用与化学合成或PCR法或无缝克隆法的组合构建为具有适于使用的宿主细胞中的表达的密码子使用的DNA。

根据目标细胞，编码得到的Cas效应蛋白质和/或核酸改变酶和/或碱基切除修复的抑制剂的DNA能够插入与上述同样的表达载体的启动子的下游。

另一方面，对于编码向导RNA的DNA，设计包括与目标核苷酸序列互补的核苷酸序列(本说明书中，也称为“导向序列(targeting sequence)”)的crRNA序列(例如，当招募FnCpf1作为Cas效应蛋白质时，能够使用在导向序列的5’侧包含序列号1；AAUUUCUACUGUUGUAGAU的crRNA，划线部分的序列形成碱基对而构成茎环结构)的编码序列、或者连接包括与目标核苷酸序列互补的核苷酸序列的crRNA编码序列以及根据需要已知的tracrRNA编码序列(例如，作为招募Cas9作为Cas效应蛋白质时的tracrRNA编码序列，为gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt；序列号2或gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtggtgctttt；序列号3)而得的寡DNA序列，使用DNA/RNA合成仪能够进行化学合成。

此处，“目标链”是指目标核苷酸序列中与crRNA杂交的链，将在其相反链因目标链与crRNA的杂交而成为单链状的链称为“非目标链(non-targetedstrand)”。当用一条链表示目标核苷酸序列时(例如表示PAM序列的情况、表示目标核苷酸序列与PAM的位置关系的情况等)，用非目标链的序列来代表。

对于导向序列的长度，只要能与目标核苷酸序列特异性结合，就没有特别的限定，例如为15～30个核苷酸，优选为18～25个核苷酸。

导向序列的设计例如通过以下方法进行：当使用Cas9作为Cas效应蛋白质时，使用公开的向导RNA设计网站(CRISPR Design Tool，CRISPRdirect等)，从目的基因的CDS序列中列出在3’侧邻接PAM(例如，在SpCas9的情况下，为NGG)的20mer序列，当在从其5’端至3’的方向将7个核苷酸以内的C转换为T时，选择在目的基因编码的蛋白质中产生氨基酸变化那样的序列。另外，在使用除20mer以外的导向序列的长度的情况下，也能够选择适当序列。从这些候选中，能够使用目的宿主基因组中的脱靶位点数少的候选序列作为导向序列。在使用的向导RNA设计软件中没有检索宿主基因组的脱靶位点的功能时，例如，针对候选序列的3’侧的8～12个核苷酸(目标核苷酸序列的识别能力高的seed序列)，通过对宿主基因组实施Blast检索，能够检索脱靶位点。

编码向导RNA的DNA也能够插入与上述同样的表达载体，作为启动子，优选使用polIII系的启动子(例如，SNR6、SNR52、SCR1、RPR1、U3、U6、H1启动子等)以及终止子(例如，PolyT序列(T6序列等))。

编码向导RNA(crRNA或crRNA-tracrRNA嵌合)的DNA能够通过设计将与目标核苷酸序列的目标链互补的序列和已知的tracrRNA序列(在招募Cas9的情况下)或crRNA的直接重复序列(在招募Cpf1的情况下)连接而得的寡RNA序列并使用DNA/RNA合成仪来化学合成。

编码突变Cas和/或核酸碱基转换酶等的DNA或RNA、向导RNA-tracrRNA或编码它的DNA能够根据宿主通过与上述同样的方法导入宿主细胞。

对于以往的人工核酸酶而言，由于伴随DNA双链断裂(DSB)，因此，以基因组内的序列为目标时，会引起认为由染色体的无序断裂(脱靶断裂)导致的增殖抑制和细胞死亡。在本发明中，并不切断DNA，而利用DNA碱基上取代基的转换反应(特别是脱氨化反应)或脱碱基反应以及之后的修复机构进行目标部位的改变，因此，能够实现毒性的显著降低。

在本发明的方法中，也能够使用不同位置的多个目标核苷酸序列来改变目标部位。因此，在本发明的一实施方式中，能够使用分别与不同目标核苷酸序列特异性结合的两种以上的核酸序列识别模块。在该情况下，这些核酸序列识别模块中的各一个与核酸碱基转换酶等形成核酸改变酶复合体。此处，能够使用共同的核酸碱基转换酶等。例如，当使用CRISPR-Cas系统作为核酸序列识别模块时，使用共同的Cas效应蛋白质和核酸碱基转换酶等的复合体(包含融合蛋白质)，作为向导RNA(crRNA或crRNA-tracrRNA嵌合)，能够制备并使用两种以上的与不同目标核苷酸序列分别形成互补链的2个以上的crRNA或者2个以上的crRNA中的每一个与tracrRNA的嵌合RNA。另一方面，在使用锌指基序、TAL效应因子等作为核酸序列识别模块的情况下，例如，能够使核酸碱基转换酶等与和不同目标核苷酸特异性结合的各核酸序列识别模块融合。

为了使本发明的核酸改变酶复合体在宿主细胞内表达，如上所述将包含编码该核酸改变酶复合体的DNA的表达载体导入宿主细胞，为了高效地导入突变，优选维持规定期间以上且规定水平以上的核酸改变酶复合体的表达。从这种观点出发，可靠地将该表达载体编入宿主基因组，但是，核酸改变酶复合体的持续表达增大了脱靶断裂的风险，因此，优选在成功地实现目标部位的改变后，快速地去除。作为用于去除编入宿主基因组的DNA的方法，可举出使用Cre-loxP系、FLP-FRT系的方法、使用转座子的方法等。

或者，在所期望的时期引起核酸反应，仅在目标部位的改变被固定所需的期间使本发明的核酸改变酶复合体在宿主细胞内短暂表达，由此，能够避免脱靶断裂的风险而且高效地实现宿主基因组的编辑。本领域技术人员能够基于使用的培养条件等适当确定优选的表达诱导期间。编码本发明的核酸改变酶复合体的核酸的表达诱导期间可以在不会使宿主细胞产生副作用的范围内超出上述“目标部位的改变被固定所需的期间”并延长。

作为使本发明的核酸改变酶复合体在所期望的时期短暂表达所期望的期间的方法，可举出制备以能够控制表达期间的方式包含编码该核酸改变酶复合体的核酸(在突变CRISPR-Cas系统中，编码向导RNA的DNA和编码Cas效应蛋白质和核酸改变酶等的DNA)的构建体(表达载体)，并导入宿主内的方法。作为“能够控制表达期间的方式”，具体而言，可举出将编码本发明的核酸改变酶复合体的核酸处于诱导性的调节区域的控制下。对“诱导性的调节区域”没有特别的限定，例如，可举出温度敏感(ts)突变阻抑物与被其控制的操纵基因的操纵子。作为ts突变阻抑物，例如，可举出来自λ噬菌体的cI阻抑物的ts突变体，但并不限定于此。在λ噬菌体cI阻抑物(ts)的情况下，在30℃以下(例如，28℃)的条件下与操纵基因结合从而抑制下游的基因表达，而在37℃以上(例如，42℃)的高温条件下，由于从操纵基因解离，因此诱导基因表达。因此，通常，在30℃以下培养导入了编码核酸改变酶复合体的核酸的宿主细胞，在适当的时期将温度提高至37℃以上并培养规定期间，使其进行同源重组，在目标基因中导入突变后，快速回到30℃以下，从而能够使目标基因的表达被抑制的期间达到最短，即使在靶向对于宿主细胞而言必需基因的情况下，也能够控制副作用并且高效地编辑。

在利用温度敏感突变的情况下，例如，通过将载体的自主复制所需的蛋白质的温度敏感突变体搭载在包含编码本发明的核酸改变酶复合体的DNA的载体中，由此，在该核酸改变酶复合体表达后，不能快速自主复制，随着细胞分裂，该载体自然脱落。作为这种温度敏感突变蛋白质，可举出pSC101ori的复制所需的Rep101 ori的温度敏感突变体，但并不限定于此。对于Rep101ori(ts)而言，在30℃以下(例如28℃)，能够作用于pSC101 ori而进行质粒的自主复制，但达到37℃以上(例如42℃)时，功能消失，质粒不能自主复制。因此，通过与上述λ噬菌体的cI阻抑物(ts)联合使用，能够同时进行本发明的核酸改变酶复合体的短暂表达和质粒去除。

另外，在诱导启动子(例如，lac启动子(通过IPTG诱导)、cspA启动子(通过冷激诱导)、araBAD启动子(通过阿拉伯糖诱导)等)的控制下将编码本发明的核酸改变酶复合体的DNA导入宿主细胞内，在适当的时期在培养基中添加诱导物质(或从培养基去除)来诱导该核酸改变酶复合体的表达，培养规定期间，进行核酸改变反应，在目标基因导入突变后，能够实现核酸改变酶复合体的短暂表达。

以下，通过实施例对本发明进行说明。但是，本发明并不限定于这些实施例。

实施例

＜酿酒酵母的细胞株的培养、转化、表达诱导＞

使用酿酒酵母Saccharomyces cerevisiae BY4741株(亮氨酸和尿嘧啶营养缺陷型)，通过符合标准YPDA培养基或SD培养基的营养缺陷型的缺陷型(dropout)组成进行培养。对于培养，在25℃至30℃之间进行采用琼脂板的静置培养或采用液体培养基的震动培养。对于转化，采用醋酸锂法，用符合适当的营养缺陷型的SD培养基进行选择。对于使用半乳糖的表达诱导，用适当的SD培养基预培养一夜后，在将碳源由2％葡萄糖替换为2％棉子糖的SR培养基中继代培养，培养一夜，再在将碳源替换为0.2％半乳糖的SGal培养基中继代培养，培养3小时至两夜左右，进行表达诱导。

对于存活细胞数量和Can1突变率的测定，将细胞悬浮液适当稀释并涂布在SD板培养基以及SD-Arg+60mg/l刀豆氨酸板培养基或SD+300mg/l刀豆氨酸板培养基中，对3天后出现的菌落数进行计数并作为存活细胞数量。将SD板中的存活菌落数作为总细胞数量，将刀豆氨酸板中的存活菌落数作为耐性突变株数，算出并评价突变率。对于突变导入部位，通过菌落PCR法对包含各株的目的基因区域的DNA片段进行扩增后，进行DNA测序，基于酵母基因组数据库(http：//www.yeastgenome.org/)的序列进行比对解析并鉴定。

＜动物细胞的细胞株的培养、表达诱导＞

使用添加了10μg/mL嘌呤霉素(美国生命技术公司)和10％胎牛血清(FBS)(法国Biosera公司，尼艾莱(Nuaille))的DME-glutamax培养基(赛默飞世尔科技公司)在37℃、5％CO₂条件下对人胚胎肾细胞(HEK293T细胞)进行培养。采用5％胰蛋白酶进行细胞的回收。用37℃的水浴溶解在冷藏器(deep freezer)中保存的HEK293T细胞，播种到75T-烧瓶，以达到5×10⁶个细胞。培养1-3天后回收细胞，播种到24孔板的各孔，以达到0.5×10⁵个细胞/孔。培养1-3天后，使用各500ng/孔的下述质粒(效应质粒和报告质粒)(总计1μg/孔)、200nM的供体DNA、1.5μl的FugeneHD(普洛麦格公司(プロメガ))，对60-80％汇合状态的各孔的细胞进行转染。将各实施例中使用的供体DNA示于表1。转染72小时后回收细胞，使用FACS检测iRFP和EGFP的荧光。通过下述式，根据检测到的细胞数量算出重组效率(％)。

表1

数学式1

＜核酸操作＞

DNA通过PCR法、限制性酶处理、连接、无缝克隆法、人工化学合成中的任意一种方法加工并构建。对质粒而言，作为酵母/大肠杆菌穿梭载体使用亮氨酸选择用pRS415和尿嘧啶选择用pRS426作为骨架。质粒采用大肠杆菌株XL-10gold或DH5α进行扩增，采用醋酸锂法导入酵母。

＜酿酒酵母用构建体的构建＞

同源臂、向导RNA、插入序列等序列参照酵母基因组的数据库(https：//www.yeastgenome.org/)来设计。载体构建按照Nishida K.et al.，Science 16：353(6305)(2016)doi：10.1126/science.aaf8729记载的方法来进行。1×gRNA载体相当于将序列号15的序列的第5871个～第5890个碱基序列置换为L86或M4的目标核苷酸序列的互补序列而得的载体。2×gRNA载体相当于将序列号16的序列的第2638个～第2657个碱基序列置换为L86、L87、L88、L93以及R90中的任意一个目标核苷酸序列的互补序列且将序列号16的第6293个～第6312个碱基序列置换为L87、R89、R90、R91以及R92中的任意一个目标核苷酸序列的互补序列而得的载体。上述目标核苷酸如下所述。

L86：CGAACAGAGTAAACCGAATC(序列号17)

L87：AGCACTATCAAGGCTAATAA(序列号18)

L88：GCGAACTTGAAGAATAACCA(序列号19)

R89：TCACCTAACTCAGACATTAT(序列号20)

R90：TTGCTGATTCTATTTACAAA(序列号21)

R91：GCAAACTCTATTCTTGGTGC(序列号22)

R92：ACCAGAGTATCATCCATGTC(序列号23)

L93：AATTCGGACACTTTAGGGTT(序列号24)

M4：AGATATTATACCTGGACCCC(序列号25)

＜动物细胞用构建体的构建＞

pcDNA3.1载体骨架和CMV、PmCDA1、Cas9、H1、sgRNA的各序列来自Nishida等2016的论文。各突变通过PCR法导入。EF1、iRFP和mEGFP片段通过人工基因合成制备。通过无缝克隆或连接反应插入或置换片段。

分别用序列号42～44表示制成的载体SY4(H1_sgRNA、CMV_mEGFP)(报告质粒)、载体SY45(CMV_Cas9-PmCDA1、EF1_iRFP)以及载体SY45(CMV_Cas9、EF1_iRFP)的序列。载体SY45(CMV_nCas9(D10A)-PmCDA1、EF1_iRFP)相当于序列号43中将第770～772个碱基置换为gct而得的载体。载体SY45(CMV_nCas9(H840A)-PmCDA1、EF1_iRFP)相当于序列号43中将第3260～3262个碱基置换为gct而得的载体。载体SY45(CMV_dCas9-PmCDA1、EF1_iRFP)相当于序列号43中将第770～772个碱基置换为gct且将第3260～3262个碱基置换为gct而得的载体。另外，载体SY45(CMV_nCas9(D10A)、EF1_iRFP)相当于序列号44中将第3724～3726个碱基置换为gct而得的载体。载体SY45(CMV_nCas9(H840A)、EF1_iRFP)相当于序列号44中将第6214～6216个碱基置换为gct而得的载体。载体SY45(CMV_dCas9、EF1_iRFP)相当于序列号44中将第3724～3726个碱基置换为gct且将第6214～6216个碱基置换为gct而得的载体。

＜细胞的DNA的测序＞

通过FACS分取iRFP阳性细胞，然后提取基因组DNA和导入的质粒DNA后，制备以下的样品，在以下的条件下进行PCR并对目的部位进行扩增。

样品制备：

PCR的条件：在94℃条件下保持2分钟后，将在94℃条件下45秒、55℃条件下45秒、72℃条件下1分钟30秒的循环进行33次循环，最后在72℃条件下保持5分钟。

作为扩增用引物，使用以下的SY157和SY182。扩增产物的大小为1554bp。

SY157：TTCTGCTTGTCGGCCATGAT(序列号47)

SY182：AGGCAAGGCTTGACCGACAATT(序列号48)

切出扩增产物，使用快速基因(Fastgene)纯化后，对各纯化产物和pGEM-teasy载体进行TA克隆，用该载体转化大肠杆菌(JM109)。然后，每个样品采集24个菌落(选择蓝白色)，通过Mini prep(使用快速基因(Fastgene))纯化质粒DNA。

然后，制备以下的测序混合液，外包给金唯智公司(Genewiz)来获得序列信息。

最后，使用Snapgene软件对获得的序列信息进行比对。

实施例1：使用dCas9-CDA和供体DNA、或nCas9-CDA和供体DNA将插入序列插入目标部位

通过质粒载体1525(序列号4的第6036个碱基为g，第6037个碱基为c)或1526(序列号4的第6036个碱基为c，第6037个碱基为a)、1059(序列号5)或1149(相当于将序列号5的序列的第3890个～第3909个碱基序列置换为TCCAATAACGGAATCCAACT(序列号6)而得的载体)对酿酒酵母BY4741株进行双重转化，通过营养缺陷型培养基(SD-Leu-Ura)选择。用S-Leu-Ura 2％棉子糖培养基培养一夜。在S-Leu-Ura 2％棉子糖+0.02％半乳糖培养基中以1/32稀释，在30℃条件下培养一夜。以10倍稀释在SD-Ura-Leu和SD-Ura-Leu+刀豆氨酸板上点样。两天后，对刀豆氨酸耐性菌落进行序列解析。其结果是，确认了突变插入到目标部位(图2)。

实施例2：重组的评价系统的构建

将用SmaI/HpaI处理质粒载体1548(序列号7)而得到的DNA片段转化在BY4741株中，用SD-Ura培养基选择。通过序列解析确认编入Ade1区域。

实施例3：使用重组的评价系统的重组反应的验证实验

将上述任意一个质粒载体转化在验证实验株中，用SD-Leu-Ura培养基选择。用S-Leu-Ura 2％棉子糖培养基培养一夜。将在S-Leu 2％棉子糖+0.02％(或0.2％)半乳糖培养基中以1/32稀释，并在30℃条件下培养一夜的菌株作为5代。为了获得20代，反复进行1/32稀释共4次。以10倍稀释在SD-Leu板上点样，两天后，对菌落数和颜色进行评价。其结果是，Ade1功能恢复，变白的菌落以高频率出现，因此，通过本发明的方法，显示出在目标部位的同源重组的诱导(图4)。

实施例4：本发明的敲入或敲除的验证实验

通过质粒载体1251(序列号8)和2×gRNA载体对酿酒酵母BY4741株进行双重转化，通过营养缺陷型培养基(SD-Leu-Ura)进行选择。用S-Leu-Ura2％棉子糖培养基培养一夜。在S-Leu-Ura 2％棉子糖+0.2％半乳糖培养基中以1/32稀释，在30℃条件下培养一夜。以10倍稀释在SD-Ura-Leu和SD-Ura-Leu(+刀豆氨酸)板中点样，两天后，对刀豆氨酸耐性菌落进行序列解析。其结果是，通过本发明的方法能够高效地实现敲入(图6)。

实施例5：动物细胞中的重组反应的验证实验

使用单链寡DNA(70碱基长度)(表1)作为供体DNA，验证是否在动物细胞(HEK293T细胞)中产生重组反应。将实验的概略图示于图7。作为报告质粒，使用载体SY4(H1_sgRNA、CMV_mEGFP)，作为效应质粒，使用载体SY45(CMV_Cas9-PmCDA1、EF1_iRFP)、载体SY45(CMV_nCas9(D10A)-PmCDA1、EF1_iRFP)、载体SY45(CMV_nCas9(H840A)-PmCDA1、EF1_iRFP)、载体SY45(CMV_dCas9-PmCDA1、EF1_iRFP)、载体SY45(CMV_Cas9、EF1_iRFP)、载体SY45(CMV_nCas9(D10A)、EF1_iRFP)、载体SY45(CMV_nCas9(H840A)、EF1_iRFP)或载体SY45(CMV_dCas9、EF1_iRFP)。当使用Fw2、Fw3作为供体DNA时，在成功地产生同源重组的情况下，在编码EGFP的序列中产生开始密码子，结果确认了EGFP的表达。Fw1是设计成即使产生同源重组在编码EGFP的序列中也不会产生开始密码子的供体DNA，其作为阴性对照使用。Fw3是Fw2的同源臂的1个碱基被置换(c→g)而成的，用于验证即使在同源臂与目标部位的邻接区域并不完全相同的情况下，是否也产生同源重组反应以及是否也能够导入多个不同部位的突变。

将结果示于图8。表明了与使用nCas9的情况相比，在使用nCas9-pmCDA1的情况下，同源重组效率高，表现出与使用Cas9的情况同等以上的同源重组效率。另外，即使在使用dCas9-pmCDA1的情况下，也确认了显著的同源重组。确认了在使用Fw2作为供体DNA的情况和使用Fw3作为供体DNA的情况下，同源重组率存在显著的差异。

实施例6：供体DNA的碱基数以及互补链的种类(正链(Fw)或反链(Rv))对同源重组反应的影响的验证

验证了使用单链寡DNA(50个碱基长度)(表1)作为供体DNA在动物细胞(HEK293T细胞)中是否产生重组反应。将实验的概略图示于图9。作为报告质粒，使用载体SY4(H1_sgRNA、CMV_mEGFP)，作为效应质粒，使用载体SY45(CMV_nCas9(D10A))-PmCDA1、EF1_iRFP)或载体SY45(CMV_nCas9(H840A))-PmCDA1。

将结果示于图10。表明了50个碱基长度的单链寡DNA也能够同源重组，互补链为Fw、Rv中的任意一个都能够同源重组，而且，nCas9采用nCas9(D10A)和nCas9(H840A)中的任意一种形式都能够同源重组。

实施例7：供体DNA的同源臂的验证

使用具有针对不同的同源区域的同源臂的供体DNA(表1)，验证了通过同源区域进行同源重组反应的效率的变化。将实验的概略图示于图11。作为报告质粒，使用载体SY4(H1_sgRNA、CMV_mEGFP)，作为效应质粒，使用载体SY45(CMV_nCas9(D10A))-PmCDA1、EF1_iRFP)或载体SY45(CMV_nCas9(H840A))-PmCDA1。

将结果示于图12。表明了当以同源区域的产生切口的部位至基于PmCDA1的脱氨酶部位为中心时，设计供体DNA使得该区域的3’侧的同源臂比5’侧的同源臂更长，同源重组的效率提高。

实施例8：哺乳动物细胞的DNA中的改变的验证

使用与实施例5中的使用Fw2的实验相同的gRNA和供体DNA，验证DNA中的改变。将结果示于以下表2。验证了与使用Cas9的情况相比，在使用nCas9(D10A)-PmCDA1和nCas9(H840A)-PmCDA1的情况下，显著抑制了作为副产物的插入和/或缺失的产生，即，降低了细胞毒性。需要说明的是，本实施例中使用的DNA的用语包括基因组DNA和质粒DNA两种。

表2

载体	是否SEQ	插入和/或缺失	置换
				nCas9(D10A)	23/24	0/23	1/23
Cas9	22/24	5/22	0/22
				nCas9(D10A)-CDA1	23/24	1/23	0/23
nCas9(H840A)-CDA1	22/24	0/22	3/22

本研究中的置换表示在gRNA目标序列中能观察到的碱基置换。

需要说明的是，并没有确认像认为CDA1发挥作用的碱基置换C→T那样的突变。

如上所述，在使用nCas9-CDA的情况下，同源重组的效率为使用Cas9的情况的同等程度以上，也能够避免使用Cas9的情况下产生的作为副产物的插入和/或缺失、高细胞毒性。因此，使用nCas9-CDA的方法能够比以往的方法更有益和有用。进一步，通过使用nCas9-CDA，与以避免在使用Cas9时产生的上述问题为目的而使用的nCas9相比，更能实现高效率。

本申请以在日本申请的日本特愿2018-059073(申请日：2018年3月26日)为基础，其内容全部包括在本说明书中。

工业实用性

根据本发明，提供使用脱氨酶等核酸碱基转换酶或DNA糖苷酶的新的DNA改变技术，其在不受能够导入的突变的类型、突变部位制约的情况下能够改变基因的方向、组合或者敲入基因片段。本发明的DNA改变技术能够在不切断双链DNA的情况下改变目标部位，因此，能够将伴随断裂的预期以外的改编、毒性抑制得低，而且，与以往方法相比，能够更高效地改变目标部位，因而极其有用。

序列表

<110> 国立大学法人神户大学

<120> 改变细胞具有的双链DNA的目标部位的方法

<130> 092857

<150> JP 2018-059073

<151> 2018-03-26

<160> 48

<170> PatentIn version 3.5

<210> 1

<211> 19

<212> RNA

<213> 新凶手弗朗西丝氏菌(Francisella novicida)

<220>

<221> misc_structure

<222> (1)..(19)

<223> crRNA的直接重复序列(crRNA direct repeat sequence)

<400> 1

aauuucuacu guuguagau 19

<210> 2

<211> 83

<212> DNA

<213> 酿脓链球菌(Streptococcus pyogenes)

<220>

<221> misc_structure

<222> (1)..(83)

<223> tracrRNA

<400> 2

gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60

ggcaccgagt cggtgctttt ttt 83

<210> 3

<211> 83

<212> DNA

<213> 酿脓链球菌(Streptococcus pyogenes)

<220>

<221> misc_structure

<222> (1)..(83)

<223> tracrRNA

<400> 3

gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60

ggcaccgagt cggtggtgct ttt 83

<210> 4

<211> 12344

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> 质粒载体1525(dCas9/nCas9-CDA)(Plasmid Vector 1525(dCas9/nCas9-CDA))

<220>

<221> misc_structure

<222> (70)..(573)

<223> CEN/ARS

<220>

<221> 启动子(promoter)

<222> (610)..(714)

<223> AmpR启动子(AmpR pro)

<220>

<221> rep_origin

<222> (1746)..(2334)

<223> ori

<220>

<221> 启动子(promoter)

<222> (2852)..(3516)

<223> GAL1,10 启动子(GAL1,10 promoter)

<220>

<221> misc_feature

<222> (3068)..(3185)

<223> Gal4 UAS

<220>

<221> 基因(gene)

<222> (3519)..(7655)

<223> dCas9(D10A, H840A)/nCas9(D10A)

<220>

<221> 突变(mutation)

<222> (3546)..(3548)

<223> D10A

<220>

<221> 突变(mutation)

<222> (6036)..(6038)

<223> H840A或野生型(H840A or Wild Type)

<220>

<221> misc_feature

<222> (7635)..(7655)

<223> SV40 NLS

<220>

<221> misc_feature

<222> (7686)..(7856)

<223> 失效SH3(dead SH3)

<220>

<221> misc_feature

<222> (7863)..(7928)

<223> 3xFLAG

<220>

<221> 基因(gene)

<222> (7935)..(8558)

<223> PmCDA1

<220>

<221> 终止子(terminator)

<222> (8589)..(8776)

<223> ADH1终止子(ADH1 terminator)

<220>

<221> misc_feature

<222> (8862)..(9209)

<223> CAN1(突变)片段(CAN1(mut) fragment)

<220>

<221> 突变(mutation)

<222> (8875)..(8875)

<223> 突变1(Mutation 1)

<220>

<221> 突变(mutation)

<222> (8911)..(8911)

<223> 突变2(Mutation 2)

<220>

<221> 启动子(promoter)

<222> (10171)..(10575)

<223> 酿酒酵母LEU2 LEU2启动子(S. cerevisiae LEU2 LEU2 prom)

<220>

<221> 基因(gene)

<222> (10588)..(11682)

<223> 酿酒酵母LEU2(S. cerevisiae LEU2)

<400> 4

gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60

cttaggacgg atcgcttgcc tgtaacttac acgcgcctcg tatcttttaa tgatggaata 120

atttgggaat ttactctgtg tttatttatt tttatgtttt gtatttggat tttagaaagt 180

aaataaagaa ggtagaagag ttacggaatg aagaaaaaaa aataaacaaa ggtttaaaaa 240

atttcaacaa aaagcgtact ttacatatat atttattaga caagaaaagc agattaaata 300

gatatacatt cgattaacga taagtaaaat gtaaaatcac aggattttcg tgtgtggtct 360

tctacacaga caagatgaaa caattcggca ttaatacctg agagcaggaa gagcaagata 420

aaaggtagta tttgttggcg atccccctag agtcttttac atcttcggaa aacaaaaact 480

attttttctt taatttcttt ttttactttc tatttttaat ttatatattt atattaaaaa 540

atttaaatta taattatttt tatagcacgt gatgaaaagg acccaggtgg cacttttcgg 600

ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg 660

ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt 720

attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt 780

gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg 840

ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa 900

cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt 960

gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga cttggttgag 1020

tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga attatgcagt 1080

gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac gatcggagga 1140

ccgaaggagc taaccgcttt ttttcacaac atgggggatc atgtaactcg ccttgatcgt 1200

tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac gatgcctgta 1260

gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct agcttcccgg 1320

caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct gcgctcggcc 1380

cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg gtctcgcggt 1440

atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat ctacacgacg 1500

ggcagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg 1560

attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat tgatttaaaa 1620

cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa 1680

atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga 1740

tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg 1800

ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact 1860

ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac 1920

cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg 1980

gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg 2040

gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga 2100

acgacctaca ccgaactgag atacctacag cgtgagcatt gagaaagcgc cacgcttccc 2160

gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg 2220

agggagcttc caggggggaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc 2280

tgacttgagc gtcgattttt gtgatgctcg tcaggggggc cgagcctatg gaaaaacgcc 2340

agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca catgttcttt 2400

cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc 2460

gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc 2520

ccaatacgca aaccgcctct ccccgcgcgt tggccgattc attaatgcag ctggcacgac 2580

aggtttcccg actggaaagc gggcagtgag cgcaacgcaa ttaatgtgag ttagctcact 2640

cattaggcac cccaggcttt acactttatg cttccggctc gtatgttgtg tggaattgtg 2700

agcggataac aatttcacac aggaaacagc tatgaccatg attacgccaa gctcgaaatt 2760

aaccctcact aaagggaaca aaagctggta ccgggcccga attctctcct tctcttaggt 2820

ggcagagcag gtggagggtc gaccatacta gtttcaaaaa ttcttacttt ttttttggat 2880

ggacgcaaag aagtttaata atcatattac atggcattac caccatatac atatccatat 2940

acatatccat atctaatctt acttatatgt tgtggaaatg taaagagccc cattatctta 3000

gcctaaaaaa accttctctt tggaactttc agtaatacgc ttaactgctc attgctatat 3060

tgaagtacgg attagaagcc gccgagcggg tgacagccct ccgaaggaag actctcctcc 3120

gtgcgtcctc gtcttcaccg gtcgcgttcc tgaaacgcag atgtgcctcg cgccgcactg 3180

ctccgaacaa taaagattct acaatactag cttttatggt tatgaagagg aaaaattggc 3240

agtaacctgg ccccacaaac cttcaaatga acgaatcaaa ttaacaacca taggatgata 3300

atgcgattag ttttttagcc ttatttctgg ggtaattaat cagcgaagcg atgatttttg 3360

atctattaac agatatataa atgcaaaaac tgcataacca ctttaactaa tactttcaac 3420

attttcggtt tgtattactt cttattcaaa tgtaataaaa gtatcaacaa aaaattgtta 3480

atatacctct atactttaac gtcaaggaga aaaaacccat ggacaagaag tactccattg 3540

ggctcgctat cggcacaaac agcgtcggtt gggccgtcat tacggacgag tacaaggtgc 3600

cgagcaaaaa attcaaagtt ctgggcaata ccgatcgcca cagcataaag aagaacctca 3660

ttggcgccct cctgttcgac tccggggaga cggccgaagc cacgcggctc aaaagaacag 3720

cacggcgcag atatacccgc agaaagaatc ggatctgcta cctgcaggag atctttagta 3780

atgagatggc taaggtggat gactctttct tccataggct ggaggagtcc tttttggtgg 3840

aggaggataa aaagcacgag cgccacccaa tctttggcaa tatcgtggac gaggtggcgt 3900

accatgaaaa gtacccaacc atatatcatc tgaggaagaa gcttgtagac agtactgata 3960

aggctgactt gcggttgatc tatctcgcgc tggcgcatat gatcaaattt cggggacact 4020

tcctcatcga gggggacctg aacccagaca acagcgatgt cgacaaactc tttatccaac 4080

tggttcagac ttacaatcag cttttcgaag agaacccgat caacgcatcc ggagttgacg 4140

ccaaagcaat cctgagcgct aggctgtcca aatcccggcg gctcgaaaac ctcatcgcac 4200

agctccctgg ggagaagaag aacggcctgt ttggtaatct tatcgccctg tcactcgggc 4260

tgacccccaa ctttaaatct aacttcgacc tggccgaaga tgccaagctt caactgagca 4320

aagacaccta cgatgatgat ctcgacaatc tgctggccca gatcggcgac cagtacgcag 4380

accttttttt ggcggcaaag aacctgtcag acgccattct gctgagtgat attctgcgag 4440

tgaacacgga gatcaccaaa gctccgctga gcgctagtat gatcaagcgc tatgatgagc 4500

accaccaaga cttgactttg ctgaaggccc ttgtcagaca gcaactgcct gagaagtaca 4560

aggaaatttt cttcgatcag tctaaaaatg gctacgccgg atacattgac ggcggagcaa 4620

gccaggagga attttacaaa tttattaagc ccatcttgga aaaaatggac ggcaccgagg 4680

agctgctggt aaagcttaac agagaagatc tgttgcgcaa acagcgcact ttcgacaatg 4740

gaagcatccc ccaccagatt cacctgggcg aactgcacgc tatcctcagg cggcaagagg 4800

atttctaccc ctttttgaaa gataacaggg aaaagattga gaaaatcctc acatttcgga 4860

taccctacta tgtaggcccc ctcgcccggg gaaattccag attcgcgtgg atgactcgca 4920

aatcagaaga gaccatcact ccctggaact tcgaggaagt cgtggataag ggggcctctg 4980

cccagtcctt catcgaaagg atgactaact ttgataaaaa tctgcctaac gaaaaggtgc 5040

ttcctaaaca ctctctgctg tacgagtact tcacagttta taacgagctc accaaggtca 5100

aatacgtcac agaagggatg agaaagccag cattcctgtc tggagagcag aagaaagcta 5160

tcgtggacct cctcttcaag acgaaccgga aagttaccgt gaaacagctc aaagaagact 5220

atttcaaaaa gattgaatgt ttcgactctg ttgaaatcag cggagtggag gatcgcttca 5280

acgcatccct gggaacgtat cacgatctcc tgaaaatcat taaagacaag gacttcctgg 5340

acaatgagga gaacgaggac attcttgagg acattgtcct cacccttacg ttgtttgaag 5400

atagggagat gattgaagaa cgcttgaaaa cttacgctca tctcttcgac gacaaagtca 5460

tgaaacagct caagaggcgc cgatatacag gatgggggcg gctgtcaaga aaactgatca 5520

atgggatccg agacaagcag agtggaaaga caatcctgga ttttcttaag tccgatggat 5580

ttgccaaccg gaacttcatg cagttgatcc atgatgactc tctcaccttt aaggaggaca 5640

tccagaaagc acaagtttct ggccaggggg acagtcttca cgagcacatc gctaatcttg 5700

caggtagccc agctatcaaa aagggaatac tgcagaccgt taaggtcgtg gatgaactcg 5760

tcaaagtaat gggaaggcat aagcccgaga atatcgttat cgagatggcc cgagagaacc 5820

aaactaccca gaagggacag aagaacagta gggaaaggat gaagaggatt gaagagggta 5880

taaaagaact ggggtcccaa atccttaagg aacacccagt tgaaaacacc cagcttcaga 5940

atgagaagct ctacctgtac tacctgcaga acggcaggga catgtacgtg gatcaggaac 6000

tggacatcaa tcggctctcc gactacgacg tggatsmtat cgtgccccag tcttttctca 6060

aagatgattc tattgataat aaagtgttga caagatccga taaaaataga gggaagagtg 6120

ataacgtccc ctcagaagaa gttgtcaaga aaatgaaaaa ttattggcgg cagctgctga 6180

acgccaaact gatcacacaa cggaagttcg ataatctgac taaggctgaa cgaggtggcc 6240

tgtctgagtt ggataaagcc ggcttcatca aaaggcagct tgttgagaca cgccagatca 6300

ccaagcacgt ggcccaaatt ctcgattcac gcatgaacac caagtacgat gaaaatgaca 6360

aactgattcg agaggtgaaa gttattactc tgaagtctaa gctggtctca gatttcagaa 6420

aggactttca gttttataag gtgagagaga tcaacaatta ccaccatgcg catgatgcct 6480

acctgaatgc agtggtaggc actgcactta tcaaaaaata tcccaagctt gaatctgaat 6540

ttgtttacgg agactataaa gtgtacgatg ttaggaaaat gatcgcaaag tctgagcagg 6600

aaataggcaa ggccaccgct aagtacttct tttacagcaa tattatgaat tttttcaaga 6660

ccgagattac actggccaat ggagagattc ggaagcgacc acttatcgaa acaaacggag 6720

aaacaggaga aatcgtgtgg gacaagggta gggatttcgc gacagtccgg aaggtcctgt 6780

ccatgccgca ggtgaacatc gttaaaaaga ccgaagtaca gaccggaggc ttctccaagg 6840

aaagtatcct cccgaaaagg aacagcgaca agctgatcgc acgcaaaaaa gattgggacc 6900

ccaagaaata cggcggattc gattctccta cagtcgctta cagtgtactg gttgtggcca 6960

aagtggagaa agggaagtct aaaaaactca aaagcgtcaa ggaactgctg ggcatcacaa 7020

tcatggagcg atcaagcttc gaaaaaaacc ccatcgactt tctcgaggcg aaaggatata 7080

aagaggtcaa aaaagacctc atcattaagc ttcccaagta ctctctcttt gagcttgaaa 7140

acggccggaa acgaatgctc gctagtgcgg gcgagctgca gaaaggtaac gagctggcac 7200

tgccctctaa atacgttaat ttcttgtatc tggccagcca ctatgaaaag ctcaaagggt 7260

ctcccgaaga taatgagcag aagcagctgt tcgtggaaca acacaaacac taccttgatg 7320

agatcatcga gcaaataagc gaattctcca aaagagtgat cctcgccgac gctaacctcg 7380

ataaggtgct ttctgcttac aataagcaca gggataagcc catcagggag caggcagaaa 7440

acattatcca cttgtttact ctgaccaact tgggcgcgcc tgcagccttc aagtacttcg 7500

acaccaccat agacagaaag cggtacacct ctacaaagga ggtcctggac gccacactga 7560

ttcatcagtc aattacgggg ctctatgaaa caagaatcga cctctctcag ctcggtggag 7620

acagcagggc tgaccccaag aagaagagga aggtgggtgg aggaggttct ggaggtggag 7680

gttctgcaga gtatgtgcgg gccctctttg actttaatgg gaatgatgaa gaagatcttc 7740

cctttaagaa aggagacatc ctgagaatcc gggataagcc tgaagagcag tggtggaatg 7800

cagaggacag cgaaggaaag agggggatga ttcttgtccc ttacgtggag aagtattccg 7860

gagactataa ggaccacgac ggagactaca aggatcatga tattgattac aaagacgatg 7920

acgataagtc taggatgacc gacgctgagt acgtgagaat ccatgagaag ttggacatct 7980

acacgtttaa gaaacagttt ttcaacaaca aaaaatccgt gtcgcataga tgctacgttc 8040

tctttgaatt aaaacgacgg ggtgaacgta gagcgtgttt ttggggctat gctgtgaata 8100

aaccacagag cgggacagaa cgtggcattc acgccgaaat ctttagcatt agaaaagtcg 8160

aagaatacct gcgcgacaac cccggacaat tcacgataaa ttggtactca tcctggagtc 8220

cttgtgcaga ttgcgctgaa aagatcttag aatggtataa ccaggagctg cgggggaacg 8280

gccacacttt gaaaatctgg gcttgcaaac tctattacga gaaaaatgcg aggaatcaaa 8340

ttgggctgtg gaacctcaga gataacgggg ttgggttgaa tgtaatggta agtgaacact 8400

accaatgttg caggaaaata ttcatccaat cgtcgcacaa tcaattgaat gagaatagat 8460

ggcttgagaa gactttgaag cgagctgaaa aacgacggag cgagttgtcc attatgattc 8520

aggtaaaaat actccacacc actaagagtc ctgctgtttc tagaggctcc ggataaggat 8580

cctaataagc gaatttctta tgatttatga tttttattat taaataagtt ataaaaaaaa 8640

taagtgtata caaattttaa agtgactctt aggttttaaa acgaaaattc ttattcttga 8700

gtaactcttt cctgtaggtc aggttgcttt ctcaggtata gcatgaggtc gctcttattg 8760

accacacctc taccggcatg ccgagcaaat gcctgcaaat cgctcccggg caaaaaaccc 8820

cctcaagacc cgtttagagg ccccaagggg ttatgctatg cattccgtta ttggtgaaac 8880

ccaggtgcct ggggtccagg tataatatct taggataaaa acgaagggag gttcttaggt 8940

tgggtttcct ctttgattaa cgctgccttc acatttcaag gtactgaact agttggtatc 9000

actgctggtg aagctgcaaa ccccagaaaa tccgttccaa gagccatcaa aaaagttgtt 9060

ttccgtatct taaccttcta cattggctct ctattattca ttggactttt agttccatac 9120

aatgacccta aactaacaca atctacttcc tacgtttcta cttctccctt tattattgct 9180

attgagaact ctggtacaaa ggttttgccg cggtggagct ccaattcgcc ctatagtgag 9240

tcgtattaca attcactggc cgtcgtttta caacgtcgtg actgggaaaa ccctggcgtt 9300

acccaactta atcgccttgc agcacatccc cccttcgcca gctggcgtaa tagcgaagag 9360

gcccgcaccg atcgcccttc ccaacagttg cgcagcctga atggcgaatg gcgcgacgcg 9420

ccctgtagcg gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca 9480

cttgccagcg ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc 9540

gccggctttc cccgtcaagc tctaaatcgg gggctccctt tagggttccg atttagtgct 9600

ttacggcacc tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg 9660

ccctgataga cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc 9720

ttgttccaaa ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg 9780

attttgccga tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg 9840

aattttaaca aaatattaac gtttacaatt tcctgatgcg gtattttctc cttacgcatc 9900

tgtgcggtat ttcacaccgc atatcgaccc tcgaggagaa cttctagtat atccacatac 9960

ctaatattat tgccttatta aaaatggaat cggaacaatt acatcaaaat ccacattctc 10020

ttcaaaatca attgtcctgt acttccttgt tcatgtgtgt tcaaaaacgt tatatttata 10080

ggataattat actctatttc tcaacaagta attggttgtt tggccgagcg gtctaaggcg 10140

cctgattcaa gaaatatctt gaccgcagtt aactgtggga atactcaggt atcgtaagat 10200

gcaagagttc gaatctctta gcaaccatta tttttttcct caacataacg agaacacaca 10260

ggggcgctat cgcacagaat caaattcgat gactggaaat tttttgttaa tttcagaggt 10320

cgcctgacgc atataccttt ttcaactgaa aaattgggag aaaaaggaaa ggtgagaggc 10380

cggaaccggc ttttcatata gaatagagaa gcgttcatga ctaaatgctt gcatcacaat 10440

acttgaagtt gacaatatta tttaaggacc tattgttttt tccaataggt ggttagcaat 10500

cgtcttactt tctaactttt cttacctttt acatttcagc aatatatata tatatttcaa 10560

ggatatacca ttctaatgtc tgcccctatg tctgccccta agaagatcgt cgttttgcca 10620

ggtgaccacg ttggtcaaga aatcacagcc gaagccatta aggttcttaa agctatttct 10680

gatgttcgtt ccaatgtcaa gttcgatttc gaaaatcatt taattggtgg tgctgctatc 10740

gatgctacag gtgtcccact tccagatgag gcgctggaag cctccaagaa ggttgatgcc 10800

gttttgttag gtgctgtggg tggtcctaaa tggggtaccg gtagtgttag acctgaacaa 10860

ggtttactaa aaatccgtaa agaacttcaa ttgtacgcca acttaagacc atgtaacttt 10920

gcatccgact ctcttttaga cttatctcca atcaagccac aatttgctaa aggtactgac 10980

ttcgttgttg tcagagaatt agtgggaggt atttactttg gtaagagaaa ggaagacgat 11040

ggtgatggtg tcgcttggga tagtgaacaa tacaccgttc cagaagtgca aagaatcaca 11100

agaatggccg ctttcatggc cctacaacat gagccaccat tgcctatttg gtccttggat 11160

aaagctaatg ttttggcctc ttcaagatta tggagaaaaa ctgtggagga aaccatcaag 11220

aacgaattcc ctacattgaa ggttcaacat caattgattg attctgccgc catgatccta 11280

gttaagaacc caacccacct aaatggtatt ataatcacca gcaacatgtt tggtgatatc 11340

atctccgatg aagcctccgt tatcccaggt tccttgggtt tgttgccatc tgcgtccttg 11400

gcctctttgc cagacaagaa caccgcattt ggtttgtacg aaccatgcca cggttctgct 11460

ccagatttgc caaagaataa ggttgaccct atcgccacta tcttgtctgc tgcaatgatg 11520

ttgaaattgt cattgaactt gcctgaagaa ggtaaggcca ttgaagatgc agttaaaaag 11580

gttttggatg caggtatcag aactggtgat ttaggtggtt ccaacagtac caccgaagtc 11640

ggtgatgctg tcgccgaaga agttaagaaa atccttgctt aaaaagattc tcttttttta 11700

tgatatttgt acataaactt tataaatgaa attcataata gaaacgacac gaaattacaa 11760

aatggaatat gttcataggg tagacgaaac tatatacgca atctacatac atttatcaag 11820

aaggagaaaa aggaggatag taaaggaata caggtaagca aattgatact aatggctcaa 11880

cgtgataagg aaaaagaatt gcactttaac attaatattg acaaggagga gggcaccaca 11940

caaaaagtta ggtgtaacag aaaatcatga aactacgatt cctaatttga tattggagga 12000

ttttctctaa aaaaaaaaaa atacaacaaa taaaaaacac tcaatgacct gaccatttga 12060

tggagtttaa gtcaatacct tcttgaacca tttcccataa tggtgaaagt tccctcaaga 12120

attttactct gtcagaaacg gccttacgac gtagtcgata tggtgcactc tcagtacaat 12180

ctgctctgat gccgcatagt taagccagcc ccgacacccg ccaacacccg ctgacgcgcc 12240

ctgacgggct tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg tctccgggag 12300

ctgcatgtgt cagaggtttt caccgtcatc accgaaacgc gcga 12344

<210> 5

<211> 6274

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> 质粒载体1059(Can1-7R)(Plasmid Vector 1059(Can1-7R))

<220>

<221> rep_origin

<222> (69)..(1411)

<223> 2个微小ori(2 micro ori)

<220>

<221> 启动子(promoter)

<222> (1438)..(1542)

<223> AmpR启动子(AmpR promoter)

<220>

<221> 基因(gene)

<222> (1543)..(2403)

<223>

<220>

<221> rep_origin

<222> (2574)..(3162)

<223> ori

<220>

<221> 启动子(promoter)

<222> (3621)..(3889)

<223> SNR52启动子(SNR52 promoter)

<220>

<221> misc_feature

<222> (3890)..(3909)

<223> Can1-7R

<220>

<221> misc_structure

<222> (3910)..(3992)

<223> tracrRNA

<220>

<221> 终止子(terminator)

<222> (3995)..(4008)

<223> Sup4终止子(Sup4 term)

<220>

<221> 终止子(terminator)

<222> (4014)..(4261)

<223> CYC1终止子(CYC1 terminator)

<220>

<221> 启动子(promoter)

<222> (4280)..(4298)

<223> T7启动子(T7 promoter)

<220>

<221> rep_origin

<222> (4469)..(4924)

<223> f1 ori

<220>

<221> 基因(gene)

<222> (5055)..(5858)

<223> URA3

<220>

<221> 启动子(promoter)

<222> (5859)..(6074)

<223> URA3启动子(URA3 promoter)

<400> 5

gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60

cttagtatga tccaatatca aaggaaatga tagcattgaa ggatgagact aatccaattg 120

aggagtggca gcatatagaa cagctaaagg gtagtgctga aggaagcata cgataccccg 180

catggaatgg gataatatca caggaggtac tagactacct ttcatcctac ataaatagac 240

gcatataagt acgcatttaa gcataaacac gcactatgcc gttcttctca tgtatatata 300

tatacaggca acacgcagat ataggtgcga cgtgaacagt gagctgtatg tgcgcagctc 360

gcgttgcatt ttcggaagcg ctcgttttcg gaaacgcttt gaagttccta ttccgaagtt 420

cctattctct agaaagtata ggaacttcag agcgcttttg aaaaccaaaa gcgctctgaa 480

gacgcacttt caaaaaacca aaaacgcacc ggactgtaac gagctactaa aatattgcga 540

ataccgcttc cacaaacatt gctcaaaagt atctctttgc tatatatctc tgtgctatat 600

ccctatataa cctacccatc cacctttcgc tccttgaact tgcatctaaa ctcgacctct 660

acatttttta tgtttatctc tagtattact ctttagacaa aaaaattgta gtaagaacta 720

ttcatagagt gaatcgaaaa caatacgaaa atgtaaacat ttcctatacg tagtatatag 780

agacaaaata gaagaaaccg ttcataattt tctgaccaat gaagaatcat caacgctatc 840

actttctgtt cacaaagtat gcgcaatcca catcggtata gaatataatc ggggatgcct 900

ttatcttgaa aaaatgcacc cgcagcttcg ctagtaatca gtaaacgcgg gaagtggagt 960

caggcttttt ttatggaaga gaaaatagac accaaagtag ccttcttcta accttaacgg 1020

acctacagtg caaaaagtta tcaagagact gcattataga gcgcacaaag gagaaaaaaa 1080

gtaatctaag atgctttgtt agaaaaatag cgctctcggg atgcattttt gtagaacaaa 1140

aaagaagtat agattctttg ttggtaaaat agcgctctcg cgttgcattt ctgttctgta 1200

aaaatgcagc tcagattctt tgtttgaaaa attagcgctc tcgcgttgca tttttgtttt 1260

acaaaaatga agcacagatt cttcgttggt aaaatagcgc tttcgcgttg catttctgtt 1320

ctgtaaaaat gcagctcaga ttctttgttt gaaaaattag cgctctcgcg ttgcattttt 1380

gttctacaaa atgaagcaca gatgcttcgt tcaggtggca cttttcgggg aaatgtgcgc 1440

ggaaccccta tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa 1500

taaccctgat aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc 1560

cgtgtcgccc ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa 1620

acgctggtga aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa 1680

ctggatctca acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg 1740

atgagcactt ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa 1800

gagcaactcg gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc 1860

acagaaaagc atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc 1920

atgagtgata acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta 1980

accgcttttt tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag 2040

ctgaatgaag ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca 2100

acgttgcgca aactattaac tggcgaacta cttactctag cttcccggca acaattaata 2160

gactggatgg aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc 2220

tggtttattg ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca 2280

ctggggccag atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca 2340

actatggatg aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg 2400

taactgtcag accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa 2460

tttaaaagga tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt 2520

gagttttcgt tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat 2580

cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg 2640

gtttgtttgc cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga 2700

gcgcagatac caaatactgt ccttctagtg tagccgtagt taggccacca cttcaagaac 2760

tctgtagcac cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt 2820

ggcgataagt cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag 2880

cggtcgggct gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc 2940

gaactgagat acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag 3000

gcggacaggt atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca 3060

gggggaaacg cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt 3120

cgatttttgt gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc 3180

tttttacggt tcctggcctt ttgctggcct tttgctcaca tgttctttcc tgcgttatcc 3240

cctgattctg tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc 3300

cgaacgaccg agcgcagcga gtcagtgagc gaggaagcgg aagagcgccc aatacgcaaa 3360

ccgcctctcc ccgcgcgttg gccgattcat taatgcagct ggcacgacag gtttcccgac 3420

tggaaagcgg gcagtgagcg caacgcaatt aatgtgagtt acctcactca ttaggcaccc 3480

caggctttac actttatgct tccggctcct atgttgtgtg gaattgtgag cggataacaa 3540

tttcacacag gaaacagcta tgaccatgat tacgccaagc gcgcaattaa ccctcactaa 3600

agggaacaaa agctggagct tctttgaaaa gataatgtat gattatgctt tcactcatat 3660

ttatacagaa acttgatgtt ttctttcgag tatatacaag gtgattacat gtacgtttga 3720

agtacaactc tagattttgt agtgccctct tgggctagcg gtaaaggtgc gcattttttc 3780

acaccctaca atgttctgtt caaaagattt tggtcaaacg ctgtagaagt gaaagttggt 3840

gcgcatgttt cggcgttcga aacttctccg cagtgaaaga taaatgatct tatccttaga 3900

tattataccg ttttagagct agaaatagca agttaaaata aggctagtcc gttatcaact 3960

tgaaaaagtg gcaccgagtc ggtggtgctt tttttgtttt ttatgtcttc gagtcatgta 4020

attagttatg tcacgcttac gttcacgccc tccccccaca tccgctctaa ccgaaaagga 4080

aggagttaga caacctgaag tctaggtccc tatttatttt tttatagtta tgttagtatt 4140

aagaacgtta tttatatttc aaatttttct tttttttctg tacagacgcg tgtacgcatg 4200

taacattata ctgaaaacct tgcttgagaa ggttttggga cgctcgaagg ctttaatttg 4260

cggccggtac ccaattcgcc ctatagtgag tcgtattacg cgcgctcact ggccgtcgtt 4320

ttacaacgtc gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat 4380

ccccctttcg ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag 4440

ttgcgcagcc tgaatggcga atggcgcgac gcgccctgta gcggcgcatt aagcgcggcg 4500

ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct 4560

ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat 4620

cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt 4680

gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg 4740

acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac 4800

cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta 4860

aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgtttaca 4920

atttcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatagggt 4980

aataactgat ataattaaat tgaagctcta atttgtgagt ttagtataca tgcatttact 5040

tataatacag ttttttagtt ttgctggccg catcttctca aatatgcttc ccagcctgct 5100

tttctgtaac gttcaccctc taccttagca tcccttccct ttgcaaatag tcctcttcca 5160

acaataataa tgtcagatcc tgtagagacc acatcatcca cggttctata ctgttgaccc 5220

aatgcgtctc ccttgtcatc taaacccaca ccgggtgtca taatcaacca atcgtaacct 5280

tcatctcttc cacccatgtc tctttgagca ataaagccga taacaaaatc tttgtcgctc 5340

ttcgcaatgt caacagtacc cttagtatat tctccagtag atagggagcc cttgcatgac 5400

aattctgcta acatcaaaag gcctctaggt tcctttgtta cttcttctgc cgcctgcttc 5460

aaaccgctaa caatacctgg gcccaccaca ccgtgtgcat tcgtaatgtc tgcccattct 5520

gctattctgt atacacccgc agagtactgc aatttgactg tattaccaat gtcagcaaat 5580

tttctgtctt cgaagagtaa aaaattgtac ttggcggata atgcctttag cggcttaact 5640

gtgccctcca tggaaaaatc agtcaagata tccacatgtg tttttagtaa acaaattttg 5700

ggacctaatg cttcaactaa ctccagtaat tccttggtgg tacgaacatc caatgaagca 5760

cacaagtttg tttgcttttc gtgcatgata ttaaatagct tggcagcaac aggactagga 5820

tgagtagcag cacgttcctt atatgtagct ttcgacatga tttatcttcg tttcctgcag 5880

gtttttgttc tgtgcagttg ggttaagaat actgggcaat ttcatgtttc ttcaacacta 5940

catatgcgta tatataccaa tctaagtctg tgctccttcc ttcgttcttc cttctgttcg 6000

gagattaccg aatcaaaaaa atttcaagga aaccgaaatc aaaaaaaaga ataaaaaaaa 6060

aatgatgaat tgaattgaaa agctgtggta tggtgcactc tcagtacaat ctgctctgat 6120

gccgcatagt taagccagcc ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct 6180

tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt 6240

cagaggtttt caccgtcatc accgaaacgc gcga 6274

<210> 6

<211> 20

<212> DNA

<213> 酿酒酵母(Saccharomyces cerevisiae)

<400> 6

tccaataacg gaatccaact 20

<210> 7

<211> 3648

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> 质粒载体1548(Plasmid Vector 1548)

<220>

<221> 启动子(promoter)

<222> (1)..(8)

<223> AmpR启动子(AmpR promoter)

<220>

<221> misc_feature

<222> (97)..(182)

<223> ade1 pro 同源(ade1 pro homology)

<220>

<221> 基因(gene)

<222> (288)..(1091)

<223> URA3

<220>

<221> 启动子(promoter)

<222> (1092)..(1307)

<223> URA3启动子(URA3 promoter)

<220>

<221> misc_feature

<222> (1359)..(1538)

<223> URA3开关同源(URA3 switch homology)

<220>

<221> misc_feature

<222> (1544)..(1633)

<223> Ade ORF起始同源(Ade ORF start homology)

<220>

<221> rep_origin

<222> (1932)..(2520)

<223> ori

<220>

<221> 基因(gene)

<222> (2691)..(3551)

<223> AmpR

<220>

<221> 启动子(promoter)

<222> (3552)..(3648)

<223> AmpR启动子(AmpR promoter)

<400> 7

gttccgcgca catttccccg aaaagtgcca cctgacgtct aagaaaccat tattatcatg 60

acattaacct ataaaaatag gcgtatcacg aggcccgggt tttatctttt gcagttggta 120

ctattaagaa caatcgaatc ataagcattg cttacaaaga atacacatac gaaatattaa 180

cgcatctgtg cggtatttca caccgcatag ggtaataact gatataatta aattgaagct 240

ctaatttgtg agtttagtat acatgcattt acttataata cagtttttta gttttgctgg 300

ccgcatcttc tcaaatatgc ttcccagcct gcttttctgt aacgttcacc ctctacctta 360

gcatcccttc cctttgcaaa tagtcctctt ccaacaataa taatgtcaga tcctgtagag 420

accacatcat ccacggttct atactgttga cccaatgcgt ctcccttgtc atctaaaccc 480

acaccgggtg tcataatcaa ccaatcgtaa ccttcatctc ttccacccat gtctctttga 540

gcaataaagc cgataacaaa atctttgtcg ctcttcgcaa tgtcaacagt acccttagta 600

tattctccag tagataggga gcccttgcat gacaattctg ctaacatcaa aaggcctcta 660

ggttcctttg ttacttcttc tgccgcctgc ttcaaaccgc taacaatacc tgggcccacc 720

acaccgtgtg cattcgtaat gtctgcccat tctgctattc tgtatacacc cgcagagtac 780

tgcaatttga ctgtattacc aatgtcagca aattttctgt cttcgaagag taaaaaattg 840

tacttggcgg ataatgcctt tagcggctta actgtgccct ccatggaaaa atcagtcaag 900

atatccacat gtgtttttag taaacaaatt ttgggaccta atgcttcaac taactccagt 960

aattccttgg tggtacgaac atccaatgaa gcacacaagt ttgtttgctt ttcgtgcatg 1020

atattaaata gcttggcagc aacaggacta ggatgagtag cagcacgttc cttatatgta 1080

gctttcgaca tgatttatct tcgtttcctg caggtttttg ttctgtgcag ttgggttaag 1140

aatactgggc aatttcatgt ttcttcaaca ctacatatgc gtatatatac caatctaagt 1200

ctgtgctcct tccttcgttc ttccttctgt tcggagatta ccgaatcaaa aaaatttcaa 1260

agaaaccgaa atcaaaaaaa agaataaaaa aaaaatgatg aattgaattg aaaagctgtg 1320

gtatggtgca ctctcagtac aatctgctct gatgccgcac agttaagccg ctaaaggcat 1380

tatccgccaa gtacaatttt ttactcttcg aagacagaaa atttgctgac attggtaata 1440

cagtcaaatt gcagtactct gcgggtgtat acagaatagc agaatgggca gacattacga 1500

atgcacacgg tgtggtgggc ccaggtattg ttagcggtgg agggtcaatt acgaagactg 1560

aactggacgg tatattgcca ttggtggcca gaggtaaagt tagagacata tatgaggtag 1620

acgctggtac gttaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga 1680

aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt 1740

attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg 1800

cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac 1860

gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg 1920

ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 1980

agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 2040

tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 2100

ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag 2160

gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 2220

ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca 2280

gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg 2340

aagtggtggc ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg 2400

aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct 2460

ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa 2520

gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa 2580

gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa 2640

tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc 2700

ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga 2760

ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca 2820

atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc 2880

ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat 2940

tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc 3000

attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt 3060

tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc 3120

ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg 3180

gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt 3240

gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg 3300

gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga 3360

aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg 3420

taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg 3480

tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt 3540

tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg ttattgtctc 3600

atgagcggat acatatttga atgtatttag aaaaataaac aaataggg 3648

<210> 8

<211> 12060

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> 质粒载体1251(Plasmid Vector 1251)

<220>

<221> misc_feature

<222> (70)..(573)

<223> CEN/ARS

<220>

<221> rep_origin

<222> (1746)..(2334)

<223> ori

<220>

<221> 启动子(promoter)

<222> (2852)..(3516)

<223> 酿酒酵母启动子的GAL1与GAL10基因(GAL1 and GAL10 genes of S.cerevisiae promoter)

<220>

<221> 基因(gene)

<222> (3519)..(7655)

<223> Cas9

<220>

<221> misc_feature

<222> (7635)..(7655)

<223> SV40的NLS(NLS of SV40)

<220>

<221> misc_feature

<222> (7686)..(7856)

<223> 失效SH3(dead SH3)

<220>

<221> misc_feature

<222> (7863)..(7928)

<223> 3串联FLAG(three tandem FLAG)

<220>

<221> 基因(gene)

<222> (7935)..(8558)

<223> PmCDA1

<220>

<221> 终止子(terminator)

<222> (8589)..(8776)

<223> 酿酒酵母ADH1终止子(S. cerevisiae ADH1 terminator)

<220>

<221> rep_origin

<222> (9132)..(9587)

<223> f1 ori

<220>

<221> 启动子(promoter)

<222> (9887)..(10291)

<223> 酿酒酵母LEU2启动子(S. cerevisiae LEU2 prom)

<220>

<221> 基因(gene)

<222> (10304)..(11398)

<223> 酿酒酵母LEU2(S. cerevisiae LEU2)

<400> 8

gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60

cttaggacgg atcgcttgcc tgtaacttac acgcgcctcg tatcttttaa tgatggaata 120

atttgggaat ttactctgtg tttatttatt tttatgtttt gtatttggat tttagaaagt 180

aaataaagaa ggtagaagag ttacggaatg aagaaaaaaa aataaacaaa ggtttaaaaa 240

atttcaacaa aaagcgtact ttacatatat atttattaga caagaaaagc agattaaata 300

gatatacatt cgattaacga taagtaaaat gtaaaatcac aggattttcg tgtgtggtct 360

tctacacaga caagatgaaa caattcggca ttaatacctg agagcaggaa gagcaagata 420

aaaggtagta tttgttggcg atccccctag agtcttttac atcttcggaa aacaaaaact 480

attttttctt taatttcttt ttttactttc tatttttaat ttatatattt atattaaaaa 540

atttaaatta taattatttt tatagcacgt gatgaaaagg acccaggtgg cacttttcgg 600

ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg 660

ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt 720

attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt 780

gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg 840

ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa 900

cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt 960

gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga cttggttgag 1020

tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga attatgcagt 1080

gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac gatcggagga 1140

ccgaaggagc taaccgcttt ttttcacaac atgggggatc atgtaactcg ccttgatcgt 1200

tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac gatgcctgta 1260

gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct agcttcccgg 1320

caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct gcgctcggcc 1380

cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg gtctcgcggt 1440

atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat ctacacgacg 1500

ggcagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg 1560

attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat tgatttaaaa 1620

cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa 1680

atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga 1740

tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg 1800

ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact 1860

ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac 1920

cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg 1980

gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg 2040

gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga 2100

acgacctaca ccgaactgag atacctacag cgtgagcatt gagaaagcgc cacgcttccc 2160

gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg 2220

agggagcttc caggggggaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc 2280

tgacttgagc gtcgattttt gtgatgctcg tcaggggggc cgagcctatg gaaaaacgcc 2340

agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca catgttcttt 2400

cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc 2460

gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc 2520

ccaatacgca aaccgcctct ccccgcgcgt tggccgattc attaatgcag ctggcacgac 2580

aggtttcccg actggaaagc gggcagtgag cgcaacgcaa ttaatgtgag ttagctcact 2640

cattaggcac cccaggcttt acactttatg cttccggctc gtatgttgtg tggaattgtg 2700

agcggataac aatttcacac aggaaacagc tatgaccatg attacgccaa gctcgaaatt 2760

aaccctcact aaagggaaca aaagctggta ccgggcccga attctctcct tctcttaggt 2820

ggcagagcag gtggagggtc gaccatacta gtttcaaaaa ttcttacttt ttttttggat 2880

ggacgcaaag aagtttaata atcatattac atggcattac caccatatac atatccatat 2940

acatatccat atctaatctt acttatatgt tgtggaaatg taaagagccc cattatctta 3000

gcctaaaaaa accttctctt tggaactttc agtaatacgc ttaactgctc attgctatat 3060

tgaagtacgg attagaagcc gccgagcggg tgacagccct ccgaaggaag actctcctcc 3120

gtgcgtcctc gtcttcaccg gtcgcgttcc tgaaacgcag atgtgcctcg cgccgcactg 3180

ctccgaacaa taaagattct acaatactag cttttatggt tatgaagagg aaaaattggc 3240

agtaacctgg ccccacaaac cttcaaatga acgaatcaaa ttaacaacca taggatgata 3300

atgcgattag ttttttagcc ttatttctgg ggtaattaat cagcgaagcg atgatttttg 3360

atctattaac agatatataa atgcaaaaac tgcataacca ctttaactaa tactttcaac 3420

attttcggtt tgtattactt cttattcaaa tgtaataaaa gtatcaacaa aaaattgtta 3480

atatacctct atactttaac gtcaaggaga aaaaacccat ggacaagaag tactccattg 3540

ggctcgctat cggcacaaac agcgtcggtt gggccgtcat tacggacgag tacaaggtgc 3600

cgagcaaaaa attcaaagtt ctgggcaata ccgatcgcca cagcataaag aagaacctca 3660

ttggcgccct cctgttcgac tccggggaga cggccgaagc cacgcggctc aaaagaacag 3720

cacggcgcag atatacccgc agaaagaatc ggatctgcta cctgcaggag atctttagta 3780

atgagatggc taaggtggat gactctttct tccataggct ggaggagtcc tttttggtgg 3840

aggaggataa aaagcacgag cgccacccaa tctttggcaa tatcgtggac gaggtggcgt 3900

accatgaaaa gtacccaacc atatatcatc tgaggaagaa gcttgtagac agtactgata 3960

aggctgactt gcggttgatc tatctcgcgc tggcgcatat gatcaaattt cggggacact 4020

tcctcatcga gggggacctg aacccagaca acagcgatgt cgacaaactc tttatccaac 4080

tggttcagac ttacaatcag cttttcgaag agaacccgat caacgcatcc ggagttgacg 4140

ccaaagcaat cctgagcgct aggctgtcca aatcccggcg gctcgaaaac ctcatcgcac 4200

agctccctgg ggagaagaag aacggcctgt ttggtaatct tatcgccctg tcactcgggc 4260

tgacccccaa ctttaaatct aacttcgacc tggccgaaga tgccaagctt caactgagca 4320

aagacaccta cgatgatgat ctcgacaatc tgctggccca gatcggcgac cagtacgcag 4380

accttttttt ggcggcaaag aacctgtcag acgccattct gctgagtgat attctgcgag 4440

tgaacacgga gatcaccaaa gctccgctga gcgctagtat gatcaagcgc tatgatgagc 4500

accaccaaga cttgactttg ctgaaggccc ttgtcagaca gcaactgcct gagaagtaca 4560

aggaaatttt cttcgatcag tctaaaaatg gctacgccgg atacattgac ggcggagcaa 4620

gccaggagga attttacaaa tttattaagc ccatcttgga aaaaatggac ggcaccgagg 4680

agctgctggt aaagcttaac agagaagatc tgttgcgcaa acagcgcact ttcgacaatg 4740

gaagcatccc ccaccagatt cacctgggcg aactgcacgc tatcctcagg cggcaagagg 4800

atttctaccc ctttttgaaa gataacaggg aaaagattga gaaaatcctc acatttcgga 4860

taccctacta tgtaggcccc ctcgcccggg gaaattccag attcgcgtgg atgactcgca 4920

aatcagaaga gaccatcact ccctggaact tcgaggaagt cgtggataag ggggcctctg 4980

cccagtcctt catcgaaagg atgactaact ttgataaaaa tctgcctaac gaaaaggtgc 5040

ttcctaaaca ctctctgctg tacgagtact tcacagttta taacgagctc accaaggtca 5100

aatacgtcac agaagggatg agaaagccag cattcctgtc tggagagcag aagaaagcta 5160

tcgtggacct cctcttcaag acgaaccgga aagttaccgt gaaacagctc aaagaagact 5220

atttcaaaaa gattgaatgt ttcgactctg ttgaaatcag cggagtggag gatcgcttca 5280

acgcatccct gggaacgtat cacgatctcc tgaaaatcat taaagacaag gacttcctgg 5340

acaatgagga gaacgaggac attcttgagg acattgtcct cacccttacg ttgtttgaag 5400

atagggagat gattgaagaa cgcttgaaaa cttacgctca tctcttcgac gacaaagtca 5460

tgaaacagct caagaggcgc cgatatacag gatgggggcg gctgtcaaga aaactgatca 5520

atgggatccg agacaagcag agtggaaaga caatcctgga ttttcttaag tccgatggat 5580

ttgccaaccg gaacttcatg cagttgatcc atgatgactc tctcaccttt aaggaggaca 5640

tccagaaagc acaagtttct ggccaggggg acagtcttca cgagcacatc gctaatcttg 5700

caggtagccc agctatcaaa aagggaatac tgcagaccgt taaggtcgtg gatgaactcg 5760

tcaaagtaat gggaaggcat aagcccgaga atatcgttat cgagatggcc cgagagaacc 5820

aaactaccca gaagggacag aagaacagta gggaaaggat gaagaggatt gaagagggta 5880

taaaagaact ggggtcccaa atccttaagg aacacccagt tgaaaacacc cagcttcaga 5940

atgagaagct ctacctgtac tacctgcaga acggcaggga catgtacgtg gatcaggaac 6000

tggacatcaa tcggctctcc gactacgacg tggatgctat cgtgccccag tcttttctca 6060

aagatgattc tattgataat aaagtgttga caagatccga taaaaataga gggaagagtg 6120

ataacgtccc ctcagaagaa gttgtcaaga aaatgaaaaa ttattggcgg cagctgctga 6180

acgccaaact gatcacacaa cggaagttcg ataatctgac taaggctgaa cgaggtggcc 6240

tgtctgagtt ggataaagcc ggcttcatca aaaggcagct tgttgagaca cgccagatca 6300

ccaagcacgt ggcccaaatt ctcgattcac gcatgaacac caagtacgat gaaaatgaca 6360

aactgattcg agaggtgaaa gttattactc tgaagtctaa gctggtctca gatttcagaa 6420

aggactttca gttttataag gtgagagaga tcaacaatta ccaccatgcg catgatgcct 6480

acctgaatgc agtggtaggc actgcactta tcaaaaaata tcccaagctt gaatctgaat 6540

ttgtttacgg agactataaa gtgtacgatg ttaggaaaat gatcgcaaag tctgagcagg 6600

aaataggcaa ggccaccgct aagtacttct tttacagcaa tattatgaat tttttcaaga 6660

ccgagattac actggccaat ggagagattc ggaagcgacc acttatcgaa acaaacggag 6720

aaacaggaga aatcgtgtgg gacaagggta gggatttcgc gacagtccgg aaggtcctgt 6780

ccatgccgca ggtgaacatc gttaaaaaga ccgaagtaca gaccggaggc ttctccaagg 6840

aaagtatcct cccgaaaagg aacagcgaca agctgatcgc acgcaaaaaa gattgggacc 6900

ccaagaaata cggcggattc gattctccta cagtcgctta cagtgtactg gttgtggcca 6960

aagtggagaa agggaagtct aaaaaactca aaagcgtcaa ggaactgctg ggcatcacaa 7020

tcatggagcg atcaagcttc gaaaaaaacc ccatcgactt tctcgaggcg aaaggatata 7080

aagaggtcaa aaaagacctc atcattaagc ttcccaagta ctctctcttt gagcttgaaa 7140

acggccggaa acgaatgctc gctagtgcgg gcgagctgca gaaaggtaac gagctggcac 7200

tgccctctaa atacgttaat ttcttgtatc tggccagcca ctatgaaaag ctcaaagggt 7260

ctcccgaaga taatgagcag aagcagctgt tcgtggaaca acacaaacac taccttgatg 7320

agatcatcga gcaaataagc gaattctcca aaagagtgat cctcgccgac gctaacctcg 7380

ataaggtgct ttctgcttac aataagcaca gggataagcc catcagggag caggcagaaa 7440

acattatcca cttgtttact ctgaccaact tgggcgcgcc tgcagccttc aagtacttcg 7500

acaccaccat agacagaaag cggtacacct ctacaaagga ggtcctggac gccacactga 7560

ttcatcagtc aattacgggg ctctatgaaa caagaatcga cctctctcag ctcggtggag 7620

acagcagggc tgaccccaag aagaagagga aggtgggtgg aggaggttct ggaggtggag 7680

gttctgcaga gtatgtgcgg gccctctttg actttaatgg gaatgatgaa gaagatcttc 7740

cctttaagaa aggagacatc ctgagaatcc gggataagcc tgaagagcag tggtggaatg 7800

cagaggacag cgaaggaaag agggggatga ttcttgtccc ttacgtggag aagtattccg 7860

gagactataa ggaccacgac ggagactaca aggatcatga tattgattac aaagacgatg 7920

acgataagtc taggatgacc gacgctgagt acgtgagaat ccatgagaag ttggacatct 7980

acacgtttaa gaaacagttt ttcaacaaca aaaaatccgt gtcgcataga tgctacgttc 8040

tctttgaatt aaaacgacgg ggtgaacgta gagcgtgttt ttggggctat gctgtgaata 8100

aaccacagag cgggacagaa cgtggcattc acgccgaaat ctttagcatt agaaaagtcg 8160

aagaatacct gcgcgacaac cccggacaat tcacgataaa ttggtactca tcctggagtc 8220

cttgtgcaga ttgcgctgaa aagatcttag aatggtataa ccaggagctg cgggggaacg 8280

gccacacttt gaaaatctgg gcttgcaaac tctattacga gaaaaatgcg aggaatcaaa 8340

ttgggctgtg gaacctcaga gataacgggg ttgggttgaa tgtaatggta agtgaacact 8400

accaatgttg caggaaaata ttcatccaat cgtcgcacaa tcaattgaat gagaatagat 8460

ggcttgagaa gactttgaag cgagctgaaa aacgacggag cgagttgtcc attatgattc 8520

aggtaaaaat actccacacc actaagagtc ctgctgtttc tagaggctcc ggataaggat 8580

cctaataagc gaatttctta tgatttatga tttttattat taaataagtt ataaaaaaaa 8640

taagtgtata caaattttaa agtgactctt aggttttaaa acgaaaattc ttattcttga 8700

gtaactcttt cctgtaggtc aggttgcttt ctcaggtata gcatgaggtc gctcttattg 8760

accacacctc taccggcatg ccgagcaaat gcctgcaaat cgctcccggg caaaaaaccc 8820

cctcaagacc cgtttagagg ccccaagggg ttatgctatg catactgata taattaaatt 8880

gaagctctaa tttgtgagtt tagtatacat gcataccaag cttccgcggt ggagctccaa 8940

ttcgccctat agtgagtcgt attacaattc actggccgtc gttttacaac gtcgtgactg 9000

ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca catcccccct tcgccagctg 9060

gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg 9120

cgaatggcgc gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 9180

cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 9240

ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 9300

gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 9360

acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 9420

ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 9480

ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 9540

acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcct gatgcggtat 9600

tttctcctta cgcatctgtg cggtatttca caccgcatat cgaccctcga ggagaacttc 9660

tagtatatcc acatacctaa tattattgcc ttattaaaaa tggaatcgga acaattacat 9720

caaaatccac attctcttca aaatcaattg tcctgtactt ccttgttcat gtgtgttcaa 9780

aaacgttata tttataggat aattatactc tatttctcaa caagtaattg gttgtttggc 9840

cgagcggtct aaggcgcctg attcaagaaa tatcttgacc gcagttaact gtgggaatac 9900

tcaggtatcg taagatgcaa gagttcgaat ctcttagcaa ccattatttt tttcctcaac 9960

ataacgagaa cacacagggg cgctatcgca cagaatcaaa ttcgatgact ggaaattttt 10020

tgttaatttc agaggtcgcc tgacgcatat acctttttca actgaaaaat tgggagaaaa 10080

aggaaaggtg agaggccgga accggctttt catatagaat agagaagcgt tcatgactaa 10140

atgcttgcat cacaatactt gaagttgaca atattattta aggacctatt gttttttcca 10200

ataggtggtt agcaatcgtc ttactttcta acttttctta ccttttacat ttcagcaata 10260

tatatatata tttcaaggat ataccattct aatgtctgcc cctatgtctg cccctaagaa 10320

gatcgtcgtt ttgccaggtg accacgttgg tcaagaaatc acagccgaag ccattaaggt 10380

tcttaaagct atttctgatg ttcgttccaa tgtcaagttc gatttcgaaa atcatttaat 10440

tggtggtgct gctatcgatg ctacaggtgt cccacttcca gatgaggcgc tggaagcctc 10500

caagaaggtt gatgccgttt tgttaggtgc tgtgggtggt cctaaatggg gtaccggtag 10560

tgttagacct gaacaaggtt tactaaaaat ccgtaaagaa cttcaattgt acgccaactt 10620

aagaccatgt aactttgcat ccgactctct tttagactta tctccaatca agccacaatt 10680

tgctaaaggt actgacttcg ttgttgtcag agaattagtg ggaggtattt actttggtaa 10740

gagaaaggaa gacgatggtg atggtgtcgc ttgggatagt gaacaataca ccgttccaga 10800

agtgcaaaga atcacaagaa tggccgcttt catggcccta caacatgagc caccattgcc 10860

tatttggtcc ttggataaag ctaatgtttt ggcctcttca agattatgga gaaaaactgt 10920

ggaggaaacc atcaagaacg aattccctac attgaaggtt caacatcaat tgattgattc 10980

tgccgccatg atcctagtta agaacccaac ccacctaaat ggtattataa tcaccagcaa 11040

catgtttggt gatatcatct ccgatgaagc ctccgttatc ccaggttcct tgggtttgtt 11100

gccatctgcg tccttggcct ctttgccaga caagaacacc gcatttggtt tgtacgaacc 11160

atgccacggt tctgctccag atttgccaaa gaataaggtt gaccctatcg ccactatctt 11220

gtctgctgca atgatgttga aattgtcatt gaacttgcct gaagaaggta aggccattga 11280

agatgcagtt aaaaaggttt tggatgcagg tatcagaact ggtgatttag gtggttccaa 11340

cagtaccacc gaagtcggtg atgctgtcgc cgaagaagtt aagaaaatcc ttgcttaaaa 11400

agattctctt tttttatgat atttgtacat aaactttata aatgaaattc ataatagaaa 11460

cgacacgaaa ttacaaaatg gaatatgttc atagggtaga cgaaactata tacgcaatct 11520

acatacattt atcaagaagg agaaaaagga ggatagtaaa ggaatacagg taagcaaatt 11580

gatactaatg gctcaacgtg ataaggaaaa agaattgcac tttaacatta atattgacaa 11640

ggaggagggc accacacaaa aagttaggtg taacagaaaa tcatgaaact acgattccta 11700

atttgatatt ggaggatttt ctctaaaaaa aaaaaaatac aacaaataaa aaacactcaa 11760

tgacctgacc atttgatgga gtttaagtca ataccttctt gaaccatttc ccataatggt 11820

gaaagttccc tcaagaattt tactctgtca gaaacggcct tacgacgtag tcgatatggt 11880

gcactctcag tacaatctgc tctgatgccg catagttaag ccagccccga cacccgccaa 11940

cacccgctga cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg 12000

tgaccgtctc cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga 12060

<210> 9

<211> 20

<212> DNA

<213> 酿酒酵母(Saccharomyces cerevisiae)

<400> 9

cctttagcgg cttaactgtg 20

<210> 10

<211> 20

<212> DNA

<213> 酿酒酵母(Saccharomyces cerevisiae)

<400> 10

ggcccaggta ttgttagcgg 20

<210> 11

<211> 20

<212> DNA

<213> 酿酒酵母(Saccharomyces cerevisiae)

<400> 11

ttggcggata atgcctttag 20

<210> 12

<211> 20

<212> DNA

<213> 酿酒酵母(Saccharomyces cerevisiae)

<400> 12

tgcagttggg ttaagaatac 20

<210> 13

<211> 20

<212> DNA

<213> 酿酒酵母(Saccharomyces cerevisiae)

<400> 13

gctaacatca aaaggcctct 20

<210> 14

<211> 20

<212> DNA

<213> 酿酒酵母(Saccharomyces cerevisiae)

<400> 14

ttggcggata atgcctttag 20

<210> 15

<211> 7250

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> 质粒载体1xgRNA Can杂交(Plasmid Vector 1xgRNA Can cross)

<220>

<221> 基因(gene)

<222> (133)..(993)

<223> AmpR

<220>

<221> 启动子(promoter)

<222> (994)..(1098)

<223> AmpR启动子(AmpR promoter)

<220>

<221> rep_origin

<222> (1125)..(2467)

<223> 2个微小ori(2 micro ori)

<220>

<221> misc_feature

<222> (2521)..(2994)

<223> Can1_左臂(Can1_Left arm)

<220>

<221> 启动子(promoter)

<222> (3231)..(3446)

<223> URA3启动子(URA3 promoter)

<220>

<221> 基因(gene)

<222> (3447)..(4250)

<223> URA3

<220>

<221> rep_origin

<222> (4381)..(4836)

<223> f1 ori

<220>

<221> misc_feature

<222> (5054)..(5507)

<223> Can1_右臂(Can1_Right Arm)

<220>

<221> 终止子(terminator)

<222> (5519)..(5766)

<223> CYC1终止子(CYC1 terminator)

<220>

<221> 终止子(terminator)

<222> (5772)..(5785)

<223> Sup4终止子(Sup4 term)

<220>

<221> misc_structure

<222> (5788)..(5870)

<223> tracrRNA

<220>

<221> misc_feature

<222> (5871)..(5890)

<223> 靶1R(target1R)

<220>

<221> 启动子(promoter)

<222> (5891)..(6159)

<223> SNR52启动子(SNR52 promoter)

<220>

<221> misc_feature

<222> (6222)..(6238)

<223> M13 rev

<220>

<221> misc_feature

<222> (6246)..(6262)

<223> lac操纵基因(lac operator)

<220>

<221> 启动子(promoter)

<222> (6270)..(6300)

<223> lac启动子(lac promoter)

<220>

<221> rep_origin

<222> (6624)..(7212)

<223> ori

<400> 15

gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac 60

ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac 120

ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 180

tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt 240

accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt 300

atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc 360

cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa 420

tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg 480

tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt 540

gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc 600

agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt 660

aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg 720

gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac 780

tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc 840

gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt 900

tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg 960

aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat attattgaag 1020

catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa 1080

acaaataggg gttccgcgca catttccccg aaaagtgcca cctgaacgaa gcatctgtgc 1140

ttcattttgt agaacaaaaa tgcaacgcga gagcgctaat ttttcaaaca aagaatctga 1200

gctgcatttt tacagaacag aaatgcaacg cgaaagcgct attttaccaa cgaagaatct 1260

gtgcttcatt tttgtaaaac aaaaatgcaa cgcgagagcg ctaatttttc aaacaaagaa 1320

tctgagctgc atttttacag aacagaaatg caacgcgaga gcgctatttt accaacaaag 1380

aatctatact tcttttttgt tctacaaaaa tgcatcccga gagcgctatt tttctaacaa 1440

agcatcttag attacttttt ttctcctttg tgcgctctat aatgcagtct cttgataact 1500

ttttgcactg taggtccgtt aaggttagaa gaaggctact ttggtgtcta ttttctcttc 1560

cataaaaaaa gcctgactcc acttcccgcg tttactgatt actagcgaag ctgcgggtgc 1620

attttttcaa gataaaggca tccccgatta tattctatac cgatgtggat tgcgcatact 1680

ttgtgaacag aaagtgatag cgttgatgat tcttcattgg tcagaaaatt atgaacggtt 1740

tcttctattt tgtctctata tactacgtat aggaaatgtt tacattttcg tattgttttc 1800

gattcactct atgaatagtt cttactacaa tttttttgtc taaagagtaa tactagagat 1860

aaacataaaa aatgtagagg tcgagtttag atgcaagttc aaggagcgaa aggtggatgg 1920

gtaggttata tagggatata gcacagagat atatagcaaa gagatacttt tgagcaatgt 1980

ttgtggaagc ggtattcgca atattttagt agctcgttac agtccggtgc gtttttggtt 2040

ttttgaaagt gcgtcttcag agcgcttttg gttttcaaaa gcgctctgaa gttcctatac 2100

tttctagaga ataggaactt cggaatagga acttcaaagc gtttccgaaa acgagcgctt 2160

ccgaaaatgc aacgcgagct gcgcacatac agctcactgt tcacgtcgca cctatatctg 2220

cgtgttgcct gtatatatat atacatgaga agaacggcat agtgcgtgtt tatgcttaaa 2280

tgcgtactta tatgcgtcta tttatgtagg atgaaaggta gtctagtacc tcctgtgata 2340

ttatcccatt ccatgcgggg tatcgtatgc ttccttcagc actacccttt agctgttcta 2400

tatgctgcca ctcctcaatt ggattagtct catccttcaa tgctatcatt tcctttgata 2460

ttggatcata ctaagaaacc attattatca tgacattaac ctataaaaat aggcgcatgc 2520

ttattagcct tgatagtgct gaaaaaaaga aaaaaaacaa aaaaaagaaa taaaataacg 2580

gcaaacagca aaggccacag aaccgtattc atgttacttc tgcaatatca atcacttact 2640

ggcaagtgcg tataaattaa acctatttct ttatcatcat atttacttat atctttaaca 2700

gattccaaac cctaaagtgt ccgaattttc aatagggcga acttgaagaa taaccaaggt 2760

caataatata tcttttagta taaccctgaa atttgcccta tagaaatcta gggtttctgt 2820

gtggtttccg ggtgagtcat acggcttttt tgaatttctt tttttgcagt tgtctctatc 2880

aatgaaaatt tcgaggaaga cgataaggtt aagataagta gataagagaa tgatacgaga 2940

taaagcacaa attagcagaa agaagagtgg ttgcgaacag agtaaaccga atcagacgtc 3000

agacctaggt catgccgagg ccctttcgtc tcgcgcgttt cggtgatgac ggtgaaaacc 3060

tctgacacat gcagctcccg gagacggtca cagcttgtct gtaagcggat gccgggagca 3120

gacaagcccg tcagggcgcg tcagcgggtg ttggcgggtg tcggggctgg cttaactatg 3180

cggcatcaga gcagattgta ctgagagtgc accataccac agcttttcaa ttcaattcat 3240

catttttttt ttattctttt ttttgatttc ggtttccttg aaattttttt gattcggtaa 3300

tctccgaaca gaaggaagaa cgaaggaagg agcacagact tagattggta tatatacgca 3360

tatgtagtgt tgaagaaaca tgaaattgcc cagtattctt aacccaactg cacagaacaa 3420

aaacctgcag gaaacgaaga taaatcatgt cgaaagctac atataaggaa cgtgctgcta 3480

ctcatcctag tcctgttgct gccaagctat ttaatatcat gcacgaaaag caaacaaact 3540

tgtgtgcttc attggatgtt cgtaccacca aggaattact ggagttagtt gaagcattag 3600

gtcccaaaat ttgtttacta aaaacacatg tggatatctt gactgatttt tccatggagg 3660

gcacagttaa gccgctaaag gcattatccg ccaagtacaa ttttttactc ttcgaagaca 3720

gaaaatttgc tgacattggt aatacagtca aattgcagta ctctgcgggt gtatacagaa 3780

tagcagaatg ggcagacatt acgaatgcac acggtgtggt gggcccaggt attgttagcg 3840

gtttgaagca ggcggcagaa gaagtaacaa aggaacctag aggccttttg atgttagcag 3900

aattgtcatg caagggctcc ctatctactg gagaatatac taagggtact gttgacattg 3960

cgaagagcga caaagatttt gttatcggct ttattgctca aagagacatg ggtggaagag 4020

atgaaggtta cgattggttg attatgacac ccggtgtggg tttagatgac aagggagacg 4080

cattgggtca acagtataga accgtggatg atgtggtctc tacaggatct gacattatta 4140

ttgttggaag aggactattt gcaaagggaa gggatgctaa ggtagagggt gaacgttaca 4200

gaaaagcagg ctgggaagca tatttgagaa gatgcggcca gcaaaactaa aaaactgtat 4260

tataagtaaa tgcatgtata ctaaactcac aaattagagc ttcaatttaa ttatatcagt 4320

tattacccta tgcggtgtga aataccgcac agatgcgtaa ggagaaaata ccgcatcagg 4380

aaattgtaaa cgttaatatt ttgttaaaat tcgcgttaaa tttttgttaa atcagctcat 4440

tttttaacca ataggccgaa atcggcaaaa tcccttataa atcaaaagaa tagaccgaga 4500

tagggttgag tgttgttcca gtttggaaca agagtccact attaaagaac gtggactcca 4560

acgtcaaagg gcgaaaaacc gtctatcagg gcgatggccc actacgtgaa ccatcaccct 4620

aatcaagttt tttggggtcg aggtgccgta aagcactaaa tcggaaccct aaagggagcc 4680

cccgatttag agcttgacgg ggaaagccgg cgaacgtggc gagaaaggaa gggaagaaag 4740

cgaaaggagc gggcgctagg gcgctggcaa gtgtagcggt cacgctgcgc gtaaccacca 4800

cacccgccgc gcttaatgcg ccgctacagg gcgcgtcgcg ccattcgcca ttcaggctgc 4860

gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag ctggcgaaag 4920

ggggatgtgc tgcaaggcga ttaagttggg taacgccagg gttttcccag tcacgacgtt 4980

gtaaaacgac ggccagtgag cgcgcgtaat acgactcact atagggcgaa ttgggtactc 5040

ctaggttaat taagataatg tctgagttag gtgagtattc taaattagaa aacaaagagc 5100

ttagaacgga gtttgaattg acaaattttc cttttccagg cacaactgat aacgactccg 5160

atgacggaag ccaagggcag aactctttga atatcattac tcctgacatg gatgatactc 5220

tggttaatga tgtacttcga gaaaacgata aaaagtctag tatgagaatg gcttttatga 5280

atctagcaaa ctctattctt ggtgccggaa taattactca gccgttcgcg atcaaaaatg 5340

ctggtatatt aggcgggcta ttatcatacg tagccctcgg atttatagtt gattggacgt 5400

taagacttat tgtcattaac ttgactcttg ctggcaagag aacataccag ggtacggtcg 5460

aacatgtaat gggtaaaaaa gggaaattgc tgattctatt tacaaactgg taccggccgc 5520

aaattaaagc cttcgagcgt cccaaaacct tctcaagcaa ggttttcagt ataatgttac 5580

atgcgtacac gcgtctgtac agaaaaaaaa gaaaaatttg aaatataaat aacgttctta 5640

atactaacat aactataaaa aaataaatag ggacctagac ttcaggttgt ctaactcctt 5700

ccttttcggt tagagcggat gtggggggag ggcgtgaacg taagcgtgac ataactaatt 5760

acatgactcg aagacataaa aaacaaaaaa agcaccaccg actcggtgcc actttttcaa 5820

gttgataacg gactagcctt attttaactt gctatttcta gctctaaaac gaaaagggga 5880

tcctattgac gatcatttat ctttcactgc ggagaagttt cgaacgccga aacatgcgca 5940

ccaactttca cttctacagc gtttgaccaa aatcttttga acagaacatt gtagggtgtg 6000

aaaaaatgcg cacctttacc gctagcccaa gagggcacta caaaatctag agttgtactt 6060

caaacgtaca tgtaatcacc ttgtatatac tcgaaagaaa acatcaagtt tctgtataaa 6120

tatgagtgaa agcataatca tacattatct tttcaaagaa gctccagctt ttgttccctt 6180

tagtgatcac gtccggattg cggccgcttg gcgtaatcat ggtcatagct gtttcctgtg 6240

tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa 6300

gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct 6360

ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga 6420

ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 6480

gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 6540

tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 6600

aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 6660

aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 6720

ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 6780

tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 6840

agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 6900

gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 6960

tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 7020

acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 7080

tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 7140

caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 7200

aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 7250

<210> 16

<211> 7672

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> 质粒载体2xgRNA Can杂交(Plasmid Vector 2xgRNA Can cross)

<220>

<221> 基因(gene)

<222> (133)..(993)

<223> AmpR

<220>

<221> 启动子(promoter)

<222> (994)..(1098)

<223> AmpR启动子(AmpR promoter)

<220>

<221> rep_origin

<222> (1125)..(2467)

<223> 2个微小ori(2 micro ori)

<220>

<221> 终止子(terminator)

<222> (2539)..(2552)

<223> Sup4终止子(Sup4 term)

<220>

<221> misc_structure

<222> (2555)..(2637)

<223> tracrRNA

<220>

<221> misc_feature

<222> (2638)..(2657)

<223> 靶1R(target1R)

<220>

<221> 启动子(promoter)

<222> (2658)..(2926)

<223> SNR52启动子(SNR52 promoter)

<220>

<221> misc_feature

<222> (2943)..(3416)

<223> Can1_左臂(Can1_Left arm)

<220>

<221> 启动子(promoter)

<222> (3653)..(3868)

<223> URA3启动子(URA3 promoter)

<220>

<221> 基因(gene)

<222> (3869)..(4672)

<223> URA3

<220>

<221> rep_origin

<222> (4803)..(5258)

<223> f1 ori

<220>

<221> misc_feature

<222> (5476)..(5929)

<223> Can1_右臂(Can1_Right Arm)

<220>

<221> 终止子(terminator)

<222> (5941)..(6188)

<223> CYC1终止子(CYC1 terminator)

<220>

<221> 终止子(terminator)

<222> (6194)..(6207)

<223> Sup4终止子(Sup4 term)

<220>

<221> misc_structure

<222> (6210)..(6292)

<223> tracrRNA

<220>

<221> misc_feature

<222> (6293)..(6312)

<223> 靶2R(target2R)

<220>

<221> 启动子(promoter)

<222> (6313)..(6581)

<223> SNR52启动子(SNR52 promoter)

<220>

<221> rep_origin

<222> (7046)..(7634)

<223> ori

<400> 16

gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac 60

ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac 120

ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 180

tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt 240

accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt 300

atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc 360

cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa 420

tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg 480

tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt 540

gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc 600

agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt 660

aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg 720

gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac 780

tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc 840

gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt 900

tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg 960

aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat attattgaag 1020

catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa 1080

acaaataggg gttccgcgca catttccccg aaaagtgcca cctgaacgaa gcatctgtgc 1140

ttcattttgt agaacaaaaa tgcaacgcga gagcgctaat ttttcaaaca aagaatctga 1200

gctgcatttt tacagaacag aaatgcaacg cgaaagcgct attttaccaa cgaagaatct 1260

gtgcttcatt tttgtaaaac aaaaatgcaa cgcgagagcg ctaatttttc aaacaaagaa 1320

tctgagctgc atttttacag aacagaaatg caacgcgaga gcgctatttt accaacaaag 1380

aatctatact tcttttttgt tctacaaaaa tgcatcccga gagcgctatt tttctaacaa 1440

agcatcttag attacttttt ttctcctttg tgcgctctat aatgcagtct cttgataact 1500

ttttgcactg taggtccgtt aaggttagaa gaaggctact ttggtgtcta ttttctcttc 1560

cataaaaaaa gcctgactcc acttcccgcg tttactgatt actagcgaag ctgcgggtgc 1620

attttttcaa gataaaggca tccccgatta tattctatac cgatgtggat tgcgcatact 1680

ttgtgaacag aaagtgatag cgttgatgat tcttcattgg tcagaaaatt atgaacggtt 1740

tcttctattt tgtctctata tactacgtat aggaaatgtt tacattttcg tattgttttc 1800

gattcactct atgaatagtt cttactacaa tttttttgtc taaagagtaa tactagagat 1860

aaacataaaa aatgtagagg tcgagtttag atgcaagttc aaggagcgaa aggtggatgg 1920

gtaggttata tagggatata gcacagagat atatagcaaa gagatacttt tgagcaatgt 1980

ttgtggaagc ggtattcgca atattttagt agctcgttac agtccggtgc gtttttggtt 2040

ttttgaaagt gcgtcttcag agcgcttttg gttttcaaaa gcgctctgaa gttcctatac 2100

tttctagaga ataggaactt cggaatagga acttcaaagc gtttccgaaa acgagcgctt 2160

ccgaaaatgc aacgcgagct gcgcacatac agctcactgt tcacgtcgca cctatatctg 2220

cgtgttgcct gtatatatat atacatgaga agaacggcat agtgcgtgtt tatgcttaaa 2280

tgcgtactta tatgcgtcta tttatgtagg atgaaaggta gtctagtacc tcctgtgata 2340

ttatcccatt ccatgcgggg tatcgtatgc ttccttcagc actacccttt agctgttcta 2400

tatgctgcca ctcctcaatt ggattagtct catccttcaa tgctatcatt tcctttgata 2460

ttggatcata ctaagaaacc attattatca tgacattaac ctataaaaat aggcgcatgt 2520

cgactacccg ggaactcgag acataaaaaa caaaaaaagc accaccgact cggtgccact 2580

ttttcaagtt gataacggac tagccttatt ttaacttgct atttctagct ctaaaacgaa 2640

aaggggatcc tattgacgat catttatctt tcactgcgga gaagtttcga acgccgaaac 2700

atgcgcacca actttcactt ctacagcgtt tgaccaaaat cttttgaaca gaacattgta 2760

gggtgtgaaa aaatgcgcac ctttaccgct agcccaagag ggcactacaa aatctagagt 2820

tgtacttcaa acgtacatgt aatcaccttg tatatactcg aaagaaaaca tcaagtttct 2880

gtataaatat gagtgaaagc ataatcatac attatctttt caaagaattc accggtgcat 2940

gcttattagc cttgatagtg ctgaaaaaaa gaaaaaaaac aaaaaaaaga aataaaataa 3000

cggcaaacag caaaggccac agaaccgtat tcatgttact tctgcaatat caatcactta 3060

ctggcaagtg cgtataaatt aaacctattt ctttatcatc atatttactt atatctttaa 3120

cagattccaa accctaaagt gtccgaattt tcaatagggc gaacttgaag aataaccaag 3180

gtcaataata tatcttttag tataaccctg aaatttgccc tatagaaatc tagggtttct 3240

gtgtggtttc cgggtgagtc atacggcttt tttgaatttc tttttttgca gttgtctcta 3300

tcaatgaaaa tttcgaggaa gacgataagg ttaagataag tagataagag aatgatacga 3360

gataaagcac aaattagcag aaagaagagt ggttgcgaac agagtaaacc gaatcagacg 3420

tcagacctag gtcatgccga ggccctttcg tctcgcgcgt ttcggtgatg acggtgaaaa 3480

cctctgacac atgcagctcc cggagacggt cacagcttgt ctgtaagcgg atgccgggag 3540

cagacaagcc cgtcagggcg cgtcagcggg tgttggcggg tgtcggggct ggcttaacta 3600

tgcggcatca gagcagattg tactgagagt gcaccatacc acagcttttc aattcaattc 3660

atcatttttt ttttattctt ttttttgatt tcggtttcct tgaaattttt ttgattcggt 3720

aatctccgaa cagaaggaag aacgaaggaa ggagcacaga cttagattgg tatatatacg 3780

catatgtagt gttgaagaaa catgaaattg cccagtattc ttaacccaac tgcacagaac 3840

aaaaacctgc aggaaacgaa gataaatcat gtcgaaagct acatataagg aacgtgctgc 3900

tactcatcct agtcctgttg ctgccaagct atttaatatc atgcacgaaa agcaaacaaa 3960

cttgtgtgct tcattggatg ttcgtaccac caaggaatta ctggagttag ttgaagcatt 4020

aggtcccaaa atttgtttac taaaaacaca tgtggatatc ttgactgatt tttccatgga 4080

gggcacagtt aagccgctaa aggcattatc cgccaagtac aattttttac tcttcgaaga 4140

cagaaaattt gctgacattg gtaatacagt caaattgcag tactctgcgg gtgtatacag 4200

aatagcagaa tgggcagaca ttacgaatgc acacggtgtg gtgggcccag gtattgttag 4260

cggtttgaag caggcggcag aagaagtaac aaaggaacct agaggccttt tgatgttagc 4320

agaattgtca tgcaagggct ccctatctac tggagaatat actaagggta ctgttgacat 4380

tgcgaagagc gacaaagatt ttgttatcgg ctttattgct caaagagaca tgggtggaag 4440

agatgaaggt tacgattggt tgattatgac acccggtgtg ggtttagatg acaagggaga 4500

cgcattgggt caacagtata gaaccgtgga tgatgtggtc tctacaggat ctgacattat 4560

tattgttgga agaggactat ttgcaaaggg aagggatgct aaggtagagg gtgaacgtta 4620

cagaaaagca ggctgggaag catatttgag aagatgcggc cagcaaaact aaaaaactgt 4680

attataagta aatgcatgta tactaaactc acaaattaga gcttcaattt aattatatca 4740

gttattaccc tatgcggtgt gaaataccgc acagatgcgt aaggagaaaa taccgcatca 4800

ggaaattgta aacgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 4860

attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 4920

gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga acgtggactc 4980

caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg aaccatcacc 5040

ctaatcaagt tttttggggt cgaggtgccg taaagcacta aatcggaacc ctaaagggag 5100

cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg aagggaagaa 5160

agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc gcgtaaccac 5220

cacacccgcc gcgcttaatg cgccgctaca gggcgcgtcg cgccattcgc cattcaggct 5280

gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 5340

agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 5400

ttgtaaaacg acggccagtg agcgcgcgta atacgactca ctatagggcg aattgggtac 5460

tcctaggtta attaagataa tgtctgagtt aggtgagtat tctaaattag aaaacaaaga 5520

gcttagaacg gagtttgaat tgacaaattt tccttttcca ggcacaactg ataacgactc 5580

cgatgacgga agccaagggc agaactcttt gaatatcatt actcctgaca tggatgatac 5640

tctggttaat gatgtacttc gagaaaacga taaaaagtct agtatgagaa tggcttttat 5700

gaatctagca aactctattc ttggtgccgg aataattact cagccgttcg cgatcaaaaa 5760

tgctggtata ttaggcgggc tattatcata cgtagccctc ggatttatag ttgattggac 5820

gttaagactt attgtcatta acttgactct tgctggcaag agaacatacc agggtacggt 5880

cgaacatgta atgggtaaaa aagggaaatt gctgattcta tttacaaact ggtaccggcc 5940

gcaaattaaa gccttcgagc gtcccaaaac cttctcaagc aaggttttca gtataatgtt 6000

acatgcgtac acgcgtctgt acagaaaaaa aagaaaaatt tgaaatataa ataacgttct 6060

taatactaac ataactataa aaaaataaat agggacctag acttcaggtt gtctaactcc 6120

ttccttttcg gttagagcgg atgtgggggg agggcgtgaa cgtaagcgtg acataactaa 6180

ttacatgact cgaagacata aaaaacaaaa aaagcaccac cgactcggtg ccactttttc 6240

aagttgataa cggactagcc ttattttaac ttgctatttc tagctctaaa acgaaaaggg 6300

gatcctattg acgatcattt atctttcact gcggagaagt ttcgaacgcc gaaacatgcg 6360

caccaacttt cacttctaca gcgtttgacc aaaatctttt gaacagaaca ttgtagggtg 6420

tgaaaaaatg cgcaccttta ccgctagccc aagagggcac tacaaaatct agagttgtac 6480

ttcaaacgta catgtaatca ccttgtatat actcgaaaga aaacatcaag tttctgtata 6540

aatatgagtg aaagcataat catacattat cttttcaaag aagctccagc ttttgttccc 6600

tttagtgatc acgtccggat tgcggccgct tggcgtaatc atggtcatag ctgtttcctg 6660

tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 6720

aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 6780

ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 6840

gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 6900

tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 6960

aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 7020

gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 7080

aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 7140

ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 7200

tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 7260

tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 7320

ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 7380

tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 7440

ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta 7500

tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 7560

aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 7620

aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct ca 7672

<210> 17

<211> 20

<212> DNA

<213> 酿酒酵母(Saccharomyces cerevisiae)

<400> 17

cgaacagagt aaaccgaatc 20

<210> 18

<211> 20

<212> DNA

<213> 酿酒酵母(Saccharomyces cerevisiae)

<400> 18

agcactatca aggctaataa 20

<210> 19

<211> 20

<212> DNA

<213> 酿酒酵母(Saccharomyces cerevisiae)

<400> 19

gcgaacttga agaataacca 20

<210> 20

<211> 20

<212> DNA

<213> 酿酒酵母(Saccharomyces cerevisiae)

<400> 20

tcacctaact cagacattat 20

<210> 21

<211> 20

<212> DNA

<213> 酿酒酵母(Saccharomyces cerevisiae)

<400> 21

ttgctgattc tatttacaaa 20

<210> 22

<211> 20

<212> DNA

<213> 酿酒酵母(Saccharomyces cerevisiae)

<400> 22

gcaaactcta ttcttggtgc 20

<210> 23

<211> 20

<212> DNA

<213> 酿酒酵母(Saccharomyces cerevisiae)

<400> 23

accagagtat catccatgtc 20

<210> 24

<211> 20

<212> DNA

<213> 酿酒酵母(Saccharomyces cerevisiae)

<400> 24

aattcggaca ctttagggtt 20

<210> 25

<211> 20

<212> DNA

<213> 酿酒酵母(Saccharomyces cerevisiae)

<400> 25

agatattata cctggacccc 20

<210> 26

<211> 23

<212> DNA

<213> 酿酒酵母(Saccharomyces cerevisiae)

<400> 26

cccagttgga ttccgttatt gga 23

<210> 27

<211> 23

<212> DNA

<213> 酿酒酵母(Saccharomyces cerevisiae)

<400> 27

ccaggtataa tatctaagga taa 23

<210> 28

<211> 94

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> 质粒载体的一部分1059(Can1-7R)或质粒载体1148(Can1-11R)(Part ofPlasmid Vector 1059(Can1-7R) or Plasmid Vector 1148(Can1-11R))

<400> 28

ggttatgcta tgcattccgt tattggtgaa acccaggtgc ctggggtcca ggtataatat 60

cttaggataa aaacgaaggg aggttcttag gttg 94

<210> 29

<211> 94

<212> DNA

<213> 酿酒酵母(Saccharomyces cerevisiae)

<400> 29

ccggcccagt tggattccgt tattggagaa acccaggtgc ctggggtcca ggtataatat 60

ctaaggataa aaacgaaggg aggttcttag gttg 94

<210> 30

<211> 23

<212> DNA

<213> 酿酒酵母(Saccharomyces cerevisiae)

<400> 30

ccaggtataa tatctaagga taa 23

<210> 31

<211> 23

<212> DNA

<213> 酿酒酵母(Saccharomyces cerevisiae)

<400> 31

ccgttattgg agaaacccag gtg 23

<210> 32

<211> 70

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> 供体DNA(donor DNA)

<400> 32

gcgctaccgg actcagatct accggcccag ttggaatgta ggtggtgagc aagggcgagg 60

agctgttcac 70

<210> 33

<211> 70

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> 供体DNA(donor DNA)

<400> 33

gcgctaccgg actcagatct accggcccag ttggaatgta gatggtgagc aagggcgagg 60

agctgttcac 70

<210> 34

<211> 70

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> 供体DNA(donor DNA)

<400> 34

gcgctaccgg actcagatct acgggcccag ttggaatgta gatggtgagc aagggcgagg 60

agctgttcac 70

<210> 35

<211> 70

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> 供体DNA(donor DNA)

<400> 35

gtgaacagct cctcgccctt gctcaccacc tacattccaa ctgggccggt agatctgagt 60

ccggtagcgc 70

<210> 36

<211> 70

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> 供体DNA(donor DNA)

<400> 36

gtgaacagct cctcgccctt gctcaccatc tacattccaa ctgggccggt agatctgagt 60

ccggtagcgc 70

<210> 37

<211> 70

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> 供体DNA(donor DNA)

<400> 37

gtgaacagct cctcgccctt gctcaccatc tacattccaa ctgggcccgt agatctgagt 60

ccggtagcgc 70

<210> 38

<211> 70

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> 供体DNA(donor DNA)

<400> 38

ccgtcagatc cgctagcgct accggactca gatctaccgg cccagttgga atgtagatgg 60

tgagcaaggg 70

<210> 39

<211> 70

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> 供体DNA(donor DNA)

<400> 39

gatctaccgg cccagttgga atgtagatgg tgagcaaggg cgaggagctg ttcaccgggg 60

tggtgcccat 70

<210> 40

<211> 50

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> 供体DNA(donor DNA)

<400> 40

actcagatct accggcccag ttggaatgta gatggtgagc aagggcgagg 50

<210> 41

<211> 50

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> 供体DNA(donor DNA)

<400> 41

cctcgccctt gctcaccatc tacattccaa ctgggccggt agatctgagt 50

<210> 42

<211> 6189

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> 载体SY4(H1_sgRNA,CMV_mEGFP)(报告质粒)(Vector SY4(H1_sgRNA,CMV_mEGFP)(Reporter plasmid))

<220>

<221> 启动子(promoter)

<222> (263)..(491)

<223> H1启动子(H1 promoter)

<220>

<221> misc_structure

<222> (512)..(587)

<223> gRNA支架(gRNA scaffold)

<220>

<221> 增强子(enhancer)

<222> (602)..(981)

<223> CMV增强子(CMV enhancer)

<220>

<221> 启动子(promoter)

<222> (982)..(1185)

<223> CMV启动子(CMV promoter)

<220>

<221> misc_feature

<222> (1231)..(1250)

<223> KI_靶2(KI_target2)

<220>

<221> misc_feature

<222> (1236)..(1255)

<223> eGFP开关靶(eGFP switch target)

<220>

<221> misc_feature

<222> (1247)..(1249)

<223> 起始密码子(Start codon)

<220>

<221> 基因(gene)

<222> (1254)..(1969)

<223> EGFP

<220>

<221> polyA_信号(polyA_signal)

<222> (2012)..(2236)

<223> bGH poly(A)

<220>

<221> rep_origin

<222> (2282)..(2710)

<223> f1 ori

<220>

<221> 启动子(promoter)

<222> (2724)..(3053)

<223> SV40启动子(SV40 promoter)

<220>

<221> rep_origin

<222> (2904)..(3039)

<223> SV40 ori

<220>

<221> 基因(gene)

<222> (3070)..(3669)

<223> PuroR

<220>

<221> misc_structure

<222> (3683)..(4271)

<223> WPRE

<220>

<221> rep_origin

<222> (4468)..(5053)

<223> ori

<220>

<221> 基因(gene)

<222> (5224)..(6084)

<223> AmpR

<220>

<221> 启动子(promoter)

<222> (6085)..(6189)

<223> AmpR启动子(AmpR promoter)

<400> 42

cacatttccc cgaaaagtgc cacctgacgt cgacggatcg ggagatctcc cgatccccta 60

tggtgcactc tcagtacaat ctgctctgat gccgcatagt taagccagta tctgctccct 120

gcttgtgtgt tggaggtcgc tgagtagtgc gcgagcaaaa tttaagctac aacaaggcaa 180

ggcttgaccg acaattgcat gaagaatctg cttagggtta ggcgttttgc gctgcttcgc 240

gatgtacggg ccagatatac gcaattcgaa cgctgacgtc atcaacccgc tccaaggaat 300

cgcgggccca gtgtcactag gcgggaacac ccagcgcgcg tgcgccctgg caggaagatg 360

gctgtgaggg acaggggagt ggcgccctgc aatatttgca tgtcgctatg tgttctggga 420

aatcaccata aacgtgaaat gtctttggat ttgggaatct tataagttct gtatgaggac 480

cacagatccc ccacctacat tccaactggg cgttttagag ctagaaatag caagttaaaa 540

taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt ttttacgcgt 600

tgacattgat tattgactag ttattaatag taatcaatta cggggtcatt agttcatagc 660

ccatatatgg agttccgcgt tacataactt acggtaaatg gcccgcctgg ctgaccgccc 720

aacgaccccc gcccattgac gtcaataatg acgtatgttc ccatagtaac gccaataggg 780

actttccatt gacgtcaatg ggtggagtat ttacggtaaa ctgcccactt ggcagtacat 840

caagtgtatc atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc 900

tggcattatg cccagtacat gaccttatgg gactttccta cttggcagta catctacgta 960

ttagtcatcg ctattaccat ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag 1020

cggtttgact cacggggatt tccaagtctc caccccattg acgtcaatgg gagtttgttt 1080

tggcaccaaa atcaacggga ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa 1140

atgggcggta ggcgtgtacg gtgggaggtc tatataagca gagctggttt agtgaaccgt 1200

cagatccgct agcgctaccg gactcagatc taccggccca gttggaatgt aggtggtgag 1260

caagggcgag gagctgttca ccggggtggt gcccatcctg gtcgagctgg acggcgacgt 1320

aaacggccac aagttcagcg tgtccggcga gggcgagggc gatgccacct acggcaagct 1380

gaccctgaag ttcatctgca ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac 1440

caccttcacc tacggcgtgc agtgcttcag ccgctacccc gaccacatga agcagcacga 1500

cttcttcaag tccgccatgc ccgaaggcta cgtccaggag cgcaccatct tcttcaagga 1560

cgacggcaac tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg 1620

catcgagctg aagggcatcg acttcaagga ggacggcaac atcctggggc acaagctgga 1680

gtacaactac aacagccaca acgtctatat catggccgac aagcagaaga acggcatcaa 1740

ggtgaacttc aagatccgcc acaacatcga ggacggcagc gtgcagctcg ccgaccacta 1800

ccagcagaac acccccatcg gcgacggccc cgtgctgctg cccgacaacc actacctgag 1860

cacccagtcc gccctgagca aagaccccaa cgagaagcgc gatcacatgg tcctgctgga 1920

gttcgtgacc gccgccggga tcactcacgg catggacgag ctgtacaagg ctcgagctca 1980

agcttaagtt taaaccgctg atcagcctcg actgtgcctt ctagttgcca gccatctgtt 2040

gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc 2100

taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat tctggggggt 2160

ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca tgctggggat 2220

gcggtgggct ctatggcttc tgaggcggaa agaaccagct ggggctctag ggggtatccc 2280

cacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc 2340

gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc 2400

acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt 2460

agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg 2520

ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt 2580

ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta 2640

taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt 2700

aacgcgaatt aattctgtgg aatgtgtgtc agttagggtg tggaaagtcc ccaggctccc 2760

cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccagg tgtggaaagt 2820

ccccaggctc cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca 2880

tagtcccgcc cctaactccg cccatcccgc ccctaactcc gcccagttcc gcccattctc 2940

cgccccatgg ctgactaatt ttttttattt atgcagaggc cgaggccgcc tctgcctctg 3000

agctattcca gaagtagtga ggaggctttt ttggaggcct aggcttttgc aaaaagctcc 3060

cggtctagaa tgaccgagta caagcccacg gtgcgcctcg ccacccgcga cgacgtcccc 3120

cgggccgtac gcaccctcgc cgccgcgttc gccgactacc ccgccacgcg ccacaccgtc 3180

gacccggacc gccacatcga gcgggtcacc gagctgcaag aactcttcct cacgcgcgtc 3240

gggctcgaca tcggcaaggt gtgggtcgcg gacgacggcg ccgcggtggc ggtctggacc 3300

acgccggaga gcgtcgaagc gggggcggtg ttcgccgaga tcggcccgcg catggccgag 3360

ttgagcggtt cccggctggc cgcgcagcaa cagatggaag gcctcctggc gccgcaccgg 3420

cccaaggagc ccgcgtggtt cctggccacc gtcggcgtct cgcccgacca ccagggcaag 3480

ggtctgggca gcgccgtcgt gctccccgga gtggaggcgg ccgagcgcgc cggggtgccc 3540

gccttcctgg agacctccgc gccccgcaac ctccccttct acgagcggct cggcttcacc 3600

gtcaccgccg acgtcgaggt gcccgaagga ccgcgcacct ggtgcatgac ccgcaagccc 3660

ggtgcctaga cgcgtctgga acaatcaacc tctggattac aaaatttgtg aaagattgac 3720

tggtattctt aactatgttg ctccttttac gctatgtgga tacgctgctt taatgccttt 3780

gtatcatgct attgcttccc gtatggcttt cattttctcc tccttgtata aatcctggtt 3840

gctgtctctt tatgaggagt tgtggcccgt tgtcaggcaa cgtggcgtgg tgtgcactgt 3900

gtttgctgac gcaaccccca ctggttgggg cattgccacc acctgtcagc tcctttccgg 3960

gactttcgct ttccccctcc ctattgccac ggcggaactc atcgccgcct gccttgcccg 4020

ctgctggaca ggggctcggc tgttgggcac tgacaattcc gtggtgttgt cggggaagct 4080

gacgtccttt ccatggctgc tcgcctgtgt tgccacctgg attctgcgcg ggacgtcctt 4140

ctgctacgtc ccttcggccc tcaatccagc ggaccttcct tcccgcggcc tgctgccggc 4200

tctgcggcct cttccgcgtc ttcgccttcg ccctcagacg agtcggatct ccctttgggc 4260

cgcctccccg cctggaatta attctgcggc cgcttcctcg ctcactgact cgctgcgctc 4320

ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 4380

agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 4440

ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 4500

caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 4560

gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 4620

cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta 4680

tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 4740

gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 4800

cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 4860

tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagaa cagtatttgg 4920

tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 4980

caaacaaacc accgctggta gcggtttttt tgtttgcaag cagcagatta cgcgcagaaa 5040

aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 5100

aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 5160

tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 5220

cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 5280

catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg 5340

ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat 5400

aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat 5460

ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg 5520

caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc 5580

attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa 5640

agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc 5700

actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt 5760

ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag 5820

ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt 5880

gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag 5940

atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac 6000

cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc 6060

gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca 6120

gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg 6180

ggttccgcg 6189

<210> 43

<211> 10648

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> 载体SY45(CMV_Cas9-PmCDA1,EF1_iRFP)(效应质粒)(Vector SY45(CMV_Cas9-PmCDA1,EF1_iRFP)(Effector plasmid))

<220>

<221> 增强子(enhancer)

<222> (23)..(402)

<223> CMV增强子(CMV enhancer)

<220>

<221> 启动子(promoter)

<222> (403)..(606)

<223> CMV启动子(CMV promoter)

<220>

<221> 启动子(promoter)

<222> (651)..(669)

<223> T7启动子(T7 promoter)

<220>

<221> misc_feature

<222> (689)..(691)

<223> Kozak序列(Kozak sequence)

<220>

<221> misc_signal

<222> (692)..(742)

<223> NLS单元(NLS unit)

<220>

<221> misc_signal

<222> (698)..(718)

<223> SV40 NLS

<220>

<221> 基因(gene)

<222> (743)..(4879)

<223> Cas9

<220>

<221> misc_signal

<222> (4859)..(4879)

<223> SV40 NLS

<220>

<221> misc_structure

<222> (4910)..(5080)

<223> 失效SH3 hs(dead SH3 hs)

<220>

<221> misc_signal

<222> (5087)..(5152)

<223> 3xFLAG hs

<220>

<221> 基因(gene)

<222> (5159)..(5782)

<223> HsPmCDA1

<220>

<221> polyA_信号(polyA_signal)

<222> (5799)..(5920)

<223> SV40 poly(A)信号(SV40 poly(A) signal)

<220>

<221> rep_origin

<222> (6026)..(6614)

<223> ori

<220>

<221> 基因(gene)

<222> (6788)..(7645)

<223> AmpR

<220>

<221> 启动子(promoter)

<222> (7646)..(7750)

<223> AmpR启动子(AmpR promoter)

<220>

<221> 启动子(promoter)

<222> (8145)..(9322)

<223> EF-1alpha启动子(EF-1alpha promoter)

<220>

<221> 内含子(Intron)

<222> (8376)..(9313)

<223> EF-1alpha 内含子A(EF-1alpha intron A)

<220>

<221> 基因(gene)

<222> (9349)..(10284)

<223> iRFP670

<220>

<221> misc_feature

<222> (9349)..(9352)

<223> Kozak序列(Kozak sequence)

<220>

<221> polyA_信号(polyA_signal)

<222> (10314)..(10538)

<223> bGH poly(A)

<400> 43

gggtaacgcc agggtacgcg ttgacattga ttattgacta gttattaata gtaatcaatt 60

acggggtcat tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat 120

ggcccgcctg gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt 180

cccatagtaa cgccaatagg gactttccat tgacgtcaat gggtggagta tttacggtaa 240

actgcccact tggcagtaca tcaagtgtat catatgccaa gtacgccccc tattgacgtc 300

aatgacggta aatggcccgc ctggcattat gcccagtaca tgaccttatg ggactttcct 360

acttggcagt acatctacgt attagtcatc gctattacca tggtgatgcg gttttggcag 420

tacatcaatg ggcgtggata gcggtttgac tcacggggat ttccaagtct ccaccccatt 480

gacgtcaatg ggagtttgtt ttggcaccaa aatcaacggg actttccaaa atgtcgtaac 540

aactccgccc cattgacgca aatgggcggt aggcgtgtac ggtgggaggt ctatataagc 600

agagctctct ggctaactag agaacccact gcttactggc ttatcgaaat taatacgact 660

cactataggg agacccaagc tggctagcga aatggcaccg aagaagaagc gtaaagtcgg 720

aatccacgga gttcctgcgg caatggacaa gaagtactcc attgggctcg atatcggcac 780

aaacagcgtc ggttgggccg tcattacgga cgagtacaag gtgccgagca aaaaattcaa 840

agttctgggc aataccgatc gccacagcat aaagaagaac ctcattggcg ccctcctgtt 900

cgactccggg gagacggccg aagccacgcg gctcaaaaga acagcacggc gcagatatac 960

ccgcagaaag aatcggatct gctacctgca ggagatcttt agtaatgaga tggctaaggt 1020

ggatgactct ttcttccata ggctggagga gtcctttttg gtggaggagg ataaaaagca 1080

cgagcgccac ccaatctttg gcaatatcgt ggacgaggtg gcgtaccatg aaaagtaccc 1140

aaccatatat catctgagga agaagcttgt agacagtact gataaggctg acttgcggtt 1200

gatctatctc gcgctggcgc atatgatcaa atttcgggga cacttcctca tcgaggggga 1260

cctgaaccca gacaacagcg atgtcgacaa actctttatc caactggttc agacttacaa 1320

tcagcttttc gaagagaacc cgatcaacgc atccggagtt gacgccaaag caatcctgag 1380

cgctaggctg tccaaatccc ggcggctcga aaacctcatc gcacagctcc ctggggagaa 1440

gaagaacggc ctgtttggta atcttatcgc cctgtcactc gggctgaccc ccaactttaa 1500

atctaacttc gacctggccg aagatgccaa gcttcaactg agcaaagaca cctacgatga 1560

tgatctcgac aatctgctgg cccagatcgg cgaccagtac gcagaccttt ttttggcggc 1620

aaagaacctg tcagacgcca ttctgctgag tgatattctg cgagtgaaca cggagatcac 1680

caaagctccg ctgagcgcta gtatgatcaa gcgctatgat gagcaccacc aagacttgac 1740

tttgctgaag gcccttgtca gacagcaact gcctgagaag tacaaggaaa ttttcttcga 1800

tcagtctaaa aatggctacg ccggatacat tgacggcgga gcaagccagg aggaatttta 1860

caaatttatt aagcccatct tggaaaaaat ggacggcacc gaggagctgc tggtaaagct 1920

taacagagaa gatctgttgc gcaaacagcg cactttcgac aatggaagca tcccccacca 1980

gattcacctg ggcgaactgc acgctatcct caggcggcaa gaggatttct accccttttt 2040

gaaagataac agggaaaaga ttgagaaaat cctcacattt cggataccct actatgtagg 2100

ccccctcgcc cggggaaatt ccagattcgc gtggatgact cgcaaatcag aagagaccat 2160

cactccctgg aacttcgagg aagtcgtgga taagggggcc tctgcccagt ccttcatcga 2220

aaggatgact aactttgata aaaatctgcc taacgaaaag gtgcttccta aacactctct 2280

gctgtacgag tacttcacag tttataacga gctcaccaag gtcaaatacg tcacagaagg 2340

gatgagaaag ccagcattcc tgtctggaga gcagaagaaa gctatcgtgg acctcctctt 2400

caagacgaac cggaaagtta ccgtgaaaca gctcaaagaa gactatttca aaaagattga 2460

atgtttcgac tctgttgaaa tcagcggagt ggaggatcgc ttcaacgcat ccctgggaac 2520

gtatcacgat ctcctgaaaa tcattaaaga caaggacttc ctggacaatg aggagaacga 2580

ggacattctt gaggacattg tcctcaccct tacgttgttt gaagataggg agatgattga 2640

agaacgcttg aaaacttacg ctcatctctt cgacgacaaa gtcatgaaac agctcaagag 2700

gcgccgatat acaggatggg ggcggctgtc aagaaaactg atcaatggga tccgagacaa 2760

gcagagtgga aagacaatcc tggattttct taagtccgat ggatttgcca accggaactt 2820

catgcagttg atccatgatg actctctcac ctttaaggag gacatccaga aagcacaagt 2880

ttctggccag ggggacagtc ttcacgagca catcgctaat cttgcaggta gcccagctat 2940

caaaaaggga atactgcaga ccgttaaggt cgtggatgaa ctcgtcaaag taatgggaag 3000

gcataagccc gagaatatcg ttatcgagat ggcccgagag aaccaaacta cccagaaggg 3060

acagaagaac agtagggaaa ggatgaagag gattgaagag ggtataaaag aactggggtc 3120

ccaaatcctt aaggaacacc cagttgaaaa cacccagctt cagaatgaga agctctacct 3180

gtactacctg cagaacggca gggacatgta cgtggatcag gaactggaca tcaatcggct 3240

ctccgactac gacgtggatc atatcgtgcc ccagtctttt ctcaaagatg attctattga 3300

taataaagtg ttgacaagat ccgataaaaa tagagggaag agtgataacg tcccctcaga 3360

agaagttgtc aagaaaatga aaaattattg gcggcagctg ctgaacgcca aactgatcac 3420

acaacggaag ttcgataatc tgactaaggc tgaacgaggt ggcctgtctg agttggataa 3480

agccggcttc atcaaaaggc agcttgttga gacacgccag atcaccaagc acgtggccca 3540

aattctcgat tcacgcatga acaccaagta cgatgaaaat gacaaactga ttcgagaggt 3600

gaaagttatt actctgaagt ctaagctggt ctcagatttc agaaaggact ttcagtttta 3660

taaggtgaga gagatcaaca attaccacca tgcgcatgat gcctacctga atgcagtggt 3720

aggcactgca cttatcaaaa aatatcccaa gcttgaatct gaatttgttt acggagacta 3780

taaagtgtac gatgttagga aaatgatcgc aaagtctgag caggaaatag gcaaggccac 3840

cgctaagtac ttcttttaca gcaatattat gaattttttc aagaccgaga ttacactggc 3900

caatggagag attcggaagc gaccacttat cgaaacaaac ggagaaacag gagaaatcgt 3960

gtgggacaag ggtagggatt tcgcgacagt ccggaaggtc ctgtccatgc cgcaggtgaa 4020

catcgttaaa aagaccgaag tacagaccgg aggcttctcc aaggaaagta tcctcccgaa 4080

aaggaacagc gacaagctga tcgcacgcaa aaaagattgg gaccccaaga aatacggcgg 4140

attcgattct cctacagtcg cttacagtgt actggttgtg gccaaagtgg agaaagggaa 4200

gtctaaaaaa ctcaaaagcg tcaaggaact gctgggcatc acaatcatgg agcgatcaag 4260

cttcgaaaaa aaccccatcg actttctcga ggcgaaagga tataaagagg tcaaaaaaga 4320

cctcatcatt aagcttccca agtactctct ctttgagctt gaaaacggcc ggaaacgaat 4380

gctcgctagt gcgggcgagc tgcagaaagg taacgagctg gcactgccct ctaaatacgt 4440

taatttcttg tatctggcca gccactatga aaagctcaaa gggtctcccg aagataatga 4500

gcagaagcag ctgttcgtgg aacaacacaa acactacctt gatgagatca tcgagcaaat 4560

aagcgaattc tccaaaagag tgatcctcgc cgacgctaac ctcgataagg tgctttctgc 4620

ttacaataag cacagggata agcccatcag ggagcaggca gaaaacatta tccacttgtt 4680

tactctgacc aacttgggcg cgcctgcagc cttcaagtac ttcgacacca ccatagacag 4740

aaagcggtac acctctacaa aggaggtcct ggacgccaca ctgattcatc agtcaattac 4800

ggggctctat gaaacaagaa tcgacctctc tcagctcggt ggagacagca gggctgaccc 4860

caagaagaag aggaaggtgg gtggaggagg taccggcggt ggaggctcag cagaatacgt 4920

acgagctctg tttgacttca atgggaatga cgaggaggat ctccccttta agaagggcga 4980

tattctccgc atcagagata agcccgaaga acaatggtgg aatgccgagg atagcgaagg 5040

gaaaaggggc atgattctgg tgccatatgt ggagaaatat tccggtgact acaaagacca 5100

tgatggggat tacaaagacc acgacatcga ctacaaagac gacgacgata aatcagggat 5160

gacagacgcc gagtacgtgc gcattcatga gaaactggat atttacacct tcaagaagca 5220

gttcttcaac aacaagaaat ctgtgtcaca ccgctgctac gtgctgtttg agttgaagcg 5280

aaggggcgaa agaagggctt gcttttgggg ctatgccgtc aacaagcccc aaagtggcac 5340

cgagagagga atacacgctg agatattcag tatccgaaag gtggaagagt atcttcggga 5400

taatcctggg cagtttacga tcaactggta ttccagctgg agtccttgcg ctgattgtgc 5460

cgagaaaatt ctggaatggt ataatcagga acttcgggga aacgggcaca cattgaaaat 5520

ctgggcctgc aagctgtact acgagaagaa tgcccggaac cagataggac tctggaatct 5580

gagggacaat ggtgtaggcc tgaacgtgat ggtttccgag cactatcagt gttgtcggaa 5640

gattttcatc caaagctctc ataaccagct caatgaaaac cgctggttgg agaaaacact 5700

gaaacgtgcg gagaagcgga gatccgagct gagcatcatg atccaggtca agattctgca 5760

taccactaag tctccagccg tttagcttcg cccaccccaa cttgtttatt gcagcttata 5820

atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc 5880

attctagttg tggtttgtcc aaactcatca atgtatctta gcggccgcca ccgcggtgga 5940

gctccagctt ttgttccctt tagtgagggt taattgcgcg ccagcaaaag gccaggaacc 6000

gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 6060

aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 6120

ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 6180

tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 6240

tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 6300

ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 6360

tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 6420

ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 6480

tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 6540

aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 6600

aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 6660

aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 6720

ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 6780

acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 6840

ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 6900

gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 6960

taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 7020

tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 7080

gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 7140

cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 7200

aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 7260

cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 7320

tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 7380

gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 7440

tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 7500

gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 7560

ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 7620

cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 7680

agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 7740

gggttccgcg cacatttccc cgaaaagtgc cacctaaatt gtaagcgtta atattttgtt 7800

aaaattcgcg ttaaattttt gttaaatcag ctcatttttt aaccaatagg ccgaaatcgg 7860

caaaatccct tataaatcaa aagaatagac cgagataggg ttgagtgttg ttccagtttg 7920

gaacaagagt ccactattaa agaacgtgga ctccaacgtc aaagggcgaa aaaccgtcta 7980

tcagggcgat ggcccactac gtgaaccatc accctaatca agttttttgg ggtcgaggtg 8040

ccgtaaagca ctaaatcgga accctaaagg gagcccccga tttagagctt gacggggaaa 8100

gccgcagcta atggaccttc taggtcttga aaggagtggg aattggctcc ggtgcccgtc 8160

agtgggcaga gcgcacatcg cccacagtcc ccgagaagtt ggggggaggg gtcggcaatt 8220

gaaccggtgc ctagagaagg tggcgcgggg taaactggga aagtgatgtc gtgtactggc 8280

tccgcctttt tcccgagggt gggggagaac cgtatataag tgcagtagtc gccgtgaacg 8340

ttctttttcg caacgggttt gccgccagaa cacaggtaag tgccgtgtgt ggttcccgcg 8400

ggcctggcct ctttacgggt tatggccctt gcgtgccttg aattacttcc actggctgca 8460

gtacgtgatt cttgatcccg agcttcgggt tggaagtggg tgggagagtt cgaggccttg 8520

cgcttaagga gccccttcgc ctcgtgcttg agttgaggcc tggcctgggc gctggggccg 8580

ccgcgtgcga atctggtggc accttcgcgc ctgtctcgct gctttcgata agtctctagc 8640

catttaaaat ttttgatgac ctgctgcgac gctttttttc tggcaagata gtcttgtaaa 8700

tgcgggccaa gatctgcaca ctggtatttc ggtttttggg gccgcgggcg gcgacggggc 8760

ccgtgcgtcc cagcgcacat gttcggcgag gcggggcctg cgagcgcggc caccgagaat 8820

cggacggggg tagtctcaag ctggccggcc tgctctggtg cctggcctcg cgccgccgtg 8880

tatcgccccg ccctgggcgg caaggctggc ccggtcggca ccagttgcgt gagcggaaag 8940

atggccgctt cccggccctg ctgcagggag ctcaaaatgg aggacgcggc gctcgggaga 9000

gcgggcgggt gagtcaccca cacaaaggaa aagggccttt ccgtcctcag ccgtcgcttc 9060

atgtgactcc acggagtacc gggcgccgtc caggcacctc gattagttct cgagcttttg 9120

gagtacgtcg tctttaggtt ggggggaggg gttttatgcg atggagtttc cccacactga 9180

gtgggtggag actgaagtta ggccagcttg gcacttgatg taattctcct tggaatttgc 9240

cctttttgag tttggatctt ggttcattct caagcctcag acagtggttc aaagtttttt 9300

tcttccattt caggtgtcgt gaggaatttc gacccggatc cggccaccat ggcgcgtaag 9360

gtcgatctca cctcctgcga tcgcgagccg atccacatcc ccggcagcat tcagccgtgc 9420

ggctgcctgc tagcctgcga cgcgcaggcg gtgcggatca cgcgcattac ggaaaatgcc 9480

ggcgcgttct ttggacgcga aactccgcgg gtcggtgagc tactcgccga ttacttcggc 9540

gagaccgaag cccatgcgct gcgcaacgca ctggcgcagt cctccgatcc aaagcgaccg 9600

gcgctgatct tcggttggcg cgacggcctg accggccgca ccttcgacat ctcactgcat 9660

cgccatgacg gtacatcgat catcgagttc gagcctgcgg cggccgaaca ggccgacaat 9720

ccgctgcggc tgacgcggca gatcatcgcg cgcaccaaag aactgaagtc gctcgaagag 9780

atggccgcac gggtgccgcg ctatctgcag gcgatgctcg gctatcaccg cgtgatgttg 9840

taccgcttcg cggacgacgg ctccgggatg gtgatcggcg aggcgaagcg cagcgacctc 9900

gagagctttc tcggtcagca ctttccggcg tcgctggtcc cgcagcaggc gcggctactg 9960

tacttgaaga acgcgatccg cgtggtctcg gattcgcgcg gcatcagcag ccggatcgtg 10020

cccgagcacg acgcctccgg cgccgcgctc gatctgtcgt tcgcgcacct gcgcagcatc 10080

tcgccctgcc atctcgaatt tctgcggaac atgggcgtca gcgcctcgat gtcgctgtcg 10140

atcatcattg acggcacgct atggggattg atcatctgtc atcattacga gccgcgtgcc 10200

gtgccgatgg cgcagcgcgt cgcggccgaa atgttcgccg acttcttatc gctgcacttc 10260

accgccgccc accaccaacg ctaagcggcc gcgactctaa ccggtctcag aagccataga 10320

gcccaccgca tccccagcat gcctgctatt gtcttcccaa tcctccccct tgctgtcctg 10380

ccccacccca ccccccagaa tagaatgaca cctactcaga caatgcgatg caatttcctc 10440

attttattag gaaaggacag tgggagtggc accttccagg gtcaaggaag gcacggggga 10500

ggggcaaaca acagatggct ggcaactaga aggcacagtc gaggctgatc attcaggctg 10560

cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa 10620

gggggatgtg ctgcaaggcg attaagtt 10648

<210> 44

<211> 10120

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> 载体SY45(CMV_Cas9,EF1_iRFP)(效应质粒)(Vector SY45(CMV_Cas9,EF1_iRFP)(Effector plasmid))

<220>

<221> 启动子(promoter)

<222> (76)..(1253)

<223> EF-1alpha启动子(EF-1alpha promoter)

<220>

<221> 内含子(Intron)

<222> (307)..(1244)

<223> EF-1alpha 内含子A(EF-1alpha intron A)

<220>

<221> 基因(gene)

<222> (1280)..(2215)

<223> iRFP670

<220>

<221> misc_feature

<222> (1280)..(1283)

<223> Kozak序列(Kozak sequence)

<220>

<221> polyA_信号(polyA_signal)

<222> (2245)..(2469)

<223> bGH poly(A)

<220>

<221> 启动子(promoter)

<222> (2677)..(2905)

<223> H1启动子(H1 promoter)

<220>

<221> misc_feature

<222> (2925)..(2925)

<223> 靶1(target1)

<220>

<221> misc_structure

<222> (2926)..(3001)

<223> gRNA支架(gRNA scaffold)

<220>

<221> 增强子(enhancer)

<222> (3016)..(3395)

<223> CMV增强子(CMV enhancer)

<220>

<221> 增强子(promoter)

<222> (3396)..(3599)

<223> CMV增强子(CMV promoter)

<220>

<221> misc_signal

<222> (3646)..(3696)

<223> NLS单元(NLS unit)

<220>

<221> misc_signal

<222> (3652)..(3672)

<223> SV40 NLS

<220>

<221> 基因(gene)

<222> (3697)..(7836)

<223> Cas9

<220>

<221> misc_signal

<222> (7813)..(7833)

<223> SV40 NLS

<220>

<221> polyA_信号(polyA_signal)

<222> (7850)..(7971)

<223> SV40 poly(A)信号(SV40 poly(A) signal)

<220>

<221> rep_origin

<222> (8077)..(8665)

<223> ori

<220>

<221> 基因(gene)

<222> (8839)..(9696)

<223> AmpR

<220>

<221> 启动子(promoter)

<222> (9697)..(9801)

<223> AmpR启动子(AmpR promoter)

<400> 44

ggagcccccg atttagagct tgacggggaa agccgcagct aatggacctt ctaggtcttg 60

aaaggagtgg gaattggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc 120

cccgagaagt tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg 180

gtaaactggg aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa 240

ccgtatataa gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga 300

acacaggtaa gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct 360

tgcgtgcctt gaattacttc cactggctgc agtacgtgat tcttgatccc gagcttcggg 420

ttggaagtgg gtgggagagt tcgaggcctt gcgcttaagg agccccttcg cctcgtgctt 480

gagttgaggc ctggcctggg cgctggggcc gccgcgtgcg aatctggtgg caccttcgcg 540

cctgtctcgc tgctttcgat aagtctctag ccatttaaaa tttttgatga cctgctgcga 600

cgcttttttt ctggcaagat agtcttgtaa atgcgggcca agatctgcac actggtattt 660

cggtttttgg ggccgcgggc ggcgacgggg cccgtgcgtc ccagcgcaca tgttcggcga 720

ggcggggcct gcgagcgcgg ccaccgagaa tcggacgggg gtagtctcaa gctggccggc 780

ctgctctggt gcctggcctc gcgccgccgt gtatcgcccc gccctgggcg gcaaggctgg 840

cccggtcggc accagttgcg tgagcggaaa gatggccgct tcccggccct gctgcaggga 900

gctcaaaatg gaggacgcgg cgctcgggag agcgggcggg tgagtcaccc acacaaagga 960

aaagggcctt tccgtcctca gccgtcgctt catgtgactc cacggagtac cgggcgccgt 1020

ccaggcacct cgattagttc tcgagctttt ggagtacgtc gtctttaggt tggggggagg 1080

ggttttatgc gatggagttt ccccacactg agtgggtgga gactgaagtt aggccagctt 1140

ggcacttgat gtaattctcc ttggaatttg ccctttttga gtttggatct tggttcattc 1200

tcaagcctca gacagtggtt caaagttttt ttcttccatt tcaggtgtcg tgaggaattt 1260

cgacccggat ccggccacca tggcgcgtaa ggtcgatctc acctcctgcg atcgcgagcc 1320

gatccacatc cccggcagca ttcagccgtg cggctgcctg ctagcctgcg acgcgcaggc 1380

ggtgcggatc acgcgcatta cggaaaatgc cggcgcgttc tttggacgcg aaactccgcg 1440

ggtcggtgag ctactcgccg attacttcgg cgagaccgaa gcccatgcgc tgcgcaacgc 1500

actggcgcag tcctccgatc caaagcgacc ggcgctgatc ttcggttggc gcgacggcct 1560

gaccggccgc accttcgaca tctcactgca tcgccatgac ggtacatcga tcatcgagtt 1620

cgagcctgcg gcggccgaac aggccgacaa tccgctgcgg ctgacgcggc agatcatcgc 1680

gcgcaccaaa gaactgaagt cgctcgaaga gatggccgca cgggtgccgc gctatctgca 1740

ggcgatgctc ggctatcacc gcgtgatgtt gtaccgcttc gcggacgacg gctccgggat 1800

ggtgatcggc gaggcgaagc gcagcgacct cgagagcttt ctcggtcagc actttccggc 1860

gtcgctggtc ccgcagcagg cgcggctact gtacttgaag aacgcgatcc gcgtggtctc 1920

ggattcgcgc ggcatcagca gccggatcgt gcccgagcac gacgcctccg gcgccgcgct 1980

cgatctgtcg ttcgcgcacc tgcgcagcat ctcgccctgc catctcgaat ttctgcggaa 2040

catgggcgtc agcgcctcga tgtcgctgtc gatcatcatt gacggcacgc tatggggatt 2100

gatcatctgt catcattacg agccgcgtgc cgtgccgatg gcgcagcgcg tcgcggccga 2160

aatgttcgcc gacttcttat cgctgcactt caccgccgcc caccaccaac gctaagcggc 2220

cgcgactcta accggtctca gaagccatag agcccaccgc atccccagca tgcctgctat 2280

tgtcttccca atcctccccc ttgctgtcct gccccacccc accccccaga atagaatgac 2340

acctactcag acaatgcgat gcaatttcct cattttatta ggaaaggaca gtgggagtgg 2400

caccttccag ggtcaaggaa ggcacggggg aggggcaaac aacagatggc tggcaactag 2460

aaggcacagt cgaggctgat cattcaggct gcgcaactgt tgggaagggc gatcggtgcg 2520

ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgcaaggc gattaagttg 2580

ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg agcgcgcgta 2640

atacgactca ctatagggcg aattgggtac cgggccaatt cgaacgctga cgtcatcaac 2700

ccgctccaag gaatcgcggg cccagtgtca ctaggcggga acacccagcg cgcgtgcgcc 2760

ctggcaggaa gatggctgtg agggacaggg gagtggcgcc ctgcaatatt tgcatgtcgc 2820

tatgtgttct gggaaatcac cataaacgtg aaatgtcttt ggatttggga atcttataag 2880

ttctgtatga ggaccacaga tccccagaag agccggcgct cttcagtttt agagctagaa 2940

atagcaagtt aaaataaggc tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg 3000

ctttttttac gcgttgacat tgattattga ctagttatta atagtaatca attacggggt 3060

cattagttca tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc 3120

ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag 3180

taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc 3240

acttggcagt acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg 3300

gtaaatggcc cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc 3360

agtacatcta cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca 3420

atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca 3480

atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg 3540

ccccattgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc 3600

tctggctaac tagagaaccc actgcttact ggcttatcgg ccaccatggc accgaagaag 3660

aagcgtaaag tcggaatcca cggagttcct gcggcaatgg acaagaagta ctccattggg 3720

ctcgatatcg gcacaaacag cgtcggttgg gccgtcatta cggacgagta caaggtgccg 3780

agcaaaaaat tcaaagttct gggcaatacc gatcgccaca gcataaagaa gaacctcatt 3840

ggcgccctcc tgttcgactc cggggagacg gccgaagcca cgcggctcaa aagaacagca 3900

cggcgcagat atacccgcag aaagaatcgg atctgctacc tgcaggagat ctttagtaat 3960

gagatggcta aggtggatga ctctttcttc cataggctgg aggagtcctt tttggtggag 4020

gaggataaaa agcacgagcg ccacccaatc tttggcaata tcgtggacga ggtggcgtac 4080

catgaaaagt acccaaccat atatcatctg aggaagaagc ttgtagacag tactgataag 4140

gctgacttgc ggttgatcta tctcgcgctg gcgcatatga tcaaatttcg gggacacttc 4200

ctcatcgagg gggacctgaa cccagacaac agcgatgtcg acaaactctt tatccaactg 4260

gttcagactt acaatcagct tttcgaagag aacccgatca acgcatccgg agttgacgcc 4320

aaagcaatcc tgagcgctag gctgtccaaa tcccggcggc tcgaaaacct catcgcacag 4380

ctccctgggg agaagaagaa cggcctgttt ggtaatctta tcgccctgtc actcgggctg 4440

acccccaact ttaaatctaa cttcgacctg gccgaagatg ccaagcttca actgagcaaa 4500

gacacctacg atgatgatct cgacaatctg ctggcccaga tcggcgacca gtacgcagac 4560

ctttttttgg cggcaaagaa cctgtcagac gccattctgc tgagtgatat tctgcgagtg 4620

aacacggaga tcaccaaagc tccgctgagc gctagtatga tcaagcgcta tgatgagcac 4680

caccaagact tgactttgct gaaggccctt gtcagacagc aactgcctga gaagtacaag 4740

gaaattttct tcgatcagtc taaaaatggc tacgccggat acattgacgg cggagcaagc 4800

caggaggaat tttacaaatt tattaagccc atcttggaaa aaatggacgg caccgaggag 4860

ctgctggtaa agcttaacag agaagatctg ttgcgcaaac agcgcacttt cgacaatgga 4920

agcatccccc accagattca cctgggcgaa ctgcacgcta tcctcaggcg gcaagaggat 4980

ttctacccct ttttgaaaga taacagggaa aagattgaga aaatcctcac atttcggata 5040

ccctactatg taggccccct cgcccgggga aattccagat tcgcgtggat gactcgcaaa 5100

tcagaagaga ccatcactcc ctggaacttc gaggaagtcg tggataaggg ggcctctgcc 5160

cagtccttca tcgaaaggat gactaacttt gataaaaatc tgcctaacga aaaggtgctt 5220

cctaaacact ctctgctgta cgagtacttc acagtttata acgagctcac caaggtcaaa 5280

tacgtcacag aagggatgag aaagccagca ttcctgtctg gagagcagaa gaaagctatc 5340

gtggacctcc tcttcaagac gaaccggaaa gttaccgtga aacagctcaa agaagactat 5400

ttcaaaaaga ttgaatgttt cgactctgtt gaaatcagcg gagtggagga tcgcttcaac 5460

gcatccctgg gaacgtatca cgatctcctg aaaatcatta aagacaagga cttcctggac 5520

aatgaggaga acgaggacat tcttgaggac attgtcctca cccttacgtt gtttgaagat 5580

agggagatga ttgaagaacg cttgaaaact tacgctcatc tcttcgacga caaagtcatg 5640

aaacagctca agaggcgccg atatacagga tgggggcggc tgtcaagaaa actgatcaat 5700

gggatccgag acaagcagag tggaaagaca atcctggatt ttcttaagtc cgatggattt 5760

gccaaccgga acttcatgca gttgatccat gatgactctc tcacctttaa ggaggacatc 5820

cagaaagcac aagtttctgg ccagggggac agtcttcacg agcacatcgc taatcttgca 5880

ggtagcccag ctatcaaaaa gggaatactg cagaccgtta aggtcgtgga tgaactcgtc 5940

aaagtaatgg gaaggcataa gcccgagaat atcgttatcg agatggcccg agagaaccaa 6000

actacccaga agggacagaa gaacagtagg gaaaggatga agaggattga agagggtata 6060

aaagaactgg ggtcccaaat ccttaaggaa cacccagttg aaaacaccca gcttcagaat 6120

gagaagctct acctgtacta cctgcagaac ggcagggaca tgtacgtgga tcaggaactg 6180

gacatcaatc ggctctccga ctacgacgtg gatcatatcg tgccccagtc ttttctcaaa 6240

gatgattcta ttgataataa agtgttgaca agatccgata aaaatagagg gaagagtgat 6300

aacgtcccct cagaagaagt tgtcaagaaa atgaaaaatt attggcggca gctgctgaac 6360

gccaaactga tcacacaacg gaagttcgat aatctgacta aggctgaacg aggtggcctg 6420

tctgagttgg ataaagccgg cttcatcaaa aggcagcttg ttgagacacg ccagatcacc 6480

aagcacgtgg cccaaattct cgattcacgc atgaacacca agtacgatga aaatgacaaa 6540

ctgattcgag aggtgaaagt tattactctg aagtctaagc tggtctcaga tttcagaaag 6600

gactttcagt tttataaggt gagagagatc aacaattacc accatgcgca tgatgcctac 6660

ctgaatgcag tggtaggcac tgcacttatc aaaaaatatc ccaagcttga atctgaattt 6720

gtttacggag actataaagt gtacgatgtt aggaaaatga tcgcaaagtc tgagcaggaa 6780

ataggcaagg ccaccgctaa gtacttcttt tacagcaata ttatgaattt tttcaagacc 6840

gagattacac tggccaatgg agagattcgg aagcgaccac ttatcgaaac aaacggagaa 6900

acaggagaaa tcgtgtggga caagggtagg gatttcgcga cagtccggaa ggtcctgtcc 6960

atgccgcagg tgaacatcgt taaaaagacc gaagtacaga ccggaggctt ctccaaggaa 7020

agtatcctcc cgaaaaggaa cagcgacaag ctgatcgcac gcaaaaaaga ttgggacccc 7080

aagaaatacg gcggattcga ttctcctaca gtcgcttaca gtgtactggt tgtggccaaa 7140

gtggagaaag ggaagtctaa aaaactcaaa agcgtcaagg aactgctggg catcacaatc 7200

atggagcgat caagcttcga aaaaaacccc atcgactttc tcgaggcgaa aggatataaa 7260

gaggtcaaaa aagacctcat cattaagctt cccaagtact ctctctttga gcttgaaaac 7320

ggccggaaac gaatgctcgc tagtgcgggc gagctgcaga aaggtaacga gctggcactg 7380

ccctctaaat acgttaattt cttgtatctg gccagccact atgaaaagct caaagggtct 7440

cccgaagata atgagcagaa gcagctgttc gtggaacaac acaaacacta ccttgatgag 7500

atcatcgagc aaataagcga attctccaaa agagtgatcc tcgccgacgc taacctcgat 7560

aaggtgcttt ctgcttacaa taagcacagg gataagccca tcagggagca ggcagaaaac 7620

attatccact tgtttactct gaccaacttg ggcgcgcctg cagccttcaa gtacttcgac 7680

accaccatag acagaaagcg gtacacctct acaaaggagg tcctggacgc cacactgatt 7740

catcagtcaa ttacggggct ctatgaaaca agaatcgacc tctctcagct cggtggagac 7800

agcagggctg accccaagaa gaagaggaag gtgtagcttc gcccacccca acttgtttat 7860

tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt 7920

tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt agcggccgcc 7980

accgcggtgg agctccagct tttgttccct ttagtgaggg ttaattgcgc gccagcaaaa 8040

ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga 8100

cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag 8160

ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct 8220

taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg 8280

ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc 8340

ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt 8400

aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta 8460

tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaagaac 8520

agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc 8580

ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat 8640

tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc 8700

tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt 8760

cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta 8820

aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct 8880

atttcgttca tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg 8940

cttaccatct ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga 9000

tttatcagca ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt 9060

atccgcctcc atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt 9120

taatagtttg cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt 9180

tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat 9240

gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc 9300

cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc 9360

cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat 9420

gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag 9480

aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt 9540

accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc 9600

ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa 9660

gggaataagg gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg 9720

aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa 9780

taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctaaat tgtaagcgtt 9840

aatattttgt taaaattcgc gttaaatttt tgttaaatca gctcattttt taaccaatag 9900

gccgaaatcg gcaaaatccc ttataaatca aaagaataga ccgagatagg gttgagtgtt 9960

gttccagttt ggaacaagag tccactatta aagaacgtgg actccaacgt caaagggcga 10020

aaaaccgtct atcagggcga tggcccacta cgtgaaccat caccctaatc aagttttttg 10080

gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag 10120

<210> 45

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> eGFP开关靶(eGFP switch target)

<400> 45

taccggccca gttggaatgt aggtggtg 28

<210> 46

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> eGFP开关靶(eGFP switch target)

<400> 46

taccggccca gttggaatgt agatggtg 28

<210> 47

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> PCR引物(PCR Primer)

<400> 47

ttctgcttgt cggccatgat 20

<210> 48

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> PCR引物(PCR Primer)

<400> 48

aggcaaggct tgaccgacaa tt 22

Claims

1.一种改变细胞具有的双链DNA的目标部位的方法，其中，包括以下工序：使与选择的双链DNA中的目标核苷酸序列特异性结合的核酸序列识别模块和核酸碱基转换酶或DNA糖苷酶结合而成的复合体、包含插入序列的供体DNA与所述双链DNA接触，将所述目标部位置换为所述插入序列或者在所述目标部位插入所述插入序列，在所述目标部位不会切断所述双链DNA的至少一条链。

2.如权利要求1所述的方法，其中，所述供体DNA包含与目标部位的邻接区域相同的序列。

3.如权利要求1或2所述的方法，其中，所述核酸序列识别模块选自由Cas效应蛋白质的至少一种DNA切断能力失活的CRISPR-Cas系统、锌指基序、TAL效应因子以及PPR基序组成的组。

4.如权利要求1～3中任一项所述的方法，其中，所述核酸序列识别模块是Cas效应蛋白质的两种DNA切断能力中的仅一种DNA切断能力失活的CRISPR-Cas系统。

5.如权利要求1～3中任一项所述的方法，其中，所述核酸序列识别模块是Cas效应蛋白质的两种DNA切断能力失活的CRISPR-Cas系统。

6.如权利要求1～5中任一项所述的方法，其中，所述核酸碱基转换酶为脱氨酶。

7.如权利要求6所述的方法，其中，所述脱氨酶为胞苷脱氨酶。

8.如权利要求7所述的方法，其中，所述胞苷脱氨酶为PmCDA1。

9.如权利要求1～8中任一项所述的方法，其中，双链DNA与复合体的接触通过向所述细胞导入编码所述复合体的核酸来进行。

10.如权利要求1～9中任一项所述的方法，其中，所述细胞为原核生物细胞或真核生物细胞。

11.如权利要求10所述的方法，其中，所述细胞为微生物细胞。

12.如权利要求10所述的方法，其中，所述细胞为植物细胞、昆虫细胞或动物细胞。

13.如权利要求12所述的方法，其中，所述动物细胞为脊椎动物细胞。

14.如权利要求13所述的方法，其中，所述脊椎动物细胞为哺乳类动物细胞。