CN114921439A

CN114921439A - CRISPR-Cas效应子蛋白、其基因编辑系统及应用

Info

Publication number: CN114921439A
Application number: CN202210681597.5A
Authority: CN
Inventors: 张红玲; 任文丹
Original assignee: Yaotang Shanghai Biotechnology Co ltd
Current assignee: Yaotang Shanghai Biotechnology Co ltd
Priority date: 2022-06-16
Filing date: 2022-06-16
Publication date: 2022-08-19
Anticipated expiration: 2042-06-16
Also published as: WO2023241669A1; CN114921439B

Abstract

本发明提供了一种CRISPR‑Cas效应子蛋白、其基因编辑系统及应用。其中，CRISPR‑Cas效应子蛋白包括与SEQ ID NO：1至5中任一项所述的氨基酸序列具有至少70％同一性的蛋白。能够解决现有技术中的CRISPR/Cas系统切割效率低的问题，适用于基因编辑领域。

Description

CRISPR-Cas效应子蛋白、其基因编辑系统及应用

技术领域

本发明涉及基因编辑领域，具体而言，涉及一种CRISPR-Cas效应子蛋白、其基因编辑系统及应用。

背景技术

Clustered regularly interspaced short palindromic repeats(CRISPR)系统,是细菌和古细菌为了防御入侵噬菌体的DNA而形成的。CRISPR系统的免疫干扰过程主要包括3个阶段：适应、表达和干扰。适应阶段，CRISPR系统会将来自噬菌体或质粒的DNA短片段整合到前导序列和第一段重复序列之间，每一次整合都伴随着重复序列的复制，进而形成一个新的重复-间隔序列单元。表达阶段，CRISPR基因座会被转录成一段CRISPR RNA(crRNA)前体(pre-crRNA)，该前体在Cas蛋白和tracrRNA的存在下会在重复序列处被进一步加工成小的crRNA。成熟的crRNA与Cas蛋白形成Cas/crRNA复合体。干扰阶段，crRNA通过其与靶序列互补的区域引导Cas/crRNA复合体寻找靶点，并在靶点位置通过Cas蛋白的核酸酶活性造成靶点位置的双链DNA断裂，从而使靶标DNA失去原有功能。

CRISPR系统分为I，II，III型三个家族，其中II型系统最常见的为CRISPR/Cas9系统，Cas9蛋白可在反式编码小RNA(trans-encoded small RNA，tracrRNA)的协助下将pre-crRNA加工成与tracrRNA结合的成熟crRNA。之后，人们发现通过人工构建模拟crRNA：tracrRNA复合体的单链嵌合体引导RNA(guide RNA)，即可有效的介导Cas9蛋白对靶点的识别和切割。其中与靶点3′端紧邻的3个碱基必须是5′-NGG-3′的形式，从而构成Cas/crRNA复合体识别靶点所需的PAM(protospacer adjacent motif)结构。然而目前存在的不同的CRISPR/Cas各有不同的优点和缺陷。例如Cas9,C2c1和CasX均需要两条RNA进行向导RNA。常见的Cas9，C2c1,CasY和Cpf1通常大小在1300个氨基酸左右。此外，Cas9，Cpf1，CasX，CasY的PAM序列都复杂多样。且现有的CRISPR/Cas系统均存在脱靶效应严重、切割效率低等问题，因此开发脱靶效应低、切割效率高的新型CRISPR/Cas系统具有重要意义。

发明内容

本发明的主要目的在于提供一种CRISPR-Cas效应子蛋白、其基因编辑系统及应用，以解决现有技术中的CRISPR/Cas系统切割效率低的问题。

为了实现上述目的，根据本发明的第一个方面，提供了一种CRISPR-Cas效应子蛋白，该CRISPR-Cas效应子蛋白包括与SEQ ID NO：1至5中任一项的氨基酸序列具有至少70％同一性的蛋白。

进一步地，CRISPR-Cas效应子蛋白包括与SEQ ID NO：1至5中任一项的氨基酸序列具有80％以上，优选90％以上，更优选95％以上，进一步优选99％以上同一性的蛋白；优选地，CRISPR-Cas效应子蛋白包括RuvC结构域。

进一步地，CRISPR-Cas效应子蛋白包括：a)SEQ ID NO：1至5中任一项所示的蛋白；或b)以SEQ ID NO：1所示的氨基酸序列为基础，进行如下一种或多种点突变的蛋白：N21X，N23X，R25X，K26X，Q482X，S484X，R486X，S489X，R493X，H511X，C513X，H515X，N516X，R518X，R540X，K558X，Y560X，K562X，K565X，T600X，T672X，D676X，Q680X，Y683X，L686X，D693X，Y731X，G767X，R772X，K832X，K833X，Q836X，M896X；或c)以SEQ ID NO：2所示的氨基酸序列为基础，进行如下一种或多种点突变的蛋白：R19X，R28X，R32X，K512X，N527X，W531X，R553X，K581X，K589X，I590X，R605X，K611X，R612X，R615X，Y777X，E877X，R931X；或d)以SEQ ID NO：3所示的氨基酸序列为基础，进行如下一种或多种点突变的蛋白：K8X，F15X，N17X，K20X，K471X，W483X，H502X，R505X，K557X，K556X，R560X，Y673X，L676X，Y723X，N822X，K823X，E826X，K827X，K830X，K880X，L887X；或e)以SEQ ID NO：4所示的氨基酸序列为基础，进行如下一种或多种点突变的蛋白：K317X，W330X，Y351X，K354X，D392X，F395X，N399X，Y509X，V512X，Y568X，N662X，K663X，E666X，R667X，K670X，K719X，L726X；或f)以SEQ ID NO：5所示的氨基酸序列为基础，进行如下一种或多种点突变的蛋白：M9X，V16X，D18X，K21X，K518X，W531X，F550X，K553X，R609X，Y612X，R616X，Y730X，L733X，Y781X，N879X，K880X，E883X，K884X，K887X，K936X，F943X；其中X为任意氨基酸。

为了实现上述目的，根据本发明的第二个方面，提供了一种CRISPR-Cas效应子融合蛋白，该CRISPR-Cas效应子融合蛋白包括上述CRISPR-Cas效应子蛋白、或CRISPR-Cas效应子蛋白的衍生物或CRISPR-Cas效应子蛋白的功能片段，以及异源功能结构域。

进一步地，异源功能结构域位于CRISPR-Cas效应子融合蛋白的N端、C端或内部；优选地，异源功能结构域包括定位信号、报告蛋白、CRISPR-Cas效应子蛋白靶向部分、DNA结合域、表位标签、转录激活域、转录抑制域、核酸酶、脱氨结构域、甲基化酶、脱甲基酶、转录释放因子、HDAC、裂解活性多肽、连接酶中的一种或多种；优选地，定位信号包括核定位信号和/或核输出信号；优选地，核输出信号包括人类蛋白酪氨酸激酶2；优选地，报告蛋白包括谷胱甘肽-S-转移酶、辣根过氧化物酶、氯霉素乙酰转移酶、β-半乳糖苷酶、β-葡糖醛酸糖苷酶或自发荧光蛋白中的一种或多种；优选地，自发荧光蛋白包括绿色荧光蛋白、HcRed、DsRed、青荧光蛋白、黄色荧光蛋白或蓝色荧光蛋白中的一种或多种；优选地，DNA结合域包括甲基化结合蛋白、Lex A DBD或Gal4 DBD中的一种或多种；优选地，表位标签包括组氨酸标签、V5标签、FLAG标签、流感病毒血凝素标签、Myc标签、VSV-G标签或硫氧还蛋白标签中的一种或多种；优选地，转录激活域包括VP64和/或VPR；优选地，转录抑制域包括KRAB和/或SID；优选地，核酸酶包括FokI；优选地，脱氨结构域包括ADAR1、ADAR2、APOBEC、AID或TAD中的一种或多种；优选地，裂解活性多肽包括具有单链RNA裂解活性的多肽、具有双链RNA裂解活性的多肽、具有单链DNA裂解活性的多肽或具有双链DNA裂解活性的多肽；优选地，连接酶包括DNA连接酶和/或RNA连接酶。

为了实现上述目的，根据本发明的第三个方面，提供了一种DNA分子，该DNA分子编码上述CRISPR-Cas效应子蛋白、或CRISPR-Cas效应子融合蛋白。

进一步地，DNA分子为根据宿主细胞的密码子偏好性进行密码子优化的DNA分子；优选地，宿主细胞包括原核细胞或真核细胞；优选地，DNA分子包括与SEQ ID NO：6至10中任一项的核苷酸序列具有70％以上，优选90％以上，更优选95％以上，进一步优选99％，更进一步优选为100％同一性的核苷酸。

为了实现上述目的，根据本发明的第四个方面，提供了一种重组载体，该重组载体包含上述DNA分子。

进一步地，DNA分子与启动子连接；优选地，启动子包括诱导型启动子、组成型启动子或组织特异性启动子中的一种或多种；优选地，启动子包括T7、SP6、T3、CMV、EF1a、SV40、PGK1、humanβ-actin、CAG、U6、H1、T7、T7lac、araBAD、trp、lac或Ptac中的一种或多种；优选地，重组载体包括逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒载体、单纯疱疹载体、质粒载体或噬菌粒载体；优选地，所述重组载体包括质粒载体。

为了实现上述目的，根据本发明的第五个方面，提供了一种宿主细胞，该宿主细胞转化有上述重组载体。

为了实现上述目的，根据本发明的第六个方面，提供了一种基因编辑系统，该基因编辑系统包括：a)RNA指导物或编码RNA指导物的核酸，RNA指导物包括直接重复序列和间隔子序列，间隔子序列用于与靶核酸杂交；b)上述CRISPR-Cas效应子蛋白，或CRISPR-Cas效应子融合蛋白，或DNA分子，或重组载体，或宿主细胞；DNA分子、重组载体或宿主细胞能够表达CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白，在基因编辑系统中，CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白，与RNA指导物结合后，靶向作用于间隔子序列与靶核酸杂交形成的杂交序列。

进一步地，基因编辑系统不包含tracrRNA。

进一步地，RNA指导物包括1种或多种。

进一步地，靶核酸包括DNA；优选地，DNA包括来源于真核生物的DNA或来源于原核生物的DNA；优选地，真核生物包括动物或植物；优选地，DNA包括非人类哺乳动物DNA、人类DNA、昆虫DNA、鸟类DNA、爬行动物DNA、两栖动物DNA、啮齿动物DNA、鱼类DNA、蠕虫DNA、线虫DNA或酵母DNA；优选地，非人类哺乳动物DNA包括非人类灵长类DNA。

进一步地，直接重复序列的3’端包含茎环结构，茎环结构包括依次连接的第一茎核苷酸链、环核苷酸链和第二茎核苷酸链，第一茎核苷酸链和第二茎核苷酸链彼此杂交形成茎环结构的茎，环核苷酸链形成茎环结构的环；优选地，第一茎核苷酸链的长度为5或6个核苷酸；优选地，第二茎核苷酸链的长度为5个核苷酸；优选地，环核苷酸链的长度为6、7或8个核苷酸。

进一步地，茎环结构包括SEQ ID NO：25、28、31、34或37的核苷酸序列。

进一步地，直接重复序列包括与SEQ ID NO：24、27、30、33或36的核苷酸序列具有至少80％同一性的核苷酸序列；优选地，直接重复序列包括与SEQ ID NO：24、27、30、33或36的核苷酸序列具有至少85％以上，更优选90％以上，进一步优选95％以上同一性的核苷酸序列；优选地，直接重复序列包括SEQ ID NO：24、27、30、33或36的核苷酸序列。

进一步地，间隔子序列的80％以上与靶核酸互补；优选地，间隔子序列的90％以上，更优选95％以上，进一步优选99％以上，更进一步优选100％与靶核酸互补；优选地，间隔子序列的长度为18-41nt；优选地，间隔子序列的长度为18-37nt；优选地，间隔子序列长度为18-26或34-36nt；优选地，间隔子序列长度为20nt。

进一步地，直接重复序列包括第一直接重复序列和第二直接重复序列；优选地，RNA指导物包括按顺序依次连接的第一直接重复序列、间隔子序列以及第二直接重复序列；优选地，第一直接重复序列与第二直接重复序列相同。

进一步地，靶核酸包含前间隔子相邻基序，CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白能够识别前间隔子相邻基序，前间隔子相邻基序包含核酸序列5’-TTN-3’，其中N是任何核苷酸；优选地，N为A、C或T。

进一步地，CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白，与RNA指导物结合，形成蛋白-核酸复合物；优选地，蛋白-核酸复合物是非天然存在的或经修饰的；优选地，蛋白-核酸复合物中的至少一个组分是非天然存在的或经修饰的。

进一步地，通过CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白和RNA指导物对靶核酸的靶向作用，对靶核酸进行修饰；优选地，修饰包括切割或切口；优选地，修饰导致：(1)细胞包含至少一种基因产物表达的改变；或(2)细胞包含至少一种基因产物的表达的改变，其中至少一种基因产物的表达增加；或(3)细胞包含至少一种基因产物的表达的改变，其中至少一种基因产物的表达减少；或(4)细胞包含经编辑的基因组；优选地，修饰导致细胞毒性；优选地，上述修饰导致抑制基因表达、降低基因表达或增强基因表达。

进一步地，基因编辑系统包括目标核酸或编码目标核酸的核酸目标核酸包括同源臂片段和供体模板核酸；优选地，目标核酸包含能够与间隔子序列杂交的序列；优选地，同源臂片段包括5’同源臂和3’同源臂，目标核酸由5’同源臂、供体模板核酸和3’同源臂顺序连接组成。

进一步地，基因编辑系统以可递送的形式存在，利用递送系统使基因编辑系统与靶核酸接触；优选地，递送系统将基因编辑系统递送入含有靶核酸的细胞中；优选地，可递送的形式包括纳米颗粒、脂质体、外泌体、微泡、蛋白衣壳或基因枪所用的颗粒。

为了实现上述目的，根据本发明的第七个方面，提供了一种基因编辑载体，该基因编辑载体包含上述编码RNA指导物的核酸。

进一步地，基因编辑载体还包含上述DNA分子；优选地，DNA分子与编码RNA指导物的核酸位于相同或不同的载体上；优选地，DNA分子与第一调节元件连接；优选地，编码RNA指导物的核酸与第二调节元件连接；优选地，第一调节元件和第二调节元件分别独立选自诱导型启动子、组成型启动子或组织特异性启动子中的一种或多种；优选地，第一调节元件和第二调节元件分别独立选自T7、SP6、T3、CMV、EF1a、SV40、PGK1、humanβ-actin、CAG、U6、H1、T7、T7lac、araBAD、trp、lac或Ptac中的一种或多种。

为了实现上述目的，根据本发明的第八个方面，提供了一种上述基因编辑系统与细胞中靶核酸结合的方法，该方法包括：将基因编辑系统递送至细胞中，细胞包括靶核酸；使CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白，与RNA指导物结合，使间隔子序列与靶核酸结合。

进一步地，靶核酸为双链DNA或单链DNA；优选地，基因编辑系统与细胞中靶核酸的结合，导致靶核酸的表达状态改变；优选地，基因编辑系统与细胞中靶核酸的结合，导致靶核酸被切割；优选地，靶核酸被切割导致靶核酸破坏、或靶核酸特定位点替换、或靶核酸位点的移除、或靶核酸区域功能的改变、或靶核酸上两个位点之间的序列倒置。

为了实现上述目的，根据本发明的第九个方面，提供了一种含有基因编辑系统的细胞，该含有基因编辑系统的细胞包括上述基因编辑系统、或基因编辑载体。

进一步地，含有基因编辑系统的细胞包含经修饰的目的靶基因座，目的靶基因座为利用基因编辑系统修饰的基因座；优选地，目的靶基因座的修饰导致：(1)含有基因编辑系统的细胞包含至少一种基因产物的表达的改变；或(2)含有基因编辑系统的细胞包含至少一种基因产物的表达的改变，其中至少一种基因产物的表达增加；或(3)含有基因编辑系统的细胞包含至少一种基因产物的表达的改变，其中至少一种基因产物的表达减少；或(4)含有基因编辑系统的细胞包含经编辑的基因组；优选地，含有基因编辑系统的细胞包括真核细胞或原核细胞；优选地，真核细胞包括动物细胞、植物细胞或人类细胞；优选地，动物细胞包括哺乳动物细胞。

为了实现上述目的，根据本发明的第十个方面，提供了一种靶向和编辑靶核酸的方法，该方法包括使靶核酸与上述基因编辑系统接触。

为了实现上述目的，根据本发明的第十一个方面，提供了一种在识别靶核酸后非特异性降解单链DNA的方法，该方法包括使靶核酸与上述基因编辑系统接触。

为了实现上述目的，根据本发明的第十二个方面，提供了一种在识别双链靶DNA的间隔子互补链后靶向双链靶DNA的非间隔子互补链并使其产生切口的方法，该方法包括使双链靶DNA与上述基因编辑系统接触。

为了实现上述目的，根据本发明的第十三个方面，提供了一种靶向和切割双链靶DNA的方法，该方法包括使双链靶DNA与上述基因编辑系统接触。

进一步地，在使双链DNA的间隔子互补链产生切口之前，使双链靶DNA的非间隔子互补链产生切口。

为了实现上述目的，根据本发明的第十四个方面，提供了一种特异性编辑双链核酸的方法，该方法包括在充分的条件下使以下进行接触充分的时间量，(1)上述CRISPR-Cas效应子蛋白、或CRISPR-Cas效应子融合蛋白、另一具有序列特异性切口活性的酶，以及RNA指导物，RNA指导物指导CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白，相对于另一序列特异性切口酶的活性使相对链产生切口；以及(2)双链核酸；方法导致双链断裂的形成。

为了实现上述目的，根据本发明的第十五个方面，提供了一种编辑双链核酸的方法，该方法包括在充分的条件下使以下进行接触充分的时间量：(1)上述CRISPR-Cas效应子蛋白、或CRISPR-Cas效应子融合蛋白，和具有DNA修饰活性的蛋白质结构域的融合蛋白，以及靶向双链核酸的RNA指导物；以及(2)双链核酸；融合蛋白的CRISPR-Cas效应子被修饰以使双链核酸的非靶链产生切口。

进一步地，双链核酸的两条链在不同的位点被切割，导致交错切割；优选地，双链核酸的两条链在同一位点被切割，导致平双链断裂。

为了实现上述目的，根据本发明的第十六个方面，提供了一种靶向并切割单链靶DNA的方法，该方法包括使靶核酸与上述基因编辑系统接触。

为了实现上述目的，根据本发明的第十七个方面，提供了一种诱导细胞状态改变的方法，该方法包括使上述基因编辑系统与细胞中的靶核酸接触。

进一步地，细胞状态包括凋亡或休眠；优选地，细胞包括真核细胞或原核细胞；优选地，细胞包括哺乳动物细胞或植物病变细胞；优选地，细胞包括癌细胞；优选地，细胞包括感染性细胞或被感染原感染的细胞；优选地，细胞包括被病毒感染的细胞、被朊病毒感染的细胞；优选地，细胞包括真菌细胞、原生动物或寄生虫细胞。

为了实现上述目的，根据本发明的第十八个方面，提供了一种上述基因编辑系统在制备治疗受试者病症或疾病的药物中的应用。

进一步地，应用包括向受试者或受试者的离体细胞施用基因编辑系统；优选地，间隔子序列与跟病症或疾病相关的靶核酸的至少15个核苷酸互补，CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白切割靶核酸；优选地，病症或疾病包括癌症或感染性疾病；优选地，癌症包括维尔姆斯瘤、尤文肉瘤、神经内分泌瘤、胶质母细胞瘤、神经母细胞瘤、黑色素瘤、皮肤癌、乳腺癌、结肠癌、直肠癌、前列腺癌、肝癌、肾癌、胰腺癌、肺癌、胆道癌、宫颈癌、子宫内膜癌、食管癌、胃癌、头颈癌、甲状腺髓样癌、卵巢癌、胶质瘤、淋巴瘤、白血病、骨髓瘤、急性淋巴细胞白血病、急性髓细胞性白血病、慢性淋巴细胞白血病、慢性髓细胞性白血病、何杰金氏淋巴瘤、非何杰金氏淋巴瘤或尿膀胱癌中的一种或多种；优选地，病症或疾病包括囊性纤维化、进行性假肥大性肌营养不良、贝克肌营养不良、α-1-抗胰蛋白酶缺乏、庞贝病、强直性肌营养不良、亨廷顿病、脆性X综合征、弗里德赖希共济失调、肌萎缩侧索硬化、额颞叶痴呆、遗传性慢性肾脏病、高脂血症、高胆固醇血症、莱伯氏先天性黑蒙、镰状细胞病或β地中海贫血中的一种或多种；优选地，感染性疾病的感染原包括人类免疫缺陷病毒、单纯疱疹病毒-1或单纯疱疹病毒-2中的一种或多种。

为了实现上述目的，根据本发明的第十九个方面，提供了一种真核细胞系，该真核细胞系包含上述含有基因编辑系统的细胞，或为含有基因编辑系统的细胞的后代。

为了实现上述目的，根据本发明的第二十个方面，提供了一种多细胞生物体，该多细胞生物体包含上述含有基因编辑系统的细胞。

进一步地，多细胞生物体包括模型动物或模型植物。

为了实现上述目的，根据本发明的第二十一个方面，提供了一种获得目的性状的植物的方法，利用上述基因编辑系统与植物细胞接触，对植物细胞的基因进行修饰或引入目的基因，修饰或目的基因能够表达目的性状，获得修饰后的植物细胞，利用修饰后的植物细胞进行再生，获得目的性状的植物。

为了实现上述目的，根据本发明的第二十二个方面，提供了一种鉴定植物中目的性状的方法，植物细胞中的目的基因能够表达目的性状，利用上述基因编辑系统与植物细胞接触，从而鉴定目的基因。

为了实现上述目的，根据本发明的第二十三个方面，提供了一种试剂盒，该试剂盒包括一种或多种选自下列的组分：上述CRISPR-Cas效应子蛋白、DNA分子、重组载体、宿主细胞、基因编辑系统、基因编辑载体、含有基因编辑系统的细胞、真核细胞系、或多细胞生物体；试剂盒的组分在相同或不同的容器中。

为了实现上述目的，根据本发明的第二十四个方面，提供了一种容器，该容器包含上述试剂盒。

进一步地，容器包括无菌容器；优选地，容器包括注射器。

为了实现上述目的，根据本发明的第二十五个方面，提供了一种可植入装置，该可植入装置包括上述基因编辑系统。

进一步地，基因编辑系统在基质内；优选地，基因编辑系统在储库内。

应用本发明的技术方案，利用上述CasY1、CasY2、CasY3、CasY4和CasY5，均能够发挥Cas蛋白的切割活性，相较于现有的CRISPR/Cas系统切割效率高。

附图说明

构成本申请的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1示出了根据本发明实施例1的CasY1-CasY5的蛋白结构域示意图，其中D、E、D代表RuvC结构域的三个保守基序Ⅰ、Ⅱ、Ⅲ的催化残基，h表示桥螺旋结构。

图2示出了根据本发明实施例1的CasY1、CasY2、CasY3、CasY4和CasY5的直接重复序列的二级结构分析结果示意图。

图3示出了根据本发明实施例2的体内筛选效应子和文库质粒设计的示意图。

图4示出了根据本发明实施例2的负选择筛选工作流程的示意图。

图5示出了根据本发明实施例2的CasY1、CasY2、CasY3、CasY4、CasY5的PAM结构域分析结果图。

图6示出了根据本发明实施例3的CasY1、CasY2、CasY3、CasY4、CasY5靶向切割质粒示意图。

图7示出了根据本发明实施例3的CasY1、CasY2、CasY3、CasY4、CasY5的细菌切割结果图。

图8示出了根据本发明实施例4的CasY1、CasY2、CasY3、CasY4、CasY5的体外切割结果图，其中，图a示出了CasY1的体外切割结果图，图b示出了CasY2的体外切割结果图，图c示出了CasY3的体外切割结果图，图d示出了CasY4的体外切割结果图，图e示出了CasY5的体外切割结果图。

图9示出了根据本发明实施例5的CasY1、CasY2、CasY3、CasY4、CasY5和Lbcpf1对293T细胞不同靶基因切割活性统计图。

具体实施方式

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将结合实施例来详细说明本发明。

术语解释：

本发明所用的术语“切割”是指由本文所述CRISPR系统的核酸酶产生的靶核酸中的DNA断裂。在一些实施例中，切割事件是双链DNA断裂。在一些实施例中，切割是单链DNA断裂。在一些实施例中，切口是双链DNA的某一条DNA链断裂。

本发明中使用的术语“CRISPR-Cas系统”是指V-I型CRISPR-Cas效应子蛋白(即，Cas12i效应子蛋白)和一种或多种RNA指导物，和/或编码上述CRISPR-Cas效应子蛋白或一种或多种RNA指导物的核酸，以及任选地与CRISPR-Cas效应子的表达或与RNA指导物或两者可操作地连接的启动子。

本发明中使用的术语“直接重复序列”或“直接重复”是指多个短的直接重复序列，其在CRISPR阵列中显示出非常小的序列变化或没有序列变化。适当地，Cas12i的直接重复序列可以形成茎环结构。

本发明所使用的术语“茎环结构”是指具有二级结构的核酸，所述二级结构包括已知或预测形成双链(茎部分)的核苷酸区域，所述双链(茎部分)在一侧由主要为单链核苷酸的区域(环部分)连接。术语“发夹”和“折回”结构在本发明中也用于指茎环结构。这样的结构在本领域中是公知的，并且这些术语与其在本领域中的公知含义一致地使用。如本领域已知的，茎环结构不需要精确的碱基配对。因此，茎可以包括一个或多个碱基错配。

可替代地，碱基配对可以是精确的，即不包括任何错配。直接重复序列具有茎环结构。RNA指导物中包含的直接重复的茎由5个互相杂交的互补核碱基组成，并且环长度是6、7或9个核苷酸。

发明中使用的术语“CRISPR RNA”、“crRNA”或是指包含由CRISPR效应子用于靶向特定核酸序列的指导物序列的RNA分子。典型地，crRNA包含介导靶识别的间隔子序列和与CRISPR-Cas效应子蛋白形成复合物的直接重复序列(或称为直接重复或“DR”序列)。

本发明中所用的术语“供体模板核酸”是指在本文所述的CRISPR酶改变了靶核酸之后，一种或多种细胞蛋白质可以使用其来改变靶核酸的结构的核酸分子。

在一些实施例中，供体模板核酸是双链核酸。

在一些实施例中，供体模板核酸是单链核酸。

在一些实施例中，供体模板核酸是线性的。

在一些实施例中，供体模板核酸是环状的(例如，环状质粒)。在一些实施例中，供体模板核酸是外源核酸分子。在一些实施例中，供体模板核酸是内源核酸分子(例如，染色体)。

本发明中使用的术语“CRISPR-Cas效应子”、“CRISPR效应子”、“效应子”、“CRISPR相关蛋白”或“CRISPR酶”、“CRISPR-Cas效应子蛋白”、或“Cas效应子蛋白”是指执行酶活性或结合RNA指导物指定的核酸上的靶位点的蛋白。

在CRISPR-Cas系统内相关联的CRISPR-Cas效应子蛋白在本发明中也可称为“Cas”或“Cas酶”、“Cas蛋白”。Cas酶可以识别与靶DNA附近相关联的短基序，称为前间隔子相邻基序(PAM)。

本发明中的CasY1、CasY2、CasY3、CasY4和CasY5蛋白可以识别包含TTN或由TTN组成的PAM，其中N表示任何核苷酸。

例如，PAM可以是TTA、TTC、TTT或TTG。

在一些实施例中，CRISPR-Cas效应子蛋白具有核酸内切酶活性、切口酶活性和/或核酸外切酶活性。

本发明所使用的术语“RNA指导物”是指促进本发明中所述蛋白质靶向于靶核酸的任何RNA分子。示例性“RNA指导物”包括但不限于crRNA、前crRNA(例如DR-间隔子-DR)和成熟crRNA(例如成熟DR-间隔子，成熟DR-间隔子-成熟DR)。

如本发明中所用的术语“靶向”是指与不具有与靶核酸相同或相似序列的其他核酸相比，包括CRISPR相关蛋白和RNA指导物(如crRNA)的复合物优先或特异性结合到例如杂交到特定靶核酸的能力。

本发明中所用的术语“靶核酸”是指特定的核酸底物，其包含与RNA指导物中间隔子的全部或部分互补的核酸序列。在一些实施例中，靶核酸包含基因或基因内的序列。在一些实施例中，靶核酸包含非编码区(例如，启动子)。在一些实施例中，靶核酸是单链的或双链的。

本说明书，使用“数值A～数值B”表示的数值范围是指包含端点数值A、B的范围。

本发明中，使用“至少数值A”表示的数值是指包含大于、等于数值A的范围。

本发明中，使用“基本上”或“实质上”表示与理论模型或理论数据的标准偏差在5％、优选为3％、更优选为1％范围以内。

本发明中，使用“可以”表示的含义包括了进行某种处理以及不进行某种处理两方面的含义。

本发明中，“任选的”或“任选地”是指接下来描述的事件或情况可发生或可不发生，并且该描述包括该事件发生的情况和该事件不发生的情况。

本说明书中，所提及的“一些具体/优选的实施方案”、“另一些具体/优选的实施方案”、“实施方案”等是指所描述的与该实施方案有关的特定要素(例如，特征、结构、性质和/或特性)包括在此处所述的至少一种实施方案中，并且可存在于其它实施方案中或者可不存在于其它实施方案中。另外，应理解，所述要素可以任何合适的方式组合在各种实施方案中。

如本发明所使用的，术语“核酸”和“核酸分子”是指包含核碱基和酸性部分的化合物，例如核苷、核苷酸或核苷酸的聚合物。通常，聚合核酸，例如包含三个或更多个核苷酸的核酸分子是线性分子，其中相邻核苷酸通过磷酸二酯键相互连接。在一些实施方案中，“核酸”是指单个核酸残基(例如核苷酸和/或核苷)。在一些实施方案中，“核酸”是指包含三个或更多个单独核苷酸残基的寡核苷酸链。如本文所用，术语“寡核苷酸”和“多核苷酸”可互换使用以指核苷酸的聚合物(例如，至少三个核苷酸的串)。在一些实施方案中，“核酸”包括RNA以及单链和/或双链DNA。核酸可以是天然存在的，例如在基因组、转录物、mRNA、tRNA、rRNA、siRNA、snRNA、质粒、粘粒、染色体、染色单体或其他天然存在的核酸分子的上下文中。另一方面，核酸分子可以是非天然存在的分子，例如重组DNA或RNA、人工染色体、工程基因组或其片段，或合成的DNA、RNA、DNA/RNA杂交体、或包括非天然存在的核苷酸或核苷。此外，术语“核酸”、“DNA”、“RNA”和/或类似术语包括核酸类似物，例如具有除磷酸二酯骨架之外的其他骨架的类似物。核酸可以从天然来源纯化、使用重组表达系统产生和任选地纯化、化学合成等。在合适的情况下，例如在化学合成分子的情况下，核酸可以包含核苷类似物，例如具有化学修饰碱基的类似物或糖和骨架修饰。

如发明所使用的，术语“多肽”、“肽”和“蛋白质”在本文中互换地使用并且为任意长度的氨基酸聚合物。该聚合物可以是线形或分支的，它可以包含修饰的氨基酸，并且它可以由非氨基酸隔断。该术语也包括已经被修饰(例如，二硫键形成、糖基化、脂质化、乙酰化、磷酸化或任何其他操作，如以标记组分缀合)的氨基酸聚合物。

如本发明所使用的，“CRISPR-Cas效应子融合蛋白”是指包含来自至少两种不同蛋白质的蛋白质结构域的杂化多肽。一种蛋白质可位于CRISPR-Cas效应子融合蛋白的氨基-末端(N-末端，N端)部分或羧基-末端(C-末端，C端)蛋白处，因此分别形成“氨基-末端CRISPR-Cas效应子融合蛋白”或“羧基-末端CRISPR-Cas效应子融合蛋白”。本文提供的任何蛋白质可通过本领域已知的任何方法产生。例如，本文提供的蛋白质可经由重组蛋白质表达和纯化来产生，这尤其适合于包含肽接头的CRISPR-Cas效应子融合蛋白。用于重组蛋白质表达和纯化的方法是公知的，并且包括以下中所述的那些，例如，可参见Green andSambrook,Molecular Cloning:A Laboratory Manual(4th ed.,Cold Spring HarborLaboratory Press,Cold Spring Harbor,N.Y.(2012))。

本领域技术人员清楚，可以改变蛋白质的结构而不对其活性和功能性产生不利影响，例如，可以在蛋白质氨基酸序列中引入一个或多个保守性氨基酸取代，而不会对蛋白质分子的活性和/或三维结构产生不利影响。本领域技术人员清楚保守性氨基酸取代的实例以及实施方式。具体的说，可以用与待取代位点属于相同组的另一氨基酸残基取代该氨基酸残基，即用非极性氨基酸残基取代另一非极性氨基酸残基，用极性不带电荷的氨基酸残基取代另一极性不带电荷的氨基酸残基，用碱性氨基酸残基取代另一碱性氨基酸残基，和用酸性氨基酸残基取代另一酸性氨基酸残基。这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的。只要取代不导致蛋白质生物活性的失活，则一种氨基酸被属于同组的其他氨基酸替换的保守取代落在本发明的范围内。因此，本发明涉及的蛋白可以在氨基酸序列中包含一个或多个保守性取代，只要该非保守取代不显著影响本发明的蛋白质的所需功能和生物活性即可。

保守氨基酸置换可以在一个或多个预测的非必需氨基酸残基处进行。“非必需”氨基酸残基是可以发生改变(缺失、取代或置换)而不改变生物活性的氨基酸残基，而“必需”氨基酸残基是生物活性所需的。“保守氨基酸置换”是其中氨基酸残基被具有类似侧链的氨基酸残基替代的置换。氨基酸置换可以在上述Cas蛋白的非保守区域中进行。一般而言，此类置换不对保守的氨基酸残基，或者不对位于保守基序内的氨基酸残基进行，其中此类残基是蛋白质活性所需的。然而，本领域技术人员应当理解，功能变体可以具有较少的在保守区域中的保守或非保守改变。

如本发明所使用的，术语“CRISPR”是指成簇、规律间隔的短回文重复序列(Clustered regularly interspaced short palindromic repeats)，其来自微生物的免疫系统。

如本发明所使用的，术语“靶序列”是指目标核酸中与crRNA互补或至少部分互补的核苷酸序列，Cas蛋白、crRNA与靶序列形成三元复合物后，Cas蛋白发挥对目标核酸中靶核酸链和/或非核苷酸链的特异性切割活性。在本公开中，“靶序列”与“靶核酸”、“靶多核苷酸”、“目标序列”、“目标核酸序列”可以互换地使用。

如本发明所使用的，术语“靶标链”(target strand)是指目标核酸中与crRNA杂交的核苷酸链；术语“非靶标链”(non-target strand)是指目标核酸中与crRNA不发生杂交配对的核苷酸链。

如本发明所使用的，术语“脱氨酶”或“脱氨酶结构域”是指催化脱氨反应的蛋白质或酶。在一些实施方案中，脱氨酶是腺苷脱氨酶，其催化腺嘌呤水解脱氨为次黄嘌呤。在一些实施方案中，脱氨酶是腺苷脱氨酶，其催化腺苷或腺嘌呤(A)水解脱氨为肌苷(I)。

如本公开所使用的，“碱基编辑器(Base Editor,BE)”或“核碱基编辑器”是指结合多核苷酸并具有核碱基修饰活性的试剂。在各种实施方案中，碱基编辑器包含核碱基修饰多肽(例如，脱氨酶)和与引导多核苷酸(例如，引导RNA)结合的核酸可编程核苷酸结合结构域(例如，核酸可编程DNA结合蛋白)。在各种实施方案中，所述试剂是包含具有碱基编辑活性的蛋白质结构域的生物分子复合物，即能够修饰核酸分子(例如，DNA、RNA)内的碱基(例如，A、T、C、G或U)。在一些实施方案中，所述多核苷酸可编程DNA结合结构域与脱氨酶结构域融合或连接。在一个实施方案中，所述试剂是包含具有碱基编辑活性的结构域的CRISPR-Cas效应子融合蛋白。在一些实施方案中，具有碱基编辑活性的结构域能够使核酸分子内的碱基脱氨基。在一些实施方案中，所述碱基编辑器能够使DNA分子内的一个或多个碱基脱氨基。在一些实施方案中，所述碱基编辑器是腺苷碱基编辑器(ABE)。

如本文可互换使用的术语“编码序列”或“蛋白质编码序列”是指编码蛋白质的多核苷酸片段。该区域或序列在靠近5'端的地方有一个起始密码子，在靠近3'端的地方有一个终止密码子。编码序列也可称为开放阅读框。

术语“核定位序列”、“核定位信号(Nuclear Localization Signal，NLS)”是指促进蛋白质输入细胞核的氨基酸序列。核定位序列是本领域已知的并且描述于例如Plank等人的国际PCT申请，PCT/EP2000/011690，2000年11月23日提交，2001年5月31日作为WO/2001/038547公布，其内容以引用方式并入本文以用于它们对示例性核定位序列的公开。在一些实施方案中，所述NLS是优化的NLS，例如由Koblan等人，Nature Biotech.2018doi:10.1038/nbt.4172所描述。

如本公开所使用的，术语“互补的”或“杂交的”用于指与碱基配对规则相关的“多核苷酸”和“寡核苷酸”(它们是可互换的术语，指的是核苷酸序列)。例如，序列“CAGT”与序列“GTCA”互补。互补可以是“部分的”或“全部的”。“部分”互补是指一个或多个核酸碱基根据碱基配对规则错配，核酸之间的“全部”或“完全”互补是指每个核酸碱基在碱基配对下均与另一个碱基匹配规则。核酸链之间的互补程度对核酸链之间的杂交效率和强度具有重要影响。这在扩增反应以及取决于核酸之间结合的检测方法中特别重要。

如本文所用，术语“杂交”是指使用核酸链通过碱基配对与互补链结合以形成杂交复合物的任何过程来配对互补核酸。

如本公开所使用的，术语“核酸序列”和“核苷酸序列”是指寡核苷酸或多核苷酸及其片段或部分，并且是指可以是单链或双链的基因组或合成来源的DNA或RNA，和代表有义或反义链。

如本公开所使用的，术语“序列同一性”和“同一性百分比”指两个或更多个多核苷酸或多肽之间相同(即同一)的核苷酸或氨基酸的百分比。两个或更多个多核苷酸或多肽之间的序列同一性可通过以下方法测定：将多核苷酸或多肽的核苷酸或氨基酸序列对准且经对准的多核苷酸或多肽中含有相同核苷酸或氨基酸残基的位置数目进行评分，将其与经对准的多核苷酸或多肽中含有不同核苷酸或氨基酸残基的位置数目进行比较。多核苷酸可例如通过含有不同核苷酸(即取代或突变)或缺失核苷酸(即一个或两个多核苷酸中的核苷酸插入或核苷酸缺失)而在一个位置处不同。多肽可例如通过含有不同氨基酸(即取代或突变)或缺失氨基酸(即一个或两个多肽中的氨基酸插入或氨基酸缺失)而在一个位置处不同。序列同一性可通过用含有相同核苷酸或氨基酸残基的位置数目除以多核苷酸或多肽中氨基酸残基的总数来计算。举例而言，可通过用含有相同核苷酸或氨基酸残基的位置数目除以多核苷酸或多肽中核苷酸或氨基酸残基的总数且乘以100来计算同一性百分比。

示例性的，当使用序列比较算法或通过目视检查测量以最大的对应性进行比较和比对时，两个或多个序列或子序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％核苷酸的“序列同一性”或“同一性百分比”。在某些实施方案中，所述序列在任一或两个相比较的生物聚合物(例如，多核苷酸)的整个长度上基本相同。

术语“载体”是指将核酸序列引入细胞中从而产生转化细胞的手段。载体包括质粒、转座子、噬菌体、病毒、脂质体和附加体。“重组载体”、“表达载体”是包含待在受体细胞中表达的核苷酸序列的核酸序列。表达载体可以包括额外的核酸序列以促进和/或促进引入序列的表达，例如起始、终止、增强子、启动子和分泌序列。

如本公开所使用的，术语“个体”和“受试者”可互换地使用，是指哺乳动物。哺乳动物包括但不限于驯化动物(例如，奶牛、绵羊、猫、犬和马)、灵长类(例如，人和非人灵长类如猴)、兔和啮齿类(例如，小鼠和大鼠)。特别地，个体是人。

本文公开的方法可以在体外、离体、或体内进行，或者产品可以以体外、离体、或体内形式存在。术语“体外”是指在实验室条件或培养液中使用材料、生物物质、细胞和/或组织的实验；而术语“体内”是指使用完整多细胞有机体的实验和工序。在一些实施方案中，体内进行的方法可以在非人动物上进行。“离体”是指存在于有机体外或发生在有机体外，例如在人或动物体外的事件，例如可以在取自有机体的组织(例如整个器官)或细胞上存在或发生的事件。

如本公开所使用的，术语“药学上可接受的载体”是指药学上可接受的材料、组合物或媒介物，例如液体或固体填充剂、稀释剂、赋形剂、制造助剂(例如，润滑剂、滑石粉、硬脂酸镁、钙或锌或硬脂酸)或溶剂包封材料，涉及将化合物从身体的一个部位(例如，递送部位)运送或运输到另一个部位(例如，器官、组织或身体的一部分)。药学上可接受的载体是“可接受的”，意思是与制剂的其他成分相容并且对受试者的组织无害(例如，生理学相容的、无菌的、生理学的pH等)。可以充当药学上可接受的载体的材料的一些实例包括：(1)糖，例如乳糖、葡萄糖和蔗糖；(2)淀粉，如玉米淀粉和马铃薯淀粉；(3)纤维素及其衍生物，如羧甲基纤维素钠、甲基纤维素、乙基纤维素、微晶纤维素和醋酸纤维素；(4)粉末黄蓍胶；(5)麦芽；(6)明胶；(7)润滑剂，如硬脂酸镁、十二烷基硫酸钠和滑石粉；(8)赋形剂，如可可脂和栓剂蜡；(9)油，如花生油、棉籽油、红花油、芝麻油、橄榄油、玉米油和豆油；(10)二醇，如丙二醇；(11)多元醇，如甘油、山梨糖醇、甘露醇和聚乙二醇(PEG)；(12)酯类，如油酸乙酯和月桂酸乙酯；(13)琼脂；(14)缓冲剂，如氢氧化镁和氢氧化铝；(15)海藻酸；(16)无热原水；(17)等渗盐水；(18)林格氏液；(19)乙醇；(20)pH缓冲溶液；(21)聚酯，聚碳酸酯和/或聚酸酐；(22)增量剂(bulking agent)，如多肽和氨基酸(23)血清成分，如血清白蛋白、高密度脂蛋白(high density lipoprotein,HDL)和低密度脂蛋白(low density lipoprotein，LDL)；(22)C2-C12醇，如乙醇；和(23)药物制剂中采用的其他无毒相容物质。润湿剂、着色剂、脱模剂、包衣剂、甜味剂、调味剂、芳香剂、防腐剂和抗氧化剂也可以存在于制剂中。诸如“赋形剂”、“药学上可接受的载体”等术语在本文中可互换使用。

如本文所用，术语“有效量”是指足以引起期望的生物学反应的生物活性剂的量。例如，在一些实施方案中，碱基编辑器的有效量可以指足以诱导由碱基编辑器突变的特异性结合的靶位点的突变的碱基编辑器的量。如本领域技术人员将理解的，试剂，例如碱基编辑器CRISPR-Cas效应子融合蛋白、脱氨酶、多核苷酸等的有效量可以随各种因素而变化，例如随期望的生物学反应，例如随待编辑的特定等位基因、基因组或靶位点，随靶定的细胞或组织和使用的试剂而变化。

术语“治疗”、“处理”是指如本文所述旨在逆转、缓解疾病或病症或其一种或多种症状、延迟疾病或病症或其一种或多种症状的发作或抑制疾病或病症或其一种或多种症状进展的临床干预。如本文所用，术语“治疗”、“处理”是指如本文所述旨在逆转、缓解疾病或病症或其一种或多种症状、延迟疾病或病症或其一种或多种症状的发作或抑制疾病或病症或其一种或多种症状进展的临床干预。在一些实施方案中，可以在一种或多种症状已经得以形成之后和/或疾病已经得到诊断之后施用治疗。在其他实施方案中，可以在没有症状的情况下施用治疗，例如用于预防或延迟症状的发作或抑制疾病的发作或进展。例如，可以在症状发作之前(例如，鉴于症状的历史和/或鉴于遗传或其他易感性因素)施用治疗于易感个体。治疗也可以在症状消退后继续进行，例如以预防或延迟其复发。

如背景技术所提到的，现有技术中的CRISPR/Cas系统切割效率较低。因而，在本申请中发明人尝试开发新型Cas蛋白和CRISPR/Cas系统，从而丰富CRISPR/Cas系统，提高切割效率和靶向性，以适应在实际使用中的需求。因而提出了本申请的一系列保护方案。

在本申请第一种典型的实施方式中，提供了一种CRISPR-Cas效应子蛋白，该CRISPR-Cas效应子蛋白包括与SEQ ID NO：1至5中任一项的氨基酸序列具有至少70％同一性的蛋白(例如，70％，71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％)。

在一种优选的实施例中，CRISPR-Cas效应子蛋白包括与SEQ ID NO：1至5中任一项的氨基酸序列具有80％以上，优选90％以上，更优选95％以上，进一步优选99％以上同一性的蛋白；优选地，CRISPR-Cas效应子蛋白包括RuvC结构域。

在一种优选的实施例中，CRISPR-Cas效应子蛋白包括：

a)SEQ ID NO：1至5中任一项所示的蛋白；或

b)以SEQ ID NO：1所示的氨基酸序列为基础，进行如下一种或多种点突变的蛋白：N21X，N23X，R25X，K26X，Q482X，S484X，R486X，S489X，R493X，H511X，C513X，H515X，N516X，R518X，R540X，K558X，Y560X，K562X，K565X，T600X，T672X，D676X，Q680X，Y683X，L686X，D693X，Y731X，G767X，R772X，K832X，K833X，Q836X，M896X；或

c)以SEQ ID NO：2所示的氨基酸序列为基础，进行如下一种或多种点突变的蛋白：R19X，R28X，R32X，K512X，N527X，W531X，R553X，K581X，K589X，I590X，R605X，K611X，R612X，R615X，Y777X，E877X，R931X；或

d)以SEQ ID NO：3所示的氨基酸序列为基础，进行如下一种或多种点突变的蛋白：K8X，F15X，N17X，K20X，K471X，W483X，H502X，R505X，K557X，K556X，R560X，Y673X，L676X，Y723X，N822X，K823X，E826X，K827X，K830X，K880X，L887X；或

e)以SEQ ID NO：4所示的氨基酸序列为基础，进行如下一种或多种点突变的蛋白：K317X，W330X，Y351X，K354X，D392X，F395X，N399X，Y509X，V512X，Y568X，N662X，K663X，E666X，R667X，K670X，K719X，L726X；或

f)以SEQ ID NO：5所示的氨基酸序列为基础，进行如下一种或多种点突变的蛋白：M9X，V16X，D18X，K21X，K518X，W531X，F550X，K553X，R609X，Y612X，R616X，Y730X，L733X，Y781X，N879X，K880X，E883X，K884X，K887X，K936X，F943X；其中X为任意氨基酸。

上述CRISPR-Cas效应子蛋白具有剪切活性，能够特异性或非特异性剪切核苷酸链，实现CRISPR-Cas系统的活性。上述同一性限定范围内的同源蛋白和点突变蛋白，相较于SEQ ID NO：1至5中任一项所示的蛋白，氨基酸的改变可以发生在蛋白活性位点或非活性位点处，包括RuvC结构域内或结构域外。氨基酸改变得到的蛋白，仍具有CRISPR-Cas效应子蛋白的剪切活性。

在本申请第二种典型的实施方式中，提供了一种CRISPR-Cas效应子融合蛋白，该CRISPR-Cas效应子融合蛋白包括上述CRISPR-Cas效应子蛋白、或CRISPR-Cas效应子蛋白的衍生物或CRISPR-Cas效应子蛋白的功能片段，以及异源功能结构域。

功能片段的序列少于全长序列但保留了上述CRISPR-Cas效应子蛋白的切割功能，功能片段中的缺失残基可以在N末端、C末端和/或内部。衍生物是指与上述CRISPR-Cas效应子蛋白至少约80％的序列同一性，且拥有至少一种相同功能，例如与一个包含至少一个DR序列的crRNA结合并形成复合物的能力。衍生物形成的原因包括但不限于保守氨基酸残基取代。

通过向具有剪切活性的CRISPR-Cas效应子蛋白、或CRISPR-Cas效应子蛋白的衍生物、或CRISPR-Cas效应子蛋白的功能片段上，融合异源功能结构域，获得CRISPR-Cas效应子融合蛋白，能够在正常发挥剪切活性的基础上，具有异源功能结构域的活性。在具体使用中，可以灵活选择现有技术中的异源功能结构域，增加该融合蛋白的功能。异源功能结构域与CRISPR-Cas效应子蛋白(包括衍生物和功能片段)的连接，可灵活选用现有技术中不同长度的融合蛋白接头(Linker)，也可不利用Linker而直接相连，均不影响CRISPR-Cas效应子蛋白(包括衍生物和功能片段)和异源功能结构域的活性发挥。

在一种优选的实施例中，异源功能结构域位于CRISPR-Cas效应子融合蛋白的N端、C端或内部；优选地，异源功能结构域包括但不限于定位信号、报告蛋白、CRISPR-Cas效应子蛋白靶向部分、DNA结合域、表位标签、转录激活域、转录抑制域、核酸酶、脱氨结构域、甲基化酶、脱甲基酶、转录释放因子、HDAC(组蛋白去乙酰化酶)、裂解活性多肽、连接酶中的一种或多种；优选地，定位信号包括但不限于核定位信号和/或核输出信号；优选地，核输出信号包括但不限于人类蛋白酪氨酸激酶2；优选地，报告蛋白包括但不限于谷胱甘肽-S-转移酶、辣根过氧化物酶、氯霉素乙酰转移酶、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、或荧光蛋白中的一种或多种；优选地，荧光蛋白包括但不限于但不限于绿色荧光蛋白、HcRed、DsRed、青荧光蛋白、黄色荧光蛋白或蓝色荧光蛋白中的一种或多种；优选地，DNA结合域包括但不限于甲基化结合蛋白、LexA DBD(LexA蛋白的DNA结合结构域)或Gal4 DBD(GAL4蛋白的DNA结合结构域)中的一种或多种；优选地，表位标签包括但不限于组氨酸标签、V5标签、FLAG标签、流感病毒血凝素标签、Myc标签、VSV-G标签或硫氧还蛋白标签中的一种或多种；优选地，转录激活域包括但不限于VP64和/或VPR；优选地，转录抑制域包括但不限于KRAB和/或SID；优选地，核酸酶包括但不限于FokI；优选地，脱氨结构域包括但不限于ADAR1、ADAR2、APOBEC、AID或TAD中的一种或多种；优选地，裂解活性多肽包括但不限于具有单链RNA裂解活性的多肽、具有双链RNA裂解活性的多肽、具有单链DNA裂解活性的多肽或具有双链DNA裂解活性的多肽；优选地，连接酶包括但不限于DNA连接酶和/或RNA连接酶。

灵活选用上述异源功能结构域，能够实现融合蛋白的多种功能与活性。上述脱氨结构域包括脱氨酶或脱氨酶的功能片段，将上述脱氨结构域与利用上述异源功能结构域与CRISPR-Cas效应子蛋白融合，能够实现碱基编辑器的效果。包含核定位信号的融合蛋白，能够能与入核载体相互作用，使蛋白能被运进细胞核。DNA结合域(DBD)能够识别特定的DNA序列，从而提高融合蛋白的靶向性。

在本申请第三种典型的实施方式中，提供了一种DNA分子，该DNA分子编码上述CRISPR-Cas效应子蛋白、或CRISPR-Cas效应子融合蛋白。

在一种优选的实施例中，DNA分子为根据宿主细胞的密码子偏好性进行密码子优化的DNA分子；优选地，宿主细胞包括原核细胞或真核细胞；优选地，DNA分子包括与SEQ IDNO：6至10中任一项的核苷酸序列具有70％以上(例如，70％，71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％)，优选90％以上，更优选95％以上，进一步优选99％，更进一步优选为100％同一性的核苷酸。

上述DNA分子，包括分离的DNA分子。能够通过转录、翻译，编码上述CRISPR-Cas效应子蛋白、或CRISPR-Cas效应子融合蛋白。上述DNA分子包括单链或双链DNA，均能够携带遗传信息，从而实现编码蛋白的作用。根据DNA分子所处的、或编码发生的宿主细胞的密码子偏好性，灵活进行密码子优化，能够实现DNA分子的高效表达。上述SEQ ID NO：6至10所示的核苷酸，分别能够编码SEQ ID NO：1至5所示的蛋白。

在本申请第四种典型的实施方式中，提供了一种重组载体，该重组载体包含上述DNA分子。

在一种优选的实施例中，DNA分子与启动子连接；优选地，启动子包括但不限于诱导型启动子、组成型启动子或组织特异性启动子中的一种或多种；优选地，启动子包括但不限于T7、SP6、T3、CMV、EF1a、SV40、PGK1、humanβ-actin、CAG、U6、H1、T7、T7lac、araBAD、trp、lac或Ptac中的一种或多种；优选地，重组载体包括但不限于逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒载体、单纯疱疹载体或噬菌粒载体；优选地，所述重组载体包括质粒载体。

在本申请第五种典型的实施方式中，提供了一种宿主细胞，该宿主细胞转化有上述重组载体。

将上述DNA分子整合到上述重组载体中，获得能够在宿主细胞中复制、表达的重组载体，从而实现DNA分子的大规模复制和表达，进而实现上述CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白的表达、纯化，或在宿主细胞中发挥蛋白活性。

在本申请第六种典型的实施方式中，提供了一种基因编辑系统，该基因编辑系统包括：a)RNA指导物或编码RNA指导物的核酸，RNA指导物包括直接重复序列和间隔子序列，间隔子序列用于与靶核酸杂交；b)上述CRISPR-Cas效应子蛋白，或CRISPR-Cas效应子融合蛋白，或DNA分子，或重组载体，或宿主细胞；DNA分子、重组载体或宿主细胞能够表达CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白，在基因编辑系统中，CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白，与RNA指导物结合后，靶向作用于间隔子序列与靶核酸杂交形成的杂交序列。

上述基因编辑系统，包括RNA指导物或编码RNA指导物的核酸，以及CRISPR-Cas效应子蛋白，或CRISPR-Cas效应子融合蛋白，或能够表达上述蛋白的DNA分子、重组载体或宿主细胞。该基因编辑系统，通过RNA指导物与靶核酸杂交结合，形成杂交序列；杂交序列上的RNA指导物能够与上述蛋白结合形成复合物，从而使得蛋白靠近靶核酸完成定位，蛋白从而发挥活性，靶向或非靶向地对上述靶核酸进行切割、切口等修饰。

在一种优选的实施例中，基因编辑系统不包含tracrRNA。

tracrRNA是trans-activating crRNA的简写，在涉及Cas9蛋白的基因编辑系统中单独转录，并与crRNA结合形成gRNA(guide RNA)，从而与Cas9蛋白结合而引导蛋白定位。上述基因编辑系统中不包含tracrRNA，则引导蛋白定位的gRNA长度和分子量更小，gRNA与Cas蛋白的结合域更小，从而实现Cas蛋白分子量和尺寸的减小，丰富了CRISPR-Cas系统的应用场景。

在一种优选的实施例中，RNA指导物包括1种或多种。

上述RNA指导物包括1种、2种、3种、4种、5种乃至更多种。基因编辑系统中包括多种RNA指导物，及能够同时与多个靶核酸杂交，进而在多个靶核酸位点发挥该基因编辑系统的活性，能够大大提高基因编辑的效率，降低基因编辑、细胞传代、编辑结果验证等实验所需时间。在现有技术中，同时利用多个gRNA的情况在实际实验过程中也较为常见，例如进行基因敲除或检测应用时，均可会采用多个gRNA。

在一种优选的实施例中，靶核酸包括DNA；优选地，DNA包括来源于真核生物的DNA或来源于原核生物的DNA；优选地，真核生物包括但不限于动物或植物；优选地，DNA包括但不限于非人类哺乳动物DNA、人类DNA、昆虫DNA、鸟类DNA、爬行动物DNA、两栖动物DNA、啮齿动物DNA、鱼类DNA、蠕虫DNA、线虫DNA或酵母DNA；优选地，非人类哺乳动物DNA包括但不限于非人类灵长类DNA。

利用上述基因编辑系统，RNA指导物能够与不同来源的DNA进行杂交，从而实现对于多物种的基因编辑。

在一种优选的实施例中，直接重复序列的3’端包含茎环结构，茎环结构包括依次连接的第一茎核苷酸链、环核苷酸链和第二茎核苷酸链和，第一茎核苷酸链和第二茎核苷酸链彼此杂交形成茎环结构的茎，环核苷酸链形成茎环结构的环；优选地，第一茎核苷酸链的长度为5或6个核苷酸；优选地，第二茎核苷酸链的长度为5个核苷酸；优选地，环核苷酸链的长度为6、7或8个核苷酸。

在一种优选的实施例中，茎环结构包括SEQ ID NO：25、28、31、34或37的核苷酸序列。

上述RNA指导物中包括直接重复序列和间隔子序列，其中直接重复序列的3’端为具有二级结构的茎环结构。在茎环结构中，包括能够彼此杂交的第一茎核苷酸链、第二茎核苷酸链，杂交形成双链，环核苷酸链形成环状结构。该茎环结构能够与CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白结合，从而发挥引导蛋白定位的作用。序列上的N表示所有碱基。

在本申请实施例中，SEQ ID NO：25所述的核苷酸对应的茎环结构，能够与CasY1蛋白结合；SEQ ID NO：28所述的核苷酸对应的茎环结构，能够与CasY2蛋白结合；SEQ ID NO：31所述的核苷酸对应的茎环结构，能够与CasY3蛋白结合；SEQ ID NO：34所述的核苷酸对应的茎环结构，能够与CasY4蛋白结合；SEQ ID NO：37所述的核苷酸对应的茎环结构，能够与CasY5蛋白结合。对于茎环结构序列的选择，蛋白可以与上述茎环结构自由组合，也可以如上述的同一性进行灵活选用，而不影响蛋白与RNA指导物的结合。

在一种优选的实施例中，直接重复序列包括与SEQ ID NO：24、27、30、33或36的核苷酸序列具有至少80％(例如，80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％)同一性的核苷酸序列；优选地，直接重复序列包括与SEQ ID NO：24、27、30、33或36的核苷酸序列具有至少85％以上，更优选90％以上，进一步优选95％以上同一性的核苷酸序列；优选地，直接重复序列包括SEQ ID NO：24、27、30、33或36的核苷酸序列。

在一种优选的实施例中，间隔子序列包括80％(例如，80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％)以上与靶核酸互补；优选地，间隔子序列包括90％以上，更优选95％以上，进一步优选99％以上，更进一步优选100％与靶核酸互补；优选地，间隔子序列的长度为18-41nt；优选地，间隔子序列的长度为18-37nt；优选地，间隔子序列长度为18-26nt或34-36nt；优选地，间隔子序列长度为20nt。

上述间隔子序列包括80％以上与靶核酸互补的片段，通过至少80％的碱基互补配对，带有间隔子序列的RNA指导物能够与靶核酸牢固结合，从而实现该基因编辑系统对靶核酸的修饰。间隔子序列的长度可在一定范围内灵活选择，若长度过短则形成的互补链长度较短，结合力差，且结合特异性较弱，影响基因编辑效率和脱靶率；若长度过长，则增加RNA引导物的长度，且互补配对难度，也会对基因编辑效率产生影响。

在一种优选的实施例中，直接重复序列包括第一直接重复序列和第二直接重复序列；优选地，RNA指导物包括按顺序依次连接的第一直接重复序列、间隔子序列以及第二直接重复序列；优选地，第一直接重复序列与第二直接重复序列相同。

本申请中的RNA指导物是指促进本发明中蛋白质靶向于靶核酸的任何RNA分子，包括但不限于crRNA、前crRNA(例如DR-间隔子-DR)和成熟crRNA(例如成熟DR-间隔子，成熟DR-间隔子-成熟DR)。如本申请实施例中所用的RNA指导物即为前crRNA，直接重复序列包括位于间隔子序列两端的第一直接重复序列和第二直接重复序列，茎环结构在第一和第二直接重复序列均存在。在细胞后续对于RNA指导物的加工中，能够进一步获得发挥活性的RNA指导物，如对于DR-间隔子-DR组成的前crRNA，在加工后其中一个直接重复序列被删除。

在一种优选的实施例中，靶核酸包含前间隔子相邻基序，CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白能够识别前间隔子相邻基序(PAM)，前间隔子相邻基序包含核酸序列5’-TTN-3’，其中N是任何核苷酸；优选地，N为A、C或T。

在CRISPR-Cas系统中，Cas酶可以识别与靶核酸附近相关联的短基序，从而完成对特异性位点的剪切、修饰。上述基因编辑系统中的CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白，能够特异性识别的PAM为5’-TTN-3’，其中N是任何核苷酸。且对5’-TTA-3’、5’-TTC-3’和5’-TTT-3’识别效率最高。

在一种优选的实施例中，CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白，与RNA指导物结合，形成蛋白-核酸复合物；优选地，蛋白-核酸复合物是非天然存在的或经修饰的；优选地，蛋白-核酸复合物中的至少一个组分是非天然存在的或经修饰的。

在基因编辑系统中，RNA指导物与Cas蛋白能够形成蛋白-核酸复合物。可以对RNA指导物进行修饰或对Cas蛋白进行修饰，或者直接采用不修饰的蛋白-核酸复合物(即RNA指导物与Cas蛋白均为天然的)，均能够发挥基因编辑的作用。

在一种优选的实施例中，通过CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白和RNA指导物对靶核酸的靶向作用，对靶核酸进行修饰；优选地，修饰包括但不限于切割或切口；优选地，修饰导致：(1)细胞包含至少一种基因产物的表达的改变；或(2)细胞包含至少一种基因产物的表达的改变，其中至少一种基因产物的表达增加；或(3)细胞包含至少一种基因产物的表达的改变，其中至少一种基因产物的表达减少；或(4)细胞包含经编辑的基因组；优选地，修饰导致细胞毒性；优选地，修饰导致抑制基因表达，降低基因表达，或增强基因表达。

利用上述CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白和RNA指导物对靶核酸的靶向作用，能够对靶核酸进行修饰，包括切割或切口。切割是单链DNA或双链DNA的断裂。切口是双链DNA的某一条DNA链断裂。上述作用于细胞基因的修饰，能够导致细胞中基因产物表达的改变，这种改变包括增加或减少，也能够导致细胞基因组被编辑。上述修饰可以作用于细胞自身的基因组，也可以作用于细胞中的如质粒等外源基因。上述修饰能够导致细胞毒性，抑制基因表达，降低基因表达，或增强基因表达等情况的出现。

在一种优选的实施例中，基因编辑系统包括目标核酸或编码目标核酸的核酸，目标核酸包括同源臂片段和供体模板核酸；优选地，目标核酸包含能够与间隔子序列杂交的序列；优选地，同源臂片段包括5’同源臂和3’同源臂，目标核酸由5’同源臂、供体模板核酸和3’同源臂顺序连接组成。

上述基因编辑系统中，还可以包括目标核酸或编码目标核酸的核酸，目标核酸包含能够与间隔子序列杂交的序列，即能够将目标核酸定位在特定的核酸位点(如靶核酸)上。在本申请中，靶核酸为基因编辑系统所修饰的核酸；供体模板核酸为对靶核酸进行修饰、修改时的模版。进一步地，目标核酸包括同源臂片段和供体模板核酸，同源臂片段能够与特定的核酸位点周围的核酸进行特异性结合，供体模板核酸则携带有特定的遗传信息，能够通过同源重组或其他机制，在上述CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白对靶核酸进行切割后，将特定的遗传信息整合到靶核酸的位置，从而完成对于靶核酸的修饰，包括碱基的插入、删除或替换，从而完成基因编辑。

“供体模板核酸”是指在Cas酶改变(修饰，包括碱基的插入、删除或替换)了靶核酸之后，一种或多种细胞蛋白质(如同源重组酶)可以使用其来改变靶核酸的结构的核酸分子。举例说明，利用Cas蛋白对靶核酸进行修饰后，利用同源重组酶，以供体模板核酸为模版，对于靶核酸进行插入、删除或替换等修饰、改变。供体模板核酸可以是双链核酸、单链核酸；供体模板核酸可以是线性的、环状的(例如可以采用质粒)；供体模板核酸可以是外源核酸分子。供体模板核酸包括DNA或RNA。

在一种优选的实施例中，基因编辑系统以可递送的形式存在，利用递送系统，使基因编辑系统与靶核酸接触；优选地，递送系统将基因编辑系统递送入含有靶核酸的细胞中；优选地，可递送的形式包括但不限于纳米颗粒、脂质体、外泌体、微泡、蛋白衣壳或基因枪所用的颗粒。

对于存在于细胞内的靶核酸，通过上述递送系统能够将基因编辑系统递送入细胞中，从而完成基因编辑系统与靶核酸的接触。递送系统也可以进一步地定位于特定的细胞种类、细胞内部结构等位置，达到基因编辑系统精确递送的目的，提高基因编辑的精确性。

在本申请第七种典型的实施方式中，提供了一种基因编辑载体，该基因编辑载体包含上述编码RNA指导物的核酸。

在一种优选的实施例中，基因编辑载体还包含上述DNA分子；优选地，DNA分子与编码RNA指导物的核酸位于相同或不同的载体上；优选地，DNA分子与第一调节元件连接；优选地，编码RNA指导物的核酸与第二调节元件连接；优选地，第一调节元件和第二调节元件分别独立选自诱导型启动子、组成型启动子或组织特异性启动子中的一种或多种；优选地，第一调节元件和第二调节元件分别独立选自包括但不限于T7、SP6、T3、CMV、EF1a、SV40、PGK1、humanβ-actin、CAG、U6、H1、T7、T7lac、araBAD、trp、lac或Ptac中的一种或多种。

上述基因编辑载体包含能够编码RNA指导物的核酸，能够复制编码RNA指导物的核酸，并在细胞中编码RNA指导物。利用上述包含DNA分子的重组载体与该基因编辑载体，能够分别表达CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白与RNA指导物，即能表达上述基因编辑系统。在该基因编辑载体中，也可以包含上述DNA分子，DNA分子与编码RNA指导物的核酸位于相同或不同的载体上。若位于相同载体上，则基因编辑载体包括一个载体；若位于不同载体上，则多个载体组成基因编辑载体。利用上述基因编辑载体，能够在细胞中表达上述基因编辑系统。在基因编辑载体上，可以各自独立地灵活设置多种如启动子等调节元件，帮助RNA指导物和/或蛋白完成转录、翻译、纯化等工作。

在本申请第八种典型的实施方式中，提供了一种上述基因编辑系统与细胞中靶核酸结合的方法，该方法包括：将基因编辑系统递送至细胞中，细胞包括靶核酸；使CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白，与RNA指导物结合，使间隔子序列与靶核酸结合。

在一种优选的实施例中，靶核酸为双链DNA或单链DNA；优选地，基因编辑系统与细胞中靶核酸的结合，导致靶核酸的表达状态改变；优选地，基因编辑系统与细胞中靶核酸的结合，导致靶核酸被切割；优选地，靶核酸被切割导致靶核酸破坏、或靶核酸特定位点替换、或靶核酸位点的移除、或靶核酸区域功能的改变、或靶核酸上两个位点之间的序列倒置。

靶核酸破坏，例如靶标突变，例如导致基因敲除；靶核酸替换，例如导致靶标校正；靶位点的移除，例如导致靶标缺失；功能的改变，例如，靶核酸活性或可及性，导致例如(转录的和/或表观遗传的)基因或基因组区域激活或者基因或基因组区域沉默。靶核酸上两个位点之间的序列倒置，例如通过切割靶核酸包括在两个位点，再利用Donor序列或Cre-loxP重组酶系统即可实现。

上述递送包括但不限于质粒转化、显微注射、纳米颗粒、脂质体、外泌体、微泡、蛋白衣壳或基因枪等现有技术。靶核酸破坏包括靶核酸突变或基因敲除，靶核酸特定位点替换包括靶核酸中错误碱基被纠正，靶核酸位点的移除能够导致靶核酸位点缺失，区域功能的改变包括但不限于靶核酸表达活性重新激活，或靶核酸表达活性失活，或表达量的调高，或表达量的调低，或表达产物改变。靶核酸的表达状态改变，包括但不限于基因沉默或基因表达激活。

在本申请第九种典型的实施方式中，提供了一种含有基因编辑系统的细胞，含有基因编辑系统的细胞包括上述基因编辑系统、或基因编辑载体。

在一种优选的实施例中，含有基因编辑系统的细胞包含经修饰的目的靶基因座，目的靶基因座为利用基因编辑系统修饰的基因座；优选地，目的靶基因座的修饰导致：(1)含有基因编辑系统的细胞包含至少一种基因产物的表达的改变；或(2)含有基因编辑系统的细胞包含至少一种基因产物的表达的改变，其中至少一种基因产物的表达增加；或(3)含有基因编辑系统的细胞包含至少一种基因产物的表达的改变，其中至少一种基因产物的表达减少；或(4)含有基因编辑系统的细胞包含经编辑的基因组；优选地，含有基因编辑系统的细胞包括真核细胞或原核细胞；优选地，真核细胞包括但不限于动物细胞、植物细胞或人类细胞；优选地，动物细胞包括但不限于哺乳动物细胞。

上述含有基因编辑系统的细胞中含有上述基因编辑系统或基因编辑载体，处于基因编辑未发生、基因编辑正在发生、基因编辑已完成等多种状态的细胞均属于上述含有基因编辑系统的细胞。处于基因编辑正在发生和基因编辑已完成的上述细胞中，含有经修饰的目的靶基因座。能够导致细胞中基因产物表达的改变，这种改变包括增加或减少，也能够导致细胞基因组被编辑。上述修饰可以作用于细胞自身的基因组，也可以作用于细胞中的如质粒等外源基因。上述修饰能够导致细胞毒性，抑制基因表达，降低基因表达，或增强基因表达等情况的出现。

术语“靶基因座”包含期望编辑的多核苷酸的任何DNA区段或区域。在一些实施例中，靶基因座为基因组座位。靶基因座对于细胞可为天然的，或另选地可包含异源或外源DNA区段。异源或外源DNA区段可包括转基因、表达盒、编码选择标记的多核苷酸，或者异源或外源DNA区域。在具体的实施例中，所靶向基因座可包含来自原核生物、真核生物、动物或植物，包括非人哺乳动物、非人细胞、啮齿动物、人、鼠、灵长类动物或任何其他目标生物体，或者它们的组合的天然、异源或外源基因组核酸序列。

在本申请第十种典型的实施方式中，提供了一种靶向和编辑靶核酸的方法，该方法包括使靶核酸与上述基因编辑系统接触。

在本申请第十一种典型的实施方式中，提供了一种在识别靶核酸后非特异性降解单链DNA的方法，该方法包括使靶核酸与上述基因编辑系统接触。利用近似于Cas12i的旁切效应的活性，能够实现上述方法。Cas12i蛋白可具有附带活性，即在某些环境中，激活的Cas12i蛋白在结合靶序列后仍然保持活性，并继续非特异性地切割非靶寡核苷酸。该附带活性被称为“旁切活性”或“乱切活性”，利用该活性，能够使用Cas12i系统检测特定靶寡核苷酸的存在。比如，将Cas12i系统工程化以非特异性切割ssDNA或转录物。比如，Cas12i在体外系统或细胞中瞬时或稳定地提供或表达，并靶向或触发以非特异性地切割细胞核酸，例如ssDNA，例如病毒ssDNA。

在现有技术中，上述旁切活性能够应用于称为SHERLOCK的高灵敏度和特异性核酸检测平台，该平台可用于许多临床诊断。利用“旁切活性”进行检测时，会用到报告核酸，“报告核酸”是指可被激活的CRISPR系统蛋白切割或以其他方式减活的分子。报告核酸包含可被CRISPR蛋白切割的核酸元件。核酸元件的切割释放出剂或产生构象变化，从而允许产生可检测的信号。在切割之前，或者当报告核酸处于“活性”状态时，报告核酸阻止阳性可检测信号的产生或检测。比如，在存在活性报告核酸的情况下可产生最小的背景信号。阳性可检测信号可以是可使用光学、荧光、化学发光、电化学或本领域已知的其他检测方法检测的任何信号。例如，在某些实施方式中，当存在报告核酸时，可检测到第一信号(即阴性可检测信号)，然后在检测到靶分子以及通过激活的CRISPR蛋白切割或减活后将其转换为第二信号(例如阳性可检测信号)。利用上述方法或上述CRISPR-Cas效应子蛋白，能够实现上述应用。

在本申请第十二种典型的实施方式中，提供了一种在识别双链靶DNA的间隔子互补链后靶向双链靶DNA的非间隔子互补链并使其产生切口的方法，该方法包括使双链靶DNA与上述基因编辑系统接触。

在本申请第十三种典型的实施方式中，提供了一种靶向和切割双链靶DNA的方法，该方法包括使双链靶DNA与上述基因编辑系统接触。

在一种优选的实施例中，在使双链DNA的间隔子互补链产生切口之前，使双链靶DNA的非间隔子互补链产生切口。

在本申请第十四种典型的实施方式中，提供了一种特异性编辑双链核酸的方法，该方法包括在充分的条件下使以下进行接触充分的时间量，(1)上述CRISPR-Cas效应子蛋白、或CRISPR-Cas效应子融合蛋白、另一具有序列特异性切口活性的酶，以及RNA指导物，RNA指导物指导CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白，相对于另一序列特异性切口酶的活性使相对链产生切口；以及(2)双链核酸；上述方法导致双链断裂的形成。

在上述方法中，可以将两种上述CRISPR-Cas效应子蛋白、或CRISPR-Cas效应子融合蛋白、或者一种上述蛋白和另一种具有切口活性的Cas蛋白(两种Cas蛋白被一对RNA指导物靶向到靶基因座的相对链)可以产生具有突出端的双链断裂。这种方法可降低脱靶修饰的可能性，因为双链断裂预计只发生在两种酶都产生切口的基因座处，从而增加基因组编辑特异性。该方法也称为“双切口”或“配对切口酶”策略。

在本申请第十五种典型的实施方式中，提供了一种编辑双链核酸的方法，该方法包括在充分的条件下使以下进行接触充分的时间量：(1)上述CRISPR-Cas效应子蛋白、或CRISPR-Cas效应子融合蛋白，和具有DNA修饰活性的蛋白质结构域的融合蛋白，以及靶向双链核酸的RNA指导物；以及(2)双链核酸；融合蛋白的CRISPR-Cas效应子被修饰以使双链核酸的非靶链产生切口。利用近似于Cas12i的旁切效应的活性，能够实现上述方法。上述双链核酸包括但不限于病毒DNA(例如，巴氏病毒、肝炎病毒、疱疹病毒、腺病毒、痘病毒、细小病毒等)。

在一种优选的实施例中，双链核酸的两条链在不同的位点被切割，导致交错切割；优选地，双链核酸的两条链在同一位点被切割，导致平双链断裂(DSB)。

在本申请第十六种典型的实施方式中，提供了一种靶向并切割单链靶DNA的方法，该方法包括使靶核酸与上述基因编辑系统接触。

上述基因编辑系统与靶核酸接触，能够利用基因编辑系统对靶核酸进行编辑。在充分的接触时间内，基因编辑系统能够靶核酸进行编辑。上述接触在细胞内、外均能实现。充分的条件和接触充分的时间量，表示上述方法能够进行或进行完全的反应条件和反应时间，根据上述方法的具体实施可进行灵活调整。上述基因编辑系统与靶核酸接触，能够利用基因编辑系统对靶核酸进行编辑，实现不同的基因编辑效果。在充分的接触时间内，基因编辑系统能够靶核酸进行编辑。上述接触在细胞内、外均能实现，靶核酸包括但不限于基因组、分离的单链或双链DNA。

在本申请第十七种典型的实施方式中，提供了一种诱导细胞状态改变的方法，上述方法保守使上述基因编辑系统与细胞中的靶核酸接触。

在一种优选的实施例中，细胞状态包括但不限于凋亡或休眠；优选地，细胞包括真核细胞或原核细胞；优选地，细胞包括但不限于哺乳动物细胞或植物病变细胞；优选地，细胞包括但不限于癌细胞；优选地，细胞包括但不限于感染性细胞或被感染原感染的细胞；优选地，细胞包括但不限于被病毒感染的细胞、被朊病毒感染的细胞；优选地，细胞包括但不限于真菌细胞、原生动物或寄生虫细胞。

上述诱导细胞状态改变的方法，通过基因编辑系统接触细胞中调控生长、代谢等功能的靶核酸，从而时间对靶核酸的修饰，进而诱导细胞状态改变。如对癌细胞、寄生虫细胞等中的特征靶核酸进行修饰，从而改变细胞的状态，使之凋亡或休眠，达到清除此类细胞的目的。

在本申请第十八种典型的实施方式中，提供了一种利用上述基因编辑系统在制备治疗受试者病症或疾病的药物中的应用。

在一种优选的实施例中，应用包括向受试者或受试者的离体细胞施用基因编辑系统；优选地，间隔子序列与跟病症或疾病相关的靶核酸的至少15个核苷酸互补，CRISPR-Cas效应子蛋白或CRISPR-Cas效应子融合蛋白切割靶核酸；优选地，病症或疾病包括但不限于癌症或感染性疾病；优选地，癌症包括但不限于维尔姆斯瘤、尤文肉瘤、神经内分泌瘤、胶质母细胞瘤、神经母细胞瘤、黑色素瘤、皮肤癌、乳腺癌、结肠癌、直肠癌、前列腺癌、肝癌、肾癌、胰腺癌、肺癌、胆道癌、宫颈癌、子宫内膜癌、食管癌、胃癌、头颈癌、甲状腺髓样癌、卵巢癌、胶质瘤、淋巴瘤、白血病、骨髓瘤、急性淋巴细胞白血病、急性髓细胞性白血病、慢性淋巴细胞白血病、慢性髓细胞性白血病、何杰金氏淋巴瘤、非何杰金氏淋巴瘤或尿膀胱癌中的一种或多种；优选地，病症或疾病包括但不限于囊性纤维化、进行性假肥大性肌营养不良、贝克肌营养不良、α-1-抗胰蛋白酶缺乏、庞贝病、强直性肌营养不良、亨廷顿病、脆性X综合征、弗里德赖希共济失调、肌萎缩侧索硬化、额颞叶痴呆、遗传性慢性肾脏病、高脂血症、高胆固醇血症、莱伯氏先天性黑蒙、镰状细胞病或β地中海贫血中的一种或多种；优选地，感染性疾病的感染原包括但不限于人类免疫缺陷病毒、单纯疱疹病毒-1或单纯疱疹病毒-2中的一种或多种。

利用上述基因编辑系统，能够应用于制备治疗受试者病症或疾病的药物。此种应用包括对受试者或其离体细胞施用基因编辑系统，对于受试者的施用包括局部施用、全身施用或靶向施用等，进而达到药物的作用。间隔子序列与跟病症或疾病相关的靶核酸的至少15个核苷酸互补，能够保证间隔子序列与靶核酸实现稳定的特异性结合，防止脱靶情况的发生。上述病症或疾病包括但不限于癌症或感染性疾病，通过该应用能够对癌细胞基因组或受试者缺陷基因等靶核酸进行修饰，进而达到药物的作用。

在本申请第十九种典型的实施方式中，提供了一种真核细胞系，该真核细胞系包含上述含有基因编辑系统的细胞，或为含有基因编辑系统的细胞的后代。

在本申请第二十种典型的实施方式中，提供了一种多细胞生物体，该多细胞生物体包含上述含有基因编辑系统的细胞。

在一种优选的实施例中，多细胞生物体包括但不限于模型动物或模型植物。

上述多细胞生物体为利用上述基因编辑系统修饰过的多细胞生物体，在上述基因编辑系统的作用下获得可遗传或不可遗传的基因修饰。上述基因修饰包括利用基因编辑系统进行的基因插入、删除或替换，基因修饰的结果，及该多细胞生物体的基因修饰为可控制和可预期的。

在本申请第二十一种典型的实施方式中，提供了一种获得目的性状的植物的方法，利用上述基因编辑系统与植物细胞接触，对植物细胞的基因进行修饰或引入目的基因，修饰或目的基因能够表达目的性状，获得修饰后的植物细胞，利用修饰后的植物细胞进行再生，获得目的性状的植物。

在本申请第二十二种典型的实施方式中，提供了一种鉴定植物中目的性状的方法，植物细胞中的目的基因能够表达目的性状，利用上述基因编辑系统与植物细胞接触，从而鉴定目的基因。

在本申请第二十三种典型的实施方式中，提供了一种试剂盒，该试剂盒包括一种或多种选自下列的组分：上述CRISPR-Cas效应子蛋白、CRISPR-Cas效应子融合蛋白、DNA分子、重组载体、宿主细胞、基因编辑系统、基因编辑载体、含有基因编辑系统的细胞、真核细胞系、多细胞生物体；试剂盒的组分分布在在相同或不同的容器中。

在本申请第二十四种典型的实施方式中，提供了一种容器，该容器包含上述试剂盒。

在一种优选的实施例中，容器包括无菌容器；优选地，容器包括注射器。

在本申请第二十五种典型的实施方式中，提供了一种可植入装置，该可植入装置包括上述基因编辑系统。

在一种优选的实施例中，基因编辑系统在基质内；优选地，基因编辑系统在储库内。

可使用可植入装置将本发明的CRISPR-Cas效应子蛋白、CRISPR-Cas效应子融合蛋白、本公开的RNP、本公开的核酸(例如，上述DNA分子、重组载体、基因编辑载体、CRISPR-Cas效应子指导RNA、编码CRISPR-Cas效应子指导RNA的核酸、编码CRISPR-Cas效应子蛋白的核酸、供体模板等)或本公开的CRISPR-Cas效应子系统递送至靶细胞(例如，体内靶细胞，其中靶细胞是循环中的靶细胞、组织中的靶细胞、器官中的靶细胞等)。适用于将本公开的CRISPR-Cas效应子多肽、本公开的CRISPR-Cas效应子融合多肽、本公开的RNP、本公开的核酸或本公开的CRISPR-Cas效应子系统递送至靶细胞(例如，体内靶细胞，其中靶细胞是循环中的靶细胞、组织中的靶细胞、器官中的靶细胞等)的可植入装置可包括容器(例如，储库、基质等)，所述容器包含CRISPR-Cas效应子蛋白、CRISPR-Cas效应子CRISPR-Cas效应子融合蛋白、RNP或CRISPR-Cas效应子系统(或其组分，例如本公开的核酸)。

合适的可植入装置可包括例如用作装置主体的聚合物基底(诸如基质)，并且在一些情况下包括另外的支架材料(诸如金属或另外的聚合物)，以及增强可见性和成像的材料。可植入递送装置可有利于在局部和长时间内提供释放，其中待递送的多肽和/或核酸直接释放至靶位点，例如细胞外基质(ECM)、肿瘤周围的脉管系统、病变组织等。合适的可植入递送装置包括适用于递送至腔(诸如腹腔)和/或其中药物递送系统未锚定或附接的任何其他类型的施用的装置，所述装置包括生物稳定的和/或可降解的和/或生物可吸收的聚合物基底，其可以例如任选地是基质。

上述基质包括在与生物环境接触后被有效加工和/或改型而不形成生物学活性、毒性和/或有害的副产物的材料。包括但不限于生物可吸收基质，可用于生物可吸收基质的材料包括例如生物聚合物(例如蛋白质、肽、碳水化合物、多核苷酸等)、合成聚合物、蛋白质、多糖、丝、聚癸二酸甘油酯(PGS)、聚二恶烷酮、聚乳酸-羟基乙酸共聚物(PLGA)、聚乳酸(PLA)、胶原、壳聚糖、丝蛋白及其组合。可用于生物可吸收基质的丝材料包括例如蚕丝蛋白、改性蚕丝蛋白、蜘蛛丝、昆虫丝、重组丝及其任意组合。上述储库储库组合物包括可生物侵蚀、可生物相容的聚合物的基质，包括但不限于高分子凝胶储库或膜控储库。

在一些情况下，合适的可植入药物递送装置包含可降解聚合物，其中主要释放机制是整体侵蚀(bulkerosion)。在一些情况下，合适的可植入药物递送装置包含不可降解或缓慢降解的聚合物，其中主要释放机制是扩散而不是整体侵蚀，使得外部部分用作膜并且其内部部分用作药物储库，实际上，所述药物储库长时间内(例如约一周至约几个月)不会受到周围环境的影响。也可任选地使用具有不同释放机制的不同聚合物的组合。在总释放期的有效期内，浓度梯度可保持有效恒定，并且因此扩散速率是有效恒定的(称为“零模式”扩散)。术语“恒定”意指扩散速率维持高于治疗有效性的下阈值，但其仍然任选地以初始突发为特征并且/或者可波动，例如增加和降低到某一程度。扩散速率可长时间这样维持，并且可认为扩散速率恒定到某一水平以优化治疗有效期，例如有效的沉默期。

在一些情况下，可植入递送系统被设计成保护基于核苷酸的治疗剂免于降解，无论是化学性质还是由于受试者体内酶和其他因素的攻击而引起的降解。可选择装置的植入位点或靶位点，用于获得最大的治疗功效。

下面将结合具体的实施例来进一步详细解释本申请的有益效果。

实施例1

CasY1、CasY2、CasY3、CasY4和CasY5(即CasY1-CasY5)基因和RNA指导物的获取。

下载NCBI和JGI数据库的微生物基因组和宏基因组数据，总共得到了20TB的高质量数据。

用TBLASTN(https：//blast.ncbi.nlm.nih.gov/)对宏基因组数据进行本地比对，获得了5种全新的CRISPR-Cas效应子蛋白，即CasY1(SEQ ID NO：1)和CasY2(SEQ ID NO：2)、CasY1(SEQ ID NO：3)、CasY4(SEQ ID NO：4)、CasY5(SEQ ID NO：5)。

SEQ ID NO 1：

MNKMKKTKKLDVRKSYSGRLNPNDRKREHLQRSLRALRKGSEFFFDLVQAWCGGLTPEMLEENAKADDLIDLWCAIYWFRPVSTTVATHPINQNDLVATFENYYGGKASSLVNEYLTAPIGEEFLWNDCRQKYEHFCRDFGADFTNDLRTLLRNNLIAVASNKSELETSTISSLFGTGVKASRSVKVEVLEKILNAVQNLEKIPDDCRSIQKIILESAQANDLNEFKIVYSGGNKSNKDGTTKKGNGRPSFLEEFLKLNGDEKLTPSKFKEFFEKLIEEIKKKKQDMSWDHAQRLREYIENNTATKYDAWAWEEMLKSGQTPLKSKATRNYSFTKERAEQFVEIQKNQDLEIVNDLNGFFESEFFNGEYKFVICQFHIGNDDLEKLFKFWNETDADVWNEDTELILNDFCDDLKNSFNRTPIKNVLKYLFQ FRKKYTAKQLVNAAKYNEQFDKYKNRKVHPSVLGNQGFTWPNALIPPDKAQRSDRENSLDLRIWLYIKLLHEDGTWKKHHVCFHNSRFFSEVYAAGSNEIEPVKFRTPRFGTTLPKLTAQTPIRVAKKYVKIAKREAKVRLAAQQGLLPKISIPLNELSAVINDSLGVTIPVKFKVDQPSRIPKLNDIILGYDQNQTASHAYSLWQVVEENTPDSFYYEGKGWECHVKFLRSGDVTSLTKTKKDDVIDQLSYEGLDYKNYADWKRTAKRFADNWTISKGKEITPAVDRFESIERWQPRLYRFNKDYAYILRDIVRGKSLAELQQIRPEIFRFITQGFGVCRLGSLSLDALEAVKAAKGVVYSYFSTALNGSKENPISDEQRKEFDPELFKLLEKLEFIRTKKKQQKVDRIGNSVLSIALENQAKFIRGEESLPTTNKSTKKKQNGRSMDWLARGVANKIRQLAEMHEIGLLNVDPRFTSHQDPLVHNNPNKAMKCRYTAAPISEIGDNVLAKLSANLKNKNRGTTGEYYHQGMKEFLEHYGLQNIENDLLKWRKKRPTIQCWELQKILAEKFGNEETVIYFPAKGGRKYFATHKVASDAVSMMFNGKNVWLCNSDHVAAANIALSELNKISLPRLWTKSEQPDEPSDDEKTDATPRNS。

SEQ ID NO 2：

MEAGKVGKKGKTNKKFIIRPYLTELNLREDGRLAFQKTFDYMDEQQAALFILGGSVMSHLDESIIRRLGLHKGSKKDLPQRLRVSLHLAIARFRLVSVNYHLDAKAISRMSPTARLAHEQLAEAHRASLIKSPISVWRNRHGVPDEAVHAYLDGNYDPETYAWQDTAMLAKKLCGILKLSPEDFKEASEAMMRNVNFLGCSGSTGSGSSVSNLFGQNEKEDSRNQARIESKTAKVIGKLLESRRPIPMERAVSLVCKSLGHPDAEAAGEDHGGQTDKSTFRQFMRGDYGGSLKELAKKLQKDAHKHRNKSIIPHRETIGAFIKQCASGEFYNKATSESWKDFNAMMNGKYKHNIIFVTEKIALGNAMRKLESNEKAVKASKQLEKLIDKYEMDGNKRFVPKVASVNGLEAYRDVIQDNPQEDDESVKDWLKRLWTTFSEGNDRRLKTPFRWLVESLARLETPESAIKDGCRLMSIRHKHESQRPHPFVRVQSRFTVGDSNIAGSINKPTELKPNRDGRSPEDYWGGNPVVWMSCRLLNGNRWQDMRIPIHNSRYINEVYYTRMGPDGNHALPLKEHARDVKHDYEAETKISRTAARRVNENRMLRRGKPSKRFERVKANSTHNVVFDPKTTASFNRRQDDIYGTINHRHPMVPLAPDGFFAVGGNVIGIDLGESVPLAAGILQKCTSTDSEAVRYACGHWKVVGMGKPGQLLDRQTSANRRKQPHTIIDPMSNMGEPFSSPICQKFIAKCRKFVRAKGSEEDNKAFDDMVKREPSLYSFHGRWGWLLKQMMKAAKGARLDPFREHLEWLLFRTKYGPTNRKSLNLNSMASTKNVISAIDSYMSRRGWKTVEQRQRRDGRLQAARSSLQSNLVNRRLERIKKEESQCIRLAHLFAVTTHLVLEDNLPKQNGASSRADNGRKADWRSRHLAQRLCGIKNDSGSCAIAGVRARRIDPVMTSHMDPFVYSLDNKWAMRARYTKVSLSSMTDYHANLIRSILLEKPGKRQTTEYYQRAVQDFARLHGLDVDEMRKVREARWYKKRIKAKTLYIPCRGGRVFLSTHRLQSDTPHTDSSGAVLWEQDADQVAALNVALRYIDQCYRSNKKGLAKVKKPK。

SEQ ID NO 3：

MSEITAIKTYNSNLFANSEKNIKYLRDTGVALKNTTNVFRGLLVAFYGGITPEIARENIKIIKKEKSLDMDLIYAINRFRPVRSNSDLAKYQIPQPVMRGKFESVVGHEASELAAEFLNSPIGEDYVWIDGLRAYEDLKSQIGDFDYDLKVMVRENILPIYNFPNIEASASISRIFGNGKKEDREFKVGVVKKIKELILNSDLGDDYSVLQQIILSAAGAKDMKEFSKTYVGKAAGRRGKIQNILLENSNKKLGANTIQSVLEKCDEIVCEKSSKLIWKNNQGLLKYIEIQSDLSYDPKAYSECFKAALAEIQPKNTVNYNFAVKRLQNKKDLESNVQAMQNSAMLNNYFDSHYFQGSNNFVICPYHLGGENLSQLFKIYKNIGDSTEAVKEYCSELRGSVKDPIPSLCEYVLTLRDLSCKQIIGAASYNQLIQRYKDHKVHPTKDGNNNYTFSTGSAMYGCLIPPNKAKKTDRPGSPDSRIWMILRVLNGKKWEDHHYYIHNVRFLEEVYAHNPEFKGDPVAIRGGRFGGIGKKICESSLQSLRENPQKYRKTKKRLLRLQESIKNNSLPNINWNEKIASIGVRFDHNNFKATINFKIKVNHKKFEGLKVGDKIMSYDQNQTQSHAYAVMNVCNSFDSGAIPFRGHYVQVNETGKIRSNIQVGQNNYDPLSYSGLSFEKYENWRNQRKNFVSKYRFIIGKNNENCDMLEELEKIESRKPSLYEYNYKYSAILRKIVRGTSGVKLDECRKEIISFLAKEQASIRNVSSLNHHSFSAFRSAKSLISAYFAASTGLNISTDEQKQDNDPEIFEIRKDLERSRKNKCREKINKISNTIVTIANMEGCNIICGEFGLSSTGSKNNTKKQNNKNMDWLARGVEKKIKEMCLLHNIHFKDAPPHYTSHQDPFVYNNTLLKVESVDHMKARFAYLSVDDVEEWHLKKLSSYLKNNKNGTAYYYNSATKQFLDHYGLVEHEEKITKNKLSLSKFKDILIKNFGNVNIVMPLRGGRYYLASKNVVTGAVPFSFGGSCYLSDADEVAAINVGLTIFPQQNS。

SEQ ID NO 4：

MLMLGDIVPYDSVGEIDGWGAVSRTFGKDKKADIAVQKKFCDEVLSKINEENCKTFEDYKKIIFEIFNASTIKELKNTWNSGAGVRSAKVIDNLGKDTDPEFTFEKERKNWESVQEEKSFIPNRPNYWAIIHYMEGKIGDEVDNSSWAVMYQNAIIDICSKITRNHNFSYEQTERKKELSKCDTSALELVNGYFKSTYFKSGNEFIIENRHVPNIGRLIELYSELTVVNDDNINEIIEIVDSETKVNENTTGDNQLKKYILSISGFATVHQIEQAMKYNKIKDDIEQTKAHPFVSGNASFTVGNSALKGSIASQNSKHKGKIAGQSAKIWLYIHLYHKDIKEWREHHIPFYHAKFFEEVYYFDPALTETVKIRNKKMKTNITKENIVRDGIDPRFAEKNIRTAAVRQNCRANVAMIPSSLELTKKNGEFTITISQRFPKGLKRKKSDIRLNDIVMAYDQNQTRPNTYSILRVTSTTKDKDGRYPCEFIKGGDIRSFINTKIGDIDVINYDGVDNTTTFFVDFVRGRTEFIHSVCNLDAFKKTNDNNLKYDFNCLGELARTNREQTKLYRWQNWYLRLLLTMMKLSKGSIPGLRSEIIYVVRFMDEKSSLSQICIENIRSMKKIINSWFSYEMKNQDATNEEKELHDKEMYALLKRIEQRRSNKNKERIRKIASAIVAIAQQEGANIIVGEKELDTKKKGKNKASNNRAMDWCPGQVSEKVKHGVDLLDISFFTMPAFYTSHQDPFVYSDSNREMRPRMDEINPEAPNAERKIKSFVTLAKMKPKKETMTQYYSDGVDRFCVHNNITRAELKKIKTRNDWIARLGSEKCLVPVRGGRYYLSAKVAASGATQIVYAGETRYLSSADHIAATNIGLSFLVPYDPEKQKKKKGKNQTAVDKTSTVA。

SEQ ID NO 5：

MASDVTSYMTYRANLVPDARKKKLLNDTYAFYRKGEELFFDAFFDILGGVSPQLINTLVNDGTIKAENDATDEEKNDITEEDKNNTSKKKLDPKLLCAILWFRLVKKEKNTCEILNVKLLKEKFSAYYGAEANDTVISYFSANYDVENYMWVDCRVRCLSFCNKLGTSLDVLAIDLESMLRAKNIAFFGGVGKADKAISNIFIRSEKRGKSNVKKLHEYAVNTIDILEKTEVINSDQYLDVLLRVFGAANIDELQNICKKENGGSKLVKPIGQFLNSKFVFDPKKVKKSWVDLAKEKSYAPNYPSCDKLKIYIENKLGKLGQLTKPKNKVSDDDEQGSNKGLWSSMFRNAITSICAAVTHNYSFSIGQTDRQEKLSILRKSNGSIANEINENFPQKDQYTIMPYHVPDLKNTIRLYNGLNQKTDEEIAGILNTINNNEKAKRKKHGDVRAQAYILSLYTSNSTKYTEKSITDALKINKIEDTIKNQKVHPFVLGNAGMRFGGDDNCVGRIERPSVFVKELGCYAGESDKMWITIKVIDEGRWKTHHIPFFQAKYYEELYAFDPDPEKKETVNIRMNKTNTLAKKGNTSNAGMFNESFYEGNDEETKMKRKKYRQKRVRNKVALENLKYNVDFVDPTFVLFKNSEGFGINISQNIQDPTGLKGEITTGQNIMGIDQNRDRSNSYSIWRITGDQANGIYPAEFVKSGDISSLIKTNKKDEKGNKKEYDVFTYDGLNTDSEKLNSFFADRKAFIYGLDPAVFNTSEYNIFFEYEKIKNEKKKIYQWNGSYLSLLRKVLTMSKGNTEKLKNEIRKEIINVIRLIDGKSSLSHCCIMNMQGMIKVINSWFAYTMGENSSTEDQKKEYDSEMYNLLLYVRKRRKNKKTEKINKMANAIICTAIENNVKHIILEALDKKGDKGNSRQNNASNMDWCAKGIIDKVITGCRFVDINVRKVNPAYTSHQDPMVHNKNNPAMKPRIAKIDMVEKNNWAVEKLVSISSMDPKENSAEIHYFNFIDVFCRQYKIDRKDLNKIKKISDLQDLMAEKHSFIYVPSRGGQYYLSTHRVTSCDDDIQILYDGKNVWLANSDHIAAANIVLRGLDYSPSPKKKNKTDLDLAAVGG。

图1示出了CasY1-CasY5的蛋白结构域示意图，其中D、E、D代表RuvC结构域的三个保守基序Ⅰ、Ⅱ、Ⅲ的催化残基，h表示桥螺旋结构。D-E-D表示Asp-Glu-Asp氨基酸，是RuvC结构域的保守氨基酸残基。

CasY1的编码DNA序列如SEQ ID NO：6所示，CasY2的编码DNA序列如SEQ ID NO：7所示，CasY3的编码DNA序列如SEQ ID NO：8所示，CasY4的编码DNA序列如SEQ ID NO：9所示，CasY5的编码DNA序列如SEQ ID NO：10所示。

CasY1-CasY5所对应的直接重复序列分别如SEQ ID NO：24、27、30、33、36所示，茎环结构的序列分别SEQ ID NO：25、28、31、34、37，RNA指导物(前crRNA序列)分别如SEQ IDNO：26、29、32、35、38所示。

对于CasY1、CasY2、CasY3、CasY4和CasY5的直接重复序列的二级结构进行分析，结果如图2所示。

实施例2

CasY1-CasY5基因的PAM序列的确定。

1.将CasY1蛋白的核酸序列(SEQ ID NO：6)和CasY1 crRNA-TTR序列(SEQ ID NO：11)克隆到表达载体pACYCDuet-1(SEQ ID NO：16)中，构建出重组质粒pACYCDuet1-CasY1-crRNA，所述重组质粒序列如SEQ ID NO：17所示。

同样地，将CasY2蛋白的核酸序列(SEQ ID NO：7)和CasY2 crRNA-TTR序列(SEQ IDNO：12)克隆到表达载体pACYCDuet-1中，构建出重组质粒pACYCDuet1-CasY2-crRNA，所述重组质粒序列如SEQ ID NO：18所示。

将CasY3蛋白的核酸序列(SEQ ID NO：8)和CasY3 crRNA-TTR序列(SEQ ID NO：13)克隆到表达载体pACYCDuet-1中，构建出重组质粒pACYCDuet1-CasY3-crRNA，所述重组质粒序列如SEQ ID NO：19所示。

将CasY4蛋白的核酸序列(SEQ ID NO：9)和CasY4 crRNA-TTR序列(SEQ ID NO：14)克隆到表达载体pACYCDuet-1中，构建出重组质粒pACYCDuet1-CasY4-crRNA，所述重组质粒序列如SEQ ID NO：20所示。

将CasY5蛋白的核酸序列(SEQ ID NO：10)和CasY5 crRNA-TTR序列(SEQ ID NO：15)克隆到表达载体pACYCDuet-1中，构建出重组质粒pACYCDuet1-CasY5-crRNA，所述重组质粒序列如SEQ ID NO：21所示。

2.将合成的PAM文库序列克隆到pUC19载体上，重组质粒pUC19-PAM如SEQ ID NO：22所示。

本申请在SEQ ID NO：22中的随机序列包括6个随机碱基(n)，即最终所构建的随机碱基序列种类达到4⁶，共4096种排列组合。

3.将pACYCDuet1-CasY1-crRNA和pUC19-PAM文库质粒共转到DH5α感受态细胞中，对照组为pACYCDuet-1和pUC19-PAM文库质粒共转。

同样地，也将pACYCDuet1-CasY2-crRNA和pUC19-PAM文库质粒共转到DH5α感受态细胞中；将pACYCDuet1-CasY3-crRNA和pUC19-PAM文库质粒共转到DH5α感受态细胞中；将pACYCDuet1-CasY4-crRNA和pUC19-PAM文库质粒共转到DH5α感受态细胞中；将pACYCDuet1-CasY5-crRNA和pUC19-PAM文库质粒共转到DH5α感受态细胞中。

转化有2种质粒的DH5α细胞，37℃条件下处理1小时后，抽提质粒并对PAM区域序列进行PCR扩增和高通量测序。

图3是体内筛选效应子和文库质粒设计的示意图，pACYC-Effector-crRNA质粒即为SEQ ID NO：17-21所示质粒(效应子质粒)，并设计了靶向PAM文库的pUC19-PAM文库质粒。

对于负选择筛选实验流程如下：

1)构建效应子质粒；

2)将效应子质粒和文库质粒转化到大肠杆菌中，然后生长，进行抗生素筛选；

3)利用靶向测序鉴定耗减的文库质粒，并利用小RNA测序鉴定成熟的crRNA。

图4是负选择筛选工作流的示意图。

4.分别统计实验组和对照组中4096种组合的PAM序列出现次数，并用PAM序列数目进行标准化，对于一条PAM序列，当log2(对照组标准化值/实验组标准化值)＞3.5时，即认为该条PAM序列被显著消耗，通过显著被消耗的PAM序列预测得到PAM结构域。

通过实验结果，观察到CasY1-CasY5对带有5’-TTA、5’-TTT、5’-TTC PAM的靶标序列进行有效编辑，CasY1-CasY5蛋白的PAM序列为5’-TTN结构。通过统计发现，CRISPR/CasY1、CRISPR/CasY2、CRISPR/CasY3、CRISPR/CasY4、CRISPR/CasY5系统对于5’-TTA、5’-TTT、5’-TTC的编辑活性远高于5’-TTG。CasY1、CasY2、CasY3、CasY4、CasY5的PAM结构域分析结果如图5所示。图5中的“Bits”即为“比特”，“Position”为“位置”。

实施例3

细菌体内切割活性确定

1.构建ccdb毒性质粒，ccdb毒性质粒如SEQ ID：23所示。将ccdb毒性质粒(SEQ IDNO：23)转入Top10感受态细胞中，通过梯度实验，发现当平板中加入64mM L-阿拉伯糖(L-ara)时，细菌致死，说明该剂量是致死剂量。

2.将pACYCDuet1-CasY1-crRNA重组质粒(SEQ ID NO：17)和ccdb毒性质粒共转到Top10感受态细胞中，再加入64mM L-阿拉伯糖(L-ara)时，部分细菌存活，说明在存活部分的细菌中CasY1蛋白对ccdb毒性质粒进行了切割。

同样地，将pACYCDuet1-CasY2-crRNA重组质粒(SEQ ID NO：18)、pACYCDuet1-CasY3-crRNA重组质粒(SEQ ID NO：19)、pACYCDuet1-CasY4-crRNA重组质粒(SEQ ID NO：20)、pACYCDuet1-CasY5-crRNA重组质粒(SEQ ID NO：21)分别和ccdb毒性质粒共转到Top10感受态细胞中，再加入64mM L-阿拉伯糖(L-ara)时，部分细菌存活，说明在存活部分的细菌中，CasY2-CasY5蛋白分别对ccdb毒性质粒进行了切割。

CasY1-CasY5蛋白在细菌体内的切割示意图如图6所示，切割活性鉴定结果如图7所示。

实施例4

CasY1-CasY5蛋白的体外切割活性

1.CasY1-CasY5蛋白的表达纯化

将分别表达CasY1-CasY5的Rosetta(DE3)pLyseS(EMD Millipore)细胞分别接种于10ml LB培养基中37℃过夜培养。待细菌的OD₆₀₀达到0.2时，将培养温度降至21℃继续培养，直到OD₆₀₀达到0.6，然后加入终浓度是500μM的IPTG以诱导Cas蛋白表达。诱导培养14-18小时后收集细胞，将细胞重悬于200ml裂解缓冲液(50mM HEPES[pH7]，2M NaCl，5mM MgCl，20mM imidazole)，其中含有蛋白酶抑制剂(Roche complete,EDTA-free，COEDTAF-RO)和溶菌酶(Sigma，10837059001)，进行匀浆。用超声处理(Branson Sonifier 450)裂解细胞。以10000×g离心1小时以清除裂解物。裂解物通过0.22μm过滤器(Millipore，Stericup)过滤，之后转移到镍柱(HisTrap FF，5ml)上，用咪唑梯度洗脱。将含有预期大小的蛋白质合并在一起，加入TEV蛋白酶(Sigma，T4455-10KU)，并将样品在TEV缓冲液中透析过夜(500mMNaCl，50mM HEPES[pH为7]，5mM MgCl，2mM DTT)。透析后将样品浓缩至500μl，在-80℃下冷冻储存。

2.体外切割测定

将纯化的蛋白质(25nM)在切割缓冲液(NEBuffer 3，5mM DTT)中37℃反应20分钟。分别使用500ng合成的TTR-2crRNA(pre-crRNA，SEQ ID NO:40、43、46、49、52)(南京金斯瑞生物科技有限公司合成)和200ng的靶DNA(dsDNA，如SEQ ID NO：57所示)进行裂解反应，蛋白质浓度分别为0nM，50nM，100nM，200nM，500nM和1μM。反应产物用纯化回收试剂盒回收(QIAGEN)。在TBE-尿素6％聚丙烯酰胺凝胶(Invitrogen)上检测切割效率。

SEQ ID NO：57：tagacaccaaatcttactggaaggcacttggcatctccccattccatgagcatgcagagg。

37℃条件下CasY1-CasY5蛋白具有明显切割活性。图8示出了体外切割活性结果，其中CasY1、CasY2、CasY3、CasY4、CasY5对靶dsDNA的体外切割活性分别如图8中的图a、图b、图c、图d、图e所示。

实施例5

293T细胞切割活性

1.将HEK293T细胞(购自ATCC)接种于添加了10％FBS(v/v)的DMEM培养基中(Gibco,11965092)，其中含1％Penicillin Streptomycin(v/v)(Gibco,15140122)，在含有5％CO₂的37℃细胞培养箱中进行培养。利用LONZA转染试剂(Lonza,Cat#V4XP-3032)按照说明书转染，细胞通过计数得2×10⁶个。

将CasY1蛋白：crRNA(金斯瑞生物科技有限公司化学合成)按照3μg：1.5μg的质量混合。同样地，将CasY2-CasY5蛋白和Lbcpf1蛋白(QRU95066.1，利用现有技术表达纯化后获得)均按照上述方式分别与多种crRNA(金斯瑞生物科技有限公司化学合成)按照上述比例混合，如表1所示。

表1

电转48h后分别收集细胞检测切割效率。

细胞进行基因组抽提(TIANGEN，DP304-03)。以基因组为模板，对靶点附近序列进行PCR扩增，扩增的PCR产物用于高通量深度测序(金唯智生物科技有限公司)。用于目标位点序列扩增的体系如下：2×Taq Master Mix(Vazyme，P112-03)25μL；Primer-F(10pmol/μL)1μL；Primer-R(10pmol/μL)1μL；模板1μL；ddH₂O补齐到50μL。

2.在293T细胞中CasY1、CasY2、CasY3、CasY4、CasY5蛋白和LbCpf1的切割活性，参见图9所示，indel表示插入缺失率。显示了在瞬时转染效应子蛋白和RNA指导物48小时后，由靶向293T细胞系中TTR基因座和PCSK9的CasY1-CasY5和LbCpf1 CRISPR效应子诱导的插入缺失活性。对不同的RNA指导物设计进行了测定，并显示出不同程度的功效。误差线表示3个重复情况下的S.E.M.。

说明在293T细胞中CasY1-CasY5蛋白可以实现不同位点的高效切割，并且切割效率优于LbCpf1。

从以上的描述中，可以看出，本发明上述的实施例实现了如下技术效果：上述CasY1、CasY2、CasY3、CasY4、CasY5蛋白，能够用于以靶向方式操纵核酸的系统、方法和组合物。由上述蛋白和RNA引导物组成的用于靶向修饰核酸(例如DNA)的非天然存在的工程改造的CRISPR-Cas系统，每个系统包括一起靶向核酸的一种或多种蛋白质组分和一种或多种核酸组分，能够在细胞内和外均发挥CRISPR-Cas系统的功能与活性。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

序列表

<110> 尧唐（上海）生物科技有限公司

<120> CRISPR-Cas效应子蛋白、其基因编辑系统及应用

<130> PN185203YTSW

<160> 57

<170> SIPOSequenceListing 1.0

<210> 1

<211> 1089

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<221> VARIANT

<222> (1)..(1089)

<223> CasY1

<400> 1

Met Asn Lys Met Lys Lys Thr Lys Lys Leu Asp Val Arg Lys Ser Tyr

1 5 10 15

Ser Gly Arg Leu Asn Pro Asn Asp Arg Lys Arg Glu His Leu Gln Arg

20 25 30

Ser Leu Arg Ala Leu Arg Lys Gly Ser Glu Phe Phe Phe Asp Leu Val

35 40 45

Gln Ala Trp Cys Gly Gly Leu Thr Pro Glu Met Leu Glu Glu Asn Ala

50 55 60

Lys Ala Asp Asp Leu Ile Asp Leu Trp Cys Ala Ile Tyr Trp Phe Arg

65 70 75 80

Pro Val Ser Thr Thr Val Ala Thr His Pro Ile Asn Gln Asn Asp Leu

85 90 95

Val Ala Thr Phe Glu Asn Tyr Tyr Gly Gly Lys Ala Ser Ser Leu Val

100 105 110

Asn Glu Tyr Leu Thr Ala Pro Ile Gly Glu Glu Phe Leu Trp Asn Asp

115 120 125

Cys Arg Gln Lys Tyr Glu His Phe Cys Arg Asp Phe Gly Ala Asp Phe

130 135 140

Thr Asn Asp Leu Arg Thr Leu Leu Arg Asn Asn Leu Ile Ala Val Ala

145 150 155 160

Ser Asn Lys Ser Glu Leu Glu Thr Ser Thr Ile Ser Ser Leu Phe Gly

165 170 175

Thr Gly Val Lys Ala Ser Arg Ser Val Lys Val Glu Val Leu Glu Lys

180 185 190

Ile Leu Asn Ala Val Gln Asn Leu Glu Lys Ile Pro Asp Asp Cys Arg

195 200 205

Ser Ile Gln Lys Ile Ile Leu Glu Ser Ala Gln Ala Asn Asp Leu Asn

210 215 220

Glu Phe Lys Ile Val Tyr Ser Gly Gly Asn Lys Ser Asn Lys Asp Gly

225 230 235 240

Thr Thr Lys Lys Gly Asn Gly Arg Pro Ser Phe Leu Glu Glu Phe Leu

245 250 255

Lys Leu Asn Gly Asp Glu Lys Leu Thr Pro Ser Lys Phe Lys Glu Phe

260 265 270

Phe Glu Lys Leu Ile Glu Glu Ile Lys Lys Lys Lys Gln Asp Met Ser

275 280 285

Trp Asp His Ala Gln Arg Leu Arg Glu Tyr Ile Glu Asn Asn Thr Ala

290 295 300

Thr Lys Tyr Asp Ala Trp Ala Trp Glu Glu Met Leu Lys Ser Gly Gln

305 310 315 320

Thr Pro Leu Lys Ser Lys Ala Thr Arg Asn Tyr Ser Phe Thr Lys Glu

325 330 335

Arg Ala Glu Gln Phe Val Glu Ile Gln Lys Asn Gln Asp Leu Glu Ile

340 345 350

Val Asn Asp Leu Asn Gly Phe Phe Glu Ser Glu Phe Phe Asn Gly Glu

355 360 365

Tyr Lys Phe Val Ile Cys Gln Phe His Ile Gly Asn Asp Asp Leu Glu

370 375 380

Lys Leu Phe Lys Phe Trp Asn Glu Thr Asp Ala Asp Val Trp Asn Glu

385 390 395 400

Asp Thr Glu Leu Ile Leu Asn Asp Phe Cys Asp Asp Leu Lys Asn Ser

405 410 415

Phe Asn Arg Thr Pro Ile Lys Asn Val Leu Lys Tyr Leu Phe Gln Phe

420 425 430

Arg Lys Lys Tyr Thr Ala Lys Gln Leu Val Asn Ala Ala Lys Tyr Asn

435 440 445

Glu Gln Phe Asp Lys Tyr Lys Asn Arg Lys Val His Pro Ser Val Leu

450 455 460

Gly Asn Gln Gly Phe Thr Trp Pro Asn Ala Leu Ile Pro Pro Asp Lys

465 470 475 480

Ala Gln Arg Ser Asp Arg Glu Asn Ser Leu Asp Leu Arg Ile Trp Leu

485 490 495

Tyr Ile Lys Leu Leu His Glu Asp Gly Thr Trp Lys Lys His His Val

500 505 510

Cys Phe His Asn Ser Arg Phe Phe Ser Glu Val Tyr Ala Ala Gly Ser

515 520 525

Asn Glu Ile Glu Pro Val Lys Phe Arg Thr Pro Arg Phe Gly Thr Thr

530 535 540

Leu Pro Lys Leu Thr Ala Gln Thr Pro Ile Arg Val Ala Lys Lys Tyr

545 550 555 560

Val Lys Ile Ala Lys Arg Glu Ala Lys Val Arg Leu Ala Ala Gln Gln

565 570 575

Gly Leu Leu Pro Lys Ile Ser Ile Pro Leu Asn Glu Leu Ser Ala Val

580 585 590

Ile Asn Asp Ser Leu Gly Val Thr Ile Pro Val Lys Phe Lys Val Asp

595 600 605

Gln Pro Ser Arg Ile Pro Lys Leu Asn Asp Ile Ile Leu Gly Tyr Asp

610 615 620

Gln Asn Gln Thr Ala Ser His Ala Tyr Ser Leu Trp Gln Val Val Glu

625 630 635 640

Glu Asn Thr Pro Asp Ser Phe Tyr Tyr Glu Gly Lys Gly Trp Glu Cys

645 650 655

His Val Lys Phe Leu Arg Ser Gly Asp Val Thr Ser Leu Thr Lys Thr

660 665 670

Lys Lys Asp Asp Val Ile Asp Gln Leu Ser Tyr Glu Gly Leu Asp Tyr

675 680 685

Lys Asn Tyr Ala Asp Trp Lys Arg Thr Ala Lys Arg Phe Ala Asp Asn

690 695 700

Trp Thr Ile Ser Lys Gly Lys Glu Ile Thr Pro Ala Val Asp Arg Phe

705 710 715 720

Glu Ser Ile Glu Arg Trp Gln Pro Arg Leu Tyr Arg Phe Asn Lys Asp

725 730 735

Tyr Ala Tyr Ile Leu Arg Asp Ile Val Arg Gly Lys Ser Leu Ala Glu

740 745 750

Leu Gln Gln Ile Arg Pro Glu Ile Phe Arg Phe Ile Thr Gln Gly Phe

755 760 765

Gly Val Cys Arg Leu Gly Ser Leu Ser Leu Asp Ala Leu Glu Ala Val

770 775 780

Lys Ala Ala Lys Gly Val Val Tyr Ser Tyr Phe Ser Thr Ala Leu Asn

785 790 795 800

Gly Ser Lys Glu Asn Pro Ile Ser Asp Glu Gln Arg Lys Glu Phe Asp

805 810 815

Pro Glu Leu Phe Lys Leu Leu Glu Lys Leu Glu Phe Ile Arg Thr Lys

820 825 830

Lys Lys Gln Gln Lys Val Asp Arg Ile Gly Asn Ser Val Leu Ser Ile

835 840 845

Ala Leu Glu Asn Gln Ala Lys Phe Ile Arg Gly Glu Glu Ser Leu Pro

850 855 860

Thr Thr Asn Lys Ser Thr Lys Lys Lys Gln Asn Gly Arg Ser Met Asp

865 870 875 880

Trp Leu Ala Arg Gly Val Ala Asn Lys Ile Arg Gln Leu Ala Glu Met

885 890 895

His Glu Ile Gly Leu Leu Asn Val Asp Pro Arg Phe Thr Ser His Gln

900 905 910

Asp Pro Leu Val His Asn Asn Pro Asn Lys Ala Met Lys Cys Arg Tyr

915 920 925

Thr Ala Ala Pro Ile Ser Glu Ile Gly Asp Asn Val Leu Ala Lys Leu

930 935 940

Ser Ala Asn Leu Lys Asn Lys Asn Arg Gly Thr Thr Gly Glu Tyr Tyr

945 950 955 960

His Gln Gly Met Lys Glu Phe Leu Glu His Tyr Gly Leu Gln Asn Ile

965 970 975

Glu Asn Asp Leu Leu Lys Trp Arg Lys Lys Arg Pro Thr Ile Gln Cys

980 985 990

Trp Glu Leu Gln Lys Ile Leu Ala Glu Lys Phe Gly Asn Glu Glu Thr

995 1000 1005

Val Ile Tyr Phe Pro Ala Lys Gly Gly Arg Lys Tyr Phe Ala Thr His

1010 1015 1020

Lys Val Ala Ser Asp Ala Val Ser Met Met Phe Asn Gly Lys Asn Val

1025 1030 1035 1040

Trp Leu Cys Asn Ser Asp His Val Ala Ala Ala Asn Ile Ala Leu Ser

1045 1050 1055

Glu Leu Asn Lys Ile Ser Leu Pro Arg Leu Trp Thr Lys Ser Glu Gln

1060 1065 1070

Pro Asp Glu Pro Ser Asp Asp Glu Lys Thr Asp Ala Thr Pro Arg Asn

1075 1080 1085

Ser

<210> 2

<211> 1112

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<221> VARIANT

<222> (1)..(1112)

<223> CasY2

<400> 2

Met Glu Ala Gly Lys Val Gly Lys Lys Gly Lys Thr Asn Lys Lys Phe

1 5 10 15

Ile Ile Arg Pro Tyr Leu Thr Glu Leu Asn Leu Arg Glu Asp Gly Arg

20 25 30

Leu Ala Phe Gln Lys Thr Phe Asp Tyr Met Asp Glu Gln Gln Ala Ala

35 40 45

Leu Phe Ile Leu Gly Gly Ser Val Met Ser His Leu Asp Glu Ser Ile

50 55 60

Ile Arg Arg Leu Gly Leu His Lys Gly Ser Lys Lys Asp Leu Pro Gln

65 70 75 80

Arg Leu Arg Val Ser Leu His Leu Ala Ile Ala Arg Phe Arg Leu Val

85 90 95

Ser Val Asn Tyr His Leu Asp Ala Lys Ala Ile Ser Arg Met Ser Pro

100 105 110

Thr Ala Arg Leu Ala His Glu Gln Leu Ala Glu Ala His Arg Ala Ser

115 120 125

Leu Ile Lys Ser Pro Ile Ser Val Trp Arg Asn Arg His Gly Val Pro

130 135 140

Asp Glu Ala Val His Ala Tyr Leu Asp Gly Asn Tyr Asp Pro Glu Thr

145 150 155 160

Tyr Ala Trp Gln Asp Thr Ala Met Leu Ala Lys Lys Leu Cys Gly Ile

165 170 175

Leu Lys Leu Ser Pro Glu Asp Phe Lys Glu Ala Ser Glu Ala Met Met

180 185 190

Arg Asn Val Asn Phe Leu Gly Cys Ser Gly Ser Thr Gly Ser Gly Ser

195 200 205

Ser Val Ser Asn Leu Phe Gly Gln Asn Glu Lys Glu Asp Ser Arg Asn

210 215 220

Gln Ala Arg Ile Glu Ser Lys Thr Ala Lys Val Ile Gly Lys Leu Leu

225 230 235 240

Glu Ser Arg Arg Pro Ile Pro Met Glu Arg Ala Val Ser Leu Val Cys

245 250 255

Lys Ser Leu Gly His Pro Asp Ala Glu Ala Ala Gly Glu Asp His Gly

260 265 270

Gly Gln Thr Asp Lys Ser Thr Phe Arg Gln Phe Met Arg Gly Asp Tyr

275 280 285

Gly Gly Ser Leu Lys Glu Leu Ala Lys Lys Leu Gln Lys Asp Ala His

290 295 300

Lys His Arg Asn Lys Ser Ile Ile Pro His Arg Glu Thr Ile Gly Ala

305 310 315 320

Phe Ile Lys Gln Cys Ala Ser Gly Glu Phe Tyr Asn Lys Ala Thr Ser

325 330 335

Glu Ser Trp Lys Asp Phe Asn Ala Met Met Asn Gly Lys Tyr Lys His

340 345 350

Asn Ile Ile Phe Val Thr Glu Lys Ile Ala Leu Gly Asn Ala Met Arg

355 360 365

Lys Leu Glu Ser Asn Glu Lys Ala Val Lys Ala Ser Lys Gln Leu Glu

370 375 380

Lys Leu Ile Asp Lys Tyr Glu Met Asp Gly Asn Lys Arg Phe Val Pro

385 390 395 400

Lys Val Ala Ser Val Asn Gly Leu Glu Ala Tyr Arg Asp Val Ile Gln

405 410 415

Asp Asn Pro Gln Glu Asp Asp Glu Ser Val Lys Asp Trp Leu Lys Arg

420 425 430

Leu Trp Thr Thr Phe Ser Glu Gly Asn Asp Arg Arg Leu Lys Thr Pro

435 440 445

Phe Arg Trp Leu Val Glu Ser Leu Ala Arg Leu Glu Thr Pro Glu Ser

450 455 460

Ala Ile Lys Asp Gly Cys Arg Leu Met Ser Ile Arg His Lys His Glu

465 470 475 480

Ser Gln Arg Pro His Pro Phe Val Arg Val Gln Ser Arg Phe Thr Val

485 490 495

Gly Asp Ser Asn Ile Ala Gly Ser Ile Asn Lys Pro Thr Glu Leu Lys

500 505 510

Pro Asn Arg Asp Gly Arg Ser Pro Glu Asp Tyr Trp Gly Gly Asn Pro

515 520 525

Val Val Trp Met Ser Cys Arg Leu Leu Asn Gly Asn Arg Trp Gln Asp

530 535 540

Met Arg Ile Pro Ile His Asn Ser Arg Tyr Ile Asn Glu Val Tyr Tyr

545 550 555 560

Thr Arg Met Gly Pro Asp Gly Asn His Ala Leu Pro Leu Lys Glu His

565 570 575

Ala Arg Asp Val Lys His Asp Tyr Glu Ala Glu Thr Lys Ile Ser Arg

580 585 590

Thr Ala Ala Arg Arg Val Asn Glu Asn Arg Met Leu Arg Arg Gly Lys

595 600 605

Pro Ser Lys Arg Phe Glu Arg Val Lys Ala Asn Ser Thr His Asn Val

610 615 620

Val Phe Asp Pro Lys Thr Thr Ala Ser Phe Asn Arg Arg Gln Asp Asp

625 630 635 640

Ile Tyr Gly Thr Ile Asn His Arg His Pro Met Val Pro Leu Ala Pro

645 650 655

Asp Gly Phe Phe Ala Val Gly Gly Asn Val Ile Gly Ile Asp Leu Gly

660 665 670

Glu Ser Val Pro Leu Ala Ala Gly Ile Leu Gln Lys Cys Thr Ser Thr

675 680 685

Asp Ser Glu Ala Val Arg Tyr Ala Cys Gly His Trp Lys Val Val Gly

690 695 700

Met Gly Lys Pro Gly Gln Leu Leu Asp Arg Gln Thr Ser Ala Asn Arg

705 710 715 720

Arg Lys Gln Pro His Thr Ile Ile Asp Pro Met Ser Asn Met Gly Glu

725 730 735

Pro Phe Ser Ser Pro Ile Cys Gln Lys Phe Ile Ala Lys Cys Arg Lys

740 745 750

Phe Val Arg Ala Lys Gly Ser Glu Glu Asp Asn Lys Ala Phe Asp Asp

755 760 765

Met Val Lys Arg Glu Pro Ser Leu Tyr Ser Phe His Gly Arg Trp Gly

770 775 780

Trp Leu Leu Lys Gln Met Met Lys Ala Ala Lys Gly Ala Arg Leu Asp

785 790 795 800

Pro Phe Arg Glu His Leu Glu Trp Leu Leu Phe Arg Thr Lys Tyr Gly

805 810 815

Pro Thr Asn Arg Lys Ser Leu Asn Leu Asn Ser Met Ala Ser Thr Lys

820 825 830

Asn Val Ile Ser Ala Ile Asp Ser Tyr Met Ser Arg Arg Gly Trp Lys

835 840 845

Thr Val Glu Gln Arg Gln Arg Arg Asp Gly Arg Leu Gln Ala Ala Arg

850 855 860

Ser Ser Leu Gln Ser Asn Leu Val Asn Arg Arg Leu Glu Arg Ile Lys

865 870 875 880

Lys Glu Glu Ser Gln Cys Ile Arg Leu Ala His Leu Phe Ala Val Thr

885 890 895

Thr His Leu Val Leu Glu Asp Asn Leu Pro Lys Gln Asn Gly Ala Ser

900 905 910

Ser Arg Ala Asp Asn Gly Arg Lys Ala Asp Trp Arg Ser Arg His Leu

915 920 925

Ala Gln Arg Leu Cys Gly Ile Lys Asn Asp Ser Gly Ser Cys Ala Ile

930 935 940

Ala Gly Val Arg Ala Arg Arg Ile Asp Pro Val Met Thr Ser His Met

945 950 955 960

Asp Pro Phe Val Tyr Ser Leu Asp Asn Lys Trp Ala Met Arg Ala Arg

965 970 975

Tyr Thr Lys Val Ser Leu Ser Ser Met Thr Asp Tyr His Ala Asn Leu

980 985 990

Ile Arg Ser Ile Leu Leu Glu Lys Pro Gly Lys Arg Gln Thr Thr Glu

995 1000 1005

Tyr Tyr Gln Arg Ala Val Gln Asp Phe Ala Arg Leu His Gly Leu Asp

1010 1015 1020

Val Asp Glu Met Arg Lys Val Arg Glu Ala Arg Trp Tyr Lys Lys Arg

1025 1030 1035 1040

Ile Lys Ala Lys Thr Leu Tyr Ile Pro Cys Arg Gly Gly Arg Val Phe

1045 1050 1055

Leu Ser Thr His Arg Leu Gln Ser Asp Thr Pro His Thr Asp Ser Ser

1060 1065 1070

Gly Ala Val Leu Trp Glu Gln Asp Ala Asp Gln Val Ala Ala Leu Asn

1075 1080 1085

Val Ala Leu Arg Tyr Ile Asp Gln Cys Tyr Arg Ser Asn Lys Lys Gly

1090 1095 1100

Leu Ala Lys Val Lys Lys Pro Lys

1105 1110

<210> 3

<211> 1051

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<221> VARIANT

<222> (1)..(1051)

<223> CasY3

<400> 3

Met Ser Glu Ile Thr Ala Ile Lys Thr Tyr Asn Ser Asn Leu Phe Ala

1 5 10 15

Asn Ser Glu Lys Asn Ile Lys Tyr Leu Arg Asp Thr Gly Val Ala Leu

20 25 30

Lys Asn Thr Thr Asn Val Phe Arg Gly Leu Leu Val Ala Phe Tyr Gly

35 40 45

Gly Ile Thr Pro Glu Ile Ala Arg Glu Asn Ile Lys Ile Ile Lys Lys

50 55 60

Glu Lys Ser Leu Asp Met Asp Leu Ile Tyr Ala Ile Asn Arg Phe Arg

65 70 75 80

Pro Val Arg Ser Asn Ser Asp Leu Ala Lys Tyr Gln Ile Pro Gln Pro

85 90 95

Val Met Arg Gly Lys Phe Glu Ser Val Val Gly His Glu Ala Ser Glu

100 105 110

Leu Ala Ala Glu Phe Leu Asn Ser Pro Ile Gly Glu Asp Tyr Val Trp

115 120 125

Ile Asp Gly Leu Arg Ala Tyr Glu Asp Leu Lys Ser Gln Ile Gly Asp

130 135 140

Phe Asp Tyr Asp Leu Lys Val Met Val Arg Glu Asn Ile Leu Pro Ile

145 150 155 160

Tyr Asn Phe Pro Asn Ile Glu Ala Ser Ala Ser Ile Ser Arg Ile Phe

165 170 175

Gly Asn Gly Lys Lys Glu Asp Arg Glu Phe Lys Val Gly Val Val Lys

180 185 190

Lys Ile Lys Glu Leu Ile Leu Asn Ser Asp Leu Gly Asp Asp Tyr Ser

195 200 205

Val Leu Gln Gln Ile Ile Leu Ser Ala Ala Gly Ala Lys Asp Met Lys

210 215 220

Glu Phe Ser Lys Thr Tyr Val Gly Lys Ala Ala Gly Arg Arg Gly Lys

225 230 235 240

Ile Gln Asn Ile Leu Leu Glu Asn Ser Asn Lys Lys Leu Gly Ala Asn

245 250 255

Thr Ile Gln Ser Val Leu Glu Lys Cys Asp Glu Ile Val Cys Glu Lys

260 265 270

Ser Ser Lys Leu Ile Trp Lys Asn Asn Gln Gly Leu Leu Lys Tyr Ile

275 280 285

Glu Ile Gln Ser Asp Leu Ser Tyr Asp Pro Lys Ala Tyr Ser Glu Cys

290 295 300

Phe Lys Ala Ala Leu Ala Glu Ile Gln Pro Lys Asn Thr Val Asn Tyr

305 310 315 320

Asn Phe Ala Val Lys Arg Leu Gln Asn Lys Lys Asp Leu Glu Ser Asn

325 330 335

Val Gln Ala Met Gln Asn Ser Ala Met Leu Asn Asn Tyr Phe Asp Ser

340 345 350

His Tyr Phe Gln Gly Ser Asn Asn Phe Val Ile Cys Pro Tyr His Leu

355 360 365

Gly Gly Glu Asn Leu Ser Gln Leu Phe Lys Ile Tyr Lys Asn Ile Gly

370 375 380

Asp Ser Thr Glu Ala Val Lys Glu Tyr Cys Ser Glu Leu Arg Gly Ser

385 390 395 400

Val Lys Asp Pro Ile Pro Ser Leu Cys Glu Tyr Val Leu Thr Leu Arg

405 410 415

Asp Leu Ser Cys Lys Gln Ile Ile Gly Ala Ala Ser Tyr Asn Gln Leu

420 425 430

Ile Gln Arg Tyr Lys Asp His Lys Val His Pro Thr Lys Asp Gly Asn

435 440 445

Asn Asn Tyr Thr Phe Ser Thr Gly Ser Ala Met Tyr Gly Cys Leu Ile

450 455 460

Pro Pro Asn Lys Ala Lys Lys Thr Asp Arg Pro Gly Ser Pro Asp Ser

465 470 475 480

Arg Ile Trp Met Ile Leu Arg Val Leu Asn Gly Lys Lys Trp Glu Asp

485 490 495

His His Tyr Tyr Ile His Asn Val Arg Phe Leu Glu Glu Val Tyr Ala

500 505 510

His Asn Pro Glu Phe Lys Gly Asp Pro Val Ala Ile Arg Gly Gly Arg

515 520 525

Phe Gly Gly Ile Gly Lys Lys Ile Cys Glu Ser Ser Leu Gln Ser Leu

530 535 540

Arg Glu Asn Pro Gln Lys Tyr Arg Lys Thr Lys Lys Arg Leu Leu Arg

545 550 555 560

Leu Gln Glu Ser Ile Lys Asn Asn Ser Leu Pro Asn Ile Asn Trp Asn

565 570 575

Glu Lys Ile Ala Ser Ile Gly Val Arg Phe Asp His Asn Asn Phe Lys

580 585 590

Ala Thr Ile Asn Phe Lys Ile Lys Val Asn His Lys Lys Phe Glu Gly

595 600 605

Leu Lys Val Gly Asp Lys Ile Met Ser Tyr Asp Gln Asn Gln Thr Gln

610 615 620

Ser His Ala Tyr Ala Val Met Asn Val Cys Asn Ser Phe Asp Ser Gly

625 630 635 640

Ala Ile Pro Phe Arg Gly His Tyr Val Gln Val Asn Glu Thr Gly Lys

645 650 655

Ile Arg Ser Asn Ile Gln Val Gly Gln Asn Asn Tyr Asp Pro Leu Ser

660 665 670

Tyr Ser Gly Leu Ser Phe Glu Lys Tyr Glu Asn Trp Arg Asn Gln Arg

675 680 685

Lys Asn Phe Val Ser Lys Tyr Arg Phe Ile Ile Gly Lys Asn Asn Glu

690 695 700

Asn Cys Asp Met Leu Glu Glu Leu Glu Lys Ile Glu Ser Arg Lys Pro

705 710 715 720

Ser Leu Tyr Glu Tyr Asn Tyr Lys Tyr Ser Ala Ile Leu Arg Lys Ile

725 730 735

Val Arg Gly Thr Ser Gly Val Lys Leu Asp Glu Cys Arg Lys Glu Ile

740 745 750

Ile Ser Phe Leu Ala Lys Glu Gln Ala Ser Ile Arg Asn Val Ser Ser

755 760 765

Leu Asn His His Ser Phe Ser Ala Phe Arg Ser Ala Lys Ser Leu Ile

770 775 780

Ser Ala Tyr Phe Ala Ala Ser Thr Gly Leu Asn Ile Ser Thr Asp Glu

785 790 795 800

Gln Lys Gln Asp Asn Asp Pro Glu Ile Phe Glu Ile Arg Lys Asp Leu

805 810 815

Glu Arg Ser Arg Lys Asn Lys Cys Arg Glu Lys Ile Asn Lys Ile Ser

820 825 830

Asn Thr Ile Val Thr Ile Ala Asn Met Glu Gly Cys Asn Ile Ile Cys

835 840 845

Gly Glu Phe Gly Leu Ser Ser Thr Gly Ser Lys Asn Asn Thr Lys Lys

850 855 860

Gln Asn Asn Lys Asn Met Asp Trp Leu Ala Arg Gly Val Glu Lys Lys

865 870 875 880

Ile Lys Glu Met Cys Leu Leu His Asn Ile His Phe Lys Asp Ala Pro

885 890 895

Pro His Tyr Thr Ser His Gln Asp Pro Phe Val Tyr Asn Asn Thr Leu

900 905 910

Leu Lys Val Glu Ser Val Asp His Met Lys Ala Arg Phe Ala Tyr Leu

915 920 925

Ser Val Asp Asp Val Glu Glu Trp His Leu Lys Lys Leu Ser Ser Tyr

930 935 940

Leu Lys Asn Asn Lys Asn Gly Thr Ala Tyr Tyr Tyr Asn Ser Ala Thr

945 950 955 960

Lys Gln Phe Leu Asp His Tyr Gly Leu Val Glu His Glu Glu Lys Ile

965 970 975

Thr Lys Asn Lys Leu Ser Leu Ser Lys Phe Lys Asp Ile Leu Ile Lys

980 985 990

Asn Phe Gly Asn Val Asn Ile Val Met Pro Leu Arg Gly Gly Arg Tyr

995 1000 1005

Tyr Leu Ala Ser Lys Asn Val Val Thr Gly Ala Val Pro Phe Ser Phe

1010 1015 1020

Gly Gly Ser Cys Tyr Leu Ser Asp Ala Asp Glu Val Ala Ala Ile Asn

1025 1030 1035 1040

Val Gly Leu Thr Ile Phe Pro Gln Gln Asn Ser

1045 1050

<210> 4

<211> 902

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<221> VARIANT

<222> (1)..(902)

<223> CasY4

<400> 4

Met Leu Met Leu Gly Asp Ile Val Pro Tyr Asp Ser Val Gly Glu Ile

1 5 10 15

Asp Gly Trp Gly Ala Val Ser Arg Thr Phe Gly Lys Asp Lys Lys Ala

20 25 30

Asp Ile Ala Val Gln Lys Lys Phe Cys Asp Glu Val Leu Ser Lys Ile

35 40 45

Asn Glu Glu Asn Cys Lys Thr Phe Glu Asp Tyr Lys Lys Ile Ile Phe

50 55 60

Glu Ile Phe Asn Ala Ser Thr Ile Lys Glu Leu Lys Asn Thr Trp Asn

65 70 75 80

Ser Gly Ala Gly Val Arg Ser Ala Lys Val Ile Asp Asn Leu Gly Lys

85 90 95

Asp Thr Asp Pro Glu Phe Thr Phe Glu Lys Glu Arg Lys Asn Trp Glu

100 105 110

Ser Val Gln Glu Glu Lys Ser Phe Ile Pro Asn Arg Pro Asn Tyr Trp

115 120 125

Ala Ile Ile His Tyr Met Glu Gly Lys Ile Gly Asp Glu Val Asp Asn

130 135 140

Ser Ser Trp Ala Val Met Tyr Gln Asn Ala Ile Ile Asp Ile Cys Ser

145 150 155 160

Lys Ile Thr Arg Asn His Asn Phe Ser Tyr Glu Gln Thr Glu Arg Lys

165 170 175

Lys Glu Leu Ser Lys Cys Asp Thr Ser Ala Leu Glu Leu Val Asn Gly

180 185 190

Tyr Phe Lys Ser Thr Tyr Phe Lys Ser Gly Asn Glu Phe Ile Ile Glu

195 200 205

Asn Arg His Val Pro Asn Ile Gly Arg Leu Ile Glu Leu Tyr Ser Glu

210 215 220

Leu Thr Val Val Asn Asp Asp Asn Ile Asn Glu Ile Ile Glu Ile Val

225 230 235 240

Asp Ser Glu Thr Lys Val Asn Glu Asn Thr Thr Gly Asp Asn Gln Leu

245 250 255

Lys Lys Tyr Ile Leu Ser Ile Ser Gly Phe Ala Thr Val His Gln Ile

260 265 270

Glu Gln Ala Met Lys Tyr Asn Lys Ile Lys Asp Asp Ile Glu Gln Thr

275 280 285

Lys Ala His Pro Phe Val Ser Gly Asn Ala Ser Phe Thr Val Gly Asn

290 295 300

Ser Ala Leu Lys Gly Ser Ile Ala Ser Gln Asn Ser Lys His Lys Gly

305 310 315 320

Lys Ile Ala Gly Gln Ser Ala Lys Ile Trp Leu Tyr Ile His Leu Tyr

325 330 335

His Lys Asp Ile Lys Glu Trp Arg Glu His His Ile Pro Phe Tyr His

340 345 350

Ala Lys Phe Phe Glu Glu Val Tyr Tyr Phe Asp Pro Ala Leu Thr Glu

355 360 365

Thr Val Lys Ile Arg Asn Lys Lys Met Lys Thr Asn Ile Thr Lys Glu

370 375 380

Asn Ile Val Arg Asp Gly Ile Asp Pro Arg Phe Ala Glu Lys Asn Ile

385 390 395 400

Arg Thr Ala Ala Val Arg Gln Asn Cys Arg Ala Asn Val Ala Met Ile

405 410 415

Pro Ser Ser Leu Glu Leu Thr Lys Lys Asn Gly Glu Phe Thr Ile Thr

420 425 430

Ile Ser Gln Arg Phe Pro Lys Gly Leu Lys Arg Lys Lys Ser Asp Ile

435 440 445

Arg Leu Asn Asp Ile Val Met Ala Tyr Asp Gln Asn Gln Thr Arg Pro

450 455 460

Asn Thr Tyr Ser Ile Leu Arg Val Thr Ser Thr Thr Lys Asp Lys Asp

465 470 475 480

Gly Arg Tyr Pro Cys Glu Phe Ile Lys Gly Gly Asp Ile Arg Ser Phe

485 490 495

Ile Asn Thr Lys Ile Gly Asp Ile Asp Val Ile Asn Tyr Asp Gly Val

500 505 510

Asp Asn Thr Thr Thr Phe Phe Val Asp Phe Val Arg Gly Arg Thr Glu

515 520 525

Phe Ile His Ser Val Cys Asn Leu Asp Ala Phe Lys Lys Thr Asn Asp

530 535 540

Asn Asn Leu Lys Tyr Asp Phe Asn Cys Leu Gly Glu Leu Ala Arg Thr

545 550 555 560

Asn Arg Glu Gln Thr Lys Leu Tyr Arg Trp Gln Asn Trp Tyr Leu Arg

565 570 575

Leu Leu Leu Thr Met Met Lys Leu Ser Lys Gly Ser Ile Pro Gly Leu

580 585 590

Arg Ser Glu Ile Ile Tyr Val Val Arg Phe Met Asp Glu Lys Ser Ser

595 600 605

Leu Ser Gln Ile Cys Ile Glu Asn Ile Arg Ser Met Lys Lys Ile Ile

610 615 620

Asn Ser Trp Phe Ser Tyr Glu Met Lys Asn Gln Asp Ala Thr Asn Glu

625 630 635 640

Glu Lys Glu Leu His Asp Lys Glu Met Tyr Ala Leu Leu Lys Arg Ile

645 650 655

Glu Gln Arg Arg Ser Asn Lys Asn Lys Glu Arg Ile Arg Lys Ile Ala

660 665 670

Ser Ala Ile Val Ala Ile Ala Gln Gln Glu Gly Ala Asn Ile Ile Val

675 680 685

Gly Glu Lys Glu Leu Asp Thr Lys Lys Lys Gly Lys Asn Lys Ala Ser

690 695 700

Asn Asn Arg Ala Met Asp Trp Cys Pro Gly Gln Val Ser Glu Lys Val

705 710 715 720

Lys His Gly Val Asp Leu Leu Asp Ile Ser Phe Phe Thr Met Pro Ala

725 730 735

Phe Tyr Thr Ser His Gln Asp Pro Phe Val Tyr Ser Asp Ser Asn Arg

740 745 750

Glu Met Arg Pro Arg Met Asp Glu Ile Asn Pro Glu Ala Pro Asn Ala

755 760 765

Glu Arg Lys Ile Lys Ser Phe Val Thr Leu Ala Lys Met Lys Pro Lys

770 775 780

Lys Glu Thr Met Thr Gln Tyr Tyr Ser Asp Gly Val Asp Arg Phe Cys

785 790 795 800

Val His Asn Asn Ile Thr Arg Ala Glu Leu Lys Lys Ile Lys Thr Arg

805 810 815

Asn Asp Trp Ile Ala Arg Leu Gly Ser Glu Lys Cys Leu Val Pro Val

820 825 830

Arg Gly Gly Arg Tyr Tyr Leu Ser Ala Lys Val Ala Ala Ser Gly Ala

835 840 845

Thr Gln Ile Val Tyr Ala Gly Glu Thr Arg Tyr Leu Ser Ser Ala Asp

850 855 860

His Ile Ala Ala Thr Asn Ile Gly Leu Ser Phe Leu Val Pro Tyr Asp

865 870 875 880

Pro Glu Lys Gln Lys Lys Lys Lys Gly Lys Asn Gln Thr Ala Val Asp

885 890 895

Lys Thr Ser Thr Val Ala

900

<210> 5

<211> 1117

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<221> VARIANT

<222> (1)..(1117)

<223> CasY5

<400> 5

Met Ala Ser Asp Val Thr Ser Tyr Met Thr Tyr Arg Ala Asn Leu Val

1 5 10 15

Pro Asp Ala Arg Lys Lys Lys Leu Leu Asn Asp Thr Tyr Ala Phe Tyr

20 25 30

Arg Lys Gly Glu Glu Leu Phe Phe Asp Ala Phe Phe Asp Ile Leu Gly

35 40 45

Gly Val Ser Pro Gln Leu Ile Asn Thr Leu Val Asn Asp Gly Thr Ile

50 55 60

Lys Ala Glu Asn Asp Ala Thr Asp Glu Glu Lys Asn Asp Ile Thr Glu

65 70 75 80

Glu Asp Lys Asn Asn Thr Ser Lys Lys Lys Leu Asp Pro Lys Leu Leu

85 90 95

Cys Ala Ile Leu Trp Phe Arg Leu Val Lys Lys Glu Lys Asn Thr Cys

100 105 110

Glu Ile Leu Asn Val Lys Leu Leu Lys Glu Lys Phe Ser Ala Tyr Tyr

115 120 125

Gly Ala Glu Ala Asn Asp Thr Val Ile Ser Tyr Phe Ser Ala Asn Tyr

130 135 140

Asp Val Glu Asn Tyr Met Trp Val Asp Cys Arg Val Arg Cys Leu Ser

145 150 155 160

Phe Cys Asn Lys Leu Gly Thr Ser Leu Asp Val Leu Ala Ile Asp Leu

165 170 175

Glu Ser Met Leu Arg Ala Lys Asn Ile Ala Phe Phe Gly Gly Val Gly

180 185 190

Lys Ala Asp Lys Ala Ile Ser Asn Ile Phe Ile Arg Ser Glu Lys Arg

195 200 205

Gly Lys Ser Asn Val Lys Lys Leu His Glu Tyr Ala Val Asn Thr Ile

210 215 220

Asp Ile Leu Glu Lys Thr Glu Val Ile Asn Ser Asp Gln Tyr Leu Asp

225 230 235 240

Val Leu Leu Arg Val Phe Gly Ala Ala Asn Ile Asp Glu Leu Gln Asn

245 250 255

Ile Cys Lys Lys Glu Asn Gly Gly Ser Lys Leu Val Lys Pro Ile Gly

260 265 270

Gln Phe Leu Asn Ser Lys Phe Val Phe Asp Pro Lys Lys Val Lys Lys

275 280 285

Ser Trp Val Asp Leu Ala Lys Glu Lys Ser Tyr Ala Pro Asn Tyr Pro

290 295 300

Ser Cys Asp Lys Leu Lys Ile Tyr Ile Glu Asn Lys Leu Gly Lys Leu

305 310 315 320

Gly Gln Leu Thr Lys Pro Lys Asn Lys Val Ser Asp Asp Asp Glu Gln

325 330 335

Gly Ser Asn Lys Gly Leu Trp Ser Ser Met Phe Arg Asn Ala Ile Thr

340 345 350

Ser Ile Cys Ala Ala Val Thr His Asn Tyr Ser Phe Ser Ile Gly Gln

355 360 365

Thr Asp Arg Gln Glu Lys Leu Ser Ile Leu Arg Lys Ser Asn Gly Ser

370 375 380

Ile Ala Asn Glu Ile Asn Glu Asn Phe Pro Gln Lys Asp Gln Tyr Thr

385 390 395 400

Ile Met Pro Tyr His Val Pro Asp Leu Lys Asn Thr Ile Arg Leu Tyr

405 410 415

Asn Gly Leu Asn Gln Lys Thr Asp Glu Glu Ile Ala Gly Ile Leu Asn

420 425 430

Thr Ile Asn Asn Asn Glu Lys Ala Lys Arg Lys Lys His Gly Asp Val

435 440 445

Arg Ala Gln Ala Tyr Ile Leu Ser Leu Tyr Thr Ser Asn Ser Thr Lys

450 455 460

Tyr Thr Glu Lys Ser Ile Thr Asp Ala Leu Lys Ile Asn Lys Ile Glu

465 470 475 480

Asp Thr Ile Lys Asn Gln Lys Val His Pro Phe Val Leu Gly Asn Ala

485 490 495

Gly Met Arg Phe Gly Gly Asp Asp Asn Cys Val Gly Arg Ile Glu Arg

500 505 510

Pro Ser Val Phe Val Lys Glu Leu Gly Cys Tyr Ala Gly Glu Ser Asp

515 520 525

Lys Met Trp Ile Thr Ile Lys Val Ile Asp Glu Gly Arg Trp Lys Thr

530 535 540

His His Ile Pro Phe Phe Gln Ala Lys Tyr Tyr Glu Glu Leu Tyr Ala

545 550 555 560

Phe Asp Pro Asp Pro Glu Lys Lys Glu Thr Val Asn Ile Arg Met Asn

565 570 575

Lys Thr Asn Thr Leu Ala Lys Lys Gly Asn Thr Ser Asn Ala Gly Met

580 585 590

Phe Asn Glu Ser Phe Tyr Glu Gly Asn Asp Glu Glu Thr Lys Met Lys

595 600 605

Arg Lys Lys Tyr Arg Gln Lys Arg Val Arg Asn Lys Val Ala Leu Glu

610 615 620

Asn Leu Lys Tyr Asn Val Asp Phe Val Asp Pro Thr Phe Val Leu Phe

625 630 635 640

Lys Asn Ser Glu Gly Phe Gly Ile Asn Ile Ser Gln Asn Ile Gln Asp

645 650 655

Pro Thr Gly Leu Lys Gly Glu Ile Thr Thr Gly Gln Asn Ile Met Gly

660 665 670

Ile Asp Gln Asn Arg Asp Arg Ser Asn Ser Tyr Ser Ile Trp Arg Ile

675 680 685

Thr Gly Asp Gln Ala Asn Gly Ile Tyr Pro Ala Glu Phe Val Lys Ser

690 695 700

Gly Asp Ile Ser Ser Leu Ile Lys Thr Asn Lys Lys Asp Glu Lys Gly

705 710 715 720

Asn Lys Lys Glu Tyr Asp Val Phe Thr Tyr Asp Gly Leu Asn Thr Asp

725 730 735

Ser Glu Lys Leu Asn Ser Phe Phe Ala Asp Arg Lys Ala Phe Ile Tyr

740 745 750

Gly Leu Asp Pro Ala Val Phe Asn Thr Ser Glu Tyr Asn Ile Phe Phe

755 760 765

Glu Tyr Glu Lys Ile Lys Asn Glu Lys Lys Lys Ile Tyr Gln Trp Asn

770 775 780

Gly Ser Tyr Leu Ser Leu Leu Arg Lys Val Leu Thr Met Ser Lys Gly

785 790 795 800

Asn Thr Glu Lys Leu Lys Asn Glu Ile Arg Lys Glu Ile Ile Asn Val

805 810 815

Ile Arg Leu Ile Asp Gly Lys Ser Ser Leu Ser His Cys Cys Ile Met

820 825 830

Asn Met Gln Gly Met Ile Lys Val Ile Asn Ser Trp Phe Ala Tyr Thr

835 840 845

Met Gly Glu Asn Ser Ser Thr Glu Asp Gln Lys Lys Glu Tyr Asp Ser

850 855 860

Glu Met Tyr Asn Leu Leu Leu Tyr Val Arg Lys Arg Arg Lys Asn Lys

865 870 875 880

Lys Thr Glu Lys Ile Asn Lys Met Ala Asn Ala Ile Ile Cys Thr Ala

885 890 895

Ile Glu Asn Asn Val Lys His Ile Ile Leu Glu Ala Leu Asp Lys Lys

900 905 910

Gly Asp Lys Gly Asn Ser Arg Gln Asn Asn Ala Ser Asn Met Asp Trp

915 920 925

Cys Ala Lys Gly Ile Ile Asp Lys Val Ile Thr Gly Cys Arg Phe Val

930 935 940

Asp Ile Asn Val Arg Lys Val Asn Pro Ala Tyr Thr Ser His Gln Asp

945 950 955 960

Pro Met Val His Asn Lys Asn Asn Pro Ala Met Lys Pro Arg Ile Ala

965 970 975

Lys Ile Asp Met Val Glu Lys Asn Asn Trp Ala Val Glu Lys Leu Val

980 985 990

Ser Ile Ser Ser Met Asp Pro Lys Glu Asn Ser Ala Glu Ile His Tyr

995 1000 1005

Phe Asn Phe Ile Asp Val Phe Cys Arg Gln Tyr Lys Ile Asp Arg Lys

1010 1015 1020

Asp Leu Asn Lys Ile Lys Lys Ile Ser Asp Leu Gln Asp Leu Met Ala

1025 1030 1035 1040

Glu Lys His Ser Phe Ile Tyr Val Pro Ser Arg Gly Gly Gln Tyr Tyr

1045 1050 1055

Leu Ser Thr His Arg Val Thr Ser Cys Asp Asp Asp Ile Gln Ile Leu

1060 1065 1070

Tyr Asp Gly Lys Asn Val Trp Leu Ala Asn Ser Asp His Ile Ala Ala

1075 1080 1085

Ala Asn Ile Val Leu Arg Gly Leu Asp Tyr Ser Pro Ser Pro Lys Lys

1090 1095 1100

Lys Asn Lys Thr Asp Leu Asp Leu Ala Ala Val Gly Gly

1105 1110 1115

<210> 6

<211> 3267

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(3267)

<223> CasY1的编码DNA序列

<400> 6

atgaacaaaa tgaaaaagac gaaaaagttg gatgtcagga agtcttactc tggccggctg 60

aatccaaatg acaggaagag agagcacctg cagcggtctc tgagggccct caggaagggc 120

tctgagttct tcttcgatct ggtgcaggca tggtgcggcg ggctgacccc cgaaatgctg 180

gaggagaacg ccaaagctga tgacctgatc gacctctggt gtgctatcta ttggtttagg 240

cctgtctcca ccactgtagc cacgcatcca atcaatcaaa acgatcttgt tgcaacgttt 300

gagaattatt acggggggaa agccagttca ctggttaatg aatacctcac cgcccctatt 360

ggggaagaat ttctgtggaa cgactgccgc caaaaatacg aacacttttg tcgcgatttc 420

ggggccgatt ttactaacga tctgagaacc ctcctgcgca ataacctgat cgcagtggcc 480

tccaacaagt ctgaactcga gacatccaca atttctagcc ttttcggcac cggcgtcaaa 540

gcctctcgca gcgtgaaggt ggaggtgctg gagaagatcc tgaacgcggt acagaacttg 600

gagaagattc cagatgattg tcggtctatc cagaagatca ttcttgaatc agcccaggcc 660

aacgacctga atgagttcaa gattgtgtat tcaggcggga acaagagcaa caaggatgga 720

acaaccaaga aggggaatgg ccgcccaagt ttcttggagg agtttctcaa attgaatggt 780

gacgagaagc tgactccctc taagttcaag gagttttttg agaagctgat agaagagatc 840

aaaaagaaga aacaggacat gtcttgggac cacgcccagc gacttagaga gtatatcgag 900

aacaacacag caaccaagta cgatgcatgg gcctgggaag agatgctgaa gtcaggccag 960

actcctctga agtccaaagc tacgagaaat tacagtttca caaaagagag ggccgagcag 1020

tttgtcgaga tccagaagaa tcaagacctg gagattgtga acgacttgaa cggatttttt 1080

gagagcgaat tctttaacgg tgagtataag ttcgttattt gccaatttca catcggcaat 1140

gacgatctcg aaaagctgtt caagttctgg aacgagaccg acgctgatgt ctggaacgag 1200

gacaccgaac tgatcttgaa tgatttctgc gacgatctca agaattcttt taatcggact 1260

cctatcaaga atgtcctgaa atatctgttc cagttcagga agaagtacac cgccaagcaa 1320

cttgtgaatg ccgcgaagta taacgagcag tttgataaat ataagaatcg caaggtgcat 1380

ccctccgtgc tgggcaatca gggctttacc tggcctaatg cgctgatccc ccctgataag 1440

gcccagagat ctgatagaga aaatagcctg gacctgcgga tctggctgta cattaaactg 1500

ctgcatgagg atggaacttg gaagaaacat catgtgtgtt tccacaactc tcgcttcttt 1560

tctgaggtat acgcagcggg gagtaacgag atcgagcccg tgaagtttcg caccccacgc 1620

ttcggcacca ctctccccaa acttaccgca cagactccaa tccgggtcgc caagaagtac 1680

gttaagatcg ccaagcggga ggcgaaagtg agactggccg ctcaacaggg gctgttgcct 1740

aaaattagca tacctctcaa cgaactgagt gctgtaataa acgactcact tggcgtgacc 1800

attcccgtga agttcaaggt tgaccagcct tcaagaatcc caaagctgaa cgacataatc 1860

ttgggttacg accagaatca gactgccagt cacgcatact ccctgtggca agttgtagag 1920

gagaacacac ccgatagttt ttactacgag ggaaaggggt gggaatgcca tgtgaaattt 1980

ttgcgctcag gagatgttac cagccttaca aaaactaaga aagatgatgt gatcgaccag 2040

ctgtcatatg agggactcga ctacaaaaat tatgctgact ggaaacggac cgccaagagg 2100

ttcgccgaca actggactat ctcaaaaggt aaggagatta cccccgccgt agaccgcttc 2160

gaaagcattg agaggtggca gccccgcttg tatcggttca acaaagatta cgcatatatt 2220

cttcgcgaca ttgtccgcgg taagtccctt gctgagttgc agcaaatcag acccgagatt 2280

tttcgcttta tcacacaggg gttcggcgta tgcagacttg gcagtctttc actggatgca 2340

ctggaagccg tgaaggctgc taagggcgtc gtctacagtt acttttccac tgccctgaat 2400

gggagtaaag aaaatcctat aagtgatgag cagagaaaag agttcgatcc cgaactgttt 2460

aagttgctcg agaaactgga gtttatccgc accaagaaga agcaacagaa agtcgaccgg 2520

atcggtaatt ccgttctttc catagcactt gagaatcaag cgaagttcat ccgcggtgag 2580

gagagcctgc ctaccacaaa taagagtacc aaaaaaaaac agaacggtcg cagcatggat 2640

tggctggcac gcggagtggc taataagatc agacagttgg cagaaatgca cgagattgga 2700

ctgctgaatg tcgatccaag atttaccagc caccaggatc ctctcgtgca taacaatccc 2760

aataaggcta tgaagtgcag gtacacagct gcacccataa gcgaaattgg cgacaacgtg 2820

cttgccaagt tgtccgccaa cctgaaaaat aaaaacagag gtacaaccgg agagtattat 2880

caccaaggaa tgaaggaatt tcttgagcat tatgggcttc agaatattga gaacgacttg 2940

ctcaagtggc gcaagaagcg accaactatc cagtgctggg agctgcagaa gattctggcg 3000

gagaaattcg ggaacgaaga gactgtgatc tatttccctg ctaagggggg ccggaagtat 3060

tttgccaccc ataaagttgc gagtgatgcc gtgagcatga tgttcaacgg aaaaaacgtg 3120

tggctctgca atagcgacca cgtggcagct gccaatatcg cactgtcaga gctcaacaag 3180

attagcttgc ccagactgtg gacaaagtcc gagcaaccag atgagccttc cgatgacgaa 3240

aaaacggacg ctacccctcg aaactcc 3267

<210> 7

<211> 3336

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(3336)

<223> CasY2的编码DNA序列

<400> 7

atggaagctg gtaaagtagg taaaaaggga aagacaaata aaaagtttat cattagaccc 60

tacctgaccg agctgaattt gcgagaagac ggccgccttg ccttccagaa gactttcgat 120

tatatggatg aacagcaggc cgctctgttt attttgggag gttccgtgat gtctcatctg 180

gacgagtcca ttatcaggag gcttggactg cacaagggat caaaaaaaga tctccctcag 240

agactccgcg tctcactgca cctggctatc gctaggtttc ggctggtgtc tgttaattat 300

cacctggatg ccaaggccat atctcggatg tctcctacag ccaggctcgc gcacgagcag 360

ctcgctgagg cccacagggc aagcctgatc aagagcccca tctctgtatg gaggaacaga 420

cacggggtac ccgatgaggc tgtgcacgcc tacctggacg gaaattatga cccagagaca 480

tacgcctggc aggataccgc catgctcgca aagaagctgt gtggtatcct caaactgtct 540

ccagaagatt tcaaggaggc ctctgaagca atgatgagaa atgtcaattt tttgggctgc 600

tccggatcta ccggctcagg gagctctgtc agcaacctct ttggccagaa tgagaaagaa 660

gatagccgca accaagctcg catcgaaagt aagactgcca aagtgattgg caagctgctg 720

gagagccgcc gcccgatacc gatggagcga gccgtgtccc tggtatgcaa atctcttgga 780

caccccgatg ctgaagccgc cggggaggat catggtggcc agactgacaa gagcacattt 840

cgacagttta tgaggggaga ctacggagga agccttaagg agcttgcaaa aaagttgcag 900

aaagatgcac acaagcatcg gaataaaagc atcattccac acagagagac tataggtgca 960

ttcataaagc agtgcgcctc cggggagttc tacaacaagg caacttcaga gagctggaag 1020

gacttcaacg ccatgatgaa cgggaagtac aaacacaata taatattcgt cacagagaaa 1080

atcgcgctgg gcaatgcaat gaggaaactt gagagtaacg agaaggcagt gaaagcatct 1140

aagcagttgg agaagctgat cgacaaatac gaaatggatg ggaataagcg cttcgtgccc 1200

aaggtagctt ctgtcaacgg actcgaggct tatcgggatg ttattcaaga taacccgcaa 1260

gaggatgacg agagcgtgaa ggattggctc aagcggctgt ggaccacttt ttcagagggg 1320

aacgaccgaa gactgaagac ccctttcaga tggttggtcg aatcacttgc ccgcctggag 1380

accccggagt ccgccatcaa agacgggtgc cggcttatgt ctattaggca taaacacgag 1440

agtcagagac cccatccctt cgtgcgcgtg cagtctaggt ttactgtggg cgatagcaac 1500

attgctggtt ctatcaacaa acccacggag ttgaagccta atcgcgacgg acgatcccct 1560

gaggattact gggggggcaa ccccgtcgtg tggatgtcat gccgcctcct gaacgggaac 1620

agatggcagg atatgcgcat ccctatccac aactctcgct atattaacga agtttactac 1680

actcggatgg ggccggatgg aaatcatgca ctgcccctca aagaacacgc cagagacgtg 1740

aaacatgatt atgaggccga gactaagatc agtaggacgg ccgcgagaag ggtaaacgaa 1800

aaccgcatgc ttcgccgcgg taaaccaagc aagcggttcg agagagtaaa agcgaactcc 1860

acccacaacg tggtgttcga tcccaagaca accgccagtt ttaaccggcg gcaggacgac 1920

atctacggca ctatcaatca caggcaccca atggtgcctc ttgctcctga cggcttcttc 1980

gctgtgggag ggaatgtgat aggtattgat ctgggtgagt cagtcccact ggcagccggc 2040

atcctgcaga agtgcacttc tacagattca gaagcagttc gctacgcatg tgggcattgg 2100

aaggtggtcg ggatggggaa accgggccag ctgctcgaca gacagacaag cgccaaccga 2160

cgcaagcaac cacacacgat cattgaccca atgagtaata tgggagagcc ctttagctcc 2220

ccgatctgcc agaagtttat cgccaaatgt cgaaaatttg tccgggcaaa aggctcagaa 2280

gaggacaaca aggccttcga cgacatggtg aagcgcgagc cttcactgta cagctttcac 2340

ggcagatggg gctggctcct taaacagatg atgaaggccg ccaaaggcgc caggctggac 2400

ccttttagag agcatttgga gtggctcctt ttccggacta aatacggccc aaccaacaga 2460

aaaagcctta acctcaatag tatggcgtct acaaagaacg tcatttcagc cattgactca 2520

tatatgagcc ggagaggttg gaaaaccgtg gagcagaggc agagacgcga cggaagactg 2580

caggcagcta gatcaagcct tcaaagcaac ttggtgaacc ggcgcctgga gcgaatcaaa 2640

aaagaggagt cccagtgtat tagattggcc cacctttttg ccgttaccac ccacttggta 2700

ctggaggata accttccgaa gcaaaatgga gctagctccc gagccgacaa cgggcgaaag 2760

gcagactgga gaagtcgaca cctggcccag cgattgtgcg gaatcaaaaa tgactccgga 2820

tcttgtgcga ttgccggagt cagagcccgc aggatcgatc ctgtgatgac tagccacatg 2880

gatccttttg tgtattcttt ggataataag tgggctatgc gcgccaggta caccaaggtg 2940

agcttgtcta gtatgaccga ttaccatgcc aacctcatta ggagcatact gctcgagaaa 3000

ccaggcaaga gacagacgac tgaatattat cagcgcgctg tacaggactt tgcccgcctg 3060

catggactgg atgttgatga gatgaggaaa gtccgcgagg ctcggtggta taaaaaacgc 3120

attaaggcta agacgctgta catcccatgc aggggcggac gcgtctttct gtccactcac 3180

aggctgcagt ctgacactcc ccataccgat tccagcgggg ctgtcctttg ggagcaggac 3240

gcagatcagg tggctgcact gaatgtagct ctcaggtata ttgaccagtg ctaccggagt 3300

aataagaaag ggcttgccaa agtgaagaag cctaag 3336

<210> 8

<211> 3153

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(3153)

<223> CasY3的编码DNA序列

<400> 8

atgagtgaga tcaccgccat taaaacctat aatagcaatc tgttcgccaa tagcgagaag 60

aatatcaaat acctgcgcga caccggagtt gcgctcaaga acaccacaaa tgtgttccgc 120

gggctgttgg tggcctttta tggaggaatc acccctgaga ttgccagaga gaacataaag 180

attattaaaa aggaaaagag cctcgacatg gacctgatat atgcgatcaa tcgattcaga 240

cccgtgcggt caaattctga ccttgcaaag taccagatcc cccagcccgt gatgcggggc 300

aagtttgaga gcgttgttgg ccacgaggcc tcagagctgg cggccgagtt ccttaattcc 360

cctatcggag aggactatgt gtggattgat gggttgagag cctatgagga cctcaaatcc 420

caaatcggcg atttcgacta tgacttgaag gtgatggtga gagaaaatat attgccaata 480

tacaacttcc caaacatcga ggcatcagca agcatatcac gaatatttgg caatggcaag 540

aaggaagacc gcgaattcaa agtgggcgtt gtgaagaaaa tcaaggagtt gatcctgaac 600

agcgacctgg gagacgacta ctctgtcctc cagcagataa ttttgagcgc ggccggcgct 660

aaagacatga aggaatttag taaaacgtat gtgggaaagg ctgccggtcg ccgcggcaag 720

atccagaata tcttgctgga gaactcaaac aaaaagcttg gcgccaacac aatccagtca 780

gtcctggaaa agtgtgatga gatcgtctgc gaaaaaagta gcaagctgat ctggaaaaat 840

aaccagggcc tgctcaaata tattgagatt cagagtgacc tgagttacga tcccaaggct 900

tattcagaat gtttcaaagc cgcactggcc gaaatccagc caaagaatac ggtgaactac 960

aatttcgcgg tgaaaaggtt gcagaacaag aaggaccttg agtccaacgt gcaagcaatg 1020

cagaattccg caatgctgaa taactatttt gattcacact acttccaggg ctccaataac 1080

ttcgtcatct gtccttatca cttggggggc gagaacctct cccaactgtt taagatatat 1140

aagaacattg gggattccac agaagcagta aaagagtatt gtagcgagct tagggggagc 1200

gtgaaagacc ctattccgag tctgtgcgag tacgtcctga cactccgcga tctgtcctgc 1260

aaacagatta taggggccgc atcttacaac cagctcatcc agagatataa ggaccataaa 1320

gtgcacccaa caaaagatgg caacaacaat tatacatttt caaccggctc cgctatgtac 1380

ggctgcctga tacctcccaa caaggctaag aaaaccgatc gaccagggtc tcccgacagc 1440

aggatctgga tgatcctccg ggtgctgaac ggcaagaagt gggaggatca tcattactat 1500

atccacaatg tgcgcttcct ggaggaggtc tatgcgcata atcctgagtt caagggggac 1560

ccggttgcca tccgcggggg gaggtttggc ggtatcggaa agaagatctg cgaatctagc 1620

cttcagagcc tgagggaaaa cccccagaag tatagaaaaa ctaaaaagcg cctcctgcgg 1680

ctccaggagt ctatcaagaa taactccctg cccaacatca actggaatga aaagattgca 1740

tccattggcg tcagatttga tcacaataat ttcaaggcta ccatcaattt caaaattaag 1800

gtcaatcaca aaaaattcga gggcctcaaa gtcggcgaca aaattatgtc ttatgatcag 1860

aaccaaactc agagccacgc ctatgcagtg atgaatgtat gcaatagttt cgattcaggc 1920

gccattcctt tccgcggcca ctacgtgcag gtgaatgaaa caggaaagat tcgatccaac 1980

attcaagtgg gacagaataa ttatgatccc cttagctaca gcggtctgtc ctttgagaaa 2040

tatgagaact ggcgcaacca gaggaaaaac ttcgtgagta aatataggtt cattatcggg 2100

aagaataatg agaattgcga tatgctcgag gagctggaaa aaattgagtc ccgcaaaccg 2160

tccctgtatg agtacaatta caagtactct gctatccttc gaaagatcgt caggggcacc 2220

agcggggtta aactggacga atgccgaaag gaaattatca gttttttggc aaaggagcag 2280

gccagcattc gcaatgtcag ctccctcaat catcattcct tcagtgcatt tagaagtgcc 2340

aaaagtctca tttcagccta ctttgctgcc tcaaccggtc tcaacatcag cacggacgaa 2400

cagaagcaag acaacgatcc cgaaattttt gaaatacgga aggacctcga gcgcagccgg 2460

aaaaataagt gtagggagaa gattaataag atttctaata ctatagtaac tatcgctaat 2520

atggagggat gtaatattat ctgcggcgag tttggcctta gttccactgg gagcaagaac 2580

aacaccaaga agcaaaacaa caaaaacatg gattggctcg cgcgaggcgt tgagaaaaag 2640

atcaaagaaa tgtgcttgct gcataatatc catttcaagg atgccccccc acattatacc 2700

agtcaccagg atccttttgt ttataataac acgcttctca aggtggagag cgtcgatcac 2760

atgaaagcaa ggttcgctta cctgagcgtg gatgatgtgg aggaatggca tttgaaaaag 2820

cttagcagtt acctgaagaa caacaagaac gggactgcct actattataa tagtgcaacc 2880

aaacagtttc tggaccacta cggcctggtt gagcatgagg aaaagatcac taaaaataag 2940

ctgtccctgt ctaagttcaa ggatatcctc atcaaaaact ttgggaatgt taatatcgtc 3000

atgccacttc ggggaggcag atattacctt gcctctaaga acgtggtgac cggcgccgtt 3060

cctttctcct tcggaggatc ttgctatctg tcagatgctg acgaagtggc agctataaat 3120

gtgggtttga caatcttccc acagcagaac tcc 3153

<210> 9

<211> 2706

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(2706)

<223> CasY4的编码DNA序列

<400> 9

atgctgatgc tgggagacat agtaccatat gacagcgtcg gggagattga cggttggggg 60

gctgtctccc ggactttcgg taaggacaaa aaagcagaca tagccgtcca gaaaaagttc 120

tgtgatgaag tcctcagcaa aatcaacgag gagaactgca aaacgttcga ggattacaag 180

aagattattt ttgaaatttt caacgcctcc acaattaaag agctgaaaaa cacttggaac 240

agtggtgccg gcgtgaggtc agcaaaagtg atcgacaatt tgggaaaaga cactgatccc 300

gagttcacat tcgaaaagga gcggaaaaat tgggagagtg tccaggagga gaagagcttc 360

attccaaatc gccctaacta ttgggccatc atacattaca tggagggaaa aatcggagac 420

gaggtggaca atagctcttg ggctgtaatg taccaaaacg ccatcattga tatttgttct 480

aaaatcaccc gaaaccacaa tttttcctac gagcagacag aacggaagaa agagctgagc 540

aaatgtgaca caagcgctct ggagctggta aatggctatt ttaaaagcac gtacttcaag 600

tctggcaatg aatttattat cgaaaaccgc cacgtgccaa atatcgggag actgatcgag 660

ctgtacagcg agctgactgt cgttaacgac gacaacatta atgaaatcat cgagatagtg 720

gacagtgaaa ctaaggtcaa tgaaaatact actggcgata atcagttgaa aaaatacatc 780

ctctccatca gcggctttgc aacggtgcat cagatcgaac aggcaatgaa atataacaag 840

atcaaagatg atattgaaca gaccaaagcc catccctttg ttagcggcaa cgcaagcttt 900

actgtcggaa actcagctct gaagggtagc atcgcatctc agaattcaaa gcacaaggga 960

aaaattgccg ggcagtccgc aaagatatgg ctctatattc acctgtatca caaggatatt 1020

aaagagtgga gggagcacca catacccttt tatcacgcca agttcttcga agaggtatat 1080

tatttcgacc ctgcactgac agagacagtc aaaatcagga ataaaaagat gaagacaaat 1140

attactaagg aaaacatcgt tagggatggc attgaccctc gatttgcaga aaaaaacatc 1200

cgcactgcag ccgtaagaca gaattgtaga gctaatgtgg ctatgattcc ttcttctctt 1260

gagctgacca agaaaaacgg cgaattcacc atcaccatca gccagagatt tcctaaaggg 1320

ctcaagcgaa agaagagtga cattagactg aatgatattg tgatggccta cgatcaaaat 1380

cagacaaggc caaatacata tagcatactc agagtgacaa gtaccaccaa ggacaaggac 1440

ggcaggtatc cttgtgaatt cattaagggg ggcgacatcc gatcatttat caacacaaag 1500

ataggcgaca tcgatgtgat taattacgat ggggttgaca atacgaccac atttttcgtg 1560

gacttcgtgc ggggacgcac tgagtttatc cacagcgtgt gcaacctgga cgcctttaag 1620

aagaccaacg acaacaacct taaatatgat tttaactgcc tgggcgagct ggctcgcaca 1680

aatagagaac agacaaaact ctaccggtgg cagaattggt atctgcgctt gttgttgacg 1740

atgatgaagc tgagcaaggg ctcaattcca gggttgagat ctgaaattat ttacgtagtg 1800

cggttcatgg acgagaaatc cagcctgagc cagatctgca tcgagaacat tcgatcaatg 1860

aagaaaatta taaacagctg gttcagctac gagatgaaaa accaggacgc tactaatgaa 1920

gaaaaagaac ttcacgacaa agagatgtat gccctgttga aacggataga acagaggcgc 1980

tccaataaga acaaagagcg aattaggaaa atcgcctctg ccatcgtcgc cattgctcag 2040

caagaggggg caaacattat tgtgggcgag aaagagctgg acaccaaaaa aaaaggaaag 2100

aataaggctt caaataacag ggccatggac tggtgccccg gtcaggttag cgaaaaggtg 2160

aaacacgggg tagacctgct ggatatcagc ttttttacaa tgcctgcttt ctacacttcc 2220

caccaggatc cttttgtgta tagcgactct aatcgagaga tgcggccgag gatggatgag 2280

atcaaccccg aggccccgaa tgccgaacgc aagattaagt ccttcgtcac actggccaaa 2340

atgaaaccaa agaaggaaac catgacacag tactattctg acggggtgga ccggttctgc 2400

gtccataaca acattaccag ggcagaactg aagaagatca agacacgcaa tgactggatt 2460

gccagactgg gctccgaaaa atgcctggtt cctgtgaggg ggggaagata ctacctgagc 2520

gctaaagtag ctgcaagtgg agccacacag atcgtgtacg caggtgaaac cagatatctt 2580

tcatctgccg atcatatcgc cgccactaac attggactgt cctttctcgt cccttatgac 2640

cctgagaaac agaagaaaaa gaaggggaaa aaccagacag ccgtggataa gacgtcaaca 2700

gttgcc 2706

<210> 10

<211> 3351

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(3351)

<223> CasY5的编码DNA序列

<400> 10

atggcctctg acgttacgtc ttacatgacc tacagggcca acctggtgcc tgatgcaaga 60

aaaaagaaat tgcttaatga cacttacgcg ttttacagga aaggcgagga gctgttcttc 120

gatgccttct ttgatatcct gggtggggtg agtccacagc tgatcaatac cctggtcaat 180

gacgggacaa tcaaagccga gaatgatgcc accgacgagg aaaagaacga tataaccgag 240

gaggacaaaa acaacacttc taaaaagaag ctcgatccaa agctcctgtg cgccattctg 300

tggttcagac tcgtgaagaa ggagaagaat acctgtgaaa tccttaatgt gaagctgttg 360

aaagagaagt tctctgctta ttatggggct gaggcaaatg acacagtaat ctcatatttc 420

agtgcaaatt acgacgtgga aaactacatg tgggtagatt gcagagtgcg gtgtctttca 480

ttctgcaaca agctggggac cagtcttgat gtgctggcca tcgatctgga gtctatgttg 540

cgggccaaaa acattgcttt cttcggaggc gttggcaagg ctgataaagc gattagcaac 600

atctttatcc ggtctgaaaa gcggggcaaa tcaaatgtga aaaaactgca tgagtacgcc 660

gtgaacacca tcgacatcct cgaaaagacc gaagtcatta acagcgacca gtacttggac 720

gtcttgctca gggtgtttgg cgccgccaac atcgacgagc tgcagaacat ctgcaaaaag 780

gaaaacgggg gttccaaact cgtcaagcca atcggccagt ttctgaacag taagttcgtc 840

tttgatccaa agaaggttaa gaagagttgg gtggatcttg ccaaagagaa gagctatgcc 900

cccaattacc cttcctgcga taaactcaaa atctacatcg agaacaagct gggcaagctc 960

ggtcagttga ctaaaccaaa aaacaaagtt tctgacgacg acgagcaagg atccaataag 1020

gggctctggt catcaatgtt tcggaacgca ataacctcta tctgtgctgc cgtgacacat 1080

aattactcat tctctatcgg tcagaccgat aggcaggaaa agttgagcat acttaggaaa 1140

agtaatgggt ctatcgccaa tgagatcaat gagaattttc cgcagaaaga tcagtacaca 1200

atcatgcctt atcacgtgcc agatttgaag aatactatcc ggctgtataa tggcttgaat 1260

cagaagacag atgaggagat cgctggcatc ctgaacacca tcaacaataa tgagaaggct 1320

aaaagaaaaa aacatggcga tgttagagcc caggcgtaca ttttgagctt gtacacctca 1380

aactccacca agtatacaga gaaatctatc acggacgcgc tgaagatcaa caagatcgag 1440

gacaccatca aaaatcaaaa ggtccatcct tttgtgctgg gtaacgcagg catgagattt 1500

ggtggagacg acaattgcgt gggaaggatt gagagaccca gtgtgtttgt gaaggagctt 1560

ggttgctatg caggcgagag tgataaaatg tggattacca tcaaggtcat cgacgaagga 1620

cgatggaaaa cccaccatat cccattcttt caggctaagt actatgaaga actctatgct 1680

tttgacccag accctgaaaa aaaggagact gtgaacatca gaatgaataa gacaaataca 1740

ttggctaaga agggtaatac gtctaacgca ggcatgttca atgagtcctt ttatgaaggc 1800

aacgacgaag aaaccaaaat gaagagaaaa aagtatagac agaaaagagt gaggaataag 1860

gtcgcgctgg aaaatttgaa atataacgtc gactttgtgg atcctacgtt cgttctgttc 1920

aaaaatagtg agggattcgg aattaatatc tcacagaata tccaagaccc aactgggctg 1980

aagggagaga ttaccaccgg ccagaatatc atggggattg accagaaccg ggataggtct 2040

aattcataca gtatctggcg cattacagga gaccaggcaa acggcatcta tcccgctgag 2100

ttcgtgaaat ctggcgatat ctccagcctg attaaaacaa ataaaaagga tgagaaaggt 2160

aacaagaaag agtacgacgt gttcacatac gacggcttga atacagactc tgaaaagctg 2220

aattcatttt ttgcagatcg gaaagctttc atctacgggc tggatcccgc cgtcttcaat 2280

acgtcagagt ataacatctt ctttgaatac gaaaagatca agaatgagaa gaaaaaaatc 2340

taccagtgga atgggtccta tctgtctttg ctgcgaaagg tgctcacgat gagtaaaggc 2400

aacactgaaa agctgaaaaa tgaaatcaga aaggagatca tcaatgtgat cagactgatc 2460

gatggaaaat cttcccttag ccactgctgt atcatgaaca tgcagggtat gataaaagtg 2520

atcaattcct ggttcgccta cacaatgggt gagaactctt ctacagaaga ccaaaaaaaa 2580

gaatacgaca gcgagatgta taatctcctc ctctacgtac gcaaaagacg caaaaacaaa 2640

aagactgaga agatcaataa gatggctaac gccattatct gtaccgctat tgagaacaat 2700

gtaaaacaca tcatcctgga agctctcgac aagaagggcg acaagggcaa ctcaagacag 2760

aataatgcct ccaacatgga ctggtgcgct aaaggcatta ttgacaaggt gatcaccggc 2820

tgtcgattcg tggatatcaa cgtgaggaag gtgaatccag cttacaccag tcatcaagat 2880

ccaatggtac ataataagaa caacccagct atgaagccgc gcattgctaa gatcgacatg 2940

gtggagaaga acaattgggc tgtcgagaag cttgtatcca ttagcagtat ggaccctaag 3000

gagaactctg cggagataca ttacttcaat ttcattgatg tgttttgcag gcagtataaa 3060

attgaccgaa aggatcttaa taagataaaa aagatctctg atcttcagga cctgatggca 3120

gaaaagcata gttttatata tgtccccagc aggggggggc agtactatct gagcacacac 3180

cgcgtgacca gctgtgacga tgacatccag attctgtacg acggaaagaa tgtgtggttg 3240

gcgaacagcg atcatattgc agccgctaac attgtcctgc ggggactgga ctactcacca 3300

agccccaaga aaaagaataa gaccgacctc gacttggccg ccgtcggagg g 3351

<210> 11

<211> 55

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(55)

<223> CasY1 crRNA-TTR

<400> 11

ttgcaacggc tgagaattgc gtcttccatt gacgcgcatc tccccattcc atgag 55

<210> 12

<211> 57

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(57)

<223> CasY2 crRNA-TTR

<400> 12

actcgactag atttagaatg cccacgatga ttgggcagca tctccccatt ccatgag 57

<210> 13

<211> 57

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(57)

<223> CasY3 crRNA-TTR

<400> 13

tttgcaatca ccaaaaattg tgtccttcgt tgacacagca tctccccatt ccatgag 57

<210> 14

<211> 56

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(56)

<223> CasY4 crRNA-TTR

<400> 14

ctcgaagagg gcgaagaact gtgactccta tgtcacgcat ctccccattc catgag 56

<210> 15

<211> 56

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(56)

<223> CasY5 crRNA-TTR

<400> 15

ctcgaagagg cgaagcatag tgaccgatgg cgtcacgcat ctccccattc catgag 56

<210> 16

<211> 4008

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(4008)

<223> pACYCDuet-1

<400> 16

ggggaattgt gagcggataa caattcccct gtagaaataa ttttgtttaa ctttaataag 60

gagatatacc atgggcagca gccatcacca tcatcaccac agccaggatc cgaattcgag 120

ctcggcgcgc ctgcaggtcg acaagcttgc ggccgcataa tgcttaagtc gaacagaaag 180

taatcgtatt gtacacggcc gcataatcga aattaatacg actcactata ggggaattgt 240

gagcggataa caattcccca tcttagtata ttagttaagt ataagaagga gatatacata 300

tggcagatct caattggata tcggccggcc acgcgatcgc tgacgtcggt accctcgagt 360

ctggtaaaga aaccgctgct gcgaaatttg aacgccagca catggactcg tctactagcg 420

cagcttaatt aacctaggct gctgccaccg ctgagcaata actagcataa ccccttgggg 480

cctctaaacg ggtcttgagg ggttttttgc tgaaacctca ggcatttgag aagcacacgg 540

tcacactgct tccggtagtc aataaaccgg taaaccagca atagacataa gcggctattt 600

aacgaccctg ccctgaaccg acgaccgggt cgaatttgct ttcgaatttc tgccattcat 660

ccgcttatta tcacttattc aggcgtagca ccaggcgttt aagggcacca ataactgcct 720

taaaaaaatt acgccccgcc ctgccactca tcgcagtact gttgtaattc attaagcatt 780

ctgccgacat ggaagccatc acagacggca tgatgaacct gaatcgccag cggcatcagc 840

accttgtcgc cttgcgtata atatttgccc atagtgaaaa cgggggcgaa gaagttgtcc 900

atattggcca cgtttaaatc aaaactggtg aaactcaccc agggattggc tgagacgaaa 960

aacatattct caataaaccc tttagggaaa taggccaggt tttcaccgta acacgccaca 1020

tcttgcgaat atatgtgtag aaactgccgg aaatcgtcgt ggtattcact ccagagcgat 1080

gaaaacgttt cagtttgctc atggaaaacg gtgtaacaag ggtgaacact atcccatatc 1140

accagctcac cgtctttcat tgccatacgg aactccggat gagcattcat caggcgggca 1200

agaatgtgaa taaaggccgg ataaaacttg tgcttatttt tctttacggt ctttaaaaag 1260

gccgtaatat ccagctgaac ggtctggtta taggtacatt gagcaactga ctgaaatgcc 1320

tcaaaatgtt ctttacgatg ccattgggat atatcaacgg tggtatatcc agtgattttt 1380

ttctccattt tagcttcctt agctcctgaa aatctcgata actcaaaaaa tacgcccggt 1440

agtgatctta tttcattatg gtgaaagttg gaacctctta cgtgccgatc aacgtctcat 1500

tttcgccaaa agttggccca gggcttcccg gtatcaacag ggacaccagg atttatttat 1560

tctgcgaagt gatcttccgt cacaggtatt tattcggcgc aaagtgcgtc gggtgatgct 1620

gccaacttac tgatttagtg tatgatggtg tttttgaggt gctccagtgg cttctgtttc 1680

tatcagctgt ccctcctgtt cagctactga cggggtggtg cgtaacggca aaagcaccgc 1740

cggacatcag cgctagcgga gtgtatactg gcttactatg ttggcactga tgagggtgtc 1800

agtgaagtgc ttcatgtggc aggagaaaaa aggctgcacc ggtgcgtcag cagaatatgt 1860

gatacaggat atattccgct tcctcgctca ctgactcgct acgctcggtc gttcgactgc 1920

ggcgagcgga aatggcttac gaacggggcg gagatttcct ggaagatgcc aggaagatac 1980

ttaacaggga agtgagaggg ccgcggcaaa gccgtttttc cataggctcc gcccccctga 2040

caagcatcac gaaatctgac gctcaaatca gtggtggcga aacccgacag gactataaag 2100

ataccaggcg tttcccctgg cggctccctc gtgcgctctc ctgttcctgc ctttcggttt 2160

accggtgtca ttccgctgtt atggccgcgt ttgtctcatt ccacgcctga cactcagttc 2220

cgggtaggca gttcgctcca agctggactg tatgcacgaa ccccccgttc agtccgaccg 2280

ctgcgcctta tccggtaact atcgtcttga gtccaacccg gaaagacatg caaaagcacc 2340

actggcagca gccactggta attgatttag aggagttagt cttgaagtca tgcgccggtt 2400

aaggctaaac tgaaaggaca agttttggtg actgcgctcc tccaagccag ttacctcggt 2460

tcaaagagtt ggtagctcag agaaccttcg aaaaaccgcc ctgcaaggcg gttttttcgt 2520

tttcagagca agagattacg cgcagaccaa aacgatctca agaagatcat cttattaatc 2580

agataaaata tttctagatt tcagtgcaat ttatctcttc aaatgtagca cctgaagtca 2640

gccccatacg atataagttg taattctcat gttagtcatg ccccgcgccc accggaagga 2700

gctgactggg ttgaaggctc tcaagggcat cggtcgagat cccggtgcct aatgagtgag 2760

ctaacttaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg 2820

ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgcca 2880

gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc accgcctggc 2940

cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga aaatcctgtt 3000

tgatggtggt taacggcggg atataacatg agctgtcttc ggtatcgtcg tatcccacta 3060

ccgagatgtc cgcaccaacg cgcagcccgg actcggtaat ggcgcgcatt gcgcccagcg 3120

ccatctgatc gttggcaacc agcatcgcag tgggaacgat gccctcattc agcatttgca 3180

tggtttgttg aaaaccggac atggcactcc agtcgccttc ccgttccgct atcggctgaa 3240

tttgattgcg agtgagatat ttatgccagc cagccagacg cagacgcgcc gagacagaac 3300

ttaatgggcc cgctaacagc gcgatttgct ggtgacccaa tgcgaccaga tgctccacgc 3360

ccagtcgcgt accgtcttca tgggagaaaa taatactgtt gatgggtgtc tggtcagaga 3420

catcaagaaa taacgccgga acattagtgc aggcagcttc cacagcaatg gcatcctggt 3480

catccagcgg atagttaatg atcagcccac tgacgcgttg cgcgagaaga ttgtgcaccg 3540

ccgctttaca ggcttcgacg ccgcttcgtt ctaccatcga caccaccacg ctggcaccca 3600

gttgatcggc gcgagattta atcgccgcga caatttgcga cggcgcgtgc agggccagac 3660

tggaggtggc aacgccaatc agcaacgact gtttgcccgc cagttgttgt gccacgcggt 3720

tgggaatgta attcagctcc gccatcgccg cttccacttt ttcccgcgtt ttcgcagaaa 3780

cgtggctggc ctggttcacc acgcgggaaa cggtctgata agagacaccg gcatactctg 3840

cgacatcgta taacgttact ggtttcacat tcaccaccct gaattgactc tcttccgggc 3900

gctatcatgc cataccgcga aaggttttgc gccattcgat ggtgtccggg atctcgacgc 3960

tctcccttat gcgactcctg cattaggaaa ttaatacgac tcactata 4008

<210> 17

<211> 7354

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(7354)

<223> pACYCDuet1-CasY1-crRNA

<400> 17

ggggaattgt gagcggataa caattcccct gtagaaataa ttttgtttaa ctttaataag 60

gagatatacc atgggcagca gccatcacca tcatcaccac agccaggatc cgaattcgag 120

ctcggcgcgc ctgcaggtcg acaagcttgc ggccgcataa tgcttaagtc gaacagaaag 180

taatcgtatt gtacacggcc gcataatcga aattaatacg actcactata ggggaattgt 240

gagcggataa caattcccca tcttagtata ttagttaagt ataagaagga gatatacata 300

tggcagatct ttgtttaact ttaagaagga gatatacata tgggtatgaa taaaatgaaa 360

aaaacgaaaa agttggatgt tcgtaaatct tattctggtc gactgaaccc caatgaccgc 420

aagagagaac atctacagcg ctctcttaga gcgctcagaa agggttcgga attctttttt 480

gatctggttc aggcttggtg tggcggtctg acacctgaaa tgctagaaga aaatgcaaaa 540

gcagatgatc taattgattt gtggtgtgcc atctactggt tccgaccagt ttctacaaca 600

gttgctacac acccaatcaa tcaaaatgat ctcgttgcta cgtttgaaaa ttactacggc 660

ggaaaagcat ccagccttgt caatgaatat ttgaccgctc caattggaga agaattttta 720

tggaatgatt gtcgacagaa atatgaacac ttctgtcgag actttggagc tgattttacg 780

aatgatcttc gtactctctt aagaaacaat ttgattgccg tggcttctaa taaatcagag 840

ttagaaacat ctacaatttc aagtttgttt ggaactggag ttaaggcaag tcgatcagtc 900

aaagttgaag tcttagagaa aatcttgaat gctgtgcaaa atttggaaaa aattccagat 960

gattgcagat caattcaaaa aatcattttg gaatccgctc aagctaatga tttaaatgaa 1020

ttcaaaattg tttactctgg cggaaacaag agtaacaaag atggcaccac gaaaaaggga 1080

aatggtagac cttctttttt ggaagaattc ttgaaattaa atggtgatga aaaactcacc 1140

cccagtaaat tcaaggaatt ttttgaaaaa cttattgaag aaattaaaaa gaaaaaacaa 1200

gatatgtctt gggaccacgc ccaacgactt cgggaatata ttgaaaacaa tacagcaact 1260

aaatatgatg cttgggcatg ggaagaaatg ctgaaaagtg ggcaaacacc gctcaaaagc 1320

aaagcaacta gaaattatag tttcacaaag gaacgggcag agcaatttgt agaaattcaa 1380

aaaaatcagg atcttgaaat tgtcaatgat ctcaatggat tttttgaaag tgaatttttc 1440

aacggagaat ataaatttgt catctgccaa ttccatattg ggaatgatga tcttgagaaa 1500

ttgttcaaat tctggaatga aaccgacgca gacgtatgga atgaagatac tgaattaatc 1560

ctgaatgatt tttgtgatga tttgaaaaat agtttcaatc gcacgccaat caaaaatgtg 1620

ctgaaatatc tctttcaatt ccgtaaaaag tatacggcta aacaacttgt caatgccgcc 1680

aaatataacg aacaatttga caaatataaa aatcgaaaag ttcatccgtc tgttcttggc 1740

aatcaaggat ttacctggcc aaatgcttta atcccgcccg ataaagctca acgttctgat 1800

cgagaaaatt ctctcgattt gagaatttgg ctgtatatca aattgctcca tgaagatggg 1860

acatggaaaa aacaccatgt ttgttttcat aattcacgct tcttttcaga agtctatgcc 1920

gcaggctcaa atgaaattga acctgtgaaa ttccgcacgc cacgctttgg aacgacattg 1980

ccgaaactca cggcacaaac tccaatccgt gtggcgaaaa aatatgttaa aatcgcaaag 2040

cgtgaagcga aagttcgact cgccgctcaa caaggattgc tccctaagat cagcattccg 2100

ttgaatgaat tgtcggctgt aattaatgat tcgctgggag ttacaatccc tgtgaaattt 2160

aaagtcgatc aaccatcaag aattccgaaa ctaaatgata ttattcttgg gtatgaccaa 2220

aaccaaaccg caagtcatgc ttatagccta tggcaagttg ttgaagaaaa cacgccagat 2280

tcattctatt atgaaggaaa aggctgggaa tgccatgtga aattcctccg ctcaggagat 2340

gtcacgtccc tgactaaaac aaaaaaagat gatgtaattg accaactctc atacgaaggt 2400

cttgattata agaactatgc cgattggaaa agaactgcta agagatttgc tgacaattgg 2460

acaatctcta aaggaaaaga aattactccc gctgtagata gatttgaatc aattgaaaga 2520

tggcaaccac gactctatcg cttcaataag gattatgcat atatcctccg agatattgtt 2580

cgtggaaaat ctcttgctga attacagcaa attcgaccgg aaatctttcg gtttattaca 2640

caaggttttg gagtctgtcg acttggatct ctctcgcttg atgccctcga agctgtaaag 2700

gccgctaagg gagttgttta tagctatttc tcaactgccc taaatggcag caaagaaaat 2760

ccgatctcgg atgaacaacg taaagagttt gatcctgaat tgttcaaact tttggaaaaa 2820

ttggaattca ttcggacaaa aaagaaacaa caaaaagttg accgaatcgg aaactctgtt 2880

ttgagtatcg ctttggaaaa tcaagcgaaa ttcatccgtg gtgaagaaag tttgcccacg 2940

actaataagt caacaaagaa aaaacaaaat ggacgaagca tggattggtt ggcacgaggc 3000

gttgcgaaca aaattcgaca actggcagaa atgcacgaaa ttggtttgct aaatgtcgat 3060

ccacgattca ctagccacca agacccattg gtacacaaca acccaaataa agcaatgaaa 3120

tgccgatata ctgctgctcc gatttctgaa atcggagata atgtactggc aaaactctcg 3180

gctaatttga aaaataaaaa tcgtggaaca actggagaat attaccatca aggaatgaaa 3240

gaattcctgg aacactatgg actccaaaat atcgaaaatg atctcctgaa atggagaaaa 3300

aaacgaccaa caattcaatg ctgggaattg caaaaaattc ttgctgaaaa atttggcaat 3360

gaagaaactg taatctactt cccggcaaaa ggaggacgta aatatttcgc aacacataaa 3420

gtagcgtcag atgctgtatc catgatgttc aatgggaaaa atgtctggtt gtgcaactct 3480

gatcatgtgg cggcagcaaa cattgctctc tctgaattga ataaaatctc gttgccgaga 3540

ttgtggacta aaagtgaaca gccagacgaa ccctccgatg acgaaaaaac tgatgcgact 3600

cctcgcaatt cggtaccctc gagtctggta aagaaaccgc tgctgcgaaa tttgaacgcc 3660

agcacatgga ctcgtctact agcgcagctt aattaaccta ggctgctgcc acctaatacg 3720

actcactata gggaattgca acggctgaga attgcgtctt ccattgacgc gcatctcccc 3780

attccatgag tttttgctga gcaataacta gcataacccc ttggggcctc taaacgggtc 3840

ttgaggggtt ttttgctgaa acctcaggca tttgagaagc acacggtcac actgcttccg 3900

gtagtcaata aaccggtaaa ccagcaatag acataagcgg ctatttaacg accctgccct 3960

gaaccgacga ccgggtcgaa tttgctttcg aatttctgcc attcatccgc ttattatcac 4020

ttattcaggc gtagcaccag gcgtttaagg gcaccaataa ctgccttaaa aaaattacgc 4080

cccgccctgc cactcatcgc agtactgttg taattcatta agcattctgc cgacatggaa 4140

gccatcacag acggcatgat gaacctgaat cgccagcggc atcagcacct tgtcgccttg 4200

cgtataatat ttgcccatag tgaaaacggg ggcgaagaag ttgtccatat tggccacgtt 4260

taaatcaaaa ctggtgaaac tcacccaggg attggctgag acgaaaaaca tattctcaat 4320

aaacccttta gggaaatagg ccaggttttc accgtaacac gccacatctt gcgaatatat 4380

gtgtagaaac tgccggaaat cgtcgtggta ttcactccag agcgatgaaa acgtttcagt 4440

ttgctcatgg aaaacggtgt aacaagggtg aacactatcc catatcacca gctcaccgtc 4500

tttcattgcc atacggaact ccggatgagc attcatcagg cgggcaagaa tgtgaataaa 4560

ggccggataa aacttgtgct tatttttctt tacggtcttt aaaaaggccg taatatccag 4620

ctgaacggtc tggttatagg tacattgagc aactgactga aatgcctcaa aatgttcttt 4680

acgatgccat tgggatatat caacggtggt atatccagtg atttttttct ccattttagc 4740

ttccttagct cctgaaaatc tcgataactc aaaaaatacg cccggtagtg atcttatttc 4800

attatggtga aagttggaac ctcttacgtg ccgatcaacg tctcattttc gccaaaagtt 4860

ggcccagggc ttcccggtat caacagggac accaggattt atttattctg cgaagtgatc 4920

ttccgtcaca ggtatttatt cggcgcaaag tgcgtcgggt gatgctgcca acttactgat 4980

ttagtgtatg atggtgtttt tgaggtgctc cagtggcttc tgtttctatc agctgtccct 5040

cctgttcagc tactgacggg gtggtgcgta acggcaaaag caccgccgga catcagcgct 5100

agcggagtgt atactggctt actatgttgg cactgatgag ggtgtcagtg aagtgcttca 5160

tgtggcagga gaaaaaaggc tgcaccggtg cgtcagcaga atatgtgata caggatatat 5220

tccgcttcct cgctcactga ctcgctacgc tcggtcgttc gactgcggcg agcggaaatg 5280

gcttacgaac ggggcggaga tttcctggaa gatgccagga agatacttaa cagggaagtg 5340

agagggccgc ggcaaagccg tttttccata ggctccgccc ccctgacaag catcacgaaa 5400

tctgacgctc aaatcagtgg tggcgaaacc cgacaggact ataaagatac caggcgtttc 5460

ccctggcggc tccctcgtgc gctctcctgt tcctgccttt cggtttaccg gtgtcattcc 5520

gctgttatgg ccgcgtttgt ctcattccac gcctgacact cagttccggg taggcagttc 5580

gctccaagct ggactgtatg cacgaacccc ccgttcagtc cgaccgctgc gccttatccg 5640

gtaactatcg tcttgagtcc aacccggaaa gacatgcaaa agcaccactg gcagcagcca 5700

ctggtaattg atttagagga gttagtcttg aagtcatgcg ccggttaagg ctaaactgaa 5760

aggacaagtt ttggtgactg cgctcctcca agccagttac ctcggttcaa agagttggta 5820

gctcagagaa ccttcgaaaa accgccctgc aaggcggttt tttcgttttc agagcaagag 5880

attacgcgca gaccaaaacg atctcaagaa gatcatctta ttaatcagat aaaatatttc 5940

tagatttcag tgcaatttat ctcttcaaat gtagcacctg aagtcagccc catacgatat 6000

aagttgtaat tctcatgtta gtcatgcccc gcgcccaccg gaaggagctg actgggttga 6060

aggctctcaa gggcatcggt cgagatcccg gtgcctaatg agtgagctaa cttacattaa 6120

ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat 6180

gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgccagggt ggtttttctt 6240

ttcaccagtg agacgggcaa cagctgattg cccttcaccg cctggccctg agagagttgc 6300

agcaagcggt ccacgctggt ttgccccagc aggcgaaaat cctgtttgat ggtggttaac 6360

ggcgggatat aacatgagct gtcttcggta tcgtcgtatc ccactaccga gatgtccgca 6420

ccaacgcgca gcccggactc ggtaatggcg cgcattgcgc ccagcgccat ctgatcgttg 6480

gcaaccagca tcgcagtggg aacgatgccc tcattcagca tttgcatggt ttgttgaaaa 6540

ccggacatgg cactccagtc gccttcccgt tccgctatcg gctgaatttg attgcgagtg 6600

agatatttat gccagccagc cagacgcaga cgcgccgaga cagaacttaa tgggcccgct 6660

aacagcgcga tttgctggtg acccaatgcg accagatgct ccacgcccag tcgcgtaccg 6720

tcttcatggg agaaaataat actgttgatg ggtgtctggt cagagacatc aagaaataac 6780

gccggaacat tagtgcaggc agcttccaca gcaatggcat cctggtcatc cagcggatag 6840

ttaatgatca gcccactgac gcgttgcgcg agaagattgt gcaccgccgc tttacaggct 6900

tcgacgccgc ttcgttctac catcgacacc accacgctgg cacccagttg atcggcgcga 6960

gatttaatcg ccgcgacaat ttgcgacggc gcgtgcaggg ccagactgga ggtggcaacg 7020

ccaatcagca acgactgttt gcccgccagt tgttgtgcca cgcggttggg aatgtaattc 7080

agctccgcca tcgccgcttc cactttttcc cgcgttttcg cagaaacgtg gctggcctgg 7140

ttcaccacgc gggaaacggt ctgataagag acaccggcat actctgcgac atcgtataac 7200

gttactggtt tcacattcac caccctgaat tgactctctt ccgggcgcta tcatgccata 7260

ccgcgaaagg ttttgcgcca ttcgatggtg tccgggatct cgacgctctc ccttatgcga 7320

ctcctgcatt aggaaattaa tacgactcac tata 7354

<210> 18

<211> 7425

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(7425)

<223> pACYCDuet1-CasY2-crRNA

<400> 18

ggggaattgt gagcggataa caattcccct gtagaaataa ttttgtttaa ctttaataag 60

gagatatacc atgggcagca gccatcacca tcatcaccac agccaggatc cgaattcgag 120

ctcggcgcgc ctgcaggtcg acaagcttgc ggccgcataa tgcttaagtc gaacagaaag 180

taatcgtatt gtacacggcc gcataatcga aattaatacg actcactata ggggaattgt 240

gagcggataa caattcccca tcttagtata ttagttaagt ataagaagga gatatacata 300

tggcagatct ttgtttaact ttaagaagga gatatacata tgggtatgga agctggtaaa 360

gtaggtaaaa agggaaagac aaataaaaag tttatcatta gaccctacct gaccgagctg 420

aatttgcgag aagacggccg ccttgccttc cagaagactt tcgattatat ggatgaacag 480

caggccgctc tgtttatttt gggaggttcc gtgatgtctc atctggacga gtccattatc 540

aggaggcttg gactgcacaa gggatcaaaa aaagatctcc ctcagagact ccgcgtctca 600

ctgcacctgg ctatcgctag gtttcggctg gtgtctgtta attatcacct ggatgccaag 660

gccatatctc ggatgtctcc tacagccagg ctcgcgcacg agcagctcgc tgaggcccac 720

agggcaagcc tgatcaagag ccccatctct gtatggagga acagacacgg ggtacccgat 780

gaggctgtgc acgcctacct ggacggaaat tatgacccag agacatacgc ctggcaggat 840

accgccatgc tcgcaaagaa gctgtgtggt atcctcaaac tgtctccaga agatttcaag 900

gaggcctctg aagcaatgat gagaaatgtc aattttttgg gctgctccgg atctaccggc 960

tcagggagct ctgtcagcaa cctctttggc cagaatgaga aagaagatag ccgcaaccaa 1020

gctcgcatcg aaagtaagac tgccaaagtg attggcaagc tgctggagag ccgccgcccg 1080

ataccgatgg agcgagccgt gtccctggta tgcaaatctc ttggacaccc cgatgctgaa 1140

gccgccgggg aggatcatgg tggccagact gacaagagca catttcgaca gtttatgagg 1200

ggagactacg gaggaagcct taaggagctt gcaaaaaagt tgcagaaaga tgcacacaag 1260

catcggaata aaagcatcat tccacacaga gagactatag gtgcattcat aaagcagtgc 1320

gcctccgggg agttctacaa caaggcaact tcagagagct ggaaggactt caacgccatg 1380

atgaacggga agtacaaaca caatataata ttcgtcacag agaaaatcgc gctgggcaat 1440

gcaatgagga aacttgagag taacgagaag gcagtgaaag catctaagca gttggagaag 1500

ctgatcgaca aatacgaaat ggatgggaat aagcgcttcg tgcccaaggt agcttctgtc 1560

aacggactcg aggcttatcg ggatgttatt caagataacc cgcaagagga tgacgagagc 1620

gtgaaggatt ggctcaagcg gctgtggacc actttttcag aggggaacga ccgaagactg 1680

aagacccctt tcagatggtt ggtcgaatca cttgcccgcc tggagacccc ggagtccgcc 1740

atcaaagacg ggtgccggct tatgtctatt aggcataaac acgagagtca gagaccccat 1800

cccttcgtgc gcgtgcagtc taggtttact gtgggcgata gcaacattgc tggttctatc 1860

aacaaaccca cggagttgaa gcctaatcgc gacggacgat cccctgagga ttactggggg 1920

ggcaaccccg tcgtgtggat gtcatgccgc ctcctgaacg ggaacagatg gcaggatatg 1980

cgcatcccta tccacaactc tcgctatatt aacgaagttt actacactcg gatggggccg 2040

gatggaaatc atgcactgcc cctcaaagaa cacgccagag acgtgaaaca tgattatgag 2100

gccgagacta agatcagtag gacggccgcg agaagggtaa acgaaaaccg catgcttcgc 2160

cgcggtaaac caagcaagcg gttcgagaga gtaaaagcga actccaccca caacgtggtg 2220

ttcgatccca agacaaccgc cagttttaac cggcggcagg acgacatcta cggcactatc 2280

aatcacaggc acccaatggt gcctcttgct cctgacggct tcttcgctgt gggagggaat 2340

gtgataggta ttgatctggg tgagtcagtc ccactggcag ccggcatcct gcagaagtgc 2400

acttctacag attcagaagc agttcgctac gcatgtgggc attggaaggt ggtcgggatg 2460

gggaaaccgg gccagctgct cgacagacag acaagcgcca accgacgcaa gcaaccacac 2520

acgatcattg acccaatgag taatatggga gagcccttta gctccccgat ctgccagaag 2580

tttatcgcca aatgtcgaaa atttgtccgg gcaaaaggct cagaagagga caacaaggcc 2640

ttcgacgaca tggtgaagcg cgagccttca ctgtacagct ttcacggcag atggggctgg 2700

ctccttaaac agatgatgaa ggccgccaaa ggcgccaggc tggacccttt tagagagcat 2760

ttggagtggc tccttttccg gactaaatac ggcccaacca acagaaaaag ccttaacctc 2820

aatagtatgg cgtctacaaa gaacgtcatt tcagccattg actcatatat gagccggaga 2880

ggttggaaaa ccgtggagca gaggcagaga cgcgacggaa gactgcaggc agctagatca 2940

agccttcaaa gcaacttggt gaaccggcgc ctggagcgaa tcaaaaaaga ggagtcccag 3000

tgtattagat tggcccacct ttttgccgtt accacccact tggtactgga ggataacctt 3060

ccgaagcaaa atggagctag ctcccgagcc gacaacgggc gaaaggcaga ctggagaagt 3120

cgacacctgg cccagcgatt gtgcggaatc aaaaatgact ccggatcttg tgcgattgcc 3180

ggagtcagag cccgcaggat cgatcctgtg atgactagcc acatggatcc ttttgtgtat 3240

tctttggata ataagtgggc tatgcgcgcc aggtacacca aggtgagctt gtctagtatg 3300

accgattacc atgccaacct cattaggagc atactgctcg agaaaccagg caagagacag 3360

acgactgaat attatcagcg cgctgtacag gactttgccc gcctgcatgg actggatgtt 3420

gatgagatga ggaaagtccg cgaggctcgg tggtataaaa aacgcattaa ggctaagacg 3480

ctgtacatcc catgcagggg cggacgcgtc tttctgtcca ctcacaggct gcagtctgac 3540

actccccata ccgattccag cggggctgtc ctttgggagc aggacgcaga tcaggtggct 3600

gcactgaatg tagctctcag gtatattgac cagtgctacc ggagtaataa gaaagggctt 3660

gccaaagtga agaagcctaa ggtaccctcg agtctggtaa agaaaccgct gctgcgaaat 3720

ttgaacgcca gcacatggac tcgtctacta gcgcagctta attaacctag gctgctgcca 3780

cctaatacga ctcactatag ggaaactcga ctagatttag aatgcccacg atgattgggc 3840

agcatctccc cattccatga gtttttgctg agcaataact agcataaccc cttggggcct 3900

ctaaacgggt cttgaggggt tttttgctga aacctcaggc atttgagaag cacacggtca 3960

cactgcttcc ggtagtcaat aaaccggtaa accagcaata gacataagcg gctatttaac 4020

gaccctgccc tgaaccgacg accgggtcga atttgctttc gaatttctgc cattcatccg 4080

cttattatca cttattcagg cgtagcacca ggcgtttaag ggcaccaata actgccttaa 4140

aaaaattacg ccccgccctg ccactcatcg cagtactgtt gtaattcatt aagcattctg 4200

ccgacatgga agccatcaca gacggcatga tgaacctgaa tcgccagcgg catcagcacc 4260

ttgtcgcctt gcgtataata tttgcccata gtgaaaacgg gggcgaagaa gttgtccata 4320

ttggccacgt ttaaatcaaa actggtgaaa ctcacccagg gattggctga gacgaaaaac 4380

atattctcaa taaacccttt agggaaatag gccaggtttt caccgtaaca cgccacatct 4440

tgcgaatata tgtgtagaaa ctgccggaaa tcgtcgtggt attcactcca gagcgatgaa 4500

aacgtttcag tttgctcatg gaaaacggtg taacaagggt gaacactatc ccatatcacc 4560

agctcaccgt ctttcattgc catacggaac tccggatgag cattcatcag gcgggcaaga 4620

atgtgaataa aggccggata aaacttgtgc ttatttttct ttacggtctt taaaaaggcc 4680

gtaatatcca gctgaacggt ctggttatag gtacattgag caactgactg aaatgcctca 4740

aaatgttctt tacgatgcca ttgggatata tcaacggtgg tatatccagt gatttttttc 4800

tccattttag cttccttagc tcctgaaaat ctcgataact caaaaaatac gcccggtagt 4860

gatcttattt cattatggtg aaagttggaa cctcttacgt gccgatcaac gtctcatttt 4920

cgccaaaagt tggcccaggg cttcccggta tcaacaggga caccaggatt tatttattct 4980

gcgaagtgat cttccgtcac aggtatttat tcggcgcaaa gtgcgtcggg tgatgctgcc 5040

aacttactga tttagtgtat gatggtgttt ttgaggtgct ccagtggctt ctgtttctat 5100

cagctgtccc tcctgttcag ctactgacgg ggtggtgcgt aacggcaaaa gcaccgccgg 5160

acatcagcgc tagcggagtg tatactggct tactatgttg gcactgatga gggtgtcagt 5220

gaagtgcttc atgtggcagg agaaaaaagg ctgcaccggt gcgtcagcag aatatgtgat 5280

acaggatata ttccgcttcc tcgctcactg actcgctacg ctcggtcgtt cgactgcggc 5340

gagcggaaat ggcttacgaa cggggcggag atttcctgga agatgccagg aagatactta 5400

acagggaagt gagagggccg cggcaaagcc gtttttccat aggctccgcc cccctgacaa 5460

gcatcacgaa atctgacgct caaatcagtg gtggcgaaac ccgacaggac tataaagata 5520

ccaggcgttt cccctggcgg ctccctcgtg cgctctcctg ttcctgcctt tcggtttacc 5580

ggtgtcattc cgctgttatg gccgcgtttg tctcattcca cgcctgacac tcagttccgg 5640

gtaggcagtt cgctccaagc tggactgtat gcacgaaccc cccgttcagt ccgaccgctg 5700

cgccttatcc ggtaactatc gtcttgagtc caacccggaa agacatgcaa aagcaccact 5760

ggcagcagcc actggtaatt gatttagagg agttagtctt gaagtcatgc gccggttaag 5820

gctaaactga aaggacaagt tttggtgact gcgctcctcc aagccagtta cctcggttca 5880

aagagttggt agctcagaga accttcgaaa aaccgccctg caaggcggtt ttttcgtttt 5940

cagagcaaga gattacgcgc agaccaaaac gatctcaaga agatcatctt attaatcaga 6000

taaaatattt ctagatttca gtgcaattta tctcttcaaa tgtagcacct gaagtcagcc 6060

ccatacgata taagttgtaa ttctcatgtt agtcatgccc cgcgcccacc ggaaggagct 6120

gactgggttg aaggctctca agggcatcgg tcgagatccc ggtgcctaat gagtgagcta 6180

acttacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca 6240

gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg ggcgccaggg 6300

tggtttttct tttcaccagt gagacgggca acagctgatt gcccttcacc gcctggccct 6360

gagagagttg cagcaagcgg tccacgctgg tttgccccag caggcgaaaa tcctgtttga 6420

tggtggttaa cggcgggata taacatgagc tgtcttcggt atcgtcgtat cccactaccg 6480

agatgtccgc accaacgcgc agcccggact cggtaatggc gcgcattgcg cccagcgcca 6540

tctgatcgtt ggcaaccagc atcgcagtgg gaacgatgcc ctcattcagc atttgcatgg 6600

tttgttgaaa accggacatg gcactccagt cgccttcccg ttccgctatc ggctgaattt 6660

gattgcgagt gagatattta tgccagccag ccagacgcag acgcgccgag acagaactta 6720

atgggcccgc taacagcgcg atttgctggt gacccaatgc gaccagatgc tccacgccca 6780

gtcgcgtacc gtcttcatgg gagaaaataa tactgttgat gggtgtctgg tcagagacat 6840

caagaaataa cgccggaaca ttagtgcagg cagcttccac agcaatggca tcctggtcat 6900

ccagcggata gttaatgatc agcccactga cgcgttgcgc gagaagattg tgcaccgccg 6960

ctttacaggc ttcgacgccg cttcgttcta ccatcgacac caccacgctg gcacccagtt 7020

gatcggcgcg agatttaatc gccgcgacaa tttgcgacgg cgcgtgcagg gccagactgg 7080

aggtggcaac gccaatcagc aacgactgtt tgcccgccag ttgttgtgcc acgcggttgg 7140

gaatgtaatt cagctccgcc atcgccgctt ccactttttc ccgcgttttc gcagaaacgt 7200

ggctggcctg gttcaccacg cgggaaacgg tctgataaga gacaccggca tactctgcga 7260

catcgtataa cgttactggt ttcacattca ccaccctgaa ttgactctct tccgggcgct 7320

atcatgccat accgcgaaag gttttgcgcc attcgatggt gtccgggatc tcgacgctct 7380

cccttatgcg actcctgcat taggaaatta atacgactca ctata 7425

<210> 19

<211> 7242

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(7242)

<223> pACYCDuet1-CasY3-crRNA

<400> 19

ggggaattgt gagcggataa caattcccct gtagaaataa ttttgtttaa ctttaataag 60

gagatatacc atgggcagca gccatcacca tcatcaccac agccaggatc cgaattcgag 120

ctcggcgcgc ctgcaggtcg acaagcttgc ggccgcataa tgcttaagtc gaacagaaag 180

taatcgtatt gtacacggcc gcataatcga aattaatacg actcactata ggggaattgt 240

gagcggataa caattcccca tcttagtata ttagttaagt ataagaagga gatatacata 300

tggcagatct ttgtttaact ttaagaagga gatatacata tgggtatgag tgagatcacc 360

gccattaaaa cctataatag caatctgttc gccaatagcg agaagaatat caaatacctg 420

cgcgacaccg gagttgcgct caagaacacc acaaatgtgt tccgcgggct gttggtggcc 480

ttttatggag gaatcacccc tgagattgcc agagagaaca taaagattat taaaaaggaa 540

aagagcctcg acatggacct gatatatgcg atcaatcgat tcagacccgt gcggtcaaat 600

tctgaccttg caaagtacca gatcccccag cccgtgatgc ggggcaagtt tgagagcgtt 660

gttggccacg aggcctcaga gctggcggcc gagttcctta attcccctat cggagaggac 720

tatgtgtgga ttgatgggtt gagagcctat gaggacctca aatcccaaat cggcgatttc 780

gactatgact tgaaggtgat ggtgagagaa aatatattgc caatatacaa cttcccaaac 840

atcgaggcat cagcaagcat atcacgaata tttggcaatg gcaagaagga agaccgcgaa 900

ttcaaagtgg gcgttgtgaa gaaaatcaag gagttgatcc tgaacagcga cctgggagac 960

gactactctg tcctccagca gataattttg agcgcggccg gcgctaaaga catgaaggaa 1020

tttagtaaaa cgtatgtggg aaaggctgcc ggtcgccgcg gcaagatcca gaatatcttg 1080

ctggagaact caaacaaaaa gcttggcgcc aacacaatcc agtcagtcct ggaaaagtgt 1140

gatgagatcg tctgcgaaaa aagtagcaag ctgatctgga aaaataacca gggcctgctc 1200

aaatatattg agattcagag tgacctgagt tacgatccca aggcttattc agaatgtttc 1260

aaagccgcac tggccgaaat ccagccaaag aatacggtga actacaattt cgcggtgaaa 1320

aggttgcaga acaagaagga ccttgagtcc aacgtgcaag caatgcagaa ttccgcaatg 1380

ctgaataact attttgattc acactacttc cagggctcca ataacttcgt catctgtcct 1440

tatcacttgg ggggcgagaa cctctcccaa ctgtttaaga tatataagaa cattggggat 1500

tccacagaag cagtaaaaga gtattgtagc gagcttaggg ggagcgtgaa agaccctatt 1560

ccgagtctgt gcgagtacgt cctgacactc cgcgatctgt cctgcaaaca gattataggg 1620

gccgcatctt acaaccagct catccagaga tataaggacc ataaagtgca cccaacaaaa 1680

gatggcaaca acaattatac attttcaacc ggctccgcta tgtacggctg cctgatacct 1740

cccaacaagg ctaagaaaac cgatcgacca gggtctcccg acagcaggat ctggatgatc 1800

ctccgggtgc tgaacggcaa gaagtgggag gatcatcatt actatatcca caatgtgcgc 1860

ttcctggagg aggtctatgc gcataatcct gagttcaagg gggacccggt tgccatccgc 1920

ggggggaggt ttggcggtat cggaaagaag atctgcgaat ctagccttca gagcctgagg 1980

gaaaaccccc agaagtatag aaaaactaaa aagcgcctcc tgcggctcca ggagtctatc 2040

aagaataact ccctgcccaa catcaactgg aatgaaaaga ttgcatccat tggcgtcaga 2100

tttgatcaca ataatttcaa ggctaccatc aatttcaaaa ttaaggtcaa tcacaaaaaa 2160

ttcgagggcc tcaaagtcgg cgacaaaatt atgtcttatg atcagaacca aactcagagc 2220

cacgcctatg cagtgatgaa tgtatgcaat agtttcgatt caggcgccat tcctttccgc 2280

ggccactacg tgcaggtgaa tgaaacagga aagattcgat ccaacattca agtgggacag 2340

aataattatg atccccttag ctacagcggt ctgtcctttg agaaatatga gaactggcgc 2400

aaccagagga aaaacttcgt gagtaaatat aggttcatta tcgggaagaa taatgagaat 2460

tgcgatatgc tcgaggagct ggaaaaaatt gagtcccgca aaccgtccct gtatgagtac 2520

aattacaagt actctgctat ccttcgaaag atcgtcaggg gcaccagcgg ggttaaactg 2580

gacgaatgcc gaaaggaaat tatcagtttt ttggcaaagg agcaggccag cattcgcaat 2640

gtcagctccc tcaatcatca ttccttcagt gcatttagaa gtgccaaaag tctcatttca 2700

gcctactttg ctgcctcaac cggtctcaac atcagcacgg acgaacagaa gcaagacaac 2760

gatcccgaaa tttttgaaat acggaaggac ctcgagcgca gccggaaaaa taagtgtagg 2820

gagaagatta ataagatttc taatactata gtaactatcg ctaatatgga gggatgtaat 2880

attatctgcg gcgagtttgg ccttagttcc actgggagca agaacaacac caagaagcaa 2940

aacaacaaaa acatggattg gctcgcgcga ggcgttgaga aaaagatcaa agaaatgtgc 3000

ttgctgcata atatccattt caaggatgcc cccccacatt ataccagtca ccaggatcct 3060

tttgtttata ataacacgct tctcaaggtg gagagcgtcg atcacatgaa agcaaggttc 3120

gcttacctga gcgtggatga tgtggaggaa tggcatttga aaaagcttag cagttacctg 3180

aagaacaaca agaacgggac tgcctactat tataatagtg caaccaaaca gtttctggac 3240

cactacggcc tggttgagca tgaggaaaag atcactaaaa ataagctgtc cctgtctaag 3300

ttcaaggata tcctcatcaa aaactttggg aatgttaata tcgtcatgcc acttcgggga 3360

ggcagatatt accttgcctc taagaacgtg gtgaccggcg ccgttccttt ctccttcgga 3420

ggatcttgct atctgtcaga tgctgacgaa gtggcagcta taaatgtggg tttgacaatc 3480

ttcccacagc agaactccgt accctcgagt ctggtaaaga aaccgctgct gcgaaatttg 3540

aacgccagca catggactcg tctactagcg cagcttaatt aacctaggct gctgccacct 3600

aatacgactc actataggga atttgcaatc accaaaaatt gtgtccttcg ttgacacagc 3660

atctccccat tccatgagtt tttgctgagc aataactagc ataacccctt ggggcctcta 3720

aacgggtctt gaggggtttt ttgctgaaac ctcaggcatt tgagaagcac acggtcacac 3780

tgcttccggt agtcaataaa ccggtaaacc agcaatagac ataagcggct atttaacgac 3840

cctgccctga accgacgacc gggtcgaatt tgctttcgaa tttctgccat tcatccgctt 3900

attatcactt attcaggcgt agcaccaggc gtttaagggc accaataact gccttaaaaa 3960

aattacgccc cgccctgcca ctcatcgcag tactgttgta attcattaag cattctgccg 4020

acatggaagc catcacagac ggcatgatga acctgaatcg ccagcggcat cagcaccttg 4080

tcgccttgcg tataatattt gcccatagtg aaaacggggg cgaagaagtt gtccatattg 4140

gccacgttta aatcaaaact ggtgaaactc acccagggat tggctgagac gaaaaacata 4200

ttctcaataa accctttagg gaaataggcc aggttttcac cgtaacacgc cacatcttgc 4260

gaatatatgt gtagaaactg ccggaaatcg tcgtggtatt cactccagag cgatgaaaac 4320

gtttcagttt gctcatggaa aacggtgtaa caagggtgaa cactatccca tatcaccagc 4380

tcaccgtctt tcattgccat acggaactcc ggatgagcat tcatcaggcg ggcaagaatg 4440

tgaataaagg ccggataaaa cttgtgctta tttttcttta cggtctttaa aaaggccgta 4500

atatccagct gaacggtctg gttataggta cattgagcaa ctgactgaaa tgcctcaaaa 4560

tgttctttac gatgccattg ggatatatca acggtggtat atccagtgat ttttttctcc 4620

attttagctt ccttagctcc tgaaaatctc gataactcaa aaaatacgcc cggtagtgat 4680

cttatttcat tatggtgaaa gttggaacct cttacgtgcc gatcaacgtc tcattttcgc 4740

caaaagttgg cccagggctt cccggtatca acagggacac caggatttat ttattctgcg 4800

aagtgatctt ccgtcacagg tatttattcg gcgcaaagtg cgtcgggtga tgctgccaac 4860

ttactgattt agtgtatgat ggtgtttttg aggtgctcca gtggcttctg tttctatcag 4920

ctgtccctcc tgttcagcta ctgacggggt ggtgcgtaac ggcaaaagca ccgccggaca 4980

tcagcgctag cggagtgtat actggcttac tatgttggca ctgatgaggg tgtcagtgaa 5040

gtgcttcatg tggcaggaga aaaaaggctg caccggtgcg tcagcagaat atgtgataca 5100

ggatatattc cgcttcctcg ctcactgact cgctacgctc ggtcgttcga ctgcggcgag 5160

cggaaatggc ttacgaacgg ggcggagatt tcctggaaga tgccaggaag atacttaaca 5220

gggaagtgag agggccgcgg caaagccgtt tttccatagg ctccgccccc ctgacaagca 5280

tcacgaaatc tgacgctcaa atcagtggtg gcgaaacccg acaggactat aaagatacca 5340

ggcgtttccc ctggcggctc cctcgtgcgc tctcctgttc ctgcctttcg gtttaccggt 5400

gtcattccgc tgttatggcc gcgtttgtct cattccacgc ctgacactca gttccgggta 5460

ggcagttcgc tccaagctgg actgtatgca cgaacccccc gttcagtccg accgctgcgc 5520

cttatccggt aactatcgtc ttgagtccaa cccggaaaga catgcaaaag caccactggc 5580

agcagccact ggtaattgat ttagaggagt tagtcttgaa gtcatgcgcc ggttaaggct 5640

aaactgaaag gacaagtttt ggtgactgcg ctcctccaag ccagttacct cggttcaaag 5700

agttggtagc tcagagaacc ttcgaaaaac cgccctgcaa ggcggttttt tcgttttcag 5760

agcaagagat tacgcgcaga ccaaaacgat ctcaagaaga tcatcttatt aatcagataa 5820

aatatttcta gatttcagtg caatttatct cttcaaatgt agcacctgaa gtcagcccca 5880

tacgatataa gttgtaattc tcatgttagt catgccccgc gcccaccgga aggagctgac 5940

tgggttgaag gctctcaagg gcatcggtcg agatcccggt gcctaatgag tgagctaact 6000

tacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct 6060

gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc gccagggtgg 6120

tttttctttt caccagtgag acgggcaaca gctgattgcc cttcaccgcc tggccctgag 6180

agagttgcag caagcggtcc acgctggttt gccccagcag gcgaaaatcc tgtttgatgg 6240

tggttaacgg cgggatataa catgagctgt cttcggtatc gtcgtatccc actaccgaga 6300

tgtccgcacc aacgcgcagc ccggactcgg taatggcgcg cattgcgccc agcgccatct 6360

gatcgttggc aaccagcatc gcagtgggaa cgatgccctc attcagcatt tgcatggttt 6420

gttgaaaacc ggacatggca ctccagtcgc cttcccgttc cgctatcggc tgaatttgat 6480

tgcgagtgag atatttatgc cagccagcca gacgcagacg cgccgagaca gaacttaatg 6540

ggcccgctaa cagcgcgatt tgctggtgac ccaatgcgac cagatgctcc acgcccagtc 6600

gcgtaccgtc ttcatgggag aaaataatac tgttgatggg tgtctggtca gagacatcaa 6660

gaaataacgc cggaacatta gtgcaggcag cttccacagc aatggcatcc tggtcatcca 6720

gcggatagtt aatgatcagc ccactgacgc gttgcgcgag aagattgtgc accgccgctt 6780

tacaggcttc gacgccgctt cgttctacca tcgacaccac cacgctggca cccagttgat 6840

cggcgcgaga tttaatcgcc gcgacaattt gcgacggcgc gtgcagggcc agactggagg 6900

tggcaacgcc aatcagcaac gactgtttgc ccgccagttg ttgtgccacg cggttgggaa 6960

tgtaattcag ctccgccatc gccgcttcca ctttttcccg cgttttcgca gaaacgtggc 7020

tggcctggtt caccacgcgg gaaacggtct gataagagac accggcatac tctgcgacat 7080

cgtataacgt tactggtttc acattcacca ccctgaattg actctcttcc gggcgctatc 7140

atgccatacc gcgaaaggtt ttgcgccatt cgatggtgtc cgggatctcg acgctctccc 7200

ttatgcgact cctgcattag gaaattaata cgactcacta ta 7242

<210> 20

<211> 6794

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(6794)

<223> pACYCDuet1-CasY4-crRNA

<400> 20

ggggaattgt gagcggataa caattcccct gtagaaataa ttttgtttaa ctttaataag 60

gagatatacc atgggcagca gccatcacca tcatcaccac agccaggatc cgaattcgag 120

ctcggcgcgc ctgcaggtcg acaagcttgc ggccgcataa tgcttaagtc gaacagaaag 180

taatcgtatt gtacacggcc gcataatcga aattaatacg actcactata ggggaattgt 240

gagcggataa caattcccca tcttagtata ttagttaagt ataagaagga gatatacata 300

tggcagatct ttgtttaact ttaagaagga gatatacata tgggtatgct gatgctggga 360

gacatagtac catatgacag cgtcggggag attgacggtt ggggggctgt ctcccggact 420

ttcggtaagg acaaaaaagc agacatagcc gtccagaaaa agttctgtga tgaagtcctc 480

agcaaaatca acgaggagaa ctgcaaaacg ttcgaggatt acaagaagat tatttttgaa 540

attttcaacg cctccacaat taaagagctg aaaaacactt ggaacagtgg tgccggcgtg 600

aggtcagcaa aagtgatcga caatttggga aaagacactg atcccgagtt cacattcgaa 660

aaggagcgga aaaattggga gagtgtccag gaggagaaga gcttcattcc aaatcgccct 720

aactattggg ccatcataca ttacatggag ggaaaaatcg gagacgaggt ggacaatagc 780

tcttgggctg taatgtacca aaacgccatc attgatattt gttctaaaat cacccgaaac 840

cacaattttt cctacgagca gacagaacgg aagaaagagc tgagcaaatg tgacacaagc 900

gctctggagc tggtaaatgg ctattttaaa agcacgtact tcaagtctgg caatgaattt 960

attatcgaaa accgccacgt gccaaatatc gggagactga tcgagctgta cagcgagctg 1020

actgtcgtta acgacgacaa cattaatgaa atcatcgaga tagtggacag tgaaactaag 1080

gtcaatgaaa atactactgg cgataatcag ttgaaaaaat acatcctctc catcagcggc 1140

tttgcaacgg tgcatcagat cgaacaggca atgaaatata acaagatcaa agatgatatt 1200

gaacagacca aagcccatcc ctttgttagc ggcaacgcaa gctttactgt cggaaactca 1260

gctctgaagg gtagcatcgc atctcagaat tcaaagcaca agggaaaaat tgccgggcag 1320

tccgcaaaga tatggctcta tattcacctg tatcacaagg atattaaaga gtggagggag 1380

caccacatac ccttttatca cgccaagttc ttcgaagagg tatattattt cgaccctgca 1440

ctgacagaga cagtcaaaat caggaataaa aagatgaaga caaatattac taaggaaaac 1500

atcgttaggg atggcattga ccctcgattt gcagaaaaaa acatccgcac tgcagccgta 1560

agacagaatt gtagagctaa tgtggctatg attccttctt ctcttgagct gaccaagaaa 1620

aacggcgaat tcaccatcac catcagccag agatttccta aagggctcaa gcgaaagaag 1680

agtgacatta gactgaatga tattgtgatg gcctacgatc aaaatcagac aaggccaaat 1740

acatatagca tactcagagt gacaagtacc accaaggaca aggacggcag gtatccttgt 1800

gaattcatta aggggggcga catccgatca tttatcaaca caaagatagg cgacatcgat 1860

gtgattaatt acgatggggt tgacaatacg accacatttt tcgtggactt cgtgcgggga 1920

cgcactgagt ttatccacag cgtgtgcaac ctggacgcct ttaagaagac caacgacaac 1980

aaccttaaat atgattttaa ctgcctgggc gagctggctc gcacaaatag agaacagaca 2040

aaactctacc ggtggcagaa ttggtatctg cgcttgttgt tgacgatgat gaagctgagc 2100

aagggctcaa ttccagggtt gagatctgaa attatttacg tagtgcggtt catggacgag 2160

aaatccagcc tgagccagat ctgcatcgag aacattcgat caatgaagaa aattataaac 2220

agctggttca gctacgagat gaaaaaccag gacgctacta atgaagaaaa agaacttcac 2280

gacaaagaga tgtatgccct gttgaaacgg atagaacaga ggcgctccaa taagaacaaa 2340

gagcgaatta ggaaaatcgc ctctgccatc gtcgccattg ctcagcaaga gggggcaaac 2400

attattgtgg gcgagaaaga gctggacacc aaaaaaaaag gaaagaataa ggcttcaaat 2460

aacagggcca tggactggtg ccccggtcag gttagcgaaa aggtgaaaca cggggtagac 2520

ctgctggata tcagcttttt tacaatgcct gctttctaca cttcccacca ggatcctttt 2580

gtgtatagcg actctaatcg agagatgcgg ccgaggatgg atgagatcaa ccccgaggcc 2640

ccgaatgccg aacgcaagat taagtccttc gtcacactgg ccaaaatgaa accaaagaag 2700

gaaaccatga cacagtacta ttctgacggg gtggaccggt tctgcgtcca taacaacatt 2760

accagggcag aactgaagaa gatcaagaca cgcaatgact ggattgccag actgggctcc 2820

gaaaaatgcc tggttcctgt gaggggggga agatactacc tgagcgctaa agtagctgca 2880

agtggagcca cacagatcgt gtacgcaggt gaaaccagat atctttcatc tgccgatcat 2940

atcgccgcca ctaacattgg actgtccttt ctcgtccctt atgaccctga gaaacagaag 3000

aaaaagaagg ggaaaaacca gacagccgtg gataagacgt caacagttgc cgtaccctcg 3060

agtctggtaa agaaaccgct gctgcgaaat ttgaacgcca gcacatggac tcgtctacta 3120

gcgcagctta attaacctag gctgctgcca cctaatacga ctcactatag ggaactcgaa 3180

gagggcgaag aactgtgact cctatgtcac gcatctcccc attccatgag tttttgctga 3240

gcaataacta gcataacccc ttggggcctc taaacgggtc ttgaggggtt ttttgctgaa 3300

acctcaggca tttgagaagc acacggtcac actgcttccg gtagtcaata aaccggtaaa 3360

ccagcaatag acataagcgg ctatttaacg accctgccct gaaccgacga ccgggtcgaa 3420

tttgctttcg aatttctgcc attcatccgc ttattatcac ttattcaggc gtagcaccag 3480

gcgtttaagg gcaccaataa ctgccttaaa aaaattacgc cccgccctgc cactcatcgc 3540

agtactgttg taattcatta agcattctgc cgacatggaa gccatcacag acggcatgat 3600

gaacctgaat cgccagcggc atcagcacct tgtcgccttg cgtataatat ttgcccatag 3660

tgaaaacggg ggcgaagaag ttgtccatat tggccacgtt taaatcaaaa ctggtgaaac 3720

tcacccaggg attggctgag acgaaaaaca tattctcaat aaacccttta gggaaatagg 3780

ccaggttttc accgtaacac gccacatctt gcgaatatat gtgtagaaac tgccggaaat 3840

cgtcgtggta ttcactccag agcgatgaaa acgtttcagt ttgctcatgg aaaacggtgt 3900

aacaagggtg aacactatcc catatcacca gctcaccgtc tttcattgcc atacggaact 3960

ccggatgagc attcatcagg cgggcaagaa tgtgaataaa ggccggataa aacttgtgct 4020

tatttttctt tacggtcttt aaaaaggccg taatatccag ctgaacggtc tggttatagg 4080

tacattgagc aactgactga aatgcctcaa aatgttcttt acgatgccat tgggatatat 4140

caacggtggt atatccagtg atttttttct ccattttagc ttccttagct cctgaaaatc 4200

tcgataactc aaaaaatacg cccggtagtg atcttatttc attatggtga aagttggaac 4260

ctcttacgtg ccgatcaacg tctcattttc gccaaaagtt ggcccagggc ttcccggtat 4320

caacagggac accaggattt atttattctg cgaagtgatc ttccgtcaca ggtatttatt 4380

cggcgcaaag tgcgtcgggt gatgctgcca acttactgat ttagtgtatg atggtgtttt 4440

tgaggtgctc cagtggcttc tgtttctatc agctgtccct cctgttcagc tactgacggg 4500

gtggtgcgta acggcaaaag caccgccgga catcagcgct agcggagtgt atactggctt 4560

actatgttgg cactgatgag ggtgtcagtg aagtgcttca tgtggcagga gaaaaaaggc 4620

tgcaccggtg cgtcagcaga atatgtgata caggatatat tccgcttcct cgctcactga 4680

ctcgctacgc tcggtcgttc gactgcggcg agcggaaatg gcttacgaac ggggcggaga 4740

tttcctggaa gatgccagga agatacttaa cagggaagtg agagggccgc ggcaaagccg 4800

tttttccata ggctccgccc ccctgacaag catcacgaaa tctgacgctc aaatcagtgg 4860

tggcgaaacc cgacaggact ataaagatac caggcgtttc ccctggcggc tccctcgtgc 4920

gctctcctgt tcctgccttt cggtttaccg gtgtcattcc gctgttatgg ccgcgtttgt 4980

ctcattccac gcctgacact cagttccggg taggcagttc gctccaagct ggactgtatg 5040

cacgaacccc ccgttcagtc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 5100

aacccggaaa gacatgcaaa agcaccactg gcagcagcca ctggtaattg atttagagga 5160

gttagtcttg aagtcatgcg ccggttaagg ctaaactgaa aggacaagtt ttggtgactg 5220

cgctcctcca agccagttac ctcggttcaa agagttggta gctcagagaa ccttcgaaaa 5280

accgccctgc aaggcggttt tttcgttttc agagcaagag attacgcgca gaccaaaacg 5340

atctcaagaa gatcatctta ttaatcagat aaaatatttc tagatttcag tgcaatttat 5400

ctcttcaaat gtagcacctg aagtcagccc catacgatat aagttgtaat tctcatgtta 5460

gtcatgcccc gcgcccaccg gaaggagctg actgggttga aggctctcaa gggcatcggt 5520

cgagatcccg gtgcctaatg agtgagctaa cttacattaa ttgcgttgcg ctcactgccc 5580

gctttccagt cgggaaacct gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg 5640

agaggcggtt tgcgtattgg gcgccagggt ggtttttctt ttcaccagtg agacgggcaa 5700

cagctgattg cccttcaccg cctggccctg agagagttgc agcaagcggt ccacgctggt 5760

ttgccccagc aggcgaaaat cctgtttgat ggtggttaac ggcgggatat aacatgagct 5820

gtcttcggta tcgtcgtatc ccactaccga gatgtccgca ccaacgcgca gcccggactc 5880

ggtaatggcg cgcattgcgc ccagcgccat ctgatcgttg gcaaccagca tcgcagtggg 5940

aacgatgccc tcattcagca tttgcatggt ttgttgaaaa ccggacatgg cactccagtc 6000

gccttcccgt tccgctatcg gctgaatttg attgcgagtg agatatttat gccagccagc 6060

cagacgcaga cgcgccgaga cagaacttaa tgggcccgct aacagcgcga tttgctggtg 6120

acccaatgcg accagatgct ccacgcccag tcgcgtaccg tcttcatggg agaaaataat 6180

actgttgatg ggtgtctggt cagagacatc aagaaataac gccggaacat tagtgcaggc 6240

agcttccaca gcaatggcat cctggtcatc cagcggatag ttaatgatca gcccactgac 6300

gcgttgcgcg agaagattgt gcaccgccgc tttacaggct tcgacgccgc ttcgttctac 6360

catcgacacc accacgctgg cacccagttg atcggcgcga gatttaatcg ccgcgacaat 6420

ttgcgacggc gcgtgcaggg ccagactgga ggtggcaacg ccaatcagca acgactgttt 6480

gcccgccagt tgttgtgcca cgcggttggg aatgtaattc agctccgcca tcgccgcttc 6540

cactttttcc cgcgttttcg cagaaacgtg gctggcctgg ttcaccacgc gggaaacggt 6600

ctgataagag acaccggcat actctgcgac atcgtataac gttactggtt tcacattcac 6660

caccctgaat tgactctctt ccgggcgcta tcatgccata ccgcgaaagg ttttgcgcca 6720

ttcgatggtg tccgggatct cgacgctctc ccttatgcga ctcctgcatt aggaaattaa 6780

tacgactcac tata 6794

<210> 21

<211> 7439

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(7439)

<223> pACYCDuet1-CasY5-crRNA

<400> 21

ggggaattgt gagcggataa caattcccct gtagaaataa ttttgtttaa ctttaataag 60

gagatatacc atgggcagca gccatcacca tcatcaccac agccaggatc cgaattcgag 120

ctcggcgcgc ctgcaggtcg acaagcttgc ggccgcataa tgcttaagtc gaacagaaag 180

taatcgtatt gtacacggcc gcataatcga aattaatacg actcactata ggggaattgt 240

gagcggataa caattcccca tcttagtata ttagttaagt ataagaagga gatatacata 300

tggcagatct ttgtttaact ttaagaagga gatatacata tgggtatggc ctctgacgtt 360

acgtcttaca tgacctacag ggccaacctg gtgcctgatg caagaaaaaa gaaattgctt 420

aatgacactt acgcgtttta caggaaaggc gaggagctgt tcttcgatgc cttctttgat 480

atcctgggtg gggtgagtcc acagctgatc aataccctgg tcaatgacgg gacaatcaaa 540

gccgagaatg atgccaccga cgaggaaaag aacgatataa ccgaggagga caaaaacaac 600

acttctaaaa agaagctcga tccaaagctc ctgtgcgcca ttctgtggtt cagactcgtg 660

aagaaggaga agaatacctg tgaaatcctt aatgtgaagc tgttgaaaga gaagttctct 720

gcttattatg gggctgaggc aaatgacaca gtaatctcat atttcagtgc aaattacgac 780

gtggaaaact acatgtgggt agattgcaga gtgcggtgtc tttcattctg caacaagctg 840

gggaccagtc ttgatgtgct ggccatcgat ctggagtcta tgttgcgggc caaaaacatt 900

gctttcttcg gaggcgttgg caaggctgat aaagcgatta gcaacatctt tatccggtct 960

gaaaagcggg gcaaatcaaa tgtgaaaaaa ctgcatgagt acgccgtgaa caccatcgac 1020

atcctcgaaa agaccgaagt cattaacagc gaccagtact tggacgtctt gctcagggtg 1080

tttggcgccg ccaacatcga cgagctgcag aacatctgca aaaaggaaaa cgggggttcc 1140

aaactcgtca agccaatcgg ccagtttctg aacagtaagt tcgtctttga tccaaagaag 1200

gttaagaaga gttgggtgga tcttgccaaa gagaagagct atgcccccaa ttacccttcc 1260

tgcgataaac tcaaaatcta catcgagaac aagctgggca agctcggtca gttgactaaa 1320

ccaaaaaaca aagtttctga cgacgacgag caaggatcca ataaggggct ctggtcatca 1380

atgtttcgga acgcaataac ctctatctgt gctgccgtga cacataatta ctcattctct 1440

atcggtcaga ccgataggca ggaaaagttg agcatactta ggaaaagtaa tgggtctatc 1500

gccaatgaga tcaatgagaa ttttccgcag aaagatcagt acacaatcat gccttatcac 1560

gtgccagatt tgaagaatac tatccggctg tataatggct tgaatcagaa gacagatgag 1620

gagatcgctg gcatcctgaa caccatcaac aataatgaga aggctaaaag aaaaaaacat 1680

ggcgatgtta gagcccaggc gtacattttg agcttgtaca cctcaaactc caccaagtat 1740

acagagaaat ctatcacgga cgcgctgaag atcaacaaga tcgaggacac catcaaaaat 1800

caaaaggtcc atccttttgt gctgggtaac gcaggcatga gatttggtgg agacgacaat 1860

tgcgtgggaa ggattgagag acccagtgtg tttgtgaagg agcttggttg ctatgcaggc 1920

gagagtgata aaatgtggat taccatcaag gtcatcgacg aaggacgatg gaaaacccac 1980

catatcccat tctttcaggc taagtactat gaagaactct atgcttttga cccagaccct 2040

gaaaaaaagg agactgtgaa catcagaatg aataagacaa atacattggc taagaagggt 2100

aatacgtcta acgcaggcat gttcaatgag tccttttatg aaggcaacga cgaagaaacc 2160

aaaatgaaga gaaaaaagta tagacagaaa agagtgagga ataaggtcgc gctggaaaat 2220

ttgaaatata acgtcgactt tgtggatcct acgttcgttc tgttcaaaaa tagtgaggga 2280

ttcggaatta atatctcaca gaatatccaa gacccaactg ggctgaaggg agagattacc 2340

accggccaga atatcatggg gattgaccag aaccgggata ggtctaattc atacagtatc 2400

tggcgcatta caggagacca ggcaaacggc atctatcccg ctgagttcgt gaaatctggc 2460

gatatctcca gcctgattaa aacaaataaa aaggatgaga aaggtaacaa gaaagagtac 2520

gacgtgttca catacgacgg cttgaataca gactctgaaa agctgaattc attttttgca 2580

gatcggaaag ctttcatcta cgggctggat cccgccgtct tcaatacgtc agagtataac 2640

atcttctttg aatacgaaaa gatcaagaat gagaagaaaa aaatctacca gtggaatggg 2700

tcctatctgt ctttgctgcg aaaggtgctc acgatgagta aaggcaacac tgaaaagctg 2760

aaaaatgaaa tcagaaagga gatcatcaat gtgatcagac tgatcgatgg aaaatcttcc 2820

cttagccact gctgtatcat gaacatgcag ggtatgataa aagtgatcaa ttcctggttc 2880

gcctacacaa tgggtgagaa ctcttctaca gaagaccaaa aaaaagaata cgacagcgag 2940

atgtataatc tcctcctcta cgtacgcaaa agacgcaaaa acaaaaagac tgagaagatc 3000

aataagatgg ctaacgccat tatctgtacc gctattgaga acaatgtaaa acacatcatc 3060

ctggaagctc tcgacaagaa gggcgacaag ggcaactcaa gacagaataa tgcctccaac 3120

atggactggt gcgctaaagg cattattgac aaggtgatca ccggctgtcg attcgtggat 3180

atcaacgtga ggaaggtgaa tccagcttac accagtcatc aagatccaat ggtacataat 3240

aagaacaacc cagctatgaa gccgcgcatt gctaagatcg acatggtgga gaagaacaat 3300

tgggctgtcg agaagcttgt atccattagc agtatggacc ctaaggagaa ctctgcggag 3360

atacattact tcaatttcat tgatgtgttt tgcaggcagt ataaaattga ccgaaaggat 3420

cttaataaga taaaaaagat ctctgatctt caggacctga tggcagaaaa gcatagtttt 3480

atatatgtcc ccagcagggg ggggcagtac tatctgagca cacaccgcgt gaccagctgt 3540

gacgatgaca tccagattct gtacgacgga aagaatgtgt ggttggcgaa cagcgatcat 3600

attgcagccg ctaacattgt cctgcgggga ctggactact caccaagccc caagaaaaag 3660

aataagaccg acctcgactt ggccgccgtc ggaggggtac cctcgagtct ggtaaagaaa 3720

ccgctgctgc gaaatttgaa cgccagcaca tggactcgtc tactagcgca gcttaattaa 3780

cctaggctgc tgccacctaa tacgactcac tatagggaac tcgaagaggc gaagcatagt 3840

gaccgatggc gtcacgcatc tccccattcc atgagttttt gctgagcaat aactagcata 3900

accccttggg gcctctaaac gggtcttgag gggttttttg ctgaaacctc aggcatttga 3960

gaagcacacg gtcacactgc ttccggtagt caataaaccg gtaaaccagc aatagacata 4020

agcggctatt taacgaccct gccctgaacc gacgaccggg tcgaatttgc tttcgaattt 4080

ctgccattca tccgcttatt atcacttatt caggcgtagc accaggcgtt taagggcacc 4140

aataactgcc ttaaaaaaat tacgccccgc cctgccactc atcgcagtac tgttgtaatt 4200

cattaagcat tctgccgaca tggaagccat cacagacggc atgatgaacc tgaatcgcca 4260

gcggcatcag caccttgtcg ccttgcgtat aatatttgcc catagtgaaa acgggggcga 4320

agaagttgtc catattggcc acgtttaaat caaaactggt gaaactcacc cagggattgg 4380

ctgagacgaa aaacatattc tcaataaacc ctttagggaa ataggccagg ttttcaccgt 4440

aacacgccac atcttgcgaa tatatgtgta gaaactgccg gaaatcgtcg tggtattcac 4500

tccagagcga tgaaaacgtt tcagtttgct catggaaaac ggtgtaacaa gggtgaacac 4560

tatcccatat caccagctca ccgtctttca ttgccatacg gaactccgga tgagcattca 4620

tcaggcgggc aagaatgtga ataaaggccg gataaaactt gtgcttattt ttctttacgg 4680

tctttaaaaa ggccgtaata tccagctgaa cggtctggtt ataggtacat tgagcaactg 4740

actgaaatgc ctcaaaatgt tctttacgat gccattggga tatatcaacg gtggtatatc 4800

cagtgatttt tttctccatt ttagcttcct tagctcctga aaatctcgat aactcaaaaa 4860

atacgcccgg tagtgatctt atttcattat ggtgaaagtt ggaacctctt acgtgccgat 4920

caacgtctca ttttcgccaa aagttggccc agggcttccc ggtatcaaca gggacaccag 4980

gatttattta ttctgcgaag tgatcttccg tcacaggtat ttattcggcg caaagtgcgt 5040

cgggtgatgc tgccaactta ctgatttagt gtatgatggt gtttttgagg tgctccagtg 5100

gcttctgttt ctatcagctg tccctcctgt tcagctactg acggggtggt gcgtaacggc 5160

aaaagcaccg ccggacatca gcgctagcgg agtgtatact ggcttactat gttggcactg 5220

atgagggtgt cagtgaagtg cttcatgtgg caggagaaaa aaggctgcac cggtgcgtca 5280

gcagaatatg tgatacagga tatattccgc ttcctcgctc actgactcgc tacgctcggt 5340

cgttcgactg cggcgagcgg aaatggctta cgaacggggc ggagatttcc tggaagatgc 5400

caggaagata cttaacaggg aagtgagagg gccgcggcaa agccgttttt ccataggctc 5460

cgcccccctg acaagcatca cgaaatctga cgctcaaatc agtggtggcg aaacccgaca 5520

ggactataaa gataccaggc gtttcccctg gcggctccct cgtgcgctct cctgttcctg 5580

cctttcggtt taccggtgtc attccgctgt tatggccgcg tttgtctcat tccacgcctg 5640

acactcagtt ccgggtaggc agttcgctcc aagctggact gtatgcacga accccccgtt 5700

cagtccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggaaagacat 5760

gcaaaagcac cactggcagc agccactggt aattgattta gaggagttag tcttgaagtc 5820

atgcgccggt taaggctaaa ctgaaaggac aagttttggt gactgcgctc ctccaagcca 5880

gttacctcgg ttcaaagagt tggtagctca gagaaccttc gaaaaaccgc cctgcaaggc 5940

ggttttttcg ttttcagagc aagagattac gcgcagacca aaacgatctc aagaagatca 6000

tcttattaat cagataaaat atttctagat ttcagtgcaa tttatctctt caaatgtagc 6060

acctgaagtc agccccatac gatataagtt gtaattctca tgttagtcat gccccgcgcc 6120

caccggaagg agctgactgg gttgaaggct ctcaagggca tcggtcgaga tcccggtgcc 6180

taatgagtga gctaacttac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga 6240

aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt 6300

attgggcgcc agggtggttt ttcttttcac cagtgagacg ggcaacagct gattgccctt 6360

caccgcctgg ccctgagaga gttgcagcaa gcggtccacg ctggtttgcc ccagcaggcg 6420

aaaatcctgt ttgatggtgg ttaacggcgg gatataacat gagctgtctt cggtatcgtc 6480

gtatcccact accgagatgt ccgcaccaac gcgcagcccg gactcggtaa tggcgcgcat 6540

tgcgcccagc gccatctgat cgttggcaac cagcatcgca gtgggaacga tgccctcatt 6600

cagcatttgc atggtttgtt gaaaaccgga catggcactc cagtcgcctt cccgttccgc 6660

tatcggctga atttgattgc gagtgagata tttatgccag ccagccagac gcagacgcgc 6720

cgagacagaa cttaatgggc ccgctaacag cgcgatttgc tggtgaccca atgcgaccag 6780

atgctccacg cccagtcgcg taccgtcttc atgggagaaa ataatactgt tgatgggtgt 6840

ctggtcagag acatcaagaa ataacgccgg aacattagtg caggcagctt ccacagcaat 6900

ggcatcctgg tcatccagcg gatagttaat gatcagccca ctgacgcgtt gcgcgagaag 6960

attgtgcacc gccgctttac aggcttcgac gccgcttcgt tctaccatcg acaccaccac 7020

gctggcaccc agttgatcgg cgcgagattt aatcgccgcg acaatttgcg acggcgcgtg 7080

cagggccaga ctggaggtgg caacgccaat cagcaacgac tgtttgcccg ccagttgttg 7140

tgccacgcgg ttgggaatgt aattcagctc cgccatcgcc gcttccactt tttcccgcgt 7200

tttcgcagaa acgtggctgg cctggttcac cacgcgggaa acggtctgat aagagacacc 7260

ggcatactct gcgacatcgt ataacgttac tggtttcaca ttcaccaccc tgaattgact 7320

ctcttccggg cgctatcatg ccataccgcg aaaggttttg cgccattcga tggtgtccgg 7380

gatctcgacg ctctccctta tgcgactcct gcattaggaa attaatacga ctcactata 7439

<210> 22

<211> 2690

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(2690)

<223> 重组质粒pUC19-PAM

<220>

<221> misc_feature

<222> (400)..(406)

<223> n表示a,t，c或g

<400> 22

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60

cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180

accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360

tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt nnnnnngcat ctccccattc 420

catgagtcta gagtcgacct gcaggcatgc aagcttggcg taatcatggt catagctgtt 480

tcctgtgtga aattgttatc cgctcacaat tccacacaac atacgagccg gaagcataaa 540

gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca ttaattgcgt tgcgctcact 600

gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc 660

ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg 720

ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc 780

cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag 840

gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca 900

tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca 960

ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg 1020

atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag 1080

gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 1140

tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca 1200

cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg 1260

cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa gaacagtatt 1320

tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc 1380

cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg 1440

cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg 1500

gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta 1560

gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg 1620

gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct gtctatttcg 1680

ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg agggcttacc 1740

atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc cagatttatc 1800

agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc 1860

ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc cagttaatag 1920

tttgcgcaac gttgttgcca ttgctacagg catcgtggtg tcacgctcgt cgtttggtat 1980

ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc ccatgttgtg 2040

caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt 2100

gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag 2160

atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg 2220

accgagttgc tcttgcccgg cgtcaatacg ggataatacc gcgccacata gcagaacttt 2280

aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct 2340

gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac 2400

tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat 2460

aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt attgaagcat 2520

ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca 2580

aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgtctaag aaaccattat 2640

tatcatgaca ttaacctata aaaataggcg tatcacgagg ccctttcgtc 2690

<210> 23

<211> 4102

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(4102)

<223> ccdb毒性质粒

<400> 23

cgtcgacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 60

tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 120

aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt 180

ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg 240

ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga 300

tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc 360

tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac 420

actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg 480

gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca 540

acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg 600

gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg 660

acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg 720

gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag 780

ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg 840

gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct 900

cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac 960

agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac caagtttact 1020

catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 1080

tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagtgt 1140

cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 1200

gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 1260

taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc 1320

ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 1380

tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 1440

ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 1500

cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 1560

agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 1620

gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 1680

atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 1740

gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 1800

gctggccttt tgctcacatg tgaagatcat cttattaatc agataaaata tttctaggct 1860

catgagcccg aagtggttgg catctcccca ttccatgagc gagcccgatc ttccccatcg 1920

gtgatgtcgg cgatataggc gccagcaacc gcacctgtgg cgccggtgat gccggccacg 1980

atgcgtccgg cgtagaggat ctgctcatgt ttgacagctt atcatcgatg cataatgtgc 2040

ctgtcaaatg gacgaagcag ggattctgca aaccctatgc tactccgtca agccgtcaat 2100

tgtctgattc gttaccaatt atgacaactt gacggctaca tcattcactt tttcttcaca 2160

accggcacgg aactcgctcg ggctggcccc ggtgcatttt ttaaataccc gcgagaaata 2220

gagttgatcg tcaaaaccaa cattgcgacc gacggtggcg ataggcatcc gggtggtgct 2280

caaaagcagc ttcgcctggc tgatacgttg gtcctcgcgc cagcttaaga cgctaatccc 2340

taactgctgg cggaaaagat gtgacagacg cgacggcgac aagcaaacat gctgtgcgac 2400

gctggcgata tcaaaattgc tgtctgccag gtgatcgctg atgtactgac aagcctcgcg 2460

tacccgatta tccatcggtg gatggagcga ctcgttaatc gcttccatgc gccgcagtaa 2520

caattgctca agcagattta tcgccagcag ctccgaatag cgcccttccc cttgcccggc 2580

gttaatgatt tgcccaaaca ggtcgctgaa atgcggctgg tgcgcttcat ccgggcgaaa 2640

gaaccccgta ttggcaaata ttgacggcca gttaagccat tcatgccagt aggcgcgcgg 2700

acgaaagtaa acccactggt gataccattc gcgagcctcc ggatgacgac cgtagtgatg 2760

aatctctcct ggcgggaaca gcaaaatatc acccggtcgg caaacaaatt ctcgtccctg 2820

atttttcacc accccctgac cgcgaatggt gagattgaga atataacctt tcattcccag 2880

cggtcggtcg ataaaaaaat cgagataacc gttggcctca atcggcgtta aacccgccac 2940

cagatgggca ttaaacgagt atcccggcag caggggatca ttttgcgctt cagccatact 3000

tttcatactc ccgccattca gagaagaaac caattgtcca tattgcatca gacattgccg 3060

tcactgcgtc ttttactggc tcttctcgct aaccaaaccg gtaaccccgc ttattaaaag 3120

cattctgtaa caaagcggga ccaaagccat gacaaaaacg cgtaacaaaa gtgtctataa 3180

tcacggcaga aaagtccaca ttgattattt gcacggcgtc acactttgct atgccatagc 3240

atttttatcc ataagattag cggatcctac ctgacgcttt ttatcgcaac tctctactgt 3300

ttctccatac ccgttttttt gggctagcga attcgagctc atgcagttta aggtttacac 3360

ctataaaaga gagagccgtt atcgtctgtt tgtggatgta cagagtgata ttattgacac 3420

gcccgggcga cggatggtga tccccctggc cagtgcacgt ctgctgtcag ataaagtctc 3480

ccgtgaactt tacccggtgg tgcatatcgg ggatgaaagc tggcgcatga tgaccaccga 3540

tatggccagt gtgccggtat ccgttatcgg ggaagaagtg gctgatctca gccaccgcga 3600

aaatgacatc aaaaacgcca ttaacctgat gttctgggga atataatcta gagtcgacct 3660

gcaggcatgc aagcttggct gttttggcgg atgagagaag attttcagcc tgatacagat 3720

taaatcagaa cgcagaagcg gtctgataaa acagaatttg cctggcggca gtagcgcggt 3780

ggtcccacct gaccccatgc cgaactcaga agtgaaacgc cgtagcgccg atggtagtgt 3840

ggggtctccc catgcgagag tagggaactg ccaggcatca aataaaacga aaggctcagt 3900

cgaaagactg ggcctttcgt tttatctgtt gtttgtcggt gaacgctctc ctgagtagga 3960

caaatccgcc gggagcggat ttgaacgttg cgaagcaacg gcccggaggg tggcgggcag 4020

gacgcccgcc ataaactgcc aggcatcaaa ttaagcagaa ggccatcctg acggatggcc 4080

tttttgcgtt tctacaaact ct 4102

<210> 24

<211> 35

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(35)

<223> CasY1直接重复序列

<400> 24

uugcaacggc ugagaauugc gucuuccauu gacgc 35

<210> 25

<211> 17

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(17)

<223> CasY1直接重复序列茎环序列

<220>

<221> misc_feature

<222> (6)..(11)

<223> n为a,g,c或u

<400> 25

gcgucnnnnn nugacgc 17

<210> 26

<211> 90

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(90)

<223> CasY1前crRNA序列

<220>

<221> misc_feature

<222> (36)..(55)

<223> n为a,g,c或u

<400> 26

uugcaacggc ugagaauugc gucuuccauu gacgcnnnnn nnnnnnnnnn nnnnnuugca 60

acggcugaga auugcgucuu ccauugacgc 90

<210> 27

<211> 37

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(37)

<223> CasY2直接重复序列

<400> 27

acucgacuag auuuagaaug cccacgauga uugggca 37

<210> 28

<211> 19

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(19)

<223> CasY2直接重复序列茎环序列

<220>

<221> misc_feature

<222> (7)..(12)

<223> n为a,g,c或u

<400> 28

ugcccannnn nnuugggca 19

<210> 29

<211> 94

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(94)

<223> CasY2前crRNA序列

<220>

<221> misc_feature

<222> (38)..(57)

<223> n为a,g,c或u

<400> 29

acucgacuag auuuagaaug cccacgauga uugggcannn nnnnnnnnnn nnnnnnnacu 60

cgacuagauu uagaaugccc acgaugauug ggca 94

<210> 30

<211> 37

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(37)

<223> CasY3直接重复序列

<400> 30

uuugcaauca ccaaaaauug uguccuucgu ugacaca 37

<210> 31

<211> 19

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(19)

<223> CasY1直接重复序列茎环序列

<220>

<221> misc_feature

<222> (7)..(12)

<223> n为a,g,c或u

<400> 31

ugugucnnnn nnugacaca 19

<210> 32

<211> 94

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(94)

<223> CasY3前crRNA序列

<220>

<221> misc_feature

<222> (38)..(57)

<223> n为a,g,c或u

<400> 32

uuugcaauca ccaaaaauug uguccuucgu ugacacannn nnnnnnnnnn nnnnnnnuuu 60

gcaaucacca aaaauugugu ccuucguuga caca 94

<210> 33

<211> 36

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(36)

<223> CasY4直接重复序列

<400> 33

cucgaagagg gcgaagaacu gugacuccua ugucac 36

<210> 34

<211> 17

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(17)

<223> CasY4直接重复序列茎环序列

<220>

<221> misc_feature

<222> (6)..(11)

<223> n为a,g,c或u

<400> 34

gugacnnnnn nugucac 17

<210> 35

<211> 92

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(92)

<223> CasY4前crRNA序列

<220>

<221> misc_feature

<222> (37)..(56)

<223> n为a,g,c或u

<400> 35

cucgaagagg gcgaagaacu gugacuccua ugucacnnnn nnnnnnnnnn nnnnnncucg 60

aagagggcga agaacuguga cuccuauguc ac 92

<210> 36

<211> 36

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(36)

<223> CasY5直接重复序列

<400> 36

cucgaagagg cgaagcauag ugaccgaugg cgucac 36

<210> 37

<211> 16

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(16)

<223> CasY5直接重复序列茎环序列

<220>

<221> misc_feature

<222> (6)..(11)

<223> n为a,g,c或u

<400> 37

gugacnnnnn ngucac 16

<210> 38

<211> 92

<212> RNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(92)

<223> CasY5前crRNA序列

<220>

<221> misc_feature

<222> (37)..(56)

<223> n为a,g,c或u

<400> 38

cucgaagagg cgaagcauag ugaccgaugg cgucacnnnn nnnnnnnnnn nnnnnncucg 60

aagaggcgaa gcauagugac cgauggcguc ac 92

<210> 39

<211> 55

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(55)

<223> TTR-1 crRNA-CasY1

<400> 39

ttgcaacggc tgagaattgc gtcttccatt gacgcaccat cagaggacac ttgga 55

<210> 40

<211> 55

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(55)

<223> TTR-2 crRNA-CasY1

<400> 40

ttgcaacggc tgagaattgc gtcttccatt gacgcgcatc tccccattcc atgag 55

<210> 41

<211> 56

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(56)

<223> PCSK9 crRNA-CasY1

<400> 41

ttgcaacggc tgagaattgc gtcttccatt gacgcgccca gagcatcccg tggaac 56

<210> 42

<211> 57

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(57)

<223> TTR-1 crRNA-CasY2

<400> 42

actcgactag atttagaatg cccacgatga ttgggcaacc atcagaggac acttgga 57

<210> 43

<211> 57

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(57)

<223> TTR-2 crRNA-CasY2

<400> 43

actcgactag atttagaatg cccacgatga ttgggcagca tctccccatt ccatgag 57

<210> 44

<211> 58

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(58)

<223> PCSK9 crRNA-CasY2

<400> 44

actcgactag atttagaatg cccacgatga ttgggcagcc cagagcatcc cgtggaac 58

<210> 45

<211> 57

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(57)

<223> TTR-1 crRNA-CasY3

<400> 45

tttgcaatca ccaaaaattg tgtccttcgt tgacacaacc atcagaggac acttgga 57

<210> 46

<211> 57

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(57)

<223> TTR-2 crRNA-CasY3

<400> 46

tttgcaatca ccaaaaattg tgtccttcgt tgacacagca tctccccatt ccatgag 57

<210> 47

<211> 58

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(58)

<223> PCSK9 crRNA-CasY3

<400> 47

tttgcaatca ccaaaaattg tgtccttcgt tgacacagcc cagagcatcc cgtggaac 58

<210> 48

<211> 56

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(56)

<223> TTR-1 crRNA-CasY4

<400> 48

ctcgaagagg gcgaagaact gtgactccta tgtcacacca tcagaggaca cttgga 56

<210> 49

<211> 56

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(56)

<223> TTR-2 crRNA-CasY4

<400> 49

ctcgaagagg gcgaagaact gtgactccta tgtcacgcat ctccccattc catgag 56

<210> 50

<211> 57

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(57)

<223> PCSK9 crRNA-CasY4

<400> 50

ctcgaagagg gcgaagaact gtgactccta tgtcacgccc agagcatccc gtggaac 57

<210> 51

<211> 56

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(56)

<223> TTR-1 crRNA-CasY5

<400> 51

ctcgaagagg cgaagcatag tgaccgatgg cgtcacacca tcagaggaca cttgga 56

<210> 52

<211> 56

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(56)

<223> TTR-2 crRNA-CasY5

<400> 52

ctcgaagagg cgaagcatag tgaccgatgg cgtcacgcat ctccccattc catgag 56

<210> 53

<211> 57

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(57)

<223> PCSK9 crRNA-CasY5

<400> 53

ctcgaagagg cgaagcatag tgaccgatgg cgtcacgccc agagcatccc gtggaac 57

<210> 54

<211> 41

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(41)

<223> TTR-1 crRNA-LbCpf1

<400> 54

taatttctac taagtgtaga taccatcaga ggacacttgg a 41

<210> 55

<211> 41

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(41)

<223> TTR-2 crRNA- LbCpf1

<400> 55

taatttctac taagtgtaga tgcatctccc cattccatga g 41

<210> 56

<211> 42

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(42)

<223> PCSK9 crRNA- LbCpf1

<400> 56

taatttctac taagtgtaga tgcccagagc atcccgtgga ac 42

<210> 57

<211> 60

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221> misc_feature

<222> (1)..(60)

<223> 靶DNA

<400> 57

tagacaccaa atcttactgg aaggcacttg gcatctcccc attccatgag catgcagagg 60

Claims

1.一种CRISPR-Cas效应子蛋白，其特征在于，所述CRISPR-Cas效应子蛋白包括与SEQID NO：1至5中任一项所述的氨基酸序列具有至少70％同一性的蛋白。

2.根据权利要求1所述的CRISPR-Cas效应子蛋白，其特征在于，所述CRISPR-Cas效应子蛋白包括与SEQ ID NO：1至5中任一项所述的氨基酸序列具有80％以上，优选90％以上，更优选95％以上，进一步优选99％以上同一性的蛋白；

优选地，所述CRISPR-Cas效应子蛋白包括RuvC结构域。

3.根据权利要求2所述的CRISPR-Cas效应子蛋白，其特征在于，所述CRISPR-Cas效应子蛋白包括：

a)SEQ ID NO：1至5中任一项所示的蛋白；或

b)以SEQ ID NO：1所示的氨基酸序列为基础，进行如下一种或多种点突变的蛋白：

N21X，N23X，R25X，K26X，Q482X，S484X，R486X，S489X，R493X，H511X，C513X，H515X，N516X，R518X，R540X，K558X，Y560X，K562X，K565X，T600X，T672X，D676X，Q680X，Y683X，L686X，D693X，Y731X，G767X，R772X，K832X，K833X，Q836X，M896X；或

c)以SEQ ID NO：2所示的氨基酸序列为基础，进行如下一种或多种点突变的蛋白：

R19X，R28X，R32X，K512X，N527X，W531X，R553X，K581X，K589X，I590X，R605X，K611X，R612X，R615X，Y777X，E877X，R931X；或

d)以SEQ ID NO：3所示的氨基酸序列为基础，进行如下一种或多种点突变的蛋白：

K8X，F15X，N17X，K20X，K471X，W483X，H502X，R505X，K557X，K556X，R560X，Y673X，L676X，Y723X，N822X，K823X，E826X，K827X，K830X，K880X，L887X；或

e)以SEQ ID NO：4所示的氨基酸序列为基础，进行如下一种或多种点突变的蛋白：

K317X，W330X，Y351X，K354X，D392X，F395X，N399X，Y509X，V512X，Y568X，N662X，K663X，E666X，R667X，K670X，K719X，L726X；或

f)以SEQ ID NO：5所示的氨基酸序列为基础，进行如下一种或多种点突变的蛋白：

M9X，V16X，D18X，K21X，K518X，W531X，F550X，K553X，R609X，Y612X，R616X，Y730X，L733X，Y781X，N879X，K880X，E883X，K884X，K887X，K936X，F943X；

其中X为任意氨基酸。

4.一种CRISPR-Cas效应子融合蛋白，其特征在于，所述CRISPR-Cas效应子融合蛋白包括权利要求1至3中任一项所述的CRISPR-Cas效应子蛋白、或所述CRISPR-Cas效应子蛋白的衍生物或所述CRISPR-Cas效应子蛋白的功能片段，以及异源功能结构域。

5.根据权利要求4所述的CRISPR-Cas效应子融合蛋白，其特征在于，所述异源功能结构域位于所述CRISPR-Cas效应子融合蛋白的N端、C端或内部；

优选地，所述异源功能结构域包括定位信号、报告蛋白、CRISPR-Cas效应子蛋白靶向部分、DNA结合域、表位标签、转录激活域、转录抑制域、核酸酶、脱氨结构域、甲基化酶、脱甲基酶、转录释放因子、HDAC、裂解活性多肽、连接酶中的一种或多种；

优选地，所述定位信号包括核定位信号和/或核输出信号；

优选地，所述核输出信号包括人类蛋白酪氨酸激酶2；

优选地，所述报告蛋白包括谷胱甘肽-S-转移酶、辣根过氧化物酶、氯霉素乙酰转移酶、β-半乳糖苷酶、β-葡糖醛酸糖苷酶或自发荧光蛋白中的一种或多种；

优选地，所述自发荧光蛋白包括绿色荧光蛋白、HcRed、DsRed、青荧光蛋白、黄色荧光蛋白或蓝色荧光蛋白中的一种或多种；

优选地，所述DNA结合域包括甲基化结合蛋白、Lex A DBD或Gal4 DBD中的一种或多种；

优选地，所述表位标签包括组氨酸标签、V5标签、FLAG标签、流感病毒血凝素标签、Myc标签、VSV-G标签或硫氧还蛋白标签中的一种或多种；

优选地，所述转录激活域包括VP64和/或VPR；

优选地，所述转录抑制域包括KRAB和/或SID；

优选地，所述核酸酶包括FokI；

优选地，所述脱氨结构域包括ADAR1、ADAR2、APOBEC、AID或TAD中的一种或多种；

优选地，所述裂解活性多肽包括具有单链RNA裂解活性的多肽、具有双链RNA裂解活性的多肽、具有单链DNA裂解活性的多肽或具有双链DNA裂解活性的多肽；

优选地，所述连接酶包括DNA连接酶和/或RNA连接酶。

6.一种DNA分子，其特征在于，所述DNA分子编码权利要求1至3中任一项所述的CRISPR-Cas效应子蛋白、或权利要求4或5所述的CRISPR-Cas效应子融合蛋白。

7.根据权利要求6所述的DNA分子，其特征在于，所述DNA分子为根据宿主细胞的密码子偏好性进行密码子优化的DNA分子；

优选地，宿主细胞包括原核细胞或真核细胞；

优选地，所述DNA分子包括与SEQ ID NO：6至10中任一项所述的核苷酸序列具有70％以上，优选90％以上，更优选95％以上，进一步优选99％，更进一步优选为100％同一性的核苷酸。

8.一种重组载体，其特征在于，所述重组载体包含权利要求6或7所述的DNA分子。

9.根据权利要求8所述的重组载体，其特征在于，所述DNA分子与启动子连接；

优选地，所述启动子包括诱导型启动子、组成型启动子或组织特异性启动子中的一种或多种；

优选地，所述启动子包括T7、SP6、T3、CMV、EF1a、SV40、PGK1、humanβ-actin、CAG、U6、H1、T7、T7lac、araBAD、trp、lac或Ptac中的一种或多种；

优选地，所述重组载体包括逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒载体、单纯疱疹载体或噬菌粒载体；

优选地，所述重组载体包括质粒载体。

10.一种宿主细胞，其特征在于，所述宿主细胞转化有权利要求8或9所述的重组载体。

11.一种基因编辑系统，其特征在于，所述基因编辑系统包括：

a)RNA指导物或编码所述RNA指导物的核酸，所述RNA指导物包括直接重复序列和间隔子序列，所述间隔子序列用于与靶核酸杂交；

b)权利要求1至3中任一项所述的CRISPR-Cas效应子蛋白，或权利要求4或5的CRISPR-Cas效应子融合蛋白，或权利要求6或7所述的DNA分子，或权利要求8或9所述的重组载体，或权利要求10所述的宿主细胞；

所述DNA分子、所述重组载体或所述宿主细胞能够表达所述CRISPR-Cas效应子蛋白或所述CRISPR-Cas效应子融合蛋白，

在所述基因编辑系统中，所述CRISPR-Cas效应子蛋白或所述CRISPR-Cas效应子融合蛋白，与所述RNA指导物结合后，靶向作用于所述间隔子序列与所述靶核酸杂交形成的杂交序列。

12.根据权利要求11所述的基因编辑系统，其特征在于，所述基因编辑系统不包含tracrRNA。

13.根据权利要求11所述的基因编辑系统，其特征在于，所述RNA指导物包括1种或多种。

14.根据权利要求11所述的基因编辑系统，其特征在于，所述靶核酸包括DNA；

优选地，所述DNA包括来源于真核生物的DNA或来源于原核生物的DNA；

优选地，所述真核生物包括动物或植物；

优选地，所述DNA包括非人类哺乳动物DNA、人类DNA、昆虫DNA、鸟类DNA、爬行动物DNA、两栖动物DNA、啮齿动物DNA、鱼类DNA、蠕虫DNA、线虫DNA或酵母DNA；

优选地，所述非人类哺乳动物DNA包括非人类灵长类DNA。

15.根据权利要求11所述的基因编辑系统，其特征在于，所述直接重复序列的3’端包含茎环结构，所述茎环结构包括依次连接的第一茎核苷酸链、环核苷酸链和第二茎核苷酸链，所述第一茎核苷酸链和所述第二茎核苷酸链彼此杂交形成所述茎环结构的茎，所述环核苷酸链形成所述茎环结构的环；

优选地，所述第一茎核苷酸链的长度为5或6个核苷酸；

优选地，所述第二茎核苷酸链的长度为5个核苷酸；

优选地，所述环核苷酸链的长度为6、7或8个核苷酸。

16.根据权利要求15所述的基因编辑系统，其特征在于，所述茎环结构包括SEQ ID NO：25、28、31、34或37所述的核苷酸序列。

17.根据权利要求11所述的基因编辑系统，其特征在于，所述直接重复序列包括与SEQIDNO：24、27、30、33或36所述的核苷酸序列具有至少80％同一性的核苷酸序列；

优选地，所述直接重复序列包括与SEQ ID NO：24、27、30、33或36所述的核苷酸序列具有至少85％以上，更优选90％以上，进一步优选95％以上同一性的核苷酸序列；

优选地，所述直接重复序列包括SEQ ID NO：24、27、30、33或36所述的核苷酸序列。

18.根据权利要求11所述的基因编辑系统，其特征在于，所述间隔子序列的80％以上与所述靶核酸互补；

优选地，所述间隔子序列的90％以上，更优选95％以上，进一步优选99％以上，更进一步优选100％与所述靶核酸互补；

优选地，所述间隔子序列的长度为18-41nt；

优选地，所述间隔子序列的长度为18-37nt；

优选地，所述间隔子序列长度为18-26或34-36nt；

优选地，所述间隔子序列长度为20nt。

19.根据权利要求11所述的基因编辑系统，其特征在于，所述直接重复序列包括第一直接重复序列和第二直接重复序列；

优选地，所述RNA指导物包括按顺序依次连接的所述第一直接重复序列、所述间隔子序列以及所述第二直接重复序列；

优选地，所述第一直接重复序列与所述第二直接重复序列相同。

20.根据权利要求11所述的基因编辑系统，其特征在于，所述靶核酸包含前间隔子相邻基序，所述CRISPR-Cas效应子蛋白或所述CRISPR-Cas效应子融合蛋白能够识别所述前间隔子相邻基序，所述前间隔子相邻基序包含核酸序列5’-TTN-3’，其中N是任何核苷酸；

优选地，所述N为A、C或T。

21.根据权利要求11所述的基因编辑系统，其特征在于，CRISPR-Cas效应子蛋白或所述CRISPR-Cas效应子融合蛋白，与所述RNA指导物结合，形成蛋白-核酸复合物；

优选地，所述蛋白-核酸复合物是非天然存在的或经修饰的；

优选地，所述蛋白-核酸复合物中的至少一个组分是非天然存在的或经修饰的。

22.根据权利要求11所述的基因编辑系统，其特征在于，通过所述CRISPR-Cas效应子蛋白或所述CRISPR-Cas效应子融合蛋白和所述RNA指导物对所述靶核酸的所述靶向作用，对所述靶核酸进行修饰；

优选地，所述修饰包括切割或切口；

优选地，所述修饰导致：

(1)细胞包含至少一种基因产物表达的改变；或

(2)所述细胞包含至少一种基因产物的表达的改变，其中所述至少一种基因产物的表达增加；或

(3)所述细胞包含至少一种基因产物的表达的改变，其中所述至少一种基因产物的表达减少；或

(4)所述细胞包含经编辑的基因组；

优选地，所述修饰导致细胞毒性；

优选地，上述修饰导致抑制基因表达、降低基因表达或增强基因表达。

23.根据权利要求11所述的基因编辑系统，其特征在于，所述基因编辑系统包括目标核酸或编码所述目标核酸的核酸，所述目标核酸包括同源臂片段和供体模板核酸；

优选地，所述目标核酸包含能够与所述间隔子序列杂交的序列；

优选地，所述同源臂片段包括5’同源臂和3’同源臂，所述目标核酸由所述5’同源臂、所述供体模板核酸和所述3’同源臂顺序连接组成。

24.根据权利要求11所述的基因编辑系统，其特征在于，所述基因编辑系统以可递送的形式存在，利用递送系统使所述基因编辑系统与所述靶核酸接触；

优选地，所述递送系统将所述基因编辑系统递送入含有所述靶核酸的细胞中；

优选地，所述可递送的形式包括纳米颗粒、脂质体、外泌体、微泡、蛋白衣壳或基因枪所用的颗粒。

25.一种基因编辑载体，其特征在于，所述基因编辑载体包含权利要求11至24中任一项所述的基因编辑系统中的编码所述RNA指导物的核酸。

26.根据权利要求25所述的基因编辑载体，其特征在于，所述基因编辑载体还包含权利要求6或7所述的DNA分子；

优选地，所述DNA分子与编码所述RNA指导物的核酸位于相同或不同的载体上；

优选地，所述DNA分子与第一调节元件连接；

优选地，编码所述RNA指导物的核酸与第二调节元件连接；

优选地，所述第一调节元件和所述第二调节元件分别独立选自诱导型启动子、组成型启动子或组织特异性启动子中的一种或多种；

优选地，所述第一调节元件和所述第二调节元件分别独立选自T7、SP6、T3、CMV、EF1a、SV40、PGK1、humanβ-actin、CAG、U6、H1、T7、T7lac、araBAD、trp、lac或Ptac中的一种或多种。

27.一种权利要求11至24中任一项所述的基因编辑系统与细胞中靶核酸结合的方法，其特征在于，所述方法包括：

将所述基因编辑系统递送至所述细胞中，所述细胞包括所述靶核酸；

使所述CRISPR-Cas效应子蛋白或所述CRISPR-Cas效应子融合蛋白，与所述RNA指导物结合，

使所述间隔子序列与所述靶核酸结合。

28.根据权利要求27所述的方法，其特征在于，所述靶核酸为双链DNA或单链DNA；

优选地，所述基因编辑系统与所述细胞中靶核酸的结合，导致所述靶核酸的表达状态改变；

优选地，所述基因编辑系统与所述细胞中靶核酸的结合，导致所述靶核酸被切割；

优选地，所述靶核酸被切割导致靶核酸破坏、或靶核酸特定位点替换、或靶核酸位点的移除、或靶核酸区域功能的改变、或靶核酸上两个位点之间的序列倒置。

29.一种含有基因编辑系统的细胞，其特征在于，所述含有基因编辑系统的细胞包括权利要求11至24中任一项所述的基因编辑系统、或权利要求25或26所述的基因编辑载体。

30.根据权利要求29所述的含有基因编辑系统的细胞，其特征在于，所述含有基因编辑系统的细胞包含经修饰的目的靶基因座，所述目的靶基因座为利用所述基因编辑系统修饰的基因座；

优选地，所述目的靶基因座的所述修饰导致：

(1)所述含有基因编辑系统的细胞包含至少一种基因产物的表达的改变；或

(2)所述含有基因编辑系统的细胞包含至少一种基因产物的表达的改变，其中所述至少一种基因产物的表达增加；或

(3)所述含有基因编辑系统的细胞包含至少一种基因产物的表达的改变，其中所述至少一种基因产物的表达减少；或

(4)所述含有基因编辑系统的细胞包含经编辑的基因组；

优选地，所述含有基因编辑系统的细胞包括真核细胞或原核细胞；

优选地，所述真核细胞包括动物细胞、植物细胞或人类细胞；

优选地，所述动物细胞包括哺乳动物细胞。

31.一种靶向和编辑靶核酸的方法，其特征在于，所述方法包括使所述靶核酸与权利要求11至24中任一项所述的基因编辑系统接触。

32.一种在识别靶核酸后非特异性降解单链DNA的方法，其特征在于，所述方法包括使所述靶核酸与权利要求11至24中任一项所述的基因编辑系统接触。

33.一种在识别双链靶DNA的间隔子互补链后靶向所述双链靶DNA的非间隔子互补链并使其产生切口的方法，其特征在于，所述方法包括使所述双链靶DNA与权利要求11至24中任一项所述的基因编辑系统接触。

34.一种靶向和切割双链靶DNA的方法，其特征在于，所述方法包括使所述双链靶DNA与权利要求11至24中任一项所述的基因编辑系统接触。

35.根据权利要求34所述的方法，其特征在于，在使所述双链DNA的间隔子互补链产生切口之前，使所述双链靶DNA的非间隔子互补链产生切口。

36.一种特异性编辑双链核酸的方法，其特征在于，

所述方法包括在充分的条件下使以下进行接触充分的时间量，

(1)权利要求11至24中任一项所述的CRISPR-Cas效应子蛋白、或权利要求4或5所述的CRISPR-Cas效应子融合蛋白、另一具有序列特异性切口活性的酶，以及所述RNA指导物，所述RNA指导物指导所述CRISPR-Cas效应子蛋白或所述CRISPR-Cas效应子融合蛋白，相对于所述另一序列特异性切口酶的活性使相对链产生切口；以及

(2)所述双链核酸；

所述方法导致双链断裂的形成。

37.一种编辑双链核酸的方法，其特征在于，所述方法包括在充分的条件下使以下进行接触充分的时间量：

(1)权利要求11至24中任一项所述的CRISPR-Cas效应子蛋白、或权利要求4或5所述的CRISPR-Cas效应子融合蛋白，和具有DNA修饰活性的蛋白质结构域的融合蛋白，以及靶向所述双链核酸的所述RNA指导物；以及

(2)所述双链核酸；

所述融合蛋白的CRISPR-Cas效应子被修饰以使所述双链核酸的非靶链产生切口。

38.根据权利要求37所述的方法，其特征在于，所述双链核酸的两条链在不同的位点被切割，导致交错切割。

39.根据权利要求37所述的方法，其特征在于，所述双链核酸的两条链在同一位点被切割，导致平双链断裂。

40.一种靶向并切割单链靶DNA的方法，其特征在于，所述方法包括使靶核酸与权利要求11至24中任一项所述的基因编辑系统接触。

41.一种诱导细胞状态改变的方法，其特征在于，所述方法包括使权利要求11至24中任一项所述的基因编辑系统与细胞中的所述靶核酸接触。

42.根据权利要求41所述的方法，其特征在于，所述细胞状态包括凋亡或休眠；

优选地，所述细胞包括真核细胞或原核细胞；

优选地，所述细胞包括哺乳动物细胞或植物病变细胞；

优选地，所述细胞包括癌细胞；

优选地，所述细胞包括感染性细胞或被感染原感染的细胞；

优选地，所述细胞包括被病毒感染的细胞、被朊病毒感染的细胞；

优选地，所述细胞包括真菌细胞、原生动物或寄生虫细胞。

43.权利要求11至24中任一项所述的基因编辑系统在制备治疗受试者病症或疾病的药物中的应用。

44.根据权利要求43所述的应用，其特征在于，所述应用包括向所述受试者或所述受试者的离体细胞施用所述基因编辑系统；

优选地，所述间隔子序列与跟所述病症或疾病相关的所述靶核酸的至少15个核苷酸互补，所述CRISPR-Cas效应子蛋白或所述CRISPR-Cas效应子融合蛋白切割所述靶核酸；

优选地，所述病症或疾病包括癌症或感染性疾病；

优选地，所述癌症包括维尔姆斯瘤、尤文肉瘤、神经内分泌瘤、胶质母细胞瘤、神经母细胞瘤、黑色素瘤、皮肤癌、乳腺癌、结肠癌、直肠癌、前列腺癌、肝癌、肾癌、胰腺癌、肺癌、胆道癌、宫颈癌、子宫内膜癌、食管癌、胃癌、头颈癌、甲状腺髓样癌、卵巢癌、胶质瘤、淋巴瘤、白血病、骨髓瘤、急性淋巴细胞白血病、急性髓细胞性白血病、慢性淋巴细胞白血病、慢性髓细胞性白血病、何杰金氏淋巴瘤、非何杰金氏淋巴瘤或尿膀胱癌中的一种或多种；

优选地，所述病症或疾病包括囊性纤维化、进行性假肥大性肌营养不良、贝克肌营养不良、α-1-抗胰蛋白酶缺乏、庞贝病、强直性肌营养不良、亨廷顿病、脆性X综合征、弗里德赖希共济失调、肌萎缩侧索硬化、额颞叶痴呆、遗传性慢性肾脏病、高脂血症、高胆固醇血症、莱伯氏先天性黑蒙、镰状细胞病或β地中海贫血中的一种或多种；

优选地，所述感染性疾病的感染原包括人类免疫缺陷病毒、单纯疱疹病毒-1或单纯疱疹病毒-2中的一种或多种。

45.一种真核细胞系，其特征在于，所述真核细胞系包含权利要求29或30所述的含有基因编辑系统的细胞，或为所述含有基因编辑系统的细胞的后代。

46.一种多细胞生物体，其特征在于，所述多细胞生物体包含权利要求29或30所述的含有基因编辑系统的细胞。

47.根据权利要求46所述的多细胞生物体，其特征在于，所述多细胞生物体包括模型动物或模型植物。

48.一种获得目的性状的植物的方法，其特征在于，利用权利要求11至24中任一项所述的基因编辑系统与植物细胞接触，对所述植物细胞的基因进行修饰或引入目的基因，所述修饰或目的基因能够表达所述目的性状，获得修饰后的植物细胞，

利用所述修饰后的植物细胞进行再生，获得所述目的性状的植物。

49.一种鉴定植物中目的性状的方法，其特征在于，植物细胞中的目的基因能够表达所述目的性状，利用权利要求11至24中任一项所述的基因编辑系统与所述植物细胞接触，从而鉴定所述目的基因。

50.一种试剂盒，其特征在于，所述试剂盒包括一种或多种选自下列的组分：权利要求1至3中任一项所述的CRISPR-Cas效应子蛋白、权利要求4或5所述的CRISPR-Cas效应子融合蛋白、权利要求6或7所述的DNA分子、权利要求8或9所述的重组载体、权利要求10所述的宿主细胞、权利要求11至24所述的基因编辑系统、权利要求25或26所述的基因编辑载体、权利要求29或30所述的含有基因编辑系统的细胞、权利要求45所述的真核细胞系、权利要求46或47所述的多细胞生物体；

所述试剂盒的组分在相同或不同的容器中。

51.一种容器，其特征在于，所述容器包含权利要求50所述的试剂盒。

52.根据权利要求51所述的容器，其特征在于，所述容器包括无菌容器；

优选地，所述容器包括注射器。

53.一种可植入装置，其特征在于，所述可植入装置包括权利要求11至24中任一项所述的基因编辑系统。

54.根据权利要求53所述的可植入装置，其特征在于，所述基因编辑系统在基质内；

优选地，所述基因编辑系统在储库内。