CN114846146B

CN114846146B - 用于增加CRISPR/Cas12f1系统的效率的工程化引导RNA及其用途

Info

Publication number: CN114846146B
Application number: CN202080089323.6A
Authority: CN
Inventors: 金龙三; 金掉妍; 高正宪
Original assignee: Keenkorey Co ltd
Current assignee: Keenkorey Co ltd
Priority date: 2019-10-29
Filing date: 2020-10-29
Publication date: 2024-04-12
Anticipated expiration: 2040-10-29
Also published as: EP4053285A2; WO2021086083A3; EP4053285A4; CN114846146A; KR20210053228A; KR20220141777A; JP2023500188A; WO2021086083A2; US20220307018A1; KR102455623B1

Abstract

本申请文件提供了具有增强的编辑效率的工程化CRISPR/Cas12f1系统及其用途。具体而言，本申请文件提供了富含U的尾序列，可将所述富含U的尾序列掺入工程化的引导RNA中，以增强CRISPR/Cas12f1系统的编辑效率。富含U的尾序列的特征在于含有丰富的尿苷，并且根据引导RNA的表达环境和实际使用环境，可进一步包含除尿苷之外的其它核酸。本发明人实验性地阐释了富含U的尾序列的结构、掺入位置及效果，并在本申请文件中予以公开。

Description

用于增加CRISPR/Cas12f1系统的效率的工程化引导RNA及其用途

技术领域

本公开涉及用于其中将CRISPR/Cas系统、特别是CRISPR/Cas12f1系统用于基因编辑的领域中的技术。

背景技术

CRISPR/Cas12f1系统是一种被归类为2类V型的CRISPR/Cas系统。之前的研究(Harrington等，Programmed DNA destruction by miniature CRISPR-Cas14 enzymes，Science 362，839-842(2018))首次报道了作为CRISPR/Cas14的CRISPR/Cas系统，这是一种由古细菌衍生而来的CRISPR/Cas系统。此后，随后的研究(Karvelis等，Nucleic AcidsResearch，Vol.48，No.9 5017(2020))将CRISPR/Cas14系统归类为CRISPR/Cas12f系统。CRISPR/Cas12f1系统属于V-F1系统(CRISPR/Cas系统中的一个亚型，被归类为2类V型)，并且包括具有Cas14a作为效应蛋白的CRISPR/Cas14a系统。与CRISPR/Cas9系统相比，CRISPR/Cas12f1系统的特征在于效应蛋白的尺寸紧凑。然而，正如之前的研究(Harington等，Programmed DNA destruction by miniature CRISPR-Cas14 enzymes，Science 362，839-842(2018)，US 2020/0190494 A1)所揭示的，CRISPR/Cas12f1系统、特别是CRISPR/Cas14a系统表现出切割单链DNA的能力，但对双链DNA没有或有极低的切割活性，使其在基因编辑技术中的应用受到限制。

发明内容

技术问题

本公开的方面提供了基因编辑效率提高的工程化的CRISPR/Cas12f1系统。

本公开的方面提供了工程化的CRISPR/Cas12f1系统，所述工程化的CRISPR/Cas12f1系统具有富含尿嘧啶(U)的尾序列。

本公开的方面提供了用于工程化CRISPR/Cas12f1系统的工程化的crRNA，所述工程化的crRNA具有富含U的尾序列。

本公开的方面提供了用于工程化CRISPR/Cas12f1系统的工程化的引导RNA，所述工程化的引导RNA具有富含U的尾序列。

本公开的方面提供了工程化CRISPR/Cas12f1复合体，所述工程化的CRISPR/Cas12f1复合体用于工程化的CRISPR/Cas12f1系统，所述工程化CRISPR/Cas12f1复合体具有富含U的尾序列。

本公开的方面提供了具有编码工程化的CRISPR/Cas12f1系统的各组分的核酸序列的载体。

本公开的方面提供了使用工程化的CRISPR/Cas12f1系统的基因编辑方法。

本公开的方面提供了工程化的CRISPR/Cas12f1系统的用途。

技术方案

在实施方式中，本公开的方面提供了用于CRISPR/Cas12f1系统的工程化的CRISPRRNA(crRNA)，所述CRISPR/Cas12f1系统能够编辑包含靶序列的核酸，所述工程化的CRISPRRNA包含：

CRISPR RNA重复序列；

间隔序列，所述间隔序列与所述靶序列互补；以及

富含U的尾序列，所述富含U的尾序列连接至所述间隔序列的3'末端，

其中，所述富含U的尾序列由(U_aN)_nU_b表示，

N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种，

a为1-4的整数，n为选自0、1和2的整数，b为1-10的整数，并且

所述工程化的CRISPR RNA包含在5'-3'方向上按顺序连接的所述CRISPR RNA重复序列、所述间隔序列和所述富含U的尾序列。

在实施方式中，本公开的方面提供了具有编码所述工程化的crRNA的序列的DNA。

在实施方式中，富含U的尾序列可为UUUUUU、UUUUAUUUUUU或UUUUGUUUUUU。

在实施方式中，所述CRISPR RNA重复序列可为SEQ ID NO：58的序列。

在实施方式中，本公开的方面提供了能够编辑包含靶序列的核酸的CRISPR/Cas12f1系统的工程化的引导RNA，所述工程化的引导RNA包含：

tracrRNA序列；

crRNA序列，所述crRNA序列包含CRISPR RNA重复序列和与所述靶序列互补的间隔序列；以及

富含U的尾序列，所述富含U的尾序列连接至所述间隔序列的3'-末端，

其中，所述富含U的尾序列由(U_aN)_nU_b表示，

N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种，

a为1-4的整数，n为选自0、1和2的整数，b为1-10的整数。

在实施方式中，所述工程化的引导RNA进一步包含接头序列，所述tracrRNA序列和所述crRNA序列通过所述接头序列连接。

在实施方式中，所述接头序列可为5'-gaaa-3'。

在实施方式中，所述富含U的尾序列可为UUUUUU、UUUUAUUUUUU或UUUUGUUUUUU。

在实施方式中，本公开的方面提供了具有编码所述工程化的引导RNA的序列的DNA。

在实施方式中，本公开的方面提供了工程化CRISPR/Cas12f1复合体，所述工程化CRISPR/Cas12f1复合体能够编辑包含靶序列的核酸，所述工程化CRISPR/Cas12f1复合体包含Cas12f1蛋白以及工程化的引导RNA，

所述Cas12f1蛋白属于CRISPR14系统类型；

所述工程化的引导RNA包含：支架序列，所述支架序列与所述Cas12f1蛋白相互作用；间隔序列，所述间隔序列与所述靶序列互补；以及富含U的尾序列，

其中，所述富含U的尾序列由(U_aN)_nU_b表示，

N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种，并且

a为1-4的整数，n为选自0、1和2的整数，b为1-10的整数。

在实施方式中，本公开的方面提供了用于表达工程化CRISPR/Cas12f1复合体的载体，所述工程化CRISPR/Cas12f1复合体能够编辑包含靶序列的核酸，所述载体包含：

第一序列，所述第一序列包含编码Cas12f1蛋白的序列；

第一启动子序列，所述第一启动子序列可操作地连接至所述第一序列；

第二序列，所述第二序列包含编码工程化的引导RNA的序列，以及

第二启动子序列，所述第二启动子序列可操作地连接至所述第二序列，

其中，所述工程化的引导RNA具有与所述Cas12f1蛋白相互作用的支架序列、与所述靶序列互补的间隔序列、以及连接至所述间隔序列的3'-末端的富含U的尾序列，

所述富含U的尾序列由(U_aN)_nU_b表示，

N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种，并且

a为1-4的整数，n为选自0、1和2的整数，b为1-10的整数，

其中，将所述载体构建为表达所述Cas12fl蛋白和所述工程化的引导RNA，

因此，所述Cas12f1蛋白和所述工程化的引导RNA在细胞中形成CRISPR/Cas12f1复合体，并且

所述包含靶序列的核酸可被所述CRISPR/Cas12f1复合体编辑。

在实施方式中，所述第二启动子序列可为U6启动子序列。

在实施方式中，所述载体可为质粒载体。

在实施方式中，所述载体可为病毒载体。

在实施方式中，所述载体可为选自于由以下所组成的组中的一种或多种：逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒和单纯疱疹病毒。

在实施方式中，所述载体可为线性PCR扩增子。

本公开的方面提供了用于表达工程化CRISPR/Cas12f1复合体的载体，所述工程化CRISPR/Cas12f1复合体能够编辑包含第一靶序列和第二靶序列的核酸，所述载体包含：

第一序列，所述第一序列包含编码Cas12f1蛋白的序列；

第二序列，所述第二序列包含编码第一工程化的引导RNA的序列；

第二启动子序列，所述第二启动子序列可操作地连接至所述第二序列；

第三序列，所述第三序列包含编码第二工程化的引导RNA的序列；以及

第三启动子序列，所述第三启动子序列可操作地连接至所述第三序列，

其中，所述第一工程化的引导RNA具有与所述Cas12f1蛋白相互作用的第一支架序列、与所述第一靶序列互补的第一间隔序列以及第一富含U的尾序列，其中

所述第一富含U的尾序列由(U_aN)_nU_b表示，

N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种，并且

a为1-4的整数，n为选自0、1和2的整数，b为1-10的整数；

其中，所述第二工程化的引导RNA具有可与所述Cas12f1蛋白相互作用的第二支架序列、与所述第二靶序列互补的第二间隔序列以及第二富含U的尾序列，

所述第二富含U的尾序列由(U_aN)_nU_b表示，

N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种，并且

a为1-4的整数，n为选自0、1和2的整数，b为1-10的整数。

在实施方式中，所述第二启动子序列和所述第三启动子序列可为相同的启动子序列。

在实施方式中，所述第二启动子序列可为H1启动子序列，所述第三启动子序列可为U6启动子序列。

在实施方式中，本公开的方面提供了用于在细胞中对包含靶序列的核酸进行编辑的方法，所述方法包括：

将Cas12f1蛋白或编码所述Cas12f1蛋白的核酸和工程化的引导RNA或编码所述工程化的引导RNA的核酸递送至所述细胞内，

使得可在所述细胞中形成CRISPR/Cas12f1复合体，并且

所述包含所述靶序列的核酸可被所述CRISPR/Cas12f1复合体编辑，

其中，所述工程化的引导RNA具有与所述Cas12f1蛋白相互作用的支架序列、与所述靶序列互补的间隔序列以及连接至所述间隔序列的3'-末端的富含U的尾序列，

其中，所述富含U的尾序列由(U_aN)_nU_b表示，

N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种，以及

a为1-4的整数，n为选自0、1和2的整数，b为1-10的整数。

在实施方式中，在所述递送中，可将所述Cas12f1蛋白和所述工程化的引导RNA以CRISPR/Cas12f1复合体的形式引入所述细胞中。

在实施方式中，在所述递送中，可将包含编码所述Cas12f1蛋白的核酸和编码所述工程化的引导RNA的核酸的载体引入所述细胞中。

在实施方式中，所述载体可选自于由以下所组成的组：逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒和单纯疱疹病毒。

使CRISPR/Cas12f1复合体与所述包含所述靶序列的核酸接触，

其中，所述CRISPR/Cas12f1复合体包含Cas12f1蛋白和工程化的引导RNA，

所述工程化的引导RNA包含与所述Cas12f1蛋白相互作用的支架序列、与所述靶序列互补的间隔序列以及富含U的尾序列，

所述富含U的尾序列由(U_aN)_nU_b表示，

N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种，以及

其中，a为1-4的整数，n为选自0、1和2的整数，b为1-10的整数。

有益效果

本公开提供的具有富含U的尾序列的工程化CRISPR/Cas12f1系统在用于基因编辑时表现出比使用野生型CRISPR/Cas12f1系统时更高的基因编辑效率。

附图说明

图1显示了本公开提供的工程化的引导RNA的示例结构。(a)显示了双引导RNA的结构的示例，其包含CRISPR RNA(crRNA)的重复序列和tracrRNA的一部分。互补序列彼此结合以形成双链RNA。阐述了crRNA部分(CRISPR RNA重复序列部分、间隔序列部分以及富含U的尾序列部分)的名称。(b)显示了单引导RNA的结构示例，其中tracrRNA和crRNA通过接头连接。阐述了CRISPR RNA重复序列部分、间隔序列部分和富含U的尾序列部分的位置。图中所示的各个序列为示例序列。

图2为显示实验例3的结果的图表。(a)为显示在HEK293 T细胞中，携带3'-U4AU6富含U的尾的crRNA序列的CRISPR/Cas12f1系统针对DYTarget2、DYtarget10和DYtarget13的插入缺失效率的图表。就此而言，具有富含U的尾序列的工程化CRISPR/Cas12f1系统的插入缺失效率明显高于野生型CRISPR/Cas12f1系统的插入缺失效率。(b)为显示在HEK293T细胞中，携带U6或U4AU6序列的Cas12f1引导RNA对Intergenic-22显示的插入缺失效率的图表。

图3为显示实验例4的结果的图表。其显示了在HEK293 T细胞中，工程化CRISPR/Cas12f1系统针对靶标1(DYtarget2)、靶标2(DYtarget10)、靶标3(Intergenic-22)的插入缺失效率。无crRNA、标准gRNA和gRNA(MS1)分别是指未经crRNA处理的对照、野生型CRISPR/Cas12f1系统和具有携带U4AU6结构的crRNA的工程化CRISPR/Cas12f1系统的插入缺失效率。

图4为显示实验例7的结果的图表。其显示了在HEK293 T细胞中，CRISPR/Cas12f1系统针对DYtarget2或DYtarget10的插入缺失效率。(a)显示了HEK293 T细胞中DYtarget2的插入缺失效率。WT显示了未处理sgRNA的实验组的插入缺失效率。Ux显示了无U添加到sgRNA间隔序列的3'-末端的实验组的插入缺失效率。U6、U4AU6、U3AU6和U3AU3AU6是指sgRNA的3'-尾序列。

图5为显示实验例8的结果的图表。其显示了在HEK293 T细胞中，工程化CRISPR/Cas12f1系统针对DYtarget2的插入缺失效率。None显示无U添加到sgRNA的实验组的插入缺失效率。T、T2、T3、T4、T4A、T4AT、T4AT2、T4AT3、T4AT4、T4AT5、T4AT6、T4AT7、T4AT8、T4AT4AT和T4AT4AT2是指使用具有分别有U、U2、U3、U4、U4A、U4AU、U4AU2、U4AU3、U4AU4、U4AU5、U4AU6、U4AU7、U4AU8、U4AU4AU和U4AU4AU2结构的3'端序列的工程化sgRNA的实验组的插入缺失效率。

图6为显示实验例9的结果的图表。其显示了在HEK293 T细胞中，CRISPR/Cas12f1系统针对CSMD1的插入缺失效率。None显示无U添加到sgRNA的实验组的插入缺失效率。U、U2、U3、U4、U5、U6、U4A、U4AU、U4AU2、U4AU3、U4AU4、U4AU5、U4AU6、U4AU7、U4AU8、U4AU9和U4AU10示出了在3'-末端显示相应序列的sgRNA的实验组的插入缺失效率。

图7为显示实验例10的结果的图表。其显示了在HEK293 T细胞中，CRISPR/Cas12f1系统针对DYtarget2的插入缺失效率。None是指无U添加到sgRNA的实验组的插入缺失效率。T4AT6和T4GT6分别是指使用具有U4AU6结构的富含U的尾序列的工程化sgRNA的实验组的插入缺失效率，以及使用具有U4GU6结构的富含U的尾序列的工程化sgRNA的实验组的插入缺失效率。

图8为显示实验例11的结果的图表。其显示了在HEK293 T细胞中，工程化CRISPR/Cas12f1系统针对DYtarget2和DYtarget10的插入缺失效率。(a)表明在HEK293 T细胞中，所有实验组中具有U4AU6富含U的尾序列的sgRNA的插入缺失效率。就此而言，图表的水平轴上的18mer、19mer、20mer、21mer、25mer和30mer表明sgRNA的间隔序列的长度。在实验例11的表25中显示了所述间隔序列。(b)表明在HEK293 T细胞中，所有实验组中具有U4AU6富含U的尾序列的sgRNA针对DYtarget10的插入缺失效率。就此而言，图表的水平轴上的17mer、18mer、19mer、20mer、21mer、25mer和30mer表明sgRNA的间隔序列的长度。在实验例11的表24中显示了所述间隔序列。

图9显示了在实验例12-1中使用HA抗体的蛋白质印迹分析结果。就此而言，证实了HEK293 T细胞中AsCas12f1和SpCas12f1效应蛋白得到表达。AsCas12f1和SpCas12f1蛋白的分子量分别显示为56.55kDa和64.65kDa。

具体实施方式

约

如本文所用，术语“约”是指相对于参比的量、水平、值、数目、频率、百分比、尺寸、大小、数量、重量或长度的变化程度为30％、25％、20％、25％、10％、9％、8％、7％、6％、5％、4％、3％、2％或1％的量、水平、值、数目、频率、百分比、尺寸、大小、数量、重量或长度。

可操作地连接

如本文所用，术语“可操作地连接”是指被连接起来从而使得在基因表达技术中，特定组分容许另一组分以预期方式起作用的状态。例如，启动子序列可操作地连接至编码序列的情况是指连接所述启动子以影响所述编码序列的细胞内转录和/或表达。此外，该术语包括能够为本领域技术人员认可的所有含义，并且可根据上下文进行适当解释。

靶基因或靶核酸

如本文所用，“靶基因”或“靶核酸”基本上是指可被CRISPR系统靶向的细胞内基因或核酸。靶基因或靶核酸可互换使用，并且可指同一对象。除非另有描述，靶基因或靶核酸可指靶细胞所具有的独特基因或核酸，也可为外部衍生的基因或核酸，并且只要其可为基因编辑的靶标，就没有特别限制。靶基因或靶核酸可为单链DNA、双链DNA和/或RNA。此外，该术语包括能够为本领域技术人员认可的所有含义，并且可根据上下文进行适当解释。

靶序列

如本文所用，“靶序列”是指CRISPR/Cas复合体识别以对靶基因或靶核酸进行切割的特定序列。可根据其目的适当地选择靶序列。具体而言，“靶序列”为靶基因或靶核酸序列中包含的序列，是指与本说明书中提供的工程化的引导RNA或引导RNA中包含的间隔序列互补的序列。通常，间隔序列是考虑靶基因或靶核酸序列以及被CRISPR/Cas系统的效应蛋白识别的PAM序列来确定的。靶序列可仅指互补结合至CRISPR/Cas复合体的引导RNA的特定链，也可指包含特定链部分的整个靶双链，可根据上下文对其进行适当解释。此外，该术语包括能够为本领域技术人员认可的所有含义，并且可根据上下文进行适当解释。

载体

如本文所用，除非另有规定，“载体”统指所有能够将遗传物质携带至细胞中的物质。例如，载体可为DNA分子，包括感兴趣的遗传物质，例如编码CRISPR/Cas系统的效应蛋白的核酸，和/或编码引导RNA的核酸，但不限于此。该术语包括能够为本领域技术人员认可的所有含义，并且可根据上下文进行适当解释。

工程化的

如本文所用，“工程化的”是用于与具有自然界已经存在的结构的材料、分子等进行区分的术语，并指其中的材料、分子等经人工修饰的材料、分子等。例如，“工程化的引导RNA”的情况是指其中的自然界中存在的引导RNA的组成经人工修饰的引导RNA。此外，该术语包括能够为本领域技术人员认可的所有含义，并且可根据上下文进行适当解释。

核定位序列或信号(NLS)

如本文所用，“NLS”是指在通过核运输行动将细胞核外的物质运输至核内时通过附着至待运输的蛋白来充当一种“标签”的具有一定长度的肽或其序列。具体而言，NLS可为：具有氨基酸序列PKKKRKV(SEQ ID NO：237)的SV40病毒大T抗原的NLS；来自核质蛋白的NLS(例如，具有序列KRPAATKKAGQAKKKK(SEQ ID NO：238)的双分型核质蛋白(nucleoplasmin bipartite)NLS)；具有氨基酸序列PAAKRVKLD(SEQ ID NO：239)或RQRRNELKRSP(SEQ ID NO：240)的c-myc NLS；具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO：241)的hRNPA1M9NLS；来自输入蛋白-α(importin-α)的IBB结构域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO：242)；肌瘤T蛋白的序列VSRKRPRP(SEQ ID NO：243)和PPKKARED(SEQ ID NO：244)；人p53的序列PQPKKKPL(SEQ IDNO：245)；小鼠c-abl IV的序列SALIKKKKKMAP(SEQ ID NO：246)；流感病毒NS1的序列DRLRR(SEQ ID NO：247)和PKQKKRK(SEQ ID NO：248)；肝炎病毒δ抗原的序列RKLKKKIKKL(SEQ IDNO：249)；小鼠Mx1蛋白的序列REKKKFLKRR(SEQ ID NO：250)；人多聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO：251)；或由类固醇激素受体(人)糖皮质激素的序列RKCLQAGMNLEARKTKK(SEQ ID NO：252)衍生而来的NLS序列，但不限于此。如本文所用，术语“NLS”包括能够为本领域技术人员认可的所有含义，并且可根据上下文进行适当解释。

核输出序列或信号(NES)

如本文所用，“NES”是指当通过核运输行动将细胞核中的物质运输到核外时通过附着至待运输的蛋白来充当一种“标签”的具有一定长度的肽或其序列。如本文所用，术语“NES”包括能够为本领域技术人员认可的所有含义，并且可根据上下文适当地解释。

标签

如本文所用，“标签”统指添加以便于肽或蛋白质的示踪和/或分离和纯化的功能结构域。具体而言，标签包括：标签蛋白，如组氨酸(His)标签、V5标签、FLAG标签、流感血凝素(HA)标签、Myc标签、VSV-G标签和硫氧还蛋白(Trx)；自体荧光蛋白，如绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP)、青色荧光蛋白(CFP)、蓝色荧光蛋白(BFP)、HcRED和DsRed；以及报告基因，如谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶、β-葡萄糖醛酸酶和荧光素酶，但不限于此。如本文所用，术语“标签”包括能够为本领域技术人员认可的所有含义，并且可根据上下文进行适当解释。

背景技术-CRISPR/Cas12f1系统

概述

自然界中存在各种类型的CRISPR/Cas系统，并且仍在发现新的CRISPR/Cas系统。其中，本公开中提供的CRISPR/Cas12f1系统具体属于2类，V型的分类，是属于Cas14家族的CRISPR/Cas系统(Harrington等，Programmed DNA destruction by miniature CRISPR-Cas14 enzymes，Science 362,839-842(2018))。下面，对本公开中提供的CRISPR/Cas12f1系统属于何种分类进行说明。

2类CRISPR/Cas系统

CRISPR/Cas系统大致分为1类和2类。其中，2类CRISPR/Cas系统的特征在于其效应复合体包含具有多个结构域的大的单个蛋白。在2类CRISPR/Cas系统中，II型CRISPR/Cas9系统具有代表性，而正在积极研究的用于基因编辑应用的CRISPR/Cas系统(例如CRISPR/Cpf1系统)通常属于2类。

V型CRISPR/Cas系统

2类CRISPR/Cas系统分为II型、V型和VI型。其中，本公开中提供的CRISPR/Cas12f1系统属于V型CRISPR/Cas系统。V型CRISPR/Cas系统的一种效应蛋白命名为Cas12，根据详细分类命名为Cas12a、Cas12b等。Cas12蛋白具有一个核酸酶结构域(RuvC样核酸酶)，这是与具有两个核酸酶结构域(HNH和RuvC结构域)的II型效应蛋白(例如Cas9蛋白)不同的特征。迄今为止，V型CRISPR/Cas系统分为11个亚型，其中本公开中提供的CRISPR/Cas12f1系统属于V-F1，是V-F亚型中的一种的变体(Makarova等，Nature Reviews，Microbiology，第18卷，67(2020))。

CRISPR/Cas12f1系统

CRISPR/Cas12f系统属于V型CRISPR/Cas系统的V-F亚型，进一步细分为V-F1至V-F3的变体。CRISPR/Cas12f系统包括CRISPR/Cas14系统，包括在先前的研究中命名为Cas14的效应蛋白中的Cas14a、Cas14b和Cas14c变体(Harrington等，Programmed DNAdestruction by miniature CRISPR-Cas14 enzymes，Science 362，839-842(2018))。其中，包含Cas14a效应蛋白的CRISPR/Cas14a系统被归类为CRISPR/Cas12f1系统(Makarova等，Nature Reviews，Microbiology，第18卷，67(2020))。然而，CRISPR/Cas12f1不仅包括Cas14a家族(Harrington等，Programmed DNA destruction by miniature CRISPR-Cas14enzymes，Science 362，839-842(2018))，还包括其中的效应系统被命名为c2c10的CRISPR/Cas系统(Karvelis等，Nucleic Acids Research，Vol.48，No.9，5017(2020)；Makarova等，Nature Reviews，Microbiology，第18卷，67(2020))。因此，在本公开中，除非另有描述，CRISPR/Cas12f1系统为包括CRISPR/Cas14a系统和CRISPR/c2c10系统的概念，其中，在提及CRISPR/Cas14a系统时，是指“CRISPR/Cas14a系统”或“属于Cas14家族的CRISPR/Cas12f1系统”。该术语具有本领域技术人员可以根据上下文适当解释的含义。

背景技术-CRISPR/Cas系统表达载体的设计

概述

为了使用CRISPR/Cas系统进行基因编辑，如下方法已被广泛使用：其中，通过将具有编码CRISPR/Cas系统的各组分的序列的载体引入细胞中，在所述细胞中表达CRISPR/Cas系统的各组分。在下文中，将对允许CRISPR/Cas系统在细胞中得以表达的载体的组分进行描述。

CRISPR/Cas系统的核酸编码组分

由于载体的目的是在细胞中表达CRISPR/Cas系统的各组分，载体的序列应该大体上包含编码CRISPR/Cas系统的各组分的一个或多个核酸序列。具体而言，载体的序列包含编码待表达的CRISPR/Cas系统中所包含的Cas蛋白、和/或引导RNA的核酸序列。在这点上，根据其目的，载体的序列不仅可包含编码野生型引导RNA和野生型Cas蛋白的核酸序列，还可包含编码工程化的引导RNA和密码子优化的Cas蛋白的核酸序列、或编码工程化的Cas蛋白的核酸序列。

调节/控制组分

为了在细胞中表达载体，应包含一种或多种调节/控制组分。具体而言，调节/控制成分可包括启动子、增强子、内含子、多聚腺苷酸化信号、Kozak共有序列、内部核糖体进入位点(IRES)、剪接受体、2A序列和/或复制起点，但不限于此。在这点上，复制起点可为f1复制起点、SV40复制起点、pMB1复制起点、腺病毒(adeno)复制起点、AAV复制起点和/或BBV复制起点，但不限于此。

启动子

为了在细胞中对载体的表达靶标进行表达，应通过将启动子序列可操作地连接至编码各组分的序列以在细胞中激活RNA转录因子。启动子序列可根据对应的RNA转录因子或表达环境进行不同的设计，只要启动子序列能够在细胞中适当表达CRISPR/Cas系统的组分，对其不做限定。启动子序列可为促进RNA聚合酶(例如，RNA Pol I、Pol II或Pol III)转录的启动子。例如，启动子可为如下启动子中的一种：SV40初始启动子、小鼠乳腺肿瘤病毒长末端重复(LTR)启动子、腺病毒主要晚期启动子(Ad MLP)、单纯疱疹病毒(HSV)启动子、巨细胞病毒(CMV)启动子(例如CMV立即早期启动子区域(CMVIE))、劳斯肉瘤病毒(RSV)启动子、人U6小核启动子(U6)(Miyagishi等，Nature Biotechnology 20，497-500(2002))、增强的U6启动子(例如，Xia等，Nucleic Acids Res.，2003Sep，1；31(17))和人H1启动子(H1)，但不限于此。

终止信号

当载体序列包含启动子序列时，与启动子可操作地连接的序列的转录由RNA转录因子诱导，诱导RNA转录因子的转录终止的序列称为终止信号。终止信号可因启动子序列的类型而异。例如，当启动子为U6或H1启动子时，启动子识别连续的胸苷序列(例如，TTTTTT(T6)序列)作为终止信号。

额外的表达组分

如果需要，除了野生型CRISPR/Cas系统配置和/或工程化的CRISPR/Cas系统之外，载体可包含编码旨在由本领域技术人员表达的额外的表达组分的核酸序列。例如，额外的表达组分可为<术语的描述>部分的“标签”部分中描述的标签之一，但不限于此。例如，额外的表达组分可为除草剂抗性基因(如草甘膦(glyphosate)、草铵膦(glufosinateammonium)或膦丝菌素(phosphinothricin))以及抗生素抗性基因(如氨苄青霉素、卡那霉素、G418、博来霉素、潮霉素和氯霉素)，但不限于此。

表达载体的形式

表达载体可设计成线性或环状载体的形式。

相关技术的局限

CRISPR/Cas12f1系统、尤其是属于Cas14家族的CRISPR/Cas14a系统的主要局限在于细胞内的基因编辑活性未出现或过低。在先前首次报道的关于CRISPR/Cas14系统的文献中(Harrington等，Programmed DNA destruction by miniature CRISPR-Cas14 enzymes，Science 362，839-842(2018))，先前的研究人员已发现CRISPR/Cas14系统在原核细胞中表现出对单链DNA的切割活性，但对细胞中的双链DNA未表现出切割活性。对此，先前的研究人员认为，当考虑到CRISPR/Cas14系统是在古细菌中发现的系统时，进化早期的CRISPR/Cas系统仅表现出对单链DNA的切割活性，而后在进化过程中获得了对双链DNA的切割活性(例如，CRISPR/Cas9系统)。在另一份先前的文献(US 2020/0190494 A1)中，先前的研究人员报告了如下事实：CRISPR/Cas14系统对真核细胞中的双链DNA表现出切割活性，但切割效率为0.1％或更低，这似乎是非常低的。因此，根据先前的文献，属于Cas14家族的CRISPR/Cas12f1系统对细胞中的双链DNA不显示切割活性，或者即使当CRISPR/Cas12f1系统显示切割活性时，其效率也很低，从而使CRISPR/Cas12f1系统存在局限性，即很难在基因编辑中积极利用CRISPR/Cas12f1系统。

富含U的尾序列

富含U的尾序列-概述

本公开的方面提供了富含U的尾序列以提高CRISPR/Cas12f1系统的基因编辑效率。富含U的尾序列的基本特征为存在丰富的尿苷，其中包括一个或多个尿苷。在实施方式中，富含U的尾序列可包括1-10个重复尿苷的序列。根据工程化的CRISPR/Cas12f1系统的实际使用和表达环境(例如，真核或原核内部环境)，富含U的尾序列可进一步包含除尿苷之外的额外核苷酸。在实施方式中，富含U的尾序列可包括其中有UV、UUV、UUUV和/或UUUUV中的一个或多个重复的序列。就这一点而言，V为腺苷(A)、胞苷(C)和鸟苷(G)中的任一种。富含U的尾序列的特征在于与CRISPR/Cas12f1系统中包含的crRNA序列的3'-末端相连。在本公开中，富含U的尾序列用于提高工程化的CRISPR-Cas12f1系统对靶核酸的插入缺失(indel)效率。就此而言，靶核酸可为单链DNA、双链DNA和/或RNA。本文使用的术语“富含U的尾序列”是指包含丰富尿苷的RNA序列或编码其的DNA序列，并根据上下文来适当解释。在本公开中，对富含U的尾序列的结构及其作用进行了详细描述，将在以下段落中进一步描述。

引入富含U的尾序列的背景-CRISPR/Cpf1系统的相关研究

在先前的研究中，本发明人发现当富含U的尾序列连接至CRISPR/Cpf1系统中包含的crRNA序列的3'-末端时，CRISPR/Cpf1系统的核酸切割效率显著增加(Moon等，Highlyefficient genome editing by CRISPR-Cpf1 using CRISPR RNA with a uridinylate-rich 3'-overhang，Nature Commun 9，3651(2018))。本发明人关注到以下事实：Cpf1属于V型CRISPR/Cas系统(下文，CRISPR/Cas12系统)，并且CRISPR/Cas12系统共享几个特征。因此，我们探讨了通过将连续的尿苷序列添加至CRISPR/Cas12系统中包含的crRNA 3'端是否提高CRISPR/Cas12复合体的基因编辑效率。

引入富含U的尾序列的背景-在CRISPR/Cas12f1系统中有效

本发明人通过实验发现，当将富含U的尾序列连接至Cas12f1、特别是属于Cas14家族的CRISPR/Cas12f1系统的crRNA的3'端时，基因编辑效率显著提高。此外，研究了富含U的尾序列的各种配置对插入缺失效率的影响，并在本公开中提供了富含U的尾序列的最佳结构。

引入富含U的尾序列的背景-不适用于所有CRISPR/Cas12系统

然而，作为将富含U的尾序列引入其它CRISPR/Cas12系统的结果，发现仅仅属于V型CRISPR/Cas系统并未增强CRISPR/Cas12复合体的基因编辑效率(见实验示例00)。可推断，对于富含U的尾序列而言这带来了不同的结果，因为即使是相同的V型组，在tracrRNA的存在、Cas蛋白的结构等方面也表现出不同的方面。就本发明人所知，添加至crRNA的3'-末端的富含U的尾序列通过何种功能和机制提高了CRISPR/Cas系统中的核酸切割效率，目前还没有阐明，并且也很难确定添加至crRNA的3'-末端的富含U的尾序列是否仅基于引导RNA和/或Cas蛋白的结构来影响基因切割活性。因此，阐明富含U的尾序列的作用及其对CRISPR/Cas系统的影响将是未来研究的课题。在下文中，将更详细地描述引入CRISPR/Cas12f1系统、特别是属于Cas14家族的系统中的富含U的尾序列。

富含U的尾序列结构-连续尿苷序列

设计富含U的尾序列的重点之一是大量包含其中有连续的一个或多个尿苷的序列。本发明人通过实验发现，当将富含U的尾序列引入CRISPR/Cas12f1系统中时，改善了CRISPR/Cas12f1复合体的基因编辑效率，所述富含U的尾序列为其中有连续的一个或多个尿苷的序列。因此，本公开中提供的富含U的尾序列包含其中有连续的一个或多个尿苷的序列。在实施方式中，富含U的尾序列可包含其中有连续的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个尿苷的序列。

富含U的尾序列结构-单独包含连续尿苷序列时可能出现的问题

当富含U的尾序列包含长的连续(例如，其中有连续的5个以上尿苷的序列)尿苷序列时，在通过将载体等引入细胞中来表达crRNA时，可能会出现以下问题。在设计表达上述连续的尿苷序列的载体时，载体中不可避免地包含对应于连续的尿苷序列的连续胸苷序列。在这点上，由于用于在真核细胞中使载体表达的一些启动子(例如，U6启动子等)使用连续的胸苷序列(例如T6序列)作为终止信号，所以对应于连续尿苷序列的连续胸苷序列可被识别为终止信号。当连续尿苷序列包含1-4个尿苷时，载体中包含1-4个连续胸苷的序列，其无法充当终止信号，因此在表达其中包含最多4个连续胸苷的富含U的尾序列中没有特别的问题。然而，当连续的尿苷序列包含6个以上的尿苷时，载体中包含充当终止信号的T6序列，因此包含5个以上连续尿苷的富含U的尾序列不太可能按预期表达。因此，为了在使用识别连续的胸苷序列作为终止序列的启动子的同时在富含U的尾部序列中包含丰富的尿苷，需要避免其中有连续的6个以上尿苷的结构。

富含U的尾序列结构-修饰的连续尿苷序列

为了解决如上所述的问题，本公开中提供的富含U的尾序列可包含修饰的尿苷重复序列，在所述修饰的尿苷重复序列中每1-5个尿苷中掺入一个核糖核苷(A、C、G)。在实施方式中，富含U的尾序列可包含其中有重复的一个或多个UV、UUV、UUUV、UUUUV和/或UUUUUV的序列。就此而言，V为腺苷(A)、胞苷(C)和鸟苷(G)中的一种。修饰的连续尿苷序列在设计表达工程化的crRNA的载体中可能有用。

富含U的尾序列的实例-U_x形式

在实施方式中，富含U的尾序列可由U_x表示。在实施方式中，x可为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。在实施方式中，x可为这些数字中的两个之间的数值范围内的整数。例如，x可为1-6的整数。在实施方式中，x可为1-20的整数。在实施方式中，x可为20或更大的整数。

富含U的尾序列的实例-(U_aN)_nU_b形式

在实施方式中，富含U的尾序列可由(U_aN)_nU_b表示。就此而言，N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种。就此而言，a为1-5的整数，n为0或更大的整数。在实施方式中，n可为0-2之间的整数。在实施方式中，b可为1、2、3、4、5、6、7、8、9或10。在实施方式中，b可为这些数字中的两个之间的数值范围内的整数。例如，b可为1-6之间的整数。

富含U的尾序列的示例性实施方式-(U_aV)_n形式

在实施方式中，富含U的尾序列可由(U_aV)_n表示。就此而言，V为腺苷(A)、胞苷(C)和鸟苷(G)中的一种。就此而言，a可为1-4之间的整数，并且n可为1或更大的整数。

在实施方式中，富含U的尾序列可由(U_aM)_n表示。就此而言，M为腺苷(A)或胞苷(C)。就此而言，a可为1-4之间的整数，并且n可为1或更大的整数。

在实施方式中，富含U的尾序列可由(U_aR)_n表示。就此而言，R为腺苷(A)或鸟苷(G)。就此而言，a可为1-4之间的整数，并且n可为1或更大的整数。

在实施方式中，富含U的尾序列可由(U_aS)_n表示。就此而言，S为胞苷(C)或鸟苷(G)。就此而言，a可为1-4之间的整数，并且n可为1或更大的整数。

在实施方式中，富含U的尾序列可由(U_aA)_n表示。就此而言，a可为1-4之间的整数，并且n可为1或更大的整数。

在实施方式中，富含U的尾序列可由(U_aC)_n表示。就此而言，a可为1-4之间的整数，并且n可为1或更大的整数。

在实施方式中，富含U的尾序列可由(U_aG)_n表示。就此而言，a可为1-4之间的整数，并且n可为1或更大的整数。

富含U的尾序列的实例-(U_aV)_nU_b形式

在实施方式中，富含U的尾序列可由(U_aV)_nU_b表示。就此而言，V为腺苷(A)、胞苷(C)和鸟苷(G)中的一种。就此而言，a为1-4之间的整数，n为0或更大的整数。在实施方式中，n可为1或2。在实施方式中，b可为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。在实施方式中，b可为这些数字中的两个之间的数值范围内的整数。例如，b可为1-6之间的整数。在实施方式中，b可为1-20之间的整数。在实施方式中，b可为20或更大的整数。

在实施方式中，富含U的尾序列可由(U_aM)_n表示。就此而言，M为腺苷(A)或胞苷(C)。就此而言，a为1-4之间的整数，n为0或更大的整数。在实施方式中，n可为1或2。在实施方式中，b可为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。在实施方式中，b可为这些数字中的两个之间的数值范围内的整数。在实施方式中，b可为1-6之间的整数。在实施方式中，b可为1-20之间的整数。在实施方式中，b可为20或更大的整数。

在实施方式中，富含U的尾序列可由(U_aR)_n表示。就此而言，R为腺苷(A)或鸟苷(G)。就此而言，a为1-4之间的整数，n为0或更大的整数。在实施方式中，n可为1或2。在实施方式中，b可为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。在实施方式中，b可为这些数字中的两个之间的数值范围内的整数。在实施方式中，b可为1-6之间的整数。在实施方式中，b可为1-20之间的整数。在实施方式中，b可为20或更大的整数。

在实施方式中，富含U的尾序列可由(U_aS)_n表示。就此而言，S为胞苷(C)或鸟苷(G)。就此而言，a为1-4之间的整数，n为0或更大的整数。在实施方式中，n可为1或2。在实施方式中，b可为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。就此而言，b可为这些数字中的两个之间的数值范围内的整数。在实施方式中，b可为1-6之间的整数。在实施方式中，b可为1-20之间的整数。在实施方式中，b可为20或更大的整数。

在实施方式中，富含U的尾序列可由(U_aA)_nU_b表示。就此而言，a为1-4之间的整数，n为0或更大的整数。在实施方式中，n可为1或2。在实施方式中，b可为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。就此而言，b可为这些数字中的两个之间的数值范围内的整数。在实施方式中，b可为1-6之间的整数。在实施方式中，b可为1-20之间的整数。在实施方式中，b可为20或更大的整数。

在实施方式中，富含U的尾序列可由(U_aC)_nU_b表示。就此而言，a为1-4之间的整数，n为0或更大的整数。在实施方式中，n可为1或2。在实施方式中，b可为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。就此而言，b可为在这些数字中的两个之间的数值范围内的整数。在实施方式中，b可为1-6之间的整数。在实施方式中，b可为1-20之间的整数。在实施方式中，b可为20或更大的整数。

在实施方式中，富含U的尾序列可由(U_aG)_nU_b表示。就此而言，a为1-4之间的整数，n为0或更大的整数。在实施方式中，n可为1或2。在实施方式中，b可为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。就此而言，b可为这些数字中的两个之间的数值范围内的整数。在实施方式中，b可为1-6之间的整数。在实施方式中，b可为1-20之间的整数。在实施方式中，b可为20或更大的整数。

富含U的尾序列的实例-U_x和(U_aV)_n的组合

在实施方式中，富含U的尾序列可为由U_x表示的序列和由(U_aV)_n表示的序列的组合形式。在实施方式中，富含U的尾序列可由(U)_n1-V1-(U)_n2-V2-U_x表示。就此而言，V1和V2可各自为腺苷(A)、胞苷(C)和鸟苷(G)中的一种。就此而言，n1和n2可各自为1-4之间的整数。就此而言，x可为1-20之间的整数。

富含U的尾序列-总长度

在实施方式中，富含U的尾序列的长度可为1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、11nt、12nt、13nt、14nt、15nt、16nt、17nt、18nt、19nt或20nt。在实施方式中，富含U的尾序列的长度可为20nt以上。

富含U的尾序列-示例性序列

在实施方式中，富含U的尾序列可为U、UU、UUU、UUUU、UUUUU、UUUUUU、UUUAUUU、UUUAUUUAUUU(SEQ ID NO：11)、UUUUAU、UUUUAUU、UUUUAUUU、UUUUAUUUU、UUUUAUUUUU(SEQ IDNO：4)、UUUUAUUUUUU(SEQ ID NO：5)、UUUGUUU、UUUGUUUGUUU(SEQ ID NO：29)、UUUUGU、UUUUGUU、UUUUGUUU、UUUUGUUUU、UUUUGUUUUU(SEQ ID NO：22)或UUUUGUUUUUU(SEQ ID NO：23)。

在实施方式中，富含U的尾序列可为选自于由SEQ ID NO：3-SEQ ID NO：57所组成的组中的任一个。

引入富含U的尾序列的优势1-基因编辑效率增加

当将本公开中提供的富含U的尾序列引入CRISPR/Cas12f1系统中时，可显著增加所得的工程化CRISPR/Cas12f1复合体的基因编辑效率。具体而言，所述工程化CRISPR/Cas12f1复合体对真核细胞中不能被野生型CRISPR/Cas12f1复合体切割的双链DNA表现出切割活性，或与野生型CRISPR/Cas12f1复合体相比，对真核细胞中的双链DNA的切割活性显著增加。这由本发明人通过实验证明，并且在本公开的实验例的部分中予以详细解释。

引入富含U的尾序列的优势2-可利用Cas12f1的优势

如上所述，Cas12f1蛋白的大小明显小于目前积极研究的Cas9和Cpf1。因此，编码Cas12f1蛋白及其引导RNA的序列长度很短，从而可将所述序列全部插入到一个AAV载体中。此外，即使在将碱基编辑器或prime编辑器等功能结构域添加至Cas12f1蛋白时，这些序列可全部包含在一个AAV载体中。由于AAV载体具有高细胞内递送效率并被批准为用于人的基因治疗剂，当CRISPR/Cas系统或添加了适当功能结构域的CRISPR/Cas系统完全包含在一个AAV载体中时，所述AAV载体可用于更广泛的基因编辑技术。CRISPR/Cas9系统的总序列太长，从而使得CRISPR/Cas9系统无法插入到一个AAV载体中。就这方面而言，CRISPR/Cas12f1系统作为基因编辑工具可能颇具吸引力。然而，先前的研究表明，Cas12f1蛋白、特别是属于Cas14家族的蛋白不能切割双链DNA或具有显著降低的切割效率。然而，本发明人已经表明，可将富含U的尾序列引入CRISPR/Cas12f1系统，从而显著提高CRISPR/Cas12f1复合体的基因编辑效率。综上所述，由于其中引入本公开提供的富含U的尾序列的工程化CRISPR/Cas12f1复合体在具有上述Cas12f1蛋白的优点的同时，表现出高的核酸切割效率，因此所述工程化CRISPR/Cas12f1复合体可应用于各种基因编辑技术中。

用于CRISPR/Cas12f1系统的工程化的CRISPR RNA(crRNA)

工程化的crRNA-概述

本公开的方面提供了用于CRISPR/Cas12f1系统的工程化的CRISPR RNA(下文中为crRNA)。所述工程化的crRNA是其中富含U的尾部序列连接至CRISPR/Cas12f1系统的crRNA序列的3'-末端的crRNA。就此而言，在本公开中描述的没有任何其它修饰的“CRISPR RNA”或“crRNA”的情况是区别于所述工程化的crRNA的概念，并且基本上是指具有自然界存在的配置的CRISPR RNA，特别是CRISPR/Cas12f1系统中所包含的CRISPR RNA。富含U的尾序列具有与<富含U的尾序列>部分中描述的特征和结构相同的特征和结构。所述crRNA包含CRISPRRNA重复序列和间隔序列。所述间隔序列是与包含在待由所述工程化CRISPR/Cas12f1复合体编辑的靶核酸中的靶序列相关的序列。本公开中提供的工程化的crRNA的序列包含CRISPR RNA重复序列、间隔序列和富含U的尾序列。

在实施方式中，在所述工程化的crRNA的序列中，所述CRISPR RNA重复序列、间隔序列和富含U的尾序列可在5'-3'方向上顺序连接。

在实施方式中，所述间隔序列可为与靶核酸的靶序列互补的序列。

在实施方式中，富含U的尾序列可由(U_aN)_nU_b表示。就此而言，N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种。就此而言，a为1-4的整数，n为选自0、1和2的整数，b为1-10的整数。

在实施方式中，富含U的尾序列可由(U_aN)_nU_b表示。就此而言，a、n和b可为整数，a可为1-4，n可为0以上，b可为1-10。另外，本公开的方面提供了编码所述工程化的crRNA的DNA。在下文中，将更详细地描述所述工程化的crRNA的配置。

CRISPR RNA重复序列-定义

CRISPR RNA重复序列是由CRISPR/Cas12f1系统的Cas12f1蛋白类型决定的序列，是指连接至所述间隔序列的5'端的序列。CRISPR RNA重复序列可因CRISPR/Cas12f1系统中包含的Cas12f1蛋白的类型而异。CRISPR RNA重复序列可与CRISPR/Cas12f1系统的至少一些tracrRNA相互作用，也可与Cas12f1蛋白相互作用。

CRISPR RNA重复序列-序列实例

在实施方式中，CRISPR RNA重复序列可为SEQ ID NO：58的序列。

CRISPR RNA重复序列-可对序列进行修饰

如本文所用，“CRISPR RNA重复序列”是指自然界中普遍存在的CRISPR RNA重复序列，但不限于此，并且可指在自然界中发现的CRISPR RNA重复序列中的部分或全部被修饰的CRISPR RNA重复序列，所述修饰在不损害CRISPR/Cas12f1系统功能的范围内进行。

在实施方式中，所述CRISPR RNA重复序列可为野生型CRISPR RNA的全部或部分被修饰的CRISPR RNA重复序列。

在实施方式中，所述CRISPR RNA重复序列可为与野生型CRISPR RNA重复序列具有100％、99％、98％、97％、96％、95％、94％、93％、92％、91％、90％、89％、88％、87％、86％、85％、84％、83％、82％、81％、80％、79％、78％、77％、76％、75％、74％、73％、72％、71％、70％、69％、68％、67％、66％、65％、64％、63％、62％、61％、60％、59％、58％、57％、56％、55％、54％、53％、52％、51％或50％的同一性或同源性的序列。在实施方式中，所述CRISPRRNA重复序列可为与野生型CRISPR RNA重复序列具有在这些值中的两个之间的数值范围内的同一性的序列。例如，所述CRISPR RNA重复序列可为与野生型CRISPR RNA重复序列具有90％-100％同一性的序列。在实施方式中，所述CRISPR RNA重复序列可为与野生型CRISPRRNA重复序列具有60％-80％同一性的序列。

在实施方式中，野生型CRISPR RNA重复序列可为SEQ ID NO：58的序列。

间隔序列-定义

间隔序列是在允许CRISPR/Cas复合体表现出靶特异性基因编辑活性中起核心作用的序列。如本文所用，除非另有规定，间隔序列是指CRISPR/Cas12f1复合体中包含的crRNA(或工程化的crRNA)中的间隔序列。所述间隔序列被设计为定位至包含在待使用CRISPR/Cas12f1复合体编辑的靶核酸序列中的靶序列。换言之，本公开提供的工程化的crRNA序列可根据靶序列具有不同的间隔序列。就此而言，靶核酸可为单链DNA、双链DNA或RNA。

间隔序列-靶核酸和靶序列之间的关系

间隔序列是与靶序列互补的序列，并连接至CRISPR RNA重复序列的3'-末端侧。所述间隔序列是与原间隔序列(所述原间隔序列邻近于由Cas12f1蛋白所识别的原间隔序列临近基序(PAM))同源的序列，并且具有原间隔序列的胸苷被置换为尿苷的序列。就此而言，在与靶核酸中包含的PAM序列邻近的序列中确定靶序列和原间隔序列，因此，所述间隔序列被确定。

在实施方式中，crRNA的间隔序列部分可与靶核酸互补结合。在实施方式中，crRNA的间隔序列部分可与靶核酸的靶序列部分互补结合。在实施方式中，当靶核酸为双链DNA时，间隔序列可为与双链DNA的靶链上包含的靶序列互补的序列。在实施方式中，当靶核酸为双链DNA时，间隔序列可为与双链DNA的非靶链上包含的原间隔序列同源的序列。具体而言，间隔序列具有与原间隔序列相同的碱基序列，但也可具有碱基序列中所含的每个胸苷(T)被置换为尿嘧啶(U)的序列。在实施方式中，间隔序列可为对应于原间隔区的DNA序列的RNA序列。

间隔序列-序列长度

在实施方式中，间隔序列的长度可为10nt、11nt、12nt、13nt、14nt、15nt、16nt、17nt、18nt、19nt、20nt、21nt、22nt、23nt、24nt、25nt、26nt、27nt、28nt、29nt、30nt、31nt、32nt、33nt、34nt、35nt、36nt、37nt、38nt、39nt或40nt。在实施方式中，间隔序列可具有这些数字中的两个之间的数字范围内的长度。例如，间隔序列的长度可为17nt-23nt。在实施方式中，间隔序列的长度可为17nt-30nt。

富含U的尾序列

工程化的crRNA的特征在于富含U的尾序列连接至crRNA序列中包含的间隔序列的3'-末端部分。富含U的尾序列具有与<富含U的尾序列>部分中描述的配置和特征相同的配置和特征。

编码工程化的crRNA的DNA

本公开的方面提供了编码所述工程化的crRNA的DNA。在实施方式中，DNA序列可具有其中所述工程化的crRNA的序列中所有尿苷被置换为胸苷的序列。

工程化的crRNA的使用

所述工程化的crRNA可与用于Cas12f1的tracrRNA一起构成用于CRISPR/Cas12f1系统的工程化的引导RNA。包含所述工程化的crRNA的工程化的引导RNA可与Cas12f1蛋白结合，从而形成CRISPR/Cas12f1复合体。

用于CRISPR/Cas12f1系统的工程化的引导RNA

工程化的引导RNA-概述

本公开的方面提供了用于CRISPR/Cas12f1系统的工程化的引导RNA。所述工程化的引导RNA的序列包含tracrRNA序列、crRNA序列和富含U的尾序列。就此而言，富含U的尾序列连接至所述crRNA序列的3'-末端。换言之，所述工程化的引导RNA的序列包含tracrRNA序列和工程化的crRNA序列。所述crRNA包含CRISPR RNA重复序列和间隔序列。就此而言，所述CRISPR RNA重复序列和间隔序列具有与<用于CRISPR/Cas12f1系统的工程化的CRISPR RNA>部分中描述的各组成相同的特征和结构。所述富含U的尾序列具有与<富含U的尾序列>部分中描述的特征和结构相同的特征和结构。

在实施方式中，富含U的尾序列可由(U_aN)_nU_b表示。就此而言，N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种。就此而言，a为1-4之间的整数，n为选自0、1和2的整数，b为1-10的整数。

在实施方式中，富含U的尾序列可由(U_aV)_nU_b表示，并且就此而言，a、n和b为整数，a可为1-4，n可为0以上，b可为1-10。

所述工程化的引导RNA中包含的tracrRNA的至少一部分和所述crRNA的至少一部分可具有彼此互补以形成双链RNA的序列。具体而言，所述tracrRNA的至少一部分和所述crRNA序列中包含的CRISPR RNA重复序列的至少一部分可彼此互补，从而形成双链RNA。所述工程化的引导RNA可与Cas12f1蛋白结合以形成CRISPR/Cas12f1复合体，并识别与所述crRNA序列中包含的间隔序列互补的靶序列，从而允许所述CRISRP/Cas12f1复合体对包含靶序列的靶核酸进行编辑。

tracrRNA-定义

tracrRNA与crRNA一起是构成CRISPR/Cas系统的引导RNA的重要组分。如本文所用，除非另有描述，所述tracrRNA是指构成CRISPR/Cas12f1系统的引导RNA的tracrRNA。所述tracrRNA的至少一部分可与crRNA的至少一部分互补结合以形成双链。更具体而言，所述tracrRNA的部分序列具有与所述crRNA中包含的CRISPR RNA重复序列的全部或部分互补的序列。

tracrRNA-tracrRNA和CRISPR RNA重复序列的互补性

在实施方式中，所述tracrRNA的序列可包含与CRISPR RNA重复序列60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％互补的序列。在实施方式中，所述tracrRNA的序列可包含与CRISPR RNA重复序列在这些数字中的两个之间的数值范围内互补的序列。例如，所述tracrRNA的序列可包含与CRISPR RNA重复序列60％-90％互补的序列。在实施方式中，所述tracrRNA的序列可包含与CRISPR RNA重复序列70％-100％互补的序列。

tracrRNA-tracrRNA和CRISPR RNA重复序列中的错配数

在实施方式中，tracrRNA的序列可包含与CRISPR RNA重复序列具有0个、1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个错配的互补序列。在实施方式中，tracrRNA的互补序列可与CRISPR RNA重复序列具有在前面的句子中选择的数值范围内的错配。例如，tracrRNA可包含与CRISPR RNA重复序列具有0-8个错配的互补序列。在实施方式中，tracrRNA序列可包含与CRISPR RNA重复序列具有8-12个错配的互补序列。

tracrRNA-序列的实例

在实施方式中，所述tracrRNA序列可为SEQ ID NO：60的序列。

tracrRNA-可对序列进行修饰

如本文所用，“tracrRNA”是指自然界中普遍存在的tracrRNA，但不限于此，并且可指在自然界中发现的tracrRNA序列中的部分或全部被修饰的tracrRNA，所述修饰在不损害CRISPR/Cas12f1系统功能的范围内进行。

在实施方式中，所述tracrRNA序列可为野生型tracrRNA序列的全部或部分被修饰的tracrRNA序列。

在实施方式中，所述tracrRNA序列可为与野生型tracrRNA序列具有100％、99％、98％、97％、96％、95％、94％、93％、92％、91％、90％、89％、88％、87％、86％、85％、84％、83％、82％、81％、80％、79％、78％、77％、76％、75％、74％、73％、72％、71％、70％、69％、68％、67％、66％、65％、64％、63％、62％、61％、60％、59％、58％、57％、56％、55％、54％、53％、52％、51％或50％的同一性或同源性的序列。在实施方式中，所述tracrRNA序列可为与野生型tracrRNA序列具有在这些数字中的两个之间的数值范围内的同一性的序列。例如，tracrRNA序列可为与野生型tracrRNA序列具有90％-100％同一性的序列。在实施方式中，tracrRNA序列可为与野生型tracrRNA序列具有60％-80％同一性的序列。

在实施方式中，野生型tracrRNA序列可为SEQ ID NO：60的序列。

双引导RNA(Dual guide RNA)-定义和结构

本公开中提供的工程化的引导RNA可为双引导RNA。这意味着tracrRNA和crRNA形成单独的RNA分子。tracrRNA的一部分和crRNA的一部分彼此互补结合以形成双链。具体而言，在双引导RNA中，包含tracrRNA的3'-末端的部分与包含crRNA的CRISPR RNA重复序列的部分可形成双链。

在实施方式中，所述工程化的引导RNA可为双引导RNA。在实施方式中，当所述工程化的引导RNA为双引导RNA时，所述tracrRNA和所述crRNA是单独的RNA分子。

双引导RNA-序列的实例

在实施方式中，tracrRNA可为SEQ ID NO：60的序列。在实施方式中，crRNA中包含的CRISPR RNA重复序列可为SEQ ID NO：58的序列。在实施方式中，具有序列SEQ ID NO：60的trancrRNA的至少一部分和具有序列SEQ ID NO：58的CRISPR RNA重复序列可彼此互补结合以形成双链。

单引导RNA-定义

为了便于形成引导RNA，tracrRNA和crRNA为一个分子的设计被称为单引导RNA。本公开提供的工程化的引导RNA可为单引导RNA。当所述工程化的引导RNA为单引导RNA时，所述单引导RNA为包含tracrRNA、crRNA和富含U的尾序列全部的一个RNA分子。在实施方式中，当所述工程化的引导RNA为单引导RNA时，tracrRNA的序列和crRNA的序列可同时包含在一个RNA分子的序列中。

单引导RNA-接头和序列的实例

在实施方式中，当所述工程化的引导RNA为单引导RNA时，所述工程化的引导RNA的序列进一步包含接头序列，并且所述tracrRNA序列和所述crRNA序列可通过所述接头序列连接。在实施方式中，所述接头序列可为5'-gaaa-3'。

单引导RNA-结构

在所述单引导RNA的序列中，tracrRNA序列、接头序列、crRNA序列以及富含U的尾序列在5'-3'方向上顺序连接。tracrRNA序列的一部分和crRNA序列中包含的CRISPR RNA重复序列的全部或一部分具有彼此互补的序列。因此，tracrRNA的一部分与crRNA中的CRISPRRNA重复序列部分彼此互补结合以形成双链RNA。

单引导RNA-序列的实例

所述单引导RNA可具有选自于由SEQ ID NO：75-SEQ ID NO：125以及SEQ ID NO：261-SEQ ID NO：280所组成的组中的序列。

支架序列

当对本公开中提供的工程化的引导RNA的序列进行功能划分时，所述序列可分为：1)与Cas12f1蛋白相互作用以形成CRISPR/Cas12f1复合体的序列部分，2)允许CRISPR/Cas12f1复合体寻找靶核酸的序列部分，以及3)富含U的尾序列部分。就此而言，与Cas12f1蛋白相互作用以形成CRISPR/Cas12f1复合体的序列部分可以说是支架序列。就此而言，所述支架序列统指与Cas12f1蛋白相互作用的部分，并且不限于一个分子的RNA序列。具体而言，所述支架序列可包含两个以上RNA分子的序列。

在实施方式中，当所述工程化的引导RNA为双引导RNA时，所述支架序列可包含所述工程化的引导RNA序列中的tracrRNA序列和crRNA中包含的CRISPR RNA重复序列。在实施方式中，所述tracrRNA序列可为其中天然存在的tracrRNA序列的全部或部分被修饰的tracrRNA序列。在实施方式中，CRISPR RNA重复序列可为在自然界中发现的CRISPR RNA重复序列的全部或部分被修饰的CRISPR RNA序列。

在实施方式中，当所述工程化的引导RNA为单引导RNA时，所述支架序列可包括tracrRNA序列、接头序列以及crRNA序列中包含的CRISPR RNA重复序列。在实施方式中，所述tracrRNA序列可为其中天然存在的tracrRNA序列的全部或部分被修饰的tracrRNA序列。在实施方式中，所述CRISPR RNA重复序列可为在自然界中发现的CRISPR RNA重复序列的全部或部分被修饰的CRISPR RNA重复序列。

在实施方式中，所述支架序列可为选自于由SEQ ID NO：253和SEQ ID NO：254所组成的组中的序列。在实施方式中，所述支架序列可为与选自于由SEQ ID NO：253和SEQ IDNO：254所组成的组中的序列具有100％、99％、98％、97％、96％、95％、94％、93％、92％、91％、90％、89％、88％、87％、86％、85％、84％、83％、82％、81％、80％、79％、78％、77％、76％、75％、74％、73％、72％、71％、70％、69％、68％、67％、66％、65％、64％、63％、62％、61％、60％、59％、58％、57％、56％、55％、54％、53％、52％、51％或50％同一性或同源性的序列。在实施方式中，所述支架序列可为与选自于由SEQ ID NO：253和SEQ ID NO：254所组成的组中的序列具有在这些数字中的两个之间的数值范围内的同一性的序列。例如，所述支架序列可为与选自于由SEQ ID NO：253和SEQ ID NO：254所组成的组中的支架序列具有90％-100％同一性的序列。在实施方式中，所述支架序列可为与选自于由SEQ ID NO：253和SEQ ID NO：254所组成的组中的支架序列具有60％-80％同一性的序列。

工程化CRISPR/Cas12f1复合体

CRISPR/Cas12f1复合体-概述

本公开的方面提供了工程化的CRISPR/Cas12f1复合体。所述工程化的CRISPR/Cas12f1复合体包含Cas12f1蛋白和工程化的引导RNA。在实施方式中，所述Cas12f1蛋白可由Cas14家族衍生而来。所述工程化的引导RNA序列包含tracrRNA序列、crRNA序列和富含U的尾序列。换言之，所述工程化的引导RNA序列包含支架序列、间隔序列和富含U的尾序列。富含U的尾序列可连接至所述crRNA序列的3'-末端。富含U的尾序列具有与<富含U的尾序列>部分中描述的特征和结构相同的特征和结构。

在实施方式中，富含U的尾序列可由(U_aV)_nU_b表示，就此而言，a、n和b为整数，a可为1-4，n可为0或更大，并且b可为1-10。

所述支架序列可与Cas12f1蛋白相互作用，并在所述工程化的引导RNA和Cas12f1蛋白形成复合体时发挥重要作用。

Cas12f1蛋白-概述

工程化CRISPR/Cas12f1复合体可包含Cas12f1蛋白。Cas12f1蛋白基本上可为自然界中存在的野生型Cas12f1蛋白。编码Cas12f1蛋白的序列可为针对野生型Cas12f1蛋白的人密码子优化的Cas12f1序列。此外，所述Cas12f1蛋白可具有与自然界中存在的野生型Cas12f1蛋白相同的功能。然而，除非另有规定，如本文所用，“Cas12f1蛋白”不仅可以指野生型或密码子优化的Cas12f1蛋白，还可以指修饰的Cas12f1蛋白或Cas12f1融合蛋白。此外，所述Cas12f1蛋白不仅可统指具有与野生型Cas12f1蛋白相同功能的Cas12f1蛋白，还可统指功能全部或部分被修饰的Cas12f1蛋白、全部或部分功能丧失的Cas12f1蛋白、和/或添加了额外功能的Cas12f1蛋白。Cas12f1蛋白的含义可根据上下文进行适当解释，除非有特殊情况，否则以最广义解释。在下文中，将详细描述Cas12f1蛋白的配置或功能。

Cas12f1蛋白-野生型Cas12f1蛋白

所述工程化CRISPR/Cas12f1复合体可包含Cas12f1蛋白。在实施方式中，所述Cas12f1蛋白可为野生型Cas12f1蛋白。在实施方式中，所述Cas12f1蛋白可由Cas14家族衍生而来(Harrington等，Programmed DNA destruction by miniature CRISPR-Cas14enzymes，Science 362，839-842(2018))。在实施方式中，所述Cas12f1蛋白可为由未培养的古细菌衍生而来的Cas14a蛋白(Harrington等，Programmed DNA destruction byminiature CRISPR-Cas14 enzymes，Science 362，839-842(2018))。在实施方式中，所述Cas12f1蛋白可为Cas14a1蛋白。

Cas12f1蛋白-修饰的Cas12f1蛋白

所述工程化CRISPR/Cas12f1复合体可包含修饰的Cas12f1蛋白。修饰的Cas12f1是指其中野生型或密码子优化的Cas12f1蛋白序列中的至少一些序列被修饰的Cas12f1。Cas12f1蛋白修饰可由单个氨基酸单元组成，也可由蛋白的功能结构域单元组成。在实施方式中，蛋白质的修饰可为如下修饰：野生型或密码子优化的Cas12f1蛋白序列的一个或多个氨基酸、肽、多肽、蛋白质和/或结构域被单独取代，将一个或多个氨基酸、肽、多肽、蛋白质和/或结构域单独地从野生型或密码子优化的Cas12f1蛋白序列中删除，和/或将一个或多个氨基酸、肽、多肽、蛋白质和/或结构域单独地添加至野生型或密码子优化的Cas12f1蛋白序列。在实施方式中，所述Cas12f1蛋白可为包含在野生型Cas12f1蛋白中的RuvC结构域中的一个或多个氨基酸、肽和/或多肽被置换、删除和添加的Cas12f1蛋白。

Cas12f1蛋白-Cas12f1融合蛋白

本公开中提供的工程化CRISPR/Cas12f1复合体可包含Cas12f1融合蛋白。就此而言，Cas12f1融合蛋白是指其中野生型或修饰的Cas12f1蛋白与额外的氨基酸、肽、多肽、蛋白质或结构域融合的蛋白。

在实施方式中，Cas12f1蛋白可为野生型Cas12f1蛋白与碱基编辑器和/或逆转录酶的融合物。在实施方式中，所述碱基编辑器可为腺苷脱氨酶和/或胞嘧啶脱氨酶。在实施方式中，所述逆转录酶可为莫洛尼鼠白血病病毒(M-MLV)逆转录酶或其变体。就此而言，与所述逆转录酶融合的Cas12f1蛋白可充当prime编辑器。

在实施方式中，Cas12f1蛋白可为野生型Cas12f1蛋白与能够参与细胞内基因表达过程的各种酶的融合物。就此而言，与所述酶融合的Cas12f1蛋白可能会带来细胞中基因表达的各种量和质的变化。在实施方式中，所述酶可为DNMT、TET、KRAB、DHAC、LSD和/或p300。

Cas12f1蛋白-功能变化

本公开中提供的工程化CRISPR/Cas12f1复合体中包含的Cas12f1蛋白可具有与野生型Cas12f1蛋白相似的功能。本公开中提供的工程化CRISPR/Cas12f1复合体中包含的Cas12f1蛋白可为与野生型Cas12f1蛋白相比时具有改变的功能的Cas12f1蛋白。具体而言，所述改变可为全部或部分功能的修饰、全部或部分功能的丧失、或增加额外功能。在实施方式中，所述Cas12f1蛋白只要具有本领域技术人员进行的适用于CRISPR/Cas系统的Cas蛋白的修饰即可，没有特别限制。就此而言，可通过已知技术进行改变。在实施方式中，可对所述Cas12f1蛋白进行修饰，以仅切割靶核酸的双链中的一条链。此外，可对Cas12f1蛋白进行改变，以使得仅靶核酸的双链中的一条链可被切割，并且可在未切割的链上进行碱基编辑或prime编辑。在实施方式中，可对所述Cas12f1蛋白进行改变，以使得靶核酸的两条链都不能被切割。此外，可对所述Cas12f1蛋白进行改变，以使得靶核酸的两条链都不能被切割，并且可在所述靶核酸上进行碱基编辑、prime编辑或基因表达调控功能。

Cas12f1蛋白-其它修饰的实例

在实施方式中，所述Cas12f1蛋白可包含核定位序列(NLS)或核输出序列(NES)。具体而言，所述NLS可为<术语的定义>中NLS部分中示例的NLS中的任一种，但不限于此。在实施方式中，所述Cas12f1蛋白可包含标签。具体而言，所述标签可为<术语的定义>中标签部分中示例的标签中的任一种，但不限于此。

Cas12f1蛋白-PAM序列

CRISPR/Cas12f1复合体切割靶基因或靶核酸需要两个条件。首先，靶基因或靶核酸中必须有Cas12f1蛋白可识别的具有一定长度的碱基序列。其次，在所述具有一定长度的碱基序列周围，必须有能够与引导RNA中包含的间隔序列互补结合的序列。当满足这两个条件以允许1)Cas12f1蛋白识别所述具有一定长度的碱基序列，以及2)间隔序列部分与所述具有一定长度的碱基序列周围的序列部分互补结合时，所述靶基因或靶核酸被切割。就此而言，Cas12f1蛋白识别的具有一定长度的碱基序列称为原间隔序列临近基序(PAM)序列。PAM序列是根据Cas12f1蛋白确定的独特序列，在确定CRISPR/Cas12f1复合体的靶序列时，伴随着如下约束：必须在与PAM序列邻近的序列中确定所述靶序列。

Cas12f1蛋白-PAM序列的实例

在实施方式中，Cas12f1蛋白的PAM序列可为富含T的序列。在实施方式中，Cas12f1蛋白的PAM序列以5'-3'的方向可为TTTN。就此而言，N为脱氧胸苷(T)、脱氧腺苷(A)、脱氧胞苷(C)或脱氧鸟苷(G)中的一种。在实施方式中，Cas12f1蛋白的PAM序列以5'-3'的方向可为TTTA、TTTT、TTTC或TTTG。在实施方式中，Cas12f1蛋白的PAM序列以5'-3'的方向可为TTTA或TTTG。在实施方式中，Cas12f1蛋白的PAM序列可不同于野生型Cas12f1蛋白的PAM序列。

Cas12f1蛋白-示例序列

在实施方式中，所述Cas12f1蛋白可具有选自于由SEQ ID NO：281、SEQ ID NO：317、SEQ ID NO：319、SEQ ID NO：321和SEQ ID NO：323所组成的组中的氨基酸序列。

在实施方式中，编码所述Cas12f1蛋白的DNA序列可为人密码子优化的序列。

在实施方式中，编码所述Cas12f1蛋白的DNA序列可为选自于由SEQ ID NO：1、SEQID NO：2、SEQ ID NO：316、SEQ ID NO：318、SEQ ID NO：320和SEQ ID NO：322所组成的组中的DNA序列。

工程化的引导RNA

本公开中提供的构成CRISPR/Cas12f1复合体的工程化的引导RNA具有与<用于CRISPR/Cas12f1系统的工程化的引导RNA>部分中描述的特征和结构相同的特征和结构。

CRISPR/Cas12f1复合体-配置的实例

在实施方式中，所述Cas12f1蛋白可具有SEQ ID NO：281的氨基酸序列，所述工程化的引导RNA可具有选自于由SEQ ID NO：75-SEQ ID NO：125所组成的组中的氨基酸序列，并且所述Cas12f1蛋白和所述工程化的引导RNA可彼此结合以形成CRISPR/Cas12f1复合体。

在实施方式中，所述Cas12f1蛋白可具有选自于由SEQ ID NO：317、SEQ ID NO：319、SEQ ID NO：321和SEQ ID NO：323所组成的组中的氨基酸序列，所述工程化的引导RNA可具有选自于由SEQ ID NO：75-SEQ ID NO：125以及SEQ ID NO：261-SEQ ID NO：280所组成的组中的序列，并且通过将所述Cas12f1蛋白与所述工程化的引导RNA结合所形成的CRISPR/Cas12f1复合体可具有碱基编辑功能。

表达CRISPR/Cas12f1系统的载体

概述

本公开的方面提供了用于表达CRISPR/Cas12f1系统的组分的载体。将载体构建为表达Cas12f1蛋白和/或工程化的引导RNA。载体的序列可包含编码CRISPR/Cas12f1系统的组分之一的核酸序列，或者可包含编码两种以上组分的核酸序列。载体的序列包含编码所述Cas12f1蛋白的核酸序列和/或编码所述工程化的引导RNA的核酸序列。载体的序列包含一个或多个启动子序列。所述启动子与编码所述Cas12f1蛋白的核酸序列和/或编码所述工程化的引导RNA的核酸序列可操作地连接，以促进所述核酸序列在细胞中的转录。所述Cas12f1蛋白具有与<工程化CRISPR/Cas12f1复合体>部分中描述的Cas12f1蛋白、修饰的Cas12f1蛋白或Cas12f1融合蛋白的特征和配置相同的特征和配置。所述工程化的引导RNA具有与<用于CRISPR/Cas12f1系统的工程化的引导RNA>部分中描述的工程化的引导RNA的特征和配置相同的特征和配置。

载体的序列可包含编码所述Cas12f1蛋白的核酸序列和编码所述工程化的引导RNA的核酸序列。在实施方式中，载体的序列可包含第一序列以及第二序列，所述第一序列包含编码所述Cas12f1蛋白的核酸序列，所述第二序列包含编码所述工程化的引导RNA的核酸序列。载体的序列包含用于在细胞中表达编码Cas12f1蛋白的核酸序列的启动子序列，以及用于在细胞中表达编码工程化的引导RNA的核酸序列的启动子序列，所述启动子可操作地连接至各个表达靶标。在实施方式中，载体的序列可包含与所述第一序列可操作地连接的第一启动子序列，以及与所述第二序列可操作地连接的第二启动子序列。

载体的序列可包含编码Cas12f1蛋白的核酸序列以及编码两种以上不同的工程化的引导RNA的核酸序列。在实施方式中，载体的序列可包含第一序列、第二序列以及第三序列，所述第一序列包含编码Cas12f1蛋白的核酸序列，所述第二序列包含编码工程化的引导RNA的核酸序列，所述第三序列包含编码第二工程化的引导RNA的核酸序列。此外，载体的序列可包含与所述第一序列可操作地连接的第一启动子序列、与所述第二序列可操作地连接的第二启动子序列和与所述第三序列可操作地连接的第三启动子序列。

表达靶标-Cas12f1蛋白

可将载体构建为表达Cas12f1蛋白。就此而言，所述Cas12f1蛋白具有与<工程化CRISPR/Cas12f1复合体>部分中描述的配置和特征相同的配置和特征。在实施方式中，可将载体构建为表达野生型Cas12f1蛋白。就此而言，所述野生型Cas12f1蛋白可为Cas14a1。在实施方式中，可将载体构建为表达已被改变为仅切割靶核酸双链中的一条链的Cas12f1蛋白。此外，经改变的Cas12f1蛋白可被改变，从而使得仅靶核酸的双链中的一条链可被切割，并且可在未切割的链上进行碱基编辑或prime编辑。在实施方式中，Cas12f1蛋白可能已经改变，从而使得靶核酸双链的两条链都不能被切割。此外，可对Cas12f1蛋白进行改变从而使得靶核酸双链的两条链都不能被切割，并且可在所述靶核酸上进行碱基编辑、prime编辑或基因表达调控功能。

表达靶标-工程化的引导RNA

可将载体构建为表达工程化的引导RNA。所述工程化的引导RNA具有与<用于CRISPR/Cas12f1系统的工程化的引导RNA>部分中描述的工程化的引导RNA的特征和配置相同的特征和配置。在实施方式中，可将载体构建为表达工程化的引导RNA。在实施方式中，所述工程化的引导RNA序列可包含支架序列、间隔序列和富含U的尾序列。在实施方式中，所述工程化的引导RNA序列可包含tracrRNA序列、crRNA序列和富含U的尾序列。在实施方式中，富含U的尾序列可由(U_aN)_nU_b表示。就此而言，N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种。就此而言，a为1-4的整数，n为选自0、1和2的整数，b为1-10的整数。在实施方式中，富含U的尾序列可由(U_aV)_nU_b表示。就此而言，a、n和b可为整数，a可为1-4，n可为0或更大，b可为1-10。

可将载体构建为表达两种以上工程化的引导RNA。在实施方式中，可将载体构建为表达第一工程化的引导RNA和第二工程化的引导RNA。在实施方式中，第一工程化的引导RNA序列可包含第一支架序列、第一间隔序列和第一富含U的尾序列，第二工程化的引导RNA序列可包含第二支架序列、第二间隔序列和第二个富含U的尾序列。

表达靶标-额外组分

除了上述所述的表达靶标之外，可将载体构建为表达额外组分，例如NLS和标签蛋白。在实施方式中，额外组分可独立于Cas12f1、修饰的Cas12f1和/或工程化的引导RNA来表达。在实施方式中，可表达额外组分，同时使其连接至Cas12f1、修饰的Cas12f1和/或工程化的引导RNA。就此而言，所述额外组分可为在期望表达CRISPR/Cas系统时通常表达的组分，可参考已知技术。所述额外组分可为<相关技术-CRISPR/Cas系统表达载体的设计>部分中描述的组分中的一种或多种。

载体组分-Cas12f1蛋白表达序列

载体序列可包含编码Cas12f1蛋白的核酸序列。就此而言，Cas12f1蛋白具有与<工程化CRISPR/Cas12f1复合体>部分中描述的配置和特征相同的配置和特征。在实施方式中，载体的序列可包含编码野生型Cas12f1蛋白的序列。就此而言，野生型Cas12f1蛋白可为Cas14a1。在实施方式中，载体的序列可包含编码Cas12f1蛋白的人密码子优化的核酸序列。就此而言，编码Cas12f1蛋白的人密码子优化的核酸序列可为编码Cas14a1蛋白的人密码子优化的核酸序列。在实施方式中，载体的序列可为编码Cas12f1蛋白或Cas12f1融合蛋白的序列。在实施方式中，载体的序列可包含编码Cas12f1蛋白的序列，所述Cas12f1蛋白被改变使得仅靶核酸的双链中的一条链可被切割，并且可在未切割的链上进行碱基编辑或prime编辑。在实施方式中，Cas12f1蛋白可包含编码Cas12f1蛋白的序列，该Cas12f1蛋白被改变使得靶核酸双链的两条链都不能被切割，并且可在靶核酸上进行碱基编辑、prime编辑或基因表达调控功能。

载体组分-工程化的引导RNA表达序列

在实施方式中，载体的序列可包含编码工程化的引导RNA的序列。在实施方式中，所述工程化的引导RNA的序列可包含支架序列、间隔序列和富含U的尾序列。在实施方式中，所述工程化的引导RNA序列的序列可包含tracrRNA序列、crRNA序列和富含U的尾序列。在实施方式中，富含U的尾序列可由(U_aN)_nU_b表示。就此而言，N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种。就此而言，a为1-4的整数，n为选自0、1和2的整数，b为1-10的整数。在实施方式中，富含U的尾序列可由(U_aV)_nU_b表示。就此而言，a、n和b可为整数，a可为1-4，n可为0或更大，b可为1-10。

在实施方式中，载体的序列可包含编码两种以上不同的工程化引导RNA的序列。在实施方式中，载体的序列可包含编码第一工程化的引导RNA的序列和编码第二工程化的引导RNA的序列。就此而言，包含在第一工程化的引导RNA序列中的间隔序列可不同于包含在第二工程化的引导RNA序列中的间隔序列。此外，包含在第一工程化的引导RNA序列中的富含U的尾序列可不同于包含在第二工程化的引导RNA序列中的富含U的尾序列。在实施方式中，第一工程化的引导RNA序列可包含第一支架序列、第一间隔序列和第一富含U的尾序列，第二工程化的引导RNA序列可包含第二支架序列、第二间隔序列和第二富含U的尾序列。

载体组分-启动子序列

载体序列包含与编码各组分的序列可操作地连接的启动子序列。具体而言，所述启动子序列可为<相关技术-CRISPR/Cas系统表达载体的设计>部分的启动子部分中公开的启动子之一，但不限于此。

在实施方式中，载体序列可包含编码Cas12f1蛋白的序列和启动子序列。就此而言，所述启动子序列可操作地连接至编码Cas12f1蛋白的序列。在实施方式中，载体序列可包含编码工程化的引导RNA的序列和启动子序列。就此而言，所述启动子序列可操作地连接至编码工程化的引导RNA的序列。在实施方式中，载体序列可包含编码Cas12f1蛋白的序列、编码工程化的引导RNA的序列和启动子序列。就此而言，所述启动子序列可操作地连接至编码Cas12f1蛋白的序列以及编码工程化的引导RNA的序列，并且由所述启动子序列激活的转录因子表达所述Cas12f1蛋白和所述工程化的引导RNA。

载体配置-可包含两个或多个启动子序列

在实施方式中，载体序列可包含编码Cas12f1蛋白的第一序列、第一启动子序列、编码工程化的引导RNA的第二序列以及第二启动子序列。就此而言，第一启动子序列可操作地连接至第一序列，第二启动子序列可操作地连接至第二序列，第一序列的转录由第一启动子序列诱导，第二序列的转录由第二启动子序列诱导。就此而言，第一启动子和第二启动子可为相同类型的启动子。就此而言，第一启动子和第二启动子可为不同类型的启动子。

在实施方式中，载体序列可包含编码Cas12f1蛋白的第一序列、第一启动子序列、编码第一工程化的引导RNA的第二序列、第二启动子序列、包含编码第二工程化的引导RNA的序列的第三序列以及第三启动子序列。就此而言，第一启动子序列可操作地连接至第一序列，第二启动子序列可操作地连接至第二序列，第三启动子序列可操作地连接至第三序列，第一序列的转录由第一启动子序列诱导，第二序列的转录由第二启动子序列诱导，第三序列的转录由第三启动子序列诱导。就此而言，第二启动子和第三启动子可为相同类型的启动子。具体而言，第二启动子序列和第三启动子序列可为U6启动子序列，但不限于此。就此而言，第二启动子和第三启动子可为不同类型的启动子。具体而言，第二启动子序列和第三启动子序列可分别为U6启动子序列和H1启动子序列，但不限于此。

载体组分-终止信号

载体可包含与启动子序列可操作地连接的终止信号。就此而言，终止信号可为在<相关技术-CRISPR/Cas系统表达载体的设计>部分的终止信号部分中公开的终止信号之一，但不限于此。终止信号可根据启动子序列的类型而异。在实施方式中，当载体序列包含U6启动子序列时，与U6启动子序列可操作地连接的连续胸苷序列可充当终止信号。在实施方式中，所述胸苷序列可为其中有五个以上胸苷连续连接的序列。在实施方式中，当载体序列包含H1启动子序列时，与H1启动子序列可操作地连接的连续胸苷序列可充当终止信号。在实施方式中，所述胸苷序列可为其中有五个以上胸苷连续连接的序列。

载体组分-编码富含U的尾序列的序列与终止信号之间的关系

本公开中提供的工程化的引导RNA的序列在其3'-末端包含富含U的尾序列。因此，编码所述工程化的引导RNA的序列将在其3'-末端包含对应于富含U的尾序列的富含T的序列。如上所述，由于一些启动子序列识别连续的胸苷序列(例如，其中5个以上胸苷连续连接的序列)作为终止信号，因此在一些情况下可将富含T的序列识别为终止信号。换言之，当根据本公开的载体序列包含编码工程化的引导RNA的序列时，编码所述工程化的引导RNA序列中包含的富含U的尾序列的序列可用作终止信号。在实施方式中，当载体序列包含U6或H1启动子序列并且包含与U6或H1启动子序列可操作连接的编码所述工程化的引导RNA的序列时，编码所述工程化的引导RNA序列中包含的富含U的尾序列的序列部分可被识别为终止信号。就此而言，富含U的尾序列包含其中具有五个以上尿苷连续连接的序列。

载体组分-其它组分

除了所述配置之外，根据目的，载体序列可包含所需的组分。在实施方式中，载体序列可包含调节/控制组分序列和/或额外组分序列。在实施方式中，为了区分转染细胞和非转染细胞的目的，可添加额外组分。就此而言，所述调节/控制组分序列和额外组分可为<相关技术-CRISPR/Cas系统表达载体的设计>中公开的那些成分中的一种，但不限于此。

载体类型-病毒载体

载体可为病毒载体。在实施方式中，所述病毒载体可为选自于由以下病毒所组成的组中的一种或多种：逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒和单纯疱疹病毒。在实施方式中，所述病毒载体可为腺相关病毒(AAV)。

载体类型-非病毒载体

载体可为非病毒载体。在实施方式中，非病毒载体可为选自于由以下所组成的组中的一种或多种：质粒、噬菌体、裸DNA、DNA复合体和mRNA。在实施方式中，质粒可选自于由以下所组成的组：pcDNA系列、pSC101、pGV1106、pACYC177、ColE1、pKT230、pME290、pBR322、pUC8/9、pUC6、pBD9、pHC79、pIJ61、pLAFR1、pHV14、pGEX系列、pET系列和pUC19。在实施方式中，噬菌体可选自于由以下所组成的组：λgt4λB、λ-Charon、λΔz1和M13。在实施方式中，载体可为PCR扩增子。

载体形式-环状载体或线性载体

载体可为环状或线性形式。当载体为线性载体时，即使线性载体序列不单独包含终止信号，RNA转录在其3'-末端终止。相比之下，当载体为环状载体时，除非环状载体序列单独包含终止信号，否则RNA转录不终止。因此，当使用环状载体作为载体时，必须包含对应于与每个启动子序列相关的转录因子的终止信号，以表达预期的靶标。在实施方式中，载体可为线性载体。在实施方式中，载体可为线性扩增子。在实施方式中，所述载体可为包含选自于由如下所组成的组中的序列的线性载体：SEQ ID NO：1、SEQ ID NO：2以及SEQ ID NO：127-SEQ ID NO：177。在实施方式中，载体可为环状载体。在实施方式中，所述载体可为包含选自于由如下所组成的组中的序列的环状载体：SEQ ID NO：1、SEQ ID NO：2以及SEQ IDNO：127-SEQ ID NO：177。

载体-序列的实例

在实施方式中，所述载体序列可包含选自于由SEQ ID NO：1、SEQ ID NO：2以及SEQID NO：127-SEQ ID NO：177所组成的组中的一种或多种序列。在实施方式中，载体序列可包含选自于由SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：316、SEQ ID NO：318、SEQ ID NO：320和SEQ ID NO：322所组成的组中的一种或多种序列。

核酸的化学修饰

本公开的方面提供了包含如下或由如下组成的组分：工程化的crRNA或编码所述工程化的crRNA的核酸、工程化的引导RNA或编码所述工程化的引导RNA的核酸，和/或诸如用于表达CRISPR/Cas12f1系统的组分等的核酸。就此而言，本文所用的“核酸”可为自然界中存在的DNA或RNA，并且可为其中核酸的部分或全部被化学修饰的修饰核酸。在实施方式中，所述核酸可为自然界中存在的DNA和/或RNA。在实施方式中，所述核酸可为其中一个或多个核苷酸被化学修饰的核酸。就此而言，所述化学修饰包括本领域已知的所有核酸修饰。具体而言，所述化学修饰可包括(WO 2019/089820 A1)中描述的所有核酸修饰，但不限于此。

使用工程化的crRNA的基因编辑方法

概述

本公开的方面提供了使用工程化的crRNA在靶细胞中编辑靶基因或靶核酸的方法。所述靶基因或靶核酸包含靶序列。所述靶核酸可为单链DNA、双链DNA和/或RNA。所述基因编辑方法包括：将工程化的引导RNA、Cas12f1蛋白、或者编码所述工程化的引导RNA和所述Cas12f1蛋白中的每一个的核酸递送到包含靶基因或靶核酸的靶细胞中。因此，将工程化的CRISPR/Cas12f1复合体注入所述靶细胞中，或诱导所述工程化的CRISPR/Cas12f1复合体的形成，以及通过所述工程化的CRISPR/Cas12f1复合体对靶基因进行编辑。所述工程化的引导RNA具有与<用于CRISPR/Cas12f1系统的工程化的引导RNA>部分中描述的特征和结构相同的特征和结构。所述Cas12f1蛋白具有与<工程化CRISPR/Cas12f1复合体>部分中描述的Cas12f1蛋白和/或修饰的Cas12f1蛋白相同的特征和配置。

在实施方式中，所述基因编辑方法可包括：将工程化的引导RNA或编码所述工程化的引导RNA的核酸以及Cas12f1蛋白或编码所述Cas12f1蛋白的核酸递送到靶细胞中。就此而言，所述工程化的引导RNA序列包含支架序列、间隔序列和富含U的尾序列。就此而言，所述间隔序列可互补结合至靶细胞中包含的靶基因或靶核酸。在实施方式中，富含U的尾序列可由(U_aV)_nU_b表示。就此而言，a、n和b为整数，a为1-4，n为0或更大，b为1-10。在实施方式中，富含U的尾序列可由(U_aN)_nU_b表示。就此而言，N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种。就此而言，a为1-4的整数，n为选自0、1和2的整数，b为1-10的整数。

靶细胞

在实施方式中，所述靶细胞可为原核细胞。在实施方式中，所述靶细胞可为真核细胞。具体而言，所述真核细胞可为植物细胞、动物细胞和/或人细胞，但不限于此。

靶序列的确定

可考虑基因编辑的目的、靶细胞环境、Cas12f1蛋白识别的PAM序列和/或其它变量来确定要使用CRISPR/Cas12f1复合体编辑的靶基因或核酸和靶序列。就此而言，只要可确定具有适当长度的靶序列，所述方法就没有特别限制，并且可利用已知技术。

根据靶序列确定间隔序列

一旦确定了靶序列，相应的间隔序列就被设计。所述间隔序列被设计为能够与靶序列互补结合的序列。在实施方式中，所述间隔序列被设计为能够与靶基因互补结合的序列。在实施方式中，所述间隔序列被设计为能够与靶核酸互补结合。在实施方式中，所述间隔序列被设计为与包含在靶核酸的靶链序列中的靶序列互补的序列。在实施方式中，所述间隔序列被设计为对应于如下的RNA序列：包含在靶核酸的非靶链序列中的原间隔区的DNA序列。具体而言，所述间隔序列具有与原间隔序列相同的碱基序列，但被设计为碱基序列中所含的各胸苷被置换为尿苷的序列。

靶序列和间隔序列的互补性

在实施方式中，所述间隔序列可为与靶序列具有60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％互补性的序列。在实施方式中，所述间隔序列可为与靶序列具有在紧接在前的句子中选择的数值范围内的互补性的序列。例如，所述间隔序列可为与靶序列具有60％-90％互补性的序列。在实施方式中，所述间隔序列可为与靶序列具有90％-100％互补性的序列。

靶序列和间隔序列之间的错配数

在实施方式中，间隔序列可为与靶序列具有0个、1个、2个、3个、4个、5个、6个、7个、8个、9个或10个错配的互补序列。在实施方式中，间隔序列可具有在这些值中的两个的数值范围内的错配。例如，间隔序列可与靶序列有1-5个错配。在实施方式中，间隔序列可与靶序列有6-10个错配。

CRISPR/Cas12f1复合体的使用

本公开中提供的基因编辑方法利用所述工程化CRISPR/Cas12f1复合体具有以靶特异性方式切割基因或核酸的活性这一事实。所述工程化CRISPR/Cas12f1复合体与<工程化CRISPR/Cas12f1复合体>部分中描述的工程化CRISPR/Cas12f1复合体具有相同的特征和配置。

将CRISRP/Cas12f1复合体的各组分递送至细胞中

在本公开中提供的基因编辑方法中，假定在靶细胞内使工程化的CRISPR/Cas12f1复合体与靶基因或核酸接触。因此，为了诱导工程化CRISPR/Cas12f1复合体与靶基因或靶核酸接触，所述基因编辑方法包括：将工程化CRISPR/Cas12f1复合体的各组分递送到靶细胞中。在实施方式中，所述基因编辑方法可包括将工程化的引导RNA或编码所述工程化的引导RNA的核酸以及Cas12f1蛋白或编码所述Cas12f1蛋白的核酸递送到靶细胞中。在实施方式中，所述基因编辑方法可包括将工程化的引导RNA和Cas12f1蛋白递送到靶细胞中。在实施方式中，所述基因编辑方法可包括将编码工程化的引导RNA和Cas12f1蛋白的核酸递送到靶细胞中。在实施方式中，所述基因编辑方法可包括将工程化的引导RNA和编码Cas12f1蛋白的核酸递送到靶细胞中。在实施方式中，所述基因编辑方法可包括将编码工程化的引导RNA的核酸和编码Cas12f1蛋白的核酸递送到靶细胞中。可使用各种递送方法以各种递送形式将工程化的引导RNA或编码所述工程化的引导RNA的核酸以及Cas12f1蛋白或编码所述Cas12f1蛋白的核酸递送到靶细胞中。

递送形式-RNP

作为递送形式，可使用工程化的引导RNA和Cas12f1蛋白相组合的核糖核蛋白颗粒(RNP)。在实施方式中，所述基因编辑方法可包括将其中组合了工程化的引导RNA和Cas12f1蛋白的CRISPR/Cas12f1复合体注射到靶细胞中。

递送形式-非病毒载体

作为另一递送形式，可使用包含编码工程化的引导RNA的核酸序列和编码Cas12f1蛋白的核酸序列的非病毒载体。在实施方式中，所述基因编辑方法可包括将包含编码工程化的引导RNA的核酸序列和编码Cas12f1蛋白的核酸序列的非病毒载体注射到靶细胞中。具体而言，所述非病毒载体可为质粒、裸DNA、DNA复合体或mRNA，但不限于此。在实施方式中，所述基因编辑方法可包括将包含编码工程化的引导RNA的核酸序列的第一非病毒载体和包含编码Cas12f1蛋白的核酸序列的第二非病毒载体注射到靶细胞中。具体而言，第一非病毒载体和第二非病毒载体可分别选自于由质粒、裸DNA、DNA复合体和mRNA所组成的组中的一种，但不限于此。

递送形式-病毒载体

作为又一递送形式，可使用包含编码工程化的引导RNA的核酸序列和编码Cas12f1蛋白的核酸序列的病毒载体。在实施方式中，所述基因编辑方法可包括：将编码工程化的引导RNA的核酸序列和编码Cas12f1蛋白的核酸序列注射到靶细胞中。具体而言，所述病毒载体可为选自于由以下病毒所组成的组中的一种：逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒和单纯疱疹病毒，但不限于此。在实施方式中，所述病毒载体可为腺相关病毒(AAV)。

在实施方式中，所述基因编辑方法可包括：将包含编码工程化的引导RNA的核酸序列的第一病毒载体和包含编码Cas12f1蛋白的核酸序列的第二病毒载体注射到靶细胞中。具体而言，第一病毒载体和第二病毒载体可分别选自于由以下病毒所组成的组中的一种：逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒和单纯疱疹病毒，但不限于此。

递送方式-一般递送方式

只要其能够以适当的递送形式将工程化的引导RNA或编码所述工程化的引导RNA的核酸以及Cas12f1蛋白或编码所述Cas12f1蛋白的核酸递送到细胞中，递送方法不受特别限制。在实施方式中，所述递送方法可为电穿孔、基因枪法、超声穿孔、磁转染和/或瞬时细胞压缩或挤压。

递送方法-纳米颗粒

所述递送方法可为使用纳米颗粒递送CRISPR/Cas12f1系统中所含的至少一种组分。就此而言，递送方法可为已知方法，能够由本领域技术人员恰当选择。例如，纳米颗粒递送方法可为(WO 2019/089820A1)中公开的方法，但不限于此。

在实施方式中，所述递送方法可为使用纳米颗粒递送Cas12f1蛋白或编码所述Cas12f1蛋白的核酸和/或工程化的引导RNA或编码所述工程化的引导RNA的核酸。在实施方式中，所述递送方法可为使用纳米颗粒递送Cas12f1蛋白或编码所述Cas12f1蛋白的核酸、第一工程化的引导RNA或编码所述第一工程化的引导RNA的核酸、和/或第二工程化的引导RNA或编码所述第二工程化的引导RNA的核酸。就此而言，所述递送方法可为阳离子脂质体法、乙酸锂-DMSO法、脂质介导的转染、磷酸钙沉淀法、脂质转染、聚乙烯亚胺(PEI)介导的转染、DEAE-葡聚糖介导的转染和/或纳米颗粒介导的核酸递送(参见Panyam等，Adv DrugDeliv Rev.，2012年9月13，pii：S0169-409X(12)00283-9.doi:10.1016/j.addr.2012.09.023)，但不限于此。就此而言，CRISPR/Cas12f1系统的组分可为RNP、非病毒载体和/或病毒载体的形式。例如，CRISPR/Cas12f1系统的组分可为编码各组分的mRNA的形式，但不限于此。

递送形式和方法-可能的组合

所述基因编辑方法包括：将工程化的引导RNA或编码所述工程化的引导RNA的核酸以及Cas12f1蛋白或编码所述Cas12f1蛋白的核酸递送到细胞中，就此而言，所述组分的递送形式和/或递送方法可彼此相同也可不同。在实施方式中，所述基因编辑方法可包括：以第一递送形式递送工程化的引导RNA或编码所述工程化的引导RNA的核酸，以及以第二递送形式递送Cas12f1蛋白或编码所述Cas12f1蛋白的核酸。就此而言，第一递送形式和第二递送形式可各自为上述递送形式中的任一种。在实施方式中，所述基因编辑方法可包括：通过第一递送方法递送工程化的引导RNA或编码所述工程化的引导RNA的核酸，以及通过第二递送方法递送Cas12f1蛋白或编码所述Cas12f1蛋白的核酸。就此而言，第一递送方法和第二递送方法可各自为上述递送方法中的任一种。

递送顺序

所述基因编辑方法包括：将工程化的引导RNA或编码所述工程化的引导RNA的核酸以及Cas12f1蛋白或编码所述Cas12f1蛋白的核酸递送至细胞中，并且就此而言，可同时将所述组分递送至细胞中，但也可按其间的时间间隔顺序递送。

在实施方式中，所述基因编辑方法可包括：同时递送工程化的引导RNA或编码所述工程化的引导RNA的核酸以及Cas12f1蛋白或编码所述Cas12f1蛋白的核酸。在实施方式中，所述基因编辑方法可包括：将工程化的引导RNA或编码所述工程化的引导RNA的核酸递送至细胞中，然后在一段时间间隔后将Cas12f1蛋白或编码所述Cas12f1蛋白的核酸递送至所述细胞中。在实施方式中，所述基因编辑方法可包括：将Cas12f1蛋白或编码所述Cas12f1蛋白的核酸递送至细胞中，然后在一段时间间隔后将工程化的引导RNA递送至所述细胞中。在实施方式中，所述基因编辑方法可包括：将编码Cas12f1蛋白的核酸递送至细胞中，然后在一段时间间隔后将工程化的引导RNA递送至所述细胞中。

多个工程化的引导RNA或编码所述多个工程化的引导RNA的核酸的递送

本公开中提供的基因编辑方法可包括：将Cas12f1蛋白或编码所述Cas12f1蛋白的核酸、以及两种以上的工程化的引导RNA或编码所述两种以上的工程化的引导RNA的核酸递送至靶细胞中。通过所述方法，可将靶向不同序列的两种以上的CRISPR/Cas12f1复合体注射到靶细胞中，或者可在靶细胞中形成靶向不同序列的两种以上的CRISPR/Cas12f1复合体。因此，可对细胞中包含的两个以上的靶基因或靶核酸进行编辑。在实施方式中，所述基因编辑方法包括：将Cas12f1蛋白或编码所述Cas12f1蛋白的核酸、第一工程化的引导RNA或编码所述第一工程化的引导RNA的核酸、以及第二工程化的引导RNA或编码所述第二工程化的引导RNA的核酸递送至包含靶基因或靶核酸的靶细胞中。就此而言，可使用上述所述的递送形式和方法中的一种或多种将各种组分递送至细胞中。就此而言，可将两种以上的组分同时递送至细胞中，或者可将它们按其间的时间间隔顺序递送至细胞中。

使CRISPR/Cas12f1复合体和靶核酸彼此接触

在本公开中提供的基因编辑方法中，在使靶细胞中的工程化CRISPR/Cas12f1复合体与靶基因或靶核酸接触的同时进行靶基因或靶核酸的编辑。因此，所述基因编辑方法可包括将工程化CRISPR/Cas12f1复合体在靶细胞中接触，或诱导所述接触。在实施方式中，所述基因编辑方法可包括：使工程化CRISPR/Cas12f1复合体与靶细胞中的靶核酸接触。在实施方式中，所述基因编辑方法可包括：诱导工程化CRISPR/Cas12f1复合体与靶细胞中的靶核酸接触。就此而言，诱导不受特别限制，只要它是使工程化CRISPR/Cas12f1复合体与细胞中的靶核酸接触的方法即可。在实施方式中，所述诱导可包括：将工程化的引导RNA或编码所述工程化的引导RNA的核酸以及Cas12f1蛋白或编码所述Cas12f1蛋白的核酸递送至细胞中。

基因编辑结果-插入缺失

作为执行本公开中提供的基因编辑方法的结果，可在靶基因或靶核酸中产生插入缺失。就此而言，插入缺失可出现在靶序列部分和/或原间隔序列部分的内部和/或外部。插入缺失是指核酸的核苷酸序列中的突变，其中核苷酸序列中的一部分被删除，任意核苷酸被插入，和/或从预先编辑的序列开始组合插入和删除。通常，靶基因或靶核酸序列中插入缺失的出现会使相应基因或核酸失活。在实施方式中，作为执行所述基因编辑方法的结果，可在靶基因或靶核酸中删除和/或添加一个或多个核苷酸。

基因编辑结果-碱基编辑

作为执行本公开中提供的基因编辑方法的结果，可在靶基因或靶核酸内发生碱基编辑。这意味着与其中删除或添加靶基因或靶核酸中的任何碱基的插入缺失不同，核酸中的一个或多个特定碱基按预期改变。换言之，碱基编辑在靶基因或核酸的特定位置处引起预定的点突变。在实施方式中，作为执行所述基因编辑方法的结果，靶基因或靶核酸中的一个或多个碱基可被置换为其它碱基。

基因编辑结果-插入

作为执行本公开中提供的基因编辑方法的结果，可在靶基因或靶核酸中发生敲入(knock-in)。敲入是指在靶基因或靶核酸序列中插入额外的核酸序列。除了CRISPR/Cas12f1复合体外，还需要包含额外的核酸序列的供体来进行敲入。当CRISPR/Cas12f1复合体切割细胞中的靶基因或靶核酸时，将发生被切割的靶基因或靶核酸的修复。就此而言，所述供体参与修复过程，从而将所述额外的核酸序列插入靶基因或靶核酸中。在实施方式中，所述基因编辑方法还可包括：将供体递送至靶细胞中。就此而言，所述供体包含额外的靶核酸，并且所述供体诱导所述额外的靶核酸插入到靶基因或靶核酸中。就此而言，当将所述供体递送至靶细胞中时，可使用上述所述的递送形式和/或递送方法。

基因编辑结果-删除

作为执行本公开中提供的基因编辑方法的结果，靶基因或靶核酸序列的全部或部分可被删除。删除是指将靶基因或靶核酸中的部分碱基序列删除。在实施方式中，所述基因编辑方法包括：将Cas12f1蛋白或编码所述Cas12f1蛋白的核酸、第一工程化的引导RNA或编码所述第一工程化的引导RNA的核酸、以及第二工程化的引导RNA或编码所述第二工程化的引导RNA的核酸引入包含靶基因或靶核酸的细胞中。因此，所述靶基因或靶核酸中特定序列部分的删除由于基因编辑而发生。

基因编辑方法的实例

在实施方式中，所述基因编辑方法可包括：以核糖核蛋白颗粒的形式将CRISPR/Cas12f1复合体递送至真核细胞中，在所述核糖核蛋白颗粒中工程化的引导RNA和Cas12f1蛋白相组合。就此而言，可通过电穿孔或脂质转染进行所述递送。

在实施方式中，所述基因编辑方法可包括：将编码工程化的引导RNA的核酸和编码Cas12f1蛋白的核酸递送到真核细胞中。就此而言，可通过电穿孔或脂质转染进行所述递送。

在实施方式中，所述基因编辑方法可包括：将腺相关病毒(AAV)载体递送到真核细胞中，所述腺相关病毒(AAV)载体包含编码工程化的引导RNA的核酸序列和编码Cas12f1蛋白的核酸序列。

在实施方式中，所述基因编辑方法可包括：将腺相关病毒(AAV)递送到真核细胞中，所述腺相关病毒(AAV)包含编码第一工程化的引导RNA的核酸序列、编码第二工程化的引导RNA的核酸序列以及编码Cas12f1蛋白的核酸序列。

工程化的crRNA的用途

工程化的crRNA的基因编辑用途

在实施方式中，所述工程化的crRNA可用于包含靶序列的靶基因或靶核酸的基因编辑。

在实施方式中，所述工程化的引导RNA可用于包含靶序列的靶基因或靶核酸的基因编辑。

在实施方式中，所述工程化CRISPR/Cas12f1复合体可用于包含靶序列的靶基因或靶核酸的基因编辑。

就此而言，所述工程化的crRNA、工程化的引导RNA和工程化CRISPR/Cas12f1复合体具有与各部分中描述的特征和配置相同的特征和配置。

在实施方式中，可使用靶基因或靶核酸的基因编辑的用途来执行<使用工程化的crRNA的基因编辑方法>部分中描述的方法。

在实施方式中，所述用途可包括：将工程化的引导RNA或编码所述工程化的引导RNA的核酸以及Cas12f1蛋白或编码所述Cas12f1蛋白的核酸递送至靶细胞中。就此而言，所述工程化的引导RNA序列包含支架序列、间隔序列和富含U的尾序列。就此而言，所述间隔序列可与靶细胞中包含的靶基因或靶核酸互补结合。在实施方式中，富含U的尾序列可由(U_aV)_nU_b表示。就此而言，a、n和b为整数，a为1-4，n为0或更大，b为1-10。在实施方式中，富含U的尾序列可由(U_aN)_nU_b表示。就此而言，N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种。就此而言，a为1-4的整数，n为选自0、1和2的整数，b为1-10的整数。

在实施方式中，所述用途可包括使工程化CRISPR/Cas12f1复合体与靶细胞中的靶核酸接触。

就此而言，所述工程化CRISPR/Cas12f1复合体具有与<工程化CRISPR/Cas12f1复合体>部分中描述的特征和结构相同的特征和结构。

在实施方式中，所述用途可包括：诱导工程化CRISPR/Cas12f1复合体与靶细胞中的靶核酸接触。就此而言，诱导不受特别限制，只要它是使工程化CRISPR/Cas12f1复合体与细胞中的靶核酸接触的方法即可。在实施方式中，所述诱导可包括：将工程化的引导RNA或编码所述工程化的引导RNA的核酸以及Cas12f1蛋白或编码所述Cas12f1蛋白的核酸递送至细胞中。

工程化的crRNA用于制备基因编辑组合物的用途

在实施方式中，工程化的crRNA可用于制备用于基因编辑的组合物。

在实施方式中，工程化的引导RNA可用于制备用于基因编辑的组合物。

在实施方式中，工程化CRISPR/Cas12f1复合体可用作制备用于基因编辑的组合物的用途。

在实施方式中，用于基因编辑的组合物可包含Cas12f1蛋白或编码所述Cas12f1蛋白的核酸、工程化的crRNA或编码所述工程化的crRNA的核酸、以及tracrRNA或编码所述tracrRNA的核酸。

在实施方式中，用于基因编辑的组合物可包含Cas12f1蛋白或编码所述Cas12f1蛋白的核酸、以及工程化的引导RNA或编码所述工程化的引导RNA的核酸。

在实施方式中，用于基因编辑的组合物可包含CRISPR/Cas12f1复合体。

在实施方式中，用于基因编辑的组合物可包含具有编码Cas12f1蛋白的核酸序列和编码工程化的引导RNA的核酸序列的载体。

实施例

在下文中，将通过实验例和实施例更详细地描述本公开中所提供的发明。这些实施例仅用于例示本公开中所公开的内容，并且对于本领域技术人员来说将显而易见的是，本公开所公开的内容的范围不应被解释为受这些实施例的限制。

实验例1实验材料的制备及实验方法

实验例1-1人密码子优化的Cas14a1序列

使用密码子优化程序对属于Cas14家族的Cas12f1蛋白(以下称为Cas14a1，Doudna等，Programmed DNA destruction by miniature CRISPR-Cas14 enzymes，Science 362，839-842(2018))进行密码子优化，并且基因合成其中5'端和3'-末端添加有NLS序列的序列以确保CDS。使用合成的基因作为模板来进行PCR扩增，并通过Gibson组装法，对于具有能够在真核系统中表达的启动子和polyA信号序列的载体根据所需克隆序列进行克隆。最终通过Sanger测序法确认克隆完成后得到的质粒载体的序列。Cas14a1蛋白的氨基酸序列和编码所述Cas14a1蛋白的人密码子优化核酸序列示于表1中。

[表1]

NLS-Cas14a1-NLS蛋白的序列信息

实验例1-2质粒载体的制备

合成了本实验中使用的包含人密码子优化的Cas14a1DNA序列的寡核苷酸(Bionics)。将用于Cas14a1蛋白序列的寡核苷酸克隆到包含鸡β-肌动蛋白启动子、5'端和3'端处的NLS以及T2A连接的eGFP的质粒中。合成了本实验中使用的标准引导RNA的模板DNA(Twist Bioscience)，并克隆到pTwist Amp质粒中进行复制。使用酶克隆技术构建用于工程化的引导RNA的模板DNA，并克隆到pTwist Amp质粒中进行复制。如有必要，通过使用质粒作为模板，使用U6互补的正向引物和原间隔序列互补的反向引物来制备引导RNA或工程化的引导RNA的扩增子。此外，如有必要，将制备的扩增子克隆到T-平端质粒(Biofact)中进行复制。为了制备(工程化的)双引导RNA，使用BamHI和HindIII限制性酶(New EnglandBiolabs)在pSilencer 2.0(ThermoFisher Scientific)中对编码tracrRNA和(工程化的)crRNA的寡核苷酸进行复制。

实验例1-3病毒载体的制备

制备了包含如下的腺相关病毒(AAV)反向末端重复载体：引导RNA(或工程化的引导RNA)序列以及通过NLS和自切割T2A序列与增强型绿色荧光蛋白(eGFP)连接的Cas12f1蛋白序列。分别通过鸡β-肌动蛋白启动子和U6启动子促进了Cas12f1和引导RNA的转录。为了制备rAAV2载体，将pAAV-ITR-sgRNA-Cas12f1、pAAVED29和辅助质粒转染到HEK293 T细胞中。在含有2％FBS的DMEM培养基中培养转染的HEK293T细胞。使用Polyplus转染(PEIpro)和PEI共沉淀以相同的摩尔比使用对质粒的三次转染，来生产重组假型AAV载体原液。培养72小时后，裂解细胞，并通过碘克沙醇(Sigma-Aldrich)逐步梯度超速离心纯化裂解物。

实验例1-4引导RNA扩增子的制备

为了制备引导RNA和工程化的引导扩增子，使用KAPA HiFi HotStart DNA聚合酶(Roche)或Pfu DNA聚合酶(Biofact)，用U6互补的正向引物和原间隔序列互补的反向引物，针对用于标准引导RNA的模板DNA质粒和工程化引导RNA的模板DNA质粒，进行PCR扩增。使用Higene Gel&PCR纯化系统(Biofact)纯化PCR扩增产物以获得引导RNA和工程化引导RNA扩增子。

实验例1-5引导RNA的制备

使用以下方法之一来制备引导RNA(或工程化的引导RNA)。

引导RNA通过化学合成预先设计的引导RNA来制备。

制备了包含预先设计的引导RNA序列和T7启动子序列的PCR扩增子。使用NEB T7聚合酶，以PCR扩增子为模板进行体外转录。用NEBDNase I处理通过进行体外转录所得到的产物，然后使用Monarch RNA Cleanup Kit(NEB)纯化经处理的产物，然后得到引导RNA。

通过实验例1-2中的Tblunt质粒克隆方法制备了包含预先设计的引导RNA序列和T7启动子序列的质粒载体。通过双剪切包含T7启动子序列的引导RNA序列的两端来纯化所述载体，然后使用NEB T7聚合酶在所得的产物上进行体外转录。用NEB DNase I处理通过进行体外转录所得到的产物后，使用Monarch RNA Cleanup Kit(NEB)纯化经处理的产物，然后得到引导RNA。

实验例1-6重组Cas12f1蛋白的制备

在pMAL-c2质粒载体中复制本实验中使用的人密码子优化的Cas14a1DNA序列。所述质粒载体用于转化BL21(DE3)大肠杆菌(E.coli)细胞。使转化的大肠杆菌菌落在37℃下在LB肉汤中生长，直至光密度达到0.7。将转化的大肠杆菌细胞在0.1mM异丙硫基-β-D-半乳糖苷存在下于18℃培养过夜。然后将细胞以3500g离心30分钟并收集。将细胞重新悬浮在20mM Tris-HCl(pH 7.6)、500mM NaCl、5mMβ-巯基乙醇、5％甘油中。对细胞进行裂解，通过超声对裂解的细胞进行破碎。将包含破碎细胞的样品以15000g离心30分钟后，通过0.4μm注射器过滤器(Millipore)过滤上清液。使用FPLC纯化系统(AKTA Purifier，GE Healthcare)将过滤后的上清液加载到Ni²⁺亲和柱上。以80-400mM咪唑、20mM Tris-HCl(pH 7.5)的梯度洗脱结合的级分。用TEV蛋白酶处理洗脱的蛋白16小时。在肝素柱中以0.15-1.6M NaCl线性浓度梯度纯化切割的蛋白。以20mM Tris pH 7.6、150mM NaCl、5mMβ-巯基乙醇和5％甘油为背景对在肝素柱中纯化的重组Cas12f1蛋白进行透析。通过穿过MBP柱对透析的蛋白进行纯化，然后在monoS柱(GE Healthcare)或Enrich S中以0.5-1.2M NaCl的线性梯度再纯化。收集再纯化的蛋白并以20mM Tris pH 7.6、150mM NaCl、5mMβ-巯基乙醇和5％甘油为背景进行透析以制备Cas12f1蛋白。使用牛血清白蛋白作为标准品，通过Bradford量化对产生的蛋白浓度进行量化，并在考马斯蓝染色的SDS-PAGE凝胶上进行电泳测量。

实验例1-7RNP的制备

通过将根据实验例1-6制备的重组Cas12f1蛋白和根据实验例1-5制备的引导RNA(或工程化的引导RNA)在室温下分别以300nM和900nM孵育10分钟来制备核糖核蛋白颗粒(RNP)。

实验例1-8细胞培养

在37℃和5％CO₂条件下，在DMEM培养基中培养HEK-293 T细胞(ATCC CRL-11269)，其中添加有10％热灭活FBS(Corning)和1％青霉素/链霉素。

实验例1-9质粒载体或PCR扩增子转染细胞

通过电穿孔或脂质转染进行细胞转染。在电穿孔的情况下，使用Neon转染系统(Invitrogen)，用各自为2-5μg的在实验例1-2中制备的编码Cas12f1蛋白的质粒载体和编码引导RNA(和工程化的引导RNA)的DNA对4×10⁵HEK-293 T细胞进行转染。在1300V、10mA和3脉冲的条件下进行电穿孔。对于脂质转染，将3-15μL FuGene试剂(Promega)与1-5μg编码Cas12f1蛋白的质粒载体以及0.3-2μg PCR扩增子混合15分钟。在转染前1天，将混合物添加到1mL铺有1×10⁶个细胞的DMEM培养基中。在混合物存在下培养细胞72-96小时。培养后，收集细胞并使用PureHelixTM基因组DNA制备试剂盒(NanoHelix)或Maxwell RSC培养细胞DNA试剂盒(Promega)手动分离细胞的基因组DNA。

实验例1-10细胞内RNP转染

在转染引导RNA(和工程化的引导RNA)前1天，使用实验例1-9中的电穿孔转染实验例1-7中制备的核糖核蛋白颗粒(RNP)，或通过实验例1-9中的脂质转染法转染实验例1-2中制备的编码Cas12f1蛋白的质粒，并且在1天后，使用实验例1-9中的电穿孔转染实验例1-5制备的引导RNA(和工程化的引导RNA)。

实验例1-11细胞中的病毒载体转染

用不同感染复数(MOI)(1、5、10、50和100)的rAAV2-Cas12f1-sgRNA感染人HEK293T细胞，所述MOI由定量PCR测定。在含有2％FBS的DMEM培养基中培养转染的HEK293T细胞。在不同的时间点，收集细胞以分离基因组DNA。

实验例1-12定量实时PCR(定量rtPCR)

使用RNeasy Miniprep试剂盒(Qiagen)或Maxwell RSC miRNA Tissue Kit(Promega)或DNeasy Blood&Tissue Kit(Qiagen)从HEK293 T细胞中分别提取引导RNA(或工程化的引导RNA)或基因组DNA。为了量化引导RNA，连接了RNA特异性引物，并使用crRNA特异性引物合成了cDNA。将所述cDNA用作定量实时PCR的模板。使用KAPA SYBR FAST qPCRMaster Mix(2×)Kit(KapaBiosystems)对实时PCR进行分析。

实验例1-13确认Cas蛋白表达的蛋白质印迹

制备实验例1-2所制备的编码Cas蛋白的质粒载体。关于这一点，该质粒进一步具有编码HA标签的序列(5'-TACCCATACGATGTTCCAGATTACGCTTATCCCTACGACGTGCCTGATTATGCATACCCATATGATGTCCCCGACTATGCC-3'，SEQ ID NO：315)，使得当Cas蛋白在细胞中表达时可连接和表达HA标签。通过实验例1-9中公开的方法用所述质粒载体对实验例1-8中培养的HEK293 T细胞进行转染。将所述HEK293T细胞接种到含有青霉素/链霉素的DMEM培养基中，在37℃和5％CO₂的培养箱中静置培养48小时。然后，用PBS稀释HEK293 T细胞，然后通过超声破碎。将含有破碎细胞的样品在15000g和4℃下离心10分钟后，通过Bradford量化方法对上清液进行量化。通过蛋白质印迹检测所量化的HA抗体是否在体内表达。

实验例1-14插入缺失效率分析

在从HEK-293T细胞中分离的基因组DNA中，在KAPA HiFi HotStart DNA聚合酶(Roche)存在下，使用靶特异性引物对含有原间隔区的区域进行PCR。扩增方法遵循制造商的说明。使用Illumina iSeq 100对作为扩增所得的产物的PCR扩增子(包含IlluminaTruSeq HT双索引)进行150bp配对末端测序。使用MAUND计算插入缺失频率。MAUND在https://github.com/ibscge/maund上提供。

实验例1-15T7核酸内切酶I(T7E1)分析

使用BioFACTTM Lamp Pfu DNA聚合酶获得PCR产物。在37℃下，将PCR产物(100-300μg)与10单位的T7E1酶(New England Biolabs)在25μg反应混合物中反应30分钟。将20μL反应混合物直接加载到10％芳基酰胺凝胶上，将切割的PCR产物在TBE缓冲系统中运行。用溴化乙锭溶液对凝胶图像进行染色，然后使用Printgraph 2M凝胶成像系统(Atto)进行数字化。通过分析数字化结果来评价基因编辑效率。

实验例1-16统计分析

通过Sigma Plot软件(版本14.0)，用双尾学生t检验进行统计学显著性验证。当出现小于0.05的p值时，认为统计学上显著，p值在每张图中都有说明。在箱线图和点图中，数据点表示值的完整范围，每个方框跨越四分位数范围(25-75百分位数)。中值和平均值分别由黑色和红色的平行线表示。所有点图和条形图数据的误差棒均使用Sigmaplot(v.41.0)进行表明，并表示每个数据的标准偏差值。样本量不是基于统计方法预先确定的。

实验例2具有富含U的尾的工程化CRISPR/Cas14a1系统的插入缺失效率比较1

使用各种基因序列作为靶核酸进行了实验，以评价具有富含U的尾序列的工程化CRISPR/Cas14a1系统的插入缺失效率。靶核酸的原间隔序列和各PAM序列在表2中公开。

[表2]

实验例2的靶核酸

靶核酸	靶核酸的原间隔序列(5′至3′)	PAM
			RNF2	CACGTCTCATATGCCCCTTG(SEQ ID NO：62)	TTTA
DYtarget2	CACACACACAGTGGGCTACC(SEQ ID NO：63)	TTTG
			DYtarget9	GACGTGGGAGACACACACAC(SEQ ID NO：64)	TTTA
DYtarget10	CATCCCCAGGACACACACAC(SEQ ID NO：65)	TTTG
			DYtarget13	AGCACATGTGCACACACACA(SEQ ID NO：66)	TTTG

1)根据实验例1-2制备包含编码Cas14a1蛋白的人密码子优化序列的质粒载体。

2)根据实验例1-4制备能够表达野生型单引导RNA或具有富含U的尾序列的(工程化的)单引导RNA的扩增子。编码单引导RNA的DNA序列和用于制备扩增子的引物序列在表3-表5中公开。

[表3]

编码实验例2中使用的野生型(WT)sgRNA的DNA序列

在上表中，对于编码每个靶核酸的sgRNA的DNA序列，sgRNA共有序列-原间隔序列-富含U的尾序列以5'-3'的方向连接，sgRNA共有序列中的支架序列为SEQ ID NO：254的一部分序列。能够表达(工程化的)单引导RNA的扩增子序列为其中U6启动子可操作地连接至编码所述sgRNA的DNA序列的扩增子序列。

[表4]

编码实验例2中使用的工程化的sgRNA的DNA序列

[表5]

实验例2中使用的引物序列

3)通过实验例1-9中公开的方法，用能够表达单引导RNA的扩增子和包含Cas14a1序列的质粒载体，对按照实验例1-8培养的HEK-293 T细胞进行转染。

4)通过实验例1-12至实验例1-15中公开的方法分析每个实施例的靶核酸的插入缺失效率。插入缺失效率分析结果示于下表6中。

[表6]

实验例2的插入缺失效率分析结果

靶核酸	对照	WT	工程化的sgRNA
				RNF2	0	0	0.029
DYtarget2	0	0.028	0.749
				DYtarget9	0	0	0.238
DYtarget10	0.029	0.031	1.076
				DYtarget13	0.529	0.526	1.176

就这方面而言，仅用包含Cas14a1蛋白序列的质粒载体转染且不具有sgRNA的那些细胞用作对照。

实验例3具有富含U的尾的工程化CRISPR/Cas14a1系统的插入缺失效率比较2

使用DYtarget2、DYtarget10、DYtarget13和Intergenic-22作为靶核酸进行了实验，以评价具有富含U的尾序列的工程化CRISPR/Cas14a1系统的插入缺失效率。靶核酸的原间隔序列和各PAM序列公开于表7中。

[表7]

实验例3中使用的靶核酸序列

1)根据实验例1-2制备包含人密码子优化的Cas14a1序列的质粒载体。

2)根据实验例1-2制备能够表达野生型单引导RNA或具有富含U的尾序列的(工程化的)单引导RNA的扩增子。编码单引导RNA的DNA序列和用于制备扩增子的引物序列在表8和表9中示出。

[表8]

实验例3的编码sgRNA的DNA序列

[表9]

实验例3中使用的引物序列

3)通过实验例1-9中公开的方法，用包含Cas14a1序列的质粒载体和单引导RNA的扩增子对按照实验例1-8培养的HEK-293 T细胞进行转染。

4)通过实验例1-12至实验例1-13中公开的方法分析每个实施例的靶核酸的插入缺失效率。插入缺失效率分析结果示于图2中。

如图2所公开，包含工程化的引导RNA的CRISPR/Cas14a1系统显示出比野生型更高的插入缺失效率，所述工程化的引导RNA具有连接至其3'-末端的富含U的尾序列。

实验例4具有富含U的尾的工程化CRISPR/Cas14a1系统的插入缺失效率比较3

使用DYtarget2、DYtarget10和Intergenic-22作为靶核酸进行了实验，以评价具有富含U的尾序列的工程化CRISPR/Cas14a1系统的插入缺失效率。靶核酸的原间隔序列和各PAM序列在表10中公开。

[表10]

实验例4中使用的靶核酸序列

靶核酸	靶核酸的原间隔序列(5′-3′)	PAM
			DYtarget2	CACACACACAGTGGGCTACC(SEQ ID NO：63)	TTTG
DYtarget10	CATCCCCAGGACACACACAC(SEQ ID NO：65)	TTTG
			Intergenic-22	AGAACACATACCCCTGGGCC(SEQ ID NO：67)	TTTA

2)根据实验例1-2和实验例1-4，制备了能够表达tracrRNA的质粒载体和扩增子，以及能够表达具有野生型序列或富含U的尾序列的(工程化的)crRNA的质粒载体和扩增子。编码tracrRNA和crRNA的DNA序列，以及用于制备质粒载体和扩增子的引物序列在表11-表13中示出。

[表11]

实验例4的编码tracrRNA的DNA序列

就这一方面而言，能够表达tracrRNA的扩增子序列或质粒载体序列为其中U6启动子可操作地连接至编码tracrRNA的DNA序列的扩增子序列或质粒载体序列。

[表12]

实验例4的编码crRNA的DNA序列

在上表中，对于编码每个靶核酸的crRNA的DNA序列，crRNA共有序列-原间隔序列-富含U的尾序列以5'-3'的方向连接，crRNA共有序列中的CRISPR RNA重复序列为SEQ IDNO：58的序列。能够表达(工程化的)crRNA的扩增子序列或质粒序列为其中U6启动子可操作地连接至编码所述crRNA的DNA序列的扩增子序列或质粒序列。

[表13]

实验例4中使用的引物序列

3)通过实验例1-9中公开的方法，用包含Cas14a1序列的质粒载体、tracrRNA的质粒载体或扩增子、以及crRNA的质粒载体或扩增子对按照实验例1-8培养的HEK-293 T细胞进行转染。在这方面，其中未注射crRNA的细胞用作对照(图3中No crRNA数据)。

4)通过实验例1-12至实验例1-14中公开的方法分析每个实施例的靶核酸的插入缺失效率。插入缺失效率分析结果示于图3。

如图3中所公开，包含具有连接至3'末端的富含U的尾序列的工程化引导RNA的CRISPR/Cas14a1系统显示出比野生型更高的插入缺失效率。

实验例5具有富含U的尾的工程化CRISPR/Cas14a1系统的插入缺失效率比较4

使用各种靶序列作为靶核酸进行实验，以评价具有富含U的尾序列的工程化CRISPR/Cas14a1系统的插入缺失效率。

对实验例3或实验例4中公开的靶核酸进行实验，实验按照以下方法进行，而不是用包含Cas14a1序列的质粒载体和单引导RNA的扩增子转染HEK-293 T细胞。

1)根据实验例1-5制备具有实验例3和实验例4中公开的sgRNA序列的单引导RNA。

2)根据实验例1-6制备Cas14a1蛋白。

3)根据实验例1-7，由1)和2)所得的产物制备RNP。

4)用根据实验例1-10的RNP对根据实验例1-8制备的HEK-293 T细胞进行转染。

5)以下插入缺失效率分析方法如实验例2或实验例3所述。

实验例6具有富含U的尾的工程化CRISPR/Cas14a1系统的插入缺失效率比较5

使用各种靶基因作为靶核酸进行实验，以评价具有富含U的尾序列的工程化CRISPR/Cas14a1系统的插入缺失效率。

1)根据实验例1-3制备具有实验例3和实验例4中公开的sgRNA序列和编码Cas14a1蛋白的序列的病毒载体。

4)用根据实验例1-11的病毒载体对根据实验例1-8制备的HEK-293 T细胞进行转染。

5)以下插入缺失效率分析方法如实验例2或实验例3所述。

实验例7根据富含U的尾的结构的插入缺失效率比较1

使用DYtarget2和DYtarget10作为靶核酸进行实验，根据富含U的尾序列的结构来评价工程化CRISPR/Cas14a1系统的插入缺失效率。靶核酸的原间隔序列和各PAM序列在表14中公开。

[表14]

实验例7中使用的靶核酸序列

靶核酸	靶核酸的原间隔序列(5′-3′)	PAM
			DYtarget2	CACACACACAGTGGGCTACC(SEQ ID NO：63)	TTTG
DYtarget10	CATCCCCAGGACACACACAC(SEQ ID NO：65)	TTTG

2)根据实验例1-4制备能够表达野生型或(工程化的)具有富含U的尾序列的单引导RNA的扩增子。编码单引导RNA的DNA序列和用于制备扩增子的引物序列在表15和表16中示出。

[表15]

实验例7的编码sgRNA的DNA序列

在上表中，对于编码每个靶核酸的sgRNA的DNA序列，sgRNA共有序列-原间隔序列-富含U的尾序列以5′-3′的方向连接，sgRNA共有序列中的支架序列为SEQ ID NO：254的一部分序列。能够表达(工程化的)单引导RNA的扩增子序列为其中U6启动子可操作地连接至编码所述sgRNA的DNA序列的扩增子序列。

[表16]

实验例7中使用的引物序列

3)通过实验例1-9中公开的方法，用包含Cas14a1序列的质粒载体和单引导RNA扩增子对根据实验例1-8培养的HEK-293 T细胞进行转染。

4)通过实验例1-12至实验例1-14中公开的方法分析每个实施例的靶核酸的插入缺失效率。插入缺失效率分析结果在图4中示出。在这方面而言，未进行任何处理的HEK-293T细胞用作对照(参见图4中的WT数据)。

实验例8根据富含U的尾的结构的插入缺失效率比较2

使用DYTarget2作为靶核酸进行实验，根据富含U的尾序列的结构来评价工程化CRISPR/Cas14a1系统的插入缺失效率。靶核酸的原间隔序列和PAM序列如实验例7的表14中的“DYTarget2”所示。

2)根据实验例1-4制备能够表达野生型单引导RNA或具有富含U的尾序列的(工程化的)单引导RNA的扩增子。编码所述单引导RNA的DNA序列和用于制备扩增子的引物序列在表17和表18中示出。

[表17]

实验例8的编码sgRNA的DNA序列

在上表中，对于编码每个靶核酸的sgRNA的扩增子序列，sgRNA共有序列-原间隔序列-富含U的尾序列以5'-3'的方向连接，sgRNA共有序列中的支架序列为SEQ ID NO：254的一部分序列。能够表达所述(工程化的)单引导RNA的扩增子序列为其中U6启动子可操作地连接至编码所述sgRNA的DNA序列的扩增子序列。

[表18]

实验例8中使用的引物序列

1)通过实验例1-9中公开的方法，用包含Cas14a1序列的质粒载体和单引导RNA的扩增子对根据实验例1-8培养的HEK-293 T细胞进行转染。

2)通过实验例1-12至实验例1-14中公开的方法分析每个实施例的靶核酸的插入缺失效率。插入缺失效率分析结果在图5中示出。

实验例9根据富含U的尾的结构的插入缺失效率比较3

使用CSMD1作为靶核酸进行实验，根据富含U的尾序列的结构来评价工程化CRISPR/Cas14a1系统的插入缺失效率。靶核酸的原间隔序列和PAM序列在表19中示出。

[表19]

实验例9中使用的靶核酸序列

靶核酸	靶核酸的原间隔序列(5′-3′)	PAM
			CSMD1	GAATACCCCCATTCTTCAGG(SEQ ID NO：260)	TTTA

1)根据实验例1-6制备重组Cas12f1蛋白。

2)根据实验例1-5合成野生型单引导RNA或具有富含U的尾序列的(工程化的)单引导RNA。单引导RNA的序列在下表20中示出。

[表20]

实验例9的sgRNA序列

在上表中，对于每个靶核酸的sgRNA序列，sgRNA共有序列-间隔序列-富含U的尾字列以5′-3′的方向连接，sgRNA共有序列中的支架序列为SEQ ID NO：253的一部分序列。

3)使用重组Cas14a1和单引导RNA根据实验例1-7制备RNP，并且通过实验例1-7中公开的方法，用RNP对根据实验例1-8培养的HEK293 T细胞进行转染。

2)通过实验例1-12至实验例1-13中公开的方法分析每个实施例的靶核酸的插入缺失效率。插入缺失效率分析结果在图6中示出。

作为实验的结果，可以看出具有连接至3′-末端的富含U的尾序列的工程化的引导RNA显示出比不具有富含U的尾序列的野生型引导RNA显著更高的插入缺失效率。

特别是，可以看出，与野生型引导RNA相比，具有10个以上连接的尿苷的序列的工程化引导RNA显示出出色的插入缺失效率。

实验例10根据富含U的尾的结构的插入缺失效率比较3

使用DYtarget2作为靶核酸进行实验，根据富含U的尾序列中修饰的连续尿苷序列的结构来评价工程化CRISPR/Cas14a1系统的插入缺失效率。靶核酸的原间隔序列和PAM序列如实验例7的表14中的“DYTarget2”所示。

2)根据实验例1-4制备能够表达野生型单引导RNA或具有富含U的尾序列的(工程化的)单引导RNA的扩增子。编码所述单引导RNA的DNA序列和用于制备扩增子的引物序列在表21和表22中示出。

[表21]

实验例10的编码sgRNA的DNA序列

在上表中，对于编码每个靶核酸的sgRNA的DNA序列，sgRNA共有序列-原间隔序列-富含U的尾序列以5'-3'的方向连接，sgRNA共有序列中的支架序列为SEQ ID NO：254的一部分序列。能够表达所述(工程化的)单引导RNA的扩增子序列为其中U6启动子可操作地连接至编码所述sgRNA的DNA序列的扩增子序列。

[表22]

实验例10中使用的引物序列

3)通过实验例1-9中公开的方法，用包含编码Cas14a1序列的核酸序列的质粒载体和单引导RNA的扩增子对根据实验例1-8培养的HEK-293 T细胞进行转染。

4)通过实验例1-12至实验例1-14中公开的方法分析每个实施例的靶核酸的插入缺失效率。插入缺失效率分析结果在图7中示出。

实验的结果表明，当工程化的引导RNA具有修饰的连续尿苷序列结构时，真核细胞中的插入缺失效率明显高于不具有富含U的尾序列的野生型引导RNA，所述连续尿苷序列结构可由(U_aV)_nU_b表示(就此而言，V为胞苷(C)、鸟苷(G)或腺苷(A)中的一种)。

实验例11根据间隔序列长度的插入缺失效率比较

为了根据间隔序列的长度比较插入缺失效率，将DYtarget2和DYtarget10用作靶核酸，将富含U的尾序列固定为U4AU6，然后通过改变间隔序列长度进行实验。靶核酸的原间隔序列和各PAM序列在表23中公开。

[表23]

实验例11中使用的靶核酸序列

1)根据实验例1-2制备了包含编码人密码子优化的Cas14a1序列的核酸序列的质粒载体。

2)根据实验例1-4制备了能够表达具有各种不同间隔序列长度的工程化单引导RNA的扩增子。编码所述单引导RNA的DNA序列和用于制备扩增子的引物序列在表24和表25中示出。

[表24]

实验例11中使用的编码sgRNA的DNA序列

在上表中，对于编码每个靶核酸的sgRNA的DNA序列，sgRNA共有序列-原间隔序列-富含U的尾序列以5′-3′的方向连接，sgRNA共有序列中的支架序列为SEQ ID NO：254的一部分序列。能够表达所述(工程化的)单引导RNA的扩增子序列为其中U6启动子可操作地连接至编码所述sgRNA的DNA序列的扩增子序列。

[表25]

实验例11中使用的引物序列

3)通过实验例1-9中公开的方法，用包含Cas14a1序列的质粒载体和单引导RNA的扩增子对根据实验例1-8培养的HEK-293 T细胞进行转染。

4)通过实验例1-12至实验例1-14中公开的方法分析每个实施例的靶核酸的插入缺失效率。插入缺失效率分析结果在图8中示出。

实验例12确认具有富含U的尾的V型CRISPR/Cas系统的细胞内基因切割活性

为了确认在实验例中使用的工程化CRISPR/Cas14a系统以外的V型CRISPR/Cas系统中引入富含U的尾序列时，基因切割活性是否增强，在归类为CRISPR/Cas 12f1系统的CRISPR/SpCas 12f1系统和CRISPR/AsCas 12f1系统(Karvelis等，Nucleic AcidsResearch，Vol.48，No.9 5017(2020))上进行了以下实验。

实验例12-1确认SpCas12f1和AsCas12f1蛋白的细胞内表达

为了确认将编码SpCas12f1和AsCas12f1蛋白的载体引入真核细胞中时，SpCas12f1和AsCas12f1蛋白在真核细胞中是否正常表达，通过实验例1-13中公开的方法确认SpCas12f1和AsCas12f1蛋白的表达。在这方面，SpCas12f1和AsCas12f1蛋白的氨基酸序列和编码所述氨基酸序列的人密码子优化核酸序列在表26中示出。

[表26]

SpCas12f1和AsCas12f1蛋白的序列信息

作为实验的结果，确认了SpCas12f1蛋白和AsCas12f1蛋白在HEK293T细胞中正确表达(图9)。

实验例12-2确认具有富含U的尾的工程化CRISPR/SpCas12f1和CRISPR/AsCas12f1 系统的细胞内基因切割活性

为了确认具有富含U的尾序列的工程化CRISPR/SpCas12f1系统和CRISPR/AsCas12f1系统的基因切割活性，使用各种基因序列作为靶核酸进行实验。靶核酸的原间隔序列和各PAM序列在表27中公开。

[表27]

实验例12中使用的靶核酸

靶核酸	靶核酸的原间隔序列(5′-3′)	PAM
			DYtarget2	CACACACACAGTGGGCTACC(SEQ ID NO：63)	TTTG
VEGFA-3	GGGGTGACCGCCGGAGCGCG(SEQ ID NO：286)	TTTG

1)根据实验例1-2制备包含编码SpCas12f1和AsCas12f1蛋白的人密码子优化序列的质粒载体。

2)根据实验例1-2，制备表达tracrRNA的质粒载体和表达野生型crRNA或具有富含U的尾序列的(工程化的)crRNA的质粒载体。编码所述tracrRNA和crRNA的DNA序列以及用于制备质粒载体的引物序列示于表28-表30。

[表28]

实验例12的编码tracrRNA的DNA序列

CRISPR/SpCas12f1和CRISPR/AsCas12f1系统具有相同的tracrRNA序列。表达所述tracrRNA的质粒载体序列为其中U6启动子可操作地连接至编码所述tracrRNA的DNA序列的质粒载体序列。

[表29]

实验例12的编码crRNA的DNA序列

在上表中，对于编码每个靶核酸的crRNA的DNA序列，crRNA共有序列-原间隔序列-富含U的尾序列以5′-3′的方向连接。表达所述crRNA的质粒载体序列为其中U6启动子可操作地连接至编码所述crRNA的DNA 序列的质粒载体序列。

[表30]

实验例12中使用的引物序列

3)通过实验例1-9中公开的方法，用含有编码SpCas12f1蛋白和AsCas12f1蛋白的核酸序列的质粒载体、tracrRNA的质粒载体以及crRNA的质粒载体对根据实验例1-8培养的HEK-293 T细胞进行转染。

4)通过实验例1-12至实验例1-14中公开的方法分析每个实施例的靶核酸的插入缺失效率。插入缺失效率分析结果在表31中示出。

[表31]

实验例12的插入缺失效率分析结果

作为实验的结果，在其中引入了富含U的尾序列的工程化CRISPR/SpCas12f1系统或工程化CRISPR/AsCas12f1系统中没有观测到显著的插入缺失效率。总之，虽然证实了SpCas12f1和AsCas12f1蛋白在真核细胞中表达(图9)，但没有显示出显著的插入缺失效率，因此可看出，即使将富含U的尾引入CRISPR/SpCas12f1系统和CRISPR/AsCas12f1系统时，基因切割活性不受影响。

[工业适用性]

本公开提供了可用于基因编辑技术的CRISPR/Cas12f1系统，特别是通过引入富含U的尾序列来提高基因编辑效率的工程化CRISPR/Cas12f1系统。

当用于基因编辑时，根据本公开的具有富含U的尾序列的工程化CRISPR/Cas12f1系统表现出比野生型CRISPR/Cas12f1系统更高的基因编辑效率。

<110> 基恩科雷有限责任公司

<120> 用于增加CRISPR/Cas12f1系统的效率的工程化引导RNA及其用途

<130> CP20-201

<160> 325

<170> KoPatentIn 3.0

<210> 1

<211> 1680

<212> DNA

<213> 人工序列

<220>

<223> 人密码子优化的Cas14a1

<400> 1

ccaaagaaga agcggaaggt cggtatccac ggagtcccag cagccatggc caagaacaca 60

attacaaaga cactgaagct gaggatcgtg agaccataca acagcgctga ggtcgagaag 120

attgtggctg atgaaaagaa caacagggaa aagatcgccc tcgagaagaa caaggataag 180

gtgaaggagg cctgctctaa gcacctgaaa gtggccgcct actgcaccac acaggtggag 240

aggaacgcct gtctgttttg taaagctcgg aagctggatg ataagtttta ccagaagctg 300

cggggccagt tccccgatgc cgtcttttgg caggagatta gcgagatctt cagacagctg 360

cagaagcagg ccgccgagat ctacaaccag agcctgatcg agctctacta cgagatcttc 420

atcaagggca agggcattgc caacgcctcc tccgtggagc actacctgag cgacgtgtgc 480

tacacaagag ccgccgagct ctttaagaac gccgctatcg cttccgggct gaggagcaag 540

attaagagta acttccggct caaggagctg aagaacatga agagcggcct gcccactaca 600

aagagcgaca acttcccaat tccactggtg aagcagaagg ggggccagta cacagggttc 660

gagatttcca accacaacag cgactttatt attaagatcc cctttggcag gtggcaggtc 720

aagaaggaga ttgacaagta caggccctgg gagaagtttg atttcgagca ggtgcagaag 780

agccccaagc ctatttccct gctgctgtcc acacagcggc ggaagaggaa caaggggtgg 840

tctaaggatg aggggaccga ggccgagatt aagaaagtga tgaacggcga ctaccagaca 900

agctacatcg aggtcaagcg gggcagtaag attggcgaga agagcgcctg gatgctgaac 960

ctgagcattg acgtgccaaa gattgataag ggcgtggatc ccagcatcat cggagggatc 1020

gatgtggggg tcaagagccc cctcgtgtgc gccatcaaca acgccttcag caggtacagc 1080

atctccgata acgacctgtt ccactttaac aagaagatgt tcgcccggcg gaggattttg 1140

ctcaagaaga accggcacaa gcgggccgga cacggggcca agaacaagct caagcccatc 1200

actatcctga ccgagaagag cgagaggttc aggaagaagc tcatcgagag atgggcctgc 1260

gagatcgccg atttctttat taagaacaag gtcggaacag tgcagatgga gaacctcgag 1320

agcatgaaga ggaaggagga ttcctacttc aacattcggc tgagggggtt ctggccctac 1380

gctgagatgc agaacaagat tgagtttaag ctgaagcagt acgggattga gatccggaag 1440

gtggccccca acaacaccag caagacctgc agcaagtgcg ggcacctcaa caactacttc 1500

aacttcgagt accggaagaa gaacaagttc ccacacttca agtgcgagaa gtgcaacttt 1560

aaggagaacg ccgattacaa cgccgccctg aacatcagca accctaagct gaagagcact 1620

aaggaggagc ccaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag 1680

1680

<210> 2

<211> 3009

<212> DNA

<213> 人工序列

<220>

<223> 脱氨酶融合Cas14a1

<400> 2

ccaaagaaga agcggaaagt ctcctcagag actgggcctg tcgccgtcga tccaaccctg 60

cgccgccgga ttgaacctca cgagtttgaa gtgttctttg acccccggga gctgagaaag 120

gagacatgcc tgctgtacga gatcaactgg ggaggcaggc actccatctg gaggcacacc 180

tctcagaaca caaataagca cgtggaggtg aacttcatcg agaagtttac cacagagcgg 240

tacttctgcc ccaataccag atgtagcatc acatggtttc tgagctggtc cccttgcgga 300

gagtgtagca gggccatcac cgagttcctg tccagatatc cacacgtgac actgtttatc 360

tacatcgcca ggctgtatca ccacgcagac ccaaggaata ggcagggcct gcgcgatctg 420

atcagctccg gcgtgaccat ccagatcatg acagagcagg agtccggcta ctgctggcgg 480

aacttcgtga attattctcc tagcaacgag gcccactggc ctaggtaccc acacctgtgg 540

gtgcgcctgt acgtgctgga gctgtattgc atcatcctgg gcctgccccc ttgtctgaat 600

atcctgcgga gaaagcagcc ccagctgacc ttctttacaa tcgccctgca gtcttgtcac 660

tatcagaggc tgccacccca catcctgtgg gccacaggcc tgaagtctgg aggatctagc 720

ggaggatcct ctggcagcga gacaccagga acaagcgagt cagcaacacc agagagcagt 780

ggcggcagca gcggcggcag catggccaag aacacaatta caaagacact gaagctgagg 840

atcgtgagac catacaacag cgctgaggtc gagaagattg tggctgatga aaagaacaac 900

agggaaaaga tcgccctcga gaagaacaag gataaggtga aggaggcctg ctctaagcac 960

ctgaaagtgg ccgcctactg caccacacag gtggagagga acgcctgtct gttttgtaaa 1020

gctcggaagc tggatgataa gttttaccag aagctgcggg gccagttccc cgatgccgtc 1080

ttttggcagg agattagcga gatcttcaga cagctgcaga agcaggccgc cgagatctac 1140

aaccagagcc tgatcgagct ctactacgag atcttcatca agggcaaggg cattgccaac 1200

gcctcctccg tggagcacta cctgagcgac gtgtgctaca caagagccgc cgagctcttt 1260

aagaacgccg ctatcgcttc cgggctgagg agcaagatta agagtaactt ccggctcaag 1320

gagctgaaga acatgaagag cggcctgccc actacaaaga gcgacaactt cccaattcca 1380

ctggtgaagc agaagggggg ccagtacaca gggttcgaga tttccaacca caacagcgac 1440

tttattatta agatcccctt tggcaggtgg caggtcaaga aggagattga caagtacagg 1500

ccctgggaga agtttgattt cgagcaggtg cagaagagcc ccaagcctat ttccctgctg 1560

ctgtccacac agcggcggaa gaggaacaag gggtggtcta aggatgaggg gaccgaggcc 1620

gagattaaga aagtgatgaa cggcgactac cagacaagct acatcgaggt caagcggggc 1680

agtaagattg gcgagaagag cgcctggatg ctgaacctga gcattgacgt gccaaagatt 1740

gataagggcg tggatcccag catcatcgga gggatcgatg tgggggtcaa gagccccctc 1800

gtgtgcgcca tcaacaacgc cttcagcagg tacagcatct ccgataacga cctgttccac 1860

tttaacaaga agatgttcgc ccggcggagg attttgctca agaagaaccg gcacaagcgg 1920

gccggacacg gggccaagaa caagctcaag cccatcacta tcctgaccga gaagagcgag 1980

aggttcagga agaagctcat cgagagatgg gcctgcgaga tcgccgattt ctttattaag 2040

aacaaggtcg gaacagtgca gatggagaac ctcgagagca tgaagaggaa ggaggattcc 2100

tacttcaaca ttcggctgag ggggttctgg ccctacgctg agatgcagaa caagattgag 2160

tttaagctga agcagtacgg gattgagatc cggaaggtgg cccccaacaa caccagcaag 2220

acctgcagca agtgcgggca cctcaacaac tacttcaact tcgagtaccg gaagaagaac 2280

aagttcccac acttcaagtg cgagaagtgc aactttaagg agaacgccga ttacaacgcc 2340

gccctgaaca tcagcaaccc taagctgaag agcactaagg aggagcccag cggcgggagc 2400

ggcgggagcg gggggagcac taatctgagc gacatcattg agaaggagac tgggaaacag 2460

ctggtcattc aggagtccat cctgatgctg cctgaggagg tggaggaagt gatcggcaac 2520

aagccagagt ctgacatcct ggtgcacacc gcctacgacg agtccacaga tgagaatgtg 2580

atgctgctga cctctgacgc ccccgagtat aagccttggg ccctggtcat ccaggattct 2640

aacggcgaga ataagatcaa gatgctgagc ggaggatccg gaggatctgg aggcagcacc 2700

aacctgtctg acatcatcga gaaggagaca ggcaagcagc tggtcatcca ggagagcatc 2760

ctgatgctgc ccgaagaagt cgaagaagtg atcggaaaca agcctgagag cgatatcctg 2820

gtccataccg cctacgacga gagtaccgac gaaaatgtga tgctgctgac atccgacgcc 2880

ccagagtata agccctgggc tctggtcatc caggattcca acggagagaa caaaatcaaa 2940

atgctgtctg gcggctcaaa aagaaccgcc gacggcagcg aattcgagcc caagaagaag 3000

aggaaagtc 3009

<210> 3

<211> 10

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 3

uuuuuuuuuu 10

<210> 4

<211> 10

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 4

uuuuauuuuu 10

<210> 5

<211> 11

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 5

uuuuauuuuu u 11

<210> 6

<211> 12

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 6

uuuuauuuuu uu 12

<210> 7

<211> 13

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 7

uuuuauuuuu uuu 13

<210> 8

<211> 14

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 8

uuuuauuuuu uuuu 14

<210> 9

<211> 15

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 9

uuuuauuuuu uuuuu 15

<210> 10

<211> 10

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 10

uuuauuuauu 10

<210> 11

<211> 11

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 11

uuuauuuauu u 11

<210> 12

<211> 12

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 12

uuuauuuauu uu 12

<210> 13

<211> 13

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 13

uuuauuuauu uuu 13

<210> 14

<211> 14

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 14

uuuauuuauu uuuu 14

<210> 15

<211> 10

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 15

uuuuauuuua 10

<210> 16

<211> 11

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 16

uuuuauuuua u 11

<210> 17

<211> 12

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 17

uuuuauuuua uu 12

<210> 18

<211> 13

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 18

uuuuauuuua uuu 13

<210> 19

<211> 14

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 19

uuuuauuuua uuuu 14

<210> 20

<211> 15

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 20

uuuuauuuua uuuuu 15

<210> 21

<211> 16

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 21

uuuuauuuua uuuuuu 16

<210> 22

<211> 10

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 22

uuuuguuuuu 10

<210> 23

<211> 11

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 23

uuuuguuuuu u 11

<210> 24

<211> 12

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 24

uuuuguuuuu uu 12

<210> 25

<211> 13

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 25

uuuuguuuuu uuu 13

<210> 26

<211> 14

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 26

uuuuguuuuu uuuu 14

<210> 27

<211> 15

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 27

uuuuguuuuu uuuuu 15

<210> 28

<211> 10

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 28

uuuguuuguu 10

<210> 29

<211> 11

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 29

uuuguuuguu u 11

<210> 30

<211> 12

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 30

uuuguuuguu uu 12

<210> 31

<211> 13

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 31

uuuguuuguu uuu 13

<210> 32

<211> 14

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 32

uuuguuuguu uuuu 14

<210> 33

<211> 10

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 33

uuuuguuuug 10

<210> 34

<211> 11

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 34

uuuuguuuug u 11

<210> 35

<211> 12

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 35

uuuuguuuug uu 12

<210> 36

<211> 13

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 36

uuuuguuuug uuu 13

<210> 37

<211> 14

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 37

uuuuguuuug uuuu 14

<210> 38

<211> 15

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 38

uuuuguuuug uuuuu 15

<210> 39

<211> 16

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 39

uuuuguuuug uuuuuu 16

<210> 40

<211> 10

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 40

uuuucuuuuu 10

<210> 41

<211> 11

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 41

uuuucuuuuu u 11

<210> 42

<211> 12

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 42

uuuucuuuuu uu 12

<210> 43

<211> 13

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 43

uuuucuuuuu uuu 13

<210> 44

<211> 14

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 44

uuuucuuuuu uuuu 14

<210> 45

<211> 15

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 45

uuuucuuuuu uuuuu 15

<210> 46

<211> 10

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 46

uuucuuucuu 10

<210> 47

<211> 11

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 47

uuucuuucuu u 11

<210> 48

<211> 12

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 48

uuucuuucuu uu 12

<210> 49

<211> 13

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 49

uuucuuucuu uuu 13

<210> 50

<211> 14

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 50

uuucuuucuu uuuu 14

<210> 51

<211> 10

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 51

uuuucuuuuc 10

<210> 52

<211> 11

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 52

uuuucuuuuc u 11

<210> 53

<211> 12

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 53

uuuucuuuuc uu 12

<210> 54

<211> 13

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 54

uuuucuuuuc uuu 13

<210> 55

<211> 14

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 55

uuuucuuuuc uuuu 14

<210> 56

<211> 15

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 56

uuuucuuuuc uuuuu 15

<210> 57

<211> 16

<212> RNA

<213> 人工序列

<220>

<223> 富含U的尾序列

<400> 57

uuuucuuuuc uuuuuu 16

<210> 58

<211> 37

<212> RNA

<213> 未鉴别的古细菌

<400> 58

guugcagaac ccgaauagac gaaugaagga augcaac 37

<210> 59

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 用于CRISPR/Cas14a1系统的编码CRISPR RNA重复序列的DNA序列

<400> 59

gttgcagaac ccgaatagac gaatgaagga atgcaac 37

<210> 60

<211> 161

<212> RNA

<213> 未鉴别的古细菌

<400> 60

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca a 161

<210> 61

<211> 161

<212> DNA

<213> 人工序列

<220>

<223> 用于CRISPR/Cas14a1系统的编码tracrRNA序列的DNA序列

<400> 61

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca a 161

<210> 62

<211> 20

<212> DNA

<213> 智人

<400> 62

cacgtctcat atgccccttg 20

<210> 63

<211> 20

<212> DNA

<213> 智人

<400> 63

cacacacaca gtgggctacc 20

<210> 64

<211> 20

<212> DNA

<213> 智人

<400> 64

gacgtgggag acacacacac 20

<210> 65

<211> 20

<212> DNA

<213> 智人

<400> 65

catccccagg acacacacac 20

<210> 66

<211> 20

<212> DNA

<213> 智人

<400> 66

agcacatgtg cacacacaca 20

<210> 67

<211> 20

<212> DNA

<213> 智人

<400> 67

agaacacata cccctgggcc 20

<210> 68

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 用于RNF2的间隔序列

<400> 68

cacgucucau augccccuug 20

<210> 69

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget2的间隔序列

<400> 69

cacacacaca gugggcuacc 20

<210> 70

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget9的间隔序列

<400> 70

gacgugggag acacacacac 20

<210> 71

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget10的间隔序列

<400> 71

cauccccagg acacacacac 20

<210> 72

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget13的间隔序列

<400> 72

agcacaugug cacacacaca 20

<210> 73

<211> 20

<212> RNA

<213> 人工序列

<220>

<223> 用于Intergenic-22的间隔序列

<400> 73

agaacacaua ccccugggcc 20

<210> 74

<211> 202

<212> RNA

<213> 人工序列

<220>

<223> 共有sgRNA序列，除了间隔序列和富含U的尾序列

<400> 74

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca ac 202

<210> 75

<211> 222

<212> RNA

<213> 人工序列

<220>

<223> 用于RNF2的sgRNA(WT)

<400> 75

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accacgucuc auaugccccu ug 222

<210> 76

<211> 233

<212> RNA

<213> 人工序列

<220>

<223> 用于RNF2的sgRNA(U4AU6)

<400> 76

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accacgucuc auaugccccu uguuuuauuu uuu 233

<210> 77

<211> 222

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget2的sgRNA(WT)

<400> 77

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accacacaca cagugggcua cc 222

<210> 78

<211> 223

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget2的sgRNA(U)

<400> 78

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accacacaca cagugggcua ccu 223

<210> 79

<211> 224

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget2的sgRNA(U2)

<400> 79

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accacacaca cagugggcua ccuu 224

<210> 80

<211> 225

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget2的sgRNA(U3)

<400> 80

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accacacaca cagugggcua ccuuu 225

<210> 81

<211> 226

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget2的sgRNA(U4)

<400> 81

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuu 226

<210> 82

<211> 227

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget2的sgRNA(U5)

<400> 82

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuu 227

<210> 83

<211> 228

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget2的sgRNA(U6)

<400> 83

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuuu 228

<210> 84

<211> 227

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget2的sgRNA(U4A)

<400> 84

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuua 227

<210> 85

<211> 228

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget2的sgRNA(U4AU)

<400> 85

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuau 228

<210> 86

<211> 229

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget2的sgRNA(U4AU2)

<400> 86

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauu 229

<210> 87

<211> 230

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget2的sgRNA(U4AU3)

<400> 87

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauuu 230

<210> 88

<211> 231

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget2的sgRNA(U4AU4)

<400> 88

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauuu u 231

<210> 89

<211> 232

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget2的sgRNA(U4AU5)

<400> 89

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauuu uu 232

<210> 90

<211> 233

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget2的sgRNA(U4AU6)

<400> 90

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauuu uuu 233

<210> 91

<211> 234

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget2的sgRNA(U4AU7)

<400> 91

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauuu uuuu 234

<210> 92

<211> 235

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget2的sgRNA(U4AU8)

<400> 92

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauuu uuuuu 235

<210> 93

<211> 236

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget2的sgRNA(U4AU9)

<400> 93

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauuu uuuuuu 236

<210> 94

<211> 237

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget2的sgRNA(U4AU10)

<400> 94

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauuu uuuuuuu 237

<210> 95

<211> 232

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget2的sgRNA(U3AU6)

<400> 95

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuauuuu uu 232

<210> 96

<211> 236

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget2的sgRNA(U3AU3AU6)

<400> 96

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuauuua uuuuuu 236

<210> 97

<211> 57

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget2的crRNA(WT)

<400> 97

guugcagaac ccgaauagac gaaugaagga augcaaccac acacacagug ggcuacc 57

<210> 98

<211> 68

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget2的crRNA(U4AU6)

<400> 98

guugcagaac ccgaauagac gaaugaagga augcaaccac acacacagug ggcuaccuuu 60

uauuuuuu 68

<210> 99

<211> 231

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget2的sgRNA(间隔区18nt, U4AU6)

<400> 99

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accacacaca cagugggcua uuuuauuuuu u 231

<210> 100

<211> 232

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget2的sgRNA(间隔区19nt, U4AU6)

<400> 100

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accacacaca cagugggcua cuuuuauuuu uu 232

<210> 101

<211> 234

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget2的sgRNA(间隔区21nt, U4AU6)

<400> 101

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accacacaca cagugggcua ccauuuuauu uuuu 234

<210> 102

<211> 238

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget2的sgRNA(间隔区25nt, U4AU6)

<400> 102

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accacacaca cagugggcua ccauuuauuu uauuuuuu 238

<210> 103

<211> 243

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget2的sgRNA(间隔区30nt, U4AU6)

<400> 103

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accacacaca cagugggcua ccauuuaagg aguuuuauuu 240

uuu 243

<210> 104

<211> 222

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget9的sgRNA(WT)

<400> 104

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca acgacguggg agacacacac ac 222

<210> 105

<211> 233

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget9的sgRNA(U4AU6)

<400> 105

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca acgacguggg agacacacac acuuuuauuu uuu 233

<210> 106

<211> 222

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget10的sgRNA(WT)

<400> 106

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accaucccca ggacacacac ac 222

<210> 107

<211> 233

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget10的sgRNA(U4AU6)

<400> 107

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accaucccca ggacacacac acuuuuauuu uuu 233

<210> 108

<211> 228

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget10的sgRNA(U6)

<400> 108

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accaucccca ggacacacac acuuuuuu 228

<210> 109

<211> 232

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget10的sgRNA(U3AU6)

<400> 109

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accaucccca ggacacacac acuuuauuuu uu 232

<210> 110

<211> 236

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget10的sgRNA(U3AU3AU6)

<400> 110

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accaucccca ggacacacac acuuuauuua uuuuuu 236

<210> 111

<211> 57

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget10的crRNA(WT)

<400> 111

guugcagaac ccgaauagac gaaugaagga augcaaccau ccccaggaca cacacac 57

<210> 112

<211> 68

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget10的crRNA(U4AU6)

<400> 112

guugcagaac ccgaauagac gaaugaagga augcaaccau ccccaggaca cacacacuuu 60

uauuuuuu 68

<210> 113

<211> 230

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget10的sgRNA(间隔区17nt, U4AU6)

<400> 113

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accaucccca ggacacacau uuuauuuuuu 230

<210> 114

<211> 230

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget10的sgRNA(间隔区18nt, U4AU6)

<400> 114

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accaucccca ggacacacau uuuauuuuuu 230

<210> 115

<211> 232

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget10的sgRNA(间隔区19nt, U4AU6)

<400> 115

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accaucccca ggacacacac auuuuauuuu uu 232

<210> 116

<211> 234

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget10的sgRNA(间隔区21nt, U4AU6)

<400> 116

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accaucccca ggacacacac acauuuuauu uuuu 234

<210> 117

<211> 238

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget10的sgRNA(间隔区25nt, U4AU6)

<400> 117

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accaucccca ggacacacac acauuucuuu uauuuuuu 238

<210> 118

<211> 243

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget10的sgRNA(间隔区30nt, U4AU6)

<400> 118

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accaucccca ggacacacac acauuucaaa aguuuuauuu 240

uuu 243

<210> 119

<211> 222

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget13的sgRNA(WT)

<400> 119

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca acagcacaug ugcacacaca ca 222

<210> 120

<211> 233

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget13的sgRNA(U4AU6)

<400> 120

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca acagcacaug ugcacacaca cauuuuauuu uuu 233

<210> 121

<211> 222

<212> RNA

<213> 人工序列

<220>

<223> 用于Intergenic-22的sgRNA(WT)

<400> 121

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca acagaacaca uaccccuggg cc 222

<210> 122

<211> 228

<212> RNA

<213> 人工序列

<220>

<223> 用于Intergenic-22的sgRNA(U6)

<400> 122

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca acagaacaca uaccccuggg ccuuuuuu 228

<210> 123

<211> 233

<212> RNA

<213> 人工序列

<220>

<223> 用于Intergenic-22的sgRNA(U4AU6)

<400> 123

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca acagaacaca uaccccuggg ccuuuuauuu uuu 233

<210> 124

<211> 57

<212> RNA

<213> 人工序列

<220>

<223> 用于Intergenic-22的crRNA(WT)

<400> 124

guugcagaac ccgaauagac gaaugaagga augcaacaga acacauaccc cugggcc 57

<210> 125

<211> 68

<212> RNA

<213> 人工序列

<220>

<223> 用于Intergenic-22的crRNA(U4AU6)

<400> 125

guugcagaac ccgaauagac gaaugaagga augcaacaga acacauaccc cugggccuuu 60

uauuuuuu 68

<210> 126

<211> 202

<212> DNA

<213> 人工序列

<220>

<223> 编码共有sgRNA的DNA序列，除间隔序列和富含U的尾序列外

<400> 126

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca ac 202

<210> 127

<211> 222

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向RNF2(WT)

<400> 127

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accacgtctc atatgcccct tg 222

<210> 128

<211> 233

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向RNF2(U4AU6)

<400> 128

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accacgtctc atatgcccct tgttttattt ttt 233

<210> 129

<211> 222

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget2(WT)

<400> 129

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accacacaca cagtgggcta cc 222

<210> 130

<211> 223

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U)

<400> 130

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accacacaca cagtgggcta cct 223

<210> 131

<211> 224

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U2)

<400> 131

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accacacaca cagtgggcta cctt 224

<210> 132

<211> 225

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U3)

<400> 132

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accacacaca cagtgggcta ccttt 225

<210> 133

<211> 226

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U4)

<400> 133

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accacacaca cagtgggcta cctttt 226

<210> 134

<211> 227

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U5)

<400> 134

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttt 227

<210> 135

<211> 228

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U6)

<400> 135

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accacacaca cagtgggcta cctttttt 228

<210> 136

<211> 227

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U4A)

<400> 136

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accacacaca cagtgggcta cctttta 227

<210> 137

<211> 228

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U4AU)

<400> 137

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttat 228

<210> 138

<211> 229

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U4AU2)

<400> 138

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttatt 229

<210> 139

<211> 230

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U4AU3)

<400> 139

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttattt 230

<210> 140

<211> 231

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U4AU4)

<400> 140

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttattt t 231

<210> 141

<211> 232

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U4AU5)

<400> 141

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttattt tt 232

<210> 142

<211> 233

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U4AU6)

<400> 142

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttattt ttt 233

<210> 143

<211> 234

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U4AU7)

<400> 143

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttattt tttt 234

<210> 144

<211> 235

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U4AU8)

<400> 144

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttattt ttttt 235

<210> 145

<211> 236

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U4AU9)

<400> 145

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttattt tttttt 236

<210> 146

<211> 237

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U4AU10)

<400> 146

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttattt ttttttt 237

<210> 147

<211> 232

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U3AU6)

<400> 147

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accacacaca cagtgggcta cctttatttt tt 232

<210> 148

<211> 236

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U3AU3AU6)

<400> 148

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accacacaca cagtgggcta cctttattta tttttt 236

<210> 149

<211> 57

<212> DNA

<213> 人工序列

<220>

<223> 编码crRNA的DNA序列, 靶向DYtarget2(WT)

<400> 149

gttgcagaac ccgaatagac gaatgaagga atgcaaccac acacacagtg ggctacc 57

<210> 150

<211> 68

<212> DNA

<213> 人工序列

<220>

<223> 编码crRNA的DNA序列, 靶向DYtarget2(U4AU6)

<400> 150

gttgcagaac ccgaatagac gaatgaagga atgcaaccac acacacagtg ggctaccttt 60

tatttttt 68

<210> 151

<211> 231

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget2(间隔区18nt,

U4AU6)

<400> 151

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accacacaca cagtgggcta ttttattttt t 231

<210> 152

<211> 232

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget2(间隔区19nt,

U4AU6)

<400> 152

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accacacaca cagtgggcta cttttatttt tt 232

<210> 153

<211> 234

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget2(间隔区21nt,

U4AU6)

<400> 153

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accacacaca cagtgggcta ccattttatt tttt 234

<210> 154

<211> 238

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget2(间隔区25nt,

U4AU6)

<400> 154

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accacacaca cagtgggcta ccatttattt tatttttt 238

<210> 155

<211> 243

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget2(间隔区30nt,

U4AU6)

<400> 155

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accacacaca cagtgggcta ccatttaagg agttttattt 240

ttt 243

<210> 156

<211> 222

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget9(WT)

<400> 156

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca acgacgtggg agacacacac ac 222

<210> 157

<211> 233

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget9(U4AU6)

<400> 157

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca acgacgtggg agacacacac acttttattt ttt 233

<210> 158

<211> 222

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget10(WT)

<400> 158

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accatcccca ggacacacac ac 222

<210> 159

<211> 233

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget10(U4AU6)

<400> 159

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accatcccca ggacacacac acttttattt ttt 233

<210> 160

<211> 228

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget10(U6)

<400> 160

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accatcccca ggacacacac actttttt 228

<210> 161

<211> 232

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget10(U3AU6)

<400> 161

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accatcccca ggacacacac actttatttt tt 232

<210> 162

<211> 236

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget10(U3AU3AU6)

<400> 162

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accatcccca ggacacacac actttattta tttttt 236

<210> 163

<211> 57

<212> DNA

<213> 人工序列

<220>

<223> 编码crRNA的DNA序列, 靶向DYtarget10(WT)

<400> 163

gttgcagaac ccgaatagac gaatgaagga atgcaaccat ccccaggaca cacacac 57

<210> 164

<211> 68

<212> DNA

<213> 人工序列

<220>

<223> 编码crRNA的DNA序列, 靶向DYtarget10(U4AU6)

<400> 164

gttgcagaac ccgaatagac gaatgaagga atgcaaccat ccccaggaca cacacacttt 60

tatttttt 68

<210> 165

<211> 230

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget10(间隔区17nt,

U4AU6)

<400> 165

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accatcccca ggacacacat tttatttttt 230

<210> 166

<211> 231

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget10(间隔区18nt,

U4AU6)

<400> 166

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accatcccca ggacacacac ttttattttt t 231

<210> 167

<211> 232

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget10(间隔区19nt,

U4AU6)

<400> 167

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accatcccca ggacacacac attttatttt tt 232

<210> 168

<211> 234

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget10(间隔区21nt,

U4AU6)

<400> 168

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accatcccca ggacacacac acattttatt tttt 234

<210> 169

<211> 238

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget10(间隔区25nt,

U4AU6)

<400> 169

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accatcccca ggacacacac acatttcttt tatttttt 238

<210> 170

<211> 243

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget10(间隔区30nt,

U4AU6)

<400> 170

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accatcccca ggacacacac acatttcaaa agttttattt 240

ttt 243

<210> 171

<211> 222

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget13(WT)

<400> 171

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca acagcacatg tgcacacaca ca 222

<210> 172

<211> 233

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向DYtarget13(U4AU6)

<400> 172

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca acagcacatg tgcacacaca cattttattt ttt 233

<210> 173

<211> 222

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向Intergenic-22(WT)

<400> 173

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca acagaacaca tacccctggg cc 222

<210> 174

<211> 228

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向Intergenic-22(U6)

<400> 174

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca acagaacaca tacccctggg cctttttt 228

<210> 175

<211> 233

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列, 靶向Intergenic-22(U4AU6)

<400> 175

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca acagaacaca tacccctggg ccttttattt ttt 233

<210> 176

<211> 57

<212> DNA

<213> 人工序列

<220>

<223> 编码crRNA的DNA序列, 靶向Intergenic-22(WT)

<400> 176

gttgcagaac ccgaatagac gaatgaagga atgcaacaga acacataccc ctgggcc 57

<210> 177

<211> 68

<212> DNA

<213> 人工序列

<220>

<223> 编码crRNA的DNA序列, 靶向Intergenic-22(U4AU6)

<400> 177

gttgcagaac ccgaatagac gaatgaagga atgcaacaga acacataccc ctgggccttt 60

tatttttt 68

<210> 178

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 正向引物，以合成用于RNF2的sgRNA

<400> 178

gccaacatac agaagtcagg aa 22

<210> 179

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 正向引物，以合成用于DYtarget2的sgRNA扩增子

<400> 179

ccaggccatt tctcagggtt 20

<210> 180

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 正向引物，以合成用于DYtarget9的sgRNA扩增子

<400> 180

gtacagcttc ccagactccg 20

<210> 181

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 正向引物，以合成用于DYtarget10的sgRNA扩增子

<400> 181

tgctccagga acctcaccta 20

<210> 182

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 正向引物，以合成用于DYtarget13的sgRNA扩增子

<400> 182

gccttccccc acctttcttt 20

<210> 183

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> U6正向引物，以合成sgRNA

<400> 183

gagggcctat ttcccatgat t 21

<210> 184

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 正向引物，以合成tracrRNA

<400> 184

gagggcctat ttcccatgat t 21

<210> 185

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于RNF2的sgRNA扩增子(WT)

<400> 185

tgtgcagaca aacggaactc 20

<210> 186

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于RNF2的sgRNA扩增子(U4AU6)

<400> 186

aaaaaataaa atgtgcagac aaacggaact c 31

<210> 187

<211> 45

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget2的sgRNA扩增子(WT)

<400> 187

ggtagcccac tgtgtgtgtg gttgcattcc ttcattcgtc tattc 45

<210> 188

<211> 46

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget2的sgRNA扩增子(U)

<400> 188

aggtagccca ctgtgtgtgt ggttgcattc cttcattcgt ctattc 46

<210> 189

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget2的sgRNA扩增子(U2)

<400> 189

aaggtagccc actgtgtgtg tggttgcatt ccttcattcg tctattc 47

<210> 190

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget2的sgRNA扩增子(U3)

<400> 190

aaaggtagcc cactgtgtgt gtggttgcat tccttcattc gtctattc 48

<210> 191

<211> 49

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget2的sgRNA扩增子(U4)

<400> 191

aaaaggtagc ccactgtgtg tgtggttgca ttccttcatt cgtctattc 49

<210> 192

<211> 50

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget2的sgRNA扩增子(U5)

<400> 192

aaaaaggtag cccactgtgt gtgtggttgc attccttcat tcgtctattc 50

<210> 193

<211> 51

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget2的sgRNA扩增子(U6)

<400> 193

aaaaaaggta gcccactgtg tgtgtggttg cattccttca ttcgtctatt c 51

<210> 194

<211> 50

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget2的sgRNA扩增子(U4A)

<400> 194

taaaaggtag cccactgtgt gtgtggttgc attccttcat tcgtctattc 50

<210> 195

<211> 51

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget2的sgRNA扩增子(U4AU)

<400> 195

ataaaaggta gcccactgtg tgtgtggttg cattccttca ttcgtctatt c 51

<210> 196

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget2的sgRNA扩增子(U4AU2)

<400> 196

aataaaaggt agcccactgt gtgtgtggtt gcattccttc attcgtctat tc 52

<210> 197

<211> 53

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget2的sgRNA扩增子(U4AU3)

<400> 197

aaataaaagg tagcccactg tgtgtgtggt tgcattcctt cattcgtcta ttc 53

<210> 198

<211> 54

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget2的sgRNA扩增子(U4AU4)

<400> 198

aaaataaaag gtagcccact gtgtgtgtgg ttgcattcct tcattcgtct attc 54

<210> 199

<211> 55

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget2的sgRNA扩增子(U4AU5)

<400> 199

aaaaataaaa ggtagcccac tgtgtgtgtg gttgcattcc ttcattcgtc tattc 55

<210> 200

<211> 56

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget2的sgRNA扩增子(U4AU6)

<400> 200

aaaaaataaa aggtagccca ctgtgtgtgt ggttgcattc cttcattcgt ctattc 56

<210> 201

<211> 57

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget2的sgRNA扩增子(U4AU7)

<400> 201

aaaaaaataa aaggtagccc actgtgtgtg tggttgcatt ccttcattcg tctattc 57

<210> 202

<211> 58

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget2的sgRNA扩增子(U4AU8)

<400> 202

aaaaaaaata aaaggtagcc cactgtgtgt gtggttgcat tccttcattc gtctattc 58

<210> 203

<211> 59

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget2的sgRNA扩增子(U4AU9)

<400> 203

aaaaaaaaat aaaaggtagc ccactgtgtg tgtggttgca ttccttcatt cgtctattc 59

<210> 204

<211> 60

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget2的sgRNA扩增子(U4AU10)

<400> 204

aaaaaaaaaa taaaaggtag cccactgtgt gtgtggttgc attccttcat tcgtctattc 60

60

<210> 205

<211> 55

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget2的sgRNA扩增子(U3AU6)

<400> 205

aaaaaataaa ggtagcccac tgtgtgtgtg gttgcattcc ttcattcgtc tattc 55

<210> 206

<211> 59

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget2的sgRNA扩增子(U3AU3AU6)

<400> 206

aaaaaataaa taaaggtagc ccactgtgtg tgtggttgca ttccttcatt cgtctattc 59

<210> 207

<211> 45

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget2的crRNA扩增子(WT)

<400> 207

ggtagcccac tgtgtgtgtg gttgcattcc ttcattcgtc tattc 45

<210> 208

<211> 56

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget2的crRNA扩增子(U4AU6)

<400> 208

aaaaaataaa aggtagccca ctgtgtgtgt ggttgcattc cttcattcgt ctattc 56

<210> 209

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget2的sgRNA扩增子(间隔区

18nt, U4AU6)

<400> 209

aaaaaataaa atagcccact gtgtgtgtgg ttgcattcct 40

<210> 210

<211> 41

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget2的sgRNA扩增子(间隔区

19nt, U4AU6)

<400> 210

aaaaaataaa agtagcccac tgtgtgtgtg gttgcattcc t 41

<210> 211

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget2的sgRNA扩增子(间隔区

21nt, U4AU6)

<400> 211

aaaaaataaa atggtagccc actgtgtgtg tggttgcatt cct 43

<210> 212

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget2的sgRNA扩增子(间隔区

25nt, U4AU6)

<400> 212

aaaaaataaa ataaatggta gcccactgtg tgtgtggttg cattcct 47

<210> 213

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget2的sgRNA扩增子(间隔区

30nt, U4AU6)

<400> 213

aaaaaataaa actccttaaa tggtagccca ctgtgtgtgt ggttgcattc ct 52

<210> 214

<211> 45

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget9的sgRNA扩增子(WT)

<400> 214

gtgtgtgtgt ctcccacgtc gttgcattcc ttcattcgtc tattc 45

<210> 215

<211> 55

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget9的sgRNA扩增子(U4AU6)

<400> 215

aaaaaataaa atgtgtgtgt ctcccacgtc gttgcattcc ttcattcgtc tattc 55

<210> 216

<211> 45

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget10的sgRNA扩增子(WT)

<400> 216

gtgtgtgtgt cctggggatg gttgcattcc ttcattcgtc tattc 45

<210> 217

<211> 55

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget10的sgRNA扩增子(U4AU6)

<400> 217

aaaaaataaa atgtgtgtgt cctggggatg gttgcattcc ttcattcgtc tattc 55

<210> 218

<211> 50

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget10的sgRNA扩增子(U6)

<400> 218

aaaaaatgtg tgtgtcctgg ggatggttgc attccttcat tcgtctattc 50

<210> 219

<211> 54

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget10的sgRNA扩增子(U3AU6)

<400> 219

aaaaaataaa tgtgtgtgtc ctggggatgg ttgcattcct tcattcgtct attc 54

<210> 220

<211> 58

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget10的sgRNA扩增子(U3AU3AU6)

<400> 220

aaaaaataaa taaatgtgtg tgtcctgggg atggttgcat tccttcattc gtctattc 58

<210> 221

<211> 45

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget10的crRNA扩增子(WT)

<400> 221

gtgtgtgtgt cctggggatg gttgcattcc ttcattcgtc tattc 45

<210> 222

<211> 56

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget10的crRNA扩增子(U4AU6)

<400> 222

aaaaataaaa gtgtgtgtgt cctggggatg gttgcattcc ttcattcgtc atattc 56

<210> 223

<211> 39

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget10的sgRNA扩增子(间隔区

17nt, U4AU6)

<400> 223

aaaaaataaa atgtgtgtcc tggggatggt tgcattcct 39

<210> 224

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget10的sgRNA扩增子(间隔区

18nt, U4AU6)

<400> 224

aaaaaataaa agtgtgtgtc ctggggatgg ttgcattcct 40

<210> 225

<211> 41

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget10的sgRNA扩增子(间隔区

19nt, U4AU6)

<400> 225

aaaaaataaa atgtgtgtgt cctggggatg gttgcattcc t 41

<210> 226

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget10的sgRNA扩增子(间隔区

21nt, U4AU6)

<400> 226

aaaaaataaa atgtgtgtgt gtcctgggga tggttgcatt cct 43

<210> 227

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget10的sgRNA扩增子(间隔区

25nt, U4AU6)

<400> 227

aaaaaataaa agaaatgtgt gtgtgtcctg gggatggttg cattcct 47

<210> 228

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget10的sgRNA扩增子(间隔区

30nt, U4AU6)

<400> 228

aaaaaataaa acttttgaaa tgtgtgtgtg tcctggggat ggttgcattc ct 52

<210> 229

<211> 45

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget13的sgRNA扩增子(WT)

<400> 229

tgtgtgtgtg cacatgtgct gttgcattcc ttcattcgtc tattc 45

<210> 230

<211> 55

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于DYtarget13的sgRNA扩增子(U4AU6)

<400> 230

aaaaaataaa agtgtgtgtg cacatgtgct gttgcattcc ttcattcgtc tattc 55

<210> 231

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于Intergenic-22的sgRNA扩增子(WT)

<400> 231

ggcccagggg tatgtgttct gttgcattcc t 31

<210> 232

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于Intergenic-22的sgRNA扩增子(U6)

<400> 232

aaaaaaggcc caggggtatg tgttctgttg cattcct 37

<210> 233

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于Intergenic-22的sgRNA扩增子(U4AU6)

<400> 233

aaaaaataaa aggcccaggg gtatgtgttc tgttgcattc ct 42

<210> 234

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于Intergenic-22的crRNA扩增子(WT)

<400> 234

ggcccagggg tatgtgttct gttgcattcc t 31

<210> 235

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成用于Intergenic-22的crRNA扩增子(U4AU6)

<400> 235

aaaaaataaa aggcccaggg gtatgtgttc tgttgcattc ct 42

<210> 236

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，以合成tracrRNA扩增子

<400> 236

ttgtgcagaa ttggagagga 20

<210> 237

<211> 7

<212> PRT

<213> 猴病毒40

<400> 237

Pro Lys Lys Lys Arg Lys Val

1 5

<210> 238

<211> 16

<212> PRT

<213> 小家鼠

<400> 238

Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys

1 5 10 15

<210> 239

<211> 9

<212> PRT

<213> 智人

<400> 239

Pro Ala Ala Lys Arg Val Lys Leu Asp

1 5

<210> 240

<211> 11

<212> PRT

<213> 智人

<400> 240

Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro

1 5 10

<210> 241

<211> 38

<212> PRT

<213> 小家鼠

<400> 241

Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly

1 5 10 15

Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro

20 25 30

Arg Asn Gln Gly Gly Tyr

35

<210> 242

<211> 42

<212> PRT

<213> 智人

<400> 242

Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu

1 5 10 15

Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys

20 25 30

Asp Glu Gln Ile Leu Lys Arg Arg Asn Val

35 40

<210> 243

<211> 8

<212> PRT

<213> 智人

<400> 243

Val Ser Arg Lys Arg Pro Arg Pro

1 5

<210> 244

<211> 8

<212> PRT

<213> 智人

<400> 244

Pro Pro Lys Lys Ala Arg Glu Asp

1 5

<210> 245

<211> 8

<212> PRT

<213> 智人

<400> 245

Pro Gln Pro Lys Lys Lys Pro Leu

1 5

<210> 246

<211> 12

<212> PRT

<213> 小家鼠

<400> 246

Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro

1 5 10

<210> 247

<211> 5

<212> PRT

<213> 流感病毒

<400> 247

Asp Arg Leu Arg Arg

1 5

<210> 248

<211> 7

<212> PRT

<213> 流感病毒

<400> 248

Pro Lys Gln Lys Lys Arg Lys

1 5

<210> 249

<211> 10

<212> PRT

<213> 丁型肝炎病毒

<400> 249

Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu

1 5 10

<210> 250

<211> 10

<212> PRT

<213> 小家鼠

<400> 250

Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg

1 5 10

<210> 251

<211> 20

<212> PRT

<213> 智人

<400> 251

Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys

1 5 10 15

Lys Ser Lys Lys

20

<210> 252

<211> 17

<212> PRT

<213> 智人

<400> 252

Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys

1 5 10 15

Lys

<210> 253

<211> 69

<212> RNA

<213> 人工序列

<220>

<223> 用于sgRNA的支架序列

<400> 253

uucauuuuuc cucuccaauu cugcacaaga aaguugcaga acccgaauag acgaaugaag 60

gaaugcaac 69

<210> 254

<211> 69

<212> DNA

<213> 人工序列

<220>

<223> 编码支架序列的DNA序列, 用于sgRNA

<400> 254

ttcatttttc ctctccaatt ctgcacaaga aaguugcaga acccgaauag acgaaugaag 60

gaaugcaac 69

<210> 255

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 共有crRNA序列

<400> 255

gttgcagaac ccgaatagac gaatgaagga atgcaac 37

<210> 256

<211> 233

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列，用于DYtarget2(T4AT4AT)

<400> 256

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttattt tat 233

<210> 257

<211> 234

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列，用于DYtarget2(T4AT4AT2)

<400> 257

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttattt tatt 234

<210> 258

<211> 56

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，用于DYtarget2的sgRNA扩增子(T4AT4AT)

<400> 258

ataaaataaa aggtagccca ctgtgtgtgt ggttgcattc cttcattcgt ctattc 56

<210> 259

<211> 57

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，用于DYtarget2的sgRNA扩增子(T4AT4AT2)

<400> 259

aataaaataa aaggtagccc actgtgtgtg tggttgcatt ccttcattcg tctattc 57

<210> 260

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 用于CSMD1的原间隔序列

<400> 260

gaataccccc attcttcagg 20

<210> 261

<211> 222

<212> RNA

<213> 人工序列

<220>

<223> 用于CSMD1的sgRNA序列(WT)

<400> 261

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca acgaauaccc ccauucuuca gg 222

<210> 262

<211> 223

<212> RNA

<213> 人工序列

<220>

<223> 用于CSMD1的sgRNA(U)

<400> 262

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca acgaauaccc ccauucuuca ggu 223

<210> 263

<211> 224

<212> RNA

<213> 人工序列

<220>

<223> 用于CSMD1的sgRNA序列(U2)

<400> 263

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguu 224

<210> 264

<211> 225

<212> RNA

<213> 人工序列

<220>

<223> 用于CSMD1的sgRNA序列(U3)

<400> 264

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuu 225

<210> 265

<211> 226

<212> RNA

<213> 人工序列

<220>

<223> 用于CSMD1的sgRNA序列(U4)

<400> 265

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuu 226

<210> 266

<211> 227

<212> RNA

<213> 人工序列

<220>

<223> 用于CSMD1的sgRNA序列(U5)

<400> 266

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuu 227

<210> 267

<211> 228

<212> RNA

<213> 人工序列

<220>

<223> 用于CSMD1的sgRNA序列(U6)

<400> 267

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuuu 228

<210> 268

<211> 227

<212> RNA

<213> 人工序列

<220>

<223> 用于CSMD1的sgRNA序列(U4A)

<400> 268

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuua 227

<210> 269

<211> 228

<212> RNA

<213> 人工序列

<220>

<223> 用于CSMD1的sgRNA序列(U4AU)

<400> 269

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuau 228

<210> 270

<211> 229

<212> RNA

<213> 人工序列

<220>

<223> 用于CSMD1的sgRNA序列(U4AU)

<400> 270

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuauu 229

<210> 271

<211> 230

<212> RNA

<213> 人工序列

<220>

<223> 用于CSMD1的sgRNA序列(U4AU3)

<400> 271

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuauuu 230

<210> 272

<211> 231

<212> RNA

<213> 人工序列

<220>

<223> 用于CSMD1的sgRNA序列(U4AU5)

<400> 272

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuauuu u 231

<210> 273

<211> 232

<212> RNA

<213> 人工序列

<220>

<223> 用于CSMD1的sgRNA序列(U4AU5)

<400> 273

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuauuu uu 232

<210> 274

<211> 233

<212> RNA

<213> 人工序列

<220>

<223> 用于CSMD1的sgRNA序列(U4AU6)

<400> 274

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuauuu uuu 233

<210> 275

<211> 234

<212> RNA

<213> 人工序列

<220>

<223> 用于CSMD1的sgRNA序列(U4AU7)

<400> 275

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuauuu uuuu 234

<210> 276

<211> 235

<212> RNA

<213> 人工序列

<220>

<223> 用于CSMD1的sgRNA序列(U4AU8)

<400> 276

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuauuu uuuuu 235

<210> 277

<211> 236

<212> RNA

<213> 人工序列

<220>

<223> 用于CSMD1的sgRNA序列(U4AU9)

<400> 277

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuauuu uuuuuu 236

<210> 278

<211> 237

<212> RNA

<213> 人工序列

<220>

<223> 用于CSMD1的sgRNA序列(U4AU10)

<400> 278

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuauuu uuuuuuu 237

<210> 279

<211> 233

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget2的sgRNA序列(U4AU4AU)

<400> 279

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauuu uau 233

<210> 280

<211> 234

<212> RNA

<213> 人工序列

<220>

<223> 用于DYtarget2的sgRNA序列(U4AU4AU2)

<400> 280

cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60

gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120

cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180

uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauuu uauu 234

<210> 281

<211> 560

<212> PRT

<213> 未鉴别的古细菌ICHT

<400> 281

Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala Ala Met

1 5 10 15

Ala Lys Asn Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg Pro

20 25 30

Tyr Asn Ser Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn Asn

35 40 45

Arg Glu Lys Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu Ala

50 55 60

Cys Ser Lys His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val Glu

65 70 75 80

Arg Asn Ala Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys Phe

85 90 95

Tyr Gln Lys Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln Glu

100 105 110

Ile Ser Glu Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile Tyr

115 120 125

Asn Gln Ser Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly Lys

130 135 140

Gly Ile Ala Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val Cys

145 150 155 160

Tyr Thr Arg Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser Gly

165 170 175

Leu Arg Ser Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys Asn

180 185 190

Met Lys Ser Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile Pro

195 200 205

Leu Val Lys Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser Asn

210 215 220

His Asn Ser Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln Val

225 230 235 240

Lys Lys Glu Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe Glu

245 250 255

Gln Val Gln Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr Gln

260 265 270

Arg Arg Lys Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu Ala

275 280 285

Glu Ile Lys Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile Glu

290 295 300

Val Lys Arg Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu Asn

305 310 315 320

Leu Ser Ile Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser Ile

325 330 335

Ile Gly Gly Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala Ile

340 345 350

Asn Asn Ala Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe His

355 360 365

Phe Asn Lys Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys Asn

370 375 380

Arg His Lys Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro Ile

385 390 395 400

Thr Ile Leu Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile Glu

405 410 415

Arg Trp Ala Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val Gly

420 425 430

Thr Val Gln Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp Ser

435 440 445

Tyr Phe Asn Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met Gln

450 455 460

Asn Lys Ile Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg Lys

465 470 475 480

Val Ala Pro Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His Leu

485 490 495

Asn Asn Tyr Phe Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro His

500 505 510

Phe Lys Cys Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn Ala

515 520 525

Ala Leu Asn Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu Pro

530 535 540

Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys

545 550 555 560

<210> 282

<211> 497

<212> PRT

<213> 人工序列

<220>

<223> 用于Syntrophomonas palmitatica的效应蛋白的多肽序列

<400> 282

Met Gly Glu Ser Val Lys Ala Ile Lys Leu Lys Ile Leu Asp Met Phe

1 5 10 15

Leu Asp Pro Glu Cys Thr Lys Gln Asp Asp Asn Trp Arg Lys Asp Leu

20 25 30

Ser Thr Met Ser Arg Phe Cys Ala Glu Ala Gly Asn Met Cys Leu Arg

35 40 45

Asp Leu Tyr Asn Tyr Phe Ser Met Pro Lys Glu Asp Arg Ile Ser Ser

50 55 60

Lys Asp Leu Tyr Asn Ala Met Tyr His Lys Thr Lys Leu Leu His Pro

65 70 75 80

Glu Leu Pro Gly Lys Val Ala Asn Gln Ile Val Asn His Ala Lys Asp

85 90 95

Val Trp Lys Arg Asn Ala Lys Leu Ile Tyr Arg Asn Gln Ile Ser Met

100 105 110

Pro Thr Tyr Lys Ile Thr Thr Ala Pro Ile Arg Leu Gln Asn Asn Ile

115 120 125

Tyr Lys Leu Ile Lys Asn Lys Asn Lys Tyr Ile Ile Asp Val Gln Leu

130 135 140

Tyr Ser Lys Glu Tyr Ser Lys Asp Ser Gly Lys Gly Thr His Arg Tyr

145 150 155 160

Phe Leu Val Ala Val Arg Asp Ser Ser Thr Arg Met Ile Phe Asp Arg

165 170 175

Ile Met Ser Lys Asp His Ile Asp Ser Ser Lys Ser Tyr Thr Gln Gly

180 185 190

Gln Leu Gln Ile Lys Lys Asp His Gln Gly Lys Trp Tyr Cys Ile Ile

195 200 205

Pro Tyr Thr Phe Pro Thr His Glu Thr Val Leu Asp Pro Asp Lys Val

210 215 220

Met Gly Val Asp Leu Gly Val Ala Lys Ala Val Tyr Trp Ala Phe Asn

225 230 235 240

Ser Ser Tyr Lys Arg Gly Cys Ile Asp Gly Gly Glu Ile Glu His Phe

245 250 255

Arg Lys Met Ile Arg Ala Arg Arg Val Ser Ile Gln Asn Gln Ile Lys

260 265 270

His Ser Gly Asp Ala Arg Lys Gly His Gly Arg Lys Arg Ala Leu Lys

275 280 285

Pro Ile Glu Thr Leu Ser Glu Lys Glu Lys Asn Phe Arg Asp Thr Ile

290 295 300

Asn His Arg Tyr Ala Asn Arg Ile Val Glu Ala Ala Ile Lys Gln Gly

305 310 315 320

Cys Gly Thr Ile Gln Ile Glu Asn Leu Glu Gly Ile Ala Asp Thr Thr

325 330 335

Gly Ser Lys Phe Leu Lys Asn Trp Pro Tyr Tyr Asp Leu Gln Thr Lys

340 345 350

Ile Val Asn Lys Ala Lys Glu His Gly Ile Thr Val Val Ala Ile Asn

355 360 365

Pro Gln Tyr Thr Ser Gln Arg Cys Ser Met Cys Gly Tyr Ile Glu Lys

370 375 380

Thr Asn Arg Ser Ser Gln Ala Val Phe Glu Cys Lys Gln Cys Gly Tyr

385 390 395 400

Gly Ser Arg Thr Ile Cys Ile Asn Cys Arg His Val Gln Val Ser Gly

405 410 415

Asp Val Cys Glu Glu Cys Gly Gly Ile Val Lys Lys Glu Asn Val Asn

420 425 430

Ala Asp Tyr Asn Ala Ala Lys Asn Ile Ser Thr Pro Tyr Ile Asp Gln

435 440 445

Ile Ile Met Glu Lys Cys Leu Glu Leu Gly Ile Pro Tyr Arg Ser Ile

450 455 460

Thr Cys Lys Glu Cys Gly His Ile Gln Ala Ser Gly Asn Thr Cys Glu

465 470 475 480

Val Cys Gly Ser Thr Asn Ile Leu Lys Pro Lys Lys Ile Arg Lys Ala

485 490 495

Lys

<210> 283

<211> 422

<212> PRT

<213> 人工序列

<220>

<223> 用于acidibacillus sulfuroxidans的效应蛋白的多肽序列

<400> 283

Met Ile Lys Val Tyr Arg Tyr Glu Ile Val Lys Pro Leu Asp Leu Asp

1 5 10 15

Trp Lys Glu Phe Gly Thr Ile Leu Arg Gln Leu Gln Gln Glu Thr Arg

20 25 30

Phe Ala Leu Asn Lys Ala Thr Gln Leu Ala Trp Glu Trp Met Gly Phe

35 40 45

Ser Ser Asp Tyr Lys Asp Asn His Gly Glu Tyr Pro Lys Ser Lys Asp

50 55 60

Ile Leu Gly Tyr Thr Asn Val His Gly Tyr Ala Tyr His Thr Ile Lys

65 70 75 80

Thr Lys Ala Tyr Arg Leu Asn Ser Gly Asn Leu Ser Gln Thr Ile Lys

85 90 95

Arg Ala Thr Asp Arg Phe Lys Ala Tyr Gln Lys Glu Ile Leu Arg Gly

100 105 110

Asp Met Ser Ile Pro Ser Tyr Lys Arg Asp Ile Pro Leu Asp Leu Ile

115 120 125

Lys Glu Asn Ile Ser Val Asn Arg Met Asn His Gly Asp Tyr Ile Ala

130 135 140

Ser Leu Ser Leu Leu Ser Asn Pro Ala Lys Gln Glu Met Asn Val Lys

145 150 155 160

Arg Lys Ile Ser Val Ile Ile Ile Val Arg Gly Ala Gly Lys Thr Ile

165 170 175

Met Asp Arg Ile Leu Ser Gly Glu Tyr Gln Val Ser Ala Ser Gln Ile

180 185 190

Ile His Asp Asp Arg Lys Asn Lys Trp Tyr Leu Asn Ile Ser Tyr Asp

195 200 205

Phe Glu Pro Gln Thr Arg Val Leu Asp Leu Asn Lys Ile Met Gly Ile

210 215 220

Asp Leu Gly Val Ala Val Ala Val Tyr Met Ala Phe Gln His Thr Pro

225 230 235 240

Ala Arg Tyr Lys Leu Glu Gly Gly Glu Ile Glu Asn Phe Arg Arg Gln

245 250 255

Val Glu Ser Arg Arg Ile Ser Met Leu Arg Gln Gly Lys Tyr Ala Gly

260 265 270

Gly Ala Arg Gly Gly His Gly Arg Asp Lys Arg Ile Lys Pro Ile Glu

275 280 285

Gln Leu Arg Asp Lys Ile Ala Asn Phe Arg Asp Thr Thr Asn His Arg

290 295 300

Tyr Ser Arg Tyr Ile Val Asp Met Ala Ile Lys Glu Gly Cys Gly Thr

305 310 315 320

Ile Gln Met Glu Asp Leu Thr Asn Ile Arg Asp Ile Gly Ser Arg Phe

325 330 335

Leu Gln Asn Trp Thr Tyr Tyr Asp Leu Gln Gln Lys Ile Ile Tyr Lys

340 345 350

Ala Glu Glu Ala Gly Ile Lys Val Ile Lys Ile Asp Pro Gln Tyr Thr

355 360 365

Ser Gln Arg Cys Ser Glu Cys Gly Asn Ile Asp Ser Gly Asn Arg Ile

370 375 380

Gly Gln Ala Ile Phe Lys Cys Arg Ala Cys Gly Tyr Glu Ala Asn Ala

385 390 395 400

Asp Tyr Asn Ala Ala Arg Asn Ile Ala Ile Pro Asn Ile Asp Lys Ile

405 410 415

Ile Ala Glu Ser Ile Lys

420

<210> 284

<211> 1491

<212> DNA

<213> 人工序列

<220>

<223> 编码人密码子优化的SpCas12f1的DNA序列

<400> 284

atgggcgaga gcgttaaagc aatcaaactg aagatcctgg acatgttcct ggacccggag 60

tgcactaaac aggacgataa ctggcgtaaa gacctgtcta ccatgtctcg tttctgcgca 120

gaggcgggta acatgtgcct gcgcgacctg tacaattact tttctatgcc gaaagaagac 180

cgtattagct ccaaggatct gtacaacgcc atgtaccaca aaactaaact gctgcacccg 240

gaactgccgg gtaaagtggc gaaccagatc gtcaaccacg ctaaagatgt gtggaaacgc 300

aacgcgaagc tgatctatcg taatcagatc tctatgccga cttacaagat caccaccgca 360

ccgattcgcc tgcaaaacaa catctataaa ctgatcaaaa acaagaacaa atatatcatc 420

gatgtccagc tgtacagcaa agaatactct aaagacagcg gcaaaggcac ccaccgctac 480

ttcctggttg cagtgcgcga ttctagcacg cgtatgatct tcgaccgcat catgagcaaa 540

gaccacatcg atagctccaa atcctacacc cagggtcagc tgcagattaa aaaagaccat 600

cagggcaaat ggtactgtat cattccgtac accttcccga ctcatgagac cgtcctggat 660

ccggacaaag ttatgggtgt ggacctgggc gtggctaaag cagtgtattg ggcgttcaac 720

tcctcttaca aacgcggttg tatcgatggt ggtgaaattg aacacttccg caaaatgatc 780

cgtgctcgtc gtgtctccat tcagaaccag attaaacatt ctggcgacgc gcgcaagggt 840

catggtcgta aacgtgcact gaagccgatt gaaaccctgt ctgaaaaaga aaaaaacttc 900

cgcgatacta tcaaccatcg ttacgcaaac cgtatcgtgg aggcagcgat taagcagggc 960

tgcggcacca tccagatcga aaatctggag ggtatcgccg atactacggg ttccaaattt 1020

ctgaaaaact ggccatacta tgacctgcag accaaaatcg tgaacaaagc gaaggaacat 1080

ggcatcaccg tcgttgcgat caacccgcag tatacttctc aacgttgctc catgtgtggt 1140

tacattgaaa aaaccaaccg ttcctctcag gcagtgttcg agtgcaaaca gtgcggctat 1200

ggttcccgta ccatctgcat caactgccgc cacgttcagg taagcggtga tgtctgcgaa 1260

gaatgcggcg gcatcgttaa aaaagaaaac gttaacgcgg actataacgc ggcgaaaaac 1320

atctccaccc catatatcga tcagatcatc atggagaaat gtctggagct gggtatcccg 1380

taccgtagca tcacttgcaa agaatgcggt catatccagg cgtctggtaa cacttgtgag 1440

gtgtgcggtt ccaccaacat tctgaaaccg aaaaaaatcc gtaaagctaa a 1491

<210> 285

<211> 1266

<212> DNA

<213> 人工序列

<220>

<223> 编码人密码子优化的AsCas12f1的DNA序列

<400> 285

atgatcaagg tttatcgcta tgaaattgtg aaaccgctgg acctggactg gaaagagttc 60

ggtactatcc tgcgtcagct gcagcaggaa acgcgtttcg cactgaacaa agcgacgcag 120

ctggcttggg aatggatggg cttcagctct gattacaaag acaaccacgg cgaataccct 180

aaatccaaag atatcctggg ttacaccaac gtgcacggtt atgcgtacca caccatcaaa 240

actaaagcgt accgcctgaa ctccggtaat ctgtctcaga ccatcaagcg tgcgaccgac 300

cgtttcaaag cgtaccagaa ggaaatcctg cgcggtgaca tgagcatccc gtcctataag 360

cgtgacatcc cgctggatct gatcaaagaa aacatcagcg taaaccgcat gaaccacggt 420

gactacatcg cctccctgtc tctgctgtct aacccggcaa agcaagagat gaacgttaaa 480

cgcaaaatct ccgttatcat tatcgttcgt ggcgcaggca aaaccatcat ggatcgtatt 540

ctgtccggtg aatatcaagt gtccgcaagc cagatcatcc atgacgatcg taaaaataaa 600

tggtatctga acatctctta tgatttcgaa ccgcagaccc gcgtactgga cctgaacaaa 660

atcatgggta tcgatctggg cgttgcagta gcggtgtaca tggctttcca gcacaccccg 720

gcacgctaca aactggaagg tggtgagatc gaaaacttcc gtcgtcaagt ggaatctcgt 780

cgcatctcta tgctgcgtca gggtaaatat gcaggtggtg cgcgtggtgg tcatggtcgt 840

gacaaacgta ttaaaccaat cgaacagctg cgcgataaaa tcgccaactt ccgtgatacc 900

accaaccacc gctactctcg ttatatcgtt gatatggcaa tcaaagaggg ttgtggtact 960

atccagatgg aagacctgac gaacatccgc gatatcggtt ctcgtttcct gcagaactgg 1020

acctactacg atctgcagca gaaaattatc tacaaagcgg aggaagcagg tatcaaagtc 1080

attaaaatcg atccgcagta tactagccag cgctgcagcg aatgtggtaa cattgatagc 1140

ggcaaccgca ttggtcaggc aatctttaaa tgccgcgctt gtggctacga agcgaacgca 1200

gactacaacg cggcgcgtaa catcgccatc ccgaatattg acaaaatcat tgccgaatct 1260

attaaa 1266

<210> 286

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> VEGFA-3基因的原间隔序列

<400> 286

ggggtgaccg ccggagcgcg 20

<210> 287

<211> 161

<212> DNA

<213> 人工序列

<220>

<223> 编码tracrRNA的DNA序列，用于SpCas12f1和AsCas12f1

<400> 287

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca a 161

<210> 288

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 编码crRNA重复序列的DNA序列，用于SpCas12f1

<400> 288

gtcgcatctt gcgtaagcgc gtggattgaa ac 32

<210> 289

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> 编码crRNA重复序列的DNA序列，用于AsCas12f1

<400> 289

gtttgcgagc tagcttgtgg agtgtgaac 29

<210> 290

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 编码SpCas12f1 crRNA的DNA，用于DYtarget2(WT)

<400> 290

gtcgcatctt gcgtaagcgc gtggattgaa accacacaca cagtgggcta cc 52

<210> 291

<211> 58

<212> DNA

<213> 人工序列

<220>

<223> 编码SpCas12f1 crRNA的DNA，用于DYtarget2(U6)

<400> 291

gtcgcatctt gcgtaagcgc gtggattgaa accacacaca cagtgggcta cctttttt 58

<210> 292

<211> 63

<212> DNA

<213> 人工序列

<220>

<223> 编码SpCas12f1 crRNA的DNA，用于DYtarget2(U4AU6)

<400> 292

gtcgcatctt gcgtaagcgc gtggattgaa accacacaca cagtgggcta ccttttattt 60

ttt 63

<210> 293

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> 编码SpCas12f1 crRNA的DNA，用于VEGFA-3(WT)

<400> 293

gtcgcatctt gcgtaagcgc gtggattgaa acggggtgac cgccggagcg cg 52

<210> 294

<211> 58

<212> DNA

<213> 人工序列

<220>

<223> 编码SpCas12f1 crRNA的DNA，用于VEGFA-3(U6)

<400> 294

gtcgcatctt gcgtaagcgc gtggattgaa acggggtgac cgccggagcg cgtttttt 58

<210> 295

<211> 63

<212> DNA

<213> 人工序列

<220>

<223> 编码SpCas12f1 crRNA的DNA，用于VEGFA-3(U4AU6)

<400> 295

gtcgcatctt gcgtaagcgc gtggattgaa acggggtgac cgccggagcg cgttttattt 60

ttt 63

<210> 296

<211> 49

<212> DNA

<213> 人工序列

<220>

<223> 编码AsCas12f1 crRNA的DNA，用于DYtarget2(WT)

<400> 296

gtttgcgagc tagcttgtgg agtgtgaacc acacacacag tgggctacc 49

<210> 297

<211> 55

<212> DNA

<213> 人工序列

<220>

<223> 编码AsCas12f1 crRNA的DNA序列，用于DYtarget2(U6)

<400> 297

gtttgcgagc tagcttgtgg agtgtgaacc acacacacag tgggctacct ttttt 55

<210> 298

<211> 60

<212> DNA

<213> 人工序列

<220>

<223> 编码AsCas12f1 crRNA的DNA，用于DYtarget2(U4AU6)

<400> 298

gtttgcgagc tagcttgtgg agtgtgaacc acacacacag tgggctacct tttatttttt 60

60

<210> 299

<211> 49

<212> DNA

<213> 人工序列

<220>

<223> 编码AsCas12f1 crRNA的DNA，用于VEGFA-3(WT)

<400> 299

gtttgcgagc tagcttgtgg agtgtgaacg gggtgaccgc cggagcgcg 49

<210> 300

<211> 55

<212> DNA

<213> 人工序列

<220>

<223> 编码AsCas12f1 crRNA的DNA，用于VEGFA-3(U6)

<400> 300

gtttgcgagc tagcttgtgg agtgtgaacg gggtgaccgc cggagcgcgt ttttt 55

<210> 301

<211> 60

<212> DNA

<213> 人工序列

<220>

<223> 编码AsCas12f1 crRNA的DNA，用于VEGFA-3(U4AU6)

<400> 301

gtttgcgagc tagcttgtgg agtgtgaacg gggtgaccgc cggagcgcgt tttatttttt 60

60

<210> 302

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，用于合成tracrRNA扩增子

<400> 302

ttgtgcagaa ttggagagga 20

<210> 303

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，用于SpCas12f1的crRNA (DYtarget2, WT)

<400> 303

ggtagcccac tgtgtgtgtg gtttcaatcc a 31

<210> 304

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，用于SpCas12f1的crRNA(DYtarget2, U6)

<400> 304

aaaaaaggta gcccactgtg tgtgtggttt caatcca 37

<210> 305

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，用于SpCas12f1的crRNA(DYtarget2, U4AU6)

<400> 305

aaaaaataaa aggtagccca ctgtgtgtgt ggtttcaatc ca 42

<210> 306

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，用于SpCas12f1的crRNA(VEGFA-3, WT)

<400> 306

cgcgctccgg cggtcacccc gtttcaatcc a 31

<210> 307

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，用于SpCas12f1的crRNA(VEGFA-3, U6)

<400> 307

aaaaaacgcg ctccggcggt caccccgttt caatcca 37

<210> 308

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，用于SpCas12f1的crRNA(VEGFA-3, U4AU6)

<400> 308

aaaaaataaa acgcgctccg gcggtcaccc cgtttcaatc ca 42

<210> 309

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，用于AsCas12f1的crRNA(DYtarget2, WT)

<400> 309

ggtagcccac tgtgtgtgtg gttcacactc c 31

<210> 310

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，用于AsCas12f1的crRNA(DYtarget2, U6)

<400> 310

aaaaaaggta gcccactgtg tgtgtggttc acactcc 37

<210> 311

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，用于AsCas12f1的crRNA(DYtarget2, U4AU6)

<400> 311

aaaaaataaa aggtagccca ctgtgtgtgt ggttcacact cc 42

<210> 312

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，用于AsCas12f1的crRNA(VEGFA-3, WT)

<400> 312

cgcgctccgg cggtcacccc gttcacactc c 31

<210> 313

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，用于AsCas12f1的crRNA(VEGFA-3, U6)

<400> 313

aaaaaacgcg ctccggcggt caccccgttc acactcc 37

<210> 314

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，用于AsCas12f1的crRNA(VEGFA-3, U4AU6)

<400> 314

aaaaaataaa acgcgctccg gcggtcaccc cgttcacact cc 42

<210> 315

<211> 81

<212> DNA

<213> 人工序列

<220>

<223> HA标签序列

<400> 315

tacccatacg atgttccaga ttacgcttat ccctacgacg tgcctgatta tgcataccca 60

tatgatgtcc ccgactatgc c 81

<210> 316

<211> 3009

<212> DNA

<213> 人工序列

<220>

<223> Cas14a1和胞苷脱氨酶融合的蛋白

<400> 316

ccaaagaaga agcggaaagt ctcctcagag actgggcctg tcgccgtcga tccaaccctg 60

cgccgccgga ttgaacctca cgagtttgaa gtgttctttg acccccggga gctgagaaag 120

gagacatgcc tgctgtacga gatcaactgg ggaggcaggc actccatctg gaggcacacc 180

tctcagaaca caaataagca cgtggaggtg aacttcatcg agaagtttac cacagagcgg 240

tacttctgcc ccaataccag atgtagcatc acatggtttc tgagctggtc cccttgcgga 300

gagtgtagca gggccatcac cgagttcctg tccagatatc cacacgtgac actgtttatc 360

tacatcgcca ggctgtatca ccacgcagac ccaaggaata ggcagggcct gcgcgatctg 420

atcagctccg gcgtgaccat ccagatcatg acagagcagg agtccggcta ctgctggcgg 480

aacttcgtga attattctcc tagcaacgag gcccactggc ctaggtaccc acacctgtgg 540

gtgcgcctgt acgtgctgga gctgtattgc atcatcctgg gcctgccccc ttgtctgaat 600

atcctgcgga gaaagcagcc ccagctgacc ttctttacaa tcgccctgca gtcttgtcac 660

tatcagaggc tgccacccca catcctgtgg gccacaggcc tgaagtctgg aggatctagc 720

ggaggatcct ctggcagcga gacaccagga acaagcgagt cagcaacacc agagagcagt 780

ggcggcagca gcggcggcag catggccaag aacacaatta caaagacact gaagctgagg 840

atcgtgagac catacaacag cgctgaggtc gagaagattg tggctgatga aaagaacaac 900

agggaaaaga tcgccctcga gaagaacaag gataaggtga aggaggcctg ctctaagcac 960

ctgaaagtgg ccgcctactg caccacacag gtggagagga acgcctgtct gttttgtaaa 1020

gctcggaagc tggatgataa gttttaccag aagctgcggg gccagttccc cgatgccgtc 1080

ttttggcagg agattagcga gatcttcaga cagctgcaga agcaggccgc cgagatctac 1140

aaccagagcc tgatcgagct ctactacgag atcttcatca agggcaaggg cattgccaac 1200

gcctcctccg tggagcacta cctgagcgac gtgtgctaca caagagccgc cgagctcttt 1260

aagaacgccg ctatcgcttc cgggctgagg agcaagatta agagtaactt ccggctcaag 1320

gagctgaaga acatgaagag cggcctgccc actacaaaga gcgacaactt cccaattcca 1380

ctggtgaagc agaagggggg ccagtacaca gggttcgaga tttccaacca caacagcgac 1440

tttattatta agatcccctt tggcaggtgg caggtcaaga aggagattga caagtacagg 1500

ccctgggaga agtttgattt cgagcaggtg cagaagagcc ccaagcctat ttccctgctg 1560

ctgtccacac agcggcggaa gaggaacaag gggtggtcta aggatgaggg gaccgaggcc 1620

gagattaaga aagtgatgaa cggcgactac cagacaagct acatcgaggt caagcggggc 1680

agtaagattg gcgagaagag cgcctggatg ctgaacctga gcattgacgt gccaaagatt 1740

gataagggcg tggatcccag catcatcgga gggatcgatg tgggggtcaa gagccccctc 1800

gtgtgcgcca tcaacaacgc cttcagcagg tacagcatct ccgataacga cctgttccac 1860

tttaacaaga agatgttcgc ccggcggagg attttgctca agaagaaccg gcacaagcgg 1920

gccggacacg gggccaagaa caagctcaag cccatcacta tcctgaccga gaagagcgag 1980

aggttcagga agaagctcat cgagagatgg gcctgcgaga tcgccgattt ctttattaag 2040

aacaaggtcg gaacagtgca gatggagaac ctcgagagca tgaagaggaa ggaggattcc 2100

tacttcaaca ttcggctgag ggggttctgg ccctacgctg agatgcagaa caagattgag 2160

tttaagctga agcagtacgg gattgagatc cggaaggtgg cccccaacaa caccagcaag 2220

acctgcagca agtgcgggca cctcaacaac tacttcaact tcgagtaccg gaagaagaac 2280

aagttcccac acttcaagtg cgagaagtgc aactttaagg agaacgccga ttacaacgcc 2340

gccctgaaca tcagcaaccc taagctgaag agcactaagg aggagcccag cggcgggagc 2400

ggcgggagcg gggggagcac taatctgagc gacatcattg agaaggagac tgggaaacag 2460

ctggtcattc aggagtccat cctgatgctg cctgaggagg tggaggaagt gatcggcaac 2520

aagccagagt ctgacatcct ggtgcacacc gcctacgacg agtccacaga tgagaatgtg 2580

atgctgctga cctctgacgc ccccgagtat aagccttggg ccctggtcat ccaggattct 2640

aacggcgaga ataagatcaa gatgctgagc ggaggatccg gaggatctgg aggcagcacc 2700

aacctgtctg acatcatcga gaaggagaca ggcaagcagc tggtcatcca ggagagcatc 2760

ctgatgctgc ccgaagaagt cgaagaagtg atcggaaaca agcctgagag cgatatcctg 2820

gtccataccg cctacgacga gagtaccgac gaaaatgtga tgctgctgac atccgacgcc 2880

ccagagtata agccctgggc tctggtcatc caggattcca acggagagaa caaaatcaaa 2940

atgctgtctg gcggctcaaa aagaaccgcc gacggcagcg aattcgagcc caagaagaag 3000

aggaaagtc 3009

<210> 317

<211> 1003

<212> PRT

<213> 人工序列

<220>

<223> Cas14a1与CBE融合蛋白(N末端-胞苷脱氨酶)

<400> 317

Pro Lys Lys Lys Arg Lys Val Ser Ser Glu Thr Gly Pro Val Ala Val

1 5 10 15

Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu Val Phe

20 25 30

Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile

35 40 45

Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln Asn Thr

50 55 60

Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg

65 70 75 80

Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp

85 90 95

Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg

100 105 110

Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr His His

115 120 125

Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly

130 135 140

Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg

145 150 155 160

Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro Arg Tyr

165 170 175

Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile

180 185 190

Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln

195 200 205

Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg Leu

210 215 220

Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Ser Gly Gly Ser Ser

225 230 235 240

Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr

245 250 255

Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Met Ala Lys Asn Thr

260 265 270

Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg Pro Tyr Asn Ser Ala

275 280 285

Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn Asn Arg Glu Lys Ile

290 295 300

Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu Ala Cys Ser Lys His

305 310 315 320

Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val Glu Arg Asn Ala Cys

325 330 335

Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys Phe Tyr Gln Lys Leu

340 345 350

Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln Glu Ile Ser Glu Ile

355 360 365

Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile Tyr Asn Gln Ser Leu

370 375 380

Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly Lys Gly Ile Ala Asn

385 390 395 400

Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val Cys Tyr Thr Arg Ala

405 410 415

Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser Gly Leu Arg Ser Lys

420 425 430

Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys Asn Met Lys Ser Gly

435 440 445

Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile Pro Leu Val Lys Gln

450 455 460

Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser Asn His Asn Ser Asp

465 470 475 480

Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln Val Lys Lys Glu Ile

485 490 495

Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe Glu Gln Val Gln Lys

500 505 510

Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr Gln Arg Arg Lys Arg

515 520 525

Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu Ala Glu Ile Lys Lys

530 535 540

Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile Glu Val Lys Arg Gly

545 550 555 560

Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu Asn Leu Ser Ile Asp

565 570 575

Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser Ile Ile Gly Gly Ile

580 585 590

Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala Ile Asn Asn Ala Phe

595 600 605

Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe His Phe Asn Lys Lys

610 615 620

Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys Asn Arg His Lys Arg

625 630 635 640

Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro Ile Thr Ile Leu Thr

645 650 655

Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile Glu Arg Trp Ala Cys

660 665 670

Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val Gly Thr Val Gln Met

675 680 685

Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp Ser Tyr Phe Asn Ile

690 695 700

Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met Gln Asn Lys Ile Glu

705 710 715 720

Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg Lys Val Ala Pro Asn

725 730 735

Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His Leu Asn Asn Tyr Phe

740 745 750

Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro His Phe Lys Cys Glu

755 760 765

Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn Ala Ala Leu Asn Ile

770 775 780

Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu Pro Ser Gly Gly Ser

785 790 795 800

Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu

805 810 815

Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu

820 825 830

Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val

835 840 845

His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr

850 855 860

Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser

865 870 875 880

Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Gly Gly Ser

885 890 895

Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys

900 905 910

Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu

915 920 925

Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala

930 935 940

Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala

945 950 955 960

Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu

965 970 975

Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Lys Arg Thr Ala Asp Gly

980 985 990

Ser Glu Phe Glu Pro Lys Lys Lys Arg Lys Val

995 1000

<210> 318

<211> 3009

<212> DNA

<213> 人工序列

<220>

<223> 编码Cas14a1和CBE融合蛋白(C末端-胞苷脱氨酶)的DNA

<400> 318

ccaaagaaga agcggaaagt catggccaag aacacaatta caaagacact gaagctgagg 60

atcgtgagac catacaacag cgctgaggtc gagaagattg tggctgatga aaagaacaac 120

agggaaaaga tcgccctcga gaagaacaag gataaggtga aggaggcctg ctctaagcac 180

ctgaaagtgg ccgcctactg caccacacag gtggagagga acgcctgtct gttttgtaaa 240

gctcggaagc tggatgataa gttttaccag aagctgcggg gccagttccc cgatgccgtc 300

ttttggcagg agattagcga gatcttcaga cagctgcaga agcaggccgc cgagatctac 360

aaccagagcc tgatcgagct ctactacgag atcttcatca agggcaaggg cattgccaac 420

gcctcctccg tggagcacta cctgagcgac gtgtgctaca caagagccgc cgagctcttt 480

aagaacgccg ctatcgcttc cgggctgagg agcaagatta agagtaactt ccggctcaag 540

gagctgaaga acatgaagag cggcctgccc actacaaaga gcgacaactt cccaattcca 600

ctggtgaagc agaagggggg ccagtacaca gggttcgaga tttccaacca caacagcgac 660

tttattatta agatcccctt tggcaggtgg caggtcaaga aggagattga caagtacagg 720

ccctgggaga agtttgattt cgagcaggtg cagaagagcc ccaagcctat ttccctgctg 780

ctgtccacac agcggcggaa gaggaacaag gggtggtcta aggatgaggg gaccgaggcc 840

gagattaaga aagtgatgaa cggcgactac cagacaagct acatcgaggt caagcggggc 900

agtaagattg gcgagaagag cgcctggatg ctgaacctga gcattgacgt gccaaagatt 960

gataagggcg tggatcccag catcatcgga gggatcgatg tgggggtcaa gagccccctc 1020

gtgtgcgcca tcaacaacgc cttcagcagg tacagcatct ccgataacga cctgttccac 1080

tttaacaaga agatgttcgc ccggcggagg attttgctca agaagaaccg gcacaagcgg 1140

gccggacacg gggccaagaa caagctcaag cccatcacta tcctgaccga gaagagcgag 1200

aggttcagga agaagctcat cgagagatgg gcctgcgaga tcgccgattt ctttattaag 1260

aacaaggtcg gaacagtgca gatggagaac ctcgagagca tgaagaggaa ggaggattcc 1320

tacttcaaca ttcggctgag ggggttctgg ccctacgctg agatgcagaa caagattgag 1380

tttaagctga agcagtacgg gattgagatc cggaaggtgg cccccaacaa caccagcaag 1440

acctgcagca agtgcgggca cctcaacaac tacttcaact tcgagtaccg gaagaagaac 1500

aagttcccac acttcaagtg cgagaagtgc aactttaagg agaacgccga ttacaacgcc 1560

gccctgaaca tcagcaaccc taagctgaag agcactaagg aggagccctc tggaggatct 1620

agcggaggat cctctggcag cgagacacca ggaacaagcg agtcagcaac accagagagc 1680

agtggcggca gcagcggcgg cagctcctca gagactgggc ctgtcgccgt cgatccaacc 1740

ctgcgccgcc ggattgaacc tcacgagttt gaagtgttct ttgacccccg ggagctgaga 1800

aaggagacat gcctgctgta cgagatcaac tggggaggca ggcactccat ctggaggcac 1860

acctctcaga acacaaataa gcacgtggag gtgaacttca tcgagaagtt taccacagag 1920

cggtacttct gccccaatac cagatgtagc atcacatggt ttctgagctg gtccccttgc 1980

ggagagtgta gcagggccat caccgagttc ctgtccagat atccacacgt gacactgttt 2040

atctacatcg ccaggctgta tcaccacgca gacccaagga ataggcaggg cctgcgcgat 2100

ctgatcagct ccggcgtgac catccagatc atgacagagc aggagtccgg ctactgctgg 2160

cggaacttcg tgaattattc tcctagcaac gaggcccact ggcctaggta cccacacctg 2220

tgggtgcgcc tgtacgtgct ggagctgtat tgcatcatcc tgggcctgcc cccttgtctg 2280

aatatcctgc ggagaaagca gccccagctg accttcttta caatcgccct gcagtcttgt 2340

cactatcaga ggctgccacc ccacatcctg tgggccacag gcctgaagag cggcgggagc 2400

ggcgggagcg gggggagcac taatctgagc gacatcattg agaaggagac tgggaaacag 2460

ctggtcattc aggagtccat cctgatgctg cctgaggagg tggaggaagt gatcggcaac 2520

aagccagagt ctgacatcct ggtgcacacc gcctacgacg agtccacaga tgagaatgtg 2580

atgctgctga cctctgacgc ccccgagtat aagccttggg ccctggtcat ccaggattct 2640

aacggcgaga ataagatcaa gatgctgagc ggaggatccg gaggatctgg aggcagcacc 2700

aacctgtctg acatcatcga gaaggagaca ggcaagcagc tggtcatcca ggagagcatc 2760

ctgatgctgc ccgaagaagt cgaagaagtg atcggaaaca agcctgagag cgatatcctg 2820

gtccataccg cctacgacga gagtaccgac gaaaatgtga tgctgctgac atccgacgcc 2880

ccagagtata agccctgggc tctggtcatc caggattcca acggagagaa caaaatcaaa 2940

atgctgtctg gcggctcaaa aagaaccgcc gacggcagcg aattcgagcc caagaagaag 3000

aggaaagtc 3009

<210> 319

<211> 1003

<212> PRT

<213> 人工序列

<220>

<223> Cas14a1和CBE融合蛋白(C末端 -胞苷脱氨酶)

<400> 319

Pro Lys Lys Lys Arg Lys Val Met Ala Lys Asn Thr Ile Thr Lys Thr

1 5 10 15

Leu Lys Leu Arg Ile Val Arg Pro Tyr Asn Ser Ala Glu Val Glu Lys

20 25 30

Ile Val Ala Asp Glu Lys Asn Asn Arg Glu Lys Ile Ala Leu Glu Lys

35 40 45

Asn Lys Asp Lys Val Lys Glu Ala Cys Ser Lys His Leu Lys Val Ala

50 55 60

Ala Tyr Cys Thr Thr Gln Val Glu Arg Asn Ala Cys Leu Phe Cys Lys

65 70 75 80

Ala Arg Lys Leu Asp Asp Lys Phe Tyr Gln Lys Leu Arg Gly Gln Phe

85 90 95

Pro Asp Ala Val Phe Trp Gln Glu Ile Ser Glu Ile Phe Arg Gln Leu

100 105 110

Gln Lys Gln Ala Ala Glu Ile Tyr Asn Gln Ser Leu Ile Glu Leu Tyr

115 120 125

Tyr Glu Ile Phe Ile Lys Gly Lys Gly Ile Ala Asn Ala Ser Ser Val

130 135 140

Glu His Tyr Leu Ser Asp Val Cys Tyr Thr Arg Ala Ala Glu Leu Phe

145 150 155 160

Lys Asn Ala Ala Ile Ala Ser Gly Leu Arg Ser Lys Ile Lys Ser Asn

165 170 175

Phe Arg Leu Lys Glu Leu Lys Asn Met Lys Ser Gly Leu Pro Thr Thr

180 185 190

Lys Ser Asp Asn Phe Pro Ile Pro Leu Val Lys Gln Lys Gly Gly Gln

195 200 205

Tyr Thr Gly Phe Glu Ile Ser Asn His Asn Ser Asp Phe Ile Ile Lys

210 215 220

Ile Pro Phe Gly Arg Trp Gln Val Lys Lys Glu Ile Asp Lys Tyr Arg

225 230 235 240

Pro Trp Glu Lys Phe Asp Phe Glu Gln Val Gln Lys Ser Pro Lys Pro

245 250 255

Ile Ser Leu Leu Leu Ser Thr Gln Arg Arg Lys Arg Asn Lys Gly Trp

260 265 270

Ser Lys Asp Glu Gly Thr Glu Ala Glu Ile Lys Lys Val Met Asn Gly

275 280 285

Asp Tyr Gln Thr Ser Tyr Ile Glu Val Lys Arg Gly Ser Lys Ile Gly

290 295 300

Glu Lys Ser Ala Trp Met Leu Asn Leu Ser Ile Asp Val Pro Lys Ile

305 310 315 320

Asp Lys Gly Val Asp Pro Ser Ile Ile Gly Gly Ile Asp Val Gly Val

325 330 335

Lys Ser Pro Leu Val Cys Ala Ile Asn Asn Ala Phe Ser Arg Tyr Ser

340 345 350

Ile Ser Asp Asn Asp Leu Phe His Phe Asn Lys Lys Met Phe Ala Arg

355 360 365

Arg Arg Ile Leu Leu Lys Lys Asn Arg His Lys Arg Ala Gly His Gly

370 375 380

Ala Lys Asn Lys Leu Lys Pro Ile Thr Ile Leu Thr Glu Lys Ser Glu

385 390 395 400

Arg Phe Arg Lys Lys Leu Ile Glu Arg Trp Ala Cys Glu Ile Ala Asp

405 410 415

Phe Phe Ile Lys Asn Lys Val Gly Thr Val Gln Met Glu Asn Leu Glu

420 425 430

Ser Met Lys Arg Lys Glu Asp Ser Tyr Phe Asn Ile Arg Leu Arg Gly

435 440 445

Phe Trp Pro Tyr Ala Glu Met Gln Asn Lys Ile Glu Phe Lys Leu Lys

450 455 460

Gln Tyr Gly Ile Glu Ile Arg Lys Val Ala Pro Asn Asn Thr Ser Lys

465 470 475 480

Thr Cys Ser Lys Cys Gly His Leu Asn Asn Tyr Phe Asn Phe Glu Tyr

485 490 495

Arg Lys Lys Asn Lys Phe Pro His Phe Lys Cys Glu Lys Cys Asn Phe

500 505 510

Lys Glu Asn Ala Asp Tyr Asn Ala Ala Leu Asn Ile Ser Asn Pro Lys

515 520 525

Leu Lys Ser Thr Lys Glu Glu Pro Ser Gly Gly Ser Ser Gly Gly Ser

530 535 540

Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser

545 550 555 560

Ser Gly Gly Ser Ser Gly Gly Ser Ser Ser Glu Thr Gly Pro Val Ala

565 570 575

Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu Val

580 585 590

Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr Glu

595 600 605

Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln Asn

610 615 620

Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr Glu

625 630 635 640

Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu Ser

645 650 655

Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu Ser

660 665 670

Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr His

675 680 685

His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser Ser

690 695 700

Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys Trp

705 710 715 720

Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro Arg

725 730 735

Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys Ile

740 745 750

Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Pro

755 760 765

Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg

770 775 780

Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Ser Gly Gly Ser

785 790 795 800

Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu

805 810 815

Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu

820 825 830

Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val

835 840 845

His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr

850 855 860

Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser

865 870 875 880

Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Gly Gly Ser

885 890 895

Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys

900 905 910

Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu

915 920 925

Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala

930 935 940

Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala

945 950 955 960

Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu

965 970 975

Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Lys Arg Thr Ala Asp Gly

980 985 990

Ser Glu Phe Glu Pro Lys Lys Lys Arg Lys Val

995 1000

<210> 320

<211> 2823

<212> DNA

<213> 人工序列

<220>

<223> 编码Cas14a1和ABE融合蛋白(N末端 -腺嘌呤脱氨酶)的DNA

<400> 320

atgtccgaag tcgagttttc ccatgagtac tggatgagac acgcattgac tctcgcaaag 60

agggcttggg atgaacgcga ggtgcccgtg ggggcagtac tcgtgcataa caatcgcgta 120

atcggcgaag gttggaatag gccgatcgga cgccacgacc ccactgcaca tgcggaaatc 180

atggcccttc gacagggagg gcttgtgatg cagaattatc gacttatcga tgcgacgctg 240

tacgtcacgc ttgaaccttg cgtaatgtgc gcgggagcta tgattcactc ccgcattgga 300

cgagttgtat tcggtgcccg cgacgccaag acgggtgccg caggttcact gatggacgtg 360

ctgcatcacc caggcatgaa ccaccgggta gaaatcacag aaggcatatt ggcggacgaa 420

tgtgcggcgc tgttgtccga cttttttcgc atgcggaggc aggagatcaa ggcccagaaa 480

aaagcacaat cctctactga ctctggtggt tcttctggtg gttctagcgg cagcgagact 540

cccgggacct cagagtccgc cacacccgaa agttctggtg gttcttctgg tggttcttcc 600

gaagtcgagt tttcccatga gtactggatg agacacgcat tgactctcgc aaagagggct 660

cgagatgaac gcgaggtgcc cgtgggggca gtactcgtgc tcaacaatcg cgtaatcggc 720

gaaggttgga atagggcaat cggactccac gaccccactg cacatgcgga aatcatggcc 780

cttcgacagg gagggcttgt gatgcagaat tatcgactta tcgatgcgac gctgtacgtc 840

acgtttgaac cttgcgtaat gtgcgcggga gctatgattc actcccgcat tggacgagtt 900

gtattcggtg ttcgcaacgc caagacgggt gccgcaggtt cactgatgga cgtgctgcat 960

tacccaggca tgaaccaccg ggtagaaatc acagaaggca tattggcgga cgaatgtgcg 1020

gcgctgttgt gttacttttt tcgcatgccc aggcaggtct ttaacgccca gaaaaaagca 1080

caatcctcta ctgactctgg tggttcttct ggtggttcta gcggcagcga gactcccggg 1140

acctcagagt ccgccacacc cgaaagttct ggtggttctt ctggtggttc tgccaagaac 1200

acaattacaa agacactgaa gctgaggatc gtgagaccat acaacagcgc tgaggtcgag 1260

aagattgtgg ctgatgaaaa gaacaacagg gaaaagatcg ccctcgagaa gaacaaggat 1320

aaggtgaagg aggcctgctc taagcacctg aaagtggccg cctactgcac cacacaggtg 1380

gagaggaacg cctgtctgtt ttgtaaagct cggaagctgg atgataagtt ttaccagaag 1440

ctgcggggcc agttccccga tgccgtcttt tggcaggaga ttagcgagat cttcagacag 1500

ctgcagaagc aggccgccga gatctacaac cagagcctga tcgagctcta ctacgagatc 1560

ttcatcaagg gcaagggcat tgccaacgcc tcctccgtgg agcactacct gagcgacgtg 1620

tgctacacaa gagccgccga gctctttaag aacgccgcta tcgcttccgg gctgaggagc 1680

aagattaaga gtaacttccg gctcaaggag ctgaagaaca tgaagagcgg cctgcccact 1740

acaaagagcg acaacttccc aattccactg gtgaagcaga aggggggcca gtacacaggg 1800

ttcgagattt ccaaccacaa cagcgacttt attattaaga tcccctttgg caggtggcag 1860

gtcaagaagg agattgacaa gtacaggccc tgggagaagt ttgatttcga gcaggtgcag 1920

aagagcccca agcctatttc cctgctgctg tccacacagc ggcggaagag gaacaagggg 1980

tggtctaagg atgaggggac cgaggccgag attaagaaag tgatgaacgg cgactaccag 2040

acaagctaca tcgaggtcaa gcggggcagt aagattggcg agaagagcgc ctggatgctg 2100

aacctgagca ttgacgtgcc aaagattgat aagggcgtgg atcccagcat catcggaggg 2160

atcgatgtgg gggtcaagag ccccctcgtg tgcgccatca acaacgcctt cagcaggtac 2220

agcatctccg ataacgacct gttccacttt aacaagaaga tgttcgcccg gcggaggatt 2280

ttgctcaaga agaaccggca caagcgggcc ggacacgggg ccaagaacaa gctcaagccc 2340

atcactatcc tgaccgagaa gagcgagagg ttcaggaaga agctcatcga gagatgggcc 2400

tgcgagatcg ccgatttctt tattaagaac aaggtcggaa cagtgcagat ggagaacctc 2460

gagagcatga agaggaagga ggattcctac ttcaacattc ggctgagggg gttctggccc 2520

tacgctgaga tgcagaacaa gattgagttt aagctgaagc agtacgggat tgagatccgg 2580

aaggtggccc ccaacaacac cagcaagacc tgcagcaagt gcgggcacct caacaactac 2640

ttcaacttcg agtaccggaa gaagaacaag ttcccacact tcaagtgcga gaagtgcaac 2700

tttaaggaga acgccgatta caacgccgcc ctgaacatca gcaaccctaa gctgaagagc 2760

actaaggagg agcccaaaag gccggcggcc acgaaaaagg ccggccaggc aaaaaagaaa 2820

aag 2823

<210> 321

<211> 941

<212> PRT

<213> 人工序列

<220>

<223> Cas14a1和ABE融合蛋白(N末端-腺嘌呤脱氨酶)

<400> 321

Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu

1 5 10 15

Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala

20 25 30

Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro

35 40 45

Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg

50 55 60

Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu

65 70 75 80

Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His

85 90 95

Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly

100 105 110

Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His

115 120 125

Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu

130 135 140

Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys

145 150 155 160

Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser

165 170 175

Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser

180 185 190

Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr

195 200 205

Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg

210 215 220

Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly

225 230 235 240

Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala

245 250 255

Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg

260 265 270

Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys

275 280 285

Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val

290 295 300

Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His

305 310 315 320

Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala

325 330 335

Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln

340 345 350

Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly

355 360 365

Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser

370 375 380

Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Ala Lys Asn

385 390 395 400

Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg Pro Tyr Asn Ser

405 410 415

Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn Asn Arg Glu Lys

420 425 430

Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu Ala Cys Ser Lys

435 440 445

His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val Glu Arg Asn Ala

450 455 460

Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys Phe Tyr Gln Lys

465 470 475 480

Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln Glu Ile Ser Glu

485 490 495

Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile Tyr Asn Gln Ser

500 505 510

Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly Lys Gly Ile Ala

515 520 525

Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val Cys Tyr Thr Arg

530 535 540

Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser Gly Leu Arg Ser

545 550 555 560

Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys Asn Met Lys Ser

565 570 575

Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile Pro Leu Val Lys

580 585 590

Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser Asn His Asn Ser

595 600 605

Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln Val Lys Lys Glu

610 615 620

Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe Glu Gln Val Gln

625 630 635 640

Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr Gln Arg Arg Lys

645 650 655

Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu Ala Glu Ile Lys

660 665 670

Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile Glu Val Lys Arg

675 680 685

Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu Asn Leu Ser Ile

690 695 700

Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser Ile Ile Gly Gly

705 710 715 720

Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala Ile Asn Asn Ala

725 730 735

Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe His Phe Asn Lys

740 745 750

Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys Asn Arg His Lys

755 760 765

Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro Ile Thr Ile Leu

770 775 780

Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile Glu Arg Trp Ala

785 790 795 800

Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val Gly Thr Val Gln

805 810 815

Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp Ser Tyr Phe Asn

820 825 830

Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met Gln Asn Lys Ile

835 840 845

Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg Lys Val Ala Pro

850 855 860

Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His Leu Asn Asn Tyr

865 870 875 880

Phe Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro His Phe Lys Cys

885 890 895

Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn Ala Ala Leu Asn

900 905 910

Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu Pro Lys Arg Pro

915 920 925

Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys

930 935 940

<210> 322

<211> 2823

<212> DNA

<213> 人工序列

<220>

<223> 编码Cas14a1和ABE融合蛋白(C末端-腺嘌呤脱氨酶)的DNA

<400> 322

atggccaaga acacaattac aaagacactg aagctgagga tcgtgagacc atacaacagc 60

gctgaggtcg agaagattgt ggctgatgaa aagaacaaca gggaaaagat cgccctcgag 120

aagaacaagg ataaggtgaa ggaggcctgc tctaagcacc tgaaagtggc cgcctactgc 180

accacacagg tggagaggaa cgcctgtctg ttttgtaaag ctcggaagct ggatgataag 240

ttttaccaga agctgcgggg ccagttcccc gatgccgtct tttggcagga gattagcgag 300

atcttcagac agctgcagaa gcaggccgcc gagatctaca accagagcct gatcgagctc 360

tactacgaga tcttcatcaa gggcaagggc attgccaacg cctcctccgt ggagcactac 420

ctgagcgacg tgtgctacac aagagccgcc gagctcttta agaacgccgc tatcgcttcc 480

gggctgagga gcaagattaa gagtaacttc cggctcaagg agctgaagaa catgaagagc 540

ggcctgccca ctacaaagag cgacaacttc ccaattccac tggtgaagca gaaggggggc 600

cagtacacag ggttcgagat ttccaaccac aacagcgact ttattattaa gatccccttt 660

ggcaggtggc aggtcaagaa ggagattgac aagtacaggc cctgggagaa gtttgatttc 720

gagcaggtgc agaagagccc caagcctatt tccctgctgc tgtccacaca gcggcggaag 780

aggaacaagg ggtggtctaa ggatgagggg accgaggccg agattaagaa agtgatgaac 840

ggcgactacc agacaagcta catcgaggtc aagcggggca gtaagattgg cgagaagagc 900

gcctggatgc tgaacctgag cattgacgtg ccaaagattg ataagggcgt ggatcccagc 960

atcatcggag ggatcgatgt gggggtcaag agccccctcg tgtgcgccat caacaacgcc 1020

ttcagcaggt acagcatctc cgataacgac ctgttccact ttaacaagaa gatgttcgcc 1080

cggcggagga ttttgctcaa gaagaaccgg cacaagcggg ccggacacgg ggccaagaac 1140

aagctcaagc ccatcactat cctgaccgag aagagcgaga ggttcaggaa gaagctcatc 1200

gagagatggg cctgcgagat cgccgatttc tttattaaga acaaggtcgg aacagtgcag 1260

atggagaacc tcgagagcat gaagaggaag gaggattcct acttcaacat tcggctgagg 1320

gggttctggc cctacgctga gatgcagaac aagattgagt ttaagctgaa gcagtacggg 1380

attgagatcc ggaaggtggc ccccaacaac accagcaaga cctgcagcaa gtgcgggcac 1440

ctcaacaact acttcaactt cgagtaccgg aagaagaaca agttcccaca cttcaagtgc 1500

gagaagtgca actttaagga gaacgccgat tacaacgccg ccctgaacat cagcaaccct 1560

aagctgaaga gcactaagga ggagccctct ggaggatcta gcggaggatc ctctggcagc 1620

gagacaccag gaacaagcga gtcagcaaca ccagagagca gtggcggcag cagcggcggc 1680

agctccgaag tcgagttttc ccatgagtac tggatgagac acgcattgac tctcgcaaag 1740

agggcttggg atgaacgcga ggtgcccgtg ggggcagtac tcgtgcataa caatcgcgta 1800

atcggcgaag gttggaatag gccgatcgga cgccacgacc ccactgcaca tgcggaaatc 1860

atggcccttc gacagggagg gcttgtgatg cagaattatc gacttatcga tgcgacgctg 1920

tacgtcacgc ttgaaccttg cgtaatgtgc gcgggagcta tgattcactc ccgcattgga 1980

cgagttgtat tcggtgcccg cgacgccaag acgggtgccg caggttcact gatggacgtg 2040

ctgcatcacc caggcatgaa ccaccgggta gaaatcacag aaggcatatt ggcggacgaa 2100

tgtgcggcgc tgttgtccga cttttttcgc atgcggaggc aggagatcaa ggcccagaaa 2160

aaagcacaat cctctactga ctctggtggt tcttctggtg gttctagcgg cagcgagact 2220

cccgggacct cagagtccgc cacacccgaa agttcaggtg gatcttcagg tggatcttcg 2280

gaagtggaat tttcgcacga gtattggatg aggcacgctt taactctcgc taagagagca 2340

cgagacgaac gggaagtgcc ggttggggct gtcctcgtac tcaataatcg agttatcgga 2400

gaaggctgga acagggcaat cggactccac gatcccacag ctcatgccga gataatggcg 2460

cttcgacaag gaggcctagt catgcaaaat tatcgtctta ttgacgcgac cctctacgtg 2520

acctttgagc catgcgttat gtgtgcgggt gcaatgatac attcccggat aggacgtgta 2580

gtatttggag ttcgcaacgc gaagaccggt gcggctggtt ctctcatgga tgtcctgcac 2640

taccctggga tgaatcaccg cgttgaaatc actgaaggca ttttggccga tgaatgcgcg 2700

gccctgttat gttacttttt tcgcatgccc aggcaggtct ttaacgcaca gaagaaagcc 2760

caatcgtcca ctgataaaag gccggcggcc acgaaaaagg ccggccaggc aaaaaagaaa 2820

aag 2823

<210> 323

<211> 941

<212> PRT

<213> 人工序列

<220>

<223> Cas14a1和ABE融合蛋白(C末端-腺嘌呤脱氨酶)

<400> 323

Met Ala Lys Asn Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg

1 5 10 15

Pro Tyr Asn Ser Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn

20 25 30

Asn Arg Glu Lys Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu

35 40 45

Ala Cys Ser Lys His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val

50 55 60

Glu Arg Asn Ala Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys

65 70 75 80

Phe Tyr Gln Lys Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln

85 90 95

Glu Ile Ser Glu Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile

100 105 110

Tyr Asn Gln Ser Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly

115 120 125

Lys Gly Ile Ala Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val

130 135 140

Cys Tyr Thr Arg Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser

145 150 155 160

Gly Leu Arg Ser Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys

165 170 175

Asn Met Lys Ser Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile

180 185 190

Pro Leu Val Lys Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser

195 200 205

Asn His Asn Ser Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln

210 215 220

Val Lys Lys Glu Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe

225 230 235 240

Glu Gln Val Gln Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr

245 250 255

Gln Arg Arg Lys Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu

260 265 270

Ala Glu Ile Lys Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile

275 280 285

Glu Val Lys Arg Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu

290 295 300

Asn Leu Ser Ile Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser

305 310 315 320

Ile Ile Gly Gly Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala

325 330 335

Ile Asn Asn Ala Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe

340 345 350

His Phe Asn Lys Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys

355 360 365

Asn Arg His Lys Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro

370 375 380

Ile Thr Ile Leu Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile

385 390 395 400

Glu Arg Trp Ala Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val

405 410 415

Gly Thr Val Gln Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp

420 425 430

Ser Tyr Phe Asn Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met

435 440 445

Gln Asn Lys Ile Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg

450 455 460

Lys Val Ala Pro Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His

465 470 475 480

Leu Asn Asn Tyr Phe Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro

485 490 495

His Phe Lys Cys Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn

500 505 510

Ala Ala Leu Asn Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu

515 520 525

Pro Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly

530 535 540

Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly

545 550 555 560

Ser Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu

565 570 575

Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala

580 585 590

Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro

595 600 605

Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg

610 615 620

Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu

625 630 635 640

Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His

645 650 655

Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly

660 665 670

Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His

675 680 685

Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu

690 695 700

Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys

705 710 715 720

Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser

725 730 735

Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser

740 745 750

Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr

755 760 765

Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg

770 775 780

Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly

785 790 795 800

Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala

805 810 815

Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg

820 825 830

Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys

835 840 845

Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val

850 855 860

Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His

865 870 875 880

Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala

885 890 895

Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln

900 905 910

Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Lys Arg Pro

915 920 925

Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys

930 935 940

<210> 324

<211> 233

<212> DNA

<213> 人工序列

<220>

<223> 编码sgRNA的DNA序列，用于DYtarget2(T4GT6)

<400> 324

cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60

gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120

ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180

tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttgttt ttt 233

<210> 325

<211> 56

<212> DNA

<213> 人工序列

<220>

<223> 反向引物，用于DYtarget2的sgRNA(T4GT6)

<400> 325

aaaaaacaaa aggtagccca ctgtgtgtgt ggttgcattc cttcattcgt ctattc 56

Claims

1.一种用于CRISPR/Cas12f1系统的工程化的CRISPR RNA(crRNA)，所述CRISPR/Cas12f1系统能够编辑包含靶序列的核酸，所述工程化的crRNA包含：

CRISPR RNA重复序列；

间隔序列，所述间隔序列与所述靶序列互补；以及

其中，所述富含U的尾序列由(U_aN)_nU_b表示，N为腺苷(A)、尿苷(U)、胞苷(C)和鸟苷(G)中的一种，

a为1-4的整数，n为选自0、1和2的整数，b为1-10的整数，并且

所述工程化的crRNA的序列包含所述CRISPR RNA重复序列、所述间隔序列和所述富含U的尾序列，它们以5'-3'的方向顺序连接。

2.一种核酸，所述核酸具有编码如权利要求1所述的工程化的crRNA的序列。

3.如权利要求1所述的工程化的crRNA，其中，所述富含U的尾序列为UUUUUU、UUUUAUUUUUU或UUUUGUUUUUU。

4.一种用于CRISPR/Cas12f1系统的工程化的引导RNA，所述CRISPR/Cas12f1系统能够编辑包含靶序列的核酸，所述工程化的引导RNA具有包含如下的序列：

tracrRNA序列；

crRNA序列，所述crRNA序列包含CRISPR RNA重复序列以及间隔序列，所述间隔序列与所述靶序列互补；以及

富含U的尾序列，所述富含U的尾序列连接至所述CRISPR RNA序列的3'-末端，其中，所述富含U的尾序列由(U_aN)_nU_b表示，N为腺苷(A)、尿苷(U)、胞苷(C)和鸟苷(G)中的一种，a为1-4的整数，n为选自0、1和2的整数，b为1-10的整数。

5.如权利要求4所述的工程化的引导RNA，其中，所述工程化的引导RNA进一步包含接头序列，其中，所述tracrRNA序列和所述crRNA序列通过所述接头序列连接。

6.如权利要求5所述的工程化的引导RNA，其中，所述接头序列为5'-gaaa-3'。

7.如权利要求4所述的工程化的引导RNA，其中，所述富含U的尾序列为UUUUUU、UUUUAUUUUUU或UUUUGUUUUUU。

8.一种核酸，所述核酸具有编码如权利要求4-7中任一项所述的工程化的引导RNA的序列。

9.一种能够编辑包含靶序列的核酸的工程化CRISPR/Cas12f1复合体，所述工程化CRISPR/Cas12f1复合体包含：

Cas12f1蛋白，所述Cas12f1蛋白属于Cas14家族；以及

工程化的引导RNA，所述工程化的引导RNA包含支架序列、间隔序列和富含U的尾序列，

所述支架序列与所述Cas12f1蛋白相互作用，

所述间隔序列与所述靶序列互补，

其中，所述富含U的尾序列由(U_aN)_nU_b表示，

N为腺苷(A)、尿苷(U)、胞苷(C)和鸟苷(G)中的一种，并且

a为1-4的整数，n为选自0、1和2的整数，b为1-10的整数。

10.一种用于表达工程化CRISPR/Cas12f1复合体的载体，所述工程化CRISPR/Cas12f1复合体能够编辑包含靶序列的核酸，所述载体包含：

第一序列，所述第一序列包含编码Cas12f1蛋白的序列；

第二序列，所述第二序列包含编码工程化的引导RNA的序列；以及

其中，所述工程化的引导RNA具有与所述Cas12f1蛋白相互作用的支架序列、与所述靶序列互补的间隔序列以及连接至所述间隔序列的3'-末端的富含U的尾序列，所述富含U的尾序列由(U_aN)_nU_b表示，N为腺苷(A)、尿苷(U)、胞苷(C)和鸟苷(G)中的一种，a为1-4的整数，n为选自0、1和2的整数，b为1-10的整数，

其中，所述载体被构建为表达所述Cas12f1蛋白和所述工程化的引导RNA，从而使所述Cas12f1蛋白和所述工程化的引导RNA在细胞中形成CRISPR/Cas12f1复合体，并通过所述CRISPR/Cas12f1复合体对包含所述靶序列的核酸进行编辑。

11.如权利要求10所述的载体，其中，所述第二启动子序列为U6启动子序列。

12.如权利要求10所述的载体，其中，所述载体为病毒载体。

13.如权利要求10所述的载体，其中，所述载体为质粒载体。

14.如权利要求12所述的载体，其中，所述载体为选自于由以下病毒所组成的组中的一种或多种：逆转录病毒、慢病毒、腺病毒、腺相关病毒、痘病毒和单纯疱疹病毒。

15.如权利要求12所述的载体，其中，所述载体选自于痘苗病毒。

16.如权利要求10所述的载体，其中，所述载体为线性PCR扩增子。

17.一种用于表达工程化CRISPR/Cas12f1复合体的载体，所述工程化CRISPR/Cas12f1复合体能够编辑包含第一靶序列和第二靶序列的核酸，所述载体包含：

第一序列，所述第一序列包含编码Cas12f1蛋白的序列；

第二序列，所述第二序列包含编码第一工程化的引导RNA的序列，其中，所述第一工程化的引导RNA具有与所述Cas12f1蛋白相互作用的第一支架序列、与所述第一靶序列互补的第一间隔序列、以及第一富含U的尾序列，其中，所述第一富含U的尾序列由(U_aN)_nU_b表示，N为腺苷(A)、尿苷(U)、胞苷(C)和鸟苷(G)中的一种，a为1-4的整数，n为选自0、1和2的整数，b为1-10的整数；以及

第三序列，所述第三序列包含编码第二工程化的引导RNA的序列，其中，所述第二工程化的引导RNA具有与所述Cas12f1蛋白相互作用的第二支架序列、与所述第二靶序列互补的第二间隔序列、以及第二富含U的尾序列，其中，所述第二富含U的尾序列由(U_aN)_nU_b表示，N为腺苷(A)、尿苷(U)、胞苷(C)和鸟苷(G)中的一种，a为1-4的整数，n为选自0、1和2的整数，b为1-10的整数；以及

第三启动子序列，所述第三启动子可操作地连接至所述第三序列。

18.如权利要求17所述的载体，其中，所述第二启动子序列和所述第三启动子序列为相同的启动子序列。

19.如权利要求17所述的载体，其中，所述第二启动子序列为H1启动子序列，所述第三启动子序列为U6启动子序列。

20.一种在细胞中编辑包含靶序列的核酸的体外方法，所述方法包括：

将Cas12f1蛋白或编码所述Cas12f1蛋白的核酸和工程化的引导RNA或编码所述工程化的引导RNA的核酸递送至所述细胞内，从而使得

在所述细胞中形成CRISPR/Cas12f1复合体，以及

通过所述CRISPR/Cas12f1复合体对包含所述靶序列的核酸进行编辑，其中，所述工程化的引导RNA包含与所述Cas12f1蛋白相互作用的支架序列、与所述靶序列互补的间隔序列、以及连接至所述间隔序列的3'-末端的富含U的尾序列，其中，所述富含U的尾序列由(U_aN)_nU_b表示，N为腺苷(A)、尿苷(U)、胞苷(C)和鸟苷(G)中的一种，a为1-4的整数，n为选自0、1和2的整数，b为1-10的整数。

21.如权利要求20所述的方法，其中，在所述递送中，将所述Cas12f1蛋白和所述工程化的引导RNA以核糖核蛋白复合体的形式引入所述细胞中。

22.如权利要求20所述的方法，其中，在所述递送中，将包含编码所述Cas12f1蛋白的核酸和编码所述工程化的引导RNA的核酸的载体引入所述细胞中。

23.如权利要求22所述的方法，其中，所述载体为选自于由以下病毒所组成的组中的一种或多种：逆转录病毒、慢病毒、腺病毒、腺相关病毒、痘病毒和单纯疱疹病毒。

24.如权利要求22所述的方法，其中，所述载体选自于痘苗病毒。

25.一种在细胞中编辑包含靶序列的核酸的体外方法，所述方法包括：

使CRISPR/Cas12f1复合体与包含所述靶序列的核酸接触，其中

所述CRISPR/Cas12f1复合体包含Cas12f1蛋白和工程化的引导RNA，

所述工程化的引导RNA包含与所述Cas12f1蛋白相互作用的支架序列、与所述靶序列互补的间隔序列、以及富含U的尾序列，其中，所述富含U的尾序列由(U_aN)_nU_b表示，N为腺苷(A)、尿苷(U)、胞苷(C)和鸟苷(G)中的一种，a为1-4的整数，n为选自0、1和2的整数，b为1-10的整数。

26.一种工程化的CRISPR RNA(crRNA)，所述工程化的crRNA以5'-3'的方向包含：

crRNA重复序列；

间隔序列，所述间隔序列与所述靶序列互补；以及

富含U的尾序列，

其中，所述crRNA重复序列为SEQ ID NO：58；以及，所述富含U的尾序列由下式表示：(U_aN)_nU_b，N选自腺苷(A)、尿苷(U)、胞苷(C)和鸟苷(G)，a为1-4的整数，n为选自0、1和2的整数，b为1-10的整数。

27.如权利要求26所述的工程化的crRNA，其中，所述富含U的尾序列为UUUUUU、UUUUAUUUUUU或UUUUGUUUUUU。

28.一种核酸，所述核酸具有编码如权利要求26或27所述的工程化的crRNA的序列。

29.一种工程化的引导RNA，所述工程化的引导RNA包含：

tracrRNA序列；

如权利要求26或27所述的工程化的crRNA。

30.如权利要求29所述的工程化的引导RNA，其中，所述tracrRNA序列为SEQ ID NO：60。

31.一种核酸，所述核酸具有编码如权利要求29或30所述的工程化的引导RNA的序列。

32.一种包含如权利要求28或31所述的核酸的载体。

33.一种用于在细胞中编辑包含靶序列的核酸的体外方法，所述方法包括：

将如权利要求29或30所述的工程化的引导RNA或编码所述工程化的引导RNA的核酸递送至所述细胞内。

34.一种用于在细胞中编辑包含靶序列的核酸的组合物，所述组合物包含：

Cas12f1蛋白或编码所述Cas12f1蛋白的核酸，以及工程化的引导RNA或编码所述工程化的引导RNA的核酸，其中，所述Cas12f1蛋白和所述工程化的引导RNA形成CRISPR/Cas12f1复合体，并且通过所述CRISPR/Cas12f1复合体对所述核酸进行编辑，

其中，所述工程化的引导RNA包含与所述Cas12f1蛋白相互作用的支架序列、与所述靶序列互补的间隔序列、以及连接至所述间隔序列的3'-末端的富含U的尾序列，

其中，所述富含U的尾序列由下式表示：(U_aN)_nU_b，N选自腺苷(A)、尿苷(U)、胞苷(C)和鸟苷(G)，a为1-4的整数，n为选自0、1和2的整数，b为1-10的整数。

35.如权利要求34所述的组合物，其中，编码所述Cas12f1蛋白的核酸和/或编码所述工程化的引导RNA的核酸包含在载体中。

36.如权利要求35所述的组合物，其中，所述载体为选自于由以下所组成的组中的一种或多种：逆转录病毒、慢病毒、腺病毒、腺相关病毒、痘病毒和单纯疱疹病毒。

37.如权利要求35所述的组合物，其中，所述载体选自于痘苗病毒。

38.一种用于在细胞中编辑包含靶序列的核酸的组合物，所述组合物包含CRISPR/Cas12f1复合体，其中

所述CRISPR/Cas12f1复合体包含Cas12f1蛋白和工程化的引导RNA，

其中，所述工程化的引导RNA包含与所述Cas12f1蛋白相互作用的支架序列、与所述靶序列互补的间隔序列、以及富含U的尾序列，其中，所述富含U的尾序列由(U_aN)_nU_b表示，其中，N选自腺苷(A)、尿苷(U)、胞苷(C)和鸟苷(G)，a为1-4的整数，n为选自0、1和2的整数，b为1-10的整数。

39.一种用于在细胞中编辑包含靶序列的核酸的组合物，所述组合物包含如权利要求29或30所述的工程化的引导RNA或编码所述工程化的引导RNA的核酸。