CN118127011A

CN118127011A - gRNA支架及CRISPR-Cas系统及其应用

Info

Publication number: CN118127011A
Application number: CN202410179080.5A
Authority: CN
Inventors: 陈柏洪; 崔开心; 胡洋; 林少芸; 徐文倡; 农保庭; 孙金帅; 石翾; 余宇霖; 余嘉俊; 谭文琼; 梁普平
Original assignee: Microlight Gene Suzhou Co ltd
Current assignee: Microlight Gene Suzhou Co ltd
Priority date: 2024-02-08
Filing date: 2024-02-08
Publication date: 2024-06-04

Abstract

本文公开了向导RNAscaffold及其在CRISPR‑Cas系统中的应用。本文具体公开了向导RNA(gRNA)scaffold、CRISPR‑Cas系统、工程化的Cas12f多肽、Cas12f融合多肽、工程化的Cas12f多肽或融合多肽与gRNA形成的复合物、核酸、载体、载体系统、递送系统、试剂盒、组合物、以及利用上述组分修饰核酸的方法。

Description

gRNA支架及CRISPR-Cas系统及其应用

技术领域

本发明涉及核酸编辑领域，特别是规律成簇的间隔短回文重复(CRISPR)技术领域。具体而言，本发明涉及gRNAscaffold和CRISPR-Cas系统及其应用，包含gRNAscaffold和Cas12f多肽，以及编码它们的核酸分子。本发明还涉及用于核酸编辑(例如，基因或基因组编辑)的复合物和组合物，其包含本发明的gRNA scaffold和Cas12f多肽，或编码它们的核酸分子。本发明还涉及用于核酸编辑(例如，基因或基因组编辑)的方法，其使用包含本发明的gRNAscaffold和Cas12f多肽。

背景技术

在大约一半的细菌和几乎所有古核生物中，CRISPR(Clustered regularlyinterspaced short palindromic repeats,CRISPR)和CRISPR-Cas相关蛋白(CRISPRassociated proteins,CRISPR-Cas)构成针对噬菌体和外源质粒入侵的适应性免疫系统，称为CRISPR-Cas系统。因其具有准确识别和切割特定DNA和RNA序列的能力，如今已应用于基因编辑。CRISPR-Cas系统是当今世界上最为流行的基因编辑工具。要想修正哺乳动物的基因缺陷，就必须把一套基因编辑工具精确送到特定的组织或细胞内，这个过程需要用到一种能通往细胞内部的运输载体-腺相关病毒(AAV)，这种病毒是目前最可靠的载体之一。但AAV的缺点在于装载容量很有限，目前主流的由Cas9和Cas12a主导的基因编辑工具尺寸普遍太大，普遍都超过了单个AAV的装载极限，限制了它在哺乳动物上的应用。

因此，开发一种尺寸小、在哺乳动物细胞中的基因编辑能力强的新型CRISPR/Cas系统对生物技术的发展具有重要意义。

发明内容

本发明的一个方面提供向导RNA(gRNA)scaffold，其中所述gRNAscaffold包含与SEQ ID NO.3至17、19至92、95至107任一项所示的核苷酸序列相比具有至少80％序列同一性的核苷酸序列；优选地，其中所述gRNA scaffold为SEQ ID NO.3至17、SEQ ID NO.19至92、SEQ ID NO.95至107任一项所示的核苷酸序列。

具体的，向导RNA(gRNA)包含两个片段：靶向序列和蛋白质结合序列。gRNA的靶向序列包括与靶核酸序列(例如，靶ssRNA、靶ssDNA、双链靶DNA的链等)内的特定序列(靶位点)互补(并且因此与之杂交)的核苷酸序列(可互换地称为向导序列、间隔区、靶向子或靶向序列)。gRNA的靶向序列能够与靶核酸序列和调控元件结合，该靶核酸序列包括编码序列、编码序列的互补序列、非编码序列。蛋白质结合序列与作为复合物的Cas12f多肽相互作用(例如，结合)，形成RNP。蛋白质结合序列在本文中也称为“支架”、“gRNAscaffold”或“gRNA支架”，这些术语在本文可互换使用。即在gRNA上除了靶向序列区域之外，gRNA的其余区域在本文中被称为“支架”、“gRNA scaffold”或“gRNA支架”。

在优选的实施方式中，所述gRNAscaffold包含或为与SEQ ID NO.3至17、19至92、95至107任一项所示的核苷酸序列相比具有至少90％序列同一性核苷酸序列。例如，所述gRNAscaffold包含或为与SEQ ID NO.3至17、19至92、95至107任一项所示的核苷酸序列相比具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的核苷酸序列。

在另一些实施方式中，所述gRNAscaffold包含一个或多个修饰，所述一个或多个修饰导致所述gRNAscaffold展现一种或多种改善特征；优选地，所述一种或多种改善特征选自由以下组成的组：改善gRNA稳定性；改善所述gRNA的转录；增加所述gRNA的折叠速率；折叠期间减少副产物形成；折叠期间减少脱靶折叠中间体形成；增加生产性折叠；增加与Cas12f蛋白的结合亲和力；当与所述Cas12f蛋白复合时，改善与靶核酸的结合亲和力；当与所述Cas12f蛋白复合时，改善基因编辑；或当与所述Cas12f蛋白复合时，改善编辑特异性。

在一些实施方式中，所述一个或多个修饰包含：(i)一个或多个区域中的所述gRNAscaffold的1至40个连续或非连续核苷酸的取代；(ii)一个或多个区域中的所述gRNAscaffold的1至40个连续或非连续核苷酸的缺失；(iii)一个或多个区域中的所述gRNAscaffold的1至40个连续或非连续核苷酸的插入；(iv)一个或多个区域中的所述gRNAscaffold的1至10个连续或非连续核苷酸的化学修饰；(v)所述gRNA scaffold具有异源RNA序列取代；或(vi)(i)-(v)的任何组合。

在一些实施方式中，本发明提供的gRNAscaffold的修饰方法包括：截短不同茎环区，增加或删除茎环，增加或删除假结茎，调整tracrRNA与crRNA互补区长度，增加终止子，取代特定位置的核苷酸，对特定位置的核苷酸的糖和磷酸二酯键进行化学修饰，在gRNAscaffold的5’和3’端连接异源RNA序列。优选地，所述化学修饰为针对gRNA的常规化学修饰，合适的化学修饰包括但不限于：2'-O甲基修饰的核苷酸、2'-氟修饰的核苷酸、锁核酸(LNA)修饰的核苷酸、肽核酸(PNA)修饰的核苷酸、具有硫代磷酸酯键的核苷酸和5'帽(例如，7-甲基鸟苷酸帽(m7G))；优选地，所述异源RNA序列为适配子，适配子是一种结合特异性靶分子的合成寡核苷酸，例如，已经通过重复数轮的体外选择或SELEX(指数富集配体系统进化法)被工程化为结合不同分子的核苷酸分子靶向诸如小分子、蛋白质、核酸以及甚至细胞、组织和生物体。适配子可提供类似抗体的分子识别特性，且其在治疗性应用中几乎不引发免疫原性；优选地，所述异源RNA序列为能够结合蛋白质、RNA结构、DNA序列或小分子MS2、Qβ、U1发夹II、Uvsx或PP7茎环序列。

在优选的实施方式中，其中所述gRNAscaffold为SEQ ID NO.3、12、13、14、15、16、17、19、20、21、23、24、25、26、27、29、30、31、32、33、34、35、36、37、38、39、40、42、43、44、45、46、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、95、97、98、99、100、103、104、105或106任一项所示的核苷酸序列。

在一些实施方式中所述gRNAscaffold可包括可以形成Stem茎和茎环结构的回文区。在一些实施方式中，所述回文区包括由5至15个碱基对(bp)形成的茎结构，例如8至12个bp或10至15个bp，例如7、8、9、10、11、12、13、14或15个bp。在一些实施方式中，并非茎结构中的所有核苷酸都是配对的，因此茎结构可包含凸起。本文中的术语“凸起”用于意指一段核苷酸(其可以是一个核苷酸)，这段核苷酸对茎结构没有贡献，但是在5'端和3'端被有贡献的核苷酸围绕，因此凸起被认为是茎结构的一部分。在一些实施方式中，茎结构包含1个或更多个凸起(例如，2个或更多个、3个或更多个、4个或更多个凸起)。在一些实施方式中，茎结构包含2个或更多个凸起(例如，3个或更多个、4个或更多个凸起)。在一些实施方式中，茎结构包含1-5个凸起(例如，1-4个、1-3个、2-5个、2-4个或2-3个凸起)。

具体的，本发明提供的gRNAscaffold的修饰方法具体为：

对SEQ ID NO.3的不同区域截短至少一个核苷酸得到SEQ ID NO.4至15任一项所示的核苷酸序列；对SEQ ID NO.3的不同区域的一个或多个核苷酸进行取代得到SEQ IDNO.16至17、SEQ ID NO.19至28任一项所示的核苷酸序列；SEQ ID NO.18的核苷酸序列从5’到3’方向为SEQ ID NO.3、靶核酸互补的靶向序列(N)n和U6终止子；对SEQ ID NO.3的Stem4区域截短至少一个核苷酸得到SEQ ID NO.29至41任一项所示的核苷酸序列；对SEQ IDNO.3的Stem3区域截短至少一个核苷酸或对一个或多个核苷酸进行取代得到SEQ ID NO.42至63任一项所示的核苷酸序列；对SEQ ID NO.3的Stem4区域的一个或多个核苷酸进行取代得到SEQ ID NO.64至78任一项所示的核苷酸序列；对SEQ ID NO.3的Stem4区域截短至少一个核苷酸得到SEQ ID NO.79至85任一项所示的核苷酸序列；对SEQ ID NO.3的Stem3区域和Stem4区域截短至少一个核苷酸或对一个或多个核苷酸进行取代得到SEQ ID NO.86至92任一项所示的核苷酸序列；对SEQ ID NO.93的不同区域截短至少一个核苷酸以及在不同区域增加多个核苷酸得到SEQ ID NO.95所示的核苷酸序列；对SEQ ID NO.94的不同区域截短至少一个核苷酸得到SEQ ID NO.96所示的核苷酸序列；对SEQ ID NO.95的不同区域截短至少一个核苷酸、在不同区域的一个或多个核苷酸进行取代以及在不同区域增加多个核苷酸得到SEQ ID NO.97至107任一项所示的核苷酸序列。

在优选的实施方式中，对所述gRNAscaffold修饰导致其与所述Cas12f多肽结合活性增强，例如与SEQ ID NO.3相比，所述gRNAscaffold与所述Cas12f多肽的核酸结合活性增强至少10％，例如10％至500％，10％至100％、10％至200％、10％至300％、10％至50％、10％至30％、10％至20％、50％至100％、50％至200％、50％至300％、100％至200％、或200％至300％；导致其与所述Cas12f多肽复合后所述Cas12f多肽的核酸切割活性增强，例如与SEQ ID NO.3相比，所述Cas12f多肽复合后所述Cas12f多肽的核酸切割活性增强至少10％，例如10％至500％，10％至100％、10％至200％、10％至300％、10％至50％、10％至30％、10％至20％、50％至100％、50％至200％、50％至300％、100％至200％、或200％至300％。

在本发明的另一个方面提供一种CRISPR-Cas系统，其包含：

(i)Cas12f多肽，所述Cas12f多肽包含与SEQ ID NO.1所示的氨基酸序列相比具有至少80％序列同一性的氨基酸序列；以及(ii)gRNA，所述gRNA包含所述的gRNAscaffold和在所述gRNAscaffold的3’末端与靶核酸互补的靶向序列，所述gRNA与所述Cas12f多肽复合以引导所述Cas12f多肽结合至所述靶核酸。

在另一些实施方式中，CRISPR-Cas系统，其包含：(i)Cas12f多肽，所述Cas12f多肽包含与SEQ ID NO.1所示的氨基酸序列相比具有至少90％序列同一性的氨基酸序列；以及(ii)gRNA，所述gRNA包含所述的gRNA scaffold和在所述gRNA scaffold的3’末端与靶核酸互补的靶向序列，所述gRNA与所述Cas12f多肽复合以引导所述Cas12f多肽结合至所述靶核酸；其中，所述gRNAscaffold包含与SEQ ID NO.3至17、19至92、95至107任一项所示的核苷酸序列相比具有至少80％序列同一性的核苷酸序列；优选地，其中所述gRNAscaffold为SEQID NO.3至17、SEQ ID NO.19至92、SEQ ID NO.95至107任一项所示的核苷酸序列。

在另一些实施方式中，CRISPR-Cas系统，其包含：(i)Cas12f多肽，所述Cas12f多肽包含与SEQ ID NO.1所示的氨基酸序列相比具有至少90％序列同一性的氨基酸序列；以及(ii)gRNA，所述gRNA包含所述的gRNAscaffold和在所述gRNA scaffold的3’末端与靶核酸互补的靶向序列，所述gRNA与所述Cas12f多肽复合以引导所述Cas12f多肽结合至所述靶核酸；其中，所述Cas12f多肽被突变以使其具有以下一个或多个特征：核酸切割活性增强或核酸结合活性增强；所述Cas12f多肽：(i)根据SEQ ID NO.1所示的序列编号，在A11、W34、A38、H66、T78、G80、K88、G90、C98、Q103、T104、K110、N111、S112、S114、E115R、T120R、S128、N129、Q130、N136、E142、Y143、C171、Q191、G194、N203、V214、A216、N223、H238、I241、E261、L271、S272、I285、I285、V289、T291、R302、S336、E341、I369、Y371、D373、S377、V399、L401、Q415和S428中的一个或多个位置处具有氨基酸取代；或(ii)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽具有一个或多个选自A11R、W34R、A38R、H66G、T78S、G80H、K88R、G90R、C98L、Q103K、T104R、K110R、N111R、S112R、S114K、E115R、T120R、S128R、N129D、Q130H、N136K、E142R、Y143R、C171K、Q191G、G194K、N203K、V214K、A216R、N223R、H238K、I241A、E261K、L271R、S272R、I285K、I285R、V289R、T291K、R302K、S336K、E341K、I369V、Y371K、D373K、S377T、V399K、L401K、Q415R和S428K的氨基酸取代。

在另一些实施方式中，CRISPR-Cas系统，其包含：(i)Cas12f多肽，所述Cas12f多肽包含与SEQ ID NO.1所示的氨基酸序列相比具有至少90％序列同一性的氨基酸序列；以及(ii)gRNA，所述gRNA包含所述的gRNA scaffold和在所述gRNA scaffold的3’末端与靶核酸互补的靶向序列，所述gRNA与所述Cas12f多肽复合以引导所述Cas12f多肽结合至所述靶核酸；其中，

在本发明中，这些Cas12f多肽及其突变体也称为“RaCas12f1多肽”、“RaCas12f1蛋白”、“RaCas12f1效应蛋白”、“Cas12f多肽”、“Cas12f效应蛋白”、“Cas12f1多肽”、“Cas12f1效应蛋白”，这些术语在本文可互换使用。

在优选的实施方式中，所述Cas12f多肽包含或为与SEQ ID NO.1所示的氨基酸序列相比具有至少95％序列同一性氨基酸序列。例如，所述Cas12f多肽包含或为与SEQ IDNO.1所示的氨基酸序列相比具有至少95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。

在一些实施方式中，其中所述Cas12f多肽被突变以使其具有以下一个或多个特征：核酸切割活性增强或核酸结合活性增强；所述Cas12f多肽的氨基酸序列不是SEQ IDNO.1所示的氨基酸序列。

在一些实施方式中，其中所述Cas12f多肽：(i)根据SEQ ID NO.1所示的序列编号，在A11、W34、A38、H66、T78、G80、K88、G90、C98、Q103、T104、K110、N111、S112、S114、E115R、T120R、S128、N129、Q130、N136、E142、Y143、C171、Q191、G194、N203、V214、A216、N223、H238、I241、E261、L271、S272、I285、I285、V289、T291、R302、S336、E341、I369、Y371、D373、S377、V399、L401、Q415和S428中的一个或多个位置处具有氨基酸取代；或(ii)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽具有一个或多个选自A11R、W34R、A38R、H66G、T78S、G80H、K88R、G90R、C98L、Q103K、T104R、K110R、N111R、S112R、S114K、E115R、T120R、S128R、N129D、Q130H、N136K、E142R、Y143R、C171K、Q191G、G194K、N203K、V214K、A216R、N223R、H238K、I241A、E261K、L271R、S272R、I285K、I285R、V289R、T291K、R302K、S336K、E341K、I369V、Y371K、D373K、S377T、V399K、L401K、Q415R和S428K的氨基酸取代。

在优选实施方式中，其中所述Cas12f多肽为：根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽具有A11R、W34R、A38R、H66G、T78S、G80H、K88R、G90R、C98L、Q103K、T104R、K110R、N111R、S112R、S114K、E115R、T120R、S128R、N129D、N136K、E142R、Y143R、C171K、Q191G、G194K、V214K、N223R、H238K、E261K、L271R、S272R、I285K、I285R、V289R、T291K、R302K、S336K、E341K、I369V、Y371K、D373K、S377T、V399K、L401K、Q415R或S428K的单一氨基酸取代。

在更优选实施方式中，其中所述Cas12f多肽为：根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽具有A38R、S114K、S128R、N129D、E142R、C171K、G194K、N223R、E261K、L271R、E341K、Y371K、V399K或S428K的单一氨基酸取代。

在一些实施方式中，其中所述Cas12f多肽：

(1)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在N129D和S428K位置处具有氨基酸取代；(2)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在E142R和S428K位置处具有氨基酸取代；(3)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在C171K和S428K位置处具有氨基酸取代；(4)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在G194K和S428K位置处具有氨基酸取代；(5)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在N223R和S428K位置处具有氨基酸取代；(6)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在E261K和S428K位置处具有氨基酸取代；(7)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在E341K和S428K位置处具有氨基酸取代；(8)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在S428K和V399K位置处具有氨基酸取代；(9)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在A38R和N129D位置处具有氨基酸取代；(10)根据SEQ IDNO.1所示的序列编号，所述Cas12f多肽在S114K和N129D位置处具有氨基酸取代；(11)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在S128R和N129D位置处具有氨基酸取代；(12)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在N129D和C171K位置处具有氨基酸取代；(13)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在N129D和G194K位置处具有氨基酸取代；(14)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在N129D和N223R位置处具有氨基酸取代；(15)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在N129D和Y371K位置处具有氨基酸取代；(16)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在N129D和V399K位置处具有氨基酸取代；(17)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在A38R位置处具有氨基酸取代；(18)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在S114K位置处具有氨基酸取代；(19)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在S128R位置处具有氨基酸取代；(20)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在N129D位置处具有氨基酸取代；(21)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在G194K位置处具有氨基酸取代；(22)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在Y371K位置处具有氨基酸取代；(23)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在A38R、S128R和N129D位置处具有氨基酸取代；(24)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在S114K、S128R和N129D位置处具有氨基酸取代；(25)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在S128R、N129D和G194K位置处具有氨基酸取代；(26)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在S128R、N129D和Y371K位置处具有氨基酸取代；(27)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在A38R、S128R、N129D和Y371K位置处具有氨基酸取代；(28)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在S114K、S128R、N129D和Y371K位置处具有氨基酸取代；(29)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在S128R、N129D、G194K和Y371K位置处具有氨基酸取代；(30)根据SEQID NO.1所示的序列编号，所述Cas12f多肽在A38R、S114K、S128R、N129D和Y371K位置处具有氨基酸取代；(31)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在A38R、S128R、N129D、Y371K和G194K位置处具有氨基酸取代；或(32)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在Q130H、N203K、A216R和I241A位置处具有氨基酸取代。

在一些实施方式中，所述Cas12f多肽在Q130H、N203K、A216R和I241A位置处具有氨基酸取代后的氨基酸序列是SEQ ID NO.2所示的氨基酸序列。

在一些实施方式中，其中所述Cas12f多肽被突变以使其核酸切割活性部分或完全失活；所述Cas12f多肽的氨基酸序列不是SEQ ID NO.1所示的氨基酸序列，核酸切割活性部分或完全失活，所述取代导致与亲本Cas12f多肽相比，核酸切割活性降低至少10％，例如10％至500％，10％至100％、10％至200％、10％至300％、10％至50％、10％至30％、10％至20％、50％至100％、50％至200％、50％至300％、100％至200％、或200％至300％、或完全丧失。

在一些实施方式中，根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在D234位置处具有氨基酸取代，以使所述Cas12f多肽的核酸切割活性部分或完全失活；优选的，根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽具有D234A的氨基酸取代，以使所述Cas12f多肽的核酸切割活性部分或完全失活。

在一些实施方式中，所述突变导致所述Cas12f多肽的核酸结合活性、与引导RNA结合活性和/或核酸切割活性基本不变，例如与亲本Cas12f多肽相比，核酸结合活性、与gRNA结合活性和/或核酸切割活性增加或降低约10％以下，例如1％至约10％。任何在所述gRNAscaffold至少一个核苷酸替换、缺失和/或插入后仍保留Cas12f多肽结合活性的核苷酸序列均在本发明的范围之内。

在一些实施方式中，所述突变导致所述Cas12f多肽的核酸结合活性增强，例如与亲本Cas12f多肽(SEQ ID NO.1)相比，核酸结合活性增强至少10％，例如10％至500％，10％至100％、10％至200％、10％至300％、10％至50％、10％至30％、10％至20％、50％至100％、50％至200％、50％至300％、100％至200％、或200％至300％；所述Cas12f多肽的与gRNA结合活性增强，例如与亲本Cas12f多肽(SEQ ID NO.1)相比，与gRNA结合活性增强至少10％，例如10％至500％，10％至100％、10％至200％、10％至300％、10％至50％、10％至30％、10％至20％、50％至100％、50％至200％、50％至300％、100％至200％、或200％至300％；所述Cas12f多肽的核酸切割活性增强，例如与亲本Cas12f多肽(SEQ ID NO.1)相比，核酸切割活性增强至少10％，例如10％至500％，10％至100％、10％至200％、10％至300％、10％至50％、10％至30％、10％至20％、50％至100％、50％至200％、50％至300％、100％至200％、或200％至300％；并且所述Cas12f多肽(SEQ ID NO.1)的核酸切割活性降低，例如与亲本Cas12f多肽相比，核酸切割活性降低至少10％，例如10％至500％，10％至100％、10％至200％、10％至300％、10％至50％、10％至30％、10％至20％、50％至100％、50％至200％、50％至300％、100％至200％、或200％至300％、或完全丧失。

具体的，所述Cas12f多肽在特定位置被特定氨基酸取代的突变多肽名称根据人类基因组变异协会(HGVS：Human Genome Variation Society)的突变命名规则命名，例如：“所述Cas12f多肽在Q130H、N203K、A216R和I241A位置处具有氨基酸取代”中“Q130H”表示在Cas12f多肽的130位置发生了H替换原来的Q，“Q130H、N203K、A216R和I241A”表示Cas12f多肽在第130位、第203位、第216位和第241位的四个位置同时发生对应氨基酸取代。

具体的，在本发明提供的CRISPR-Cas系统中，所述Cas12f多肽为任何一个在下文描述的RaCas12f1；在Q130H、N203K、A216R和I241A位置处具有氨基酸取代的所述Cas12f多肽为任何一个在下文描述的RaCas12f1-HKRA；在本发明提供的CRISPR-Cas系统中，所述gRNA为任何一个在上文“引导RNA(gRNA)”，这些术语在本文可互换使用。

在一些实施方式中，所述CRISPR-Cas系统的靶向序列具有10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸。优选地，所述靶向序列具有18、19或20个核苷酸。

具体的，在CRISPR-Cas系统中，所述Cas12f蛋白与Cas12f的gRNA形成复合物，并且gRNA通过靶向序列为RNP复合物提供序列特异性。换言之，Cas12f蛋白借助于其与引导RNA缔合而被引导至靶核酸序列(例如染色体序列或染色体外序列，例如游离型序列、微环序列、线粒体序列、叶绿体序列等)内的靶位点(例如在靶位点处稳定)。

在一些实施方式中，所述gRNAscaffold的靶向序列与靶核酸的靶位点之间的互补性百分比为60％或更高(例如，65％或更高、70％或更高、75％或更高、80％或更高、85％或更高、90％或更高、95％或更高、97％或更高、98％或更高、99％或更高或者100％)。在一些实施方式中，所述靶向序列与靶核酸的靶位点之间的互补性百分比为80％或更高(例如，85％或更高、90％或更高、95％或更高、97％或更高、98％或更高、99％或更高或者100％)。在一些实施方式中，所述靶向序列与靶核酸的靶位点之间的互补性百分比为90％或更高(例如，95％或更高、97％或更高、98％或更高、99％或更高或者100％)。在一些实施方式中，所述靶向序列与靶核酸的靶位点之间的互补性百分比为100％。在一些实施方式中，所述靶向序列与靶核酸的靶位点之间的互补性百分比在靶核酸的靶位点最3'端的七个连续核苷酸上为100％。

在一些实施方案中，所述gRNAscaffold的靶向序列与靶核酸的靶位点之间的互补性百分比在17-25个连续核苷酸上为60％或更高(例如，70％或更高、75％或更高、80％或更高、85％或更高、90％或更高、95％或更高、97％或更高、98％或更高、99％或更高或者100％)。在一些实施方式中，所述gRNA scaffold的靶向序列与靶核酸的靶位点之间的互补性百分比在17-25个连续核苷酸上为80％或更高(例如，85％或更高、90％或更高、95％或更高、97％或更高、98％或更高、99％或更高或者100％)。在一些实施方式中，所述gRNAscaffold的靶向序列与靶核酸的靶位点之间的互补性百分比在17-25个连续核苷酸上为90％或更高(例如，95％或更高、97％或更高、98％或更高、99％或更高或者100％)。在一些实施方式中，所述gRNAscaffold的靶向序列与靶核酸的靶位点之间的互补性百分比在17-25个连续核苷酸上为100％。

在一些实施方式中，所述gRNAscaffold的靶向序列具有在17-30个核苷酸(nt)(例如，17-25个、17-22个、17-20个、18-28个、18-26个、18-24个、18-22个、18-21个、18-20个、18-19个、19-30个、19-25个、19-22个、19-20个、20-30个、20-25个或20-22个nt)的范围内的长度。在一些实施方式中，所述gRNA scaffold的靶向序列具有在17-25个核苷酸(nt)(例如，17-22个、17-20个、19-25个、19-22个、19-20个、20-25个或20-22个nt)的范围内的长度。在一些实施方式中，所述gRNAscaffold的靶向序列具有17或更多个nt(例如，18个或更多个、19个或更多个、20个或更多个、21个或更多个或者22个或更多个nt；19个nt、20个nt、21个nt、22个nt、23个nt、24个nt、25个nt等)的长度。在一些实施方式中，所述gRNAscaffold的靶向序列具有19个或更多个nt(例如，20个或更多个、21个或更多个或者22个或更多个nt；19个nt、20个nt、21个nt、22个nt、23个nt、24个nt、25个nt等)的长度。在一些实施方式中，所述gRNAscaffold的靶向序列具有17个nt的长度。在一些实施方式中，所述gRNA scaffold的靶向序列具有18个nt的长度。在一些实施方式中，所述gRNAscaffold的靶向序列具有19个nt的长度。在一些实施方式中，所述gRNAscaffold的靶向序列具有20个nt的长度。在一些实施方式中，所述gRNAscaffold的靶向序列具有21个nt的长度。在一些实施方式中，所述gRNAscaffold的靶向序列具有22个nt的长度。在一些实施方式中，所述gRNAscaffold的靶向序列具有23个nt的长度。在一些实施方式中，所述gRNA scaffold的靶向序列具有24个nt的长度。在一些实施方式中，所述gRNAscaffold的靶向序列具有25个nt的长度。在一些实施方式中，所述gRNAscaffold的靶向序列具有26个nt的长度。在一些实施方式中，所述gRNAscaffold的靶向序列具有27个nt的长度。在一些实施方式中，所述gRNA scaffold的靶向序列具有28个nt的长度。在一些实施方式中，所述gRNAscaffold的靶向序列具有15至50个核苷酸的长度(例如，15个核苷酸(nt)至20nt、20nt至25nt、25nt至30nt、30nt至35nt、35nt至40nt、40nt至45nt或45nt至50nt)。

在一些实施方式中，其中所述靶向序列的3’端连接有终止子。优选地，所述终止子为U6终止子。优选地，所述U6终止子为SEQ ID NO.108至125任一项所示的核苷酸序列。

本发明的CRISPR-Cas系统的Cas12f多肽识别并结合靶核酸的过程需要靶序列上/下游的一段短保守序列，即前间区序列临近基序(protospacer adjacent motif，PAM)的参与。gRNA介导Cas12f蛋白识别靶点序列5’端PAM，当PAM出现特定的碱基组成特征时，催化该靶点序列附近的DNA双链解链，gRNA的靶向序列通过碱基互补配对与DNA双链中的靶向链杂交形成RNA-DNA异源双链复合体，进而与靶核酸链结合。经过实验测试发现，本发明的Cas12f多肽及其突变体的PAM序列为5’-TTN(N＝A、T、C或G)，优选为5’-TTA或5’-TTC，PAM序列也可以为5’-TTCT、5’-TTTC或5’-TTTT。

本发明的另一个方面提供一种融合多肽，其包含与一个或多个异源多肽融合的Cas12f多肽，所述Cas12f多肽选自所述CRISPR-Cas系统的Cas12f多肽；优选地，其中所述一个或多个异源多肽独立地为表位标签、核定位信号或具有以下一种或多种酶促活性：外切核酸酶活性、逆转录酶活性、核酸酶活性、甲基转移酶活性、脱甲基化酶活性、乙酰转移酶活性、脱乙酰酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、脱泛素化活性、腺苷酸化活性、脱腺苷酸化活性、SUMO化活性、脱SUMO化活性、核糖基化活性、脱核糖基化活性、豆蔻酰化活性、脱豆蔻酰化活性、糖基化活性(例如来自O-GlcNAc转移酶)和脱糖基化活性、DNA修复活性、DNA损伤活性、脱氨酶活性、歧化酶活性、烷基化活性、脱嘌呤活性、氧化活性、嘧啶二聚体形成活性、整合酶活性、转座酶活性、重组酶活性、聚合酶活性、连接酶活性、解旋酶活性、光裂合酶活性和糖基化酶活；更优选地，所述酶促活性结构域具有以下一种或多种酶促活性：脱氨酶活性、甲基转移酶活性、脱甲基酶活性、乙酰转移酶活性和脱乙酰酶活性；优选地，所述一个或多个异源多肽独立地为转录阻遏结构域、转录激活结构域、脱氨酶结构域或5’-3’外切核酸酶功能域。

在一些实施方式中，所述异源多肽选自表位标签(epitope tag)。这类表位标签为现有常规的标签，包括但不限于His、V5、FLAG、HA、Myc、VSV-G、Trx等，并且本领域技术人员已知如何根据期望目的(例如，纯化、检测或示踪)选择合适的表位标签。

在一些实施方式中，所述异源多肽选自报告基因序列，这类报告基因是本领域技术人员熟知的，其实例包括但不限于GST、HRP、CAT、GFP、HcRed、DsRed、CFP、YFP、BFP等。

在一些实施方式中，所述异源多肽选自能够与DNA分子或细胞内分子结合的结构域，例如麦芽糖结合蛋白(MBP)、LexA的DNA结合结构域(DBD)、GAL4的DBD等。

在一些实施方式中，所述异源多肽还可以是可检测信号的酶、放射性同位素、特异性结合对的成员、荧光团、荧光蛋白、量子点等。

在一些实施方式中，所述异源多肽提供亚细胞定位，即异源多肽含有亚细胞定位序列(例如，用于靶向细胞核的核定位信号(NLS)、用于将融合蛋白保持在细胞核外的序列(例如核输出序列(NES))、用于将融合蛋白保留在细胞质中的序列、用于靶向线粒体的线粒体定位信号、用于靶向叶绿体的叶绿体定位信号、ER保留信号等)。在一些实施方案中，Cas12f融合多肽不包括NLS，使得蛋白质不靶向细胞核(这可能是有利的，例如，当靶核酸是存在于胞质溶胶中的RNA时)。

在优选的实施方式中，所述转录抑制结构域可以包括DNA甲基转移酶(例如DNMT1、DNMT3A、DNMT3B、DNMT3L或其任何功能变体或片段)、RYBP(RING1 andYY1 bindingprotein)催化结构域及其同源物、YAF2催化结构域及其同源物、KRAB催化结构域、MBD2催化结构域及其同源物、MeCP2催化结构域及其同源物、RBBP4催化结构域及其同源物、CDYL2催化结构域及其同源物、HP1α催化结构域及其同源物、HP1β(CBX1)催化结构域及其同源物、TOX催化结构域及其同源物、TOX3催化结构域及其同源物、TOX4催化结构域及其同源物、SCMH1催化结构域及其同源物、SCMH2催化结构域及其同源物、CBX8催化结构域及其同源物、HDAC5催化结构域及其同源物、I2BP1催化结构域及其同源物、EZH2催化结构域及其同源物、SUZ12催化结构域及其同源物、SIN3A催化结构域及其同源物、RING2催化结构域及其同源物、SetDB1催化结构域及其同源物。

在一些实施方式中，本发明提供的Cas12f融合多肽包含：i)本发明提供的Cas12f多肽；和ii)转录因子。转录因子可以包括：i)DNA结合结构域；和ii)转录激活因子。转录因子可以包括：i)DNA结合结构域；和ii)转录阻遏子。合适的转录因子包括包含转录激活因子或转录抑制子结构域的多肽(例如，Krüppel相关框(KRAB或SKD))；MadmSIN3相互作用结构域(SID)；ERF阻遏结构域(ERD)等)；基于锌指的人工转录因子；基于TALE的人工转录因子；等等。在一些实施方式中，转录因子包括VP64多肽(转录激活)。在某些情况下，转录因子包含Krüppel相关盒(KRAB)多肽(转录抑制)。在一些实施方式中，转录因子包括MadmSIN3相互作用结构域(SID)多肽(转录阻遏)。在一些实施方式中，转录因子包括ERF阻遏子结构域(ERD)多肽(转录阻遏)。在一些实施方式中，转录因子包括DNMT3A-DNMT3L(转录阻遏)。在一些实施方式中，转录因子是转录激活因子，其中转录激活因子是GAL4-VP16。在一些实施方式中，转录因子是转录激活因子，其中转录激活因子是VP64；P65；RTA；截短的P65；截短的RTA；或它们各自或之间的一个或多个的融合形式。

在一些实施方式中，在本发明提供的融合多肽中，所述一个或多个异源多肽独立地为转录阻遏结构域、转录激活结构域或脱氨酶结构域时，所述Cas12f多肽为dCas12f多肽，“dCas12f”是指核酸酶无活性的Cas12f或核酸酶死亡的Cas12f，任何使本发明的Cas12f多肽的核酸内切酶失活的合适突变都可以用于形成dCas12f，例如氨基酸序列为SEQ IDNO.1或2中D234A的突变，所述“dCas12f”为下文描述的“dRaCas12f1”、“dRaCas12f1-HKRA”或“dRaCas12f1-D234A”，这些术语在本文可互换使用。在一些实施方式中，在本发明提供的融合多肽中，所述一个或多个异源多肽独立地为5’-3’外切核酸酶功能域时，所述Cas12f多肽为有核酸酶活性的Cas12f。

在一些实施方式中，其中所述5’-3’外切核酸酶功能域为SEQ ID NO.126任一项所示的核苷酸序列。

在一些实施方式中，Cas12f融合多肽包含(融合有)核定位信号(NLS)(例如，在一些实施方式中，2个或更多、3个或更多、4个或更多、或5个或更多个NLS)。在一些实施方式中，一个或多个NLS(2个或更多个、3个或更多个、4个或更多个或者5个或更多个NLS)定位在N末端和/或C末端处或附近(例如，在50个氨基酸内)。Cas12f融合多肽包含(融合有)1至10个NLS(例如，1-9、1-8、1-7、1-6、1-5、2-10、2-9、2-8、2-7、2-6或2-5个NLS)。在一些实施方式中，Cas12f融合多肽包含(融合有)2至5个NLS(例如，2-4个或2-3个NLS)。具体地，核定位信号(NLS)连接顺序可以为：NH₂-[Cas12f]-[NLS]-COOH；NH₂-[NLS]-[Cas12f]-COOH；其中]-[表示可任选地存在的根据下文定义的连接肽(下同)。

在优选的实施方式中，所述融合多肽中的所述核定位信号来源于SV40病毒大T抗原的NLS、核质蛋白二分NLS、c-myc NLS、hRNPA1 M9 NLS、输入蛋白-α的IBB结构域NLS、肌瘤T蛋白NLS、人p53 NLS、小鼠c-abl IV的NLS、流感病毒NS1的NLS、肝炎病毒δ抗原的NLS、小鼠Mx1蛋白的NLS、人聚(ADP-核糖)聚合酶的NLS或类固醇激素受体(人)糖皮质激素的NLS。

在优选的实施方式中，所述融合多肽中的所述转录激活结构域包含选自以下的酶形成的结构域：转录激活因子、组蛋白赖氨酸甲基转移酶、组蛋白赖氨酸脱甲基酶、组蛋白乙酰转移酶以及DNA脱甲基酶；优选地，所述转录阻遏结构域包含选自以下的结构域：转录阻遏物、ZIM3结构域、KOX1阻遏结构域、MadmSIN3相互作用结构域(SID)、ERF阻遏物结构域(ERD)、SRDX阻遏结构域、组蛋白赖氨酸甲基转移酶、组蛋白赖氨酸脱甲基酶、组蛋白赖氨酸脱乙酰酶、DNA甲基化酶以及外周募集元件。在优选的实施方式中，所述转录激活结构域包含VP64；P65；RTA；截短的P65；截短的RTA；或它们各自或之间的一个或多个的融合形式。在优选的实施方式中，所述转录阻遏结构域选自KRAB催化结构域、DNA甲基转移酶或其组合。

在一些实施方式中，所述转录抑制结构域的数量可为两个以上，这些转录抑制结构域通过连接肽串联后连接在Cas12f(如dRaCas12f1-HKRA或dRaCas12f1)蛋白的N端或/和C端；所述转录激活结构域的数量可为两个以上，这些转录激活结构域通过连接肽串联后连接在Cas12f(如dRaCas12f1-HKRA或dRaCas12f1)蛋白的N端或/和C端。

在优选的实施方式中，所述融合多肽的结构选自：NH₂-[Cas12f]-[转录调控结构域]-COOH；NH₂-[转录调控结构域]-[Cas12f]-COOH；NH₂-[Cas12f]-[转录激活结构域]-COOH；NH₂-[转录激活结构域]-[Cas12f]-COOH；NH₂-[NLS]-[Cas12f]-[转录激活结构域]-COOH；NH₂-[Cas12f]-[转录激活结构域]-[NLS]-COOH；NH₂-[NLS]-[Cas12f]-[转录激活结构域]-[NLS]-COOH；NH₂-[NLS]-[转录激活结构域]-[Cas12f]-COOH；NH₂-[转录激活结构域]-[Cas12f]-[NLS]-COOH；NH₂-[NLS]-[转录激活结构域]-[Cas12f]-[NLS]-COOH；NH₂-[Cas12f]-[VP64-P65-RTA融合蛋白及其截短的融合蛋白]-COOH；NH₂-[VP64-P65-RTA融合蛋白及其截短的融合蛋白]-[Cas12f]-COOH；NH₂-[NLS]-[Cas12f]-[VP64-P65-RTA融合蛋白及其截短的融合蛋白]-COOH；NH₂-[Cas12f]-[VP64-P65-RTA融合蛋白及其截短的融合蛋白]-[NLS]-COOH；NH₂-[NLS]-[Cas12f]-[VP64-P65-RTA融合蛋白及其截短的融合蛋白]-[NLS]-COOH；

NH₂-[NLS]-[VP64-P65-RTA融合蛋白及其截短的融合蛋白]-[Cas12f]-COOH；NH₂-[VP64-P65-RTA融合蛋白及其截短的融合蛋白]-[Cas12f]-[NLS]-COOH；NH₂-[NLS]-[Cas12f]-[VP64-P65-RTA融合蛋白及其截短的融合蛋白]-[NLS]-COOH；NH₂-[Cas12f]-[转录抑制结构域]-COOH；NH₂-[转录抑制结构域]-[Cas12f]-COOH；NH₂-[NLS]-[Cas12f]-[转录抑制结构域]-COOH；NH₂-[Cas12f]-[转录抑制结构域]-[NLS]-COOH；

NH₂-[NLS]-[Cas12f]-[转录抑制结构域]-[NLS]-COOH；NH₂-[NLS]-[转录抑制结构域]-[Cas12f]-COOH；

NH₂-[转录抑制结构域]-[Cas12f]-[NLS]-COOH；NH₂-[NLS]-[转录抑制结构域]-[Cas12f]-[NLS]-COOH；

NH₂-[Cas12f]-[第一转录抑制结构域]-[第二转录抑制结构域]-COOH；NH₂-[Cas12f]-[第二转录抑制结构域]-[第一转录抑制结构域]-COOH；NH₂-[第一转录抑制结构域]-[第二转录抑制结构域]-[Cas12f]-COOH；NH₂-[第二转录抑制结构域]-[第一转录抑制结构域]-[Cas12f]-COOH；NH₂-[第一转录抑制结构域]-[Cas12f]-[第二转录抑制结构域]-COOH；NH₂-[第二转录抑制结构域]-[Cas12f]-[第一转录抑制结构域]-COOH；NH₂-[NLS]-[Cas12f]-[KRAB催化结构域]-[DNMT3A-DNMT3L]-COOH；NH₂-[Cas12f]-[KRAB催化结构域]-[DNMT3A-DNMT3L]-[NLS]-COOH；NH₂-[NLS]-[Cas12f]-[KRAB催化结构

域]-[DNMT3A-DNMT3L]-[NLS]-COOH；NH₂-[NLS]-[KRAB催化结构

域]-[DNMT3A-DNMT3L]-[Cas12f]-COOH；NH₂-[KRAB催化结构

域]-[DNMT3A-DNMT3L]-[Cas12f]-[NLS]-COOH；NH₂-[NLS]-[KRAB催化结构

域]-[Cas12f]-[DNMT3A-DNMT3L]-COOH；NH₂-[KRAB催化结构

域]-[Cas12f]-[DNMT3A-DNMT3L]-[NLS]-COOH；NH₂-[NLS]-[KRAB催化结构

域]-[Cas12f]-[DNMT3A-DNMT3L]-[NLS]-COOH；NH₂-[NLS]-[DNMT3A-DNMT3L]-[Cas12f]-[KRAB催化结构域]-COOH；NH₂-[DNMT3A-DNMT3L]-[Cas12f]-[KRAB催化结构域]-[NLS]-COOH；和

NH₂-[NLS]-[DNMT3A-DNMT3L]-[Cas12f]-[KRAB催化结构域]-[NLS]-COOH。

在一些实施方式中，所述融合多肽中的所述脱氨酶结构域包括腺苷脱氨酶结构域、胞苷脱氨酶结构域或其组合。

本发明提供的碱基编辑器包括腺嘌呤碱基编辑器(ABEs)和胞嘧啶碱基编辑器(CBEs)。在ABEs中，将腺苷脱氨酶结构域与Cas12f蛋白融合，可实现A·T碱基对转化为G·C碱基对。在一些实施方式中，本发明提供的碱基编辑器包括第一腺苷脱氨酶结构域与第二腺苷脱氨酶结构域，它们可以是相同的腺苷脱氨酶结构域，也可以是不同的腺苷脱氨酶结构域。在CBEs中，胞苷脱氨酶结构域APOBEC/AID与Cas12f蛋白融合，并与一个或多个尿嘧啶糖基化酶抑制剂(UGI)融合，以提高CBEs碱基编辑的准确性和效率，将C·G碱基对转化为T·A碱基对。

在优选的实施方式中，所述融合多肽中的所述腺苷脱氨酶结构域可以来源于γ-变形菌腺苷脱氨酶、肠杆菌腺苷脱氨酶、金黄色葡萄球菌TadA、枯草杆菌TadA、鼠伤寒沙门菌(Sal monellatyphimurium)TadA、腐败希瓦菌TadA、流感嗜血杆菌F3031 TadA、新月柄杆菌TadA或硫还原地杆菌(Geobactersulfurreducens)TadA。

在优选的实施方式中，所述胞苷脱氨酶选自活化诱导的胞苷脱氨酶(AID)、载脂蛋白B mRNA编辑复合物(APOBEC)和PmCDA1。在优选的实施方式中，所述腺苷脱氨酶结构域是TadA、ecTadA、saTadA、ecTadA7.10、TadA-8e、TadA8.17、TadA8.20、TadA9或其组合。

在优选的实施方式中，所述融合多肽的结构选自：

NH₂-[腺苷脱氨酶结构域]-[Cas12f]-COOH；NH₂-[Cas12f]-[腺苷脱氨酶结构域]-COOH；NH₂-[第一腺苷脱氨酶结构域]-[第二腺苷脱氨酶结构域]-[Cas12f]-COOH；NH₂-[第一腺苷脱氨酶结构域]-[Cas12f]-[第二腺苷脱氨酶结构域]-COOH；NH₂-[Cas12f]-[第一腺苷脱氨酶结构域]-[第二腺苷脱氨酶结构域]-COOH；

NH₂-[第二腺苷脱氨酶结构域]-[第一腺苷脱氨酶结构域]-[Cas12f]-COOH；NH₂-[第二腺苷脱氨酶结构域]-[Cas12f]-[第一腺苷脱氨酶结构域]-COOH；NH₂-[Cas12f]-[第二腺苷脱氨酶结构域]-[第一腺苷脱氨酶结构域]-COOH；NH₂-[腺苷脱氨酶结构域]-[Cas12f]-[NLS]-COOH；NH₂-[Cas12f]-[腺苷脱氨酶结构域]-[NLS]-COOH；NH₂-[NLS]-[腺苷脱氨酶结构域]-[Cas12f]-COOH；NH₂-[NLS]-[Cas12f]-[腺苷脱氨酶结构域]-COOH；NH₂-[NLS]-[腺苷脱氨酶结构域]-[Cas12f]-[NLS]-COOH；NH₂-[NLS]-[Cas12f]-[腺苷脱氨酶结构域]-[NLS]-COOH；NH₂-[胞苷脱氨酶结构域]-[Cas12f]-[尿嘧啶糖基化酶抑制剂(UGI)]-COOH；NH₂-[尿嘧啶糖基化酶抑制剂(UGI)]-[Cas12f]-[胞苷脱氨酶结构域]-COOH；NH₂-[NLS]-[胞苷脱氨酶结构域]-[Cas12f]-[尿嘧啶糖基化酶抑制剂(UGI)]-COOH；NH₂-[NLS]-[尿嘧啶糖基化酶抑制剂(UGI)]-[Cas12f]-[胞苷脱氨酶结构域]-COOH；NH₂-[胞苷脱氨酶结构域]-[Cas12f]-[尿嘧啶糖基化酶抑制剂(UGI)]-[NLS]-COOH；NH₂-[尿嘧啶糖基化酶抑制剂(UGI)]-[Cas12f]-[胞苷脱氨酶结构域]-[NLS]-COOH；NH₂-[NLS]-[胞苷脱氨酶结构域]-[Cas12f]-[尿嘧啶糖基化酶抑制剂(UGI)]-[NLS]-COOH；和NH₂-[NLS]-[尿嘧啶糖基化酶抑制剂(UGI)]-[Cas12f]-[胞苷脱氨酶结构域]-[NLS]-COOH。

在优选的实施方式中，所述5’-3’外切核酸酶功能域来自T5噬菌体；所述融合多肽的结构选自：NH₂-[5’-3’外切核酸酶功能域]-[Cas12f]-COOH；NH₂-[Cas12f]-[5’-3’外切核酸酶功能域]-COOH；

NH₂-[NLS]-[5’-3’外切核酸酶功能域]-[Cas12f]-COOH；NH₂-[NLS]-[Cas12f]-[5’-3’外切核酸酶功能域]-COOH；NH₂-[5’-3’外切核酸酶功能域]-[Cas12f]-[NLS]-COOH；NH₂-[Cas12f]-[5’-3’外切核酸酶功能域]-[NLS]-COOH；NH₂-[NLS]-[5’-3’外切核酸酶功能域]-[Cas12f]-[NLS]-COOH；和NH₂-[NLS]-[Cas12f]-[5’-3’外切核酸酶功能域]-[NLS]-COOH。

本发明的另一个方面提供一种复合物，其包含所述的融合多肽以及gRNA，所述gRNA包含所述的gRNAscaffold和在所述gRNAscaffold的3’末端与靶核酸互补的靶向序列，所述gRNA与所述融合多肽复合以引导所述融合多肽结合至靶核酸；优选地，所述的融合多肽包含Cas12f多肽和融合在所述Cas12f多肽C端的5’-3’外切核酸酶功能域，所述融合多肽包含SEQ ID NO.127所示的氨基酸序列；优选地，所述复合物是表观遗传编辑器，所述融合多肽包含SEQ ID NO.129至131任一个所示的氨基酸序列；优选地，所述复合物是碱基编辑器，所述融合多肽包含SEQ ID NO.132或133所示的氨基酸序列。

在优选的实施方式中，所述复合物是表观遗传编辑器。在优选的实施方式中，所述复合物是碱基编辑器。在优选的实施方式中，所述复合物是基因敲除编辑器。

具体地，本发明提供的dCas12f(如dRaCas12f1、dRaCas12f1-HKRA)蛋白的gRNA的靶向序列可作用于靶核酸的转录起始位点(TSS)上游3000bp，优选为200-500bp之间，使得该表观遗传编辑器作用于目的基因的启动子、增强子、沉默子等调控元件。

在一些实施方案中，所述Cas12f多肽可经由一个或多个接头多肽(或称连接肽)与异源多肽融合。接头多肽可具有多种氨基酸序列中的任一种。蛋白质可通过间隔肽连接，间隔肽通常具有柔性性质，但不排除其他化学键。合适的接头包括长度在4至40个氨基酸之间或者长度在4至25个氨基酸之间的多肽。这些接头可通过使用合成的编码接头的寡核苷酸来产生以偶联蛋白质，或者可由编码融合蛋白的核酸序列编码。可使用具有一定程度柔性的肽接头。连接肽实际上可具有任何氨基酸序列，应记住优选的接头将具有产生总体上柔性的肽的序列。小氨基酸(诸如甘氨酸和丙氨酸)的用途用于产生柔性肽。对于本领域技术人员来说，产生此类序列是常规的。多种不同的接头是可商购获得的并且被认为是适合使用的。

接头多肽的实例包括甘氨酸聚合物(G)n、甘氨酸-丝氨酸聚合物、甘氨酸-丙氨酸聚合物、丙氨酸-丝氨酸聚合物。连接肽还可以是各种XTEN linker等，XTEN linker的长度约为16-80个氨基酸，XTEN linker可以为XTEN16 linker、XTEN18 linker、XTEN32 linker、XTEN80 linker。本领域技术人员将认识到，与任何所需元件缀合的肽的设计可包括全部或部分柔性的接头，使得接头可包括柔性接头以及赋予较少柔性结构的一个或多个部分。

本发明的另一个方面提供一种核酸，其包含编码gRNA的核苷酸序列，所述gRNA包含所述的gRNAscaffold和在所述gRNAscaffold的3’末端与靶核酸互补的靶向序列；优选地，所述核酸是DNA或mRNA。

本发明的另一个方面提供一种核酸，包含编码所述的CRISPR-Cas系统的Cas12f多肽或所述的融合多肽的多核苷酸；优选地，所述多核苷酸被密码子优化以在原核或真核细胞中表达；优选地，所述多核苷酸包含或为如SEQ ID NO.1至2任一个所示的核苷酸序列。

本发明的另一个方面提供一种载体，其包含本发明提供的任何一种核酸。在优选的实施方式中，所述载体是质粒或病毒载体。在优选的实施方式中，所述病毒载体是腺相关病毒载体、腺病毒载体、逆转录病毒载体、慢病毒载体或单纯疱疹病毒载体。

本发明的另一个方面提供一种载体系统，其包括第一载体和与第一载体不同的第二载体，所述第一载体包含编码本发明提供的任何一种CRISPR-Cas系统的Cas12f多肽或所述的融合多肽的多核苷酸；所述第二载体包含gRNA或编码所述gRNA的核苷酸序列。在优选的实施方式中，所述第一载体和第二载体独立地是质粒或病毒载体。在优选的实施方式中，所述病毒载体是腺相关病毒载体、腺病毒载体、逆转录病毒载体、慢病毒载体或单纯疱疹病毒载体。

本发明的另一个方面提供一种递送系统，包含本发明提供的任一CRISPR-Cas系统、本发明提供的任一融合多肽、本发明提供的任一复合物、本发明提供的任一核酸、本发明提供的任一载体、或本发明提供的任一载体系统。在优选的实施方式中，所述递送系统包括脂质体、纳米颗粒或外泌体。

本发明的另一个方面提供一种细胞，其包含本发明提供的任一CRISPR-Cas系统、本发明提供的任一融合多肽、本发明提供的任一复合物、本发明提供的任一核酸、本发明提供的任一载体、本发明提供的任一载体系统、或本发明提供的任一递送系统。在优选的实施方式中，所述细胞是真核细胞。在优选的实施方式中，所述细胞是人细胞。

本发明的另一个方面提供组合物或试剂盒，其包含本发明提供的任一CRISPR-Cas系统、本发明提供的任一融合多肽、本发明提供的任一复合物、本发明提供的任一核酸、本发明提供的任一载体、本发明提供的任一载体系统、本发明提供的任一递送系统、或本发明提供的任一细胞；以及药学上可接受的载体。

本发明的组合物或试剂盒可进一步包括药学上可接受的载体，例如一种或多种另外的试剂，例如，i)缓冲剂；ii)蛋白酶抑制剂；iii)核酸酶抑制剂；iv)显影或可视化可检测标记所需的试剂；v)阳性和/或阴性对照靶DNA；vi)阳性和/或阴性对照Cas12f引导RNA等。本发明的组合物或试剂盒可包括：a)如上所述的本发明的Cas12f系统的组分，或者可包含本发明的Cas12f系统；和b)治疗剂。

本发明的另一个方面提供修饰靶核酸的方法，所述方法包括使靶核酸与本发明提供的任一CRISPR-Cas系统、本发明提供的任一复合物、本发明提供的任一载体系统、或本发明提供的任一递送系统接触，所述接触导致所述靶核酸被修饰。在优选的实施方式中，所述修饰包括增加或减少所述靶核酸中的靶序列的表达。在优选的实施方式中，所述修饰包括对所述靶核酸中的靶腺嘌呤或靶胞嘧啶进行脱氨基以实现碱基对转换。

具体的，当与Cas12f引导RNA结合时，本发明的Cas12f多肽或本发明的Cas12f融合多肽可结合靶核酸，并且在一些实施方式中，可结合并修饰靶核酸。靶核酸可以是任何核酸(例如，DNA、RNA)，可以是双链或单链的，可以是任何类型的核酸(例如，染色体(基因组DNA)、衍生自染色体、染色体DNA、质粒、病毒、细胞外、细胞内、线粒体、叶绿体、线性、环状等)并且可来自任何生物体(例如，只要Cas12f引导RNA包含与靶核酸中的靶序列杂交的核苷酸序列，使得靶核酸可被靶向即可)。靶核酸可以是DNA或RNA。靶核酸可以是双链的(例如，dsDNA、dsRNA)或单链的(例如，ssRNA、ssDNA)。

在优选的实施方式中，其中所述靶核酸选自：双链DNA、单链DNA、RNA、基因组DNA和染色体外DNA。在优选的实施方式中，其中所述接触在体外在细胞外部发生、在培养的细胞内部发生或在体内细胞内部发生。在优选的实施方式中，所述细胞是真核细胞，更优选为人细胞。

本发明的另一个方面提供了用于治疗被诊断患有与点突变相关或由点突变引起的疾病的受试者的方法，所述点突变可以通过本文提供的碱基编辑器来校正。例如，在一些实施例中，提供了一种方法，包括向患有这种疾病的受试者(例如，与如上所述的点突变相关联的癌症)施用有效量的表观遗传编辑器、碱基编辑器或基因敲除编辑器，该编辑器纠正点突变、敲除疾病相关基因、激活/抑制疾病相关基因或将失活突变引入疾病相关基因。在一些实施方案中，该疾病是增殖性疾病。在一些实施方案中，该疾病是遗传性疾病。在一些实施方案中，该疾病是肿瘤性疾病。在一些实施方案中，该疾病是一种代谢性疾病。

具体地，本文提供的融合蛋白可用于治疗各种罕见病、肿瘤、癌症、炎症、病毒感染疾病、遗传疾病、中枢神经系统疾病、衰老和多种自身免疫性疾病以及常见和慢性疾病。更具体地，治疗的疾病可以为高血压、高脂血症、特发性纤维化(IPF)、肝纤维化、乙型肝炎病毒(HBV)、肝细胞癌(HCC)、肩肱型肌营养不良症(FSHD)、杂合子家族性高胆固醇血症(HeFH)、α-1抗胰蛋白酶缺乏症(A1AD)、非动脉性前部缺血性视神经病变(NAION)、视网膜色素变性(RP)或杜氏肌营养不良(DMD)。

附图说明

图1显示本发明的GFxxFP的报告系统验证原理的示意图。

图2显示本发明的构建GFxxFP的报告细胞的第一种载体的结构图。

图3显示本发明的构建GFxxFP的报告细胞的第二种载体的结构图。

图4显示本发明的RaCas12f1效应蛋白与不同gRNA scaffold在报告细胞中的切割效率。

图5显示本发明的不同RaCas12f1突变蛋白体在报告细胞中的切割效率。

图6显示本发明的载体A至载体C的重组载体图。

图7通过一代测序结果展示本发明的RaCas12f1突变蛋白体以及与T5 exo融合蛋白在真核细胞的TTR基因的切割活性。

图8通过高通量测序结果展示本发明的RaCas12f1突变蛋白体以及与T5 exo融合蛋白在真核细胞的TTR基因的插入缺失率(Indel％)。

图9通过高通量测序结果展示本发明的RaCas12f1突变蛋白体以及与T5 exo融合蛋白在真核细胞的其他基因的插入缺失率(Indel％)。

具体实施方式

序列表

/>

实施例

实施例1.构建GFxxFP的报告系统

为了灵敏地检测本申请CRISPR/RaCas12f1系统与不同gRNAscaffold的切割活性，构建含有编码RaCas12f1序列、gRNA和编码TagBFP序列的第一载体，以及含有编码mCherry序列、P2A和编码GFxxFP序列的第二载体。第一种载体的结构图如图2：将编码RaCas12f1的序列(SEQ ID NO.1)、编码gRNA的序列和编码TagBFP蓝色荧光蛋白的序列构建至转染载体上，命名为pCMV-RaCas12f1-gRNA-VEGFA2-TagBFP；其中，gRNA包括gRNA scaffold和在该gRNAscaffold的3’末端与靶核酸互补的靶向序列(VEGFA2 Target)，VEGFA2 Target的核苷酸序列为SEQ ID NO.134，gRNA scaffold的核苷酸序列为SEQ ID NO.3；RaCas12f1蛋白通过CMV启动子表达，且RaCas12f1的序列两端连接SV40 NLS序列，gRNA通过U6启动子转录，TagBFP通过hPGK启动子启动表达，通过TagBFP蛋白的蓝色荧光指示该载体成功转染宿主细胞。第二种载体的结构图如图3：将编码mCherry蛋白的序列、自剪切多肽P2A和编码GFxxFP序列依次构建至慢病毒表达载体上，命名为pLenti-EF1a-mCherry-P2A-GFxxFP-VEGA2；其中，编码mCherry蛋白的序列、自剪切多肽P2A和编码GFxxFP序列通过EF-1a启动子启动表达，GFxxFP中d1EGFP和d2EGFP序列为两个同源臂，d1EGFP和d2EGFP序列分别是编码绿色荧光蛋白基因EGFP的N端的199aa序列和C端的199aa序列，这两段序列共有160aa的重叠，d1EGFP和d2EGFP序列之间有插入片段，插入片段的5’端至3”端依次含有终止密码子TGA、TTC PAM序列(SEQ ID NO.135)、靶向序列(VEGFA2 Target，SEQ ID NO.134)和NGG PAM序列(SEQ ID NO.136)，即插入片段的序列为：TTC-SEQ ID NO.134-GGG，VEGFA2 Target靶向序列的5’端为TTC PAM，其3’端为GGG PAM使其同时适用于以下的CRISPR/RaCas12f1系统和CRISPR/SpCas9系统，通过mCherry蛋白的红色荧光指示该载体成功转染宿主细胞。

同样的，参照上述方法，在gRNA的3’末端构建U6终止子，具体包括：在SEQ ID NO.3的3’末端与VEGFA2 Target连接后再连接U6终止子-14(SEQ ID NO.121)，该gRNA的结构为SEQ ID NO.18。

同样的，将SpCas9的密码子优化的核苷酸编码序列替换上述第一载体的RaCas12f1，形成pCMV-SpCas9-gRNA-VEGFA2-TagBFP阳性对照载体，其中，该阳性对照载体的gRNA是VEGFA2 Target(SEQ ID NO.134)的3’末端连接SpCas9 gRNAscaffold(SEQ IDNO.136)，通过TagBFP蓝色荧光指示阳性对照载体成功转染宿主细胞。

同样的，参照上述方法，构建相应的转录各自gRNA scaffold(SEQ ID NO.4至SEQID NO.107)的第一种载体，即将其余gRNA scaffold(SEQ ID NO.4至SEQ ID NO.107)各自替换上述SEQ ID NO.3序列，通过TagBFP蓝色荧光指示第一种载体成功转染宿主细胞。

同样的，参照上述方法，于pCMV-RaCas12f1-gRNA-VEGFA2-TagBFP载体上构建不含有gRNA scaffold的空白对照载体，通过TagBFP蓝色荧光指示空白对照载体成功转染宿主细胞。

实施例2.利用荧光报告系统比较不同gRNAscaffold的切割活性

GFxxFP的报告系统验证原理如图1所示，将上述构建的第一载体和第二载体共转染至人类细胞系HEK293细胞中，通过TagBFP蛋白和mCherry蛋白的荧光指示两种载体成功转染宿主细胞，宿主细胞中的d1EGFP和d2EGFP之间含有终止密码子TGA，宿主细胞无法表达正常EGFP；第一载体在宿主细胞中表达RaCas12f1或SpCas9蛋白和对应的转录gRNA，该gRNA与对应的Cas蛋白结合形成RNP复合物后，RNP复合物识别GFxxFP中PAM，gRNA的靶向序列(VEGFA2 Target)引导RNP复合物至宿主细胞GFxxFP上的靶向序列，CRISPR/RaCas12f1切割GFxxFP上的靶向序列，产生DSB，然后GFxxFP利用SSA修复机制产生正确的EGFP编码框，表达正常EGFP，使宿主细胞由无绿色荧光变为有绿色荧光，如图1底部结果(该结果为假设结果)，当gRNA只有gRNAscaffold无靶向序列时，宿主细胞无绿色荧光；当gRNA含有gRNAscaffold和靶向序列时，宿主细胞产生绿色荧光。

用电转染法分别将上述表达RaCas12f1或SpCas9蛋白和转录不同gRNA的第一载体pCMV-RaCas12f1-gRNA-VEGFA2-TagBFP、阳性对照载体或空白对照载体(蓝色荧光)和转录pLenti-EF1a-mCherry-P2A-GFxxFP-VEGA2的第二载体(红色荧光)转至HEK293细胞系中。在培养48小时后，通过流式细胞仪分选得到转染双阳性(红色和蓝色荧光两者)的细胞。在同时发红光(mCherry⁺)和发蓝光(BFP⁺)阳性细胞中检测绿色荧光(GFP⁺)细胞的绿色荧光强度以筛选适用于RaCas12f1及其突变体的gRNAscaffold。结果如图4和图5，图4至图6横坐标为gRNA scaffold，横坐标的名称与序列表的名称列一一对应，图4A至C、图4G至I横坐标的NT表示第一载体的gRNA不含有gRNAscaffold(转染空白对照载体的实验组)，图4A至C横坐标的“WT”和图4H横坐标的“RasgWT”均表示gRNAscaffold序列为SEQ ID NO.3(转染含有SEQID NO.3第一载体的实验组)，图4和图5的“％ofGFP⁺cells/mCherry⁺BFP⁺cells”表示GFP阳性细胞/mCherry和BFP阳性细胞(％)。

图4A为第一轮改造的结果，图4A横坐标名称为MS1-MS24依次为SEQ ID NO.4-SEQID NO.27，将含有这些gRNAscaffold的第一载体和第二载体共转染HEK293按照上述方法培养后检测绿色荧光强度，纵坐标为红色和蓝色荧光细胞中绿色荧光强度。绿色荧光强度可表征这些gRNAscaffold的切割活性，绿色荧光强度越高其切割活性越高，其中SEQ IDNO.12-SEQ ID NO.21和SEQ ID NO.23-SEQ ID NO.27的gRNA scaffold具有较高的切割活性(较高绿色荧光强度)，SEQ ID NO.12-SEQ ID NO.16、SEQ ID NO.23-SEQ ID NO.27的gRNAscaffold显著强于SEQ ID NO.3的gRNAscaffold。

进过第一轮改造，挑选切割活性最高的SEQ ID NO.12和SEQ ID NO.13进行第二轮改造。图4B为第二轮改造的结果，图4B横坐标从左列到右列依次为SEQ ID NO.12-13、SEQID NO.29-41，将含有这些gRNAscaffold的第一载体和第二载体共转染HEK293按照上述方法培养后检测绿色荧光强度，纵坐标为红色和蓝色荧光细胞中绿色荧光强度。绿色荧光强度可表征这些gRNAscaffold的切割活性，绿色荧光强度越高其切割活性越高，其中SEQ IDNO.29-40的gRNAscaffold具有较高的切割活性(显著强于SEQ ID NO.3)，SEQ ID NO.29-38的gRNAscaffold显著强于SEQ ID NO.12或SEQ ID NO.13，其中，SEQ ID NO.29、30、33和36的gRNAscaffold切割活性较高。

同样的，挑选切割活性较高的SEQ ID NO.23和SEQ ID NO.24进行第二轮改造。图4C为第二轮改造的结果，图4C横坐标从左列到右列依次为SEQ ID NO.23-24、SEQ IDNO.42-53，将含有这些gRNA scaffold的第一载体和第二载体共转染HEK293按照上述方法培养后检测绿色荧光强度，纵坐标为红色和蓝色荧光细胞中绿色荧光强度。绿色荧光强度可表征这些gRNAscaffold的切割活性，绿色荧光强度越高其切割活性越高，其中SEQ IDNO.42-46的gRNA scaffold具有较高的切割活性分别强于SEQ ID NO.3、23和24，其中，SEQID NO.42、43和46的gRNAscaffold切割活性较高。

接着，参照图4C中第二轮改造后切割活性较高的SEQ ID NO.23、24、42、43和46的突变方式，在SEQ ID NO.3基础上进行第三轮组合突变改造，图4D为第三轮改造的结果，图4D纵坐标表示gRNA scaffold，横坐标为红色和蓝色荧光细胞中绿色荧光强度，其中，图4D纵坐标从底行到顶行的序列依次为SEQ ID NO.3、23、24、43、46、42、54、55、56、57、58、59、60、61、62和63，将含有这些gRNAscaffold的第一载体和第二载体共转染HEK293按照上述方法培养后检测绿色荧光强度，纵坐标为红色和蓝色荧光细胞中绿色荧光强度。绿色荧光强度可表征这些gRNAscaffold的切割活性，绿色荧光强度越高其切割活性越高，其中SEQ IDNO.54-63的gRNAscaffold具有较高的切割活性分别强于SEQ ID NO.23、24、42、43和46，其中，SEQ ID NO.58、61和63的gRNAscaffold切割活性较高。

同样的，挑选图4B中第二轮改造后切割活性较高的SEQ ID NO.36进行第三轮改造。图4E为第三轮改造的结果，图4E纵坐标表示gRNA scaffold，横坐标为红色和蓝色荧光细胞中绿色荧光强度，其中，图4E纵坐标从底行到顶行的序列依次为SEQ ID NO.36、64至78，将含有这些gRNAscaffold的第一载体和第二载体共转染HEK293按照上述方法培养后检测绿色荧光强度，纵坐标为红色和蓝色荧光细胞中绿色荧光强度。绿色荧光强度可表征这些gRNA scaffold的切割活性，绿色荧光强度越高其切割活性越高，其中SEQ ID NO.64至78的gRNA scaffold具有切割活性，但与SEQ ID NO.36相比没有显著提高。

接着，参照图4A中第一轮和图4B中第二轮改造后切割活性较高的SEQ ID NO.25、26和29，以及SEQ ID NO.28的突变形式，在SEQ ID NO.3基础上进行第四轮组合突变改造，图4F为第四轮改造的结果，图4F纵坐标表示gRNA scaffold，横坐标为红色和蓝色荧光细胞中绿色荧光强度，其中，图4F纵坐标从底行到顶行的序列依次为SEQ ID NO.3、29、25、26、28、79、80、81、82、83、84和85，将含有这些gRNAscaffold的第一载体和第二载体共转染HEK293按照上述方法培养后检测绿色荧光强度，纵坐标为红色和蓝色荧光细胞中绿色荧光强度。绿色荧光强度可表征这些gRNAscaffold的切割活性，绿色荧光强度越高其切割活性越高，其中SEQ ID NO.79-85的gRNAscaffold具有较高的切割活性分别强于SEQ ID NO.3、25、26和28。

接着，参照图4A中第一轮、图4D中第三轮和图4E中第三轮改造后切割活性较高的SEQ ID NO.16、27、36和63，在SEQ ID NO.3基础上进行第五轮组合突变改造；图4G为第五轮改造的结果，图4G横坐标表示gRNAscaffold，纵坐标为红色和蓝色荧光细胞中绿色荧光强度，其中图4G横坐标从左列到右列的序列依次为SEQ ID NO.3、16、27、63、36、86、87、88、89、90、91和92，将含有这些gRNAscaffold的第一载体和第二载体共转染HEK293按照上述方法培养后检测绿色荧光强度，纵坐标为红色和蓝色荧光细胞中绿色荧光强度；同时设置阳性对照组，即将pCMV-SpCas9-gRNA-VEGFA2-TagBFP阳性对照载体和上述第二载体，共转染HEK293按照上述方法培养后检测绿色荧光强度，结果如图4G最右列的SpCas9为该阳性对照组结果。绿色荧光强度可表征这些gRNAscaffold的切割活性，绿色荧光强度越高其切割活性越高，其中SEQ ID NO.63、36、86至92的gRNAscaffold具有较高的切割活性分别强于SEQID NO.3、16和27，且SEQ ID NO.36、88、90、91和92的切割活性均强于SpCas9的切割活性，最后筛选得到适合RaCas12f1蛋白的gRNAscaffold(SEQ ID NO.92)，将SEQ ID NO.92命名为Rasgmax，后续实施例采用Rasgmax筛选RaCas12f1蛋白的有效突变位点。

进一步地，对现有gRNA scaffold进行改造，SEQ ID NO.95至102是对现有的gRNAscaffold(SEQ ID NO.93和94)进行截短或/和插入茎环改造后得到，分别将含有这些gRNAscaffold(SEQ ID NO.95至102)的第一载体和第二载体共转染HEK293按照上述方法培养后检测绿色荧光强度，绿色荧光强度可表征这些gRNA scaffold的切割活性，绿色荧光强度越高其切割活性越高，结果如图4H，图4H横坐标表示gRNA scaffold，纵坐标为红色和蓝色荧光细胞中绿色荧光强度，其中图4H横坐标从左列到右列的序列依次为SEQ ID NO.97、98、99、100、101、102、95、96、94、93和3，其中SEQ ID NO.97-100和95的gRNAscaffold具有较高的切割活性，分别强于SEQ ID NO.3、93和94。

接着，挑选图4H中改造后切割活性较高的SEQ ID NO.99进行优化。图4I为优化结果，图4I横坐标表示gRNA scaffold，纵坐标为红色和蓝色荧光细胞中绿色荧光强度，其中，图4I横坐标从左列到右列的序列依次为SEQ ID NO.99、103、104、105、106、107和95，将含有这些gRNAscaffold的第一载体和第二载体共转染HEK293按照上述方法培养后检测绿色荧光强度，纵坐标为红色和蓝色荧光细胞中绿色荧光强度。绿色荧光强度可表征这些gRNAscaffold的切割活性，绿色荧光强度越高其切割活性越高，其中SEQ ID NO.103、104、105和106的gRNA scaffold具有切割活性，且SEQ ID NO.103、104和105强于SEQ ID NO.99。

实施例3.利用荧光报告系统比较不同RaCas12f1蛋白的点突变的切割活性

按照实施例1和2的方法检测不同点突变RaCas12f1蛋白系统的切割活性，以RaCas12f1蛋白(SEQ ID NO.1)为基础，分别构建RaCas12f1单一位点突变库，单一点突变位点分别为A11R、W34R、A38R、S55R、H66G、T78S、G80H、N84K、K88R、G90R、C98L、Q103K、T104K、T104R、K110R、N111R、S112R、S114K、E115R、T120R、I124R、S128R、N129D、D133R、N136K、E142R、Y143R、C171K、Q191G、G194K、V214K、N223R、H238K、E261K、L271R、S272R、I285K、I285R、V289R、T291K、R302K、S336K、T339K、E341K、I369V、Y371K、D373K、S377T、V399K、L401K、Q415R和S428K，将含有这些RaCas12f1点突变的第一载体(第一载体gRNA的gRNAscaffold为实施例2的Rasgmax，其靶向序列为SEQ ID NO.134)和第二载体共转染HEK293按照上述方法培养后检测绿色荧光强度，纵坐标为红色和蓝色荧光细胞中绿色荧光强度。绿色荧光强度可表征这些点突变蛋白的切割活性，绿色荧光强度越高其切割活性越高。

同时设置RaCas12f1蛋白不作突变的WT阴性对照组、SpCas9阳性对照组和NT空白对照组；WT阴性对照组和NT空白对照组载体上gRNA的gRNAscaffold为实施例2的Rasgmax，其靶向序列为SEQ ID NO.134，SpCas9阳性对照载体上gRNA是VEGFA2 Target(SEQ IDNO.134)的3’末端连接SpCas9 gRNA scaffold(SEQ ID NO.136)；WT阴性对照组为将第一载体(含有SEQ ID NO.1的不作点突变RaCas12f1蛋白)和上述第二载体，共转染HEK293按照上述方法培养后检测绿色荧光强度，SpCas9阳性对照组为将pCMV-SpCas9-gRNA-VEGFA2-TagBFP阳性对照载体和上述第二载体，共转染HEK293按照上述方法培养后检测绿色荧光强度，NT空白对照组为将第一载体(不含有RaCas12f1序列)和上述第二载体，共转染HEK293按照上述方法培养后检测绿色荧光强度，结果如图5A，图5A横坐标标记为WT、SpCas9和NT分别为WT阴性对照组、SpCas9阳性对照组和NT空白对照组，纵坐标为红色和蓝色荧光细胞中绿色荧光强度，其中图5A横坐标从左列到右列的点突变蛋白依次为A11R、W34R、A38R、S55R、H66G、T78S、G80H、N84K、K88R、G90R、C98L、Q103K、T104K、T104R、K110R、N111R、S112R、S114K、E115R、T120R、I124R、S128R、N129D、D133R、N136K、E142R、Y143R、C171K、Q191G、G194K、V214K、N223R、H238K、E261K、L271R、S272R、I285K、I285R、V289R、T291K、R302K、S336K、T339K、E341K、I369V、Y371K、D373K、S377T、V399K、L401K、Q415R和S428K，结果显示A11R、W34R、A38R、H66G、T78S、G80H、K88R、G90R、C98L、Q103K、T104R、K110R、N111R、S112R、S114K、E115R、T120R、S128R、N129D、N136K、E142R、Y143R、C171K、Q191G、G194K、V214K、N223R、H238K、E261K、L271R、S272R、I285K、I285R、V289R、T291K、R302K、S336K、E341K、I369V、Y371K、D373K、S377T、V399K、L401K、Q415R或S428K的RaCas12f1点突变蛋白具有一定的切割活性，说明这些点突变为有效突变，A38R、S114K、S128R、N129D、E142R、C171K、G194K、N223R、E261K、L271R、E341K、Y371K、V399K和S428K的RaCas12f1点突变蛋白强于SpCas9蛋白。

实施例4.利用荧光报告系统比较不同点突变组合的RaCas12f1蛋白的切割活性

按照实施例1和2的方法检测不同点突变组合的RaCas12f1蛋白系统的切割活性，挑选实施例3切割活性高的单一突变位点进行两两组合，以RaCas12f1蛋白(SEQ ID NO.1)为基础，构建RaCas12f1双位点突变库，双突变位点组合为：(N129D和S428K)组合1、(E142R和S428K)组合2、(C171K和S428K)组合3、(G194K和S428K)组合4、(N223R和S428K)组合5、(E261K和S428K)组合6、(E341K和S428K)组合7、(S428K和V399K)组合8、(A38R和N129D)组合9、(S128R和N129D)组合10、(N129D和C171K)组合11、(N129D和G194K)组合12、(N129D和N223R)组合13、(N129D和Y371K)组合14和(N129D和V399K)组合15。将含有这些RaCas12f1双突变位点组合的第一载体(第一载体gRNA的gRNAscaffold为实施例2的Rasgmax，其靶向序列为SEQ ID NO.134)和第二载体共转染HEK293按照上述方法培养后检测绿色荧光强度，纵坐标为红色和蓝色荧光细胞中绿色荧光强度。绿色荧光强度可表征这些点突变组合蛋白的切割活性，绿色荧光强度越高其切割活性越高。

同时设置RaCas12f1蛋白不作突变的WT阴性对照组、SpCas9阳性对照组和NT空白对照组；WT阴性对照组和NT空白对照组载体上gRNA的gRNAscaffold为实施例2的Rasgmax，其靶向序列为SEQ ID NO.134，SpCas9阳性对照载体上gRNA是VEGFA2 Target(SEQ IDNO.134)的3’末端连接SpCas9 gRNA scaffold(SEQ ID NO.136)；WT阴性对照组为将第一载体(含有SEQ ID NO.1的不作点突变RaCas12f1蛋白)和上述第二载体，共转染HEK293按照上述方法培养后检测绿色荧光强度，SpCas9阳性对照组为将pCMV-SpCas9-gRNA-VEGFA2-TagBFP阳性对照载体和上述第二载体，共转染HEK293按照上述方法培养后检测绿色荧光强度，NT空白对照组为将第一载体(不含有RaCas12f1序列)和上述第二载体，共转染HEK293按照上述方法培养后检测绿色荧光强度，结果如图5B，图5B横坐标标记为WT、SpCas9和NT分别为WT阴性对照组、SpCas9阳性对照组和NT空白对照组，纵坐标为红色和蓝色荧光细胞中绿色荧光强度。其中图5B左图横坐标从左列到右列的点突变蛋白依次为(N129D和S428K)组合1、(E142R和S428K)组合2、(C171K和S428K)组合3、(G194K和S428K)组合4、(N223R和S428K)组合5、(E261K和S428K)组合6、(E341K和S428K)组合7、(V399K和S428K)组合8和RaCas12f1-S428K(实施例3的单一点突变)；图5B右图横坐标从左列到右列的点突变蛋白依次为(A38R和N129D)组合9、(S128R和N129D)组合10、(C171K和N129D)组合11、(G194K和N129D)组合12、(N223R和N129D)组合13、(Y371K和N129D)组合14、(V399K和N129D)组合15和RaCas12f1-N129D(实施例3的单一点突变)。图5B结果说明RaCas12f1蛋白进行组合1至组合15的双点突变后均能保持高效的切割活性，组合1至组合8、组合9、组合10、组合12、组合14和组合16的双点突变后蛋白的切割活性均强于SpCas9蛋白。

此外，挑选实施例3切割活性高的单一突变位点进行双位点、三位点、四位点和五位点组合对RaCas12f1蛋白进行改造，以RaCas12f1蛋白(SEQ ID NO.1)为基础，构建RaCas12f1多位点突变库，突变位点为：A38R、S114K、S128R、N129D、G194K、Y371K、(A38R和N129D)组合、(S114K和N129D)组合、(S128R和N129D)组合、(G194K和N129D)组合、(Y371K和N129D)组合、(A38R、S128R和N129D)组合、(S114K、S128R和N129D)组合、(G194K、S128R和N129D)组合、(Y371K、S128R和N129D)组合、(A38R、S128R、N129D和Y371K)组合、(S114K、S128R、N129D和Y371K)组合、(G194K、S128R、N129D和Y371K)组合、(S114K、A38R、S128R、N129D和Y371K)组合和(G194K、A38R、S128R、N129D和Y371K)组合。将含有这些双位点、三位点、四位点和五位点的RaCas12f1的第一载体(第一载体gRNA的gRNA scaffold为实施例2的Rasgmax，其靶向序列为SEQ ID NO.134)和第二载体共转染HEK293按照上述方法培养后检测绿色荧光强度，纵坐标为红色和蓝色荧光细胞中绿色荧光强度。绿色荧光强度可表征这些点突变组合蛋白的切割活性，绿色荧光强度越高其切割活性越高。

同时设置WT对照组和NT空白对照组，WT对照组为将第一载体(含有SEQ ID NO.1的RaCas12f1蛋白)和上述第二载体，共转染HEK293按照上述方法培养后检测绿色荧光强度，NT空白对照组为将第一载体(不含有RaCas12f1蛋白)和上述第二载体，共转染HEK293按照上述方法培养后检测绿色荧光强度，结果如图5C，图5C最左列为WT对照组结果，图5C最右列为NT空白对照组结果。图5C横坐标表示RaCas12f1蛋白点突变种类，纵坐标为红色和蓝色荧光细胞中绿色荧光强度，其中图5C左图横坐标从左列到右列的V1.1、V1.2、V1.3、V1.4、V1.5、V1.6、V2.1、V2.2、V2.3、V2.4、V2.5、V3.1、V3.2、V3.3、V3.4、V4.1、V4.2、V4.3、V5.1、V5.2的突变位点对应为A38R、S114K、S128R、N129D、G194K、Y371K、(A38R和N129D)组合、(S114K和N129D)组合、(S128R和N129D)组合、(G194K和N129D)组合、(Y371K和N129D)组合、(A38R、S128R和N129D)组合、(S114K、S128R和N129D)组合、(G194K、S128R和N129D)组合、(Y371K、S128R和N129D)组合、(A38R、S128R、N129D和Y371K)组合、(S114K、S128R、N129D和Y371K)组合、(G194K、S128R、N129D和Y371K)组合、(S114K、A38R、S128R、N129D和Y371K)组合和(G194K、A38R、S128R、N129D和Y371K)组合。图5C结果说明进行单一点突变的RaCas12f1蛋白(V1.1至V1.6)均能维持其切割活性，双位点组合突变的RaCas12f1蛋白(V2.1至V2.5)的切割活性均有一定的提高，三位点和四位点和五位点突变的RaCas12f1蛋白(V3.1至V3.4、V4.1至V4.3、V5.1至V5.2)的切割活性均有较高的提升，可见，上述突变位点均为有效突变。

最后，利用上述荧光报告系统比较不同CRISPR-RaCas12f1系统的切割效率，按照实施例1和2的方法构建第一载体和第二载体，设置三个实验组，分别为Ra-sgWT组、Ra-sgmax组和Ra_v5.1-sgmax组。Ra-sgWT组包括：含有无突变的RaCas12f1蛋白(SEQ ID NO.1)的第一载体(第一载体gRNA的gRNA scaffold为RasgWT(SEQ ID NO.3)，其靶向序列为SEQID NO.134)和第二载体共转染HEK293按照上述方法培养后检测绿色荧光强度；Ra-sgmax组包括：含有无突变的RaCas12f1蛋白(SEQ ID NO.1)的第一载体(第一载体gRNA的gRNAscaffold为实施例2的Rasgmax(SEQ ID NO.92)，其靶向序列为SEQ ID NO.134)和第二载体共转染HEK293按照上述方法培养后检测绿色荧光强度；Ra_v5.1-sgmax组包括：含有五位点突变的RaCas12f1蛋白(SEQ ID NO.1上有S114K、A38R、S128R、N129D和Y371K位点突变，命名为Ra_v5.1)的第一载体(第一载体gRNA的gRNAscaffold为实施例2的Rasgmax(SEQ IDNO.92)，其靶向序列为SEQ ID NO.134)和第二载体共转染HEK293按照上述方法培养后检测绿色荧光强度。同时设置NT空白对照组，NT空白对照组为将第一载体(不含有RaCas12f1蛋白)和上述第二载体，共转染HEK293按照上述方法培养后检测绿色荧光强度，结果如图5D，图5D从左列到右列依次为NT空白对照组、Ra-sgWT组、Ra-sgmax组和Ra_v5.1-sgmax组，图5D结果显示，RaCas12f1蛋白与RasgWT、RaCas12f1蛋白与Rasgmax、和Ra_v5.1蛋白与Rasgmax均有一定的切割活性，其中Ra_v5.1蛋白与Rasgmax组成的CRISPR-RaCas12f1系统具有最优的切割活性。

实施例5.不同RaCas12f1蛋白在人类细胞系中内源靶点切割活性验证

进一步证实不同RaCas12f1蛋白在哺乳动物细胞中对内源靶点的dsDNA切割活性，本实验采用测序方式进行验证，如表1所示载体结构，分别将经过真核生物密码子优化的编码RaCas12f1-HKRA/RaCas12f1-HKRA-T5 exo的核苷酸与靶向TTR基因的sgRNA构建真核生物表达载体pX330中，该sgRNA由U6启动子启动表达；该RaCas12f1-HKRA/RaCas12f1-HKRA-T5 exo蛋白由chickenβ-actin promoter启动子启动表达；在RaCas12f1-HKRA/RaCas12f1-HKRA-T5 exo核苷酸下游(C端)通过自剪切多肽2A(P2A)连接eGFP基因(用于进行细胞分选)，形成重组载体，分别标记为：pX330-RaCas12f1-HKRA-Rasgmax-TTR-eGFP(载体A)、pX330-RaCas12f1-HKRA-T5exo-Rasgmax-TTR-eGFP(载体B)。具体的，载体A中效应蛋白为RaCas12f1-HKRA(SEQ ID NO.2)；载体B中效应蛋白为RaCas12f1-HKRA-T5 exo(RaCas12f1-HKRA的C端通过linker与5’-3’外切核酸酶T5exo连接，其序列为SEQ ID NO.127)；载体A和B的sgRNA(5’→3’)依次包括：gRNAscaffold和靶向序列，其gRNAscaffold为Rasgmax(SEQ IDNO.92)，其靶向序列为TTR-Target gRNA(SEQ ID NO.138)。

同样的，构建SpCas9阳性对照组，参照上述方法，将编码SpCas9的核苷酸与靶向TTR基因的sgRNA构建真核生物表达载体pX330中，该sgRNA由U6启动子启动表达；该SpCas9蛋白由chickenβ-actin promoter启动子启动表达；在SpCas9核苷酸下游(C端)通过自剪切多肽2A(P2A)连接eGFP基因(用于进行细胞分选)，形成重组载体，分别标记为：pX330-SpCas9-TTR-eGFP(载体C)。载体C的sgRNA(5’→3’)依次包括：靶向序列和gRNAscaffold，其靶向序列为TTR-Target gRNA(SpCas9)(SEQ ID NO.139)，其gRNAscaffold为SpCas9 gRNAscaffold(SEQ ID NO.137)。

表1用于敲除TTR基因的各种载体(图6显示对应的质粒图谱)

/>

分别将上述载体(载体A至载体C)转染人HEK293T细胞。在37℃、5％二氧化碳浓度下培养，转染72h后，通过荧光活化细胞分选(FACS)收集eGFP阳性细胞，细胞分选后继续培养48小时，随后提取分选的细胞基因组，对TTR基因靶位点进行PCR扩增然后进行一代和高通量测序。

一代测序结果如图7所示，测序结果可知，图7A至7C的箭头区为对应效应蛋白的TTR靶点序列，在TTR靶点序列下游(箭头方向)，也即阅读框下游存在连续稳定的套峰，说明本申请的RaCas12f1-HKRA蛋白和RaCas12f1-HKRA-T5 exo融合蛋白能在TTR靶点上进行切割，导致TTR靶点下游(箭头方向)的阅读框下游序列发生移码突变，引起阅读框架变化，导致其位点下游出现连续稳定的套峰，说明本发明的RaCas12f1效应蛋白及其突变体具有在真核细胞的内源靶点切割活性。

高通量测序展示两个效应蛋白在HEK293T细胞系的TTR基因的插入缺失率(Indel％)结果，如图8所示，本申请的RaCas12f1-HKRA和RaCas12f1-HKRA-T5 exo融合蛋白在人HEK293T细胞系的TTR基因处的插入缺失率分别为89.35％和93.55％，阳性对照的SpCas9蛋白在该TTR基因处的插入缺失率为57.44％。

参照上述方法验证RaCas12f1-HKRA蛋白和RaCas12f1-HKRA-T5 exo融合蛋白在HEK293T细胞系的其他基因(分别为RNF2、PCSK9、B2M、TRAC和PD-1)敲除效率，具体包括：如表2所示载体结构构建一系列载体。分别将这些载体转染人HEK293T细胞。在37℃、5％二氧化碳浓度下培养，转染72h后，通过荧光活化细胞分选(FACS)收集eGFP阳性细胞，细胞分选后继续培养48小时，随后提取分选的细胞基因组，对对应基因靶位点进行PCR扩增然后进行高通量测序。高通量测序展示RaCas12f1-HKRA蛋白和RaCas12f1-HKRA-T5 exo融合蛋白在HEK293T细胞系的不同基因的插入缺失率(Indel％)结果，如图9所示，本申请的RaCas12f1-HKRA和RaCas12f1-HKRA-T5 exo融合蛋白在人HEK293T细胞系的RNF2、PCSK9、B2M、TRAC和PD-1基因处具有较高的敲除活性，尤其是RNF2、B2M、TRAC和PD-1基因，此外，5’-3’外切核酸酶连接在RaCas12f1及其变体的C端可显著提高RaCas12f1蛋白的切割效率。

表2用于敲除不同基因的各种载体

/>

上述实施例结果说明本申请的CRISPR-RaCas12f1及一系列gRNAscaffold具有稳健的编辑活性，是哺乳动物细胞中基因组编辑、碱基编辑和表观遗传编辑的多功能平台，并且未来可以用于体内或离体治疗性应用。

Claims

1.向导RNA(gRNA)scaffold，其中所述gRNAscaffold包含与SEQ ID NO.3至17、19至92、95至107任一项所示的核苷酸序列相比具有至少80％序列同一性的核苷酸序列；优选地，其中所述gRNAscaffold为SEQ ID NO.3至17、SEQ ID NO.19至92、SEQ ID NO.95至107任一项所示的核苷酸序列。

2.根据权利要求1所述的gRNAscaffold，其中所述gRNAscaffold包含一个或多个修饰，所述一个或多个修饰导致所述gRNAscaffold展现一种或多种改善特征；

优选地，所述一种或多种改善特征选自由以下组成的组：

改善gRNA稳定性；

改善所述gRNA的转录；

增加所述gRNA的折叠速率；

折叠期间减少副产物形成；

折叠期间减少脱靶折叠中间体形成；

增加生产性折叠；

增加与Cas12f蛋白的结合亲和力；

当与所述Cas12f蛋白复合时，改善与靶核酸的结合亲和力；

当与所述Cas12f蛋白复合时，改善基因编辑；或

当与所述Cas12f蛋白复合时，改善编辑特异性。

3.根据权利要求2所述的gRNAscaffold，所述一个或多个修饰包含：

(i)一个或多个区域中的所述gRNA scaffold的1至40个连续或非连续核苷酸的取代；

(ii)一个或多个区域中的所述gRNAscaffold的1至40个连续或非连续核苷酸的缺失；

(iii)一个或多个区域中的所述gRNA scaffold的1至40个连续或非连续核苷酸的插入；

(iv)一个或多个区域中的所述gRNAscaffold的1至10个连续或非连续核苷酸的化学修饰；

(v)所述gRNAscaffold具有异源RNA序列取代；或

(vi)(i)-(v)的任何组合。

4.一种CRISPR-Cas系统，其包含：

(i)Cas12f多肽，所述Cas12f多肽包含与SEQ ID NO.1所示的氨基酸序列相比具有至少80％序列同一性的氨基酸序列；以及

(ii)gRNA，所述gRNA包含权利要求1至3中任一项所述的gRNA scaffold和在所述gRNAscaffold的3’末端与靶核酸互补的靶向序列，所述gRNA与所述Cas12f多肽复合以引导所述Cas12f多肽结合至所述靶核酸。

5.根据权利要求4所述的CRISPR-Cas系统，其中所述Cas12f多肽被突变以使其具有以下一个或多个特征：核酸切割活性增强或核酸结合活性增强；

所述Cas12f多肽：(i)根据SEQ ID NO.1所示的序列编号，在A11、W34、A38、H66、T78、G80、K88、G90、C98、Q103、T104、K110、N111、S112、S114、E115R、T120R、S128、N129、Q130、N136、E142、Y143、C171、Q191、G194、N203、V214、A216、N223、H238、I241、E261、L271、S272、I285、I285、V289、T291、R302、S336、E341、I369、Y371、D373、S377、V399、L401、Q415和S428中的一个或多个位置处具有氨基酸取代；或

(ii)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽具有一个或多个选自A11R、W34R、A38R、H66G、T78S、G80H、K88R、G90R、C98L、Q103K、T104R、K110R、N111R、S112R、S114K、E115R、T120R、S128R、N129D、Q130H、N136K、E142R、Y143R、C171K、Q191G、G194K、N203K、V214K、A216R、N223R、H238K、I241A、E261K、L271R、S272R、I285K、I285R、V289R、T291K、R302K、S336K、E341K、I369V、Y371K、D373K、S377T、V399K、L401K、Q415R和S428K的氨基酸取代。

6.根据权利要求5所述的CRISPR-Cas系统，其中所述Cas12f多肽：

(1)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在N129D和S428K位置处具有氨基酸取代；

(2)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在E142R和S428K位置处具有氨基酸取代；

(3)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在C171K和S428K位置处具有氨基酸取代；

(4)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在G194K和S428K位置处具有氨基酸取代；

(5)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在N223R和S428K位置处具有氨基酸取代；

(6)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在E261K和S428K位置处具有氨基酸取代；

(7)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在E341K和S428K位置处具有氨基酸取代；

(8)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在S428K和V399K位置处具有氨基酸取代；

(9)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在A38R和N129D位置处具有氨基酸取代；

(10)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在S114K和N129D位置处具有氨基酸取代；

(11)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在S128R和N129D位置处具有氨基酸取代；

(12)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在N129D和C171K位置处具有氨基酸取代；

(13)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在N129D和G194K位置处具有氨基酸取代；

(14)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在N129D和N223R位置处具有氨基酸取代；

(15)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在N129D和Y371K位置处具有氨基酸取代；

(16)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在N129D和V399K位置处具有氨基酸取代；

(17)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在A38R位置处具有氨基酸取代；

(18)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在S114K位置处具有氨基酸取代；

(19)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在S128R位置处具有氨基酸取代；

(20)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在N129D位置处具有氨基酸取代；

(21)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在G194K位置处具有氨基酸取代；

(22)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在Y371K位置处具有氨基酸取代；

(23)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在A38R、S128R和N129D位置处具有氨基酸取代；

(24)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在S114K、S128R和N129D位置处具有氨基酸取代；

(25)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在S128R、N129D和G194K位置处具有氨基酸取代；

(26)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在S128R、N129D和Y371K位置处具有氨基酸取代；

(27)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在A38R、S128R、N129D和Y371K位置处具有氨基酸取代；

(28)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在S114K、S128R、N129D和Y371K位置处具有氨基酸取代；

(29)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在S128R、N129D、G194K和Y371K位置处具有氨基酸取代；

(30)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在A38R、S114K、S128R、N129D和Y371K位置处具有氨基酸取代；

(31)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在A38R、S128R、N129D、Y371K和G194K位置处具有氨基酸取代；或

(32)根据SEQ ID NO.1所示的序列编号，所述Cas12f多肽在Q130H、N203K、A216R和I241A位置处具有氨基酸取代。

7.一种融合多肽，其包含与一个或多个异源多肽融合的Cas12f多肽，所述Cas12f多肽选自权利要求4至6任一项所述CRISPR-Cas系统的Cas12f多肽；优选地，其中所述一个或多个异源多肽独立地为表位标签、核定位信号或具有以下一种或多种酶促活性：外切核酸酶活性、逆转录酶活性、核酸酶活性、甲基转移酶活性、脱甲基化酶活性、乙酰转移酶活性、脱乙酰酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、脱泛素化活性、腺苷酸化活性、脱腺苷酸化活性、SUMO化活性、脱SUMO化活性、核糖基化活性、脱核糖基化活性、豆蔻酰化活性、脱豆蔻酰化活性、糖基化活性(例如来自O-GlcNAc转移酶)和脱糖基化活性、DNA修复活性、DNA损伤活性、脱氨酶活性、歧化酶活性、烷基化活性、脱嘌呤活性、氧化活性、嘧啶二聚体形成活性、整合酶活性、转座酶活性、重组酶活性、聚合酶活性、连接酶活性、解旋酶活性、光裂合酶活性和糖基化酶活；更优选地，所述酶促活性结构域具有以下一种或多种酶促活性：脱氨酶活性、甲基转移酶活性、脱甲基酶活性、乙酰转移酶活性和脱乙酰酶活性；优选地，所述一个或多个异源多肽独立地为转录阻遏结构域、转录激活结构域、脱氨酶结构域或5’-3’外切核酸酶功能域。

8.一种复合物，其包含权利要求7所述的融合多肽以及gRNA，所述gRNA包含权利要求1至3中任一项所述的gRNAscaffold和在所述gRNAscaffold的3’末端与靶核酸互补的靶向序列，所述gRNA与所述融合多肽复合以引导所述融合多肽结合至靶核酸；

优选地，所述的融合多肽包含Cas12f多肽和融合在所述Cas12f多肽C端的5’-3’外切核酸酶功能域，所述融合多肽包含SEQ ID NO.127所示的氨基酸序列；

优选地，所述复合物是表观遗传编辑器，所述融合多肽包含SEQ ID NO.129至131任一个所示的氨基酸序列；

优选地，所述复合物是碱基编辑器，所述融合多肽包含SEQ ID NO.132或133所示的氨基酸序列。

9.一种核酸，其包含：

编码gRNA的核苷酸序列，所述gRNA包含权利要求1至3中任一项所述的gRNAscaffold和在所述gRNAscaffold的3’末端与靶核酸互补的靶向序列；优选地，所述核酸是DNA或mRNA。

10.一种核酸，其包含：

编码如权利要求4至6任一项所述的CRISPR-Cas系统的Cas12f多肽或权利要求7所述的融合多肽的多核苷酸；优选地，所述多核苷酸被密码子优化以在原核或真核细胞中表达；优选地，所述多核苷酸包含或为如SEQ ID NO.1至2任一个所示的核苷酸序列。

11.一种载体，其包含权利要求9或10所述的核酸；优选地，所述载体是质粒或病毒载体；优选地，所述病毒载体是腺相关病毒载体、腺病毒载体、逆转录病毒载体、慢病毒载体或单纯疱疹病毒载体。

12.一种载体系统，其包括第一载体和与第一载体不同的第二载体，所述第一载体包含权利要求9所述的核酸；所述第二载体包含权利要求10所述的核酸；优选地，所述第一载体和第二载体独立地是质粒或病毒载体；优选地，所述病毒载体是腺相关病毒载体、腺病毒载体、逆转录病毒载体、慢病毒载体或单纯疱疹病毒载体。

13.一种递送系统，其包含gRNA、权利要求4至6任一项所述的CRISPR-Cas系统、权利要求7所述的融合多肽、权利要求8所述的复合物、权利要求9或10所述的核酸、权利要求11所述的载体、或权利要求12所述的载体系统；优选地，所述递送系统包括脂质体、纳米颗粒或外泌体；其中，所述gRNA包含权利要求1至3中任一项所述的gRNAscaffold和在所述gRNAscaffold的3’末端与靶核酸互补的靶向序列。

14.一种细胞，其包含gRNA、权利要求4至6任一项所述的CRISPR-Cas系统、权利要求7所述的融合多肽、权利要求8所述的复合物、权利要求9或10所述的核酸、权利要求11所述的载体、或权利要求12所述的载体系统、或权利要求13所述的递送系统；其中，所述gRNA包含权利要求1至3中任一项所述的gRNAscaffold和在所述gRNAscaffold的3’末端与靶核酸互补的靶向序列；优选地，所述细胞是真核细胞；更优选地，所述细胞是人细胞。

15.一种组合物或试剂盒，其包含gRNA、权利要求4至6任一项所述的CRISPR-Cas系统、权利要求7所述的融合多肽、权利要求8所述的复合物、权利要求9或10所述的核酸、权利要求11所述的载体、或权利要求12所述的载体系统、或权利要求13所述的递送系统或权利要求14所述的细胞；以及药学上可接受的载体；其中，所述gRNA包含权利要求1至3中任一项所述的gRNAscaffold和在所述gRNAscaffold的3’末端与靶核酸互补的靶向序列。

16.一种修饰靶核酸的方法，所述方法包括使靶核酸与权利要求4至6任一项所述的CRISPR-Cas系统、权利要求7所述的融合多肽、权利要求8所述的复合物、权利要求9或10所述的核酸、权利要求11所述的载体、或权利要求12所述的载体系统、或权利要求13所述的递送系统接触，所述接触导致所述靶核酸被修饰；优选地，所述修饰包括增加或减少所述靶核酸中的靶序列的表达，或所述修饰包括对所述靶核酸中的靶腺嘌呤或靶胞嘧啶进行脱氨基以实现碱基对转换。