CN116457462A - 用于高效和特异性基因组编辑的构建体和其用途 - Google Patents

用于高效和特异性基因组编辑的构建体和其用途 Download PDF

Info

Publication number
CN116457462A
CN116457462A CN202180076806.7A CN202180076806A CN116457462A CN 116457462 A CN116457462 A CN 116457462A CN 202180076806 A CN202180076806 A CN 202180076806A CN 116457462 A CN116457462 A CN 116457462A
Authority
CN
China
Prior art keywords
sequence
seq
amino acid
nuclease
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180076806.7A
Other languages
English (en)
Inventor
J·克什纳
R·刘
L·梁
R·鲍姆加特纳
T·沃内克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Artisan Development Labs Inc
Original Assignee
Artisan Development Labs Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Artisan Development Labs Inc filed Critical Artisan Development Labs Inc
Priority claimed from PCT/US2021/051142 external-priority patent/WO2022061247A2/en
Publication of CN116457462A publication Critical patent/CN116457462A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Enzymes And Modification Thereof (AREA)

Abstract

本文公开的实施方案包括新型的核酸引导的核酸酶、新型的引导核酸和新型的可靶向的核酸酶系统,以及使用方法。在一些实施方案中,工程化的非天然存在的核酸引导的核酸酶可以与已知的引导核酸一起用于可靶向的核酸酶系统中。在某些实施方案中,可靶向的核酸酶系统可用于编辑人和其它物种的靶向基因组。在一些实施方案中,方法包括但不限于递归基因工程和可追踪基因工程方法。

Description

用于高效和特异性基因组编辑的构建体和其用途
交叉引用
本申请要求2020年9月18日提交的美国临时申请No.63/080,552和2021年5月6日提交的美国临时申请No.63/185,315的权益,这些申请以引用的方式并入本文中。
背景技术
CRISPR是成簇规律间隔的短回文重复序列(Clustered Regularly InterspacedShort Palindromic Repeats)的缩写。在回文重复序列中,核苷酸序列在两个方向上都是相同的。这些回文重复序列中的每一个之后都是短的间隔DNA区段。小的Cas(CRISPR相关系统)基因簇位于CRISPR序列旁边。CRISPR/Cas系统是一种原核免疫系统,可以赋予对外来遗传元件、例如质粒和噬菌体中存在的外来遗传元件的抗性,从而为原核生物提供一种形式的获得性免疫。含有间隔序列的RNA有助于Cas(CRISPR相关)蛋白识别和切割外源DNA。在大约50%的细菌基因组中发现了CRISPR序列,近90%的已测序古细菌选择了有效且稳健的代谢和调节网络,以防止不必要的代谢物生物合成并优化分配资源以最大限度地提高整体细胞适应性。这些网络的复杂性以及了解其结构和功能的途径有限以及重新编程细胞网络以修饰这些系统从而适应各种应用的能力使得该领域的进展复杂化。某些重新编程细胞网络的方法旨在修饰复杂通路的单个基因,但作为修饰单个基因的结果,可能会导致对这些基因或其它基因的不需要的修饰,从而妨碍识别实现所追寻的终点所需要的变化以及使修饰所寻求的终点复杂化。
CRISPR-Cas驱动的基因组编辑和工程化总体上对生物学和生物技术产生了巨大影响。CRISPR-Cas编辑系统需要多核苷酸引导的核酸酶、指导核酸酶切割基因组特定区域的引导多核苷酸(例如引导RNA(gRNA))以及可选的供体DNA盒,所述供体DNA盒可用于修复切割的dsDNA,从而在感兴趣的位点并入可编程的编辑。CRISPR-Cas编辑的最早演示和应用使用Cas9核酸酶和相关gRNA。这些系统已被用于广泛物种的基因编辑,涵盖细菌到高级哺乳动物系统,如动物,在某些情况下用于人。然而,众所周知,关键的编辑参数,如原间隔序列相邻基序(protospacer adjacent motif,PAM)特异性、编辑效率和脱靶率等,取决于物种、基因座和核酸酶。人们越来越关注识别和快速表征可用于扩大和改进整体编辑能力的新颖核酸酶系统。
已知Cas12a是一种单一的RNA引导的CRISPR/Cas核酸内切酶,能够进行基因组编辑,与Cas9相比具有不同的特征。在某些实施方案中,基于Cas12a的系统允许将供体DNA快速可靠地引入基因组。此外,Cas12a拓宽了基因组编辑。CRISPR/Cas12a基因组编辑已在人细胞以及包括植物在内的其它生物体中进行了评估。与CRISPR/Cas9相比,CRISPR/Cas12a系统的几个特征有所不同。
已知Cas12a核酸酶识别富含T的原间隔序列相邻基序(PAM)序列(例如5'-TTTN-3'(AsCas12a、LbCas12a)和5'-TTN-3'(FnCas12a);然而,针对SpCas9可比较的序列是NGG。Cas12a的PAM序列位于靶DNA序列的5'端,而对于Cas9,它位于3'端。此外,Cas12a能够使远离其PAM的DNA在原间隔序列的+18/+23位置周围裂解。这种裂解会产生交错的DNA突出端(例如粘端),而Cas9在两条链的原间隔序列的3'位置后靠近其PAM裂解并产生平端。在某些方法中,产生改变的核酸酶识别可以提供对Cas9或Cas12a的改进从而提高准确性。此外,Cas12a由单个crRNA引导,不需要tracrRNA,导致gRNA序列比Cas9使用的sgRNA更短。
还已知Cas12a显示出在crRNA加工中起作用的另外的核糖核酸酶活性。Cas12a用作不同物种的编辑工具(例如酿酒酵母(S.cerevisiae)),与CRISPR/Cas9识别的PAM序列相比,允许使用替代的PAM序列。
众所周知的Cas12a蛋白-RNA复合物识别富含T的PAM,并且裂解导致交错的DNA双链断裂。Cas12a型核酸酶与由crRNA的5'-手柄形成的假结结构相互作用。由种子区域和3'端构成的引导RNA区段具有与靶DNA序列互补的结合序列。迄今为止表征的Cas12a型核酸酶已被证明可与单个gRNA一起使用并加工gRNA阵列。虽然已证实Cas12a型和Cas9核酸酶系统具有很高的影响力,但这两种系统都没有显示能够像预期的那样发挥可预测的作用,以实现设想的基因编辑技术全方位应用。
在目前的状态下,一系列努力试图对改进的CRISPR编辑系统进行工程化,以提高效率和准确性,其中包括对PAM特异性、稳定性和gRNA和/或核酸酶的序列进行工程化。例如,预期会增加gRNA稳定性的CRISPR/Cas9 gRNA的化学修饰被发现会导致人细胞中的插入缺失频率高出3.8倍。此外,其它研究包括Cas12a的结构引导诱变并进行筛选以识别具有更大范围的识别的PAM序列的变体。除了已建立的TTTV序列外,这些工程化的AsCas12a还识别TYCV和TATV PAM,并在体外和测试的人细胞中具有增强的活性。
CRISPR/Cas系统的一个版本,CRISPR/Cas9,已经过修饰以提供用于编辑靶向基因组的有用工具。通过将与合成引导RNA(gRNA)形成复合物的Cas9核酸酶递送到细胞中,可以在预定位置切割/编辑细胞的基因组,从而允许删除现有基因和/或添加新基因。这些系统很有用,但在靶向编辑的效率和准确性、不精确的编辑并发症以及用于商业相关情况(例如基因替换)时存在障碍方面存在一些重要限制。因此,需要改进的核酸引导的核酸酶系统,以提高的效率进行定向和准确的编辑。
发明内容
实施方案1提供了一种组合物,所述组合物包含(i)工程化的核酸引导的核酸酶,所述工程化的核酸引导的核酸酶包括包含与SEQ ID NO:143-177和229中的任一者具有至少60%序列同一性的氨基酸序列的工程化的核酸酶多肽,或编码与SEQ ID NO:143-177和229中的任一者具有至少60%序列同一性的氨基酸序列的一种多核苷酸或多种多核苷酸。实施方案2.实施方案1的组合物,所述组合物包括包含与SEQ ID NO:144、153和229中的任一者具有至少60%序列同一性的氨基酸序列的工程化的核酸酶多肽,或编码与SEQ ID NO:144、153和229中的任一者具有至少60%序列同一性的氨基酸序列的一种多核苷酸或多种多核苷酸。实施方案3.实施方案1或2的组合物,所述组合物包括包含与SEQ ID NO:144具有至少60%序列同一性的氨基酸序列的工程化的核酸酶多肽或编码与SEQ ID NO:144具有至少60%序列同一性的氨基酸序列的一种多核苷酸或多种多核苷酸。实施方案4.任一前述实施方案的组合物,所述组合物包括包含与SEQ ID NO:153具有至少60%序列同一性的氨基酸序列的工程化的核酸酶多肽或编码与SEQ ID NO:153具有至少60%序列同一性的氨基酸序列的一种多核苷酸或多种多核苷酸。实施方案5.任一前述实施方案的组合物,所述组合物包括包含与SEQ ID NO:229具有至少60%序列同一性的氨基酸序列的工程化的核酸酶多肽或编码与SEQ ID NO:229具有至少60%序列同一性的氨基酸序列的一种多核苷酸或多种多核苷酸。实施方案6.任一前述实施方案的组合物,其中所述序列同一性为至少80%。实施方案7.任一前述实施方案的组合物,其中所述序列同一性为至少95%。实施方案8.任一前述实施方案的组合物,其中所述序列同一性为100%。实施方案9.实施方案1的组合物,其中所述工程化的核酸酶多肽不含肽基序YLFQIYNKDF(SEQ ID NO.224)或编码不含肽基序YLFQIYNKDF(SEQ ID NO.224)的所述工程化的核酸酶多肽的一种多核苷酸或多种多核苷酸。实施方案10.实施方案9的组合物,所述组合物包含与SEQ ID NO:143-151、161-163、165、166、169、171-175、177和229中的任一者具有至少60%序列同一性的氨基酸序列或编码与SEQ ID NO:143-151、161-163、165、166、169、171-175、177和229中的任一者具有至少60%序列同一性的氨基酸序列的一种多核苷酸或多种多核苷酸。实施方案11.实施方案10的组合物,所述组合物包含与SEQ ID NO:149、151、175和177中的任一者具有至少60%序列同一性的氨基酸序列或编码与SEQ ID NO:149、151、175和177中的任一者具有至少60%序列同一性的氨基酸序列的一种多核苷酸或多种多核苷酸。实施方案12.一种组合物,所述组合物包含可靶向的引导核酸引导的核酸酶复合物,所述核酸酶复合物包含任一前述实施方案的工程化的核酸引导的核酸酶并且还包含(ii)相容的引导核酸。实施方案13.实施方案12的组合物,其中所述引导核酸是gRNA并且所述复合物是RNP。实施方案14.实施方案12或13的组合物,其中所述引导核酸是分裂引导核酸。实施方案15.实施方案13或14的组合物,其中所述gRNA是工程化的gRNA。实施方案16.实施方案15的组合物,其中所述工程化的gRNA包含保守gRNA。实施方案17.实施方案16的组合物,其中所述保守gRNA包含SEQ ID NO:291-325中的任一者,或其一部分。实施方案18.实施方案17的组合物,其中所述保守gRNA包含SEQ ID NO:291-325中的任一者的一部分。实施方案19.实施方案18的组合物,其中所述部分是包含所述RNA的二级结构的核苷酸序列的高度保守部分。实施方案20.实施方案18的组合物,其中所述二级结构包含假结。实施方案21.实施方案13至20中的任一项的组合物,其中所述gRNA是合成gRNA。实施方案22.实施方案21的组合物,其中所述gRNA包含一种或多种化学修饰。实施方案23.一种在靶多核苷酸中的靶序列处或附近产生链断裂的方法,所述方法包括使所述靶序列与实施方案12-22中的任一项的可靶向的核酸引导的核酸酶复合物接触,其中所述复合物的相容的引导核酸靶向所述靶序列,并允许可靶向的引导核酸引导的核酸酶复合物产生所述链断裂。实施方案24.实施方案23的方法,其中所述靶多核苷酸是在细胞基因组中。实施方案25.实施方案23或24的方法,所述方法还包括提供待插入到所述靶序列中的编辑模板。实施方案26.实施方案25的方法,其中所述编辑模板包含转基因。实施方案27.实施方案23-27中的任一项的方法,其中所述靶多核苷酸是安全港位点。实施方案28.一种细胞,所述细胞由实施方案23的实施方案产生。实施方案29.一种生物体,所述生物体由实施方案23的方法产生。实施方案30.一种组合物,所述组合物包含一种工程化的多核苷酸或多种工程化的多核苷酸,所述工程化的多核苷酸包括包含对应于与SEQ ID NO:1-142和225-228中的任一者具有至少60%序列同一性的序列的序列的一种或多种多核苷酸。实施方案31.实施方案30的组合物,所述组合物包括包含对应于与SEQ ID NO:1、5、11、15、19、23、27、31、35、39、43、47、51、55、59、63、67、71、75、79、83、87、91、95、99、103、107、111、115、119、123、127、131、135、139和225中的任一者具有至少60%序列同一性的序列的序列的一种或多种多核苷酸。实施方案32.实施方案30或31的组合物,其中所述多核苷酸在由所述多核苷酸编码的多肽的N端、C端或两者处编码一种或多种另外的氨基酸序列。实施方案33.实施方案32的组合物,其中所述另外的氨基酸序列包含以下中的至少一者:(i)一种或多种NLS;(ii)一种或多种纯化标签;(iii)一种或裂解序列;以及(iv)FLAG或3XFLAG。实施方案34.实施方案32的组合物,其中所述另外的氨基酸序列包含以下中的至少两者:(i)一种或多种NLS;(ii)一种或多种纯化标签;(iii)一种或裂解序列;以及(iv)FLAG或3XFLAG。实施方案35.实施方案32的组合物,其中所述另外的氨基酸序列包含以下中的至少三者:(i)一种或多种NLS;(ii)一种或多种纯化标签;(iii)一种或裂解序列;以及(iv)FLAG或3XFLAG。实施方案36.实施方案32的组合物,其中所述另外的氨基酸序列包含:(i)一种或多种NLS;(ii)一种或多种纯化标签;(iii)一种或裂解序列;(iv)FLAG或3XFLAG。实施方案37.实施方案30-36中的任一项的组合物,其中所述一种多核苷酸或多种多核苷酸进行密码子优化。实施方案38.实施方案37的组合物,其中所述一种多核苷酸或多种多核苷酸针对大肠杆菌进行密码子优化。实施方案39.实施方案39的组合物,所述组合物包括包含对应于与SEQ ID NO:2、6、12、16、20、24、28、32、36、40、44、48、52、56、60、64、68、72、76、80、84、88、92、96、100、104、108、112、116、120、124、128、132、136、140、226和330中的任一者具有至少60%序列同一性的序列的序列的一种或多种多核苷酸。实施方案40.实施方案37的组合物,其中所述一种多核苷酸或多种多核苷酸针对酿酒酵母进行密码子优化。实施方案41.实施方案40的组合物,所述组合物包括包含对应于与SEQ ID NO:3、7、9、13、17、21、25、29、33、37、41、45、49、53、57、61、65、69、73、77、81、85、89、93、97、101、105、109、113、117、121、125、129、133、137、141和227中的任一者具有至少60%序列同一性的序列的序列的一种或多种多核苷酸。实施方案42.实施方案37的组合物,其中所述一种多核苷酸或多种多核苷酸针对人进行密码子优化。实施方案43.实施方案42的组合物,所述组合物包括包含对应于与SEQ IDNO:3、7、9、13、17、21、25、29、33、37、41、45、49、53、57、61、65、69、73、77、81、85、89、93、97、101、105、109、113、117、121、125、129、133、137、141和227中的任一者具有至少60%序列同一性的序列的序列的一种或多种多核苷酸。实施方案44.实施方案30-43中的任一项的组合物,其中所述序列同一性为至少80%。实施方案45.实施方案30-43中的任一项的组合物,其中所述序列同一性为至少95%。实施方案46.实施方案30-43中的任一项的组合物,其中所述序列同一性为100%。
以引用的方式并入
本说明书中提及的所有出版物、专利和专利申请以引用的方式并入本文中,就如每个单独的出版物、专利或专利申请被具体地和单独地指出以引用的方式并入本文的程度一样。
附图说明
以下图式形成本说明书的一部分并且包括其以进一步证明本公开的某些实施方案。可通过参考一个或多个这些附图并结合本文提出的具体实施方案的详细描述更好地理解某些实施方案。
图1是说明用于评估本文公开的一些实施方案的ART1核酸引导的核酸酶的切割效率的耗竭测定的示例性图。
图2是说明用于评估本文公开的一些实施方案的ART2核酸引导的核酸酶的切割效率的耗竭测定的示例性图。
图3是说明用于评估本文公开的一些实施方案的ART5核酸引导的核酸酶的切割效率的耗竭测定的示例性图。
图4是说明用于评估本文公开的一些实施方案的ART6核酸引导的核酸酶的切割效率的耗竭测定的示例性图。
图5是说明用于评估本文公开的一些实施方案的ART8核酸引导的核酸酶的切割效率的耗竭测定的示例性图。
图6是说明用于评估本文公开的一些实施方案的ART9核酸引导的核酸酶的切割效率的耗竭测定的示例性图。
图7是说明用于评估本文公开的一些实施方案的ART10核酸引导的核酸酶的切割效率的耗竭测定的示例性图。
图8是说明用于评估本文公开的一些实施方案的ART11核酸引导的核酸酶的切割效率的耗竭测定的示例性图。
图9是说明用于评估本文公开的一些实施方案的ART11_L679F(ART11*)核酸引导的核酸酶的切割效率的耗竭测定的示例性图。
图10是说明用于评估本文公开的一些实施方案的ART2核酸引导的核酸酶的基因编辑效率的实验性GalK编辑测定的示例性直方图。
图11是说明用于评估本文公开的一些实施方案的ART11核酸引导的核酸酶的基因编辑效率的实验性GalK编辑测定的示例性直方图。
图12是说明本文公开的一些实施方案的ART11核酸引导的核酸酶的各种PAM位点的富集的示例性直方图。
图13是说明本文公开的一些实施方案的ART11_L679F核酸引导的核酸酶的各种PAM位点的富集的示例性直方图。
图14示出了在Jurkat细胞中跨越ART11的TRAC基因瓦状叠覆的引导的插入缺失%。
具体实施方式
本文公开的一些实施方案涉及新颖核酸引导的核酸酶、引导核酸(例如gRNA)和可靶向的核酸酶系统,以及使用方法。在其它实施方案中,公开了用于制造和使用工程化的非天然存在的核酸引导的核酸酶、引导核酸和可靶向的核酸酶系统的方法。在一些实施方案中,可靶向的核酸酶系统可用于编辑人基因组或其它物种的基因组。在一些实施方案中,核酸引导的核酸酶可包括具有氨基酸序列,例如由SEQ ID NO:143-177和229表示的序列的多肽;在实施方案中,核酸引导的核酸酶可包括编码核酸酶的多核苷酸,例如具有由SEQ IDNO:1-142和225-228表示的核酸序列的多核苷酸。在实施方案中,gRNA可包括由SEQ ID NO:178-188中的一个或多个表示的gRNA。在其它实施方案中,gRNA可由SEQ ID NO:178-188表示。在其它实施方案中,gRNA可包括用作本文公开的方法和系统的合成tracrRNA和cfRNA的分裂gRNA。下文提供了本文公开的实施方案中的其它使用序列。
在以下部分中,描述了各种示例性组合物和方法以详述本公开的各种实施方案。对于相关领域的技术人员来说显而易见的是,实施各种实施方案不需要采用本文概述的全部或甚至部分细节,而是可以通过常规实验修改浓度、时间和其它细节。在某些情况下,描述中未包括众所周知的方法或组分。
如本文所用,术语基因组编辑的“调节”和“操纵”可意指本文公开的某些实施方案的一个或多个靶向基因或基因簇的增加、减少、上调、下调、诱导、编辑活性的变化、结合的变化、裂解的变化等。
在本公开的某些实施方案中,可以采用本领域技术范围内的常规分子生物学、微生物学和重组DNA技术。这类技术在文献中有充分的解释,并为本领域技术人员所理解。
在其它实施方案中,本文中根据常规技术用于制备的引物可包括测序引物和扩增引物。在一些实施方案中,常规技术中使用的质粒和寡聚物可包括合成的寡聚物和寡聚物盒。
在本文公开的一些实施方案中,提供了核酸引导的核酸酶系统和使用方法。核酸酶系统可包括参与本文公开的工程化核酸酶表达的转录物和其它元件,其可包括编码新型的工程化核酸引导的核酸酶蛋白和引导序列(gNA,例如,gRNA)或新型的gNA(例如本文公开的新颖gRNA)的序列。在一些实施方案中,核酸引导的核酸酶系统可包括至少一种CRISPR相关核酸引导的核酸酶构建体,其公开内容在本文中提供。在其它实施方案中,核酸引导的核酸酶系统可包括至少一种已知的序列,例如至少一种已知的引导序列或gNA(例如,gRNA)或至少一种新颖gNA(例如gRNA)中的至少一种已知的支架序列。在一些实施方案中,本发明的工程化的核酸引导的核酸酶可用于编辑人或其它物种中的感兴趣的基因的系统。
细菌和古细菌的可靶向的核酸酶系统已成为精确基因组编辑的强大工具。然而,天然存在的核酸酶具有一些局限性,包括由于核酸序列和蛋白质大小而导致的表达和递送挑战。在某些实施方案中,可以产生本文公开的新颖工程化的核酸引导的核酸酶构建体以用于改变靶向基因的靶向和/或增加受试者中靶向基因编辑的效率和/或准确性。本文公开的新颖工程化的核酸引导的核酸酶构建体的其它用途可以是例如本文公开的那些用途。
根据这些实施方案,已知Cas12a是一种单一的RNA引导的CRISPR/Cas核酸内切酶,能够进行基因组编辑,与Cas9相比具有不同的特征。在某些实施方案中,基于Cas12a的系统允许将供体DNA快速可靠地引入基因组。此外,Cas12a拓宽了基因组编辑。CRISPR/Cas12a基因组编辑已在人细胞以及包括植物在内的其它生物体中进行了评估。与CRISPR/Cas9相比,CRISPR/Cas12a系统的几个特征有所不同。
已知Cas12a核酸酶识别富含T的原间隔序列相邻基序(PAM)序列(例如5'-TTTN-3'(AsCas12a、LbCas12a)和5'-TTN-3'(FnCas12a);然而,针对SpCas9可比较的序列是NGG。Cas12a的PAM序列位于靶DNA序列的5'端,而对于Cas9,它位于3'端。此外,Cas12a能够使远离其PAM的DNA在原间隔序列的+18/+23位置周围裂解。这种裂解会产生交错的DNA突出端(例如粘端),而Cas9在两条链的原间隔序列的3'位置后靠近其PAM裂解并产生平端。在某些方法中,产生改变的核酸酶识别可以提供对Cas9或Cas12a的改进从而提高准确性。此外,在本文的某些实施方案中,Cas12a可由单个crRNA(gRNA)引导,不需要tracrRNA,导致gRNA序列比Cas9使用的sgRNA更短;在本文的某些实施方案中,Cas12a可由分裂gRNA引导,例如作为合成gRNA的分裂gRNA、包含调节的核苷酸的分裂gRNA或其它工程化的分裂gRNA,而不是如Cas12a中所见由单个gRNA引导;或如本文公开的其它工程化的分裂gRNA。
还已知Cas12a显示出在crRNA(gRNA,例如分裂gRNA,例如工程化的分裂gRNA)加工中起作用的另外的核糖核酸酶活性。Cas12a用作不同物种的编辑工具(例如酿酒酵母),与CRISPR/Cas9识别的PAM序列相比,允许使用替代的PAM序列。本文公开的新颖核酸酶可以进一步识别相同或替代的PAM序列。与已知的多重方法相比,这些新颖核酸酶可以为多重基因组编辑提供替代系统,并且可以用作哺乳动物基因编辑的改进系统。gRNA加工的其它含义可以如本文所讨论,例如gRNA的产生,例如分裂gRNA,例如工程化的分裂gRNA,其包含保守或高度保守的RNA序列,其可以是对特定核酸酶的RNA中的二级结构,例如二级结构如假结区域具有重要意义的序列,和/或如本文讨论的其它含义。
众所周知的Cas12a蛋白-RNA复合物识别富含T的PAM,并且裂解导致交错的DNA双链断裂。Cas12a型核酸酶与由crRNA的5'-手柄形成的假结结构相互作用。由种子区域和3'端构成的引导RNA区段具有与靶DNA序列互补的结合序列。迄今为止表征的Cas12a型核酸酶已被证明可与单个gRNA一起使用并加工gRNA阵列。虽然已证实Cas12a型和Cas9核酸酶系统具有很高的影响力,但这两种系统都没有显示能够像预期的那样发挥可预测的作用,以实现设想的基因编辑技术全方位应用。
在目前的状态下,一系列努力试图对改进的CRISPR编辑系统进行工程化,以提高效率和准确性,其中包括对PAM特异性、稳定性和gRNA和/或核酸酶的序列进行工程化。例如,预期会增加gRNA稳定性的CRISPR/Cas9 gRNA的化学修饰被发现会导致人细胞中的插入缺失频率高出3.8倍。此外,其它研究包括Cas12a的结构引导诱变并进行筛选以识别具有更大范围的识别的PAM序列的变体。除了已建立的TTTV序列外,这些工程化的AsCas12a还识别TYCV和TATV PAM,并在体外和测试的人细胞中具有增强的活性。
Cas12a样核酸酶和工程化的Cas12a样核酸酶(工程化的设计核酸酶)和gNA,例如gRNA,例如工程化gNA,例如本文公开的gRNA,考虑用于细菌、其它原核生物。在其它实施方案中,工程化的设计核酸酶考虑用于真核生物(如单细胞真核生物,例如酵母)、哺乳动物以及用于鸟类和鱼类。在某些实施方案中,考虑将工程化的设计核酸酶用于人细胞。根据这些实施方案,产生这些构建体以例如改变野生型gRNA序列的某些特征,同时与gRNA来源的对照相比保留其它期望的特征。
在某些实施方案中,本文公开的实施方案的工程化的gRNA构建体可以从本领域已知或尚未发现的Cas12as gRNA产生,并且可包括但不限于马西氨基酸球菌(Acidaminococcus massiliensis sp.)(例如AM_Cas12a菌株Marseille-P2828)、青沉积球菌(Sedimentisphaera cyanobacteriorum sp.)(SC_Cas12a,菌株L21-RPul-D3)、巴恩斯氏菌属某种(Barnesiella sp.)An22(B_Cas12a;An22 An22)、拟杆菌属(Bacteroidete)细菌HGW-拟杆菌属-6某种XS5(BB_Cas12a,08E140C01)、狄氏副拟杆菌属某种(Parabacteroidesdistasonis sp.)(PD_Cas12a,菌株8-P5)、田中柯林斯菌属某种(Collinsella tanakaeisp.)(CT_Cas12a,分离株CIM:MAG 294)、毛螺菌科(Lachnospiraceae)细菌MC2017某种(LB_Cas12a,T350)、粪球菌属某种(Coprococcus sp.)AF16-5(Co_Cas12a,AF16-5 AF16-5.Scaf1)或链卵菌属某种(Catenovulum sp.)CCB-QB4(Ca_Cas12a,物种CCB-QB4)、直肠真杆菌(Eubacterium rectale)(阳性对照是该Cas12a的衍生物)、嗜鳃黄杆菌(Flavobacterium branchiophilum)(FB_Cas12a)和/或合成构建体(SC_Cas12a)或类似物。在某些实施方案中,构建体可以包括与已知的Cas12as 60%或更少的同一性以产生新颖核酸酶。在某些实施方案中,新颖Cas12a衍生的构建体可以包括与对照或野生型Cas12a核酸酶相比具有降低的脱靶率和/或改进的编辑功能的构建体。
在一些实施方案中,与用于改进编辑的对照相比,本文公开的核酸酶构建体的脱靶率可以降低。例如,可以很容易地测试脱靶率。根据这些实施方案,与实验设计的gRNA相比,野生型gRNA质粒可用于评估基线脱靶编辑,以评估新颖核酸酶与对照Cas12a核酸酶或本领域已知的作为阳性对照的其它核酸酶(例如MAD7)相比的准确性。在一些实施方案中,本文公开的核酸酶构建体可以共享已知核酸酶的保守编码基序。在其它实施方案中,本文公开的核酸酶构建体不与已知核酸酶共享保守的编码肽基序。在某些实施方案中,本文公开的核酸酶构建体不编码所编码核酸酶内的肽基序YLFQIYNKDF(SEQ ID NO.224)。在某些实施方案中,本文公开的核酸引导的核酸酶构建体不编码肽基序YLFQIYNKDF,并且可以包括由SEQ ID NO.143-151、161-163、165、166、169、171-175、177和229表示的多肽。在其它实施方案中,本文公开的核酸引导的核酸酶构建体多肽包括肽基序YLFQIYNKDF(SEQ IDNO.224)。在一些实施方案中,本文公开的核酸引导的核酸酶构建体多肽包括肽基序YLFQIYNKDF并且可以由SEQ ID NO.152-160、164、167、168、170和176表示的多肽表示。
在某些方法中,可以将间隔突变引入质粒以测试何时产生取代gRNA序列或缺失或插入突变体。这些质粒构建体中的每一个都可用于测试基因组编辑的准确性和效率,例如,缺失、取代或插入。
可替代地,可以通过观察预定时间段内的编辑效率来测试由本文公开的组合物和方法产生的核酸酶构建体在选定靶标上的最佳基因组编辑时间。
用于本文公开的工程化的核酸引导的核酸酶的靶多核苷酸的实例可以包括与信号传导生化通路相关的序列/基因或基因区段,例如信号传导生化通路相关基因或多核苷酸。本文考虑的其它实施方案涉及与疾病相关基因或多核苷酸相关的靶多核苷酸的实例。
“疾病相关”或“病症相关”基因或多核苷酸可以指导致与对照相比转录或翻译产物处于异常水平或导致与非疾病对照的组织或细胞相比源自患病组织的细胞的异常形式的任何基因或多核苷酸。它可能是一个异常高水平表达的基因;它可能是一个异常低水平表达的基因,或者基因含有一个或多个突变,并且改变的表达或表达与健康状况或病症的发生和/或进展直接相关。疾病或病症相关基因可指一种具有突变或遗传变异的基因,直接负责疾病或病症的起因或进展或与负责疾病或病症的起因或进展的基因处于连锁不平衡。转录或翻译产物可能是已知的或未知的,可能处于正常或异常水平。
相关领域的技术人员理解疾病相关基因和多核苷酸的实例可从约翰霍普金斯大学的麦库西克-内森斯遗传医学研究所(McKusick-Nat hans Institute of GeneticMedicine,Johns Hopkins University)(Balti more,Md.)和美国国家医学图书馆的国家生物技术信息中心、国家医学图书馆(National Center for BiotechnologyInformation,National Library of Medicine)(Bethesda,Md.)获得,可在万维网上获取。本文公开了遗传病症和病症相关疾患、遗传病症的其它实例。
本文考虑的遗传病症可包括但不限于:
赘瘤:与这种病症相关的基因:PTEN;ATM;ATR;EGFR;ERBB2;ERBB3;ERBB4;Notchl;Notch2;Notch3;Notch4;AKT;AKT2;AKT3;HIF;HIFI a;HIF3a;Met;HRG;Bc12;PPARα;PPARγ;WT1(维尔姆斯瘤(Wilms Tumor));FGF受体家族成员(5个成员:1、2、3、4、5);CDKN2a;APC;RB(视网膜母细胞瘤);MEN1;VHL;BRCA1;BRCA2;AR(雄激素受体);TSG101;IGF;IGF受体;Igfl(4种变体);Igf2(3种变体);Igf 1受体;Igf 2受体;Bax;Bc12;胱天蛋白酶家族(9个成员:1、2、3、4、6、7、8、9、12);Kras;Apc;
年龄相关性黄斑变性:与这些病症相关的基因:Abcr;Cc12;Cc2;cp(铜蓝蛋白);Timp3;组织蛋白酶D;VIdlr;Ccr2;
精神分裂症:与这种病症相关的基因:神经调节蛋白l(Nrgl);Erb4(神经调节蛋白受体);复合素l(Cp1x1);Tphl色氨酸羟化酶;Tph2色氨酸羟化酶2;轴突蛋白1;GSK3;GSK3a;GSK3b;
三核苷酸重复病症:与这种病症相关的基因:5HTT(亨廷顿病(Huntington'sDx));SBMA/SMAX1/AR(肯尼迪病(Kennedy's Dx));FXN/X25(弗里德里希共济失调(Friedrich's Ataxia));ATX3(马查多-约瑟夫病(Machado-Joseph's Dx));ATXN1和ATXN2(脊髓小脑性共济失调);DMPK(myotonic dystrophy);肌萎缩蛋白-1和Atnl(DRPLA病);CBP(Creb-BP-普遍不稳定);VLDLR(阿尔茨海默氏症(Alzheimer's));Atxn7;Atxn10;
脆性X综合征:与这种病症相关的基因:FMR2;FXR1;FXR2;mGLURS;
分泌酶相关病症:与这种病症相关的基因:APH-1(α和β);早老素(Psenl);呆蛋白(Ncstn);PEN-2;
其它:与这种病症相关的基因:Nosl;Paipl;Nati;Nat2;
朊病毒相关病症:与这种病症相关的基因:Prp;
ALS:与这种病症相关的基因:SOD1;ALS2;STEX;FUS;TARDBP;VEGF(VEGF-a;VEGF-b;VEGF-c);
药物成瘾:与这种病症相关的基因:Prkce(酒精);Drd2;Drd4;ABAT(酒精);GRIA2;GrmS;Grinl;Htrlb;Grin2a;Drd3;Pdyn;Grial(酒精);
自闭症:与这种病症相关的基因:Mecp2;BZRAP1;MDGA2;SemaSA;轴突蛋白1;脆性X(FMR2(AFF2);FXR1;FXR2;MglurS);
阿尔茨海默氏症:与这种病症相关的基因:El;CHIP;UCH;UBB;Tau;LRP;PICALM;凝聚素;PS1;SORL1;CR1;VIdlr;Ubal;Uba3;CHIP28(Aqp1、水通道蛋白1);Uchll;Uch13;APP;
炎症和免疫相关病症:与这种病症相关的基因:IL-10;IL-1(IL-la;IL-1b);IL-13;IL-17(IL-17a(CTLA8);IL-17b;IL-17c;IL-17d;IL-17f);11-23;Cx3crl;ptpn22;TNFa;IBD的NOD2/CARD15;IL-6;IL-12(IL-12a;IL-12b);CTLA4;Cx3c11、AAT缺陷/突变、AIDS(KIR3DL1、NKAT3、NKB1、ANIB11、KIR3DS1、IFNG、CXCL12、SDF1);自身免疫性淋巴增生综合征(TNFRSF6、APT1、FAS、CD95、ALPS1A);联合免疫缺陷、(IL2RG、SCIDX1、SCIDX、IMD4);HIV-1(CCL5、SCYA5、D17S136E、TCP228)、HIV易感性或感染(IL10、CSIF、CMKBR2、CCR2、CMKBR5、CCCKR5(CCR5));免疫缺陷(CD3E、CD3G、AICDA、AID、HIGM2、TNFRSF5、CD40、UNG、DGU、HIGM4、TNFSF5、CD4OLG、HIGM1、IGM、FOXP3、IPEX、AIID、XPID、PIDX、TNFRSF14B、TACI);炎症(IL-10、IL-1(IL-la、IL-1b)、IL-13、IL-17(IL-17a(CTLA8)、IL-17b、IL-17c、IL-17d、IL-17f)、11-23、Cx3crl、ptpn22、TNFa、IBD的NOD2/CARD15、IL-6、IL-12(IL-12a、IL-12b)、CTLA4、Cx3c11);严重联合免疫缺陷(SCID)(JAK3、JAKL、DCLRE1C、ARTEMIS、SCIDA、RAG1、RAG2、ADA、PTPRC、CD45、LCA、IL7R、CD3D、T3D、IL2RG、SCIDX1、SCIDX、IMD4);
帕金森病(Parkinson's),与这种病症相关的基因:x-突触核蛋白;DJ-1;LRRK2;帕金蛋白;PINK1;
血液和凝血障碍:与这些病症相关的基因:贫血(CDAN1、CDA1、RPS19、DBA、PKLR、PK1、NT5C3、UMPH I、PSN1、RHAG、RH50A、NRAMP2、SPTB、ALAS2、ANH I、ASB、ABCB7、ABC7、ASAT);裸淋巴细胞综合征(TAPBP、TPSN、TAP2、ABCB3、PSF2、RINGI 1、MHC2TA、C2TA、RFX5、RFXAP、RFX5)、出血性病症(TBXA2R、P2RX I、P2X I);因子H和因子H样1(HF1、CFH、HUS);因子V和因子VIII(MCFD2);因子VII缺乏症(F7);因子X缺乏症(F10);因子XI缺乏症(F11);因子XII缺乏症(F12、HAF);因子XIIIA缺乏症(F13A1、F13A);因子XIIIB缺乏症(F13B);范可尼贫血(Fanconi anemia)(FANCA、FACA、FA1、FA、FAA、FAAP95、FAAP90、FLJ34064、FANCB、FANCC、FACC、BRCA2、FANCD1、FANCD2、FANCD、FACD、FAD、FANCE、FACE、FANCF、XRCC9、FANCG、BRIP1、BACH1、FANCJ、PHF9、FANCL、FANCM、ICIAA1596);噬血细胞性淋巴组织细胞增多症(PRF1、HPLH2、UNC13D、MUNC13-4、HPLH3、HLH3、FHL3);血友病A(F8、F8C、HEMA);血友病B(F9、HEMB)、出血性病症(PI、ATT、F5);白细胞缺陷和紊乱(ITGB2、CD18、LCAMB、LAD、EIF2B1、EIF2BA、EIF2B2、EIF2B3、EIF2B5、LVWM、CACH、CLE、EIF2B4);镰状细胞性贫血(HBB);地中海贫血(HBA2、HBB、HBD、LCRB、HBA1);
细胞失调和肿瘤病症:与这些病症相关的基因:B细胞非霍奇金淋巴瘤(B-cellnon-Hodgkin lymphoma)(BCL7A、BCL7);白血病(TALI TCL5、SCL、TAL2、FLT3、NBS 1、NBS、ZNFNIAI、IK1、LYF1、HOXD4、HOX4B、BCR、CML、PHL、ALL、ARNT、KRAS2、RASK2、GMPS、AFIO、ARHGEFI2、LARG、KIAA0382、CALM、CLTH、CEBPA、CEBP、CHIC2、BTL、FLT3、KIT、PBT、LPP、NPM1、NUP214、D9S46E、CAN、CAIN、RUNX 1、CBFA2、AML1、WHSC 1LI、NSD3、FLT3、AF1Q、NPM 1、NUMA1、ZNF145、PLZF、PML、MYL、STAT5B、AFI 0、CALM、CLTH、ARLI 1、ARLTS1、P2RX7、P2X7、BCR、CML、PHL、ALL、GRAF、NFI、VRNF、WSS、NFNS、PTPNI 1、PTP2C、SHP2、NS 1、BCL2、CCND1、PRAD1、BCL1、TCRA、GATA1、GF1、ERYF1、NFE1、ABL1、NQO1、DIA4、NMOR1、NUP2I4、D9S46E、CAN、CAIN);
代谢、肝脏、肾脏病症:与这些病症相关的基因:淀粉样变性神经病(TTR、PALS);淀粉样变性(APOA1、APP、AAA、CVAP、AD1、GSN、FGA、LYZ、UR、PALS);肝硬化(KATI 8、KRT8、CaHlA、NAIC、TEX292、KIAA1988);囊性纤维化(CFTR、ABCC7、CF、MRP7);糖原贮积病(SLC2A2、GLUT2、G6PC、G6PT、G6PT1、GAA、LAMP2、LAMPS、AGL、GDE、GBE1、GYS2、PYGL、PFKM);肝腺瘤、142330(TCF1、HNF1A、MODY3)、肝衰竭、早发和神经系统病症(SCOD1、SCO1)、肝脂肪酶缺乏症(LIPC)、肝母细胞瘤、癌症和癌瘤(CTNNB1、PDGFRL、PDGRL、PRLTS、AXIN1、AXIN、CTNNB1、TP53、P53、LFS1、IGF2R、MPRI、MET、CASP8、MCH5;髓质囊性肾病(UMOD、HNFJ、FJHN、MCKD2、ADMCKD2);苯丙酮尿症(PAH、PKU1、QDPR、DHPR、PTS);多囊性肾脏和肝脏疾病(FCYT、PKHD1、ARPKD、PKD2、PKD4、PKDTS、PRKCSH、G19P1、PCLD、SEC63);
肌肉/骨骼病症:与这些病症相关的基因:贝克尔肌营养不良症(Becker musculardystrophy)(DMD、BMD、MYF6)、杜氏肌营养不良症(Duchenne Muscular Dystrophy)(DMD、BMD);埃默里-德赖弗斯肌营养不良症(Emery-Dreifuss muscular dystrophy)(LMNA、LMN1、EMD2、FPLD、CMD1A、HGPS、LGMD1B、LMNA、LMN1、EMD2、FPLD、CMD1A);面肩肱型肌营养不良症(FSHMD1A、FSHD1A);肌营养不良症(FKRP、MDC1C、LGMD2I、LAMA2、LAMM、LARGE、KIAA0609、MDC1D、FCMD、TTID、MYOT、CAPN3、CANP3、DYSF、LGMD2B、SGCG、LGMD2C、DMDA1、SCG3、SGCA、ADL、DAG2、LGMD2D、DMDA2、SGCB、LGMD2E、SGCD、SGD、LGMD2F、CMD1L、TCAP、LGMD2G、CMD1N、TRIM32、HT2A、LGMD2H、FKRP、MDC1C、LGMD2I、TTN、CMD1G、TMD、LGMD2J、POMT1、CAV3、LGMD1C、SEPN1、SELN、RSMD1、PLEC1、PLTN、EBS1);骨质硬化症(LAPS、BMND1、LRP7、LR3、OPPG、VBCH2、CLCN7、CLC7、OPTA2、OSTM1、GL、TCIRG1、TIRC7、0C116、OPTB1);肌肉萎缩(VAPB、VAPC、ALS8、SMN1、SMA1、SMA2、SMA3、SMA4、BSCL2、SPG17、GARS、SMAD1、CMT2D、HEXB、IGHMBP2、SMUBP2、CATF1、SMARD1);
神经系统和神经元病症:与这些病症相关的基因:ALS(SOD1、ALS2、STEX、FUS、TARDBP、VEGF(VEGF-a、VEGF-b、VEGF-c);阿尔茨海默症(APP、AAA、CVAP、AD1、APOE、AD2、PSEN2、AD4、STM2、APBB2、FE65L1、NOS3、PLAU、URK、ACE、DCPI、ACEI、MPO、PACIP1、PAXIPIL、PTIP、A2M、BLMH、BMH、PSEN1、AD3);自闭症(Mecp2、BZRAP I、MDGA2、Sema5A、Neurex 1、GLO1、MECP2、RTT、PPMX、MRX16、MRX79、NLGN3、NLGN4、KIAA1260、AUTSX2);脆性X综合征(FMR2、FXR1、FXR2、mGLUR5);亨廷顿氏病和疾病样病症(HD、IT15、PRNP、PRIP、JPH3、JP3、HDL2、TBP、SCA17);帕金森病(NR4A2、NURR1、NOT、TINUR、SNCAIP、TBP、SCA17、SNCA、NACP、PARK1、PARK4、DJ1、PARK7、LRRK2、PARKS、PINK1、PARK6、UCHL1、PARKS、SNCA、NACP、PARK1、PARK4、PRKN、PARK-2、PDJ、DBH、NDUFV2);雷特综合征(Rett syndrome)(MECP2、RTT、PPMX、MRX16、MRX79、CDKL5、STK9、MECP2、RTT、PPMX、MRX16、MRX79、x-突触核蛋白、DJ-1);精神分裂症(神经调节蛋白l(Nrgl)、Erb4(神经调节蛋白受体)、复合素l(Cp1x1)、Tphl色氨酸羟化酶、Tph2、色氨酸羟化酶2、轴突蛋白1、GSK3、GSK3a、GSK3b、5-HTT(S1c6a4)、COMT、DRD(Drd la)、SLC6A3、DAOA、DTNBP1、Dao(Daol));分泌酶相关病症(APH-1(α和β)、早老素(Psenl)、呆蛋白(Ncstn)、PEN-2、Nosl、Parpl、Natl、Nat2);三核苷酸重复病症(HTT(亨廷顿病)、SBMA/SMAX1/AR(肯尼迪病)、FXN/X25(弗里德里希共济失调)、ATX3(马查多-约瑟夫病)、ATXN1和ATXN2(脊髓小脑性共济失调)、DMPK(强直性肌营养不良)、肌萎缩蛋白-1和Atnl(DRPLADx)、CBP(Creb-BP-普遍不稳定)、VLDLR(阿尔茨海默氏症)、Atxn7、Atxn10);
眼部相关病症:与这些病症相关的基因:年龄相关性黄斑变性(Aber、Cc12、Cc2、cp(血浆铜蓝蛋白)、Timp3、组织蛋白酶D、Vld1r、Ccr2);白内障(CRYAA、CRYA1、CRYBB2、CRYB2、PITX3、BFSP2、CP49、CP47、CRYAA、CRYA1、PAX6、AN2、MGDA、CRYBA1、CRYB1、CRYGC、CRYG3、CCL、LIM2、MP19、CRYGD、CRYG4、BFSP2、CP49、CP47、HSF4、CTM、HSF4、CTM、MIP、AQPO、CRYAB、CRYA2、CTPP2、CRYBB1、CRYGD、CRYG4、CRYBB2、CRYB2、CRYGC、CRYG3、CCL、CRYAA、CRYA1、GJA8、CX50、CAE1、GJA3、CX46、CZP3、CAE3、CCM1、CAM、KRIT1);角膜混浊和营养不良(APOA1、TGFBI、CSD2、CDGG1、CSD、BIGH3、CDG2、TACSTD2、TROP2、M1S1、VSX1、RINX、PPCD、PPD、KTCN、COL8A2、FECD、PPCD2、PIP5K3、CFD);先天性扁平角膜(KERA、CNA2);青光眼(MYOC、TIGR、GLC1A、JOAG、GPOA、OPTN、GLC1E、FIP2、HYPL、NRP、CYP1B1、GLC3A、OPAL、NTG、NPG、CYP1B1、GLC3A);莱伯氏先天性黑蒙(Leber congenital amaurosis)(CRB1、RP12、CRX、CORD2、CRD、RPGRIP1、LCA6、CORD9、RPE65、RP20、AIPL1、LCA4、GUCY2D、GUC2D、LCA1、CORD6、RDH12、LCA3);黄斑营养不良(ELOVL4、ADMD、STGD2、STGD3、RDS、RP7、PRPH2、PRPH、AVMD、AOFMD、VMD2);
P13K/AKT细胞信号传导病症:与这些病症相关的基因:PRKCE;ITGAM;ITGA5;IRAK1;PRKAA2;EIF2AK2;PTEN;EIF4E;PRKCZ;GRK6;MAPK1;TSC1;PLK1;AKT2;IKBKB;PIK3CA;CDK8;CDKN1B;NFKB2;BCL2;PIK3CB;PPP2R1A;MAPK8;BCL2L1;MAPK3;TSC2;ITGAl;KRAS;EIF4EBP1;RELA;PRKCD;NOS3;PRKAA1;MAPK9;CDK2;PPP2CA;PIM1;ITGB7;YWHAZ;ILK;TP53;RAF1;IKBKG;RELB;DYRK1A;CDKN1A;ITGB1;MAP2K2;JAK1;AKT1;JAK2;PIK3R1;CHUK;PDPK1;PPP2R5C;CTNNB1;MAP2K1;NFKB1;PAK3;ITGB3;CCND1;GSK3A;FRAP1;SFN;ITGA2;TTK;CSNK1A1;BRAF;GSK3B;AKT3;FOXO1;SOK;HS P9OAA1;RP S 6KB1;
ERK/MAPK细胞信号传导病症:与这些病症相关的基因:PRKCE;ITGAM;ITGA5;HSPB1;IRAK1;PRKAA2;EIF2AK2;RAC1;RAP1A;TLN1;EIF4E;ELK1;GRK6;MAPK1;RAC2;PLK1;AKT2;PIK3CA;CDK8;CREB1;PRKCI;PTK2;FOS;RPS6KA4;PIK3CB;PPP2R1A;PIK3C3;MAPK8;MAPK3;ITGAl;ETS1;KRAS;MYCN;EIF4EBP1;PPARG;PRKCD;PRKAA1;MAPK9;SRC;CDK2;PPP2CA;PIM1;PIK3C2A;ITGB7;YWHAZ;PPP1CC;KSR1;PXN;RAF1;FYN;DYRK1A;ITGB1;MAP2K2;PAK4;PIK3R1;STAT3;PPP2R5C;MAP2K1;PAK3;ITGB3;ESR1;ITGA2;MYC;TTK;CSNK1A1;CRKL;BRAE;ATF4;PRKCA;SRF;STAT1;SGK;
糖皮质激素受体细胞信号传导病症:与这些病症相关的基因:RAC1;TAF4B;EP300;SMAD2;TRAF6;PCAF;ELK1;MAPK1;SMAD3;AKT2;IKBKB;NCOR2;UBE2I;PIK3CA;CREB1;FOS;HSPA5;NFKB2;BCL2;MAP3K14;STAT5B;PIK3CB;PIK3C3;MAPK8;BCL2L1;MAPK3;TSC22D3;MAPK10;NRIP1;KRAS;MAPK13;RELA;STAT5A;MAPK9;NOS2A;PBX1;NR3C1;PIK3C2A;CDKN1C;TRAF2;SERPINE1;NCOA3;MAPK14;TNF;RAF1;IKBKG;MAP3K7;CREBBP;CDKN1A;MAP2K2;JAK1;IL8;NCOA2;AKT1;JAK2;PIK3R1;CHUK;STAT3;MAP2K1;NFKB1;TGFBR1;ESR1;SMAD4;CEBPB;JUN;AR;AKT3;CCL2;MMP 1;STAT1;IL6;HSP9OAA1;
轴突导向细胞信号传导病症:与这些病症相关的基因:PRKCE;ITGAM;ROCK1;ITGA5;CXCR4;ADAM12;IGF1;RAC1;RAP1A;El F4E;PRKCZ;NRP1;NTRK2;ARHGEF7;SMO;ROCK2;MAPK1;PGF;RAC2;PTPN11;GNAS;AKT2;PIK3CA;ERBB2;PRKCI;PTK2;CFL1;GNAQ;PIK3CB;CXCL12;PIK3C3;WNT11;PRKD1;GNB2L1;ABL1;MAPK3;ITGA1;KRAS;RHOA;PRKCD;PIK3C2A;ITGB7;GLI2;PXN;VASP;RAF1;FYN;ITGB1;MAP2K2;PAK4;ADAM17;AKT1;PIK3R1;GUI;WNT5A;ADAM10;MAP2K1;PAK3;ITGB3;CDC42;VEGFA;ITGA2;EPHA8;CRKL;RND1;GSK3B;AKT3;PRKCA;
Ephrin受体细胞信号传导病症:与这些病症相关的基因:PRKCE;ITGAM;ROCK1;ITGA5;CXCR4;IRAK1;PRKAA2;EIF2AK2;RAC1;RAP1A;GRK6;ROCK2;MAPK1;PGF;RAC2;PTPN11;GNAS;PLK1;AKT2;DOK1;CDK8;CREB1;PTK2;CFL1;GNAQ;MAP3K14;CXCL12;MAPK8;GNB2L1;ABL1;MAPK3;ITGA1;KRAS;RHOA;PRKCD;PRKAA1;MAPK9;SRC;CDK2;PIM1;ITGB7;PXN;RAF1;FYN;DYRK1A;ITGB1;MAP2K2;PAK4、AKT1;JAK2;STAT3;ADAM10;MAP2K1;PAK3;ITGB3;CDC42;VEGFA;ITGA2;EPHA8;TTK;CSNK1A1;CRKL;BRAF;PTPN13;ATF4;AKT3;SGK;
肌动蛋白细胞骨架细胞信号传导病症:与这些病症相关的基因:ACTN4;PRKCE;ITGAM;ROCK1;ITGA5;IRAK1;PRKAA2;EIF2AK2;RAC1;INS;ARHGEF7;GRK6;ROCK2;MAPK1;RAC2;PLK1;AKT2;PIK3CA;CDK8;PTK2;CFL1;PIK3CB;MYH9;DIAPH1;PIK3C3;MAPK8;F2R;MAPK3;SLC9A1;ITGA1;KRAS;RHOA;PRKCD;PRKAA1;MAPK9;CDK2;PIM1;PIK3C2A;ITGB7;PPP1CC;PXN;VIL2;RAF1;GSN;DYRK1A;ITGB1;MAP2K2;PAK4;PIP5K1A;PIK3R1;MAP2K1;PAK3;ITGB3;CDC42;APC;ITGA2;TTK;CSNK1A1;CRKL;BRAF;VAV3;SGK;
亨廷顿氏病细胞信号传导病症:与这些病症相关的基因:PRKCE;IGF1;EP300;RCOR1;PRKCZ;HDAC4;TGM2;MAPK1;CAPNS1;AKT2;EGFR;NCOR2;SP1;CAPN2;PIK3CA;HDAC5;CREB1;PRKC1;HS PA5;REST;GNAQ;PIK3CB;PIK3C3;MAPK8;IGF1R;PRKD1;GNB2L1;BCL2L1;CAPN1;MAPK3;CASP8;HDAC2;HDAC7A;PRKCD;HDAC11;MAPK9;HDAC9;PIK3C2A;HDAC3;TP53;CASP9;CREBBP;AKT1;PIK3R1;PDPK1;CASP1;APAF1;FRAP1;CASP2;JUN;BAX;ATF4;AKT3;PRKCA;CLTC;SGK;HDAC6;CASP3;
细胞凋亡细胞信号传导病症:与这些病症相关的基因:PRKCE;ROCK1;BID;IRAK1;PRKAA2;EIF2AK2;BAK1;BIRC4;GRK6;MAPK1;CAPNS1;PLK1;AKT2;IKBKB;CAPN2;CDK8;FAS;NFKB2;BCL2;MAP3K14;MAPK8;BCL2L1;CAPN1;MAPK3;CASP8;KRAS;RELA;PRKCD;PRKAA1;MAPK9;CDK2;PIM1;TP53;TNF;RAF1;IKBKG;RELB;CASP9;DYRK1A;MAP2K2;CHUK;APAF1;MAP2K1;NFKB1;PAK3;LMNA;CASP2;BIRC2;TTK;CSNK1A1;BRAF;BAX;PRKCA;SGK;CASP3;BTRC3;PARPI;
B细胞受体细胞信号传导病症:与这些病症相关的基因:RAC1;PTEN;LYN;ELK1;MAPK1;RAC2;PTPN11;AKT2;IKBKB;PIK3CA;CREB1;SYK;NFKB2;CAMK2A;MAP3K14;PIK3CB;PIK3C3;MAPK8;BCL2L1;ABL1;MAPK3;ETS1;KRAS;MAPK13;RELA;PTPN6;MAPK9;EGR1;PIK3C2A;BTK;MAPK14;RAF1;IKBKG;RELB;MAP3K7;MAP2K2;AKT1;PIK3R1;CHUK;MAP2K1;NFKB1;CDC42;GSK3A;FRAP1;BCL6;BCL10;JUN;GSK3B;ATF4;AKT3;VAV3;RPS6KB1;
白细胞外渗细胞信号传导病症:与这些病症相关的基因:ACTN4;CD44;PRKCE;ITGAM;ROCK1;CXCR4;CYBA;RAC1;RAP1A;PRKCZ;ROCK2;RAC2;PTPN11;MMP14;PIK3CA;PRKCI;PTK2;PIK3CB;CXCL12;PIK3C3;MAPK8;PRKD1;ABL1;MAPK10;CYBB;MAPK13;RHOA;PRKCD;MAPK9;SRC;PIK3C2A;BTK;MAPK14;NOX1;PXN;VIL2;VASP;ITGB1;MAP2K2;CTNND1;PIK3R1;CTNNB1;CLDN1;CDC42;FUR;ITK;CRKL;VAV3;CTTN;PRKCA;MMPl;MMP9;
整合素细胞信号传导病症:与这些病症相关的基因:ACTN4;ITGAM;ROCK1;ITGA5;RAC1;PTEN;RAP1A;TLN1;ARHGEF7;MAPK1;RAC2;CAPNS1;AKT2;CAPN2;PIK3CA;PTK2;PIK3CB;PIK3C3;MAPK8;CAV1;CAPN1;ABL1;MAPK3;ITGAl;KRAS;RHOA;SRC;PIK3C2A;ITGB7;PPP1CC;ILK;PXN;VASP;RAF1;FYN;ITGB1;MAP2K2;PAK4;AKT1;PIK3R1;TNK2;MAP2K1;PAK3;ITGB3;CDC42;RND3;ITGA2;CRKL;BRAF;GSK3B;AKT3;
急性期反应细胞信号传导病症:与这些病症相关的基因:IRAK1;SOD2;MYD88;TRAF6;ELK1;MAPK1;PTPN11;AKT2;IKBKB;PIK3CA;FOS;NFKB2;MAP3K14;PIK3CB;MAPK8;RIPK1;MAPK3;IL6ST;KRAS;MAPK13;IL6R;RELA;SOCS1;MAPK9;FTL;NR3C1;TRAF2;SERPINE1;MAPK14;TNF;RAF1;PDK1;IKBKG;RELB;MAP3K7;MAP2K2;AKT1;JAK2;PIK3R1;CHUK;STAT3;MAP2K1;NFKB1;FRAP1;CEBPB;JUN;AKT3;IL1R1;IL6;
PTEN细胞信号传导病症:与这些病症相关的基因:ITGAM;ITGA5;RAC1;PTEN;PRKCZ;BCL2L11;MAPK1;RAC2;AKT2;EGFR;IKBKB;CBL;PIK3CA;CDKN1B;PTK2;NFKB2;BCL2;PIK3CB;BCL2L1;MAPK3;ITGA1;KRAS;ITGB7;ILK;PDGFRB;INSR;RAF1;IKBKG;CASP9;CDKN1A;ITGB1;MAP2K2;AKT1;PIK3R1;CHUK;PDGFRA;PDPK1;MAP2K1;NFKB1;ITGB3;CDC42;CCND1;GSK3A;ITGA2;GSK3B;AKT3;FOXO1;CASP3;
p53细胞信号传导病症:与这些病症相关的基因:RPS6KB1 PTEN;EP300;BBC3;PCAF;FASN;BRCA1;GADD45A;BIRC5;AKT2;PIK3CA;CHEK1;TP53INP1;BCL2;PIK3CB;PIK3C3;MAPK8;THBS 1;ATR;BCL2L1;E2F1;PMAIP1;CHEK2;TNFASF10B;TP73;RB1;HDAC9;CDK2;PIK3C2A;MAPK14;TP53;LRDD;CDKN1A;HIPK2;AKT1;PIK3R1;RAM2B;APAF1;CTNNB1;SIRT1;CCND1;PRKDC;ATM;SFN;CDKN2A;JUN;SNAI2;GSK3B;BAX;AKT3;
芳基烃受体细胞信号传导病症:与这些病症相关的基因:HSPB1;EP300;FASN;TGM2;RXRA;MAPK1;NQO1;NCOR2;SP1;ARNT;CDKN1B;FOS;CHEK1;SMARCA4;NFKB2;MAPK8;ALDH1A1;ATR;E2F1;MAPK3;NRIP1;CHEK2;RELA;TP73;GSTP1;RB1;SRC;CDK2;AHR;NFE2L2;NCOA3;TP53;TNF;CDKN1A;NCOA2;APAF1;NFKB1;CCND1;ATM;ESR1;CDKN2A;MYC;JUN;ESR2;BAX;IL6;CYP1B1;HSP9OAA1;
异种代谢细胞信号传导病症:与这些病症相关的基因:PRKCE;EP300;PRKCZ;RXRA;MAPK1;NQO1;NCOR2;PIK3CA;ARNT;PRKCI;NFKB2;CAMK2A;PIK3CB;PPP2R1A;PIK3C3;MAPK8;PRKD1;ALDH1A1;MAPK3;NRIP1;KRAS;MAPK13;PRKCD;GSTP1;MAPK9;NOS2A;ABCB1;AHR;PPP2CA;FTL;NFE2L2;PIK3C2A;PPARGC1A;MAPK14;TNF;RAF1;CREBBP;MAP2K2;PIK3R1;PPP2R5C;MAP2K1;NFKB1;KEAP1;PRKCA;EIF2AK3;IL6;CYP1B1;HSP9OAA1;
SAPL/JNK细胞信号传导病症:与这些病症相关的基因:PRKCE;IRAK1;PRKAA2;EIF2AK2;RAC1;ELK1;GRK6;MAPK1;GADD45A;RAC2;PLK1;AKT2;PIK3CA;FADD;CDK8;PIK3CB;PIK3C3;MAPK8;RIPK1;GNB2L1;IRS1;MAPK3;MAPK10;DAXX;KRAS;PRKCD;PRKAA1;MAPK9;CDK2;PIM1;PIK3C2A;TRAF2;TP53;LCK;MAP3K7;DYRK1A;MAP2K2;PIK3R1;MAP2K1;PAK3;CDC42;JUN;TTK;CSNK1A1;CRKL;BRAF;SGK;
PPAr/RXR细胞信号传导病症:与这些病症相关的基因:PRKAA2;EP300;INS;SMAD2;TRAF6;PPARA;FASN;RXRA;MAPK1;SMAD3;GNAS;IKBKB;NCOR2;ABCA1;GNAQ;NFKB2;MAP3K14;STAT5B;MAPK8;IASI;MAPK3;KRAS;RELA;PRKAA1;PPARGC1A;NCOA3;MAPK14;INSR;RAF1;IKBKG;RELB;MAP3K7;CREBBP;MAP2K2;JAK2;CHUK;MAP2K1;NFKB1;TGFBAl;SMAD4;JUN;IL1R1;PRKCA;IL6;HSP9OAA1;ADIPOO;
NF-KB细胞信号传导病症:与这些病症相关的基因:IRAK1;EIF2AK2;EP300;INS;MYD88;PRKCZ:TRAF6;TBK1;AKT2;EGFR;IKBKB;PIK3CA;BTRC;NFKB2;MAP3K14;PIK3CB;PIK3C3;MAPK8;RIPK1;HDAC2;KRAS;RELA;PIK3C2A;TRAF2;TLR4:PDGFRB;TNF;INSR;LCK;IKBKG;RELB;MAP3K7;CREBBP;AKT1;PIK3R1;CHUK;PDGFRA;NFKB1;TLR2;BCL10;GSK3B;AKT3;TNFAIP3;IL1R1;
神经调节蛋白细胞信号传导病症:与这些病症相关的基因:ERBB4;PRKCE;ITGAM;ITGA5:PTEN;PRKCZ;ELK1;MAPK1;PTPN11;AKT2;EGFR;ERBB2;PRKCI;CDKN1B;STAT5B;PRKD1;MAPK3;ITGA1;KRAS;PRKCD;STAT5A;SRC;ITGB7;RAF1;ITGB1;MAP2K2;ADAM17;AKT1;PIK3R1;PDPK1;MAP2K1;ITGB3;EREG;FRAP1;PSEN1;ITGA2;MYC;NRG1;CRKL;AKT3;PRKCA;HS P9OAA1;RPS6KB1;
Wnt和Β连环蛋白细胞信号传导病症:与这些病症相关的基因:CD44;EP300;LRP6;DVL3;CSNK1E;GJA1;SMO;AKT2;PIN1;CDH1;BTRC;GNAQ;MARK2;PPP2R1A;WNT11;SRC;DKK1;PPP2CA;SOX6;SFRP2;ILK;LEF1;SOX9;TP53;MAP3K7;CREBBP;TCF7L2;AKT1;PPP2R5C;WNT5A;LAPS;CTNNB1;TGFBR1;CCND1;GSK3A;DVL1;APC;CDKN2A;MYC;CSNK1A1;GSK3B;AKT3;SOX2;
胰岛素受体信号传导病症:与这些病症相关的基因:PTEN;INS;EIF4E;PTPN1;PRKCZ;MAPK1;TSC1;PTPN11;AKT2;CBL;PIK3CA;PRKCI;PIK3CB;PIK3C3;MAPK8;IASI;MAPK3;TSC2;KRAS;EIF4EBP1;SLC2A4;PIK3C2A;PPP1CC;INSR;RAF1;FYN;MAP2K2;JAK1;AKT1;JAK2;PIK3R1;PDPK1;MAP2K1;GSK3A;FRAP1;CRKL;GSK3B;AKT3;FOXO1;SGK;RPS6KB1;
IL-6细胞信号传导病症:与这些病症相关的基因:HSPB1;TRAF6;MAPKAPK2;ELK1;MAPK1;PTPN11;IKBKB;FOS;NFKB2;MAP3K14;MAPK8;MAPK3;MAPK10;IL6ST;KRAS;MAPK13;IL6R;RELA;SOCS1;MAPK9;ABCB1;TRAF2;MAPK14;TNF;RAF1;IKBKG;RELB;MAP3K7;MAP2K2;IL8;JAK2;CHUK;STAT3;MAP2K1;NFKB1;CEBPB;JUN;IL1R1;SRF;IL6;
肝胆汁淤积细胞信号传导病症:与这些病症相关的基因:PRKCE;IRAK1;INS;MYD88;PRKCZ;TRAF6;PPARA;RXRA;IKBKB;PRKCI;NFKB2;MAP3K14;MAPK8;PRKD1;MAPK10;RELA;PRKCD;MAPK9;ABCB1;TRAF2;TLR4;TNF;INSR;IKBKG;RELB;MAP3K7;IL8;CHUK;NR1H2;TJP2;NFKB1;ESR1;SREBF1;FGFR4;JUN;IL1R1;PRKCA;IL6;
IGF-1细胞信号传导病症:与这些病症相关的基因:IGF1;PRKCZ;ELK1;MAPK1;PTPN11;NEDD4;AKT2;PIK3CA;PRKCI;PTK2;FOS;PIK3CB;PIK3C3;MAPK8;IGF1R;IRS1;MAPK3;IGFBP7;KRAS;PIK3C2A;YWHAZ;PXN;RAF1;CASP9;MAP2K2;AKT1;PIK3R1;PDPK1;MAP2K1;IGFBP2;SFN;JUN;CYR61;AKT3;FOXO1;SRF;CTGF;RPS6KB1;
NRF2介导的氧化应激反应信号传导病症:与这些病症相关的基因:PRKCE;EP300;SOD2;PRKCZ;MAPK1;SQSTM1;NQO1;PIK3CA;PRKCI;FOS;PIK3CB;PIK3C3;MAPK8;PRKD1;MAPK3;KRAS;PRKCD;GSTP1;MAPK9;FTL;NFE2L2;PIK3C2A;MAPK14;RAF1;MAP3K7;CREBBP;MAP2K2;AKT1;PIK3R1;MAP2K1;PPIB;JUN;KEAP1;GSK3B;ATF4;PRKCA;EIF2AK3;HSP9OAA1;
肝纤维化/肝星状细胞激活信号传导病症:与这些病症相关的基因:EDN1;IGF1;KDR;FLT1;SMAD2;FGFR1;MET;PGF;SMAD3;EGFR;FAS;CSF1;NFKB2;BCL2;MYH9;IGF1R;IL6R;RELA;TLR4;PDGFRB;TNF;RELB;IL8;PDGFRA;NFKB1;TGFBR1;SMAD4;VEGFA;BAX;IL1R1;CCL2;HGF;MMP1;STAT1;IL6;CTGF;MMP9;
PPAR信号传导病症:与这些病症相关的基因:EP300;INS;TRAF6;PPARA;RXRA;MAPK1;IKBKB;NCOR2;FOS;NFKB2;MAP3K14;STAT5B;MAPK3;NRIP1;KRAS;PPARG;RELA;STAT5A;TRAF2;PPARGC1A;PDGFRB;TNF;INSR;RAF1;IKBKG;RELB;MAP3K7;CREBBP;MAP2K2;CHUK;PDGFRA;MAP2K1;NFKB1;JUN;IL1R1;HSP9OAA1;
FcΕRI信号传导病症:与这些病症相关的基因:PRKCE;RAC1;PRKCZ;LYN;MAPK1;RAC2;PTPN11;AKT2;PIK3CA;SYK;PRKCI;PIK3CB;PIK3C3;MAPK8;PRKD1;MAPK3;MAPK10;KRAS;MAPK13;PRKCD;MAPK9;PIK3C2A;BTK;MAPK14;TNF;RAF1;FYN;MAP2K2;AKT1;PIK3R1;PDPK1;MAP2K1;AKT3;VAV3;PRKCA;
G蛋白偶联受体信号传导病症:与这些病症相关的基因:PRKCE;RAP1A;RGS16;MAPK1;GNAS;AKT2;IKBKB;PIK3CA;CREB1;GNAQ;NFKB2;CAMK2A;PIK3CB;PIK3C3;MAPK3;KRAS;RELA;SRC;PIK3C2A;RAF1;IKBKG;RELB;FYN;MAP2K2;AKT1;PIK3R1;CHUK;PDPK1;STAT3;MAP2K1;NFKB1;BRAF;ATF4;AKT3;PRKCA;
磷酸肌醇代谢信号传导病症:与这些病症相关的基因:PRKCE;IRAK1;PRKAA2;EIF2AK2;PTEN;GRK6;MAPK1;PLK1;AKT2;PIK3CA;CDK8;PIK3CB;PIK3C3;MAPK8;MAPK3;PRKCD;PRKAA1;MAPK9;CDK2;PIM1;PIK3C2A;DYRK1A;MAP2K2;PIP5K1A;PIK3R1;MAP2K1;PAK3;ATM;TTK;CSNK1A1;BRAF;SGK;
PDGF信号传导病症:与这些病症相关的基因:EIF2AK2;ELK1;ABL2;MAPK1;PIK3CA;FOS;PIK3CB;P IK3 C3;MAPK8;CAV1;ABL1;MAPK3;KRAS;SRC;PIK3C2A;PDGFRB;RAF1;MAP2K2;JAK1;JAK2;PIK3R1;PDGFRA;STAT3;SPHK1;MAP2K1;MYC;JUN;CRKL;PRKCA;SRF;STAT1;SPHK2 VEGF信号传导病症:与这些病症相关的基因:ACTN4;ROCK1;KDR;FLT1;ROCK2;MAPK1;PGF;AKT2;PIK3CA;ARNT;PTK2;BCL2;PIK3CB;PIK3C3;BCL2L1;MAPK3;KRAS;HIF1A;NOS3;PIK3C2A;PXN;RAF1;MAP2K2;ELAVL1;AKT1;PIK3R1;MAP2K1;SFN;VEGFA;AKT3;FOXO1;PRKCA;
自然杀伤细胞信号传导病症:与这些病症相关的基因:PRKCE;RAC1;PRKCZ;MAPK1;RAC2;PTPN11;KIR2DL3;AKT2;PIK3CA;SYK;PRKCI;PIK3CB;PIK3C3;PRKD1;MAPK3;KRAS;PRKCD;PTPN6;PIK3C2A;LCK;RAF1;FYN;MAP2K2;PAK4;AKT1;PIK3R1;MAP2K1;PAK3;AKT3;VAV3;PRKCA;
细胞周期:Gl/S检查点调节信号传导病症:与这些病症相关的基因:HDAC4;SMAD3;SUV39H1;HDAC5;CDKN1B;BTRC;ATR;ABL1;E2F1;HDAC2;HDAC7A;RB1;HDAC11;HDAC9;CDK2;E2F2;HDAC3;TP53;CDKN1A;CCND1;E2F4;ATM;RBL2;SMAD4;CDKN2A;MYC;NRG1;GSK3B;RBL1;HDAC6;
T细胞受体信号传导病症:与这些病症相关的基因:RAC1;ELK1;MAPK1;IKBKB;CBL;PIK3CA;FOS;NFKB2;PIK3CB;PIK3C3;MAPK8;MAPK3;KRAS;RELA、PIK3C2A;BTK;LCK;RAF1;IKBKG;RELB、FYN;MAP2K2;PIK3R1;CHUK;MAP2K1;NFKB1;ITK;BCL10;JUN;VAV3;
死亡受体病症:与这些病症相关的基因:CRADD;HSPB1;BID;BIRC4;TBK1;IKBKB;FADD;FAS;NFKB2;BCL2;MAP3K14;MAPK8;RIPK1;CASP8;DAXX;TNFRSF10B;RELA;TRAF2;TNF;IKBKG;RELB;CASP9;CHUK;APAF1;NFKB1;CASP2;BIRC2;CASP3;BIRC3;
FGF细胞信号传导病症:与这些病症相关的基因:RAC1;FGFR1;MET;MAPKAPK2;MAPK1;PTPN11;AKT2;PIK3CA;CREB1;PIK3CB;PIK3C3;MAPK8;MAPK3;MAPK13;PTPN6;PIK3C2A;MAPK14;RAF1;AKT1;PIK3R1;STAT3;MAP2K1;FGFR4;CRKL;ATF4;AKT3;PRKCA;HGF;
GM-CSF细胞信号传导病症:与这些病症相关的基因:LYN;ELK1;MAPK1;PTPN11;AKT2;PIK3CA;CAMK2A;STAT5B;PIK3CB;PIK3C3;GNB2L1;BCL2L1;MAPK3;ETS1;KRAS;RUNX1;PIM1;PIK3C2A;RAF1;MAP2K2;AKT1;JAK2;PIK3R1;STAT3;MAP2K1;CCND1;AKT3;STAT1;
肌萎缩侧索硬化细胞信号传导病症:与这些病症相关的基因:BID;IGF1;RAC1;BIRC4;PGF;CAPNS1;CAPN2;PIK3CA;BCL2;PIK3CB;PIK3C3;BCL2L1;CAPN1;PIK3C2A;TP53;CASP9;PIK3R1;RAB5A;CASP1;APAF1;VEGFA;BIRC2;BAX;AKT3;CASP3;BIRC3 PTPN1;MAPK1;PTPN11;AKT2;PIK3CA;STAT5B;PIK3CB;PIK3C3;MAPK3;KRAS;SOCS1;STAT5A;PTPN6;PIK3C2A;RAF1;CDKN1A;MAP2K2;JAK1;AKT1;JAK2;PIK3R1;STAT3;MAP2K1;FRAP1;AKT3;STAT1;
JAK/Stat细胞信号传导病症:与这些病症相关的基因:PTPN1;MAPK1;PTPN11;AKT2;PIK3CA;STAT5B;PIK3CB;PIK3C3;MAPK3;KRAS;SOCS1;STAT5A;PTPN6;PIK3C2A;RAF1;CDKN1A;MAP2K2;JAK1;AKT1;JAK2;PIK3R1;STAT3;MAP2K1;FRAP1;AKT3;STAT1;
烟酸盐和烟酰胺代谢细胞信号传导病症:与这些病症相关的基因:PRKCE;IRAK1;PRKAA2;EIF2AK2;GRK6;MAPK1;PLK1;AKT2;CDK8;MAPK8;MAPK3;PRKCD;PRKAA1;PBEF1;MAPK9;CDK2;PIM1;DYRK1A;MAP2K2;MAP2K1;PAK3;NT5E;TTK;CSNK1A1;BRAF;SGK;
趋化因子细胞信号传导病症:与这些病症相关的基因:CXCR4;ROCK2;MAPK1;PTK2;FOS;CFL1;GNAQ;CAMK2A;CXCL12;MAPK8;MAPK3;KRAS;MAPK13;RHOA;CCR3;SRC;PPP1CC;MAPK14;NOX1;RAF1;MAP2K2;MAP2K1;JUN;CCL2;PRKCA;
IL-2细胞信号传导病症:与这些病症相关的基因:ELK1;MAPK1;PTPN11;AKT2;PIK3CA;SYK;FOS;STAT5B;PIK3CB;PIK3C3;MAPK8;MAPK3;KRAS;SOCS1;STAT5A;PIK3C2A;LCK;RAF1;MAP2K2;JAK1;AKT1;PIK3R1;MAP2K1;JUN;AKT3;
突触长时程抑制信号传导病症:与这些病症相关的基因:PRKCE;IGF1;PRKCZ;PRDX6;LYN;MAPK1;GNAS;PRKCI;GNAQ;PPP2R1A;IGF1R;PRKD1;MAPK3;KRAS;GRN;PRKCD;NOS3;NOS2A;PPP2CA;YWHAZ;RAF1;MAP2K2;PPP2R5C;MAP2K1;PRKCA;
雌激素受体细胞信号传导病症:与这些病症相关的基因:TAF4B;EP300;CARM1;PCAF;MAPK1;NCOR2;SMARCA4;MAPK3;NRIP1;KRAS;SRC;NR3C1;HDAC3;PPARGC1A;RBM9;NCOA3;RAF1;CREBBP;MAP2K2;NCOA2;MAP2K1;PRKDC;ESR1;ESR2;
蛋白质泛素化通路细胞信号传导病症:与这些病症相关的基因:TRAF6;SMURF1;BIRC4;BRCAl;UCHL1;NEDD4;CBL;UBE2I;BTRC;HSPA5;USP7;USP10;FBXW7;USP9X;STUB1;USP22;B2M;BIRC2;PARK2;USP8;USP1;VHL;HSP9OAA1;BIRC3;
IL-10细胞信号传导病症:与这些病症相关的基因:TRAF6;CCR1;ELK1;IKBKB;SP1;FOS;NFKB2;MAP3K14;MAPK8;MAPK13;RELA;MAPK14;TNF;IKBKG;RELB;MAP3K7;JAK1;CHUK;STAT3;NFKB1;JUN;IL1R1;IL6;
VDR/RXR激活信号传导病症:与这些病症相关的基因:PRKCE;EP300;PRKCZ;RXRA;GADD45A;HES1;NCOR2;SP1;PRKCI;CDKN1B;PRKD1;PRKCD;RUNX2;KLF4;YY1;NCOA3;CDKN1A;NCOA2;SPP1;LAPS;CEBPB;FOXO1;PRKCA;
TGF-β细胞信号传导病症:与这些病症相关的基因:EP300;SMAD2;SMURF1;MAPK1;SMAD3;SMAD1;FOS;MAPK8;MAPK3;KRAS;MAPK9;RUNX2;SERPINE1;RAF1;MAP3K7;CREBBP;MAP2K2;MAP2K1;TGFBR1;SMAD4;JUN;SMAD5;
Toll样受体细胞信号传导病症:与这些病症相关的基因:IRAK1;EIF2AK2;MYD88;TRAF6;PPARA;ELK1;IKBKB;FOS;NFKB2;MAP3K14;MAPK8;MAPK13;RELA;TLR4;MAPK14;IKBKG;RELB;MAP3K7;CHUK;NFKB1;TLR2;JUN;
p38 MAPK细胞信号传导病症:与这些病症相关的基因:HSPB1;IRAK1;TRAF6;MAPKAPK2;ELK1;FADD;FAS;CREB1;DDIT3;RPS6KA4;DAXX;MAPK13;TRAF2;MAPK14;TNF;MAP3K7;TGFBR1;MYC;ATF4;IL1R1;SRF;STAT1;以及
神经营养因子/TRK细胞信号传导病症:与这些病症相关的基因:NTRK2;MAPK1;PTPN11;PIK3CA;CREB1;FOS;PIK3CB;PIK3C3;MAPK8;MAPK3;KRAS;PIK3C2A;RAF1;MAP2K2;AKT1;PIK3R1;PDPK1;MAP2K1;CDC42;JUN;ATF4。
本文考虑了与基因修饰相关的其它细胞功能障碍病症,例如FXR/RXR激活、突触长时程增强、钙信号传导、EGF信号传导、心血管系统中的缺氧信号传导、LPS/IL-1介导的RXR功能抑制LXR/RXR激活、淀粉样蛋白加工、IL-4信号传导、细胞周期:G2/MDNA损伤检查点调节、心血管系统嘌呤代谢中的一氧化氮信号传导、cAMP介导的信号传导、线粒体功能障碍Notch信号传导内质网应激通路嘧啶代谢、帕金森信号传导心脏与β肾上腺素能信号传导糖酵解/糖异生干扰素信号传导音猬因子(Sonic Hedgehog)信号传导甘油磷脂代谢、磷脂降解、色氨酸代谢赖氨酸降解核苷酸切除修复通路、淀粉和蔗糖代谢、氨基糖代谢花生四烯酸代谢、昼夜节律信号传导、凝血系统多巴胺受体信号传导、谷胱甘肽代谢甘油脂代谢亚油酸代谢蛋氨酸代谢丙酮酸代谢精氨酸和脯氨酸代谢、花生酸信号传导果糖和甘露糖代谢、半乳糖代谢二苯乙烯、香豆素和木质素生物合成抗原呈递通路、类固醇生物合成丁酸代谢柠檬酸循环脂肪酸代谢甘油磷酸脂代谢、组氨酸代谢肌醇代谢细胞色素p450对异生素的代谢、甲烷代谢、苯丙氨酸代谢、丙酸代谢硒代氨基酸代谢鞘脂代谢氨基膦酸盐代谢、雄激素和雌激素代谢抗坏血酸和醛糖酸代谢、胆汁酸生物合成半胱氨酸代谢脂肪酸生物合成谷氨酸受体信号传导、NRF2介导的氧化应激反应戊糖磷酸通路、戊糖和葡萄糖醛酸相互转化、视黄醇代谢核黄素代谢酪氨酸代谢泛醌生物合成缬氨酸、亮氨酸和异亮氨酸降解甘氨酸、丝氨酸和苏氨酸代谢赖氨酸降解疼痛/味觉或线粒体功能发育神经学或它们的组合。
核酸引导的核酸酶可以涵盖天然序列、工程化序列或合成变体的工程化核苷酸序列。可以进行以获得非天然存在的核酸酶系统的工程化类型的非限制性实例如下。工程化可以包括密码子优化以促进在宿主细胞如异源宿主细胞中的表达或改善表达。工程化可以减小核酸酶的大小或分子量以促进表达或递送。工程化可以改变PAM的选择,以改变PAM的特异性或扩大公认的PAM的范围。工程化可以改变、增加或降低可靶向的核酸酶系统的稳定性、持续性、特异性或效率。工程化可以改变、增加或降低蛋白质稳定性。工程化可以改变、增加或降低核酸扫描的持续性。工程化可以改变、增加或降低靶序列特异性。工程化可以改变、增加或降低核酸酶活性。工程化可以改变、提高或降低编辑效率。工程化可以改变、提高或降低转化效率。工程化可以改变、增加或减少核酸酶或引导核酸的表达。如本文所用,非天然存在的核酸序列可以是合成变体的工程化序列或工程化核苷酸序列。这类非天然存在的核酸序列可以被扩增、克隆、装配、合成、从合成的寡核苷酸或dNTP产生,或者使用本领域技术人员已知的方法以其它方式获得。在某些实施方案中,本文公开的非天然存在的核酸引导的核酸酶的实例可以包括那些具有以下的核酸引导的核酸酶:工程化多肽序列(例如,SEQ ID NO:143-177、229、257-262和330,在一些情况还包含如本文所述的另外的氨基酸序列);因此编码的工程化多核苷酸序列(例如,SEQ ID NO:1-142、225-228、230-256和230;在一些情况下还包含如本文所述的另外的核苷酸序列);包含与那些核酸引导的核酸酶相容的RNA、例如工程化的gRNA的一种或多种多核苷酸;或合成变体的核苷酸序列或核苷酸序列的一部分,或其部分(例如,SEQ ID NO:178-188,表3中提供的序列或其部分);和/或如本文所述的其它。
本文公开了核酸引导的核酸酶。应当理解,所公开的核酸引导的核酸酶在体外或在原核、古细菌或真核细胞中具有功能,用于体外、体内或离体应用。合适的核酸引导的核酸酶可以来自以下属的生物体,该属包括但不限于硫微螺菌属(Thiomicrospira)、琥珀酸弧菌属(Succinivibrio)、候选菌属(Candidatus)、卟啉单胞菌属(Porphyromonas)、氨基酸球菌属(Acidaminococcus)、酸单球菌属(Acidomonococcus)、巴恩斯氏菌属(Barnesiella)、普雷沃氏菌属(Prevotella)、史密斯氏菌属(Smithella)、莫拉氏菌属(Moraxella)、互养菌属(Synergistes)、弗朗西斯菌属(Francisella)、钩端螺旋体属(Leptospira)、链状杆菌属(Catenibacterium)、坎德勒氏菌属(Kandleria)、梭菌属(Clostridium)、多尔氏菌属(Dorea)、粪球菌属(Coprococcus)、肠球菌属(Enterococcus)、嗜果糖乳酸菌属(Fructobacillus)、魏斯氏菌属(Weissella)、片球菌属(Pediococcus)、柯林斯菌属(Collinsella)、棒状杆菌属(Corynebacter)、萨特氏菌属(Sutterella)、军团菌属(Legionella)、密螺旋体属(Treponema)、罗氏菌属(Roseburia)、产丝菌属(Filifactor)、毛螺菌科(Lachnospiraceae)、真杆菌属(Eubacterium)、沉积球菌属(Sedimentisphaera)、链球菌属(Streptococcus)、乳杆菌属(Lactobacillus)、支原体(Mycoplasma)、拟杆菌属(Bacteroides)、黄沃拉菌属(Flaviivola)、黄杆菌属(Flavobacterium)、螺旋体属(Sphaerochaeta)、固氮螺菌属(Azospirillum)、葡糖酸醋杆菌属(Gluconacetobacter)、奈瑟菌属(Neisseria)、罗氏菌属、副芽孢杆菌属(Parvibaculum)、副拟杆菌属(Parabacteroide)、葡萄球菌属(Staphylococcus)、硝酸盐裂解菌属(Nitratifractor)、支原体、脂环酸芽孢杆菌(Alicyclobacillus)、短芽孢杆菌属(Brevibacilus)、杆菌属(Bacillus)、拟杆菌属、孢杆菌属、肉食杆菌属(Carnobacterium)、梭状芽孢杆菌属(Clostridiaridium)、梭菌属、脱硫弯曲杆菌属(Desulfonatronum)、脱硫弧菌属(Desulfovibrio)、创伤球菌属(Helcococcus)、纤毛菌属(Leptotrichia)、李斯特菌属(Listeria)、产甲烷古菌属(Methanomethyophilus)、甲基杆菌属(Methylobacterium)、丰佑菌科(Opitutaceae)、沼杆菌属(Paludibacter)、红细菌属(Rhodobacter)、鳞球菌属(Sphaerochaeta)、结核杆菌属(Tuberibacillus)、嗜油菌属(Oleiphilus)、杂食菌门(Omnitrophica)、俭菌超门(Parcubacteria)和弯曲杆菌属(Campylobacter)。这类属的生物物种可以如本文另外讨论的那样。合适的gRNA可以来自一个界内的一个属或未分类的属的生物体,该界包括但不限于厚壁菌门(Firmicute)、放线菌门(Actinobacteria)、拟杆菌门(Bacteroidete)、变形菌门(Proteobacteria)、螺旋菌门(Spirochate)和无壁菌门(Tenericute)。合适的gRNA可以来自一个门内的一个属或未分类的属的生物体,该门包括但不限于丹毒丝菌纲(Erysipelotrichia)、梭菌纲(Clostridia)、杆菌纲(Bacilli)、放线菌纲(Actinobacteria)、拟杆菌纲(Bacteroidetes)、链卵菌(Catenovulum)、粪球菌、黄杆菌纲(Flavobacteria)、α-变形菌纲(Alphaproteobacteria)、β-变形菌纲(proteobacteria)、γ-变形菌纲、δ变形菌纲、ε-变形菌纲、螺旋体纲(Spirochaetes)和软膜体纲(Mollicutes)。合适的gRNA可以来自一个纲内的一个属或未分类的属的生物体,该目包括但不限于梭菌目(Clostridiales)、乳杆菌目(Lactobacillales)、放线菌目(Actinomycetales)、拟杆菌目(Bacteroidales)、黄杆菌目(Flavobacteriales)、根瘤菌目(Rhizobiales)、红螺菌目(Rhodospirillales)、伯克霍尔德氏菌目(Burkholderiales)、奈瑟菌目(Neisseriales)、军团菌目(Legionellales)、鹦鹉螺目(Nautiliales)、弯曲杆菌目(Campylobacterales)、螺旋体目(Spirochaetales)、支原体目(Mycoplasmatales)和硫发菌目(Thiotrichales)。合适的gRNA可以来自一个科内的一个属或未分类的属的生物体,该科包括但不限于毛螺菌科、肠球菌科(Enterococcaceae)、明串珠菌科(Leuconostocaceae)、乳杆菌科(Lactobacillaceae)、链球菌科(Streptococcaceae)、消化链球菌科(Peptostreptococcaceae)、葡萄球菌科(Staphylococcaceae)、真细菌科(Eubacteriaceae)、棒状杆菌科(Corynebacterineae)、拟杆菌科(Bacteroidaceae)、黄杆菌科(Flavobacterium)、冷霉菌科(Cryomoorphaceae)、红霉菌科(Rhodobiaceae)、红螺菌科(Rhodospirillaceae)、醋杆菌科(Acetobacteraceae)、萨特氏菌科(Sutterellaceae)、奈瑟菌科(Neisseriaceae)、军团菌科(Legionellaceae)、鹦鹉螺科(Nautiliaceae)、弯曲杆菌科(Campylobacteraceae)、螺旋体科(Spirochaetaceae)、支原体科(Mycoplasmataceae)、鱼立克次体科(Pisciririckettsiaceae)和弗朗西斯菌科(Francisellaceae)。在一些实施方案中,合适的gRNA可以来自一个科内的一个属或未分类的属的生物体,该科包括氨基酸球菌属、沉积球菌属、巴恩斯氏菌属某种、拟杆菌属、副拟杆菌属、毛螺菌科、粪球菌属某种、链卵菌属某种和柯林斯菌属。其它核酸引导的核酸酶已经在以下中进行了描述:2015年12月18日提交的美国专利申请公布No.US20160208243、2013年3月15日提交的美国专利申请公布No.US20140068797、2013年10月15日提交的美国专利No.8,697,359和Zetsche等人,Cell 2015年10月22日;163(3):759-71。
适用于本公开的方法、系统和组合物的一些核酸引导的核酸酶可包括但不限于源自生物体的那些核酸引导的核酸酶,该生物体例如但不限于硫微螺菌属某种XS5、直肠真杆菌、溶糊精琥珀酸弧菌(Succinivibrio dextrinosolvens)、候选白蚁链甲烷胞菌(Candidatus Methanop lasma termitum)、候选腹部嗜甲烷菌(CandidatusMethanomethylophilus alvus)、狗口腔卟啉单胞菌(Porphyromonas crevioricanis)、嗜鳃黄杆菌(Flavobacterium branchiophilum)、氨基酸球菌属某种、酸单球菌属某种、毛螺菌科细菌COE1、短普雷沃氏菌(Prevotella brevis)ATCC 19188、史密斯氏菌属某种SCADC、牛眼莫拉氏菌(Moraxella bovoculi)、琼斯氏互养菌(Synergistes jonesii)、拟杆菌门口腔分类单元(Bacteroidetes oral taxon)274、土拉热弗朗西斯菌(Francisellatularensis)、莱姆血清型稻田钩端螺旋体菌株(Leptospira inadai serovar Lymestr.)10、酸单球菌属晶体结构(5B43)、变形链球菌(S.mutans)、无乳链球菌(S.agalactiae)、类马链球菌(S.equisimilis)、血链球菌(S.sanguinis)、肺炎链球菌(S.pneumonia);空肠弯曲杆菌(C.jejuni)、结肠弯曲杆菌(C.coli);海硝酸盐裂解菌(N.salsuginis)、背硝酸盐裂解菌(N.tergarcus);耳葡萄球菌(S.auricularis)、肉葡萄球菌(S.carnosus);脑膜炎奈瑟菌(N.meningitides)、淋病奈瑟菌(N.gonorrhoeae);单核细胞增生李斯特菌(L.monocytogenes)、伊氏李斯特菌(L.ivanovii);肉毒梭菌(C.botulinum)、艰难梭菌(C.difficile)、破伤风梭菌(C.tetani)、梭氏梭菌(C.sordellii);土拉热弗朗西斯菌1、阿尔伯普雷沃氏菌(Prevotella albensis)、毛螺菌科细菌MC2017 1、蛋白分解丁酸弧菌(Butyrivibrio proteoclasticus)、蛋白分解丁酸弧菌B316、异域菌门(Peregrinibacteria)细菌GW2011_GWA2_33_10、俭菌总门(Parcubacteria)细菌GW2011_GWC2_44_17、史密斯氏菌属某种SCADC、氨基酸球菌属某种BV3L6、毛螺菌科细菌MA2020、候选白蚁链甲烷胞菌、挑剔真杆菌(Eubacterium eligens)、牛眼莫拉氏菌237、稻田钩端螺旋体(Leptospira inadai)、毛螺菌科细菌ND2006、狗口腔卟啉单胞菌3、解糖胨普雷沃氏菌(Prevotella disiens)、猕猴卟啉单胞菌(Porphyromonas macacae)、链状杆菌属某种CAG:290、小牛坎德勒氏菌(Kandleriavitulina)、梭菌目细菌KA00274、毛螺菌科细菌3-2、长尾多尔氏菌(Dorea longicatena)、猫粪球菌(Coprococcus catus)GD/7、柱状肠球菌(Enterococcus columbae)DSM 7374、嗜果糖乳酸菌属某种(Fructobacillus sp.)EFB-N1、耐盐魏斯氏菌(Weissella halotolerans)、乳酸片球菌(Pediococcus acidilactici)、弯曲乳杆菌(Lactobacillus curvatus)、酿脓链球菌(Streptococcus pyogenes)、费尔斯莫乳杆菌(Lactobacillus versmoldensis)、龈沟产丝菌(Filifactor alocis)ATCC 35896、嗜酸耐热菌(Alicyclobacillus acidoterrestris)、嗜酸耐热菌ATCC 49025、非常脱硫弧菌(Desulfovibrio inopinatus)、非常脱硫弧菌DSM 10711、嗜油菌属某种(Oleiphilussp.)嗜油菌属某种HI0009、候选科菲尔德菌(Candidtus kefeldibacteria)、俭菌总门(Parcubacteria)CasY.4、杂食菌门(Omnitrophica)WOR 2细菌GWF2、芽孢杆菌属某种NSP2.1、热嗜淀粉芽孢杆菌(Bacillus thermoamylovorans)、链卵菌属某种(Catenovulumsp.)CCB-QB4、粪球菌属某种AF16-5、毛螺菌科细菌MC2017、田中柯林斯菌(Collinsellatanakaei)、狄氏副拟杆菌(Parabacteroides distasonis)、拟杆菌门细菌HGW-拟杆菌门-6、巴恩斯氏菌属某种(Barnesiella sp.)An22、青沉积球菌(Sedimentisphaeracyanobacteriorum)和马西氨基酸球菌(Acidaminococcus massiliensis)。
在一些实施方案中,本文公开的核酸引导的核酸酶包括与SEQ ID NO:143-177和229中的任一者具有至少50%同一性的氨基酸序列的多肽。在一些实施方案中,本文公开的核酸引导的核酸酶包括具有与SEQ ID NO:143-177和229中的一者或多者的氨基酸序列具有至少60%、65%、75%、85%、95%、99%或100%同一性的氨基酸序列的多肽。在一些实施方案中,本文公开的核酸引导的核酸酶包括具有与SEQ ID NO:143-151中的一者或多者的氨基酸序列具有至少60%、65%、75%、85%、95%、99%或100%同一性的氨基酸序列的多肽。在一些实施方案中,本文公开的核酸引导的核酸酶包括与SEQ ID NO:143、144、147、148、150和151中的任一者具有至少85%、90%、95%、99%或100%、氨基酸同一性的氨基酸序列。在一些实施方案中,本文公开的核酸引导的核酸酶包括与由SEQ ID NO:144表示的氨基酸序列具有至少85%、90%、95%、99%或100%氨基酸同一性的多肽。
在本文中的某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:143-177和229中的任一者表示的氨基酸序列具有至少60%、65%、75%、85%、90%、95%、99%或100%序列同一性,例如至少85%,在一些情况下至少90%,在一些情况下至少95%,在一些情况下至少99%或甚至100%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ IDNO:143-177和229中的任一者表示的氨基酸序列具有至少60%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ IDNO:143-177和229中的任一者表示的氨基酸序列具有至少80%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ IDNO:143-177和229中的任一者表示的氨基酸序列具有至少90%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ IDNO:143-177和229中的任一者表示的氨基酸序列具有至少95%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ IDNO:143-177和229中的任一者表示的氨基酸序列具有100%序列同一性的氨基酸序列。这些氨基酸序列可以是核酸酶多肽的完整氨基酸序列,或者它们可以是如上所述附加了另外的氨基酸序列的原始核酸酶多肽。
在某些实施方案中,本文公开的核酸酶不与已知核酸酶共享保守肽基序,或编码核酸酶的多核苷酸、编码这类基序的核苷酸序列。在某些实施方案中,本文公开的核酸酶不含肽基序YLFQIYNKDF(SEQ ID NO.224)。在某些实施方案中,编码本文公开的核酸酶的一个或多个多核苷酸不编码所编码的核酸酶内的肽基序YLFQIYNKDF(SEQ ID NO.224)。与SEQID NO:224相比,SEQ ID NO:224的基序可以完全不存在,或者可以具有1个、2个、3个、4个、5个或多于5个取代的氨基酸。取代可以是保守的或激进的,或其任何组合。在某些实施方案中,非SEQ ID NO:224序列可具有至少一个激进取代。在某些实施方案中,非SEQ ID NO:224序列可具有至少一个、两个、三个或四个根据斯尼斯指数(Sneath’s index)具有至少10、15、20或25的值的取代。在某些实施方案中,非SEQ ID NO:224序列可具有至少一个根据斯尼斯指数具有至少25的值的取代。
在本文中的某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:143-151、161-163、165、166、169、171-175、177和229中的任一者表示的氨基酸序列具有至少60%、65%、75%、85%、90%、95%、99%或100%序列同一性,例如至少85%,在一些情况下至少90%,在一些情况下至少95%,在一些情况下至少99%或甚至100%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:143-151、161-163、165、166、169、171-175、177和229中的任一者表示的氨基酸序列具有至少60%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:143-151、161-163、165、166、169、171-175、177和229中的任一者表示的氨基酸序列具有至少80%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:143-151、161-163、165、166、169、171-175、177和229中的任一者表示的氨基酸序列具有至少90%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:143-151、161-163、165、166、169、171-175、177和229中的任一者表示的氨基酸序列具有至少95%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:143-151、161-163、165、166、169、171-175、177和229中的任一者表示的氨基酸序列具有100%序列同一性的氨基酸序列。这些氨基酸序列可以是核酸酶多肽的完整氨基酸序列,或者它们可以是如上所述附加了另外的氨基酸序列的原始核酸酶多肽。
在本文中的某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:149、151、175和177中的任一者表示的氨基酸序列具有至少60%、65%、75%、85%、90%、95%、99%或100%序列同一性,例如至少85%,在一些情况下至少90%,在一些情况下至少95%,在一些情况下至少99%或甚至100%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQID NO:149、151、175和177中的任一者表示的氨基酸序列具有至少60%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:149、151、175和177中的任一者表示的氨基酸序列具有至少80%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:149、151、175和177中的任一者表示的氨基酸序列具有至少90%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:149、151、175和177中的任一者表示的氨基酸序列具有至少95%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:149、151、175和177中的任一者表示的氨基酸序列具有100%序列同一性的氨基酸序列。这些氨基酸序列可以是核酸酶多肽的完整氨基酸序列,或者它们可以是如上所述附加了另外的氨基酸序列的原始核酸酶多肽。
在本文中的某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:144、153和229中的任一者表示的氨基酸序列具有至少60%、65%、75%、85%、90%、95%、99%或100%序列同一性,例如至少85%,在一些情况下至少90%,在一些情况下至少95%,在一些情况下至少99%或甚至100%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ IDNO:144、153和229中的任一者表示的氨基酸序列具有至少60%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ IDNO:144、153和229中的任一者表示的氨基酸序列具有至少80%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ IDNO:144、153和229中的任一者表示的氨基酸序列具有至少90%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ IDNO:144、153和229中的任一者表示的氨基酸序列具有至少95%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ IDNO:144、153和229中的任一者表示的氨基酸序列具有100%序列同一性的氨基酸序列。这些氨基酸序列可以是核酸酶多肽的完整氨基酸序列,或者它们可以是如上所述附加了另外的氨基酸序列的原始核酸酶多肽。
在本文中的某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:144表示的氨基酸序列具有至少60%、65%、75%、85%、90%、95%、99%或100%序列同一性,例如至少85%,在一些情况下至少90%,在一些情况下至少95%,在一些情况下至少99%或甚至100%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:144表示的氨基酸序列具有至少60%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:144表示的氨基酸序列具有至少80%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:144表示的氨基酸序列具有至少90%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:144表示的氨基酸序列具有至少95%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:144中的任一者表示的氨基酸序列具有100%序列同一性的氨基酸序列。这些氨基酸序列可以是核酸酶多肽的完整氨基酸序列,或者它们可以是如上所述附加了另外的氨基酸序列的原始核酸酶多肽。
在本文中的某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:153表示的氨基酸序列具有至少60%、65%、75%、85%、90%、95%、99%或100%序列同一性,例如至少85%,在一些情况下至少90%,在一些情况下至少95%,在一些情况下至少99%或甚至100%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:153表示的氨基酸序列具有至少60%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:153表示的氨基酸序列具有至少80%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:153表示的氨基酸序列具有至少90%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:153表示的氨基酸序列具有至少95%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:153中的任一者表示的氨基酸序列具有100%序列同一性的氨基酸序列。这些氨基酸序列可以是核酸酶多肽的完整氨基酸序列,或者它们可以是如上所述附加了另外的氨基酸序列的原始核酸酶多肽。
核酸引导的核酸酶可包含即使没有另外的氨基酸序列,例如本文所述的那些,也是工程化序列,即与任何已知的天然序列不匹配的氨基酸序列。在本文中的某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:229表示的氨基酸序列具有至少60%、65%、75%、85%、90%、95%、99%或100%序列同一性,例如至少85%,在一些情况下至少90%,在一些情况下至少95%,在一些情况下至少99%或甚至100%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:229表示的氨基酸序列具有至少60%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:229表示的氨基酸序列具有至少80%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:229表示的氨基酸序列具有至少90%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:229表示的氨基酸序列具有至少95%序列同一性的氨基酸序列。在某些实施方案中,核酸引导的核酸酶,例如工程化的核酸引导的核酸酶,包含与由SEQ ID NO:229中的任一者表示的氨基酸序列具有100%序列同一性的氨基酸序列。这些氨基酸序列可以是核酸酶多肽的完整氨基酸序列,或者它们可以是如上所述附加了另外的氨基酸序列的原始核酸酶多肽。
因此,本文公开了提供和/或利用工程化的核酸引导的核酸酶系统、其组分和产物的组合物和方法,以及其它组合物和方法,这将是显而易见的。如本文所用,“工程化的核酸引导的核酸酶系统”在本文中也称为新颖工程化的核酸引导的核酸酶构建体、非天然存在的核酸引导的核酸酶系统等,可指核酸引导的核酸酶系统,其中该系统是非天然存在的。该系统可以包括a)一种或多种呈其最终形式的组分,即,如在一种或多种方法中使用的,例如,如在宿主细胞中使用的,有时在一个或多个位置进一步加工之后;b)编码一种或多种组分的一种多核苷酸或多种多核苷酸;该系统可以包括a)和b)。所述组分包含以下中的一者或多者:1)工程化的核酸引导的核酸酶或其部分,例如其活性部分,2)工程化的引导核酸,例如gRNA,其与工程化的核酸引导的核酸酶或其部分相容,和/或在编码多核苷酸或其它多核苷酸的情况下,3)一种或多种工程化的多核苷酸。该系统还可以包括其它组分,例如编辑模板。
如本文所用,“工程化、工程化的”在本文中也称为新颖等,可指非天然存在的组合物或方法。
在某些实施方案中,本文公开的非天然存在的核酸引导的核酸酶的实例可以包括那些用多核苷酸序列产生的核酸引导的核酸酶,例如工程化的多核苷酸序列(例如,SEQ IDNO:1-142、225-228和330,或其亚组,如本文更充分描述的)和那些gNA,例如合成变体的gRNA序列(例如,SEQ ID NO:178-188)。在某些实施方案中,可以使用包含gNA,例如表3中所示和本文更充分描述的gRNA的合成变体。
在某些实施方案中,本文提供了工程化的核酸引导的核酸酶。如本文所用,“工程化的核酸引导的核酸酶”或类似术语是非天然存在的核酸引导的核酸酶;核酸酶可以出于任何原因是非天然存在的,包括包含工程化的核酸酶多肽和/或编码其的一种或多种工程化的多核苷酸。
如本文所用,“核酸引导的核酸酶”在本文中也简称为核酸酶、CRISPR相关(Cas)核酸酶、Cas12a样等,可指与相容的引导核酸,例如相容的gRNA一起,可以在靶多核苷酸中的靶序列处或附近结合并裂解的核酸酶。“靶序列”在本文中也称为靶核酸、靶多核苷酸序列等,可指引导序列与之具有互补性的序列,其中靶序列与引导序列之间的杂交允许核酸酶复合物,例如工程化的核酸酶复合物的活性。可靶向的核酸酶复合物的靶多核苷酸可以是宿主细胞内源或外源的任何多核苷酸。“靶多核苷酸”在本文使用该术语等时可指靶序列所定位的多核苷酸。
本文公开了引导核酸(gNA),例如gRNA和编码gNA或gRNA或者gNA或gRNA的一部分的多核苷酸。在某些实施方案中,gNA,例如gRNA,是工程化的gNA,例如工程化的gRNA。
如本文所用,“引导核酸”或“引导多核苷酸”(gNA)可指一种或多种多核苷酸;gNA包括1)能够与靶序列杂交的引导序列和2)能够与核酸引导的核酸酶相互作用或形成复合物的支架序列。gNA,例如gRNA,须与相容的核酸引导的核酸酶形成复合物,以使核酸酶复合物在靶序列处或附近定位和裂解。“引导RNA(gRNA)”在本文中也称为RNA引导多核苷酸,是核苷酸为天然或修饰的核糖核苷酸的gNA。
可靶向的核酸酶复合物的靶多核苷酸可以是宿主细胞内源或外源的任何多核苷酸。“靶多核苷酸”在本文使用该术语等时可指靶序列所定位的多核苷酸。靶多核苷酸可包含编码或非编码核苷酸。在某些实施方案中,靶序列在作为安全港位点(SHS)的靶多核苷酸内。
引导核酸可以作为一种或多种核酸提供。
在特定的实施方案中,引导核酸,例如gRNA,作为结合形成功能性引导核酸的两个单独的多核苷酸,例如gRNA(分裂或双重引导核酸,例如分裂或双重gRNA)提供。在某些实施方案中,核酸引导的核酸酶,例如本文公开的工程化的核酸引导的核酸酶,与相容的gNA,例如相容的gRNA组合,所述相容的gNA包含分裂gNA,例如分裂gRNA,其中核酸酶或其来源的核酸酶序列在其天然状态下不与分裂gNA,例如分裂gRNA组合,而是与单个gNA,例如单个gRNA结合。在这些天然核酸酶中的至少一些中,例如Cas12a,该天然gRNA中不存在tracrRNA。在本文的某些实施方案中,gRNA,例如分裂gRNA,包含tracrRNA。有关这些非天然存在的gNA的进一步讨论,参见PCT公布WO2021067788。
在特定的实施方案中,引导序列和支架序列作为单个多核苷酸(单个引导核酸,例如单个gRNA)提供。
核酸引导的核酸酶,例如本文公开的工程化的核酸引导的核酸酶,当与相容的gNA,例如相容的gRNA组合时,形成可靶向的核酸酶复合物,本文也称为核糖核蛋白(RNP)(如果是gRNA)、复合的核酸引导的核酸酶等,其能够结合靶多核苷酸内的靶序列,由引导核酸的引导序列决定,并在靶序列处或附近裂解。引导多核苷酸可以是DNA。引导多核苷酸可以是RNA。引导多核苷酸可包括DNA和RNA。引导多核苷酸可以包括修饰的或非天然存在的核苷酸。在引导多核苷酸包含RNA的情况下,RNA引导多核苷酸可由如本文所公开的多核苷酸分子如质粒、线性构建体或编辑盒上的DNA序列编码。
通常,引导多核苷酸可以与相容的核酸引导的核酸酶形成复合物并且可以与靶序列杂交,从而将核酸酶指引到靶序列。能够与引导多核苷酸形成复合物的主题核酸引导的核酸酶可称为与引导多核苷酸相容的核酸引导的核酸酶。此外,能够与核酸引导的核酸酶形成复合物的引导多核苷酸可称为与核酸引导的核酸酶相容的引导多核苷酸或引导核酸。
gNA,例如gRNA,可以是天然存在的gNA,例如天然存在的gRNA。在某些实施方案中,gNA,例如gRNA,是工程化的gNA,例如工程化的gRNA。“工程化的引导核酸”,例如“工程化的gRNA”,也称为新颖引导核酸,例如新颖gRNA,在该术语在本文中使用时,可以包括非天然存在的引导核酸,例如非天然存在的gRNA,或正交gNA,例如正交gRNA。
核酸引导的核酸酶可以与核酸酶内源宿主中未发现的引导核酸相容。这样的正交引导核酸可以通过经验测试来确定。正交引导核酸可以来自不同的细菌物种或者是合成的或以其它方式工程化为非天然存在的。
与核酸引导的核酸酶相容的正交引导核酸可包含一个或多个共同特征。共同特征可以包括假结区域外的序列。共同特征可以包括假结区域。共同特征可以包括一级序列或二级结构。
本文公开了可靶向的核酸引导的核酸酶复合物。“可靶向的核酸引导的核酸酶复合物”等在本文中使用该术语时可指与相容的gNA结合的核酸引导的核酸酶;该复合物具有结合靶多核苷酸中的靶序列并在靶多核苷酸中的靶序列处或附近产生至少一处链断裂的功能。在某些实施方案中,可靶向的核酸引导的复合物包含为gRNA的gNA;这类复合物可称为“核糖核蛋白”或“RNP”。在某些实施方案中,可靶向的核酸引导的核酸酶复合物,例如RNP,是工程化的可靶向的核酸引导的核酸酶复合物,例如工程化的RNP。“工程化的可靶向的核酸引导的核酸酶复合物”,例如“工程化的RNP”等,在本文使用那些术语时,可指一种可靶向的核酸引导的核酸酶复合物、例如RNP,其中核酸引导的核酸酶包含工程化的核酸引导的核酸酶,引导核酸、例如gRNA包含工程化的引导核酸、例如工程化的gRNA,或两者都有。在某些实施方案中,核酸酶和gNA、例如gRNA都是工程化的。在使用工程化的核酸引导的核酸酶的实施方案中,可以使用任何合适的核酸引导的核酸酶,例如本文公开的核酸引导的核酸酶。在使用工程化的gNA、例如工程化的gRNA的实施例中,可以使用任何合适的工程化的gNA、例如工程化的gRNA,例如本文公开的工程化的gNA、例如工程化的gRNA。
可靶向的核酸引导的核酸酶复合物、例如RNP可以用本领域已知的任何合适的方式产生。在一种极端情况下,核酸引导的核酸酶及其相容的gNA(例如gRNA)都是合成产生的,然后组合形成可靶向的核酸引导的核酸酶复合物、例如RNP。可以通过任何合适的方法、例如电穿孔将复合物引入宿主细胞中。在另一个极端,可靶向的核酸引导的核酸酶复合物、例如RNP是通过转录和/或翻译引入宿主细胞中的一个或多个多核苷酸而在宿主细胞中产生的,其中多核苷酸含有编码可靶向的核酸引导的核酸酶复合物、例如RNP的一种或多种组分的部分,例如编码核酸酶的一个或多个部分、编码一种或多种gNA、例如gRNA的一个或多个部分、以及编码一个或多个编辑模板(如果使用的话)的一个或多个部分。如本文所讨论的和本领域已知的,可以添加调控元件和其它元件以使多核苷酸可操作以产生一种或多种载体。通过任何合适的方法将一种或多种载体引入宿主细胞中。各种组分由细胞产生并在细胞内装配成可靶向的核酸引导的核酸酶复合物、例如RNP。这些中的任何一者,或这两个极端之间的任何变化,都可以使用,并且已经在本领域中进行了广泛描述;参见例如美国专利No.10,337,028。在某些实施方案中,通过将包装在一种或多种合适的载体中的合适的一种多核苷酸或多种多核苷酸引入产生核酸酶的第一宿主细胞中,然后提取和纯化至合适的程度来在第一宿主细胞中产生可靶向的核酸引导的核酸酶。显然,如本文所述,各种纯化标签、裂解序列、FLAG和3XFLAG可用于帮助分离和纯化核酸酶。在某些实施方案中,一种或多种相容的gNA,例如一种或多种相容的gRNA,例如包含一种或多种修饰的核苷酸、例如一种或多种化学修饰的核苷酸的一种或多种相容的gRNA,可以是分裂gNA、例如分裂gRNA或单个gNA、例如单个gRNA(在某些实施方案中,分裂gNA),它们被合成为完整的gNA或gRNA。可以将合成的gNA、例如gRNA引入宿主细胞中,其中当相容的gNA、例如相容的gRNA遇到核酸酶时,它们结合成可靶向的核酸引导的核酸酶复合物、例如RNP。合成的gNA、例如gRNA可以在细胞外与合适的核酸酶接触足够长的时间,以允许形成可靶向的核酸引导的核酸酶复合物、例如RNP,然后将其引入宿主细胞中。
在某些实施方案中,待整合的序列包含转基因。
在某些实施方案中,本文公开的组合物和方法利用包含工程化的核酸酶多肽的核酸引导的核酸酶。如本文所用,术语“工程化的核酸酶多肽”在本文中也称为工程化的序列等,可指包含非天然存在的氨基酸序列的核酸酶多肽,其中该多肽充当核酸引导的核酸酶,无论是原样还是经过另外加工,与相容的gNA(例如gRNA)组合。非天然存在的氨基酸序列可以是如例如通过取代序列中的一个或多个氨基酸,和/或序列中的非天然氨基酸,通过在N端、C端处或其组合添加一个或多个氨基酸而不同于天然序列的氨基酸序列。
如本文所用,“工程化的核酸引导的核酸酶”,在本文中也称为Cas12a样核酸酶,是一种非天然存在的核酸酶;由于包括但不限于包含工程化的核酸酶多肽的原因,核酸酶可以是非天然存在的。
在某些实施方案中,工程化的核酸酶多肽可以包括核酸酶多肽,例如包含与由SEQID NO:143-177和229表示的氨基酸序列中的任一者具有至少60%、65%、75%、85%、90%、95%、99%或100%序列同一性,例如至少85%,在一些情况下至少90%,在一些情况下至少95%,在一些情况下至少99%或甚至100%序列同一性的核酸酶多肽,例如在氨基端、羧基端或两者处添加了另外的氨基酸。这样的添加可以包括任何合适的添加;示例性添加包括一个或多个核定位序列(NLS)、一个或多个纯化标签、一个或多个裂解序列、一个或多个标记、一个或多个FLAG或3xFLAG序列或它们的组合,其中每次添加可以发生在核心氨基酸序列的氨基端或羧基端,根据需要或视情况而定。“在氨基端”在本文中使用该术语时包括在氨基端之前添加并直接或间接连接到氨基端的氨基酸添加。“在氨基端”在本文中使用该术语时包括在氨基端之后添加并直接或间接连接到氨基端的氨基酸添加。在核酸酶多肽的制备和/或加工过程中可以裂解一个或多个另外的氨基酸。
“核酸酶多肽”等在本文中使用该术语时可指具有这样的氨基酸序列的多肽,所述氨基酸序列使得该多肽充当核酸引导的核酸酶,无论是原样还是经过另外加工,与相容的gNA,例如相容的gRNA组合。“天然核酸酶多肽”在本文中也称为天然核酸酶多肽序列等,在本文中使用该术语时可指在自然界中,例如在原核生物中发现的核酸引导的核酸酶中存在的核酸酶多肽。
如本文所用,术语“原始核酸酶多核苷酸”等可指工程化的核酸酶多肽所来源的核酸酶多肽。在一些情况下,原始核酸酶多肽可以是天然核酸酶多肽。
如本文所用,术语“工程化的核酸酶多肽”在本文中也称为工程化的序列等,可指非天然存在的核酸酶多肽。核酸酶多肽可以出于任何原因是非天然存在的,包括具有不同于已知的天然核酸酶多肽的氨基酸序列,或具有包含在N端、C端或两者处附加一个或多个另外的氨基酸序列的原始核酸酶多肽(其可以是天然核酸酶多肽)的核酸酶多肽。
可以附加到原始核酸酶多肽的另外的氨基酸序列可以是任何合适的氨基酸序列;在某些实施方案中,另外的氨基酸序列包括一个或多个核定位序列(NLS)、一个或多个纯化标签、一个或多个裂解序列、一个或多个FLAG或3XFLAG、和/或一个或多个标志物。当使用多于一种类型之氨基酸序列时,例如多于一个NLS,每个氨基酸序列可以与其它氨基酸序列相同或不同,并且每个都可以添加在原始核酸酶多肽的N端或C端处。在某些实施方案中,另外的氨基酸序列的顺序和/或类型可以是特定顺序和/或类型。该顺序被读取为N端到C端。
NLS
在某些实施方案中,另外的氨基酸序列可以包括可以添加到原始核酸酶多肽的一种或多种核定位序列(NLS),例如1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个NLS。在一些实施方案中,工程化的核酸酶多肽在原始核酸酶多肽的氨基端包含1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个NLS,在原始核酸酶多肽的羧基端包含1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个NLS,或这些的组合(例如在氨基端的一个或多个NLS和在羧基端的一个或多个NLS)。在某些实施方案中,工程化的核酸酶多肽在氨基端包含1-3个,在一些情况下1-2个,例如1个NLS。在某些实施方案中,工程化的核酸酶多肽在羧基端包含3-5个,在一些情况下3-4个,例如3个NLS。当存在多于一个NLS时,每一个可以独立于其它NLS来选择,使得单个NLS可以呈多于一个拷贝存在和/或与一个或多个存在于一个或多个拷贝中的其它NLS组合。在某些实施方案中,4个NLS附加到原始核酸酶多肽;在这些实施方案中的某些中,1个NLS在N端处并且3个在C端处。在某些实施方案中,本文提供的工程化的核酸酶多肽包含至少一个myc相关的NLS,所述NLS包含序列PAAKKKKLD(SEQID NO:279)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列;在某些实施方案中,myc相关的NLS在原始核酸酶多肽的N端处。在某些实施方案中,本文提供的工程化的核酸酶多肽包含至少一个核质蛋白NLS,所述核质蛋白NLS包含序列KRPAATKKAGQAKKKK(SEQ ID NO:264)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列;在某些实施方案中,核质蛋白NLS在C端处。在某些实施方案中,本文提供的工程化的核酸酶多肽包含至少一个或至少两个SV40 NLS序列,所述NLS序列包含序列PKKKRKV(SEQ ID NO:263)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列;在某些实施方案中,SV40 NLS在C端处。在某些实施方案中,本文提供的工程化的核酸酶多肽包含在N端处的1个NLS和在C端处的3个NLSs,例如在N端处的1个myc相关的NLS和在C端处的一个核质蛋白NLS和两个SV40NLS。在某些实施方案中,本文提供的工程化的核酸酶多肽包含在N端处的具有序列PAAKKKKLD(SEQ ID NO:279或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列的1个myc相关的NLS,和在C端处的包含序列KRPAATKKAGQAKKKK(SEQ ID NO:264)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列的一个核质蛋白NLS和包含序列PKKKRKV(SEQID NO:263)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列的两个SV40 NLS。通常,一个或多个NLS将与原始核酸酶多肽相邻,在其N侧或C侧或两侧。例如,在具有4个NLS的实施方案中,顺序可以是NLS-原始核酸酶多肽-NLS-NLS-NLS。因此,如果例如通过在裂解序列处裂解而去除了部分或全部其它标签,则工程化的核酸酶多肽的剩余部分将保留NLS。
NLS的非限制性实例包括源自以下的NLS序列:SV40病毒大T抗原的NLS,具有氨基酸序列PKKKRKV(SEQ ID NO:263)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列;来自核质蛋白的NLS(例如核质蛋白二分NLS,其具有序列KRPAATKKAGQAKKKK(SEQ ID NO:264)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列;c-myc NLS,其具有氨基酸序列PAAKRVKLD SEQ ID NO:265)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列或者RQRRNELKRSP(SEQ ID NO:266)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列;hRNPA1 M9 NLS,其具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQG GY(SEQ ID NO:267)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列;来自输入蛋白-α的IBB结构域的序列RMRIZFKNKGKDTAELRRRRVEVSVELR KAKKDEQILKRRNV(SEQ IDNO:268)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列;肌瘤T蛋白的序列VSRKRPRP(SEQ ID NO:269)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列,和PPKKARED(SEQ IDNO:270)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列;人p53的序列PQPKKKPL(SEQ ID NO:271)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列;小鼠c-abl IV的序列SALIKKKKKMAP(SEQ ID NO:272)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列;流行性感冒病毒NS1的序列DRLRR(SEQ ID NO:273)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列,和PKQKKRK(SEQ ID NO:274)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列;丁型肝炎病毒抗原的序列RKLKKKIKKL(SEQ IDNO:275)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列;小鼠Mx1蛋白的序列REKKKFLKRR(SEQ ID NO:276)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列;人聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:277)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列;以及甾类激素受体(人)糖皮质激素的序列RKCLQAGMNLEARKTKK(SEQ ID NO:278)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列。在某些实施方案中,本文公开的工程化的核酸酶多肽包含具有与SEQ ID NO:143-177或229中的一者或多者的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中,至少95%同一性,或甚至100%同一性的氨基酸序列的原始核酸酶多肽,和包含序列PAAKKKKLD(SEQ ID NO:279)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列的至少一个myc相关的NLS;在某些实施方案中,myc相关的NLS在N端处。另外或可替代地,工程化的核酸酶多肽可以包括至少一个核质蛋白NLS,所述核质蛋白NLS包含序列KRPAATKKAGQAKKKK(SEQ IDNO:264)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列;在某些实施方案中,核质蛋白NLS在C端处。另外或可替代地,工程化的核酸酶多肽可以包括至少一个,或至少两个,例如一个,在某些实施方案中两个SV40 NLS序列,所述NLS序列包含序列PKKKRKV(SEQ ID NO:263)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列;在某些实施方案中,SV40 NLS在C端处。在某些实施方案中,本文公开的工程化的核酸酶多肽包括具有与SEQ ID NO:143-177或229中的任一者的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的氨基酸序列的原始核酸酶多肽,和在N端处的一个NLS和在C端处的三个NLS,例如在N端处的1个如上所述的myc相关的NLS和在C端处的一个如上所述的核质蛋白NLS和两个如上所述的SV40 NLS。在某些实施方案中,本文公开的工程化的核酸酶多肽包括具有与SEQ ID NO:143-177或229中的任一者具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的氨基酸序列的原始核酸酶多肽,和在N端处的一个myc相关的NLS,所述NLS具有序列PAAKKKKLD(SEQ ID NO:279)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列;以及在C端处的包含序列KRPAATKKAGQAKKKK(SEQ ID NO:264)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列的一个核质蛋白NLS和包含序列PKKKRKV(SEQID NO:263)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列的两个SV40 NLS。
在某些实施方案中,本文公开的工程化的核酸酶多肽包含与SEQ ID NO:144、153和229中的任一者(在一些情况下SEQ ID NO:144;在一些情况下SEQ ID NO:153;在一些情况下SEQ ID NO:229)的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的原始核酸酶多肽;以及至少一个myc相关的NLS,所述NLS包含序列PAAKKKKLD(SEQ ID NO:279)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列;在某些实施方案中,myc相关的NLS在N端。另外或可替代地,工程化的核酸酶多肽可以包括至少一个核质蛋白NLS,所述核质蛋白NLS包含序列KRPAATKKAGQAKKKK(SEQ ID NO:264)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列;在某些实施方案中,核质蛋白NLS在C端处。另外或可替代地,工程化的核酸酶多肽可以包括至少一个,或至少两个,例如一个,在某些实施方案中两个SV40 NLS序列,所述NLS序列包含序列PKKKRKV(SEQ ID NO:263)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列;在某些实施方案中,SV40 NLS在C端处。在某些实施方案中,本文公开的工程化的核酸酶多肽包括具有与SEQ ID NO:144、153和229中的任一者(在一些情况下SEQ ID NO:144;在一些情况下SEQ ID NO:153;在一些情况下SEQ ID NO:229)的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的氨基酸序列的原始核酸酶多肽;以及在N端处的一个NLS和在C端处的三个NLS,例如在N端的1个如上所述的myc相关的NLS和在C端处的一个如上所述的核质蛋白NLS和两个如上所述的SV40 NLS。在某些实施方案中,本文公开的工程化的核酸酶多肽包括具有与SEQ ID NO:144、153和229中的任一者(在一些情况下SEQ ID NO:144;在一些情况下SEQ ID NO:153;在一些情况下SEQ ID NO:229)的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的氨基酸序列的原始核酸酶多肽;以及在N端处的一个myc相关的NLS,所述NLS具有序列PAAKKKKLD(SEQID NO:279)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列;以及在C端处的包含序列KRPAATKKAGQAKKKK(SEQ ID NO:264)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列的一个核质蛋白NLS和包含序列PKKKRKV(SEQ ID NO:263)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列的两个SV40 NLS。
在某些实施方案中,本文公开的工程化的核酸酶多肽包含与SEQ ID NO:153的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的原始核酸酶多肽,和至少一个myc相关的NLS,所述NLS包含序列PAAKKKKLD(SEQ ID NO:279)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列;在某些实施方案中,myc相关的NLS在N端处。另外或可替代地,工程化的核酸酶多肽可以包括至少一个核质蛋白NLS,所述核质蛋白NLS包含序列KRPAATKKAGQAKKKK(SEQ ID NO:264)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列;在某些实施方案中,核质蛋白NLS在C端处。另外或可替代地,工程化的核酸酶多肽可以包括至少一个,或至少两个,例如一个,在某些实施方案中两个SV40 NLS序列,所述NLS序列包含序列PKKKRKV(SEQ ID NO:263)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列;在某些实施方案中,SV40 NLS在C端处。在某些实施方案中,本文公开的工程化的核酸酶多肽包括具有与SEQ ID NO:153的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的氨基酸序列的原始核酸酶多肽,和在N端处的一个NLS和在C端处的三个NLS,例如在N端处的1个如上所述的myc相关的NLS和在C端处的一个如上所述的核质蛋白NLS和两个如上所述的SV40NLS。在某些实施方案中,本文公开的工程化的核酸酶多肽包括具有与SEQ ID NO:153的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的氨基酸序列的原始核酸酶多肽,和在N端的一个myc相关的NLS,所述NLS具有序列PAAKKKKLD(SEQ ID NO:279)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列;以及在C端处的包含序列KRPAATKKAGQAKKKK(SEQ ID NO:264)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列的一个核质蛋白NLS和包含序列PKKKRKV(SEQ ID NO:263)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列的两个SV40NLS。
在某些实施方案中,本文公开的工程化的核酸酶多肽包含与SEQ ID NO:229的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的原始核酸酶多肽,和至少一个myc相关的NLS,所述NLS包含序列PAAKKKKLD(SEQ ID NO:279)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列;在某些实施方案中,myc相关的NLS在N端。另外或可替代地,工程化的核酸酶多肽可以包括至少一个核质蛋白NLS,所述核质蛋白NLS包含序列KRPAATKKAGQAKKKK(SEQ ID NO:264)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列;在某些实施方案中,核质蛋白NLS在C端处。另外或可替代地,工程化的核酸酶多肽可以包括至少一个,或至少两个,例如一个,在某些实施方案中两个SV40 NLS序列,所述NLS序列包含序列PKKKRKV(SEQ ID NO:263)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列;在某些实施方案中,SV40 NLS在C端处。在某些实施方案中,本文公开的工程化的核酸酶多肽包括具有与SEQ ID NO:229的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的氨基酸序列的原始核酸酶多肽,和在N端处的一个NLS和在C端处的三个NLS,例如在N端处的1个如上所述的myc相关的NLS和在C端处的一个如上所述的核质蛋白NLS和两个如上所述的SV40 NLS。在某些实施方案中,本文公开的工程化的核酸酶多肽包括具有与SEQ ID NO:229的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的氨基酸序列的原始核酸酶多肽,和在N端处的一个myc相关的NLS,所述NLS具有序列PAAKKKKLD(SEQID NO:279)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列;以及在C端处的包含序列KRPAATKKAGQAKKKK(SEQ ID NO:264)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列的一个核质蛋白NLS和包含序列PKKKRKV(SEQ ID NO:263)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列的两个SV40NLS。
b)纯化标签
除了或替代包括一个或多个NLS和/或本文所述的其它另外的氨基酸序列,本文公开的工程化的核酸酶多肽可以包括一个或多个纯化标签,其可以在原始核酸酶多肽的N端或C端处。可以使用任何合适的纯化标签。示例性纯化标签包括聚组氨酸标签,其可在其N端包括甘氨酸,例如Gly-6x His标签(SEQ ID NO:332)或Gly-8x His标签(SEQ ID NO:333)。其它示例性纯化标签包括血凝素(HA)、c-myc、T7和Glu-Glu;麦芽糖结合蛋白(mbp);N端谷胱甘肽S-转移酶(GST);钙调蛋白结合肽(CBP)。在某些实施方案中,在一些情况下,除了如上所述的一个或多个NLS之外,工程化的核酸酶多肽还例如在N端处包含Gly-6xhis标签。在某些实施方案中,工程化的核酸酶多肽例如在N端处包含Gly-8x his标签。通常,如果使用Gly-聚his标签,则它是添加的最N端序列。
在某些实施方案中,本文公开的工程化的核酸酶多肽可例如在N端处包含聚-his标签或gly-聚his标签,例如Gly-6x His标签或Gly-8x His标签。这些Gly-6xHis或Gly-8xHis标签出于多种原因应用,包括:1)6xHis或8xHis标签可用于蛋白质纯化,以允许结合色谱柱进行纯化,以及2)N端甘氨酸允许进行其它的位点特异性的化学修饰,所述修饰允许进行先进的蛋白质工程。此外,Gly-6xHis或Gly-8xHis被设计用于在需要时通过烟草蚀纹病毒(TEV)蛋白酶消化来轻松去除。Gly-6xHis 6xHis或Gly-8xHis标签可位于N端。Gly-6xHis标签在Martos-Maldonado等人,Nat Commun.(2018)17;9(1):3307中进一步描述,其公开内容并入本文中。
在某些实施方案中,本文公开的工程化的核酸酶多肽包含与SEQ ID NO:143-177或229中的任一者的氨基酸序列,或与SEQ ID NO:144、153和229(在一些情况下SEQ ID NO:144;在一些情况下SEQ ID NO:153;在一些情况下SEQ ID NO:229)中的任一者的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的原始核酸酶多肽;以及在N端处的Gly-聚-His标签,例如Gly-6x His标签(SEQ ID NO:332)或Gly-8xHis标签(SEQ ID NO:333)。在某些实施方案中,标签是Gly-6xHis标签(SEQ ID NO:332)。在某些实施方案中,标签是Gly-8xHis标签(SEQ ID NO:333)。另外或可替代地,工程化的核酸酶多肽可以在羧基端或氨基端包括FLAG(SEQ ID NO:281)或3XFLAG(SEQ ID NO:280)。在某些实施方案中,标签是在氨基端的3XFLAG(SEQ ID NO:280);如果亦存在Gly-聚His标签,则3XFLAG可以位于Gly-聚His标签内部。在某些实施方案中,标签是在羧基端的3XFLAG(SEQID NO:280)。
在某些实施方案中,本文公开的工程化的核酸酶多肽包含与SEQ ID NO:144、153和229中的任一者(在一些情况下SEQ ID NO:144;在一些情况下SEQ ID NO:153;在一些情况下SEQ ID NO:229)的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的原始核酸酶多肽;以及在N端处的Gly-聚-His标签,例如Gly-6xHis标签(SEQ ID NO:332)或Gly-8xHis标签(SEQ ID NO:333)。在某些实施方案中,标签是Gly-6xHis标签(SEQ ID NO:332)。在某些实施方案中,标签是Gly-8xHis标签(SEQ ID NO:333)。另外或可替代地,工程化的核酸酶多肽可以在羧基端或氨基端包括FLAG(SEQ ID NO:281)或3XFLAG(SEQ IDNO:280)。在某些实施方案中,标签是在氨基端的3XFLAG(SEQ ID NO:280);如果亦存在Gly-聚His标签,则3XFLAG可以位于Gly-聚His标签内部。在某些实施方案中,标签是在羧基端的3XFLAG(SEQ ID NO:280)。
在某些实施方案中,本文公开的工程化的核酸酶多肽包含与SEQ ID NO:153的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的原始核酸酶多肽和在N端处的Gly-聚-His标签,例如Gly-6x His标签(SEQ ID NO:332)或Gly-8xHis标签(SEQ ID NO:333)。在某些实施方案中,标签是Gly-6xHis标签(SEQ ID NO:332)。在某些实施方案中,标签是Gly-8xHis标签(SEQ ID NO:333)。另外或可替代地,工程化的核酸酶多肽可以在羧基端或氨基端包括FLAG(SEQ ID NO:281)或3XFLAG(SEQ ID NO:280)。在某些实施方案中,标签是在氨基端的3XFLAG(SEQ ID NO:280);如果亦存在Gly-聚His标签,则3XFLAG可以位于Gly-聚His标签内部。在某些实施方案中,标签是在羧基端的3XFLAG(SEQID NO:280)。
在某些实施方案中,本文公开的工程化的核酸酶多肽包含与SEQ ID NO:229的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的原始核酸酶多肽和在N端处的Gly-聚-His标签,例如Gly-6x His标签(SEQ ID NO:332)或Gly-8xHis标签(SEQ ID NO:333)。在某些实施方案中,标签是Gly-6xHis标签(SEQ ID NO:332)。在某些实施方案中,标签是Gly-8xHis标签(SEQ ID NO:333)。
FLAG或3xFLAG
另外或可替代地,工程化的核酸酶多肽可以在羧基端或氨基端包括FLAG(SEQ IDNO:281)或3XFLAG(SEQ ID NO:280)。在某些实施方案中,标签是在氨基端的3XFLAG(SEQ IDNO:280);如果亦存在Gly-聚His标签,则3XFLAG可以位于Gly-聚His标签内部。在某些实施方案中,标签是在羧基端的3XFLAG(SEQ ID NO:280)。
裂解序列
除了或替代包括一个或多个NLS、纯化标签和/或本文所述的其它另外的氨基酸序列,本文公开的工程化的核酸酶多肽可以包括一个或多个纯化标签,其可以在N端或C端处。可以使用任何合适的裂解序列;如果使用多个裂解序列,它们可以相同或不同。在某些实施方案中,裂解序列包含烟草蚀纹病毒蛋白酶裂解序列,在本文中称为“TEV序列”(SEQ IDNO:331)。TEV序列可以在氨基端。通常,裂解序列例如TEV序列的位置使得在裂解序列处的裂解留下完整的其它另外的氨基酸序列,特别是添加到原始核酸酶多肽的任何NLS。
组合
本文公开了工程化的核酸酶多肽,其包含添加到原始核酸酶多肽的多于一个另外的氨基酸序列。除了上述公开的这类工程化的核酸酶多核苷酸外,另外的工程化的核酸酶多核苷酸可以包括:
在某些实施方案中,本文公开的工程化核酸酶多肽或其活性部分包括包含以下的组分:
(i)纯化标签;
(ii)裂解位点;
(iii)NLS;
(iv)原始核酸酶多肽;以及
(v)3个NLS;
在某些实施方案中,工程化的核酸酶多肽在C端处还包含(vi)3XFLAG。在某些实施方案中,工程化的多肽在N端还包含v(3x)FLAG。在某些实施方案中,在N端处的3xFLAG介于纯化标签与裂解位点之间。在某些实施方案中,组分是按顺序的,即从核酸酶多肽的氨基端到羧基端的顺序。在某些实施方案中,纯化标签包含Gly-聚his标签,例如Gly-6xHis或Gly-8xHis标签;在某些实施方案中,纯化标签包含Gly-6xHis标签。在某些实施方案中,裂解位点包含TEV。在某些实施方案中,N端NLS包含myc相关的NLS,例如具有氨基酸序列PAAKRVKLDSEQ ID NO:265)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列或者RQRRNELKRSP(SEQ ID NO:266)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列的c-myc NLS。在某些实施方案中,原始核酸酶多肽具有与SEQ ID NO:143-177和229中的任一者的氨基酸序列或与SEQID NO:144、153和229中的任一者(在一些情况下SEQ ID NO:144;在一些情况下SEQ ID NO:153;在一些情况下SEQ ID NO:229)的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的氨基酸序列。在某些实施方案中,原始核酸酶多肽不含SEQ ID NO:224的肽基序。在某些实施方案中,原始核酸酶多肽具有与SEQ ID NO:143-151、161-163、165、166、169、171-175、177或229中的任一者的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的氨基酸序列。在某些实施方案中,原始核酸酶多肽具有与SEQ ID NO:149、151、175或177中的任一者的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的氨基酸序列。在某些实施方案中,原始核酸酶多肽具有与SEQ ID NO:144、153或229的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的氨基酸序列。在某些实施方案中,原始核酸酶多肽具有与SEQ ID NO:144的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的氨基酸序列。在某些实施方案中,原始核酸酶多肽具有与SEQ ID NO:153的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的氨基酸序列。在某些实施方案中,原始核酸酶多肽具有与SEQ ID NO:229的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的氨基酸序列。在某些实施方案中,3个N端NLS在C端处包含核质蛋白NLS,例如包含序列KRPAATKKAGQAKK KK(SEQ ID NO:264)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列的核质蛋白NLS,和两个SV40NLS,例如包含序列PKKKRKV(SEQ ID NO:263)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列的两个SV40 NLS。在某些实施方案中,工程化的核酸酶多肽包含与SEQ ID NO:257的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的氨基酸序列。在某些实施方案中,工程化的核酸酶多肽包含与SEQ ID NO:260的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的氨基酸序列。在某些实施方案中,工程化的核酸酶多肽包含与SEQ ID NO:261的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的氨基酸序列。在某些实施方案中,工程化的核酸酶多核苷酸还包含3xFLAG(SEQ ID NO:280)。在某些实施方案中,工程化的核酸酶多肽包含与SEQ ID NO:258的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的氨基酸序列。
在某些实施方案中,本文公开的工程化核酸酶多肽或其活性部分包含
(i)纯化标签;
(ii)裂解位点;
(iii)NLS;
(iv)原始核酸酶多肽;
(v)3个NLS。
在某些实施方案中,工程化的核酸酶多肽在C端处还包含(vi)3XFLAG。在某些实施方案中,工程化的多肽在N端还包含(vi)(3x)FLAG。在某些实施方案中,在N端处的3xFLAG介于纯化标签与裂解位点之间。在某些实施方案中,组分是按顺序的,即从核酸酶多肽的氨基端到羧基端的顺序。在某些实施方案中,纯化标签包含Gly-聚his标签,例如Gly-6xHis或Gly-8xHis标签;在某些实施方案中,纯化标签包含Gly-8xHis标签。在某些实施方案中,裂解位点包含TEV。在某些实施方案中,N端NLS包含myc相关的NLS,例如具有氨基酸序列PAAKRVKLD SEQ ID NO:265)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列或者RQRRNELKRSP(SEQ ID NO:266)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列的c-myc NLS。在某些实施方案中,原始核酸酶多肽具有与SEQ ID NO:143-177和229中的任一者的氨基酸序列或与SEQ ID NO:144、153和229中的任一者(在一些情况下SEQ ID NO:144;在一些情况下SEQ ID NO:153;在一些情况下SEQ ID NO:229)的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的氨基酸序列。在某些实施方案中,原始核酸酶多肽不含SEQ ID NO:224的肽基序。在某些实施方案中,原始核酸酶多肽具有与SEQID NO:143-151、161-163、165、166、169、171-175、177或229中的任一者的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的氨基酸序列。在某些实施方案中,原始核酸酶多肽具有与SEQ ID NO:149、151、175或177中的任一者的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的氨基酸序列。在某些实施方案中,原始核酸酶多肽具有与SEQ ID NO:144、153或229的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的氨基酸序列。在某些实施方案中,原始核酸酶多肽具有与SEQ ID NO:144的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的氨基酸序列。在某些实施方案中,原始核酸酶多肽具有与SEQ ID NO:153的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的氨基酸序列。在某些实施方案中,原始核酸酶多肽具有与SEQ ID NO:229的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的氨基酸序列。在某些实施方案中,3个N端NLS在C端处包含核质蛋白NLS,例如包含序列KRPAATKKAGQAKK KK(SEQ ID NO:264)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列的核质蛋白NLS,和两个SV40NLS,例如包含序列PKKKRKV(SEQ ID NO:263)或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%或98%序列同一性的氨基酸序列的两个SV40 NLS。在某些实施方案中,工程化的核酸酶多肽包含与SEQ ID NO:259的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的氨基酸序列。在某些实施方案中,工程化的核酸酶多肽包含与SEQ ID NO:262的氨基酸序列具有至少50%、60%、65%、75%、85%、95%、99%或100%同一性,例如至少60%,在一些情况下至少85%,并且在某些实施方案中至少95%同一性,或甚至100%同一性的氨基酸序列。
核酸引导的核酸酶可以由一种或多种多核苷酸编码。多核苷酸可以是天然的。在某些实施方案中,多核苷酸包含工程化的多核苷酸。工程化的多核苷酸是非天然存在的多核苷酸,例如编码工程化的核酸引导的核酸酶的多核苷酸,其中编码的氨基酸序列已通过天然核酸酶多肽中的一个或多个取代、向核酸酶多肽的C端和/或N端添加一个或多个氨基酸序列、或两者从天然序列改变。工程化的多核苷酸可以另外或可替代地通过密码子优化来产生,例如,对于一个物种来说为天然的多核苷酸针对在另一物种中的转录和/或翻译进行优化,其中多核苷酸中的至少1个、2个、5个、10个、20个、50个、100个、200个或500个密码子在两者之间不同。编码核酸引导的核酸酶、例如本文公开的核酸引导的核酸酶的工程化的多核苷酸可以针对原核生物、如大肠杆菌进行密码子优化。编码核酸引导的核酸酶、例如本文公开的核酸引导的核酸酶的工程化的多核苷酸可以针对单细胞真核生物、如酵母、例如酿酒酵母进行密码子优化。编码核酸引导的核酸酶、例如本文公开的核酸引导的核酸酶的工程化的多核苷酸可以针对多细胞真核生物如人进行密码子优化。
本文公开了编码本文提供的核酸引导的核酸酶的多核苷酸。在某些实施方案中,多核苷酸是天然存在的。在某些实施方案中,多核苷酸是工程化的,例如因为编码的核酸酶多肽包含工程化的核酸酶多肽,多核苷酸已经过密码子优化,或两者兼而有之。
在某些实施方案中,提供了一种或多种多核苷酸,其编码对应于SEQ ID NO:143-177和229中的任一者的氨基酸序列中的一者或多者,或与对应于SEQ ID NO:143-177和229中的任一者的氨基酸序列中的一者或多者至少50%、60%、70%、80%、90%、95%100%相同的氨基酸序列。在某些实施方案中,编码的多肽不含肽基序YLFQIYNKDF(SEQ IDNO.224)。因此,在某些实施方案中,提供了多核苷酸,其编码对应于SEQ ID NO:143-151、161-163、165、166、169、171-175、177和229中的任一者的氨基酸序列中的一者或多者或与对应于SEQ ID NO:143-151、161-163、165、166、169、171-175、177和229中的任一者的氨基酸序列中的一者或多者至少50%、60%、70%、80%、90%、95%或100%相同的氨基酸序列。在某些实施方案中,不含肽基序YLFQIYNKDF(SEQ ID NO.224)的编码的多肽包含至少一个氨基酸取代,所述取代是自由基氨基酸取代,和/或具有大于20的斯尼斯指数值。在某些实施方案中,提供了多核苷酸,其编码对应于SEQ ID NO:149、151、175和177中的任一者的氨基酸序列中的一者或多者,或与对应于SEQ ID NO:149、151、175和177中的任一者中的任一者的氨基酸序列中的一者或多者至少50%、60%、70%、80%、90%、95%或100%相同的氨基酸序列。在某些实施方案中,提供了多核苷酸,其编码对应于SEQ ID NO:144、153和229中的任一者的氨基酸序列中的一者或多者,或与对应于SEQ ID NO:144、153和229中的任一者中的任一者的氨基酸序列中的一者或多者至少50%、60%、70%、80%、90%、95%或100%相同的氨基酸序列。在某些实施方案中,提供了多核苷酸,其编码对应于SEQ ID NO:144的氨基酸序列,或与对应于SEQ ID NO:144的氨基酸序列至少50%、60%、70%、80%、90%、95%或100%相同的氨基酸序列。在某些实施方案中,提供了多核苷酸,其编码对应于SEQID NO:153的氨基酸序列或与对应于SEQ ID NO:153的氨基酸序列至少50%、60%、70%、80%、90%、95%或100%相同的氨基酸序列。在某些实施方案中,提供了多核苷酸,其编码对应于SEQ ID NO:229的氨基酸序列或与对应于SEQ ID NO:229的氨基酸序列至少50%、60%、70%、80%、90%、95%或100%相同的氨基酸序列。在某些实施方案中,序列在由所述多核苷酸编码的多肽的N端、C端或两者处编码一种或多种另外的氨基酸序列。另外的氨基酸序列的类型、组合、N端或C端和/或顺序可以是本文公开的那些中的任一者。在后面实施方案中的某些中,提供了多核苷酸,其编码对应于SEQ ID NO:257-262的氨基酸序列或与SEQ ID NO:257-262至少50%、60%、70%、80%、90%、95%或100%相同的氨基酸序列对应于的氨基酸序列。在上述实施方案中的某些中,多核苷酸是工程化的多核苷酸。
在某些实施方案中,本文提供了一种或多种多核苷酸,其具有对应于SEQ ID NO:1-142和225-228中的任一者的序列或与对应于SEQ ID NO:1-142和225-228中的任一者的多核苷酸序列中的一者或多者至少50%、60%、70%、80%、90%、95%或100%相同的多核苷酸序列。在某些实施方案中,序列在由所述多核苷酸编码的多肽的N端、C端或两者处编码一种或多种另外的氨基酸序列。另外的氨基酸序列的类型、组合、N端或C端和/或顺序可以是本文公开的那些中的任一者。序列可以是密码子优化的,例如针对大肠杆菌、酿酒酵母或人中的一者进行密码子优化。在上述实施方案中的某些中,多核苷酸是工程化的多核苷酸。在后面实施方案中的某些中,多核苷酸针对大肠杆菌、酿酒酵母或人进行密码子优化。
在某些实施方案中,本文提供了一种或多种多核苷酸,其具有对应于SEQ ID NO:1、5、11、15、19、23、27、31、35、39、43、47、51、55、59、63、67、71、75、79、83、87、91、95、99、103、107、111、115、119、123、127、131、135、139和225中的任一者的序列,或与对应于SEQ ID NO:1、5、11、15、19、23、27、31、35、39、43、47、51、55、59、63、67、71、75、79、83、87、91、95、99、103、107、111、115、119、123、127、131、135、139和225中的任一者的多核苷酸序列中的一者或多者至少50%、60%、70%、80%、90%、95%或100%相同的多核苷酸序列。在某些实施方案中,序列在由所述多核苷酸编码的多肽的N端、C端或两者处编码一种或多种另外的氨基酸序列。另外的氨基酸序列的类型、组合、N端或C端和/或顺序可以是本文公开的那些中的任一者。序列可以是密码子优化的,例如针对大肠杆菌、酿酒酵母或人中的一者进行密码子优化。在某些实施方案中,提供对应于SEQ ID NO:230-256和330中的任一者的多核苷酸,或与对应于SEQ ID NO:230-256和330中的任一者中的任一者的多核苷酸序列中的一者或多者至少50%、60%、70%、80%、90%、95%或100%相同的多核苷酸序列。在上述实施方案中的某些中,多核苷酸是工程化的多核苷酸。在后面实施方案中的某些中,多核苷酸针对大肠杆菌、酿酒酵母或人进行密码子优化。
在一些实施方案中,本文公开的引导RNA(gRNA)可以是任何gRNA。在其它实施方案中,本文公开的gRNA可以包括与SEQ ID NO:178-188中的任一者具有至少50%核酸同一性的核酸序列。在一些实施方案中,本文公开的gRNA包括与SEQ ID NO:178-188中的任一者具有约60%、65%、70%、75%、80%、85%、90%、95%、大于95%或100%核酸同一性的核酸序列。在一些实施方案中,本文公开的gRNA包括与SEQ ID NO:178-188中的任一者具有至少50%、60%、65%、70%、75%、80%、85%、90%、95%、大于95%核酸同一性的核酸序列。在一些实施方案中,工程化的多核苷酸(gRNA)可分裂成涵盖合成tracrRNA和crRNA的片段。
在一些实施方案中,本文公开的gRNA包括与SEQ ID NO:188具有至少50%核酸同一性的核酸序列。在一些实施方案中,本文公开的gRNA包括与SEQ ID NO:188具有约10%、20%、30%、40%、50%、60%、65%、70%、75%、80%、85%、90%、95%、大于95%或100%核酸同一性的核酸序列。在一些实施方案中,本文公开的gRNA包括与SEQ ID NO:188具有至少50%、60%、65%、70%、75%、80%、85%、90%、95%、大于95%核酸同一性的核酸序列。
在一些实施方案中,编码本文公开的核酸引导的核酸酶的多核苷酸包括与由SEQID NO:1-142或225表示的任何核酸具有至少50%核酸同一性的核酸序列。在一些实施方案中,本文公开的核酸引导的核酸酶包括与SEQ ID NO:1-142或225中的任一者具有约60%、65%、70%、75%、80%、85%、90%、95%、大于95%或100%多核苷酸同一性的核酸序列。
在一些情况下,本文公开的核酸引导的核酸酶由核酸序列编码。这样的核酸可以是密码子优化的以在期望的宿主细胞中表达。作为非限制性实例,合适的宿主细胞可包括原核细胞,例如大肠杆菌、铜绿假单胞菌(P.aeruginosa)、枯草芽孢杆菌(B.subtilus)和需钠弧菌(V.natriegens);真核细胞,例如酿酒酵母、植物细胞、昆虫细胞、线虫细胞、两栖动物细胞、鱼类细胞或哺乳动物细胞,包括人细胞。
编码核酸引导的核酸酶的核酸序列可以可操作地连接到启动子。这样的核酸序列可以是线性的或环状的。核酸序列可以涵盖在更大的线性或环状核酸序列上,所述更大的线性或环状核酸序列包含另外的元件,例如复制起点、可选择或可筛选标志物、终止子、可靶向的核酸酶系统的其它组分,例如引导核酸,或如本文公开的编辑或录音盒。在一些方面,核酸序列可以包括至少一个甘氨酸、至少一个6X组氨酸标签和/或至少一个3x核定位信号标签。更大的核酸序列可以是重组表达载体,如稍后更详细描述。
通常,引导多核苷酸可以与相容的核酸引导的核酸酶形成复合物并且可以与靶序列杂交,从而将核酸酶指引到靶序列。能够与引导多核苷酸形成复合物的主题核酸引导的核酸酶可称为与引导多核苷酸相容的核酸引导的核酸酶。此外,能够与核酸引导的核酸酶形成复合物的引导多核苷酸可称为与核酸引导的核酸酶相容的引导多核苷酸或引导核酸。在一些实施方案中,本文公开的多核苷酸(gRNA)可分裂成涵盖合成tracrRNA和crRNA的片段。gRNA的实例可以包括但不限于表1中所示的gRNA。
表1.示例性gRNA
引导多核苷酸可以是DNA。引导多核苷酸可以是RNA。引导多核苷酸可包括DNA和RNA。引导多核苷酸可以包括修饰的或非天然存在的核苷酸。在引导多核苷酸包含RNA的情况下,RNA引导多核苷酸可由如本文所公开的多核苷酸分子如质粒、线性构建体或编辑盒上的DNA序列编码。
引导多核苷酸可包含引导序列。引导序列是与靶多核苷酸序列具有足够互补性以与靶序列杂交并指导复合的核酸引导的核酸酶与靶序列的序列特异性结合的多核苷酸序列。当使用合适的比对算法进行最佳比对时,引导序列与其相应靶序列之间的互补程度为约或超过约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更大。可使用任何合适的比对序列算法来确定最佳比对。在一些实施方案中,引导序列的长度可以是约或超过约5个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、35个、40个、45个、50个、75个或更多个核苷酸。在其它实施方案中,引导序列的长度可以小于约75个、50个、45个、40个、35个、30个、25个、20个核苷酸。优选地,引导序列是10-30个核苷酸长。引导序列的长度可以是15-20个核苷酸。引导序列的长度可以是15个核苷酸。引导序列的长度可以是16个核苷酸。引导序列的长度可以是17个核苷酸。引导序列的长度可以是18个核苷酸。引导序列的长度可以是19个核苷酸。引导序列的长度可以是20个核苷酸。
引导多核苷酸可包括支架序列。一般来说,“支架序列”可包括具有足以促进可靶向的核酸酶复合物形成的序列的任何序列,其中可靶向的核酸酶复合物包括但不限于核酸引导的核酸酶并且引导多核苷酸可包括支架序列和引导序列。支架序列内足以促进可靶向的核酸酶复合物形成的序列可沿支架序列内的两个序列区域、例如参与形成二级结构的一个或两个序列区域的长度包括一定程度的互补性。在一些情况下,一个或两个序列区域包括在或编码在同一多核苷酸上。在一些情况下,一个或两个序列区域包括在或编码在单独的多核苷酸上。最佳比对可以通过任何合适的比对算法来确定,并且可以进一步考虑二级结构,例如一个或两个序列区域内的自互补性。在一些实施方案中,当最佳比对时,一个或两个序列区域沿两个序列区域中较短者的长度的互补程度为约或大于约25%、30%、40%、50%、60%、70%、80%、90%、95%、97.5%、99%或更高。在一些实施方案中,两个序列区域中的至少一个的长度可以是约或超过约5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、25个、30个、40个、50个或更多个核苷酸。
主题引导多核苷酸的支架序列可包含二级结构。二级结构可包含假结区域。在一些情况下,引导多核苷酸与核酸引导的核酸酶的结合动力学部分地由支架序列内的二级结构决定。在一些情况下,引导多核苷酸与核酸引导的核酸酶的结合动力学部分地由支架序列内的核酸序列决定。在一些方面,本发明提供了结合引导多核苷酸的核酸酶,所述引导多核苷酸可以包括保守支架序列。例如,用于本公开的核酸引导的核酸酶可以结合保守假结区域。因此,支架序列可包含二级结构。二级结构可包含假结区域。在一些情况下,引导多核苷酸与核酸引导的核酸酶的结合动力学部分地由支架序列内的二级结构决定。在一些情况下,引导多核苷酸与核酸引导的核酸酶的结合动力学部分地由支架序列内的核酸序列决定。
在某些方法中,可以通过扫描与天然核酸引导的核酸酶基因座相邻的序列来找到用于相容的引导核酸的相容的支架序列。举例来说,天然核酸引导的核酸酶可以在基因组上编码在相应相容的引导核酸或支架序列附近。参见例如实施例3。
下表3提供了ART1-ART35中每一者的保守DNA序列;这些序列编码相应核酸酶的gRNA保守序列,并且可以从这些序列中创建RNA序列(表3中的保守RNA序列);此外,部分或全部RNA序列可能会经过进一步加工,以从任一端去除一个或多个核苷酸。对于每个特定的ART核酸酶,间隔子的长度是特定的NT数,支架序列的长度是特定的NT数;因此,在某些实施方案中,特定核酸酶的gRNA(加工前)的这些长度如表3所示,并且特定ART核酸酶的gRNA的总长度(在进行可能的另外加工以产生最终gRNA之前)是这两者的总和。在本文中讨论各种实施方案时,应理解包含保守序列(或其部分,见下文)的ART核酸酶和gRNA是指如本文所公开的特定ART核酸酶和其相应的特定gRNA或其部分。
因此,另外,对于每种ART核酸酶,保守RNA序列可含有RNA序列的部分,例如RNA序列是保守RNA的缩短型式,如例如在5'和/或3'端任一端或两端上缩短了一个或多个核苷酸的序列。不受理论的束缚,认为这些部分至少在某些情况下可以对应于例如代表编辑后的最终gRNA的RNA序列,和/或存在于大多数或所有gRNA中以与特定的ART核酸酶一起使用的高度保守序列。在后一种情况下,这些可以是例如在最终gRNA中产生重要的二级结构所需的RNA序列。特定ART核酸酶的gRNA可包含保守部分或高度保守部分,例如包含gRNA二级结构的核苷酸序列的高度保守部分,例如假结。
因此,在某些实施方案中,保守gRNA,即包含特定ART核酸酶的保守部分、例如保守支架部分或其一部分的gRNA,与该ART核酸酶一起使用。在某些实施方案中,保守gRNA包含SEQ ID NO:291-325的任一序列或其一部分。其部分是保守RNA序列中的连续序列,其中在5'侧、3'侧或两侧的一个或多个核苷酸被去除(在这种情况下,“去除”仅意指保守RNA的该部分中不存在,无论它是如何产生的)。该部分可以是任何合适的部分;在某些实施方案中,该部分包含从gRNA的5'端去除的0个、1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个或30个核苷酸;在某些实施方案中,该部分包含从gRNA的3'端去除的0个、1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个或30个核苷酸,只要去除至少一个核苷酸即可。在某些实施方案中,使用高度保守部分,例如包含gRNA的二级结构的核苷酸序列的高度保守部分,例如包含假结的二级结构。
在某些实施方案中,与特定ART核酸酶一起使用的gRNA是分裂gRNA,例如包含修饰的核苷酸的分裂gRNA;在某些实施方案中,与特定ART核酸酶一起使用的gRNA是单个gRNA,例如包含修饰的核苷酸的单个gRNA。合适的gNA、例如gRNA可以通过任何合适的方法产生,例如在天然环境中、在宿主细胞中、合成(具有修饰的核苷酸的gRNA)或通过任何其它合适的方法产生。这样的方法是本领域众所周知的。在某些实施方案中,与特定ART核酸酶一起使用的gRNA通过合成产生。在某些实施方案中,与特定ART核酸酶一起使用的gRNA通过合成产生并含有修饰的核苷酸,例如化学修饰的核苷酸。在美国专利申请公开No 20160289675中进一步描述了具有修饰的核苷酸的合成gRNA。在某些实施方案中,与特定核酸引导的核酸酶一起使用的gRNA包含保守gRNA或其部分,例如源自SEQ ID NO:291-325之一的保守gRNA或其部分,如上所述;在某些实施方案中,保守gRNA包含高度保守部分;例如形成二级结构的部分,例如假结。应当理解,如本文所用的“核苷酸”可以是天然核苷酸或修饰的核苷酸;例如,所写的SEQ ID NO:291-325应解释为包含天然核糖核苷酸的序列,或包含一个或多个化学修饰的核糖核苷酸的序列,这取决于上下文。
表3:保守的DNA序列和相应的RNA序列
/>
/>
/>
/>
/>
引导多核苷酸或“gRNA”可以由SEQ ID NO:178-188表示的任一序列或其它合适的gRNA表示。在一些实施方案中,工程化的多核苷酸(gRNA)可分裂成涵盖合成tracrRNA和crRNA的片段。在一些实施方案中,gRNA表示为与由SEQ ID NO:178-223中的任一者表示的序列具有至少80%、或至少85%、或至少90%、或至少95%同一性并且可包括合成tracrRNA和crRNA。
如本文所用,“引导核酸”或“引导多核苷酸”可指一种或多种多核苷酸并且包括1)能够与靶序列杂交的引导序列和2)能够与核酸引导的核酸酶相互作用或形成复合物的支架序列。引导核酸可以作为一种或多种核酸提供。在特定的实施方案中,引导序列和支架序列作为单个多核苷酸提供。在其它方面,引导核酸可以包括至少一个扩增子靶向片段。
当引导核酸与核酸引导的核酸酶可以形成能够裂解靶序列的功能性可靶向的核酸酶复合物时,两个元件可为相容的。在某些方法中,可以通过扫描与天然核酸引导的核酸酶基因座相邻的序列来找到用于相容的引导核酸的相容的支架序列。举例来说,天然核酸引导的核酸酶可以在基因组上编码在相应相容的引导核酸或支架序列附近。
核酸引导的核酸酶可以与核酸酶内源宿主中未发现的引导核酸相容。这样的正交引导核酸可以通过经验测试来确定。正交引导核酸可以来自不同的细菌物种或者是合成的或以其它方式工程化为非天然存在的。
与共同的核酸引导的核酸酶相容的正交引导核酸可包含一个或多个共同特征。共同特征可以包括假结区域外的序列。共同特征可以包括假结区域。共同特征可以包括一级序列或二级结构。
通过改变引导序列使得引导序列与靶序列互补,从而允许引导序列和靶序列之间的杂交,可以将引导核酸工程化以靶向期望的靶序列。具有工程化的引导序列的引导核酸可称为工程化的引导核酸。工程化的引导核酸通常是非天然存在的,在自然界中找不到。
可以使用合成TracrRNA(STAR)系统形成工程化的引导核酸。STAR与Cas12a蛋白组合时,可形成至少一种靶向特定基因组基因座的核糖核蛋白(RNP)复合物。STAR利用CRISPR(成簇规律间隔的短回文重复序列)的自然特性,其中CRISPR系统的功能非常类似于抵抗入侵病毒和质粒DNA的免疫系统。来自入侵病毒的短DNA序列(间隔子)被并入到细菌基因组内的CRISPR基因座,并用作先前感染的“记忆”。再次感染触发互补的成熟CRISPR RNA(crRNA)找到匹配的病毒序列。crRNA和反式激活crRNA(tracrRNA)一起引导CRISPR相关(Cas)核酸酶裂解“外来”DNA序列中的双链断裂。原核CRISPR“免疫系统”已被工程化成一种RNA引导的哺乳动物基因组编辑工具,该工具简单、容易并且可快速实施。STAR(包括合成crRNA和tracrRNA)与Cas12a蛋白结合时可以形成靶向特定基因组基因座的核糖核蛋白(RNP)复合物。用RNA(STAR)系统形成的工程化的引导核酸可产生分裂gRNA。如本文所公开使用的分裂gRNA的一个实例可以包括由SEQ ID NO:188表示的序列。
在一些实施方案中,核糖核蛋白(RNP)复合物可包括至少一种本文公开的核酸酶。在一些方面,RNP复合物可包括至少一种核酸酶,其具有与SEQ ID NO:143-177或229约75%、约85%、约95%、约99%相同或相同的氨基酸序列。在一些实例中,包括本文公开的核酸酶的RNP复合物还可包括至少一种STAR gRNA。在一些其它实例中,包括本文公开的核酸酶的RNP复合物还可包括至少一种非STAR gRNA。在一些其它实例中,包括本文公开的核酸酶的RNP复合物还可包括至少一种多核苷酸。在一些方面,包括在本文公开的RNP复合物中的多核苷酸的长度可以大于约50个核苷酸。在一些实施方案中,包括在本文公开的RNP复合物中的多核苷酸的长度可以是约50、至约150、至约500、至约1000个核苷酸或大于1000个核苷酸。在一些实施方案中,可以将超过一种核酸酶添加到RNP复合物中以影响整体编辑效率。在其它实施方案中,可以将超过一种gRNA添加到RNP复合物中,以允许在单次转染中对超过一个位点进行多重编辑,从而提高效率。在其它实施方案中,可以将超过一种DNA模板添加到RNP中,以允许根据特定的所需修复结果在一个或多个位点进行多重编辑。
核酸酶系统
本文公开的其它实施方案是可靶向的核酸酶系统。在某些实施方案中,可靶向的核酸酶系统可以包括核酸引导的核酸酶和相容的引导核酸(在本文中也可互换地称为“引导多核苷酸”和“gRNA”)。可靶向的核酸酶系统可以包括核酸引导的核酸酶或编码核酸引导的核酸酶的多核苷酸序列。可靶向的核酸酶系统可以包括引导核酸或编码引导核酸的多核苷酸序列。
一般来说,如本文所公开的可靶向的核酸酶系统的特征在于促进在靶序列位点形成可靶向的核酸酶复合物的元件,其中可靶向的核酸酶复合物包括核酸引导的核酸酶和引导核酸。
引导核酸与核酸引导的核酸酶一起形成可靶向的核酸酶复合物,如由引导核酸的引导序列所确定,所述核酸酶复合物能够结合靶多核苷酸内的靶序列。
一般来说,为了产生双链断裂,在大多数情况下,如由引导核酸所确定,可靶向的核酸酶复合物结合靶序列,并且核酸酶必须识别与靶序列相邻的原间隔序列相邻基序(PAM)序列。
可靶向的核酸酶复合物可以包括包含SEQ ID NO:143-177和229中的任一者的序列的核酸引导的核酸酶和相容的引导核酸。可靶向的核酸酶复合物可以包括SEQ ID NO:143-151中的任一者的核酸引导的核酸酶和相容的引导核酸。可靶向的核酸酶复合物可以包括SEQ ID NO:143-177中的任一者的核酸引导的核酸酶和由SEQ ID NO:178-188表示的相容的引导核酸。可靶向的核酸酶复合物可以包括编码由SEQ ID NO:1-142中的任一者表示的核酸酶的核酸引导的核酸酶和相容的gRNA或由SEQ ID NO:178-188中的任一者表示的gRNA。在某些实施方案中,引导核酸可以包括与所选择的核酸引导的核酸酶相容的支架序列。在这些实施方案中的任一者中,引导序列可以被工程化成与任何期望的靶序列互补。所选择的引导序列可以被工程化成与任何期望的靶序列杂交。
可靶向的核酸酶复合物的靶序列可以是原核或真核细胞或体外的任何内源或外源多核苷酸。例如,靶序列可以是存在于真核细胞核中的多核苷酸。靶序列可以是编码基因产物(例如蛋白质)的序列或非编码序列(例如调节多核苷酸或垃圾DNA)。本文预期靶序列应与PAM相关联;即,由可靶向的核酸酶复合物识别的短序列。PAM的精确序列和长度要求因所使用的核酸引导的核酸酶而异,但PAM可以是与靶序列相邻的2-5个碱基对序列。PAM序列的实例在下面的实施例部分中给出,并且技术人员将能够鉴定与给定的核酸引导的核酸酶一起使用的其它PAM序列。此外,PAM相互作用(PI)结构域的工程化可以允许对PAM特异性进行编程,提高靶位点识别保真度,并增加核酸引导的核酸酶基因组工程平台的通用性。核酸引导的核酸酶可以被工程化成改变它们的PAM特异性,例如Kleinstiver等人,Nature.2015年7月23日;523(7561):481-5中所描述,其公开内容整体并入本文中。
PAM位点是靠近靶序列的核苷酸序列。在大多数情况下,核酸引导的核酸酶只在存在适当的PAM时才能裂解靶序列。PAM是核酸引导的核酸酶特异性的,并且在两种不同的核酸引导的核酸酶之间可能不同。PAM可以在靶序列的5'或3'。PAM可以位于靶序列的上游或下游。PAM的长度可以是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个核苷酸。通常,PAM的长度在2-6个核苷酸之间。
在本文公开的一些实施方案中,可以在单独的寡核苷酸上提供PAM。在这种情况下,在寡核苷酸上提供PAM允许裂解靶序列,否则将无法裂解,因为在与靶序列相同的多核苷酸上不存在相邻的PAM。
编码可靶向的核酸酶系统的组分的多核苷酸序列可以包括一种或多种载体。一般地,如本文所用,术语“载体”可指能够转运已与其连接的另一核酸的核酸分子。载体包括但不限于单链、双链或部分双链的核酸分子;包含一个或多个游离端、无游离端(例如环状)的核酸分子;包含DNA、RNA或两者的核酸分子;以及本领域已知的其它种类的多核苷酸。一种类型的载体是“质粒”,它是指另外的DNA区段可以例如通过标准分子克隆技术插入的环状双链DNA环。另一种类型的载体是病毒载体,其中病毒来源的DNA或RNA序列存在于载体中,用于包装成病毒(例如逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒和腺相关病毒)。其它载体(例如非附加型哺乳动物载体)可在引入宿主细胞后整合到宿主细胞的基因组中。重组表达载体可以包括呈适合于在宿主细胞中表达核酸的形式的本发明的核酸,可意指重组表达载体包括一种或多种调控元件,所述调控元件可以根据用于表达的宿主细胞进行选择,其可操作地连接到待表达的核酸序列。
在一些实施方案中,调控元件可以可操作地连接到可靶向的核酸酶系统的一个或多个元件以便驱动可靶向的核酸酶系统的一种或多种组分的表达。
在一些实施方案中,载体可以包括可操作地连接到编码核酸引导的核酸酶的多核苷酸序列的调控元件。可以对编码核酸引导的核酸酶的多核苷酸序列进行密码子优化以在靶细胞如原核或真核细胞中表达。真核细胞可以是酵母、真菌、藻类、植物、动物或人细胞。真核细胞可以是来源于生物体的细胞,例如哺乳动物,包括但不限于人、小鼠、大鼠、兔、狗或非人哺乳动物,包括非人灵长类动物。
通常,密码子优化可指通过用感兴趣的宿主细胞中的基因中更频繁或最频繁使用的密码子替换天然序列的至少一个密码子或多个密码子同时维持天然氨基酸序列来修饰核酸序列以增强在所述宿主细胞中的表达的过程。各种物种对某种氨基酸的密码子表现出一定的偏好。如本文所预期,可以基于密码子优化来定制基因以使给定生物体中基因表达最佳。密码子使用表很容易例如在www.kazusa.orjp的“密码子使用数据库”获得,这些表可以通过多种方式进行调整。参见Nakamura,Y.等人,“Codon usage tabulated from theinternational DNA sequence databases:status for the year 2000”Nucl.AcidsRes.28:292(2000)。在某些实施方案中,提供了密码子优化的多核苷酸。在某些实施方案中,提供了一种或多种多核苷酸,其编码以下中的一者或多者:对应于SEQ ID NO:143-177和229中的任一者的氨基酸序列;或SEQ ID NO:144、153和229中的任一者(在一些情况下SEQ ID NO:144;在一些情况下SEQ ID NO:153;在一些情况下SEQ ID NO:229)的氨基酸序列;或与对应于SEQ ID NO:143-177和229中的任一者的氨基酸序列或与SEQ ID NO:144、153和229中的任一者(在一些情况下SEQ ID NO:144;在一些情况下SEQ ID NO:153;在一些情况下SEQ ID NO:229)的氨基酸序列中的一者或多者至少50%、60%、70%、80%、90%、95%或100%相同的氨基酸序列;其中所述多核苷酸进行密码子优化,例如针对大肠杆菌进行密码子优化,或针对酿酒酵母进行密码子优化,或针对人进行密码子优化。在某些实施方案中,序列在由所述多核苷酸编码的多肽的N端、C端或两者处编码一种或多种另外的氨基酸序列。另外的氨基酸序列的类型、组合、N端或C端和/或顺序可以是本文公开的那些中的任一者。
在某些实施方案中,本文提供了一种或多种密码子优化的多核苷酸,其对应于SEQID NO:2-4、6-10、12-14、16-18、20-22、24-26、28-30、32-34、36-38、40-42、44-46、48-50、52-54、56-58、60-62、64-66、68-70、72-74、76-78、80-82、84-86、88-90、92-94、96-98、100-102、104-106、108-110、112-114、116-118、120-122、124-126、128-130、132-134、136-138、140-142、226-228和330中的任一者,或与对应于SEQ ID NO:2-4、6-10、12-14、16-18、20-22、24-26、28-30、32-34、36-38、40-42、44-46、48-50、52-54、56-58、60-62、64-66、68-70、72-74、76-78、80-82、84-86、88-90、92-94、96-98、100-102、104-106、108-110、112-114、116-118、120-122、124-126、128-130、132-134、136-138、140-142、226-228和330中的任一者的多核苷酸序列中的一者或多者至少50%、60%、70%、80%、90%、95%或100%相同的多核苷酸序列。在某些实施方案中,序列在由所述多核苷酸编码的多肽的N端、C端或两者处编码一种或多种另外的氨基酸序列。另外的氨基酸序列的类型、组合、N端或C端和/或顺序可以是本文公开的那些中的任一者。在某些实施方案中,本文提供了一种或多种大肠杆菌密码子优化的多核苷酸,其对应于SEQ ID NO:2、6、12、16、20、24、28、32、36、40、44、48、52、56、60、64、68、72、76、80、84、88、92、96、100、104、108、112、116、120、124、128、132、136、140、226和330中的任一者,或与对应于SEQ ID NO:2、6、12、16、20、24、28、32、36、40、44、48、52、56、60、64、68、72、76、80、84、88、92、96、100、104、108、112、116、120、124、128、132、136、140、226和330中的任一者的多核苷酸序列中的一者或多者至少50%、60%、70%、80%、90%、95%或100%相同的多核苷酸序列。在某些实施方案中,序列在由所述多核苷酸编码的多肽的N端、C端或两者处编码一种或多种另外的氨基酸序列。另外的氨基酸序列的类型、组合、N端或C端和/或顺序可以是本文公开的那些中的任一者。在某些实施方案中,本文提供了一种或多种酿酒酵母密码子优化的多核苷酸,其对应于SEQ ID NO:3、7、9、13、17、21、25、29、33、37、41、45、49、53、57、61、65、69、73、77、81、85、89、93、97、101、105、109、113、117、121、125、129、133、137、141和227的中的任一者,或与对应于SEQ ID NO:3、7、9、13、17、21、25、29、33、37、41、45、49、53、57、61、65、69、73、77、81、85、89、93、97、101、105、109、113、117、121、125、129、133、137、141和227中的任一者的多核苷酸序列中的一者或多者至少50%、60%、70%、80%、90%、95%或100%相同的多核苷酸序列。在某些实施方案中,序列在由所述多核苷酸编码的多肽的N端、C端或两者处编码一种或多种另外的氨基酸序列。另外的氨基酸序列的类型、组合、N端或C端和/或顺序可以是本文公开的那些中的任一者。在某些实施方案中,本文提供了一种或多种人密码子优化的多核苷酸,其对应于SEQ ID NO:4、10、14、18、22、26、30、34、38、42、46、50、54、58、62、66、70、74、78、82、86、90、94、98、102、106、110、114、118、122、126、130、134、138、142和228中的任一者,或与对应于SEQ ID NO:4、10、14、18、22、26、30、34、38、42、46、50、54、58、62、66、70、74、78、82、86、90、94、98、102、106、110、114、118、122、126、130、134、138、142和228中的任一者的多核苷酸序列中的一者或多者至少50%、60%、70%、80%、90%、95%或100%相同的多核苷酸序列。在某些实施方案中,序列在由所述多核苷酸编码的多肽的N端、C端或两者处编码一种或多种另外的氨基酸序列。另外的氨基酸序列的类型、组合、N端或C端和/或顺序可以是本文公开的那些中的任一者。
核酸引导的核酸酶和一种或多种引导核酸可以作为DNA或RNA递送。核酸引导的核酸酶和引导核酸均作为RNA(未修饰或含有碱基或主链修饰)分子的递送可用于减少核酸引导的核酸酶在细胞中持续存在的时间量。这可以降低靶细胞中脱靶裂解活性的水平。由于以mRNA形式递送核酸引导的核酸酶需要时间来翻译成蛋白质,因此宜在递送核酸引导的核酸酶mRNA后数小时递送引导核酸,以使可用于与核酸引导的核酸酶蛋白相互作用的引导核酸的水平最大化。在其它情况下,核酸引导的核酸酶mRNA和引导核酸同时递送。在其它实例中,引导核酸依序递送,例如在核酸引导的核酸酶mRNA之后0.5小时、1小时、2小时、3小时、4小时或更多小时。
可以将RNA形式的或在DNA表达盒上编码的引导核酸引入宿主细胞中,可以包括在载体或染色体上编码的核酸引导的核酸酶。引导核酸可以作为一个或多个多核苷酸提供在盒中,其在盒中可以是连续的或不连续的。在特定的实施方案中,引导核酸作为单个连续多核苷酸提供在盒中。
多种递送系统可用于将核酸引导的核酸酶(DNA或RNA)和引导核酸(DNA或RNA)引入宿主细胞中。根据这些实施方案,使用系统可包括但不限于酵母系统、脂质转染系统、显微注射系统、基因枪系统、病毒颗粒、脂质体、免疫脂质体、聚阳离子、脂质:核酸偶联物、病毒体、人工病毒体、病毒载体、电穿孔、细胞渗透肽、纳米颗粒、纳米线(Shalek等人,NanoLetters,2012)、外泌体、分子特洛伊木马脂质体(Pardridge等人,Cold Spring HarbProtoc;2010;doi:10.1101/pdb.prot5407),可用于递送工程的核酸酶并引导核酸酶穿过血脑屏障。
在一些实施方案中,还提供了编辑模板。编辑模板可以是如本文所述的载体的组分,包含在单独的载体中,或作为单独的多核苷酸提供,例如寡核苷酸、线性多核苷酸或合成多核苷酸。在一些情况下,编辑模板与引导核酸位于相同的多核苷酸上。在一些实施方案中,编辑模板被设计成用作同源重组中的模板,例如在由作为本文公开的复合物的一部分的核酸引导的核酸酶切开或裂解的靶序列内或附近。编辑模板多核苷酸可以具有任何合适的长度,例如约或多于约10个、15个、20个、25个、50个、75个、100个、150个、200个、500个、1000个或更多个核苷酸的长度。在一些实施方案中,编辑模板多核苷酸与可包括靶序列的多核苷酸的一部分互补。当最佳比对时,编辑模板多核苷酸可能与靶序列的一个或多个核苷酸(例如约或多于约1个、5个、10个、15个、20个、25个、30个、35个、40个或更多个核苷酸)重叠。在一些实施方案中,当编辑模板序列和可包括靶序列的多核苷酸最佳比对时,模板多核苷酸的最近核苷酸距靶序列约1个、5个、10个、15个、20个、25个、50个、75个、100个、200个、300个、400个、500个、1000个、5000个、10000个或更多个核苷酸。
在一些实施方案中,提供了用于将一种或多种多核苷酸、例如本文所述的一种或多种载体或线性多核苷酸、其一种或多种转录物和/或从其转录的一种或多种蛋白质递送到宿主细胞的方法。在一些方面,本发明还提供了通过这类方法产生的细胞,并且生物体可以包括这类细胞或由这类细胞产生。在一些实施方案中,将工程化的核酸酶与引导核酸组合(并任选形成复合物)递送到细胞。
常规的基于病毒和非病毒的基因转移方法可用于将核酸引入细胞,例如原核细胞、真核细胞、哺乳动物细胞或靶组织。这类方法可用于将编码工程化的核酸引导的核酸酶系统的组分的核酸施用于培养的细胞或宿主生物体中的细胞。非病毒载体递送系统包括DNA质粒、RNA(例如本文所述的载体的转录物)、裸核酸和与递送媒介物如脂质体形成复合物的核酸。病毒载体递送系统包括DNA和RNA病毒,它们在递送到细胞后具有游离基因组或整合基因组。考虑在本文中使用本领域已知的任何基因治疗方法。本文中预期非病毒递送核酸的方法。腺相关病毒(“AAV”)载体也可用于用靶核酸转导细胞,例如在核酸和肽的体外产生中,以及用于体内和离体基因治疗程序。
在一些实施方案中,宿主细胞被如本文所述的一种或多种载体、线性多核苷酸、多肽、核酸-蛋白质复合物或它们的任何组合瞬时或非瞬时转染。在一些实施方案中,细胞在体外、培养时或离体转染。在一些实施方案中,细胞在其天然存在于受试者中时被转染。在一些实施方案中,被转染的细胞取自受试者。在一些实施方案中,细胞来源于取自受试者的细胞,例如细胞系。
在一些实施方案中,本文所述的一种或多种载体、线性多核苷酸、多肽、核酸-蛋白质复合物或它们的任何组合转染的细胞用于建立可包括一种或多种转染衍生序列的新的细胞系。在一些实施方案中,用本文所述的工程化的核酸引导的核酸酶系统的组分瞬时转染(例如通过瞬时转染一种或多种载体,或用RNA转染)并通过工程化的核酸酶复合物的活性修饰的细胞用于建立可包括含有修饰但缺乏任何其它外源序列的细胞的新的细胞系。
在一些实施方案中,本文所述的一种或多种载体用于产生非人转基因细胞、生物体、动物或植物。在一些实施方案中,转基因动物是哺乳动物,例如小鼠、大鼠或兔。用于产生转基因细胞、生物体、植物和动物的方法是本领域已知的,并且通常从细胞转化或转染的方法开始,例如本文所述。
在某些实施方案中,对于工程化的核酸酶复合物,“靶序列”可指引导序列被设计成与其具有互补性的序列,其中靶序列与引导序列之间的杂交促进工程化的核酸酶复合物的形成。靶序列可包括任何多核苷酸,例如DNA、RNA或DNA-RNA杂交体。靶序列可位于细胞的细胞核或细胞质中。靶序列可以位于体外或无细胞环境中。
在一些实施方案中,工程化的核酸酶复合物的形成可包括与靶序列杂交并与本文公开的一种或多种新颖工程化的核酸酶形成复合物的引导核酸,从而使靶序列内或附近(例如1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个或更多个碱基对)的一条或两条链裂解。裂解可发生在靶序列内、靶序列的5'、靶序列的上游、靶序列的3'或靶序列的下游。
在一些实施方案中,将驱动可靶向的核酸酶系统的一种或多种组分表达的一种或多种载体引入宿主细胞或体外,从而在一个或多个靶位点处形成可靶向的核酸酶复合物。例如,核酸引导的核酸酶和引导核酸可各自可操作地连接到单独载体上的单独调控元件。可替代地,由相同或不同调控元件表达的两个或多个元件可以组合在单个载体中,其中一个或多个另外的载体提供不包括在第一载体中的可靶向的核酸酶系统的任何组分。组合在单个载体中的可靶向的核酸酶系统元件可以按任何合适的取向排列,例如一个元件相对于第二元件位于5'(“上游”)或位于3'(“下游”)。一个元件的编码序列可以位于第二个元件的编码序列的相同或相反链上,并且取向相同或相反。在一些实施方案中,单个启动子驱动编码核酸引导的核酸酶和一种或多种引导核酸的转录物的表达。在一些实施方案中,核酸引导的核酸酶和一种或多种引导核酸可操作地连接到相同的启动子并从相同的启动子表达。在其它实施方案中,将一种或多种引导核酸或编码一种或多种引导核酸的多核苷酸引入已包括核酸引导的核酸酶或编码核酸引导的核酸酶的多核苷酸序列的细胞或体外环境中。
在一些实施方案中,当使用多个不同的引导序列时,单个表达构建体可用于将核酸酶活性靶向细胞内或体外的多个不同的对应靶序列。例如,单个载体可包括约或超过约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个或更多个引导序列。在其它实施方案中,可提供约或超过约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个这样的含有引导序列的载体,并且任选地,递送到体内或体外细胞。
在一些实施方案中,本文公开的方法和组合物可包括超过一种引导核酸,使得每种引导核酸具有不同的引导序列,从而靶向不同的靶序列。根据这些实施方案,多个引导核酸可用于多路复用,其中同时靶向多个靶标。另外或可替代地,将多个引导核酸引入细胞群体中,使得群体中的每个细胞接受不同的或随机的引导核酸,从而靶向跨细胞群体的多个不同靶序列。在这样的情况下,随后改变的细胞的集合可以称为文库。
在其它实施方案中,本文公开的方法和组合物可包括多种不同的核酸引导的核酸酶,每种具有一种或多种不同的相应引导核酸,从而允许不同的核酸引导的核酸酶靶向不同的靶序列。在一些这样的情况下,每个核酸引导的核酸酶可以对应于不同的多个引导核酸,从而允许两个或更多个不重叠、部分重叠或完全重叠的多路复用事件发生。
在一些实施方案中,核酸引导的核酸酶具有DNA裂解活性或RNA裂解活性。在一些实施方案中,核酸引导的核酸酶在靶序列的位置,例如在靶序列内和/或在靶序列的补体内指导一条或两条链的裂解。在一些实施方案中,核酸引导的核酸酶在距靶序列的第一个或最后一个核苷酸约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、25个、50个、100个、200个、500个或更多个碱基对内指导一条或两条链的裂解。
在某些实施方案中,本发明提供了在体外或在原核或真核细胞中修饰靶序列的方法,其可以是体内、离体或体外。在一些实施方案中,所述方法包括对细胞或细胞群体、例如原核细胞或来自人或非人动物或植物(包括微藻或其它生物体)的细胞进行取样,并修饰该细胞或这些细胞。培养可以发生在体外或离体的任何阶段。甚至可以将一个或多个细胞重新引入宿主、例如非人动物或植物(包括微藻)中。对于重新引入的细胞,它们可以是干细胞。
在一些实施方案中,所述方法包括允许可靶向的核酸酶复合物结合靶序列以实现靶序列的裂解,从而修饰靶序列,其中可靶向的核酸酶复合物包括与引导核酸形成复合物的核酸引导的核酸酶,其中引导核酸的引导序列与靶多核苷酸内的靶序列杂交。在一些方面,本发明提供了一种在体外或在原核或真核细胞中修饰靶多核苷酸表达的方法。在一些实施方案中,所述方法包括允许可靶向的核酸酶复合物与靶多核苷酸内的靶序列结合,使得结合可引起靶多核苷酸的表达增加或减少;其中可靶向的核酸酶复合物包括与引导核酸形成复合物的核酸引导的核酸酶,并且其中引导核酸的引导序列与靶多核苷酸内的靶序列杂交。
在某些实施方案中,本发明提供了含有上述方法和组合物中公开的任何一种或多种要素的试剂盒。要素可以单独或组合提供,并且可以提供在任何合适的容器中,例如小瓶、瓶子或管。在一些实施方案中,试剂盒包括一种或多种语言、例如超过一种语言的说明书的说明书。
在一些实施方案中,试剂盒包含一种或多种试剂,用于在利用本文所述的一种或多种要素的过程中使用。试剂可以提供在任何合适的容器中。例如,试剂盒可以提供一种或多种反应或储存缓冲液。试剂可以呈可用于测定的形式提供,或呈需要在使用前添加一种或多种其它组分的形式提供(例如呈浓缩物或冻干形式)。缓冲液可以是任何缓冲液,包括但不限于碳酸钠缓冲液、碳酸氢钠缓冲液、硼酸盐缓冲液、Tris缓冲液、MOPS缓冲液、HEPES缓冲液以及它们的组合。在一些实施方案中,缓冲液是碱性的。在一些实施方案中,缓冲液具有约7至约10的pH。在一些实施方案中,试剂盒包括对应于引导序列的一种或多种寡核苷酸,用于插入载体中以便可操作地连接引导序列和调控元件。在一些实施方案中,试剂盒包括编辑模板。
在一些实施方案中,可靶向的核酸酶复合物具有多种用途,包括修饰(例如,缺失、插入、易位、失活、激活)多种细胞类型中的靶序列。因此,本发明的可靶向的核酸酶复合物在例如生化通路优化、全基因组研究、基因组工程、基因疗法、药物筛选、疾病诊断和预后中具有广泛的应用。示例性可靶向的核酸酶复合物包括如本文公开的与引导核酸形成复合物的核酸引导的核酸酶,其中引导核酸的引导序列可以与靶多核苷酸内的靶序列杂交。引导核酸可包括与支架序列连接的引导序列。支架序列可包括具有一定程度互补性,使得它们一起形成二级结构的一个或多个序列区域。
编辑模板多核苷酸可包括待整合的序列(例如突变基因)。用于整合的序列可以是细胞内源或外源的序列。待整合的序列的实例包括编码蛋白质或非编码RNA(例如微RNA)的多核苷酸。因此,用于整合的序列可以可操作地连接到一个适当的控制序列或多个适当的控制序列。可替代地,待整合的序列可提供调节功能。待整合的序列可以是内源性野生型序列的突变或变体。可替代地,待整合的序列可以是内源突变序列的野生型。另外地或可替代地,待整合的序列可以是内源突变或变异序列的变异或突变形式。
在某些实施方案中,上游或下游序列可包括约20bp至约2500bp,例如约50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400或约2500bp。在一些实施方案中,示例性上游或下游序列具有约15bp至约2000bp、约30bp至约1000bp、约50bp至约750bp、约600bp至约1000bp、或约700bp至约1000bp。
在一些实施方案中,编辑模板多核苷酸还可包括标志物。在某些实施方案中,一些标记可以促进靶向整合的筛选。合适标记的实例可包括但不限于限制性位点、荧光蛋白或选择标记。在某些实施方案中,可以使用重组技术构建外源多核苷酸模板。
在一个实施方案中,示例性方法通过整合编辑模板多核苷酸来修饰靶多核苷酸,通过工程化的核酸酶复合物将双链断裂引入基因组序列,可以使用编辑模板通过同源重组修复断裂,使得模板被整合到靶多核苷酸中。双链断裂的存在可以提高编辑模板的整合效率。
本文公开了用于修饰多核苷酸在细胞中的表达的方法。一些方法包括通过使用结合靶多核苷酸的可靶向的核酸酶复合物来增加或减少靶多核苷酸的表达。
基因表达水平的检测可以在扩增测定中实时进行。一方面,扩增产物可以用荧光DNA结合剂直接显现,包括但不限于DNA嵌入剂和DNA沟结合剂。由于并入双链DNA分子中的嵌入剂的量可以与扩增的DNA产物的量成比例,因此宜通过使用本领域中常规的光学系统对嵌入染料的荧光进行定量来确定扩增产物的量。适用于该应用的DNA结合染料包括但不限于SYBR绿、SYBR蓝、DAPI、碘化丙锭、Hoeste、SYBR金、溴化乙锭、吖啶、原黄素、吖啶橙、吖啶黄、荧光香豆素、玫瑰树碱、道诺霉素(daunomycin)、氯喹(chloroquine)、偏端霉素D(distamycin D)、色霉素(chromomycin)、乙菲啶(homidium)、光神霉素(mithramycin)、多吡啶钌(ruthenium polypyridyl)、安曲霉素(anthramycin)和本领域技术人员已知的其它物质。
在一些实施方案中,其它荧光标记如序列特异性探针可用于扩增反应以促进扩增产物的检测和定量。基于探针的定量扩增依赖于对所需扩增产物的序列特异性检测。它利用荧光目标特异性探针(例如TaqManTM探针)来提高特异性和灵敏度。用于进行基于探针的定量扩增的方法在本领域中是公认的。
在一些实施方案中,还可以通过检查相应的基因产物来确定试剂诱导的与信号传导生化通路相关的序列的表达变化。确定蛋白质水平可涉及a)使生物样品中所含的蛋白质与特异性结合与信号传导生化通路相关的蛋白质的试剂接触;以及(b)鉴定如此形成的任何试剂:蛋白质复合物。在该实施方案的一方面,特异性结合与信号传导生化通路相关的蛋白质的试剂是抗体,优选单克隆抗体。
在一些实施方案中,在结合反应期间形成的试剂:多肽复合物的量可以通过标准定量测定来定量。如上所示,试剂:多肽复合物的形成可以通过保留在结合位点的标记量直接测量。或者,测试与信号传导生化通路相关的蛋白质与标记类似物竞争特定试剂上的结合位点的能力。在该竞争测定中,捕获的标记量与测试样品中存在的与信号传导生化通路相关的蛋白质序列量成反比。
在一些实施方案中,基于上文概述的一般原理的多种蛋白质分析技术是本领域中已知的并且涵盖在本文中。它们包括但不限于放射免疫测定、ELISA(酶联免疫放射测定)、“夹心式”免疫测定、免疫放射测定、原位免疫测定(使用例如胶体金、酶或放射性同位素标记)、蛋白质印迹分析、免疫沉淀测定、免疫荧光测定和SDS-PAGE。
在一些实施方案中,在实施主题方法时,可能需要辨别与信号传导生化通路相关的蛋白质在不同身体组织、不同细胞类型和/或不同亚细胞结构中的表达模式。这些研究可以使用组织特异性、细胞特异性或亚细胞结构特异性抗体进行,这些抗体能够结合优先在某些组织、细胞类型或亚细胞结构中表达的蛋白质标记。
在其它实施方案中,与信号传导生化通路相关的基因的表达改变也可以通过检查基因产物相对于对照细胞的活性变化来确定。试剂诱导的与信号传导生化通路相关的蛋白质活性变化的测定将取决于正在研究的生物活性和/或信号转导通路。例如,当蛋白质是激酶时,其使下游底物磷酸化的能力的变化可以通过本领域已知的多种测定来确定。代表性测定包括但不限于免疫印迹和免疫沉淀,使用识别磷酸化蛋白质的抗体,例如抗磷酸酪氨酸抗体。此外,激酶活性可以通过高通量化学发光测定来检测。
在某些实施方案中,当与信号传导生化通路相关的蛋白质是导致细胞内pH条件波动的信号级联的一部分时,pH敏感分子如荧光pH染料可用作报道分子。在另一个实例中,当与信号传导生化通路相关的蛋白质是离子通道时,可以监测膜电位和/或细胞内离子浓度的波动。许多商业试剂盒和高通量装置适用于对离子通道调节剂进行快速且稳健的筛选。代表性仪器包括FLIPRTM(Molecular Devices,Inc.)和VIPR(Aurora Biosciences)。这些仪器能够同时检测一块微孔板的1000多个样品孔中的反应,并提供秒级甚至毫秒级的实时测量和功能数据。
在实施本文公开的任何方法时,可经由本领域中已知的一种或多种方法将合适的载体引入细胞、组织、生物体或胚胎中,所述方法包括不限于显微注射、电穿孔、声致穿孔、基因枪法、磷酸钙介导的转染、阳离子转染、脂质体转染、树状聚合物转染、热休克转染、核转染法(nucleofection)转染、磁转染、脂质转染、穿刺转染(impalefection)、光学转染、专利试剂(proprietary agent)增强的核酸摄取、以及经由脂质体、免疫脂质体、病毒颗粒或人工病毒体递送。在一些方法中,通过显微注射将载体引入胚胎中。可以将一种或多种载体显微注射到胚胎的细胞核或细胞质中。在一些方法中,可以通过核转染将一种或多种载体引入细胞中。
可靶向的核酸酶复合物的靶多核苷酸可以是宿主细胞内源或外源的任何多核苷酸。例如,靶多核苷酸可以是存在于真核细胞的细胞核、原核细胞的基因组或宿主细胞的染色体外载体中的多核苷酸。靶多核苷酸序列可以是编码基因产物(例如蛋白质)的序列或非编码序列(例如调节多核苷酸或垃圾DNA)。
本文公开的一些实施方案涉及使用本文公开的工程化的核酸引导的核酸酶系统;例如,为了靶向和敲除基因、扩增基因和/或修复与DNA重复不稳定性和医学病症相关的某些突变。该核酸酶系统可用于利用和纠正这些基因组不稳定性缺陷。在其它实施方案中,本文公开的工程化的核酸引导的核酸酶系统可用于纠正与拉福拉病(Lafora disease)相关的基因中的缺陷。拉福拉病是一种常染色体隐性疾患,其特征是进行性肌阵挛性癫痫,可能在青春期以癫痫发作开始。这种情况会导致癫痫发作、肌肉痉挛、行走困难、痴呆,并最终导致死亡。
在本发明的另一个方面,工程化/新型的核酸引导的核酸酶系统可用于纠正由多种基因突变引起的遗传性眼病。
本发明的几个其它实施方案涉及纠正与广泛遗传疾病相关的缺陷,这些疾病在美国国立卫生研究院网站的遗传病症主题小节下有进一步描述。脑部的某些遗传病症可包括但不限于肾上腺脑白质营养不良、胼胝体发育不全、艾卡尔迪综合征(Aicardi Syndrome)、阿尔珀斯病(Alpers'Disease)、胶质母细胞瘤、阿尔茨海默氏症、巴特综合征(BarthSyndrome)、巴藤病(Batten Disease)、CADASIL、小脑变性、法布里病(Fabry's Disease)、格-施-斯三氏病(Gerstmann-Straussler-Scheinker Disease)、亨廷顿氏病和其它三联体重复序列病症、莱氏病(Leigh's Disease)、莱施-尼汉综合征(Lesch-Nyhan Syndrome)、门克斯病(Menkes Disease)、线粒体肌病和NINDS空洞脑或由遗传相关因果关系导致的其它脑部病症。在一些实施方案中,遗传相关病症可以是赘瘤。在一些实施方案中,当疾患是赘瘤时,靶向基因可以包括一种或多种上面列出的基因。在一些实施方案中,本文考虑的健康疾患可以是年龄相关性黄斑变性或精神分裂症相关病症。在其它实施方案中,疾患可以是三核苷酸重复病症或脆性X综合征。在其它实施方案中,疾患可以是分泌酶相关病症。在一些实施方案中,疾患可以是朊病毒相关病症。在一些实施方案中,疾患可以是ALS。在一些实施方案中,疾患可以是与处方药或非法物质有关的药物成瘾。根据这些实施例,成瘾相关蛋白可以包括例如ABAT。
在一些实施方案中,疾患可以是自闭症。在一些实施方案中,健康疾患可以是炎症相关疾患,例如促炎细胞因子的过度表达。其它炎症相关蛋白可包括以下中的一种或多种:由Ccr2基因编码的单核细胞趋化蛋白-1(MCP1)、由Ccr5基因编码的CC趋化因子受体类型5(CCR5)、由Fcgr2b基因编码的IgG受体IIB(FCGR2b,也称为CD32)、或由Fcerlg基因编码的FcεRlg(FCER1g)蛋白蛋白,或与这些疾患具有遗传联系的其它蛋白质。在一些实施方案中,疾患可以是帕金森病。根据这些实施方案,与帕金森病相关的蛋白质可包括但不限于a-突触核蛋白、DJ-1、LRRK2、PINK1、帕金蛋白、UCHL1、核突触蛋白相互作用蛋白-1和NURR1。
导致心脏病症的心血管相关蛋白可包括但不限于IL1b(白细胞介素1-β)、XDH(黄嘌呤脱氢酶)、TP53(肿瘤蛋白p53)、PTGIS(前列腺素12(前列环素)合酶)、MB(肌红蛋白)、IL4(白细胞介素4)、ANGPT1(血管生成素1)、ABCG8(ATP结合盒亚家族G(WHITE)成员8)或CTSK(组织蛋白酶K),或已知引起这些疾患的其它因子。
在一些实施方案中,疾患可以是阿尔茨海默氏症。根据这些实施方案,阿尔茨海默氏症相关蛋白可包括由VLDLR基因编码的极低密度脂蛋白受体蛋白(VLDLR)、由UBA1基因编码的泛素样修饰激活酶1(UBA1)、或例如由UBA3基因编码的NEDD8激活酶El催化亚基蛋白(UBE1C)或其它遗传相关因子。
在一些实施方案中,疾患可以是自闭症谱系障碍。根据这些实施方案,与自闭症谱系障碍相关的蛋白质可以包括由BZRAP1基因编码的苯二氮卓受体(外周)相关蛋白1(BZRAP1)、由AFF2基因(也称为MFR2)编码的AF4/FMR2家族成员2蛋白(AFF2)、由FXR1基因编码的脆性X智力低下常染色体同源物1蛋白(FXR1)、或由FXR2基因编码的脆性X智力低下常染色体同源物2蛋白(FXR2)、或其它遗传相关因子。
在一些实施方案中,疾患可以是黄斑变性。根据这些实施方案,与黄斑变性相关的蛋白质可以包括但不限于由ABCR基因编码的ATP结合盒亚家族A(ABC1)成员4蛋白(ABCA4)、载脂蛋白E蛋白(由APOE基因编码的APOE)、或由CCL2基因编码的趋化因子(CC基序)Llg和2蛋白(CCL2)、或其它遗传相关因子。
在一些实施方案中,疾患可以是精神分裂症。根据这些实施方案,与精神分裂症相关的蛋白质包括NRG1、ErbB4、CPLX1、TPH1、TPH2、NRXN1、GSK3A、BDNF、DISCI、GSK3B和它们的组合。
在一些实施方案中,疾患可以是肿瘤抑制。根据这些实施方案,与肿瘤抑制相关的蛋白质可以包括ATM(共济失调毛细血管扩张症突变)、ATR(共济失调毛细血管扩张症和Rad3相关)、EGFR(表皮生长因子受体)、ERBB2(v-erb-b2红白血病病毒癌基因同源物2)、ERBB3(v-erb-b2红白血病病毒癌基因同源物3)、ERBB4(v-erb-b2红白血病病毒癌基因同源物4)、Notch 1、Notch2、Notch 3或Notch 4或其它遗传相关因子。
在一些实施方案中,疾患可以是分泌酶病症。根据这些实施方案,与分泌酶病症相关的蛋白质可以包括PSENEN(早老素增强子2同源物(秀丽隐杆线虫(C.elegans)))、CTSB(组织蛋白酶B)、PSEN1(早老素1)、APP(淀粉样蛋白β(A4)前体蛋白)、APH1B(前咽缺陷1同源物B(秀丽隐杆线虫))、PSEN2(早老素2(阿尔茨海默症4))或BACE1(β位点APP裂解酶1)或其它遗传相关因子。
在一些实施方案中,疾患可以是肌萎缩侧索硬化。根据这些实施方案,与之相关的蛋白质可包括SOD1(超氧化物歧化酶1)、ALS2(肌萎缩侧索硬化2)、FUS(肉瘤融合)、TARDBP(TAR DNA结合蛋白)、VAGFA(血管内皮生长因子A)、VAGFB(血管内皮生长因子B)和VAGFC(血管内皮生长因子C)以及它们的任何组合或其它遗传相关因子。
在一些实施方案中,疾患可以是朊病毒病。根据这些实施方案,与朊病毒病相关的蛋白质可包括SOD1(超氧化物歧化酶1)、ALS2(肌萎缩侧索硬化2)、FUS(肉瘤融合)、TARDBP(TAR DNA结合蛋白)、VAGFA(血管内皮生长因子A)、VAGFB(血管内皮生长因子B)和VAGFC(血管内皮生长因子C)以及它们的任何组合或其它遗传相关因子。朊病毒病中与神经退行性疾患相关的蛋白质的实例包括A2M(Α-2-巨球蛋白)、AATF(凋亡拮抗转录因子)、ACPP(酸性磷酸酶前列腺)、ACTA2(肌动蛋白α2平滑肌主动脉)、ADAM22(ADAM金属肽酶结构域)、ADORA3(腺苷A3受体)或ADRA1D(Α-1D-肾上腺素能受体的Α-1D肾上腺素能受体)或其它遗传相关因子。
在一些实施方案中,疾患可以是免疫缺陷病症。根据这些实施方案,与免疫缺陷病症相关的蛋白质可包括A2M[α-2-巨球蛋白];AANAT[芳烷胺N-乙酰转移酶];ABCA1[ATP结合盒亚家族A(ABC1)成员1];ABCA2[ATP结合盒亚家族A(ABC1)成员2];或ABCA3[ATP结合盒亚家族A(ABC 1)成员3];或其它遗传有关因子。
在一些实施方案中,疾患可以是免疫缺陷病症。根据这些实施方案,与免疫缺陷病症相关的蛋白质可包括三核苷酸重复病症,包括AR(雄激素受体)、FMR1(脆性X智力低下1)、HTT(亨廷顿蛋白)或DMPK(肌强直性肌营养不良症-蛋白激酶)、FXN(共济蛋白)、ATXN2(共济失调蛋白2)或其它基因相关因子。
在一些实施方案中,疾患可以是神经传递病症。根据这些实施方案,与神经传递病症相关的蛋白质可包括SST(生长抑素)、NOS1(一氧化氮合酶1(神经元))、ADRA2A(肾上腺素能α-2A-受体)、ADRA2C(肾上腺素能α-2C-受体)、TACR1(速激肽受体1)或HTR2c(5-羟色胺(血清素)受体2C)或其它基因相关因子。在其它实施方案中,神经发育相关序列可包括但不限于A2BP1[共济失调蛋白2-结合蛋白1]、AADAT[氨基己二酸转氨酶]、AANAT[芳基烷基胺N-乙酰转移酶]、ABAT[4-氨基丁酸转氨-ABCA1[ATP结合盒亚家族A(ABC1)成员1]或ABCA13[ATP结合盒亚家族A(ABC1)成员13]或其它遗传相关因子。
在其它实施方案中,遗传健康疾患可包括但不限于艾卡迪-古特雷斯综合征(Aicardi-Goutieres Syndrome);亚历山大病(Alexander Di sease);艾伦-赫恩登-达德利综合征(Allan-Herndon-Dudley Syndrome);POLG相关病症;Α-甘露糖苷贮积症(II型和III型);阿尔斯特罗姆综合征(Alstrom Syndrome);天使人;综合征;共济失调-毛细血管扩张症;神经元蜡样质脂褐质沉积症;Β-地中海贫血;双侧视神经萎缩和(婴儿)3视神经萎缩1型;视网膜母细胞瘤(双侧);卡纳万病(Canava n Disease);脑-眼-面-骨骼综合征(Cerebrooculofacioskeletal Syndrom e)1[COFS1];脑腱性黄瘤症(CerebrotendinousXanthomatosis);德朗热综合征(Cornelia de Lange Syndrome);MAPT相关病症;遗传性朊病毒病;德拉韦特综合征(Dravet Syndrome);早发性家族性阿尔茨海默氏症;4弗里德里希共济失调[FRDA];弗林斯综合征(Fryns Syndr ome);岩藻糖苷贮积症;福山先天性肌营养不良症(Fukuyama Conge nital Muscular Dystrophy);半乳糖唾液酸贮积症;戈谢病(Gaucher Disease);有机酸血症;噬血细胞性淋巴组织细胞增多症;哈钦森-吉尔福德早衰综合征(Hutchinson-Gilford Progeria Syndrome);粘脂贮积症II;婴儿期游离唾液酸贮积病4;PLA2G6相关神经变性;耶韦尔和朗格-尼尔森综合征(Jervell and Lange-NielsenSyndrome);交界性大疱性表皮松解症;亨廷顿病;克拉伯病(婴儿);线粒体DNA相关莱氏综合征和NARP;莱施-尼汉综合征;LIST相关无脑回症-5;洛伊综合征(Lowe Syndrome);枫糖浆尿病;MECP2复制综合征;ATP7A相关的铜转运病症;LAMA2相关的肌营养不良症;芳基硫酸酯酶A缺乏症;I、II或III型粘多糖贮积症;过氧化物酶体生物发生障碍、泽尔韦格综合征谱系(Zellweger Syndrome Spectrum);脑内铁沉积神经变性病;酸性鞘磷脂酶缺乏症;尼曼-匹克病C型(Niemann-Pick Dis ease Type C);甘氨酸脑病;ARX相关病症;尿素循环障碍;COL1A1/2相关的成骨不全症;线粒体DNA缺失综合征;PLP1相关病症;佩里综合征(PerrySyndrome);费伦-麦克德米德综合征(Phelan-McDe rmid Syndrome);II型糖原贮积病(庞贝病(Pompe Disease))(婴儿);MAPT相关病症;MECP2相关病症;1型肢近端型点状软骨发育不良;罗伯茨综合征(Roberts Syndrome);桑德霍夫病(Sandhoff Disease);1型辛德勒病(Schindler Disease Type 1);腺苷脱氨酶缺乏症;史-李-欧综合征(Smith-Lemli-OpitzSyndrome);脊髓性肌萎缩症;婴儿期发作的脊髓小脑性共济失调;己糖胺酶A缺乏症;1型致死性骨发育不全;VI型胶原蛋白相关病症;I型乌舍尔综合征(Usher Syndrome Ty pe I);先天性肌肉萎缩症;沃尔夫·赫希霍恩综合征(Wolf-HirschhornSyndrome);溶酶体酸性脂肪酶缺乏症;以及着色性干皮病。
在其它实施方案中,本文公开的编辑系统靶向的动物遗传病症可包括但不限于髋关节发育不良、膀胱疾患、癫痫、心脏病症、退行性脊髓病、短头综合征、糖原分支酶缺乏症(GBED)、遗传性马局部皮肤无力(HERDA)、高血钾性周期性麻痹症(HYPP)、恶性高热(MH)、多糖贮积性肌病-1型(PSSM1)、交界性大疱性表皮松解症、小脑营养不良、薰衣草综合征、致命性家族性失眠症或其它动物相关遗传病症。
在本发明的一些实施方案中,核酸酶和/或gRNA序列可包括具有同源取代的序列(例如,取代和置换在本文中均用于指现有的氨基酸残基或核苷酸与替代的残基或核苷酸互换),同源取代可能发生在氨基酸的情况下,例如碱性对碱性、酸性对酸性、极性对极性等。还考虑非同源取代;例如,从一类残基到另一类残基,或者涉及包括非天然存在的氨基酸,例如鸟氨酸(以下称为Z)、二胺基丁酸鸟氨酸(以下称为B)、正亮氨酸鸟氨酸(以下称为0)、吡啶基丙氨酸、噻吩基丙氨酸、萘基丙氨酸和苯基甘氨酸。
在本文公开的某些实施方案中,工程化的核酸引导的核酸酶构建体可以识别不同于TTTN或除了TTTN之外的原间隔序列相邻基序(PAM)序列。在其它实施方案中,本文公开的工程化的核酸引导的核酸酶构建体可以进一步发生突变以提高靶向效率或可以从具有某些靶向特征的文库中选择。
本文公开的其它实施方案涉及包括本文公开的构建体的载体,用于进一步分析和选择改进的基因组编辑特征。
本文公开的其它实施方案包括用于包装和运输核酸引导的核酸酶构建体和/或本文公开的新颖gRNA或本文公开的已知gRNA的试剂盒,并且还包括至少一个容器。在某些实施方案中,可以包括试剂盒所需的几种试剂以方便容易地运输和提高效率。
在某些实施方案中,本文提供了在靶多核苷酸中的靶序列处或附近产生链断裂的方法,该方法包括使靶序列与可靶向的核酸引导的核酸酶复合物、例如工程化的可靶向的核酸引导的核酸酶复合物、例如如本文所公开的RNP接触,其中复合物的相容的引导核酸靶向靶序列,并允许可靶向的引导核酸引导的核酸酶复合物产生链断裂。靶多核苷酸可以是任何合适的靶多核苷酸,例如细胞基因组中的靶多核苷酸。靶多核苷酸可以是安全港位点。该方法还可以包括提供待插入到靶序列中的编辑模板。编辑模板可以包含任何希望在断裂处插入的合适序列;在某些实施方案中,编辑模板包含转基因。在某些实施方案中,本文提供了通过该方法产生的细胞,或通过该方法产生的生物体。
在某些实施方案中,本发明提供了包括将一种或多种多核苷酸、例如本文所述的一种或多种载体或线性多核苷酸、其一种或多种转录物和/或从其转录的一种或蛋白质递送到宿主细胞的方法。在一些方面,本发明还提供了通过这类方法产生的细胞,和包含这类细胞或由这类细胞产生的生物体。在一些实施方案中,将工程化的核酸酶与引导核酸组合(并任选形成复合物)递送到细胞。
某些实施方案提供了通过整合编辑模板多核苷酸来修饰靶多核苷酸的方法,通过工程化的核酸酶复合物将双链断裂引入基因组序列,可以使用编辑模板通过同源重组修复断裂,使得模板被整合到靶多核苷酸中。双链断裂的存在可以提高编辑模板的整合效率。
在根据本公开回顾以下实施例后,本公开另外的目标、优点和新颖特征对于本领域技术人员将变得显而易见。
包含序列表的附录A随附于此并构成本申请的一部分。
以下实施例不意图限制。
IV.实施例
包括以下实施例是为了证实本公开的优选实施方案。本领域技术人员应理解以下实施例中公开的技术表示由本发明人发现的在本公开的实践中发挥良好作用的技术,并且因此可以被认为构成本发明实践的优选模式。然而,根据本公开,本领域技术人员应理解,在不脱离本公开的精神和范围的情况下可以在已公开并仍获得类似或相似结果的特定实施方案中做出许多改变。
实施例1
在一个示例性方法中,设置选择标准以鉴定与Cas12a具有<60%AA序列相似性、与阳性对照核酸酶具有<60% AA序列相似性和>80%查询覆盖率的序列。经过几轮筛选后,鉴定出35种核酸酶并在本文中称为ART1-35以供进一步研究。表2提供了调查概述。
表2.筛选中鉴定出的ART核酸酶
/>
*核酸序列对应于尚未使用本文实施例中描述的方法优化的ART
实施例2
在一些方法中,如实施例8中所述的密码子优化在大多数情况下可以降低核苷酸序列相似性;但是,它不会改变蛋白质的氨基酸序列。对序列进行进一步的工程化,以提高核酸酶在其天然环境之外的活性。35种ART核酸酶的天然序列被工程化为包括甘氨酸、6x组氨酸和3x核定位信号标签。
这些Gly-6xHis标签出于几种原因应用,包括:1)6xHis标签可用于蛋白质纯化,以允许结合色谱柱进行纯化,以及2)N端甘氨酸允许进行其它的位点特异性的化学修饰,所述化学修饰允许进行先进的蛋白质工程。此外,Gly-6xHis被设计成用于在需要时通过烟草蚀纹病毒(TEV)蛋白酶消化来轻松去除。对于这些构建体,Gly-6xHis标签位于N端。Gly-6xHis标签在Martos-Maldonado等人,Nat Commun.(2018)17;9(1):3307中进一步描述,其公开内容并入本文中。
添加NLS(核定位信号)片段以改善向细胞核的转运。这些实施例中使用的NLS片段已成功添加到Cas9构建体中,如先前在以下中所描述:Perli等人,Science.(2016)353(6304);Ménoret等人,Sci Rep.(2015)5:14410;以及来自New England Biolabs(NEB)的Spy Cas9 NLS产品信息,其公开内容全部并入本文中。
实施例3
在另一个示例性方法中,应当理解,在某些实施方案中,CRISPR-Cas基因组编辑系统需要至少2种组分:引导RNA(gRNA)和CRISPR相关(Cas)核酸酶。引导RNA是一种特定的RNA序列,它识别感兴趣的靶向DNA区域并将Cas核酸酶引导至该区域进行编辑。gRNA可以包含两部分:引导序列,与靶DNA互补的17-29个或更长的核苷酸序列;以及支架序列,其用作Cas核酸酶的结合支架以促进编辑。在一种方法中,通过搜索ART1-ART35中每一者的起始密码子上游5000bp和终止密码子下游1000bp,找到核酸酶ART1-35的gRNA的保守序列,并使用标准方法来确定推定gRNA编码区段的保守序列。申请中的表3提供了ART1-ART35中每一者的保守DNA序列;这些序列编码相应核酸酶的gRNA保守序列,并且可以从这些序列中创建RNA序列(表3中的保守RNA序列);此外,如本领域中已知和本文其它部分所描述,部分或全部RNA序列可能会经过进一步加工,以从任一端去除一个或多个核苷酸。
实施例4
在另一个示例性方法中,在体内测试ART核酸酶的裂解效率。在大肠杆菌(大肠杆菌)中在体内测试ART核酸酶的裂解效率。在这些方法中,该测定基于大肠杆菌中的体内耗竭测定。首先,将含有表达ART核酸酶的质粒的大肠杆菌MG1655甘油原液从-80℃冰箱中取出,并将20μL细胞放入15mL管中2份4mL具有34μg/mL氯霉素(chloramphenicol)的LB(鲁利亚-贝塔尼肉汤(Luria-Bertani broth))培养基中。将细胞在30℃和200rpm下培养过夜。然后,将4mL过夜培养物放入200mL具有34μg/mL氯霉素的LB培养基中,放入2个1L烧瓶中。将细胞在30℃和200rpm下培养直至OD600达到0.5-0.6。将烧瓶放入42℃和200rpm的振荡水浴培养箱中15分钟。然后,通过手动缓慢振荡将烧瓶放入冰中并在冰中保持15分钟。之后,将细胞从烧瓶转移到50mL管中(4个管用于200mL细胞)并在8000rpm和4℃下离心5分钟以去除上清液。然后添加50mL冰冷的10%甘油进行200mL培养,并使细胞重悬。将重悬的细胞以8000rpm和4℃离心5分钟以去除上清液,并添加2mL冰冷的10%甘油。用移液管轻轻地使细胞重悬,并分成50μL感受态细胞。然后将混合物等分到72个冷却的0.1cm电穿孔比色皿(Bio-rad)中。
将含有24种gRNA和一种非靶向对照gRNA的质粒在无核酸酶的水中稀释至25ng/ul。gRNA_EC1至gRNA_EC23靶向18个靶基因座,它们是galK、lpd、accA、cynT、cynS、adhE、oppA、fabI、ldhA、pntA、pta、accD、pheA、accB、accC、aroE、aroB和aroK基因。将2μL(50ng)冷却的质粒放入电穿孔比色皿中,在1800V下进行电穿孔。然后,将950μL LB培养基添加到电穿孔比色皿中并混合,然后将细胞取出至96深孔板(Light labs)中。将具有细胞的96孔深孔板在30℃和200rpm下放置2小时。
培养2小时后,对回收的细胞进行10^0、10^1和10^2的稀释。然后,将10μL细胞放入90μL ddH2O中并用移液管混合。稀释后,从每个稀释液中取出8μL细胞,并用移液管将其放置于含有34μg/mL氯霉素和100μg/mL羧苄青霉素(carbenicillin)的LB琼脂板上,并在无盖的情况下干燥几分钟。然后将盖子放回平板上,并将平板放回30℃培养过夜。第二天,通过计数菌落数来检查结果。
使用ART1、ART2、ART5、ART6、ART8、ART9、ART10、ART11和ART11_L679F(在本文中也称为ART11*或ART11突变体)的耗竭测定结果提供于图1-9中,其中数据描绘切割效率百分比=1-(具有中靶gRNA的板上的菌落数/具有非靶gRNA的板上的菌落数)*100%。
实施例5
在另一个示例性方法中,在大肠杆菌(大肠杆菌)中在体内测试ART核酸酶的编辑效率。在这些方法中,该测定基于大肠杆菌中的体内编辑测定。首先,将含有表达ART核酸酶的质粒的大肠杆菌MG1655甘油原液从-80℃冰箱中取出,并移出20μL原液细胞并放入一个15mL管中4mL具有34μg/mL氯霉素的LB培养基中。将细胞在30℃和200rpm下培养过夜。然后,将1mL过夜培养物放入50mL具有34μg/mL氯霉素和0.2%阿拉伯糖的LB培养基中,放入500mL烧瓶中。将细胞在30℃和200rpm下培养直至OD600达到0.5-0.6。然后将烧瓶放入42℃和200rpm的振荡水浴培养箱中15分钟。然后,通过手动缓慢振荡将烧瓶放入冰中并在冰中保持15分钟。之后,将细胞从烧瓶转移到50mL管中并在8000rpm和4℃下离心5分钟以去除上清液。然后添加25mL冰冷的10%甘油进行50mL培养,并使细胞重悬。将重悬的细胞以8000rpm和4℃离心5分钟以去除上清液,并添加到0.5mL冰冷的10%甘油。用移液管轻轻地使细胞重悬,然后分成50μL感受态细胞。然后将混合物分到9个冷却的0.1cm电穿孔比色皿中。
含有3种gRNA的质粒在无核酸酶的水中稀释至25ng/ul。gRNA_EC1至gRNA_EC3靶向galK基因。将2μL(50ng)冷却的gRNA质粒和2μL(50ng)ssDNA(用作DNA修复模板)放入电穿孔比色皿中,并在1800V下进行电穿孔。然后,将950μL LB培养基添加到比色皿中并混合,然后将细胞从比色皿中取出并放入1.5mL管中。将具有细胞的管放在30℃和200rpm下2小时。
恢复后,用移液管将5μL细胞涂铺到具有34μg/mL氯霉素、100μg/mL羧苄青霉素和1%半乳糖的MacConkey琼脂板上,并使用无菌涂铺珠播散细胞。去除涂铺珠后,将盖子放回平板上,并将平板放回30℃培养过夜。第二天,使用以下等式计算编辑效率。
使用ART2的代表性编辑测定结果在图10中提供,而ART11则在图11中提供。
实施例6
在另一个示例性方法中,可以在真核细胞体内测试ART核酸酶的裂解效率。在这些方法中,测定基于体内DNA裂解测定。Jurkat细胞是一种永生化的人T淋巴细胞系,在具有10%胎牛血清(FBS)的RPMI 1640培养基中培养,并在收获用于转染之前定期分裂。在基因组Jurkat的DNA中选择两个靶基因座DNMT1和TRAC43作为靶标。核酸酶ART2和对照核酸酶在储存缓冲液中稀释(例如NaCl 300mM、磷酸钠50mM、EDTA 0.1mM、DTT 1mM和甘油10%)至20mg/mL。类似地,gRNA在无核酸酶的水中稀释至100μM。RNA-蛋白质复合物(RNP)是通过混合1μL核酸酶溶液和1.5μL gRNA溶液制备的。在室温下孵育10分钟期间,复合物在96孔V形底板中形成。
在NucleoCounter NC-200中对细胞进行计数并评估其活力。收获的细胞以100×105个细胞/毫升的浓度重悬于转染缓冲液(来自Lonza的SF细胞系96孔Nucleofector试剂盒的SF)中。将20μL该溶液添加到具有形成的RNP的孔中,通过移液来混合,并转移到96孔Nucleocuvette板(Lonza)中。细胞被电穿孔。在一些情况下,在核穿孔之前,双组分gRNA(分裂gRNA;STAR)按体积1:1混合,并在37℃下退火30分钟以形成gRNA溶液。值得注意的是,STAR gRNA是分裂gRNA,其中crRNA和tracrRNA是分开的。ART2 mRNA和gRNA(单个或STAR)在适当的核穿孔缓冲液(Lonza)中重悬后立即共同递送,并通过优化的核穿孔程序(Lonza)递送。
电穿孔后,将80μL含10% FBS的新鲜RPMI 1640培养基在电穿孔后立即添加到Nucleocuvette板中。将溶液混合,并将50μL转移到具有150μL新鲜培养基的96孔平底培养板中。细胞在收获用于DNA提取之前培养72小时。通过以1000×g离心10分钟收获细胞,并用缓冲液(PBS)洗涤。小心去除上清液,并用20μL预热的QuickExtract DNA提取溶液(Lucigen)处理细胞团块。将平板置于热循环仪(Biorad)中并进行温度处理(例如在65℃下15分钟、在68℃下15分钟、在95℃下10分钟、冷却至4℃)。通过离心收获细胞碎片,并收集含有基因组DNA的上清液。含有靶位点的DNA片段在PCR反应中进行扩增,并且DNA准备用于测序。在第二轮PCR期间,将Illumina兼容的衔接子序列和用于样品鉴定的索引序列添加到靶位点PCR产物中。将第二轮PCR产物汇集并加载到Illumina MiSeq测序仪上进行2x150双端测序。使用Crispresso2分析包确定编辑频率。
实施例7
在另一个示例性方法中,将ART核酸酶RNP引入哺乳动物细胞中进行基因编辑。
1.1细胞与培养
购买Jurkat克隆E6-1急性T细胞白血病细胞(ATCC)并根据制造商的说明在补充有10%胎牛血清(FBS,Thermo Fisher)的RPMI-1640(Thermo Fisher)中培养。所有细胞培养物均在37℃的含有5% CO2的加湿培养箱(Heracell VIOS 160i,Thermo Fisher)中生长和维持。
1.2.在哺乳动物细胞中引入ART11 RNP进行基因编辑
核糖核蛋白(RNP)是通过单个gRNA与ART11核酸酶形成复合物产生的。合成单个gRNA(IDT)并产生和纯化重组ART11(Aldevron)。使用前,将重组ART11核酸酶储存在-80℃下25mM Tris-HCl pH 7.4、300mM NaCl、0.1mM EDTA、1mM DTT和50%(v/v)甘油缓冲液中。使单个gRNA重悬在IDTE pH 7.5缓冲液(IDT)中以产生100μM原液,并在使用前储存在-80℃下。ART11核酸酶和gRNA在室温下混合10分钟以形成RNP。形成复合物后,使RNP重悬于适当的核穿孔缓冲液(例如SF缓冲液,Lonza)中,并通过优化的核穿孔程序(例如CA-137,Lonza)递送到哺乳动物细胞。
1.3收获DNA用于扩增子测序
细胞在收获用于DNA提取之前培养48小时。通过离心(200×g,5分钟)形成团块来收获细胞并用缓冲液(PBS)洗涤。小心去除上清液后,用20μL QuickExtract DNA提取溶液(Lucigen)处理细胞团块。将样品置于热循环仪中并进行温度处理(例如在65℃下15分钟、在68℃下15分钟、在95℃下10分钟,然后冷却至4C)。含有靶位点的DNA片段在PCR反应中进行扩增,并且DNA准备用于测序。在第二轮PCR期间,将Illumina兼容的衔接子序列和用于样品鉴定的索引序列添加到靶位点PCR产物中。将第二轮PCR产物汇集并加载到IlluminaMiSeq测序仪上进行2x150双端测序。使用Crispresso2分析包确定编辑频率。结果在图14中示出。
实施例8
在另一个示例性方法中,本文公开的非天然存在的核酸序列的密码子优化使用密码子优化工具(Integrated DNA technologies)。在这种方法中,从“生物体”栏选择一种生物体来表达核酸酶以用于广泛的应用,例如细菌(例如,大肠杆菌K12)、酵母(例如,酿酒酵母)或多细胞真核生物(例如,智人(人))。然后将DNA碱基或氨基酸序列加载到密码子优化工具的空白框中。然后优化序列。生成的DNA序列针对细菌(例如,大肠杆菌K12)、酵母(例如,酿酒酵母)或多细胞真核生物(例如,智人(人))进行密码子优化。
本文公开的非天然存在的核酸序列的实例包括针对在细菌如大肠杆菌中表达而密码子优化的ART2序列(例如,SEQ ID NO:6)、针对在酵母如酿酒酵母中表达而密码子优化的序列(例如,SEQ ID NO:7)、针对在多细胞真核生物例如智人(人)中表达而密码子优化的序列(例如,SEQ ID NO:8)。这类非天然存在的核酸序列被扩增、克隆、装配、合成、从合成的寡核苷酸或dNTP产生,或者使用本领域技术人员已知的方法以其它方式获得。密码子优化的核酸酶已用于通过从细胞系中的质粒表达来编辑细胞系,或在蛋白质生产细胞系中高水平表达,随后纯化用于RNP编辑。
实施例9
在另一个示例性方法中,将超过一种ART核酸酶RNP引入哺乳动物细胞中进行基因编辑。核糖核蛋白(RNP)是通过单个gRNA或STAR gRNA与每种ART核酸酶形成复合物产生的,多种ART核酸酶RNP的混合物用于转染。类似于实施例6,合成单个或STAR gRNA并产生和纯化重组ART。然后在使用前,将重组ART核酸酶储存在-80℃下25mM Tris-HCl pH 7.4、300mMNaCl、0.1mM EDTA、1mM DTT和50%(v/v)甘油缓冲液中。使单个gRNA或STAR gRNA重悬在IDTE缓冲液(10mM Tris、0.1mM EDTA)pH 7.5缓冲液中以产生100μM原液,并在使用前储存在-80℃下。就在核穿孔之前,重组ART在由20mM HEPES和150mM KCl pH 7.5组成的工作缓冲液中稀释,并且gRNA用IDTE pH 7.5缓冲液稀释到最终工作浓度(如果是STAR,则首先退火,请参见第1.4节)。稀释ART核酸酶和gRNA后,在37℃下两者按体积1:1(gRNA与核酸酶的比率为2:1)混合10分钟以形成RNP。形成复合物后,使RNP重悬在适当的核穿孔缓冲液(Lonza)中,并通过优化的核穿孔仪程序(Lonza)进行递送。
实施例10
在另一个示例性方法中,将ART核酸酶与超过一种gRNA组合以构建多路复用的多靶标RNP,并将其引入哺乳动物细胞中进行基因编辑。核糖核蛋白(RNP)是通过将靶向基因组内不同位点的超过一种单个或STAR gRNA与单个ART核酸酶或超过一种ART核酸酶形成复合物而产生的。类似于实施例6,合成单个或STAR gRNA并产生和纯化重组ART。然后在使用前,将重组ART核酸酶储存在-80℃下25mM Tris-HCl pH 7.4、300mM NaCl、0.1mM EDTA、1mMDTT和50%(v/v)甘油缓冲液中。使单个gRNA或STAR gRNA重悬在IDTE缓冲液(10mM Tris、0.1mM EDTA)pH 7.5缓冲液中以产生100μM原液,并在使用前储存在-80℃下。就在核穿孔之前,重组ART在由20mM HEPES和150mM KCl pH 7.5组成的工作缓冲液中稀释,并且gRNA用IDTE pH 7.5缓冲液稀释到最终工作浓度(如果是STAR,则首先退火,请参见第1.4节)。稀释ART核酸酶和gRNA后,在37℃下两者按体积1:1(gRNA与核酸酶的比率为2:1)混合10分钟以形成RNP。形成复合物后,使RNP重悬在适当的核穿孔缓冲液(Lonza)中,并通过优化的核穿孔仪程序(Lonza)进行递送。
实施例11
在另一个示例性方法中,将ART核酸酶RNP引入哺乳动物细胞中进行基因编辑,其中使用多核苷酸DNA修复模板进行靶基因组的定向修复或编辑。核糖核蛋白(RNP)是通过将单个或STAR gRNA与ART核酸酶形成复合物产生的,并将大小范围为20bp至20kbp的多核苷酸DNA修复模板添加到RNP中。类似于实施例6,合成单个或STAR gRNA并产生和纯化重组ART。然后在使用前,将重组ART核酸酶储存在-80℃下25mM Tris-HCl pH 7.4、300mM NaCl、0.1mM EDTA、1mM DTT和50%(v/v)甘油缓冲液中。多核苷酸DNA模板由含有源DNA材料的质粒原液合成,或者是商业合成的合成DNA材料(IDT,Genewiz)。DNA模板是单链DNA(ssDNA)或双链DNA(dsDNA),并且具有同源臂,使插入或编辑区域靠近gRNA切割位点。使单个或STARgRNA重悬在IDTE缓冲液(10mM Tris、0.1mM EDTA)pH 7.5缓冲液中以产生100μM原液,并在使用前储存在-80℃下。就在核穿孔之前,重组ART在由20mM HEPES和150mM KCl pH 7.5组成的工作缓冲液中稀释,并且gRNA用IDTE pH 7.5缓冲液稀释到最终工作浓度(如果是STAR,则首先退火,请参见第1.4节)。稀释ART核酸酶和gRNA后,在37℃下两者按体积1:1(gRNA与核酸酶的比率为2:1)混合10分钟并将DNA模板以优化的浓度添加以形成RNP。形成复合物后,使RNP重悬在适当的核穿孔缓冲液(例如Lonza)中,并通过优化的核穿孔仪程序(Lonza)进行递送。
实施例12
在另一个示例性方法中,将ART核酸酶RNP引入哺乳动物细胞中进行基因编辑,其中使用多核苷酸DNA修复模板的混合物多路进行靶基因组的定向修复或编辑。核糖核蛋白(RNP)是通过将单个或STAR gRNA与ART核酸酶形成复合物产生的,并将大小范围为20bp至20kbp的多核苷酸DNA修复模板之混合物添加到RNP中。类似于实施例6,合成单个或STARgRNA并产生和纯化重组ART。在使用前,将重组ART核酸酶储存在-80℃下25mM Tris-HCl pH7.4、300mM NaCl、0.1mM EDTA、1mM DTT和50%(v/v)甘油缓冲液中。多核苷酸DNA模板由含有源DNA材料的质粒原液合成,或者是商业合成的合成DNA材料(IDT,Genewiz)。DNA模板是单链DNA(ssDNA)或双链DNA(dsDNA),并且具有同源臂,使插入或编辑区域靠近gRNA切割位点。使单个或STAR gRNA重悬在IDTE缓冲液(10mM Tris、0.1mM EDTA)pH 7.5缓冲液中以产生100μM原液,并在使用前储存在-80℃下。就在核穿孔之前,重组ART在由20mM HEPES和150mM KCl pH 7.5组成的工作缓冲液中稀释,并且gRNA用IDTE pH 7.5缓冲液稀释到最终工作浓度(如果是STAR,则首先退火,请参见第1.4节)。稀释ART核酸酶和gRNA后,在37℃下两者按体积1:1(gRNA与核酸酶的比率为2:1)混合10分钟并将DNA模板以优化的浓度添加以形成RNP。形成复合物后,使RNP重悬在适当的核穿孔缓冲液(例如Lonza)中,并通过优化的核穿孔仪程序(Lonza)进行递送。
实施例13
在本实施例中,评估本文公开的代表性核酸酶的PAM序列。
将含有表达ART核酸酶的质粒的大肠杆菌MG1655甘油原液从-80℃冰箱中取出,并使用100μL细胞原液接种15mL管中4mL含有34mg/mL氯霉素的LB培养基中。将细胞在30℃和200rpm的振荡培养箱中培养过夜(12-16小时)。生长过夜后,将1mL过夜细胞培养物添加到250mL烧瓶中25mL含有34mg/mL氯霉素的LB培养基中。将细胞在振荡培养箱中在30℃和200rpm下培养直至OD600达到0.5-0.6。将细胞从烧瓶转移到50mL管中并在8000rpm和4℃下离心5分钟以去除上清液。然后添加25mL冰冷的10%甘油,并使细胞重悬。将重悬的细胞以8000rpm和4℃离心5分钟以去除上清液,并添加2mL冰冷的10%甘油。用移液管轻轻地使细胞重悬,并分成50μL等份试样的感受态细胞。
通过将50μL准备好的感受态细胞转移到冰上0.1cm间隙的电穿孔比色皿中,准备电穿孔。将200ng的PAM质粒文库(携带具有可变PAM序列的中靶位点)添加到电穿孔比色皿中,并在1800V下进行电穿孔。添加950μL Super Optimal Broth(SOB)培养基,轻轻混合并将整个体积转移到1.5mL管。在30℃和200rpm下孵育2小时。将细胞从每个管转移到含有4mL具有34mg/mL氯霉素和50mg/mL卡那霉素(Carbenicillin)的LB培养基的另一个15mL塑料管中,并孵育过夜。对于每种培养物,将1mL的过夜细胞培养物添加到含有25mL具有34mg/mL氯霉素的LB培养基的250mL烧瓶中,在30℃和200rpm的振荡培养箱中孵育,直到OD600达到0.5-0.6。将烧瓶放入42℃和200rpm的振荡水浴培养箱中15分钟。然后,通过手动缓慢振荡将烧瓶放入冰中并在冰中保持15分钟。将细胞从烧瓶转移到50mL管中并在8000rpm和4℃下离心5分钟以去除上清液。然后添加25mL冰冷的10%甘油,并使细胞重悬。将重悬的细胞以8000rpm和4℃离心5分钟以去除上清液,并添加2mL冰冷的10%甘油。用移液管轻轻地使细胞重悬,并分成50μL等份试样的感受态细胞。
通过将50μL准备好的感受态细胞转移到冰上0.1cm间隙的电穿孔比色皿中来准备新一轮的电穿孔。添加100μg的非靶向对照或中靶gRNA质粒中的一者,并在1800V下进行电穿孔。添加950μL SOB培养基,轻轻混合并将整个体积转移到1.5mL管。在30℃和200rpm下孵育2小时。将回收的细胞的等份试样涂铺到含有50mg/mL卡那霉素和100mg/mL卡那霉素的LB琼脂平板上,并在30°下孵育过夜。收获细胞并纯化质粒。将质粒用作PCR反应的模板DNA,引物为miniseq_galKOFF_T225-F2(TCGTCGGCAGCGTCAGA TGTGTATA AGAGACAGcgtaccctggttggcagcgaatac)(SEQ ID NO:326)和miniseq_galKOFF_T225-R2(GTCTCGTGGGCTCGGAGATGTGTAT AAGAGACAGacgcacgcgttttgccacgatc)(SEQ ID NO:327)。在第二轮PCR期间,将Illumina兼容的衔接子序列和用于样品鉴定的索引序列添加到PCR产物中。将第二轮PCR产物汇集并加载到Illu mina MiSeq测序仪上进行2x150双端测序。
使用VSEARCH工具将NGS数据与参考PAM文库模板比对。比对的阈值是0.9。pandas程序用于过滤比对的数据。数据的阈值是100%。使用以下公式计算每个PAM的归一化读数,其中PAM命中是运行pandas后PAM命中的总和,总命中是运行VSEARCH之前的总命中:
使用以下公式计算富集,其中归一化读数y表示非靶向对照实验中每个PAM的归一化读数,归一化读数x表示中靶gRNA实验中每个PAM的归一化读数:
ART11的PAM位点的最高命中结果显示在图11中。ART11_L679F的PAM位点的最高命中结果显示在图13中。
实施例14
本实施例描述了用于开发突变核酸酶ART11_L679F的定点诱变(SDM)
定点诱变(SDM)的引物设计
使用NEB SDM试剂盒进行指数扩增(PCR)
使用pSC-ART11从ART11进行PCR扩增
b.在1%琼脂糖凝胶中在120v下使5ul PCR产物跑胶30分钟
激酶、连接酶和DpnI(KLD)处理
装配以下试剂:
体积
PCR产物 1μl
2X KLD反应缓冲液 5μl
10X KLD酶混合物 1μl
无核酸酶的水 3μl
通过上下移液混匀并在室温下孵育30分钟。
转化
1.在冰上解冻一管NEB 5-α感受态大肠杆菌细胞。
2.将5μl来自步骤II的KLD混合物添加到解冻细胞的管中。小心轻弹管4-5次以混合。不要涡旋。
3.将混合物置于冰上30分钟。
4. 42℃热激30秒。
5.置于冰上5分钟。
6.将950μl室温SOC移液到混合物中。
7.在30℃下振荡孵育2小时(200rpm)。
8.轻弹管并倒置以彻底混匀细胞,然后将10μl和100μl铺到选择板上并在30℃下孵育过夜。
9.挑取部分菌落进行桑格测序(sanger sequencing),找出正确的质粒。
出于所有目的,附录A以引用的方式整体并入本文中。
出于说明和描述的目的,已经呈现了本公开的前面论述。前述内容并非旨在将本公开内容限制为本文公开的一种或多种形式。尽管本公开的描述已经包括对一个或多个实施方案的描述以及某些变化和修改,但是在理解本公开之后,例如在本领域技术人员的技能和知识之内,其它变化和修改也在本公开的范围内。旨在获得包括在允许范围内的替代实施方案的权利,包括对所要求的结构、功能、范围或步骤可替代的、可互换的和/或等同的结构、功能、范围或步骤,无论这种替代的、可互换的和/或等同的结构、功能、范围或步骤在本文中是否公开,并且不打算公开奉献任何可授予专利的主题。
尽管本文已示出并描述了本发明的优选实施方案,但对于本领域技术人员来说将显而易见的是,这类实施方案仅作为实例提供。在不偏离本发明下本领域技术人员现在将想到许多变化、改变和替换。应当理解的是,可以在实践本发明时采用在本文中描述的本发明的实施方案的各种替代方案。意图以下权利要求界定本发明的范围以及由此涵盖这些权利要求和其等同物范围内的方法和结构。
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
附录A
/>

Claims (46)

1.一种组合物,所述组合物包含
(i)工程化的核酸引导的核酸酶,所述工程化的核酸引导的核酸酶包括包含与SEQ IDNO:143-177和229中的任一者具有至少60%序列同一性的氨基酸序列的工程化的核酸酶多肽,或编码与SEQ ID NO:143-177和229中的任一者具有至少60%序列同一性的氨基酸序列的一种多核苷酸或多种多核苷酸。
2.如权利要求1所述的组合物,所述组合物包括包含与SEQ ID NO:144、153和229中的任一者具有至少60%序列同一性的氨基酸序列的工程化的核酸酶多肽,或编码与SEQ IDNO:144、153和229中的任一者具有至少60%序列同一性的氨基酸序列的一种多核苷酸或多种多核苷酸。
3.如权利要求1或2所述的组合物,所述组合物包括包含与SEQ ID NO:144具有至少60%序列同一性的氨基酸序列的工程化的核酸酶多肽或编码与SEQ ID NO:144具有至少60%序列同一性的氨基酸序列的一种多核苷酸或多种多核苷酸。
4.如任一前述权利要求所述的组合物,所述组合物包括包含与SEQ ID NO:153具有至少60%序列同一性的氨基酸序列的工程化的核酸酶多肽或编码与SEQ ID NO:153具有至少60%序列同一性的氨基酸序列的一种多核苷酸或多种多核苷酸。
5.如任一前述权利要求所述的组合物,所述组合物包括包含与SEQ ID NO:229具有至少60%序列同一性的氨基酸序列的工程化的核酸酶多肽或编码与SEQ ID NO:229具有至少60%序列同一性的氨基酸序列的一种多核苷酸或多种多核苷酸。
6.如任一前述权利要求所述的组合物,其中所述序列同一性为至少80%。
7.如任一前述权利要求所述的组合物,其中所述序列同一性为至少95%。
8.如任一前述权利要求所述的组合物,其中所述序列同一性为100%。
9.如权利要求1所述的组合物,其中所述工程化的核酸酶多肽不含肽基序YLFQIYNKDF(SEQ ID NO.224)或编码不含肽基序YLFQIYNKDF(SEQ ID NO.224)的所述工程化的核酸酶多肽的一种多核苷酸或多种多核苷酸。
10.如权利要求9所述的组合物,所述组合物包含与SEQ ID NO:143-151、161-163、165、166、169、171-175、177和229中的任一者具有至少60%序列同一性的氨基酸序列或编码与SEQ ID NO:143-151、161-163、165、166、169、171-175、177和229中的任一者具有至少60%序列同一性的氨基酸序列的一种多核苷酸或多种多核苷酸。
11.如权利要求10所述的组合物,所述组合物包含与SEQ ID NO:149、151、175和177中的任一者具有至少60%序列同一性的氨基酸序列或编码与SEQ ID NO:149、151、175和177中的任一者具有至少60%序列同一性的氨基酸序列的一种多核苷酸或多种多核苷酸。
12.一种组合物,所述组合物包含可靶向的引导核酸引导的核酸酶复合物,所述核酸酶复合物包含任一前述权利要求的工程化的核酸引导的核酸酶并且还包含
(ii)相容的引导核酸。
13.如权利要求12所述的组合物,其中所述引导核酸是gRNA并且所述复合物是RNP。
14.如权利要求12或13所述的组合物,其中所述引导核酸是分裂引导核酸。
15.如权利要求13或14所述的组合物,其中所述gRNA是工程化的gRNA。
16.如权利要求15所述的组合物,其中所述工程化的gRNA包含保守gRNA。
17.如权利要求16所述的组合物,其中所述保守gRNA包含SEQ ID NO:291-325中的任一者,或其一部分。
18.如权利要求17所述的组合物,其中所述保守gRNA包含SEQ ID NO:291-325中的任一者的一部分。
19.如权利要求18所述的组合物,其中所述部分是包含所述RNA的二级结构的核苷酸序列的高度保守部分。
20.如权利要求18所述的组合物,其中所述二级结构包含假结。
21.如权利要求13至20中任一项所述的组合物,其中所述gRNA是合成gRNA。
22.如权利要求21所述的组合物,其中所述gRNA包含一种或多种化学修饰。
23.一种在靶多核苷酸中的靶序列处或附近产生链断裂的方法,所述方法包括使所述靶序列与权利要求12-22中任一项的可靶向的核酸引导的核酸酶复合物接触,其中所述复合物的所述相容的引导核酸靶向所述靶序列,并允许所述可靶向的引导核酸引导的核酸酶复合物产生所述链断裂。
24.如权利要求23所述的方法,其中所述靶多核苷酸是在细胞基因组中。
25.如权利要求23或24所述的方法,所述方法还包括提供待插入到所述靶序列中的编辑模板。
26.如权利要求25所述的方法,其中所述编辑模板包含转基因。
27.如权利要求23-27中任一项所述的方法,其中所述靶多核苷酸是安全港位点。
28.一种细胞,所述细胞由如权利要求23所述的方法产生。
29.一种生物体,所述生物体由如权利要求23所述的方法产生。
30.一种组合物,所述组合物包含一种工程化的多核苷酸或多种工程化的多核苷酸,所述工程化的多核苷酸包括包含对应于与SEQ ID NO:1-142和225-228中的任一者具有至少60%序列同一性的序列的序列的一种或多种多核苷酸。
31.如权利要求30所述的组合物,所述组合物包括包含对应于与SEQ ID NO:1、5、11、15、19、23、27、31、35、39、43、47、51、55、59、63、67、71、75、79、83、87、91、95、99、103、107、111、115、119、123、127、131、135、139和225中的任一者具有至少60%序列同一性的序列的序列的一种或多种多核苷酸。
32.如权利要求30或31所述的组合物,其中所述多核苷酸在由所述多核苷酸编码的多肽的N端、C端或两者处编码一种或多种另外的氨基酸序列。
33.如权利要求32所述的组合物,其中所述另外的氨基酸序列包含以下中的至少一者:
(i)一种或多种NLS;
(ii)一种或多种纯化标签;
(iii)一种或多种裂解序列;以及
(iv)FLAG或3XFLAG
34.如权利要求32所述的组合物,其中所述另外的氨基酸序列包含以下中的至少两者:
(i)一种或多种NLS;
(ii)一种或多种纯化标签;
(iii)一种或多种裂解序列;以及
(iv)FLAG或3XFLAG
35.如权利要求32所述的组合物,其中所述另外的氨基酸序列包含以下中的至少三者:
(i)一种或多种NLS;
(ii)一种或多种纯化标签;
(iii)一种或多种裂解序列;以及
(iv)FLAG或3XFLAG
36.如权利要求32所述的组合物,其中所述另外的氨基酸序列包含
(i)一种或多种NLS;
(ii)一种或多种纯化标签;
(iii)一种或多种裂解序列;以及
(iv)FLAG或3XFLAG
37.如权利要求30-36中任一项所述的组合物,其中所述一种多核苷酸或多种多核苷酸进行密码子优化。
38.如权利要求37所述的组合物,其中所述一种多核苷酸或多种多核苷酸针对大肠杆菌进行密码子优化。
39.如权利要求39所述的组合物,所述组合物包括包含对应于与SEQ ID NO:2、6、12、16、20、24、28、32、36、40、44、48、52、56、60、64、68、72、76、80、84、88、92、96、100、104、108、112、116、120、124、128、132、136、140、226和330中的任一者具有至少60%序列同一性的序列的序列的一种或多种多核苷酸。
40.如权利要求37所述的组合物,其中所述一种多核苷酸或多种多核苷酸针对酿酒酵母进行密码子优化。
41.如权利要求40所述的组合物,所述组合物包括包含对应于与SEQ ID NO:3、7、9、13、17、21、25、29、33、37、41、45、49、53、57、61、65、69、73、77、81、85、89、93、97、101、105、109、113、117、121、125、129、133、137、141和227中的任一者具有至少60%序列同一性的序列的序列的一种或多种多核苷酸。
42.如权利要求37所述的组合物,其中所述一种多核苷酸或多种多核苷酸针对人进行密码子优化。
43.如权利要求42所述的组合物,所述组合物包括包含对应于与SEQ ID NO:3、7、9、13、17、21、25、29、33、37、41、45、49、53、57、61、65、69、73、77、81、85、89、93、97、101、105、109、113、117、121、125、129、133、137、141和227中的任一者具有至少60%序列同一性的序列的序列的一种或多种多核苷酸。
44.如权利要求30-43中任一项所述的组合物,其中所述序列同一性为至少80%。
45.如权利要求30-43中任一项所述的组合物,其中所述序列同一性为至少95%。
46.如权利要求30-43中任一项所述的组合物,其中所述序列同一性为100%。
CN202180076806.7A 2020-09-18 2021-09-20 用于高效和特异性基因组编辑的构建体和其用途 Pending CN116457462A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US63/080,552 2020-09-18
US202163185315P 2021-05-06 2021-05-06
US63/185,315 2021-05-06
PCT/US2021/051142 WO2022061247A2 (en) 2020-09-18 2021-09-20 Constructs and uses thereof for efficient and specific genome editing

Publications (1)

Publication Number Publication Date
CN116457462A true CN116457462A (zh) 2023-07-18

Family

ID=87120618

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180076806.7A Pending CN116457462A (zh) 2020-09-18 2021-09-20 用于高效和特异性基因组编辑的构建体和其用途

Country Status (1)

Country Link
CN (1) CN116457462A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117051102A (zh) * 2023-10-12 2023-11-14 上海爱谱蒂康生物科技有限公司 生物标志物组合在制备预测帕金森病的产品中的应用

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117051102A (zh) * 2023-10-12 2023-11-14 上海爱谱蒂康生物科技有限公司 生物标志物组合在制备预测帕金森病的产品中的应用
CN117051102B (zh) * 2023-10-12 2024-01-26 上海爱谱蒂康生物科技有限公司 生物标志物组合在制备预测帕金森病的产品中的应用

Similar Documents

Publication Publication Date Title
US20210108196A1 (en) Functional genomics using crispr-cas systems, compositions, methods, screens and applications thereof
AU2016244241B2 (en) Engineering of systems, methods and optimized guide compositions for sequence manipulation
EP2940140B1 (en) Engineering of systems, methods and optimized guide compositions for sequence manipulation
EP3180426B1 (en) Genome editing using cas9 nickases
ES2576126T3 (es) Modificación por tecnología genética y optimización de sistemas, métodos y composiciones enzimáticas mejorados para la manipulación de secuencias
EP3011030B1 (en) Optimized crispr-cas double nickase systems, methods and compositions for sequence manipulation
EP2931898B1 (en) Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains
US20150203872A1 (en) Crispr-cas systems and methods for altering expression of gene products
US20230357796A1 (en) Constructs, compositions and methods thereof having improved genome editing efficiency and specificity
US20230323405A1 (en) Constructs and uses thereof for efficient and specific genome editing
CN116457462A (zh) 用于高效和特异性基因组编辑的构建体和其用途
RU2796017C2 (ru) Конструирование систем, способы и оптимизированные направляющие композиции для манипуляции с последовательностями

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination