CN116096878A - 在非经典tttt前间区序列邻近基序处具有增强的切割活性的毛螺菌科菌种cas12a突变体 - Google Patents

在非经典tttt前间区序列邻近基序处具有增强的切割活性的毛螺菌科菌种cas12a突变体 Download PDF

Info

Publication number
CN116096878A
CN116096878A CN202180044477.8A CN202180044477A CN116096878A CN 116096878 A CN116096878 A CN 116096878A CN 202180044477 A CN202180044477 A CN 202180044477A CN 116096878 A CN116096878 A CN 116096878A
Authority
CN
China
Prior art keywords
seq
lbcas12a
polypeptide
mutant
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180044477.8A
Other languages
English (en)
Inventor
张黎旸
克里斯托弗·安东尼·瓦库尔斯卡斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Integrated DNA Technologies Inc
Original Assignee
Integrated DNA Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Integrated DNA Technologies Inc filed Critical Integrated DNA Technologies Inc
Publication of CN116096878A publication Critical patent/CN116096878A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本文描述了来自于毛螺菌科(Lachnospiraceae)细菌的CAS12A突变体及其使用方法。这些突变体与野生型酶相比在非经典TTTT前间区序列邻近基序(PAM)处具有增强的DNA切割活性。

Description

在非经典TTTT前间区序列邻近基序处具有增强的切割活性的毛螺菌科菌种CAS12A突变体
与相关申请的交叉引用
本申请要求2020年5月1日提交的美国临时专利申请号63/018,592和2020年10月13日提交的63/090,912的优先权,每个所述临时专利申请的内容整体通过参考并入本文。本申请涉及2020年2月21日提交的国际申请号PCT/US2020/019168,其在2020年8月27日作为国际专利申请号WO 202/0172502 A1公布,并整体通过参考并入本文。
对序列表的参考
根据37C.F.R.§1.821(c),本申请与计算机可读形式的序列表一起提交。所述通过EFS提交的文本文件“013670-9067-WO01_sequence_listing_27-APR-2021_ST25.txt”于2021年4月27日创建,含有5320个序列,文件大小为30.2兆字节,并整体通过参考并入本文。
技术领域
本文描述了来自于毛螺菌科(Lachnospiraceae)细菌的Cas12a突变体及其使用方法。这些突变体与野生型酶相比在非经典TTTT前间区序列邻近基序(PAM)处具有增强的DNA切割活性。
背景技术
LbCas12a是一种RNA指导的核酸内切酶,来自于毛螺菌科(Lachnospiraceae)细菌ND2006(Lb)菌种的簇集规则间隔短回文重复序列(CRISPR)适应性免疫系统。参见Zetsche等,Cell 163:759-771(2015)。Cas12a核酸酶被分类为2类V型CRISPR系统,其在与CRISPRRNA(crRNA)复合时提供具有5-核苷酸5′-突出端的交错的DNA双链断裂。所述LbCas12a:crRNA复合体被称为CRISPR核糖核蛋白(RNP)复合体。
Cas12a被靶位点特异性的21-24个核苷酸的向导RNA(gRNA)引导到互补的21-24个核苷酸的DNA靶序列,或通常被称为前间区序列。所述Cas12a-gRNA RNP复合体介导双链DNA断裂(DSB),其然后通过非同源末端连接(NHEJ,通常在切割位点处引入突变或插入缺失)或在存在适合的模板核酸的情况下用于精确编辑的同源指导的修复(HDR)系统修复。
LbCas12a对正确DNA靶的识别需要crRNA和经典的“TTTV”前间区序列邻近基序(PAM)两者,其是紧靠前间区序列上游的4-bp序列,与来自于酿脓链球菌(Streptococcuspyogenes)的Cas9的2-bp NGG PAM形成对比。参见Jinek等,Science 337:816-821(2012)。Cas12a扩展了基因组编辑中的可靶向位点,特别是覆盖了不可被Cas9系统接近的富含T的位点。尽管基因组上Cas12a的可靶向位点的出现频率低于Cas9,但由于在环境温度(20-30℃)下具有编辑活性,LbCas12a在植物基因组工程中获得了极大普及。提高LbCas12a的切割活性和相关基因组编辑效率将极大地促进具有增强特性的农产品的开发。
希望通过蛋白质诱变增强LbCas12a的靶上活性来进一步提高它的实用性。以前已进行了研究以提高来自于氨基酸球菌属菌种(Acidaminococcus sp.)的Cas12a(也被称为AsCas12a)的实用性。参见通过参考并入本文的美国专利申请公布号US 2020/0109382 A1。然而,将在AsCas12a中鉴定到的有益突变转移到LbCas12a多肽序列中并不简单。尽管在这两种同源Cas12a酶之间存在显著的结构和序列相似性,但大多数提高AsCas12a活性的点突变对LbCas12a有害。参见Schindele和Puchta,Plant Biotechnol.J.18(5):1118-1120(2020)。
需要新的LbCas12a突变体以增强这种酶在非经典TTTT前间区序列邻近基序处的活性,特别是在人类细胞中。
发明内容
本文描述的一个实施方式是一种分离的突变体LbCas12a多肽,其包含引入到SEQID NO:2的野生型LbCas12a多肽序列中的至少一个氨基酸替换,条件是所述突变体LbCas12a多肽与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。在一种情况下,所述突变体LbCas12a多肽与选自SEQ IDNO:4-4022的偶数编号序列的多肽序列具有95%至99%同一性。在另一种情况下,所述突变体LbCas12a多肽具有选自SEQ ID NO:4-4022的偶数编号序列的多肽序列。在另一种情况下,所述突变体LbCas12a多肽包含在SEQ ID NO:2的野生型LbCas12a多肽序列的第81、125、145、146、152、182、396、478、491、582、595、606、646、665、795、799、814、839、841、858、860、890、898、909、913、981、1020、1083或1121位处的至少一个氨基酸替换。在另一种情况下,所述突变体LbCas12a多肽包含选自SEQ ID NO:2的野生型LbCas12a多肽序列的F81E、E125K、N145R、G146R、T152K、R182V、S396D、K478R、V491D、N582R、K595R、Y606F、Y646H、D665N、E795Q、P799V、T814G、L839F、I841A、E858V、I860R、W890A、E898N、H909K、E913R、E981V、S1020E、V1083W或K1121D的至少一个氨基酸替换。在另一种情况下,所述突变体LbCas12a多肽选自:F81E,SEQ ID NO:802;E125K,SEQ ID NO:428;N145R,SEQ ID NO:2902;G146R,SEQID NO:156;T152K,SEQ ID NO:694;R182V,SEQ ID NO:98;S396D,SEQ ID NO:108;K478R,SEQ ID NO:134;V491D,SEQ ID NO:954;N582R,SEQ ID NO:1730;K595R,SEQ ID NO:184;Y606F,SEQ ID NO:642;Y646H,SEQ ID NO:720;D665N,SEQ ID NO:1014;E795Q,SEQ ID NO:930;P799V,SEQ ID NO:706;T814G,SEQ ID NO:162;L839F,SEQ ID NO:834;I841A,SEQ IDNO:988;E858V,SEQ ID NO:114;I860R,SEQ ID NO:250;W890A,SEQ ID NO:3958;E898N,SEQID NO:48;H909K,SEQ ID NO:70;E913R,SEQ ID NO:1960;E981V,SEQ ID NO:880;S1020E,SEQ ID NO:532;V1083W,SEQ ID NO:132;或K1121D,SEQ ID NO:598。在另一种情况下,所述突变体LbCas12a多肽包含选自下述的替换突变:(a)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自下述位置的单个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121;或(b)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自至少两个下述位置的多个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121。在另一种情况下,所述多个替换突变包括E88A/E795Q、E125K/E795Q、G146R/E795Q、R182V/E795Q、V491D/E795Q、Q529I/E795Q、Y646H/E795Q、D665N/E795Q、T814K/E795Q、L839F/E795Q、Q906F/E795Q、E795Q/Q1170D、G146R/R182V/E795Q、G146R/E795Q/D665N、G146R/E795Q/E981V、G146R/E795Q/T814K、G146R/R182V/D665N、E125K/R182V/E981V、R182V/P799V/E981V、R182V/T814K/E981V、G146R/P799V/E981V、G146R/R182V/E795Q/F81E、G146R/R182V/E795Q/E125K、G146R/R182V/E795Q/E125A、G146R/R182V/E795Q/P799V、G146R/R182V/E795Q/T814K、G146R/R182V/E795Q/E981V、G146R/R182V/E795Q/D665N、G146R/R182V/P799V/E981V、E125K/G146R/R182V/E795Q/D665N、G146R/R182V/E795Q/P799V/T814K或E125K/G146R/R182V/E795Q/D665N/E981V。在另一种情况下,所述多个替换突变包括E88A/E795Q、E125K/E795Q、G146R/E795Q、R182V/E795Q、V491D/E795Q、Q529I/E795Q、Y646H/E795Q、D665N/E795Q、T814K/E795Q、L839F/E795Q、Q906F/E795Q、E795Q/Q1170D、G146R/R182V/E795Q、G146R/E795Q/D665N、G146R/E795Q/E981V、G146R/E795Q/T814K、G146R/R182V/D665N、E125K/R182V/E981V、R182V/P799V/E981V、R182V/T814K/E981V、G146R/P799V/E981V、G146R/R182V/E795Q/F81E、G146R/R182V/E795Q/E125K、G146R/R182V/E795Q/E125A、G146R/R182V/E795Q/P799V、G146R/R182V/E795Q/T814K、G146R/R182V/E795Q/E981V、G146R/R182V/E795Q/D665N、G146R/R182V/P799V/E981V、E125K/G146R/R182V/E795Q/D665N或G146R/R182V/E795Q/P799V/T814K,并且与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。在另一种情况下,所述突变体LbCas12a多肽选自SEQ ID NO:802、428、2902、156、694、98、954、134、1730、642、720、1014、930、706、834、988、114、250、3958、48、70、1960、880、532、598、3960、3962、3964、3966、3968、3970、3972、3974、3976、3978、3980、3982、3984、3986、3988、3990、3992、3994、3996、3998、4000、4002、4004、4006、4008、4010、4012、4014、4016、4018、4020或4022。在另一种情况下,所述突变体LbCas12a多肽选自F81E(SEQ ID NO:802)、E125K(SEQ ID NO:428)、N145R(SEQ ID NO:2902)、G146R(SEQ ID NO:156)、T152K(SEQ ID NO:694)、R182V(SEQ ID NO:98)、V491D(SEQID NO:954)、K478R(SEQ ID NO:134)、N582R(SEQ ID NO:1730)、D665N(SEQ ID NO:1014)、E795Q(SEQ ID NO:930)、P799V(SEQ ID NO:706)、E858V(SEQ ID NO:114)、I860R(SEQ IDNO:250)、E913R(SEQ ID NO:1960)、E981V(SEQ ID NO:880)、E88A/E795Q(SEQ ID NO:3960)、E125K/E795Q(SEQ ID NO:3962)、G146R/E795Q(SEQ ID NO:3964)、R182V/E795Q(SEQID NO:3966)、V491D/E795Q(SEQ ID NO:3968)、Q529I/E795Q(SEQ ID NO:3970)、Y646H/E795Q(SEQ ID NO:3972)、D665N/E795Q(SEQ ID NO:3974)、T814K/E795Q(SEQ ID NO:3976)、L839F/E795Q(SEQ ID NO:3978)、Q906F/E795Q(SEQ ID NO:3980)、E795Q/Q1170D(SEQ ID NO:3982)、G146R/R182V/E795Q(SEQ ID NO:3984)、G146R/E795Q/D665N(SEQ IDNO:3986)、G146R/E795Q/E981V(SEQ ID NO:3988)、G146R/E795Q/T814K(SEQ ID NO:3990)、G146R/R182V/D665N(SEQ ID NO:3992)、E125K/R182V/E981V(SEQ ID NO:3994)、R182V/P799V/E981V(SEQ ID NO:3996)、R182V/T814K/E981V(SEQ ID NO:3998)、G146R/P799V/E981V(SEQ ID NO:4000)、G146R/R182V/E795Q/F81E(SEQ ID NO:4002)、G146R/R182V/E795Q/E125K(SEQ ID NO:4004)、G146R/R182V/E795Q/E125A(SEQ ID NO:4006)、G146R/R182V/E795Q/P799V(SEQ ID NO:4008)、G146R/R182V/E795Q/T814K(SEQ ID NO:4010)、G146R/R182V/E795Q/E981V(SEQ ID NO:4012)、G146R/R182V/E795Q/D665N(SEQ ID NO:4014)、G146R/R182V/P799V/E981V(SEQ ID NO:4016)、E125K/G146R/R182V/E795Q/D665N(SEQ ID NO:4018)或G146R/R182V/E795Q/P799V/T814K(SEQ ID NO:4020)。在另一种情况下,所述突变体LbCas12a多肽是G146R/R182V/E795Q(SEQ ID NO:3984)。
本文描述的另一个实施方式是一种分离的多核苷酸序列,其编码突变体LbCas12a多肽,所述突变体LbCas12a多肽包含引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的至少一个氨基酸替换,条件是所述突变体LbCas12a多肽与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。在一种情况下,所述编码的突变体LbCas12a多肽与选自SEQ ID NO:4-4022的偶数编号序列的多肽序列具有95%至99%同一性。在另一种情况下,所述编码的突变体LbCas12a多肽具有选自SEQ IDNO:4-4022的偶数编号序列的多肽序列。在另一种情况下,所述突变体LbCas12a多核苷酸序列与选自SEQ ID NO:3-4021的奇数编号序列的核苷酸序列具有95%至99%同一性。在另一种情况下,所述突变体LbCas12a多核苷酸具有选自SEQ ID NO:3-4021的奇数编号序列的核苷酸序列。在另一种情况下,所述编码的突变体LbCas12a多肽包含在SEQ ID NO:2的野生型LbCas12a多肽序列的第81、125、145、146、152、182、396、478、491、582、595、606、646、665、795、799、814、839、841、858、860、890、898、909、913、981、1020、1083或1121位处的至少一个氨基酸替换。在另一种情况下,所述编码的突变体LbCas12a多肽与SEQ ID NO:2的野生型LbCas12a多肽序列相比包含选自F81E、E125K、N145R、G146R、T152K、R182V、S396D、K478R、V491D、N582R、K595R、Y606F、Y646H、D665N、E795Q、P799V、T814G、L839F、I841A、E858V、I860R、W890A、E898N、H909K、E913R、E981V、S1020E、V1083W或K1121D的至少一个氨基酸替换。在另一种情况下,所述突变体LbCas12a多核苷酸选自:F81E,SEQ ID NO:802;E125K,SEQID NO:428;N145R,SEQ ID NO:2902;G146R,SEQ ID NO:156;T152K,SEQ ID NO:694;R182V,SEQ ID NO:98;S396D,SEQ ID NO:108;K478R,SEQ ID NO:134;V491D,SEQ ID NO:954;N582R,SEQ ID NO:1730;K595R,SEQ ID NO:184;Y606F,SEQ ID NO:642;Y646H,SEQ ID NO:720;D665N,SEQ ID NO:1014;E795Q,SEQ ID NO:930;P799V,SEQ ID NO:706;T814G,SEQ IDNO:162;L839F,SEQ ID NO:834;I841A,SEQ ID NO:988;E858V,SEQ ID NO:114;I860R,SEQID NO:250;W890A,SEQ ID NO:3958;E898N,SEQ ID NO:48;H909K,SEQ ID NO:70;E913R,SEQ ID NO:1960;E981V,SEQ ID NO:880;S1020E,SEQ ID NO:532;V1083W,SEQ ID NO:132;或K1121D,SEQ ID NO:598。在另一种情况下,所述编码的突变体LbCas12a多肽包含选自下述的替换突变:(a)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自下述位置的单个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121;或(b)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自至少两个下述位置的多个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121。在另一种情况下,所述多个替换突变包括E88A/E795Q、E125K/E795Q、G146R/E795Q、R182V/E795Q、V491D/E795Q、Q529I/E795Q、Y646H/E795Q、D665N/E795Q、T814K/E795Q、L839F/E795Q、Q906F/E795Q、E795Q/Q1170D、G146R/R182V/E795Q、G146R/E795Q/D665N、G146R/E795Q/E981V、G146R/E795Q/T814K、G146R/R182V/D665N、E125K/R182V/E981V、R182V/P799V/E981V、R182V/T814K/E981V、G146R/P799V/E981V、G146R/R182V/E795Q/F81E、G146R/R182V/E795Q/E125K、G146R/R182V/E795Q/E125A、G146R/R182V/E795Q/P799V、G146R/R182V/E795Q/T814K、G146R/R182V/E795Q/E981V、G146R/R182V/E795Q/D665N、G146R/R182V/P799V/E981V、E125K/G146R/R182V/E795Q/D665N、G146R/R182V/E795Q/P799V/T814K或E125K/G146R/R182V/E795Q/D665N/E981V。在另一种情况下,所述多个替换突变包括E88A/E795Q、E125K/E795Q、G146R/E795Q、R182V/E795Q、V491D/E795Q、Q529I/E795Q、Y646H/E795Q、D665N/E795Q、T814K/E795Q、L839F/E795Q、Q906F/E795Q、E795Q/Q1170D、G146R/R182V/E795Q、G146R/E795Q/D665N、G146R/E795Q/E981V、G146R/E795Q/T814K、G146R/R182V/D665N、E125K/R182V/E981V、R182V/P799V/E981V、R182V/T814K/E981V、G146R/P799V/E981V、G146R/R182V/E795Q/F81E、G146R/R182V/E795Q/E125K、G146R/R182V/E795Q/E125A、G146R/R182V/E795Q/P799V、G146R/R182V/E795Q/T814K、G146R/R182V/E795Q/E981V、G146R/R182V/E795Q/D665N、G146R/R182V/P799V/E981V、E125K/G146R/R182V/E795Q/D665N或G146R/R182V/E795Q/P799V/T814K,并且与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。在另一种情况下,所述编码的突变体LbCas12a多肽选自F81E(SEQ ID NO:802)、E125K(SEQ ID NO:428)、N145R(SEQ ID NO:2902)、G146R(SEQ ID NO:156)、T152K(SEQ ID NO:694)、R182V(SEQ ID NO:98)、V491D(SEQ ID NO:954)、K478R(SEQ ID NO:134)、N582R(SEQID NO:1730)、D665N(SEQ ID NO:1014)、E795Q(SEQ ID NO:930)、P799V(SEQ ID NO:706)、E858V(SEQ ID NO:114)、I860R(SEQ ID NO:250)、E913R(SEQ ID NO:1960)、E981V(SEQ IDNO:880)、E88A/E795Q(SEQ ID NO:3960)、E125K/E795Q(SEQ ID NO:3962)、G146R/E795Q(SEQ ID NO:3964)、R182V/E795Q(SEQ ID NO:3966)、V491D/E795Q(SEQ ID NO:3968)、Q529I/E795Q(SEQ ID NO:3970)、Y646H/E795Q(SEQ ID NO:3972)、D665N/E795Q(SEQ IDNO:3974)、T814K/E795Q(SEQ ID NO:3976)、L839F/E795Q(SEQ ID NO:3978)、Q906F/E795Q(SEQ ID NO:3980)、E795Q/Q1170D(SEQ ID NO:3982)、G146R/R182V/E795Q(SEQ ID NO:3984)、G146R/E795Q/D665N(SEQ ID NO:3986)、G146R/E795Q/E981V(SEQ ID NO:3988)、G146R/E795Q/T814K(SEQ ID NO:3990)、G146R/R182V/D665N(SEQ ID NO:3992)、E125K/R182V/E981V(SEQ ID NO:3994)、R182V/P799V/E981V(SEQ ID NO:3996)、R182V/T814K/E981V(SEQ ID NO:3998)、G146R/P799V/E981V(SEQ ID NO:4000)、G146R/R182V/E795Q/F81E(SEQ ID NO:4002)、G146R/R182V/E795Q/E125K(SEQ ID NO:4004)、G146R/R182V/E795Q/E125A(SEQ ID NO:4006)、G146R/R182V/E795Q/P799V(SEQ ID NO:4008)、G146R/R182V/E795Q/T814K(SEQ ID NO:4010)、G146R/R182V/E795Q/E981V(SEQ ID NO:4012)、G146R/R182V/E795Q/D665N(SEQ ID NO:4014)、G146R/R182V/P799V/E981V(SEQ ID NO:4016)、E125K/G146R/R182V/E795Q/D665N(SEQ ID NO:4018)或G146R/R182V/E795Q/P799V/T814K(SEQ ID NO:4020)。在另一种情况下,所述编码的突变体LbCas12a多肽是G146R/R182V/E795Q(SEQ ID NO:3984)。在另一种情况下,所述突变体LbCas12a多核苷酸选自SEQID NO:801、427、2901、155、693、97、953、133、1729、641、719、1013、929、705、833、987、113、249、3957、47、69、1959、879、531、597、3959、3961、3963、3965、3967、3969、3971、3973、3975、3977、3979、3981、3983、3985、3987、3989、3991、3993、3995、3997、3999、4001、4003、4005、4007、4009、4011、4013、4015、4017、4019或4021。在另一种情况下,所述突变体LbCas12a多核苷酸选自SEQ ID NO:801、427、2901、155、693、97、953、133、1729、1013、929、705、113、249、531、597、3959、3961、3963、3965、3967、3969、3971、3973、3975、3977、3979、3981、3983、3985、3987、3989、3991、3993、3995、3997、3999、4001、4003、4005、4007、4009、4011、4013、4015、4017或4019,并编码与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高的突变体LbCas12a多肽。在另一种情况下,所述突变体LbCas12a多核苷酸是SEQ ID NO:3983。
本文描述的另一个实施方式是一种载体或质粒,其包含本文中描述的任何多核苷酸序列。
本文描述的另一个实施方式是一种细胞,其包含本文中描述的任何多核苷酸序列或本文中描述的载体或质粒。
本文描述的另一个实施方式是一种分离的核糖核蛋白复合体,其包含向导RNA和突变体LbCas12a多肽,所述突变体LbCas12a多肽包含引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的至少一个氨基酸替换,条件是所述突变体LbCas12a多肽与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。在一种情况下,所述突变体LbCas12a多肽具有选自SEQ ID NO:4-4022的偶数编号序列的多肽序列。在另一种情况下,所述突变体LbCas12a多肽包含在SEQ ID NO:2的野生型LbCas12a多肽序列的第81、125、145、146、152、182、396、478、491、582、595、606、646、665、795、799、814、839、841、858、860、890、898、909、913、981、1020、1083或1121位处的至少一个氨基酸替换。在另一种情况下,所述突变体LbCas12a多肽包含选自SEQ ID NO:2的野生型LbCas12a多肽序列的F81E、E125K、N145R、G146R、T152K、R182V、S396D、K478R、V491D、N582R、K595R、Y606F、Y646H、D665N、E795Q、P799V、T814G、L839F、I841A、E858V、I860R、W890A、E898N、H909K、E913R、E981V、S1020E、V1083W或K1121D的至少一个氨基酸替换。在另一种情况下,所述突变体LbCas12a多肽选自:F81E,SEQ ID NO:802;E125K,SEQ ID NO:428;N145R,SEQ ID NO:2902;G146R,SEQ ID NO:156;T152K,SEQ ID NO:694;R182V,SEQ ID NO:98;S396D,SEQ ID NO:108;K478R,SEQ ID NO:134;V491D,SEQ ID NO:954;N582R,SEQ ID NO:1730;K595R,SEQ ID NO:184;Y606F,SEQ ID NO:642;Y646H,SEQ ID NO:720;D665N,SEQ IDNO:1014;E795Q,SEQ ID NO:930;P799V,SEQ ID NO:706;T814G,SEQ ID NO:162;L839F,SEQID NO:834;I841A,SEQ ID NO:988;E858V,SEQ ID NO:114;I860R,SEQ ID NO:250;W890A,SEQ ID NO:3958;E898N,SEQ ID NO:48;H909K,SEQ ID NO:70;E913R,SEQ ID NO:1960;E981V,SEQ ID NO:880;S1020E,SEQ ID NO:532;V1083W,SEQ ID NO:132;或K1121D,SEQ IDNO:598。在另一种情况下,所述突变体LbCas12a多肽选自F81E(SEQ ID NO:802)、E125K(SEQID NO:428)、N145R(SEQ ID NO:2902)、G146R(SEQ ID NO:156)、T152K(SEQ ID NO:694)、R182V(SEQ ID NO:98)、V491D(SEQ ID NO:954)、K478R(SEQ ID NO:134)、N582R(SEQ IDNO:1730)、D665N(SEQ ID NO:1014)、E795Q(SEQ ID NO:930)、P799V(SEQ ID NO:706)、E858V(SEQ ID NO:114)、I860R(SEQ ID NO:250)、E913R(SEQ ID NO:1960)、E981V(SEQ IDNO:880)、E88A/E795Q(SEQ ID NO:3960)、E125K/E795Q(SEQ ID NO:3962)、G146R/E795Q(SEQ ID NO:3964)、R182V/E795Q(SEQ ID NO:3966)、V491D/E795Q(SEQ ID NO:3968)、Q529I/E795Q(SEQ ID NO:3970)、Y646H/E795Q(SEQ ID NO:3972)、D665N/E795Q(SEQ IDNO:3974)、T814K/E795Q(SEQ ID NO:3976)、L839F/E795Q(SEQ ID NO:3978)、Q906F/E795Q(SEQ ID NO:3980)、E795Q/Q1170D(SEQ ID NO:3982)、G146R/R182V/E795Q(SEQ ID NO:3984)、G146R/E795Q/D665N(SEQ ID NO:3986)、G146R/E795Q/E981V(SEQ ID NO:3988)、G146R/E795Q/T814K(SEQ ID NO:3990)、G146R/R182V/D665N(SEQ ID NO:3992)、E125R/R182V/E981V(SEQ ID NO:3994)、R182V/P799V/E981V(SEQ ID NO:3996)、R182V/T814K/E981V(SEQ ID NO:3998)、G146R/P799V/E981V(SEQ ID NO:4000)、G146R/R182V/E795Q/F81E(SEQ ID NO:4002)、G146R/R182V/E795Q/E125K(SEQ ID NO:4004)、G146R/R182V/E795Q/E125A(SEQ ID NO:4006)、G146R/R182V/E795Q/P799V(SEQ ID NO:4008)、G146R/R182V/E795Q/T814K(SEQ ID NO:4010)、G146R/R182V/E795Q/E981V(SEQ ID NO:4012)、G146R/R182V/E795Q/D665N(SEQ ID NO:4014)、G146R/R182V/P799V/E981V(SEQ ID NO:4016)、E125K/G146R/R182V/E795Q/D665N(SEQ ID NO:4018)或G146R/R182V/E795Q/P799V/T814K(SEQ ID NO:4020)。在另一种情况下,所述突变体LbCas12a多肽是G146R/R182V/E795Q(SEQ ID NO:3984)。
本文描述的另一个实施方式是一种使用CRISPR核糖核蛋白复合体在细胞中提高在非经典TTTT PAM位点处的基因编辑效率的方法,所述方法包括将细胞与所述包括向导RNA和突变体LbCas12a多肽的CRISPR核糖核蛋白复合体接触,所述突变体LbCas12a多肽包含引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的至少一个氨基酸替换,条件是所述突变体LbCas12a多肽与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。在一种情况下,所述突变体LbCas12a多肽具有选自SEQ ID NO:4-4022的偶数编号序列的多肽序列。在另一种情况下,所述突变体LbCas12a多肽包含在SEQ ID NO:2的野生型LbCas12a多肽序列的第81、125、145、146、152、182、396、478、491、582、595、606、646、665、795、799、814、839、841、858、860、890、898、909、913、981、1020、1083或1121位处的至少一个氨基酸替换。在另一种情况下,所述突变体LbCas12a多肽包含选自SEQ ID NO:2的野生型LbCas12a多肽序列的F81E、E125K、N145R、G146R、T152K、R182V、S396D、K478R、V491D、N582R、K595R、Y606F、Y646H、D665N、E795Q、P799V、T814G、L839F、I841A、E858V、I860R、W890A、E898N、H909K、E913R、E981V、S1020E、V1083W或K1121D的至少一个氨基酸替换。在另一种情况下,所述突变体LbCas12a多肽选自:F81E,SEQ ID NO:802;E125K,SEQ ID NO:428;N145R,SEQ ID NO:2902;G146R,SEQ ID NO:156;T152K,SEQ IDNO:694;R182V,SEQ ID NO:98;S396D,SEQ ID NO:108;K478R,SEQ ID NO:134;V491D,SEQID NO:954;N582R,SEQ ID NO:1730;K595R,SEQ ID NO:184;Y606F,SEQ ID NO:642;Y646H,SEQ ID NO:720;D665N,SEQ ID NO:1014;E795Q,SEQ ID NO:930;P799V,SEQ ID NO:706;T814G,SEQ ID NO:162;L839F,SEQ ID NO:834;I841A,SEQ ID NO:988;E858V,SEQ ID NO:114;I860R,SEQ ID NO:250;W890A,SEQ ID NO:3958;E898N,SEQ ID NO:48;H909K,SEQ IDNO:70;E913R,SEQ ID NO:1960;E981V,SEQ ID NO:880;S1020E,SEQ ID NO:532;V1083W,SEQ ID NO:132;或K1121D,SEQ ID NO:598。在另一种情况下,所述突变体LbCas12a多肽包含选自下述的替换突变:(a)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自下述位置的单个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、I839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121;或(b)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自至少两个下述位置的多个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121。在另一种情况下,所述多个替换突变包括E88A/E795Q、E125K/E795Q、G146R/E795Q、R182V/E795Q、V491D/E795Q、Q529I/E795Q、Y646H/E795Q、D665N/E795Q、T814K/E795Q、L839F/E795Q、Q906F/E795Q、E795Q/Q1170D、G146R/R182V/E795Q、G146R/E795Q/D665N、G146R/E795Q/E981V、G146R/E795Q/T814K、G146R/R182V/D665N、E125K/R182V/E981V、R182V/P799V/E981V、R182V/T814K/E981V、G146R/P799V/E981V、G146R/R182V/E795Q/F81E、G146R/R182V/E795Q/E125K、G146R/R182V/E795Q/E125A、G146R/R182V/E795Q/P799V、G146R/R182V/E795Q/T814K、G146R/R182V/E795Q/E981V、G146R/R182V/E795Q/D665N、G146R/R182V/P799V/E981V、E125K/G146R/R182V/E795Q/D665N或G146R/R182V/E795Q/P799V/T814K。在另一种情况下,所述突变体LbCas12a多肽选自F81E(SEQ ID NO:802)、E125K(SEQ ID NO:428)、N145R(SEQ ID NO:2902)、G146R(SEQ ID NO:156)、T152K(SEQ ID NO:694)、R182V(SEQ ID NO:98)、V491D(SEQ ID NO:954)、K478R(SEQID NO:134)、N582R(SEQ ID NO:1730)、D665N(SEQ ID NO:1014)、E795Q(SEQ ID NO:930)、P799V(SEQ ID NO:706)、E858V(SEQ ID NO:114)、I860R(SEQ ID NO:250)、E913R(SEQ IDNO:1960)、E981V(SEQ ID NO:880)、E88A/E795Q(SEQ ID NO:3960)、E125K/E795Q(SEQ IDNO:3962)、G146R/E795Q(SEQ ID NO:3964)、R182V/E795Q(SEQ ID NO:3966)、V491D/E795Q(SEQ ID NO:3968)、Q529I/E795Q(SEQ ID NO:3970)、Y646H/E795Q(SEQ ID NO:3972)、D665N/E795Q(SEQ ID NO:3974)、T814K/E795Q(SEQ ID NO:3976)、L839F/E795Q(SEQ IDNO:3978)、Q906F/E795Q(SEQ ID NO:3980)、E795Q/Q1170D(SEQ ID NO:3982)、G146R/R182V/E795Q(SEQ ID NO:3984)、G146R/E795Q/D665N(SEQ ID NO:3986)、G146R/E795Q/E981V(SEQ ID NO:3988)、G146R/E795Q/T814K(SEQ ID NO:3990)、G146R/R182V/D665N(SEQID NO:3992)、E125K/R182V/E981V(SEQ ID NO:3994)、R182V/P799V/E981V(SEQ ID NO:3996)、R182V/T814K/E981V(SEQ ID NO:3998)、G146R/P799V/E981V(SEQ ID NO:4000)、G146R/R182V/E795Q/F81E(SEQ ID NO:4002)、G146R/R182V/E795Q/E125K(SEQ ID NO:4004)、G146R/R182V/E795Q/E125A(SEQ ID NO:4006)、G146R/R182V/E795Q/P799V(SEQ IDNO:4008)、G146R/R182V/E795Q/T814K(SEQ ID NO:4010)、G146R/R182V/E795Q/E981V(SEQID NO:4012)、G146R/R182V/E795Q/D665N(SEQ ID NO:4014)、G146R/R182V/P799V/E981V(SEQ ID NO:4016)、E125K/G146R/R182V/E795Q/D665N(SEQ ID NO:4018)或G146R/R182V/E795Q/P799V/T814K(SEQ ID NO:4020)。在另一种情况下,所述突变体LbCas12a多肽是G146R/R182V/E795Q(SEQ ID NO:3984)。
本文描述的另一个实施方式是一种用于在细胞中提高在非经典TTTT PAM位点处的基因编辑效率的试剂盒,所述试剂盒包含CRISPR核糖核蛋白复合体,其包括向导RNA和突变体LbCas12a多肽,所述突变体LbCas12a多肽包含引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的至少一个氨基酸替换,条件是所述突变体LbCas12a多肽与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。在一种情况下,所述突变体LbCas12a多肽具有选自SEQ ID NO:4-4022的偶数编号序列的多肽序列。在另一种情况下,所述突变体LbCas12a多肽包含在SEQ ID NO:2的野生型LbCas12a多肽序列的第81、125、145、146、152、182、396、478、491、582、595、606、646、665、795、799、814、839、841、858、860、890、898、909、913、981、1020、1083或1121位处的至少一个氨基酸替换。在另一种情况下,所述突变体LbCas12a多肽包含选自SEQ ID NO:2的野生型LbCas12a多肽序列的F81E、E125K、N145R、G146R、T152K、R182V、S396D、K478R、V491D、N582R、K595R、Y606F、Y646H、D665N、E795Q、P799V、T814G、L839F、I841A、E858V、I860R、W890A、E898N、H909K、E913R、E981V、S1020E、V1083W或K1121D的至少一个氨基酸替换。在另一种情况下,所述突变体LbCas12a多肽选自:F81E,SEQ ID NO:802;E125K,SEQ ID NO:428;N145R,SEQ ID NO:2902;G146R,SEQ ID NO:156;T152K,SEQ ID NO:694;R182V,SEQ ID NO:98;S396D,SEQ IDNO:108;K478R,SEQ ID NO:134;V491D,SEQ ID NO:954;N582R,SEQ ID NO:1730;K595R,SEQID NO:184;Y606F,SEQ ID NO:642;Y646H,SEQ ID NO:720;D665N,SEQ ID NO:1014;E795Q,SEQ ID NO:930;P799V,SEQ ID NO:706;T814G,SEQ ID NO:162;L839F,SEQ ID NO:834;I841A,SEQ ID NO:988;E858V,SEQ ID NO:114;I860R,SEQ ID NO:250;W890A,SEQ ID NO:3958;E898N,SEQ ID NO:48;H909K,SEQ ID NO:70;E913R,SEQ ID NO:1960;E981V,SEQ IDNO:880;S1020E,SEQ ID NO:532;V1083W,SEQ ID NO:132;或K1121D,SEQ ID NO:598。在另一种情况下,所述突变体LbCas12a多肽包含选自下述的替换突变:(a)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自下述位置的单个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121;或(b)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自至少两个下述位置的多个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121。在另一种情况下,所述多个替换突变包括E88A/E795Q、E125K/E795Q、G146R/E795Q、R182V/E795Q、V491D/E795Q、Q529I/E795Q、Y646H/E795Q、D665N/E795Q、T814K/E795Q、L839F/E795Q、Q906F/E795Q、E795Q/Q1170D、G146R/R182V/E795Q、G146R/E795Q/D665N、G146R/E795Q/E981V、G146R/E795Q/T814K、G146R/R182V/D665N、E 125K/R182V/E981V、R182V/P799V/E981V、R182V/T814K/E981V、G146R/P799V/E981V、G146R/R182V/E795Q/F81E、G146R/R182V/E795Q/E125K、G146R/R182V/E795Q/E125A、G146R/R182V/E795Q/P799V、G146R/R182V/E795Q/T814K、G146R/R182V/E795Q/E981V、G146R/R182V/E795Q/D665N、G146R/R182V/P799V/E981V、E125K/G146R/R182V/E795Q/D665N或G146R/R182V/E795Q/P799V/T814K。在另一种情况下,所述突变体LbCas12a多肽选自F81E(SEQ ID NO:802)、E125K(SEQ ID NO:428)、N145R(SEQID NO:2902)、G146R(SEQ ID NO:156)、T152K(SEQ ID NO:694)、R182V(SEQ ID NO:98)、V491D(SEQ ID NO:954)、K478R(SEQ ID NO:134)、N582R(SEQ ID NO:1730)、D665N(SEQ IDNO:1014)、E795Q(SEQ ID NO:930)、P799V(SEQ ID NO:706)、E858V(SEQ ID NO:114)、I860R(SEQ ID NO:250)、E913R(SEQ ID NO:1960)、E981V(SEQ ID NO:880)、E88A/E795Q(SEQ IDNO:3960)、E125K/E795Q(SEQ ID NO:3962)、G146R/E795Q(SEQ ID NO:3964)、R182V/E795Q(SEQ ID NO:3966)、V491D/E795Q(SEQ ID NO:3968)、Q529I/E795Q(SEQ ID NO:3970)、Y646H/E795Q(SEQ ID NO:3972)、D665N/E795Q(SEQ ID NO:3974)、T814K/E795Q(SEQ IDNO:3976)、L839F/E795Q(SEQ ID NO:3978)、Q906F/E795Q(SEQ ID NO:3980)、E795Q/Q1170D(SEQ ID NO:3982)、G146R/R182V/E795Q(SEQ ID NO:3984)、G146R/E795Q/D665N(SEQ IDNO:3986)、G146R/E795Q/E981V(SEQ ID NO:3988)、G146R/E795Q/T814K(SEQ ID NO:3990)、G146R/R182V/D665N(SEQ ID NO:3992)、E125K/R182V/E981V(SEQ ID NO:3994)、R182V/P799V/E981V(SEQ ID NO:3996)、R182V/T814K/E981V(SEQ ID NO:3998)、G146R/P799V/E981V(SEQ ID NO:4000)、G146R/R182V/E795Q/F81E(SEQ ID NO:4002)、G146R/R182V/E795Q/E125K(SEQ ID NO:4004)、G146R/R182V/E795Q/E125A(SEQ ID NO:4006)、G146R/R182V/E795Q/P799V(SEQ ID NO:4008)、G146R/R182V/E795Q/T814K(SEQ ID NO:4010)、G146R/R182V/E795Q/E981V(SEQ ID NO:4012)、G146R/R182V/E795Q/D665N(SEQ ID NO:4014)、G146R/R182V/P799V/E981V(SEQ ID NO:4016)、E125K/G146R/R182V/E795Q/D665N(SEQ ID NO:4018)或G146R/R182V/E795Q/P799V/T814K(SEQ ID NO:4020)。在另一种情况下,所述突变体LbCas12a多肽是G146R/R182V/E795Q(SEQ ID NO:3984)。
本文描述的另一个实施方式是突变体LbCas12a多肽用于提高在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的用途,其中所述突变体LbCas12a多肽包含引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的至少一个氨基酸替换,条件是所述突变体LbCas12a多肽与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。在一种情况下,所述突变体LbCas12a多肽具有选自SEQID NO:4-4022的偶数编号序列的多肽序列。在另一种情况下,所述突变体LbCas12a多肽包含在SEQ ID NO:2的野生型LbCas12a多肽序列的第81、125、145、146、152、182、396、478、491、582、595、606、646、665、795、799、814、839、841、858、860、890、898、909、913、981、1020、1083或1121位处的至少一个氨基酸替换。在另一种情况下,所述突变体LbCas12a多肽包含选自SEQ ID NO:2的野生型LbCas12a多肽序列的F81E、E125K、N145R、G146R、T152K、R182V、S396D、K478R、V491D、N582R、K595R、Y606F、Y646H、D665N、E795Q、P799V、T814G、L839F、I841A、E858V、I860R、W890A、E898N、H909K、E913R、E981V、S1020E、V1083W或K1121D的至少一个氨基酸替换。在另一种情况下,所述突变体LbCas12a多肽选自:F81E,SEQ ID NO:802;E125K,SEQ ID NO:428;N145R,SEQ ID NO:2902;G146R,SEQ ID NO:156;T152K,SEQ ID NO:694;R182V,SEQ ID NO:98;S396D,SEQ ID NO:108;K478R,SEQ ID NO:134;V491D,SEQ IDNO:954;N582R,SEQ ID NO:1730;K595R,SEQ ID NO:184;Y606F,SEQ ID NO:642;Y646H,SEQID NO:720;D665N,SEQ ID NO:1014;E795Q,SEQ ID NO:930;P799V,SEQ ID NO:706;T814G,SEQ ID NO:162;L839F,SEQ ID NO:834;I841A,SEQ ID NO:988;E858V,SEQ ID NO:114;I860R,SEQ ID NO:250;W890A,SEQ ID NO:3958;E898N,SEQ ID NO:48;H909K,SEQ ID NO:70;E913R,SEQ ID NO:1960;E981V,SEQ ID NO:880;S1020E,SEQ ID NO:532;V1083W,SEQID NO:132;或K1121D,SEQ ID NO:598。在另一种情况下,所述突变体LbCas12a多肽包含选自下述的替换突变:(a)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自下述位置的单个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121;或(b)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自至少两个下述位置的多个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121。在另一种情况下,所述多个替换突变包括E88A/E795Q、E125K/E795Q、G146R/E795Q、R182V/E795Q、V491D/E795Q、Q529I/E795Q、Y646H/E795Q、D665N/E795Q、T814K/E795Q、L839F/E795Q、Q906F/E795Q、E795Q/Q1170D、G146R/R182V/E795Q、G146R/E795Q/D665N、G146R/E795Q/E981V、G146R/E795Q/T814K、G146R/R182V/D665N、E125R/R182V/E981V、R182V/P799V/E981V、R182V/T814K/E981V、G146R/P799V/E981V、G146R/R182V/E795Q/F81E、G146R/R182V/E795Q/E125K、G146R/R182V/E795Q/E125A、G146R/R182V/E795Q/P799V、G146R/R182V/E795Q/T814K、G146R/R182V/E795Q/E981V、G146R/R182V/E795Q/D665N、G146R/R182V/P799V/E981V、E125K/G146R/R182V/E795Q/D665N或G146R/R182V/E795Q/P799V/T814K。在另一种情况下,所述突变体LbCas12a多肽选自F81E(SEQ IDNO:802)、E125K(SEQ ID NO:428)、N145R(SEQ ID NO:2902)、G146R(SEQ ID NO:156)、T152K(SEQ ID NO:694)、R182V(SEQ ID NO:98)、V491D(SEQ ID NO:954)、K478R(SEQ ID NO:134)、N582R(SEQ ID NO:1730)、D665N(SEQ ID NO:1014)、E795Q(SEQ ID NO:930)、P799V(SEQ ID NO:706)、E858V(SEQ ID NO:114)、I860R(SEQ ID NO:250)、E913R(SEQ ID NO:1960)、E981V(SEQ ID NO:880)、E88A/E795Q(SEQ ID NO:3960)、E125K/E795Q(SEQ ID NO:3962)、G146R/E795Q(SEQ ID NO:3964)、R182V/E795Q(SEQ ID NO:3966)、V491D/E795Q(SEQID NO:3968)、Q529I/E795Q(SEQ ID NO:3970)、Y646H/E795Q(SEQ ID NO:3972)、D665N/E795Q(SEQ ID NO:3974)、T814K/E795Q(SEQ ID NO:3976)、L839F/E795Q(SEQ ID NO:3978)、Q906F/E795Q(SEQ ID NO:3980)、E795Q/Q1170D(SEQ ID NO:3982)、G146R/R182V/E795Q(SEQ ID NO:3984)、G146R/E795Q/D665N(SEQ ID NO:3986)、G146R/E795Q/E981V(SEQID NO:3988)、G146R/E795Q/T814K(SEQ ID NO:3990)、G146R/R182V/D665N(SEQ ID NO:3992)、E125K/R182V/E981V(SEQ ID NO:3994)、R182V/P799V/E981V(SEQ ID NO:3996)、R182V/T814K/E981V(SEQ ID NO:3998)、G146R/P799V/E981V(SEQ ID NO:4000)、G146R/R182V/E795Q/F81E(SEQ ID NO:4002)、G146R/R182V/E795Q/E125K(SEQ ID NO:4004)、G146R/R182V/E795Q/E125A(SEQ ID NO:4006)、G146R/R182V/E795Q/P799V(SEQ ID NO:4008)、G146I/R182V/E795Q/T814K(SEQ ID NO:4010)、G146R/R182V/E795Q/E981V(SEQ IDNO:4012)、G146R/R182V/E795Q/D665N(SEQ ID NO:4014)、G146R/R182V/P799V/E981V(SEQID NO:4016)、E125K/G146R/R182V/E795Q/D665N(SEQ ID NO:4018)或G146R/R182V/E795Q/P799V/T814K(SEQ ID NO:4020)。在另一种情况下,所述突变体LbCas12a多肽是G146R/R182V/E795Q(SEQ ID NO:3984)。
本文描述的另一个实施方式是一种用于表达和纯化突变体LbCas13a蛋白的方法,所述方法包括:(a)将编码突变体LbCas12a多肽的核苷酸序列插入到表达质粒中,所述突变体LbCas12a多肽与野生型LbCas12a多肽序列相比包含至少一个氨基酸替换,并与SEQ IDNO:4-4022的偶数编号多肽序列中的任一者具有95-99%同一性;(b)用所述表达质粒转化一个或多个细胞;(c)诱导所述转化的质粒的表达;(d)分离所述细胞;(e)提取所述突变体LbCas13a蛋白;和(f)纯化所述突变体LbCas13a蛋白;其中所述突变体LbCas12a多肽与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。
本文描述的另一个实施方式是一种突变体LbCas12a多肽,其通过本文描述的方法生产。
附图说明
图1A示出了细菌筛选所覆盖的所有LbCas12a突变体的示例性表型分布。该分析使用了选择的两个生物学平行样的平均点突变富集评分。所有同义变化(即编码与野生型氨基酸相同的氨基酸的不同密码子)的富集评分紧密簇集在0附近,这使得能够在所述选择中量化WT-LbCas12a的表型。图1B示出了同义突变的分布和富集。图1C示出了非同义突变的分布和富集。
图2示出了横跨LbCas12a多肽序列的所有突变的表型(活性)评分。指示了活性最高的10个突变体。
图3A示出了在LbCas12a的E795位置处点突变的示例性表型评分。
图3B示出了N527N和N527K的示例性表型评分。在该位置处的其他点突变从筛选中退出,表明在该位置处的任何变化是有害的。
图4A示出了D156位置处点突变的示例性表型评分。在该位置处大多数突变耐受良好;亮氨酸几乎是中性的;并且苯丙氨酸或组氨酸在该位置处有害。
图4B示出了G532位置处点突变的示例性表型评分。在该位置处大多数突变有害。
图5A-J示出了野生型LbCas12a(图5A)和与阴性对照(无HPRT38346 gRNA;图5B)相比在TTTT PAM处具有增强的DNA切割活性的示例性点突变(图5B-J)。LbCas12a变体在TTTTPAM位点处的切割活性通过基于细菌的活性测定法测量。大肠杆菌(E.coli)在阿拉伯糖选择下的存活依赖于使用TTTT PAM的毒素表达质粒上HPRT38346前间区序列的成功切割。在不存在HPRT38346 gRNA的情况下大肠杆菌的存活率急剧降低。参见图5A(野生型)与图5B(阴性)的比较。与野生型(图5A)相比,所有示例性突变体在gRNA存在下存活率提高(图5C-图5J,突变体分别为:K478R;E898N;S396D;G146R;K595R;E795Q;T814G和V1083W),反映出LbCas12a变体在非经典TTTT PAM处增强的切割活性。
图6A-B示出了作为RNP复合体的LbCas12a变体在人类细胞中的性能评估。纯化了表7中示出的LbCas12a变体并使用四种不同crRNA(表9)组装成RNP。图6A示出了在递送到人类HEK293细胞后48小时使用T7核酸内切酶I测定法测定的LbCas12a变体的编辑效率。进行了三份平行实验。平均的数据和标准偏差示出在表10中。图6B示出了每种变体的归一化编辑效率(归一化到野生型LbCas12a),并表示为相对于野生型的提高倍数。示出了每种突变体的第一四分位数(Q1)、中位数和第三四分位数(Q3)。虚线表示野生型LbCas12a蛋白的基线活性。进行了两份平行实验。每种crRNA的归一化数据示出在表11中。
详细描述
除非另有定义,否则在本文中使用的所有技术和科学术语具有与本领域普通技术人员通常理解的相同的含义。例如,本文描述的与细胞和组织培养、分子生物学、免疫学、微生物学、遗传学和蛋白质和核酸化学以及杂交相关联使用的任何命名法和技术,在本领域中是公知且常用的。在有冲突的情况下,以包括定义在内的本公开为准。尽管与本文描述的相似或等同的方法和材料可用于本发明的实践或测试,但下文中描述了示例性的方法和材料。
当在本文中使用时,术语“氨基酸”、“核苷酸”、“多肽”、“多核苷酸”和“载体”具有本领域普通技术的生化学家将会理解的常用含义。本文中使用标准的单字母核苷酸(A、C、G、T、U)和标准的单字母氨基酸(A、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或R)。
当在本文中使用时,诸如“包括”、“含有”、“具有”等的术语意味着“包含”。本公开还设想了“包含”本文中示出的实施方式、情况或要素、“由它们组成”和“基本上由它们组成”的其他实施方式,不论是否明确阐述。
当在本文中使用时,在本公开的上下文中(特别是在权利要求书的上下文中)使用的没有具体数目的术语应该被理解为覆盖单数和复数两者,除非本文中另有指明或明显与上下文矛盾。此外,除非另有规定,否则没有具体数目的指称意味着“一个或多个”。
当在本文中使用时,术语“或”可以是连接词或反意连接词。
当在本文中使用时,术语“基本上”意味着极大或显著程度,但不是完全地。
当在本文中使用时,术语“约”或“大约”当应用于一个或多个感兴趣的值时,是指与所陈述的参考值相近或在所述特定值的本领域普通技术人员所确定的可接受的误差范围内的值,所述误差范围部分取决于所述值如何测量或确定,例如测量系统的限制。在一种情况下,术语“约”是指在术语“约”所修饰的值的至多±10%的变差以内的任何值,包括整数和分数分量两者。或者,“约”可以意味着根据本领域的实践在3个或更多个标准偏差以内。或者,例如对于生物学系统或过程而言,术语“约”可以意味着在值的一个数量级以内、在某些实施方式中在5倍以内、在某些实施方式中在2倍以内。当在本文中使用时,符号“~”意味着“约”或“大约”。
本文公开的所有范围包括作为离散值的两个端点以及所述范围内规定的所有整数和分数。例如,0.1-2.0的范围包括0.1、0.2、0.3、0.4...2.0。如果端点被术语“约”修饰,则所述规定的范围被扩充到所述范围内的任何值、包括端点的至多±10%的变差或3个或更多个标准偏差以内。
当在本文中使用时,术语“对照”或“参比”在本文中可互换使用。“参比”或“对照”水平可以是预定的值或范围,其被用作基线或基准,针对它来评估测量结果。“对照”也指对照实验或对照细胞。
当在本文中使用时,本文描述的化合物的“有效量”这一短语是指本文描述的化合物将引发生物学反应例如酶或蛋白质活性的降低或抑制,或改善症状、减轻病症、减缓或延迟疾病进展或预防疾病等的量。
当在本文中使用时,术语“抑制”是指给定病症、症状或障碍或疾病的减轻或压制或生物学活性或过程的基线活性的显著降低。
当在本文中使用时,术语“毛螺菌科(Lachnospiraceae)细菌Cas12a”或“LbCas12a”可互换使用,并且是指毛螺菌科(Lachnospiraceae)细菌ND2006(Lb)的Cas12a蛋白(以前被命名为Cpf1),是一种2类/V型CRISPR RNA指导的核酸内切酶。
术语“LbCas12a”、“野生型LbCas12a”、“野生型Lb酶”或“WT LbCas12a”是指具有天然存在的毛螺菌科(Lachnospiraceae)细菌ND2006 Cas12a的氨基酸序列(例如SEQ ID NO:2,由SEQ ID NO:1的核苷酸序列编码),并且当与适合的crRNA组合以形成有活性的CRISPR/Cas12a核酸内切酶系统时具有生物学活性的蛋白质。
术语“突变体LbCas12a蛋白”或“变体LbCas12a蛋白”可互换使用,并且是指具有与野生型毛螺菌科(Lachnospiraceae)细菌ND2006 Cas12a不同的氨基酸序列,并且当与适合的crRNA组合以形成有活性的CRISPR/Cas12a核酸内切酶系统时具有生物学活性的LbCas12a蛋白形式。这包括直向同源物和具有与野生型毛螺菌科(Lachnospiraceae)细菌ND2006 Cas12a不同的氨基酸序列的Cas12a变体。本文描述的突变体LbCas12a蛋白相对于野生型LbCas12a多肽序列具有至少一个氨基酸替换。在一种情况下,所述突变体LbCas12a多肽相对于野生型LbCas12a多肽序列具有至少一个氨基酸替换,并且与野生型LbCas12a酶相比具有在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。
当在本文中使用时,短语“SEQ ID NO:3-4021的奇数编号序列”是指SEQ ID NO:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361、363、365、367、369、371、373、375、377、379、381、383、385、387、389、391、393、395、397、399、401、403、405、407、409、411、413、415、417、419、421、423、425、427、429、431、433、435、437、439、441、443、445、447、449、451、453、455、457、459、461、463、465、467、469、471、473、475、477、479、481、483、485、487、489、491、493、495、497、499、501、503、505、507、509、511、513、515、517、519、521、523、525、527、529、531、533、535、537、539、541、543、545、547、549、551、553、555、557、559、561、563、565、567、569、571、573、575、577、579、581、583、585、587、589、591、593、595、597、599、601、603、605、607、609、611、613、615、617、619、621、623、625、627、629、631、633、635、637、639、641、643、645、647、649、651、653、655、657、659、661、663、665、667、669、671、673、675、677、679、681、683、685、687、689、691、693、695、697、699、701、703、705、707、709、711、713、715、717、719、721、723、725、727、729、731、733、735、737、739、741、743、745、747、749、751、753、755、757、759、761、763、765、767、769、771、773、775、777、779、781、783、785、787、789、791、793、795、797、799、801、803、805、807、809、811、813、815、817、819、821、823、825、827、829、831、833、835、837、839、841、843、845、847、849、851、853、855、857、859、861、863、865、867、869、871、873、875、877、879、881、883、885、887、889、891、893、895、897、899、901、903、905、907、909、911、913、915、917、919、921、923、925、927、929、931、933、935、937、939、941、943、945、947、949、951、953、955、957、959、961、963、965、967、969、971、973、975、977、979、981、983、985、987、989、991、993、995、997、999、1001、1003、1005、1007、1009、1011、1013、1015、1017、1019、1021、1023、1025、1027、1029、1031、1033、1035、1037、1039、1041、1043、1045、1047、1049、1051、1053、1055、1057、1059、1061、1063、1065、1067、1069、1071、1073、1075、1077、1079、1081、1083、1085、1087、1089、1091、1093、1095、1097、1099、1101、1103、1105、1107、1109、1111、1113、1115、1117、1119、1121、1123、1125、1127、1129、1131、1133、1135、1137、1139、1141、1143、1145、1147、1149、1151、1153、1155、1157、1159、1161、1163、1165、1167、1169、1171、1173、1175、1177、1179、1181、1183、1185、1187、1189、1191、1193、1195、1197、1199、1201、1203、1205、1207、1209、1211、1213、1215、1217、1219、1221、1223、1225、1227、1229、1231、1233、1235、1237、1239、1241、1243、1245、1247、1249、1251、1253、1255、1257、1259、1261、1263、1265、1267、1269、1271、1273、1275、1277、1279、1281、1283、1285、1287、1289、1291、1293、1295、1297、1299、1301、1303、1305、1307、1309、1311、1313、1315、1317、1319、1321、1323、1325、1327、1329、1331、1333、1335、1337、1339、1341、1343、1345、1347、1349、1351、1353、1355、1357、1359、1361、1363、1365、1367、1369、1371、1373、1375、1377、1379、1381、1383、1385、1387、1389、1391、1393、1395、1397、1399、1401、1403、1405、1407、1409、1411、1413、1415、1417、1419、1421、1423、1425、1427、1429、1431、1433、1435、1437、1439、1441、1443、1445、1447、1449、1451、1453、1455、1457、1459、1461、1463、1465、1467、1469、1471、1473、1475、1477、1479、1481、1483、1485、1487、1489、1491、1493、1495、1497、1499、1501、1503、1505、1507、1509、1511、1513、1515、1517、1519、1521、1523、1525、1527、1529、1531、1533、1535、1537、1539、1541、1543、1545、1547、1549、1551、1553、1555、1557、1559、1561、1563、1565、1567、1569、1571、1573、1575、1577、1579、1581、1583、1585、1587、1589、1591、1593、1595、1597、1599、1601、1603、1605、1607、1609、1611、1613、1615、1617、1619、1621、1623、1625、1627、1629、1631、1633、1635、1637、1639、1641、1643、1645、1647、1649、1651、1653、1655、1657、1659、1661、1663、1665、1667、1669、1671、1673、1675、1677、1679、1681、1683、1685、1687、1689、1691、1693、1695、1697、1699、1701、1703、1705、1707、1709、1711、1713、1715、1717、1719、1721、1723、1725、1727、1729、1731、1733、1735、1737、1739、1741、1743、1745、1747、1749、1751、1753、1755、1757、1759、1761、1763、1765、1767、1769、1771、1773、1775、1777、1779、1781、1783、1785、1787、1789、1791、1793、1795、1797、1799、1801、1803、1805、1807、1809、1811、1813、1815、1817、1819、1821、1823、1825、1827、1829、1831、1833、1835、1837、1839、1841、1843、1845、1847、1849、1851、1853、1855、1857、1859、1861、1863、1865、1867、1869、1871、1873、1875、1877、1879、1881、1883、1885、1887、1889、1891、1893、1895、1897、1899、1901、1903、1905、1907、1909、1911、1913、1915、1917、1919、1921、1923、1925、1927、1929、1931、1933、1935、1937、1939、1941、1943、1945、1947、1949、1951、1953、1955、1957、1959、1961、1963、1965、1967、1969、1971、1973、1975、1977、1979、1981、1983、1985、1987、1989、1991、1993、1995、1997、1999、2001、2003、2005、2007、2009、2011、2013、2015、2017、2019、2021、2023、2025、2027、2029、2031、2033、2035、2037、2039、2041、2043、2045、2047、2049、2051、2053、2055、2057、2059、2061、2063、2065、2067、2069、2071、2073、2075、2077、2079、2081、2083、2085、2087、2089、2091、2093、2095、2097、2099、2101、2103、2105、2107、2109、2111、2113、2115、2117、2119、2121、2123、2125、2127、2129、2131、2133、2135、2137、2139、2141、2143、2145、2147、2149、2151、2153、2155、2157、2159、2161、2163、2165、2167、2169、2171、2173、2175、2177、2179、2181、2183、2185、2187、2189、2191、2193、2195、2197、2199、2201、2203、2205、2207、2209、2211、2213、2215、2217、2219、2221、2223、2225、2227、2229、2231、2233、2235、2237、2239、2241、2243、2245、2247、2249、2251、2253、2255、2257、2259、2261、2263、2265、2267、2269、2271、2273、2275、2277、2279、2281、2283、2285、2287、2289、2291、2293、2295、2297、2299、2301、2303、2305、2307、2309、2311、2313、2315、2317、2319、2321、2323、2325、2327、2329、2331、2333、2335、2337、2339、2341、2343、2345、2347、2349、2351、2353、2355、2357、2359、2361、2363、2365、2367、2369、2371、2373、2375、2377、2379、2381、2383、2385、2387、2389、2391、2393、2395、2397、2399、2401、2403、2405、2407、2409、2411、2413、2415、2417、2419、2421、2423、2425、2427、2429、2431、2433、2435、2437、2439、2441、2443、2445、2447、2449、2451、2453、2455、2457、2459、2461、2463、2465、2467、2469、2471、2473、2475、2477、2479、2481、2483、2485、2487、2489、2491、2493、2495、2497、2499、2501、2503、2505、2507、2509、2511、2513、2515、2517、2519、2521、2523、2525、2527、2529、2531、2533、2535、2537、2539、2541、2543、2545、2547、2549、2551、2553、2555、2557、2559、2561、2563、2565、2567、2569、2571、2573、2575、2577、2579、2581、2583、2585、2587、2589、2591、2593、2595、2597、2599、2601、2603、2605、2607、2609、2611、2613、2615、2617、2619、2621、2623、2625、2627、2629、2631、2633、2635、2637、2639、2641、2643、2645、2647、2649、2651、2653、2655、2657、2659、2661、2663、2665、2667、2669、2671、2673、2675、2677、2679、2681、2683、2685、2687、2689、2691、2693、2695、2697、2699、2701、2703、2705、2707、2709、2711、2713、2715、2717、2719、2721、2723、2725、2727、2729、2731、2733、2735、2737、2739、2741、2743、2745、2747、2749、2751、2753、2755、2757、2759、2761、2763、2765、2767、2769、2771、2773、2775、2777、2779、2781、2783、2785、2787、2789、2791、2793、2795、2797、2799、2801、2803、2805、2807、2809、2811、2813、2815、2817、2819、2821、2823、2825、2827、2829、2831、2833、2835、2837、2839、2841、2843、2845、2847、2849、2851、2853、2855、2857、2859、2861、2863、2865、2867、2869、2871、2873、2875、2877、2879、2881、2883、2885、2887、2889、2891、2893、2895、2897、2899、2901、2903、2905、2907、2909、2911、2913、2915、2917、2919、2921、2923、2925、2927、2929、2931、2933、2935、2937、2939、2941、2943、2945、2947、2949、2951、2953、2955、2957、2959、2961、2963、2965、2967、2969、2971、2973、2975、2977、2979、2981、2983、2985、2987、2989、2991、2993、2995、2997、2999、3001、3003、3005、3007、3009、3011、3013、3015、3017、3019、3021、3023、3025、3027、3029、3031、3033、3035、3037、3039、3041、3043、3045、3047、3049、3051、3053、3055、3057、3059、3061、3063、3065、3067、3069、3071、3073、3075、3077、3079、3081、3083、3085、3087、3089、3091、3093、3095、3097、3099、3101、3103、3105、3107、3109、3111、3113、3115、3117、3119、3121、3123、3125、3127、3129、3131、3133、3135、3137、3139、3141、3143、3145、3147、3149、3151、3153、3155、3157、3159、3161、3163、3165、3167、3169、3171、3173、3175、3177、3179、3181、3183、3185、3187、3189、3191、3193、3195、3197、3199、3201、3203、3205、3207、3209、3211、3213、3215、3217、3219、3221、3223、3225、3227、3229、3231、3233、3235、3237、3239、3241、3243、3245、3247、3249、3251、3253、3255、3257、3259、3261、3263、3265、3267、3269、3271、3273、3275、3277、3279、3281、3283、3285、3287、3289、3291、3293、3295、3297、3299、3301、3303、3305、3307、3309、3311、3313、3315、3317、3319、3321、3323、3325、3327、3329、3331、3333、3335、3337、3339、3341、3343、3345、3347、3349、3351、3353、3355、3357、3359、3361、3363、3365、3367、3369、3371、3373、3375、3377、3379、3381、3383、3385、3387、3389、3391、3393、3395、3397、3399、3401、3403、3405、3407、3409、3411、3413、3415、3417、3419、3421、3423、3425、3427、3429、3431、3433、3435、3437、3439、3441、3443、3445、3447、3449、3451、3453、3455、3457、3459、3461、3463、3465、3467、3469、3471、3473、3475、3477、3479、3481、3483、3485、3487、3489、3491、3493、3495、3497、3499、3501、3503、3505、3507、3509、3511、3513、3515、3517、3519、3521、3523、3525、3527、3529、3531、3533、3535、3537、3539、3541、3543、3545、3547、3549、3551、3553、3555、3557、3559、3561、3563、3565、3567、3569、3571、3573、3575、3577、3579、3581、3583、3585、3587、3589、3591、3593、3595、3597、3599、3601、3603、3605、3607、3609、3611、3613、3615、3617、3619、3621、3623、3625、3627、3629、3631、3633、3635、3637、3639、3641、3643、3645、3647、3649、3651、3653、3655、3657、3659、3661、3663、3665、3667、3669、3671、3673、3675、3677、3679、3681、3683、3685、3687、3689、3691、3693、3695、3697、3699、3701、3703、3705、3707、3709、3711、3713、3715、3717、3719、3721、3723、3725、3727、3729、3731、3733、3735、3737、3739、3741、3743、3745、3747、3749、3751、3753、3755、3757、3759、3761、3763、3765、3767、3769、3771、3773、3775、3777、3779、3781、3783、3785、3787、3789、3791、3793、3795、3797、3799、3801、3803、3805、3807、3809、3811、3813、3815、3817、3819、3821、3823、3825、3827、3829、3831、3833、3835、3837、3839、3841、3843、3845、3847、3849、3851、3853、3855、3857、3859、3861、3863、3865、3867、3869、3871、3873、3875、3877、3879、3881、3883、3885、3887、3889、3891、3893、3895、3897、3899、3901、3903、3905、3907、3909、3911、3913、3915、3917、3919、3921、3923、3925、3927、3929、3931、3933、3935、3937、3939、3941、3943、3945、3947、3949、3951、3953、3955、3957、3959、3961、3963、3965、3967、3969、3971、3973、3975、3977、3979、3981、3983、3985、3987、3989、3991、3993、3995、3997、3999、4001、4003、4005、4007、4009、4011、4013、4015、4017、4019或4021的核苷酸序列。
当在本文中使用时,短语“SEQ ID NO:4-4022的偶数编号序列”是指SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、410、412、414、416、418、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、562、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、602、604、606、608、610、612、614、616、618、620、622、624、626、628、630、632、634、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666、668、670、672、674、676、678、680、682、684、686、688、690、692、694、696、698、700、702、704、706、708、710、712、714、716、718、720、722、724、726、728、730、732、734、736、738、740、742、744、746、748、750、752、754、756、758、760、762、764、766、768、770、772、774、776、778、780、782、784、786、788、790、792、794、796、798、800、802、804、806、808、810、812、814、816、818、820、822、824、826、828、830、832、834、836、838、840、842、844、846、848、850、852、854、856、858、860、862、864、866、868、870、872、874、876、878、880、882、884、886、888、890、892、894、896、898、900、902、904、906、908、910、912、914、916、918、920、922、924、926、928、930、932、934、936、938、940、942、944、946、948、950、952、954、956、958、960、962、964、966、968、970、972、974、976、978、980、982、984、986、988、990、992、994、996、998、1000、1002、1004、1006、1008、1010、1012、1014、1016、1018、1020、1022、1024、1026、1028、1030、1032、1034、1036、1038、1040、1042、1044、1046、1048、1050、1052、1054、1056、1058、1060、1062、1064、1066、1068、1070、1072、1074、1076、1078、1080、1082、1084、1086、1088、1090、1092、1094、1096、1098、1100、1102、1104、1106、1108、1110、1112、1114、1116、1118、1120、1122、1124、1126、1128、1130、1132、1134、1136、1138、1140、1142、1144、1146、1148、1150、1152、1154、1156、1158、1160、1162、1164、1166、1168、1170、1172、1174、1176、1178、1180、1182、1184、1186、1188、1190、1192、1194、1196、1198、1200、1202、1204、1206、1208、1210、1212、1214、1216、1218、1220、1222、1224、1226、1228、1230、1232、1234、1236、1238、1240、1242、1244、1246、1248、1250、1252、1254、1256、1258、1260、1262、1264、1266、1268、1270、1272、1274、1276、1278、1280、1282、1284、1286、1288、1290、1292、1294、1296、1298、1300、1302、1304、1306、1308、1310、1312、1314、1316、1318、1320、1322、1324、1326、1328、1330、1332、1334、1336、1338、1340、1342、1344、1346、1348、1350、1352、1354、1356、1358、1360、1362、1364、1366、1368、1370、1372、1374、1376、1378、1380、1382、1384、1386、1388、1390、1392、1394、1396、1398、1400、1402、1404、1406、1408、1410、1412、1414、1416、1418、1420、1422、1424、1426、1428、1430、1432、1434、1436、1438、1440、1442、1444、1446、1448、1450、1452、1454、1456、1458、1460、1462、1464、1466、1468、1470、1472、1474、1476、1478、1480、1482、1484、1486、1488、1490、1492、1494、1496、1498、1500、1502、1504、1506、1508、1510、1512、1514、1516、1518、1520、1522、1524、1526、1528、1530、1532、1534、1536、1538、1540、1542、1544、1546、1548、1550、1552、1554、1556、1558、1560、1562、1564、1566、1568、1570、1572、1574、1576、1578、1580、1582、1584、1586、1588、1590、1592、1594、1596、1598、1600、1602、1604、1606、1608、1610、1612、1614、1616、1618、1620、1622、1624、1626、1628、1630、1632、1634、1636、1638、1640、1642、1644、1646、1648、1650、1652、1654、1656、1658、1660、1662、1664、1666、1668、1670、1672、1674、1676、1678、1680、1682、1684、1686、1688、1690、1692、1694、1696、1698、1700、1702、1704、1706、1708、1710、1712、1714、1716、1718、1720、1722、1724、1726、1728、1730、1732、1734、1736、1738、1740、1742、1744、1746、1748、1750、1752、1754、1756、1758、1760、1762、1764、1766、1768、1770、1772、1774、1776、1778、1780、1782、1784、1786、1788、1790、1792、1794、1796、1798、1800、1802、1804、1806、1808、1810、1812、1814、1816、1818、1820、1822、1824、1826、1828、1830、1832、1834、1836、1838、1840、1842、1844、1846、1848、1850、1852、1854、1856、1858、1860、1862、1864、1866、1868、1870、1872、1874、1876、1878、1880、1882、1884、1886、1888、1890、1892、1894、1896、1898、1900、1902、1904、1906、1908、1910、1912、1914、1916、1918、1920、1922、1924、1926、1928、1930、1932、1934、1936、1938、1940、1942、1944、1946、1948、1950、1952、1954、1956、1958、1960、1962、1964、1966、1968、1970、1972、1974、1976、1978、1980、1982、1984、1986、1988、1990、1992、1994、1996、1998、2000、2002、2004、2006、2008、2010、2012、2014、2016、2018、2020、2022、2024、2026、2028、2030、2032、2034、2036、2038、2040、2042、2044、2046、2048、2050、2052、2054、2056、2058、2060、2062、2064、2066、2068、2070、2072、2074、2076、2078、2080、2082、2084、2086、2088、2090、2092、2094、2096、2098、2100、2102、2104、2106、2108、2110、2112、2114、2116、2118、2120、2122、2124、2126、2128、2130、2132、2134、2136、2138、2140、2142、2144、2146、2148、2150、2152、2154、2156、2158、2160、2162、2164、2166、2168、2170、2172、2174、2176、2178、2180、2182、2184、2186、2188、2190、2192、2194、2196、2198、2200、2202、2204、2206、2208、2210、2212、2214、2216、2218、2220、2222、2224、2226、2228、2230、2232、2234、2236、2238、2240、2242、2244、2246、2248、2250、2252、2254、2256、2258、2260、2262、2264、2266、2268、2270、2272、2274、2276、2278、2280、2282、2284、2286、2288、2290、2292、2294、2296、2298、2300、2302、2304、2306、2308、2310、2312、2314、2316、2318、2320、2322、2324、2326、2328、2330、2332、2334、2336、2338、2340、2342、2344、2346、2348、2350、2352、2354、2356、2358、2360、2362、2364、2366、2368、2370、2372、2374、2376、2378、2380、2382、2384、2386、2388、2390、2392、2394、2396、2398、2400、2402、2404、2406、2408、2410、2412、2414、2416、2418、2420、2422、2424、2426、2428、2430、2432、2434、2436、2438、2440、2442、2444、2446、2448、2450、2452、2454、2456、2458、2460、2462、2464、2466、2468、2470、2472、2474、2476、2478、2480、2482、2484、2486、2488、2490、2492、2494、2496、2498、2500、2502、2504、2506、2508、2510、2512、2514、2516、2518、2520、2522、2524、2526、2528、2530、2532、2534、2536、2538、2540、2542、2544、2546、2548、2550、2552、2554、2556、2558、2560、2562、2564、2566、2568、2570、2572、2574、2576、2578、2580、2582、2584、2586、2588、2590、2592、2594、2596、2598、2600、2602、2604、2606、2608、2610、2612、2614、2616、2618、2620、2622、2624、2626、2628、2630、2632、2634、2636、2638、2640、2642、2644、2646、2648、2650、2652、2654、2656、2658、2660、2662、2664、2666、2668、2670、2672、2674、2676、2678、2680、2682、2684、2686、2688、2690、2692、2694、2696、2698、2700、2702、2704、2706、2708、2710、2712、2714、2716、2718、2720、2722、2724、2726、2728、2730、2732、2734、2736、2738、2740、2742、2744、2746、2748、2750、2752、2754、2756、2758、2760、2762、2764、2766、2768、2770、2772、2774、2776、2778、2780、2782、2784、2786、2788、2790、2792、2794、2796、2798、2800、2802、2804、2806、2808、2810、2812、2814、2816、2818、2820、2822、2824、2826、2828、2830、2832、2834、2836、2838、2840、2842、2844、2846、2848、2850、2852、2854、2856、2858、2860、2862、2864、2866、2868、2870、2872、2874、2876、2878、2880、2882、2884、2886、2888、2890、2892、2894、2896、2898、2900、2902、2904、2906、2908、2910、2912、2914、2916、2918、2920、2922、2924、2926、2928、2930、2932、2934、2936、2938、2940、2942、2944、2946、2948、2950、2952、2954、2956、2958、2960、2962、2964、2966、2968、2970、2972、2974、2976、2978、2980、2982、2984、2986、2988、2990、2992、2994、2996、2998、3000、3002、3004、3006、3008、3010、3012、3014、3016、3018、3020、3022、3024、3026、3028、3030、3032、3034、3036、3038、3040、3042、3044、3046、3048、3050、3052、3054、3056、3058、3060、3062、3064、3066、3068、3070、3072、3074、3076、3078、3080、3082、3084、3086、3088、3090、3092、3094、3096、3098、3100、3102、3104、3106、3108、3110、3112、3114、3116、3118、3120、3122、3124、3126、3128、3130、3132、3134、3136、3138、3140、3142、3144、3146、3148、3150、3152、3154、3156、3158、3160、3162、3164、3166、3168、3170、3172、3174、3176、3178、3180、3182、3184、3186、3188、3190、3192、3194、3196、3198、3200、3202、3204、3206、3208、3210、3212、3214、3216、3218、3220、3222、3224、3226、3228、3230、3232、3234、3236、3238、3240、3242、3244、3246、3248、3250、3252、3254、3256、3258、3260、3262、3264、3266、3268、3270、3272、3274、3276、3278、3280、3282、3284、3286、3288、3290、3292、3294、3296、3298、3300、3302、3304、3306、3308、3310、3312、3314、3316、3318、3320、3322、3324、3326、3328、3330、3332、3334、3336、3338、3340、3342、3344、3346、3348、3350、3352、3354、3356、3358、3360、3362、3364、3366、3368、3370、3372、3374、3376、3378、3380、3382、3384、3386、3388、3390、3392、3394、3396、3398、3400、3402、3404、3406、3408、3410、3412、3414、3416、3418、3420、3422、3424、3426、3428、3430、3432、3434、3436、3438、3440、3442、3444、3446、3448、3450、3452、3454、3456、3458、3460、3462、3464、3466、3468、3470、3472、3474、3476、3478、3480、3482、3484、3486、3488、3490、3492、3494、3496、3498、3500、3502、3504、3506、3508、3510、3512、3514、3516、3518、3520、3522、3524、3526、3528、3530、3532、3534、3536、3538、3540、3542、3544、3546、3548、3550、3552、3554、3556、3558、3560、3562、3564、3566、3568、3570、3572、3574、3576、3578、3580、3582、3584、3586、3588、3590、3592、3594、3596、3598、3600、3602、3604、3606、3608、3610、3612、3614、3616、3618、3620、3622、3624、3626、3628、3630、3632、3634、3636、3638、3640、3642、3644、3646、3648、3650、3652、3654、3656、3658、3660、3662、3664、3666、3668、3670、3672、3674、3676、3678、3680、3682、3684、3686、3688、3690、3692、3694、3696、3698、3700、3702、3704、3706、3708、3710、3712、3714、3716、3718、3720、3722、3724、3726、3728、3730、3732、3734、3736、3738、3740、3742、3744、3746、3748、3750、3752、3754、3756、3758、3760、3762、3764、3766、3768、3770、3772、3774、3776、3778、3780、3782、3784、3786、3788、3790、3792、3794、3796、3798、3800、3802、3804、3806、3808、3810、3812、3814、3816、3818、3820、3822、3824、3826、3828、3830、3832、3834、3836、3838、3840、3842、3844、3846、3848、3850、3852、3854、3856、3858、3860、3862、3864、3866、3868、3870、3872、3874、3876、3878、3880、3882、3884、3886、3888、3890、3892、3894、3896、3898、3900、3902、3904、3906、3908、3910、3912、3914、3916、3918、3920、3922、3924、3926、3928、3930、3932、3934、3936、3938、3940、3942、3944、3946、3948、3950、3952、3954、3956、3958、3960、3962、3964、3966、3968、3970、3972、3974、3976、3978、3980、3982、3984、3986、3988、3990、3992、3994、3996、3998、4000、4002、4004、4006、4008、4010、4012、4014、4016、4018、4020或4022的多肽序列。
本文描述了编码与野生型LbCas12a酶相比在非经典TTTT前间区序列邻近基序(PAM)处具有增强的编辑活性的突变体LbCas12a多肽的核酸。
通过将可以靶向的PAM序列范围从基因组的富含GC的区域(Cas9)扩展到富含AT的区域(Cas12a),从而扩充了可以使用CRISPR基因组工程方法修饰的序列的范围,Cas12a为Cas9提供了有用的补充。除了具有富含T的PAM位点之外,Cas12a系统与Cas9相比的另一个优点是使用单个短RNA分子。
本文描述了分离的突变体Cas12a蛋白,其相对于野生型Cas12a氨基酸序列包含至少一个点突变。所述分离的突变体Cas12a蛋白在簇集规则间隔短回文重复序列(CRISPR)/CRISPR相关蛋白核酸内切酶系统(“CRISPR/Cas12a核酸内切酶系统”)中有活性。所述CRISPR/Cas12a核酸内切酶系统相对于野生型CRISPR/Cas核酸内切酶系统表现出维持的靶上编辑活性。在一种情况下,所述Cas12a蛋白来自于毛螺菌科(Lachnospiraceae)细菌ND2006(Lb)。野生型LbCas12a蛋白(SEQ ID NO:2)由下面示出的核苷酸序列(SEQ ID NO:1)编码。
野生型LbCas12a DNA序列(SEQ ID NO:1;3684nt)
Figure BPA0000330845410000391
Figure BPA0000330845410000401
Figure BPA0000330845410000411
Figure BPA0000330845410000421
WT LbCas12a氨基酸序列(SEQ ID NO:2;1228 AA)
Figure BPA0000330845410000422
Figure BPA0000330845410000431
本文描述了在非经典TTTT PAM处的DNA切割活性的细菌筛选中LbCas12a的所选点突变的表型。进行了LbCas12a的基于细菌的定向进化,以鉴定具有增强的切割活性的突变。创建了一个深度扫描突变文库,其含有LbCas12a的整个编码序列上所有可能的氨基酸点突变,其中大多数克隆只含有单个突变。Wrenbeck等,Nat.Methods 13:928-930(2016)。这种类型的文库允许通过在细菌筛选中测量每个点突变与野生型LbCas12a蛋白相比的相对存活率,对它们的表型进行定向评估。
所述筛选通过用突变体LbCas12a文库和靶向毒素质粒上的HPRT38346位点的crRNA转化带有毒素质粒的筛选菌株来进行。在回收和IPTG诱导后,将细胞在含有阿拉伯糖的LB-氯霉素培养基上铺板,并在37℃温育过夜。有功能的LbCas12酶能够具有CRISPR活性并使毒素质粒失活。如果突变体LbCas12a酶无功能,则所述转化的筛选大肠杆菌不能存活。提取并纯化存活的大肠杆菌细胞携带的LbCas12a表达质粒。将输入和所选质粒文库两者通过PCR进行扩增,用Nextera文库制备试剂盒随机片段化,并在Illumina NextSeqTM上以每个文库~4000万个读出进行测序。测量两个文库中在LbCas12a的每个位置处的突变频率并归一化到每个密码子的总覆盖率。每个点突变的相对存活率被计算为所选与输入文库之间归一化频率之比。由于在阿拉伯糖选择下的细胞存活程度指示了LbCas12a变体在HPRT38346前间区序列处的切割活性,因此在选择期间富集的超过WT的任何变体均为在TTTT PAM处具有增强活性的变体。
细菌筛选中LbCas12a的17,278个点突变的表型度量了在非经典TTTT PAM处的切割活性。使用表型测量进行了两个生物学平行实验,这使得能够分离大量具有增强的切割活性的新LbCas12a变体。文库中的突变残基示出在表1中;野生型突变氨基酸列于野生型序列上方(未示出实际的突变残基,例如仅示出S2而不是S2H)。具体的突变和活性水平示出在表2中。图2示出了横跨野生型LbCas12a氨基酸序列的突变的活性评分,并注明了排名前十的突变体。所述表型评分(或活性评分)被计算为所选(第4轮)和输入文库(第3轮)之间的归一化频率之比的自然对数,其中每个位置处每个突变体的归一化频率被计算为每个位置处突变体与同义变化之比。
特定突变的表型在大肠杆菌中作为每个突变体的菌落形成单位(CFU)进行评估。那些在选择后具有提高的CFU的突变体指示了在大肠杆菌中提高的编辑效率,不论实际机制如何。
Figure BPA0000330845410000441
Figure BPA0000330845410000451
在上面示出的野生型LbCas12a多肽序列中,粗体斜体氨基酸指示了如本文中所述被单独或组合替换的野生型氨基酸。本文描述的LbCas12a突变体可用作研究工具或用于治疗用途,用于任何CRISPR/Cas12a DNA切割或基因编辑实验或治疗。这些突变体的优越活性可以潜在地增强LbCas12a的编辑效率,并在基因组编辑应用中直接代替WT-LbCas12a。
本文描述的一个实施方式是一种分离的突变体LbCas12a多肽,其包含引入到SEQID NO:2的野生型LbCas12a多肽序列中的至少一个氨基酸替换,条件是所述突变体LbCas12a多肽与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。在一种情况下,所述突变体LbCas12a多肽与选自SEQ IDNO:4-4022的偶数编号序列的多肽序列具有95%至99%同一性。在另一种情况下,所述突变体LbCas12a多肽具有选自SEQ ID NO:4-4022的偶数编号序列的多肽序列。在另一种情况下,所述突变体LbCas12a多肽包含在SEQ ID NO:2的野生型LbCas12a多肽序列的第81、125、145、146、152、182、396、478、491、582、595、606、646、665、795、799、814、839、841、858、860、890、898、909、913、981、1020、1083或1121位处的至少一个氨基酸替换。在另一种情况下,所述突变体LbCas12a多肽包含选自SEQ ID NO:2的野生型LbCas12a多肽序列的F81E、E125K、N145R、G146R、T152K、R182V、S396D、K478R、V491D、N582R、K595R、Y606F、Y646H、D665N、E795Q、P799V、T814G、L839F、I841A、E858V、I860R、W890A、E898N、H909K、E913R、E981V、S1020E、V1083W或K1121D的至少一个氨基酸替换。在另一种情况下,所述突变体LbCas12a多肽选自:F81E,SEQ ID NO:802;E125K,SEQ ID NO:428;N145R,SEQ ID NO:2902;G146R,SEQID NO:156;T152K,SEQ ID NO:694;R182V,SEQ ID NO:98;S396D,SEQ ID NO:108;K478R,SEQ ID NO:134;V491D,SEQ ID NO:954;N582R,SEQ ID NO:1730;K595R,SEQ ID NO:184;Y606F,SEQ ID NO:642;Y646H,SEQ ID NO:720;D665N,SEQ ID NO:1014;E795Q,SEQ ID NO:930;P799V,SEQ ID NO:706;T814G,SEQ ID NO:162;L839F,SEQ ID NO:834;I841A,SEQ IDNO:988;E858V,SEQ ID NO:114;I860R,SEQ ID NO:250;W890A,SEQ ID NO:3958;E898N,SEQID NO:48;H909K,SEQ ID NO:70;E913R,SEQ ID NO:1960;E981V,SEQ ID NO:880;S1020E,SEQ ID NO:532;V1083W,SEQ ID NO:132;或K1121D,SEQ ID NO:598。在另一种情况下,所述突变体LbCas12a多肽包含选自下述的替换突变:(a)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自下述位置的单个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121;或(b)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自至少两个下述位置的多个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121。在另一种情况下,所述多个替换突变包括E88A/E795Q、E125K/E795Q、G146R/E795Q、R182V/E795Q、V491D/E795Q、Q529I/E795Q、Y646H/E795Q、D665N/E795Q、T814K/E795Q、L839F/E795Q、Q906F/E795Q、E795Q/Q1170D、G146R/R182V/E795Q、G146R/E795Q/D665N、G146R/E795Q/E981V、G146R/E795Q/T814K、G146R/R182V/D665N、E125K/R182V/E981V、R182V/P799V/E981V、R182V/T814K/E981V、G146R/P799V/E981V、G146R/R182V/E795Q/F81E、G146R/R182V/E795Q/E125K、G146R/R182V/E795Q/E125A、G146R/R182V/E795Q/P799V、G146R/R182V/E795Q/T814K、G146R/R182V/E795Q/E981V、G146R/R182V/E795Q/D665N、G146R/R182V/P799V/E981V、E125K/G146R/R182V/E795Q/D665N、G146R/R182V/E795Q/P799V/T814K或E125K/G146R/R182V/E795Q/D665N/E981V。在另一种情况下,所述多个替换突变包括E88A/E795Q、E125K/E795Q、G146R/E795Q、R182V/E795Q、V491D/E795Q、Q529I/E795Q、Y646H/E795Q、D665N/E795Q、T814K/E795Q、L839F/E795Q、Q906F/E795Q、E795Q/Q1170D、G 146R/R182V/E795Q、G146R/E795Q/D665N、G146R/E795Q/E981V、G146R/E795Q/T814K、G146R/R182V/D665N、E125K/R182V/E981V、R182V/P799V/E981V、R182V/T814K/E981V、G146R/P799V/E981V、G146R/R182V/E795Q/F81E、G146R/R182V/E795Q/E125K、G146R/R182V/E795Q/E125A、G146R/R182V/E795Q/P799V、G146R/R182V/E795Q/T814K、G146R/R182V/E795Q/E981V、G146R/R182V/E795Q/D665N、G146R/R182V/P799V/E981V、E125K/G146R/R182V/E795Q/D665N或G146R/R182V/E795Q/P799V/T814K,并且与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。在另一种情况下,所述突变体LbCas12a多肽选自SEQ ID NO:802、428、2902、156、694、98、954、134、1730、642、720、1014、930、706、834、988、114、250、3958、48、70、1960、880、532、598、3960、3962、3964、3966、3968、3970、3972、3974、3976、3978、3980、3982、3984、3986、3988、3990、3992、3994、3996、3998、4000、4002、4004、4006、4008、4010、4012、4014、4016、4018、4020或4022。在另一种情况下,所述突变体LbCas12a多肽选自F81E(SEQ ID NO:802)、E125K(SEQ ID NO:428)、N145R(SEQ ID NO:2902)、G146R(SEQ ID NO:156)、T152K(SEQ ID NO:694)、R182V(SEQ ID NO:98)、V491D(SEQID NO:954)、K478R(SEQ ID NO:134)、N582R(SEQ ID NO:1730)、D665N(SEQ ID NO:1014)、E795Q(SEQ ID NO:930)、P799V(SEQ ID NO:706)、E858V(SEQ ID NO:114)、I860R(SEQ IDNO:250)、E913R(SEQ ID NO:1960)、E981V(SEQ ID NO:880)、E88A/E795Q(SEQ ID NO:3960)、E125K/E795Q(SEQ ID NO:3962)、G146R/E795Q(SEQ ID NO:3964)、R182V/E795Q(SEQID NO:3966)、V491D/E795Q(SEQ ID NO:3968)、Q529I/E795Q(SEQ ID NO:3970)、Y646H/E795Q(SEQ ID NO:3972)、D665N/E795Q(SEQ ID NO:3974)、T814K/E795Q(SEQ ID NO:3976)、L839F/E795Q(SEQ ID NO:3978)、Q906F/E795Q(SEQ ID NO:3980)、E795Q/Q1170D(SEQ ID NO:3982)、G146R/R182V/E795Q(SEQ ID NO:3984)、G146R/E795Q/D665N(SEQ IDNO:3986)、G146R/E795Q/E981V(SEQ ID NO:3988)、G146R/E795Q/T814K(SEQ ID NO:3990)、G146R/R182V/D665N(SEQ ID NO:3992)、E125K/R182V/E981V(SEQ ID NO:3994)、R182V/P799V/E981V(SEQ ID NO:3996)、R182V/T814K/E981V(SEQ ID NO:3998)、G146R/P799V/E981V(SEQ ID NO:4000)、G146R/R182V/E795Q/F81E(SEQ ID NO:4002)、G146R/R182V/E795Q/E125K(SEQ ID NO:4004)、G146R/R182V/E795Q/E125A(SEQ ID NO:4006)、G146R/R182V/E795Q/P799V(SEQ ID NO:4008)、G146R/R182V/E795Q/T814K(SEQ ID NO:4010)、G146R/R182V/E795Q/E981V(SEQ ID NO:4012)、G146R/R182V/E795Q/D665N(SEQ ID NO:4014)、G146R/R182V/P799V/E981V(SEQ ID NO:4016)、E125K/G146R/R182V/E795Q/D665N(SEQ ID NO:4018)或G146R/R182V/E795Q/P799V/T814K(SEQ ID NO:4020)。在另一种情况下,所述突变体LbCas12a多肽是G146R/R182V/E795Q(SEQ ID NO:3984)。
本文描述的另一个实施方式是一种分离的多核苷酸序列,其编码突变体LbCas12a多肽,所述突变体LbCas12a多肽包含引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的至少一个氨基酸替换,条件是所述突变体LbCas12a多肽与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。在一种情况下,所述编码的突变体LbCas12a多肽与选自SEQ ID NO:4-4022的偶数编号序列的多肽序列具有95%至99%同一性。在另一种情况下,所述编码的突变体LbCas12a多肽具有选自SEQ IDNO:4-4022的偶数编号序列的多肽序列。在另一种情况下,所述突变体LbCas12a多核苷酸序列与选自SEQ ID NO:3-4021的奇数编号序列的核苷酸序列具有95%至99%同一性。在另一种情况下,所述突变体LbCas12a多核苷酸具有选自SEQ ID NO:3-4021的奇数编号序列的核苷酸序列。在另一种情况下,所述编码的突变体LbCas12a多肽包含在SEQ ID NO:2的野生型LbCas12a多肽序列的第81、125、145、146、152、182、396、478、491、582、595、606、646、665、795、799、814、839、841、858、860、890、898、909、913、981、1020、1083或1121位处的至少一个氨基酸替换。在另一种情况下,所述编码的突变体LbCas12a多肽与SEQ ID NO:2的野生型LbCas12a多肽序列相比包含选自F81E、E125K、N145R、G146R、T152K、R182V、S396D、K478R、V491D、N582R、K595R、Y606F、Y646H、D665N、E795Q、P799V、T814G、L839F、I841A、E858V、I860R、W890A、E898N、H909K、E913R、E981V、S1020E、V1083W或K1121D的至少一个氨基酸替换。在另一种情况下,所述突变体LbCas12a多核苷酸选自:F81E,SEQ ID NO:802;E125K,SEQID NO:428;N145R,SEQ ID NO:2902;G146R,SEQ ID NO:156;T152K,SEQ ID NO:694;R182V,SEQ ID NO:98;S396D,SEQ ID NO:108;K478R,SEQ ID NO:134;V491D,SEQ ID NO:954;N582R,SEQ ID NO:1730;K595R,SEQ ID NO:184;Y606F,SEQ ID NO:642;Y646H,SEQ ID NO:720;D665N,SEQ ID NO:1014;E795Q,SEQ ID NO:930;P799V,SEQ ID NO:706;T814G,SEQ IDNO:162;L839F,SEQ ID NO:834;I841A,SEQ ID NO:988;E858V,SEQ ID NO:114;I860R,SEQID NO:250;W890A,SEQ ID NO:3958;E898N,SEQ ID NO:48;H909K,SEQ ID NO:70;E913R,SEQ ID NO:1960;E981V,SEQ ID NO:880;S1020E,SEQ ID NO:532;V1083W,SEQ ID NO:132;或K1121D,SEQ ID NO:598。在另一种情况下,所述编码的突变体LbCas12a多肽包含选自下述的替换突变:(a)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自下述位置的单个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121;或(b)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自至少两个下述位置的多个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121。在另一种情况下,所述多个替换突变包括E88A/E795Q、E125K/E795Q、G146R/E795Q、R182V/E795Q、V491D/E795Q、Q529I/E795Q、Y646H/E795Q、D665N/E795Q、T814K/E795Q、L839F/E795Q、Q906F/E795Q、E795Q/Q1170D、G146R/R182V/E795Q、G146R/E795Q/D665N、G146R/E795Q/E981V、G146R/E795Q/T814K、G146R/R182V/D665N、E125K/R182V/E981V、R182V/P799V/E981V、R182V/T814K/E981V、G146R/P799V/E981V、G146R/R182V/E795Q/F81E、G146R/R182V/E795Q/E125K、G146R/R182V/E795Q/E125A、G146R/R182V/E795Q/P799V、G146R/R182V/E795Q/T814K、G146R/R182V/E795Q/E981V、G146R/R182V/E795Q/D665N、G146R/R182V/P799V/E981V、E125K/G146R/R182V/E795Q/D665N、G146R/R182V/E795Q/P799V/T814K或E125K/G146R/R182V/E795Q/D665N/E981V。在另一种情况下,所述多个替换突变包括E88A/E795Q、E125K/E795Q、G146R/E795Q、R182V/E795Q、V491D/E795Q、Q529I/E795Q、Y646H/E795Q、D665N/E795Q、T814K/E795Q、L839F/E795Q、Q906F/E795Q、E795Q/Q1170D、G146R/R182V/E795Q、G146R/E795Q/D665N、G146R/E795Q/E981V、G146R/E795Q/T814K、G146R/R182V/D665N、E125K/R182V/E981V、R182V/P799V/E981V、R182V/T814K/E981V、G146R/P799V/E981V、G146R/R182V/E795Q/F81E、G146R/R182V/E795Q/E125K、G146R/R182V/E795Q/E125A、G146R/R182V/E795Q/P799V、G146R/R182V/E795Q/T814K、G146R/R182V/E795Q/E981V、G146R/R182V/E795Q/D665N、G146R/R182V/P799V/E981V、E125K/G146R/R182V/E795Q/D665N或G146R/R182V/E795Q/P799V/T814K,并且与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。在另一种情况下,所述编码的突变体LbCas12a多肽选自F81E(SEQ ID NO:802)、E125K(SEQ ID NO:428)、N145R(SEQ ID NO:2902)、G146R(SEQ ID NO:156)、T152K(SEQ ID NO:694)、R182V(SEQ ID NO:98)、V491D(SEQ ID NO:954)、K478R(SEQ ID NO:134)、N582R(SEQID NO:1730)、D665N(SEQ ID NO:1014)、E795Q(SEQ ID NO:930)、P799V(SEQ ID NO:706)、E858V(SEQ ID NO:114)、I860R(SEQ ID NO:250)、E913R(SEQ ID NO:1960)、E981V(SEQ IDNO:880)、E88A/E795Q(SEQ ID NO:3960)、E125K/E795Q(SEQ ID NO:3962)、G146R/E795Q(SEQ ID NO:3964)、R182V/E795Q(SEQ ID NO:3966)、V491D/E795Q(SEQ ID NO:3968)、Q529I/E795Q(SEQ ID NO:3970)、Y646H/E795Q(SEQ ID NO:3972)、D665N/E795Q(SEQ IDNO:3974)、T814K/E795Q(SEQ ID NO:3976)、L839F/E795Q(SEQ ID NO:3978)、Q906F/E795Q(SEQ ID NO:3980)、E795Q/Q1170D(SEQ ID NO:3982)、G146R/R182V/E795Q(SEQ ID NO:3984)、G146R/E795Q/D665N(SEQ ID NO:3986)、G146R/E795Q/E981V(SEQ ID NO:3988)、G146R/E795Q/T814K(SEQ ID NO:3990)、G146R/R182V/D665N(SEQ ID NO:3992)、E125K/R182V/E981V(SEQ ID NO:3994)、R182V/P799V/E981V(SEQ ID NO:3996)、R182V/T814K/E981V(SEQ ID NO:3998)、G146R/P799V/E981V(SEQ ID NO:4000)、G146R/R182V/E795Q/F81E(SEQ ID NO:4002)、G146R/R182V/E795Q/E125K(SEQ ID NO:4004)、G146R/R182V/E795Q/E125A(SEQ ID NO:4006)、G146R/R182V/E795Q/P799V(SEQ ID NO:4008)、G146R/R182V/E795Q/T814K(SEQ ID NO:4010)、G146R/R182V/E795Q/E981V(SEQ ID NO:4012)、G146R/R182V/E795Q/D665N(SEQ ID NO:4014)、G146R/R182V/P799V/E981V(SEQ ID NO:4016)、E125K/G146R/R182V/E795Q/D665N(SEQ ID NO:4018)或G146R/R182V/E795Q/P799V/T814K(SEQ ID NO:4020)。在另一种情况下,所述编码的突变体LbCas12a多肽是G146R/R182V/E795Q(SEQ ID NO:3984)。在另一种情况下,所述突变体LbCas12a多核苷酸选自SEQID NO:801、427、2901、155、693、97、953、133、1729、641、719、1013、929、705、833、987、113、249、3957、47、69、1959、879、531、597、3959、3961、3963、3965、3967、3969、3971、3973、3975、3977、3979、3981、3983、3985、3987、3989、3991、3993、3995、3997、3999、4001、4003、4005、4007、4009、4011、4013、4015、4017、4019或4021。在另一种情况下,所述突变体LbCas12a多核苷酸选自SEQ ID NO:801、427、2901、155、693、97、953、133、1729、1013、929、705、113、249、531、597、3959、3961、3963、3965、3967、3969、3971、3973、3975、3977、3979、3981、3983、3985、3987、3989、3991、3993、3995、3997、3999、4001、4003、4005、4007、4009、4011、4013、4015、4017或4019,并编码与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高的突变体LbCas12a多肽。在另一种情况下,所述突变体LbCas12a多核苷酸是SEQ ID NO:3983。
本文描述的另一个实施方式是一种载体或质粒,其包含本文中描述的任何多核苷酸序列。
本文描述的另一个实施方式是一种细胞,其包含本文中描述的任何多核苷酸序列或本文中描述的载体或质粒。
本文描述的另一个实施方式是一种分离的核糖核蛋白复合体,其包含向导RNA和突变体LbCas12a多肽,所述突变体LbCas12a多肽包含引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的至少一个氨基酸替换,条件是所述突变体LbCas12a多肽与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。在一种情况下,所述突变体LbCas12a多肽具有选自SEQ ID NO:4-4022的偶数编号序列的多肽序列。在另一种情况下,所述突变体LbCas12a多肽包含在SEQ ID NO:2的野生型LbCas12a多肽序列的第81、125、145、146、152、182、396、478、491、582、595、606、646、665、795、799、814、839、841、858、860、890、898、909、913、981、1020、1083或1121位处的至少一个氨基酸替换。在另一种情况下,所述突变体LbCas12a多肽包含选自SEQ ID NO:2的野生型LbCas12a多肽序列的F81E、E125K、N145R、G146R、T152K、R182V、S396D、K478R、V491D、N582R、K595R、Y606F、Y646H、D665N、E795Q、P799V、T814G、L839F、I841A、E858V、I860R、W890A、E898N、H909K、E913R、E981V、S1020E、V1083W或K1121D的至少一个氨基酸替换。在另一种情况下,所述突变体LbCas12a多肽选自:F81E,SEQ ID NO:802;E125K,SEQ ID NO:428;N145R,SEQ ID NO:2902;G146R,SEQ ID NO:156;T152K,SEQ ID NO:694;R182V,SEQ ID NO:98;S396D,SEQ ID NO:108;K478R,SEQ ID NO:134;V491D,SEQ ID NO:954;N582R,SEQ ID NO:1730;K595R,SEQ ID NO:184;Y606F,SEQ ID NO:642;Y646H,SEQ ID NO:720;D665N,SEQ IDNO:1014;E795Q,SEQ ID NO:930;P799V,SEQ ID NO:706;T814G,SEQ ID NO:162;L839F,SEQID NO:834;I841A,SEQ ID NO:988;E858V,SEQ ID NO:114;I860R,SEQ ID NO:250;W890A,SEQ ID NO:3958;E898N,SEQ ID NO:48;H909K,SEQ ID NO:70;E913R,SEQ ID NO:1960;E981V,SEQ ID NO:880;S1020E,SEQ ID NO:532;V1083W,SEQ ID NO:132;或K1121D,SEQ IDNO:598。在另一种情况下,所述突变体LbCas12a多肽选自F81E(SEQ ID NO:802)、E125K(SEQID NO:428)、N145R(SEQ ID NO:2902)、G146R(SEQ ID NO:156)、T152K(SEQ ID NO:694)、R182V(SEQ ID NO:98)、V491D(SEQ ID NO:954)、K478R(SEQ ID NO:134)、N582R(SEQ IDNO:1730)、D665N(SEQ ID NO:1014)、E795Q(SEQ ID NO:930)、P799V(SEQ ID NO:706)、E858V(SEQ ID NO:114)、I860R(SEQ ID NO:250)、E913R(SEQ ID NO:1960)、E981V(SEQ IDNO:880)、E88A/E795Q(SEQ ID NO:3960)、E125K/E795Q(SEQ ID NO:3962)、G146R/E795Q(SEQ ID NO:3964)、R182V/E795Q(SEQ ID NO:3966)、V491D/E795Q(SEQ ID NO:3968)、Q529I/E795Q(SEQ ID NO:3970)、Y646H/E795Q(SEQ ID NO:3972)、D665N/E795Q(SEQ IDNO:3974)、T814K/E795Q(SEQ ID NO:3976)、L839F/E795Q(SEQ ID NO:3978)、Q906F/E795Q(SEQ ID NO:3980)、E795Q/Q1170D(SEQ ID NO:3982)、G146R/R182V/E795Q(SEQ ID NO:3984)、G146R/E795Q/D665N(SEQ ID NO:3986)、G146R/E795Q/E981V(SEQ ID NO:3988)、G146R/E795Q/T814K(SEQ ID NO:3990)、G146R/R182V/D665N(SEQ ID NO:3992)、E125K/R182V/E981V(SEQ ID NO:3994)、R182V/P799V/E981V(SEQ ID NO:3996)、R182V/T814K/E981V(SEQ ID NO:3998)、G146R/P799V/E981V(SEQ ID NO:4000)、G146R/R182V/E795Q/F81E(SEQ ID NO:4002)、G146R/R182V/E795Q/E125K(SEQ ID NO:4004)、G146R/R182V/E795Q/E125A(SEQ ID NO:4006)、G146R/R182V/E795Q/P799V(SEQ ID NO:4008)、G146R/R182V/E795Q/T814K(SEQ ID NO:4010)、G146R/R182V/E795Q/E981V(SEQ ID NO:4012)、G146R/R182V/E795Q/D665N(SEQ ID NO:4014)、G146R/R182V/P799V/E981V(SEQ ID NO:4016)、E125K/G146R/R182V/E795Q/D665N(SEQ ID NO:4018)或G146R/R182V/E795Q/P799V/T814K(SEQ ID NO:4020)。在另一种情况下,所述突变体LbCas12a多肽是G146R/R182V/E795Q(SEQ ID NO:3984)。
本文描述的另一个实施方式是一种使用CRISPR核糖核蛋白复合体在细胞中提高在非经典TTTT PAM位点处的基因编辑效率的方法,所述方法包括将细胞与包括向导RNA和突变体LbCas12a多肽的CRISPR核糖核蛋白复合体接触,所述突变体LbCas12a多肽包含引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的至少一个氨基酸替换,条件是所述突变体LbCas12a多肽与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CR/SPR/LbCas12a相关核酸酶活性的提高。在一种情况下,所述突变体LbCas12a多肽具有选自SEQID NO:4-4022的偶数编号序列的多肽序列。在另一种情况下,所述突变体LbCas12a多肽包含在SEQ ID NO:2的野生型LbCas12a多肽序列的第81、125、145、146、152、182、396、478、491、582、595、606、646、665、795、799、814、839、841、858、860、890、898、909、913、981、1020、1083或1121位处的至少一个氨基酸替换。在另一种情况下,所述突变体LbCas12a多肽包含选自SEQ ID NO:2的野生型LbCas12a多肽序列的F81E、E125K、N145R、G146R、T152K、R182V、S396D、K478R、V491D、N582R、K595R、Y606F、Y646H、D665N、E795Q、P799V、T814G、L839F、I841A、E858V、I860R、W890A、E898N、H909K、E913R、E981V、S1020E、V1083W或K1121D的至少一个氨基酸替换。在另一种情况下,所述突变体LbCas12a多肽选自:F81E,SEQ ID NO:802;E125K,SEQ ID NO:428;N145R,SEQ ID NO:2902;G146R,SEQ ID NO:156;T152K,SEQ ID NO:694;R182V,SEQ ID NO:98;S396D,SEQ ID NO:108;K478R,SEQ ID NO:134;V491D,SEQ IDNO:954;N582R,SEQ ID NO:1730;K595R,SEQ ID NO:184;Y606F,SEQ ID NO:642;Y646H,SEQID NO:720;D665N,SEQ ID NO:1014;E795Q,SEQ ID NO:930;P799V,SEQ ID NO:706;T814G,SEQ ID NO:162;L839F,SEQ ID NO:834;I841A,SEQ ID NO:988;E858V,SEQ ID NO:114;I860R,SEQ ID NO:250;W890A,SEQ ID NO:3958;E898N,SEQ ID NO:48;H909K,SEQ ID NO:70;E913R,SEQ ID NO:1960;E981V,SEQ ID NO:880;S1020E,SEQ ID NO:532;V1083W,SEQID NO:132;或K1121D,SEQ ID NO:598。在另一种情况下,所述突变体LbCas12a多肽包含选自下述的替换突变:(a)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自下述位置的单个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121;或(b)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自至少两个下述位置的多个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121。在另一种情况下,所述多个替换突变包括E88A/E795Q、E125K/E795Q、G146R/E795Q、R182V/E795Q、V491D/E795Q、Q529I/E795Q、Y646H/E795Q、D665N/E795Q、T814K/E795Q、L839F/E795Q、Q906F/E795Q、E795Q/Q 1170D、G146R/R182V/E795Q、G146R/E795Q/D665N、G146R/E795Q/E981V、G146R/E795Q/T814K、G146R/R182V/D665N、E125K/R182V/E981V、R182V/P799V/E981V、R182V/T814K/E981V、G146R/P799V/E981V、G146R/R182V/E795Q/F81E、G146R/R182V/E795Q/E125K、G146R/R182V/E795Q/E125A、G146R/R182V/E795Q/P799V、G146R/R182V/E795Q/T814K、G146R/R182V/E795Q/E981V、G146R/R182V/E795Q/D665N、G146R/R182V/P799V/E981V、E125K/G146R/R182V/E795Q/D665N或G146R/R182V/E795Q/P799V/T814K。在另一种情况下,所述突变体LbCas12a多肽选自F81E(SEQ IDNO:802)、E125K(SEQ ID NO:428)、N145R(SEQ ID NO:2902)、G146R(SEQ ID NO:156)、T152K(SEQ ID NO:694)、R182V(SEQ ID NO:98)、V491D(SEQ ID NO:954)、K478R(SEQ ID NO:134)、N582R(SEQ ID NO:1730)、D665N(SEQ ID NO:1014)、E795Q(SEQ ID NO:930)、P799V(SEQ ID NO:706)、E858V(SEQ ID NO:114)、I860R(SEQ ID NO:250)、E913R(SEQ ID NO:1960)、E981V(SEQ ID NO:880)、E88A/E795Q(SEQ ID NO:3960)、E125K/E795Q(SEQ ID NO:3962)、G146R/E795Q(SEQ ID NO:3964)、R182V/E795Q(SEQ ID NO:3966)、V491D/E795Q(SEQID NO:3968)、Q529I/E795Q(SEQ ID NO:3970)、Y646H/E795Q(SEQ ID NO:3972)、D665N/E795Q(SEQ ID NO:3974)、T814K/E795Q(SEQ ID NO:3976)、L839F/E795Q(SEQ ID NO:3978)、Q906F/E795Q(SEQ ID NO:3980)、E795Q/Q1170D(SEQ ID NO:3982)、G146R/R182V/E795Q(SEQ ID NO:3984)、G146R/E795Q/D665N(SEQ ID NO:3986)、G146R/E795Q/E981V(SEQID NO:3988)、G146R/E795Q/T814K(SEQ ID NO:3990)、G146R/R182V/D665N(SEQ ID NO:3992)、E125K/R182V/E981V(SEQ ID NO:3994)、R182V/P799V/E981V(SEQ ID NO:3996)、R182V/T814K/E981V(SEQ ID NO:3998)、G146R/P799V/E981V(SEQ ID NO:4000)、G146R/R182V/E795Q/F81E(SEQ ID NO:4002)、G146R/R182V/E795Q/E125K(SEQ ID NO:4004)、G146R/R182V/E795Q/E125A(SEQ ID NO:4006)、G146R/R182V/E795Q/P799V(SEQ ID NO:4008)、G146R/R182V/E795Q/T814K(SEQ ID NO:4010)、G146R/R182V/E795Q/E981V(SEQ IDNO:4012)、G146R/R182V/E795Q/D665N(SEQ ID NO:4014)、G146R/R182V/P799V/E981V(SEQID NO:4016)、E125K/G146R/R182V/E795Q/D665N(SEQ ID NO:4018)或G146R/R182V/E795Q/P799V/T814K(SEQ ID NO:4020)。在另一种情况下,所述突变体LbCas12a多肽是G146R/R182V/E795Q(SEQ ID NO:3984)。
本文描述的另一个实施方式是一种用于在细胞中提高在非经典TTTT PAM位点处的基因编辑效率的试剂盒,所述试剂盒包含CRISPR核糖核蛋白复合体,其包括向导RNA和突变体LbCas12a多肽,所述突变体LbCas12a多肽包含引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的至少一个氨基酸替换,条件是所述突变体LbCas12a多肽与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。在一种情况下,所述突变体LbCas12a多肽具有选自SEQ ID NO:4-4022的偶数编号序列的多肽序列。在另一种情况下,所述突变体LbCas12a多肽包含在SEQ ID NO:2的野生型LbCas12a多肽序列的第81、125、145、146、152、182、396、478、491、582、595、606、646、665、795、799、814、839、841、858、860、890、898、909、913、981、1020、1083或1121位处的至少一个氨基酸替换。在另一种情况下,所述突变体LbCas12a多肽包含选自SEQ ID NO:2的野生型LbCas12a多肽序列的F81E、E125K、N145R、G146R、T152K、R182V、S396D、K478R、V491D、N582R、K595R、Y606F、Y646H、D665N、E795Q、P799V、T814G、L839F、I841A、E858V、I860R、W890A、E898N、H909K、E913R、E981V、S1020E、V1083W或K1121D的至少一个氨基酸替换。在另一种情况下,所述突变体LbCas12a多肽选自:F81E,SEQ ID NO:802;E125K,SEQ ID NO:428;N145R,SEQ ID NO:2902;G146R,SEQ ID NO:156;T152K,SEQ ID NO:694;R182V,SEQ ID NO:98;S396D,SEQ IDNO:108;K478R,SEQ ID NO:134;V491D,SEQ ID NO:954;N582R,SEQ ID NO:1730;K595R,SEQID NO:184;Y606F,SEQ ID NO:642;Y646H,SEQ ID NO:720;D665N,SEQ ID NO:1014;E795Q,SEQ ID NO:930;P799V,SEQ ID NO:706;T814G,SEQ ID NO:162;L839F,SEQ ID NO:834;I841A,SEQ ID NO:988;E858V,SEQ ID NO:114;I860R,SEQ ID NO:250;W890A,SEQ ID NO:3958;E898N,SEQ ID NO:48;H909K,SEQ ID NO:70;E913R,SEQ ID NO:1960;E981V,SEQ IDNO:880;S1020E,SEQ ID NO:532;V1083W,SEQ ID NO:132;或K1121D,SEQ ID NO:598。在另一种情况下,所述突变体LbCas12a多肽包含选自下述的替换突变:(a)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自下述位置的单个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121;或(b)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自至少两个下述位置的多个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121。在另一种情况下,所述多个替换突变包括E88A/E795Q、E125K/E795Q、G146R/E795Q、R182V/E795Q、V491D/E795Q、Q529I/E795Q、Y646H/E795Q、D665N/E795Q、T814K/E795Q、L839F/E795Q、Q906F/E795Q、E795Q/Q 1170D、G146R/R182V/E795Q、G146R/E795Q/D665N、G146R/E795Q/E981V、G146R/E795Q/T814K、G146R/R182V/D665N、E125K/R182V/E981V、R182V/P799V/E981V、R182V/T814K/E981V、G146R/P799V/E981V、G146R/R182V/E795Q/F81E、G146R/R182V/E795Q/E125K、G146R/R182V/E795Q/E125A、G146R/R182V/E795Q/P799V、G146R/R182V/E795Q/T814K、G146R/R182V/E795Q/E981V、G146R/R182V/E795Q/D665N、G146R/R182V/P799V/E981V、E125K/G146R/R182V/E795Q/D665N或G146R/R182V/E795Q/P799V/T814K。在另一种情况下,所述突变体LbCas12a多肽选自F81E(SEQ ID NO:802)、E125K(SEQ ID NO:428)、N145R(SEQID NO:2902)、G146R(SEQ ID NO:156)、T152K(SEQ ID NO:694)、R182V(SEQ ID NO:98)、V491D(SEQ ID NO:954)、K478R(SEQ ID NO:134)、N582R(SEQ ID NO:1730)、D665N(SEQ IDNO:1014)、E795Q(SEQ ID NO:930)、P799V(SEQ ID NO:706)、E858V(SEQ ID NO:114)、I860R(SEQ ID NO:250)、E913R(SEQ ID NO:1960)、E981V(SEQ ID NO:880)、E88A/E795Q(SEQ IDNO:3960)、E125K/E795Q(SEQ ID NO:3962)、G146R/E795Q(SEQ ID NO:3964)、R182V/E795Q(SEQ ID NO:3966)、V491D/E795Q(SEQ ID NO:3968)、Q529I/E795Q(SEQ ID NO:3970)、Y646H/E795Q(SEQ ID NO:3972)、D665N/E795Q(SEQ ID NO:3974)、T814K/E795Q(SEQ IDNO:3976)、L839F/E795Q(SEQ ID NO:3978)、Q906F/E795Q(SEQ ID NO:3980)、E795Q/Q1170D(SEQ ID NO:3982)、G146R/R182V/E795Q(SEQ ID NO:3984)、G146R/E795Q/D665N(SEQ IDNO:3986)、G146R/E795Q/E981V(SEQ ID NO:3988)、G146R/E795Q/T814K(SEQ ID NO:3990)、G146R/R182V/D665N(SEQ ID NO:3992)、E125K/R182V/E981V(SEQ ID NO:3994)、R182V/P799V/E981V(SEQ ID NO:3996)、R182V/T814K/E981V(SEQ ID NO:3998)、G146R/P799V/E981V(SEQ ID NO:4000)、G146R/R182V/E795Q/F81E(SEQ ID NO:4002)、G146R/R182V/E795Q/E125K(SEQ ID NO:4004)、G146R/R182V/E795Q/E125A(SEQ ID NO:4006)、G146R/R182V/E795Q/P799V(SEQ ID NO:4008)、G146R/R182V/E795Q/T814K(SEQ ID NO:4010)、G146R/R182V/E795Q/E981V(SEQ ID NO:4012)、G146R/R182V/E795Q/D665N(SEQ ID NO:4014)、G146R/R182V/P799V/E981V(SEQ ID NO:4016)、E125K/G146R/R182V/E795Q/D665N(SEQ ID NO:4018)或G146R/R182V/E795Q/P799V/T814K(SEQ ID NO:4020)。在另一种情况下,所述突变体LbCas12a多肽是G146R/R182V/E795Q(SEQ ID NO:3984)。
本文描述的另一个实施方式是突变体LbCas12a多肽用于提高在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的用途,其中所述突变体LbCas12a多肽包含引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的至少一个氨基酸替换,条件是所述突变体LbCas12a多肽与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。在一种情况下,所述突变体LbCas12a多肽具有选自SEQID NO:4-4022的偶数编号序列的多肽序列。在另一种情况下,所述突变体LbCas12a多肽包含在SEQ ID NO:2的野生型LbCas12a多肽序列的第81、125、145、146、152、182、396、478、491、582、595、606、646、665、795、799、814、839、841、858、860、890、898、909、913、981、1020、1083或1121位处的至少一个氨基酸替换。在另一种情况下,所述突变体LbCas12a多肽包含选自SEQ ID NO:2的野生型LbCas12a多肽序列的F81E、E125K、N145R、G146R、T152K、R182V、S396D、K478R、V491D、N582R、K595R、Y606F、Y646H、D665N、E795Q、P799V、T814G、L839F、I841A、E858V、I860R、W890A、E898N、H909K、E913R、E981V、S1020E、V1083W或K1121D的至少一个氨基酸替换。在另一种情况下,所述突变体LbCas12a多肽选自:F81E,SEQ ID NO:802;E125K,SEQ ID NO:428;N145R,SEQ ID NO:2902;G146R,SEQ ID NO:156;T152K,SEQ ID NO:694;R182V,SEQ ID NO:98;S396D,SEQ ID NO:108;K478R,SEQ ID NO:134;V491D,SEQ IDNO:954;N582R,SEQ ID NO:1730;K595R,SEQ ID NO:184;Y606F,SEQ ID NO:642;Y646H,SEQID NO:720;D665N,SEQ ID NO:1014;E795Q,SEQ ID NO:930;P799V,SEQ ID NO:706;T814G,SEQ ID NO:162;L839F,SEQ ID NO:834;I841A,SEQ ID NO:988;E858V,SEQ ID NO:114;I860R,SEQ ID NO:250;W890A,SEQ ID NO:3958;E898N,SEQ ID NO:48;H909K,SEQ ID NO:70;E913R,SEQ ID NO:1960;E981V,SEQ ID NO:880;S1020E,SEQ ID NO:532;V1083W,SEQID NO:132;或K1121D,SEQ ID NO:598。在另一种情况下,所述突变体LbCas12a多肽包含选自下述的替换突变:(a)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自下述位置的单个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121;或(b)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自至少两个下述位置的多个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121。在另一种情况下,所述多个替换突变包括E88A/E795Q、E125K/E795Q、G146R/E795Q、R182V/E795Q、V491D/E795Q、Q529I/E795Q、Y646H/E795Q、D665N/E795Q、T814K/E795Q、L839F/E795Q、Q906F/E795Q、E795Q/Q1170D、G146R/R182V/E795Q、G146R/E795Q/D665N、G146R/E795Q/E981V、G146R/E795Q/T814K、G146R/R182V/D665N、E125K/R182V/E981V、R182V/P799V/E981V、R182V/T814K/E981V、G146R/P799V/E981V、G146R/R182V/E795Q/F81E、G146R/R182V/E795Q/E125K、G146R/R182V/E795Q/E125A、G146R/R182V/E795Q/P799V、G146R/R182V/E795Q/T814K、G146R/R182V/E795Q/E981V、G146R/R182V/E795Q/D665N、G146R/R182V/P799V/E981V、E125K/G146R/R182V/E795Q/D665N或G146R/R182V/E795Q/P799V/T814K。在另一种情况下,所述突变体LbCas12a多肽选自F81E(SEQ IDNO:802)、E125K(SEQ ID NO:428)、N145R(SEQ ID NO:2902)、G146R(SEQ ID NO:156)、T152K(SEQ ID NO:694)、R182V(SEQ ID NO:98)、V491D(SEQ ID NO:954)、K478R(SEQ ID NO:134)、N582R(SEQ ID NO:1730)、D665N(SEQ ID NO:1014)、E795Q(SEQ ID NO:930)、P799V(SEQ ID NO:706)、E858V(SEQ ID NO:114)、I860R(SEQ ID NO:250)、E913R(SEQ ID NO:1960)、E981V(SEQ ID NO:880)、E88A/E795Q(SEQ ID NO:3960)、E125K/E795Q(SEQ ID NO:3962)、G146R/E795Q(SEQ ID NO:3964)、R182V/E795Q(SEQ ID NO:3966)、V491D/E795Q(SEQID NO:3968)、Q529I/E795Q(SEQ ID NO:3970)、Y646H/E795Q(SEQ ID NO:3972)、D665N/E795Q(SEQ ID NO:3974)、T814K/E795Q(SEQ ID NO:3976)、L839F/E795Q(SEQ ID NO:3978)、Q906F/E795Q(SEQ ID NO:3980)、E795Q/Q1170D(SEQ ID NO:3982)、G146R/R182V/E795Q(SEQ ID NO:3984)、G146R/E795Q/D665N(SEQ ID NO:3986)、G146R/E795Q/E981V(SEQID NO:3988)、G146R/E795Q/T814K(SEQ ID NO:3990)、G146R/R182V/D665N(SEQ ID NO:3992)、E125K/R182V/E981V(SEQ ID NO:3994)、R182V/P799V/E981V(SEQ ID NO:3996)、R182V/T814K/E981V(SEQ ID NO:3998)、G146R/P799V/E981V(SEQ ID NO:4000)、G146R/R182V/E795Q/F81E(SEQ ID NO:4002)、G146R/R182V/E795Q/E125K(SEQ ID NO:4004)、G146R/R182V/E795Q/E125A(SEQ ID NO:4006)、G146R/R182V/E795Q/P799V(SEQ ID NO:4008)、G146R/R182V/E795Q/T814K(SEQ ID NO:4010)、G146R/R182V/E795Q/E981V(SEQ IDNO:4012)、G146R/R182V/E795Q/D665N(SEQ ID NO:4014)、G146R/R182V/P799V/E981V(SEQID NO:4016)、E125K/G146R/R182V/E795Q/D665N(SEQ ID NO:4018)或G146R/R182V/E795Q/P799V/T814K(SEQ ID NO:4020)。在另一种情况下,所述突变体LbCas12a多肽是G146R/R182V/E795Q(SEQ ID NO:3984)。
本文描述的另一个实施方式是一种用于表达和纯化突变体LbCas13a蛋白的方法,所述方法包括:(a)将编码突变体LbCas12a多肽的核苷酸序列插入到表达质粒中,所述突变体LbCas12a多肽与野生型LbCas12a多肽序列相比包含至少一个氨基酸替换,并与SEQ IDNO:4-4022的偶数编号多肽序列中的任一者具有95-99%同一性;(b)用所述表达质粒转化一个或多个细胞;(c)诱导所述转化的质粒的表达;(d)分离所述细胞;(e)提取所述突变体LbCas13a蛋白;和(f)纯化所述突变体LbCas13a蛋白;其中所述突变体LbCas12a多肽与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。
本文描述的另一个实施方式是一种突变体LbCas12a多肽,其通过本文描述的方法生产。
本文描述的另一个实施方式是一种制备本文描述的一个或多个核苷酸序列或由本文描述的核苷酸序列编码的多肽的方法,所述方法包括:用包含本文描述的核苷酸序列的核酸转化或转染细胞;生长所述细胞;任选地分离额外量的本文描述的核苷酸序列;诱导由本文描述的核苷酸序列编码的多肽的表达;分离由本文描述的核苷酸编码的多肽。
本文描述的另一个实施方式是一种制备本文描述的一个或多个核苷酸序列或由本文描述的核苷酸序列编码的多肽的手段,所述方法包括:用包含本文描述的核苷酸序列的核酸转化或转染细胞;生长所述细胞;任选地分离额外量的本文描述的核苷酸序列;诱导由本文描述的核苷酸序列编码的多肽的表达;分离由本文描述的核苷酸编码的多肽。
本文描述的另一个实施方式是一种核苷酸序列或由所述核苷酸序列编码的多肽,其通过本文描述的方法或手段生产。
本文描述的另一个实施方式是有效量的由本文描述的一个或多个核苷酸序列编码的多肽在CRISPR/Cas12a系统中的用途。
本文描述的另一个实施方式是一种研究工具,其包含由本文描述的核苷酸序列编码的多肽。
本文描述的另一个实施方式是一种生化试剂或治疗剂,其包含由本文描述的核苷酸序列编码的多肽。
本文描述的多核苷酸包括具有可以涉及一个或多个核苷酸的替换、缺失和/或添加的变体。所述变体可以在编码区、非编码区或两者中改变。编码区中的改变可以产生保守或非保守氨基酸替换、缺失或添加。其中特别优选的是不改变活性的沉默替换、添加和缺失。
本文描述的其他实施方式包括核酸分子,其包含具有与下述核苷酸序列具有约50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性、更优选地至少约90-99%同一性的核苷酸序列的多核苷酸:(a)编码具有SEQ ID NO:4-4022的偶数编号序列中的氨基酸序列的多肽的核苷酸序列或其简并、同源或密码子优化的变体;(b)编码具有SEQ ID NO:4-4022的偶数编号序列中的氨基酸序列的多肽的核苷酸序列或其简并、同源或密码子优化的变体;和(c)能够与上述(a)或(b)中的任何核苷酸序列的互补体杂交,并且能够表达SEQ ID NO:4-4022的偶数编号序列中的氨基酸序列的有功能多肽的核苷酸序列。
具有与编码突变体LbCas12a的参比核苷酸序列具有例如至少90-99%“同一性”的核苷酸序列的多核苷酸意指除了所述多核苷酸序列可以包括所述编码突变体LbCas12a的参比核苷酸序列的每100个核苷酸至多约10至1个点突变、添加或缺失之外,所述多核苷酸的核苷酸序列与所述参比序列相同。
换句话说,为了获得具有与参比核苷酸序列具有至少约90-99%同一性的核苷酸序列的多核苷酸,所述参比序列中至多10%的核苷酸可以被缺失、添加或用另一个核苷酸替换,或数目为参比序列中总核苷酸的至多10%的核苷酸可以被插入到所述参比序列中。参比序列的这些突变可以发生在所述参比核苷酸序列的5′-或3′-末端位置处或那些末端位置之间的任何位置处,单个地散布在所述参比序列中的核苷酸当中或在所述参比序列内的一个或多个毗连的组中。这同样适用于与参比多肽序列具有至少约90-99%同一性的多肽序列。
正如上文提到的,两个或更多个多核苷酸序列可以通过确定它们的百分同一性进行比较。两个或更多个氨基酸序列同样可以通过确定它们的百分同一性进行比较。两个序列不论是核酸还是肽序列,它们的百分同一性通常被描述为两个比对序列之间完全匹配的数目除以较短序列的长度并乘以100。核酸序列的近似比对由Smith和Waterman,Advancesin Applied Mathematics 2:4 82-489(1981)的局部同源性算法提供。
由于遗传密码的简并性,具有与SEQ ID NO:3-4021的奇数编号序列中示出的核酸序列或其简并、同源或密码子优化的变体具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的序列的大量核酸分子将编码突变体LbCas12a。
本文描述的多核苷酸包括编码本文描述的多肽的突变、变异、替换、添加、缺失和特定实例的多核苷酸。例如,与如何制造表型沉默的氨基酸替换有关的指导被提供在Bowie,J.U.等,“破译蛋白质序列中的讯息:对氨基酸替换的耐受性”(Deciphering theMessage in Protein Sequences:Tolerance to Amino Acid Substitutions),Science247:1306-1310(1990),其中作者指出蛋白质对氨基酸替换具有令人吃惊的耐受性。
因此,SEQ ID NO:4-4022的偶数编号序列的多肽的片段、衍生物或类似物可以是:(i)其中一个或多个氨基酸残基(例如1、2、3、4、5、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45或50个或甚至更多个残基)被保守或非保守氨基酸残基(优选为保守氨基酸残基)替换的片段、衍生物或类似物。此类替换的氨基酸残基可以是也可以不是由遗传密码编码的残基;或(ii)其中一个或多个氨基酸残基(例如1、2、3、4、5、7、8、9、10、15、20、25、30、35、40、45或50个或甚至更多个残基)包括取代基的片段、衍生物或类似物;或(iii)其中成熟多肽与另一种多肽或化合物例如增加多肽的半衰期的化合物(例如聚乙二醇)融合的片段、衍生物或类似物;或(iv)其中将额外的氨基酸例如IgG Fc融合区肽或前导或分泌序列或用于成熟多肽或前蛋白序列的纯化的序列融合到成熟多肽的片段、衍生物或类似物。根据本文的教导,此类片段、衍生物或类似物被认为是在本领域技术人员的范围之内。
此外,SEQ ID NO:4-4022的偶数编号序列的多肽的片段、衍生物或类似物可以被一个或多个保守或非保守氨基酸残基(优选为保守氨基酸残基)替换。在某些情况下,这些多肽、其片段、衍生物或类似物将具有与SEQ ID NO:4-4022的偶数编号序列中示出的多肽序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的多肽序列,并且将包含有功能或无功能的蛋白或酶。类似地,可以在所述多肽的N-或C-端处或非保守区(其据推测是不关键的,因为它们在系统发育上不保守)内对所述多肽进行添加或缺失。
正如本文中描述的,在许多情况下,所述氨基酸替换、突变、添加或缺失优选为次要性质的,例如不显著影响蛋白质的折叠或活性的保守氨基酸替换或对N-或C-端的添加或缺失。当然,本领域技术人员制造的氨基酸替换、添加或缺失的数目取决于许多因素,包括本文描述的那些因素。通常,对于任何给定多肽来说,替换、添加或缺失的数目将不超过约100、90、80、70、60、50、40、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、5、6、4、3、2或1个。
Cas12a和基于LbCas12a的工具的应用多种多样。所述应用包括但不限于:植物基因编辑,酵母基因编辑,哺乳动物基因编辑,活的动物的器官中的细胞的编辑,胚胎的编辑,敲除/敲入动物品系的快速产生,产生疾病状态的动物模型,校正疾病状态,插入报告基因和全基因组功能筛查。
对于相关领域的普通技术人员来说,显然可以对本文描述的组合物、制剂、方法、过程和应用做出适合的修饰和改编,而不背离任何实施方式或其方面的范围。提供的组合物和方法是示例性的,并且不打算限制任何指定实施方式的范围。本文公开的各种不同实施方式、方面和选择全都可以以任何变化或迭代形式组合。本文描述的组合物、制剂、方法和过程的范围包括本文描述的实施方式、方面、选择、实例和优选项的所有实际和潜在的组合。本文描述的示例性组合物和制剂可以省略任何组分,替换本文公开的任何组分,或包括本文中别处公开的任何组分。本文公开的任何组合物或制剂的任何组分的质量与所述制剂中任何其他组分的质量或与所述制剂中其他组分的总质量之比特此公开,如同它们被明确地公开。在通过参考并入的任何专利或出版物中的任何术语的含义与本公开中使用的术语的含义有冲突的情况下,以本公开中的术语或短语的含义为准。此外,上述讨论仅仅公开和描述了示例性实施方式。本文中引用的所有专利和出版物以其具体教导通过参考并入本文。
本文描述的发明的各个不同实施方式和方面由下面的条款概括:
条款1.一种分离的突变体LbCas12a多肽,其包含引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的至少一个氨基酸替换,条件是所述突变体LbCas12a多肽与所述野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。
条款2.根据条款1所述的分离的突变体LbCas12a多肽,其中所述突变体LbCas12a多肽与选自SEQ ID NO:4-4022的偶数编号序列的多肽序列具有95%至99%同一性。
条款3.根据条款1或2所述的分离的突变体LbCas12a多肽,其中所述突变体LbCas12a多肽具有选自SEQ ID NO:4-4022的偶数编号序列的多肽序列。
条款4.根据条款1-3中的任一项所述的分离的突变体LbCas12a多肽,其中所述突变体LbCas12a多肽在SEQ ID NO:2的野生型LbCas12a多肽序列的第81、125、145、146、152、182、396、478、491、582、595、606、646、665、795、799、814、839、841、858、860、890、898、909、913、981、1020、1083或1121位处包含至少一个氨基酸替换。
条款5.根据条款1-4中的任一项所述的分离的突变体LbCas12a多肽,其中所述突变体LbCas12a多肽包含选自SEQ ID NO:2的野生型LbCas12a多肽序列的F81E、E125K、N145R、G146R、T152K、R182V、S396D、K478R、V491D、N582R、K595R、Y606F、Y646H、D665N、E795Q、P799V、T814G、L839F、I841A、E858V、I860R、W890A、E898N、H909K、E913R、E981V、S1020E、V1083W或K1121D的至少一个氨基酸替换。
条款6.根据条款1-5中的任一项所述的分离的突变体LbCas12a多肽,其中所述突变体LbCas12a多肽选自:F81E,SEQ ID NO:802;E125K,SEQ ID NO:428;N145R,SEQ ID NO:2902;G146R,SEQ ID NO:156;T152K,SEQ ID NO:694;R182V,SEQ ID NO:98;S396D,SEQ IDNO:108;K478R,SEQ ID NO:134;V491D,SEQ ID NO:954;N582R,SEQ ID NO:1730;K595R,SEQID NO:184;Y606F,SEQ ID NO:642;Y646H,SEQ ID NO:720;D665N,SEQ ID NO:1014;E795Q,SEQ ID NO:930;P799V,SEQ ID NO:706;T814G,SEQ ID NO:162;L839F,SEQ ID NO:834;I841A,SEQ ID NO:988;E858V,SEQ ID NO:114;I860R,SEQ ID NO:250;W890A,SEQ ID NO:3958;E898N,SEQ ID NO:48;H909K,SEQ ID NO:70;E913R,SEQ ID NO:1960;E981V,SEQ IDNO:880;S1020E,SEQ ID NO:532;V1083W,SEQ ID NO:132;或K1121D,SEQ ID NO:598。
条款7.根据条款1-6中的任一项所述的分离的突变体LbCas12a多肽,其中所述突变体LbCas12a多肽包含选自下述的替换突变:
(a)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自下述位置的单个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121;或
(b)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自至少两个下述位置的多个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121。
条款8.根据条款1-7中的任一项所述的分离的突变体LbCas12a多肽,其中所述多个替换突变包括E88A/E795Q、E125K/E795Q、G146R/E795Q、R182V/E795Q、V491D/E795Q、Q529I/E795Q、Y646H/E795Q、D665N/E795Q、T814K/E795Q、L839F/E795Q、Q906F/E795Q、E795Q/Q1170D、G146R/R182V/E795Q、G146R/E795Q/D665N、G146R/E795Q/E981V、G146R/E795Q/T814K、G146R/R182V/D665N、E125K/R182V/E981V、R182V/P799V/E981V、R182V/T814K/E981V、G146R/P799V/E981V、G146R/R182V/E795Q/F81E、G146R/R182V/E795Q/E125K、G146R/R182V/E795Q/E125A、G146R/R182V/E795Q/P799V、G146R/R182V/E795Q/T814K、G146R/R182V/E795Q/E981V、G146R/R182V/E795Q/D665N、G146R/R182V/P799V/E981V、E125K/G146R/R182V/E795Q/D665N、G146R/R182V/E795Q/P799V/T814K或E125K/G146R/R182V/E795Q/D665N/E981V。
条款9.根据条款1-8中的任一项所述的分离的突变体LbCas12a多肽,其中所述多个替换突变包括E88A/E795Q、E125K/E795Q、G146R/E795Q、R182V/E795Q、V491D/E795Q、Q529I/E795Q、Y646H/E795Q、D665N/E795Q、T814K/E795Q、L839F/E795Q、Q906F/E795Q、E795Q/Q1170D、G146R/R182V/E795Q、G146R/E795Q/D665N、G146R/E795Q/E981V、G146R/E795Q/T814K、G146R/R182V/D665N、E125K/R182V/E981V、R182V/P799V/E981V、R182V/T814K/E981V、G146R/P799V/E981V、G146R/R182V/E795Q/F81E、G146R/R182V/E795Q/E125K、G146R/R182V/E795Q/E125A、G146R/R182V/E795Q/P799V、G146R/R182V/E795Q/T814K、G146R/R182V/E795Q/E981V、G146R/R182V/E795Q/D665N、G146R/R182V/P799V/E981V、E125K/G146R/R182V/E795Q/D665N或G146R/R182V/E795Q/P799V/T814K,并且与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。
条款10.根据条款1-9中的任一项所述的分离的突变体LbCas12a多肽,其中所述突变体LbCas12a多肽选自SEQ ID NO:802、428、2902、156、694、98、954、134、1730、642、720、1014、930、706、834、988、114、250、3958、48、70、1960、880、532、598、3960、3962、3964、3966、3968、3970、3972、3974、3976、3978、3980、3982、3984、3986、3988、3990、3992、3994、3996、3998、4000、4002、4004、4006、4008、4010、4012、4014、4016、4018、4020或4022。
条款11.根据条款1-10中的任一项所述的分离的突变体LbCas12a多肽,其中所述突变体LbCas12a多肽选自F81E(SEQ ID NO:802)、E125K(SEQ ID NO:428)、N145R(SEQ IDNO:2902)、G146R(SEQ ID NO:156)、T152K(SEQ ID NO:694)、R182V(SEQ ID NO:98)、V491D(SEQ ID NO:954)、K478R(SEQ ID NO:134)、N582R(SEQ ID NO:1730)、D665N(SEQ ID NO:1014)、E795Q(SEQ ID NO:930)、P799V(SEQ ID NO:706)、E858V(SEQ ID NO:114)、I860R(SEQ ID NO:250)、E913R(SEQ ID NO:1960)、E981V(SEQ ID NO:880)、E88A/E795Q(SEQ IDNO:3960)、E125K/E795Q(SEQ ID NO:3962)、G146R/E795Q(SEQ ID NO:3964)、R182V/E795Q(SEQ ID NO:3966)、V491D/E795Q(SEQ ID NO:3968)、Q529I/E795Q(SEQ ID NO:3970)、Y646H/E795Q(SEQ ID NO:3972)、D665N/E795Q(SEQ ID NO:3974)、T814K/E795Q(SEQ IDNO:3976)、L839F/E795Q(SEQ ID NO:3978)、Q906F/E795Q(SEQ ID NO:3980)、E795Q/Q1170D(SEQ ID NO:3982)、G146R/R182V/E795Q(SEQ ID NO:3984)、G146R/E795Q/D665N(SEQ IDNO:3986)、G146R/E795Q/E981V(SEQ ID NO:3988)、G146R/E795Q/T814K(SEQ ID NO:3990)、G146R/R182V/D665N(SEQ ID NO:3992)、E125K/R182V/E981V(SEQ ID NO:3994)、R182V/P799V/E981V(SEQ ID NO:3996)、R182V/T814K/E981V(SEQ ID NO:3998)、G146R/P799V/E981V(SEQ ID NO:4000)、G146R/R182V/E795Q/F81E(SEQ ID NO:4002)、G146R/R182V/E795Q/E125K(SEQ ID NO:4004)、G146R/R182V/E795Q/E125A(SEQ ID NO:4006)、G146R/R182V/E795Q/P799V(SEQ ID NO:4008)、G146R/R182V/E795Q/T814K(SEQ ID NO:4010)、G146R/R182V/E795Q/E981V(SEQ ID NO:4012)、G146R/R182V/E795Q/D665N(SEQ ID NO:4014)、G146R/R182V/P799V/E981V(SEQ ID NO:4016)、E125K/G146R/R182V/E795Q/D665N(SEQ ID NO:4018)或G146R/R182V/E795Q/P799V/T814K(SEQ ID NO:4020)。
条款12.根据条款1-11中的任一项所述的分离的突变体LbCas12a多肽,其中所述突变体LbCas12a多肽是G146R/R182V/E795Q(SEQ ID NO:3984)。
条款13.一种分离的多核苷酸序列,其编码包含引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的至少一个氨基酸替换的突变体LbCas12a多肽,条件是所述突变体LbCas12a多肽与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。
条款14.根据条款13所述的分离的多核苷酸序列,其中编码的突变体LbCas12a多肽与选自SEQ ID NO:4-4022的偶数编号序列的多肽序列具有95%至99%同一性。
条款15.根据条款13或14所述的分离的多核苷酸序列,其中编码的突变体LbCas12a多肽具有选自SEQ ID NO:4-4022的偶数编号序列的多肽序列。
条款16.根据条款13-15中的任一项所述的分离的多核苷酸序列,其中所述突变体LbCas12a多核苷酸序列与选自SEQ ID NO:3-4021的奇数编号序列的核苷酸序列具有95%至99%同一性。
条款17.根据条款13-16中的任一项所述的分离的多核苷酸序列,其中所述突变体LbCas12a多核苷酸具有选自SEQ ID NO:3-4021的奇数编号序列的核苷酸序列。
条款18.根据条款13-17中的任一项所述的分离的多核苷酸序列,其中编码的突变体LbCas12a多肽包含在SEQ ID NO:2的野生型LbCas12a多肽序列的第81、125、145、146、152、182、396、478、491、582、595、606、646、665、795、799、814、839、841、858、860、890、898、909、913、981、1020、1083或1121位处的至少一个氨基酸替换。
条款19.根据条款13-18中的任一项所述的分离的多核苷酸序列,其中编码的突变体LbCas12a多肽与SEQ ID NO:2的野生型LbCas12a多肽序列相比包含选自F81E、E125K、N145R、G146R、T152K、R182V、S396D、K478R、V491D、N582R、K595R、Y606F、Y646H、D665N、E795Q、P799V、T814G、L839F、I841A、E858V、I860R、W890A、E898N、H909K、E913R、E981V、S1020E、V1083W或K1121D的至少一个氨基酸替换。
条款20.根据条款13-19中的任一项所述的分离的突变体LbCas12a多核苷酸,其中所述突变体LbCas12a多核苷酸选自:F81E,SEQ ID NO:802;E125K,SEQ ID NO:428;N145R,SEQ ID NO:2902;G146R,SEQ ID NO:156;T152K,SEQ ID NO:694;R182V,SEQ ID NO:98;S396D,SEQ ID NO:108;K478R,SEQ ID NO:134;V491D,SEQ ID NO:954;N582R,SEQ ID NO:1730;K595R,SEQ ID NO:184;Y606F,SEQ ID NO:642;Y646H,SEQ ID NO:720;D665N,SEQ IDNO:1014;E795Q,SEQ ID NO:930;P799V,SEQ ID NO:706;T814G,SEQ ID NO:162;L839F,SEQID NO:834;I841A,SEQ ID NO:988;E858V,SEQ ID NO:114;I860R,SEQ ID NO:250;W890A,SEQ ID NO:3958;E898N,SEQ ID NO:48;H909K,SEQ ID NO:70;E913R,SEQ ID NO:1960;E981V,SEQ ID NO:880;S1020E,SEQ ID NO:532;V1083W,SEQ ID NO:132;或K1121D,SEQ IDNO:598。
条款21.根据条款13-20中的任一项所述的分离的突变体LbCas12a多核苷酸,其中编码的突变体LbCas12a多肽包含选自下述的替换突变:
(a)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自下述位置的单个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121;或
(b)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自至少两个下述位置的多个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121。
条款22.根据条款13-21中的任一项所述的分离的突变体LbCas12a多核苷酸,其中所述多个替换突变包括E88A/E795Q、E125K/E795Q、G146R/E795Q、R182V/E795Q、V491D/E795Q、Q529I/E795Q、Y646H/E795Q、D665N/E795Q、T814K/E795Q、L839F/E795Q、Q906F/E795Q、E795Q/Q1170D、G146R/R182V/E795Q、G146R/E795Q/D665N、G146R/E795Q/E981V、G146R/E795Q/T814K、G146R/R182V/D665N、E125K/R182V/E981V、R182V/P799V/E981V、R182V/T814K/E981V、G146R/P799V/E981V、G146R/R182V/E795Q/F81E、G146R/R182V/E795Q/E125K、G146R/R182V/E795Q/E125A、G146R/R182V/E795Q/P799V、G146R/R182V/E795Q/T814K、G146R/R182V/E795Q/E981V、G146R/R182V/E795Q/D665N、G146R/R182V/P799V/E981V、E125K/G146R/R182V/E795Q/D665N、G146R/R182V/E795Q/P799V/T814K或E125K/G146R/R182V/E795Q/D665N/E981V。
条款23.根据条款13-22中的任一项所述的分离的突变体LbCas12a多核苷酸,其中所述多个替换突变包括E88A/E795Q、E125K/E795Q、G146R/E795Q、R182V/E795Q、V491D/E795Q、Q529I/E795Q、Y646H/E795Q、D665N/E795Q、T814K/E795Q、L839F/E795Q、Q906F/E795Q、E795Q/Q1170D、G146R/R182V/E795Q、G146R/E795Q/D665N、G146R/E795Q/E981V、G146R/E795Q/T814K、G146R/R 182V/D665N、E125K/R182V/E981V、R182V/P799V/E981V、R182V/T814K/E981V、G146R/P799V/E981V、G146R/R182V/E795Q/F81E、G146R/R182V/E795Q/E125K、G146R/R182V/E795Q/E125A、G146R/R182V/E795Q/P799V、G146R/R182V/E795Q/T814K、G146R/R182V/E795Q/E981V、G146R/R182V/E795Q/D665N、G146R/R182V/P799V/E981V、E125K/G146R/R182V/E795Q/D665N或G146R/R182V/E795Q/P799V/T814K,并且与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。
条款24.根据条款13-23中的任一项所述的分离的突变体LbCas12a多核苷酸,其中编码的突变体LbCas12a多肽选自F81E(SEQ ID NO:802)、E125K(SEQ ID NO:428)、N145R(SEQ ID NO:2902)、G146R(SEQ ID NO:156)、T152K(SEQ ID NO:694)、R182V(SEQ ID NO:98)、V491D(SEQ ID NO:954)、K478R(SEQ ID NO:134)、N582R(SEQ ID NO:1730)、D665N(SEQID NO:1014)、E795Q(SEQ ID NO:930)、P799V(SEQ ID NO:706)、E858V(SEQ ID NO:114)、I860R(SEQ ID NO:250)、E913R(SEQ ID NO:1960)、E981V(SEQ ID NO:880)、E88A/E795Q(SEQ ID NO:3960)、E125K/E795Q(SEQ ID NO:3962)、G146R/E795Q(SEQ ID NO:3964)、R182V/E795Q(SEQ ID NO:3966)、V491D/E795Q(SEQ ID NO:3968)、Q529I/E795Q(SEQ IDNO:3970)、Y646H/E795Q(SEQ ID NO:3972)、D665N/E795Q(SEQ ID NO:3974)、T814K/E795Q(SEQ ID NO:3976)、L839F/E795Q(SEQ ID NO:3978)、Q906F/E795Q(SEQ ID NO:3980)、E795Q/Q1170D(SEQ ID NO:3982)、G146R/R182V/E795Q(SEQ ID NO:3984)、G146R/E795Q/D665N(SEQ ID NO:3986)、G146R/E795Q/E981V(SEQ ID NO:3988)、G146R/E795Q/T814K(SEQID NO:3990)、G146R/R182V/D665N(SEQ ID NO:3992)、E125K/R182V/E981V(SEQ ID NO:3994)、R182V/P799V/E981V(SEQ ID NO:3996)、R182V/T814K/E981V(SEQ ID NO:3998)、G146R/P799V/E981V(SEQ ID NO:4000)、G146R/R182V/E795Q/F81E(SEQ ID NO:4002)、G146R/R182V/E795Q/E125K(SEQ ID NO:4004)、G146R/R182V/E795Q/E125A(SEQ ID NO:4006)、G146R/R182V/E795Q/P799V(SEQ ID NO:4008)、G146R/R182V/E795Q/T814K(SEQ IDNO:4010)、G146R/R182V/E795Q/E981V(SEQ ID NO:4012)、G146R/R182V/E795Q/D665N(SEQID NO:4014)、G146R/R182V/P799V/E981V(SEQ ID NO:4016)、E125K/G146R/R182V/E795Q/D665N(SEQ ID NO:4018)或G146R/R182V/E795Q/P799V/T814K(SEQ ID NO:4020)。
条款25.根据条款13-24中的任一项所述的分离的突变体LbCas12a多核苷酸,其中编码的突变体LbCas12a多肽是G146R/R182V/E795Q(SEQ ID NO:3984)。
条款26.根据条款13-25中的任一项所述的分离的突变体LbCas12a多核苷酸,其中所述突变体LbCas12a多核苷酸选自SEQ ID NO:801、427、2901、155、693、97、953、133、1729、641、719、1013、929、705、833、987、113、249、3957、47、69、1959、879、531、597、3959、3961、3963、3965、3967、3969、3971、3973、3975、3977、3979、3981、3983、3985、3987、3989、3991、3993、3995、3997、3999、4001、4003、4005、4007、4009、4011、4013、4015、4017、4019或4021。
条款27.根据条款13-26中的任一项所述的分离的突变体LbCas12a多核苷酸,其中所述突变体LbCas12a多核苷酸选自SEQ ID NO:801、427、2901、155、693、97、953、133、1729、1013、929、705、113、249、531、597、3959、3961、3963、3965、3967、3969、3971、3973、3975、3977、3979、3981、3983、3985、3987、3989、3991、3993、3995、3997、3999、4001、4003、4005、4007、4009、4011、4013、4015、4017或4019,并编码与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高的突变体LbCas12a多肽。
条款28.根据条款13-27中的任一项所述的分离的突变体LbCas12a多核苷酸,其中所述突变体LbCas12a多核苷酸是SEQ ID NO:3983。
条款29.一种载体或质粒,其包含根据条款13-28中的任一项所述的多核苷酸序列。
条款30.一种细胞,其包含根据条款13-28中的任一项所述的多核苷酸序列或根据条款29所述的载体或质粒。
条款31.一种分离的核糖核蛋白复合体,其包含向导RNA和突变体LbCas12a多肽,所述突变体LbCas12a多肽包含引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的至少一个氨基酸替换,条件是所述突变体LbCas12a多肽与所述野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。
条款32.根据条款31所述的分离的核糖核蛋白复合体,其中所述突变体LbCas12a多肽具有选自SEQ ID NO:4-4022的偶数编号序列的多肽序列。
条款33.根据条款31或32所述的分离的核糖核蛋白复合体,其中所述突变体LbCas12a多肽包含在SEQ ID NO:2的野生型LbCas12a多肽序列的第81、125、145、146、152、182、396、478、491、582、595、606、646、665、795、799、814、839、841、858、860、890、898、909、913、981、1020、1083或1121位处的至少一个氨基酸替换。
条款34.根据条款31-33中的任一项所述的分离的核糖核蛋白复合体,其中所述突变体LbCas12a多肽包含选自SEQ ID NO:2的野生型LbCas12a多肽序列的F81E、E125K、N145R、G146R、T152K、R182V、S396D、K478R、V491D、N582R、K595R、Y606F、Y646H、D665N、E795Q、P799V、T814G、L839F、I841A、E858V、I860R、W890A、E898N、H909K、E913R、E981V、S1020E、V1083W或K1121D的至少一个氨基酸替换。
条款35.根据条款31-34中的任一项所述的分离的核糖核蛋白复合体,其中所述突变体LbCas12a多肽选自:F81E,SEQ ID NO:802;E125K,SEQ ID NO:428;N145R,SEQ ID NO:2902;G146R,SEQ ID NO:156;T152K,SEQ ID NO:694;R182V,SEQ ID NO:98;S396D,SEQ IDNO:108;K478R,SEQ ID NO:134;V491D,SEQ ID NO:954;N582R,SEQ ID NO:1730;K595R,SEQID NO:184;Y606F,SEQ ID NO:642;Y646H,SEQ ID NO:720;D665N,SEQ ID NO:1014;E795Q,SEQ ID NO:930;P799V,SEQ ID NO:706;T814G,SEQ ID NO:162;L839F,SEQ ID NO:834;I841A,SEQ ID NO:988;E858V,SEQ ID NO:114;I860R,SEQ ID NO:250;W890A,SEQ ID NO:3958;E898N,SEQ ID NO:48;H909K,SEQ ID NO:70;E913R,SEQ ID NO:1960;E981V,SEQ IDNO:880;S1020E,SEQ ID NO:532;V1083W,SEQ ID NO:132;或K1121D,SEQ ID NO:598。
条款36.根据条款31-35中的任一项所述的分离的核糖核蛋白复合体,其中所述突变体LbCas12a多肽选自F81E(SEQ ID NO:802)、E125K(SEQ ID NO:428)、N145R(SEQ ID NO:2902)、G146R(SEQ ID NO:156)、T152K(SEQ ID NO:694)、R182V(SEQ ID NO:98)、V491D(SEQID NO:954)、K478R(SEQ ID NO:134)、N582R(SEQ ID NO:1730)、D665N(SEQ ID NO:1014)、E795Q(SEQ ID NO:930)、P799V(SEQ ID NO:706)、E858V(SEQ ID NO:114)、I860R(SEQ IDNO:250)、E913R(SEQ ID NO:1960)、E981V(SEQ ID NO:880)、E88A/E795Q(SEQ ID NO:3960)、E125K/E795Q(SEQ ID NO:3962)、G146R/E795Q(SEQ ID NO:3964)、R182V/E795Q(SEQID NO:3966)、V491D/E795Q(SEQ ID NO:3968)、Q529I/E795Q(SEQ ID NO:3970)、Y646H/E795Q(SEQ ID NO:3972)、D665N/E795Q(SEQ ID NO:3974)、T814K/E795Q(SEQ ID NO:3976)、L839F/E795Q(SEQ ID NO:3978)、Q906F/E795Q(SEQ ID NO:3980)、E795Q/Q1170D(SEQ ID NO:3982)、G146R/R182V/E795Q(SEQ ID NO:3984)、G146R/E795Q/D665N(SEQ IDNO:3986)、G146R/E795Q/E981V(SEQ ID NO:3988)、G146R/E795Q/T814K(SEQ ID NO:3990)、G146R/R182V/D665N(SEQ ID NO:3992)、E125K/R182V/E981V(SEQ ID NO:3994)、R182V/P799V/E981V(SEQ ID NO:3996)、R182V/T814K/E981V(SEQ ID NO:3998)、G146R/P799V/E981V(SEQ ID NO:4000)、G146R/R182V/E795Q/F81E(SEQ ID NO:4002)、G146R/R182V/E795Q/E125K(SEQ ID NO:4004)、G146R/R182V/E795Q/E125A(SEQ ID NO:4006)、G146R/R182V/E795Q/P799V(SEQ ID NO:4008)、G146R/R182V/E795Q/T814K(SEQ ID NO:4010)、G146R/R182V/E795Q/E981V(SEQ ID NO:4012)、G146R/R182V/E795Q/D665N(SEQ ID NO:4014)、G146R/R182V/P799V/E981V(SEQ ID NO:4016)、E125K/G146R/R182V/E795Q/D665N(SEQ ID NO:4018)或G146R/R182V/E795Q/P799V/T814K(SEQ ID NO:4020)。
条款37.根据条款31-36中的任一项所述的分离的核糖核蛋白复合体,其中所述突变体LbCas12a多肽是G146R/R182V/E795Q(SEQ ID NO:3984)。
条款38.一种使用CRISPR核糖核蛋白复合体在细胞中提高在非经典TTTT PAM位点处的基因编辑效率的方法,所述方法包括:
将细胞与所述CRISPR核糖核蛋白复合体接触,所述复合体包括向导RNA和突变体LbCas12a多肽,所述突变体LbCas12a多肽包含引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的至少一个氨基酸替换,条件是所述突变体LbCas12a多肽与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。
条款39.根据条款38所述的方法,其中所述突变体LbCas12a多肽具有选自SEQ IDNO:4-4022的偶数编号序列的多肽序列。
条款40.根据条款38或39所述的方法,其中所述突变体LbCas12a多肽包含在SEQID NO:2的野生型LbCas12a多肽序列的第81、125、145、146、152、182、396、478、491、582、595、606、646、665、795、799、814、839、841、858、860、890、898、909、913、981、1020、1083或1121位处的至少一个氨基酸替换。
条款41.根据条款38-40中的任一项所述的方法,其中所述突变体LbCas12a多肽包含选自SEQ ID NO:2的野生型LbCas12a多肽序列的F81E、E125K、N145R、G146R、T152K、R182V、S396D、K478R、V491D、N582R、K595R、Y606F、Y646H、D665N、E795Q、P799V、T814G、L839F、I841A、E858V、I860R、W890A、E898N、H909K、E913R、E98IV、S1020E、V1083W或K1121D的至少一个氨基酸替换。
条款42.根据条款38-41中的任一项所述的方法,其中所述突变体LbCas12a多肽选自:F81E,SEQ ID NO:802;E125K,SEQ ID NO:428;N145R,SEQ ID NO:2902;G146R,SEQ IDNO:156;T152K,SEQ ID NO:694;R182V,SEQ ID NO:98;S396D,SEQ ID NO:108;K478R,SEQID NO:134;V491D,SEQ ID NO:954;N582R,SEQ ID NO:1730;K595R,SEQ ID NO:184;Y606F,SEQ ID NO:642;Y646H,SEQ ID NO:720;D665N,SEQ ID NO:1014;E795Q,SEQ ID NO:930;P799V,SEQ ID NO:706;T814G,SEQ ID NO:162;L839F,SEQ ID NO:834;I841A,SEQ ID NO:988;E858V,SEQ ID NO:114;I860R,SEQ ID NO:250;W890A,SEQ ID NO:3958;E898N,SEQ IDNO:48;H909K,SEQ ID NO:70;E913R,SEQ ID NO:1960;E981V,SEQ ID NO:880;S1020E,SEQID NO:532;V1083W,SEQ ID NO:132;或K1121D,SEQ ID NO:598。
条款43.根据条款38-42中的任一项所述的方法,其中所述突变体LbCas12a多肽包含选自下述的替换突变:
(a)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自下述位置的单个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121;或者
(b)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自至少两个下述位置的多个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121。
条款44.根据条款38-43中的任一项所述的方法,其中所述多个替换突变包括E88A/E795Q、E125K/E795Q、G146R/E795Q、R182V/E795Q、V491D/E795Q、Q529I/E795Q、Y646H/E795Q、D665N/E795Q、T814K/E795Q、L839F/E795Q、Q906F/E795Q、E795Q/Q1170D、G146R/R182V/E795Q、G146R/E795Q/D665N、G146R/E795Q/E981V、G146R/E795Q/T814K、G146R/R182V/D665N、E125K/R182V/E981V、R182V/P799V/E981V、R182V/T814K/E981V、G146R/P799V/E981V、G146R/R182V/E795Q/F81E、G146R/R182V/E795Q/E125K、G146R/R182V/E795Q/E125A、G146R/R182V/E795Q/P799V、G146R/R182V/E795Q/T814K、G146R/R182V/E795Q/E981V、G146R/R182V/E795Q/D665N、G146R/R182V/P799V/E981V、E125K/G146R/R182V/E795Q/D665N或G146R/R182V/E795Q/P799V/T814K。
条款45.根据条款38-44中的任一项所述的方法,其中所述突变体LbCas12a多肽选自F81E(SEQ ID NO:802)、E125K(SEQ ID NO:428)、N145R(SEQ ID NO:2902)、G146R(SEQ IDNO:156)、T152K(SEQ ID NO:694)、R182V(SEQ ID NO:98)、V491D(SEQ ID NO:954)、K478R(SEQ ID NO:134)、N582R(SEQ ID NO:1730)、D665N(SEQ ID NO:1014)、E795Q(SEQ ID NO:930)、P799V(SEQ ID NO:706)、E858V(SEQ ID NO:114)、I860R(SEQ ID NO:250)、E913R(SEQID NO:1960)、E981V(SEQ ID NO:880)、E88A/E795Q(SEQ ID NO:3960)、E125K/E795Q(SEQID NO:3962)、G146R/E795Q(SEQ ID NO:3964)、R182V/E795Q(SEQ ID NO:3966)、V491D/E795Q(SEQ ID NO:3968)、Q529I/E795Q(SEQ ID NO:3970)、Y646H/E795Q(SEQ ID NO:3972)、D665N/E795Q(SEQ ID NO:3974)、T814K/E795Q(SEQ ID NO:3976)、L839F/E795Q(SEQID NO:3978)、Q906F/E795Q(SEQ ID NO:3980)、E795Q/Q1170D(SEQ ID NO:3982)、G146R/R182V/E795Q(SEQ ID NO:3984)、G146R/E795Q/D665N(SEQ ID NO:3986)、G146R/E795Q/E981V(SEQ ID NO:3988)、G146R/E795Q/T814K(SEQ ID NO:3990)、G146R/R182V/D665N(SEQID NO:3992)、E125K/R182V/E981V(SEQ ID NO:3994)、R182V/P799V/E981V(SEQ ID NO:3996)、R182V/T814K/E981V(SEQ ID NO:3998)、G146R/P799V/E981V(SEQ ID NO:4000)、G146R/R182V/E795Q/F81E(SEQ ID NO:4002)、G146R/R182V/E795Q/E125K(SEQ ID NO:4004)、G146R/R182V/E795Q/E125A(SEQ ID NO:4006)、G146R/R182V/E795Q/P799V(SEQ IDNO:4008)、G146R/R182V/E795Q/T814K(SEQ ID NO:4010)、G146R/R182V/E795Q/E981V(SEQID NO:4012)、G146R/R182V/E795Q/D665N(SEQ ID NO:4014)、G146R/R182V/P799V/E981V(SEQ ID NO:4016)、E125K/G146R/R182V/E795Q/D665N(SEQ ID NO:4018)或G146R/R182V/E795Q/P799V/T814K(SEQ ID NO:4020)。
条款46.根据条款38-45中的任一项所述的方法,其中所述突变体LbCas12a多肽是G146R/R182V/E795Q(SEQ ID NO:3984)。
条款47.一种用于在细胞中提高在非经典TTTT PAM位点处的基因编辑效率的试剂盒,所述试剂盒包含:
CRISPR核糖核蛋白复合体,其包括向导RNA和突变体LbCas12a多肽,所述突变体LbCas12a多肽包含引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的至少一个氨基酸替换,条件是所述突变体LbCas12a多肽与野生型LbCas12a多肽序列相比提供在非经典TTTTPAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。
条款48.根据条款47所述的试剂盒,其中所述突变体LbCas12a多肽具有选自SEQID NO:4-4022的偶数编号序列的多肽序列。
条款49.根据条款47或48所述的试剂盒,其中所述突变体LbCas12a多肽包含在SEQID NO:2的野生型LbCas12a多肽序列的第81、125、145、146、152、182、396、478、491、582、595、606、646、665、795、799、814、839、841、858、860、890、898、909、913、981、1020、1083或1121位处的至少一个氨基酸替换。
条款50.根据条款47-49中的任一项所述的试剂盒,其中所述突变体LbCas12a多肽包含选自SEQ ID NO:2的野生型LbCas12a多肽序列的F81E、E125K、N145R、G146R、T152K、R182V、S396D、K478R、V491D、N582R、K595R、Y606F、Y646H、D665N、E795Q、P799V、T814G、L839F、I841A、E858V、I860R、W890A、E898N、H909K、E913R、E981V、S1020E、V1083W或K1121D的至少一个氨基酸替换。
条款51.根据条款47-50中的任一项所述的试剂盒,其中所述突变体LbCas12a多肽选自:F81E,SEQ ID NO:802;E125K,SEQ ID NO:428;N145R,SEQ ID NO:2902;G146R,SEQ IDNO:156;T152K,SEQ ID NO:694;R182V,SEQ ID NO:98;S396D,SEQ ID NO:108;K478R,SEQID NO:134;V491D,SEQ ID NO:954;N582R,SEQ ID NO:1730;K595R,SEQ ID NO:184;Y606F,SEQ ID NO:642;Y646H,SEQ ID NO:720;D665N,SEQ ID NO:1014;E795Q,SEQ ID NO:930;P799V,SEQ ID NO:706;T814G,SEQ ID NO:162;L839F,SEQ ID NO:834;I841A,SEQ ID NO:988;E858V,SEQ ID NO:114;I860R,SEQ ID NO:250;W890A,SEQ ID NO:3958;E898N,SEQ IDNO:48;H909K,SEQ ID NO:70;E913R,SEQ ID NO:1960;E981V,SEQ ID NO:880;S1020E,SEQID NO:532;V1083W,SEQ ID NO:132;或K1121D,SEQ ID NO:598。
条款52.根据条款47-51中的任一项所述的试剂盒,其中所述突变体LbCas12a多肽包含选自下述的替换突变:
(a)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自下述位置的单个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121;或
(b)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自至少两个下述位置的多个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121。
条款53.根据条款47-52中的任一项所述的试剂盒,其中所述多个替换突变包括E88A/E795Q、E125K/E795Q、G146R/E795Q、R182V/E795Q、V491D/E795Q、Q529I/E795Q、Y646H/E795Q、D665N/E795Q、T814K/E795Q、L839F/E795Q、Q906F/E795Q、E795Q/Q1170D、G146R/R182V/E795Q、G146R/E795Q/D665N、G146R/E795Q/E981V、G146R/E795Q/T814K、G146R/R182V/D665N、E125K/R182V/E981V、R182V/P799V/E981V、R182V/T814K/E981V、G146R/P799V/E981V、G146R/R182V/E795Q/F81E、G146R/R182V/E795Q/E125K、G146R/R182V/E795Q/E125A、G146R/R182V/E795Q/P799V、G146R/R182V/E795Q/T814K、G146R/R182V/E795Q/E981V、G146R/R182V/E795Q/D665N、G146R/R182V/P799V/E981V、E125K/G146R/R182V/E795Q/D665N或G146R/R182V/E795Q/P799V/T814K。
条款54.根据条款47-53中的任一项所述的试剂盒,其中所述突变体LbCas12a多肽选自F81E(SEQ ID NO:802)、E125K(SEQ ID NO:428)、N145R(SEQ ID NO:2902)、G146R(SEQID NO:156)、T152K(SEQ ID NO:694)、R182V(SEQ ID NO:98)、V491D(SEQ ID NO:954)、K478R(SEQ ID NO:134)、N582R(SEQ ID NO:1730)、D665N(SEQ ID NO:1014)、E795Q(SEQ IDNO:930)、P799V(SEQ ID NO:706)、E858V(SEQ ID NO:114)、I860R(SEQ ID NO:250)、E913R(SEQ ID NO:1960)、E981V(SEQ ID NO:880)、E88A/E795Q(SEQ ID NO:3960)、E125K/E795Q(SEQ ID NO:3962)、G146R/E795Q(SEQ ID NO:3964)、R182V/E795Q(SEQ ID NO:3966)、V491D/E795Q(SEQ ID NO:3968)、Q529I/E795Q(SEQ ID NO:3970)、Y646H/E795Q(SEQ IDNO:3972)、D665N/E795Q(SEQ ID NO:3974)、T814K/E795Q(SEQ ID NO:3976)、L839F/E795Q(SEQ ID NO:3978)、Q906F/E795Q(SEQ ID NO:3980)、E795Q/Q1170D(SEQ ID NO:3982)、G146R/R182V/E795Q(SEQ ID NO:3984)、G146R/E795Q/D665N(SEQ ID NO:3986)、G146R/E795Q/E981V(SEQ ID NO:3988)、G146R/E795Q/T814K(SEQ ID NO:3990)、G146R/R182V/D665N(SEQ ID NO:3992)、E125K/R182V/E981V(SEQ ID NO:3994)、R182V/P799V/E981V(SEQID NO:3996)、R182V/T814K/E981V(SEQ ID NO:3998)、G146R/P799V/E981V(SEQ ID NO:4000)、G146R/R182V/E795Q/F81E(SEQ ID NO:4002)、G146R/R182V/E795Q/E125K(SEQ IDNO:4004)、G146R/R182V/E795Q/E125A(SEQ ID NO:4006)、G146R/R182V/E795Q/P799V(SEQID NO:4008)、G146R/R182V/E795Q/T814K(SEQ ID NO:4010)、G146R/R182V/E795Q/E981V(SEQ ID NO:4012)、G146R/R182V/E795Q/D665N(SEQ ID NO:4014)、G146R/R182V/P799V/E981V(SEQ ID NO:4016)、E125K/G146R/R182V/E795Q/D665N(SEQ ID NO:4018)或G146R/R182V/E795Q/P799V/T814K(SEQ ID NO:4020)。
条款55.根据条款47-54中的任一项所述的试剂盒,其中所述突变体LbCas12a多肽是G146R/R182V/E795Q(SEQ ID NO:3984)。
条款56.一种突变体LbCas12a多肽用于提高在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的用途,其中所述突变体LbCas12a多肽包含引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的至少一个氨基酸替换,条件是所述突变体LbCas12a多肽与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。
条款57.根据条款56所述的用途,其中所述突变体LbCas12a多肽具有选自SEQ IDNO:4-4022的偶数编号序列的多肽序列。
条款58.根据条款56或57所述的用途,其中所述突变体LbCas12a多肽包含在SEQID NO:2的野生型LbCas12a多肽序列的第81、125、145、146、152、182、396、478、491、582、595、606、646、665、795、799、814、839、841、858、860、890、898、909、913、981、1020、1083或1121位处的至少一个氨基酸替换。
条款59.根据条款56-58中的任一项所述的用途,其中所述突变体LbCas12a多肽包含选自SEQ ID NO:2的野生型LbCas12a多肽序列的F81E、E125K、N145R、G146R、T152K、R182V、S396D、K478R、V491D、N582R、K595R、Y606F、Y646H、D665N、E795Q、P799V、T814G、L839F、I841A、E858V、I860R、W890A、E898N、H909K、E913R、E981V、S1020E、V1083W或K1121D的至少一个氨基酸替换。
条款60.根据条款56-59中的任一项所述的用途,其中所述突变体LbCas12a多肽选自:F81E,SEQ ID NO:802;E125K,SEQ ID NO:428;N145R,SEQ ID NO:2902;G146R,SEQ IDNO:156;T152K,SEQ ID NO:694;R182V,SEQ ID NO:98;S396D,SEQ ID NO:108;K478R,SEQID NO:134;V491D,SEQ ID NO:954;N582R,SEQ ID NO:1730;K595R,SEQ ID NO:184;Y606F,SEQ ID NO:642;Y646H,SEQ ID NO:720;D665N,SEQ ID NO:1014;E795Q,SEQ ID NO:930;P799V,SEQ ID NO:706;T814G,SEQ ID NO:162;L839F,SEQ ID NO:834;I841A,SEQ ID NO:988;E858V,SEQ ID NO:114;I860R,SEQ ID NO:250;W890A,SEQ ID NO:3958;E898N,SEQ IDNO:48;H909K,SEQ ID NO:70;E913R,SEQ ID NO:1960;E981V,SEQ ID NO:880;S1020E,SEQID NO:532;V1083W,SEQ ID NO:132;或K1121D,SEQ ID NO:598。
条款61.根据条款56-60中的任一项所述的用途,其中所述突变体LbCas12a多肽包含选自下述的替换突变:
(a)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自下述位置的单个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121;或
(b)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自至少两个下述位置的多个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121。
条款62.根据条款56-61中的任一项所述的用途,其中所述多个替换突变包括E88A/E795Q、E125K/E795Q、G146R/E795Q、R182V/E795Q、V491D/E795Q、Q529I/E795Q、Y646H/E795Q、D665N/E795Q、T814K/E795Q、L839F/E795Q、Q906F/E795Q、E795Q/Q1170D、G146R/R182V/E795Q、G146R/E795Q/D665N、G146R/E795Q/E981V、G146R/E795Q/T814K、G146R/R182V/D665N、E125K/R182V/E981V、R182V/P799V/E981V、R182V/T814K/E981V、G146R/P799V/E981V、G146R/R182V/E795Q/F81E、G146R/R182V/E795Q/E125K、G146R/R182V/E795Q/E125A、G146R/R182V/E795Q/P799V、G146R/R182V/E795Q/T814K、G146R/R182V/E795Q/E981V、G146R/R182V/E795Q/D665N、G146R/R182V/P799V/E981V、E125K/G146R/R182V/E795Q/D665N或G146R/R182V/E795Q/P799V/T814K。
条款63.根据条款56-62中的任一项所述的用途,其中所述突变体LbCas12a多肽选自F81E(SEQ ID NO:802)、E125K(SEQ ID NO:428)、N145R(SEQ ID NO:2902)、G146R(SEQ IDNO:156)、T152K(SEQ ID NO:694)、R182V(SEQ ID NO:98)、V491D(SEQ ID NO:954)、K478R(SEQ ID NO:134)、N582R(SEQ ID NO:1730)、D665N(SEQ ID NO:1014)、E795Q(SEQ ID NO:930)、P799V(SEQ ID NO:706)、E858V(SEQ ID NO:114)、I860R(SEQ ID NO:250)、E913R(SEQID NO:1960)、E981V(SEQ ID NO:880)、E88A/E795Q(SEQ ID NO:3960)、E125K/E795Q(SEQID NO:3962)、G146R/E795Q(SEQ ID NO:3964)、R182V/E795Q(SEQ ID NO:3966)、V491D/E795Q(SEQ ID NO:3968)、Q529I/E795Q(SEQ ID NO:3970)、Y646H/E795Q(SEQ ID NO:3972)、D665N/E795Q(SEQ ID NO:3974)、T814K/E795Q(SEQ ID NO:3976)、L839F/E795Q(SEQID NO:3978)、Q906F/E795Q(SEQ ID NO:3980)、E795Q/Q1170D(SEQ ID NO:3982)、G146R/R182V/E795Q(SEQ ID NO:3984)、G146R/E795Q/D665N(SEQ ID NO:3986)、G146R/E795Q/E981V(SEQ ID NO:3988)、G146R/E795Q/T814K(SEQ ID NO:3990)、G146R/R182V/D665N(SEQID NO:3992)、E125K/R182V/E981V(SEQ ID NO:3994)、R182V/P799V/E981V(SEQ ID NO:3996)、R182V/T814K/E981V(SEQ ID NO:3998)、G146R/P799V/E981V(SEQ ID NO:4000)、G146R/R182V/E795Q/F81E(SEQ ID NO:4002)、G146R/R182V/E795Q/E125K(SEQ ID NO:4004)、G146R/R182V/E795Q/E125A(SEQ ID NO:4006)、G146R/R182V/E795Q/P799V(SEQ IDNO:4008)、G146R/R182V/E795Q/T814K(SEQ ID NO:4010)、G146R/R182V/E795Q/E981V(SEQID NO:4012)、G146R/R182V/E795Q/D665N(SEQ ID NO:4014)、G146R/R182V/P799V/E981V(SEQ ID NO:4016)、E125K/G146R/R182V/E795Q/D665N(SEQ ID NO:4018)或G146R/R182V/E795Q/P799V/T814K(SEQ ID NO:4020)。
条款64.根据条款56-63中的任一项所述的用途,其中所述突变体LbCas12a多肽是G146R/R182V/E795Q(SEQ ID NO:3984)。
条款65.一种表达和纯化突变体LbCas13a蛋白的方法,所述方法包括:
(a)将编码突变体LbCas12a多肽的核苷酸序列插入到表达质粒中,所述突变体LbCas12a多肽与野生型LbCas12a多肽序列相比包含至少一个氨基酸替换,并与SEQ ID NO:4-4022的偶数编号多肽序列中的任一者具有95-99%同一性;
(b)用所述表达质粒转化一个或多个细胞;
(c)诱导所述转化的质粒的表达;
(d)分离所述细胞;
(e)提取所述突变体LbCas13a蛋白;和
(f)纯化所述突变体LbCas13a蛋白;
其中所述突变体LbCas12a多肽与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。
条款66.一种突变体LbCas12a多肽,其通过根据条款65所述的方法生产。
参考文献
Zetsche等,“Cpf1是2类CRISPR-Cas系统的一种单RNA指导的核酸内切酶”(Cpf1Is a Single RNA-Guided Endonuclease of a Class 2 CRISPR-Cas System),Cell 163:759-771(2015)。
Jinek等,“适应性细菌免疫中的可编程双RNA指导的DNA核酸内切酶”(Aprogrammable dual-RNA-guided DNA endonuclease in adaptive bacterialimmunity),Science 337:816-821(2012)。
Schindele和Puchta,“用于高效耐温植物基因编辑的CRISPR/LbCas12a的工程化改造”(Engineering CRISPR/LbCas 12a for highly efficient,temperature-tolerantplant gene editing),Plant Biotechnol.J.18(5):1118-1120(2020)。
Wrenbeck等,“基于质粒的一锅法饱和突变”(Plasmid-based one-potsaturation mutagenesis),Nat.Methods 13:928-930(2016)。
实施例
实施例1
大肠杆菌中LbCas12a变体在TTTT PAM位点处的DNA切割活性的高通量测量
对LbCas12a进行了基于细菌的定向进化,以鉴定具有增强的切割活性的突变。创建了一个深度扫描突变文库,其含有LbCas12a的整个编码序列上所有可能的氨基酸水平上的点突变,其中大多数克隆只含有一个突变。Wrenbeck等,Nat.Methods 13:928-930(2016),其通过参考并入本文。这种类型的文库允许通过在细菌筛选中测量每个点突变与LbCas12a野生型(WT)蛋白相比的相对存活率,对它们的表型进行定向评估。
将带有毒素质粒的筛选菌株用LbCas12a文库和靶向毒素质粒上的HPRT38346位点的crRNA转化。在回收和IPTG诱导后,将细胞在含有阿拉伯糖的LB-氯霉素培养基上铺板,并在37℃温育过夜。提取并纯化存活的大肠杆菌细胞携带的LbCas12a表达质粒。将输入和所选质粒文库两者进行PCR扩增,用Nextera文库制备试剂盒随机片段化,并在IlluminaNextSeqTM上以每个文库~4000万个读出进行测序。测量两个文库中在LbCas12a的每个位置处的突变频率并归一化到每个密码子的总覆盖率。每个点突变的相对存活率被计算为所选与输入文库之间归一化频率之比。所述表型评分(或活性评分)被计算为所选(第4轮)和输入文库(第3轮)之间的归一化频率之比的自然对数,其中每个位置处每个突变体的归一化频率被计算为每个位置处特定突变体与同义变化之比。由于在阿拉伯糖选择下的细胞存活程度指示了LbCas12a变体在HPRT38346前间区序列处的切割活性,因此在选择期间富集的超过WT的任何变体均为在TTTT PAM处具有增强活性的变体。
17,278个具有单个点突变的LbCas12a变体的表型评分(或活性评分)列于表2中。同义变化(n=849,所有位置的69%)的评分紧密簇集在0附近,并因此充当野生型LbCas12a的基线活性(图1A-C)。总的来说,17,278个点突变中的1,977个(~11.4%)表现出一定益处,具有高于所有同义变化的第99百分位数(0.248)的评分(图2;表2)。
表2示出了富集的超过WT蛋白的点突变。所述表型评分是点突变相比于具有有益表型的两个生物平行样的相对富集的自然对数。用于产生饱和突变文库的引物示出在表3中。
Figure BPA0000330845410000931
Figure BPA0000330845410000941
Figure BPA0000330845410000951
Figure BPA0000330845410000961
Figure BPA0000330845410000971
Figure BPA0000330845410000981
Figure BPA0000330845410000991
Figure BPA0000330845410001001
Figure BPA0000330845410001011
Figure BPA0000330845410001021
Figure BPA0000330845410001031
Figure BPA0000330845410001041
Figure BPA0000330845410001051
Figure BPA0000330845410001061
Figure BPA0000330845410001071
Figure BPA0000330845410001081
Figure BPA0000330845410001091
Figure BPA0000330845410001101
Figure BPA0000330845410001111
Figure BPA0000330845410001121
Figure BPA0000330845410001131
Figure BPA0000330845410001141
Figure BPA0000330845410001151
Figure BPA0000330845410001161
Figure BPA0000330845410001171
Figure BPA0000330845410001181
Figure BPA0000330845410001191
Figure BPA0000330845410001201
Figure BPA0000330845410001211
Figure BPA0000330845410001221
Figure BPA0000330845410001231
Figure BPA0000330845410001241
Figure BPA0000330845410001251
Figure BPA0000330845410001261
Figure BPA0000330845410001271
Figure BPA0000330845410001281
Figure BPA0000330845410001291
Figure BPA0000330845410001301
Figure BPA0000330845410001311
Figure BPA0000330845410001321
Figure BPA0000330845410001331
Figure BPA0000330845410001341
Figure BPA0000330845410001351
Figure BPA0000330845410001361
Figure BPA0000330845410001371
Figure BPA0000330845410001381
Figure BPA0000330845410001391
Figure BPA0000330845410001401
Figure BPA0000330845410001411
Figure BPA0000330845410001421
Figure BPA0000330845410001431
Figure BPA0000330845410001441
Figure BPA0000330845410001451
Figure BPA0000330845410001461
Figure BPA0000330845410001471
Figure BPA0000330845410001481
Figure BPA0000330845410001491
Figure BPA0000330845410001501
Figure BPA0000330845410001511
Figure BPA0000330845410001521
Figure BPA0000330845410001531
Figure BPA0000330845410001541
Figure BPA0000330845410001551
Figure BPA0000330845410001561
Figure BPA0000330845410001571
Figure BPA0000330845410001581
Figure BPA0000330845410001591
Figure BPA0000330845410001601
Figure BPA0000330845410001611
Figure BPA0000330845410001621
Figure BPA0000330845410001631
Figure BPA0000330845410001641
Figure BPA0000330845410001651
Figure BPA0000330845410001661
Figure BPA0000330845410001671
Figure BPA0000330845410001681
Figure BPA0000330845410001691
Figure BPA0000330845410001701
Figure BPA0000330845410001711
Figure BPA0000330845410001721
Figure BPA0000330845410001731
Figure BPA0000330845410001741
Figure BPA0000330845410001751
Figure BPA0000330845410001761
Figure BPA0000330845410001771
Figure BPA0000330845410001781
Figure BPA0000330845410001791
Figure BPA0000330845410001801
Figure BPA0000330845410001811
Figure BPA0000330845410001821
Figure BPA0000330845410001831
Figure BPA0000330845410001841
Figure BPA0000330845410001851
Figure BPA0000330845410001861
Figure BPA0000330845410001871
Figure BPA0000330845410001881
Figure BPA0000330845410001891
Figure BPA0000330845410001901
Figure BPA0000330845410001911
Figure BPA0000330845410001921
Figure BPA0000330845410001931
Figure BPA0000330845410001941
Figure BPA0000330845410001951
Figure BPA0000330845410001961
Figure BPA0000330845410001971
Figure BPA0000330845410001981
Figure BPA0000330845410001991
为了证实所述结果的实用性,首先评估在那些具有已知结果的位置处的LbCas12a突变的表型,包括N527、E795、D156、G532和K538,它们对应于AsCas12a中的M537、F870、E174、S542或K548突变。
在以前的研究中,选择了M537R和F870L来产生AsCas12a-Ultra以增强切割活性。参见美国专利申请公布号US 2020/0109382 A1,其通过参考并入本文。作为每个位置处的第二选择,M537K和F870I是有益的,但程度较低(表4)。然而,只有E795L被成功转移到LbCas12a,其中N527R负面影响酶活性。AsCas12a与LbCas12a之间的这种差异在整个筛选中得到准确反映。
Figure BPA0000330845410002001
E795处突变的表型评分的检查揭示出E795L而不是E795I的有益表型。此外,作为这个位置的最佳选择,E795Q的性能优于其他突变(图3A)。相反,除了N527N和N527K以外,N527位置处的大多数突变从筛选中退出。此外,与同义变化(N527N)相比,N527K表现出强阴性表型(图3B)。这些数据表明在LbCas12a的N527位置处的突变通常是有害的,这与以前关于N527R突变体的活性丧失的发现相一致。
进一步评估了LbCas12a中D156、G532和K538位置处的突变的影响(表5),因为以前已显示AsCas12a中的相应突变体(E174R/S542R/K548R)提高活性。首先,包括D156R在内的D156处的大多数突变具有比WT更高的表型评分,表明在AsCas12a中发现的类似突变体(E174R)可以以相似的结果转移到LbCas12a(图4A)。目前的筛选进一步揭示了D156Q是最佳突变体。包括G532R在内的G532处的突变降低活性(图4B)。K538处的几乎所有突变体均从筛选中退出,表明在该位置处的突变通常是不耐受的(数据未示出)。
Figure BPA0000330845410002002
这些结果与以前的研究相一致,显示出D156R是对LbCas12a有益的突变(图4A)。参见Schindele和Puchta,Plant Biotechnol J.18(5):1118-1120(2010),其通过参考并入本文。合在一起,所述高通量数据准确再现并鉴定了具有已知结果的突变。此外,这些实验说明在一个Cas12a家族成员中发现的点突变不能被可靠地转移到其他成员,因为在AsCas12a中鉴定到的大多数增强活性的突变体在LbCas12a中是有害的。
在所述高通量结果指导下,克隆了一组具有新的点突变(G146R、S396D、K478R、K595R、E795Q、T814G、E898N和V1083W)的LbCas12a变体,并在细菌选择测定的背景下测试了它们的活性。如图5C-J中所示,在选择后这些突变体与WT-LbCas12a相比提高了细菌的存活率,表明它们可以被添加到WT-LbCas12a以增强其在TTTT-PAM处的固有切割活性。
Figure BPA0000330845410002011
Figure BPA0000330845410002021
表6中活性最高的10个突变体不一定是增强在TTTT-PAM处的编辑的最佳突变体。这是因为表型是在大肠杆菌细胞中测量的。除了增强DNA切割之外,一些突变体被富集是因为它们降低对宿主细胞的毒性或在大肠杆菌中提高LbCas12a的溶解性或表达水平。这些变体可用于大肠杆菌或已知CRISPR酶(Cas12a或Cas9)的毒性在其中是一个问题的其他细菌的基因组编辑。WT酶被认为是有毒的,它引起不佳的转化效率和编辑效率。文献中已显示,降低CRISPR酶的毒性、活性或表达水平可提高编辑效率。然而,这种类型的毒性在哺乳动物细胞中通常不是问题。因此,为了获得在人类细胞中工作更好的突变体,在HEK293细胞中测试了所选的一组突变体的进一步验证。
实施例2
具有增强的活性的LbCas12a突变体
在本研究中评估的LbCas12a变体列于表7中。使用表8中列出的引物进行定点突变,以将特定点突变引入到表达载体上。特定单一、双重、三重、四重、五重和六重突变的表型在大肠杆菌中作为每个突变体的菌落形成单位(CFU)进行评估。那些在选择后具有提高的CFU的突变体指示了在大肠杆菌中的编辑效率提高,不论隐含的机制如何。
Figure BPA0000330845410002031
 
Figure BPA0000330845410002041
Figure BPA0000330845410002051
Figure BPA0000330845410002061
 
Figure BPA0000330845410002071
Figure BPA0000330845410002081
将LbCas12a突变体转化到大肠杆菌BL21(DE3)细胞中,使用适合菌株的菌落接种含有卡那霉素(0.05mg/mL)的TB培养基并在37℃下生长,直至达到OD为大约0.9,然后将摇瓶冷却至18℃ 30分钟。添加500μL 1M IPTG用于诱导蛋白质表达,然后在18℃生长19小时。收获细胞并将细胞沉积物重悬浮,在预冷到4℃的Avestin Emulsiflex C3上以15-20kpsi通过三次进行裂解。将裂解物在4℃下以16,000×g离心20分钟以除去细胞碎片。
将澄清的裂解物置于HisTrapTM HP柱(Cytiva)上。所述程序由以下组成:用
Figure BPA0000330845410002082
缓冲液(20mM NaPO4pH 6.8,0.5M NaCl,10mM咪唑,5%甘油)平衡树脂,然后装载样品。将样品用His-Bind缓冲液清洗,然后进行额外的标准清洗和由10%His洗脱缓冲液(10mM NaPO4pH 6.8,250mM NaCl,150mM咪唑,5%甘油)组成的10%“B”清洗。最后,使用His洗脱缓冲液将样品洗脱。
然后将部分纯化的Cas13a变体置于
Figure BPA0000330845410002083
肝素HP柱上。所述程序由以下组成:用肝素结合缓冲液(20mM NaPO4pH 6.8,250mM NaCl,10%甘油)平衡树脂,然后装载样品。然后将样品用肝素结合缓冲液清洗,然后进行由5%肝素洗脱缓冲液(10mM NaPO4pH 6.8,1M NaCl,10%甘油)组成的5%“B”清洗。最后,使用肝素洗脱缓冲液(10mM NaPO4pH 6.8,1MNaCl,10%甘油)洗脱纯化的蛋白。最后,使用肝素洗脱纯化的蛋白。
将纯化的LbCas12a突变体浓缩至大约10mg/mL,并在-20℃下储存在含有25mMTris-HCl pH 7.4、0.3M NaCl、1mM EDTA、1mM DTT和50%甘油的储存缓冲液中。
实施例3
LbCas12a变体在人类细胞中的编辑效率
为了评估每种变体的基因组编辑效率,使用靶向人类HPRT基因的4种crRNA(表9)来组装LbCas12a-RNP(1μM)。通过Lonza核转染(SF缓冲液,CM-130)将组装的RNP(50nM)递送到HEK293细胞中,并在递送后48小时通过T7核酸内切酶I测定法测量编辑效率(表10;图6A)。
Figure BPA0000330845410002091
为了便于比较,将变体在每个靶处的效率归一化到WT LbCas12a,并在表11和图6B中表示为与WT相比的提高倍数。总的来说,纯化的57种含有单个或多个点突变的变体中的49种变体在一个或多个位点处相比于WT活性提高(表10-11)。38号三重突变体(SEQ ID NO:3984)G146R/R182V/E795Q(“RVQ”)具有最好的表现,在这种测定中与WT相比提高~3倍。在RVQ上叠加其他有益突变逐渐降低活性(参见突变体编号47-57,表10-11;图6A-B)。因此,三重突变体RVQ(编号38,SEQ ID NO:3984)似乎是用于基因组编辑的最佳LbCas12a变体。
Figure BPA0000330845410002092
 
Figure BPA0000330845410002101
Figure BPA0000330845410002111
Figure BPA0000330845410002121

Claims (66)

1.一种分离的突变体LbCas12a多肽,其包含引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的至少一个氨基酸替换,条件是所述突变体LbCas12a多肽与所述野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。
2.根据权利要求1所述的分离的突变体LbCas12a多肽,其中所述突变体LbCas12a多肽与选自SEQ ID NO:4-4022的偶数编号序列的多肽序列具有95%至99%同一性。
3.根据权利要求1所述的分离的突变体LbCas12a多肽,其中所述突变体LbCas12a多肽具有选自SEQ ID NO:4-4022的偶数编号序列的多肽序列。
4.根据权利要求1所述的分离的突变体LbCas12a多肽,其中所述突变体LbCas12a多肽在SEQ ID NO:2的野生型LbCas12a多肽序列的第81、125、145、146、152、182、396、478、491、582、595、606、646、665、795、799、814、839、841、858、860、890、898、909、913、981、1020、1083或1121位处包含至少一个氨基酸替换。
5.根据权利要求4所述的分离的突变体LbCas12a多肽,其中所述突变体LbCas12a多肽包含选自SEQ ID NO:2的野生型LbCas12a多肽序列的F81E、E125K、N145R、G146R、T152K、R182V、S396D、K478R、V491D、N582R、K595R、Y606F、Y646H、D665N、E795Q、P799V、T814G、L839F、I841A、E858V、I860R、W890A、E898N、H909K、E913R、E981V、S1020E、V1083W或K1121D的至少一个氨基酸替换。
6.根据权利要求4所述的分离的突变体LbCas12a多肽,其中所述突变体LbCas12a多肽选自:F81E,SEQ ID NO:802;E125K,SEQ ID NO:428;N145R,SEQ ID NO:2902;G146R,SEQ IDNO:156;T152K,SEQ ID NO:694;R182V,SEQ ID NO:98;S396D,SEQ ID NO:108;K478R,SEQID NO:134;V491D,SEQ ID NO:954;N582R,SEQ ID NO:1730;K595R,SEQ ID NO:184;Y606F,SEQ ID NO:642;Y646H,SEQ ID NO:720;D665N,SEQ ID NO:1014;E795Q,SEQ ID NO:930;P799V,SEQ ID NO:706;T814G,SEQ ID NO:162;L839F,SEQ ID NO:834;I841A,SEQ ID NO:988;E858V,SEQ ID NO:114;I860R,SEQ ID NO:250;W890A,SEQ ID NO:3958;E898N,SEQ IDNO:48;H909K,SEQ ID NO:70;E913R,SEQ ID NO:1960;E981V,SEQ ID NO:880;S1020E,SEQID NO:532;V1083W,SEQ ID NO:132;或K1121D,SEQ ID NO:598。
7.根据权利要求1所述的分离的突变体LbCas12a多肽,其中所述突变体LbCas12a多肽包含选自下述的替换突变:
(a)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自下述位置的单个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121;或
(b)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自至少两个下述位置的多个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121。
8.根据权利要求7所述的分离的突变体LbCas12a多肽,其中所述多个替换突变包括E88A/E795Q、E125K/E795Q、G146R/E795Q、R182V/E795Q、V491D/E795Q、Q529I/E795Q、Y646H/E795Q、D665N/E795Q、T814K/E795Q、L839F/E795Q、Q906F/E795Q、E795Q/Q1170D、G146R/R182V/E795Q、G146R/E795Q/D665N、G146R/E795Q/E981V、G146R/E795Q/T814K、G146R/R182V/D665N、E125K/R182V/E981V、R182V/P799V/E981V、R182V/T814K/E981V、G146R/P799V/E981V、G146R/R182V/E795Q/F81E、G146R/R182V/E795Q/E125K、G146R/R182V/E795Q/E125A、G146R/R182V/E795Q/P799V、G146R/R182V/E795Q/T814K、G146R/R182V/E795Q/E981V、G146R/R182V/E795Q/D665N、G146R/R182V/P799V/E981V、E125K/G146R/R182V/E795Q/D665N、G146R/R182V/E795Q/P799V/T814K或E125K/G146R/R182V/E795Q/D665N/E981V。
9.根据权利要求7所述的分离的突变体LbCas12a多肽,其中所述多个替换突变包括E88A/E795Q、E125K/E795Q、G146R/E795Q、R182V/E795Q、V491D/E795Q、Q529I/E795Q、Y646H/E795Q、D665N/E795Q、T814K/E795Q、L839F/E795Q、Q906F/E795Q、E795Q/Q1170D、G146R/R182V/E795Q、G146R/E795Q/D665N、G146R/E795Q/E981V、G146R/E795Q/T814K、G146R/R182V/D665N、E125K/R182V/E981V、R182V/P799V/E981V、R182V/T814K/E981V、G146R/P799V/E981V、G146R/R182V/E795Q/F81E、G146R/R182V/E795Q/E125K、G146R/R182V/E795Q/E125A、G146R/R182V/E795Q/P799V、G146R/R182V/E795Q/T814K、G146R/R182V/E795Q/E981V、G146R/R182V/E795Q/D665N、G146R/R182V/P799V/E981V、E125K/G146R/R182V/E795Q/D665N或G146R/R182V/E795Q/P799V/T814K,并且与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。
10.根据权利要求7所述的分离的突变体LbCas12a多肽,其中所述突变体LbCas12a多肽选自SEQ ID NO:802、428、2902、156、694、98、954、134、1730、642、720、1014、930、706、834、988、114、250、3958、48、70、1960、880、532、598、3960、3962、3964、3966、3968、3970、3972、3974、3976、3978、3980、3982、3984、3986、3988、3990、3992、3994、3996、3998、4000、4002、4004、4006、4008、4010、4012、4014、4016、4018、4020或4022。
11.根据权利要求7所述的分离的突变体LbCas12a多肽,其中所述突变体LbCas12a多肽选自F81E(SEQ ID NO:802)、E125K(SEQ ID NO:428)、N145R(SEQ ID NO:2902)、G146R(SEQID NO:156)、T152K(SEQ ID NO:694)、R182V(SEQ ID NO:98)、V491D(SEQ ID NO:954)、K478R(SEQ ID NO:134)、N582R(SEQ ID NO:1730)、D665N(SEQ ID NO:1014)、E795Q(SEQ IDNO:930)、P799V(SEQ ID NO:706)、E858V(SEQ ID NO:114)、I860R(SEQ ID NO:250)、E913R(SEQ ID NO:1960)、E981V(SEQ ID NO:880)、E88A/E795Q(SEQ ID NO:3960)、E125K/E795Q(SEQ ID NO:3962)、G146R/E795Q(SEQ ID NO:3964)、R182V/E795Q(SEQ ID NO:3966)、V491D/E795Q(SEQ ID NO:3968)、Q529I/E795Q(SEQ ID NO:3970)、Y646H/E795Q(SEQ IDNO:3972)、D665N/E795Q(SEQ ID NO:3974)、T814K/E795Q(SEQ ID NO:3976)、L839F/E795Q(SEQ ID NO:3978)、Q906F/E795Q(SEQ ID NO:3980)、E795Q/Q1170D(SEQ ID NO:3982)、G146R/R182V/E795Q(SEQ ID NO:3984)、G146R/E795Q/D665N(SEQ ID NO:3986)、G146R/E795Q/E981V(SEQ ID NO:3988)、G146R/E795Q/T814K(SEQ ID NO:3990)、G146R/R182V/D665N(SEQ ID NO:3992)、E125K/R182V/E981V(SEQ ID NO:3994)、R182V/P799V/E981V(SEQID NO:3996)、R182V/T814K/E981V(SEQ ID NO:3998)、G146R/P799V/E981V(SEQ ID NO:4000)、G146R/R182V/E795Q/F81E(SEQ ID NO:4002)、G146R/R182V/E795Q/E125K(SEQ IDNO:4004)、G146R/R182V/E795Q/E125A(SEQ ID NO:4006)、G146R/R182V/E795Q/P799V(SEQID NO:4008)、G146R/R182V/E795Q/T814K(SEQ ID NO:4010)、G146R/R182V/E795Q/E981V(SEQ ID NO:4012)、G146R/R182V/E795Q/D665N(SEQ ID NO:4014)、G146R/R182V/P799V/E981V(SEQ ID NO:4016)、E125K/G146R/R182V/E795Q/D665N(SEQ ID NO:4018)或G146R/R182V/E795Q/P799V/T814K(SEQ ID NO:4020)。
12.根据权利要求7所述的分离的突变体LbCas12a多肽,其中所述突变体LbCas12a多肽是G146R/R182V/E795Q(SEQ ID NO:3984)。
13.一种分离的多核苷酸序列,其编码包含引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的至少一个氨基酸替换的突变体LbCas12a多肽,条件是所述突变体LbCas12a多肽与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。
14.根据权利要求13所述的分离的多核苷酸序列,其中编码的突变体LbCas12a多肽与选自SEQ ID NO:4-4022的偶数编号序列的多肽序列具有95%至99%同一性。
15.根据权利要求13所述的分离的多核苷酸序列,其中编码的突变体LbCas12a多肽具有选自SEQ ID NO:4-4022的偶数编号序列的多肽序列。
16.根据权利要求13所述的分离的多核苷酸序列,其中所述突变体LbCas12a多核苷酸序列与选自SEQ ID NO:3-4021的奇数编号序列的核苷酸序列具有95%至99%同一性。
17.根据权利要求13所述的分离的多核苷酸序列,其中所述突变体LbCas12a多核苷酸具有选自SEQ ID NO:3-4021的奇数编号序列的核苷酸序列。
18.根据权利要求13所述的分离的多核苷酸序列,其中编码的突变体LbCas12a多肽包含在SEQ ID NO:2的野生型LbCas12a多肽序列的第81、125、145、146、152、182、396、478、491、582、595、606、646、665、795、799、814、839、841、858、860、890、898、909、913、981、1020、1083或1121位处的至少一个氨基酸替换。
19.根据权利要求18所述的分离的多核苷酸序列,其中编码的突变体LbCas12a多肽与SEQ ID NO:2的野生型LbCas12a多肽序列相比包含选自F81E、E125K、N145R、G146R、T152K、R182V、S396D、K478R、V491D、N582R、K595R、Y606F、Y646H、D665N、E795Q、P799V、T814G、L839F、I841A、E858V、I860R、W890A、E898N、H909K、E913R、E981V、S1020E、V1083W或K1121D的至少一个氨基酸替换。
20.根据权利要求18所述的分离的突变体LbCas12a多核苷酸,其中所述突变体LbCas12a多核苷酸选自:F81E,SEQ ID NO:802;E125K,SEQ ID NO:428;N145R,SEQ ID NO:2902;G146R,SEQ ID NO:156;T152K,SEQ ID NO:694;R182V,SEQ ID NO:98;S396D,SEQ IDNO:108;K478R,SEQ ID NO:134;V491D,SEQ ID NO:954;N582R,SEQ ID NO:1730;K595R,SEQID NO:184;Y606F,SEQ ID NO:642;Y646H,SEQ ID NO:720;D665N,SEQ ID NO:1014;E795Q,SEQ ID NO:930;P799V,SEQ ID NO:706;T814G,SEQ ID NO:162;L839F,SEQ ID NO:834;I841A,SEQ ID NO:988;E858V,SEQ ID NO:114;I860R,SEQ ID NO:250;W890A,SEQ ID NO:3958;E898N,SEQ ID NO:48;H909K,SEQ ID NO:70;E913R,SEQ ID NO:1960;E981V,SEQ IDNO:880;S1020E,SEQ ID NO:532;V1083W,SEQ ID NO:132;或K1121D,SEQ ID NO:598。
21.根据权利要求13所述的分离的突变体LbCas12a多核苷酸,其中编码的突变体LbCas12a多肽包含选自下述的替换突变:
(a)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自下述位置的单个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121;或
(b)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自至少两个下述位置的多个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121。
22.根据权利要求21所述的分离的突变体LbCas12a多核苷酸,其中所述多个替换突变包括E88A/E795Q、E125K/E795Q、G146R/E795Q、R182V/E795Q、V491D/E795Q、Q529I/E795Q、Y646H/E795Q、D665N/E795Q、T814K/E795Q、L839F/E795Q、Q906F/E795Q、E795Q/Q1170D、G146R/R182V/E795Q、G146R/E795Q/D665N、G146R/E795Q/E981V、G146R/E795Q/T814K、G146R/R182V/D665N、E125K/R182V/E981V、R182V/P799V/E981V、R182V/T814K/E981V、G146R/P799V/E981V、G146R/R182V/E795Q/F81E、G146R/R182V/E795Q/E125K、G146R/R182V/E795Q/E125A、G146R/R182V/E795Q/P799V、G146R/R182V/E795Q/T814K、G146R/R182V/E795Q/E981V、G146R/R182V/E795Q/D665N、G146R/R182V/P799V/E981V、E125K/G146R/R182V/E795Q/D665N、G146R/R182V/E795Q/P799V/T814K或E125K/G146R/R182V/E795Q/D665N/E981V。
23.根据权利要求21所述的分离的突变体LbCas12a多核苷酸,其中所述多个替换突变包括E88A/E795Q、E125K/E795Q、G146R/E795Q、R182V/E795Q、V491D/E795Q、Q529I/E795Q、Y646H/E795Q、D665N/E795Q、T814K/E795Q、L839F/E795Q、Q906F/E795Q、E795Q/Q1170D、G146R/R182V/E795Q、G146R/E795Q/D665N、G146R/E795Q/E981V、G146R/E795Q/T814K、G146R/R182V/D665N、E125K/R182V/E981V、R182V/P799V/E981V、R182V/T814K/E981V、G146R/P799V/E981V、G146R/R182V/E795Q/F81E、G146R/R182V/E795Q/E125K、G146R/R182V/E795Q/E125A、G146R/R182V/E795Q/P799V、G146R/R182V/E795Q/T814K、G146R/R182V/E795Q/E981V、G146R/R182V/E795Q/D665N、G146R/R182V/P799V/E981V、E125K/G146R/R182V/E795Q/D665N或G146R/R182V/E795Q/P799V/T814K,并且与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。
24.根据权利要求21所述的分离的突变体LbCas12a多核苷酸,其中编码的突变体LbCas12a多肽选自F81E(SEQ ID NO:802)、E125K(SEQ ID NO:428)、N145R(SEQ ID NO:2902)、G146R(SEQ ID NO:156)、T152K(SEQ ID NO:694)、R182V(SEQ ID NO:98)、V491D(SEQID NO:954)、K478R(SEQ ID NO:134)、N582R(SEQ ID NO:1730)、D665N(SEQ ID NO:1014)、E795Q(SEQ ID NO:930)、P799V(SEQ ID NO:706)、E858V(SEQ ID NO:114)、1860R(SEQ IDNO:250)、E913R(SEQ ID NO:1960)、E981V(SEQ ID NO:880)、E88A/E795Q(SEQ ID NO:3960)、E125K/E795Q(SEQ ID NO:3962)、G146R/E795Q(SEQ ID NO:3964)、R182V/E795Q(SEQID NO:3966)、V491D/E795Q(SEQ ID NO:3968)、Q529I/E795Q(SEQ ID NO:3970)、Y646H/E795Q(SEQ ID NO:3972)、D665N/E795Q(SEQ ID NO:3974)、T814K/E795Q(SEQ ID NO:3976)、L839F/E795Q(SEQ ID NO:3978)、Q906F/E795Q(SEQ ID NO:3980)、E795Q/Q1170D(SEQ ID NO:3982)、G146R/R182V/E795Q(SEQ ID NO:3984)、G146R/E795Q/D665N(SEQ IDNO:3986)、G146R/E795Q/E981V(SEQ ID NO:3988)、G146R/E795Q/T814K(SEQ ID NO:3990)、G146R/R182V/D665N(SEQ ID NO:3992)、E125K/R182V/E981V(SEQ ID NO:3994)、R182V/P799V/E981V(SEQ ID NO:3996)、R182V/T814K/E981V(SEQ ID NO:3998)、G146R/P799V/E981V(SEQ ID NO:4000)、G146R/R182V/E795Q/F81E(SEQ ID NO:4002)、G146R/R182V/E795Q/E125K(SEQ ID NO:4004)、G146R/R182V/E795Q/E125A(SEQ ID NO:4006)、G146R/R182V/E795Q/P799V(SEQ ID NO:4008)、G146R/R182V/E795Q/T814K(SEQ ID NO:4010)、G146R/R182V/E795Q/E981V(SEQ ID NO:4012)、G146R/R182V/E795Q/D665N(SEQ ID NO:4014)、G146R/R182V/P799V/E981V(SEQ ID NO:4016)、E125K/G146R/R182V/E795Q/D665N(SEQ ID NO:4018)或G146R/R182V/E795Q/P799V/T814K(SEQ ID NO:4020)。
25.根据权利要求21所述的分离的突变体LbCas12a多核苷酸,其中编码的突变体LbCas12a多肽是G146R/R182V/E795Q(SEQ ID NO:3984)。
26.根据权利要求21所述的分离的突变体LbCas12a多核苷酸,其中所述突变体LbCas12a多核苷酸选自SEQ ID NO:801、427、2901、155、693、97、953、133、1729、641、719、1013、929、705、833、987、113、249、3957、47、69、1959、879、531、597、3959、3961、3963、3965、3967、3969、3971、3973、3975、3977、3979、3981、3983、3985、3987、3989、3991、3993、3995、3997、3999、4001、4003、4005、4007、4009、4011、4013、4015、4017、4019或4021。
27.根据权利要求21所述的分离的突变体LbCas12a多核苷酸,其中所述突变体LbCas12a多核苷酸选自SEQ ID NO:801、427、2901、155、693、97、953、133、1729、1013、929、705、113、249、531、597、3959、3961、3963、3965、3967、3969、3971、3973、3975、3977、3979、3981、3983、3985、3987、3989、3991、3993、3995、3997、3999、4001、4003、4005、4007、4009、4011、4013、4015、4017或4019,并编码与野生型LbCas12a多肽序列相比提供在非经典TTTTPAM位点处CRISPR/LbCas12a相关核酸酶活性的提高的突变体LbCas12a多肽。
28.根据权利要求21所述的分离的突变体LbCas12a多核苷酸,其中所述突变体LbCas12a多核苷酸是SEQ ID NO:3983。
29.一种载体或质粒,其包含根据权利要求13所述的多核苷酸序列。
30.一种细胞,其包含根据权利要求13所述的多核苷酸序列或根据权利要求29所述的载体或质粒。
31.一种分离的核糖核蛋白复合体,其包含向导RNA和突变体LbCas12a多肽,所述突变体LbCas12a多肽包含引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的至少一个氨基酸替换,条件是所述突变体LbCas12a多肽与所述野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。
32.根据权利要求31所述的分离的核糖核蛋白复合体,其中所述突变体LbCas12a多肽具有选自SEQ ID NO:4-4022的偶数编号序列的多肽序列。
33.根据权利要求31所述的分离的核糖核蛋白复合体,其中所述突变体LbCas12a多肽包含在SEQ ID NO:2的野生型LbCas12a多肽序列的第81、125、145、146、152、182、396、478、491、582、595、606、646、665、795、799、814、839、841、858、860、890、898、909、913、981、1020、1083或1121位处的至少一个氨基酸替换。
34.根据权利要求33所述的分离的核糖核蛋白复合体,其中所述突变体LbCas12a多肽包含选自SEQ ID NO:2的野生型LbCas12a多肽序列的F81E、E125K、N145R、G146R、T152K、R182V、S396D、K478R、V491D、N582R、K595R、Y606F、Y646H、D665N、E795Q、P799V、T814G、L839F、I841A、E858V、I860R、W890A、E898N、H909K、E913R、E981V、S1020E、V1083W或K1121D的至少一个氨基酸替换。
35.根据权利要求33所述的分离的核糖核蛋白复合体,其中所述突变体LbCas12a多肽选自:F81E,SEQ ID NO:802;E125K,SEQ ID NO:428;N145R,SEQ ID NO:2902;G146R,SEQ IDNO:156;T152K,SEQ ID NO:694;R182V,SEQ ID NO:98;S396D,SEQ ID NO:108;K478R,SEQID NO:134;V491D,SEQ ID NO:954;N582R,SEQ ID NO:1730;K595R,SEQ ID NO:184;Y606F,SEQ ID NO:642;Y646H,SEQ ID NO:720;D665N,SEQ ID NO:1014;E795Q,SEQ ID NO:930;P799V,SEQ ID NO:706;T814G,SEQ ID NO:162;L839F,SEQ ID NO:834;I841A,SEQ ID NO:988;E858V,SEQ ID NO:114;I860R,SEQ ID NO:250;W890A,SEQ ID NO:3958;E898N,SEQ IDNO:48;H909K,SEQ ID NO:70;E913R,SEQ ID NO:1960;E981V,SEQ ID NO:880;S1020E,SEQID NO:532;V1083W,SEQ ID NO:132;或K1121D,SEQ ID NO:598。
36.根据权利要求31所述的分离的核糖核蛋白复合体,其中所述突变体LbCas12a多肽选自F81E(SEQ ID NO:802)、E125K(SEQ ID NO:428)、N145R(SEQ ID NO:2902)、G146R(SEQID NO:156)、T152K(SEQ ID NO:694)、R182V(SEQ ID NO:98)、V491D(SEQ ID NO:954)、K478R(SEQ ID NO:134)、N582R(SEQ ID NO:1730)、D665N(SEQ ID NO:1014)、E795Q(SEQ IDNO:930)、P799V(SEQ ID NO:706)、E858V(SEQ ID NO:114)、I860R(SEQ ID NO:250)、E913R(SEQ ID NO:1960)、E981V(SEQ ID NO:880)、E88A/E795Q(SEQ ID NO:3960)、E125K/E795Q(SEQ ID NO:3962)、G146R/E795Q(SEQ ID NO:3964)、R182V/E795Q(SEQ ID NO:3966)、V491D/E795Q(SEQ ID NO:3968)、Q529I/E795Q(SEQ ID NO:3970)、Y646H/E795Q(SEQ IDNO:3972)、D665N/E795Q(SEQ ID NO:3974)、T814K/E795Q(SEQ ID NO:3976)、L839F/E795Q(SEQ ID NO:3978)、Q906F/E795Q(SEQ ID NO:3980)、E795Q/Q1170D(SEQ ID NO:3982)、G146R/R182V/E795Q(SEQ ID NO:3984)、G146R/E795Q/D665N(SEQ ID NO:3986)、G146R/E795Q/E981V(SEQ ID NO:3988)、G146R/E795Q/T814K(SEQ ID NO:3990)、G146R/R182V/D665N(SEQ ID NO:3992)、E125K/R182V/E981V(SEQ ID NO:3994)、R182V/P799V/E981V(SEQID NO:3996)、R182V/T814K/E981V(SEQ ID NO:3998)、G146R/P799V/E981V(SEQ ID NO:4000)、G146R/R182V/E795Q/F81E(SEQ ID NO:4002)、G146R/R182V/E795Q/E125K(SEQ IDNO:4004)、G146R/R182V/E795Q/E125A(SEQ ID NO:4006)、G146R/R182V/E795Q/P799V(SEQID NO:4008)、G146R/R182V/E795Q/T814K(SEQ ID NO:4010)、G146R/R182V/E795Q/E981V(SEQ ID NO:4012)、G146R/R182V/E795Q/D665N(SEQ ID NO:4014)、G146R/R182V/P799V/E981V(SEQ ID NO:4016)、E125K/G146R/R182V/E795Q/D665N(SEQ ID NO:4018)或G146R/R182V/E795Q/P799V/T814K(SEQ ID NO:4020)。
37.根据权利要求36所述的分离的核糖核蛋白复合体,其中所述突变体LbCas12a多肽是G146R/R182V/E795Q(SEQ ID NO:3984)。
38.一种使用CRISPR核糖核蛋白复合体在细胞中提高在非经典TTTT PAM位点处的基因编辑效率的方法,所述方法包括:
将细胞与所述CRISPR核糖核蛋白复合体接触,所述复合体包括向导RNA和突变体LbCas12a多肽,所述突变体LbCas12a多肽包含引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的至少一个氨基酸替换,条件是所述突变体LbCas12a多肽与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。
39.根据权利要求38所述的方法,其中所述突变体LbCas12a多肽具有选自SEQ ID NO:4-4022的偶数编号序列的多肽序列。
40.根据权利要求38所述的方法,其中所述突变体LbCas12a多肽包含在SEQ ID NO:2的野生型LbCas12a多肽序列的第81、125、145、146、152、182、396、478、491、582、595、606、646、665、795、799、814、839、841、858、860、890、898、909、913、981、1020、1083或1121位处的至少一个氨基酸替换。
41.根据权利要求40所述的方法,其中所述突变体LbCas12a多肽包含选自SEQ ID NO:2的野生型LbCas12a多肽序列的F81E、E125K、N145R、G146R、T152K、R182V、S396D、K478R、V491D、N582R、K595R、Y606F、Y646H、D665N、E795Q、P799V、T814G、L839F、I841A、E858V、I860R、W890A、E898N、H909K、E913R、E981V、S1020E、V1083W或K1121D的至少一个氨基酸替换。
42.根据权利要求40所述的方法,其中所述突变体LbCas12a多肽选自:F81E,SEQ IDNO:802;E125K,SEQ ID NO:428;N145R,SEQ ID NO:2902;G146R,SEQ ID NO:156;T152K,SEQID NO:694;R182V,SEQ ID NO:98;S396D,SEQ ID NO:108;K478R,SEQ ID NO:134;V491D,SEQ ID NO:954;N582R,SEQ ID NO:1730;K595R,SEQ ID NO:184;Y606F,SEQ ID NO:642;Y646H,SEQ ID NO:720;D665N,SEQ ID NO:1014;E795Q,SEQ ID NO:930;P799V,SEQ ID NO:706;T814G,SEQ ID NO:162;L839F,SEQ ID NO:834;I841A,SEQ ID NO:988;E858V,SEQ IDNO:114;I860R,SEQ ID NO:250;W890A,SEQ ID NO:3958;E898N,SEQ ID NO:48;H909K,SEQID NO:70;E913R,SEQ ID NO:1960;E981V,SEQ ID NO:880;S1020E,SEQ ID NO:532;V1083W,SEQ ID NO:132;或K1121D,SEQ ID NO:598。
43.根据权利要求38所述的方法,其中所述突变体LbCas12a多肽包含选自下述的替换突变:
(a)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自下述位置的单个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121;或者
(b)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自至少两个下述位置的多个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121。
44.根据权利要求43所述的方法,其中所述多个替换突变包括E88A/E795Q、E125K/E795Q、G146R/E795Q、R182V/E795Q、V491D/E795Q、Q529I/E795Q、Y646H/E795Q、D665N/E795Q、T814K/E795Q、L839F/E795Q、Q906F/E795Q、E795Q/Q1170D、G146R/R182V/E795Q、G146R/E795Q/D665N、G146R/E795Q/E981V、G146R/E795Q/T814K、G146R/R182V/D665N、E125K/R182V/E981V、R182V/P799V/E981V、R182V/T814K/E981V、G146R/P799V/E981V、G146R/R182V/E795Q/F81E、G146R/R182V/E795Q/E125K、G146R/R182V/E795Q/E125A、G146R/R182V/E795Q/P799V、G146R/R182V/E795Q/T814K、G146R/R182V/E795Q/E981V、G146R/R182V/E795Q/D665N、G146R/R182V/P799V/E981V、E125K/G146R/R182V/E795Q/D665N或G146R/R182V/E795Q/P799V/T814K。
45.根据权利要求43所述的方法,其中所述突变体LbCas12a多肽选自F81E(SEQ ID NO:802)、E125K(SEQ ID NO:428)、N145R(SEQ ID NO:2902)、G146R(SEQ ID NO:156)、T152K(SEQ ID NO:694)、R182V(SEQ ID NO:98)、V491D(SEQ ID NO:954)、K478R(SEQ ID NO:134)、N582R(SEQ ID NO:1730)、D665N(SEQ ID NO:1014)、E795Q(SEQ ID NO:930)、P799V(SEQ ID NO:706)、E858V(SEQ ID NO:114)、I860R(SEQ ID NO:250)、E913R(SEQ ID NO:1960)、E981V(SEQ ID NO:880)、E88A/E795Q(SEQ ID NO:3960)、E125K/E795Q(SEQ ID NO:3962)、G146I/E795Q(SEQ ID NO:3964)、R182V/E795Q(SEQ ID NO:3966)、V491D/E795Q(SEQID NO:3968)、Q529I/E795Q(SEQ ID NO:3970)、Y646H/E795Q(SEQ ID NO:3972)、D665N/E795Q(SEQ ID NO:3974)、T814K/E795Q(SEQ ID NO:3976)、L839F/E795Q(SEQ ID NO:3978)、Q906F/E795Q(SEQ ID NO:3980)、E795Q/Q1170D(SEQ ID NO:3982)、G146R/R182V/E795Q(SEQ ID NO:3984)、G146R/E795Q/D665N(SEQ ID NO:3986)、G146R/E795Q/E981V(SEQID NO:3988)、G146R/E795Q/T814K(SEQ ID NO:3990)、G146R/R182V/D665N(SEQ ID NO:3992)、E125K/R182V/E981V(SEQ ID NO:3994)、R182V/P799V/E981V(SEQ ID NO:3996)、R182V/T814K/E981V(SEQ ID NO:3998)、G146R/P799V/E981V(SEQ ID NO:4000)、G146R/R182V/E795Q/F81E(SEQ ID NO:4002)、G146R/R182V/E795Q/E125K(SEQ ID NO:4004)、G146R/R182V/E795Q/E125A(SEQ ID NO:4006)、G146R/R182V/E795Q/P799V(SEQ ID NO:4008)、G146R/R182V/E795Q/T814K(SEQ ID NO:4010)、G146R/R182V/E795Q/E981V(SEQ IDNO:4012)、G146R/R182V/E795Q/D665N(SEQ ID NO:4014)、G146R/R182V/P799V/E981V(SEQID NO:4016)、E125K/G146R/R182V/E795Q/D665N(SEQ ID NO:4018)或G146R/R182V/E795Q/P799V/T814K(SEQ ID NO:4020)。
46.根据权利要求43所述的方法,其中所述突变体LbCas12a多肽是G146R/R182V/E795Q(SEQ ID NO:3984)。
47.一种用于在细胞中提高在非经典TTTT PAM位点处的基因编辑效率的试剂盒,所述试剂盒包含:
CRISPR核糖核蛋白复合体,其包括向导RNA和突变体LbCas12a多肽,所述突变体LbCas12a多肽包含引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的至少一个氨基酸替换,条件是所述突变体LbCas12a多肽与野生型LbCas12a多肽序列相比提供在非经典TTTTPAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。
48.根据权利要求47所述的试剂盒,其中所述突变体LbCas12a多肽具有选自SEQ IDNO:4-4022的偶数编号序列的多肽序列。
49.根据权利要求47所述的试剂盒,其中所述突变体LbCas12a多肽包含在SEQ ID NO:2的野生型LbCas12a多肽序列的第81、125、145、146、152、182、396、478、491、582、595、606、646、665、795、799、814、839、841、858、860、890、898、909、913、981、1020、1083或1121位处的至少一个氨基酸替换。
50.根据权利要求49所述的试剂盒,其中所述突变体LbCas12a多肽包含选自SEQ IDNO:2的野生型LbCas12a多肽序列的F81E、E125K、N145R、G146R、T152K、R182V、S396D、K478R、V491D、N582R、K595R、Y606F、Y646H、D665N、E795Q、P799V、T814G、L839F、1841A、E858V、I860R、W890A、E898N、H909K、E913R、E981V、S1020E、V1083W或K1121D的至少一个氨基酸替换。
51.根据权利要求49所述的试剂盒,其中所述突变体LbCas12a多肽选自:F81E,SEQ IDNO:802;E125K,SEQ ID NO:428;N145R,SEQ ID NO:2902;G146R,SEQ ID NO:156;T152K,SEQID NO:694;R182V,SEQ ID NO:98;S396D,SEQ ID NO:108;K478R,SEQ ID NO:134;V491D,SEQ ID NO:954;N582R,SEQ ID NO:1730;K595R,SEQ ID NO:184;Y606F,SEQ ID NO:642;Y646H,SEQ ID NO:720;D665N,SEQ ID NO:1014;E795Q,SEQ ID NO:930;P799V,SEQ ID NO:706;T814G,SEQ ID NO:162;L839F,SEQ ID NO:834;I841A,SEQ ID NO:988;E858V,SEQ IDNO:114;I860R,SEQ ID NO:250;W890A,SEQ ID NO:3958;E898N,SEQ ID NO:48;H909K,SEQID NO:70;E913R,SEQ ID NO:1960;E981V,SEQ ID NO:880;S1020E,SEQ ID NO:532;V1083W,SEQ ID NO:132;或K1121D,SEQ ID NO:598。
52.根据权利要求47所述的试剂盒,其中所述突变体LbCas12a多肽包含选自下述的替换突变:
(a)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自下述位置的单个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121;或
(b)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自至少两个下述位置的多个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121。
53.根据权利要求52所述的试剂盒,其中所述多个替换突变包括E88A/E795Q、E125K/E795Q、G146R/E795Q、R182V/E795Q、V491D/E795Q、Q529I/E795Q、Y646H/E795Q、D665N/E795Q、T814K/E795Q、L839F/E795Q、Q906F/E795Q、E795Q/Q1170D、G146R/R182V/E795Q、G146R/E795Q/D665N、G146R/E795Q/E981V、G146R/E795Q/T814K、G146R/R182V/D665N、E125K/R182V/E981V、R182V/P799V/E981V、R182V/T814K/E981V、G146R/P799V/E981V、G146R/R182V/E795Q/F81E、G146R/R182V/E795Q/E125K、G146R/R182V/E795Q/E125A、G146R/R182V/E795Q/P799V、G146R/R182V/E795Q/T814K、G146R/R182V/E795Q/E981V、G146R/R182V/E795Q/D665N、G146R/R182V/P799V/E981V、E125K/G146R/R182V/E795Q/D665N或G146R/R182V/E795Q/P799V/T814K。
54.根据权利要求52所述的试剂盒,其中所述突变体LbCas12a多肽选自F81E(SEQ IDNO:802)、E125K(SEQ ID NO:428)、N145R(SEQ ID NO:2902)、G146R(SEQ ID NO:156)、T152K(SEQ ID NO:694)、R182V(SEQ ID NO:98)、V491D(SEQ ID NO:954)、K478R(SEQ ID NO:134)、N582R(SEQ ID NO:1730)、D665N(SEQ ID NO:1014)、E795Q(SEQ ID NO:930)、P799V(SEQ ID NO:706)、E858V(SEQ ID NO:114)、I860R(SEQ ID NO:250)、E913R(SEQ ID NO:1960)、E981V(SEQ ID NO:880)、E88A/E795Q(SEQ ID NO:3960)、E125K/E795Q(SEQ ID NO:3962)、G146R/E795Q(SEQ ID NO:3964)、R182V/E795Q(SEQ ID NO:3966)、V491D/E795Q(SEQID NO:3968)、Q529I/E795Q(SEQ ID NO:3970)、Y646H/E795Q(SEQ ID NO:3972)、D665N/E795Q(SEQ ID NO:3974)、T814K/E795Q(SEQ ID NO:3976)、L839F/E795Q(SEQ ID NO:3978)、Q906F/E795Q(SEQ ID NO:3980)、E795Q/Q1170D(SEQ ID NO:3982)、G146R/R182V/E795Q(SEQ ID NO:3984)、G146R/E795Q/D665N(SEQ ID NO:3986)、G146R/E795Q/E981V(SEQID NO:3988)、G146R/E795Q/T814K(SEQ ID NO:3990)、G146R/R182V/D665N(SEQ ID NO:3992)、E125K/R182V/E981V(SEQ ID NO:3994)、R182V/P799V/E981V(SEQ ID NO:3996)、R182V/T814K/E981V(SEQ ID NO:3998)、G146R/P799V/E981V(SEQ ID NO:4000)、G146R/R182V/E795Q/F81E(SEQ ID NO:4002)、G146R/R182V/E795Q/E125K(SEQ ID NO:4004)、G146R/R182V/E795Q/E125A(SEQ ID NO:4006)、G146R/R182V/E795Q/P799V(SEQ ID NO:4008)、G146R/R182V/E795Q/T814K(SEQ ID NO:4010)、G146R/R182V/E795Q/E981V(SEQ IDNO:4012)、G146R/R182V/E795Q/D665N(SEQ ID NO:4014)、G146R/R182V/P799V/E981V(SEQID NO:4016)、E125K/G146R/R182V/E795Q/D665N(SEQ ID NO:4018)或G146R/R182V/E795Q/P799V/T814K(SEQ ID NO:4020)。
55.根据权利要求52所述的试剂盒,其中所述突变体LbCas12a多肽是G146R/R182V/E795Q(SEQ ID NO:3984)。
56.一种突变体LbCas12a多肽用于提高在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的用途,其中所述突变体LbCas12a多肽包含引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的至少一个氨基酸替换,条件是所述突变体LbCas12a多肽与野生型LbCas12a多肽序列相比提供在非经典TTTT PAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。
57.根据权利要求56所述的用途,其中所述突变体LbCas12a多肽具有选自SEQ ID NO:4-4022的偶数编号序列的多肽序列。
58.根据权利要求56所述的用途,其中所述突变体LbCas12a多肽包含在SEQ ID NO:2的野生型LbCas12a多肽序列的第81、125、145、146、152、182、396、478、491、582、595、606、646、665、795、799、814、839、841、858、860、890、898、909、913、981、1020、1083或1121位处的至少一个氨基酸替换。
59.根据权利要求58所述的用途,其中所述突变体LbCas12a多肽包含选自SEQ ID NO:2的野生型LbCas12a多肽序列的F81E、E125K、N145R、G146R、T152K、R182V、S396D、K478R、V491D、N582R、K595R、Y606F、Y646H、D665N、E795Q、P799V、T814G、L839F、I841A、E858V、I860R、W890A、E898N、H909K、E913R、E981V、S1020E、V1083W或K1121D的至少一个氨基酸替换。
60.根据权利要求58所述的用途,其中所述突变体LbCas12a多肽选自:F81E,SEQ IDNO:802;E125K,SEQ ID NO:428;N145R,SEQ ID NO:2902;G146R,SEQ ID NO:156;T152K,SEQID NO:694;R182V,SEQ ID NO:98;S396D,SEQ ID NO:108;K478R,SEQ ID NO:134;V491D,SEQ ID NO:954;N582R,SEQ ID NO:1730;K595R,SEQ ID NO:184;Y606F,SEQ ID NO:642;Y646H,SEQ ID NO:720;D665N,SEQ ID NO:1014;E795Q,SEQ ID NO:930;P799V,SEQ ID NO:706;T814G,SEQ ID NO:162;L839F,SEQ ID NO:834;I841A,SEQ ID NO:988;E858V,SEQ IDNO:114;I860R,SEQ ID NO:250;W890A,SEQ ID NO:3958;E898N,SEQ ID NO:48;H909K,SEQID NO:70;E913R,SEQ ID NO:1960;E981V,SEQ ID NO:880;S1020E,SEQ ID NO:532;V1083W,SEQ ID NO:132;或K1121D,SEQ ID NO:598。
61.根据权利要求56所述的用途,其中所述突变体LbCas12a多肽包含选自下述的替换突变:
(a)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自下述位置的单个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121;或
(b)引入到SEQ ID NO:2的野生型LbCas12a多肽序列中的选自至少两个下述位置的多个替换突变:F81、E125、N145、G146、T152、R182、S396、K478、V491、N582、K595、Y606、Y646、D665、E795、P799、T814、L839、I841、E858、I860、W890、E898、H909、E913、E981、S1020、V1083或K1121。
62.根据权利要求61所述的用途,其中所述多个替换突变包括E88A/E795Q、E125K/E795Q、G146R/E795Q、R182V/E795Q、V491D/E795Q、Q529I/E795Q、Y646H/E795Q、D665N/E795Q、T814K/E795Q、L839F/E795Q、Q906F/E795Q、E795Q/Q1170D、G146R/R182V/E795Q、G146R/E795Q/D665N、G146R/E795Q/E981V、G146R/E795Q/T814K、G146R/R182V/D665N、E125K/R182V/E981V、R182V/P799V/E981V、R182V/T814K/E981V、G146R/P799V/E981V、G146R/R182V/E795Q/F81E、G146R/R182V/E795Q/E125K、G146R/R182V/E795Q/E125A、G146R/R182V/E795Q/P799V、G146R/R182V/E795Q/T814K、G146R/R182V/E795Q/E981V、G146R/R182V/E795Q/D665N、G146R/R182V/P799V/E981V、E125K/G146R/R182V/E795Q/D665N或G146R/R182V/E795Q/P799V/T814K。
63.根据权利要求61所述的用途,其中所述突变体LbCas12a多肽选自F81E(SEQ ID NO:802)、E125K(SEQ ID NO:428)、N145R(SEQ ID NO:2902)、G146R(SEQ ID NO:156)、T152K(SEQ ID NO:694)、R182V(SEQ ID NO:98)、V491D(SEQ ID NO:954)、K478R(SEQ ID NO:134)、N582R(SEQ ID NO:1730)、D665N(SEQ ID NO:1014)、E795Q(SEQ ID NO:930)、P799V(SEQ ID NO:706)、E858V(SEQ ID NO:114)、I860R(SEQ ID NO:250)、E913R(SEQ ID NO:1960)、E981V(SEQ ID NO:880)、E88A/E795Q(SEQ ID NO:3960)、E125K/E795Q(SEQ ID NO:3962)、G146R/E795Q(SEQ ID NO:3964)、R182V/E795Q(SEQ ID NO:3966)、V491D/E795Q(SEQID NO:3968)、Q529I/E795Q(SEQ ID NO:3970)、Y646H/E795Q(SEQ ID NO:3972)、D665N/E795Q(SEQ ID NO:3974)、T814K/E795Q(SEQ ID NO:3976)、L839F/E795Q(SEQ ID NO:3978)、Q906F/E795Q(SEQ ID NO:3980)、E795Q/Q1170D(SEQ ID NO:3982)、G146R/R182V/E795Q(SEQ ID NO:3984)、G146R/E795Q/D665N(SEQ ID NO:3986)、G146R/E795Q/E981V(SEQID NO:3988)、G146R/E795Q/T814K(SEQ ID NO:3990)、G146R/R182V/D665N(SEQ ID NO:3992)、E125K/R182V/E981V(SEQ ID NO:3994)、R182V/P799V/E981V(SEQ ID NO:3996)、R182V/T814K/E981V(SEQ ID NO:3998)、G146R/P799V/E981V(SEQ ID NO:4000)、G146R/R182V/E795Q/F81E(SEQ ID NO:4002)、G146R/R182V/E795Q/E125K(SEQ ID NO:4004)、G146R/R182V/E795Q/E125A(SEQ ID NO:4006)、G146R/R182V/E795Q/P799V(SEQ ID NO:4008)、G146R/R182V/E795Q/T814K(SEQ ID NO:4010)、G146R/R182V/E795Q/E981V(SEQ IDNO:4012)、G146R/R182V/E795Q/D665N(SEQ ID NO:4014)、G146R/R182V/P799V/E981V(SEQID NO:4016)、E125K/G146R/R182V/E795Q/D665N(SEQ ID NO:4018)或G146R/R182V/E795Q/P799V/T814K(SEQ ID NO:4020)。
64.根据权利要求61所述的用途,其中所述突变体LbCas12a多肽是G146R/R182V/E795Q(SEQ ID NO:3984)。
65.一种表达和纯化突变体LbCas13a蛋白的方法,所述方法包括:
(a)将编码突变体LbCas12a多肽的核苷酸序列插入到表达质粒中,所述突变体LbCas12a多肽与野生型LbCas12a多肽序列相比包含至少一个氨基酸替换,并与SEQ ID NO:4-4022的偶数编号多肽序列中的任一者具有95-99%同一性;
(b)用所述表达质粒转化一个或多个细胞;
(c)诱导所述转化的质粒的表达;
(d)分离所述细胞;
(e)提取所述突变体LbCas13a蛋白;和
(f)纯化所述突变体LbCas13a蛋白;
其中所述突变体LbCas12a多肽与野生型LbCas12a多肽序列相比提供在非经典TTTTPAM位点处CRISPR/LbCas12a相关核酸酶活性的提高。
66.一种突变体LbCas12a多肽,其通过根据权利要求65所述的方法生产。
CN202180044477.8A 2020-05-01 2021-04-30 在非经典tttt前间区序列邻近基序处具有增强的切割活性的毛螺菌科菌种cas12a突变体 Pending CN116096878A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063018592P 2020-05-01 2020-05-01
US63/018,592 2020-05-01
US202063090912P 2020-10-13 2020-10-13
US63/090,912 2020-10-13
PCT/US2021/030089 WO2021222703A2 (en) 2020-05-01 2021-04-30 Lachnospiraceae sp. cas12a mutants with enhanced cleavage activity at non-canonical tttt protospacer adjacent motifs

Publications (1)

Publication Number Publication Date
CN116096878A true CN116096878A (zh) 2023-05-09

Family

ID=76059984

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180044477.8A Pending CN116096878A (zh) 2020-05-01 2021-04-30 在非经典tttt前间区序列邻近基序处具有增强的切割活性的毛螺菌科菌种cas12a突变体

Country Status (6)

Country Link
US (1) US11999979B2 (zh)
EP (1) EP4143324A2 (zh)
JP (1) JP2023524066A (zh)
CN (1) CN116096878A (zh)
CA (1) CA3176675A1 (zh)
WO (1) WO2021222703A2 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023131870A2 (en) * 2022-01-06 2023-07-13 Twelve Bio Aps Endonuclease variants and methods of use
WO2023147240A2 (en) * 2022-01-25 2023-08-03 The Regents Of The University Of California Variant type v crispr/cas effector polypeptides and methods of use thereof
WO2023166032A1 (en) * 2022-03-01 2023-09-07 Wageningen Universiteit Cas12a nickases

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7560529B2 (en) 2001-04-24 2009-07-14 FDS Pharma Method for producing catalytic antibodies (variants), antigens for immunization and nucleotide sequence
EP3234133B1 (en) 2014-12-18 2020-11-11 Integrated DNA Technologies, Inc. Crispr-based compositions and methods of use
US20180179523A1 (en) 2014-12-18 2018-06-28 Integrated Dna Technologies, Inc. Crispr-based compositions and methods of use
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
US20190264186A1 (en) 2016-01-22 2019-08-29 The Broad Institute Inc. Crystal structure of crispr cpf1
KR102670601B1 (ko) 2016-04-19 2024-05-29 더 브로드 인스티튜트, 인코퍼레이티드 신규한 crispr 효소 및 시스템
WO2018068053A2 (en) 2016-10-07 2018-04-12 Integrated Dna Technologies, Inc. S. pyogenes cas9 mutant genes and polypeptides encoded by same
US11242542B2 (en) 2016-10-07 2022-02-08 Integrated Dna Technologies, Inc. S. pyogenes Cas9 mutant genes and polypeptides encoded by same
EP3545085A4 (en) 2016-11-22 2020-10-28 Integrated Dna Technologies, Inc. CRISPR / CPF1 SYSTEMS AND METHODS
CA3049961A1 (en) 2016-12-09 2018-06-14 The Broad Institute, Inc. Crispr effector system based diagnostics
US11293022B2 (en) 2016-12-12 2022-04-05 Integrated Dna Technologies, Inc. Genome editing enhancement
WO2018111946A1 (en) 2016-12-12 2018-06-21 Integrated Dna Technologies, Inc. Genome editing detection
WO2018195545A2 (en) 2017-04-21 2018-10-25 The General Hospital Corporation Variants of cpf1 (cas12a) with altered pam specificity
BR112020014017A2 (pt) * 2018-01-11 2020-12-08 KWS SAAT SE & Co. KGaA Sistemas crispr / cpf1 de plantas otimizados
BR112021002258A2 (pt) * 2018-08-08 2021-05-04 Integrated Dna Technologies, Inc. proteína associada a crispr, complexo de ribonucleoproteína crispr, métodos para aumentar a eficiência de edição de genes em sítios tttn pam, para aumentar a eficiência de edição de genes em sítios não canônicos de tttt pam e para realizar edição do genoma em uma célula eucariótica, kit, ácido nucleico, sequência polinucleotídica que codifica um polipeptídeo cas12a, sequência de aminoácidos que codifica um polipeptídeo cas12a, e, sistema de endonuclease cas.
US11414669B2 (en) * 2018-09-06 2022-08-16 Monsanto Technology Llc Compositions and methods for genome editing in planta
US20230040148A1 (en) 2019-02-22 2023-02-09 Integrated Dna Technologies, Inc. Lachnospiraceae bacterium nd2006 cas12a mutant genes and polypeptides encoded by same
WO2021093752A1 (zh) 2019-11-11 2021-05-20 北京大学 Crispr家族蛋白与核酸的定点偶联方法及其偶联物和用途
WO2023097316A1 (en) 2021-11-29 2023-06-01 Editas Medicine, Inc. Engineered crispr/cas12a effector proteins, and uses thereof

Also Published As

Publication number Publication date
US20210348144A1 (en) 2021-11-11
WO2021222703A2 (en) 2021-11-04
WO2021222703A3 (en) 2022-06-16
EP4143324A2 (en) 2023-03-08
CA3176675A1 (en) 2021-11-04
JP2023524066A (ja) 2023-06-08
US11999979B2 (en) 2024-06-04

Similar Documents

Publication Publication Date Title
AU2021231074C1 (en) Class II, type V CRISPR systems
CN106922154B (zh) 使用空肠弯曲杆菌crispr/cas系统衍生的rna引导的工程化核酸酶的基因编辑
CN116096878A (zh) 在非经典tttt前间区序列邻近基序处具有增强的切割活性的毛螺菌科菌种cas12a突变体
US20200149021A1 (en) System and method for genome editing
US20230279374A1 (en) Modified cas9 protein, and use thereof
KR20190112855A (ko) Crispr 하이브리드 dna/rna 폴리뉴클레오티드 및 사용 방법
JP6994730B2 (ja) ゲノム編集タンパク質の直接導入による糸状菌ゲノム編集方法
AU2021310363A1 (en) Uracil stabilizing proteins and active fragments and variants thereof and methods of use
CN114075559A (zh) 一种2型CRISPR/Cas9基因编辑系统及其应用
CN103361329A (zh) 高保真度限制性内切核酸酶
WO2023193536A1 (zh) 一种腺苷脱氨酶、碱基编辑器及应用
CN114641567A (zh) 用于编辑突变以允许转录或表达的组合物和方法
US20240218339A1 (en) Class ii, type v crispr systems
US20040091886A1 (en) Method for generating recombinant polynucleotides
JP4825383B2 (ja) MseI制限エンドヌクレアーゼをクローニングする方法及び製造する方法
US20040091911A1 (en) Recombinant type II restriction endonucleases, MmeI and related endonucleases and methods for producing the same
OA20812A (en) Use of CAS9 protein from the bacterium pasteurella pneumotropica.
KR20210118817A (ko) Dna 절단 물질
EP0794252A2 (en) Method for cloning and producing the PshAI restriction endonuclease

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination