CN117396602A - 具有增强的稳定性的cas9效应蛋白 - Google Patents

具有增强的稳定性的cas9效应蛋白 Download PDF

Info

Publication number
CN117396602A
CN117396602A CN202280037340.4A CN202280037340A CN117396602A CN 117396602 A CN117396602 A CN 117396602A CN 202280037340 A CN202280037340 A CN 202280037340A CN 117396602 A CN117396602 A CN 117396602A
Authority
CN
China
Prior art keywords
nuclear localization
localization signal
protein
effector protein
cas9 effector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280037340.4A
Other languages
English (en)
Inventor
G·西恩斯基
M·马雷斯卡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AstraZeneca AB
Original Assignee
AstraZeneca AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AstraZeneca AB filed Critical AstraZeneca AB
Publication of CN117396602A publication Critical patent/CN117396602A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

提供了具有增强的稳定性的Cas9效应蛋白。Cas9效应蛋白的实施例具有附接至N‑末端的第一核定位信号和附接至C‑末端的第二核定位信号。还提供了Cas9系统,其包含具有增强的稳定性的Cas9效应蛋白和与该Cas9效应蛋白形成复合物的指导多核苷酸。进一步提供了用于在真核细胞中使用Cas9效应蛋白提供靶序列的位点特异性修饰的方法。

Description

具有增强的稳定性的CAS9效应蛋白
技术领域
本披露提供了具有增强的稳定性的Cas9效应蛋白。Cas9效应蛋白的实施例具有附接至N-末端的第一核定位信号和附接至C-末端的第二核定位信号。本披露还提供了Cas9系统,其包含这样的Cas9效应蛋白和与Cas9效应蛋白形成复合物的指导多核苷酸。本披露进一步提供了用于在真核细胞中使用Cas9效应蛋白提供靶序列的位点特异性修饰的方法。
背景技术
CRIPR/Cas基因编辑技术的使用彻底改变了生物技术。CRISPR-Cas9基因编辑系统已成功用于许多种生物体和细胞系中,既为了在DNA中使用野生型Cas9蛋白诱导双链断裂(DSB)形成,又为了使用称为Cas9n/Cas9 D10A的突变型蛋白切割单DNA链(参见,例如,Mali等人,Science[科学],339(6121):823-826(2013)以及Sander和Joung,NatureBiotechnology[自然生物技术]32(4):347-355(2014),将其各自通过引用以其全文并入本文)。虽然DSB的形成导致可能破坏基因功能的小插入和缺失(插入缺失(indel))的产生,但Cas9n/Cas9 D10A切口酶避免了插入缺失的产生(通过非同源末端连接进行修复的结果),同时刺激了内源同源重组机制。因此,Cas9n/Cas9 D10A切口酶可用于将DNA区域高保真地插入基因组。
除基因组编辑外,CRISPR系统还具有许多其他应用,包括调节基因表达、基因回路构建和功能基因组学等(在Sander和Joung,2014中综述)。
虽然Cas9蛋白已被证明在多种体内和体外应用中有效,但作为蛋白质,它易受潜在降解的影响,特别是在细胞环境中。
发明内容
本披露涉及Cas9效应蛋白,其包含:a)附接至该Cas9效应蛋白N-末端的第一核定位信号;和b)附接至该Cas9效应蛋白C-末端的第二核定位信号。
在蛋白质的一些实施例中,第一核定位信号是单组分核定位信号。在一些实施例中,第一核定位信号是两组分核定位信号。在一些实施例中,第二核定位信号是单组分核定位信号。在一些实施例中,第二核定位信号是两组分核定位信号。在一些实施例中,第一核定位信号是两组分核定位信号,并且第二核定位信号是单组分核定位信号。
在一些实施例中,单组分核定位信号是SV40大T抗原、核质蛋白、EGL-13、c-Myc、TUS蛋白核定位信号、或其组合。在一些实施例中,两组分核定位信号是经典的两组分核定位信号。在一些实施例中,第一核定位信号是经典的两组分核定位信号,并且第二核定位信号是SV40大T抗原核定位信号。
在蛋白质的一些实施例中,第一核定位信号直接附接至Cas9效应蛋白。在一些实施例中,第一核定位信号经由接头附接至Cas9效应蛋白。在一些实施例中,第二核定位信号直接附接至Cas9效应蛋白。在一些实施例中,第二核定位信号经由接头附接至Cas9效应蛋白。在一些实施例中,接头是具有2至30个残基的肽接头。
在一些实施例中,蛋白质包含第一核定位信号的两个拷贝。在一些实施例中,蛋白质包含第一核定位信号的三个拷贝。在一些实施例中,蛋白质包含第二核定位信号的两个拷贝。在一些实施例中,蛋白质包含第二核定位信号的三个拷贝。
在一些实施例中,Cas9效应蛋白衍生自具有II-B型CRISPR系统的细菌物种。在一些实施例中,Cas9效应蛋白包含与SEQ ID NO:10-97中的任一个具有至少95%同一性的多肽序列。在一些实施例中,Cas9效应蛋白包含以1E-5的E值截止值匹配TIGR03031蛋白家族的结构域。在一些实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少90%同一性的多肽序列。在一些实施例中,Cas9效应蛋白包含经修饰的SEQ ID NO:98的多肽,其中一个或多个修饰选自N1164R、N1265R、N1300R、N1412R、N347R、N651A、D1266R、D309R、D345R、D487R、D607R、Q1129R、Q1381A、Q1381A、Q1381R、Q661A、Q713R、Q734R、E1032G、E1032R、E1409A、E436R、E611R、E691R、E697R、G1335R、L125R、L1264S、L1299S、K1031R、K490R、K615R、K656R、F636R、S1334A、S1334A、S1334R、S1380R、S1410R、S1413R、S634R、S638R、S711R、S1006R、S1017R、T1267A、T1267R、T551R、Y1338A、Y1338R、V1273S、V1274S、V486R、V644R、V736R和V736Y。
本披露还涉及CRISPR-Cas系统,其包含:a)Cas9效应蛋白,该Cas9效应蛋白包含:i)附接至该Cas9效应蛋白N-末端的第一核定位信号;和ii)附接至该Cas9效应蛋白C-末端的第二核定位信号;以及b)指导多核苷酸,该指导多核苷酸包含指导序列并且与该Cas9效应蛋白形成复合物,其中该指导序列能够与真核细胞中的靶序列杂交。
本披露进一步涉及CRISPR-Cas系统,其包含:a)编码Cas9效应蛋白的核酸序列,该Cas9效应蛋白包含:i)附接至该Cas9效应蛋白N-末端的第一核定位信号;和ii)附接至该Cas9效应蛋白C-末端的第二核定位信号;以及b)编码指导多核苷酸的核酸序列,该指导多核苷酸包含指导序列并且与该Cas9效应蛋白形成复合物,其中该指导序列能够与真核细胞中的靶序列杂交。
在系统的一些实施例中,(a)和(b)的核苷酸序列在真核启动子的控制下。在一些实施例中,(a)和(b)的核酸序列在单个载体中。
本披露进一步涉及CRISPR-Cas系统,其包含一个或多个含有以下的载体:a)与一个或多个编码Cas9效应蛋白的核苷酸序列可操作地连接的调节元件,该Cas9效应蛋白包含:i)附接至该Cas9效应蛋白N-末端的第一核定位信号;和ii)附接至该Cas9效应蛋白C-末端的第二核定位信号;以及b)指导多核苷酸,该指导多核苷酸包含指导序列并且与该Cas9效应蛋白形成复合物,其中该指导序列能够与真核细胞中的靶序列杂交。
在系统的一些实施例中,调节元件是真核调节元件。
在系统的一些实施例中,第一核定位信号是单组分核定位信号。在一些实施例中,第一核定位信号是两组分核定位信号。在一些实施例中,第二核定位信号是单组分核定位信号。在一些实施例中,第二核定位信号是两组分核定位信号。在一些实施例中,第一核定位信号是两组分核定位信号,并且第二核定位信号是单组分核定位信号。在一些实施例中,第一核定位信号和第二核定位信号各自是两组分核定位信号。
在一些实施例中,单组分核定位信号是SV40大T抗原、核质蛋白、EGL-13、c-Myc、TUS蛋白核定位信号、或其组合。在一些实施例中,两组分核定位信号是经典的两组分核定位信号。在一些实施例中,第一核定位信号是经典的两组分核定位信号,并且第二核定位信号是SV40大T抗原核定位信号。
在系统的一些实施例中,第一核定位信号直接附接至Cas9效应蛋白。在一些实施例中,第一核定位信号经由接头附接至Cas9效应蛋白。在一些实施例中,第二核定位信号直接附接至Cas9效应蛋白。在一些实施例中,第二核定位信号经由接头附接至Cas9效应蛋白。在一些实施例中,接头是具有2至30个残基的肽接头。
在系统的一些实施例中,蛋白质包含第一核定位信号的两个拷贝。在一些实施例中,蛋白质包含第一核定位信号的三个拷贝。在一些实施例中,蛋白质包含第二核定位信号的两个拷贝。在一些实施例中,蛋白质包含第二核定位信号的三个拷贝。
在系统的一些实施例中,Cas9效应蛋白衍生自具有II-B型CRISPR系统的细菌物种。在一些实施例中,Cas9效应蛋白包含与SEQ ID NO:10-97中的任一个具有至少95%同一性的多肽序列。在一些实施例中,Cas9效应蛋白包含以1E-5的E值截止值匹配TIGR03031蛋白家族的结构域。在一些实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少90%同一性的多肽序列。
在系统的一些实施例中,指导多核苷酸是RNA。在一些实施例中,指导序列的长度是19至30个碱基。在一些实施例中,指导序列的长度是19至25个碱基。在一些实施例中,指导序列的长度是21至26个碱基。在一些实施例中,指导多核苷酸进一步包含tracrRNA序列。
在系统的一些实施例中,Cas9效应蛋白产生粘性末端。在一些实施例中,粘性末端包含具有1至10个核苷酸的单链多核苷酸突出端。在一些实施例中,粘性末端包含具有2至6个核苷酸的单链多核苷酸突出端。在一些实施例中,粘性末端包含具有3至5个核苷酸的单链多核苷酸突出端。
本披露提供了真核细胞,其包含如上所述的蛋白质。本披露进一步提供了真核细胞,其包含如上所述的系统。
本披露提供了递送颗粒,其包含如上所述的蛋白质。本披露进一步提供了递送颗粒,其包含系统。在递送颗粒的一些实施例中,Cas9效应蛋白和指导多核苷酸以复合物存在。在一些实施例中,复合物进一步包含含有tracrRNA序列的多核苷酸。在一些实施例中,递送颗粒进一步包含脂质、糖、金属或蛋白质。
本披露提供了囊泡,其包含如上所述的蛋白质。本披露进一步提供了囊泡,其包含如上所述的系统。在囊泡的一些实施例中,Cas9效应蛋白和指导多核苷酸以复合物存在。在一些实施例中,囊泡进一步包含含有tracrRNA序列的多核苷酸。在一些实施例中,囊泡是外泌体或脂质体。
本披露提供了病毒载体,其包含如上所述的蛋白质。本披露进一步提供了病毒载体,其包含如上所述的系统。在一些实施例中,病毒载体进一步包含编码tracrRNA序列的核酸序列。在一些实施例中,病毒载体是腺病毒颗粒、腺相关病毒颗粒或单纯疱疹病毒颗粒。
本披露还提供了用于在真核细胞中提供靶序列的位点特异性修饰的方法,该方法包括:
a)将以下引入到该细胞中:i)编码Cas9效应蛋白的核苷酸,该Cas9效应蛋白包含:A)附接至该Cas9效应蛋白N-末端的第一核定位信号;和B)附接至该Cas9效应蛋白C-末端的第二核定位信号;以及ii)编码指导多核苷酸的核苷酸,该指导多核苷酸与该Cas9效应蛋白形成复合物并且包含指导序列,其中该指导序列能够与宿主多核苷酸中的靶序列杂交;
b)用该Cas9效应蛋白和该指导多核苷酸在该宿主多核苷酸中产生粘性末端;以及
c)i)将(b)的这些粘性末端连接在一起,或ii)将目的多核苷酸序列的3′端与一个粘性末端连接,并且将该多核苷酸序列的5’端与一个粘性末端连接;从而修饰该靶序列。
在方法的一些实施例中,第一核定位信号是单组分核定位信号。在一些实施例中,第一核定位信号是两组分核定位信号。在一些实施例中,第二核定位信号是单组分核定位信号。在一些实施例中,第二核定位信号是两组分核定位信号。在一些实施例中,第一核定位信号是两组分核定位信号,并且第二核定位信号是单组分核定位信号。在一些实施例中,单组分核定位信号是SV40大T抗原、核质蛋白、EGL-13、c-Myc、TUS蛋白核定位信号、或其组合。在一些实施例中,两组分核定位信号是经典的两组分核定位信号。在一些实施例中,第一核定位信号和第二核定位信号各自是两组分核定位信号。在一些实施例中,第一核定位信号是经典的两组分核定位信号,并且第二核定位信号是SV40大T抗原核定位信号。
在方法的一些实施例中,第一核定位信号直接附接至Cas9效应蛋白。在一些实施例中,第一核定位信号经由接头附接至Cas9效应蛋白。在一些实施例中,第二核定位信号直接附接至Cas9效应蛋白。在一些实施例中,第二核定位信号经由接头附接至Cas9效应蛋白。在一些实施例中,接头是具有2至30个残基的肽接头。
在方法的一些实施例中,蛋白质包含第一核定位信号的两个拷贝。在一些实施例中,蛋白质包含第一核定位信号的三个拷贝。在一些实施例中,蛋白质包含第二核定位信号的两个拷贝。在一些实施例中,蛋白质包含第二核定位信号的三个拷贝。
在方法的一些实施例中,Cas9效应蛋白衍生自具有II-B型CRISPR系统的细菌物种。在一些实施例中,Cas9效应蛋白包含与SEQ ID NO:10-97中的任一个具有至少95%同一性的多肽序列。在一些实施例中,Cas9效应蛋白包含以1E-5的E值截止值匹配TIGR03031蛋白家族的结构域。
在方法的一些实施例中,指导多核苷酸是RNA。在一些实施例中,指导多核苷酸的长度是19至30个碱基。在一些实施例中,指导多核苷酸的长度是19至25个碱基。在一些实施例中,指导多核苷酸的长度是21至26个碱基。在一些实施例中,指导多核苷酸进一步包含tracrRNA序列。
在方法的一些实施例中,Cas9效应蛋白产生粘性末端。在一些实施例中,粘性末端包含具有1至10个核苷酸的单链多核苷酸突出端。在一些实施例中,粘性末端包含具有2至6个核苷酸的单链多核苷酸突出端。在一些实施例中,粘性末端包含具有3至5个核苷酸的单链多核苷酸突出端。在实施例中,粘性末端是平末端。在实施例中,粘性末端具有5’单链多核苷酸突出端。在实施例中,粘性末端具有3’单链多核苷酸突出端。
在方法的一些实施例中,真核细胞是动物或人细胞。在一些实施例中,真核细胞是人细胞。在一些实施例中,真核细胞是植物细胞。
在方法的一些实施例中,修饰是靶序列的至少一部分的缺失。在一些实施例中,修饰是靶序列的突变。在一些实施例中,修饰是将目的序列插入靶序列中。
本披露还提供了用于减少细胞中Cas9效应蛋白降解的方法,该方法包括a)将第一核定位信号附接至该Cas9效应蛋白的N-末端;以及b)将第二核定位信号附接至该Cas9效应蛋白的C-末端。
在方法的实施例中,第一核定位信号是单组分核定位信号。在实施例中,第一核定位信号是两组分核定位信号。在实施例中,第二核定位信号是单组分核定位信号。在实施例中,第二核定位信号是两组分核定位信号。在实施例中,第一核定位信号是两组分核定位信号,并且第二核定位信号是单组分核定位信号。在实施例中,单组分核定位信号是SV40大T抗原、核质蛋白、EGL-13、c-Myc、TUS蛋白核定位信号、或其组合。在实施例中,两组分核定位信号是经典的两组分核定位信号。在实施例中,第一核定位信号是经典的两组分核定位信号,并且第二核定位信号是SV40大T抗原核定位信号。
附图说明
以下附图形成本说明书的一部分,并且被包括在内以进一步展示本发明的某些方面的示例性实施例。
图1提供了可用于本文所述Cas9效应蛋白的Cas9蛋白的氨基酸序列。
图2提供了可用于本文所述Cas9效应蛋白的Cas9蛋白的另外的氨基酸序列。
图3A是显示在不存在或存在以下抑制剂的情况下MHCas9表达的蛋白质印迹:1)浓度为5μM的蛋白酶体抑制剂MG132;2)浓度为20nM的溶酶体vATP酶抑制剂巴佛洛霉素(bafilomycin)A1;或3)浓度为10nM的核输出抑制剂来普霉素(leptomycin)B,如实例1中所述。图3B是使用MAPK对每种抑制剂和对照进行归一化的蛋白质印迹定量的条形图。
图4是显示以下Cas9构建体表达的蛋白质印迹:1)3xSV40-MHCas9;2)MHCas9-NLSSV40;3)3XNLSSV40-MHCas9-NLSSV40;和4)bpNLS-MHCas9-SLSSV40(SpOT-ON),如实例2中所述。检测作为转染对照的由克隆载体表达的GFP,并检测作为凝胶加载对照的微管蛋白。
图5示出了如实例3中所述的SpOT-ON(5A)或bpNLS-SpCas9-NLSSV40(5B)表达的蛋白质印迹。在不存在或存在以下抑制剂的情况下测试Cas9构建体:1)浓度为5μM的蛋白酶体抑制剂MG132;2)浓度为20nM的溶酶体vATP酶抑制剂巴佛洛霉素A1;或3)浓度为10nM的核输出抑制剂来普霉素B。
图6示出了如实例4中所述的SpOT-ON(MHCas9)或SpCas9在不同位点的DNA切割活性的滴定图。
图7示出了如实例5中所述使用不同前间区序列长度时DNA切割速度常数k的条形图。
图8示出了条形图,其绘制显示了如实例6中所述的EMX1位点(8A)和CD34位点(8B)处不同前间区序列长度的映射读数中突变读数的平均百分比。条形图表示如通过扩增子测序(Amplicon-Seq)和RIMA分析评估的靶向CD34或EMX1的n=3个不同PBMC供体的HEK293T细胞的平均编辑效率±SD。等位基因频率<0.1%被排除在分析之外。
图9示出了如实例7中所述的SpOT-ON和SPCas9的脱靶位点处的经修饰读数的百分比图。
图10示出了绘制如实例8中所述的在PAM的位置1、2和3处具有错配的DNA底物的切割速度常数的条形图。
图11示出了如实例9中所述的用23个核苷酸指导RNA测试的EMX1错配编辑的不同位置处的映射读数中突变读数的平均百分比的条形图。条形图表示如通过扩增子测序和RIMA分析评估的靶向EMX1的n=3个不同PBMC供体的HEK293T细胞的平均编辑效率±SD。等位基因频率<0.1%被排除在分析之外。
图12示出了如实例10中所述的EMX基因座(图12A)和CD34基因座(图12B)处DNA编辑的定性分析。图12C示出了在CD34基因座处SpCas9 DNA切割后DNA修复比较的定性分析。
图13是显示具有如图所示的不同突出端的底物的CD34基因座处非同源末端连接(NHEJ)敲入的百分比的条形图。如实例11中那样进行实验。图显示了插入的两个潜在方向性,其中深灰色代表正向(预期)插入,浅灰色代表反向插入。
图14是显示具有如图所示的不同突出端的底物的STAT1基因座处NHEJ敲入的百分比的条形图。如实例11中那样进行实验。图显示了插入的两个潜在方向性,其中深灰色代表正向(预期)插入,浅灰色代表反向插入。
具体实施方式
本披露提供了具有增强的稳定性的Cas9效应蛋白,该Cas9效应蛋白在其N-末端和C-末端上均包含核定位信号。本披露还提供了系统,其包含具有增强的稳定性的Cas9效应蛋白和与该Cas9效应蛋白复合的核酸指导序列。本披露还提供了用于在真核细胞中使用具有增强的稳定性的Cas9效应蛋白提供靶序列的位点特异性修饰的方法。本披露进一步提供了通过将核定位信号同时附接至Cas9效应蛋白的N-末端和C-末端来增强该蛋白质的稳定性的方法。
不希望受理论束缚,认为Cas9效应蛋白上另外的核定位信号的存在导致该蛋白质的核输入增强。这种增强的核输入导致Cas9效应蛋白在细胞质中停留的时间更少,在细胞质中它可以是溶酶体降解的底物,溶酶体降解是胞质蛋白的常见分解途径。在实施例中,本文所述的Cas9效应蛋白具有增强的稳定性,与不具有增强的稳定性的Cas9蛋白相比,保留了显著的Cas9效应子活性。
如本文所用,具有“增强的稳定性”的蛋白质意指在体内环境(例如细胞)或体外环境内部具有更长寿命的蛋白质。在一些实施例中,具有“增强的稳定性”的蛋白质可以对环境中的降解更具抗性,这是通过较少地暴露于降解蛋白质的因子(例如蛋白酶)和/或通过作为降解蛋白质的因子的较差底物(例如通过对蛋白质内键的切割更具抗性)来实现的。在实施例中,与呈未经修饰状态的蛋白质相比,“增强的稳定性”得到增强。在实施例中,与不具有核定位信号的Cas9效应蛋白相比,如本文所述的Cas9效应蛋白的“增强的稳定性”得到增强。在实施例中,与仅具有一个核定位信号的Cas9效应蛋白相比,如本文所述的Cas9效应蛋白的“增强的稳定性”得到增强。在实施例中,与仅具有一个附接至Cas9效应蛋白N-末端的核定位信号的Cas9效应蛋白相比,如本文所述的Cas9效应蛋白的“增强的稳定性”得到增强。在一些实施例中,Cas9效应蛋白的稳定性在表达30分钟、表达60分钟、表达90分钟、表达120分钟、表达150分钟、表达120分钟后增强大于10%、大于20%、大于30%、大于40%、大于50%、大于60%、大于70%、大于80%、大于90%、大于100%、大于120%、大于140%、大于160%、大于180%、大于200%、大于300%、或大于400%,如通过本领域技术人员已知的用于确定蛋白质数量的手段(例如,蛋白质印迹)或通过本领域技术人员已知的用于通过测量蛋白质的活性(例如,本文所述的活性测定)来确定蛋白质数量的手段测量的。
如本文所用,“一个/一种(a或an)”可以意指一个/一种或多个/多种。如本文所用,当与单词“包含”结合使用时,单词“一个/一种(a或an)”可以意指一个/一种或多于一个/一种。如本文所用,“另一个/另一种(another)”或“另一(further)”可以意指至少第二个/第二种或更多个/更多种。
在整个本申请中,术语“约”用于指示值包括被采用以确定该值的方法/装置的误差的固有变化,或者研究受试者之间存在的变化。典型地,术语“约”意指涵盖近似于或小于1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%或20%或更高变化,这取决于具体情况。在实施例中,本领域技术人员将理解由术语“约”指示的变化水平,这是由于其在本文中使用的上下文。还应理解,术语“约”的使用也包括特别列举的值。
权利要求书中使用术语“或”用于意指“和/或”,除非明确指示仅指替代方案或替代方案是相互排斥的,尽管本披露支持仅是指替代方案和“和/或”的定义。
如本文所用,术语“包含(comprising)”(以及包含的任何变体或形式,如“包含(comprise和comprises)”)、“具有(having)”(以及具有的任何变体或形式,如“具有(have和has)”)、“包括(including)”(以及包括的任何变体或形式,如“包括(includes和include)”)或者“含有(containing)”(以及含有的任何变体或形式,如“含有(contains和contain)”)是包括性的或开放式的,并且不排除另外的未列举的元素或方法步骤。
除非另有明确说明,否则术语“例如(for example)”及其对应的缩写“例如(e.g.)”(无论是否斜体)的使用意指所列举的特定术语是本披露的代表性示例和实施例,它们并不旨在限于所参考或引用的特定示例。
如本文所用,“之间”是包括范围末端的范围。例如,x与y之间的数值明确包括数值x和y,以及落在x和y内的任何数值。
Cas9效应蛋白
在实施例中,本披露提供了具有增强的稳定性的Cas9效应蛋白。在实施例中,本披露提供了Cas9效应蛋白,其包含多于一个核定位信号。在实施例中,本披露提供了Cas9效应蛋白,其包含:a)附接至该Cas9效应蛋白N-末端的第一核定位信号;和b)附接至该Cas9效应蛋白C-末端的第二核定位信号。
如本文所述,Cas蛋白是CRISPR-Cas系统的组分,该系统可尤其用于基因组编辑、基因调节、基因回路构建和功能基因组学。尽管Cas1和Cas2蛋白显现对所有目前鉴定的CRISPR系统通用,但Cas3、Cas9和Cas10蛋白被认为分别对I型、II型和III型CRISPR系统具有特异性。
在围绕CRISPR-Cas9系统(II型系统)的首次出版之后,已经在一系列细菌物种中鉴定出Cas9变体,并且已经对许多变体进行了功能性表征。参见,例如,Chylinski等人,“Classification and evolution of type II CRISPR-Cas systems[II型CRISPR-Cas系统的分类与进化]”,Nucleic Acids Research[核酸研究]42(10):6091-6105(2014),Ran等人,“In vivo genome editing using Staphylococcus aureus Cas9[使用金黄色葡萄球菌Cas9进行的体内基因组编辑]”,Nature[自然]520(7546):186-91(2015),以及Esvelt等人,“Orthogonal Cas9 proteins for RNA-guided gene regulation and editing[用于RNA指导基因调节和编辑的正交Cas9蛋白]”,Nature Methods[自然方法]10(11):1116-1121(2013),将其各自通过引用以其全文并入本文。
本披露涵盖了具有增强的Cas9稳定性的CRISPR-Cas9系统的新型效应蛋白。术语“Cas9”、“Cas9蛋白”和“Cas9效应蛋白”是可互换的,并且在本文中用于描述当在CRISPR-Cas9系统中使用时能够提供粘性末端、平末端或带切口的dsDNA的效应蛋白。
在实施例中,核定位信号是单组分核定位信号、两组分核定位信号或其组合。核定位信号(也称为核定位序列或NLS)是这样的氨基酸序列,其使具有该序列的蛋白质输入到细胞核。在实施例中,单组分核定位信号是具有被识别用于核输入的单个连续序列的信号。在实施例中,两组分核定位信号是具有由间隔子序列隔开的两个序列的信号,这两个序列被识别用于核输入。本文同时提供了单组分和两组分核定位信号的实例。
在Cas9效应蛋白的实施例中,第一核定位信号是单组分核定位信号。在实施例中,第一核定位信号是两组分核定位信号。在实施例中,第二核定位信号是单组分核定位信号。在实施例中,第二核定位信号是两组分核定位信号。
在实施例中,第一和第二核定位信号可以均是单组分核定位信号、均是两组分核定位信号或可以是单组分核定位信号和两组分核定位信号的混合物。在实施例中,第一核定位信号是两组分核定位信号,并且第二核定位信号是单组分核定位信号。在实施例中,第一核定位信号是单组分核定位信号,并且第二核定位信号是两组分核定位信号。在实施例中,第一核定位信号是单组分核定位信号,并且第二核定位信号是单组分核定位信号。在实施例中,第一核定位信号是两组分核定位信号,并且第二核定位信号是两组分核定位信号。
在实施例中,单组分核定位信号是本领域已知的单组分核定位信号。在实施例中,单组分核定位信号是表1中列出的单组分核定位信号中的一种或其组合。
表1-单组分核定位信号
在实施例中,两组分核定位信号是本领域已知的两组分核定位信号。在实施例中,两组分核定位信号是经典的两组分核定位信号。在实施例中,两组分核定位信号是表2中列出的两组分核定位信号中的一种或其组合。
表2-两组分核定位信号
NLS名称 序列 SEQ ID NO:
经典的两组分 KRTADGSEFESPKKKRKV 7
经典的两组分 KRPAATKKAGQAKKKK 8
经典的两组分 KRPAATKKAGQAKKK 9
在蛋白质的实施例中,第一核定位信号是经典的两组分核定位信号(SEQ ID NO:7),并且第二核定位信号是SV40大T抗原核定位信号(SEQ ID NO:1)。
在实施例中,使用本领域的标准方法将核定位信号附接至Cas9效应蛋白。在实施例中,使用标准分子生物学方法(如限制性内切酶消化和连接)将编码核定位信号的核酸序列置于编码Cas9效应蛋白的核酸序列的上游和下游,从而形成编码Cas9效应蛋白的核酸,该Cas9效应蛋白在其N-末端和C-末端包含核定位信号。随后该核酸可以在细胞(例如真核细胞)中表达。在其他实施例中,使用固相蛋白质合成方法完全或部分合成在其N-末端和C-末端包含核定位信号的Cas9效应蛋白。
在蛋白质的实施例中,第一核定位信号直接附接至Cas9效应蛋白。在实施例中,第一核定位信号经由接头附接至Cas9效应蛋白。在实施例中,第二核定位信号直接附接至Cas9效应蛋白。在实施例中,第二核定位信号经由接头附接至Cas9效应蛋白。
在使用接头的实施例中,接头是具有2至30个残基的肽接头。在实施例中,接头是具有2至20个残基的肽接头。在实施例中,接头是具有2至15个残基的肽接头。在实施例中,接头是具有2至10个残基的肽接头。在实施例中,接头是具有2至5个残基的肽接头。在实施例中,接头是经取代的或未经取代的C2-C20烷基、烯基或炔基链。
在实施例中,Cas9效应蛋白在其N-末端包含核定位信号的多于一个拷贝。在实施例中,Cas9效应蛋白在其N-末端包含核定位信号的多于一种类型。在实施例中,Cas9效应蛋白在其C-末端包含核定位信号的多于一个拷贝。在实施例中,Cas9效应蛋白在其C-末端包含核定位信号的多于一种类型。
在实施例中,蛋白质包含第一核定位信号的两个拷贝。在实施例中,蛋白质包含第一核定位信号的三个拷贝。在实施例中,蛋白质包含第二核定位信号的两个拷贝。在实施例中,蛋白质包含第二核定位信号的三个拷贝。
包含第一和第二核定位信号的Cas9蛋白的Cas9部分可以衍生自本领域已知的任何Cas9效应子结构域。在实施例中,Cas9效应蛋白衍生自具有II-B型CRISPR系统的细菌物种。合适的II-B型Cas9蛋白的实例描述于WO/2019/099943中,将其通过引用特此并入本文。在实施例中,合适的II-B型Cas9能够产生粘性末端。如本文所述,鉴定了II-B型CRISPR系统,尤其是通过cas操纵子上cas4基因的存在来鉴定,并且II-B型Cas9蛋白属于TIGR03031TIGRFAM蛋白家族。因此,在实施例中,Cas9部分属于TIGR03031 TIGRFAM蛋白家族。在实施例中,Cas9部分包含以1E-5的E值截止值匹配TIGR03031蛋白家族的结构域。在实施例中,位点特异性核酸酶包含以1E-10的E值截止值匹配TIGR03031蛋白家族的结构域。在例如像以下细菌物种中发现了II-B型CRISPR系统:嗜肺军团菌(Legionella pneumophila)、新凶手弗朗西斯氏菌(Francisella novicida)、γ变形菌HTCC5015、人粪便副萨特氏菌(Parasutterella excrementihominis)、华德萨特氏菌(Sutterella wadsworthensis)、硫磺单胞菌属物种(Sulfurospirillum sp.)SCADC、瘤胃杆菌属物种(Ruminobacter sp.)RM87、伯克霍尔德氏菌目(Burkholderiales)细菌1_1_47、拟杆菌门(Bacteroidetes)口腔分类群274菌株F0058、产琥珀酸沃廉氏菌(Wolinella succinogenes)、伯克霍尔德氏菌目细菌YL45、嗜淀粉瘤胃杆菌(Ruminobacter amylophilus)、弯曲杆菌属物种(Campylobacter sp.)P0111、弯曲杆菌属物种RM9261、拉尼尔弯曲杆菌(Campylobacterlanienae)菌株RM8001、拉尼尔弯曲杆菌菌株P0121、鼠毛滴虫(Turicimonas muris)、伦敦军团菌(Legionella londiniensis)、沙姆盐弧菌(Salinivibrio sharmensis)、钩端螺旋体属物种(Leptospira sp.)分离株FW.030、莫里特拉氏菌属物种(Moritella sp.)分离株NORP46、内生单胞菌属物种(Endozoicomonassp.)S-B4-1U、喜盐泰米尔纳德菌(Tamilnaduibacter salinus)、需钠弧菌(Vibrio natriegens)、斯氏弓形杆菌(Arcobacter skirrowii)、蜃楼弗朗西斯氏菌(Francisella philomiragia)、西班牙弗朗西斯氏菌(Francisella hispaniensis)或嗜盐副内生单胞菌(Parendozoicomonashaliclonae)。
在一些实施例中,Cas9能够产生双链多核苷酸切割,例如双链DNA切割。在一些实施例中,Cas9可以包括一个或多个核酸酶结构域(如RuvC和HNH),并且可以切割双链DNA。在一些实施例中,Cas9可以包含RuvC结构域和HNH结构域,其各自切割双链DNA的一条链。在一些实施例中,Cas9产生平末端。在一些实施例中,Cas核酸酶的RuvC和HNH在相同位置处切割每条DNA链,从而产生平末端。在一些实施例中,Cas9产生粘性末端。在一些实施例中,Cas9的RuvC和HNH在不同位置处切割每条DNA链(即,在“偏移”处切割),从而产生粘性末端。如本文所用,术语“粘性末端(cohesive end)”、“交错末端”或“粘性末端(sticky end)”是指具有长度不等的链的核酸片段。与“平末端”相反,粘性末端是由双链核酸(例如,DNA)上的交错切割产生的。粘性末端(sticky或cohesive end)具有突出的单链(这些链具有不成对的核苷酸)或突出端(例如,3′或5′突出端)。
在实施例中,术语Cas9是指工程化的Cas9变体,例如像deadCas9-FokI、Cas9nD10A-FokI和Cas9nH840A-FokI。在本披露的实施例中,Cas9效应蛋白包含:a)附接至该Cas9效应蛋白N-末端的第一核定位信号;和b)附接至该Cas9效应蛋白C-末端的第二核定位信号。
在一些实施例中,Cas9(例如融合蛋白的Cas9结构域)包含核酸酶灭活的Cas9(例如,缺乏DNA切割活性的Cas9;“dCas9”),该Cas9保留了RNA(gRNA)结合活性,因此能够结合与gRNA互补的靶位点。在实施例中,融合蛋白包含dCas9结构域与转录调节子结构域之间的接头。在实施例中,dCas9结构域与转录激活因子或阻遏因子结构域融合,形成dCas9转录调节子,该dCas9转录调节子可通过互补的gRNA序列引导至特定的靶位点。本文描述了接头的实例。在实施例中,dCas9结构域和转录调节子结构域的融合蛋白具有如本文所述的附接至dCas9结构域N-末端的核定位信号和附接至转录调节子结构域C-末端的核定位信号。
在实施例中,dCas9结构域是作为阻断转录的障碍起作用的dCas9结构域。在实施例中,dCas9结构域可以在空间上阻断RNA聚合酶的转录延伸。
在实施例中,dCa9结构域与VP64转录激活结构域融合。在实施例中,使用SunTag基因激活系统修饰dCas9结构域,其中利用小肽GCN4的串联重复序列来募集与转录激活因子VP64融合的单链可变片段的多个拷贝。在实施例中,使用协同激活介质(SAM)系统修饰dCas9结构域,其中dCas9与VP64融合,并且sgRNA已被修饰为含有两个MS2 RNA适配体以募集MS2噬菌体外壳蛋白(MCP),该MS2噬菌体外壳蛋白与转录激活因子p65和热休克因子1(HSF1)融合。在实施例中,用VP64-p65-Rta(VPR)修饰dCas9结构域用于基因激活,其中dCas9与组合VPR转录激活因子结构域融合以放大激活效应。在实施例中,用scRNA修饰dCas9结构域用于同时进行基因激活和抑制,其中偶联sgRNA和RNA适配体(例如,MS2、com、PP7)的杂交RNA支架可以募集束缚至转录激活因子或阻遏因子的RNA结合蛋白(例如,MCP、COM、PCP)。
在实施例中,用化学或光控制的二聚化系统修饰dCas9结构域,其中化学或光诱导的二聚化因子(例如,PYL1::ABI、GID::GAI和PhyB::PIF)分别与dCas9和转录效应子融合。在这些实施例中,添加相应的化学品(例如,脱落酸[ABA]或赤霉素[GA])或光可以诱导基因调节。在实施例中,使用分拆式dCas系统或受体偶联系统:I/O分子装置来修饰dCas9结构域。
在实施例中,dCas9是第二代或第三代转录调节子,如描述于Xu等人,“A CRISPR-dCas Toolbox for Genetic Engineering and Synthetic Biology[用于基因工程化和合成生物学的CRISPR-dCas工具箱],”J.Mol.Biol.[分子生物学杂志],2019,431:34-47,将其通过引用特此并入本文。
在实施例中,dCas9是用于表观基因组工程化的dCas9融合蛋白。在实施例中,用于表观基因组工程化的dCas9是dCas9融合蛋白,如描述于Xu等人,J.Mol.Biol.[分子生物学杂志],2019,431:34-47,将其通过引用特此并入本文。在实施例中,dCas9与甲基转移酶(例如,DNMT3A、DNMT3B或DNMT3L)融合。在实施例中,dCas9与KRAB结构域融合。在实施例中,dCas9与DNA脱甲基酶(例如,TET1)融合。在实施例中,dCas9与组蛋白甲基转移酶(例如,PRDM9或DOT1L)融合。在实施例中,dCas9与组蛋白脱甲基酶(例如,LSD1)融合。在实施例中,dCas9与组蛋白乙酰转移酶(例如,p300)融合。在实施例中,dCas9与组蛋白脱乙酰酶(例如,HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC 10或HDAC11,或者SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6或SIRT7)融合。
在实施例中,dCas9是用于基因组成像的dCas9融合蛋白。在实施例中,用于基因组成像的dCas9是dCas9融合蛋白,如描述于Xu等人,J.Mol.Biol.[分子生物学杂志],2019,431:34-47,将其通过引用特此并入本文。在实施例中,dCas9与荧光蛋白(例如,绿色荧光蛋白、黄色荧光蛋白、蓝色荧光蛋白、青色荧光蛋白、橙色荧光蛋白或红色荧光蛋白)融合。
在实施例中,dCas9是用于碱基编辑的dCas9融合蛋白。在实施例中,dCas9与胞嘧啶碱基编辑器融合。在实施例中,dCas9与腺嘌呤碱基编辑器融合。在实施例中,dCas9与尿嘧啶碱基编辑器融合。在实施例中,dCas9与胞苷脱氨酶融合。在实施例中,dCas9与腺嘌呤脱氨酶融合。在实施例中,dCas9与尿嘧啶DNA糖基化酶融合。
在实施例中,Cas9结构域是用于碱基编辑的Cas9切口酶融合蛋白。如本文所用,“Cas9切口酶”是仅切割靶DNA的一条链的Cas9蛋白。在实施例中,Cas9切口酶与胞嘧啶碱基编辑器融合。在实施例中,Cas9切口酶与腺嘌呤碱基编辑器融合。在实施例中,Cas9切口酶与尿嘧啶碱基编辑器融合。在实施例中,Cas9切口酶与胞苷脱氨酶融合。在实施例中,Cas9切口酶与腺嘌呤脱氯酶融合。在实施例中,Cas9切口酶与尿嘧啶DNA糖基化酶融合。在实施例中,Cas9结构域是用于碱基编辑的Cas9切口酶融合物,如描述于US 2018/0312828、US2018/0237787和US 2020/0010835,将其各自通过引用特此并入本文。
在实施例中,Cas9结构域是用于先导编辑的Cas9切口酶融合蛋白。在实施例中,Cas9切口酶与逆转录酶融合。在实施例中,Cas9结构域是用于先导编辑的Cas9切口酶融合物,如WO 2020/191248中所述,将其通过引用特此并入本文。
在实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少95%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少90%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少98%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少99%同一性的多肽序列。在实施例中,Cas9效应蛋白包含选自如图1和图2所示的SEQ IDNO:10-97中的任一个的多肽。
在实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少95%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少90%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少98%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少99%同一性的多肽序列。在实施例中,Cas9效应蛋白包含SEQ ID NO:71。
在蛋白质的实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少90%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少95%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少98%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少99%同一性的多肽序列。在实施例中,Cas9效应蛋白包含SEQ ID NO:98。
在一些实施例中,Cas9效应蛋白包含在以下的一个或多个位置处包括氨基酸修饰的SEQ ID NO:98:SEQ ID NO:98的R1336、R1389、R668、N1164、N1265、N1300、N1412、N347、N348、N562、N565、N618、N651、D1266、D309、D345、D487、D607、D30、Q1129、Q1381、Q624、Q661、Q713、Q734、E1032、E1409、E436、E610、E611、E691、E697、G1245、G1335、H777、I1242、L125、L1162、L1264、L1299、K1031、K443、K490、K615、K656、F1035、F620、F636、F670、S1243、S1334、S1380、S1410、S1413、S634、S638、S711、S1006、S1017、T1267、T1333、T551、T639、T639、T640、T666、T897、Y1338、Y343、Y566、V1273、V1274、V486、V644、V660、V667、V736,或其组合。
在一些实施例中,氨基酸修饰包括以下突变中的一个或多个:R668A、N1164R、N1265R、N1300R、N1412R、N347R、N348R、N562R、N565R、N618R、N651A、N651R、D1266R、D309R、D345R、D487R、D607R、Q1129R、Q1381A、Q1381A、Q1381R、Q624R、Q661A、Q661R、Q713R、Q734R、E1032G、E1032R、E1409A、E1409R、E436R、E610R、E611R、E691R、E697R、G1245R、G1335R、H777A、I1242S、L125R、L125Y、L1162S、L1264S、L1299S、K1031R、K443R、K490R、K615R、K656R、F1035R、F620R、F636R、F670Y、S1243R、S1334A、S1334A、S1334R、S1380R、S1410R、S1413R、S634R、S638A、S638R、S711R、S1006R、S1017R、T1267A、T1267R、T1333A、T1333R、T551R、T639A、T639R、T640R、T666R、T897R、Y1338A、Y1338R、Y343R、Y566R、V1273S、V1274S、V486R、V644R、V660R、V660Y、V667R、V667S、V736R或V736Y。在一些实施例中,氨基酸修饰包括以下突变中的一个或多个:N1164R、N1265R、N1300R、N1412R、N347R、N651A、D1266R、D309R、D345R、D487R、D607R、Q1129R、Q1381A、Q1381A、Q1381R、Q661A、Q713R、Q734R、E1032G、E1032R、E1409A、E436R、E611R、E691R、E697R、G1335R、L125R、L1264S、L1299S、K1031R、K490R、K615R、K656R、F636R、S1334A、S1334A、S1334R、S1380R、S1410R、S1413R、S634R、S638R、S711R、S1006R、S1017R、T1267A、T1267R、T551R、Y1338A、Y1338R、V1273S、V1274S、V486R、V644R、V736R或V736Y。在一些实施例中,氨基酸修饰包括以下突变中的一个或多个:N1265R、N1300R、N1412R、D1266R、E436R、G1335R、S1334R、S1380R、S1017R、T1267R、V736R或V736Y。
在一些实施例中,氨基酸修饰导致Cas9效应蛋白与DNA之间的结合亲和力增加。
CRISPR-Cas系统
在实施例中,本披露提供了CRISPR-Cas系统,其包含具有增强的稳定性的Cas9效应蛋白。
通常,CRISPR或CRISPR-Cas或CRISPR系统的特征在于促进靶序列位点处CRISPR复合物形成的元件(在内源性CRISPR系统的背景下也称为前间区序列)。在CRISPR复合物形成的背景下,“靶序列”是指设计指导多核苷酸靶向的序列,例如,它们具有互补性,其中靶序列与指导多核苷酸之间的杂交促进了CRISPR复合物的形成。指导多核苷酸中与靶序列互补的对于切割活性可能重要的节段在本文中称为指导序列。靶序列可以包含任何多核苷酸,如DNA或RNA多核苷酸,并且可能位于目的靶基因座内。在实施例中,靶序列位于细胞的细胞核或细胞质中。在实施例中,靶序列位于染色体(TSC)上。在实施例中,靶序列位于载体(TSV)上。
在实施例中,本披露提供了CRISPR-Cas系统,其包含:
a)Cas9效应蛋白,该Cas9效应蛋白包含:i)附接至该Cas9效应蛋白N-末端的第一核定位信号;和ii)附接至该Cas9效应蛋白C-末端的第二核定位信号;以及
b)指导多核苷酸,该指导多核苷酸包含指导序列并且与该Cas9效应蛋白形成复合物,其中该指导序列能够与真核细胞中的靶序列杂交。
在实施例中,本披露提供了CRISPR-Cas系统,其包含:
a)编码Cas9效应蛋白的核酸序列,该Cas9效应蛋白包含:i)附接至该Cas9效应蛋白N-末端的第一核定位信号;和ii)附接至该Cas9效应蛋白C-末端的第二核定位信号;以及
b)编码指导多核苷酸的核酸序列,该指导多核苷酸包含指导序列并且与该Cas9效应蛋白形成复合物,其中该指导序列能够与真核细胞中的靶序列杂交。
在该系统的实施例中,(a)和(b)的核苷酸序列在相同启动子的控制下。在实施例中,(a)和(b)的核苷酸序列在不同启动子的控制下。
如本文所用,“启动子”,“启动子序列”或“启动子区域”是指能够结合RNA聚合酶并涉及起始下游编码或非编码序列的转录的DNA调节区/序列。在本披露的一些实例中,启动子序列包括转录起始位点并向上游延伸以包括以高于背景可检测水平起始转录所使用的最少数目的碱基或元件。在实施例中,启动子序列包括转录起始位点以及负责RNA聚合酶结合的蛋白质结合结构域。真核启动子通常但并非总是含有“TATA”盒和“CAT”盒。各种启动子(包括诱导型启动子)可用于驱动本披露的各种载体。
在实施例中,(a)和(b)的核苷酸序列在真核启动子的控制下。在实施例中,(a)和(b)的核苷酸序列在两种不同的真核启动子的控制下。在实施例中,真核启动子中的至少一种是在人诱导多能干细胞中具有活性的启动子。在实施例中,真核启动子中的至少一种是EF1α(EF1a)。在实施例中,真核启动子中的至少一种是人巨细胞病毒(CMV)启动子。在实施例中,真核启动子中的至少一种是多西环素可调节启动子TRE3G。在实施例中,(a)和(b)的核苷酸序列在细菌启动子的控制下。在实施例中,(a)和(b)的核苷酸序列在两种不同的细菌启动子的控制下。在实施例中,(a)和(b)的核苷酸序列在病毒启动子的控制下。在实施例中,(a)和(b)的核苷酸序列在两种不同的病毒启动子的控制下。
在实施例中,(a)和(b)的核酸序列在单个载体中。在实施例中,(a)和(b)的核酸序列在单独的载体中。
在实施例中,本披露提供了CRISPR-Cas系统,其包含一个或多个含有以下的载体:
a)与一个或多个编码Cas9效应蛋白的核苷酸序列可操作地连接的调节元件,该Cas9效应蛋白包含:i)附接至该Cas9效应蛋白N-末端的第一核定位信号;和ii)附接至该Cas9效应蛋白C-末端的第二核定位信号;以及
b)指导多核苷酸,该指导多核苷酸包含指导序列并且与该Cas9效应蛋白形成复合物,其中该指导序列能够与真核细胞中的靶序列杂交。
在该系统的实施例中,调节元件是真核调节元件。在该系统的实施例中,调节元件是原核调节元件。
在实施例中,编码Cas9效应蛋白和指导多核苷酸的核苷酸在单个载体上。在实施例中,编码Cas9效应蛋白、指导多核苷酸(或可以转录成指导多核苷酸的核苷酸)和tracrRNA的核苷酸在单个载体上。在实施例中,编码Cas9效应蛋白、指导多核苷酸(或可以转录成指导多核苷酸的核苷酸)、tracrRNA和同向重复序列的核苷酸在单个载体上。在实施例中,载体是表达载体。在实施例中,载体是哺乳动物表达载体。在实施例中,载体是人表达载体。在实施例中,载体是植物表达载体。
在实施例中,编码Cas9效应蛋白和指导多核苷酸的核苷酸是单个核酸分子。在实施例中,编码Cas9效应蛋白、指导多核苷酸和tracrRNA的核苷酸是单个核酸分子。在实施例中,编码Cas9效应蛋白、指导多核苷酸、tracrRNA和同向重复序列的核苷酸是单个核酸分子。在实施例中,单个核酸分子是表达载体。在实施例中,单个核酸分子是哺乳动物表达载体。在实施例中,单个核酸分子是人表达载体。在实施例中,单个核酸分子是植物表达载体。
“可操作地连接”意指目的核苷酸(即编码Cas9效应蛋白的核苷酸)以允许核苷酸序列表达的方式与调节元件连接。因此,在实施例中,载体是表达载体。
在实施例中,调节元件是启动子。在实施例中,调节元件是细菌启动子。在实施例中,调节元件是病毒启动子。在实施例中,调节元件是真核调节元件,即真核启动子。在实施例中,真核调节元件是哺乳动物启动子。
在任一上述系统的实施例中,第一核定位信号是单组分核定位信号。在实施例中,第一核定位信号是两组分核定位信号。在实施例中,第二核定位信号是单组分核定位信号。在实施例中,第二核定位信号是两组分核定位信号。
在实施例中,第一和第二核定位信号可以均是单组分核定位信号、均是两组分核定位信号或可以是单组分核定位信号和两组分核定位信号的混合物。在实施例中,第一核定位信号是两组分核定位信号,并且第二核定位信号是单组分核定位信号。在实施例中,第一核定位信号是单组分核定位信号,并且第二核定位信号是两组分核定位信号。在实施例中,第一核定位信号是单组分核定位信号,并且第二核定位信号是单组分核定位信号。在实施例中,第一核定位信号是两组分核定位信号,并且第二核定位信号是两组分核定位信号。
在任一上述系统的实施例中,单组分核定位信号是本领域已知的单组分核定位信号。在实施例中,单组分核定位信号是上文表1中列出的单组分核定位信号(SEQ ID NO:1-6)中的一种或其组合。
在任一上述系统的实施例中,两组分核定位信号是本领域已知的两组分核定位信号。在实施例中,两组分核定位信号是经典的两组分核定位信号。在实施例中,两组分核定位信号是上文表2中列出的两组分核定位信号(SEQ ID NO:7-9)中的一种或其组合。
在任一上述系统的实施例中,第一核定位信号是经典的两组分核定位信号(SEQID NO:7),并且第二核定位信号是SV40大T抗原核定位信号(SEQ ID NO:1)。
在任一上述系统的实施例中,第一核定位信号直接附接至Cas9效应蛋白。在实施例中,第一核定位信号经由接头附接至Cas9效应蛋白。在实施例中,第二核定位信号直接附接至Cas9效应蛋白。在实施例中,第二核定位信号经由接头附接至Cas9效应蛋白。
在使用接头的实施例中,接头是具有2至30个残基的肽接头。在实施例中,接头是具有2至20个残基的肽接头。在实施例中,接头是具有2至15个残基的肽接头。在实施例中,接头是具有2至10个残基的肽接头。在实施例中,接头是具有2至5个残基的肽接头。在实施例中,接头是经取代的或未经取代的C2-C20烷基、烯基或炔基链。
在任一上述系统的实施例中,Cas9效应蛋白在其N-末端包含核定位信号的多于一个拷贝。在实施例中,Cas9效应蛋白在其N-末端包含核定位信号的多于一种类型。在实施例中,Cas9效应蛋白在其C-末端包含核定位信号的多于一个拷贝。在实施例中,Cas9效应蛋白在其C-末端包含核定位信号的多于一种类型。
在任一上述系统的实施例中,蛋白质包含第一核定位信号的两个拷贝。在实施例中,蛋白质包含第一核定位信号的三个拷贝。在实施例中,蛋白质包含第二核定位信号的两个拷贝。在实施例中,蛋白质包含第二核定位信号的三个拷贝。
在任一上述系统的实施例中,包含第一和第二核定位信号的Cas9蛋白的Cas9部分可以衍生自本领域已知的任何Cas9效应子结构域。在实施例中,Cas9效应蛋白衍生自具有II-B型CRISPR系统的细菌物种。上文描述了合适的II-B型Cas9蛋白的实例。在实施例中,Cas9部分包含以1E-5的E值截止值匹配TIGR03031蛋白家族的结构域。在实施例中,位点特异性核酸酶包含以1E-10的E值截止值匹配TIGR03031蛋白家族的结构域。
在任一上述系统的实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少95%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少90%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少98%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少99%同一性的多肽序列。在实施例中,Cas9效应蛋白包含选自如图1和图2所示的SEQ ID NO:10-97中的任一个的多肽。
在任一上述系统的实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少95%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少90%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少98%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少99%同一性的多肽序列。在实施例中,Cas9效应蛋白包含SEQ ID NO:71。
在任一上述系统的实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少90%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少95%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少98%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少99%同一性的多肽序列。在实施例中,Cas9效应蛋白包含SEQ ID NO:98。
在任一上述系统的其他实施例中,Cas9效应蛋白的Cas9部分包含dCas9,即缺乏DNA双链断裂活性的失活或“死亡”的Cas9。在实施例中,dCas9可以与其它活性结构域(例如如本文其他地方描述的转录调节子、表观遗传调节蛋白或荧光蛋白)融合。在dCas9与另一个活性结构域融合的实施例中,本文所述的核定位信号存在于整个Cas9效应蛋白构建体的N-末端和C-末端。
在任一上述系统的其他实施例中,Cas9效应蛋白的Cas9部分包含Cas9切口酶,即仅切割DNA双链的一条链的Cas9蛋白。在实施例中,Cas9切口酶可以与其它活性结构域(例如如本文其他地方描述的转录调节子、表观遗传调节蛋白或荧光蛋白)融合。在Cas9切口酶与另一个活性结构域融合的实施例中,本文所述的核定位信号存在于整个Cas9效应蛋白构建体的N-末端和C-末端。
本文所述的系统和方法可以包含指导多核苷酸。在实施例中,指导多核苷酸是RNA。与CRISPR-Cas9组分结合并将其靶向靶DNA内特定位置的RNA在本文中称为“指导RNA”、“gRNA”或“小指导RNA”,并且在本文中也可称为“DNA靶向RNA”。指导多核苷酸(例如指导RNA)包含至少两个核苷酸区段:至少一个“DNA结合区段”和至少一个“多肽结合区段”。“区段”意指分子的部分、节段或区域,例如,指导多核苷酸分子的核苷酸的连续延伸段。除非另有明确定义,否则“区段”的定义不限于特定数目的总碱基对。
在实施例中,指导多核苷酸的DNA结合区段与真核细胞中的靶序列杂交,但不与细菌细胞中的序列杂交。如本文所用,细菌细胞中的序列是指细菌生物体原生的多核苷酸序列,即天然存在的细菌多核苷酸序列或细菌起源的序列。例如,该序列可以是细菌染色体或细菌质粒,或者是在细菌细胞中天然存在的任何其他多核苷酸序列。
在实施例中,指导多核苷酸的多肽结合区段与如本文所述的具有增强的稳定性的Cas9效应蛋白结合。
在实施例中,指导多核苷酸是10至150个核苷酸。在实施例中,指导多核苷酸是20至120个核苷酸。在实施例中,指导多核苷酸是30至100个核苷酸。在实施例中,指导多核苷酸是40至80个核苷酸。在实施例中,指导多核苷酸是50至60个核苷酸。在实施例中,指导多核苷酸是10至35个核苷酸。在实施例中,指导多核苷酸是15至30个核苷酸。在实施例中,指导多核苷酸是20至25个核苷酸。
可以将指导多核苷酸(例如,指导RNA)作为分离的分子(例如,RNA分子)引入靶细胞中,或使用含有编码指导多核苷酸(例如,指导RNA)的DNA的表达载体将其引入细胞中。
指导多核苷酸(例如,指导RNA)的“DNA结合区段”(或“DNA靶向序列”)包含与靶DNA内的特定序列互补的核苷酸序列。
本披露的指导多核苷酸(例如,指导RNA)可以包括多肽结合序列/区段。指导多核苷酸(例如,指导RNA)的多肽结合区段(或“蛋白结合序列”)与本披露的Cas蛋白的多核苷酸结合结构域相互作用。这样的多肽结合区段或序列是本领域技术人员已知的,例如,美国专利申请公开2014/0068797、2014/0273037、2014/0273226、2014/0295556、2014/0295557、2014/0349405、2015/0045546、2015/0071898、2015/0071899和2015/0071906中披露的那些,将其披露内容以其全文并入本文。
在一些实施例中,多肽结合区段已被修饰以改善与本发明多肽的结合。Riesenberg等人(Nature eommunications[自然通讯],2021)及其参考文献中描述了修饰多肽结合区段以改善结合的方法。适用于SEQ ID NO.98的指导RNA的优化多肽结合区段在表3中显示为SEQ ID NO:100-107。SEQ ID NO:99是适用于优化前的SEQ ID NO:98的多肽结合区段序列。在一些实施例中,指导RNA包含选自SEQ ID NO.99、SEQ ID NO.100、SEQ IDNO.101、SEQ ID NO.102、SEQ ID NO.103、SEQ ID NO.104、SEQ ID NO.105、SEQ ID NO.106或SEQ ID NO.107的序列。
表3
在本披露的实施例中,Cas9效应蛋白和指导多核苷酸可以形成复合物。“复合物”是两个或更多个缔合的核酸和/或多肽的组。在实施例中,当复合物的所有组分一起存在时,形成复合物,即自组装复合物。在实施例中,通过复合物的不同组分之间的化学相互作用(例如像氢键合)形成复合物。在实施例中,通过Cas9效应蛋白对指导多核苷酸的二级结构识别,该指导多核苷酸与该Cas9效应蛋白形成复合物。在实施例中,Cas9效应蛋白是无活性的,即,不展现出核酸酶活性,直到它与指导多核苷酸形成复合物。指导RNA的结合诱导Cas9效应蛋白的构象变化,以将Cas9效应蛋白从无活性形式转化为活性(即,催化活性)形式。
在任一上述系统的实施例中,指导序列的长度是19至30个碱基。在实施例中,指导序列的长度是19至25个碱基。在实施例中,指导序列的长度是21至26个碱基。
在任一上述系统的实施例中,指导多核苷酸进一步包含tracrRNA序列。“tracrRNA”或反式激活CRISPR-RNA与前体crRNA或前体CRISPR-RNA形成RNA双链体,然后被RNA特异性核糖核酸酶RNA酶III切割,形成crRNA/tracrRNA杂交体。在实施例中,指导RNA包含crRNA/tracrRNA杂交体。在实施例中,指导RNA的tracrRNA组分激活Cas9效应蛋白。
在本文披露的系统的实施例中,Cas9效应蛋白、指导多核苷酸和tracrRNA能够形成复合物。
在任一上述系统的实施例中,Cas9效应蛋白产生粘性末端。在实施例中,由Cas9效应蛋白产生的粘性末端包含5’突出端。在实施例中,由Cas9效应蛋白产生的粘性末端包含3’突出端。在实施例中,粘性末端包含具有1至10个核苷酸的单链多核苷酸突出端。在实施例中,粘性末端包含具有2至6个核苷酸的单链多核苷酸突出端。在实施例中,粘性末端包含具有3至5个核苷酸的单链多核苷酸突出端。
在实施例中,Cas9效应蛋白优选在5′端具有多个核苷酸的粘性末端。在实施例中,Cas9效应蛋白优选在5′端具有3个核苷酸的粘性末端。在实施例中,Cas9效应蛋白优选在5′端具有2、3、4、5或6个核苷酸的粘性末端。在实施例中,这种优选与传统使用的酿脓链球菌(S.pyogenes)Cas9(SpCas9)相反,后者优选单个核苷酸5′粘性末端。
在实施例中,单个核苷酸5′粘性末端的存在可用于指导目的核酸以特定方向插入。在实施例中,5′粘性末端上三个核苷酸的存在可用于指导目的核酸以特定方向插入。在实施例中,5′粘性末端上两个、三个、四个、五个或六个核苷酸的存在可用于指导目的核酸以特定方向插入。
细胞
在实施例中,本披露提供了真核细胞,其包含如本文所述的Cas9效应蛋白。在实施例中,本披露还提供了真核细胞,其包含含有如本文所述的Cas9效应蛋白的系统。
在实施例中,真核细胞是动物或人细胞。在实施例中,真核细胞是人或啮齿动物或牛细胞系或者细胞株。这样的细胞、细胞系或细胞株的实例包括但不限于小鼠骨髓瘤(NSO)细胞系、中国仓鼠卵巢(CHO)细胞系、HT1080、H9、HepG2、MCF7、MDBK Jurkat、NIH3T3、PCI2、BHK(幼仓鼠肾细胞)、VERO、SP2/0、YB2/0、Y0、C127、L细胞、COS(例如COS1和COS7)、QC1-3、HEK-293、VERO、PER.C6、HeLA、EB1、EB2、EB3、溶瘤或杂交瘤细胞系。在实施例中,真核细胞是CHO细胞系。在实施例中,真核细胞是CHO细胞。在实施例中,细胞是CHO-K1细胞、CHO-K1 SV细胞、DG44 CHO细胞、DUXB11 CHO细胞、CHOS、CHO GS敲除细胞、CHO FUT8 GS敲除细胞、CHOZN、或CHO衍生的细胞。CHO GS敲除细胞(例如,GSKO细胞)是例如CHO-K1 SV GS敲除细胞。CHO FUT8敲除细胞是例如CHOK1 SV(龙沙生物公司(Lonza Biologics,Inc.))。真核细胞也可以是鸟类细胞、细胞系或细胞株,例如像细胞、EB14、EB24、EB26、EB66或EBvl3。
在实施例中,真核细胞是人细胞。在实施例中,人细胞是干细胞。这些干细胞可以是例如多能干细胞,包括胚胎干细胞(ESC)、成体干细胞、诱导多能干细胞(iPSC)、组织特异性干细胞(例如,造血干细胞)和间充质干细胞(MSC)。在实施例中,人细胞是本文所述的任一细胞的分化形式。在实施例中,真核细胞是衍生自培养中的任何原代细胞的细胞。在实施例中,细胞是干细胞或干细胞系。
在实施例中,真核细胞是肝细胞,如人肝细胞、动物肝细胞或非实质细胞。例如,真核细胞可以是可铺板培养的代谢合格的人肝细胞、可铺板培养的诱导合格的人肝细胞、可铺板培养的Qualyst Transporter CertifiedTM人肝细胞、悬浮合格的人肝细胞(包括10-供体和20-供体合并的肝细胞)、人肝库普弗(hepatic kupffer)细胞、人肝星形细胞、犬肝细胞(包括单个的和合并的比格犬肝细胞)、小鼠肝细胞(包括CD-1和C57BI/6肝细胞)、大鼠肝细胞(包括Sprague-Dawley、Wistar Han和Wistar肝细胞)、猴肝细胞(包括食蟹猴或恒河猴肝细胞)、猫肝细胞(包括短毛家猫肝细胞)和兔肝细胞(包括新西兰白兔肝细胞)。
在实施例中,真核细胞是植物细胞。例如,植物细胞可以属于如木薯、玉米、高粱、小麦或水稻等农作物。植物细胞可以属于藻类、树木或蔬菜。植物细胞可以属于单子叶植物或双子叶植物,或者可以属于农作物或谷物植物、生产植物、水果或蔬菜。例如,植物细胞可以属于树木,例如柑橘属树木,如橘子树、葡萄柚树或柠檬树;桃树或油桃树;苹果树或梨树;坚果树,如杏仁树或核桃树或开心果树;茄属植物,即马铃薯;芸苔属(Brassica)植物;莴苣属(Lactuca)植物;菠菜属(Spinacia)植物;辣椒属(Capsicum)植物;棉花、烟草、芦笋、胡萝卜、卷心菜、西兰花、花椰菜、番茄、茄子、胡椒、生菜、菠菜、草莓、蓝莓、覆盆子、黑莓、葡萄、咖啡、可可等。
递送颗粒
在实施例中,本披露提供了递送颗粒,其包含如本文所述的Cas9效应蛋白。在实施例中,本披露还提供了递送颗粒,其包含含有如本文所述Cas9效应蛋白的系统。
在递送颗粒包含如本文所述的系统的实施例中,Cas9效应蛋白和指导多核苷酸以复合物存在。在实施例中,复合物进一步包含含有tracrRNA序列的多核苷酸。
在实施例中,递送颗粒是基于脂质的系统、脂质体、胶束、微囊泡、外泌体或基因枪。在实施例中,递送颗粒包含Cas9效应蛋白和指导多核苷酸。在实施例中,递送颗粒包含Cas9效应蛋白和指导多核苷酸,其中该Cas9效应蛋白和该指导多核苷酸以复合物存在。在实施例中,递送颗粒包含编码Cas9效应蛋白的多核苷酸、编码指导多核苷酸的多核苷酸和含有tracrRNA的多核苷酸。在实施例中,递送颗粒包含Cas9效应蛋白、指导多核苷酸和tracrRNA。在实施例中,递送颗粒包含编码一种或多种Cas9效应蛋白的多核苷酸、编码一种或多种指导多核苷酸的多核苷酸和编码tracrRNA的多核苷酸。
在实施例中,递送颗粒进一步包含脂质、糖、金属或蛋白质。在实施例中,递送颗粒是脂质包膜。在实施例中,递送颗粒是基于糖的颗粒,例如GalNAc。在实施例中,递送颗粒是纳米颗粒。本文描述了纳米颗粒的实例。在美国专利公开号2011/0293703、2012/0251560和2013/0302401以及美国专利号5,543,158、5,855,913、5,895,309、6,007,845和8,709,843中进一步描述了递送颗粒的制备,将其各自通过引用以其全文并入本文。
囊泡
在实施例中,本披露提供了囊泡,其包含如本文所述的Cas9效应蛋白。在实施例中,本披露还提供了囊泡,其包含含有如本文所述Cas9效应蛋白的系统。
在囊泡包含如本文所述的系统的实施例中,Cas9效应蛋白和指导多核苷酸以复合物存在。在实施例中,复合物进一步包含含有tracrRNA序列的多核苷酸。
“囊泡”是细胞内具有被脂质双层包围的流体的小结构。本文提供了囊泡的实例。在实施例中,囊泡包含Cas9效应蛋白和指导多核苷酸。在实施例中,囊泡包含Cas9效应蛋白和指导多核苷酸,其中该Cas9效应蛋白和该指导多核苷酸以复合物存在。在实施例中,囊泡包含编码Cas9效应蛋白的多核苷酸、编码指导多核苷酸的多核苷酸和含有tracrRNA的多核苷酸。在实施例中,囊泡包含Cas9效应蛋白、指导多核苷酸和tracrRNA。在实施例中,囊泡包含编码一种或多种Cas9效应蛋白的多核苷酸、编码一种或多种指导多核苷酸的多核苷酸和编码tracrRNA的多核苷酸。
在实施例中,囊泡是外泌体或脂质体。在实施例中,Cas9效应蛋白经由外泌体递送至细胞中。外泌体是内源性纳米囊泡(即,直径为约30nm至约100nm),可转运RNA和蛋白质,并且可将RNA递送至大脑和其他靶器官。例如,Alvarez-Erviti等人,NatureBiotechnology[自然生物学]29:341(2011),El-Andaloussi等人,Nature Protocols[自然实验手册]7:2112-2116(2012),以及Wahlgren等人,Nucleic Acids Research[核酸研究]40(17):e130(2012)中描述了用于将外源性生物材料递送至靶器官的工程化外泌体,将这些文献各自通过引用以其全文并入本文。
在实施例中,Cas9效应蛋白经由脂质体递送至细胞中。脂质体是具有至少一个脂质双层的球形囊泡结构,并且可以用作营养物和药物施用的媒介物。脂质体通常由磷脂(特别是磷脂酰胆碱)以及其他脂质(如蛋磷脂酰乙醇胺)组成。脂质体的类型包括但不限于多层囊泡、小单层囊泡、大单层囊泡和耳蜗囊泡。参见,例如,Spuch和Navarro,“Liposomesfor Targeted Delivery of ActiVe Agents against Neurodegenerative Diseases(Alzheimer′s Disease and Parkinson′s Disease)[用于抗神经退行性疾病(阿尔茨海默病和帕金森病)活性药物的靶向递送的脂质体]”,Journal of Drug Delivery[药物递送杂志]2011,文章ID 469679(2011)。例如,Morrissey等人,Nature Biotechnology[自然生物技术]23(8):1002-1007(2005),Zimmerman等人,Nature Letters[自然快报]441:111-114(2006),以及Li等人,Gene Therapy[基因疗法]19:775-780(2012)描述了用于递送生物材料例如CRISPR-Cas组分的脂质体,将这些文献各自通过引用以其全文并入本文。
病毒载体
在实施例中,本披露提供了病毒载体,其包含如本文所述的Cas9效应蛋白。在实施例中,本披露还提供了病毒载体,其包含含有如本文所述Cas9效应蛋白的系统。
在病毒载体包含如本文所述的系统的实施例中,Cas9效应蛋白和指导多核苷酸以复合物存在。在实施例中,复合物进一步包含含有tracrRNA序列的多核苷酸。
在实施例中,病毒载体是腺病毒颗粒、腺相关病毒颗粒或单纯疱疹病毒颗粒。在实施例中,病毒载体是腺病毒、慢病毒或腺相关病毒。本文提供了病毒载体的实例。使用腺相关病毒(AAV)和慢病毒载体的病毒转导(可以局部、靶向或全身施用)已被用作体内基因疗法的递送方法。在本披露的实施例中,Cas效应蛋白由转导的细胞在细胞内表达。
在实施例中,病毒载体包含Cas9效应蛋白和指导多核苷酸。在实施例中,病毒载体包含Cas9效应蛋白和指导多核苷酸,其中该Cas9效应蛋白和该指导多核苷酸以复合物存在。在实施例中,病毒载体包含编码Cas9效应蛋白的多核苷酸、编码指导多核苷酸的多核苷酸和含有tracrRNA的多核苷酸。在实施例中,病毒载体包含Cas9效应蛋白、指导多核苷酸和tracrRNA。在实施例中,病毒载体包含编码一种或多种Cas9效应蛋白的多核苷酸、编码一种或多种指导多核苷酸的多核苷酸和编码tracrRNA的多核苷酸。
用于提供靶序列的位点特异性修饰的方法
在实施例中,本披露提供了用于在真核细胞中提供靶序列的位点特异性修饰的方法,该方法包括:
a)将以下引入到该细胞中:
i)编码Cas9效应蛋白的核苷酸,该Cas9效应蛋白包含:
A)附接至该Cas9效应蛋白N-末端的第一核定位信号;和
B)附接至该Cas9效应蛋白C-末端的第二核定位信号;以及
ii)编码指导多核苷酸的核苷酸,该指导多核苷酸与该Cas9效应蛋白形成复合物并且包含指导序列,其中该指导序列能够与宿主多核苷酸中的靶序列杂交;
b)用该Cas9效应蛋白和该指导多核苷酸在该宿主多核苷酸中产生粘性末端;以及
c)
i)将(b)的这些粘性末端连接在一起,或
ii)将目的多核苷酸序列的3′端与一个粘性末端连接,并且将该多核苷酸序列的5’端与一个粘性末端连接;从而修饰该靶序列。
靶序列的修饰涵盖单核苷酸取代、多核苷酸取代、核酸的插入(即,敲入)和缺失(即,敲除)、移码突变和其他核酸修饰。
在实施例中,修饰是靶序列的至少一部分的缺失。可以在两个不同位点切割靶序列并产生互补的粘性末端,并且这些互补的粘性末端可以重新连接,从而去除两个位点之间的序列部分。
在实施例中,修饰是靶序列的突变。真核细胞中的位点特异性诱变是通过使用位点特异性核酸酶来实现的,该位点特异性核酸酶可促进含有目的突变的外源多核苷酸模板(也称为“供体多核苷酸”或“供体载体”)的同源重组。在实施例中,目的序列(SoI)包含目的突变。
在实施例中,修饰是将目的序列(SoI)插入靶序列中。SoI可以作为外源多核苷酸模板引入。在实施例中,外源多核苷酸模板包含粘性末端。在实施例中,外源多核苷酸模板包含与靶序列中的粘性末端互补的粘性末端。
外源多核苷酸模板可以具有任何合适的长度,如长度是约或至少约10、15、20、25、50、75、100、150、200、250、500或1000或更多个核苷酸。在实施例中,外源多核苷酸模板与包含靶序列的多核苷酸的一部分互补。当进行最佳比对时,外源多核苷酸模板与靶序列的一个或多个核苷酸(例如,约或至少约1、5、10、15、20、25、30、35、40、45、50、60、70、80、90或100或更多个核苷酸)重叠。在实施例中,当对外源多核苷酸模板和包含靶序列的多核苷酸进行最佳比对时,外源多核苷酸模板最接近的核苷酸在距离靶序列约1、5、10、15、20、25、50、75、100、200、300、400、500、100、1500、2000、2500、5000、10000个或更多个核苷酸内。
在实施例中,外源多核苷酸是DNA,例如,DNA质粒、细菌人工染色体(BAC)、酵母人工染色体(YAC)、病毒载体、单链或双链DNA的线性片段、寡核苷酸、PCR片段、裸核酸或与递送媒介物(如脂质体)复合的核酸。
在实施例中,使用细胞的内源DNA修复途径将外源多核苷酸插入靶序列中。内源DNA修复途径包括非同源末端连接(NHEJ)途径、微同源介导的末端连接(MMEJ)途径和同源定向修复(HDR)途径。NHEJ、MMEJ和HDR途径可修复双链DNA断裂。在NHEJ中,修复DNA中的断裂不需要同源模板。NHEJ修复可能容易出错,尽管当DNA断裂包含相容的突出端时,错误会减少。NHEJ和MMEJ是在机理上截然不同的DNA修复途径,它们各自涉及DNA修复酶的不同子集。与可能精确且容易出错的NHEJ不一样,MMEJ总是容易出错,并且会导致在修复位点处的缺失和插入。MMEI相关的缺失归因于双链断裂两侧的微同源性(2-10个碱基对)。相比之下,HDR需要同源模板来直接进行修复,但是HDR修复典型地具有高保真度,并且不易出错。在实施例中,利用NHEJ和MMEJ修复的容易出错的性质在靶序列中引入非特异性核苷酸取代。在实施例中,Cas9效应蛋白以促进HDR修复的方式切割靶序列。
在修复过程中,可以将包含SoI的外源多核苷酸模板引入靶序列中。在实施例中,将包含侧接上游序列和下游序列的SoI的外源多核苷酸模板引入细胞中,其中该上游和下游序列与靶序列中整合位点的任一侧具有序列相似性。在实施例中,包含SoI的外源多核苷酸包含例如突变基因。在实施例中,外源多核苷酸包含对于该细胞而言是内源性或外源性的序列。在实施例中,SoI包含编码蛋白质的多核苷酸、或非编码序列,例如像微小RNA。在实施例中,SoI与调节元件可操作地连接。在实施例中,SoI是调节元件。在实施例中,SoI包含抗性盒,例如赋予对抗生素的抗性的基因。在实施例中,SoI包含野生型靶序列的突变。在实施例中,SoI通过产生移码突变或核苷酸取代来破坏或校正靶序列。在实施例中,SoI包含标志物。将标志物引入靶序列可以便于筛选靶向的整合。在实施例中,标志物是限制性位点、荧光蛋白或选择性标志物。在实施例中,将SoI作为包含SoI的载体引入。
选择外源多核苷酸模板中的上游和下游序列以促进靶序列与外源多核苷酸之间的同源重组。该上游序列是与用于整合的靶位点的上游序列(即靶序列)具有序列相似性的核酸序列。类似地,该下游序列是与用于整合的靶位点的下游序列具有序列相似性的核酸序列。因此,在实施例中,通过在上游和下游序列处的同源重组,将包含SoI的外源多核苷酸模板插入靶序列中。在实施例中,外源多核苷酸模板中的上游和下游序列与靶向的基因组序列的上游和下游序列分别具有至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、分别至少97%、至少98%、至少99%或100%序列同一性。在实施例中,该上游或下游序列具有约20至2000个碱基对、或约50至1750个碱基对、或约100至1500个碱基对、或约200至1250个碱基对、或约300至1000个碱基对、或约400至约750个碱基对、或约500至600个碱基对。在实施例中,该上游或下游序列具有约50、约100、约250、约500、约100、约1250、约1500、约1750、约2000、约2250或约2500个碱基对。
在实施例中,靶序列中的修饰是细胞中靶序列表达的失活。例如,在CRISPR复合物与靶序列结合后,靶序列即失活,使得该序列不被转录,不产生编码的蛋白质,或者该序列不像野生型序列那样起作用。例如,蛋白质或微小RNA编码序列可能会失活,从而不产生蛋白质。
在实施例中,调节序列可能会失活,使得它不再作为调节序列起作用。调节序列的实例包括启动子、转录终止子、增强子和本文所述的其他调节元件。失活的靶序列可以包括缺失突变(即,一个或多个核苷酸的缺失)、插入突变(即,一个或多个核苷酸的插入)或无义突变(即,用另一个核苷酸取代一个单核苷酸从而引入终止密码子)。在实施例中,靶序列的失活导致靶序列的“敲除”。
在方法的实施例中,第一核定位信号是单组分核定位信号。在实施例中,第一核定位信号是两组分核定位信号。在实施例中,第二核定位信号是单组分核定位信号。在实施例中,第二核定位信号是两组分核定位信号。
在方法的实施例中,第一和第二核定位信号可以均是单组分核定位信号、均是两组分核定位信号或可以是单组分核定位信号和两组分核定位信号的混合物。在实施例中,第一核定位信号是两组分核定位信号,并且第二核定位信号是单组分核定位信号。在实施例中,第一核定位信号是单组分核定位信号,并且第二核定位信号是两组分核定位信号。在实施例中,第一核定位信号是单组分核定位信号,并且第二核定位信号是单组分核定位信号。在实施例中,第一核定位信号是两组分核定位信号,并且第二核定位信号是两组分核定位信号。
在方法的实施例中,单组分核定位信号是本领域已知的单组分核定位信号。在实施例中,单组分核定位信号是上文表1中列出的单组分核定位信号(SEQ ID NO:1-6)中的一种或其组合。
在方法的实施例中,两组分核定位信号是本领域已知的两组分核定位信号。在实施例中,两组分核定位信号是经典的两组分核定位信号。在实施例中,两组分核定位信号是上文表2中列出的两组分核定位信号(SEQ ID NO:7-9)中的一种或其组合。
在方法的实施例中,第一核定位信号是经典的两组分核定位信号(SEQ ID NO:7),并且第二核定位信号是SV40大T抗原核定位信号(SEQ ID NO:1)。
在方法的实施例中,第一核定位信号直接附接至Cas9效应蛋白。在实施例中,第一核定位信号经由接头附接至Cas9效应蛋白。在实施例中,第二核定位信号直接附接至Cas9效应蛋白。在实施例中,第二核定位信号经由接头附接至Cas9效应蛋白。
在使用接头的实施例中,接头是具有2至30个残基的肽接头。在实施例中,接头是具有2至20个残基的肽接头。在实施例中,接头是具有2至15个残基的肽接头。在实施例中,接头是具有2至10个残基的肽接头。在实施例中,接头是具有2至5个残基的肽接头。在实施例中,接头是经取代的或未经取代的C2-C20烷基、烯基或炔基链。
在方法的实施例中,Cas9效应蛋白在其N-末端包含核定位信号的多于一个拷贝。在实施例中,Cas9效应蛋白在其N-末端包含核定位信号的多于一种类型。在实施例中,Cas9效应蛋白在其C-末端包含核定位信号的多于一个拷贝。在实施例中,Cas9效应蛋白在其C-末端包含核定位信号的多于一种类型。
在方法的实施例中,蛋白质包含第一核定位信号的两个拷贝。在实施例中,蛋白质包含第一核定位信号的三个拷贝。在实施例中,蛋白质包含第二核定位信号的两个拷贝。在实施例中,蛋白质包含第二核定位信号的三个拷贝。
在方法的实施例中,包含第一和第二核定位信号的Cas9蛋白的Cas9部分可以衍生自本领域已知的任何Cas9效应子结构域。在实施例中,Cas9效应蛋白衍生自具有II-B型CRISPR系统的细菌物种。上文描述了合适的II-B型Cas9蛋白的实例。在实施例中,Cas9部分包含以1E-5的E值截止值匹配TIGR03031蛋白家族的结构域。在实施例中,位点特异性核酸酶包含以1E-10的E值截止值匹配TIGR03031蛋白家族的结构域。
在方法的实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少95%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少90%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少98%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少99%同一性的多肽序列。在实施例中,Cas9效应蛋白包含选自如图1和图2所示的SEQID NO:10-97中的任一个的多肽。
在方法的实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少95%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少90%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少98%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少99%同一性的多肽序列。在实施例中,Cas9效应蛋白包含SEQ ID NO:71。
在方法的实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少90%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少95%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少98%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少99%同一性的多肽序列。在实施例中,Cas9效应蛋白包含SEQ ID NO:98。
在方法的其他实施例中,Cas9效应蛋白的Cas9部分包含dCas9,即缺乏DNA双链断裂活性的失活或“死亡”的Cas9。在实施例中,dCas9可以与其它活性结构域(例如如本文其他地方描述的转录调节子、表观遗传调节蛋白或荧光蛋白)融合。在dCas9与另一个活性结构域融合的实施例中,本文所述的核定位信号存在于整个Cas9效应蛋白构建体的N-末端和C-末端。
在方法的其他实施例中,Cas9效应蛋白的Cas9部分包含Cas9切口酶,即仅切割DNA双链的一条链的Cas9蛋白。在实施例中,Cas9切口酶可以与其它活性结构域(例如如本文其他地方描述的转录调节子、表观遗传调节蛋白或荧光蛋白)融合。在Cas9切口酶与另一个活性结构域融合的实施例中,本文所述的核定位信号存在于整个Cas9效应蛋白构建体的N-末端和C-末端。
在实施例中,该方法包括使用如本文所述的指导多核苷酸。在方法的实施例中,指导多核苷酸是RNA。
在任一上述系统的实施例中,指导序列的长度是19至30个碱基。在实施例中,指导序列的长度是19至25个碱基。在实施例中,指导序列的长度是21至26个碱基。
在任一上述系统的实施例中,指导多核苷酸进一步包含如本文所述的tracrRNA序列。在本文披露的系统的实施例中,Cas9效应蛋白、指导多核苷酸和tracrRNA能够形成复合物。
在方法的实施例中,Cas9效应蛋白产生粘性末端。在实施例中,由Cas9效应蛋白产生的粘性末端包含5’突出端。在实施例中,由Cas9效应蛋白产生的粘性末端包含3’突出端。在实施例中,粘性末端包含具有1至10个核苷酸的单链多核苷酸突出端。在实施例中,粘性末端包含具有2至6个核苷酸的单链多核苷酸突出端。在实施例中,粘性末端包含具有3至5个核苷酸的单链多核苷酸突出端。
在方法的实施例中,真核细胞是动物或人细胞。在实施例中,真核细胞是如本文所述的动物细胞。在实施例中,真核细胞是人细胞。在实施例中,真核细胞是如本文所述的人细胞。在实施例中,真核细胞是植物细胞。在实施例中,真核细胞是如本文所述的植物细胞。
在方法的实施例中,修饰是靶序列的至少一部分的缺失。在实施例中,修饰是靶序列的突变。在实施例中,修饰是将目的序列插入靶序列中。在实施例中,修饰是如本文所述的修饰。
在方法的实施例中,修饰提供了减少的脱靶效应。在方法的实施例中,与酿脓链球菌Cas9(SpCas9)提供的脱靶效应相比,修饰提供了减少的脱靶效应。
本披露还提供了用于在真核细胞中提供具有减少的脱靶效应的靶序列的位点特异性修饰的方法,该方法包括:
a)将以下引入到该细胞中:i)编码Cas9效应蛋白的核苷酸,该Cas9效应蛋白包含:A)附接至该Cas9效应蛋白N-末端的第一核定位信号;和B)附接至该Cas9效应蛋白C-末端的第二核定位信号;以及ii)编码指导多核苷酸的核苷酸,该指导多核苷酸与该Cas9效应蛋白形成复合物并且包含指导序列,其中该指导序列能够与宿主多核苷酸中的靶序列杂交;
b)用该Cas9效应蛋白和该指导多核苷酸在该宿主多核苷酸中产生粘性末端:以及
c)i)将(b)的这些粘性末端连接在一起,或ii)将目的多核苷酸序列的3′端与一个粘性末端连接,并且将该多核苷酸序列的5’端与一个粘性末端连接;从而修饰该具有减少的脱靶效应的靶序列。
在方法的实施例中,与酿脓链球菌Cas9(SpCas9)提供的脱靶效应相比,修饰提供了减少的脱靶效应。在方法的实施例中,与野生型酿脓链球菌Cas9(SpCas9)提供的脱靶效应相比,修饰提供了减少的脱靶效应。
用于减少Cas9效应蛋白降解的方法
在实施例中,本披露提供了用于减少细胞中Cas9效应蛋白降解的方法,该方法包括:
a)将第一核定位信号附接至该Cas9效应蛋白的N-末端;以及
b)将第二核定位信号附接至该Cas9效应蛋白的C-末端。
在实施例中,可以如本文所述的进行附接。在实施例中,使用标准分子生物学方法(如限制性内切酶消化和连接)将编码核定位信号的核酸序列置于编码Cas9效应蛋白的核酸序列的上游和下游,从而形成编码Cas9效应蛋白的核酸,该Cas9效应蛋白在其N-末端和C-末端包含核定位信号。随后该核酸可以在细胞(例如真核细胞)中表达。在其他实施例中,使用固相蛋白质合成方法完全或部分合成在其N-末端和C-末端包含核定位信号的Cas9效应蛋白。
在方法的实施例中,第一核定位信号是单组分核定位信号。在实施例中,第一核定位信号是两组分核定位信号。在实施例中,第二核定位信号是单组分核定位信号。在实施例中,第二核定位信号是两组分核定位信号。
在方法的实施例中,第一和第二核定位信号可以均是单组分核定位信号、均是两组分核定位信号或可以是单组分核定位信号和两组分核定位信号的混合物。在实施例中,第一核定位信号是两组分核定位信号,并且第二核定位信号是单组分核定位信号。在实施例中,第一核定位信号是单组分核定位信号,并且第二核定位信号是两组分核定位信号。在实施例中,第一核定位信号是单组分核定位信号,并且第二核定位信号是单组分核定位信号。在实施例中,第一核定位信号是两组分核定位信号,并且第二核定位信号是两组分核定位信号。
在方法的实施例中,单组分核定位信号是本领域已知的单组分核定位信号。在实施例中,单组分核定位信号是上文表1中列出的单组分核定位信号(SEQ ID NO:1-6)中的一种或其组合。
在方法的实施例中,两组分核定位信号是本领域已知的两组分核定位信号。在实施例中,两组分核定位信号是经典的两组分核定位信号。在实施例中,两组分核定位信号是上文表2中列出的两组分核定位信号(SEQ ID NO:7-9)中的一种或其组合。
在方法的实施例中,第一核定位信号是经典的两组分核定位信号(SEQ ID NO:7),并且第二核定位信号是SV40大T抗原核定位信号(SEQ ID NO:1)。
在方法的实施例中,第一核定位信号直接附接至Cas9效应蛋白。在实施例中,第一核定位信号经由接头附接至Cas9效应蛋白。在实施例中,第二核定位信号直接附接至Cas9效应蛋白。在实施例中,第二核定位信号经由接头附接至Cas9效应蛋白。
在使用接头的实施例中,接头是具有2至30个残基的肽接头。在实施例中,接头是具有2至20个残基的肽接头。在实施例中,接头是具有2至15个残基的肽接头。在实施例中,接头是具有2至10个残基的肽接头。在实施例中,接头是具有2至5个残基的肽接头。在实施例中,接头是经取代的或未经取代的C2-C20烷基、烯基或炔基链。
在方法的实施例中,Cas9效应蛋白在其N-末端包含核定位信号的多于一个拷贝。在实施例中,Cas9效应蛋白在其N-末端包含核定位信号的多于一种类型。在实施例中,Cas9效应蛋白在其C-末端包含核定位信号的多于一个拷贝。在实施例中,Cas9效应蛋白在其C-末端包含核定位信号的多于一种类型。
在方法的实施例中,蛋白质包含第一核定位信号的两个拷贝。在实施例中,蛋白质包含第一核定位信号的三个拷贝。在实施例中,蛋白质包含第二核定位信号的两个拷贝。在实施例中,蛋白质包含第二核定位信号的三个拷贝。
在方法的实施例中,包含第一和第二核定位信号的Cas9蛋白的Cas9部分可以衍生自本领域已知的任何Cas9效应子结构域。在实施例中,Cas9效应蛋白衍生自具有II-B型CRISPR系统的细菌物种。上文描述了合适的II-B型Cas9蛋白的实例。在实施例中,Cas9部分包含以1E-5的E值截止值匹配TIGR03031蛋白家族的结构域。在实施例中,位点特异性核酸酶包含以1E-10的E值截止值匹配TIGR03031蛋白家族的结构域。
在方法的实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少95%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少90%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少98%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与如图1和图2所示的SEQ ID NO:10-97中的任一个具有至少99%同一性的多肽序列。在实施例中,Cas9效应蛋白包含选自如图1和图2所示的SEQID NO:10-97中的任一个的多肽。
在方法的实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少95%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少90%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少98%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:71具有至少99%同一性的多肽序列。在实施例中,Cas9效应蛋白包含SEQ ID NO:71。
在方法的实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少90%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少95%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少98%同一性的多肽序列。在实施例中,Cas9效应蛋白包含与SEQ ID NO:98具有至少99%同一性的多肽序列。在实施例中,Cas9效应蛋白包含SEQ ID NO:98。
将本文引用的所有参考文献(包括专利、专利申请、论文、教科书等)以及其中引用的参考文献(如同它们还未曾引用过的程度)通过引用以其全文特此并入本文。
实例
实例1-Cas9是用于溶酶体降解的底物
将来自序列肠道宏基因组MH0245(MHCas9)的Cas9蛋白(如WO 2019099943中所述,将其通过引用特此并入本文)克隆到编码SV40单组分核定位信号(NLS;SEQ ID NO:1)的三个拷贝的质粒中,以形成3xSV40-MHCas9(一种具有与其N-末端附接的三个SV40 NLS的Cas9蛋白)。
将质粒转染到HEK293T细胞中。将细胞在DMEM+10%FBS培养基中培养24小时,然后添加以下任一细胞培养物中:1)浓度为5μM的蛋白酶体抑制剂MG132;2)浓度为20nM的溶酶体vATP酶抑制剂巴佛洛霉素A1;或3)浓度为10nM的核输出抑制剂来普霉素B。将未经处理的细胞用作对照。收获细胞,随后进行总蛋白质提取。
在转染前一天,将HEK293T细胞以每孔25,000个细胞的密度接种在96孔板上。接种后20小时,将细胞用以上所述的质粒转染。转染后48小时,向细胞中添加100μL的培养基。转染后60小时收获细胞。
收获后,使用蛋白质印迹分析3xSV40-MHCas9的总水平(与丝裂原活化蛋白激酶(MAPK)的印迹进行比较),以使条带强度归一化。印迹如图3A所示。对蛋白质印迹进行定量,并绘制归一化的蛋白质表达,如图3B所示。
如图3B所示,用巴佛洛霉素A1阻断溶酶体功能导致MHCas9水平升高,表明MHCas9在溶酶体中被降解。
实例2-向Cas9中添加NLS防止降解
将如实例1中所述的MHCas9克隆到编码核定位信号的质粒中,以形成四种不同的Cas9效应蛋白构建体:1)如实例1中所述的3xSV40-MHCas9;2)在C-末端处具有单个SV40NLS的MHCas9(MHCas9-NLSSV40);3)在N-末端处具有三个SV40 NLS并且在C-末端处具有单个SV40 NLS的MHCas9(3XNLSSV40-MHCas9-NLSSV40);和4)在N-末端处具有单个两组分NLS(SEQ ID NO:7)并且在C-末端处具有单个SV40 NLS的MHCas9(bpNLS-MHCas9-SLSSV40)。质粒表达绿色荧光蛋白(GFP),检测该绿色荧光蛋白用于转染的归一化。
如实例1中所述转染HEK293T细胞并使其生长,但不用任何抑制剂处理。收获细胞并进行蛋白质印迹,检测到的微管蛋白作为凝胶加载对照,并且GFP用于转染量的归一化。印迹如图4所示。可以看出,在Cas9的C-末端添加NLS增加了蛋白质在体内的稳定性。选择bpNLS-MHCas9-SLSSV40蛋白用于进一步研究,并命名为SpOT-ON。
实例3-在两个末端均具有NLS的Cas9构建体避免溶酶体降解
为了测试NLS对其他Cas9蛋白的影响,将酿脓链球菌Cas9(SpCas9)克隆到与实例2中的构建体4相同的载体中,以形成bpNLS-SpCas9-NLSSV40构建体。
表达SpOT-ON和bpNLS-SpCas9-NLSSV40的细胞要么不进行处理,要么使其在抑制剂MG132、巴佛洛霉素A1或来普霉素(浓度与在实例1中使用的相同)的存在下生长。如实例1中所述,收获细胞并使用MAPK进行蛋白质印迹以使条带强度归一化。SpOT-ON的印迹如图5A所示,bpNLS-SpCas9-NLSSV40的印迹如图5B所示。
从印迹中可以看出,无论样品是用抑制剂处理还是用实例1中未显著减缓降解的抑制剂(MG132和来普霉素B)处理,都能检测到相似水平的蛋白质。由另外的NLS信号提供的增强的核输入可能会防止细胞质中的蛋白质降解。此外,在N-末端和C-末端处添加NLS信号导致MHCas9和SPCas9的稳定性均增强,这表明该技术应普遍适用于增强所有类型的Cas9蛋白的稳定性。
实例4-SpOT-ON与未经修饰的Cas9具有相似的DNA切割活性
将SpOT-ON的DNA切割活性与缺乏NLS的Cas9进行比较,发现是相似的。
体外测量SpOT-On和酿脓链球菌(Streptococcus pyogenes)Cas9蛋白(SpyCas9)的切割活性。将靶向20nt前间区序列的Cas9核糖核蛋白(RNP)与荧光标记的靶DNA和缺乏前间区序列相邻基序(PAM)的加载对照混合。将反应物在37C下孵育,在不同时间点取出等分试样,将其淬灭并使用毛细管电泳解析。对消化的DNA部分进行定量,相对于加载对照和零时间点归一化,然后相对于时间作图。两种酶对靶DNA的消化程度相同。对数据(未显示)的分析确定了以下速率常数(k):SpyCas9,k=0.224和SpOT-ON,k=0.004。
结果表明,SpOT-On Cas9能够在体外消化靶向DNA,程度与SPyCas9相同。然而,从不同的速率常数中可以看出,SpOT-On Cas9的这种切割比SpyCas9发生得慢。
实例5-SpOT-ON与未经修饰的Cas9具有相似的编辑活性
将SpOT-ON的基因编辑活性与缺乏NLS的Cas9进行比较,发现是相似的。
比较了SpOT-ON和SpCas9的基因编辑活性。HEK293T细胞通过表达Cas9变体以及HEK3、HEK4、EMX1和FANCF的指导RNA的表达载体转染。CD34用作插入位点,STAT1用作缺失位点。将细胞培养72小时,然后裂解以获得DNA。进行深度扩增子测序以评估已发生的编辑。如图6所示,SpOT-ON和SpCas9的编辑效率相似。
实例6-确定SpoT-ON的最佳前间区序列长度
假设实例4中显示的SpOT-On Cas9对DNA的缓慢切割是由次优的sgRNA设计,特别是前间区序列长度引起的。对于由一系列靶向相同序列的具有不同前间区序列靶向序列长度的sgRNA形成的SpOT-On-Cas9 RNP,重复实例4的体外切割实验。
为了优化反应效率,使用实例4中描述的方法确定具有不同间隔子长度的指导RNA的切割活性,并作图。条形表示计算的速度常数,误差条表示拟合的标准误差。结果如图7所示。
如图7所示,靶向较短前间区序列(18-20nt)的SpOT-On-Cas9在DNA切割中效率较低。然而,具有较长指导的RNP消化DNA的速度快10-50倍,这表明SpOT-On Cas9的最佳活性需要至少21个核苷酸靶序列。
进行了进一步的研究以确定体内最佳前间区序列长度。在以下两个不同的靶位点处测试体内切割活性:EMX1和CD34。
在转染前一天,将HEK293T细胞以每孔25,000个细胞的密度接种在96孔板上。接种后20小时,将细胞用以上所述的质粒转染。转染后48小时,向细胞中添加100μL的培养基。转染后60小时使用QuickExtract DNA提取溶液(卢西根公司(Lucigen))收获细胞。进行深度靶向扩增子测序。图8中显示的条形图示出了映射读数中突变读数的平均百分比。重复次数n=3(将细胞分成三个储备液,然后分别转染和分析)。
如图8所示,SpOT-ON的最佳前间区序列长度在19-23个核苷酸之间,其中21个核苷酸显示出峰活性。
实例7-SpOT-ON显示脱靶DNA编辑减少
使用与实例5中描述的方法类似的方法比较SpOT-ON和SpCas9的基因编辑活性。HEK293T细胞通过表达Cas9变体以及HEK3、HEK4、EMX1和FANCF的指导RNA的表达载体转染。将细胞培养72小时,然后裂解以获得DNA。进行深度扩增子测序以评估已发生的编辑。使用Crispresso2汇总分析对脱靶编辑进行分析。分析的14个脱靶位点是由Tsai等人(NatBiotechnol.[自然生物技术]2015年2月;33(2):187-197)确定的那些。脱靶分析图如图9所示。
如图9所示,与SpCas9相比,SpOT-ON在脱靶位点显示出大大降低的编辑百分比,这表明SpOT-ON在区分靶上和脱靶序列方面更好。
实例8-脱靶DNA编辑的分析
进行了进一步的研究,以研究底物DNA中的错配如何影响DNA切割的动力学。产生了在靶序列中携带单个碱基对取代的DNA底物,以研究SpyCas9和SpOT-ON的特异性。对于PAM的位置1、2和3处完美匹配和错配的DNA底物,测量Cas9酶的活性。用最佳指导物如上文实例中所述进行实验。计算每种DNA底物的切割速度常数,并且绘制在图10中。
如图10所示,Cas9酶消化错配的DNA底物的速度比完美匹配的DNA底物慢。紧邻PAM的错配导致SpyCas9和SpOT-On Cas9的切割速度均显著降低。更多的远端错配仅略微减小Spy Cas9活性,而SpOT-On Cas9被抑制了至少10倍。这些数据表明,SpOT-On Cas9在体外是比Spy Cas9更具特异性的酶,这可能解释了SpOT-On Cas9在体内的低脱靶基因组编辑活性。
实例9-体内错配耐受性
在HEK293T细胞中用23个核苷酸的指导RNA测试EMX1的SpOT-ON错配编辑的体内错配耐受性。
在转染前一天,将HEK293T细胞以每孔25,000个细胞的密度接种在96孔板上。接种后20小时,将细胞用以上所述的质粒转染。转染后48小时,向细胞中添加100μL的培养基。转染后60小时使用QuickExtract DNA提取溶液(卢西根公司)收获细胞。进行深度靶向扩增子测序。图11中的条形图示出了映射读数中突变读数的平均百分比。重复次数n=3(将细胞分成三个储备液,然后分别转染和分析)。
从图11中可以看出,位置1-10(其中1最靠近PAM)处的错配是非耐受的,并且导致没有编辑或非常低的编辑(>0.7%)。位置11-21之间的错配显示出高达20%的中等编辑效率。位置22处的错配导致与没有错配的sgRNA类似的编辑效率(约55%)。
实例10-切割位点的DNA编辑与分析
进一步分析EMX和CD34基因座处的DNA编辑,以定性评估DNA修复结果。如实例9中所述接种细胞并使其生长。使用RIMA分析的扩增子测序的NGS结果显示在图12A(EMX1)、图12B(CD34)和图12C(利用SpCas9的CD34对照)中。
这些结果表明,在HEK293T细胞中,SpOT-ON切割DNA以产生3个核苷酸突出端。
实例11-敲入实验
进行实验以评估定向非同源末端连接(NHEJ)介导的在CD34和STAT1两个靶位点处具有平末端或不同突出端的寡核苷酸敲入的效率。将DNA PK(M9831/VX-984)抑制剂以1μM的终浓度添加到一半样品中作为NHEJ抑制剂,以证明正在发生NHEJ。比较SpOT-ON Cas9和SpCas9。如实例9中所述接种细胞并使其生长。使用深度靶向扩增子测序分析DNA。
CD34基因座处敲入的结果如图13所示。STAT1基因座处敲入的结果如图14所示。如图13和图14所示,SpOT-ON对其3个核苷酸5’突出端的优先底物(灰色框)显示出最佳活性,而SpCas9对1个核苷酸5’突出端的优先底物(白色框)显示出最佳活性。图显示了插入的两个潜在方向性,其中深灰色代表正向(预期)插入,浅灰色代表反向插入。如DNAPK柱所示,DNA-PK抑制剂处理完全抑制寡核苷酸供体插入,这证明敲入是NHEJ介导的。
从数据中可以看出,在用SpCas9或SpOT-ON Cas9引入双链断裂后,以正向和反向掺入平末端dsDNA寡核苷酸。当在寡核苷酸的两端引入3个核苷酸的短同源臂时,仍然可以看到经由NHEJ的插入。
SpOT-ON Cas9能够有效地靶向整合具有5’突出端(1bp)、3个核苷酸和4个核苷酸突出端的dsDNA寡核苷酸,其中以定向方式对3个核苷酸突出端整合的效率最高。SpCas9显示对具有1个核苷酸突出端的dsDNA整合效率高,而具有3个核苷酸或4个核苷酸突出端的dsDNA整合效率低。这些结果表明,SpOT-ON Cas9 DSB主要导致产生3个核苷酸的5’突出端,并且SpCas9显示出具有1个核苷酸突出端的交错切割。
对于SpCas9和SpOT-ON Cas9,具有3’突出端(3个核苷酸)的dsDNA寡核苷酸的协同效率低于5%。这进一步支持了产生5’突出端的理论。
实例12不同的SpOT-ON酶的比较
进行了通过在DNA结合位点附近的残基处引入单个氨基酸取代来改善SpOT-ON的基因组编辑效率的实验。DNA结合位点附近的SpOT-ON残基通过用Alpha Fold2(Jumper等人,Nature[自然]2021)模拟SpOT-ON结构来定义(参见表图16A)。选择残基的子集用于后续研究和诱变。例如,去除负电荷(天冬氨酸(ASP或D)或谷氨酸(GLU或E))和/或引入正电荷(精氨酸(ARG或R)或赖氨酸(LYS或K))以增加SpOT-ON复合物与其靶DNA的结合。SpOT-ON变体通过诱变产生,并且将其转染到细胞中,如实例5中所述。表3显示了测试对SpOT-ON活性影响的突变。总的来说,PAM相互作用区域(CTD结构域)附近以及SpOT-ON的REC3结构域中的突变显示出酶活性有所改善。
表4

Claims (124)

1.一种Cas9效应蛋白,其包含:
a)附接至该Cas9效应蛋白N-末端的第一核定位信号;和
b)附接至该Cas9效应蛋白C-末端的第二核定位信号。
2.如权利要求1所述的蛋白质,其中该第一核定位信号是单组分核定位信号。
3.如权利要求1所述的蛋白质,其中该第一核定位信号是两组分核定位信号。
4.如权利要求1至3中任一项所述的蛋白质,其中该第二核定位信号是单组分核定位信号。
5.如权利要求1至3中任一项所述的蛋白质,其中该第二核定位信号是两组分核定位信号。
6.如权利要求1所述的蛋白质,其中该第一核定位信号是两组分核定位信号,并且该第二核定位信号是单组分核定位信号。
7.如权利要求2、4或6中任一项所述的蛋白质,其中该单组分核定位信号是SV40大T抗原、核质蛋白、EGL-13、c-Myc、TUS蛋白核定位信号、或其组合。
8.如权利要求3、5或6中任一项所述的蛋白质,其中该两组分核定位信号是经典的两组分核定位信号。
9.如权利要求6所述的蛋白质,其中该第一核定位信号是经典的两组分核定位信号,并且该第二核定位信号是SV40大T抗原核定位信号。
10.如权利要求1至9中任一项所述的蛋白质,其中该第一核定位信号直接附接至该Cas9效应蛋白。
11.如权利要求1至9中任一项所述的蛋白质,其中该第一核定位信号经由接头附接至该Cas9效应蛋白。
12.如权利要求1至11中任一项所述的蛋白质,其中该第二核定位信号直接附接至该Cas9效应蛋白。
13.如权利要求1至11中任一项所述的蛋白质,其中该第二核定位信号经由接头附接至该Cas9效应蛋白。
14.如权利要求11或13所述的蛋白质,其中该接头是具有2至30个残基的肽接头。
15.如权利要求1至14中任一项所述的蛋白质,其中该蛋白质包含该第一核定位信号的两个拷贝。
16.如权利要求1至14中任一项所述的蛋白质,其中该蛋白质包含该第一核定位信号的三个拷贝。
17.如权利要求1至14中任一项所述的蛋白质,其中该蛋白质包含该第二核定位信号的两个拷贝。
18.如权利要求1至14中任一项所述的蛋白质,其中该蛋白质包含该第二核定位信号的三个拷贝。
19.如权利要求1至18中任一项所述的蛋白质,其中该Cas9效应蛋白包含与SEQ ID NO:10-97中的任一个具有至少95%同一性的多肽序列。
20.如权利要求1至18中任一项所述的蛋白质,其中该Cas9效应蛋白包含以1E-5的E值截止值匹配TIGR03031蛋白家族的结构域。
21.如权利要求1至18中任一项所述的蛋白质,其中该Cas9效应蛋白包含与SEQ ID NO:98具有至少90%同一性的多肽序列。
22.如权利要求21所述的蛋白质,其中该多肽含有一个或多个选自以下的修饰:N1164R、N1265R、N1300R、N1412R、N347R、N651A、D1266R、D309R、D345R、D487R、D607R、Q1129R、Q1381A、Q1381A、Q1381R、Q661A、Q713R、Q734R、E1032G、E1032R、E1409A、E436R、E611R、E691R、E697R、G1335R、L125R、L1264S、L1299S、K1031R、K490R、K615R、K656R、F636R、S1334A、S1334A、S1334R、S1380R、S1410R、S1413R、S634R、S638R、S711R、S1006R、S1017R、T1267A、T1267R、T551R、Y1338A、Y1338R、V1273S、V1274S、V486R、V644R、V736R和V736Y。
23.一种CRISPR-Cas系统,其包含:
a)Cas9效应蛋白,该Cas9效应蛋白包含:
i)附接至该Cas9效应蛋白N-末端的第一核定位信号;和
ii)附接至该Cas9效应蛋白C-末端的第二核定位信号;以及
b)指导多核苷酸,该指导多核苷酸包含指导序列并且与该Cas9效应蛋白形成复合物,其中该指导序列能够与真核细胞中的靶序列杂交。
24.一种CRISPR-Cas系统,其包含:
a)编码Cas9效应蛋白的核酸序列,该Cas9效应蛋白包含:
i)附接至该Cas9效应蛋白N-末端的第一核定位信号;和
ii)附接至该Cas9效应蛋白C-末端的第二核定位信号;以及
b)编码指导多核苷酸的核酸序列,该指导多核苷酸包含指导序列并且与该Cas9效应蛋白形成复合物,其中该指导序列能够与真核细胞中的靶序列杂交。
25.如权利要求24所述的系统,其中(a)和(b)的这些核苷酸序列在真核启动子的控制下。
26.如权利要求24所述的系统,其中(a)和(b)的这些核酸序列在单个载体中。
27.一种CRISPR-Cas系统,其包含一个或多个含有以下的载体:
a)与一个或多个编码Cas9效应蛋白的核苷酸序列可操作地连接的调节元件,该Cas9效应蛋白包含:
i)附接至该Cas9效应蛋白N-末端的第一核定位信号;和
ii)附接至该Cas9效应蛋白C-末端的第二核定位信号;以及
b)指导多核苷酸,该指导多核苷酸包含指导序列并且与该Cas9效应蛋白形成复合物,其中该指导序列能够与真核细胞中的靶序列杂交。
28.如权利要求27所述的系统,其中该调节元件是真核调节元件。
29.如权利要求23至28中任一项所述的系统,其中该第一核定位信号是单组分核定位信号。
30.如权利要求23至28中任一项所述的系统,其中该第一核定位信号是两组分核定位信号。
31.如权利要求23至30中任一项所述的系统,其中该第二核定位信号是单组分核定位信号。
32.如权利要求23至30中任一项所述的系统,其中该第二核定位信号是两组分核定位信号。
33.如权利要求23至28中任一项所述的系统,其中该第一核定位信号是两组分核定位信号,并且该第二核定位信号是单组分核定位信号。
34.如权利要求23至28中任一项所述的系统,其中该第一核定位信号和该第二核定位信号各自是两组分核定位信号。
35.如权利要求29、31或33中任一项所述的系统,其中该单组分核定位信号是SV40大T抗原、核质蛋白、EGL-13、c-Myc、TUS蛋白核定位信号、或其组合。
36.如权利要求30、32或33中任一项所述的系统,其中该两组分核定位信号是经典的两组分核定位信号。
37.如权利要求33所述的系统,其中该第一核定位信号是经典的两组分核定位信号,并且该第二核定位信号是SV40大T抗原核定位信号。
38.如权利要求23至37中任一项所述的系统,其中该第一核定位信号直接附接至该Cas9效应蛋白。
39.如权利要求23至37中任一项所述的系统,其中该第一核定位信号经由接头附接至该Cas9效应蛋白。
40.如权利要求23至39中任一项所述的系统,其中该第二核定位信号直接附接至该Cas9效应蛋白。
41.如权利要求23至39中任一项所述的系统,其中该第二核定位信号经由接头附接至该Cas9效应蛋白。
42.如权利要求39或41所述的系统,其中该接头是具有2至30个残基的肽接头。
43.如权利要求23至42中任一项所述的系统,其中该蛋白质包含该第一核定位信号的两个拷贝。
44.如权利要求23至42中任一项所述的系统,其中该蛋白质包含该第一核定位信号的三个拷贝。
45.如权利要求23至44中任一项所述的系统,其中该蛋白质包含该第二核定位信号的两个拷贝。
46.如权利要求23至44中任一项所述的系统,其中该蛋白质包含该第二核定位信号的三个拷贝。
47.如权利要求23至46中任一项所述的系统,其中该Cas9效应蛋白衍生自具有II-B型CRISPR系统的细菌物种。
48.如权利要求23至46中任一项所述的系统,其中该Cas9效应蛋白包含与SEQ ID NO:10-97中的任一个具有至少95%同一性的多肽序列。
49.如权利要求23至47中任一项所述的系统,其中该Cas9效应蛋白包含以1E-5的E值截止值匹配TIGR03031蛋白家族的结构域。
50.如权利要求23至49中任一项所述的系统,其中该Cas9效应蛋白包含与SEQ ID NO:98具有至少90%同一性的多肽序列。
51.如权利要求23至50中任一项所述的系统,其中该指导多核苷酸是RNA。
52.如权利要求51所述的系统,其中该指导序列的长度是19至30个碱基。
53.如权利要求51所述的系统,其中该指导序列的长度是19至25个碱基。
54.如权利要求51所述的系统,其中该指导序列的长度是21至26个碱基。
55.如权利要求23至54中任一项所述的系统,其中该指导多核苷酸进一步包含tracrRNA序列。
56.如权利要求23至55中任一项所述的系统,其中该Cas9效应蛋白产生粘性末端。
57.如权利要求56中任一项所述的系统,其中这些粘性末端包含具有1至10个核苷酸的单链多核苷酸突出端。
58.如权利要求56中任一项所述的系统,其中这些粘性末端包含具有2至6个核苷酸的单链多核苷酸突出端。
59.如权利要求57中任一项所述的系统,其中这些粘性末端包含具有3至5个核苷酸的单链多核苷酸突出端。
60.一种真核细胞,其包含如权利要求1至22中任一项所述的蛋白质。
61.一种真核细胞,其包含如权利要求23至59中任一项所述的系统。
62.一种递送颗粒,其包含如权利要求1至22中任一项所述的蛋白质。
63.一种递送颗粒,其包含如权利要求23至59中任一项所述的系统。
64.如权利要求63所述的递送颗粒,其中该Cas9效应蛋白和该指导多核苷酸以复合物存在。
65.如权利要求64所述的递送颗粒,其中该复合物进一步包含含有tracrRNA序列的多核苷酸。
66.如权利要求62至65中任一项所述的递送颗粒,其进一步包含脂质、糖、金属或蛋白质。
67.一种囊泡,其包含如权利要求1至22中任一项所述的蛋白质。
68.一种囊泡,其包含如权利要求23至59中任一项所述的系统。
69.如权利要求68所述的囊泡,其中该Cas9效应蛋白和该指导多核苷酸以复合物存在。
70.如权利要求68所述的囊泡,其进一步包含含有tracrRNA序列的多核苷酸。
71.如权利要求67至70中任一项所述的囊泡,其中该囊泡是外泌体或脂质体。
72.一种病毒载体,其包含如权利要求1至22中任一项所述的蛋白质。
73.一种病毒载体,其包含如权利要求23至59中任一项所述的系统。
74.如权利要求73所述的病毒载体,其进一步包含编码tracrRNA序列的核酸序列。
75.如权利要求72至74中任一项所述的病毒载体,其中该病毒载体是腺病毒颗粒、腺相关病毒颗粒或单纯疱疹病毒颗粒。
76.一种用于在真核细胞中提供靶序列的位点特异性修饰的方法,该方法包括:
a)将以下引入到该细胞中:
i)编码Cas9效应蛋白的核苷酸,该Cas9效应蛋白包含:
A)附接至该Cas9效应蛋白N-末端的第一核定位信号;和
B)附接至该Cas9效应蛋白C-末端的第二核定位信号;以及
ii)编码指导多核苷酸的核苷酸,该指导多核苷酸与该Cas9效应蛋白形成复合物并且包含指导序列,其中该指导序列能够与宿主多核苷酸中的靶序列杂交;
b)用该Cas9效应蛋白和该指导多核苷酸在该宿主多核苷酸中产生粘性末端;以及
c)
i)将(b)的这些粘性末端连接在一起,或
ii)将目的多核苷酸序列的3′端与一个粘性末端连接,并且将该目的多核苷酸序列的5’端与一个粘性末端连接;从而修饰该靶序列。
77.如权利要求76所述的方法,其中该第一核定位信号是单组分核定位信号。
78.如权利要求76所述的方法,其中该第一核定位信号是两组分核定位信号。
79.如权利要求76至78中任一项所述的方法,其中该第二核定位信号是单组分核定位信号。
80.如权利要求76至78中任一项所述的方法,其中该第二核定位信号是两组分核定位信号。
81.如权利要求76至80中任一项所述的方法,其中该第一核定位信号是两组分核定位信号,并且该第二核定位信号是单组分核定位信号。
82.如权利要求77、79或81中任一项所述的方法,其中该单组分核定位信号是SV40大T抗原、核质蛋白、EGL-13、c-Myc、TUS蛋白核定位信号、或其组合。
83.如权利要求78、80或81中任一项所述的方法,其中该两组分核定位信号是经典的两组分核定位信号。
84.如权利要求76至83中任一项所述的方法,其中该第一核定位信号和该第二核定位信号各自是两组分核定位信号。
85.如权利要求81所述的方法,其中该第一核定位信号是经典的两组分核定位信号,并且该第二核定位信号是SV40大T抗原核定位信号。
86.如权利要求76至85中任一项所述的方法,其中该第一核定位信号直接附接至该Cas9效应蛋白。
87.如权利要求76至85中任一项所述的方法,其中该第一核定位信号经由接头附接至该Cas9效应蛋白。
88.如权利要求76至87中任一项所述的方法,其中该第二核定位信号直接附接至该Cas9效应蛋白。
89.如权利要求76至87中任一项所述的方法,其中该第二核定位信号经由接头附接至该Cas9效应蛋白。
90.如权利要求87或89所述的方法,其中该接头是具有2至30个残基的肽接头。
91.如权利要求76至90中任一项所述的方法,其中该蛋白质包含该第一核定位信号的两个拷贝。
92.如权利要求76至90中任一项所述的方法,其中该蛋白质包含该第一核定位信号的三个拷贝。
93.如权利要求76至92中任一项所述的方法,其中该蛋白质包含该第二核定位信号的两个拷贝。
94.如权利要求76至92中任一项所述的方法,其中该蛋白质包含该第二核定位信号的三个拷贝。
95.如权利要求76至94中任一项所述的方法,其中该Cas9效应蛋白衍生自具有II-B型CRISPR系统的细菌物种。
96.如权利要求76至95中任一项所述的方法,其中该Cas9效应蛋白包含与SEQ ID NO:10-97中的任一个具有至少95%同一性的多肽序列。
97.如权利要求76至95中任一项所述的方法,其中该Cas9效应蛋白包含以1E-5的E值截止值匹配TIGR03031蛋白家族的结构域。
98.如权利要求76至97中任一项所述的方法,其中该指导多核苷酸是RNA。
99.如权利要求98所述的方法,其中该指导多核苷酸的长度是19至30个碱基。
100.如权利要求98所述的方法,其中该指导多核苷酸的长度是19至25个碱基。
101.如权利要求98所述的方法,其中该指导多核苷酸的长度是21至26个碱基。
102.如权利要求76至101中任一项所述的方法,其中该指导多核苷酸进一步包含tracrRNA序列。
103.如权利要求76至102中任一项所述的系统,其中该Cas9效应蛋白产生粘性末端。
104.如权利要求76至103中任一项所述的方法,其中这些粘性末端包含具有1至10个核苷酸的单链多核苷酸突出端。
105.如权利要求76至104中任一项所述的方法,其中这些粘性末端包含具有2至6个核苷酸的单链多核苷酸突出端。
106.如权利要求76至105中任一项所述的方法,其中这些粘性末端包含具有3至5个核苷酸的单链多核苷酸突出端。
107.如权利要求76至106中任一项所述的方法,其中这些粘性末端是平末端。
108.如权利要求76至106中任一项所述的方法,其中这些粘性末端具有5’单链多核苷酸突出端。
109.如权利要求76至106中任一项所述的方法,其中这些粘性末端具有3’单链多核苷酸突出端。
110.如权利要求76至109中任一项所述的方法,其中该真核细胞是动物或人细胞。
111.如权利要求76至109中任一项所述的方法,其中该真核细胞是人细胞。
112.如权利要求76至109中任一项所述的方法,其中该真核细胞是植物细胞。
113.如权利要求76至112中任一项所述的方法,其中该修饰是该靶序列的至少一部分的缺失。
114.如权利要求76至112中任一项所述的方法,其中该修饰是该靶序列的突变。
115.如权利要求76至112中任一项所述的方法,其中该修饰是将目的序列插入该靶序列中。
116.一种用于减少细胞中Cas9效应蛋白降解的方法,该方法包括
a)将第一核定位信号附接至该Cas9效应蛋白的N-末端;以及
b)将第二核定位信号附接至该Cas9效应蛋白的C-末端。
117.如权利要求116所述的方法,其中该第一核定位信号是单组分核定位信号。
118.如权利要求116所述的方法,其中该第一核定位信号是两组分核定位信号。
119.如权利要求116至118中任一项所述的方法,其中该第二核定位信号是单组分核定位信号。
120.如权利要求116至118中任一项所述的方法,其中该第二核定位信号是两组分核定位信号。
121.如权利要求116所述的方法,其中该第一核定位信号是两组分核定位信号,并且该第二核定位信号是单组分核定位信号。
122.如权利要求117、119或121中任一项所述的方法,其中该单组分核定位信号是SV40大T抗原、核质蛋白、EGL-13、c-Myc、TUS蛋白核定位信号、或其组合。
123.如权利要求118、1 20或121中任一项所述的方法,其中该两组分核定位信号是经典的两组分核定位信号。
124.如权利要求121所述的方法,其中该第一核定位信号是经典的两组分核定位信号,并且该第二核定位信号是SV40大T抗原核定位信号。
CN202280037340.4A 2021-05-27 2022-05-26 具有增强的稳定性的cas9效应蛋白 Pending CN117396602A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163193620P 2021-05-27 2021-05-27
US63/193620 2021-05-27
PCT/EP2022/064368 WO2022248645A1 (en) 2021-05-27 2022-05-26 Cas9 effector proteins with enhanced stability

Publications (1)

Publication Number Publication Date
CN117396602A true CN117396602A (zh) 2024-01-12

Family

ID=82117168

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280037340.4A Pending CN117396602A (zh) 2021-05-27 2022-05-26 具有增强的稳定性的cas9效应蛋白

Country Status (4)

Country Link
EP (1) EP4347805A1 (zh)
JP (1) JP2024518793A (zh)
CN (1) CN117396602A (zh)
WO (1) WO2022248645A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115716880A (zh) * 2022-12-07 2023-02-28 云舟生物科技(广州)股份有限公司 一种核定位荧光蛋白及其应用

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5543158A (en) 1993-07-23 1996-08-06 Massachusetts Institute Of Technology Biodegradable injectable nanoparticles
US6007845A (en) 1994-07-22 1999-12-28 Massachusetts Institute Of Technology Nanoparticles and microparticles of non-linear hydrophilic-hydrophobic multiblock copolymers
US5855913A (en) 1997-01-16 1999-01-05 Massachusetts Instite Of Technology Particles incorporating surfactants for pulmonary drug delivery
US5895309A (en) 1998-02-09 1999-04-20 Spector; Donald Collapsible hula-hoop
AU2002364927A1 (en) * 2001-07-10 2003-06-30 North Carolina State University Nanoparticle delivery vehicle
JP2008078613A (ja) 2006-08-24 2008-04-03 Rohm Co Ltd 窒化物半導体の製造方法及び窒化物半導体素子
CA2742954C (en) 2008-11-07 2018-07-10 Massachusetts Institute Of Technology Aminoalcohol lipidoids and uses thereof
US9193827B2 (en) 2010-08-26 2015-11-24 Massachusetts Institute Of Technology Poly(beta-amino alcohols), their preparation, and uses thereof
PL2691443T3 (pl) 2011-03-28 2021-08-30 Massachusetts Institute Of Technology Sprzężone lipomery i ich zastosowania
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
DE202013012241U1 (de) 2012-05-25 2016-01-18 Emmanuelle Charpentier Zusammensetzungen für die durch RNA gesteuerte Modifikation einer Ziel-DNA und für die durch RNA gesteuerte Modulation der Transkription
KR102210322B1 (ko) 2013-03-15 2021-02-01 더 제너럴 하스피탈 코포레이션 Rna-안내 게놈 편집의 특이성을 증가시키기 위한 rna-안내 foki 뉴클레아제(rfn)의 용도
US9234213B2 (en) 2013-03-15 2016-01-12 System Biosciences, Llc Compositions and methods directed to CRISPR/Cas genomic engineering systems
US20140349405A1 (en) 2013-05-22 2014-11-27 Wisconsin Alumni Research Foundation Rna-directed dna cleavage and gene editing by cas9 enzyme from neisseria meningitidis
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
CA3030587A1 (en) * 2016-07-15 2018-01-18 Salk Institute For Biological Studies Methods and compositions for genome editing in non-dividing cells
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
GB2572918B (en) 2016-12-23 2023-02-15 Harvard College Gene editing of PCSK9
CN106632693B (zh) * 2017-01-19 2021-05-25 上海科技大学 具有多个核定位序列的SpyCas9蛋白及其应用
IL269458B2 (en) 2017-03-23 2024-02-01 Harvard College Nucleic base editors that include nucleic acid programmable DNA binding proteins
CN111448313A (zh) 2017-11-16 2020-07-24 阿斯利康(瑞典)有限公司 用于改善基于Cas9的敲入策略的有效性的组合物和方法
US20210115420A1 (en) * 2018-05-01 2021-04-22 The Children's Medical Center Corporation Enhanced bcl11a rnp / crispr delivery & editing using a 3xnls-cas9
DE112020001342T5 (de) 2019-03-19 2022-01-13 President and Fellows of Harvard College Verfahren und Zusammensetzungen zum Editing von Nukleotidsequenzen

Also Published As

Publication number Publication date
JP2024518793A (ja) 2024-05-02
WO2022248645A1 (en) 2022-12-01
EP4347805A1 (en) 2024-04-10

Similar Documents

Publication Publication Date Title
US20200239863A1 (en) Tracking and Manipulating Cellular RNA via Nuclear Delivery of CRISPR/CAS9
AU2021200636B2 (en) Using programmable dna binding proteins to enhance targeted genome modification
JP7423520B2 (ja) Cas9ベースノックイン方針の効力を改善するための組成物及び方法
US20190300867A1 (en) Bypassing the pam requirement of the crispr-cas system
CA3077086A1 (en) Systems, methods, and compositions for targeted nucleic acid editing
CN111328290A (zh) 用于靶向核酸编辑的基于crispr/cas-腺嘌呤脱氨酶的组合物、系统和方法
US20190390229A1 (en) Gene editing reagents with reduced toxicity
CN117396602A (zh) 具有增强的稳定性的cas9效应蛋白
JP2024534207A (ja) キロ塩基スケールでのrnaガイドゲノムリコンビニアリング
EP4408993A1 (en) Methods for gene editing
US20220372522A1 (en) Compositions and methods for homology-directed recombination
CN117355607A (zh) 非病毒同源性介导的末端连接

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination