CN112424360A - 用固定的向导rna对生成基因编辑载体的方法 - Google Patents

用固定的向导rna对生成基因编辑载体的方法 Download PDF

Info

Publication number
CN112424360A
CN112424360A CN201980038633.2A CN201980038633A CN112424360A CN 112424360 A CN112424360 A CN 112424360A CN 201980038633 A CN201980038633 A CN 201980038633A CN 112424360 A CN112424360 A CN 112424360A
Authority
CN
China
Prior art keywords
sequence
dna
grna
vector
tracrrna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980038633.2A
Other languages
English (en)
Inventor
曼纽尔·考利希
伊凡·迪基奇
马丁·韦格纳
伊夫·马特斯
科拉尔伊卡·胡斯尼亚克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Goethe Universitaet Frankfurt am Main
Original Assignee
Goethe Universitaet Frankfurt am Main
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Goethe Universitaet Frankfurt am Main filed Critical Goethe Universitaet Frankfurt am Main
Publication of CN112424360A publication Critical patent/CN112424360A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2330/00Production
    • C12N2330/50Biochemical production, i.e. in a transformed host cell
    • C12N2330/51Specially adapted vectors

Landscapes

  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明涉及一种用于产生适用于基因编辑应用的载体构建体的新颖方法,该载体构建体包括一对固定的预定的可表达的向导RNA(gRNA)序列。本发明的方法允许容易地构建这样的载体,并且另外提供用于表达固定的gRNA对的载体文库。本发明的载体可以有利地用于切出更大的基因组DNA序列,或者替代地,用于在基因组中同时引入突变而不会丢失更大的基因组序列。因此,本发明的系统提供了许多用于基因组改变的分子遗传学方法。

Description

用固定的向导RNA对生成基因编辑载体的方法
技术领域
本发明涉及一种用于产生适用于基因编辑应用的载体构建体的新颖方法,该载体构建体包括一对固定的预定的可表达的向导RNA(gRNA)序列。本发明的方法允许容易地构建这样的载体,并且另外提供用于表达固定的gRNA对的载体文库。本发明的载体可以有利地用于切出更大的基因组DNA序列,或者可替代地,用于在基因组中同时引入突变而不会丢失更大的基因组序列。因此,本发明的系统提供了许多用于基因组改变的分子遗传学方法。
描述
最初在细菌和古细菌物种中发现了成簇的规则间隔的短回文重复序列(CRISPR)/Cas系统,作为对外来遗传物质(例如质粒和噬菌体)的防御机制。天然存在的CRISPR/Cas系统依赖于三个组件的表达:1)与靶序列互补的向导RNA序列;2)有助于将第三组件(内切核酸酶)募集到该位点的支架RNA。尽管在许多细菌和古细菌物种中,CRISPR/Cas系统用于降解外来遗传物质,但该系统已被适配用于多种原核和真核生物,并已用于许多方法,包括基因敲除、诱变和表达激活或抑制(Hsu,et al.Cell(2014)157(6):1262-1278)。在基因工程的CRISPR/Cas系统中,可以通过表达小向导RNA(sgRNA,或简称为向导RNA-gRNA)来避免对三个独立组件的需求,该向导RNA同时包含用于结合靶序列的CRISPR向导RNA序列和支架RNA,其一起模拟由单个向导RNA序列和支架序列形成的结构并且足以将内切核酸酶募集到合适的靶位点(Jinek,et al.Science(2012)337(6096):816-821)。用于Cas-gRNA复合物的成功DNA靶向的另一个前提条件是目标DNA中存在原间隔物相邻基序(PAM)DNA序列,其确切序列取决于细菌Cas酶。对于最广泛使用的化脓性链球菌(Streptococcus pyogenes)Cas9(SpCas9),此序列的格式为NGG,其中N可以是任何核苷酸。最值得注意的是,Cas酶可以在人类细胞中表达,并且通过提供人类DNA定向的gRNA,可以诱导无法修复的高度特异性的DNA双链断裂,从而导致插入和缺失(InDel)突变。InDel突变的表型从框内缺失到完整基因敲除不等。最近,已证明CRISPR/Cas系统可通过使用患者来源的干细胞和祖细胞有效纠正导致镰状细胞疾病的突变。因此,CRISPR/Cas系统是一种可编程的基因编辑工具,具有巨大的潜力,范围从标准细胞生物学到治疗应用。
单个遗传变化可用于生成控制良好的模型系统,但是这些不允许进行无偏(unbiased)筛选。为了进行遗传筛选,可以将多个gRNA序列组合以生成针对人类和其他基因组中特定区域的文库。这些基因筛选的主要优点是其应用无偏且易于使用。截至今天,仅公布了几个全基因组的CRISPR/Cas敲除筛选,但进行这些实验和报告相应结果的步伐已大大加快。除敲除筛选外,少数实验室还证明了全基因组CRISPR/Cas转录激活和抑制筛选的益处。这些筛选覆盖的区域包括耐药性、细胞生长、隐性和必需基因、长非编码RNA(lncRNA)以及NF-κB激活/抑制性基因、或转移诱导基因。
常规的合并gRNA克隆费时费力、容易出错,并导致试剂具有严重的序列偏倚和克隆伪影1。除了这些技术缺陷外,在应用CRISPR/Cas筛选领域还朝着生成单一和多重gRNA文库迈出了重要一步,从而允许生成复杂的文库,其中每个gRNA与所有gRNA随机组合(图1a)2。这种试剂的复杂性(c)是靶向第一个gRNA表达盒的n个寡核苷酸和靶向第二个gRNA表达盒的m个寡核苷酸的乘积。因此,随着gRNA数量的增加,这种gRNA文库的复杂性很快就变得对于经济上可行的筛选实验来说太大2。另外,并非在多重gRNA文库中所有可能的gRNA组合都具有生物学相关性。因此,通常需要在单个质粒上定义两个gRNA的确切组合(“固定对(fixed-pair)”)(图1a)。直到今天,还没有用于生成合并的定义的固定对基因扰动试剂的技术解决方案。
在单个质粒上预先确定两个或更多个gRNA的组合具有重大的科学意义,多种应用可从这种技术中受益匪浅:
DNA切除:两个gRNA可以同时诱导两个同步的DNA双链断裂,这些断裂位于紧密的二维或三维接近位置。接近会导致位于两个gRNA靶序列之间的DNA片段被切除(图1b)。这样,可以精确地切除编码和非编码遗传元件,从而研究它们的生物学功能以及相应DNA序列丢失的后果。
两个(或更多个)gRNA——一个靶标:为了更加自信地剖析靶标相关性,固定对3C试剂可将两个(或更多个)gRNA导向同一靶标,从而提高编辑事件(剪切、修饰等)的效率。(图1c)。
两个(或更多个)gRNA——两个(或更多个)靶标:固定的gRNA对可以精确地预先确定待分析的靶标对(或靶标群),从而能够直接剖析靶标与靶标之间的相互作用,而无需分析所有理论上可能的相互作用(图1c、d、e)。
CRISPR激活和抑制:为了诱导或阻断靶标转录,有效改变需要多个gRNA;因此,同一质粒上的多个定义的gRNA可提高激活或抑制率,同时保持低复杂度gRNA试剂。
药物功效和耐药性筛选:固定对3C试剂可使用两个(或更多个)gRNA来监测FDA批准药物或新药的功效或剖析其作用的分子机制或针对其的耐药性,而无需实际施加药物。
在下文中,将描述本发明的元素。这些元素与特定实施例一起列出,但是,应该理解,它们可以以任何方式和任何数量组合以创建其他的实施例。各种描述的示例和优选实施例不应被解释为将本发明限制为仅明确描述的实施例。该描述应被理解为支持并涵盖将两个或更多个明确描述的实施例组合或将一个或多个明确描述的实施例与任意数量的所公开和/或优选元素组合的实施例。此外,除非上下文另有指示,否则应认为本申请的描述中公开了本申请中所有描述的元素的任何排列和组合。
I.使用共价闭合环状(covalently closed circular,ccc)DNA生成gRNA载体和载 体文库
最近,发明人通过生成基于cccDNA的小RNA或表达载体文库,开发了用于生成更高阶gRNA文库的新系统。此方法主要包括以下步骤:
(a)提供单链(single stranded,ss)噬菌粒载体,其包含(i)至少一个小RNA/DNA表达盒,所述小RNA/DNA表达盒包含RNA/DNA启动子和空的靶标小RNA/DNA序列引入位点或小RNA/DNA编码序列和/或DNA/RNA核酸酶靶序列、或其部分序列,(ii)至少一个单链DNA的复制起点(ORI),例如噬菌体ORI,特别是f1-起点,以及
(b)提供至少一种诱变RNA或DNA引物,其中所述诱变RNA或DNA引物在3'至5'方向具有以下结构:第一同源区域、编码待表达的小RNA/DNA的靶序列区、以及第二同源区域,其中第一同源区域与在5'侧位于空的靶标小RNA/DNA序列引入位点或小RNA/DNA编码序列侧翼的ss-噬菌粒载体构建体的序列或其部分序列互补或能够退火至该序列,并且其中第二同源区域与在3'侧位于空的靶标小RNA/DNA序列引入位点或小RNA/DNA编码序列侧翼的ss-噬菌粒载体构建体的序列或其部分序列互补或能够退火至该序列,
(c)将至少一种诱变RNA或DNA引物退火至ss-噬菌粒载体构建体,并从中扩增共价闭合环状(ccc)-异源双链dsDNA,
(d)去除残留的野生型噬菌粒载体DNA。
该方法完全公开于国际专利申请号PCT/EP2017/084625中,该申请全文以引用方式并入本文。在比较例1中进一步描述了该方法。上述方法不仅可以用于生成高阶库,而且可以用于创建单个或多个(但不是高阶)载体。因此,在一些实施例中,本发明可以具体地指如PCT/EP2017/084625中所公开的方法的步骤或材料,在下文中与本发明相关地重复。
在本文公开的发明的上下文中,可以应用去除残留的野生型噬菌粒载体DNA核酸内切酶消化。例如,在其至少一个小RNA/DNA表达盒内在单链(ss)噬菌粒载体构建体中提供了核酸内切酶靶位点。优选地,核酸内切酶靶位点位于单链(ss)噬菌粒载体构建体中,在与诱变DNA引物的第一同源区域互补的区域和与诱变引物的第二同源区域互补的区域之间。因此,核酸内切酶靶位点位于3C合成中没有重复的位置,因此仅存在于野生型ss-噬菌粒载体构建体中。因此,该方法在此包括在步骤(d)中,用对靶位点特异的核酸内切酶酶促消化3C DNA。例如,在一些实施方案中,使用限制性内切酶及其靶位点作为核酸内切酶。示例性限制酶及其靶位点是I-PpoI、SmaI、HpaI、I-SceI或I-CeuI。可以使用在模板ss DNA中或在引入的序列I中都不会发生诱变引物的任何限制性识别位点。除了使用限制性核酸内切酶以外,下列任何一种酶都可用于去除残留的野生型质粒:I-CeuI,I-PpoI,I-SceI,所有归巢内切核酸酶都是优选的,所有非归巢内切核酸酶,基因扰动靶序列(例如TALEN、ZFN、CRISPR/Cas和类似的酶)的使用,原核和/或真核有毒核苷酸序列的使用(其目的是抑制此类序列的扩增),以及同源性和/或基于重组的克隆序列的使用。
去除野生型DNA载体的另一种可能性是使用Kunkel方法。因此,通过一种产生小RNA/DNA表达(或编码)载体的方法、或一种将小RNA/DNA编码序列引入载体的方法,使用Kunkel用于诱变的方法(Kunkel方法),本发明解决了上述问题。因此,优选的方面涉及一种使用Kunkel方法或Kunkel诱变将小RNA/DNA序列引入载体的方法。在本发明的上下文中,Kunkel方法或Kunkel诱变是指以下程序:将待突变的DNA片段插入噬菌粒(任何含有f1 ori的载体,例如M13mp18/19),然后转化为缺乏两种酶(即dUTPase(dut)和尿嘧啶脱糖苷酶(ung))的大肠杆菌菌株。两种酶都是DNA修复途径的一部分,该途径通过自发地将dCTP脱氨为dUTP保护细菌染色体免受突变。dUTPase缺乏会阻止dUTP分解,从而导致细胞中的dUTP含量很高。尿嘧啶脱糖苷酶缺乏阻止了尿嘧啶从新合成的DNA中去除。由于双突变大肠杆菌复制了噬菌体DNA,因此其酶机制可能误掺入了dUTP而不是dTTP,从而导致了含有一些尿嘧啶的单链DNA(ssUDNA)。从释放到培养基中的噬菌体中提取ssUDNA,然后将其用作诱变的模板。包含所需核苷酸序列突变或变化的寡核苷酸用于引物延伸。形成的异源双链DNA由一条含有dUTP的亲本非突变链和一条含有dTTP的突变链组成。然后将DNA转化到带有野生型dut和ung基因的大肠杆菌菌株中。在此,含尿嘧啶的亲本DNA链被降解,因此几乎所有的所得DNA均由突变链组成。本发明的方法特别适合于将向导RNA序列引入基因组编辑载体中以用于靶向基因组编辑。
在本发明的上下文中,“Kunkel方法”是这样的方法,其包括使用单链尿嘧啶DNA(优选环状单链尿嘧啶DNA)作为模板,用突变引物进行扩增。“尿嘧啶”是指在核苷酸中包含一个或多个尿嘧啶碱基的任何DNA分子。
在先前的发明中,公开了一种用于产生基于共价闭合环状(ccc)DNA的小RNA/DNA表达载体或载体文库的方法,该方法包括以下步骤:
(a)提供包含至少一个尿嘧啶碱基和/或DNA/RNA核酸酶靶位点的单链(ss)噬菌粒载体构建体;ss-噬菌粒载体构建体包含(i)至少一个小RNA/DNA表达盒,其包含RNA/DNA启动子和空的靶标小RNA/DNA序列引入位点或小RNA/DNA编码序列、或其部分序列,(ii)至少一个单链DNA的复制起点(ORI),例如噬菌体ORI,特别是f1-起点,以及
(b)提供至少一种诱变DNA引物,其中所述诱变DNA引物在3'至5'方向具有以下结构:第一同源区域、编码待表达的小RNA/DNA的靶序列区、以及第二同源区域,其中第一同源区域与在5'侧位于空的靶标小RNA/DNA序列引入位点或小RNA/DNA编码序列侧翼的ss-噬菌粒载体构建体的序列或其部分序列互补或能够退火至该序列,并且其中第二同源区域与在3'侧位于空的靶标小RNA/DNA序列引入位点或小RNA/DNA编码序列侧翼的ss-噬菌粒载体构建体的序列或其部分序列互补或能够退火至该序列,
(c)将至少一种诱变DNA引物退火至ss-噬菌粒载体构建体,并扩增共价闭合环状(ccc)-异源双链dsDNA,
(d)用不含尿嘧啶的互补DNA链替换ccc-异源双链dsDNA中的含尿嘧啶的链,以获得基于cccDNA的小RNA/DNA表达载体或载体文库。
在任何情况下,本文中的术语“噬菌粒”应指已被转化为质粒的噬菌体基因组。
在本发明和本公开的一些优选实施方案中,单链(ss)噬菌粒载体构建体在其至少一个小RNA/DNA表达盒中还包含限制性内切酶识别位点(限制性位点)。优选地,限制性位点位于单链(ss)噬菌粒载体构建体中,在与诱变DNA引物的第一同源区域互补的区域与与诱变引物的第二同源区域互补的区域之间。因此,限制位点位于3C合成中没有重复的位置,因此仅存在于含尿嘧啶的ss-噬菌粒载体构建体中。该实施方案允许对残留的尿嘧啶野生型DNA进行额外的消化。因此,一个实施方案中的方法还包括步骤(c)和(d)之间的步骤(c`),其包括用能够选择性地在限制位点引入双链断裂的限制酶酶解3C DNA。在实施方案的上下文中,使用具有在基因组中很少发现的识别位点的限制性位点及其相应的酶。示例性限制酶及其靶位点是I-PpoI、SmaI、HpaI、I-SceI或I-CeuI。可以使用在模板尿嘧啶单链DNA中不存在的任何限制性识别位点。除了使用限制性核酸内切酶外,以下任何一种酶都可用于去除残留的野生型质粒:I-CeuI,I-PpoI,I-SceI,所有归巢核酸内切酶都是优选的,所有非归巢核酸内切酶,基因扰动靶序列(例如TALEN、ZFN、CRISPR/Cas和类似的酶)的使用,原核和/或真核有毒核苷酸序列的使用(其目的是抑制此类序列的扩增),以及同源性和/或基于重组的克隆序列的使用。
在一个优选的实施方案中,本发明提供了如前所述的单链(ss)噬菌粒载体构建体,其包含至少两个小RNA/DNA表达盒,更优选至少3、4、5、6、7、8、9、10、15、20、30和更多个如上文所述的小RNA/DNA表达盒。在被称为“多重”的该实施方案中,载体分子能够产生大量小RNA/DNA同时表达。
在另一个实施方案中,所述至少一个小RNA/DNA表达盒是至少两个或更多个小RNA/DNA表达盒(gRNA或其他小RNA/DNA的多重表达)。在其他优选的实施方案中,在两个或更多个小RNA/DNA表达盒中使用的限制位点是相同、相似或不同的。
如本文所用,术语“共价闭合环状DNA”或“cccDNA”是指与线性DNA分子(例如包含缺口或包含游离的3'或5'端的真核染色体DNA或细菌染色体DNA)相比呈圆形形式的DNA分子。此外,上述参考DNA分子的环状结构是共价封闭的。cccDNA是本领域众所周知的,并且例如在KG.Hardy(ed)"Plasmids,a practical approach",IRL Press Oxford U.K.,Washington D.C.,U.S.A.,1987中有进一步描述。
如本文所用,术语“载体文库”是指多个载体(或质粒),其包含插入RNA/DNA表达盒中的待表达的多个独特的小RNA/DNA序列(例如siRNA、shRNA、gRNA或类似序列)。在优选的实施方案中,载体文库包含至少101或102个、更优选至少103个、甚至更优选至少104个、再进一步更优选至少105个、106个、107个、108个或109个独特的载体序列(意为每个载体或质粒中包含的RNA/DNA序列)。
在本发明的上下文中,小RNA应理解为包括siRNA、shRNA、抗miR、向导RNA(gRNA)或引导DNA(gDNA)。最优选的是,小RNA是gRNA,并且其中ss-噬菌粒载体构建体进一步包括但不限于存在基因组编辑核酸酶表达序列,其任选地可操作地连接至启动子。应当理解,本发明涉及固定gRNA对载体的提供,小RNA应该是gRNA或sgRNA。
在某些方面,本公开提供了一种用于产生小RNA/DNA表达载体的高阶文库的新方法。在本发明的上下文中,术语“高阶”应意指该文库包含多种载体,这些载体在由/通过载体表达的小RNA/DNA的序列上不同。本方法使用诱变DNA引物来将这样的序列引入选择的载体。因此,在一些实施方案中,所述至少一种诱变DNA引物是至少两种诱变DNA引物,优选至少三种,更优选至少4、5、6、10、50、100、1000、104、105、106、107、108、109、1010、1011或1012种诱变DNA引物,其中cccDNA的每个种类(species)在所选的小RNA/DNA编码序列中具有不同的序列。
在本发明的一些实施方案中,通过将至少一种或多种IUPAC编码的碱基(例如简并碱基)引入选择的小RNA/DNA编码序列(包含在本发明的诱变DNA引物中)来提供多个诱变DNA引物序列种类。“简并碱基”或“简并位置”在序列命名法中称为“n”。在本发明的上下文中,简并碱基不是核苷酸碱基的类型,而是表示在制备具有基本相同序列的核酸时,所述序列中的位置“n”允许在这个位置存在多种碱基的可能性。因此,具有至少一个“n”位的序列的核酸的制备是指在n位具有腺嘌呤、鸟嘌呤、胸腺嘧啶或胞嘧啶(等概率)的核酸的混合物。例如,如果合成寡核苷酸,则可以使用含有等量的腺嘌呤、鸟嘌呤、胸腺嘧啶和胞嘧啶的核苷酸作为供体核苷酸在一个或多个位置进行反应。在这样的反应中,这些核苷酸中的每一个都有相等的机会被添加到正在生长的寡核苷酸链中,因此允许在位置“n”处产生具有不同碱基的分子的混合物。如果只打算在一个位置引入两个或三个不同的碱基,则可以使用相同的原理。在本公开中,使用以下命名法:R=G、A(嘌呤),Y=T、C(嘧啶),K=G、T(酮基),M=A、C(氨基),B=G、T、C(除A之外的所有元素),D=G、A、T(除C之外的所有元素),H=A、C、T(除G之外的所有元素),V=G、C、A(除T之外的所有元素)并且N=A、G、C、T(任意)。
在本发明的其他实施方案中,小RNA/DNA编码序列的长度为至少10个核苷酸至200个核苷酸,更优选10至100个,更优选10至50个,更优选10至30个,更优选15至30个,更优选15至25个,最优选17至23个,最优选约20个。本领域技术人员可以根据待表达的小RNA/DNA的类型来调节序列长度。向导RNA和shRNA或siRNA的优选长度是不同的,但是是技术人员众所周知的。
本公开内容的诱变DNA引物包含侧翼同源区,所述侧翼同源区用于将引物用在本发明的反应中使用的ss环状尿嘧啶载体分子退火。因此,侧翼区的长度优选为允许诱变DNA引物在适合于引物延伸的条件下退火至模板的长度。3′或5′同源区的长度可以相同或不同。在一些实施方案中,每个同源区的长度为至少5个核苷酸,优选至少10个核苷酸,更优选5至40个核苷酸,最优选10至30个、或10至20个,最优选13至18个,甚至更优选约15个核苷酸。最优选的是5-40个核苷酸。
在本发明方法的一些实施方案中,通过以下额外的方法步骤提供单链(ss)噬菌粒载体构建体:
(aa)在缺乏dUTPase和/或尿嘧啶糖基化酶、和/或其同源物、旁系同源物或直向同源物的细菌菌株中,优选在CJ236菌株中,扩增相同序列的dsDNA噬菌粒载体,以获得含有尿嘧啶的异源双链dsDNA噬菌粒载体,以及
(bb)产生包含含尿嘧啶的ssDNA的噬菌体颗粒,以及
(cc)从所述噬菌体颗粒中纯化所述含尿嘧啶的ssDNA,以获得包含至少一个尿嘧啶碱基的ss-噬菌粒载体构建体。
在根据本发明各个方面优选的另一个实施方案中,所述缺乏dUTPase和/或尿嘧啶糖基化酶、和/或其同源物、旁系同源物或直向同源物的细菌菌株,优选CJ236菌株,其包含辅助噬菌粒,或其中在步骤(bb)中所述缺乏dUTPase和/或尿嘧啶糖基化酶、和/或其同源物、旁系同源物或直向同源物的细菌菌株、优选CJ236菌株感染了辅助噬菌体,其中所述辅助噬菌粒或辅助噬菌体优选为M13K07。
在一些实施方案中,优选地,通过在具有功能性dUTPase和/或尿嘧啶糖基化酶活性的细菌(例如XL1或SS320)中转化和扩增所述ccc-异源双链dsDNA,从而执行根据I的产生文库载体的方法的步骤(d),以获得所述cccDNA。
在本发明的一些实施方案中,步骤(c)中共价闭合环状(ccc)-异源双链dsDNA的扩增是通过使用具有DNA聚合酶活性的酶进行的,该酶例如是T7 DNA聚合酶,任选地与DNA连接酶结合,例如T4 DNA连接酶或其替代物,这对于本领域技术人员而言是已知的。
在另一方面,通过提供根据本文公开的本发明的方法产生的载体或载体文库来解决本发明的目的。根据本发明产生的载体文库的特征优选在于包含至少106个、更优选107、108、最优选109个不同种类的本文所述的载体序列。
此外,提供了全基因组筛选细胞表型的方法,该方法包括使用根据本发明的方法产生的载体文库。
本发明的筛选方法可以包括以下步骤:将本发明的载体文库——特别是全基因组文库——导入靶细胞群,并使用任何感兴趣的测定对转导的细胞进行表型化。在下一步中,可以分析任何具有目的表型的细胞的转导gRNA或RNAi的身份,从而鉴定参与表型生成的基因或基因组区域。例如,可以将细胞与细胞死亡诱导剂接触,并对存活的细胞分析转导的3C载体,从而鉴定引起对细胞死亡诱导剂的抗性的遗传扰动。
在本发明的另一方面,提供了一种用于执行如上所述的方法的试剂盒,该试剂盒包括
(a)噬菌粒载体构建体,其包含
(i)至少一个向导RNA(gRNA)/向导DNA(gDNA)表达盒,其包含gRNA/gDNA启动子、空的gRNA/gDNA靶向序列引入位点或gRNA/gDNA靶向序列
(ii)至少一个噬菌体复制起点,以及
(iii)至少一个包含在启动子序列的控制下编码基因组编辑核酸酶的序列的表达盒;
(b)DNA聚合酶,任选地DNA连接酶;
(c)具有功能性dUTPase和/或尿嘧啶糖基化酶活性的细菌细胞的制剂,
(d)以及任选的使用本发明试剂盒的说明。
在一些实施方案中,DNA聚合酶是T7 DNA聚合酶,和/或DNA连接酶是T4 DNA连接酶,或其任何通常已知的替代物。
在本发明的其他实施方案中,本发明的噬菌粒载体构建体是包含至少一个尿嘧啶碱基的单链(ss)噬菌粒载体构建体。
在其他实施方案中,噬菌粒载体是dsDNA载体。
在一些实施方案中,本发明的试剂盒可以包含缺乏dUTPase和/或尿嘧啶糖基化酶、和/或其同源物、旁系同源物或直向同源物的细菌细胞(优选CJ236菌株)的制备物、样品或培养物。这样的菌株在相关领域中是众所周知的。
在与本发明的试剂盒有关的其他实施方案中,细菌细胞进一步包含/含有辅助噬菌粒,优选M13K07。
在本发明的其他实施方案中,根据本发明的试剂盒进一步包含辅助噬菌粒或辅助噬菌体的制剂,其中所述辅助噬菌粒或辅助噬菌体优选是M13K07颗粒。
II.使用cccDNA生成固定对gRNA载体和载体文库
对于本发明,一个特别的目的是允许容易且快速地产生包含两个或更多个可表达的gRNA序列(“固定对”)的gRNA载体。为了解决该问题,发明人应用并改变了上述基于cccDNA和Kunkel的方法。当然,在技术上合理的情况下,以上公开内容(特别是任何定义)同样适用于本发明的特定方面和实施例的以下描述。
在本发明的上下文中,术语“固定对”应指两个或更多个显著且不同的小RNA序列,特别是适用于基因组的靶向编辑(基于CRISPR的基因组编辑)的gRNA序列。根据本发明的固定对优选地涉及多个这样的序列,例如2、3、4、5、6、7、8或更多个小RNA序列。在一些优选的方面和实施方案中,该术语涉及两个这样的序列。
在第一方面,本发明的上述目的通过一种核酸得以解决,该核酸包含与tracrRNA的各个野生型序列相比具有50%至95%的序列同一性的经修饰的tracrRNA序列,其中与野生型tracrRNA序列相比,经修饰的tracrRNA序列包含至少一个、优选至少两个或三个序列变异。发明人已经开发了多种非野生型tracrRNA序列,其显示出改进的特性,例如当克隆成转化的或反向的重复序列时折叠成空间上不利的三维结构的能力降低。
如本文所用,术语“tracrRNA”是指通过部分互补区域与crRNA序列缔合并起着将Cas9核酸酶或CAS9相关核酸酶或蛋白质募集至原间隔子基序的作用的反式激活RNA。在一个实施方案中,tracrRNA的长度为至少50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、或更多个核苷酸。在一个实施方案中,tracrRNA的长度为约85个核苷酸。
有时,crRNA和tracrRNA被工程化为一个多核苷酸序列,其在此被称为“单向导RNA”或“sgRNA”。sgRNA的crRNA等效部分被工程化来引导Cas9核酸酶以靶向任何所需的原间隔子基序。在一个实施方案中,sgRNA的tracrRNA等效部分被工程化为长度为至少50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100或更多个核苷酸。
原间隔子基序与短的原间隔子相邻基序(PAM)相邻,后者在募集Cas9/RNA复合体中起作用。Cas9多肽识别Cas9多肽特有的PAM基序。因此,CRISPR/Cas9系统可用于靶向和切割双链多核苷酸序列的任一或两条链,所述双链多核苷酸序列的侧翼是对特定Cas9多肽特异的特定3'PAM序列。可以使用生物信息学或使用实验方法来识别PAM。Esvelt et al.,2013,Nature Methods.10(11):1116-1121,其通过引用整体并入本文。
在一些实施方案中,根据I和II的本发明的方法用于产生适合基因组编辑的载体。这样的基因组编辑载体通常以向导RNA表达盒的存在为特征,所述向导RNA表达盒包含用于引入选择的gRNA序列的位点,其将基因组编辑复合物引导至基因组中的靶位点。这样,gRNA表达盒既包含用于靶向的gRNA部分,又包含与基因组编辑核酸酶(Cas)结合的gRNA片段。gRNA表达盒通常与RNA启动子(例如人或小鼠U6启动子或人7SK启动子或小鼠H1启动子)可操作地连接(转录控制)。但是,其他RNA启动子是本领域技术人员已知的。基因组编辑载体通常进一步包括可表达的基因组编辑核酸酶,例如Cas9。关于根据方面II的本发明,下面在此提供进一步的公开。
如本文所用,术语“向导RNA”通常是指可以结合Cas蛋白并帮助将Cas蛋白靶向靶多核苷酸(例如DNA或RNA)内的特定位置的RNA序列或分子(或一组RNA分子的集合)。向导RNA可以包含crRNA区段和tracrRNA区段。如本文所用,术语“crRNA”或“crRNA区段”是指RNA分子或其部分,其包括靶向多核苷酸的向导序列、茎序列以及任选地5'突出端序列。术语“tracrRNA”或“tracrRNA区段”在下文进一步定义,是指包括蛋白质结合区段(例如,蛋白质结合区段能够与CRISPR相关蛋白(例如Cas9)相互作用)的RNA分子或其部分。术语“向导RNA”还涵盖单向导RNA(sgRNA),其中crRNA片段和tracrRNA片段位于同一RNA分子中。术语“向导RNA”也共同包括两个或更多个RNA分子的组,其中crRNA区段和tracrRNA区段位于分开的RNA分子中。向导RNA的其他优选结构和实施方案在下文描述。
术语“支架”是指向导RNA分子的部分,其包含在天然生物物种中基本相同或高度保守的序列。支架包括tracrRNA区段和crRNA区段的一部分,而不是crRNA片段的5'末端之处或附近的多核苷酸靶向向导序列,不包括包含在天然crRNA和tracrRNA中不保守的序列的任何非天然部分。
本发明的各个实施方案和方面的基因组编辑载体可以编码f1噬菌体复制起点、RNA聚合酶启动子、用于CRISPR/Cas系统的向导RNA支架、RNA引导的核酸酶、或其任何其他合适的替代物。优选的构建体是基于慢病毒的构建体。可以在本发明的上下文中使用或可以用作开发其他基因组编辑载体的蓝图的本领域已知的标准CRISPR/Cas载体是称为pLentiCRISPR、pLentiCRISPRv2或pLentiGuide的载体。
在一些实施方案中,经修饰的tracrRNA序列和野生型tracrRNA序列对RNA/DNA或对基因组编辑核酸酶的结合亲和力彼此相差不超过50%、更优选20%、更优选10%、5%、3%、最优选1%。
如本文所用,术语“CRISPR核酸酶”是指衍生自天然存在的Cas核酸酶的重组蛋白,其具有核酸酶或切口酶活性,并且与本发明的gRNA一起起作用以在感兴趣的靶标(例如DYS基因)中引入DSB(或一个或两个SSB)。在实施方案中,CRISPR核酸酶是SpCas9。在实施方案中,CRISPR核酸酶是Cpf1。在其他实施方案中,CRISPR核酸酶是SaCas9。CRISPR核酸酶也可以是TALEN酶。在另一个实施方案中,CRISPR核酸酶是具有切口酶活性的Cas9蛋白。如本文所用,术语“Cas9切口酶”是指衍生自天然Cas9的重组蛋白,其具有被灭活的两个核酸酶结构域之一,使得其将单链断裂(SSB)引入DNA中。它可以是RuvC或HNH域。在另一个实施方案中,Cas蛋白是与二聚化依赖性FoKI核酸酶结构域融合的dCas9蛋白。以下表1中提供了可根据本发明使用的示例性CRISPR核酸酶。Cas9的变体可以是通过蛋白质工程或通过随机诱变(即,是非天然存在的)获得的Cas9核酸酶。这样的Cas9变体保持功能性并且可以通过天然存在的Cas9的(例如化脓性链球菌的)氨基酸序列的突变(缺失、插入和/或取代)来获得。
CRISPR核酸酶(例如Cas9/核酸酶)在PAM序列上游切割3-4bp。另一方面,CRISPR核酸酶(例如Cpf1)产生5'突出端。切割发生在目标(+)链上的PAM之后19bp以及相反链上的23bp处(62)。使用野生型Cas9可能会有一些脱靶DSB。脱靶作用的程度取决于许多因素,包括:脱靶位点与中靶位点相比同源性有多紧密,特异性位点序列,以及核酸酶和向导RNA(gRNA)的浓度。这些考虑仅在PAM序列与几乎同源的靶位点紧邻时才重要。仅存在额外的PAM序列应不足以生成目标DSB。在PAM之前或之后,需要与原间隔子具有广泛的同源性。
表1:来自不同物种的CRISPR核酸酶系统的非穷举列表。还包括识别替代的PAM序列的工程变体(请参阅Kleinstiver,BP.et al.(2015).Broadening the targeting rangeof Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition.NatBiotechnol 33(12):1293-1298.)
CRISPR核酸酶 PAM序列
Streptococcus pyogenes(SP);SpCas9 NGG+NAG
SpCas9 D1135E变体 NGG(减少的NAG结合)
SpCas9 VRER变体 NGCG
SpCas9 EQR变体 NGAG
SpCas9 VQR变体 NGAN or NGNG
Staphylococcus aureus(SA);SaCas9 NNGRRT或NNGRR(N)
SaCas9 KKH变体 NNNRRT
Neisseria meningitidis(NM) NNNNGATT
Streptococcus thermophilus(ST) NNAGAAW
Treponema denticola(TD) NAAAAC
AsCpf1 TTTN
LbCpf1 TTTN
在一些优选的实施方案中,本发明的经修饰的tracrRNA序列包含根据SEQ ID NO:8-10中任一项的核苷酸序列。
在本发明的上下文中,所述至少一种序列变异是至少一个核酸残基的缺失、取代、插入、倒置、添加或化学修饰。
在另一方面,本发明提供了一种用于产生经修饰的tracrRNA序列的方法,该方法包括以下步骤:
a)分析与野生型tracrRNA复合的RNA/DNA或基因组编辑核酸酶的结构,
b)在野生型tracrRNA序列中鉴定至少一个与RNA/DNA或基因组编辑核酸酶不接触的残基,优选至少2个、更优选至少3个与RNA/DNA或基因组编辑核酸酶不接触的残基,以及
c)突变与RNA/DNA或基因组编辑核酸酶不接触的所述至少一个残基、优选至少2个、更优选至少3个残基,以及
从而获得经修饰的tracrRNA序列,其与野生型tracrRNA序列具有50%至95%的序列同一性,并且其中与野生型tracrRNA序列的结合亲和力相比,所述经修饰的tracrRNA序列保持至少50%、更优选80%、更优选90%、95%、97%、最优选99%的与RNA/DNA或基因组编辑核酸酶的结合亲和力。
例如,将tracrRNA序列与各自的CRISPR核酸酶复合,然后例如通过X射线晶体学、NMR光谱和双极化干涉术进行结构分析,以确定结合至其tracrRNA的核酸酶的结构。
优选地,与tracrRNA的各个野生型序列相比,如此产生的突变的tracrRNA序列在序列上50%(优选60%、70%、80%、85%或90%)至95%相同。
在另一方面,本发明的目的通过一种用于产生用于表达固定的向导RNA对的共价闭合环状(ccc)DNA载体的方法来解决,该方法包括以下步骤:
(a)提供受体载体,其包含两个外向(extraverted)[表达方向彼此朝向外定向]的gRNA表达盒,其中每个gRNA表达盒包含gRNA占位符序列(placeholder sequence)和tracrRNA(sgRNA)序列,
(b)提供按此顺序包含以下序列的诱变DNA引物
i.能够结合第一gRNA表达盒的第一同源区域,
ii.待表达的第一预定gRNA序列,
iii.接头序列,
iv.待表达的第二预定gRNA序列,
v.能够与第二gRNA表达盒结合的第二同源区域,
(c)使用所述受体载体和所述诱变DNA引物产生cccDNA载体,
(d)将包含两个外向RNA启动子序列的启动子片段引入cccDNA载体的接头序列中,以获得用于表达固定的向导RNA对的cccDNA载体。
gRNA占位符或gRNA占位符序列应理解为随机选择的gRNA序列,其旨在在执行上述方法的过程中被本发明的固定对的待表达的第一或第二gRNA序列取代。除了随机的gRNA序列,还可以使用任何其他随机序列。选择序列的长度以适应诱变DNA引物的总长度,以允许有效的杂交和引物合成。
在优选的实施方案中,一个或两个gRNA表达盒的tracrRNA序列是如上所述的经修饰的或突变的tracrRNA序列。优选地,tracrRNA序列是根据SEQ ID NO:7至10中任一项的序列。最优选地,tracrRNA序列之一是根据SEQ ID NO:10的序列,或与其至少80%、85%、90%或95%相同的序列。
在步骤(a)中的一些实施方案中,两个gRNA占位符序列被接头分开,并且其中该接头序列与诱变DNA引物中的接头序列相同。优选地,接头序列包含限制性内切酶识别位点,例如用于平末端连接的限制性内切酶识别位点,或用于粘性末端连接的限制性内切酶识别位点。连接至平末端或粘性末端限制性内切酶断裂点不允许定向克隆插入序列。但是,通过使用两个彼此之间有足够间隔的不同限制性核酸酶识别位点,可以进行定向克隆,这是因为两个限制性内切酶识别位点的两个不同的粘性末端序列不兼容,并且允许仅在一个方向上插入序列连接到断裂点。因此,在一些实施方案中,接头序列包含两个限制性内切酶识别位点,优选两个用于定向RNA启动子连接的不同限制性内切酶识别位点。
在一些优选的实施方案中,受体载体包含以下中的任何一种或全部或任何组合:
-噬菌体复制起点(ORI),例如f1 ORI,
-用于基因编辑核酸酶的表达盒,
-一个或多个选择标记。
在一些实施方案中,根据本发明的方法是优选的,其中在步骤(c)中,通过以下步骤产生cccDNA载体:
(a’)以单链(ss)噬菌粒载体的形式提供受体载体,
(b’)将诱变DNA引物退火至所述ss噬菌粒载体,
(c’)从中扩增共价闭合环状(ccc)异源双链dsDNA,以及
(d’)去除残留的野生型噬菌粒载体DNA。
在本发明的步骤(d)的优选实施方案中,通过在接头序列中诱导双链断裂,例如使用限制酶,将所述启动子元件连接到如此诱导的双链断裂双链断裂中,从而将启动子片段引入接头序列。术语“限制性内切酶序列”是指被细菌酶识别和切割的特定双链DNA序列,每种酶在特定核苷酸序列处或附近切割双链DNA。
如本文所用,术语“粘性末端”或“突出端”通常与相关领域的普通技术人员的理解一致地解释,并且包括在分子的一条链的末端具有一个或多个未配对的核苷酸种类的线性双链核酸分子,其中该未配对的核苷酸种类可存在于任一链上,并且包括单个碱基位置或多个碱基位置(有时也称为“内聚末端”)。如本文所用,术语“平末端”或“平末端的”通常是指这样的线性双链核酸分子,其末端以一对互补的核苷酸碱基种类终止,其中一对平末端总是能够连接至彼此。优选的限制性内切酶切位点是在本申请的实施例部分中使用的位点。然而,替代的核酸内切酶位点是本领域众所周知的。在本发明的上下文中优选的是,所用的限制性内切酶诱导粘性末端双链断裂或平末端双链断裂。在一些实施方案中,可能优选的是,接头包含彼此紧邻的两个不同的限制酶识别位点,其用于允许所述启动子元件的定向引入。在一些实施方案中,紧邻是两个识别位点彼此不超过50个、优选不超过20、10或5个核酸。
在另一方面,本发明然后涉及一种用于产生基于共价闭合环状(ccc)DNA的向导RNA表达载体或载体文库的方法,该方法包括以下步骤:
(a)提供单链(ss)噬菌粒载体,其包含(i)至少两个向导RNA表达盒,其中每个所述向导RNA表达盒包含tracrRNA(sgRNA)序列和空的靶标向导RNA序列引入位点或向导RNA占位符序列、或其部分序列,(ii)至少一个单链DNA的复制起点(ORI),例如噬菌体ORI,特别是f1-起点,
(b)提供至少一种诱变DNA引物,其中所述诱变DNA引物在3'至5'方向具有以下结构:第一同源区域、编码将要表达的第一向导RNA的第一靶序列区域、第二同源区域、编码要表达的第二向导RNA的第二靶序列区域、以及第三同源区域,其中第一同源区域与在5'侧位于空的第一靶标向导RNA序列引入位点或第一向导RNA编码序列侧翼的ss-噬菌粒载体构建体的序列或其部分序列互补或能够退火至该序列,并且其中第二同源区域与在3'侧位于空的第一靶标向导RNA序列引入位点或第一向导RNA编码序列侧翼的ss-噬菌粒载体构建体的序列或其部分序列互补或能够退火至该序列,并且其中第三同源区域与在3'侧位于空的第二靶标向导RNA序列引入位点或第二向导RNA编码序列侧翼的ss-噬菌粒载体构建体的序列互补或能够退火至该序列,
(c)将至少一种诱变DNA引物退火至ss-噬菌粒载体构建体,并从中扩增共价闭合环状(ccc)-异源双链dsDNA,
(d)去除残留的野生型噬菌粒载体DNA,以及
(e)提供能够表达第一向导RNA和第二向导RNA的RNA启动子。
如前所述,对于本发明的方法而言,优选的是,至少两个向导RNA表达盒中的一个的tracrRNA序列与至少两个向导RNA表达盒中的另一个的tracrRNA序列不同。这是为了避免由于tracrRNA序列的反向重复取向而在构建体中形成三维结构。这样的三维结构可能损害用于生成固定载体对的其他方法步骤。优选地,所述一个和所述另一个向导RNA表达盒的tracrRNA序列的特征在于它们的序列同源性为50%至95%,和/或其中tracrRNA序列具有结合相同或不同RNA/DNA或基因组编辑核酸酶的能力。
两个gRNA表达盒优选地处于外向取向,优选地第一向导RNA在3′至5′方向取向,而第二向导RNA在5′至3′方向取向。
同样如前所述,第一向导RNA序列和第二向导RNA序列之间的序列包含至少一个被限制性核酸内切酶识别的限制性核酸内切酶识别序列。这样的核酸酶及其识别位点在上文描述。
优选地,在本发明的上下文中,步骤(e)包括以下步骤:
(i)使ccc-异源双链dsDNA与至少一种限制性核酸内切酶接触,其中所述至少一种限制性核酸内切酶能够切割位于第一向导RNA序列和第二向导RNA序列之间的至少一种限制性核酸内切酶识别序列,并且其中所述条件足以产生包含第一限制性核酸内切酶识别序列半位点和第二限制性核酸内切酶识别序列半位点的切割产物,
(ii)提供双向DNA/RNA片段,其包含第一限制性内切核酸酶识别序列半位点、第一RNA启动子、第二RNA启动子、以及第二限制性内切核酸酶识别序列半位点,其中所述第一识别序列半位点与步骤(i)的切割产物的第一识别序列半位点相容,并且所述第二识别序列半位点与步骤(i)的切割产物的第二识别序列半位点相容,并且其中第一RNA启动子在3′至5′方向取向,第二RNA启动子在5′至3′方向取向,以及
(iii)在足以产生连接产物组合物的连接条件下,将步骤(i)的切割产物与步骤(ii)的双向DNA/RNA片段结合,其中第一向导RNA的5'端可操作地连接至第一RNA启动子的3'端,并且第二向导RNA的5'端可操作地连接至第二RNA启动子的3'端。
本发明的向导RNA序列最终在RNA启动子的控制下表达。优选地,第一RNA启动子和第二RNA启动子是相同的,或者优选地是不同的。术语“启动子”应理解为是指一种调节序列/元件或控制序列/元件,其能够结合/招募RNA聚合酶并启动从启动子向下游或3'方向的序列转录。启动子可以是例如组成型活性的,或总是在其上或可诱导的,其中在存在外部刺激的情况下,该启动子是活性的或无活性的。RNA启动子的实例包括h7SK、T7启动子或U6启动子。
在一些实施方案中,根据本发明使用的载体还包含野生型或工程化形式的RNA/DNA或基因组编辑核酸酶(CRISPR核酸酶)表达序列,其任选可操作地连接至启动子(稳定或可诱导的),其中该启动子优选适合于mRNA的表达。
向导RNA(gRNA)编码序列的长度至少为10个核苷酸至200个核苷酸,更优选10至50个,更优选10至30个,更优选15至30个,更优选15至25个,最优选17至23个,甚至更优选长度为约20个核苷酸。
在本文描述的方法的上下文中,同源区的长度为至少5个核苷酸,优选至少10个核苷酸,更优选5至40个核苷酸,最优选10至30、或10至20个,最优选13至18个,甚至更优选约15个核苷酸。在本发明的其他替代或另外的实施方案中,同源区由退火温度为约40℃至60℃、优选约45℃至55℃、最优选Tm为50℃+/-3的序列组成。
在某些方面,本发明的方法用于产生基于共价闭合环状(ccc)DNA的向导RNA表达载体或载体文库,其中每个载体包含至少两个不同的gRNA(固定对)的定义的组合。
作为本发明的非限制性实例,诱变DNA引物可以具有根据SEQ ID NO:1-5中任一项的序列。
在另外的优选实施方案中,根据图11中描绘的另外的实施方案,使用上述用于产生“固定对”gRNA表达载体的技术。简而言之,本文所述的固定对方法与如本文在第I节中公开的产生gRNA表达载体的方法直接结合使用。该实施方案可以包括另外的gRNA表达盒的另外使用的tracrRNA序列也与模板载体的其他tracrRNA序列不同。然后,一个附加或替代实施例涉及固定对技术的方法,其在同一载体中同时使用两次(见图11c)。
本发明的一部分还形成了可通过本文描述的方法获得的载体文库。
在另一方面,本发明提供了用于引入和表达两个不同的向导RNA序列的核酸载体,该载体在外向方向[表达方向彼此朝外定向]上包括:
(i)第一gRNA表达盒,其包含第一tracrRNA(sgRNA)序列和第一gRNA占位符序列,以及
(ii)第二gRNA表达盒,其包含第二tracrRNA(sgRNA)序列和第二gRNA占位符序列。优选地,第一和第二tracrRNA序列不同。在一些实施方案中,由外向重复取向的第一和第二tracrRNA序列组成的核酸序列具有不小于约100至-100kcal/mol的最小自由能。
在一些优选的实施方案中,载体包含在第一和第二gRNA表达盒之间的接头,其中该接头的侧翼是gRNA占位符序列。优选地,接头包含限制性核酸内切酶识别位点,其优选适于引入平末端或粘性末端双链断裂(参见上文)。
适用于产生固定对gRNA载体的方法的模板载体的上述实施方案同样适用。
因此,本发明的又一方面涉及一种试剂盒,其包含本文所述的本发明的任何化合物,任选地,还包含适用于以下任何一种的任何缓冲液或试剂:细菌转化、和/或DNA/RNA分离、和/或限制酶消化、和/或连接。
III.增强的固定对3C基因编辑
在另一方面,本发明的目的通过一种增强的方法来解决,该方法用于产生用于表达固定的向导RNA对的共价闭合环状(ccc)DNA载体。由于在以上第II节中公开的上述方法仍然需要残留的经典克隆步骤,因此公开了另一种策略,该策略是基于固定对原理开发的。
CRISPR方法可以包括两种产生功能性RNA复合物的可能性,该复合物包括必需的结构元件以及与靶DNA互补结合的向导序列。通常使用的是作为包含靶互补区(有时称为“原间隔物”)的单分子的向导RNA,其融合到与tracrRNA互补并融合的crRNA“重复”序列,导致形成crRNA重复序列和tracrRNA序列的双链。然而,也可能是靶向导序列与crRNA序列融合,并且tracrRNA被表达为单独的分子,但是仍然通过crRNA序列与tracrRNA的互补碱基配对形成复合物。发明人将后一种策略用于本发明的第三方面。
因此,本发明的增强的3C固定对方法包括以下步骤:
(a)提供增强的受体载体,其包含(x)两个反向的[表达方向彼此面对朝向]增强的gRNA表达盒(第一和第二增强的gRNA表达盒),其中每个增强的gRNA表达盒按该顺序包括:(i)任选的RNA启动子,(ii)gRNA占位符序列,和(iii)crRNA(缺少Tracer序列的sgRNA序列)序列,以及(y)tracrRNA表达盒;
(b)提供增强的诱变DNA引物,其包含两个感兴趣的gRNA序列和能够介导该诱变DNA引物与两个反向的增强的gRNA表达盒结合的同源区域;以及
(c)使用所述受体载体和所述诱变DNA引物产生cccDNA载体。
优选实施方案中的方法包括本文其他地方所述的生成cccDNA的步骤,优选通过使用所谓的Kunkel诱变方法将增强的诱变DNA引物的序列引入增强的受体载体中。在优选的实施方案中,这种方法可以包括方法步骤(c)中的以下子步骤:(a')提供作为单链(ss)噬菌粒载体的受体载体,(b')将诱变DNA引物退火至所述ss噬菌粒载体,(c′)从中扩增共价闭合环状(ccc)-异源双链dsDNA,和(d′)除去残留的野生型噬菌粒载体DNA。
本发明的增强的3C固定对方法不需要引入包含用于gRNA表达的RNA启动子区域的接头片段的步骤,因此不太容易发生典型的克隆问题和错误。
在本发明的一些优选实施方案中,tracrRNA表达盒不位于增强的受体载体的反向的增强的gRNA表达盒之间。
在本发明的一些优选实施方案中,tracrRNA表达盒包含缺少crRNA序列并且可操作地连接至适合于tracrRNA表达的启动子的tracrRNA编码序列。
在本发明的一些优选实施方案中,缺少crRNA序列的tracrRNA序列,以及crRNA序列,当由受体载体表达时,将会产生彼此相互作用以形成功能性crRNA-tracrRNA复合物的RNA分子。
为了本发明的当前方面的目的,crRNA序列与缺少crRNA序列的tracrRNA序列的一部分互补。因此,在表达crRNA时(最好是与gRNA序列融合时),crRNA与tracrRNA结合,从而形成功能性RNA复合物,用于介导Cas9依赖性基因编辑。
在本发明的一些其他优选实施方案中,crRNA序列包含crRNA序列的已知“重复”序列,例如化脓链球菌crRNA序列的(Kooning,EV et al Curr.Opin.Microbiol.37,67-782017,在此全文引入作为参考)。例如在图12d中公开了本发明的优选的crRNA序列。
在一些实施方案中,优选在每个增强的gRNA表达盒中,RNA启动子序列和gRNA占位符序列处于可操作连接中,这应理解为使得当根据本发明将gRNA序列引入占位符时,gRNA序列在RNA启动子序列的控制下表达。
因此,在本发明的优选实施方案中,增强的受体载体以直接和不间断的连续顺序包含以下元件:(i)第一RNA启动子,(ii)第一gRNA占位符或gRNA序列,其中(i)和(ii)处于可操作连接中,(iii)第一crRNA(重复)序列(iv)任选的连接子,随后是以下元件,与(i)至(iii)相比每个元件的方向都相反:(v)第二crRNA序列,(vi)第二gRNA占位符或gRNA序列,(vii)第二RNA启动子,其中(vii)和(vi)处于可操作连接中。
在该方面的一些优选实施方案中,增强的诱变DNA引物按该顺序包含
i.能够结合第一增强gRNA表达盒的第一同源区域,
ii.待表达的第一预定gRNA序列,
iii.第二同源区域,其能够结合反向的crRNA序列,以及任选的连接子,
iv.待表达的第二预定gRNA序列,
v.能够结合第二增强gRNA表达盒的第三同源区域。
在一些实施方案中,上述方法是优选的,其中步骤(a)和(c)之间的方法不包括克隆步骤,优选地,克隆是指基于核酸酶的双链断裂的引入然后是连接的步骤——例如在引入或切除载体的一部分之后。
因此,本发明的问题通过受体增强的受体载体进一步解决,所述受体载体以直接和不间断的连续顺序包含以下元件:(i)第一RNA启动子,(ii)第一gRNA占位符或gRNA序列,其中(i)和(ii)处于可操作连接中,(iii)第一crRNA(重复)序列(iv)任选的接头,随后是以下元件,与(i)至(iii)相比每个元件的方向都相反:(v)第二crRNA序列,(vi)第二gRNA占位符或gRNA序列,(vii)第二RNA启动子,其中(vii)和(vi)处于可操作连接中;增强的受体载体还包含tracrRNA表达盒。
成功进行3C反应所必需的上述其他方面中提到的所有元素和实施方式,在适用或必要时,均应通过引用并入。
同样,对于本发明的其他方法和组合物所述的所有应用和用途均等同地用作该方面的优选实施方案。
如本文中所使用的,术语“包括”将被解释为涵盖“包括”和“由……组成”,这两种含义都是特别意图的,因此根据本发明被单独公开。在本文中使用时,“和/或”应被视为具有或不具有彼此的两个指定特征或组件中的每一个的特定公开。例如,“A和/或B”将被视为(i)A、(ii)B和(iii)A和B中的每一个的具体公开,就如同它们在本文中分别列出一样。在本发明的上下文中,术语“大约”和“约”表示本领域技术人员将理解为仍确保所讨论特征的技术效果的精度范围。该术语通常表示与所示的数值相差±20%、±15%、±10%,例如±5%。如本领域技术人员将理解的,对于给定的技术效果,数值的这种特定偏差将取决于技术效果的性质。例如,自然或生物技术效果通常可能比人为或工程技术效果具有更大的偏差。如本领域技术人员将理解的,对于给定的技术效果,数值的这种特定偏差将取决于技术效果的性质。例如,自然或生物技术效果通常可能比人为或工程技术效果具有更大的偏差。当提到单数名词时使用不定冠词或定冠词,除非特别说明,否则例如“一个”、“一”或“该”包括该名词的复数形式。
应当理解,将本发明的教导应用于特定问题或环境,以及包括本发明的变体或其他特征(诸如另外的方面和实施例)将在根据本文包含的教导的具有本领域普通技术的人员的能力范围内。
除非上下文另外指示,否则以上阐述的特征的描述和定义不限于本发明的任何特定方面或实施例,并且等同地适用于所描述的所有方面和实施例。
本文引用的所有参考文献、专利和出版物均通过引用全文并入本文。
现在将在以下实施例中参考附图和序列进一步描述本发明,然而不限于此。在附图中:
图1
a)用于生成gRNA多重或定义的固定对gRNA试剂的两个gRNA表达盒的组合。常规的3C-gRNA多重化将会导致试剂含有靶向任一gRNA表达盒的gRNA的所有可能组合(复杂性=盒n的gRNA数量*盒m的gRNA数量,c=n*m)。相反,通过3C固定对gRNA合成来预先确定gRNA组合将会导致试剂的复杂性为单个定义的gRNA组合的数量(c=n=m)。
b)可以将单个固定gRNA对中的两个gRNA定义为紧邻的靶DNA,从而导致两个gRNA靶序列之间的DNA丢失。因此,固定对gRNA试剂可用于精确切除DNA序列。
c)可以针对同一遗传靶标(基因、元件、非编码序列等)定义单个固定gRNA对中的两个gRNA,从而大大提高所需编辑或修饰事件的效率。替代地,可以针对两个不同的遗传靶标(基因、元件、非编码序列等)定义单个固定gRNA对的两个gRNA。这样可以精确编辑或修改同一单元格中两个已定义的序列元件。
d)固定gRNA对试剂可与核酸酶活性野生型Cas酶(i)或单个活性位点灭活的Cas酶切口酶(ii)一起使用。
e)固定gRNA对的使用不仅限于活性Cas酶,还可以扩展到酶促死亡的Cas酶以进行灭活(i)、激活(ii)、表观遗传修饰(iii)、或可视化(iv)遗传因素。
图2
a)用于生成定义的3C固定gRNA对试剂的概念工作流程。将两个外向的tracrRNA和gRNA编码占位符(I-SceI位点)整合到dsDNA模板质粒中,该质粒在CJ236细菌中扩增以随机掺入脱氧尿嘧啶。C13236细菌的M13K07过度感染导致噬菌体颗粒含有模板质粒的ssDNA拷贝。将编码5'和3'同源性以及两个定义的gRNA序列的DNA寡核苷酸退火至ssDNA,并分别通过T7 DNA聚合酶和T4连接酶的活性进行延伸和连接。所得的由模板和新合成的3C-DNA组成的异源双链dsDNA被转化为非CJ236细菌,以扩增新的DNA链并降解含有dU的模板DNA。随后通过酶切消化在两个新的gRNA序列之间打开定义的gRNA组合的所得的dsDNA,并与双向RNA启动子序列连接,产生最终定义的3C固定对gRNA试剂。
b)寡核苷酸退火位点的详细和示例性序列图。请注意,存在两个限制性内切酶识别位点,这些位点使得随后的清理步骤可以去除野生型让人联想到的质粒DNA。
c)定义的3C固定gRNA对组合不限于使用单个Cas核酸酶。可以使用两个不同的tracrRNA序列,从而扩展靶序列的范围,并允许使用野生型和酶促死亡或修饰的Cas核酸酶的组合(图1d、e)。
d)给定DNA序列上的定义的固定gRNA对组合的最大数量,是tracr#1的靶序列数量乘以tracr#2的靶序列数量得出的。如果将SpCas9靶序列与其自身组合,则平均定义的固定gRNA对组合为150*150(图2c)。如果组合不同的Cas酶,则由于Cas酶的PAM选择性增加,其数量会下降。
图3
a)可以调整SpCas9 tracrRNA序列(#1-3)中的选择的序列元素,以防止3C模板DNA中存在两个高度相似的序列。序列方案改编自Konermann et al.,201514。该序列在SEQ IDNO:7中提供。
b)将合理改造的SpCas9 tracrRNA序列v2(SEQ ID NO:9)和v3(SEQ ID NO:10)与野生型SpCas9 tracrRNA序列(SEQ ID NO:8)进行比较。蓝色和红色字母表示序列的合理变化。Chen et al.,201316先前曾报道过V2。
图4
a)基于pLKO.1,发明人生成了5个包含tracrRNA序列的3C模板dsDNA质粒,使得Cas核酸酶的以下组合成为可能:SpCas9:SpCas9(v1.v2和v2.v3),SpCas9:SaCas9(v2.Sa),SpCas9:NmCas9(v2.Nm)和SpCas9:AsCpf1(v2.As)。当进行分析性限制酶消化和通过凝胶电泳进行分析时,所有质粒均产生预期的条带模式,从而确认了正确的克隆和3C模板的产生。
b)将所有3C模板dsDNA质粒转化为含dU的ssDNA,并通过凝胶电泳进行分离,显示出高纯度的ssDNA。
c)用携带所有5个3C模板ssDNA的噬菌体感染XL1细菌,以将ssDNA转换回dsDNA,并间接分析3C模板ssDNA的质量。令人惊讶的是,对应于SpCas9 tracrRNA组合v1和v2的ssDNA发生严重重组。相反,与测试的所有其他tracrRNA组合相对应的ssDNA没有重组事件,因此适合作为固定对3C反应的模板。
图5
用于固定对3C模板设计的不同tracrRNA组合的二维折叠和结构预测。单链DNA折叠的预测基于Lorenz et al.,201113。重要的是,tracrRNA组合SpCas9:SpCas9(SpV1.SpV2)的结构预测显示了64个核苷酸长的完美同源性,并且ssDNA退火在所有其他tracrRNA组合的预测的结构中不存在。序列提供于SEQ ID NO:8至10,以及它们各自的含尿嘧啶的RNA。
图6
源自图4c的tracrRNA组合方案和单个细菌克隆的SANGER测序。如从图4c中可以预期的,单个克隆的SANGER测序证实了重组事件,并揭示了在SpV1.SpV2固定对模板DNA上完全缺乏对应于外向tracrRNA和两个gRNA序列的序列。所有其他3C固定对模板设计均显示无错误序列。
图7
a)人视网膜母细胞瘤蛋白1(RB1)基因的基因座,放大到第7外显子直到第9外显子,并用红色突出显示了固定对#1和#2的gRNA位置。成功切除DNA后,固定对#1或#2的各自219bp或207bp片段将丢失。请注意:gRNA设计用于靶向非编码内含子DNA,以最大程度减少编码InDel。
b)在用固定gRNA对#1和#2转导后,在RPE1细胞中诱导了Palbociclib(PD,iCdk4)抗性。与对照细胞(空的,空的慢病毒主链)相比,用固定对#1或#2转导的细胞在选择性Cdk4抑制剂Palbociclib的存在下开始增殖。
图8
在过夜3C反应中,将五个测试的tracrRNA组合的单链DNA与3C固定DNA对寡核苷酸分别组合。通过凝胶电泳分析3C产物,并将其与相应tracrRNA组合模板的dsDNA和ssDNA进行比较。引人注目的是,所有3C反应都表明异源双链3C-DNA的成功形成,包括在SpCas9v1.v2模板上进行的3C反应,本发明人先前证明其含有重组DNA,表明在这种情况下非特异性DNA寡核苷酸与ssDNA结合。
图9
将图8的3C-DNA转化到非CJ236细菌中以扩增多克隆DNA。纯化过夜培养物的质粒DNA,并进行分析性限制酶消化。将各个3C-DNA制剂与图4a的相应野生型质粒DNA对照进行比较。成功的3C反应会将3C模板DNA中的I-SceI限制性酶切位点改变为定义的gRNA序列。因此,用I-SceI进行酶切只会线性化野生型3C-DNA。不出所料,用v1.v2 3C模板DNA的3C-DNA转化的细菌不能很好地生长,并且所得的DNA不能作为野生型DNA迁移,这表明3C模板DNA和3C寡核苷酸的错误退火会导致DNA种类是不可转换的。相反,所有其他tracrRNA组合的3C-DNA导致不可切割的DNA,表明成功进行了3c固定对反应。令人惊讶的是,在没有任何以意外大小迁移的DNA种类的情况下,获得的DNA的总体质量非常高。
图10
与图9相似,图8的3C-DNA在非CJ236细菌中转化,但在LB琼脂平板上划线,从中扩增出单个细菌菌落,并通过SANGER测序分析其DNA。当与各自的野生型(WT)SANGER测序结果比较时,发明人能够为所有测试的tracrRNA组合鉴定正确的RB1固定对gRNA序列。这表明发明人已经基于先前描述的3C技术成功地产生了一种新技术,该新技术使得能够产生确定的固定gRNA对试剂。
图11
如上所述,3C固定对技术能够以单一或合并的方式预先确定两个序列,因此代表了首个此类技术解决方案。但是,对3C固定对技术的一些修改是合乎逻辑的。这样,例如,同一质粒上单个固定对表达盒与单个gRNA表达盒的组合应该是可能的(a)。同样,单个固定对盒可以与两个单独的gRNA表达盒结合,从而使固定对gRNA与gRNA多重化相结合(b)。此外,设计这样的3C模板在技术上是可行的,其中结合了两个固定对gRNA盒,从而实现了固定对多重化。
图12
增强的3C固定对gRNA。a)说明在固定对gRNA组合生成过程中从tracrRNA分离crisp(cr)RNA的逻辑的方案。简而言之,合成编码两个预定的gRNA组合的寡核苷酸,并与模板DNA的ssDNA合并以进行3C合成反应。所得的dsDNA产物导致两个单独的crRNA序列的表达,该序列退火至tracrRNA(从同一质粒共表达),与SpCas9一起形成功能性核糖核苷酸复合物。b)3C固定对反应的一般工作流程和ssDNA的模板设计规则。c)固定对模板DNA设计。突出显示了RNA启动子、gRNA和crRNA序列。d)3C固定对gRNA寡核苷酸的设计和退火原理。
图13
a)两个CJ236克隆接受了我们的增强固定对模板DNA的ssDNA生成。SsDNA比dsDNA迁移更快。b)用单个引物对进行固定对合成3C后,对3C产物进行琼脂糖凝胶电泳鉴定出3C反应产物。c-d)通过PacI和I-SceI限制酶消化分析了扩增的dsDNA 3C固定对产物的质量控制步骤(P1)。没有切割表明新序列已成功整合。消化产物(P1)被重新扩增(P2),并再次通过限制酶消化进行分析,发现没有野生型残留。e)对(c)衍生的3C DNA的P1和P2进行SANGER测序。鉴定出8个核苷酸被改变(由箭头突出显示)。重要的是,已经在P1的水平上,在这8个核苷酸位置确定了足够的随机化,而在P2的水平上,已经出现了完全随机化。
图14
3C合成产物扩增的dsDNA的琼脂糖凝胶电泳。测试了ssDNA与寡核苷酸的不同比例以及总DNA量对P1质量的影响。没有发现明显的偏向单一比例或数量(在所有测试条件下均有效),表明3C固定对反应具有较高的性能。
图15.3C固定对gRNA试剂的细胞功能。a)衍生自图13b的固定对构建体,经过慢病毒颗粒的产生,并用于转导GFP阳性RPE1细胞。通过FACS分析GFP的消耗。如先前报道,单个gRNA会强烈还原GFP阳性细胞,而GFP靶向gRNA的固定对组合会完全消除GFP阳性细胞群。b)对(a)衍生的细胞进行免疫印迹分析,确认FACS导致的GFP荧光损失是由于GFP蛋白的损失。c)类似于GFP的固定对靶向,靶向Cdk2的3C固定对构建体可单独使用或组合使用,并且当将两个功能性gRNA用作固定对组合时,可显示Cdk2的耗竭有所改善。这表明,与单个这些gRNA相比,以3C固定对gRNA形式存在的两个gRNA具有更高的靶向活性。
表2:本发明的序列
Figure BDA0002820950370000221
Figure BDA0002820950370000231
实施例
比较例:共价闭合环状合成突变CRISPR/Cas9质粒
尽管常规的定点诱变不能在含有大型逆转录病毒元件的质粒上有效地起作用,但是可以预期,基于ssDNA的T7 DNA聚合酶和T4 DNA连接酶介导的5'寡核苷酸延伸将是产生高质量和无偏的gRNA库的有效方法(图12A)。为此,用最广泛使用的含f1起点(f1-ori)的CRISPR/Cas9质粒pLentiGuide和pLentiCRISPRv2转化了含dut-/ung-、F因子的K12大肠杆菌CJ236细菌。与传统的K12大肠杆菌菌株相反,由于缺乏dUTPase(dut-)和尿嘧啶糖基化酶(ung-)酶,CJ236细菌能够耐受基因组和质粒DNA中脱氧尿苷的存在。随后用M13K07噬菌体对转化的CJ236进行超级感染,从而可以生产噬菌体颗粒,该颗粒包装了含有pLentiGuide和pLentiCRISPRv2的ssDNA(dU-ssDNA)模板的脱氧尿苷。在下一步中,从沉淀的噬菌体颗粒中纯化dU-ssDNA(图12B)。通常,该方法可以应用于编码f1-ori的任何质粒。
为了从dU-ssDNA模板成功生成异源双链、共价闭合环状合成dsDNA(3C-dsDNA),通过在2小时体外3C反应中比较5'和3'同源性的10、13、15和18个核苷酸(nt),测试了最佳引物/同源性长度(图13A)。通过凝胶电泳分离了dU-CCC-dsDNA反应产物,并鉴定了异源双链dsDNA反应的典型三波段模式(33、34)。通过15个nt的引物同源性实现了正确延伸、带切口的和链置换的3C产物之间的最佳比例(图13A),因此,本发明人将这个长度用于所有后续反应。
接下来,发明人测试了用于靶向增强的绿色荧光蛋白(eGFP)基因的细胞内活性gRNA的生成的该方案。使用规则集2(RS2)算法设计了六个gRNA序列,并通过3C反应克隆到包含在U6启动子控制下的非人类靶向(NHT)控制序列的pLentiGuide和pLentiCRISPRv2中,随后是gRNA支架DNA序列负责与Cas9结合(图2B)(32)。所得的异源双链体dU-CCC-dsDNA用于转化XL1细菌,以确定正确突变的含野生型(NHT)序列的比率。发明人分别对20个克隆测序,并确定81%的pLentiGuide和82%的plentiCRISPRv2被GFP靶向gRNA修饰(图13C、D)。向M13K07培养基中添加尿苷可将野生型率显著降低至约12%,这表明未修饰的质粒的发生很可能是由于dU掺入到dU-ssDNA模板中不足(图13E)。重要的是,发明人能够鉴定所有6个靶向eGFP的gRNA序列的几个拷贝(图13D),尽管发明人仅对20个单独的克隆测序,也表明高效的方案适用于文库构建。
为了测试靶向eGFP的gRNA构建体的细胞功能,产生了感染性慢病毒颗粒,并用于转导eGFP阳性的人类端粒酶永生化的视网膜色素上皮(RPE1)细胞。7天后无任何选择压力,通过流式细胞仪分析eGFP阳性和阴性细胞的存在。使用慢病毒3C-gRNA构建体减少绿色荧光非常有效,而对照质粒对eGFP荧光没有影响(图14)。有趣的是,发明人观察到剂量依赖性荧光降低,表明RPE1细胞的慢病毒转导与常规产生的慢病毒CRISPR/Cas颗粒的效率相同(图14)。因此,可以使用新近建立的3C方法快速生成共价闭合环状合成CRISPR/Cas gRNA,并在细胞中完全发挥作用。
实施例1:针对固定对CRISPR/Cas gRNA的3C策略
为了产生gRNA组合或gRNA的固定对,发明人基于先前发明的3C技术设计了3C策略(图2a)。为此,发明人在计算机上基于pLKO.1设计了模板质粒,其中表达shRNA的表达盒(RNA启动子和shRNA克隆位点)被两个tracrRNA沿相反方向替代,这对于RNA结合Cas核酸酶至关重要。外向的tracrRNA被两个限制性位点编码的gRNA占位符分隔(图2a、b)。发明人在CJ236细菌中克隆并扩增了该质粒,并通过扩增和纯化噬菌体M13K07颗粒将其转化为单链环状dU-DNA(dU-ssDNA)。然后将得到的环状dU-ssDNA与DNA寡核苷酸退火,该寡核苷酸具有与外向的tracrRNA序列(tracr#1和tracr#2)足够的5'和3'同源性,并包含两个定义的双向gRNA序列(图2a、b)。然后将退火的DNA寡核苷酸通过T7聚合酶和T4连接酶的活性分别延伸并连接到其自身的尾巴,从而生成由模板和新合成的DNA链组成的异源双链DNA(3C-DNA)。然后将3C-DNA转化为非CJ236细菌,以选择性降解含dU的DNA和扩增新合成的质粒DNA。将纯化的不含dU的质粒DNA纯化,然后进行清理步骤(限制酶消化)以除去野生型让人联想到的质粒。为了使gRNA表达,通过使用限制性酶切位点(平末端或粘性克隆)将双向RNA启动子(由两个非同源序列组成,例如hU6、h7SK、H1等)克隆到两个定义的gRNA序列之间。产生定义的(“固定对”)gRNA组合的最终CRISPR/Cas gRNA库(图2a)。
自从CRSIPR/Cas系统的最初描述和最广泛使用的Cas酶SpCas93,4的表征以来,已经描述了许多其他的Cas核酸酶并对其功能进行了表征。发明人选择了几种常用的Cas酶(SpCas9、SaCas9、NmCas9和AsCpf1),并根据其各自的PAM序列选择性,估计了它们在1.000个随机核苷酸中的平均靶位点出现率(GC含量为50%)(图2c)3-7。如先前报道,SpCas9的靶位点出现率最高,每千碱基DNA大约有150个靶位点,其次是SaCas9的125个,NmCas9的10个,AsCpf1每千碱基大约100个靶位点(图2c)。从理论上讲,不仅可以基于相同的tracrRNA(利用相同的Cas酶)生成固定对gRNA组合,而且还可以与不同的tracrRNA分子(依赖于不同的Cas酶)结合生成固定对gRNA组合,从而扩大了靶标范围及其特异性。因此,SpCas9与SaCas9或AsCpf1的组合具有最广泛的靶标,平均固定对靶标数量约为每千碱基20.000个gRNA组合(图2d)。
实施例2:用于固定对3C-gRNA的合理工程化的SpCas9 tracrRNA
已经证明,含有高度同源或相同核苷酸序列的质粒在病毒包装过程中会重组,从而导致序列信息丢失并导致病毒颗粒失活8-11。为了在噬菌体颗粒包装过程中规避这一问题,发明人将野生型SpCas9 tracrRNA(v1)序列与最近改造和改良的SpCas9 tracrRNA版本2(v2)相结合,以生成固定对模板质粒DNA(v1.v2)(图2a)12。此外,发明人还生成了SpCas-SaCas9(v2.Sa),SpCas9-NmCas9(v2.Nm)和SpCas9-AsCpf1(v2.As)的外向tracrRNA组合的固定对模板质粒DNA,所有这些经过分析性限制酶消化后均产生了预期的DNA片段(图4a)。此外,发明人预测了通过常规生物信息学工具折叠的外向tracrRNA和gRNA序列,尽管大多数tracrRNA组合均未导致强烈折叠13,但发明人发现SpCas9 tracrRNA分子的v1和v2的基于强同源性的折叠(图5)。为了防止v1和v2重组,发明人基于先前报道的SpCas9的晶体结构与tracrRNA和gRNA分子复合14,合理地改造了新的SpCas9 tracrRNA序列。发明人确定了三个不与SpCas9直接接触的序列区域,因此可能具有破坏序列同源性的改造潜力(图3a)。发明人合理地将三个序列改变为最有效破坏ssDNA重折叠的核苷酸,并命名为新的tracrRNA分子版本三(v3)(图3b、5)。与所有其他模板质粒相似,在酶切限制分析后,v2与v3组合(v2.v3)产生了正确的消化模式(图4a)。接下来,发明人测试了固定对模板质粒的组合以产生环状ssDNA。来自多个克隆的所有固定对模板质粒的单链DNA,包括SpCas9 tracrRNA组合的v1.v2,产生了高质量的环状ssDNA,在通过凝胶电泳进行分析时,其迁移为单一条带(图4b)。但是,ssDNA的凝胶电泳可能看不到高度同源序列信息的丢失。因此,发明人使用了含有固定对模板DNA的纯化噬菌体颗粒,以基于通过噬菌体感染传递给它们的ssDNA重新转化XL1细菌以产生dsDNA。对得到的质粒dsDNA进行分析限制酶消化,以确认固定对模板dsDNA的正确性。如所预测的,从v1.v2tracrRNA ssDNA产生的dsDNA经历了严重的重组事件,这表现为更快的迁移带、缺乏正确的消化模式以及缺乏正确的SANGER序列信息(图4c、6)。但是,所有其他tracrRNA组合,包括新设计的v3 SpCas9 tracrRNA,都没有DNA重组,并且包含正确的核苷酸序列(通过SANGER测序确定)(图4c、6)。这表明来自各个固定对模板的环状ssDNA具有很高的质量,并且包含正确的同源序列以实现3C-DNA的产生。
TracrRNA设计
灰色高亮:修改自wt
下划线:MS2茎环
wt(v1)–136.50kcal/mol,76bp,SEQ ID No:8
GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGC
v2–167.90kcal/mol,86bp,SEQ ID No:9
GTTTAAGAGCTATGCTGGAAACAGCATAGCAAGTTTAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGC
v3(经改造的)–90.90kcal/mol,82bp,SEQ ID No:9
GTTTTAGAGCTAGAGCAAGCTCTAGCAAGTTAAAATAAGGCTAGTCCGAATAGAACTTCCACAAGTGGCAGGCAGTGCCTGC
实施例3:原理证明:按顺序克隆的固定对gRNA的功能
为了测试3C固定对gRNA的性能,发明人着手设计了实验设置,该设置可以在两个gRNA靶位点发生单独的插入或缺失(InDels)时选择性地量化完整的DNA切除事件。为此,发明人设计了两对分别靶向人视网膜母细胞瘤基因RB1基因的内含子区域的gRNA,其耗尽或失活导致对选择性Cdk4/6抑制剂Palbociclib的耐药。两对的设计均应使单个gRNA距离RB1最接近的编码外显子的5'或3'末端至少50个核苷酸。第1对设计为包含外显子7,而第2对设计为包含RB1的外显子9(图7a)。值得注意的是,gRNA被设计来靶向非编码内含子DNA,以最大程度地减少编码InDel。通过常规克隆分别将两组成对的gRNA依次克隆到先前描述的慢病毒质粒pKLV2.215中。两种质粒都经过感染性慢病毒颗粒的产生,随后被用于转导表达SpCas9的RPE1细胞。慢病毒转导后的一天,将细胞暴露于1μM的选择性Cdk4抑制剂Palbociclib(PD),并通过每日AlamarBlue分析定量其增殖,总共持续11天。与空的携带pKLV2.2的慢病毒颗粒转导的细胞形成鲜明对比的是,用Palbocilcib暴露4至7天后,用靶向RB1的gRNA对的第1对或第2对转导的细胞显示出增殖的急剧增加(图7b)。
这表明定义的gRNA对是有活性的,并导致完整的DNA切除事件,包括位于gRNA侧翼的外显子,而不是单个位点的小InDel。因此,固定对的gRNA具有适合大型细胞功能筛选的潜力。
实施例4:合并的固定对3C技术中定义的gRNA组合
为了证明上述固定对环状ssDNA模板的3C性能,发明人将它们与DNA寡核苷酸组合,该寡核苷酸由以下序列组成:1)与外向tracrRNA组合的5'和3'同源性,和2)靶向RB1基因第7外显子侧翼的两个内含子区域的双向gRNA序列(第1对,图7a、b)。当通过凝胶电泳分析3C-DNA时,发明人惊讶地发现,在v1.v2模板DNA上进行的3C反应中,DNA种类迁移较慢,而发明人此前已证明其重组并缺乏tracrRNA序列(图8)。发明人推测,DNA的迁移较慢是由于寡核苷酸与模板的同源性完全缺乏,其可能引起寡核苷酸的非特异性结合并导致部分3C-DNA产物。但是,无论使用的是tracrRNA还是tracrRNA组合,所有其他3C反应也会导致DNA种类的较慢迁移,表明在所有测试条件下均生成3C-DNA(图8)。
为了通过合并的限制酶消化和单个细菌克隆的直接SANGER测序来准确定量固定对3C反应效率,发明人将所得3C-DNA转化为XL1细菌。与以前的观察结果一致,使用v1.v2模板ssDNA产生的3C产物转化的细菌没有生长,也无法提取或分析质粒DNA。这证实了以下假设:寡核苷酸与模板DNA的非特异性结合不会导致可转化的3C-DNA。相反,所有其他tracrRNA组合的细菌均正常生长,并提取了其扩增的DNA。重要的是,成功的3C反应会将3C模板DNA中的I-SceI限制性酶切位点改变为定义的gRNA序列,从而使I-SceI对正确生成的3C-DNA失去活性。随后将纯化的多克隆过夜细菌培养物的DNA进行分析性限制酶消化,并与相应的野生型质粒进行比较。最重要的是,当进行I-SceI消化时,所有固定对tracrRNA组合均显示未切割的质粒DNA种类,表明存在其中I-SceI限制性位点已改变的质粒DNA(图9)。为了证实I-SceI序列的改变,发明人通过SANGER测序分析了单个细菌克隆,并鉴定了对应于图7的切除对1的两个RB1gRNA序列(图10a-c)。
总的来说,发明人已经开发了一种新颖的方法,用于产生CRISPR/Cas gRNA的定义的组合,用于产生合并的固定对gRNA文库。这项创新技术具有广泛的应用潜力,包括但不限于提高基因敲除、激活或抑制或效应子介导的编辑以及精确切除遗传信息(CRISPRex)的靶向效率。固定对gRNA试剂对于CRISPRa和CRISPRi领域特别重要,已证明这两种试剂都显著依赖多种gRNA进行有效激活(a)或失活(i)。发明人认为,该技术对于健康和疾病中编码和非编码遗传信息的研究具有广泛的意义。
实施例5:扩展3C固定对gRNA工具箱
3C固定对技术可实现所用gRNA组合的进一步技术发展,如以下修改所示(图11)。
1)3C固定对gRNA可以与一个单一gRNA表达盒结合使用,以实现一个单一gRNA与固定对gRNA的多重化(图11a)。
2)3C固定对gRNA可以与两个单一gRNA表达盒结合使用,以实现两个单一gRNA与固定对gRNA的多重化(图11b)。
3)可以将单一的3C固定对gRNA表达盒与第二个3C固定对gRNA表达盒进行多重化,以实现3C固定对gRNA的多重化(图11c)。
实施例6:防止3C库扩增
为确保3C试剂不能被第三第二/方扩增,可以通过限制酶消化将最终的3C试剂线性化,以去除质粒/文库的必需部分,从而阻止细菌的生长/扩增。然而,线性化质粒/文库的转染对于产生用于实验目的的慢病毒颗粒是有活性的。
细菌质粒扩增需要抗生素药物选择/压力,以确保携带所需质粒/文库的细菌的选择性生长。这样,例如1)可以切除抗生素启动子,2)可以去除全部或部分抗生素抗药性基因,或3)可以切除复制起点(ORI)序列。
实施例7:无克隆的增强的3C固定对gRNA的产生
3C试剂得益于PCR扩增和常规克隆步骤的缺乏。但是,整合双向启动子以完成3C固定对试剂的生产可能会干扰3C固定对试剂的整体质量(多样性和分布)。因此,发明人设计了增强的3C固定对方案,完全避免了任何常规的克隆步骤的需要。为此,发明人利用了以下事实:化脓链球菌的非工程化II型CRISPR系统使用两个单独的RNA分子(crRNA和tracrRNA),它们与Cas9一起在细胞内形成功能性RNA引导的DNA核酸酶复合物(图12a)。
通过修饰3C固定对模板质粒,使其包含两个双向定位(朝向另一个)的人RNA启动子(7SK和U6)序列,该序列由两个占位符gRNA序列分隔,该两个占位符gRNA序列进一步被退火至tracrRNA的双向crRNA序列分隔,3C固定对反应足以从同一质粒(增强的质粒#3.1)产生crRNA的固定对组合物(图12b、c)。在同一质粒上的单独的SpCas9 tracrRNA表达盒可确保在同一细胞内表达两个RNA分子。与以前的设计相反,用于增强的质粒#3.1的3C固定对寡核苷酸包含三个同源性区域(3C固定对同源性),可能会改善寡核苷酸退火,从而改善3C反应的性能(图12d)。
实施例8:产生增强的3C固定对试剂
为了证明增强的3C固定对模板的性能和稳健性,发明人将质粒#3.1转化进CJ236细菌,并选择了两个克隆用于ssDNA产生。琼脂糖凝胶电泳鉴定了CJ236克隆的单条ssDNA,证明了质粒#3.1产生了稳定的ssDNA(图13a)。
为了鉴定质粒#3.1上3C反应的稳健性和质量,发明人设计了5种寡核苷酸,编码对照(非人类靶标,NHT)、mCherry、GFP靶向gRNA的组合,并进行了单独的3C固定对反应。所有已设计的寡核苷酸在3C固定对反应中均表现良好,通过琼脂糖凝胶电泳可视化的预期条带模式显示出来(图13b)。由于单个寡核苷酸3C固定对合成表现良好,因此发明人询问使用该方案是否可能进行合并的引物反应。为了识别这一点,发明人设计了包含8个随机核苷酸位置(8N引物)的单个寡核苷酸,计算的多样性为65,536,并进行了体外3C反应。将反应产物纯化,电穿孔并在细菌中扩增,然后第一个质量控制步骤(P1)通过应用酶PacI和I-SceI去除野生型残留。再次对P1的未裂解产物进行电穿孔,并进行第二个质量控制步骤(P2),以通过琼脂糖凝胶电泳在最终的8N文库制备物中鉴定野生型残留的程度(图13c、d)。如预期的那样,两个质量控制步骤均将野生型残留去除到检测限以下。为了使随机化的核苷酸可视化并潜在地识别与3C引物同源性区域并列的任何不需要的突变,发明人对合并的8N质粒上P1和P2的水平进行了SANGER测序。令人惊讶的是,在P1的水平上,已经可以通过SANGER测序鉴定所有8个随机核苷酸,并且质量步骤P1对核苷酸随机化的整体程度几乎没有影响(图13e)。这表明8N3C固定对反应非常有效,可能是由于长的寡核苷酸内3C同源性所致,并表明3C固定对质粒#3.1非常适合生成具有预定义组合的gRNA合并库。
发明人先前证明,ssDNA与3C寡核苷酸的比例对于稳健的3C性能至关重要。因此,发明人测试了哪个比例对于3C固定对反应最有效。为此,发明人设置了3个反应,比例为600/20(1:33)、600/15(1:25)和400/20(1:50)(ng的ssDNA比μg的寡核苷酸),以及2个比例为1:33的反应,其中将ssDNA的总量调整为10或5μg。如前所述,将所有反应产物进行电穿孔和扩增,并通过质量控制步骤P1进行处理。有趣的是,发明人无法在所有测试条件下观察到3C性能的任何显著差异(图14a)。尽管在单个或多重3C反应中ssDNA与寡核苷酸的精确比例很重要,但固定对引物的额外内部3C同源性可能会绕过这种需求,并扩大了ssDNA与寡核苷酸的性能比。
实施例9:增强的3C固定对试剂的细胞功能
为了证明增强的3C固定对质粒和试剂的功能,发明人采用了上述产生的NHT和GFP靶向构建体,并制成了它们的感染性慢病毒颗粒。用它们将表达GFP的hTERT-RPE1细胞转导48小时,然后施加选择压力(嘌呤霉素)再维持4天,然后通过FACS和免疫印迹进行分析,其中野生型(wt)和GFP阳性细胞(GFP)作为对照。重要的是,两个NHT-gRNA序列的固定对组合不影响GFP阳性细胞的百分比,而通过FACS NHT-GFP2和GFP2-NHT均诱导了GFP阳性细胞的强烈减少。但是,GFP2-GFP1(两种不同的靶向GFP的gRNA)的组合将GFP阳性细胞群体降至检测限以下(图15a、b)。另外,通过GFP的免疫印迹证实了GFP的缺失效率,从而证实了FACS的发现(图15b)。在人类细胞中表达的荧光蛋白反映出人工的情况,因此发明人询问是否两个gRNA同样会更有效地消除RPE1细胞中内源表达的基因。为了解决这个问题,用编码NHT/NHT、NHT/Cdk2、Cdk2/NHT或Cdk2/Cdk2的固定对gRNA构建体转导了RPE1细胞。正如预期的那样,与两个单个gRNA任一个相比,两个固定对gRNA更有效地消耗了内源性Cdk2(图15c)。这证明3C固定对试剂在细胞中起作用,并且靶向同一基因的3C固定对gRNA组合比单个gRNA具有增强的靶向活性。
材料和方法
dU-DNA模板扩增和纯化
根据以下方案,用50ng CRISPR/Cas模板质粒转化KCM感受态和dut-/ung-大肠杆菌细胞(大肠杆菌K12 CJ236菌株,NEB):将DNA与2μL 5x KCM(1M KCl,1M CaCl2,1M MgCl2)溶液混合,设为10μL,在冰上冷却10分钟。将等体积的CJ236细菌添加到DNA/KCM混合物中,轻轻混合并在冰上孵育15分钟。然后将细菌/DNA混合物在室温下孵育10分钟,然后接种在200μL SOC培养基中。将细菌在37℃和200rpm下孵育1小时。1小时后,在LB琼脂平板上用氨苄青霉素筛选细菌,并在37℃下孵育过夜。
第二天早晨,将转化的CJ236的单一菌落挑入1mL的2YT培养基中,该培养基中添加了M13KO7辅助噬菌体,终浓度为1x108 pfu,任选的6.25μg/ml尿苷、氯霉素(终浓度为35μg/mL)和氨苄青霉素(终浓度为100μg/mL)以分别维持宿主F'附加体和噬菌粒。在200rpm和37℃摇动2小时后,添加卡那霉素(终浓度25μg/mL)以选择已被M13KO7感染的细菌。将细菌在200rpm和37℃的温度下再保持6个小时,然后将培养物转移到补充有氨苄青霉素(终浓度100μg/mL)和卡那霉素(终浓度25μg/mL)的30mL 2YT培养基中。在200rpm和37℃摇动20小时后,细菌培养物在Beckman JA-12定角转子中以10,000rpm和4℃离心10分钟。为了沉淀噬菌体颗粒,将上清液转移至6mL(培养体积的1/5)PEG/NaCl(20%聚乙二醇8000,2.5M NaCl)中,在室温下孵育1小时,然后在Beckman JA-12定角转子中以10,000rpm和4℃离心10分钟。将噬菌体沉淀重悬于1mL PBS中。
根据制造商的方案,使用.Z.N.A.M13 DNA Mini Kit(Omega)从重悬的噬菌体中纯化出环状ssDNA。
生成3C-DNA
分别列出了用于3C反应的寡核苷酸。对于每个3C反应,通过混合2μL 10x TM缓冲液(0.1M MgCl2、0.5M Tris-HCl,pH 7.5)、2μL 10mM ATP、1μL 100mM DTT、20个单位的T4多核苷酸激酶和H2O(总量为20μL),将600ng寡核苷酸磷酸化。将混合物在37℃下孵育1小时。
通过将20μL磷酸化产物添加到25μL 10x TM缓冲液、20μg dU-ssDNA模板和H2O中至总体积为250μL,将磷酸化寡核苷酸与环状dU-ssDNA模板进行退火。将混合物在90℃孵育3分钟,在50℃孵育5分钟,在室温孵育5分钟。
通过向退火的寡核苷酸/ssDNA混合物中加入10μL 10mM ATP、10μL 100mM dNTP混合物、15μL 100mM DTT、2000个连接单元(或30个Weiss单元)T4 DNA连接酶和30个单元的T7DNA聚合酶来生成3C-DNA。将3C合成混合物在室温下孵育12小时(过夜),进行亲和纯化,并通过凝胶萃取柱(Thermo Fisher Scientific)脱盐。通过凝胶电泳与ssDNA模板一起在0.8%TAE/琼脂糖凝胶(100V,30分钟)上分析3C反应产物。
细胞培养
作为标准,HEK293T(ATCC CRL-3216)维持于Dulbecco改良Eagle培养基(DMEM,Thermo Fisher Scientific)中,而hTERT-RPE1(CRL-4000)在DMEM:营养混合物F-12(DMEM/F12,Thermo Fisher Scientific)中,在37℃和5%CO2下补充10%胎牛血清(FBS)和1%青霉素-链霉素(Sigma)。
慢病毒转导
对于每个实验,将RPE1细胞以适当的密度播种,在补充有10%FBS和1%青霉素-链霉素(Sigma)的DMEM/F12(Thermo Fisher Scientific)中最大融合度为60-70%。转导当天,根据先前确定的病毒滴度,将聚乙烯加入培养基中至终浓度为8μg/mL,并加入病毒上清液。第二天早晨,将培养基替换为新鲜培养基,并对细胞进行抗生素选择或实验分析。
慢病毒颗粒的产生和定量
转染前一天,将HEK293T细胞接种至5x105细胞/mL。为了转染HEK293T细胞,使用含有1/10培养体积的Optimem(Thermo Fisher Scientific)、105μl/ml lipofectamin 2000(Invitrogen)、1.65μg转移载体、1.35μg pPAX2(addgene质粒#12260)和0.5μg pMD2.G(addgene质粒#12259)的转染培养基。将混合物在室温下温育30分钟,然后将其滴加到培养基中。第二天早晨,将转染培养基替换为新鲜培养基,以产生无转染试剂的慢病毒上清液。在24小时和48小时收获慢病毒上清液,合并并在-80℃下保存。
为了确定慢病毒滴度,将RPE1细胞接种在24孔板中,每孔20,000个细胞。第二天,使用8μg/ml聚丙烯和一系列0.5、1、5和10μL病毒上清液转导细胞。在37℃下孵育3天后,通过流式细胞仪确定荧光阳性细胞的百分比。使用以下公式来计算病毒滴度:
Figure BDA0002820950370000311
流式细胞术
在FACSCanto II流式细胞仪(BD Biosciences)上分析所有样品,并通过FlowJo软件(FlowJo,LLC)处理数据。门控是根据活细胞和单个细胞进行的,而单个细胞是根据其散布形态确定的。
免疫印迹
如前所述,使用含有20mM NaF、20mMβ-甘油磷酸酯、0.3mM钒酸钠、20μg/ml RNaseA、20μg/ml DNase和1/300蛋白酶抑制剂混合物(Sigma-Aldrich,P8340)和磷酸酶抑制剂混合物#2(Sigma-Aldrich,P5726)的Tris裂解缓冲液(50mM Tris–HCl(pH 7.8),150mM NaCl,1%IGEPAL CA-630),进行裂解物的制备和免疫印迹分析。本研究中使用的抗体是从以下来源购买的:小鼠抗GFP(GFP(B-2):sc-9996,1:2,000,Santa Cruz Biotechnology,Inc.),小鼠抗微管蛋白(克隆12G10,1:1,000,Developmental Studies Hybridoma Bank,University of Iowa),小鼠抗Cdk2(克隆M2(sc-163),1:1,000,Santa CruzBiotechnology,Inc.)。用于蛋白质印迹分析的二抗是山羊抗小鼠(Thermo Scientific,31430)和山羊抗兔(Thermo Scientific,31460)。小鼠抗微管蛋白杂交瘤细胞系(克隆#12G10)由J.Frankel和E.M.Nelson在NICHD的主持下开发,并由Developmental StudiesHybridoma Bank维护。蛋白质水平通过BioRad ChemiDoc MP成像系统上的Pierce ECL蛋白质印迹底物可视化,并使用Bio-Rad Image Lab软件(version 4.1build 16)进行分析。
使用的DNA寡核苷酸
第一策略:
双下划线:与tracrRNA序列的3'同源性
弯曲下划线:与tracrRNA序列的5'同源性
斜体:与限制酶位点序列的同源性
下划线:gRNA编码序列(PAM特异)
粗体:AsCpf1 tracrRNA序列
SpV1-SpV2-R:(3C合成寡核苷酸)–SEQ ID NO:1
Figure BDA0002820950370000321
SpV2-SpV3-R:(3C合成寡核苷酸)–SEQ ID NO:2
Figure BDA0002820950370000322
SpV2-SaV1-R:(3C合成寡核苷酸)–SEQ ID NO:3
Figure BDA0002820950370000323
SpV2-NmV1-R:(3C合成寡核苷酸)–SEQ ID NO:4
Figure BDA0002820950370000331
SpV2-As-R:(3C合成寡核苷酸)–SEQ ID NO:5
Figure BDA0002820950370000332
pLKO-1-Seq-F:(SANGER测序寡核苷酸)–SEQ ID NO:6
5’-ATTCATAATGATAGTAGGAGGCTTGGTAGG-3’
增强策略:
Figure BDA0002820950370000333
与h7SK序列的3'同源性
Figure BDA0002820950370000334
与hU6序列的5'同源性
Figure BDA0002820950370000335
与crRNA的分子内同源性
下划线:gRNA编码序列(PAM特异)
NHT-NHT(3C合成寡核苷酸)-SEQ ID NO:11
Figure BDA0002820950370000336
GFP2-NHT(3C合成寡核苷酸)-SEQ ID NO:12
Figure BDA0002820950370000337
NHT-GFP2(3C合成寡核苷酸)-SEQ ID NO:13
Figure BDA0002820950370000338
GFP1-GFP2(3C合成寡核苷酸)-SEQ ID NO:14
Figure BDA0002820950370000339
NHT-Cdk2(3C合成寡核苷酸)-SEQ ID NO:15
Figure BDA00028209503700003310
Cdc27-NHT(3C合成寡核苷酸)-SEQ ID NO:16
Figure BDA0002820950370000341
Cdc27-Cdk2(3C合成寡核苷酸)-SEQ ID NO:17
Figure BDA0002820950370000342
参考文献
1.Kim,H.K.et al.In vivo high-throughput profiling of CRISPR-Cpf1activity.Nat Methods (2016).doi:10.1038/nmeth.4104
2.Han,K.et al.Synergistic drug combinations for cancer identified ina CRISPR screen for pairwise genetic interactions.Nat.Biotechnol.35,463–474(2017).
3.Mali,P.et al.RNA-guided human genome engineering via Cas9.Science(80-.).339,823–826(2013).
4.Cong,L.et al.Multiplex genome engineering using CRISPR/Cassystems.Science(80-.).339,819–823(2013).
5.Ran,F.A.et al.In vivo genome editing using Staphylococcus aureusCas9.Nature 520,186–191(2015).
6.Kleinstiver,B.P.et al.Genome-wide specificities of CRISPR-Cas Cpf1nucleases in human cells.Nat Biotechnol(2016).doi:10.1038/nbt.3620
7.Hou,Z.et al.Efficient genome engineering in human pluripotent stemcells using Cas9 from Neisseria meningitidis.Proc.Natl.Acad.Sci.110,15644–15649(2013).
8.Kuate,S.,Marino,M.P.&Reiser,J.Analysis of Partial Recombinants inLentiviral Vector Preparations.Hum.Gene Ther.Methods 25,126–135(2014).
9.Sack,L.M.,Davoli,T.,Xu,Q.,Li,M.Z.&Elledge,S.J.Sources of Error inMammalian Genetic Screens.G3:Genes|Genomes|Genetics 6,2781–2790(2016).
10.Miller,A.D.&Buttimore,C.Redesign of retrovirus packaging celllines to avoid recombination leading to helper virusproduction.Mol.Cell.Biol.6,2895–902(1986).
11.Barlett,M.M.,Erickson,M.J.&Meyer,R.J.Recombination betweendirectly repeated origins of conjugative transfer cloned in M13 bacteriophageDNA models ligation of the transferred plasmid strand.Nucleic Acids Res.18,3579–86(1990).
12.Chen,B.et al.Dynamic Imaging of Genomic Loci in Living Human Cellsby an Optimized CRISPR/Cas System.Cell 155,1479–1491(2013).
13.Lorenz,R.et al.ViennaRNA Package 2.0.Algorithms Mol.Biol.6,26(2011).
14.Konermann,S.et al.Genome-scale transcriptional activation by anengineered CRISPR-Cas9 complex.Nature 517,583–588(2015).
15.Tzelepis,K.et al.A CRISPR Dropout Screen Identifies GeneticVulnerabilities and Therapeutic Targets in Acute Myeloid Leukemia.Cell Rep17,1193–1205(2016).
16.Chen,B.et al.Dynamic imaging of genomic loci in living human cellsby an optimized CRISPR/Cas system.Cell 155,1479–1491(2013)。
序列表
<110> 法兰克福大学
<120> 用固定的向导RNA对生成基因编辑载体的方法
<130> U30844WO
<140> EP18176677.5
<141> 2018-06-08
<150> PCT/EP2019/065167
<150> 2019-06-11
<160> 44
<170> PatentIn version 3.5
<210> 1
<211> 92
<212> DNA
<213> 人工
<220>
<223> 诱变寡核苷酸
<400> 1
gtttccagca tagctcttaa acccgtcctc gaagttcatc accgttaacg gtcgccctcg 60
aacttcacct gttttagagc tagaaatagc aa 92
<210> 2
<211> 85
<212> DNA
<213> 人工
<220>
<223> 诱变寡核苷酸
<400> 2
cttgctctag ctctaaaact gcgattttct ctcatacaac gttaacggct gaatgagaaa 60
gtaaaaggtt taagagctat gctgg 85
<210> 3
<211> 87
<212> DNA
<213> 人工
<220>
<223> 诱变寡核苷酸
<400> 3
ctgtttccag agtactaaaa ctgcgatttt ctctcataca acgttaacgg ctgaatgaga 60
aagtaaaagg tttaagagct atgctgg 87
<210> 4
<211> 83
<212> DNA
<213> 人工
<220>
<223> 诱变寡核苷酸
<400> 4
agaaagggag ctacaacatg gactttgccc ataagtacgt taacggctga atgagaaagt 60
aaaaggttta agagctatgc tgg 83
<210> 5
<211> 106
<212> DNA
<213> 人工
<220>
<223> 诱变寡核苷酸
<400> 5
ttcgaccgac aattaaaaaa gcaactgctg aatgagaaag atctacaaga gtagaaatta 60
cgttaacggc tgaatgagaa agtaaaaggt ttaagagcta tgctgg 106
<210> 6
<211> 30
<212> DNA
<213> 人工
<220>
<223> 诱变寡核苷酸
<400> 6
attcataatg atagtaggag gcttggtagg 30
<210> 7
<211> 98
<212> RNA
<213> 人工
<220>
<223> tracrRNA
<220>
<221> misc_feature
<222> (1)..(20)
<223> n为a、c、g或u
<400> 7
nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuu 98
<210> 8
<211> 76
<212> DNA
<213> 人工
<220>
<223> tracrRNA
<400> 8
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60
ggcaccgagt cggtgc 76
<210> 9
<211> 86
<212> DNA
<213> 人工
<220>
<223> tracrRNA
<400> 9
gttttagagc taggctggaa acagcatagc aagtttaaat aaggctagtc cgttatcaac 60
ttgaaaaagt ggcaccgagt cggtgc 86
<210> 10
<211> 82
<212> DNA
<213> 人工
<220>
<223> tracrRNA
<400> 10
gttttagagc tagagcaagc tctagcaagt taaaataagg ctagtccgaa tagaacttcc 60
acaagtggca ggcagtgcct gc 82
<210> 11
<211> 114
<212> DNA
<213> 人工
<220>
<223> 诱变寡核苷酸
<400> 11
gaaaggacga aacaccgtca ggatcagggt gtatggcgtt ttagagctat gcttttttaa 60
aaaagcatag ctctaaaacc tcgcacccat atagcaagcc gaggtaccca agcg 114
<210> 12
<211> 114
<212> DNA
<213> 人工
<220>
<223> 诱变寡核苷酸
<400> 12
gaaaggacga aacaccgtca ggatcagggt gtatggcgtt ttagagctat gcttttttaa 60
aaaagcatag ctctaaaacc gatgttgtgg cggatcttgc gaggtaccca agcg 114
<210> 13
<211> 114
<212> DNA
<213> 人工
<220>
<223> 诱变寡核苷酸
<400> 13
gaaaggacga aacaccggaa gggcatcgac ttcaagggtt ttagagctat gcttttttaa 60
aaaagcatag ctctaaaacg catgttgtgg cggatcttgc gaggtaccca agcg 114
<210> 14
<211> 114
<212> DNA
<213> 人工
<220>
<223> 诱变寡核苷酸
<400> 14
gaaaggacga aacaccggaa gggcatcgac ttcaagggtt ttagagctat gcttttttaa 60
aaaagcatag ctctaaaacc gatgttgtgg cggatcttgc gaggtaccca agcg 114
<210> 15
<211> 96
<212> DNA
<213> 人工
<220>
<223> 诱变寡核苷酸
<400> 15
gaaaggacga aacaccgaag cagagagatc tctcggagtt tagagacgct cgtctctaaa 60
cccatcaggc ggaagctttt tcgaggtacc caagcg 96
<210> 16
<211> 96
<212> DNA
<213> 人工
<220>
<223> 诱变寡核苷酸
<400> 16
gaaaggacga aacaccgaaa aagcttccgc ctgatgggtt tagagacgct cgtctctaaa 60
cagatgcggt tttcctcgca gcgaggtacc caagcg 96
<210> 17
<211> 96
<212> DNA
<213> 人工
<220>
<223> 诱变寡核苷酸
<400> 17
gaaaggacga aacaccgaca ggttgccagt aaaaacagtt tagagacgct cgtctctaaa 60
cctcccgtca acttgtttct gcgaggtacc caagcg 96
<210> 18
<211> 3
<212> DNA
<213> 人工
<220>
<223> PAM序列
<220>
<221> misc_feature
<222> (1)..(1)
<223> n为a、c、g或t
<400> 18
ngg 3
<210> 19
<211> 3
<212> DNA
<213> 人工
<220>
<223> PAM序列
<220>
<221> misc_feature
<222> (1)..(1)
<223> n为a、c、g或t
<400> 19
nag 3
<210> 20
<211> 4
<212> DNA
<213> 人工
<220>
<223> PAM序列
<220>
<221> misc_feature
<222> (1)..(1)
<223> n为a、c、g或t
<400> 20
ngcg 4
<210> 21
<211> 4
<212> DNA
<213> 人工
<220>
<223> PAM序列
<220>
<221> misc_feature
<222> (1)..(1)
<223> n为a、c、g或t
<400> 21
ngag 4
<210> 22
<211> 4
<212> DNA
<213> 人工
<220>
<223> PAM序列
<220>
<221> misc_feature
<222> (1)..(1)
<223> n为a、c、g或t
<220>
<221> misc_feature
<222> (4)..(4)
<223> n为a、c、g或t
<400> 22
ngan 4
<210> 23
<211> 4
<212> DNA
<213> 人工
<220>
<223> PAM序列
<220>
<221> misc_feature
<222> (1)..(1)
<223> n为a、c、g或t
<220>
<221> misc_feature
<222> (3)..(3)
<223> n为a、c、g或t
<400> 23
ngng 4
<210> 24
<211> 6
<212> DNA
<213> 人工
<220>
<223> PAM序列
<220>
<221> misc_feature
<222> (1)..(2)
<223> n为a、c、g或t
<400> 24
nngrrt 6
<210> 25
<211> 5
<212> DNA
<213> 人工
<220>
<223> PAM序列
<220>
<221> misc_feature
<222> (1)..(2)
<223> n为a、c、g或t
<400> 25
nngrr 5
<210> 26
<211> 6
<212> DNA
<213> 人工
<220>
<223> PAM序列
<220>
<221> misc_feature
<222> (1)..(2)
<223> n为a、c、g或t
<220>
<221> misc_feature
<222> (6)..(6)
<223> n为a、c、g或t
<400> 26
nngrrn 6
<210> 27
<211> 6
<212> DNA
<213> 人工
<220>
<223> PAM序列
<220>
<221> misc_feature
<222> (1)..(3)
<223> n为a、c、g或t
<400> 27
nnnrrt 6
<210> 28
<211> 8
<212> DNA
<213> 人工
<220>
<223> PAM序列
<220>
<221> misc_feature
<222> (1)..(4)
<223> n为a、c、g或t
<400> 28
nnnngatt 8
<210> 29
<211> 7
<212> DNA
<213> 人工
<220>
<223> PAM序列
<220>
<221> misc_feature
<222> (1)..(2)
<223> n为a、c、g或t
<400> 29
nnagaaw 7
<210> 30
<211> 6
<212> DNA
<213> 人工
<220>
<223> PAM序列
<220>
<221> misc_feature
<222> (1)..(1)
<223> n为a、c、g或t
<400> 30
naaaac 6
<210> 31
<211> 4
<212> DNA
<213> 人工
<220>
<223> PAM序列
<220>
<221> misc_feature
<222> (4)..(4)
<223> n为a、c、g或t
<400> 31
tttn 4
<210> 32
<211> 229
<212> DNA
<213> 人工
<220>
<223> 诱变寡核苷酸
<400> 32
cttaaaaaag caccgactcg gtgccacttt ttcaagttga taacggacta gccttatttt 60
aacttgctat ttctagctct aaaactaggg ataacagggt aatggcgtta acgtctacct 120
ctcttaaggt agcgtttaag agctatgctg gaaacagcat agcaagttta aataaggcta 180
gtccgttatc aacttgaaaa agtggcaccg agtcggtgct ttttttagg 229
<210> 33
<211> 3
<212> DNA
<213> 人工
<220>
<223> PAM序列
<220>
<221> misc_feature
<222> (1)..(1)
<223> n为a、c、g或t
<400> 33
ngg 3
<210> 34
<211> 5
<212> DNA
<213> 人工
<220>
<223> PAM序列
<220>
<221> misc_feature
<222> (1)..(2)
<223> n为a、c、g或t
<400> 34
nngrr 5
<210> 35
<211> 8
<212> DNA
<213> 人工
<220>
<223> PAM序列
<220>
<221> misc_feature
<222> (1)..(4)
<223> n为a、c、g或t
<400> 35
nnnngatt 8
<210> 36
<211> 3
<212> DNA
<213> 人工
<220>
<223> PAM序列
<220>
<221> misc_feature
<222> (3)..(3)
<223> n为a、c、g或t
<400> 36
ttn 3
<210> 37
<211> 23
<212> DNA
<213> 人工
<220>
<223> 诱变寡核苷酸
<220>
<221> misc_feature
<222> (1)..(21)
<223> n为a、c、g或t
<400> 37
nnnnnnnnnn nnnnnnnnnn ncc 23
<210> 38
<211> 158
<212> RNA
<213> 人工
<220>
<223> 引导RNA
<220>
<221> misc_feature
<222> (1)..(20)
<223> n为a、c、g或u
<400> 38
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaggccaaca ugaggaucac ccaugucugc 60
agggccuagc aaguuaaaau aaggcuaguc cguuaucaac uuggccaaca ugaggaucac 120
ccaugucugc agggccaagu ggcaccgagu cggugcuu 158
<210> 39
<211> 76
<212> DNA
<213> 人工
<220>
<223> tracrRNA
<400> 39
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60
ggcaccgagt cggtgc 76
<210> 40
<211> 86
<212> DNA
<213> 人工
<220>
<223> tracrRNA
<400> 40
gtttaagagc tatgctggaa acagcatagc aagtttaaat aaggctagtc cgttatcaac 60
ttgaaaaagt ggcaccgagt cggtgc 86
<210> 41
<211> 82
<212> DNA
<213> 人工
<220>
<223> tracrRNA
<400> 41
gttttagagc tagagcaagc tctagcaagt taaaataagg ctagtccgaa tagaacttcc 60
acaagtggca ggcagtgcct gc 82
<210> 42
<211> 118
<212> DNA
<213> 人工
<220>
<223> 诱变寡核苷酸
<400> 42
gccgcttggg tacctcgaat taattaatgt taattaagtt ttagagctat gcttttttaa 60
aaaagcatag ctctaaaaca ttaccctgtt atccctattc ggtgtttcgt cctttcca 118
<210> 43
<211> 114
<212> DNA
<213> 人工
<220>
<223> 诱变寡核苷酸
<400> 43
gcgaacccat ggagcgttct aggcggtgtt gtagccaaaa tctcgatacg aaaaaatttt 60
ttcgtatcga gattttgcgg tatgtgggac taggactgcc acaaagcagg aaag 114
<210> 44
<211> 114
<212> DNA
<213> 人工
<220>
<223> 诱变寡核苷酸
<220>
<221> misc_feature
<222> (22)..(22)
<223> n为a、c、g或t
<220>
<221> misc_feature
<222> (27)..(27)
<223> n为a、c、g或t
<220>
<221> misc_feature
<222> (32)..(32)
<223> n为a、c、g或t
<220>
<221> misc_feature
<222> (35)..(35)
<223> n为a、c、g或t
<220>
<221> misc_feature
<222> (82)..(82)
<223> n为a、c、g或t
<220>
<221> misc_feature
<222> (85)..(85)
<223> n为a、c、g或t
<220>
<221> misc_feature
<222> (91)..(91)
<223> n为a、c、g或t
<220>
<221> misc_feature
<222> (97)..(97)
<223> n为a、c、g或t
<400> 44
gaaaggacga aacaccggtc gntctancag tnaancagtt ttagagctat gcttttttaa 60
aaaagcatag ctctaaaacg cngtnagacg ngagttnggc gaggtaccca agcg 114

Claims (20)

1.一种用于产生用于表达固定的向导RNA对的共价闭合环状(ccc)DNA载体的方法,该方法包括以下步骤:
(a)提供增强的受体载体,其包含:(x)两个反向的增强的gRNA表达盒,其中每个增强的gRNA表达盒按该顺序包括 :(i)任选的RNA启动子,(ii)gRNA占位符序列,和(iii)crRNA序列;以及(y)tracrRNA表达盒;
(b)提供增强的诱变DNA引物,其包含两个感兴趣的gRNA编码序列和能够介导该诱变DNA引物与所述两个反向的增强的gRNA表达盒结合的同源区域;以及
(c)使用所述受体载体和所述诱变DNA引物产生cccDNA载体。
2.根据权利要求1所述的方法,其中每个gRNA编码序列的长度为至少10个核苷酸至200个核苷酸,更优选10至50个,更优选10至30个,更优选15至30个,更优选15至25个,最优选17至23个,甚至更优选长度为约20个核苷酸。
3.根据权利要求1或2所述的方法,其中所述方法被用来产生基于共价闭合环状(ccc)DNA的向导RNA表达载体或载体文库,其中每个载体包含至少两个不同的gRNA的确定的组合。
4.一种载体文库,其能够通过根据权利要求1至3中任一项所述的用于产生共价闭合环状(ccc)DNA载体的方法获得。
5.一种用于固定对基因编辑的增强的受体载体,其以直接和不间断的连续顺序包含以下元件:(i)第一RNA启动子,(ii)第一gRNA占位符或gRNA序列,其中(i)和(ii)处于可操作连接中,(iii)第一crRNA(重复)序列,(iv)任选的连接子,随后是以下元件,与(i)至(iii)相比每个元件的方向都相反:(v)第二crRNA序列,( vi)第二gRNA占位符或gRNA序列,(vii)第二RNA启动子,其中(vii)和(vi)处于可操作连接中;所述增强的受体载体还包含tracrRNA表达盒。
6.一种核酸,其包含与野生型tracrRNA序列相比具有50%至95%的序列同一性的经修饰的tracrRNA序列,并且其中与野生型tracrRNA序列相比,所述经修饰的tracrRNA序列包含至少一个、优选至少两个或三个序列变异。
7.一种用于产生经修饰的tracrRNA序列的方法,该方法包括以下步骤:
a)分析与野生型tracrRNA复合的RNA/DNA或基因组编辑核酸酶的结构,
b)在野生型tracrRNA序列中鉴定至少一个与所述RNA/DNA或基因组编辑核酸酶不接触的残基,优选至少2个、更优选至少3个与所述RNA/DNA或基因组编辑核酸酶不接触的残基,以及
c)突变与RNA/DNA或基因组编辑核酸酶不接触的所述至少一个残基、优选至少2个、更优选至少3个残基,以及
从而获得经修饰的tracrRNA序列,其与野生型tracrRNA序列具有50%至95%的序列同一性,并且其中与野生型tracrRNA序列的结合亲和力相比,所述经修饰的tracrRNA序列保持至少50%、更优选80%、更优选90%、95%、97%、最优选99%的与RNA/DNA或基因组编辑核酸酶的结合亲和力。
8.一种用于产生用于表达固定的向导RNA对的共价闭合环状(ccc)DNA载体的方法,该方法包括以下步骤:
(a)提供受体载体,其包含两个外向[表达方向彼此朝外定向]的 gRNA表达盒,其中每个gRNA表达盒包含gRNA占位符序列和tracrRNA序列,
(b)提供按此顺序包含以下序列的诱变DNA引物
i. 能够结合第一gRNA表达盒的第一同源区域,
ii. 待表达的第一预定gRNA序列,
iii. 接头序列,
iv. 待表达的第二预定gRNA序列,
v. 能够结合第二gRNA表达盒的第二同源区域,
(c)使用所述受体载体和所述诱变DNA引物产生cccDNA载体,
(d)将包含两个外向的RNA启动子序列的启动子片段引入cccDNA载体的接头序列中,以获得用于表达固定的向导RNA对的cccDNA载体。
9.根据权利要求8所述的方法,其中在步骤(a)中,两个gRNA占位符序列被接头分开,并且其中该接头序列与诱变DNA引物中的接头序列相同。
10.根据权利要求8或9所述的方法,其中所述接头序列包含限制性内切酶识别位点,例如用于平末端连接的限制性内切酶识别位点,或用于粘性末端连接的限制性内切酶识别位点。
11.根据权利要求8至10中任一项所述的方法,其中在步骤(c)中,通过以下步骤产生cccDNA载体:
(a’)以单链(ss)噬菌粒载体的形式提供所述受体载体,
(b’)将所述诱变DNA引物退火至所述ss噬菌粒载体,
(c’)从中扩增共价闭合环状(ccc)异源双链dsDNA,以及
(d’)去除残留的野生型噬菌粒载体DNA。
12.根据权利要求8至11中任一项所述的方法,其中在步骤(d)中,通过诱导接头序列中的双链断裂,例如使用限制性内切酶,将所述启动子元件连接到如此诱导的双链断裂双链断裂中,从而将所述启动子片段引入接头序列。
13.根据权利要求8至12中任一项所述的方法,其中至少两个向导RNA表达盒中的一个的tracrRNA序列与该至少两个向导RNA表达盒中的另一个的tracrRNA序列不同。
14.根据权利要求13所述的方法,其中所述一个和所述另一个向导RNA表达盒的tracrRNA序列的特征在于它们的序列同源性为50%至95%,和/或其中所述tracrRNA序列具有与相同或不同的RNA/DNA或基因组编辑核酸酶结合的能力。
15.根据权利要求8至14中任一项所述的方法,其中每个向导RNA编码序列的长度为至少10个核苷酸至200个核苷酸,更优选10至50个,更优选10至30个,更优选15至30个, 更优选15至25个,最优选17至23个,甚至更优选长度为约20个核苷酸。
16.根据权利要求8至15中任一项所述的方法,其中所述方法被用来产生基于共价闭合环状(ccc)DNA的向导RNA表达载体或载体文库,其中每个载体包含至少两个不同的gRNA的确定的组合。
17.一种载体文库,其能够通过根据权利要求8至15中任一项所述的方法获得。
18.一种核酸载体,其用于引入和表达两个不同的向导RNA序列,该载体在外向方向上包含:
(i)第一gRNA表达盒,其包含第一tracrRNA序列和第一gRNA占位符序列,以及
(ii)第二gRNA表达盒,其包含第二tracrRNA序列和第二gRNA占位符序列。
19.根据权利要求18所述的核酸载体,其中所述载体包含在所述第一gRNA表达盒和所述第二gRNA表达盒之间的接头,其中所述接头的侧翼是所述gRNA占位符序列。
20.一种试剂盒,其包含根据权利要求4所述的载体文库、根据权利要求5的增强的受体载体、根据权利要求6所述的核酸或根据权利要求18或19所述的核酸载体。
CN201980038633.2A 2018-06-08 2019-06-11 用固定的向导rna对生成基因编辑载体的方法 Pending CN112424360A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP18176677.5 2018-06-08
EP18176677.5A EP3578658A1 (en) 2018-06-08 2018-06-08 Method for generating a gene editing vector with fixed guide rna pairs
PCT/EP2019/065167 WO2019234258A1 (en) 2018-06-08 2019-06-11 Method for generating a gene editing vector with fixed guide rna pairs

Publications (1)

Publication Number Publication Date
CN112424360A true CN112424360A (zh) 2021-02-26

Family

ID=62567521

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980038633.2A Pending CN112424360A (zh) 2018-06-08 2019-06-11 用固定的向导rna对生成基因编辑载体的方法

Country Status (7)

Country Link
US (1) US20210261954A1 (zh)
EP (2) EP3578658A1 (zh)
JP (1) JP7473969B2 (zh)
CN (1) CN112424360A (zh)
AU (1) AU2019281034A1 (zh)
CA (1) CA3103044A1 (zh)
WO (1) WO2019234258A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116469468A (zh) * 2023-06-12 2023-07-21 北京齐禾生科生物科技有限公司 一种基于贝叶斯模型的编辑基因载体残留检测方法和系统

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111613272B (zh) * 2020-05-21 2023-10-13 西湖大学 程序化框架gRNA及其应用
CN112553246A (zh) * 2020-12-08 2021-03-26 安徽省农业科学院水稻研究所 一种基于CRISPR-SaCas9系统的高效基因组编辑载体及其应用
CN114150001A (zh) * 2021-11-05 2022-03-08 中国农业科学院上海兽医研究所(中国动物卫生与流行病学中心上海分中心) 一种用于弓形虫基因编辑的CRISPR/Cas9载体的构建方法
CN116536309A (zh) * 2022-01-25 2023-08-04 西北农林科技大学 一种改造后的先导编辑系统及其应用

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120149060A1 (en) * 2009-03-06 2012-06-14 Europaisches Laboratorium Fur Molekularbiologie (Embl) Nucleic Acids for Cloning and Expressing Multiprotein Complexes
US20150067921A1 (en) * 2012-09-07 2015-03-05 Sangamo Biosciences, Inc. Fad3 performance loci and corresponding target site specific binding proteins capable of inducing targeted breaks
CN104838001A (zh) * 2012-09-07 2015-08-12 美国陶氏益农公司 用于基因打靶和性状堆叠的工程化转基因整合平台(etip)
US20160153006A1 (en) * 2013-06-17 2016-06-02 The Broad Institute Inc. Optimized crispr-cas double nickase systems, methods and compositions for sequence manipulation
US20160153005A1 (en) * 2013-06-17 2016-06-02 The Broad Institute Inc. Delivery and use of the crispr-cas systems, vectors and compositions for hepatic targeting and therapy
CN105658796A (zh) * 2012-12-12 2016-06-08 布罗德研究所有限公司 用于序列操纵的crispr-cas组分系统、方法以及组合物
US20160186213A1 (en) * 2013-06-17 2016-06-30 The Broad Institute Inc. Delivery, engineering and optimization of tandem guide systems, methods and compositions for sequence manipulation
US20160317677A1 (en) * 2013-12-12 2016-11-03 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for hbv and viral diseases and disorders
US20170369891A1 (en) * 2014-12-16 2017-12-28 Danisco Us Inc. Fungal genome modification systems and methods of use
CN107556389A (zh) * 2012-02-02 2018-01-09 陶氏益农公司 植物反式激活互作基序及其用途
CN108026523A (zh) * 2015-07-06 2018-05-11 帝斯曼知识产权资产管理有限公司 向导rna组装载体

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013109950A1 (en) * 2012-01-20 2013-07-25 Kennesaw State University Research And Services Foundation Methods to mutate circular deoxyribonucleotides
WO2014093701A1 (en) * 2012-12-12 2014-06-19 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof
WO2015040075A1 (en) * 2013-09-18 2015-03-26 Genome Research Limited Genomic screening methods using rna-guided endonucleases
WO2015065964A1 (en) * 2013-10-28 2015-05-07 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions, methods, screens and applications thereof
US10513711B2 (en) * 2014-08-13 2019-12-24 Dupont Us Holding, Llc Genetic targeting in non-conventional yeast using an RNA-guided endonuclease
WO2016106236A1 (en) * 2014-12-23 2016-06-30 The Broad Institute Inc. Rna-targeting system
US10526590B2 (en) * 2015-08-31 2020-01-07 Agilent Technologies, Inc. Compounds and methods for CRISPR/Cas-based genome editing by homologous recombination
US11261439B2 (en) * 2015-09-18 2022-03-01 President And Fellows Of Harvard College Methods of making guide RNA
EP3407918A4 (en) * 2016-01-25 2019-09-04 Excision Biotherapeutics METHOD AND COMPOSITIONS FOR RNA-TREATED TREATMENT OF HIV INFECTIONS
WO2017155714A1 (en) * 2016-03-11 2017-09-14 Pioneer Hi-Bred International, Inc. Novel cas9 systems and methods of use
CN106967716A (zh) * 2016-05-11 2017-07-21 浙江理工大学 双gRNA、双gRNA文库、双gRNA载体文库及其制备方法和应用
AU2017385611B2 (en) * 2016-12-29 2023-11-02 Johann Wolfgang Goethe-Universität Frankfurt am Main Method for generating higher order genome editing libraries

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120149060A1 (en) * 2009-03-06 2012-06-14 Europaisches Laboratorium Fur Molekularbiologie (Embl) Nucleic Acids for Cloning and Expressing Multiprotein Complexes
CN107556389A (zh) * 2012-02-02 2018-01-09 陶氏益农公司 植物反式激活互作基序及其用途
US20150067921A1 (en) * 2012-09-07 2015-03-05 Sangamo Biosciences, Inc. Fad3 performance loci and corresponding target site specific binding proteins capable of inducing targeted breaks
CN104838001A (zh) * 2012-09-07 2015-08-12 美国陶氏益农公司 用于基因打靶和性状堆叠的工程化转基因整合平台(etip)
CN105264067A (zh) * 2012-09-07 2016-01-20 美国陶氏益农公司 Fad3性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白
CN105658796A (zh) * 2012-12-12 2016-06-08 布罗德研究所有限公司 用于序列操纵的crispr-cas组分系统、方法以及组合物
US20160153005A1 (en) * 2013-06-17 2016-06-02 The Broad Institute Inc. Delivery and use of the crispr-cas systems, vectors and compositions for hepatic targeting and therapy
US20160186213A1 (en) * 2013-06-17 2016-06-30 The Broad Institute Inc. Delivery, engineering and optimization of tandem guide systems, methods and compositions for sequence manipulation
CN106062197A (zh) * 2013-06-17 2016-10-26 布罗德研究所有限公司 用于序列操纵的串联指导系统、方法和组合物的递送、工程化和优化
US20160153006A1 (en) * 2013-06-17 2016-06-02 The Broad Institute Inc. Optimized crispr-cas double nickase systems, methods and compositions for sequence manipulation
US20160317677A1 (en) * 2013-12-12 2016-11-03 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for hbv and viral diseases and disorders
US20170369891A1 (en) * 2014-12-16 2017-12-28 Danisco Us Inc. Fungal genome modification systems and methods of use
CN108026523A (zh) * 2015-07-06 2018-05-11 帝斯曼知识产权资产管理有限公司 向导rna组装载体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116469468A (zh) * 2023-06-12 2023-07-21 北京齐禾生科生物科技有限公司 一种基于贝叶斯模型的编辑基因载体残留检测方法和系统
CN116469468B (zh) * 2023-06-12 2023-09-19 北京齐禾生科生物科技有限公司 一种基于贝叶斯模型的编辑基因载体残留检测方法和系统

Also Published As

Publication number Publication date
EP3578658A1 (en) 2019-12-11
CA3103044A1 (en) 2019-12-12
JP2021525542A (ja) 2021-09-27
JP7473969B2 (ja) 2024-04-24
US20210261954A1 (en) 2021-08-26
WO2019234258A1 (en) 2019-12-12
EP3802835A1 (en) 2021-04-14
AU2019281034A1 (en) 2021-01-07

Similar Documents

Publication Publication Date Title
Giuliano et al. Generating single cell–derived knockout clones in mammalian cells with CRISPR/Cas9
US11643669B2 (en) CRISPR mediated recording of cellular events
JP7473969B2 (ja) 固定ガイドrnaペアを用いた遺伝子編集ベクターの作製方法
US20200032294A1 (en) Somatic haploid human cell line
JP2023525304A (ja) 標的二本鎖ヌクレオチド配列の両鎖同時編集のための方法および組成物
US20190264193A1 (en) Protein engineering methods
JP2022526908A (ja) 編集ヌクレオチド配列を編集するための方法および組成物
US20190345483A1 (en) AAV Split Cas9 Genome Editing and Transcriptional Regulation
CA3026110A1 (en) Novel crispr enzymes and systems
CN106852157A (zh) 用于使用h1启动子表达crispr向导rna的组合物和方法
WO2023076898A1 (en) Methods and compositions for editing a genome with prime editing and a recombinase
JP2024503437A (ja) プライム編集効率及び精度を向上させるためのプライム編集因子バリアント、構築物、及び方法
EP3562941B1 (en) Method for generating higher order genome editing libraries
Iyer et al. Efficient homology-directed repair with circular ssDNA donors
JP2023508400A (ja) 遺伝子発現を増強させる哺乳動物配列への標的組込み
CN114144519A (zh) 单碱基置换蛋白以及包含其的组合物
WO2019035485A1 (ja) ゲノム編集酵素の活性を阻害する核酸アプタマー
Garcia et al. One Anti-CRISPR to Rule Them All: Potent Inhibition of Cas9 Homologs Used for Genome Editing
Carusillo Hijacking-DNA-Repair (HDR)-CRISPR promotes seamless gene editing in human primary cells
CN117321201A (zh) 用于增强引导编辑效率和精度的引导编辑器变体、构建体和方法
정의환 Directed evolution of CRISPR-Cas9 to increase its specificity

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination