CN114438169A - 使用CRISPR/Cas系统蛋白靶向消减、富集、和分割核酸的组合物及方法 - Google Patents

使用CRISPR/Cas系统蛋白靶向消减、富集、和分割核酸的组合物及方法 Download PDF

Info

Publication number
CN114438169A
CN114438169A CN202111423939.5A CN202111423939A CN114438169A CN 114438169 A CN114438169 A CN 114438169A CN 202111423939 A CN202111423939 A CN 202111423939A CN 114438169 A CN114438169 A CN 114438169A
Authority
CN
China
Prior art keywords
dna
sequence
sample
crispr
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111423939.5A
Other languages
English (en)
Inventor
M·L·卡朋特
C·D·布斯塔曼特
S·B·古尔格雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ARC Bio LLC
Original Assignee
ARC Bio LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=56127883&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN114438169(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by ARC Bio LLC filed Critical ARC Bio LLC
Publication of CN114438169A publication Critical patent/CN114438169A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本文提供了用于从样品消减靶向的核酸序列、从样品富集目的序列和/或从样品分割序列的方法和组合物。在一个方面,本文提供了富集样品的目的序列的方法,包括:(a)提供包含目的序列和被靶向以待消减的序列的样品,其中所述目的序列占样品的少于30%;(b)将样品与多个CRISPR/Cas系统蛋白‑gRNA复合物接触,其中所述gRNA与靶向序列互补,并由此切割靶向序列。在本文公开的一个实施方案中,该方法进一步包括从样品提取目的序列和被靶向以待消减的序列。

Description

使用CRISPR/Cas系统蛋白靶向消减、富集、和分割核酸的组合 物及方法
本申请是申请号为201580076214.X的中国专利申请(申请日:2015年12 月19日,发明名称:使用CRISPR/Cas系统蛋白靶向消减、富集、和分割核酸 的组合物及方法)的分案申请。
相关申请的交叉引用
本申请要求2014年12月20日提交的美国临时申请序列号No.62/094,980 和2015年7月28日提交的美国临时申请序列号No.62/198,097的优先权。这些 申请的内容通过提述以其整体并入本文。
发明背景
许多人临床DNA样品或样品文库(如源自RNA的cDNA文库)或从组织, 流体或其他宿主材料样品提取的DNA样品含有高度丰富的序列,其信息价值 很小且增加了测序成本。虽然已经开发了消减(deplete)这些序列的方法(例 如通过杂交捕获),但是这些方法通常是耗时的并且可能是低效的。此外, 杂交捕获通常寻求捕获DNA目的序列,同时丢弃剩余的序列。因此,当DNA 目的序列预先未知时(例如当筛选样品以研究所有微生物或非宿主DNA序列 时),通过杂交捕获的消减不是可行的选择。
尽管可以进行人样品的鸟枪法测序来研究微生物DNA,但是由于成本, 许多样品中微生物DNA的低水平排除了许多复杂和/或目的样品的鸟枪法测 序。这是实情,例如,对于样品的宏基因组分析,其中样品含有多于一个物 种的生物体(真核生物,原核生物或病毒生物体)。例如,源自全血的DNA文 库通常含有>99%的人DNA。因此,为了从鸟枪法测序检测人血液中循环的 感染原,需要测序到非常高的覆盖范围以确保足够的覆盖。因此与测序高人 类DNA样品相关的大量成本提供了相对少的宏基因组数据。因此,许多人组 织DNA样品被认为不适合进行宏基因组测序只是因为数据产量与所需资源 相比是较低的。因此,本领域需要增加高宿主DNA样品中的微生物DNA产 量,特别是当测量高宿主内源性(HHE)DNA样品时,增加待测序的微生物DNA的百分比。
DNA提取的近期进展提供了一些测序技术,从而指出宏基因组学领域的 重点从PCR扩增的16S核糖体RNA标记转到整个宏基因组的鸟枪法测序。然 而,由于在整体样品材料中微生物DNA的百分比较低,因此在对HHE DNA 样品进行测序时,鸟枪法测序可能产生不理想的结果。此外,鸟枪法测序通 常不能提供足够的信息以在宏基因组分析中达到准确的分辨率,特别是当所 选择的分子(例如16S核糖体RNA)仅代表单一谱系(lineage)时。此外,16S核 糖体RNA谱系通常不能区分病原体与密切相关的细菌的非致病菌株,而这是 临床宏基因组分析的关键目标。
相反,对于宏基因组分析而言使用全基因组DNA和RNA序列是优选的, 因为它提供了整个宏基因组的信息。因此,本领域需要提供用于宏基因组分 析的DNA和RNA测序技术以得到改进的分辨率。例如,肥胖和正常体重患者 的粪便材料的宏基因组的全基因组分析揭示了微生物群落结构的高度可重 复的差异。这些材料往往具有非常高的微生物DNA含量(>99%的微生物和<1% 的人)。
相比之下,源自许多其他组织(包括人血液,阴道,鼻粘膜和肺)的测序 文库通常含有>90%的人DNA和<10%的微生物DNA。虽然具有<10%微生物 DNA的样品仍然可以通过足够的测序获得足够的信息用于宏基因组分析,但 是用较少目标DNA的标本测序所需的量是昂贵的,因此对于许多研究人员而 言是不能维持的。
因此,本领域中需要得到用于宏基因组分析的低成本、有效的方法和组 合物。本文提供了这些方法和组合物。
本文引用的所有专利,专利申请,出版物,文献,网络链接和论文均通 过体术以其整体并入本文。
发明简述
本文提供了用于从样品消减靶向的核酸序列、从样品富集目的序列和/ 或从样品分割序列(partitioning of sequence)的方法和组合物。所述方法和 组合物适用于生物,临床,法医和环境样品。
在一个方面,提供了富集样品的目的序列的方法,包括:(a)提供包含目 的序列和被靶向以待消减的序列的样品,其中所述目的序列占所述样品的少 于30%;(b)使所述样品与多个CRISPR/Cas系统蛋白-gRNA复合物接触,其中 所述gRNA与靶向序列互补,并由此切割靶向序列。在本文公开的一个实施 方案中,该方法还包括从所述样品提取目的序列和被靶向以待消减的序列。 在本文公开的一个实施方案中,该方法还包括将提取的序列片段化。在本文 公开的一个实施方案中,该方法还包括将片段化的提取序列的5’和3’端接头连接。在本文公开的一个实施方案中,通过大小排阻去除切割的靶向序列。 在本文公开的一个实施方案中,通过使用生物素去除切割的靶向序列。在本 文公开的一个实施方案中,该方法还包括扩增所述目的序列。在本文公开的 一个实施方案中,被靶向以待消减的序列后接着是前间区序列临近基序 (Protospacer Adjacent Morif)或(PAM)序列。在本文公开的一个实施方案中, 该方法包括用至少102个特别的(unique)CRISPR/Cas系统蛋白-gRNA复合物 与样品接触。在本文公开的一个实施方案中,样品是生物样品、临床样品、 法医样品或环境样品的任一种。在本文公开的一个实施方案中,样品包含被 靶向以待消减的宿主核酸序列和目的非宿主核酸序列。在本文公开的一个实 施方案中,非宿主核酸序列包括微生物核酸序列。在本文公开的一个实施方 案中,微生物核酸序列是细菌、病毒或真核寄生核酸序列。在本文公开的一 个实施方案中,使样品与CRISPR/Cas系统蛋白-gRNA复合物接触,其中所述 gRNA与核糖体RNA序列对应的DNA互补。在本文公开的一个实施方案中, 使样品与CRISPR/Cas系统蛋白-gRNA复合物接触,其中所述gRNA与线粒体 DNA互补。在本文公开的一个实施方案中,使样品与CRISPR/Cas系统蛋白 -gRNA复合物接触,其中所述gRNA与编码球蛋白的序列、编码转座子的序 列、编码逆转录病毒序列的序列、包含端粒序列的序列、包含亚端粒重复的 序列、包含着丝粒序列的序列、包含内含子序列的序列、包含Alu重复的序 列、包含SINE重复的序列、包含LINE重复的序列、包含双核酸重复的序列、 包含三核酸重复的序列、包括四核酸重复的序列、包含多聚A重复的序列、 包含多聚T重复的序列、包含多聚C重复的序列、包含多聚G重复的序列、包 含富含AT的序列的序列、或包含富含GC的序列的序列是互补的。在本文公 开的一个实施方案中,提取的核酸包括单链DNA,双链DNA,单链RNA, 双链RNA,cDNA,合成DNA,人工DNA和DNA/RNA杂交体的任一种。在 本文公开的一个实施方案中,目的序列占所述提取的核酸的少于10%。在本 文公开的一个实施方案中,目的序列占所述提取的核酸的少于5%。在本文 公开的一个实施方案中,CRISPR/Cas系统蛋白是Cas9、Cpf1、Cas3、Cas8a-c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2、或Cm5。在本文公开的一个实施 方案中,CRISPR/Cas系统蛋白是Cas9。在本文公开的一个实施方案中, CRISPR/Cas系统蛋白是无催化活性的,例如所述无催化活性的CRISPR/Cas 系统蛋白是dCas9。在本文公开的一个实施方案中,CRISPR/Cas系统蛋白是 CRISPR/Cas系统蛋白切口酶,例如Cas9切口酶。在本文公开的一个实施方案 中,CRISPR/Cas系统蛋白是热稳定的。在本文公开的一个实施方案中,方法 还包括用接头特异性PCR扩增步骤(b)的产物。在本文公开的一个实施方案中, 方法还包括用具有核酸外切酶活性的酶来处理步骤(b)的产物。在本文公开的一个实施方案中,所述酶是核酸外切酶III或BAL-31。在本文公开的一个实 施方案中,方法还包括使用阳性对照靶序列。在本文公开的一个实施方案中, 方法还包括使用阴性对照gRNA。在本文公开的一个实施方案中,样品选自 全血,血浆,血清,眼泪,唾液,粘液,脑脊液,牙齿,骨,指甲,粪便, 尿液,组织和活检样品。
在另一个方面,本文提供了一种富集样品的方法,包括:(a)提供包含线 粒体DNA和非线粒体DNA的样品,其中所述线粒体DNA和非线粒体DNA是 接头连接的,且其中所述接头连接至线粒体DNA和非线粒体DNA的5’和3’ 端;(b)使所述样品与多个CRISPR/Cas系统蛋白-gRNA复合物接触,其中 gRNA与线粒体DNA互补,由此产生仅接头连接于一端上的线粒体DNA和接 头连接于5’和3’端二者上的非线粒体DNA;及(c)富集样品的非线粒体DNA。 在本文公开的一个实施方案中,步骤(c)包括用接头特异性PCR扩增步骤(b) 的产物。在本文公开的一个实施方案中,步骤(c)包括用具有核酸外切酶活性 的酶来处理步骤(b)的产物。在本文公开的一个实施方案中,所述酶是核酸外 切酶III或BAL-31。在本文公开的一个实施方案中,该方法在用于分析基因 组DNA的方法之后进行,所述分析基因组DNA的方法包括用插入酶处理分 离自细胞群体的DNA以产生多个带标签的非线粒体基因组DNA片段,由此 还生成残余量的带标签的线粒体DNA。在本文公开的一个实施方案中,该方 法还包括从样品提取线粒体DNA和非线粒体DNA。在本文公开的一个实施 方案中,该方法还包括将提取的序列片段化。在本文公开的一个实施方案中, 通过大小排阻去除线粒体DNA。在本文公开的一个实施方案中,通过使用生 物素去除线粒体DNA。在本文公开的一个实施方案中,富集样品包括扩增所 述非线粒体DNA。在本文公开的一个实施方案中,该方法包括用至少102个 特别的CRISPR/Cas系统蛋白-gRNA复合物与样品接触。在本文公开的一个实 施方案中,CRISPR/Cas系统蛋白是Cas9、Cpf1、Cas3、Cas8a-c、Cas10、Cse1、 Csy1、Csn2、Cas4、Csm2、或Cm5。在本文公开的一个实施方案中,CRISPR/Cas 系统蛋白是Cas9。在本文公开的一个实施方案中,CRISPR/Cas系统蛋白是无 催化活性的,例如dCas9。在本文公开的一个实施方案中,CRISPR/Cas系统 蛋白是CRISPR/Cas系统蛋白切口酶,例如Cas9切口酶。在本文公开的一个实 施方案中,CRISPR/Cas系统蛋白是热稳定的。在本文公开的一个实施方案中, 富集包括用接头特异性PCR扩增步骤(b)的产物。在本文公开的一个实施方案 中,富集包括用具有核酸外切酶活性的酶来处理步骤(b)的产物。在本文公开 的一个实施方案中,所述酶是核酸外切酶III或BAL-31。在本文公开的一个 实施方案中,该方法还包括使用阳性对照靶序列。在本文公开的一个实施方 案中,该方法还包括使用阴性对照gRNA。在本文公开的一个实施方案中, 样品选自全血,血浆,血清,眼泪,唾液,粘液,脑脊液,牙齿,骨,指甲, 粪便,尿液,组织和活检样品。
在另一个方面,本文提供了一种富集样品的方法,包括:(a)提供包含来 自第一基因组的核酸和来自第二基因组的核酸的样品,其中所述来自第一基 因组的核酸接头连接于其5’和3’端上,且其中所述来自第二基因组的核酸接 头连接于其5’和3’端上;(b)使所述样品与多个CRISPR/Cas系统蛋白-gRNA复 合物接触,其中gRNA与来自第一基因组的核酸中的靶向位点互补,由此产 生仅接头连接于一端上的来自第一基因组的核酸和接头连接于5’和3’端二者 上的来自第二基因组的核酸;及(c)富集样品的来自第二基因组的核酸。在本 文公开的一个实施方案中,样品还包含来自其他基因组的核酸。在本文公开 的一个实施方案中,第一基因组是宿主基因组,且第二基因组是非宿主基因 组。在本文公开的一个实施方案中,该方法包括用至少102个特别的 CRISPR/Cas系统蛋白-gRNA复合物与样品接触。在本文公开的一个实施方案 中,所述核酸选自下组:单链DNA,单链RNA,双链DNA,双链RNA, DNA/RNA杂交体、cDNA,合成DNA和人工DNA。在本文公开的一个实施 方案中,所述核酸是双链DNA。在本文公开的一个实施方案中,所述核酸是 DNA,且其中步骤(b)的接触产生接头连接于5’端上而非3’端上的第一基因组 -DNA和DNA接头连接于5’和3’端二者上的第二基因组。在本文公开的一个 实施方案中,所述核酸是DNA。在本文公开的一个实施方案中,DNA是基 因组DNA。在本文公开的一个实施方案中,CRISPR/Cas系统蛋白是Cas9、 Cpf1、Cas3、Cas8a-c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2、或Cm5。 在本文公开的一个实施方案中,CRISPR/Cas系统蛋白是Cas9。在本文公开的 一个实施方案中,第一基因组核酸中的靶向位点后面接着是能与Cas9结合的 前间区序列临近基序或(PAM)序列。在本文公开的一个实施方案中, CRISPR/Cas系统蛋白是无催化活性的,例如dCas9。在本文公开的一个实施方案中,CRISPR/Cas系统蛋白是CRISPR/Cas系统蛋白切口酶,例如Cas9切 口酶。在本文公开的一个实施方案中,CRISPR/Cas系统蛋白是热稳定的。在 本文公开的一个实施方案中,第一基因组是选自下组的生物体:人,牛,马, 羊,猪,猴,狗,猫,沙鼠,鸟,小鼠和大鼠。在本文公开的一个实施方案 中,第二基因组来自原核生物。在本文公开的一个实施方案中,第二基因组 来自真核生物。在本文公开的一个实施方案中,第二基因组来自寄生生物。 在本文公开的一个实施方案中,第二基因组来自病毒,细菌,真菌或原生动 物。在本文公开的一个实施方案中,接头连接的第一基因组核酸和接头连接 的第二基因组核酸为50-1000bp。在本文公开的一个实施方案中,第二基因 组核酸占样品中总核酸的少于50%。在本文公开的一个实施方案中,第二基 因组核酸占样品中总核酸的少于5%。在本文公开的一个实施方案中,样品 是生物样品、临床样品、法医样品或环境样品的任一种。在本文公开的一个实施方案中,步骤(c)包括用接头特异性PCR扩增步骤(b)的产物。在本文公开 的一个实施方案中,步骤(c)包括用具有核酸外切酶活性的酶来处理步骤(b) 的产物。在本文公开的一个实施方案中,所述酶是核酸外切酶III或BAL-31。 在本文公开的一个实施方案中,步骤(c)包括通过大小排阻去除宿主核酸。在 本文公开的一个实施方案中,步骤(c)包括通过使用生物素去除宿主核酸。在 本文公开的一个实施方案中,该方法还包括用接头特异性PCR扩增步骤(b) 的产物。在本文公开的一个实施方案中,该方法还包括用具有核酸外切酶活性的酶来处理步骤(b)的产物。在本文公开的一个实施方案中,所述酶是核酸 外切酶III或BAL-31。在本文公开的一个实施方案中,该方法还包括使用阳 性对照靶序列。在本文公开的一个实施方案中,该方法还包括使用阴性对照 gRNA。在本文公开的一个实施方案中,样品选自全血,血浆,血清,眼泪, 唾液,粘液,脑脊液,牙齿,骨,指甲,粪便,尿液,组织和活检样品。
在另一个方面,本文提供了一种富集样品的方法,包括:(a)提供包含宿 主核酸和非宿主核酸的样品,其中所述宿主核酸和非宿主核酸是接头连接的, 且其中所述接头连接至宿主核酸和所述非宿主核酸的5’和3’端;(b)使所述样 品与多个CRISPR/Cas系统蛋白-gRNA复合物接触,其中gRNA与宿主核酸中 的靶向位点互补,由此产生仅接头连接于一端上的宿主核酸和接头连接于5’ 和3’端二者上的非宿主核酸;及(c)富集样品的非宿主核酸。在本文公开的一 个实施方案中,该方法包括用至少102个特别的CRISPR/Cas系统蛋白-gRNA 复合物与样品接触。在本文公开的一个实施方案中,所述核酸选自下组:单 链DNA,单链RNA,双链DNA,双链RNA,DNA/RNA杂交体、cDNA,合 成DNA和人工DNA。在本文公开的一个实施方案中,所述核酸是双链DNA。 在本文公开的一个实施方案中,所述核酸是DNA,且其中步骤(b)的接触产 生接头连接于5’端上而非3’端上的宿主核酸和接头连接于5’和3’端二者上的 非宿主核酸。在本文公开的一个实施方案中,所述核酸是DNA。在本文公开 的一个实施方案中,DNA是基因组DNA。在本文公开的一个实施方案中, CRISPR/Cas系统蛋白是Cas9、Cpf1、Cas3、Cas8a-c、Cas10、Cse1、Csy1、 Csn2、Cas4、Csm2、或Cm5。在本文公开的一个实施方案中,CRISPR/Cas 系统蛋白是Cas9。在本文公开的一个实施方案中,第一基因组核酸中的靶向 位点后面接着是能与Cas9结合的前间区序列临近基序或(PAM)序列。在本文 公开的一个实施方案中,CRISPR/Cas系统蛋白是无催化活性的,例如dCas9。 在本文公开的一个实施方案中,CRISPR/Cas系统蛋白是CRISPR/Cas系统蛋 白切口酶,例如Cas9切口酶。在本文公开的一个实施方案中,CRISPR/Cas 系统蛋白是热稳定的。在本文公开的一个实施方案中,宿主选自下组:人, 牛,马,羊,猪,猴,狗,猫,沙鼠,鸟,小鼠和大鼠。在本文公开的一个实施方案中,非宿主是原核生物。在本文公开的一个实施方案中,非宿主是 真核生物。在本文公开的一个实施方案中,非宿主是寄生生物。在本文公开 的一个实施方案中,非宿主选自下组:病毒,细菌,真菌或原生动物。在本 文公开的一个实施方案中,接头连接的宿主核酸和非宿主核酸为50-1000bp。 在本文公开的一个实施方案中,非宿主核酸占样品中总核酸的少于50%。在 本文公开的一个实施方案中,非宿主核酸占样品中总核酸的少于5%。在本 文公开的一个实施方案中,样品是生物样品、临床样品、法医样品或环境样 品的任一种。在本文公开的一个实施方案中,样品是生物样品、临床样品、 法医样品或环境样品的任一种。在本文公开的一个实施方案中,步骤(c)包括 用接头特异性PCR扩增步骤(b)的产物。在本文公开的一个实施方案中,步骤 (c)包括用具有核酸外切酶活性的酶来处理步骤(b)的产物。在本文公开的一个 实施方案中,所述酶是核酸外切酶III或BAL-31。在本文公开的一个实施方 案中,步骤(c)包括通过大小排阻去除宿主核酸。在本文公开的一个实施方案中,步骤(c)包括通过使用生物素去除宿主核酸。在本文公开的一个实施方案 中,该方法还包括用接头特异性PCR扩增步骤(b)的产物。在本文公开的一个 实施方案中,该方法还包括用具有核酸外切酶活性的酶来处理步骤(b)的产物。 在本文公开的一个实施方案中,所述酶是核酸外切酶III或BAL-31。在本文 公开的一个实施方案中,该方法还包括使用阳性对照靶序列。在本文公开的 一个实施方案中,该方法还包括使用阴性对照gRNA。在本文公开的一个实 施方案中,样品选自全血,血浆,血清,眼泪,唾液,粘液,脑脊液,牙齿, 骨,指甲,粪便,尿液,组织和活检样品。
在另一个方面,本文提供一种消减样品中的靶向序列的方法,包括:(a) 提供包含目的序列和被靶向以待消减的序列的样品;(b)使所述样品与多个 CRISPR/Cas系统蛋白-gRNA复合物接触,其中所述gRNA与靶向序列互补, 并由此产生切割的靶向序列;及(c)使步骤(b)的产物与具有核酸外切酶活性的 酶接触。在本文公开的一个实施方案中,所述酶是核酸外切酶III或BAL-31。 在本文公开的一个实施方案中,CRISPR/Cas系统蛋白是Cas9。在本文公开 的一个实施方案中,被靶向以待消减的序列包括编码球蛋白的序列、编码转 座子的序列、编码逆转录病毒序列的序列、包含端粒序列的序列、包含亚端 粒重复的序列、包含着丝粒序列的序列、包含内含子序列的序列、包含Alu 重复的序列、包含SINE重复的序列、包含LINE重复的序列、包含双核酸重 复的序列、包含三核酸重复的序列、包括四核酸重复的序列、包含多聚A重 复的序列、包含多聚T重复的序列、包含多聚C重复的序列、包含多聚G重复 的序列、包含富含AT的序列的序列、或包含富含GC的序列的序列。在本文 公开的一个实施方案中,该方法包括用至少102个特别的CRISPR/Cas系统蛋 白-gRNA复合物与样品接触。在本文公开的一个实施方案中,CRISPR/Cas 系统蛋白是Cas9、Cpf1、Cas3、Cas8a-c、Cas10、Cse1、Csy1、Csn2、Cas4、 Csm2、或Cm5。在本文公开的一个实施方案中,样品选自全血,血浆,血清, 眼泪,唾液,粘液,脑脊液,牙齿,骨,指甲,粪便,尿液,组织和活检样 品。
在另一个方面,本文提供一种在样品中产生切割的靶向序列的方法,包 括:(a)提供包含目的序列和用于切割的靶向序列的样品;(b)使所述样品与多 个CRISPR/Cas系统蛋白-gRNA复合物接触,其中所述gRNA与靶向序列互补, 并由此产生切割的靶向序列;及(c)将CRISPR/Cas系统蛋白从切割的靶向序 列分离;(d)产生其他的切割的靶向序列;及(e)回收未切割的目的序列。在本 文公开的一个实施方案中,CRISPR/Cas系统蛋白是热稳定的。在本文公开的 一个实施方案中,CRISPR/Cas系统蛋白是热稳定的Cas9。在本文公开的一个实施方案中,将CRISPR/Cas系统蛋白从切割的靶向序列分离是通过将步骤(b) 的混合物的温度提升至至少75℃完成的。在本文公开的一个实施方案中,产 生其他的切割的靶向序列是通过将步骤(b)的混合物的温度降低至至少50℃ 完成的。在本文公开的一个实施方案中,步骤(e)包括用接头特异性PCR扩增 步骤(d)的产物。在本文公开的一个实施方案中,步骤(e)包括用具有核酸外切 酶活性的酶处理步骤(d)的产物。在本文公开的一个实施方案中,所述酶是核 酸外切酶III或BAL-31。在本文公开的一个实施方案中,CRISPR/Cas系统蛋白是Cas9。在本文公开的一个实施方案中,用于切割的靶向序列包括编码球 蛋白的序列、编码转座子的序列、编码逆转录病毒序列的序列、包含端粒序 列的序列、包含亚端粒重复的序列、包含着丝粒序列的序列、包含内含子序 列的序列、包含Alu重复的序列、包含SINE重复的序列、包含LINE重复的序 列、包含双核酸重复的序列、包含三核酸重复的序列、包括四核酸重复的序 列、包含多聚A重复的序列、包含多聚T重复的序列、包含多聚C重复的序列、 包含多聚G重复的序列、包含富含AT的序列的序列、或包含富含GC的序列 的序列。在本文公开的一个实施方案中,该方法包括用至少102个特别的 CRISPR/Cas系统蛋白-gRNA复合物与样品接触。在本文公开的一个实施方案 中,样品选自全血,血浆,血清,眼泪,唾液,粘液,脑脊液,牙齿,骨, 指甲,粪便,尿液,组织和活检样品。
在另一个方面,本文提供了消减样品中的靶向序列的方法,包括:(a) 提供包含目的序列和用于切割的靶向序列的样品;(b)使所述样品与多个 CRISPR/Cas系统蛋白-gRNA复合物接触,其中所述gRNA与靶向序列互补, 由此产生切割的靶向序列,且其中所述CRISPR/Cas系统蛋白是热稳定的;及 (c)将步骤(b)的混合物的温度提升至至少75℃;(d)将步骤(b)的混合物的温度 降低至至少50℃;(e)重复步骤(c)和(d)至少一次;及(f)回收未切割的目的序 列。在本文公开的一个实施方案中,步骤(f)包括用接头特异性PCR扩增步骤 (e)的产物。在本文公开的一个实施方案中,步骤(f)包括用具有核酸外切酶活 性的酶处理步骤(e)的产物。在本文公开的一个实施方案中,所述酶是核酸外 切酶III或BAL-31。在本文公开的一个实施方案中,CRISPR/Cas系统蛋白是 Cas9。在本文公开的一个实施方案中,用于切割的靶向序列包括编码球蛋白 的序列、编码转座子的序列、编码逆转录病毒序列的序列、包含端粒序列的 序列、包含亚端粒重复的序列、包含着丝粒序列的序列、包含内含子序列的 序列、包含Alu重复的序列、包含SINE重复的序列、包含LINE重复的序列、 包含双核酸重复的序列、包含三核酸重复的序列、包括四核酸重复的序列、 包含多聚A重复的序列、包含多聚T重复的序列、包含多聚C重复的序列、包 含多聚G重复的序列、包含富含AT的序列的序列、或包含富含GC的序列的 序列。在本文公开的一个实施方案中,该方法包括用至少102个特别的 CRISPR/Cas系统蛋白-gRNA复合物与样品接触。在本文公开的一个实施方案 中,样品选自:全血,血浆,血清,眼泪,唾液,粘液,脑脊液,牙齿,骨, 指甲,粪便,尿液,组织和活检样品。
在另一个方面,本文提供了用于连续消减样品中的靶向核酸的方法,包 括:(a)提供包含宿主核酸和非宿主核酸的样品,其中所述非宿主核酸包含来 自至少一个已知非宿主生物体的核酸和来自至少一个未知非宿主生物体的 核酸;(b)使所述样品与多个CRISPR/Cas系统蛋白-gRNA复合物接触,其中 将所述gRNA配置为与宿主核酸中的靶向序列杂交,由此切割所述宿主核酸 的一部分;(c)使所述样品与多个CRISPR/Cas系统蛋白-gRNA复合物接触,其 中将所述gRNA配置为与至少一个已知非宿主核酸中的靶向序列杂交,由此切割所述至少一个已知非宿主核酸的一部分;及(d)从未知非宿主生物体分离 所述核酸。在本文公开的一个实施方案中,该方法包括用至少102个特别的 CRISPR/Cas系统蛋白-gRNA复合物与样品接触,所述CRISPR/Cas系统蛋白 -gRNA复合物被配置为与宿主核酸中的靶向序列杂交。该方法包括用至少102个特别的CRISPR/Cas系统蛋白-gRNA复合物与样品接触,所述CRISPR/Cas 系统蛋白-gRNA复合物被配置为与至少一个已知非宿主核酸中的靶向序列 杂交。在本文公开的一个实施方案中,样品选自:全血,血浆,血清,眼泪, 唾液,粘液,脑脊液,牙齿,骨,指甲,粪便,尿液,组织和活检样品。在 本文公开的一个实施方案中,所述来自未知非宿主生物体的核酸占样品中总 核酸的少于5%。在本文公开的一个实施方案中,宿主是人。在本文公开的 一个实施方案中,所述至少一个已知非宿主生物体是链球菌属(Streptococcus) 的菌种。
在另一个方面,本文提供了用于分析基因组DNA的方法,包括:(a)用插 入酶(insertional enzyme)处理分离自样品的细胞群的DNA,以产生多个带标 签的非线粒体基因组DNA片段,由此还产生残余量的带标签的线粒体DNA; (b)根据本文提供的任何相关方法来富集步骤(a)的产物中的非线粒体DNA。 例如,此类富集样品的方法可以包括:(a)提供包含线粒体DNA和非线粒体 DNA的样品,其中所述线粒体DNA和非线粒体DNA是接头连接的,且其中 所述接头连接至线粒体DNA和非线粒体DNA的5’和3’端;(b)使所述样品与多 个CRISPR/Cas系统蛋白-gRNA复合物接触,其中gRNA与线粒体DNA互补, 由此产生仅接头连接于一端上的线粒体DNA和接头连接于5’和3’端二者上 的非线粒体DNA;及(c)富集样品的非线粒体DNA。在本文公开的一个实施 方案中,该方法还包括(a)对带标签的片段的至少一部分进行测序以产生多个 序列读段;及(b)通过将获取自所述序列读段的信息映射(mapping)至该区域, 制作所述细胞基因组的区域的表观遗传学图谱。在本文公开的一个实施方案 中,样品选自全血,血浆,血清,眼泪,唾液,粘液,脑脊液,牙齿,骨, 指甲,粪便,尿液,组织和活检样品。
在另一个方面,本文提供了包含来自第一基因组的DNA和来自第二基因 组的DNA的混合物的组合物,其中所述第一基因组DNA和第二基因组DNA 是接头连接的,且其中所述第一基因组DNA与gRNA-CRISPR/Cas系统蛋白 复合物复合。在本文公开的一个实施方案中,第一基因组来自宿主生物体且 第二基因组来自非宿主生物体。在本文公开的一个实施方案中,CRISPR/Cas 系统蛋白是Cas9。本文公开的任一实施方案中,CRISPR/Cas系统蛋白是热稳 定的。
在另一个方面,本文提供试剂盒。在另一个方面,本文提供包含如下的 试剂盒:(a)CRISPR/Cas系统蛋白;及(b)gRNA,其中所述gRNA与线粒体 DNA互补。在另一个方面,本文提供包含如下的试剂盒:(a)CRISPR/Cas系 统蛋白;(b)gRNA,其中所述gRNA与目的靶标互补;及(c)具有核酸外切酶 活性的酶。在另一个方面,本文提供包含如下的试剂盒:(a)CRISPR/Cas系 统蛋白,其中所述CRISPR/Cas系统蛋白是热稳定的;及(b)gRNA,其中所述gRNA与目的靶标互补。在另一个方面,本文提供包含如下的试剂盒:(a) CRISPR/Cas系统蛋白;(b)第一gRNA组,其中所述gRNA与目的靶标序列互 补,及(c)对照试剂组。在另一个方面,本文提供包含如下的试剂盒:(a)用于 从细胞群分离DNA的试剂;(b)插入酶;(c)CRISPR/Cas系统蛋白;及(d)多个 gRNA,其中所述gRNA与线粒体DNA互补。在本文公开的任一试剂盒中, 试剂盒还包含Y型接头的集合或多聚-G接头的集合。在本文公开的任何试剂盒中,CRISPR/Cas系统蛋白是Cas9。在本文公开的任一试剂盒中,试剂盒还 包含阳性对照试剂组,例如阳性对照试剂组包含核酸片段的集合,其中该片 段包含靶标目的序列,gRNA与所述靶标目的序列至少85%互补。在本文公 开的任一试剂盒中,试剂盒还包含阴性对照试剂组,例如,阴性对照试剂组 包含第二gRNA组,其中所述第二gRNA组表现出与第一gRNA组相比降低的 与靶标目的序列的结合;或者例如阴性对照组试剂组可以包含核酸片段的集 合,其中所述片段与第一gRNA组不超过90%互补。在本文公开的任一种试 剂盒中,试剂盒还包含至少102个特别的gRNA。
在另一方面,本发明提供了消减样品中的靶向序列的方法,包括:提供 包含目的序列和被靶向以待消减的序列的样品;及使样品与多个CRISPR/Cas 系统蛋白-gRNA复合物接触,其中所述gRNA与靶向序列互补,由此产生切 割的靶向序列。在一个相关的方面,本发明提供用于消减与分割样品中的靶 向序列之一项的方法,包括:提供提取自样品的核酸,其中所述提取的核酸 序列包含目的序列和用于消减与分割之一者的靶向序列;提供多个向导RNA (gRNA)-CRISPR/Cas系统蛋白复合物,其中将所述gRNA配置为与不同的靶 向序列杂交;将所述核酸与gRNA-CRISPR/Cas系统蛋白复合物混合,其中多 个gRNA-CRISPR/Cas系统蛋白复合物的至少一部分与靶向序列杂交。在本文 公开的一个实施方案中,该方法还包括从样品提取核酸序列。在本文公开的 一个实施方案中,CRISPR/Cas系统蛋白是Cas9。在本文公开的一个实施方案 中,该方法还包括将提取的核酸片段化。在本文公开的一个实施方案中,该 方法还包括将所述片段化的提取序列的5’和3’端接头连接。在本文公开的一个实施方案中,该方法还包括温育该混合物以切割靶向序列。在本文公开的 一个实施方案中,各个被靶向以待消减的序列后接着是能与源自细菌物种的 Cas9蛋白结合的前间区序列临近基序或(PAM)序列,但其中所述目的序列(欲 富集的)不被gRNA所靶向。在本文公开的一个实施方案中,Cas9蛋白包含无 催化活性的Cas9,其包括之前与其附接的亲和标签(affinity tag),进一步包括 将所述混合物分割为第一部分和第二部分,所述第一部分包括互补靶标特异 性核酸序列,该序列存在于包含向导RNA/Cas9复合物的混合物中,所述第二部分包括未与向导RNA/Cas9复合物结合的片段化的提取的核酸序列,其 中所述分割用亲和标签进行。在本文公开的一个实施方案中,经切割的提取 的核酸序列比未被切割的片段化的提取的核酸序列更小,该方法还包括通过 大小选择性排阻从混合物去除被切割的提取的核酸序列。在本文公开的一个 实施方案中,该方法还包括扩增未被切割的片段化的提取的核酸序列。在本 文公开的一个实施方案中,该方法还包括通过扩增和测序来分析第一和第二 部分的每一个。在本文公开的一个实施方案中,所述样品是生物样品、临床 样品、法医样品或环境样品的任一种。在本文公开的一个实施方案中,提取 的核酸包含宿主核酸序列和非宿主核酸序列。在本文公开的一个实施方案中, 非宿主核酸序列包含微生物核酸序列。在本文公开的一个实施方案中,微生 物核酸序列包括细菌、病毒、和真核寄生核酸序列的任一项。在本文公开的 一个实施方案中,宿主核酸序列的至少一部分包含在用于消减或分割之一者 的靶向序列中。在本文公开的一个实施方案中,所有宿主核酸序列基本上包 含在用于消减或分割之一者的靶向序列中。在本文公开的一个实施方案中, 提取的核酸包含多个不同的核糖体RNA序列且多个不同的靶标特异性gRNA 包含靶核酸序列的至少一部分,所述靶核酸序列经配置与所述多个不同的核 糖体RNA序列的一部分杂交。在本文公开的一个实施方案中,提取的核酸序 列包含多个不同的线粒体核酸序列且多个不同的靶标特异性gRNA包含一个 或多个靶核酸序列,所述靶核酸序列经配置与多个不同的线粒体核酸序列的 一部分杂交。在本文公开的一个实施方案中,提取的核酸序列包含待消减的 靶向核酸序列中的多个不同的重复核酸序列且多个不同的靶标特异性gRNA 包含至少一个能与所述多个不同的重复核酸序列的一部分杂交的靶核酸序 列。在本文公开的一个实施方案中,提取的核酸包括单链DNA,双链DNA, 单链RNA,双链RNA,cDNA,合成DNA,人工DNA和DNA/RNA杂交体的 任一种。在本文公开的一个实施方案中,目的序列占提取的核酸的少于50%。 在本文公开的一个实施方案中,目的序列占提取的核酸的少于5%。
在另一个方面,本发明提供了向导RNA文库,其包含多个靶标特异性向 导RNA,其各自经配置与所选的靶核酸序列杂交,其中各个向导RNA包含能 与Cas9蛋白结合的序列。在本文公开的一个实施方案中,各个所选的靶核酸 序列后面紧接着是前间区序列临近基序。在本文公开的一个实施方案中,靶 标特异性gRNA包括对于与人基因组中所选的靶核酸序列杂交而言合适的 gRNA。在本文公开的一个实施方案中,人基因组包括包含多个不同的重复 核酸序列的核酸序列,且靶标特异性gRNA包含对于与所述多个不同的重复 核酸序列的每一个杂交而言合适的指导元件。
在另一个方面,本文公开的技术涉及使用Cas9-酶介导的方法来选择性 地或靶向地消减和/或选择性地或靶向地分割核酸样品的方法和系统。
在另一个方面,本文公开的技术涉及形成gRNA的文库,其中各个gRNA 适于与被靶向以从总核酸样品中去除的核酸序列杂交,其中所述被靶向的序 列后面是前间区序列临近基序(PAM)序列。通过将gRNA与核酸样品和来源 于细菌菌种的Cas9蛋白混合,所述gRNA与被靶向从而被去除的核酸序列杂 交,并且Cas9酶形成向导RNA/Cas9复合物,其与被靶向从而被去除的核酸 序列结合。随后,可以温育向导RNA/Cas9复合物以切割靶向的核酸序列, 从而将被切割的序列从未切割的核酸序列分离,或从而使与向导RNA/Cas9 复合物结合的靶向序列能够从未与向导RNA/Cas9复合物结合的DNA序列分 割出来。
在另一个方面,本文公开的技术还可用于消减来自含有低水平(例如 <50%)的非宿主核酸的核酸样品的宿主分子
在另一个方面,本文公开的技术包括:1)将基因组DNA样品或测序文库 与Cas9-gRNA复合物的混合物组合,其中所述Cas9-gRNA复合物包含与基因 组中预先定义的位点互补的Cas9蛋白和Cas9相关gRNA;和b)温育反应混合 物以仅切割靶区域。在其中靶向测序文库的实施方案中,Cas9切割会分离两 个测序接头,因此使得这些片段不能被扩增。在基因组DNA被靶向的实施方 案中,Cas9切割会使这些片段足够小以通过大小选择而被去除。
附图简述
图1示出了使用Cas9选择性地切割文库中的靶序列的消减方法的一般示 意图。
图2示出了使用无催化活性的Cas9将文库分割为靶和非靶序列的消减方 法的一般示意图。
图3示出了从测序文库消减线粒体DNA的示例性策略,仅留下非线粒体DNA用于测序。
图4示出了消减实验的结果,其中线粒体DNA消减约44%(通过qPCR测 量)。
图5示出了第二实验的结果,其中使用更多数量的向导RNA并且线粒体 DNA消减约70%(通过qPCR测量)。
图6A示出在线粒体DNA消减之前和之后测序文库的结果。图6B示出了 使用不同数量的gRNA的线粒体DNA的消减。
图7示出了Cas9切口酶介导的DNA消减。
图8示出Cas9介导的消减,然后是核酸外切酶III处理。
图9示出了Cas9介导的消减,然后是核酸外切酶Bal-31处理。
图10示出Cas-9介导的消减期间的生物素标记
图11示出了使用热稳定的Cas9来提高Cas9介导的消减的效率。
发明详述
定义
除非另有定义,否则本文使用的所有技术和科学术语具有与本发明所属 领域的普通技术人员通常理解的相同的含义。尽管与本文所述类似或等同的 任何方法和材料可用于本发明的实践或测试中,但是描述了优选的方法和材 料。
本文提供的章节标题不是对本发明的各个方面或实施方案的限制。因此, 下文定义的术语通过参考整个说明书而更完整地加以定义。
除非另有定义,本文使用的所有技术和科学术语具有与本发明所属领域 的普通技术人员通常理解的相同的含义。Singleton等,DICTIONARY OF MICROBIOLOGY ANDMOLECULAR BIOLOGY,2D ED.,John Wiley and Sons,New York(1994)和Hale&Markham,THEHARPER COLLINS DICTIONARY OF BIOLOGY,Harper Perennial,N.Y.(1991)为技术人员提供 了本文使用的许多术语的一般含义。然而,处于清楚和易于参考的目的,将 一些术语定义如下。
数字范围包括定义范围的数字。
本文所用的术语“样品”涉及材料或材料的混合物,通常是但不一定是液 体形式,其含有一种或多种感兴趣的分析物。
本文使用的术语“核酸样品”表示含有核酸的样品。本文使用的核酸样品 可能是复杂的,因为其含有多个不同的含有序列的分子。来自哺乳动物的基 因组DNA(例如小鼠或人)是复杂样品的类型。复杂样品可以具有多于104、 105、106或107个不同的核酸分子。DNA靶标可以源于任何来源,例如基因组 DNA,cDNA或人工DNA构建体。任何含有核酸的样品,例如由组织培养细 胞或组织样品制成的基因组DNA可以在本文中使用。
术语“核苷酸”旨在包括不仅含有已知嘌呤和嘧啶碱基,而且还含有经修 饰的其它杂环碱基的那些部分。此类修饰包括甲基化嘌呤或嘧啶,酰化嘌呤 或嘧啶,烷基化核糖或其它杂环。此外,术语“核苷酸”包括含有半抗原或荧 光标记的那些部分,并且其可以不仅含有常规的核糖和脱氧核糖糖类,而且 还含有其它糖。修饰的核苷或核苷酸还包括对糖部分的修饰,例如其中一个 或多个羟基被卤素原子或脂族基团取代,或被官能化为醚,胺等。
术语“核酸”和“多核苷酸”在本文中可互换使用。多核苷酸用于描述任何 长度的核酸聚合物,例如大于约2个碱基,大于约10个碱基,大于约100个碱 基,大于约500个碱基,大于1000个碱基,多至约10,000个或更多个碱基,所 述多核苷酸由核苷酸组成,例如脱氧核糖核苷酸或核糖核苷酸,并且可以通 过酶促或合成方式产生(例如美国专利No.5,948,902及其中引用的参考文献 中所述的PNA),其可按照与两个天然存在的核酸类似的序列特异性方式进 行杂交,例如可以参与Watson-Crick碱基配对相互作用。天然存在的核苷酸包括鸟嘌呤,胞嘧啶,腺嘌呤和胸腺嘧啶(分别为G,C,A和T)。DNA和RNA 分别具有脱氧核糖和核糖骨架,而PNA的主链由通过肽键连接的重复的N-(2- 氨基乙基)-甘氨酸单元组成。在PNA中,各种嘌呤和嘧啶碱基通过亚甲基羰 基键与主链连接。经常被称为不可接近的RNA的锁核酸(LNA)是一种修饰的 RNA核苷酸。LNA核苷酸的核糖部分由连接2'氧和4'碳的额外桥接(bridge)修 饰。所述桥接“锁定”3'内(北)构象(3'-endo(North)conformation)中的核糖,通 常以A型双链体形式存在。一旦需要,可以将LNA核苷酸与寡核苷酸中的 DNA或RNA残基混合。术语“非结构化核酸”或“UNA”是含有以降低的稳定性 彼此结合的非天然核苷酸的核酸。例如,非结构化核酸可以含有G'残基和C' 残基,其中这些残基对应于G和C的非天然存在形式(即类似物),其以降低的 稳定性彼此碱基配对,但保留分别与天然存在的C和G残基进行碱基配对的 能力。US20050233340中描述了非结构化核酸,其通过提述并入本文以用于 UNA的公开。
本文所用的术语“寡核苷酸”表示核苷酸的单链多聚体。
除非另有说明,分别地,核酸以5'至3'方向从左到右书写;氨基酸序列 以氨基至羧基方向从左到右书写。
本文所用的术语“切割”是指破坏双链DNA分子的两条链中两个相邻核 苷酸之间的磷酸二酯键,从而导致DNA分子中的双链断裂的反应。
本文使用的术语“切割位点”是指双链DNA分子已被切割的位点。
术语“杂交”是指本领域已知的通过碱基配对的核酸链与互补链结合的过 程。如果两个序列在中等至高严格杂交和洗涤条件下彼此特异性杂交,则认 为核酸与参考核酸序列“选择性杂交”。中等和高严格杂交条件是已知的(参见 例如Ausubel等,ShortProtocols in Molecular Biology,第3版,Wiley&Sons 1995和Sambrook等,MolecularCloning:A Laboratory Manual,Third Edition, 2001Cold Spring Harbor,NY)。高严格条件的一个实例包括在约42℃于50% 甲酰胺,5X SSC,5X Denhardt’s溶液,0.5%SDS和100μg/m变性载体DNA中 杂交,然后在室温于2X SSC和0.5%SDS中洗涤两次,并在42℃于0.1×SSC和 0.5%SDS中再洗涤两次。
本文所用的术语“双链体”或“双链的”描述了两个互补的多核苷酸,其是 碱基配对的,即杂交在一起。
本文所用的术语“扩增”是指用靶核酸作为模板产生靶核酸的一个或多个 拷贝。
关于基因组的术语“消减(depletion)”是指从基因组的剩余部分去除基因 组的一部分以产生从基因组的剩余部分分离的产物。术语“消减”还涵盖从一 个物种去除DNA,同时保留来自另一物种的DNA。
本文所用的术语“基因组区域”是指基因组的区域,例如动物或植物基因 组,例如人,猴,大鼠,鱼或昆虫或植物的基因组。在某些情况下,可以使 用参考基因组区域来设计本文所述方法中使用的寡核苷酸,所述参考基因组 区域即已知核苷酸序列的基因组区域,例如其序列保藏在NCBI的Genbank数 据库或其他数据库中的染色体区域。
本文所用的术语“基因组序列”是指存在于基因组中的序列。因为RNA转 录自基因组,所以该术语涵盖存在于生物体的核基因组中的序列,以及存在 于从该基因组转录的RNA(例如mRNA)的cDNA拷贝中的序列。
如本文所用的术语“基因组片段”是指基因组的区域,所述基因组例如动 物或植物基因组,例如人,猴,大鼠,鱼或昆虫或植物的基因组。基因组片 段可以是整个染色体或染色体的片段。基因组片段可以是接头连接的(在这 种情况下,其具有连接到片段的一端或两端或连接到至少分子的5'末端的接 头),或者可以不是接头连接的。
在一些情况下,本文所述方法中使用的寡核苷酸可以用参考基因组区域 来设计,即已知核苷酸序列的基因组区域,例如其序列保藏在NCBI的 Genbank数据库或其他数据库的染色体区域。这样的寡核苷酸可以用于使用 含有测试基因组的样品的测定法,其中测试基因组含有寡核苷酸的结合位点。
本文所用的术语“连接(ligating)”是指在第一DNA分子的5'末端的末端核 苷酸与第二DNA分子的3'端的末端核苷酸的酶催化连接。
如果两个核酸是“互补的”,则其中一个核酸的每个碱基与另一个核酸中 的对应核苷酸碱基配对。术语“互补”和“完全互补”在本文中同义使用。
如本文所使用的术语“分开(separating)”是指两个元素的物理分开(例如通 过大小或亲和力等)以及一个元素的降解,使另一元素保持完整。
在细胞中,DNA通常以双链形式存在,因此具有两条核酸互补链,本文 称为“顶(top)”和“底(bottom)”链。在一些情况下,染色体区域的互补链可以被 称为“正”和“负”链,“第一”和“第二”链,“编码”和“非编码”链,“沃森”和“克里克” 链或“正义”和“反义”链。链分配为顶或底链是任意的,并不意味着任何特定 的取向、功能或结构。第一和第二链是不同的分子,直到它们共价连接。为 了易于描述,其中顶部和底部链共价连接的双链核酸的“顶”和“底”链仍将被 描述为“顶”和“底”链。换言之,为了本发明的目的,双链DNA的顶和底链不 需要是分开的分子。几种示例性哺乳动物染色体区域(例如BAC,组装体(assemblies),染色体等)的第一链的核苷酸序列是已知的,并且可以在例如 NCBI的Genbank数据库中找到。
本文所用的术语“顶链”是指核酸的任一链,但不指核酸的全部两条链。 当寡核苷酸或引物仅与顶链结合或退火时,它仅与一条链结合而不与另一条 结合。本文所用的术语“底链”是指与“顶链”互补的链。当寡核苷酸结合或退 火“仅一条链”时,它仅与一条链结合,例如第一或第二链,但不是另一条链。 如果寡核苷酸与双链DNA的两条链结合或退火,则寡核苷酸可以具有两个区 域,即与双链DNA的顶链杂交的第一区域和与双链DNA的底链杂交的第二 区域。
术语“双链DNA分子”是指其中顶和底链未共价连接的双链DNA分子以 及其中顶和底链共价连接的双链DNA分子。双链DNA的顶和底链通过沃森- 克里克相互作用来互相碱基配对。
本文使用的术语“变性”是指通过将双链体置于合适的变性条件下来分开 核酸双链体的至少一部分碱基对。变性条件是本领域公知的。在一个实施方 案中,为了使核酸双链体变性,双链体可以暴露于高于双链体的Tm的温度, 从而将双链体的一条链从另一条释放。在一些实施方案中,可以通过将核酸 暴露于至少90℃的温度适当的时间(例如至少30秒,多至30分钟)而使其变性。 在一些实施方案中,可以使用完全变性条件来完全分开双链体的碱基对。在 其他实施方案中,可以使用部分变性条件(例如用比完全变性条件更低的温 度)来分开双链体的某些部分的碱基对(例如富含A-T碱基对的区域可以分开, 而富含G-C碱基对的区域可以保持配对)。还可以对核酸进行化学变性(例如 使用尿素或NaOH)。
本文使用的术语“基因分型”是指核酸序列的任何类型的分析,并且包括 测序,多态性(SNP)分析和鉴定重排的分析。
本文使用的术语“测序”是指获得多核苷酸的连续核苷酸的同一性的方法。
术语“下一代测序”是指所谓的并行的通过合成测序 (sequencing-by-synthesis)或通过连接测序(sequencing-by-ligation)平台,例如 Illumina,LifeTechnologies和Roche等目前使用的那些。下一代测序方法还可 以包括纳米孔测序方法或基于电子检测的方法,例如由Life Technologies商业 化的Ion Torrent技术。
术语“宿主核酸”是指源自获得样品的多细胞真核生物受试者的核酸。宿 主核酸可以是例如植物或动物,包括哺乳动物,特别是人。术语“宿主核酸” 包括细胞核核酸以及存在于其他细胞器(例如线粒体和叶绿体(如果宿主是植 物))中的核酸,而不是通常生长在受试者中或受试者上的微生物的核酸。
术语“非宿主核酸”是指不属于获得样品的宿主的核酸。非宿主核酸可以 是病毒,细菌或其他微生物DNA。
术语“微生物核酸”是指存在于样品中的来源的微生物(例如细菌或病毒 或来自真核寄生虫)的核酸。
术语“宿主DNA”是指源自获得样品的多细胞真核生物受试者的DNA。宿 主DNA可以是例如植物或动物,包括哺乳动物,特别是人。术语“宿主DNA” 包括细胞核DNA以及存在于其他细胞器(例如线粒体和叶绿体(如果宿主是 植物))中的DNA,而不是通常生长在受试者中或受试者上的微生物的DNA。
术语“非宿主DNA”是指不属于获得样品的宿主的DNA。非宿主DNA可以 是病毒,细菌或其他微生物DNA。
术语“微生物DNA”是指存在于样品中的来源的微生物(例如细菌或病毒 或来自真核寄生虫)的基因组DNA。
术语“互补DNA”或cDNA是指通过如下方法从RNA样品产生的双链DNA 样品:RNA的逆转录(使用引物如随机六聚体或寡聚-dT引物),然后是通过 RNA酶H消化RNA及用DNA聚合酶合成来进行第二链合成。
术语“RNA启动子接头”是含有噬菌体RNA聚合酶(例如来自噬菌体T3, T7,SP6等的RNA聚合酶)的启动子的接头。
术语“宏基因组学样品”是指含有多于一种生物体(真核生物,原核生物或 病毒生物体)的样品。
术语“宏基因组分析”是指宏基因组学样品的分析。
术语的其他定义可以在整个说明书中出现。
发明目的
鉴于与上述常规方法和装置相关的问题,本发明的目的是使用酶介导的 切割机制从核酸样品消减所选择的核酸。
本发明的另一个目的是提供一种从包括宿主和非宿主核酸的测序文库 中消减所选择的宿主核酸的方法,以增加用于追求下游应用目的的非宿主核 酸片段的比例,所述下游应用包括但不限于扩增,测序,克隆等。
本发明的另一个目的是提供一种宏基因组分析方法,其相对于来自特定 物种的基因组的片段而言是无偏好的,其通过选择性地消减来自宏基因组学 样品的一些或全部特定物种的基因组实现。
本发明的另一个目的是在宏基因组分析中获得更好的分辨率,其通过增 加映射至物种的宏基因组的样品读段而不增加(在一些情况下甚至减少)测序 量。
本发明的另一个目的是提供从包含线粒体DNA和非线粒体DNA的样品 消减线粒体DNA的方法和组合物。
核酸,样品
本发明的核酸(靶向用于富集,分割或消减)可以是单链DNA,单链RNA, 双链DNA,双链RNA,人工DNA,人工RNA,合成DNA,合成RNA和 RNA/DNA杂交体。
本发明的核酸可以是包含基因组区域的基因组片段或整个基因组本身。 在一个实施方案中,基因组是DNA基因组。在另一个实施方案中,基因组是 RNA基因组。
本发明的核酸可以获取自真核生物或原核生物体;获取自哺乳动物生物 体或非哺乳动物生物体;获取自动物或植物;获取自细菌或病毒;获取自动 物寄生虫;或获取自病原体。
本发明的核酸可以获取自任何哺乳动物生物。在一个实施方案中,哺乳 动物是人。在另一个实施方案中,哺乳动物是家畜动物,例如马,羊,牛, 猪或驴。在另一个实施方案中,哺乳动物生物体是家养宠物,例如猫,狗, 沙鼠,小鼠,大鼠。在另一个实施方案中,哺乳动物是一种类型的猴。
本发明的核酸可获取自任何鸟类或禽类生物。禽类生物体包括但不限于 鸡,火鸡,鸭和鹅。
本发明的核酸可以从植物获得。在一个实施方案中,植物是水稻,玉米, 小麦,玫瑰,葡萄,咖啡豆,水果,番茄,马铃薯或棉花。
在一些实施方案中,本发明的核酸从细菌菌种获得。在一个实施方案中, 细菌是引起结核病的细菌。
在一些实施方案中,本发明的核酸从病毒获得。
在一些实施方案中,本发明的核酸从真菌菌种获得。
在一些实施方案中,本发明的核酸从藻类物种获得。
在一些实施方案中,本发明的核酸从任意哺乳动物寄生虫获得。
在一些实施方案中,本发明的核酸从任意哺乳动物寄生虫获得。在一个 实施方案中,寄生虫是蠕虫。在另一个实施方案中,寄生虫是引起疟疾的寄 生虫。在另一个实施方案中,寄生虫是引起利什曼病的寄生虫。在另一个实 施方案中,寄生虫是变形虫。
在一个实施方案中,本发明的核酸包括在同一样品中是gRNA靶标的核 酸(在本文中也称为gRNA元件可互换)和不是gRNA靶标的核酸。
在一个实施方案中,样品中的核酸包括靶核酸/靶向序列(gRNA的靶标) 和目的核酸/目的序列(不被gRNA靶向)。
在一个实施方案中,核酸都属于相同的生物体,但是靶向子集以用于消 减或分割。例如,可以靶向几乎不具有信息价值的核酸。几乎不具有信息价 值的核酸的实例包括但不限于:线粒体DNA,线粒体RNA,线粒体rRNA, 重复序列,多拷贝序列,编码珠蛋白的序列,编码转座子的序列,编码逆转 录病毒序列的序列,包含端粒序列的序列,包括亚端粒重复的序列,包含着 丝粒序列的序列,包含内含子序列的序列,包含Alu重复、SINE重复、LINE重复、双核酸重复、三核酸重复、四核酸重复、多聚A重复、多聚T重复、 多聚C重复、多聚G重复的序列,富含AT的序列或富含GC的序列。
在一个实施方案中,将样品与CRISPR/Cas系统蛋白-gRNA复合物接触, 其中所述gRNA与如下序列互补:待消减的靶序列,编码珠蛋白的靶序列, 编码转座子的序列,编码逆转录病毒序列的序列,包含端粒序列的序列,包 含亚端粒重复的序列,包含着丝粒序列的序列,包含内含子序列的序列,包 含Alu重复的序列,包含SINE重复的序列,包含LINE重复的序列,包含双核 酸重复的序列,包含三核酸重复的序列,包含四核酸重复的序列,包含多聚 A重复的序列,包含多聚T重复的序列,包含多聚C重复的序列,包含多聚G 重复的序列,包含富含AT的序列的序列,或包含富含GC的序列的序列。
在一个示例性实施方案中,可靶向核糖体RNA以供消减或分割。在另一 个示例性实施方案中,可靶向重复DNA以供消减或分割。在这样的实施方案 中,本方法可用于消减核糖体或重复DNA或任何其他几乎不具有信息价值的 DNA,以便降低对DNA提取的这些元件的测序成本并提高数据产量/得率 (yield)。
在一个实施方案中,靶DNA可以是非线粒体DNA(例如基因组DNA),并 且目的DNA可以是线粒体DNA,并且通过靶向和消减非线粒体人DNA而富 集线粒体DNA。
在一个实施方案中,待消减的靶DNA可以是线粒体DNA,并且目的DNA 可以是非线粒体DNA,并且通过靶向和消减线粒体人DNA而富集非线粒体 DNA。在一个示例性实施方案中,实施ATAC-Seq程序(例如参见 WO2014/189957),产生不想要的残留线粒体DNA;本发明的方法可用于从 样品中去除不想要的线粒体DNA。
在一个实施方案中,待消减或分割的核酸可以是基因组的非映射区域; 并且待保留用于进一步分析/测序/克隆的核酸可以是基因组的可映射区域。 在一个实施方案中,待消减或分割的核酸可以是基因组的可映射区域;并且 待保留用于进一步分析/测序/克隆的核酸可以是基因组的非映射区域。非映 射区域的实例包括端粒,着丝粒,重复区或其它包含难以映射的特征的基因 组区域。
在一些实施方案中,本发明的方法在包含宿主核酸和非宿主核酸的样品 上进行。在一个实施方案中,宿主核酸是哺乳动物的,非宿主核酸不是哺乳 动物的(例如细菌,病毒,真菌,原生动物的)。在一个实施方案中,宿主核 酸是人的,而非宿主核酸是细菌的。在一个实施方案中,宿主核酸是人的, 而非宿主核酸是病毒的。在一个实施方案中,宿主核酸是人的,而非宿主核 酸是真菌的。在一个实施方案中,宿主核酸是人的,而非宿主核酸是原生动 物的。在一个实施方案中,宿主核酸来自一种家畜。在一个实施方案中,宿 主核酸来自猴。在一个具体实施方案中,宿主核酸是人的,而非宿主核酸来 自未鉴定的病原体,例如已知或未知的病毒,或已知或未知的细菌,或已知 或未知的动物寄生虫。在一个具体实施方案中,宿主核酸来自牛,而非宿主 核酸是病毒,细菌,真菌或原生动物的。
在含有宿主核酸和非宿主核酸二者的样品中,宿主和非宿主可能具有例 如宿主-病原体关系或共生关系。在一些实施方案中,从宿主获得的总核酸 样品的非宿主部分可以源自与宿主相关的微生物群。
在一个实施方案中,从宿主生物体(例如人宿主)获得的样品含有来自多 于一个非宿主生物体的核酸,例如来自多个非宿主生物体,其包含至少一个 待鉴定的未知非宿主生物体。本发明的组合物和方法可用于连续处理样品中 的核酸,以首先消减/分割宿主DNA,然后将非目的的其他已知非宿主核酸 加以消减/分割,剩余代表特定目的非宿主核酸库(pool)。例如,这样的实施 方案可适用于如下情形,在所述情形中预期宿主携带多于一种已知细菌,例 如以共生方式存在的细菌。例如,这样的实施方案可适用于检测来自个体的 唾液样品中的未知病原体,已知唾液含有数种细菌,例如链球菌属 (Streptococcus)菌种。在另一个实例中,样品可以是来自哺乳动物宿主的粪便 样品,包括已知和未知非宿主核酸。
在一个实施方案中,从已知的宿主生物体(例如人宿主)获得的样品含有 非宿主核酸,但非宿主是未知的(例如未知的致病细菌,病毒或人血液中的 其他病原体),直到宿主核酸被耗尽或分割,从而富集非宿主核酸并进行进 一步的下游分析。
在示例性实施方案中,当DNA包括宿主DNA和非宿主DNA时,本方法 可用于消减基本上全部的宿主DNA,以构建非宿主DNA文库用于进一步分 析。在DNA包括核DNA和线粒体DNA的情况下,本方法可用于消减线粒体 DNA,以构建核DNA文库用于进一步分析;或者消减核DNA以构建线粒体 DNA文库用于进一步分析。在DNA包括可能几乎不具有信息价值的核糖体 RNA或重复DNA的丰富序列的情况下,本方法可用于消减核糖体或重复 DNA或任何其他几乎不具有信息价值的DNA以便降低对DNA提取的这些元 件的测序成本并提高数据产率。在每个应用中,所得的DNA具有显著较少的 DNA片段到序列,从而降低了测序成本和复杂性。此外,根据本发明的方法, 消减的样品仍然提供存在于生物样品中的未被主动消减的全部DNA材料,其 提供如下优点:降低测序成本,以及通过测序更小的多样性较低的DNA样品 而提高数据产量/得率。
在一个实施方案中,本发明的核酸获得自生物样品。用于获得核酸的生 物样品包括但不限于全血,血浆,血清,眼泪,唾液,粘液,脑脊液,牙齿, 骨骼,指甲,粪便,尿液,组织,组织活检样品等。生物样品可以包括法医 样品,例如牙齿,骨骼,指甲等。生物样品可以包括组织,组织活检样品, 例如切除的肺组织。生物样品可以包括临床样品,其是指临床环境(例如在 医院或诊所)中获得的样品。
在一个实施方案中,本发明的核酸获取自环境样品,例如获取自水,土 壤,空气或岩石获得。
在一个实施方案中,本发明的核酸获取自法医样品,例如,获取自犯罪 现场的个体、获取自证据、验尸、作为正在进行的调查的一部分等等的样品。
在一个实施方案中,本发明的核酸在文库中提供。
本发明的核酸是从样品提供的或提取的。提取可以从样品中提取基本上 所有的核酸序列。其可以是例如样品中存在的宿主的核酸序列和任何非人或 非宿主生物体的核酸序列。
提取可以99.999:0.001至0.001:99.999之间任意的比例产生宿主核酸和非 宿主核酸。提取可以99.999:0.001至0.001:99.999之间任意的比例产生靶向的 核酸和目的核酸。提取可以99.999:0.001至0.001:99.999之间任意的比例产生 待消减的核酸:待保留/分析/测序的核酸。提取可以99.999:0.001至 0.001:99.999之间任意的比例产生待分割的核酸:待保留/分析/测序的核酸。来 自生物样品的提取可以99.999:0.001至0.001:99.999之间任意的比例产生待消 减的宿主核酸:待保留/分析/测序的来自多于一个非宿主的核酸。在这些实施 方案中,比例可以等于或落在99.999:0.001至0.001:99.999之间的任意处,例 如比例可以是99:1,95:5,90:10,85:15,80:20,75:25,70:30,65:35,60:40, 55:45,50:50,45:55,40:60,35:65,30:70,25:75,20:80,15:85,10:90, 5:95,和1:99。
提取后,可将提取的核酸序列片段化,以将每个提取的核酸的长度减少 到更易于管理的长度以供扩增,测序等。
如本文所提供的,可以消减或分割起始核酸材料的至少10%、15%、20%、 25%、30%、40%、50%、60%、70%、80%、90%。这种消减或分割可以在 不超过10分钟,15分钟,20分钟,30分钟,45分钟,60分钟,75分钟,90分 钟,105分钟,120分钟,150分钟,3小时,4小时,5小时,6小时,7小时, 8小时,9小时,10小时,11小时或12小时实现。
在一个实施方案中,本发明的核酸是接头连接的。待接头连接的本发明 的核酸范围可以为10bp至1000bp。例如,待接头连接的核酸可以是至少10、 15、20、25、50、75、100、125、150、175、200、250、300、350、400、 450、500、550、600、650、700、750、800、850、900、950、或1000bp。 在一个具体实施方案中,待接头连接的核酸为100bp。在一个具体实施方案 中,待接头连接的核酸为200bp。在一个具体实施方案中,待接头连接的核 酸为300bp。在一个具体实施方案中,待接头连接的核酸为400bp。在一个具 体实施方案中,待接头连接的核酸为500bp。
在一些实施方案中,样品包含核酸片段文库,其中所述核酸片段在其5' 和3'端以接头连接。在这样的实施方案中,将接头连接至每个核酸片段的在 5'和3'端的每一端。在其它实施方案中,可以将接头连接到每个片段的仅一 端。在一些实施方案中,接头还包括在5'末端和/或3'末端之间的间插序列 (intervening sequence)。例如,接头还可以包括条码(barcode)序列。
在一些实施方案中,接头是可与双链DNA分子的两条链连接的核酸。
在一些实施方案中,接头在消减/富集之前连接。在其他实施方案中,接 头在后续步骤中连接。
在一些实施方案中,接头是线性的。在一些实施方案中,接头是线性Y 形的。在一些实施方案中,接头是线性圆形的。在一些实施方案中,接头是 发夹接头。
在多种实施方案中,接头可以是发夹接头,即一个与其自身碱基配对形 成具有双链茎和环的结构的分子,其中所述分子的3'和5'端分别连接到片段 的双链DNA分子的5'和3'端。
或者,接头可以是连接到片段的一端或两端的Y-接头,也称为通用接头。 或者,接头本身可以由彼此碱基配对的两种不同的寡核苷酸分子组成。另外, 接头的可连接端可以设计成与通过限制性内切酶切割制成的突出端相容,或 者其可以具有平末端或5'T突出端。
接头可以包括双链以及单链分子。因此接头可以是DNA或RNA,或两者 的混合物。含有RNA的接头可以通过RNase处理或碱水解来切割。
接头的长度可以为10至100bp,但是在不背离本发明的情况下,可以使 用该范围以外的接头。在具体实施方案中,接头的长度至少为10bp,至少15bp, 至少20bp,至少25bp,至少30bp,至少35bp,至少40bp,至少45bp,至少50bp, 至少55bp,至少60bp,至少65bp,至少70bp,至少75bp,至少80bp,至少85bp, 至少90bp,或至少95bp。
在一些情况下,接头可以包含被设计为匹配宿主基因组特定区域的核苷 酸序列的寡核苷酸,例如其序列保藏在NCBI的Genbank数据库或其他数据库 的染色体区域。此类寡核苷酸可以用于使用含有测试基因组的样品的测定中, 其中测试基因组含有寡核苷酸的结合位点。在其他实例中,可以自一个或多 个DNA测序文库衍生出片段化的核酸序列。可以配置接头用于下一代测序平 台,例如用于Illumina测序平台或用于IonTorrents平台,或与Nanopore技术一 起使用。
向导RNA
本文提供了向导RNA(guide RNA,gRNA),其中所述gRNA与核酸中的 (例如来自宿主的基因组DNA中的)靶向位点或靶向序列互补(可选择地,可与 之杂交)。在一个实施方案中,本发明提供了向导RNA文库,其包含gRNA的 集合,其被配置为与被靶向以供消减或分割的核酸序列杂交。
在一个实施方案中,gRNA选择性针对样品中的靶核酸(或靶向序列),但 不选择性针对样品中的目的序列。
在一个实施方案中,gRNA选择性针对来自宿主的生物样品中的宿主核 酸,但不选择性针对来自宿主的样品中的非宿主核酸。在一个实施方案中,gRNA选择性针对来自宿主的生物样品中的非宿主核酸,但不选择性针对样 品中的宿主核酸。在一个实施方案中,gRNA选择性针对来自宿主的生物样 品中的宿主核酸和非宿主核酸的子集。例如,如果复杂的生物样品包含宿主 核酸和来自多于一个非宿主生物体的核酸,则所述gRNA可以是选择性针对 多于一种非宿主物种的。在这样的实施方案中,gRNA用于连续消减或分割 非目的序列。例如,来自人的唾液含有人DNA,以及多于一种细菌菌种的 DNA,但也可能含有未知病原生物体的基因组物质。在这样的实施方案中, 可以使用指向人DNA和已知细菌的gRNA来连续消减人DNA和已知细菌的 DNA,从而得到包含未知病原生物体的基因组材料的样品。
在一个示例性实施方案中,所述gRNA选择性针对从来自宿主的生物样 品获得的人宿主DNA,但是不与该样品中的未知生物体(例如病原体)的DNA 杂交。
在一些实施方案中,gRNA选择性针对靶核酸序列,其后是可以与Cas9 结合的前间区序列临近基序(PAM)序列。在一些实施方案中,gRNA的序列 由CRISPR/Cas系统蛋白类型确定。例如,在多种实施方案中,gRNA可以针 对不同的Cas9类型进行定制,因为PAM序列可以根据Cas9来源的细菌的种类 而变化。
gRNA的大小范围可以是例如50-250个碱基对。例如,gRNA可以是至少 50bp、55bp、60bp、65bp、70bp、75bp、80bp、85bp、90bp、95bp、100bp、 110bp、120bp、125bp、130bp、140bp、150bp、160bp、170bp、175bp、180bp、 190bp、或195bp。在具体实施方案中,gRNA是80bp,90bp,100bp或110bp。 每个靶特异性gRNA包含与目标核酸中的预定义位点互补的碱基对序列,其 后是可以与CRISPR/Cas系统蛋白(例如源自细菌菌种的Cas9蛋白)结合的前 间区序列临近基序或(PAM)序列。在具体实施方案中,与靶核酸中的预定位 点互补的gRNA的碱基对序列是15、16、17、18、19、20、25、30、35、40、 45、或50个碱基对。
本发明还提供了gRNA文库。gRNA文库可以包含多个不同的物种特异性 的gRNA,每个gRNA被配置为与被靶向以供消减或分割的核酸序列(选择性 地)杂交。每个gRNA包括靶特异性向导序列和茎环结合位点,其形成为与特 定的CRISPR/Cas系统蛋白结合,例如与Cas9蛋白结合。文库可以包含多个不 同的向导RNA,每个向导RNA具有不同的15至20个碱基对序列,其与靶向的 核酸中的不同预定义位点互补,其后是可与CRISPR/Cas系统蛋白结合的适当 的PAM序列。对于每个向导RNA,PAM序列存在于目的核酸的预定义DNA 靶序列中,但不存在于相应的靶特异性向导序列中。
通常根据本发明,目的基因组中具有预定义的靶序列和随后的适当PAM 序列的任何核酸序列可以与向导RNA文库中提供的对应向导RNA杂交并与 CRISPR/Cas系统蛋白(例如Cas9)结合。在多种实施方案中,gRNA文库可以 针对不同的CRISPR/Cas系统蛋白定制,例如不同的Cas9类型,因为PAM序列 可以根据产生蛋白质的细菌的菌种而变化。
可以生成gRNA中的不同靶特异性序列。这可以通过使用噬菌体RNA聚 合酶(例如来自噬菌体T3,T7,SP6等的RNA聚合酶)的启动子来实现。因此, 每个不同的T7 RNA聚合酶启动子提供了适合于与不同的靶核酸序列杂交的 不同靶特异性序列。可用于退火和随后的PCR反应二者的非限制性示例性的 一组正向引物列于下文提供的实施例1的表1和表2中。
不限于理论,如果gRNA显示~100%功效,则可以计算达到>95%靶核酸 切割的gRNA之间的距离:这可以通过测量文库大小的分布并确定均值来计 算,N和标准偏差SD;N-2SD=最小尺寸对于>文库的95%,确保该大小的每 个片段有一个向导RNA,以确保>95%的消减。这也可以被描述为向导RNA 之间的最大距离=文库大小的均值-2×(文库大小的标准偏差)。
在本文提供的实施方案中,可以扩增gRNA文库以包括大量各自不同的 gRNA的拷贝,以及可能适合于期望的消减结果的大量不同gRNA。人基因组 中给定的向导RNA文库中独特的gRNA(unique gRNA)的数量范围可以是从1 个特别的gRNA到多达1010个特别的gRNA或每2个碱基对约1个特别的向导 RNA序列。在一些实施方案中,所述文库包含至少102个特别的gRNA。在一 些实施方案中,文库包含至少102,至少103,至少104,至少105,至少106, 至少107,至少108,至少109,至少1010个特别的gRNA。在一个示例性实施方 案中,文库包含约103个特别的gRNA。
在本文提供的实施方案中,所述方法包括将包含核酸的样品与多个 CRISPR/Cas9系统蛋白-gRNA复合物接触,其中所述gRNA与靶序列互补,该 序列被靶向用于消减。在一些实施方案中,所述方法包括使用可与靶位点碱 基配对的gRNA,其中将所述样品与至少102个特别的gRNA接触。在一些实 施方案中,将样品与至少102,至少103,至少104,至少105,至少106,至少107,至少108,至少109,至少1010个特别的gRNA接触。在一个示例性实施方 案中,将样品与约103个特别的gRNA接触。
在本文提供的实施方案中,方法包括使样品与至少102个特别的 CRISPR/Cas系统蛋白-gRNA复合物接触,其中复合物的独特性质由gRNA本 身的独特性质决定。例如,2个特别的CRISPR/Cas系统蛋白-gRNA复合物可 能具有相同的CRISPR/Cas系统蛋白,但gRNA不同,即使只有1个核苷酸不 同。因此,在一些实施方案中,该方法包括使样品与至少102个特别的 CRISPR/Cas系统蛋白-gRNA复合物接触。在一些实施方案中,使样品与至少 102,至少103,至少104,至少105,至少106,至少107,至少108,至少109, 至少1010个特别的CRISPR/Cas系统蛋白-gRNA复合物接触。在一个示例性实 施方案中,样品与约103个特别的CRISPR/Cas系统蛋白-gRNA复合物接触。
在本文提供的实施方案中,所述方法包括将包含基因组DNA的样品与多 个CRISPR/Cas9系统蛋白-gRNA复合物接触,其中所述gRNA与待消减的基因 组中靶向的位点互补。在一些实施方案中,该方法包括使用可与靶向DNA 碱基配对的gRNA,其中在整个目的基因组,目的靶位点在至少每1bp、至少 每2bp、至少每3bp、至少每4bp、至少每5bp、至少每6bp、至少每7bp、 至少每8bp、至少每9bp、至少每10bp、至少每11bp、至少每12bp、至少每13bp、至少每14bp、至少每15bp、至少每16bp、至少每17bp、至少每18bp、 至少每19bp、20bp、至少每25bp、至少每30bp、至少每40bp、至少每50bp、 至少每100bp、至少每200bp、至少每300bp、至少每400bp、至少每500bp、 至少每600bp、至少每700bp、至少每800bp、至少每900bp、至少每1000bp、 至少每2500bp、至少每5000bp、至少每10,000bp、至少每15,000bp、至少 每20,000bp、至少每25,000bp、至少每50,000bp、至少每100,000bp、至少 每250,000bp、至少每500,000bp、至少每750,000bp、或甚至至少每1,000,000 bp被间隔。
在本文提供的实施方案中,所述方法包括将包含被靶向以待消减的核酸 的样品与多个CRISPR/Cas9系统蛋白-gRNA复合物接触,其中所述gRNA与被 靶向以待消减的核酸互补。在一些实施方案中,gRNA:被靶向以待消减的 核酸的摩尔比为1:1、5:1、10:1、50:1、100:1、150:1、250:1、500:1、750:1、 1000:1、1500:1、2000:1、2500:1、5000:1、7500:1、或甚至10,000:1。在示例 性实施方案中,gRNA:被靶向以待消减的核酸的摩尔比为500:1。
在本文提供的实施方案中,所述方法包括将包含被靶向以待消减的核酸 的样品与多个CRISPR/Cas9系统蛋白-gRNA复合物接触,其中所述gRNA与被 靶向以待消减的核酸互补。在一些实施方案中,gRNA:被靶向以待消减的 核酸的重量比为1:1、5:1、10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、 90:1、100:1、150:1、250:1、500:1、750:1、1000:1、1500:1、2000:1、2500:1、 5000:1、7500:1、或甚至10,000:1。在一个示例性实施方案中,gRNA:被靶 向以待消减的核酸的重量比为50:1至100:1。
如下描述参考图1作为示例性实施方案。在图1中,向导RNA文库(1050) 包含大量不同的人特异性gRNA(1055),其各自配置为与来自DNA提取片段 (1025)或其他可以消减的片段的集合(因为其不是感兴趣的)的人DNA或核酸 序列杂交,所述人DNA或核酸序列被靶向以供消减。在这个实施方案中,被 靶向以待消减的核酸序列不是存在于供进一步分析的目的非人遗传片段 (1030)中的序列。每个向导RNA(1055)包括形成为与Cas9蛋白结合的靶特异 性向导序列(1060)和茎环结合位点(1065)。每个靶特异性向导序列(1060)是与 人基因组中预定义位点互补的15至20个碱基对序列,其后是可以与源自细菌 菌种的Cas9蛋白结合的前间区序列临近基序或(PAM)序列。其它可用的碱基 对长度范围可以是约8至100个碱基对,而不偏离本发明。
在图1中,不同的靶特异性序列(1060)由含有噬菌体RNA聚合酶(例如来 自噬菌体T3,T7,SP6等的RNA聚合酶)启动子的不同T7RNA聚合酶启动子 序列(1070)产生。因此,每个不同的T7 RNA聚合酶启动子(1070)提供了适合 于与不同的人DNA序列杂交的不同靶特异性序列(1060)。
在图1中,扩增向导RNA文库(1050)以包括大量的各个不同gRNA(1055) 的拷贝以及大量不同的gRNA,例如(1055a)(1055b)(1055n)可能是合适的以获 得期望的消减结果。
CRISPR/Cas系统蛋白
本文提供了用于消减样品中不想要的核酸,和/或富集样品中的目的序列 的组合物和方法。这些组合物和方法利用CRISPR/Cas系统蛋白进行。
在一些实施方案中,CRISPR/Cas系统蛋白包括来自CRISPR I型系统, CRISPR II型系统和CRISPR III型系统的蛋白。
在一些实施方案中,CRISPR/Cas系统蛋白可以来自任何细菌或古细菌(archaeal)菌种。
在一些实施方案中,CRIPR/Cas系统蛋白来自或衍生自来自如下菌种/ 属的CRIPR/Cas系统蛋白:酿脓链球菌(Streptococcus pyogenes)、金黄色葡萄 球菌(Staphylococcus aureus)、脑膜炎奈瑟氏球菌(Neisseria meningitidis)、嗜 热链球菌(Streptococcus thermophiles)、齿垢密螺旋体(Treponema denticola)、 土拉热弗朗西丝氏菌(Francisella tularensis)、多杀巴斯德氏菌(Pasteurella multocida)、空肠弯曲杆菌(Campylobacter jejuni)、海鸥弯曲杆菌 (Campylobacter lari)、鸡毒支原体(Mycoplasma gallisepticum)、卤水硝酸盐裂 解菌(Nitratifractor salsuginis)、食淋洗物细小棒状菌(Parvibaculum lavamentivorans)、肠道罗斯拜瑞氏菌(Roseburiaintestinalis)、灰色奈瑟氏球 菌(Neisseria cinerea)、重氮营养葡糖酸醋杆菌(Gluconacetobacter diazotrophicus)、固氮螺菌属(Azospirillum)、Sphaerochaetaglobus、柱状黄杆 菌(Flavobacterium columnare)、塔夫河栖河菌(Fluviicolataffensis)、嗜粪拟杆 菌(Bacteroides coprophilus)、运动枝原体(Mycoplasmamobile)、香肠乳杆菌 (Lactobacillus farciminis)、巴氏链球菌(Streptococcuspasteurianus)、约氏乳杆 菌(Lactobacillus johnsonii)、假中间葡萄球菌(Staphylococcus pseudintermedius)、 龈沟产线菌(Filifactor alocis)、嗜肺军团菌(Legionella pneumophila)、华德萨 特氏菌(Suterella wadsworthensis)、或白喉棒杆菌(Corynebacter diphtheria)。
在一些实施方案中,CRISPR/Cas系统蛋白的实例可以是天然存在的或工 程化的。
在一些实施方案中,天然存在的CRISPR/Cas系统蛋白包括Cas9,Cpf1, Cas3,Cas8a-c,Cas10,Cse1,Csy1,Csn2,Cas4,Csm2和Cm5。在示例性 实施方案中,CRISPR/Cas系统蛋白包括Cas9。
“CRISPR/Cas系统蛋白-gRNA复合物”是指包含CRISPR/Cas系统蛋白和 向导RNA的复合物,向导RNA可以由两个分子组成,即一个RNA(“crRNA”), 其与靶标杂交并提供序列特异性,以及一个RNA,即“tracrRNA”,其能够与 crRNA杂交。或者,向导RNA可以是含有crRNA和tracrRNA序列的单个分子 (即gRNA)。CRISPR/Cas系统蛋白可以与野生型CRISPR/Cas系统蛋白至少60% 相同(例如至少70%,至少80%,或90%相同,至少95%相同或至少98%相同 或至少99%相同)。CRISPR/Cas系统蛋白可以具有野生型CRISPR/Cas系统蛋 白的所有功能,或仅具有一个或一些功能,包括结合活性,核酸酶活性,和 核酸酶活性。
术语“CRISPR/Cas系统蛋白相关的向导RNA”是指如上所述的向导 RNA(包含crRNA分子和tracrRNA分子,或包含含有crRNA和tracrRNA序列的 单个RNA分子)。CRISPR/Cas系统蛋白相关的向导RNA可以作为分离的RNA 存在,或作为CRISPR/Cas系统蛋白-gRNA复合物的一部分存在。
Cas9
在一些实施方案中,CRISPR/Cas系统蛋白包含Cas9。可以分离,重组生 产或是合成本发明的Cas9。
可以在本文的实施方案中使用的Cas9蛋白可见于 http://www.nature.com/nature/journal/v520/n7546/full/nature14299.html中。
在一些实施方案中,Cas9是II型CRISPR系统,其衍生自酿脓链球菌、金 黄色葡萄球菌、脑膜炎奈瑟氏球菌、嗜热链球菌、齿垢密螺旋体、土拉热弗 朗西丝氏菌、多杀巴斯德氏菌、空肠弯曲杆菌、海鸥弯曲杆菌、鸡毒支原体、 卤水硝酸盐裂解菌、食淋洗物细小棒状菌、肠道罗斯拜瑞氏菌、灰色奈瑟氏 球菌、重氮营养葡糖酸醋杆菌、固氮螺菌属、Sphaerochaeta globus、柱状黄 杆菌、塔夫河栖河菌、嗜粪拟杆菌、运动枝原体、香肠乳杆菌、巴氏链球菌、 约氏乳杆菌、假中间葡萄球菌、龈沟产线菌、嗜肺军团菌、华德萨特氏菌、或白喉棒杆菌。
在一些实施方案中,Cas9是源自酿脓链球菌的II型CRISPR系统,并且 PAM序列是位于靶特异性向导序列的最接近(immediate)3'末端的NGG。来 自示例性细菌菌种的II型CRISPR系统的PAM序列还可以包括:酿脓链球菌 (NGG),金黄色葡萄球菌(NNGRRT),脑膜炎奈瑟氏球菌(NNNNGA TT),嗜 热链球菌(NNAGAA)和齿垢密螺旋体(NAAAAC),其在不脱离本发明的情 况下都可以使用。 ((http://www.nature.com/nature/journal/v520/n7546/full/nature14299.html))。
在一个示例性实施方案中,可以例如从pX330质粒(可从Addgene获得) 获得Cas9序列,通过PCR重新扩增,然后克隆到pET30(来自EMD生物科学) 中以在细菌中表达并纯化重组的带6His标签的蛋白。
“Cas9-gRNA复合物”是指包含Cas9蛋白和向导RNA的复合物。向导RNA 可以由两个分子组成,即与靶标杂交并提供序列特异性的一个 RNA(“crRNA”),以及能够与crRNA杂交的一个RNA,即“tracrRNA”。或者, 向导RNA可以是含有crRNA和tracrRNA序列的单一分子(即gRNA)。Cas9蛋白 可以与野生型Cas9蛋白(例如与酿脓链球菌Cas9蛋白)至少60%相同(例如至 少70%,至少80%,或90%相同,至少95%相同或至少98%相同或至少99%相同)。Cas9蛋白可以具有野生型Cas9蛋白的所有功能,或仅具有一种或一些 功能,包括结合活性,核酸酶活性,和核酸酶活性。
术语“Cas9相关的向导RNA”是指如上所述的向导RNA(包含crRNA分子 和tracrRNA分子,或包含含有crRNA和tracrRNA序列的RNA分子)。Cas9相关 的向导RNA可以作为分离的RNA或作为Cas9-gRNA复合物的一部分存在。
无催化活性的CRISPR/Cas系统蛋白
在一些实施方案中,CRISPR/Cas系统蛋白的工程化实例包括无催化活性 的CRISPR/Cas系统蛋白。术语“无催化活性的”通常指具有灭活HNH和RuvC 核酸酶的CRISPR/Cas系统蛋白。这种蛋白可以结合任何核酸中的靶位点(其 中靶位点由向导RNA确定),但该蛋白不能切割或切口双链DNA。
在一些实施方案中,无催化活性的CRISPR/Cas系统蛋白是dCas9、dCpf1、 dCas3、dCas8a-c、dCas10、dCse1、dCsy1、dCsn2、dCas4、dCsm2、或dCm5。
在一个实施方案中,无催化活性的CRISPR/Cas系统蛋白是dCas9。因此, dCas9允许将混合物分割成未结合的核酸和被靶向以供分割的dCas9结合片 段。在一个实施方案中,dCas9/gRNA复合物与由gRNA序列确定的靶标结合。 结合的dCas9可以阻止Cas9的切割,而其他操作则会进行。这在图2中示出。 在一个实施方案中,dCas9/gRNA复合物结合至由gRNA序列确定的靶标,并 且靶核酸样品的结合部分可以通过先前连接到dCas9蛋白的亲和标签(例如 生物素)而加以去除。结合的核酸序列可以通过变性条件从dCas9/gRNA复合 物中洗脱出来,然后进行扩增和测序。相反地,在另一个实施方案中,可以 弃去那些dCas9靶向的核酸,并且可以通过扩增和测序来分析剩余的核酸。
CRISPR/Cas系统蛋白切口酶
在一些实施方案中,CRISPR/Cas系统蛋白的工程化实施例还包括Cas切 口酶。Cas切口酶是指CRISPR/Cas系统蛋白的一种修饰版本,其含有单一的 非活性催化结构域。
在一些实施方案中,CRISPR/Cas系统蛋白切口酶是Cas9切口酶,Cpf1 切口酶,Cas3切口酶,Cas8a-c切口酶,Cas10切口酶,Cse1切口酶,Csy1切 口酶,Csn2切口酶,Cas4切口酶,Csm2切口酶或Cm5切口酶。
在一个实施方案中,CRISPR/Cas系统蛋白切口酶是Cas9切口酶。
在一些实施方案中,Cas9切口酶可用于结合至靶序列。术语“Cas9切口 酶”是指Cas9蛋白的一种修饰版本,其含有单个无活性催化结构域,例如 RuvC-或HNH结构域。只具有一个活性核酸酶结构域,则Cas9切口酶仅切割 一条靶DNA链,产生单链断裂或“缺口”。取决于使用哪个突变体,可以切割 向导RNA杂交的链或非杂交的链。与靶向相反链的2个gRNA结合的Cas9切口 酶可以在DNA中产生双链断裂。这种“双切口酶”策略增加了切割的特异性, 因为其要求Cas9/gRNA复合物在形成双链断裂之前特异性结合于位点处。
在一个示例性实施方案中,DNA的消减可以使用Cas9切口酶进行。在一 个实施方案中,该方法包括:制备包含待去除的DNA(例如非目的人DNA) 和目的DNA(例如来自未知病原体的DNA)的DNA测序文库;设计向导RNA 以使所有要消减的DNA在相对的DNA链上具有两个临近的(例如相距小于15 个碱基)向导RNA结合位点;将Cas9切口酶和向导RNA加入DNA文库。在该 实施方案中,Cas9切口酶识别其待去除的DNA上的靶位点,并且仅切割一条 链。对于待消减的DNA,两个独立的Cas9切口酶可以切割待去除的DNA(例 如人DNA)的两条链;只有待去除的DNA(例如人DNA)会具有两个临近的 Cas9切口酶位点,其产生双链断裂。如果Cas9切口酶非特异性地或以低亲和 性识别目的DNA(例如病原DNA)上的位点,则仅切割不会阻止DNA分子的后 续PCR扩增或下游处理的一条链。这图示于图7中。在该实施方案中,两个 向导RNA非特异性识别两个临近位点的机会可以忽略不计(<1×10-14)。如果 常规的Cas9介导的切割切断了太多的目的DNA,则该实施方案会是特别有用 的。
可解离的且热稳定的CRISPR/Cas系统蛋白
尽管CRISPR/Cas系统蛋白可与向导RNA文库结合使用以有效地消减目 标DNA的集合,但可能需要大量(例如>30皮摩尔)的CRISPR/Cas系统蛋白和 向导RNA。通常超过靶DNA>100倍的量的原因之一是,与切割后从其靶DNA 完全脱离的经典限制酶(如EcoRI)不同,CRISPR/Cas系统蛋白在切割反应完 成后不完全再循环。CRISPR/Cas系统蛋白,例如Cas9,可以保持结合到两个 子代DNA产物分子之一(参见图11,左侧的开口圆圈)。因此,可能需要提供 更多的CRISPR/Cas系统蛋白和gRNA,以实现不想要的DNA的完全消减。
在一些实施方案中,为了克服这个问题,本文提供了可解离的 CRISPR/Cas系统蛋白。例如,在切割靶向序列时,可以使CRISPR/Cas系统 蛋白与gRNA或靶标解离。在一些实施方案中,通过升高反应温度诱导解离。 这可以通过如下方法来发挥作用增加酶的持续合成性(processivity):使其与 可用的gRNA复合,与另外的靶序列再次结合(re-associatewith)并产生另外的 切割的靶序列。
在一些实施方案中,为克服该问题,本文提供了耐热CRISPR/Cas系统蛋 白。在这样的实施方案中,反应温度升高,引起蛋白质的解离;反应温度降 低,允许产生另外的切割的靶序列。在一些实施方案中,当保持至少在75℃ 至少1分钟时,耐热CRISPR/Cas系统蛋白维持至少50%的活性,至少55%的 活性,至少60%的活性,至少65%的活性,至少70%的活性,至少75%的活 性,至少80%活性,至少85%活性,至少90%活性,至少95%活性,至少96% 活性,至少97%活性,至少98%活性,至少99%活性或100%活性。在一些实 施方案中,当保持至少在75℃、至少在80℃、至少在85℃、至少在90℃、至 少在91℃、至少在92℃、至少在93℃、至少在94℃、至少在95℃、96℃、 至少在97℃、至少在98℃、至少在99℃、或至少在100℃至少1分钟时,耐热 CRISPR/Cas系统蛋白维持至少50%的活性。在一些实施方案中,当保持至少 在75℃至少1分钟,2分钟,3分钟,4分钟或5分钟时,耐热CRISPR/Cas系统蛋白维持至少50%的活性。在一些实施方案中,当温度升高,降低至25℃-50℃ 时,耐热CRISPR/Cas系统蛋白保持至少50%的活性。在一些实施方案中,将 温度降低至25℃、至30℃、至35℃、至40℃、至45℃、或至50℃。在一个 示例性实施方案中,热稳定酶在95℃ 1分钟后保留至少90%的活性。
在一些实施方案中,热稳定的CRISPR/Cas系统蛋白是热稳定的Cas9,热 稳定的Cpf1,热稳定的Cas3,热稳定的Cas8a-c,热稳定的Cas10,热稳定的 Cse1,热稳定的Csy1,热稳定的Csn2,热稳定的Cas4,热稳定的Csm2或热 稳定的Cm5。
在一些实施方案中,热稳定的CRISPR/Cas系统蛋白是热稳定的Cas9。
在一个示例性实施方案中,与向导RNA(例如针对人DNA的gRNA文库) 复合的热稳定的Cas9可以应用于DNA混合物(含有例如95%人DNA和5%病 毒DNA)的测序文库。如图11所示(右侧的灰色圆圈),在允许Cas9消化一段时 间之后,可以提高样品混合物的温度,例如高达95℃或更高,这可能导致DNA 变性,以及来自DNA靶标的gRNA和Cas9的解离。可以增加Cas9与gRNA的 结合,使得Cas9-gRNA作为完整的复合物从DNA靶标解离,尽管存在DNA 变性。可加入二甲基亚砜以降低DNA变性所需的温度,使Cas9蛋白结构不受 影响。Cas9优先结合未被切割的靶位点,并且热稳定的Cas9可在煮沸后保留 活性。由于这些特征,通过升高温度,例如高达100℃,并将反应冷却至例 如37℃,热稳定的Cas9可保持能够结合其gRNA并切割其更多的底物。通过 允许Cas9的回收,可以提高消减效率,并且随着反应中需要较少的Cas9,也 可以降低脱靶(非特异性)切割概率。
可以分离热稳定的CRISPR/Cas系统蛋白,例如通过嗜热细菌嗜热链球菌 和激烈热火球古菌(Pyrococcus furiosus)的基因组中的序列同源性来鉴定。然 后可以将CRISPR/Cas系统基因克隆到表达载体中。在一个示例性实施方案中, 分离出热稳定的Cas9蛋白。
在另一个实施方案中,可以通过非耐热CRISPR/Cas系统蛋白的体外演化 获得耐热CRISPR/Cas系统蛋白。可以诱变CRISPR/Cas系统蛋白的序列以提 高其热稳定性。在一些实施方案中,这可以通过定点诱变来实现,以去除过 量的环序列,增加蛋白结构域之间的离子桥的数量,或通过稀释成液滴和 PCR来产生潜在的突变体库。在一个示例性实施方案中,通过非耐热的Cas9 的体外演化产生热稳定的Cas9。
发明的方法
富集目的序列/消减靶向序列
本文提供了通过耗尽非目的的靶向序列(靶序列是被靶向以待消减的序 列)来富集样品的目的序列的方法。
在一个实施方案中,富集样本的目的序列的方法包括:
提供包含目的序列和被靶向以待消减的序列的样品,其中所述目的序列 占样品的少于50%、少于45%、少于40%、少于35%、少于30%、少于25%、 少于20%、少于15%、少于10%、少于9%、少于8%、少于7%、少于6%、少 于5%、少于4%、少于3%、少于2%、少于1%、少于0.5%、少于0.1%、少于 0.05%、少于0.01%、少于0.005%、或甚至少于0.001%;将样品与多个 CRISPR/Cas系统蛋白-gRNA复合物接触,其中gRNA与靶向序列互补,由此 切割靶向序列。在示例性的实施方案中,CRISPR/Cas系统蛋白是Cas9。
在一个实施方案中,富集非线粒体DNA的样品的方法包括:(a)提供包含 线粒体DNA和非线粒体DNA的样品,其中线粒体DNA和非线粒体DNA是接 头连接的,并且其中将接头连接到线粒体DNA和非线粒体DNA的5’和3’端; (b)将样品与多个CRISPR/Cas系统蛋白-gRNA复合物接触,其中所述gRNA与 线粒体DNA互补,由此产生仅接头连接于一端上的线粒体DNA,以及接头 连接于5’和3’端二者上的非线粒体DNA;和(c)富集样品的非线粒体DNA。在 一些实施方案中,用接头特异性PCR富集样品。在一些实施方案中,富集包 括用具有核酸外切酶活性的酶处理步骤(b)的产物,所述酶例如核酸外切酶III 或BAL-31。例如,如果使用核酸外切酶III,则接头可以是Y形的。如果使用 BAL-31,则接头可以包含多聚-G尾部。在一些实施方案中,通过纯化目的 序列来富集样品。
在另一个实施方案中,富集样品的方法包括:(a)提供包含来自第一基因 组的核酸和来自第二基因组的核酸的样品,其中来自第一基因组的核酸接头 连接于其5’和3’端上且其中来自第二基因组的核酸接头连接于其5’和3’端上; (b)使所述样品与多个CRISPR/Cas系统蛋白-gRNA复合物接触,其中gRNA与 来自第一基因组的核酸上的位点互补,由此产生仅接头连接于一端上的来自 第一基因组的核酸和接头连接于5’和3’端二者上的来自第二基因组的核酸; 及(c)富集样品的来自第一基因组的核酸。在一些实施方案中,用接头特异性 PCR富集样品。在一些实施方案中,富集包括用具有核酸外切酶活性的酶处 理步骤(b)的产物,所述酶例如核酸外切酶III或BAL-31。例如,如果使用核 酸外切酶III,则接头可以是Y形的。如果使用BAL-31,则接头可以包含多聚 -G尾部。在一些实施方案中,通过纯化目的序列来富集样品。
在另一个实施方案中,富集样品的非宿主核酸的方法包括:提供包含宿 主核酸和非宿主核酸的样品,其中宿主核酸和非宿主核酸是接头连接的,并 且其中接头连接至宿主核酸和非宿主核酸的5’和3’端;将样品与多个 CRISPR/Cas系统蛋白-gRNA复合物接触,其中所述gRNA与宿主核酸中的靶 位点互补,由此产生仅接头连接于一端上的宿主核酸和接头连接于5’和3’端 二者上的非宿主核酸;并用接头特异性PCR扩增产品或纯化,或用核酸外切 酶处理。
在另一个实施方案中,本文提供了用于连续消减样品中的靶向核酸的方 法,包括:(a)提供包含宿主核酸和非宿主核酸的样品,其中所述非宿主核酸 包含来自至少一个已知非宿主生物体的核酸和来自至少一个未知非宿主生 物体的核酸;(b)将样品与多个CRISPR/Cas系统蛋白-gRNA复合物接触,其 中将所述gRNA配置为与宿主核酸中的靶向序列杂交,由此切割宿主核酸的 一部分;(c)使所述样品与多个CRISPR/Cas系统蛋白-gRNA复合物接触,其中 所述gRNA被配置为与所述至少一个已知非宿主核酸中的靶向序列杂交,由此切割所述至少一个已知非宿主核酸的一部分;和(d)从未知非宿主生物体分 离核酸。
图1提供了处理人体组织样本(1000)的第一非限制性示例性方法。在第一 步(1005)中,DNA提取从所述样本(1000)基本上提取了全部核酸序列,包括 存在于样本(1000)中的人宿主的核酸序列的和任何非人或非宿主生物体的核 酸序列。DNA提取步骤(1005)可以产生约95%的人DNA(1010)和约5%的非人 DNA(1015),其中非人DNA(1015)主要包括微生物DNA,并且在本实例方法 实施方案中,微生物或非人DNA(1015)是进行进一步的DNA分析的主要兴趣 所在。在DNA提取步骤(1005)之后,将所提取的核酸序列(1010)和(1015)片段 化,以将每个提取的核酸序列的长度减少至更易于管理的长度以供扩增,测序等。将接头(1020)连接到每个片段的每个末端。每个提取的核序列片段或 基因组片段包含基因组的区域,例如每个片段(1025)包括来自人基因组区域 的两个接头(1020)之间的虚线所示的核酸序列,而每个片段(1030)包括来自 从组织样品提取的非宿主生物体之一的区域的显示为两个接头(1020)之间的 实线的核酸序列。每个提取的核酸或基因组片段包含基因组的区域,例如每 个片段(1025)包括来自人基因组区域的两个接头(1020)之间的虚线所示的核 酸序列,而每个片段(1030)包括来自从组织样品提取的非宿主生物体之一的 区域的显示为两个接头(1020)之间的实线的核酸序列。然而会认识到,不加 以进一步分析的话序列是无法区分的。
本文描述的组合物和方法的示例性应用在图1中提供。该图描述了本发 明的非限制性示例性实施方案,其包括消减生物样品的DNA提取物的方法。 在图1中,将整个片段化的DNA提取物(1025)和(1030)以及整个向导RNA文库 (1050)与混合物(1080)中的Cas9蛋白混合。在混合物(1080)中每个靶特异性向 导序列(1060)与人DNA片段(1025)中发现的匹配核酸序列杂交,且Cas9蛋白 和向导RNA茎结合位点(1065)形成向导RNA/Cas9复合物(1085),其将向导 RNA(1055)与人DNA片段(1025)结合。如果向导RNA文库(1050)设计良好,基本上所有的人DNA片段(1025)都会被向导RNA/Cas9复合物结合。此后,将 混合物(1080)以如下方式进行温育:其中Cas9蛋白切割或裂解与向导RNA/Cas9复合物结合的每个人DNA片段(1025)的两条链。切割后,人DNA 片段(1025)分为两片(1090)(1095),任何未切割的DNA片段(1030)保持完整, 而接头(1020)仍然连接到每一端并可以进行扩增和进一步研究。
在消减靶标已被切割或裂解之后进行的各种进一步的处理步骤中,可以 将混合物(1080)大小选择性地过滤以从切割的片段(1090)和(1095)分离未切 割的片段(1030)。此后,可以扩增和测序未切割的片段(1030)。或者,扩增 工艺可以用于从未切割的区段将切割的区段分选出来,因为在一些扩增系统 中,只有在片段的每个末端具有接头(1020)的区段被扩增。
图2中提供了本文所述的组合物和方法的另一示例性应用。图2描绘了第 二非限制性示例性方法涉及处理样本或测序文库(2000),其涉及分割而非消 减。在第一步(2005)中,DNA提取从样本(2000)提取基本上所有的核酸序列, 其包括样本(2000)中存在的人宿主的核酸序列和任何其他非宿主生物体的核 酸序列。在本实例中,DNA提取步骤(2005)可以产生约5至40%的人DNA和 约95至60%的非人DNA。如上述关于图1所述的,将DNA提取样品片段化并 接头连接。如上述关于图1进一步描述的,开发了gRNA的向导RNA文库(2050)以与大量不同的人特异性gRNA(2055)杂交,其各自被配置为与人DNA或核 酸序列杂交,所述人DNA或核酸序列被靶向用于与Cas9复合物结合。然而, 取代切割靶向序列的,图2所示的方法用于将片段化的核酸样品分开为两个 可以分别扩增的级分。如上所述,将指导文库(2050)和片段化DNA提取样品 与混合物(2080)中的Cas9组合。然而,在本实例实施方案中,CAs9包含无催 化活性的Cas9(dCas9)。术语“无催化活性的”是指具有灭活HNH和RuvC核酸酶的Cas蛋白。这种蛋白可以结合至双链DNA中的靶位点(其中靶位点由向导 RNA确定),但是该蛋白不能切割或切口双链DNA。因此,dCas9将混合物 (2080)分开为未结合的非人DNA片段(2030)和dCas9结合的人DNA片段 (2090)。dCas9/gRNA复合物仅与由gRNA序列确定的靶标结合,并且通过先 前连接到dCas9蛋白的亲和标签(例如生物素)的结合来去除靶核酸样品的结 合部分。结合的核酸序列(2090)可以通过变性条件从Cas9/gRNA复合物中洗 脱出来,然后进行扩增和测序。类似地,可以对未结合的核酸序列(2030)进 行扩增和测序。
无接头的DNA大片段的消减
在一些实施方案中,本文提供的方法用于消减。然而,代替切割含有接 头的文库,选择向导RNA在大尺寸(例如从100bp至10kb的任何处)的片段化 DNA库进行多次切割。在用CRISPR/Cas系统蛋白-gRNA复合物切割后,对 DNA进行尺寸选择以除去小片段(例如完整片段的平均大小的至少1/2或1/3)。 这通过例如通过用λ核酸外切酶的处理来辅助,所述λ核酸外切酶是5'至3'方 向进行的5'磷酸特异性核酸外切酶,并且会攻击先前已用CRISPR/Cas系统蛋 白切割的任何片段。然后可以通过不需要测序接头的单分子测序仪对所得的文库进行测序;或可以连接接头用于下游分析。
使用热稳定的CRISPR/Cas系统蛋白的消减
在另一个实施方案中,在样品中产生切割的靶向序列的方法包括:(a) 提供包含目的序列和被靶向以待切割的序列的样品;(b)使样品与多个 CRISPR/Cas系统蛋白-gRNA复合物接触,其中所述gRNA与靶向序列互补, 由此产生切割的靶向序列;(c)将CRISPR/Cas系统蛋白从切割的靶向序列解 离;(d)产生另外的切割的靶向序列;和(c)回收未切割的目的序列。在一些实 施方案中,CRISPR/Cas系统蛋白是耐热的。在一些实施方案中,通过将步骤(b)的混合物的温度升高至至少75℃来实现CRISPR/Cas系统蛋白从切割的 靶向序列的解离。在一些实施方案中,通过将步骤(b)的混合物的温度降低至 至少50℃来实现另外的切割的靶向序列的产生。
在另一个实施方案中,在样品中消减靶向序列的方法包括:(a)提供包含 目的序列和被靶向以待消减的序列的样品;(b)将样品与多个CRISPR/Cas系 统蛋白-gRNA复合物接触,其中gRNA与靶向序列互补,由此产生切割的靶 向序列,且其中所述CRISPR/Cas系统蛋白是热稳定的;(c)将步骤(b)的混合 物的温度升高至至少75℃;(d)将步骤(b)的混合物的温度降低至少50℃;重 复步骤(c)和(d)至少一次;和(f)回收未切割的目的序列。
在存在CRISPR/Cas蛋白切口酶的情况下CRISPR/Cas系统蛋白介导的消 减
在一些实施方案中,不想要的靶向核酸的消减可以使用CRISPR/Cas系统 蛋白切口酶进行。在一个实施方案中,该方法包括:制备包含待去除的 DNA(例如非目的的人DNA)和目的DNA(例如来自未知病原体的DNA)的 DNA测序文库;设计向导RNA以使所有要消减的DNA在相对的DNA链上具 有两个临近的(例如相距小于15个碱基)向导RNA结合位点;将CRISPR/Cas 系统蛋白切口酶和向导RNA加入DNA文库。在该实施方案中,CRISPR/Cas 系统蛋白切口酶识别其待去除的DNA上的靶位点,并且仅切割一条链。对于 待消减的DNA,两个独立的CRISPR/Cas系统蛋白切口酶可以在临近位置切 割待去除的DNA(例如人DNA)的两条链;只有待去除的DNA(例如人DNA) 会具有两个临近的CRISPR/Cas系统蛋白切口酶位点,其产生双链断裂。如果 CRISPR/Cas系统蛋白切口酶非特异性地或以低亲和性识别目的DNA(例如病 原DNA)上的位点,则其仅切割不会阻止DNA分子的后续PCR扩增或下游处 理的一条链。这图示于图7中。在该实施方案中,两个向导RNA非特异性识 别两个足够临近的位点的机会可以忽略不计(<1×10-14)。如果常规的 CRISPR/Cas系统蛋白介导的裂解切割了太多的目的DNA,则该实施方案会 是特别有用的。
CRISPR/Cas系统蛋白介导的消减及生物素标记
在一些实施方案中,使用生物素清除CRISPR/Cas系统蛋白切割产物。例 如,在最初包含<5%目的DNA和>95%被靶向以待消减的DNA的样品中,>95% 的DNA被片段化和消减,而包含生物素标签的未切割(<5%目的DNA)DNA通 过结合至链霉亲和素小珠而加以纯化。该实例说明了在不使用核酸外切酶的 情况下在CRISPR/Cas系统蛋白介导的切割之后去除不想要的DNA(消减的片 段化DNA)的方法。
图10中示出了示例性实施方案。在该示例性实施方案中,按照常规方案 将DNA混合物(含有>95%的不想要的人DNA和<5%的其它目的DNA)片段化, 末端修复并连接到接头上,然后使用生物素-P5(例如5’生物素- AATGATACGGCGACCACCGA)和P7(例如 5’-CAAGCAGAAGACGGCATACGA)的引物通过PCR扩增。这确保了整个测 序文库只在DNA分子的一端具有5'生物素标记。然后将DNA混合物进行 CRISPR/Cas系统蛋白(例如Cas9)消化,与例如在这种情况下针对线粒体DNA (不想要的DNA)的向导RNA文库复合。已经被CRISPR/Cas系统蛋白切割的 DNA分子(例如在这种情况下是线粒体DNA)会失去生物素标记的接头,因此不能进行测序或PCR扩增;而完整的未被Cas9切割的DNA文库(例如在这种 情况下是非线粒体目的DNA)仍然携带生物素标记。结果,可以通过加入链 霉亲和素小珠来回收未被CRISPR/Cas系统蛋白切割的完整DNA。然后可以 将样品进行进一步下游应用,如测序,克隆,以进一步富集。
消减后的核酸外切酶处理
在一些实施方案中,期望在PCR扩增或测序之前去除切割的片段。
在一个实施方案中,CRISPR/Cas系统蛋白介导的消减之后是核酸外切酶 处理。核酸外切酶处理可以进一步降解CRISPR/Cas系统蛋白切割的核酸,同 时保留包含目的序列的未切割核酸完整。
在一个实施方案中,消减样品中的靶向序列的方法包括:提供包含目标 序列和被靶向以待消减的序列的样品;将样品与多个CRISPR/Cas系统蛋白 -gRNA复合物接触,其中所述gRNA与靶向序列互补,由此产生切割的靶向 序列;并将步骤(b)的产物与核酸外切酶接触。在一个实施方案中,核酸外切 酶是核酸外切酶III。在另一个实施方案中,核酸外切酶是BAL-31。
在一个示例性实施方案中,从生物样品中提取DNA并片段化,从而产生 包含DNA片段的文库(例如测序文库)。将Y形接头或圆形接头连接到DNA片 段。DNA片段包含DNA目的序列和靶向序列(非目的DNA)。将该文库与多个 CRISPR/Cas系统蛋白-gRNA复合物接触,而CRISPR/Cas系统蛋白切割非目 的的靶DNA,并保留其他DNA目的序列完整。将所得产物与核酸外切酶III 接触。核酸外切酶III可以通过使用平末端或5'突出端引发一条DNA链的单向3'>5'降解,产生单链DNA和核苷酸;它在单链DNA上不是活性的,因此3' 突出端(例如Y形接头端)具有抗降解性。因此,未被CRISPR/Cas系统蛋白切 割的完整的双链DNA文库不被核酸外切酶III消化,而被CRISPR/Cas系统蛋 白切割的DNA分子被具有3’>5’活性的核酸外切酶III自Cas9切出的平末端向 接头降解。图8示出了示例性实施方案。按照常规方案,将DNA混合物(含有> 95%的不想要的人DNA和<5%的其他目的DNA)片段化,末端修复并连接至Y 形接头(或圆形接头),但不通过PCR扩增。然后将DNA混合物进行Cas9消化, 与例如在这种情况下为针对线粒体DNA的向导RNA文库复合,加入核酸外切 酶III。消化不想要的线粒体DNA,然后通过柱纯化和/或PCR扩增回收剩余 的完整双链DNA文库。
在另一个示例性实施方案中,使用核酸外切酶BAL-31降解CRISPR/Cas 系统蛋白切割的DNA,同时保留未切割的目的DNA完整。在一个示例性实 施方案中,从生物样品提取DNA并片段化,并产生包含DNA片段的文库(例 如测序文库)。DNA片段包含DNA目的序列和靶向序列(非目的DNA)。片段 的3'端用末端转移酶加上多聚-dG尾部。将该文库与多个CRISPR/Cas系统蛋 白-gRNA复合物接触,CRISPR/Cas系统蛋白切割非目的的靶标DNA,并保留其他DNA目的序列完整。将所得产物与核酸外切酶BAL-31接触。核酸外 切酶BAL-31具有两种活性:双链DNA核酸外切酶活性和单链DNA/RNA内切 酶活性。双链DNA核酸外切酶活性允许BAL-31在两条链上从开口端降解 DNA,从而降低双链DNA的大小。温育的时间越长,双链DNA的大小减小 越多,使其对于消减中等至大的DNA(>200bp)是有用的。注意到BAL-31的单链内切核酸酶活性使其能够非常快速地消化多聚-A,多聚-C或多聚-T,但 对多聚-G的消化极低(Marrone and Ballantyne,2008)。由于这种性质,在文 库的3'末端添加单链多聚-dG可以保护其不被BAL-31降解。因此,由 CRISPR/Cas系统蛋白切割的DNA分子可以被BAL-31降解,所述降解是由 BAL-31的双链DNA核酸外切酶活性自CRISPR/Cas系统蛋白切割的双链平末 端向携带多聚-dG的其他末端进行的,引起消减;而未被CRISPR/Cas系统蛋 白切割的完整DNA文库不被BAL-31消化,这是由于其3'末端多聚-dG保护所 致。图9描绘了该方法的示例性实施方案。制备了测序文库(含有例如>95% 的人DNA和<5%的其他文库)。使用末端转移酶在3'末端加上多聚-dG尾部。 然后将添加多聚-dG尾部的文库进行Cas9消化,与向导RNA文库(例如针对线 粒体DNA的向导RNA文库)复合。然后将产物与核酸外切酶BAL-31温育,其 启动未被多聚-dG封端的末端的消化。然后将产物进行进一步PCR或在DNA 纯化柱上纯化。然后可以通过柱纯化或PCR扩增来回收剩余的完整双链DNA 文库。
用于监测消减的控制
在所讨论的实施方案中,期望提供阳性和/或阴性对照。阳性对照可以确 保靶核酸的消减以保真度进行。
在一些实施方案中,一个对照试剂组是阳性对照试剂组,阳性对照靶序 列。在一个示例性实施方案中,阳性对照试剂组包含核酸片段的集合,其中 所述片段包含靶序列,其与gRNA至少80%、至少85%、至少90%、至少95%、 至少96%、至少97%、至少98%、至少99%、或100%互补。此对照可以与用 户的反应一起运行,以确保所有组件都正常工作。使用CRISPR/Cas系统蛋白 消减后,可以通过凝胶电泳或qPCR测量阳性对照靶序列的清除。
在一些实施方案中,对照试剂组是阴性对照试剂组。在一些实施方案中, 阴性对照确保脱靶标(off-target)切割在最小限度或是不存在。在一个示例 性实施方案中,阴性对照试剂组包含第二组gRNA,其中与第一组gRNA相比, 第二组gRNA表现出降低的与靶序列的结合。在一些实施方案中,与第一组 RNA相比,第二组gRNA表现出降低5%、10%、15%、20%、25%、30%、35%、 40%、45%、50%、55%、60%、65%、70%、75%、80%、或85%的与靶序 列的结合。在另一个示例性实施方案中,阴性对照试剂组包含第二组gRNA, 其中所述第二组gRNA与靶序列不超过50%、55%、60%、65%、70%、75%、 80%、85%、90%、或95%互补。阴性对照可以是与使用的gRNA具有小于100% 同一性的一组gRNA;例如与靶特异性序列具有1、2、3、4、5或更多个不匹 配。在一些实施方案中,阴性对照试剂组包含核酸片段的集合,其中该片段 与第一组gRNA不超过50%、55%、60%、65%、70%、75%、80%、85%、90%、 或95%互补。DNA文库可以与试剂盒中使用的gRNA的靶向序列具有小于100% 的同一性;例如,与gRNA的互补序列具有1、2、3、4、5或更多个不匹配。 该对照可以与用户的反应一起运行,以确保所有组分都正常工作并测量酶的 任何脱靶活性。用CRISPR/Cas系统蛋白进行消减后,可通过凝胶电泳或qPCR 测量脱靶消减量。
关于本文考虑的阳性和阴性对照,本文提供的gRNA与其靶标的互补性 可以指沿着靶标全长的gRNA互补性。然而,在一些实施方案中,在最接近 PAM序列的结合区域,互补性可能更多地受到gRNA末端核酸不匹配的影响。 在该区域中的不匹配可能会比沿gRNA其他区域的核酸不匹配更大地影响结 合靶标的能力。同样,远离PAM序列的gRNA中的不匹配可能会比沿gRNA 其他区域的核酸不匹配更小地影响结合靶标的能力。在一些实施方案中,阴 性对照gRNA在PAM序列附近具有较低的互补性,但是在远离PAM序列处具 有较高的互补性。例如,在一些实施方案中,阴性对照gRNA在PAM序列附 近具有50%-70%的互补性,但是远离PAM序列具有70%-100%的互补性。在 一些实施方案中,阴性对照gRNA沿靶标的全长具有50%、55%、60%、65%、 70%、75%、80%、85%、90%、或95%的互补性。
在ATAC-seq后消减线粒体DNA
使用测序(ATAC-seq)的转座酶可及的染色质测序测定技术用于分子生 物学中以研究染色质,即可及位点。该方法通过转座酶使用测序接头将开放 性染色质区域加上标签,使得可以扩增来自这些开放染色质区域的DNA片段 并进行高通量测序(WO2014/189957;Buenrostro等,Nature Methods,Vol.10, No.12,2013年12月,第1213页)。尽管与针对全基因组染色质可及性的其他 测定法相比,ATAC-seq要求的起始材料少得多,但主要缺点之一是测序文库 通常被高百分比的线粒体DNA(其也是开放DNA)污染,并且需要许多人基因 组的标准可及性研究的更多测序读段,如DNase-seq和FAIRE-seq(M.Temana 和MJ.Back,2014)。因此,本领域需要在ATAC-Seq方法之后从测序文库去除 不想要的线粒体DNA污染物,以降低测序成本。本发明提供了从经过 ATAC-Seq的样品中选择性地消减线粒体DNA的方法。
本文提供了一种分析基因组DNA的方法,包括:(a)用插入酶处理分离自 细胞群的DNA,以产生多个带标签的非线粒体基因组DNA片段,由此还产 生残余量的带标签的线粒体DNA;(b)根据本文提供的任何相关方法来富集 步骤(a)的产物中的非线粒体DNA。在一些实施方案中,该方法还包括对带标 签的片段的至少一部分进行测序以产生多个序列读段;及通过将获取自所述 序列读段的信息映射至该区域,来制作所述细胞基因组的区域的表观遗传学 图谱。
在另一个方面,本公开提供了一种帮助确定多核苷酸在位点处的可及性(assessibility)的方法,其中所述多核苷酸来自细胞样品,所述方法包括:用 插入酶将多个分子标签插入到所述多核苷酸中,以及用所述分子标签来确定 位点处的可及性,并使用本文所述的基于CRISPR/Cas系统的消减方法去除不 想要的DNA污染物。细胞样品可以来自原代来源(primary source)。细胞样 品可以由单个细胞组成。细胞样品可能由有限数量的细胞组成(例如小于约 500,000个细胞)。
插入酶可以是能够将核酸序列插入到多核苷酸中的任何酶。在一些情况 下,插入酶可以以基本上序列独立性的方式将核酸序列插入多核苷酸。插入 酶可以是原核的或真核生物的。插入酶的实例包括但不限于转座酶, HERMES和HIV整合酶。转座酶可以是Tn转座酶(例如Tn3,Tn5,Tn7,Tn10, Tn552,Tn903),MuA转座酶,Vibhar转座酶(例如来自哈氏弧菌(Vibrio harveyi)),Ac-Ds,Ascot-I,BsI,Cin4,Copia,En/Spm,F元件,hobo,Hsmarl,Hsmar2,IN(HIV),ISI,IS2,IS3,IS4,IS5,IS6,ISIO,IS2I,IS30,IS50, ISSI,ISI50,IS256,IS407,IS427,IS630,IS903,IS911,IS982,IS103I, ISL2,LI,Mariner,P element,Tam3,Tel,Tc3,Tel,THE-I,Tn/O,TnA, Tn3,Tn5,Tn7,TnlO,Tn552,Tn903,Toll,Tol2,TnlO,Tyl,任何原核 转座酶,或与上述那些相关的和/或衍生自上述那些的任何转座酶。在一些情 况下,与亲本转座酶相关和/或衍生自亲本转座酶的转座酶可以包含与亲本转 座酶的相应肽片段具有至少约50%、约55%、约60%、约65%、约70%、约75%、 约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、 约97%、约98%、或约99%的氨基酸序列同源性的肽片段。肽片段的长度可 以是至少约10,约15,约20,约25,约30,约35,约40,约45,约50,约60, 约70,约80,约90,约100,约150,约200,约250,约300,约400或约500 个氨基酸。例如,衍生自Tn5的转座酶可以包含长度为50个氨基酸且与亲本 Tn5转座酶中的相应片段约80%同源的肽片段。在一些情况下,插入可以通 过添加一种或多种阳离子来促进和/或触发。阳离子可以是二价阳离子,例如 Ca2+,Mg2+和Mn2+
分子标签可以包括测序接头,锁核酸(LNA),拉链核酸(ZNA),RNA, 亲和反应性分子(例如生物素,dig),自身互补分子,硫代磷酸酯修饰,叠氮 基或炔基。在一些情况下,测序接头还可以包括条码标记。此外,条码标记 可以包括唯一的序列。唯一的序列可用于识别各个插入事件。任何标签还可 以包含荧光标签(例如荧光素,罗丹明,Cy3,Cy5,噻唑橙等)。
试剂盒及制品
本申请提供了包含本文所述的任何一种或多种组合物(其不限于接头, gRNA,gRNA文库等)的试剂盒。
在一个实施方案中,试剂盒包含gRNA的集合或文库,其中所述gRNA 靶向人DNA序列。在另一个实施方案中,试剂盒包含gRNA的集合或文库, 其中所述gRNA靶向牛DNA序列。在另一个实施方案中,试剂盒包含gRNA 的集合或文库,其中所述gRNA靶向人核糖体RNA序列。在另一个实施方案 中,试剂盒包含gRNA的集合或文库,其中所述gRNA靶向人线粒体DNA序 列。
在一些实施方案中,试剂盒包含:CRISPR/Cas系统蛋白和gRNA,其中 所述gRNA与线粒体DNA互补;或其中所述gRNA与整个基因组互补;或其 中所述gRNA与由整个转录组(transcriptome)制备的cDNA互补;或其中所述 gRNA与至少10个,至少25个,至少50个,至少100个,至少250个,至少500 个,至少750个,至少102,至少103个,至少104个,至少105个,至少106个, 至少107个,至少108个,至少109个,至少1010个独特转录物制得的cDNA互补; 或其中所述gRNA与转录组中最丰富的转录物制得的cDNA互补,例如转录组 中最丰富的100、75、50、25、20、15、或10个转录物;或其中所述gRNA与 由转录组中最丰富的100、75、50、25、20、15、或10个转录物的子集制得 的cDNA互补。
在一些实施方案中,试剂盒包含:CRISPR/Cas系统蛋白和gRNA,其中 CRISPR/Cas系统蛋白包含来自不同细菌的CRISPR/Cas系统蛋白的混合物; 或其中CRISPR/Cas系统蛋白是工程化的;其中所述gRNA与线粒体DNA互补; 或其中所述gRNA与基因组DNA互补,代表整个基因组;或其中所述gRNA 与源自整个转录组的cDNA文库互补;或其中所述gRNA与源自至少10个,至 少25个,至少50个,至少100个,至少250个,至少500个,至少750个,至少 102个,至少103个,至少104个,至少105个,至少106个,至少107个,至少108个,至少109个,至少1010个独特转录物的cDNA文库互补;或其中所述gRNA 与源自转录组中最丰富的100、75、50、25、20、15、或10个转录物的cDNA 文库互补;或其中所述gRNA与衍生自转录组中最丰富的100、75、50、25、 20、15、或10个转录物的子集的cDNA文库互补;或其中所述gRNA包含能够将来自不同细菌菌种的CRISPR/Cas系统蛋白靶向靶序列的gRNA的混合物。
在一些实施方案中,试剂盒包含:CRISPR/Cas系统蛋白、gRNA和具有 核酸外切酶活性的酶,其中所述gRNA与目的靶标互补。在一个实施方案中, 核酸外切酶是核酸外切酶III。在一个实施方案中,核酸外切酶是BAL-31。
在一些实施方案中,试剂盒包含:CRISPR/Cas系统蛋白和gRNA,其中 所述CRISPR/Cas系统蛋白是热稳定的;其中所述gRNA与目的靶标互补。
在一些实施方案中,试剂盒包含:CRISPR/Cas系统蛋白、第一组gRNA 和对照试剂组,其中所述gRNA与目的靶序列互补。在一个实施方案中,对 照试剂组是阳性对照试剂组。在一个示例性实施方案中,阳性对照试剂组包 含核酸片段的集合,阳性对照靶序列,其中所述片段包含与所述gRNA互补 的靶序列。在一个实施方案中,对照试剂组是阴性对照试剂组。在一个示例 性实施方案中,阴性对照试剂组包含第二组gRNA,其中与第一组gRNA相比,第二组gRNA表现出降低的与靶序列的结合。在另一个示例性实施方案中, 阴性对照试剂组包含核酸片段的集合,其中所述片段与第一组gRNA不超过 90%互补。
在一些实施方案中,试剂盒包含:用于从细胞群分离DNA的试剂;插入 酶;CRISPR/Cas系统蛋白;和多个gRNA,其中所述gRNA与线粒体DNA互 补;或其中所述gRNA与整个基因组互补;或其中gRNA与整个转录组互补; 或其中所述gRNA与转录组中最多的(top)100、75、50、25、20、15、或 10个基因互补。
本申请还提供了包含本文所述的任何一种试剂盒的制品。制品的实例包 括小瓶(包括密封小瓶)。
纳入以下实施例是出于说明目的,而并不意图限制本发明的范围。
实施例
实施例1:从ATAC-seq文库消减线粒体DNA,文库1
概览
如图4所示,在人DNA文库上测试了消减方法,人DNA文库已被先前测 序并显示为由94%人核DNA和6%线粒体DNA组成(文库1)。使用重组Cas9和 专门为线粒体DNA设计的25个向导RNA的文库进行消减。使用不靶向线粒体 DNA的不相关向导RNA进行对照消减。消减了约40%的人线粒体DNA。消减 在20分钟内完成,随后PCR扩增文库。
Cas9的表达
将Cas9(来自酿脓链球菌)克隆到pET30表达载体(EMD biosciences)中, 以在Cas9起始密码子的紧邻上游插入六组氨酸标签。将所得质粒转化到 Rosetta(DE3)BL21细菌菌株(EMD biosciences)中,并在1L的LB培养基中充分 通风培养,直至培养物的光密度(600nm处的OD)达到0.4。将温度降至25℃, 加入0.2mM IPTG,并再培养4小时。然后通过离心收集细胞(在4℃处1,000× g,20分钟),重悬于10ml结合缓冲液(20mM Tris pH8,0.5MNaCl,5mM咪 唑,0.05%NP40)中,并通过超声处理裂解(以30%的功率7×10秒脉冲(bursts), Sonifier 250,Branson)。通过10,000xg离心20分钟去除不溶性细胞碎片;然后将含有可溶性蛋白的上清液与0.4ml NTA小珠(Qiagen)混合并加载到柱上。 将小珠用4ml结合缓冲液洗涤三次,然后用3×0.5ml补充有250mM咪唑的结 合缓冲液洗脱。然后使用30,000MWCO蛋白浓缩器(Life Technologies)浓缩洗 脱级分并与储存缓冲液(10mM TrispH 8,0.3M NaCl,0.1mM EDTA,1mM DTT,50%甘油)进行缓冲液交换,通过SDS PAGE然后是胶体蓝染色(Life Technologies)来验证,定量,然后储存在-20℃以供以后使用。
使用与上述生产Cas9相同的方法制备和纯化突变体Cas9切口酶,一种酿 脓链球菌Cas9的D10A突变体。
向导RNA文库的制备
设计了25个构建体,每个构建体含有T7 RNA聚合酶启动子,20个碱基 对的线粒体DNA特异性序列,和来自酿脓链球菌的向导RNA骨架。对于每个 构建体,排列两个寡核苷酸(参见表1和2的序列),并以1μl终浓度组合5μM, 然后在98℃加热3分钟,然后以5℃/分钟的速率冷却至55℃,最后在55℃温育 5分钟。
然后将退火的寡核苷酸连接到含有通过金门克隆(golden gate cloning)的 向导RNA骨架的T7GRNE载体;将退火的寡核苷酸组合至500ng T7GRNE质 粒,1μl BsaI限制酶和1μl T7 DNA连接酶,总体积为20μl。将反应物在热循 环仪中进行如下10个循环:在37℃温育15分钟,然后在20℃10分钟,然后是 80℃单次循环15分钟。然后使用特异性正向引物(参见表1和2)和反向引物 (5’-CAGAGCGAGGTATGTAGG-3’)对产物进行PCR扩增。循环条件如下: 95℃1分钟,57℃30秒,及72℃90秒,30个循环。通过琼脂糖凝胶电泳和SYBR 安全染色的1.6kb片段的存在证实了成功的反应。将成功的反应合并在一起 并使用PCR清理试剂盒(Thermo Fisher Scientific)纯化。
用如下规则来设计向导RNA:
规则1:在任意链上的目的基因组区域(例如全外显子或线粒体基因组) 中建立如下序列(5’>3’方向):NNNNNNNNNNNNNNNNNNNNNGG
规则2:加下划线的序列(20聚体)是排列的寡核苷酸序列中包含的向导 RNA的靶向部分。
a.消除了具有超过55%GC含量的任何20聚体
b.消除了具有超过13个茎环形成碱基对的任何20聚体(例如通过Mfold 或Vienna软件预测的)
c.如果20聚体的第一个核苷酸不是A/G,则在5'端添加一个G残基以得 到21聚体
d.规则3:添加T7启动子和引物结合位点以产生以下引物(5'>3'):
GCCTCGAGCTAATACGACTCACTATAG(G)NNNNNNNNNNNNNNNNNNNN
(G)表示如果20聚体在5'末端没有嘌呤,则添加G
体外转录
为了将指导文库转录为向导RNA,我们组装了如下体外转录反应混合物: 将10μl纯化的文库(~500ng),6.5μl的H2O,2.25μl的ATP,2.25μl的CTP, 2.25μl的GTP,2.25μlUTP,2.25μl 10x反应缓冲液(NEB)和2.25μl T7 RNA聚 合酶混合物。将反应物在37℃温育24小时,然后在H2O中稀释10倍。单次反 应产生约40μg的RNA。通过在5%TBE/尿素凝胶上进行1μl反应并用SYBR Gold(Life Technologies)染色来检查RNA的产量和大小(~150个碱基对)。
DNA特异性Cas9介导的消减
将稀释的向导RNA(1μl,相当于2pmol)与3μl 10x Cas9反应缓冲液 (NEB),20μlH2O和1μl重组Cas9酶(NEB,1pmol/μl)组合。使用相同的参数 分别进行使用靶向以下序列(5’-GGATTTATACAGCACTTTAA-3’)的对照向 导RNA的对照反应。人染色体或线粒体DNA都不存在该序列。反应在37℃温 育15分钟,然后补充5μl稀释的DNA文库(50pg/μl),并在37℃继续温育90分 钟。通过以1:100稀释度添加RNA酶A(Thermo Fisher Scientific)终止反应,加 热至98℃5分钟,然后冷却至室温并添加100μl H2O。然后将反应储存在-20℃ 直到使用。
消减后线粒体DNA的定量
对于每个反应(每个测试条件和使用对照向导RNA的反应),使用对照和 测试引物通过实时PCR分析两个单独的5μl样品。对于对照引物反应,将样 品与2μl H2O,0.25μl 10μM引物P5(5’-AATGATACGGCGACCACCGA-3’)和 0.25μl 10μM P7,(5’-CAAGCAGAAGACGGCATACGA-3’)和7.5μl的2x Maxima SYBR Green主混合物(Thermo FisherScientific)温育。对于测试引物 反应,将样品与1.75μl H2O,0.5μl的10μM线粒体引物(见表1和2)和0.25μl 的10μM P7(5’-CAAGCAGAAGACGGCATACGA-3’)和7.5μl的2x Maxima SYBRGreen主混合物(Thermo Fisher Scientific)温育。反应在iCycler实时 PCR热循环仪(BioRad)中使用如下2步循环条件进行温育:95℃3分钟,然后 是40个循环:95℃10秒,55℃45秒。
对于使用对照和测试引物两个实时PCR条件,进行校准曲线。将稀释的 DNA文库(50pg/μl)进一步稀释1:10,1:100,1:1000,1:10,000,并使用上述 相同的反应条件,仪器和循环条件通过实时PCR分析这些稀释液。
分别从对照和测试引物反应的结果中推导出总DNA和线粒体DNA的量。 对于每个DNA文库消减实验,确定线粒体DNA:总DNA比例,并使用对照 向导RNA将其针对实验进行标准化,然后绘制为图4所示的柱图。
表1:正向引物–退火及后续PCR反应中均使用
Figure BDA0003377520320000511
Figure BDA0003377520320000521
表2:反向引物–退火反应及实时PCR反应中使用
Figure BDA0003377520320000522
Figure BDA0003377520320000531
实施例2:从ATAC-seq文库消减线粒体DNA,文库2
概览
如图5和图6所示,在人DNA文库中测试了消减方法,人DNA文库先前 已经被测序并显示为由55%人核DNA和45%线粒体DNA组成(文库2)。使用 重组Cas9和专门设计用于线粒体DNA的90个向导RNA的文库进行消减,线 粒体基因组中没有留下空位(gap)。使用不靶向线粒体DNA的不相关向导 RNA进行对照消减。
通过使用两套不同的引物组合通过实时PCR来定量捕获前和捕获后文 库:P5与P7,其扩增所有DNA文库片段或仅扩增线粒体DNA的线粒体DNA 特异性引物。使用这两个单独反应的比例来定量线粒体DNA的消减。
还在Illumina MiSeq平台上对捕获前和捕获后文库进行测序,并将得到 的读数映射到人基因组以确定线粒体DNA含量。
Cas9的表达
将Cas9(来自酿脓链球菌)克隆到pET30表达载体(EMD biosciences)中, 以在Cas9起始密码子的紧邻上游插入六组氨酸标签。将所得质粒转化到 Rosetta(DE3)BL21细菌菌株(EMD biosciences)中,并在1L LB培养基中充分通 风培养,直至培养物的光密度(600nm处的OD)达到0.4。将温度降至25℃,加 入0.2mM IPTG,并再培养4小时。然后通过离心收集细胞(在4℃处1,000×g,20分钟),重悬于10ml结合缓冲液(20mM Tris pH8,0.5MNaCl,5mM咪唑, 0.05%NP40)中,并通过超声裂解(以30%的功率7×10秒脉冲,Sonifier250, Branson)。通过10,000xg离心20分钟去除不溶性细胞碎片;然后将含有可溶 性蛋白的上清液与0.4ml NTA小珠(Qiagen)混合并加载到柱上。将小珠用4ml 结合缓冲液洗涤三次,然后用3×0.5ml的补充有250mM咪唑的结合缓冲液洗 脱。然后使用30,000MWCO蛋白浓缩器(Life Technologies)浓缩洗脱级分并与 储存缓冲液(10mM Tris pH8,0.3M NaCl,0.1mM EDTA,1mM DTT,50%甘 油)进行缓冲液交换,通过SDS PAGE验证,随后通过胶体蓝染色(Life Technologies),定量,然后储存在-20℃以供以后使用。
使用与上述生产Cas9相同的方法制备和纯化突变体Cas9切口酶,一种酿 脓链球菌Cas9的D10A突变体。
向导RNA文库的制备
对T7向导RNA寡核苷酸(表3)及分离的寡核苷酸,stlgR(序列,GT TTT AGA GCTAGA AAT AGC AAG TTA AAA TAA GGC TAG TCC GTT ATC AAC TTG AAA AAG TGG CAC CGAGTC GGT GCT TTT TTT GGA TCC GAT GC),进行排序并合成(IDT)。
根据制造商的说明书,使用T4 PNK(New England Biolabs)将stlgR寡核苷 酸(300pmol)依次5'磷酸化,然后用(sing)5'腺苷酸化试剂盒(New England Biolabs)5'腺苷酸化。然后使用热稳定的5’App DNA/RNA连接酶(New England Biolabs)在65℃将T7-向导RNA寡核苷酸(5pmol)和5'腺苷酸化stlgR(10pmol) 连接1小时。连接反应在90℃热灭活5分钟,然后通过PCR(使用OneTaq,New England Biolabs,如下30个循环:95℃30秒,57℃20秒,72℃,20秒)用引物 ForT7(序列GCC TCG AGC TAA TAC GAC TCA C)和gRU(序列AAAAAAAGCACCGACTCGGTG)。使用PCR清理试剂盒(Life Technologies) 纯化PCR产物,并通过琼脂糖凝胶电泳和测序进行验证。
然后使用HiScribe T7转录试剂盒(New England Biolabs),将验证的产物 用作体外转录反应的模板。将500-1000ng模板按照制造商的说明书在37℃温 育过夜。使用RNA清除试剂盒(Life Technologies)纯化所得到的向导RNA,洗 脱至100μl无RNA酶的水中,定量并储存在-20℃直到使用。
体外转录
为了将向导文库转录为向导RNA,我们装配了如下体外转录反应混合物:10μl纯化的文库(~500ng),6.5μl的H2O,2.25μl的ATP,2.25μl的CTP,2.25 μl的GTP,2.25μl的UTP,2.25μl的10x反应缓冲液(NEB)和2.25μl的T7 RNA 聚合酶混合物。将反应物在37℃温育24小时,然后在H2O中稀释10倍。单次 反应产生约40μg的RNA。通过在5%TBE/尿素凝胶上进行1μl反应并用 SYBR Gold(Life Technologies)染色来检查RNA的产率和大小(~150个碱基对)。
DNA特异性Cas9介导的消减
选择多个向导RNA(来自单个或多个体外转录反应)以确保>95%的待消 减的靶DNA含有至少一个向导RNA靶序列。这可以通过测量文库大小的分布 并确定平均值N和标准差SD来计算;对于>95%的文库,N-2SD=最低大小, 确保每个这个大小有一个向导RNA,以确保>95%消减。这也可以被描述为 向导RNA之间的最大距离=文库大小的平均值-2×(文库大小的标准差)。在线 粒体文库的情况下,文库含有平均长度为450个碱基对的DNA片段,标准差 为100。这导致向导RNA之间最大为250bp。在此,这些文库中的DNA片段平 均长度为450bp(估计的标准偏差为100bp),假设正态分布,<5%的DNA小 于250bp。假设向导RNA会靶向其指定靶标的100%,>95%的靶DNA应包含 至少一个向导RNA位点并被消减。
在本实施例中,除了实施例1中构建的那些之外,还使用了实施例2中构 建的所有向导。将这些多个向导RNA以等摩尔量混合以增加至总共80pmol, 然后与60μl Cas9反应缓冲液(20mM HEPES pH6.5,100mM NaCl,5mM MgCl2,0.1mM EDTA)中的40pmol纯化的Cas9蛋白混合,并在37℃温育10 分钟。加入5ng的DNA混合物(含有想要的DNA和待消减的靶DNA),再继续 温育20分钟。通过加入140μl含有2μg/ml核RNA酶A的TE缓冲液(10mM Tris pH8,1mMEDTA)终止反应,并在37℃温育20分钟。使用PCR清理试剂盒(Life Technologies)回收DNA,且在柱结合前不添加任何异丙醇,并在20μl的10mM Tris pH 8中洗脱。按照制造商的说明书,用高保真(HiFidelity)主混合物(New England Biolabs),使用适当的引物(例如用于重新扩增基于Illumina的DNA测 序文库的P5和P7)和8-13个PCR循环,对洗脱的DNA进行再扩增。
测序及生物信息学
使用PCR清理试剂盒纯化PCR产物,并将其用作高通量DNA测序 (Illumina MiSeq或NextSeq)的模板。
使用bwa或bowtie将Fastq文件与人基因组参考(hg20)进行比对,以确定映 射到核基因组比对线粒体基因组的读段的比例。
表3–实施例2中使用的其他向导RNA
Figure BDA0003377520320000561
Figure BDA0003377520320000571
Figure BDA0003377520320000581
实施例3:使用CRISPR/Cas9系统从DNA文库(转录组或全部基因组DNA)消减所有人 序列
转录组范围的gRNA文库:
产生向导RNA,它们分布在整个转录组中。该设计基于血液转录组。根 据预期在人基因组中平均每~10-20bp有一个NGG位点的知识,开发了用于跨 越每个转录物每~100-200bp间隔的向导RNA的计算选择通道。以这种方式, 考虑到~200-500bp的典型RNA-seq文库插入片段大小,预期每个插入片段包 含靶位点。完成设计后,排列含有向导RNA靶序列和周围基序的寡核苷酸库, 这允许随后添加T7启动子和向导RNA序列的不变部分。这种方法可以在需要 排列新的库之前,使文库再生一段时间。基于90,000个元素的阵列大小,预 期将产生具有两个阵列(假定转录组大小为~30M碱基)的转录组跨度中每个 向导RNA每隔~200bp间隔。如前述实施例所述,然后将这些向导RNA与Cas9 一起使用,以从RNA-seq文库消减所有人DNA。消减和测序数据分析按照前 述实施例完成。
验证:
在测试RNA-seq文库中测试所述方法。这些RNA-seq文库由人和大肠杆 菌RNA的混合物制成,以模拟靶向的序列的类型。在消减文库后进行测序, 以获得~10X的转录组覆盖。如上所述,测量消减前后映射至人的所有序列的 比例;可用Kruskal-Wallis单因素方差分析测试来确定消减的统计学显著性。
预期该方法具有最佳的gRNA设计,其调节反应中Cas9水平,达到来自 RNA-seq文库的非核糖体人序列的90%消减,而非人类序列的消减不足5%。
实施例4:富集人血液样品的病毒或其他病原体来源序列
获得携带已知病原体(例如埃博拉病毒)或未知病原体的人血液样品,并 提取RNA(例如使用PAXgene Blood RNA提取试剂盒,Qiagen),并使用标准 方法将其转变成测序文库(例如使用KAPA RNA-seq文库制备试剂盒)。在 cDNA产生和接头连接后,然后将文库与Cas9和向导RNA库混合,其靶向人 转录组中每~200个碱基。将反应物在37℃温育20分钟,使含有靶序列的任何 片段都被Cas9切割。然后使用接头特异性引物纯化和扩增文库。人序列被有 效消减。只有未切割的序列被扩增,并且富集所得文库的病毒或病原体来源 序列。
实施例5:富集来自家畜的样品的病毒和其他病原体以进行监测
在这个实施例中,该方法用于监测牛奶和家畜中的病毒和其他病原体。
提取来自牛奶或牛(bovine)(奶牛(cow)血液的RNA,并将其转化为如上述 实施例中所述的测序文库。在cDNA生成和接头连接后,将文库与Cas9和靶 向家牛(Bos taurus)转录组中的~200个碱基的向导RNA库混合。将反应物在37℃ 温育20分钟,使含有靶序列的任何片段被Cas9切割。然后使用接头特异性引 物纯化和扩增文库。牛序列有效消减。只有未切割的序列被扩增,并且富集 所得文库的病毒或病原体来源序列。在这种情况下,可以对奶牛消减的测序 文库进行测序并用于监测牛奶和家畜中的病毒和其他病原体。
实施例6:没有接头的大片段DNA的消减
本实施例显示了一种支持消减而不需要接头的方法。在该实施例中,该 方法用于如上所述实施例中所述的消减实验。然而,不再切割含有接头的文 库,而是选择向导RNA在大尺寸(例如从100bp至10kb的任意处)的片段化 DNA库中切割多次。在用Cas9/gRNA复合物切割后,对DNA进行大小选择以 除去小片段(例如完整片段的平均大小的至少1/2或1/3)。这可以通过例如通过 用λ核酸外切酶(其是5'到3'方向运行的5'磷酸特异性核酸外切酶,并且会攻击 先前曾用Cas9切割的任何片段)的处理来辅助。然后可以将得到的文库送至不需要测序接头的测序单分子测序仪处理;或可以连接接头用于下游分析。
实施例7:消减,然后是核酸外切酶III处理
在一些实施方案中,期望在PCR扩增或测序之前除去切割的片段。该实 施例说明了通过使用核酸外切酶III降解被切割的DNA同时保留未切割的目 的DNA,而在Cas9介导的切割之后去除不想要的DNA的方法。
如图8所示,遵循常规方案,将DNA混合物(含有≥95%的被靶向以待消 减的人DNA和<5%的其他目的DNA)片段化,末端修复并连接到Y形接头(或 诸如
Figure BDA0003377520320000601
的圆形接头),但不通过PCR进行扩增。然后将DNA混合物进 行Cas9消化,与(例如在这种情况下)针对线粒体DNA的向导RNA文库复合, 如前所述。用补充有0.5%RNA酶A(Thermo FisherScientific)的TE(10mM Tris-Cl pH8,1mM EDTA)将Cas9反应物以1:3稀释,并在37℃温育5分钟。蛋白 酶K(NEB),然后以8单位/ml的最终浓度加入,并在37℃温育5分钟。然后使 用GeneJET PCR纯化试剂盒(Thermo Fisher Scientific)回收DNA,并在20μl的 1X
Figure BDA0003377520320000602
缓冲液(NEB)中洗脱。然后加入核酸外切酶III(NEB)(50单位), 并在37℃温育20分钟,然后在65℃热灭活30分钟。
核酸外切酶III可以通过使用平末端或5'突出端引发一个DNA链的单向3'> 5'降解,产生单链DNA和核苷酸;它在单链DNA上无活性,因此3'突出端(例 如Y形接头端)具有抗降解性。因此,Cas9未切割的完整的双链DNA文库(例 如在这种情况下为非线粒体DNA)不被核酸外切酶III消化,而已被Cas9切割 的DNA分子(例如在这种情况下为线粒体DNA)被核酸外切酶III用其从Cas9 切割的平末端朝向接头的3'>5'活性降解。
因此,不想要的DNA被消化。然后使用GeneJET PCR纯化试剂盒(Thermo FisherScientific)回收剩余的完整双链DNA文库,并在20μl的10mM Tris-Cl pH 8中洗脱。然后使用Qubit荧光计(Life Technologies)定量样品,并在MiSeq 系统(Illumina)上测序。
或者,如上所述,可以消化不想要的DNA,而回收完整的DNA,例如 通过柱纯化或PCR扩增进行。
实施例8:消减,然后是核酸外切酶Bal-31
在一些实施方案中,期望在PCR扩增或测序之前除去切割的片段。该实 施例说明了通过使用核酸外切酶Bal-31降解被切割的DNA同时保留未切割 的目的DNA,而在Cas9介导的切割之后去除不想要的DNA的另一种方法。
如图9所示,根据常规方法(包括PCR扩增步骤)制备测序文库(包含例如> 95%被靶向以待消减的人DNA(例如线粒体DNA)和<5%目的DNA)。然后根据 制造商的说明书,使用末端转移酶(NEB)和3mM dGTP对文库(500nM)在3' 末端添加多聚-dG尾-在37℃温育30分钟,然后在75℃热灭活20分钟。然后将 添加3'多聚-dG尾部的文库进行Cas9消化,与(例如在这种情况下为针对线粒 体DNA的向导RNA文库)复合,如前所述,然后在75℃热灭活20分钟。然后 将反应物在1x核酸外切酶Bal-31反应缓冲液(NEB)中1:5稀释,补充10单位的 核酸外切酶Bal-31(NEB),并在37℃温育30分钟。
核酸外切酶Bal-31具有两个活性:双链DNA核酸外切酶活性和单链 DNA/RNA核酸内切酶活性。双链DNA核酸外切酶活性允许BAL-31在两条链 上从开放端降解DNA,从而减少双链DNA的大小。温育的时间越长,双链 DNA的大小减少越多,使其对于消减中等至大的DNA(>200bp)而言是有用 的。应注意的是,BAL-31的单链核酸内切酶活性使其能够快速消化多聚-A, 多聚-C或多聚-T,但消化多聚-G极低(Marrone and Ballantyne,2008)。由于 这种性质,在文库的3'末端添加单链多聚-dG可以保护BAL-31免受降解,对 此我们已经使用PCR产物进行了验证。因此,由已被Cas9切割的DNA分子(例 如在这种情况下为线粒体DNA)将被BAL-31利用其双链DNA核酸外切酶活 性从Cas9切割的双链平末端朝着携带多聚-dG的另一端降解,产生消减;而 未被Cas9切割的完整DNA文库(例如在这种情况下为非线粒体DNA)不会被 BAL-31消化,因为它们具有3'末端多聚-dG保护。
在核酸外切酶Bal-31温育后,将反应混合物在75℃热灭活20分钟,并使 用GeneJET PCR纯化试剂盒(Thermo Fisher Scientific)回收DNA。然后使用 Qubit荧光计(Life Technologies)对样品进行定量,并在MiSeq系统(Illumina)上 进行测序。
或者,如上所述,可以消化不想要的DNA,而回收完整的DNA,例如 通过柱纯化进行。
实施例9:Cas9消减和生物素标记
在一些实施方案中,清除了Cas9切割的产物(例如清除了>95%线粒体 DNA),并且包含生物素标记的未切割(<5%目的DNA)DNA通过结合至链霉 亲和素小珠而纯化。该实施例说明了在不使用核酸外切酶的情况下在Cas9介 导的切割之后除去不想要的DNA的方法,并在图10中示出。
遵循常规方案,将DNA混合物(含有>95%的不想要的人DNA和<5%的其 他目的DNA)片段化,末端修复并连接至接头,然后使用生物素-P5引物(5’ 生物素-AATGATACGGCGACCACCGA)和 P7(5’-CAAGCAGAAGACGGCATACGA)通过PCR进行扩增。这确保了整个 测序文库只在DNA分子的一端具有5'生物素标记。然后将DNA混合物进行Cas9消化,与(例如在这种情况下为针对线粒体DNA(不想要的DNA)的向导 RNA文库)复合,如前所述。将Cas9反应物用TE(10mM Tris-Cl pH 8,1mM EDTA)以1:3稀释,补充0.5%RNA酶A(ThermoFisher Scientific)并在37℃温育 5分钟。然后以8单位/ml的最终浓度加入蛋白酶K(NEB),并在37℃温育5分钟。 被Cas9切割的DNA分子(例如在这种情况下为线粒体DNA)会失去生物素标 记的接头,因此不能进行测序或PCR扩增;而未被Cas9切割的完整的DNA文 库(例如在这种情况下为非线粒体目的DNA)仍然携带生物素标记。因此,可 以通过加入链霉亲和素小珠(Dynabeads MyOne Streptavidin C1,Thermo Fisher Scientific)至终浓度为2%来回收未被Cas9切割的完整DNA。使用磁性 支持物捕获小珠,并用TE缓冲液洗涤4次。通过加热至95℃3分钟,然后是使 用P5和P7引物(非生物素化的)的6个PCR循环,从小珠释放DNA。然后使用 GeneJET PCR纯化试剂盒(Thermo Fisher Scientific)纯化DNA。然后使用Qubit 荧光计(Life Technologies)对样品进行定量,并在MiSeq系统(Illumina)上进行测序。
实施例10:使用热稳定的Cas9提高Cas9介导的消减的效率
尽管Cas9可与向导RNA文库结合使用以有效消减靶DNA的集合,但需要 大量的(>30pmole)Cas9和向导RNA。通常这种相对于靶DNA的>100倍超量 的原因是,与经过切割后完全脱离其靶DNA的EcoRI等经典限制酶不同,Cas9 在切割反应完成后不再循环。Cas9可以与两个子代DNA产物分子中的一个保 持紧密结合(参见图11,左侧的开口圆圈)。因此,需要提供更多的Cas9和gRNA 才能实现不想要的DNA的完全消减。为了克服这个问题,与向导RNA(例如 针对人DNA的gRNA文库)复合的热稳定的Cas9(定义为在95℃处保持1分钟 后具有>90%活性的那些)可以应用于DNA混合物的测序文库(含有例如95% 人DNA和5%病毒DNA)。如图11所示(右边的灰色圆圈),在让Cas9消化一段 时间后,可以将样品混合物煮沸,这会导致DNA变性,以及gRNA和Cas9从 DNA靶标解离。可以增加Cas9与gRNA的结合,使得Cas9-gRNA作为完整的 复合物从DNA靶解离,尽管存在DNA变性。可加入二甲亚砜以降低DNA变 性所需的温度,使Cas9蛋白结构不受影响。Cas9会优先结合未切割的靶位点, 热稳定的Cas9会在沸腾后保留活性。由于这些特征,通过将反应沸腾并冷却 至37℃,热稳定的Cas9将保持能够结合其gRNA并切割其更多的底物。通过 允许Cas9的再循环,消减效率提高,并且因为反应中需要较少的Cas9,脱靶 (非特异性)切割概率也会降低。
提供了制作恒温Cas9的两种示例性方法。
第一种方法是分离热稳定的Cas9。热稳定的Cas9及其相应向导RNA的基 因将通过嗜热细菌嗜热链球菌(Streptococcus thermophilus)和激烈热火球古 菌(Pyrococcusfuriosus)的基因组中的序列同源性鉴定。然后将Cas9基因克隆 到表达载体pET30(Novagen)中以表达Cas9,如前面部分所述。向导RNA序列 会被组装成寡核苷酸并合成(IDT)。Cas9和向导RNA的活性组合将通过在37℃ (对照)处消化测序的DNA模板并在95℃处消化3X5分钟后在37℃处消化来评 估。
第二种方法是酿脓链球菌Cas9的体外演化。诱变Cas9的序列以改善其 热稳定性。简言之,这通过定点诱变进行,以去除过量的环序列,增加蛋白 质结构域之间的离子桥数,或者通过稀释成液滴和PCR来产生潜在的突变体 库。将如上所述评估所有突变体的活性和热稳定性。
实施例11:用于监测不想要的DNA和脱靶事件的消减
在所讨论的实施方案中,期望提供阳性和/或阴性对照。阳性对照会确保 不想要的DNA的消减以保真度和效率进行。阴性对照会确保脱靶切割保持在 最小或不存在。
阳性对照可以由具有插入片段的测序文库组成,所述插入片段包含试剂 盒中包含的全部或大部分gRNA的靶序列。这种对照会与用户的反应一起运 行,以确保所有组件正常工作。用Cas9消减后,可以通过凝胶电泳或qPCR 测量靶序列的清除。
阴性对照可以包括1)与试剂盒中使用的gRNA具有小于100%同一性的一 组gRNA;例如与靶特异性序列具有1,2,3,4,5或更多个不匹配;或2)具 有与试剂盒中使用的gRNA的靶向序列具有小于100%同一性的插入片段的 DNA文库;例如与gRNA的互补序列具有1,2,3,4,5或更多个不匹配。该 对照会与用户的反应一起运行,以确保所有组份都正常工作并测量酶的任何 脱靶活性。在用Cas9消减后,通过.凝胶电泳或qPCR测量脱靶消减的量。
综上所述,本发明包括但不限于以下项:
1.一种富集样品的目的序列方法,包括:
a.提供包含目的序列和被靶向以待消减的序列的样品,其中所述目的 序列占所述样品的少于30%;
b.使所述样品与多个CRISPR/Cas系统蛋白-gRNA复合物接触,其中所 述gRNA与所述靶向序列互补,并由此切割靶向序列。
2.项1的方法,其还包括从所述样品提取目的序列和被靶向以待消减的 序列。
3.项2的方法,其还包括将所述提取的序列片段化。
4.项3的方法,其还包括将所述片段化的提取序列的5’和3’端接头连接。
5.项1的方法,其中通过大小排阻或通过使用生物素去除所述切割的靶 向序列。
6.项1的方法,其还包括扩增所述目的序列。
7.项1的方法,其中所述方法包括用至少102个特别的CRISPR/Cas系统蛋 白-gRNA复合物与所述样品接触。
8.项1的方法,其中所述样品是生物样品、临床样品、法医样品或环境样 品的任一种。
9.项1的方法,其中所述样品包含被靶向以待消减的宿主核酸序列和目 的非宿主核酸序列。
10.项9的方法,其中所述非宿主核酸序列包括微生物核酸序列。
11.项10的方法,其中所述微生物核酸序列是细菌、病毒或真核寄生核 酸序列。
12.项1的方法,其中使所述样品与CRISPR/Cas系统蛋白-gRNA复合物 接触,其中所述gRNA与线粒体DNA互补。
13.项1的方法,其中使所述样品与CRISPR/Cas系统蛋白-gRNA复合物 接触,其中所述gRNA与核糖体RNA序列对应的DNA、编码球蛋白的序列、 编码转座子的序列、编码逆转录病毒序列的序列、包含端粒序列的序列、包 含亚端粒重复的序列、包含着丝粒序列的序列、包含内含子序列的序列、包 含Alu重复的序列、包含SINE重复的序列、包含LINE重复的序列、包含双核 酸重复的序列、包含三核酸重复的序列、包括四核酸重复的序列、包含多聚A重复的序列、包含多聚T重复的序列、包含多聚C重复的序列、包含多聚G 重复的序列、包含富含AT的序列的序列、或包含富含GC的序列的序列是互 补的。
14.项2的方法,其中所述提取的核酸包括单链DNA,双链DNA,单链 RNA,双链RNA,cDNA,合成DNA,人工DNA和DNA/RNA杂交体的任一 种。
15.项1的方法,其中所述目的序列占所述提取的核酸的少于10%。
16.项1的方法,其中所述CRISPR/Cas系统蛋白是Cas9。
17.项1的方法,其中所述CRISPR/Cas系统蛋白是无催化活性的。
18.项17的方法,其中所述无催化活性的CRISPR/Cas系统蛋白是dCas9。
19.项1的方法,其中所述CRISPR/Cas系统蛋白是CRISPR/Cas系统蛋白 切口酶。
20.项19的方法,其中所述CRISPR/Cas系统蛋白是Cas9切口酶。
21.项1的方法,其中所述CRISPR/Cas系统蛋白是热稳定的。
22.项1的方法,其还包括用接头特异性PCR扩增步骤(b)的产物。
23.项1的方法,其还包括用具有核酸外切酶活性的酶来处理步骤(b)的 产物。
24.项23的方法,其中所述酶是核酸外切酶III或BAL-31。
25.项1的方法,其中所述样品选自全血,血浆,血清,眼泪,唾液,粘 液,脑脊液,牙齿,骨,指甲,粪便,尿液,组织和活检样品。
26.一种富集样品的方法,包括:
a.提供包含宿主核酸和非宿主核酸的样品,其中所述宿主核酸和非宿 主核酸是接头连接的,且其中所述接头连接至所述宿主核酸和非宿主核酸的 5’和3’端;
b.使所述样品与多个CRISPR/Cas系统蛋白-gRNA复合物接触,其中所 述gRNA与宿主核酸中的靶向位点互补,由此产生仅接头连接于一端上的宿 主核酸和接头连接于5’和3’端二者上的非宿主核酸;及
c.富集样品的非宿主核酸。
27.项26的方法,其中所述方法包括使所述样品与102个特别的 CRISPR/Cas系统蛋白-gRNA复合物接触。
28.项26的方法,其中所述核酸是DNA,且其中步骤(b)的接触产生接头 连接于5’端上而非3’端上的宿主核酸和接头连接于5’和3’端二者上的非宿主 核酸。
29.项26的方法,其中所述CRISPR/Cas系统蛋白是Cas9、Cpf1、Cas3、 Cas8a-c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2、或Cm5。
30.项29的方法,其中所述CRISPR/Cas系统蛋白是Cas9。
31.项26的方法,其中所述CRISPR/Cas系统蛋白是dCas9。
32.项26的方法,其中所述CRISPR/Cas系统蛋白是Cas9切口酶。
33.项26的方法,其中所述CRISPR/Cas系统蛋白是热稳定的。
34.项26的方法,其中所述宿主选自下组:人,牛,马,羊,猪,猴, 狗,猫,沙鼠,鸟,小鼠和大鼠。
35.项26的方法,其中所述非宿主是原核生物。
36.项26的方法,其中所述非宿主选自下组:真核生物,病毒,细菌, 真菌和原生动物。
37.项26的方法,其中所述接头连接的宿主核酸和非宿主核酸为 50-1000bp。
38.项26的方法,其中所述非宿主核酸占样品中总核酸的少于50%。
39.项26的方法,其中所述样品是生物样品、临床样品、法医样品或环 境样品的任一种。
40.项26的方法,其中步骤(c)包括用接头特异性PCR扩增步骤(b)的产物。
41.项26的方法,其中步骤(c)包括用具有核酸外切酶活性的酶来处理步 骤(b)的产物。
42.项41的方法,其中所述酶是核酸外切酶III或BAL-31。
43.项26的方法,其中步骤(c)包括通过大小排阻来去除宿主核酸。
44.项26的方法,其中步骤(c)包括通过使用生物素去除宿主核酸。
45.项26的方法,其还包括用接头特异性PCR扩增步骤(b)的产物。
46.项26的方法,其还包括用具有核酸外切酶活性的酶来处理步骤(b)的 产物。
47.项46的方法,其中所述酶是核酸外切酶III或BAL-31。
48.项26的方法,其进一步包含包括使用阳性对照靶序列。
49.项26的方法,其进一步包含包括使用阴性对照gRNA。
50.项26的方法,其中所述样品选自下组:全血,血浆,血清,眼泪, 唾液,粘液,脑脊液,牙齿,骨,指甲,粪便,尿液,组织和活检样品。
51.一种用于连续消减样品中的靶核酸的方法,包括:
a.提供包含宿主核酸和非宿主核酸的样品,其中所述非宿主核酸包含 来自至少一个已知非宿主生物体的核酸和来自至少一个未知非宿主生物体 的核酸;
b.使所述样品与多个CRISPR/Cas系统蛋白-gRNA复合物接触,其中将 所述gRNA配置为与宿主核酸中的靶向序列杂交,由此切割宿主核酸的一部 分;
c.使所述样品与多个CRISPR/Cas系统蛋白-gRNA复合物接触,其中将 所述gRNA配置为与至少一个已知非宿主核酸中的靶向序列杂交,由此切割 至少一个已知非宿主核酸的一部分;及
d.从未知非宿主生物体分离所述核酸。
52.项51的方法,其中所述方法包括使样品与至少102个特别的 CRISPR/Cas系统蛋白-gRNA复合物接触,所述CRISPR/Cas系统蛋白-gRNA 复合物被配置为与宿主核酸中的靶向序列杂交。
53.项51的方法,其中所述方法包括使样品与至少102个特别的 CRISPR/Cas系统蛋白-gRNA复合物接触,所述CRISPR/Cas系统蛋白-gRNA 复合物被配置为与所述至少一个已知非宿主核酸中的靶向序列杂交。
54.项51的方法,其中所述样品选自全血,血浆,血清,眼泪,唾液, 粘液,脑脊液,牙齿,骨,指甲,粪便,尿液,组织和活检样品。
55.项51的方法,其中所述来自未知非宿主生物体的核酸占所述样品中 总核酸的少于5%。
56.项51的方法,其中所述宿主是人。
57.一种组合物,其包含来自第一基因组的DNA和来自第二基因组的 DNA的混合物,其中所述第一基因组DNA和所述第二基因组DNA是接头连 接的,且其中所述第一基因组DNA与gRNA-CRISPR/Cas系统蛋白复合物复 合。
58.项57的组合物,其中所述第一基因组来自宿主生物体且所述第二基 因组来自非宿主生物体。
59.项57的组合物,其中所述CRISPR/Cas系统蛋白是Cas9。
60.项57的组合物,其中所述CRISPR/Cas系统蛋白是热稳定的。
61.一种试剂盒,其包含:
a.CRISPR/Cas系统蛋白;和
b.gRNA,其中所述gRNA与线粒体DNA互补。
62.一种试剂盒,其包含:
a.CRISPR/Cas系统蛋白;
b.gRNA,其中所述gRNA与目的靶标互补;和
c.具有核酸外切酶活性的酶。
63.一种试剂盒,其包含:
a.CRISPR/Cas系统蛋白,其中所述CRISPR/Cas系统蛋白是热稳定的; 和
b.gRNA,其中所述gRNA与目的靶标互补。
64.一种试剂盒,其包含:
a.CRISPR/Cas系统蛋白;和
b.第一gRNA组,其中所述gRNA与目的靶序列互补;和
c.对照试剂组。
65.项64的试剂盒,其进一步包含阳性对照试剂组。
66.项64的试剂盒,其进一步包含阴性对照试剂组。
67.一种试剂盒,其包含:
a.用于从细胞群分离DNA的试剂;
b.插入酶;
c.CRISPR/Cas系统蛋白;和
d.多个gRNA,其中所述gRNA与线粒体DNA互补。
68.项61-67任一项的试剂盒,其中所述CRISPR/Cas系统蛋白是Cas9。
69.项61-67任一项的试剂盒,其包含至少102个特别的gRNA。
70.项61-67任一项的试剂盒,其进一步包含Y-型接头或多聚G接头的集 合。

Claims (10)

1.一种富集样品的目的序列方法,包括:
a.提供包含目的序列和被靶向以待消减的序列的样品,其中所述目的序列占所述样品的少于30%;
b.使所述样品与多个CRISPR/Cas系统蛋白-gRNA复合物接触,其中所述gRNA与所述靶向序列互补,并由此切割靶向序列。
2.根据权利要求1的方法,其还包括从所述样品提取目的序列和被靶向以待消减的序列。
3.根据权利要求2的方法,其还包括将所述提取的序列片段化。
4.根据权利要求3的方法,其还包括将所述片段化的提取序列的5’和3’端接头连接。
5.根据权利要求1的方法,其中通过大小排阻或通过使用生物素去除所述切割的靶向序列。
6.根据权利要求1的方法,其还包括扩增所述目的序列。
7.根据权利要求1的方法,其中所述方法包括用至少102个特别的CRISPR/Cas系统蛋白-gRNA复合物与所述样品接触。
8.根据权利要求1的方法,其中所述样品是生物样品、临床样品、法医样品或环境样品的任一种。
9.根据权利要求1的方法,其中所述样品包含被靶向以待消减的宿主核酸序列和目的非宿主核酸序列。
10.一种富集样品的方法,包括:
a.提供包含宿主核酸和非宿主核酸的样品,其中所述宿主核酸和非宿主核酸是接头连接的,且其中所述接头连接至所述宿主核酸和非宿主核酸的5’和3’端;
b.使所述样品与多个CRISPR/Cas系统蛋白-gRNA复合物接触,其中所述gRNA与宿主核酸中的靶向位点互补,由此产生仅接头连接于一端上的宿主核酸和接头连接于5’和3’端二者上的非宿主核酸;及
c.富集样品的非宿主核酸。
CN202111423939.5A 2014-12-20 2015-12-19 使用CRISPR/Cas系统蛋白靶向消减、富集、和分割核酸的组合物及方法 Pending CN114438169A (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US201462094980P 2014-12-20 2014-12-20
US62/094,980 2014-12-20
US201562198097P 2015-07-28 2015-07-28
US62/198,097 2015-07-28
PCT/US2015/066949 WO2016100955A2 (en) 2014-12-20 2015-12-19 Compositions and methods for targeted depletion, enrichment, and partitioning of nucleic acids using crispr/cas system proteins
CN201580076214.XA CN107406875B (zh) 2014-12-20 2015-12-19 使用CRISPR/Cas系统蛋白靶向消减、富集、和分割核酸的组合物及方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201580076214.XA Division CN107406875B (zh) 2014-12-20 2015-12-19 使用CRISPR/Cas系统蛋白靶向消减、富集、和分割核酸的组合物及方法

Publications (1)

Publication Number Publication Date
CN114438169A true CN114438169A (zh) 2022-05-06

Family

ID=56127883

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202111423939.5A Pending CN114438169A (zh) 2014-12-20 2015-12-19 使用CRISPR/Cas系统蛋白靶向消减、富集、和分割核酸的组合物及方法
CN201580076214.XA Active CN107406875B (zh) 2014-12-20 2015-12-19 使用CRISPR/Cas系统蛋白靶向消减、富集、和分割核酸的组合物及方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201580076214.XA Active CN107406875B (zh) 2014-12-20 2015-12-19 使用CRISPR/Cas系统蛋白靶向消减、富集、和分割核酸的组合物及方法

Country Status (8)

Country Link
US (3) US10774365B2 (zh)
EP (2) EP3957745A1 (zh)
JP (3) JP6947638B2 (zh)
CN (2) CN114438169A (zh)
AU (2) AU2015364286B2 (zh)
CA (1) CA2971444A1 (zh)
DK (1) DK3234200T3 (zh)
WO (1) WO2016100955A2 (zh)

Families Citing this family (92)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10323236B2 (en) 2011-07-22 2019-06-18 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
GB2513793B (en) 2012-01-26 2016-11-02 Nugen Tech Inc Compositions and methods for targeted nucleic acid sequence enrichment and high efficiency library generation
US20150011396A1 (en) 2012-07-09 2015-01-08 Benjamin G. Schroeder Methods for creating directional bisulfite-converted nucleic acid libraries for next generation sequencing
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US20150166984A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting alpha-antitrypsin point mutations
DK3102722T3 (da) 2014-02-04 2020-11-16 Jumpcode Genomics Inc Genom fraktionering
ES2974229T3 (es) 2014-02-11 2024-06-26 Univ Colorado Regents Ingeniería del genoma multiplex mediante CRISPR
CN106232814B (zh) 2014-02-13 2021-05-11 宝生物工程(美国)有限公司 从核酸的初始集合中耗尽靶分子的方法、以及用于实践其的组合物和试剂盒
EP4079847A1 (en) 2014-07-30 2022-10-26 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
CN113930455A (zh) * 2014-10-09 2022-01-14 生命技术公司 Crispr寡核苷酸和基因剪辑
JP6947638B2 (ja) 2014-12-20 2021-10-13 アーク バイオ, エルエルシー Crispr/cas系タンパク質を使用する核酸の標的化枯渇、富化および分割のための組成物および方法
US10968536B2 (en) 2015-02-25 2021-04-06 Jumpcode Genomics, Inc. Methods and compositions for sequencing
EP3985111A1 (en) * 2015-08-19 2022-04-20 Arc Bio, LLC Capture of nucleic acids using a nucleic acid-guided nuclease-based system
IL294014B2 (en) 2015-10-23 2024-07-01 Harvard College Nucleobase editors and their uses
DK3386550T3 (da) 2015-12-07 2021-04-26 Arc Bio Llc Fremgangsmåder til fremstilling og anvendelse af guide nukleinsyrer
US11339427B2 (en) 2016-02-12 2022-05-24 Jumpcode Genomics, Inc. Method for target specific RNA transcription of DNA sequences
ES2915562T3 (es) 2016-06-24 2022-06-23 Univ Colorado Regents Métodos para generar bibliotecas combinatorias con código de barras
AU2017306676B2 (en) 2016-08-03 2024-02-22 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
EP3497214B1 (en) 2016-08-09 2023-06-28 President and Fellows of Harvard College Programmable cas9-recombinase fusion proteins and uses thereof
WO2018035062A1 (en) * 2016-08-16 2018-02-22 The Regents Of The University Of California Method for finding low abundance sequences by hybridization (flash)
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
KR101964746B1 (ko) * 2016-09-07 2019-04-03 울산대학교 산학협력단 dCas9 단백질 및 표적 핵산 서열에 결합하는 gRNA를 이용한 핵산 검출의 민감도 및 특이도 향상용 조성물 및 방법
SG11201901730QA (en) 2016-09-27 2019-03-28 Ubiome Inc Method and system for crispr-based library preparation and sequencing
JP2019530464A (ja) 2016-10-14 2019-10-24 プレジデント アンド フェローズ オブ ハーバード カレッジ 核酸塩基エディターのaav送達
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
SG10202109874VA (en) 2017-01-19 2021-10-28 Open Monoclonal Tech Inc Human antibodies from transgenic rodents with multiple heavy chain immunoglobulin loci
GB2559118B (en) * 2017-01-19 2021-07-07 Agency For Science Tech And Research Astarstar Method for normalizing a nucleic acid sample
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
US11542496B2 (en) 2017-03-10 2023-01-03 President And Fellows Of Harvard College Cytosine to guanine base editor
WO2018176009A1 (en) 2017-03-23 2018-09-27 President And Fellows Of Harvard College Nucleobase editors comprising nucleic acid programmable dna binding proteins
JP2020515250A (ja) 2017-04-07 2020-05-28 セージ サイエンス, インコーポレイテッド 統合型電気泳動dna精製を使用する遺伝的構造変動を検出するためのシステムおよび方法
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
CN109526228B (zh) * 2017-05-26 2022-11-25 10X基因组学有限公司 转座酶可接近性染色质的单细胞分析
WO2018227025A1 (en) * 2017-06-07 2018-12-13 Arc Bio, Llc Creation and use of guide nucleic acids
WO2018231955A2 (en) 2017-06-13 2018-12-20 Genetics Research, Llc, D/B/A Zs Genetics, Inc. Isolation of target nucleic acids
US10947599B2 (en) 2017-06-13 2021-03-16 Genetics Research, Llc Tumor mutation burden
US10527608B2 (en) 2017-06-13 2020-01-07 Genetics Research, Llc Methods for rare event detection
US10081829B1 (en) 2017-06-13 2018-09-25 Genetics Research, Llc Detection of targeted sequence regions
US10011849B1 (en) 2017-06-23 2018-07-03 Inscripta, Inc. Nucleic acid-guided nucleases
US9982279B1 (en) 2017-06-23 2018-05-29 Inscripta, Inc. Nucleic acid-guided nucleases
US20190071716A1 (en) * 2017-06-28 2019-03-07 Genetics Research, Llc, D/B/A Zs Genetics, Inc. Bodily fluid enrichment
US20190085318A1 (en) * 2017-06-28 2019-03-21 Genetics Research, Llc, D/B/A Zs Genetics, Inc. Solid phase negative enrichment
US20190002964A1 (en) * 2017-06-28 2019-01-03 Genetics Research, Llc, D/B/A Zs Genetics, Inc. Bodily fluid target enrichment
US20190048425A1 (en) * 2017-06-28 2019-02-14 Genetics Research, Llc, D/B/A Zs Genetics, Inc. Tumor detection and monitoring
CN107190008A (zh) * 2017-07-19 2017-09-22 苏州吉赛基因测序科技有限公司 一种基于Crispr/cas9的捕获基因组目标序列的方法及其在高通量测序中的应用
EP3658573A1 (en) 2017-07-28 2020-06-03 President and Fellows of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (pace)
US11384383B2 (en) 2017-08-08 2022-07-12 Depixus In vitro isolation and enrichment of nucleic acids using site-specific nucleases
WO2019139645A2 (en) 2017-08-30 2019-07-18 President And Fellows Of Harvard College High efficiency base editors comprising gam
AU2018352592A1 (en) 2017-10-16 2020-06-04 Beam Therapeutics, Inc. Uses of adenosine base editors
CN107893260B (zh) * 2017-11-27 2021-01-12 广州市锐博生物科技有限公司 高效去除核糖体rna的构建转录组测序文库的方法及试剂盒
CN111448315B (zh) * 2018-01-03 2023-09-22 苏州晶睿生物科技有限公司 一种Cas蛋白体系分离DNA的方法
KR102086689B1 (ko) * 2018-02-06 2020-03-09 주식회사 진씨커 돌연변이 세포 유리 유전자 분리 키트 및 이를 이용한 돌연변이 세포 유리 유전자 분리 방법
EP3765063A4 (en) * 2018-03-15 2021-12-15 Twinstrand Biosciences, Inc. METHODS AND REAGENTS FOR ENRICHMENT NUCLEIC ACID MATERIAL FOR SEQUENCING APPLICATIONS AND OTHER NUCLEIC ACID MATERIAL INTERROGATIONS
EP3768855A1 (en) * 2018-03-19 2021-01-27 Illumina, Inc. Methods and compositions for recombinase-mediated selective cleavage of nucleic acids
EP3768856A1 (en) * 2018-03-19 2021-01-27 Illumina, Inc. Methods and compositions for selective cleavage of nucleic acids with recombinant nucleases
AU2019282812A1 (en) 2018-06-07 2020-12-17 Arc Bio, Llc Compositions and methods for making guide nucleic acids
EP3587590A1 (en) * 2018-06-21 2020-01-01 Progenika Biopharma, S.A. Nucleic acid depletion and detection
CN109182454A (zh) * 2018-08-22 2019-01-11 杭州恺思医疗器械有限公司 一种捕获基因组特定dna片段的方法
WO2020072990A1 (en) 2018-10-04 2020-04-09 Arc Bio, Llc Normalization controls for managing low sample inputs in next generation sequencing
EP3650555B1 (en) 2018-11-07 2024-02-21 Siemens Healthineers AG Target irrelevant guide rna for crispr
CA3120176A1 (en) * 2018-11-16 2020-05-22 Depixus Optimization of in vitro isolation of nucleic acids using site-specific nucleases
CA3117768A1 (en) * 2018-11-28 2020-06-04 Keygene N.V. Targeted enrichment by endonuclease protection
EP3837379B1 (en) 2018-12-12 2022-05-18 Depixus Method of nucleic acid enrichment using site-specific nucleases followed by capture
CN109652861A (zh) * 2018-12-22 2019-04-19 阅尔基因技术(苏州)有限公司 一种生化试剂盒及其应用方法
CA3127493A1 (en) * 2019-01-31 2020-08-06 Beam Therapeutics Inc. Nucleobase editors having reduced non-target deamination and assays for characterizing nucleobase editors
WO2020167795A1 (en) * 2019-02-12 2020-08-20 Jumpcode Genomics, Inc. Methods for targeted depletion of nucleic acids
US11224850B2 (en) 2019-02-20 2022-01-18 Genetics Research, Llc Regulated multiplex reactions in a single tube
EP3942040A1 (en) 2019-03-19 2022-01-26 The Broad Institute, Inc. Methods and compositions for editing nucleotide sequences
WO2020210372A1 (en) * 2019-04-09 2020-10-15 Arc Bio, Llc Compositions and methods for nucleotide modification-based depletion
CN110041109A (zh) * 2019-04-22 2019-07-23 刘坚 一种猪粪源生物肥的制备方法
CN110093409B (zh) * 2019-04-26 2020-11-24 南京世和基因生物技术股份有限公司 一种基于高通量测序的感染线检测方法以及试剂盒
CN110205318A (zh) * 2019-05-15 2019-09-06 杭州杰毅生物技术有限公司 基于CRISPR-Cas去除宿主基因组DNA的宏基因组提取方法
CN110272921A (zh) * 2019-06-20 2019-09-24 武汉百翼生物科技有限公司 一种安全高效的CRISPR/Cas9基因编辑方法
US11041172B2 (en) 2019-06-25 2021-06-22 Inari Agriculture, Inc. Homology dependent repair genome editing
WO2021055385A1 (en) * 2019-09-16 2021-03-25 Stitch Bio, Llc Diagnostic assay for cancer
EP4048063A4 (en) * 2019-10-23 2023-12-06 Pairwise Plants Services, Inc. COMPOSITIONS AND METHODS FOR RNA ARRAY EDITING IN PLANTS
EP3816299A1 (en) * 2019-10-31 2021-05-05 Siemens Healthcare GmbH A method to prepare personalized target-irrelevant guide rna for crispr
WO2021108557A1 (en) * 2019-11-27 2021-06-03 Stitch Bio, Llc Methods and compositions for inducing tumor cell death
JP2023519782A (ja) * 2020-01-17 2023-05-15 ジャンプコード ゲノミクス,インク. 標的化された配列決定の方法
CN111471745B (zh) * 2020-03-30 2021-09-07 华中农业大学 基于CRISPR/Cas9系统介导的DNA靶向捕获方法
MX2022014008A (es) 2020-05-08 2023-02-09 Broad Inst Inc Métodos y composiciones para la edición simultánea de ambas cadenas de una secuencia de nucleótidos de doble cadena objetivo.
JP2023538537A (ja) * 2020-08-12 2023-09-08 ジャンプコード ゲノミクス,インク. 核酸の標的化除去のための方法
US20230407366A1 (en) * 2020-10-06 2023-12-21 Keygene N.V. Targeted sequence addition
US20240002904A1 (en) * 2020-11-24 2024-01-04 Keygene N.V. Targeted enrichment using nanopore selective sequencing
WO2023283343A1 (en) * 2021-07-07 2023-01-12 Arc Bio, Llc Non-ribosomal sequence enrichment and single-stranded dna library for nucleic acid guided nuclease targeting
WO2023173034A2 (en) * 2022-03-10 2023-09-14 Micronoma, Inc. Disease classifiers from targeted microbial amplicon sequencing
WO2024059516A1 (en) * 2022-09-12 2024-03-21 Jumpcode Genomics, Inc. Methods for generating cdna library from rna
CN117551746A (zh) * 2023-12-01 2024-02-13 北京博奥医学检验所有限公司 一种检测目标核酸及其邻近区域核酸序列的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013142578A1 (en) * 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
US20140120529A1 (en) * 2012-10-15 2014-05-01 Life Technologies Corporation Compositions, methods, systems and kits for target nucleic acid enrichment
US20140134610A1 (en) * 2012-01-31 2014-05-15 Pacific Biosciences Of California, Inc. Compositions and methods for selection of nucleic acids
US20140356867A1 (en) * 2013-05-29 2014-12-04 Agilent Technologies, Inc. Nucleic acid enrichment using cas9

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5948902A (en) 1997-11-20 1999-09-07 South Alabama Medical Science Foundation Antisense oligonucleotides to human serine/threonine protein phosphatase genes
US7166432B2 (en) * 1999-03-12 2007-01-23 Integragen Compositions and methods for genetic analysis
US20050233340A1 (en) 2004-04-20 2005-10-20 Barrett Michael T Methods and compositions for assessing CpG methylation
US20090318305A1 (en) 2008-06-18 2009-12-24 Xi Erick Lin Methods for selectively capturing and amplifying exons or targeted genomic regions from biological samples
WO2012051327A2 (en) 2010-10-12 2012-04-19 Cornell University Method of dual-adapter recombination for efficient concatenation of multiple dna fragments in shuffled or specified arrangements
AU2011323107B2 (en) 2010-11-05 2015-09-10 Illumina, Inc. Linking sequence reads using paired code tags
US9725765B2 (en) 2011-09-09 2017-08-08 The Board Of Trustees Of The Leland Stanford Junior University Methods for obtaining a sequence
WO2013141680A1 (en) 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
PT2800811T (pt) 2012-05-25 2017-08-17 Univ California Métodos e composições para modificação de adn alvo dirigida por arn e para modulação dirigida por arn de transcrição
SG11201408478QA (en) 2012-06-18 2015-02-27 Nugen Technologies Inc Compositions and methods for negative selection of non-desired nucleic acid sequences
US10847248B2 (en) 2012-08-10 2020-11-24 The Board Of Trustees Of The Leland Stanford Junior University Techniques for determining haplotype by population genotype and sequence data
EP2896697B1 (en) 2012-12-12 2015-09-02 The Broad Institute, Inc. Engineering of systems, methods and optimized guide compositions for sequence manipulation
SG11201507378UA (en) 2013-03-14 2015-10-29 Caribou Biosciences Inc Compositions and methods of nucleic acid-targeting nucleic acids
EP2992114B1 (en) 2013-05-04 2019-04-17 The Board of Trustees of The Leland Stanford Junior University Enrichment of dna sequencing libraries from samples containing small amounts of target dna
EP2999792B1 (en) 2013-05-23 2018-11-14 The Board of Trustees of The Leland Stanford Junior University Transposition into native chromatin for personal epigenomics
US10421957B2 (en) 2013-07-29 2019-09-24 Agilent Technologies, Inc. DNA assembly using an RNA-programmable nickase
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
KR20240038168A (ko) 2013-11-07 2024-03-22 더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티 인간 마이크로바이옴 및 그의 성분의 분석을 위한 무세포 핵산
AU2014346559B2 (en) 2013-11-07 2020-07-09 Editas Medicine,Inc. CRISPR-related methods and compositions with governing gRNAs
WO2015075056A1 (en) 2013-11-19 2015-05-28 Thermo Fisher Scientific Baltics Uab Programmable enzymes for isolation of specific dna fragments
US9850525B2 (en) 2014-01-29 2017-12-26 Agilent Technologies, Inc. CAS9-based isothermal method of detection of specific DNA sequence
DK3102722T3 (da) 2014-02-04 2020-11-16 Jumpcode Genomics Inc Genom fraktionering
CN106232814B (zh) 2014-02-13 2021-05-11 宝生物工程(美国)有限公司 从核酸的初始集合中耗尽靶分子的方法、以及用于实践其的组合物和试剂盒
US9670485B2 (en) 2014-02-15 2017-06-06 The Board Of Trustees Of The Leland Stanford Junior University Partitioning of DNA sequencing libraries into host and microbial components
EP3114231B1 (en) 2014-03-03 2019-01-02 Swift Biosciences, Inc. Enhanced adaptor ligation
US20170191123A1 (en) 2014-05-28 2017-07-06 Toolgen Incorporated Method for Sensitive Detection of Target DNA Using Target-Specific Nuclease
US20160053304A1 (en) 2014-07-18 2016-02-25 Whitehead Institute For Biomedical Research Methods Of Depleting Target Sequences Using CRISPR
WO2016014409A1 (en) 2014-07-21 2016-01-28 Illumina, Inc. Polynucleotide enrichment using crispr-cas systems
US10435685B2 (en) * 2014-08-19 2019-10-08 Pacific Biosciences Of California, Inc. Compositions and methods for enrichment of nucleic acids
KR20170036801A (ko) 2014-08-19 2017-04-03 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵산의 프로빙 및 맵핑을 위한 rna-가이드된 시스템
JP6947638B2 (ja) 2014-12-20 2021-10-13 アーク バイオ, エルエルシー Crispr/cas系タンパク質を使用する核酸の標的化枯渇、富化および分割のための組成物および方法
US11111520B2 (en) 2015-05-18 2021-09-07 Karius, Inc. Compositions and methods for enriching populations of nucleic acids
WO2016196805A1 (en) 2015-06-05 2016-12-08 The Regents Of The University Of California Methods and compositions for generating crispr/cas guide rnas
EP3985111A1 (en) 2015-08-19 2022-04-20 Arc Bio, LLC Capture of nucleic acids using a nucleic acid-guided nuclease-based system
WO2017062599A1 (en) 2015-10-07 2017-04-13 The Board Of Trustees Of The Leland Stanford Junior University Techniques for determining whether an individual is included in ensemble genomic data
CN108778343A (zh) 2015-10-16 2018-11-09 天普大学-联邦高等教育系统 利用cpf1进行rna向导的基因编辑的方法和组合物
CN109312400A (zh) 2016-03-25 2019-02-05 凯锐思公司 合成核酸掺入物
WO2018035062A1 (en) 2016-08-16 2018-02-22 The Regents Of The University Of California Method for finding low abundance sequences by hybridization (flash)
US20180051320A1 (en) 2016-08-22 2018-02-22 The Regents Of The University Of California Depletion of abundant sequences by hybridization (dash)
WO2018069430A1 (en) 2016-10-13 2018-04-19 bioMérieux Identification and antibiotic characterization of pathogens in metagenomic sample

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140134610A1 (en) * 2012-01-31 2014-05-15 Pacific Biosciences Of California, Inc. Compositions and methods for selection of nucleic acids
WO2013142578A1 (en) * 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
US20140120529A1 (en) * 2012-10-15 2014-05-01 Life Technologies Corporation Compositions, methods, systems and kits for target nucleic acid enrichment
US20140356867A1 (en) * 2013-05-29 2014-12-04 Agilent Technologies, Inc. Nucleic acid enrichment using cas9

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
GEORGE R. FEEHERY等: ""A method for selectively enriching microbial DNA from contaminating vertebrate host DNA"", 《PLOS ONE》, vol. 8, no. 10, pages 1 - 13 *

Also Published As

Publication number Publication date
AU2022200686A1 (en) 2022-02-24
JP6947638B2 (ja) 2021-10-13
CN107406875B (zh) 2021-12-07
US20190144920A1 (en) 2019-05-16
US11692213B2 (en) 2023-07-04
US10669571B2 (en) 2020-06-02
EP3234200A4 (en) 2018-05-23
DK3234200T3 (da) 2021-08-23
US10774365B2 (en) 2020-09-15
EP3957745A1 (en) 2022-02-23
JP7407762B2 (ja) 2024-01-04
JP2018500937A (ja) 2018-01-18
AU2015364286A1 (en) 2017-07-06
CA2971444A1 (en) 2016-06-23
JP2023129696A (ja) 2023-09-14
WO2016100955A2 (en) 2016-06-23
US20210189459A1 (en) 2021-06-24
EP3234200B1 (en) 2021-07-07
CN107406875A (zh) 2017-11-28
WO2016100955A3 (en) 2016-08-18
US20180298421A1 (en) 2018-10-18
JP2021104060A (ja) 2021-07-26
AU2015364286B2 (en) 2021-11-04
EP3234200A2 (en) 2017-10-25

Similar Documents

Publication Publication Date Title
US11692213B2 (en) Compositions and methods for targeted depletion, enrichment, and partitioning of nucleic acids using CRISPR/Cas system proteins
CN108138176B (zh) 使用基于核酸引导的核酸酶的系统捕获核酸
CN109310784B (zh) 用于制备和使用指导核酸的方法和组合物
CN111094565B (zh) 指导核酸的产生和用途

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination