CN108138176B - 使用基于核酸引导的核酸酶的系统捕获核酸 - Google Patents

使用基于核酸引导的核酸酶的系统捕获核酸 Download PDF

Info

Publication number
CN108138176B
CN108138176B CN201680057464.3A CN201680057464A CN108138176B CN 108138176 B CN108138176 B CN 108138176B CN 201680057464 A CN201680057464 A CN 201680057464A CN 108138176 B CN108138176 B CN 108138176B
Authority
CN
China
Prior art keywords
nucleic acid
dna
nickase
sample
interest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680057464.3A
Other languages
English (en)
Other versions
CN108138176A (zh
Inventor
S·B·古尔格雄
E·哈尼斯
D·辛克莱
M·L·卡彭特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ARC Bio LLC
Original Assignee
ARC Bio LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ARC Bio LLC filed Critical ARC Bio LLC
Publication of CN108138176A publication Critical patent/CN108138176A/zh
Application granted granted Critical
Publication of CN108138176B publication Critical patent/CN108138176B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1276RNA-directed DNA polymerase (2.7.7.49), i.e. reverse transcriptase or telomerase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/301Endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本文中提供了用于例如通过使用基于核酸引导的核酸酶的系统捕获核酸的方法和组合物。

Description

使用基于核酸引导的核酸酶的系统捕获核酸
对相关申请的交叉援引
本申请要求于2015年8月19日提交的美国临时申请序列号62/207,359的优先权,将其通过提述完整并入本文。
发明背景
基因组特定区域的靶向测序仍然是研究人员感兴趣的,特别是在临床环境中。遗传疾病、癌症的临床诊断和许多研究项目依赖于靶向测序,以实现靶定位点的高覆盖率测序,同时降低测序成本。目前,用于这个目的的主要方法是1)基于杂交的富集,和2)多重PCR。在前一种方法中,使用生物素标记的短寡核苷酸探针从文库中“拉出”感兴趣的序列。这个过程既费时又昂贵,而且需要许多实践步骤。此外,一些“脱靶”序列常常可能保留在所得产品中。基于多重PCR的方法可以更快,但是靶标数可能有限并且成本可能很高。需要的是有效捕获感兴趣的核酸区域的方法,其简单、特异、快速且便宜。本文中提供了解决这种需要的方法和组合物。
将本文中引用的所有专利、专利申请、出版物、文件、网络链接和文章通过提述完整并入本文。
发明概述
本文中提供了允许选择性捕获感兴趣的核酸序列的方法和组合物。所述核酸可以含有DNA或RNA。本文中提供的方法和组合物对于处理复杂的核酸样品特别有用。
在一个方面,本发明提供了捕获靶核酸序列的方法,其包括:(a)提供包含多个衔接子连接的核酸的样品,其中所述核酸在一端与第一衔接子连接并在另一端与第二衔接子连接;(b)使所述样品与多个核酸引导的核酸酶-gNA复合物接触,其中所述gNA与在所述核酸的子集中包含的感兴趣的靶定位点互补,由此产生多个在一端与第一或第二衔接子连接并且在另一端无衔接子的核酸片段;和(c)使所述多个核酸片段与第三衔接子接触,由此产生多个在一端与第一或第二衔接子连接并且在另一端与第三衔接子连接的核酸片段。在一个实施方案中,所述核酸引导的核酸酶是CRISPR/Cas系统蛋白。在一个实施方案中,所述核酸引导的核酸酶是非CRISPR/Cas系统蛋白。在一个实施方案中,所述核酸引导的核酸酶选自以下各项的组:CAS I类I型、CAS I类III型、CAS I类IV型、CAS II类II型和CAS II类V型。在一个实施方案中,核酸引导的核酸酶选自以下各项的组:Cas9、Cpf1、Cas3、Cas8a-c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2、Cm5、Csf1、C2c2和NgAgo。在一个实施方案中,所述gNA是gRNA。在一个实施方案中,所述gNA是gDNA。在一个实施方案中,与多个核酸引导的核酸酶-gNA复合物接触而切割在所述核酸的子集中包含的感兴趣的靶定位点,由此产生多个在一端包含第一或第二衔接子并且在另一端没有衔接子的核酸片段。在一个实施方案中,所述方法进一步包括使用第一或第二和第三衔接子特异性PCR扩增步骤(c)的产物。在一个实施方案中,所述核酸选自以下各项的组:单链DNA、双链DNA、单链RNA、双链RNA和DNA/RNA杂合物。在一个实施方案中,所述核酸是双链DNA。在一个实施方案中,所述核酸来自基因组DNA。在一个实施方案中,所述基因组DNA是人的。在一个实施方案中,所述在末端连接衔接子的核酸的长度为20bp至5000bp。在一个实施方案中,感兴趣的靶定位点是单核苷酸多态性(SNP)、短串联重复(STR)、癌基因、插入物、删除、结构变异、外显子、基因突变或调控区。在一个实施方案中,扩增产物用于克隆、测序或基因分型。在一个实施方案中,衔接子的长度为20bp至100bp。在一个实施方案中,衔接子包括引物结合位点。在一个实施方案中,衔接子包括测序衔接子或限制性位点。在一个实施方案中,感兴趣的靶定位点代表少于50%的样品中的总核酸。在一个实施方案中,所述样品获自生物样品、临床样品、法医样品或环境样品。在一个实施方案中,第一和第二衔接子是相同的。在一个实施方案中,第一和第二衔接子是不同的。在一个实施方案中,所述样品包括测序文库。
在另一个方面,本发明提供了在感兴趣的靶定位点引入经标记核苷酸的方法,其包括:(a)提供包含多个核酸片段的样品;(b)使所述样品与多个核酸引导的核酸酶切口酶-gNA复合物接触,其中gNA与所述核酸片段中感兴趣的靶定位点互补,由此产生多个在感兴趣的靶定位点的带切口的核酸片段;和(c)使所述多个带切口的核酸片段与能够在切口位点处引发核酸合成的酶和经标记核苷酸接触,由此产生多个在感兴趣的靶定位点包含经标记核苷酸的核酸片段。在一个实施方案中,所述核酸引导的核酸酶切口酶选自以下各项的组:CAS I类I型切口酶、CAS I类III型切口酶、CAS I类IV型切口酶、CAS II类II型切口酶和CAS II类V型切口酶。在一个实施方案中,所述核酸引导的核酸酶切口酶选自以下各项的组:Cas9切口酶、Cpf1切口酶、Cas3切口酶、Cas8a-c切口酶、Cas10切口酶、Cse1切口酶、Csy1切口酶、Csn2切口酶、Cas4切口酶、Csm2切口酶、Cm5切口酶、Csf1切口酶、C2C2切口酶和NgAgo切口酶。在一个实施方案中,所述gNA是gRNA。在一个实施方案中,所述gNA是gDNA。在一个实施方案中,所述核酸片段选自以下各项的组:单链DNA片段、双链DNA片段、单链RNA片段、双链RNA片段和DNA/RNA杂合物片段。在一个实施方案中,所述核酸片段是双链DNA片段。在一个实施方案中,双链DNA片段来自基因组DNA。在一个实施方案中,所述基因组DNA是人的。在一个实施方案中,所述核酸片段的长度为20bp至5000bp。在一个实施方案中,感兴趣的靶定位点是单核苷酸多态性(SNP)、短串联重复(STR)、癌基因、插入物、删除、结构变异、外显子、基因突变或调控区。在一个实施方案中,感兴趣的靶定位点代表少于50%的样品中的总核酸。在一个实施方案中,所述样品获自生物样品、临床样品、法医样品或环境样品。在一个实施方案中,所述经标记核苷酸是生物素化核苷酸。在一个实施方案中,所述经标记核苷酸是抗体缀合物对的一部分。在一个实施方案中,所述方法进一步包括使包含生物素化核苷酸的核酸片段与亲合素或链霉亲合素接触,从而捕获感兴趣的靶向的核酸位点。在一个实施方案中,所述能够在切口位点处引发核酸合成的酶是DNA聚合酶I、Klenow片段、TAQ聚合酶或Bst DNA聚合酶。在一个实施方案中,所述Cas9切口酶在核酸片段的5’端产生切口。在一个实施方案中,所述核酸片段的长度为20bp至5000bp。在一个实施方案中,所述样品获自生物样品、临床样品、法医样品或环境样品。
在另一个方面,本发明提供了捕获感兴趣的靶核酸序列的方法,其包括:(a)提供包含多个衔接子连接的核酸的样品,其中所述核酸在一端与第一衔接子连接并在另一端与第二衔接子连接;和(b)使所述样品与多个无催化活性的核酸引导的核酸酶-gNA复合物接触,其中所述无催化活性的核酸引导的核酸酶与转座酶融合,其中所述gRNA与在所述核酸的子集中包含的感兴趣的靶定位点互补,并且其中所述复合物负载有多个第三衔接子,从而产生多个包含在一端的第一或第二衔接子和在另一端的第三衔接子的核酸片段。在一个实施方案中,所述方法进一步包括使用第一或第二衔接子和第三衔接子特异性PCR扩增步骤(b)的产物。在一个实施方案中,所述无催化活性的核酸引导的核酸酶衍生自CRISPR/Cas系统蛋白。在一个实施方案中,所述无催化活性的核酸引导的核酸酶衍生自非CRISPR/Cas系统蛋白。在一个实施方案中,所述无催化活性的核酸引导的核酸酶选自以下各项的组:无活性的CAS I类I型、无活性的CAS I类III型、无活性的CAS I类IV型、无活性的CAS II类II型和无活性的CAS II类V型。在一个实施方案中,所述无催化活性的核酸引导的核酸酶选自以下各项的组:dCas9、dCpf1、dCas3、dCas8a-c、dCas10、dCse1、dCsy1、dCsn2、dCas4、dCsm2、dCm5、dCsf1、dC2C2和dNgAgo。在一个实施方案中,所述gNA是gRNA。在一个实施方案中,所述gNA是gDNA。在一个实施方案中,所述核酸序列来自基因组DNA。在一个实施方案中,所述基因组DNA是人的。在一个实施方案中,所述无催化活性的核酸引导的核酸酶融合至转座酶的N端。在一个实施方案中,所述无催化活性的核酸引导的核酸酶融合至转座酶的C端。在一个实施方案中,所述衔接子连接的核酸为20bp-5000bp。在一个实施方案中,步骤(b)的接触允许将第二衔接子插入靶定的核酸序列中。在一个实施方案中,感兴趣的靶定位点是单核苷酸多态性(SNP)、短串联重复(STR)、癌基因、插入物、删除、结构变异、外显子、基因突变或调控区。在一个实施方案中,扩增产物用于克隆、测序或基因分型。在一个实施方案中,衔接子的长度为20bp至100bp。在一个实施方案中,衔接子包括引物结合位点。在一个实施方案中,衔接子包括测序衔接子或限制性位点。在一个实施方案中,感兴趣的靶定位点代表少于50%的样品中的总核酸。在一个实施方案中,所述样品获自生物样品、临床样品、法医样品或环境样品。
在另一个方面,本发明提供了捕获感兴趣的靶核酸序列的方法,其包括:(a)提供包含多个衔接子连接的核酸的样品,其中所述核酸在5’端和3’端与衔接子连接;(b)使所述样品与多个无催化活性的核酸引导的核酸酶-gNA复合物接触,其中所述gNA与在所述核酸的子集中包含的感兴趣的靶定位点互补,由此产生多个在5’和3’端连接衔接子的核酸,其与无催化活性的核酸引导的核酸酶-gNA复合物结合;和(c)使所述样品与多个无催化活性的核酸引导的核酸酶-gNA复合物接触,其中所述gNA与所述核酸中的所述感兴趣的靶定位点和不感兴趣的靶定位点两者互补,由此产生多个包含仅在5’或3’端之一连接衔接子的不感兴趣的核酸序列的核酸片段。在一个实施方案中,步骤(c)的接触并不置换步骤(b)的多个与dCAS9-gRNA复合物结合的在5’和3’端连接衔接子的核酸。在一个实施方案中,步骤(d)中的接触切割在所述核酸的子集中包含的不感兴趣的靶定位点,由此产生多个包含仅在5’或3’端之一连接衔接子的不感兴趣的核酸序列的核酸片段。在一个实施方案中,所述方法进一步包括使用衔接子特异性PCR去除结合的dCAS9-gRNA复合物并且扩增步骤(b)的产物。在一个实施方案中,所述无催化活性的核酸引导的核酸酶是CRISPR/Cas系统蛋白。在一个实施方案中,所述无催化活性的核酸引导的核酸酶是非CRISPR/Cas系统蛋白。在一个实施方案中,所述无催化活性的核酸引导的核酸酶选自以下各项的组:无活性的CAS I类I型、无活性的CAS I类III型、无活性的CAS I类IV型、无活性的CAS II类II型和无活性的CAS II类V型。在一个实施方案中,所述无催化活性的核酸引导的核酸酶选自以下各项的组:dCas9、dCpf1、dCas3、dCas8a-c、dCas10、dCse1、dCsy1、dCsn2、dCas4、dCsm2、dCm5、dCsf1、dC2C2和dNgAgo。在一个实施方案中,所述gNA是gRNA。在一个实施方案中,所述gNA是gDNA。在一个实施方案中,所述核酸选自以下各项的组:单链DNA、双链DNA、单链RNA、双链RNA和DNA/RNA杂合物。在一个实施方案中,所述核酸是双链DNA。在一个实施方案中,所述核酸来自基因组DNA。在一个实施方案中,所述基因组DNA是人的。在一个实施方案中,所述在5’端和3’端连接衔接子的核酸的长度为20bp至5000bp。在一个实施方案中,感兴趣的靶定位点是单核苷酸多态性(SNP)、短串联重复(STR)、癌基因、插入物、删除、结构变异、外显子、基因突变或调控区。在一个实施方案中,扩增产物用于克隆、测序或基因分型。在一个实施方案中,衔接子的长度为20bp至100bp。在一个实施方案中,衔接子包括引物结合位点。在一个实施方案中,衔接子包括测序衔接子或限制性位点。在一个实施方案中,感兴趣的靶定位点代表少于50%的样品中的总核酸。在一个实施方案中,所述样品获自生物样品、临床样品、法医样品或环境样品。
在另一个方面,本发明提供了捕获感兴趣的靶DNA序列的方法,其包括:(a)提供包含多个核酸序列的样品,其中所述核酸序列包含甲基化核苷酸,并且其中所述核酸序列在5’和3’端连接衔接子;(b)使所述样品与多个核酸引导的核酸酶切口酶-gNA复合物接触,其中所述gNA与所述核酸序列的子集中感兴趣的靶定位点互补,由此产生多个在所述核酸序列的子集中感兴趣的切口位点,并且其中所述靶核酸序列在5’和3’端连接衔接子;(c)使所述样品与能够在切口位点处引发DNA合成的酶和未甲基化核苷酸接触,由此产生多个在感兴趣的靶定位点中包含未甲基化核苷酸的核酸序列,并且其中所述核酸序列在5'和3’端连接衔接子;和(d)使所述样品与能够切割甲基化核酸的酶接触,由此产生多个包含甲基化核酸的核酸片段,其中所述多个核酸片段包含在5’和3’端的至多一者连接衔接子的甲基化核酸。在一个实施方案中,所述核酸引导的核酸酶切口酶选自以下各项的组:CAS I类I型切口酶、CAS I类III型切口酶、CAS I类IV型切口酶、CAS II类II型切口酶和CAS II类V型切口酶。在一个实施方案中,所述核酸引导的核酸酶切口酶选自以下各项的组:Cas9切口酶、Cpf1切口酶、Cas3切口酶、Cas8a-c切口酶、Cas10切口酶、Cse1切口酶、Csy1切口酶、Csn2切口酶、Cas4切口酶、Csm2切口酶、Cm5切口酶、Csf1切口酶、C2c2切口酶和NgAgo切口酶。在一个实施方案中,所述gNA是gRNA。在一个实施方案中,所述gNA是gDNA。在一个实施方案中,所述DNA是双链DNA。在一个实施方案中,所述双链DNA来自基因组DNA。在一个实施方案中,所述基因组DNA是人的。在一个实施方案中,DNA序列的长度为20bp至5000bp。在一个实施方案中,感兴趣的靶定位点是单核苷酸多态性(SNP)、短串联重复(STR)、癌基因、插入物、删除、结构变异、外显子、基因突变或调控区。在一个实施方案中,感兴趣的靶定位点少于样品中总DNA的50%。在一个实施方案中,所述样品获自生物样品、临床样品、法医样品或环境样品。在一个实施方案中,所述能够在切口位点处引发核酸合成的酶是DNA聚合酶I、Klenow片段、TAQ聚合酶或Bst DNA聚合酶。在一个实施方案中,所述核酸引导的核酸酶切口酶在DNA序列的5’端产生切口。在一个实施方案中,能够切割甲基化DNA的酶是DpnI。
在另一个方面,本发明提供了捕获感兴趣的靶DNA序列的方法,其包括:(a)使所述样品与多个核酸引导的核酸酶切口酶-gNA复合物接触,其中所述gNA与所述DNA序列的子集中感兴趣区域侧翼的靶定位点互补,由此产生多个在邻近所述感兴趣区域的位点处的带切口的DNA;(b)加热至65℃以引起非常接近的切口而产生双链断裂;(c)使这些双链断裂与热稳定的连接酶接触,由此允许仅在这些位点连接衔接子序列;和(d)重复这三个步骤在感兴趣区域的另一侧放置第二衔接子,从而允许富集感兴趣区域。在一个实施方案中,所述gNA是gRNA。在一个实施方案中,所述gNA是gDNA。在一个实施方案中,所述核酸引导的核酸酶切口酶选自以下各项的组:CAS I类I型切口酶、CAS I类III型切口酶、CAS I类IV型切口酶、CAS II类II型切口酶和CAS II类V型切口酶。在一个实施方案中,所述核酸引导的核酸酶切口酶选自以下各项的组:Cas9切口酶、Cpf1切口酶、Cas3切口酶、Cas8a-c切口酶、Cas10切口酶、Cse1切口酶、Csy1切口酶、Csn2切口酶、Cas4切口酶、Csm2切口酶、Cm5切口酶、Csf1切口酶、C2C2切口酶和NgAgo切口酶。在一个实施方案中,所述DNA是双链DNA。在一个实施方案中,所述双链DNA来自基因组DNA。在一个实施方案中,所述基因组DNA是人的。在一个实施方案中,DNA序列的长度为20bp至5000bp。在一个实施方案中,感兴趣的靶定位点是单核苷酸多态性(SNP)、短串联重复(STR)、癌基因、插入物、删除、结构变异、外显子、基因突变或调控区。在一个实施方案中,感兴趣的靶定位点少于样品中总DNA的50%。在一个实施方案中,所述样品获自生物样品、临床样品、法医样品或环境样品。在一个实施方案中,能够接触双链断裂的连接酶是热稳定的5’App DNA/RNA连接酶或T4RNA连接酶。在一个实施方案中,所述核酸引导的核酸酶切口酶在DNA序列的5’端产生切口。在一个实施方案中,能够切割甲基化DNA的酶是DpnI。
在另一个方面,本发明提供了富集样品的感兴趣的序列的方法,其包括:(a)提供包含感兴趣的序列和用于耗尽的靶定序列的样品,其中感兴趣的序列构成少于50%的样品;和(b)使所述样品与多个核酸引导的RNA核酸内切酶-gRNA复合物或多个核酸引导的DNA核酸内切酶-gDNA复合物接触,其中所述gRNA和gDNA与所述靶定序列互补,由此所述靶定序列受到切割。在一个实施方案中,所述方法进一步包括从样品中提取感兴趣的序列和用于耗尽的靶定序列。在一个实施方案中,所述方法进一步包括使提取的序列片段化。在一个实施方案中,通过大小排阻去除切割的靶定序列。在一个实施方案中,所述样品是生物样品、临床样品、法医样品或环境样品中的任一种。在一个实施方案中,样品包含靶向耗尽的宿主核酸序列和感兴趣的非宿主核酸序列。在一个实施方案中,非宿主核酸序列包括微生物核酸序列。在一个实施方案中,微生物核酸序列是细菌、病毒或真核寄生物核酸序列。在一个实施方案中,gRNA和gDNA与核糖体RNA序列、经剪接转录物、未剪接转录物、内含子、外显子或非编码RNA互补。在一个实施方案中,提取的核酸包括单链或双链RNA。在一个实施方案中,提取的核酸包括单链或双链DNA。在一个实施方案中,感兴趣的序列构成少于10%的提取的核酸。在一个实施方案中,核酸引导的RNA核酸内切酶包括C2c2。在一个实施方案中,C2c2无催化活性。在一个实施方案中,核酸引导的DNA核酸内切酶包括NgAgo。在一个实施方案中,NgAgo无催化活性。在一个实施方案中,样品选自全血、血浆、血清、泪液、唾液、粘液、脑脊液、牙齿、骨、指甲、粪便、尿液、组织和活检。
在另一个方面,本发明提供了富集样品的方法,其包括:(a)提供包含宿主核酸和非宿主核酸的样品;(b)使所述样品与多个核酸引导的RNA核酸内切酶-gRNA复合物或多个核酸引导的DNA核酸内切酶-gDNA复合物接触,其中gRNA和gDNA与宿主核酸中的靶定位点互补,和(c)富集样品的非宿主核酸。在一个实施方案中,核酸引导的RNA核酸内切酶包括C2c2。在一个实施方案中,核酸引导的RNA核酸内切酶包括无催化活性的C2c2。在一个实施方案中,核酸引导的DNA核酸内切酶包括NgAgo。在一个实施方案中,核酸引导的DNA核酸内切酶包括无催化活性的NgAgo。在一个实施方案中,宿主选自由人、牛、马、绵羊、猪、猴、犬、猫、沙鼠、鸟、小鼠和大鼠组成的组。在一个实施方案中,非宿主是原核生物。在一个实施方案中,非宿主选自由真核生物、病毒、细菌、真菌和原生动物组成的组。在一个实施方案中,衔接子连接的宿主核酸和非宿主核酸的长度范围为50bp至1000bp。在一个实施方案中,非宿主核酸构成少于50%的样品中的总核酸。在一个实施方案中,所述样品是生物样品、临床样品、法医样品或环境样品中的任一种。在一个实施方案中,步骤(c)包括将步骤(b)的产物逆转录成cDNA。在一个实施方案中,步骤(c)包括通过大小排阻去除宿主核酸。在一个实施方案中,步骤(c)包括使用生物素去除宿主核酸。在一个实施方案中,样品选自全血、血浆、血清、泪液、唾液、粘液、脑脊液、牙齿、骨、指甲、粪便、尿液、组织和活检。
在另一个方面,本发明提供了使用核酸引导的RNA核酸内切酶富集RNA样品中的靶标的方法,所述方法利用标记的无催化活性的核酸引导的RNA核酸内切酶蛋白。在一些实施方案中,使核酸引导的RNA核酸内切酶蛋白靶向至血液RNA样品中的HIV RNA,并将宿主RNA洗掉。在一些实施方案中,所述核酸引导的RNA核酸内切酶是C2c2。
在另一个方面,本发明提供了包含核酸片段、核酸引导的核酸酶切口酶-gNA复合物和经标记核苷酸的组合物。在一个实施方案中,所述核酸包括DNA。在一个实施方案中,所述核酸引导的核酸酶切口酶选自以下各项的组:CAS I类I型切口酶、CAS I类III型切口酶、CAS I类IV型切口酶、CAS II类II型切口酶和CAS II类V型切口酶。在一个实施方案中,所述核酸引导的核酸酶切口酶选自以下各项的组:Cas9切口酶、Cpf1切口酶、Cas3切口酶、Cas8a-c切口酶、Cas10切口酶、Cse1切口酶、Csy1切口酶、Csn2切口酶、Cas4切口酶、Csm2切口酶、Cm5切口酶、Csf1切口酶、C2C2切口酶和NgAgo切口酶。在一个实施方案中,所述gNA是gRNA。在一个实施方案中,所述gNA是gDNA。在一个实施方案中,所述核酸片段包括DNA。在一个实施方案中,所述核酸片段包括RNA。在一个实施方案中,所述核苷酸用生物素标记。在一个实施方案中,所述核苷酸是抗体缀合物对的一部分。
在另一个方面,本发明提供了包含核酸片段和无催化活性的核酸引导的核酸酶-gNA复合物的组合物,其中所述无催化活性的核酸引导的核酸酶与转座酶融合。在一个实施方案中,所述无催化活性的核酸引导的核酸酶选自以下各项的组:无活性的CAS I类I型、无活性的CAS I类III型、无活性的CAS I类IV型、无活性的CAS II类II型和无活性的CAS II类V型。在一个实施方案中,所述无催化活性的核酸引导的核酸酶选自以下各项的组:dCas9、dCpf1、dCas3、dCas8a-c、dCas10、dCse1、dCsy1、dCsn2、dCas4、dCsm2、dCm5、dCsf1、dC2C2和dNgAgo。在一个实施方案中,所述gNA是gRNA。在一个实施方案中,所述gNA是gDNA。在一个实施方案中,所述核酸片段包括DNA。在一个实施方案中,所述核酸片段包括RNA。在一个实施方案中,所述无催化活性的核酸引导的核酸酶融合至转座酶的N端。在一个实施方案中,所述无催化活性的核酸引导的核酸酶融合至转座酶的C端。在一个实施方案中,所述组合物包含DNA片段和dCas9-gRNA复合物,其中dCas9与转座酶融合。
在另一个方面,本发明提供了包含含有甲基化核苷酸的核酸片段、核酸引导的核酸酶切口酶-gNA复合物和未甲基化核苷酸的组合物。在一个实施方案中,所述核酸引导的核酸酶切口酶选自以下各项的组:CAS I类I型切口酶、CAS I类III型切口酶、CAS I类IV型切口酶、CAS II类II型切口酶和CAS II类V型切口酶。在一个实施方案中,所述核酸引导的核酸酶切口酶选自以下各项的组:Cas9切口酶、Cpf1切口酶、Cas3切口酶、Cas8a-c切口酶、Cas10切口酶、Cse1切口酶、Csy1切口酶、Csn2切口酶、Cas4切口酶、Csm2切口酶、Cm5切口酶、Csf1切口酶、C2C2切口酶和NgAgo切口酶。在一个实施方案中,所述gNA是gRNA。在一个实施方案中,所述gNA是gDNA。在一个实施方案中,所述核酸片段包括DNA。在一个实施方案中,所述核酸片段包括RNA。在一个实施方案中,所述核苷酸用生物素标记。在一个实施方案中,所述核苷酸是抗体缀合物对的一部分。在一个实施方案中,所述组合物包含含有甲基化核苷酸的DNA片段、切口酶Cas9-gRNA复合物和未甲基化核苷酸。
附图简述
图1展示了从人基因组DNA文库中捕获靶核酸的第一种方案。
图2进一步展示了从核酸混合物中捕获靶核酸(例如DNA)的方案。用核酸引导的核酸酶切割靶核酸,然后将衔接子连接到最新可用的平端中。
图3展示,在Cas9切割之后连接衔接子允许特异性扩增靶DNA。
图4展示,在对扩增的DNA进行测序时,衔接子的连接仅发生在由引导RNA指定的位置。
图5展示,图1的方法有效扩增了在任何给定文库中的代表性不足的DNA。
图6展示了第二种捕获方案:使用核酸引导的核酸酶切口酶标记靶核酸(例如DNA),从而允许进一步捕获和纯化。
图7展示了使用限制性切口酶作为核酸引导的核酸酶切口酶的替代物的原理实验的证据。
图8展示了对于图7中展示的实验的大约50倍的测试DNA的富集(使用Cas9-切口酶)。
图9展示了第三种捕获方案:使用无催化活性的核酸引导的核酸酶-转座酶融合物,在人基因组文库中插入衔接子,以允许特异性SNP的富集。
图10展示了第四种捕获方案:使用无活性的核酸引导的核酸酶保护靶定位点免受随后被核酸引导的核酸酶片段化,从而允许富集感兴趣区域。
图11展示了第五种捕获方案:使用核酸引导的核酸酶切口酶通过用未甲基化的DNA取代甲基化的DNA来保护并且然后富集来自例如人基因组DNA的任何靶向区域,例如SNP或STR。
图12展示,在第五种方案中测试DNA的甲基化使其易于受DpnI介导的切割。
图13展示了第六种捕获方案:使用核酸引导的核酸酶切口酶引入描绘感兴趣区域的两个双链断裂,从而允许衔接子的3'单链连接以及随后的富集。
发明详述
定义
除非本文中另外定义,本文中使用的全部技术术语和科学术语具有与本发明所属领域的普通技术人员通常所理解的相同的含义。尽管可以在本发明的实践或测试中使用与本文中所描述的那些类似或等同的任何方法和材料,但描述了优选的方法和材料。
本文中提供的标题并非对本发明的各个方面或实施方案的限制。因此,通过整体上参考说明书,更详尽地定义了紧接着在下文中定义的术语。
除非另外定义,本文中使用的全部技术术语和科学术语具有与本发明所属领域的普通技术人员通常所理解的相同的含义。Singleton等人,DICTIONARY OF MICROBIOLOGYAND MOLECULAR BIOLOGY,2D ED.,John Wiley and Sons,New York(1994)以及Hale&Markham,THE HARPER COLLINS DICTIONARY OF BIOLOGY,Harper Perennial,N.Y.(1991)向技术人员提供了在本文中使用的许多术语的一般含义。然而,为了清楚和易于参考,下面定义了某些术语。
数值范围包括定义该范围的数字。
如本文中使用的术语“样品”涉及通常但不一定处于液体形式的含有一种或多种感兴趣的分析物的材料或材料混合物。
如本文中使用的,术语“核酸样品”表示含有核酸的样品。本文中使用的核酸样品可能是复杂的,因为它们含有包含序列的多个不同的分子。来自哺乳动物的基因组DNA是一种复杂的样品。复杂样品可能具有多于104、105、106或107个不同的核酸分子。DNA靶标可以来源于任何来源,比如基因组DNA、cDNA或人工DNA构建体。可以在本文中采用任何含有核酸的样品,所述核酸例如由组织培养细胞或组织样品制备的基因组DNA。
术语“核苷酸”预期包括那些不仅含有已知嘌呤和嘧啶碱基而且还包含经修饰的其他杂环碱基的模块。这样的修饰包括甲基化嘌呤或嘧啶、酰化嘌呤或嘧啶、烷基化核糖或其他杂环。另外,术语“核苷酸”包括含有半抗原或荧光标记的那些模块,并且不仅可以含有常规的核糖和脱氧核糖,还可以含有其他糖。修饰的核苷或核苷酸还包括在糖模块上的修饰,例如其中一个或多个羟基被卤素原子或脂族基团取代,或被官能化为醚、胺等。
术语“核酸”和“多核苷酸”在本文中可互换使用。多核苷酸用于描述任何长度的核酸聚合物,例如大于约2个碱基、大于约10个碱基、大于约100个碱基、大于约500个碱基、大于1000个碱基、至多约10,000个或更多个碱基组成的核苷酸,例如脱氧核糖核苷酸或核糖核苷酸,并且可以通过酶或合成产生(例如PNA,如美国专利No.5,948,902和其中引用的参考文献所述),其可以以序列特异性方式与天然存在的核酸杂交,所述方式类似于两个天然存在的核酸的杂交,例如可以参与沃森-克里克碱基配对相互作用。天然存在的核苷酸包括鸟嘌呤、胞嘧啶、腺嘌呤和胸腺嘧啶(分别为G、C、A和T)。DNA和RNA分别具有脱氧核糖和核糖糖骨架,而PNA的骨架由通过肽键连接的重复的N-(2-氨基乙基)-甘氨酸单元组成。在PNA中,各种嘌呤和嘧啶碱基通过亚甲基羰基键与骨架连接。通常称为不可接近RNA的锁核酸(LNA)是经修饰的RNA核苷酸。将LNA核苷酸的核糖模块用连接2'氧和4'碳的外桥修饰。所述桥将核糖“锁”在3'-内(北)构象中,该构象常见于A型双链体中。在需要时,LNA核苷酸可以与寡核苷酸中的DNA或RNA残基混合。术语“非结构化核酸”或“UNA”是含有以降低的稳定性彼此结合的非天然核苷酸的核酸。例如,非结构化核酸可以含有G'残基和C'残基,其中这些残基对应于G和C的非天然存在形式,即G和C的类似物,其以降低的稳定性彼此碱基配对,但分别保留与天然存在的C和G残基碱基配对的能力。在US20050233340中描述了非结构化核酸,针对其UNA的公开内容通过提述将其并入本文。
如本文中使用的术语“寡核苷酸”表示核苷酸的单链多聚体。
除非另外指明,否则核酸以5’至3’方向从左向右书写;氨基酸序列对应地以氨基至羧基方向从左向右书写。
如本文中使用的,术语“切割”是指使双链DNA分子的两条链中的两个相邻核苷酸之间的磷酸二酯键断裂的反应,由此在DNA分子中产生双链断裂。
如本文中使用的,术语“切割位点”是指双链DNA分子被切割的位置。
“核酸引导的核酸酶-gNA复合物”是指包含核酸引导的核酸酶蛋白和引导核酸(gNA,例如gRNA或gDNA)的复合物。例如,“Cas9-gRNA复合物”是指包含Cas9蛋白和引导RNA(gRNA)的复合物。核酸引导的核酸酶可以是任何类型的核酸引导的核酸酶,包括但不限于野生型核酸引导的核酸酶、无催化活性的核酸引导的核酸酶或核酸引导的核酸酶切口酶。
术语“核酸引导的核酸酶相关引导NA”是指引导核酸(引导NA)。核酸引导的核酸酶相关引导NA可以作为分离的核酸存在,或作为核酸引导的核酸酶-gNA复合物(例如Cas9-gRNA复合物)的一部分存在。
术语“捕获”和“富集”在本文中可互换使用,并且是指选择性分离核酸区域的过程,所述核酸区域包含:感兴趣的序列、感兴趣的靶定位点、不感兴趣的序列或不感兴趣的靶定位点。
术语“杂交”是指核酸链通过本领域已知的碱基配对与互补链结合的过程。如果两个序列在中等至高严格杂交和洗涤条件下彼此特异性杂交,则认为核酸与参考核酸序列“可选择性杂交”。中等和高严格杂交条件是已知的(参见,例如Ausubel等人,ShortProtocols in Molecular Biology,第3版,Wiley&Sons 1995以及Sambrook等人,Molecular Cloning:A Laboratory Manual,第3版,2001Cold Spring Harbor,N.Y.)。高严格条件的一个实例包括在约42℃下在50%甲酰胺、5X SSC、5X Denhardt溶液、0.5%SDS和100μg/ml变性载体DNA中杂交,接着在室温下在2X SSC和0.5%SDS中洗涤两次,再在42℃下在0.1X SSC和0.5%SDS中洗涤两次。
如本文中使用的术语“双链体”或“双链体的”描述了碱基配对即杂交到一起的两个互补的多核苷酸。
如本文中使用的术语“扩增”是指使用靶标核酸作为模板生成靶核酸的一个或更多个拷贝。
如本文中使用的术语“基因组区域”是指基因组的区域,例如动物或植物基因组,比如人、猴、大鼠、鱼或昆虫或植物的基因组的区域。在某些情况下,可以使用参考基因组区域(即,已知核苷酸序列的基因组区域,例如,其序列保存在例如NCBI的Genbank数据库或其他数据库中的染色体区域)来设计在本文所述的方法中使用的寡核苷酸。
如本文中使用的术语“基因组序列”是指出现在基因组中的序列。由于RNA是从基因组转录的,该术语涵盖存在于生物体的核基因组中的序列,以及存在于从这样的基因组转录的RNA(例如mRNA)的cDNA拷贝中的序列。
如本文中使用的术语“基因组片段”是指基因组的区域,例如动物或植物基因组,比如人、猴、大鼠、鱼或昆虫或植物的基因组的区域。基因组片段可以是整个染色体或染色体的片段。基因组片段可以连接衔接子(在这种情况下,它具有与片段的一端或两端连接、或至少与分子的5’端连接的衔接子),或者可以不连接衔接子。
在某些情况下,可以使用参考基因组区域(即,已知核苷酸序列的基因组区域,例如,其序列保存在例如NCBI的Genbank数据库或其他数据库中的染色体区域)来设计在本文所述的方法中使用的寡核苷酸。这样的寡核苷酸可用于使用含有测试基因组的样品的测定法中,其中所述测试基因组含有针对所述寡核苷酸的结合位点。
如本文中使用的术语“连接”是指第一DNA分子的5’端的末端核苷酸与第二DNA分子的3’端的末端核苷酸的酶催化连接。
如果两个核酸是“互补的”,则其中一个核酸的每个碱基与另一个核酸中的相应核苷酸碱基配对。术语“互补”和“完全互补”在本文中作为同义词使用。
如本文中使用的术语“分离”是指两种要素的物理分离(例如,通过大小或亲和力等),以及使一种要素降解而使另一种要素保持完整。例如,可以采用大小排阻分离核酸,包括切割的靶定序列。
在细胞中,DNA通常以双链的形式存在,并因此具有核酸的两条互补链,在本文中被称为“顶”链和“底”链。在某些情况下,染色体区域的互补链可以被称为“正”链和“负”链、“第一”链和“第二”链、“编码”链和“非编码”链、“沃森”链和“克里克”链、或“有义”链和“反义”链。将链分配为顶链或底链是任意的,并不意味着任何特定的取向、功能或结构。第一链和第二链是不同的分子,直到它们变成共价连接为止。为了便于描述,其中顶链和底链已共价连接的双链核酸的“顶”链和“底”链将仍被描述为“顶”链和“底”链。换言之,出于本公开的目的,双链DNA的顶链和底链不必是分开的分子。几个示例性哺乳动物染色体区域(例如,BAC、装配体、染色体等)的第一链的核苷酸序列是已知的,并且可以例如在NCBI的Genbank数据库中找到。
如本文中使用的术语“顶链”是指核酸的任一链而不是核酸的两条链。当寡核苷酸或引物“仅与顶链”结合或退火时,它仅与一条链结合而不与另一条链结合。如本文中使用的术语“底链”是指与“顶链”互补的链。当寡核苷酸“仅与一条链”结合或退火时,它仅与一条链例如第一链或第二链结合,而不与另一条链结合。如果寡核苷酸与双链DNA的两条链结合或退火,则所述寡核苷酸可以具有两个区域,即与双链DNA的顶链杂交的第一区域和与与双链DNA的底链杂交的第二区域。
术语“双链DNA分子”是指其中顶链和底链未共价连接的双链DNA分子以及其中顶链和底链共价连接的双链DNA分子。双链DNA的顶链和底链通过沃森-克里克相互作用彼此碱基配对。
如本文中使用的术语“变性”是指通过将双链体置于适合的变性条件下来分离核酸双链体的碱基对的至少一部分。变性条件在本领域中是熟知的。在一个实施方案中,为了使核酸双链体变性,可将双链体暴露于在双链体的Tm以上的温度,由此使双链体的一条链释放而离开另一条链。在某些实施方案中,可以通过将核酸暴露于至少90℃温度持续适合的时间量(例如,至少30秒,至多30分钟)使其变性。在某些实施方案中,可以使用完全变性条件来完全分离双链体的碱基对。在其他实施方案中,可以使用部分变性条件(例如,具有比完全变性条件更低的温度)来分开双链体某些部分的碱基对(例如,富含A-T碱基对的区域可以分开,而富含G-C碱基对的区域可以保持配对)。也可以通过化学方式使核酸变性(例如,使用尿素或NaOH)。
如本文中使用的术语“基因分型”是指任何类型的核酸序列分析,并且包括测序、多态性(SNP)分析以及鉴定重排的分析。
如本文中使用的术语“测序”是指借此获得多核苷酸的连续核苷酸的身份的方法。
术语“下一代测序”是指例如目前被Illumina、Life Technologies和Roche等采用的所谓的并行化的边合成边测序或边连接边测序平台。下一代测序法还可包括纳米孔测序法或基于电子检测的方法,比如被Life Technologies商业化的离子激流技术。
术语“互补DNA”或cDNA是指通过如下方法从RNA样品产生的双链DNA样品:RNA的逆转录(使用引物,如随机六聚体或寡聚-dT引物),然后是通过RNA酶H消化RNA及用DNA聚合酶合成来进行第二链合成。
术语“RNA启动子衔接子”是含有噬菌体RNA聚合酶(例如来自噬菌体T3、T7、SP6等的RNA聚合酶)的启动子的衔接子。
术语的其他定义可以在整个说明书中出现。
本发明的示例性方法
如本文所述,本发明提供了用于捕获在这些方案中使用的核酸和组合物的示例性方案。
示例性的方案分别展示在图1、6、9、10、11和13以及在实施例部分中。在全文中对各种用途予以考虑。在本节中提及的具体术语在后续章节中有更详细的描述。
在一个实施方案中,本发明提供了如图1-5中提供的捕获方法(描绘为方案1)。在这个实施方案中,所述方法用于捕获靶核酸序列。参考图1,所述方法包括提供样品或文库100,进行提取方案101(例如DNA提取方案),从而产生包含>99%非靶序列和<1%靶序列的样品102。进行样品的文库构建方案103,从而产生包含测序索引的衔接子104的核酸文库,产生多个衔接子连接的核酸,其中所述核酸在一端与第一衔接子连接,并在另一端与第二衔接子连接。为了产生靶特异性引导NA(例如gRNA)的文库,使各自包含RNA聚合酶启动子111、特异性碱基对区域112(例如20个碱基对的区域)和用于核酸引导的核酸酶113的茎环结合位点的靶特异性gNA前体110的文库经受体外转录114,从而产生靶特异性引导RNA 115的文库。然后使靶特异性引导NA的文库与核酸引导的核酸酶蛋白116结合,以产生核酸引导的核酸酶-gNA复合物的文库。然后使核酸引导的核酸酶-gNA复合物与核酸文库结合,使得核酸引导的核酸酶切割匹配的靶核酸序列而不切割其他核酸117。加入第二衔接子118并使其特异性地与切割的核酸119的5'磷酸化平端连接。这使得能够进行下游应用,例如使用衔接子特异性PCR 120扩增包含在一端的第一或第二衔接子和在另一端的第三衔接子的核酸片段。
在方案1的示例性描述中,参考图1,所述方法用于捕获靶核酸序列。所述方法包括提供包含多个衔接子连接的核酸的样品或文库,其中所述核酸在一端与第一衔接子连接,并在另一端与第二衔接子连接。随后使所述样品与多个Cas9-gRNA复合物接触,其中所述gRNA与包含在所述核酸的子集中感兴趣的靶定位点互补。该接触将所述感兴趣的靶定位点切割,由此产生多个在一端与第一或第二衔接子连接并且在另一端没有衔接子的核酸片段。这个步骤之后,将多个所得到的核酸片段与第三衔接子连接,从而产生多个在一端与第一或第二衔接子连接并且在另一端与第三衔接子连接的核酸片段。这使得能够进行下游应用,例如使用衔接子特异性PCR扩增包含在一端的第一或第二衔接子和在另一端的第三衔接子的核酸片段。
在一个实施方案中,本发明提供了如图6-8中提供的捕获方法(描绘为方案2)。在这个实施方案中,所述方法用于在感兴趣的靶定位点引入经标记核苷酸。所述方法包括提供包含多个双链核酸片段601(例如双链DNA)的样品;使所述样品与多个核酸引导的核酸酶切口酶-gNA复合物接触。切口酶核酸引导的核酸酶603由靶特异性引导NA 604引导,其中所述gNA与所述核酸片段中感兴趣的靶定位点互补,由此产生多个在感兴趣的靶定位点的带切口的核酸片段。切口酶用于使靶序列605产生切口。切口酶-核酸引导的核酸酶在靶序列处切割。单链切割(切口)是DNA聚合酶I的底物,其可用于以生物素标记的DNA 606置换所述切口下游的DNA。
在方案2的示例性描述中,参考图6,所述方法用于在感兴趣的靶定位点引入经标记核苷酸。所述方法包括提供包含多个核酸片段的样品;使所述样品与多个Cas9切口酶-gRNA复合物接触,其中gRNA与所述核酸片段中感兴趣的靶定位点互补,由此产生多个在感兴趣的靶定位点的带切口的核酸片段;然后接着使所述多个带切口的核酸片段与能够在切口位点处引发核酸合成的酶和经标记核苷酸接触,由此产生多个在感兴趣的靶定位点包含经标记核苷酸的核酸片段。
在一个实施方案中,本发明提供了如图9中提供的捕获方法(描绘为方案3)。在这个实施方案中,所述方法用于捕获感兴趣的靶核酸序列901。所述方法首先涉及提供包含多个衔接子连接的核酸902的样品,其中所述核酸在一端与第一衔接子连接,并在另一端与第二衔接子连接。随后使所述样品与多个无催化活性的核酸引导的核酸酶-gNA复合物接触,其中所述无催化活性的核酸引导的核酸酶与转座酶903融合,其中所述gNA 904与包含在所述核酸的子集中感兴趣的靶定位点互补,并且其中所述无催化活性的核酸引导的核酸酶-gNA转座酶复合物加载有多个第三衔接子905,从而产生多个包含在一端的第一或第二衔接子和在另一端的第三衔接子的核酸片段906。然后可以使用衔接子序列将这些片段扩增907,然后进行测序908。
在方案3的示例性描述中,参考图9,所述方法用于捕获感兴趣的靶核酸序列。所述方法首先涉及提供包含多个衔接子连接的核酸的样品,其中所述核酸在一端与第一衔接子连接,并在另一端与第二衔接子连接。随后使所述样品与多个dCas9-gRNA复合物接触,其中所述dCas9与转座酶融合,其中所述gRNA与包含在所述核酸的子集中感兴趣的靶定位点互补,并且其中所述dCas9-gRNA转座酶复合物加载有多个第三衔接子,从而产生多个包含在一端的第一或第二衔接子和在另一端的第三衔接子的核酸片段。
在一个实施方案中,本发明提供了正如例如在图10中提供的捕获方法(描绘为方案4)。在这个实施方案中,所述方法用于捕获感兴趣的靶核酸序列1001。所述方法包括首先提供包含多个衔接子连接的核酸1002的样品,其中所述核酸在5'端和3'端与所述衔接子连接。所述方法然后涉及使所述样品与多个无催化活性的核酸引导的核酸酶-gNA复合物1003接触,其中gNA 1004与包含在所述核酸的子集中感兴趣的靶定位点互补,由此产生多个在5'和3'端连接衔接子的核酸,其与无催化活性的核酸引导的核酸酶-gNA复合物1005结合。随后使所述样品与多个核酸引导的核酸酶-gNA复合物1006接触,其中gNA 1007与所述核酸中的感兴趣的靶定位点和不感兴趣的靶定位点互补,由此产生多个包含仅在5’或3’端之一连接衔接子的不感兴趣的核酸序列的核酸片段1008。在该方法中,其中与多个核酸引导的核酸酶-gNA复合物接触的第二个接触步骤并不置换多个在5'和3'端连接衔接子的核酸,所述核酸与步骤(b)的无催化活性的核酸引导的核酸酶-gNA复合物结合。
在方案4的示例性描述中,参考图10,所述方法用于捕获感兴趣的靶核酸序列。所述方法包括首先提供包含多个衔接子连接的核酸的样品,其中所述核酸在5'端和3'端与所述衔接子连接。所述方法然后涉及使所述样品与多个无活性的核酸引导的核酸酶-gNA复合物(例如dCas9-gRNA复合物)接触,其中gNA与包含在所述核酸的子集中感兴趣的靶定位点互补,由此产生多个在5'和3'端连接衔接子的核酸,其与无活性的核酸引导的核酸酶-gNA复合物(例如dCAS9-gRNA复合物)结合。随后使所述样品与多个核酸引导的核酸酶-gNA复合物(例如Cas9-gRNA复合物)接触,其中gNA与所述核酸中的感兴趣的靶定位点和不感兴趣的靶定位点互补,由此产生多个包含仅在5’或3’端之一连接衔接子的不感兴趣的核酸序列的核酸片段。在该方法中,其中与多个核酸引导的核酸酶-gNA复合物(例如Cas9-gRNA复合物)接触的第二个接触步骤并不置换多个在5'和3'端连接衔接子的核酸,所述核酸与步骤(b)的无活性的核酸引导的核酸酶-gNA复合物(例如dCAS9-gRNA复合物)结合。
在一个实施方案中,本发明提供了正如例如在图11和图12中提供的捕获方法(描绘为方案5)。在这个实施方案中,所述方法用于捕获感兴趣的靶核酸序列1101。所述方法涉及首先提供包含多个序列1102的样品,其中所述序列包含甲基化核苷酸(例如用Dam甲基转移酶处理),并且其中所述序列在5'和3'端连接衔接子。所述方法然后涉及首先使所述样品与多个核酸引导的核酸酶切口酶-gNA复合物1103接触,其中gNA 1104与所述序列的子集中感兴趣的靶定位点互补,由此产生多个在感兴趣的靶定位点的带切口的核酸序列1105,并且其中所述核酸序列在5'和3'端连接衔接子。当核酸是DNA时,单链切割(切口)可以是例如DNA聚合酶I的底物,从而以未甲基化的DNA置换所述切口下游的DNA。然后可以接着使所述样品与能够在切口位点处引发DNA合成的酶和未甲基化核苷酸接触,由此产生多个在感兴趣的靶定位点包含未甲基化核苷酸1106的DNA,并且其中DNA序列在5'和3'端连接衔接子。然后使所述样品与能够切割甲基化DNA的酶(例如DpnI)接触1107,由此产生多个包含甲基化DNA的DNA片段,其中包含甲基化DNA的多个DNA片段仅在5'和3'端之一连接衔接子。可将剩余的完整核酸扩增和测序1108。例如,图12显示了根据这个方案进行的实验的结果。凝胶上的第一列显示1kb的梯状条带,第二列显示用Dam甲基转移酶处理然后用DpnI消化的测试DNA,第三列显示用DpnI消化的测试DNA。第二列显示对应于DpnI消化的DNA的条带,而第三列显示对应于未切割的测试DNA的条带。
在方案5的示例性描述中,参考图11-12,所述方法用于捕获感兴趣的靶DNA序列。所述方法涉及首先提供包含多个DNA序列的样品,其中所述DNA序列包含甲基化核苷酸,并且其中所述DNA序列在5'和3'端连接衔接子。所述方法然后涉及首先使所述样品与多个Cas9切口酶-gRNA复合物接触,其中gRNA与所述DNA序列的子集中感兴趣的靶定位点互补,由此产生多个在感兴趣的靶定位点的带切口的DNA,并且其中所述DNA在5'和3'端连接衔接子。然后可以接着使所述样品与能够在切口位点处引发DNA合成的酶和未甲基化核苷酸接触,由此产生多个在感兴趣的靶定位点包含未甲基化核苷酸的DNA,并且其中DNA序列在5'和3'端连接衔接子。然后使所述样品与能够切割甲基化DNA的酶接触,由此产生多个包含甲基化DNA的DNA片段,其中包含甲基化DNA的多个DNA片段仅在5'和3'端之一连接衔接子。
在一个实施方案中,本发明提供了如图13中提供的捕获方法(描绘为方案6)。本方法的目的是从任何来源(例如,文库1302、基因组或PCR)富集核酸1301的区域,正如例如图13中描绘。可以使用两个引导NA 1304和1305将核酸引导的核酸酶-切口酶1303靶向至近端位点,从而在每个位置1306产生核酸切口。或者,可以仅在一侧连接衔接子,随后填充,然后可以在另一侧连接衔接子。两个切口可以彼此接近(例如,在10至15bp内)。可以在非靶分子中产生单切口。由于两个切口位点接近,当反应被加热1307(例如加热至65℃时)可产生双链断裂,从而生成长的(例如10-15bp)3'突出端。这些突出端可以被热稳定的单链DNA/RNA连接酶识别,以允许单链衔接子的位点特异性连接1308。例如,连接酶可以仅识别长的3'突出端,从而确保不会在其他位点连接衔接子。使用核酸引导的核酸酶切口酶和靶向感兴趣区域的另一侧的引导NA,可以重复该过程,接着使用第二单链衔接子如上所述进行连接。一旦两个衔接子已经连接在感兴趣区域的任一侧,可以直接将该区扩增或测序1309。
在方案6的示例性描述中,参考图13,所述方法为从任何DNA来源(例如,文库、基因组或PCR)富集DNA区域。可以使用两个引导RNA将Cas9切口酶靶向至近端位点,并在每个位置产生DNA切口。或者,可以仅在一侧连接衔接子,随后填充,然后可以在另一侧连接衔接子。两个切口可以彼此接近(例如,在10至15bp内)。可以在非靶分子中产生单切口。由于两个切口位点接近,当反应被加热(例如加热至65℃时)可产生双链断裂,从而生成长的(例如10-15bp)3'突出端。这些突出端可以被热稳定的单链DNA/RNA连接酶(如热稳定的5’AppDNA/RNA连接酶)识别,以允许单链衔接子的位点特异性连接。例如,连接酶可以仅识别长的3'突出端,从而确保不会在其他位点连接衔接子。使用Cas9切口酶和靶向感兴趣区域的另一侧的引导RNA,可以重复该过程,接着使用第二单链衔接子如上所述进行连接。一旦两个衔接子已经连接在感兴趣区域的任一侧,可以直接将该区扩增或测序。
在一个实施方案中,本文中提供了富集样品的感兴趣的序列的方法,其包括:(a)提供包含感兴趣的序列和用于耗尽的靶定序列的样品,其中感兴趣的序列构成少于50%的样品;和(b)使所述样品与多个核酸引导的RNA核酸内切酶-gRNA复合物或多个核酸引导的DNA核酸内切酶-gDNA复合物接触,其中所述gRNA和gDNA与所述靶定序列互补。在一些实施方案中,所述靶定序列由此被切割。在一个实施方案中,核酸引导的RNA核酸内切酶是C2c2。在一个实施方案中,C2c2无催化活性。在一个实施方案中,核酸引导的DNA核酸内切酶是NgAgo(来自格氏嗜盐碱杆菌的Argonaute蛋白)。在一个实施方案中,NgAgo无催化活性。
在一个实施方案中,本文中提供了富集样品的方法,其包括:(a)提供包含宿主核酸和非宿主核酸的样品;(b)使所述样品与多个核酸引导的RNA核酸内切酶-gRNA复合物或多个核酸引导的DNA核酸内切酶-gDNA复合物接触,其中gNA与宿主核酸中的靶定位点互补,和(c)富集样品的非宿主核酸。在一个实施方案中,核酸引导的RNA核酸内切酶是C2c2。在一个实施方案中,C2c2无催化活性。在一个实施方案中,核酸引导的DNA核酸内切酶是NgAgo。在一个实施方案中,NgAgo无催化活性。
核酸、样品
本发明的核酸(用于捕获靶向)可以是任何DNA、任何RNA、单链DNA、单链RNA、双链DNA、双链RNA、人工DNA、人工RNA、合成DNA、合成RNA和RNA/DNA杂合物。
本发明的核酸可以是包含基因组区域或整个基因组本身的基因组片段。在一个实施方案中,基因组是DNA基因组。在另一个实施方案中,基因组是RNA基因组。
本发明的核酸可以获自真核生物或原核生物;哺乳动物生物或非哺乳动物生物;动物或植物;细菌或病毒;动物寄生虫;或病原体。
本发明的核酸可以获自任何哺乳动物生物。在一个实施方案中,哺乳动物是人。在另一个实施方案中,哺乳动物是家畜动物,例如马、绵羊、牛、猪或驴。在另一个实施方案中,哺乳动物生物是家养宠物,例如猫、犬、沙鼠、小鼠、大鼠。在另一个实施方案中,哺乳动物是一种类型的猴子。
本发明的核酸可以获自任何鸟类或禽类生物。禽类生物包括但不限于鸡、火鸡、鸭和鹅。
本发明的核酸可以获自植物。在一个实施方案中,所述植物是水稻、玉米、小麦、玫瑰、葡萄、咖啡、水果、番茄、马铃薯或棉花。
在一些实施方案中,本发明的核酸获自细菌物种。在一个实施方案中,细菌是引起结核病的细菌。
在一些实施方案中,本发明的核酸获自病毒。
在一些实施方案中,本发明的核酸获自真菌物种。
在一些实施方案中,本发明的核酸获自藻类物种。
在一些实施方案中,本发明的核酸获自任何哺乳动物寄生虫。
在一些实施方案中,本发明的核酸获自任何哺乳动物寄生虫。在一个实施方案中,寄生虫是蠕虫。在另一个实施方案中,寄生虫是引起疟疾的寄生虫。在另一个实施方案中,寄生虫是引起利什曼病的寄生虫。在另一个实施方案中,寄生虫是变形虫。
在一些实施方案中,病原体是非哺乳动物病原体(在非哺乳动物生物中是致病的)。
在一个实施方案中,本发明的核酸包括在同一样品中作为gNA靶标的核酸和不是gNA靶标的核酸。
在一个实施方案中,本发明的核酸包括在同一样品中作为gRNA靶标的核酸和不是gRNA靶标的核酸。
在一个实施方案中,本发明的核酸包括在同一样品中作为gDNA靶标的核酸和不是gDNA靶标的核酸。
在一个实施方案中,本发明的核酸包括来自样品的靶核酸(gNA的靶标)和感兴趣的核酸(不被gNA靶向)。
在一个实施方案中,本发明的核酸包括来自样品的靶核酸(gRNA的靶标)和感兴趣的核酸(不被gRNA靶向)。
在一个实施方案中,本发明的核酸包括来自样品的靶核酸(gDNA的靶标)和感兴趣的核酸(不被gDNA靶向)。
在一个实施方案中,靶DNA(gNA、gRNA、gDNA的靶标)可以是人类非线粒体DNA(例如基因组DNA),感兴趣的DNA(用于捕获)可以是人类线粒体DNA,并且所述人类线粒体DNA是通过靶向非线粒体人类DNA来富集的。
在一个实施方案中,待捕获的核酸可以是基因组的非可映射区域;并且待保留用于进一步分析/测序/克隆的核酸可以是基因组的可映射区域。在一个实施方案中,待捕获输出的核酸可以是基因组的可映射区域;并且待保留用于进一步分析/测序/克隆的核酸可以是基因组的非可映射区域。非可映射区域的实例包括端粒、着丝粒或其他包含难以映射的特征的基因组区域。
在一个实施方案中,本发明的核酸获自生物样品。从中获得核酸的生物样品包括但不限于全血、血浆、血清、泪液、唾液、粘液、脑脊液、牙齿、骨、指甲、粪便、尿液、组织和活检。生物样品可以包括法医样品,比如牙齿、骨头、指甲等。生物样品可以包括组织、活检,例如切除的肺组织。生物样品可以包括临床样品,其是指在临床环境中比如在医院或诊所中获得的样品。
在一个实施方案中,本发明的核酸获自环境样品,例如获自水、土壤、空气或岩石。
在一个实施方案中,本发明的核酸获自法医样品,例如,获自犯罪现场的个体、获自证据、验尸、作为正在进行的调查的一部分等等的样品。
在一个实施方案中,本发明的核酸提供在文库中。
本发明的核酸是从样品提供的或提取的。
提取可以从标本中提取基本上所有的核酸序列。
本发明的方法可产生99.999:0.001至0.001:99.999之间的任何比率的将被捕获的核酸:将不被捕获的核酸。本发明的方法可产生99.999:0.001至0.001:99.999之间的任何比率的靶向核酸和感兴趣的核酸。本发明的方法可产生99.999:0.001至0.001:99.999之间的任何比率的将被捕获的核酸与将被保留/分析/测序的核酸。在这些实施方案中,所述比率可以等于或落入99.999:0.001至0.001:99.999之间的任何比率,例如所述比率可以是99:1、95:5、90:10、85:15、80:20、75:25、70:30、65:35、60:40、55:45、50:50、45:55、40:60、35:65、30:70、25:75、20:80、15:85、10:90、5:95和1:99。
在捕获后,可以将捕获或保留的核酸序列片段化,以将每个提取的核酸的长度降低到更易控制的长度,以便用于扩增、测序等。
如本文中提供的,可以捕获起始核酸材料的至少10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%。这种捕获可以在不超过10分钟、15分钟、20分钟、30分钟、45分钟、60分钟、75分钟、90分钟、105分钟、120分钟、150分钟、180分钟或240分钟的情况下实现。
在一些情况下,感兴趣的靶定位点占样品中总DNA的少于90%、少于80%、少于70%、少于60%、少于50%、少于40%、少于30%、少于20%或少于10%。
衔接子
如本文中提供的,本发明的核酸(可互换地称为核酸或核酸片段)是衔接子连接的,以帮助实施本文中提供的方法。
本发明的待连接衔接子的核酸的大小范围可以是20bp至5000bp。例如,待连接衔接子的核酸可以具有至少20、25、50、75、100、125、150、175、200、25、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1500、2000、2500、3000、3500、4000、4500或5000个碱基对。在一个具体实施方案中,待连接衔接子的核酸是100bp。在一个具体实施方案中,待连接衔接子的核酸是200bp。在一个具体实施方案中,待连接衔接子的核酸是300bp。在一个具体实施方案中,待连接衔接子的核酸是400bp。在一个具体实施方案中,待连接衔接子的核酸是500bp。
可在5'和3'端将衔接子与每个核酸或核酸片段的各端连接。在其他实施方案中,衔接子可以仅与每个片段的一端连接,或者在其他情况下衔接子可以在随后的步骤中连接。在一个实例中,衔接子是可与双链DNA分子的两条链连接的核酸。在不同的实施方案中,衔接子可以是发夹衔接子,例如一个与其自身碱基配对以形成具有双链茎和环的结构的分子,其中分子的3'和5'端分别与片段的双链DNA分子的5'和3'端连接。或者,衔接子可以是与片段的一端或两端连接的Y衔接子,也称为通用衔接子。或者,衔接子本身可由两个彼此碱基配对的不同寡核苷酸分子组成。另外,衔接子的可连接端可以被设计成与通过限制酶切割形成的突出端相容,或者可以具有平端或5'T突出端。通常,衔接子可以包括双链以及单链分子。因此衔接子可以是DNA或RNA,或者是这两者的混合物。通过RNA酶处理或通过碱水解可切割含有RNA的衔接子。
衔接子的长度可以是10至100bp,但在不偏离本发明的情况下,可以使用在这个范围之外的衔接子。在具体的实施方案中,衔接子的长度为至少10bp、至少15bp、至少20bp、至少25bp、至少30bp、至少35bp、至少40bp、至少45bp、至少50bp、至少55bp、至少60bp、至少65bp、至少70bp、至少75bp、至少80bp、至少85bp、至少90bp或至少95bp。
在进一步的实例中,捕获的核酸序列可以衍生自一个或多个DNA测序文库。衔接子可配置为用于下一代测序平台,例如用于Illumina测序平台或用于IonTorrent平台。
衔接子可含有感兴趣的限制性位点或引物结合位点。
示例性的衔接子包括P5和P7衔接子。
引导核酸(gNA)
本文中提供了引导核酸(gNA),其中gNA与核酸中的靶定位点或感兴趣的序列或不感兴趣的序列(例如来自宿主的基因组DNA)互补(选择性地,可与之杂交)。gNA将核酸引导的核酸酶引导至核酸上的特定位点。
在一些实施方案中,gNA是引导RNA(gRNA);在其他实施方案中,gNA是指导性DNA(gDNA)。在一些实施方案中,gNA包括gRNA和gDNA的混合物。
gNA所针对的宿主可以是动物,例如人、牛、马、绵羊、猪、猴、犬、猫、沙鼠、鸟、小鼠或大鼠。宿主可以是植物。非宿主可以是原核生物、真核生物、病毒、细菌、真菌和原生动物。
在一个实施方案中,本发明提供了引导核酸(gNA)文库,其包含gNA的集合,所述gNA被配置为与靶向捕获的核酸序列杂交。在另一个实施方案中,本发明提供了引导NA文库,其包含gNA的集合,所述gNA被配置为与未靶向捕获的核酸序列杂交。
在一个实施方案中,本发明提供了引导RNA文库,其包含gRNA的集合,所述gRNA被配置为与靶向捕获的核酸序列杂交。在另一个实施方案中,本发明提供了引导RNA文库,其包含gRNA的集合,所述gRNA被配置为与未靶向捕获的核酸序列杂交。
在一个实施方案中,本发明提供了引导DNA文库,其包含gDNA的集合,所述gDNA被配置为与靶向捕获的核酸序列杂交。在另一个实施方案中,本发明提供了引导DNA文库,其包含gDNA的集合,所述gDNA被配置为与未靶向捕获的核酸序列杂交。
在一个实施方案中,gNA对样品中的靶核酸具有选择性,但对来自所述样品的感兴趣的序列没有选择性。
在一个实施方案中,gNA用于连续捕获核酸序列。
在一些实施方案中,gNA对靶核酸序列具有选择性,所述靶核酸序列之后是可被核酸引导的核酸酶结合的原型间隔序列毗邻基序(Protospacer Adjacent Motif,PAM)序列。在一些实施方案中,gNA的序列由核酸引导的核酸酶的类型决定。在不同的实施方案中,可以针对不同的核酸引导的核酸酶类型来定制gNA,因为PAM序列可以根据从中衍生核酸引导的核酸酶的生物的物种而变化。
本发明的gNA(gRNA或gDNA)的大小范围可以是50-200个碱基对。例如,本发明的gNA可以是至少50bp、55bp、60bp、65bp、70bp、75bp、80bp、85bp、90bp、95bp、100bp、110bp、120bp、125bp、130bp、140bp、150bp、160bp、170bp、175bp、180bp、190bp或195bp。在具体的实施方案中,gNA是80bp、90bp、100bp或110bp。在一些实施方案中,包含碱基对序列的靶特异性gNA可以与靶核酸中的预定义位点互补,所述位点之后是可以被衍生自细菌物种的核酸引导的核酸酶蛋白(例如Cas9)结合的原型间隔序列毗邻基序(PAM)序列。在具体的实施方案中,与靶核酸中的预定义位点互补的gNA的碱基对序列具有15、16、17、18、19、20、25、30、35、40、45或50个碱基对。
本发明还提供了gNA文库(例如gRNA文库或gDNA文库)。gNA文库可以包含许多不同的物种特异性引导NA(例如gRNA或gDNA)元件,所述元件各自被配置为与靶向捕获的核酸序列、感兴趣的核酸序列或不感兴趣的核酸序列杂交(选择性地)。每个gNA包括靶特异性引导序列和形成为与核酸引导的核酸酶蛋白结合的茎环结合位点。在一些实施方案中,所述文库可以包含多个不同的引导NA,每个引导NA具有不同的15-30个碱基对序列,所述序列与被靶向的核酸中的不同预定义位点互补,随后是可以被核酸引导的核酸酶蛋白结合的适当的PAM序列。对于每个引导NA,PAM序列在感兴趣的核酸的预定义的DNA或RNA靶序列中存在,但在相应的靶特异性引导序列中不存在。
通常根据本发明,感兴趣基因组中的任何核酸序列(具有预定义靶序列然后是适当的PAM序列)可以被引导NA文库中提供的相应引导RNA杂交并且与核酸引导的核酸酶结合。在不同的实施方案中,可以针对不同的核酸引导的核酸酶类型来定制gNA文库,因为PAM序列可以根据从中衍生核酸引导的核酸酶的细菌的物种而变化。但是在一些变型中,在预定义的靶序列之后没有PAM序列。
在gNA中可以生成不同的靶特异性序列。这可以通过使用噬菌体RNA聚合酶的启动子来完成,所述噬菌体RNA聚合酶例如来自噬菌体T3、T7、SP6等的RNA聚合酶。因此,每种不同的T7RNA聚合酶启动子提供适合与不同靶核酸序列杂交的不同靶特异性序列。可用于退火和随后的PCR反应的非限制性示例性正向引物组列于下文提供的表1中。
可以扩增gNA文库(例如gRNA或gDNA文库),以包括每个不同的引导NA元件的大量拷贝以及可能适合于期望的捕获结果的大量不同的引导NA元件。在给定的引导NA文库中,独特的引导NA元件的数目的范围可以是从1个独特的引导NA元件到多达300,000,000个独特的引导NA元件,或者对于人基因组中的每10个碱基对约1个独特的引导NA序列。独特的gNA(例如,gRNA或gDNA)的数目可以是至少约101、102、103、104、105、106、107或108个独特的gNA。独特的gNA的数目可以产生该数量的独特的核酸引导的核酸酶-gNA复合物(例如CRISPR/Cas系统蛋白-gRNA复合物)。
不受理论的限制,如果gNA显示约100%效力,则可以计算出达到>95%靶核酸切割的gNA之间的距离:这可以通过测量文库大小的分布并确定均值、N和标准偏差SD来计算;对于>文库的95%,N-2SD=最小尺寸,从而确保该大小的每个片段有一个引导NA,以确保>95%的捕获。这也可以被描述为引导NA之间的最大距离=文库大小的均值–2x(文库大小的标准偏差)。
在本发明的不同实施方案中,gNA可以是对感兴趣的不同靶定位点特异的,所述靶定位点包括但不限于单核苷酸多态性(SNP)、短串联重复(STR)、癌基因、插入物、删除、结构变异、外显子、基因突变和调控区。
核酸引导的核酸酶
本文中提供了从样品中捕获核酸的组合物和方法。这些组合物和方法利用核酸引导的核酸酶。如本文中使用的,“核酸引导的核酸酶”是切割DNA、RNA或DNA/RNA杂合物并且利用一个或多个核酸引导核酸(gNA)来赋予特异性的任何核酸内切酶。核酸引导的核酸酶包括CRISPR/Cas系统蛋白以及非CRISPR/Cas系统蛋白。
本文中提供的核酸引导的核酸酶可以是DNA引导的DNA核酸内切酶;DNA引导的RNA核酸内切酶;RNA引导的DNA核酸内切酶;或RNA引导的RNA核酸内切酶。
在一个实施方案中,所述核酸引导的核酸酶是核酸引导的DNA核酸内切酶。
在一个实施方案中,所述核酸引导的核酸酶是核酸引导的RNA核酸内切酶。
CRISPR/Cas系统核酸引导的核酸酶
在一些实施方案中,在本文中提供的实施方案中使用CRISPR/Cas系统蛋白。在一些实施方案中,CRISPR/Cas系统蛋白包括来自CRISPR I型系统、CRISPR II型系统和CRISPRIII型系统的蛋白质。
在一些实施方案中,CRISPR/Cas系统蛋白可以来自任何细菌或古细菌物种。
在一些实施方案中,CRISPR/Cas系统蛋白是分离的、重组产生的或合成的。
在一些实施方案中,CRIPR/Cas系统蛋白来自或衍生自来自如下微生物的CRISPR/Cas系统蛋白:酿脓链球菌(Streptococcus pyogenes)、金黄色葡萄球菌(Staphylococcusaureus)、脑膜炎奈瑟球菌(Neisseria meningitidis)、嗜热链球菌(Streptococcusthermophiles)、齿垢密螺旋体(Treponema denticola)、土拉热弗朗西丝菌(Francisellatularensis)、多杀巴斯德菌(Pasteurella multocida)、空肠弯曲杆菌(Campylobacterjejuni)、红嘴鸥弯曲杆菌(Campylobacter lari)、鸡毒支原体(Mycoplasmagallisepticum)、Nitratifractor salsuginis、食清洁剂细小棒菌(Parvibaculumlavamentivorans)、肠道罗斯拜瑞氏菌(Roseburia intestinalis)、灰色奈瑟球菌(Neisseria cinerea)、重氮营养葡糖酸醋杆菌(Gluconacetobacter diazotrophicus)、固氮螺菌属(Azospirillum)、Sphaerochaeta globus、柱状黄杆菌(Flavobacteriumcolumnare)、Fluviicola taffensis、嗜粪拟杆菌(Bacteroides coprophilus)、运动支原体(Mycoplasma mobile)、香肠乳杆菌(Lactobacillus farciminis)、巴氏链球菌(Streptococcus pasteurianus)、约氏乳杆菌(Lactobacillus johnsonii)、假中间葡萄球菌(Staphylococcus pseudintermedius)、龈沟产线菌(Filifactor alocis)、嗜肺军团菌(Legionella pneumophila)、华德萨特菌(Suterella wadsworthensis)、或白喉棒状杆菌(Corynebacter diphtheria)。
在一些实施方案中,CRISPR/Cas系统蛋白的实例可以是天然存在的或工程改造的形式。
在一些实施方案中,天然存在的CRISPR/Cas系统蛋白可以属于CAS I类I型、III型或IV型,或CAS II类II型或V型,并且可以包括Cas9、Cas3、Cas8a-c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2、Cmr5、Csf1、C2c2和Cpf1。
在示例性实施方案中,CRISPR/Cas系统蛋白包括Cas9。
“CRISPR/Cas系统蛋白-gNA复合物”是指包含CRISPR/Cas系统蛋白和引导NA(例如gRNA或gDNA)的复合物。在gNA是gRNA的情况下,gRNA可以由两个分子组成,即一个与靶标杂交并提供序列特异性的RNA(“crRNA”),以及一个能够与crRNA杂交的RNA(“tracrRNA”)。或者,引导RNA可以是含有crRNA和tracrRNA序列的单个分子(即,gRNA)。
CRISPR/Cas系统蛋白可以与野生型CRISPR/Cas系统蛋白至少60%相同(例如至少70%、至少80%或90%相同,至少95%相同或至少98%相同或至少99%相同)。CRISPR/Cas系统蛋白可能具有野生型CRISPR/Cas系统蛋白的所有功能,或仅具有其一种或一些功能,包括结合活性、核酸酶活性和核酸酶活性。
术语“CRISPR/Cas系统蛋白相关引导NA”是引导NA。CRISPR/Cas系统蛋白相关引导NA可以作为分离的NA存在,或作为CRISPR/Cas系统蛋白-gnA复合物的一部分存在。
Cas9
在一些实施方案中,CRISPR/Cas系统蛋白核酸引导的核酸酶是或包括Cas9。可以分离、重组产生或合成本发明的Cas9。
可以在本文中的实施方案中使用的Cas9蛋白的实例可发现于F.A.Ran,L.Cong,W.X.Yan,D.A.Scott,J.S.Gootenberg,A.J.Kriz,B.Zetsche,O.Shalem,X.Wu,K.S.Makarova,E.V.Koonin,P.A.Sharp,and F.Zhang;“In vivo genome editing usingStaphylococcus aureus Cas9,”Nature 520,186–191(09April 2015)doi:10.1038/nature14299,将该文献通过提述并入本文。
在一些实施方案中,Cas9是衍生自如下微生物的II型CRISPR系统:酿脓链球菌、金黄色葡萄球菌、脑膜炎奈瑟球菌、嗜热链球菌、齿垢密螺旋体、土拉热弗朗西丝菌、多杀巴斯德菌、空肠弯曲杆菌、红嘴鸥弯曲杆菌、鸡毒支原体、Nitratifractor salsuginis、食清洁剂细小棒菌、肠道罗斯拜瑞氏菌、灰色奈瑟球菌、重氮营养葡糖酸醋杆菌、固氮螺菌属、Sphaerochaeta globus、柱状黄杆菌、Fluviicola taffensis、嗜粪拟杆菌、运动支原体、香肠乳杆菌、巴氏链球菌、约氏乳杆菌、假中间葡萄球菌、龈沟产线菌、嗜肺军团菌、华德萨特菌、或白喉棒状杆菌。
在一些实施方案中,Cas9是衍生自酿脓链球菌的II型CRISPR系统,并且PAM序列是位于靶特异性引导序列的3'端附近的NGG。来自示例性细菌物种的II型CRISPR系统的PAM序列还可以包括:酿脓链球菌(NGG)、金黄色葡萄球菌(NNGRRT)、脑膜炎奈瑟球菌(NNNNGATT)、嗜热链球菌(NNAGAA)和齿垢密螺旋体(NAAAAC),在不偏离本发明的情况下,都可以使用。
在一个示例性实施方案中,可以从例如pX330质粒(可从Addgene获得)获得Cas9序列,通过PCR再扩增,然后克隆到pET30(来自EMD biosciences)中以便在细菌中表达并纯化重组的带6His标签的蛋白。
“Cas9-gNA复合物”是指包含Cas9蛋白和引导NA的复合物。Cas9蛋白可以与野生型Cas9蛋白例如与酿脓链球菌Cas9蛋白至少60%相同(例如至少70%、至少80%或90%相同,至少95%相同或至少98%相同或至少99%相同)。Cas9蛋白可能具有野生型Cas9蛋白的所有功能,或仅具有其一种或一些功能,包括结合活性、核酸酶活性和核酸酶活性。
术语“Cas9相关引导NA”是指如上所述的引导NA。Cas9相关引导NA可以是分离的,或作为Cas9-gNA复合物的一部分存在。
非CRISPR/Cas系统核酸引导的核酸酶
在一些实施方案中,在本文中提供的实施方案中使用非CRISPR/Cas系统蛋白。
在一些实施方案中,非CRISPR/Cas系统蛋白可以来自任何细菌或古细菌物种。
在一些实施方案中,非CRISPR/Cas系统蛋白是分离的、重组产生的或合成的。
在一些实施方案中,非CRISPR/Cas系统蛋白来自或衍生自来自如下微生物:超嗜热菌(Aquifex aeolicus)、嗜热栖热菌(Thermus thermophilus)、酿脓链球菌、金黄色葡萄球菌、脑膜炎奈瑟球菌、嗜热链球菌、齿垢密螺旋体、土拉热弗朗西丝菌、多杀巴斯德菌、空肠弯曲杆菌、红嘴鸥弯曲杆菌、鸡毒支原体、Nitratifractor salsuginis、食清洁剂细小棒菌、肠道罗斯拜瑞氏菌、灰色奈瑟球菌、重氮营养葡糖酸醋杆菌、固氮螺菌属、Sphaerochaeta globus、柱状黄杆菌、Fluviicola taffensis、嗜粪拟杆菌、运动支原体、香肠乳杆菌、巴氏链球菌、约氏乳杆菌、假中间葡萄球菌、龈沟产线菌、嗜肺军团菌、华德萨特菌、格氏嗜盐碱杆菌(Natronobacterium gregoryi)、或白喉棒状杆菌。
在一些实施方案中,非CRISPR/Cas系统蛋白可以是天然存在的或工程改造的形式。
在一些实施方案中,天然存在的非CRISPR/Cas系统蛋白是NgAgo(来自格氏嗜盐碱杆菌的Argonaute蛋白)。
“非CRISPR/Cas系统蛋白-gNA复合物”是指包含非CRISPR/Cas系统蛋白和引导NA(例如gRNA或gDNA)的复合物。在gNA是gRNA的情况下,gRNA可以由两个分子组成,即一个与靶标杂交并提供序列特异性的RNA(“crRNA”),以及一个能够与crRNA杂交的RNA(“tracrRNA”)。或者,引导RNA可以是含有crRNA和tracrRNA序列的单个分子(即,gRNA)。
非CRISPR/Cas系统蛋白可以与野生型非CRISPR/Cas系统蛋白至少60%相同(例如至少70%、至少80%或90%相同,至少95%相同或至少98%相同或至少99%相同)。非CRISPR/Cas系统蛋白可能具有野生型非CRISPR/Cas系统蛋白的所有功能,或仅具有其一种或一些功能,包括结合活性、核酸酶活性和核酸酶活性。
术语“非CRISPR/Cas系统蛋白相关引导NA”是引导NA。非CRISPR/Cas系统蛋白相关引导NA可以作为分离的NA存在,或作为非CRISPR/Cas系统蛋白-gNA复合物的一部分存在。
无催化活性的核酸引导的核酸酶
在一些实施方案中,核酸引导的核酸酶的工程改造实例包括无催化活性的核酸引导的核酸酶(CRISPR/Cas系统核酸引导的核酸酶或非CRISPR/Cas系统核酸引导的核酸酶)。术语“无催化活性”通常是指具有失活的核酸酶(例如失活的HNH和RuvC核酸酶)的核酸引导的核酸酶。这样的蛋白质可以与任何核酸中的靶位点结合(其中靶位点由引导NA决定),但所述蛋白质不能切割核酸或产生核酸切口。
因此,无催化活性的核酸引导的核酸酶允许将混合物分离成未结合的核酸和无催化活性的核酸引导的核酸酶结合片段。例如,分别在方案3和4的图9和图10中描绘了无活性的核酸引导的核酸酶的用途。在一个示例性实施方案中,dCas9/gRNA复合物与由gRNA序列决定的靶标结合。结合的dCas9可防止在其他操作继续时被Cas9切割,如图10的图片所示。
在另一个实施方案中,无催化活性的核酸引导的核酸酶可以与另一种酶比如转座酶融合,以便将该酶的活性靶向至特定位点。
在一个实施方案中,无催化活性的核酸引导的核酸酶是dCas9、dCpf1、dCas3、dCas8a-c、dCas10、dCse1、dCsy1、dCsn2、dCas4、dCsm2、dCm5、dCsf1、dC2C2、或dNgAgo。
在一个示例性实施方案中,无催化活性的核酸引导的核酸酶蛋白是dCas9。
核酸引导的核酸酶切口酶
在一些实施方案中,核酸引导的核酸酶的工程改造实例包括核酸引导的核酸酶切口酶(可互换地称为切口酶核酸引导的核酸酶)。
在一些实施方案中,核酸引导的核酸酶的工程改造实例包括含有单一无活性催化结构域的CRISPR/Cas系统切口酶或非CRISPR/Cas系统切口酶。
在一些实施方案中,所述核酸引导的核酸酶切口酶是Cas9切口酶、Cpf1切口酶、Cas3切口酶、Cas8a-c切口酶、Cas10切口酶、Cse1切口酶、Csy1切口酶、Csn2切口酶、Cas4切口酶、Csm2切口酶、Cm5切口酶、Csf1切口酶、C2C2切口酶或NgAgo切口酶。
在一个实施方案中,核酸引导的核酸酶切口酶是Cas9切口酶。
在一些实施方案中,可以使用核酸引导的核酸酶切口酶与靶序列结合。在仅具有一个活性核酸酶结构域时,所述核酸引导的核酸酶切口酶仅切割靶DNA的一条链,从而产生单链断裂或“切口”。取决于使用哪种突变体,可以切割引导NA-杂交链或非杂交链。与靶向相反链的2个gNA结合的核酸引导的核酸酶切口酶可以在核酸中产生双链断裂。这种“双切口酶”策略增加了切割的特异性,因为它需要两个核酸引导的核酸酶/gNA复合物在双链断裂形成之前在一个位点特异性地结合。
在示例性实施方案中,可以使用Cas9切口酶与靶序列结合。术语“Cas9切口酶”是指含有单个无活性的催化结构域,即RuvC-或HNH-结构域的Cas9蛋白的修饰形式。在仅具有一个活性核酸酶结构域时,所述Cas9切口酶仅切割靶DNA的一条链,从而产生单链断裂或“切口”。取决于使用哪种突变体,可以切割引导RNA-杂交链或非杂交链。与靶向相反链的2个gRNA结合的Cas9切口酶将在DNA中产生双链断裂。这种“双切口酶”策略可以增加切割的特异性,因为它需要两个Cas9/gRNA复合物在双链断裂形成之前在一个位点特异性地结合。
可以使用核酸引导的核酸酶切口酶进行DNA的捕获。这分别展示在方案2和5的图6和图11中。在一个示例性实施方案中,如图6和图11中的图片所示,核酸引导的核酸酶切口酶切割双链核酸的单链,其中双链区域包含甲基化核苷酸。
可离解的热稳定的核酸引导的核酸酶
在一些实施方案中,在本文提供的方法中使用热稳定的核酸引导的核酸酶(热稳定的CRISPR/Cas系统核酸引导的核酸酶或热稳定的非CRISPR/Cas系统核酸引导的核酸酶)。在这样的实施方案中,将反应温度升高,从而诱导蛋白质解离;将反应温度降低,从而允许产生另外的切割靶序列。在一些实施方案中,当维持在至少75℃持续至少1分钟时,热稳定的核酸引导的核酸酶保持至少50%活性、至少55%活性、至少60%活性、至少65%活性、至少70%活性、至少75%活性、至少80%活性、至少85%活性、至少90%活性、至少95%活性、至少96%活性、至少97%活性、至少98%活性、至少99%活性或100%活性。在一些实施方案中,当至少在75℃、至少在80℃、至少在85℃、至少在90℃、至少在91℃、至少在92℃、至少在93℃、至少在94℃、至少在95℃、至少在96℃、至少在97℃、至少在98℃、至少在99℃或至少在100℃维持至少1分钟时,热稳定的核酸引导的核酸酶保持至少50%活性。在一些实施方案中,当在至少75℃维持至少1分钟、2分钟、3分钟、4分钟或5分钟时,热稳定的核酸引导的核酸酶保持至少50%活性。在一些实施方案中,当温度升高、降低至25℃-50℃时,热稳定的核酸引导的核酸酶保持至少50%的活性。在一些实施方案中,温度降低至25℃、至30℃、至35℃、至40℃、至45℃或至50℃。在一个示例性实施方案中,热稳定的酶在95℃1分钟后保留至少90%活性。
在一些实施方案中,热稳定的核酸引导的核酸酶是热稳定的Cas9、热稳定的Cpf1、热稳定的Cas3、热稳定的Cas8a-c、热稳定的Cas10、热稳定的Cse1、热稳定的Csy1、热稳定的Csn2、热稳定的Cas4、热稳定的Csm2、热稳定的Cm5、热稳定的Csf1、热稳定的C2C2或热稳定的NgAgo。
在一些实施方案中,热稳定的CRISPR/Cas系统蛋白是热稳定的Cas9。
可以分离热稳定的核酸引导的核酸酶,例如,通过嗜热菌嗜热链球菌和激烈火球菌的基因组中的序列同源性加以鉴定。然后可以将核酸引导的核酸酶基因克隆到表达载体中。在一个示例性实施方案中,分离热稳定的Cas9蛋白。
在另一个实施方案中,可以通过非热稳定的核酸引导的核酸酶的体外进化获得热稳定的核酸引导的核酸酶。可以诱变核酸引导的核酸酶的序列以改善其热稳定性。
本发明的示例性组合物
在一个实施方案中,本文中提供了包含核酸片段、切口酶核酸引导的核酸酶-gNA复合物和经标记核苷酸的组合物。在一个示例性实施方案中,本文中提供了包含核酸片段、切口酶Cas9-gRNA复合物和经标记核苷酸的组合物。在这样的实施方案中,核酸可以包括DNA。可以例如用生物素标记核苷酸。核苷酸可以是抗体-缀合物对的一部分。
在一个实施方案中,本文中提供了包含核酸片段和无催化活性的核酸引导的核酸酶-gNA复合物的组合物,其中所述无催化活性的核酸引导的核酸酶与转座酶融合。在一个示例性实施方案中,本文中提供了包含DNA片段和dCas9-gRNA复合物的组合物,其中dCas9与转座酶融合。
在一个实施方案中,本文中提供了包含含有甲基化核苷酸的核酸片段、切口酶核酸引导的核酸酶-gNA复合物和未甲基化核苷酸的组合物。在一个示例性实施方案中,本文中提供了包含含有甲基化核苷酸的DNA片段、切口酶Cas9-gRNA复合物和未甲基化核苷酸的组合物。
在一个实施方案中,本文中提供了与核酸引导的DNA核酸内切酶复合的gDNA。在一个示例性实施方案中,核酸引导的DNA核酸内切酶是NgAgo。
在一个实施方案中,本文中提供了与核酸引导的RNA核酸内切酶复合的gDNA。
在一个实施方案中,本文中提供了与核酸引导的DNA核酸内切酶复合的gRNA。
在一个实施方案中,本文中提供了与核酸引导的RNA核酸内切酶复合的gRNA。在一个实施方案中,核酸引导的RNA核酸内切酶包括C2c2。
试剂盒和制品
本申请提供了包含本文所述的任何一种或多种组合物的试剂盒,包括但不限于衔接子、gNA、gDNA、gRNA、gNA文库、gRNA文库、gDNA文库、核酸引导的核酸酶、无催化活性的核酸引导的核酸酶、切口酶核酸引导的核酸酶、CRISPR/Cas系统蛋白、切口酶CRISPR/Cas系统蛋白、无催化活性的CRISPR/Cas系统蛋白、Cas9、dCas9、Cas9切口酶、甲基化核苷酸、经标记核苷酸、生物素化核苷酸、亲合素、链霉亲合素、能够在切口位点处引发核酸合成的酶、DNA聚合酶I、TAQ聚合酶、bst DNA聚合酶、能够切割甲基化核苷酸的酶、Dpn1酶、和能够甲基化DNA的酶,例如Dam/Dcm1甲基转移酶)。
在一个实施方案中,试剂盒包含gNA的集合或文库,其中gNA靶向至人基因组DNA序列,例如感兴趣的特定基因(例如癌基因)SNP、STR。在另一个示例性实施方案中,试剂盒包含gNA的集合或文库,其中gNA靶向至非人类哺乳动物DNA序列。在另一个示例性实施方案中,试剂盒包含gNA的集合或文库,其中gNA靶向至人核糖体RNA序列。在另一个示例性实施方案中,试剂盒包含gNA的集合或文库,其中gNA靶向至人线粒体DNA序列。
在一个示例性实施方案中,试剂盒包含gRNA的集合或文库,其中gRNA靶向至人基因组DNA序列,例如感兴趣的特定基因(例如癌基因)SNP、STR。在另一个示例性实施方案中,试剂盒包含gRNA的集合或文库,其中gRNA靶向至非人类哺乳动物DNA序列。在另一个示例性实施方案中,试剂盒包含gRNA的集合或文库,其中gRNA靶向至人核糖体RNA序列。在另一个示例性实施方案中,试剂盒包含gRNA的集合或文库,其中gRNA靶向至人线粒体DNA序列。
本申请还提供了包含本文所述的任何一种试剂盒的制品。
制品的实例包括小瓶(包括密封的小瓶)。
下面的实施例是为了说明的目的而被包括在内,并非意在限制本发明的范围。
实施例
实施例1:从全人基因组DNA捕获线粒体DNA(DNA捕获方案1)
概述
该方法的目的是从人基因组DNA文库中捕获线粒体DNA,如图1描绘。进行人组织标本的DNA提取方案,产生包含>99%人DNA和<1%靶序列的DNA样品。对DNA样品进行测序文库构建方案,产生包含测序索引衔接子的核酸文库。为了产生靶特异性引导RNA(gRNA)文库,使各自包含T7RNA聚合酶启动子、人特异性20碱基对区域和用于Cas9的茎环结合位点的靶特异性gRNA前体的文库经受体外转录,从而产生靶特异性引导RNA文库。然后使靶特异性引导RNA文库与Cas9蛋白组合以产生Cas9-gRNA复合物文库。然后使Cas9-gRNA复合物与核酸文库组合,使得Cas9切割匹配的靶DNA序列并留下其他DNA未切割。加入第二衔接子并使其特异性地与切割的DNA的5'磷酸化平端连接。然后使用第一和第二衔接子利用PCR特异性地进行扩增。
线粒体DNA构成人基因组总DNA的约0.1%-0.2%。为了测试Cas9对DNA的精确的位点特异性切割,然后连接衔接子,参考图2,在第一位置202或第二位置203用Cas9切割测试DNA(例如质粒)201,从而产生第一产物204或第二产物205(参见例如图2)。将衔接子连接206到新提供的DNA平端中。针对AUK-F/P7或MB1OriR/P7进行PCR扩增,每个反应产生两个独立的产物。如果切割第一位置,那么产物大小为212和1.9k;如果切割第二位置,那么产物大小为359和1.75k。通过测序进行验证。
结果显示,Cas9切割之后连接衔接子允许特异性扩增靶DNA(参见例如图3);扩增的DNA的测序显示,衔接子的连接仅发生在引导RNA所指定的位置(参见例如图4)。
然后从主要含有人核DNA的混合物富集线粒体DNA。使用25个对线粒体DNA特异的引导RNA,然后用Cas9切割并与衔接子连接,随后进行扩增。如图5所见,两个单独的反应允许扩增线粒体DNA,而没有引导RNA的反应未扩增任何DNA,因而表明所述方法有效扩增了在任何给定文库中代表性不足的DNA。
DNA文库的制备
通过使用平端修复试剂盒(NEB)在25℃进行500ng片段化的人基因组DNA的末端修复20分钟(ds DNA片段化酶,NEB,在37℃处理1小时),产生人基因组DNA文库。然后使反应在75℃热灭活20分钟,冷却至25℃,随后使用T4DNA连接酶(NEB)在25℃与15皮摩尔的P5/Myc衔接子连接2小时。使用NGS清洁试剂盒(Life Technologies)去除衔接子二聚体。
Cas9的表达
将Cas9(来自酿脓链球菌)克隆到pET30表达载体(EMD biosciences)中以将六组氨酸标签紧邻Cas9起始密码子的上游插入。将所得质粒转化到Rosetta(DE3)BL21细菌菌株(EMD biosciences)中并在剧烈通气下在1L LB培养基中培养,直到培养物的光密度(在600nm的OD)达到0.4时为止。将温度降低至25℃,加入0.2mM IPTG,将培养物再培养四小时。然后通过离心(在4℃ 1,000xg下持续20分钟)收获细胞,重悬于10ml结合缓冲液(20mMTris pH8、0.5M NaCl、5mM咪唑、0.05%NP40)中,并通过超声处理(在30%功率下爆裂7x10秒,Sonifier 250,Branson)进行裂解。在10,000xg下离心20分钟除去不溶性细胞碎片;然后将含有可溶蛋白的上清液与0.4ml NTA珠(Qiagen)混合并上样到柱上。用4ml结合缓冲液将珠子洗涤三次,然后用3x 0.5ml补充有250mM咪唑的结合缓冲液洗脱。然后浓缩洗脱的级分,并使用30,000MWCO蛋白浓缩器(Life Technologies)用储存缓冲液(10mM Tris pH8、0.3M NaCl,0.1mM EDTA、1mM DTT、50%甘油)进行缓冲液交换,通过SDS PAGE进行验证,接着通过胶体蓝染色(Life Technologies)定量,然后在-20℃储存备用。
可以使用用于产生如上的Cas9的相同程序来产生和纯化突变体Cas9切口酶,其为酿脓链球菌Cas9的D10A突变体。
gRNA1和gRNA2的制备
订购合成了(IDT)三个寡核苷酸:T7-引导RNA1和RNA2(5’至3’方向的序列GCCTCGAGCTAATACGACTCACTATAGGGATTTATACAGCACTTTAA和GCCTCGAGCTAATACGACTCACTATAGGGTCTTTTTGGTCCTCGAAG)以及stlgR(序列GT TTT AGA GCT AGA AAT AGC AAG TTA AAA TAA GGCTAG TCC GTT ATC AAC TTG AAA AAG TGG CAC CGA GTC GGT GCT TTT TTT GGA TCC GATGC)。根据制造商的说明书,依次地使用T4PNK(New England Biolabs)将stlgR寡核苷酸(300皮摩尔)5'磷酸化,然后使用5'腺苷酸化试剂盒(New England Biolabs)进行5'腺苷酸化。然后使用热稳定的5’App DNA/RNA连接酶(New England Biolabs)在65℃将T7-引导RNA寡核苷酸(5皮摩尔)和5'腺苷酸化的stlgR(10皮摩尔)连接1小时。连接反应在90℃热灭活5分钟,然后通过PCR(使用OneTaq,New England Biolabs,如下30个循环:95℃ 30秒,57℃20秒,72℃,20秒)进行扩增,其中引物为ForT7(序列GCC TCG AGC TAA TAC GAC TCA C)和gRU(序列AAAAAAAGCACCGACTCGGTG)。使用PCR清洁试剂盒(Life Technologies)纯化PCR产物,并通过琼脂糖凝胶电泳和测序进行验证。然后将验证的产物用作体外转录的模板。
引导RNA文库的制备
订购合成了(IDT)T7-引导RNA寡核苷酸(表1)和单独的寡核苷酸stlgR(序列GTTTT AGA GCT AGA AAT AGC AAG TTA AAA TAA GGC TAG TCC GTT ATC AAC TTG AAA AAGTGG CAC CGA GTC GGT GCT TTT TTT GGA TCC GAT GC)。
根据制造商的说明书,依次地使用T4PNK(New England Biolabs)将stlgR寡核苷酸(300皮摩尔)5'磷酸化,然后使用5'腺苷酸化试剂盒(New England Biolabs)进行5'腺苷酸化。然后使用热稳定的5’App DNA/RNA连接酶(New England Biolabs)在65℃将T7-引导RNA寡核苷酸(5皮摩尔)和5'腺苷酸化的stlgR(10皮摩尔)连接1小时。连接反应在90℃热灭活5分钟,然后通过PCR(使用OneTaq,New England Biolabs,如下30个循环:95℃ 30秒,57℃ 20秒,72℃,20秒)进行扩增,其中引物为ForT7(序列GCC TCG AGC TAA TAC GAC TCA C)和gRU(序列AAAAAAAGCACCGACTCGGTG)。使用PCR清洁试剂盒(Life Technologies)纯化PCR产物,并通过琼脂糖凝胶电泳和测序进行验证。然后将验证的产物用作体外转录的模板。
Figure BDA0001615012230000381
Figure BDA0001615012230000391
体外转录
然后使用HiScribe T7转录试剂盒(New England Biolabs)将验证的产物用作体外转录反应的模板。根据制造商的说明书,将500-1000ng模板在37℃温育过夜。为了将引导文库转录成引导RNA,我们装配了以下体外转录反应混合物:10μl纯化的文库(约500ng)、6.5μl的H2O、2.25μl的ATP、2.25μl的CTP、2.25μl的GTP、2.25μl的UTP、2.25μl 10x反应缓冲液(NEB)和2.25μl的T7RNA聚合酶混合物。将反应物在37℃下温育24小时,然后使用RNA清洁试剂盒(Life Technologies)纯化,洗脱到100μl不含RNA酶的水中,定量并在-20℃保存直到使用。
DNA特异性Cas9介导的片段化
为了切割测试DNA,将测试引导RNA 1和2分开使用。为了从人类基因组DNA文库中切割和富集线粒体DNA,使用了引导RNA系列1和2。将稀释的引导RNA(1μl,相当于2皮摩尔)与3μl 10x Cas9反应缓冲液(NEB)、20μl H2O和1μl重组Cas9酶(NEB,1皮摩尔/μl)合并。使用相同参数,独立进行使用靶向以下序列(5’-GGATTTATACAGCACTTTAA-3’)的对照引导RNA的对照反应。这个序列在人染色体或线粒体DNA中都不存在。将反应物在37℃温育15分钟,然后补充5μl稀释的DNA文库(50pg/μl),在37℃继续温育90分钟。通过添加1:100稀释的RNA酶A(Thermo Fisher Scientific)终止反应,然后使用PCR清洁试剂盒(LifeTechnologies)纯化DNA,在30μl 10mM Tris-Cl pH 8中洗脱。然后将反应物在-20℃储存直到使用。
衔接子的连接和PCR分析
对于测试DNA,将Cas9消化后的反应物与15皮摩尔的P5/P7衔接子和T4DNA连接酶(NEB)一起在25℃温育1小时。然后将连接物用作PCR的模板,其中PCR使用TestDNA-F引物(序列ATGCCGCAGCACTTGG)和P5引物(序列AATGATACGGCGACCACCGA)。通过使用TestDNA-F引物(ElimBio)测序的琼脂糖凝胶电泳证实成功的PCR产物,以便表明切割和连接发生在靶DNA序列。
连接在旧末端的衔接子的消除
为了富集线粒体DNA,在Cas9消化后,将反应物与15皮摩尔的Flag5/P7衔接子和T4DNA连接酶(NEB)在25℃温育1小时。可以采用多种分子生物学方法在来自原始文库的旧P5和P7衔接子的末端处消除衔接子的连接,例如用酶处理。然后将反应物用作PCR的模板,其中PCR使用P7(序列CAAGCAGAAGACGGCATACGA)和P5引物(序列AATGATACGGCGACCACCGA)。通过琼脂糖凝胶电泳证实成功的PCR产物。
实施例2:使用Cas9切口酶加以标记,然后从DNA混合物中纯化测试DNA(DNA捕获方案2)
概述
该方法的目的是从人基因组DNA文库中捕获感兴趣的区域(例如,SNP,STR等),正如例如在图6中描绘。为了应用这个方案,将含有由靶特异性引导RNA(NtAlwI(NEB))引导的切口酶位点的测试DNA以1%或5%混合到另一个不包含该位点的DNA池中。切口酶Cas9仅在靶序列处切割并且仅切割DNA的一条链。切口酶用于使靶序列产生切口。单链切割(切口)是DNA聚合酶I的底物,其可用于以生物素标记的DNA置换所述切口下游的DNA。然后纯化感兴趣的生物素化的DNA,扩增,并测序。
使用NtAlwI,使具有用于产生切口(例如,GGATC)703的靶位点的DNA701和不具有靶位点的DNA702的混合物产生切口704(参见例如图7)。与具有切口酶位点的感兴趣的DNA相比,不具有切口酶位点的DNA以100X过量存在。单链切割(切口)是DNA聚合酶I的底物,其可用于以生物素标记的DNA置换705所述切口下游的DNA。通过链霉亲合素结合和洗涤706分离生物素标记的感兴趣的DNA。例如,使用特异性引物707进行PCR扩增,产生扩增的感兴趣区域708,并且由于非特异性标记或捕获而存在扩增的未标记序列709。
两个特异性PCR反应(一个用于具有感兴趣区域的测试DNA,另一个用于没有感兴趣区域的其他DNA)显示所述测试DNA已被富集约50倍(参见例如图8)。
Cas9切口酶的表达和纯化
可以使用用于产生如上的Cas9的相同程序来产生和纯化突变体Cas9切口酶,其为酿脓链球菌Cas9的D10A突变体。
序列特异性Cas9切口酶介导的切口产生
将靶向以下序列5’-GGATTTATACAGCACTTTAA-3’(1μl,相当于2皮摩尔)的稀释的引导RNA与3μl 10x Cas9反应缓冲液(NEB)、20μl H2O和1μl重组Cas9切口酶(10皮摩尔/μl)合并。该靶序列仅存在于靶DNA上(占总DNA的5%或1%)。将反应物在37℃温育15分钟,然后补充5μl稀释的DNA(总共100ng),在37℃继续温育90分钟。通过添加1:100稀释的RNA酶A(Thermo Fisher Scientific)终止反应,然后使用PCR清洁试剂盒(Life Technologies)纯化DNA,在30μl 10mM Tris-Cl pH 8中洗脱。然后将反应物在-20℃储存直到使用。生物素切口翻译
将带切口的DNA与具有5’>3’核酸外切酶活性并且能够在切口处引发DNA合成的大肠杆菌DNA聚合酶I一起温育,从而允许它用经标记核苷酸(在这种程序的情况下为生物素经标记核苷酸)置换切口下游的核苷酸。在25℃在具有1个单位的大肠杆菌DNA聚合酶I(NEB)和dCTP、dGTP和dTTP各0.02mM、0.01mM dATP和0.01mM生物素-C14标记的dATP(LifeTechnologies)的20μl的DNA聚合酶缓冲液(NEB)中进行切口标记反应30分钟。通过加入1mM EDTA终止反应。
生物素标记的DNA的富集
将链霉亲合素C1珠(每反应5μl,Life Technologies)重悬于1ml结合缓冲液(50mMTris-Cl pH8、1mM EDTA、0.1%Tween20)中,与磁力架结合,并用结合缓冲液洗涤两次。然后将珠子重悬于30μl的结合缓冲液中并与切口平移反应物混合,然后在25℃下温育30分钟。使用磁力架捕获珠子并用0.5ml结合缓冲液洗涤四次,然后用0.5ml 10mM Tris-Cl pH 8洗涤三次。然后将珠子重悬于20μl 10mM Tris-Cl pH 8中,然后用作PCR的模板以确定测试DNA和其他DNA的比例。
实施例3:使用无催化活性的核酸引导的核酸酶-转座酶融合物在人基因组文库中插入衔接子之后富集特异性SNP(DNA捕获方案3)
在该实施例中,如针对Cas9纯化所述,从大肠杆菌表达和纯化无催化活性的核酸引导的核酸酶转座酶融合蛋白(例如dCas9-转座酶融合蛋白)。所述融合蛋白与衔接子(Nextera)复合,然后与靶向感兴趣区域(例如人SNP)的引导NA(例如gRNA)复合。然后将该复合物添加到人基因组DNA中;所述感兴趣区域被无催化活性的核酸引导的核酸酶靶向,使得转座酶-衔接子复合物靠近所述感兴趣区域,从而允许插入衔接子。然后可以通过PCR扩增人SNP,随后使用MiSeq进行测序;因而可以从人基因组DNA中富集人SNP。
实施例4:使用无催化活性的核酸引导的核酸酶和核酸引导的核酸酶来保护线粒体DNA并且消化来自人基因组DNA文库的剩余的人核DNA(DNA捕获方案4)
获得来自临床、法医或环境样品的具有P5/P7衔接子的人基因组DNA文库。为了富集某些区域(例如SNP),制备靶向这些区域的引导RNA并与无催化活性的核酸引导的核酸酶(例如dCas9)一起温育,然后在37℃下添加到人基因组DNA文库中温育20分钟。然后,加入涵盖与有活性的核酸引导的核酸酶(例如Cas9)复合的人基因组的引导NA的文库。无催化活性的核酸引导的核酸酶将保持结合在靶位置处并保护所述感兴趣区域(例如SNP)免于被切割并变得不能被PCR扩增和测序。因而,感兴趣的DNA保持完整,而所有其他DNA将被切割并消除。使用PCR清洁试剂盒从反应物中回收感兴趣的DNA,进行PCR扩增并使用MiSeq测序。
为了证明概念测试,从全人基因组DNA文库中富集线粒体DNA。将线粒体特异性引导RNA添加到dCas9中,然后添加到文库中。然后,除了那些由于已经受到结合的dCas9保护而不可接近的序列之外,与Cas9复合的随机引导RNA使任何序列都降解。这使得线粒体DNA的富集水平远远高于最初的0.1%-0.2%。
实施例5:使用核酸引导的核酸酶切口酶(例如Cas9切口酶)通过用未甲基化的DNA置换甲基化的DNA来保护并且然后富集来自人基因组DNA的SNP(DNA捕获方案5)
概述
该方法的目的是从人基因组DNA文库中捕获感兴趣区域,如图11描绘。作为原理验证,将含有切口酶NtBbvCI(NEB)位点的测试DNA以1%或5%混合到另一个不包含该位点的DNA池中。然后用Dam甲基转移酶处理整个混合物以向所有GATC序列添加甲基。测试DNA和其他DNA两者在它们的序列中都含有GATC基序。然后使用NtBbvCI切割混合物,随后与DNA聚合酶I和未经标记核苷酸(dATP、dCTP、dGTP、dTTP)一起温育,然后在75℃加热灭活20分钟。然后将混合物用DpnI消化,其中DpnI仅消化甲基化的DNA;未甲基化或半甲基化的DNA将不会被消化。图12显示,测试DNA的甲基化使其易于受DpnI介导的切割。
Cas9切口酶的表达和纯化
可以使用用于产生如上的Cas9的相同程序来产生和纯化突变体Cas9切口酶,其为酿脓链球菌Cas9的D10A突变体。
序列特异性Cas9切口酶介导的切口产生
将靶向以下序列5’-GGATTTATACAGCACTTTAA-3’(1μl,相当于2皮摩尔)的稀释的引导RNA与3μl 10x Cas9反应缓冲液(NEB)、20μl H2O和1μl重组Cas9切口酶(10皮摩尔/μl)合并。该靶序列仅存在于靶DNA上(占总DNA的5%或1%)。将反应物在37℃温育15分钟,然后补充5μl稀释的DNA(总共100ng),在37℃继续温育90分钟。通过添加1:100稀释的RNA酶A(Thermo Fisher Scientific)终止反应,然后使用PCR清洁试剂盒(Life Technologies)纯化DNA,在30μl 10mM Tris-Cl pH 8中洗脱。然后将反应物在-20℃储存直到使用。未标记的DNA切口平移
将带切口的DNA与具有5’>3’核酸外切酶活性并且能够在切口处引发DNA合成的大肠杆菌DNA聚合酶I一起温育,从而允许它用经标记核苷酸(在这种程序的情况下为生物素经标记核苷酸)置换切口下游的核苷酸。在25℃在具有1个单位的大肠杆菌DNA聚合酶I(NEB)和各自0.02mM的dATP、dCTP、dGTP和dTTP的20μl的DNA聚合酶缓冲液(NEB)中进行切口标记反应30分钟。通过在75℃热灭活20分钟终止反应。
用DpnI消化
然后在37℃将反应物与DpnI(NEB)一起温育1小时。使用PCR清洁试剂盒(LifeTechnologies)回收DNA,然后将其用作PCR的模板,所述PCR使用测试DNA特异性引物。
实施例6:使用核酸引导的核酸酶切口酶(例如Cas9切口酶)产生在感兴趣区域侧翼的长的3'突出端,然后将衔接子与这些突出端连接以富集靶DNA(DNA捕获方案6)
本方法的目的可用于从任何DNA来源(例如,文库、基因组或PCR)富集DNA区域,正如例如图13中描绘。可以使用两个引导NA(例如gRNA)将核酸引导的核酸酶切口酶(例如Cas9切口酶)靶向至近端位点,从而导致在每个位置处产生DNA切口。或者,可以仅在一侧连接衔接子,随后填充,然后可以在另一侧连接衔接子。两个切口可以彼此接近(例如,在10至15bp内)。可以在非靶分子中产生单切口。由于两个切口位点接近,当反应被加热(例如加热至65℃时)可产生双链断裂,从而生成长的(例如10-15bp)3'突出端。这些突出端可以被热稳定的单链DNA/RNA连接酶(如热稳定的5’App DNA/RNA连接酶)识别,以允许单链衔接子的位点特异性连接。例如,连接酶可以仅识别长的3'突出端,从而确保不会在其他位点连接衔接子。使用核酸引导的核酸酶切口酶和靶向感兴趣区域的另一侧的引导NA,可以重复该过程,接着使用第二单链衔接子如上所述进行连接。一旦两个衔接子已经连接在感兴趣区域的任一侧,可以直接将该区扩增或测序。
Figure IDA0001615012290000011
Figure IDA0001615012290000021
Figure IDA0001615012290000031
Figure IDA0001615012290000041
Figure IDA0001615012290000051
Figure IDA0001615012290000061
Figure IDA0001615012290000071

Claims (14)

1.一种捕获感兴趣的靶DNA序列的方法,其包括:
(a)使所述样品与多个核酸引导的核酸酶切口酶-gNA复合物接触,其中所述gNA与所述DNA序列的子集中感兴趣区域侧翼的感兴趣的靶定位点互补,由此产生多个在邻近所述感兴趣区域的位点处带切口的DNA;
(b)将所述样品加热至65℃,由此引起非常接近的切口产生双链断裂;
(c)使所述双链断裂与热稳定的连接酶接触,由此允许仅在这些位点连接衔接子序列;和
(d)重复步骤a-c在感兴趣区域的另一侧放置第二衔接子,从而允许富集感兴趣区域。
2.权利要求1的方法,其中所述gNA是gRNA。
3.权利要求1的方法,其中所述gNA是gDNA。
4.权利要求1至3中任一项的方法,其中所述核酸引导的核酸酶切口酶选自以下各项组成的组:CAS I类I型切口酶、CAS I类III型切口酶、CAS I类IV型切口酶、CAS II类II型切口酶和CAS II类V型切口酶。
5.权利要求1至3中任一项的方法,其中所述核酸引导的核酸酶切口酶选自以下各项组成的组:Cas9切口酶、Cpf1切口酶、Cas3切口酶、Cas8a-c切口酶、Cas10切口酶、Cse1切口酶、Csy1切口酶、Csn2切口酶、Cas4切口酶、Csm2切口酶、Cmr5切口酶、Csf1切口酶、C2C2切口酶和NgAgo切口酶。
6.权利要求1的方法,其中所述DNA是双链DNA。
7.权利要求6的方法,其中所述双链DNA来自基因组DNA。
8.权利要求7的方法,其中所述基因组DNA是人的。
9.权利要求1至8中任一项的方法,其中所述DNA序列的长度为20bp至5000bp。
10.权利要求1至9中任一项的方法,其中所述感兴趣的靶定位点是单核苷酸多态性(SNP)、短串联重复(STR)、癌基因、插入物、删除、结构变异、外显子、基因突变或调控区。
11.权利要求1至10中任一项的方法,其中所述感兴趣的靶定位点代表少于50%的所述样品中的总DNA。
12.权利要求1至11中任一项的方法,其中所述样品获自生物样品、临床样品、法医样品或环境样品。
13.权利要求1至11中任一项的方法,其中能够接触双链断裂的热稳定的连接酶是热稳定的5’App DNA/RNA连接酶或T4 RNA连接酶。
14.权利要求1至13中任一项的方法,其中所述核酸引导的核酸酶切口酶在所述DNA序列的5'端产生切口。
CN201680057464.3A 2015-08-19 2016-08-18 使用基于核酸引导的核酸酶的系统捕获核酸 Active CN108138176B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562207359P 2015-08-19 2015-08-19
US62/207,359 2015-08-19
PCT/US2016/047631 WO2017031360A1 (en) 2015-08-19 2016-08-18 Capture of nucleic acids using a nucleic acid-guided nuclease-based system

Publications (2)

Publication Number Publication Date
CN108138176A CN108138176A (zh) 2018-06-08
CN108138176B true CN108138176B (zh) 2022-05-24

Family

ID=58050956

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680057464.3A Active CN108138176B (zh) 2015-08-19 2016-08-18 使用基于核酸引导的核酸酶的系统捕获核酸

Country Status (8)

Country Link
US (3) US10538758B2 (zh)
EP (2) EP3337898B1 (zh)
JP (2) JP6986509B2 (zh)
CN (1) CN108138176B (zh)
AU (1) AU2016308283B2 (zh)
CA (1) CA2995983A1 (zh)
DK (1) DK3337898T3 (zh)
WO (1) WO2017031360A1 (zh)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2012333134B2 (en) 2011-07-22 2017-05-25 John Paul Guilinger Evaluation and improvement of nuclease cleavage specificity
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9340800B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College Extended DNA-sensing GRNAS
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
US20150166984A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting alpha-antitrypsin point mutations
CN113215219A (zh) 2014-02-13 2021-08-06 宝生物工程(美国) 有限公司 从核酸的初始集合中耗尽靶分子的方法、以及用于实践其的组合物和试剂盒
AU2015298571B2 (en) 2014-07-30 2020-09-03 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
JP6947638B2 (ja) 2014-12-20 2021-10-13 アーク バイオ, エルエルシー Crispr/cas系タンパク質を使用する核酸の標的化枯渇、富化および分割のための組成物および方法
DK3337898T3 (da) 2015-08-19 2021-10-18 Arc Bio Llc Indfangning af nukleinsyrer ved anvendelse af et nukleinsyre-styret nuclease-baseret system
SG10202104041PA (en) 2015-10-23 2021-06-29 Harvard College Nucleobase editors and uses thereof
CN109310784B (zh) 2015-12-07 2022-08-19 阿克生物公司 用于制备和使用指导核酸的方法和组合物
SG11201900907YA (en) 2016-08-03 2019-02-27 Harvard College Adenosine nucleobase editors and uses thereof
WO2018031683A1 (en) 2016-08-09 2018-02-15 President And Fellows Of Harvard College Programmable cas9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
EP3507382B1 (en) * 2016-09-02 2021-06-23 New England Biolabs, Inc. Analysis of chromatin using a nicking enzyme
EP3526320A1 (en) 2016-10-14 2019-08-21 President and Fellows of Harvard College Aav delivery of nucleobase editors
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
WO2018165629A1 (en) 2017-03-10 2018-09-13 President And Fellows Of Harvard College Cytosine to guanine base editor
KR20190130613A (ko) 2017-03-23 2019-11-22 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵산 프로그램가능한 dna 결합 단백질을 포함하는 핵염기 편집제
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
JP7282692B2 (ja) * 2017-06-07 2023-05-29 アーク バイオ, エルエルシー ガイド核酸の作製および使用
CA3222176A1 (en) 2017-06-13 2018-12-20 Genetics Research, Llc, D/B/A Zs Genetics, Inc. Isolation of target nucleic acids
CA3222142A1 (en) * 2017-06-13 2018-12-20 Genetics Research, Llc, D/B/A Zs Genetics, Inc. Negative-positive enrichment for nucleic acid detection
WO2018231967A2 (en) * 2017-06-13 2018-12-20 Genetics Research, Llc, D/B/A Zs Genetics, Inc. Rare nucleic acid detection
US10081829B1 (en) * 2017-06-13 2018-09-25 Genetics Research, Llc Detection of targeted sequence regions
US10527608B2 (en) 2017-06-13 2020-01-07 Genetics Research, Llc Methods for rare event detection
US10947599B2 (en) 2017-06-13 2021-03-16 Genetics Research, Llc Tumor mutation burden
WO2018231952A1 (en) * 2017-06-13 2018-12-20 Genetics Research, Llc, D/B/A Zs Genetics, Inc. Plasma/serum target enrichment
WO2018232114A1 (en) * 2017-06-14 2018-12-20 Wisconsin Alumni Research Foundation Modified guide rnas, crispr-ribonucleotprotein complexes and methods of use
CN107190008A (zh) * 2017-07-19 2017-09-22 苏州吉赛基因测序科技有限公司 一种基于Crispr/cas9的捕获基因组目标序列的方法及其在高通量测序中的应用
JP2020534795A (ja) 2017-07-28 2020-12-03 プレジデント アンド フェローズ オブ ハーバード カレッジ ファージによって支援される連続的進化(pace)を用いて塩基編集因子を進化させるための方法および組成物
WO2019139645A2 (en) 2017-08-30 2019-07-18 President And Fellows Of Harvard College High efficiency base editors comprising gam
WO2019071048A1 (en) * 2017-10-04 2019-04-11 The Broad Institute, Inc. SYSTEMS, METHODS AND COMPOSITIONS FOR TARGETED NUCLEIC ACID EDITION
EP3697906A1 (en) 2017-10-16 2020-08-26 The Broad Institute, Inc. Uses of adenosine base editors
CN110157727A (zh) * 2017-12-21 2019-08-23 中国科学院遗传与发育生物学研究所 植物碱基编辑方法
EP3802809A1 (en) 2018-06-07 2021-04-14 Arc Bio, LLC Compositions and methods for making guide nucleic acids
CN109182454A (zh) * 2018-08-22 2019-01-11 杭州恺思医疗器械有限公司 一种捕获基因组特定dna片段的方法
CN109837273B (zh) * 2018-09-17 2021-06-29 东南大学 一种crispr辅助dna靶向富集方法及其应用
AU2019356016A1 (en) 2018-10-04 2021-05-13 Arc Bio, Llc Normalization controls for managing low sample inputs in next generation sequencing
EP3942042A1 (en) 2019-03-19 2022-01-26 The Broad Institute, Inc. Methods and compositions for editing nucleotide sequences
CN110205318A (zh) * 2019-05-15 2019-09-06 杭州杰毅生物技术有限公司 基于CRISPR-Cas去除宿主基因组DNA的宏基因组提取方法
GB201913997D0 (en) * 2019-09-27 2019-11-13 Oxford Nanopore Tech Ltd Method
CA3165756A1 (en) * 2020-01-06 2021-07-15 Pairwise Plants Services, Inc. Recruitment of dna polymerase for templated editing
KR20230019843A (ko) 2020-05-08 2023-02-09 더 브로드 인스티튜트, 인코퍼레이티드 표적 이중 가닥 뉴클레오티드 서열의 두 가닥의 동시 편집을 위한 방법 및 조성물
CN112159822A (zh) * 2020-09-30 2021-01-01 扬州大学 一种PS转座酶与CRISPR/dCpf1融合蛋白表达载体及其介导的定点整合方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016014409A1 (en) * 2014-07-21 2016-01-28 Illumina, Inc. Polynucleotide enrichment using crispr-cas systems

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US177444A (en) * 1876-05-16 Improvement in transplanters
US5948902A (en) 1997-11-20 1999-09-07 South Alabama Medical Science Foundation Antisense oligonucleotides to human serine/threonine protein phosphatase genes
US7166432B2 (en) 1999-03-12 2007-01-23 Integragen Compositions and methods for genetic analysis
EP1606417A2 (en) * 2003-03-07 2005-12-21 Rubicon Genomics Inc. In vitro dna immortalization and whole genome amplification using libraries generated from randomly fragmented dna
US20050233340A1 (en) 2004-04-20 2005-10-20 Barrett Michael T Methods and compositions for assessing CpG methylation
US20090318305A1 (en) 2008-06-18 2009-12-24 Xi Erick Lin Methods for selectively capturing and amplifying exons or targeted genomic regions from biological samples
WO2012051327A2 (en) 2010-10-12 2012-04-19 Cornell University Method of dual-adapter recombination for efficient concatenation of multiple dna fragments in shuffled or specified arrangements
AU2011323107B2 (en) 2010-11-05 2015-09-10 Illumina, Inc. Linking sequence reads using paired code tags
EP2753715A4 (en) 2011-09-09 2015-05-20 Univ Leland Stanford Junior METHODS FOR OBTAINING A SEQUENCE
US9528107B2 (en) 2012-01-31 2016-12-27 Pacific Biosciences Of California, Inc. Compositions and methods for selection of nucleic acids
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
WO2013141680A1 (en) 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
NZ728024A (en) 2012-05-25 2019-05-31 Univ California Methods and compositions for rna-directed target dna modification and for rna-directed modulation of transcription
CN104619894B (zh) 2012-06-18 2017-06-06 纽亘技术公司 用于非期望核酸序列的阴性选择的组合物和方法
US10847248B2 (en) 2012-08-10 2020-11-24 The Board Of Trustees Of The Leland Stanford Junior University Techniques for determining haplotype by population genotype and sequence data
EP2940140B1 (en) * 2012-12-12 2019-03-27 The Broad Institute, Inc. Engineering of systems, methods and optimized guide compositions for sequence manipulation
WO2014182574A1 (en) 2013-05-04 2014-11-13 The Board Of Trustees Of The Leland Stanford Junior University Enrichment of dna sequencing libraries from samples containing small amounts of target dna
CN111394426B (zh) 2013-05-23 2024-05-10 斯坦福大学托管董事会 用于个人表观基因组学的至天然染色质的转座
US9873907B2 (en) * 2013-05-29 2018-01-23 Agilent Technologies, Inc. Method for fragmenting genomic DNA using CAS9
US10421957B2 (en) * 2013-07-29 2019-09-24 Agilent Technologies, Inc. DNA assembly using an RNA-programmable nickase
US9340800B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College Extended DNA-sensing GRNAS
KR20240038168A (ko) 2013-11-07 2024-03-22 더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티 인간 마이크로바이옴 및 그의 성분의 분석을 위한 무세포 핵산
US9834791B2 (en) 2013-11-07 2017-12-05 Editas Medicine, Inc. CRISPR-related methods and compositions with governing gRNAS
WO2015075056A1 (en) 2013-11-19 2015-05-28 Thermo Fisher Scientific Baltics Uab Programmable enzymes for isolation of specific dna fragments
US9850525B2 (en) * 2014-01-29 2017-12-26 Agilent Technologies, Inc. CAS9-based isothermal method of detection of specific DNA sequence
EP3102722B1 (en) 2014-02-04 2020-08-26 Jumpcode Genomics, Inc. Genome fractioning
CN113215219A (zh) 2014-02-13 2021-08-06 宝生物工程(美国) 有限公司 从核酸的初始集合中耗尽靶分子的方法、以及用于实践其的组合物和试剂盒
US9670485B2 (en) 2014-02-15 2017-06-06 The Board Of Trustees Of The Leland Stanford Junior University Partitioning of DNA sequencing libraries into host and microbial components
EP3114231B1 (en) 2014-03-03 2019-01-02 Swift Biosciences, Inc. Enhanced adaptor ligation
US20160053304A1 (en) 2014-07-18 2016-02-25 Whitehead Institute For Biomedical Research Methods Of Depleting Target Sequences Using CRISPR
AU2015305570C1 (en) 2014-08-19 2020-07-23 President And Fellows Of Harvard College RNA-guided systems for probing and mapping of nucleic acids
US10435685B2 (en) 2014-08-19 2019-10-08 Pacific Biosciences Of California, Inc. Compositions and methods for enrichment of nucleic acids
JP6947638B2 (ja) 2014-12-20 2021-10-13 アーク バイオ, エルエルシー Crispr/cas系タンパク質を使用する核酸の標的化枯渇、富化および分割のための組成物および方法
WO2016187234A1 (en) 2015-05-18 2016-11-24 Karius, Inc. Compositions and methods for enriching populations of nucleic acids
EP3334823B1 (en) 2015-06-05 2024-05-22 The Regents of The University of California Method and kit for generating crispr/cas guide rnas
DK3337898T3 (da) 2015-08-19 2021-10-18 Arc Bio Llc Indfangning af nukleinsyrer ved anvendelse af et nukleinsyre-styret nuclease-baseret system
US10747899B2 (en) 2015-10-07 2020-08-18 The Board Of Trustees Of The Leland Stanford Junior University Techniques for determining whether an individual is included in ensemble genomic data
CA3001130A1 (en) 2015-10-16 2017-04-20 Temple University - Of The Commonwealth System Of Higher Education Methods and compositions utilizing cpf1 for rna-guided gene editing
CN109312400A (zh) 2016-03-25 2019-02-05 凯锐思公司 合成核酸掺入物
US11046995B2 (en) 2016-08-16 2021-06-29 The Regents Of The University Of California Method for finding low abundance sequences by hybridization (FLASH)
US20180051320A1 (en) 2016-08-22 2018-02-22 The Regents Of The University Of California Depletion of abundant sequences by hybridization (dash)
EP3526344B1 (en) 2016-10-13 2020-09-30 Biomérieux Identification and antibiotic characterization of pathogens in metagenomic sample

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016014409A1 (en) * 2014-07-21 2016-01-28 Illumina, Inc. Polynucleotide enrichment using crispr-cas systems

Also Published As

Publication number Publication date
JP2022046466A (ja) 2022-03-23
US20180312830A1 (en) 2018-11-01
CA2995983A1 (en) 2017-02-23
CN108138176A (zh) 2018-06-08
US20240132872A1 (en) 2024-04-25
EP3985111A1 (en) 2022-04-20
US20200087652A1 (en) 2020-03-19
US10538758B2 (en) 2020-01-21
WO2017031360A8 (en) 2017-04-13
JP6986509B2 (ja) 2021-12-22
EP3337898A1 (en) 2018-06-27
JP2018529326A (ja) 2018-10-11
AU2016308283B2 (en) 2022-04-21
DK3337898T3 (da) 2021-10-18
WO2017031360A1 (en) 2017-02-23
AU2016308283A1 (en) 2018-03-15
EP3337898A4 (en) 2019-02-06
EP3337898B1 (en) 2021-07-28

Similar Documents

Publication Publication Date Title
CN108138176B (zh) 使用基于核酸引导的核酸酶的系统捕获核酸
US11692213B2 (en) Compositions and methods for targeted depletion, enrichment, and partitioning of nucleic acids using CRISPR/Cas system proteins
CN109310784B (zh) 用于制备和使用指导核酸的方法和组合物
CN111094565B (zh) 指导核酸的产生和用途

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant