CN112941065A - 使用crispr-cas系统的多核苷酸富集 - Google Patents

使用crispr-cas系统的多核苷酸富集 Download PDF

Info

Publication number
CN112941065A
CN112941065A CN202110046936.8A CN202110046936A CN112941065A CN 112941065 A CN112941065 A CN 112941065A CN 202110046936 A CN202110046936 A CN 202110046936A CN 112941065 A CN112941065 A CN 112941065A
Authority
CN
China
Prior art keywords
nucleic acid
dna
crrna
target nucleic
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110046936.8A
Other languages
English (en)
Inventor
G.卡恩
J.G.曼德尔
A.阿拉瓦尼斯
S.诺伯格
D.K.波克霍洛克
F.J.斯蒂默斯
F.阿布萨兰
L.巴扎尔甘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Illumina Inc
Original Assignee
Illumina Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=53887185&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN112941065(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Illumina Inc filed Critical Illumina Inc
Publication of CN112941065A publication Critical patent/CN112941065A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • C12Q1/683Hybridisation assays for detection of mutation or polymorphism involving restriction enzymes, e.g. restriction fragment length polymorphism [RFLP]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/301Endonuclease

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Saccharide Compounds (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • General Preparation And Processing Of Foods (AREA)

Abstract

用于富集靶核酸的方法,其包括提供具有crRNA或其衍生物和Cas蛋白或其变体的内切核酸酶系统。crRNA或其衍生物包含与靶核酸的区域基本上互补的靶物特异性核苷酸区域;使所述靶核酸与所述内切核酸酶系统接触以形成复合物;并分离复合物,从而富集靶核酸。

Description

使用CRISPR-CAS系统的多核苷酸富集
本申请是申请日为2015年7月20日、申请号为201580051001.1、发明名称 为“使用CRISPR-CAS系统的多核苷酸富集”的中国专利申请的分案申请。
技术领域
本公开一般涉及富集多核苷酸的方法,更具体地涉及使用CRISPR-Cas 系统富集多核苷酸的方法及其应用。
背景技术
存在有期望在多核苷酸群体中(例如在全基因组中)富集靶多核苷酸的多 种方法和应用。此类方法和应用包括但不限于确定序列的存在以诊断病症或 疾病。
目前用于序列特异性DNA富集的许多方法涉及多个步骤,并且需要相对 大量的样品核酸,并且通常是困难的、繁琐的、费力的、费时的、低效的和 昂贵的。此外,目前用于双链DNA的靶向富集的方法需要在序列特异性靶向 之前创建单链DNA。它们还需要更长的时间将探针与靶DNA杂交。因此, 需要能够实现快速和有效的序列特异性多核苷酸富集的新方法。本公开通过 提供使用CRISPR-Cas系统富集多核苷酸的方法来满足这种需要。还提供相关 优点。
在许多细菌和古细菌中,聚簇规则间隔短回文重复(CRISPR)涉及保护细 胞免受噬菌体和接合接合质粒的干扰途径(Marraffini and Sontheimer,2010, Nat RevGenet.11(3):181-190)。CRISPR由短重复序列阵列组成,所述短重复 序列由称为间隔区的类似大小的独特可变DNA序列间隔开,所述序列通常来 自噬菌体或质粒DNA(Barrangou etal.,2007,Science 315:1709-12;Bolotin et al.,2005,Microbiology 151:2551-61;Mojica et al.,2005,J Mol Evol 60:174-82)。因此,CRISPR序列提供了过去感染的适应性、可遗传的记录并 且表达CRISPR RNA(crRNA)-靶向侵入性核酸的小RNA(Marraffiniand Sontheimer,2010,Nat Rev Genet.11(3):181-190)。CRISPR通常与编码与CRISPR相关的蛋白质的CRISPR相关(Cas)基因相关。Cas蛋白可以提供破坏 由crRNA靶向的侵入性外来核酸的机制。CRISPR与Cas(CRISPR相关的)基因 一起包含对细菌和古细菌中侵入性外来核酸提供获得性抗性的适应性免疫 系统(Barrangou et al.,2007,Science 315:1709-12)。
发明内容
本公开提供了用于富集多核苷酸的方法,并且更具体地涉及使用 CRISPR-Cas系统富集靶DNA序列的方法及其应用。
一方面,本文提供了用于富集靶核酸的方法,包括提供内切核酸酶系统, 所述内切核酸酶系统具有:聚簇规则间隔短回文重复(CRISPR)RNA(crRNA) 或其衍生物,和CRISPR相关的(Cas)蛋白或其变体,其中所述crRNA或其衍 生物包含与所述靶核酸的区域互补的靶物特异性核苷酸区域;使所述靶核酸 与所述内切核酸酶系统接触以形成复合物,并且分离所述复合物,从而富集 所述靶核酸。
在一些实施方案中,所述方法还包括从复合物中分离靶核酸。在一些实 施方案中,所述方法还包括扩增靶定核酸。
在一些实施方案中,本文提供的内切核酸酶系统还包含反式激活 crRNA(tracrRNA)或其衍生物。在一些实施方案中,crRNA或其衍生物是含 有与tracrRNA多核苷酸融合的crRNA多核苷酸的多核苷酸。在一些实施方案 中,内切核酸酶系统是II型CRISPR-Cas系统或其衍生物。在一些实施方案中, 靶核酸是双链DNA(dsDNA)。
在一些实施方案中,内切核酸酶系统是标记的。在一些实施方案中,用 生物素标记crRNA。在一些实施方案中,本文提供的方法还包括加入链霉亲 合素,从而分离复合物。在一些实施方案中,Cas蛋白或其衍生物用捕获标 签标记。
在一些实施方案中,一种或多种以下Cas9复合物组分可以用结合标签标 记:Cas9酶,crRNA,tracrRNA和靶向置换环的DNA探针标记。在一些实施 方案中,结合标签是生物素或其功能类似物。
在某些实施方案中,当Cas9酶用结合标签标记时,蛋白质可以是加化学 标签的。例如,Cas9可以化学生物素化。作为另一个实例,可以通过加入编 码与Cas9基因的融合物的额外序列创建融合物。在此类实施方案中有用的融 合物的一个实例是AviTagTM,其采用单一生物素在独特的15个氨基酸的肽标 签上的高度靶向的酶缀合。
在用结合标签标记crRNA的某些实施方案中,可以使用掺入一种或多种 生物素化核苷酸(如生物素化尿嘧啶)的体外转录(IVT)标记整个crRNA。在一 些实施方案中,可以将生物素化学或酶促加入crRNA,例如在crRNA的3’末 端加入2个生物素基团(双生物素)。
在用结合标签标记tracrRNA的某些实施方案中,可以使用掺入一种或多 种生物素化核苷酸(如生物素化尿嘧啶)的体外转录(IVT)标记整个tracrRNA。 在一些实施方案中,可以将生物素化学或酶促加入tracrRNA,例如在 tracrRNA的3’端加入2个生物素基团(双生物素)。
在用结合标签标记靶向置换环的探针的某些实施方案中,可以通过在寡 核苷酸探针的5’端加入生物素基团合成具有感兴趣的特定序列的寡核苷酸。 例如,可以在合成期间将一个或多个生物素化的亚磷酰胺(phosphoramadites) 掺入寡核苷酸中。
在一些实施方案中,Cas蛋白或其变体是Cas9蛋白或其变体。在一些实 施方案中,Cas9蛋白或其变体保留两个核酸酶结构域并且能够产生双链DNA 断裂。在一些实施方案中,Cas9蛋白含有一个失活的核酸酶结构域,其包含 切割与crRNA互补的靶核酸链的结构域中的突变。在一些实施方案中,所述 突变是D10A。在一些实施方案中,Cas9蛋白含有一个失活的核酸酶结构域, 其包含切割与crRNA不互补的靶核酸链的结构域中的突变。在一些实施方案 中,所述突变是H840A。在一些实施方案中,Cas9蛋白含有两个失活的核酸 酶结构域。在一些实施方案中,两个失活的核酸酶结构域包含切割与crRNA 互补的链的结构域中的第一突变和在切割与crRNA不互补的链的结构域中 的第二突变。在一些实施方案中,所述第一突变是D10A,并且所述第二突 变是H840A。
在另一方面,本文提供了用于富集靶双链核酸的方法,包括:提供内切 核酸酶系统,所述内切核酸酶系统具有:聚簇规则间隔短回文重复(CRISPR) RNA(crRNA)或其衍生物,以及CRISPR相关(Cas)蛋白或其变体,其中所述 crRNA或其衍生物包含与所述靶双链核酸的第一链的区域互补的靶物特异 性核苷酸区域;使所述靶双链核酸与所述内切核酸酶系统接触以形成第一复 合物;使标记的核酸与所述靶双链核酸的第二链杂交以形成第二复合物,所 述靶双链核酸的第二链与所述crRNA或其衍生物不互补,并且分离所述第二 复合物,从而富集靶核酸。
在一些实施方案中,所述方法还包括从复合物中分离靶核酸。在一些实 施方案中,所述方法还包括扩增靶定核酸。
在一些实施方案中,本文提供的内切核酸酶系统还包含反式激活 crRNA(tracrRNA)或其衍生物。在一些实施方案中,crRNA或其衍生物是包 含与tracrRNA多核苷酸融合的crRNA多核苷酸的多核苷酸。在一些实施方案 中,内切核酸酶系统是II型CRISPR-Cas系统或其衍生物。在一些实施方案中, 靶核酸是双链DNA(dsDNA)。
在一些实施方案中,如上所述标记内切核酸酶系统。在一些实施方案中, 用生物素标记crRNA。在一些实施方案中,本文提供的方法还包括加入链霉 亲合素,从而分离复合物。
在一些实施方案中,Cas蛋白或其衍生物用捕获标签标记。在一些实施 方案中,Cas蛋白或其变体是Cas9蛋白或其变体。在一些实施方案中,Cas9 蛋白或其变体保留两个核酸酶结构域并且能够产生双链核酸断裂。在一些实 施方案中,Cas9蛋白含有一个失活的核酸酶结构域,其包含切割与crRNA互 补的靶核酸链的结构域中的突变。在一些实施方案中,所述突变是D10A。 在一些实施方案中,Cas9蛋白含有一个失活的核酸酶结构域,其包含切割与 crRNA不互补的靶核酸链的结构域中的突变。在一些实施方案中,所述突变 是H840A。在一些实施方案中,Cas9蛋白含有两个失活的核酸酶结构域。在 一些实施方案中,两个失活的核酸酶结构域包含切割与crRNA互补的链的结 构域中的第一突变和在切割与crRNA不互补的链的结构域中的第二突变。在 一些实施方案中,所述第一突变是D10A,并且所述第二突变是H840A。
在一些实施方案中,本文提供的方法还包括使靶核酸进行片段标签化(tagmenting the target nucleic acid)。在一些实施方案中,本文提供的方法还包 括加入转座酶,其中所述crRNA或其衍生物含有转座子末端。在一些实施方 案中,转座子末端是嵌合末端(ME),并且其中转座酶是Tn5转座酶。在一些 实施方案中,本文提供的方法还包括将转座子末端加入靶核酸,并使靶核酸 进行片段标签化,其中所述内切核酸酶系统进一步包含转座酶。
在一些实施方案中,转座酶结合核酸内切酶系统的核苷酸序列。在一些 实施方案中,转座酶和Cas蛋白形成融合蛋白。在一些实施方案中,转座子 末端是嵌合末端(ME),并且其中转座酶是Tn5转座酶。
在另一方面,本文提供了用于富集靶核酸的方法,包括:从受试者的血 浆或血清获得细胞游离DNA(cell free DNA,cfDNA)群体,所述含有靶核酸 的细胞游离DNA群体;提供内切核酸酶系统,其具有:聚簇规则间隔短回文 重复(CRISPR)RNA(crRNA)或其衍生物,和CRISPR相关的(Cas)蛋白或其变 体,其中所述crRNA或其衍生物包含与靶核酸的区域互补的靶物特异性核苷 酸区域;使所述靶核酸与所述内切核酸酶系统接触以形成复合物,以及分离 所述复合物,从而富集所述靶核酸。
在一些实施方案中,靶核酸包含单核苷酸变体(SNV)。在一些实施方案 中,该方法还包括从复合物中分离靶核酸。在一些实施方案中,所述方法还 包括扩增靶定核酸。在一些实施方案中,本文提供的内切核酸酶系统进一步 包括反式激活crRNA(tracrRNA)或其衍生物。在一些实施方案中,crRNA或 其衍生物是包含与tracrRNA多核苷酸融合的crRNA多核苷酸的多核苷酸。在 一些实施方案中,本文提供的内切核酸酶系统是II型CRISPR-Cas系统或其衍 生物。在一些实施方案中,靶核酸是双链DNA(dsDNA)。
在一些实施方案中,如上所述标记内切核酸酶系统。在一些实施方案中, 用生物素标记crRNA。在一些实施方案中,本文提供的方法还包括加入链霉 亲合素,从而分离复合物。在一些实施方案中,Cas蛋白或其衍生物用捕获 标签标记。
在一些实施方案中,Cas蛋白或其变体是Cas9蛋白或其变体。在一些实 施方案中,Cas9蛋白或其变体保留两个核酸酶结构域并且能够产生双链DNA 断裂。在一些实施方案中,Cas9蛋白含有一个失活的核酸酶结构域,其包含 切割与crRNA互补的靶核酸链的结构域中的突变。在一些实施方案中,所述 突变是D10A。在一些实施方案中,Cas9蛋白含有一个失活的核酸酶结构域, 其包含切割与crRNA不互补的靶核酸链的结构域中的突变。在一些实施方案 中,所述突变是H840A。在一些实施方案中,Cas9蛋白含有两个失活的核酸 酶结构域。在一些实施方案中,两个失活的核酸酶结构域包含切割与crRNA 互补的链的结构域中的第一突变和在切割与crRNA不互补的链的结构域中 的第二突变。在一些实施方案中,所述第一突变是D10A,并且所述第二突 变是H840A。
在一些实施方案中,靶核酸在细胞游离DNA的胎儿细胞级份中,并且其 中所述细胞游离DNA来自母体血浆。在一些实施方案中,受试者是癌症患者。
另一方面,本文提供了检测单核苷酸变体(SNV)的方法,包括:从受试 者的血浆或血清中获得细胞游离DNA的群体;提供第一内切核酸酶系统,其 具有:第一聚簇规则间隔短回文重复(CRISPR)RNA(crRNA)或其衍生物,和 第一CRISPR相关的(Cas)蛋白或其变体,其中所述第一crRNA或其衍生物包 含与第一靶核酸的区域互补的第一靶物特异性核苷酸区域,并且其中所述第 一Cas蛋白具有核酸酶活性;使用核酸内切酶系统切割第一靶核酸,以及使 用聚合酶链式反应(PCR)扩增第二靶核酸,其中第二靶核酸包含第一靶核酸 的单核苷酸变体形式。
在一些实施方案中,本文提供的第一内切核酸酶系统进一步包括反式激 活crRNA(tracrRNA)或其衍生物。在一些实施方案中,crRNA或其衍生物是 包含与tracrRNA多核苷酸融合的crRNA多核苷酸的多核苷酸。在一些实施方 案中,本文提供的第一内切核酸酶系统是II型CRISPR-Cas系统或其衍生物。 在一些实施方案中,靶核酸是双链DNA(dsDNA)。在一些实施方案中,Cas 蛋白或其变体是Cas9蛋白或其变体。
在一些实施方案中,本文提供的方法还包括:提供第二内切核酸酶系统, 其具有:第二聚类的规则间隔短回文重复(CRISPR)RNA(crRNA)或其衍生物, 和第二CRISPR相关的(Cas)蛋白质或其变体,其中所述第二crRNA或其衍生 物含有与所述第二靶核酸的区域互补的第二靶物特异性核苷酸区域;使所述 第二靶核酸与所述第二内切核酸酶系统接触以形成复合物,以及分离所述复 合物,从而富集所述第二靶核酸。
在一些实施方案中,本文提供的方法还包括从复合物中分离第二靶核 酸。在一些实施方案中,第二内切核酸酶系统进一步包含反式激活 crRNA(tracrRNA)或其衍生物。在一些实施方案中,第二crRNA或其衍生物 是包含与tracrRNA多核苷酸融合的crRNA多核苷酸的多核苷酸。在一些实施 方案中,第二内切核酸酶系统是II型CRISPR-Cas系统或其衍生物。在一些实 施方案中,第二靶核酸是双链DNA(dsDNA)。
在一些实施方案中,如上所述标记第二内切核酸酶系统。在一些实施方 案中,第二crRNA用生物素标记。在一些实施方案中,本文提供的方法还包 括加入链霉亲合素,从而分离复合物。在一些实施方案中,第二Cas蛋白或 其衍生物用捕获标签标记。
在一些实施方案中,第二Cas蛋白或其变体是Cas9蛋白或其变体。在一 些实施方案中,Cas9蛋白或其变体保留两个核酸酶结构域并且能够产生双链 核酸断裂。在一些实施方案中,Cas9蛋白含有一个失活的核酸酶结构域,其 包含切割与crRNA互补的靶核酸链的结构域中的突变。在一些实施方案中, 所述突变是D10A。在一些实施方案中,Cas9蛋白含有一个失活的核酸酶结 构域,其包含切割与crRNA不互补的靶核酸链的结构域中的突变。在一些实 施方案中,所述突变是H840A。在一些实施方案中,Cas9蛋白含有两个失活 的核酸酶结构域。在一些实施方案中,两个失活的核酸酶结构域包含切割与 crRNA互补的链的结构域中的第一突变和在切割与crRNA不互补的链的结构 域中的第二突变。在一些实施方案中,所述第一突变是D10A,并且所述第 二突变是H840A。
在一些实施方案中,靶核酸在细胞游离DNA的胎儿细胞级份中,并且其 中所述细胞游离DNA来自母体血浆。在一些实施方案中,受试者是癌症患者。
在另一方面,本文提供了用于标记靶核酸的方法,包括提供第一核酸酶 系统,所述第一核酸酶系统具有:第一聚簇规则间隔短回文重复 (CRISPR)RNA(crRNA)或其衍生物,和第一CRISPR相关-(Cas)蛋白或其变体, 其中所述第一crRNA或其衍生物包含与所述靶核酸的第一区互补的第一靶 物特异性核苷酸区,并且其中所述第一Cas蛋白包含一个失活的核酸酶结构 域;使包含所述靶核酸的双链核酸与所述第一核酸酶系统接触,以在所述靶核酸的第一区产生第一单链切口,并标记所述靶核酸。
在一些实施方案中,本文提供的方法还包括通过标记分离靶核酸,从而 富集靶核酸。在一些实施方案中,本文提供的方法还包括扩增靶核酸。
在一些实施方案中,本文提供的第一核酸酶系统进一步包括反式激活 crRNA(tracrRNA)。在一些实施方案中,第一crRNA或其衍生物是包含与 tracrRNA多核苷酸融合的crRNA多核苷酸的多核苷酸。在一些实施方案中, 第一核酸酶系统是II型CRISPR-Cas系统或其衍生物。在一些实施方案中,靶 核酸是双链DNA(dsDNA)。
在一些实施方案中,第一Cas蛋白或其变体是Cas9蛋白或其变体。在一 些实施方案中,Cas9蛋白或其变体含有一个失活的核酸酶结构域,其包含切 割与第一crRNA互补的靶核酸链的结构域中的突变。在一些实施方案中,所 述突变是D10A。在一些实施方案中,第一Cas9蛋白或其变体含有一个失活 的核酸酶结构域,其在结构域中包含切割与第一crRNA不互补的靶核酸链的 突变。在一些实施方案中,所述突变是H840A。在一些实施方案中,本文提 供的方法还包括进行切口平移。在一些实施方案中,切口平移通过使用选自 DNA Pol1,Bst和Taq的切口平移聚合酶进行。在一些实施方案中,切口平移 在含有生物素化dNTP的反应混合物中进行。在一些实施方案中,生物素化 的dNTP是生物素化的dUTP。在一些实施方案中,本文提供的方法还包括加 入磁性链霉亲合素珠以富集生物素化的靶核酸。
在一些实施方案中,本文提供的方法还包括提供第二核酸酶系统,其具 有:第二crRNA或其衍生物,和第二Cas蛋白或其变体,其中第二crRNA或其 衍生物包含与所述靶核酸的第二区互补的第二靶物特异性核苷酸区域,并且 其中所述第二Cas蛋白含有一个失活的核酸酶结构域,并使含有所述靶核酸 的双链核酸与所述第二核酸酶系统接触,以在靶核酸的第二区产生第二单链 切口,其中所述靶核酸的第一区不同于所述靶核酸的第二区。
在一些实施方案中,第一单链切口和第二单链切口在靶核酸的相同链 上。在一些实施方案中,靶核酸的相同链上的第一单链切口和第二单链切口 之间的间隔为1bp至20bp。在一些实施方案中,所述方法还包括进行切口平 移。在一些实施方案中,切口平移通过使用切口平移聚合酶Phi29进行。
在一些实施方案中,靶核酸的第一区和靶核酸的第二区在靶核酸的相同 链上;其中所述第一Cas蛋白是含有一个失活的核酸酶结构域的第一Cas9蛋 白,所述核酸酶结构域包含切割与所述第一crRNA互补的靶核酸链的所述结 构域中的第一突变,并且其中所述第二Cas蛋白是含有一个失活的核酸酶结 构域的第二Cas9蛋白,所述核酸酶结构域包含在切割与第二crRNA互补的靶 核酸链的结构域中的第二突变。在一些实施方案中,第一突变和第二突变都 是D10A。
在一些实施方案中,靶核酸的第一区和靶核酸的第二区在靶核酸的相同 链上;其中所述第一Cas蛋白是含有一个失活的核酸酶结构域的第一Cas9蛋 白,所述核酸酶结构域包含切割与所述第一crRNA不互补的靶核酸链的所述 结构域中的第一突变,并且其中所述第二Cas蛋白是含有一个失活的核酸酶 结构域的第二Cas9蛋白,所述核酸酶结构域含有切割与所述第二crRNA不互 补的所述结构域中的靶核酸链。在一些实施方案中,第一突变和第二突变都 是H840A。
在一些实施方案中,靶核酸的第一区和靶核酸的第二区在靶核酸的不同 链上;第一Cas蛋白是含有一个失活的核酸酶结构域的第一Cas9蛋白,所述 核酸酶结构域包含切割与第一crRNA互补的靶核酸链的结构域中的第一突 变,并且第二Cas蛋白是含有一个失活核酸酶结构域的第二Cas9蛋白,所述 核酸酶结构域包含切割与所述第二crRNA不互补的靶核酸链的结构域中的 第二突变。在一些实施方案中,所述第一突变是D10A,并且所述第二突变 是H840A。
在一些实施方案中,第一单链切口和第二单链切口之间的间隔为20bp至 500bp。
在一些实施方案中,本文提供的方法还包括加入捕获探针;以及用所述 捕获探针交换在所述第一单链切口和所述第二单链切口之间的单链核酸产 物,其中所述捕获探针能够与同所述单链核酸产物互补的核酸杂交。
在一些实施方案中,捕获探针的序列与单链核酸产物的序列具有10%至 100%的同一性。在一些实施方案中,捕获探针是生物素化的探针,并且可 以如上所述进行标记。在一些实施方案中,本文提供的方法还包括加入磁性 链霉亲合素珠以富集靶核酸。在一些实施方案中,捕获探针含有突出核苷酸 序列,突出核苷酸序列与固定在表面上的寡核苷酸互补。
在一些实施方案中,第一单链切口和第二单链切口在靶核酸的相反链 上,从而产生第一双链核酸断裂末端。在一些实施方案中,靶核酸的第一区 和靶核酸的第二区在靶核酸的相同链上;第一Cas蛋白是含有一个失活的核 酸酶结构域的第一Cas9蛋白,所述核酸酶结构域包含切割与第一crRNA互补 的靶核酸链的结构域中的第一突变,并且第二Cas蛋白是含有一个失活核酸 酶结构域的第二Cas9蛋白,所述核酸酶结构域包含切割与所述第二crRNA不 互补的靶核酸链的结构域中的第二突变。在一些实施方案中,第一突变是D10A,并且第二突变是H840A。
在一些实施方案中,靶核酸的第一区和靶核酸的第二区在靶核酸的相反 链上;第一Cas蛋白是含有一个失活的核酸酶结构域的第一Cas9蛋白,核酸 酶结构域包含切割与第一crRNA互补的靶核酸链的结构域中的第一突变,并 且第二Cas蛋白是含有一个失活的核酸酶结构域的第二Cas9蛋白,所述核酸 酶结构域包含切割与所述第二crRNA互补的靶核酸链的结构域中的第二突 变。在一些实施方案中,第一突变和第二突变都是D10A。
在一些实施方案中,靶核酸的第一区和靶核酸的第二区在靶核酸的相反 链上;第一Cas蛋白是含有一个失活的核酸酶结构域的第一Cas9蛋白,核酸 酶结构域包含切割与第一crRNA不互补的靶核酸链的结构域中的第一突变, 并且第二Cas蛋白是含有一个失活的核酸酶结构域的第二Cas蛋白,所述核酸 酶结构域含有在切割与第二crRNA不互补的靶核酸链的结构域中的第二突 变。在一些实施方案中,第一突变和第二突变都是H840A。
在一些实施方案中,本文提供的方法还包括将衔接头连接至第一双链 DNA断裂末端。在一些实施方案中,衔接头是生物素化的。在一些实施方案 中,本文提供的方法还包括加入磁性链霉亲合素珠以富集靶核酸。
在一些实施方案中,本文提供的方法还包括提供第三核酸酶系统,其具 有:第三crRNA或其衍生物,和第三Cas蛋白或其变体,其中所述第三crRNA 或其衍生物包含与所述靶核酸的第三区域基本上互补的第三靶物特异性核 苷酸区域,并且其中所述第三Cas蛋白包含一个失活的核酸酶结构域;提供 第四核酸酶系统,其具有:第四crRNA或其衍生物,和第四Cas蛋白或其变 体,其中所述第四crRNA或其衍生物包含与所述靶核酸的第四区基本上互补 的第四靶物特异性核苷酸区,并且其中所述第四Cas蛋白含有一个失活的核 酸酶结构域;和使含有靶核酸的双链核酸与第三和第四核酸酶系统接触,以 在靶核酸的第三区域产生第三单链切口,在靶核酸的第四区域产生第四单链 切口,其中在所述第三单链切口和所述第四单链切口在所述靶核酸的相反链 上,从而产生第二双链核酸断裂末端,所述第二双链核酸断裂末端不同于第 一个双链核酸断裂末端。在一些实施方案中,所述方法还包括将衔接头连接 至第二双链核酸断裂末端。
在另一方面,本文提供了用于富集靶核酸的方法,包括:提供用crRNA 组编程的Cas9蛋白群体,其中所述crRNA组含有与靶序列的一系列不同区域 互补的crRNA核酸;使靶核酸与用该crRNA组编程的Cas9蛋白群体接触以产 生一系列核酸片段,并将衔接头连接到至少一个核酸片段,其中Cas9蛋白保 留两个核酸酶结构域。
在一些实施方案中,该crRNA组含有与靶核酸的两个不同区域互补的 crRNA。在一些实施方案中,靶核酸是双链DNA。在一些实施方案中,靶核 酸是基因组DNA、染色体DNA、基因组或部分基因组。
在另一方面,本文提供了用于对靶核酸进行测序的方法,包括:提供用crRNA组编程的Cas9蛋白群体,其中所述crRNA组包含与靶核酸间的一系列 不同区域互补的crRNA;使靶核酸与用所述crRNA组编程的Cas9蛋白群体接 触以产生一系列核酸片段,并对所述一系列核酸片段测序。
在一些实施方案中,本文提供了用于对靶核酸测序的方法,包括:提供 多个Cas9蛋白群体,每个Cas9蛋白群体用不同的crRNA组编程,其中每个 crRNA组包含与靶核酸间的不同系列区域互补的crRNA;在单独的反应中使 靶核酸与多个Cas9蛋白群体中的每一个接触,以产生不同系列的核酸片段, 并对所述核酸片段测序。
在一些实施方案中,多个Cas9蛋白质群体包含三个Cas9蛋白质群体,并 且其中由三个Cas9蛋白质群体中的每一个产生的核酸片段含有与由Cas9蛋 白的三个群体的至少另一个产生的核酸片段的重叠序列。在一些实施方案 中,Cas9蛋白保留两个核酸酶结构域。在一些实施方案中,靶核酸是双链 DNA。在一些实施方案中,靶核酸是基因组DNA,染色体DNA,基因组或 部分基因组。在一些实施方案中,该方法还包括将衔接头连接到核酸片段上。 在一些实施方案中,本文提供的方法还包括将含有靶DNA的DNA样品稀释 为单倍体含量。在一些实施方案中,对核酸片段测序包括下列一种或多种: 使用通过合成测序,桥式PCR,链终止测序,通过杂交测序,纳米孔测序和 通过连接测序。
附图说明
图1显示了本文提供的用于使用CRISPR-Cas系统富集靶DNA序列的方 法。在图的右部分显示内切核酸酶系统-靶DNA复合物。
图2A-2B举例说明了本文提供的使用含有野生型Cas9蛋白的 CRISPR-Cas系统富集靶DNA序列(野生型Braf)的方法。在图2A中,在提供 CRISPR-Cas系统之前,首先用AlwNI消化含有野生型Braf序列的质粒。在图 2B中,在提供CRISPR-Cas系统之前,首先用Bgl l消化含有野生型Braf序列的 质粒。图2C-2D举例说明了本文提供的使用含有Cas9切口酶的CRISPR-Cas 系统富集靶DNA序列(野生型Braf)的方法。图2C显示了来自Cas9切口酶介导的从Nextera质粒文库的片段的富集。图2D显示Cas9切口酶介导的从Nextera 质粒文库富集片段的富集结果。
图3是示意图,其显示了使用CRISPR-Cas系统富集靶DNA测序的方法, 其中指导RNA与靶DNA的链的结合参见用于由核酸探针进一步标记的置换 环。
图4A-4F显示了本文提供的方法,其进一步包括使靶DNA进行片段标签 化。图4A显示了使富集的靶DNA进行片段标签化的方法。图4B显示了使用 含有ME序列的指导RNA的方法。图4C显示了使用含有连接到指导RNA的 Tn5二聚体的CRIPR-Cas系统的方法。图4D显示了使用含有与Cas9蛋白融合 的Tn5二聚体的CRIPR-Cas系统的方法。图4E显示了使用Tn5和Cas9蛋白质富 集靶核酸的方法。图4F显示了Cas9介导的靶向测序的方法,其包括进行片段标签化步骤。
图5是显示富集和检测多核苷酸变体的方法的示意图。
图6A显示Cas9融合蛋白的表达。图6B举例说明了Cas9切口酶(m10)的纯 化。图6C-D显示了测试野生型Cas9蛋白和Cas9切口酶的活性的活性测定的结 果。图6E显示了Cas9切口酶的序列特异性。
图7A-7C显示了使用Cas9切口酶和切口平移富集靶双链DNA序列的方 法。图7A是显示使用Cas9切口酶和切口平移的方法的示意图。图7B显示在 切口平移期间掺入dGTP和dUTP。图7C显示Cas9切口平移的结果。
图8A-8E显示了使用用于富集靶DNA的Cas9切口酶在靶DNA的相同链 上产生两个连续单链切口的方法。图8A是示意图,其显示使用用于富集靶 DNA的Cas9切口酶在靶DNA的相同链上产生两个连续单链切口的方法。图 8B显示了产生双切口的结果。图8C显示了使用各种Cas9切口酶浓度产生双 切口的结果。图8D显示在变性温度下产生双切口的结果。图8E是显示Cas9 切口DNA的富集结果的柱状图。
图9是显示使用突出端捕获探针富集靶DNA序列的方法的示意图。
图10是显示将DNA标志(DNA条形码)掺入双链DNA的方法的示意图。
图11A显示了使用用于富集靶DNA的Cas9切口酶在靶DNA的相反链上 产生两个连续单链切口的方法。图11B显示了在进行片段标签化之前将片段 稀释为单倍体含量(haploid content)的方法。
图12A显示了使用多种WT Cas9富集双链DNA的方法。图12B-12C显示 了使用CRISPR-Cas系统进行DNA测序的方法。图12B是显示使用Cas9介导的 DNA片段化的靶向测序方法的示意图。图12C是显示使用Cas9介导的片段化 的靶向单倍型测序的示意图。
图13显示了Cas9切割测定的实例的流程图;
图14图示了图13的Cas9切割测定的步骤;
图15显示使用图13的Cas9切割测定单独或在包含BRAF质粒DNA和基因 组DNA的混合物中的BRAF质粒DNA的片段化的琼脂糖凝胶的照片;
图16显示了图15的片段化BRAF质粒DNA的Cas9介导的下拉(富集)的琼 脂糖凝胶的照片;
图17显示HindIII消化的噬菌体λDNA的片段大小分布的照片;
图18显示Cas9介导的λHindIII-DNA片段的切割的琼脂糖凝胶的照片;
图19显示了图18的靶向和切割的λDNA片段的Cas9介导的下拉(富集)的 琼脂糖凝胶的照片;
图20显示Cas9-切口酶介导的λHindIII片段的下拉的琼脂糖凝胶的照片;
图21显示了用于多重富集的crRNA设计的λDNA和9个Cas9靶位置的基 因组图谱;
图22显示了Cas9-切口酶文库富集方案的流程图;
图23显示对于使用图22的文库富集方案制备的λDNA富集文库,百分比 总深度和百分比GC含量(作为λ基因组中位置的函数)的图;
图24显示了使用图22的文库富集方案制备的基因组文库中内源BRAF DNA序列的富集的柱状图;和
图25显示了HindIII消化的λDNA的crRNA设计和用于crRNA合成的IVT 反应的正向和反向链的实例的数据表。
具体实施方式
本公开提供了使用CRISPR-Cas系统的快速和有效富集靶核酸的方法。本 公开还提供了使用CRISPR-Cas系统富集和/或检测多核苷酸变体的方法。本 公开进一步提供了CRISPR-Cas系统介导的靶向测序的方法。
CRISPR-Cas系统通常可以分为三种主要类型(I-III型),其基于核心元件 含量和序列进一步细分为10个亚型(Makarova et al.,2011,Nat Rev Microbiol 9:467-77)。这些CRISPR-Cas系统的两个关键元件是Cas蛋白和CRISPR RNA(crRNA)。CrRNA由短重复序列组成,所述短重复序列与衍生自侵入者 DNA的间隔序列间插。Cas蛋白具有各种活性,例如核酸酶活性。因此, CRISPR-Cas系统提供了用于靶向特定序列以及在序列上的某些酶活性的机 制。
典型的I型CRISPR-Cas系统含有具有单独的解旋酶和DNA酶活性的Cas3 蛋白。例如,在1-E型系统中,将crRNA掺入称为级联(用于抗病毒防御的 CRISPR相关复合物)的多亚基效应物复合物中(Brouns et al.,2008,Science 321:960-4),其结合靶DNA并触发Cas3蛋白的降解(Sinkunas et al.,2011, EMBO J 30:1335-1342;Beloglazova et al.,2011,EMBO J 30:616-627)。
II型CRISPR-Cas系统包括签名Cas9蛋白(signature Cas9 protein),能够产 生crRNA并裂解靶DNA的单一蛋白质(约160KDa)。Cas9蛋白通常含有两个核 酸酶结构域,靠近氨基末端的RuvC样核酸酶结构域和靠近蛋白质中间的 HNH(或McrA样)核酸酶结构域。Cas9蛋白的每个核酸酶结构域专用于切割双 螺旋的一条链(Jinek et al.,2012,Science 337(6096):816–821)。
III型CRISPR-Cas系统含有聚合酶和RAMP模块。III型系统可以进一步分 为亚类III-A和III-B。III-A型CRISPR-Cas系统已显示靶向质粒,并且III-A系 统的聚合酶样蛋白参与靶DNA的切割(Marraffini and Sontheimer,2008, Science 322:1843–1845)。类型III-B CRISPR-Cas系统也已显示靶向RNA(Hale et al.,2009,Cell 139:945–956)。
本公开部分地涉及利用CRISPR-Cas系统及其衍生物用于靶物特异性富 集。在一个实施方案中,本公开涉及使用衍生自II型CRISPR-Cas系统的 CRISPR-Cas系统富集靶DNA。如所讨论的,II型CRISPR-Cas系统包含其他 元件中的两个关键元件:crRNA和Cas9蛋白。本文提供的crRNA和Cas9部分 都可以由用户工程化或程序化,实现本文提供的用于核酸富集,检测和/或测 序的各种方法。
当前的靶物特异性富集方案需要在与探针的靶物特异性杂交之前制备 单链核酸。在本公开提供的各种优点中,本公开提供了富集方法,其可以跳 过首先产生单链核酸的这个步骤,并且能够直接靶向双链核酸,例如双链 DNA(dsDNA)。直接靶向双链DNA(部分或完全双链)的方法与单链富集策略 相比具有独特的优点。例如,单链基因组DNA与靶向区域的非特异性杂交降 低了特异性,并且通常需要大量的严格洗涤或其它耗时的步骤;并且单链富 集方案通常使用Cot-1或其它阻断DNA以减少非特异性杂交。这些添加剂不 需要来自双链DNA富集方案,降低了所需试剂的成本和数量。此外,从双链 DNA制备测序文库比从单链DNA更容易。因此,双链DNA的富集使得文库 制备(例如,进行片段标签化)在富集后发生。对于另一个实例,由于特异性(树 状结构和非特异性杂交是双链DNA富集的较少问题,与单链DNA富集方案 相比,潜在更大的DNA片段可以更好地特异性富集。若考虑单倍型分型和装 配背景中的靶向测序,则这是特别重要的优点。此外,由于可潜在富集更长 的DNA片段,我们对靶探针设计的位置具有更大的灵活性,例如,我们可以 避免高多态性区域,但仍然捕获这些区域。此外,需要使用更少的探针来捕 获大区域,从而降低捕获探针成本和设计两者。
此外,目标特异性杂交的目前方案具有缓慢的动力学并且通常需要高 温。本公开提供了提供更快的动力学和更容易的富集工作流的酶驱动序列靶 向方法。因为在目前方法中与靶核酸的杂交是酶驱动的,所以该方法可以等 温发生。在一些实施方案中,本文的方法提供在20-37℃的DNA的等温靶向。 此外,本文系统中的指导RNA(例如crRNA)提供序列特异性以及允许多重靶 向富集(例如,用多种方式制备的更多探针靶向多个靶向区域,包括来自寡 核苷酸合并物的IVT)的灵活编程。本公开还提供了用于富集和/或检测具有更高灵敏度和特异性的多核苷酸变体的方法。此外,本发明还提供了使用 CRISPR-Cas系统的靶向测序的方法。
定义
如本文所用,术语“包括”、“包含”、“含有”、“具有”,及其变型意图覆 盖非排他性纳入,使得包括、包含或含有要素或要素列表的过程、方法、过 程产品、物质组合物不仅包括那些要素,而且可以包括未明确列出的此类过 程、方法、过程产品、物质组合物所固有的要素。
如本文所用,单数形式“一”,“一个”和“该”包括复数指示物,除非内容 另有明确指示。因此,例如,提及“一种蛋白质”包括两种或多种蛋白质的混 合物等。
如本文所用,术语“约”或“大约”是指在给定值或范围的5%内。
如本文所用,术语“核酸”是指核苷酸单体的单链和双链聚合物,包括通 过核苷酸间磷酸二酯键连接的2’-脱氧核糖核苷酸(DNA)和核糖核苷酸 (RNA),或核苷酸间类似物,和相关的抗衡离子,例如H+,NH4+,三烷基铵, 四烷基铵,Mg2+,Na+等。核酸可以是多核苷酸或寡核苷酸。核酸可以完全 由脱氧核糖核苷酸,完全由核糖核苷酸组成,或其嵌合混合物组成。核苷酸 单体单元可以包括本文所述的任何核苷酸,包括但不限于天然存在的核苷酸和核苷酸类似物。核酸的大小范围通常为几个单体单元,例如5-40个,数千 个单体核苷酸单元。核酸包括但不限于基因组DNA,eDNA,hnRNA,mRNA, rRNA,tRNA,片段化核酸,从亚细胞器官如线粒体或叶绿体获得的核酸, 以及从微生物或DNA获得的核酸或RNA病毒,其可以存在于生物样品之上或 之中。
如本文所用,术语“靶核酸”旨在表示作为分析或作用的目标的核酸。分 析或作用包括使核酸经受复制、扩增、测序和/或核酸探询的其它程序。靶核 酸可以包括除了待分析的靶序列之外的核苷酸序列。例如,靶核酸可以包括 一个或多个衔接头,包括作为引物结合位点的衔接头,其位于待分析的靶核 酸序列的侧翼。与捕获寡核苷酸或捕获引物杂交的靶核酸可以含有以下述方 式延伸超过捕获寡核苷酸的5’或3’末端的核苷酸,使得不是所有的靶核酸都 适合延伸。
如本文所用,当用于指代RNA、crRNA或其衍生物或其他核苷酸时,术 语“靶物特异性”是指包括靶多核苷酸序列特异性核苷酸序列的多核苷酸,即 能够选择性退火至靶多核苷酸(例如靶DNA)的鉴定区域的核苷酸序列。靶物 特异性核苷酸可以具有单个种类的寡核苷酸,或者其可以包括具有不同序列 的两个或更多个种类。因此,靶物特异性核苷酸可以是两个或更多个序列, 包括3、4、5、6、7、8、9或10个或更多个不同的序列。在一个实施方案中, crRNA或其衍生物包含与靶DNA序列的区域互补的靶物特异性核苷酸区域。 在一个实施方案中,crRNA或其衍生物可以含有除靶物特异性核苷酸区域之 外的其它核苷酸序列。在一个实施方案中,其他核苷酸序列可以来自 tracrRNA序列。
如本文所用,术语“互补的”当用于指多核苷酸时意指包括能够在某些条 件下选择性退火至靶多核苷酸的鉴定区域的核苷酸序列的多核苷酸。如本文 所用,术语“基本上互补的”和语法等价物旨在表示包括在某些条件下能够特 异性退火至靶多核苷酸的鉴定区域的核苷酸序列的多核苷酸。退火是指一个 核酸与另一个核酸的核苷酸碱基配对相互作用,其导致形成双链体,三链体 或其他更高序结构。主要相互作用通常是通过Watson-Crick和Hoogsteen型氢 键键合的核苷酸碱基特异性,例如A:T、A:U和G:C。在某些实施方案中, 碱基堆积和疏水相互作用也可以有助于双链体稳定性。多核苷酸与靶核酸的 互补或基本互补区域退火的条件是本领域公知的,例如,如Nucleic Acid Hybridization,APractical Approach,Hames and Higgins,eds.,IRL Press, Washington,D.C.(1985)和Wetmur and Davidson,Mol.Biol.31:349(1968)中描 述。退火条件将取决于具体应用,并且可以由本领域技术人员无需过度的实 验常规确定。
如本文所用,术语“杂交”是指其中两个单链多核苷酸非共价结合以形成 稳定的双链多核苷酸的过程。得到的双链多核苷酸是“杂合物”或“双链体”。 杂交条件通常包括小于约1M,更通常小于约500mM且可以小于约200mM的 盐浓度。杂交缓冲液包括缓冲盐溶液,如5%SSPE或本领域已知的其它此类 缓冲液。杂交温度可以低至5℃,但通常大于22℃,更通常大于约30℃,通 常超过37℃。杂交通常在严格条件(即探针将与其靶亚序列杂交,但不与其 它不相容的序列杂交的条件)下进行。严格条件是序列依赖性的,并且在不 同情况下是不同的,并且可以由本领域技术人员常规地确定。
在“多核苷酸”的上下文中,如本文所用的术语“变体”和“衍生物”是指包 含已经通过引入核苷酸取代,缺失或添加改变的多核苷酸或多核苷酸的片段 的核苷酸序列的多核苷酸。多核苷酸的变体或衍生物可以是包含多核苷酸的 核苷酸序列的部分的融合多核苷酸。如本文所用的术语“变体”或“衍生物”还 指已经例如通过将任何类型的分子共价附着至多核苷酸化学修饰的多核苷 酸或其片段。例如但不限于,多核苷酸或其片段可以通过例如乙酰化,磷酸 化,甲基化等进行化学修饰。变体或衍生物以不同于天然存在的或起始核苷 酸或多核苷酸(在所附着的分子的类型或位置上)的方式修饰。变体或衍生物 还包括天然存在于核苷酸或多核苷酸上的一个或多个化学基团的缺失。多核 苷酸或多核苷酸的片段的变体或衍生物可以使用本领域技术人员已知的技 术通过化学修饰进行化学修饰,包括但不限于特异性化学切割、乙酰化、配 制等。此外,多核苷酸或多核苷酸的片段的变体或衍生物可以含有一种或多 种dNTP或核苷酸类似物。多核苷酸变体或衍生物可以具有与本文所述的多 核苷酸或多核苷酸片段相似或相同的功能。与本文所述的多核苷酸或多核苷 酸的片段相比,多核苷酸变体或衍生物可具有额外的或不同的功能。
如本文所用,术语“dNTP”是指脱氧核苷三磷酸。NTP是指核糖核苷三 磷酸,例如用于合成crRNA或tracrRNA的那些。嘌呤碱基(Pu)包括腺嘌呤(A)、 鸟嘌呤(G)及其衍生物和类似物。嘧啶碱基(Py)包括胞嘧啶(C)、胸腺嘧啶(T)、 尿嘧啶(U)及其衍生物和类似物。通过说明而非限制的方式,这些衍生物或 类似物的实例是用报告基团修饰、生物素化、胺修饰、放射性标记、烷基化 的那些衍生物或类似物,并且还包括硫代磷酸酯、亚磷酸酯(phosphate)、环 原子修饰的衍生物。报道基团可以是荧光基团如荧光素,化学发光基团如鲁 米诺(luminal),铽螯合剂如N-(羟乙基)乙二胺三乙酸,其能够通过延迟荧光 检测,等等。
如本文所用,术语“核苷酸类似物”是指具有修饰的核苷酸碱基部分,修 饰的戊糖部分和/或修饰的磷酸酯部分,并且在多核苷酸的情况下,修饰的核 苷酸间连接的合成类似物,如其他地方一般性描述的(例如Scheit,Nucleotide Analogs,John Wiley,NewYork,1980;Englisch,Angew.Chem.Int.Ed.Engl. 30:613-29,1991;Agarwal,Protocolsfor Polynucleotides and Analogs,Humana Press,1994;以及S.Verma and F.Eckstein,Ann.Rev.Biochem.67:99-134, 1998)。示例性的磷酸类似物包括但不限于硫代磷酸酯、二硫代磷酸酯、硒 代磷酸酯,二硒代磷酸酯、苯胺磷酸硫醇酯(Phosphoroanilothioate)、苯胺磷 酸酯(phosphoranilidate)、氨基磷酸酯、硼磷酸酯,包括相关的抗衡离子,例 如H+、NH4+、Na+(若存在此类抗衡离子的话)。示例性修饰的核苷酸碱基部 分包括但不限于5-甲基胞嘧啶(5mC);C-5-丙炔基类似物,包括但不限于C-5 丙炔基-C和C-5丙炔基-U;2,6-二氨基嘌呤,也称为2-氨基腺嘌呤或2-氨基 -dA);次黄嘌呤,假尿苷,2-硫代嘧啶,异胞嘧啶(isoC),5-甲基异C和异鸟 嘌呤(isoG;参见例如美国专利号5,432,272)。示例性的修饰的戊糖部分包括 但不限于锁核酸(LNA)类似物,包括但不限于Bz-A-LNA,5-Me-Bz-C-LNA,dmf-G-LNA和T-LNA(参见例如The Glen Report,16(2):5,2003;Koshkin et al.,Tetrahedron 54:3607-30,1998)和2’-或3’-修饰,其中2’-或3’-位是氢,羟基,烷 氧基(例如甲氧基,乙氧基,烯丙氧基,异丙氧基,丁氧基,异丁氧基和苯 氧基),叠氮基,氨基,烷基氨基,氟,氯或溴。修饰的核苷酸间连接包括 磷酸酯类似物,具有非手性和不带电亚基间连接的类似物(例如Sterchak,E.P. et al.,Organic Chern.,52:4202,1987)和具有非手性亚基间连接的不带电荷的 基于吗啉代的聚合物(参见,美国专利号5,034,506)。一些核苷酸间连接类似 物包括吗啉酯,缩醛和聚酰胺连接的杂环。
如本文所用,术语“连接”及其语法等价物旨在表示在两个或更多个核酸 (例如寡核苷酸和/或多核苷酸)的末端之间形成共价键或连接,通常在模板驱 动的反应中。键或连接的性质可以广泛变化,并且连接可以酶促或化学地进 行。如本文所用,通常进行酶促连接以在一个寡核苷酸的5’碳末端核苷酸与 另一个核苷酸的3’碳之间形成磷酸二酯连接。模板驱动的连接反应描述于以 下参考文献中:美国专利号4,883,750;5,476,930;5,593,826;和5,871,921, 其全部内容通过引用并入本文。术语“连接”还包括磷酸二酯键的非酶形成, 以及寡核苷酸末端之间的非磷酸二酯共价键的形成,如硫代磷酸酯键,二硫 键等。
如本文所用,术语“衔接头”是可以连接到其他核酸末端的单链或双链核 酸分子。在一个实施方案中,衔接头是短的,化学合成的双链核酸分子,其 可用于连接两个其他核酸分子的末端。在一个实施方案中,衔接头是在5’和 /或3’末端包含单链核苷酸突出端的双链核酸(例如,寡核苷酸)。在一些实施 方案中,单链突出端是1、2或更多个核苷酸。在一些实施方案中,衔接头包 含用于克隆或分析“插入物”的另外的核酸序列。在一些实施方案中,衔接头 包含用于分析或纯化“插入物”的标记或亲和标签。术语“插入物”指感兴趣的核酸序列。在一些实施方案中,插入物是在5’和/或3’末端包含单链核苷酸突 出端的双链DNA。在一些实施方案中,单链突出端是1、2或更多个核苷酸。
如本文所用,术语“切口平移”是指通过使用聚合酶用其标记的类似物替 换来自单链核酸缺口的核酸的一些核苷酸,产生有标签的核酸序列的过程。 术语“切口平移聚合酶”是指在切口平移过程中使用的聚合酶,例如DNA聚合 酶。在一个实施方案中,切口平移聚合酶是DNA聚合酶I,其延长3’羟基末 端,通过5’-3’核酸外切酶活性除去核苷酸,用dNTP替代它们。
如本文所用,术语“片段标签化”是指在准备好通过使用转座酶介导的片 段化和标签化测序和簇形成的溶液中将核酸(例如DNA)转化为衔接头修饰 的模板。该过程通常涉及通过转座酶复合物修饰核酸,所述转座酶复合物包 含与包含转座子末端序列的衔接头复合的转座酶。片段标签化导致核酸的同 时片段化和衔接头与双链体片段的两条链的5’端的连接。在除去转座酶的纯 化步骤之后,通过PCR将另外的序列加入加衔接片段的末端。
如本文所用,术语“转座体复合物”是指非共价结合于双链核酸的转座 酶。例如,复合物可以是在支持非共价复合物形成的条件下与双链转座子 DNA预温育的转座酶。双链转座子DNA可以包括但不限于Tn5 DNA,Tn5 DNA的一部分,转座子末端组合物,转座子末端组合物的混合物或能够与转 座酶(如超活性Tn5转座酶)相互作用的其他双链DNA。
“转座酶”是指能够与含有转座子末端的组合物(例如转座子,转座子末 端,转座子末端组合物)形成功能性复合物并催化含有转座子末端的组合物 插入或转座成与其例如在体外转座反应中一起温育的双链靶核酸的酶。如本 文所示的转座酶还可以包括来自反转录转座子(retrotransposons)和逆转录病 毒的整合酶。转座酶、转座体和转座体复合物通常是本领域技术人员已知的, 如US 2010/0120098的公开内容所例示的,其内容通过引用整体并入本文。 尽管本文描述的许多实施方案涉及Tn5转座酶和/或超活性Tn5转座酶,但应 当理解,出于其意图的目的能够以足够的效率插入转座子末端以将靶核酸进 行5’标签化和片段化的任何转座系统可用于本发明。在具体的实施方案中, 优选的转座系统能够将转座子末端以随机或几乎随机的方式插入以将靶核 酸进行5’-标签化和片段化。
如本文所用,术语“转座反应”是指其中一个或多个转座子插入靶核酸, 例如在随机位点或几乎随机位点的反应。转座反应中的基本成分是转座酶和 DNA寡核苷酸,其展示转座子的核苷酸序列,包括转移的转座子序列及其互 补序列(非转移的转座子末端序列)以及形成功能转座或转座体复合物所需的 其它成分。根据需要或期望,DNA寡核苷酸可以进一步包含额外的序列(例 如,衔接头或引物序列)。在一些实施方案中,本文提供的方法通过使用由 高活性Tn5转座酶和Tn5型转座子末端形成的转座复合物(Goryshin andReznikoff,1998,J.Biol.Chem.,273:7367)或通过MuA转座酶和包含R1和R2 末端序列的Mu转座子末端(Mizuuchi,1983,Cell,35:785;Savilahti et al.,1995, EMBO J.,14:4893)例示。然而,出于其意图的目的能够以随机或几乎随机的 方式以足够的效率插入转座子末端以对靶DNA进行5’-标签化和片段化的任 何转座系统都可以用于本发明。可用于本方法的本领域已知的转座系统的实 例包括但不限于金黄色葡萄球菌Tn552(Colegio et al.,2001,J Bacterid.,183: 2384-8;Kirby et al.,2002,MoI Microbiol,43:173-86),TyI(Devine and Boeke, 1994,Nucleic Acids Res.,22:3765-72and International PatentApplication No. WO 95/23875),转座子Tn7(Craig,1996,Science.271:1512;Craig,1996, Review in:Curr Top Microbiol Immunol,204:27-48),Tn10和IS10(Kleckner etal.,1996,Curr Top Microbiol Immunol,204:49-82),Mariner转座酶(Lampe et al.,1996,EMBO J.,15:5470-9),Tci(Plasterk,1996,Curr Top Microbiol Immunol,204:125-43),P元件(Gloor,2004,Methods MoI Biol,260:97-114),TnJ(Ichikawa and Ohtsubo,1990,J Biol Chem.265:18829-32),细菌插入序列 (Ohtsubo and Sekine,1996,Curr.Top.Microbiol.Immunol.204:1-26),逆转录病 毒(Brown et al.,1989,Proc NatlAcad Sci USA,86:2525-9)和酵母的反转录转 座子(Boeke and Corces,1989,Annu RevMicrobiol.43:403-34)。用于将转座子 末端插入靶序列的方法可以使用任何合适的转座子系统在体外进行,对于所 述转座子系统可获得合适的体外转座系统或可以基于本领域的知识开发。通 常,用于本文提供的方法中的合适的体外转座系统至少需要具有足够纯度, 足够浓度和足够的体外转座活性的转座酶和转座酶藉此与具有能够催化转 座反应的相应转座酶形成功能性复合物的转座子末端。可用于本发明的合适 的转座酶转座子末端序列包括但不限于与转座酶形成复合物的野生型,衍生 物或突变体转座子末端序列,所述转座酶选自转座酶的野生型,衍生物或突 变形式。
术语“转座子末端”(TE)指仅展现出与转座酶或整合酶形成复合物必需的 核苷酸序列(“转座子末端序列”)的双链核酸,例如双链DNA,所述转座酶或 整合酶在体外转座反应中具有功能。在一些实施方案中,转座子末端能够在 转座反应中与转座酶形成功能性复合物。作为非限制性实例,转座子末端可 包括19-bp外端(“OE”)转座子末端、内端(“IE”)转座子末端或“嵌合末端 (mosaic end)”转座子末端(其由突变体或突变体Tn5转座酶识别),或R1和R2 转座子末端,如US 2010/0120098的公开内容中列出,其内容通过引用整体 并入本文。转座子末端可以包括适合于在体外转座反应中与转座酶或整合酶 形成功能性复合物的任何核酸或核酸类似物。例如,转座子末端可以包括 DNA,RNA,修饰的碱基,非天然碱基,修饰的主链,并且可以包括一条或 两条链中的切口。虽然术语“DNA”有时与转座子末端的组成结合在本公开中 使用,但应理解任何合适的核酸或核酸类似物可用于转座子末端。
如本文所用,术语“固体表面”,“固体支持物”和其它语法等价物在本文 中是指适合于或可修饰为适合于附着多核苷酸的任何材料。可能的基底包括 但不限于玻璃和改性或功能化玻璃,塑料(包括丙烯酸树脂,聚苯乙烯和苯 乙烯和其它材料的共聚物,聚丙烯,聚乙烯,聚丁烯,聚氨酯,TeflonTM等), 多糖,尼龙或硝化纤维,陶瓷,树脂,二氧化硅或基于二氧化硅的材料,包 括硅和改性硅,碳,金属,无机玻璃,塑料,光纤束和多种其它聚合物。在 一些实施方案中,固体支持物和固体表面位于流动池装置内。在一些实施方 案中,固体支持物包含适合于以有序模式固定化分子的图案化表面。“图案 化表面”是指在固体支持物的暴露层中或上的不同区域的排列。在一些实施 方案中,固体支持物包括表面中的孔或凹陷的阵列。固体支持物的组成和几 何形状可随其用途而变化。在一些实施方案中,固体支持物是平面结构,如 载玻片,芯片,微芯片和/或阵列。因此,基底的表面可以是平面层的形式。 在一些实施方案中,固体支持物包含流动池的一个或多个表面。如本文所用 的术语“流通池”是指包括一种或多种流体试剂可以流过的固体表面的室。可 容易地用于本公开的方法中的流动池和相关流体系统和检测平台的实例描 述于例如Bentley et al.,Nature 456:53-59(2008),WO 04/018497;US 7,057,026; WO 91/06678;WO 07/123744;US7,329,492;US 7,211,414;US 7,315,019;US 7,405,281,以及US 2008/0108082,其各自通过引用并入本文。在一些实施方 案中,固体支持物或其表面是非平面的,如管或容器的内表面或外表面。在 一些实施方案中,固体支持物包含微球或珠。本文中的“微球”,“珠”,“颗粒” 或语法等价物旨在表示由各种材料制成的小离散颗粒,包括但不限于塑料, 陶瓷,玻璃和聚苯乙烯。在某些实施方案中,微球体是磁性微球体或珠粒。 或者/另外,珠粒可以是多孔的。珠粒尺寸范围从纳米,例如100nm,至几 毫米,例如1mm。
如本文所用,术语“CRISPR-Cas系统”是指下述酶系统,其包括含有与靶 多核苷酸区域互补或基本互补的核苷酸序列的引导RNA序列和具有核酸酶 活性的蛋白质。CRISPR-Cas系统包括I型CRISPR-Cas系统,II型CRISPR-Cas 系统,III型CRISPR-Cas系统及其衍生物CRISPR-Cas系统包括衍生自天然产 生的CRISPR-Cas系统的工程化和/或程序化的核酸酶系统。CRISPR-Cas系统 可以包含工程化和/或突变的Cas蛋白。CRISPR-Cas系统可含有工程化和/或 程序化的指导RNA。
如本文所用,术语“指导RNA”是指含有与靶DNA序列的区域互补或基本 互补的序列的RNA。指导RNA可以含有除了与靶DNA序列的区域互补或基 本上互补的区域以外的核苷酸序列。指导RNA可以是crRNA或其衍生物,例 如crRNA:tracrRNA嵌合体。
如本文所用,术语“核酸酶”是指能够切割核酸的核苷酸亚基之间的磷酸 二酯键的酶;术语“内切核酸酶”是指能够切割多核苷酸链内的磷酸二酯键的 酶;并且术语“切口酶”是指仅切割DNA双链体的单链的内切核酸酶。术语 “Cas9切口酶”是指衍生自Cas9蛋白的切口酶,通常通过使Cas9蛋白的一个核 酸酶结构域失活。
在多肽的上下文中,如本文所用的术语“变体”和“衍生物”是指包含已经 通过引入氨基酸残基取代,缺失或添加改变的多肽或多肽片段的氨基酸序列 的多肽。多肽的变体或衍生物可以是包含多肽的氨基酸序列的部分的融合蛋 白。本文所用的术语“变体”或“衍生物”还指多肽或多肽的片段,其已经例如 通过将任何类型的分子共价附着至多肽而化学修饰。例如但不限于,多肽或 多肽片段可以通过例如糖基化、乙酰化、聚乙二醇化、磷酸化、酰胺化,通 过已知的保护/封闭基团的衍生化、蛋白水解切割、与细胞配体或其它蛋白质连接等化学修饰。变体或衍生物以不同于天然存在的或起始的肽或多肽(在 附着的分子的类型或位置上)的方式修饰。变体或衍生物进一步包括天然存 在于肽或多肽上的一个或多个化学基团的缺失。可以使用本领域技术人员已 知的技术通过化学修饰来化学修饰多肽或多肽的片段的变体或衍生物,所述 技术包括但不限于特异性化学切割,乙酰化,配制,衣霉素(tunicamycin)的 代谢合成等。此外,多肽或多肽的片段的变体或衍生物可以含有一个或多个 非经典氨基酸。多肽变体或衍生物可以具有与本文所述多肽或多肽片段相似 或相同的功能。与本文所述多肽或多肽片段相比,多肽变体或衍生物可具有 额外的或不同的功能。
如本文所用,术语“标记”是指此类过程,其中修饰组分(例如RNA或蛋 白质),例如结合另一分子,以便于促进该组分及其相关元件的分离。在一 个实施方案中,标记CRISPR-Cas系统中的RNA。在一些实施方案中,用生 物素化的dNTP标记RNA。在一些实施方案中,用另一多核苷酸探针标记 RNA。多核苷酸探针可以包含与RNA的区域基本上互补的序列。在一些实施 方案中,用衔接头标记RNA末端。在一个实施方案中,蛋白质(例如Cas蛋白) 用捕获标签标记。如本文所用的术语“捕获标签”是指在下拉方案中用作靶物 的分子。在一些实施方案中,捕获标签是亲和标签。如本文所用的术语“亲 和标签”是指在某些条件下(称为“结合条件”)对另一物质具有亲和力并“结 合”以形成“特异性结合对”的分子。例如,生物素和链霉亲合素,生物素和 亲合素或地高辛(digoxigenin)和结合地高辛的特异性抗体是“特异性结合对” 的实例。
在一些实施方案中,一种或多种以下Cas9复合物组分可以用结合标签标 记:Cas9酶,crRNA,tracrRNA和靶向置换环的DNA探针标记。在一些实施 方案中,结合标签是生物素或其功能类似物。
在用结合标签标记Cas9酶的某些实施方案中,可以对蛋白质以化学方式 加标签。例如,化学生物素化Cas9可以。作为另一个实例,可以通过添加编 码与Cas9基因的融合物的额外序列参见融合。在这些实施方案中有用的融合 物的一个实例是AviTagTM,其采用单一生物素在独特的15个氨基酸的肽标签 上的高度靶向的酶缀合。
在用结合标签标记crRNA的某些实施方案中,可以使用掺入一种或多种 生物素化核苷酸(如例如生物素化尿嘧啶)的体外转录(IVT)标记整个crRNA。 在一些实施方案中,生物素可以化学或酶促加入crRNA,例如在crRNA的3’ 末端加入2个生物素基团(双生物素)。
在用结合标签标记tracrRNA的某些实施方案中,可以使用掺入一种或多 种生物素化核苷酸(例如生物素化尿嘧啶)的体外转录(IVT)标记整个 tracrRNA。在一些实施方案中,生物素可以化学或酶促加入tracrRNA中,例 如在tracrRNA的3’端加入2个生物素基团(双生物素)。
在用结合标签标记靶向置换环的探针的某些实施方案中,可以通过在寡 核苷酸探针的5’端加入生物素基团来合成具有感兴趣的特定序列的寡核苷 酸。例如,可以在合成期间将一个或多个生物素化的磷酸酰胺掺入寡核苷酸 中。
如本文所用,在富集靶多核苷酸的上下文中,术语“富集”是指在多核苷 酸群体中导致更高百分比的靶多核苷酸的过程。在一个实施方案中,百分比 增加约5%,10%,20%,30%,40%,50%,60%,70%,80%,90%或100%。 在一个实施方案中,百分比增加约2倍,5倍,10倍,50倍或100倍。在一个 实施方案中,靶多核苷酸基本上从多核苷酸群体中分离。
如本文所用,术语“检测”核酸分子或其片段是指确定核酸分子的存在, 通常当核酸分子或其片段已经完全或部分地与样品或组合物分开,并且还可 以包括确定核酸分子或其片段的电荷与质量比,质量,量,吸光度,荧光或 其它性质。
如本文所用,术语“单核苷酸多态性(SNP)”是指当基因组(或其他共有序 列)中的单个核苷酸-A,T,C或G在物种成员之间(或个体中配对的染色体之 间)不同时发生的DNA序列变异。
如本文所用,术语“单核苷酸变体(SNV)”是指包括单核苷酸多态性(SNP) 或点突变位点的一种基因型或多核苷酸。
如本文所用,术语“受试者”和“患者”可互换使用。如本文所用,受试者 优选为哺乳动物,例如非灵长类动物(例如牛,猪,马,猫,狗,大鼠等)或 灵长类动物(例如猴和人)。在具体实施方案中,受试者是人。在一个实施方 案中,受试者是具有癌症的哺乳动物(例如,人)。
如本文所用,术语“单倍型”,“单倍体基因型”和本文其他语法等价物是 指存在于单个母本或父本染色体上的一组核苷酸序列多态性或等位基因,通 常作为单位遗传。
如本文所用,当在基因组或染色体的上下文中使用时,术语“定相测序”, “单倍型测序”和其他语法等价物是指分别确定单个基因组或单个染色体的 核酸序列,其中核酸序列从单个基因组或单个染色体的测序获得。当在染色 体片段的上下文中使用时,术语“定相测序”,“单元型测序”和其它语法等价 物是指确定单个染色体片段的核酸序列,其中该核酸序列是从单个染色体片 段的测序获得。
富集多核苷酸的方法
在一个方面,本公开提供了使用衍生自CRISPR-Cas系统的内切核酸酶系 统富集靶核酸的方法。本公开部分地基于CRISPR-Cas系统与靶核酸特异性结 合的能力。通过CRISPR-Cas系统的这种靶物特异性结合提供了有效富集靶核 酸的方法,例如通过下拉与靶核酸相关的CRISPR-Cas元件。CRISPR-Cas介 导的核酸富集绕过传统上在靶物特异性结合之前产生单链核酸的所需步骤, 并且能够直接靶向双链核酸,如双链DNA(dsDNA)。此外,CRISPR-Cas介导 的核酸结合是酶驱动的,因此它可以提供更快的动力学和更容易的工作流程 用于在较低温度和/或等温反应条件下富集。
在一个实施方案中,本公开提供了用于富集靶核酸的方法,包括:提供 具有聚簇规则间隔短回文重复(CRISPR)RNA(crRNA)或其衍生物的内切核酸 酶系统,和CRISPR相关(Cas)蛋白或其变体,其中所述crRNA或其衍生物包 含与所述靶核酸的区域互补的靶物特异性核苷酸区域;使所述靶核酸与所述 内切核酸酶系统接触以形成复合物,以及分离所述复合物,从而富集所述靶 核酸。
在一些实施方案中,本文提供的方法还包括从复合物中分离靶核酸。在 一个实施方案中,一旦CRISPR-Cas系统已经发现靶定区域,则其可以结合到 表面,例如在平板中。这可以防止复合物过早解离,从而提高捕获的效率。 在一些实施方案中,本文提供的方法还包括扩增靶核酸序列。
如图1所示,提供了CRISPR-Cas系统,例如II型CRISPR-Cas系统,并且 酶系统接触靶DNA以形成复合物。图1的右侧部分显示了CRISPR-Cas系统- 靶DNA复合物。如图所示,引导RNA用例如生物素化的dUTP标记,因此可 以通过下拉标记的RNA来分离复合物。
在一些实施方案中,本文提供的靶核酸是双链DNA(dsDNA)。某些 CRISPR-Cas系统,例如II型CRISPR-Cas系统,以酶驱动和序列特异性方式结 合双链DNA。因此,本文提供的一个优点是直接靶向双链DNA,而不是加 工的单链DNA,用于富集。
本文提供的内切核酸酶系统衍生自CRISPR-Cas系统。在一些实施方案 中,本文提供的内切核酸酶系统是I型CRISPR-Cas系统或其衍生物。在一些 实施方案中,本文提供的内切核酸酶系统是II型CRISPR-Cas系统。在一些实 施方案中,本文提供的内切核酸酶系统是III型CRISPR-Cas系统或其衍生物。 本文提供的CRISPR-Cas系统包括衍生自天然存在的CRISPR-Cas系统的工程 化和/或程序化的核酸酶系统。CRISPR-Cas系统可以包含工程化和/或突变的 Cas蛋白。CRISPR-Cas系统还可以包含工程化和/或程序化的指导RNA。例如,在一些实施方案中,使用含有T7启动子的合成双链DNA模板,通过体外转录 合成crRNA和tracrRNA。tracrRNA具有固定序列,而靶序列指示crRNA序列 的部分。将等摩尔的crRNA和tracrRNA混合并在55℃加热30秒。Cas9在37℃ 下以相同的摩尔浓度加入,并与RNA混合物温育10分钟。然后将10-20倍摩 尔过量的Cas9复合物加入靶DNA中。切割/结合反应可以在15分钟内发生。
CRISPR-Cas系统的关键要素包括指导RNA,例如crRNA和Cas蛋白。 crRNA或其衍生物包含与靶核酸的区域互补或基本上互补的靶物特异性核 苷酸区域。在一些实施方案中,crRNA或其衍生物包含允许将酶特异性靶向 互补双链DNA的用户可选择的RNA序列。在一些实施方案中,用户可选择的 RNA序列含有与靶DNA序列的区域互补或基本上互补的20-50个核苷酸。在 一些实施方案中,crRNA的靶物特异性核苷酸区域具有与靶核酸的区域的100%碱基对匹配。在一些实施方案中,crRNA的靶物特异性核苷酸区域具有 与靶核酸的区域的90%-100%,80%-100%或70%-100%的碱基对匹配。在一 些实施方案中,在crRNA的靶物特异性核苷酸区域和靶核酸的区域之间存在 一个碱基对错配。在一些实施方案中,在crRNA的靶物特异性核苷酸区域和 靶核酸的区域之间存在两个碱基对错配。在一些实施方案中,在crRNA的靶 物特异性核苷酸区域和靶核酸的区域之间存在三个碱基对错配。在一些实施 方案中,在crRNA的靶物特异性核苷酸区域和靶核酸的区域之间存在四个碱 基对错配。在一些实施方案中,在crRNA的靶物特异性核苷酸区域和靶核酸 的区域之间存在五个碱基对错配。
在一些实施方案中,本文提供的内切核酸酶系统进一步包括反式激活 crRNA(tracrRNA)或其衍生物。在一些实施方案中,本文提供的crRNA或其 衍生物是具有与tracrRNA多核苷酸融合的crRNA多核苷酸的多核苷酸。嵌合 单指导RNA(sgRNA)描述于Jinek et al.,2012,Science 337,816-821中,其全部 内容并入本文。在一个实施方案中,本文提供的Cas蛋白或其变体可以通过 嵌合sgRNA指导后面有5’-NGG原间隔物(protospacer)相邻基序(PAM)的任何 基因组基因座。
在一些实施方案中,Cas蛋白或其变体是Cas9蛋白或其变体。来自嗜热 链球菌(S.thermophilus)CRISPR-Cas系统的分离的Cas9-crRNA复合物以及从 分离的组分体外组装的复合物证明其结合于具有与crRNA互补的核苷酸序 列的合成寡脱氧核苷酸和质粒DNA两者。已经显示Cas9具有两个核酸酶结构 域-RuvC-和HNH-活性位点/核酸酶结构域,并且这两个核酸酶结构域负责相 对的DNA链的切割。在一些实施方案中,Cas9蛋白来源于嗜热链球菌 CRISPR-Cas系统的Cas9蛋白。在一些实施方案中,Cas9蛋白是具有约1,409 个氨基酸残基的多结构域蛋白。
在一些实施方案中,Cas9蛋白或其变体保留两个核酸酶结构域,并且能 够切割相对的DNA链并产生双链DNA断裂。本方法部分基于令人惊奇的发 现,即保留两个核酸酶结构域的野生型Cas9蛋白可以在DNA切割后以足够的 强度和长度保留在结合位点,使得能够将DNA内切核酸酶系统复合物通过内 切核酸酶系统下拉。如图2A-2B所示,将含有野生型Cas9蛋白的CRISPR-Cas 系统加入含有靶Braf序列的溶液中。该系统用生物素化的dUTP标记,并加入 链霉亲合素珠以下拉系统与其相关的DNA片段。如图2A-2B的右图所示,从 珠洗脱中检测到切割的DNA片段,表明切割后酶系统和DNA之间的关联。
在其它实施方案中,Cas9蛋白或其变体是Cas9切口酶,并且能够产生单 链核酸缺口,例如单链DNA切口。Cas9蛋白的切口酶变体在创建切口后与靶 核酸保持在一起,因此其可以用于靶物特异性富集。在一些实施方案中,仅 突变和失活RuvC-核酸酶结构域。在一些实施方案中,仅突变和失活HNH- 核酸酶结构域。在一些实施方案中,Cas9蛋白含有一个失活的核酸酶结构域, 其具有在切割与crRNA互补的靶核酸链的结构域中的突变。在一个实施方案 中,突变是D10A。在一些实施方案中,Cas9蛋白含有一个失活的核酸酶结 构域,其具有在切割与crRNA不互补的靶核酸链的结构域中的突变。在一个 实施方案中,突变是H840A。
在一些实施方案中,本方法可用于富集核酸片段文库中的靶核酸片段, 例如使用Illumina的Nextera文库制备物制备。图2C显示了Cas9切口酶介导的 从Nextera质粒文库制备的片段的富集。如图所示,含有Braf靶位点的质粒首 先进行Tn5介导的片段标签化以产生DNA片段群体。然后将包含Cas9切口酶 和靶向Braf序列的生物素标记的crRNA的CRISPR-Cas9系统加入片段中。 CRISPR-Cas9系统特异性结合含有Braf序列的DNA片段。通过使用链霉亲合 素珠下拉生物素及其相关组分,富含含有Braf序列的DNA片段。从蛋白质洗 脱后,可以将富集的DNA片段进一步进行DNA扩增和测序。
在其它实施方案中,Cas9蛋白或其变体是Cas9蛋白的核酸酶无效变体, 其中RuvC-和HNH-活性位点/核酸酶结构域都是突变的。Cas9蛋白的核酸酶 无效变体与双链DNA结合,但不切割DNA,因此其也可用于靶物特异性DNA 富集。在一些实施方案中,Cas9蛋白具有两个失活的核酸酶结构域,其具有 在切割与crRNA互补的链的结构域中的第一突变和在切割与crRNA不互补的 链的结构域中的第二突变。在一些实施方案中,Cas9蛋白具有第一突变D10A 和第二突变H840A。
可以通过下拉其相关的CRISPR-Cas系统来分离靶核酸。在一些实施方案 中,标记内切核酸酶系统,并且通过标记物下拉将酶-核酸复合物。在一些 实施方案中,标记crRNA或其衍生物。在一个实施方案中,如上所述,用生 物素标记crRNA。在其他实施方案中,如上所述标记tracrRNA。在其它实施 方案中,Cas蛋白或其变体用捕获标签标记。蛋白质捕获标签包括但不限于 GST,Myc,血凝素(HA),绿色荧光蛋白(GFP),flag,His标签,TAP标签和 Fc标签。本领域公认的其它蛋白质捕获标签,例如亲和标签,也可以用于本 发明的方法中。本领域技术人员将认识到,选择用于纯化步骤的方案将特异 于所使用的标签。在一些实施方案中,抗Cas蛋白抗体或其片段,例如抗Cas9 抗体,也可用于分离复合物。
在另一方面,指导RNA与靶双链核酸的区域的结合破坏靶核酸的两条链 之间的相互作用,从而产生环结构,暴露与指导RNA不互补链的链。该暴露 的链可以与本文提供的另一种核苷酸探针杂交。本文方法提供的一个优点是 富集的双特异性:一个来自crRNA的和另一个来自探针。在一个实施方案中, 本公开提供了用于富集靶双链核酸的方法,包括提供具有聚簇规则间隔短回 文重复(CRISPR)RNA(crRNA)或其衍生物的内切核酸酶系统和CRISPR相关 的Cas)蛋白或其变体,其中所述crRNA或其衍生物包含与所述靶双链核酸的第一链的区域互补的靶物特异性核苷酸区域;使所述靶双链核酸与所述内切 核酸酶系统接触以形成第一复合物;使标记的核酸与所述靶双链核酸的第二 链杂交以形成第二复合物,所述靶双链核酸的第二链与所述crRNA或其衍生 物不互补,并且分离第二复合物,从而富集靶核酸。
如图3所示,crRNA(指导RNA或gRNA)与靶双链DNA的一条链杂交以形 成复合物,并产生置换环。提供标记的(例如,生物素标记的)核酸探针,靶 向该置换环并与靶双链DNA的另一条链杂交,以形成标记的复合物。然后可 以通过下拉标记的复合物来富集靶双链DNA。
在一些实施方案中,本公开的方法还包括将靶双链DNA序列与第二复合 物分离。在一些实施方案中,本申请的方法还包括扩增靶向的双链DNA序列。
在一些实施方案中,本文提供的靶核酸是双链DNA(dsDNA)。在一些实 施方案中,本文提供的内切核酸酶系统是I型CRISPR-Cas系统或其衍生物。 在一些实施方案中,本文提供的内切核酸酶系统是II型CRISPR-Cas系统。在 一些实施方案中,本文提供的内切核酸酶系统是III型CRISPR-Cas系统或其衍 生物。本文提供的CRISPR-Cas系统包括来源于天然产生的CRISPR-Cas系统 的工程化和/或程序化的核酸酶系统。CRISPR-Cas系统可以包含工程化和/ 或突变的Cas蛋白。CRISPR-Cas系统还可以包含工程化和/或程序化的指导 RNA。
在一些实施方案中,crRNA或其衍生物含有允许将酶特异性靶向互补双 链DNA的用户可选择的RNA序列。在一些实施方案中,用户可选择的RNA 序列含有与靶DNA序列的区域互补或基本上互补的20-50个核苷酸。在一些 实施方案中,crRNA的靶物特异性核苷酸区域具有与靶核酸的区域的100% 碱基对匹配。在一些实施方案中,crRNA的靶物特异性核苷酸区域具有与靶 核酸的区域的90%-100%,80%-100%或70%-100%的碱基对匹配。在一些实 施方案中,在crRNA的靶物特异性核苷酸区域和靶核酸的区域之间存在一个 碱基对错配。在一些实施方案中,在crRNA的靶物特异性核苷酸区域和靶核 酸的区域之间存在两个,三个,四个或五个碱基对错配。
在一些实施方案中,本文提供的内切核酸酶系统进一步包括反式激活 crRNA(tracrRNA)或其衍生物。在一些实施方案中,本文提供的crRNA或其 衍生物是具有与tracrRNA多核苷酸融合的crRNA多核苷酸的多核苷酸。在一 个实施方案中,本文提供的Cas蛋白或其变体可以通过嵌合sgRNA指导后面 有5’-NGG原间隔物相邻基序(PAM)的任何基因组基因座。
在一些实施方案中,Cas蛋白或其变体是Cas9蛋白或其变体。在一些实 施方案中,Cas9蛋白衍生自嗜热链球菌CRISPR-Cas系统的Cas9蛋白。在一些 实施方案中,Cas9蛋白是约1,409个氨基酸残基的多结构域蛋白。
在一些实施方案中,Cas9蛋白或其变体保留两个核酸酶结构域,并且能 够切割相对的DNA链并产生双链DNA断裂。在其它实施方案中,Cas9蛋白 或其变体是Cas9切口酶,并且能够产生单链核酸切口,例如单链DNA切口。 在一些实施方案中,仅突变和失活RuvC-核酸酶结构域。在一些实施方案中, 仅突变和失活HNH-核酸酶结构域。在一些实施方案中,Cas9蛋白含有一个 失活的核酸酶结构域,其具有在切割与crRNA互补的靶核酸链的结构域中的 突变。在一个实施方案中,突变是D10A。在一些实施方案中,Cas9蛋白含 有一个失活的核酸酶结构域,其具有在切割与crRNA不互补的靶核酸链的结 构域中的突变。在一个实施方案中,突变是H840A。在其它实施方案中,Cas9 蛋白或其变体是Cas9蛋白的核酸酶无效变体,其中RuvC-和HNH-活性位点/ 核酸酶结构域都被突变。Cas9蛋白的核酸酶无效变体与双链DNA结合,但不 切割DNA,因此其也可用于靶物特异性DNA富集。在一些实施方案中,Cas9 蛋白具有两个失活的核酸酶结构域,其具有在切割与crRNA互补的链的结构 域中的第一突变和在切割与crRNA不互补的链的结构域中的第二突变。在一 些实施方案中,Cas9蛋白具有第一突变D10A和第二突变H840A。
在另一方面,可以片段化靶核酸并连接到衔接头,制备好用于其它程序 如测序。在一些实施方案中,靶核酸进一步进行转座酶介导的片段标签化, 其导致靶核酸的片段化和衔接头连接到双链DNA片段的两条链的5’端。任选 地,可以将靶核酸片段化,并且可以使用如美国公开号2010/0120098中所述 的片段标签化或转座将衔接头加入5’和3’末端,其通过引用整体并入本文。 简言之,转座反应是其中一个或多个转座子在随机位点插入靶核酸的反应。 转座反应中的基本成分是转座酶和DNA寡核苷酸,其展示转座子的核苷酸序列,包括转移的转座子序列及其互补序列(非转移的转座子末端序列)以及形 成功能转座或转座体复合物所需的其它成分。根据需要或期望,DNA寡核苷 酸可以进一步包括另外的序列(例如,衔接头或引物序列)。适用于本文提供 的方法的示例性转座复合物包括但不限于由高活性Tn5转座酶和Tn5型转座 子末端或由MuA转座酶和包含R1和R2末端的Mu转座子末端形成的那些序 列(参见,例如,Goryshin and Reznikoff,J.Biol.Chem.273:7367,1998;and Mizuuchi,Cell 35:785,1983;Savilahti et al.,EMBO J.14:4893,1995;本文参 考)。然而,出于其意图的目的能够以足够的效率插入转座子末端以将靶核 酸标签化的任何转座系统可以用于所提供的方法中。可用于所提供的方法的 已知转座系统的其它实例包括但不限于金黄色葡萄球菌Tn552,Ty1,转座子 Tn7,Tn/O和IS10,Mariner转座酶,Tel,P元件,Tn3,细菌插入序列,逆转 录病毒和逆转录转座子(参见例如Colegio et al.,2001,J.Bacteriol.183:2384-8; kirby et al.,2002,Mol.Microbiol.43:173-86;Devineand Boeke,1994,Nucleic Acids Res.,22:3765-72;International Patent ApplicationNo.WO 95/23875; Craig,1996,Science 271:1512;Craig,1996,Review in:Curr TopMicrobiol Immunol.204:27-48;Kleckner et al.,1996,Curr Top MicrobiolImmunol.204: 49-82;Lampe et al.,1996,EMBO J.15:5470-9;Plasterk,1996,Curr TopMicrobiol Immunol 204:125-43;Gloor,2004,Methods Mol.Biol.260:97-114; Ichikawaand Ohtsubo,1990,J Biol.Chem.265:18829-32;Ohtsubo and Sekine, 1996,Curr.Top.Microbiol.Immunol.204:1-26;Brown et al.,1989,Proc Natl Acad Sci USA86:2525-9;Boeke and Corces,1989,Annu Rev Microbiol.43: 403-34;其全部内容通过引用并入本文)。在一些实施方案中,本公开的方法 还包括除去转座酶并通过PCR加入改编(adapted)的DNA片段的末端。
在一些实施方案中,在靶核酸富集后进行片段标签化。在一个实施方案 中,如图4A和4F所示,加入含有Cas9蛋白和crRNA-tracrRNA嵌合体的 CRISPR-Cas系统,并结合靶DNA序列以形成复合物。Cas9蛋白用捕获标签 标记,通过所述捕获标签分离复合物。然后从复合物中分离目标DNA并进行 片段标签化。
在一些实施方案中,CRISPR-Cas系统中的RNA,例如crRNA或其衍生物, sgRNA和tracrRNA或其衍生物含有转座子末端,并且本发明的方法还包括加 入转座酶。加入的转座酶可以装配在转座子末端,并且靶DNA因此被转座酶 切割。在一些实施方案中,转座子末端是嵌合末端(ME),并且转座酶是Tn5 转座酶。在一个实施方案中,如图4B所示,CRISPR-Cas系统含有携带转座 子末端(ME)的标记的Cas9蛋白和crRNA-tracrRNA嵌合体。加入系统并结合 靶DNA序列以形成复合物。加入转座酶(Tn5)并装配在ME序列上,从而切割 DNA。
在一些实施方案中,本文提供的内切核酸酶系统进一步包括转座酶,因 此转座酶是内切核酸酶系统的一部分,并且本公开的方法还包括将转座子末 端加入靶DNA序列;和通过转座酶将靶DNA序列进行片段标签化。在一些 实施方案中,转座酶结合核酸内切酶系统的核苷酸序列。在一些实施方案中, 转座酶结合crRNA或其衍生物。在一些实施方案中,转座酶结合tracrRNA或 其衍生物。在一些实施方案中,转座酶结合sgRNA或具有crRNA多核苷酸和 tracrRNA多核苷酸的嵌合多核苷酸。在一些实施方案中,转座子末端是嵌合 末端(ME),并且转座酶是Tn5转座酶。如图4C所示,在一个实施方案中,转 座酶(Tn5)通过连接到crRNA-tracrRNA嵌合体的适体结合内切核酸酶系统。 因此,Tn5在不借助ME序列的情况下与系统结合。加入含有Tn5的内切核酸 酶系统并结合靶DNA。然后,将ME序列加入DNA,因此可以通过Tn5将DNA 进行片段标签化。如图4D所示,在另一个实施方案中,本文提供的转座酶和 本文提供的Cas蛋白形成融合蛋白。加入含有Tn5的内切核酸酶系统并结合靶 DNA。然后,将ME序列加入DNA,因此可以通过Tn5将DNA片段标签化, 并且可以引入序列,例如索引(index)或通用引物序列。
图4E显示了使用本文提供的方法富集靶核酸的方法。如图所示,将Tn5 系统和CRISPR-Cas9系统加入含有靶核酸的核酸群体中。CRISPR-Cas9系统 含有具有两个核酸酶结构域的Cas9。因此,Tn5系统和CRISPR-Cas9系统都 可以切割核酸,并且在切割后,这两个系统都与核酸的切割末端保持在一起。 标记CRISPR-Cas9系统,藉此可以下拉靶核酸。在用蛋白酶处理后,释放从 靶核酸产生的DNA片段,并且可以进行进一步的扩增和/或文库制备。
在另一方面,本公开提供了使用CRISPR-Cas系统富集和/或检测细胞游 离DNA群体中的靶核酸的方法。血浆或血清中的细胞游离DNA在许多医学 领域作为非侵入性诊断工具具有巨大的潜力。例如,已经研究了细胞游离胎 儿DNA,甚至优化用于测试不相容的RhD因子,X连锁遗传疾病的性别确定, 单基因病症的测试,先兆子痫的鉴定等。例如,对母体血浆中的细胞游离DNA 的胎儿细胞级份测序是检测与胎儿染色体非整倍性(anueploidy)相关的拷贝 数变化的可靠方法。另一种情况,对从癌症患者分离的细胞游离DNA(也称 为循环肿瘤DNA)测序已用于检测与治疗决定相关的关键基因中的突变。本 公开提供了用于改善细胞游离DNA中的靶DNA序列的富集和/或检测的方 法。
在一些实施方案中,本公开提供了用于富集靶核酸的方法,包括从受试 者的血浆或血清获得细胞游离DNA(cfDNA)群体,包含靶核酸的细胞游离 DNA群体;提供具有聚簇规则间隔短回文重复(CRISPR)RNA(crRNA)或其衍 生物和CRISPR相关的(Cas)蛋白或其变体的内切核酸酶系统,其中所述 crRNA或其衍生物包含靶物特异性与靶核酸的区域互补的核苷酸区域;使所 述靶核酸与所述内切核酸酶系统接触以形成复合物,以及分离所述复合物, 从而富集所述靶核酸。
在一些实施方案中,本文提供的方法还包括从复合物中分离靶DNA序 列。在一些实施方案中,本文提供的方法还包括扩增靶DNA序列。在一些实 施方案中,本文提供的靶核酸是双链DNA(dsDNA)。
在一些实施方案中,本文提供的内切核酸酶系统是I型CRISPR-Cas系统 或其衍生物。在一些实施方案中,本文提供的内切核酸酶系统是II型 CRISPR-Cas系统。在一些实施方案中,本文提供的内切核酸酶系统是III型 CRISPR-Cas系统或其衍生物。本文提供的CRISPR-Cas系统包括来源于天然 产生的CRISPR-Cas系统的工程化和/或程序化的核酸酶系统。CRISPR-Cas系 统可以包含工程化和/或突变的Cas蛋白。CRISPR-Cas系统还可以包含工程 化和/或程序化的指导RNA。
在一些实施方案中,crRNA或其衍生物包含允许将酶特异性靶向互补双 链DNA的用户可选择的RNA序列。在一些实施方案中,用户可选择的RNA 序列含有与靶DNA序列的区域互补或基本上互补的20-50个核苷酸。在一些 实施方案中,crRNA的靶物特异性核苷酸区域具有与靶核酸的区域的100% 碱基对匹配。在一些实施方案中,在crRNA的靶物特异性核苷酸区域和靶核 酸的区域之间存在一个碱基对错配。在一些实施方案中,在crRNA的靶物特 异性核苷酸区域和靶核酸的区域之间存在两个,三个,四个或五个碱基对错 配。
在一些实施方案中,本文提供的内切核酸酶系统还包括反式激活 crRNA(tracrRNA)或其衍生物。在一些实施方案中,本文提供的crRNA或其 衍生物是具有与tracrRNA多核苷酸融合的crRNA多核苷酸的多核苷酸。在一 个实施方案中,本文提供的Cas蛋白或其变体可以通过嵌合sgRNA指导后面 有5’-NGG原间隔物相邻基序(PAM)的任何基因组座位。
在一些实施方案中,Cas蛋白或其变体是Cas9蛋白或其变体。在一些实 施方案中,Cas9蛋白衍生自嗜热链球菌CRISPR-Cas系统的Cas9蛋白。在一些 实施方案中,Cas9蛋白是约1,409个氨基酸残基的多结构域蛋白。
在一些实施方案中,Cas9蛋白或其变体保留两个核酸酶结构域,并且能 够切割相对的DNA链并产生双链DNA断裂。在其它实施方案中,Cas9蛋白 或其变体是Cas9切口酶,并且能够产生单链核酸切口,例如单链DNA切口。 在一些实施方案中,仅突变和失活RuvC-核酸酶结构域。在一些实施方案中, 仅突变和失活HNH-核酸酶结构域。在一些实施方案中,Cas9蛋白含有一个 失活的核酸酶结构域,其具有在切割与crRNA互补的靶核酸链的结构域中的 突变。在一个实施方案中,突变是D10A。在一些实施方案中,Cas9蛋白含 有一个失活的核酸酶结构域,其具有在切割与crRNA不互补的靶核酸链的结 构域中的突变。在一个实施方案中,突变是H840A。在其它实施方案中,Cas9 蛋白或其变体是Cas9蛋白的核酸酶无效变体,其中RuvC-和HNH-活性位点/ 核酸酶结构域都被突变。Cas9蛋白的核酸酶无效变体与双链DNA结合,但不 切割DNA,因此其也可用于靶物特异性DNA富集。在一些实施方案中,Cas9 蛋白具有两个失活的核酸酶结构域,其具有在切割与crRNA互补的链的结构 域中的第一突变和在切割与crRNA不互补的链的结构域中的第二突变。在一 些实施方案中,Cas9蛋白具有第一突变D10A和第二突变H840A。
在一些实施方案中,靶DNA在细胞游离DNA的胎儿细胞级份中,并且 细胞游离DNA来自母体血浆。用于提取细胞游离胎儿DNA的方案是本领域 已知的(参见例如Li et al.,2004,Clinical Chemistry50(6):1002-1011;and Li et al.,2005,The Journal of theAmerican Medical Association293(7):843-849,其 通过引用整体并入本文)。用于从母体血浆提取胎儿DNA的许多方案使用胎 儿DNA的大小以将其与母体DNA区分开。用于从母血中分离血浆的典型步 骤包括离心,然后分离和纯化细胞游离DNA(参见例如Chiu et al.,2001, Clinical Chemistry 47(9):1607-1613)。任选地,由Legler等人开发的方案可用于提取细胞游离胎儿DNA(参见Legler et al.2007,Prenatal Diagnosis 27(9): 824-829)。任选地,可以将甲醛加入母体血液样品中以增加细胞游离胎儿 DNA的百分比。已经表明,甲醛可以稳定完整细胞,并抑制母体DNA的进 一步释放(参见例如Dhallan etal.2004,The Journal of the American Medical Association 291(9):1114-1119)。
在一些实施方案中,受试者是癌症患者。肿瘤本身通常是肿瘤DNA的主 要来源。然而,通过活组织检查获取DNA是侵入性的并且有风险(如果完全 可能的话)。从死亡肿瘤细胞释放的血流中的细胞游离循环肿瘤DNA提供了 另一种用于检测肿瘤中存在的体细胞突变的有用工具。在早期和晚期阶段两 者的许多类型的癌症中已经鉴定了具有突变的细胞游离循环肿瘤DNA。此 外,已显示细胞游离循环DNA的量随着癌症的进展而增加。因此,细胞游离 循环DNA也可以用作监测肿瘤进展和测试患者的肿瘤是否会响应靶向药物 治疗的方式(参见例如Bettegowda et al.,2014,Sci.Transl.Med,6(224):24)。本 公开提供了用于富集和/或检测来自癌症患者的细胞游离循环DNA中的靶 DNA序列的方法。在一个实施方案中,癌症患者具有胰腺,卵巢,结肠直肠, 膀胱,胃食管,乳腺,黑素瘤,肝细胞或头颈癌。在一些实施方案中,癌症 患者具有脑,肾,前列腺或甲状腺癌。在一些实施方案中,癌症患者具有癌。 在一些实施方案中,癌症患者具有肉瘤。在一些实施方案中,癌症患者具有 淋巴瘤或白血病。在一些实施方案中,本文提供的方法用于诊断癌症。在一 些实施方案中,本文提供的方法用于监测肿瘤进展和/或测试肿瘤患者对靶向 药物治疗的反应。
在一些实施方案中,靶核酸包含单核苷酸变体(SNV)。在一些实施方案 中,SNV含有单核苷酸多态性(SNP)。在一些实施方案中,SNV包含点突变。 单核苷酸多态性(SNP)是常见类型的遗传变异,其包括在DNA位置中的多态 性,其中两个或更多个替代碱基在人群中以可观的频率发生(通常大于或等 于1%)。点突变是频率小于1%的基因变异。单核苷酸多态性(SNP)和点突变 代表人类基因组中最大的多样性来源。这些单核苷酸多态性(SNP)和点突变 可以作为用于在人类基因组图谱上定位疾病的生物标记,因为它们通常位于 与某种疾病相关的基因附近。因此,单核苷酸多态性(SNP),点突变和类似 突变的检测对于临床活动,人类健康和遗传疾病的控制是非常重要的。通过 测序细胞游离DNA来检测胎儿或癌症相关的SNV可能是困难的,因为这些变 体通常以总细胞游离DNA的非常低的百分比(通常为0.1%和更低)存在。本公 开提供的一个优点是用于检测和/或富集具有SNV的DNA序列的更灵敏的方 法。在一个实施方案中,本公开的方法允许检测在0.1%至0.01%频率范围内存在于细胞游离DNA样品中的SNV。在一个实施方案中,本文提供的方法富 集和/或检测细胞游离DNA样品中在0.01%至0.05%频率范围内存在的SNV。 在一些实施方案中,本文提供的方法富集和/或检测以约0.01%,0.02%, 0.03%,0.04%,0.05%,0.06%,0.07%,0.08%,0.09%,0.01%,0.02%或0.1% 频率存在于细胞游离DNA样品中的SNV。
作为实例而非限制,在图5中显示在过量野生型等位基因(B-Raf)存在下 的稀有突变体等位基因(B-Raf V600E)的富集。在一个实施方案中,图5的左 图,在使用之前,用诸如生物素的标签修饰CRISPR-Cas系统以促进结合的靶 DNA的回收。CRISPR-Cas系统编程为包含Cas9蛋白的核酸酶无效变体和具 有与突变体等位基因(B-Raf V600E)互补的序列的引导RNA。将突变体等位基 因B-RAF V600E与含有过量野生型等位基因DNA片段的纯化的细胞游离 DNA混合。将CRISPR-Cas系统加入含有突变等位基因(B-Raf V600E)和过量 的野生型等位基因(B-Raf)的混合物中。CRISPR-Cas系统特异性结合含有突 变等位基因(B-RafV600E)的多核苷酸以形成复合物,但该酶不切割DNA。 使用链霉亲合素包被的珠从混合物中拉出复合物。然后,从复合物中分离突 变等位基因(B-Raf V600E)。洗涤后,使用V600E等位基因位点侧翼的引物组 通过PCR扩增带有突变等位基因的富集DNA。然后,可以对扩增子进行测序。
作为对含有SNV的靶核酸序列的直接富集的替代,本公开还提供了通过 使用CRISPR-Cas系统破坏不含SNV的其它基因型或多核苷酸来富集含有 SNV的核酸序列的方法。在一些实施方案中,本公开提供了用于检测单核苷 酸变体(SNV)的方法,包括从受试者的血浆或血清中获得细胞游离DNA的群 体;提供具有第一聚簇规则间隔短回文重复(CRISPR)RNA(crRNA)或其衍生 物和第一CRISPR相关的(Cas)蛋白或其变体的第一内切核酸酶系统,其中所 述第一crRNA或其衍生物包含与第一靶核酸的区域互补的第一靶物特异性 核苷酸区域,并且其中所述第一Cas蛋白具有核酸酶活性;使用核酸内切酶 系统切割第一靶核酸,以及使用聚合酶链式反应(PCR)扩增第二靶核酸,其 中第二靶核酸包含第一靶核酸的单核苷酸变体形式。
如图5右图所示,使用与野生型等位基因(B-Raf)互补的指导RNA,而不 是使用与突变等位基因互补的指导RNA。此外,Cas9蛋白在两个核酸酶结构 域中保留核酸酶活性。因此,CRISPR-Cas系统结合野生型等位基因并将其切 割。因为系统在野生型等位基因序列中产生双链断裂,所以这些序列不能用 作随后的PCR反应的模板。因此,只有携带突变等位基因的细胞游离DNA将 作为模板并被扩增。
在一些实施方案中,本文提供的第二靶核酸是双链DNA(dsDNA)。
在一些实施方案中,本文提供的第一内切核酸酶系统是I型CRISPR-Cas 系统或其衍生物。在一些实施方案中,本文提供的内切核酸酶系统是II型 CRISPR-Cas系统。在一些实施方案中,本文提供的内切核酸酶系统是III型 CRISPR-Cas系统或其衍生物。本文提供的CRISPR-Cas系统包括来源于天然 产生的CRISPR-Cas系统的工程化和/或程序化的核酸酶系统。CRISPR-Cas系 统可以包含工程化和/或突变的Cas蛋白。CRISPR-Cas系统还可以包含工程化 和/或程序化的指导RNA。
在一些实施方案中,第一crRNA或其衍生物包含允许将酶特异性靶向互 补双链核酸的用户可选择的RNA序列。在一些实施方案中,用户可选择的 RNA序列含有与第一靶DNA序列的区域互补的20-50个核苷酸。在一些实施 方案中,crRNA的第一靶物特异性核苷酸区域具有与第一靶核酸的区域的 100%碱基对匹配。在一些实施方案中,在crRNA的第一靶物特异性核苷酸区 域和第一靶核酸的区域之间存在一个碱基对错配。在一些实施方案中,在crRNA的第一靶物特异性核苷酸区域和第一靶核酸的区域之间存在两个,三 个,四个或五个碱基对错配。
在一些实施方案中,本文提供的第一内切核酸酶系统进一步包括反式激 活crRNA(tracrRNA)或其衍生物。在一些实施方案中,本文提供的第一crRNA 或其衍生物是具有与tracrRNA多核苷酸融合的crRNA多核苷酸的多核苷酸。 在一个实施方案中,本文提供的第一Cas蛋白或其变体可以通过嵌合sgRNA 指导后面有5’-NGG原间隔物相邻基序(PAM)的任何基因组座位。
在一些实施方案中,第一Cas蛋白或其变体是Cas9蛋白或其变体。在一 些实施方案中,Cas9蛋白衍生自嗜热链球菌CRISPR-Cas系统的Cas9蛋白。在 一些实施方案中,Cas9蛋白是约1,409个氨基酸残基的多结构域蛋白。在一些 实施方案中,Cas9蛋白或其变体保留两个核酸酶结构域,并且能够切割相对 的DNA链并产生双链DNA断裂。
在一些实施方案中,第二靶核酸包含单核苷酸变体(SNV)。在一些实施 方案中,SNV含有单核苷酸多态性(SNP)。在一些实施方案中,SNV包含点 突变。在一个实施方案中,本公开的方法允许检测在0.1%至0.01%频率范围 内存在于细胞游离DNA样品中的SNV。在一个实施方案中,本文提供的方法 富集和/或检测在0.01%至0.05%频率范围内在细胞游离DNA样品中存在的 SNV。在一些实施方案中,本文提供的方法富集和/或检测以约0.01%,0.02%, 0.03%,0.04%,0.05%,0.06%,0.07%,0.08%,0.09%或0.1%频率存在于细胞游离DNA样品中的SNV。
或者,可以提供两种内切核酸酶系统:第一内切核酸酶系统用于消化不 含SNV的核酸,并且第二内切核酸酶系统用于用SNV下拉核酸。在一些实施 方案中,本文的方法还包括提供具有第二聚簇规则间隔短回文重复(CRISPR) RNA(crRNA)或其衍生物和第二CRISPR相关的(Cas)蛋白或其变体的第二内 切核酸酶系统,其中所述第二crRNA或其衍生物包含与所述第二靶核酸的区 域互补的第二靶物特异性核苷酸区域;使所述第二靶核酸与所述第二内切核 酸酶系统接触以形成复合物,以及分离所述复合物,从而富集所述第二目标核酸。
在一些实施方案中,本文提供的方法还包括从复合物中分离第二靶核 酸。在一些实施方案中,本文提供的第二靶核酸是双链DNA(dsDNA)。
在一些实施方案中,本文提供的第二内切核酸酶系统是I型CRISPR-Cas 系统或其衍生物。在一些实施方案中,本文提供的第二内切核酸酶系统是II 型CRISPR-Cas系统。在一些实施方案中,本文提供的第二内切核酸酶系统是 III型CRISPR-Cas系统或其衍生物。本文提供的CRISPR-Cas系统包括来源于 天然产生的CRISPR-Cas系统的工程化和/或程序化的核酸酶系统。 CRISPR-Cas系统可以包含工程化和/或突变的Cas蛋白。CRISPR-Cas系统还 可以包含工程化和/或程序化的指导RNA。
在一些实施方案中,第二crRNA或其衍生物包含允许将酶特异性靶向互 补双链DNA的用户可选择的RNA序列。在一些实施方案中,用户可选择的 RNA序列含有与靶DNA序列的区域互补或基本上互补的20-50个核苷酸。在 一些实施方案中,crRNA的靶物特异性核苷酸区域具有与靶核酸的区域的 100%碱基对匹配。在一些实施方案中,在crRNA的靶物特异性核苷酸区域和 靶核酸的区域之间存在一个碱基对错配。在一些实施方案中,在crRNA的靶 物特异性核苷酸区域和靶核酸的区域之间存在两个,三个,四个或五个碱基 对错配。
在一些实施方案中,本文提供的第二内切核酸酶系统进一步包括反式激 活crRNA(tracrRNA)或其衍生物。在一些实施方案中,本文提供的crRNA或 其衍生物是包含与tracrRNA多核苷酸融合的crRNA多核苷酸的多核苷酸。
在一些实施方案中,第二Cas蛋白或其变体是Cas9蛋白或其变体。在一 些实施方案中,Cas9蛋白衍生自嗜热链球菌CRISPR-Cas系统的Cas9蛋白。在 一些实施方案中,Cas9蛋白是约1,409个氨基酸残基的多结构域蛋白。
在一些实施方案中,Cas9蛋白或其变体保留两个核酸酶结构域,并且能 够切割相对的DNA链并产生双链DNA断裂。在其它实施方案中,Cas9蛋白 或其变体是Cas9切口酶,并且能够产生单链核酸切口,例如单链DNA切口。 在一些实施方案中,仅突变和失活RuvC-核酸酶结构域。在一些实施方案中, 仅突变和失活HNH-核酸酶结构域。在一些实施方案中,Cas9蛋白含有一个 失活的核酸酶结构域,其具有在切割与crRNA互补的靶核酸链的结构域中的 突变。在一个实施方案中,突变是D10A。在一些实施方案中,Cas9蛋白含 有一个失活的核酸酶结构域,其具有在切割与crRNA不互补的靶核酸链的结 构域中的突变。在一个实施方案中,突变是H840A。在其它实施方案中,Cas9 蛋白或其变体是Cas9蛋白的核酸酶无效变体,其中RuvC-和HNH-活性位点/ 核酸酶结构域都被突变。在一些实施方案中,Cas9蛋白具有两个失活的核酸 酶结构域,其具有在切割与crRNA互补的链的结构域中的第一突变和在切割 与crRNA不互补的链的结构域中的第二突变。在一些实施方案中,Cas9蛋白 具有第一突变D10A和第二突变H840A。
在一些实施方案中,第二靶核酸在细胞游离DNA的胎儿细胞级份中,并 且细胞游离DNA来自母体血浆。在一些实施方案中,受试者是癌症患者。在 一个实施方案中,癌症患者具有胰腺,卵巢,结肠直肠,膀胱,胃食管,乳 腺,黑素瘤,肝细胞或头颈癌。在一些实施方案中,癌症患者具有脑,肾, 前列腺或甲状腺癌。在一些实施方案中,癌症患者具有癌。在一些实施方案 中,癌症患者具有肉瘤。在一些实施方案中,癌症患者具有淋巴瘤或白血病。在一些实施方案中,本文提供的方法用于诊断癌症。在一些实施方案中,本 文提供的方法用于监测肿瘤进展和/或测试肿瘤患者对靶向药物治疗的反应。
在另一方面,本公开提供了使用含有切口酶的CRISPR-Cas系统标记靶核 酸序列的方法。本文提供的切口酶可以将靶物特异性切口引入双链核酸。切 口可以进一步用于插入捕获标签,如生物素化的dNTP,寡核苷酸探针或双 链核酸衔接头,用于靶核酸的富集策略。单链核酸富集方案的当前方法需要 产生杂交产物的“树结构”,并且这种结构通常降低特异性。本文提供的方法 直接靶向双链核酸,因此避免了创建这种“树结构”的需要。此外,本文提供 的方法能够富集长核酸片段。
在一些实施方案中,本文提供的方法包括产生一个单链切口,并且从该 切口进行切口平移以引入用于回收靶核酸的捕获标记物。在其他实施方案 中,本文提供的方法包括在靶核酸的相同链上产生两个连续的单链切口。两 个切口之间的单链核酸产物可以被用于回收靶核酸的捕获标记物替代。在其 他实施方案中,本文提供的方法包括在靶核酸的相对链上产生两个连续的单 链切口,并因此产生可以连接到衔接头用于富集的双链核酸断裂。
在一些实施方案中,本公开提供了用于标记靶核酸的方法,包括提供具 有第一聚簇规则间隔短回文重复(CRISPR)RNA(crRNA)或其衍生物的第一核 酸酶系统和第一CRISPR相关的(Cas)蛋白或其变体,其中所述第一crRNA或 其衍生物含有与所述靶核酸的第一区互补的第一靶物特异性核苷酸区,并且 其中所述第一Cas蛋白包含一个失活的核酸酶结构域;使包含所述靶核酸的 双链核酸与所述第一核酸酶系统接触,以在所述靶核酸的第一区产生第一单 链切口,并标记所述靶核酸。在一些实施方案中,本文的方法进一步包括通 过标记分离靶核酸,从而富集靶核酸。在一些实施方案中,本文提供的方法 还包括扩增靶核酸。
在一些实施方案中,本文提供的第一核酸酶系统进一步包括反式激活 crRNA(tracrRNA)。在一些实施方案中,本文提供的第一crRNA或其衍生物 是具有与tracrRNA多核苷酸融合的crRNA多核苷酸的多核苷酸。在一些实施 方案中,本文提供的第一核酸酶系统是II型CRISPR-Cas系统或其衍生物。在 一些实施方案中,第一Cas蛋白或其变体是Cas9蛋白或其变体。在一些实施 方案中,Cas9蛋白或其变体包含一个失活的核酸酶结构域,其具有在切割与 第一crRNA互补的靶核酸链的结构域中的突变。在一些实施方案中,突变是D10A。在一些实施方案中,第一Cas9蛋白或其变体含有一个失活的核酸酶 结构域,其具有在切割与第一crRNA不互补的靶核酸链的结构域中的突变。 在一些实施方案中,突变是H840A。如图6A-6B所示,纯化的Cas9切口酶具 有序列特异性切口活性。
在一些实施方案中,本公开的方法还包括进行切口平移。在一些实施方 案中,本文提供的切口平移通过使用选自DNA Pol 1,Bst和Taq的切口平移聚 合酶进行。本领域已知的其他切口平移聚合酶也包括在本文提供的方法中。 在一些实施方案中,本文提供的切口平移在含有生物素化dNTP的反应混合 物中进行。在一些实施方案中,本文提供的生物素化dNTP是生物素化的 dUTP。在一些实施方案中,本公开的方法还包括加入磁性链霉亲合素珠以 富集生物素化的靶DNA。
如图7A中显示,CRISPR-Cas系统含有Cas9切口酶,其中失活两个核酸 酶结构域之一,例如D10A和H840 Cas9突变体。CRISPR-Cas系统还含有指导 RNA,例如crRNA和crRNA-tracrRNA嵌合体,其含有与靶DNA序列基本上 互补的序列。酶系统结合靶双链DNA并产生单链切口。该缺口充当使用切口 平移聚合酶如Bst的切口平移的起始点。在切口平移期间,生物素化的dNTP 用于产生生物素标记的DNA片段,使得可以通过加入磁性链霉抗生物素珠来分离靶DNA,如图7A的左图所示。在一些实施方案中,为了防止非特异性 切口平移,可以使用本领域已知的各种方法(例如使用DNA连接酶)除去Cas9 切割之前存在于DNA中的切口,并且也可以用聚合酶填充或补回(chewed back)3’和5’突出端,如图7A右图中所示。在一些实施方案中,可以首先用 DNA聚合酶,连接酶和激酶的混合物处理靶定的DNA,以除去任何预先存 在的切口和隐性末端。将修复的DNA与Cas9切口酶复合物一起温育,在基因 组的靶定区域引入单链切口,其用于与生物素化核苷酸的切口平移反应。在 下拉测定中,用链霉亲合素包被的珠富集基因组的生物素化的靶定区域。
在一些实施方案中,本公开的方法还包括提供具有第二crRNA或其衍生 物和第二Cas蛋白或其变体的第二核酸酶系统,其中所述第二crRNA或其衍 生物包含与所述靶核酸的第二区互补的第二靶物特异性核苷酸区域,并且其 中所述第二Cas蛋白含有一个失活的核酸酶结构域,并且使含有所述靶核酸 的双链核酸与所述第二核酸酶系统接触,以在靶核酸的第二区产生第二单链 切口,其中所述靶核酸的第一区不同于所述靶核酸的第二区。
在一些实施方案中,第一单链切口和第二单链切口在靶核酸的相同链 上。在一些实施方案中,靶核酸的第一区和靶核酸的第二区在靶核酸的相同 链上,并且第一Cas9蛋白和第二Cas9蛋白都含有在切割与其各自的crRNA互 补的靶核酸链的结构域中的突变,使得第一单链切口和第二单链切口位于靶 核酸的相同链上。在一些实施方案中,第一Cas蛋白是含有一个失活的核酸 酶结构域的第一Cas9蛋白,所述核酸酶结构域具有切割与第一crRNA互补的 靶核酸链的结构域中的第一突变,并且第二Cas蛋白是含有一个失活的核酸酶结构域的第二Cas9蛋白,所述核酸酶结构域含有切割与所述第二crRNA互 补的靶核酸链的所述结构域中的第二突变。在一些实施方案中,第一突变和 第二突变都是D10A。
在一些实施方案中,靶核酸的第一区和靶核酸的第二区在靶核酸的相同 链上,并且第一Cas9蛋白和第二Cas9蛋白都含有切割与其相应的crRNA不互 补的靶核酸链的结构域中的突变,使得第一单链切口和第二单链切口位于靶 核酸的相同链上。在一些实施方案中,第一Cas蛋白是含有一个失活的核酸 酶结构域的第一Cas9蛋白,所述核酸酶结构域具有切割与第一crRNA不互补 的靶核酸链的结构域中的第一突变,并且第二Cas蛋白是含有一个失活的核 酸酶结构域的第二Cas9蛋白,所述核酸酶结构域含有切割与第二crRNA不互补的靶核酸链的结构域中的第二突变。在一些实施方案中,第一突变和第二 突变都是H840A。
在一些实施方案中,靶核酸的第一区和靶核酸的第二区在靶核酸的不同 链上,并且两个Cas9蛋白保留不同的核酸酶结构域,使得第一单链切口和第 二单链切口在靶核酸的相同链上。在一些实施方案中,第一Cas蛋白是含有 一个失活的核酸酶结构域的第一Cas9蛋白,所述核酸酶结构域具有切割与第 一crRNA互补的靶核酸链的结构域中的第一突变,并且第二Cas蛋白是含有 一个失活的核酸酶结构域的第二Cas9蛋白,所述核酸酶结构域具有切割与第 二crRNA不互补的靶核酸链的结构域中的第二突变。在一些实施方案中,第 一突变是D10A,并且所述第二突变是H840A。
在一些实施方案中,第一单链切口和第二单链切口之间的间隔为20个碱 基对(bp)至10kp。在一些实施方案中,第一单链切口和第二单链切口之间的 间隔为20个碱基对(bp)至5kp。在一些实施方案中,第一单链切口和第二单链 切口之间的间隔为20个碱基对(bp)至1000bp。在一些实施方案中,第一单链 切口和第二单链切口之间的间隔为20个碱基对(bp)至500bp。在一些实施方案 中,第一单链切口和第二单链切口之间的间隔为约20bp,30bp,40bp,50bp, 60bp,70bp,80bp,90bp,100bp,200bp,300bp,400bp或500bp。
在一些实施方案中,本公开的方法还包括加入捕获探针;并且用捕获探 针交换第一单链切口和第二单链切口之间的单链核酸产物,其中捕获探针能 够与与单链核酸产物互补的核酸链杂交。在一些实施方案中,捕获探针的序 列与单链核酸产物的序列10%至100%相同。在一些实施方案中,捕获探针的 序列与单链核酸产物的序列约10%,20%,30%,40%,50%,60%,70%, 80%或90%相同。在一些实施方案中,本文提供的捕获探针是生物素化的探 针。在一些实施方案中,本公开的方法还包括加入磁性链霉亲合素珠以富集 靶核酸。
图8A显示了一个实施方案,其中Cas9切口酶在靶DNA的相同链上产生 两个连续的单链切口。如图所示,加入两个酶系统,每个靶向靶DNA序列的 不同区域,因此在相同链上产生两个连续的单链切口。然后用捕获探针(例 如生物素化的捕获探针)替换两个切口之间的单链DNA产物,用于富集步骤。
在另一个实施方案中,如图9所示,捕获探针包含突出核苷酸序列,突 出核苷酸序列与固定在表面上的寡聚物基本上互补。因此,突出端可以用于 通过将突出端退火到固定在表面上的互补寡聚物来下拉靶DNA。在一个实施 方案中,突出端包含或互补于通用
Figure BDA0002897666300000431
捕获引物P5(可获自Illunima,Inc, San Diego,CA)。表面可以是固体支持物的外部部分或外部层。固体支持物 可以是刚性固体并且任选地可以是液体或气体不可渗透的。固体支持物也可 以是半刚性固体,例如,液体或气体可渗透。表面可以与另一种材料如气体, 液体,凝胶,相似或不同的固体载体的第二表面,金属或涂层接触。表面或 其区域可以是基本平坦的。表面可以具有表面特征,例如孔,凹陷,通道, 脊,凸起区域,钉,柱等。在一些实施方案中,其表面或区域可以位于容器 如孔,管,通道,比色杯,培养皿,瓶等中。有用的容器是流动池。示例性 流动池是可从Illumina,Inc(San Diego,CA)商购获得的那些。另一种有用的 容器是多孔板或微量滴定板中的孔。在一些实施方案中,本文提供的方法还包括在表面上的Nextera文库制备和聚簇。在一些实施方案中,可以在流式细 胞捕获之前进行转座。已经在商品化的固相平台(例如,可从Illumina Inc.(San Diego,CA)获得)的背景下描述了各种实施方案,本领域技术人员将理解, 各种实施方案中的任一个可以用本领域中公知的各种其它固体相配置进行。 这种配置基本上包括固相和捕获探针。
在其它实施方案中,本文提供的方法可用于在重复区域中引入特定缺 口。在一个实施方案中,捕获探针具有“发夹”或是具有与靶DNA互补的5’和 3’区的错配探针,如图10所示。结果,每个重复单元被独特标志物(或条形码) 替换,允许引入标志。标志可以用于重复区域的组装或计数重复的精确数目。
某些聚合酶(例如Phi29)可以从缺口启动切口平移。因此,在其他实施方 案中,靶核酸的相同链上的第一单链切口和第二单链切口之间的间隔为1bp 至20bp。在一些实施方案中,本文提供的方法可以进一步包括进行切口平移。 在一些实施方案中,切口平移通过使用切口平移聚合酶Phi29进行。
在一些实施方案中,第一单链切口和第二单链切口在靶DNA序列的相反 链上,从而产生第一双链DNA断裂末端。
在一些实施方案中,靶核酸的第一区和靶核酸的第二区在靶核酸的相同 链上;第一Cas蛋白是具有一个失活的核酸酶结构域的第一Cas9蛋白,其具 有切割与第一crRNA互补的靶核酸链的结构域中的第一突变,并且第二Cas 蛋白是具有一个失活的核酸酶结构域的第二Cas9蛋白,所述核酸酶结构域具 有切割与所述第二crRNA不互补的靶核酸链的结构域中的第二突变。在一些 实施方案中,第一突变是D10A,并且第二突变是H840A。
在一些实施方案中,靶核酸的第一区和靶核酸的第二区在靶核酸的相反 链上;第一Cas蛋白是含有一个失活的核酸酶结构域的第一Cas9蛋白,所述 核酸酶结构域具有切割与第一crRNA互补的靶核酸链的结构域中的第一突 变,并且第二Cas蛋白是具有一个失活的核酸酶结构域的第二Cas9蛋白,所 述核酸酶结构域具有切割与所述第二crRNA互补的靶核酸链的结构域中的 第二突变。在一些实施方案中,第一突变和第二突变都是D10A。
在一些实施方案中,靶核酸的第一区和靶核酸的第二区在靶核酸的相反 链上;第一Cas蛋白是具有一个失活的核酸酶结构域的第一Cas9蛋白,其具 有切割与第一crRNA不互补的靶核酸链的结构域中的第一突变,并且第二 Cas蛋白是具有一个失活的核酸酶结构域的第二Cas9蛋白,所述核酸酶结构 域含有切割与所述第二crRNA互补的靶核酸链的结构域中的第二突变。在一 些实施方案中,第一突变和第二突变都是H840A。
在一些实施方案中,在相对接近的核酸位置产生切口,并可产生平端断 裂。在一些实施方案中,在彼此相对较远处产生切口,并且可产生具有5’或 3’突出端的粘性末端断裂。在一些实施方案中,本发明的方法还包括将衔接 头连接到双链核酸断裂末端。在一些实施方案中,本公开的衔接头是生物素 化的。在一些实施方案中,本公开的方法包括加入磁性链霉亲合素珠以富集 靶核酸。
在一些实施方案中,本文提供的方法还包括提供具有第三crRNA或其衍 生物和第三Cas蛋白或其变体的第三核酸酶系统,其中所述第三crRNA或其 衍生物含有与所述靶核酸的第三区域基本上互补的第三靶物特异性核苷酸 区域,并且其中所述第三Cas蛋白含有一个失活的核酸酶结构域;提供具有 第四crRNA或其衍生物和第四Cas蛋白或其变体的第四核酸酶系统,其中所 述第四crRNA或其衍生物包含与靶核酸的第四区基本上互补的第四靶物特 异性核苷酸区酸,并且其中所述第四Cas蛋白含有一个失活的核酸酶结构域; 并且使含有靶核酸的双链核酸与第三和第四核酸酶系统接触,以在靶核酸的 第三区域产生第三单链切口,并且在靶核酸的第四区域产生第四单链切口, 其中所述第三单链切口和所述第四单链切口在所述靶核酸的相反链上,从而 产生第二双链核酸断裂末端,所述第二双链核酸断裂末端不同于第一个双链 核酸断裂末端。
在一些实施方案中,第一和第二双链核酸中断末端之间的核酸片段可以 含有10至数千个核苷酸。在一些实施方案中,可以加入捕获探针,如单链寡 聚物,DNA哑铃(DNAdumbbells)和双链DNA衔接头以标记核酸片段。在一 些实施方案中,本文提供的方法还包括将衔接头连接至第二双链核酸断裂末 端。
如图11A所示,提供了两对CRISPR-Cas系统。每对酶包含两个Cas9切口 酶,并且两个Cas9切口酶可以在DNA的相反链上产生单链DNA切口。因此, 每对酶产生双链DNA断裂末端,并且在靶DNA序列的周围或两端产生两个 双链DNA断裂末端。在一个实施方案中,两个双链DNA断裂末端之间的DNA 片段为约10kb。在一些实施方案中,两个双链DNA断裂末端之间的DNA片 段为约1kb,2kb,3kb,4kb,5kb,6kb,7kb,8kb或9kb。DNA片段可以进 一步连接到靶物特异性生物素化的PCR衔接头,藉此可以富集靶DNA。
富集的双链核酸可以进一步进行测序。在一个实施方案中,将富集的 DNA进行片段标签化以成为较小的片段并引入到测序衔接头。如图11B所示, 在一些实施方案中,本文提供的方法还包括在片段标签化前稀释。在一个实 施方案中,在PCR和/或片段标签化之前将富集的DNA稀释成单倍体含量。
在一些实施方案中,进行Nextera文库制备(可得自Illumina,Inc,San Diego,CA)以片段化输入DNA并引入测序引物,然后将片段化的DNA与本 文提供的CRISPR-Cas系统接触以形成复合物。将复合物下拉,并且可以例如 使用EDTA,热,SDS和RNA酶从复合物中释放靶DNA。然后可以进行测序。
在另一方面,本公开提供了使用包含两个核酸酶结构域的多种野生型 Cas9富集双链DNA的方法。在一些实施方案中,本文提供了用于富集靶核酸 的方法,包括:提供用crRNA组编程的Cas9蛋白群体,其中所述crRNA组包 含与靶核酸的一系列不同区域互补的crRNA;使靶核酸与用该crRNA组编程 的Cas9蛋白群体接触以产生一系列核酸片段,并将衔接头连接到至少一个核 酸片段上,其中Cas9蛋白保留两个核酸酶结构域。
在一些实施方案中,该crRNA组含有与靶核酸的两个不同区域互补的 crRNA。本文提供的方法可用于富集长DNA片段。在一些实施方案中,两个 不同区域之间的间隔长于10kb。
在一些实施方案中,靶核酸是双链DNA。在一些实施方案中,靶核酸是 基因组DNA,染色体DNA,基因组或部分基因组。
如图12A所示,各自含有两个核酸酶结构域的两种Cas9蛋白用于处理双 链核酸。每个Cas9编程有靶向双链DNA上不同区域的crRNA,因此反应在两 个切割位点之间产生双链DNA片段。可以将DNA片段连接到衔接头上,并 准备用于其他过程和/或分析,例如下拉和测序。
在另一方面,本公开提供了Cas9介导的核酸片段化和靶向测序的方法。 本公开提供了在用户定义的区域中以序列特异性方式使DNA片段化并产生 用于随后测序的核酸片段的方法,例如适合于用于掺入Illumina测序文库的 DNA片段。在一些实施方案中,本文提供的靶核酸测序方法包括提供用 crRNA组编程的Cas9蛋白质群体,其中所述crRNA组包含与靶核酸间的一系 列不同区域互补的crRNA;使靶核酸与用所述crRNA组编程的Cas9蛋白群体 接触以产生一系列核酸片段,并对所述一系列核酸片段测序。
在一些实施方案中,核酸的靶向片段化可以通过制备用靶向靶核酸间平 铺(tiled)的区域的crRNA编程的Cas9蛋白质群体来实现。在一些实施方案中, 本文提供的Cas9蛋白保留两个核酸酶结构域,它们可以产生双链核酸断裂, 并因此产生一系列核酸片段。这些核酸片段可以进一步进行核酸测序工作流 程。
可以用多个Cas9蛋白群体分开处理相同的核酸样品,所述多个Cas9蛋白 群体由靶向靶核酸间平铺的区域的不同crRNA组编程。由每个群体产生的核 酸片段与由另一个群体产生的核酸片段重叠。更可靠和全面的测序数据可以 通过对具有重叠序列的核酸片段测序来实现。在一些实施方案中,本文提供 的靶核酸测序方法包括提供多个Cas9蛋白群体,每个Cas9蛋白群体用不同组 的crRNA编程,其中每组crRNA含有与靶核酸间的不同系列区域互补的 crRNA;在单独的反应中使靶核酸与多个Cas9蛋白群体中的每一个接触以产生不同系列的核酸片段,并对核酸片段进行测序。
在一些实施方案中,多个Cas9蛋白质群体包括三个Cas9蛋白质群体,并 且其中由三个Cas9蛋白质群体中的每一个产生的核酸片段含有与由Cas9蛋 白的三个群体的至少另一个产生的核酸片段的重叠序列。如图12B所示,用 Cas9蛋白处理10kb靶DNA,所述Cas9蛋白用靶向靶DNA序列间具有约500bp 间隔的区域的三组crRNA编码。每组crRNA包含约57个crRNA。Cas9蛋白保 持与切割的DNA的末端非共价缔合,通过用蛋白酶或去污剂处理样品可以释 放切割的靶DNA。然后,合并切割产物并转化为测序文库,例如使用Illumina 的TruSeq Nano工作流程。可以在单独的反应中使用不同组的crRNA进行切 割。例如,如图12B所示,在3个管(罐1,罐2和罐3)中进行切割,具有用产 生大约500bp大小的重叠片段的cRNA重建的Cas9复合物的三个文库。这种重 叠片段可以提高测序精确度。
在一些实施方案中,本公开提供了用于靶向单倍型测序(定相测序)的方 法。在一些实施方案中,本文提供的方法还包括将含有靶DNA的DNA样品 稀释为单倍体含量。相或单倍型信息(其指二倍体生物体中两条同源染色体 的独特内容)提供了一种有用的工具,以更好地理解人类DNA序列和表型(包 括疾病)之间的关系。本公开提供了使用CRISPR-Cas系统的单元型测序的方 法。单倍型测序工作流可以利用Cas9蛋白保持在切割的DNA的末端的能力。 由于Cas9蛋白保持与切割的DNA的末端缔合,这创建了大小与靶序列中Cas9 靶区域之间的数目和距离成比例的DNA的单倍型区段。在一些实施方案中, 在切割后,反应可以在微量滴定孔中稀释至亚单倍型水平,然后可以用蛋白 酶处理以释放连接的片段,并且转化为测序文库,例如使用可获自Illumina, Inc.(San Diego,CA)的TruSeq Nano文库制备方法。
如图12C所示,用Cas9蛋白处理10kb靶DNA,所述Cas9蛋白用靶向靶 DNA序列间具有约500bp间隔的区域的crRNA组编码。切割后,将反应在微 量滴定孔中稀释至亚单倍型水平。然后,可以通过用蛋白酶或去污剂处理样 品释放切割的靶DNA。然后,合并切割产物并转化为测序文库,例如使用 Illumina的TruSeq Nano工作流程。可以使用具有不同组crRNA的多个反应进 行切割。例如,如图12C所示,在3个管(罐1,罐2和罐3)中进行切割,所述 管具有用产生大约500bp大小的重叠片段的cRNA重建的3个Cas9复合物文 库。此类重叠片段可以提高单倍型测序精确度。
在一些实施方案中,本文提供的靶核酸是双链DNA。在一些实施方案中, 本文提供的靶核酸是基因组DNA,染色体DNA,基因组或部分基因组。
在一些实施方案中,可以例如使用有限循环聚合酶链反应(PCR)扩增核 酸片段以引入其它末端序列或衔接头,例如索引,通用引物和簇形成和测序 所需的其它序列。
在一些实施方案中,核酸片段的测序包括使用下列一种或多种:合成测 序,桥式PCR,链终止测序,杂交测序,纳米孔测序和连接测序。
在一些实施方案中,本文提供的方法中使用的测序方法是合成测序 (SBS)。在SBS中,监测核酸引物沿核酸模板(例如靶核酸或其扩增子)的延伸 以确定模板中的核苷酸序列。根本的化学过程可以是聚合(例如,通过聚合 酶催化)。在特定的基于聚合酶的SBS实施方案中,以模板依赖性方式将荧光 标记的核苷酸加入引物(从而延伸引物),使得加入引物的核苷酸的顺序和类 型的检测可用于确定模板的序列。
可以使用使用循环反应的其他测序程序,如焦磷酸测序。焦磷酸测序检 测在特定核苷酸被掺入新生核酸链时无机焦磷酸(PPi)的释放(Ronaghi,et al., AnalyticalBiochemistry 242(1),84-9(1996);Ronaghi,Genome Res.11(1),3-11 (2001);Ronaghiet al.Science 281(5375),363(1998);US 6,210,891;US 6,258,568and US.6,274,320,其各自通过引用并入本文)。在焦磷酸测序中, 可以通过ATP硫酸化酶立即转化为三磷酸腺苷(ATP)来检测释放的PPi,并且 可以通过萤光素酶产生的光子检测产生的ATP的水平。因此,可以通过发光 检测系统监测测序反应。用于基于荧光的检测系统的激发辐射源对于焦磷酸 测序程序不是必需的。可以适于将焦磷酸测序应用于根据本公开产生的扩增 子的有用的流体系统,检测器和程序例如描述于以下文献中:WIPO Pat.App. Ser.No.PCT/US11/57111,US 2005/0191698 A1,US 7,595,883,以及US 7,244,559,其各自通过引用并入本文。
一些实施方案可以利用涉及DNA聚合酶活性的实时监测的方法。例如, 核苷酸掺入可以通过带荧光团的聚合酶和γ-磷酸盐标记的核苷酸之间的荧光 共振能量转移(FRET)相互作用或者用Zeromode波导(ZMW)来检测。用于基 于FRET的测序的技术和试剂描述于例如Levene et al.Science 299,682–686 (2003);Lundquist et al.Opt.Lett.33,1026–1028(2008);Korlach et al.Proc. Natl.Acad.Sci.USA 105,1176–1181(2008),其公开内容通过引用并入本文。
一些SBS实施方案包括检测在将核苷酸掺入延伸产物中时释放的质子。 例如,基于检测释放的质子的测序可以使用可从Ion Torrent(Guilford,CT,a Life Technologiessubsidiary)购得的电检测器和相关技术或US 2009/0026082 A1;US 2009/0127589 A1;US2010/0137143 A1;或US 2010/0282617 A1(其各 自通过引用并入本文)中描述的测序方法和系统。本文中列出的使用动力学 排除法扩增靶核酸的方法可以容易地应用于用于检测质子的基底。更具体 地,本文中列出的方法可用于产生用于检测质子的扩增子的克隆群体。
另一种有用的测序技术是纳米孔测序(参见,例如,Deamer et al.TrendsBiotechnol.18,147–151(2000);Deamer et al.Acc.Chem.Res.35:817-825 (2002);Li etal.Nat.Mater.2:611–615(2003),其公开内容通过引用并入本文)。 在一些纳米孔实施方案中,从靶核酸除去的靶核酸或单个核苷酸通过纳米 孔。当核酸或核苷酸通过纳米孔时,可以通过测量孔的电导率的波动来鉴定 每种核苷酸类型。(U.S.Patent No.7,001,792;Soni et al.Clin.Chem.53, 1996–2001(2007);Healy,Nanomed.2,459–481(2007);Cockroft et al.J.Am. Chem.Soc.130,818–820(2008),其公开内容通过引用并入本文)。
从前面的描述中,显而易见的是,可以对本文所述的本发明进行变化和 修改以采用其进行各种用途和条件。这些实施方案也在所附权利要求书的范 围内。
本文对变量的任何定义中的要素列表的列举包括该变量作为列出的要 素的任何单个要素或组合(或子组合)的定义。本文实施方案的叙述包括作为 任何单个实施方案或与任何其它实施方案或其部分组合的实施方案。
本说明书中提及的所有专利和出版物通过引用并入本文,其程度如同每 个独立的专利和出版物具体且单独地指明通过引用并入一样。
通过说明而非限制的方式提供以下实施例。
实施例
实施例1:使用含有野生型Cas9蛋白的CRISPR-Cas系统富集靶DNA
本实施例例示了使用含有保留两个核酸酶结构域两者的核酸酶活性的 野生型Cas9蛋白的CRISPR-Cas系统富集靶DNA序列的方法。图2A的左图显 示了实验的方案。首先,用限制酶AlwNI(其在Braf序列外产生DNA断裂)处 理含有野生型Braf序列的3550bp的质粒。其次,加入含有野生型Cas9蛋白和 生物素标记的指导RNA的CRISPR-Cas系统。指导RNA含有与野生型Braf序列 互补的序列,因此酶系统识别并结合Braf序列的区域以形成复合物。Cas9核 酸在Braf区域切割以产生两个DNA片段:一个是2250bp,而另一个是1300bp。 第三,然后加入可以结合生物素的链霉亲合素珠。最后,在洗涤珠子并用蛋 白酶洗脱后,将Cas9下拉的上清液和珠洗脱样品进行聚丙烯酰胺凝胶电泳, 并且通过磷光成像(phosphorimaging)使结果显现。实验使用对照crRNA,用 生物素化dUTP(IVT)完全标记的crRNA和在3’末端具有2个生物素基团的 crRNA(BioSynthesis)进行。凝胶电泳结果显示在图2A的右图中。如所示,当 使用对照crRNA时,两个DNA片段(一个约2250bp和一个约1300bp)存在于 Cas9下拉上清液中。但这些DNA片段不在珠洗脱中。相比之下,当使用IVT生物素化的crRNA或BioSynthesis双生物素crRNA时,如果可检测的话,Cas9 下拉上清液中的两个DNA片段的量大大降低。相反,两个DNA片段存在于 珠洗脱中。
还使用Bgl1限制性酶进行实验。具体地,实验的方案在图2B的左图中显 示。首先,用限制酶Bgl 1(其在Braf序列外产生两个DNA断裂)处理含有野生 型Braf序列的3550bp的质粒。结果,将质粒分成两个DNA片段:一个是含有 Braf序列的2464bp,而另一个是1118bp。其次,加入含有野生型Cas9蛋白和 生物素标记的指导RNA的CRISPR-Cas系统。指导RNA含有与野生型Braf序列 互补的序列,因此酶系统识别并结合2464bp片段内的Braf序列区域以形成复 合物。Cas9核酸酶在Braf区域切割以产生两个DNA片段:一个是1854bp,而 另一个是610bp。第三,然后加入可以结合生物素的链霉亲合素珠。最后, 在洗涤珠并用蛋白酶洗脱后,将Cas9下拉的上清液和珠洗脱样品进行聚丙烯 酰胺凝胶电泳,并且通过磷光成像使结果显现。结果显示在图2B的右图中。 如所示,当crRNA未被生物素化时,上清液含有三个具有1854bp,1118bp和 610bp的DNA片段;但是这三种DNA片段在珠洗脱中不存在。相比之下,当 使用生物素化的crRNA时,珠洗脱包含两个具有1854bp和610bp的DNA片段。 应注意,当用250mM NaCl洗涤链霉亲合素珠时,珠洗脱液含有指示非特异 性结合的可检测的1118bp DNA片段。当使用高盐洗涤(500mM NaCl)时,显 示了改善的结合特异性。如所示,当用500mM NaCl洗涤珠时,1118bp片段 的量在珠洗脱中显著降低。
这些实验的结果显示野生型Cas9蛋白在切割后保留在DNA末端,并且这 种结合足以下拉核酸酶-DNA复合物用于富集。
实施例2:自低复杂性Nextera质粒文库的Cas9切口酶介导的片段富集
本实施例例示了使用含有Cas9切口酶的CRISPR-Cas系统富集DNA片段 的方法。如图2C所示,含有Braf靶位点的质粒首先进行Tn5介导的片段标签 化以产生DNA片段群体。然后,将包含Cas9切口酶和靶向Braf序列的生物素 标记的crRNA的CRISPR-Cas9系统加入片段中。CRISPR-Cas9系统特异性结 合含有Braf序列的DNA片段。通过使用链霉亲合素珠下拉生物素及其相关组 分,富含含有Braf序列的DNA片段。从蛋白质洗脱后,将富集的DNA片段进 一步进行DNA扩增和测序。测序的结果显示在图2D中。如图所示,成功地 富集含有Braf序列的靶DNA片段。
实施例3:将通过CRISPR-Cas系统富集的靶DNA进行片段标签化
靶质粒含有跨越V600密码子的Braf序列的一部分。生物素化的crRNA设 计成靶向跨越V600密码子的20bp。将50ng靶质粒DNA用Cas9复合物(生物素 化的)和bglI限制酶在1×NEB缓冲液3.1中在20μl反应中在37℃下切割15分钟。 反应温度和珠结合温度可以升高至48℃以减少Cas9与非靶DNA的背景(非特 异性)结合。高达500mM NaCl也可用于结合反应和洗涤以减少背景结合。将 20ul
Figure BDA0002897666300000511
M-280链霉亲合素珠加入反应中并温育30分钟。通过短暂 涡旋每10分钟将珠在反应中重悬。然后,将反应管转移到磁体上,弃去上清液。在含有400mM额外NaCl的20μl 1x NEB缓冲液3.1中洗涤珠。在55℃下, 在1x NEB缓冲液3.1和50ng/ul蛋白酶中从珠释放DNA 15分钟。然后将反应管 转移到磁体上,并且将上清液转移到新管中,并使用来自Zymo Research的 Zymo DNA清洁和浓缩试剂盒进行清洁。然后,将释放的DNA进行片段标签 化并转化成Nextera文库(可购自Illumina,Inc,San Diego,CA)。将文库在 MiSeq上测序,并且产生的质粒覆盖图。如图4F所示,读段显示610bp和1845bp 靶向DNA片段的富集。
实施例4:Cas9蛋白的纯化和Cas9蛋白的活性和特异性的测试
图6A显示了BL21细胞中Cas9融合蛋白的表达。用编码四种MBP_CAS9 融合变体的表达载体转化BL21细胞:野生型和三种突变体,包括单突变体 D10A,H840A和D10A_H840A双突变体。在37℃下良好通气培养细胞培养物, 在OD600为1下用IPTG(0.2mM)诱导,转移至17℃,并在充分通气下再培养16 小时。将细胞沉淀,裂解,并通过SDS_PAGE分析诱导前(在图中表示为1) 和后(图中用2表示)的细胞蛋白质。在IPTG诱导后样品中约250KDa条带的存在证实了所有四种MBP_CAS9融合蛋白的表达。
M10A Cas9切口酶的纯化示于实施例2中。使用表达有His标签的Cas9 m10切口酶的1L细胞培养物产生细胞裂解物,然后通过His柱运行以进行纯 化。然后用缓冲液(butter)洗柱。最后,从柱中洗脱蛋白质。从细胞裂解物, 清洗前的His柱,流过清洗缓冲液(follow-through washing buffer)和洗脱液采 集样品。具体地,在BL21细胞(泳道1)中表达含有N末端六组氨酸标签的 MBP_Cas9融合蛋白,用His柱层析纯化,并使用TEV消化(泳道2)除去 His_MBP标签。离子交换层析用于从未消化的MBP_Cas9融合物和完全加工 的Cas9(泳道4)的剩余物(leftover)中分离His_MBP标签(泳道3)。通过凝胶电泳 分析样品,并且结果示于图6B中。如所示,检测到M10A Cas9切口酶并在洗 脱液中富集。
分析野生型Cas9和Cas9切口酶两者的活性。通过用T7 RNA聚合酶体外 转录产生两种crRNA和一种tracrRNA,纯化,并且每种crRNA(10uM)与 tracrRNA以相等的摩尔比退火。在Cas9切割缓冲液(20mM HEPES pH 7.5, 150mM KCl,10mM MgCl2,0.5mM DTT)中,将每种crRNA:tracrRNA双链 体(1uM)与纯化的Cas9野生型或D10A切口酶(0.5uM)在37℃下温育10分钟。 将形成的复合物与相应的靶DNA扩增子(0.025uM)温育不同的时间。通过加 入EDTA(10mM)终止反应,并用ZYMO DNA纯化-浓缩柱纯化复合物。在8% TBE-尿素PAAG上分离纯化的DNA,并用SYBR Gold染色显色。
如图6C左侧的图所示,310bp靶扩增子描绘为两条黑线,表示在顶图上 由野生型Cas9切割的两条DNA链,或者在底图上D10A切口酶仅对顶链产生 切口。Cas9 WT和D10A切口酶识别位点距离靶扩增子的5’端为160个碱基。 用包含互补crRNA(1和2)的野生型Cas9(WT)或D10A切口酶Cas9(D10A)分别 消化两个扩增子(1和2)。在8%TBE-尿素凝胶上分析切割产物。如所示,在 与0.5uM Cas9复合物在37℃温育3小时后有效切割100ng扩增子DNA。
还用M10A Cas9切口酶在37℃处理310bp扩增子(如图6D右图所示)30分 钟、60分钟或90分钟。结果显示在图6D的左图中。如所示,当Cas9切口酶和 crRNA都存在于复合物中时,如箭头所示检测到有切口的产物。随着反应时 间增加,产生更多的有切口的产物。
接下来,测试纯化的M10A Cas9切口酶的切口产生特异性。通过用T7 RNA聚合酶体外转录产生两种crRNA和一种tracrRNA,纯化,并且每种 crRNA(10uM)与tracrRNA以相等的摩尔比退火。在Cas9切割缓冲液(20mM HEPES pH 7.5,150mM KCl,10mM MgCl2,0.5mM DTT)中,将每种crRNA: tracrRNA双链体(1uM)与纯化的D10A切口酶(0.5uM)在37℃下温育10分钟。将 形成的复合物与互补和不互补的靶DNA扩增子(0.025uM)温育72小时。通过 加入EDTA(50mM)终止反应,在6%TBE-尿素PAAG上分离并用SYBR Gold 染色显现。
图6E左侧的小图显示了310bp靶扩增子,描绘为两条黑线,代表具有被 D10A切口酶切割的顶链的两条DNA链。D10A切口酶识别位点距离靶扩增子 的5’端为160个碱基。用与互补的或非互补crRNA:tracrRNA双链体形成的 D10A切口酶复合物将两个扩增子(1和2)单独消化72小时。如图6E所示,仅当 靶扩增子和crRNA互补时,观察到切口产物。
实施例5切口平移
在本实施例中,使用链霉亲合素移位测定(Streptavidin shift assay)分析在切口平移期间掺入不同生物素-dNTP的效率。在进行切口平移并将各种dNTP 掺入翻译产物后,将链霉亲合素加入反应产物中,并通过与生物素标记的 dNTP结合而与翻译产物形成复合物。然后,进行电泳迁移率移位测定以分 析翻译产物。
具体地,将3ug源自含有Nb.BtsI切口内切核酸酶识别位点的人基因组的 HLA区的120bp长的扩增子在37℃下与5单位的Nb.BtsI在CutSmart TM缓冲液 (50mM乙酸钾,20mMTris-乙酸盐,10mM乙酸镁,100μg/ml BSA,pH 7.9) 中温育1小时。通过用T7 RNA聚合酶体外转录产生一个crRNA和一个tracrRNA,纯化,并且将crRNA(10uM)以等摩尔比与tracrRNA退火。将 crRNA:tracrRNA双链体(1uM)与纯化的Cas9 D10A切口酶(0.5uM)在Cas9切 割缓冲液(20mM HEPES pH 7.5,150mM KCl,10mM MgCl2,0.5mM DTT)中 37℃温育10分钟。将形成的复合物与靶DNA扩增子(0.025uM)温育3小时。通 过加入EDTA(10mM)终止反应,并用ZYMO DNA纯化-浓缩柱纯化复合物。 采用纯化的DNA用于切口平移反应。将包含10ng DNA扩增子,50μM每种 dNTP,10μM生物素-dGTP或生物素-dUTP,切口平移缓冲液和2单位的BstDNA聚合酶的20ul切口平移反应在37℃温育30分钟,用EDTA(50mM)终止, 并用ZYMO DNA纯化-浓缩柱纯化。将纯化的DNA分开,并且一半在室温下 与10μg链霉亲合素一起温育10分钟。在8%TBE PAAG上分离所有样品并用 SYBR Gold染色显现。
结果示于图7B中。左图显示了当在切口平移期间使用生物素-dGTP时的 凝胶位移测定结果。右图显示了在切口平移期间使用生物素-dUTP时的凝胶 移位测定结果。如所示,生物素-dGTP比生物素-dUTP更有效地掺入,但也 非特异性地掺入非切口DNA中。
使用Bst聚合酶和生物素-dUTP举例说明使用切口平移的DNA富集。分析 了三种靶DNA序列:HLA-A3(100bp),1037(300bp)和1216(300bp)。然后,使 用定量PCR定量DNA富集。在用切口内切核酸酶Nb.BtsI切口的120bp扩增子 上和在用Cas9 D10A切口酶切口的300bp扩增子上进行切口平移。用生物素 -dGTP(图I)或生物素-dUTP(图II)补充切口翻译反应混合物。切口平移后,取 每个样品的一半用于链霉亲合素移位测定(S.A),随后在8%TBE-PAAG上进 行分析。在该切口平移实验中,使用Bst DNA聚合酶。
具体地,将来自含有Nb.BtsI切口内切核酸酶识别位点的人基因组的HLA 区的3μg扩增子在37℃下与5单位的Nb.BtsI在CutSmartTM缓冲液(50mM乙酸 钾,20mM Tris-乙酸盐,10mM乙酸镁,100μg/ml BSA,pH 7.9)中温育1小 时。通过用T7 RNA聚合酶体外转录产生两种crRNA和一种tracrRNA,纯化, 并且每种crRNA(10uM)与tracrRNA以相等的摩尔比退火。将crRNA:tracrRNA 双链体(1uM)与纯化的CAS9 D10A切口酶(0.5uM)在Cas9切割缓冲液(20mM HEPES pH7.5,150mM KCl,10mM MgCl 2,0.5mM DTT)中于37℃温育10分 钟。将形成的复合物与靶DNA扩增子(0.025uM)温育3小时。通过加入 EDTA(10mM)终止反应,并用ZYMODNA纯化-浓缩柱纯化复合物。在基因 组DNA文库背景(使用Illumina的v2 Nextera文库制备试剂盒根据制造商方案 (可获自Illunima Inc.,San Diego,CA)制备)中,采用纯化的DNA进行切口平 移反应。将含有0.5ng DNA扩增子,100ng基因组DNA文库,50uM每种dNTP,10uM生物素-dUTP,切口平移缓冲液和2单位Bst DNA聚合酶的20ul切口平移 反应在37℃下温育30分钟,并且用EDTA(10mM)终止。用40μl链霉亲合素磁 珠下拉的生物素化的DNA用100ng gDNA和100μg BSA预结合。因此,用高 和低盐洗涤缓冲液洗涤珠,并且用NaOH从珠洗脱靶向的扩增子,随后进行 pH中和。通过qPCR使用对靶向扩增子和人AluSx5重复序列(用作标准化对照) 特异性的引物分析适当稀释的洗脱物质和输入对照。
结果显示于图7C中,左图呈现了在靶扩增子切口平移后链霉亲合素下拉 测定法中富集的三种不同扩增子(HLA_A3、1037和1216)的qPCR分析结果。 将有切口(切口)和没有切口(无切口)的靶DNA扩增子掺入100ng的基因组 DNA文库中,用或不用生物素-dUTP(生物素/无生物素)进行切口平移,并用 磁性链霉亲合素珠将所得的生物素化DNA下拉。右图呈现了在下拉测定中携 带的基因组DNA文库的qPCR分析的结果。灰色条代表标准化的Cq值,条上 方的数字描绘不同扩增子和基因组DNA文库的倍数富集。如所示,仅在切口 平移反应混合物中含有切口靶物和生物素-dUTP的条件下观察到靶DNA的 富集。
实施例6:通过使用含Cas9切口酶的CRISPR-Cas系统产生双切口来富集靶 DNA
在本实施例中例示了通过在相同DNA链上使用CRISPR-Cas系统产生双 切口来富集靶DNA。用两个Cas9切口酶系统处理230bp的双链DNA。每个系 统可以在相同DNA链上产生缺口,如图8B的左图所示。
通过用T7RNA聚合酶体外转录产生两种crRNA和一种tracrRNA,纯化, 并且量每种crRNA(10uM)与tracrRNA以相等的摩尔比退火。在Cas9切割缓冲 液(20mM HEPES pH 7.5,150mM KCl,10mM MgCl 2,0.5mM DTT)中,将每 种crRNA:tracrRNA双链体(1uM)与纯化的CAS9切口酶(0.5uM)在37℃下温育 15分钟。拉出形成的复合物并与靶DNA扩增子(0.025uM)温育指定时间。通 过用ZYMO DNA纯化-浓缩柱的复合物纯化停止反应,并在8%TBE-尿素PAAG上分析。结果显示在图8B的右图中。如图所示,发生双切口产生,如 63bp DNA片段所证明的。
作为在相同链上双切口产生的结果产生的63bp单链DNA片段可以用如 上所述的探针置换,其在本实施例中例示。用Cas9切口酶系统处理至2.5ng 的300bp扩增子后,加入60mer生物素化探针并与靶DNA杂交。具体地,在含 有一种或两种crRNA:tracrRNA双链体(0.05uM)的CAS9复合物(0.1uM)的 CAS9切割缓冲液中将靶DNA(0.005uM)产生切口3小时。通过用ZYMO DNA 纯化-浓缩柱进行复合物纯化来停止切口产生反应。将所得纯化的DNA(4nM) 与100倍摩尔过量的生物素化捕获探针混合,并将含有100ng人基因组文库 DNA的不同等分试样在85℃,75℃,70℃,65℃,60℃温育2分钟,随后逐 渐冷却至40℃。无切口的靶扩增子与没有生物素化捕获探针的样品一起经历 相同的变性-退火条件。用链霉亲合素包被的磁珠将形成的带切口的扩增子 和生物素化捕获探针的异双链体下拉,并用基因组DNA封闭以防止非特异性 靶扩增子结合。因此,用高和低盐洗涤缓冲液洗涤两次珠,并且用NaOH从 珠洗脱靶向的扩增子,随后进行pH中和。通过qPCR使用对靶向扩增子和人 AluSx5重复(用作标准化对照)特异性的引物分析适当稀释的洗脱材料和输入 对照。
结果示于图8E中。如所示,当不加入捕获探针时,没有富集;在完全变 性条件下,对于所有靶DNA都观察到富集。在部分变性条件下,观察到有切 口的DNA的靶向富集。qPCR结果显示在用两个Cas9切口酶对相同链上产生 切口的扩增子的成功富集。
在本实施例中还例示了通过在使用CRISPR-Cas系统对相对DNA链上产 生双切口来富集靶DNA。如图8C所示,进行300bp扩增子的相对链上的切口 产生,并使用凝胶电泳分析产生的片段。
具体地,将靶DNA在37℃下在具有Cas9切口产生反应的不同组分的Cas9 切割缓冲液中温育3小时,如凝胶图像的顶部所示。通过用ZYMO DNA纯化 -浓缩柱进行复合物纯化来停止切口产生反应。将洗脱样品的等分试样在天 然8%PAAG上加载。结果示于图8C中。顶部两条带代表原始DNA扩增子, 并且在具有两种crRNA的泳道中更快的迁移条带代表有切口的产物。
图8D显示在75℃下短暂温育后原始和有切口的靶向扩增子的8%PAAG 凝胶分析。将靶DNA在Cas9切割缓冲液中在37℃在Cas9切口产生缓冲液的不 同组分的Cas9切割缓冲液中温育3小时,如凝胶图像的顶部所示。通过用 ZYMO DNA纯化-浓缩柱进行复合物纯化来停止切口产生反应。将洗脱样品 的等分试样在75℃温育3分钟,立即转移到冰上,并在凝胶上加载。顶部两 条带代表原始DNA扩增子,具有两种crRNA中单种的泳道中更快的迁移条带对应于有切口的产物。如所示,产生具有适当大小的单链DNA。
实施例7:Cas9介导的BRAF靶DNA的靶物富集
图13显示了Cas9切割测定1300的实例的流程图。Cas9切割测定1300可以 包括但不限于以下步骤。
在步骤1310,通过限制性内切核酸酶消化使包含靶DNA序列的质粒线性 化。在一个实例中,靶DNA序列是BRAF DNA序列,并且通过AlwNI限制性 内切核酸酶消化使质粒线性化。
在步骤1315,形成Cas9内切核酸酶复合物,并切割靶向的BRAF DNA序 列。Cas9内切核酸酶复合物包含Cas9内切核酸酶,靶物特异性crRNA和辅助 tracrRNA。crRNA和tracrRNA形成“指导RNA”,其将Cas9内切核酸酶靶向到 用于双链DNA切割的靶定DNA序列。在一个实例中,Cas9内切核酸酶是切 割靶DNA序列的两条链的野生型Cas9内切核酸酶。在一个实例中,用标签如 生物素标签标记crRNA和/或tracrRNA(即,crRNA和tracrRNA是生物素化 的)。在另一个实例中,crRNA和tracrRNA是未标记的。
在任选的步骤1320,使用链霉亲合素包被的磁响应珠分离Cas9复合物。 其中具有片段化靶BRAF DNA的Cas9复合物通过生物素化的crRNA和 tracrRNA和链霉亲合素包被的珠之间形成的生物素-链霉亲合素结合复合物 结合到链霉亲合素包被的珠的表面。
在步骤1325,使用蛋白酶反应消化Cas9内切核酸酶以释放靶向且切割的 BRAFDNA片段。通过例如琼脂糖凝胶电泳检测释放的BRAF DNA片段。
图14图示了图13的Cas9切割测定1300的步骤。即,质粒1410包括靶BRAF DNA序列1415。在Cas9切割测定1300的步骤1310,通过AlwNI限制性内切核 酸酶消化使质粒1410线性化。在该实例中,质粒1410的大小约为3582bp。在 Cas9切割测定1300的步骤1315,形成包含Cas9内切核酸酶1420,靶物特异性 crRNA 1425(例如,BRAF特异性crRNA)和tracrRNA1430的Cas9复合物。靶 物特异性crRNA 1425和tracrRNA 1430形成“靶向RNA”,其将Cas9内切核酸酶 1420靶向质粒1410中的靶BRAF DNA序列1415。在该实例中,靶物特异性 crRNA1425和tracrRNA 1430是生物素化的。在另一个实例(未显示)中,靶物 特异性crRNA 1425和tracrRNA 1430不是标记的。靶物BRAF DNA序列1415 被Cas9内切核酸酶1420切割以产生一对Cas9切割片段1435,即约1242bp的片 段1435a和约2340bp的片段1435b,每个包含靶BRAF DNA序列1415的一部 分。在Cas9切割测定1300的任选步骤1320,链霉亲合素包被的磁响应珠用于 “下拉”Cas9复合物和其中的片段1435a和1435b。在Cas9切割测定1300的步骤1325,使用蛋白酶反应消化Cas9内切核酸酶1420,并释放片段1435a和1435b。
图15显示了使用图13的Cas9切割测定1300单独或在包含BRAF质粒DNA 和基因组DNA的混合物中的BRAF质粒DNA片段化的琼脂糖凝胶的照片 1500。在该实例中,Cas9内切核酸酶是野生型内切核酸酶。使用非生物素化 的crRNA和tracrRNA进行阴性对照反应(“阴性对照”)。使用生物素化的crRNA 和tracrRNA进行阳性对照反应(“阳性对照”)。使用体外转录试剂盒(即,Biotin IVT试剂盒)制备cRNA和tracrRNA。双生物素化的crRNA和tracrRNA也获自 Bio-Synthesis Inc.。通常,双生物素化的crRNA或tracrRNA产生更好的下拉结 果。使用体外转录(ASF3507(AmpliScribeTM T7-FlashTM转录试剂盒(Epicentre, Illumina))制备非生物素化的crRNA和tracrRNA。使用单独的BRAF质粒 DNA(“BRAF”),基因组DNA(“gDNA”),BRAF质粒DNA加上基因组DNA的 混合物(即50%BRAF+50%gDNA或25%BRAF+75%gDNA,按重量百分 比计)进行实验。通过琼脂糖凝胶电泳检测切割片段(即,2340bp和1242bp片 段)。数据显示,在阴性对照(“阴性对照”)和阳性对照(“阳性对照”)反 应两者中,Cas9复合物使靶向的BRAF质粒DNA片段化,而没有显著切割基 因组DNA(gDNA)。数据还显示,在BRAF质粒DNA和基因组DNA的混合样 品中靶向的BRAF质粒DNA的切割没有受到基因组DNA的量显著影响,即不 同量的gDNA不会中断Cas9对BRAF质粒的切割。
图16显示图15的片段化BRAF质粒DNA的Cas9介导的下拉(富集)的琼脂 糖凝胶的照片1600。在该实例中,使用链霉亲合素包被的磁珠来下拉并分离 Cas9复合物(图13的Cas9切割测定1300的任选步骤1320),然后进行片段化的 靶定DNA序列的蛋白酶消化和洗脱(Cas9切割测定1300的步骤1325)。通过琼 脂糖凝胶电泳检查上清液(SN)级分和珠洗脱级分(“珠粒”)的BRAF DNA切割 片段(即,2340bp和1242bp片段)。数据显示,在阴性对照样品(阴性对照)中, 仅在上清液级份(SN)中检测到BRAF裂解片段和人基因组DNA(gDNA)。在阳 性对照样品(对照)和混合的BRAF+gDNA样品中,在洗脱的珠级分中检测到 BRAF裂解片段。在洗脱的珠级分中还检测到由Cas9复合物非特异性下拉的 基因组DNA(由箭头指示)。
为了确定可以使用Cas9复合物下拉的最大片段,将HindIII消化的λDNA 片段用于Cas9切割和下拉测定。
图17显示HindIII消化的噬菌体λDNA的片段大小分布的照片1700。设计 四种不同的crRNA以靶向和切割λDNA的23.13kb,9.4kb,4.4kb和2.3kb HindIII 片段。每个λHindIII片段的预期的Cas9介导的切割片段大小示于表1中。
Figure BDA0002897666300000591
图18显示Cas9介导的λHindIII-DNA片段切割的琼脂糖凝胶的照片1800。 在该实例中,使用500nM野生型Cas9内切核酸酶,500nM双生物素标记 (DB)tracrRNA,500nM crRNA(未标记)和500ng HindIII消化的λDNA形成Cas9 复合物。切割反应在1X CutSmart缓冲液中进行。靶向23.13,9.4,4.4和2.3kb 的λHindIII片段的的crRNA分别由23130crRNA,9416crRNA,4361crRNA 和2322crRNA命名。对于每个HindIII消化的λ片段,用圆圈指示预期的Cas9 介导的切割片段的位置。箭头指示每个未切割的λHindIII片段的预期位置。 使用BRAF质粒DNA和双生物素(DB)标记的tracrRNA和/或双生物素(DB)标 记的crRNA作为切割和下拉对照样品。数据显示Cas9介导的所有片段大小的 切割,即23.13,9.4,4.4和2.3kb的λHindIII片段。
图19显示图18的靶向且切割的λDNA片段的Cas9介导的下拉(富集)的琼 脂糖凝胶的照片1900。基本上如参考图16所述进行下拉测定,除了将500mM NaCl加入珠洗涤缓冲液中。对于每个HindIII消化的λ片段,用圆圈指示预期 的Cas9介导的切割片段的位置。实箭头指示每个未切割的HindIII消化的λ片 段的预期位置。使用BRAF质粒DNA和双生物素(DB)标记的tracrRNA和/或双 生物素(DB)标记的crRNA作为切割和下拉对照样品。数据显示切割的λDNA 片段的Cas9介导的下拉。在洗脱的珠粒级分中也观察到Cas9复合物的脱靶结 合(非特异性结合)(由虚线箭头指示)。
使用Cas9内切核酸酶的D10A突变切口酶形式(命名为“Cas9-切口酶”)重 复参照图19描述的HindIII消化的λ片段下拉测定。Cas9-切口酶在双链DNA中 产生单链断裂,但不产生双链断裂(即,其不切割HindIII消化的λ片段)。
图20显示HindIII消化的λ片段的Cas9-切口酶介导的下拉的琼脂糖凝胶 的照片2000。在该实例中,在37℃下进行下拉,并将500mM NaCl加入珠洗 涤缓冲液中。对于每个HindIII消化的λ片段(即,23.13,9.4,4.4和2.3kb,分 别命名为23130crRNA,9416crRNA,4361crRNA和2322crRNA),实心黑色 箭头表示未切割片段的预期位置。使用线性化的BRAF质粒DNA(3582bp)作 为下拉对照。数据显示,如所预期的,HindIII消化的λ片段和线性化的BRAF 质粒DNA不被Cas9-切口酶切割。数据还显示线性化的BRAF质粒DNA被 Cas9-切口酶下拉。仅观察到23.13kb和2.3kb片段(由圆圈指示)的HindIII消化 的λ片段的下拉。在洗脱的珠粒级分中也观察到Cas9-切口酶复合物的脱靶结 合(非特异性结合)(由虚线箭头指示)。观察到的脱靶结合的模式不同于用野 生型Cas9复合物观察到的模式。
随后的实验(未显示)已经证明,使用Cas9切割和下拉温育温度为48℃和 500mMNaCl的更严格的下拉条件,以及在48℃和在存在500mM NaCl下的严 格珠清洗可用于实质性改善下拉反应的特异性。
为了评价文库富集方案中Cas9-切口酶的多重复用能力,针对λDNA的9 个不同区域设计了9个crRNA和生物素化探针。图21显示λDNA的基因组图谱 2100(基因组大小=48502bp)。基因组图谱2100上的圆圈位点表示λDNA的靶 向区域。生物素化探针是靶向Cas9-D10A切口酶复合物中每个靶物λDNA区 域的置换环的寡核苷酸。目标λDNA区域在λ基因组的位置6723、11720、 16782、21700、26189、32617、37557、42587和46423处(由圆圈指示)。
图22显示了Cas9-切口酶文库富集方案2200的流程图。文库富集方案 2200可以包括但不限于以下步骤。
在步骤2210,输入DNA(例如,50ng)用于文库制备和靶定序列的富集。 在一个实例中,DNA是如参考图21所述的λDNA。在另一个实例中,DNA是 参考图24更详细描述的人基因组DNA。
在步骤2215,将输入DNA进行片段标签化。在一个实例中,使用Nextera TM片段标签化的文库制备方案(Illumina Inc.)将λDNA进行片段标签化。在片 段标签化反应完成后,使用例如Zymo Clean&Concentrator TM试剂盒(Zymo Research)纯化片段标签化的λDNA。
在步骤2220,扩增经片段标签化的DNA。在一个实例中,使用10个循环 的PCR扩增来扩增经片段标签化的λDNA。在经片段标签化的λDNA的PCR扩 增后,使用例如基于SPRI珠的纯化方案(例如,来自Beckman的Ampure XP) 纯化扩增的片段。
在步骤2225,使用针对每个靶定DNA区域的crRNA,tracrRNA和Cas9- 切口酶形成Cas9-切口酶复合物。在一个实例中,tracrRNA是未标记的。在另 一个实例中,tracrRNA是生物素化的。在一个实例中,在48℃下进行复合物 形成。在另一个实施例中,在37℃下进行复合物形成。
在步骤2230,进行基于磁珠的下拉反应以捕获靶向的DNA序列。在一个 实例中,使用靶向Cas9-切口酶复合物中每个λDNA区域的置换环的生物素化 探针和链霉亲合素包被的磁珠下拉靶向的λDNA序列。在另一个实例中,使 用Cas9-切口酶复合物中的生物素化的tracrRNA序列和链霉亲合素包被的磁 珠下拉靶向的λDNA序列。在基于珠的下拉反应之后,使用基于珠的洗涤方 案洗涤珠和其上的Cas9-切口酶复合物。
在步骤2235,扩增通过Cas9-切口酶复合物与链霉亲合素包被的磁珠结 合的靶定DNA序列。在一个实例中,使用15至20个循环的PCR扩增来扩增靶 向的λDNA序列。在靶向λDNA序列的基于珠的扩增后,使用基于SPRI珠的 纯化方案(例如,Ampure XP)纯化和洗脱靶向的λDNA序列。在一个实例中, 使用8μL洗脱缓冲液洗脱靶向的λDNA序列。
在步骤2240,对分离的靶DNA序列进行测序。在一个实例中,使用MiSeq 系统(Illumina Inc.)进行测序。文库富集方案2200结束。
图23显示了使用图22的文库富集方案2200制备的λDNA富集文库,百分 比总深度和GC含量百分比(作为λ基因组中位置的函数)的图2300。在该实例 中,使用500mM NaCl和48℃的温育温度进行Cas9-切口酶复合物形成和珠洗 涤方案步骤。使用靶向Cas9-D10A切口酶复合物中每个靶向λDNA区域的置 换环的生物素化探针来下拉复合物。曲线2300显示了每个靶向区域的百分比 总深度的线2310和GC含量百分比(作为λ基因组中位置的函数)的线2315。数 据显示9个靶向λ区中的8个的显著富集。数据还显示不同的靶向区域显示不同的富集百分比。靶富集的可变性可能是由于例如序列差异或其他参数,如crRNA的二级结构或与crRNA高度相似性的脱靶序列的数目。数据还显示观 察到的富集是真实的,而不仅仅是GC含量的函数。
图24显示了使用图22的文库富集方案2200制备的人基因组文库中内源 BRAF DNA序列富集的柱状图2400。在该实例中,使用相对于基因组 DNA(50ng基因组DNA)40倍,100倍或250倍摩尔过量的Cas9-切口酶形成 Cas9-切口酶复合物(文库富集方案2200的步骤2225)。使用500mM NaCl,48℃ 的温育温度和1小时或过夜(ON)温育(“结合时间”)进行Cas9-切口酶复合物形 成。使用不同浓度的对靶向BRAF DNA序列特异性的生物素化探针进行 Cas9-切口酶复合物的下拉(文库富集方案2200的步骤2230),温育时间为45分 钟。在下拉反应之后,使用含有500mM NaCl的1X CutSmart缓冲液在48℃将 珠和其上的Cas9-切口酶复合物洗涤70分钟。使用20个循环的PCR扩增靶向的 BRAF DNA序列(文库富集方案2200的步骤2235)。在靶向BRAF DNA序列的 基于珠的扩增后,使用基于SPRI珠的纯化方案纯化和洗脱(8μL洗脱体积)靶 向的BRAF DNA序列。使用MiSeq系统进行测序(文库富集方案2200的步骤 2240)。图上的每个条表示文库。文库通过“gDNA-切口酶-生物素化探针(BP) -结合时间-PCR循环”命名。例如,条形图2400中的第一个条形标记为 “gDNA1-40X切口酶-BP-1hr-20cyc_2”,并且表示使用相对于DNA文库的40x 摩尔过量的Cas9-切口酶,40X摩尔过量的生物素化探针,结合时间(复合物 形成时间)1小时,以及20个循环的基于珠的PCR扩增制备的文库。数据显示 使用100x Cas9-切口酶,100X生物素化探针,1小时结合时间(复合物形成) 和20个循环的基于珠的PCR扩增制备的文库具有最高水平的靶物富集(即,文 库“gDNA2-100x切口酶-BP-1hr-20cyc“)。图的左侧部分来自珠洗脱,并且 具有Sup1,Sup2名称的图右侧部分来自下拉(富集)后的上清液。gDNA1, gDNA2等指从相同的人gDNA样品制备的但具有不同的双重索引(Nextera Sample Prep方案)的文库,用于在MiSeq仪器上测序。
图25显示了HindIII消化的λDNA的crRNA设计的实例的数据表2500,以 及用于crRNA合成的IVT反应的正向和反向链。
本发明包括:
1.用于富集靶核酸的方法,所述方法包括:
提供内切核酸酶系统,其具有:
聚簇规则间隔短回文重复(CRISPR)RNA(crRNA)或其衍生物,和
CRISPR相关(Cas)蛋白或其变体,
其中所述crRNA或其衍生物包含与所述靶核酸的区域互补的靶物特异 性核苷酸区域;
使所述靶核酸与所述内切核酸酶系统接触以形成复合物,并且
分离所述复合物,从而富集所述靶核酸。
2.项1的方法,其还包括从所述复合物中分离所述靶核酸。
3.项2的方法,其还包括扩增靶定的核酸。
4.项1的方法,其中所述内切核酸酶系统还包含反式激活 crRNA(tracrRNA)或其衍生物。
5.项1的方法,其中所述crRNA或其衍生物是包含与tracrRNA多核苷酸 融合的crRNA多核苷酸的多核苷酸。
6.项1的方法,其中所述内切核酸酶系统是II型CRISPR-Cas系统或其衍 生物。
7.项1的方法,其中所述靶核酸是双链DNA(dsDNA)。
8.项1的方法,其中所述内切核酸酶系统是被标记的。
9.项8的方法,其中所述crRNA用生物素标记。
10.项9的方法,其还包括加入链霉亲合素,从而分离所述复合物。
11.项8的方法,其中所述Cas蛋白或其衍生物用捕获标签标记。
12.项1的方法,其中所述Cas蛋白或其变体是Cas9蛋白或其变体。
13.项12的方法,其中所述Cas9蛋白或其变体保留两个核酸酶结构域并 且能够产生双链DNA断裂。
14.项12的方法,其中所述Cas9蛋白含有一个失活的核酸酶结构域,所 述核酸酶结构域包含切割与所述crRNA互补的靶核酸链的结构域中的突变。
15.项14的方法,其中所述突变是D10A。
16.项12的方法,其中所述Cas9蛋白含有一个失活的核酸酶结构域,所 述核酸酶结构域包含切割与所述crRNA不互补的靶核酸链的结构域中的突 变。
17.项16的方法,其中所述突变是H840A。
18.项12的方法,其中所述Cas9蛋白含有两个失活的核酸酶结构域。
19.根据项18所述的方法,其中所述两个失活的核酸酶结构域包含切割 与所述crRNA互补的链的结构域中的第一突变和切割与所述crRNA不互补的 链的结构域中的第二突变。
20.项19的方法,其中所述第一突变是D10A,并且所述第二突变是 H840A。
21.用于富集靶双链核酸的方法,其包括:
提供内切核酸酶系统,其具有:
聚簇规则间隔短回文重复(CRISPR)RNA(crRNA)或其衍生物,和
CRISPR相关(Cas)蛋白或其变体,
其中所述crRNA或其衍生物包含与所述靶双链核酸的第一链的区域互 补的靶物特异性核苷酸区域;
使所述靶双链核酸与所述内切核酸酶系统接触以形成第一复合物;
使标记的核酸与所述靶双链核酸的第二链杂交以形成第二复合物,所述 靶双链核酸的第二链与所述crRNA或其衍生物不互补,并且
分离所述第二复合物,从而富集所述靶核酸。
22.项21所述的方法,其还包括从所述复合物中分离所述靶核酸。
23.项22的方法,其还包括扩增靶定的核酸。
24.项21的方法,其中所述内切核酸酶系统还包含反式激活 crRNA(tracrRNA)或其衍生物。
25.项21的方法,其中所述crRNA或其衍生物是包含与tracrRNA多核苷 酸融合的crRNA多核苷酸的多核苷酸。
26.项21的方法,其中所述内切核酸酶系统是II型CRISPR-Cas系统或其 衍生物。
27.项21的方法,其中所述靶核酸是双链DNA(dsDNA)。
28.项21的方法,其中所述内切核酸酶系统是被标记的。
29.项28的方法,其中所述crRNA用生物素标记。
30.项29的方法,还包括加入链霉亲合素,从而分离所述复合物。
31.项28的方法,其中所述Cas蛋白或其衍生物用捕获标签标记。
32.项21的方法,其中所述Cas蛋白或其变体是Cas9蛋白或其变体。
33.项32的方法,其中所述Cas9蛋白或其变体保留两个核酸酶结构域, 并且能够产生双链核酸断裂。
34.项32的方法,其中所述Cas9蛋白含有一个失活的核酸酶结构域,所 述核酸酶结构域包含切割与所述crRNA互补的靶核酸链的结构域中的突变。
35.项34的方法,其中所述突变是D10A。
36.项32的方法,其中所述Cas9蛋白含有一个失活的核酸酶结构域,所 述核酸酶结构域包含切割与所述crRNA不互补的靶核酸链的结构域中的突 变。
37.项36的方法,其中所述突变是H840A。
38.项32的方法,其中所述Cas9蛋白含有两个失活的核酸酶结构域。
39.项38的方法,其中所述两个失活的核酸酶结构域包含切割与所述 crRNA互补的链的结构域中的第一突变和切割与所述crRNA不互补的链的结 构域中的第二突变。
40.项39的方法,其中所述第一突变是D10A,并且所述第二突变是 H840A。
41.项1或21的方法,其还包括使所述靶核酸进行片段标签化 (tagmenting)。
42.项1或21的方法,其还包括加入转座酶,其中所述crRNA或其衍生物 含有转座子末端。
43.项41或42的方法,其中所述转座子末端是嵌合末端(ME),并且其中 所述转座酶是Tn5转座酶。
44.项1或21的方法,其还包括:
将转座子末端加入所述靶核酸,并且
使所述靶核酸进行片段标签化,
其中所述内切核酸酶系统进一步包含转座酶。
45.项44的方法,其中所述转座酶结合所述内切核酸酶系统的核苷酸序 列。
46.项44的方法,其中所述转座酶和所述Cas蛋白形成融合蛋白。
47.项44的方法,其中所述转座子末端是嵌合末端(ME),并且其中所述 转座酶是Tn5转座酶。
48.用于富集靶核酸的方法,所述方法包括:
从受试者的血浆或血清获得细胞游离DNA(cell free DNA,cfDNA)群体, 所述细胞游离DNA群体含有所述靶核酸;
提供内切核酸酶系统,其具有:
聚簇规则间隔短回文重复(CRISPR)RNA(crRNA)或其衍生物,和
CRISPR相关(Cas)蛋白或其变体,
其中所述crRNA或其衍生物包含与所述靶核酸的区域互补的靶物特异 性核苷酸区域;
使所述靶核酸与所述内切核酸酶系统接触以形成复合物,并且
分离所述复合物,从而富集靶核酸。
49.项48的方法,其中所述靶核酸包含单核苷酸变体(SNV)。
50.项48的方法,其还包括从所述复合物中分离所述靶核酸。
51.项48的方法,还包括扩增靶定的核酸。
52.项48的方法,其中所述内切核酸酶系统还包含反式激活 crRNA(tracrRNA)或其衍生物。
53.项48的方法,其中所述crRNA或其衍生物是包含与tracrRNA多核苷 酸融合的crRNA多核苷酸的多核苷酸。
54.项48的方法,其中所述内切核酸酶系统是II型CRISPR-Cas系统或其 衍生物。
55.项48的方法,其中所述靶核酸是双链DNA(dsDNA)。
56.项48的方法,其中所述内切核酸酶系统是被标记的。
57.项56的方法,其中所述crRNA用生物素标记。
58.项57的方法,其还包括加入链霉亲合素,从而分离所述复合物。
59.项56的方法,其中所述Cas蛋白或其衍生物用捕获标签标记。
60.项48的方法,其中所述Cas蛋白或其变体是Cas9蛋白或其变体。
61.项60的方法,其中所述Cas9蛋白或其变体保留两个核酸酶结构域并 且能够产生双链DNA断裂。
62.项60的方法,其中所述Cas9蛋白含有一个失活的核酸酶结构域,所 述核酸酶结构域包含切割与所述crRNA互补的靶核酸链的结构域中的突变。
63.项62的方法,其中所述突变是D10A。
64.项60的方法,其中所述Cas9蛋白含有一个失活的核酸酶结构域,所 述核酸酶结构域包含切割与所述crRNA不互补的靶核酸链的所述结构域中 的突变。
65.项64的方法,其中所述突变是H840A。
66.项60的方法,其中所述Cas9蛋白含有两个失活的核酸酶结构域。
67.项66的方法,其中所述两个失活的核酸酶结构域包含切割与所述 crRNA互补的链的结构域中的第一突变和切割与所述crRNA不互补的链的结 构域中的第二突变。
68.项67的方法,其中所述第一突变是D10A,并且所述第二突变是 H840A。
69.项48的方法,其中所述靶核酸在所述细胞游离DNA的胎儿细胞级份 中,并且其中所述细胞游离DNA来自母体血浆。
70.项48的方法,其中所述受试者是癌症患者。
71.用于检测单核苷酸变体(SNV)的方法,其包括:
从受试者的血浆或血清中获得细胞游离DNA的群体;
提供第一内切核酸酶系统,其具有:
第一聚簇规则间隔短回文重复(CRISPR)RNA(crRNA)或其衍生物,和
第一CRISPR相关(Cas)蛋白或其变体,
其中所述第一crRNA或其衍生物包含与第一靶核酸的区域互补的第一 靶物特异性核苷酸区域,并且其中所述第一Cas蛋白具有核酸酶活性;
使用所述核酸内切酶系统切割所述第一靶核酸,并且
使用聚合酶链式反应(PCR)扩增第二靶核酸,其中所述第二靶核酸包含 所述第一靶核酸的单核苷酸变体形式。
72.项71的方法,其中所述第一内切核酸酶系统还包含反式激活 crRNA(tracrRNA)或其衍生物。
73.项71的方法,其中所述crRNA或其衍生物是包含与tracrRNA多核苷 酸融合的crRNA多核苷酸的多核苷酸。
74.项71的方法,其中所述第一内切核酸酶系统是II型CRISPR-Cas系统 或其衍生物。
75.项71的方法,其中所述靶核酸是双链DNA(dsDNA)。
76.项71的方法,其中所述Cas蛋白或其变体是Cas9蛋白或其变体。
77.根据项71所述的方法,还包括:
提供第二内切核酸酶系统,其具有:
第二簇聚规则间隔短回文重复(CRISPR)RNA(crRNA)或其衍生物,和
第二CRISPR相关(Cas)蛋白或其变体,
其中所述第二crRNA或其衍生物包含与所述第二靶核酸的区域互补的 第二靶物特异性核苷酸区域;
使所述第二靶核酸与所述第二内切核酸酶系统接触以形成复合物,
分离所述复合物从而富集第二靶核酸。
78.项77的方法,还包括从所述复合物中分离第二靶核酸。
79.项77的方法,其中所述第二内切核酸酶系统还包含反式激活 crRNA(tracrRNA)或其衍生物。
80.项77的方法,其中所述第二crRNA或其衍生物是包含与tracrRNA多 核苷酸融合的crRNA多核苷酸的多核苷酸。
81.项77的方法,其中所述第二内切核酸酶系统是II型CRISPR-Cas系统 或其衍生物。
82.项77的方法,其中所述第二靶核酸是双链DNA(dsDNA)。
83.项77的方法,其中所述第二内切核酸酶系统是标记的。
84.项83的方法,其中所述第二crRNA用生物素标记。
85.项84的方法,还包括加入链霉亲合素,从而分离所述复合物。
86.项83的方法,其中所述第二Cas蛋白或其衍生物用捕获标签标记。
87.项77的方法,其中所述第二Cas蛋白或其变体是Cas9蛋白或其变体。
88.项87的方法,其中所述Cas9蛋白或其变体保留两个核酸酶结构域, 并且能够产生双链核酸断裂。
89.项87的方法,其中所述Cas9蛋白含有一个失活的核酸酶结构域,所 述核酸酶结构域包含切割与所述crRNA互补的靶核酸链的结构域中的突变。
90.项89的方法,其中所述突变是D10A。
91.项87的方法,其中所述Cas9蛋白含有一个失活的核酸酶结构域,所 述核酸酶结构域包含切割与所述crRNA不互补的靶核酸链的结构域中的突 变。
92.项91的方法,其中所述突变是H840A。
93.项87的方法,其中所述Cas9蛋白包含两个失活的核酸酶结构域。
94.项93的方法,其中所述两个失活的核酸酶结构域包含切割与所述 crRNA互补的链的结构域中的第一突变和切割与所述crRNA不互补的链的结 构域中的第二突变。
95.项94的方法,其中所述第一突变是D10A,且所述第二突变是H840A。
96.项71的方法,其中所述靶核酸在所述细胞游离DNA的胎儿细胞级份 中,并且其中所述细胞游离DNA来自母体血浆。
97.项71的方法,其中所述受试者是癌症患者。
98.用于标记靶核酸的方法,其包括:
提供第一核酸酶系统,其具有:
第一聚簇规则间隔短回文重复(CRISPR)RNA(crRNA)或其衍生物,和
第一CRISPR相关(Cas)蛋白或其变体,
其中所述第一crRNA或其衍生物包含与所述靶核酸的第一区互补的第 一靶物特异性核苷酸区,并且其中所述第一Cas蛋白包含一个失活的核酸酶 结构域;
使包含所述靶核酸的双链核酸与所述第一核酸酶系统接触以在所述靶 核酸的所述第一区产生第一单链切口,以及
标记所述靶核酸。
99.项98的方法,还包括通过标记分离靶核酸,从而富集所述靶核酸。
100.项99的方法,还包括扩增所述靶核酸。
101.项98的方法,其中所述第一核酸酶系统还包含反式激活 crRNA(tracrRNA)。
102.项98的方法,其中所述第一crRNA或其衍生物是包含与tracrRNA多 核苷酸融合的crRNA多核苷酸的多核苷酸。
103.项98的方法,其中所述第一核酸酶系统是II型CRISPR-Cas系统或其 衍生物。
104.项98的方法,其中所述靶核酸是双链DNA(dsDNA)。
105.项98的方法,其中所述第一Cas蛋白或其变体是Cas9蛋白或其变体。
106.项105的方法,其中所述Cas9蛋白或其变体含有一个失活的核酸酶 结构域,所述核酸酶结构域在包含切割与所述第一crRNA互补的靶核酸链的 结构域中的突变。
107.项106的方法,其中所述突变是D10A。
108.项105的方法,其中所述第一Cas9蛋白或其变体含有一个失活的核 酸酶结构域,所述核酸酶结构域包含切割与所述第一crRNA不互补的靶核酸 链的结构域中的突变。
109.项108的方法,其中所述突变是H840A。
110.项98所述的方法,其还包括进行切口平移。
111.项110的方法,其中所述切口平移通过使用选自DNA Pol 1、Bst和 Taq的切口平移聚合酶进行。
112.项110的方法,其中所述切口平移在含有生物素化dNTP的反应混合 物中进行。
113.项112的方法,其中所述生物素化的dNTP是生物素化的dUTP。
114.项110的方法,还包括加入磁性链霉亲合素珠以富集生物素化的靶 核酸。
115.项98所述的方法,其还包括:
提供第二核酸酶系统,其具有:
第二crRNA或其衍生物,和
第二Cas蛋白或其变体,
其中所述第二crRNA或其衍生物包含与所述靶核酸的第二区互补的第 二靶物特异性核苷酸区,并且其中所述第二Cas蛋白包含一个失活的核酸酶 结构域,并且
使含有所述靶核酸的所述双链核酸与所述第二核酸酶系统接触以在所 述靶核酸的第二区产生第二单链切口,
其中所述靶核酸的第一区不同于所述靶核酸的第二区。
116.项115的方法,其中所述第一单链切口和所述第二单链切口在所述 靶核酸的相同链上。
117.项116的方法,其中所述靶核酸的相同链上的所述第一单链切口和 所述第二单链切口之间的间隔为1bp至20bp。
118.项116的方法,其中进一步包括进行切口平移。
119.项118的方法,其中所述切口平移通过使用切口平移聚合酶Phi29进 行。
120.项116的方法,其中:
所述靶核酸的第一区和所述靶核酸的第二区在所述靶核酸的相同链上;
其中所述第一Cas蛋白是含有一个失活的核酸酶结构域的第一Cas9蛋 白,所述核酸酶结构域包含切割与所述第一crRNA互补的靶核酸链的结构域 中的第一突变,且
其中所述第二Cas蛋白是含有一个失活的核酸酶结构域的第二Cas9蛋 白,所述核酸酶结构域包含切割与所述第二crRNA互补的靶核酸链的结构域 中的第二突变。
121.项120的方法,其中所述第一突变和所述第二突变均为D10A。
122.项116的方法,其中:
所述靶核酸的第一区和所述靶核酸的第二区在所述靶核酸的相同链上;
其中所述第一Cas蛋白是含有一个失活的核酸酶结构域的第一Cas9蛋 白,所述核酸酶结构域包含切割与所述第一crRNA不互补的靶核酸链的结构 域中的第一突变,和
其中所述第二Cas蛋白是含有一个失活的核酸酶结构域的第二Cas9蛋 白,所述核酸酶结构域包含切割与所述第二crRNA不互补的靶核酸链的结构 域中的第二突变。
123.项122的方法,其中所述第一突变和所述第二突变都是H840A。
124.项116的方法,其中:
所述靶核酸的第一区和所述靶核酸的第二区在所述靶核酸的不同链上;
所述第一Cas蛋白是含有一个失活的核酸酶结构域的第一Cas9蛋白,所 述核酸酶结构域包含切割与第一crRNA互补的靶核酸链的结构域中的第一 突变,和
所述第二Cas蛋白是含有一个失活的核酸酶结构域的第二Cas9蛋白,所 述核酸酶结构域包含切割与第二crRNA不互补的靶核酸链的结构域中的第 二突变。
125.项124的方法,其中所述第一突变是D10A,并且所述第二突变是 H840A。
126.项115的方法,其中所述第一单链切口和所述第二单链切口之间的 间隔为20bp至500bp。
127.项115的方法,其还包括:
加入捕获探针;并且
用所述捕获探针交换所述第一单链切口和所述第二单链切口之间的单 链核酸产物,
其中所述捕获探针能够与同所述单链核酸产物互补的核酸杂交。
128.项124的方法,其中所述捕获探针的序列与所述单链核酸产物的序 列10%至100%相同。
129.项125的方法,其中所述捕获探针是生物素化探针。
130.项126的方法,其还包括加入磁性链霉亲合素珠以富集所述靶核酸。
131.项124的方法,其中所述捕获探针含有突出核苷酸序列,所述突出 核苷酸序列与固定在表面上的寡核苷酸互补。
132.项62的方法,其中所述第一单链切口和所述第二单链切口在所述靶 核酸的相反链上,从而产生第一双链核酸断裂末端。
133.项132的方法,其中:
所述靶核酸的第一区和所述靶核酸的第二区在所述靶核酸的相同链上;
所述第一Cas蛋白是含有一个失活的核酸酶结构域的第一Cas9蛋白,所 述核酸酶结构域包含切割与第一crRNA互补的靶核酸链的结构域中的第一 突变,和
所述第二Cas蛋白是含有一个失活的核酸酶结构域的第二Cas9蛋白,所 述核酸酶结构域包含切割与第二crRNA不互补的靶核酸链的结构域中的第 二突变。
134.项132的方法,其中所述第一突变是D10A,并且所述第二突变是 H840A。
135.项132的方法,其中:
所述靶核酸的第一区和所述靶核酸的第二区在所述靶核酸的相反链上;
所述第一Cas蛋白是含有一个失活的核酸酶结构域的第一Cas9蛋白,所 述核酸酶结构域包含切割与第一crRNA互补的靶核酸链的结构域中的第一 突变,和
所述第二Cas蛋白是含有一个失活的核酸酶结构域的第二Cas9蛋白,所 述核酸酶结构域含有切割与第二crRNA互补的靶核酸链的结构域中的第二 突变。
136.项135的方法,其中所述第一突变和所述第二突变都是D10A。
137.项132的方法,其中:
所述靶核酸的第一区和所述靶核酸的第二区在所述靶核酸的相反链上;
所述第一Cas蛋白是含有一个失活的核酸酶结构域的第一Cas9蛋白,所 述核酸酶结构域包含切割与第一crRNA不互补的靶核酸链的结构域中的第 一突变,和
所述第二Cas蛋白是含有一个失活的核酸酶结构域的第二Cas9蛋白,所 述核酸酶结构域含有切割与第二crRNA不互补的靶核酸链的结构域中的第 二突变。
138.项137的方法,其中所述第一突变和所述第二突变都是H840A。
139.项132的方法,其还包括将衔接头连接到所述第一双链DNA断裂末 端。
140.项139的方法,其中所述衔接头是生物素化的。
141.项140的方法,其还包括加入磁性链霉亲合素珠以富集所述靶核酸。
142.项115的方法,其还包括:
提供第三核酸酶系统,其具有:
第三crRNA或其衍生物,和
第三Cas蛋白或其变体,
其中所述第三crRNA或其衍生物包含与所述靶核酸的第三区基本上互 补的第三靶物特异性核苷酸区,并且其中所述第三Cas蛋白包含一个失活的 核酸酶结构域;
提供第四核酸酶系统,其具有:
第四crRNA或其衍生物,和
第四Cas蛋白或其变体,
其中所述第四crRNA或其衍生物包含与所述靶核酸的第四区基本上互 补的第四靶物特异性核苷酸区,并且其中所述第四Cas蛋白包含一个失活的 核酸酶结构域;并且
使含有所述靶核酸的所述双链核酸与所述第三和第四核酸酶系统接触 以在所述靶核酸的第三区域产生第三单链切口并在所述靶核酸的第四区域 产生第四单链切口,其中所述第三单链切口和所述第四单链切口在所述靶核 酸的相反链上,从而产生第二双链核酸断裂末端,所述第二双链核酸断裂末 端不同于所述第一双链核酸断裂末端。
143.项139的方法,其还包括将衔接头连接到所述第二双链核酸断裂末 端。
144.用于富集靶核酸的方法,其包括:
提供用crRNA组编程的Cas9蛋白的群体,其中所述crRNA组包含与所述 靶核酸的一系列不同区域互补的crRNA;
使所述靶核酸与用所述crRNA组编程的Cas9蛋白群体接触以产生一系 列核酸片段,并且
将衔接头连接到核酸片段中的至少一个,
其中所述Cas9蛋白保留两个核酸酶结构域。
145.项144的方法,其中所述crRNA组含有与所述靶核酸的两个不同区 域互补的crRNA,其中两个不同区域之间的间隔长于10kb。
146.项144的方法,其中所述靶核酸是双链DNA。
147.项144的方法,其中所述靶核酸是基因组DNA、染色体DNA、基因 组或部分基因组。
148.用于对靶核酸进行测序的方法,其包括:
提供用crRNA组编程的Cas9蛋白群体,其中所述crRNA组包含与所述靶 核酸间的一系列不同区域互补的crRNA;
使所述靶核酸与所述用crRNA组编程的Cas9蛋白群体接触以产生一系 列核酸片段,并且
对所述一系列核酸片段测序。
149.用于对靶核酸进行测序的方法,其包括:
提供多个Cas9蛋白群体,每个Cas9蛋白群体用不同的crRNA组编程,其 中每一个crRNA组含有与所述靶核酸间的不同系列的区域互补的crRNA,
在单独的反应中使所述靶核酸与所述多个Cas9蛋白群体中的每一个接 触以产生不同系列的核酸片段,并且
对所述核酸片段测序。
150.项149的方法,其中所述多个Cas9蛋白群体包含三个Cas9蛋白群体, 并且其中由所述三个Cas9蛋白群体中的每一个产生的核酸片段含有与由三 个Cas9蛋白群体中的至少另一个产生的核酸片段重叠的序列。
151.项148或项149的方法,其中所述Cas9蛋白保留两个核酸酶结构域。
152.项148或项149的方法,其中所述靶核酸是双链DNA。
153.项148或项149的方法,其中所述靶核酸是基因组DNA、染色体 DNA、基因组或部分基因组。
154.项148或项149的方法,还包括将衔接头与所述核酸片段连接。
155.项148或项149的方法,其还包括将含有所述靶DNA的DNA样品稀 释成单倍体含量。
156.项148或项149的方法,其中对所述核酸片段测序包括使用下列一项 或多项:合成测序、桥式PCR、链终止测序、通过杂交测序、纳米孔测序和 连接测序。
157.用于富集多个靶序列的方法,其包括:
提供多个Cas9蛋白群体,每个Cas9蛋白群体用不同的crRNA组编程,其 中每个crRNA组含有与所述靶核酸间的不同系列的区域互补的crRNA,
在单独的反应中使所述靶核酸与所述多个Cas9蛋白群体中的每一个接 触以产生不同系列的核酸片段,其中下列至少一种用结合标签标记:Cas9酶、 crRNA、tracrRNA、和靶向置换环的DNA探针,并且
将与Cas9复合物的标记组分相关的核酸片段与其它片段分离,从而富集 感兴趣的片段。
158.项157的方法,其中所述结合标签包含生物素。
159.项157的方法,其中通过掺入一个或多个生物素化核苷酸的体外转 录标记tracrRNA。
160.项157的方法,其中通过掺入一个或多个生物素化核苷酸的体外转 录标记crRNA。
161.项157的方法,其中所述分离包括将核酸片段-Cos9复合物与链霉亲 合素标记的珠结合。
162.项161的方法,其中所述结合包括用包含高于100mM、200mM、 250mM、300mM、400mM、500mM NaCl的盐浓度的缓冲液洗涤。
163.项157的方法,其中所述接触包括包含高于100mM、200mM、 250mM、300mM、400mM、500mM NaCl的盐浓度的缓冲液条件。

Claims (10)

1.用于富集靶核酸的方法,所述方法包括:
提供内切核酸酶系统,其具有:
聚簇规则间隔短回文重复(CRISPR)RNA(crRNA)或其衍生物,和
CRISPR相关(Cas)蛋白或其变体,
其中所述crRNA或其衍生物包含与所述靶核酸的区域互补的靶物特异性核苷酸区域;
使所述靶核酸与所述内切核酸酶系统接触以形成复合物,并且
分离所述复合物,从而富集所述靶核酸。
2.权利要求1的方法,其还包括从所述复合物中分离所述靶核酸。
3.权利要求2的方法,其还包括扩增靶定的核酸。
4.权利要求1的方法,其中所述内切核酸酶系统还包含反式激活crRNA(tracrRNA)或其衍生物。
5.权利要求1的方法,其中所述crRNA或其衍生物是包含与tracrRNA多核苷酸融合的crRNA多核苷酸的多核苷酸。
6.权利要求1的方法,其中所述内切核酸酶系统是II型CRISPR-Cas系统或其衍生物。
7.权利要求1的方法,其中所述靶核酸是双链DNA(dsDNA)。
8.权利要求1的方法,其中所述内切核酸酶系统是被标记的。
9.权利要求8的方法,其中所述crRNA用生物素标记。
10.权利要求9的方法,其还包括加入链霉亲合素,从而分离所述复合物。
CN202110046936.8A 2014-07-21 2015-07-20 使用crispr-cas系统的多核苷酸富集 Pending CN112941065A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201462027191P 2014-07-21 2014-07-21
US62/027,191 2014-07-21
US201562181084P 2015-06-17 2015-06-17
US62/181,084 2015-06-17
CN201580051001.1A CN107109401B (zh) 2014-07-21 2015-07-20 使用crispr-cas系统的多核苷酸富集

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201580051001.1A Division CN107109401B (zh) 2014-07-21 2015-07-20 使用crispr-cas系统的多核苷酸富集

Publications (1)

Publication Number Publication Date
CN112941065A true CN112941065A (zh) 2021-06-11

Family

ID=53887185

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201580051001.1A Active CN107109401B (zh) 2014-07-21 2015-07-20 使用crispr-cas系统的多核苷酸富集
CN202110046936.8A Pending CN112941065A (zh) 2014-07-21 2015-07-20 使用crispr-cas系统的多核苷酸富集

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201580051001.1A Active CN107109401B (zh) 2014-07-21 2015-07-20 使用crispr-cas系统的多核苷酸富集

Country Status (7)

Country Link
US (2) US10457969B2 (zh)
EP (1) EP3172321B2 (zh)
CN (2) CN107109401B (zh)
AU (2) AU2015294354B2 (zh)
CA (2) CA2955382C (zh)
SG (1) SG11201702066UA (zh)
WO (1) WO2016014409A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117512076A (zh) * 2023-12-25 2024-02-06 中国农业科学院农业质量标准与检测技术研究所 一种基于劈裂式Cas9系统的RNA免反转录的检测方法

Families Citing this family (84)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3613852A3 (en) 2011-07-22 2020-04-22 President and Fellows of Harvard College Evaluation and improvement of nuclease cleavage specificity
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9228207B2 (en) 2013-09-06 2016-01-05 President And Fellows Of Harvard College Switchable gRNAs comprising aptamers
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US20150166985A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting von willebrand factor point mutations
CN113215219A (zh) 2014-02-13 2021-08-06 宝生物工程(美国) 有限公司 从核酸的初始集合中耗尽靶分子的方法、以及用于实践其的组合物和试剂盒
CA2956224A1 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
US10435685B2 (en) 2014-08-19 2019-10-08 Pacific Biosciences Of California, Inc. Compositions and methods for enrichment of nucleic acids
CN107109495B (zh) * 2014-11-11 2021-12-24 伊鲁米那股份有限公司 使用crispr-cas系统的多核苷酸扩增
CA2971444A1 (en) 2014-12-20 2016-06-23 Arc Bio, Llc Compositions and methods for targeted depletion, enrichment, and partitioning of nucleic acids using crispr/cas system proteins
DK3337898T3 (da) 2015-08-19 2021-10-18 Arc Bio Llc Indfangning af nukleinsyrer ved anvendelse af et nukleinsyre-styret nuclease-baseret system
US20190225955A1 (en) 2015-10-23 2019-07-25 President And Fellows Of Harvard College Evolved cas9 proteins for gene editing
ES2835101T3 (es) * 2016-02-10 2021-06-21 Univ Michigan Regents Detección de ácidos nucleicos
US11542544B2 (en) 2016-05-11 2023-01-03 Illumina, Inc. Polynucleotide enrichment and amplification using CRISPR-Cas or Argonaute systems
EP3469079B1 (en) 2016-06-13 2020-08-05 Grail, Inc. Enrichment of mutated cell free nucleic acids for cancer detection
WO2017218979A1 (en) * 2016-06-17 2017-12-21 The Broad Institute, Inc. Unbiased detection of nucleic acid modifications
WO2018013724A1 (en) * 2016-07-12 2018-01-18 Kapa Biosystems, Inc. System and method for transposase-mediated amplicon sequencing
WO2018027078A1 (en) 2016-08-03 2018-02-08 President And Fellows Of Harard College Adenosine nucleobase editors and uses thereof
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
GB201616590D0 (en) * 2016-09-29 2016-11-16 Oxford Nanopore Technologies Limited Method
CN107880132B (zh) * 2016-09-30 2022-06-17 北京大学 一种融合蛋白及使用其进行同源重组的方法
US11242542B2 (en) * 2016-10-07 2022-02-08 Integrated Dna Technologies, Inc. S. pyogenes Cas9 mutant genes and polypeptides encoded by same
KR20240007715A (ko) 2016-10-14 2024-01-16 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵염기 에디터의 aav 전달
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
WO2018129368A2 (en) * 2017-01-06 2018-07-12 Editas Medicine, Inc. Methods of assessing nuclease cleavage
GB2559118B (en) * 2017-01-19 2021-07-07 Agency For Science Tech And Research Astarstar Method for normalizing a nucleic acid sample
US10995333B2 (en) * 2017-02-06 2021-05-04 10X Genomics, Inc. Systems and methods for nucleic acid preparation
EP3592853A1 (en) 2017-03-09 2020-01-15 President and Fellows of Harvard College Suppression of pain by gene editing
WO2018165629A1 (en) 2017-03-10 2018-09-13 President And Fellows Of Harvard College Cytosine to guanine base editor
IL269458B2 (en) 2017-03-23 2024-02-01 Harvard College Nucleic base editors that include nucleic acid programmable DNA binding proteins
US11867661B2 (en) 2017-04-07 2024-01-09 Sage Science, Inc. Systems and methods for detection of genetic structural variation using integrated electrophoretic DNA purification
WO2018209320A1 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
WO2018231952A1 (en) * 2017-06-13 2018-12-20 Genetics Research, Llc, D/B/A Zs Genetics, Inc. Plasma/serum target enrichment
US10527608B2 (en) 2017-06-13 2020-01-07 Genetics Research, Llc Methods for rare event detection
US10947599B2 (en) 2017-06-13 2021-03-16 Genetics Research, Llc Tumor mutation burden
US11142788B2 (en) 2017-06-13 2021-10-12 Genetics Research, Llc Isolation of target nucleic acids
US10081829B1 (en) 2017-06-13 2018-09-25 Genetics Research, Llc Detection of targeted sequence regions
KR102634727B1 (ko) * 2017-06-14 2024-02-07 위스콘신 얼럼나이 리서어치 화운데이션 변형된 가이드 rna, crispr-리보뉴클레오프로테인 복합체 및 사용 방법
US20190002964A1 (en) * 2017-06-28 2019-01-03 Genetics Research, Llc, D/B/A Zs Genetics, Inc. Bodily fluid target enrichment
US20190085318A1 (en) * 2017-06-28 2019-03-21 Genetics Research, Llc, D/B/A Zs Genetics, Inc. Solid phase negative enrichment
US20190071716A1 (en) * 2017-06-28 2019-03-07 Genetics Research, Llc, D/B/A Zs Genetics, Inc. Bodily fluid enrichment
US20190048425A1 (en) * 2017-06-28 2019-02-14 Genetics Research, Llc, D/B/A Zs Genetics, Inc. Tumor detection and monitoring
US11732274B2 (en) 2017-07-28 2023-08-22 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)
EP3950957A1 (en) 2017-08-08 2022-02-09 Depixus In vitro isolation and enrichment of nucleic acids using site-specific nucleases
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
CN107523640A (zh) * 2017-10-12 2017-12-29 厦门燕旭安生物科技有限公司 一种ctDNA精准测序的扩增子文库构建方法
EP3697906A1 (en) 2017-10-16 2020-08-26 The Broad Institute, Inc. Uses of adenosine base editors
CN108192956B (zh) * 2017-11-17 2021-06-01 东南大学 一种基于Cas9核酸酶的DNA检测分析方法及其应用
EP3765063A4 (en) * 2018-03-15 2021-12-15 Twinstrand Biosciences, Inc. METHODS AND REAGENTS FOR ENRICHMENT NUCLEIC ACID MATERIAL FOR SEQUENCING APPLICATIONS AND OTHER NUCLEIC ACID MATERIAL INTERROGATIONS
CA3100492A1 (en) * 2018-05-16 2019-11-21 Genetics Research, Llc, D/B/A Zs Genetics, Inc. Sequence specific methylation enrichment and detection
JP2021523745A (ja) 2018-05-16 2021-09-09 シンテゴ コーポレイション ガイドrna設計および使用のための方法およびシステム
CN109182454A (zh) * 2018-08-22 2019-01-11 杭州恺思医疗器械有限公司 一种捕获基因组特定dna片段的方法
CN109837273B (zh) * 2018-09-17 2021-06-29 东南大学 一种crispr辅助dna靶向富集方法及其应用
EP3856903A4 (en) 2018-09-27 2022-07-27 Grail, LLC METHYLATION MARKER AND TARGETED METHYLATION PROBE PANEL
US11739320B2 (en) 2018-11-05 2023-08-29 Wisconsin Alumni Research Foundation Gene correction of Pompe disease and other autosomal recessive disorders via RNA-guided nucleases
EP3650555B1 (en) * 2018-11-07 2024-02-21 Siemens Healthineers AG Target irrelevant guide rna for crispr
EP3650558A1 (en) * 2018-11-07 2020-05-13 Siemens Healthcare GmbH Liquid sample workflow for nanopore sequencing
US11680261B2 (en) 2018-11-15 2023-06-20 Grail, Inc. Needle-based devices and methods for in vivo diagnostics of disease conditions
CN113166798A (zh) * 2018-11-28 2021-07-23 主基因有限公司 通过核酸内切酶保护的靶向富集
US11473124B2 (en) 2018-12-12 2022-10-18 Depixus Method of nucleic acid enrichment using site-specific nucleases followed by capture
CN109652861A (zh) * 2018-12-22 2019-04-19 阅尔基因技术(苏州)有限公司 一种生化试剂盒及其应用方法
MX2021011426A (es) 2019-03-19 2022-03-11 Broad Inst Inc Metodos y composiciones para editar secuencias de nucleótidos.
CN110205318A (zh) * 2019-05-15 2019-09-06 杭州杰毅生物技术有限公司 基于CRISPR-Cas去除宿主基因组DNA的宏基因组提取方法
JP2022543375A (ja) * 2019-07-31 2022-10-12 バイオスクリブ ゲノミックス,インク. 遺伝子変異分析
KR20220044212A (ko) 2019-08-09 2022-04-06 넛크래커 테라퓨틱스 인코포레이티드 미세유체 장치 및 이의 사용 방법
WO2021055385A1 (en) * 2019-09-16 2021-03-25 Stitch Bio, Llc Diagnostic assay for cancer
GB201913997D0 (en) * 2019-09-27 2019-11-13 Oxford Nanopore Tech Ltd Method
WO2021076876A1 (en) * 2019-10-18 2021-04-22 Zymergen Inc. Genotyping edited microbial strains
EP3816299A1 (en) * 2019-10-31 2021-05-05 Siemens Healthcare GmbH A method to prepare personalized target-irrelevant guide rna for crispr
US11211144B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Methods and systems for refining copy number variation in a liquid biopsy assay
US11475981B2 (en) 2020-02-18 2022-10-18 Tempus Labs, Inc. Methods and systems for dynamic variant thresholding in a liquid biopsy assay
US11211147B2 (en) 2020-02-18 2021-12-28 Tempus Labs, Inc. Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing
JP2023525304A (ja) 2020-05-08 2023-06-15 ザ ブロード インスティテュート,インコーポレーテッド 標的二本鎖ヌクレオチド配列の両鎖同時編集のための方法および組成物
US20240018571A1 (en) * 2020-05-19 2024-01-18 Meso Scale Technologies, Llc. Methods, compositions, and kits for nucleic acid detection
AU2021329302A1 (en) 2020-08-18 2023-02-16 Illumina Cambridge Limited Sequence-specific targeted transposition and selection and sorting of nucleic acids
CN113106144A (zh) * 2020-12-30 2021-07-13 中南大学湘雅二医院 Dna片段靶向富集方法及其在基因组靶向测序中的应用
GB2603203A (en) * 2021-02-02 2022-08-03 Univ Heriot Watt Method for enriching nucelic acids
KR102604416B1 (ko) * 2021-02-03 2023-11-20 연세대학교 산학협력단 가이드 rna를 이용한 유전자 분석 방법
CN113249376A (zh) * 2021-05-18 2021-08-13 明科生物技术(杭州)有限公司 一种基于CRISPR-Cas捕获甜瓜线粒体基因组的方法及该方法的应用
EP4373963A2 (en) * 2021-07-21 2024-05-29 Montana State University Nucleic acid detection using type iii crispr complex
EP4276195A1 (en) * 2022-05-10 2023-11-15 Genartis S.r.l. Methods for determining the presence or risk of developing myotonic dystrophy type 1 (md1) or myotonic dystrophy type 2 (md2)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011053987A1 (en) * 2009-11-02 2011-05-05 Nugen Technologies, Inc. Compositions and methods for targeted nucleic acid sequence selection and amplification
CN103668472A (zh) * 2013-12-31 2014-03-26 北京大学 利用CRISPR/Cas9系统构建真核基因敲除文库的方法

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4883750A (en) 1984-12-13 1989-11-28 Applied Biosystems, Inc. Detection of specific sequences in nucleic acids
US5034506A (en) 1985-03-15 1991-07-23 Anti-Gene Development Group Uncharged morpholino-based polymers having achiral intersubunit linkages
EP0450060A1 (en) 1989-10-26 1991-10-09 Sri International Dna sequencing
US5432272A (en) 1990-10-09 1995-07-11 Benner; Steven A. Method for incorporating into a DNA or RNA oligonucleotide using nucleotides bearing heterocyclic bases
US5593826A (en) 1993-03-22 1997-01-14 Perkin-Elmer Corporation, Applied Biosystems, Inc. Enzymatic ligation of 3'amino-substituted oligonucleotides
CA2160016C (en) 1993-04-12 2008-06-03 Robert L. Letsinger Method of forming oligonucleotides
SE9400522D0 (sv) 1994-02-16 1994-02-16 Ulf Landegren Method and reagent for detecting specific nucleotide sequences
US5677170A (en) 1994-03-02 1997-10-14 The Johns Hopkins University In vitro transposition of artificial transposons
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
US20050244870A1 (en) 1999-04-20 2005-11-03 Illumina, Inc. Nucleic acid sequencing using microsphere arrays
US7244559B2 (en) 1999-09-16 2007-07-17 454 Life Sciences Corporation Method of sequencing a nucleic acid
US6274320B1 (en) 1999-09-16 2001-08-14 Curagen Corporation Method of sequencing a nucleic acid
US7001792B2 (en) 2000-04-24 2006-02-21 Eagle Research & Development, Llc Ultra-fast nucleic acid sequencing device and a method for making and using the same
AU2001282881B2 (en) 2000-07-07 2007-06-14 Visigen Biotechnologies, Inc. Real-time sequence determination
EP1354064A2 (en) 2000-12-01 2003-10-22 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
WO2002101095A1 (en) 2001-06-08 2002-12-19 U.S. Genomics, Inc. Methods and products for analyzing nucleic acids using nick translation
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
EP2607369B1 (en) 2002-08-23 2015-09-23 Illumina Cambridge Limited Modified nucleotides for polynucleotide sequencing
US7595883B1 (en) 2002-09-16 2009-09-29 The Board Of Trustees Of The Leland Stanford Junior University Biological analysis arrangement and approach therefor
US7315019B2 (en) 2004-09-17 2008-01-01 Pacific Biosciences Of California, Inc. Arrays of optical confinements and uses thereof
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
EP3722409A1 (en) 2006-03-31 2020-10-14 Illumina, Inc. Systems and devices for sequence by synthesis analysis
WO2008051530A2 (en) 2006-10-23 2008-05-02 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
GB2457851B (en) 2006-12-14 2011-01-05 Ion Torrent Systems Inc Methods and apparatus for measuring analytes using large scale fet arrays
US20090246788A1 (en) * 2008-04-01 2009-10-01 Roche Nimblegen, Inc. Methods and Assays for Capture of Nucleic Acids
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US9080211B2 (en) 2008-10-24 2015-07-14 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
US8017328B2 (en) * 2008-11-21 2011-09-13 Agilent Technologies, Inc. Genome partitioning using a nicking endonuclease
US8835125B2 (en) * 2011-03-02 2014-09-16 Affymetrix, Inc. Methods and compositions for selective labeling of different biotinylated targets within multicolor or multilabel assays
CA2861856C (en) * 2012-01-20 2020-06-02 Sequenom, Inc. Diagnostic processes that factor experimental conditions
UA118014C2 (uk) * 2012-05-25 2018-11-12 Те Ріджентс Оф Те Юніверсіті Оф Каліфорнія Спосіб модифікації днк-мішені
US20140038241A1 (en) * 2012-08-05 2014-02-06 Zhaohui Zhou Genomic enrichment method, composition, and reagent kit
CN110669746B (zh) * 2012-10-23 2024-04-16 基因工具股份有限公司 用于切割靶dna的组合物及其用途
US20140127752A1 (en) * 2012-11-07 2014-05-08 Zhaohui Zhou Method, composition, and reagent kit for targeted genomic enrichment
ES2768291T3 (es) 2013-02-14 2020-06-22 Univ Osaka Método para aislar una región genómica específica utilizando una molécula que se une específicamente a una secuencia de ADN endógena
US11414695B2 (en) * 2013-05-29 2022-08-16 Agilent Technologies, Inc. Nucleic acid enrichment using Cas9
WO2015075056A1 (en) 2013-11-19 2015-05-28 Thermo Fisher Scientific Baltics Uab Programmable enzymes for isolation of specific dna fragments

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011053987A1 (en) * 2009-11-02 2011-05-05 Nugen Technologies, Inc. Compositions and methods for targeted nucleic acid sequence selection and amplification
CN103668472A (zh) * 2013-12-31 2014-03-26 北京大学 利用CRISPR/Cas9系统构建真核基因敲除文库的方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
FUJITA T 等: ""Efficient isolation of specific genomic regions and identification of associated proteins by engineered DNA-binding molecule-mediated chromatin immunoprecipitation (enChIP) using CRISPR"", 《BIOCHEMICAL AND BIOPHYSICAL RESEARCH COMMUNICATIONS》, vol. 439, no. 1, pages 132 - 136, XP028715147, DOI: 10.1016/j.bbrc.2013.08.013 *
RAN FA 等: ""Double nicking by RNA-guided CRISPR Cas9 for enhanced genome editing specificity"", 《CELL》, vol. 154, no. 6, pages 1380 - 1389, XP055299681, DOI: 10.1016/j.cell.2013.08.021 *
THOMAS LUBBERSTEDT 等: "《Diagnostics in Plant Breeding》", 31 December 2013, SPRINGER出版集团, pages: 103 - 104 *
李君 等: ""CRISPR/Cas系统:RNA靶向的基因组定向编辑新技术"", 《遗传》, vol. 35, no. 11, pages 1265 - 1273 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117512076A (zh) * 2023-12-25 2024-02-06 中国农业科学院农业质量标准与检测技术研究所 一种基于劈裂式Cas9系统的RNA免反转录的检测方法
CN117512076B (zh) * 2023-12-25 2024-04-12 中国农业科学院农业质量标准与检测技术研究所 一种基于劈裂式Cas9系统的RNA免反转录的检测方法

Also Published As

Publication number Publication date
EP3172321B2 (en) 2023-01-04
US20160017396A1 (en) 2016-01-21
EP3172321B1 (en) 2019-08-21
CN107109401B (zh) 2021-02-19
SG11201702066UA (en) 2017-04-27
CA3176503A1 (en) 2016-01-28
AU2015294354A1 (en) 2017-02-02
WO2016014409A1 (en) 2016-01-28
CN107109401A (zh) 2017-08-29
CA2955382A1 (en) 2016-01-28
EP3172321A1 (en) 2017-05-31
US20200165650A1 (en) 2020-05-28
CA2955382C (en) 2023-07-18
AU2015294354B2 (en) 2021-10-28
AU2021282536B2 (en) 2024-03-28
AU2021282536A1 (en) 2022-01-06
US10457969B2 (en) 2019-10-29

Similar Documents

Publication Publication Date Title
AU2021282536B2 (en) Polynucleotide enrichment using CRISPR-Cas systems
US11926866B2 (en) Method for detecting on-target and predicted off-target genome editing events
US20220042090A1 (en) PROGRAMMABLE RNA-TEMPLATED SEQUENCING BY LIGATION (rSBL)
CN109477137B (zh) 使用argonaute系统的多核苷酸富集和扩增
EP2929048B1 (en) Restriction enzyme-free target enrichment
EP3102702B1 (en) Error-free sequencing of dna
JP2023537850A (ja) 核酸の配列特異的標的化転位並びに選択及び選別
US20210395799A1 (en) Methods for variant detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40053631

Country of ref document: HK