CN112041459A - 核酸扩增方法 - Google Patents

核酸扩增方法 Download PDF

Info

Publication number
CN112041459A
CN112041459A CN201980023713.0A CN201980023713A CN112041459A CN 112041459 A CN112041459 A CN 112041459A CN 201980023713 A CN201980023713 A CN 201980023713A CN 112041459 A CN112041459 A CN 112041459A
Authority
CN
China
Prior art keywords
nucleotide
nucleic acid
cell
composition
terminator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201980023713.0A
Other languages
English (en)
Other versions
CN112041459B (zh
Inventor
查尔斯·加瓦德
约翰·伊斯顿
维罗妮卡·冈萨雷斯-皮纳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
St Jude Childrens Research Hospital
Original Assignee
St Jude Childrens Research Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by St Jude Childrens Research Hospital filed Critical St Jude Childrens Research Hospital
Publication of CN112041459A publication Critical patent/CN112041459A/zh
Application granted granted Critical
Publication of CN112041459B publication Critical patent/CN112041459B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/186Modifications characterised by incorporating a non-extendable or blocking moiety
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2531/00Reactions of nucleic acids characterised by
    • C12Q2531/10Reactions of nucleic acids characterised by the purpose being amplify/increase the copy number of target nucleic acid
    • C12Q2531/119Strand displacement amplification [SDA]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)

Abstract

本文提供了用于准确且可扩展的主要模板定向扩增(PTA)核酸扩增和测序方法的组合物和方法,及其在研究、诊断和治疗中的应用。

Description

核酸扩增方法
交叉引用
本申请要求于2018年1月29日提交的美国临时专利申请号62/623,471的权益,该临时申请的内容通过引用以其全文并入于此。
背景技术
利用核酸扩增的研究方法,例如,下一代测序,提供了关于复杂样品、基因组和其他核酸来源的大量信息。然而,对于涉及小样品的研究、诊断和治疗,需要高度准确、可扩展和有效的核酸扩增和测序方法。
发明内容
本文提供的组合物包括:至少一种靶核酸分子和扩增子文库,其中所述扩增子文库包括从所述至少一种靶核酸分子的扩增获得的多种多核苷酸,其中至少一些所述多核苷酸包括终止子核苷酸,其中所述多核苷酸的至少5%是所述至少一种靶核酸分子的直接拷贝。本文还提供了组合物,其中所述多核苷酸的至少10%是所述至少一种靶核酸分子的直接拷贝。本文还提供了组合物,其中所述多核苷酸的至少15%是所述至少一种靶核酸分子的直接拷贝。本文还提供了组合物,其中所述多核苷酸的至少25%是所述至少一种靶核酸分子的直接拷贝。本文还提供了组合物,其中所述多核苷酸的至少50%是所述至少一种靶核酸分子的直接拷贝。本文还提供了组合物,其中所述多核苷酸的5-50%是所述至少一种靶核酸分子的直接拷贝。本文还提供了组合物,其中所述多核苷酸的5-25%是所述至少一种靶核酸分子的直接拷贝。本文还提供了组合物,其中多核苷酸的累积分数的不超过50%包括所述至少一种靶核酸分子的序列的累积分数的至少80%的序列。本文还提供了组合物,其中所述多种多核苷酸的累积分数的不超过50%包括靶核酸序列的累积分数的至少85%的序列。本文还提供了组合物,其中所述多种多核苷酸的累积分数的不超过50%包括靶核酸序列的累积分数的至少90%的序列。本文还提供了组合物,其中所述扩增子文库的基尼指数不超过0.5。本文还提供了组合物,其中所述扩增子文库的基尼指数不超过0.4。本文还提供了组合物,其中所述多种多核苷酸的长度为约50至约2000个核苷酸。本文还提供了组合物,其中多核苷酸的长度为约400至约600个核苷酸。本文还提供了组合物,其中多核苷酸的数目为100-5000。本文还提供了组合物,其中多核苷酸的数目为250-1250。本文还提供了组合物,其中多核苷酸的数目为至少100。本文还提供了组合物,其中多核苷酸的数目为至少500。本文还提供了组合物,其中多核苷酸的数目为至少1000。本文还提供了组合物,其中至少一些所述多核苷酸包括条形码。本文还提供了组合物,其中所述条形码包括细胞条形码。本文还提供了组合物,其中所述条形码包括样品条形码。本文还提供了组合物,其中至少一些所述多核苷酸包括独特分子标识码。本文还提供了组合物,其中所述多种多核苷酸包括至少部分代表基因组的序列。本文还提供了组合物,其中所述多种多核苷酸包括至少部分代表至少两个基因组的序列。本文还提供了组合物,其中所述多种多核苷酸包括来自cDNA的序列。本文还提供了组合物,其中至少90%的所述多核苷酸包括终止子核苷酸。本文还提供了组合物,其中至少98%的所述多核苷酸包括终止子核苷酸。本文还提供了组合物,其中所述终止子核苷酸附接至所述至少一些多核苷酸的3’末端。本文还提供了组合物,其中所述终止子核苷酸选自带有α基团修饰的核苷酸、C3间隔子核苷酸、锁核酸(LNA)、反向核酸、2’氟核苷酸、3’磷酸化核苷酸、2’-O-甲基修饰核苷酸和反式核酸。本文还提供了组合物,其中所述带有α基团修饰的核苷酸为α-硫代双脱氧核苷酸。本文还提供了组合物,其中所述终止子核苷酸包括脱氧核糖的3’碳的r基团的修饰。本文还提供了组合物,其中所述终止子核苷酸选自含有核苷酸的3’封闭的可逆终止子、含有核苷酸的3’未封闭的可逆终止子、含有脱氧核苷酸的2’修饰的终止子、含有对脱氧核苷酸的含氮碱基的修饰的终止子,及其组合。本文还提供了组合物,其中所述终止子核苷酸选自双脱氧核苷酸、反向双脱氧核苷酸、3’生物素化核苷酸、3’氨基核苷酸、3’-磷酸化核苷酸、3’-O-甲基核苷酸、包括3’C3间隔子核苷酸、3’C18核苷酸、3’己二醇间隔子核苷酸的3’碳间隔子核苷酸、无环核苷酸,及其组合。本文还提供了组合物,其中所述组合物包含在液滴中。
本文提供的组合物包括:至少一种靶核酸分子和扩增子文库,其中所述扩增子文库包括从所述至少一种靶核酸分子的扩增获得的多种多核苷酸,其中至少一些所述多核苷酸包括终止子核苷酸,其中多核苷酸的累积分数的不超过50%包括所述至少一种靶核酸分子的序列的累积分数的至少80%的序列。本文还提供了组合物,其中所述多种多核苷酸的累积分数的不超过50%包括靶核酸序列的累积分数的至少85%的序列。本文还提供了组合物,其中所述多种多核苷酸的累积分数的不超过50%包括靶核酸序列的累积分数的至少90%的序列。本文还提供了组合物,其中所述多种多核苷酸的长度为约50至约2000个核苷酸。本文还提供了组合物,其中多核苷酸的长度为约400至约600个核苷酸。本文还提供了组合物,其中多核苷酸的数目为100-5000。本文还提供了组合物,其中多核苷酸的数目为250-1250。本文还提供了组合物,其中多核苷酸的数目为至少100。本文还提供了组合物,其中多核苷酸的数目为至少500。本文还提供了组合物,其中多核苷酸的数目为至少1000。本文还提供了组合物,其中至少一些所述多核苷酸包括条形码。本文还提供了组合物,其中所述条形码包括细胞条形码。本文还提供了组合物,其中所述条形码包括样品条形码。本文还提供了组合物,其中至少一些所述多核苷酸包括独特分子标识码。本文还提供了组合物,其中所述多种多核苷酸包括至少部分代表基因组的序列。本文还提供了组合物,其中所述多种多核苷酸包括至少部分代表至少两个基因组的序列。本文还提供了组合物,其中所述多种多核苷酸包括来自cDNA的序列。本文还提供了组合物,其中至少90%的所述多核苷酸包括终止子核苷酸。本文还提供了组合物,其中至少98%的所述多核苷酸包括终止子核苷酸。本文还提供了组合物,其中所述终止子核苷酸附接至所述至少一些多核苷酸的3’末端。本文还提供了组合物,其中所述终止子核苷酸选自带有α基团修饰的核苷酸、C3间隔子核苷酸、锁核酸(LNA)、反向核酸、2’氟核苷酸、3’磷酸化核苷酸、2’-O-甲基修饰核苷酸和反式核酸。本文还提供了组合物,其中所述带有α基团修饰的核苷酸为α-硫代双脱氧核苷酸。本文还提供了组合物,其中所述终止子核苷酸包括脱氧核糖的3’碳的r基团的修饰。本文还提供了组合物,其中所述终止子核苷酸选自含有核苷酸的3’封闭的可逆终止子、含有核苷酸的3’未封闭的可逆终止子、含有脱氧核苷酸的2’修饰的终止子、含有对脱氧核苷酸的含氮碱基的修饰的终止子,及其组合。本文还提供了组合物,其中所述终止子核苷酸选自双脱氧核苷酸、反向双脱氧核苷酸、3’生物素化核苷酸、3’氨基核苷酸、3’-磷酸化核苷酸、3’-O-甲基核苷酸、包括3’C3间隔子核苷酸、3’C18核苷酸、3’己二醇间隔子核苷酸的3’碳间隔子核苷酸、无环核苷酸,及其组合。本文还提供了组合物,其中所述组合物包含在液滴中。
本文提供了扩增靶核酸分子的方法,该方法包括:使包括所述靶核酸分子的样品,至少一种扩增引物,至少一种核酸聚合酶和核苷酸混合物接触,其中所述核苷酸混合物包括至少一种终止子核苷酸,所述终止子核苷酸终止由所述聚合酶进行的核酸复制,以及扩增所述靶核酸分子以产生多个终止的扩增产物,其中所述复制通过链置换复制进行。本文还提供了方法,其中所述扩增在基本等温的条件下进行。本文还提供了方法,其中所述扩增在温度变化不超过10℃的条件下进行。本文还提供了方法,其中所述扩增在温度变化不超过5℃的条件下进行。本文还提供了方法,其中所述核酸聚合酶是DNA聚合酶。本文还提供了方法,其中所述DNA聚合酶是链置换DNA聚合酶。本文还提供了方法,其中所述核酸聚合酶是噬菌体phi29(Φ29)聚合酶、基因修饰的phi29(Φ29)DNA聚合酶、DNA聚合酶I的Klenow片段、噬菌体M2 DNA聚合酶、噬菌体phiPRD1 DNA聚合酶、Bst DNA聚合酶、Bst大片段DNA聚合酶、exo(-)Bst聚合酶、exo(-)Bca DNA聚合酶、Bsu DNA聚合酶、VentR DNA聚合酶、VentR(exo-)DNA聚合酶、Deep Vent DNA聚合酶、Deep Vent(exo-)DNA聚合酶、IsoPol DNA聚合酶、DNA聚合酶I、Therminator DNA聚合酶、T5 DNA聚合酶、测序酶、T7 DNA聚合酶、T7-测序酶或T4 DNA聚合酶。本文还提供了方法,其中所述核酸聚合酶包括3’->5’核酸外切酶活性,并且所述至少一种终止子核苷酸抑制3’->5’核酸外切酶活性。本文还提供了方法,其中所述核酸聚合酶不包括3’->5’核酸外切酶活性。本文还提供了方法,其中所述聚合酶是BstDNA聚合酶、exo(-)Bst聚合酶、exo(-)Bca DNA聚合酶、Bsu DNA聚合酶、VentR(exo-)DNA聚合酶、Deep Vent(exo-)DNA聚合酶、Klenow片段(exo-)DNA聚合酶或Therminator DNA聚合酶。本文还提供了方法,其中所述至少一种终止子核苷酸包括脱氧核糖的3’碳的r基团的修饰。本文还提供了方法,其中所述至少一种终止子核苷酸选自含有核苷酸的3’封闭的可逆终止子、含有核苷酸的3’未封闭的可逆终止子、含有脱氧核苷酸的2’修饰的终止子、含有对脱氧核苷酸的含氮碱基的修饰的终止子,及其组合。本文还提供了方法,其中所述至少一种终止子核苷酸选自双脱氧核苷酸、反向双脱氧核苷酸、3’生物素化核苷酸、3’氨基核苷酸、3’-磷酸化核苷酸、3’-O-甲基核苷酸、包括3’C3间隔子核苷酸、3’C18核苷酸、3’己二醇间隔子核苷酸的3’碳间隔子核苷酸、无环核苷酸,及其组合。本文还提供了方法,其中所述至少一种终止子核苷酸选自带有α基团修饰的核苷酸、C3间隔子核苷酸、锁核酸(LNA)、反向核酸、2’氟核苷酸、3’磷酸化核苷酸、2’-O-甲基修饰核苷酸和反式核酸。本文还提供了方法,其中所述带有α基团修饰的核苷酸为α-硫代双脱氧核苷酸。本文还提供了方法,其中所述扩增引物的长度为4至70个核苷酸。本文还提供了方法,其中所述至少一种扩增引物的长度为4至20个核苷酸。本文还提供了方法,其中所述方法还包括使用PCR的额外扩增步骤。本文还提供了方法,其中所述至少一种扩增引物包括随机区域。本文还提供了方法,其中所述随机区域的长度为4至20个核苷酸。本文还提供了方法,其中所述随机区域的长度为8至15个核苷酸。本文还提供了方法,其中所述扩增产物的长度为约50至约2000个核苷酸。本文还提供了方法,其中所述扩增产物的长度为约200至约1000个核苷酸。本文还提供了方法,其中用于识别低频序列变体。本文还提供了方法,其中所述低频序列变体构成总序列的≥0.01%。本文还提供了方法,其中所述低频序列变体构成总序列的≥0.05%。本文还提供了方法,其中所述低频序列变体构成总序列的≥0.10%。
本文提供了对靶核酸分子进行测序的方法,该方法包括:使包括所述靶核酸分子的样品,至少一种扩增引物,至少一种核酸聚合酶和核苷酸混合物接触,其中所述核苷酸混合物包括至少一种终止子核苷酸,所述终止子核苷酸终止由所述聚合酶进行的核酸复制,以及扩增所述靶核酸分子以产生多个终止的扩增产物,其中所述复制通过链置换复制进行;从所述终止的扩增产物中除去至少一种终止子核苷酸;将在方法中获得的所述分子连接至衔接子,从而产生扩增产物文库;以及对扩增产物的所述文库进行测序。本文还提供了方法,还包括修复末端和加A尾。本文还提供了方法,其中所述靶核酸是DNA。本文还提供了方法,其中所述DNA是cDNA。本文还提供了方法,其中所述DNA是基因组DNA。本文还提供了方法,其中所述至少一种扩增引物包括两种或更多种引物。本文还提供了方法,其中所述至少一种扩增引物是随机引物。本文还提供了方法,其中所述至少一种扩增引物包括条形码。本文还提供了方法,其中所述条形码包括细胞条形码。本文还提供了方法,其中所述条形码包括样品条形码。本文还提供了方法,其中所述扩增引物包括独特分子标识码(UMI)。本文还提供了方法,其中所述方法还包括在初始引物退火之前使所述靶核酸或基因组DNA变性。本文还提供了方法,其中变性在碱性条件下进行,然后进行中和。本文还提供了方法,其中所述样品、所述扩增引物、所述核酸聚合酶和所述核苷酸混合物包含在微流体装置中。本文还提供了方法,其中所述样品、所述扩增引物、所述核酸聚合酶和所述核苷酸混合物包含在液滴中。本文还提供了方法,其中所述样品选自组织样品、细胞、生物流体样品、骨髓样品、精液样品、活检样品、癌症样品、肿瘤样品、细胞裂解物样品、法医样品、考古样品、古生物样品、感染样品、生产样品、整株植物、植物部分、微生物群样品、病毒制剂、土壤样品、海洋样品、淡水样品、家庭或工业样品,及其组合和分离物。本文还提供了方法,其中所述生物流体选自血液、尿液、唾液、淋巴液、脑脊髓液(CSF)、羊水、胸膜液、心包液、腹水和房水。本文还提供了方法,其中所述方法还包括使用PCR的额外扩增步骤。
本文提供了对单细胞进行测序的方法,该方法包括:提供来自所述单细胞的细胞裂解物;使所述细胞裂解物与至少一种扩增引物、至少一种核酸聚合酶和核苷酸混合物接触,其中所述核苷酸混合物包括至少一种终止子核苷酸,所述终止子核苷酸终止由所述聚合酶进行的核酸复制,以及扩增所述靶核酸分子以产生多个终止的扩增产物,其中所述复制通过链置换复制进行;从所述终止的扩增产物中除去至少一种终止子核苷酸;将在所述方法中获得的所述分子连接至衔接子,从而产生扩增产物文库;以及对扩增产物的所述文库进行测序。本文还提供了方法,其中细胞裂解伴随蛋白水解。本文还提供了方法,其中所述样品、至少一种扩增引物、所述核酸聚合酶和所述核苷酸混合物包含在微流体装置中。本文还提供了方法,其中所述样品、所述至少一种扩增引物、所述核酸聚合酶和所述核苷酸混合物包含在液滴中。本文还提供了方法,其中所述至少一种扩增引物附接至固体支持物。本文还提供了方法,其中所述固体支持物是珠子。本文还提供了方法,其中所述至少一种扩增引物通过可切割的接头附接至固体支持物。本文还提供了方法,其中所述至少一种扩增引物包括条形码。本文还提供了方法,其中所述方法还包括在扩增之前切割所述可切割的接头。本文还提供了方法,其中所述细胞选自动物细胞、植物细胞、真菌细胞、细菌细胞和原生动物细胞。本文还提供了方法,其中所述动物细胞是人类细胞。本文还提供了方法,其中所述细胞选自来自植入前胚胎的细胞、干细胞、胎儿细胞、肿瘤细胞、疑似癌细胞、癌细胞、经过基因编辑程序的细胞、来自致病生物的细胞、从法医样品获得的细胞、从考古样品获得的细胞和从古生物样品获得的细胞。本文还提供了方法,其中所述植入前胚胎细胞是卵裂球。本文还提供了方法,其中所述卵裂球从体外受精产生的八细胞期胚胎获得。本文还提供了方法,还包括确定在所述胚胎细胞中疾病易感种系或体细胞变体的存在。本文还提供了方法,其中所述致病生物是细菌、真菌或原生动物。本文还提供了方法,其中从致病生物获得的所述细胞是从取自患者的体液、微生物群样品或留置医疗装置获得的。本文还提供了方法,还包括确定所述致病生物的身份的步骤。本文还提供了方法,还包括确定导致所述致病生物对治疗有抗性的遗传变体的存在。本文还提供了方法,其中所述细胞是肿瘤细胞、疑似癌细胞或癌细胞。本文还提供了方法,还包括确定一种或多种诊断或预后突变的存在。本文还提供了方法,还包括确定导致对治疗有抗性的种系或体细胞变体的存在。本文还提供了方法,其中所述细胞是经过基因编辑程序的细胞。本文还提供了方法,还包括确定由所述基因编辑过程引起的计划外突变的存在。本文还提供了方法,还包括确定细胞谱系的历史。本文还提供了方法,其中用于识别低频序列变体。本文还提供了方法,其中所述低频序列变体构成总序列的≥0.01%。本文还提供了方法,其中所述低频序列变体构成总序列的≥0.05%。本文还提供了方法,其中所述低频序列变体构成总序列的≥0.10%。本文还提供了方法,其中所述方法还包括使用PCR的额外扩增步骤。
本文提供了确定环境条件的致突变性的方法,该方法包括:使细胞暴露于所述环境条件;从所述群体中分离单细胞;提供来自单细胞的细胞裂解物;使所述细胞裂解物与至少一种扩增引物、至少一种核酸聚合酶和核苷酸混合物接触,其中所述核苷酸混合物包括至少一种终止子核苷酸,所述终止子核苷酸终止由所述聚合酶进行的核酸复制,以及扩增所述靶核酸分子以产生多个终止的扩增产物,其中所述复制通过链置换复制进行;从所述终止的扩增产物中除去至少一种终止子核苷酸;将在所述方法中获得的所述分子连接至衔接子,从而产生扩增产物文库;以及对扩增产物的所述文库进行测序,以及将扩增产物的序列与至少一个参考序列进行比较,以识别突变。本文还提供了方法,其中所述单细胞是人类细胞。本文还提供了方法,其中环境条件包括化学物质。本文还提供了方法,其中所述环境条件包括辐射。本文还提供了方法,其中所述环境条件包括紫外线。本文还提供了方法,其中所述单细胞源自肝脏、皮肤、肾脏、血液或肺。本文还提供了方法,其中至少一些所述扩增产物包括条形码。本文还提供了方法,其中所述条形码包括细胞条形码。本文还提供了方法,其中所述条形码包括样品条形码。本文还提供了方法,其中至少一些所述扩增引物包括独特分子标识码(UMI)。本文还提供了方法,其中所述方法还包括使用PCR的额外扩增步骤。
援引并入
本说明书中提到的所有出版物、专利和专利申请均通过引用并入本文,其程度如同特别地且单独地指出每一个单独的出版物、专利或专利申请均通过引用而并入。
附图说明
在所附权利要求书中具体阐述了本发明的新颖性特征。通过参考对在其中利用到本发明的原理的说明性实施方案加以阐述的以下详细描述和附图,将会获得对本发明的特征和优点的更好的理解,在附图中:
图1A示出了先前的多重置换扩增(MDA)方法与主要模板定向扩增(PTA)方法的一个实施方案(即PTA-不可逆终止子方法)的比较。
图1B示出了PTA-不可逆终止子方法与不同实施方案(即PTA-可逆终止子方法)的比较。
图1C示出了MDA与PTA-不可逆终止子方法在涉及突变传播时的比较。
图1D示出了扩增后进行的方法步骤,包括除去终止子、修复末端以及在衔接子连接之前进行加A尾。然后,在测序之前,可以在合并的细胞文库中对所有外显子或其他感兴趣的特定区域进行杂交介导的富集。源自每次读取的细胞均通过细胞条形码(显示为绿色和蓝色序列)识别。
图2A示出了在进行PTA并添加浓度不断增加的终止子(上方的凝胶)后,扩增子的大小分布。下方的凝胶示出了在进行PTA并添加浓度不断增加的可逆终止子后,或添加浓度不断增加的不可逆终止子后,扩增子的大小分布。
图2B(GC)示出了MDA和PTA的测序碱基的GC含量比较。
图2C示出了在单细胞经过PTA或MDA后,映射到人类基因组(p_mapped)的映射质量得分(e)(mapQ)。
图2D在单细胞经过PTA或MDA后,映射到人类基因组(p_mapped)的读取百分比。
图2E(PCR)示出了在单细胞经过MDA和PTA后,2000万个亚取样读取中为PCR复制的读取百分比的比较。
图3A示出了在单细胞经过可逆或不可逆终止子PTA后,映射到人类基因组(p_mapped2)的映射质量得分(c)(mapQ2)。
图3B示出了在单细胞经过可逆或不可逆终止子PTA后,映射到人类基因组(p_mapped2)的读取百分比。
图3C示出了使用各种方法得到的一系列箱形图,描述了与Alu元件重叠的平均百分比读取的对齐读取。PTA具有与基因组对齐的最大读取数。
图3D示出了使用各种方法得到的一系列箱形图,描述了与Alu元件重叠的平均百分比读取的PCR复制。
图3E示出了使用各种方法得到的一系列箱形图,描述了与Alu元件重叠的平均百分比读取的GC含量。
图3F示出了使用各种方法得到的一系列箱形图,描述了与Alu元件重叠的平均百分比读取的映射质量。PTA具有测试方法中最高的映射质量。
图3G示出了在固定的7.5X测序深度下用不同的WGA方法时SC线粒体基因组覆盖宽度的比较。
图4A示出了在将每个细胞下取样至4000万个配对读取后,在选择高质量MDA细胞(代表~50%细胞)后,与随机引物PTA扩增的细胞相比,对染色体1上的10千碱基窗口的平均覆盖深度。该图显示MDA的均匀性较差,更多窗口的覆盖深度比平均覆盖深度大(框A)或小(框C)两倍。由于高GC含量和重复区域的低映射质量,在着丝粒处MDA和PTA均无覆盖(框B)。
图4B示出了MDA和PTA方法的测序覆盖与基因组位置的关系图(上图)。下部箱形图示出了与大量样品(bulk sample)相比,MDA和PTA方法的等位基因频率。
图4C示出了MDA和PTA实验的覆盖均匀性的平均覆盖与基因组窗口的关系图。与MDA相比,PTA导致整个基因组的覆盖更加均匀。
图5A示出了基因组覆盖率与基因组读取数目的关系图,用以评估各种方法在增加测序深度时的覆盖。PTA方法在每个深度下都接近两种大量样品,这是相对于其他测试方法的改进。
图5B示出了基因组覆盖的变异系数与读取数目的关系图,用以评估覆盖均匀性。发现PTA方法在测试方法中具有最高的均匀性。
图5C示出了总读取的累积分数与基因组的累积分数的洛伦兹图。发现PTA方法在测试方法中具有最高的均匀性。
图5D示出了所测试的每种方法的计算的基尼指数的一系列箱形图,以便根据完全均匀性来估计每个扩增反应的差异。发现PTA方法比其他测试方法具有可再现的更高均匀性。
图5E示出了判定的大量变体的比例与读取数目的关系图。在增加测序深度时,将每种方法的变体判定率与相应的大量样品进行比较。为了估计灵敏度,计算了在每个测序深度下,在每个细胞中发现的在被下取样至6.5亿个读取的相应大量样品中判定的变体百分比(图3A)。PTA的覆盖和均匀性的提高使得与灵敏度第二的方法Q-MDA方法相比,可检测出多30%的变体。
图5F示出了与Alu元件重叠的平均百分比读取的一系列箱形图。PTA方法显著减少了这些杂合位点的等位基因倾斜。相对于其他测试方法,PTA方法更均匀地扩增同一细胞中的两个等位基因。
图5G示出了变体判定的特异性与读取数目的关系图,用以评估突变判定的特异性。使用各种方法发现的变体若在大量样品中未发现,则被认为是假阳性。在所测试的方法中,PTA方法的假阳性判定最低(特异性最高)。
图5H示出了对于各种方法,每种类型碱基改变的假阳性碱基改变的比例。不受理论约束,这种模式可以是依赖于聚合酶的。
图5I示出了对于假阳性变体判定,与Alu元件重叠的平均百分比读取的一系列箱形图。PTA方法产生了假阳性变体判定的最低等位基因频率。
图6A描绘了根据本公开内容的克隆型药物敏感性目录的示意图。通过识别不同克隆型的药物敏感性,可以创建目录,肿瘤学家可以从该目录中将在患者肿瘤中识别出的克隆型转化为最适合耐药群体的药物列表。
图6B示出了在100次模拟后,白血病克隆的数目随着每个克隆的白血病细胞数目增加的变化。使用每个细胞的突变率,模拟预测出随着一个细胞扩展到100至1000亿个细胞,会产生大量的小克隆(框A)。当前测序方法仅检测到频率最高的1-5个克隆(框C)。在本发明的一个实施方案中,提供了用于确定刚好低于当前方法检测水平的数百个克隆的抗药性的方法(框B)。
图7示出了本公开内容的示例性实施方案。与底行的诊断样品相比,未经化疗的培养选择了具有激活的KRAS突变的克隆(红框,右下角)。相反,该克隆被泼尼松龙或柔红霉素杀死(绿框,右上角),而频率较低的克隆则经历阳性选择(虚线框)。
图8是本公开内容的一个实施方案的概述,即用于量化具有特定基因型的克隆对特定药物的相对敏感性的实验设计。
图9(A部分)示出了具有寡核苷酸的珠子,该寡核苷酸附接有可切割的接头、独特细胞条形码和随机引物。B部分示出了单细胞和珠子封装在同一液滴中,然后裂解细胞并切割引物。然后可以将液滴与包括PTA扩增混合物的另一液滴融合。C部分示出了扩增后液滴破裂,并且合并来自所有细胞的扩增子。然后将根据本公开内容的方案用于除去终止子、末端修复和加A尾,随后连接衔接子。然后,在测序之前,使合并的细胞文库经历针对感兴趣外显子的杂交介导的富集。然后,使用细胞条形码识别源自每次读取的细胞。
图10A展示了使用包括细胞条形码和/或独特分子标识码的引物将细胞条形码和/或独特分子标识码并入PTA反应中。
图10B展示了使用包括细胞条形码和/或独特分子标识码的发夹引物将细胞条形码和/或独特分子标识码并入PTA反应中。
图11A(PTA_UMI)示出了独特分子标识码(UMI)的并入使得能够创建共有读取,减少了由测序和其他错误引起的假阳性率,从而导致在进行种系或体细胞变体判定时的灵敏度提高。
图11B示出了将具有相同UMI的读取合并能够校正扩增和其他偏差,这些偏差在判定拷贝数变体时可能导致错误检测或有限的灵敏度。
图12A示出了对于环境致突变性实验的直接测量,突变数目与治疗组的关系图。将单个人类细胞以不同的处理水平暴露于媒介物(VHC)、甘露糖(MAN)或直接诱变剂N-乙基-N-亚硝基脲(ENU),并测量突变数目。
图12B示出了突变数目与不同的治疗组和水平的一系列关系图,进一步按照碱基突变的类型进行了划分。
图12C示出了三核苷酸背景下突变的模式表示。y轴上的碱基位于n-1位置,x轴上的碱基位于n+1位置。较暗的区域表示较低的突变频率,并且较亮的区域表示较高的突变频率。最上面一行的实心黑框(胞嘧啶突变)表明,当胞嘧啶后面是鸟嘌呤时,胞嘧啶诱变的频率降低。最下面一行的虚线黑框(胸腺嘧啶突变)表明大多数胸腺嘧啶突变发生在腺嘌呤处于胸腺嘧啶正前方时的位置。
图12D示出了将CD34+细胞中的已知DNA酶I超敏位点的位置与N-乙基-N-亚硝基脲处理的细胞中的相应位置比较的图。没有观察到胞嘧啶变体的显著富集。
图12E示出了DNA酶I超敏(DH)位点中ENU诱导突变的比例。以前由表观基因组学线路图计划(Roadmap Epigenomics Project)进行分类的CD34+细胞中的DH位点被用于研究ENU突变是否在代表开放染色质位点的DH位点处更普遍。在DH位点的变体位置没有发现显著富集,并且在DH位点没有观察到限于胞嘧啶的变体的富集。
图12F示出了在具有特定注释的基因组位置中ENU诱导突变的比例的一系列箱形图。相对于每个注释所包括的基因组的比例(右框),在每个细胞中的变体(左框)的特定注释中没有看到特定的富集。
具体实施方式
需要开发新的可扩展、准确且有效的核酸扩增(包括单细胞和多细胞基因组扩增)和测序方法,其将通过以可再现的方式增加序列呈现、均匀性和准确性来克服当前方法的局限性。本文提供了用于提供准确且可扩展的主要模板定向扩增(PTA)和测序的组合物和方法。本文还提供了确定单核苷酸变体、拷贝数变异、克隆分型和环境致突变性测量的方法。这些方法和组合物促进靶标(或“模板”)核酸的高精度扩增,这增加了下游应用(如下一代测序)的准确性和灵敏性。
定义
除非另有定义,否则本文使用的所有技术和科学术语的含义与这些发明所属领域的普通技术人员通常所理解的含义相同。
在整个本公开内容中,数字特征以范围格式表示。应理解,范围格式的描述仅为了方便和简洁,而不应被解释为对任何实施方案的范围的严格限制。因此,除非上下文另有明确指示,否则应认为对范围的描述已具体公开了所有可能的子范围以及在该范围内直至下限单位的十分之一的单个数值。例如,对范围如从1至6的描述应视为已具体公开了子范围,如从1至3、从1至4、从1至5、从2至4、从2至6、从3至6等,以及该范围内的单个值,例如,1.1、2、2.3、5和5.9。无论范围的宽度如何,这都适用。这些中间范围的上限和下限可以独立地包括在较小的范围内,并且也包括在本发明内,受规定范围内任何明确排除的限制。当所述范围包括一个或两个限值时,除非上下文明确指出,否则不包含所包括的那些限值中的一个或两个的范围也包括在本发明中。
本文所使用的术语仅出于描述特定实施方案的目的,并且不旨在限制任何实施方案。如本文所用,单数形式“一”、“一个”和“该”也旨在包括复数形式,除非上下文另有明确指出。还将理解,当在本说明书中使用术语“包括”(“comprises”和/或“comprising”)时,其指定了所述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其他特征、整体、步骤、操作、元素、组件和/或其群组的存在或添加。如本文所用,术语“和/或”包括一个或多个相关联的所列项目的任何和所有组合。
除非特别说明或从上下文可以明显看出,否则如本文所用,术语“约”在提及数值或数值范围时应理解为是指所述数值+/-其10%,或对于一个范围中列出的值,则指从比列出的下限低10%到比列出的上限高10%。
如本文所用,术语“受试者”或“患者”或“个体”是指动物,包括哺乳动物,如人类、兽医动物(例如,猫、狗、牛、马、绵羊、猪等)和疾病实验动物模型(例如,小鼠、大鼠)。根据本发明,可以在本领域技术范围内使用常规分子生物学、微生物学和重组DNA技术。这些技术在文献中有充分的解释。参见,例如,Sambrook,Fritsch和Maniatis,Molecular Cloning:ALaboratory Manual,第二版(1989)Cold Spring Harbor Laboratory Press,Cold SpringHarbor,New York(本文中为"Sambrook等人,1989");DNA Cloning:A practicalApproach,第I和II卷(D.N.Glover著,1985);Oligonucleotide Synthesis(MJ.Gait著,1984);Nucleic Acid Hybridization(B.D.Hames和S.J.Higgins著,(1985));Transcription and Translation(B.D.Hames和S.J.Higgins著,(1984));Animal CellCulture(R.I.Freshney著,(1986));Immobilized Cells and Enzymes(lRL出版社(1986));B.Perbal,A practical Guide To Molecular Cloning(1984);F.M.Ausubel等人(著),Current Protocols in Molecular Biology,John Wiley&Sons,Inc.(1994);等等。
术语“核酸”涵盖多链以及单链分子。在双链或三链核酸中,核酸链不需要是共延伸的(即,双链核酸不需要沿两条链的整个长度是双链的)。本文所述的核酸模板可以根据样品(从小的无细胞DNA片段至整个基因组)而具有任何大小,包括但不限于长度为50-300个碱基、100-2000个碱基、100-750个碱基、170-500个碱基、100-5000个碱基、50-10,000个碱基或50-2000个碱基。在一些情况下,模板的长度为至少50、100、200、500、1000、2000、5000、10,000、20,000、50,000、100,000、200,000、500,000、1,000,000或大于1,000,000个碱基。本文所述的方法提供了核酸如核酸模板的扩增。本文所述的方法另外提供了分离的和至少部分纯化的核酸以及核酸文库的生成。核酸包括但不限于DNA、RNA、环状RNA、cfDNA(无细胞DNA)、cfRNA(无细胞RNA)、siRNA(小干扰RNA)、cffDNA(无细胞胎儿DNA)、mRNA、tRNA、rRNA、miRNA(微RNA)、合成多核苷酸、多核苷酸类似物,符合本说明书的任何其他核酸,或其任何组合。当提供多核苷酸时,其长度用碱基数和缩写描述,如nt(核苷酸)、bp(碱基)、kb(千碱基)或Gb(千兆碱基)。
如本文所用,术语“液滴”是指液滴致动器上的一定体积液体。在一些情况下,例如,液滴是水性或非水性的,或者可以是包括水性和非水性组分的混合物或乳液。对于可经受液滴操作的液滴流体的非限制性示例,参见,例如,国际专利申请公开号WO2007/120241。在本文提出的实施方案中,可以使用任何适于形成和操纵液滴的系统。例如,在一些情况下,使用液滴致动器。对于可以使用的液滴致动器的非限制性示例,参见,例如,美国专利号6,911,132、6,977,033、6,773,566、6,565,727、7,163,612、7,052,244、7,328,979、7,547,380、7,641,779、美国专利申请公开号US20060194331、US20030205632、US20060164490、US20070023292、US20060039823、US20080124252、US20090283407、US20090192044、US20050179746、US20090321262、US20100096266、US20110048951、国际专利申请公开号WO2007/120241。在一些情况下,珠子在液滴中、在液滴操作间隙中或在液滴操作表面上提供。在一些情况下,珠子在位于液滴操作间隙外部或与液滴操作表面分开的储器中提供,并且该储器可以与流动路径相关联,该流动路径允许包括该珠子的液滴进入液滴操作间隙或与液滴操作表面接触。用于固定磁响应珠子和/或非磁响应珠子和/或使用珠子进行液滴操作方案的液滴致动器技术的非限制性示例在美国专利申请公开号US20080053205、国际专利申请公开号WO2008/098236、WO2008/134153、WO2008/116221、WO2007/120241中描述。珠子特性可以在本文所述的方法的多路复用实施方案中采用。具有适合于多路复用的特性的珠子的示例,以及检测和分析从这种珠子发出的信号的方法,可以在美国专利申请公开号US20080305481、US20080151240、US20070207513、US20070064990、US20060159962、US20050277197、US20050118574中找到。
如本文所用,术语“独特分子标识码(UMI)”是指附接于多个核酸分子中的每一个的独特核酸序列。当并入核酸分子中时,在一些情况下,UMI被用于通过直接对扩增后测序的UMI进行计数来校正后续的扩增偏倚。UMI的设计、并入和应用在例如国际专利申请公开号WO 2012/142213、Islam等人.Nat.Methods(2014)11:163-166和Kivioja,T.等人,Nat.Methods(2012)9:72-74中描述。
如本文所用,术语“条形码”是指可用于识别核酸材料的样品或来源的核酸标签。因此,在核酸样品来自多个来源的情况下,在一些情况下,每个核酸样品中的核酸用不同的核酸标签标记,从而可以识别样品的来源。条形码,通常也称为索引、标签等,是本领域技术人员熟知的。任何合适的条形码或条形码组都可以使用。参见,例如,美国专利号8,053,192和国际专利申请公开号WO2005/068656中提供的非限制性示例。单细胞的条形码化可以例如如美国专利申请公开号2013/0274117中描述地进行。
本文中的术语“固体表面”、“固体支持物”和其他语法等同物是指适合于或可以被修饰以适合于本文所述的引物、条形码和序列的附接的任何材料。示例性基底包括但不限于玻璃和改性或功能化玻璃、塑料(包括丙烯酸、聚苯乙烯,和苯乙烯与其他材料的共聚物、聚丙烯、聚乙烯、聚丁烯、聚氨酯、特氟龙TM等)、多糖、尼龙、硝酸纤维素、陶瓷、树脂、二氧化硅、二氧化硅基材料(例如,硅或改性硅)、碳、金属、无机玻璃、塑料、光纤束和各种其他聚合物。在一些实施方案中,固体支持物包括适于以有序模式固定引物、条形码和序列的图案化表面。
如本文所用,术语“生物样品”包括但不限于组织、细胞、生物流体及其分离物。在一些情况下,本文所述方法中使用的细胞或其他样品是从人类患者、动物、植物、土壤或包括如细菌、真菌、原生动物等微生物的其他样品中分离的。在一些情况下,生物样品来源于人类。在一些情况下,生物样品并非来源于人类。在一些情况下,细胞经历本文所述的PTA方法和测序。在整个基因组或特定位置检测到的变体可以与从该受试者分离的所有其他细胞进行比较,以追踪细胞谱系的历史,以用于研究或诊断目的。
主要模板定向扩增
本文描述了核酸扩增方法,如“主要模板定向扩增(PTA)”。例如,图1A-图1D示意性地呈现了本文所述的PTA方法。在PTA方法中,使用聚合酶(例如,链置换聚合酶)优先从主要模板(“直接拷贝”)生成扩增子。因此,与MDA相比,在随后的扩增过程中,错误以较低的速率从子扩增子传播。因而得到一种易于执行的方法,与现有的WGA方案不同,该方法可以以准确且可再现的方式扩增低输入量的DNA(包括单细胞的基因组),且具有高覆盖范围和均匀性。此外,终止的扩增产物可以在除去终止子后进行定向连接,允许细胞条形码附接至扩增引物,从而可以在进行平行扩增反应后合并来自所有细胞的产物(图1B)。
本文描述了使用具有链置换活性的核酸聚合酶进行扩增的方法。在一些情况下,这种聚合酶具有链置换活性和低错误率。在一些情况下,这种聚合酶具有链置换活性和校对核酸外切酶活性,如3’->5’校对活性。在一些情况下,核酸聚合酶与其他组分结合使用,如可逆或不可逆终止子,或其他链置换因子。在一些情况下,聚合酶具有链置换活性,但不具有核酸外切酶校对活性。例如,在一些情况下,这些聚合酶包括噬菌体phi29(Φ29)聚合酶,其也有非常低的错误率,这是3’->5’校对核酸外切酶活性的结果(参见,例如,美国专利号5,198,543和5,001,050)。在一些情况下,链置换核酸聚合酶的非限制性示例包括,例如,基因修饰的phi29(Φ29)DNA聚合酶、DNA聚合酶I的Klenow片段(Jacobsen等人,Eur.J.Biochem.45:623-627(1974))、噬菌体M2 DNA聚合酶(Matsumoto等人,Gene 84:247(1989))、噬菌体phiPRD1 DNA聚合酶(Jung等人,Proc.Natl.Acad.Sci.USA84:8287(1987);Zhu和Ito,Biochim.Biophys.Acta.1219:267-276(1994))、Bst DNA聚合酶(例如,Bst大片段DNA聚合酶(Exo(-)Bst;Aliotta等人,Genet.Anal.(Netherlands)12:185-195(1996))、exo(-)Bca DNA聚合酶(Walker和Linn,Clinical Chemistry 42:1604-1608(1996))、BsuDNA聚合酶、包括VentR(exo-)DNA聚合酶的VentR DNA聚合酶(Kong等人,J.Biol.Chem.268:1965-1975(1993))、包括Deep Vent(exo-)DNA聚合酶的Deep Vent DNA聚合酶、IsoPol DNA聚合酶、DNA聚合酶I、Therminator DNA聚合酶、T5 DNA聚合酶(Chatterjee等人,Gene 97:13-19(1991))、测序酶(US.Biochemicals)、T7 DNA聚合酶、T7-测序酶、T7 gp5 DNA聚合酶、PRDI DNA聚合酶、T4 DNA聚合酶(Kaboord和Benkovic,Curr.Biol.5:149-157(1995))。另外的链置换核酸聚合酶也与本文所述的方法相容。给定聚合酶进行链置换复制的能力可以被确定,例如,通过在链置换复制测定中使用该聚合酶(例如,如美国专利号6,977,148中所公开)。在一些情况下,这些测定是在适合于所用酶的最佳活性温度下进行的,例如,phi29DNA聚合酶的该温度为32℃,exo(-)Bst DNA聚合酶的该温度为46℃至64℃,或来自超高温生物的酶的该温度为约60℃至70℃。选择聚合酶的另一种有用的测定法是在Kong等人,J.Biol.Chem.268:1965-1975(1993)中所述的引物阻断测定。该测定包括在存在或不存在寡核苷酸的情况下使用M13 ssDNA模板进行的引物延伸测定,该寡核苷酸在延伸引物的上游杂交,以阻断其进程。在该测定中,能够置换阻断引物的其他酶在一些情况下对所公开的方法有用。在一些情况下,聚合酶以近似相等的比率并入dNTP和终止子。在一些情况下,本文所述聚合酶的dNTP和终止子的并入比率为约1:1、约1.5:1、约2:1、约3:1、约4:1、约5:1、约10:1、约20:1、约50:1、约100:1、约200:1、约500:1或约1000:1。在一些情况下,本文所述聚合酶的dNTP和终止子的并入比率为1:1至1000:1、2:1至500:1、5:1至100:1、10:1至1000:1、100:1至1000:1、500:1至2000:1、50:1至1500:1或25:1至1000:1。
本文描述了扩增方法,其中可以通过使用链置换因子例如解旋酶来促进链置换。在一些情况下,这些因子与另外的扩增组分结合使用,如聚合酶、终止子或其他组分。在一些情况下,链置换因子与不具有链置换活性的聚合酶一起使用。在一些情况下,链置换因子与具有链置换活性的聚合酶一起使用。不受理论的约束,链置换因子可以增加较小的双链扩增子被引发的速率。在一些情况下,可以在存在链置换因子的情况下进行链置换复制的任何DNA聚合酶都适用于PTA方法,即使该DNA聚合酶在不存在这种因子的情况下无法进行链置换复制。在一些情况下,可用于链置换复制的链置换因子包括(但不限于)BMRF1聚合酶辅助亚基(Tsurumi等人,J.Virology 67(12):7648-7653(1993))、腺病毒DNA结合蛋白(Zijderveld和van der Vliet,J.Virology 68(2):1158-1164(1994))、单纯疱疹病毒蛋白ICP8(Boehmer和Lehman,J.Virology 67(2):711-715(1993);Skaliter和Lehman,Proc.Natl.Acad.Sci.USA 91(22):10665-10669(1994));单链DNA结合蛋白(SSB;Rigler和Romano,J.Biol.Chem.270:8910-8919(1995));噬菌体T4基因32蛋白(Villemain和Giedroc,Biochemistry 35:14395-14404(1996);T7解旋酶-引发酶;T7gp2.5 SSB蛋白;Tte-UvrD(来自腾冲嗜热厌氧菌(Thermoanaerobacter tengcongensis)),小牛胸腺解旋酶(Siegel等人,J.Biol.Chem.267:13629-13635(1992));细菌SSB(例如,大肠杆菌SSB),真核生物中的复制蛋白A(RPA),人类线粒体SSB(mtSSB)和重组酶(例如,重组酶A(RecA)家族蛋白、T4 UvsX、噬菌体HK620的Sak4、Rad51、Dmc1或Radb)。促进链置换和引发的因子组合也符合本文所述方法。例如,将解旋酶与与聚合酶结合使用。在一些情况下,PTA方法包括使用单链DNA结合蛋白(SSB、T4 gp32或其他单链DNA结合蛋白)、解旋酶和聚合酶(例如,SauDNA聚合酶、Bsu聚合酶、Bst2.0、GspM、GspM2.0、GspSSD或其他合适的聚合酶)。在一些情况下,将逆转录酶与本文所述的链置换因子结合使用。
本文描述了扩增方法,其包括使用终止子核苷酸、聚合酶和其他因子或条件。例如,在一些情况下,这些因子在扩增过程中用于使核酸模板或扩增子片段化。在一些情况下,这些因子包括核酸内切酶。在一些情况下,因子包括转座酶。在一些情况下,在扩增过程中使用机械剪切来使核酸片段化。在一些情况下,在扩增过程中添加核苷酸,可以通过添加其他蛋白质或条件使其片段化。例如,将尿嘧啶并入扩增子中;用尿嘧啶D-糖基化酶的处理使核酸在含尿嘧啶位置处片段化。在一些情况下,还采用了选择性核酸片段化的其他体系,例如,切割修饰的胞嘧啶-芘碱基对的工程化DNA糖基化酶(Kwon,等人Chem Biol.2003,10(4),351)。
本文描述了包括使用终止子核苷酸的扩增方法,该终止子核苷酸终止核酸复制,从而减小扩增产物的大小。在一些情况下,这些终止子与本文所述的聚合酶、链置换因子或其他扩增组分结合使用。在一些情况下,终止子核苷酸减少或降低了核酸复制的效率。在一些情况下,这些终止子将延伸率减少至少99.9%、99%、98%、95%、90%、85%、80%、75%、70%或至少65%。在一些情况下,这些终止子将延伸率减少50%-90%、60%-80%、65%-90%、70%-85%、60%-90%、70%-99%、80%-99%或50%-80%。在一些情况下,终止子将平均扩增子产物长度减少至少99.9%、99%、98%、95%、90%、85%、80%、75%、70%或至少65%。在一些情况下,终止子将平均扩增子长度减少50%-90%、60%-80%、65%-90%、70%-85%、60%-90%、70%-99%、80%-99%或50%-80%。在一些情况下,包括终止子核苷酸的扩增子会形成环或发夹,从而降低聚合酶将这些扩增子用作模板的能力。在一些情况下,终止子的使用通过并入终止子核苷酸(例如,经过修饰以使其抵抗核酸外切酶从而终止DNA延伸的双脱氧核苷酸)而减慢起始扩增位点处的扩增速度,从而产生较小的扩增产物。通过比当前使用的方法产生更小的扩增产物(例如,PTA方法的平均长度为50-2000个核苷酸,而MDA方法的平均产物长度为>10,000个核苷酸),PTA扩增产物在一些情况下可直接进行连接衔接子而无需片段化,从而允许细胞条形码和独特分子标识码(UMI)的有效并入(参见图1D、图2B-图3E、图9、图10A和图10B)。
终止子核苷酸以各种浓度存在,取决于诸如聚合酶、模板或其他因子。例如,在一些情况下,在本文所述的方法中,终止子核苷酸的量表示为非终止子核苷酸与终止子核苷酸的比率。在一些情况下,这些浓度允许控制扩增子的长度。在一些情况下,非终止子核苷酸与终止子核苷酸的比率为约2:1、5:1、7:1、10:1、20:1、50:1、100:1、200:1、500:1、1000:1、2000:1或5000:1。在一些情况下,非终止子核苷酸与终止子核苷酸的比率为2:1-10:1、5:1-20:1、10:1-100:1、20:1-200:1、50:1-1000:1、50:1-500:1、75:1-150:1或100:1-500:1。在一些情况下,在使用本文所述的方法扩增期间存在的至少一个核苷酸是终止子核苷酸。每种终止子不必以约相同的浓度存在;在一些情况下,对于特定的一组反应条件、样品类型或聚合酶,可以优化本文所述方法中存在的各种终止子的比例。不受理论的约束,每种终止子在响应与模板链上相应核苷酸的配对时,并入扩增子的生长多核苷酸链中的效率可以不同。例如,在一些情况下,与胞嘧啶配对的终止子的浓度比平均终止子浓度高约3%、5%、10%、15%、20%、25%或50%。在一些情况下,与胸腺嘧啶配对的终止子的浓度比平均终止子浓度高约3%、5%、10%、15%、20%、25%或50%。在一些情况下,与鸟嘌呤配对的终止子的浓度比平均终止子浓度高约3%、5%、10%、15%、20%、25%或50%。在一些情况下,与腺嘌呤配对的终止子的浓度比平均终止子浓度高约3%、5%、10%、15%、20%、25%或50%。在一些情况下,与尿嘧啶配对的终止子的浓度比平均终止子浓度高约3%、5%、10%、15%、20%、25%或50%。在一些情况下,能够终止通过核酸聚合酶的核酸延伸的任何核苷酸在本文所述的方法中用作终止子核苷酸。在一些情况下,可逆终止子用于终止核酸复制。在一些情况下,不可逆终止子用于终止核酸复制。在一些情况下,终止子的非限制性示例包括可逆和不可逆核酸和核酸类似物,例如,包括核苷酸的3’封闭的可逆终止子、包括核苷酸的3’未封闭的可逆终止子、包括脱氧核苷酸的2’修饰的终止子、包括对脱氧核苷酸的含氮碱基的修饰的终止子或其任何组合。在一个实施方案中,终止子核苷酸是双脱氧核苷酸。终止核酸复制并且可以适用于实施本发明的其他核苷酸修饰包括但不限于脱氧核糖的3’碳的r基团的任何修饰,如反向双脱氧核苷酸、3’生物素化核苷酸、3’氨基核苷酸、3’-磷酸化核苷酸、3’-O-甲基核苷酸、包括3’C3间隔子核苷酸、3’C18核苷酸、3’己二醇间隔子核苷酸的3’碳间隔子核苷酸、无环核苷酸,及其组合。在一些情况下,终止子是长度为1、2、3、4或更多个碱基的多核苷酸。在一些情况下,终止子不包括可检测的部分或标签(例如,质量标签、荧光标签、染料、放射性原子或其他可检测的部分)。在一些情况下,终止子不包括允许可检测部分或标签附接的化学部分(例如,“点击”叠氮化物/炔烃、共轭加成剂或用于标签附接的其他化学处理)。在一些情况下,所有终止子核苷酸都包括相同的修饰,该修饰减少核苷酸的某区域(例如,糖部分、碱基部分或磷酸部分)处的扩增。在一些情况下,至少一种终止子具有减少扩增的不同修饰。在一些情况下,所有终止子都具有基本相似的荧光激发或发射波长。在一些情况下,未修饰磷酸基团的终止子与不具有核酸外切酶校对活性的聚合酶一起使用。终止子在与具有可以除去终止子核苷酸的3’->5’校对核酸外切酶活性的聚合酶(例如,phi29)一起使用时,在一些情况下,还需要进一步修饰使其抵抗核酸外切酶。例如,双脱氧核苷酸被α-硫基修饰,产生硫代磷酸酯键,使这些核苷酸对核酸聚合酶的3’->5’校对核酸外切酶活性具有抗性。在一些情况下,这种修饰使聚合酶的核酸外切酶校对活性降低至少99.5%、99%、98%、95%、90%或至少85%。在一些情况下,提供对3’->5’核酸外切酶活性的抗性的其他终止子核苷酸修饰的非限制性示例包括:具有对α基团的修饰的核苷酸,如产生硫代磷酸酯键的α-硫代双脱氧核苷酸、C3间隔子核苷酸、锁核酸(LNA)、反向核酸、2’氟碱基、3’磷酸化、2’-O-甲基修饰(或其他2’-O-烷基修饰)、丙炔修饰的碱基(例如,脱氧胞嘧啶、脱氧尿苷)、L-DNA核苷酸、L-RNA核苷酸、具有反向连接的核苷酸(例如,5’-5’或3’-3’)、5’反向碱基(例如,5’反向的2’,3’-二脱氧dT)、甲基膦酸酯骨架和反式核酸。在一些情况下,具有修饰的核苷酸包括具有游离3’OH基团的碱基修饰的核酸(例如,2-硝基苄基烷基化的HOMedU三磷酸,具有大化学基团修饰如固体支持物或其他较大部分的碱基)。在一些情况下,将具有链置换活性但不具有3’->5’核酸外切酶校对活性的聚合酶与经历或未经历使其具有核酸外切酶抗性的修饰的终止子核苷酸一起使用。这些核酸聚合酶包括但不限于BstDNA聚合酶、Bsu DNA聚合酶、Deep Vent(exo-)DNA聚合酶、Klenow片段(exo-)DNA聚合酶、Therminator DNA聚合酶和VentR(exo-)。
引物和扩增子文库
本文描述了由至少一种靶核酸分子的扩增产生的扩增子文库。在一些情况下,这些文库是使用本文所述方法生成的,如使用终止子的文库。这些方法包括使用链置换聚合酶或因子、终止子核苷酸(可逆或不可逆)或本文所述的其他特征和实施方案。在一些情况下,使用本文所述的终止子产生的扩增子文库在随后的扩增反应(例如,PCR)中进一步扩增。在一些情况下,随后的扩增反应不包括终止子。在一些情况下,扩增子文库包括多核苷酸,其中至少50%、60%、70%、80%、90%、95%或至少98%的多核苷酸包括至少一种终止子核苷酸。在一些情况下,扩增子文库包括衍生出扩增子文库的靶核酸分子。扩增子文库包括多种多核苷酸,其中至少一些多核苷酸是直接拷贝(例如,直接从靶核酸分子如基因组DNA、RNA或其他靶核酸复制)。例如,至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%或超过95%的扩增子多核苷酸是至少一种靶核酸分子的直接拷贝。在一些情况下,至少5%的扩增子多核苷酸是至少一种靶核酸分子的直接拷贝。在一些情况下,至少10%的扩增子多核苷酸是至少一种靶核酸分子的直接拷贝。在一些情况下,至少15%的扩增子多核苷酸是至少一种靶核酸分子的直接拷贝。在一些情况下,至少20%的扩增子多核苷酸是至少一种靶核酸分子的直接拷贝。在一些情况下,至少50%的扩增子多核苷酸是至少一种靶核酸分子的直接拷贝。在一些情况下,3%-5%、3-10%、5%-10%、10%-20%、20%-30%、30%-40%、5%-30%、10%-50%或15%-75%的扩增子多核苷酸是至少一种靶核酸分子的直接拷贝。在一些情况下,至少一些多核苷酸是靶核酸分子的直接拷贝或子代(靶核酸的第一拷贝)。例如,至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%或超过95%的扩增子多核苷酸是至少一种靶核酸分子的直接拷贝或子代。在一些情况下,至少5%的扩增子多核苷酸是至少一种靶核酸分子的直接拷贝或子代。在一些情况下,至少10%的扩增子多核苷酸是至少一种靶核酸分子的直接拷贝或子代。在一些情况下,至少20%的扩增子多核苷酸是至少一种靶核酸分子的直接拷贝或子代。在一些情况下,至少30%的扩增子多核苷酸是至少一种靶核酸分子的直接拷贝或子代。在一些情况下,3%-5%、3%-10%、5%-10%、10%-20%、20%-30%、30%-40%、5%-30%、10%-50%或15%-75%的扩增子多核苷酸是至少一种靶核酸分子的直接拷贝或子代。在一些情况下,靶核酸的直接拷贝的长度为50-2500、75-2000、50-2000、25-1000、50-1000、500-2000或50-2000个碱基。在一些情况下,子代的长度为1000-5000、2000-5000、1000-10,000、2000-5000、1500-5000、3000-7000或2000-7000个碱基。在一些情况下,PTA扩增产物的平均长度为25-3000个核苷酸,为50-2500、75-2000、50-2000、25-1000、50-1000、500-2000或50-2000个碱基。在一些情况下,从PTA产生的扩增子的长度不超过5000、4000、3000、2000、1700、1500、1200、1000、700、500或不超过300个碱基。在一些情况下,从PTA产生的扩增子的长度为1000-5000、1000-3000、200-2000、200-4000、500-2000、750-2500或1000-2000个碱基。在一些情况下,使用本文所述方法产生的扩增子文库包括至少1000、2000、5000、10,000、100,000、200,000、500,000或超过500,000个包括独特序列的扩增子。在一些情况下,文库包括至少100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、2000、2500、3000或至少3500个扩增子。在一些情况下,长度小于1000个碱基的扩增子多核苷酸的至少5%、10%、15%、20%、25%、30%或超过30%是至少一种靶核酸分子的直接拷贝。在一些情况下,长度不超过2000个碱基的扩增子多核苷酸的至少5%、10%、15%、20%、25%、30%或超过30%是至少一种靶核酸分子的直接拷贝。在一些情况下,长度为3000-5000个碱基的扩增子多核苷酸的至少5%、10%、15%、20%、25%、30%或超过30%是至少一种靶核酸分子的直接拷贝。在一些情况下,直接拷贝扩增子与靶核酸分子的比例为至少10:1、100:1、1000:1、10,000:1、100,000:1、1,000,000:1、10,000,000:1或大于10,000,000:1。在一些情况下,直接拷贝扩增子与靶核酸分子的比例为至少10:1、100:1、1000:1、10,000:1、100,000:1、1,000,000:1、10,000,000:1或大于10,000,000:1,其中直接拷贝扩增子的长度不超过700-1200个碱基。在一些情况下,直接拷贝扩增子和子扩增子与靶核酸分子的比例为至少10:1、100:1、1000:1、10,000:1、100,000:1、1,000,000:1、10,000,000:1或大于10,000,000:1。在一些情况下,直接拷贝扩增子和子扩增子与靶核酸分子的比例为至少10:1、100:1、1000:1、10,000:1、100,000:1、1,000,000:1、10,000,000:1或大于10,000,000:1,其中直接拷贝扩增子的长度为700-1200个碱基,并且子扩增子的长度为2500-6000个碱基。在一些情况下,文库包括约50-10,000、约50-5,000、约50-2500、约50-1000、约150-2000、约250-3000、约50-2000、约500-2000或约500-1500个扩增子,这些是靶核酸分子的直接拷贝。在一些情况下,文库包括约50-10,000、约50-5,000、约50-2500、约50-1000、约150-2000、约250-3000、约50-2000、约500-2000或约500-1500个扩增子,这些是靶核酸分子的直接拷贝或子扩增子。在一些情况下,使用本文所述方法生成的扩增子文库经受额外步骤,如衔接子连接和进一步的PCR扩增。在一些情况下,这些额外步骤在测序步骤之前。
在一些情况下,由本文所述的PTA方法和组合物(终止子、聚合酶等)产生的多核苷酸的扩增子文库具有增加的均匀性。在一些情况下,均匀性使用洛伦兹曲线(例如,图5C)或其他类似方法来描述。在一些情况下,这种增加使得覆盖所期望的靶核酸分子(例如,基因组DNA、RNA或其他靶核酸分子)所需的测序读取更少。例如,多核苷酸的累积分数的不超过50%包括靶核酸分子的序列的累积分数的至少80%的序列。在一些情况下,多核苷酸的累积分数的不超过50%包括靶核酸分子的序列的累积分数的至少60%的序列。在一些情况下,多核苷酸的累积分数的不超过50%包括靶核酸分子的序列的累积分数的至少70%的序列。在一些情况下,多核苷酸的累积分数的不超过50%包括靶核酸分子的序列的累积分数的至少90%的序列。在一些情况下,均匀性使用基尼指数描述(其中指数0表示文库的完全相等,指数1表示完全不等)。在一些情况下,本文所述的扩增子文库的基尼指数不超过0.55、0.50、0.45、0.40或0.30。在一些情况下,本文所述的扩增子文库的基尼指数不超过0.50。在一些情况下,本文所述的扩增子文库的基尼指数不超过0.40。在一些情况下,这种均匀性度量取决于所获得的读取次数。例如,获得的读取不超过1亿、2亿、3亿、4亿或不超过5亿。在一些情况下,读取的长度为约50、75、100、125、150、175、200、225或约250个碱基。在一些情况下,均匀性度量取决于靶核酸的覆盖深度。例如,平均覆盖深度为约10X、15X、20X、25X或约30X。在一些情况下,平均覆盖深度为10-30X、20-50X、5-40X、20-60X、5-20X或10-20X。在一些情况下,本文所述的扩增子文库的基尼指数不超过0.55,其中获得了约3亿次读取。在一些情况下,本文所述的扩增子文库的基尼指数不超过0.50,其中获得了约3亿次读取。在一些情况下,本文所述的扩增子文库的基尼指数不超过0.45,其中获得了约3亿次读取。在一些情况下,本文所述的扩增子文库的基尼指数不超过0.55,其中获得了不超过3亿次读取。在一些情况下,本文所述的扩增子文库的基尼指数不超过0.50,其中获得了不超过3亿次读取。在一些情况下,本文所述的扩增子文库的基尼指数不超过0.45,其中获得了不超过3亿次读取。在一些情况下,本文所述的扩增子文库的基尼指数不超过0.55,其中测序覆盖的平均深度为约15X。在一些情况下,本文所述的扩增子文库的基尼指数不超过0.50,其中测序覆盖的平均深度为约15X。在一些情况下,本文所述的扩增子文库的基尼指数不超过0.45,其中测序覆盖的平均深度为约15X。在一些情况下,本文所述的扩增子文库的基尼指数不超过0.55,其中测序覆盖的平均深度为至少15X。在一些情况下,本文所述的扩增子文库的基尼指数不超过0.50,其中测序覆盖的平均深度为至少15X。在一些情况下,本文所述的扩增子文库的基尼指数不超过0.45,其中测序覆盖的平均深度为至少15X。在一些情况下,本文所述的扩增子文库的基尼指数不超过0.55,其中测序覆盖的平均深度不超过15X。在一些情况下,本文所述的扩增子文库的基尼指数不超过0.50,其中测序覆盖的平均深度不超过15X。在一些情况下,本文所述的扩增子文库的基尼指数不超过0.45,其中测序覆盖的平均深度不超过15X。在一些情况下,使用本文所述方法生成的均匀扩增子文库需要经受额外步骤,如衔接子连接和进一步的PCR扩增。在一些情况下,这些额外步骤在测序步骤之前。
引物包括用于引发本文所述的扩增反应的核酸。在一些情况下,这些引物包括但不限于具有或不具有使其抵抗核酸外切酶的修饰的任何长度的随机脱氧核苷酸,具有或不具有使其抵抗核酸外切酶的修饰的任意长度的随机核糖核苷酸,修饰的核酸,如锁核酸、靶向特定基因组区域的DNA或RNA引物,以及由诸如引发酶的酶引发的反应。在全基因组PTA的情况下,优选使用具有随机或部分随机核苷酸序列的一组引物。在非常复杂的核酸样品中,不需要知道样品中存在的具体核酸序列,并且不需要将引物设计为与任何特定序列互补。相反,核酸样品的复杂性导致样品中大量不同的杂交靶序列,它们将与随机或部分随机序列的各种引物互补。在一些情况下,用于PTA的引物的互补部分是完全随机的,仅包括随机的部分,或是选择性地随机的。在一些情况下,例如,引物的互补部分中的随机碱基位置数为引物的互补部分中的核苷酸总数的20%至100%。在一些情况下,引物的互补部分中的随机碱基位置数为引物的互补部分中的核苷酸总数的10%至90%、15-95%、20%-100%、30%-100%、50%-100%、75-100%或90-95%。在一些情况下,引物的互补部分中的随机碱基位置数为引物的互补部分中的核苷酸总数的至少10%、20%、30%、40%、50%、60%、70%、80%或至少90%。在一些情况下,使用标准技术合成具有随机或部分随机序列的引物组,这是通过允许在每个位置随机添加任何核苷酸。在一些情况下,引物组由具有相似的长度和/或杂交特性的引物组成。在一些情况下,术语“随机引物”是指在每个位置均可表现出4倍简并性的引物。在一些情况下,术语“随机引物”是指在每个位置均可表现出3倍简并性的引物。在一些情况下,本文所述方法中使用的随机引物包括长度为3、4、5、6、7、8、10、11、12、13、14、15、16、17、18、19、20或更多个碱基的随机序列。在一些情况下,引物包括长度为3-20、5-15、5-20、6-12或4-10个碱基的随机序列。引物也可以包括不可延伸的元件,其限制产生的扩增子的后续扩增。例如,在一些情况下,具有不可延伸元件的引物包括终止子。在一些情况下,引物包括终止子核苷酸,如1、2、3、4、5、10或超过10种终止子核苷酸。引物不需要局限于从外部添加至扩增反应的组分。在一些情况下,通过添加促进引发的核苷酸和蛋白质来原位产生引物。例如,在一些情况下,将与核苷酸组合的类似于引发酶的酶用于产生本文所述方法的随机引物。在一些情况下,类似引发酶的酶是DnaG或AEP酶超家族的成员。在一些情况下,类似引发酶的酶是TthPrimPol。在一些情况下,类似引发酶的酶是T7 gp4解旋酶-引发酶。在一些情况下,这些引发酶与本文所述的聚合酶或链置换因子一起使用。在一些情况下,引发酶用脱氧核糖核苷酸启动引发。在一些情况下,引发酶用核糖核苷酸启动引发。
在PTA扩增后可以选择扩增子的特定子集。在一些情况下,这种选择取决于大小、亲和力、活性、与探针的杂交或本领域中其他已知的选择因子。在一些情况下,选择在本文所述的额外步骤如衔接子连接和/或文库扩增之前或之后进行。在一些情况下,选择基于扩增子的大小(长度)。在一些情况下,选择较小的扩增子,其不太可能经历指数扩增,从而丰富了从主要模板衍生的产物,同时进一步将扩增从指数形式转化为拟线性扩增过程(图1A)。在一些情况下,选择长度为50-2000、25-5000、40-3000、50-1000、200-1000、300-1000、400-1000、400-600、600-2000或800-1000个碱基的扩增子。在一些情况下,通过使用方案来进行大小选择,例如,在羧化顺磁珠上使用固相可逆固定化(SPRI)以富集特定大小的核酸片段,或本领域技术人员已知的其他方案。任选地或组合地,选择通过在制备测序文库时在PCR期间优先扩增较小片段来进行,也可以在Illumina测序过程中优先由较小测序文库片段形成簇来进行。选择较小片段的其他策略也符合本文所述的方法,包括但不限于在凝胶电泳后分离特定大小的核酸片段,使用结合特定大小的核酸片段的硅胶柱,以及使用可以更强地富集较小片段的其他PCR策略。
PTA中使用的引物的非互补部分可以包括可用于进一步操纵和/或分析扩增序列的序列。这种序列的一个示例是“检测标签”。检测标签具有与检测探针互补的序列,并使用其同源检测探针进行检测。引物上可以有一个、两个、三个、四个或四个以上的检测标签。除引物的大小外,对引物上可能存在的检测标签的数目没有基本限制。在一些情况下,引物上只有一个检测标签。在一些情况下,引物上有两个检测标签。当有多个检测标签时,它们可以具有相同的序列,也可以具有不同的序列,每个不同的序列与不同的检测探针互补。在一些情况下,多个检测标签具有相同的序列。在一些情况下,多个检测标签具有不同的序列。
可以包括在引物的非互补部分中的序列的另一个示例是“地址标签”。地址标签具有与地址探针互补的序列。地址标签被并入扩增链的末端。如果存在,引物上可以有一个或多个地址标签。除引物的大小外,引物上可能存在的地址标签的数目没有基本限制。当有多个地址标签时,它们可以具有相同的序列,也可以具有不同的序列,每个不同的序列都与不同的地址探针互补。地址标签部分可以是支持地址标签与地址探针之间特异性且稳定的杂交的任何长度。在一些情况下,来自一个以上来源的核酸可以并入可变标签序列。该标签序列的长度可以高达100个核苷酸,优选地长度为1至10个核苷酸,最优选地为4、5或6个核苷酸,并且包括核苷酸的组合。在一些情况下,标签序列的长度为1-20、2-15、3-13、4-12、5-12或1-10个核苷酸。例如,如果选择六个碱基对形成标签并且使用四个不同核苷酸的排列,则可以制成总共4096个核酸锚(例如,发夹),每个锚具有独特的6碱基标签。
本文所述的引物可以存在于溶液中或固定在固体支持物上。在一些情况下,带有样品条形码和/或UMI序列的引物可以固定在固体支持物上。例如,固体支持物可以是一个或多个珠子。在一些情况下,使个体细胞与一个或多个具有独特的一组样品条形码和/或UMI序列的珠子接触,以识别个体细胞。在一些情况下,将来自个体细胞的裂解物与一个或多个具有独特的一组样品条形码和/或UMI序列的珠子接触,以识别个体细胞裂解物。在一些情况下,将来自个体细胞的纯化的核酸与一个或多个具有独特的一组样品条形码和/或UMI序列的珠子接触,以识别来自个体细胞的纯化的核酸。珠子可以以本领域已知的任何合适方式来操纵,例如,使用本文所述的液滴致动器。珠子可以是任何合适的大小,包括例如,微珠、微粒、纳米珠和纳米颗粒。在一些实施方案中,珠子是磁响应的;在其他实施方案中,珠子没有明显的磁响应。合适的珠子的非限制性示例包括流式细胞术微珠、聚苯乙烯微粒和纳米颗粒、官能化的聚苯乙烯微粒和纳米颗粒、包覆的聚苯乙烯微粒和纳米颗粒、二氧化硅微珠、荧光微球和纳米球、官能化的荧光微球和纳米球、包覆的荧光微球和纳米球、颜色染色微粒和纳米颗粒、磁性微粒和纳米颗粒、超顺磁性微粒和纳米颗粒(例如,可从Invitrogen Group,Carlsbad,CA获得的
Figure BDA0002709160300000321
)、荧光微粒和纳米颗粒、包覆的磁性微粒和纳米颗粒、铁磁性微粒和纳米颗粒、包覆的铁磁性微粒和纳米颗粒,以及在美国专利申请公开号US20050260686、US20030132538、US20050118574、20050277197、20060159962中所描述的。珠子可以与抗体、蛋白质或抗原、DNA/RNA探针或任何其他对所需靶标具有亲和力的分子预耦合。在一些实施方案中,带有样品条形码和/或UMI序列的引物可以在溶液中。在某些实施方案中,可以提供多个液滴,其中多个液滴中的每个液滴都具有对于液滴来说独特的样品条形码和对于分子来说独特的UMI,从而使得UMI在液滴集合内重复多次。在一些实施方案中,使个体细胞与具有独特的一组样品条形码和/或UMI序列的液滴接触,以识别个体细胞。在一些实施方案中,使来自个体细胞的裂解物与具有独特的一组样品条形码和/或UMI序列的液滴接触,以识别个体细胞裂解物。在一些实施方案中,将来自个体细胞的纯化的核酸与具有独特的一组样品条形码和/或UMI序列的液滴接触,以识别来自个体细胞的纯化的核酸。
PTA引物可以包括序列特异性或随机的引物、细胞条形码和/或独特分子标识码(UMI)(参见,例如,图10A(线性引物)和图10B(发夹引物))。在一些情况下,引物包括序列特异性引物。在一些情况下,引物包括随机引物。在一些情况下,引物包括细胞条形码。在一些情况下,引物包括样品条形码。在一些情况下,引物包括独特分子标识码。在一些情况下,引物包括两个或更多个细胞条形码。在一些情况下,这些条形码标识独特的样品来源或独特的工作流程。在一些情况下,这些条形码或UMI的长度为5、6、7、8、9、10、11、12、15、20、25、30或超过30个碱基。在一些情况下,引物包括至少1000、10,000、50,000、100,000、250,000、500,000、106、107、108、109或至少1010个独特条形码或UMI。在一些情况下,引物包括至少8、16、96或384个独特条形码或UMI。在一些情况下,然后在测序前将标准衔接子连接至扩增产物上;测序后,首先根据细胞条形码将读取分配给特定细胞。可以与PTA方法一起使用的合适衔接子包括,例如,可从Integrated DNA Technologies(IDT)获得的
Figure BDA0002709160300000331
DualIndex UMI衔接子。然后,使用UMI将来自每个细胞的读取分组,并将具有相同UMI的读取合并为共有读取。使用细胞条形码允许在制备文库之前合并所有细胞,因为它们之后可以通过细胞条形码识别。在一些情况下,使用UMI形成共有读取校正PCR偏倚,从而改善拷贝数变异(CNV)检测(图11A和图11B)。此外,可以通过要求来自同一分子的固定百分比的读取在每个位置具有相同的检测到的碱基变化来校正测序错误。这种方法已被用于改善CNV检测并校正大量样品中的测序错误。在一些情况下,UMI与本文所述的方法一起使用,例如,美国专利号8,835,358公开了在附接随机可扩增条形码后的数字计数原理。Schmitt.等人和Fan等人公开了校正测序错误的类似方法。
本文所述的方法可以还包括额外步骤,包括对样品或模板进行的步骤。在一些情况下,这些样品或模板在PTA之前要经过一个或多个步骤。在一些情况下,对包括细胞的样品进行预处理步骤。例如,使用冻融、Triton X-100、Tween 20和蛋白酶K的组合对细胞进行裂解和蛋白水解,以增加染色质的可及性。其他裂解策略也适用于实施本文所述的方法。这些策略包括但不限于使用洗涤剂和/或溶菌酶和/或蛋白酶处理,以及/或细胞物理破坏如超声和/或碱裂解和/或低渗裂解的其他组合进行裂解。在一些情况下,对主要模板或靶分子进行预处理步骤。在一些情况下,使用氢氧化钠使主要模板(或靶标)变性,然后中和溶液。其他变性策略也可适用于实施本文所述的方法。这些策略可以包括但不限于将碱裂解与其他碱性溶液组合,提高样品温度和/或改变样品中的盐浓度,添加添加剂如溶剂或油,其他修饰或其任何组合。在一些情况下,额外步骤包括按大小对样品、模板或扩增子进行分类、过滤或分离。例如,在用本文所述的方法扩增后,扩增子文库富集具有期望长度的扩增子。在一些情况下,扩增子文库富含长度为50-2000、25-1000、50-1000、75-2000、100-3000、150-500、75-250、170-500、100-500或75-2000个碱基的扩增子。在一些情况下,扩增子文库富含长度不超过75、100、150、200、500、750、1000、2000、5000或不超过10,000个碱基的扩增子。在一些情况下,扩增子文库富含长度为至少25、50、75、100、150、200、500、750、1000或至少2000个碱基的扩增子。
本文所述的方法和组合物可包括缓冲液或其他制剂。在一些情况下,这些缓冲液包括表面活性剂/洗涤剂或变性剂(Tween-20、DMSO、DMF,包括疏水基团的聚乙二醇化聚合物或其他表面活性剂)、盐(磷酸钾或磷酸钠(一元或二元)、氯化钠、氯化钾)、TrisHCl、氯化镁或硫酸镁、铵盐,如磷酸盐、硝酸盐或硫酸盐、EDTA)、还原剂(DTT、THP、DTE、β-巯基乙醇、TCEP或其他还原剂)或其他组分(甘油、亲水性聚合物,如PEG)。在一些情况下,将缓冲液与诸如聚合酶、链置换因子、终止子或本文所述的其他反应组分等组分结合使用。
根据本文所述方法扩增的核酸分子可以使用本领域技术人员已知的方法进行测序和分析。在一些情况下,使用的测序方法的非限制性示例包括,例如,杂交测序(SBH)、连接测序(SBL)(Shendure等人(2005)Science 309:1728)、定量增量荧光核苷酸添加测序(QIFNAS)、逐步连接和切割、荧光共振能量转移(FRET)、分子信标、TaqMan报告基因探针消化、焦磷酸测序、荧光原位测序(FISSEQ)、FISSEQ珠子(美国专利号7,425,431)、摆动测序(国际专利申请公开号WO2006/073504)、多重测序(美国专利申请公开号US2008/0269068;Porreca等人,2007,Nat.Methods 4:931)、聚合酶克隆(POLONY)测序(美国专利号6,432,360、6,485,944和6,511,803,以及国际专利申请公开号WO2005/082098)、纳米网格滚环测序(ROLONY)(美国专利号9,624,538)、等位基因特异性寡核苷酸连接测定(例如,寡核苷酸连接测定(OLA),使用连接的线性探针和滚环扩增(RCA)读出的单模板分子OLA,连接的挂锁探针和/或使用连接的圆形挂锁探针和滚环扩增(RCA)读出的单模板分子OLA)、高通量测序方法,例如,使用Roche 454、Illumina Solexa、AB-SOLiD、Helicos、Polonator平台等的方法,以及基于光的测序技术(Landegren等人(1998)Genome Res.8:769-76;Kwok(2000)Pharmacogenomics 1:95-100;以及Shi(2001)Clin.Chem.47:164-172)。在一些情况下,将扩增的核酸分子进行鸟枪法测序。
方法和应用
本文描述了使用PTA方法识别细胞突变的方法。在一些情况下使用PTA方法会导致对已知方法(例如,MDA)的改进。在一些情况下,与MDA方法相比,PTA的假阳性和假阴性变体判定率较低。在一些情况下,将基因组,如NA12878铂基因组,用于确定PTA的更大的基因组覆盖和均匀性是否会导致较低的假阴性变体判定率。不受理论的约束,可以确定PTA中错误传播的缺失降低了假阳性变体判定率。在一些情况下,通过比较已知阳性基因座处杂合突变判定的等位基因频率来估算用这两种方法在等位基因之间的扩增平衡。在一些情况下,通过PCR进一步扩增使用PTA产生的扩增子文库。
在一些情况下,使用本文所述的方法分析的细胞包括肿瘤细胞。例如,循环肿瘤细胞可以从取自患者的体液中分离,如但不限于血液、骨髓、尿液、唾液、脑脊髓液、胸膜液、心包液、腹水或房水。然后,使细胞经历本文所述的方法(例如,PTA)并测序,以确定每个细胞的突变负荷和突变组合。在一些情况下,这些数据用于诊断特定疾病或用作预测治疗应答的工具。类似地,在一些情况下,恶性潜能未知的细胞是从取自患者的体液中分离的,如但不限于血液、骨髓、尿液、唾液、脑脊髓液、胸膜液、心包液、腹水或房水。在利用本文所述的方法和测序后,这些方法还用于确定每个细胞的突变负荷和突变组合。在一些情况下,这些数据用于诊断特定疾病或用作预测恶性前状态发展为显性恶性肿瘤的工具。在一些情况下,可以从原发性肿瘤样品中分离细胞。然后,细胞可以进行PTA和测序,以确定每个细胞的突变负荷和突变组合。这些数据可以用于诊断特定疾病或用作预测患者恶性肿瘤对可用抗癌药物的抗药性的工具。通过将样品暴露于不同的化疗药物,已发现主要和次要克隆对特定药物具有不同的敏感性,这些敏感性不一定与已知的“驱动突变”的存在相关,这表明克隆种群中的突变组合决定了它对特定化疗药物的敏感性。不受理论的约束,这些发现表明,如果检测到尚未扩展并且可演化为基因组修饰数目增加的克隆而使其更有可能对治疗产生抗性的癌前病变,则可能更容易根除该恶性肿瘤。参见,Ma等人,2018,“Pan-cancergenome and transcriptome analyses of 1,699 pediatric leukemias and solidtumors”。在一些情况下,单细胞基因组学方案用于检测从患者样品中分离的正常和恶性细胞混合物内的单个癌细胞或克隆型中的体细胞遗传变体组合。在一些情况下,该技术还用于识别在体外和/或患者体内暴露于药物后经历阳性选择的克隆型。如图6A所示,通过比较暴露于化疗的存活克隆与诊断时识别的克隆,可以创建癌症克隆型目录,该目录记录它们对特定药物的抗性。在一些情况下,PTA方法检测由多种克隆型组成的样品中的特定克隆对现有药物或新药及其组合的敏感性,其中该方法可以检测特定克隆对药物的敏感性。在一些情况下,这种方法显示了药物对特定克隆的功效,而当前的药物敏感性测量在一次测量中考虑了所有癌症克隆的敏感性,因此可能无法检测到这种功效。当将本文所述的PTA应用于诊断时收集的患者样品以检测给定患者癌症中的癌症克隆型时,可以随后使用药物敏感性目录来查找这些克隆,从而告知肿瘤学家哪种药物或药物组合无效,哪种药物或药物组合最有可能对患者的癌症有效。
本文描述了测量环境因子致突变性的方法。例如,细胞(单细胞或细胞群体)暴露于潜在的环境条件。例如,在一些情况下,该方法使用诸如源自器官(肝脏、胰腺、肺、结肠、甲状腺或其他器官)、组织(皮肤或其他组织)、血液或其他生物来源的细胞。在一些情况下,环境条件包括热、光(例如,紫外线)、辐射、化学物质或其任何组合。在一定量的环境条件暴露后,在一些情况下,这是几分钟、几小时、几天或更长时间,分离出单细胞并进行PTA方法。在一些情况下,分子条形码和独特分子标识码用于标记样品。对样品进行测序,然后进行分析,以识别暴露于环境条件所导致的突变。在一些情况下,将这种突变与对照环境条件进行比较,如已知的非诱变物质、媒介物/溶剂或缺乏环境条件。在一些情况下,这种分析不仅提供了由环境条件引起的突变总数,而且还提供了这种突变的位置和性质。在一些情况下,模式从数据中识别,并且可以用于诊断疾病或病况。在一些情况下,模式可用于预测未来的疾病状态或病况。在一些情况下,本文所述的方法测量在暴露于环境药剂,例如,潜在的诱变剂或致畸剂后细胞的突变负荷、位置和模式。在一些情况下,该方法用于评估给定药剂的安全性,包括其诱发可能导致疾病发展的突变的可能性。例如,该方法可用于预测暴露于特定浓度的特定药剂后该药剂对特定细胞类型的致癌性或致畸性。
本文描述了识别已经历基因组编辑(例如,使用CRISPR技术)的动物、植物或微生物细胞中的突变的方法。在一些情况下,可以将这些细胞分离并进行PTA和测序,以确定每个细胞的突变负荷和突变组合。在一些情况下,将由基因组编辑方案产生的每细胞突变率和突变位置用于评估给定基因组编辑方法的安全性。
本文描述了确定用于细胞疗法的细胞中的突变的方法,该细胞疗法诸如但不限于诱导多能干细胞的移植,尚未被操纵的造血细胞或其他细胞的移植,或经过基因组编辑的造血细胞或其他细胞的移植。然后,细胞可以经历PTA和测序,以确定每个细胞的突变负荷和突变组合。细胞疗法产品中的每细胞突变率和突变位置可用于评估产品的安全性和潜在功效。
在另一个实施方案中,细胞可以从体外受精产生的卵裂球分离。然后,细胞可以经历PTA和测序,以确定每个细胞中潜在疾病易感遗传变体的负荷和组合。然后,可以将细胞的突变谱用于在植入前推断卵裂球对特定疾病的遗传易感性。
在另一个实施方案中,微生物细胞(例如,细菌、真菌、原生动物)可以从植物或动物(例如,微生物群样品[例如,GI微生物群、皮肤微生物群等]或体液,例如,血液、骨髓、尿液、唾液、脑脊髓液、胸膜液、心包液、腹水或房水)分离。此外,微生物细胞可以从留置的医疗装置分离,如但不限于,静脉导管、导尿管、脑脊髓分流器、假体瓣膜、人工关节或气管导管。然后,细胞可以经历PTA和测序,以确定特定微生物的身份,并检测预测对特定抗菌剂的应答(或抗性)的微生物遗传变体的存在。这些数据可用于诊断特定的传染病和/或用作预测治疗应答的工具。
本文描述了使用本文所述的PTA方法从包括短核酸的样品中产生扩增子文库的方法。在一些情况下,PTA可以提高短核酸扩增的保真度和均匀性。在一些情况下,核酸的长度不超过2000个碱基。在一些情况下,核酸的长度不超过1000个碱基。在一些情况下,核酸的长度不超过500个碱基。在一些情况下,核酸的长度不超过200、400、750、1000、2000或5000个碱基。在一些情况下,包括短核酸片段的样品包括但不限于古DNA(年龄为数百年、数千年、数百万甚至数十亿年)、FFPE(福尔马林固定石蜡包埋的)样品、无细胞DNA或其他包括短核酸的样品。
实施方案
本文描述了扩增靶核酸分子的方法,该方法包括:a)使包括靶核酸分子的样品,一种或多种扩增引物,核酸聚合酶以及包含一种或多种终止子核苷酸的核苷酸混合物接触,所述终止子核苷酸终止通过聚合酶的核酸复制,以及b)在促进靶核酸分子复制的条件下温育样品,以获得多个终止的扩增产物,其中复制通过链置换复制进行。在上述任何方法的一个实施方案中,该方法还包括从多个终止的扩增产物中分离长度为约50至约2000个核苷酸的产物。在上述任何方法的一个实施方案中,该方法还包括从多个终止的扩增产物中分离长度为约400至约600个核苷酸的产物。在上述任何方法的一个实施方案中,该方法还包括:c)从终止的扩增产物中除去末端终止子核苷酸;d)修复末端和加A-尾,以及e)将步骤(d)中获得的分子连接至衔接子,从而产生扩增产物文库。在上述任何方法的一个实施方案中,该方法还包括对扩增产物进行测序。在上述任何方法的一个实施方案中,扩增在基本等温的条件下进行。在上述任何方法的一个实施方案中,核酸聚合酶是DNA聚合酶。
在上述任何方法的一个实施方案中,DNA聚合酶是链置换DNA聚合酶。在上述任何方法的一个实施方案中,核酸聚合酶选自噬菌体phi29(Φ29)聚合酶、基因修饰的phi29(Φ29)DNA聚合酶、DNA聚合酶I的Klenow片段、噬菌体M2 DNA聚合酶、噬菌体phiPRD1 DNA聚合酶、Bst DNA聚合酶、Bst大片段DNA聚合酶、exo(-)Bst聚合酶、exo(-)Bca DNA聚合酶、BsuDNA聚合酶、VentR DNA聚合酶、VentR(exo-)DNA聚合酶、Deep Vent DNA聚合酶、Deep Vent(exo-)DNA聚合酶、IsoPol DNA聚合酶、DNA聚合酶I、Therminator DNA聚合酶、T5 DNA聚合酶、测序酶、T7 DNA聚合酶、T7-测序酶和T4 DNA聚合酶。在上述任何方法的一个实施方案中,核酸聚合酶具有3’->5’核酸外切酶活性,并且终止子核苷酸抑制这种3’->5’核酸外切酶活性。在一个特定的实施方案中,终止子核苷酸选自带有α基团修饰的核苷酸(例如,产生硫代磷酸酯键的α-硫代双脱氧核苷酸)、C3间隔子核苷酸、锁核酸(LNA)、反向核酸、2’氟核苷酸、3’磷酸化核苷酸、2’-O-甲基修饰核苷酸和反式核酸。在上述任何方法的一个实施方案中,核酸聚合酶不具有3’->5’核酸外切酶活性。在一个特定的实施方案中,聚合酶选自Bst DNA聚合酶、exo(-)Bst聚合酶、exo(-)Bca DNA聚合酶、Bsu DNA聚合酶、VentR(exo-)DNA聚合酶、Deep Vent(exo-)DNA聚合酶、Klenow片段(exo-)DNA聚合酶和Therminator DNA聚合酶。在一个特定的实施方案中,终止子核苷酸包括脱氧核糖的3’碳的r基团的修饰。在一个特定的实施方案中,终止子核苷酸选自包括核苷酸的3’封闭的可逆终止子、包括核苷酸的3’未封闭的可逆终止子、包括脱氧核苷酸的2’修饰的终止子、包括对脱氧核苷酸的含氮碱基的修饰的终止子及其组合。在一个特定的实施方案中,终止子核苷酸选自双脱氧核苷酸、反向双脱氧核苷酸、3’生物素化核苷酸、3’氨基核苷酸、3’-磷酸化核苷酸、3’-O-甲基核苷酸、包括3’C3间隔子核苷酸、3’C18核苷酸、3’己二醇间隔子核苷酸的3’碳间隔子核苷酸、无环核苷酸,及其组合。在上述任何方法的一个实施方案中,扩增引物的长度为4至70个核苷酸。在上述任何方法的一个实施方案中,扩增产物的长度为约50至约2000个核苷酸。在上述任何方法的一个实施方案中,靶核酸是DNA(例如,cDNA或基因组DNA)。在上述任何方法的一个实施方案中,扩增引物是随机引物。在上述任何方法的一个实施方案中,扩增引物包括条形码。在一个特定实施方案中,条形码包括细胞条形码。在一个特定实施方案中,条形码包括样品条形码。在上述任何方法的一个实施方案中,扩增引物包括独特分子标识码(UMI)。在上述任何方法的一个实施方案中,该方法包括在初始引物退火之前使靶核酸或基因组DNA变性。在一个特定的实施方案中,变性在碱性条件下进行,然后中和。在上述任何方法的一个实施方案中,样品、扩增引物、核酸聚合酶和核苷酸混合物包含在微流体装置中。在上述任何方法的一个实施方案中,样品、扩增引物、核酸聚合酶和核苷酸混合物包含在液滴中。在上述任何方法的一个实施方案中,样品选自组织样品、细胞、生物液样品(例如,血液、尿液、唾液、淋巴液、脑脊髓液(CSF)、羊水、胸膜液、心包液、腹水、房水)、骨髓样品、精液样品、活检样品、癌症样品、肿瘤样品、细胞裂解物样品、法医样品、考古样品、古生物样品、感染样品、生产样品、整株植物、植物部分、微生物群样品、病毒制剂、土壤样品、海洋样品、淡水样品、家庭或工业样品,及其组合和分离物。在上述任何方法的一个实施方案中,样品是细胞(例如,动物细胞[例如,人类细胞]、植物细胞、真菌细胞、细菌细胞和原生动物细胞)。在一个特定的实施方案中,细胞在复制之前裂解。在一个特定的实施方案中,细胞裂解伴随蛋白水解。在一个特定的实施方案中,该细胞选自来自植入前胚胎的细胞、干细胞、胎儿细胞、肿瘤细胞、疑似癌细胞、癌细胞、经过基因编辑程序的细胞、来自致病生物的细胞、从法医样品获得的细胞、从考古样品获得的细胞和从古生物样品获得的细胞。在上述任何方法的一个实施方案中,样品是来自来自植入前胚胎的细胞(例如卵裂球[例如,通过体外受精产生的八细胞期胚胎获得的卵裂球])。在一个特定的实施方案中,该方法还包括确定在胚胎细胞中疾病易感种系或体细胞变体的存在。在上述任何方法的一个实施方案中,样品是来自致病生物(例如,细菌、真菌、原生动物)的细胞。在一个特定的实施方案中,致病生物细胞从取自患者的体液、微生物群样品(例如GI微生物群样品、阴道微生物群样品、皮肤微生物群样品等)或留置医疗装置(例如,静脉导管、导尿管、脑脊髓分流器、假体瓣膜、人工关节、气管导管等)获得的。在一个特定的实施方案中,该方法还包括确定致病生物的身份的步骤。在一个特定的实施方案中,该方法还包括确定导致致病生物对治疗有抗性的遗传变体的存在。在上述任何方法的一个实施方案中,样品是肿瘤细胞、疑似癌细胞或癌细胞。在一个特定的实施方案中,该方法还包括确定一种或多种诊断或预后突变的存在。在一个特定的实施方案中,该方法还包括确定导致对治疗有抗性的种系或体细胞变体的存在。在上述任何方法的一个实施方案中,样品是经过基因编辑程序的细胞。在一个特定的实施方案中,该方法还包括确定由基因编辑过程引起的计划外突变的存在。在上述任何方法的一个实施方案中,该方法还包括确定细胞谱系历史。在相关方面,本发明提供了上述任何方法在识别低频序列变体(例如,构成总序列的≥0.01%的变体)中的用途。
在相关方面,本发明提供了包含核酸聚合酶、一种或多种扩增引物、包括一种或多种终止子核苷酸的核苷酸混合物以及任选的使用说明的试剂盒。在本发明试剂盒的一个实施方案中,核酸聚合酶是链置换DNA聚合酶。在本发明试剂盒的一个实施方案中,核酸聚合酶选自噬菌体phi29(Φ29)聚合酶、基因修饰的phi29(Φ29)DNA聚合酶、DNA聚合酶I的Klenow片段、噬菌体M2 DNA聚合酶、噬菌体phiPRD1 DNA聚合酶、Bst DNA聚合酶、Bst大片段DNA聚合酶、exo(-)Bst聚合酶、exo(-)Bca DNA聚合酶、Bsu DNA聚合酶、VentR DNA聚合酶、VentR(exo-)DNA聚合酶、Deep Vent DNA聚合酶、Deep Vent(exo-)DNA聚合酶、IsoPol DNA聚合酶、DNA聚合酶I、Therminator DNA聚合酶、T5 DNA聚合酶、测序酶、T7 DNA聚合酶、T7-测序酶和T4 DNA聚合酶。在本发明试剂盒的一个实施方案中,核酸聚合酶具有3’->5’核酸外切酶活性,并且终止子核苷酸抑制这种3’->5’核酸外切酶活性(例如,带有α基团修饰的核苷酸[例如,α-硫代双脱氧核苷酸]、C3间隔子核苷酸、锁核酸(LNA)、反向核酸、2’氟核苷酸、3’磷酸化核苷酸、2’-O-甲基修饰的核苷酸、反式核酸)。在本发明试剂盒的一个实施方案中,核酸聚合酶不具有3’->5’核酸外切酶活性(例如,Bst DNA聚合酶、exo(-)Bst聚合酶、exo(-)Bca DNA聚合酶、Bsu DNA聚合酶、VentR(exo-)DNA聚合酶、Deep Vent(exo-)DNA聚合酶、Klenow片段(exo-)DNA聚合酶、Therminator DNA聚合酶)。在一个特定的实施方案中,终止子核苷酸包括脱氧核糖的3’碳的r基团的修饰。在一个特定的实施方案中,终止子核苷酸选自包括核苷酸的3’封闭的可逆终止子、包括核苷酸的3’未封闭的可逆终止子、包括脱氧核苷酸的2’修饰的终止子、包括对脱氧核苷酸的含氮碱基的修饰的终止子及其组合。在一个特定的实施方案中,终止子核苷酸选自双脱氧核苷酸、反向双脱氧核苷酸、3’生物素化核苷酸、3’氨基核苷酸、3’-磷酸化核苷酸、3’-O-甲基核苷酸、包括3’C3间隔子核苷酸、3’C18核苷酸、3’己二醇间隔子核苷酸的3’碳间隔子核苷酸、无环核苷酸,及其组合。
本文描述了扩增基因组的方法,该方法包括:a)使包括基因组的样品、多种扩增引物(例如,两种或更多种引物)、核酸聚合酶以及包含一种或多种终止子核苷酸的核苷酸混合物接触,所述终止子核苷酸终止通过聚合酶的核酸复制,和b)在促进基因组复制的条件下温育样品,以获得多个终止的扩增产物,其中复制通过链置换复制进行。在上述任何方法的一个实施方案中,该方法还包括从多个终止的扩增产物中分离长度为约50至约2000个核苷酸的产物。在上述任何方法的一个实施方案中,该方法还包括从多个终止的扩增产物中分离长度为约400至约600个核苷酸的产物。在上述任何方法的一个实施方案中,该方法还包括:c)从终止的扩增产物中除去末端终止子核苷酸;d)修复末端和加A-尾,以及e)将步骤(d)中获得的分子连接至衔接子,从而产生扩增产物文库。在上述任何方法的一个实施方案中,该方法还包括对扩增产物进行测序。在上述任何方法的一个实施方案中,扩增在基本等温的条件下进行。在上述任何方法的一个实施方案中,核酸聚合酶是DNA聚合酶。
在上述任何方法的一个实施方案中,DNA聚合酶是链置换DNA聚合酶。在上述任何方法的一个实施方案中,核酸聚合酶选自噬菌体phi29(Φ29)聚合酶、基因修饰的phi29(Φ29)DNA聚合酶、DNA聚合酶I的Klenow片段、噬菌体M2 DNA聚合酶、噬菌体phiPRD1 DNA聚合酶、Bst DNA聚合酶、Bst大片段DNA聚合酶、exo(-)Bst聚合酶、exo(-)Bca DNA聚合酶、BsuDNA聚合酶、VentR DNA聚合酶、VentR(exo-)DNA聚合酶、Deep Vent DNA聚合酶、Deep Vent(exo-)DNA聚合酶、IsoPol DNA聚合酶、DNA聚合酶I、Therminator DNA聚合酶、T5 DNA聚合酶、测序酶、T7 DNA聚合酶、T7-测序酶和T4 DNA聚合酶。在上述任何方法的一个实施方案中,核酸聚合酶具有3’->5’核酸外切酶活性,并且终止子核苷酸抑制这种3’->5’核酸外切酶活性。在一个特定的实施方案中,终止子核苷酸选自带有α基团修饰的核苷酸(例如,产生硫代磷酸酯键的α-硫代双脱氧核苷酸)、C3间隔子核苷酸、锁核酸(LNA)、反向核酸、2’氟核苷酸、3’磷酸化核苷酸、2’-O-甲基修饰核苷酸和反式核酸。在上述任何方法的一个实施方案中,核酸聚合酶不具有3’->5’核酸外切酶活性。在一个特定的实施方案中,聚合酶选自Bst DNA聚合酶、exo(-)Bst聚合酶、exo(-)Bca DNA聚合酶、Bsu DNA聚合酶、VentR(exo-)DNA聚合酶、Deep Vent(exo-)DNA聚合酶、Klenow片段(exo-)DNA聚合酶和Therminator DNA聚合酶。在一个特定的实施方案中,终止子核苷酸包括脱氧核糖的3’碳的r基团的修饰。在一个特定的实施方案中,终止子核苷酸选自包括核苷酸的3’封闭的可逆终止子、包括核苷酸的3’未封闭的可逆终止子、包括脱氧核苷酸的2’修饰的终止子、包括对脱氧核苷酸的含氮碱基的修饰的终止子及其组合。在一个特定的实施方案中,终止子核苷酸选自双脱氧核苷酸、反向双脱氧核苷酸、3’生物素化核苷酸、3’氨基核苷酸、3’-磷酸化核苷酸、3’-O-甲基核苷酸、包括3’C3间隔子核苷酸、3’C18核苷酸、3’己二醇间隔子核苷酸的3’碳间隔子核苷酸、无环核苷酸,及其组合。在上述任何方法的一个实施方案中,扩增引物的长度为4至70个核苷酸。在上述任何方法的一个实施方案中,扩增产物的长度为约50至约2000个核苷酸。在上述任何方法的一个实施方案中,靶核酸是DNA(例如,cDNA或基因组DNA)。在上述任何方法的一个实施方案中,扩增引物是随机引物。在上述任何方法的一个实施方案中,扩增引物包括条形码。在一个特定实施方案中,条形码包括细胞条形码。在一个特定实施方案中,条形码包括样品条形码。在上述任何方法的一个实施方案中,扩增引物包括独特分子标识码(UMI)。在上述任何方法的一个实施方案中,该方法包括在初始引物退火之前使靶核酸或基因组DNA变性。在一个特定的实施方案中,变性在碱性条件下进行,然后中和。在上述任何方法的一个实施方案中,样品、扩增引物、核酸聚合酶和核苷酸混合物包含在微流体装置中。在上述任何方法的一个实施方案中,样品、扩增引物、核酸聚合酶和核苷酸混合物包含在液滴中。在上述任何方法的一个实施方案中,样品选自组织样品、细胞、生物液样品(例如,血液、尿液、唾液、淋巴液、脑脊髓液(CSF)、羊水、胸膜液、心包液、腹水、房水)、骨髓样品、精液样品、活检样品、癌症样品、肿瘤样品、细胞裂解物样品、法医样品、考古样品、古生物样品、感染样品、生产样品、整株植物、植物部分、微生物群样品、病毒制剂、土壤样品、海洋样品、淡水样品、家庭或工业样品,及其组合和分离物。在上述任何方法的一个实施方案中,样品是细胞(例如,动物细胞[例如,人类细胞]、植物细胞、真菌细胞、细菌细胞和原生动物细胞)。在一个特定的实施方案中,细胞在复制之前裂解。在一个特定的实施方案中,细胞裂解伴随蛋白水解。在一个特定的实施方案中,该细胞选自来自植入前胚胎的细胞、干细胞、胎儿细胞、肿瘤细胞、疑似癌细胞、癌细胞、经过基因编辑程序的细胞、来自致病生物的细胞、从法医样品获得的细胞、从考古样品获得的细胞和从古生物样品获得的细胞。在上述任何方法的一个实施方案中,样品是来自来自植入前胚胎的细胞(例如卵裂球[例如,通过体外受精产生的八细胞期胚胎获得的卵裂球])。在一个特定的实施方案中,该方法还包括确定在胚胎细胞中疾病易感种系或体细胞变体的存在。在上述任何方法的一个实施方案中,样品是来自致病生物(例如,细菌、真菌、原生动物)的细胞。在一个特定的实施方案中,致病生物细胞从取自患者的体液、微生物群样品(例如GI微生物群样品、阴道微生物群样品、皮肤微生物群样品等)或留置医疗装置(例如,静脉导管、导尿管、脑脊髓分流器、假体瓣膜、人工关节、气管导管等)获得的。在一个特定的实施方案中,该方法还包括确定致病生物的身份的步骤。在一个特定的实施方案中,该方法还包括确定导致致病生物对治疗有抗性的遗传变体的存在。在上述任何方法的一个实施方案中,样品是肿瘤细胞、疑似癌细胞或癌细胞。在一个特定的实施方案中,该方法还包括确定一种或多种诊断或预后突变的存在。在一个特定的实施方案中,该方法还包括确定导致对治疗有抗性的种系或体细胞变体的存在。在上述任何方法的一个实施方案中,样品是经过基因编辑程序的细胞。在一个特定的实施方案中,该方法还包括确定由基因编辑过程引起的计划外突变的存在。在上述任何方法的一个实施方案中,该方法还包括确定细胞谱系历史。在相关方面,本发明提供了上述任何方法在识别低频序列变体(例如,构成总序列的≥0.01%的变体)中的用途。
在相关方面,本发明提供了包含核酸聚合酶、一种或多种扩增引物、包括一种或多种终止子核苷酸的核苷酸混合物以及任选的使用说明的试剂盒。在本发明试剂盒的一个实施方案中,核酸聚合酶是链置换DNA聚合酶。在本发明试剂盒的一个实施方案中,核酸聚合酶选自噬菌体phi29(Φ29)聚合酶、基因修饰的phi29(Φ29)DNA聚合酶、DNA聚合酶I的Klenow片段、噬菌体M2 DNA聚合酶、噬菌体phiPRD1 DNA聚合酶、Bst DNA聚合酶、Bst大片段DNA聚合酶、exo(-)Bst聚合酶、exo(-)Bca DNA聚合酶、Bsu DNA聚合酶、VentR DNA聚合酶、VentR(exo-)DNA聚合酶、Deep Vent DNA聚合酶、Deep Vent(exo-)DNA聚合酶、IsoPol DNA聚合酶、DNA聚合酶I、Therminator DNA聚合酶、T5 DNA聚合酶、测序酶、T7 DNA聚合酶、T7-测序酶和T4 DNA聚合酶。在本发明试剂盒的一个实施方案中,核酸聚合酶具有3’->5’核酸外切酶活性,并且终止子核苷酸抑制这种3’->5’核酸外切酶活性(例如,带有α基团修饰的核苷酸[例如,α-硫代双脱氧核苷酸]、C3间隔子核苷酸、锁核酸(LNA)、反向核酸、2’氟核苷酸、3’磷酸化核苷酸、2’-O-甲基修饰的核苷酸、反式核酸)。在本发明试剂盒的一个实施方案中,核酸聚合酶不具有3’->5’核酸外切酶活性(例如,Bst DNA聚合酶、exo(-)Bst聚合酶、exo(-)Bca DNA聚合酶、Bsu DNA聚合酶、VentR(exo-)DNA聚合酶、Deep Vent(exo-)DNA聚合酶、Klenow片段(exo-)DNA聚合酶、Therminator DNA聚合酶)。在一个特定的实施方案中,终止子核苷酸包括脱氧核糖的3’碳的r基团的修饰。在一个特定的实施方案中,终止子核苷酸选自包括核苷酸的3’封闭的可逆终止子、包括核苷酸的3’未封闭的可逆终止子、包括脱氧核苷酸的2’修饰的终止子、包括对脱氧核苷酸的含氮碱基的修饰的终止子及其组合。在一个特定的实施方案中,终止子核苷酸选自双脱氧核苷酸、反向双脱氧核苷酸、3’生物素化核苷酸、3’氨基核苷酸、3’-磷酸化核苷酸、3’-O-甲基核苷酸、包括3’C3间隔子核苷酸、3’C18核苷酸、3’己二醇间隔子核苷酸的3’碳间隔子核苷酸、无环核苷酸,及其组合。
实施例
提出以下实施例以更清楚地向本领域技术人员说明本文公开的实施方案的原理和实践,并且不应被解释为限制任何要求保护的实施方案的范围。除非另有说明,否则所有份数和百分比均以重量计。
实施例1:主要模板定向扩增(PTA)
尽管PTA可以用于任何核酸扩增,但它对于全基因组扩增特别有用,因为与目前使用的方法如多重置换扩增(MDA)相比,它可以以更均匀且可再现的方式捕获更大百分比的细胞基因组,并且错误率更低,避免了目前使用的方法的缺点,如在聚合酶首先延伸随机引物的位置处进行的指数扩增,而该指数扩增会导致基因座和等位基因的随机过度表达和突变传播(参见图1A-图1C)。
细胞培养
将人NA12878(Coriell Institute)细胞维持在RPMI培养基中,该培养基补充有15%FBS和2mM的L-谷氨酰胺、100单位/mL的青霉素、100μg/mL的链霉素和0.25μg/mL的两性霉素B(Gibco,Life Technologies)。细胞以3.5×105个细胞/ml的密度接种。培养物每3天分离一次,并在37C,5%CO2的潮湿培养箱中维持。
单细胞分离和WGA
以3.5×105细胞/ml的密度接种后,将NA12878细胞培养至少三天,在这之后将3mL的细胞悬浮液以300xg沉淀10分钟。然后弃去培养基,并且用1mL的细胞洗涤缓冲液(含有2%FBS,不含Mg2或Ca2的1X PBS)洗涤3次,以300xg、200xg和最后100xg离心5分钟。然后将细胞重悬于500μL细胞洗涤缓冲液中。随后用100nM钙黄绿素AM(分子探针)和100ng/ml碘化丙啶(PI;Sigma-Aldrich)染色,以区分活细胞群。将细胞加载至已被ELIMINase(Decon Labs)彻底清洗过的BD FACScan流式细胞仪(FACSAria II)(BD Biosciences)上,并使用Accudrop荧光珠(BD Biosciences)校准,以进行细胞分选。在要经历PTA(Sigma-Aldrich)的细胞中将来自钙黄绿素AM阳性且PI阴性的部分中的单细胞分入96孔板的每个孔中,孔中含有3μL的PBS(Qiagen,REPLI-g SC试剂盒)和0.2%Tween 20。有意将多个孔留空,以用作无模板对照(NTC)。分选后,立即将板短暂离心并置于冰上。然后,将细胞在-20℃冷冻至少过夜。第二天,在预PCR工作站上进行WGA反应,该工作站提供恒定正压的HEPA过滤空气,并在每次实验前用紫外线消毒30分钟。
使用经改进的REPLI-g单细胞试剂盒(Qiagen)进行MDA,该改进先前已显示出可改善扩增均匀性。具体地,将抗核酸外切酶的随机引物(ThermoFisher)添加至缓冲液D2(REPLI-g单细胞试剂盒,Qiagen),直到在缓冲液D2中的最终浓度为125μM。将4μL所得到的裂解/变性混合物添加至含有单细胞的管,涡旋振荡,短暂离心并在冰上温育10分钟。细胞裂解液通过添加3μL终止溶液(REPLI-g单细胞试剂盒,Qiagen)来中和,涡旋混合,短暂离心,并置于室温下。随后添加40μl扩增混合物,然后在30℃温育8小时,然后通过加热至65℃持续3分钟来终止扩增。
PTA通过在冻融后首先进一步裂解细胞来进行,该裂解是通过添加5%Triton X-100(Sigma-Aldrich)和20mg/ml蛋白酶K(Promega)的1:1混合物的2μl预冷溶液。然后将细胞涡旋并短暂离心,然后在40度放置10分钟。然后将4μl缓冲液D2(REPLI-g单细胞试剂盒,Qiagen)和1μl的500μM抗核酸外切酶的随机引物添加至裂解的细胞,以使DNA变性,然后涡旋,离心并在65度放置15分钟。然后添加4μl室温终止溶液(REPLI-g单细胞试剂盒,Qiagen),并将样品涡旋并离心分离。56μl扩增混合物(REPLI-g单细胞试剂盒,Qiagen)含有等比例的α-硫代-ddNTP,其在最终的扩增反应中浓度为1200μM。然后将样品在30℃放置8小时,然后加热至65℃持续3分钟来终止扩增。
扩增步骤后,使用AMPure XP磁珠(Beckman Coulter)以2:1的磁珠样品比纯化来自MDA和PTA反应的DNA,并使用Qubit dsDNA HS测定试剂盒和Qubit 3.0荧光计根据制造商的说明(Life Technologies)来测量产量。
文库制备
MDA反应产生40μg的扩增DNA。在添加调节溶液(KAPA Biosystems)后,根据KAPAHyperPlus方案,将1μg产物片段化30分钟。然后用15μM的双索引衔接子(Integrated DNATechnologies)和4个PCR循环,对样品进行标准文库制备。每个PTA反应产生40-60ng的物质,在不进行片段化的情况下全部用于使用KAPA HyperPlus试剂盒的DNA测序文库制备。在连接时使用具有UMI和双索引的2.5μM衔接子(Integrated DNA Technologies),并且在最终扩增中使用15个PCR循环。然后使用双侧SPRI来清理文库,右侧选择和左侧选择所采用的比例分别为0.65X和0.55X。在Illumina NextSeq平台上测序之前,使用Qubit dsDNA BR测定试剂盒和2100生物分析仪(Agilent Technologies)对最终文库进行量化。包括NovaSeq在内的所有Illumina测序平台也与该方案兼容。
数据分析
使用Bcl2fastq基于细胞条形码对测序读取进行多路解编。然后使用trimmomatic修剪读取,随后使用BWA将其与hg19比对。读取由Picard进行重复标记,然后使用GATK 4.0进行局部重新比对和碱基重新校准。所有用于计算质量指标的文件都使用PicardDownSampleSam下取样至2000万次读取。质量指标是使用qualimap以及PicardAlignmentSummaryMetrics和CollectWgsMetrics从最终bam文件获取的。总基因组覆盖也使用Preseq估算。
变体判定
使用来自GATK 4.0的GATK UnifiedGenotyper判定单核苷酸变体和插入/缺失。将使用GATK最佳实践的标准过滤条件用于过程中的所有步骤(https://software.broadinstitute.org/gatk/best-practices/)。使用Control-FREEC(Boeva等人,Bioinformatics,2012,28(3):423-5)判定拷贝数变体。结构变体还使用CREST检测(Wang等人,Nat Methods,2011,8(8):652-4)。
结果
如图3A和图3B所示,仅用双脱氧核苷酸(“可逆”)扩增的映射率和映射质量得分分别为15.0+/-2.2和0.8+/-0.08,而掺入抗核酸外切酶的α-硫代双脱氧核苷酸终止子(“不可逆”)的映射率和映射质量得分分别为97.9+/-0.62和46.3+/-3.18。实验还使用可逆的ddNTP和不同浓度的终止子进行(图2A,底部)。
图2B-图2E示出了经过MDA(按照Dong,X.等人,Nat Methods.2017,14(5):491-493的方法)或PTA的NA12878人单细胞所产生的比较数据。虽然两种方案均产生了相当的低PCR重复率(MDA为1.26%+/-0.52,而PTA为1.84%+/-0.99)以及GC%(MDA为42.0+/-1.47,而PTA为40.33+/-0.45),但PTA产生的扩增子更小。与MDA相比,PTA的映射读取百分比和映射质量得分也明显更高(分别为PTA 97.9+/-0.62与MDA 82.13+/-0.62,以及PTA 46.3+/-3.18与MDA 43.2+/-4.21)。总体而言,与MDA相比,PTA生成更多可用的映射数据。图4A示出,与MDA相比,PTA显著提高了扩增的均匀性,覆盖范围更广且覆盖接近0的区域更少。使用PTA可以识别核酸群体中的低频序列变体,包括占总序列的≥0.01%的变体。PTA可以成功用于单细胞基因组扩增。
实施例2:PTA的比较分析
基准化PTA和SCMDA细胞维持和分离
将来自1000个基因组计划受试者NA12878(Coriell Institute,Camden,NJ,USA)的类淋巴母细胞维持在RPMI培养基中,该培养基中补充了15%FBS、2mM的L-谷氨酰胺、100单位/mL的青霉素、100μg/mL的链霉素和0.25μg/mL的两性霉素B)。细胞以3.5×105细胞/ml的密度接种,并且每3天分离一次。将它们维持在37℃,5%CO2的潮湿培养箱中。在单细胞分离前,将3mL在过去3天中已扩增的细胞的悬浮液以300xg离心10分钟。将沉淀的细胞用1mL细胞洗涤缓冲液(含有2%FBS,不含Mg2+或Ca2+的1X PBS)洗涤3次,然后依次以300xg、200xg和最后100xg离心5分钟,以除去死细胞。然后将细胞重悬于500uL细胞洗涤缓冲液中,然后用100nM钙黄绿素AM和100ng/ml碘化丙啶(PI)染色,以区分活细胞群。将细胞加载至已被ELIMINase彻底清洗并使用Accudrop荧光珠校准的BD FACScan流式细胞仪(FACSAria II)上。将来自钙黄绿素AM阳性且PI阴性部分的单细胞分入96孔板的每个孔中,孔中含有3uL的PBS和0.2%Tween20。有意将多个孔留空,以用作无模板对照。分选后,立即将板短暂离心并置于冰上。然后,将细胞在-80℃冷冻至少过夜。
PTA和SCMDA实验
WGA反应在预PCR工作站上组装,该工作站使用HEPA过滤后的空气提供恒定正压,并在每次实验前用紫外线消毒30分钟。MDA是根据SCMDA方法使用REPLI-g单细胞试剂盒根据已公开的方案进行的(Dong等人,Nat.Meth.2017,14,491-493)。具体而言,将抗核酸外切酶的随机引物以最终浓度12.5uM添加至裂解缓冲液。将4uL所得的裂解混合物添加至含有单细胞的管中,移液3次以混合,短暂离心并在冰上温育10分钟。细胞裂解液通过添加3uL淬灭缓冲液来中和,移液3次混合,短暂离心,并置于冰上。随后添加40ul扩增混合物,然后在30℃温育8小时,然后通过加热至65℃持续3分钟来终止扩增。PTA通过在冻融后首先进一步裂解细胞来进行,该裂解是通过添加5%Triton X-100和20mg/ml蛋白酶K的1:1混合物的2μl预冷溶液。然后将细胞涡旋并短暂离心,然后在40度放置10分钟。然后将4μl变性缓冲液和1μl 500μM抗核酸外切酶的随机引物添加至裂解的细胞,以使DNA变性,然后涡旋,离心并在65℃放置15分钟。然后2μl 4μl室温淬灭溶液,并将样品涡旋并离心分离。56μl扩增混合物含有等比例的α-硫代-ddNTP,其在最终的扩增反应中浓度为1200μM。然后将样品在30℃放置8小时,然后加热至65℃持续3分钟来终止扩增。在SCMDA或PTA扩增后,使用AMPure XP磁珠以2:1的磁珠样品比纯化DNA,并使用Qubit dsDNA HS测定试剂盒和Qubit 3.0荧光计根据制造商的说明来测量产量。PTA实验还使用可逆的ddNTP和不同浓度的终止子进行(图2A,顶部)。
文库制备
在添加调节溶液后,根据HyperPlus方案,将1ug SCMDA产物片段化30分钟。然后用15uM独特双索引衔接子和4个PCR循环,对样品进行标准文库制备。将每个PTA反应的全部产物在不进行片段化的情况下用于使用KAPA HyperPlus试剂盒的DNA测序文库制备。在连接时使用2.5uM独特双索引衔接子,并且在最终扩增中使用15个PCR循环。然后在1%琼脂糖E-Gel上将来自SCMDA和PTA的文库可视化。从凝胶切下400-700bp之间的片段,并使用Gel DNA回收试剂盒回收。在NovaSeq 6000上测序之前,使用Qubit dsDNA BR测定试剂盒和Agilent2100生物分析仪对最终文库进行量化。
数据分析
使用trimmomatic修剪数据,随后使用BWA将其与hg19比对。读取由Picard进行重复标记,然后使用GATK 3.5最佳实践进行局部重新比对和碱基重新校准。使用PicardDownSampleSam将所有文件下取样至指定的读取次数。质量指标是使用qualimap以及Picard AlignmentMetricsAummary和CollectWgsMetrics从最终bam文件获取的。绘制洛伦兹曲线,并使用htSeqTools计算基尼指数。使用UnifiedGenotyper进行SNV判定,然后使用标准推荐条件(QD<2.0||FS>60.0||MQ<40.0||SOR>4.0||MQRankSum<-12.5||ReadPosRankSum<-8.0)进行过滤。分析中没有排除任何区域,也没有进行其他数据标准化或操作。表1中列出了所测试方法的测序指标。
表1:所测试的方法之间的测序指标的比较。
Figure BDA0002709160300000521
Figure BDA0002709160300000531
CV=变异系数;SNV=单核苷酸变异;值是指15X覆盖。
基因组覆盖范围和均匀性
将PTA与所有常见的单细胞WGA方法进行综合比较。为实现此目的,分别对10个NA12878细胞进行了PTA和改进版本的MDA,称为单细胞MDA(Dong等人.Nat.Meth.2017,14,491-493)(SCMDA)。此外,使用作为LIANTI研究的一部分产生的数据来比较通过DOP-PCR(Zhang等人,PNAS 1992,89,5847-5851)、MDA试剂盒1(Dean等人,PNAS 2002,99,5261-5266)、MDA试剂盒2、MALBAC(Zong等人,Science 2012,338,1622-1626)、LIANTI(Chen等人,Science 2017,356,189-194)或PicoPlex(Langmore,Pharmacogenomics 3,557-560(2002))扩增的细胞的结果。
为了在样品之间进行标准化,将来自所有样品的原始数据进行排列并进行预处理,以使用相同的管线进行变体判定。然后,在进行比较之前,将bam文件下取样至3亿次读取。重要的是,在进行进一步分析之前未筛选PTA和SCMDA产物,而所有其他方法均在选择后续分析中使用的最高质量细胞之前进行了基因组覆盖和均匀性的筛选。值得注意的是,将SCMDA和PTA与大量二倍体NA12878样品进行比较,而所有其他方法均与LIANTI研究中使用的大量BJ1二倍体成纤维细胞进行比较。如图3C-图3F所示,PTA具有最高百分比的与基因组对齐的读取,以及最高的映射质量。PTA、LIANTI和SCMDA具有相似的GC含量,均低于其他方法。在所有方法中,PCR复制率相似。此外,相对于其他经测试方法,PTA方法使较小的模板(如线粒体基因组)能够提供更高的覆盖率(类似于较大的典型染色体)(图3G)。
然后比较所有方法的覆盖范围和均匀性。示出了SCMDA和PTA在染色体1上的覆盖图示例,其中示出,PTA具有显著改善的覆盖均匀性(图4B和图4C)。然后,使用增加的读取次数来计算所有方法的覆盖率。PTA在每个深度下都接近两种大量样品,这是相对于所有其他方法的显著改进(图5A)。然后,我们使用两种策略来衡量覆盖均匀性。第一种方法是在增加测序深度时计算覆盖变异系数,其中发现PTA比所有其他方法更均匀(图5B)。第二种策略是计算每个下取样bam文件的洛伦兹曲线,其中再次发现PTA具有最大的均匀性(图5C)。为了测量扩增均匀性的可再现性,计算了基尼指数以估算每个扩增反应与完全均匀性的差异(de Bourcy等人,PloS one 9,e105585(2014))。PTA再次显示比其他方法具有更高的可再现性(图5D)。
SNV灵敏度
为了确定扩增方法性能的这些差异对SNV判定的影响,在增加的测序深度下比较了每种方法与相应大量样品的变体判定比率。为了估计灵敏度,比较了在每个测序深度下,在每个细胞中发现的在被下取样至6.5亿个读取的相应大量样品中判定的变体百分比(图5E)。PTA的覆盖和均匀性的改善使得检测出的变体比MDA试剂盒2多45.6%,而MDA试剂盒2是第二高灵敏度的方法。在大量样品中判定为杂合的位点的检查显示,PTA显著减少了那些杂合位点的等位基因倾斜(图5F)。这一发现支持了PTA不仅在整个基因组中具有更均匀的扩增,而且在同一细胞中还更均匀地扩增两个等位基因的观点。
SNV特异性
为了估计突变判定的特异性,在每个单细胞中判定的未在相应的大量样品中发现的变体被认为是假阳性。SCMDA的较低温度裂解显著减少了假阳性变体判定的数目(图5G)。使用热稳定聚合酶的方法(MALBAC、PicoPlex和DOP-PCR)显示,随着测序深度的增加,SNV判定的特异性进一步降低。不受理论约束,这很可能是这些聚合酶的错误率与phi29 DNA聚合酶相比显著提高的结果。此外,在假阳性判定中看到的碱基改变模式也似乎是聚合酶依赖性的(图5H)。如图5G所示,与标准MDA方案相比,PTA中较低的假阳性SNV判定率支持了PTA中抑制错误传播的模型。此外,PTA的假阳性变体判定的等位基因频率最低,这再次与PTA抑制错误传播的模型一致(图5I)。
实施例3:环境致突变性的直接测量(DMEM)
PTA被用于进行新型的致突变性测定,该测定·为进行高分辨率、全基因组人类毒理基因组学研究提供框架。先前的研究,如Ames测试,依靠细菌遗传学进行测量,这些测量被认为可代表人类细胞,但仅提供有关每个暴露细胞中诱导的突变数目和模式的有限信息。为了克服这些限制,开发了一种人类诱变系统“环境致突变性的直接测量(DMEM)”,其中将单个人类细胞暴露于环境化合物中,分离为单细胞,并且进行单细胞测序,以识别在每个细胞中诱导的新突变。
将表达干/祖细胞标志物CD34的脐带血细胞暴露于浓度增加的直接诱变剂N-乙基-N-亚硝基脲(ENU)。已知ENU具有相对较低的Swain-Scott底物常数,因此已被证明主要通过两步SN1机制起作用,该机制导致O4-胸腺嘧啶、O2-胸腺嘧啶和O2-胞嘧啶的优先烷基化。通过对靶基因的有限测序,ENU在小鼠中也显示出对T到A(A到T)、T到C(A到G)和C到T(G到A)变化的偏好,这与在大肠杆菌中看到的模式有明显不同。
用于致突变性实验的脐带血细胞的分离和扩增
将ENU(CAS 759-73-9)和D-甘露醇(CAS 69-65-8)以其最大溶解度放入溶液中。新鲜抗凝剂处理的脐带血(CB)从圣路易斯脐带血库获得。将CB用PBS以1:2稀释,并根据制造商的说明在Ficoll-Paque Plus上通过密度梯度离心法分离单核细胞(MNC)。然后根据制造商的说明,使用人CD34微珠试剂盒和磁性细胞分选(MACS)系统对表达CD34的CB MNC进行免疫磁性选择。使用Luna FL细胞计数仪测定细胞计数和活力。将CB CD34+细胞以2.5x104个细胞/mL的密度接种在补充了1X CD34+扩展补充剂、100单位/mL青霉素和100ug/mL链霉素的StemSpan SFEM中,在其中扩增96小时,之后进行诱变剂暴露。
环境致突变性的直接测量(DMEM)
扩增的脐血CD34+细胞在补充有1X CD34+扩展补充剂、100单位/mL青霉素和100ug/mL链霉素的StemSpan SFEM中培养。将细胞暴露于浓度分别为8.54、85.4和854uM的ENU、1152.8和11528uM的D-甘露醇或0.9%的氯化钠(媒介物对照)40小时。如上所述,收获来自药物处理的细胞和媒介物对照样品的单细胞悬浮液,并对其进行染色以测量活力。如上所述进行单细胞分类。按照本文所述方法和实施例2的一般方法,使用简化和改进的方案进行PTA并制备文库。
DMEM数据的分析
使用Trimmomatic修剪从DMEM实验中的细胞获取的数据,使用BWA将其与GRCh38比对,并使用GATK 4.0.1最佳实践进一步处理,未偏离推荐参数。使用HaplotypeCaller进行基因分型,再次使用标准参数过滤联合基因型。如果变体的Phred质量得分至少为100并且仅在一个细胞中发现,而在大量样品中却未发现,则仅被视为诱变剂的结果。通过使用bedtools从参考基因组中提取周围碱基,确定每个SNV的三核苷酸背景。使用ggplot2和heatmap2对R中的突变计数和背景进行可视化。
为了确定突变是否在CD34+细胞中的DNA酶I超敏位点(DHS)中富集,计算了每个样品中与来自通过路线图表观基因组项目(Roadmap Epigenomics Project)产生的10个CD34+原代细胞数据集的DHS位点重叠的SNV的比例。DHS位点在两个方向都延伸了2个核小体或340个碱基。将每个DHS数据集与单细胞样品配对,在其中我们确定该细胞中与DHS重叠的至少10倍覆盖的人类基因组的比例,并将其与在覆盖的DHS位点中发现的SNV的比例进行比较。
结果
与这些研究一致,观察到每个细胞的突变数目呈剂量依赖性增加,其中与媒介物对照或有毒剂量的甘露醇相比,在最低剂量的ENU中检测到相似数目的突变(图12A)。也与先前使用ENU的小鼠研究一致,最常见的突变是T到A(A到T)、T到C(A到G)和C到T(G到A)。还观察到其他三种类型的碱基变化,但C到G(G到C)的转化似乎是罕见的(图12B)。对SNV的三核苷酸背景的检查示出了两种不同的模式(图12C)。第一种模式是当胞嘧啶后跟随鸟嘌呤时,胞嘧啶诱变似乎是罕见的。之后跟随着鸟嘌呤的胞嘧啶通常在人类基因组的第五个碳位点处被甲基化,这是异染色质的标志。不受理论的约束,假设由于异染色质的不可及性或由于5-甲基胞嘧啶与胞嘧啶相比的不利反应条件,5-甲基胞嘧啶不会被ENU烷基化。为了检验前一假设,将突变位点的位置与CD34+细胞中已知的DNA酶I超敏位点进行比较,这些位点由路线图表观基因组项目分类。如图12D所示,在DNA酶I超敏位点中未观察到胞嘧啶变体的富集。此外,在DH位点中未观察到限于胞嘧啶的变体的富集(图12E)。此外,大多数胸腺嘧啶变体发生在腺嘌呤位于胸腺嘧啶之前的地方。变体的基因组特征注释与基因组中那些特征的注释没有显著差异(图12F)。
实施例4:大规模并行单细胞DNA测序
使用PTA,建立了用于大规模并行DNA测序的方案。首先,将细胞条形码添加至随机引物。采用了两种策略来最大程度地减少细胞条形码引入的扩增中的任何偏差:1)延长随机引物的大小和/或2)创建引物,使其自身环回,以防止细胞条形码与模板结合(图10B)。一旦建立了最佳引物策略,则可以使用,例如,Mosquito HTS液体处理器对多达384种分选的细胞进行扩展,该处理器可以高精度地将粘性液体移至25nL的体积。通过使用1μL PTA反应代替标准的50μL反应体积,该液体处理器还可将试剂成本降低约50倍。
通过将带有细胞条形码的引物递送至液滴,将扩增方案转化到液滴中。任选地使用固体支持物,如使用裂池策略创建的珠子。例如,合适的珠子可以从ChemGenes获得。在一些情况下,寡核苷酸含有随机引物、细胞条形码、独特分子标识码以及可切割的序列或间隔子,以在将珠和细胞封装在同一液滴中后释放寡核苷酸。在此过程中,优化液滴中低纳升体积的模板、引物、dNTP、α-硫代-ddNTP和聚合酶浓度。在一些情况下,优化包括使用较大的液滴以增加反应体积。如图9所示,此过程需要两个连续的反应来裂解细胞,然后进行WGA。含有裂解细胞和珠子的第一液滴与含有扩增混合物的第二液滴结合。替代地或组合地,细胞在裂解前封装在水凝胶珠中,然后可以将两种珠子添加至油滴中。参见Lan,F.等人,NatureBiotechnol.,2017,35:640-646)。
其他的方法包括使用微孔,在一些情况下,该微孔在3″×2″的显微镜载玻片大小的装置上的20皮升反应室中捕获140,000个单细胞。与基于液滴的方法类似,这些孔将细胞与含有细胞条形码的珠子结合,从而允许进行大规模并行处理。参见Gole等人,NatureBiotechnol.,2013,31:1126-1132。
实施例5:PTA在小儿急性成淋巴细胞白血病(ALL)中的应用
已经对具有ETV6-RUNX1易位的单个白血病细胞进行了单细胞外显子组测序,每个细胞测量了约200个编码突变,其中仅有25个存在于该患者的足够的细胞中并且可以通过标准大量测序检测到。然后,将每个细胞的突变负荷与这种类型的白血病的其他已知特征合并,如复制相关的突变率(1个编码突变/300次细胞分裂),从开始到诊断的时间(4.2年)以及诊断时的群体规模(1000亿个细胞),从而创建该疾病发展的计算机模拟。令人意外的是,即使在被认为是基因简单的癌症,如小儿ALL中,在患者诊断时,估计仍有3.3亿个克隆具有不同的编码突变谱。有趣的是,如图6B所示,通过标准大量测序仅检测到1至5个丰度最大的克隆(框C);有数千万个克隆由少量细胞组成,因此不太可能具有临床上显著的(框A)。因此,提供了用于增强检测灵敏度的方法,从而可以检测到构成细胞的至少0.01%(1:10,000)的克隆(框B),因为这是大多数可导致复发的抗药性疾病所在的阶层。
鉴于如此大量的种群遗传多样性,已经假设在给定的患者体内存在对治疗更有抵抗力的克隆。为了检验该假设,将样品置于培养物中,并将白血病细胞暴露于浓度不断增加的标准ALL化疗药物。如图7所示,在对照样品和接受最低剂量天冬酰胺酶的样品中,具有激活的KRAS突变的克隆继续扩展。然而,该克隆被证明对泼尼松龙和柔红霉素更敏感,而其他先前无法检测到的克隆在使用这些药物治疗后可以更清楚地被检测到(图7,虚线框)。这种方法还对处理过的样品进行了大量测序。在一些情况下,使用单细胞DNA测序允许确定正在扩展的种群的多样性和克隆型。
创建ALL克隆型药物敏感性的目录
如图8所示,为了对ALL克隆型药物敏感性的目录,取诊断样品的等分试样,并进行10,000个细胞的单细胞测序,以确定每种克隆型的丰度。同时,将诊断的白血病细胞在体外暴露于标准ALL药物(长春新碱、柔红霉素、巯基嘌呤、泼尼松龙和天冬酰胺酶),以及一组靶向药物(依鲁替尼、达沙替尼和鲁索替尼)。选择活细胞,并且每次药物暴露至少对2500个细胞进行单细胞DNA测序。最后,使用已建立的用于大量测序研究的方案,对来自完成6周治疗的相同患者的骨髓样品进行分选,以检测活的残留前白血病和白血病。然后,将PTA用于以可扩展、高效且经济的方式对数万个细胞进行单细胞DNA测序,从而实现以下目标。
从克隆型到药物敏感性的药物敏感性目录
一旦获得测序数据,就建立每个细胞的克隆型。为此,需要判定变体并确定克隆型。通过利用PTA,由目前使用的WGA方法引入的等位基因缺失和覆盖偏倚受到限制。系统性地比较了用于从单细胞判定变体的进行MDA的工具,并且发现最近开发的工具Monovar具有最高的敏感性和特异性(Zafar等人,Nature Methods,2016,13:505-507)。一旦进行了变体判定,就可以确定两个细胞是否具有相同的克隆型,尽管一些变体判定由于等位基因缺失而丢失。为此,可以使用多元伯努利分布的混合模型(Gawad等人,Proc.Natl.Acad.Sci.USA,2014,111(50):17947-52)。在确定细胞具有相同的克隆型后,确定要在目录中包括哪些变体。包括满足以下任何条件的基因:1)它们是在大型儿科癌症基因组测序项目中发现的已知肿瘤抑制基因中出现的任何突变热点或功能丧失变体(移码、无义、剪接)中检测到的非同义变体;2)它们是在复发癌症样品中反复检测到的变体;以及3)它们是在ALL患者接受了6周的治疗后在残留疾病的当前大量测序研究中得到阳性选择的复发变体。如果克隆没有至少两个满足这些条件的变体,则它们不包括在目录中。随着识别出更多与治疗抗性或疾病复发相关的基因,克隆可以被“救回”并包括在目录中。为了确定克隆型在对照与药物治疗之间经过阳性还是阴性选择,将费舍尔精确检验用于识别与对照有显著差异的克隆。仅当突变的至少两个一致的组合显示出与暴露于特定药物具有相同相关性时,才将克隆添加至目录。癌基因的已知激活突变或同一基因中肿瘤抑制基因的功能丧失突变被视为在克隆之间是等效的。如果克隆型不完全一致,则将共同的突变输入到目录中。例如,如果克隆型1是A+B+C,并且克隆型2是B+C+D,则B+C克隆型将输入到目录中。如果识别出在具有有限数目的同时发生的突变的抗性细胞中反复突变的基因,则这些克隆可以合并为功能等效的克隆型。
实施例6:PTA方法
PTA方法是使用带有改动的实施例1的一般方法进行的。在一个实施方案中,终止子被标准dNTP取代,并使用添加剂来减慢扩增过程中的延伸。在另一个实施方案中,终止子被标准dNTP取代,并修饰链置换聚合酶,以减慢其延伸速率。在另一个实施方案中,终止子被dNTP取代,所述dNTP在延伸过程中比标准核苷酸并入得更慢,或者在并入后导致延伸反应比从包括标准核苷酸的模板进行的反应更慢的。在一些情况下,这种缓慢并入的dNTP具有核酸酶抗性。
实施例7:具有终止子的发夹或环方法
任选地裂解样品(如单细胞),并对样品模板(“靶核酸分子”)DNA进行拟随机引发和线性扩增。在拟随机引发步骤中使用终止子和dNTP的混合物。引物设计为产生发夹或环状结构,与原始样品模板DNA相比,它们是对于进一步扩增而言效率较低的模板。这导致源自原始样品模板的扩增子比例更高。接下来,扩增子文库通过指数扩增步骤进一步扩增,以生成用于测序的文库。在一些情况下,裂解、线性扩增和指数扩增发生在同一容器中。替代地或组合地,终止子在指数扩增步骤中使用。在一些情况下,标准dNTP在线性扩增过程中使用,并且终止子在指数扩增步骤中使用。与非终止子核苷酸相比,终止子的使用导致非原始模板扩增的减少。
实施例8:具有终止子的重组酶聚合酶扩增(RPA)
任选地裂解样品(如单细胞),并且使样品模板DNA经受RPA反应混合物(示例性程序参见Daher等人,Clin.Chem.2016,62(7),947-958),其包括重组酶、单链DNA结合蛋白、引物、聚合酶、以及终止子和dNTP的混合物。例如,重组酶是RecA,并且单链DNA结合蛋白是SSB。在一些情况下,重组酶是T4 UvsX,并且单链DNA结合蛋白是T4 gp32。各种聚合酶包括但不限于Sau聚合酶或Bsu聚合酶。在一些情况下,将额外的试剂如聚乙二醇或Carbowax20M添加至反应混合物。在一些情况下,添加逆转录酶以扩增RNA样品模板。在一些情况下,使用完全或部分随机的引物。由RPA生成的扩增子可选地经历额外步骤,如与衔接子连接、指数扩增、测序或其任何组合。与非终止子核苷酸相比,终止子的使用导致非原始模板扩增的减少。
实施例9:具有终止子的解旋酶依赖性扩增(HDA)
任选地裂解样品(如单细胞),并且使样品模板DNA经受HDA反应混合物(示例性程序参见Yang等人,Chembiochem 2015,16(9),1365-1370),其包括解旋酶、聚合酶以及终止子和dNTP的混合物。例如,聚合酶是Bst2.0、GspM、GspM2.0、GspSSD或其他聚合酶,并且解旋酶是嗜热解旋酶、Tte-UvrD或其他解旋酶。在一些情况下,添加了额外的单链DNA结合蛋白。在一些情况下,添加逆转录酶以扩增RNA样品模板。在一些情况下,使用完全或部分随机的引物。由HDA生成的扩增子可选地经历额外步骤,如与衔接子连接、指数扩增、测序或其任何组合。与非终止子核苷酸相比,终止子的使用导致非原始模板扩增的减少。
尽管本文中已经示出并描述了本发明的优选实施方案,但对于本领域技术人员显而易见的是,这些实施方案仅以示例的方式提供。本领域技术人员在不脱离本发明的情况下现将想到多种变化、改变和替代。应当理解,本文中所述的本发明实施方案的各种替代方案可用于实施本发明。以下权利要求旨在限定本发明的范围,并由此涵盖这些权利要求范围内的方法和结构及其等同项。

Claims (138)

1.一种组合物,其包括:
至少一种靶核酸分子和
扩增子文库,
其中所述扩增子文库包括从所述至少一种靶核酸分子的扩增获得的多种多核苷酸,
其中至少一些所述多核苷酸包括终止子核苷酸,
其中所述多核苷酸的至少5%是所述至少一种靶核酸分子的直接拷贝。
2.根据权利要求1所述的组合物,其中所述多核苷酸的至少10%是所述至少一种靶核酸分子的直接拷贝。
3.根据权利要求1或2所述的组合物,其中所述多核苷酸的至少15%是所述至少一种靶核酸分子的直接拷贝。
4.根据权利要求1-3中任一项所述的组合物,其中所述多核苷酸的至少25%是所述至少一种靶核酸分子的直接拷贝。
5.根据权利要求1-4中任一项所述的组合物,其中所述多核苷酸的至少50%是所述至少一种靶核酸分子的直接拷贝。
6.根据权利要求1所述的组合物,其中所述多核苷酸的5-50%是所述至少一种靶核酸分子的直接拷贝。
7.根据权利要求1所述的组合物,其中所述多核苷酸的5-20%是所述至少一种靶核酸分子的直接拷贝。
8.根据权利要求1-7中任一项所述的组合物,其中多核苷酸的累积分数的不超过50%包括所述至少一种靶核酸分子的序列的累积分数的至少80%的序列。
9.根据权利要求1-8中任一项所述的组合物,其中所述多种多核苷酸的累积分数的不超过50%包括靶核酸序列的累积分数的至少85%的序列。
10.根据权利要求1-9中任一项所述的组合物,其中所述多种多核苷酸的累积分数的不超过50%包括靶核酸序列的累积分数的至少90%的序列。
11.根据权利要求1-9中任一项所述的组合物,其中所述扩增子文库的基尼指数不超过0.5。
12.根据权利要求1-9中任一项所述的组合物,其中所述扩增子文库的基尼指数不超过0.4。
13.根据权利要求1-12中任一项所述的组合物,其中所述多种多核苷酸的长度为约50至约2000个核苷酸。
14.根据权利要求1-13中任一项所述的组合物,其中多核苷酸的长度为约400至约600个核苷酸。
15.根据权利要求1-14中任一项所述的组合物,其中多核苷酸的数目为100-5000。
16.根据权利要求1-14中任一项所述的组合物,其中多核苷酸的数目为250-1250。
17.根据权利要求1-14中任一项所述的组合物,其中多核苷酸的数目为至少100。
18.根据权利要求1-14中任一项所述的组合物,其中多核苷酸的数目为至少500。
19.根据权利要求1-14中任一项所述的组合物,其中多核苷酸的数目为至少1000。
20.根据权利要求1-19中任一项所述的组合物,其中至少一些所述多核苷酸包括条形码。
21.根据权利要求16所述的组合物,其中所述条形码包括细胞条形码。
22.根据权利要求16或21所述的组合物,其中所述条形码包括样品条形码。
23.根据权利要求1-22中任一项所述的组合物,其中至少一些所述多核苷酸包括独特分子标识码。
24.根据权利要求1-23中任一项所述的组合物,其中所述多种多核苷酸包括至少部分代表基因组的序列。
25.根据权利要求1-23中任一项所述的组合物,其中所述多种多核苷酸包括至少部分代表至少两个基因组的序列。
26.根据权利要求1-23中任一项所述的组合物,其中所述多种多核苷酸包括来自cDNA的序列。
27.根据权利要求1-26中任一项所述的组合物,其中至少90%的所述多核苷酸包括终止子核苷酸。
28.根据权利要求1-27中任一项所述的组合物,其中至少98%的所述多核苷酸包括终止子核苷酸。
29.根据权利要求1-28中任一项所述的组合物,其中所述终止子核苷酸附接至所述至少一些多核苷酸的3’末端。
30.根据权利要求1-29中任一项所述的组合物,其中所述终止子核苷酸选自带有α基团修饰的核苷酸、C3间隔子核苷酸、锁核酸(LNA)、反向核酸、2’氟核苷酸、3’磷酸化核苷酸、2’-O-甲基修饰核苷酸和反式核酸。
31.根据权利要求1-30中任一项所述的组合物,其中所述带有α基团修饰的核苷酸为α-硫代双脱氧核苷酸。
32.根据权利要求1-31中任一项所述的组合物,其中所述终止子核苷酸包括脱氧核糖的3’碳的r基团的修饰。
33.根据权利要求1-32中任一项所述的组合物,其中所述终止子核苷酸选自含有核苷酸的3’封闭的可逆终止子、含有核苷酸的3’未封闭的可逆终止子、含有脱氧核苷酸的2’修饰的终止子、含有对脱氧核苷酸的含氮碱基的修饰的终止子,及其组合。
34.根据权利要求1-32中任一项所述的组合物,其中所述终止子核苷酸选自双脱氧核苷酸、反向双脱氧核苷酸、3’生物素化核苷酸、3’氨基核苷酸、3’-磷酸化核苷酸、3’-O-甲基核苷酸、包括3’C3间隔子核苷酸、3’C18核苷酸、3’己二醇间隔子核苷酸的3’碳间隔子核苷酸、无环核苷酸,及其组合。
35.根据权利要求1-34中任一项所述的组合物,其中所述组合物包含在液滴中。
36.一种组合物,其包括:
至少一种靶核酸分子和
扩增子文库,
其中所述扩增子文库包括从所述至少一种靶核酸分子的扩增获得的多种多核苷酸,
其中至少一些所述多核苷酸包括终止子核苷酸,
其中多核苷酸的累积分数的不超过50%包括所述至少一种靶核酸分子的序列的累积分数的至少80%的序列。
37.根据权利要求36所述的组合物,其中所述多种多核苷酸的累积分数的不超过50%包括靶核酸序列的累积分数的至少85%的序列。
38.根据权利要求36或37所述的组合物,其中所述多种多核苷酸的累积分数的不超过50%包括靶核酸序列的累积分数的至少90%的序列。
39.根据权利要求36-38中任一项所述的组合物,其中所述多种多核苷酸的长度为约50至约2000个核苷酸。
40.根据权利要求36-39中任一项所述的组合物,其中多核苷酸的长度为约400至约600个核苷酸。
41.根据权利要求36-40中任一项所述的组合物,其中至少一些所述多核苷酸包括条形码。
42.根据权利要求41所述的组合物,其中所述条形码包括细胞条形码。
43.根据权利要求41或42所述的组合物,其中所述条形码包括样品条形码。
44.根据权利要求36-43中任一项所述的组合物,其中至少一些所述多核苷酸包括独特分子标识码。
45.根据权利要求36-44中任一项所述的组合物,其中所述多种多核苷酸包括至少部分代表基因组的序列。
46.根据权利要求36-44中任一项所述的组合物,其中所述多种多核苷酸包括至少部分代表至少两个基因组的序列。
47.根据权利要求36-44中任一项所述的组合物,其中所述多种多核苷酸包括来自cDNA的序列。
48.根据权利要求36-47中任一项所述的组合物,其中至少90%的所述多核苷酸包括终止子核苷酸。
49.根据权利要求36-48中任一项所述的组合物,其中至少98%的所述多核苷酸包括终止子核苷酸。
50.根据权利要求36-49中任一项所述的组合物,其中所述终止子核苷酸附接至所述至少一些多核苷酸的3’末端。
51.根据权利要求36-50中任一项所述的组合物,其中所述终止子核苷酸选自带有α基团修饰的核苷酸、C3间隔子核苷酸、锁核酸(LNA)、反向核酸、2’氟核苷酸、3’磷酸化核苷酸、2’-O-甲基修饰核苷酸和反式核酸。
52.根据权利要求36-51中任一项所述的组合物,其中所述带有α基团修饰的核苷酸为α-硫代双脱氧核苷酸。
53.根据权利要求36-52中任一项所述的组合物,其中所述终止子核苷酸包括脱氧核糖的3’碳的r基团的修饰。
54.根据权利要求36-53中任一项所述的组合物,其中所述终止子核苷酸选自含有核苷酸的3’封闭的可逆终止子、含有核苷酸的3’未封闭的可逆终止子、含有脱氧核苷酸的2’修饰的终止子、含有对脱氧核苷酸的含氮碱基的修饰的终止子,及其组合。
55.根据权利要求36-53中任一项所述的组合物,其中所述终止子核苷酸选自双脱氧核苷酸、反向双脱氧核苷酸、3’生物素化核苷酸、3’氨基核苷酸、3’-磷酸化核苷酸、3’-O-甲基核苷酸、包括3’C3间隔子核苷酸、3’C18核苷酸、3’己二醇间隔子核苷酸的3’碳间隔子核苷酸、无环核苷酸,及其组合。
56.根据权利要求36-54中任一项所述的组合物,其中所述组合物包含在液滴中。
57.一种扩增靶核酸分子的方法,所述方法包括:
a.使包括所述靶核酸分子的样品,至少一种扩增引物,至少一种核酸聚合酶和核苷酸混合物接触,其中所述核苷酸混合物包括至少一种终止子核苷酸,所述终止子核苷酸终止由所述聚合酶进行的核酸复制,以及
b.扩增所述靶核酸分子以产生多个终止的扩增产物,其中所述复制通过链置换复制进行。
58.根据权利要求57所述的方法,其中所述扩增在基本等温的条件下进行。
59.根据权利要求57或58所述的方法,其中所述扩增在温度变化不超过10℃的条件下进行。
60.根据权利要求57-59中任一项所述的方法,其中所述扩增在温度变化不超过5℃的条件下进行。
61.根据权利要求57-60中任一项所述的方法,其中所述核酸聚合酶是DNA聚合酶。
62.根据权利要求61所述的方法,其中所述DNA聚合酶是链置换DNA聚合酶。
63.根据权利要求57-62中任一项所述的方法,其中所述核酸聚合酶是噬菌体phi29(Φ29)聚合酶、基因修饰的phi29(Φ29)DNA聚合酶、DNA聚合酶I的Klenow片段、噬菌体M2 DNA聚合酶、噬菌体phiPRD1 DNA聚合酶、Bst DNA聚合酶、Bst大片段DNA聚合酶、exo(-)Bst聚合酶、exo(-)Bca DNA聚合酶、Bsu DNA聚合酶、VentR DNA聚合酶、VentR(exo-)DNA聚合酶、DeepVent DNA聚合酶、Deep Vent(exo-)DNA聚合酶、IsoPolDNA聚合酶、DNA聚合酶I、Therminator DNA聚合酶、T5 DNA聚合酶、测序酶、T7 DNA聚合酶、T7-测序酶或T4 DNA聚合酶。
64.根据权利要求57-63中任一项所述的方法,其中所述核酸聚合酶包括3’->5’核酸外切酶活性,并且所述至少一种终止子核苷酸抑制3’->5’核酸外切酶活性。
65.根据权利要求57-63中任一项所述的方法,其中所述核酸聚合酶不包括3’->5’核酸外切酶活性。
66.根据权利要求57-63中任一项所述的方法,其中所述聚合酶是Bst DNA聚合酶、exo(-)Bst聚合酶、exo(-)Bca DNA聚合酶、Bsu DNA聚合酶、VentR(exo-)DNA聚合酶、Deep Vent(exo-)DNA聚合酶、Klenow片段(exo-)DNA聚合酶或Therminator DNA聚合酶。
67.根据权利要求57-66中任一项所述的方法,其中所述至少一种终止子核苷酸包括脱氧核糖的3’碳的r基团的修饰。
68.根据权利要求57-67中任一项所述的方法,其中所述至少一种终止子核苷酸选自含有核苷酸的3’封闭的可逆终止子、含有核苷酸的3’未封闭的可逆终止子、含有脱氧核苷酸的2’修饰的终止子、含有对脱氧核苷酸的含氮碱基的修饰的终止子,及其组合。
69.根据权利要求57-68中任一项所述的方法,其中所述至少一种终止子核苷酸选自双脱氧核苷酸、反向双脱氧核苷酸、3’生物素化核苷酸、3’氨基核苷酸、3’-磷酸化核苷酸、3’-O-甲基核苷酸、包括3’C3间隔子核苷酸、3’C18核苷酸、3’己二醇间隔子核苷酸的3’碳间隔子核苷酸、无环核苷酸,及其组合。
70.根据权利要求57-69中任一项所述的方法,其中所述至少一种终止子核苷酸选自带有α基团修饰的核苷酸、C3间隔子核苷酸、锁核酸(LNA)、反向核酸、2’氟核苷酸、3’磷酸化核苷酸、2’-O-甲基修饰核苷酸和反式核酸。
71.根据权利要求57-70中任一项所述的方法,其中所述带有α基团修饰的核苷酸为α-硫代双脱氧核苷酸。
72.根据权利要求57-71中任一项所述的方法,其中所述扩增引物的长度为4至70个核苷酸。
73.根据权利要求57-72中任一项所述的方法,其中所述至少一种扩增引物的长度为4至20个核苷酸。
74.根据权利要求57-73中任一项所述的方法,其中所述至少一种扩增引物包括随机区域。
75.根据权利要求74所述的方法,其中所述随机区域的长度为4至20个核苷酸。
76.根据权利要求74或75所述的方法,其中所述随机区域的长度为8至15个核苷酸。
77.根据权利要求57-76中任一项所述的方法,其中所述扩增产物的长度为约50至约2000个核苷酸。
78.根据权利要求57-77中任一项所述的方法,其中所述扩增产物的长度为约200至约1000个核苷酸。
79.根据权利要求57-78中任一项所述的方法,其中所述方法还包括使用PCR的额外扩增步骤。
80.一种对靶核酸分子进行测序的方法,所述方法包括:
a.使包括所述靶核酸分子的样品,至少一种扩增引物,至少一种核酸聚合酶和核苷酸混合物接触,其中所述核苷酸混合物包括至少一种终止子核苷酸,所述终止子核苷酸终止由所述聚合酶进行的核酸复制,以及
b.扩增所述靶核酸分子以产生多个终止的扩增产物,其中所述复制通过链置换复制进行;
c.从所述终止的扩增产物中除去至少一种终止子核苷酸;
d.将步骤(c)中获得的所述分子与衔接子连接,从而产生扩增产物文库;以及
e.对所述扩增产物文库进行测序。
81.根据权利要求80所述的方法,还包括修复末端和加A尾。
82.根据权利要求80或81中任一项所述的方法,其中所述靶核酸是DNA。
83.根据权利要求82所述的方法,其中所述DNA是cDNA。
84.根据权利要求82所述的方法,其中所述DNA是基因组DNA。
85.根据权利要求80-84中任一项所述的方法,其中所述至少一种扩增引物包括两种或更多种引物。
86.根据权利要求80-85中任一项所述的方法,其中所述至少一种扩增引物是随机引物。
87.根据权利要求80-86中任一项所述的方法,其中所述至少一种扩增引物包括条形码。
88.根据权利要求87所述的方法,其中所述条形码包括细胞条形码。
89.根据权利要求87或88所述的方法,其中所述条形码包括样品条形码。
90.根据权利要求80-89中任一项所述的方法,其中所述方法还包括使用PCR的额外扩增步骤。
91.根据权利要求80-90中任一项所述的方法,其中所述扩增引物包括独特分子标识码(UMI)。
92.根据权利要求80-91中任一项所述的方法,其中所述方法还包括在初始引物退火之前使所述靶核酸或基因组DNA变性。
93.根据权利要求92所述的方法,其中变性在碱性条件下进行,然后进行中和。
94.根据权利要求80-93中任一项所述的方法,其中所述样品、所述扩增引物、所述核酸聚合酶和所述核苷酸混合物包含在微流体装置中。
95.根据权利要求80-94中任一项所述的方法,其中所述样品、所述扩增引物、所述核酸聚合酶和所述核苷酸混合物包含在液滴中。
96.根据权利要求80-95中任一项所述的方法,其中所述样品选自组织样品、细胞、生物流体样品、骨髓样品、精液样品、活检样品、癌症样品、肿瘤样品、细胞裂解物样品、法医样品、考古样品、古生物样品、感染样品、生产样品、整株植物、植物部分、微生物群样品、病毒制剂、土壤样品、海洋样品、淡水样品、家庭或工业样品,及其组合和分离物。
97.根据权利要求96所述的方法,其中所述生物流体选自血液、尿液、唾液、淋巴液、脑脊髓液(CSF)、羊水、胸膜液、心包液、腹水和房水。
98.一种对单细胞进行测序的方法,所述方法包括:
a.提供来自所述单细胞的细胞裂解物;
b.使所述细胞裂解物与至少一种扩增引物、至少一种核酸聚合酶和核苷酸混合物接触,其中所述核苷酸混合物包括至少一种终止子核苷酸,所述终止子核苷酸终止由所述聚合酶进行的核酸复制,以及
c.扩增所述靶核酸分子以产生多个终止的扩增产物,其中所述复制通过链置换复制进行;
d.从所述终止的扩增产物中除去至少一种终止子核苷酸;
e.将步骤(d)中获得的所述分子与衔接子连接,从而产生扩增产物文库;以及
f.对所述扩增产物文库进行测序。
99.根据权利要求98所述的方法,其中细胞裂解伴随蛋白水解。
100.根据权利要求98或99所述的方法,其中所述样品、至少一种扩增引物、所述核酸聚合酶和所述核苷酸混合物包含在微流体装置中。
101.根据权利要求98-100中任一项所述的方法,其中所述样品、所述至少一种扩增引物、所述核酸聚合酶和所述核苷酸混合物包含在液滴中。
102.根据权利要求98-101中任一项所述的方法,其中所述至少一种扩增引物附接至固体支持物。
103.根据权利要求102所述的方法,其中所述固体支持物是珠子。
104.根据权利要求102或103所述的方法,其中所述至少一种扩增引物通过可切割的接头附接至固体支持物。
105.根据权利要求98-104中任一项所述的方法,其中所述至少一种扩增引物包括条形码。
106.根据权利要求104所述的方法,其中所述方法还包括在扩增之前切割所述可切割的接头。
107.根据权利要求98-106中任一项所述的方法,其中所述方法还包括使用PCR的额外扩增步骤。
108.根据权利要求98-107中任一项所述的方法,其中所述细胞选自动物细胞、植物细胞、真菌细胞、细菌细胞和原生动物细胞。
109.根据权利要求108所述的方法,其中所述动物细胞是人类细胞。
110.根据权利要求98-109中任一项所述的方法,其中所述细胞选自来自植入前胚胎的细胞、干细胞、胎儿细胞、肿瘤细胞、疑似癌细胞、癌细胞、经过基因编辑程序的细胞、来自致病生物的细胞、从法医样品获得的细胞、从考古样品获得的细胞和从古生物样品获得的细胞。
111.根据权利要求110所述的方法,其中所述植入前胚胎细胞是卵裂球。
112.根据权利要求111所述的方法,其中所述卵裂球从体外受精产生的八细胞期胚胎获得。
113.根据权利要求110-112中任一项所述的方法,还包括确定在所述胚胎细胞中疾病易感种系或体细胞变体的存在。
114.根据权利要求110所述的方法,其中所述致病生物是细菌、真菌或原生动物。
115.根据权利要求114所述的方法,其中从致病生物获得的所述细胞是从取自患者的体液、微生物群样品或留置医疗装置获得的。
116.根据权利要求114或115所述的方法,还包括确定所述致病生物的身份的步骤。
117.根据权利要求110-116中任一项所述的方法,还包括确定导致所述致病生物对治疗有抗性的遗传变体的存在。
118.根据权利要求98-110中任一项所述的方法,其中所述细胞是肿瘤细胞、疑似癌细胞或癌细胞。
119.根据权利要求98-110或118中任一项所述的方法,还包括确定一种或多种诊断或预后突变的存在。
120.根据权利要求98-110、118或119中任一项所述的方法,还包括确定导致对治疗有抗性的种系或体细胞变体的存在。
121.根据权利要求98-110中任一项所述的方法,其中所述细胞是经过基因编辑程序的细胞。
122.根据权利要求121所述的方法,还包括确定由所述基因编辑过程引起的计划外突变的存在。
123.根据权利要求98-122中任一项所述的方法,还包括确定细胞谱系的历史。
124.根据权利要求57-123中任一项所述的方法在识别低频序列变体中的用途。
125.根据权利要求124所述的用途,其中所述低频序列变体构成总序列的≥0.01%。
126.根据权利要求124所述的用途,其中所述低频序列变体构成总序列的≥0.05%。
127.根据权利要求124所述的用途,其中所述低频序列变体构成总序列的≥0.10%。
128.一种确定环境条件的致突变性的方法,所述方法包括:
a.使细胞暴露于所述环境条件;
b.从群体中分离单细胞;
c.提供来自单细胞的细胞裂解物;
d.使所述细胞裂解物与至少一种扩增引物、至少一种核酸聚合酶和核苷酸混合物接触,其中所述核苷酸混合物包括至少一种终止子核苷酸,所述终止子核苷酸终止由所述聚合酶进行的核酸复制,以及
e.扩增所述靶核酸分子以产生多个终止的扩增产物,其中所述复制通过链置换复制进行;
f.从所述终止的扩增产物中除去至少一种终止子核苷酸;
g.将步骤(f)中获得的所述分子与衔接子连接,从而产生扩增产物文库;以及
h.对所述扩增产物文库进行测序,以及
i.将扩增产物的序列与至少一个参考序列进行比较,以识别突变。
129.根据权利要求128所述的方法,其中所述单细胞是人类细胞。
130.根据权利要求128或129所述的方法,其中环境条件包括化学物质。
131.根据权利要求128或129所述的方法,其中所述环境条件包括辐射。
132.根据权利要求128或129所述的方法,其中所述环境条件包括紫外线。
133.根据权利要求128-132中任一项所述的方法,其中所述单细胞源自肝脏、皮肤、肾脏、血液或肺。
134.根据权利要求128-133中任一项所述的方法,其中至少一些所述扩增产物包括条形码。
135.根据权利要求134所述的方法,其中所述条形码包括细胞条形码。
136.根据权利要求134或135所述的方法,其中所述条形码包括样品条形码。
137.根据权利要求128-136中任一项所述的方法,其中至少一些所述扩增引物包括独特分子标识码(UMI)。
138.根据权利要求128-137中任一项所述的方法,其中所述方法还包括使用PCR的额外扩增步骤。
CN201980023713.0A 2018-01-29 2019-01-28 核酸扩增方法 Active CN112041459B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862623471P 2018-01-29 2018-01-29
US62/623,471 2018-01-29
PCT/US2019/015452 WO2019148119A1 (en) 2018-01-29 2019-01-28 Method for nucleic acid amplification

Publications (2)

Publication Number Publication Date
CN112041459A true CN112041459A (zh) 2020-12-04
CN112041459B CN112041459B (zh) 2024-09-10

Family

ID=

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117343999A (zh) * 2023-12-05 2024-01-05 上海锐赛循益生物技术有限公司 基于左侧探针退火和右侧探针退火延伸的核酸扩增方法

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020064837A1 (en) * 1998-05-08 2002-05-30 Thuan Quoc Trinh Method for synthesizing a nucleic acid molecule using a ribonuclease
CN1373812A (zh) * 1999-09-13 2002-10-09 纽亘技术公司 用于多核苷酸序列线性等温扩增的方法及组合物
WO2003002736A2 (en) * 2001-06-27 2003-01-09 Roche Diagnostics Gmbh A walk-through technique for in vitro recombination of polynucleotide sequences
US20050221324A1 (en) * 2002-05-06 2005-10-06 Fox Michael H Genotoxicity analysis
US20060199193A1 (en) * 2005-03-04 2006-09-07 Tae-Woong Koo Sensor arrays and nucleic acid sequencing applications
US20080131952A1 (en) * 2006-12-05 2008-06-05 Weidong Wu Labeled nucleotides and nucleosides and methods for their use in DNA sequencing
CN101321877A (zh) * 2005-10-03 2008-12-10 阿普里拉股份有限公司 用于扩增核酸的组合物、方法和试剂盒
CN101636406A (zh) * 2006-12-05 2010-01-27 激光基因公司 光可断裂的标记核苷酸和核苷与标记的核苷酸和核苷以及其在dna测序中的使用方法
US20100330556A1 (en) * 2009-06-30 2010-12-30 Brian Jon Peter Genome analysis using a nicking endonuclease
WO2011050000A2 (en) * 2009-10-20 2011-04-28 The Regents Of The University Of California Single molecule nucleic acid nanoparticles
US20110319298A1 (en) * 2009-04-21 2011-12-29 Benner Steven A Differential detection of single nucleotide polymorphisms
US20130053252A1 (en) * 2009-09-25 2013-02-28 President & Fellows Of Harvard College Nucleic acid amplification and sequencing by synthesis with fluorogenic nucleotides
CN103781918A (zh) * 2011-04-13 2014-05-07 空间转录公司 用于组织样本中核酸的局部或空间检测的方法和产品
CN103917661A (zh) * 2011-05-12 2014-07-09 网络百奥有限公司 用于快速多重扩增str基因座的方法和组合物
CN104080958A (zh) * 2011-10-19 2014-10-01 纽亘技术公司 用于定向核酸扩增和测序的组合物和方法
CN104379766A (zh) * 2012-06-15 2015-02-25 伊鲁米那股份有限公司 核酸文库的动力学排除扩增
CN104736722A (zh) * 2012-05-21 2015-06-24 斯克利普斯研究所 样品制备方法
WO2016090273A1 (en) * 2014-12-05 2016-06-09 Foundation Medicine, Inc. Multigene analysis of tumor samples

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020064837A1 (en) * 1998-05-08 2002-05-30 Thuan Quoc Trinh Method for synthesizing a nucleic acid molecule using a ribonuclease
CN1373812A (zh) * 1999-09-13 2002-10-09 纽亘技术公司 用于多核苷酸序列线性等温扩增的方法及组合物
WO2003002736A2 (en) * 2001-06-27 2003-01-09 Roche Diagnostics Gmbh A walk-through technique for in vitro recombination of polynucleotide sequences
US20050221324A1 (en) * 2002-05-06 2005-10-06 Fox Michael H Genotoxicity analysis
US20060199193A1 (en) * 2005-03-04 2006-09-07 Tae-Woong Koo Sensor arrays and nucleic acid sequencing applications
CN101321877A (zh) * 2005-10-03 2008-12-10 阿普里拉股份有限公司 用于扩增核酸的组合物、方法和试剂盒
US20080131952A1 (en) * 2006-12-05 2008-06-05 Weidong Wu Labeled nucleotides and nucleosides and methods for their use in DNA sequencing
CN101636406A (zh) * 2006-12-05 2010-01-27 激光基因公司 光可断裂的标记核苷酸和核苷与标记的核苷酸和核苷以及其在dna测序中的使用方法
US20110319298A1 (en) * 2009-04-21 2011-12-29 Benner Steven A Differential detection of single nucleotide polymorphisms
US20100330556A1 (en) * 2009-06-30 2010-12-30 Brian Jon Peter Genome analysis using a nicking endonuclease
US20130053252A1 (en) * 2009-09-25 2013-02-28 President & Fellows Of Harvard College Nucleic acid amplification and sequencing by synthesis with fluorogenic nucleotides
WO2011050000A2 (en) * 2009-10-20 2011-04-28 The Regents Of The University Of California Single molecule nucleic acid nanoparticles
CN103781918A (zh) * 2011-04-13 2014-05-07 空间转录公司 用于组织样本中核酸的局部或空间检测的方法和产品
CN103917661A (zh) * 2011-05-12 2014-07-09 网络百奥有限公司 用于快速多重扩增str基因座的方法和组合物
CN104080958A (zh) * 2011-10-19 2014-10-01 纽亘技术公司 用于定向核酸扩增和测序的组合物和方法
CN104736722A (zh) * 2012-05-21 2015-06-24 斯克利普斯研究所 样品制备方法
CN104379766A (zh) * 2012-06-15 2015-02-25 伊鲁米那股份有限公司 核酸文库的动力学排除扩增
WO2016090273A1 (en) * 2014-12-05 2016-06-09 Foundation Medicine, Inc. Multigene analysis of tumor samples

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
FEI CHEN等: "Reconstructed evolutionary adaptive paths give polymerases accepting reversible terminators for sequencing and SNP detection", PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES OF THE UNITED STATES OF AMERICA, vol. 107, no. 5, pages 1948 - 1953 *
STEPANAUSKAS RAMUNAS等: "Improved genome recovery and integrated cell-size analyses of individual uncultured microbial cells and viral particles", NATURE COMMUNICATIONS, vol. 8, no. 1, pages 84, XP055842099, DOI: 10.1038/s41467-017-00128-z *
VERONICA GONZALEZ-PENA等: "Accurate genomic variant detection in single cells with primary template-directed amplification", PROC NATL ACAD SCI U S A., vol. 118, no. 24, pages 2024176118 *
何艳等: "基于链置换反应的DNA等温扩增技术应用进展", 医学综述, vol. 16, no. 1, pages 24 - 27 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117343999A (zh) * 2023-12-05 2024-01-05 上海锐赛循益生物技术有限公司 基于左侧探针退火和右侧探针退火延伸的核酸扩增方法
CN117343999B (zh) * 2023-12-05 2024-03-01 上海锐赛循益生物技术有限公司 基于左侧探针退火和右侧探针退火延伸的核酸扩增方法

Also Published As

Publication number Publication date
AU2019212953A1 (en) 2020-08-27
IL312691A (en) 2024-07-01
CA3089756A1 (en) 2019-08-01
KR20200138183A (ko) 2020-12-09
PL3746564T3 (pl) 2023-05-22
EA202091673A1 (ru) 2021-02-03
ES2937927T3 (es) 2023-04-03
KR102653725B1 (ko) 2024-04-01
WO2019148119A1 (en) 2019-08-01
US20240035080A1 (en) 2024-02-01
US20230022451A1 (en) 2023-01-26
EP3746564A4 (en) 2021-10-27
EP3746564A1 (en) 2020-12-09
AU2019212953B2 (en) 2023-02-02
IL276343A (en) 2020-09-30
AU2023202656A1 (en) 2023-05-18
DK3746564T3 (da) 2023-01-30
US20200362394A1 (en) 2020-11-19
EP4183886A1 (en) 2023-05-24
SG11202007225TA (en) 2020-08-28
JP7457434B2 (ja) 2024-03-28
DK4183886T3 (da) 2024-06-03
US11643682B2 (en) 2023-05-09
IL276343B1 (en) 2024-06-01
EP4183886B1 (en) 2024-04-17
EP3746564B1 (en) 2023-01-04
US11905553B2 (en) 2024-02-20
JP2021511794A (ja) 2021-05-13

Similar Documents

Publication Publication Date Title
AU2019212953B2 (en) Method for nucleic acid amplification
JP6882453B2 (ja) 全ゲノムデジタル増幅方法
US20230220377A1 (en) Single cell analysis
US20220277805A1 (en) Genetic mutational analysis
WO2023107453A1 (en) Method for combined genome methylation and variation analyses
CN118284703A (zh) 胚胎核酸分析
US20230095295A1 (en) Phi29 mutants and use thereof
CN112041459B (zh) 核酸扩增方法
US20240271210A1 (en) Spatial nucleic acid analysis
EP4334033A1 (en) High-throughput analysis of biomolecules
JP2023103372A (ja) 改良された核酸標的濃縮および関連方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant