CN114807323A - 用于富集扩增产物的方法及组合物 - Google Patents

用于富集扩增产物的方法及组合物 Download PDF

Info

Publication number
CN114807323A
CN114807323A CN202210471304.0A CN202210471304A CN114807323A CN 114807323 A CN114807323 A CN 114807323A CN 202210471304 A CN202210471304 A CN 202210471304A CN 114807323 A CN114807323 A CN 114807323A
Authority
CN
China
Prior art keywords
sequence
primer
target polynucleotide
amplification
polynucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210471304.0A
Other languages
English (en)
Inventor
翁莉
林盛榕
邓凌锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Accuragen Holdings Ltd
Original Assignee
Accuragen Holdings Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Accuragen Holdings Ltd filed Critical Accuragen Holdings Ltd
Publication of CN114807323A publication Critical patent/CN114807323A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/155Modifications characterised by incorporating/generating a new priming site
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/30Oligonucleotides characterised by their secondary structure
    • C12Q2525/301Hairpin oligonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/30Oligonucleotides characterised by their secondary structure
    • C12Q2525/307Circular oligonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2531/00Reactions of nucleic acids characterised by
    • C12Q2531/10Reactions of nucleic acids characterised by the purpose being amplify/increase the copy number of target nucleic acid
    • C12Q2531/125Rolling circle
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/16Assays for determining copy number or wherein the copy number is of special importance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Analytical Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Macromonomer-Based Addition Polymer (AREA)

Abstract

在一些方面,本公开内容提供了用于富集包含至少两个或更多个拷贝的靶多核苷酸的多联体的扩增子或扩增产物的方法。在一些实施方案中,方法包括对包含至少两个或更多个拷贝的靶多核苷酸的扩增子进行测序。在一些实施方案中,所述靶多核苷酸包含由染色体重排产生的序列,该染色体重排包括但不限于点突变、单核苷酸多态性、插入、缺失和包含融合基因的易位。在一些方面,本公开内容提供了在所述方法中有用的组合物和反应混合物。

Description

用于富集扩增产物的方法及组合物
本申请是申请日为2016年10月07日、申请号为201680072543.1、发明名称为“用于富集扩增产物的方法及组合物”的中国专利申请(其对应PCT申请的申请日为2016年10月07日、申请号为PCT/US2016/056126)的分案申请。
交叉引用
本申请要求于2015年10月9日提供的美国临时申请号62/239,690的权益,该临时申请通过引用并入本文。
发明背景
大规模平行核酸测序的出现已使得对复杂群体内的序列变异的鉴定变得可行。一种利用具有链置换能力的聚合酶的扩增方法——滚环扩增(RCA),已作为对用于制备核酸以供测序分析的聚合酶链反应(PCR)程序的有用替代和补充而出现。RCA涉及通过将核苷酸连续添加至与环状多核苷酸模板(如环状DNA模板)退火的引物来生长具有重复序列的多核苷酸。该延伸过程可多次覆盖环状多核苷酸模板的全长,从而导致形成该模板的重复序列或者所谓的多联体。多联体也可作为模板来生成进一步的扩增产物。然而,该延伸只会进行直到达到线性多联体的末端。随着生长多核苷酸链的前端遇到DNA的双链部分,该生长链替代模板的现有链。结果通常是形成各种长度的由可变数目的模板序列重复组成的双链DNA。在常规的RCA方法中,与包含靶序列的多个重复的较长多联体相比,较短多联体经常不成比例地扩增。因此,对较长多联体的后续分析可能会更加困难。
由于常用技术的固有误差频率比群体内许多实际序列变异的频率更大,大规模平行测序具有显著的局限性。例如,在标准的高通量测序中已报道了0.1-1%的误差率。当变体频率低,如等于或低于该误差率时,对罕见序列变体的检测具有高的假阳性率。
由于多种原因,检测罕见序列变体的能力非常关键。例如,检测罕见特征性序列可用于鉴定和区分有害环境污染物如细菌分类群的存在。表征细菌分类群的一种常见方法是鉴定高度保守序列如rRNA序列的差异。然而,迄今为止典型的基于测序的方法面临与给定样品中不同基因组的绝对数量和成员之间的同源性程度相关的挑战,从而为本已繁琐的程序呈现出复杂的问题。
用于检测序列变异的现有技术在检测融合基因变异和染色体重排方面特别低效。通常,与重排基因融合的‘配偶体’基因是未知的,这使得检测更具挑战性。如果没有观察到接合点,融合基因也可能难以检测。
发明内容
鉴于上述情况,需要检测罕见序列变异,特别是罕见序列变化和基因融合事件的替代并且/或者稳健的方法和组合物。本公开内容的组合物和方法满足了该需求,并且也提供了另外的益处。特别是,本公开内容的各个方面提供了可用于大规模平行测序方法的包含多个拷贝的靶多核苷酸的扩增子。使用包含多个拷贝的靶多核苷酸的扩增子,可不止一次对靶多核苷酸进行测序,从而减少对罕见序列变体和融合基因进行测序时的错误。
在一方面,公开了一种用于富集包含至少两个或更多个拷贝的靶多核苷酸的多联体的扩增子的方法。该方法包括:(a)通过延伸第一引物生成包含来自环状靶多核苷酸的单链多核苷酸的多联体,该第一引物包含通过序列互补性与靶多核苷酸特异性杂交的第一3’端和不通过序列互补性与靶多核苷酸特异性杂交的包含第一共同序列的第一5’端;(b)通过延伸第二引物生成包含一个或多个拷贝的靶多核苷酸的多种延伸产物,该第二引物包含通过序列互补性与多联体特异性杂交的第二3’端和不通过序列互补性与多联体特异性杂交的包含第二共同序列的第二5’端,其中第一共同序列和第二共同序列各自在5’端包含至少10个连续核苷酸并且当最佳比对时至少90%相同;以及(c)在生成多个扩增子的条件下对步骤(b)的多种延伸产物进行扩增,其中富集包含至少2个或更多个拷贝的靶多核苷酸的扩增子。在一些实施方案中,步骤(a)通过具有链置换活性的聚合酶而实现。在一些实施方案中,所述第一共同序列和所述第二共同序列是相同的。在一些实施方案中,步骤(c)的扩增包括第三引物的引物延伸,其中该第三引物包含通过序列互补性与第一共同序列或第二共同序列特异性杂交的序列。在一些实施方案中,(c)的扩增步骤产生的具有两个或更多个拷贝的靶多核苷酸的扩增子的百分比大于具有少于两个拷贝的靶多核苷酸的扩增子的百分比。在一些实施方案中,具有两个或更多个拷贝的靶多核苷酸的扩增子的百分比至少为90%。在一些实施方案中,具有两个或更多个拷贝的靶多核苷酸的扩增子的百分比至少为80%。在一些实施方案中,具有两个或更多个拷贝的靶多核苷酸的扩增子的百分比至少为60%。在一些实施方案中,所述延伸产物形成茎环结构,该茎环结构包含(i)第一共同序列与第二共同序列的互补体之间的分子内杂交,或(ii)第二共同序列与第一共同序列的互补体之间的分子内杂交。在一些实施方案中,茎环产物的形成通过在退火步骤的温度保持在第三引物的解链温度±5℃内的情况下进行步骤(c)的扩增而实现。在一些实施方案中,茎环产物的形成通过在退火步骤保持在低于70℃的温度的情况下进行步骤(c)的扩增而实现。在一些实施方案中,该茎环结构包含至少9个碱基对的分子内杂交。在一些实施方案中,该茎环结构包含至少15个碱基对的分子内杂交。在一些实施方案中,该茎环结构包含至少20个碱基对的分子内杂交。在一些实施方案中,该茎环结构包含至少25个碱基对的分子内杂交。在一些实施方案中,该茎环结构包含至少30个碱基对的分子内杂交。在一些实施方案中,步骤(b)包括不超过6个循环的第二引物延伸。在一些实施方案中,步骤(b)包括不超过8个循环的第二引物延伸。在一些实施方案中,步骤(b)包括不超过10个循环的第二引物延伸。在一些实施方案中,所述第一共同序列、所述第二共同序列和所述第三引物的杂交序列均具有在彼此±5℃内的解链温度(Tm)。在一些实施方案中,该环状靶多核苷酸为环化的无细胞DNA。在一些实施方案中,该环状靶多核苷酸为基因组DNA的环化片段。在一些实施方案中,该环状靶多核苷酸包含由染色体重排产生的序列。在一些实施方案中,染色体重排是缺失、重复、倒位和易位中的至少一种。在一些实施方案中,沿靶多核苷酸从5’至3’对应于(i)与第一3’端互补的序列、(ii)与第二3’端相同的序列以及(iii)(i)与(ii)之间的间插序列的所述靶多核苷酸的序列部分的组合长度为75个或更少的核苷酸。在一些实施方案中,至少50%的多联体包含长度为至少75个核苷酸的靶多核苷酸。在一些实施方案中,环状靶多核苷酸为单链。在一些实施方案中,该方法进一步包括对步骤(c)中产生的多个扩增子进行测序。在一些实施方案中,所述测序在没有相对于包含仅一个拷贝的靶多核苷酸的扩增子选择性地纯化包含两个或更多个拷贝的靶多核苷酸的扩增子的情况下进行。在一些实施方案中,该方法进一步包括对步骤(c)中产生的多个扩增子中包含两个或更多个拷贝的靶多核苷酸的扩增子进行纯化。在一些实施方案中,该方法进一步包括对经纯化的扩增子进行测序。在一些实施方案中,多种不同的靶多核苷酸在同一反应混合物中扩增。
在另一方面,公开了一种用于富集包含至少两个或更多个拷贝的靶多核苷酸的多联体的扩增子的反应混合物。在一个实施方案中,该反应混合物包含:(a)环状靶多核苷酸,(b)第一引物,其包含通过序列互补性与靶多核苷酸特异性杂交的第一3’端和不通过序列互补性与靶多核苷酸特异性杂交的包含第一共同序列的第一5’端;以及(c)第二引物,其包含通过序列互补性与多联体特异性杂交的第二3’端和不通过序列互补性与多联体特异性杂交的包含第二共同序列的第二5’端,其中第一共同序列和第二共同序列各自在5’端包含至少10个连续核苷酸并且当最佳比对时至少90%相同,并且该多联体为第一引物的延伸产物。在一些实施方案中,所述第一共同序列和所述第二共同序列是相同的。在一些实施方案中,该反应混合物容纳在容器中。在一些实施方案中,该容器为孔、板、管、腔室、流动池或芯片。在一些实施方案中,该反应混合物进一步包含具有通过序列互补性与第一共同序列或第二共同序列特异性杂交的序列的第三引物。在一些实施方案中,所述第一共同序列、所述第二共同序列和所述第三引物的杂交序列均具有在彼此±5℃内的解链温度(Tm)。在一些实施方案中,所述第一共同序列和所述第二共同序列各自包含至少15个核苷酸。在一些实施方案中,该环状靶多核苷酸为环化的无细胞DNA。在一些实施方案中,该环状靶多核苷酸为基因组DNA的环化片段。在一些实施方案中,该环状靶多核苷酸包含由染色体重排产生的序列。在一些实施方案中,该染色体重排是缺失、重复、倒位和易位中的至少一种。在一些实施方案中,沿靶多核苷酸从5’至3’对应于(i)与第一3’端互补的序列、(ii)与第二3’端相同的序列以及(iii)(i)与(ii)之间的间插序列的所述靶多核苷酸的序列部分的组合长度为75或更少的个核苷酸。在一些实施方案中,该环状靶多核苷酸为单链。
在另一方面,公开了一种用于富集包含至少两个或更多个拷贝的靶多核苷酸的多联体的扩增子的试剂盒。在一个实施方案中,该试剂盒包含:(a)第一引物,其包含通过序列互补性与靶多核苷酸特异性杂交的第一3’端和不通过序列互补性与靶多核苷酸特异性杂交的包含第一共同序列的第一5’端;(b)第二引物,其包含通过序列互补性与多联体特异性杂交的第二3’端和不通过序列互补性与多联体特异性杂交的包含第二共同序列的第二5’端,其中第一共同序列和第二共同序列各自在5’端包含至少10个连续核苷酸并且当最佳比对时至少90%相同,并且该多联体为第一引物的延伸产物;以及(c)第三引物,其具有通过序列互补性与第一共同序列或第二共同序列特异性杂交的序列。在一些实施方案中,所述第一共同序列和所述第二共同序列是相同的。在一些实施方案中,所述第一共同序列、所述第二共同序列和所述第三引物的杂交序列均具有在彼此±5℃内的解链温度(Tm)。在一些实施方案中,沿靶多核苷酸从5’至3’对应于(i)与第一3’端互补的序列、(ii)与第二3’端相同的序列以及(iii)(i)与(ii)之间的间插序列的所述靶多核苷酸的序列部分的组合长度为75个或更少的核苷酸。
在另一方面,公开了一种用于设计用于富集包含至少两个或更多个拷贝的靶多核苷酸的多联体的扩增子的引物的系统。在一个实施方案中,该系统包含:(a)计算机,其被配置为接收客户请求以设计用于扩增指定的靶序列的引物;(b)包含代码的计算机可读介质,该代码在由一个或多个处理器执行时设计至少三种用于扩增靶序列的引物,其中所述至少三种引物包含:(i)第一引物,其包含通过序列互补性与靶多核苷酸特异性杂交的第一3’端和不通过序列互补性与靶多核苷酸特异性杂交的包含第一共同序列的第一5’端;(ii)第二引物,其包含通过序列互补性与多联体特异性杂交的第二3’端和不通过序列互补性与多联体特异性杂交的包含第二共同序列的第二5’端,其中所述第一共同序列和所述第二共同序列各自在5’端包含至少10个连续核苷酸并且当最佳比对时至少90%相同,并且该多联体为第一引物的延伸产物;以及(iii)第三引物,其具有通过序列互补性与第一共同序列或第二共同序列特异性杂交的序列;以及(c)向接收者发送报告的报告生成器,其中该报告包含所述至少三种引物的序列。在一些实施方案中,所述第一共同序列和所述第二共同序列是相同的。在一些实施方案中,所述第一共同序列、所述第二共同序列和所述第三引物的杂交序列均具有在彼此±5℃内的解链温度(Tm)。在一些实施方案中,沿靶多核苷酸从5’至3’对应于(i)与第一3’端互补的序列、(ii)与第二3’端相同的序列以及(iii)(i)与(ii)之间的间插序列的所述靶多核苷酸的序列部分的组合长度为75个或更少的核苷酸。
在一方面,本公开内容提供了一种进行滚环扩增的方法。该方法包括(a)提供包含靶多核苷酸的环状多核苷酸;(b)使扩增反应混合物经受多个循环的滚环扩增以生成包含多联体的多种扩增产物,其中该扩增反应混合物包含(i)具有链置换活性的聚合酶,(ii)环状多核苷酸以及(iii)引物;且其中多个循环的滚环扩增中的每个循环均包含在变性温度下的变性、在退火温度下的引物退火以及在延伸温度下持续给定延伸时间段的引物延伸,从而生成多种扩增产物;且其中所生成的多种扩增产物的特征在于与通过利用变性和引物退火条件相当但延伸时间段相当于所述多个循环的延伸时间段之和的一个扩增循环生成的多种扩增产物相比,其含有更高比例的具有至少两个拷贝的靶多核苷酸的多联体。
在一方面,本公开内容提供了一种提高由滚环扩增生成的具有至少两个拷贝的靶多核苷酸的多联体的比例的方法。该方法包括(a)提供包含靶多核苷酸的环状多核苷酸;(b)使扩增反应混合物经受多个循环的滚环扩增以生成包含多联体的多种扩增产物,其中该扩增反应混合物包含(i)具有链置换活性的聚合酶,(ii)环状多核苷酸,以及(iii)引物;且其中多个循环的滚环扩增中的每个循环均包含在变性温度下的变性、在退火温度下的引物退火以及在延伸温度下持续给定延伸时间段的引物延伸,从而生成多种扩增产物;从而提高具有至少两个拷贝的靶多核苷酸的多联体的比例。在一些实施方案中,与通过利用变性和引物退火条件相当但延伸时间段相当于所述多个循环的延伸时间段之和的一个扩增循环生成的多种扩增产物相比,所述多种扩增产物中具有至少两个拷贝的靶多核苷酸的多联体的比例增加。
在一些实施方案中,所述聚合酶选自:Bsu DNA聚合酶、Vent聚合酶、Bst DNA聚合酶、phi29 DNA聚合酶、PyroPhage 3173聚合酶、其任何变体及其任何片段。
在一些实施方案中,当反应混合物中使用的环状多核苷酸包含人无细胞DNA(cfDNA)时,所述多种扩增产物展现出约180个碱基对的平均片段长度。在一些实施方案中,当反应混合物中使用的环状多核苷酸包含人无细胞DNA(cfDNA)时,所述多种扩增产物展现出约170个碱基对的中值片段长度。在一些实施方案中,当反应混合物中使用的环状多核苷酸包含人无细胞DNA(cfDNA)时,所述多种扩增产物展现出约40个碱基至约450个碱基的片段长度分布。在一些实施方案中,当反应混合物中使用的环状多核苷酸包含人无细胞DNA(cfDNA)时,所述多种扩增产物展现出约100个碱基至约200个碱基的片段长度分布。
在一些实施方案中,具有至少两个拷贝的靶多核苷酸的多联体的比例增加至少约1%。在一些实施方案中,所述方法进一步包括在多个循环的滚环扩增中的至少一个循环之后用聚合酶补充反应混合物。
在一些实施方案中,所述环状多核苷酸具有约40个碱基至约500个碱基的长度。在一些实施方案中,该环状多核苷酸包含无细胞DNA(cfDNA)。在一些实施方案中,该环状多核苷酸包含基因组DNA的片段。在一些实施方案中,该环状多核苷酸包含由染色体重排产生的序列。在一些实施方案中,该染色体重排是缺失、重复、倒位和易位中的至少一种。在一些实施方案中,该环状多核苷酸为双链。在一些实施方案中,该环状多核苷酸为单链。
在一些实施方案中,多种不同的环状多核苷酸在扩增反应混合物中扩增。在一些实施方案中,所述多个循环包括至少两个循环。在一些实施方案中,所述多个循环中的每个循环均包含(i)在约75℃至约95℃的变性温度下持续约5秒至约60秒的变性,(ii)在约45℃至约65℃的退火温度下持续约5秒至约60秒的引物退火,以及(iii)在约65℃至约75℃的延伸温度下持续约30秒至约10分钟的延伸时间段的引物延伸。在一些实施方案中,所述多个循环中的每个循环均包含(i)在约80℃的变性温度下持续约15秒至约30秒的变性,(ii)在约50℃的退火温度下持续约15秒至约45秒的引物退火,以及(iii)在约70℃的延伸温度下续约3分钟至约10分钟的延伸时间段的引物延伸。
在一些实施方案中,所述引物包含能够与环状多核苷酸的不同区域随机杂交并引发该不同区域以供引物延伸的随机序列。在一些实施方案中,该引物包含能够以序列特异性方式与环状多核苷酸的区域杂交并引发该区域以供引物延伸的基因特异性序列。在一些实施方案中,该引物包括第一引物,该第一引物包含(i)通过序列互补性与环状多核苷酸特异性杂交的第一3’端,和(ii)不通过序列互补性与靶多核苷酸特异性杂交的包含第一共同序列的第一5’端,其中在多个循环的滚环扩增期间,通过使用环状多核苷酸作为模板延伸所述第一引物来生成包含单链多核苷酸的多联体。在一些实施方案中,该引物包括第二引物,该第二引物包含(i)通过序列互补性与包含单链多核苷酸的多联体特异性杂交的第二3’端,和(ii)不通过序列互补性与多联体特异性杂交的包含第二共同序列的第二5’端,其中在多个循环的滚环扩增期间,通过使用该多联体作为模板延伸所述第二引物来生成包含一个或多个拷贝的靶多核苷酸的多种延伸产物。在一些实施方案中,所述第一共同序列和所述第二共同序列各自在5’端包含至少10个连续核苷酸,并且当最佳比对时至少90%相同。在一些实施方案中,所述第一共同序列和所述第二共同序列是相同的。
在一些实施方案中,所述方法进一步包括在生成多个扩增子的条件下对多种延伸产物进行扩增,其中富集包含至少2个或更多个拷贝的靶多核苷酸的扩增子。在一些实施方案中,扩增包括第三引物的引物延伸,其中该第三引物包含通过序列互补性与第一共同序列或第二共同序列特异性杂交的序列。在一些实施方案中,扩增产生的具有两个或更多个拷贝的靶多核苷酸的扩增子的百分比大于具有少于两个拷贝的靶多核苷酸的扩增子的百分比。在一些实施方案中,具有两个或更多个拷贝的靶多核苷酸的扩增子的百分比至少为5%。在一些实施方案中,具有两个或更多个拷贝的靶多核苷酸的扩增子的百分比至少为10%。在一些实施方案中,具有两个或更多个拷贝的靶多核苷酸的扩增子的百分比至少为20%。在一些实施方案中,具有两个或更多个拷贝的靶多核苷酸的扩增子的百分比至少为30%。在一些实施方案中,具有两个或更多个拷贝的靶多核苷酸的扩增子的百分比至少为40%。在一些实施方案中,具有两个或更多个拷贝的靶多核苷酸的扩增子的百分比至少为60%。在一些实施方案中,具有两个或更多个拷贝的靶多核苷酸的扩增子的百分比至少为80%。在一些实施方案中,具有两个或更多个拷贝的靶多核苷酸的扩增子的百分比至少为90%。
在一些实施方案中,所述多种延伸产物形成茎环结构,该茎环结构包含(i)第一共同序列与第二共同序列的互补体之间的分子内杂交,或(ii)第二共同序列与第一共同序列的互补体之间的分子内杂交。在一些实施方案中,该茎环结构的形成通过在退火步骤的温度保持在第三引物的解链温度±5℃内的情况下进行扩增而实现。在一些实施方案中,该茎环结构的形成通过在退火步骤保持在低于约70℃的温度下的情况进行扩增而实现。在一些实施方案中,该茎环结构包含至少9个碱基对的分子内杂交。在一些实施方案中,该茎环结构包含至少15个碱基对的分子内杂交。在一些实施方案中,该茎环结构包含至少20个碱基对的分子内杂交。在一些实施方案中,该茎环结构包含至少25个碱基对的分子内杂交。在一些实施方案中,该茎环结构包含至少30个碱基对的分子内杂交。在一些实施方案中,所述第一共同序列、所述第二共同序列和所述第三引物的杂交序列均具有在彼此±5℃内的解链温度(Tm)。
在一些实施方案中,沿靶多核苷酸从5’至3’对应于(i)与第一3’端互补的序列、(ii)与第二3’端相同的序列以及(iii)(i)与(ii)之间的间插序列的所述靶多核苷酸的序列部分的组合长度为75个或更少的核苷酸。
在一些实施方案中,所述方法进一步包括对包含多联体的多种扩增产物进行测序。在一些实施方案中,所述测序在没有选择性地将具有至少两个拷贝的靶多核苷酸的多联体与包含少于两个拷贝的靶多核苷酸的多联体相分离的情况下进行。
在一些实施方案中,所述方法进一步包括将包含至少两个拷贝的靶多核苷酸的多联体与包含少于两个拷贝的靶多核苷酸的多联体相分离。在一些实施方案中,该方法进一步包括对包含至少两个拷贝的靶多核苷酸的多联体进行测序。
援引并入
本说明书中提及的所有出版物、专利和专利申请均通过引用并入本文,其程度如同特别地和单独地说明每个单独的出版物、专利或专利申请通过引用而并入。
附图说明
本发明的新颖特征在所附的权利要求书中进行了具体阐述。通过参考以下对利用了本发明原理的说明性实施方案加以阐述的详细描述及其附图(图),将会获得对本发明的特征和优点的更好的了解,在附图中:
图1图示了根据一个实施方案的茎环产物的形成。
图2图示了根据一个实施方案的背靠背(B2B)引物设计,其中正向和反向引物被设计为具有用于RCA扩增的相邻5’端。
图3图示了根据一个实施方案的使用背靠背引物构建测序文库的方法。
图4图示了根据一个实施方案的用于富集扩增子的方法。
图5示出了通过一个循环的滚环扩增和多个循环的滚环扩增生成的扩增产物的大小分布,由琼脂糖凝胶获得。
图6呈现的表格示出了具有不同数目重复的扩增产物之间的比率。
图7图示了包含一个循环和多个循环的示例性滚环扩增反应中各个重复元件的大小分布。
图8示出了通过一个循环的滚环扩增和多个循环的滚环扩增生成的测序靶标的片段大小分布。
图9呈现的表格图示了根据一个实施方案,HD664、ELM4/ALK融合DNA样品与野生型参考DNA样品以不同比例的混合。
图10图示了根据一个实施方案的融合等位基因检测。
图11图示了根据一个实施方案在多重反应中可检测到多种靶多核苷酸序列。
具体实施方式
除非另有说明,否则本文公开的一些方法的实施采用了本领域技术范围内的免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组DNA的常规技术。参见,例如,Sambrook和Green,Molecular Cloning:A Laboratory Manual,第四版(2012);Current Protocols in Molecular Biology系列(F.M.Ausubel等编著);Methods InEnzymology系列(Academic Press,Inc.),PCR 2:A Practical Approach(M.J.MacPherson,B.D.Hames和G.R.Taylor编著(1995));Harlow和Lane编著(1988)Antibodies,A Laboratory Manual,and Culture of Animal Cells:A Manual of BasicTechnique and Specialized Applications,第6版(R.I.Freshney编著(2010))。
术语“约”或“大约”意指如本领域普通技术人员所确定的特定值在可接受的误差范围内,其部分地取决于该值是如何测量或确定的,即,测量系统的限制。例如,“约”可以是指根据本领域的实践,在1个或大于1个标准差内。或者,“约”可以是指给定值的高达20%、高达10%、高达5%或高达1%的范围。或者,尤其是对于生物系统或过程,该术语可以是指在数值的一个数量级内,优选地在5倍以内,更优选地在2倍以内。在本申请和权利要求书中描述特定值时,除另有说明外,否则术语“约”应该被认为是指在特定值的可接受的误差范围内。
术语“多核苷酸”、“核酸”和“寡核苷酸”是可以互换使用的。它们是指任意长度的核苷酸(脱氧核糖核苷酸或核糖核苷酸)或其类似物的聚合形式。多核苷酸可以具有任意三维结构,并且可以行使任何已知的或未知的功能。以下是多核苷酸的非限制性实例:基因或基因片段的编码或非编码区,通过连锁分析确定的基因座(座位)、外显子、内含子、信使RNA(mRNA)、转运RNA(tRNA)、核糖体RNA(rRNA)、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微小RNA(miRNA)、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、任意序列的分离的DNA、任意序列的分离的RNA、核酸探针和引物。多核苷酸可以包含一个或多个修饰的核苷酸,例如甲基化核苷酸和核苷酸类似物。如果存在,对核苷酸结构的修饰可以在聚合物组装之前或之后赋予。核苷酸序列可以被非核苷酸组分打断。多核苷酸可以在聚合后被进一步修饰,例如,通过与标记组分偶联。
术语“靶多核苷酸”是指具有靶序列的核酸分子起始群体中的核酸分子或多核苷酸,该靶序列的存在、量和/或核苷酸序列或其中一个或多个的改变希望加以确定。靶多核苷酸可以是较大多核苷酸的一部分(例如待扩增、待测序或有待以其他方式分析的部分),或可用于指包含靶序列的较大多核苷酸。通常,术语“靶序列”是指在核酸单链上的核酸序列。靶序列可以是基因的一部分,调节序列,基因组DNA,cDNA,融合基因,包括mRNA、miRNA、rRNA在内的RNA,等等。靶序列可以是来自样品的靶序列或次级靶标如扩增反应的产物。
通常,术语“序列变体”是指序列中相对于一个或多个参考序列的任何变异。一般而言,对于参考序列已知的个体的给定群体,序列变体以比参考序列更低的频率发生。在一些情况下,参考序列为单个已知参考序列,如单个个体的基因组序列。在一些情况下,参考序列是通过对多个已知序列,如作为参考群体的多个个体的基因组序列,或来自相同个体的多核苷酸的多个测序读取进行比对而形成的共有序列。在一些情况下,序列变体在群体中以低频率发生(也称为“罕见”序列变体)。例如,序列变体可以以约为或低于约5%、4%、3%、2%、1.5%、1%、0.75%、0.5%、0.25%、0.1%、0.075%、0.05%、0.04%、0.03%、0.02%、0.01%、0.005%、0.001%或更低的频率发生。在一些情况下,序列变体以约为或低于约0.1%的频率发生。序列变体可以是相对于参考序列的任何变异。序列变异可以由一个核苷酸或多个核苷酸(例如2、3、4、5、6、7、8、9、10个或更多个核苷酸)的变化、插入或缺失组成。当序列变体包含两个或更多个核苷酸差异时,不同的核苷酸可以是彼此相邻近的,或不连续的。序列变体类型的非限制性实例包括单核苷酸多态性(SNP)、缺失/插入多态性(DIP)、拷贝数变体(CNV)、短串联重复(STR)、简单序列重复(SSR)、可变数目串联重复(VNTR)、扩增片段长度多态性(AFLP)、基于反转录转座子的插入多态性、序列特异性扩增多态性和可检测为序列变体的表观遗传标记的差异(例如,甲基化差异)。在一些实施方案中,序列变体可以指染色体重排,包括但不限于易位或融合基因。
如本文所用的,术语“多联体”通常指包含连续多核苷酸的连接产物或扩增产物,该连续多核苷酸含有多个拷贝的靶多核苷酸序列(例如,至少2、3、4、5、6、7、8、9或10个拷贝的靶序列;在一些情况下,至少2个拷贝)。在一些情况下,多联体包含串联连接的多个拷贝的靶多核苷酸序列。在一些情况下,附加的多核苷酸序列散布在多个拷贝的靶多核苷酸序列之间。
如本文所用的,术语“杂交”和“退火”通常是指这样的反应,在该反应中,一个或多个多核苷酸发生反应以形成复合体,该复合体通过在核苷酸残基的碱基之间的氢键键合而得到稳定。该氢键键合可以通过Watson Crick碱基配对、Hoogstein结合或以任意其他序列特异性方式而发生。该复合体可包含形成双链体结构的两条链、形成多链复合体的三条或更多条链、自杂交的单链或其任意组合。杂交反应可以构成更广泛的过程中的步骤,例如PCR的起始,或核酶对多核苷酸的酶切。可以通过与第二序列的核苷酸残基的碱基发生氢键键合而稳定化的第一序列被称为可与第二序列“杂交”。在这种情况下,第二序列也可称为可与第一序列杂交。
如本文所用的,术语“互补体”、“互补”和“互补性”通常是指与给定序列完全互补且可杂交的序列。在一些情况下,如果给定区域上的碱基序列能够与其结合配偶体的碱基序列互补地结合,使得例如形成A-T、A-U、G-C和G-U碱基对,则与该给定核酸杂交的序列被称为给定分子的“互补体”或“反向互补体”。通常,可与第二序列杂交的第一序列与该第二序列特异性或选择性地杂交,使得在杂交反应期间,与第二序列或第二序列组的杂交相对于与非靶序列的杂交是优选的(例如,在给定的一组条件,如本领域常用的严格条件下更加热力学稳定)。一般而言,可杂交序列在其各自的全长或部分长度上具有一定程度的序列互补性,如25%-100%的互补性,包括至少25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%和100%的序列互补性。序列同一性,例如为了评估互补性百分比,可以通过任何合适的比对算法进行测量,包括但不限于Needleman-Wunsch算法(参见,例如,EMBOSS Needle比对器,可从www.ebi.ac.uk/Tools/psa/emboss_needle/nucleotide.html获得,任选地具有默认设置)、BLAST算法(参见,例如,BLAST比对工具,可从blast.ncbi.nlm.nih.gov/Blast.cgi获得,任选地具有默认设置)或者Smith-Waterman算法(参见,例如,EMBOSS Water比对器,可从www.ebi.ac.uk/Tools/psa/emboss_water/nucleotide.html获得,任选地具有默认设置)。最优算法可以使用所选定算法的任意合适的参数(包括默认参数)进行评估。
如本文所用的,术语“延伸产物”通常指这种反应的产物,其中在该反应中,核苷酸引物通过核苷酸的共价添加而延伸。在一些情况下,核苷酸掺入可以由模板引导。在一些情况下,核苷酸掺入可以在没有模板的情况下进行。在一些情况下,延伸产物是诸如来自PCR扩增、滚环扩增(RCA)或等温扩增的扩增产物。
如本文所用的,术语“扩增”通常是指由靶多核苷酸或其部分形成一个或多个拷贝的任意过程。多种扩增多核苷酸(例如DNA和/或RNA)的方法是可用的,本文描述了这些方法的一些实例。扩增可以是线性的,指数式的,或在多阶段扩增过程中涉及线性和指数阶段。扩增方法可包括温度的改变,例如热变性步骤,或者可以是不需要热变性的等温过程。
如本文所用的,术语“茎环产物”和“茎环结构”通常指其中在部分多核苷酸之间发生分子内杂交的多核苷酸二级结构。当单个多核苷酸链的两个区域杂交形成可被称为“茎”的双链部分和可被称为“环”的未配对单链环时,可形成茎环。茎可具有任意可变长度的碱基对,并且沿着茎的碱基配对可以被参与该茎的一个或两个部分上的一个或多个未配对碱基的间隙内部中断。环可以具有任意可变长度的未配对碱基。在一些情况下,环的长度为至少3个碱基。在一些情况下,形成“茎”的两个区域完全互补。在一些情况下,形成“茎”的两个区域部分互补。在一些情况下,单个多核苷酸可包含一个茎环结构。在一些情况下,单个多核苷酸可包含多于一个茎环结构。茎环结构的茎部分可以以没有突出端的双链部分、包含5’突出端的单链部分、包含3’突出端的单链部分,或从5’端和3’端两者延伸的单链部分终止。
本公开内容提供了可用于生成包含两个或更多个拷贝的靶多核苷酸的扩增子的方法和组合物。在一些实施方案中,该方法对检测罕见序列变体和融合基因是有用的。在一些实施方案中,基因融合在没有预先知晓配偶体基因的情况下被检测到,并且可用于诸如在无细胞DNA或基因组DNA样品中筛选基因重排事件。本公开内容的各个方面提供了可以与大规模平行测序方法一起使用的包含两个或更多个拷贝的靶多核苷酸的扩增子。
在一方面,本公开内容提供了提高由滚环扩增生成的具有至少两个拷贝的靶多核苷酸的多联体的比例的方法。该方法包括(a)提供包含靶多核苷酸的环状多核苷酸,(b)使扩增反应混合物经受多个循环的滚环扩增以生成包含多联体的多种扩增产物。该反应混合物可包含(i)具有链置换活性的聚合酶,(ii)包含靶多核苷酸的环状多核苷酸,以及(iii)引物。多个循环的滚环扩增中的每个循环可包含在变性温度下的变性、在退火温度下的引物退火和在延伸温度下持续给定延伸时间段的引物延伸。多个循环的滚环扩增可产生比例增加的具有至少两个拷贝的靶多核苷酸的多联体的多种扩增产物。所生成的多种扩增产物的特征可以在于与通过利用变性和引物退火条件相当但延伸时间段相当于所述多个循环的延伸时间段之和的一个扩增循环生成的多种扩增产物相比,其含有更高比例的具有至少两个拷贝的靶多核苷酸的多联体。
具有链置换活性的聚合酶(例如,具有链置换活性的DNA聚合酶)可以促进滚环扩增。在本方法中有用的多种聚合酶是可用的,其非限制性实例包括Bst DNA聚合酶,大片段;Bsu DNA聚合酶,大片段;Deep VentR TM DNA聚合酶;Deep VentR TM(exo-)DNA聚合酶;Klenow片段(3’-5’exo-);DNA聚合酶I,大片段;M-MuLV逆转录酶;phi29DNA聚合酶;PyroPhage3173聚合酶;
Figure BDA0003622534420000161
DNA聚合酶;以及
Figure BDA0003622534420000162
(exo-)DNA聚合酶。
用于进行滚环扩增的扩增反应混合物可包含用于引物延伸反应的必需试剂,包括但不限于模板(例如,环状多核苷酸)、一种或多种引物、dNTP和缓冲液组分。一个扩增循环可包含(i)在变性温度下的变性,其中双链模板被转化为单链多核苷酸,(ii)在退火温度下的引物退火,其中引物与单链多核苷酸杂交,以及(iii)在延伸温度下持续给定延伸时间段的引物延伸,其中使用单链多核苷酸作为模板延伸与单链多核苷酸杂交的引物。链置换聚合酶在RCA中尤其有用,因为置换允许聚合酶不止一次地围绕环状模板持续进行聚合,从而生成与环状模板互补的序列的多联体串联拷贝。使用环状多核苷酸作为模板,引物延伸可以在该模板上持续,从而生成包含多个拷贝的环状多核苷酸序列(例如,多联体)的扩增产物。在一些实施方案中,通过使扩增反应混合物经受多个循环的滚环扩增来生成多种扩增产物。
在一些实施方案中,所述多个循环包括至少2个循环(例如,至少3、4、5、6、7、8、9或10个循环)。RCA的多个循环可导致多个线性多联体由环状模板形成。在变性期间,终止第一多联体从环状模板的延伸。通过重复引物结合和延伸,可以经多个循环从环状模板生成多个多联体。在一些实施方案中,使用三个温度阶段——用于变性的第一温度阶段、用于引物结合的第二温度阶段和用于引物延伸的第三温度阶段。在一些实施方案中,选择高于引物结合温度的引物延伸温度以使引物延伸期间的引物结合最小化。如在扩增反应混合物中包含反向引物的情况下,在引物延伸期间使引物结合最小化可减少较短扩增产物的形成并减少短片段的偏倚扩增,因为引物不太可能在扩增产物形成时与之杂交。在扩增产物形成时与之杂交的引物也可参与引物延伸,但可能导致小片段的优先扩增,因为在延伸期间,小环倾向于在给定时间段内比大片段生成更多拷贝的重复单元和更多引物结合位点。在一些实施方案中,选择用于引物延伸的温度可以比选择用于引物退火的温度高至少5℃(例如,至少6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃或更多)。选择用于引物延伸的温度可以比选择用于引物退火的温度高约1℃至20℃(例如,约2℃至18℃、约4℃至15℃或约5℃至10℃)。适用于非等温RCA的温度范围可取决于所用的聚合酶的性质。
所述多个循环中的每个循环可包含在至少约70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃、80℃、81℃、82℃、83℃、84℃、85℃、86℃、87℃、88℃、89℃、90℃、91℃、92℃、93℃、94℃或95℃的变性温度下的变性。所述多个循环中的每个循环可包含在约70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃、80℃、81℃、82℃、83℃、84℃、85℃、86℃、87℃、88℃、89℃、90℃、91℃、92℃、93℃、94℃或95℃的变性温度下的变性。所述多个循环中的每个循环可包含在至多约70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃、80℃、81℃、82℃、83℃、84℃、85℃、86℃、87℃、88℃、89℃、90℃、91℃、92℃、93℃、94℃或95℃的变性温度下的变性。所述多个循环中的每个循环可包含在约70℃至约100℃、约70℃至约95℃、约70℃至约90℃、约70℃至约85℃、约70℃至约80℃或约70℃至约75℃的变性温度下的变性。所述多个循环中的每个循环可包含在约70℃至约100℃、约75℃至约100℃、约80℃至约100℃、约85℃至约100℃、约90℃至约100℃或约95℃至约100℃的变性温度下的变性。所述多个循环中的每个循环可包含在变性温度下持续至少约5秒、10秒、15秒、20秒、25秒、30秒、35秒、40秒、45秒、50秒、55秒或60秒的变性。所述多个循环中的每个循环可包含在变性温度下持续约5秒、10秒、15秒、20秒、25秒、30秒、35秒、40秒、45秒、50秒、55秒或60秒的变性。所述多个循环中的每个循环可包含在变性温度下持续至多约5秒、10秒、15秒、20秒、25秒、30秒、35秒、40秒、45秒、50秒、55秒或60秒的变性。所述多个循环中的每个循环可包含在变性温度下持续约5秒至60秒、5秒至55秒、5秒至50秒、5秒至45秒、5秒至40秒、5秒至35秒、5秒至30秒、5秒至25秒、5秒至20秒、5秒至15秒或5秒至10秒的变性。所述多个循环中的每个循环可包含在变性温度下持续约5秒至60秒、10秒至60秒、15秒至60秒、20秒至60秒、25秒至60秒、30秒至60秒、35秒至60秒、40秒至60秒、45秒至60秒、50秒至60秒或55秒至60秒的变性。
所述多个循环中的每个循环可包含在至少约45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃或65℃的退火温度下的引物退火。所述多个循环中的每个循环可包含在约45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃或65℃的退火温度下的引物退火。所述多个循环中的每个循环可包含在至多约45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃或65℃的退火温度下的引物退火。所述多个循环中的每个循环可包含在约45℃至约65℃、约45℃至约60℃、约45℃至约55℃或约45℃至约50℃的退火温度下的引物退火。所述多个循环中的每个循环可包含在约45℃至约65℃、约50℃至约65℃、约55℃至约65℃或约60℃至约65℃的退火温度下的引物退火。所述多个循环中的每个循环可包含在退火温度下持续至少约5秒、10秒、15秒、20秒、25秒、30秒、35秒、40秒、45秒、50秒、55秒或60秒的引物退火。所述多个循环中的每个循环可包含在退火温度下持续约5秒、10秒、15秒、20秒、25秒、30秒、35秒、40秒、45秒、50秒、55秒或60秒的引物退火。多个循环中的每个循环可包含在退火温度下持续至多约5秒、10秒、15秒、20秒、25秒、30秒、35秒、40秒、45秒、50秒、55秒或60秒的引物退火。所述多个循环中的每个循环可包含在退火温度下持续约5秒至60秒、5秒至55秒、5秒至50秒、5秒至45秒、5秒至40秒、5秒至35秒、5秒至30秒、5秒至25秒、5秒至20秒、5秒至15秒或5秒至10秒。所述多个循环中的每个循环可包含在退火温度下持续约5秒至60秒、10秒至60秒、15秒至60秒、20秒至60秒、25秒至60秒、30秒至60秒、35秒至60秒、40秒至60秒、45秒至60秒、50秒至60秒或55秒至60秒的引物退火。
所述多个循环中的每个循环可包含在至少约65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃或75℃的延伸温度下的引物延伸。多个循环中的每个循环可包含在约65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃或75℃的延伸温度下的引物延伸。所述多个循环中的每个循环可包含在至多约65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃或75℃的延伸温度下的引物延伸。所述多个循环中的每个循环可包含在约65℃至约75℃或约65℃至约70℃的延伸温度下的引物延伸。所述多个循环中的每个循环可包含在约65℃至约75℃或约70℃至约75℃的延伸温度下的引物延伸。所述多个循环中的每个循环可包含在延伸温度下持续至少约30秒、1分钟、2分钟、3分钟、4分钟、5分钟、6分钟、7分钟、8分钟、9分钟或10分钟的延伸时间段的引物延伸。所述多个循环中的每个循环可包含在延伸温度下持续约30秒、1分钟、2分钟、3分钟、4分钟、5分钟、6分钟、7分钟、8分钟、9分钟或10分钟的延伸时间段的引物延伸。所述多个循环中的每个循环可包含在延伸温度下持续至多约30秒、1分钟、2分钟、3分钟、4分钟、5分钟、6分钟、7分钟、8分钟、9分钟或10分钟的延伸时间段的引物延伸。所述多个循环中的每个循环可包含在延伸温度下持续约30秒至10分钟、30秒至9分钟、30秒至8分钟、30秒至7分钟、30秒至6分钟、30秒至5分钟、30秒至4分钟、30秒至3分钟、30秒至2分钟或30秒至1分钟的延伸时间段的引物延伸。所述多个循环中的每个循环可包含在延伸温度下持续约30秒至10分钟、1分钟至10分钟、2分钟至10分钟、3分钟至10分钟、4分钟至10分钟、5分钟至10分钟、6分钟至10分钟、7分钟至10分钟、8分钟至10分钟或9分钟至10分钟的延伸时间段的引物延伸。可以选择延伸时间段的长度来优化扩增产物产率。选择延伸时间段时所考虑的一些因素包括但不限于环状多核苷酸(例如,环状模板)的大小、环状多核苷酸序列的GC含量以及扩增产物中二级结构的形成。例如,对于产生相似产量的扩增产物,与较短环状多核苷酸相比,较长环状多核苷酸可能使用更长的延伸时间。对于进一步的实例,对于产生相似产量的扩增产物,与具有较低GC含量但长度相当的环状多核苷酸相比,具有较高GC含量的环状多核苷酸可能使用更长的延伸时间。
在一些实施方案中,所述多个循环中的每个循环包含(i)在约75℃至约95℃的变性温度下持续约5秒至约60秒的变性,(ii)在约45℃至约65℃的退火温度下持续约5秒至约60秒的引物退火,以及(iii)在约65℃至约75℃的延伸温度下持续约30秒至约10分钟的延伸时间段的引物延伸。在一些实施方案中,所述多个循环中的每个循环包含(i)在约80℃的变性温度下持续约15秒至约30秒的变性,(ii)在约50℃的退火温度下持续约15秒至约45秒的引物退火,以及(iii)在约70℃的延伸温度下续约3分钟至约10分钟的延伸时间段的引物延伸。在一些实施方案中,所述多个循环中的每个循环包含(i)在约80℃的变性温度下持续约20秒的变性,(ii)在约50℃的退火温度下持续约30秒的引物退火,以及(iii)在约70℃的延伸温度下持续约6分钟的延伸时间段的引物延伸。
在一些实施方案中,在所述多个循环的滚环扩增中的任意循环处为反应混合物补充聚合酶。在一些实施方案中,在所述多个循环的滚环扩增中的至少两个循环处为反应混合物补充聚合酶。在一些情况下,由于聚合酶活性的热失活,可能需要补充扩增反应混合物。一些聚合酶在升高的温度下热失活。热失活的温度可取决于所使用的聚合酶。根据选择用于扩增的聚合酶和针对变性温度、引物退火温度和引物延伸温度中的任一个所选择的温度,可任选地在至少一个扩增循环之后补充聚合酶。在一些实施方案中,在每隔一个循环之后,为反应混合物补充聚合酶。在各种实施方案中,例如由扩增产物的产率所决定的,根据需要为反应混合物补充聚合酶。
在一些实施方案中,使用本文公开的方法生成的多种扩增产物的特征在于与利用变性和引物退火条件相当但延伸时间段相当于所述多个循环的延伸时间段之和的一个扩增循环生成的多种扩增产物相比,其含有更高比例的具有至少两个拷贝(例如,至少三个、四个或五个拷贝)的靶多核苷酸的多联体。
相对于具有较少拷贝靶多核苷酸的扩增产物,具有较多拷贝靶多核苷酸的多联体或扩增产物可具有更大的片段大小。确定扩增产物或多联体中靶多核苷酸的拷贝数可使用多种方法来进行,例如通过琼脂糖凝胶、大小排阻色谱法或下一代测序进行分析。如使用任何合适的方法(例如,琼脂糖凝胶、大小排阻色谱法或下一代测序)所确定的,与包含一个循环的滚环扩增相比,使用如本文公开的包含多个循环滚环扩增的方法所生成的多联体或扩增产物可具有比例增加的具有至少两个拷贝的靶多核苷酸的多联体。在一些实施方案中,具有至少两个拷贝的靶多核苷酸的多联体的比例增加至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、25%或50%。
在一些实施方案中,所述多种扩增产物展现出至少约100、110、120、130、140、150、160、170、180、190、200、210、220、230、240或250个碱基对的平均片段长度。在一些实施方案中,所述多种扩增产物展现出约100、110、120、130、140、150、160、170、180、190、200、210、220、230、240或250个碱基对的平均片段长度。在一些实施方案中,所述多种扩增产物展现出至多约100、110、120、130、140、150、160、170、180、190、200、210、220、230、240或250个碱基对的平均片段长度。在一些实施方案中,所述多种扩增产物展现出约150个碱基对的平均片段长度。在一些实施方案中,所述多种扩增产物展现出约160个碱基对的平均片段长度。在一些实施方案中,所述多种扩增产物展现出约170个碱基对的平均片段长度。在一些实施方案中,所述多种扩增产物展现出约180个碱基对的平均片段长度。在一些实施方案中,所述多种扩增产物展现出约190个碱基对的平均片段长度。在一些实施方案中,所述多种扩增产物展现出约200个碱基对的平均片段长度。
在一些实施方案中,所述多种扩增产物展现出至少约100、110、120、130、140、150、160、170、180、190、200、210、220、230、240或250个碱基对的中值片段长度。在一些实施方案中,所述多种扩增产物展现出约100、110、120、130、140、150、160、170、180、190、200、210、220、230、240或250个碱基对的中值片段长度。在一些实施方案中,所述多种扩增产物展现出至多约100、110、120、130、140、150、160、170、180、190、200、210、220、230、240或250个碱基对的中值片段长度。在一些实施方案中,所述多种扩增产物展现出约150个碱基对的中值片段长度。在一些实施方案中,所述多种扩增产物展现出约160个碱基对的中值片段长度。在一些实施方案中,所述多种扩增产物展现出约170个碱基对的中值片段长度。在一些实施方案中,所述多种扩增产物展现出约180个碱基对的中值片段长度。在一些实施方案中,所述多种扩增产物展现出约190个碱基对的中值片段长度。在一些实施方案中,所述多种扩增产物展现出约200个碱基对的中值片段长度。
在一些实施方案中,期望分析无细胞多核苷酸,例如无细胞DNA。如本文其他各处进一步描述的无细胞DNA(cfDNA)可以是循环肿瘤DNA或循环胎儿DNA。在一些情况下,无细胞多核苷酸可包括无细胞RNA。例如,无细胞DNA可通过使用诸如连接酶等酶的连接而环化并经由本方法来扩增。在一些实施方案中,当反应混合物中所使用的环状多核苷酸包含cfDNA时,所述多种扩增产物展现出约40个碱基至约450个碱基、40个碱基至约400个碱基、40个碱基至约350个碱基、40个碱基至约300个碱基、40个碱基至约250个碱基、40个碱基至约200个碱基、40个碱基至约150个碱基、40个碱基至约100个碱基或40个碱基至约50个碱基的片段长度分布。在一些实施方案中,当反应混合物中所使用的环状多核苷酸包含cfDNA时,所述多种扩增产物展现出约40个碱基至约450个碱基、50个碱基至约450个碱基、100个碱基至约450个碱基、150个碱基至约450个碱基、200个碱基至约450个碱基、250个碱基至约450个碱基、300个碱基至约450个碱基、350个碱基至约450个碱基或400个碱基至约450个碱基的片段长度分布。在一些实施方案中,当反应混合物中所使用的环状多核苷酸包含cfDNA时,所述多种扩增产物展现出约100个碱基至约200个碱基、110个碱基至约200个碱基、120个碱基至约200个碱基、130个碱基至约200个碱基、140个碱基至约200个碱基、150个碱基至约200个碱基、160个碱基至约200个碱基、170个碱基至约200个碱基、180个碱基至约200个碱基或190个碱基至约200个碱基的片段长度分布。在一些实施方案中,当反应混合物中所使用的环状多核苷酸包含cfDNA时,所述多种扩增产物展现出约100个碱基至约200个碱基、100个碱基至约190个碱基、100个碱基至约180个碱基、100个碱基至约170个碱基、100个碱基至约160个碱基、100个碱基至约150个碱基、100个碱基至约140个碱基、100个碱基至约130个碱基、100个碱基至约120个碱基或100个碱基至约110个碱基的片段长度分布。
在一些实施方案中,扩增反应混合物中的引物包含随机序列。在一些实施方案中,扩增反应混合物中的引物包含基因特异性序列。在一些实施方案中,引物包含针对多个基因(例如,至少2、3、4、5、6、7、8、9或10个基因)的基因特异性序列。在一些实施方案中,所述引物包括第一引物,该第一引物包含(i)通过序列互补性与环状多核苷酸特异性杂交的第一3’端和(ii)不通过序列互补性与靶多核苷酸特异性杂交的包含第一共同序列的第一5’端。包含单链多核苷酸的多联体可在多个循环的滚环扩增期间通过使用环状多核苷酸作为模板延伸第一引物而生成。所述引物可包括第二引物,该第二引物包含(i)通过序列互补性与包含单链多核苷酸的多联体特异性杂交的第二3’端和(ii)不通过序列互补性与多联体特异性杂交的包含第二共同序列的第二5’端。包含一个或多个拷贝的靶多核苷酸的多种延伸产物可在多个循环的滚环扩增期间通过使用多联体作为模板延伸第二引物而生成。如本文进一步描述的,使用这样的第一引物和第二引物进行扩增的方法可用于富集包含至少两个或更多个拷贝的靶多核苷酸的多联体的扩增子。
在一方面,本公开内容提供了一种用于富集包含至少两个或更多个拷贝的靶多核苷酸的多联体的扩增子的方法。在一个实施方案中,该方法包括(a)通过延伸第一引物生成包含来自环状靶多核苷酸的单链多核苷酸的多联体,该第一引物包含通过序列互补性与靶多核苷酸特异性杂交的第一3’端和不通过序列互补性与靶多核苷酸特异性杂交的包含第一共同序列的第一5’端,(b)通过延伸第二引物生成包含一个或多个拷贝的靶多核苷酸的多种延伸产物,该第二引物包含通过序列互补性与多联体特异性杂交的第二3’端和不通过序列互补性与多联体特异性杂交的包含第二共同序列的第二5’端,其中第一共同序列和第二共同序列各自在5’端包含至少10个连续核苷酸并且当最佳比对时至少90%相同,以及(c)在生成多个扩增子的条件下对步骤(b)的多种延伸产物进行扩增,其中富集包含至少2个或更多个拷贝的靶多核苷酸的扩增子。
在一些实施方案中,从环状靶多核苷酸生成包含单链多核苷酸的多联体包括第一引物的延伸。引物延伸可以通过包括但不限于热循环反应和等温反应的扩增反应完成。在一些实施方案中,热循环反应涉及例如变性、引物结合和引物延伸的若干个循环。在一些实施方案中,生成本方法的多联体通过聚合酶而实现。在本方法中有用的各种聚合酶是可用的,其非限制性实例在本文中提供。在一些实施方案中,用于实现多联体生成的聚合酶具有链置换活性。在一些实施方案中,从环状靶多核苷酸生成包含单链多核苷酸的多联体包括等温滚环扩增(RCA)。链置换聚合酶在RCA中尤其有用,因为置换允许聚合酶不止一次地围绕环状模板持续进行聚合,从而生成与环状模板互补的序列的多联体串联拷贝。在一些实施方案中,生成包含单链多核苷酸的多联体包括非等温RCA。非等温RCA可包括至少2个温度阶段(例如,至少2、3、4个或更多个温度阶段)的至少两个循环(例如,至少2、3、4、5、6、7、8、9、10个或更多个循环)。例如,第一温度阶段可适用于引物结合和延伸,而第二温度阶段可适用于使双链多核苷酸变性。在一些实施方案中,非等温RCA包括至少两个温度阶段的2至35个循环(例如,3至30个、4至20个、5至15个或6至10个循环)。在非等温RCA期间循环通过包括适用于使双链多核苷酸变性的第二温度阶段在内的温度阶段可导致由环状模板形成多个线性多联体。在变性期间,终止第一多联体从环状模板的延伸。通过重复引物结合和延伸,可以经若干个循环从环状模板生成多个多联体。在一些实施方案中,使用三个温度阶段-用于引物退火的第一温度阶段、用于引物延伸的第二温度阶段和用于使双链多核苷酸变性的第三温度阶段。在一些实施方案中,选择高于引物结合温度的引物延伸温度以使引物延伸期间的引物结合最小化。如在扩增反应混合物中包含反向引物的情况下,在引物延伸期间使引物结合最小化可减少较短扩增产物的形成并减少短片段的偏倚扩增,因为引物不太可能在扩增产物形成时与之杂交。在扩增产物形成时与之杂交的引物也可参与引物延伸,但可能导致小片段优先扩增,因为在延伸期间,小环倾向于在给定时间段内比大片段生成更多拷贝的重复单元和更多引物结合位点。在一些实施方案中,选择用于引物延伸的温度可比选择用于引物退火的温度高至少5℃(例如,至少6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃或更多)。选择用于引物延伸的温度可比选择用于引物退火的温度高约1℃至20℃(例如,约2℃至18℃、约4℃至15℃或约5℃至10℃)。在一些实施方案中,非等温RCA可包含第四温度阶段。第四温度阶段可例如适合于在延伸产物中形成二级结构,例如形成茎环结构。适合于非等温RCA的温度范围可取决于所使用的聚合酶的性质。
在一些实施方案中,RCA(等温或非等温)可包含沿线性模板的引物延伸反应,如沿着由沿环状模板引物延伸产生的线性多联体的反向引物延伸。例如,第二引物可与包含作为第一引物的延伸产物而生成的线性多联体模板的模板杂交,并且在引物延伸阶段第二引物的引物延伸可生成线性双链多核苷酸,该线性双链多核苷酸的链可进一步作为通过附加拷贝的第一和第二引物进行延伸的模板。
在一些实施方案中,生成包含一个或多个拷贝的靶多核苷酸的多种延伸产物包括延伸与作为第一引物的延伸产物而产生的线性多联体模板杂交的第二引物。在一些实施方案中,在非等温RCA期间,多种延伸引物的生成可与线性多联体从环状模板的的生成同时进行。引物延伸和扩增的方法通常有利于短片段扩增,而不是长片段扩增。根据一些实施方案,可优化生成延伸产物的引物延伸反应以减少有利于较短产物的偏倚,并由此增加较长产物(如包含两个或更多个拷贝的靶多核苷酸的产物)的比例。本公开内容考虑了实现该目的的各种方式,其可以单独使用或组合使用。实现该目的的一种方式是通过限制引物延伸循环的数目,使得短片段不被优先扩增,或与长度相同但缺乏发夹结构的模板相比以减少的频率扩增。在一些实施方案中,生成延伸产物包括不超过15个循环(例如,不超过10、8、6个或更少的循环)的第二引物延伸。在一些实施方案中,生成延伸产物包括2至15个循环的第二引物延伸。在一些实施方案中,生成延伸产物包括2至10个循环的第二引物延伸。在一些实施方案中,第二引物的延伸与第一引物的延伸同时发生。
在一些实施方案中,本文中与环状多核苷酸可互换使用的可用于生成多联体的环状靶多核苷酸由线性靶多核苷酸形成。在一些实施方案中,环状靶多核苷酸或环状多核苷酸为单链。在一些实施方案中,环状靶多核苷酸或环状多核苷酸为双链。环状靶多核苷酸或环状多核苷酸可以具有任意长度。在一些实施方案中,环状靶多核苷酸或环状多核苷酸的长度为约25、50、75、100、150、200、250、300、400、500、600、700或800个核苷酸。在一些实施方案中,环状靶多核苷酸或环状多核苷酸的长度为25-1000个核苷酸。在一些实施方案中,环状靶多核苷酸或环状多核苷酸的长度为50-500个核苷酸。在一些实施方案中,环状靶多核苷酸或环状多核苷酸的长度为75-250个核苷酸。在一些实施方案中,环状靶多核苷酸或环状多核苷酸的长度为100-200个核苷酸。环状靶多核苷酸或环状多核苷酸可包含染色体或基因片段。在一些实施方案中,环状靶多核苷酸或环状多核苷酸包含基因产物,包括但不限于miRNA、rRNA、tRNA和mRNA。在一些实施方案中,环状靶多核苷酸或环状多核苷酸包含由点突变、SNP、插入或缺失产生的序列。在一些实施方案中,环状靶多核苷酸或环状多核苷酸包含由染色体重排产生的序列。染色体重排可以是一个或多个倒位;一个或多个缺失;一个或多个重复;一个或多个易位;或其组合。在一些实施方案中,包含一个或多个易位的环状靶多核苷酸或环状多核苷酸包含融合基因的融合点或融合接头。在一些实施方案中,环状靶多核苷酸或环状多核苷酸包含倒位、缺失、重复和易位中的至少一种。
在一种或多种本方法中用于生成多联体的第一引物可包含通过序列互补性与靶多核苷酸特异性杂交的第一3’端和不通过序列互补性与靶多核苷酸特异性杂交的包含第一共同序列的第一5’端。第一引物可以是任意合适的长度,如至少5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90或100个核苷酸,其任何部分均可与引物所杂交的相应靶序列互补(例如,至少5、10、15、20、25、30、35、40、45或50个核苷酸)。通过序列互补性与靶序列特异性杂交的第一引物的第一3’端可以是任意合适的长度,如至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90或95个核苷酸长。在一些实施方案中,第一引物包含含有随机核苷酸序列的第一3’端,该随机核苷酸序列随机杂交并引发环状靶多核苷酸或环状多核苷酸的各个随机区域以供引物延伸,每个随机序列均通过序列互补性与相应互补序列特异性杂交。当引物包含随机3’端序列时,靶序列是通过引物延伸而扩增的序列。一般而言,3’端包含3’末端核苷酸。第一5’端(具有第一引物的第一共同序列且不通过序列互补性与靶多核苷酸特异性杂交)可以是任意合适的长度,如至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90或95个核苷酸长。第一共同序列可以是任意合适的长度。在一些实施方案中,第一引物的第一共同序列为至少10个核苷酸长(例如,至少15、20、25、30个或更多个核苷酸长)。通常,5’端是指相对于3’端处于5’的多核苷酸部分。在一些实施方案中,5’端包含5’末端核苷酸。
包含通过序列互补性与多联体特异性杂交的第二3’端和不通过序列互补性与多联体特异性杂交的包含第二共同序列的第二5’端的第二引物可用于通过引物延伸生成包含一个或多个拷贝的靶多核苷酸的多种延伸产物。用于生成多种延伸产物的第二引物可以具有任意合适的长度,如约为或至少为5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90或100个核苷酸,其任何部分均可与引物所杂交的相应靶序列互补(例如,至少5、10、15、20、25、30、35、40、45、50个核苷酸)。通过序列互补性与多联体特异性杂交的第二引物的第二3’端可以是任意合适的长度,如至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90或95个核苷酸长。在一些实施方案中,第二引物包含含有随机核苷酸序列的第二3’端,该随机核苷酸序列随机杂交并引发多联体的各个随机区域以供引物延伸。不通过序列互补性与多联体特异性杂交的、包含第二引物的第二共同序列的第二5’端可以是任意合适的长度,如至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90或95个核苷酸长。第二共同序列可以是任意合适的长度。在一些实施方案中,第二引物的第二共同序列的长度为至少10个核苷酸(例如,至少15、20、25、30个或更多个核苷酸长)。通常,5’端是指相对于3’端在5’的多核苷酸部分。在一些实施方案中,5’端包含5’末端核苷酸。在一些实施方案中,第二共同序列与第一共同序列至少80%相同(例如,至少90%、95%或100%相同),使得第二共同序列可在合适的反应条件(例如,扩增反应中的一个或多个步骤,如引物杂交步骤和/或引物延伸步骤)下与第一共同序列的互补体杂交。在一些实施方案中,第一共同序列和第二共同序列是相同的。
通常,不与靶标特异性杂交的共同序列被设计成在3’端与靶多核苷酸杂交的条件(例如,扩增反应中的一个或多个步骤)下不与靶多核苷酸杂交。在一些实施方案中,共同序列被设计成与沿着靶多核苷酸在相对于3’端杂交处的3’的序列、靶多核苷酸内任意处的序列,或样品(例如,生物体如细菌、病毒、植物或动物的所有基因组序列,包括人类基因组DNA序列)中的多核苷酸的任意基团具有小于75%、50%、25%、10%或更低的互补性。在某些实施方案中,第一共同序列和第二共同序列各自在5’端包含至少10个(例如,至少15、20、25、30、40、50个或更多个)连续核苷酸,并且当最佳比对时至少90%相同。在某些实施方案中,第一共同序列和第二共同序列在5’端包含至少5、10、15、20、25或30个连续核苷酸,并且当最佳比对时至少70%相同(例如,至少80%、90%、95%或100%相同)。
在一些实施方案中,本方法的延伸产物形成茎环结构,该茎环结构包含(i)第一共同序列与第二共同序列的互补体之间的分子内杂交,和/或(ii)第二共同序列与第一共同序列的互补体之间的分子内杂交。延伸产物可在非等温RCA期间,例如在具有适于形成茎环结构的温度的第四温度阶段期间形成茎环结构。在一些实施方案中,茎环结构在RCA之后的后续扩增反应期间形成。茎环结构的形成可取决于双链茎区和单链环区的稳定性。茎的稳定性可取决于其长度、错配数目和碱基组成。茎环结构的稳定性还取决于环长度。没有二级结构的大环可能不稳定,并且短于三个碱基长的环可能在空间上是不可能的。在一些实施方案中,具有较长茎部分的茎环结构可比具有相同环和较短茎的茎环结构更稳定。在一些情况下,具有较长环的茎环结构可能不如具有相同茎和较短环的茎环结构稳定。
生成多联体的方法的说明性实施方案示于图1中。通过滚环扩增(RCA)延伸第一引物,该第一引物包含通过序列互补性与靶多核苷酸特异性杂交的第一3’端和不通过序列互补性与靶多核苷酸特异性杂交的包含第一共同序列5’-TACGCA-3’的第一5’端。接下来,生成包含一个或多个拷贝的靶多核苷酸的多种延伸产物包括延伸第二引物,该第二引物包含通过序列互补性与多联体特异性杂交的第二3’端和不通过序列互补性与多联体特异性杂交的包含第二共同序列5’-TACGCA-3’(与第一共同序列相同)的第二5’端。由于第二共同序列与第一共同序列的互补体之间的分子内杂交,延伸产物可形成茎环结构。茎环结构可包含可变拷贝数的靶多核苷酸。碱基对中茎的长度可以变化。在一些实施方案中,茎的长度为至少6、9、15、20、25、30个或更多个碱基对。在一些实施方案中,该茎环结构包含5至30个碱基对的分子内杂交。在一些实施方案中,该茎环结构包含10至20个碱基对的分子内杂交。表1中提供了可用作第一或第二共同序列的序列的非限制性实例。
表1.候选共同序列的非限制性实例
Figure BDA0003622534420000301
Figure BDA0003622534420000311
参与分子内杂交的碱基对的数目可取决于第一共同序列和第二共同序列的连续核苷酸的数目或第二共同序列与第一共同序列的互补体的连续核苷酸的数目。参与分子内杂交的碱基对的数目还可取决于第一共同序列与第二共同序列的同一性百分比,其中同一性百分比是指当第一共同序列和第二共同序列最佳比对时第一共同序列与第二共同序列之间相同碱基的百分比。在一些实施方案中,第一共同序列和第二共同序列各自在5’端包含至少10个连续核苷酸,并且当最佳比对时至少90%相同。在一些实施方案中,第一共同序列和第二共同序列各自在5’端包含至少5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45或50个连续核苷酸。在一些实施方案中,第一共同序列和第二共同序列各自在5’端包含5至25个连续核苷酸。在一些实施方案中,当最佳比对时,第一共同序列和第二共同序列至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同。在一些实施方案中,当最佳比对时,第一共同序列和第二共同序列60%至100%相同。在一些实施方案中,第一共同序列和第二共同序列在5’端包含5至25个连续核苷酸,并且当最佳比对时60%至100%相同。
对第一引物和第二引物的多种延伸产物进行扩增可包括第三引物的引物延伸。在一些实施方案中,第三引物包含通过序列互补性与第一共同序列和/或第二共同序列特异性杂交的序列。用于核酸扩增的第三引物可以具有任意合适的长度,如至少5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90或100个核苷酸,其任何部分或全部可与相应靶序列互补(例如,约5、10、15、20、25、30、35、40、45、50个核苷酸或更多)。第三引物可包含区段,该区段包含一个或多个扩增引物退火序列或其互补体;一个或多个测序引物退火序列或其互补体;一个或多个条形码序列;一个或多个在多种不同引物之间共有的共同序列;一个或多个限制酶识别位点;一个或多个探针结合位点或测序衔接子(例如,用于附接至测序平台,如用于大规模平行测序的流动池);一个或多个随机或接近随机的序列(例如,从在一个或多个位置处的一组两个或更多个不同核苷酸中随机选择的一个或多个核苷酸);以及它们的组合。扩增引物退火序列也可用作测序引物退火序列。
根据茎环结构的稳定性,该茎环结构可以以可变的效率扩增。通常,在包含相同长度的茎和可变长度的环的多个茎环结构中,包含较长环的茎环结构热力学较不稳定,作为模板更容易接近,因此可以更有效地被扩增。因此,在一些实施方案中,对两侧是可杂交的共同序列的靶序列的扩增富集了包含至少2个或更多个拷贝的靶序列的扩增子。由第三引物的引物延伸产生的扩增子可包含可变拷贝数的靶多核苷酸。在一些实施方案中,具有两个或更多个拷贝的靶多核苷酸的扩增子的百分比至少为50%(例如,至少60%、70%、80%、90%或更大)。在一些实施方案中,具有两个或更多个拷贝的靶多核苷酸的扩增子的百分比为10%-100%(例如,20%-90%、30%-80%或40%-60%)。
在实施本方法时,茎环产物的形成和包含至少2个或更多个拷贝的靶多核苷酸的扩增子的富集可通过指定第一共同序列、第二共同序列和第三引物序列的杂交序列的解链温度以及调节进行扩增的温度中的一项或多项来优化。对于其中引物延伸产物的扩增包含与第一共同序列和/或第二共同序列特异性杂交的第三引物的引物延伸的实施方案,第三引物的引物结合效率可取决于第一共同序列、第二共同序列和第三引物的杂交序列的解链温度中的一个或多个。在一些实施方案中,第一共同序列、第二共同序列和第三引物的杂交序列均具有在彼此±15℃(例如,±10℃、±5℃或±1℃)内的解链温度(Tm)。在一些实施方案中,第一共同序列、第二共同序列和第三引物的杂交序列均具有在彼此±5℃内的解链温度(Tm)。一般而言,Tm通常代表50%的由参考序列(其实际上可能是较大多核苷酸内的子序列)及其互补序列组成的寡核苷酸杂交(或分离)时的温度。Tm可基于本领域可用的标准计算、算法或测量。用于测量Tm的示例性工具OligoAnalyzer由Integrated DNATechnologies使得在www.idtdna.com/calc/analyzer下可用,该工具可设置为使用默认参数。其他类似的工具是可用的。
进行扩增的温度也可影响长茎环产物和短茎环产物的引物结合和延伸的效率。在某些实施方案中,茎环结构的形成可通过在退火步骤的温度保持在第三引物的解链温度±15℃内(例如,±10℃、±5℃或±1℃内)的情况下进行(c)的扩增步骤而实现。在一些实施方案中,茎环产物的形成通过在退火步骤保持在低于75℃(例如,低于70℃、65℃、60℃或更低)的温度的情况下进行(c)的扩增步骤而实现。在一些实施方案中,茎环产物的形成通过在退火步骤保持在55℃-75℃(例如,60℃-70℃)的温度的情况下进行(c)的扩增步骤而实现。
在一些实施方案中,所述环状靶多核苷酸或环状多核苷酸为环化的无细胞多核苷酸(例如,无细胞DNA、cDNA或RNA)。在一些实施方案中,所述环状靶多核苷酸或环状多核苷酸为基因组DNA的环化片段。在一些实施方案中,所述环状靶多核苷酸或环状多核苷酸包含由染色体重排产生的序列。在某些实施方案中,该染色体重排是缺失、重复、倒位和易位中的至少一种。在一些实施方案中,本方法的环状靶多核苷酸或环状多核苷酸为单链。在一些实施方案中,本方法的环状靶多核苷酸或环状多核苷酸为双链。在某些实施方案中,沿靶多核苷酸从5’至3’对应于(i)与第一3’端互补的序列、(ii)与第二3’端相同的序列以及(iii)(i)与(ii)之间的间插序列的靶多核苷酸序列部分的组合长度为75个或更少的核苷酸。在一些实施方案中,序列部分的组合长度为60个或更少的核苷酸。在一些实施方案中,序列部分的组合长度为50个或更少的核苷酸。在一些实施方案中,序列部分的组合长度为40个或更少的核苷酸。在一些情况下,序列部分的组合长度为30个或更少的核苷酸。
在一个说明性实施方案中,第一引物和第二引物如图2所示排列。简单起见,第一和第二引物的相对杂交位置相对于靶多核苷酸的单链进行说明。然而,如下所述,一个引物与包含靶序列的链杂交,而另一引物与包含靶序列的互补体的链杂交。第一引物即正向引物(F引物)的第一3’端通过序列互补性与靶多核苷酸特异性杂交,而第一5’端未与靶多核苷酸特异性杂交。第二引物即反向引物(R引物)的第二3’端通过序列互补性与靶多核苷酸的互补体特异性杂交,而第二5’端未与靶多核苷酸的互补体特异性杂交。鉴于正向引物(F引物)和反向引物(R引物)相对于靶序列单体的取向,这种排列可被称为“背靠背”(B2B)或“倒置”引物。与传统的头对头设计相比,这种引物设计具有减少的引物足迹(一对引物所跨越的总距离)。在图2中,沿靶多核苷酸从5’至3’对应于(i)与第一3’端互补的序列、(ii)与第二3’端相同的序列以及(i)与(ii)之间的间插序列的靶多核苷酸序列部分的组合长度为约30-100个核苷酸(例如,40-80或50-70个核苷酸)。该组合长度也被称为“引物足迹”。在一些实施方案中,引物足迹的长度小于100个核苷酸(例如,长度小于90、80、70、60、50个或更少的核苷酸)。在一些实施方案中,可使用具有背靠背排列的第一引物和第二引物扩增包含点突变、indel(插入/缺失)或基因融合的环状靶多核苷酸或环状多核苷酸。这种引物对减小的引物足迹允许对围绕靶序列的各种片段化事件进行扩增,因为在B2B引物之间发生接合(例如,融合接合)的可能性小于在典型扩增反应(彼此面对,跨越靶序列)中发现的引物排列中发生该接合的可能性。
在一个说明性实施方案中,如图3所示构建测序文库。线性DNA分子首先被环化形成RCA的模板。在5’端具有常规测序衔接子的背靠背引物与靶分子结合,而具有链置换活性的聚合酶在RCA期间扩增该靶标。可以将该文库测序,或在测序以检测序列变体(例如点突变、SNP和融合基因)之前通过PCR扩增将该文库进一步扩增。
在一些实施方案中,可从样品中的多种靶多核苷酸生成多个多联体。样品可包含一种或多种靶序列。每种靶序列可具有一个或多个相应多联体。对应于独特靶多核苷酸的每个多联体可包含可变拷贝数的靶多核苷酸。在一些实施方案中,可以优化本方法以生成可变长度的多联体。多联体长度的可变性可由靶多核苷酸长度和/或每个多联体中靶多核苷酸的拷贝数的变化而导致。在一些实施方案中,至少50%(例如,至少60%、70%、80%、90%或更多)的多联体包含长度为至少75个核苷酸(例如,长度为至少100、150、200个或更多个核苷酸)的靶多核苷酸。在一些实施方案中,至少80%的多联体包含长度为至少75个核苷酸的靶多核苷酸。在一些实施方案中,至少60%的多联体包含长度为至少100个核苷酸的靶多核苷酸。在一些实施方案中,至少50%的多联体包含长度为至少150个核苷酸的靶多核苷酸。
在一些实施方案中,本公开内容的方法包括对步骤(c)中产生的多个扩增子进行测序。在一些实施方案中,所述测序在没有相对于包含仅一个拷贝的靶多核苷酸的扩增子选择性地纯化包含两个或更多个拷贝的靶多核苷酸的扩增子的情况下进行。在一些实施方案中,本公开内容的方法包括对步骤(c)产生的多个扩增子中包含两个或更多个拷贝的靶多核苷酸的扩增子进行纯化。在一些实施方案中,对本方法的经纯化的扩增子进行测序。在某些实施方案中,本公开内容的方法包括在同一反应混合物中扩增多种不同的靶多核苷酸。所述多种靶多核苷酸的组分可以具有不同的长度。在一些实施方案中,所述靶多核苷酸的长度为30个核苷酸至1000个核苷酸(例如,长度为50-600、75-500、100-400或200-300个核苷酸)。在一些实施方案中,通过在单一反应混合物中连接而将所述靶多核苷酸环化。
在一个说明性实施方案中,如图4所示对包含无细胞多核苷酸混合物的核酸样品进行扩增。混合物中的多核苷酸(例如,单链DNA,“ssDNA”)可被环化形成环状靶多核苷酸或环状多核苷酸。在非等温RCA的第一温度阶段(如55℃)中的引物结合和在非等温RCA的第二温度阶段(如70℃)中对一种或多种第一引物的引物延伸生成多联体混合物。选择用于引物延伸的温度高于选择用于引物结合的温度可以使引物延伸期间额外的引物结合最小化。每个靶多核苷酸可具有一个或多个相应多联体。对应于独特靶多核苷酸的每个多联体可包含可变拷贝数的靶多核苷酸。根据图示,一个或多个第一引物包含通过序列互补性与靶多核苷酸特异性杂交的第一3’端和不通过序列互补性与靶多核苷酸特异性杂交的包含第一共同序列的第一5’端。在非等温扩增的后续循环中,多种第二延伸产物的生成与多联体的生成同时发生,该延伸产物由在第二温度阶段中一种或多种第二引物的引物延伸而得到,该一种或多种第二引物已与在第一温度阶段中作为第一引物的延伸产物生成的线性多联体模板杂交,并且由于在先前循环中的第三温度阶段(如94℃)期间的变性而不与环状模板杂交。第二引物的新杂交位点经环状模板周围的进展聚合酶的置换而暴露。所述一种或多种第二引物包含通过序列互补性与多联体特异性杂交的第二3’端和不通过序列互补性与多联体特异性杂交的包含第二共同序列的第二5’端。延伸产物可包含不同拷贝数的靶多核苷酸。在混合样品中,靶多核苷酸可具有不同的长度,并且所得到的延伸产物也可具有不同的长度。可以由第一共同序列与第二共同序列的互补体之间的分子内杂交,或由第一共同序列的互补体与(第二)共同序列之间的分子内杂交而形成不同大小的茎环结构。茎环结构可以在扩增的一个或多个阶段(例如,退火、延伸或用于茎环形成的第四温度阶段(例如58℃))期间形成。茎环结构还可在RCA之后的后续扩增反应期间形成。延伸产物可作为扩增反应的模板以生成扩增子,并且茎环结构的稳定性可影响引物结合和延伸。在后续扩增反应期间,相比于其中茎环结构具有较小环的延伸产物,可优先富集包含更长靶多核苷酸序列或更多拷贝的延伸产物。在一些实施方案中,富集包含两个或更多个拷贝的靶多核苷酸的扩增子。在一些实施方案中,具有两个或更多个拷贝的靶多核苷酸的扩增子的百分比至少为50%(例如,至少60%、70%、80%、90%或更大)。在一些实施方案中,具有两个或更多个拷贝的靶多核苷酸的扩增子的百分比为10%-100%(例如,20%-90%、30%-80%或40%-60%)。在一些实施方案中,富集包含较长靶多核苷酸的扩增子。在一些实施方案中,至少50%(例如,至少60%、70%、80%、90%或更多)的多联体包含长度为至少75个核苷酸(例如,长度为至少100、150、200个或更多个核苷酸)的靶多核苷酸。在一些实施方案中,至少80%的多联体包含长度为至少75个核苷酸的靶多核苷酸。在一些实施方案中,至少60%的多联体包含长度为至少100个核苷酸的靶多核苷酸。在一些实施方案中,至少50%的多联体包含长度为至少150个核苷酸的靶多核苷酸。
在另一方面,本公开内容提供了用于执行根据本公开内容的方法中的方法的反应混合物。反应混合物可包含如本文中关于各个方面和方法中的任一个所描述的各种组分中的一种或多种。在一些实施方案中,本公开内容提供了用于富集包含至少两个或更多个拷贝的靶多核苷酸的多联体的扩增子的反应混合物。在一个实施方案中,该反应混合物包含:(a)环状靶多核苷酸,(b)第一引物,其包含通过序列互补性与靶多核苷酸特异性杂交的第一3’端和不通过序列互补性与靶多核苷酸特异性杂交的包含第一共同序列的第一5’端;以及(c)第二引物,其包含通过序列互补性与多联体特异性杂交的第二3’端和不通过序列互补性与多联体特异性杂交的包含第二共同序列的第二5’端,其中第一共同序列和第二共同序列各自在5’端包含至少10个连续核苷酸并且当最佳比对时至少90%相同。
在一些实施方案中,本公开内容的反应混合物容纳在容器内。每种组分可以被封装到不同的容器中,或者在交叉反应性和保质期允许的情况下,可在容器中提供组分的组合。容器可以是孔、板、管、腔室、流动池或芯片。
在一些实施方案中,反应混合物包含具有通过序列互补性与第一共同序列或第二共同序列特异性杂交的序列的第三引物。在一些实施方案中,第三引物可用于扩增多种延伸产物。用于核酸扩增的第三引物可具有任意合适的长度,如至少5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90或100个核苷酸,其任何部分或全部可与相应靶序列互补(例如,约5、10、15、20、25、30、35、40、45、50个核苷酸或更多)。第三引物可包含区段,该区段包含一个或多个扩增引物退火序列或其互补体;一个或多个测序引物退火序列或其互补体;一个或多个条形码序列;一个或多个在多种不同引物之间共有的共同序列;一个或多个限制酶识别位点;一个或多个探针结合位点或测序衔接子(例如,用于附接至测序平台,如用于大规模平行测序的流动池);一个或多个随机或接近随机的序列(例如,从一个或多个位置处的一组两个或更多个不同核苷酸中随机选择的一个或多个核苷酸);以及它们的组合。扩增引物退火序列也可以用作测序引物退火序列。
在某些实施方案中,延伸产物可形成茎环产物,并且可通过优化第一共同序列、第二共同序列和第三引物的第三杂交序列的性质,例如通过优化它们的解链温度来优化从第三引物的引物延伸的扩增子产率。在一些实施方案中,第一共同序列、第二共同序列和第三引物的杂交序列均具有在彼此±15℃内的解链温度(Tm)。在一些实施方案中,第一共同序列、第二共同序列和第三引物的杂交序列均具有在彼此±10℃内的解链温度(Tm)。在一些实施方案中,第一共同序列、第二共同序列和第三引物的杂交序列均具有在彼此±5℃内的解链温度(Tm)。在一些实施方案中,第一共同序列、第二共同序列和第三引物的杂交序列均具有在彼此±1℃内的解链温度(Tm)。
在一些实施方案中,本公开内容的反应混合物包含环化的无细胞DNA作为环状靶多核苷酸或环状多核苷酸。在一些实施方案中,本公开内容的反应混合物包含基因组DNA的环化片段作为环状靶多核苷酸或环状多核苷酸。在一些实施方案中,该环状靶多核苷酸或环状多核苷酸包含由染色体重排产生的序列。在某些实施方案中,该染色体重排是缺失、重复、倒位和易位中的至少一种。在一些实施方案中,本方法的环状靶多核苷酸或环状多核苷酸为单链。在一些实施方案中,本方法的环状靶多核苷酸或环状多核苷酸为双链。
在一些实施方案中,本公开内容的反应混合物包含沿靶多核苷酸从5’至3’对应于(i)与第一3’端互补的序列、(ii)与第二3’端相同的序列以及(iii)(i)与(ii)之间的间插序列的靶多核苷酸序列部分的组合长度为75个或更少的核苷酸。在一些实施方案中,靶多核苷酸序列部分的组合长度为60个或更少的核苷酸。在一些实施方案中,靶多核苷酸序列部分的组合长度为50个或更少的核苷酸。在一些实施方案中,靶多核苷酸序列部分的组合长度为40个或更少的核苷酸。在一些实施方案中,靶多核苷酸序列部分的组合长度为30个或更少的核苷酸。
在包括本公开内容的方法和反应混合物在内的本文所述各个方面的一些实施方案中,通过连接线性靶多核苷酸形成环状靶多核苷酸或环状多核苷酸。由线性靶多核苷酸形成的环状靶多核苷酸可包含待表征的序列,例如罕见序列变体或融合基因。在一些实施方案中,线性靶多核苷酸为单链。在其他实施方案中,线性靶多核苷酸为双链。靶多核苷酸的非限制性实例包括DNA、RNA、cDNA、dsDNA、ssDNA、质粒DNA、粘粒DNA、染色体DNA、基因组DNA、病毒DNA、细菌DNA、mtDNA(线粒体DNA)、mRNA、rRNA、tRNA、nRNA、siRNA、snRNA、snoRNA、scaRNA、微小RNA、dsRNA、核酶、核糖开关和病毒RNA(例如,逆转录病毒RNA)。
在各个方面中的任何方面的一些实施方案中,环状靶多核苷酸或环状多核苷酸包含无细胞多核苷酸,包括但不限于无细胞DNA或无细胞RNA(cfDNA或cfRNA)。在一些实施方案中,无细胞多核苷酸是循环肿瘤DNA或循环肿瘤RNA(ctDNA或ctRNA)。在一些实施方案中,无细胞多核苷酸包括胎儿DNA或胎儿RNA。在一些实施方案中,无细胞多核苷酸是来源于细胞但并非直接从细胞来源如组织样品获得的多核苷酸。可发源出无细胞多核苷酸的来源的非限制性实例是正常细胞和组织、异常细胞和组织(例如,癌细胞或组织)、胎儿细胞和组织,以及病原体。存在于非细胞来源中的无细胞多核苷酸可由细胞死亡(例如,凋亡或坏死)或细胞脱落产生。可以使用对无细胞多核苷酸的序列分析来表征无细胞DNA所源自的细胞或细胞群,诸如肿瘤细胞(例如,在癌症检测中)、胎儿细胞(例如在产前诊断中)、来自移植组织的细胞(例如,在移植失败的早期检测中)或病原体(例如,细菌或病毒)。
本公开内容的实施方案可使用任何无细胞多核苷酸。无细胞多核苷酸可从受试者如任何动物或活生物体获得。受试者的非限制性实例是哺乳动物,诸如人、非人灵长类动物、啮齿动物如小鼠和大鼠、狗、猫、猪、羊、兔等。在一些实施方案中,受试者是健康的,因此从该受试者获得的无细胞多核苷酸可能不包含与疾病或病症相关的序列变体。在一些实施方案中,受试者疑似患有疾病或病症,因此从该受试者获得的无细胞多核苷酸可能包含与疾病或病症相关的序列变体。在一些实施方案中,受试者怀孕,因此从该受试者获得的无细胞多核苷酸包括胎儿多核苷酸。
无细胞多核苷酸可从各种非细胞来源获得。可获得无细胞多核苷酸的非细胞来源的非限制性实例是血清、血浆、血液、汗液、唾液、尿液、粪便、精液、粘膜排泄物、脊髓液、羊水和淋巴液。用于收集可获得无细胞多核苷酸的非细胞来源的样品的各种方法是可用的。在一些实施方案中,从受试者获得可获得无细胞多核苷酸的非细胞来源的样品。在一些实施方案中,通过静脉穿刺获得样品。在一些实施方案中,通过抽吸获得样品。
各种方法和商用试剂盒可用于从样品获得无细胞多核苷酸,如无细胞DNA。用于提取和分离无细胞多核苷酸(包括无细胞DNA)的方法和试剂盒的实例是苯酚/氯仿提取、苯酚/氯仿/异戊醇(PCI)-糖原提取、NaI(碘化钠)提取、胍树脂提取、带有载体RNA的QIAmpDNA Blood Midi试剂盒、ChargeSwitch血清试剂盒、ZR血清DNA试剂盒、Qiagen QubitTMdsDNA HS Assay试剂盒、AgilentTM DNA 1000试剂盒、TruSeqTM测序文库制备以及PuregeneDNA纯化系统血液试剂盒。
无细胞多核苷酸(包括无细胞DNA)可以通过分隔步骤从体液中提取和分离,该分隔步骤中无细胞多核苷酸与体液的细胞和其他非可溶性组分相分离。分隔技术的实例是离心和过滤。在一些实施方案中,没有首先将细胞与无细胞多核苷酸相分隔,而是首先进行裂解。在一些实施方案中,通过选择性沉淀来分隔完整细胞的基因组DNA。无细胞多核苷酸(包括DNA)可保持可溶性,并可与不溶性基因组DNA相分离并被提取。根据一些程序,在添加缓冲液以及不同试剂盒特定的其他洗涤步骤后,可以使用异丙醇沉淀来沉淀DNA。可以使用进一步的清理步骤,如基于二氧化硅的柱来去除污染物或盐。通用步骤可针对特定应用进行优化。例如,可以在整个反应期间添加非特异性批量载体多核苷酸以优化该程序的某些方面,如产率。
在本文公开的各个方面中的任何方面的一些实施方案中,环状靶多核苷酸或环状多核苷酸包含基因组DNA。在一些实施方案中,环状靶多核苷酸或环状多核苷酸来源于基因组DNA。基因组DNA可使用可用的各种方法和商用试剂盒(如Qiagen DNeasy Tissue试剂盒)从细胞样品获得。可使用先前在本文其他各处描述的任何提取、分离和纯化方法从样品获得并纯化基因组DNA。提取技术的其他非限制性实例包括:(1)有机萃取然后乙醇沉淀,例如,使用苯酚/氯仿有机试剂(Ausubel等人,1993),使用或不使用自动核酸提取器,例如可从Applied Biosystems(Foster city,Calif)获得的341DNA型提取器;(2)固定相吸附法(美国专利号5,234,809;Walsh等人,1991);和(3)盐诱导核酸沉淀法(Miller等人,1988),该沉淀方法一般被称作“盐析”法。核酸分离和/或纯化的另一个实例包括使用核酸能够特异性或非特异性结合的磁性颗粒,然后使用磁体分离珠子,并洗涤和从珠子中洗脱核酸(参见,例如,美国专利号5,705,628)。例如,可使用固相可逆固定(SPRI)珠(Agencourt AMPureXP)将核酸分离和纯化。在一些实施方案中,上述分离方法之前可先进行酶消化步骤以帮助从样品中去除不需要的蛋白质,例如用蛋白酶K或其他类似的蛋白酶进行消化。如果需要,可向裂解缓冲液中添加RNase抑制剂。对于特定的细胞或样品类型,可能需要在方案中增加蛋白质变性/消化步骤。纯化方法可以针对分离DNA、RNA或此两者。当DNA和RNA在提取程序过程中或之后被一起分离时,可使用进一步的步骤来与另一种分开地纯化一种或两者。也可生成提取的核酸的亚级分,例如,根据大小、序列或其他物理或化学特性进行纯化。除了初始核酸分离步骤,核酸的纯化还可以在所公开的方法的任意步骤之后进行,例如用于去除过量的或不需要的试剂、反应物或产物。多种用来确定样品中的核酸量和/或核酸纯度的方法是可用的,例如通过吸光度(例如,在260nm、280nm处的光吸收,和其比值)和标记物的检测(例如,荧光染料和嵌入剂,例如SYBR绿、SYBR蓝、DAPI、碘化丙锭、Hoechst染色剂、SYBR金、溴化乙锭)。
在一些实施方案中,环状靶多核苷酸或环状多核苷酸包含片段化无细胞DNA或片段化基因组DNA。多种方法可用于对多核苷酸进行片段化,包括但不限于化学方法、酶促方法和机械方法,如超声处理、剪切和与限制酶接触。在一些实施方案中,无细胞DNA片段的长度大致均匀。在一些实施方案中,无细胞DNA片段的长度并非大致均匀。在一些实施方案中,无细胞DNA片段具有约50至约1000个核苷酸的平均长度。在一些实施方案中,无细胞DNA片段具有约50至约500个核苷酸的平均长度。在一些实施方案中,无细胞DNA片段具有约50至约250个核苷酸的平均长度。在一些实施方案中,无细胞DNA片段具有约50至约200个核苷酸的平均长度。在一些实施方案中,无细胞DNA片段具有约50至约100个核苷酸的平均长度。在一些实施方案中,无细胞DNA片段具有约40至约1000个核苷酸的平均长度。在一些实施方案中,无细胞DNA片段具有约40至约500个核苷酸的平均长度。在一些实施方案中,无细胞DNA片段具有约40至约250个核苷酸的平均长度。在一些实施方案中,无细胞DNA片段具有约40至约200个核苷酸的平均长度。在一些实施方案中,无细胞DNA片段具有约40至约100个核苷酸的平均长度。在一些实施方案中,基因组DNA被片段化为较短长度的多核苷酸。在一些实施方案中,基因组DNA片段的长度大致相同。在一些实施方案中,基因组DNA片段的长度几乎不同。在一些实施方案中,基因组DNA片段具有约50至约100个核苷酸的平均长度。在一些实施方案中,基因组DNA片段具有约50至250个核苷酸的平均长度。在一些实施方案中,基因组DNA片段具有约50至500个核苷酸的平均长度。在一些实施方案中,基因组DNA片段具有约50至750个核苷酸的平均长度。在一些实施方案中,基因组DNA片段具有约100至1000个核苷酸的平均长度。
可通过各种方法由线性靶多核苷酸形成环状靶多核苷酸或环状多核苷酸。在一些实施方案中,通过末端联接将单个线性靶多核苷酸环化。在一些实施方案中,将第一线性靶多核苷酸联接至第二线性靶多核苷酸,然后将第一靶多核苷酸的未联接端联接至第二线性靶多核苷酸的未联接端以形成包含第一和第二靶多核苷酸的环状靶多核苷酸或环状多核苷酸。待环化的多核苷酸可以是单链或双链的。当期望单链环时,多核苷酸可以是如最初分离的单链多核苷酸,或者可被处理以使该多核苷酸成为单链(例如,通过变性)。在一些实施方案中,用于使多核苷酸环化的方法涉及酶,如使用连接酶(例如,RNA连接酶或DNA连接酶)。可用于将线性靶多核苷酸连接成环状靶多核苷酸或环状多核苷酸的酶的非限制性实例是ATP依赖性双链多核苷酸连接酶、NAD+依赖性DNA或RNA连接酶和单链多核苷酸连接酶。连接酶的非限制性实例是CircLigase I和CircLigase II(Epicentre;Madison,WI)、大肠杆菌DNA连接酶、丝状栖热菌DNA连接酶、Tth DNA连接酶、水管致黑栖热菌DNA连接酶(I型和II型)、T3 DNA连接酶、T4 DNA连接酶、T4 RNA连接酶、T7 DNA连接酶、Taq连接酶、Ampligase(
Figure BDA0003622534420000431
Technologies Corp.)、VanC-型连接酶、9°N DNA连接酶、Tsp DNA连接酶、DNA连接酶I型、DNA连接酶III型、DNA连接酶IV型、Sso7-T3 DNA连接酶、Sso7-T4 DNA连接酶、Sso7-T7DNA连接酶、Sso7-Taq DNA连接酶、Sso7-大肠杆菌DNA连接酶、Sso7-AmpligaseDNA连接酶,以及热稳定连接酶。连接酶可以是野生型、突变同工型和基因工程化变体。连接反应可含有缓冲组分、小分子连接增强剂和其他反应组分。在一些实施方案中,调节多核苷酸和酶的浓度以促进分子间连接而不是分子内连接。在一些实施方案中,调节反应温度和反应时间或反应的时间长度。反应温度和时间也可调节。在一些实施方案中,使用60℃来促进分子内环的形成。在一些实施方案中,反应时间为12-16小时。反应条件可以是所选择的酶的制造商所规定的条件。在一些实施方案中,联接多核苷酸的末端以形成环状多核苷酸(直接联接至其自身或联接至一个或多个其他多核苷酸例如,包含两个靶多核苷酸的环状靶多核苷酸或环状多核苷酸)产生具有连接序列的接合。在一些实施方案中,可以包括外切核酸酶步骤以在环化反应后消化任何未连接的核酸。也就是说,闭合环不含游离5’或3’端,因此引入5’或3’外切核酸酶不会消化闭合环但会消化未连接的组分。这尤其可用于多路系统中。
环化之后,反应产物可在扩增或测序之前进行纯化以提高可参与后续步骤的环化多核苷酸的相对浓度或纯度(例如,通过环状多核苷酸的分离或反应中一种或多种其他分子的去除)。例如,可处理环化反应或其组分以去除单链(未环化的)多核苷酸,例如通过外切核酸酶处理。作为进一步的实例,环化反应或其部分可进行大小排阻色谱法,借此保留及丢弃小试剂,或在单独的体积中保留并释放环化产物。多种用于清理连接反应的试剂盒是可用的,例如由Zymo Reaserch制造的Zymo寡核苷酸纯化试剂盒所提供的试剂盒。在一些实施方案中,纯化包括用于去除或降解在环化反应中使用的连接酶和/或将环化多核苷酸从该连接酶中纯化的处理。在一些实施方案中,用于降解连接酶的处理包括用蛋白酶如蛋白酶K进行的处理。蛋白酶K处理可遵循制造商的方案或标准方案(例如,如Sambrook和Green,Molecular Cloning:A Laboratory Manual,第4版(2012)所提供的)。蛋白酶处理之后还可进行提取和沉淀。在一个实例中,环化多核苷酸如下纯化:在0.1%SDS和20mM EDTA的存在下进行蛋白酶K(Qiagen)处理,用1:1苯酚/氯仿和氯仿抽提,并用乙醇或异丙醇沉淀。在一些实施方案中,沉淀在乙醇中进行。
本公开内容的一些实施方案包括引物延伸和扩增反应,如生成多联体、生成多种延伸产物,以及对多种延伸产物进行扩增中的一种或多种。引物延伸反应可涉及温度变化(热循环)或恒温(等温)。在一些实施方案中,引物延伸反应包括聚合酶链反应(PCR)。PCR涉及通过多个阶段的变性、引物对与相反链退火,以及用于使靶序列拷贝数指数增加的引物延伸而进行的循环,这些阶段中的至少一些通常在不同的反应温度下发生。PCR扩增技术的非限制实例是定量PCR(qPCR或实时PCR)、逆转录PCR(RT-PCR)、数字PCR(dPCR或dePCR)、靶标特异性PCR以及定量逆转录PCR(qRT-PCR)。可用于PCR的聚合酶的实例为热稳定聚合酶,包括但不限于嗜热栖热菌HB8;突变Thermus oshimai;水管致黑栖热菌;嗜热栖热菌1B21;嗜热栖热菌GK24;水生栖热菌聚合酶(
Figure BDA0003622534420000451
FS或Taq(G46D;F667Y),Taq(G46D;F667Y;E6811)和Taq(G46D;F667Y;T664N;R660G));激烈火球菌聚合酶;Thermococcusgorgonarius聚合酶;火球菌属物种GB-D聚合酶;栖热球菌属(菌株9°N-7)聚合酶;嗜热脂肪芽胞杆菌聚合酶;Tsp聚合酶;ThermalAceTM聚合酶(Invitrogen);黄栖热菌聚合酶;Thermuslitoralis聚合酶;栖热菌属Z05聚合酶;δZ05聚合酶(例如,δZ05 Gold DNA聚合酶);以及其突变体、变体其衍生物。可用于PCR的聚合酶的其他实例是非热稳定聚合酶,包括但不限于DNA聚合酶I;突变体DNA聚合酶I,包括但不限于Klenow片段和Klenow片段(3’至5’外切核酸酶(-));T4 DNA聚合酶;突变体T4 DNA聚合酶;T7 DNA聚合酶;突变体T7 DNA聚合酶;phi29DNA聚合酶;以及突变体phi29 DNA聚合酶。在一些实施方案中,使用热启动聚合酶。热启动聚合酶是需要热激活的DNA聚合酶的修饰形式。这样的聚合酶可用于例如进一步提高敏感度、特异性和产率;并且/或者进一步改善低拷贝靶标扩增。通常,热启动酶以非活性状态提供。热活化后,释放修饰物或改性剂,从而生成活性酶。许多热启动聚合酶可从各种商业来源获得,如Applied Biosystems;Bio-Rad;eEnzyme LLC;Eppendorf North America;Finnzymes Oy;GeneChoice,Inc.;Invitrogen;Jena Bioscience GmbH;MIDSCI;MinervaBiolabs GmbH;New England Biolabs;Novagen;Promega;QIAGEN;Roche AppliedScience;Sigma-Aldrich;Stratagene;Takara Mirus Bio;USB Corp.;YorkshireBioscience Ltd;等等。
在一些实施方案中,引物延伸和扩增反应包括等温反应。等温扩增技术的非限制性实例是连接酶链反应(LCR)(例如,美国专利号5,494,810和5,830,711);转录介导的扩增(TMA)(例如,美国专利号5,399,491、5,888,779、5,705,365、5,710,029);基于核酸序列的扩增(NASBA)(例如,Malek等人,美国专利号5,130,238);信号介导的RNA扩增技术(SMART)(例如,Wharam等人,Nucleic Acids Res.2001,29,e54);链置换扩增(SDA)(例如,美国专利号5,455,166);嗜热SDA(Spargo等人,Mol Cell Probes 1996,10:247-256;欧洲专利号0684315);滚环扩增(RCA)(例如,Lizardi,“Rolling Circle Replication ReporterSystems,”美国专利号5,854,033);环介导的DNA等温扩增(LAMP)(例如,Notomi等人,“Process for Synthesizing Nucleic Acid,”美国专利号6,410,278);解旋酶依赖性扩增(HDA)(例如,美国专利申请US 20040058378);单引物等温扩增(SPIA)(例如,WO2001020035和美国专利号6,251,639);以及环状解旋酶依赖性扩增(cHDA)(例如,美国专利申请US.10/594,095)。
在一些实施方案中,引物延伸反应通过具有链置换活性的聚合酶实现如对于RCA。在一些实施方案中,等温扩增包括滚环扩增(RCA)。RCA反应混合物可包含一种或多种引物、具有链置换活性的聚合酶,和dNTP。链置换是指在合成期间置换下游DNA的能力。具有链置换活性的聚合酶可具有不同程度的链置换活性。在一些实施方案中,聚合酶可具有弱链置换活性或没有链置换活性。在一些实施方案中,聚合酶可具有强链置换活性。在一些实施方案中,具有链置换活性的聚合酶可在不同反应温度下具有不同水平的链置换活性。在一些实施方案中,聚合酶可在中等温度例如20℃-37℃下显示链置换活性。在一些实施方案中,聚合酶可在升高的温度例如65℃下显示链置换活性。可调节反应温度以有利于具有链置换活性的聚合酶的活性水平。在一些实施方案中,反应温度为至少20℃、25℃、30℃、35℃、40℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃、80℃、85℃或90℃。在一些实施方案中,反应温度为20℃至80℃。在一些实施方案中,反应温度为20℃至70℃。在一些实施方案中,反应温度为20℃至60℃。在一些实施方案中,反应温度为20℃至50℃。在一些实施方案中,可以在不同阶段中循环通过不同反应温度以提高或降低聚合酶的链置换活性。具有链置换活性的聚合酶的非限制性实例是Bst DNA聚合酶,大片段;Bsu DNA聚合酶,大片段;Deep VentR TMDNA聚合酶;Deep VentR TM(exo-)DNA聚合酶;Klenow片段(3’-5’exo-);DNA聚合酶I,大片段;M-MuLV逆转录酶;phi29 DNA聚合酶;PyroPhage 3173聚合酶;
Figure BDA0003622534420000472
DNA聚合酶;以及
Figure BDA0003622534420000471
(exo-)DNA聚合酶。
作为扩增反应(包括热循环方法、等温方法和这些的组合)的产物生成的多联体可包含两个或更多个拷贝的靶多核苷酸。多联体可包含约2、3、4、5、6、7、8、9、10个或更多个拷贝的靶多核苷酸。在一些实施方案中,多联体作为引物延伸反应的产物从多种靶多核苷酸生成,其中所述多种靶多核苷酸的组分的长度不均匀且包含多个序列。
在本公开内容的各个方面中的任何方面的一些实施方案中,引物可包含一个或多个部分。例如,引物可包含一个或多个扩增引物退火序列或其互补体;一个或多个测序引物退火序列或其互补体;一个或多个条形码序列;一个或多个在多种不同引物之间共有的共同序列;一个或多个限制酶识别位点;一个或多个探针结合位点或测序衔接子(例如,用于附接至测序平台,如用于大规模平行测序的流动池);一个或多个随机或接近随机的序列(例如,从一个或多个位置处的一组两个或更多个不同核苷酸中随机选择的一个或多个核苷酸,其中在一个或多个位置处选择的不同核苷酸中的每一个均表现在包含随机序列的引物池中);以及它们的组合。在一些实施方案中,引物如第三引物包含测序衔接子元件(在本文中也被称为衔接子),该元件通常指在多核苷酸的5’和/或3’端掺入以促进多核苷酸测序反应中的一个或多个步骤的寡核苷酸。在一些实施方案中,使用测序衔接子将包含测序衔接子的多核苷酸结合至流动池以供下一代测序。下一代测序方法的非限制性实例是单分子实时测序、离子半导体测序、焦磷酸测序、合成测序、连接测序和链终止。用于流动池附接的测序衔接子可包括与下一代测序系统(例如,454测序、Ion TorrentProton或PGM和Illumina X10)兼容的任何合适序列。用于下一代测序方法的测序衔接子的非限制性实例包括适合与Illumina测序系统一起使用的P5和P7衔接子;TruSeq通用衔接子;和TruSeq索引衔接子。在一些实施方案中,可使用测序衔接子来例如通过扩增如聚合酶链反应(PCR)来富集包含衔接子序列的多核苷酸。测序衔接子可进一步包含条形码序列和/或样品索引序列。
在某些其他实施方案中,引物如第三引物包含条形码序列。条形码序列是指允许鉴定与条形码相关联的多核苷酸的一些特征的已知核酸序列。条形码各自可具有5至35个核苷酸、6至30个核苷酸或8至20个核苷酸的长度。在一些实施方案中,条形码的长度为至少3、4、5、6、7、8、9、10、11、12、13、14或15个核苷酸。在一些实施方案中,条形码的长度小于6个核苷酸。在一些实施方案中,与一些靶多核苷酸相关联的条形码可具有不同于与其他靶多核苷酸相关联的条形码的长度。一组内的条形码的解链温度可以在彼此的±10℃内、彼此的±5℃内或彼此的±2℃内。条形码可以是最小交叉杂交组的成员。例如,这样的组中的每个成员的核苷酸序列可以与该组中的每个其他成员的核苷酸序列明显不同,以致于在中等或严格杂交条件下,没有成员可以与任何其他成员的互补体形成稳定的双链体。最小交叉杂交组的每个成员的核苷酸序列可以与每个其他成员的核苷酸序列有至少两个核苷酸不同。一些条形码技术描述于Winzeler等人,(1999)Science 285:901;Brenner(2000)GenomeBiol.1:1;Kumar等人,(2001)Nature Rev.2:302;Giaever等人,(2004)Proc.Natl.Acad.Sci.USA 101:793;Eason等人,(2004)Proc.Natl.Acad.Sci.USA 101:1104;以及Brenner(2004)Genome Biol.5:240,其中的每一个均通过引用以其全部内容并入本文。
本公开内容的某些实施方案包括对多个扩增子进行测序。多种测序方法可用于对多个扩增子进行测序。在一些实施方案中,使用高通量测序方法。可使用的测序方法的非限制性实例包括Illumina制造的测序系统(诸如
Figure BDA0003622534420000481
Figure BDA0003622534420000482
的测序系统)、LifeTechnologies制造的测序系统(Ion
Figure BDA0003622534420000483
等)、Roche的454LifeSciences系统、Pacific Biosciences系统等。在一些实施方案中,测序包括使用
Figure BDA0003622534420000484
Figure BDA0003622534420000485
系统产生长度约为或多于约50、75、100、125、150、175、200、250、300个或更多个核苷酸的读取。在一些实施方案中,测序包括合成测序过程,其中随着单独的核苷酸被添加至生长的引物延伸产物上,该核苷酸被迭代地鉴定。焦磷酸测序是合成测序法的一个实例,其通过分析所产生的合成混合物中测序反应副产物即焦磷酸的存在而鉴定核苷酸的掺入。特别是,引物/模板/聚合酶复合体与一种类型的核苷酸接触。如果该核苷酸掺入,则聚合反应切割三磷酸链的α和β磷酸之间的三磷酸核苷,从而释放焦磷酸。然后使用化学荧光酶报告系统鉴定所释放的焦磷酸的存在,该系统将含有AMP的焦磷酸转化为ATP,之后用萤光素酶测量ATP以生成可测量的光信号。当检测到光时,碱基已掺入,当未检测到光时,碱基未掺入。在适当的洗涤步骤后,使各种碱基周期性地与该复合体接触,以连续地鉴定模板序列中的后续碱基。参见,例如,美国专利号6,210,891。
在一些实施方案中,对扩增子进行测序以相对于参考序列或在无突变的背景下检测序列变体,例如,倒位、缺失、重复、易位和罕见体细胞突变。在一些实施方案中,该序列变体与疾病相关。在一些实施方案中,该序列变体与疾病不相关。通常,与疾病或性状的关联性具有统计学证据、生物学证据和/或功能证据的序列变体被称为“因果遗传变体”。单个因果遗传变体可与多于一种疾病或性状相关。在一些情况下,因果遗传变体可与孟德尔性状、非孟德尔性状或与两者相关。因果遗传变体可表现为多核苷酸变异,如1、2、3、4、5、6、7、8、9、10、20、50个或更多个序列差异(如包含因果遗传变体的多核苷酸与在相同的相对基因组位置处缺乏因果遗传变体的多核苷酸之间的序列差异)。因果遗传变体类型的非限制性实例包括单核苷酸多态性(SNP)、缺失/插入多态性(DIP)、拷贝数变体(CNV)、短串联重复(STR)、限制性片段长度多态性(RFLP)、简单序列重复(SSR)、可变数目串联重复(VNTR)、随机扩增多态DNA(RAPD)、扩增片段长度多态性(AFLP)、逆转录转座子间扩增多态性(IRAP)、长散在元件和散在元件(LINE/SINE)、长串联重复(LTR)、移动元件、逆转录转座子微卫星扩增多态性、基于逆转录转座子的插入多态性、序列特异性扩增多态性和可遗传表观遗传修饰(例如,DNA甲基化)。因果遗传变体也可能是一组密切相关的因果遗传变体。一些因果遗传变体可能施加与RNA多核苷酸中的序列变异一样的影响。在这个水平下,一些因果遗传变体还可由存在或不存在RNA多核苷酸物质来指示。另外,一些因果遗传变体导致蛋白质多肽的序列变异。已经报道了许多因果遗传变体。为SNP的因果遗传变体的实例是导致镰状细胞性贫血的血红蛋白Hb S变体。为DIP的因果遗传变体的实例是导致囊性纤维化的CFTR基因的δ508突变。为CNV的因果遗传变体的实例是21三体,其导致唐氏综合症。为STR的因果遗传变体的实例是导致亨廷顿病的串联重复。WO2014015084中描述了因果遗传变体的其他非限制性实例。WO2015089333中描述了用于鉴定罕见序列变体的方法的其他非限制性实例。
在本公开内容的各个方面中的任何方面的某些实施方案中,在测序之前对扩增子进行纯化。可通过各种方法对扩增子进行纯化。可将扩增子纯化以去除过量或不需要的试剂、反应物或产物。扩增子可进一步通过大小、序列或其他物理或化学特性进行纯化。在一些实施方案中,扩增子可经受大小排阻色谱法,由此截留并丢弃仅包含一个拷贝的靶多核苷酸的扩增子和/或较小试剂(例如,引物),或截留包含两个或更多个拷贝的靶多核苷酸的扩增子并释放在单独的体积中。在一些实施方案中,扩增子可以经受从凝胶上切下片段和凝胶过滤(例如,用于富集长度大于约300、400、500个或更多个核苷酸的片段);以及用于通过微调结合缓冲液浓度进行大小选择的SPRI珠(Agencourt AMPure XP)。例如,可以在与DNA片段混合过程中使用0.6x结合缓冲液来优先结合大于约500个碱基对(bp)的DNA片段。在一些实施方案中,尤其是在已用B2B引物进行了扩增时,对扩增产物进行处理,以根据大小过滤所得到的扩增子,从而减少和/或去除包含多联体的混合物中的单体数目。这可以使用如本文其他各处描述的任何纯化技术来完成。
本文提供的公开内容的实施方案可用于富集包含与一种或多种癌症相关的各种序列变体的扩增子。可用于本公开内容的方法的具有肿瘤学意义的合适靶序列包括但不限于TP53基因、ALK基因、KRAS基因、PIK3CA基因、BRAF基因、EGFR基因和KIT基因的改变。可特异性扩增和/或针对序列变体进行特异性分析的靶序列可以是癌症相关基因的全部部分。在一些实施方案中,在TP53基因中鉴定出一个或多个序列变体。TP53是人类癌症中最常突变的基因之一,例如,在45%的卵巢癌、43%的大肠癌和42%的上呼吸消化道癌症中均发现TP53突变(参见,例如M.Olivier等人,TP53Mutations in Human Cancers:Origins,Consequences,and Clinical Use.Cold Spring Harb Perspect Biol.2010年1月;2(1))。TP53突变状态的表征可帮助临床诊断,提供预后价值并影响对癌症患者的治疗。例如,TP53突变可用作来源于胶质细胞的CNS肿瘤患者的预后不良的预测因子,并且是慢性淋巴细胞白血病患者中快速疾病进展的预测因子(参见,例如McLendon RE等人,Cancer.2005年10月15日;1 04(8):1693-9;Dicker F等人,Leukemia.2009年1月;23(1):117-24)。序列变异可发生在基因的任何地方。因此,在本文中可能评估全部或部分TP53基因。换言之,如本文其他各处所述的,当使用靶标特异性组分(例如,靶特异性引物)时,可使用多个TP53特异性序列,例如以便扩增和检测跨该基因的片段,而不仅仅是可用于选定靶标的一个或多个选定的子序列(如突变“热点”)。或者,可以设计靶标特异性引物,使其在一个或多个选定子序列(如也被术语“热点”涵盖在内的与一类受试者之间突变率增加相关的核苷酸或核苷酸区域)的上游或下游杂交。可以设计跨这种子序列的标准引物,并且/或者可以设计在这种子序列的上游或下游杂交的B2B引物。
在一些实施方案中,在ALK基因的全部或部分中鉴定一个或多个序列变体。已报道在多达7%的肺肿瘤中存在ALK融合,其中一些与EGFR酪氨酸激酶抑制剂(TKI)抗性相关(参见,例如Shaw等人,J Clin Oncol.2009年9月10日;27(26):4247–4253)。截至2013年,已经在对ALK酪氨酸激酶抑制剂(TKI)具有继发耐药性的患者中发现了跨整个ALK酪氨酸激酶结构域的几个不同的点突变(Katayama R2012 Sci Transl Med.2012年2月8日;4(120))。因此,ALK基因中的突变检测可用于辅助癌症疗法决策。
在一些实施方案中,在KRAS基因的全部或部分中鉴定一个或多个序列变体。已报道约15-25%的肺腺癌患者和40%的结直肠癌患者携带肿瘤相关的KRAS突变(参见,例如Neuman 2009,Pathol Res Pract.2009;205(12):858-62)。大多数突变位于KRAS基因的密码子12、13和61处。这些突变激活KRAS信号传导途径,触发肿瘤细胞的生长和增殖。一些研究表明携带KRAS突变的肿瘤患者不大可能从单独的抗-EGFR抗体疗法或与化疗联合的抗-EGFR抗体疗法获益(参见,例如Amado等人,2008J Clin On col.2008年4月1日;26(10):1626-34,Bokemeyer等人,2009J Clin Oncol.2009年2月10日;27(5):663-71)。可用于鉴定序列变异的序列变异的一个特定“热点”位于该基因的位置35。KRAS序列变体的鉴定可用于治疗选择,例如用于患有结直肠癌的受试者的治疗选择。
在一些实施方案中,在PIK3CA基因的全部或部分中鉴定一个或多个序列变体。在各种类型癌症,例如在10-30%的结直肠癌中经常发现PIK3CA的体细胞突变(参见,例如Samuels等人,2004Science.2004年4月23日;304(5670):554)。这些突变最常位于外显子9(螺旋结构域)和外显子20(激酶结构域)内的两个“热点”区域内,可专门靶向这两个“热点”区域进行扩增和/或分析以供序列变体检测。还可以专门靶向位置3140。
在一些实施方案中,在BRAF基因的全部或部分中鉴定一个或多个序列变体。已报道全部恶性黑素瘤中近50%都携带BRAF的体细胞突变(参见,例如Maldonado等人,J NatlCancer Inst.2003年12月17日;95(24):1878-90)。在所有黑素瘤亚型中均发现BRAF突变,但在来源于没有慢性日光诱导损伤的皮肤的黑素瘤中最常见。黑素瘤中最常见的BRAF突变是错义突变V600E,其将位置600处的缬氨酸置换为谷氨酰胺。BRAF V600E突变与BRAF抑制剂治疗的临床益处相关。BRAF突变的检测可用于黑素瘤治疗选择和针对靶向疗法的抗性研究。
在一些实施方案中,在EGFR基因的全部或部分中鉴定一个或多个序列变体。EGFR突变经常与非小细胞肺癌相关(在美国约为10%,在东亚为35%;参见例如Pao等人,ProcNatl Acad Sci US A.2004年9月7日;101(36):13306-11)。这些突变通常发生在EGFR外显子18-21内,并且通常是杂合的。这些突变中约90%是外显子19缺失或外显子21L858R点突变。
在一些实施方案中,在KIT基因的全部或部分中鉴定一个或多个序列变体。已报道近85%的胃肠道间质瘤(GIST)携带KIT突变(参见,例如Heinrich等人,2003J ClinOncol.2003年12月1日;21(23):4342-9)。大多数KIT突变见于在近膜域(外显子11,70%)、细胞外二聚化基序(外显子9,10-15%)、酪氨酸激酶I(TKI)结构域(外显子13,1-3%)和酪氨酸激酶2(TK2)结构域和活化环(外显子17,1-3%)中。通常在靶向疗法伊马替尼后并且患者对该疗法发展出耐药性后鉴定继发性KIT突变。
与癌症相关的基因(可根据本文所述的方法来分析其全部或一部分的序列变体)的其他非限制性实例包括但不限于PTEN;ATM;ATR;EGFR;ERBB2;ERBB3;ERBB4;Notch1;Notch2;Notch3;Notch4;AKT;AKT2;AKT3;HIF;HIF1a;HIF3a;Met;HRG;Bcl2;PPARα;PPARγ;WT1(Wilms肿瘤);FGF受体家族成员(5个成员:1、2、3、4、5);CDKN2a;APC;RB(成视网膜细胞瘤);MEN1;VHL;BRCA1;BRCA2;AR;(雄激素受体);TSG101;IGF;IGF受体;Igf1(4个变体);Igf2(3个变体);Igf 1受体;Igf 2受体;Bax;Bcl2;半胱天冬酶家族(9个成员:1、2、3、4、6、7、8、9、12);Kras;以及Apc。本文其他各处提供了其他实例。可基于根据本文公开的方法对一个或多个序列变体进行判别而诊断的癌症的实例包括但不限于棘皮瘤、腺泡细胞癌、听神经瘤、肢端着色斑性黑素瘤、顶端螺旋瘤、急性嗜酸细胞白血病、急性淋巴母细胞性白血病、急性巨核母细胞性白血病、急性单核细胞性白血病、成熟的急性成髓细胞白血病、急性髓样树突细胞白血病、急性髓样白血病、急性早幼粒细胞性白血病、釉质瘤、腺癌、腺样囊性癌、腺瘤、牙源性腺瘤样瘤、肾上腺皮质癌、成人T-细胞白血病、侵袭性NK-细胞白血病、AIDS相关癌症、AIDS相关淋巴瘤、软组织腺泡状肉瘤、成釉细胞纤维瘤、肛门癌、间变性大细胞淋巴瘤、甲状腺未分化癌、血管免疫母细胞性T细胞淋巴瘤、血管肌脂瘤、血管肉瘤、阑尾癌、星形细胞瘤、非典型性畸胎样横纹肌样瘤、基底细胞癌、基底细胞样癌、B-细胞白血病、B细胞淋巴瘤、Bellini管癌、胆道癌、膀胱癌、母细胞瘤、骨癌、骨瘤、脑干胶质瘤、脑瘤、乳腺癌、Brenner瘤、支气管瘤、细支气管肺泡癌、棕色瘤、伯基特淋巴瘤、原发灶不明的癌症、类癌瘤、癌、原位癌、阴茎癌、原发灶不明癌、癌肉瘤、Castleman病、中枢神经系统胚胎瘤、小脑星形细胞瘤、大脑星形细胞瘤、宫颈癌、胆管细胞癌、软骨瘤、软骨肉瘤、脊索瘤、绒毛膜癌、脉络丛乳头状瘤、慢性淋巴细胞白血病、慢性单核细胞性白血病、慢性髓性白血病、慢性骨髓增生性疾病、慢性嗜中性粒细胞白血病、明细胞肿瘤、结肠癌、结直肠癌、颅咽管瘤、皮肤T细胞淋巴瘤、Degos病、隆凸性皮肤纤维肉瘤、皮样囊肿、结缔组织增生性小圆细胞瘤、弥漫性大B细胞淋巴瘤、胚胎发育不良神经上皮瘤、胚胎癌、内胚窦瘤、子宫内膜癌、子宫内膜子宫癌、子宫内膜样肿瘤、肠病相关的T细胞淋巴瘤、室管膜母细胞瘤、室管膜瘤、上皮样肉瘤、红白血病、食管癌、鼻腔神经胶质瘤、尤因家族肿瘤、尤因家族肉瘤、尤因肉瘤、颅外生殖细胞瘤、性腺外生殖细胞瘤、肝外胆管癌、非乳腺性佩吉特病、输卵管癌、胎中胎、纤维瘤、纤维肉瘤、滤泡性淋巴瘤、滤泡性甲状腺癌、胆囊癌、神经节胶质瘤、神经节瘤、胃癌、胃淋巴瘤、胃肠癌、胃肠类癌瘤、胃肠间质瘤、生殖细胞肿瘤、生殖细胞瘤、妊娠性绒毛膜癌、妊娠滋养细胞瘤、骨巨细胞瘤、多形性胶质母细胞瘤、胶质瘤、大脑胶质瘤病、血管球瘤、胰高血糖素瘤、成性腺细胞瘤、粒层细胞瘤、毛细胞白血病、头颈癌、心脏癌、血管母细胞瘤、血管外皮细胞瘤、血管肉瘤、恶性血液肿瘤、肝细胞癌、肝脾T细胞淋巴瘤、遗传性乳腺癌-卵巢癌综合征、霍奇金淋巴瘤、霍奇金氏淋巴瘤、下咽癌、下丘脑胶质瘤、炎性乳腺癌、眼内黑素瘤、胰岛细胞癌、胰岛细胞瘤、幼年型粒单核细胞白血病、卡波西肉瘤、卡波西氏肉瘤、肾癌、Klatskin瘤、Krukenberg瘤、喉癌、恶性雀斑样痣黑素瘤、白血病、唇癌和口腔癌、脂肪肉瘤、肺癌、黄体瘤、淋巴管瘤、淋巴管肉瘤、淋巴上皮瘤、淋巴样白血病、淋巴瘤、巨球蛋白血症、恶性纤维组织细胞瘤、恶性纤维组织细胞瘤、骨恶性纤维组织细胞瘤、恶性胶质瘤、恶性间皮瘤、恶性外周神经鞘瘤、恶性棒状瘤、恶性特里顿瘤、MALT淋巴瘤、套细胞淋巴瘤、肥大细胞淋巴瘤、纵膈生殖细胞瘤、纵膈肿瘤、甲状腺髓样癌、髓母细胞瘤、髓上皮瘤、黑素瘤、脑膜瘤、Merkel细胞癌、间皮瘤、原发灶隐匿转移性鳞状颈癌、转移性尿路上皮癌、混合Mullerian瘤、单核细胞性白血病、口腔癌、粘液瘤、多发性内分泌瘤综合征、多发性骨髓瘤、蕈样肉芽肿病、骨髓增生异常疾病、骨髓增生异常综合征、髓样白血病、髓样肉瘤、骨髓增生性疾病、粘液瘤、鼻腔癌、鼻咽癌症、鼻咽癌、赘生物、神经鞘瘤、神经母细胞瘤、神经纤维瘤、神经瘤、结节型黑素瘤、非霍奇金淋巴瘤、非黑素瘤皮肤癌、非小细胞肺癌、眼肿瘤、少突星形细胞瘤、少突神经胶质瘤、嗜酸粒细胞腺瘤、视神经鞘脑膜瘤、口癌、口咽癌、骨肉瘤、卵巢癌、卵巢上皮癌、卵巢生殖细胞瘤、卵巢低恶性潜能肿瘤、乳腺Paget病、Pancoast瘤、胰腺癌、乳头状甲状腺癌、乳头状瘤病、副神经节瘤、副鼻窦癌、甲状旁腺癌、阴茎癌、血管周上皮样细胞瘤、咽癌、嗜铬细胞瘤、中度分化的松果体实质瘤、成松果体细胞瘤、垂体细胞瘤、垂体腺瘤、垂体瘤、浆细胞瘤、胸膜肺母细胞瘤、多胚瘤、前体T成淋巴细胞淋巴瘤、原发性中枢神经系统淋巴瘤、原发性渗出性淋巴瘤、原发性肝细胞癌、原发性肝癌、原发性腹膜癌、原始神经外胚层瘤、前列腺癌、腹膜假粘液瘤、直肠癌、肾细胞癌、涉及染色体15上NUT基因的呼吸道癌、视网膜母细胞瘤、横纹肌瘤、横纹肌肉瘤、Richter转化、骶尾部畸胎瘤、唾腺癌、肉瘤、施万鞘瘤神经鞘瘤病(Schwannomatosis)、皮脂腺癌、继发性肿瘤、精原细胞瘤、浆液性肿瘤、Sertoli-Leydig细胞瘤、性索间质瘤、Sezary综合征、Signet细胞癌、皮肤癌、小蓝圆细胞瘤、小细胞癌、小细胞肺癌、小细胞淋巴瘤、小肠癌、软组织肉瘤、生长抑素瘤、煤烟疣、脊髓瘤、脊髓肿瘤、脾边缘区淋巴瘤、鳞状细胞癌、胃癌、表浅扩散性黑素瘤、幕上原始神经外胚层瘤、表面上皮-间质瘤、滑膜肉瘤、T细胞急性淋巴母细胞性白血病、T细胞大颗粒淋巴细胞白血病、T细胞白血病、T细胞淋巴瘤、T细胞幼淋巴细胞白血病、畸胎瘤、晚期淋巴癌、睾丸癌、泡膜细胞瘤、喉癌、胸腺癌、胸腺瘤、甲状腺癌、肾盂和输尿管移行细胞癌、移行细胞癌、脐尿管癌、尿道癌、泌尿生殖系统肿瘤、子宫肉瘤、葡萄膜黑素瘤、阴道癌、Verner Morrison综合征、疣状癌、视通路胶质瘤、外阴癌、瓦尔登斯特伦巨球蛋白血症、Warthin瘤、维尔姆斯(Wilms)瘤,以及它们的组合。
表2中提供了与癌症的相关的基因(可根据本文所述的方法来分析其全部或一部分(例如,启动子区域、内含子、外显子等)的序列变体)的其他非限制性实例。
表2
Figure BDA0003622534420000561
Figure BDA0003622534420000571
Figure BDA0003622534420000581
Figure BDA0003622534420000591
Figure BDA0003622534420000601
Figure BDA0003622534420000611
Figure BDA0003622534420000621
Figure BDA0003622534420000631
Figure BDA0003622534420000641
Figure BDA0003622534420000651
Figure BDA0003622534420000661
Figure BDA0003622534420000671
Figure BDA0003622534420000681
Figure BDA0003622534420000691
Figure BDA0003622534420000701
Figure BDA0003622534420000711
Figure BDA0003622534420000721
在一方面,本公开内容提供了用于富集包含至少两个或更多个拷贝的靶多核苷酸的多联体的扩增子的试剂盒。试剂盒可包含本文关于各个方面中的任何方面以任何组合方式公开的一个或多个元件。在一些实施方案中,该试剂盒包含:(a)第一引物,其包含通过序列互补性与靶多核苷酸特异性杂交的第一3’端和不通过序列互补性与靶多核苷酸特异性杂交的包含第一共同序列的第一5’端;(b)第二引物,其包含通过序列互补性与多联体特异性杂交的第二3’端和不通过序列互补性与多联体特异性杂交的包含第二共同序列的第二5’端,其中第一共同序列和第二共同序列各自在5’端包含至少10个连续核苷酸并且当最佳比对时至少90%相同;以及(c)第三引物,其具有通过序列互补性与第一共同序列或第二共同序列特异性杂交的序列。试剂盒中的试剂和其他材料可以容纳在任何合适的容器中,并且可以是直接可用的形式,或者需要与试剂盒中的其他试剂或使用者提供的试剂进行组合(例如,浓缩的组合物的稀释或冻干组合物的重建)。试剂盒可提供缓冲液,其非限制性实例包括碳酸钠缓冲液、碳酸氢钠缓冲液、硼酸盐缓冲液、Tris缓冲液、MOPS缓冲液、HEPES缓冲液及其组合。试剂盒可包含对照样品,例如纯化的DNA,用作阳性对照或定量标准。在一些实施方案中,该试剂盒包含一种或多种用于扩增多核苷酸的酶,如逆转录酶和聚合酶中的一种或多种。在需要的情况下,本试剂盒可进一步包含一个或多个可检测标志物,以实现例对扩增产物积累的监测,如实时监测。上文描述了可检测标志物的非限制性实例,并且其包括在扩增步骤期间优先或排外地结合双链DNA的染料,如SYBR绿色染料或BEBO染料。在一些实施方案中,该试剂盒包含探针寡核苷酸,该探针寡核苷酸包含荧光团和淬灭剂以检测扩增反应的进展或产物。在一些实施方案中,该试剂盒包含根据本文公开的一种或多种方法的试剂盒使用说明书。在一些实施方案中,第一共同序列和第二共同序列是相同的。在一些实施方案中,第一共同序列、第二共同序列和第三引物的杂交序列均具有在彼此±5℃内的解链温度(Tm)。在一些实施方案中,沿靶多核苷酸从5’至3’对应于(i)与第一3’端互补的序列、(ii)与第二3’端相同的序列以及(iii)(i)与(ii)之间的间插序列的靶多核苷酸序列部分的组合长度为75个或更少的核苷酸。
在一方面,本公开内容提供了用于设计用于富集包含至少两个或更多个拷贝的靶多核苷酸的多联体的扩增子的引物的系统。关于本公开内容的各个方面中的任何方面,引物可包含本文所述的任何特征。在一些实施方案中,该系统包含:(a)计算机,其被配置用于接收客户请求以设计用于扩增指定靶序列的引物;(b)包含代码的计算机可读介质,该代码在由一个或多个处理器执行时设计至少三种用于扩增靶序列的引物,其中所述至少三种引物包含:(i)第一引物,其包含通过序列互补性与靶多核苷酸特异性杂交的第一3’端和不通过序列互补性与靶多核苷酸特异性杂交的包含第一共同序列的第一5’端;(ii)第二引物,其包含通过序列互补性与多联体特异性杂交的第二3’端和不通过序列互补性与多联体特异性杂交的包含第二共同序列的第二5’端,其中第一共同序列和第二共同序列各自在5’端包含至少10个连续核苷酸并且当最佳比对时至少90%相同,并且该多联体为第一引物的延伸产物;以及(iii)第三引物,其具有通过序列互补性与第一共同序列或第二共同序列特异性杂交的序列;以及(c)向接收者发送报告的报告生成器,其中该报告包含所述至少三种引物的序列。在一些实施方案中,第一共同序列和第二共同序列是相同的。在一些实施方案中,第一共同序列、第二共同序列和第三引物的杂交序列均具有在彼此±5℃内的解链温度(Tm)。在一些实施方案中,沿靶多核苷酸从5’至3’对应于(i)与第一3’端互补的序列、(ii)与第二3’端相同的序列以及(iii)(i)与(ii)之间的间插序列的靶多核苷酸序列部分的组合长度为75个或更少的核苷酸。
在一些实施方案中,所述计算机包含一个或多个处理器。处理器可以与一个或多个控制器、计算单元和/或计算机系统的其他单元相关联,或者根据需要植入固件中。如果在软件中实现,则例程可存储在任何计算机可读存储器中,诸如存储在RAM、ROM、闪速存储器、磁盘、激光盘或其他存储介质中。同样地,该软件可经由任何已知的传送方法而传送至计算设备,所述传送方法例如包括通过诸如电话线、因特网、无线连接等通信信道,或者经由诸如计算机可读盘、闪存驱动器等可移动介质。各个步骤可实现为各个块、操作、工具、模块或技术,而所述各个块、操作、工具、模块和技术继而可在硬件、固件、软件或其组合中实现。当在硬件中实现时,所述块、操作、技术等之中的一些或全部块、操作、技术可例如在定制集成电路(IC)、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)、可编程逻辑阵列(PLA)等中实现。在一些实施方案中,所述计算机被配置用于接收客户请求以设计用于扩增指定靶序列(其也可以由客户提供)的引物。所述计算机可直接(例如,通过输入设备如由客户操作的键盘、鼠标或触摸屏,或通过用户输入客户请求)或间接地(例如,通过有线或无线连接,包括经互联网)接收客户请求。
在一些实施方案中,所述系统包含向接受者发送报告的报告生成器,其中报告包含所述至少三种引物的序列。该报告生成器可响应于客户请求而自动发送报告。或者,该报告生成器可以响应于来自操作者的指令而发送报告。可以使用任何合适的通信介质将报告传送给本地或远程位置的接收者。例如,该通信介质可以是网络连接、无线连接或互联网连接。报告可通过这样的网络或连接(或任何其他合适的传送信息的手段,包括但不限于邮寄体检报告,诸如打印输出)传送,以供接收和/或由接收者查阅。接收者可以是但不限于客户或电子系统(例如,一个或多个计算机,和/或一个或多个服务器)。在一些实施方案中,报告生成器将报告发送给接收者的设备,诸如个人计算机、电话、平板电脑或其他设备。该报告可以被在线查看、保存在接收者的设备上或打印。
在一方面,本公开内容提供了一种包含代码的计算机可读介质,该代码一旦由一个或多个处理器执行,就实现根据任意本文公开方法的方法。计算机可读介质可以采取许多形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质例如包括光盘或磁盘(诸如任何计算机中的任何存储设备)等,诸如可用于实现计算步骤、处理步骤的存储介质等。易失性存储介质包括动态存储器,例如计算机的主存储器。有形传输介质包括同轴线缆、铜线和光纤,包括构成计算机系统内的总线的导线。载波传输介质可以采取电信号或电磁信号或者声波或光波的形式,诸如在射频(RF)和红外(IR)数据通信期间所生成的电信号或电磁信号或者声波或光波。因此,计算机可读介质的常见形式包括,例如:软盘、柔性盘、硬盘、磁带、任何其他磁介质、CD-ROM、DVD或DVD-ROM、任何其他光学介质、穿孔卡片纸带、任何具有孔洞图案的其他物理存储介质、RAM、PROM和EPROM、FLASH-EPROM、任何其他存储器芯片或盒、载波传输数据或指令、传输此类载波的缆线或链路,或者任何可让计算机从中读取编程代码和/或数据的其他介质。这些计算机可读介质的形式中的许多形式可参与向处理器传送一个或多个序列的一个或多个指令以供执行。
本发明提供了包括但不限于以下实施方式:
1.一种用于富集包含至少两个或更多个拷贝的靶多核苷酸的多联体的扩增子的方法,所述方法包括:
(a)通过延伸第一引物生成包含来自环状靶多核苷酸的单链多核苷酸的多联体,所述第一引物包含通过序列互补性与所述靶多核苷酸特异性杂交的第一3’端和不通过序列互补性与所述靶多核苷酸特异性杂交的包含第一共同序列的第一5’端;
(b)通过延伸第二引物生成包含一个或多个拷贝的所述靶多核苷酸的多种延伸产物,所述第二引物包含通过序列互补性与所述多联体特异性杂交的第二3’端和不通过序列互补性与所述多联体特异性杂交的包含第二共同序列的第二5’端,其中所述第一共同序列和所述第二共同序列各自在5’端包含至少10个连续核苷酸并且当最佳比对时至少90%相同;以及
(c)在生成多个扩增子的条件下扩增步骤(b)的所述多种延伸产物,其中富集包含至少2个或更多个拷贝的所述靶多核苷酸的扩增子。
2.如实施方式1所述的方法,其中步骤(a)通过具有链置换活性的聚合酶而实现。
3.如实施方式1所述的方法,其中所述第一共同序列和所述第二共同序列是相同的。
4.如实施方式1所述的方法,其中在步骤(c)的所述扩增中包括第三引物的引物延伸,其中所述第三引物包含通过序列互补性与所述第一共同序列或所述第二共同序列特异性杂交的序列。
5.如实施方式1所述的方法,其中(c)的所述扩增步骤产生的具有两个或更多个拷贝的所述靶多核苷酸的扩增子的百分比大于具有少于两个拷贝的所述靶多核苷酸的扩增子的百分比。
6.如实施方式5所述的方法,其中具有两个或更多个拷贝的所述靶多核苷酸的扩增子的百分比至少为90%。
7.如实施方式5所述的方法,其中具有两个或更多个拷贝的所述靶多核苷酸的扩增子的百分比至少为80%。
8.如实施方式5所述的方法,其中具有两个或更多个拷贝的所述靶多核苷酸的扩增子的百分比至少为60%。
9.如实施方式1所述的方法,其中所述延伸产物形成茎环结构,所述茎环结构包含(i)所述第一共同序列与所述第二共同序列的互补体之间的分子内杂交,或(ii)所述第二共同序列与所述第一共同序列的互补体之间的分子内杂交。
10.如实施方式9所述的方法,其中所述茎环结构的形成通过在退火步骤的温度保持在所述第三引物的解链温度±5℃内的情况下进行步骤(c)的扩增而实现。
11.如实施方式9所述的方法,其中所述茎环结构的形成通过在退火步骤保持在低于70℃的温度的情况下进行步骤(c)的扩增而实现。
12.如实施方式9所述的方法,其中所述茎环结构包含至少9个碱基对的分子内杂交。
13.如实施方式9所述的方法,其中所述茎环结构包含至少15个碱基对的分子内杂交。
14.如实施方式9所述的方法,其中所述茎环结构包含至少20个碱基对的分子内杂交。
15.如实施方式9所述的方法,其中所述茎环结构包含至少25个碱基对的分子内杂交。
16.如实施方式9所述的方法,其中所述茎环结构包含至少30个碱基对的分子内杂交。
17.如实施方式1所述的方法,其中步骤(b)包括不超过6个循环的所述第二引物的延伸。
18.如实施方式1所述的方法,其中步骤(b)包括不超过8个循环的所述第二引物的延伸。
19.如实施方式1所述的方法,其中步骤(b)包括不超过10个循环的所述第二引物的延伸。
20.如实施方式4所述的方法,其中所述第一共同序列、所述第二共同序列和所述第三引物的杂交序列均具有在彼此±5℃内的解链温度(Tm)。
21.如实施方式1所述的方法,其中所述环状靶多核苷酸是环化的无细胞DNA。
22.如实施方式1所述的方法,其中所述环状靶多核苷酸是基因组DNA的环化片段。
23.如实施方式1所述的方法,其中所述环状靶多核苷酸包含由染色体重排产生的序列。
24.如实施方式23所述的方法,其中所述染色体重排是缺失、重复、倒位和易位中的至少一种。
25.如实施方式1或23所述的方法,其中沿所述靶多核苷酸从5’至3’对应于(i)与所述第一3’端互补的序列、(ii)与所述第二3’端相同的序列以及(iii)(i)与(ii)之间的间插序列的所述靶多核苷酸的序列部分的组合长度为75个或更少的核苷酸。
26.如实施方式1所述的方法,其中至少50%的多联体包含长度为至少75个核苷酸的靶多核苷酸。
27.如实施方式1所述的方法,其中所述环状靶多核苷酸为单链。
28.如实施方式1所述的方法,其进一步包括对步骤(c)中产生的所述多个扩增子进行测序。
29.如实施方式28所述的方法,其中所述测序在没有相对于包含仅一个拷贝的所述靶多核苷酸的扩增子选择性地纯化包含两个或更多个拷贝的所述靶多核苷酸的扩增子的情况下进行。
30.如实施方式1所述的方法,其进一步包括对步骤(c)中产生的所述多个扩增子中包含两个或更多个拷贝的所述靶多核苷酸的扩增子进行纯化。
31.如实施方式30所述的方法,其进一步包括对经纯化的扩增子进行测序。
32.如实施方式1所述的方法,其中多种不同的靶多核苷酸在同一反应混合物中扩增。
33.一种用于富集包含至少两个或更多个拷贝的靶多核苷酸的多联体的扩增子的反应混合物,所述反应混合物包含:
(a)环状靶多核苷酸;
(b)第一引物,其包含通过序列互补性与所述靶多核苷酸特异性杂交的第一3’端和不通过序列互补性与所述靶多核苷酸特异性杂交的包含第一共同序列的第一5’端;以及
(c)第二引物,其包含通过序列互补性与所述多联体特异性杂交的第二3’端和不通过序列互补性与所述多联体特异性杂交的包含第二共同序列的第二5’端,其中所述第一共同序列和所述第二共同序列各自在5’端包含至少10个连续核苷酸并且当最佳比对时至少90%相同。
34.如实施方式33所述的反应混合物,其中所述第一共同序列和所述第二共同序列是相同的。
35.如实施方式33所述的反应混合物,其中所述反应混合物容纳在容器中。
36.如实施方式35所述的反应混合物,其中所述容器为孔、板、管、腔室、流动池或芯片。
37.如实施方式33所述的反应混合物,其进一步包含具有通过序列互补性与所述第一共同序列或所述第二共同序列特异性杂交的序列的第三引物。
38.如实施方式37所述的反应混合物,其中所述第一共同序列、所述第二共同序列和所述第三引物的杂交序列均具有在彼此±5℃内的解链温度(Tm)。
39.如实施方式33所述的反应混合物,其中所述第一共同序列和所述第二共同序列各自包含至少15个核苷酸。
40.如实施方式33所述的反应混合物,其中所述环状靶多核苷酸是环化的无细胞DNA。
41.如实施方式33所述的反应混合物,其中所述环状靶多核苷酸是基因组DNA的环化片段。
42.如实施方式33所述的反应混合物,其中所述环状靶多核苷酸包含由染色体重排产生的序列。
43.如实施方式42所述的反应混合物,其中所述染色体重排是缺失、重复、倒位和易位中的至少一种。
44.如实施方式33或42所述的反应混合物,其中沿所述靶多核苷酸从5’至3’对应于(i)与所述第一3’端互补的序列、(ii)与所述第二3’端相同的序列以及(iii)(i)与(ii)之间的间插序列的所述靶多核苷酸的序列部分的组合长度为75个或更少的核苷酸。
45.如实施方式33所述的反应混合物,其中所述环状靶多核苷酸为单链。
46.一种用于富集包含至少两个或更多个拷贝的靶多核苷酸的多联体的扩增子的试剂盒,所述试剂盒包含:
(a)第一引物,其包含通过序列互补性与所述靶多核苷酸特异性杂交的第一3’端和不通过序列互补性与所述靶多核苷酸特异性杂交的包含第一共同序列的第一5’端;
(b)第二引物,其包含通过序列互补性与所述多联体特异性杂交的第二3’端和不通过序列互补性与所述多联体特异性杂交的包含第二共同序列的第二5’端,其中所述第一共同序列和所述第二共同序列各自在5’端包含至少10个连续核苷酸并且当最佳比对时至少90%相同,并且所述多联体为所述第一引物的延伸产物;以及
(c)第三引物,其具有通过序列互补性与所述第一共同序列或所述第二共同序列特异性杂交的序列。
47.如实施方式46所述的试剂盒,其中所述第一共同序列和所述第二共同序列是相同的。
48.如实施方式46所述的试剂盒,其中所述第一共同序列、所述第二共同序列和所述第三引物的杂交序列均具有在彼此±5℃内的解链温度(Tm)。
49.如实施方式46所述的试剂盒,其中沿所述靶多核苷酸从5’至3’对应于(i)与所述第一3’端互补的序列、(ii)与所述第二3’端相同的序列以及(iii)(i)与(ii)之间的间插序列的所述靶多核苷酸的序列部分的组合长度为75个或更少的核苷酸。
50.一种用于设计用于富集包含至少两个或更多个拷贝的靶多核苷酸的多联体的扩增子的引物的系统,所述系统包含:
(a)计算机,其被配置为接收客户请求以设计用于扩增指定靶序列的引物;
(b)包含代码的计算机可读介质,所述代码在由一个或多个处理器执行时设计至少三种用于扩增所述靶序列的引物,其中所述至少三种引物包含:
(i)第一引物,其包含通过序列互补性与所述靶多核苷酸特异性杂交的第一3’端和不通过序列互补性与所述靶多核苷酸特异性杂交的包含第一共同序列的第一5’端;
(ii)第二引物,其包含通过序列互补性与所述多联体特异性杂交的第二3’端和不通过序列互补性与所述多联体特异性杂交的包含第二共同序列的第二5’端,其中所述第一共同序列和所述第二共同序列各自在5’端包含至少10个连续核苷酸并且当最佳比对时至少90%相同,并且所述多联体为所述第一引物的延伸产物;以及
(iii)第三引物,其具有通过序列互补性与所述第一共同序列或所述第二共同序列特异性杂交的序列;以及
(c)向接收者发送报告的报告生成器,其中所述报告包含所述至少三种引物的序列。
51.如实施方式50所述的系统,其中所述第一共同序列和所述第二共同序列是相同的。
52.如实施方式50所述的系统,其中所述第一共同序列、所述第二共同序列和所述第三引物的杂交序列均具有在彼此±5℃内的解链温度(Tm)。
53.如实施方式50所述的系统,其中沿所述靶多核苷酸从5’至3’对应于(i)与所述第一3’端互补的序列、(ii)与所述第二3’端相同的序列以及(iii)(i)与(ii)之间的间插序列的所述靶多核苷酸的序列部分的组合长度为75个或更少的核苷酸。
54.一种进行滚环扩增的方法,其包括:
(a)提供包含靶多核苷酸的环状多核苷酸;
(b)使扩增反应混合物经受多个循环的滚环扩增以生成包含多联体的多种扩增产物,其中所述扩增反应混合物包含(i)具有链置换活性的聚合酶,(ii)所述环状多核苷酸,以及(iii)引物;且其中所述多个循环的滚环扩增中的每个循环均包含在变性温度下的变性、在退火温度下的引物退火以及在延伸温度下持续给定延伸时间段的引物延伸,从而生成所述多种扩增产物;并且
其中生成的所述多种扩增产物的特征在于与通过利用变性和引物退火条件相当但延伸时间段相当于所述多个循环的延伸时间段之和的一个扩增循环生成的多种扩增产物相比,其含有更高比例的具有至少两个拷贝的所述靶多核苷酸的多联体。
55.一种提高由滚环扩增生成的具有至少两个拷贝的靶多核苷酸的多联体的比例的方法,所述方法包括:
(a)提供包含靶多核苷酸的环状多核苷酸;
(b)使扩增反应混合物经受多个循环的滚环扩增以生成包含多联体的多种扩增产物,其中所述扩增反应混合物包含(i)具有链置换活性的聚合酶,(ii)所述环状多核苷酸,以及(iii)引物;且其中所述多个循环的滚环扩增中的每个循环均包含在变性温度下的变性、在退火温度下的引物退火以及在延伸温度下持续给定延伸时间段的引物延伸,从而生成所述多种扩增产物;
由此提高具有至少两个拷贝的所述靶多核苷酸的多联体的比例。
56.如实施方式55所述的方法,其中与通过利用变性和引物退火条件相当但延伸时间段相当于所述多个循环的延伸时间段之和的一个扩增循环生成的多种扩增产物相比,所述多种扩增产物中具有至少两个拷贝的所述靶多核苷酸的多联体的比例增加。
57.如实施方式54或55所述的方法,其中所述聚合酶选自:Bsu DNA聚合酶、Vent聚合酶、Bst DNA聚合酶、phi29 DNA聚合酶、PyroPhage 3173聚合酶、其任何变体及其任何片段。
58.如实施方式54或55所述的方法,其中当所述反应混合物中使用的环状多核苷酸包含人无细胞DNA(cfDNA)时,所述多种扩增产物展现出约180个碱基对的平均片段长度。
59.如实施方式54或55所述的方法,其中当所述反应混合物中使用的环状多核苷酸包含人无细胞DNA(cfDNA)时,所述多种扩增产物展现出约170个碱基对的中值片段长度。
60.如实施方式54或55所述的方法,其中当所述反应混合物中使用的环状多核苷酸包含人无细胞DNA(cfDNA)时,所述多种扩增产物展现出约40个碱基至约450个碱基的片段长度分布。
61.如实施方式54或55所述的方法,其中当所述反应混合物中使用的环状多核苷酸包含人无细胞DNA(cfDNA)时,所述多种扩增产物展现出约100个碱基至约200个碱基的片段长度分布。
62.如实施方式56所述的方法,其中具有至少两个拷贝的所述靶多核苷酸的多联体的比例增加至少约1%。
63.如实施方式54或55所述的方法,其进一步包括在所述多个循环的滚环扩增中的至少一个循环之后用所述聚合酶补充所述反应混合物。
64.如实施方式54或55所述的方法,其中所述环状多核苷酸具有约40个碱基至约500个碱基的长度。
65.如实施方式54或55所述的方法,其中所述环状多核苷酸包含无细胞DNA(cfDNA)。
66.如实施方式54或55所述的方法,其中所述环状多核苷酸包含基因组DNA的片段。
67.如实施方式54或55所述的方法,其中所述环状多核苷酸包含由染色体重排产生的序列。
68.如实施方式67所述的方法,其中所述染色体重排是缺失、重复、倒位和易位中的至少一种。
69.如实施方式54或55所述的方法,其中所述环状多核苷酸为双链。
70.如实施方式54或55所述的方法,其中所述环状多核苷酸为单链。
71.如实施方式54或55所述的方法,其中多种不同的环状多核苷酸在所述扩增反应混合物中扩增。
72.如实施方式54或55所述的方法,其中所述多个循环包括至少两个循环。
73.如实施方式54或55所述的方法,其中所述多个循环中的每个循环均包含在约75℃至约95℃的变性温度下持续约5秒至约60秒的变性,(ii)在约45℃至约65℃的退火温度下持续约5秒至约60秒的引物退火,以及(iii)在约65℃至约75℃的延伸温度下持续约30秒至约10分钟的延伸时间段的引物延伸。
74.如实施方式54或55所述的方法,其中所述多个循环中的每个循环均包含在约80℃的变性温度下持续约15秒至约30秒的变性,(ii)在约50℃的退火温度下持续约15秒至约45秒的引物退火,以及(iii)在约70℃的延伸温度下续约3分钟至约10分钟的延伸时间段的引物延伸。
75.如实施方式54或55所述的方法,其中所述引物包含随机序列。
76.如实施方式54或55所述的方法,其中所述引物包含基因特异性序列。
77.如实施方式54或55所述的方法,其中所述引物包括第一引物,该第一引物包含(i)通过序列互补性与所述环状多核苷酸特异性杂交的第一3’端,和(ii)不通过序列互补性与所述靶多核苷酸特异性杂交的包含第一共同序列的第一5’端,其中在所述多个循环的滚环扩增期间,通过使用所述环状多核苷酸作为模板延伸所述第一引物来生成包含单链多核苷酸的多联体。
78.如实施方式77所述的方法,其中所述引物包括第二引物,所述第二引物包含(i)通过序列互补性与所述包含单链多核苷酸的多联体特异性杂交的第二3’端,和(ii)不通过序列互补性与所述多联体特异性杂交的包含第二共同序列的第二5’端,其中在所述多个循环的滚环扩增期间,通过使用所述多联体作为模板延伸所述第二引物来生成包含一个或多个拷贝的所述靶多核苷酸的多种延伸产物。
79.如实施方式78所述的方法,其中所述第一共同序列和所述第二共同序列各自在5’端包含至少10个连续核苷酸,并且当最佳比对时至少90%相同。
80.如实施方式79所述的方法,其中所述第一共同序列和所述第二共同序列是相同的。
81.如实施方式78所述的方法,其进一步包括在生成多个扩增子的条件下扩增所述多种延伸产物,其中富集包含至少2个或更多个拷贝的所述靶多核苷酸的扩增子。
82.如实施方式81所述的方法,其中扩增包括第三引物的引物延伸,其中所述第三引物包含通过序列互补性与所述第一共同序列或所述第二共同序列特异性杂交的序列。
83.如实施方式81所述的方法,其中扩增产生的具有两个或更多个拷贝的所述靶多核苷酸的扩增子的百分比大于具有少于两个拷贝的所述靶多核苷酸的扩增子的百分比。
84.如实施方式83所述的方法,其中具有两个或更多个拷贝的所述靶多核苷酸的扩增子的百分比至少为5%。
85.如实施方式84所述的方法,其中具有两个或更多个拷贝的所述靶多核苷酸的扩增子的百分比至少为10%。
86.如实施方式85所述的方法,其中具有两个或更多个拷贝的所述靶多核苷酸的扩增子的百分比至少为20%。
87.如实施方式86所述的方法,其中具有两个或更多个拷贝的所述靶多核苷酸的扩增子的百分比至少为30%。
88.如实施方式87所述的方法,其中具有两个或更多个拷贝的所述靶多核苷酸的扩增子的百分比至少为40%。
89.如实施方式88所述的方法,其中具有两个或更多个拷贝的所述靶多核苷酸的扩增子的百分比至少为60%。
90.如实施方式89所述的方法,其中具有两个或更多个拷贝的所述靶多核苷酸的扩增子的百分比至少为80%。
91.如实施方式90所述的方法,其中具有两个或更多个拷贝的所述靶多核苷酸的扩增子的百分比至少为90%。
92.如实施方式78-80中任一项所述的方法,其中所述多种延伸产物形成茎环结构,所述茎环结构包含(i)所述第一共同序列与所述第二共同序列的互补体之间的分子内杂交,或(ii)所述第二共同序列与所述第一共同序列的互补体之间的分子内杂交。
93.如实施方式92所述的方法,其中所述茎环结构的形成通过在退火步骤的温度保持在所述第三引物的解链温度±5℃内的情况下进行扩增而实现。
94.如实施方式92所述的方法,其中所述茎环结构的形成通过在退火步骤保持在低于约70℃的温度的情况下进行扩增而实现。
95.如实施方式92所述的方法,其中所述茎环结构包含至少9个碱基对的分子内杂交。
96.如实施方式95所述的方法,其中所述茎环结构包含至少15个碱基对的分子内杂交。
97.如实施方式96所述的方法,其中所述茎环结构包含至少20个碱基对的分子内杂交。
98.如实施方式97所述的方法,其中所述茎环结构包含至少25个碱基对的分子内杂交。
99.如实施方式98所述的方法,其中所述茎环结构包含至少30个碱基对的分子内杂交。
100.如实施方式82所述的方法,其中所述第一共同序列、所述第二共同序列和所述第三引物的杂交序列均具有在彼此±5℃内的解链温度(Tm)。
101.如实施方式78-80中任一项所述的方法,其中沿所述靶多核苷酸从5’至3’对应于(i)与所述第一3’端互补的序列、(ii)与所述第二3’端相同的序列以及(iii)(i)与(ii)之间的间插序列的所述靶多核苷酸的序列部分的组合长度为75个或更少的核苷酸。
102.如实施方式54-101中任一项所述的方法,其进一步包括对所述包含多联体的多种扩增产物进行测序。
103.如实施方式102所述的方法,其中所述测序在没有选择性地将具有至少两个拷贝的所述靶多核苷酸的多联体与包含少于两个拷贝的所述靶多核苷酸的多联体相分离的情况下进行。
104.如实施方式54-101中任一项所述的方法,其进一步包括将包含至少两个拷贝的所述靶多核苷酸的多联体与包含少于两个拷贝的所述靶多核苷酸的多联体相分离。
105.如实施方式104所述的方法,其进一步包括对所述包含至少两个拷贝的靶多核苷酸的多联体进行测序。
实施例
下列实施例是为了说明本发明的各种实施方案而给出的,并非意在以任何方式限制本发明。这些实施例以及其中描述的方法目前均代表优选的实施方案,是示例性的,并且不应作为对本发明范围的限制。本领域技术人员将会想到由权利要求范围限定的本发明精神内所包含的其变化和其他用途。
实施例1:来自一个RCA扩增循环和多个RCA扩增循环的产物的比较
将基因组DNA超声处理至约180bp的平均片段大小。用0.9xAmpure珠将片段化DNA纯化以去除小于100bp的片段。然后将超声处理的基因组DNA连接以形成环状靶多核苷酸。为了连接,12μl经纯化的DNA片段(>10ng)通过在95℃下加热30秒并在冰上冷却2分钟而变性。然后,将含有2μl 10x CircLigase缓冲液、4μl 5M甜菜碱、1μl 50mM MnCl2和1μlCircLigase II的8μl连接混合物添加至变性的DNA样品,并且将该反应在60℃下温育至少12小时。在连接过程结束时,通过外切核酸酶处理步骤去除剩余的线性单链DNA分子。对于外切核酸酶处理,将连接产物在80℃下加热45秒,然后添加1μl外切核酸酶混合物(ExoI20U/μl:ExoIII 100U/μl,比例为1:2)。将样品在热循环仪上于37℃下温育30分钟,然后在80℃下温育20分钟。外切核酸酶处理后,向每个管添加1μl 50mM EDTA。
使环状靶多核苷酸经受一个RCA扩增循环或多重RCA扩增。对于一个RCA扩增循环和多个RCA扩增循环,均使用10ng环化DNA样品作为起始材料。对于每个反应,向每10ng DNA样品添加0.34μL 1M Tris-HCl(pH9.2)、1μl 100mM MgSO4、2.78μl 180mM(NH4)2SO4、0.75uL dNTP混合物(各25mM)、0.5μl 10%吐温20、1.20μl 1M KCl、2μl 10μM背靠背正向和反向引物、18.28μl水。将反应在80℃下加热1分钟,并在63℃下温育5分钟,然后冷却至4℃。接下来,向每个反应添加15个单位的Bst 2.0热启动DNA聚合酶。对于一个RCA扩增循环,将反应在63℃下温育2小时。对于多个RCA扩增循环,将反应在具有以下程序的热循环仪中温育:8个循环的60℃持续30秒;70℃持续4.5分钟;94℃持续20秒;和58℃持续10秒。在每两个循环结束时,添加15个单位的Bst 2.0热启动DNA聚合酶。
根据制造商关于剩余洗涤步骤的说明,通过添加50μl Ampure珠来纯化所有扩增产物。对于洗脱,将55μl洗脱缓冲液添加至每个管,并将珠在65℃下温育5分钟。短暂旋转后,将管返回到磁体。从每个反应回收约50μl洗脱产物。
对于来自一个RCA循环的扩增产物的衔接子附接,每50μl洗脱液与5.7μl 10xAccuPrime缓冲液、1μl 25μM衔接子引物(其与在先前扩增反应中使用的引物的3’端处的共同序列互补)和2个单位的AccuPrime HiFi Taq聚合酶混合。通过使用以下PCR程序进行扩增来附接衔接子:95℃持续2分钟;30个循环的95℃持续30秒、60℃持续30秒、72℃持续2.5分钟;以及在72℃下持续7分钟的最终延伸。对于来自多个RCA循环的扩增产物,使用Illumina的KAPA hyper prep试剂盒来附接测序衔接子。通过琼脂糖凝胶或下一代测序对PCR扩增的文库产物进行分析。为了对测序数据进行生物信息学分析,从HiSeq运行获得FASTQ文件。将FASTQ文件与包含靶序列的参考文件比对。基于测序数据计算插入物大小。
如图5的琼脂糖凝胶中定性示出的,与一个RCA循环相比,利用B2B引物和温度循环的扩增产生包含更多多核苷酸拷贝的扩增子,以及具有更长靶多核苷酸的扩增子。在图6中,该表提供了通过琼脂糖凝胶的强度分析进行的对包含一个重复(约150bp大小)、两个重复(约300bp)或3个重复(约450bp)的产物之比的半定量比较。与一个RCA循环相比,多个RCA循环减少了只有1个重复的产物的相对量。
扩增产物的测序分析还表明,与一个RCA循环相比,使用多个RCA循环时较大DNA片段的比例增加。图7以读取计数示出了片段大小分布,而图8以分子百分比示出了所观察到的分子大小的分布。
实施例2:使用具有茎结构的引物或不具有茎结构的引物进行多个RCA循环产生的产物的比较
将基因组DNA超声处理至约150bp的平均片段大小。用0.9xAmpure珠将片段化DNA纯化以去除小于100bp的片段。然后将超声处理的基因组DNA连接以形成环状靶多核苷酸。为了连接,12μl经纯化的DNA片段(>10ng)通过在95℃下加热30秒并在冰上冷却2分钟而变性。然后,将含有2μl 10x CircLigase缓冲液、4μl 5M甜菜碱、1μl 50mM MnCl2和1μlCircLigase II的8μl连接混合物添加至变性的DNA样品,并且将该反应在60℃下温育至少12小时。在连接过程结束时,通过外切核酸酶处理步骤去除剩余的线性单链DNA分子。对于外切核酸酶处理,将连接产物在80℃下加热45秒,然后添加1μl外切核酸酶混合物(ExoI20U/μl:ExoIII 100U/μl,比例为1:2)。将样品在热循环仪上于37℃下温育30分钟,然后在80℃下温育20分钟。外切核酸酶处理后,向每个管添加1μl 50mM EDTA。
使环状靶多核苷酸经受使用能够形成19聚体茎结构的引物或设计成无茎结构的引物的多个RCA扩增循环。能够形成茎结构的示例性常见序列包括表1中提供的那些序列及其任何片段。
对于每个反应,向每10ng DNA样品添加0.34μL 1M Tris-HCl(pH9.2)、1μl 100mMMgSO4、2.78μl 180mM(NH4)2SO4、0.75μLdNTP混合物(各25mM)、0.5μl 10%吐温20、1.20μl1M KCl、2μl10μM背靠背正向和反向引物、18.28μl水。将反应在80℃下加热1分钟,并在63℃下温育5分钟,然后冷却至4℃。接下来,向每个反应添加15个单位的Bst 2.0热启动DNA聚合酶。将反应在具有以下程序的热循环仪中温育:8个循环的60℃持续30秒;70℃持续4.5分钟;94℃持续20秒;和58℃持续10秒。在每两个循环结束时,添加15个单位的Bst 2.0热启动DNA聚合酶。
根据制造商关于剩余洗涤步骤的说明,通过添加50μl Ampure珠来纯化所有扩增产物。对于洗脱,将55μl洗脱缓冲液添加至每个管,并将珠在65℃下温育5分钟。短暂旋转后,将管返回到磁体。从每个反应回收约50μl洗脱产物。
使用Illumina的KAPA hyper prep试剂盒来附接测序衔接子。通过琼脂糖凝胶分析PCR扩增的文库产物,并进一步收集在大小范围550bp-1000bp内的产物以供测序。通过测序来分析所得的扩增产物。为了对测序数据进行生物信息学分析,从HiSeq运行获得FASTQ文件。将FASTQ文件与包含靶序列的参考文件比对。基于测序数据计算插入物大小。
如表3所示,利用包含茎结构的B2B引物和温度循环进行扩增产生了含有更多多核苷酸拷贝的扩增子。表3列出了包含多于一个重复的测序读取的百分比。与无茎引物相比,使用具有19个碱基茎的引物的扩增显著增加了具有多于一个重复的读取的百分比。
表3
用于RCA的引物 具有重复的读取的百分比
19聚体茎的引物 64.62%
无茎的引物 31.49%
实施例3:从混合基因组DNA样品检测低频融合等位基因
在许多癌症类型中观察到染色体重排。本实施例描述了用于使用环化DNA分子和背靠背(B2B)引物设计来检测融合等位基因的方法。该方法能够在没有预先知晓‘配偶体’基因的情况下进行DNA样品的融合检测,并且可应用于筛选无细胞DNA或基因组DNA样品中的基因重排事件。
将来自含有50%EML4/ALK融合等位基因的EML4/ALK DNA标准参照物(HD664Horizon Diagnostics)的基因组DNA和参照基因组DNA超声处理至约150bp的平均片段大小。用0.9x Ampure珠将片段化DNA纯化以去除小于100bp的片段。为了连接,12μl经纯化的DNA片段(>10ng)通过在95℃下加热30秒并在冰上冷却2分钟而变性。然后,将含有2μl 10xCircLigase缓冲液、4μl 5M甜菜碱、1μl 50mM MnCl2和1μl CircLigase II的8μl连接混合物添加至变性的DNA样品,并且将该反应在60℃下温育至少12小时。在连接过程结束时,通过外切核酸酶处理步骤去除剩余的线性单链DNA分子。对于外切核酸酶处理,将连接产物在80℃下加热45秒,然后添加1μl外切核酸酶混合物(ExoI 20U/μl:ExoIII 100U/μl,比例为1:2)并在热循环仪上于37℃下温育30分钟,然后在80℃下温育20分钟。外切核酸酶处理后,向每个管添加1μl 50mM EDTA。
然后将超声处理的基因组DNA连接以形成环状靶多核苷酸。通过qPCR对两个环化DNA样品、HD664和参照基因组DNA进行定量,之后混合在一起以获得以浓度计2.5%、0.5%、0.05%和0%的融合等位基因(图9)。对于滚环扩增,使用10ng每种混合DNA样品作为起始材料。对于每个反应,向每10ng DNA样品添加0.34μL 1M Tris-HCl(pH9.2)、1μl 100mMMgSO4、2.78μl 180mM(NH4)2SO4、0.75μL dNTP混合物(各25mM)、0.5μl 10%吐温20、1.20μl1M KCl、被特别设计用于靶向ALK/EML4融合区域的2μl 10μM正向和反向引物(表4中提供的引物序列)、18.28μl水。将反应在80℃下加热1分钟,并在63℃下温育5分钟,之后冷却至4℃。向每个反应添加15个单位的Bst2.0热启动DNA聚合酶,然后将每个反应在63℃下温育2小时。
表4.用于ALK融合检测的正向和反向引物序列
寡核苷酸名称 寡核苷酸序列
HD664_ALK_F CCTTGGCACCCGAGAATTCCATTTGAGGGATGGCACCATAT
HD664_ALK_R GTTCAGAGTTCTACAGTCCGACGATCGGGACAGGATAATAGGAGCTAACA
根据制造商关于剩余洗涤步骤的说明,通过添加50μl Ampure珠来纯化所有扩增产物。对于洗脱,将55μl洗脱缓冲液添加至每个管,并将珠在65℃下温育5分钟。短暂旋转后,将管返回到磁体。从每个反应回收约50μl洗脱产物。将每50μl洗脱液与5.7μl 10xAccuPrime缓冲液、1μl 25uM每种Illumina测序文库衔接子引物,和2个单位的AccuPrimeHiFi Taq聚合酶混合。通过扩增的衔接子附接使用以下PCR程序:95℃持续2分钟;25个循环的95℃持续30秒、60℃持续30秒、72℃持续2.5分钟;以及在72℃下持续7分钟的最终延伸。通过琼脂糖凝胶分析PCR产物,并收集在大小范围550bp-1000bp内的产物以供测序。
为了对测序数据进行生物信息学分析,从HiSeq运行获得FASTQ文件。将FASTQ文件与包含靶序列的参考文件比对。如图10所示,在样品中发现了具有2.5%、0.5%或0.05%的融合等位基因掺入的融合等位基因,但在样品中未发现具有0%融合等位基因掺入的融合等位基因。
实施例4:在利用B2B引物的多重RCA中的靶标检测
在多个RCA和利用B2B引物的扩增中检测样品中多种靶多核苷酸的成分靶多核苷酸。将从人血清样品(H6914,Sigma)提取的20ng对照cfDNA重悬于共12μl的Tris pH 8缓冲液中,并通过在95℃下加热30秒并在冰上冷却2分钟而变性。然后,将含有2μl 10xCircLigase缓冲液、4μl 5M甜菜碱、1μl 50mM MnCl2和1μl CircLigase II的8μl连接混合物添加至变性的DNA样品,并且将反应在60℃下温育至少12小时。在连接过程结束时,通过外切核酸酶处理步骤去除剩余的线性单链DNA分子。对于外切核酸酶处理,将连接产物在80℃下加热45秒,然后添加1μl外切核酸酶混合物(ExoI 20U/μl:ExoIII100U/μl,比例为1:2)。将样品在热循环仪上于37℃下温育30分钟,然后在80℃下温育20分钟。外切核酸酶处理后,向每个管添加1μl50mM EDTA。
使环状靶多核苷酸经受滚环扩增以及随后用B2B引物进行的扩增。表5中提供了B2B引物的实例。
表5.背靠背B2B引物的实例
Figure BDA0003622534420000921
Figure BDA0003622534420000931
Figure BDA0003622534420000941
Figure BDA0003622534420000951
对于每个反应,向每10ng DNA样品添加0.34μL 1M Tris-HCl(pH9.2)、1μl 100mMMgSO4、2.78μl 180mM(NH4)2SO4、0.75μLdNTP混合物(各25mM)、0.5μl 10%吐温20、1.20μl1M KCl、2μl10μM背靠背正向和反向引物(图11的靶标列表中列出的8个配对引物靶向特异性靶标的混合物)、18.28μl水。将反应在80℃下加热1分钟,并在63℃下温育5分钟,然后冷却至4℃。接下来,向每个反应添加15个单位的Bst 2.0热启动DNA聚合酶。对于用B2B引物进行的等温扩增,将该反应在63℃下温育2小时。
根据制造商关于剩余洗涤步骤的说明,通过添加50μl Ampure珠来纯化所有扩增产物。对于洗脱,将55μl洗脱缓冲液添加至每个管,并将珠在65℃下温育5分钟。短暂旋转后,将管返回到磁体。从每个反应回收约50μl洗脱产物。
针对衔接子附接,将每50μl洗脱液与5.7μl 10x AccuPrime缓冲液、1μl 25uM衔接子引物(其与在等温和B2B扩增中使用的引物的3’端处的共同序列互补)和2个单位的AccuPrime HiFi Taq聚合酶混合。通过使用以下PCR程序进行扩增来附接衔接子:95℃持续2分钟;30个循环的95℃持续30秒、60℃持续30秒、72℃持续2.5分钟;以及在72℃下持续7分钟的最终延伸。通过琼脂糖凝胶对PCR产物进行分析,并进一步收集在大小范围550bp-1000bp内的产物以供测序。通过测序对所得的扩增产物进行分析。如图11所示的序列分析结果表明在多重反应中可检测到多种靶多核苷酸序列。
尽管本文中已经示出并描述了本发明的优选实施方案,但对于本领域技术人员显而易见的是,这些实施方案仅以示例的方式提供。本领域技术人员在不脱离本发明的情况下现将想到多种变化、改变和替代。应当理解,本文中所述的本发明实施方案的各种替代方案均可用于实施本发明。旨在由以下权利要求来限定本发明的范围,并由此涵盖这些权利要求范围内的方法和结构及其等同物。

Claims (10)

1.一种用于富集包含至少两个或更多个拷贝的靶多核苷酸的多联体的扩增子的方法,所述方法包括:
(a)通过延伸第一引物生成包含来自环状靶多核苷酸的单链多核苷酸的多联体,所述第一引物包含通过序列互补性与所述靶多核苷酸特异性杂交的第一3’端和不通过序列互补性与所述靶多核苷酸特异性杂交的包含第一共同序列的第一5’端;
(b)通过延伸第二引物生成包含一个或多个拷贝的所述靶多核苷酸的多种延伸产物,所述第二引物包含通过序列互补性与所述多联体特异性杂交的第二3’端和不通过序列互补性与所述多联体特异性杂交的包含第二共同序列的第二5’端,其中所述第一共同序列和所述第二共同序列各自在5’端包含至少10个连续核苷酸并且当最佳比对时至少90%相同;以及
(c)在生成多个扩增子的条件下扩增步骤(b)的所述多种延伸产物,其中富集包含至少2个或更多个拷贝的所述靶多核苷酸的扩增子。
2.如权利要求1所述的方法,其中步骤(a)通过具有链置换活性的聚合酶而实现。
3.如权利要求1所述的方法,其中所述第一共同序列和所述第二共同序列是相同的。
4.如权利要求1所述的方法,其中在步骤(c)的所述扩增中包括第三引物的引物延伸,其中所述第三引物包含通过序列互补性与所述第一共同序列或所述第二共同序列特异性杂交的序列。
5.如权利要求1所述的方法,其中(c)的所述扩增步骤产生的具有两个或更多个拷贝的所述靶多核苷酸的扩增子的百分比大于具有少于两个拷贝的所述靶多核苷酸的扩增子的百分比。
6.一种用于富集包含至少两个或更多个拷贝的靶多核苷酸的多联体的扩增子的反应混合物,所述反应混合物包含:
(a)环状靶多核苷酸;
(b)第一引物,其包含通过序列互补性与所述靶多核苷酸特异性杂交的第一3’端和不通过序列互补性与所述靶多核苷酸特异性杂交的包含第一共同序列的第一5’端;以及
(c)第二引物,其包含通过序列互补性与所述多联体特异性杂交的第二3’端和不通过序列互补性与所述多联体特异性杂交的包含第二共同序列的第二5’端,其中所述第一共同序列和所述第二共同序列各自在5’端包含至少10个连续核苷酸并且当最佳比对时至少90%相同。
7.一种用于富集包含至少两个或更多个拷贝的靶多核苷酸的多联体的扩增子的试剂盒,所述试剂盒包含:
(a)第一引物,其包含通过序列互补性与所述靶多核苷酸特异性杂交的第一3’端和不通过序列互补性与所述靶多核苷酸特异性杂交的包含第一共同序列的第一5’端;
(b)第二引物,其包含通过序列互补性与所述多联体特异性杂交的第二3’端和不通过序列互补性与所述多联体特异性杂交的包含第二共同序列的第二5’端,其中所述第一共同序列和所述第二共同序列各自在5’端包含至少10个连续核苷酸并且当最佳比对时至少90%相同,并且所述多联体为所述第一引物的延伸产物;以及
(c)第三引物,其具有通过序列互补性与所述第一共同序列或所述第二共同序列特异性杂交的序列。
8.一种用于设计用于富集包含至少两个或更多个拷贝的靶多核苷酸的多联体的扩增子的引物的系统,所述系统包含:
(a)计算机,其被配置为接收客户请求以设计用于扩增指定靶序列的引物;
(b)包含代码的计算机可读介质,所述代码在由一个或多个处理器执行时设计至少三种用于扩增所述靶序列的引物,其中所述至少三种引物包含:
(i)第一引物,其包含通过序列互补性与所述靶多核苷酸特异性杂交的第一3’端和不通过序列互补性与所述靶多核苷酸特异性杂交的包含第一共同序列的第一5’端;
(ii)第二引物,其包含通过序列互补性与所述多联体特异性杂交的第二3’端和不通过序列互补性与所述多联体特异性杂交的包含第二共同序列的第二5’端,其中所述第一共同序列和所述第二共同序列各自在5’端包含至少10个连续核苷酸并且当最佳比对时至少90%相同,并且所述多联体为所述第一引物的延伸产物;以及
(iii)第三引物,其具有通过序列互补性与所述第一共同序列或所述第二共同序列特异性杂交的序列;以及
(c)向接收者发送报告的报告生成器,其中所述报告包含所述至少三种引物的序列。
9.一种进行滚环扩增的方法,其包括:
(a)提供包含靶多核苷酸的环状多核苷酸;
(b)使扩增反应混合物经受多个循环的滚环扩增以生成包含多联体的多种扩增产物,其中所述扩增反应混合物包含(i)具有链置换活性的聚合酶,(ii)所述环状多核苷酸,以及(iii)引物;且其中所述多个循环的滚环扩增中的每个循环均包含在变性温度下的变性、在退火温度下的引物退火以及在延伸温度下持续给定延伸时间段的引物延伸,从而生成所述多种扩增产物;并且
其中生成的所述多种扩增产物的特征在于与通过利用变性和引物退火条件相当但延伸时间段相当于所述多个循环的延伸时间段之和的一个扩增循环生成的多种扩增产物相比,其含有更高比例的具有至少两个拷贝的所述靶多核苷酸的多联体。
10.一种提高由滚环扩增生成的具有至少两个拷贝的靶多核苷酸的多联体的比例的方法,所述方法包括:
(a)提供包含靶多核苷酸的环状多核苷酸;
(b)使扩增反应混合物经受多个循环的滚环扩增以生成包含多联体的多种扩增产物,其中所述扩增反应混合物包含(i)具有链置换活性的聚合酶,(ii)所述环状多核苷酸,以及(iii)引物;且其中所述多个循环的滚环扩增中的每个循环均包含在变性温度下的变性、在退火温度下的引物退火以及在延伸温度下持续给定延伸时间段的引物延伸,从而生成所述多种扩增产物;
由此提高具有至少两个拷贝的所述靶多核苷酸的多联体的比例。
CN202210471304.0A 2015-10-09 2016-10-07 用于富集扩增产物的方法及组合物 Pending CN114807323A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201562239690P 2015-10-09 2015-10-09
US62/239,690 2015-10-09
CN201680072543.1A CN108368545B (zh) 2015-10-09 2016-10-07 用于富集扩增产物的方法及组合物
PCT/US2016/056126 WO2017062863A1 (en) 2015-10-09 2016-10-07 Methods and compositions for enrichment of amplification products

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201680072543.1A Division CN108368545B (zh) 2015-10-09 2016-10-07 用于富集扩增产物的方法及组合物

Publications (1)

Publication Number Publication Date
CN114807323A true CN114807323A (zh) 2022-07-29

Family

ID=58488563

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201680072543.1A Active CN108368545B (zh) 2015-10-09 2016-10-07 用于富集扩增产物的方法及组合物
CN202210471304.0A Pending CN114807323A (zh) 2015-10-09 2016-10-07 用于富集扩增产物的方法及组合物

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201680072543.1A Active CN108368545B (zh) 2015-10-09 2016-10-07 用于富集扩增产物的方法及组合物

Country Status (12)

Country Link
US (3) US10752942B2 (zh)
EP (1) EP3359693A4 (zh)
JP (2) JP7008016B2 (zh)
KR (1) KR20180055905A (zh)
CN (2) CN108368545B (zh)
AU (2) AU2016334233B2 (zh)
CA (1) CA2999902A1 (zh)
HK (1) HK1259101A1 (zh)
IL (2) IL258236B (zh)
MX (1) MX2018004284A (zh)
SG (1) SG11201802864RA (zh)
WO (1) WO2017062863A1 (zh)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11286519B2 (en) 2013-12-11 2022-03-29 Accuragen Holdings Limited Methods and compositions for enrichment of amplification products
US11859246B2 (en) 2013-12-11 2024-01-02 Accuragen Holdings Limited Methods and compositions for enrichment of amplification products
CN104946737B (zh) 2013-12-11 2019-02-22 安可济控股有限公司 用于检测罕见序列变体的组合物和方法
KR20180055905A (ko) 2015-10-09 2018-05-25 아큐라젠 홀딩스 리미티드 증폭 산물의 농축을 위한 방법 및 조성물
CN108699505A (zh) * 2015-12-03 2018-10-23 安可济控股有限公司 用于形成连接产物的方法和组合物
US11427866B2 (en) 2016-05-16 2022-08-30 Accuragen Holdings Limited Method of improved sequencing by strand identification
AU2017290237B2 (en) 2016-06-30 2020-10-22 Grail, Llc Differential tagging of RNA for preparation of a cell-free DNA/RNA sequencing library
SG11201901296TA (en) 2016-08-15 2019-03-28 Accuragen Holdings Ltd Compositions and methods for detecting rare sequence variants
CN107177693B (zh) * 2017-07-19 2020-11-06 中山大学 一种多倍pcr扩增方法
CN107760763B (zh) * 2017-11-20 2021-05-11 东南大学 一种用于茎环引物-滚环扩增反应的茎环引物以及茎环引物-滚环扩增的应用
CN109971825B (zh) * 2017-12-28 2020-11-10 南京金斯瑞生物科技有限公司 快速制备桑格测序模板的方法
US11203782B2 (en) 2018-03-29 2021-12-21 Accuragen Holdings Limited Compositions and methods comprising asymmetric barcoding
EP3650558A1 (en) * 2018-11-07 2020-05-13 Siemens Healthcare GmbH Liquid sample workflow for nanopore sequencing
CN110820051B (zh) * 2018-12-28 2023-04-28 广州表观生物科技有限公司 一种高灵敏度融合基因检测方法及其应用
KR102102107B1 (ko) * 2019-05-30 2020-04-20 단국대학교 천안캠퍼스 산학협력단 이동성 유전인자 SINE 선택적 발굴을 위한 HiSeq 시퀀서 기반의 DNA 라이브러리 제작 방법
EP3990548A4 (en) * 2019-06-25 2023-07-26 AccuraGen Holdings Limited DISEASE DETECTION METHODS AND SYSTEMS
GB201911421D0 (en) * 2019-08-09 2019-09-25 Dnae Diagnostics Ltd Methods of multiplexed isothermal amplification of nucleic acid sequences
WO2021046655A1 (en) * 2019-09-13 2021-03-18 University Health Network Detection of circulating tumor dna using double stranded hybrid capture
US11802282B2 (en) 2019-11-19 2023-10-31 Xbf Llc Method for identifying gene fusions by circle cDNA amplification
WO2021127208A1 (en) * 2019-12-20 2021-06-24 Accuragen Holdings Limited Methods and systems for disease detection
KR102468839B1 (ko) * 2020-06-03 2022-11-18 주식회사 제노헬릭스 Rna 검출 방법
MX2023004461A (es) * 2020-10-21 2023-05-03 Illumina Inc Plantillas de secuenciacion que comprenden multiples insertos y composiciones y metodos para mejorar la productividad de secuenciacion.
WO2022103750A1 (en) * 2020-11-11 2022-05-19 Accuragen Holdings Limited Methods and systems for sample normalization
CN113549674B (zh) * 2021-04-22 2023-11-03 福建和瑞基因科技有限公司 一种检测样本中目标序列整合和突变的方法及其引物的设计方法和试剂盒
CN113832147B (zh) * 2021-09-08 2024-06-14 华南农业大学 一种高效的大片段dna合成与扩增的pcr引物、方法及应用

Family Cites Families (154)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US443087A (en) * 1890-12-23 Riding-saddle
US5310652A (en) 1986-08-22 1994-05-10 Hoffman-La Roche Inc. Reverse transcription with thermostable DNA polymerase-high temperature reverse transcription
US5322770A (en) 1989-12-22 1994-06-21 Hoffman-Laroche Inc. Reverse transcription with thermostable DNA polymerases - high temperature reverse transcription
US5130238A (en) 1988-06-24 1992-07-14 Cangene Corporation Enhanced nucleic acid amplification process
US5234809A (en) 1989-03-23 1993-08-10 Akzo N.V. Process for isolating nucleic acid
US5362623A (en) 1991-06-14 1994-11-08 The John Hopkins University Sequence specific DNA binding by p53
US5527676A (en) 1989-03-29 1996-06-18 The Johns Hopkins University Detection of loss of the wild-type P53 gene and kits therefor
US6800617B1 (en) 1989-03-29 2004-10-05 The Johns Hopkins University Methods for restoring wild-type p53 gene function
DE69032864T3 (de) 1989-03-29 2013-01-31 The Johns Hopkins University Nachweis des Ausfalls des Wildtyps des p53-Gens
US6677312B1 (en) 1989-03-29 2004-01-13 The Johns Hopkins University Methods for restoring wild-type p53 gene function
ES2091225T3 (es) 1989-07-11 1996-11-01 Gen Probe Inc Metodos para la amplificacion de las secuencias de acidos nucleicos.
CA2020958C (en) 1989-07-11 2005-01-11 Daniel L. Kacian Nucleic acid sequence amplification methods
US5494810A (en) 1990-05-03 1996-02-27 Cornell Research Foundation, Inc. Thermostable ligase-mediated DNA amplifications system for the detection of genetic disease
US5527670A (en) 1990-09-12 1996-06-18 Scientific Generics Limited Electrochemical denaturation of double-stranded nucleic acid
US5352775A (en) 1991-01-16 1994-10-04 The Johns Hopkins Univ. APC gene and nucleic acid probes derived therefrom
EP0569527B1 (en) 1991-01-16 2001-03-14 The Johns Hopkins University Inherited and somatic mutations of apc gene in colorectal cancer of humans
US5455166A (en) 1991-01-31 1995-10-03 Becton, Dickinson And Company Strand displacement amplification
US5330892A (en) 1991-03-13 1994-07-19 The Johns Hopkins University MCC gene (mutated in colorectal cancer) used for diagnosis of cancer in humans
US5270184A (en) 1991-11-19 1993-12-14 Becton, Dickinson And Company Nucleic acid target generation
US7326778B1 (en) 1993-05-05 2008-02-05 The John Hopkins University Mutator gene and hereditary non-polyposis colorectal cancer
US5591826A (en) 1993-05-05 1997-01-07 The Johns Hopkins University Human MSH2 protein
US5492808A (en) 1993-05-05 1996-02-20 The Johns Hopkins University Means for detecting familial colon cancer (FCC)
KR960703174A (ko) 1993-06-09 1996-06-19 미안 알렉 자기장 순환식 반응방법(magnetic cycle reaction)
WO1995013375A1 (en) 1993-11-10 1995-05-18 The Johns Hopkins University Tumor suppressor waf1
DE69433940T2 (de) 1993-12-02 2005-07-28 The Johns Hopkins University Menschliches mutator-gen nmsh2 und seine verbindung zum hereditaren, nichtpolypösen kolorrektalen karzinom
US6482606B1 (en) 1994-01-27 2002-11-19 Human Genome Sciences, Inc. Human DNA mismatch repair polynucleotides
US6380369B1 (en) 1994-01-27 2002-04-30 Human Genome Sciences, Inc. Human DNA mismatch repair proteins
EP0749496A4 (en) 1994-01-27 1999-03-03 Human Genome Sciences Inc HUMAN DNA MALFUNCTION REPAIR PROTEINS
US6033850A (en) 1994-03-15 2000-03-07 Affymetrix, Inc. Electrochemical denaturation of double-stranded nucleic acid
US5648211A (en) 1994-04-18 1997-07-15 Becton, Dickinson And Company Strand displacement amplification using thermophilic enzymes
US6593086B2 (en) * 1996-05-20 2003-07-15 Mount Sinai School Of Medicine Of New York University Nucleic acid amplification methods
US5942391A (en) * 1994-06-22 1999-08-24 Mount Sinai School Of Medicine Nucleic acid amplification method: ramification-extension amplification method (RAM)
US5705628A (en) 1994-09-20 1998-01-06 Whitehead Institute For Biomedical Research DNA purification and isolation using magnetic particles
US5648245A (en) * 1995-05-09 1997-07-15 Carnegie Institution Of Washington Method for constructing an oligonucleotide concatamer library by rolling circle replication
US5710029A (en) 1995-06-07 1998-01-20 Gen-Probe Incorporated Methods for determining pre-amplification levels of a nucleic acid target sequence from post-amplification levels of product
US5705365A (en) 1995-06-07 1998-01-06 Gen-Probe Incorporated Kits for determining pre-amplification levels of a nucleic acid target sequence from post-amplification levels of product
US5854033A (en) * 1995-11-21 1998-12-29 Yale University Rolling circle replication reporter systems
DK0862656T3 (da) 1995-11-21 2001-04-09 Univ Yale Unimolekylær segmentamplifikation og -detektering
EP0929694A4 (en) 1996-03-15 2002-05-02 Penn State Res Found DETECTION OF TUMOR-RELATED EXTRACELLULAR NUCLEIC ACID USING PLASMA OR BLOOD SERUM USING NUCLEIC ACID AMPLIFICATION TESTS
US6511805B1 (en) 1996-03-15 2003-01-28 The Penn State Research Foundation Methods for detecting papillomavirus DNA in blood plasma and serum
US8048629B2 (en) 1996-03-15 2011-11-01 The Penn State Research Foundation Detection of extracellular tumor-associated nucleic acid in blood plasma or serum
CA2250118C (en) 1996-03-26 2009-09-29 Michael S. Kopreski Method enabling use of extracellular rna extracted from plasma or serum to detect, monitor or evaluate cancer
US5939291A (en) 1996-06-14 1999-08-17 Sarnoff Corporation Microfluidic method for nucleic acid amplification
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
EP2327797B1 (en) 1997-04-01 2015-11-25 Illumina Cambridge Limited Method of nucleic acid sequencing
GB9706654D0 (en) 1997-04-02 1997-05-21 Scient Generics Ltd Disassociation of interacting molecules
WO1998045474A1 (en) 1997-04-04 1998-10-15 Innogenetics N.V. Isothermal polymerase chain reaction by cycling the concentration of divalent metal ions
WO1999053102A1 (en) * 1998-04-16 1999-10-21 Packard Bioscience Company Analysis of polynucleotide sequence
ATE426045T1 (de) 1998-11-09 2009-04-15 Eiken Chemical Prozess zur synthetisierung von nukleinsaure
GB9903906D0 (en) 1999-02-19 1999-04-14 Microbiological Res Authority Method and apparatus for nucleic acid strand separation
EP1175510B1 (en) 1999-03-17 2007-02-28 The Board Of Trustees Of The Leland Stanford Junior University Mismatch repair detection
US20060275782A1 (en) 1999-04-20 2006-12-07 Illumina, Inc. Detection of nucleic acid reactions on bead arrays
US7056661B2 (en) 1999-05-19 2006-06-06 Cornell Research Foundation, Inc. Method for sequencing nucleic acid molecules
AU7364700A (en) 1999-09-08 2001-04-10 University Of Victoria Innovation And Development Corporation Use of psychrotrophic bacterium in biotechnology applications
DK1218542T3 (da) 1999-09-13 2004-08-02 Nugen Technologies Inc Fremgangsmåder og sammensætninger til lineær isotermisk amplifikation af polynukleotidsekvenser
EP1218543A2 (en) 1999-09-29 2002-07-03 Solexa Ltd. Polynucleotide sequencing
CA2392474A1 (en) 1999-11-26 2001-05-31 Jonathan M. Rothberg Nucleic acid probe arrays
US6653079B2 (en) 2000-03-13 2003-11-25 Freshgene, Inc. Methods for detection of differences in nucleic acids
US6917726B2 (en) 2001-09-27 2005-07-12 Cornell Research Foundation, Inc. Zero-mode clad waveguides for performing spectroscopy with confined effective observation volumes
US6626906B1 (en) 2000-10-23 2003-09-30 Sdgi Holdings, Inc. Multi-planar adjustable connector
US7001724B1 (en) 2000-11-28 2006-02-21 Applera Corporation Compositions, methods, and kits for isolating nucleic acids using surfactants and proteases
US20040067511A1 (en) * 2001-02-27 2004-04-08 Thomas David C. Circular probe amplification (cpa) using energy-transfer primers
IL153504A0 (en) 2001-03-09 2003-07-06 Nugen Technologies Inc Methods and compositions for amplification of rna sequences
US7122715B2 (en) * 2001-09-20 2006-10-17 Monsanto Technology Llc In vitro method to create circular molecules for use in transformation
US6977148B2 (en) 2001-10-15 2005-12-20 Qiagen Gmbh Multiple displacement amplification
US20110151438A9 (en) 2001-11-19 2011-06-23 Affymetrix, Inc. Methods of Analysis of Methylation
US7553619B2 (en) * 2002-02-08 2009-06-30 Qiagen Gmbh Detection method using dissociated rolling circle amplification
US6815167B2 (en) * 2002-04-25 2004-11-09 Geneohm Sciences Amplification of DNA to produce single-stranded product of defined sequence and length
DE60324810D1 (de) 2002-09-20 2009-01-02 New England Biolabs Inc HELICASE-ABHuNGIGE AMPLIFIKATION VON NUKLEINSUREN
US7309571B2 (en) 2003-02-03 2007-12-18 Ge Healthcare Bio-Sciences Corp. Amplification of self-ligated, circularized cDNA for expression profiling
WO2005059157A2 (en) * 2003-12-11 2005-06-30 The Board Of Trustees Of The Leland Stanford Junior University METHODS AND COMPOSITIONS FOR USE IN PREPARING HAIRPIN RNAs
WO2005065814A1 (en) * 2004-01-07 2005-07-21 Solexa Limited Modified molecular arrays
CA2557841A1 (en) 2004-02-27 2005-09-09 President And Fellows Of Harvard College Polony fluorescent in situ sequencing beads
US20100075384A1 (en) * 2004-03-25 2010-03-25 New England Biolabs, Inc. Helicase-dependent amplification of circular nucleic acids
WO2005113824A2 (en) 2004-05-14 2005-12-01 Zhenghe Wang Protein tyrosine phosphatase mutations in cancers
US7170050B2 (en) 2004-09-17 2007-01-30 Pacific Biosciences Of California, Inc. Apparatus and methods for optical analysis of molecules
US7588894B2 (en) * 2005-02-01 2009-09-15 John Wayne Cancern Institute Use of ID4 for diagnosis and treatment of cancer
EP1866434B1 (en) 2005-02-19 2013-06-05 Avacta Group plc Isothermal nucleic acid amplification
PL1712639T3 (pl) 2005-04-06 2009-02-27 Maurice Stroun Sposób diagnozowania nowotworu przez wykrywanie krążącego DNA i RNA
US9139849B2 (en) * 2005-04-08 2015-09-22 The United States of America as Represented by the Government of the Department of Health and Human Services Rapid generation of long synthetic centromeric tandem repeats for mammalian artificial chromosome formation
US20060228721A1 (en) 2005-04-12 2006-10-12 Leamon John H Methods for determining sequence variants using ultra-deep sequencing
DK1907583T4 (da) 2005-06-15 2020-01-27 Complete Genomics Inc Enkeltmolekyle-arrays til genetisk og kemisk analyse
DE602006011917D1 (de) 2005-08-19 2010-03-11 Bioventures Inc Verfahren und substanzen zur isolierung von mirnas
EP1969153A2 (en) 2005-11-28 2008-09-17 Pacific Biosciences of California, Inc. Uniform surfaces for hybrid material substrates and methods for making and using same
WO2007092538A2 (en) 2006-02-07 2007-08-16 President And Fellows Of Harvard College Methods for making nucleotide probes for sequencing and synthesis
WO2007117832A2 (en) 2006-03-12 2007-10-18 Applera Corporation Methods of detecting target nucleic acids
EP2677039B8 (en) 2006-05-10 2022-10-05 DxTerity Diagnostics Incorporated Detection of nucleic acid targets using chemically reactive oligonucleotide probes
US8768629B2 (en) 2009-02-11 2014-07-01 Caris Mpi, Inc. Molecular profiling of tumors
EP2602321B1 (en) 2006-05-31 2017-08-23 Sequenom, Inc. Methods and compositions for the extraction and amplification of nucleic acid from a sample
WO2008070352A2 (en) 2006-10-27 2008-06-12 Complete Genomics, Inc. Efficient arrays of amplified polynucleotides
AU2007203390B2 (en) 2007-04-26 2012-10-04 Yew Jin Fong Improved lace fastener
FR2924440B1 (fr) * 2007-12-04 2015-01-09 Pf Medicament Nouveau procede de generation et de criblage d'une banque d'anticorps
JP2012517813A (ja) 2009-02-16 2012-08-09 エピセンター テクノロジーズ コーポレイション 1本鎖dnaの鋳型非依存性ライゲーション
WO2010117817A2 (en) 2009-03-30 2010-10-14 Life Technologies Corporation Methods for generating target specific probes for solution based capture
WO2010115100A1 (en) 2009-04-03 2010-10-07 L&C Diagment, Inc. Multiplex nucleic acid detection methods and systems
WO2010120803A2 (en) * 2009-04-13 2010-10-21 Somagenics Inc. Methods and compositions for detection of small rnas
GB0910302D0 (en) * 2009-06-15 2009-07-29 Lumora Ltd Nucleic acid amplification
US20110237444A1 (en) 2009-11-20 2011-09-29 Life Technologies Corporation Methods of mapping genomic methylation patterns
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
WO2011120046A2 (en) 2010-03-26 2011-09-29 Swift Biosciences, Inc. Methods and compositions for isolating polynucleotides
WO2011161549A2 (en) 2010-06-24 2011-12-29 Population Genetics Technologies Ltd. Methods and compositions for polynucleotide library production, immortalization and region of interest extraction
EP2591433A4 (en) 2010-07-06 2017-05-17 Life Technologies Corporation Systems and methods to detect copy number variation
WO2012019320A1 (zh) 2010-08-11 2012-02-16 中国科学院心理研究所 一种甲基化dna的高通量测序方法及其应用
EP2426217A1 (en) 2010-09-03 2012-03-07 Centre National de la Recherche Scientifique (CNRS) Analytical methods for cell free nucleic acids and applications
CN101985654A (zh) 2010-10-21 2011-03-16 徐州医学院 检测多样本多位点snp的检测方法
EP2697397B1 (en) 2011-04-15 2017-04-05 The Johns Hopkins University Safe sequencing system
WO2013003585A2 (en) 2011-06-29 2013-01-03 The Johns Hopkins University Enrichment of nucleic acids by complimentary capture
CN103717752B (zh) * 2011-08-05 2015-04-15 株式会社东芝 核酸分析法
EP2746395B1 (en) 2011-09-08 2017-11-29 Kabushiki Kaisha DNAFORM Primer set, method for amplifying target nucleic acid sequence using same, and method for detecting mutated nucleic acid using same
WO2013056178A2 (en) 2011-10-14 2013-04-18 Foundation Medicine, Inc. Novel estrogen receptor mutations and uses thereof
WO2013059740A1 (en) 2011-10-21 2013-04-25 Foundation Medicine, Inc. Novel alk and ntrk1 fusion molecules and uses thereof
WO2013074632A1 (en) 2011-11-14 2013-05-23 Rose Floyd D Mismatch nucleotide purification and identification
US20130217023A1 (en) 2012-02-22 2013-08-22 454 Life Sciences Corporation System And Method For Generation And Use Of Compact Clonally Amplified Products
WO2013142389A1 (en) 2012-03-20 2013-09-26 University Of Washington Through Its Center For Commercialization Methods of lowering the error rate of massively parallel dna sequencing using duplex consensus sequencing
US8209130B1 (en) 2012-04-04 2012-06-26 Good Start Genetics, Inc. Sequence assembly
AU2013267609C1 (en) 2012-05-31 2019-01-03 Board Of Regents, The University Of Texas System Method for accurate sequencing of DNA
US10538807B2 (en) 2012-06-01 2020-01-21 Fred Hutchinson Cancer Research Center Compositions and methods for detecting rare nucleic acid molecule mutations
WO2013188840A1 (en) 2012-06-14 2013-12-19 Fred Hutchinson Cancer Research Center Compositions and methods for sensitive mutation detection in nucleic acid molecules
CN103998621A (zh) 2012-07-11 2014-08-20 北京贝瑞和康生物技术有限公司 片断dna检测方法、片断dna检测试剂盒及其应用
CA2876505A1 (en) 2012-07-17 2014-01-23 Counsyl, Inc. System and methods for detecting genetic variation
US9092401B2 (en) 2012-10-31 2015-07-28 Counsyl, Inc. System and methods for detecting genetic variation
CA2878246C (en) 2012-07-20 2022-01-11 Verinata Health, Inc. Detecting and classifying copy number variation in a cancer genome
US20160040229A1 (en) 2013-08-16 2016-02-11 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
US20140066317A1 (en) 2012-09-04 2014-03-06 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
CA2890004A1 (en) 2012-10-31 2014-05-08 Becton, Dickinson And Company Selective amplification and real-time pcr detection of rare mutations
WO2014113729A2 (en) 2013-01-18 2014-07-24 Foundation Mecicine, Inc. Methods of treating cholangiocarcinoma
EP2971152B1 (en) 2013-03-15 2018-08-01 The Board Of Trustees Of The Leland Stanford Junior University Identification and use of circulating nucleic acid tumor markers
US10081825B2 (en) * 2013-03-15 2018-09-25 Aegea Biotechnologies, Inc. Methods for amplification of nucleic acids utilizing a circularized template prepared from a target nucleic acid
CA3156663A1 (en) 2013-03-15 2014-09-18 Verinata Health, Inc. Generating cell-free dna libraries directly from blood
US9290800B2 (en) * 2013-03-15 2016-03-22 Pacific Biosciences Of California, Inc. Targeted rolling circle amplification
US20150033372A1 (en) * 2013-05-01 2015-01-29 Kymab Limited Human VpreB & Chimaeric Surrogate Light Chains in Transgenic Non-Human Vertebrates
US9644232B2 (en) 2013-07-26 2017-05-09 General Electric Company Method and device for collection and amplification of circulating nucleic acids
US9217167B2 (en) 2013-07-26 2015-12-22 General Electric Company Ligase-assisted nucleic acid circularization and amplification
WO2015048535A1 (en) 2013-09-27 2015-04-02 Natera, Inc. Prenatal diagnostic resting standards
EP4389888A2 (en) * 2013-10-17 2024-06-26 Takara Bio USA, Inc. Methods for adding adapters to nucleic acids and compositions for practicing the same
IL285106B (en) 2013-11-07 2022-09-01 Univ Leland Stanford Junior Clean nucleic acids are suitable for analyzing the human microbiome and its parts
GB201321123D0 (en) 2013-11-29 2014-01-15 Linea Ab Q Amplification of circular molecules
US11286519B2 (en) 2013-12-11 2022-03-29 Accuragen Holdings Limited Methods and compositions for enrichment of amplification products
CN104946737B (zh) * 2013-12-11 2019-02-22 安可济控股有限公司 用于检测罕见序列变体的组合物和方法
US11859246B2 (en) 2013-12-11 2024-01-02 Accuragen Holdings Limited Methods and compositions for enrichment of amplification products
EP3524694B1 (en) 2013-12-28 2020-07-15 Guardant Health, Inc. Methods and systems for detecting genetic variants
CN104745679B (zh) 2013-12-31 2018-06-15 杭州贝瑞和康基因诊断技术有限公司 一种无创检测egfr基因突变的方法及试剂盒
DK3604544T3 (en) * 2014-01-31 2022-02-14 Swift Biosciences Inc Improved methods for processing dna substrates
CA3172086A1 (en) * 2014-06-13 2015-12-17 Illumina Cambridge Limited Methods and compositions for preparing sequencing libraries
US10364458B2 (en) * 2014-07-16 2019-07-30 Tangen Biosciences, Inc. Isothermal methods for amplifying nucleic acid samples
EP3201350B1 (en) 2014-09-30 2020-12-02 Global Life Sciences Solutions USA LLC Method for nucleic acid analysis directly from an unpurified biological sample
US10844428B2 (en) 2015-04-28 2020-11-24 Illumina, Inc. Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS)
KR20180055905A (ko) 2015-10-09 2018-05-25 아큐라젠 홀딩스 리미티드 증폭 산물의 농축을 위한 방법 및 조성물
CN108699505A (zh) 2015-12-03 2018-10-23 安可济控股有限公司 用于形成连接产物的方法和组合物
US11427866B2 (en) 2016-05-16 2022-08-30 Accuragen Holdings Limited Method of improved sequencing by strand identification
US10370701B2 (en) * 2016-06-17 2019-08-06 Pacific Biosciences Of California, Inc. Methods and compositions for generating asymmetrically-tagged nucleic acid fragments
US20190323073A1 (en) 2016-06-23 2019-10-24 Accuragen Holdings Limited Cell-free nucleic acid standards and uses thereof
SG11201901296TA (en) 2016-08-15 2019-03-28 Accuragen Holdings Ltd Compositions and methods for detecting rare sequence variants
US11203782B2 (en) 2018-03-29 2021-12-21 Accuragen Holdings Limited Compositions and methods comprising asymmetric barcoding

Also Published As

Publication number Publication date
US20210002716A1 (en) 2021-01-07
EP3359693A1 (en) 2018-08-15
IL258236B (en) 2021-12-01
JP7008016B2 (ja) 2022-01-25
EP3359693A4 (en) 2019-03-06
AU2016334233A1 (en) 2018-04-12
US10752942B2 (en) 2020-08-25
US20230287485A1 (en) 2023-09-14
KR20180055905A (ko) 2018-05-25
HK1259101A1 (zh) 2019-11-22
WO2017062863A1 (en) 2017-04-13
JP2022050563A (ja) 2022-03-30
CN108368545A (zh) 2018-08-03
CN108368545B (zh) 2022-05-17
AU2016334233B2 (en) 2023-01-05
SG11201802864RA (en) 2018-05-30
US20180298434A1 (en) 2018-10-18
IL258236A (en) 2018-05-31
AU2023201912A1 (en) 2023-05-04
MX2018004284A (es) 2018-05-16
JP2018537955A (ja) 2018-12-27
CA2999902A1 (en) 2017-04-13
IL287586A (en) 2021-12-01
US11578359B2 (en) 2023-02-14

Similar Documents

Publication Publication Date Title
CN108368545B (zh) 用于富集扩增产物的方法及组合物
JP7365382B2 (ja) 稀な配列変異体を検出するための組成物および方法
US20210230666A1 (en) Methods and compositions for preparing polynucleotides
US20210254134A1 (en) Methods and compositions for forming ligation products
KR102640585B1 (ko) 희귀 서열 변이를 검출하기 위한 조성물 및 방법
US20230167493A1 (en) Method of improved sequencing by strand identification
US20180363039A1 (en) Methods and compositions for forming ligation products
CN109689888B (zh) 无细胞核酸标准品及其用途
JP6899844B2 (ja) 超並列シークエンシングのためのdnaライブラリーを生成する方法及びキット
US20220205032A1 (en) Compositions and methods comprising asymmetric barcoding
CN112654713A (zh) 用于数字聚合酶链反应的组合物和方法
US11634750B2 (en) Methods and compositions for preparing polynucleotides

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination