CN114929896A - 用于多重靶扩增pcr的有效方法和组合物 - Google Patents

用于多重靶扩增pcr的有效方法和组合物 Download PDF

Info

Publication number
CN114929896A
CN114929896A CN202080089446.XA CN202080089446A CN114929896A CN 114929896 A CN114929896 A CN 114929896A CN 202080089446 A CN202080089446 A CN 202080089446A CN 114929896 A CN114929896 A CN 114929896A
Authority
CN
China
Prior art keywords
target
universal
amplification
specific
primer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080089446.XA
Other languages
English (en)
Inventor
C·王
Z·马
B·加里扎德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chapter Diagnosis Co
Original Assignee
Chapter Diagnosis Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chapter Diagnosis Co filed Critical Chapter Diagnosis Co
Publication of CN114929896A publication Critical patent/CN114929896A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6848Nucleic acid amplification reactions characterised by the means for preventing contamination or increasing the specificity or sensitivity of an amplification reaction
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本公开涉及双链PCR扩增产物的酶处理的方法,用于消除或最小化多重PCR反应中的引物二聚体和用于衔接子的有效连接。本公开涉及与常规方法、组合物和试剂盒相比,通过最小化实验室步骤、消除引物二聚体和提高衔接子连接的效率,允许更有效的高度多重靶扩增的方法和组合物。所公开的方法使用多种靶标特异性引物来特异性和选择性扩增受试者基因组中的靶标。所公开的方法可用于许多下游程序和分析,包括DNA测序。

Description

用于多重靶扩增PCR的有效方法和组合物
相关申请
本申请要求于2019年12月19日提交的名称为“用于多重靶扩增PCR的有效方法和组合物(Efficient Methods and Compositions for Multiplex Target AmplificationPCR)”的美国临时专利申请16/720,823的优先权,其全部内容并入本文。
背景技术
快速准确地鉴定导致疾病、药物反应或不良药物作用的遗传变体对于患者的诊断、个体化治疗、伴随诊断和预后至关重要。许多癌症和先天性或遗传性病症是复杂的疾病,其可能与多个基因相关并且可能涉及杂合突变。此外,这些突变可能少量存在于给定样品中。
靶向基因测序是用于分析样品中的特定突变和遗传变化的有效方法。靶基因测序允许更深入地关注已知或怀疑与特定疾病相关联的一组选定基因或基因区域。可以跨基因组平行分析多个基因,从而减少时间和成本。靶向基因测序还针对感兴趣的基因产生更详细的数据集,提供高灵敏度、特异性和深度覆盖,允许更容易的基因分析和罕见基因变体的检测。
此外,因为大多数已知的致病突变发生在基因的编码区中,所以将序列分析的焦点集中在与特定疾病相关的一组基因上是更实际的。对感兴趣的基因组区域进行靶向、捕获和测序在临床环境中是特别有价值的,使得可以以更大的深度分析每个靶标,并且可以同时分析大量的特定基因组合(panel)和高样品数。因此,仍然非常需要设计需要关注特定基因组间隔或基因集的应用。
虽然全基因组测序对于许多适应症来说变得更具成本效益和更实用,但聚焦的靶特异性组合继续提供以下优势:更好地覆盖靶向区域和更强的检测多种变异类型(包括CNV和复杂的基因组重排)的能力,成本显著更低,通量更高,生物信息学分析更简单,检测更集中。这种聚焦的靶特异性组合消除了处理次要/偶然发现的需要,否则在全基因组测序中不可避免地会出现次要/偶然发现。此外,对大量样品中感兴趣的特定区域进行靶向测序在表征疾病状态方面比对较少个体的整个基因组进行测序更具成本效益。对于疾病评估、治疗和预后,更广泛的特定靶标覆盖范围和更深入的富集靶标测序允许等位基因频率的更宽动态范围以及少数序列和低频变异的检测。有效且特异性的靶富集方法允许更有效的靶向测序。靶富集的重要参数是:(i)灵敏度;(ii)特异性;(iii)均匀性;(iv)再现性;(v)成本;(vi)易用性;和(vii)每个实验所需的DNA量。
人类基因组含有约30亿个碱基、约21,000个编码基因和超过220,000个外显子。外显子占基因组的约1-2%,并且在平均规模上每个基因有9个外显子,平均外显子大小为170个核苷酸。下一代测序(NGS)是用于分析基因组的重要工具,具有比Sanger测序更高的灵敏度,允许检测来自仅含有几个细胞的样品的突变。其可用于检测DNA和RNA中的多种序列变异,例如单核苷酸和多核苷酸变体、插入、缺失和基因拷贝数变异。NGS也可用于通过定量测量mRNA、微小RNA和影响它们的因素(例如基因启动子甲基化)的水平来分析基因表达水平。目前有三种类型的NGS用于测序DNA:(a)全基因组测序(WGS);(b)全外显子组测序(WES);和(c)靶向测序。WGS覆盖并分析个体的整个基因组内容,而WES仅覆盖基因组的蛋白质编码区。相比之下,靶向测序集中于通过常见病理机制或已知临床表型连接的一组基因或基因组的特定区域。
值得注意的是,NGS正在彻底改变遗传性疾病和癌症的分子表征,用于发现驱动突变和常规筛选基因组畸变。由于广泛的不同应用,NGS已经覆盖了生命科学的许多领域,并且在研究和诊断方面显著影响医学遗传学。分离基因组的高优先区段极大地增强了临床、诊断和研究环境中的结果。然而,使用NGS聚焦于感兴趣的特定区域需要相关的靶区域的富集。值得注意的是,靶富集允许增加靶区域和感兴趣的特定区域的覆盖,从而促进样品的多重化并简化序列读段数据分析。基因组测定中靶富集的基本优点包括富集因子、覆盖度或读段深度、跨感兴趣的靶区域的覆盖度的均一性或均匀性、再现性、特异性(即序列读段的中靶/脱靶比率)、所需的输入DNA量和有用序列数据的每个靶碱基的总成本。
基于PCR的靶富集方法相对快速,需要步骤少和输入DNA少,因此更适合于含有少量输入DNA的样品,例如FFPE、cfDNA和ctDNA。PCR对感兴趣区域的靶富集的特异性显著受反应中引物数量的影响,并且引物特征例如G-C含量和靶区域中变异的存在可能干扰最佳引物杂交,导致某些序列的扩增失败,也称为等位基因丢失。扩增子大小和覆盖度是基于PCR的靶富集以产生均匀和均一覆盖度的重要考虑因素。
靶核酸序列的多重扩增允许在单个聚合酶链(PCR)反应中的大量应用。在单个PCR反应中使用多个靶特异性引物的优点是这样做允许以有效的方式多重扩增选择性靶,节省时间,降低成本和减少劳动以及增加通量。然而,增加反应中寡核苷酸引物的数量可能引入引物交叉反应性和扩增假象(例如引物二聚体)的形成或导致非特异性扩增产物的非特异性引发。此外,由于这种交叉反应性,一些核酸靶标可能不会扩增,导致核酸靶标丢失。这些扩增假象可能过度消耗扩增组分和试剂,例如dNTPs和DNA聚合酶,影响扩增反应的总体效率和质量。来自高度多重扩增的这些假象可能还影响下游程序,例如用于下一代测序的样品制备。在这种情况下,非特异性扩增或假象的扩增可以被带到下游步骤,例如下一代测序读段结果,产生过度显性的非信息性测序读段。
多重扩增可以在一个反应中扩增多个感兴趣的靶标,并且有利地增加可以在单个反应中从有限量的DNA开始扩增的靶区域的数量,其中可以同时扩增数百至数千个靶区域用于测序。选择性多重扩增在临床和研究环境中具有广泛的应用,并且可用于突变检测和分析、单核苷酸多态性(SNP)微生物和病毒检测、缺失和插入、基因分型、拷贝数变异(CNV)、表观遗传和甲基化分析、基因表达和转录组分析。这些应用可用于疾病的诊断、预后和治疗。
然而,随着用于选择性扩增的核酸靶区域的数量增加,需要将按比例更多的引物引入反应中。单个测试反应中较高的引物数量和浓度可增加扩增假象,例如引物二聚体、非特异性扩增、超扩增子,并且可由于引物之间的干扰而导致扩增失败,每个引物可能对下游步骤产生负面影响。避免或最小化这些扩增假象的常见方法是使用商业或内部软件包来设计用于多重扩增测定的引物,以避免或降低引物二聚体形成和非特异性引发。这可以通过以下方式完成:(1)使用严格的设计考虑来设计靶特异性引物以减轻引物相互作用;和(2)将引物分组成非重叠池的最佳子集以避免假象。
然而,这样的努力没有完全解决上述问题,因此,非常需要用于靶特异性序列的高度多重扩增的方法或组合物,而没有或最小化扩增假象,例如引物二聚体和非特异性扩增产物,以及消除或最小化用于单独测试反应的引物分组,这增加了额外的步骤。
发明内容
在一些实施方案中,本公开涉及用于在下游分析(如下一代测序)之前的多重靶扩增和靶富集的方法、组合物和试剂盒。在某些实施方案中,本公开涉及一种方法,其包括使用多种靶特异性引物在DNA或RNA样品中进行靶富集扩增的步骤,其中所述扩增在包含聚合酶和dNTP的扩增试剂存在下在最佳条件下进行。在各种实施方案中,所述方法还包括将样品中的mRNA转化为cDNA的步骤。在一些实施方案中,该方法的靶特异性引物包含在3’端的靶特异性序列和在5’端的辅助序列,其中所述辅助序列被配置成允许用适当的限制性酶消化甲基化的位点周围的PCR产物。
在一些实施方案中,本公开涉及一种方法,所述方法包括以下步骤:(1)在测试反应中,使两种或更多种靶特异性引物与核酸靶序列杂交,其中所述靶特异性引物包含具有甲基化依赖性核酸内切酶限制性酶识别位点的甲基化的通用辅助部分和被配置成靶向样品中的核酸靶序列的靶特异性部分;(2)使测试反应在最佳扩增条件下进行扩增以产生包含扩增子的扩增产物;(3)用甲基化依赖性核酸内切酶限制性酶对所述扩增产物进行消化以形成消化产物,其中所述消化产物包含在链的每个末端上包含粘性末端(即,未配对的核苷酸)的扩增子;(4)对所述消化产物进行大小选择纯化以除去消化的引物二聚体和未使用的引物,以形成包含dsDNA的消化的扩增子;(5)将通用衔接子连接至来自所述消化的扩增子的dsDNA以形成连接产物,其中所述连接通用衔接子包含通用序列部分和粘性末端;(6)用与所述连接通用衔接子上的序列互补的条形码化的通用引物对所述连接产物进行扩增,以形成最终扩增产物;和(7)定量所述最终扩增产物用于下一代测序。
在一些实施方案中,本公开涉及一种方法,所述方法包括以下步骤:(1)在测试反应中,使两种或更多种靶特异性引物与核酸靶序列杂交,其中所述靶特异性引物包含在5’端的互补通用辅助部分和被配置成靶向样品中的核酸靶序列的靶特异性部分;(2)在最佳扩增条件下通过通用辅助引物对所述测试反应进行第一扩增以形成扩增产物;(3)使用甲基化的通用辅助引物使所述扩增产物的一部分经受第二扩增以形成第二扩增产物,其中所述甲基化的通用辅助引物包含限制性酶识别序列;(4)用甲基化依赖性核酸内切酶限制性酶对所述第二扩增产物进行消化,以形成包含扩增子的消化产物,所述扩增子在链的每个末端上包含粘性末端;(5)对所述消化产物进行大小选择纯化以除去消化的引物二聚体和未使用的引物,以形成包含dsDNA的消化的扩增子;(6)将通用衔接子连接至来自消化的扩增子的dsDNA以形成连接产物,其中所述连接通用衔接子包含互补粘性末端和通用序列部分;(7)使用与所述连接通用衔接子上的序列互补的条形码化的通用引物对所述连接产物进行第三扩增;和(8)定量所述最终扩增产物用于下一代测序。
在一些实施方案中,所公开的方法包括以下步骤:(1)使至少10、20、100、500、1,000、2,500、5,000、10,000、25,000、50,000、80,000、100,000、150,000个或更多个靶核酸序列与靶特异性引物退火,其中所述靶特异性引物包含正向引物和反向引物两者;和(2)使用引物延伸产生靶扩增产物,其中所述靶扩增产物包含不同大小的扩增子。在一些实施方案中,所公开的方法进一步包括确定至少一种靶扩增产物的存在或不存在的步骤。在一些实施方案中,所公开的方法进一步包括确定至少一种靶扩增产物的序列的步骤。在一些实施方案中,所公开的方法包括使用至少10、20、100、500、1,000、2,500、5,000、10,000、25,000、50,000、80,000、100,000、150,000个或更多个正向引物和反向引物的步骤,其中每个正向引物和反向引物被引导与特定靶核酸序列杂交。在某些实施方案中,所公开的方法进一步包括通过将对照表达水平与受试者样品表达水平进行比较,在对照样品和受试者样品两者中进行RNA表达测量的RNA分析的步骤。
在所公开的方法的某些实施方案中,使用现有技术的聚合酶链式反应(PCR)进行扩增。在某些实施方案中,PCR的进行包括大于0.1、0.5、1、2、5、8、10或15分钟的退火时间。在某些实施方案中,PCR的进行包括大于0.1、0.5、1、2、5、8、10或15分钟的延伸时间。
在一些实施方案中,所公开的方法进一步包括以下步骤:将修饰引入扩增产物,其中所述修饰使得能够通过核酸内切酶消化;利用限制性核酸内切酶消化所述扩增产物,其中限制性核酸内切酶被配置为在远离所述修饰的固定距离处切割所述扩增产物中的DNA。在一些实施方案中,所述修饰是甲基化。在一些实施方案中,甲基化的扩增产物通过甲基化依赖性核酸内切酶限制性酶在指定的限制性位点处消化。在一些实施方案中,所述甲基化依赖性核酸内切酶限制性酶被配置为消化双链DNA。在一些实施方案中,所述甲基化依赖性核酸内切酶限制性酶被配置为消化双链DNA和单链DNA两者。
在该方法的一些实施方案中,所述靶特异性引物的浓度为500、250、100、80、70、50、30、10、2或1nM。在一些实施方案中,所述靶特异性引物的GC含量为40%至70%、或30%至60%、或50%至80%。在一些实施方案中,所述靶特异性引物的GC含量范围为小于20%、15%、10%或5%。在一些实施方案中,所述靶特异性引物的解链温度(Tm)为55℃至65℃、40℃至70℃或55℃至68℃。在一些实施方案中,所述靶特异性引物的长度为20至90个碱基、40至70个碱基、20至40个碱基或25至50个碱基。在一些实施方案中,经修饰的甲基化的引物的5'-区包含对样品中的任何核酸区不互补或不特异的辅助序列。在一些实施方案中,所述靶特异性引物特异性退火至靶区域、基因或基因的不同外显子上的不同区域。在某些实施方案中,所述靶特异性引物被配置为退火至靶区域并同时扩增所述样品中的靶核酸。
在一些实施方案中,本公开涉及一种用于检测样品中的癌症的方法。在一些实施方案中,本公开涉及用于检测样品中先天性或遗传性疾病的存在或不存在的方法。在一些实施方案中,本公开涉及用于检测样品中妊娠胎儿的染色体倍性状态的方法,其中所述方法包括测量多态性位点处的等位基因计数以确定染色体倍性状态的步骤。在一些实施方案中,该方法进一步包括基于样品中检测到的靶序列为受试者选择治疗的步骤。
在一些实施方案中,所述靶序列包含临床上可操作的突变。在一些实施方案中,所述靶序列与耐药性或药物遗传学药物(伴随诊断)治疗相关。在一些实施方案中,遗传标志物的检测、鉴定和/或定量可以与器官移植或器官排斥相关。
在一些实施方案中,所述样品获自健康受试者。在一些实施方案中,所述样品获自妊娠受试者,其中所述样品包含母体和胎儿核酸。在某些实施方案中,所述样品获自疑似患有疾病或患有疾病的机会升高的受试者,并且其中所述靶序列包含与疾病相关的突变或变异。在一些实施方案中,所述疾病是癌症。在一些实施方案中,所述样品包含全基因组DNA、机械或酶促片段化DNA、cDNA、福尔马林固定的石蜡包埋组织(FFPE)、无细胞DNA(cfDNA)或循环肿瘤DNA(ctDNA)。在一些实施方案中,所述样品包含来自孕妇血浆的无细胞DNA。在一些实施方案中,样品中的核酸靶序列包含单核苷酸多态性(SNP)、突变、基因重排和融合、短串联重复、基因、外显子、编码区和外显子组。在一些实施方案中,所述样品包含mRNA。在一些实施方案中,对所述样品中的mRNA进行逆转录反应以产生DNA。在一些实施方案中,所述核酸获自单个细胞。在一些实施方案中,所述样品包含从血液、血清、血浆、脊髓液、尿液、组织、唾液、活组织检查、痰、拭子、手术切除、宫颈拭子、泪液、肿瘤组织、细针抽吸(FNA)、循环无细胞DNA(cfDNA)和循环肿瘤DNA(ctDNA)、刮片、拭子、粘液、尿液、精液、毛发、其他非限制性临床或实验室获得的样品或法医样品获得的核酸。
在一个实施方案中,至少一个连接衔接子是包含粘性末端和通用引发序列的双链寡核苷酸,其中所述连接衔接子的所述粘性末端序列被配置成与由所述甲基化依赖性核酸内切酶限制性酶产生的所述消化产物的一个粘性末端互补,其中所述通用引发序列用于下游扩增和测序。在一些实施方案中,所公开的方法包括将至少一个连接衔接子连接至靶核酸的步骤。在一些实施方案中,所述连接衔接子包含:(a)通用引发序列;(b)条形码序列(DNA标记序列);和(c)粘性末端,其中所述连接衔接子的所述粘性末端序列与由所述甲基化依赖性核酸内切酶限制性酶产生的所述消化产物的粘性末端互补。在一些实施方案中,所述连接衔接子包含:(a)通用引发序列;和(b)粘性末端,其中所述粘性末端序列根据所使用的所述甲基化依赖性核酸内切酶限制性酶与消化的扩增子粘性末端互补。在一些实施方案中,所述连接衔接子包含与限制性酶消化产物的两端互补的粘性末端。在另一个实施方案中,所述连接衔接子包含通用引发序列,所述通用引发序列被配置成允许扩增具有待再扩增的连接衔接子的靶序列。在一些实施方案中,所述连接步骤使用多于一个连接衔接子。
在一些实施方案中,本公开涉及一种方法,其包括以下步骤:使靶特异性引物与样品中的核酸接触,其中所述样品包含母体和胎儿DNA两者,并且其中所述靶特异性引物被配置为与核酸中的至少10、20、100、500、1,000、2,500、5,000、10,000、25,000、50,000、80,000、100,000或150,000个不同靶区域同时杂交;扩增多种靶核酸以产生扩增子;对所述扩增子进行下一代测序以生成序列数据;以及通过软件算法分析序列数据。在一些实施方案中,所述方法进一步包括对与对照染色体和疑似染色体相关的扩增子进行计数以确定异常染色体分布的存在或不存在的步骤。在一些实施方案中,所述方法进一步包括计数扩增子以确定胎儿DNA中非整倍性的存在的步骤。在一些实施方案中,所述方法进一步包括计数扩增子并确定核酸中缺失的存在或不存在的步骤。在一些实施方案中,样品包含母体和胎儿DNA两者。在一些实施方案中,所述样品包含来自受试者血浆的无细胞DNA。
在一些实施方案中,该方法进一步包括通过将样品与包含对照序列的对照样品进行比较来确定非整倍性或异常染色体分布的存在。在一些实施方案中,所述对照序列的相对量是已知的。在一些实施方案中,每个靶核酸序列的相对量通过参考基因组标准化。在一些实施方案中,所述对照或参考基因组包括至少一种染色体异常分布或非整倍性。在一些实施方案中,所述非整倍性在染色体13或染色体18或染色体21或染色体X或染色体Y。
在一些实施方案中,本公开涉及一种试剂盒,其包含两种或更多种修饰的甲基化的靶特异性引物,所述修饰的甲基化的靶特异性引物被配置以扩增样品中的感兴趣靶序列。在一些实施方案中,本公开涉及包含两种或更多种修饰的甲基化的通用引物的试剂盒,所述修饰的甲基化的通用引物被配置为扩增样品中感兴趣靶序列。
附图说明
参考以下附图可以更好地理解本公开。附图的元件不一定相对于彼此按比例绘制,而是将重点放在清楚地示出本公开的原理上。此外,在几个视图中,相同的附图标记表示相应的部分。
图1示出了正向和反向甲基化的靶特异性引物的示意图。每个引物由靶特异性序列部分和由甲基化的核苷酸C(mC)、限制性酶识别位点和切割位点组成的通用辅助序列部分组成。
图2示出了用于第二种方法的正向和反向通用辅助甲基化的引物的示意图。所述通用辅助序列引物由甲基化的核苷酸C(mC)、限制性酶识别位点和切割位点组成。
图3显示了修饰依赖性核酸内切酶及其限制性位点的四个实例。甲基化依赖性核酸内切酶限制性酶在所示限制位点处消化双链DNA中的修饰的(甲基化的)胞嘧啶。
图4示出了用甲基化的引物扩增(方法1或2)的扩增子,和通过甲基化/修饰依赖性核酸内切酶的消化。通过大小选择清除去除消化的引物和过量/未使用的引物,并将互补的粘性末端衔接子连接至粘性末端扩增子。
图5示出了在文库制备和测序之前用条形码化的通用引物扩增衔接子连接的扩增子。
图6描绘了整个文库制备的示意图,其中:(1)通过甲基化的靶特异性引物扩增双链gDNA或RNA(转化为cDNA),其中甲基化在辅助序列部分上(方法1);或使用包含通用辅助序列的靶特异性引物扩增以形成扩增产物,然后使用扩增产物的一部分进行使用甲基化的通用辅助引物的下一次PCR(方法2);(2)用甲基化依赖性核酸内切酶限制性酶消化来自(1)的扩增产物,其中所述扩增产物在所述链的每个末端含有粘性末端,并进行大小选择纯化以除去消化的引物二聚体和未使用的引物;(3)将包含互补粘性末端的通用衔接子与dsDNA连接,其中所述连接衔接子包含通用序列部分;(4)用与连接衔接子上的序列互补的条形码化的通用引物对连接产物进行扩增,以形成最终扩增产物;和(5)制备用于下一代测序的最终扩增产物。
图7示出了图6公开的两种方法的文库制备工作流程。
图8显示了用甲基化的引物(方法1)对致癌基因EGFR进行多重PCR的双向序列结果(电泳图)。
图9显示了用甲基化的引物(方法1)对致癌基因TP53进行多重PCR的双向序列结果(电泳图)。
图10显示了用甲基化的引物用致癌基因KIT进行多重PCR(方法1)的双向序列结果(电泳图)。
图11显示了来自用本发明公开的方法2生成的文库的Illumina序列读段的屏幕截图,其映射到不同靶区域的人序列参考hg19上。
具体实施方式
本公开涉及用于扩增和富集特定靶序列的方法和组合物。以下实施例、应用、描述和内容是示例性和解释性的,并且以任何方式是非限制性和非限制的。本公开的特征在于多种应用,例如基因分型、染色体异常(例如胎儿染色体非整倍性)的检测、基因突变和多态性(例如单核苷酸多态性,SNP)分析、基因缺失、亲子鉴定的确定、群体间遗传差异的分析、法医分析、测量疾病倾向、mRNA的定量分析以及感染因子(例如细菌、寄生虫和病毒)的检测和鉴定。本文公开的方法还可用于非侵入性产前测试,诸如亲子鉴定测试或胎儿染色体异常的检测。
下一代测序已经以极低的成本实现了许多应用,但是某些应用,例如全基因组测序和全转录组测序,尽管对于研究环境和发现是实用的,但是在临床环境中对于疾病的诊断、治疗和预后仍然是不切实际的。特异性和均匀的多重靶测序在临床和研究环境中都具有许多优点。为了增加生物测定(例如多重PCR和下一代测序)的输出和功效,使用几种靶特异性引物的组合同时扩增许多靶基因允许多重扩增感兴趣区域。尽管许多引物的使用减少了劳动力、成本和时间,但所得的非特异性扩增或扩增假象(诸如引物-引物相互作用(引物-二聚体)和超扩增子)可干扰最佳扩增和进一步分析,诸如测序。这些假象浪费PCR反应试剂并产生较短的片段代替预期的靶序列。此外,这些不需要的非特异性片段倾向于主导扩增反应,因为它们比期望的靶序列更有效地扩增。这些不期望的假象也可能干扰涉及第二PCR步骤的下游程序和应用,例如下一代测序。这些假象可消耗序列读段的相当大的部分,从而生成非信息性结果。
靶富集(由此在测序之前选择性地捕获来自DNA样品的基因组区域)的当前问题是实现高特异性和均匀性,这将要求更少的测序读段来生成足够的覆盖度和序列数据用于下游分析。在某些应用中,例如癌症或遗传疾病,需要更深的测序来以高特异性和均匀性检测、鉴定或验证组中的体细胞突变。
此外,仍然需要使引物二聚体最小化,这将允许开发高度多重PCR,由此多重扩增可以在单个测试反应中同时扩增大量靶核酸。此外,引物二聚体的去除将允许增加用于多重化的引物数量、更高浓度的引物用于平衡扩增和更高的灵敏度。在多重PCR中增加靶特异性数目的能力将允许同时扩增大量(数千)核酸靶标,同时还减少输入DNA的量、劳动和时间。当起始输入核酸材料的量有限或者样品是来自单个细胞的核酸时,这将是特别有利的。
为了解决前述需要,本文描述了一种多重靶富集的方法,其使用甲基化引物去除引物二聚体以增加和扩增多重引物的能力用于进一步分析,例如下一代测序。该方法可以用在两种方法中。在第一种方法中,靶特异性引物在通用辅助部分中含有甲基化的C(mC),而在第二种方法中,两种通用辅助引物含有甲基化的C(mC),并且与含有与甲基化的通用辅助引物互补的部分的靶特异性引物组合使用。
因此,本公开可以以两种变体方法执行。第一种方法是包括以下步骤的方法:(1)使甲基化的靶特异性引物与样品中的核酸靶序列接触以使甲基化的靶特异性引物与样品中的靶序列杂交;(2)使靶核酸序列在最佳扩增条件下进行扩增以形成扩增产物;(3)用甲基化依赖性核酸内切酶限制性酶对扩增产物进行消化以形成消化产物,其中消化产物在链的每个末端上含有粘性末端;(4)对消化产物进行大小选择纯化以除去消化的引物二聚体和未使用的引物,以形成选择的消化产物;(5)将通用衔接子连接至所选择的消化产物中的ds DNA以形成连接产物,其中所述通用衔接子包含与dsDNA互补的粘性末端和通用序列部分;(6)使用条形码化的通用引物对所述连接产物进行扩增以形成最终扩增产物,其中所述条形码化的通用引物被配置为与所述连接衔接子上的序列互补;和(7)制备用于下一代测序的最终扩增产物。
第二种方法是包括以下步骤的方法:(1)使靶特异性引物与样品中的核酸靶序列接触以使靶特异性引物与靶序列杂交,其中靶特异性引物在5’端包含通用辅助部分;(2)在最佳扩增条件下用通用辅助引物对靶序列进行第一扩增以形成扩增产物;(3)使用甲基化的通用辅助引物对所述扩增产物的一部分进行第二扩增以形成第二扩增产物,其中所述甲基化的通用辅助引物包含限制性酶识别序列;(4)用甲基化依赖性核酸内切酶限制性酶消化所述第二扩增产物以形成消化产物,其中所述消化产物在链的每个末端上含有粘性末端;(5)对消化的产物进行大小选择纯化以除去消化的引物二聚体和未使用的引物,以形成选择的消化产物;(6)将通用衔接子连接至所选择的消化产物中的ds DNA以形成连接产物,其中所述通用衔接子包含互补粘性末端和通用序列部分;(6)使用条形码化的通用引物对所述连接产物进行第三扩增以形成最终扩增产物,其中所述条形码化的通用引物包含与所述连接衔接子上的序列互补的序列;和(7)定量所述最终扩增产物用于下一代测序。
所公开的方法还可以包括从样品中提取DNA,例如FFPE或血液、血浆DNA或RNA(转化为ds cDNA)。所公开的方法可以进一步包括本领域技术人员已知的纯化。所公开的方法可包含约10、20、100、500、1,000、2,500、5,000、10,000、25,000、50,000、80,000、100,000或150,000个或更多个靶特异性引物和约10、20、100、500、1,000、2,500、5,000、10,000、25,000、50,000、80,000、100,000或150,000个或更多个靶序列。
受试者可以是哺乳动物。在一些情况下,受试者是人。受试者可以是健康的、被诊断患有疾病或疑似患有疾病。在其他情况下,受试者可以是非哺乳动物,例如细菌、病毒或真菌。
靶核酸可以存在于从受试者获得的样品中。样品可包含蛋白质、细胞、流体、生物流体、防腐剂、血液、毛发、活检材料和含有核酸的其他材料。核酸样品可包含基因组DNA或RNA。样品还可包含从FFPE或存档的DNA样品获得的核酸分子。样品还可包含机械或酶促剪切或片段化的DNA。样品可包含循环无细胞DNA(cfDNA),例如从母体受试者获得的材料,或来自诊断患有癌症的受试者或来自用于癌症筛查目的的受试者的循环肿瘤DNA(ctDNA)。样品可包含从血液、血清、血浆、脊髓液、尿液、组织、唾液、活组织检查、痰、拭子、福尔马林固定的石蜡包埋材料(FFPE)、手术切除、宫颈拭子、泪液、肿瘤组织、细针抽吸(FNA)、循环无细胞DNA(cfDNA)和循环肿瘤DNA(ctDNA)、刮片、拭子、粘液、尿液、精液、毛发、激光捕获显微切割和其他非限制性临床或实验室获得的样品获得的核酸分子。样品可以是流行病学样品、细菌样品、病毒样品、真菌样品、农业样品、法医样品或病原性样品。
多个靶特异性引物可以包含靶特异性序列和在5'-处的辅助序列,其中所述辅助序列被配置成允许使用限制性酶消化甲基化位点。此外,甲基化可以直接位于通用辅助引物上的靶特异性引物的辅助部分上。靶特异性引物可以包含甲基化的通用辅助序列部分,其包含限制性酶识别位点和靶特异性序列部分(图1)。扩增可以利用至少一种正向靶特异性引物和至少一种反向靶特异性引物。靶特异性引物可以包含通用辅助序列。本公开还设想了一种方法,其中在第一扩增中使用包含通用辅助部分的靶特异性引物,并且其中包含甲基化的核苷酸和限制性酶识别位点的互补甲基化的通用辅助引物用于第二扩增(图2)。靶特异性引物可以被配置为与靶序列的短串联重复序列(STR)杂交。靶特异性引物可以在3'端、5'端或整个序列中包含核苷酸修饰。靶特异性引物的靶特异性部分的长度可为约15至40个碱基。每种靶特异性引物的Tm可以是约50℃至约72℃或其他温度范围。
靶特异性引物可以针对至少一种靶序列,由此靶序列中的一个或多个突变指示受试者患有疾病。突变可以是临床上可操作的突变。突变还可以与耐药性或伴随诊断治疗相关。突变可包括取代、插入、倒位、点突变、缺失、错配和易位。在一个实施方案中,突变可包括拷贝数的变化。在一个实施方案中,突变可包括种系或体细胞突变。在一些实施方案中,突变具有小于约10%的等位基因频率。在其他实施方案中,突变具有小于约5%、3%、1%、0.5%、0.1%或0.01%的等位基因频率。
靶特异性引物可以靶向与癌症相关的疾病或一种或多种自身免疫、遗传、心血管、发育、代谢、神经学、神经肌肉病症、新生儿疾病或新生儿病症相关的序列。靶序列可以与器官移植或器官排斥相关。
靶特异性引物可以针对与覆盖许多癌症的高患病率临床相关癌症基因相关的一种或多种基因。靶特异性引物可以被配置为扩增一种或多种癌症临床相关基因,包括但不限于:AIP、ALK、APC、ATM、BAP1、BARD1、BLM、BMPR1A、BRCA1、BRCA2、BRIP1、CDH1、CDK4、CDKN1B、CDKN2A、CHEK2、DICER1、EPCAM、FANCC、FH、FLCN、GALNT12、GREM1、HOXB13、MAX、MEN1、MET、MITF、MLH1、MRE11A、MSH2、MSH6、MUTYH、NBN、NF1、NF2、PALB2、PHOX2B、PMS2、POLD1、POLE、POT1、PRKAR1A、PTCH1、PTEN、RAD50、RAD51C、RAD51D、RB1、RET、SDHA、SDHAF2、SDHB、SDHC、SDHD、SMAD4、SMARCA4、SMARCB1、SMARCE1、STK11、SUFU、TMEM127、TP53、TSC1、TSC2、VHL和XRCC2。
靶特异性引物还可以针对与乳腺癌相关的一种或多种基因。靶特异性引物可以被配置为扩增乳腺癌的一种或多种临床相关基因,包括但不限于:ATM、BARD1、BRCA1、BRCA2、BRIP1、CDH1、CHEK2、FANCC、MRE11A、MUTYH、NBN、NF1、PALB2、PTEN、RAD50、RAD51C、RAD51D、STK11和TP53。
靶特异性引物可以针对与卵巢癌相关的一种或多种基因。靶特异性引物可以被配置为扩增卵巢癌的一种或多种临床相关基因,包括但不限于:ATM、BARD1、BRCA1、BRCA2、BRIP1、CDH1、CHEK2、DICER1、EPCAM、MLH1、MRE11A、MSH2、MSH6、MUTYH、NBN、NF1、PALB2、PMS2、PTEN、RAD50、RAD51C、RAD51D、SMARCA4、STK11和TP53。
靶特异性引物可以针对与结肠直肠癌相关的一种或多种基因。靶特异性引物可以被配置为扩增结肠直肠癌的一种或多种临床相关基因,包括但不限于:APC、BMPR1A、CDH1、CHEK2、EPCAM、GREM1、MLH1、MSH2、MSH6、MUTYH、PMS2、POLD1、POLE、PTEN、SMAD4、STK11和TP53。
靶特异性引物可以针对与前列腺癌相关的一种或多种基因。靶特异性引物可以被配置为扩增前列腺癌的一种或多种临床相关基因,包括但不限于:ATM、BRCA1、BRCA2、CHEK2、EPCAM、HOXB13、MLH1、MSH2、MSH6、NBN、PALB2、PMS2、RAD51D和TP53。
靶特异性引物可以针对检测和鉴定融合基因,例如癌症中的异常基因融合或转化基因融合(例如EML4-ALK或ROS1)。靶特异性引物可以被配置为扩增癌症中的一种或多种融合基因,包括但不限于:AKT3、ALK、ARHGAP26、AXL、BRAF、BRD3、BRD4、EGFR、ERG、ESR1、ETV1、ETV4、ETV5、ETV6、EWSR1、FGFR1、FGFR2、FGFR3、FGR、INSR、MAML2、MAST1、MAST2、MET、MSMB、MUSK、MYB、NOTCH1、NOTCH2、NRG1、NTRK1、NTRK2、NTRK3、NUMB1、NUTM1、PDGFRA、PDGFRB、PIK3CA、PKN1、PPARG、PRKCA、PRKCB、RAF1、RELA、RET、ROS1、RSPO2、RSPO3、TERT、TFE3、TFEB、THADA和TMPRSS2。
靶特异性引物可以被配置为选择性扩增携带与先天性或遗传性疾病相关的突变的靶序列。突变可以是体细胞或种系突变。与先天性或遗传性疾病相关的突变可包括点突变、插入、缺失、倒位、取代、错配、易位和拷贝数变异。在一些实施方案中,与遗传性疾病相关的靶特异性引物中的至少一种与靶序列至少90%互补。
靶特异性引物可以针对与心血管疾病相关的一种或多种基因。靶特异性引物可以被配置为扩增与心血管疾病相关的一种或多种临床相关基因,包括但不限于ABCC9、ACTA2、ACTC1、ACTN2、AKAP9、ANK2、ANKRD1、BAG3、CACNA1C、CACNA2D1、CACNB2、CALM1、CASQ2、CAV3、CBS、COL3A1、COL5A1、COL5A2、CRYAB、CSRP3、DES、DMD、DSC2、DSG2、DSP、EMD、EYA4、FBN1、FBN2、FKTN、FLNA、FXN、GATA4、GATAD1、GLA、GPD1L、HCN4、JAG1、JPH2、JUP、KCND3、KCNE1、KCNE2、KCNE3、KCNH2、KCNJ2、KCNJ5、KCNJ8、KCNQ1、LAMA4、LAMP2、LDB3、LMNA、MED12、MYBPC3、MYH11、MYH6、MYH7、MYL2、MYL3、MYLK、MYOZ2、MYPN、NEXN、NKX2-5、NOTCH1、PKP2、PLN、PLOD1、PRKAG2、PRKG1、PTPN11、RAF1、RBM20、RYR2、SCN1B、SCN2B、SCN3B、SCN4B、SCN5A、SKI、SLC2A10、SMAD3、SMAD4、SNTA1、TAZ、TBX1、TBX20、TBX5、TCAP、TGFB2、TGFB3、TGFBR1、TGFBR2、TMEM43、TMPO、TNNC1、TNNI3、TNNT2、TPM1、TRDN、TRPM4、TTN、TTR、TXNRD和CL。
本公开还涉及一种通过多重PCR进行靶富集的方法,其包括以下步骤:在PCR试剂如DNA聚合酶、dNTP和反应缓冲液的存在下,使靶序列与多种靶特异性引物接触;并给出变性、退火和延伸的最佳温度和时间条件,杂交引物互补靶序列并延伸此类靶序列。如本领域技术人员所确定的,扩增、纯化和清除可以根据需要进行调整或去除,以优化下游过程的多重靶扩增。
本文公开的方法的特征在于在临床和研究环境中的广泛应用,并且可用于突变检测和分析、单核苷酸多态性(SNP)、微生物和病毒检测、缺失和插入、基因分型、拷贝数变异(CNV)、表观遗传和甲基化分析、基因表达、转录组分析和低频等位基因突变。所公开的方法还可用于疾病的检测、诊断、预后和治疗。所公开的方法还可以检测样品中的种系或体细胞突变。
所公开的方法可以使用PCR和DNA聚合酶。可获得广泛选择的DNA聚合酶,其特征在于不同的特性,例如热稳定性、高保真性、持续合成能力和热启动。扩增条件,如循环数、退火温度、退火持续时间、延伸温度和延伸持续时间,可以调节至最佳扩增条件,其可以基于所选择的商业DNA聚合酶提供的说明书。用于多重PCR的DNA聚合酶的浓度可以高于用于单重PCR的浓度。
本文公开的方法使用的连接衔接子是双链的,并且被配置成连接到双链核酸片段。该连接衔接子包含与靶序列不互补的通用序列部分和与消化的扩增子上的粘性末端互补的粘性末端。条形码化的通用引物上的条形码序列允许标记每个受试者的核酸片段,并且可以区分每个样品的身份。因此,条形码化通过实现样品的合并来增加通量。所公开的方法还可以使用连接衔接子用于大量核酸靶序列的通用扩增的目的。
所公开的方法使用多重聚合酶链式反应扩增靶序列,其中在单个测试反应中扩增多于一种靶序列。多重扩增所需的样品中核酸的量可以是约1ng。或者,核酸物质的量可以是约5ng、10ng、50ng、100ng或200ng或更多。多重聚合酶链式反应可以在热循环仪上进行,并且多重PCR的每个循环包括变性、退火和延伸的步骤。多重PCR的每个循环包括至少一个变性步骤、一个退火步骤和一个用于延伸核酸的延伸步骤。所公开的方法可在每轮扩增中包括5至20个PCR循环,但其他循环数也是可能的。例如,可以进行1至10个循环、1至15个循环、1至20个循环、1至25个循环或1至30个循环或更多个循环。每个循环或循环组可以具有不同的持续时间和温度。例如,退火步骤可以具有温度和持续时间的增量增加和减少,或者延伸步骤可以具有温度和持续时间的增量增加和减少。持续时间可以具有约5秒、10秒、30秒、1分钟、2分钟、4分钟、8分钟或更大增量的减少或增加。温度可以以约0.5摄氏度、1摄氏度、2摄氏度、4摄氏度、8摄氏度、10摄氏度或更大的增量的降低或升高。
扩增子大小选择可用于对一定长度范围的扩增产物进行测序。例如,可以对100至250个碱基对、150至300个碱基对、120至350个碱基对或200至500个碱基对或更大长度范围的扩增子进行测序。
通常,引物组或引物文库中的少量引物在多重扩增反应中引起扩增假象,例如引物二聚体。然而,通过采用可以计算不期望的引物-引物相互作用的引物选择算法,可以以将引物-引物相互作用最小化至可忽略的量的有效方式进行靶特异性引物选择,从而允许能够在单个测试反应中同时扩增大量靶序列的多重扩增。此外,靶特异性引物的通用部分上的甲基化位点的消化允许通过甲基化依赖性核酸内切酶限制性酶消化和大小选择纯化(例如SPRISelect珠粒)去除引物二聚体。此外,甲基化的靶特异性引物允许增加数量的引物用于多重化,更高浓度的靶特异性引物用于平衡扩增和更高的灵敏度,而不考虑引物二聚体。在多重PCR中增加靶特异性引物的数量的能力允许同时扩增大量(数千)核酸靶序列,同时减少输入DNA的量、劳动和时间。当起始输入核酸材料的量有限时,或当样品包含来自单个细胞的核酸时,这是特别有利的。
可以通过调节所公开的方法的不同参数(例如退火步骤的持续时间、温度增量和/或PCR循环数)来减少或最小化引物二聚体。除了减少的或最小化的引物二聚体之外,可以降低引物浓度,并且可以增加退火温度和持续时间以允许特异性扩增(引物具有更多的时间间隔以与靶核酸杂交)。靶特异性引物的浓度可以是约500nM、250nM、100nM、80nM、70nM、50nM、30nM、10nM、2nM、1nM或低于1nM。或者,每种靶特异性引物的浓度可以是1μM至1nM、1nM至80nM、1nM至100nM、10nM至50nM或1nM至60nM。退火温度可以是约1分钟、3分钟、5分钟、8分钟、10分钟或更长。具有增加的退火时间的扩增可以使用1个循环、2个循环、3个循环、5个循环、8个循环、10个循环或更多个循环,然后是标准退火持续时间。
所公开的方法和试剂盒可包含至少10、20、100、500、1,000、2,500、5,000、10,000、25,000、50,000、80,000、100,000或150,000种或更多种靶特异性引物,其中每种靶特异性引物被引导与特定靶序列杂交。可以存在多于一组靶特异性引物;作为实例,可以存在用于两个测试反应的两组靶特异性引物,3组用于3个测试反应或5组用于5个测试反应或更多。出于实际原因,例如靶特异性引物设计或选择的限制,还可以将样品分成具有多组靶特异性引物的多个平行多重测试反应。
靶特异性引物的GC含量可以在40%至70%之间、在30%至60%之间、在50%至80%之间或在30%至80%之间。或者,靶特异性引物的GC含量范围可以小于20%、15%、10%或5%。靶特异性引物的解链温度(Tm)可以在55℃至65℃之间、在40℃至70℃之间、在50℃至68℃之间、或如由本领域技术人员确定的此类其他范围。靶特异性引物的解链温度范围可以变化。在一些情况下,该范围可以小于20℃、15℃、10℃、5℃、2℃或1℃。靶特异性引物的长度也可以变化。在一些情况下,长度可以为20至90个碱基、40至70个碱基、20至40个碱基或25至50个碱基。靶特异性引物的长度范围也可以变化。例如,它可以是60、50、40、30或20个碱基。在一些情况下,靶特异性引物的5'-区是辅助或通用引物结合位点或标签,并且对任何靶序列不互补或不具有特异性。在一些情况下,靶序列的长度为50至500个碱基、90至350个碱基或200至450个碱基,但其他长度也是可能的。
本公开还涉及包含两种或更多种靶特异性引物的试剂盒。在一些情况下,试剂盒包含多种甲基化的靶特异性引物。在其他情况下,试剂盒包含甲基化的通用引物和靶特异性引物的组合。基于描述为不具有或具有最小的引物-引物相互作用或非特异性引发的标准来设计和选择靶特异性引物。试剂盒可以配制用于检测、诊断、预后和治疗疾病,例如癌症或先天性或遗传性疾病。试剂盒还可以被配置用于妊娠胎儿的倍性状态,例如通过选择靶特异性引物,所述靶特异性引物靶向与胎儿中的三体性相关的染色体上的序列,例如染色体13、18、21、X和Y、其他染色体或其某种组合。试剂盒可包含约10、20、100、500、1,000、2,500、5,000、10,000、25,000、50,000、80,000、100,000或150,000或更多个靶特异性引物。
本文公开的方法和试剂盒可包含多种靶特异性引物,其不具有或具有最小的自身互补结构并且不形成二级结构,诸如发夹或环。本文公开的方法和试剂盒可以进一步包含与样品中存在的非特异性序列具有最小交叉杂交的多种靶特异性引物。
本文公开的靶特异性引物可用于有效扩增短核酸片段,诸如衍生自FFPE样品的核酸、无细胞DNA(cfDNA)、无细胞肿瘤DNA(ctDNA)和无细胞胎儿DNA(cffDNA)。短核酸片段可以小于约40个碱基、50个碱基、60个碱基、70个碱基、80个碱基、90个碱基、100个碱基或120个碱基。本文公开的方法还可用于检测和定量低于1%的少数突变,例如与肺癌中的耐药性相关的T790M突变。
本文公开的方法产生可以通过下一代测序平台测序的扩增产物。下一代测序是指基于非桑格的大规模平行DNA核酸测序技术,其可以平行地对数万条或数百万至数十亿条DNA链进行测序。现有技术当前下一代测序技术和平台的当前状态的实例是Illumina平台(可逆染料终止子测序)、454焦磷酸测序、离子半导体测序(Ion Torrent)、PacBio SMRT测序、Qiagen GeneReader测序技术和Oxoford Nanopore测序。本公开不限于这些下一代测序技术实例。在另一方面,当扩增多于两种靶标时,本文公开的方法可以以多重方式使用。本文公开的方法不限于任何数量的多重化。
实施例
实施例1
用甲基化修饰的引物进行多重扩增以鉴定变体(方法1)
材料和方法
根据制造商的说明书,通过Qiagen DNA提取试剂盒提取人DNA,并通过NanoDrop(ThermoFisher,USA)和Qubit 3(ThermoFisher,USA)测量DNA的量。
选择三种致癌基因用于该实验。设计甲基化修饰的正向和反向引物用于检测EGFR、KIT和TP53致癌基因的变体。每个引物由靶特异性区域和甲基化修饰的辅助通用区域组成。
在20μL反应体积中,在基因组DNA、DNA聚合酶、dNTP和PCR缓冲液存在下,应用6种甲基化修饰的引物进行多重PCR。PCR条件由以下组成:在98℃下起始30秒,98℃下10秒、63℃下4分钟、72℃下20秒的15个循环和最终在72℃下延伸2分钟。
根据制造商的说明书,对扩增产物进行核酸外切酶I(NEB,USA)消化以去除冗余引物和进行SPRIselect(Beckman Coulter,USA)珠纯化以选择大片段。
根据制造商的说明书,在单独的反应中用MspJI或LpnPI(NEB,USA)消化PCR产物。通过SPRIselect(Beckman Coulter,USA)珠纯化消化的产物。
根据制造商的说明书,使用瞬时粘性末端连接酶预混液(Instant Sticky-EndLigase Master Mix)(NEB,USA)将消化的产物连接至含有互补粘性末端的衔接子。在Applied Biosystems Veriti热循环仪(ThermoFisher,USA)上进行程序。
通过SPRISelect(Beckman Coulter,USA)珠纯化连接的DNA产物以除去多余的连接衔接子。
使用条形码化的通用引物对连接产物进行PCR,在20μL反应体积中在DNA聚合酶、dNTP和PCR缓冲液存在下与连接产物通用引发位点杂交。PCR条件由以下组成:在98℃下起始30秒,98℃下10秒、68℃下30秒、72℃下20秒的21个循环和最终在72℃下延伸2分钟。
用核酸外切酶I(NEB,USA)消化扩增产物以除去冗余引物,并通过SPRIselect珠(Beckman Coulter,USA)纯化,然后在Qubit 3(ThermoFisher,USA)上测量。通过Sanger测序对最终产物进行双向测序。
实施例2
用于从FFPE样品中鉴定肺癌中的突变和融合基因的癌症基因组合
材料和方法
将人基因组DNA用于该实验以分析可影响治疗方案的可能突变。
根据制造商的说明书,通过Qiagen DNA提取试剂盒提取DNA,并通过NanoDrop(ThermoFisher,USA)和Qubit 3(ThermoFisher,USA)测量DNA的量。
癌症基因和引物设计:基于文献检索,选择了15种癌症相关基因:AKT1、ALK、BRAF、CTNNB1、EGFR、ERBB2、HRAS、KIT、KRAS、MAP2K1、MET、NRAS、PDGFRA、PIK3CA和TP53。为了检测这些基因上的热点突变,设计了61对正向和反向引物用于靶核酸的多重扩增。
在20μL反应体积中,在基因组DNA、DNA聚合酶、dNTP和PCR缓冲液存在下,应用含有通用辅助序列的122种靶特异性引物进行多重PCR。PCR条件由以下组成:在98℃下起始30秒,98℃下10秒、63℃下4分钟、72℃下20秒的10个循环和最终在72℃下延伸2分钟。
根据制造商的说明书,对来自第一扩增的扩增产物进行核酸外切酶I(NEB,USA)处理以除去冗余引物。然后,通过SPRIselect珠(Beckman Coulter,USA)纯化所得的第一扩增子。
在DNA聚合酶、dNTP和PCR缓冲液存在下,在20μL反应体积中,使用来自第一扩增的一部分纯化产物和甲基化的通用辅助引物进行扩增。PCR条件由以下组成:在98℃下起始30秒,98℃10秒、69℃30秒、72℃30秒的15个循环和最终在72℃下延伸2分钟。
根据制造商的说明书,对扩增产物进行核酸外切酶I(NEB,USA)消化以除去冗余引物和SPRIselect珠(Beckman Coulter,USA)纯化以选择大片段。
根据制造商的说明书,使用MspJI或LpnPI(NEB,USA)消化扩增的产物,然后通过SPRIselect珠纯化。
根据制造商的说明书,使用瞬时粘性末端连接酶预混液(Instant Sticky-EndLigase Master Mix)(NEB,USA)将消化的产物连接至含有互补粘性末端的衔接子。在Applied Biosystems Veriti热循环仪(ThermoFisher,USA)上进行程序。
然后通过SPRIselect珠纯化连接的DNA产物以除去多余的连接衔接子。
使用条形码化的通用引物对连接产物进行PCR,在20μL反应体积中在DNA聚合酶、dNTP和PCR缓冲液存在下与连接产物通用引发位点杂交。PCR条件由以下组成:在98℃下起始30秒,98℃10秒、68℃30秒、72℃20秒的21个循环和最终在72℃下延伸2分钟。
用核酸外切酶I(NEB,USA)消化扩增产物以除去冗余引物,并用SPRIselect珠纯化,然后在Qubit 3(ThermoFisher,USA)上测量。
在MiniSeq测序系统(Illumina,CA,USA)上使用MiniSeq中输出试剂盒(MiniSeqMid Output Kit)进行文库的测序。
分析从上述实验产生的序列数据的突变和变异。
本文描述的方法及其各种实施方式是示例性的。本文描述的方法的各种其他实施方式是可能的。

Claims (23)

1.一种富集样品中的核酸靶序列的方法,包括以下步骤:
在测试反应中,使两种或更多种靶特异性引物与所述样品中的靶序列杂交,其中所述靶特异性引物包含具有甲基化依赖性核酸内切酶限制性酶识别位点的甲基化的通用辅助部分和被配置成靶向所述样品中的所述核酸靶序列的靶特异性部分;
使所述测试反应在最佳扩增条件下进行扩增以产生包含扩增子的扩增产物;
用甲基化依赖性核酸内切酶限制性酶对所述扩增产物进行消化以形成消化产物,其中所述消化产物包含扩增子,所述扩增子在链的每个末端上包含粘性末端;
对所述消化产物进行大小选择纯化以去除消化的引物二聚体和未使用的引物,以产生包含dsDNA的消化的扩增子;
将通用衔接子连接至来自所述消化的扩增子的dsDNA以形成连接产物,其中所述连接通用衔接子包含通用序列部分和粘性末端;以及
用与所述连接通用衔接子上的序列互补的条形码化的通用引物对所述连接产物进行扩增,以形成包含最终扩增子的最终扩增产物。
2.根据权利要求1所述的方法,其进一步包括在至少一个额外测试反应中的至少一个额外靶特异性引物组。
3.根据权利要求1所述的方法,其中所述样品包含基因组DNA。
4.根据权利要求1所述的方法,其中所述样品包含RNA,并且所述方法进一步包括在第一扩增之前使所述RNA进行逆转录反应以产生双链cDNA的步骤。
5.根据权利要求1所述的方法,其中所述方法进一步包括对所述最终扩增子进行下一代测序以产生序列数据的步骤。
6.根据权利要求5所述的方法,进一步包括测量所述序列数据中多态性位点处的等位基因计数的步骤。
7.根据权利要求1所述的方法,其中所述连接通用衔接子进一步包含条形码序列。
8.根据权利要求1所述的方法,其中所述样品包含选自由以下组成的组的核酸:从妊娠受试者获得的母体cfDNA和cffDNA的混合物、循环cfDNA和循环ctDNA。
9.根据权利要求1所述的方法,其中所述靶特异性引物包含至少一对正向靶特异性引物和反向靶特异性引物。
10.根据权利要求1所述的方法,其中所述靶序列包含与妊娠胎儿中的疾病、癌症、病症、感染、药物遗传学药物治疗(伴随诊断)、耐药性或药物抗生素耐药性、或非整倍性或三体性相关的一个或多个突变。
11.一种富集样品中的核酸靶序列的方法,包括以下步骤:
在测试反应中,使两种或更多种靶特异性引物与核酸靶序列杂交,其中所述靶特异性引物包含在5’端的互补通用辅助部分和被配置为靶向所述样品中的所述核酸靶序列的靶特异性部分;
在最佳扩增条件下用通用辅助引物对所述测试反应进行第一扩增以形成扩增产物;
使用甲基化的通用辅助引物对所述扩增产物的一部分进行第二扩增以形成第二扩增产物,其中所述甲基化的通用辅助引物包含限制性酶识别序列;
用甲基化依赖性核酸内切酶限制性酶对所述第二扩增产物进行消化,以形成包含扩增子的消化产物,所述扩增子在链的每个末端上包含粘性末端;
对所述消化产物进行大小选择纯化以除去消化的引物二聚体和未使用的引物,以形成包含dsDNA的消化的扩增子;
将通用衔接子连接至来自所述消化的扩增子的dsDNA以形成连接产物,其中所述连接通用衔接子包含互补粘性末端和通用序列部分;以及
使用与所述连接通用衔接子上的序列互补的条形码化的通用引物对所述连接产物进行第三扩增,以形成包含最终扩增子的最终扩增产物。
12.根据权利要求11所述的方法,进一步包括在至少一个额外测试反应中的至少一个额外靶特异性引物组。
13.根据权利要求11所述的方法,其中所述样品包含基因组DNA。
14.根据权利要求11所述的方法,其中所述样品包含RNA,并且其中所述方法进一步包括在所述第一扩增之前使所述RNA进行逆转录反应以产生双链cDNA。
15.根据权利要求11所述的方法,其中所述方法进一步包括对所述最终扩增子进行下一代测序以产生序列数据的步骤。
16.根据权利要求15所述的方法,进一步包括测量所述序列数据中多态性位点处的等位基因计数的步骤。
17.根据权利要求11所述的方法,其中所述连接通用衔接子进一步包含条形码序列。
18.根据权利要求11所述的方法,其中所述样品包含选自由以下组成的组的核酸:从妊娠受试者获得的母体cfDNA和cffDNA的混合物、循环cfDNA和循环ctDNA。
19.根据权利要求11所述的方法,其中所述靶特异性引物包含至少一对正向靶特异性引物和反向靶特异性引物。
20.根据权利要求11所述的方法,其中所述靶序列包含与妊娠胎儿中的疾病、癌症、病症、感染、药物遗传学药物治疗(伴随诊断)、耐药性或药物抗生素耐药性、或非整倍性或三体性相关的一个或多个突变。
21.一种试剂盒,包括:
至少一对正向和反向靶特异性引物;
甲基化依赖性核酸内切酶限制性酶;
包含通用序列部分和粘性末端部分的连接衔接子;以及
条形码化的通用衔接子。
22.根据权利要求21所述的试剂盒,其中所述靶特异性引物包含甲基化的通用辅助部分和靶特异性部分,所述甲基化的通用辅助部分包含甲基化依赖性核酸内切酶限制性酶识别位点。
23.根据权利要求21所述的试剂盒,其中所述靶特异性引物包含通用辅助部分和靶特异性部分,所述通用辅助部分包含甲基化依赖性核酸内切酶限制性酶识别位点,并且进一步包含互补甲基化的通用辅助引物,所述互补甲基化的通用辅助引物包含限制性酶识别序列。
CN202080089446.XA 2019-12-19 2020-10-26 用于多重靶扩增pcr的有效方法和组合物 Pending CN114929896A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US16/720,823 US11680290B2 (en) 2019-12-19 2019-12-19 Efficient methods and compositions for multiplex target amplification PCR
US16/720,823 2019-12-19
PCT/US2020/057287 WO2021126367A1 (en) 2019-12-19 2020-10-26 Efficient methods and compositions for mulitplex target amplification pcr

Publications (1)

Publication Number Publication Date
CN114929896A true CN114929896A (zh) 2022-08-19

Family

ID=76437995

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080089446.XA Pending CN114929896A (zh) 2019-12-19 2020-10-26 用于多重靶扩增pcr的有效方法和组合物

Country Status (4)

Country Link
US (1) US11680290B2 (zh)
EP (1) EP4077708A4 (zh)
CN (1) CN114929896A (zh)
WO (1) WO2021126367A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116516012B (zh) * 2023-05-24 2023-10-13 北京阅微基因技术股份有限公司 Pole基因分型检测的复合扩增体系及试剂盒

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3117011B1 (en) * 2014-03-13 2020-05-06 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US10233490B2 (en) * 2014-11-21 2019-03-19 Metabiotech Corporation Methods for assembling and reading nucleic acid sequences from mixed populations
GB2532749B (en) * 2014-11-26 2016-12-28 Population Genetics Tech Ltd Method for preparing a nucleic acid for sequencing using MspJI family restriction endonucleases
CN117778531A (zh) * 2017-06-30 2024-03-29 生命技术公司 分子库制备方法以及其组合物和用途

Also Published As

Publication number Publication date
US11680290B2 (en) 2023-06-20
EP4077708A1 (en) 2022-10-26
WO2021126367A1 (en) 2021-06-24
EP4077708A4 (en) 2024-01-10
US20210189457A1 (en) 2021-06-24

Similar Documents

Publication Publication Date Title
US20240117420A1 (en) Methods and compositions for multiplex pcr
JP6571895B1 (ja) 核酸プローブ及びゲノム断片検出方法
US10100354B2 (en) Methods and compositions for multiplex PCR
JP7008407B2 (ja) ヌクレアーゼ、リガーゼ、ポリメラーゼ、及び配列決定反応の組み合わせを用いた、核酸配列、発現、コピー、またはdnaのメチル化変化の識別及び計数方法
EP2966180B1 (en) Methods and compositions for multiplex pcr
US10266881B2 (en) Methods and compositions for multiplex PCR
US9745614B2 (en) Reduced representation bisulfite sequencing with diversity adaptors
US11261479B2 (en) Methods and compositions for enrichment of target nucleic acids
WO2020106906A1 (en) Methods for targeted nucleic acid library formation
US20230193380A1 (en) Systems and methods for targeted nucleic acid capture
US11680290B2 (en) Efficient methods and compositions for multiplex target amplification PCR
WO2023159250A1 (en) Systems and methods for targeted nucleic acid capture and barcoding
KR20240032631A (ko) 변이체 핵산의 정확한 병렬 정량을 위한 고감도 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination