CN116075520A - 扩增子全面富集 - Google Patents

扩增子全面富集 Download PDF

Info

Publication number
CN116075520A
CN116075520A CN202180049991.0A CN202180049991A CN116075520A CN 116075520 A CN116075520 A CN 116075520A CN 202180049991 A CN202180049991 A CN 202180049991A CN 116075520 A CN116075520 A CN 116075520A
Authority
CN
China
Prior art keywords
oligonucleotide
dna
composition
subsequence
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180049991.0A
Other languages
English (en)
Inventor
大卫·张
张克柔
宋萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
William Marsh Rice University
Original Assignee
William Marsh Rice University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by William Marsh Rice University filed Critical William Marsh Rice University
Publication of CN116075520A publication Critical patent/CN116075520A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/143Multiplexing, i.e. use of multiple primers or probes in a single reaction, usually for simultaneously analyse of multiple analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/163Reactions characterised by the reaction format or use of a specific feature the purpose or use of blocking probe
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2561/00Nucleic acid detection characterised by assay method
    • C12Q2561/101Taqman
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/173Nucleic acid detection characterized by the use of physical, structural and functional properties staining/intercalating agent, e.g. ethidium bromide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Steroid Compounds (AREA)

Abstract

本文提供了用于在靶向区域内全面富集潜在变体的试剂和方法,称为扩增子全面富集(ACE)。所富集的序列变体可以包含单核苷酸多态性(SNP)、单核苷酸变体或小插入和缺失。实施例包含与实时聚合酶链式反应、下一代测序(NGS)和长读长测序整合的程序。

Description

扩增子全面富集
相关申请的引用
本申请要求于2020年6月26日提交的美国临时申请号63/044,634的优先权,其全部内容通过引用并入本文。
关于联邦资助研究的声明
本发明是在国立卫生研究院授予的资助号R01CA203964的政府支持下完成的。政府在本发明中具有某些权利。
对序列表的参考
本申请含有已经以ASCII格式经由EFS-Web递交的序列表并且将此序列表通过引用以其整体并入本文。所述ASCII副本创建于2021年6月8日,名为RICEP0077WO_ST25.txt,大小为11.6千字节。
技术领域
本公开一般涉及分子生物学领域。更特别地,它涉及用于在靶向区域内全面富集潜在变体的试剂和方法,称为扩增子全面富集(ACE)。
背景技术
具有低变体等位基因分数(VAF)的DNA序列变体的检测对于一系列研究和临床应用至关重要,包含癌症肿瘤活检和血浆无细胞DNA样本中的肿瘤特异性突变的检测。目前用于检测低VAF突变的仪器要么灵敏度有限(例如,10%VAF下的桑格和纳米孔测序),要么在多重化方面有限(例如,1重数字PCR)或价格昂贵(例如,用唯一分子标识符(UMI)条形码进行深度测序至25000x或更高)。DNA序列变体的选择性富集将提高qPCR、桑格测序和纳米孔测序的灵敏度,同时降低边合成边测序(NGS)的成本。
先前的变体富集方法,如基于振荡电场(Boreal Genomics)、具有复杂斜坡的PCR(ICE-COLD PCR)、核酸类似物阻断剂(Diacarta)和酶促消化(Name-Pro),由于这些方法对环境温度和探针序列的高度脆弱性,通常难以针对多重化基因包进行产品化。阻断剂置换扩增法(Nuprobe)允许温度稳健的变体序列富集,但是具有约20个核苷酸(nt)的富集窗口,这使得它难以用于检查长连续外显子中(例如,如TP53和BRCA1等肿瘤抑制基因中)的突变。因此,需要新的变体富集方法,其允许检查长区域中的突变。
发明内容
因此,本文提供了等位基因全面富集(ACE)技术,它允许在至多100nt的长区域中进行多重化变体等位基因富集。
在一个实施例中,本文提供了组合物,其包括:(a)辅助寡核苷酸,(b)抑制寡核苷酸,其中所述抑制寡核苷酸包括至少20个核苷酸长并且与所述辅助寡核苷酸的子序列反向互补的受保护子序列,其中所述抑制寡核苷酸包括至少7个核苷酸长并且不与所述辅助寡核苷酸反向互补的未受保护子序列,(c)正向引物寡核苷酸,其中所述正向引物寡核苷酸包括与所述抑制寡核苷酸的子序列具有同一性的至少6个核苷酸长的子序列,和(d)模板依赖性聚合酶。在一些方面中,所述组合物进一步包括聚合酶功能所需的试剂和缓冲液。在一些方面中,所述模板依赖性聚合酶是DNA聚合酶。在一些方面中,所述模板依赖性聚合酶是逆转录酶。在一些方面中,所述模板依赖性聚合酶是RNA聚合酶。
在一些方面中,所述组合物进一步包括核酸模板分子,其中所述模板分子包括与所述正向引物寡核苷酸的3′子序列的反向互补序列具有超过90%的同源性的子序列。在一些方面中,所述模板分子是生物DNA或RNA分子。在一些方面中,所述模板分子获自细胞样本。在一些方面中,所述模板分子获自生物流体。在某些方面中,所述生物流体是血液、尿液、唾液、脑脊液、间质液或滑液。在一些方面中,所述模板分子获自组织。在某些方面中,所述组织是活检组织或手术切除组织。在一些方面中,所述模板分子是通过RNA分子的逆转录生成的互补DNA分子。在一些方面中,所述RNA分子获自源自人、动物、植物或环境标本的生物RNA样本。在一些方面中,所述模板分子是通过作用于单链DNA模板的DNA聚合酶生成的扩增子DNA分子。在一些方面中,所述模板分子是由单细胞DNA的多重置换扩增生成的扩增子DNA分子。在一些方面中,所述模板分子是生物DNA分子的物理、化学或酶促生成产物。在一些方面中,所述模板分子是片段化过程的产物。在一些方面中,所述片段化过程是超声处理或酶促片段化。在一些方面中,所述模板分子是亚硫酸氢盐转化反应、APOBEC反应(即载脂蛋白B mRNA编辑酶、催化多肽样反应)、TAPS反应(即TET辅助的吡啶硼烷测序反应)或其它化学或酶促反应的产物,其中胞嘧啶核苷酸基于其甲基化状态选择性地转化为尿嘧啶核苷酸。
在一些方面中,所述辅助寡核苷酸包括起始互补序列子序列和靶结合互补序列子序列。在一些方面中,所述辅助寡核苷酸包括DNA。在一些方面中,所述辅助寡核苷酸由DNA组成。在一些方面中,所述辅助寡核苷酸包括非天然寡核苷酸。在一些方面中,所述辅助寡核苷酸的长度在30和500nt、50和500nt、100和500nt、30和400nt、30和300nt、30和200nt、30和100nt、30和75nt以及30和50nt之间。在一些方面中,所述辅助寡核苷酸至少或约30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450或500个核苷酸长。在一些方面中,所述辅助寡核苷酸具有阻止DNA聚合酶延伸的3′化学修饰或DNA序列。
在一些方面中,所述抑制寡核苷酸包括未受保护子序列和受保护子序列。所述受保护子序列由靶结合子序列和起始子序列组成。在一些方面中,所述受保护子序列至少20个核苷酸长,并且与所述辅助寡核苷酸的至少一个子序列反向互补。在一些方面中,所述受保护子序列至少或约20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100个核苷酸长。在一些方面中,所述受保护子序列的长度在20-500nt、20-400nt、20-300nt、20-200nt、20-100nt、20-80nt、20-60nt、30-500nt、30-400nt、30-300nt、30-200nt、30-100nt、30-80nt、30-60nt、40-500nt、40-400nt、40-300nt、40-200nt、40-100nt、40-80nt、50-500nt、50-400nt、50-300nt、50-200nt、50-100nt、50-80nt或100-500nt之间。在一些方面中,所述受保护子序列与整个所述辅助寡核苷酸反向互补。在一些方面中,所述未受保护子序列至少7个核苷酸长,并且不与所述辅助寡核苷酸的任何部分反向互补。在一些方面中,所述未受保护子序列至少或约8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸长。在一些方面中,所述未受保护子序列的长度在8-30nt、8-25nt、8-20nt、8-15nt、12-30nt、12-25nt、12-20nt、16-30nt或16-25nt之间。
在一些方面中,所述起始子序列在所述抑制寡核苷酸的3′处或附近。在一些方面中,所述起始子序列的长度在4和30个核苷酸之间(例如,4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸;或在4-30nt、4-25nt、4-20nt、4-15nt、8-30nt、8-25nt、8-20nt、8-15nt、12-30nt、12-25nt、12-20nt、16-30nt或16-25nt之间)。在一些方面中,所述起始子序列与紧邻所述靶子序列的3′的所述模板分子子序列的反向互补序列具有小于30%的同一性(即小于约30%、28%、26%、24%、22%、20%、18%或16%的同一性)。在一些方面中,所述辅助寡核苷酸在所述辅助寡核苷酸的5′端处或附近具有起始互补序列子序列。在一些方面中,所述起始互补序列子序列的长度在4和35个核苷酸之间(例如,4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸;或在4-30nt、4-25nt、4-20nt、4-15nt、8-30nt、8-25nt、8-20nt、8-15nt、12-30nt、12-25nt、12-20nt、16-30nt或16-25nt之间)。在一些方面中,所述起始互补序列子序列与所述抑制寡核苷酸的所述起始子序列的反向互补序列具有至少90%的同一性(例如,约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性)。在一些方面中,所述辅助寡核苷酸不具有与所述正向引物寡核苷酸的反向互补序列具有超过30%的同一性(例如,同一性不超过约30%、28%、26%、24%、22%、20%、18%或16%)的子序列。
在一些方面中,所述抑制寡核苷酸包括DNA。在一些方面中,所述抑制寡核苷酸由DNA组成。在一些方面中,所述抑制寡核苷酸包括非天然寡核苷酸。在一些方面中,所述抑制寡核苷酸的长度在30和500、50和500、100和500、30和400、30和300、30和200、30和100、30和75以及30和50个核苷酸之间。在一些方面中,所述抑制寡核苷酸至少或约30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450或500个核苷酸长。在一些方面中,所述抑制寡核苷酸的所述未受保护子序列不与所述辅助寡核苷酸的任何部分反向互补。在一些方面中,所述抑制寡核苷酸具有阻止DNA聚合酶延伸的3′化学修饰或DNA序列。
在一些方面中,所述正向引物寡核苷酸包括与所述抑制寡核苷酸的子序列具有同一性的至少6个核苷酸长的子序列。在一些方面中,所述正向引物寡核苷酸包括DNA。在一些方面中,所述正向引物寡核苷酸由DNA组成。在一些方面中,所述正向引物寡核苷酸包括RNA。在一些方面中,所述正向引物寡核苷酸由RNA组成。在一些方面中,所述正向引物寡核苷酸的长度在6和70个核苷酸之间(例如,6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65或70个核苷酸;或在6-70nt、6-30nt、6-25nt、6-20nt、6-15nt、8-70nt、8-30nt、8-25nt、8-20nt、8-15nt、12-70nt、12-30nt、12-25nt、12-20nt、16-70nt、16-30nt或16-25nt之间)。在一些方面中,所述正向引物寡核苷酸和所述辅助寡核苷酸不能相互杂交。
在一些方面中,所述组合物进一步包括反向引物寡核苷酸,其中所述模板分子包括与所述反向引物寡核苷酸的3′子序列具有超过90%的同源性(例如,约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或1090%的同源性)的子序列。在一些方面中,所述反向引物寡核苷酸的长度在10和70个核苷酸之间(例如,10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65或70个核苷酸;或在10-70nt、10-30nt、10-25nt、10-20nt、10-15nt、12-70nt、12-30nt、12-25nt、12-20nt、16-70nt、16-30nt或16-25nt之间)。
在一些方面中,所述模板分子包括位于正向引物结合子序列和反向引物同源子序列之间的靶子序列。在一些方面中,所述靶子序列与不包含所述起始子序列(即所述靶结合子序列)的抑制寡核苷酸保护子序列的部分的反向互补序列具有至少70%的同一性(例如,约70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性)。
在一些方面中,所述抑制寡核苷酸和所述辅助寡核苷酸各自具有阻止DNA聚合酶延伸的3′化学修饰。在一些方面中,所述修饰包括双脱氧核苷酸、反向DNA核苷酸、经硫代膦酸酯取代的主链和烷烃或聚乙二醇(PEG)间隔子。
在一些方面中,所述抑制寡核苷酸和所述辅助寡核苷酸各自具有阻止DNA聚合酶延伸的DNA序列。在一些方面中,3′端处的所述DNA序列形成至少一个发夹结构。
在一些方面中,所述组合物进一步包括荧光团功能化DNA探针。在某些方面中,所述荧光团功能化DNA探针是Taqman探针或分子信标。
在一些方面中,所述组合物进一步包括DNA嵌入染料。在某些方面中,所述DNA嵌入染料是SybrGreen、EvaGreen或Syto。
在一些方面中,所述辅助寡核苷酸与所述抑制寡核苷酸的化学计量比在0.8和100之间。
在一些方面中,所述正向引物寡核苷酸和所述模板分子在60℃的温度和0.2M钠的盐度下的标准杂交自由能(ΔG°1)在-7.0kcal/mol和-20.0kcal/mol之间。例如,所述正向引物寡核苷酸和所述模板分子的标准杂交自由能(ΔG°1)在-7.0和-20.0kcal/mol之间,在-7.0和-18.0kcal/mol之间,在-7.0和-16.0kcal/mol之间,在-7.0和-14.0kcal/mol之间,在-7.0和-12.0kcal/mol之间,在-7.0和-10.0kcal/mol之间,在-10.0和-20.0kcal/mol之间,在-10.0和-18.0kcal/mol之间,在-10.0和-16.0kcal/mol之间,在-10.0和-14.0kcal/mol之间,或在其中可推导的任何范围内。在一些方面中,所述正向引物寡核苷酸和所述模板分子的标准杂交自由能(ΔG°1)为至少或约-7.0、-8.0、-9.0、-10.0、-11.0、-12.0、-13.0、-14.0、-15.0、-16.0、-17.0、-18.0、-19.0或-20.0kcal/mol。
在一些方面中,所述抑制寡核苷酸和所述模板分子在60℃的温度和0.2M钠的盐度下的标准杂交自由能(ΔG°2)在-16kcal/mol和-200kcal/mol之间。例如,所述抑制寡核苷酸和所述模板分子的标准杂交自由能(ΔG°2)在-16和-200kcal/mol之间,在-16和-150kcal/mol之间,在-16和-100kcal/mol之间,在-16和-50kcal/mol之间,在-16和-25kcal/mol之间,在-25和-200kcal/mol之间,在-25和-150kcal/mol之间,在-25和-100kcal/mol之间,在-25和-75kcal/mol之间,在-25和-50kcal/mol之间。在一些方面中,所述抑制寡核苷酸和所述模板分子的标准杂交自由能(ΔG°2)为至少或约-16、-18、-20、-25、-30、-35、-40、-45、-50、-55、-60、-65、-70、-75、-80、-85、-90、-95、-100、-125、-150、-175或-200kcal/mol。
在一些方面中,所述抑制寡核苷酸和所述辅助寡核苷酸在60℃的温度和0.2M钠的盐度下的标准杂交自由能(ΔG°3)在-15kcal/mol和-200kcal/mol之间-例如,所述抑制寡核苷酸和所述辅助寡核苷酸的标准杂交自由能(ΔG°3)在-15和-200kcal/mol之间,在-15和-150kcal/mol之间,在-15和-100kcal/mol之间,在-15和-50kcal/mol之间,在-15和-25kcal/mol之间,在-25和-200kcal/mol之间,在-25和-150kcal/mol之间,在-25和-100kcal/mol之间,在-25和-75kcal/mol之间,在-25和-50kcal/mol之间。在一些方面中,所述抑制寡核苷酸和所述辅助寡核苷酸的标准杂交自由能(ΔG°3)为至少或约-15、-16、-17、-18、-19、-20、-25、-30、-35、-40、-45、-50、-55、-60、-65、-70、-75、-80、-85、-90、-95、-100、-125、-150、-175或-200kcal/mol。
在一些方面中,(ΔG°2-ΔG°3)的值在-5kcal/mol和+5kcal/mol之间。例如,(ΔG°2-ΔG°3)的值在-5和+5kcal/mol之间,在-5和+4kcal/mol之间,在-5和+3kcal/mol之间,在-5和+2kcal/mol之间,在-5和+1kcal/mol之间,在-5和0kcal/mol之间,在-5和-1kcal/mol之间,在-5和-2kcal/mol之间,在-5和-3kcal/mol之间,在-4和+5kcal/mol之间,在-3和+5kcal/mol之间,在-2和+5kcal/mol之间,在-1和+5kcal/mol之间,在0和+5kcal/mol之间,在+1和+5kcal/mol之间,+2和+5kcal/mol,在+3和+5kcal/mol之间,在-4和+4kcal/mol之间,在-3和+3kcal/mol之间,在-2和+2kcal/mol之间,在-1和+1kcal/mol之间,在-2和0kcal/mole之间,在-2和+1kcal/mol之间,或在-1和+2kcal/mol之间。在一些方面中,(ΔG°2-ΔG°3)的值为至少或约-5、-4、-3、-2、-1、0、+1、+2、+3、+4或+5kcal/mol。
在一些方面中,所述反向引物寡核苷酸和所述变体模板分子在60℃的温度和0.2M钠的盐度下的标准杂交自由能(ΔG°4)在-7kcal/mol和-20kcal/mol之间。例如,所述反向引物寡核苷酸和所述模板分子的标准杂交自由能(ΔG°4)在-7和-20kcal/mol之间,在-7和-18kcal/mol之间,在-7和-16kcal/mol之间,在-7和-14kcal/mol之间,在-7和-12kcal/mol之间,在-7和-10kcal/mol之间,在-10和-20kcal/mol之间,在-10和-18kcal/mol之间,在-10和-16kcal/mol之间,或在-10和-14kcal/mol之间。在一些方面中,所述反向引物寡核苷酸和所述模板分子的标准杂交自由能(ΔG°4)为至少或约-7、-8、-9、-10、-11、-12、-13、-14、-15、-16、-17、-18、-19或-20kcal/mol。
在一些方面中,与所述野生型DNA模板分子杂交的所述抑制寡核苷酸在热力学上比与所述辅助寡核苷酸结合的所述抑制寡核苷酸更有利,与所述辅助寡核苷酸结合的所述抑制寡核苷酸在热力学上比与所述DNA模板分子结合的所述正向引物寡核苷酸更有利,与所述DNA模板分子结合的所述正向引物寡核苷酸在热力学上比与所述变体DNA模板分子结合的所述抑制寡核苷酸更有利。
在一些方面中,所述组合物包括多个抑制寡核苷酸物种、多个辅助寡核苷酸物种和多个正向引物寡核苷酸物种。在一些方面中,每个抑制寡核苷酸物种包括至少20个核苷酸长并且与至少一个相对应的辅助寡核苷酸物种的子序列反向互补的受保护子序列。在一些方面中,每个正向引物寡核苷酸物种包括与至少一个相对应的抑制寡核苷酸物种的子序列具有同一性的至少6个核苷酸长的子序列。在一些方面中,所述多个正向引物寡核苷酸物种各自在其5′区域处包括第一通用衔接子序列。
在一个实施例中,本文提供了用于使用聚合酶链式反应选择性扩增DNA序列变体的方法,所述方法包括:(a)将可能包括变体DNA模板分子并且可能包括野生型DNA模板分子的样本与本实施例的任一实施例的组合物混合,以及(b)使所述混合物经受至少7轮热循环。例如,所述热循环可以进行至少或约7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35或40个循环。在一些方面中,每轮热循环包括将所述混合物保持在80℃和105℃之间(例如,80和105℃之间、80和100℃之间、80和95℃之间、85和105℃之间、85和100℃之间、85和95℃之间;或至少或约80、85、90、95、100或105℃)的温度下1秒至1小时(例如,1秒-1小时、1秒-30分钟、10秒-30分钟、20秒-30分钟、30秒-30分钟、45秒-30分钟、1分钟-30分钟、2分钟-30分钟、30秒-5分钟或1分钟-5分钟;或至少或约1秒、5秒、10秒、15秒、20秒、30秒、45秒、1分钟、2分钟、5分钟或10分钟),然后将所述混合物保持在50℃和75℃之间(例如,50和75℃之间、50和72℃之间、50和70℃之间、50和65℃之间、50和60℃之间、55和75℃之间、55和72℃之间、55和70℃之间、55和65℃之间、60和75℃之间、60和72℃之间、60和70℃之间、65和75℃之间;或至少或约50、55、60、65、70或75℃)的退火温度下1秒至2小时(例如,1秒-2小时、1秒-1小时、1秒-30分钟、10秒-30分钟、20秒-30分钟、30秒-30分钟、45秒-30分钟、1分钟-30分钟、2分钟-30分钟、30秒-5分钟或1分钟-5分钟;或至少或约1秒、5秒、10秒、15秒、20秒、30秒、45秒、1分钟、2分钟、5分钟或10分钟)。
在一些方面中,将多个正向引物寡核苷酸、反向引物寡核苷酸、抑制寡核苷酸和辅助寡核苷酸与所述样本混合,其中每组正向引物寡核苷酸、反向引物寡核苷酸、抑制寡核苷酸和辅助寡核苷酸对应于不同的变体模板分子和野生型模板分子序列。在一些方面中,所有正向引物寡核苷酸在5′端处或附近包括通用正向衔接子序列,并且其中所有反向引物寡核苷酸在5′端处或附近包括通用反向衔接子子序列。在一些方面中,每个抑制寡核苷酸物种包括至少20个核苷酸长并且与至少一个相对应的辅助寡核苷酸物种的子序列反向互补的受保护子序列。在一些方面中,每个正向引物寡核苷酸物种包括与至少一个相对应的抑制寡核苷酸物种的子序列具有同一性的至少6个核苷酸长的子序列。
在一些方面中,所述混合物中的每个正向引物寡核苷酸的浓度在100pM和5μM之间。在一些方面中,所述混合物中的每个反向引物寡核苷酸的浓度在100pM和5μM之间。在一些方面中,所述混合物中的每个抑制寡核苷酸的浓度在100pM和5μM之间。在一些方面中,每个辅助寡核苷酸的浓度在100pM和5μM之间。对于这些中的任何一个,浓度可以在100pM-5μM、200pM-5μM、300pM-5μM、400pM-5μM、500pM-5μM、750pM-5μM、1nM-5μM、250nM-5μM、500nM-5μM、750nM-5μM、1μM-5μM、100pM-1μM、200pM-1μM、300pM-1μM、400pM-1μM、500pM-1μM、750pM-1μM、1nM-1μM或500pM-500nM之间。例如,浓度可以为至少或约100pM、200pM、300pM、400pM、500pM、750pM、1nM、10nM、50nM、100nM、200nM、300nM、400nM、500nM、750nM、1μM、2μM、3μM、4μM或5μM。
在一些方面中,每个正向引物寡核苷酸与其相对应的抑制寡核苷酸的化学计量比在0.8和100之间。在一些方面中,每个辅助寡核苷酸与其相对应的抑制寡核苷酸的化学计量比在0.8和100之间。
在一些方面中,所述混合物进一步包括荧光团功能化DNA探针。在某些方面中,所述荧光团功能化DNA探针是Taqman探针或分子信标。在一些方面中,所述混合物进一步包括DNA嵌入染料。在某些方面中,所述DNA嵌入染料是SybrGreen、EvaGreen或Syto。
在一个实施例中,本文提供了用于使用定量PCR(qPCR)选择性地检测和量化DNA序列变体的方法,所述方法包括:(a)根据本实施例任一实施例的选择性扩增方法在样本的第一等分试样中进行变体DNA模板相较于野生型DNA模板的选择性PCR扩增;(b)进行基于时间的溶液荧光测量;(c)基于所述溶液荧光超过阈值的循环计算循环阈值(Ct);和(d)基于Ct值确定所述样本中是否存在所述变体DNA模板或确定其量。在一些方面中,所述qPCR混合物包括Taqman探针。在一些方面中,所述方法进一步包括:(e)在不存在抑制寡核苷酸的情况下,使用所述正向引物寡核苷酸和所述反向引物寡核苷酸对所述样本的第二等份试样进行第二qPCR反应;(f)计算本第二反应的循环阈值(Ct2);和(g)基于Ct和Ct2之间的值差异确定变体DNA模板与野生型DNA模板的相对量。
在一个实施例中,本文提供了用于使用高通量测序选择性地检测和量化DNA序列变体的方法,所述方法包括:(a)根据本实施例任一实施例的选择性扩增方法在样本的第一等分试样中进行变体DNA模板相较于野生型DNA模板的选择性PCR扩增;以及(b)对步骤(a)的PCR产物进行高通量测序。
在一些方面中,所述正向引物寡核苷酸在其5′端处包括正向测序衔接子,并且所述反向引物寡核苷酸在其5′端处包括反向测序衔接子。在某些方面中,所述测序衔接子中的一个或两个包括唯一分子标识符(UMI)序列。
在一些方面中,所述方法进一步包括使用PCR附加测序衔接子和/或测序索引。在某些方面中,所述测序衔接子包括唯一分子标识符(UMI)序列。
在一些方面中,所述方法进一步包括在进行高通量测序之前将测序衔接子连接至步骤(a)的PCR产物。在某些方面中,经由连接附加的所述测序衔接子包括唯一分子标识符(UMI)序列。
在一些方面中,所述UMI序列包括一组预先设计的序列,其中每对UMI序列表现出不小于所述UMI的长度的30%的最小汉明距离。在一些方面中,所述UMI序列包括一组包括退化核苷酸的序列,所述退化核苷酸选自N(A、C、G和T的混合物)、B(C、G和T的混合物)、D(A、G和T的混合物)、H(C、A和T的混合物)、V(A、C和G的混合物)、S(C和G的混合物)、W(A和T的混合物)、R(A和G的混合物)、Y(T和C的混合物)、K(G和T的混合物)和M(A和C的混合物)。
在一些方面中,所述高通量测序经由边合成边测序进行。在一些方面中,所述高通量测序经由结合纳米孔的电流测量进行。
本发明的其它目的、特征和优点将从以下详细描述中变得清楚。然而,应理解,具体实施方式和特定实例虽然指示本发明的优选实施例,但仅以说明方式给出,因为本领域的技术人员将由此实施方式而变得显而易知本发明的精神和范围内的各种变化和修改。
附图说明
以下附图形成本说明书的一部分,并且包含在内以进一步展示本发明的某些方面。通过参考这些附图中的一个或多个并结合本文给出的具体实施例的详细描述,可以更好地理解本发明。
图1:用于扩增子全面富集(ACE)系统的关键试剂组分。正向引物寡核苷酸右侧的箭头表示寡核苷酸的3′端。辅助寡核苷酸左侧的竖直条和抑制寡核苷酸右侧的斜向条表示寡核苷酸的3′端,并且进一步表示存在阻止聚合酶延伸的化学修饰或DNA序列。抑制寡核苷酸和辅助寡核苷酸具有显著的反向互补性区域,表示为受保护子序列并示出为两个寡核苷酸彼此靠近放置的区域。正向引物寡核苷酸和抑制寡核苷酸具有显著的序列相似性区域,示出为正向引物寡核苷酸和抑制寡核苷酸的水平位置。ACE系统还包含模板依赖性聚合酶和聚合酶进行引物延伸所需的dNTP试剂。
图2:ACE在变体等位基因的基于聚合酶链式反应(PCR)的富集中的应用。抑制寡核苷酸优先与模板分子结合,不仅是因为它更长并且具有用于启动杂交的额外位点,而且还因为它可能以比正向引物寡核苷酸更高的浓度存在。当抑制寡核苷酸与模板分子结合时,正向引物寡核苷酸不能与模板分子杂交,因此不能被DNA聚合酶延伸。抑制寡核苷酸上的起始子序列可以与辅助寡核苷酸上的起始互补序列子序列结合,并且可以开始分支迁移。然而,考虑到有限的PCR退火循环次数,在与靶子序列中的抑制寡核苷酸匹配的模板分子上,由于热力学或动力学而不太可能发生辅助寡核苷酸对抑制寡核苷酸的置换。反向引物寡核苷酸是标准的PCR反向引物,其不一定与任何其它寡核苷酸具有任何序列相似性或反向互补性。
图3:ACE在变体等位基因的基于PCR的富集中的应用。在具有序列变体的模板分子上,模板分子和靶子序列中的抑制寡核苷酸之间形成的错配气泡在热力学上使模板-抑制寡核苷酸杂交不稳定,并使得辅助寡核苷酸对抑制寡核苷酸的置换在热力学上更有利。此外,错配气泡表示置换反应中的动力阱,这也加速了动力学。在抑制寡核苷酸被辅助寡核苷酸置换后,模板分子可以自由地与正向引物寡核苷酸结合,并且正向引物寡核苷酸随后像在标准PCR中一样被延伸。
图4:旨在选择性PCR扩增rs1443486 SNP基因座处的两个单核苷酸多态性(SNP)等位基因中的一个的ACE混合物的详细实例。NA18562人基因组DNA的A等位基因是纯合的,而NA18537人基因组DNA的DNA(-)链上的C等位基因是纯合的。Taqman探针在抑制寡核苷酸的下游结合,以为所生成的扩增子产生特异性荧光信号。此处,抑制寡核苷酸被设计成与NA18562A等位基因完美匹配。
图5:使用人基因组DNA的ACE定量PCR(qPCR)的实验结果。qPCR反应的循环阈值(Ct)值可以清楚地区分100%NA18537、5%NA18537/95%NA18562、1%NA18537/99%NA18562和100%NA18562。在所有反应中,使用了7.5ng人基因组DNA输入,这对应于大约2250个单倍体基因组拷贝。较高浓度的抑制寡核苷酸导致所有DNA样本的Ct值延迟。所有反应均使用PowerUp DNA聚合酶母料(mastermix)。
图6:支持所提出的ACE机制的进一步实验结果。在qPCR反应中不存在抑制寡核苷酸或辅助寡核苷酸的情况下,NA18537和NA18562的Ct值几乎相同,表明输入量相似且PCR效率相似。在仅存在辅助寡核苷酸但是不存在抑制寡核苷酸的情况下,Ct值与既不存在辅助寡核苷酸也不存在抑制寡核苷酸的qPCR反应相同,表明辅助寡核苷酸本身不抑制反向引物寡核苷酸与模板分子的反向互补序列的结合。在仅存在抑制寡核苷酸但是不存在辅助寡核苷酸的情况下,没有可观察到的PCR扩增,表明抑制寡核苷酸在它没有被辅助寡核苷酸置换时完全抑制正向引物寡核苷酸结合和PCR。当存在抑制寡核苷酸和辅助寡核苷酸时,我们观察到NA18537的优先扩增,因为它的模板分子与抑制寡核苷酸不匹配。
图7:qPCR设置中的ACE的全面性的证明。在与不同基因座处的TP53突变相对应的15个单独DNA序列上对ACE qPCR进行测试。基于ACE机制的设计,无论突变在抑制寡核苷酸上的位置如何,所有突变都被相同的ACE抑制寡核苷酸和辅助寡核苷酸选择性地富集。使用合成gBlock寡核苷酸模板(每个606nt长)作为突变体模板并且使用NA18537作为野生型模板进行实验。绘制了突变的3个三重反应的中值Ct值,并且将NA18537 gDNA的Ct值绘制为3条水平线。所有TP53突变的Ct值显著小于单独的NA18537野生型模板的Ct值,表明所有这些突变都得到了富集。
图8:ACE对长抑制寡核苷酸和辅助寡核苷酸起作用的证明。针对相同的rs1443486SNP测试了三个单独的ACE系统。抑制寡核苷酸被设计成不同的长度,其中模板结合区域的长度为64nt、81nt和126nt。SNP位置被设计成始终是自模板结合区域的末端起的第13个核苷酸。所有三个ACE系统都表现出NA18537模板和NA18562模板之间的显著Ct差异。对于最长的抑制寡核苷酸,观察到显著延迟,表明越长的长度需要越长的退火循环时间以允许链置换,或者越长的长度越会导致辅助寡核苷酸纯度下降,从而使置换效率降低。
图9:使用具有5′通用衔接子序列的正向引物寡核苷酸和反向引物寡核苷酸的ACE的应用。衔接子序列允许后续衔接子PCR用于下一代测序(NGS)文库制备。
图10:使用NGS的高度多重化ACE的证明。构建了18重ACE基因包,其靶向18个不同的SNP基因座,其中NA18537和NA18562的不同的等位基因是纯合的。所有18个抑制寡核苷酸被设计成与NA18562等位基因完美匹配。在1%NA18537/99%NA18562样本上对18重ACE进行测试;每个文库使用25ng这种混合物作为输入。在不存在ACE的情况下,NGS文库表现出,对于每个基因座,映射到NA18562等位基因的读长数比映射到NA18537等位基因的读长数高大约100倍,正如预期的那样。在使用18重衔接子ACE系统的情况下(右),每个基因座处的NA18537等位基因的分数增加(注意不同的Y轴刻度)。底部表格总结了5个不同文库的NGS文库结果;上面绘制了最左边和最右边的文库。VRF行是指变体等位基因分数,计算为变体(NA18537)读长数除以变体读长和野生型(NA18562)读长之和。
图11:跨较长的PCR扩增子将多个抑制寡核苷酸和正向引物寡核苷酸平铺的ACE的实施例。这可以克服极长抑制寡核苷酸的合成的技术困难,从而能够在单个PCR扩增子中在多个核苷酸的广泛区域中检测出变体。
图12:用于富集基因融合变体的ACE的实施例。此处,基因融合模板与野生型模板的不同之处在于拥有来自不同基因的下游序列(锯齿线)。基因融合变体可能源自异常的染色体重排,例如在癌细胞中。重要的是,下游融合基因和序列不是先验已知的,因此基于标准PCR的ACE将不起作用,因为反向引物寡核苷酸序列不能被设计成靶向下游基因。此处,双链DNA衔接子连接至DNA模板,并且反向引物寡核苷酸被设计成靶向衔接子序列。抑制寡核苷酸与野生型模板高强度地结合,并且不会被辅助寡核苷酸高效置换。抑制寡核苷酸与基因融合模板的结合强度较低,并且被辅助寡核苷酸有效置换,从而允许正向引物与基因融合模板结合并且扩增模板。
图13:滚环扩增(RCA)上的ACE的实施例。此处,具有野生型或突变体序列的环状DNA模板分子经由RCA进行差异扩增,因为抑制寡核苷酸与野生型模板分子高强度地结合并且不会被辅助寡核苷酸置换。抑制寡核苷酸和突变体模板分子之间形成的错配气泡使抑制寡核苷酸和突变体模板分子之间的结合不稳定,并且允许辅助寡核苷酸置换抑制寡核苷酸,进而允许正向引物寡核苷酸与模板分子结合并且扩增模板分子。注意,在RCA中,没有反向引物寡核苷酸。
具体实施方式
等位基因全面富集(ACE)基于抑制寡核苷酸的设计,该抑制寡核苷酸表现出显著的与相对应的正向引物寡核苷酸的5′序列相似性(图1)。在抑制寡核苷酸的3′端表现出显著的与抑制寡核苷酸的反向互补性的辅助寡核苷酸用于抑制抑制寡核苷酸,并且允许具有不同于预期核酸野生型模板分子的序列的核酸变体模板分子的有效扩增。在一些实施例中,模板分子是DNA分子。在其它实施例中,模板分子是RNA分子。
抑制寡核苷酸具有被设计成比其与辅助寡核苷酸结合更有利地与预期野生型模板序列结合的序列(图2)。当抑制寡核苷酸与模板分子结合时,正向引物寡核苷酸不能有效地与模板分子结合,因为与抑制寡核苷酸结合的模板序列的部分也是与正向引物寡核苷酸结合的子序列。在一些实施例中,正向引物寡核苷酸所结合的模板分子的子序列完全涵盖在抑制寡核苷酸所结合的模板分子的子序列内。在其它实施例中,正向引物寡核苷酸所结合的模板分子的子序列具有不涵盖在抑制寡核苷酸所结合的模板分子的子序列中的少量核苷酸,不超过7个核苷酸(即1、2、3、4、5、6或7个核苷酸)。
抑制寡核苷酸包括起始子序列,该起始子序列不与模板分子反向互补。辅助寡核苷酸包括起始互补序列子序列,该起始互补序列子序列与起始序列反向互补。在一些实施例中,起始子序列的长度在4nt和30nt之间(例如,4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸;或在4-30nt、4-25nt、4-20nt、4-15nt、8-30nt、8-25nt、8-20nt、8-15nt、12-30nt、12-25nt、12-20nt、16-30nt或16-25nt之间)。
抑制寡核苷酸所结合的、正向引物寡核苷酸所不结合的模板分子的区域被称为靶子序列。靶子序列中的序列变异将优先通过ACE进行扩增。在一些实施例中,靶子序列的长度在10nt和500nt之间。在其它实施例中,靶子序列的长度在10nt和200nt之间。例如,靶子序列的长度在10-500nt、10-400nt、10-300nt、10-200nt、10-100nt、10-80nt、10-60nt、10-40nt、20-500nt、20-400nt、20-300nt、20-200nt、20-100nt、20-80nt、20-60nt、30-500nt、30-400nt、30-300nt、30-200nt、30-100nt、30-80nt、30-60nt、40-500nt、40-400nt、40-300nt、40-200nt、40-100nt、40-80nt、50-500nt、50-400nt、50-300nt、50-200nt、50-100nt、50-80nt或100-500nt之间。例如,靶子序列的长度为至少或约10、15、20、25、30、35、40、45、50、60、70、80、90、100、120、140、160、180、200、220、240、260、280、300、320、340、360、380、400、420、440、460、480或500个核苷酸。
如果模板序列甚至具有单个核苷酸序列变体,则模板分子和靶子序列中的抑制寡核苷酸之间形成的错配气泡会导致热力学不稳定,从而导致抑制寡核苷酸与辅助寡核苷酸的结合比与模板分子的结合更有利(图3)。因此,抑制寡核苷酸从模板分子中被置换,并且模板分子随后能够与正向引物寡核苷酸结合。在一些实施例中,正向引物寡核苷酸随后能够通过模板依赖性聚合酶延伸。在一些实施例中,野生型模板分子和变体模板分子的混合物存在于模板样本中,并且将ACE应用于样本会通过变体模板分子的选择性扩增实现变体模板分子相较于野生型模板分子的富集。在一些实施例中,模板依赖性聚合酶是DNA聚合酶。在一些实施例中,DNA聚合酶是热稳定性DNA聚合酶,并且扩增通过聚合酶链式反应(PCR)实现。在其它实施例中,DNA聚合酶为phi-29聚合酶,并且扩增通过滚环扩增实现。在其它实施例中,模板依赖性聚合酶是逆转录酶,并且突变体RNA模板相较于野生型RNA模板的富集通过突变体RNA模板的选择性逆转录。
I.定义
如本文所使用,“扩增”是指用于增加一个或多个核苷酸序列拷贝数的任何体外过程。核酸扩增导致核苷酸掺入到DNA或RNA中。如本文所使用,一个扩增反应可以由多轮DNA复制组成。例如,一个PCR反应可以由2-100个变性和复制“循环”组成。
“聚合酶链式反应”或“PCR”意指通过DNA互补链的同时引物延伸来体外扩增特异性DNA序列的反应。换句话说,PCR是一种用于制备侧接引物结合位点的靶核酸的多个拷贝或复制的反应,这种反应包括以下步骤的一次或多次重复:(i)使该靶核酸变性,(ii)将引物退火至引物结合位点,以及(iii)在存在核苷三磷酸的情况下通过核酸聚合酶延伸引物。通常,将反应在热循环仪器中在针对每个步骤优化的不同温度下进行循环。在一些情况下,退火和延伸步骤可以组合为单个步骤。特定温度、每一步骤的持续时间和步骤之间的变化率取决于本领域普通技术人员熟知的多种因素,例如通过以下参考文献示范的因素:McPherson等人编辑,《PCR:实用方法(PCR:A Practical Approach)》和《PCR2:实用方法(PCR2:A Practical Approach)》(IRL出版社,牛津(Oxford),分别为1991和1995)。
“引物”意指天然的或合成的寡核苷酸,该天然的或合成的寡核苷酸在与多核苷酸模板形成双链体时能够充当核酸合成的起始点,并从其3^端沿着模板延伸,从而形成延伸的双链体。延伸过程期间所添加的核苷酸的序列由模板多核苷酸的序列确定。通常引物通过DNA聚合酶延伸。引物的长度通常与其在引物延伸产物的合成中的用途相容,并且长度通常在6至100个核苷酸的范围内,例如长度为6至70、10至50、10至75、15至60、15至40、15至45、18至30、18至40、20至30、20至40、21至25、21至50、22至45、25至40个核苷酸,以及规定范围之间的任何长度。在一些实施例中,引物的长度通常不超过约6、7、8、9、10、12、15、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65或70个核苷酸。
如本文所使用,“掺入”意指成为核酸聚合物的一部分。
如本文所使用,术语“在不存在外源性操纵的情况下”是指在不改变核酸分子被修饰的溶液的情况下对核酸分子进行修饰。在具体实施例中,其在没有人手或者在不存在改变溶液条件的机器的情况下发生,该溶液条件也可以被称为缓冲条件。然而,在修饰期间,温度可能会发生变化。
“核苷”是碱基-糖组合,即缺少磷酸的核苷酸。本领域公认术语核苷和核苷酸的用法有一定的互换性。例如,核苷酸脱氧尿苷三磷酸,dUTP,是脱氧核苷三磷酸。掺入到DNA中后,其充当DNA单体,形式上是脱氧尿苷酸,即dUMP或脱氧尿苷酸。可以说,即使在所得DNA中不存在dUTP部分,也可以将dUTP掺入到DNA中。类似地,可以说,即使其仅是底物分子的一部分,也可以将脱氧尿苷掺入到DNA中。
如本文所使用,“核苷酸”是指碱基-糖-磷酸盐组合的专业术语。核苷酸是核酸聚合物,即,DNA和RNA的单体单元。该术语包含核糖核苷酸三磷酸,如rATP、rCTP、rGTP或rUTP,以及脱氧核糖核苷酸三磷酸,如dATP、dCTP、dUTP、dGTP或dTTP。
术语“核酸”或“多核苷酸”通常是指DNA、RNA、DNA-RNA嵌合体或它们的衍生物或类似物的至少一个分子或链,包括至少一个核碱基,如例如DNA(例如,腺嘌呤“A”、鸟嘌呤“G”、胸腺嘧啶“T”和胞嘧啶“C”)或RNA(例如,A、G、尿嘧啶“U”和C)中可见的天然存在的嘌呤或嘧啶碱基。术语“核酸”涵盖术语“寡核苷酸”和“多核苷酸”。如本文所使用,“寡核苷酸”统指并且可互换地指代两个专业术语“寡核苷酸”和“多核苷酸”。应当注意,尽管寡核苷酸和多核苷酸是本领域的不同术语,但是它们之间没有确切的分界线,并且它们在本文中可以互换地使用。术语“衔接子”也可与术语“寡核苷酸”和“多核苷酸”互换使用。此外,术语“衔接子”可以表示线性衔接子(单链或双链)或茎-环衔接子。这些定义通常是指至少一个单链分子,但是在具体实施例中,这些定义还将涵盖与至少一个单链分子部分、基本上或完全互补的至少一条另外的链。因此,核酸可以涵盖包括有包括分子链的特定序列的一个或多个互补链或“互补序列”的至少一个双链分子或至少一个三链分子。如本文所使用,单链核酸可以由前缀“ss”表示,双链核酸可以由前缀“ds”表示,而三链核酸可以由前缀“ts”表示。
“核酸分子”是指任何单链或双链核酸分子,包含标准规范碱基、高度修饰碱基、非天然碱基或它们的碱基的任何组合。例如但不限于,核酸分子含有四种典范DNA碱基-腺嘌呤、胞嘧啶、鸟嘌呤和胸腺嘧啶,和/或四种典范RNA碱基-腺嘌呤、胞嘧啶、鸟嘌呤和尿嘧啶。当核苷含有2′-脱氧核糖基时,尿嘧啶可以取代胸腺嘧啶。核酸分子可以从RNA转化成DNA,也可以从DNA转化成RNA。例如但不限于,可以使用逆转录酶将mRNA创建成互补DNA(cDNA),并且使用RNA聚合酶将DNA创建成RNA。核酸分子可以是生物来源或合成来源的。核酸分子的实例包含基因组DNA、cDNA、RNA、DNA/RNA杂交体、扩增的DNA、预先存在的核酸文库等。核酸可以从人类样本,如血液、血清、血浆、脑脊液、脸颊刮屑、活检、精液、尿液、粪便、唾液、汗液等中获得。核酸分子可以经受各种处理,如修复处理和片段化处理。片段化处理包含机械剪切、声速剪切和水力剪切。修复处理包含通过延伸和/或连接反应的缺口修复、抛光以产生钝端、去除受损的碱基,如脱氨基、衍生化、脱碱基或交联的核苷酸等。目的核酸分子也可以经受化学修饰(例如,亚硫酸氢盐转化、甲基化/去甲基化)、延伸、扩增(例如,PCR、等温等)等。
“互补的”或“互补序列”核酸是能够根据标准沃森-克里克(Watson-Crick)、胡斯坦碱(Hoogsteen)或反向胡斯坦碱结合互补规则进行碱基配对的核酸。如本文所使用,术语“互补的”或“互补序列”可以是指基本上互补的核酸,如可以通过上述相同核苷酸比较所评估。术语“基本上互补的”可以指包括至少一个连续核碱基序列的核酸,或者如果分子中不存在一个或多个核碱基部分,则半连续性核碱基能够与至少一条核酸链或双链体杂交,即使并非所有的核碱基均不与对应的核碱基碱基配对。在某些实施例中,“基本上互补”的核酸含有至少一个序列,其中约70%、约71%、约72%、约73%、约74%、约75%、约76%、约77%、约77%、约78%、约79%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%至约100%(以及其中任何范围)的核碱基序列能够在杂交期间与至少一个单链或双链核酸分子碱基配对。在某些实施例中,术语“基本上互补的”是指可以在严格条件下与至少一种核酸链或双链体杂交的至少一种核酸。在某些实施例中,“部分互补的”核酸包括可以在低严格条件下与至少一个单链或双链核酸杂交的至少一个序列,或含有其中少于约70%的核碱基序列能够在杂交期间与至少一个单链或双链核酸分子碱基配对的至少一个序列。
术语“非互补的”是指缺乏通过特异性氢键形成至少一个沃森-克里克碱基对的能力的核酸序列。
如本文所使用,术语“退化的”是指核苷酸或一系列核苷酸,其中同一性可以选自与所定义的序列相反的多种选择的核苷酸。在具体实施例中,可以从两种或更多种不同的核苷酸中进行选择。在另外的具体实施例中,在一个特定位置处选择核苷酸包括仅从嘌呤、仅从嘧啶、或从非配对的嘌呤和嘧啶中选择。
如本文所使用,术语“二级结构”是指碱基对之间的相互作用的集合。例如,在DNA双螺旋中,两个DNA链通过氢键保持在一起。二级结构决定了核酸呈现的形状。对于单链核酸,最简单的二级结构是线性的。对于线性二级结构,核酸分子的任何两个子序列不会形成强度大于-2kcal/mol的分子内结构。作为单链核酸的另一个实例,核酸分子的一部分可以与同一核酸分子的第二部分杂交,从而形成发夹至茎环二级结构。对于非线性二级结构,核酸分子的至少两个子序列来自强度大于-2kcal/mol的分子内结构。
如本文所使用,术语“子序列”是指至少5个连续碱基对的序列。
如本文所使用,术语“突变体DNA模板”或“变体DNA模板”是指核酸的核苷酸序列,其含待扩增、标识或以其它方式分离的期望等位基因,例如单核苷酸多态性。如本文所使用,术语“野生型序列”或“背景序列”是指不含有期望等位基因的核酸的核苷酸序列。例如,在一些情况下,背景序列含野生型等位基因,而变体序列含突变体等位基因。因此,在一些情况下,背景序列和变体序列源自基因组中的共同基因座,使得除了含期望等位基因、核苷酸或两者之间有所不同的组或核苷酸的区域之外,每个序列的序列可以基本上是同源的。
“样本”意指从含有目的核酸的新鲜或保存的生物样本或合成创建源中获得或分离的材料。样本可以包含至少一个细胞、胎儿细胞、细胞培养物、组织标本、血液、血清、血浆、唾液、尿液、泪液、阴道分泌物、汗液、淋巴液、脑脊液、粘膜分泌物、腹膜液、腹水液、粪便物、身体渗出液、脐带血、绒毛膜绒毛、羊水、胚胎组织、多细胞胚胎、裂解物、提取物、溶液或怀疑含有目的免疫核酸的反应混合物。样本还可以包含非人来源,如非人灵长类动物、啮齿动物和其它哺乳动物、其它动物、植物、真菌、细菌和病毒。
如本文关于核苷酸序列所使用,“基本上已知”是指具有足够的序列信息以允许制备核酸分子,包含其扩增。这通常为约100%,但在一些实施例中,衔接子序列的某些部分是随机的或退化的。因此,在具体实施例中,基本上已知是指约50%至约100%、约60%至约100%、约70%至约100%、约80%至约100%、约90%至约100%、约95%至约100%、约97%至约100%、约98%至约100%或约99%至约100%。
如本文所使用,就指定组分而言,“本质上不含”在本文中用于意指指定组分没有被故意调配成组合物和/或仅作为污染物或以微量存在。因此,由组合物的任何意外污染引起的指定组分的总量远低于0.05%,优选低于0.01%。最优选的是其中使用标准分析方法检测不到指定组分的量的组合物。
如本文在说明书所使用,“一个(“a”或“an”)”可以意指一个或多个。如本文在权利要求中所使用,当与词语“包括”一起使用时,词语“一个”可以意指一个或多于一个。
除非明显表示仅指替代方案或替代方案相互排斥,否则在权利要求书中使用术语“或”用于指“和/或”,但本公开支持仅指代替代方案的定义和“和/或”。如本文所使用,“另一个(another)”可以意味着至少第二个或更多个。
在本申请中,术语“约”用于表示一个值包含用于确定所述值的装置、方法的误差的固有变化、研究对象之间存在的变化或者所述值的10%内的值。
II.定量PCR中的ACE
ACE可以用于qPCR设置。在本实施例中,正向引物寡核苷酸、反向引物寡核苷酸、抑制寡核苷酸、辅助寡核苷酸、DNA聚合酶、dNTP和PCR所需的缓冲液与可能包括野生型DNA模板分子并且可能包括突变体DNA模板分子的样本混合。在一些实施例中,该混合物进一步包括Taqman探针。图4示出了用于富集单核苷酸多态性(SNP)基因座rs1443486处的除A等位基因以外的等位基因的ACE系统的一个具体实施例。NA18562人基因组DNA的A等位基因是纯合的,并且NA18537人基因组DNA的DNA(-)链上的C等位基因是纯合的。可以包含在抑制寡核苷酸的下游结合的Taqman探针,以为所生成的扩增子产生特异性荧光信号。在本实例中,抑制寡核苷酸被设计成与NA18562A等位基因完美匹配。
本ACE-qPCR设置用于富集和检测rs1443486处的非A等位基因。因为NA18562人基因组DNA的A等位基因是纯合的,所以它被认为是本反应的野生型模板分子。NA18537人基因组DNA的C等位基因是纯合的,其是突变体模板分子。qPCR反应能够清楚地区分100%NA18537、5%NA18537/95%NA18562、1%NA18537/99%NA18562和100%NA18562(图5)。甚至99%NA18562中1%NA18537也可以与100%NA18562清楚地区分,这意味着C等位基因相较于A等位基因的超过100倍的富集。较高浓度的抑制寡核苷酸导致所有DNA样本的Ct值延迟。辅助寡核苷酸与抑制寡核苷酸或正向引物寡核苷酸与抑制寡核苷酸的化学计量(即摩尔)比可以在0.8和100、0.9和100、1和100、2和100、3和100、4和100、5和100、10和100、15和100、20和100、25和100、30和100、40和100、50和100、0.8和50、0.8和45、0.8和40、0.8和35、0.8和30、0.8和25、0.8和20、1和50、1和45、1和40、1和35、1和30、1和25或1和20之间。辅助寡核苷酸与抑制寡核苷酸或正向引物寡核苷酸与抑制寡核苷酸的化学计量(即摩尔)比可以为至少或约0.8、0.9、1、1.1、1.2、1.3、1.4、1.5、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100。
当不存在抑制寡核苷酸或辅助寡核苷酸时,没有实现NA18537的C等位基因相较于NA18562的A等位基因的富集(图6)。当二者都不存在时,循环阈值(Ct)值相似,表明输入DNA量相似且PCR扩增效率相似。当仅存在辅助寡核苷酸时,NA18537和NA18562的Ct值均未改变,表明辅助寡核苷酸与模板分子的反向互补序列的结合不抑制PCR反应。当仅存在抑制寡核苷酸时,没有观察到扩增,表明在不存在辅助寡核苷酸的情况下,抑制寡核苷酸与模板分子的结合是不可逆的,并且突变体模板分子和野生型模板分子都无法扩增。只有当抑制寡核苷酸和辅助寡核苷酸都存在时,突变体和野生型模板分子才会有差异扩增。换句话说,当抑制寡核苷酸和辅助寡核苷酸都存在时,则观察到NA18537的优先扩增,因为它的模板分子与抑制寡核苷酸不匹配。
为了证明ACE在靶子序列中富集了具有序列变异的所有模板分子,设计了ACE系统来靶向人TP53基因(图7)。本ACE系统使用qPCR进行测试,在跨越50nt靶子序列的不同基因座处使用15个单独的TP53突变。本实验是使用合成gBlock寡核苷酸模板(每个606nt长)作为突变体模板分子进行的。在没有突变体模板分子的情况下观察到的7.5ng NA18537的Ct值被绘制为一条线并且具有约40的值。突变体模板样本的Ct值都大约低9至13个循环,介于27和31之间(图7)。基于ACE机制的设计,无论突变在抑制寡核苷酸上的位置如何,所有突变都被相同的ACE抑制寡核苷酸和辅助寡核苷酸选择性地富集。
最后,为了证明可以通过抑制寡核苷酸和辅助寡核苷酸的合理设计来延长靶子序列的长度,构建了靶向具有不同的靶子序列长度64nt(51+1+12)、81nt和126nt的相同人SNP(rs1443486)的三个单独的ACE组(图8)。SNP位置被设计成始终是自模板结合区域的末端起的第13个核苷酸。所有三个ACE系统都表现出NA18537变体模板和NA18562野生型模板之间的显著Ct值差异。对于最长的抑制寡核苷酸,观察到显著延迟,表明越长的长度需要越长的退火循环时间以允许链置换,或者越长的长度越会导致辅助寡核苷酸纯度下降(这是由于较长的化学合成寡核苷酸的纯度较低),从而使置换效率降低。
III.下一代测序(NGS)文库制备中的ACE
在一些实施例中,ACE可以用于在高通量测序程序的文库制备过程期间进行变体富集。在一些实施例中,高通量测序是边合成边测序(NGS)方法。在其它实施例中,高通量测序经由结合纳米孔的电流测量进行。
可以设计多个ACE系统来在文库中富集不同的目的遗传区域中的变体。在一些实施例中,ACE系统可以应用于使用标准长度基因特异性引物的多重PCR,然后是衔接子PCR或衔接子连接以附加测序特异性衔接子序列。使用衔接子连接来添加另外的序列的方法例如在美国专利7,803,550中描述,所述文献通过引用整体并入本文。在其它实施例中,ACE系统可以利用在5′端具有衔接子序列的正向引物寡核苷酸和反向引物寡核苷酸作为ACE富集的一部分(图9)。衔接子序列允许后续衔接子PCR用于下一代测序(NGS)文库制备。在各个实施例中,多重ACE基因包可以包括2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100个ACE系统。
作为一个实例,构建了18重ACE基因包,该基因包向其中NA18537和NA18562的不同的等位基因是纯合的18个不同的SNP基因座。本18重ACE基因包被设计成抑制NA18562样本的纯合SNP等位基因。所有18个抑制寡核苷酸被设计成与NA18562等位基因完美匹配。在1%NA18537/99%NA18562样本上对18重ACE进行测试;每个文库使用25ng这种混合物作为输入。使用因美纳(Illumina)MiSeq来进行NGS。在没有ACE抑制寡核苷酸和辅助寡核苷酸的情况下,映射到NA18562等位基因的NGS读长数在每个基因座处比映射到NA18537等位基因的NGS读长数高大约100倍,正如预期的那样(图10)。在存在ACE抑制寡核苷酸和辅助寡核苷酸的文库中,对于所有基因座,映射到NA18537变体等位基因的读长的相对分数显著增加。总体而言,映射到NA18537基因座的NGS读长的分数从1.22%增加到33.8%,加权平均富集超过24倍。基于这些单重qPCRACE结果,可以通过优化序列、浓度、反应时间和其它实验方案细节,进一步显著改善ACE富集倍数。
IV.平铺ACE
在一些实施例中,ACE方法可以与将连续DNA区域平铺或大部分平铺的多个抑制寡核苷酸一起使用。这将规避在合成高纯度长DNA寡核苷酸以获得长抑制寡核苷酸方面的挑战。图11示出了PCR中ACE的一个实施例,其中两个不同的抑制寡核苷酸与不同的相对应辅助寡核苷酸和结合模板分子上的相邻序列的正向引物寡核苷酸配对。在各个实施例中,2、3、4、5、6、7、8、9、10或更多个抑制寡核苷酸,每个与其自身的辅助寡核苷酸配对,可以用将连续DNA区域平铺或大部分平铺。
V.PCR基因融合富集
在一些实施例中,ACE方法可以用于富集基因融合,其中目的基因的一部分已被重排成与另一个基因的一部分相邻,如通过染色体易位。在这种情况下,下游或上游基因融合伙伴可能不是先验已知的。图12示出了可能含有基因融合的DNA模板分子首先连接至衔接子的一个实施例。使用衔接子连接来添加另外的序列的方法例如在美国专利7,803,550中描述,所述文献通过引用整体并入本文。ACE-PCR使用与衔接子序列反向互补的反向引物寡核苷酸进行。注意,本图和实施例的衔接子不一定是测序衔接子,并且原则上可以是任何设计DNA序列。
VI.滚环扩增(RCA)中的ACE
在一些实施例中,ACE方法不需要反向引物。图13示出了在RCA中应用ACE的一个实施例。环状DNA模板分子可以是环状生物DNA序列,或者它可以由通过酶促方法环化的线性DNA序列构造。ACE抑制寡核苷酸阻止正向引物寡核苷酸结合,并且进而阻止野生型模板分子上的RCA。
VII.富集倍数分析和VAF定量
变体模板分子的富集倍数(EF)被定义为变体模板分子相较于相对应野生型模板分子的相对扩增。一般来说,使用ACE的PCR循环数越多,EF值就越大。在NGS文库设置中,VRF、EF和变体等位基因频率(VAF)的值满足以下等式:
VRF=(VAF*EF)/(VAF*EF+(1-VAF))
VAF=(VRF)/(VRF*(1-EF)+EF)
EF=(VRF*(VAF-1))/(VAF*(VRF-1))
给定三个变量中的任何两个的已知值,就可以计算出最后一个变量。因此,在初始校准实验期间,可以使用来自已知样本的VRF和VAF来计算EF。之后,当对样本运行NGS并且VAF未知时,可以使用VRF和EF来计算VAF值。
VIII.UMI设计
UMI的概念是给每个原始DNA分子不同的DNA序列作为“条形码”,以便可以基于条形码序列追踪每个NGS读长的来源。给定足够的NGS读长,在NGS输出中发现的唯一UMI的数量可以反映原始DNA分子的数量。通过使用大量不同的UMI序列来实现对每个原始分子进行唯一标记;例如,对100000个原始分子使用109个不同的UMI序列将生成<0.006%的携带重复UMI的分子。
含有退化碱基的DNA序列,如poly(N)(即A、T、C或G在每个位置处的混合物)经常被用作UMI序列。在QBDA中,poly(H)(即A、T或C在每个位置处的混合物)被用作UMI,因为其与poly(N)或S(C或G)和W(A或T)碱基的混合物相比具有较弱的交叉结合能。(H)20含有3.5×109个不同的序列,其足以作为100000个分子的输入;(H)15含有1.4×107个不同的序列,其足以作为6000个分子的输入。
已经开发出一种作为纠错方法的特定的基于DNA的条形码。与任何测定一样,NGS可能会产生误读。这种基于DNA的条形码是一种7核苷酸汉明条形码,其允许标识误读并且纠正这些错误。
条形码序列的原始设计会产生容易受到NGS固有错误的影响的条形码序列。在信号处理领域,跨故障通道(例如,互联网)传递消息导致了错误纠正和错误检测代码的发展。这些想法可以直接应用到条形码设计中。因为因美纳测序错误主要是碱基替换(与插入或缺失相反),所以汉明编码非常适合条形码序列。
回顾一下,最简单的(7,4)汉明码为每个4位消息插入3个纠错位(较长的消息首先被分解为4位字)。汉明码的所有7位实例都具有以下性质:它们与任何其它实例的汉明距离至少为3-也就是说,为了将一个汉明码实例转换为另一个实例,需要更改至少3位。这种性质意味着(7,4)汉明码纠正至多一个错误,并且容忍至多两个错误:原始序列可以从突变了一个碱基的任何序列恢复;更保守地,具有两个突变的任何序列都不会与任何其它代码匹配,因此可以排除。
例如,可以使用(7,4)DNA条形码。选择A、T、C和G的数值分配和错误检查等式的设计,使得长均聚物和极端G/C含量很少见。256个可能的(7,4)汉明码的手动裁剪去除了40个序列,这些序列可能有助于形成超过5nt的均聚物(经由在条形码的开头或结尾具有长度为3的均聚物)或其G/C含量为>75%或<25%,从而产生216个良好(7,4)nt条形码节段。
出于演示目的,使用了21nt条形码,其对应于三个(7,4)条形码节段,这可以枚举超过1000万个不同的条形码。这些条形码每7nt可以纠正1nt错误,或者每7nt可以容忍2nt错误。在1%的固有错误率下,当与任何设计条形码不匹配的NGS读长被纠正时,所提出的条形码表现出大约0.6%的错误率,而当不匹配的NGS读长被丢弃时,错误率为0.01%。这些比没有纠错的原始条形码好大约20倍和1000倍。在7nt的块中具有3个或更多个错误的概率为0.0034%,并且不太可能因位置特异性引物渗出(bleeding)而显著影响SNP基因型的解释。
与任何设计条形码不匹配的NGS读长的纠正是在满足错误检查等式的水平上完成的,并且不需要了解设计条形码序列。本操作的时间复杂度为O(M),其中M是条形码的长度(此处M=21)。在纠正或丢弃与任何设计条形码不完全匹配的NGS读长后,可以使用后缀树算法对设计条形码进行精确的字符串匹配。后缀树非常快速,运行时复杂度为O(M);重要的是,它不依赖于所设计的条形码数量,因此可以很好地扩展为高度多重。
IX.热力学计算
从序列计算ΔG°值的方法是本领域已知的。计算不同区域相互作用的ΔG°存在不同的惯例。WO2015/179339提供了基于最近邻模型的示例性能量计算,所述文献通过引用整体并入本文。从引物序列、抑制寡核苷酸序列、辅助寡核苷酸序列、靶分子序列、变体序列、操作温度和操作缓冲液条件计算ΔG°1、ΔG°2、ΔG°3和ΔG°4是本领域技术人员已知的。操作温度可以是约20℃、约25℃、约30℃、约35℃、约40℃、约45℃、约50℃、约55℃、约60℃、约65℃或约70℃。操作缓冲液条件可以是适用于PCR的缓冲液条件。
X.靶核酸的进一步加工
A.DNA的扩增
许多模板依赖性过程可用于扩增存在于给定模板样本中的核酸。最著名的扩增方法之一是聚合酶链式反应(被称为PCRTM),其在美国专利第4,683,195号、第4,683,202号和第4,800,159号以及Innis等人,1990中有详细描述,每个文献均通过引用整体并入本文。简而言之,在存在过量脱氧核苷酸(dNTP的)和热稳定性聚合酶,如例如Taq(水生栖热菌)DNA聚合酶的情况下,将与待扩增的模板DNA的两个区域(每条链一个)互补的两个合成寡核苷酸引物添加到模板DNA(不需要是纯的)中。在一系列(通常为30-35次)温度循环中,靶DNA反复变性(约90℃)、退火至引物(通常在50-60℃下),并且子链从引物延伸(72℃)。当子链被创建时,其在随后的循环中充当模板。因此,两个引物之间的模板区域以指数方式扩增,而不是线性扩增。
B.DNA的测序
还提供了用于衔接子连接片段的文库的测序方法。本领域技术人员已知的任何核酸测序技术都可以用于本公开的方法中。DNA测序技术包含使用标记终止子或引物和平板或毛细管中的凝胶分离的经典双脱氧测序反应(桑格法)、使用可逆终止的标记核苷酸的边合成边测序、焦磷酸测序、454测序、与标记寡核苷酸探针文库的等位基因特异性杂交、使用等位基因特异性杂交与标记克隆文库的边合成边测序并随后进行连接、聚合步骤期间的标记核苷酸的掺入的实时监测、以及SOLiD测序。
核酸文库可以用与因美纳测序兼容的方法产生,如NexteraTM DNA样本制备试剂盒,并且用于生成因美纳下一代测序文库制剂的另外的方法在例如Oyola等人,(2012)中描述。在其它实施例中,核酸文库用与SOLiDTM或离子激流测序方法兼容的方法(例如,
Figure BPA0000334477500000231
片段文库构建试剂盒、
Figure BPA0000334477500000232
配对文库构建试剂盒、
Figure BPA0000334477500000233
ChIP-Seq试剂盒、
Figure BPA0000334477500000234
总RNA-Seq试剂盒、
Figure BPA0000334477500000235
SAGETM试剂盒、
Figure BPA0000334477500000236
RNA-Seq文库构建试剂盒等)生成。例如在Pareek(2011)和Thudi(2012)中描述了用于下一代测序方法的另外的方法,包含可用于本发明的实施例的文库构建的各种方法。
在特定方面,本公开的方法中使用的测序技术包含HiSeqTM系统(例如,HiSeqTM2000和HiSeqTM 1000)、NextSeqTM 500和来自因美纳公司的MiSeqTM系统。HiSeqTM系统基于数百万个片段的大规模并行测序,使用随机片段化的基因组DNA附着到平面、光学透明表面和固相扩增,以创建具有数百万个簇的高密度测序流动池,每个簇每平方厘米含有约1000个模板拷贝。使用四色DNA边合成边测序技术对这些模板进行测序。MiSeqTM系统使用TruSeqTM,即因美纳的基于可逆终止子的边合成边测序。
可用于本公开的方法中的DNA测序技术的另一个实例是454测序(Roche(罗氏公司))(Margulies等人,2005)。454测序涉及两个步骤。在第一步骤中,DNA被剪切成大致300-800个碱基对的片段,并且这些片段是钝端的。随后将寡核苷酸衔接子连接到片段的末端。衔接子作为引物用于片段的扩增和测序。片段可以使用例如含有5′-生物素标签的衔接子B附着到DNA捕获珠粒,例如链霉亲和素包被珠粒。附着到珠粒上的片段在油-水乳液的液滴中进行PCR扩增。结果是在每个珠粒上克隆扩增的DNA片段的多个拷贝。在第二步中,在孔(皮升大小)中捕获珠粒。对每个DNA片段平行进行焦磷酸测序。一个或多个核苷酸的添加生成被测序仪器中的CCD相机记录的光信号。信号强度与掺入的核苷酸数量成比例。
可用于本公开的方法中的DNA测序技术的另一个实例是SOLiD技术(生命技术公司(Life Technologies,Inc.))。在SOLiD测序中,基因组DNA被剪切成片段,并且衔接子附着到片段的5′端和3′端以生成片段文库。可替代地,可以通过以下方式引入内部衔接子:将衔接子连接到片段的5′端和3′端,环化片段,消化环化片段以生成内部衔接子,并且将衔接子附着到所得片段的5′端和3′端片段以生成配对文库。接着,在含有珠粒、引物、模板以及PCR组分的微反应器中制备克隆珠粒群。在PCR之后,使模板变性并且使珠粒富集以将珠粒与延伸的模板分离。所选珠粒上的模板经过3′修饰,这允许粘合到载玻片上。
可用于本公开的方法中的DNA测序技术的另一个实例是离子激流系统(生命技术公司)。离子激流使用高密度的微加工孔阵列以大规模并行的方式进行此生化过程。每个孔均有不同的DNA模板。孔下方是离子敏感层,并且下方是专有的离子传感器。如果核苷酸,例如C,被添加到DNA模板中,并且然后被掺入到DNA链中,就会释放出氢离子。来自所述离子的电荷将会改变溶液的pH,这可以通过专有的离子传感器检测到。测序仪将判定碱基,直接从化学信息转化为数字信息。然后,离子个人基因组机(PGMTM)测序仪用一个接一个的核苷酸依次淹没芯片。如果淹没芯片的下一个核苷酸不匹配,则不会记录电压变化,并且也不会判定碱基。如果DNA链上有两个相同的碱基,则电压会加倍,并且芯片将记录判定的两个相同的碱基。因为这是直接检测-没有扫描、没有相机、没有光-每个核苷酸的掺入都在几秒钟内记录下来。
可用于本公开的方法中的测序技术的另一个实例包含太平洋生物科学(PacificBiosciences)的单分子实时(SMRTTM)技术。在SMRTTM中,四个DNA碱基中的每一个都附着到四种不同荧光染料中的一种。这些染料是磷酸连接的。单个DNA聚合酶与模板单链DNA单分子一起固定在零模式波导(ZMW)底部。ZMW是能够在ZMW内外快速扩散(以微秒为单位)的荧光核苷酸背景观测单核苷酸通过DNA聚合酶掺入的限制结构。核苷酸掺入生长链中耗时若干毫秒。在此时间期间,荧光标记被激发并且产生荧光信号,并且荧光标记被切断。检测染料的对应荧光可指示掺入了哪种碱基。重复此过程。
另一个测序平台包含CGA平台(全基因组学)。CGA技术是基于环状DNA文库的制备和滚环扩增(RCA)来生成排列在固体载体上的DNA纳米球(Drmanac等人,2009)。全基因组学的CGA平台使用称为组合探针锚定连接(cPAL)的新策略以进行测序。所述过程开始于锚分子与独特衔接子之一之间的杂交。四个退化的9聚体寡核苷酸用对应于探针的第一位置中的特异性核苷酸(A、C、G或T)的特异性荧光团标记。序列测定发生在反应中,其中正确匹配的探针与模板杂交,并且使用T4DNA连接酶与锚连接。连接产物成像后,连接的锚-探针分子变性。使用在n+1、n+2、n+3和n+4位置处含有已知碱基的新的荧光标记的9聚体探针组,将杂交、连接、成像和变性的过程重复五次。
另一个测序平台包含纳米孔测序(牛津纳米孔(Oxford Nanopore))。纳米孔检测阵列描述于US2011/0177498、US2011/0229877、US2012/0133354;WO2012/042226和WO2012/107778中,并且已用于核酸测序,如US2012/0058468、US2012/0064599、US2012/0322679和WO2012/164270中所述,所有这些文献都通过引用并入本文。可以使用纳米孔直接对单个DNA分子进行测序,不需要中间的PCR扩增步骤或化学标记步骤,也不需要光学仪器来标识化学标记。可商购的纳米孔核酸测序单元由牛津纳米孔(牛津,英国)开发。GridIONTM系统和小型化MinIONTM装置被设计成提供分子传感的新特性,如实时数据流,工作流程的简单性、效率和可扩展性改善,以及对目的分子的直接分析。使用牛津纳米孔测序平台,通过设置这种膜上的电压使离子电流通过纳米孔。如果分析物通过孔或靠近其孔,则此事件会产生特征性的电流中断。该电流的测量可以标识问题分子。例如,这种系统可以用于区分四种标准DNA碱基G、A、T和C以及经修饰的碱基。它可以用于标识靶蛋白、小分子,或获取丰富的分子信息,例如以区分布洛芬的对映体或研究分子结合动力学。这些纳米孔阵列可用于特定于每种分析物类型的科学应用;例如,在对DNA进行测序时,该技术可以用于重测序、从头测序和表观遗传学。
XI.试剂盒
本文所述的技术包含包括本文公开的抑制寡核苷酸、辅助寡核苷酸和引物的试剂盒。示例性试剂盒包含qPCR试剂盒、桑格试剂盒、NGS基因包和纳米孔测序基因包。这些基因包可以提供用于以高灵敏度检测肿瘤抑制基因,如例如TP53、PTEN、BRCA1和/或BRCA2中的突变的必要试剂。“试剂盒”是指物理元素的组合。例如,试剂盒可以包含例如一种或多种组分,如核酸引物、抑制寡核苷酸、辅助寡核苷酸、酶、反应缓冲液、说明书和可用于实践本文所述技术的其它元素。这些物理元素可以以适于实施本发明的任何方式布置。
试剂盒的组分可以在水性介质中或以冻干形式包装。试剂盒的容器装置将通常包含至少一个小瓶、试管、烧瓶、瓶子、注射器或其它容器装置,组分可以放置有于其中并且优选地适当等分(例如,等分到微量滴定板的孔中)。当试剂盒中存在多于一种组分时,试剂盒通常还将含有第二、第三或其它另外的容器,另外的组分可以单独放置于其中。然而,单个小瓶中可以包括组分的各种组合。本发明的试剂盒通常还包含一种用于以紧密封闭的方式容纳核酸和任何其它试剂容器以供商业销售的装置。这些容器可以包含注塑成型或吹塑成型塑料容器,其中可以保留所需小瓶。试剂盒还将包含试剂盒组分的使用说明以及试剂盒中未包含的任何其它试剂的使用说明。说明书可以包含可以实施的变型。
XII.实例
以下实例是为了证明本发明的优选实施例而包含在内。本领域的技术人员应理解,以下实例中所公开的技术代表本发明人发现的在本发明的实践中操作良好的技术,并且因此可以视为构成其实践的优选模式。然而,根据本公开内容,本领域的技术人员应当理解,在不脱离本发明的精神和范围的情况下,可以对所公开的具体实施例进行许多改变并且仍然获得相同或类似的结果。
实例1-定量PCR(qPCR)反应方案和条件
在15μL反应混合物中,正向引物寡核苷酸和反向引物寡核苷酸的最终浓度通常为100nM;然而,在图中注明了与此相比的变化。抑制寡核苷酸的最终浓度在250nM和500nM之间变化,并在图中注明。辅助寡核苷酸的最终浓度在500nM和1000nM之间变化,并在图中注明。Taqman探针的最终浓度通常为50nM。PowerUP SybrGreen DNA聚合酶母液(赛默飞世尔(Thermo Fisher))用于所有qPCR实验。使用伯乐(Bio-Rad)CFX96 qPCR仪器进行热循环和荧光测量。热循环方案如下:
1. 95℃ 3分钟;
2. 60个循环(95℃ 15秒,60℃ 90秒)
实例2-定量PCR中的ACE
例如,ACE系统被设计成用于富集单核苷酸多态性(SNP)位点rs1443486处的除A等位基因以外的等位基因。NA18562人基因组DNA的A等位基因是纯合的,并且NA18537人基因组DNA的DNA(-)链上的C等位基因是纯合的。抑制寡核苷酸被设计成与NA18562A等位基因完美匹配并且具有序列:ttcctgcagggaaacagcatcgattgttttctttaaaagatcccctactccTttttggctaactGAACCCTGACTT/3SpC3/(SEQ ID NO:35;图4)。辅助寡核苷酸具有序列:GTCAGGGTTCagttagccaaaaAggagtaggggatcttttaaagaaaacaatcgatgct/3SpC3/(SEQ ID NO:36)。因为NA18562人基因组DNA的A等位基因是纯合的,所以它被认为是本反应的野生型模板。由于NA18537人基因组DNA的C等位基因是纯合的,因此它被认为是本反应的突变体模板。使用在抑制寡核苷酸的下游结合的Taqman探针(/5Cy5/ggtaaagaaactaaagcaatcagaaagga/3IAbRQSp/;SEQ ID NO:37)来为所述生成的扩增子产生特异性荧光信号。
将ACE-qPCR应用于rs1443486处的非A等位基因的富集和检测后,qPCR反应的循环阈值(Ct)可以清楚地区分100%NA18537、5%NA18537/95%NA18562、1%NA18537/99%NA18562和100%NA18562(图5)。甚至99%NA18562中1%NA18537也可以与100%NA18562清楚地区分,这意味着C等位基因相较于A等位基因的超过100倍的富集。较高浓度的抑制寡核苷酸导致所有DNA样本的Ct值延迟(图5)。
当不存在抑制寡核苷酸或辅助寡核苷酸时,没有实现NA18537的C等位基因相较于NA18562的A等位基因的富集(图6)。当二者都不存在时,循环阈值(Ct)值相似,表明输入DNA量相似并且PCR扩增效率相似。当仅存在辅助寡核苷酸时,NA18537和NA18562的Ct值均未改变,表明辅助寡核苷酸与模板分子的反向互补序列的结合不抑制PCR反应。当仅存在抑制寡核苷酸时,没有观察到任一模板分子的扩增,表明在不存在辅助寡核苷酸的情况下,抑制寡核苷酸与模板分子的结合是不可逆的,并且突变体模板分子和野生型模板分子都无法扩增。只有当抑制寡核苷酸和辅助寡核苷酸都存在时,突变体和野生型模板分子才会有差异扩增。换句话说,当抑制寡核苷酸和辅助寡核苷酸都存在时,则观察到NA18537的优先扩增,因为它的模板分子与抑制寡核苷酸不匹配。
为了证明ACE在靶子序列中富集了具有序列变异的所有模板分子,设计了ACE系统来靶向人TP53基因(图7)。ACE组的抑制寡核苷酸具有序列:GGGTCACTGCCATGGAGGAGCCGCAGTCAGATCCTAGCGTCGAGCCCCCTCTGAGTCAGGAAACATTTTCAGACCCGCAACG/3SPC3/(SEQ ID NO:38)。ACE组的辅助寡核苷酸具有序列:CGTTGCGGGTCTGAAAATGTTTCCTGACTCAGAGGGGGCTCGACGCTAGGATCTGACTGCGGCTCCTC/3SPC3/(SEQ ID NO:39)。本ACE系统使用qPCR进行测试,在跨越50nt靶子序列的不同基因座处使用15个单独的TP53突变。本实验使用合成gBlock寡核苷酸模板(每个606nt长)进行。对于每个qPCR反应,具有目的突变的每个gBlock的2500个分子用作100%VAF样本。使用在抑制寡核苷酸的下游结合的Taqman探针(/5Cy5/AATGGATCCACTCACAGTTTCCATA/3IAbRQSp/;SEQ ID NO:40)来为所生成的扩增子产生特异性荧光信号。在没有突变体模板掺入的情况下观察到的7.5ng NA18537的Ct值被绘制成一条线并且具有约40的值。掺入样本的Ct值都大约低9至13个循环,介于27和31之间(图7)。基于ACE机制的设计,无论突变在抑制寡核苷酸上的位置如何,所有突变都被相同的ACE抑制寡核苷酸和辅助寡核苷酸选择性地富集。
为了证明可以通过抑制寡核苷酸和辅助寡核苷酸的合理设计来延长靶子序列的长度,构建了靶向具有不同的靶子序列长度64nt(51+1+12)、81nt和126nt的相同人SNP(rs1443486)的三个单独的ACE组(图8)。126nt ACE组的抑制寡核苷酸具有序列:gccactagcaccatttacagccagagcctctgcttcgggagatggtctctcttgggggcgctttcctgcagggaaacagcatcgattgttttctttaaaagatcccctactccTttttggctaactGAACCCTGAC/3SPC3/(SEQ ID NO:41)。126nt ACE组的辅助寡核苷酸具有序列:GICAGGGTTCagttagccaaaaAggagtaggggatcttttaaagaaaacaatcgatgctgtttccctgcaggaaagcgcccccaagagagaccatctcccgaagcagaggctctggctgta/3SpC3/(SEQ ID NO:42)。81nt ACE组的抑制寡核苷酸具有序列:tctctcttgggggcgctttcctgcagggaaacagcatcgattgttttctttaaaagatcccctactccTttttggctaactGAACCCTGAC/3SpC3/(SEQ ID NO:43)。81nt ACE组的辅助寡核苷酸具有序列:GTCAGGGTTCagttagccaaaaAggagtaggggatcttttaaagaaaacaatcgatgctgtttccctgcaggaaagc/3SpC3/(SEQ ID NO:44)。64nt ACE组的抑制寡核苷酸具有序列:ttcctgcagggaaacagcatcgattgttttctttaaaagatcccctactccTttttggctaactGAACCCTGACTT/3SpC3/(SEQ ID NO:35)。64nt ACE组的辅助寡核苷酸具有序列:GTCAGGGTTCagttagccaaaaAggagtaggggatcttttaaagaaaacaatcgatgct/3SpC3/(SEQ ID NO:36)。
SNP位置被设计成始终是自模板结合区域的末端起的第13个核苷酸。所有三个ACE系统都表现出NA18537变体模板和NA18562野生型模板之间的显著Ct值差异。对于最长的抑制寡核苷酸,观察到显著延迟,表明越长的长度需要越长的退火循环时间以允许链置换,或者越长的长度越会导致辅助寡核苷酸纯度下降(这是由于较长的化学合成寡核苷酸的纯度较低),从而使置换效率降低。
实例3-下一代测序(NGS)文库制备方案
图10中总结的NGS实验的数据使用因美纳MiSeq仪器和MiSeq v3单端150循环试剂盒收集。每个文库在50μL反应混合物中使用25ng输入DNA。文库制备过程简要总结如下:
1.使用图10中列出的正向引物寡核苷酸、反向引物寡核苷酸、抑制寡核苷酸和辅助寡核苷酸浓度,使用PowerUP母液(赛默飞世尔)进行33个ACE-PCR循环(95℃ 30秒,60℃6分钟)。
2.使用1.7x SPRI珠粒进行DNA纯化。
3.使用iTaq母液(伯乐)进行2个衔接子PCR循环(95℃ 10秒,60℃ 6分钟),每重使用15nM引物。
4.使用1.4x SPRI珠粒进行DNA纯化。
5a.对于没有抑制寡核苷酸的文库,使用500nM索引引物,使用iTaq母液(伯乐)进行8个索引PCR循环(95℃ 10秒,60℃ 30秒)。
5b.对于具有抑制寡核苷酸的文库,使用500nM索引引物,使用iTaq母液(伯乐)进行10个索引PCR循环(95℃ 10秒,60℃ 30秒)。
6.使用1.1x SPRI珠粒进行DNA纯化。
实例4-NGS生物信息学分析方法
从NGS FASTQ文件分析NGS读长的方法总结如下:
1.从每个读长剪除衔接子序列。
2.对与野生型扩增子(WT读长)或变体扩增子(Var读长)完全匹配的插入读长数进行计数。读长中的任何退化核苷酸,如N,被认为是不匹配的,并且不会对WT读长或Var读长产生影响。文库中的可计为任何基因座的WT读长或Var读长的所有NGS读长的分数在此处被定义为目标率。
3.扩增子的变体读长频率(VRF)计算如下:
VRF=(Var读长)/(Var读长+WT读长)
实例5-下一代测序(NGS)文库制备中的ACE
ACE可以用于如例如边合成边测序(NGS)方法中的高通量测序程序的文库制备过程期间的变体富集。可替代地,高通量测序可以经由结合纳米孔的电流测量进行。
构建了18重ACE基因包(表1),其靶向其中NA18537和NA18562的不同的等位基因是纯合的18个不同的SNP基因座。本18重ACE基因包被设计成抑制NA18562样本的纯合SNP等位基因。所有18个抑制寡核苷酸被设计成与NA18562等位基因完美匹配。在1%NA18537/99%NA18562样本上对18重ACE进行测试;每个文库使用25ng这种混合物作为输入。使用因美纳MiSeq来进行NGS。在没有ACE抑制寡核苷酸和辅助寡核苷酸的情况下,映射到NA18562等位基因的NGS读长数在每个基因座处比映射到NA18537等位基因的NGS读长数高大约100倍,正如预期的那样(图10)。在存在ACE抑制寡核苷酸和辅助寡核苷酸的文库中,对于所有基因座,映射到NA18537变体等位基因的读长的相对分数显著增加。总体而言,映射到NA18537基因座的NGS读长的分数从1.22%增加到33.8%,加权平均富集超过24倍。基于这些单重qPCRACE结果,可以通过优化序列、浓度、反应时间和其它实验方案细节,进一步显著改善ACE富集倍数。
表1. 18重ACE基因包的寡核苷酸。
Figure BPA0000334477500000301
Figure BPA0000334477500000311
* * *
本文中所公开和要求的所有方法均可以在无需过度实验的情况下根据本公开进行和执行。虽然本发明的组合物和方法已结合优选实施例描述,但是对于本领域的技术人员显而易见的是,可以对方法和本文所述方法中的步骤或步骤顺序进行变更而这些变更不脱离本发明的构思、精神和范围。更具体地,显然,在化学上和生理学上相关的某些药剂可以取代本文所述的药剂,同时实现相同或相似的结果。对本领域的技术人员显而易见的是,所有这类类似取代和修改视为在由所附权利要求书限定的本发明的精神、范围和概念内。

Claims (121)

1.一种组合物,其包括:
(a)辅助寡核苷酸,
(b)抑制寡核苷酸,其中所述抑制寡核苷酸包括至少20个核苷酸长并且与所述辅助寡核苷酸的子序列反向互补的受保护子序列,其中所述抑制寡核苷酸包括至少7个核苷酸长并且不与所述辅助寡核苷酸反向互补的未受保护子序列,
(c)正向引物寡核苷酸,其中所述正向引物寡核苷酸包括与所述抑制寡核苷酸的子序列具有同一性的至少6个核苷酸长的子序列,和
(d)模板依赖性聚合酶。
2.根据权利要求1所述的组合物,其中所述辅助寡核苷酸包括DNA。
3.根据权利要求1或2所述的组合物,其中所述辅助寡核苷酸由DNA组成。
4.根据权利要求1至3中任一项所述的组合物,其中所述抑制寡核苷酸包括DNA。
5.根据权利要求1至4中任一项所述的组合物,其中所述抑制寡核苷酸由DNA组成。
6.根据权利要求1所述的组合物,其中所述辅助寡核苷酸包括非天然寡核苷酸。
7.根据权利要求1或6所述的组合物,其中所述抑制寡核苷酸包括非天然寡核苷酸。
8.根据权利要求1至7中任一项所述的组合物,其中所述正向引物寡核苷酸包括DNA。
9.根据权利要求1至8中任一项所述的组合物,其中所述正向引物寡核苷酸由DNA组成。
10.根据权利要求1至9中任一项所述的组合物,其中所述模板依赖性聚合酶是DNA聚合酶。
11.根据权利要求1至9中任一项所述的组合物,其中所述模板依赖性聚合酶是逆转录酶。
12.根据权利要求1至7中任一项所述的组合物,其中所述正向引物寡核苷酸包括RNA。
13.根据权利要求1至7和12中任一项所述的组合物,其中所述正向引物寡核苷酸由RNA组成。
14.根据权利要求12或13所述的组合物,其中所述模板依赖性聚合酶是RNA聚合酶。
15.根据权利要求1至14中任一项所述的组合物,其中所述抑制寡核苷酸的长度在30和500个核苷酸之间。
16.根据权利要求1至15中任一项所述的组合物,其中所述抑制寡核苷酸的所述未受保护子序列不与所述辅助寡核苷酸的任何部分反向互补。
17.根据权利要求1至16中任一项所述的组合物,其中所述辅助寡核苷酸的长度在30和500个核苷酸之间。
18.根据权利要求1至17中任一项所述的组合物,其中所述正向引物寡核苷酸的长度在6和70个核苷酸之间。
19.根据权利要求1至18中任一项所述的组合物,其中所述抑制寡核苷酸具有阻止模板依赖性聚合酶延伸的3′化学修饰或DNA序列。
20.根据权利要求1至19中任一项所述的组合物,其中所述辅助寡核苷酸具有阻止模板依赖性聚合酶延伸的3′化学修饰或DNA序列。
21.根据权利要求19或20所述的组合物,其中所述修饰包括双脱氧核苷酸、反向DNA核苷酸、经硫代磷酸酯取代的主链和烷烃或聚乙二醇(PEG)间隔子。
22.根据权利要求19或20所述的组合物,其中3′端处的所述DNA序列形成至少一个发夹结构。
23.根据权利要求1至22中任一项所述的组合物,其中所述组合物包括多个抑制寡核苷酸物种、多个辅助寡核苷酸物种和多个正向引物寡核苷酸物种。
24.根据权利要求23所述的组合物,其中每个抑制寡核苷酸物种包括至少20个核苷酸长并且与至少一个相对应的辅助寡核苷酸物种的子序列反向互补的受保护子序列。
25.根据权利要求23或24所述的组合物,其中每个正向引物寡核苷酸物种包括与至少一个相对应的抑制寡核苷酸物种的子序列具有同一性的至少6个核苷酸长的子序列。
26.根据权利要求23至25中任一项所述的组合物,其中所述多个正向引物寡核苷酸物种各自在5′端处或附近包括通用正向衔接子子序列。
27.根据权利要求1至26中任一项所述的组合物,其进一步包括核酸模板分子,其中所述模板分子包括与所述正向引物寡核苷酸的3′子序列的反向互补序列具有超过90%的同源性的子序列。
28.根据权利要求1至27中任一项所述的组合物,其进一步包括反向引物寡核苷酸,其中所述模板分子包括与所述反向引物寡核苷酸的3′子序列具有超过90%的同源性的子序列。
29.根据权利要求28所述的组合物,其中所述反向引物寡核苷酸的长度在10和70个核苷酸之间。
30.根据权利要求28至29所述的组合物,其中所述反向引物寡核苷酸在5′端处或附近包括通用反向衔接子子序列。
31.根据权利要求27至30中任一项所述的组合物,其中所述模板分子是生物DNA或RNA分子。
32.根据权利要求27至31中任一项所述的组合物,其中所述模板分子获自细胞样本。
33.根据权利要求27至31中任一项所述的组合物,其中所述模板分子获自生物流体。
34.根据权利要求33所述的组合物,其中所述生物流体是血液、尿液、唾液、脑脊液、间质液或滑液。
35.根据权利要求27至31中任一项所述的组合物,其中所述模板分子获自组织。
36.根据权利要求35所述的组合物,其中所述组织是活检组织或手术切除组织。
37.根据权利要求27至36中任一项所述的组合物,其中所述模板分子是通过RNA分子的逆转录生成的互补DNA分子。
38.根据权利要求37所述的组合物,其中所述RNA分子获自源自人、动物、植物或环境标本的生物RNA样本。
39.根据权利要求27至36中任一项所述的组合物,其中所述模板分子是通过作用于单链DNA模板的DNA聚合酶生成的扩增子DNA分子。
40.根据权利要求39所述的组合物,其中所述模板分子是由单细胞DNA的多重置换扩增生成的扩增子DNA分子。
41.根据权利要求27至36中任一项所述的组合物,其中所述模板分子是生物DNA分子的物理、化学或酶促生成产物。
42.根据权利要求41所述的组合物,其中所述模板分子是片段化过程的产物。
43.根据权利要求42所述的组合物,其中所述片段化过程是超声处理或酶促片段化。
44.根据权利要求41所述的组合物,其中所述模板分子是亚硫酸氢盐转化反应、APOBEC反应、TAPS反应或其它化学或酶促反应的产物,其中胞嘧啶核苷酸基于其甲基化状态选择性地转化为尿嘧啶核苷酸。
45.根据权利要求27至44中任一项所述的组合物,其中所述模板分子包括位于正向引物结合子序列和反向引物同源子序列之间的靶子序列。
46.根据权利要求45所述的组合物,其中所述靶子序列与不包含起始子序列的抑制寡核苷酸受保护子序列的部分的反向互补序列具有至少70%的同一性。
47.根据权利要求45或46所述的组合物,其中所述抑制寡核苷酸在所述抑制寡核苷酸的3′处或附近具有起始子序列。
48.根据权利要求47所述的组合物,其中所述起始子序列的长度在4和25个核苷酸之间。
49.根据权利要求47或48所述的组合物,其中所述起始子序列与紧邻所述靶子序列的3′的所述模板分子子序列的反向互补序列具有小于30%的同一性。
50.根据权利要求47至49中任一项所述的组合物,其中所述辅助寡核苷酸在所述辅助寡核苷酸的5′端处或附近具有起始互补序列子序列。
51.根据权利要求50所述的组合物,其中所述起始互补序列子序列的长度在4和25个核苷酸之间。
52.根据权利要求50或51所述的组合物,其中所述起始互补序列子序列与所述抑制寡核苷酸的所述起始子序列的反向互补序列具有至少90%的同一性。
53.根据权利要求27至52中任一项所述的组合物,其中所述辅助寡核苷酸不具有与反向互补序列正向引物寡核苷酸具有超过30%的同一性的子序列。
54.根据权利要求1至53中任一项所述的组合物,其进一步包括荧光团功能化DNA探针。
55.根据权利要求54所述的组合物,其中所述荧光团功能化DNA探针是Taqman探针或分子信标。
56.根据权利要求1至53中任一项所述的组合物,其进一步包括DNA嵌入染料。
57.根据权利要求56所述的组合物,其中所述DNA嵌入染料是SybrGreen、EvaGreen或Syto。
58.根据权利要求1至57中任一项所述的组合物,其中所述辅助寡核苷酸与所述抑制寡核苷酸的化学计量比在0.8和100之间。
59.根据权利要求1至58中任一项所述的组合物,其中所述正向引物寡核苷酸和所述模板分子在60℃的温度和0.2M钠的盐度下的标准杂交自由能(ΔG°1)在-7kcal/mol和-20kcal/mol之间。
60.根据权利要求1至59中任一项所述的组合物,其中所述抑制寡核苷酸和所述模板分子在60℃的温度和0.2M钠的盐度下的标准杂交自由能(ΔG°2)在-16kcal/mol和-200kcal/mol之间。
61.根据权利要求1至60中任一项所述的组合物,其中所述抑制寡核苷酸和所述辅助寡核苷酸在60℃的温度和0.2M钠的盐度下的标准杂交自由能(ΔG°3)在-15kcal/mol和-200kcal/mol之间。
62.根据权利要求60和61中任一项所述的组合物,其中(ΔG°2-ΔG°3)的值在-5kcal/mol和+5kcal/mol之间。
63.根据权利要求1至62中任一项所述的组合物,其进一步包括聚合酶功能所需的试剂和缓冲液。
64.一种用于使用聚合酶链式反应选择性地扩增DNA序列变体的方法,所述方法包括:
(a)将可能包括变体DNA模板分子并且可能包括野生型DNA模板分子的样本与以下混合:
(i)辅助寡核苷酸,
(ii)抑制寡核苷酸,其中所述抑制寡核苷酸包括至少20个核苷酸长并且与所述辅助寡核苷酸的子序列反向互补的受保护子序列,其中所述抑制寡核苷酸包括至少7个核苷酸长并且不与所述辅助寡核苷酸反向互补的未受保护子序列,其中所述受保护子序列包括靶结合子序列和起始子序列,并且其中所述靶结合子序列与所述野生型DNA模板分子的反向互补序列具有至少70%的同一性,
(iii)正向引物寡核苷酸,其中所述正向引物寡核苷酸包括与所述抑制寡核苷酸的所述未受保护子序列的至少一部分具有同一性的至少6个核苷酸长的子序列,并且其中所述正向引物寡核苷酸的3′子序列的反向互补序列与所述野生型DNA模板具有至少90%的同一性,
(iv)反向引物寡核苷酸,其中所述反向引物寡核苷酸的3′子序列与所述野生型DNA模板的子序列具有至少90%的同一性,和
(v)DNA聚合酶功能所需的模板依赖性DNA聚合酶、dNTP和缓冲试剂,以及
(b)使所述混合物经受至少7轮热循环。
65.根据权利要求64所述的方法,其中每轮热循环包括将所述混合物保持在80℃至105℃的变性温度下1秒至1小时,然后将所述混合物保持在50℃至75℃的退火温度下1秒至2小时。
66.根据权利要求64或65所述的方法,其中将多个正向引物寡核苷酸、反向引物寡核苷酸、抑制寡核苷酸和辅助寡核苷酸与所述样本混合,其中每组正向引物寡核苷酸、反向引物寡核苷酸、抑制寡核苷酸和辅助寡核苷酸对应于不同的变体模板分子和野生型模板分子序列。
67.根据权利要求64至66中任一项所述的方法,其中所有正向引物寡核苷酸在5′端处或附近包括通用正向衔接子子序列,并且其中所有反向引物寡核苷酸在5′端处或附近包括通用反向衔接子子序列。
68.根据权利要求64至67中任一项所述的方法,其中每个抑制寡核苷酸物种包括至少20个核苷酸长并且与至少一个相对应的辅助寡核苷酸物种的子序列反向互补的受保护子序列。
69.根据权利要求64至68中任一项所述的方法,其中每个正向引物寡核苷酸物种包括与至少一个相对应的抑制寡核苷酸物种的子序列具有同一性的至少6个核苷酸长的子序列。
70.根据权利要求64至69中任一项所述的方法,其中所述正向引物寡核苷酸和所述变体模板分子在60℃的温度和0.2M钠的盐度下的标准杂交自由能(ΔG°1)在-7kcal/mol和-20kcal/mol之间。
71.根据权利要求64至70中任一项所述的方法,其中所述抑制寡核苷酸和所述野生型模板分子在60℃的温度和0.2M钠的盐度下的标准杂交自由能(ΔG°2)在-16kcal/mol和-200kcal/mol之间。
72.根据权利要求64至71中任一项所述的方法,其中所述抑制寡核苷酸和所述辅助寡核苷酸在60℃的温度和0.2M钠的盐度下的标准杂交自由能(ΔG°3)在-15kcal/mol和-200kcal/mol之间。
73.根据权利要求71和72中任一项所述的方法,其中(ΔG°2-ΔG°3)的值在-5kcal/mol和+5kcal/mol之间。
74.根据权利要求64至73中任一项所述的方法,其中所述反向引物寡核苷酸和所述变体模板分子在60℃的温度和0.2M钠的盐度下的标准杂交自由能(ΔG°4)在-7kcal/mol和-20kcal/mol之间。
75.根据权利要求64至74中任一项所述的方法,其中所述混合物中的每个正向引物寡核苷酸的浓度在100pM和5μM之间。
76.根据权利要求64至75中任一项所述的方法,其中所述混合物中的每个反向引物寡核苷酸的浓度在100pM和5μM之间。
77.根据权利要求64至76中任一项所述的方法,其中所述混合物中的每个抑制寡核苷酸的浓度在100pM和5μM之间。
78.根据权利要求64至77中任一项所述的方法,其中每个辅助寡核苷酸的浓度在100pM和5μM之间。
79.根据权利要求64至78中任一项所述的方法,其中每个正向引物寡核苷酸与其相对应的抑制寡核苷酸的化学计量比在0.8和100之间。
80.根据权利要求64至79中任一项所述的方法,其中每个辅助寡核苷酸与其相对应的抑制寡核苷酸的化学计量比在0.8和100之间。
81.根据权利要求64至80中任一项所述的方法,其中所述辅助寡核苷酸包括DNA。
82.根据权利要求64至81中任一项所述的方法,其中所述辅助寡核苷酸由DNA组成。
83.根据权利要求64至82中任一项所述的方法,其中所述抑制寡核苷酸包括DNA。
84.根据权利要求64至83中任一项所述的方法,其中所述抑制寡核苷酸由DNA组成。
85.根据权利要求64至84中任一项所述的方法,其中所述抑制寡核苷酸的长度在30和500个核苷酸之间。
86.根据权利要求64至85中任一项所述的方法,其中所述抑制寡核苷酸的所述未受保护子序列不与所述辅助寡核苷酸的任何部分反向互补。
87.根据权利要求64至86中任一项所述的方法,其中所述辅助寡核苷酸的长度在30和500个核苷酸之间。
88.根据权利要求64至87中任一项所述的方法,其中所述正向引物寡核苷酸的长度在6和70个核苷酸之间。
89.根据权利要求64至88中任一项所述的方法,其中所述反向引物寡核苷酸的长度在10和70个核苷酸之间。
90.根据权利要求64至89中任一项所述的方法,其中所述抑制寡核苷酸具有阻止DNA聚合酶延伸的3′化学修饰或DNA序列。
91.根据权利要求64至90中任一项所述的方法,其中所述辅助寡核苷酸具有阻止DNA聚合酶延伸的3′化学修饰或DNA序列。
92.根据权利要求90或91所述的方法,其中所述修饰包括双脱氧核苷酸、反向DNA核苷酸、经硫代膦酸酯取代的主链和烷烃或聚乙二醇(PEG)间隔子。
93.根据权利要求90或91所述的方法,其中3′端处的所述DNA序列形成至少一个发夹结构。
94.根据权利要求64至93中任一项所述的方法,其中所述抑制寡核苷酸在所述抑制寡核苷酸的3′处或附近具有起始子序列。
95.根据权利要求64至94中任一项所述的方法,其中所述起始子序列的长度在4和25个核苷酸之间。
96.根据权利要求64至95中任一项所述的方法,其中所述起始子序列与紧邻所述靶子序列的3′的所述变体模板分子子序列的反向互补序列具有小于30%的同一性。
97.根据权利要求64至96中任一项所述的方法,其中所述辅助寡核苷酸在所述辅助寡核苷酸的5′端处或附近具有起始互补序列子序列。
98.根据权利要求97所述的方法,其中所述起始互补序列子序列的长度在4和25个核苷酸之间。
99.根据权利要求97或98所述的方法,其中所述起始互补序列子序列与所述抑制寡核苷酸的所述起始子序列的反向互补序列具有至少90%的同一性。
100.根据权利要求64至99中任一项所述的方法,其中所述辅助寡核苷酸不具有与所述正向引物寡核苷酸的反向互补序列具有超过30%的同一性的子序列。
101.根据权利要求64至100中任一项所述的方法,其中所述混合物进一步包括荧光团功能化DNA探针。
102.根据权利要求101所述的方法,其中所述荧光团功能化DNA探针是Taqman探针或分子信标。
103.根据权利要求64至100中任一项所述的方法,其中所述混合物进一步包括DNA嵌入染料。
104.根据权利要求103所述的方法,其中所述DNA嵌入染料是SybrGreen、EvaGreen或Syto。
105.一种用于使用定量PCR(qPCR)选择性地检测和量化DNA序列变体的方法,所述方法包括:
(a)根据权利要求64至104中任一项所述的方法在样本的第一等分试样中进行变体DNA模板相较于野生型DNA模板的选择性PCR扩增;
(b)进行基于时间的溶液荧光测量;
(c)基于所述溶液荧光超过阈值的循环计算循环阈值(Ct);以及
(d)基于Ct值确定所述样本中是否存在所述变体DNA模板或确定其量。
106.根据权利要求105所述的方法,其中所述qPCR混合物包括Taqman探针。
107.根据权利要求105或106所述的方法,其进一步包括:
(e)在不存在抑制寡核苷酸的情况下,使用所述正向引物寡核苷酸和所述反向引物寡核苷酸对所述样本的第二等份试样进行第二qPCR反应;
(f)计算本第二反应的循环阈值(Ct2);以及
(g)基于Ct和Ct2之间的值差异确定变体DNA模板与野生型DNA模板的相对量。
108.一种用于使用高通量测序选择性地检测和量化DNA序列变体的方法,所述方法包括:
(a)根据权利要求64至104中任一项所述的方法在样本的第一等分试样中进行变体DNA模板相较于野生型DNA模板的选择性PCR扩增;
(b)将测序衔接子附加到扩增子的一端或两端;以及
(c)对步骤(b)的产物进行高通量测序;以及
(d)基于所述高通量测序读长确定所述样本的突变VAF。
109.根据权利要求108所述的方法,其中所述正向引物寡核苷酸在其5′端包括正向测序衔接子,并且所述反向引物寡核苷酸在其5′端包括反向测序衔接子。
110.根据权利要求109所述的方法,其中所述测序衔接子中的一个或两个包括唯一分子标识符(UMI)序列。
111.根据权利要求108所述的方法,其进一步包括使用PCR附加测序衔接子和/或测序索引。
112.根据权利要求111所述的方法,其中所述测序衔接子包括唯一分子标识符(UMI)序列。
113.根据权利要求108所述的方法,其进一步包括在进行高通量测序之前将测序衔接子和/或测序索引连接到步骤(a)的PCR产物。
114.根据权利要求113所述的方法,其中经由连接附加的所述测序衔接子包括唯一分子标识符(UMI)序列。
115.根据权利要求110、112或114所述的方法,其中所述UMI序列包括一组预先设计的序列,其中每对UMI序列表现出不小于所述UMI的长度的30%的最小汉明距离。
116.根据权利要求110、112、114或115所述的方法,其中所述UMI序列包括一组包括退化核苷酸的序列,所述退化核苷酸选自N(A、C、G和T的混合物)、B(C、G和T的混合物)、D(A、G和T的混合物)、H(C、A和T的混合物)、V(A、C和G的混合物)、S(C和G的混合物)、W(A和T的混合物)、R(A和G的混合物)、Y(T和C的混合物)、K(G和T的混合物)和M(A和C的混合物)。
117.根据权利要求108至116中任一项所述的方法,其中所述样本的突变VAF是所有模板分子中的变体模板分子的分数。
118.根据权利要求117所述的方法,其中突变VAF的确定基于变体读长频率(VRF)和富集倍数(EF)。
119.根据权利要求117所述的方法,其中突变VAF的确定基于UMI聚类。
120.根据权利要求108至119中任一项所述的方法,其中所述高通量测序经由边合成边测序进行。
121.根据权利要求108至119中任一项所述的方法,其中所述高通量测序经由结合纳米孔的电流测量进行。
CN202180049991.0A 2020-06-26 2021-06-25 扩增子全面富集 Pending CN116075520A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063044634P 2020-06-26 2020-06-26
US63/044,634 2020-06-26
PCT/US2021/039202 WO2021263176A1 (en) 2020-06-26 2021-06-25 Amplicon comprehensive enrichment

Publications (1)

Publication Number Publication Date
CN116075520A true CN116075520A (zh) 2023-05-05

Family

ID=79281925

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180049991.0A Pending CN116075520A (zh) 2020-06-26 2021-06-25 扩增子全面富集

Country Status (7)

Country Link
US (1) US20230250470A1 (zh)
EP (1) EP4172169A1 (zh)
KR (1) KR20230028450A (zh)
CN (1) CN116075520A (zh)
AU (1) AU2021294360A1 (zh)
CA (1) CA3183843A1 (zh)
WO (1) WO2021263176A1 (zh)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6637423B2 (ja) * 2013-12-16 2020-01-29 ウィリアム マーシュ ライス ユニバーシティWilliam Marsh Rice University 微調整された超特異的核酸ハイブリダイゼーションプローブ
ES2861353T3 (es) * 2014-05-19 2021-10-06 Univ Rice William M Amplificación específica de alelo utilizando una composición de oligonucleótidos cebadores no específicos de alelo y bloqueantes específicos de alelo solapantes
BR112019012925A2 (pt) * 2016-12-23 2019-12-10 Albert-Ludwigs-Universität Freiburg sonda mediadora em duas partes

Also Published As

Publication number Publication date
EP4172169A1 (en) 2023-05-03
CA3183843A1 (en) 2021-12-30
WO2021263176A1 (en) 2021-12-30
US20230250470A1 (en) 2023-08-10
KR20230028450A (ko) 2023-02-28
AU2021294360A1 (en) 2023-02-02

Similar Documents

Publication Publication Date Title
ES2810300T3 (es) Etiquetado y evaluación de una secuencia diana
AU2015315103B2 (en) Methods and compositions for rapid nucleic acid library preparation
US8883990B2 (en) Asymmetric adapter library construction
EP2467479B1 (en) Compositions and methods for intramolecular nucleic acid rearrangement
CN109511265B (zh) 通过链鉴定改进测序的方法
US20140255929A1 (en) Mosaic tags for labeling templates in large-scale amplifications
ES2874143T3 (es) Métodos y composiciones para reducir códigos de barras, moleculares redundantes creados en reacciones de prolongación de cebadores
WO2017087724A1 (en) Methods for determining sequence profiles
JP2023519782A (ja) 標的化された配列決定の方法
US20220267848A1 (en) Detection and quantification of rare variants with low-depth sequencing via selective allele enrichment or depletion
US20220098642A1 (en) Quantitative amplicon sequencing for multiplexed copy number variation detection and allele ratio quantitation
US20170175182A1 (en) Transposase-mediated barcoding of fragmented dna
KR20200024167A (ko) Rna 및 dna로부터의 핵산 라이브러리의 제조
US11174511B2 (en) Methods and compositions for selecting and amplifying DNA targets in a single reaction mixture
WO2022144003A1 (zh) 一种用于高通量靶向测序的多重pcr文库构建方法
CN116075520A (zh) 扩增子全面富集
KR20230006852A (ko) 무보정 및 다중 변이체 대립유전자 빈도 정량화를 위한 정량적 블로커 변위 증폭(qbda) 시퀀싱
US20230340581A1 (en) Non-extensible oligonucleotides in dna amplification reactions
KR101762486B1 (ko) 한국인 모계 계통 분석용 마커 조성물

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination