CN110373449A - 捕获包含靶寡核苷酸序列的核酸的方法及其用途 - Google Patents

捕获包含靶寡核苷酸序列的核酸的方法及其用途 Download PDF

Info

Publication number
CN110373449A
CN110373449A CN201910289102.2A CN201910289102A CN110373449A CN 110373449 A CN110373449 A CN 110373449A CN 201910289102 A CN201910289102 A CN 201910289102A CN 110373449 A CN110373449 A CN 110373449A
Authority
CN
China
Prior art keywords
nucleic acid
hours
minutes
different nucleic
buffer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910289102.2A
Other languages
English (en)
Inventor
梅蕊
卢卡斯朱利安
古帕塔普莱尤斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Precision Biotechnology Co Ltd
Original Assignee
Precision Biotechnology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Precision Biotechnology Co Ltd filed Critical Precision Biotechnology Co Ltd
Publication of CN110373449A publication Critical patent/CN110373449A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6832Enhancement of hybridisation reaction
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1003Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor
    • C12N15/1006Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor by means of a solid support carrier, e.g. particles, polymers
    • C12N15/1013Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor by means of a solid support carrier, e.g. particles, polymers by using magnetic beads
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/682Signal amplification
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B30/00Methods of screening libraries
    • C40B30/04Methods of screening libraries by measuring the ability to specifically bind a target molecule, e.g. antibody-antigen binding, receptor-ligand binding
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了从核酸库捕获包含靶寡核苷酸序列的核酸的方法,包括:使核酸库与探针接触,所述核酸库包括一个包含靶寡核苷酸序列的核酸,所述探针包含与靶寡核苷酸序列互补的序列,其中所述接触可在基于四甲基氯化铵(TMAC)的缓冲液中,在约60℃至约70℃的温度下进行,所述接触可使靶寡核苷酸序列和与靶寡核苷酸序列互补的序列杂交,从而产生杂交产品;将杂交产物与库中不包含靶寡核苷酸序列的核酸分离。本发明还提供了用于实施上述方法的组合物。

Description

捕获包含靶寡核苷酸序列的核酸的方法及其用途
技术领域
本发明涉及寡核苷酸杂交和核酸纯化领域,特别是涉及一种从核酸库中捕获包含靶寡核 苷酸序列的核酸的方法及其用途。
背景技术
新一代测序可使无数基因组在一段时间内进行测序。尽管现有技术先进,但全基因组测 序仍非常昂贵,因此需要靶富集。
有两种类型的靶富集策略:基于扩增子和基于杂交。扩增子策略依赖于使用称为引物的 短互补核苷酸序列,通过基于聚合酶链反应(PCR)的靶扩增来进行富集。但这会导致DNA 片段的缺失,从而导致变体缺失,发生错误。另一方面,杂交策略依赖于基于互补性的DNA 结合片段,从而可针对给定靶标,有效地捕获所有变体。但杂交策略存在链偏差、不均匀覆 盖,以及低效结合和捕获等问题。
发明内容
在本发明提供的方法中使用新的基于四甲基氯化铵(TMAC)的缓冲液,可提供比本领 域已知的其他方法较低的脱靶率和较均匀的靶标覆盖率。鉴于此,本发明提供一种从核酸库 捕获包含靶寡核苷酸序列的核酸的方法,包括:使核酸库与探针接触,所述核酸库包括一个 包含靶寡核苷酸序列的核酸,所述探针包含与靶寡核苷酸序列互补的序列,其中所述接触在 基于TMAC的缓冲液中,在约60℃至约70℃的温度下进行,所述接触使靶寡核苷酸序列和 与靶寡核苷酸序列互补的序列杂交,从而产生杂交产品;将杂交产物与库中不包含靶寡核苷 酸序列的核酸分离。
在一些实施例中,所述接触步骤在约64℃至约66℃的温度下进行。
在一些实施例中,所述杂交产物是RNA-DNA产物。
在一些实施例中,所述基于TMAC的缓冲液包含约0.5M至约4.0M的TMAC。
在本说明书所述任何方法的一些实施例中,基于TMAC的缓冲液还包含以下一种或多种: 约10mM至约200mM的2-氨基-2-(羟甲基)丙烷-1,3-二醇(Tris);约1X到约5X的Denhardt’s 溶液;约0.01%至约0.2%的吐温20(Tween-20);约0.5mM至约10mM的乙二胺四乙酸 (EDTA);约0.5%至约25%(v/v)的甲酰胺。
在本说明书所述任何方法的一些实施例中,基于TMAC的缓冲液还包含:约10mM至约200mM的2-氨基-2-(羟甲基)丙烷-1,3-二醇(Tris);约1X到约5X的Denhardt’s溶液;约0.01%至约0.2%的吐温20;约0.5mM至约10mM的乙二胺四乙酸(EDTA);约0.5%至约 25%(v/v)的甲酰胺。
在一些实施例中,基于TMAC的缓冲液包含:约40mM至约60mM的2-氨基-2-(羟甲基)丙烷-1,3-二醇(Tris);约2X至约3X的Denhardt’s溶液;约0.01%至约0.05%吐温20;约0.5mM至约7mM乙二胺四乙酸(EDTA);约0.5%至约25%(v/v)的甲酰胺。
在本说明书所述任何方法的一些实施例中,基于TMAC的缓冲液包含约2.7M的TMAC、 约50mM的Tris(pH8.0)、约2.5X的Denhardt’s溶液、约0.010%的吐温20、约6mM的EDTA,和约20%的甲酰胺。
在本说明书所述任何方法的一些实施例中,基于TMAC的缓冲液包括约5.4M的TMAC、 约100mM的Tris(pH8.0)、约5X的Denhardt’s溶液、约0.02%的吐温20和约12mM的EDTA。
在本说明书所述任何方法的一些实施例中,所述接触步骤进行约1小时至约48小时。在 一些实施例中,所述接触步骤进行约10小时至约20小时。
在本说明书所述任何方法的一些实施例中,探针包含位于探针核酸序列内部或5'或3'末 端的标签。在一些实施例中,标签是生物素或其变体。
在本说明书所述任何方法的一些实施例中,使用珠进行分离。在一些实施例中,使用具 有可特异性结合标签的连结部分的珠进行分离。
在本说明书所述任何方法的一些实施例中,所述方法还包括接触步骤和分离步骤之后的 至少一个清洗步骤。在一些实施例中,所述至少一个清洗步骤包括使用低严格性缓冲液和高 严格性缓冲液。
在一些实施例中,所述至少一个清洗步骤包括使用低严格性缓冲液,在约16℃至约30℃ 的温度下清洗约1分钟至约10小时。
在本说明书所述任何方法的一些实施例中,使用低严格性缓冲液,在约23℃至约27℃的 温度下清洗约5分钟至约40分钟。
在一些实施例中,低严格性缓冲液包含缓冲溶液和任选的去污剂。在一些实施例中,低 严格性缓冲液包含盐水-柠檬酸钠(SSC)缓冲液和任选的十二烷基硫酸钠(SDS)。在一些 实施例中,低严格性缓冲液包含约0.5X至约2.5X的SSC和0%至约0.15%的SDS。
在本说明书所述任何方法的一些实施例中,所述至少一个清洗步骤包括使用高严格性缓 冲液,在约45℃至约75℃的温度下清洗约1分钟至约10小时。在一些实施例中,使用高严 格性缓冲液,在约45℃至约75℃的温度下清洗约1分钟至约4小时。
在一些实施例中,高严格性缓冲液包含约0.1X至约0.5X的SSC,和任选的清洗剂。在 一些实施例中,高严格性缓冲液包含约0.15X至约0.35X的SSC,和任选的清洗剂。在一些实施例中,高严格性缓冲液包含约0%至约0.15%的SDS。
本说明书还提供了包含液体的组合物,其中液体包含约0.5M至约8.0M的TMAC、约10mM至约200mM的Tris(pH8.0)、约1X至约5X的Denhardt’s溶液、约0.01%至约0.2% 的吐温20、约0.5mM至约15mM的EDTA和约0.5%至约25%的甲酰胺(v/v)。
在本说明书所述任何组合物的一些实施例中,液体包含约2.0M至约6.0M的TMAC。在 本文所述任何组合物的一些实施例中,液体包含约5.0M至约6.0M的TMAC。
在本说明书所述任何组合物的一些实施例中,液体包含约5.4M的TMAC。
在本说明书所述任何组合物的一些实施例中,液体包含约40mM至约60mM的Tris(pH8.0)。在本文所述任何组合物的一些实施例中,液体包含约100mM的Tris(pH8.0)。
在本说明书所述任何组合物的一些实施例中,液体包含约2X至约3X的Denhardt’s溶 液。在本文所述任何组合物的一些实施例中,液体包含约5X的Denhardt’s溶液。
在本说明书所述任何组合物的一些实施例中,液体包含约0.01%至约0.05%的吐温20。 在本文所述任何组合物的一些实施例中,液体包含约5mM至约15mM的EDTA。
在本说明书所述任何组合物的一些实施例中,液体包含约10%至约25%的甲酰胺(v/v)。 在本文所述任何组合物的一些实施例中,液体包含约20%的甲酰胺(v/v)。
在本说明书所述任何组合物的一些实施例中,液体包括约2.7M的TMAC、约50mM的Tris(pH8.0)、约2.5X的Denhardt’s溶液、约0.010%的吐温20、约6mM的EDTA和约 20%的甲酰胺。在本说明书所述任何组合物的一些实施例中,组合物由液体组成。
本发明还提供了包含本说明书所述任何一种组合物的试剂盒。本说明书所述的任何试剂 盒的一些实施例还包括进行本说明书所述任何方法的说明书。
如本说明书所用,术语“脱靶”是指富集不预计进行富集的核酸(例如,不包括靶序列的 核酸)。这种“脱靶”结合可能因具有缺失区域而降低灵敏度,由于覆盖率较低而增加假阳性, 导致可信度差和/或成本提高。在一些实施例中,脱靶结合会有毒性作用。
如本说明书所用,术语“靶标覆盖”是指靶区域(例如,基因座或所需基因座的一部分) 的定序覆盖度。
如本说明书所用,术语“测序覆盖度”或“测序深度”是指覆盖库中靶向核苷酸序列的测序 产物的数量。
如本说明书所用,术语“GC含量”是指在指定区域上的DNA寡核苷酸中鸟嘌呤核苷酸 (Gs)和胞嘧啶核苷酸(Cs)的含量。GC含量通常用百分比表示。与As和Ts相反,Gs和Cs量多的区域视为具有高GC含量。高GC含量是指GC百分比约60%及以上,例如,约62% 及以上、约64%及以上、约66%及以上、约68%及以上、约70%及以上、约72%及以上、 约74%及以上、约76%及以上、约78%及以上、约80%及以上、约82%及以上、约84%及 以上、约86%及以上、约88%及以上、约90%及以上、约92%及以上、约94%及以上、约 96%及以上、约98%及以上,或60%、约61%、约62%、约63%、约64%、约65%、约 66%、约67%、约68%、约69%、约70%、约71%、约72%、约73%、约74%、约75%、 约76%、约77%、约78%、约79%、约80%、约81%、约82%、约83%、约84%、约85%、 约86%、约87%、约88%、约89%约90%、约91%、约92%、约93%、约94%、约95%、 约96%、约97%、约98%、约99%或100%。低GC含量是指GC百分比约59%及以下、 约58%及以下、约56%及以下、约54%及以下、约52%及以下、约50%及以下、约48%及 以下、约46%及以下、约44%及以下、约42%及以下、约40%及以下、约38%及以下、约 36%及以下、约34%及以下、约32%及以下、约30%及以下、约28%及以下、约26%及以 下、约24%及以下、约22%及以下、约20%及以下、约18%及以下、约16%及以下、约14% 及以下、约12%及以下、约10%及以下、约8%及以下、约6%及以下、约4%及以下、约2% 及以下、约1%及以下,或约0.5%、约1%、约2%、约3%、约4%、约5%、约6%、约7%、 约8%、约9%、约10%、约11%、约12%、约13%、约14%、约15%、约16%、约17%、 约18%、约19%、约20%、约21%、约22%、约23%、约24%、约25%、约26%、约27%、约28%、约29%、约30%、约31%、约32%、约33%、约34%、约35%、约36%、约37%、 约38%、约39%、约40%、约41%、约42%、约43%、约44%、约45%、约46%、约47%、 约48%、约49%、约50%、约51%、约52%、约53%、约54%、约55%、约56%、约57%、 约58%或约59%。
如本说明书所用,术语“引物”是指可作为与一种或多种核酸(例如,靶核酸链,例如, 靶寡核苷酸序列)互补的延伸产物5'至3'合成起始点的寡核苷酸。存在适当的核苷酸和用于 聚合的试剂(例如,DNA聚合酶)时,可在合适的缓冲液中,合适的温度下合成延伸产物。
附图说明
图1是示例性过程的示意图:左侧显示了DNA片段化、末端修复和dA拖尾、衔接子连接和PCR扩增步骤;中间显示了捕获步骤和PCR扩增步骤;右侧显示了序列准备和执行步骤;
图2是DNA片段化、末端修复和dA拖尾、衔接子连接和PCR扩增步骤的代表性示意图,使用Illumina衔接子将片段化的基因组DNA转化为PCR扩增库;简而言之,片段化DNA 呈平端、dA拖尾,并通过酶混合物发生5'磷酸化;再将DNA连接到分支的衔接子上;扩增 衔接子连接库,可增加得到的DNA量,并使衔接子线性化;
图3是PCR扩增库与Illumina衔接子杂交的示意图,所述Illumina衔接子可与RNA探 针杂交,所述RNA探针可与生物素(RNA捕获饵剂)共价连接;用链霉抗生物素蛋白珠子拉下RNA-DNA杂交产物,所述链霉抗生物素蛋白珠子可与探针中的生物素标签结合;清洗具有已捕获的库序列的珠,以去除未经靶向的库分子,并通过聚合酶链式反应(PCR)扩增富集库;
图4是与杂交严格性、覆盖率和脱靶率相关的高GC含量(60%GC)和低GC含量(30%GC)的靶序列的示意图;
图5是包含序列的探针示意图,所述序列可与描述非特异性相互作用的靶寡核苷酸序列 互补;探针包括由符号“b”表示的标记;
图6是杂交产物的示例性图,其中靶寡核苷酸序列已与探针杂交,所述探针包含与靶寡 核苷酸序列互补并具有内部标签的序列;探针的内部标签由特异性结合内部标签的珠结合; 不包括靶寡核苷酸序列的核酸序列显示在杂交产物的右侧;
图7是杂交产物的示例性图,其中靶寡核苷酸序列已与探针杂交,所述探针包含与靶寡 核苷酸序列互补并具有内部生物素标签的序列;探针的内部生物素标签由与链霉抗生物素蛋 白共价缀合的磁珠结合,链霉抗生物素蛋白可特异性结合生物素标签;
图8是描述探针选择和制剂策略的示意图,涉及基于TGCA和COSMIC数据库选择具有 覆盖最多患者大多数变体的外显子;
图9是解释基于扩增子和基于杂交的靶富集策略之间的差异,以及描述后者优点的示例 性图。
具体实施方式
下面将对本发明的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明的 一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有 做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供一种新的基于四甲基氯化铵(TMAC)的杂交缓冲液,并将其与下述增强型 方法结合。TMAC是季铵盐,有助于稳定腺嘌呤(A)和硫胺素(T)核苷酸区域,从而在 60-70℃下明显提高杂交率。
本发明提供一种从核酸库捕获包含靶寡核苷酸序列的核酸的方法,所述方法包括:使核 酸库与探针接触,所述核酸库包括一个包含靶寡核苷酸序列的核酸,所述探针包含与靶寡核 苷酸序列互补的序列,其中所述接触可在基于TMAC的缓冲液中,在约60℃至约70℃的温 度下进行,所述接触可使靶寡核苷酸序列和与靶寡核苷酸序列互补的序列杂交,从而产生杂 交产品;将杂交产物从库中分离。
本发明还提供本说明书所述的任何基于TMAC的缓冲液,所述基于TMAC的缓冲液可用于本说明书所述的任何方法中。
所述方法提供的分析灵敏度大于95%、大于95.5%、大于96.0%、大于96.5%、大于97.0%、 大于97.5%、大于98.0%、大于98.5%、大于98.6%、大于98.7%、大于98.8%、大于98.9%、 大于99.0%、大于99.1%、大于99.2%、大于99.3%、大于99.4%、大于99.5%、大于99.6%、 大于99.7%、大于99.8%、大于99.9%或100%。
所述方法提供的再现性大于95%、大于95.5%、大于96.0%、大于96.5%、大于97.0%、 大于97.5%、大于98.0%、大于98.5%、大于98.6%、大于98.7%、大于98.8%、大于98.9%、 大于99.0%、大于99.1%、大于99.2%、大于99.3%、大于99.4%、大于99.5%、大于99.6%、 大于99.7%、大于99.8%、大于99.9%或100%。
所述方法提供的平均测序覆盖率大于95%、大于95.5%、大于96.0%、大于96.5%、大 于97.0%、大于97.5%、大于98.0%、大于98.5%、大于98.6%、大于98.7%、大于98.8%、 大于98.9%、大于99.0%、大于99.1%、大于99.2%、大于99.3%、大于99.4%、大于99.5%、 大于99.6%、大于99.7%、大于99.8%、大于99.9%或100%。
所述方法的非限制性如下文所述,可以任何组合使用而无限制。所述方法的其他方面是 本领域已知的。
(一)核酸库
本发明提供的方法可实现从包括含靶寡核苷酸序列的核酸的核酸库中捕获包含靶寡核苷 酸序列的核酸。所述核酸库可包括多种不同的核酸,其中每种核酸包括不同的核酸序列。在 一些实施例中,所述核酸库内的每个核酸具有相同的长度或具有大致相同的长度。在一些实 施例中,所述核酸库内的每种核酸具有不同的长度。在一些实施例中,所述核酸库内的至少 两种核酸具有不同的长度。
核酸库可为双链DNA库、单链DNA库、单链RNA库、双链RNA库,或由一条DNA 链和一条RNA链构建的双链核酸库。
在一些实施例中,所述核酸库中的核酸可为染色体、质粒、基因组、线粒体、外来体、 无细胞DNA、细胞(例如,哺乳动物细胞)或病毒来源。在一些实施例中,可使用本说明书所述的任何方法捕获一条或两条双链核酸分子(例如,本说明书所述的任何双链核酸)。
核酸库可包括具有以下总长度的多个双链核酸(例如,双链DNA、双链RNA,或由一条DNA链和一条RNA链构成的双链核酸),总长度为例如约20碱基对(bp)至约5,000bp、 约20bp至约4,000bp、约20bp至约3,000bp、约20bp至约2,000bp、约20bp至约1,500bp、 约20bp至约1,000bp、约20bp至约500bp、约20bp至约100bp、约20bp至约60bp、约20bp 至约40bp、约100bp至约5,000bp、约100bp至约约4,000bp、约100bp至约2,000bp、约100bp 至约1,000bp、约100bp至约500bp、约100bp至约250bp、约100bp至约200bp、约250bp 至约5,000bp、约250bp至约1,000bp、约250bp至约500bp、约500bp至约5,000bp、约500bp 至约2,000bp、约500bp至约1,000bp、约1,000bp至约5,000bp、约1,000bp至约2,000bp、约 1,500bp至约5,000bp、约1,500bp至约2,000bp、约2,000bp至约5,000bp、约2,000bp至约 4,000bp、约3,000bp至约5,000bp、约3,000bp至约4,000bp,或约4,500bp至约5,000bp。
核酸库可包括多个单链核酸(例如,单链DNA或单链RNA),总长度为例如约20个核苷酸(nt)至约5,000nt、约20bp至约4,000bp、约20bp至约3,000bp、约20bp至约2,000bp、 约20bp至约1,500bp、约20bp至约1,000bp、约20bp至约500bp、约20bp至约100bp、约 20bp至约60bp、约20bp至约40bp、约100bp至约5,000bp、约100bp至约4,000bp、约100bp 至约2,000bp、约100bp至约1,000bp、约100bp至约500bp、约100bp至约250bp、约100bp 至约200bp、约250bp至约5,000bp、约250bp至约1,000bp、约250bp至约500bp、约500bp 至约5,000bp、约500bp至约2,000bp、约500bp至约1,000bp、约1,000bp至约5,000bp、约 1,000bp至约2,000bp、约1,500bp至约5,000bp、约1,500bp至约2,000bp、约2,000bp至约 5,000bp、约2,000bp至约4,000bp、约3,000bp至约5,000bp、约3,000bp至约4,000bp,或约 4,500bp至约5,000bp。
核酸库可包括多个至少1×103个不同的核酸、至少1×104个不同的核酸、至少1×105个不 同的核酸、至少1×106个不同的核酸、至少1×107个不同的核酸、至少1×108个不同的核酸、 至少1×109个不同的核酸、至少1×1010个不同的核酸、至少1×1011个不同的核酸、至少1×1012个不同的核酸、至少1×1013个不同的核酸、至少1×1014个不同的核酸,或至少1×1015个不同 的核酸。例如,本文所述的任何库可包括多个,例如,约1.0×102个不同的核酸至约1.0×109个不同的核酸、约1.0×108个不同的核酸至约0.5×109个不同的核酸、约1.0×102个不同的核 酸至约1.0×108个不同的核酸、约1.0×102个不同的核酸至约0.5×108个不同的核酸、约1.0 ×108个不同的核酸至约1.0×107个不同的核酸、约1.0×102个不同的核酸至约0.5×107个不 同的核酸、约1.0×102个不同的核酸至约1.0×106个不同的核酸、约1.0×108个不同的核酸至 约0.5×106个不同的核酸、约1.0×108个不同的核酸至约1.0×105个不同的核酸、约1.0×102个不同的核酸至约0.5×105个不同的核酸、约1.0×102个不同的核酸至约1.0×104个不同的核 酸、约1.0×102个不同的核酸至约0.5×104个不同的核酸、约1.0×103个不同的核酸至约0.5 ×109个不同的核酸、约1.0×103个不同的核酸至约1.0×108个不同的核酸、约1.0×103个不 同的核酸至约0.5×108个不同的核酸、约1.0×103个不同的核酸至约1.0×107个不同的核酸、 约1.0×103个不同的核酸至约0.5×107个不同的核酸、约1.0×103个不同的核酸到约1.0×106个不同的核酸、约1.0×103个不同的核酸到约0.5×106个不同的核酸、约1.0×1010个不同的 核酸到约1.0×105个不同的核酸、约1.0×103个不同的核酸至约0.5×105个不同的核酸、约 1.0×103个不同的核酸至约1.0×104个不同的核酸、约1.0×103个不同的核酸至约0.5×104个 不同的核酸、约0.5×104个不同的核酸至约1.0×109个不同的核酸、约0.5×104个不同的核酸 至约0.5×109个不同的核酸、约0.5×104个不同的核酸至约1.0×108个不同的核酸、约0.5× 104个不同的核酸至约0.5×108个不同的核酸、约0.5×104个不同的核酸至约1.0×107个不同 的核酸、约0.5×104个不同的核酸至约0.5×107个不同的核酸、约0.5×104个不同的核酸至约 1.0×106个不同的核酸、约0.5×104个不同的核酸至约0.5×106个不同的核酸、约0.5×104个 不同的核酸至约1.0×105个不同的核酸、约0.5×104个不同的核酸至约0.5×105个不同的核酸、约0.5×104个不同的核酸至约1.0×104个不同的核酸、约1.0×104个不同的核酸至约1.0×109个不同的核酸、约1.0×104个不同的核酸至约0.5×109个不同的核酸、约1.0×104个不同的核 酸至约1.0×108个不同的核酸、约1.0×104个不同的核酸至约0.5×108个不同的核酸、约1.0 ×104个不同的核酸至约1.0×107个不同的核酸、约1.0×104个不同的核酸至约0.5×107个不 同的核酸、约1.0×104个不同的核酸至约1.0×106个不同的核酸、约1.0×104个不同的核酸 至约0.5×106个不同的核酸、约1.0×104个不同的核酸至约1.0×105个不同的核酸、约1.0× 104个不同的核酸至约0.5×105个不同的核酸、约0.5×103个不同的核酸至约1.0×109个不同 的核酸、约0.5×105个不同的核酸至约0.5×109个不同的核酸、约0.5×105个不同的核酸至约 1.0×108个不同的核酸、约0.5×103个不同的核酸至约0.5×108个不同的核酸、约0.5×105个 不同的核酸至约1.0×107个不同的核酸、约0.5×105个不同的核酸至约0.5×107个不同的核酸、 约0.5×105个不同的核酸至约1.0×106个不同的核酸、约0.5×103个不同的核酸至约0.5×106个不同的核酸、约0.5×105个不同的核酸至约1.0×105个不同的核酸、约1.0×105个不同的核 酸至约1.0×109个不同的核酸、约1.0×105个不同的核酸至约0.5×109个不同的核酸、约1.0 ×105个不同的核酸至约1.0×108个不同的核酸、约1.0×105个不同的核酸至约0.5×108个不 同的核酸、约1.0×105个不同的核酸至约1.0×107个不同的核酸、约1.0×105个不同的核酸至 约0.5×107个不同的核酸、约1.0×105个不同的核酸至约1.0×106个不同的核酸、约1.0×105个不同的核酸至约0.5×106个不同的核酸、约0.5×106个不同的核酸至约1.0×109个不同的核 酸、约0.5×106个不同的核酸至约0.5×109个不同的核酸、约0.5×106个不同的核酸至约1.0 ×108个不同的核酸、约0.5×106个不同的核酸至约0.5×108个不同的核酸、约0.5×106个不 同的核酸至约1.0×107个不同的核酸、约0.5×106个不同的核酸至约0.5×107个不同的核酸、 约0.5×106个不同的核酸至约1.0×106个不同的核酸、约1.0×105个不同的核酸至约1.0×109个不同的核酸、约1.0×106个不同的核酸至约0.5×109个不同的核酸、约1.0×106个不同的核酸至约1.0×108个不同的核酸、约1.0×106个不同的核酸至约0.5×108个不同的核酸、约1.0 ×106个不同的核酸至约1.0×107个不同的核酸、约1.0×106个不同的核酸至约0.5×107个不 同的核酸、约0.5×107个不同的核酸至约1.0×109个不同的核酸、约0.5×107个不同的核酸至 约0.5×109个不同的核酸、约0.5×107个不同的核酸至约1.0×108个不同的核酸、约0.5×107个不同的核酸至约0.5×108个不同的核酸、约0.5×107个不同的核酸至约1.0×107个不同的核 酸、约1.0×107个不同的核酸至约1.0×109个不同的核酸、约1.0×107个不同的核酸至约0.5 ×109个不同的核酸、约1.0×107个不同的核酸至约1.0×105个不同的核酸、约1.0×107个不 同的核酸至约0.5×105个不同的核酸、约0.5×108个不同的核酸至约1.0×109个不同的核酸、 约0.5×105个不同的核酸至约0.5×109个不同的核酸、约0.5×108个不同的核酸至约1.0×108个不同的核酸、约1.0×108个不同的核酸至约1.0×109个不同的核酸、约1.0×108个不同的核 酸至约0.5×109个不同的核酸,或约0.5×109个不同的核酸至约1.0×109个不同的核酸。
在本说明书所述任何方法的一些实施例中、存在于所述核酸库中的核酸(例如,通过本 说明书所述方法捕获的核酸)可包含具有高GC含量的序列或由该序列组成。在一些实施例 中,所述核酸库中核酸的GC含量或其部分(例如,所述核酸库中核酸中存在的靶寡核苷酸 序列)可具有约60%及以上的GC百分比(例如,约62%及以上、约64%及以上、约65%及以上、约68%及以上、约70%及以上、约72%及以上、约74%及以上、约75%及以上、 约78%及以上、约80%及以上、约82%及以上、约84%及以上、约85%及以上、约88%及 以上、约90%及以上、约92%及以上、约94%及以上、约95%及以上,或约98%及以上, 或约60%、约61%、约62%、约63%、约64%、约65%、约66%、约67%、约68%、约 69%、约70%、约71%、约72%、约73%、约74%、约75%、约76%、约77%、约78%、 约79%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、 约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、 约99%或100%。
在本说明书所述任何方法的一些实施例中,存在于所述核酸库中的核酸(例如,通过本 文所述方法捕获的核酸)可包含具有低GC含量的序列或由该序列组成。在一些实施例中, 所述核酸库中核酸的GC含量或其部分(例如,所述核酸库中核酸中存在的靶寡核苷酸序列) 可具有约59%及以下的GC百分比(例如,约58%及以下、约56%及以下、约54%及以下、 约52%及以下、约50%及以下、约48%及以下、约46%及以下、约44%及以下、约42%及以下、约40%及以下、约38%及以下、约36%及以下、约34%及以下、约32%及以下、约 30%及以下、约28%及以下、约26%及以下、约24%及以下、约22%及以下、约20%及以 下、约18%及以下、约16%及以下、约14%及以下、约12%及以下、约10%及以下、约8% 及以下、约6%及以下、约4%及以下、约2%及以下、或约1%及以下,或约0.5%、约1%、 约2%、约3%、约4%、约5%、约6%、约7%、约8%、约9%、约10%、约11%、约 12%、约13%、约14%、约15%、约16%、约17%、约18%、约19%、约20%、约21%、 约22%、约23%、约24%、约25%、约26%、约27%、约28%、约29%、约30%、约31%、 约32%、约33%、约34%、约35%、约36%、约37%、约38%、约39%、约40%、约41%、 约42%、约43%、约44%、约45%、约46%、约47%、约48%、约49%、约50%、约51%、 约52%、约53%、约54%、约55%、约56%、约57%、约58%或约59%。
本说明书所述任何方法的一些实施例还包括产生所述核酸库,包含以下步骤:将双链 DNA(例如,哺乳动物细胞中的基因组DNA或细胞DNA,例如,活组织检查样本中存在的哺乳动物细胞)片段化、进行末端修复和dA拖尾、连接衔接子,并进行PCR扩增,从而产 生所述核酸库。产生核酸库的其他方法是本领域已知的。
(二)探针
本说明书所述的方法包括使用单链探针,所述单链探针包括与靶寡核苷酸序列互补的序 列(例如,本说明书所述的任何靶序列)。
在本说明书所述任何方法的一些实施例中,探针含有总共约10个核苷酸(nt)至约800nt、 约10nt至约500nt、约10nt至约250nt、约10nt至约100nt、约10nt至约50nt、约10nt至约 40nt、约10nt至约30nt、约10nt至约20nt、约10nt至约15nt、约20nt至约800nt、约20nt至约500nt、约20nt至约200nt、约20nt至约100nt、约20nt至约50nt、约20nt至约40nt、 约50nt至约800nt、约50nt至约500nt、约50nt至约250nt、约50nt至约100nt、约100nt至 约800nt、约100nt至约500nt、约100nt至约250nt、约100nt至约约200nt、约150nt至约800nt、约150nt至约500nt、约150nt至约250nt、约150nt至约200nt、约200nt至约800nt、约200nt至约500nt、约200nt至约400nt、约200nt至约300nt、约200nt至约250nt、约250nt至约500nt、 约500nt至约800nt。
在一些实施例中,与靶寡核苷酸序列和/或靶寡核苷酸序列互补的序列包括总共约8个核 苷酸(nt)至约400nt、约8nt至约200nt、约8nt至约100nt、约8nt至约50nt、约8nt至约 30nt、约8nt至约20nt、约8nt至约16nt、约8nt至约10nt、约10nt至约400nt、约10nt至约200nt、约10nt至约100nt、约10nt至约50nt、约10nt至约20nt、约20nt至约400nt、约20nt 至约200nt、约20nt至约100nt、约50nt至约400nt、约50nt至约100nt、约75nt至约400nt、 约75nt至约200nt、约75nt至约100nt、约100nt至约约400nt、约100nt至约200nt、约200nt 至约400nt、约200nt至约300nt、约300nt至约400nt。
在本说明书所述任何方法的一些实施例中,与靶寡核苷酸序列和/或靶寡核苷酸序列互补 的序列可包含具有高GC含量的序列或由该序列组成。在一些实施例中,与靶寡核苷酸序列 和/或靶寡核苷酸序列互补的序列的GC含量可具有约60%及以上的GC百分比(例如,约62% 及以上、约64%及以上、约65%及以上、约68%及以上、约70%及以上、约72%及以上、 约74%及以上、约75%及以上、约78%及以上、约80%及以上、约82%及以上、约84%及 以上、约85%及以上、约88%及以上、约90%及以上、约92%及以上、约94%及以上、约95%及以上、或约98%及以上,或约60%、约61%、约62%、约63%、约64%、约65%、 约66%、约67%、约68%、约69%、约70%、约71%、约72%、约73%、约74%、约75%、 约76%、约77%、约78%、约79%、约80%、约81%、约82%、约83%约84%、约85%、 约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、 约96%、约97%、约98%、约99%或100%。
在本说明书所述任何方法的一些实施例中,与靶寡核苷酸序列和/或靶寡核苷酸序列互补 的序列可包含具有低GC含量的序列或由该序列组成。在一些实施例中,与靶寡核苷酸序列 和/或靶寡核苷酸序列互补的序列的GC含量可具有约59%及以下的GC百分比(例如,约58% 及以下、约56%及以下、约54%及以下、约52%及以下、约50%及以下、约48%及以下、 约46%及以下、约44%及以下、约42%及以下、约40%及以下、约38%及以下、约36%及 以下、约34%及以下、约32%及以下、约30%及以下、约28%及以下、约26%及以下、约24%及以下、约22%及以下、约20%及以下、约18%及以下、约16%及以下、约14%及以 下、约12%及以下、约10%及以下、约8%及以下、约6%及以下、约4%及以下、约2%及 以下、约1%及以下,或约0.5%、约1%、约2%、约3%、约4%、约5%、约6%、约7%、 约8%、约9%、约10%、约11%、约12%、约13%、约14%、约15%、约16%、约17%、 约18%、约19%、约20%、约21%、约22%、约23%、约24%、约25%、约26%、约27%、 约28%、约29%、约30%、约31%、约32%、约33%、约34%、约35%、约36%、约37%、 约38%、约39%、约40%、约41%、约42%、约43%、约44%、约45%、约46%、约47%、 约48%、约49%、约50%、约51%、约52%、约53%、约54%、约55%、约56%、约57%、 约58%或约59%)。
选择通过探针进行靶向的外显子,主要受美国国家综合癌症网络(NCCN)指南指导, 以涵盖可操作的变体。此外,为了具有高杂交率,探针的覆盖/小组尺寸比可以尽可能地高, 可通过选择具有基于癌症基因组图谱(TGCA)的大多数癌症变体的外显子来实现。根据《体 细胞突变癌症目录》(COSMIC)中的数据,通过设计与外显子互补的探针进行进一步选择, 所述外显子覆盖大量患者的最大数量的变体。这样,探针数量少,但覆盖广泛,从而提高了 杂交率。
为了改善覆盖均匀性,探针包括覆盖外显子侧翼的额外核苷酸,从而可覆盖外显子内含 子剪接点,从而可均匀地覆盖整个外显子而无任何外显子丢失。
在一些示例中,靶寡核苷酸序列是原癌基因中的序列。在一些示例中,靶寡核苷酸序列 是致癌基因中的序列。在一些示例中,靶寡核苷酸序列是致癌激酶融合蛋白。在一些示例中, 靶寡核苷酸序列是表1中列出的基因序列。
(三)阻断
为了通过防止扩增显性和/或无需的DNA模板的方式,来降低非特异性结合并提高靶速 率,应进行阻断步骤。阻断寡核苷酸的各示例是本领域已知的。参见,例如,Xie等,(2016) 《分子遗传学与基因组医学》4(3):262-272;Blumenstiel等,(2010)《人类遗传学的最 新协议》第18章:第18.4单元;Vestheim等,(2011)《分子生物学方法》687:265-274。 例如,阻断寡核苷酸可从集成DNA技术公司(IDT)获得。在一些情况下,阻断寡核苷酸与 鲑鱼精子DNA和人类cot-1DNA组合,构成阻塞混合物。在一些情况下,可在杂交步骤之前 将封闭混合物添加到合并库中。
(四)杂交
在本说明书中的杂交是指氢键,可为互补核苷或核苷酸碱基之间的Watson-Crick、 Hoogsteen或反向Hoogsteen氢键。例如,腺嘌呤和胸腺嘧啶为互补的核碱基,通过形成氢键 而配对。
本说明书中的互补是指两个核苷酸之间精确配对的能力。例如,如果探针特定位置的核 苷酸可与靶DNA分子或靶RNA分子的相应位置处的核苷酸形成氢键,则视为探针和靶DNA 分子或靶RNA分子在该位置上相补。每个分子中足够数量的相应位置由彼此氢键结合的核苷 酸占据时,探针和靶DNA分子或靶RNA分子彼此互补。因此,术语“可特异性杂交”和“互补” 中,部分用途表示足够程度的互补性或精确配对,从而可在探针和靶DNA分子或靶RNA分 子之间发生稳定和特异性结合。例如,如果探针的一个位置上的碱基可与靶DNA分子或靶 RNA分子的相应位置处的碱基形成氢键,则视为碱基在该位置处彼此互补,无需100%的互 补性。
在本领域中应理解,核酸序列无需与靶核酸的核酸序列100%互补,即可特异性杂交。 互补性程度足够高时,用于本方法目的的互补核酸序列是特异性可杂交的,以避免在需要特 异性结合的条件下,该序列与非靶DNA和/或RNA序列的非特异性结合,例如,在合适的严 格条件下进行体外测定的条件下。在一些实施例中,互补核酸序列不与其他序列互补。杂交 技术是本领域技术人员已知的,例如,Benton和Davis(《科学》196:180,1977);Grunstein 和Hogness(《美国科学院院报》72:3961,1975);Ausubel等,(《分子生物学的当前协 议》,纽约威利国际科学,2001);Berger和Kimmel(《分子克隆技术指南》,1987,纽约学术出版社);和Sambrook等(《分子克隆:实验室手册》,纽约冷泉港实验室出版社)。
(五)捕获寡核苷酸的方法
本说明书提供了从核酸库捕获包含靶寡核苷酸序列的核酸的方法,所述方法包括:使核 酸库与探针接触,所述核酸库包括一个包含靶寡核苷酸序列的核酸,所述探针包含与靶寡核 苷酸序列互补的序列,其中所述接触可在基于氯化四甲铵(TMAC)的缓冲液中,在约60℃ 至约70℃的温度下进行,所述接触可使靶寡核苷酸序列和与靶寡核苷酸序列互补的序列杂交, 从而产生杂交产品;将杂交产物从库中分离。
在本说明书所述任何方法的一些实施例中,杂交产物是RNA-DNA产物或DNA-DNA产物。在一些实施例中,杂交产物是RNA-DNA产物。在一些实施例中,杂交产物是DNA-DNA 产物。
(六)接触核酸库
在本说明书提供的任何方法的一些实施例中,在基于TMAC的缓冲液中,在约60℃至约 70℃的温度下(例如,约60℃至约66℃,约60℃至约64℃,约64℃至约68℃,约64℃至约66℃,约64℃,约65℃,约66℃,约67℃,约68℃、约69℃或约70℃)使核酸库与探 针接触,所述核酸库包括一个包含靶寡核苷酸序列的核酸,所述探针包含与靶寡核苷酸序列 互补的序列。
在本说明书提供的任何方法的一些实施例中,基于TMAC的缓冲剂包含约0.5M至约8.0M的TMAC(例如,约0.5M至约6.0M、约0.5M至约5.5M、约0.5M至约5.0M、约0.5M 至约4.5M、约0.5M至约4.0M、约0.5M至约3.0M、约0.5M至约2.5M、约0.5M至约2.0M、 约1.0M至约8.0M、约1.0M至约6.0M、约1.0M至约5.5M、约1.0M至约5.0M、约1.0M 至约4.5M、约1.0M至约4.0M、约1.0M至约3.5M、约1.0M至约3.0M、约1.0M至约2.5M、 约1.0M至约2.0M、约2.0M至约8.0M、约2.0M至约6.0M、约2.0M至约5.5M、约2.0M 至约5.0M、约2.0M至约4.5M、约2.0M至约4.0M、约2.5M至约8.0M、约2.5M至约6.0M、 约2.5M至约5.5M、约2.5M至约5.0M、约3.0M至约8.0M、约3.0M至约6.0M、约3.0M 至约5.5M、约3.0M至约5.0M、约3.0M至约4.5M、约3.0M至约4.0M、约4.0M至约8.0M、 约4.0M至约6.0M、约4.0M至约5.5M、约4.0M至约5.0M、约4.0M至约4.5M、约5.0M 至约8.0M、约5.0M至约6.0M、约5.0M至约5.5M、约6.0M至约8.0M、约7.0M至约8.0M、约7.0M至约7.5M、约7.5M至约8.0M,或约0.5M、约0.6M、约0.7M、约0.8M、约0.9M、 约1.0M、约1.2M、约1.4M、约1.6M、约1.8M、约2.0M、约2.2M、约2.4M、约2.6M、约 2.7M、约2.8M、约3.0M、约3.2M、约3.4M、约3.6M约3.8M、约4.0M、约4.2M、约4.4M、 约4.6M、约4.8M、约5.0M、约5.2M、约5.4M、约5.6M、约5.8M、约6.0M、约6.2M、约 6.4M、约6.6M、约6.8M、约7.0M、约7.2M、约7.4M、约7.6M、约7.8M或约8.0M)。
在本说明书所述的任何方法的一些实施例中,基于TMAC的缓冲液还包括一种或多种(两 种、三种、四种或五种):
约10mM至约200mM的2-氨基-2-(羟甲基)丙烷-1,3-二醇(Tris),例如,约10mM 至约150mM、约10mM至约100mM、约10至约50mM、约20mM至约200mM、约20mM 至约150mM、约20至约100mM、约20至约60mM、约20至约50mM、约30mM至约200mM、 约30mM至约150mM、约30至约100mM、约30至约60mM、约30至约50mM、约40mM 至约200mM、约40mM至约150mM、约40至约60mM、约40至约50mM、约50mM至约 200mM、约50mM至约150mM、约50至约100mM、约90mM至约200mM、约90mM至约 150mM、约100mM至约100mM、200mM、约100mM至约150mM,或约10mM、约20mM、 约30mM、约40mM、约50mM、约60mM、约70mM、约80mM、约90mM、约100mM、 约150mM、约160mM、约170mM、约180mM、约190mM、约200mM的Tris,pH6.0-8.0 (例如,pH6.0-7.5、pH6.0-7.0、pH6.0-6.5、pH6.5-8.0、pH6.5-7.5、pH6.5-7.0、pH7.0-8.0、pH7.0-7.5、 pH6.0、pH6.5、pH7.0、pH7.5、pH8.0);
约1X至约5X的Denhardt’s溶液(例如,约1X至约4X、约1X至约3X、约1X至约 2X、约2X至约5X、约2X至约4X、约2X至约3X、约3X至约5X、约3X至约4X、或约 4X至约5X,或约1X、约1.5X、约2X、约2.5X、约3X、约3.5X、约4X、约4.5X或约5X 的Denhardt’s溶液);
约0.01%至约0.2%的吐温20(例如,约0.01%至约0.10%、约0.01%至约0.06%、约 0.01%至约0.05%、约0.01%至约0.04%、约0.02%至约约0.20%、约0.02%至约0.10%、 约0.02%至约0.06%、约0.02%至约0.04%、约0.10%至约0.20%约0.10%至约0.16%、约 0.14%至约0.20%、约0.16%至约0.20%、约0.01%、约0.02%、约0.04%、约0.06%、约 0.08%、约0.1%或约0.2%吐温20);
约0.5mM至约15mM的亚乙二胺四乙酸(EDTA)(例如,约0.5mM至约12.5mM、约 0.5mM至约12.0mM、约0.5mM至约10.0mM、约0.5mM至约8.0mM、约0.5mM至约7.0mM、 约0.5mM至约6.0mM、约0.5mM至约5.0mM、约1.0mM至约15mM、约1.0mM至约13.5mM、 约1.0mM至约13.0mM、约1.0mM至约12.5mM、约1.0mM至约12.0mM、约1.0mM至约10mM、约2.0mM至约7.0mM、约1.0mM至约6.0mM、约1.0mM至约5.0mM、约2.0mM 至约15mM、约2.0mM至约13.5mM、约2.0mM至约13.0mM、约2.0mM至约12.5mM、约 2.0mM至约12.0mM、约2.0mM至约10mM、约2.0mM至约8.0mM、约2.0mM至约6.0mM、 约3.0mM至约15mM、约3.0mM至约14.0mM、约3.0mM至约13.0mM、约3.0mM至约10mM、 约3.0mM至约8.0mM、约3.0mM至约7.0mM、约3.0mM至约直径6.5mM、约3.0mM至约6.0mM、约3.0mM至约5.5mM、约3.0mM至约5.0mM、约3.0mM至约4.0mM、约5.0mM 至约15mM、约5.0mM至约13.5mM、约5.0mM至约13.0mM、约5.0mM至约12.5mM、约 5.0mM至约12.0mM、约5.0mM至约10mM、约5.0mM至约8.0mM、约5.0mM至约6.5mM、 约5.0mM至约6.0mM、约6.0mM至约15mM、约6.0mM至约13.0mM、约6.0mM至约12.5mM、 约6.0mM至约12.0mM、约6.0mM至约10mM、约8.0mM至约15mM、约8.0mM至约13.0mM、 约8.0mM至约12.5mM、约8.0mM至约12.0mM、约8.0mM至约10mM、约10.0mM至约 15mM、约10.0mM至约10mM、约13.0mM、约10.0mM至约12.5mM、约10.0mM至约12.0mM, 或约11.0mM至约13.0mM、约5mM、约6mM、约8mM、约10mM、约12mM、约14mM 或约15mM);和
约0.5%至约25%(v/v)的甲酰胺(例如,约0.5%(v/v)至约20.0%(v/v)、约0.5%(v/v)至约15.0%(v/v))、约0.5%(v/v)至约10.0%(v/v)、约0.5%(v/v)至约5.0% (v/v)、约0.5%(v/v)至约3.0%(v/v)、约0.5%(v/v)至约2.0%(v/v)、约0.5%(v/v) 至约1.0%(v/v)、约1.0%(v/v)至约25%(v/v)、约1.0%(v/v)至约20.0%(v/v)、 约1.0%(v/v)至约15.0%(v/v)、约1.0%(v/v)至约12.5%(v/v)、约1.0%(v/v)至 约10.0%(v/v)、约1.0%(v/v)至约5.0%(v/v)、约5.0%(v/v)至约25%(v/v)、约 5.0%(v/v)至约20.0%(v/v)、约5.0%(v/v)至约15.0%(v/v)、约5.0%(v/v)至约 10.0%(v/v)、约10.0%(v/v)至约25%(v/v)、约10.0%(v/v)至约20.0%(v/v)、约 10.0%(v/v)至约15.0%(v/v)、约10.0%(v/v)至约12.5%(v/v)、约12.5%(v/v)至 约25%(v/v)、约12.5%(v/v)至约20.0%(v/v)、约15.0%(v/v)至约25%(v/v)、 约15.0%(v/v)至约20.0%(v/v)、约17.5%(v/v)至约25%(v/v)、约17.5%(v/v)至 约22.5%(v/v)、约17.5%(v/v)至约20.0%(v/v),或约20.0%(v/v)至约25%(v/v) 的甲酰胺)。
在一些实施例中,基于TMAC的缓冲液包含约10mM至约200mM(或本说明书所述的该范围的任何子范围)2-氨基-2-(羟甲基)丙烷-1,3-二醇(Tris);约1X到约5X(或本文 所述范围的任何子范围)Denhardt’s溶液;约0.01%至约0.2%(或本说明书所述范围的任 何子范围)吐温20;约0.5mM至约10mM(或本说明书所述范围的任何子范围)乙二胺四乙 酸(EDTA);和约0.5%至约25%(v/v)(或本说明书所述范围的任何子范围)甲酰胺。
在一些实施例中,基于TMAC的缓冲液包含约40mM至约60mM(或本说明书所述范围的任何子范围)2-氨基-2-(羟甲基)丙烷-1,3-二醇(Tris);约2X至约3X(或本说明书所 述范围的任何子范围)Denhardt’s溶液;约0.01%至约0.05%(或本说明书所述范围的任何子范围)吐温20;约0.5mM至约7mM(或本说明书所述范围的任何子范围)乙二胺四乙酸(EDTA);和约0.55%(v/v)至约25%(v/v)(或本说明书所述范围的任何子范围)甲酰 胺。
在一些实施例中,基于TMAC的缓冲液包括约2.7M的TMAC、约50mM的Tris(pH8.0)、约2.5XDenhardt’s溶液、约0.010%吐温20、约6mM的EDTA和约20%甲酰胺。
在一些实施例中,基于TMAC的缓冲液包含约5.4M的TMAC、约100mM的Tris(pH8.0)、约5X的Denhardt’s溶液、约0.02%吐温20、约12mM的EDTA。
如本说明书所述,1X Denhardt’s溶液为1%Ficoll、1%聚乙烯吡咯烷酮和1%牛血清白 蛋白。
在本说明书所述任何方法的一些实施例中,接触步骤进行约1小时至约48小时(例如, 约1小时至约36小时、约1小时至约24小时、约1小时至约18小时、约1小时至约16小 时、约1小时至约14小时、约1小时至约12小时、约1小时至约10小时、约1小时至约6 小时、约1小时至约2小时;约4小时至约48小时、约4小时至约24小时、约4小时至约 16小时、约4小时至约12小时、约4小时至约10小时、约4小时至约8小时、约4小时至 约6小时、约6小时至约14小时、约6小时至约12小时、约6小时至约10小时、约10小 时至约48小时、约10小时至约24小时、约10小时至约20小时、约10小时至约18小时、 约10小时至约16小时、约10小时至约14小时、约10小时至约12小时、约12小时至约 48小时、约12小时至约24小时、约12小时至约18小时、约12小时至约16小时、约16 小时至约48小时、约16小时至约24小时、约16小时至约18小时、约20小时至约48小时, 或约20小时至约24小时、约24小时至约48小时)。
(七)珠结合步骤
探针为生物素化,在与靶核酸区域杂交后,形成生物素化的杂交体。为了将靶核酸与非 靶核酸分离,可使生物素化的杂交体与链霉抗生物素蛋白包覆的磁珠结合。该结合过程发生 在高达2.0M的盐中(例如,约0.1M至约2.0M、约0.1M至约1.0M、约0.1M至约0.5M、 约1.0M至约2.0M、约1.0M至约1.5M、约0.2M、约0.3M、约0.4M、约0.5M、约0.6M、 约0.7M、约0.8M、约0.9M、约1.0M、约1.2M、约1.4M、约1.6M、约1.8M,或约2.0M), 存在在约0.01M至约0.1M的Tris,pH8.0(例如、约0.01M至约0.08M、约0.01M至约0.06M、 约0.01M至约0.04M、约0.01M至约0.02M、约0.02M至约0.1M、约0.02M至约0.08M、约 0.02M至约0.06M、约0.02M至约0.04M、约0.04M至约0.1M、约0.04M至约0.08M、约0.04M 至约0.06M、约0.06M至约0.1M、约0.06M至约0.08M、约0.01M、约0.02M、约0.04M、 约0.06M、约0.08M、约0.1M和约0.1M至约1.0M的EDTA(例如、约0.1M至约0.8M、约 0.1M至约0.6M、约0.1M至约0.5M、约0.1M至约0.4M、约0.1M至约0.2M、约0.2M至约 1.0M、约0.2M至约0.8M、约0.2M至约0.6M、约0.2M至约0.5M、约0.2M至约0.4M、约 0.4M至约1.0M、约0.4M至约0.8M、约0.4M至约0.6M、约0.4M至约0.5M、约0.5M至约 1.0M、约0.5M至约0.8M、约0.5M至约0.6M、约0.6M至约1.0M、约0.6M至约0.8M、约 0.1M、约0.2M、约0.4M、约0.5M、约0.6M、约0.8M或约1.0M)。该结合过程在约16℃ 至约65℃的温度下进行(例如、约16℃至约60℃、约16℃至约50℃,约16℃至约42℃、 约16℃至约40℃、约16℃至约38℃、约16℃至约36℃、约16℃至约30℃、约16℃至约28℃、 约16℃至约24℃、约16℃至约20℃、约16℃至约18℃、约20℃至约65℃、约20℃至约42℃、 约20℃至约32℃、约20℃至约26℃,约20℃至约24℃、约20℃至约22℃,约24℃至约65℃、 约24℃至约60℃、约24℃至约42℃、约24℃至约40℃、约24℃至约38℃,约24℃至约36℃、 约24℃至约34℃、约24℃至约32℃、约24℃至约30℃、约24℃至约28℃、约24℃至约26℃、 约26℃至约65℃、约26℃至约38℃、约30℃至约65℃,约30℃至约42℃、约30℃至约34℃, 约32℃至约38℃、约32℃至约36℃、约36℃至约65℃、约36℃至约48℃、约40℃至约65℃、 约40℃至约44℃、约50℃至约65℃、约56℃至约65℃、约60℃至约65℃、约16℃、约22℃、 约24℃、约26℃,约28℃、约30℃、约32℃、约34℃、约36℃、约38℃、约40℃、约42℃、 约44℃、约46℃、约48℃、约50℃、约52℃、约54℃、约56℃、约58℃、约60℃、约62℃、 约64℃或约65℃)约10分钟至约60分钟(例如,约10分钟至约50分钟,约10分钟至约 45分钟、约10分钟至约40分钟、约10分钟至约30分钟、约10分钟至约20分钟、约10 分钟至约15分钟、约15分钟至约60分钟,约15分钟至约45分钟、约15分钟至约30分钟、 约20分钟至约60分钟、约20分钟至约45分钟,约20分钟至约30分钟、约20分钟至约 25分钟、约25分钟至约60分钟、约25分钟至约30分钟,约30分钟至约60分钟、约30 分钟至约45分钟、约45分钟至约60分钟,约10分钟、约15分钟、约20分钟、约25分钟、 约30分钟分钟、约35分钟,约40分钟、约45分钟、约50分钟、约55分钟或约60分钟, 体积为约20μL至约500μL(例如,约20μL至约400μL、约20μL至约300μL、约20μL至约 250μL、约20μL至约200μL、约20μL至约100μL、约20μL至约50μL、约50μL至约500μL、 约50μL至约250μL、约50μL至约100μL,约100μL至约500μL、约100μL至约400μL、约 100μL至约300μL、约100μL至约250μL、约100μL至约200μL、约100μL至约150μL、约150μL至约500μL,约150μL至约300μL、约150μL至约200μL、约200μL至约500μL,约 200μL至约400μL、约200μL至约250μL,约250μL至约500μL、约300μL至约500μL、约 300μL至约400μL、约400pL至约500pL、约25μL、约50μL、约100μL、约150μL、约200μL、 约250μL、约300μL、约350μL、约400μL、约450μL或约500μL)。
在结合步骤期间,靶核酸的生物素化杂交体可与磁珠结合,并可使用磁体与非靶核酸分 离。为了进一步去除未靶向的非特异性结合的核酸,应进行清洗步骤。上述步骤可确保靶覆 盖率最大,脱靶率最低。
(八)清洗步骤
在本说明书所述任何方法的一些实施例中,所述方法还可包括在接触步骤和分离步骤之 后的至少一个(例如,2、3或4个)清洗步骤。
在本说明书所述任何方法的一些实施例中,所述至少一个清洗步骤包括使用珠清洗缓冲 液(例如,本说明书所述的任何珠清洗缓冲液)。在一些实施例中,所述至少一个清洗步骤 包括使用珠清洗缓冲液(例如,本说明书所述的任何示例性珠清洗缓冲液)在约16℃至约30℃ (例如,约16℃至约24℃、约16℃至约20℃、约16℃至约18℃、约20℃至约30℃、约20℃ 至约26℃、约20℃至约24℃、约20℃至约22℃、约23℃至约27℃、约24℃至约30℃、约 24℃至约28℃、约24℃至约26℃、约26℃至约30℃、约26℃至约28℃或约28℃至约30℃,或约16℃、约18℃、约20℃、约22℃、约24℃、约26℃、约28℃或约30℃)的温度下, 在约20μL至约500μL的体积(例如,约20μL至约400μL、约20μL至约300μL、约20μL至 约250μL,约20μL至约200μL、约20μL至约100μL、约20μL至约50μL、约50μL至约500μL、 约50μL至约250μL、约50μL至约100μL、约100μL至约500μL、约100μL至约400μL、约 100μL至约300μL、约100μL至约250μL、约100μL至约200μL、约100μL至约150μL、约 150μL至约500μL,约150μL至约300μL、约150μL至约200μL、约200μL至约500μL,约 200μL至约400μL、约200μL至约250μL、约250μL至约500μL、约300μL至约500μL、约 300μL至约400μL、约400μL至约500μL、约25μL、约50μL、约100μL、约150μL、约200μL、 约250μL、约300μL、约350μL、约400μL、约450μL)中,清洗约1分钟至约10小时(例 如,约1分钟至约6小时、约1分钟至约4小时、约1分钟至约2小时、约1分钟至约1小 时、约1分钟至约45分钟、约1分钟至约30分钟、约1分钟至约25分钟,约1分钟至约 20分钟、约1分钟至约15分钟、约1分钟至约10分钟、约1分钟至约5分钟、约5分钟至 约10小时、约5分钟分钟至约5小时、约5分钟至约2小时、约5分钟至约1小时、约5分 钟至约45分钟、约5分钟至约40分钟、约5分钟至约30分钟、约5分钟至约5分钟25分 钟、约5分钟至约20分钟、约5分钟至约15分钟、约5分钟至约10分钟、约15分钟至约10小时、约15分钟至约8小时、约15分钟至约6小时、约15分钟至约4小时、约15分钟 至约2小时、约15分钟至约1小时、约15分钟至约45分钟、约15分钟至约30分钟、约 15分钟至约25分钟、约15分钟至约20分钟、约30分钟至约10小时、约30分钟至约4小 时、约30分钟至约2小时、约30分钟至约1小时、约30分钟至约45分钟、约45分钟至约 10小时、约45分钟至约6小时、约45分钟至约4小时、约45分钟至约1小时、约1小时 至约10小时、约1小时至约8小时、约1小时至约6小时、约1小时至约5小时、约1小时 至约4小时,约1小时至约2小时、约2小时至约10小时、约2小时至约8小时、约2小时至约6小时、约2小时至约4小时、约4小时至约10小时、约4小时至约8小时、约4小时 至约6小时、约5小时至约10小时、约5小时至约6小时,或约6小时至约10小时。
在一些实施例中、珠清洗缓冲液包含约1M至约10M的氯化钠(NaCl)(例如,约1M 至约8M、约1M至约6M、约1M至约5M、约1M至约4M、约1M至约3M、约1M至约 2M、约2M至约10M、约2M至约8M、约2M至约6M、约2M至约5M、约2M至约4M、 约4M至约10M、约4M至约8M、约4M至约6M、约4M至约5M、约5M至约10M、约 6M至约8M、约8M至约10M,或约1M、约2M、约3M、约4M、约5M、约6M、约7M、 约8M、约9M、约10M)、约0.5M至约5M的Tris-Cl(pH8.0)(例如,约0.5M至约4.0M、 约0.5M至约3.0M、约0.5M至约2.5M、约0.5M至约2.0M、约0.5M至约1.0M、约1.0M、 至约5.0M、约1.0M至约4.0M、约1.0M至约2.5M、约1.0M至约2.0M、约1.5M至约5.0M、 约1.5M至约4.0M、约1.5M约3.0M、约1.5M至约2.5M、约1.5M至约2.0M、约2.0M至 约5.0M、约2.0M至约4.0M、约2.0M至约3.0、约M至约约5.0M、约3.0M至约5.0M、约 4.0M至约5.0M、约1.0M、约1.5M、约2.0M、约2.5M、约3.0M、约3.5M、约4.0M、约M 或约5.0M),和约0.1M至约1.0M的EDTA(例如、约0.1M至约0.5M、约0.1M至约0.2M、 约0.2M至约1.0M、约0.2M至约0.5M、约0.4M至约0.8M、约0.4M至约0.6M、约0.4M 至约0.5M、约0.5M至约1.0M、约0.1M、约0.2M、约0.4M、约0.5M、约0.6M、约0.8M 或约1.0M)。
在本说明书所述任何方法的一些实施例中,所述至少一个清洗步骤包括使用低严格性缓 冲液(例如,本说明书所述的任何示例性低严格性缓冲液)和高严格性缓冲液(例如,本说 明书所述的任何示例性高严格性缓冲液)。在一些实施例中、所述至少一个清洗步骤包括使 用低严格性缓冲液(例如,本说明书所述的任何示例性低严格性缓冲液)在约16℃至约30℃ 的温度下(例如,约16℃至约24℃、约16℃至约20℃、约16℃至约18℃、约18℃至约30℃、 约18℃至约24℃、约18℃至约20℃、约20℃至约30℃、约20℃至约24℃、约20℃至约22℃、 约23℃至约27℃、约24℃至约30℃、约24℃至约28℃、约24℃至约26℃、约26℃至约30℃、 约26℃至约28℃或约28℃至约30℃,或约16℃、约18℃、约20℃、约22℃、约24℃、约 26℃、约28℃或约30℃)清洗约1分钟至约10小时(例如,约1分钟至约6小时、约1分钟至约4小时、约1分钟至约2小时、约1分钟至约1小时、约1分钟至约45分钟约1分钟 至约30分钟、约1分钟至约25分钟、约1分钟至约20分钟、约1分钟至约15分钟、约1 分钟至约10分钟、约1分钟至约5分钟约5分钟至约10小时、约5分钟至约5小时、约5 分钟至约2小时、约5分钟至约1小时、约5分钟至约45分钟、约5分钟至约40分钟、约 5分钟至约30分钟、约5分钟至约25分钟、约5分钟至约20分钟、约5分钟至约15分钟、 约5分钟至约10分钟、约15分钟至约10小时、约15分钟至约8小时、约15分钟至约6小 时、约15分钟至约4小时、约15分钟至约2小时、约15分钟至约1小时、约15分钟至约 45分钟、约15分钟至约30分钟、约15分钟至约25分钟、约15分钟至约20分钟、约30 英里静止约10小时、约30分钟至约4小时、约30分钟至约2小时、约30分钟至约1小时、 约30分钟至约45分钟、约45分钟至约10小时、约45分钟至约约6小时、约45分钟至约 4小时、约45分钟至约1小时、约1小时至约10小时、约1小时至约8小时、约1小时至 约6小时、约1小时至约5小时小时、约1小时至约4小时、约1小时至约2小时、约2小时至约10小时、约2小时至约8小时、约2小时至约6小时、约2小时至约4小时、约4小 时至约10小时、约4小时至约8小时、约4小时至约6小时、约5小时至约10小时、约5 小时至约6小时,或约6小时至约10小时)。
在一些实施例中,低严格性缓冲液包括缓冲溶液(例如,缓冲盐水溶液)和任选的去污 剂。在一些实施例中,低严格性缓冲液包括盐水柠檬酸钠(SSC)缓冲液;任选地,还包括 去污剂(例如,十二烷基硫酸钠(SDS))。在一些实施例中,低严格性缓冲液包含约0.5X至约2.5XSSC(例如,约0.5X至约2.0X、约0.5X至约1,5X、约1.0X至约2.5X、约1.0X至 约2.0X,或约1.5X至约2.0X),和约0%至约0.15%SDS(例如,约0%至约0.12%、约0% 至约0.10%、约0%至约0.08%、约0%至约0.06%、约0%至约0.04%、约0%至约0.02%、 约0.01%至约0.10%、约0.01%至约0.06%、约0.02%至约0.10%、约0.04%至约0.10%、 约0.04%至约0.08%、约0.04%至约0.06%、约0.06%至约0.10%、约0.06%至约0.08%或约0.08%至约0.10%,或0%、约0.1%、约0.2%、约0.3%、约0.4%、约0.5%、约0.6%、 约0.7%、约0.8%、约0.9%、约0.10%、约0.11%、约0.12%、约0.13%、约0.14%或约0.15%)。
在一些实施例中,低严格性缓冲液包括约1XSSC和约0.1%SDS。
在本说明书所述任何方法的一些实施例中,所述至少一个清洗步骤包括使用高严格性缓 冲液(例如,本说明书所述的任何示例性高严格性缓冲液)在约45℃至约75℃的温度下(例 如,约45℃至约70℃、约45℃至约60℃、约45℃至约50℃、约50℃至约60℃、50℃至约 55℃、54℃至约60℃、54℃至约58℃、约60℃至约65℃、约60℃至约64℃、60℃至约62℃、约62℃至约65℃、约62℃至约64℃、约50℃、约52℃、约54℃、约56℃、约58℃、约60℃、 约62℃、约64℃)清洗约1分钟至约10小时(例如,约1分钟至约6小时、约1分钟至约 4小时、约1分钟至约2小时、约1分钟至约1小时、约1分钟至约45分钟、约1分钟至约 30分钟、约1分钟至约25分钟、约1分钟约20分钟、约1分钟至约15分钟、约1分钟至 约10分钟、约1分钟至约5分钟、约5分钟至约10小时、约5分钟至约5小时、约5分钟 至约约2小时、约5分钟至约1小时、约5分钟至约45分钟、约5分钟至约30分钟、约5 分钟至约25分钟、约5分钟至约20分钟、约5分钟至约15分钟分钟、约5分钟至约10分 钟、约15分钟至约10小时、约15分钟至约8小时、约15分钟至约6小时、约15分钟至约 4小时、约15分钟至约2小时、约15分钟至约1小时、约15分钟至约45分钟、约15分钟 至约30分钟、约15分钟至约25分钟、约15分钟至约20分钟、约30分钟至约10小时、约 30分钟至约4小时、约30分钟至约2小时、约30分钟至约1小时、约30小时分钟至约45 分钟、约45分钟至约10小时、约45分钟至约6小时、约45分钟至约4小时、约45分钟至约1小时、约1小时至约10小时、约1小时至约约8小时、约1小时至约6小时、约1小时 至约5小时、约1小时至约4小时、约1小时至约2小时、约2小时至约10小时、约2小时 至约8小时小时、约2小时至约6小时、约2小时至约4小时、约4小时至约10小时、约4 小时至约8小时、约4小时至约6小时、约5小时至约10小时、约5小时至约6小时,或约 6小时至约10小时)。
在一些实施例中、高严格性缓冲液包含约0.1X至约0.5XSSC(例如,约0.10X至约0.40X、 约0.10X至约0.30X、约0.10X至约0.20X、约0.15X至约0.35X、约0.20X至约0.5X、约0.20X 至约0.40X、约0.20X至约0.30X、约0.5X至约0.25X、约0.30X至约0.50X、约0.30X至约0.40X、约0.40X至约0.5X、约0.45X至约0.50X,或约0.10X、约0.15X、约0.20X、约0.25X、 约0.30X、约0.35X、约0.40X、约0.45X或约0.50XSSC);任选地,还包括去污剂(例如, SDS)。
在一些实施例中,高严格性缓冲液还包含约0%至约0.15%SDS(例如,约0%至约0.14%、 约0%至约0.12%、约0%至约0.10%、约0%至约0.08%、约0%至约0.06%、约0%至约 0.04%、约0%至约0.02%、约0.01%至约0.10%、约0.01%至约0.08%、约0.01%至约0.06%、 约0.01%至约0.04%、约0.01%至约0.02%、约0.02%至约0.10%、约0.02%至约0.08%、 约0.02%至约0.06%、约0.02%至约0.04%、约0.04%至约0.10%、约0.04%至约0.08%、 约0.04%至约0.06%、约0.06%至约0.10%、约0.06%至约0.08%或约0.08%至约0.10%, 或0%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、0.10%、0.11%、 0.12%、0.13%、0.14%或0.15%SDS)。
(九)分离步骤
在本说明书提供的任何方法的一些实施例中,所述方法包括分离步骤。在一些实施例中, 可使用磁珠、色谱树脂(例如,琼脂糖珠)、膜、固体、传感器或具有共价连接部分的芯片, 来分离杂交产物,所述共价连接部分可特异性结合与探针共价连接的标签(例如,本说明书 所述的任何标签和/或探针)。用于进行分离步骤的其他示例性方法在本领域中是已知的。
(十)一个或多个附加步骤
在本说明书提供的任何方法的一些实施例中,可在捕获步骤之前和/或之后进行一个或多 个附加步骤(如图1所示)。
在一些实施例中,在捕获步骤之前进行的一个或多个(例如,两个、三个、四个或五个) 附加步骤包括:使DNA片段化(例如,使哺乳动物基因组DNA片段化)、进行末端修复、 dA拖尾、连接衔接子,和/或进行PCR扩增。在一些实施例中,在捕获步骤之前进行的一个 或多个附加步骤包括:使DNA片段化(例如,使哺乳动物基因组DNA片段化)、进行末端 修复、dA拖尾、连接衔接子,和进行PCR扩增。可使用法式压榨、限制酶消化、DNA剪切 (例如,声学剪切、流体动力学剪切(例如,点沉剪切或针剪切))、雾化、微波辐射或超 声处理,来进行DNA片段化。例如,参见Knierim等(2011)PLoS One 6(11):e28240; Yang和Hang(2013)《生物分子技术杂志》24(2):98-103;和Sapojnikova等(2017) 《生物技术杂志》256:1-5。各种市售试剂盒可用于进行末端修复和dA拖尾。在DNA片段 化后,进行末端修复,以产生平端5'和3'DNA片段。在一些实施例中,使用Klenow DNA聚 合酶、T4DNA聚合酶和/或T4多核苷酸激酶(T4PNK)进行末端修复,dA拖尾可在钝DNA 片段的3'末端掺入一个或多个非模板化的脱氧腺苷一磷酸(dAMP);可进行dA拖尾来防止 形成多联体。在一些实施例中,使用缺乏5'至3'外切核酸酶活性且缺乏3'至5'核酸外切酶活 性的Klenow酶进行dA拖尾。衔接子连接包括将化学合成的短单链或双链寡核苷酸(即,衔 接子)连接到核酸的一端或两端。例如,参见Tsoktouridis等(2005)《生物技术》38(6): 885-888;Aigrain等(2016)《BMC基因组学》17(1):1;和Raine等(2017)《核酸研 究》45(6):e36。聚合酶链式反应(PCR)可由本领域技术人员按常规进行。可用于进行 PCR的各种方法和试剂盒是本领域已知的。
在一些实施例中,在捕获步骤之后进行的一个或多个附加步骤包括:进行qPCR定量、 清洗测序仪器(例如,)、对核酸库进行汇集和变性,和/或运行测序仪器(例如,)。在一些实施例中,在捕获后进行的一个或多个附加步骤包括:进行qPCR定量、 清洗MiSeq、对核酸库进行汇集和变性,和/或运行MiSeq。PCR(qPCR)的相对定量是指通 过监测qPCR扩增曲线来确定最初存在的靶寡核苷酸序列的量。为Illumina台式测序 仪器。用于进行qPCR和使用测序仪器(例如,MiSeq)的各种方法和试剂盒是本领域已知的。 例如,参见,Bustin等(2009)《临床化学》55:611-622;Karlen等(2007)《BMC生物信 息学》8:131;Ruijter等(2013)《方法》59:32-46;和Quail等(2012)BMC《基因组学》 13:341。
在一些实施例中,在捕获步骤之前进行的一个或多个附加步骤包括:使基因组DNA片 段化、进行末端修复和dA拖尾、连接衔接子,和/或进行PCR扩增;在捕获步骤之后执行的一个或多个附加步骤包括:执行qPCR定量、清洗测序仪器(例如,)、对库进行汇 集和变性,和/或运行测序仪器(例如,)。
在一些实施例中,在捕获步骤之前进行的一个或多个附加步骤是使基因组DNA片段化、 进行末端修复和dA拖尾、接衔接子,和进行PCR扩增;在捕获步骤之后进行的一个或多个 附加步骤是进行qPCR定量、清洗测序仪器(例如,)、对库进行汇集和变性,和运 行测序仪器(例如,)。
(十一)标签和结合部分
在本说明书所述的任何方法的一些实施例中,探针还可包括标签。在一些实施例中,标 签是内部标签(即,标签位于探针的整个长度内)。在一些实施例中,标签位于探针的5'末 端。在一些实施例中,标签位于探针的3'末端。
在一些实施例中,标签是生物素或其变体。在一些实施例中,标签是链霉抗生物素蛋白 或其变体。在本说明书所述任何方法的一些实施例中,标签和特异性结合标签的部分可互换。 例如,标签可为生物素或其衍生物,且特异性结合标签的部分为抗生物素蛋白或其衍生物。 在其他示例中,标签可为抗生物素蛋白或其衍生物,且特异性结合标签的部分为生物素。标 签和相应结合部分的其他示例是本领域公知的。
可与本说明书提供的标签进行标签特异性结合的标签和部分可以结合,解离平衡常数 (Kd)小于1×10-7M、小于1×10-8M、小于1×10-9M、小于1×10-10M、小于1×10-11M、 小于1×10-12M、小于1×10-13M、小于1×10-14M、小于1×10-15M或小于1×10-16M;在一些 实施例中,可与本说明书提供的标签进行标签结合的标签和部分可以结合,Kd约1×10-4M至 约1×10-6M、约1×10-5M至约1×10-7M、约1×10-6M至约1×10-8M、约1×10-7M至约1× 10-9M、约1×10-8M至约1×10-10M、约1×10-9M至约1×10-11M、约1×10-9M至约1×10-12M、 约1×10-9M至约1×10-13M、约1×10-9M至约1×10-14M、约1×10-9M至约1×10-15M、约1 ×10-10M至约1×10-15M、约1×10-10M至约1×10-14M、约1×10-10M至约1×10-13M、约1×10-13M至约1×10-15M,或约1×10-14M至约1×10-15M;在一些实施例中,可与本说明书提供 的标签进行标签特异性结合的标签和部分可以结合,Kd约1.1nM至约500nM,或约2.0nM至 约6.7nM。
在本说明书所述任何方法的一些实施例中,与标签结合的部分可共价连接珠(例如,磁 珠、色谱树脂(例如,琼脂糖珠)或聚合物珠)、颗粒(例如,微粒或纳米颗粒)。在本说明书所述任何方法的一些实施例中,特异性结合标签的部分可共价连接珠。在一些实施例中, 珠为磁珠。
(十二)组合物
本说明书还提供了包含液体的组合物,其中所述液体包含:约0.5M至约8.0M(或本说 明书所述范围的任何子范围)TMAC;约10mM至约200mM(或本说明书所述范围的任何子范围)Tris(pH8.0);约1至约5X(或本说明书所述范围的任何子范围)Denhardt’s溶液; 约0.01%至约0.2%(或本说明书所述范围的任何子范围)吐温20;约0.5mM至约15mM(或 本说明书所述的该范围的任何子范围)EDTA;和约0.5%至约25%(或本说明书所述范围的 任何子范围)甲酰胺(v/v)。
在上述组合物的一些实施例中,液体包括约2.7M的TMAC、约50mM的Tris(pH8.0)、约2.5XDenhardt’s溶液、约0.010%吐温20、约6mM的EDTA和约20%甲酰胺。
在本说明书所述任何组合物的一些实施例中,组合物由液体组成。
(十三)套件
本说明书还提供了包含一种或多种(例如,至少2、3、4、5、6、7、8、9、10、12、14、 16、18、20)任何探针和缓冲液的试剂盒(例如,本说明书所述的杂交缓冲液、低严格性缓 冲液和高严格性缓冲液中的一种、两种或三种)。本说明书还提供了包含本文所述任何组合 物的试剂盒。在一些实施例中,试剂盒可包括实施本说明书所述任何方法的说明书。
在一些实施例中,试剂盒可包含至少两种引物(例如,至少4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48或50),用于扩增靶 寡核苷酸序列(例如,核酸库(例如,本文所述的任何库)内的靶寡核苷酸序列)。在一些 实施例中,试剂盒可包含两组或多组引物,其中一组包括正向引物和反向引物(例如,3、4、 5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、 27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、 47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、 67、68、69、70、71、72、73、74、75、76、77、78、78、79、80、81、82、83、84、85、 86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、 121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、 137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、 153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、 169、170、171、172、173、174、175、176、177、178、178、179、180、181、182、183、 184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199或200对引物),用于扩增靶寡核苷酸序列(例如,核酸库(例如,本说明书所述的任何库) 内的靶寡核苷酸序列)。在一些实施例中,试剂盒可包含一组多重引物,其中一组包括正向 多重引物和反向多重引物。
在一些实施例中,试剂盒可包含探针,所述探针包含与靶寡核苷酸序列互补的序列,并 包括内部标签或5'或3'末端的标签。在一些实施例中,标签是荧光团、放射性同位素、酶、 生物素或链霉抗生物素蛋白。在一些实施例中,标签是链霉抗生物素蛋白或其变体。在一些 实施例中,所述试剂盒还可包括磁珠、色谱树脂(例如,琼脂糖珠)、膜、固体、传感器或 具有共价连接部分的芯片,所述共价连接部分可特异性结合与探针共价连接的标签(例如, 本文所述的任何标签和/或探针)。
(十四)示例
以下示例进一步描述了本发明,该些示例不限制权利要求中本发明的范围。
示例1:测定方法
本说明书提供的测定法将基因组DNA转化为Illumina测序就绪库,并对基因区域中的库进 行测序,所述基因区域具有对癌症风险具有大影响的变体。据报告,患者具有癌症风险的孟 德尔高渗透性变体。基因景观对遗传性癌症风险非常重要,随着基因景观的增长,开发用于 探索可携带突变的多个基因的方法变得越来越重要。例如,有乳腺癌家族史的个体可能存在 BRCA1和BRCA2以外的基因突变。为了更全面地了解患者的风险,已普遍使用多基因组对 基因组DNA进行测序[2,3];例如,与单独测试BRCA1和BRCA2相比,使用多基因组测试遗传 性乳腺癌和/或卵巢癌(HBOC),确定的遗传性癌症基因突变的个体数量可增加40%[4];多 基因组方法还可通过减少阴性结果后的后续测试(较小测试区域)并简化提供的测试组,来 减轻测试负担。
如表1所示设计基因组,分析与癌症易感性相关的基因和遗传变异,该分析是针对白细 胞DNA中可检测的种系变异。所述基因组是根据科学文献的系统性专家评审选出的,以确 定使受试者易患癌症的基因,关注已有强烈证据表明与癌症有关的基因。它不包含许多已证 明对癌症起推定作用的基因/变体,但尚未得到证实。
表1:包含在小组中的基因
样本制备可将基因组DNA转换为可用于序列的库,并使用DNA/RNA杂交选择富集所期 望的基因中的外显子库[5](如图1所示)。可使用Illumina公司的测序仪生成高覆盖率 序列数据,并使用自动分析管道调用变体。该过程的验证可利用公知的样本端对端处理,来 表征整个测定工作流程的灵敏度、特异性、准确性、精确度和其他指标。
CEPH谱系1463包含三代的17个样本。谱系是1000G和HapMap项目的一部分(www.1000genomes.org/about;hapmap.ncbi.nlm.nih.gov),NA12878通常用作参考样本,或 实验室的内对照。“铂基因组计划”对共17个样本进行了测序,并从“瓶中基因组联盟计划”(可 提供NA12878的数据)中生成了高质量的共识调用。
可使用19种独特的“金标”参考样本验证该测定,所述参考样本覆盖了38种不同的库制 备品。评估19个独特样本中分析灵敏度、特异性和准确性——每个样本预计有约100个单核 苷酸变体。在从DNA输入处理后,通过变体调用,将产生的数据与高质量参考调用进行比 较,以评估测定性能。其中两个样本在冻融10次后运行,以测量不适当样本处理造成的干扰。 此外,可重新运行灵敏度/特异性/准确度测试中的六个样本,以测量精确度。
所述测定利用血液中提取的基因组DNA(gDNA)作为输入。CellMax Life公司要求使 用类似于Life技术公司PureLink Genomic DNA试剂盒的柱试剂盒,对送到实验室进行处理 的gDNA进行提取;gDNA在血液中含量丰富,使用商业试剂盒提取的DNA(与家酿盐析程序相反)所产生的DNA不含污染物,不会影响长期储存。
1.基因组DNA测序库的制备
用Illumina公司的对基因组DNA进行测序,基因组DNA(最初是10kb以上的片段)须进行片段化(如图1所示)。酶片段酶(可从NEB购买)可用于片段化DNA。
与Covaris声学剪切等其他方法相比,所述方法需较少的样本处理。在孵育期间,可通过 片段酶随机切割DNA(双链切割)。孵育期和酶:DNA复制率均为片段化DNA最终大小分 布的主要决定因素。例如,孵育时间过长会导致DNA过度分裂。为了避免片段化DNA的大小分布具有巨大差异,可使用乙二胺四乙酸(EDTA)迅速终止切割反应;所有样本的DNA 输入量均设为标准值1.5pg。由于技术人员的处理差异,可能出现微小差异,可进行包括多尺寸选择的步骤,来减轻这种差异。
一旦进行了片段化,则准备DNA用于衔接子连接(如图2所示)。DNA片段含有5'和3'突端,所述突端可由T4和Taq DNA聚合酶平端化,且平端DNA可由T4PNK 3'磷酸化(所 有酶均来自NEB)。上述三个步骤可在同一管中进行。再将管从20℃加热至65℃,加入A 尾。NEB的快速连接酶,以及缓冲液和衔接子,可直接添加到末端修复/dA拖尾混合物中。 使用酶混合物进行末端修复和dA拖尾,可将连接试剂直接添加到先前的反应中,减少清洁 步骤,可减少样本损失和操作员处理造成的潜在污染。
清除衔接子连接的DNA,再使用KAPA的库扩增试剂盒进行PCR扩增(如图2所示)。选择KAPA的聚合酶的原因是保真度很高,GC偏差很小。用Qubit BR试剂盒测量清洁、扩 增库的浓度,并用安捷伦的生物分析仪1000芯片记录大小分布(如图1所示)。
2.靶区域的库富集
PCR扩增后可直接对扩增的库进行测序,但这样做会导致需对整个人类基因组进行测序 (~3Gigabases)。大多数数据将无法用于癌症风险评估,且测序到足够深度来调用变体的成 本会非常高。相反,使用Gnirke等人的RNA/DNA杂交选择方法,本文提供的库可富集与遗 传性癌症综合征具有已知关系的基因中的外显子。(Gnirke、Andreas等“用超长寡核苷酸进 行溶液杂交选择,用于大规模平行靶向测序”《自然生物技术》27.2(2009):182-189)。
通过在靶基因中平铺外显子来设计探针序列。每个探针具有固定长度,且由于GC偏差, 测序覆盖率低的区域中探针重叠会增加(如图5-8所示)。设计后,所有探针序列均附加了 共同的末端。将探针共同末端序列发送给商业提供者,以进行大规模平行DNA寡核苷酸合 成(AZCO生物技术公司)。随后对合成的寡核苷酸进行PCR扩增,以引入T7启动子。通过添加生物素UTP一整夜,进行体外转录。用Turbo DNAse清除RNA产物的DNA,并用柱 来纯化该反应。
将扩增库进行合并,并加入转录的饵剂用于杂交(如下所述,使用基于TMAC的杂交缓 冲液,并在约60℃至约70℃的温度下进行)、珠下拉和清洗(如下所述,低严格性清洗缓冲 液和/或高严格性清洗缓冲液)。杂交进行16小时后,将RNA饵剂(及其杂交的DNA库) 与链霉抗生物素蛋白珠结合(如图9所示)。然后,将珠在室温下用高盐缓冲液进行机械清 洗,再在高温下用低盐缓冲液进行多次高严格性清洗,以减少共富集的脱靶库分子的数量。 富集后,进行第二次PCR,以扩增富集库。
3.测序
富集后,可使用Illumina公司的对库进行测序;由于具有高准确性,可使用qPCR 定量;可运行预富集生物分析仪获得库大小估值,来对结果大小进行校正(如图4所示)。
在运行之前进行严格的漂白清洗,以防止逐次运行的读数堆叠;根据Illumina 公司的用户指南进行200次循环配对末端读取,对库进行测序。
每次序列运行中均包含运行对照,以确保运行的定量足以进行处理。运行对照 PhiX由Illumina公司提供,作为PhiX DNA的制备库。将PhiX的基因组序列硬编码到运行分析软件中,在25次循环后,识别和标记PhiX库分子中的任何读数。使用公知的序列, 从而软件可计算测序运行的实际平均错误率,用作序列质量的对照。根据Illumina 公司(使用PhiX对照,用于HiSeq测序运行,2016年6月11日下载)的建议,在处理过程 中,将PhiX加标1%;生物信息学管道是一条端到端的自动化管道,始于原始数据, 可产生变体调用,所述变体调用解释了变体对蛋白质功能的预期效果。在处理期间,强制执 行多个QC指标,确保样本未污染;数据具有足够的质量,能可信地调用变体。
对原始数据(基本调用文件)进行解复用,分离运行中汇集的不同库的 读数。对生成的Fastq文件(具有库分子生成序列的文件,以及相关的质量分数)进行过滤, 以删除质量较低或来自库衔接子的内容。使过滤的Fastq文件与参考基因组(hg19)对齐, 对质量进行再次过滤,并重新排列,以减少插入或缺失的假阳性。变量用Varscan调用并注 释,并根据GATK的最佳实践建议(2.3-9,GATK指南书版本),通过带有GATK的技术参数进行过滤。
对技术假阳性进行过滤之后,管道的三级分析部分对一般人群中频率的变异、变异对蛋 白质功能有明显影响的计算能力,以及其他临床实验室对ClinVar数据库中癌症综合征的任 何声明进行了注释。
4.测定质量对照
通过在每批处理中包括两个批次对照,来监测患者样本的端对端过程:一个具有已知致 病变体的阳性对照,以及该分析验证研究中的一个阴性对照。对阳性对照进行处理,如果样 本中未调用已知的致病变体,则该批次失效。阴性对照将进行类似的评分。将所有调用的变 体与已知变体进行比较(如验证报告中所述),如果灵敏度或特异性分别低于99.00%或 99.99%,则该批次失效。
在每个步骤中,监测不合格处理或试剂降解;也可在随后的步骤中鉴定。如果基因组DNA 的酶促片段化导致DNA过度或不足,则尺寸选择步骤中,应富集正确的尺寸(可能为少数), 产量QC失效。
和序列数据QC指标可监测足够的数据,来调用变体。虽然样本的测序执行了许 多步骤,但只有可报告范围内区域的最终覆盖率会影响最终结果。如果各步骤中的任一步骤 未达到最佳要求,则最终的覆盖率会受到影响。例如,如果由于过度集群而导致原始读取的 质量较低,则在管道对数据进行过滤之后,仅保留高质量数据,样本应不会使覆盖度量失效。
使用phiX作为测序质量的参考标准,而不依赖于的自我报错:如果发生潜在的 错误,且未报告较低的质量得分,则将触发PhiX错误率度量。
示例2:设计效率
可高可信度地调用变体的靶基因组区域。重要地,需确保变体调用仅在区域中执行,这 样可产生高质量的数据,上述数据始终符合QC标准。为了测量保留的靶集量,可定义设计 效率度量。
设计效率=(可报告范围碱基对/靶向碱基对)×100
GIAB联盟为NA12878报告了98个基因的外显子区域和高可信区域。可将GIAB高可信 区域(对于整个基因组)与靶区域的交叉,定义为可报告的范围。为了确定靶区域,可从与 遗传性癌症综合征已知关系的98个基因中选择外显子区域。然后,靶区域与GIAB高可信区 域相交,产生可报告范围。
可报告的测定范围包括跨越200,000碱基对靶区域的98个基因的外显子(如表1所示)。 可报告范围占靶区域的82%(设计率为82%)。由于靶区域几乎完全是基因列表的整个外显 子区域,因此可报告范围占基因列表中外显子区域的82%。设计率占靶地区的82%。
定义提供高可信变体调用的靶集区域的一种方法是:列举导致假阳性和漏报的问题区域 类型。问题区域及其影响的示例可包括:重复区域(导致作图和插入/缺失问题)和高GC区 域(导致杂交富集中的低覆盖率)。枚举了区域类型后,即可定义度量的“好”和“坏”,且可 规定截止值。然而,训练截止值通常主要基于启发式分析,原因是低质量区域中的参考数据 难以获得。
相比手动定义可能发生的错误情况,以及省略可能适合频谱“坏”端的区域,可报告区域 可定义为针对NA12878,通过GIAB联盟报告高质量数据的区域。该区域存在重复序列,可 能会导致假阳性。这说明了一般假设,即如果构成区域中GIAB数据集的多个高质量数据集 不能创建共识调用,则可能无法在该区域中使用一种技术进行高质量变体调用。应该注意, 不可能使用铂基因组数据作为测定参考范围的基础,原因是未使用多种不同的测序技术,且 在系谱限制的帮助下,仅使用一个管道调用一些高质量的变体。
示例3:分析灵敏度
分析灵敏度应定义为如果源材料中存在变体将受到调用的可能性[18]
分析灵敏度=(通过处理正确调用的变体/参考数据中所需的变体)×100
变量调用可由每个样本的自动化管道生成,但未对临床指标进行注释。从列出的来源中 提取参考SNV调用并进行过滤,以保留可报告范围内具有基因座的变体行。为了计算灵敏度, 可将参考数据中所需的变体与调用集进行比较。调用了18个样本中的变体,可正确识别100% 的所需变体;样本NA24143中遗漏了一个变体。分析验证中共19个样本的测量灵敏度计算 如下:
分析灵敏度=(1841正确调用的变体/1842所需变体)×100=99.95%。
与复杂的变体调用技术相反,变体调用的高灵敏度可通过高质量数据实现。原始数据(数 据未显示)显示了所需变体位置和假阳性之间的明显分离:假阳性的等位基因频率明显较低。 使用严格的质量过滤器和高序列覆盖率,从而高质量参考等位基因可消除个体错误。
示例4:分析特异性
不存在序列变异时,该测定无法检测到序列变异的概率[18]
分析特异性=(正确调用的参考等位基因/参考数据中所需的参考等位基因)×100
处理了八个样本。变量调用可由本文所述的用于每个样本的自动化管道产生,但未对临 床度量进行标注。从源中提取参考SNV调用并进行过滤,以保留可报告范围内具有基因座的 变体行。为了计算特异性,将通过处理而调用的变体与参考调用集进行比较。任何非所需的 调用变体可标记为假阳性。19个样本中的变体受到调用,无假阳性。分析验证中测量的共19 个样本的特异性计算如下:
分析特异性=(3898611正确的参考调用/3898611所需的参考调用)×100=100%。
示例5:准确度
测定中的核酸序列与参考序列之间的一致程度[18]
准确度=(正确变异调用的数量/变体调用的总数)×100
变量调用可由每个样本的自动化管道生成,但未对临床指标进行注释。从源中提取参考 SNV调用并进行过滤,以保留可报告范围内具有基因座的变体行。为了计算准确度,将通过 处理而调用的变体与参考调用集进行比较。任何非所需的调用变体可标记为假阳性,任何缺 失的调用均标记为假阴性。测量精确度大于99.99%。仅进行了一次不正确的调用(样本 NA24143中的假阴性)。
准确度=(3898611正确参考+1841正确变体)/3900453总变量和参考调用)×100=>99.99%
示例6:精确度
在规定条件下,可获得独立测试结果之间的一致性[18]。可通过测量再现性来确定测定的 精确度。
再现性=(条件协议中样本的调用数量/不同条件下样本的调用总数)×100
将分析验证运行中的十一个样本作为复品再次运行。每个复品的自动化管道均会产生变 体调用。对可报告范围内的SNV调用进行比较。为了将变体分类为重复之间的一致性,变体 调用需位于相同的基因座,且调用具有相同基因型的相同替代等位基因。(例如,对于可转 换为杂合“C”调用的“A”的参考纯合位置,两个样本均应调用变体“C”并将变体分类为杂合 子。)
所有6个复品样本(由不同技术人员在不同周进行处理)的再现性为100%:
再现性=(2258157调用协议/2258157总调用)×100=100%
上述计算显示了十一个样本的重复性,每个样本有205,287个位点。
为了更好地显示运行中变体调用之间的一致性或不一致性,本文绘制了每个复品所有变 体位置的接合性。一个代表性样本如下所示。任何不一致的调用均视为:框(运行1标记) 和×(运行2标记)未在Y轴上对齐。应该注意,为简明起见,图表未显示备用等位基因(A、 C、G或T调用)信息,但可在调用集之间比较备用等位基因。
示例7:干扰
干扰物质或条件对测定输入(gDNA)的影响。通过将样本冻融10次后测量再现性,来 确定模拟的gDNA处理的不良干扰效应。将样本运送到台湾,测试延迟装运时间,再将相同 的样本运回美国。在重复冻融后运行分析验证运行中的两个样本,以模拟由于质量控制(QC) 失败而须重新运行的样本。将分析验证运行中的六个样本用于运输测试,以确保从台湾运输 的DNA可用于本文提供的测定中。如示例6中的精密度测试所示,对变体进行调用和比较。 冻融后两种样本的再现性均为100%。
再现性(冻结/解冻)=(410574协议调用/410574总调用)×100=100%
再现性(装运)=(1231722协议调用/1231722总调用)×100=100%
上述计算显示了冻融和运输测试的可重复性。值得注意,每个样本在205,287个位点接 受询问。
示例8:平均测序覆盖率
测序深度太大会增加消费者的成本,而读数(reads)太少通常会导致假阴性,原因是许多 区域低于变体识别的覆盖率阈值。
本说明书中的平均靶覆盖率定义为:在靶集中所有位置的给定位置上进行基本调用的平 均读取数量。
平均靶覆盖率是有用的指标,可在常规处理中轻松监控QC(以及覆盖均匀度)。
尽管可使用变异等位基因的10个reads调用杂合SNV,但平均靶覆盖率须大得多,以确 保可调用>99%的靶位置。这种高平均覆盖率的要求是:测量的等位基因频率和靶区域中基础 覆盖深度的应有差异性。
六个样本的下采样分析表明,为了不人为地限制灵敏度,样本的平均靶覆盖率须大于 100X。通过六个样本(和570个变体调用),可查询大量基因组变体,用于变体调用(通过 代理:变体调用的足够覆盖率)。
示例9:协议
使DNA干燥,用于捕获
1.用于捕获的池库
2.准备3个池的DNA
a.准备DNA、阻断DNA和寡核苷酸MM,等分试样,以剥离PCR管
3.使库干燥,用于捕获
a.将阻断寡核苷酸添加到合并的库中
b.将每个合并的捕获物分成两个PCR条带管
c.在PCR机中的PCR管中干燥
i.PCR机,45℃下(不带加热盖)
ii.每管干燥至~2ul(每个捕获池中4μl)
iii.如果合并捕获的最终体积<4μl,则添加水来增加体积
准备内部缓冲区
1.准备基于TMAC的杂交缓冲液(2015年8月28日完成)
a.添加300pl的10%吐温20和700μl水,最终至3%
2.将甲酰胺加入杂交缓冲液至最终1.43X(杂合甲酰胺缓冲液)。
3.准备珠清洗缓冲液(2015年9月16日完成),1M的NaCl
4.准备低严格清洗缓冲液
5.准备高严格性清洗缓冲液(0.25XSSC)
混合选择
1.混合甲酰胺:
2.在杂交缓冲液+甲酰胺中,重悬阻断DNA和寡核苷酸
a.将6μl的1.43X杂合甲酰胺缓冲液加入4μl干燥的DNA中。
b.冲洗管,转移到另一管,冲洗管,转移16μl到PCR板
3.将IDT探针稀释至1X
a.在1.43X杂交缓冲液+甲酰胺中,将探针稀释至4X。
i.将2μl的10XA池加入18μl的1.43杂交缓冲液+甲酰胺中。
ii.将1μl的10XB池加入9μl的1.43杂交缓冲液+甲酰胺中。
b.结合1XA和B池
4.变性DNA
a.将DNA+BLK寡核苷酸置于混合缓冲液+甲酰胺中,放入聚合酶链反应(PCR)机(使用PCR板和条带帽)
b.启动PCR程序:
i.在95℃下变性10分钟
ii.冷却至65℃,打开盖子,在缓冲液中加入4μl的1X探针和多通道移液管(体 积设为5μl)
iii.吸取10次
iv.使用条形帽和胶片盖
c.在65℃下孵育16小时
i.使用加热盖子 珠结合和清洗
1.准备DynabeadsTMMyOneTM链霉抗生物素蛋白T1珠
a.用于一次捕获(根据需要扩大规模):
i.将50μl珠加入165μl的珠清洗缓冲液中,短暂搅拌
ii.用165μl珠清洗缓冲液洗3次,加入缓冲液后快速搅拌
iii.重悬于165μ珠清洗缓冲液中
2.将杂交产物与T1珠结合
a.用P-200吸移30μl珠
b.将珠分配到杂交反应中
c.将反应从PCR机转移到剩余的珠上
i.转移45-50μl进行反应,快速移液几次
ii.搅拌5秒钟
iii.在室温下孵育30分钟
iv.偶尔反转(15分钟1X或每10分钟2X)
d.用低严格性缓冲液(十二烷基硫酸钠(SDS))清洗
i.将珠重悬于165μl的LSB中,在室温下孵育15分钟
e.用基础的高严格性缓冲液(HSB)清洗(0.25XSSC,不含SDS)
i.将珠重新悬浮在165μl预热的HSB(55℃)中
ii.在加热块中搅拌,在55℃下温育10分钟(设为55℃)
iii.重复进行共4次清洗
iv.将珠重新悬浮在40μl水中
(十五)参考文献、来源
本说明书提及的所有出版物、专利申请、专利、序列、数据库条目和其他参考文献均通 过引用的方式整体并入本文。如果发生冲突,以本说明书(包括定义)为准。
[1]“Couch、Fergus J.和Barbara L.Weber“家族性早发性乳腺癌(BRCA1)基因的突变和 多态性”《人类突变8.1(1996):8-18》”。
[2]“Chong、Hansook Kim等“BRCAplus的验证和临床实施:高风险乳腺癌的全面诊断检 测”《PLoS One 9.5(2014):e97408》”。
[3]“Lincoln、Stephen E.等“对超过1000名患者的遗传性乳腺癌和卵巢癌基因的传统和多 基因组测试进行了系统比较”《分子诊断杂志》17.5(2015):533-544》”。
[4]“Desmond、Andrea等“多基因组测试对遗传性乳腺癌和卵巢癌风险评估的临床可行性” 《JAMA肿瘤学》1.7(2015):943-951”。
[5]Gnirke、Andreas等“用超长寡核苷酸进行溶液杂交选择,用于大规模平行靶向测序” 《自然生物技术》27.2(2009):182-189”。
[6]www.1000genomes.org/about
[7]hapmap.ncbi.nlm.nih.gov
[8]IlluminaPlatinumGenomes-user-guide.pdf
[9]www.personalgenomes.org
[10]Zook、Justin M.等“对7种人类基因组进行了广泛测序,以表征基准参考材料” 《bioRxiv》(2015):026468”。
[11]“Eberle、Michael A.等“通过对三代17人血统的测序进行基因遗传验证的540万人类 变异的参考数据集”《bioRxiv》(2016):055541”。
[12]“Zook、Justin M.等“整合人类序列数据集提供了基准SNP和indel基因型调用的资源” (2014年)”。
[13]www.horizondiscovery.com/reference-standards/q-seq-hdx/genome-in-a-bottle(2016年6 月10日摘取)。
[14]“Bronner、Iraad F.等“改进的Illumina测序方案”《人类遗传学现行协议》(2014): 18-2”。
[15]research.fhcrc.org/content/dam/stripe/hahn/methods/mol_biol/SPRIselect%20User%20Gui de.pdf
[16]“使用PhiX对照进行HiSeq测序运行,2016年6月11日下载”
[17]“2.3-9,《GATK指南书版本》”。
[18]“Gargis、Amy S.等“确保临床实验室实践中下一代测序的质量”《自然生物技术》30.11 (2012):1033-1036”。
[19]“Rehm、Heidi L.等“用于新一代测序的ACMG临床实验室标准”《医学遗传学》15.9 (2013):733-747》”。
[20]“Richards、Sue等“序列变异解读的标准与指南:美国医学遗传学与基因组学会、分子病 理学会联合推荐”《医学遗传学(2)》”。
综上所述,上述各实施例仅为本发明的较佳实施例而已,并不用以限定本发明的保护范 围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,皆应包含在本发 明的保护范围内。

Claims (15)

1.一种捕获包含靶寡核苷酸序列的核酸的方法,其特征在于,所述方法包括:
使核酸库与探针接触,所述核酸库包括一个包含靶寡核苷酸序列的核酸,所述探针包含与靶寡核苷酸序列互补的序列,其中所述接触在基于氯化四甲铵(TMAC)的缓冲液中,在60℃至70℃的温度下进行,所述接触使靶寡核苷酸序列和与靶寡核苷酸序列互补的序列杂交,从而产生杂交产品;和将所述杂交产物与所述核酸库中不包含靶寡核苷酸序列的核酸分离。
2.根据权利要求1所述的方法,其特征在于,所述杂交产物是RNA-DNA产物。
3.根据权利要求1或2所述的方法,其特征在于,所述基于TMAC的缓冲液包含0.5M至4.0M的TMAC。
4.根据权利要求3所述的方法,其特征在于,所述基于TMAC的缓冲液还包括以下中的一个或多个:
10mM至200mM的2-氨基-2-(羟甲基)丙烷-1,3-二醇(Tris);
1X至5X的邓哈特溶液(Denhardt’s solution);
0.01%至0.2%吐温20(Tween-20);
0.5mM至10mM亚乙二胺四乙酸(EDTA);
0.5%至25%(v/v)甲酰胺。
5.根据权利要求4所述的方法,其特征在于,所述基于TMAC的缓冲液包括:
40mM至60mM的2-氨基-2-(羟甲基)丙烷-1,3-二醇(Tris);
2X至3X的邓哈特溶液(Denhardt’s solution);
0.01%至0.05%吐温20;
0.5mM至7mM亚乙二胺四乙酸(EDTA);
0.5%至25%(v/v)甲酰胺。
6.根据权利要求5所述的方法,其特征在于,所述基于TMAC的缓冲液包括:
(i)2.7M的TMAC、50mM的Tris(pH8.0)、2.5X邓哈特溶液、0.010%吐温20、6mM的EDTA和20%甲酰胺;
(ii)5.4M的TMAC、100mM的Tris(pH8.0)、5X邓哈特溶液、0.02%吐温20和12mM的EDTA。
7.根据权利要求1所述的方法,其特征在于,所述探针包含位于所述探针的核酸序列内部或5'或3'末端的一标签。
8.根据权利要求1所述的方法,其特征在于,使用珠进行所述分离。
9.根据权利要求7所述的方法,其特征在于,使用包含可特异性结合所述标签的连结部分的珠进行所述分离。
10.根据权利要求1所述的方法,其特征在于,还包括在所述接触步骤和所述分离步骤之后的至少一个清洗步骤。
11.根据权利要求10所述的方法,其特征在于,所述至少一个清洗步骤包括使用低严格性缓冲液和高严格性缓冲液。
12.根据权利要求11所述的方法,其特征在于,所述低严格性缓冲液包含盐水-柠檬酸钠(SSC)缓冲液,并选择性地包含十二烷基硫酸钠(SDS)。
13.根据权利要求12所述的方法,其特征在于,所述低严格性缓冲液包含0.5X至2.5XSSC和0%至0.15%SDS。
14.根据权利要求11所述的方法,其特征在于,所述高严格性缓冲液包含0.1X至0.5XSSC,并选择性地包含一种清洗剂。
15.根据权利要求14所述的方法,其特征在于,所述高严格性缓冲液包含0%至0.15%SDS。
CN201910289102.2A 2018-04-12 2019-04-11 捕获包含靶寡核苷酸序列的核酸的方法及其用途 Pending CN110373449A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/952,011 2018-04-12
US15/952,011 US20190316195A1 (en) 2018-04-12 2018-04-12 Methods of capturing a nucleic acid including a target oligonucleotide sequence and uses thereof

Publications (1)

Publication Number Publication Date
CN110373449A true CN110373449A (zh) 2019-10-25

Family

ID=66105172

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910289102.2A Pending CN110373449A (zh) 2018-04-12 2019-04-11 捕获包含靶寡核苷酸序列的核酸的方法及其用途

Country Status (3)

Country Link
US (1) US20190316195A1 (zh)
EP (1) EP3553184A1 (zh)
CN (1) CN110373449A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060014192A1 (en) * 2000-09-06 2006-01-19 Hodge Timothy A Methods for genotype screening using magnetic particles
US20150218620A1 (en) * 2014-02-03 2015-08-06 Integrated Dna Technologies, Inc. Methods to capture and/or remove highly abundant rnas from a heterogenous rna sample
US20170159040A1 (en) * 2015-12-04 2017-06-08 Justin Lock High-efficiency hybrid capture compositions, and methods

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1990001564A1 (en) * 1988-08-09 1990-02-22 Microprobe Corporation Methods for multiple target analyses through nucleic acid hybridization
US6280946B2 (en) * 1998-08-07 2001-08-28 Boston Probes, Inc. PNA probes, probe sets, methods and kits pertaining to the universal detection of bacteria and eucarya
US6812341B1 (en) * 2001-05-11 2004-11-02 Ambion, Inc. High efficiency mRNA isolation methods and compositions
US20070178478A1 (en) * 2002-05-08 2007-08-02 Dhallan Ravinder S Methods for detection of genetic disorders
AU2007324273A1 (en) * 2006-11-22 2008-05-29 Commonwealth Scientific And Industrial Research Organisation Improved hybridisation of nucleic acids
US20100190167A1 (en) * 2007-02-14 2010-07-29 Genisphere Inc. Methods, Reagents and Kits for Detection of Nucleic Acid Molecules
WO2009099602A1 (en) * 2008-02-04 2009-08-13 Massachusetts Institute Of Technology Selection of nucleic acids by solution hybridization to oligonucleotide baits

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060014192A1 (en) * 2000-09-06 2006-01-19 Hodge Timothy A Methods for genotype screening using magnetic particles
US20150218620A1 (en) * 2014-02-03 2015-08-06 Integrated Dna Technologies, Inc. Methods to capture and/or remove highly abundant rnas from a heterogenous rna sample
US20170159040A1 (en) * 2015-12-04 2017-06-08 Justin Lock High-efficiency hybrid capture compositions, and methods

Also Published As

Publication number Publication date
US20190316195A1 (en) 2019-10-17
EP3553184A1 (en) 2019-10-16

Similar Documents

Publication Publication Date Title
Castel et al. Modified penetrance of coding variants by cis-regulatory variation contributes to disease risk
US11242569B2 (en) Methods to determine tumor gene copy number by analysis of cell-free DNA
Levy-Sakin et al. Genome maps across 26 human populations reveal population-specific patterns of structural variation
Gupta et al. Next generation sequencing and its applications
JP6227095B2 (ja) 遺伝的変異の非侵襲的評価のための方法およびプロセス
CN107849612B (zh) 比对和变体测序分析管线
JP7009518B2 (ja) 既知又は未知の遺伝子型の複数のコントリビューターからのdna混合物の分解及び定量化のための方法並びにシステム
KR20220142466A (ko) 융합 사건을 결정하기 위한 방법 및 시스템
Volozonoka et al. Whole genome amplification in preimplantation genetic testing in the era of massively parallel sequencing
JP2018509928A (ja) 環状化メイトペアライブラリーおよびショットガン配列決定を用いて、ゲノム変異を検出するための方法
David et al. Detecting Alu insertions from high-throughput sequencing data
JP2023523002A (ja) 染色体近接実験における構造的変異検出
JP2018533965A (ja) 遺伝子サンプルを識別且つ区別するためのシステムと方法
Kvikstad et al. A high throughput screen for active human transposable elements
CN110373456A (zh) 捕获包含靶寡核苷酸序列的核酸的方法及其用途
CN110373449A (zh) 捕获包含靶寡核苷酸序列的核酸的方法及其用途
CN113748467A (zh) 基于等位基因频率的功能丧失计算模型
Wang et al. Variant phasing and haplotypic expression from single-molecule long-read sequencing in maize
US20230235320A1 (en) Methods and compositions for analyzing nucleic acid
Borges Monroy Transposable Elements in Health and Disease
Duan et al. The Next Generation Sequencing and Applications in Clinical Research
Konnick et al. Existing and Emerging Molecular Technologies in Myeloid Neoplasms
Pala Sequence Variation Of Copy Number Variable Regions In The Human Genome
Lorente-Arencibia et al. Evaluating the genetic diagnostic power of exome sequencing: Identifying missing data
Wang et al. Differences of circular RNA expression profiles between monozygotic twins' blood, with the forensic application in bloodstain and saliva

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination