CN106574266A - 用于下一代测序的文库生成 - Google Patents

用于下一代测序的文库生成 Download PDF

Info

Publication number
CN106574266A
CN106574266A CN201580043577.3A CN201580043577A CN106574266A CN 106574266 A CN106574266 A CN 106574266A CN 201580043577 A CN201580043577 A CN 201580043577A CN 106574266 A CN106574266 A CN 106574266A
Authority
CN
China
Prior art keywords
less
nucleic acid
concentration
normalized
ngs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580043577.3A
Other languages
English (en)
Inventor
D.H.金
M.H.多马努斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Abbott Laboratories
Abbott Molecular Inc
Original Assignee
Abbott Laboratories
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Abbott Laboratories filed Critical Abbott Laboratories
Publication of CN106574266A publication Critical patent/CN106574266A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1003Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor
    • C12N15/1006Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor by means of a solid support carrier, e.g. particles, polymers
    • C12N15/1013Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor by means of a solid support carrier, e.g. particles, polymers by using magnetic beads
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Immunology (AREA)

Abstract

本发明提供了涉及下一代测序(NGS)的技术,并且具体地涉及但不局限于方法和组合物,其用于制备NGS文库,例如,制备用于NGS工作流程的NGS文库。

Description

用于下一代测序的文库生成
相关申请的交叉引用
本申请要求于2014年8月14日提交的美国临时专利申请序号62/037,327的优先权,其整体通过引用并入本文。
技术领域
本发明提供了涉及下一代测序(NGS)的技术,并且具体地涉及但不局限于方法和组合物,其用于制备NGS文库,例如,制备用于NGS工作流程的NGS文库。
背景技术
下一代测序平台一般需要作为输入的特定浓度的核酸文库,其将被载入至测序仪工作流程以用于克隆扩增。序列输出取决于初始浓度:载入过低浓度的NGS文库导致低测序仪输出,而载入过高浓度的NGS文库导致低质量序列、不可用的测序仪输出,或无测序仪输出。
已经设计了一些常规方案以用于DNA浓缩、大小筛选、纯化、以及对NGS的归一化。通常的归一化措施包括直接定量,例如,通过分光光度法、荧光测定法、定量PCR、或电泳,随后是计算期望的浓度并将样品稀释至归一化的浓度。其它常规方案包括试剂盒,其由LifeTechnologies、Illumina、Invitrogen、和Corning/AxyPrep出售,用于制备用于测序的扩增子文库。然而,这些方案涉及冗长的时间、关联多个手操(hands-on)步骤、以及常常仅适于特定的NGS平台。具体而言,Life Technologies Ion TorrentTM Ion AmpliseqTM文库制备方案包括在测序前的文库均衡步骤(例如,通过使用Ion Library EqualizerTM试剂盒)。此步骤需要在Ion Equalizer™引物的存在下,在7-循环的PCR期间进一步扩增NGS扩增子文库。此步骤增加了样品制备过程中的总时间和用户手操时间,并且,另外该方法对IonTorrent测序平台是特异的。此外,Illumina TruSeqTM Custom扩增子文库制备方案需要多个步骤以及用户的可观时间投入(例如,总共1小时20分钟的时间且有30分钟的手操时间)。在最终的NGS扩增子文库清理和大小筛选之后进行Illumina文库归一化过程,并且其对Illumina形式的TruseqTM扩增子文库是特异的。由Invitrogen在SequalPrepTM归一化产品中提供的技术纯化在100 bp至20 kbp的大小范围内的DNA,并且推荐输入至少250 ng的核酸产物。类似地,Corning/Axygen Biosciences AxyPrep MagTM Normalizer产品经相似配置以回收100 ng或更多的DNA。
需要多个移液步骤以及需要使用多个容器的方法有更大的机会引入误差。此外,时间和资源的花费与具有许多步骤的程序相关联。因此,需要新的技术来将核酸文库归一化以用于下一代测序,其简单、需要很少步骤、并且广泛适用于多个下一代测序平台。此外,需要归一化技术,其适用于具有少于100 ng量的产物的样品,例如从用于保持测序目标的覆盖一致性的低循环数扩增所产生的扩增子组。
发明内容
本文提供的技术通过减少在NGS测序仪工作流程载入之前对NGS文库进行定量或浓度归一化的需要,而简化了下一代测序工作流程。所述的技术提供了NGS工作流程,其与常规技术相比具有更少步骤、更少手操时间、和更少周转时间。所述技术通用于为NGS制备的任何文库。例如,在一些实施方案中,所述技术用于加工NGS扩增子组文库。所述方法的实施方案使用数量减少的管转移和移液步骤,并且具有与常规NGS扩增子方法相比减少的花费。具体而言,通过除去常规技术中在文库准备好用于测序仪工作流程之前进行的常规技术的一些步骤,如纯化、大小筛选、和直接定量(例如,通过光谱法、荧光测定法、定量PCR、和电泳),相对于常规技术减少了手操时间和样品周转时间。在一些实施方案中,NGS文库无需进一步的稀释、纯化、或定量即准备好用于NGS测序仪工作流程(例如,克隆扩增)载入。
因此,本文提供了技术的实施方案,其涉及用于将NGS文库的浓度归一化的方法,所述方法包括:将包含第一量的文库片段的下一代测序文库,与具有结合少于第一量文库片段的第二量的文库片段的能力的捕获底物混合,以提供捕获混合物,其包含未结合的文库片段和包含结合的文库片段的捕获底物;和从捕获底物洗脱结合的文库片段,以提供包含文库片段的浓度归一化的NGS文库。在一些实施方案中,所述方法还包括将文库片段结合至捕获底物。另外的实施方案包括以下步骤,例如,从捕获混合物去除未结合的文库片段,洗涤包含结合的文库片段的捕获底物,和/或将接头(adapter)连接至文库片段。所述技术不局限于使用的捕获底物的类型;例如,在一些实施方案中,所述捕获底物包含顺磁性微粒,其经官能化而具有羧基(COOH/COO)、胺基、金属离子、包封的羧基、硅石(SiOH)、二乙基氨基乙基、或者与核酸序列杂交的基团(例如,互补序列)。
所述技术可应用于提供浓度归一化的NGS文库,其具有给定量的文库片段。在一些实施方案中,第一量的文库片段(例如,在下一代测序文库中)与第二量的文库片段(例如,在浓度归一化的NGS文库中)的比例大于1000、大于100、或大于10。
所述技术提供了NGS文库的大小筛选;因而,在一些实施方案中方法包括通过调节缓冲成分(例如,盐(如,约0.005 M至约5 M的氯化钠(NaCl)、氯化锂(LiCl)、氯化钡(BaCl2)、氯化钾(KCl)、氯化钙(CaCl2)、氯化镁(MgCl2)、和氯化铯(CsCl);例如,约0.1 M至约0.5 M;约0.15 M至约0.4 M;或约2 M至约4 M),沉淀试剂,拥挤试剂(crowding reagent)(例如,5%至20%的PEG,例如,5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%的PEG;例如,5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%的PEG,其具有从约250至10,000;从约1000至约10,000;从约2500至约10,000;从约6000至约10,000;从约6000至约8000;从约7000至约9000;从约8000至约10,000的平均分子量),对NGS文库进行大小筛选;以及一些实施方案包括通过调节离子强度来对NGS文库进行大小筛选。
另外,所述技术可应用于提供用于载入至测序装置上的多元NGS文库(例如,包含两个或更多个归一化的NGS文库,其代表例如,两个或更多个对象、两个或更多个样品、两个或更多个患者、两个或更多个基因、两个或更多个测定等)。因而,所述技术提供了有效的方法,其用于提高通过测序(例如,NGS)进行的遗传和/或基因组分析的通量和效率。因此,在一些实施方案中,方法还包括组合两个或更多个浓度归一化的NGS文库,以提供多元的浓度归一化的NGS文库。
在一些实施方案中,所述方法还包括添加核酸沉淀试剂或拥挤试剂,例如,用以促进核酸(例如,文库片段)与捕获底物的结合。
所提供的方法一般适用于为NGS平台提供浓度归一化的NGS文库(或NGS文库的多元混合物)。具体实施方案有利于提供浓度归一化的NGS文库,其具有特定浓度或量的DNA或具有特定片段长度的DNA。一些实施方案可应用于具有特定浓度和/或量的DNA的输入NGS文库的浓度归一化。例如,一些实施方案提供了浓度归一化的NGS文库,其包含浓度低于1 nM、低于0.75 nM、低于0.55 nM、或低于0.25 nM的DNA。一些实施方案提供了浓度归一化的NGS文库,其包含含有超过100 bp的DNA。一些实施方案提供了浓度归一化的NGS文库,其包含少于200、少于150、少于100、少于50、少于25、少于10,和/或少于5个扩增子。一些实施方案可应用于将包含少于250 ng、少于200、少于150、或少于100 ng的DNA的下一代测序文库(例如,作为方法的输入)归一化。
所述技术在减少用于归一化的时间和/或手操时间和/或花费的方面提供了特定的优势。例如,在一些实施方案中,所述方法的步骤在单一容器(例如,样品管、单一孔等)中进行。进一步地,在一些实施方案中,所述技术不取决于使用任何特定序列(例如,所述技术不使用基于序列的捕获探针),并且所述技术不特异于任何特定的NGS平台。
一些实施方案提供了用于将NGS文库的浓度归一化的方法,所述方法由以下组成、包含以下、或基本上由以下组成:将包含第一量的文库片段的下一代测序文库,与具有结合少于第一量文库片段的第二量的文库片段的能力的捕获底物(例如,包含以羧基官能化的顺磁性微粒)混合,以提供捕获混合物,其包含未结合的文库片段和包含结合的文库片段的捕获底物。在一些实施方案中,随后的步骤包括从捕获底物洗脱结合的文库片段,以提供浓度归一化的NGS文库。在一些实施方案中,所述方法还包括在混合步骤之后且在洗脱步骤之前发生的步骤,例如:从捕获混合物去除未结合的文库片段;洗涤包含结合的文库片段的捕获底物;对NGS文库进行大小筛选(例如,通过调节缓冲成分和/或调节离子强度);和/或添加核酸沉淀试剂(例如,PEG)。在一些实施方案中,所述方法包括在洗脱步骤之后发生的步骤,例如将接头连接至文库片段和/或组合两个或更多个浓度归一化的NGS文库以提供多元的浓度归一化的NGS文库。
在特定的实施方案中,所述方法包括将包含第一量的文库片段的下一代测序文库,与具有结合少于第一量文库片段的第二量的文库片段的能力的捕获底物(例如,包含以羧基官能化的顺磁性微粒)混合,以提供捕获混合物,其包含未结合的文库片段和包含结合的文库片段的捕获底物,其中第一量的文库片段与第二量的文库片段的比例大于1000、大于100,或大于10;其中所述浓度归一化的NGS文库包含浓度低于1 nM、低于0.75 nM、低于0.55 nM、或低于0.25 nM的DNA;其中所述浓度归一化的NGS文库包含含有超过100bp的DNA;其中所述浓度归一化的NGS文库包含少于200、少于150、少于100、少于50、少于25、少于10、或少于5个文库片段;其中所述下一代测序文库包含低于250 ng、低于200、低于150、或低于100 ng的DNA;和/或其中所述方法的步骤在单一容器中进行。
在一些实施方案中,所述技术提供了用于将NGS文库的浓度归一化的方法,其中通过将包含第一量的文库片段的NGS文库,与具有结合少于第一量文库片段的第二量的文库片段的能力的捕获底物混合,以提供捕获混合物,其包含未结合的文库片段和包含结合的文库片段的捕获底物;和从捕获底物洗脱结合的文库片段,以提供浓度归一化的NGS文库,其中所述浓度归一化的NGS文库包含浓度低于1 nM、低于0.75 nM、低于0.55 nM、或低于0.25 nM的DNA;所述浓度归一化的NGS文库包含含有超过100bp的DNA;所述浓度归一化的NGS文库包含少于200、少于150、少于100、少于50、少于25、少于10、少于5个扩增子;和/或所述输入NGS文库包含低于250 ng、低于200、低于150、或低于100 ng的DNA。
所述技术的相关实施方案提供了用于对核酸进行测序的方法,包括如本文所述的用于文库生成的方法(例如,用于生成浓度归一化的NGS文库的方法),并且还包括将浓度归一化的NGS文库载入至下一代测序仪工作流程中。
此外,描述了涉及浓度归一化的NGS文库的实施方案,例如,通过本文所述方法所产生的。例如,在一些实施方案中,所述技术提供了包含浓度归一化的NGS文库的组合物,所述NGS文库包含一或多个文库片段,例如,包含感来自兴趣区域(例如,来自待测序的核酸序列靶标)的序列的文库片段。在一些实施方案中,所述文库片段连接至和/或包含用于测序的接头(例如,测序平台特异性的接头)。在一些实施方案中,所述技术提供了包含文库片段的组合物,所述文库片段具有超过75 bp或碱基、超过80 bp或碱基、超过85 bp或碱基、超过90 bp或碱基、超过95 bp或碱基、超过100 bp或碱基、超过105 bp或碱基、超过110 bp或碱基、超过115 bp或碱基、超过120 bp或碱基的长度;例如,在一些实施方案中,所述组合物不包含大约100 bp或碱基的或者更短的文库片段。
在一些实施方案中,所述组合物包含许多文库片段,其为少于500个文库片段、少于450个文库片段、少于400个文库片段、少于350个文库片段、少于300个文库片段、少于250个文库片段、少于200个文库片段、少于150个文库片段、少于100个文库片段、少于50个文库片段、少于25个文库片段,例如,在一些实施方案中,所述技术提供了包含1至150个文库片段的组合物。在一些实施方案中,所述技术提供了包含核酸的组合物(例如,NGS文库),所述核酸具有低于1 nM的浓度,例如,低于0.90 nM、低于0.80 nM、低于0.70 nM、低于0.60 nM、低于0.55 nM、低于0.50 nM、低于0.45 nM、低于0.40 nM、低于0.35 nM、低于0.30 nM、低于0.25 nM、低于0.20 nM、低于0.15 nM、或低于0.10 nM。
在一些实施方案中,所述技术涉及包含浓度归一化的NGS文库的组合物,所述NGS文库包含一或多个文库片段,例如,包含来自待测序核酸的感兴趣区域的序列的文库片段,并且所述组合物还包含捕获底物,例如,非特异性捕获底物,例如,包含硅石和/或官能团包被表面的磁性颗粒,例如,包含羧基(COOH/COO)的磁性颗粒。在一些实施方案中,所述磁性颗粒包含胺基、金属离子、包封的羧基、硅石(SiOH)、二乙基氨基乙基、或与核酸序列杂交的基团(例如,互补序列)。在一些实施方案中,所述技术涉及包含浓度归一化的NGS文库的组合物,所述NGS文库包含一或多个文库片段,例如,包含来自待测序核酸的感兴趣区域的序列的文库片段,并且所述组合物还包含捕获底物,例如,非特异性捕获底物,例如,包含官能团包被表面的磁性颗粒,例如,包含游离COO/COOH基团的磁性颗粒,并且所述组合物还包含缓冲剂,例如,一或多种核酸沉淀剂,例如,PEG,以及在一些实施方案中,盐(例如,NaCl),Tris-HCl,和/或柠檬酸盐。
在一些实施方案中,所述技术涉及包含浓度归一化的NGS文库的组合物,所述NGS文库包含一或多个文库片段,例如,包含来自待测序核酸的感兴趣区域的序列的文库片段,并且所述组合物还包含洗脱和/或稳定所述浓度归一化的NGS文库的核酸的缓冲剂,例如,缓冲盐溶液,例如,包含Tris-HCl、EDTA、和阳离子(例如,0.1 M至0.5 M)。
一些实施方案提供了组合物,其包含如本文所述(例如,其不包含长度小于100个碱基或bp的核酸)的归一化的NGS文库(例如,准备好用于载入NGS测序工作流程)、聚合酶、和核苷酸(例如,经标记的核苷酸),以提供例如测序反应混合物。例如,在一些实施方案中,所述技术涉及组合物,其包含文库片段浓度低于1 nM (例如,低于0.5 nM)和/或包含少于500个文库片段的NGS文库的文库片段(例如,包含一或多个接头)。一些实施方案提供了组合物,其包含归一化的NGS文库(其不包含稀释剂,例如,调节用于载入本文所述的NGS测序工作流程的浓度)、聚合酶、和核苷酸(例如,经标记的核苷酸)来提供例如测序反应混合物。例如,在一些实施方案中,所述技术涉及组合物,其包含文库片段浓度低于1 nM (例如,低于0.5 nM)和/或包含少于500个文库片段的NGS文库的文库片段(例如,包含一或多个接头),并且其不包含添加用于调节浓度的稀释剂。
一些实施方案提供了用于产生浓度归一化的NGS文库的试剂盒。例如,一些实施方案提供了捕获底物(例如,非特异性捕获底物,例如,包含硅石和/或游离的COO/COOH基团的磁性捕获底物),其具有结合低于250 ng和/或低于100 ng (例如,低于200 ng、低于150ng、低于100 ng、低于75 ng、低于50 ng、低于25 ng、和/或低于10 ng)的核酸的能力;和以下的一或多种:结合缓冲剂(例如,包含核酸沉淀试剂如多元醇(例如,PEG)和/或拥挤试剂(例如,PVP))、洗涤缓冲剂(例如,包含洗涤剂、盐如NaCl,和/或醇(例如,乙醇)),和/或洗脱缓冲剂。
一些实施方案提供了用于产生浓度归一化的NGS文库的试剂盒。例如,一些实施方案提供了捕获底物(例如,非特异性捕获底物,例如,包含羧基(COOH/COO)的捕获底物(例如,磁性颗粒)),其具有结合低于250 ng和/或低于100 ng (例如,低于200 ng、低于150ng、低于100 ng、低于75 ng、低于50 ng、低于25 ng、和/或低于10 ng)的核酸的能力;和以下的一或多种:结合缓冲剂(例如,包含核酸沉淀试剂如多元醇(例如,PEG)和/或拥挤试剂(例如,PVP)),洗涤缓冲剂(例如,包含洗涤剂,盐如NaCl,和/或醇(例如,乙醇)),和/或洗脱缓冲剂。在一些实施方案中,所述磁性颗粒包含胺基、金属离子、包封的羧基、硅石(SiOH)、二乙基氨基乙基、或与核酸序列杂交的基团(例如,互补序列)。
一些实施方案提供了用于对核酸进行测序的试剂盒(例如,在NGS测序平台上)。例如,一些实施方案提供了捕获底物(例如,非特异性捕获底物,例如,包含硅石和/或包含游离的COO/COOH基团的磁性捕获底物),其具有结合低于250 ng和/或低于100 ng (例如,低于200 ng、低于150 ng、低于100 ng、低于75 ng、低于50 ng、低于25 ng、和/或低于10 ng)的核酸的能力,和/或包含捕获底物的组合物,所述捕获底物具有结合低于250 ng和/或低于100 ng (例如,低于200 ng、低于150 ng、低于100 ng、低于75 ng、低于50 ng、低于25ng、和/或低于10 ng)的核酸的能力;以下的一或多种:结合缓冲剂(例如,包含核酸沉淀试剂如多元醇(例如,PEG)和/或拥挤试剂(例如,PVP)),洗涤缓冲剂(例如,包含洗涤剂,盐如NaCl,和/或醇(例如,乙醇)),和/或洗脱缓冲剂;聚合酶;接头寡核苷酸(在一些实施方案中,所述试剂盒还包含用于将接头连接至扩增子的连接酶);和/或核苷酸(例如,经标记的核苷酸)。
一些实施方案提供了用于产生浓度归一化的NGS文库的系统。系统实施方案的实例包括捕获底物(例如,非特异性捕获底物,例如,包含硅石和/或游离的COO/COOH基团的磁性捕获底物),其具有结合低于250 ng和/或低于100 ng (例如,低于200 ng、低于150ng、低于100 ng、低于75 ng、低于50 ng、低于25 ng、和/或低于10 ng)的核酸的能力;以下的一或多种:结合缓冲剂(例如,包含核酸沉淀试剂如多元醇(例如,PEG)和/或拥挤试剂(例如,PVP)),洗涤缓冲剂(例如,包含洗涤剂,盐如NaCl,和/或醇(例如,乙醇)),和/或洗脱缓冲剂;以及在一些实施方案中还包括,磁体。
一些实施方案提供了用于对核酸测序的系统。例如,一些实施方案包括捕获底物(例如,非特异性捕获底物,例如,包含硅石和/或游离的COO/COOH基团的磁性捕获底物),其具有结合低于250 ng和/或低于100 ng (例如,低于200 ng、低于150 ng、低于100 ng、低于75 ng、低于50 ng、低于25 ng、和/或低于10 ng)的核酸的能力;以下的一或多种:结合缓冲剂(例如,包含核酸沉淀试剂如多元醇(例如,PEG)和/或拥挤试剂(例如,PVP)),洗涤缓冲剂(例如,包含洗涤剂,盐如NaCl,和/或醇(例如,乙醇)),和/或洗脱缓冲剂;以及在一些实施方案中还包括,磁体、接头寡核苷酸(以及在一些实施方案中,连接酶)、聚合酶、核苷酸、测序装置、用于控制测序装置和/或用于收集和分析测序数据的计算机、以及用于给计算机和/或测序装置提供指令的计算机软件。一些实施方案还包括一或多个机器和/或自动化装置,以用于液体操控、样品操作、样品的移动和追踪等。例如,在一些实施方案中,自动化的机器(例如,执行软件提供的指令和/或连接至计算机)进行一或多个步骤,如:提供片段文库,将片段文库格式化用于下一代测序的 (例如,包含连接/附着接头),将格式化的片段文库与给定的回收限制类型和/或量的捕获底物(例如,羧基修饰的磁性珠)组合,相对于期望大小范围之外的文库片段,捕获底物优先结合至期望大小范围的文库片段(例如,通过使用促进期望大小范围的文库片段结合至捕获底物且不促进期望大小范围之外的文库片段结合至捕获底物的缓冲条件(例如,盐浓度和/或pH)),捕获结合的文库片段(例如,用磁体),去除过量的未结合文库片段,洗涤结合的文库片段,洗脱结合的文库片段,收集洗脱的文库片段,稀释洗脱的文库片段,和对洗脱的文库片段进行测序。
在一些实施方案中,通过将包含DNA扩增子文库的样品与溶液混合(例如,以1:2的比例)来同时进行DNA扩增子文库的同时的大小筛选、纯化、和浓度归一化,其中所述溶液包含PEG 8000 (例如,20%的PEG 8000)、NaCl (例如,0.5 M的NaCl)、和以羧基官能化的8-µm的磁性珠(例如,以5% w/v的珠/溶液);用60%的EtOH洗涤珠,和从珠洗脱DNA扩增子文库,来制备经过大小筛选的、纯化且浓度归一化的DNA扩增子文库,其准备好用于输入至NGS工作流程。在一些实施方案中,所述浓度归一化的DNA扩增子文库包含浓度为0.2 nM至0.3 nM的DNA。在一些实施方案中,所述浓度归一化的DNA扩增子文库包含超过大约100碱基对的DNA。
基于本文包含的教导额外的实施方案对相关领域的技术人员将是显而易见的。
附图说明
考虑下列附图,本技术的这些和其它特征、方面以及优点将变得更好理解:
图1是显示珠的量限制回收的DNA量的图。
图2是显示根据本文提供的技术的实施方案,在捕获/归一化之前(对每个样品是每对的左边的柱(散列填充))和在捕获/归一化之后(对每个样品是每对的右边的柱(实心填充)),基于NGS扩增子的文库的浓度的图。
图3是显示根据本文提供的技术的实施方案,在捕获/归一化之前和之后,基于NGS扩增子的文库的大小分布的图。
应理解的是图不一定按比例绘制,图中的物体也不一定按彼此关系成比例绘制。图为意在使本文所公开装置、系统和方法的各种实施方案清楚和得到理解的描绘。只要有可能,相同的参考数字将在整个附图中用于指相同或相似的部分。此外,应理解的是附图不意在以任何方式限制本教导的范围。
发明详述
本文提供的是涉及NGS的技术,并且具体地涉及但不局限于,用于制备准备好用于NGS工作流程的NGS文库的方法和组合物。在本文的技术说明中,本文所使用的节标题仅为组织目的而不应理解为以任何方式限制所描述的主题;为了解释目的,阐述了很多具体的细节以提供对所公开实施方案的透彻理解。然而,本领域技术人员会理解,这些各种实施方案可以在具有或不具有这些具体细节的情况下实施。在其它情况下,结构和装置以框图形式显示。此外,本领域技术人员可容易地理解,呈现和实施方法的具体顺序为说明性的并且预计顺序可进行改变但仍在本文所公开的各种实施方案的精神和范围内。
本申请中引用的所有文献和相似材料,包括但不限于,专利、专利申请、文章、书籍、论文和因特网网页,均通过引用以其整体清楚地通过引用并入本文以用于任何目的。除非另外定义,本文使用的所有技术和科学术语具有与本文所述各种实施方案所属领域的普通技术人员通常理解的相同的含义。当所援引文献中的术语定义看起来与本教导中提供的定义不同时,应以本教导中提供的定义为准。
定义
为了便于理解本技术,下文定义了许多术语和短语。额外的定义在整个详述中阐述。
除非上下文另有清楚指示,在整个说明书和权利要求中,下列术语采用本文明确相关的含义。如本文所使用的短语“在一个实施方案中”不一定指相同的实施方案,尽管其可能指相同的实施方案。此外,如本文所使用的短语“在另一个实施方案中”不一定指不同的实施方案,尽管其可能指不同的实施方案。因此,如下文所描述的,可容易地组合所述技术的各种实施方案,而不脱离所述技术的范围或精神。
另外,除非上下文另有清楚指示,如本文所使用的,术语“或”为包含性的“或”算符并且与术语“和/或”等同。除非上下文另有清楚指示,术语“基于”不是排他的并且允许基于未描述的额外因素。另外,在整个说明书中,“一个”、“一种”和“所述”的含义包括复数的引用对象。“在其中”的含义包括“在其中”和“在其上”。
如本文所使用的,“核酸”应意指任何核酸分子,包括,但不限于,DNA、RNA及其杂合体。形成核酸分子的核酸碱基可为碱基A、C、G、T和U,及其衍生物。这些碱基的衍生物为本领域所熟知。该术语应理解为包括,由核苷类似物制成的DNA或RNA的类似物,作为等同物。如本文所使用的该术语还包括cDNA,其为例如通过反转录酶的作用从RNA模板产生的互补或拷贝DNA。
如本文所使用的,“核酸测序数据”、“核酸测序信息”、“核酸序列”、“基因组序列”、“基因序列”、“片段序列”或“核酸测序读出”指任何信息或数据,其指示DNA或RNA分子(例如,全基因组、全转录子组、外显子组、寡核苷酸、多核苷酸、片段,等)内的核苷酸碱基(例如,腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶/尿嘧啶)的次序。
应理解本教导考虑使用所有可用的技术、平台或工艺种类获得的序列信息,包括,但不限于:毛细管电泳、微阵列、基于连接的系统、基于聚合酶的系统、基于杂交的系统、直接或间接核苷酸鉴定系统、焦磷酸测序、基于离子或pH的检测系统、基于电子签名的系统等。
对碱基、核苷酸或另一种分子的提及可为单数或复数。即,“碱基”可指,例如,溶液中的该碱基的单个分子,或多个该碱基。
“多核苷酸”、“核酸”或“寡核苷酸”指通过核苷间连接结合的核苷(包括脱氧核糖核苷、核糖核苷或其类似物)的线性聚合物。典型地,多核苷酸包含至少三个核苷。通常寡核苷酸大小范围从几个单体单元,例如3-4个,到几百个单体单元。每当多核苷酸例如寡核苷酸用字母序列,例如“ATGCCTG”表示时,其将理解为核苷酸为从左到右为5'至3'的次序,并且“A”指脱氧腺苷,“C”指脱氧胞苷、“G”指脱氧鸟苷和“T”指胸腺嘧啶,除非另外注明。如本领域中的标准,字母A、C、G和T可用于指碱基本身、核苷或包含碱基的核苷酸。
如本文所使用的,术语“靶核酸”或“靶核苷酸序列”指出于任何理由,本领域普通技术人员认为对其进行操作是所期望的任何核苷酸序列(例如,RNA或DNA)。在一些实施方案中,“靶核酸”指其核苷酸序列待测定或期望被测定的核苷酸序列。在一些实施方案中,术语“靶核苷酸序列”指产生与其部分或完全互补的引物或探针的序列。
如本文所使用的,“感兴趣的区域”指(例如,使用本文所述的组合物、系统或方法之一)分析的核酸。在一些实施方案中,感兴趣的区域为为基因组的或基因组DNA区域的一部分(例如,包含一个或多个染色体或一个或多个基因)。在一些实施方案中,分析从感兴趣的区域表达的mRNA。在一些实施方案中,感兴趣的区域是核酸的区域、基因座、部分等。
如本文所使用的,术语“对应于”或“对应的”针对连续核酸或核苷酸序列(例如,子序列)使用,所述连续核酸或核苷酸序列与全部或部分靶核酸序列互补并且因此与其“对应”。
如本文所使用的,短语“克隆的多个核酸”指为产生它们的模板核酸的完全或部分拷贝的核酸产物。这些产物彼此大体或完全或基本同一,并且其为合成它们的模板核酸链的互补拷贝,假定合成克隆核酸分子期间核苷酸错误掺入率为0%。
如本文所使用的,术语“文库”指多个核酸,例如,多个不同核酸。在一些实施方案中,“文库”是“文库组”或“扩增子文库组”。如本文所用,“扩增子文库组”是与以下相关的扩增子的集合:例如,疾病(例如,多基因病)、疾病进展、发育缺陷、体质病(例如,具有取决于遗传因素的病因的状态,例如,可遗传的(非肿瘤)异常或疾病)、代谢通路、药物基因组学特征、性状、生物体(例如,用于物种鉴别)、生物体的组、地理位置、器官、组织、样品、环境(例如,用于宏基因组学和/或核糖体RNA (例如核糖体小亚基(SSU)、核糖体大亚基(LSU)、5S、16S、18S、23S、28S、内转录序列(ITS) rRNA)的研究)、基因、染色体等。例如,癌症扩增子组可包含用于对与癌症相关的上百个、上千个、或更多个基因座、区域、基因、单核苷酸多态性、等位基因、标记物等进行测序的一组引物。在一些实施方案中,扩增子文库组提供了高度多元化的且靶向的重测序,例如,以检测与疾病相关的突变。在一些实施方案中,“文库”包含多个(例如,集合)“文库片段”;“文库片段”是核酸。在一些实施方案中,文库片段是通过将较大的核酸片段化来产生的,例如,物理的(例如,剪切)、酶的(例如,通过核酸酶)、和/或化学的处理。在一些实施方案中,文库片段是通过扩增产生的(例如,PCR),并因此是对应于和/或衍生自核酸(例如,待测序核酸)的扩增子。
如本文所使用的,核苷酸序列的“子序列”指该核苷酸序列内包含的任何核苷酸序列,包括具有单个碱基大小至比核苷酸序列短一个碱基的子序列的任何子序列。
短语“测序运行”指所进行的以测定与至少一个生物分子(例如,核酸分子)有关的一些信息的测序实验的任何步骤或部分。
如本文所使用的,短语“dNTP”意指脱氧核苷酸三磷酸,其中所述核苷酸包含核苷酸碱基,例如,A、T、C、G或U。
如本文所使用的术语“单体”意指可通过给定的聚合酶掺入生长的分子链内的任何化合物。这样的单体包括,但不限于,天然存在的核苷酸(例如,ATP、GTP、TTP、UTP、CTP、dATP、dGTP、dTTP、dUTP、dCTP、合成的类似物)、各核苷酸的前体、非天然存在的核苷酸及其前体或可通过给定的聚合酶掺入生长的聚合物链内的任何其它分子。
“聚合酶”为一般用于连接3'-OH 5'-三磷酸核苷酸、寡聚物及其类似物的酶。聚合酶包括,但不限于,DNA-依赖性DNA聚合酶、DNA-依赖性RNA聚合酶、RNA-依赖性DNA聚合酶、RNA-依赖性RNA聚合酶、T7 DNA聚合酶、T3 DNA聚合酶、T4 DNA聚合酶、T7 RNA聚合酶、T3RNA聚合酶、SP6 RNA聚合酶、DNA聚合酶1、Klenow片段、水生嗜热链球菌(Thermophilus aquaticus) (Taq) DNA聚合酶、嗜热栖热菌(Thermus thermophilus) (Tth) DNA聚合酶、Vent DNA聚合酶(New England Biolabs)、Deep Vent DNA聚合酶(New England Biolabs)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus) (Bst) DNA聚合酶、DNA聚合酶大片段、Stoeffel片段、9°N DNA聚合酶、9°Nm聚合酶、激烈火球菌(Pyrococcus furiosis)(Pfu) DNA聚合酶、丝状栖热菌(Thermus filiformis) (Tfl) DNA聚合酶、RepliPHI Phi29聚合酶、海滨嗜热球菌(Thermococcus litoralis) (Tli) DNA聚合酶、真核DNA聚合酶β、端粒酶、Therminator聚合酶(New England Biolabs)、KOD HiFi.DNA聚合酶(Novagen)、KOD1DNA聚合酶、Q-β复制酶、末端转移酶、AMV反转录酶、M-MLV反转录酶、Phi6反转录酶、HIV-1反转录酶、生物勘探和/或分子进化发现的新型聚合酶和美国专利申请公开号2007/0048748和美国专利号6,329,178、6,602,695和6,395,524中引用的聚合酶。这些聚合酶包括野生型、突变体同种型和经基因工程改造的变体例如exo聚合酶;具有最小的、不可检测的和/或降低的3'→5'校对外切核酸酶活性的聚合酶和其它突变体,例如耐受标记的核苷酸并将其掺入核酸链中的突变体。在一些实施方案中,聚合酶设计为用在,例如,实时PCR、高保真度PCR、下一代DNA测序、快速PCR、热启动PCR、粗样品PCR、稳健PCR和/或分子诊断中。这样的酶可从许多供应商,例如,Kapa Enzymes、Finnzymes、Promega、Invitrogen、LifeTechnologies、Thermo Scientific、Qiagen、Roche等获得。
术语“引物”是指当放置在诱导与核酸链互补的引物延伸产物合成的条件下(例如,在核苷酸和诱导剂例如DNA聚合酶的存在下以及在合适的温度和pH下)时,能够充当合成起始点的寡核苷酸,无论是在纯化的限制酶消化产物中天然存在的还是合成产生的。为了在扩增中达到最大效率,所述引物优选为单链的,但可备选地为双链的。若为双链,首先处理引物以分开其两条链,然后用于制备延伸产物。优选地,所述引物为寡脱氧核糖核苷酸。引物必须足够长以便在诱导剂存在下引发延伸产物合成。引物的确切长度将取决于多个因素,包括温度、引物来源和所使用的方法。
如本文所使用的,“系统”表示一套组件,真实的或抽象的,包括其中每个组件与整体内的至少一个其它组件相互作用或相关的整体。
如本文所用,术语“分离”是指所讨论的材料存在于这样的物理环境中,所述物理环境与所讨论的材料在自然中所存在的环境不同,和/或已经完全或部分地从其它的成分(例如其它的核酸分子)分开、分离、或纯化。
如本文所用,术语“固相载体”是具有或可向其添加可逆地结合至靶标种类的一或多个官能团的实体,例如,以提供“捕获底物”。固相载体在靶标种类可沉淀至(或可结合至)所述固相载体的条件下,基本上是不可溶的。适宜用于本技术的方法中的固相载体,具有充足的表面积以允许靶标种类有效结合至载体上的官能团,并且特征还在于具有能够可逆地结合靶标种类的表面。适宜的固相载体包括但不限于,微粒(例如,珠)、纤维、以及对靶标种类(如核酸)具有亲和性的支持物,并且其可以实现多种形状(其为规则或不规则的形式),且优选具有使固相表面积最大的形状,并且实现能适应微观尺度操作的载体。在一个实施方案中,所述固相载体是磁性微粒(例如,顺磁性(磁性响应的)微粒)。
如本文所用,“顺磁性微粒”是指对外部磁场有响应(例如,由稀土(例如钕)磁体产生)但在当磁场去除时消磁的微粒。因而,使用磁体有效地将顺磁性微粒从溶液中分离,而在没有磁诱导的聚集发生时能够容易地重悬。具体的顺磁性微粒包括聚合物壳包封的富含磁铁的核。在一个实施方案中,适宜的顺磁性微粒具有大约20-35%的磁铁/包封比。例如,具有大约23%、25%、28%、30%、32%、或34%的磁铁/包封比的磁性颗粒,适宜用于本技术。具有低于大约20%比例的磁性颗粒仅仅微弱地被吸引至用于实现磁性分离的磁体。取决于本技术的方法中所使用的混合物的性质,一些实施方案包括使用具有更高磁铁百分比的顺磁性微粒。使用经包封的顺磁性微粒(在表面上不具有暴露的铁、或Fe3O4),使铁干扰分离核酸的某些下游操作(例如,聚合酶功能)的可能性减少或最小化。
所述技术的方面
本文所述的技术提供了这样的NGS文库工作流程,其与常规技术相比,需要较少的步骤、较少的手操时间和周转时间、数量减少的管转移、移液步骤、以及减少的花费。本公开所述的方法与NGS平台无关,并且可用于涉及或不涉及测序的其它核酸分析技术。
方法
一些实施方案提供了用于制备准备好用于NGS工作流程的NGS文库的方法。一般而言,方法的实施方案包括捕获给定(例如,有限)量的NGS文库(例如,少于250 ng和/或少于100ng,例如,以提供低于1 nM的浓度,例如,低于0.1至0.5 nM、低于0.05 nM核酸),例如,在从核酸(例如,RNA或DNA)的感兴趣的区域生成文库片段之后,使用经修饰的(例如羧基修饰的)磁性珠,以及在一些实施方案中,使用测序平台特异性接头进行格式化。所述方法包括使用一定量和类型的捕获底物,其对捕获核酸具有已知的和给定的结合能力。将捕获底物添加至已知具有比捕获底物的结合能力更多的核酸的文库制备物(例如,片段文库或扩增子组)。由此,所述技术提供了对来自文库的给定量(少于文库中存在的核酸的总量)的核酸的捕获,因而提供了归一化的制备物,例如,用于NGS平台的具有已知量(例如,在已知范围内和/或在小的已知误差窗口内)的核酸的样品。
在所述方法的一些实施方案中,所述方法包括步骤如:提供NGS文库,将所述NGS文库格式化以用于下一代测序(例如,包含连接的接头),将经格式化的NGS文库与给定的回收局限类型和/或量的捕获底物(例如,羧基修饰的磁性珠)组合,相对于期望大小范围之外的文库片段,捕获底物优先结合至期望大小范围的文库片段(例如,超过100碱基或bp,例如,超过10碱基或且小于1000、2000、3000、4000、或5000碱基或bp) (例如,通过使用促进期望大小范围的文库片段结合至捕获底物且不促进期望大小范围之外的文库片段结合至捕获底物的缓冲条件(例如,盐浓度和/或pH)),捕获结合的文库片段(例如,使用磁体),去除过量的未结合文库片段,洗涤结合的文库片段,洗脱结合的文库片段,收集洗脱的文库片段,稀释洗脱的文库片段,和对洗脱的文库片段测序。
例如,在优选的实施方案中,所述技术涉及用于将NGS文库的浓度归一化的方法,所述方法由以下组成、包含以下、或基本上由以下组成:将包含第一量的文库片段的下一代测序文库,与具有结合少于第一量文库片段的第二量的文库片段的能力的捕获底物(例如,包含以羧基官能化的顺磁性微粒)混合,以提供捕获混合物,其包含未结合的文库片段和包含结合的文库片段的捕获底物。在一些实施方案中,随后的步骤包括从捕获底物洗脱结合的文库片段,以提供浓度归一化的NGS文库。在一些实施方案中,所述方法还包括在混合步骤之后且在洗脱步骤之前发生的步骤,如:从捕获混合物去除未结合的文库片段;洗涤包含结合的文库片段的捕获底物;对NGS文库进行大小筛选(例如,通过调节缓冲成分和/或调节离子强度);和/或添加核酸沉淀试剂(例如,PEG)。在一些实施方案中,所述方法包括在洗脱步骤之后发生的步骤,如将接头连接至文库片段和/或组合两个或更多个浓度归一化的NGS文库,以提供多元的浓度归一化的NGS文库。
在特定的实施方案中,所述方法包括,将包含第一量的文库片段的下一代测序文库,与具有结合少于第一量文库片段的第二量的文库片段的能力的捕获底物(例如,包含以羧基官能化的顺磁性微粒)混合,以提供捕获混合物,其包含未结合的文库片段和包含结合的文库片段的捕获底物,其中所述第一量的文库片段与第二量的文库片段的比例大于1000、大于100、或大于10;其中所述浓度归一化的NGS文库包含浓度低于1 nM、低于0.75nM、低于0.55 nM、或低于0.25 nM的DNA;其中所述浓度归一化的NGS文库包含含有超过100bp的DNA;其中所述浓度归一化的NGS文库包含少于200、少于150、少于100、少于50、少于25、少于10、或少于5个文库片段;其中所述下一代测序文库包含低于250 ng、低于200、低于150、或低于100 ng的DNA;和/或其中所述方法的步骤在单一容器中进行。
在一些实施方案中,对捕获底物(例如,表面修饰的磁性珠)的几何形状、包含捕获底物的颗粒的大小、和缓冲成分进行选择,以提供特异性地用于NGS文库生产的期望的归一化、文库纯化、和大小筛选。例如,可以增加或减小配方中表面修饰的磁性珠大小,来改变可用的表面积以实现期望的浓度归一化。所述珠用于结合核酸的能力与珠的表面积成比例。因而,随着珠直径的增加,表面积增加并且结合核酸的能力也增加。此外,珠的粗糙性与表面积相关,因而与具有相同直径的光滑珠相比,具有粗糙或起伏表面的珠具有更大的表面积和更大的结合核酸的能力。此外,珠的能力与每单位表面积的核酸结合基团的密度成比例。因而,随着每单位表面积的核酸结合基团数量的增加,珠的结合能力增加。选择用于所述技术的珠的结合能力可依经验确定,例如,通过对包含已知量核酸的一系列标准物的结合进行定量。
基于所产生且用作方法的输入的NGS文库类型的预期片段大小范围和预期文库片段产量范围,所述大小、表面修饰的类型、浓度、和缓冲成分在所述技术的实施方案之间变化以适宜于片段文库。
在一些实施方案中,所述捕获底物包含顺磁性微粒(例如,“磁性珠”)。在包括使用顺磁性微粒的实施方案中,优选使用磁性手段将顺磁性微粒从溶液中分离,如应用至少1000高斯的磁场。然而,本领域技术人员已知的其它方法可用于从上清中去除磁性微粒(例如,真空过滤或离心)。继而可以去除剩余的溶液,留下在其表面吸附有细胞核酸的固相载体。
在一些实施方案中,所述方法产生NGS文库,其立即准备好用于载入NGS测序仪工作流程而无需进一步稀释。在不需要额外稀释的方法的实施方案中,多个样品的多元测序仅需要在测序仪工作流程载入之前,组合由所述方法生产的相等体积的来自每种最终的、浓度归一化的、NGS文库样品。在一些实施方案中,所公开的方法产生浓度已经归一化的NGS文库,并且在载入NGS测序仪工作流程之前,通过单一的稀释从所述NGS文库产生准备好用于NGS工作流程的样品。
在一些实施方案中,所述方法提供包含低于1 nM浓度的DNA的NGS文库,例如,低于0.90 nM、低于0.80 nM、低于0.70 nM、低于0.60 nM、低于0.55 nM、低于0.50 nM、低于0.45nM、低于0.40 nM、低于0.35 nM、低于0.30 nM、低于0.25 nM、低于0.20 nM、低于0.15 nM、或低于0.10 nM。用于输入所述技术的实施方案的输入NGS文库包含低于100 nM、低于90 nM、低于80 nM、低于70 nM、低于60 nM、低于50 nM、低于40 nM、低于30 nM、低于20 nM、低于25nM、低于20 nM、低于15 nM、低于10 nM、低于9 nM、低于8 nM、低于7.5 nM、低于7 nM、低于6.5 nM、低于6 nM、低于5.5 nM、或低于5 nM的DNA。在一些实施方案中,有待于用所述技术归一化的输入DNA包含质量低于250 ng、低于200 ng、低于150 ng、低于100 ng、低于75 ng、低于50 ng、或低于25 ng的DNA。例如,在所述技术的一些实施方案中,在归一化之前进行有限的扩增,以保持扩增子组中存在的扩增子之间的覆盖一致性。
在一些实施方案中,所述技术提供了包含相对低数目核酸的NGS文库(例如,片段或扩增子),例如,包含少于500个核酸、少于450个核酸、少于400个核酸、少于350个核酸、少于300个核酸、少于250个核酸、少于200个核酸、少于150个核酸、少于100个核酸、少于50个核酸、少于25个核酸,例如,1至150个核酸。
在一些实施方案中,所述方法和配方用于在单一步骤和/或在单一容器(例如,单一管、孔、或其它容纳样品的物体)中完成的浓度归一化、纯化、和大小筛选。
在一些实施方案中,所述技术提供了包含片段的NGS文库,所述片段具有超过75bp或碱基、超过80 bp或碱基、超过85 bp或碱基、超过90 bp或碱基、超过95 bp或碱基、超过100 bp或碱基、超过105 bp或碱基、超过110 bp或碱基、超过115 bp或碱基、超过120 bp或碱基的长度,例如,在一些实施方案中,在浓度归一化期间,可将大约100 bp或更短的片段有效去除。
捕获底物
在一些实施方案中,所述技术包括将核酸(例如,NGS文库)结合至捕获底物。在一些实施方案中,捕获是非特异性的,例如,捕获底物并不具有对特定大小和/或组成的核酸的特异性,而是以基本相同的亲和性结合至所有核酸。在一些实施方案中,与另一类型或类别的核酸相比,捕获底物对于特定类型或类别的核酸具有相对较高的亲和性。例如,在一些实施方案中,捕获底物对于长度超过1000 bp的核酸具有特异性,而对长度少于1000 bp的核酸则没有。在一些实施方案中,捕获底物对于具有特定组成(例如,具有多聚-A尾、高或低GC含量等)、结构(茎环、线性、环状等)、修饰(例如,甲基化的或未甲基化的),和/或序列的核酸具有特异性。
在一些实施方案中,捕获底物和/或包含捕获底物的组合物具有结合低于250 ng或低于100 ng的核酸的能力(例如,低于250 ng、200 ng、150 ng、100 ng、75 ng、50 ng、25ng、或者10 ng或更低)。
在一些实施方案中,NGS文库的扩增子结合于结合核酸的捕获底物,例如,所述捕获底物包含游离的COOH或COO(羧基)基团。在一些实施方案中,捕获底物包含磁性颗粒(例如,顺磁性颗粒)。
在一些实施方案中,适宜的顺磁性微粒具有足够的大小以提供其从溶液分离,例如通过磁场或通过过滤。在一些实施方案中,顺磁性微粒具有足够的大小以提供适宜的表面积和体积用于微观尺度操作。例如,在一些实施方案中,大小范围为从大约0.1 µm的平均直径至大约100 µm的平均直径,例如,大约1.0 µm的平均直径。适宜用于本技术的磁性微粒可得自供应商如Agencourt Biosciences,Polysciences,Bioclone,Seradyne,和BangsLaboratories Inc.,Fishers,Indiana (例如,estapor®羧酸修饰的经包封的磁性微球)。
在一些实施方案中,NGS文库的扩增子非特异性地结合至固相载体上的至少一个官能团。“非特异性结合”是指不同靶标种类的分子(例如,不同种类的核酸,如大小不同的核酸)以大致相似的亲和性结合固相载体上官能团,而无论不同靶标种类分子在结构(例如核酸序列)或大小上的差异。所述结合可以例如经辅助的吸附来实现。如本文所用,“辅助的吸附”是指其中使用拥挤试剂(例如,PVP)或沉淀试剂(例如,聚乙二醇,乙醇,异丙醇)来促进初始在混合物中的DNA分子种类的沉淀和随后的吸附至固相载体(捕获底物)上的过程。
在一些实施方案中,NGS文库的核酸(例如,片段或扩增子)特异性地(选择性地)结合至固相载体上的至少一个官能团。“特异性结合”或“选择性结合”是指,例如特定核酸分子(例如,靶核酸种类)结合至固相载体上的一或多个官能团,以排除混合物中的其它核酸种类。在此实施方案中,所述官能团对特定的核酸分子(例如,靶核酸种类)具有比其它核酸分子更高的亲和性。
在本技术的方法中所使用的固相载体,具有官能团包被的表面。如本文所用,术语“官能团包被的表面”是指以官能团或部分包被的固相载体的表面,所述官能团或部分可逆地结合NGS文库的一或多个核酸,其为直接结合(官能团结合核酸)或间接结合(官能团结合连接至核酸的基团)。
以官能团(直接地或间接地)包被固相载体的方法,是本领域已知的。例如,提供了实施方案,其中官能团(例如,COOH/COO)在固相载体的形成期间包被固相载体。参见例如,美国专利号5,648,124,其通过引用并入本文。此外,提供了实施方案,其中通过将官能团(一或多个)共价偶合至固相载体上的COOH基团(一或多个)来用官能团包被固相载体。官能团包被的表面的具体实例是由各自具有游离官能团的部分所包被的表面,其中所述游离的官能团结合微粒氨基硅烷的氨基;结果,微粒的表面由含官能团的部分所包被。所述官能团充当用于沉淀的核酸的生物亲和吸附剂(例如,聚亚烷基二醇沉淀的DNA)。
在一些实施方案中,捕获底物包含官能团,其为羧酸(COOH/COO)。具有游离的羧酸官能团的适宜的部分为琥珀酸部分,其中一个羧酸基团经酰胺键结合至氨基硅烷的胺而第二个羧酸没有结合,产生链接至或栓系在固相载体表面的游离羧酸基团。羧酸包被的磁性颗粒可商购自例如,Polysciences,Inc.。羧基提供核酸从固相载体的有效洗脱。羧基具有大约4.7的pKa,并因而在中性pH时带负电。核酸,如DNA,是带负电的;因而,在缺乏拥挤试剂或盐时,在中性pH核酸被羧基修饰的微粒排斥。
实施方案提供了具有官能团包被的表面的固相载体,所述表面可逆地结合核酸分子,例如,以提供捕获底物。示例性的捕获底物包括但不限于,具有官能团包被的表面的磁响应固相载体,例如但不限于,氨基包被的、羧基包被的、包封的羧基包被的顺磁性微粒。
在一些实施方案中,其它官能团通过羧基二酰亚胺偶合至固相载体表面的羧基,从而偶合至固相载体。在表面上具有高密度羧基的固相载体可与另一官能团(例如,寡聚-dT)接触,所述另一官能团通过碳二亚胺偶合结合一些但非全部的羧基。在碳二亚胺偶合至不同的官能团之后,保留了充足的羧基官能团(其可用于,例如,结合核酸),产生具有双功能性的固相载体,其中可发生核酸与羧基的结合以及分离的部分与第二官能团的结合。因而,所述固相载体可用于去除或保留另一靶标分子。
结合靶标种类(如核酸和肽)的官能团,是本领域熟知的(例如,参见Hermanson,G.T.,Bioconjugate Techniques,Academic Press,San Diego,Calif. (1996),其通过引用并入本文)。直接结合核酸的官能团包括,例如,金属离子、胺基、羧基、包封的羧基、硅石(SiOH)、二乙基氨基乙基(DEAE)、以及与混合物中的核酸序列杂交的基团。
杂交至核酸序列的官能团可以是与混合物中的核酸的全部或部分互补的核酸序列(例如,与待分离的靶核酸序列的全部或部分核酸序列互补)。例如,在一些实施方案中,互补的核酸序列是特异于待分离核酸种类(的特征)的序列,从而混合物中结合互补序列的基本所有核酸(主要的核酸种类)都包含靶核酸种类,而混合物中存在的其它核酸序列不结合补序列。例如,基团可以是寡聚脱氧胸腺嘧啶(寡聚dT)基团,其是脱氧核糖胸腺嘧啶的聚合物并且与信使RNA (mRNA) 3'末端处的腺嘌呤核苷酸聚合物(多聚腺苷酸(多聚A)尾)互补,并且是mRNA或从mRNA制得的cDNA的特征序列。寡聚dT基团可以是大约3至大约100个胸腺嘧啶、大约5至大约75个胸腺嘧啶、大约8至大约60个胸腺嘧啶、大约10至大约50个胸腺嘧啶、大约15至大约40个胸腺嘧啶、或大约20至大约30个胸腺嘧啶的聚合物。经修饰的寡聚dT基团也可用于本技术的方法中。例如,可使用寡聚dT,其中最后两个3'核苷酸是N或寡聚dT,其中最后两个3'核苷酸是VN,其中“N”是腺嘌呤(A),胞嘧啶(C)、胸腺嘧啶(T)、或鸟嘌呤(G),而“V”是A、C、或G。
间接结合靶核酸的基团结合至与核酸连接的部分,如标记或标签。因此,可使用本技术的方法,分离包含能结合至固相载体上的官能团的标签的核酸。此类基团包括,例如,与结合配偶体相互作用的基团。例如,所述官能团可以是常规用于基于其组成和序列而分离具体生物分子的结合配偶体。用于本技术的方法的此类官能团的实例,包括抗生物素蛋白、链酶亲和素、生物素、抗体、抗原、序列特异性相互作用(可杂交标签)、DNA特异性结合蛋白(例如,指结构域、转录因子)、以及其衍生物。
在特定的实施方案中,所述官能团是生物素或者包含生物素的分子。生物素,水可溶维生素,出于各种目的而广泛用于生物化学和分子生物学,包括大分子检测、纯化、和分离,以及用于细胞化学染色(参见例如,美国专利号5,948,624,其通过引用并入本文)。生物素的实用性来自于其强烈结合四聚体蛋白抗生物素蛋白(在鸟类、爬行类和两栖类的蛋清和组织中发现)的能力,或者结合抗生物素蛋白的化学近亲链酶亲和素(其对于生物素特异性略高于抗生物素蛋白)的能力。生物素与抗生物素蛋白的相互作用属于已知的最强的非共价亲和性,展现出大约1.3×10−15 M的解离常数(Hermanson,G. T., BioconjugateTechniques,Academic Press,San Diego,Calif. (1996),p. 570)。在其它实施方案中,所述官能团是生物胞素和/或生物素类似物(例如,生物素酰胺基己酸-羟基琥珀酰亚胺酯、生物素-PEO4-N-羟基琥珀酰亚胺酯,生物素 4-酰氨基苯甲酸,生物素酰胺己酰肼)和生物素衍生物(例如,生物素-萄聚糖,生物素-二硫化物-N-羟基琥珀酰亚胺酯,生物素-6酰氨基喹啉,生物素酰肼,d-生物素-N-羟基琥珀酰亚胺酯,生物素马来酰亚胺,d-生物素p-硝基苯基酯,生物素化的核苷酸,生物素化的氨基酸如Nε-生物素基-1-赖氨酸) (参见例如,美国专利号5,948,624)。
在另一实施方案中,所述官能团是抗生物素蛋白或者是包含抗生物素蛋白的分子(抗生物素蛋白化的)。抗生物素蛋白是蛋清中发现的糖蛋白,其含有四个相同的亚基,每个都具有对生物素的结合位点(Hermanson,G. T., Bioconjugate Techniques,AcademicPress,San Diego,Calif. (1996),p. 570)。链酶亲和素和其他抗生物素蛋白类似物也可用于本技术的方法中。此类抗生物素蛋白的类似物包括,例如,抗生物素蛋白缀合物,链酶亲和素缀合物,高度纯化的和/或级分化的抗生物素蛋白或链酶亲和素种类,抗生物素蛋白或链酶亲和素的非-或部分氨基酸变体(例如,重组的或化学合成的抗生物素蛋白类似物,其具有氨基酸或化学取代,仍允许抗生物素蛋白类似物与生物素的高度亲和性的、多价或单价结合)。链酶亲和素是另一种生物素结合蛋白,其分离自阿维丁链霉菌(Streptomyces avidinii) (Hermanson,如上)。
所述官能团还可以是抗体。如本文所用,术语“抗体”涵盖了多克隆和单克隆抗体(例如,IgG,IgM,IgA,IgD,和IgE抗体)二者。术语多克隆和单克隆是指抗体制剂的均质性程度,而不是用于限定为特定的生产方法。任何抗体或抗原结合片段都可用于所述技术的方法中。例如,单链抗体,嵌合抗体,哺乳动物(例如,人类)抗体,人源化的抗体,CDR-移植的抗体(例如,灵长类化的抗体),表面镶饰(veneered)抗体,多价抗体(例如,二价),和双特异性抗体均由本技术和术语“抗体”所涵盖。本技术和术语“抗体”还涵盖了嵌合的、CDR-移植的、或表面镶饰的单链抗体,其包含衍生自不同物种的部分。这些抗体的各个部分可以通过常规技术化学接合在一起,或者可以用基因工程技术制备为连续的蛋白。例如,可以表达编码嵌合或人源化链的核酸来产生连续的蛋白。参见例如,美国专利号4,816,567;欧洲专利号0,125,023 B1;美国专利号4,816,397;欧洲专利号0,120,694 B1;WO 86/01533;欧洲专利号0,194,276 B1;美国专利号5,225,539;欧洲专利号0,239,400 B1;欧洲专利号0 451 216B1;EP 0 519 596 A1。也可参见,关于灵长类化的抗体的Newman,R. 等人,BioTechnology,10: 1455-1460 (1992),,以及关于单链抗体的Ladner等人,美国专利号4,946,778和Bird,R. E.等人,Science,242: 423-426 (1988))。
或者,所述官能团可以是抗原。如本文所用,术语“抗原”,“免疫原”,或“表位”(例如,T细胞表位,B细胞表位)是指抗体或抗原结合片段对其具有结合特异性的物质。所述技术的方法中使用的抗体和抗原结合片段对多种免疫原(例如,多肽)具有结合亲和性。
在一些实施方案中,所述捕获底物包含一或多个异源官能团。任何数目的异源(不同)官能团(例如,异双功能的,异三功能的,异多功能的)可存在于固相颗粒的表面,只要官能团的存在不干扰(例如,化学地、空间上地)核酸的可逆结合。在一个实施方案中,大约每个2 A2至大约200 A2有一个官能团。
固体底物如珠的能力可以使用多种技术来确定。在一些实施方案中,固体底物如珠的能力依经验确定,例如,使用给定的固体底物,一组包含已知量核酸的标准物样品,并测试在给定条件下固体底物的能力。
在一些实施方案中,使用珠的已知特征来估算、确定、或预测固体底物如珠的能力。例如,实施方案包括使用若干不同的策略来用于核酸(例如,NGS文库)的结合、筛选、纯化、和浓度归一化,例如,COOH/SPRI,寡聚杂交,生物素/链酶亲和素。在本文所述的优选实施方案中,在固相可逆固定(SPRI)方法中使用COOH修饰的珠。此外,在一些实施方案中,使用“拥挤试剂”(例如,PEG)和盐来驱动带负电的DNA与珠表面上的羧基结合/沉淀(参见例如,De Angelis等人(1995)“Solid-phase reversible immobilization for theisolation of PCR products” Nucleic Acids Res. 23(22):4742-3)。在一些实施方案中,通过PEG和盐的浓度来确定结合至COOH珠的DNA片段大小。具体而言,PEG和盐的浓度越高,结合至珠的DNA的大小截断值就越小。
此外,固体支持物(例如,珠)的若干示例性特征被用于预测能力。例如,假设珠是光滑球体,用于预测珠能力的一些示例性的特征和关系包括:珠半径(例如,以nm计),总可用表面积(例如,4πr2),一个珠的质量(例如,g),每个珠的官能团密度(例如,官能团数目/nm2),以及每个DNA片段结合事件所关联的官能团的数目。
此外,可以通过如下来确定、估算、和/或预测对DNA的结合能力:
DNA结合能力= [总可用表面积] × [官能团密度] × [每个DNA片段结合事件所消耗的官能团数目]。
示例性的计算提供了对DNA结合能力的估算。假设表面在每nm2表面积包含一个COOH基团以及每个DNA片段结合事件消耗10个COOH基团,对珠结合能力的估算包括如下计算:
对于1-µm的珠,珠的能力估算为[3,141,500 nm2] × [1 COOH基团/nm2] × [1 DNA片段/10 COOH基团] = 314,150 DNA片段/珠。
对于8-µm的珠,珠的能力估算为[201,056,000 nm2] × [1 COOH基团/nm2] × [1DNA片段/10 COOH基团] = 20,105,600 DNA片段/珠。
对于每个DNA片段结合事件消耗一个COOH基团的假设,这些值分别为31,415和2,010,560。因而,对于每个DNA片段结合事件消耗1至10个COOH基团的范围,能力预测为范围在大约30,000至300,000 DNA片段/1-µm的珠;能力预测为范围在大约2,000,000至20,000,000 DNA片段/8-µm的珠。因此,将珠的总质量保持在反应中恒定(例如,0.1%的固体= 1 mg珠/1 mL反应),那么在使用大小更小的珠时,每个反应的总DNA结合能力显著更大。也即,与8-µm的珠相比,1-µm的珠具有更大的表面积/单位质量。参见表1。
表1:1-µm的和8-µm的珠的估算DNA结合能力
珠大小(µm) 单个珠质量(g) 反应体积(µL) 珠浓度(%固体) 每个反应的总珠# 每个反应的总珠表面积(nm2) 每个珠的DNA结合能力 每个反应的DNA结合能力
1 7.9E-13 75 0.1 94,861,060 3.0E+14 314,150 3.0E+13
8 4.0E-10 75 0.1 185,277 3.7E+13 20,105,600 3.7E+12
缓冲剂
在本技术的方法中,所述混合物包含NGS文库且所述固相载体保存在适宜于NGS文库的核酸结合载体上的官能团的条件下。在一些实施方案中,本文所述的方法和试剂(反应物)与多种涉及核酸结合至固相载体的纯化技术(例如核酸纯化技术)一起使用,包括以下中所描述的那些:例如,美国专利号5,705,628;5,898,071;6,534,262;WO 99/58664;美国专利申请公开号2002/0094519 A1,美国专利号5,047,513;6,623,655;和5,284,933,其内容通过引用并入本文。
如本文所述,使用一或多种试剂(例如,缓冲剂,酶)来从固相载体结合或去除核酸(例如,扩增子或文库片段)。在各种实施方案中,促进靶核酸与固相载体(捕获底物)关联(例如结合)和/或解离的试剂的成分存在于一种试剂中或多种试剂中(例如,第一试剂、第二试剂、第三试剂等)。因此,当在本技术的方法中使用超过一种试剂时,提供了同时或顺次使用所述试剂的实施方案。取决于使用本文所述方法的目的,本领域技术人员可以确定将用于本技术的方法中试剂的数目和顺序。
在一些实施方案中,在本技术的方法中使用所述试剂,来引起混合物中的核酸(例如,NGS文库的文库片段或扩增子)沉淀或吸附至固相载体表面上的官能团之上(核酸沉淀剂)。在一个实施方案中,以充足的浓度使用核酸沉淀剂,以使混合物的核酸沉淀至固相载体上。
“核酸沉淀试剂”或“核酸沉淀剂”是引起核酸离开溶液的成分。适宜的沉淀剂包括醇(例如,短链醇,如乙醇或异丙醇)和多聚-OH化合物(例如,聚亚烷基二醇)。核酸沉淀试剂可包含一或多个这些试剂。核酸沉淀试剂以充足的浓度存在,以将核酸非特异性地和可逆地结合至固相载体上。可以使用此类核酸沉淀剂,例如,来非特异性地将核酸、或特异性地将核酸(这取决于所使用的浓度),结合至固相载体,例如,包含COOH作为官能团的固相载体。
在一个实施方案中,使用涉及将核酸结合至羧基包被的固相载体(例如,磁性和/或顺磁性微粒)的基于羧基的磁性珠,其中使用各种核酸沉淀试剂或拥挤试剂,如醇、二醇(例如,烯属烃,聚亚烷基二醇,乙烯,聚乙二醇),和聚乙烯吡咯烷酮(PVP) (例如,聚乙烯吡咯烷酮-40)。在一些实施方案中,调节这些沉淀和/或拥挤试剂的分子量,以产生具有可观沉淀能力的低粘度溶液。在一些实施方案中,通过调节沉淀和/或拥挤试剂的浓度,沉淀和/或拥挤试剂的分子量,或者通过调节溶液的盐、pH、极性或疏水性,来进行大小特异性的核酸分离。大的核酸分子在低浓度的盐、沉淀、和/或拥挤试剂下沉淀和/或群集出溶液,而较小的核酸分子在较高浓度的沉淀和/或拥挤试剂下沉淀和/或吸附。参见例如,美国专利号5,705,628;美国专利号5,898,071;美国专利号6,534,262和美国公开申请号2002/0106686,其所有的都通过引用并入本文。
用于本技术的方法中的适应方案(例如,乙醇,异丙醇)的浓度(终浓度),为大约5%至大约100%;大约40%至大约60%;大约45%至大约55%;以及大约50%至大约54%,其描述为体积:体积比。
适宜的聚亚烷基二醇包括聚乙二醇(PEG)和聚丙二醇。适宜的PEG可得自Sigma(Sigma Chemical Co.,St. Louis Mo.,分子量8000,无Dnase和Rnase,目录编号25322-68-3)。聚乙二醇(PEG)的分子量范围可以是大250至大约10,000;大约1000至大约10,000;大约2500至大约10,000;大约6000至大约10,000;大约6000至大约8000;大约7000至大约9000;大约8000至大约10,000。一般而,PEG的存在提供了疏水溶液,迫使亲水的核酸分子离开溶液。在一个实施方案中,PEG的浓度为大约5%至大约20%。在其它实施方案中,PEG的浓度范围是大约7%至大约18%;大约9%至大约16%;以及大约10%至大约15%,其描述为重量:体积比。
任选地,可以向试剂添加盐,以引起混合物中的核酸沉淀至固相载体上。可用于促进靶向分离的核酸吸附至磁响应微粒的适宜的盐包括氯化钠(NaCl)、氯化锂(LiCl)、氯化钡(BaCl2)、氯化钾(KCl)、氯化钙(CaCl2)、氯化镁(MgCl2)、和氯化铯(CsCl)。在一些实施方案中,使用氯化钠。一般而言,所述盐使核酸分子的负电荷排斥最小化。适宜用于所述方法的盐的广阔范围表明,可以使用许多其它的盐并且本领域技术人员可依经验确定适宜的水平。盐的浓度可以为大约0.005 M至约5 M,大约0.1 M至约0.5 M;大约0.15 M至约0.4 M;和大约2 M至约4 M。
在官能团是互补的序列(因而与混合物中的一或多个核酸杂交)的实施方案中,可以使用杂交缓冲剂来用于结合。用于此方法的适宜的缓冲剂是本领域技术人员熟知的。适宜缓冲剂的实例为包含NaCl (例如大约0.1 M至约0.5 M)、Tris-HCl (例如10 mM)、EDTA(例如0.5 mM)、柠檬酸钠(SSC)、以及其组合的缓冲剂。
用于本技术的方法中的适宜“洗脱缓冲剂”,是从固相载体的官能团洗脱(例如选择性地)包被核酸的缓冲剂。在一些实施方案中,洗脱缓冲剂是水或水成溶液。例如,可用的缓冲剂包括但不限于,Tris-HCl (例如,10 mM,pH 7.5)、Tris乙酸、蔗糖(20% w/v)、EDTA、和甲酰胺(例如,90%至100%)溶液。在一些实施方案中,洗脱缓冲剂是缓冲盐溶液,其包含单价的(一或多种)阳离子如钠、锂、钾、和/或铵(例如,大约0.1 M至约0.5 M)。当使用适宜的低离子强度的洗脱缓冲剂时,从固相载体洗脱核酸可快速发生(例如,在30秒内或更短)。
此外,在从固相载体分离固相载体结合的包被种类之前,可以通过洗涤具有结合的核酸的固相载体(例如让固相载体接触适宜的洗涤缓冲剂溶液),来从固相载体去除杂质(例如,蛋白(例如,酶)、代谢物、化合物、未掺入的核苷酸和/或引物、或细胞碎片)。如本文所用,“洗涤缓冲剂”是溶解或去除可结合至微粒的杂质(与吸附的核酸关联、或存在于本体溶液中)的成分,但是其不会使吸附至固相之上的靶核酸溶解。洗涤缓冲剂的pH、溶质浓成分、和浓度可以根据预期会存在的杂质的类型而改变。例如,乙醇(例如,70% (v/v))示例了可用于去除过量的PEG和盐的优选洗涤缓冲剂。在一个实施方案中,洗涤缓冲剂包含 NaCl(例如,0.1 M)、Tris (例如,10 mM)、和EDTA (例如,0.5 mM)。具有结合的核酸的固相载体也可用一或多种洗涤缓冲剂溶液来洗涤。固相载体可以根据要求经常洗涤(例如,一次、两次、三次或更多次,例如三至五次),以去除期望的杂质。然而,有限限定洗涤的次数,以使结合的靶标种类的损失最小化。
适宜的洗涤缓冲剂溶液具有若干特征。首先,洗涤缓冲剂溶液必需具有足够高的盐浓度(足够高的离子强度),从而使结合至固相载体的核酸不会从固相载体洗脱,而保持结合至微粒。适宜的盐浓度超过大约0.1 M,并且优选为大约0.5 M。其次,对缓冲剂溶液进行选择,从而使结合至核酸或微粒的杂质溶解。缓冲剂溶液的pH、溶液成分、和浓度可以根据预期会存在的杂质的类型而改变。适宜的洗涤溶液包括以下:0.5×盐水-柠檬酸钠(SSC;20×原液包含3 M氯化钠和300 mM柠檬酸三钠(用HCl调节为pH 7.0));100 mM硫酸铵,400mM Tris pH 9,25 mM MgCl2,和1%牛血清白蛋白(BSA);1-4 M盐酸胍(例如,具有40%异丙醇和1% Triton X-100的1 M的胍HCl );和0.5 M NaCl。在一个实施方案中,洗涤缓冲剂溶液包含25 mM Tris乙酸(pH 7.8),100 mM乙酸钾(KOAc),10 mM乙酸镁(Mg2OAc),和1 mM二硫苏糖醇(DTT;Cleland's Reagent)。在另一实施方案中,洗涤溶液包含2% SDS,10% Tween,和/或10% Triton。
本技术的方法中所使用的试剂的成分,可以包含在单一试剂(反应剂)中或者分离的成分中。在使用分离的试剂成分的实施方案中,所述成分可同时或顺次与化合物组合。取决于特定的实施方案,组合中的元素进行组合的顺序并不必然是关键的。试剂中所含有的成分的性质和量如上文方法所述。所述试剂可以浓缩的形式进行配制,从而期望进行稀释以获得本文方法中所描述的功能和/或浓度。
接头
所述技术的方法包括将接头附着至核酸(例如,核酸(例如,NGS文库的文库片或扩增子文库的扩增子)。在某些实施方案中,用酶将接头附着至核酸。所述酶可以是连接酶或聚合酶。所述连接酶可以是能够将寡核苷酸(单链RNA、双链RNA、单链DNA、或双链DNA)连接至另一核酸分子的任何酶。适宜的连接酶T4 DNA连接酶和T4 RNA连接酶(此类连接酶可商业购买自,例如,New England Biolabs)。使用连接酶的方法是本领域熟知的。连接可以是平头末端的或者是经使用突悬末端的互补。在某些实施方案中,核酸的末端可以是经磷酸化的(例如,使用T4多核苷酸激酶)、经修复的、经修剪的(例如使用外切核酸酶)、或经填充的(例如,使用聚合酶和dNTP),以形成平头末端。经生产平头末端,所述末端可以用 聚合酶和dATP处理以形成不依赖于模版的在片段3'末端的添加,由此产生单一A突出。此单一A用于在称作T-A克隆的方法中引导片段与5'末端的单一T突出的连接。所述聚合酶可以是能够将核苷酸添加至模板核酸分子的3'和5'末端的任何酶。
在一些实施方案中,接头包含通用序列和/或索引(index),例如,条码核苷酸序列。另外,接头可含有一或多个各种序列元件,包括但不限于,一或多个扩增引物退火序列或其互补,一或多个测序引物退火序列或其互补,一或多个条码序列,多个不同的接头或不同接头的亚集所共享的一或多个共有序列(例如,通用序列),一或多个限制性酶识别位点,与靶标多核苷酸的突出互补的一或多个突出,一或多个探针结合位点(例如用于附着至测序平台,如用于大规模平行测序的流动池(flow cell),例如由Illumina,Inc.所开发的),一或多个随机或接近随机的序列(例如随机选自一或多个位置的一组两个或更多个不同的核苷酸的一或多个核苷酸,其中在一或多个位置选择的每个不同的核苷酸在包含随机序列的接头汇集中进行代表),以及其组合。两个或更多个序列元件可以彼此不相邻(例如由一或多个核苷酸所分开)、彼此相邻、部分重叠、或完全重叠。例如,扩增引物退火序列也可以用作测序引物退火序列。序列元件可以位于或接近3'末端,位于或接近5'末端,或者位于接头寡核苷酸的内部。当接头寡核苷酸能够形成二级结构时,如发夹,序列元件可以部分或全部位于二级结构之外,部分或全部位于二级结构之内,或者位于参与二级结构的序列之间。例如,当接头寡核苷酸包含发夹结构时,序列元件可部分或全部位于可杂交序列(“茎”)之内或之外,包括在可杂交序列之间的序列(“环”)中。在一些实施方案中,具有不同条码序列的多个第一接头寡核苷酸中的第一个接头寡核苷酸,包含所有所述多个第一接头寡核苷酸共有的序列元件。在一些实施方案中,所有第二接头寡核苷酸包含所有第二接头寡核苷酸共有的序列元件(与第一接头寡核苷酸共有的序列元件不同)。序列元件的不同可以是任意的,从而不同的接头至少有一部分不完全比对,例如,由于序列长度的改变、一或多个核苷酸的缺失和插入、或者在一或多个核苷酸位置的核苷酸成分的改变(如碱基改变或碱基修饰)。
在一些实施方案中,接头寡核苷酸包含与一或多个靶标多核苷酸互补的5'突出、3'突出、或二者都有。互补的突出其长度可以是一或多个核苷酸,包括但不限于长度为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、或更多个核苷酸。互补的突出可包含固定的序列。互补的突出可包含一或多个核苷酸的随机序列,从而随机从一或多个位置的两个或更多个不同的核苷酸选择一或多个核苷酸,其中从一或多个位置选择的每个不同的核苷酸在包含随机序列的具有互补突出的接头汇集中进行代表。在一些实施方案中,接头突出与限制性内切核酸酶消化所产生的靶标多核苷酸的突出互补。在一些实施方案中,接头突出由腺嘌呤或胸腺嘧啶所组成。
在一些实施方案中,接头序列可含有分子结合位点鉴别元件,以促进靶核酸的鉴别和分离以用于下游应用。分子结合作为亲和性机制允许两个分子之间的相互作用,以导致稳定的联合复合物。在分子结合反应中能够沉淀的分子包括蛋白质、核酸、碳水化合物、脂质、和小有机分子如配体、肽或药物。
当核酸分子结合位点被用作接头的部分时,其可以用来利用选择性的杂交,以分离靶标序列。选择性的杂交可将实质性的杂交限制在含有接头(具有分子结合位点)的靶核酸,并捕获与分子结合位点充分互补的核酸。因而,通过“选择性杂交”,可以检测不纯样品(含有许多核酸的汇集)中靶标多核苷酸的存在。核苷酸-核苷酸选择性杂交分离系统的实例包含具有若干捕获核苷酸的系统,所述捕获核苷酸包含分子结合识别元件的互补序列并且任选固定至固体支持物。在其它实施方案中,捕获多核苷酸可以与靶标序列本身互补或与接头内含有的条码或独特标签互补。捕获多核苷酸可以固定至各种固体支持物,如平板的孔内、单分散球、或者本领域已知的任何其它适宜的支持物表面。可以通过洗涤掉不期望的非结合核酸,留下期望的靶标多核苷酸,来分离附着至固体支持物上的杂交的互补接头多核苷酸 。如果互补接头分子固定至顺磁性球或类似的珠技术以用于分离,那么可以在管中将球与含有接头的靶标多核苷酸混合。当接头序列已经与固定至球的互补序列杂交时,可以洗涤掉不期望的分子,而球则用磁体或相似的试剂来保持在管中。随后可以通过提高温度、改变pH、或通过使用本领域已知的任何其他适宜的洗脱方法,释放期望的靶标分子。
样品
在一些实施方案中,核酸(例如,DNA或RNA)分离自包含各种其它组分,例如蛋白、脂质和其它(例如非靶标或非模板)核酸的生物样品。核酸分子可得自任何材料(例如,细胞材料(活的或死的)、胞外材料、病毒材料、环境样品(例如,宏基因组样品)、合成材料(例如,扩增子如PCR或其它扩增技术所提供的)),可得自动物、植物、细菌、古细菌、真菌或任何其它生物。用于所述技术的生物样品包括病毒颗粒或其制备物。在一些实施方案中,核酸分离自在扩增反应中用作模板的样品(例如用于制备扩增子文库或片段文库以用于测序)。在一些实施方案中,核酸分离自用于直奔片段文库的样品。
核酸分子可从生物体或从获自生物体的生物样品,例如,从血液、尿液、脑脊液、精液、唾液、痰、粪便、头发、汗液、泪液、皮肤和组织直接获得。示例性的样品包括,但不限于,全血、淋巴液、血清、血浆、口腔细胞、汗液、泪液、唾液、痰、头发、皮肤、活组织检查、脑脊液(CSF)、羊水、精液、阴道分泌物、浆液、滑液、心包液、腹膜液、胸膜液、渗出液、渗出物、囊液、胆汁、尿液、胃液、肠液、粪便样品和拭子、抽出物(例如,骨髓、细针,等)、洗涤物(例如,口腔、鼻咽、支气管、支气管肺泡、眼、直肠、肠、阴道、表皮,等)和/或其它试样。
任何组织或体液试样均可用作本技术中使用的核酸的来源,包括法医试样、存档试样、保存试样和/或长时间储存的试样,例如,新鲜-冷冻、甲醇/乙酸固定或甲醛固定石蜡包埋(FFPE)的试样和样品。核酸模板分子还可从培养细胞,例如原代细胞培养物或细胞系分离。可用病毒或其它胞内病原体感染获得模板核酸的细胞或组织。样品还可为从生物试样提取的总RNA、cDNA文库、病毒或基因组DNA。样品还可为来自非细胞源的分离的DNA,例如,在冰箱中储存的扩增/分离的DNA。
核酸模板分子可,例如,通过从生物样品,例如经由多种技术如Maniatis等人(1982) Molecular Cloning: A Laboratory Manual (分子克隆:实验室手册),ColdSpring Harbor,N.Y。描述的那些(参见例如,pp.280-281)提取获得。
在一些实施方案中,所述技术提供了对核酸进行的大小选择,以除去非常短的片段或非常长的片段。选择大小的合适方法为本领域所已知。在各种实施方案中,所述大小被限制为0.5、1、2、3、4、5、7、10、12、15、20、25、30、50、100 kb或更长。
在各种实施方案中,扩增核酸。可使用本领域已知的任何扩增方法。可使用的扩增技术的实例包括,但不限于,PCR、定量PCR、定量荧光PCR (QF-PCR)、多重荧光PCR (MF-PCR)、实时PCR (RT-PCR)、单细胞PCR、限制片段长度多态性PCR (PCR-RFLP)、热启动PCR、巢氏PCR、原位群落PCR、原位滚环扩增(RCA)、桥式PCR、小滴度PCR和乳液PCR。其它合适的扩增方法包括连接酶链反应(LCR)、转录扩增、自主序列复制、靶多核苷酸序列的选择性扩增、共有序列引发的聚合酶链反应(CP-PCR)、随机引发的聚合酶链反应(AP-PCR)、简并寡核苷酸引发的PCR (DOP-PCR)、和基于核酸的序列扩增(NABSA)。本文可使用的其它扩增方法包括美国专利号5,242,794、5,494,810、4,988,617和6,582,938中描述的那些。
在一些实施方案中,使用市售试剂盒,例如从Epicentre Biotechnologies(Madison,WI)可得的那些,来进行末端修复以产生平末端5'磷酸化的核酸末端。
在一些实施方案中,所述技术可用于将扩增子组归一化,例如,扩增子组文库。扩增子组是与以下相关的扩增子的集合:例如,疾病(例如,多基因病)、疾病进展、发育缺陷、体质病(例如,具有取决于遗传因素的病因的状态、例如、可遗传的(非肿瘤)异常或疾病)、代谢通路、药物基因组学特征、性状、生物体(例如,用于物种鉴别)、生物体的组、地理位置、器官、组织、样品、环境(例如,用于宏基因组学和/或核糖体RNA(例如核糖体小亚基(SSU)、核糖体大亚基(LSU)、5S、16S、18S、23S、28S、内转录序列(ITS)rRNA)的研究)、基因、染色体等。例如,癌症组包含具体的基因或基因中的突变,其 已经与特定的癌症表型建立起关联(例如,ABL1、AKT1、AKT2、ATM、PDGFRA、EGFR、FGFR (例如,FGFR1、FGFR2、FGFR3)、BRAF (例如,在V60包含突变,例如,V600E突变)、RUNX1、TET2、CBL、EGFR、FLT3、JAK2、JAK3、KIT、RAS(例如,KRAS (例如,在G12、G13、或A146包含突变,例如,G12A、G12S、G12C、G12D、G13D、或A146T突变)、HRAS (例如,在G12包含突变,例如,G12V突变)、NRAS (例如,在Q61包含突变,例如,Q61R或Q61K突变))、MET、PIK3CA (例如,在H1047包含突变,例如,H1047L、H1047L、H1047R突变)、PTEN、TP53 (例如,在R248、Y126、G245、或A159包含突变,例如,R248W、G245S、或A159D突变)、VEGFA、BRCA、RET、PTPN11、HNHF1A、RB1、CDH1、ERBB2、ERBB4、SMAD4、SKT11(例如,在Q37包含突变)、ALK、IDH1、IDH2、SRC、GNAS、SMARCB1、VHL、MLH1、CTNNB1、KDR、FBXW7、APC、CSF1R、NPM1、MPL、SMO、CDKN2A、NOTCH1、CDK4、CEBPA、CREBBP、DNMT3A、FES、FOXL2、GATA1、GNA11、GNAQ、HIF1A、IKBKB、MEN1、NF2、PAX5、PIK3R1、PTCH1、STK11等的一或多种)。一些扩增子组针对特定的“癌症热点”,也即,含有与癌症进展和治疗抗性相关的已知突变的基因组区域。
在一些实施方案中,用于单一基因的扩增子组包括用于基因的外显子(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、或更多个外显子)的扩增子。在一些实施方案中,用于物种(株系、亚种、类型、亚型、属、或其它分类学级别和/或基于系统发生间距的测量的操作分类单位(OTU))鉴别的扩增子组,可包含扩增子对应于一套基因或基因座,其共同提供对于一或多个物种(或株系、亚种、类型、亚型、属、或其它分类学级别)相对于其它物种(或株系、亚种、类型、亚型、属、或其它分类学级别)的鉴别(例如,对于细菌(例如,MRSA),病毒(例如,HIV,HCV,HBV,呼吸道病毒等)),或者其被用于确定药物抗性和/或灵敏性(例如,对于细菌(例如,MRSA),病毒(例如,HIV,HCV,HBV,呼吸道病毒等))。
所述组的扩增子突出包含100至1000个碱基对,例如,在一些实施方案中所述组的扩增子包含大约100、125、150、175、200、225、250、275、300、325、350、375、400、325、350、375、400、425、450、475、500、525、550、575、600、625、650、675、700、725、750、775、800、825、850、875、900、925、950、975、或1000个碱基对。在一些实施方案中,扩增子组包含贯穿基因组的扩增子的集合,例如,以提供基因组序列。
通常通过使用寡核苷酸的扩增(例如,来从样品产生扩增子组 )和/或用于对疾病相关基因进行测序的寡核苷酸探针探针来产生扩增子组,例如,来评估基因组中特定突变和/或等位基因的存在。在一些实施方案中,10、20、30、40、50、60、70、80、90、100、150、200、300、400、500、1000、或更多的基因、基因座。区域等被靶向看来用于产生例如,10、20、30、40、50、60、70、80、90、100、150、200、300、400、500、1000、或更多的扩增子。在一些实施方案中,在高度多元化的、单一管的扩增反应中产生扩增子。在一些实施方案中,在一元扩增反应的集合(例如,10组100、100至1000、或1000个或更多个反应)中产生扩增子。在一些实施方案中,将一元扩增反应的集合进行汇集。在一些实施方案中,平行进行所述一元扩增反应。
在一些优选实施方案中,将许多扩增(例如热)循环最小化(例如,在一些实施方案中,低于常规技术中使用的循环数来保持扩增子对靶标序列的一致覆盖,以在扩增子中提供对靶标序列的准确表现、和/或以最小化和/或消除偏好,例如在扩增的中间和后期引入至扩增样品的偏好。因此,所产生的DNA (例如,扩增子)的量低于用于常规归一化技术的输入。在一些实施方案中,用作本文提供的归一化技术的输入的扩增子DNA的量低于250 ng;在一些实施方案中,用作本文提供的归一化技术的输入的扩增子DNA的量低于100 ng。并且,在一些实施方案中,用作本文提供的归一化技术的输入的样品中扩增子的数目低于200个、低于150个、低于100个,例如,1至150个扩增子。由此,所述技术可应用于加工包含低(例如,质量方面和/或数目方面)量扩增子的扩增子文库,以制备用于下一代测序工作流程的样品。
扩增子组的产生通常与下游的下一代测序相关联,以获得所述组的扩增子的序列。也即,使用扩增来靶向基因组,并提供用于NGS的选择的区域。此种靶向富集聚焦于对基因组的特定区域的测序努力,由此提供对整个基因组进行测序的更有成本效益的替代,并提供对感兴趣区域更加深入的覆盖(例如,用于对罕见变异和/或低比率的假阴性和/或假阳性进行改善的检测)。另外,NGS提供了用于在单一测试中靶向多个扩增子的技术。
核酸测序
在所述技术的一些实施方案中,产生核酸序列数据。核酸测序平台(例如,核酸测序仪)的各种实施方案包括如下所述的组件。根据各种实施方案,测序仪器包括流体递送和控制单元、样品处理单元、信号检测单元以及数据采集、分析和控制单元。所述仪器的各种实施方案提供用于平行和/或基本上同时从多个序列收集序列信息的自动化测序。
在一些实施方案中,流体递送和控制单元包括试剂递送系统。所述试剂递送系统包括用于储存各种试剂的试剂槽。所述试剂可包括基于RNA的引物、正向/反向DNA引物、用于通过合成测序的核苷酸混合物(例如,在一些实施方案中,包含核苷酸类似物的组合物)、缓冲剂、洗涤试剂、封闭试剂、剥离试剂等。另外,试剂递送系统可包括连接样品处理单元与试剂槽的移液系统或连续流动系统。
在一些实施方案中,样品处理单元包括样品室例如流动室、底物、微阵列、多孔托盘等。样品处理单元可包括多个泳道、多个通道、多个孔或基本上同时处理多个样品集的其它装置。另外,样品处理单元可包括多个样品室以使得能够同时处理多个运行。在特定的实施方案中,所述系统可在一个样品室进行信号检测而又基本上同时处理另一个样品室。另外,样品处理单元可包括用于移动或操纵样品室的自动系统。在一些实施方案中,信号检测单元可包括成像或检测传感器。例如,成像或检测传感器(例如,荧光检测器或电子检测器)可包括CCD、CMOS、离子传感器如覆盖CMOS的离子敏感层、检流器等。信号检测单元可包括激发系统以引起探针(例如,荧光染料)来发射信号。检测系统可包括照明源,例如弧光灯、激光、发光二极管(LED)等。在特定的实施方案中,信号检测单元包括用于从照明源向样品或从样品向成像或检测传感器传输光的光学。或者,信号检测单元可不包括照明源,例如,当信号由于测序反应自发产生时。例如,信号可通过释放部分的相互作用,例如释放的离子与离子敏感层相互作用,或焦磷酸与酶或其它催化剂反应以产生化学发光信号。在另一个实例中,可检测电流、电压或电阻的变化而不需照明源。
在一些实施方案中,数据采集分析和控制单元监测各种系统参数。所述系统参数可包括仪器各部分例如样品处理单元或试剂槽的温度、各种试剂的体积、各种系统亚组件例如机械手、步进电机、泵等的状态,或其任意组合。
本领域技术人员将理解的是所述仪器和系统的各种实施方案用于实践测序方法例如通过合成测序、单分子方法和其它测序技术。通过合成测序可包括掺入染料标记的核苷酸、链终止、离子/质子测序、焦磷酸测序等。单分子技术可包括交错测序,其中暂停测序反应以确定所掺入核苷酸的同一性。
在一些实施方案中,测序仪器测定核酸,例如多核苷酸或寡核苷酸的序列。核酸可包括DNA或RNA,并且可为单链的,例如ssDNA和RNA,或者是双链的,例如dsDNA或RNA/cDNA对。在一些实施方案中,核酸可包括或衍生自片段文库、扩增子文库、配对文库、ChIP片段等。在特定的实施方案中,测序仪器可从单一核酸分子或从一组基本上同一的核酸分子获得序列信息。
在一些实施方案中,测序仪器可以以多种不同的输出数据文件类型/格式输出核酸测序阅读数据,包括,但不限于:*.txt、*.fasta、*.csfasta、*seq.txt、*qseq.txt、*.fastq、*.sff、*prb.txt、*.sms、*srs和/或*.qv。
下一代测序技术
本技术所考虑的具体测序技术为下一代测序(NGS)方法,其共享大规模平行、高通量策略的共同特征,并以与旧测序方法相比更低的成本为目标(参见,例如,Voelkerding等人,Clinical Chem.,55: 641-658,2009;MacLean等人,Nature Rev。Microbiol.,7: 287-296;各自以其整体通过引用并入本文)。NGS方法可大致分为通常使用模板扩增的那些和不使用的那些。需要扩增的方法包括作为454技术平台(例如,GS 20和GS FLX)由Roche商业化的焦磷酸测序、由Illumina商业化的Solexa平台和由Applied Biosystems商业化的SupportedOligonucleotide Ligation and Detection (SOLiD)平台。非-扩增方法,也称为单分子测序,通过由Helicos BioSciences商业化的HeliScope平台和分别由VisiGen、OxfordNanopore Technologies Ltd.、Life Technologies/Ion Torrent和Pacific Biosciences商业化的新兴平台例示。
在焦磷酸测序中(Voelkerding等人,Clinical Chem.,55: 641-658,2009;MacLean等人,Nature Rev。Microbiol.,7: 287-296;美国专利号6,210,891;美国专利号6,258,568;各自以其整体通过引用并入本文),通过用承载与接头互补的寡核苷酸的小珠捕获单个模板分子原位克隆扩增NGS片段文库。将每个承载单个模板类型的小珠划分入油包水微泡中,并使用称作乳液PCR的技术克隆扩增模板。扩增后将乳液打破并将小珠放置在测序反应期间充当流动室的皮滴定(picotitre)平板的单个孔。在测序酶和发光报告分子例如荧光素酶存在下流动室中发生4种dNTP试剂每个的有序反复引入。如果适当的dNTP被加至测序引物的3'末端,结果产生的ATP导致孔内发光的爆发,这使用CCD照相机记录。达到大于或等于400碱基的阅读长度是可能的,并且可达到106个序列阅读,导致多达500个百万碱基对(Mb)的序列。
在Solexa/Illumina平台中(Voelkerding等人,Clinical Chem.,55: 641-658,2009;MacLean等人,Nature Rev。Microbiol.,7: 287-296;美国专利号6,833,246;美国专利号7,115,400;美国专利号6,969,488;各自以其整体通过引用并入本文),测序数据以较短长度阅读的形式产生。在该方法中,将NGS文库的片段或扩增子捕获在布满寡核苷酸锚的流动室表面。所述锚用作PCR引物,但由于模板的长度以及其与其它附近锚寡核苷酸的接近度,PCR延伸导致该分子“拱悬”与邻近锚寡核苷酸杂交以在流动室表面上形成桥状结构。将这些DNA环变性和切割。然后用可逆染料终止剂测序正向链。所掺入核苷酸的序列通过检测掺入后荧光测定,去除各荧光剂和障碍,然后进行下一个dNTP添加循环。序列阅读长度从36个核苷酸到超过100个核苷酸变化,每个分析运行的总体输出超过十亿个核苷酸对。
使用SOLiD技术测序核酸分子(Voelkerding等人,Clinical Chem.,55: 641-658,2009;MacLean等人,Nature Rev。Microbiol.,7: 287-296;美国专利号5,912,148;美国专利号6,130,073;各自以其整体通过引用并入本文)也涉及通过乳液PCR克隆扩增NGS片段。这之后,将承载模板的小珠固定在玻璃流动室的衍生表面,并退火与接头寡核苷酸互补的引物。然而,不是利用该引物进行3'延伸,而是用于提供5'磷酸基团与包含两个探针-特异性碱基接着6个简并碱基和4种荧光标记之一的审问探针(interrogation probe)连接。在SOLiD系统中,审问探针在每个探针的3'末端具有16种可能的两个碱基组合并且在5'末端具有4种荧光剂之一。荧光剂颜色,以及因此各个探针的鉴定,与指定的颜色-空间编码方案对应。多轮(通常7)探针退火、连接和荧光剂检测之后为变性,然后使用相对于最初的引物1个碱基偏移的引物第二轮测序。以这种方式,可计算重构模板序列,并且模板碱基被审问两次,导致增加的准确度。序列阅读长度平均35个核苷酸,并且每次测序运行的总体输出超过40亿碱基。
在某些实施方案中,使用Helicos BioSciences的HeliScope (Voelkerding等人,Clinical Chem.,55: 641-658,2009;MacLean等人,Nature Rev。Microbiol.,7: 287-296;美国专利号7,169,560;美国专利号7,282,337;美国专利号7,482,120;美国专利号7,501,245;美国专利号6,818,395;美国专利号6,911,345;美国专利号7,501,245;各自以其整体通过引用并入本文)。HeliScope测序通过添加聚合酶和系列添加荧光标记的dNTP试剂完成。掺入事件导致与dNTP对应的荧光剂信号,并且在每轮dNTP添加前用CCD照相机捕获信号。序列阅读长度从25-50个核苷酸变化,每次分析运行的总体输出超过10亿核苷酸对。
在一些实施方案中,使用Roche的454测序(Margulies等人(2005) Nature 437:376–380)。454测序包括两步。在第一步中,将DNA剪切为约300-800碱基对的片段并将片段平末端化。然后将寡核苷酸接头连接至片段的末端。接头用作用于片段扩增和测序的引物。片段可使用,例如,包含5'-生物素标签的接头附着到DNA捕获小珠上,例如链霉亲和素-包覆的小珠上。在油-水乳液的微滴内PCR扩增附着到小珠上的片段。结果为每个小珠上克隆扩增的DNA片段的多个拷贝。在第二步中,将小珠捕获在孔(微升大小)中。在每个DNA片段上平行实施焦磷酸测序。一个或多个核苷酸的添加产生光信号,其由测序仪器中的CCD照相机记录。信号强度与掺入核苷酸的数目成比例。焦磷酸测序利用核苷酸添加时释放的焦磷酸(PPi)。PPi在腺苷5'磷酸硫酸酐的存在下被ATP硫酸化酶转化为ATP。荧光素酶使用ATP以将荧光素转化为氧荧光素,该反应产生被检测和分析的光。
Ion Torrent技术为基于对DNA聚合期间所释放氢离子的检测的DNA测序方法(参见,例如,Science 327(5970): 1190 (2010);美国专利申请出版号20090026082、20090127589、20100301398、20100197507、20100188073和20100137143,对于所有目的以其整体通过引用并入本文)。微孔含有待测序的NGS文库的片段。微孔层之下为高灵敏度的ISFET离子传感器。所有层均被包含在CMOS半导体芯片内,与电子工业中所使用的类似。当dNTP掺入到增长的互补链中时,释放氢离子,氢离子触发离子传感器。若模板序列中存在均聚物重复,单个循环中将掺入多个dNTP分子。这导致相应数目的氢释放以及按比例增高的电子信号。该技术与其它测序技术的不同之处在于不使用修饰的核苷酸或光学。对于50碱基阅读Ion Torrent测序仪每个碱基的准确度为~99.6%,每次运行产生~100 Mb。阅读长度为100碱基对。5个重复长度的均聚物重复的准确度为~98%。离子激流测序的益处为快的测序速度以及低前期和运行成本。然而,除去样品制备装置和用于数据分析的服务器,获得pH-介导的测序仪的成本为大约$50,000。
Stratos Genomics,Inc.开发了经适应可用于本技术的另一种示例性的核酸测序方法并且涉及Xpandomers的使用。该测序方法通常包括提供由模板-定向合成所产生的子链。所述子链一般在与所有或部分靶核酸的连续核苷酸序列所对应的序列中包含多个偶联的亚基,其中单个亚基含有一个系链、至少一个探针或核苷碱基残基以及至少一个可选择性切割的键。可选择性切割的键被切割产生长度长于子链的多个亚基的Xpandomer。Xpandomer通常在与全部或部分靶核酸的连续核苷酸序列所对应的序列中含有系链和用于解析遗传信息的报告分子元件。然后检测Xpandomer的报告分子元件。关于基于Xpandomer的方法的更多细节在,例如,2008年6月19日提交的标题为“HIGH THROUGHPUT核酸SEQUENCING BY EXPANSION (通过扩展的高通量核酸测序)”的美国专利出版号20090035777中描述,所述专利以其整体通过引用并入本文。
其它单分子测序方法包括使用VisiGen平台通过合成实时测序(Voelkerding等人,Clinical Chem.,55: 641-58,2009;美国专利号7,329,492;美国专利申请序列号11/671956;美国专利申请序列号11/781166;各自以其整体通过引用并入本文),其中将NGS文库的片段固定、引发,然后经受使用荧光修饰的聚合酶和荧光受体分子的链延伸,导致核苷酸添加时可检测的荧光共振能量转移(FRET)。
Pacific Biosciences开发的另一个实时单分子测序系统(Voelkerding等人,Clinical Chem.,55: 641-658,2009;MacLean等人,Nature Rev。Microbiol.,7: 287-296;美国专利号7,170,050;美国专利号7,302,146;美国专利号7,313,308;美国专利号7,476,503;其所有均通过引用并入本文)利用直径50-100 nm并包含约20仄升4(10-21升)的反应体积的反应孔。测序反应使用固定化模板、修饰的phi29 DNA聚合酶和高局部浓度的荧光标记dNTP进行。高局部浓度和连续反应条件允许通过使用激光激发、光波导和CCD照相机检测荧光信号实时捕获掺入事件。
在某些实施方案中,利用Pacific Biosciences开发的使用零模式波导(ZMW)的单分子实时(SMRT) DNA测序方法,或相似的方法。用该技术,DNA测序在SMRT芯片上进行,每个芯片包含数千个零模式波导(ZMWs)。ZMW为直径数十纳米的孔,在二氧化硅基底上放置的100 nm金属膜中制造。每个ZMW成为提供仅20仄升检测体积的纳米光子可视化小室。在该体积,可在数千个标记核苷的背景之中检测单分子的活性。由于其进行合成法测序,ZMW提供用于观察DNA聚合酶的窗口。在每个室内,单个DNA聚合酶分子附着在底部表面上使得其永久存在于检测体积中。然后将磷酸连接的核苷酸,各个类型用不同颜色的荧光团标记,以促进酶速度、准确度和持续合成能力的高浓度引入反应溶液中。由于ZMW的小尺寸,即使在这些高、生物学相关浓度时,核苷酸仅占据检测体积一小部分时间。另外,访问检测体积迅速,仅持续几个微秒,因为扩散需要携带核酸的距离非常小。结果是非常低的背景。
在一些实施方案中,使用纳米孔测序(Soni G V和Meller A。(2007) Clin Chem53: 1996-2001)。纳米孔为直径1纳米级的小孔。将纳米孔浸在电导液中并在其两端施加电势导致轻微电流,这是因为离子传导通过纳米孔。流过的电流的量对纳米孔的大小敏感。随着DNA分子通过纳米孔,DNA分子上的每个核苷酸以不同的程度堵塞纳米孔。因此,随着DNA分子通过纳米孔通过纳米孔的电流的变化代表对DNA序列的阅读。
在一些实施方案中,测序技术使用化学-敏感场效应晶体管(chemFET)阵列测序DNA (例如,如美国专利申请公开号20090026082中所描述的)。在该技术的一个实例中,将DNA分子放置在反应室中并使模板分子与结合聚合酶的测序引物杂交。一个或多个三磷酸在测序引物的3'末端向新核酸链中的掺入可通过chemFET经由电流变化检测。阵列可具有多个chemFET传感器。在另一个实例中,可将单个核酸附着在小珠上,核酸可在小珠上扩增,并且可将单个小珠转移至chemFET阵列上的单个反应室,每个反应室具有一个chemFET传感器,并且可测序核酸。
在一些实施方案中,测序技术使用电子显微镜(Moudrianakis E。N.和Beer M。Proc Natl Acad Sci USA。1965 March;53:564-71)。在该技术的一个实例中,使用可使用电子显微镜区分的金属标记标记个体DNA分子。然后将这些分子在平面上拉伸并使用电子显微镜测量序列。
在一些实施方案中,使用如Turro等人 PNAS 103: 19635–40 (2006)中所描述的“使用可切割的荧光核苷酸可逆终止剂的四-颜色合成法测序”,例如Intelligent Bio-Systems所商业化的。该技术在美国专利申请出版号2010/0323350、2010/0063743、2010/0159531、20100035253、20100152050中描述,对于所有目的所述申请通过引用并入本文。
用于这样的经调适可用于本技术的实时测序的过程和系统在以下文献中描述,例如,2008年7月29日颁予Xu等人的标题为“Fluorescent nucleotide analogs and usestherefor (荧光核苷类似物及其用途)”的美国专利号7,405,281、2008年1月1日颁予Turner等人的标题为“Arrays of optical confinements and uses thereof (光学限制的阵列及其用途)”的7,315,019、2007年12月25日颁予Turner等人的标题为“Opticalanalysis of molecules (分子的光学分析)”的7,313,308、2007年11月27日颁予Turner等人的标题为“Apparatus and method for analysis of molecules (用于分子分析的装置和方法)”的7,302,146以及2007年1月30日颁予Turner等人的标题为“Apparatus andmethods for optical analysis of molecules (用于分子光学分析的装置和方法)”的7,170,050,以及Lundquist等人2007年10月26日提交的标题为“Methods and systems forsimultaneous real-time monitoring of optical signals from multiple sources(用于同时实时监测来自多个源的光学信号的方法和系统)”的美国专利出版号20080212960、Williams等人2007年10月26日提交的标题为“Flowcell system for singlemolecule detection (用于单分子检测的流动室系统)”的20080206764、Hanzel等人2007年10月26日提交的标题为“Active surface coupled polymerases (活性表面偶联的聚合酶)”的20080199932、Otto等人2008年2月11日提交的标题为“CONTROLLABLE STRANDSCISSION OF MINI CIRCLE DNA (小圆DNA的可控链断裂)”的20080199874、Rank等人2007年10月26日提交的标题为“Articles having localized molecules disposed thereonand methods of producing same (具有局域化的分子排列在其上的物品及生产其的方法)”的20080176769、Eid等人2007年10月31日提交的标题为“Mitigation of photodamagein analytical reactions (分析反应中光损伤的缓解)”的20080176316、Eid等人2007年10月31日提交的标题为“Mitigation of photodamage in analytical reactions (分析反应中光损伤的缓解)”的20080176241、Lundquist等人2007年10月26日提交的标题为“Methods and systems for simultaneous real-time monitoring of optical signalsfrom multiple sources (用于同时实时监测来自多个源的光学信号的方法和系统)”的20080165346、Korlach 2007年10月31日提交的标题为“Uniform surfaces for hybridmaterial substrates and methods for making and using same (用于杂合体材料基底的独特表面及用于制造和使用其的方法)”的20080160531、Lundquist等人2007年10月26日提交的标题为“Methods and systems for simultaneous real-time monitoring ofoptical signals from multiple sources (用于同时实时监测来自多个源的光学信号的方法和系统)”的20080157005、Rank等人2007年10月31日提交的标题为“Articles havinglocalized molecules disposed thereon and methods of producing same (具有局域化的分子排列在其上的物品及生产其的方法)”的20080153100、Williams等人2007年10月26日提交的标题为“CHARGE SWITCH 核苷酸(电荷开关核苷酸)”的20080153095、Lundquist等人2007年10月31日提交的标题为“Substrates,systems and methods for analyzingmaterials (用于分析物质的底物、系统和方法)”的20080152281、Lundquist等人2007年10月31日提交的标题为“Substrates,systems and methods for analyzing materials (用于分析物质的底物、系统和方法)”的20080152280、Korlach 2007年10月31日提交的标题为“Uniform surfaces for hybrid material substrates and methods for making andusing same (用于杂合体材料基底的独特表面及用于制造和使用其的方法)”的20080145278、Lundquist等人2007年8月31日提交的标题为“SUBSTRATES,SYSTEMS ANDMETHODS FOR ANALYZING MATERIALS (用于分析物质的底物、系统和方法)”的20080128627、Rank等人2007年10月22日提交的标题为“聚合酶 enzymes and reagentsfor enhanced核酸sequencing (用于增强核酸测序的聚合酶和试剂)”的20080108082、Foquet等人2007年6月11日提交的标题为“SUBSTRATES FOR PERFORMING ANALYTICALREACTIONS (用于进行分析反应的底物)”的20080095488、Dixon等人2007年9月27日提交的标题为“MODULAR OPTICAL COMPONENTS AND SYSTEMS INCORPORATING SAME (模块光学组件和并入其的系统)”的20080080059、Korlach等人2007年8月14日提交的标题为“Articleshaving localized molecules disposed thereon and methods of producing andusing same (具有局域化的分子排列在其上的物品及生产和使用其的方法)”的20080050747、Rank等人2007年3月29日提交的标题为“Articles having localizedmolecules disposed thereon and methods of producing same (具有局域化的分子排列在其上的物品及生产其的方法)”的20080032301、Lundquist等人2007年2月9日提交的标题为“Methods and systems for simultaneous real-time monitoring of opticalsignals from multiple sources (用于同时实时监测来自多个源的光学信号的方法和系统)”的20080030628、Lyle等人2007年6月15日提交的标题为“CONTROLLED INITIATION OFPRIMER EXTENSION (引物延伸的受控起始)”的20080009007、Rank等人2006年3月30日提交的标题为“Articles having localized molecules disposed thereon and methods ofproducing same (具有局域化的分子排列在其上的物品及生产其的方法)”的20070238679、Korlach等人2006年3月31日提交的标题为“Methods,systems andcompositions for monitoring enzyme activity and applications thereof (用于监测酶活的方法、系统和组合物及其应用)”的20070231804、Lundquist等人2007年2月9日提交的标题为“Methods and systems for simultaneous real-time monitoring ofoptical signals from multiple sources (用于同时实时监测来自多个源的光学信号的方法和系统)”的20070206187、Hanzel等人2006年12月21日提交的标题为“聚合酶s for 核苷酸类似物incorporation (用于掺入核苷酸类似物的聚合酶)”的20070196846、Lundquist等人2006年7月7日提交的标题为“Methods and systems for simultaneousreal-time monitoring of optical signals from multiple sources (用于同时实时监测来自多个源的光学信号的方法和系统)”的20070188750、Eid等人2006年12月1日提交的标题为“MITIGATION OF PHOTODAMAGE IN ANALYTICAL REACTIONS (分析反应中光损伤的缓解)”的20070161017、Turner等人2006年11月3日提交的标题为“核苷酸 Compositionsand Uses Thereof (核苷酸组合物及其用途)”的20070141598、Korlach 2006年11月27日提交的标题为“Uniform surfaces for hybrid material substrate and methods formaking and using same (用于杂合体材料基底的独特表面及用于制造和使用其的方法)”的20070134128、Eid等人2005年12月2日提交的标题为“Mitigation of photodamage inanalytical reactions (分析反应中光损伤的缓解)”的20070128133、Roitman等人2005年9月30日提交的标题为“Reactive surfaces,substrates and methods of producingsame (反应性表面、基底和用于生产其的方法)”的20070077564、Xu等人2005年9月29日提交的标题为“Fluorescent 核苷酸类似物and uses therefore (荧光核苷酸类似物及其用途)”的20070072196和Lundquist等人2005年8月11日提交的标题为“Methods and systemsfor monitoring multiple optical signals from a single source (用于监测来自单一源的多个光学信号的方法和系统)”的20070036511,以及Korlach等人(2008)“Selective aluminum passivation for targeted immobilization of single DN聚合酶 molecules in zero-mode waveguide nanostructures (用于将单个DNA聚合酶分子以零模式波导纳米结构靶向固定的选择性铝钝化)” PNAS 105(4): 1176–81,其所有均以其整体通过引用并入本文。
在一些实施方案中,由下一代测序平台所产生数据的质量取决于载入至测序仪工作工作流程上的克隆扩增步骤的DNA(例如,NGS文库,如片段文库或扩增子组文库)的浓度。例如,载入低于最小阈值的浓度可导致低的或次佳的测序仪输出,而载入高于最大阈值的浓度可导致低质量的测序或无测序仪输出。因此,本文提供的技术可用于制备具有用于测序的适宜浓度的样品,例如,从而使输出的测序数据具有期望的质量。
用途
所述技术不限于特定的应用,而是可用在广泛的(基础和应用)研究、临床、医药和其它生物学、生物化学和分子生物学应用中。所述技术用于与提供浓度归一化的核酸样品相关的方法、试剂盒、系统等。本技术的一些示例性用途包括遗传学、基因组学和/或,例如,植物、动物和其它生物体的基因分型,例如,以鉴定突变和/或等位基因的单元型、定相和/或连锁。在一些实施方案中,所述技术用于与癌症诊断、治疗和疗法相关的测序。
另外,所述技术可用在传染病领域,例如鉴定传染剂例如病毒、细菌、真菌等,和测定病毒类型、家族、种类和/或准种,和鉴定突变和/或等位基因的单元型、定相和/或连锁。在传染病领域的其它具体和非限制的说明性实例包括表征抗生素抗性决定簇、对于流行病学跟踪传染生物体、监测抗性机制的出现和进化、鉴定与毒力有关的物种、亚种、菌株染色体外元件、类型等、监测治疗的进展等。
在一些实施方案中,所述技术可用于移植医学,例如,用于分型主要组织相容性复合体(MHC)、分型人类白细胞抗原(HLA)和用于鉴定与移植医学相关的突变和/或等位基因的单元型、定相和/或连锁(例如,以为需要移植的特定宿主鉴定相容的供体、预测排斥的可能性、监测排斥、存档移植材料、用于医学信息数据库等)。
在一些实施方案中,所述技术可用于肿瘤学以及与肿瘤学相关的领域。在肿瘤学领域的特定的和非限制的说明性实例有检测与癌症相关的遗传和/或基因组畸变、癌症诱因和/或癌症治疗。例如,在一些实施方案中所述技术可用于检测与癌症相关的突变、多态性、等位基因、或染色体易位的存在情况。在一些实施方案中,所述技术可用于癌症筛查、癌症诊断、癌症预后、测量微小残留疾病、以及选择和/或监测癌症治疗进程。
一些实施方案包括使用计算机(例如微芯片),其执行计算机指令来分析测序数据并给出结果(例如给用户)。
试剂盒
本技术还提供了试剂盒的实施方案。在一个实施方案中,试剂盒包含固相载体(例如,作为溶液、浆、粉末或悬液等)和缓冲剂。在一些实施方案中,试剂盒还包含另外的缓冲剂(例如,洗涤缓冲剂和/或洗脱缓冲剂);用于核酸的降解、连接或末端终止等的酶;核苷酸,和使用说明。在特定的实施方案中,试剂盒包含磁性微粒,其含有COOH基团,以及在一些实施方案中,磁性微粒包含寡聚dT基团或其衍生物。
尽管本文的公开内容提及某些说明性的实施方案,应理解的是这些实施方案仅通过举例的方式而非通过限定的方式呈现。
实施例
实施例1
首先,在本文所述技术的实施方案的开发期间所进行的实验中收集的数据表明,COOH珠的量(例如,%珠固体)限制了回收的DNA的量。具体而言,对固定量的DNA梯度,用Agentcourt Ampure XP 珠和1-µm的Sera-Mag珠(Fisher Scientific,cat# 09-981-123)进行了珠定量滴定实验(图1)。数据显示,随着珠量的减少(0.1至0.00001%珠;参见图1),大约100、200、和400碱基对片段的递减的回收。
实施例2
接着,在本文所述技术的实施方案的开发期间,进行了实验来测试方法和配方,以用于将NGS多元扩增子组库(Abbott Molecular)进行浓度归一化。
材料和方法
羧基化的珠是8-µm的磁性珠,经COOH官能化(Bangs Laboratories,Inc. “COMPEL™Magnetic COOH经修饰的,8µm (5% solid),目录编号UMC4N/10487)。珠缓冲剂包含PEG、NaCl、Tris (pH 7)、EDTA、Tween-20、和水。实例性的珠缓冲剂组合物包括以下浓度的组分:
用于测试的样品包括使用20-plex的多元PCR反应(Abbott Molecular)和10 ng的Human Placental gDNA模板所产生的扩增子产物。测试了以下系列稀释的样品:
样品1:未经稀释的
样品2:样品1的1:3稀释
样品3:样品2的1:3稀释。
珠的混合物如下产生:经COOH官能化的8-µm的磁性珠,用分子生物学级别的H2O洗涤(例如,使用与等分试样的珠混合物的量相同体积的H2O,由此在洗涤和于新鲜H2O中重悬浮后的固体百分比为5%)。
珠的洗涤是通过将期望量的珠等分至非粘性的1.5 mL微离心管中并将管置于磁性立台(stand)上2分钟或直至溶液变澄清。接着,在管位于磁性立台中时对其进行洗涤,并小心去除上清。保持管的盖子打开并使管在室温留置5分钟使珠干燥。将具有珠的管与磁体脱离,并使用与最初所用的珠混合物的体积相同体积的H2O,将珠重悬在分子生物学级别的H2O中。
接着,将珠缓冲剂与经洗涤的珠混合。例如,对于每98 µl的珠缓冲剂,加入2 µl的经洗涤和重悬浮的珠(例如,为制备500 µl的归一化珠混合物,添加490 µl的缓冲剂以及10µl的重悬浮珠混合物)。珠混合物可储存在4℃待用。
根据以下方法进行同时的大小筛选、纯化、和浓度归一化。在开始过程之前,混合新鲜的60% EtOH (每个样品500 µL)。接着,将1份的样品和2份的珠混合物组合并在1.5 mL非粘性微离心管中混合(例如,25 µl的样品 + 50 µl的珠混合物)。将样品良好混合(例如通过轻柔涡旋)并在室温温育5分钟。接下来,将管置于磁性支架中(例如,放置2分钟或直至溶液变澄清)。在管依然置于磁性支架中时小心去除上清。将珠洗涤,例如,用200 µl的60%EtOH洗涤两次,而依然将管保留在支架中。接着将珠在空气中干燥5分钟,并将管从支架移出。使用低TE缓冲剂,将珠重悬在适宜的洗脱体积中。将重悬液置于支架中1分钟,之后去除上清而不扰动珠的沉淀。
此外,在本文所提供的技术的实施方案的开发期间,进行了实验来证明在单一步骤中的大小、纯化、和浓度归一化。具体而言,使用包含多元扩增子文库的样品1、样品2、和样品3 (例如,3倍系列稀释)进行了实验,以确定适宜于NGS文库的浓度归一化、大小分类和纯化的缓冲剂成分浓度。
结果
在实施例1中显示出所回收的DNA的量受回收过程中使用的珠的量限制之后,进行了实验,以使用1 µm的Sera-Mag COOH珠将范围变化的DNA输入量归一化为相同的终浓度。然而,使用1-µm的COOH珠,没有跨越满意的DNA输入量范围来产生浓度的归一化。
接下来,用来自Bangs Laboratories,Inc.的更大的8-µm的COOH珠(例如,具有每单位质量较低的表面积并因而具有较低的每单位质量结合能力)来进行实验。跨越上文所述的3倍系列稀释的多元扩增子样品(例如,样品1、样品2、和样品3),所述8-µm的珠提供了对多元的扩增子文库的同时的纯化、大小筛选、和浓度归一化。
在这些实验中,使用3个独立的NGS扩增子文库(具有大约8 nM至约80 nM的浓度范围),作为所述技术的输入。在根据所提供技术进行浓度归一化之后,文库的浓度一致为大约0.2 nM至0.3 nM (图2)。此外,通过有效去除酶、dNTP、盐、和低于大约100个碱基对的核酸的片段,所述方法的实施方案提供了样品的纯化和大小筛选(图3)。片段大小分析和定量在Agilent Bioanalyzer 2100上进行。
来自这些实验的数据显示,将所述技术应用于NGS多元扩增子文库,产生了纯化且浓度归一化的NGS扩增子库,其已准备好用于载入至NGS平台工作流程中。
对于所有目的,上述说明书中提及的所有出版物和专利以其整体通过引用并入本文。所述技术的组合物、方法和用途的多种修饰和变更将对本领域技术人员显而易见而不脱离所述技术的范围和精神。尽管所述技术已经结合具体的示例性实施方案进行描述,应理解的是如所要求保护的技术不应被过度限制在这样的具体实施方案中。实际上,对本领域技术人员显而易见的所述用于实施本发明的模式的多种修饰意在包含在随附权利要求书的范围内。

Claims (31)

1.用于将下一代测序(NGS)文库的浓度归一化的方法,所述方法包括:
a) 将以下混合:
1) 包含第一量的核酸的输入下一代测序文库,与
2) 具有结合少于第一量核酸的第二量的核酸的能力的捕获底物,
以提供捕获混合物,其包含未结合的核酸和包含结合的核酸的捕获底物;和
b) 从所述捕获底物洗脱结合的核酸,以提供作为输出的浓度归一化的NGS文库。
2.权利要求1的方法,其还包括将核酸结合至所述捕获底物。
3.权利要求1的方法,其还包括从所述捕获混合物中去除未结合的核酸。
4.权利要求1的方法,其还包括洗涤所述包含结合的核酸的捕获底物。
5.权利要求1的方法,其中所述捕获底物包含以羧基官能化的顺磁性微粒。
6.权利要求1的方法,其中所述第一量的核酸与第二量的核酸的比例大于1000、大于100,或大于10。
7.权利要求1的方法,其还包括将接头连接至核酸。
8.权利要求1的方法,其还包括通过调节缓冲成分对所述NGS文库进行大小筛选。
9.权利要求1的方法,其还包括通过调节离子强度对所述NGS文库进行大小筛选。
10.权利要求1的方法,其还包括将两个或更多个浓度归一化的NGS文库组合,以提供多元的浓度归一化的NGS文库。
11.权利要求1的方法,其还包括添加核酸沉淀试剂。
12.权利要求1的方法,其中所述浓度归一化的NGS文库包含浓度低于1 nM、低于0.75nM、低于0.55 nM、低于0.25 nM、低于0.1 nM、或低于0.05 nM的核酸。
13.权利要求1的方法,其中所述浓度归一化的NGS文库包含含有超过100 bp的核酸。
14.权利要求1的方法,其中所述浓度归一化的NGS文库包含低于200、低于150、低于100、低于50、低于25、低于10、低于5个核酸。
15.权利要求1的方法,其中所述输入NGS文库包含低于250 ng、低于200、低于150、或低于100 ng的核酸。
16.权利要求1的方法,其中所述方法的步骤在单一容器中进行。
17.用于将NGS文库的浓度归一化的方法,所述方法由以下组成:
a) 将以下混合:
1) 包含第一量的核酸的输入NGS文库,与
2) 具有结合少于第一量核酸的第二量的核酸的能力的捕获底物,
以提供捕获混合物,其包含未结合的核酸和包含结合的核酸的捕获底物;和
b) 从所述捕获底物洗脱结合的核酸,以提供浓度归一化的NGS文库,
其中:
i) 所述浓度归一化的NGS文库包含浓度低于1 nM、低于0.75 nM、低于0.55 nM、或低于0.25 nM的核酸;
ii) 所述浓度归一化的NGS文库包含含有超过100 bp的核酸;
iii) 所述浓度归一化的NGS文库包含低于200、低于150、低于100、低于50、低于25、低于10、低于5个核酸;和/或
iv) 所述输入NGS文库包含低于250 ng、低于200、低于150、或低于100 ng的核酸。
18.权利要求17的方法,其中所述方法的步骤在单一容器中进行。
19.权利要求1的方法,其中所述输入NGS文库是扩增子组文库。
20.权利要求1的方法,其中所述输入NGS文库是片段文库。
21.用于对核酸进行测序的方法,其包括权利要求1-20任一项的方法,并进一步包括将所述浓度归一化的NGS文库载入至下一代测序仪工作流程中。
22.浓度归一化的NGS文库,其由权利要求1-20任一项的方法所产生。
23.浓度归一化的扩增子组文库,其由权利要求1-20任一项的方法所产生。
24.用于DNA扩增子文库的同时的大小筛选、纯化、和浓度归一化的方法,所述方法包括:
a) 将包含DNA扩增子文库的样品与包含PEG、NaCl、和以羧酸基团官能化的磁性珠的溶液混合;
b) 用EtOH洗涤所述珠;和
c) 从所述珠洗脱所述DNA扩增子文库,以制备经大小筛选的、纯化且浓度归一化的DNA扩增子文库,其准备好用于输入至NGS工作流程。
25.权利要求24的方法,其中包含DNA扩增子文库的样品和所述溶液以1:2的比例混合。
26.权利要求24的方法,其中所述溶液包含20% PEG 8000、0.5 M NaCl、和5% w/v 珠/溶液的8-µm磁性珠。
27.权利要求24的方法,其中所述浓度归一化的DNA扩增子文库包含浓度为0.2 nM至0.3 nM的DNA。
28.权利要求24的方法,其中所述浓度归一化的DNA扩增子文库包含超过大约100个碱基对的DNA。
29.权利要求24的方法,其包括用60% EtOH洗涤。
30.浓度归一化的DNA扩增子文库,其由权利要求24的方法产生。
31.用于对核酸进行测序的方法,其包括权利要求24的方法,并进一步包括将所述浓度归一化的NGS文库载入至下一代测序仪工作流程中。
CN201580043577.3A 2014-08-14 2015-08-14 用于下一代测序的文库生成 Pending CN106574266A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462037327P 2014-08-14 2014-08-14
US62/037327 2014-08-14
PCT/US2015/045338 WO2016025872A1 (en) 2014-08-14 2015-08-14 Library generation for next-generation sequencing

Publications (1)

Publication Number Publication Date
CN106574266A true CN106574266A (zh) 2017-04-19

Family

ID=55301710

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580043577.3A Pending CN106574266A (zh) 2014-08-14 2015-08-14 用于下一代测序的文库生成

Country Status (5)

Country Link
US (1) US20160046987A1 (zh)
EP (1) EP3180432A4 (zh)
CN (1) CN106574266A (zh)
CA (1) CA2955820A1 (zh)
WO (1) WO2016025872A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109321634A (zh) * 2017-07-26 2019-02-12 上海之江生物科技股份有限公司 核酸均一化方法及其试剂盒和应用
CN111278550A (zh) * 2017-06-30 2020-06-12 赛库乐米克斯公司 使用热塑性硅石纳米材料进行尺寸选择纯化
CN114480576A (zh) * 2022-01-26 2022-05-13 纳昂达(南京)生物科技有限公司 靶向甲基化测序文库的构建方法及试剂盒
CN115354398A (zh) * 2022-09-27 2022-11-18 北京金匙医学检验实验室有限公司 一种使宏基因组测序文库片段大小集中的文库构建方法
CN116814864A (zh) * 2023-08-30 2023-09-29 深圳赛陆医疗科技有限公司 基因测序中芯片转移控制方法及装置、设备、系统及介质

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3303630B1 (en) * 2015-06-05 2022-01-05 Qiagen GmbH Method for separating dna by size
GB2551801A (en) * 2016-06-30 2018-01-03 Lgc Genomics Ltd Methods
EP3510155A4 (en) 2016-09-06 2020-03-18 Swift Biosciences, Inc. NORMALIZATION OF A NGS LIBRARY CONCENTRATION
MX2019007247A (es) * 2016-12-19 2019-08-16 Quantum Si Inc Carga de moleculas en pocillos para muestra para su analisis.
GB2559118B (en) 2017-01-19 2021-07-07 Agency For Science Tech And Research Astarstar Method for normalizing a nucleic acid sample
CN106834274B (zh) * 2017-02-17 2019-12-06 苏州贝斯派生物科技有限公司 一种回收片段化降解dna的方法
CN107653239A (zh) * 2017-09-11 2018-02-02 湖南优品司生物科技有限公司 一种磁珠介导分离纯化的多步酶反应方法
CA3106820A1 (en) * 2018-07-26 2020-01-30 Lexent Bio, Inc. Multiple sequencing using a single flow cell
US20220348999A1 (en) * 2018-12-18 2022-11-03 Takara Bio Usa, Inc. Normalization of Nucleic Acid Samples and Compositions for Use in the Same
US20230105642A1 (en) * 2020-03-30 2023-04-06 Illumina, Inc. Method and compositions for preparing nucleic acid libraries
WO2021236328A1 (en) * 2020-05-22 2021-11-25 Novartis Ag Cdna library generation
CN113943726A (zh) * 2020-07-17 2022-01-18 成都先导药物开发股份有限公司 一种提高dna编码化合物库纯度的方法
WO2023097257A1 (en) * 2021-11-23 2023-06-01 Bioo Scientific Corporation Compositions and methods for nucleic acid normalization
CN116162690B (zh) * 2022-11-24 2023-12-26 伯科生物科技有限公司 一管式靶向高通量测序方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6534262B1 (en) * 1998-05-14 2003-03-18 Whitehead Institute For Biomedical Research Solid phase technique for selectively isolating nucleic acids
WO2014047678A1 (en) * 2012-09-25 2014-04-03 Agriculture Victoria Services Pty Ltd Method of producing a normalised nucleic acid library using solid state capture material

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2256195A1 (de) * 2009-05-12 2010-12-01 Qiagen GmbH Nukleinsäureaufreinigungsverfahren
EP3354750A1 (en) * 2012-07-18 2018-08-01 Siemens Healthcare Diagnostics Inc. Kit of normalizing biological samples

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6534262B1 (en) * 1998-05-14 2003-03-18 Whitehead Institute For Biomedical Research Solid phase technique for selectively isolating nucleic acids
WO2014047678A1 (en) * 2012-09-25 2014-04-03 Agriculture Victoria Services Pty Ltd Method of producing a normalised nucleic acid library using solid state capture material

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HARRIS J. KIRK等: "《Comparison of Normalization Methods for Construction of Large, Multiplex Amplicon Pools for Next-Generation Sequencing》", 《APPLIED AND ENVIRONMENTAL MICROBIOLOGY》 *
HOSOMICHI KAZUYOSHI等: "《A Bead-based Normalization for Uniform Sequencing depth (BeNUS) protocol for multi-samples sequencing exemplified by HLA-B》", 《BMC GENOMICS》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111278550A (zh) * 2017-06-30 2020-06-12 赛库乐米克斯公司 使用热塑性硅石纳米材料进行尺寸选择纯化
CN111278550B (zh) * 2017-06-30 2023-04-25 赛库乐米克斯公司 使用热塑性硅石纳米材料进行尺寸选择纯化
US11732254B2 (en) 2017-06-30 2023-08-22 Pacific Biosicences of California, Inc. Size selection purification using a thermoplastic silica nanomaterial
CN109321634A (zh) * 2017-07-26 2019-02-12 上海之江生物科技股份有限公司 核酸均一化方法及其试剂盒和应用
CN114480576A (zh) * 2022-01-26 2022-05-13 纳昂达(南京)生物科技有限公司 靶向甲基化测序文库的构建方法及试剂盒
CN114480576B (zh) * 2022-01-26 2023-04-07 纳昂达(南京)生物科技有限公司 靶向甲基化测序文库的构建方法及试剂盒
CN115354398A (zh) * 2022-09-27 2022-11-18 北京金匙医学检验实验室有限公司 一种使宏基因组测序文库片段大小集中的文库构建方法
CN116814864A (zh) * 2023-08-30 2023-09-29 深圳赛陆医疗科技有限公司 基因测序中芯片转移控制方法及装置、设备、系统及介质
CN116814864B (zh) * 2023-08-30 2023-11-24 深圳赛陆医疗科技有限公司 基因测序中芯片转移控制方法及装置、设备、系统及介质

Also Published As

Publication number Publication date
US20160046987A1 (en) 2016-02-18
EP3180432A1 (en) 2017-06-21
CA2955820A1 (en) 2016-02-18
WO2016025872A1 (en) 2016-02-18
EP3180432A4 (en) 2018-03-07

Similar Documents

Publication Publication Date Title
CN106574266A (zh) 用于下一代测序的文库生成
Gupta et al. Next generation sequencing and its applications
US11584929B2 (en) Methods and compositions for analyzing nucleic acid
KR102326769B1 (ko) 합성 핵산 스파이크-인
US10648103B2 (en) Universal blocking oligo system and improved hybridization capture methods for multiplexed capture reactions
US20220348906A1 (en) Methods and compositions for analyzing nucleic acid
CN109415758A (zh) 使用含接头的经固定化的转座体进行的标签片段化
KR20190034164A (ko) 단일 세포 전체 게놈 라이브러리 및 이의 제조를 위한 조합 인덱싱 방법
US11486004B2 (en) Methods of sequencing circular template polynucleotides
CN110914449B (zh) 构建测序文库
US11155858B2 (en) Polynucleotide barcodes for long read sequencing
US20180201974A1 (en) Sample preparation for nucleic acid amplification
CN111712580A (zh) 用于扩增双链dna的方法和试剂盒
EP4294920A1 (en) High density sequencing and multiplexed priming

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170419

WD01 Invention patent application deemed withdrawn after publication