CN107002290B9 - 样品制备方法 - Google Patents

样品制备方法 Download PDF

Info

Publication number
CN107002290B9
CN107002290B9 CN201580063859.XA CN201580063859A CN107002290B9 CN 107002290 B9 CN107002290 B9 CN 107002290B9 CN 201580063859 A CN201580063859 A CN 201580063859A CN 107002290 B9 CN107002290 B9 CN 107002290B9
Authority
CN
China
Prior art keywords
primers
pool
double
stranded
cleavable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580063859.XA
Other languages
English (en)
Other versions
CN107002290B (zh
CN107002290A (zh
Inventor
约瑟夫·邓纳姆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seqonce Biosciences Inc
University of Southern California USC
Original Assignee
Seqonce Biosciences Inc
University of Southern California USC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seqonce Biosciences Inc, University of Southern California USC filed Critical Seqonce Biosciences Inc
Priority to CN202110251569.5A priority Critical patent/CN113279067A/zh
Publication of CN107002290A publication Critical patent/CN107002290A/zh
Publication of CN107002290B publication Critical patent/CN107002290B/zh
Application granted granted Critical
Publication of CN107002290B9 publication Critical patent/CN107002290B9/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)

Abstract

本公开内容提供了制备用于测序的核酸样品的单扩增法和双扩增法。

Description

样品制备方法
交叉引用
本申请要求2014年9月24日提交的序列号为62/054,886的 美国临时申请和2015年4月20日提交的第14/691,457号美国专利 申请的优先权,其通过引用而整体并入本文。
联邦赞助研究声明
本发明是在由国立卫生研究院授予的GM098741下由政府支 持而完成的。政府对本发明享有一定的权利。
背景技术
尽管近年来核酸测序的成本已经降低,但样品制备仍然费用 高昂。只有几种样品制备方法与最流行的测序平台相兼容。这些方 法可能费用高昂且又耗时。特别是,文库制备可能需要在核酸片段 上生成突出的碱基。该步骤是制备测序文库较为低效的一步步骤。 提高该步骤的效率将减少制备测序文库所需的起始核酸的量。需要 用于测序的样品制备的新方法,特别是借此提高生成具有突出碱基 的核酸片段的效率的方法。
发明内容
本文提供了用于生成核酸片段的衔接子连接的文库的方法。 特别地,公开了用于制备部分互补的双链核酸片段的方法,使得一 条链延伸超出另一条以产生突出端。这样的突出端可以提高酶促反 应和生化反应的效率。例如,这样的突出端可与其互补序列退火, 以允许核酸片段的靶向配对。在另一实例中,具有互补突出端的核 酸片段的连接比平端核酸片段的连接更有效率。
在一方面,本公开内容提供了用于生成双链核酸分子的衔接 子连接的文库的方法,其包括:在单一反应容器或反应混合物中, 使多个单链多核苷酸与第一组随机引物相接触,每个随机引物包含 可切割5’端;延伸该第一组随机引物以生成与该单链多核苷酸杂交 的第一延伸产物,从而形成第一双链双链体;使该第一双链双链体 变性为单链;使该第一多核苷酸延伸产物与第二组随机引物杂交 (该第一组引物和该第二组引物可以相同或不同);延伸该第二组 随机引物以生成与该第一延伸产物杂交的第二延伸产物,从而形成 第二双链双链体;切割该第一延伸产物和/或该第二延伸产物的可 切割5’端,从而形成具有一个或多个突出端的第二双链双链体;以 及使包含3’突出端的一个或多个双链衔接物与先前步骤的第二双 链双链体连接,从而形成该衔接子连接的文库。该双链衔接物在一 些实例中可以包含核酸条码,诸如样品条码、分子条码或随机化条 码。随机引物可以是完全简并或部分简并的。可采用单个清理步骤 来执行整个文库制备。可采用不超过两个清理步骤来执行整个文库 制备。可采用仅三个清理步骤来执行整个文库制备。
在一些实施方案中,所述单链多核苷酸为ssDNA。在一些实 施方案中,该单链多核苷酸为RNA。在一些实施方案中,所述引 物是随机的,如随机六聚体。在一些实施方案中,该引物的长度为 4至30个核苷酸的长度。在一些实施方案中,所述可切割5’端为 可通过光切割切割的。在一些实施方案中,该可切割5’端为可被核 酸酶切割的。在一些实施方案中,该核酸酶为核酸外切酶。在一些 实施方案中,该核酸酶为核酸内切酶。在一些实施方案中,该核酸 酶为RNA核酸酶。在一些实施方案中,该核酸酶为DNA核酸酶。 在一些实施方案中,该核酸酶是可以切割DNA-RNA杂合分子的核 酸酶。在一些实施方案中,该核酸酶是切割DNA-RNA杂合分子的 RNA组分的核酸酶,如RNaseH。在一些情况下,该核酸外切酶活 性由聚合酶如DNA聚合酶I的5’-3’核酸外切酶活性来提供。在一 些情况下,该核酸酶特异性地切割dU,如尿嘧啶-DNA糖基化酶。 在一些实施方案中,该可切割5’端包含选自:荧光团、双脱氧核苷 酸、脱氧核苷酸、放射性标记、染料、dUTP、rA、rU、rG、rC、 rUTP和限制酶靶序列或其任何组合的修饰。在一些实施方案中, 该可切割5’端包含dUTP。在一些实施方案中,该可切割5’端包含 rUTP。在一些实施方案中,该可切割5’端为1-5个核苷酸。在一些 实施方案中,该可切割5’端为1个核苷酸。在一些实施方案中,该 切割去除引物的1-5个核苷酸。在一些实施方案中,该切割从引物 去除一个或多个核苷酸。在一些实施方案中,该切割包括切割一个 或多个碱基。在一些实施方案中,所述一个或多个突出端包含胸腺 嘧啶。在一些实施方案中,所述一个或多个突出端包含腺嘌呤。在 一些实施方案中,一个或多个突出端包含鸟嘌呤。在一些实施方案 中,所述一个或多个突出端包含胞嘧啶。在一些实施方案中,所述 一个或多个突出端包含胸腺嘧啶,并且3’突出端包含腺嘌呤。在一 些实施方案中,所述一个或多个突出端包含1-5个核苷酸。在一些 实施方案中,所述一个或多个突出端包含选自以下修饰的1-5个核 苷酸:荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记、染料、 dUTP、rA、rU、rG、rC、rUTP和限制酶靶序列或其任何组合。在 一些实施方案中,所述延伸步骤(例如,使用dNTP,含有dUTP、 rA、rU、rG、rC、rUTP、荧光团、双脱氧核苷酸、脱氧核苷酸、 放射性标记或染料以用于下游纯化或降解的dNTP)产生平端。在 一些实施方案中,所述衔接物包含测序衔接物。在一些实施方案中, 该衔接物包含核酸条码。在一些实施方案中,该衔接物包含核酸条 码序列。在一些情况下,可对该衔接物连接的文库进行测序。在一 些实施方案中,所述多核苷酸为古多核苷酸。在一些实施方案中, 该多核苷酸包含少于10个核酸拷贝。在一些实施方案中,将所述 方法执行两次或更多次。可采用单个清理步骤来执行整个文库制备。 可采用不超过两个清理步骤来执行整个文库制备。可采用仅三个清 理步骤来执行整个文库制备。
在一方面,本公开内容提供了一种用于生成双链核酸分子的 衔接子连接的文库的方法,其包括:在单一反应容器或反应混合物 中,使多个单链多核苷酸与第一组靶标特异性引物相接触,每个靶 标特异性引物包含可切割5'端;延伸该第一组引物(例如,使用 dNTP,含有dUTP、rA、rU、rG、rC、rUTP、荧光团、双脱氧核 苷酸、脱氧核苷酸、放射性标记或染料以用于下游纯化或降解的 dNTP)以生成与该单链多核苷酸杂交的第一延伸产物,从而形成 第一双链双链体;使该第一双链双链体变性为单链;使该第一多核 苷酸延伸产物与第二组靶标特异性引物杂交(该第一和第二组引物 可以相同或不同;例如,第一组引物可与该靶核酸(或其上游)特 异性杂交。该第二组引物可与同该靶核酸或其上游)互补的序列特 异性杂交);延伸该第二组引物以生成与该第一延伸产物杂交的第 二延伸产物,从而形成第二双链双链体;切割该第一延伸产物和/ 或该第二延伸产物的可切割5'端,从而形成具有一个或多个突出端 的第二双链双链体;以及使包含3'突出端的一个或多个双链衔接物 与先前步骤的第二双链双链体相连接,从而形成衔接子连接的文库, 其中所述方法仅包括两个延伸步骤。所述双链衔接物可以包含,例 如,核酸条码,诸如样品条码、分子条码或随机化条码。可采用单 个清理步骤来执行整个文库制备。可采用不超过两个清理步骤来执 行整个文库制备。可采用仅三个清理步骤来执行整个文库制备。
在一些实施方案中,所述靶标特异性引物包含5’随机化尾部。 在一些实施方案中,该随机化尾部包含可切割5’端。在一些实施方 案中,所述单链多核苷酸为ssDNA。在一些实施方案中,该单链多 核苷酸为RNA。在一些实施方案中,所述引物是随机的,如随机 六聚体。在一些实施方案中,该引物的长度为4至30个核苷酸的 长度。在一些实施方案中,所述可切割5’端是可通过光切割来切割 的。在一些实施方案中,该可切割5’端是可被核酸酶切割的。在一 些实施方案中,该核酸酶为核酸外切酶。在一些实施方案中,该核 酸酶为核酸内切酶。在一些实施方案中,该核酸酶为RNA核酸酶。 在一些实施方案中,该核酸酶为DNA核酸酶。在一些实施方案中, 该核酸酶是可以切割DNA-RNA杂合分子的核酸酶。在一些实施方 案中,该核酸酶是切割DNA-RNA杂合分子的RNA组分的核酸酶, 如RNaseH。在一些情况下,该核酸外切酶活性由聚合酶如DNA 聚合酶I的5’-3’核酸外切酶活性来提供。在一些情况下,该核酸酶 特异性地切割dU,如尿嘧啶-DNA糖基化酶。在一些实施方案中, 该可切割5’端包含选自:荧光团、双脱氧核苷酸、脱氧核苷酸、放 射性标记、染料、dUTP、rA、rU、rG、rC、rUTP和限制酶靶序列 或其任何组合的修饰。在一些实施方案中,该可切割5’端包含dUTP。 在一些实施方案中,该可切割5’端包含rUTP。在一些实施方案中, 该可切割5’端为1-5个核苷酸。在一些实施方案中,该可切割5’ 端为1个核苷酸。在一些实施方案中,该切割去除该引物的1-5个 核苷酸。在一些实施方案中,该切割从该引物去除一个或多个核苷 酸。在一些实施方案中,该切割包括切割一个或多个碱基。在一些 实施方案中,所述一个或多个突出端包含胸腺嘧啶。在一些实施方 案中,所述一个或多个突出端包含腺嘌呤。在一些实施方案中,一 个或多个突出端包含鸟嘌呤。在一些实施方案中,所述一个或多个 突出端包含胞嘧啶。在一些实施方案中,所述一个或多个突出端包 含胸腺嘧啶,并且所述3’突出端包含腺嘌呤。在一些实施方案中, 所述一个或多个突出端包含1-5个核苷酸。在一些实施方案中,所 述一个或多个突出端包含选自以下修饰的1-5个核苷酸:荧光团、 双脱氧核苷酸、脱氧核苷酸、放射性标记、染料、dUTP、rA、rU、 rG、rC、rUTP和限制酶靶序列或其任何组合。在一些实施方案中, 所述延伸步骤(例如,使用dNTP,含有dUTP、rA、rU、rG、rC、 rUTP、荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记或染料 以用于下游纯化或降解的dNTP)产生平端。在一些实施方案中, 所述衔接物包含测序衔接物。在一些实施方案中,该衔接物包含核 酸条码。在一些实施方案中,该衔接物包含核酸条码序列。在一些 情况下,可对该衔接物连接的文库进行测序。在一些实施方案中, 所述多核苷酸为古多核苷酸。在一些实施方案中,该多核苷酸包含 少于10个核酸拷贝。在一些实施方案中,将所述方法执行两次或 更多次。可采用单个清理步骤来执行整个文库制备。可采用不超过 两个清理步骤来执行整个文库制备。可采用仅三个清理步骤来执行 整个文库制备。
在一方面,本公开内容提供了一种用于制备多核苷酸文库的 方法,其包括:使多个单链多核苷酸与包含可切割5’端的第一组随 机引物相接触;延伸该引物以生成与该多核苷酸杂交的第一延伸产 物,从而形成双链双链体;切割可切割5’端,从而生成具有第一突 出端的双链双链体;以及使一个或多个衔接子与先前步骤的双链双 链体连接,其中该一个或多个衔接子包含与该第一突出端互补的突 出端,并且其中该方法仅包括一轮延伸。可采用单个清理步骤来执 行整个文库制备。可采用不超过两个清理步骤来执行整个文库制备。 可采用仅三个清理步骤来执行整个文库制备。
在一些实施方案中,所述多核苷酸为ssDNA。在一些实施方 案中,该多核苷酸为RNA。在一些实施方案中,所述引物是随机 的,如随机六聚体。在一些实施方案中,该引物的长度为4至30 个核苷酸的长度。在一些实施方案中,所述可切割5’端可通过光切 割来切割。在一些实施方案中,该可切割5’端可被核酸酶切割。在 一些实施方案中,该核酸酶为核酸外切酶。在一些实施方案中,该 核酸酶为核酸内切酶。在一些实施方案中,该核酸酶为RNA核酸 酶。在一些实施方案中,该核酸酶为DNA核酸酶。在一些实施方 案中,该核酸酶是可以切割DNA-RNA杂合分子的核酸酶。在一些 实施方案中,该核酸酶是切割DNA-RNA杂合分子的RNA组分的 核酸酶,如RNaseH。在一些情况下,该核酸外切酶活性由聚合酶 如DNA聚合酶I的5’-3’核酸外切酶活性来提供。在一些情况下, 该核酸酶特异性地切割dU,如尿嘧啶-DNA糖基化酶。在一些实施 方案中,该可切割5’端包含选自:荧光团、双脱氧核苷酸、脱氧核 苷酸、放射性标记、染料、dUTP、rA、rU、rG、rC、rUTP和限制 酶靶序列或其任何组合的修饰。在一些实施方案中,该可切割5’ 端包含dUTP。在一些实施方案中,该可切割5’端包含rUTP。在一 些实施方案中,该可切割5’端来自于1-5个核苷酸。在一些实施方 案中,该可切割5’端为1个核苷酸。在一些实施方案中,该切割去 除该引物的1-5个核苷酸。在一些实施方案中,该切割从该引物去 除一个或多个核苷酸。在一些实施方案中,该切割包括切割一个或 多个碱基。在一些实施方案中,所述一个或多个突出端包含胸腺嘧 啶。在一些实施方案中,所述一个或多个突出端包含腺嘌呤。在一 些实施方案中,一个或多个突出端包含鸟嘌呤。在一些实施方案中, 所述一个或多个突出端包含胞嘧啶。在一些实施方案中,所述一个 或多个突出端包含胸腺嘧啶,并且所述3’突出端包含腺嘌呤。在一 些实施方案中,所述一个或多个突出端包含1-5个核苷酸。在一些 实施方案中,所述一个或多个突出端包含选自以下修饰的1-5个核 苷酸:荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记、染料、 dUTP、rA、rU、rG、rC、rUTP和限制酶靶序列或其任何组合。在 一些实施方案中,所述延伸步骤(例如,使用dNTP,含有dUTP、 rA、rU、rG、rC、rUTP、荧光团、双脱氧核苷酸、脱氧核苷酸、 放射性标记或染料以用于下游纯化或降解的dNTP)产生平端。在 一些实施方案中,所述衔接物包含测序衔接物。在一些实施方案中, 该衔接物包含核酸条码。在一些实施方案中,该衔接物包含由含有 可切割3'或5'端的任一衔接子寡核苷酸生成的核酸随机化条码。在 一些实施方案中,所述方法进一步包括对该衔接物连接的文库进行 测序。在一些实施方案中,所述多核苷酸为古多核苷酸。在一些实 施方案中,起始单链多核苷酸包含少于10个核酸分子拷贝。在一 些实施方案中,将所述方法执行两次或更多次。可采用单个清理步 骤来执行整个文库制备。可采用不超过两个清理步骤来执行整个文 库制备。可采用仅三个清理步骤来执行整个文库制备。
在一方面,本公开内容提供了用于生成双链核酸分子的衔接 子连接的文库的方法,其包括:在单一反应容器或反应混合物中, 使多个单链多核苷酸与随机引物库接触,每个随机引物包含可切割 5’端;延伸该引物以生成与该单链多核苷酸杂交的第一延伸产物, 从而形成第一双链双链体;使该第一双链双链体变性为单链;使该 第一多核苷酸延伸产物与来自靶标特异性引物库的引物杂交;延伸 该引物以生成与该第一延伸产物杂交的第二延伸产物,从而形成第 二双链双链体;切割该第一延伸产物或该第二延伸产物的可切割5’ 端,从而形成具有一个或多个突出端的第二双链双链体;以及使包 含3’突出端的一个或多个双链衔接物与先前步骤的第二双链双链 体连接,从而形成该衔接子连接的文库,其中所述方法仅包括两个 延伸步骤。可采用单个清理步骤来执行整个文库制备。可采用不超 过两个清理步骤来执行整个文库制备。可采用仅三个清理步骤来执 行整个文库制备。
在一些实施方案中,所述多核苷酸为DNA。在一些实施方案 中,该多核苷酸为RNA。在一些实施方案中,所述引物是随机的, 如随机六聚体。在一些实施方案中,该引物的长度为4至30个核 苷酸的长度。在一些实施方案中,所述可切割5’端可通过光切割来 切割。在一些实施方案中,该可切割5’端可被核酸酶来切割。在一 些实施方案中,该核酸酶为核酸外切酶。在一些实施方案中,该核 酸酶为核酸内切酶。在一些实施方案中,该核酸酶为RNA核酸酶。 在一些实施方案中,该核酸酶为DNA核酸酶。在一些实施方案中, 该核酸酶是可以切割DNA-RNA杂合分子的核酸酶。在一些情况下, 该核酸酶可以是切割DNA-RNA杂合分子的RNA组分的核酸酶, 如RNaseH。在一些情况下,该核酸外切酶活性由聚合酶如DNA 聚合酶I的5’-3’核酸外切酶活性提供。在一些情况下,该核酸酶特 异性地切割dU,如尿嘧啶-DNA糖基化酶。在一些实施方案中,所 述可切割5’端包含选自:荧光团、双脱氧核苷酸、脱氧核苷酸、放 射性标记、染料、dUTP、rA、rU、rG、rC、rUTP和限制酶靶序列 或其任何组合的修饰。在一些实施方案中,该可切割5’端包含dUTP。 在一些实施方案中,该可切割5’端包含rUTP。在一些实施方案中, 该可切割5’端为1-5个核苷酸。在一些实施方案中,该可切割5’ 端为1个核苷酸。在一些实施方案中,该切割去除该引物的1-5个 核苷酸。在一些实施方案中,该切割从该引物去除一个或多个核苷 酸。在一些实施方案中,该切割包括切割一个或多个碱基。在一些 实施方案中,所述一个或多个突出端包含胸腺嘧啶。在一些实施方 案中,所述一个或多个突出端包含腺嘌呤。在一些实施方案中,一 个或多个突出端包含鸟嘌呤。在一些实施方案中,所述一个或多个 突出端包含胞嘧啶。在一些实施方案中,所述一个或多个突出端包 含胸腺嘧啶,并且所述3’突出端包含腺嘌呤。在一些实施方案中, 所述一个或多个突出端包含1-5个核苷酸。在一些实施方案中,所 述一个或多个突出端包含选自以下修饰的1-5个核苷酸:荧光团、 双脱氧核苷酸、脱氧核苷酸、放射性标记、染料、dUTP、rA、rU、 rG、rC、rUTP和限制酶靶序列或其任何组合。在一些实施方案中, 所述延伸步骤(例如,使用dNTP,含有dUTP、rA、rU、rG、rC、 rUTP、荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记或染料 以用于下游纯化或降解的dNTP)产生平端。在一些实施方案中, 所述衔接物包含测序衔接物。在一些实施方案中,该衔接物包含核 酸条码。在一些实施方案中,该衔接物包含核酸条码。在一些实施 方案中,该衔接物包含核酸条码序列。在一些情况下,可对该衔接 物连接的文库进行测序。在一些实施方案中,该多核苷酸为古多核 苷酸。在一些实施方案中,所述多核苷酸包含少于10个核酸拷贝。 在一些实施方案中,将所述方法执行两次或更多次。可采用单个清 理步骤来执行整个文库制备。可采用不超过两个清理步骤来执行整 个文库制备。可采用仅三个清理步骤来执行整个文库制备。
在一方面,本公开内容提供了生成具有一个或多个突出端的 双链衔接物的方法。可在单一反应混合物或反应容器中生成该双链 衔接物。可以通过使两个寡核苷酸库退火来生成该双链衔接物。该 第一寡核苷酸库内的每个寡核苷酸可选地包含5’可切割核苷酸。该 第二寡核苷酸库内的每个寡核苷酸可包含与该第一个库中的寡核 苷酸的一部分互补的序列和5’可切割核苷酸。在一些情况下,来自 该第二寡核苷酸库的每个寡核苷酸均可包含介于与该第一个库中 的寡核苷酸的一部分互补的序列和该5’可切割核苷酸之间的条码 序列。该条码序列可以是随机的。该条码序列可以是非随机的。该 条码序列可以是半随机的,诸如例如,通过利用半简并引物合成来 制备寡核苷酸。来自该第一库的寡核苷酸可与来自该第二库的寡核 苷酸杂交以形成双链体。可以延伸该双链体中来自该第一库的寡核 苷酸,从而使来自该第一库的寡核苷酸与同该可选的条码序列互补 并且与来自该第二库的寡核苷酸的可切割核苷酸互补的序列共价 连接。可以切割位于该衔接物一个或多个末端的一种或多种可切割 核苷酸。可在本文任何方法中使用该切割的衔接物用于文库制备和 测序。在一些情况下,该第二寡核苷酸库包含超过三种或更多种、 四种或更多种、五种或更多种、六种或更多种、七种或更多种、八 种或更多种、九种或更多种、十种或更多种、12种或更多种、14 种或更多种、16种或更多种、18种或更多种、20种或更多种、22 种或更多种、24种或更多种、26种或更多种、28种或更多种、30 种或更多种、32种或更多种、36种或更多种、42种或更多种、48 种或更多种、54种或更多种、60种或更多种、64种或更多种、66 种或更多种、72种或更多种、78种或更多种、84种或更多种、90 种或更多种、98种或更多种、120种或更多种、128种或更多种、 160种或更多种、200种或更多种、240种或更多种、256种或更多 种、280种或更多种、512种或更多种、1024种或更多种、2048种 或更多种或者4096种或更多种不同的序列条码。
所述寡核苷酸可以为4至150个核苷酸的长度。除了随机条 码和5’可切割核苷酸之外,该寡核苷酸可以是完全互补的。在一些 实施方案中,该寡核苷酸仅部分互补。在一些实例中,该可切割5’ 端可通过光切割来切割。在一些实施方案中,该可切割5’端可被核 酸酶切割。在一些实施方案中,该核酸酶为核酸外切酶。在一些实 施方案中,该核酸酶为核酸内切酶。在一些实施方案中,该核酸酶 为RNA核酸酶。在一些实施方案中,该核酸酶为DNA核酸酶。 在一些实施方案中,该核酸酶是可以切割DNA-RNA杂合分子的核 酸酶。在一些实施方案中,该核酸酶是切割DNA-RNA杂合分子的 RNA组分的核酸酶,如RNaseH。在一些情况下,该核酸外切酶活 性由聚合酶如DNA聚合酶I的5’-3’核酸外切酶活性来提供。在一 些情况下,该核酸酶特异性地切割dU,如尿嘧啶-DNA糖基化酶。 在一些实施方案中,该可切割5’端包含选自:荧光团、双脱氧核苷 酸、脱氧核苷酸、放射性标记、染料、dUTP、rA、rU、rG、rC、 rUTP和限制酶靶序列或其任何组合的修饰。在一些实施方案中, 该可切割5’端包含dUTP。在一些实施方案中,该可切割5’端包含 rUTP。在一些实施方案中,该可切割5’端为1-5个核苷酸。在一些 实施方案中,该可切割5’端为1个核苷酸。在一些实施方案中,该 切割去除该引物的1-5个核苷酸。在一些实施方案中,该切割从该 引物去除一个或多个核苷酸。在一些实施方案中,该切割包括切割 一个或多个碱基。在一些实施方案中,所述一个或多个突出端包含 胸腺嘧啶。在一些实施方案中,所述一个或多个突出端包含腺嘌呤。 在一些实施方案中,一个或多个突出端包含鸟嘌呤。在一些实施方 案中,所述一个或多个突出端包含胞嘧啶。在一些实施方案中,该 衔接物包含由含有可切割3’或5’端的任一衔接子寡核苷酸生成的 核酸随机化条码。在一些实施方案中,该方法进一步包括对该衔接 物连接的文库进行测序。
在一方面,本公开内容提供了一种试剂盒,其包含:包含一 组随机引物的第一容器,每个随机引物包含可切割5’端;包含聚合 酶的第二容器;包含衔接子的第三容器,其中每个衔接子包含与该 可切割5’端互补的突出端;以及使用说明书,其中该说明书指示该 随机引物用于仅两轮延伸的用法。在一些实施方案中,该试剂盒进 一步包含含有连接酶的容器。在一些实施方案中,该试剂盒进一步 包含含有缓冲液的容器。
在生成具有突出端的双链核酸片段或具有突出端的双链衔接 物的具体实例中,所述5’可切割端包含一个或多个RNA碱基或者 一个或多个dU。如果该5’可切割端包含RNA碱基,则该切割在一 些情况下可由RNaseH或聚合酶,如DNA聚合酶I的5’→3’核酸 外切酶活性来介导。如果该可切割5’端包含dU,则该切割可由尿 嘧啶-DNA糖基化酶来介导。在切割该5’可切割端之后,该双链核 酸片段或双链衔接物可以具有一个或多个突出端。这些突出端可以 提高具有互补突出端的序列的连接反应的效率。然后可使该具有5’ 突出端的核酸片段与具有互补3’突出端的衔接物相连接,以生成衔 接物连接的测序文库。
在一方面,本公开内容提供了一种试剂盒,其包含:包含一 组随机引物的第一容器,每个随机引物包含可切割5’端;包含聚合 酶的第二容器;包含衔接子的第三容器,其中每个衔接子包含与该 可切割5’端互补的突出端;以及使用说明书,其中该说明书指示该 随机引物库用于仅一轮延伸的用法。在一些实施方案中,该试剂盒 进一步包含含有连接酶的容器。在一些实施方案中,该试剂盒进一 步包含含有缓冲液的容器。
本申请提供了以下各项:
1.一种用于生成双链核酸分子的衔接子连接的文库的方法, 其包括在单一反应容器或反应混合物中:
(a)由多个单链多核苷酸生成包含一条或两条链的可切割5’端 的多个双链DNA分子;
(b)用切割剂切割所述可切割5’端以产生包含一个或多个突出 端的双链DNA分子;以及
(c)使包含3’突出端的一个或多个双链衔接物与所述具有一个 或多个突出端的双链DNA分子相连接,从而形成所述衔接物连接 的文库;以及,可选地,
(d)对所述衔接物连接的文库进行测序,
其中所述多个单链多核苷酸以小于约5纳克的量存在。
2.根据项目1所述的方法,其中所述可切割5’端选自:rA、 rC、rG、rU或dU。
3.根据项目1所述的方法,其中以高于90%的效率进行所述 连接。
4.根据项目1所述的方法,其中所述生成包括:
(a)使所述多个单链多核苷酸与第一引物库相接触,其中来自 该第一库的每个引物包含可切割5’端;
(b)延伸来自所述第一库的引物以生成与所述单链多核苷酸杂 交的第一延伸产物,从而形成第一双链双链体;
(c)使所述第一双链双链体变性为单链;
(d)使所述第一多核苷酸延伸产物与第二引物库杂交,其中来 自该第二库的每个引物可选地包含可切割5’端;
(e)延伸来自所述第二库的引物以生成与所述第一延伸产物杂 交的第二延伸产物,从而形成第二双链双链体。
5.根据项目4所述的方法,其中所述第一引物库和所述第二 引物库为包含5’可切割端的随机引物库。
6.根据项目4所述的方法,其中所述第一引物库包含随机引 物,而所述第二库包含靶标特异性引物。
7.根据项目4所述的方法,其中所述第一引物库包含靶标特 异性引物,而所述第二库包含随机引物。
8.根据项目4所述的方法,其中所述第一引物库包含靶标特 异性引物,而所述第二库包含靶标特异性引物。
9.根据项目6所述的方法,其中所述靶标特异性引物包含位 于所述靶标特异性序列上游的随机化条码序列。
10.根据项目7所述的方法,其中所述靶标特异性引物包含位 于所述靶标特异性序列上游的随机化条码序列。
11.根据项目8所述的方法,其中所述第一靶标特异性引物库 和第二靶标特异性引物库包含位于所述靶标特异性序列上游的条 码序列。
12.根据项目1所述的方法,其中所述生成包括:
(a)使多个多核苷酸与包含可切割5’端的引物库相接触;
(b)延伸所述引物以生成与所述多核苷酸杂交的第一延伸产物, 从而形成双链双链体;
(c)切割所述可切割5’端,从而生成具有第一突出端的双链双 链体;以及
(d)使一个或多个衔接子与(c)中的所述双链双链体相连接,其 中所述一个或多个衔接子包含与所述第一突出端互补的突出端,
其中所述方法仅包括一轮延伸。
13.根据项目12所述的方法,其中所述引物库包含随机引物。
14.根据项目12所述的方法,其中所述引物库包含靶标特异 性引物。
15.根据项目14所述的方法,其中所述靶标特异性引物包含 位于所述靶标特异性序列上游的条码序列。
16.一种用于生成双链核酸分子的衔接子连接的文库的方法, 其包括在单一反应容器或反应混合物中:
(a)使所述多个单链多核苷酸与第一引物库相接触,其中来自 该第一库的每个引物包含可切割5’端;
(b)延伸来自所述第一库的引物以生成与所述单链多核苷酸杂 交的第一延伸产物,从而形成第一双链双链体;
(c)使所述第一双链双链体变性为单链;
(d)使所述第一多核苷酸延伸产物与第二引物库杂交,其中来 自该第二库的每个引物可选地包含可切割5’端;
(e)延伸来自所述第二库的引物以生成与所述第一延伸产物杂 交的第二延伸产物,从而形成第二双链双链体。
(f)用切割剂来切割所述可切割5’端以产生包含一个或多个突 出端的双链DNA分子;以及
(g)使包含3’突出端的一个或多个双链衔接物与所述具有一个 或多个突出端的双链DNA分子相连接,从而形成所述衔接物连接 的文库;以及,可选地,
(h)对所述衔接物连接的文库进行测序。
17.根据项目16所述的方法,其中所述可切割5’端选自:rA、 rC、rG、rU或dU。
18.根据项目16所述的方法,其中所述第一引物库和所述第 二引物库为包含5’可切割端的随机引物库。
19.根据项目16所述的方法,其中所述第一引物库包含随机 引物,而所述第二库包含靶标特异性引物。
20.根据项目16所述的方法,其中所述第一引物库包含靶标 特异性引物,而所述第二库包含随机引物。
21.根据项目16所述的方法,其中所述第一引物库包含靶标 特异性引物,而所述第二库包含靶标特异性引物。
22.根据项目19所述的方法,其中所述靶标特异性引物包含 位于所述靶标特异性序列上游的随机化条码序列。
23.根据项目20所述的方法,其中所述靶标特异性引物包含 位于所述靶标特异性序列上游的随机化条码序列。
24.根据项目21所述的方法,其中所述第一靶标特异性引物 库和第二靶标特异性引物库包含位于所述靶标特异性序列上游的 条码序列。
25.一种用于生成可选地包含序列条码的双链衔接物的方法, 其包括,在单一反应容器或反应混合物中:
(a)将第一寡核苷酸库与第二寡核苷酸库相组合,其中所述第 一寡核苷酸库内的每个寡核苷酸可选地包含可切割5’端,其中所述 第二库中的每个寡核苷酸包含(i)与所述第一库中的寡核苷酸的一 部分互补的序列;(ii)位于与所述第一库中的寡核苷酸的该部分互 补的序列上游的可选条码序列;和(iii)位于所述条码上游的可切割 5’端;
(b)使来自所述第一库的寡核苷酸与来自所述第二库的寡核苷 酸杂交以形成双链体;
(c)延伸来自所述第一库的寡核苷酸,从而使来自所述第一库 的寡核苷酸与同所述可选的条码序列互补并且与来自所述第二库 的寡核苷酸的可切割5’端互补的序列共价连接;
(d)切割所述可切割5’端以产生包含所述可选条码序列并包 含一个或多个突出端的双链衔接物;以及,可选地,
(e)使所述双链衔接物与包含一个或多个突出端的多个双链核 酸分子相连接。
26.根据项目25所述的方法,其中所述第二寡核苷酸库包含 十二种或更多种不同的条码序列。
27.根据项目25所述的方法,其中所述5’可切割端选自:rA、 rC、rG、rU或dU。
28.根据项目25所述的方法,其中所述条码序列是随机的。
29.根据项目25所述的方法,其中所述条码序列是非随机的。
30.根据项目25所述的方法,其中所述条码序列是半简并的。
援引并入
本说明书中提到的所有出版物、专利和专利申请均通过引用 而并入本文,其程度犹如特别地且单独地指出每个单独的出版物、 专利或专利申请通过引用而并入。
附图说明
本发明的新颖特征在所附权利要求书中具体阐述。通过参考 以下对利用本发明原理的说明性实施方案加以阐述的详细描述以 及附图,将获得对本发明的特征和优点的更好的理解,在这些附图 中:
图1描绘了本公开内容的双扩增法的示例性实施方案。
图2描绘了本公开内容的单扩增法的示例性实施方案。
图3描绘了示出本公开内容的未优化双扩增法的1.5%琼脂糖 凝胶。
图4阐释了来自图3的样品在1.5%琼脂糖凝胶上的再扩增产 物。
图5描绘了描述具有适当对照的双扩增过程的第二次重复尝 试的1.5%琼脂糖凝胶。
图6描绘了本公开内容的双扩增法在1.5%琼脂糖凝胶上的重 复。
图7示出了本公开内容的双扩增法在1.5%琼脂糖凝胶上的重 复。
图8描绘了来自图7的重复结果。x轴为DNA输入,y轴为 来自重复实验的DNA输出浓度。圆形和正方形表示平均值,而条 棒则对应于最小和最大输出范围。圆形表示150ng的DNA输入, 正方形表示75ng的DNA输入。
图9图示了本公开内容的单扩增法。
图10图示了本公开内容的双扩增法。
图11图示了本公开内容的示例性引物延伸方法。
图12描绘了本公开内容的示例性靶向引物延伸方法。
图13描述了通过两个单链DNA分子的退火而导致的衔接物 生成。
图14描绘了含有来自不完全互补寡核苷酸的随机条码的衔 接物的生成。
图15描绘了含有来自完全互补寡核苷酸的随机条码的衔接 物的生成。
具体实施方式
定义
如本文所使用的,“可切割端”可以指可切割的核酸的3’或5’ 端或其附近的核苷酸。可以通过包括化学、热或光解在内的非酶促 或酶促手段来切割可切割端,以使可切割端能够释放。可切割端既 可以指可选择性切割的官能团也可以指其经保护的形式。例如,可 切割端可以位于聚合物主链(即,经修饰的3’-5’核苷酸间连接代 替其中一个磷酸二酯基团),作为寡核苷酸引物其中一个碱基或糖 的取代基或替代物,并且/或者作为3’末端残基(例如,寡脱氧核 糖核苷酸引物3’端的核糖核苷酸)。在引物固定、杂交、引物延伸 和洗涤条件期间,可切割端在标准固相DNA合成条件下可以是稳 定的。可切割端还可包含可被诸如核酸酶等酶切割的核苷酸。例如, 可切割端可以是限制性内切核酸酶位点。用于在可切割端切割的示 例性限制性内切核酸酶可以包括BpmI、BsgI、BseRI、BsmFI和FokI。
可切割端还可以是能够通过具有5’至3’核酸外切酶活性的酶, 如T7基因6核酸外切酶来阻断或终止5’至3’酶促消化的核苷酸或 系列核苷酸。代表性的阻断核苷酸可以是包含硫代磷酸酯、硼酸- 磷酸酯或肽基团的核苷酸。阻断核苷酸和/或可切割端可以是不抑 制引物的酶促延伸的核苷酸。
如本文所使用的,术语“衔接子”或“衔接物”可互换使用,并 且可以指可与核酸末端连接的寡核苷酸。衔接子序列可以包含,例 如,启动位点、启动位点的互补体、核酸内切酶的识别位点、共同 序列和启动子。衔接子还可并入修饰衔接子序列性质的经修饰的核 苷酸。例如,可将硫代磷酸酯基团并入其中一个衔接子链中。
如本文所使用的术语“库”或“组”可以可互换地使用,并且可 以指分子的集合。组中的分子彼此间可以相同或不同。
如本文所使用的术语“互补”可以指核苷酸或核酸之间的杂交 或碱基配对,诸如例如,双链DNA分子的两条链之间或者寡核苷 酸引物与待测序或待扩增的单链核酸上的引物结合位点之间。互补 核苷酸通常可以是A(腺嘌呤)和T(胸腺嘧啶)(或A和U)或 者C(胞嘧啶)和G(鸟嘌呤)。当一条链的核苷酸经最佳比对和 比较并经适当的核苷酸插入或缺失与另一条链的核苷酸配对时,两 条单链RNA或DNA分子可以是互补的。当RNA或DNA链在选 择性杂交条件下与其互补体杂交时,可以存在互补性。
如本文所使用的术语“引物”可以指,在在适当条件下,例如 缓冲液和温度、存在四种不同的核苷三磷酸和用于聚合的试剂,诸 如例如DNA或RNA聚合酶或逆转录酶,能够充当模板指导的DNA 合成起始点的单链寡核苷酸。引物可以充分互补以与这样的模板杂 交。引物可以包含引物位点,其可以指引物与靶核酸杂交的引物区 域。引物可以是引物库中的引物。引物可以是引物对的一部分。引 物对(例如靶标特异性引物)可以包含与待扩增序列的5’端杂交的 5’上游引物和与待扩增序列的3’端互补体杂交的3’下游引物。
总体概述
在一些实施方案中,本公开内容提供了使一个或多个衔接物 与双链核酸连接的方法。图1描绘了本公开内容的方法的示例性实 施方案。单链核酸105可与引物或随机引物库110相接触。引物可 以包含可切割5’端115。可以延伸120引物以形成第一双链双链体 125。可使第一双链双链体125变性130成为第一双链双链体125 的单链135。然后可使第一接触步骤中所用的相同(或不同)引物 与变性单链135接触140。可以延伸145引物以生成第二双链双链 体150。第二双链双链体150的一个或多个5’可切割端可与切割剂 155接触,切割剂155可以切割160一个或多个5’可切割端,从而 生成一个或多个突出端165。一个或多个突出端165可与双链核酸 175(例如测序衔接物)相连接170,双链核酸175包含与第二双 链双链体150的一个或多个突出端互补的突出端。优选地在单一反 应容器或反应混合物中来执行所有上述步骤。可在连接之前采用单 个清理步骤来执行所述方法。可采用单个清理步骤来执行整个文库 制备。可采用不超过两个清理步骤来执行整个文库制备。可采用仅 三个清理步骤来执行整个文库制备。清理可以指将靶核酸分子与杂 质、缓冲液或不需要的核酸分子如未连接的衔接物相分离的方法。 清理方法可以包括柱,如Qiagen DNA柱或Qiagen MinElute反应 清理试剂盒,或基于珠子的方法,如Ampure XP珠子。
在一些实施方案中,本公开内容的方法提供了使一个或多个 衔接物与双链核酸连接的方法,其中该方法仅使用一轮延伸(例如 扩增)。图2描绘了其中仅使用一轮延伸的本公开内容方法的示例 性实施方案。单链核酸205可与引物(例如随机引物库的引物)210 相接触。引物可以包含可切割5’端215。可以延伸220引物以形成 第一双链双链体225。第二双链双链体225的一个或多个5’可切割 端可与切割剂230接触,切割剂230可以切割235该一个或多个5’ 可切割端,从而生成一个或多个突出端240。一个或多个突出端240 可与双链核酸250(例如测序衔接物)连接245,双链核酸250包 含与第一双链双链体225的一个或多个突出端互补的突出端。
引物
本公开内容提供了包含一个或多个修饰(例如可切割的核苷 酸)的引物。一个或多个修饰(例如可切割的核苷酸)可以在5’ 端。一个或多个修饰(例如可切割的核苷酸)可以在3’端。一个或 多个修饰(例如可切割的核苷酸)可以在引物的末端之间。在一些 情况下,一个或多个修饰(例如可切割的核苷酸)在5’端。
一个或多个可切割的核苷酸可以包含至少1、2、3、4、5、6、 7、8、9或10个或更多个核苷酸。一种或多种可切割的核苷酸可 以包含至多1、2、3、4、5、6、7、8、9或10个或更多个核苷酸。 示例性可切割的核苷酸可以包括RNA、DNA、PNA或LNA、dU、 dA、dT、dC和dG或其任何组合。在一些实施方案中,可切割的 核苷酸为RNA核苷酸。
可切割的核苷酸可以包含修饰。不可切割的核苷酸可以包含 使其能够被切割的修饰。示例性修饰可以包括但不限于生物素化核 苷酸、甲基化核苷酸、乙酰化核苷酸、PNA核苷酸、多聚腺苷酸 化、多聚尿苷酸化和LNA核苷酸。在一些情况下,示例性修饰为 可由鸟苷酸转移酶添加的5’7-甲基鸟苷。
引物可以为至少1、2、3、4、5、6、7、8、9或10个或更多 个核苷酸的长度。引物可以为至多1、2、3、4、5、6、7、8、9或 10个或更多个核苷酸的长度。在一些情况下,引物为6个核苷酸 (六聚体)的长度。
引物可以是引物库的部分。引物库可以包含至少100、500、 1000、1500、2000、2500、3000、3500、4000、4500或5000种或 更多种引物。引物库可以包含至多100、500、1000、1500、2000、 2500、3000、3500、4000、4500或5000种或更多种引物。
引物可以是随机引物(例如随机六聚体引物)。随机引物库 可以包含基本上彼此不同的引物。随机引物库可与靶核酸内的多个 位置杂交。随机引物库可具有多个引物,其中每个引物与其他引物 各不相同。随机引物库中的引物可与随机引物库中的另一引物具有 至少1%、2%、3%、4%、5%、6%、7%、8%、9%或10%或更多的 互补性和/或同一性。随机引物库中的引物可与随机引物库中的另 一引物具有至多1%、2%、3%、4%、5%、6%、7%、8%、9%或 10%或更多的互补性和/或同一性。
引物可以是靶标特异性引物。靶标特异性引物可以是设计为 与靶核酸的特定区域杂交的引物。靶标特异性引物可与具有至少 30%、40%、50%、60%、70%、80%、90%、95%或100%互补性的 靶核酸杂交。靶标特异性引物可与具有至多30%、40%、50%、60%、 70%、80%、90%、95%或100%互补性的靶核酸杂交。靶标特异性 引物可在超过至少10%、20%、30%、40%、50%、60%、70%、80%、 90%或100%的引物长度上与靶核酸杂交。靶标特异性引物可在超 过至多10%、20%、30%、40%、50%、60%、70%、80%、90%或 100%的引物长度上与靶核酸杂交。靶标特异性引物可与靶核酸杂 交,并具有至少1、2、3、4、5、6、7、8、9或10个或更多个错 配。靶标特异性引物可与靶核酸杂交,并具有至多1、2、3、4、5、 6、7、8、9或10个或更多个错配。
在一些情况下,靶标特异性引物包含尾部。尾部可以为至少 1、2、3、4、5、6、7、8、9、10个或更多个核苷酸的长度。尾部 可以为至多1、2、3、4、5、6、7、8、9或10个或更多个核苷酸 的长度。尾部可以为1-5个核苷酸、1-10个核苷酸、1-15个核苷酸、 1-30个核苷酸、5-10个核苷酸、5-15个核苷酸或5-30个核苷酸的 长度。尾部可以包含随机序列。尾部可以包含随机六聚体。包含随 机序列的尾部可以是本公开内容的任何随机序列。例如,随机尾部 序列可以包含核苷酸,诸如例如荧光团、双脱氧核苷酸、脱氧核苷 酸、放射性标记、染料、dUTP、rA、rU、rG、rC、rUTP、由鸟苷 酸转移酶添加的5’7-甲基鸟苷,或限制酶靶序列。
方法
本公开内容提供了用于样品制备的方法(例如,用于测序的 衔接子连接)。可使包含单链核酸(例如RNA和/或DNA)的样 品与本公开内容的引物接触。引物可以包含修饰(例如,其5’端的 可切割核苷酸)。引物(或引物库中的引物)可与靶核酸(例如片 段化的靶核酸)库内的一个或多个位置结合。引物(或引物库中的 引物)可与靶核酸库内的特定位置结合。
可以延伸引物(例如,使用dNTP,含有dUTP、rA、rU、rG、 rC、rUTP、荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记或 染料以用于下游纯化或降解的dNTP)。在某些情况下,引物延伸 仅发生一次。引物延伸的长度可取决于用来进行延伸的聚合酶的类 型。可用于延伸的示例性聚合酶可以包括但不限于DNA聚合酶、 RNA聚合酶、逆转录酶、DNA聚合酶I、polyA聚合酶、Bst聚合 酶大片段、Bst 2.0(NEB)、Bst 2.0Warmstart聚合酶、Klenow(exo-)、 Klenow大片段、DNA聚合酶I大(Klenow)片段、T4 DNA聚合 酶、Bsu聚合酶大片段、Sulfolobus DNA聚合酶、Deep Vent(exo-) DNA聚合酶(NEB)、Deep Vent DNA聚合酶(NEB)、Vent DNA 聚合酶、Taq、phi29、T7 RNA聚合酶、转移酶(例如,添加5’7- 甲基鸟苷的鸟苷酸转移酶,甲基转移酶、酰基转移酶、硒基转移酶、 转酮酶、糖基转移酶、酰基转移酶)和rTth DNA聚合酶。引物延 伸产物的长度可以是至少100、200、300、400、500、600、700、 800、900、1000、1100、1200、1300、1400、1500、1600、1700、 1800、1900或2000个或更多个碱基。引物延伸产物的长度可以是 至多100、200、300、400、500、600、700、800、900、1000、1100、 1200、1300、1400、1500、1600、1700、1800、1900或2000个或 更多个碱基。引物延伸可以产生双链双链体,其中一条链包含可切 割5’端。延伸可在室温下进行。延伸可在不改变反应温度的情况下 进行。
在一些情况下,所述方法包括第二轮延伸。第二轮延伸包括 使包含可切割5’端的双链双链体变性成其相应的单链。变性的双链 双链体的一条链可对应于原始的单链靶核酸。变性的双链双链体的 一条链可对应于并入可切割5’端的引物延伸产物。在第二轮延伸中, 来自引物库的引物可与引物延伸产物上的一个或多个区域杂交。可 通过引物延伸来延伸引物。引物延伸的长度可取决于用来进行延伸 的聚合酶的类型。可用于延伸的示例性聚合酶可以包括但不限于 DNA聚合酶、RNA聚合酶、逆转录酶、DNA聚合酶I、polyA聚 合酶、Bst聚合酶大片段、Bst 2.0(NEB)、Bst 2.0Warmstart聚合 酶、Klenow(exo-)、Klenow大片段、DNA聚合酶I大(Klenow) 片段、T4 DNA聚合酶、Bsu聚合酶大片段、Sulfolobus DNA聚合 酶、Deep Vent(exo-)DNA聚合酶(NEB)、Deep Vent DNA聚 合酶(NEB)、Vent DNA聚合酶、Taq、phi29、T7 RNA聚合酶、 转移酶(例如,添加5’7-甲基鸟苷的鸟苷酸转移酶,甲基转移酶、 酰基转移酶、硒基转移酶、转酮酶、糖基转移酶、酰基转移酶)和 rTth DNA聚合酶。第二引物延伸产物的长度可以是至少100、200、 300、400、500、600、700、800、900、1000、1100、1200、1300、 1400、1500、1600、1700、1800、1900或2000个或更多个碱基。 第二引物延伸产物的长度可以是至多100、200、300、400、500、 600、700、800、900、1000、1100、1200、1300、1400、1500、1600、 1700、1800、1900或2000个或更多个碱基。引物延伸可产生双链 双链体,其中两条链均包含可切割的5’端。
当存在两轮引物延伸时,可用靶标特异性引物来执行第一轮 延伸,可用随机引物来执行第二轮延伸。当存在两轮引物延伸时, 可用随机引物来执行第一轮延伸,可用靶标特异性引物来执行第二 轮延伸。
在一些情况下,可以存在多轮引物延伸。引物延伸的轮数可 以为至少1、2、3、4、5、6、7、8、9或10或更多。引物延伸的 轮数可以为至多1、2、3、4、5、6、7、8、9或10或更多。在一 些情况下,执行一轮引物延伸。在一些情况下,执行两轮引物延伸。
衔接子的连接
可用切割剂来切割包含一个或两个可切割端的双链双链体以 去除可切割端。切割剂对于5’可切割端上的可切割核苷酸可以是特 异性的。例如,如果核苷酸为尿嘧啶,则可切割剂可以是尿嘧啶 -DNA糖基化酶(UDG)。示例性尿嘧啶-DNA糖基化酶可以包括 但不限于大肠杆菌(E.coli)尿嘧啶-DNA糖基化酶(NEB)、尿 嘧啶DNA-糖基化酶(Life Technologies)、Afu尿嘧啶-DNA糖基 化酶、南极热敏尿嘧啶DNA-糖基化酶、Epicenter HK-尿嘧啶-N- 糖基化酶、热敏尿嘧啶-N-糖基化酶,或尿嘧啶-DNA切割混合物, 或ThermoScientific尿嘧啶-DNA糖基化酶。切割剂对于特定序列 可以是非特异性的。例如,切割剂可以是维持其5’→3’核酸外切酶 活性的原核DNA聚合酶I。DNA聚合酶I可以来自不同的生物体 (例如大肠杆菌、枯草芽孢杆菌(B.subtilis)和水生栖热菌(Thermus aquaticus))。此类DNA聚合酶I可购自,例如,New England BioLabs、 Life Technologies和Epicentre。在其他实例中,切割剂可以是切割 DNA-RNA杂交分子的RNA部分的核酸酶。此类核酸酶可以包括 但不限于核糖核酸酶杂化酶热稳定RNAse H(Epicentre)、RBase HII、 RNase If、RNAse A、Rnase I、Rnase P、RNase T1和Riboshredder Rnase Blend。切割剂可以切割可切割核苷酸和相邻的不可切割核苷 酸之间的磷酸二酯键。切割剂可以切掉一个或多个5’可切割端的至 少1、2、3、4、5、6、7、8、9或10个或更多个核苷酸。切割剂 可以切掉一个或多个5’可切割端的至多12、3、4、5、6、7、8、9 或10个或更多个核苷酸。在特别优选的实施方案中,切割产生具 有相同序列的突出端,从而允许衔接物与互补突出端的连接。
所述切割剂可以为核酸酶。核酸酶可以为核酸内切酶。核酸 内切酶的实例包括限制酶、I型核酸内切酶、II型核酸内切酶、T7 核酸内切酶、T4核酸内切酶、Bal 31核酸内切酶、S1核酸酶、AP 核酸内切酶、DNaseI和Endo R。核酸酶可以为核酸外切酶。核酸 外切酶的实例包括5’-3’核酸外切酶、3’-5’核酸外切酶、核酸外切 酶I、核酸外切酶II、核酸外切酶III、核酸外切酶IV、核酸外切酶 V、T7核酸外切酶和λ核酸外切酶。核酸酶可以为DNA核酸酶。 核酸酶可以为RNA核酸酶。RNA核酸酶的实例可以包括RNaseA、 RNaseH和RNase T1。核酸酶可以切割DNA。核酸酶可以切割RNA。 核酸酶可以切割一条或多条RNA-DNA杂合链。
5’可切割端的切割可产生突出端。突出端可以为至少1、2、3、 4、5、6、7、8、9或10个或更多个核苷酸的长度。突出端可以为 至多1、2、3、4、5、6、7、8、9或10个或更多个核苷酸的长度。 突出端可以为1-5个核苷酸、1-10个核苷酸、1-15个核苷酸、1-30 个核苷酸、5-10个核苷酸、5-15个核苷酸或5-30个核苷酸。突出 端可以包含具有修饰的一个或多个核苷酸。示例性修饰可以包括, 例如,荧光团、双脱氧核苷酸、脱氧核苷酸、放射性标记、染料、 dUTP、rA、rU、rG、rC、rUTP和限制酶靶序列。
在一些情况下,突出端为一个核苷酸的长度。一个核苷酸突 出端可以为A、T、G、C或U。在一些情况下,一个核苷酸突出端 为A。在一些情况下,一个核苷酸突出端为T。
待连接的衔接子可以包含突出端。衔接子的突出端可与可切 割端的突出端互补(即,衔接子的突出端可通过形成粘性末端与可 切割端的突出端杂交)。
待连接的衔接子可以包括测序衔接子(例如,用于深度测序)。 待连接的衔接子可以包含核酸条码序列(例如,用于标记核酸样品)。 衔接物可以包含由含有可切割3’或5’端的任一衔接子寡核苷酸生 成的核酸随机条码。衔接子可以包含任何核酸序列(例如限制酶序 列、经修饰的核苷酸、可切割的核苷酸、不可切割的核苷酸)。衔 接子可以全部为双链或基本上为双链。衔接子可以包含二级结构。 双链衔接子可以包含至少部分互补的两个寡核苷酸。可使衔接子在 一条或两条链上磷酸化或非磷酸化。衔接子可以包含双链部分和与 突出端完全或部分互补的单链突出端部分。例如,当用限制酶EcoRI 来消化DNA时,所得到的双链片段可在任一末端与单链突出端 5’-AATT-3’侧接,携带单链突出端5’-AATT-3’的衔接子可通过突 出区域之间的互补性与该片段杂交。这种衔接子与片段的“粘性末 端”杂交可以有助于衔接子与片段的连接。平端连接也可以是可能 的。可以利用Klenow片段的核酸外切酶活性将平端转化为粘性末 端。例如,当用PvuII消化DNA时,通过在dTTP和dCTP存在的 情况下以Klenow温育片段,可将平端转化为两个碱基对突出端。 通过填补突出端或去除突出端也可将突出端转化为平端。
可以通过使用连接酶进行连接。示例性连接酶可以包括 Ampligase热稳定DNA连接酶、大肠杆菌DNA连接酶、Taq DNA 连接酶、T7 DNA连接酶、T3 DNA连接酶、9°N DNA连接酶、 ElectroLigase(NEB)、DNA连接酶、RNA连接酶、T4 DNA连接 酶、DNA连接酶I、DNA连接酶III和DNA连接酶IV。连接方法 可以包括利用T4 DNA连接酶,其催化具有平端和粘性末端的双链 体DNA或RNA中并列的5’磷酸和3’羟基末端之间形成磷酸二酯 键;Taq DNA连接酶,其催化与互补靶DNA杂交的两个相邻寡核 苷酸的并列5’磷酸和3’羟基末端之间形成磷酸二酯键;大肠杆菌 DNA连接酶,其催化含有粘性末端的双链体DNA中并列的5’磷酸 和3’羟基末端之间形成磷酸二酯键;和T4 RNA连接酶,其通过形 成3’至5’磷酸二酯键来催化5’磷酰基封端的核酸供体与3’羟基封 端的核酸受体的连接。将衔接物与具有通过切割可切割5’核苷酸所 生成的突出端的核酸连接的任何公开方法的连接效率可以为>50%、 >60%、>70%、>80%、>90%、>95%、>98%、>99%或>99.5%。
在一些实施方案中,采用双链衔接子,并且仅一条链与引物 延伸产物相连接。可以选择性地阻断衔接子一条链的连接。例如, 可将衔接子的一条链设计成在衔接子该链的5’端和靶核酸的3’端 之间引入一个或多个核苷酸的缺口。衔接子5’端磷酸的缺失可以阻 断此5’端与可获取的3’OH的连接。
测序
可对包含与衔接子连接的单链多核苷酸的双链产物进行测序。 示例性测序技术可以包括,例如乳液PCR(来自Roche 454的焦磷 酸测序、来自Ion Torrent的半导体测序、来自Life Technologies的 SOLiD连接测序、来自Intelligent Biosystems的合成测序),流动 池上的桥式扩增(例如Solexa/lllumina)、Wildfire technology的等 温测序(Life Technologies)或通过滚环扩增生成的滚环集落 (rolonies)/纳米球(Complete Genomics、Intelligent Biosystems、 Polonator)。测序技术,如允许在无需提前克隆扩增的情况下直接 对单个分子进行测序的Heliscope(Helicos)、SMRT技术(Pacific Biosciences)或纳米孔测序(Oxford Nanopore)可以是合适的测序 平台。
样品
在本公开内容的方法中所用的样品可以包括含有核酸的各种 来源和组合物。样品可以为生物样品,但该术语还包括其他样品, 例如,包含核酸,诸如例如包含已纯化核酸的PCR产物或组合物 的人造样品。示例性样品可以包括但不限于全血;血液制品;红血 球;白血球;白膜层;拭子;尿;痰;唾液;精液;淋巴液;羊水; 脑脊液;腹腔积液;胸腔积液;活检样品;囊肿液;滑液;玻璃体 液;房水;囊液;眼清洗液;眼吸出物;血浆;血清;肺灌洗液; 肺吸出物;动物,包括人类或植物组织,包括但不限于肝脏、脾脏、 肾脏、肺、肠、脑、心脏、肌肉、胰腺、细胞培养物,以及从上述 样品或者可能存在于样品之上或之中的任何细胞和微生物以及病 毒获得的裂解物、提取物或物质和级分。从含有核酸的临床或法医 环境获得的材料也可在术语“样品”意指的含义内。样品可以为来源 于人类、动物、植物、细菌或真菌的生物样品。样品可以源自细胞、 组织和/或器官。样品还可以是经处理的样品,诸如保存的、固定 的和/或稳定的样品。样品可以包含RNA。样品可以包含DNA。
试剂盒
本公开内容提供了试剂盒。试剂盒可以包含用于实施本公开 内容的方法的试剂。试剂盒可以包含本公开内容的引物(例如,具 有5’可切割端的引物)。试剂盒可以包含引物(例如随机引物)库。 试剂盒可以包含靶标特异性引物。试剂盒可以包含不同的靶标特异 性引物库。
试剂盒可以包含一种或多种衔接子、聚合酶、切割剂和/或连 接酶。试剂盒可以包含用于引物延伸的试剂,如dNTP和/或NTP。 试剂盒可以包含缓冲液。缓冲液可用于试剂盒中所有物品的稀释、 激活和/或重构。可将试剂盒维持在室温下。可将试剂盒维持在4℃。 可将试剂盒冷冻。
试剂盒可以包含使用说明书。说明书可以是手写的或电子的。 使用说明书可以描述如何在本公开内容的方法中使用试剂盒。例如, 使用说明书可以描述以下方法:使单链多核苷酸样品与来自试剂盒 的随机引物库相接触;延伸该引物以生成与单链多核苷酸杂交的第 一延伸产物,从而生成第一双链双链体;使该双链双链体变性为其 单个链;使引物库与单个第一延伸产物链杂交;延伸该引物以生成 与第一延伸产物杂交的第二延伸产物,从而产生第二双链双链体; 切割该第二双链双链体的一个或多个5’可切割端,从而生成一个或 多个核苷酸突出端;以及使一个或多个衔接子与一个或多个核苷酸 突出端相连接。
在一些情况下,使用说明书可以描述以下方法:使单链多核 苷酸样品与来自试剂盒的靶标特异性引物库接触;延伸该引物以生 成与单链多核苷酸杂交的第一延伸产物,从而生成第一双链双链体; 使该双链双链体变性为其单个链;使引物库与单个第一延伸产物链 杂交;延伸该引物以生成与第一延伸产物杂交的第二延伸产物,从 而产生第二双链双链体;切割第二双链双链体的一个或多个5’可切 割端,从而生成一个或多个核苷酸突出端;以及使一个或多个衔接 子与一个或多个核苷酸突出端相连接,其中仅执行两个延伸步骤。
在一些情况下,使用说明书可以描述以下方法:使单链多核 苷酸样品与来自试剂盒的随机引物库相接触;延伸该引物以生成与 单链多核苷酸杂交的第一延伸产物,从而生成第一双链双链体;切 割第二双链双链体的一个或多个5’可切割端,从而生成一个或多个 核苷酸突出端;以及使一个或多个衔接子与一个或多个核苷酸突出 端相连接,其中仅执行一轮引物延伸。
在一些情况下,使用说明书可以描述以下方法:使单链多核 苷酸样品与来自试剂盒的随机引物库相接触;延伸该引物以生成与 单链多核苷酸杂交的第一延伸产物,从而生成第一双链双链体;使 双链双链体变性为其单个链;使靶标特异性引物库与单个第一延伸 产物链杂交;延伸该引物以生成与第一延伸产物杂交的第二延伸产 物,从而产生第二双链双链体;切割第二双链双链体的一个或多个 5’可切割端,从而生成一个或多个核苷酸突出端;以及使一个或多 个衔接子与一个或多个核苷酸突出端相连接,其中仅执行两个延伸 步骤。
尽管本文中已经示出并描述了本发明的优选实施方式,但对 于本领域技术人员显而易见的是,这些实施方式仅以示例的方式提 供。本领域技术人员现将在不偏离本发明的情况下想到许多变形、 改变和替换。应当理解,在实践本发明的过程中可以采用对本文所 描述的本发明实施方式的各种替代方案。旨在以所附权利要求来限 定本发明的范围,并由此涵盖这些权利要求范围内的方法和结构及 其等同项。
实施例
实施例1:DNA的单扩增
按照新一代测序的标准样品制备程序将基因组DNA片段化。 在可逆修饰的随机六聚体存在的情况下,将样品立即变性。将dNTP (或含有dUTP、rA、rU、rG、rC、rUTP、荧光团、双脱氧核苷酸、 脱氧核苷酸、放射性标记或染料以用于下游纯化或降解的dNTP)、 聚合酶和缓冲液的混合物加入样品。按照适用于聚合酶的温育时间 和条件,由经修饰的六聚体进行单延伸。采用具有5’-3’核酸酶活 性的DNA聚合酶I来去除由于延伸而超出模板分子的突出端。在 延伸完成之后,利用标准纯化程序来纯化样品。然后处理样品以去 除修饰(根据修饰类型进行不同处理),并将样品加入含有经修饰 的衔接子(例如Illumina衔接子)的TA/平端连接反应。一个衔接 子包含第二配对端衔接子的序列,该第二配对端衔接子包含与延伸 产物上的突出端互补的突出端。第二衔接子包含第一配对端衔接子 的序列,该第一配对端衔接子包含将与延伸产物两端之一的平端连 接的平端。然后可选地,选择该反应产物的大小并将反应直接置于 可根据所使用的衔接子进行选择的索引化(indexing)PCR反应中。 在可选PCR后,选择样品的大小以适合新一代测序的大小范围。
图9中示出了本公开内容的单次扩增法的示例性图解。
实施例2:DNA的双扩增
图10中示出了本公开内容的单扩增法的示例性图解。按照新 一代测序的标准样品制备程序将基因组DNA片段化。在可逆修饰 的随机六聚体存在的情况下,将样品立即变性。将dNTP(或者例 如,含有dUTP、rA、rU、rG、rC、rUTP、荧光团、双脱氧核苷酸、 脱氧核苷酸、放射性标记或染料以用于下游纯化或降解的dNTP)、 聚合酶和缓冲液的混合物加入样品。从经修饰的六聚体开始的第一 延伸遵循适用于聚合酶的温育时间和条件。一旦延伸完成,样品即 变性,并且如果必要,则将额外的聚合酶加入样品。第二延伸遵循 与第一延伸相同的条件。在第二延伸完成之后,利用标准纯化程序 来纯化样品。然后处理样品以去除修饰(根据修饰类型进行不同处 理),并将样品加入含有衔接子(例如Illumina衔接子)的TA连 接反应。然后可选地,选择该反应产物的大小并按照标准索引化 PCR程序将反应产物直接置于索引化PCR反应中。备选地,可以 将改变的衔接子与非基于PCR的方法一起使用。在PCR后,选择 样品的大小以适合新一代测序的大小范围。
例如,图3描绘了通过双扩增方法来制备的样品制备。第一 泳道含有O’GeneRuler 1kb加DNA梯。次亮的条带为500bp。下面 的条带对应于400、300和200bp。第二泳道示出了以150ng DNA 开始的测试样品。然后利用双扩增法处理样品以产生衔接物连接的 核酸片段。第三泳道以75ng DNA开始,然后利用双扩增法处理以 产生衔接物连接的核酸片段。第四泳道以150ng DNA开始,然后 利用双扩增法处理以产生衔接物连接的核酸片段。第五泳道以75 ng DNA开始,然后利用双扩增法处理以产生衔接物连接的核酸片 段。第五泳道是与第一泳道中使用的相同的分子量标准梯。PCR之 后的每种最终产物的浓度为:泳道2:21ng/μl;泳道3:34.3ng/μl; 泳道4:25.8ng/μl;泳道5:27.5ng/μl。
图4图示了来自图3的样品在1.5%琼脂糖凝胶上的再扩增产 物。为了从图3中低于200bp所示的衔接子-衔接子产物中去除衔 接物连接的核酸文库片段,通过约220-350bp的凝胶切除对样品的 大小进行选择,该范围对应于最亮尺寸范围的最小值和最大值。对 凝胶切除的样品进行柱纯化,并将其用作再扩增PCR反应的模板。 第一泳道含有O’GeneRuler 1kb加DNA梯。最亮的条带下方为 500bp。下面的条带对应于400、300和200bp。第二泳道示出了来 自图3第二泳道、经大小选择的产物的再扩增产物,其以按照双扩 增法处理的150ng模板开始。第三泳道示出了来自图3第三泳道、 经大小选择的产物的再扩增产物,其以按照双扩增法处理的75ng 模板开始。第四泳道示出了来自图3第四泳道、经大小选择的产物 的再扩增产物,其以按照双扩增法处理的150ng模板开始。第五 泳道示出了来自图3第五泳道、经大小选择的产物的再扩增产物, 其以按照双扩增法处理的75ng模板开始。第六泳道是与第一泳道 中使用的相同的分子量标准梯。定性地,样品显示在大小选择后得 以扩增。
图5描绘了描述具有适当对照的双扩增程序的第二次重复尝 试的1.5%琼脂糖凝胶。第一泳道含有O’GeneRuler 1kb加DNA梯。 最亮的条带下方对应于500bp。下面的条带对应于400、300和200bp。 第二泳道示出了以150ng DNA开始的测试样品。然后利用双扩增 法处理样品以产生衔接物连接的核酸片段。第三泳道为150ng DNA, 其被片段化但没有经历双扩增法,并在琼脂糖凝胶上立即流出。第 四泳道在不存在DNA和经修饰的六聚体的情况下经历双扩增法, 但含有Illumina衔接子。第五泳道在不存在DNA的情况下经历双 扩增方案,但含有经修饰的六聚体和Illumina衔接子。第六泳道经 历双扩增过程,但缺少DNA输入且仅含有在连接反应期间的衔接 子。第七泳道为阴性对照反应,其在不存在任何DNA、经修饰的 六聚体和衔接子的情况下经历双扩增方案。第八泳道与第一泳道相 同。
图6描绘了图3中的程序条件在1.5%琼脂糖凝胶上的重复。 第一泳道含有O’GeneRuler 1kb加DNA梯。最亮的条带下方对应 于500bp。下面的条带对应于400、300和200bp。第二泳道示出了 具有150ng起始DNA的样品。第三泳道示出了具有150bp起始 DNA的样品。第四泳道示出了具有75ng起始DNA的样品。第五 泳道示出了具有75ng DNA的样品,该DNA被片段化但没有经历 双重扩增方案,并立即流出琼脂糖凝胶。第六泳道为不含DNA的 阴性对照。第七泳道与第一泳道相同。
图7示出了图3中的程序条件在1.5%琼脂糖凝胶上的重复。 第一泳道含有O’GeneRuler 1kb加DNA分子量标准梯。最亮的条 带下方对应于500bp。下面的条带对应于400、300和200bp。泳道 2-7是按照双扩增方案处理的150ng起始DNA的产物。泳道八与 泳道一相同。泳道9-14是利用双扩增方案处理的75ng起始DNA 的产物。泳道15与泳道一相同。利用Qubit HS dsDNA试剂盒对每 个泳道中的dsDNA产物的浓度进行定量,并在图8中示出。
图8描绘了来自图7的重复结果。x轴为DNA输入,y轴为 来自重复的双扩增方案的DNA输出浓度。圆形和正方形表示平均 值,而条棒则对应于最小和最大输出范围。圆形表示按照双扩增方 案所处理的150ng输入DNA的产物,正方形表示按照双扩增方案 处理的75ng输入DNA的产物。
为了确定能够成功生成文库的DNA的量,根据单扩增法来 处理15ng、5ng和500pg的DNA。如通过安捷伦生物分析仪和 qPCR所测量的,采用15ng和5ng样品均产生成功的文库。500pg 样品的结果则不确定。
实施例3:单一反应混合物或容器中的RNA双扩增
按照新一代测序的标准样品制备程序将mRNA片段化。在可 逆修饰的随机六聚体存在的情况下,将样品立即变性。将dNTP(或 者例如,含有dUTP、rA、rU、rG、rC、rUTP、荧光团、双脱氧核 苷酸、脱氧核苷酸、放射性标记或染料以用于下游纯化或降解的 dNTP)、逆转录酶(RT)、RNAse抑制剂和缓冲液的混合物加入 样品。从经修饰的六聚体开始的第一延伸遵循适用于RT的温育时 间和条件。一旦延伸完成,样品即变性并猝灭,并将聚合酶加入样 品。第二延伸遵循适用于聚合酶的条件。在第二延伸完成之后,利 用标准纯化程序来纯化样品。然后处理样品以去除修饰(根据修饰 类型进行不同处理),并将样品加入含有衔接子(例如Illumina) 的TA连接反应。然后可选地,选择该反应产物的大小并按照标准 索引化PCR程序将反应产物直接置于索引化PCR反应中。备选地, 可以将改变的衔接子与非基于PCR的方法一起使用。在PCR后, 选择样品的大小以适合新一代测序的大小范围。
实施例4:RNA的双纯化双扩增
按照新一代测序的标准样品制备程序将mRNA片段化。在随 机六聚体存在的情况下,将样品立即变性。将dNTP、逆转录酶(RT) 和缓冲液的混合物加入样品。从六聚体开始的第一延伸遵循适用于 RT的温育时间和条件。一旦延伸完成,即按照标准程序来纯化样 品。接下来,将可逆修饰的随机六聚体加入样品并使其变性,并将 聚合酶加入样品。第二延伸遵循适用于利用dNTP,含有dUTP、rA、 rU、rG、rC、rUTP、荧光团、双脱氧核苷酸、脱氧核苷酸、放射 性标记或染料以用于下游纯化或降解的dNTP的聚合酶的条件。在 第二延伸完成之后,利用标准纯化程序来纯化样品。然后处理样品 以去除修饰(根据修饰类型进行不同处理),并将样品加入含有经 修饰的衔接子(例如,来自Illumina)的TA/平端连接反应。一个 衔接子包含第二配对端衔接子的序列,该第二配对端衔接子含有与 双延伸产物上的突出端互补的突出端。第二衔接子包含第一配对端 衔接子的序列,该第一配对端衔接子包含可与延伸产物一侧上的平 端连接的平端。可选地,选择该反应产物的大小并将反应产物直接 置于可根据所使用的衔接子进行选择的索引化PCR反应中。在可 选的PCR后,选择样品的大小以适合新一代测序的大小范围。
实施例5:采用具有可逆修饰随机六聚体引物的单延伸的靶向扩增
按照新一代测序的标准样品制备程序将基因组DNA片段化。 在可逆修饰的随机六聚体存在的情况下,将样品立即变性,并将 dNTP(或者例如,含有dUTP、rA、rU、rG、rC、rUTP、荧光团、 双脱氧核苷酸、脱氧核苷酸、放射性标记或染料以用于下游纯化或 降解的dNTP)、聚合酶和缓冲液的混合物加入样品。按照适用于 聚合酶的温育时间和条件,从经修饰的六聚体进行单延伸。在延伸 完成之后,利用标准纯化程序来纯化样品。然后处理样品以去除修 饰(根据修饰类型进行不同处理),并将样品加入含有经修饰的衔 接子(例如Illumina衔接子)的TA/平端连接反应。一个衔接子包 含与第二配对端衔接子相似的经修饰的序列,该第二配对端衔接子 包含与延伸产物上的突出端互补的突出端。第二衔接子包含第一配 对端衔接子的经修饰的序列,该第一配对端衔接子包含将与延伸产 物两端之一的平端连接的平端。
如果这些衔接子不足以结合用于测序的流动池,则可以执行 索引化PCR反应以并入适当的序列。索引化PCR反应可用于给样 品加上标记或条码。可选地,选择连接反应产物的大小并将反应产 物直接置于索引化PCR反应中。该反应包含索引化引物、多重引 物和包含用于结合流动池的适当的测序寡核苷酸序列的靶标特异 性引物。在PCR反应后,选择样品的大小以适合新一代测序的大 小范围。
实施例6:采用具有可逆修饰随机六聚体的双扩增的靶向扩增替代 方法
按照新一代测序的标准样品制备程序将基因组DNA片段化。 在可逆修饰的随机六聚体存在的情况下,将样品立即变性、猝灭, 并将dNTP(或者例如,含有dUTP、rA、rU、rG、rC、rUTP、荧 光团、双脱氧核苷酸、脱氧核苷酸、放射性标记或染料以用于下游 纯化或降解的dNTP)、聚合酶和缓冲液的混合物加入样品。从经 修饰的六聚体开始的第一延伸遵循适用于聚合酶的温育时间和条 件。一旦延伸完成,即将样品变性、猝灭,并将额外的聚合酶加入 样品。第二延伸遵循与第一延伸相同的条件。在第二延伸完成之后, 利用标准纯化程序来纯化样品。然后处理样品以去除修饰(根据修 饰类型进行不同处理),并将样品加入含有经修饰的衔接子(例如 Illumina衔接子)的TA连接反应。
如果这些衔接子不足以结合用于测序的流动池,则可以执行 索引化反应以并入适当的序列。可选地,选择连接反应产物的大小, 并将反应产物直接置于索引化PCR反应中。该反应包含索引化引 物、多重引物和含有用于结合流动池的适当寡核苷酸序列的靶标特 异性引物。在PCR后,选择样品的大小以适合新一代测序的大小 范围。
实施例7:靶向扩增的替代方法-具有可逆修饰靶向引物的单扩增
图11中示出了本公开内容的单扩增法的示例性图解。按照新 一代测序的标准样品制备程序将基因组DNA片段化。在可逆修饰 靶向引物存在的情况下,将样品立即变性、猝灭,并将dNTP(或 者例如,含有dUTP、rA、rU、rG、rC、rUTP、荧光团、双脱氧核 苷酸、脱氧核苷酸、放射性标记或染料以用于下游纯化或降解的 dNTP)、聚合酶和缓冲液的混合物加入样品。从经修饰的靶向引 物开始的第一延伸遵循适用于聚合酶的温育时间和条件。在聚合酶 延伸完成之后,利用标准纯化程序来纯化样品。然后处理样品以去 除修饰(根据修饰类型进行不同处理),并将样品加入含有经修饰 的衔接子(例如Illumina衔接子)的TA/平端连接反应。一个衔接 子包含第二配对端衔接子,如第二Illumina衔接子的序列,该第二 配对端衔接子包含与延伸产物上的突出端互补的突出端。第二衔接 子包含第一配对端衔接子,如第一Illumina衔接子的序列,该第一 配对端衔接子包含将与延伸产物两端之一的平端连接的平端。然后 可选地,选择该反应产物的大小,并将反应产物直接置于可根据所 使用的衔接子进行选择的索引化PCR反应中。在可选PCR后,选 择样品的大小以适合新一代测序的大小范围。
实施例8:靶向扩增的替代方法-具有可逆修饰靶向引物的双扩增
图12中示出了本公开内容的单扩增法的示例性图解。按照新 一代测序的标准样品制备程序将基因组DNA片段化。在可逆修饰 靶向引物存在的情况下,将样品立即变性,并将dNTP(或含有dUTP、 rA、rU、rG、rC、rUTP、荧光团、双脱氧核苷酸、脱氧核苷酸、 放射性标记或染料以用于下游纯化或降解的dNTP)、聚合酶和缓 冲液的混合物加入样品。一旦延伸完成,即将经修饰的随机六聚体 加入样品并使其变性、猝灭,并将额外的聚合酶加入样品。第二延 伸遵循与第一延伸相同的条件。在第二延伸完成之后,利用标准纯 化程序来纯化样品。然后处理样品以去除修饰(根据修饰类型进行 不同处理),并将样品加入含有衔接子(例如Illumina衔接子)的 TA连接反应。然后可选地,选择该反应产物的大小并按照标准索 引化PCR程序将反应产物直接置于索引化PCR反应中。备选地, 可以将改变的衔接子与非基于PCR的方法一起使用。在PCR后, 选择样品的大小以适合新一代测序的大小范围。
实施例9:生成包含突出端和随机条码的衔接物
图13示出了用来形成用于制备新一代测序文库的衔接物的 标准方法。在图13中,包含互补序列的两个寡核苷酸在选择性条 件下杂交以产生双链衔接物。图14是使用本公开内容的方法产生 包含随机条码序列的衔接物的方法的示例性图解。第一寡核苷酸库 (1410)包含含有与第二寡核苷酸库(1415)中的序列互补的序列 的寡核苷酸。除了所述互补序列之外,第二寡核苷酸还包含通过在 其5’端合成而并入的随机核苷酸,在其更5’侧是一个或多个可切割 核苷酸。此类可切割核苷酸可以为RNA核苷酸。将两个寡核苷酸 库混合并允许其杂交。用dNTP、缓冲液和聚合酶来处理双链产物 (1420),以便延伸第一寡核苷酸使其包含与随机条码和可切割的 5’核苷酸(1425)互补的序列。然后切割(1430)包含选自rU、rA、 rC、rG或dU的核苷酸的可切割5’核苷酸。通过用RNaseH处理, 或在dU的情况下,通过用尿嘧啶-DNA糖基化酶处理来完成切割 以生成包含至少一个突出端的最终衔接子产物(1430)。图15示 出了与图14相同的程序,不同之处在于寡核苷酸2(1515)包含 寡核苷酸1(1510)的序列,此外寡核苷酸2仅具有额外的随机条 码和其5’端的一个或多个可切割核苷酸。
实施例10:制备没有扩增错误的文库
按照新一代测序的标准样品制备程序将基因组DNA片段化。 在经修饰的随机六聚体存在的情况下,将样品立即变性。将dNTP 和一种多种可切割的dNTP、聚合酶和缓冲液的混合物加入样品。 按照适用于聚合酶的温育时间和条件,从经修饰的六聚体进行单延 伸。利用具有5’-3’核酸酶活性的DNA聚合酶I来去除由于延伸而 超出模板分子的突出端。在延伸完成之后,用生成突出端的切割剂 处理样品并切割延伸链内的一个或多个核苷酸。然后利用标准纯化 程序来纯化样品。处理和纯化后,文库包含两端均具有衔接物序列 的单链模板序列,同时延伸链被切割,使得文库具有衔接物序列的 两端不再是连续的。通过该方法制备的文库没有延伸或PCR诱导 的错误,因为只有模板链具有桥式扩增和测序所必需的两个衔接物 序列。

Claims (28)

1.一种用于生成双链核酸分子的衔接子连接的文库的方法,其 包括在单一反应容器或反应混合物中:
(a)通过以下步骤由多个单链多核苷酸生成包含一条或两条链的 可切割5’端的多个双链DNA分子:
(i)使所述多个单链多核苷酸与引物库相接触,其中来自该引物 库的每个引物包含可切割5’端;
(ii)延伸来自所述引物库的引物以生成与所述单链多核苷酸杂交 的延伸产物,从而形成双链双链体;
(b)用切割剂切割所述可切割5’端以产生包含一个或多个突出端 的双链DNA分子;以及
(c)使包含3’突出端的一个或多个双链衔接物与所述包含一个或 多个突出端的双链DNA分子相连接,从而形成所述衔接物连接的文 库;
其中所述多个单链多核苷酸以小于5纳克的量存在。
2.根据权利要求1所述的方法,还包括(d)对所述衔接物连接的 文库进行测序。
3.根据权利要求1或2所述的方法,其中所述可切割5’端选自: rA、rC、rG、rU或dU。
4.根据权利要求1或2所述的方法,其中以高于90%的效率进 行所述连接。
5.根据权利要求1所述的方法,其中所述生成包括:
(i)使所述多个单链多核苷酸与第一引物库相接触,其中来自该 第一引物库的每个引物包含可切割5’端;
(ii)延伸来自所述第一引物库的引物以生成与所述单链多核苷酸 杂交的第一延伸产物,从而形成第一双链双链体;
(iii)使所述第一双链双链体变性为单链;
(iv)使所述第一延伸产物与第二引物库杂交;
(v)延伸来自所述第二引物库的引物以生成与所述第一延伸产物 杂交的第二延伸产物,从而形成第二双链双链体。
6.根据权利要求5所述的方法,其中来自该第二引物库的每个引 物包含可切割5’端。
7.根据权利要求5或6所述的方法,其中所述第一引物库和所 述第二引物库为包含5’可切割端的随机引物库。
8.根据权利要求5或6所述的方法,其中所述第一引物库包含 随机引物,而所述第二引物库包含靶标特异性引物。
9.根据权利要求5或6所述的方法,其中所述第一引物库包含 靶标特异性引物,而所述第二引物库包含随机引物。
10.根据权利要求5或6所述的方法,其中所述第一引物库包含 靶标特异性引物,而所述第二引物库包含靶标特异性引物。
11.根据权利要求8所述的方法,其中所述靶标特异性引物包含 位于靶标特异性序列上游的随机化条码序列。
12.根据权利要求9所述的方法,其中所述靶标特异性引物包含 位于靶标特异性序列上游的随机化条码序列。
13.根据权利要求10所述的方法,其中所述第一引物库的所述 靶标特异性引物和所述第二引物库的所述靶标特异性引物包含位于 所述靶标特异性序列上游的条码序列。
14.根据权利要求1或2所述的方法,其中所述生成包括:
(a)使多个多核苷酸与包含可切割5’端的引物库相接触;
(b)延伸所述引物以生成与所述多核苷酸杂交的第一延伸产物, 从而形成双链双链体;
(c)切割所述可切割5’端,从而生成具有第一突出端的双链双链 体;以及
(d)使一个或多个衔接子与(c)中的所述双链双链体相连接,其中 所述一个或多个衔接子包含与所述第一突出端互补的突出端,
其中所述方法仅包括一轮延伸。
15.根据权利要求14所述的方法,其中所述引物库包含随机引 物。
16.根据权利要求14所述的方法,其中所述引物库包含靶标特 异性引物。
17.根据权利要求16所述的方法,其中所述靶标特异性引物包 含位于靶标特异性序列上游的条码序列。
18.一种用于生成双链核酸分子的衔接子连接的文库的方法,其 包括在单一反应容器或反应混合物中:
(a)使多个单链多核苷酸与第一引物库相接触,其中来自该第一 引物库的每个引物包含可切割5’端;
(b)延伸来自所述第一引物库的引物以生成与所述单链多核苷酸 杂交的第一延伸产物,从而形成第一双链双链体;
(c)使所述第一双链双链体变性为单链;
(d)使所述第一延伸产物与第二引物库杂交;
(e)延伸来自所述第二引物库的引物以生成与所述第一延伸产物 杂交的第二延伸产物,从而形成第二双链双链体;
(f)用切割剂来切割所述可切割5’端以产生包含一个或多个突出 端的双链DNA分子;以及
(g)使包含3’突出端的一个或多个双链衔接物与所述包含一个或 多个突出端的双链DNA分子相连接,从而形成所述衔接物连接的文 库。
19.根据权利要求18所述的方法,其中来自该第二引物库的每 个引物包含可切割5’端。
20.根据权利要求18或19所述的方法,还包括(h)对所述衔接 物连接的文库进行测序。
21.根据权利要求18或19所述的方法,其中所述可切割5’端选 自:rA、rC、rG、rU或dU。
22.根据权利要求18或19所述的方法,其中所述第一引物库和 所述第二引物库为包含5’可切割端的随机引物库。
23.根据权利要求18或19所述的方法,其中所述第一引物库包 含随机引物,而所述第二引物库包含靶标特异性引物。
24.根据权利要求18或19所述的方法,其中所述第一引物库包 含靶标特异性引物,而所述第二引物库包含随机引物。
25.根据权利要求18或19所述的方法,其中所述第一引物库包 含靶标特异性引物,而所述第二引物库包含靶标特异性引物。
26.根据权利要求23所述的方法,其中所述靶标特异性引物包 含位于靶标特异性序列上游的随机化条码序列。
27.根据权利要求24所述的方法,其中所述靶标特异性引物包 含位于靶标特异性序列上游的随机化条码序列。
28.根据权利要求25所述的方法,其中所述第一引物库的所述 靶标特异性引物和所述第二引物库的所述靶标特异性引物包含位于 所述靶标特异性序列上游的条码序列。
CN201580063859.XA 2014-09-24 2015-09-24 样品制备方法 Active CN107002290B9 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110251569.5A CN113279067A (zh) 2014-09-24 2015-09-24 生成双链衔接物的方法

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201462054886P 2014-09-24 2014-09-24
US62/054,886 2014-09-24
US14/691,457 2015-04-20
US14/691,457 US20160083724A1 (en) 2014-09-24 2015-04-20 Methods for sample preparation
PCT/US2015/051947 WO2016049318A1 (en) 2014-09-24 2015-09-24 Methods for sample preparation

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202110251569.5A Division CN113279067A (zh) 2014-09-24 2015-09-24 生成双链衔接物的方法

Publications (3)

Publication Number Publication Date
CN107002290A CN107002290A (zh) 2017-08-01
CN107002290B CN107002290B (zh) 2021-03-23
CN107002290B9 true CN107002290B9 (zh) 2021-04-20

Family

ID=55525187

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201580063859.XA Active CN107002290B9 (zh) 2014-09-24 2015-09-24 样品制备方法
CN202110251569.5A Pending CN113279067A (zh) 2014-09-24 2015-09-24 生成双链衔接物的方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202110251569.5A Pending CN113279067A (zh) 2014-09-24 2015-09-24 生成双链衔接物的方法

Country Status (4)

Country Link
US (2) US20160083724A1 (zh)
EP (1) EP3198064B1 (zh)
CN (2) CN107002290B9 (zh)
WO (1) WO2016049318A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160083724A1 (en) * 2014-09-24 2016-03-24 University Of Southern California Methods for sample preparation
WO2019018404A1 (en) * 2017-07-17 2019-01-24 SeqOnce Biosciences, Inc. FAST BANK CONSTRUCTION FOR HIGH FLOW SEQUENCING
WO2024073034A1 (en) * 2022-09-29 2024-04-04 The Board Of Trustees Of The Leland Stanford Junior University Simplified sequencing library preparation for dna

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120237943A1 (en) * 2009-07-06 2012-09-20 Aleksey Soldatov Method for differentiation of polynucleotide strands

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5830655A (en) * 1995-05-22 1998-11-03 Sri International Oligonucleotide sizing using cleavable primers
EP0832278A4 (en) * 1995-06-07 1999-05-26 Bio Rad Laboratories LINKED LINEAR AMPLIFICATION OF NUCLEIC ACIDS
US5935793A (en) * 1996-09-27 1999-08-10 The Chinese University Of Hong Kong Parallel polynucleotide sequencing method using tagged primers
EP1332208A2 (en) * 2000-10-30 2003-08-06 Gene Logic, Inc. Partially double-stranded nucleic acids, methods of making, and use thereof
FR2861405A1 (fr) * 2003-10-24 2005-04-29 Centre Nat Rech Scient METHODE DE PRODUCTION D'ADNc PLEINE LONGUEUR PAR LIGATURATION D'ADAPTATEUR A EXTREMITE COHESIVE
GB0422551D0 (en) * 2004-10-11 2004-11-10 Univ Liverpool Labelling and sequencing of nucleic acids
CN101351552A (zh) * 2005-06-06 2009-01-21 454生命科学公司 配对末端测序
WO2008015396A2 (en) * 2006-07-31 2008-02-07 Solexa Limited Method of library preparation avoiding the formation of adaptor dimers
CA2741996A1 (en) * 2008-10-29 2010-05-14 Trustees Of Boston University Sequence preserved dna conversion
US20110319290A1 (en) * 2010-06-08 2011-12-29 Nugen Technologies, Inc. Methods and Compositions for Multiplex Sequencing
US20120244525A1 (en) * 2010-07-19 2012-09-27 New England Biolabs, Inc. Oligonucleotide Adapters: Compositions and Methods of Use
US20130059762A1 (en) 2011-04-28 2013-03-07 Life Technologies Corporation Methods and compositions for multiplex pcr
US20130059738A1 (en) 2011-04-28 2013-03-07 Life Technologies Corporation Methods and compositions for multiplex pcr
CN106912197B (zh) 2011-04-28 2022-01-25 生命技术公司 用于多重pcr的方法和组合物
WO2013081755A1 (en) 2011-11-29 2013-06-06 Life Technologies Corporation Methods and compositions for multiplex pcr
EP2769007B1 (en) * 2011-10-19 2016-12-07 Nugen Technologies, Inc. Compositions and methods for directional nucleic acid amplification and sequencing
WO2013081864A1 (en) 2011-11-29 2013-06-06 Life Technologies Corporation Methods and compositions for multiplex pcr
SG11201404243WA (en) * 2012-01-26 2014-08-28 Nugen Technologies Inc Compositions and methods for targeted nucleic acid sequence enrichment and high efficiency library generation
US9365896B2 (en) * 2012-10-19 2016-06-14 Agilent Technologies, Inc. Addition of an adaptor by invasive cleavage
WO2015094861A1 (en) 2013-12-17 2015-06-25 Clontech Laboratories, Inc. Methods for adding adapters to nucleic acids and compositions for practicing the same
US20160083724A1 (en) * 2014-09-24 2016-03-24 University Of Southern California Methods for sample preparation

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120237943A1 (en) * 2009-07-06 2012-09-20 Aleksey Soldatov Method for differentiation of polynucleotide strands

Also Published As

Publication number Publication date
EP3198064B1 (en) 2020-03-18
US20160083724A1 (en) 2016-03-24
CN113279067A (zh) 2021-08-20
WO2016049318A1 (en) 2016-03-31
EP3198064A4 (en) 2018-06-06
CN107002290B (zh) 2021-03-23
EP3198064A1 (en) 2017-08-02
CN107002290A (zh) 2017-08-01
US11834657B2 (en) 2023-12-05
US20190048334A1 (en) 2019-02-14

Similar Documents

Publication Publication Date Title
US10876108B2 (en) Compositions and methods for targeted nucleic acid sequence enrichment and high efficiency library generation
US11421269B2 (en) Target enrichment by single probe primer extension
US11014957B2 (en) Methods of library construction for polynucleotide sequencing
EP3143139B1 (en) Synthesis of double-stranded nucleic acids
CN110678547B (zh) 分子条码化
WO2011156529A2 (en) Methods and composition for multiplex sequencing
KR102398479B1 (ko) 카피수 보존 rna 분석 방법
AU2018254190B2 (en) Methods, compositions, and kits for preparing nucleic acid libraries
WO2015050501A1 (en) Amplification paralleled library enrichment
US11834657B2 (en) Methods for sample preparation
CN110468179B (zh) 选择性扩增核酸序列的方法
US11725305B2 (en) Rapid library construction for high throughput sequencing
WO2024022207A1 (en) Methods of in-solution positional co-barcoding for sequencing long dna molecules
CN116710573A (zh) 插入段和标识无变性测序方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CI03 Correction of invention patent
CI03 Correction of invention patent

Correction item: Description

Correct: Paragraphs 1-91 of the specification submitted on March 8, 2021

False: Paragraphs 1-91 of the specification submitted on July 22, 2020

Number: 13-01

Page: ??

Volume: 37