CN110612351B - 用于制备核酸文库的方法和组合物 - Google Patents

用于制备核酸文库的方法和组合物 Download PDF

Info

Publication number
CN110612351B
CN110612351B CN201880031331.8A CN201880031331A CN110612351B CN 110612351 B CN110612351 B CN 110612351B CN 201880031331 A CN201880031331 A CN 201880031331A CN 110612351 B CN110612351 B CN 110612351B
Authority
CN
China
Prior art keywords
nucleic acid
adapter
stranded nucleic
single stranded
adaptor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201880031331.8A
Other languages
English (en)
Other versions
CN110612351A (zh
Inventor
陈锡君
塔伦·库拉纳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Illumina Inc
Original Assignee
Illumina Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Illumina Inc filed Critical Illumina Inc
Priority to CN202310889341.8A priority Critical patent/CN116926061A/zh
Publication of CN110612351A publication Critical patent/CN110612351A/zh
Application granted granted Critical
Publication of CN110612351B publication Critical patent/CN110612351B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/501Ligase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本文提供的系统、方法和组合物涉及制备核酸文库。一些实施方案包括通过连接单链核酸制备核酸文库。

Description

用于制备核酸文库的方法和组合物
相关申请
本申请要求2017年3月20日提交的名称为“用于制备核酸文库的方法和组合物”的美国临时申请62/473595号的优先权;将其公开的内容通过援引的方式整体并入本文。
序列表
本申请包含电子格式的序列表。所提供的序列表文件名为“ILLINC362WOSEQLIST”,创建于2018年3月15日,其文件大小约为4kb。将电子格式序列表中的信息通过援引的方式整体并入本文。
发明领域
本文提供的系统、方法和组合物涉及制备核酸文库。一些实施方案包括通过连接单链核酸制备核酸文库。
发明背景
数种二代测序技术可用于快速、经济地确定基因组的整个序列。通常,在测序前由双链靶基因组DNA样品制备模板核酸文库。样品制备通常包括DNA片段化步骤,将较大的DNA链断裂为较小的DNA片段,较小的DNA片段更适合于二代测序技术。通常,衔接子附接在DNA片段的末端,这可以通过在DNA末端修复后进行衔接子连接来完成,或者最近通过使用转座体系统来完成。转座体是转座酶和转座子序列的复合体,使用转座体可以同时进行基因组片段化和片段的衔接子连接,从而简化了文库的制备。文库制备方法通常是劳动密集型的,并且在不同的阶段需要几个动手步骤。
发明概述
一些实施方案包括制备核酸文库的方法,包括:(a)获取多个核酸,其中所述多个核酸是单链核酸;(b)将所述单链核酸的5′端去磷酸化;(c)在连接酶存在下,将第一衔接子与所述单链核酸的3′端连接,其中所述第一衔接子的3′端包含封闭基团;(d)使所述连接的单链核酸的5′端磷酸化;以及(e)在所述连接酶存在下,将第二衔接子与所述磷酸化的连接的单链核酸的5′端连接,从而得到核酸文库。
在一些实施方案中,所述第二衔接子的5′端是非磷酸化的。
在一些实施方案中,所述第二衔接子附接于基底。在一些实施方案中,所述基底包含珠或流动室。
一些实施方案还包括在步骤(e)之前去除未连接的单链第一衔接子。
一些实施方案还包括使所述未连接的单链第一衔接子与捕获探针杂交。在一些实施方案中,所述捕获探针包含与所述第一衔接子的至少一部分互补的序列。在一些实施方案中,所述捕获探针的3′端包含封闭基团。在一些实施方案中,所述捕获探针的5′端包含封闭基团。
一些实施方案还包括消化所述未连接的单链第一衔接子。在一些实施方案中,消化所述未连接的单链第一衔接子包括使所述未连接的单链第一衔接子与5′-磷酸依赖性核酸外切酶接触。在一些实施方案中,消化所述未连接的单链第一衔接子包括使所述未连接的单链第一衔接子与5′-磷酸依赖性核酸外切酶和5′-去腺苷化酶接触。
在一些实施方案中,使所述连接的单链核酸的5′端磷酸化包括使所述连接的单链核酸与激酶接触。
一些实施方案包括制备核酸文库的方法,包括:(a)获取多个核酸,其中所述多个核酸是双链核酸;(b)使所述双链核酸与5′-核酸外切酶接触,以获取多个具有单链3′-悬突的修饰的双链核酸;(c)在连接酶存在下,使第一衔接子与所述修饰的双链核酸的3′端连接,其中所述第一衔接子的3′端包含封闭基团;(d)使与所述第一衔接子连接的所述修饰的双链核酸去杂交(dehybridizing),以获取多个单链核酸;以及(e)在所述连接酶存在下,使第二衔接子与所述单链核酸的5′端连接,从而得到核酸文库。
在一些实施方案中,所述第二衔接子的5′端是非磷酸化的。
一些实施方案包括制备核酸文库的方法,包括:(a)获取多个核酸,其中所述多个核酸是单链核酸;(b)将所述单链核酸的5′端去磷酸化;(c)在连接酶存在下,将第一衔接子与所述单链核酸的3′端连接,其中所述第一衔接子的3′端包含封闭基团;(d)使所述连接的第一衔接子与捕获探针杂交;以及(e)延伸所述捕获探针,以及在所述连接酶存在下,将第二衔接子与所述延伸的捕获探针的3′端连接,其中所述第二衔接子的3′端包含封闭基团,从而得到核酸文库。
一些实施方案还包括从所述延伸的捕获探针去除所述杂交的连接的第一衔接子。
在一些实施方案中,所述捕获探针附接于基底。在一些实施方案中,所述基底包含珠或流动室。在一些实施方案中,所述捕获探针包含捕获探针索引。在一些实施方案中,所述捕获探针包含可切割连接子。一些实施方案还包括切割所述可切割连接子。
一些实施方案包括制备核酸文库的方法,包括:(a)获取多个核酸,其中所述多个核酸是单链核酸;(b)将所述单链核酸的5′端去磷酸化;(c)使所述单链核酸的3′端与连接子连接,其中所述连接子包含第一衔接子和第二衔接子,并且所述连接子的3′端包含封闭基团;(d)使所述连接的单链核酸的5′端磷酸化;以及(e)使所述磷酸化的核酸的3′端脱保护,并且通过连接使所述脱保护的核酸环化,从而获取环状核酸文库。
在一些实施方案中,其中所述连接子包含在所述第一衔接子和所述第二衔接子之间的可切割位点。
一些实施方案还包括通过在所述可切割连接子的切割来使所述环状核酸线性化。在一些实施方案中,所述可切割位点包含尿嘧啶残基。一些实施方案还包括使所述环状核酸与尿嘧啶特异性切除试剂接触。在一些实施方案中,所述尿嘧啶特异性切除试剂包含选自以下的酶:尿嘧啶DNA糖基化酶(UDG)和DNA糖基化酶-裂合酶核酸内切酶VIII。
一些实施方案还包括通过包括以下步骤的方法扩增所述环状核酸:使至少一个引物与所述第一衔接子或所述第二衔接子杂交。在一些实施方案中,所述扩增选自:PCR和滚环扩增(RCA)。在一些实施方案中,所述扩增包括使所述环状核酸与聚合酶接触,所述聚合酶在接触模板中的尿嘧啶残基时形成线状产物。
在一些实施方案中,使所述单链核酸的5′端去磷酸化包括:使所述单链核酸与磷酸酶接触。
在一些实施方案中,步骤(b)–(e)在单个反应体积中进行。
在一些实施方案中,步骤(b)–(e)在单个反应容器中进行。
在一些实施方案中,所述第一衔接子和/或第二衔接子包含测序引物结合位点。
在一些实施方案中,所述第一衔接子包含P7序列、P5序列或者其互补序列或反向互补序列。在一些实施方案中,所述第二衔接子包含P7序列、P5序列或者其互补序列或反向互补序列。
在一些实施方案中,所述第一衔接子和/或第二衔接子包含衔接子索引。在一些实施方案中,所述第一衔接子索引不同于所述第二衔接子索引。在一些实施方案中,所述衔接子索引指示所述多个核酸的来源。
在一些实施方案中,所述封闭基团包含3'-间隔子C3或双脱氧核苷酸。
在一些实施方案中,所述连接酶包含单链核酸连接酶。
在一些实施方案中,所述第一衔接子的连接和/或所述第二衔接子的连接在体积排除试剂存在下进行的。在一些实施方案中,所述体积排除试剂选自:聚乙二醇(PEG)、葡聚糖、羟乙基淀粉、Ficoll和聚乙烯吡咯烷酮。在一些实施方案中,所述第一连接步骤和/或第二连接步骤在包含至少约37%(wt/vol)PEG的反应体积中进行。在一些实施方案中,所述第一连接步骤和/或第二连接步骤是在包含至少约60%(wt/vol)PEG的反应体积中进行。
在一些实施方案中,所述多个核酸包括RNA。在一些实施方案中,所述多个核酸包括cDNA或基因组DNA。
在一些实施方案中,所述多个核酸的核酸平均大小为小于约200个核苷酸。
在一些实施方案中,所述多个核酸获取自低质量核酸源。在一些实施方案中,所述多个核酸获取自固定的样品。
一些实施方案还包括扩增所述核酸文库。
一些实施方案还包括从所述核酸文库获取序列数据。
一些实施方案包括由前述实施方案的任一个中的方法制备的核酸文库。
一些实施方案包括试剂盒,其包含:第一衔接子,其中所述第一衔接子的3′端包含封闭基团,其中所述第一衔接子包含P7序列、P5序列或者其互补序列或反向互补序列;连接酶;以及选自以下的组分:体积排除试剂、激酶、磷酸酶、5′-磷酸依赖性核酸外切酶、5′-去腺苷化酶、在接触模板中的尿嘧啶残基时形成线状产物的聚合酶、尿嘧啶特异性切除试剂和第二衔接子,其中所述第二衔接子包含P7序列、P5序列或者其互补序列或反向互补序列。在一些实施方案中,连接子包含所述第一和第二衔接子。
一些实施方案包括反应容器,其包含反应体积,所述反应体积包含:多个核酸;第一衔接子,其中所述第一衔接子的3′端包含封闭基团;连接酶;以及体积排除试剂。
在一些实施方案中,所述多个核酸是单链核酸。
在一些实施方案中,所述第一衔接子连接于所述多个单链核酸的3′端,从而形成多个修饰的单链核酸。
在一些实施方案中,未连接的第一衔接子与捕获探针杂交。在一些实施方案中,所述捕获探针包含与所述第一衔接子的至少一部分互补的序列。
在一些实施方案中,所述多个核酸是具有3′悬突的双链核酸。在一些实施方案中,所述第一衔接子连接于具有3′悬突的多个双链核酸的3′端,从而形成多个修饰的双链核酸。
一些实施方案还包括第二衔接子。在一些实施方案中,所述第二衔接子的5′端是非磷酸化的。
一些实施方案还包括去磷酸化试剂。在一些实施方案中,所述去磷酸化试剂包含磷酸酶。在一些实施方案中,所述磷酸酶是未活化的。
在一些实施方案中,所述体积排除试剂选自:聚乙二醇(PEG)、葡聚糖、羟乙基淀粉、Ficoll和聚乙烯吡咯烷酮。在一些实施方案中,所述反应体积包含至少约37%(wt/vol)PEG。在一些实施方案中,所述反应体积包含至少约60%(wt/vol)PEG。
在一些实施方案中,所述第一衔接子和/或第二衔接子包含测序引物结合位点。
在一些实施方案中,所述第一衔接子和/或第二衔接子包含衔接子索引。在一些实施方案中,所述第一衔接子索引不同于所述第二衔接子索引。在一些实施方案中,所述衔接子索引指示所述多个单链核酸的来源。
在一些实施方案中,所述封闭基团包含3'-间隔子C3或双脱氧核苷酸。在一些实施方案中,所述封闭基团包含3'-间隔子C3。
在一些实施方案中,所述连接酶其中所述连接酶包含单链核酸连接酶。
在一些实施方案中,所述多个核酸包括RNA。在一些实施方案中,所述多个核酸包括cDNA或基因组DNA。
在一些实施方案中,所述多个单链核酸获取自低质量核酸源。在一些实施方案中,所述多个核酸获取自固定的样品。
一些实施方案包括流动室,其包含前述实施方案的任一个中的反应容器。
一些实施方案包括系统,其包含前述实施方案的任一个中的反应容器,以及用于获取测序数据的检测器。
附图简述
图1是根据一个实施方案的制备单链核酸库的方法示意图。将双链核酸去杂交化以形成单链核酸,并且可以通过如下来制备文库:使所述单链核酸的5'端去磷酸化,将包含3'封闭基团的P7'衔接子连接到所述单链核酸的3'端,将连接的单链核酸的5'端再磷酸化,并将含有非磷酸化5'端的P5衔接子连接至连接的单链核酸5'端。
图2是根据一个实施方案的制备单链核酸文库的方法示意图。用5'核酸外切酶部分地消化双链核酸,以形成具有3'-悬突的双链核酸。通过去杂交化以形成单链核酸,可以将含有3'封闭基团的P7'衔接子连接到具有3'-悬突的双链核酸的3'端,将具有3'-悬突的连接的双链核酸进行去杂交化以形成单链核酸,含有非磷酸化5'端的P5衔接子可以被连接到连接的单链核酸的5'端。
图3显示了根据一个实施方案使用珠制备单链核酸文库的方法示意图。可通过如下来制备文库:使单链核酸的5'端去磷酸化,将含有3'封闭基团的P5'衔接子连接至单链核酸的3'端,将第一连接产物与连接到珠上的P5捕获探针杂交,延伸所述捕获探针,从延伸的捕获探针除去杂交的第一连接产物,并将含有3'封闭基团的P7'衔接子连接至所述延伸的捕获探针的3'端。
图4A是根据一个实施方案的制备环状单链核酸文库的方法示意图。将双链核酸去杂交化以形成单链核酸,并且可以通过如下来制备文库:使所述单链核酸的5'端去磷酸化;将包含P7'衔接子、可切割位点(“U”)、具有3'封闭基团(“R”)的P5衔接子的连接子连接至单链核酸的3'端;使连接的单链核酸的5'端再磷酸化;使该连接的单链核酸的3'端脱保护,并使脱保护的核酸环化以形成包含环状单链核酸的文库的成员。
图4B是示意图,其中图4B的环状核酸可以通过切割可切割位点(“U”)线性化,或通过PCR或通过滚环扩增(RCA)进行扩增。
图5是包括图1所示的实施方案的制备单链核酸文库的方法示意图。在图5中,具有P7序列的捕获探针与连接至靶核酸的P7'衔接子和过量未连接的P7'衔接子杂交。所述捕获探针与未连接的P7'衔接子的杂交抑制未连接的P7'衔接子与其他核酸的连接。
图6是根据一个实施方案的制备单链核酸文库的方法示意图。将双链核酸去杂交化以形成单链核酸,并且可以通过如下来制备文库:使所述单链核酸的5'端去磷酸化,将包含3'封闭基团的P7'衔接子连接到单链核酸的3'端,通过用5'-磷酸依赖性核酸外切酶和5'-去腺苷化酶消化来去除多余的未连接的单链P7'衔接子,将连接的单链核酸的5'端再磷酸化,并将含有非磷酸化5'端的P5衔接子连接到连接的单链核酸的5'端。
图7显示了将60聚体单链核酸(3′OH-60-Phos 5′)的5'端去磷酸化并确认产物(3′OH-60-OH 5′)不能形成串联体的实验结果。上图是显示去磷酸化的示意图。表格列出了在下图中所示凝胶上进行和运行的反应的条件。
图8显示了将含有3'封闭基团的64聚体P7'衔接子(3′C3-P7-phos 5′)连接到去磷酸化的60聚体单链核酸(3′OH-60-OH 5′)的3'端的实验结果。上图是显示连接的示意图。表格列出了在下图中所示凝胶上进行和运行的反应的条件。
图9显示了将包含具有3'封闭基团(3′C3-P7-60-OH)的连接的64聚体衔接子的124聚体去磷酸化单链核酸的5'端再磷酸化的实验结果。上图是显示激酶反应的示意图。表格列出了在下图中所示凝胶上进行和运行的反应的条件。
图10显示了将具有非磷酸化5'端的60聚体P5衔接子(5′P5-OH)连接到124聚体单链核酸(3′C3-60-B2-Phos)的5'端的实验结果。124聚体单链核酸包括具有3'封闭基团(3′C3-P7-phos 5′)的连接的64聚体衔接子。上图是显示连接的示意图。表格列出了在下图中所示凝胶上进行和运行的反应的条件。
图11描述了将含有3'封闭基团的64聚体P7'衔接子(3′C3-P7-phos 5′)连接到单链去磷酸化无细胞DNA(cfDNA)的3'端的实验结果。表格列出了在下图中所示凝胶上进行和运行的反应的条件。
图12显示了用激酶(PNK)处理去磷酸化的cfDNA(cfDNA[Apex]),并且将含有3'封闭基团(3′C3-P7-phos 5′)的64聚体P7'衔接子连接到再磷酸化的cfDNA的3'端的实验结果。表格列出了在下图中所示凝胶上进行和运行的反应的条件。
图13显示了将含有3'封闭基团的64聚体P7'衔接子(3′C3-P7-phos 5′)连接到去磷酸化cfDNA的3'端,用激酶(PNK)处理所得的第一连接产物(3′C3-P7-cfDNA-phos 5′),并将具有非磷酸化5'端的60聚体P5衔接子(5′P5-OH)连接至第一连接产物的5'端以形成第二连接产物(P7′-cfDNA-P5)的实验结果。表格列出了在下图中所示凝胶上进行和运行的反应的条件。
图14显示了显示实施例2的连接产物以及来自连接产物提取物B1和提取物B2的扩增产物的凝胶。在“参考”泳道中,提取物B1用两个黑框标记,提取物B2用一个白框标记。
图15显示了扩增的连接产物提取物B1和提取物B2的电泳图谱。峰表示126bp引物二聚体(P7′-P5)、292bp(P7′-cfDNA-P5)和480bp(P7′-cfDNA-P5)物质。
图16显示了显示以不同比例使用SPRI珠提取扩增产物的结果的凝胶。
图17显示了将包含3'封闭基团的63聚体P7'衔接子(3′C3-P7′-Phos 5′)连接至单链去磷酸化cfDNA的3'端的实验结果。表格列出了在下图中所示凝胶上进行和运行的反应的条件。
图18显示了在含有5'和3'封闭基团的63聚体P7捕获探针(3′C3-P7-C35′)的存在下,将具有非磷酸化5'端的60聚体P5衔接子(5′P5-OH)连接至第一连接产物(3′C3-P7′-cfDNA-phos5′)的5'端的实验结果。上图是显示连接的示意图。表格列出了在下图中所示凝胶上进行和运行的反应的条件。
图19显示了扩增的连接产物提取物B1和提取物B2的电泳图谱分析。峰表示126bp引物二聚体(P7′-P5)、292bp(P7′-cfDNA-P5)和480bp(P7′-cfDNA-P5)物质。
图20显示了扩增前、扩增后和用SPRI珠提取后的连接产物的凝胶。
图21显示了在各种浓度的聚乙二醇(PEG)存在下,将具有去磷酸化5'端的39聚体寡聚体1(5′OH-寡聚体1-OH3′)连接到具有磷酸化3'封闭基团的37聚体寡聚体2(5′phos-寡聚体2-phos3′)的实验结果。表格列出了在下图中所示凝胶上进行和运行的反应的条件。
图22显示了将具有去磷酸化5'端的39bp寡聚体1(5′OH-寡聚体1-OH3′)连接到具有磷酸化3'封闭基团的37bp寡聚体2(5′phos-寡聚体2-phos3′)以不同的寡聚体1:寡聚体2比率的实验结果。表格列出了在下图中所示凝胶上进行和运行的反应的条件。
图23显示了以各种量的连接酶(CIRCLIGASE)将具有去磷酸化5'端的39bp寡核苷酸1(5′OH-寡聚体1-OH3′)连接到具有磷酸化3'封闭基团的37bp寡聚体2(5′phos-寡聚体2-phos3′)的实验结果。表格列出了在下图中所示凝胶上进行和运行的反应的条件。
图24显示了将具有磷酸化3'封闭基团的37聚体寡聚体2(5′phos-寡聚体2-phos3′)连接到与珠缀合的具有去磷酸化5'端的39聚体寡聚体1(5′OH-寡聚体1-OH3′)的实验结果。通过使用尿嘧啶-DNA糖基化酶(UDG)从珠上切割连接产物来对其进行分析,该酶切割了寡聚体1中的尿嘧啶位点。表格列出了在下图中所示凝胶上进行和运行的反应的条件。
图25显示了将具有磷酸化3'封闭基团的37聚体寡聚体2(5′phos-寡聚体2-phos3′)连接到与珠缀合的具有去磷酸化5'端的39聚体寡聚体1(5′OH-寡聚体1-OH3′)的实验结果,最终反应体积中具有45%PEG。表格列出了在下图中所示凝胶上进行和运行的反应的条件。
图26显示了根据一个实施方案使用珠制备单链核酸文库的方法示意图。可通过如下来制备文库:使单链核酸的5'端去磷酸化,将包含3'封闭基团的P5'衔接子连接至单链核酸的3'端,将第一连接产物与连接到流动室的P5捕获探针杂交,延伸所述捕获探针,从所述延伸的捕获探针中去除杂交的第一连接产物,使互补引物杂交,将包含3'封闭基团的P7'衔接子连接至延伸的捕获探针的3'端,并使所述互补引物去杂交化。
发明详述
本文提供的系统、方法和组合物的实施方案涉及制备核酸文库。一些实施方案包括将单链核酸连接至衔接子以从少量源核酸制备核酸文库。一些实施方案包括将具有3′悬突的双链核酸连接至衔接子以从少量源核酸制备核酸文库。一些实施方案包括将单链核酸连接至包含衔接子的连接子以从少量源核酸制备环状核酸文库。
在一个实施方案中,通过降低反应物质进行自我串联体化的可能性来制备单链核酸。例如,将3′衔接子连接至单链核酸的3′端,所述3′衔接子可具有抑制自我串联体化的封闭基团。类似地,单链核酸的5′端可被去磷酸化以抑制自我串联体化。来自该反应的连接产物包括具有3′封闭基团的连接的单链核酸。在一些实施方案中,发现在体积排除试剂存在下进行将3′衔接子连接至单链核酸的3′端是高效的。具有3′封闭基团的连接的单链核酸的5′端可被去磷酸化,以使得5′衔接子可被连接至其5′端。为将5′衔接子连接至具有3′封闭基团的再磷酸化的连接的单链核酸的5′端,5′衔接子可具有去磷酸化的5′端以抑制自我串联体化。来自该反应的连接产物将包含具有5′衔接子和3′衔接子的单链核酸。衔接子可包括测序引物位点、扩增引物位点和索引。如本文所用,“索引”可包括核苷酸序列,其可用作分子标识符和/或条码以标记核酸,和/或鉴定核酸的来源。在一些实施方案中,索引可用于鉴定单个核酸或核酸的亚群。在一些实施方案中,单链核酸文库可在单个反应容器、单个体积中制备。此外,本文提供的实施方案可在随后的扩增反应中降低形成引物二聚体产物的可能性。
根据一个实施方案的示例性方法展示于图1。如图所示,目标单链核酸的5′端被去磷酸化以防止在随后的连接步骤中形成串联体。使用单链连接酶将第一衔接子连接至去磷酸化靶标的3′端。为防止第一衔接子形成串联体,可封闭第一衔接子的3′端。用激酶将连接的靶标的5′端再磷酸化,并用所述单链连接酶将第二衔接子连接至去磷酸化靶标的5′端,从而形成核酸文库。为防止第二衔接子形成串联体,第二衔接子的5′端可以是非磷酸化的。
根据一个实施方案的另一示例性方法展示于图2,其中衔接子被连接至具有3′悬突的双链核酸。在一些实施方案中,第一衔接子可被连接至具有3′悬突的双链核酸的3′端。为防止第一衔接子形成串联体,第一衔接子的3′端可被封闭。连接至第一衔接子的双链核酸可被去杂交化以获取多个单链核酸。第二衔接子可被连接至该单链核酸的5′端。
根据一个实施方案的另一示例性方法展示于图3,其中可使用附接于珠的衔接子来制备核酸文库。在一些这样的实施方案中,使用单链连接酶将第一衔接子连接至去磷酸化的靶标的3′端。连接的第一衔接子可与附接于珠的捕获探针杂交。捕获探针可被延伸,并且第二衔接子可被连接至延伸的捕获探针。可通过从珠上洗涤来去除未连接的单链衔接子。包括使用附接于珠的衔接子的制备核酸文库的一些实施方案,可用于将索引添加至核酸文库。例如,包含第一索引的第一衔接子可被附接于珠,并且包含第二索引的第二衔接子和捕获探针可被连接至第一衔接子。与捕获探针杂交的靶核酸可被延伸以并入第一和第二索引。
根据一个实施方案的另一示例性方法展示于图4A,其中可以使用包含第一和第二衔接子的连接子来制备单链环状核酸的文库。在一些这样的实施方案中,连接子可包括在第一衔接子和第二衔接子之间的可切割位点,使得切割环状核酸的可切割位点能产生在一端具有第一衔接子的线状核酸,并且第二衔接子在线状核酸的另一端。
在一些实施方案中,可使用衔接子序列中的引物位点来扩增核酸文库。在一些实施方案中,随后扩增步骤的效率会由于形成引物二聚体而降低。为增加随后扩增步骤的效率,可从连接产物中去除未连接的单链衔接子。一个实例展示于图5,并在此进一步描述,其包括通过用捕获探针杂交来去除未连接的单链第一衔接子。另一个实例展示于图6,并在此进一步描述,其包括通过用5′-磷酸依赖性核酸外切酶和5′-去腺苷化酶消化来去除未连接的单链第一衔接子。
制备单链文库
本文提供的系统、方法和组合物的一些实施方案包括这样的方法,其中衔接子被连接至靶核酸。本文提供的一些实施方案中,制备本文提供的核酸文库可有利地在单个反应体积中进行。
衔接子包括核酸,如单链核酸。衔接子可包括短核酸,其长度小于、大于或等于约5个核苷酸,10个核苷酸,20个核苷酸,30个核苷酸,40个核苷酸,50个核苷酸,60个核苷酸,70个核苷酸,80个核苷酸,90个核苷酸,100个核苷酸,或任意两个前述大小之间的范围。衔接子可包括测序引物结合位点、扩增引物结合位点和/或索引。例如,衔接子可包括P5序列、P7序列或其互补序列。索引可用于鉴定核酸分子的来源。可用于本文提供的实施方案的索引使用和制备实例可参见国际公开号WO 2012/061832和WO 2014/142850;以及美国专利9074251和8829171号,其各自通过引用整体并入本文。在一些实施方案中,可修饰衔接子以防止形成串联体,例如,通过在一端或两端添加防止衔接子延伸的封闭基团。封闭基团是可阻止工作流程的随后步骤期间要与封闭基团连接的化合物进行反应的任何化学部分,例如可封闭连接酶活化衔接子、与磷酸反应,以及自我反应的部分。3′封闭基团的实例包括3'-间隔子C3、双脱氧核苷酸和与基底的附接。3′封闭基团的其他实例包括任选地被一个或多个羟基取代的烷基、硫醇、叠氮化物或炔烃。在一些方面,封闭基团可以提供在后续操作如富集、纯化、进一步官能化等中有用的功能。5'封闭基团的实例包括去磷酸化的5'核苷酸,以及与基底的附接(例如,封闭基团是任选地经由连接子附接的基底)。
靶核酸包括单链核酸和双链核酸。使双链核酸去杂交化以形成单链核酸的方法是本领域众所周知的,包括加热或化学方法。靶核酸的实例包括DNA,如基因组DNA或cDNA;RNA,如mRNA、sRNA或rRNA;或DNA和RNA的杂合体。核酸可以包含磷酸二酯键,并且可以包括其他类型的主链,包括例如磷酰胺、硫代磷酸酯、二硫代磷酸酯、O-甲基亚磷酰胺和肽核酸骨架和连接。核酸可以包含脱氧核糖核苷酸和核糖核苷酸的任何组合,以及碱基的任何组合,包括尿嘧啶、腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤、肌苷、黄嘌呤、次黄嘌呤、异胞嘧啶、异鸟嘌呤和碱基类似物,如硝基吡咯(包括3-硝基吡咯)和硝基吲哚(包括5-硝基吲哚)等。在一些实施方案中,核酸可以包括至少一个混杂(promiscuous)碱基。混杂碱基可与多种不同碱基进行碱基配对,并且例如,当被包含在用于在复杂核酸样品(例如基因组DNA样品)中随机杂交的寡核苷酸引物或插入物中时,它可以是有用的。混杂碱基的一个实例包括可与腺嘌呤、胸腺嘧啶或胞嘧啶配对的肌苷。其他实例包括次黄嘌呤、5-硝基吲哚、丙烯酸5-硝基吲哚、4-硝基吡唑、4-硝基咪唑和3-硝基吡咯。可以使用可与至少两种、三种、四种或更多个类型的碱基配对的混杂碱基。
靶核酸可包括这样的样品,其中样品中双链核酸的平均大小为小于、大于或等于约2kb、1kb、500bp、400bp、200bp、100bp、50bp,或任意两个前述大小之间的范围。在一些实施方案中,样品中单链核酸的平均大小为小于、大于或等于约2000个核苷酸,1000个核苷酸,500个核苷酸,400个核苷酸,200个核苷酸,100个核苷酸,50个核苷酸,或任意两个前述大小之间的范围。样品可包括靶核酸的量为小于、大于或等于约50μg、10μg、5μg、1μg、500ng、400ng、200ng、100ng、50ng、10ng,或任意两个前述量之间的范围。靶核酸可获自低质量核酸源,例如降解的样品,如固定的样品和古老样品。固定的样品的实例包括那些用诸如福尔马林、戊二醛、酒精、渗透酸和多聚甲醛等化合物固定的样品。固定的样品可以包括福尔马林固定的石蜡包埋(FFPE)样品。古老样品可包括年数大于约5年、10年、20年、50年、100年、500年、1000年,或任意两个前述年数的之间的范围的样品。
使核酸(例如,核酸的5'核苷酸)去磷酸化的方法包括使核酸与磷酸酶接触。磷酸酶的实例包括小牛肠磷酸酶、虾碱性磷酸酶、南极磷酸酶和APEX碱性磷酸酶(Epicentre,Madison,WI)。
连接单链核酸的方法包括使单链核酸与连接酶接触。单链连接酶的实例包括T4RNA连接酶1、T4 RNA连接酶2、RtcB连接酶、甲烷杆菌RNA连接酶和TS2126 RNA连接酶(CIRCLIGASE;Epicentre,Madison WI)。将两个核酸连接在一起的方法可以在体积排除试剂的存在下在反应体积中进行。如本文所用中,“体积排除试剂”可以包括减少可以发生反应(例如连接反应)的有效体积的试剂。体积排除试剂的实例包括聚合物,例如惰性聚合物,如聚乙二醇(PEG)、Ficoll、葡聚糖、羟乙基淀粉和聚乙烯吡咯烷酮。可用于本文提供的实施方案的PEG实例包括PEG 600、PEG 800、PEG 1000、PEG 6000和PEG 8000。反应体积可包括的所述体积排除试剂的浓度如(重量/体积)为小于、大于或等于约5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%,或任意两个前述百分比之间的范围。
使核酸(如核酸的5'核苷酸)磷酸化的方法包括使核酸与激酶接触。激酶的实例包括T4多核苷酸激酶。
本文的一些实施方案可在单个反应体积中进行。在一些实施方案中,制备核酸的方法可以在减少的时间段内进行,例如在少于约12小时的时间段内,在少于约6小时的时间段内,或少于约3个小时的时间段内进行。
图1中描述了一个实施方案,其中将目标双链DNA片段去磷酸化并变性以形成目标单链DNA。将包含磷酸化的5'端、P7'序列和封闭的3'端的第一64bp衔接子与目标单链DNA的3'端连接,以形成具有连接酶(如CIRCLIGASETM(Lucigen Corporation,Middleton,WI))的连接的DNA。连接的DNA的5'端被诸如T4多核苷酸激酶的激酶磷酸化。将包含P5序列的第二60bp衔接子连接至磷酸化的连接的DNA 5'端,以形成DNA文库的成员(5′-P5-ssDNA插入物-P7-3′)。引物序列的实例可包括:P5引物序列(SEQ ID NO:01:aatgatacggcgaccaccga);P5‵引物序列(SEQ ID NO:02:tcggtggtcgccgtatcatt);P7引物序列(SEQ ID NO:03:caagcagaagacggcatacga);以及P7‵引物序列(SEQ ID NO:04:tcgtatgccgtcttctgcttg)。
在一些实施方案中,制备核酸文库的方法可包括使目标单链核酸的5′端去磷酸化以防止在随后的连接步骤中形成串联体;使用单链连接酶将第一衔接子与去磷酸化靶标的3'端连接,其中所述第一衔接子的3'端被封闭;将连接的靶标5'端再磷酸化;使用所述单链连接酶将第二衔接子连接至去磷酸化靶标的5'端,其中所述第二衔接子的5′端是非磷酸化的,从而得到核酸文库。在一些实施方案中,第二衔接子附接于基底。在一些实施方案中,基底包含珠。
一些实施方案包括在将第二衔接子连接至去磷酸化靶标的5′端之前,去除未连接的单链第一衔接子。在一些实施方案中,未连接的单链第一衔接子可与捕获探针杂交。在一些实施方案中,捕获探针包含与所述第一衔接子的至少一部分互补的序列。在一些这样的实施方案中,与捕获探针杂交抑制未连接的第一衔接子连接至单链第二衔接子。在一些实施方案中,捕获探针的3′端包含封闭基团。在一些实施方案中,捕获探针的5′端包含封闭基团。在一些实施方案中,未连接的单链第一衔接子可通过消化来去除。在一些实施方案中,消化未连接的单链第一衔接子包括使未连接的单链第一衔接子与5′-磷酸依赖性核酸外切酶接触,并且任选地也与5′-去腺苷化酶接触。
图2中描述了另一实施方案,其中用5'核酸外切酶部分地消化双链靶核酸以形成具有单链3'悬突的双链核酸。将包含磷酸化5'端、P7'序列和封闭的3'端的第一64bp衔接子与目标双链DNA的3'端连接,以形成具有连接酶(如CIRCLIGASETM)的连接的DNA。连接的DNA被去杂化以形成单链核酸。将包含P5序列的第二60bp衔接子与磷酸化的连接的DNA的5'端连接,以形成DNA文库的成员(5′-P5-ssDNA插入物-P7-3′)。
在一些实施方案中,制备核酸文库的方法可包括使目标双链核酸与5'核酸外切酶与接触,以获取多个具有单链3′-悬突的修饰的双链核酸;在连接酶和体积排除试剂存在下,使第一衔接子与修饰的双链核酸的3′端连接,其中第一衔接子的3′端包含封闭基团;使与第一衔接子连接的修饰的双链核酸去杂交以获取多个单链核酸;以及在所述连接酶存在下,使第二衔接子与所述单链核酸的5′端连接,从而得到核酸文库。
图3中描述了一个实施方案,其中用碱性磷酸酶将目标单链DNA去磷酸化。将包含磷酸化的5'端、P5'序列和封闭的3'端的第一衔接子与目标单链DNA的3'端连接,以形成具有连接酶(如CIRCLIGASETM)的连接的DNA。连接的DNA通过第一衔接子与含有P5序列的捕获探针杂交并附接于珠。所述捕获探针被延伸以形成延伸的DNA,并且所述连接的DNA被从延伸的DNA中去除。通过连接酶(如CIRCLIGASETM)将包含磷酸化5'端、P7'序列和封闭的3'端的第二衔接子与延伸DNA的3'端连接,以形成附接于珠的DNA文库成员(P5-插入物'-P7')。
在一些实施方案中,制备核酸文库的方法可包括使目标单链核酸的5′端去磷酸化;在连接酶和体积排除试剂存在下,将第一衔接子与所述单链核酸的3′端连接,其中所述第一衔接子的3′端包含封闭基团;使所述连接的第一衔接子与捕获探针杂交;延伸所述捕获探针,以及在所述连接酶存在下,将第二衔接子与所述延伸的捕获探针的3′端连接,其中所述第二衔接子的3′端包含封闭基团,从而得到核酸文库。一些实施方案还包括从所述延伸的捕获探针去除所述杂交的连接的第一衔接子。在一些实施方案中,所述捕获探针附接于基底。在一些实施方案中,带有捕获探针的基底是流动室、珠、玻璃、可控孔玻璃、塑料、硅、熔融石英、二氧化硅、氮化硅、硅衍生物、砷化镓、磷化铟、铝、陶瓷、聚酰亚胺、石英、树脂或聚合物或共聚物(如聚苯乙烯)。基底可以由多个材料的层或材料的混合物组成。基底可以是刚性的或半刚性的。基底可以是平坦的、圆形的或有纹理的。在一些实施方案中,基底可以是刚性材料,如玻璃和/或二氧化硅衍生物,其上包被有一种或多个聚合物材料。在一些实施方案中,所述基底包含珠。在一些实施方案中,所述捕获探针包含捕获探针索引。在一些实施方案中,所述捕获探针索引指示捕获探针的来源。在一些实施方案中,所述捕获探针包含可切割连接子。一些实施方案还包括切割所述可切割连接子。在一些实施方案中,所述捕获探针附接于基底,如流动室(参见图26),后续在所述基底上发生延伸。当所述基底是流动室时,所得的文库可被直接测序。在一些实施方案中,该方法进一步包括将互补引物与延伸的捕获探针杂交,将含有3'封闭基团的P7'衔接子连接到延伸的捕获探针的3'端,并使互补引物去杂交化,例如,如图26中所示。
图4A中描述了一个实施方案,其中将目标双链DNA片段去磷酸化并变性,以形成目标单链DNA。提供了一种衔接子,其从5'至3'包括:磷酸化的5'端、P7'序列、可切割位点(“U”)、P5序列和封闭的3'端(“R”)。用连接酶将所述衔接子连接到目标单链DNA的3'端,以形成连接的DNA。连接的DNA的5'端被激酶磷酸化。连接的DNA的封闭3'端被脱保护,并且连接的DNA通过用连接酶进行连接被环化,以形成包含环状单链DNA的文库成员。在一些实施方案中,环状核酸可用于通过多个技术中的任何一种来生成单链核酸。图4B中显示了一些示例性实施方案,其中可以通过切割可包含尿嘧啶残基的可切割位点来线性化所述环状核酸。所述环状核酸也可以用于通过利用诸如衔接子内的引物位点进行扩增(如PCR)来产生单链核酸。还可通过滚环扩增(RCA)来扩增所述环状核酸。
在一些实施方案中,制备核酸文库的方法可以包括:使目标单链核酸的5′端去磷酸化;使所述单链核酸的3′端与连接子连接,其中所述连接子包含第一衔接子和第二衔接子,并且所述连接子的3′端包含封闭基团;使所述连接的单链核酸的5′端磷酸化;使所述磷酸化的核酸的3′端脱保护,并且通过连接使所述脱保护的核酸环化,从而获取环状核酸文库。
在一些实施方案中,连接子包含在第一衔接子和第二衔接子之间的可切割位点。在一些这样的实施方案中,切割环状核酸的可切割位点可产生在一端具有第一衔接子的线状核酸,第二衔接子位于所述线状核酸的另一端。在一些实施方案中,可切割位点包括限制性位点,包含至少一个尿嘧啶残基的位点,以及包含非典型碱基(如8-氧代鸟嘌呤和二硫醇基团)的位点。一些实施方案包括通过在可切割位点切割使环状核酸线性化。切割可切割位点的实例包括使所述位点与尿嘧啶特异性切除试剂接触,如选自以下的酶:尿嘧啶DNA糖基化酶(UDG)和DNA糖基化酶-裂合酶核酸内切酶VIII,或其混合物,或使所述位点与限制性核酸内切酶接触。
一些实施方案还包括扩增所述环状核酸,所述扩增包括使引物与第一和第二衔接子杂交。扩增方法的实例包括PCR、滚环扩增(RCA)和成簇扩增。在一些这样的实施方案中,通过RCA扩增可在溶液中进行,或者环状单链核酸可被捕捉在表面上(诸如流动室的表面上)并且扩增。在一些实施方案中,扩增包括使所述环状核酸与聚合酶接触,所述聚合酶在接触模板中的尿嘧啶残基时形成线状产物。聚合酶实例包括热球菌(Pyrococcus)样校对聚合酶,如PHUSION DNA聚合酶。
一些实施方案包括制备单链核酸文库的方法,包括:(a)获取多个单链核酸;(b)使所述单链核酸与APEX碱性磷酸酶接触,从而使所述单链核酸的5′端去磷酸化;(c)在包含TS2126 RNA连接酶(Lucigen Corporation,Middleton,WI)和至少45%(w/v)聚乙二醇(PEG)的反应体积中,将第一衔接子连接至单链核酸的3′端,其中所述第一衔接子的3′端包含3'-间隔子C3封闭基团;(d)使所述连接的单链核酸与T4多核苷酸激酶接触,从而使所述连接的单链核酸的5′端磷酸化;以及(e)在所述连接酶和PEG存在下,将第二衔接子与所述磷酸化的连接的单链核酸的5′端连接,其中所述第二衔接子的5′端是非磷酸化的,从而得到核酸文库。
一些实施方案包括制备单链核酸文库的方法,包括:(a)获取多个双链核酸;(b)使所述双链核酸与5′-核酸外切酶接触以获取多个具有单链3′-悬突的修饰的双链核酸;(c)在包含TS2126 RNA连接酶和至少45%(w/v)聚乙二醇(PEG)的反应体积中,将第一衔接子连接至修饰的双链核酸的3′端,其中所述第一衔接子的3′端包含3'-间隔子C3封闭基团;(d)使与所述第一衔接子连接的所述修饰的双链核酸去杂交以获取多个单链核酸;以及(e)在所述连接酶和PEG存在下,使第二衔接子与所述单链核酸的5′端连接,其中所述第二衔接子的5′端是非磷酸化的,从而得到核酸文库。
一些实施方案包括制备单链核酸文库的方法,包括:(a)获取多个单链核酸;(b)使所述单链核酸与APEX碱性磷酸酶接触,从而使所述单链核酸的5′端去磷酸化;(c)在包含TS2126 RNA连接酶和至少45%(w/v)聚乙二醇(PEG)的反应体积中,将第一衔接子连接至单链核酸的3′端,其中所述第一衔接子的3′端包含3'-间隔子C3封闭基团;(d)使所述连接的单链核酸与T4多核苷酸激酶接触,从而使所述连接的单链核酸的5′端磷酸化;(e)通过使所述单链第一衔接子与捕获探针杂交,从所述连接的单链核酸去除未连接的单链第一衔接子,其中所述捕获探针包含:含有3'-间隔子C3封闭基团的3′端、非磷酸化的5′端和与所述第一衔接子的至少一部分互补的序列;以及(f)在所述连接酶和PEG存在下,将第二衔接子与所述磷酸化的连接的单链核酸的5′端连接,其中所述第二衔接子的5′端是非磷酸化的,从而得到核酸文库。
一些实施方案包括制备附接于珠的核酸文库的方法,包括:(a)获取多个单链核酸;(b)使所述单链核酸与APEX碱性磷酸酶接触,从而使所述单链核酸的5′端去磷酸化;(c)在包含TS2126 RNA连接酶和至少45%(w/v)聚乙二醇(PEG)的反应体积中,将第一衔接子连接至单链核酸的3′端,其中所述第一衔接子的3′端包含3'-间隔子C3封闭基团;(d)使所述连接的第一衔接子与捕获探针杂交,其中所述捕获探针附接于珠上;(e)延伸所述捕获探针;以及(f)在所述连接酶和PEG存在下,将第二衔接子与所述延伸的捕获探针的3′端连接,其中所述第二衔接子的5′端是非磷酸化的,从而得到核酸文库。
一些实施方案包括制备具有索引的核酸文库的方法,包括:(a)获取多个包含第一索引的第一单链核酸,其中所述第一单链核酸的5′端附接于多个珠,以及获取包含第二索引和捕获探针的多个第二单链核酸,其中所述第二单链核酸的3′端包含3'-间隔子C3封闭基团;(b)在包含TS2126RNA连接酶和至少45%(w/v)聚乙二醇(PEG)的反应体积中,将第一单链核酸的3′端连接至所述第二单链核酸的5′端;(c)使靶核酸与所述捕获探针杂交;以及(d)延伸所述靶核酸,从而获取具有索引的核酸文库。
去除未连接的单链衔接子
本文提供的系统、方法和组合物的一些实施方案包括从连接的衔接子(如连接至单链核酸的衔接子)去除未连接的单链衔接子。在一些实施方案中,从连接的衔接子去除未连接的单链衔接子可提高扩增制备的核酸文库的效率,如降低后续扩增步骤中引物二聚体形成的可能性或量。
一些实施方案包括系统或方法以去除未连接的单链衔接子,并且可包括使未连接的单链衔接子与捕获探针杂交。在图5中描述了一种实施方案,其中将目标双链DNA片段去磷酸化并变性以形成目标单链DNA。用连接酶将包含磷酸化5'端、P7'序列和封闭的3'端的第一64bp衔接子与目标单链DNA的3'端连接,以形成连接的DNA。连接的DNA的5'端被诸如T4多核苷酸激酶的激酶磷酸化。通过与含有P7序列的捕获探针杂交,从连接的DNA中去除未连接的第一衔接子。将包含P5序列的第二60bp衔接子与磷酸化的连接的DNA 5'端连接,以形成DNA文库的成员(5′-P5-ssDNA插入物-P7-3′)。在一些这样的实施方案中,与捕获探针的杂交可抑制未连接的第一衔接子与单链第二衔接子的连接。在一些实施方案中,所述捕获探针可包括未连接的单链衔接子的至少一部分的互补序列。在一些实施方案中,所述捕获探针可包括3'和/或5'封闭基团以防止串联体形成。在一些实施方案中,所述捕获探针可附接于诸如珠的基底上。
去除未连接的单链衔接子的一些实施方案可包括消化未连接的单链衔接子。一些这样的实施方案可包括使未连接的单链衔接子与核酸酶接触,所述核酸酶如5'-磷酸依赖性核酸外切酶,如TERMINATOR(Epicentre,Madison,WI)。在图6中描述了一个实施方案,其中将目标双链DNA片段去磷酸化并变性以形成目标单链DNA。用连接酶将包含磷酸化5'端、P7'序列和封闭的3'端的第一64bp衔接子与目标单链DNA的3'端连接,以形成连接的DNA。通过用5'-磷酸依赖性核酸外切酶和5'-去腺苷化酶消化来去除未连接的第一衔接子。用诸如T4多核苷酸激酶的激酶将连接的DNA的5'端磷酸化。将包含P5序列的第二60bp衔接子与磷酸化的连接的DNA 5'端连接,以形成DNA文库的成员(5′-P5-ssDNA插入物-P7-3′)。
去除未连接的单链衔接子的一些实施方案可包括使用珠。有利地,珠的使用可包括从珠洗去反应的组分和附接于珠上的组分。在一些实施方案中,第一衔接子可连接至去磷酸化的单链核酸的3'端。所述第一衔接子可包括3'封闭基团,并且可包括靶序列。所述靶序列可与附接于基底的捕获探针杂交。在一些实施方案中,所述基底可包括珠。所述捕获探针可包括测序引物位点、索引和扩增引物位点。可以从基底和杂交的连接的单链核酸洗去未连接的单链衔接子。所述捕获探针可被延伸。在一些实施方案中,可以从所述延伸的捕获探针去除杂交的连接的单链核酸。第二衔接子可以与延伸的捕获探针的5'端连接。在一些实施方案中,所述第二衔接子在3'端包括封闭基团。所述第二衔接子可包括测序引物位点、索引和扩增引物位点。
制备具有索引的文库
本文提供的系统、方法和组合物的一些实施方案包括制备具有索引的核酸文库的方法。衔接子和/或捕获探针可包括索引。可用于本文提供的实施方案的索引的使用和制备实例可参见国际公开号WO 2012/061832和WO 2014/142850;以及美国专利9074251和8829171号,其各自通过引用整体并入本文。在一些实施方案中,索引可通过连接并入靶核酸中。在一些实施方案中,索引可通过捕获探针、衔接子或靶核酸的延伸来并入核酸中。因此,可通过本文提供的方法容易地制备具有索引的文库。
在一些实施方案中,可制备一系列捕获探针。在一些实施方案中,可通过将第一衔接子与第二衔接子连接来制备捕获探针。所述衔接子可以各自包含索引。所述第一衔接子可被附接于诸如珠的基底上。所述第二衔接子可包括杂交探针。所述杂交探针可与目标单链核酸杂交。目标单链核酸可与杂交探针杂交,并可被延伸,从而并入与一个或多个衔接子的索引互补的序列。
一些实施方案可包括获取多个包含第一索引的第一衔接子,其中所述第一衔接子的5'端包括5'封闭基团,以及获取多个包含第二索引和捕获探针的第二衔接子,其中所述第二衔接子的3'端包括3'封闭基团。一些实施方案还包括在连接酶存在下,将所述第一单链核酸的3'端连接至所述第二单链核酸的5′端。一些实施方案还包括使靶核酸与所述捕获探针杂交。一些实施方案还包括延伸所述靶核酸,从而获取具有索引的核酸文库。一些实施方案还包括扩增所述延伸的靶核酸。在一些实施方案中,所述5′封闭基团包含去磷酸化的核苷酸或与基底的附接。在一些实施方案中,所述基底包含多个珠。
试剂盒、反应容器和流动室
本文提供的系统和方法的实施方案包括试剂盒、反应容器和流动室,其含有可用于将衔接子连接至核酸(如单链核酸和/或双链核酸)来制备核酸文库的任何一种或多个组分。组分的实例包括第一衔接子(其中所述第一衔接子的3′端包含封闭基团),连接酶,体积排除试剂,去磷酸化试剂,第二衔接子(其中所述第二衔接子的5′端包含封闭基团),测序引物,扩增引物,包含索引的核酸,以及5′核酸外切酶。在一些实施方案中,试剂盒可包含用于本文提供的任何方法的试剂。在一些实施方案中,试剂盒可包含反应容器。在一些实施方案中,试剂盒可包含流动室,流动室包含所述反应容器。
一些实施方案包括包含反应体积的反应容器,本文提供的方法可在所述反应体积中进行。在一些这样的实施方案中,反应容器可包含本文提供的方法的任何阶段或步骤的组分。在一些实施方案中,反应容器可包含多个核酸,如单链核酸和/或双链核酸;第一衔接子,其中所述第一衔接子的3′端包含封闭基团;连接酶;以及体积排除试剂。在一些实施方案中,反应容器还可包含第二衔接子。在一些实施方案中,反应容器还可包含去磷酸化试剂。
在一些实施方案中,反应容器可包含反应体积。在一些实施方案中,所述反应体积可包含多个核酸,如单链核酸和/或双链核酸;第一衔接子,其中所述第一衔接子的3′端包含封闭基团;第二衔接子;去磷酸化试剂;连接酶;以及体积排除试剂。在一些实施方案中,反应体积可包含多个包含第一索引的第一单链核酸,其中所述第一单链核酸的5′端包含5′封闭基团;包含第二索引和捕获探针的第二单链核酸,其中所述第二单链核酸的3′端包含3′封闭基团;以及连接酶。
在一些实施方案中,所述第一衔接子被连接于所述多个单链核酸的3′端,从而形成多个修饰的单链核酸。在一些实施方案中,未连接的第一衔接子与捕获探针杂交。在一些实施方案中,所述捕获探针包含与所述第一衔接子的至少一部分互补的序列。
在一些实施方案中,所述第二衔接子的5′端是非磷酸化的。在一些实施方案中,所述第二衔接子被连接至多个修饰的单链核酸的5′端。在一些实施方案中,所述去磷酸化试剂包含磷酸酶。在一些实施方案中,所述磷酸酶是未活化的。磷酸酶的实例包括小牛肠磷酸酶、虾碱性磷酸酶、南极磷酸酶和APEX碱性磷酸酶。
在一些实施方案中,所述第一衔接子和/或第二衔接子可包括测序引物结合位点。测序结合位点的实例包括P7序列、P7序列的互补序列或反向互补序列;及P5序列、P5序列的互补序列或反向互补序列。
在一些实施方案中,所述第一衔接子和/或第二衔接子可包含衔接子索引。在一些实施方案中,所述第一衔接子索引不同于所述第二衔接子索引。在一些实施方案中,所述衔接子索引指示所述多个单链核酸的来源。
本文提供的一些实施方案包括包含反应体积的反应容器,所述反应体积包含:多个包含第一索引的第一单链核酸,其中所述第一单链核酸的5′端包含5′封闭基团;多个包含第二索引和捕获探针的第二单链核酸,其中所述第二单链核酸的3′端包含3′封闭基团;以及连接酶。
在一些实施方案中,封闭基团包含3'-间隔子C3、双脱氧核苷酸或磷酸基团。在一些实施方案中,封闭基团可包含与基底的附接。基底实例包括珠。
在一些实施方案中,体积排除试剂选自:聚乙二醇(PEG)、葡聚糖、羟乙基淀粉、Ficoll和聚乙烯吡咯烷酮。可用于本文提供的实施方案的PEG实例包括:PEG 600、PEG 800、PEG 1000、PEG 6000和PEG 8000。所述反应体积可包含的体积排除试剂的浓度(如重量/体积)为小于、大于或等于约5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%,或任意两个前述百分比之间的范围。
在一些实施方案中,所述连接酶包含单链核酸连接酶。单链核酸连接酶的实例包括:T4 RNA连接酶1、T4 RNA连接酶2、RtcB连接酶、甲烷杆菌RNA连接酶和TS2126 RNA连接酶(CIRCLIGASE)。
本文提供的一些实施方案包括包含本文的反应容器的流动室。一些实施方案包括包含本文的反应容器和用于获取测序数据的检测器的系统。
流动室可以包括具有表面的室,一种或多种流体试剂可以流过该表面。通常,流动室将具有入口和出口以促进流体的流动。可以容易地在本申请的方法中使用的流动室和相关的流体系统和检测平台的实例描述于例如,Bentley et al.,Nature 456:53-59(2008),WO 04/018497;US7,057,026;WO 91/06678;WO 071123744;US 7,329,492;US 7,211,414;US 7,315,019;US 7,405,281和US 2008/0108082,其各自通过引用整体并入本文。
实施例
实施例1—将衔接子连接至单链靶核酸
使用单链DNA作为靶核酸,进行四步法单链DNA(ssDNA)文库制备方法。图1提供了四个步骤的概述,包括:靶核酸的5'去磷酸化;3'衔接子与靶核酸3'端的连接,其中3'衔接子的3'端被封闭以抑制自我串联体化;连接的靶核酸的5'去磷酸化的再磷酸化;以及5'衔接子与连接的靶核酸5'端的连接,其中5'衔接子的5'端被封闭以抑制自我串联体化。
为了检测去磷酸化步骤,使用碱性磷酸酶APEX磷酸酶(Epicentre,Madison,WI)、在含25%聚乙二醇(PEG)的反应体积中将60聚体单链核酸(3′OH-60-Phos 5′)的5'端进行去磷酸化。使用单链连接酶CIRCLIGASETM连接酶(Lucigen Corporation,Middleton,WI)测定5'端的去磷酸化程度,以确认去磷酸化产物没有形成串联体。如图7所示,碱性磷酸酶的去磷酸化效率为约100%。
为检测最初的连接步骤,使用CIRCLIGASE、在含有25%PEG的反应体积中,将包含3'封闭基团的64聚体P7'衔接子(3′C3-P7-phos 5′)连接到去磷酸化60聚体单链核酸(3′OH-60-OH 5′)的3'端。将P7'衔接子的3'端封闭,以抑制自我串联体化。如图8所示,该连接步骤(泳道2)的产率确定为97.5%。
为检测激酶步骤,使用T4多核苷酸激酶(PNK)将包含带有3'封闭基团的连接的64聚体衔接子(3′C3-P7-60-OH)的124聚体去磷酸化单链核酸的5'端再磷酸化。如图9所示,确定再磷酸化具有约99%的产率。
为了检测第二连接步骤,使用CIRCLIGASE、在含有1.6%PEG的反应体积中,将具有非磷酸化5'端的60聚体P5衔接子(5′P5-OH)连接至124聚体单链核酸的5'端(3′C3-60-B2-Phos)。124聚体单链核酸包括带有3'封闭基团的连接的64聚体衔接子(3′C3-P7-phos 5′)。如图10所示,该连接步骤(泳道2)的产率确定为>85%。因此,四步ssDNA文库制备方法的总产率>80%。
实施例2—将衔接子连接至无细胞靶核酸
使用无细胞DNA(cfDNA)进行图1中展示的方案。使用APEX碱性磷酸酶将双链靶核酸进行去磷酸化,然后去杂交化以形成单链靶核酸。为了检测初始连接步骤,使用CIRCLIGASE、在含有22.5%PEG的反应体积中,将包含3'封闭基团的64聚体P7'衔接子(3′C3-P7-phos 5′)连接到单链去磷酸化无细胞DNA(cfDNA)的3'端,持续3小时。如图11所示,该连接步骤(泳道2)的产率被确定为大于95%。
为了检测激酶步骤,用T4多核苷酸激酶(PNK)处理去磷酸化的cfDNA(cfDNA[Apex]),并且将含有3'封闭基团的64聚体P7'衔接子(3′C3-P7-phos 5′)连接到再磷酸化的cfDNA的3'端。所述反应在包含11.25%PEG的反应体积中进行1小时(图12)。
为了检测第二连接步骤,将含有3'封闭基团的64聚体P7'衔接子(3′C3-P7-phos5′)连接至去磷酸化cfDNA的3'端,用激酶(PNK)处理所得的第一连接产物(3'C3-P7-cfDNA-phos 5'),并将具有非磷酸化5'端的60聚体P5衔接子(5'P5-OH)连接到第一连接产物的5'端的末端形成第二连接产物(P7′-cfDNA-P5)。使用CIRCLIGASE、在含有3.8%PEG的反应体积中进行该反应。图13显示了连接产物(P7′-cfDNA-P5)和(P7′-P5)。
实施例3—分析连接产物
将来自实施例2的连接产物在凝胶上分离,从凝胶上提取连接产物的条带,扩增提取的连接产物,并使用毛细管电泳(BioAnalyzer,Agilent)分离扩增产物。
将连接产物在凝胶上分离,并从凝胶上切下条带提取物B1和提取物B2。如图14所示,在“参考”泳道中,提取物B1用两个黑框标记,提取物B2用一个白框标记。通过PCR扩增提取物,其中包含的非PCR(不可扩增)P7引物与PCRP7引物的比例为1:40至1:20,共24个循环。使用固相可逆固定化(SPRI)珠与样品以2:1的比例提取PCR产物。结果如图14所示。
通过毛细管电泳(BioAnalyser,Agilent)进一步分析提取物B1和B2的扩增产物。如图15所示,提取物B2主要包含127bp(P7′-P5)物质,提取物B1包含292bp(P7′-cfDNA-P5)物质和480bp(P7′-cfDNA-P5)物质。
改变用于纯化凝胶提取物的SPRI珠的量,以确定有效去除引物二聚体的比例(图16)。SPRI珠:样品(v:v)为1.2:1时最有效地去除引物二聚体,而不会丢失明显部分的cfDNA文库。
实施例4—捕获未连接P7′引物
使用图5中展示的方案去除了多余的未连接P7'引物。简而言之,在将P7′衔接子引物连接至靶核酸的3'端之后,将与P7′衔接子引物互补的P7引物添加至反应体积。P7引物在其5'和3'端包括封闭基团。添加P7引物后,将P5衔接子连接至再磷酸化的连接的靶核酸5'端。
在含有25%PEG的反应体积中,将63聚体P7'引物(3′C3-P7′-phos5′)连接到cfDNA的3'端。如图17所示,连接产物的收率>95%。为了检测捕获探针的存在下的连接,在含有5'和3'封闭基团的63聚体P7捕获探针(3′C3-P7-C35′)存在下,将具有非磷酸化5'端的60聚体P5衔接子(5′P5-OH)连接到第一连接产物(3′C3-P7′-cfDNA-phos5′)的5'端。在含有6.5%PEG的反应体积中进行该反应。图18显示了连接产物(P7′-cfDNA-P5)和(P7′-P5)。
进一步分析连接产物。如图19所示,将连接产物按大小在凝胶上分离,从凝胶中提取某些条带,并扩增提取物B1和提取物B2。通过毛细管电泳分析扩增产物,扩增产物包括127bp(P7′-P5)物质、292bp(P7′-cfDNA-P5)物质和480bp(P7′-cfDNA-P5)物质。图20显示了扩增前、扩增后和SPRI珠提取后的连接产物的凝胶。
并入非PCR P7以捕获过量的P7',显著减少了引物二聚体的形成。此外,使用1.2XSPRI去除显著减少了引物二聚体,cfDNA文库没有明显损失。
实施例5—连接缀合至珠的单链核酸
检测了在不同浓度的PEG中两种寡聚体(寡聚体1和寡聚体2)之间的连接效率。寡聚体1包含封闭的3'端(OH),寡聚体2包含封闭的5'端(phos),因此连接产生单个连接的寡聚体1-寡聚体2产物。反应条件包括:每种寡聚体10pmol+2μL的10x缓冲液+1μL的1mM ATP,1μL的50mM MnCl2,1μL的CIRCLIGASE(100U/μL)+15μL的0%、25%、50%或60%PEG,最终反应体积为20μL,分别具有0%、19%、38%和45%PEG。结果如图21所示。含有45%PEG的反应体积提供了连接的寡聚体1和寡聚体2的产率为55.9%。
检测了不同浓度的寡聚体2时,寡聚体1和寡聚体2之间的连接效率。反应条件包括:10pmol的寡聚体1+10x pmol的寡聚体2+2μL的10x缓冲液+1μL的1mM ATP,1μL的50mMMnCl2、2μL的CIRCLIGASE(100U/μL)+15μL的60%PEG,最终反应体积为20μL,含45%PEG。结果如图22所示。含有过量4X的寡聚体2和+2X CIRCLIGASE的反应体积提供的连接的寡聚体1和寡聚体2的产率为79.6%。
检测了在不同浓度的CIRCLIGASE时,寡聚体1和寡聚体2之间的连接效率。反应条件包括:每种寡聚体10pmol+2μL的10x缓冲液+1μL的1mM ATP,1μL的50mM MnCl2,XμL的CIRCLIGASE(100U/μL)+15μL的60%PEG,最终反应体积为20μL,含45%PEG。结果如图23所示。含有8X浓度的CIRCLIGASE的反应体积提供的连接的寡聚体1和寡聚体2的产率为75.3%。
通过肼-醛偶联将寡聚体1缀合至珠。39聚体寡聚体1包含两个尿嘧啶碱基,其可使用尿嘧啶DNA糖基化酶(UDG)切割以产生更短的27聚体寡聚体(寡聚体1*)。
在连接反应中检测与珠缀合的各种浓度的寡聚体1。通过随后用UDG处理来测定寡聚体2与缀合的寡聚体1的连接。连接反应条件假定为:用于珠附接的寡聚体1的量等于珠上的寡聚体1的量。测试了四种浓度的总寡聚体1输入:0.5nmol、1nmol、2nmol和4nmol。使用了10%的总珠溶液,因此假设每个反应中寡聚体1的量等于0.1nmol、0.2nm ol、0.3nmol和0.4nmol。反应混合物:10μL珠溶液(2x浓缩液),寡聚体2(0.4nmol),2μL的10x缓冲液,1μL的1mM ATP,1μL的50mM MnCl2、1μL的CIRCLIGASE(100U/μL)+5μL的90%PEG,最终反应体积为20μL,含22.5%PEG。将反应物在60℃孵育3h,然后在80℃灭活10min。反应中寡聚体1:寡聚体2的比率为:0.05nmol(1:8)、0.1nmol(1:4)、0.2nmol(1:2)、0.4nmol(1:1)。在最终的反应体积10μL中用10μL的LMX1进行尿嘧啶切割,然后在37℃下孵育1小时。结果如图24所示。含有1:1比例的寡聚体1:寡聚体2的反应体积可提供连接的寡聚体1和寡聚体2的产率为85.2%。对具有45%PEG的最终反应体积重复该试验。结果如图25所示。包含1:1比例的寡聚体1:寡聚体2的反应体积提供连接的寡聚体1和寡聚体2的产率为84.5%。
如本文所用,术语“包含”与“包括”、“含有”,或“特征在于”同义,并且是包括性的或开放性的,不排除另外的未写明的要素或方法步骤。
以上描述公开了本发明的几种方法和材料。本发明容易接受方法和材料的修改,以及制造方法和设备的改变。通过考虑本申请或本文公开的发明的实践,这样的修改对于本领域技术人员是容易得出的。因此,本发明不意图限制于本文公开的具体实施方案,而是涵盖了落入本发明的真实范围和实质的所有修改和替代方案。
本文引用的所有参考文献,包括但不限于已公开和未公开的申请、专利和参考文献,均通过引用全文并入本文,并因此成为本说明书的一部分。在通过引用并入的出版物和专利或专利申请与本说明书中包含的内容相抵触的情况下,本说明书旨在取代和/或优先于任何此类矛盾的材料。
序列表
<110> 陈锡君
塔伦·库拉纳
<120> 用于制备核酸文库的方法和组合物
<130> ILLINC.362WO
<150> 62/473595
<151> 2017-03-20
<160> 4
<170> FastSEQ for Windows Version 4.0
<210> 1
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> primer_bind
<222> (0)...(0)
<223> P5引物
<400> 1
aatgatacgg cgaccaccga 20
<210> 2
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> primer_bind
<222> (0)...(0)
<223> P5'引物
<400> 2
tcggtggtcg ccgtatcatt 20
<210> 3
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> primer_bind
<222> (0)...(0)
<223> P7引物
<400> 3
caagcagaag acggcatacg a 21
<210> 4
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> primer_bind
<222> (0)...(0)
<223> P7'引物
<400> 4
tcgtatgccg tcttctgctt g 21

Claims (28)

1.制备核酸文库的方法,包括:
(a) 获取多个核酸,其中所述多个核酸是单链核酸;
(b) 将所述单链核酸的5′端脱磷酸化;
(c) 在连接酶存在下,将第一衔接子与所述单链核酸的3′端连接,其中所述第一衔接子的3′端包含封闭基团;
(d) 通过使未连接的单链第一衔接子与捕获探针杂交,去除未连接的单链第一衔接子;
(e) 使所述连接的单链核酸的5′端磷酸化;以及
(f) 在所述连接酶存在下,将第二衔接子与所述磷酸化的连接的单链核酸的5′端连接,从而得到核酸文库,
其中所述捕获探针的3′端和5′端包含封闭基团。
2.如权利要求1所述的方法,其中所述第二衔接子的5′端是非磷酸化的。
3.如权利要求1所述的方法,其中所述第二衔接子附接于基底。
4.如权利要求3所述的方法,其中所述基底包含珠或流动室。
5.如权利要求1所述的方法,其中所述捕获探针位于溶液中。
6.如权利要求1所述的方法,其中所述捕获探针包含与所述第一衔接子的至少一部分互补的序列。
7.如权利要求1所述的方法,其中使所述连接的单链核酸的5′端磷酸化包括使所述连接的单链核酸与激酶接触。
8. 如权利要求1-7中任一项所述的方法,其中步骤(b) – (f)在单个反应体积中进行。
9. 如权利要求1-7中任一项所述的方法,其中步骤(b) – (f)在单个反应容器中进行。
10.如权利要求1-7中任一项所述的方法,其中所述第一衔接子和/或第二衔接子包含测序引物结合位点。
11.如权利要求10所述的方法,其中所述第一衔接子包含P7序列、P5序列或者其互补序列或反向互补序列。
12.如权利要求10所述的方法,其中所述第二衔接子包含P7序列、P5序列或者其互补序列或反向互补序列。
13.如权利要求1-7中任一项所述的方法,其中所述第一衔接子和/或第二衔接子包含衔接子索引。
14.如权利要求13所述的方法,其中所述第一衔接子索引不同于所述第二衔接子索引。
15.如权利要求13所述的方法,其中所述衔接子索引指示所述多个核酸的来源。
16.如权利要求1-7中任一项所述的方法,其中所述封闭基团包含3'-间隔子C3或双脱氧核苷酸。
17.如权利要求1-7中任一项所述的方法,其中所述连接酶包含单链核酸连接酶。
18.如权利要求1-7中任一项所述的方法,其中所述第一衔接子的连接和/或所述第二衔接子的连接是在体积排除试剂存在下进行的。
19.如权利要求18所述的方法,其中所述体积排除试剂选自:聚乙二醇(PEG)、葡聚糖、羟乙基淀粉、Ficoll和聚乙烯吡咯烷酮。
20. 如权利要求18所述的方法,其中所述第一连接步骤和/或第二连接步骤在包含至少37% (wt/vol) PEG的反应体积中进行。
21. 如权利要求18所述的方法,其中所述第一连接步骤和/或第二连接步骤在包含至少60% (wt/vol) PEG的反应体积中进行。
22.如权利要求1-7中任一项所述的方法,其中所述多个核酸包含RNA。
23.如权利要求1-7中任一项所述的方法,其中所述多个核酸包含cDNA或基因组DNA。
24.如权利要求1-7中任一项所述的方法,其中所述多个核酸的核酸平均大小为小于200个核苷酸。
25.如权利要求1-7中任一项所述的方法,其中所述多个核酸获取自低质量核酸源。
26.如权利要求25所述的方法,其中所述多个核酸获取自固定的样品。
27.如权利要求1-7中任一项所述的方法,还包括扩增所述核酸文库。
28.如权利要求1-7中任一项所述的方法,还包括从所述核酸文库获取序列数据。
CN201880031331.8A 2017-03-20 2018-03-16 用于制备核酸文库的方法和组合物 Active CN110612351B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310889341.8A CN116926061A (zh) 2017-03-20 2018-03-16 用于制备核酸文库的方法和组合物

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762473595P 2017-03-20 2017-03-20
US62/473,595 2017-03-20
PCT/US2018/022978 WO2018175258A1 (en) 2017-03-20 2018-03-16 Methods and compositions for preparing nuclelic acid libraries

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202310889341.8A Division CN116926061A (zh) 2017-03-20 2018-03-16 用于制备核酸文库的方法和组合物

Publications (2)

Publication Number Publication Date
CN110612351A CN110612351A (zh) 2019-12-24
CN110612351B true CN110612351B (zh) 2023-08-11

Family

ID=61874043

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202310889341.8A Pending CN116926061A (zh) 2017-03-20 2018-03-16 用于制备核酸文库的方法和组合物
CN201880031331.8A Active CN110612351B (zh) 2017-03-20 2018-03-16 用于制备核酸文库的方法和组合物

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202310889341.8A Pending CN116926061A (zh) 2017-03-20 2018-03-16 用于制备核酸文库的方法和组合物

Country Status (9)

Country Link
US (2) US11518993B2 (zh)
EP (1) EP3601560A1 (zh)
JP (3) JP7062681B2 (zh)
KR (2) KR102548274B1 (zh)
CN (2) CN116926061A (zh)
AU (1) AU2018239186A1 (zh)
CA (1) CA3056428A1 (zh)
SG (2) SG11201908680YA (zh)
WO (1) WO2018175258A1 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3100983A1 (en) 2018-06-06 2019-12-12 The Regents Of The University Of California Methods of producing nucleic acid libraries and compositions and kits for practicing same
US11396674B2 (en) * 2019-02-22 2022-07-26 Gianluca ROMA Multiplex nucleic acid amplification and library preparation
JP2022528139A (ja) * 2019-04-05 2022-06-08 クラレット バイオサイエンス, エルエルシー 核酸を解析するための方法および組成物
US11390915B2 (en) * 2019-04-26 2022-07-19 New England Biolabs, Inc. Polynucleotide adapter design for reduced bias
IT201900015902A1 (it) * 2019-09-09 2021-03-09 Immagina Biotechnology S R L Procedimento per preparare un campione di rna per il sequenziamento e relativo kit
IT201900015914A1 (it) * 2019-09-09 2021-03-09 Immagina Biotechnology S R L Procedimento per preparare un campione di rna per il sequenziamento e relativo kit
CN111455469B (zh) * 2020-04-07 2023-08-18 深圳易倍科华生物科技有限公司 一种单链快速建库方法及建库仪器
CN111690718B (zh) * 2020-06-11 2023-04-14 曲阜师范大学 一种dna可逆保护和分离的方法
CN111763664B (zh) * 2020-06-28 2021-03-26 江苏康科斯医疗科技有限公司 一种用于构建测序文库的酶反应液及其应用
CN114480568B (zh) * 2020-12-30 2024-04-26 安诺优达基因科技(北京)有限公司 一种磷酸化反应的检测方法及试剂盒
WO2022177273A1 (ko) * 2021-02-18 2022-08-25 서울대학교산학협력단 핵산 라이브러리의 정제방법
CN113699214A (zh) * 2021-10-27 2021-11-26 翌圣生物科技(上海)股份有限公司 基于基因捕获技术的测序方法
WO2024005523A1 (ko) * 2022-06-28 2024-01-04 주식회사 제노헬릭스 Rna 염기서열 분석을 위한 라이브러리 제작 방법
WO2024059550A1 (en) * 2022-09-12 2024-03-21 Element Biosciences, Inc. Double-stranded splint adaptors with universal long splint strands and methods of use

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013022504A1 (en) * 2011-05-06 2013-02-14 New England Biolabs, Inc. Ligation enhancement
WO2014168575A1 (en) * 2013-04-11 2014-10-16 Sahlén Pelin Targeted chromosome conformation capture
CA2909861A1 (en) * 2013-04-25 2014-10-30 Firefly Bioworks, Inc. Multiplexed analysis of target nucleic acids
CN104428423A (zh) * 2012-07-06 2015-03-18 深圳华大基因科技有限公司 确定外源基因在人类基因组中整合方式的方法和系统
CN105102467A (zh) * 2013-02-07 2015-11-25 新泽西鲁特格斯州立大学 高度选择性核酸扩增引物
CN107603971A (zh) * 2017-10-24 2018-01-19 厦门龙进生物科技有限公司 一种原位杂交探针的制备方法
CN110603596A (zh) * 2017-03-30 2019-12-20 Illumina公司 基因组数据分析系统和方法
CN111108219A (zh) * 2017-08-01 2020-05-05 伊鲁米纳公司 使用的水凝胶珠和流动池的遗传物质的空间索引和文库制备
CN113272449A (zh) * 2018-10-26 2021-08-17 Illumina公司 调整聚合物小珠以进行dna处理

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0450060A1 (en) 1989-10-26 1991-10-09 Sri International Dna sequencing
ATE492652T1 (de) 2000-02-07 2011-01-15 Illumina Inc Nukleinsäuredetektionsverfahren mit universellem priming
EP2100971A3 (en) 2000-07-07 2009-11-25 Visigen Biotechnologies, Inc. Real-time sequence determination
US7211414B2 (en) 2000-12-01 2007-05-01 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
KR100385905B1 (ko) 2001-05-17 2003-06-02 주식회사 웰진 유니진 유래의 안티센스 분자로 구성된 안티센스 라이브러리를 이용한 대규모 유전자 검색 및 기능 분석 방법
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
EP1498486A4 (en) * 2002-03-29 2005-08-03 Prec System Science Co Ltd NUCLEIC ACID LIBRARY AND PROTEIN LIBRARY
SI3587433T1 (sl) 2002-08-23 2020-08-31 Illumina Cambridge Limited Modificirani nukleotidi
US7575865B2 (en) 2003-01-29 2009-08-18 454 Life Sciences Corporation Methods of amplifying and sequencing nucleic acids
CN101914620B (zh) 2004-09-17 2014-02-12 加利福尼亚太平洋生命科学公司 核酸测序的方法
US20070031865A1 (en) 2005-07-07 2007-02-08 David Willoughby Novel Process for Construction of a DNA Library
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
WO2007123744A2 (en) 2006-03-31 2007-11-01 Solexa, Inc. Systems and devices for sequence by synthesis analysis
US8343746B2 (en) 2006-10-23 2013-01-01 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
US20110003701A1 (en) * 2008-02-27 2011-01-06 454 Life Sciences Corporation System and method for improved processing of nucleic acids for production of sequencable libraries
US20120015821A1 (en) * 2009-09-09 2012-01-19 Life Technologies Corporation Methods of Generating Gene Specific Libraries
US8574864B2 (en) * 2009-11-05 2013-11-05 Epicentre Technologies Corporation Methods and kits for 3'-end-tagging of RNA
US9074251B2 (en) 2011-02-10 2015-07-07 Illumina, Inc. Linking sequence reads using paired code tags
CA2821299C (en) 2010-11-05 2019-02-12 Frank J. Steemers Linking sequence reads using paired code tags
US8829171B2 (en) 2011-02-10 2014-09-09 Illumina, Inc. Linking sequence reads using paired code tags
US10497461B2 (en) * 2012-06-22 2019-12-03 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US20140128292A1 (en) * 2012-09-27 2014-05-08 Bioo Scientific Corporation Methods for improving ligation steps to minimize bias during production of libraries for massively parallel sequencing
ES2887177T3 (es) 2013-03-13 2021-12-22 Illumina Inc Método de preparación de una biblioteca de secuenciación de ácidos nucleicos
US9255265B2 (en) * 2013-03-15 2016-02-09 Illumina, Inc. Methods for producing stranded cDNA libraries
US20160362680A1 (en) * 2015-05-15 2016-12-15 Nugen Technologies, Inc. Compositions and methods for negative selection of non-desired nucleic acid sequences
US20180171386A1 (en) * 2015-06-03 2018-06-21 The General Hospital Corporation Long Adapter Single Stranded Oligonucleotide (LASSO) Probes to Capture and Clone Complex Libraries
US11014957B2 (en) 2015-12-21 2021-05-25 Realseq Biosciences, Inc. Methods of library construction for polynucleotide sequencing
WO2017214557A1 (en) * 2016-06-10 2017-12-14 Counsyl, Inc. Nucleic acid sequencing adapters and uses thereof
CN106987585B (zh) * 2017-03-15 2019-11-12 深圳市海普洛斯生物科技有限公司 一种针对cfDNA的单链DNA二代测序文库构建方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013022504A1 (en) * 2011-05-06 2013-02-14 New England Biolabs, Inc. Ligation enhancement
CN104428423A (zh) * 2012-07-06 2015-03-18 深圳华大基因科技有限公司 确定外源基因在人类基因组中整合方式的方法和系统
CN105102467A (zh) * 2013-02-07 2015-11-25 新泽西鲁特格斯州立大学 高度选择性核酸扩增引物
WO2014168575A1 (en) * 2013-04-11 2014-10-16 Sahlén Pelin Targeted chromosome conformation capture
CA2909861A1 (en) * 2013-04-25 2014-10-30 Firefly Bioworks, Inc. Multiplexed analysis of target nucleic acids
CN110603596A (zh) * 2017-03-30 2019-12-20 Illumina公司 基因组数据分析系统和方法
CN111108219A (zh) * 2017-08-01 2020-05-05 伊鲁米纳公司 使用的水凝胶珠和流动池的遗传物质的空间索引和文库制备
CN107603971A (zh) * 2017-10-24 2018-01-19 厦门龙进生物科技有限公司 一种原位杂交探针的制备方法
CN113272449A (zh) * 2018-10-26 2021-08-17 Illumina公司 调整聚合物小珠以进行dna处理

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Universal Target Capture of HIV Sequences From NGS Libraries;Julie Yamaguchi等;《Front. Microbiol.》;全文 *

Also Published As

Publication number Publication date
US20240141332A1 (en) 2024-05-02
CN116926061A (zh) 2023-10-24
JP2020509778A (ja) 2020-04-02
US20200115707A1 (en) 2020-04-16
RU2019129451A (ru) 2021-04-21
RU2019129451A3 (zh) 2021-09-24
JP2022106809A (ja) 2022-07-20
CN110612351A (zh) 2019-12-24
WO2018175258A1 (en) 2018-09-27
JP7392028B2 (ja) 2023-12-05
KR102548274B1 (ko) 2023-06-27
KR20190130146A (ko) 2019-11-21
WO2018175258A8 (en) 2019-10-10
SG11201908680YA (en) 2019-10-30
SG10202109852WA (en) 2021-10-28
US11518993B2 (en) 2022-12-06
AU2018239186A1 (en) 2019-10-17
CA3056428A1 (en) 2018-09-27
JP7062681B2 (ja) 2022-05-06
KR20230101930A (ko) 2023-07-06
JP2024009211A (ja) 2024-01-19
EP3601560A1 (en) 2020-02-05

Similar Documents

Publication Publication Date Title
CN110612351B (zh) 用于制备核酸文库的方法和组合物
EP3615690B1 (en) Compositions and methods for improving sample identification in indexed nucleic acid libraries
CN108060191B (zh) 一种双链核酸片段加接头的方法、文库构建方法和试剂盒
EP2191011B1 (en) Method for sequencing a polynucleotide template
EP3635136B1 (en) Single cell whole genome libraries for methylation sequencing
US9902994B2 (en) Method for retaining even coverage of short insert libraries
US10006081B2 (en) End modification to prevent over-representation of fragments
US9328378B2 (en) Method of library preparation avoiding the formation of adaptor dimers
JP4124377B2 (ja) コードアダプターの連結による配列決定
EP2235217B1 (en) Method of making a paired tag library for nucleic acid sequencing
EP0975655B1 (en) Improvements in adaptor-based sequence analysis
EP3919617A1 (en) Methods and compositions for nucleic acid sequencing
CA3172086A1 (en) Methods and compositions for preparing sequencing libraries
WO2012003374A2 (en) Targeted sequencing library preparation by genomic dna circularization
CN107002290B9 (zh) 样品制备方法
RU2788402C2 (ru) Способы и композиции для получения библиотек нуклеиновых кислот
CA3220708A1 (en) Oligo-modified nucleotide analogues for nucleic acid preparation
CN116710573A (zh) 插入段和标识无变性测序方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant