CN109563543B - 产生核酸库的方法 - Google Patents

产生核酸库的方法 Download PDF

Info

Publication number
CN109563543B
CN109563543B CN201780050631.6A CN201780050631A CN109563543B CN 109563543 B CN109563543 B CN 109563543B CN 201780050631 A CN201780050631 A CN 201780050631A CN 109563543 B CN109563543 B CN 109563543B
Authority
CN
China
Prior art keywords
nucleic acid
overhang
oligonucleotides
complementary region
target nucleic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780050631.6A
Other languages
English (en)
Other versions
CN109563543A (zh
Inventor
理查德·E·格林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of California
Original Assignee
University of California
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of California filed Critical University of California
Publication of CN109563543A publication Critical patent/CN109563543A/zh
Application granted granted Critical
Publication of CN109563543B publication Critical patent/CN109563543B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/501Ligase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/179Modifications characterised by incorporating arbitrary or random nucleotide sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/204Modifications characterised by specific length of the oligonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2533/00Reactions characterised by the enzymatic reaction principle used
    • C12Q2533/10Reactions characterised by the enzymatic reaction principle used the purpose being to increase the length of an oligonucleotide strand
    • C12Q2533/107Probe or oligonucleotide ligation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/60Detection means characterised by use of a special device
    • C12Q2565/631Detection means characterised by use of a special device being a biochannel or pore

Abstract

提供了产生核酸库的方法。在某些方面,所述方法包含:组合靶核酸(例如,5'磷酰化核酸)和寡核苷酸池。所述寡核苷酸池的寡核苷酸可以包含不同长度和核苷酸序列的互补区域以及互补区域识别序列。在这种方面,所述组合是在以下条件下进行的:所述寡核苷酸池的寡核苷酸与所述靶核酸中的核酸(例如,5'磷酰化核酸)杂交,所述核酸具有在序列上互补并且相对于所述寡核苷酸的所述互补区域具有对应长度的突出端区域。还提供了可用于例如实践本公开的所述方法的组合物和试剂盒。

Description

产生核酸库的方法
关于联邦政府资助的研究的声明
本发明是在国家科学基金会授予的合同号1513501的政府支持下完成的。政府拥有本发明中的某些权利。
相关专利申请
本专利申请要求于2016年7月15日提交的题目为“产生核酸库的方法”,命名Richard E.Green为第一命名发明人,并由代理人案卷号UCSC-350PRV指定的美国临时专利申请号62/362,904的权益。上述申请的全部内容通过引用并入本文,包含所有文本、表格和附图。
背景技术
DNA测序的最新进展已经彻底改变了基因组学领域,使甚至单个研究组非常快速并以低得多的成本生成大量序列数据成为可能。这些高通量测序技术可使更多的研究人员和项目获得深度转录组测序和转录本量化、全基因组测序和重测序。
存在各种商业高通量测序平台,并且例如在Metzker,M.L.(2010)《自然评论遗传学(Nat.Rev.Genet.)》11:31-46,Morey等人(2013)《分子遗传学和代谢学(Mol.Genet.Metab.)》110:3–24,Reuter等人(2015)《分子细胞(Molecular Cell)》58(4):586-597中,以及其它地方描述。在Illumina平台中,测序过程涉及在载玻片表面上克隆扩增衔接子连接的DNA片段。使用循环可逆终止策略读取碱基,其通过渐进的碱基掺入、洗涤、成像和切割一次一个核苷酸对模板链进行测序。在此策略中,荧光标记的3'-O-叠氮基甲基-dNTP用于暂停聚合反应,能够移除未掺入的碱基和荧光成像以确定添加的核苷酸。在用耦合电荷装置(CCD)照相机扫描流动池之后,移除荧光部分和3'嵌段,并重复所述过程。
近年来已经取得重大进展的新兴单分子策略是基于纳米孔的测序,牛津纳米孔技术领导此方法的开发和商业化。纳米孔测序主要依赖于DNA或单个核苷酸通过小通道的转变。测序流动池包含数百个独立的微孔,每个微孔含有由生物纳米孔穿孔的合成双层。通过测量当碱通过分子运动蛋白穿过孔时诱导的电流的特性变化来完成测序。库制备是最小的,涉及DNA的片段化和衔接子的连接,并且可以在有或没有PCR扩增的情况下进行。库设计允许对来自单个分子的两条DNA链进行测序,这提高了准确性。
为特定类型的实验选择合适的测序平台是重要的考虑因素,并且需要详细了解可用的技术,包含误差来源、错误率、以及测序的速度和成本。虽然测序成本已经急剧下降,但库制备的通量和成本现在是限制性因素。
发明内容
提供了产生核酸库的方法。在某些方面,所述方法包含组合靶核酸和寡核苷酸池。所述寡核苷酸池的每个寡核苷酸可以包含(i)能够与靶核酸中的突出端杂交的互补区域,和(ii)互补区域识别多核苷酸。所述池中的寡核苷酸可以包含不同长度的互补区域,并且互补区域识别多核苷酸可以对互补区域的长度具有特异性(并且可以对互补区域的其它特征具有特异性)。在这种方面,在所述寡核苷酸中的互补区域与具有对应长度的所述靶核酸中的突出端杂交的条件下组合,由此形成(例如核酸库)的杂交产物。
在某些方面,所述方法包含组合5'磷酰化核酸和寡核苷酸池。所述寡核苷酸池的寡核苷酸可以包含不同长度和核苷酸序列的互补区域以及互补区域识别序列。在这种方面,所述组合是在所述寡核苷酸池的寡核苷酸与所述5'磷酰化核酸的核酸杂交的条件下进行的,所述5'磷酰化核酸具有在序列上互补并且相对于所述寡核苷酸的所述互补区域具有对应长度的突出区域。还提供了组合物和发现例如,在实践本公开的所述方法中使用的试剂盒。
附图说明
图1示意性地示出了根据本公开的一个实施例的产生核酸库的方法。
图2描绘了使用根据本公开的实施例的方法获得的测序读数的数量。
图3描绘了使用根据本公开的实施例的方法制备的库中的错配率。
图4示出了从健康供体的血浆和尿液纯化的DNA片段的长度分布。
图5示出了从健康血浆cfDNA观察到的每种DNA突出端类型和长度的计数。
图6示出了从健康尿液cfDNA观察到的每种DNA突出端类型和长度的计数。
图7示出了发夹条形码衔接子的示意图。可切割位点可以含有化学可切割位点或酶促可切割位点。条形码表示单链突出端的类型和长度。
图8示出了从毛干回收的DNA片段的长度。上图:从140年历史的无根毛发提取物回收的DNA片段被定位到人类基因组。几乎所有的片段都长度小于50bp。下图:从新鲜毛发提取的DNA的测序库长度的证据痕迹。此长度包含约110bp的测序衔接子。因此,即使在新鲜的毛发中,大多数DNA片段长度小于50bp。
图9示出了来自13种标准CODIS标记的最短PCR产物的扩增子长度。因为这些标记是长度多态性,所以选择人类中存在的最小扩增子用于可从PowerPlex 1.1或16、ProfilerPlus、COfiler或Identifier引物组获得的PCR引物组。甚至迷你STR也需要超出通常在毛干中的核DNA中看到的大小范围的模板分子(图8)。数据来自万维网统一资源定位器cstl.nist.gov/strbase。
具体实施方式
提供了产生核酸库的方法。在某些方面,所述方法包含组合靶核酸和寡核苷酸池。所述寡核苷酸池的每个寡核苷酸可以包含(i)能够与靶核酸中的突出端杂交的互补区域,和(ii)互补区域识别多核苷酸。所述池中的寡核苷酸可以包含不同长度的互补区域,并且互补区域识别多核苷酸可以对互补区域的长度具有特异性(并且可以对互补区域的其它特征具有特异性)。在这种方面,在所述寡核苷酸中的互补区域与具有对应长度的所述靶核酸中的突出端杂交的条件下组合,由此形成(例如核酸库)的杂交产物。
在某些方面,所述方法包含组合5'磷酰化核酸和寡核苷酸池。所述寡核苷酸池的寡核苷酸可以包含不同长度和核苷酸序列的互补区域以及互补区域识别序列。在这种方面,所述组合是在所述寡核苷酸池的寡核苷酸与所述5'磷酰化核酸的核酸杂交的条件下进行的,所述5'磷酰化核酸具有在序列上互补并且相对于所述寡核苷酸的所述互补区域具有对应长度的突出区域。还提供了组合物和发现例如,在实践本公开的所述方法中使用的试剂盒。
在更详细地描述本公开的方法、组合物和试剂盒之前,应当理解方法、组合物和试剂盒不限于所描述的特定实施例,因为这种当然可以改变。还应当理解的是,因为方法、组合物和试剂盒的范围将仅由所附权利要求书限定,所以本文中所使用的术语仅是出于描述具体实施例的目的,而不旨在是限制性的。
在提供取值范围的情况下,应当理解的是,在所述范围的上限与下限之间的每个插入值(到下限的十分之一单位除非上下文清楚地另外指明)以及在所陈述范围内的任何其它所陈述的值或插入值均被涵盖在方法、组合物和试剂盒之内。这些更小范围的上限和下限可以独立地被包含在更小范围之内,并且也被涵盖在方法、组合物和试剂盒之内,服从于在所陈述范围内任何确切排除的限制。在所陈述的范围包含限制中的一者或两者的情况下,排除了那些被包含的限制中的任一者或两者的范围也包含在方法、组合物和试剂盒之内。
某些范围在本文以前面出现术语“约”的数值呈现。术语“约”在本文用于为其后面出现的精确数值以及接近或靠近术语后面的数值的数提供文字性支持。在确定数值是否接近或靠近具体叙述的数值时,接近或靠近未叙述的数值可以为这样的数值,其在出现的上下文中,提供与具体叙述的数值基本上等同的方式。
除非另外定义,否则本文使用的所有技术术语和科学术语均具有与方法、组合物和试剂盒所属领域的普通技术人员通常所理解的相同的含义。尽管与本文所述的那些类似或等同的任何方法、组合物和试剂盒也可以用于实践或测试方法、组合物和试剂盒,现在描述代表性的说明性方法、组合物和试剂盒。
本说明书中引用的所有出版物和专利通过引用并入本文,如同每篇单独的出版物或专利被具体和单独地指出通过引用并入本文并且通过引用本文以公开和描述与引用出版物相关的材料和/或方法。任何出版物的引用均为其在申请日之前的公开,不应被解释为承认本方法、组合物和试剂盒无权获得此类出版物,因为所提供的出版日期可能与实际不同。出版日期可能需要独立确认。
应当指出的是,除非上下文另外清楚地指明,比如本文中以及在所附权利要求书中所使用的,单数形式“一个”、“一种”以及“所述”包含复数指代物。另外指出的是,权利要求书可以撰写为排除任何可选择的要素。这样,本声明旨在充当对于此类与权利要求要素的叙述相结合的排除性术语如“单独地”、“仅”等的使用,或“否定型”限制的使用的先行基础。
应当理解,出于清楚的目的描述于单独实施例的背景下的方法、组合物和试剂盒的某些特征还可以按组合形式提供于单个实施例中。相反,为了简便起见,在单个实施例的情况下描述的所公开主题的各种特征也可以分开或以任何合适子组合提供。本公开具体包括实施例的所有组合,并且在本文中公开,就好像每种组合被单独和明确地公开,只要这种组合包括可操作的过程和/或组合物。另外,描述这些变量的实施例中列出的所有亚组合也特别地包括在本方法、组合物和试剂盒中,并且在本文中公开,就好像每个这种子组合在本文中单独和明确地公开。
当阅读了本公开,对本领域技术人员显而易见,本文描述和阐释的每个单个实施例具有分开的组分和特征,其可以容易与任何其它数个实施例的特征分开或结合,而不背离本发明的精神或范围。任何叙述的方法可以以所叙述事件的顺序或以逻辑上可能的任何其它顺序进行。
方法
如上所概述,本公开的方面包含产生核酸库的方法。在一些实施例中,方法包含组合包括包括突出端的靶核酸的核酸组合物和包括寡核苷酸的寡核苷酸池,其中所述寡核苷酸中的一些或全部包括(i)能够与靶核酸中的突出端杂交的互补区域,和(ii)互补区域识别多核苷酸;库中的寡核苷酸包含不同长度的互补区域;并且互补区域识别多核苷酸对互补区域的一个或多个特征(例如,长度)具有特异性。在这种方面,在所述寡核苷酸中的互补区域与具有对应长度的所述靶核酸中的突出端杂交的条件下组合,由此形成(例如核酸库)的杂交产物。
在一些实施例中,所述方法包含组合5'磷酰化核酸和寡核苷酸池,所述寡核苷酸池包含包含不同长度和核苷酸序列的互补区域的寡核苷酸,和互补区域识别序列。在这种方面,所述组合是在所述寡核苷酸池的寡核苷酸与所述5'磷酰化核酸的核酸杂交的条件下进行的,所述5'磷酰化核酸具有在序列上互补并且相对于所述寡核苷酸的所述互补区域具有对应长度的突出区域。这种杂交的寡核苷酸和核酸在本文可以称为“杂交产物”。现在将更详细地描述主题方法的各方面。
在一些实施例中,方法进一步包含在组合步骤之前,通过磷酰化来自核酸样品的核酸的5'末端产生5'磷酰化核酸。用于进行核酸的5'磷酰化的试剂和试剂盒是已知的并且是可获得的。例如,核酸可以用多核苷酸激酶(PNK)(例如,T4PNK)处理,其催化Pi从ATP的γ位置到多核苷酸(双链和单链DNA和RNA)的5'-羟基末端和核苷3'-单磷酸的转移和交换。合适的反应条件包含,例如,将核酸与PNK在1X PNK反应缓冲液(例如,70mM Tris-HCl,10mMMgCl2,5mM DTT,pH 7.6@25℃)中在37℃下温育30分钟。任选地,在磷酰化反应之后,PNK可以被加热灭活,例如在65℃下20分钟。在一些实施例中,方法不包含在组合步骤之前,通过磷酰化来自核酸样品的核酸的5'末端产生5'磷酰化核酸。在这种情况下,核酸样品包括具有天然磷酰化的5'末端的核酸。
在一些实施例中,在与库组合之前,靶核酸的长度未经修饰。在此文中,“未经修饰”是指从样品(例如,含有从活的或已死的生物分离的核酸的样品)分离靶核酸,并且然后与寡核苷酸池组合,而不修饰靶核酸的长度。例如,靶核酸不会缩短(例如,它们不与限制酶或核酸酶或减少长度的物理条件(例如,剪切条件、切割条件)接触),并且长度不会增加一个或多个核苷酸(例如,在突出端处未填充末端;末端没有添加核苷酸)。将磷酸盐或化学反应性基团添加到靶核酸的一个末端或两个末端不被认为是修饰核酸的长度。
在某些方面,本公开的方法包含,紧接着所述组合步骤,将所述杂交产物暴露于所述靶核酸末端与其杂交的所述寡核苷酸末端连接的条件下。可以通过允许靶核酸与其杂交的寡核苷酸共价附接的任何合适方法来实现连接。当靶核酸的一个末端与其杂交的寡核苷酸的末端连接时,通常进行两个附接事件:1)靶核酸中的一条链的3'末端到寡核苷酸中的一条链的5'末端,和2)靶核酸中的另一条链的5'末端到寡核苷酸中另一条链的3'末端。当靶核酸的两个末端各自与其杂交的寡核苷酸连接时,通常进行四个附接事件:1)靶核酸中的一条链的3'末端到寡核苷酸中的一条链的5'末端,2)靶核酸中的另一条链的5'末端到寡核苷酸中另一条链的3'末端;和3)和4):与(1)和(2)相同,用于与另一个寡核苷酸附接的靶核酸的相对末端。
在某些方面,本公开的方法包含,紧接着所述组合步骤,使所述杂交产物与包括连接酶活性的试剂在靶核酸的末端共价连接到所述靶核酸杂交的所述寡核苷酸的末端的条件下接触。在一些实施例中,所述杂交产物与包括第一连接酶活性的第一试剂和包括不同于所述第一连接酶活性的第二连接酶活性的第二试剂接触。例如,所述第一连接酶活性和所述第二连接酶活性独立地可以选自平末端连接酶活性、切口密封连接酶活性、粘性末端连接酶活性、环化连接酶活性和粘性末端连接酶活性。
在某些方面,本公开的方法包含通过生物相容的附接件使靶核酸与寡核苷酸连接。方法可以包含,例如,“点击”化学或标记,其包含用于使生物分子连接的生物相容性反应。在一些实施例中,所述寡核苷酸中的每一个的末端包括第一化学反应性部分,并且所述靶核酸中的每一个的末端包含第二化学反应性部分。在这种实施例中,所述第一化学反应性部分通常能够与所述第二化学反应性部分反应,并且在寡核苷酸与所述寡核苷酸杂交的靶核酸之间形成共价键。在某些方面,本公开的方法包含,在将所述核酸组合物与所述寡核苷酸池组合之前,使所述组合物中的所述靶核酸在其中所述第二化学反应性部分结合在所述靶核酸中的每一个的末端的条件下与一种或多种化学试剂接触。在某些方面,本公开的方法包含,紧接着所述组合步骤,用一种或多种化学试剂将所述杂交产物暴露于所述第一化学反应性部分与所述第二化学反应性部分反应形成寡核苷酸与所述寡核苷酸杂交的靶核酸之间的共价键的条件。在一些实施例中,所述第一化学反应性部分能够与所述第二化学反应性部分反应以在所述寡核苷酸与所述寡核苷酸与其杂交的所述靶核酸之间形成1,2,3-三唑。在一些实施例中,所述第一化学反应性部分能够在包括铜的条件下与所述第二化学反应性部分反应。第一化学反应性部分和第二化学反应性部分可以包含任何合适的配对。例如,所述第一化学反应性部分可以选自含叠氮化合物的部分和5-辛二炔基脱氧尿嘧啶,并且所述第二化学反应性部分可以独立地选自含叠氮化合物的部分、己炔基和5-辛二炔基脱氧尿嘧啶。在一些实施例中,含叠氮化合物的部分是N-羟基琥珀酰亚胺(NHS)酯-叠氮化合物。
在某些方面,本公开的方法包含紧接着组合步骤,连接杂交的寡核苷酸和核酸。当包含时,这种连接步骤包含将核酸的5'磷酰化末端连接到与其杂交的寡核苷酸的3'末端。用于进行这种连接反应的合适的试剂(例如,连接酶)和试剂盒是已知的并且是可获得的,例如可从New England Biolabs(Ipswich,MA)获得的Instant Sticky-end Ligase MasterMix。可以使用的连接酶包含例如T4DNA连接酶(例如,低浓度或高浓度)、T4DNA连接酶、T7DNA连接酶、大肠杆菌DNA连接酶、Electro
Figure BDA0001971867200000091
等。适于进行连接反应的条件将根据所用连接酶的类型而变化。有关这种条件的信息很容易获得。根据某些实施例,在组合步骤期间,寡核苷酸池的寡核苷酸作为双链体存在。也就是说,寡核苷酸池的寡核苷酸可以与除靶核酸(例如,5'磷酰化核酸)的核酸链之外的核酸链杂交。在某些方面,双链体包含与互补区域相邻(例如,紧邻)的寡核苷酸区域杂交的寡核苷酸和核酸链。在一些实施例中,与互补区域相邻的寡核苷酸区域包含互补区域识别多核苷酸的全部或一部分(互补区域识别序列)。
在某些实施例中,所述寡核苷酸池包括包括第一链和第二链的寡核苷酸。在某些实施例中,所述寡核苷酸池包括各自基本上由第一链和第二链组成的寡核苷酸。基本上由第一链和第二链组成意味着寡核苷酸不包含任何额外的核酸链(例如,与寡核苷酸杂交)。因此,“基本上由……组成”在此是指寡核苷酸中链的数目,并且寡核苷酸可以包含对链的数目不必要的其它特征(例如,可以包含可检测标记,可以包含其它区域)。第一链可以包括第一多核苷酸,并且第二链包括与所述第一多核苷酸互补的第二多核苷酸。
在某些方面,当寡核苷酸池的寡核苷酸作为双链体存在时,双链体中的一些或全部可以在双链体末端包含与核酸杂交的末端相对的突出端。当存在这种双链体突出端时,紧接着组合,本公开的方法可以进一步包含填充由双链体形成的突出端。用于进行这种填充反应的试剂和试剂盒是已知的并且是可获得的。适于进行填充反应的聚合酶包含例如DNA聚合酶I、大(Klenow)片段、嗜热脂肪芽孢杆菌(Bst)DNA聚合酶等。适于进行填充反应的条件可以变化,例如,取决于所用聚合酶的类型,可容易地获得哪种反应条件信息。
在某些方面,本文的方法可以使用发夹衔接子进行。发夹衔接子通常包括双链“茎”区域和单链“环”区域。在一些实施例中,寡核苷酸包括能够采取发夹结构的一条链(即,一个连续的链)。在一些实施例中,寡核苷酸基本上由能够采取发夹结构的一条链(即,一个连续的链)组成。基本上由一条链组成意味着寡核苷酸不包含不是连续链的一部分的任何额外的核酸链(例如,与寡核苷酸杂交)。因此,“基本上由……组成”在此是指寡核苷酸中链的数目,并且寡核苷酸可以包含对链的数目不必要的其它特征(例如,可以包含可检测标记,可以包含其它区域)。包括或基本上由能够形成发夹结构的一条链组成的寡核苷酸在本文可以称为发夹衔接子。
发夹衔接子可以在一条链内包括多个多肽。在一些实施例中,发夹衔接子包括第一多核苷酸和第二多核苷酸。在一些实施例中,第一多核苷酸与第二多核苷酸互补。在一些实施例中,第一多核苷酸的一部分与第二多核苷酸的一部分互补。在一些实施例中,第一多核苷酸包括与第二多核苷酸中的第一区域互补的第一区域,并且所述第一多核苷酸包括与所述第二多核苷酸中的第二区域不互补的第二区域。互补区域通常形成发夹衔接子的茎,并且非互补区域通常形成发夹衔接子的环或其一部分。第一多肽和第二多肽可以包括如本文所述的衔接子的组分,如例如,扩增引发位点和具体的测序衔接子(例如,P5、P7衔接子)。
发夹衔接子可以包括能够在切割条件下切割的一个或多个切割位点。在一些实施例中,切割位点位于第一多核苷酸与第二多核苷酸之间。切割位点处的切割通常从发夹衔接子生成两条分开的链。在一些实施例中,切割位点处的切割生成部分双链衔接子,其具有形成“Y”结构的两条未成对链。切割位点可以包括例如尿嘧啶和/或脱氧尿苷碱。包括尿嘧啶和/或脱氧尿苷的切割位点可以例如使用DNA糖基化酶、内切核酸酶、RNA酶等及其组合进行切割。在一些实施例中,切割位点包括二醇。例如,切割位点可以包括以5'到5'键结合的邻位二醇。包括二醇的切割位点可以例如,使用高碘酸盐进行化学切割。在一些实施例中,切割位点包括限制酶识别位点。在一些实施例中,切割位点包括稀有切割酶限制酶识别位点(例如,NotI识别序列)。稀有切割酶限制酶识别位点通常以来自哺乳动物和其它生物的DNA/RNA中的低频率发生。例如,稀有切割酶限制酶识别位点可以包含在人或哺乳动物基因组序列中很少发现的序列。包括限制酶识别位点或稀有切割酶限制酶识别位点的切割位点可以通过限制酶或稀有切割酶限制酶(例如NotI)切割。在一些实施例中,本文的方法包括在将发夹寡核苷酸池与靶核酸组合之后,将一个或多个切割位点暴露于切割条件,由此切割寡核苷酸。在一些实施例中,切割位点包括平末端限制酶识别位点。包括平末端限制酶识别位点的切割位点可以被平末端限制酶切割。
在一些实施例中,发夹衔接子包括突出端区域(例如,5'突出端、3'突出端)。发夹衔接子的突出端区域通常位于双链“茎”部分附近和“环”部分的相对末端。本文中发夹衔接子的突出端区域通常包括本文所述的互补区域。本文包括互补区域的发夹衔接子通常还包括互补区域识别多核苷酸(例如,对互补区域长度特异,并且有时对互补区域的类型(5'或3')和/或序列特异的识别多核苷酸)。在一些实施例中,发夹衔接子包括5'到3'朝向:第一互补区域识别多核苷酸、第一多核苷酸、一个或多个切割位点、第二多核苷酸、与第一互补区域识别多核苷酸互补的第二互补区域识别多核苷酸和互补区域。在一些实施例中,发夹衔接子包括5'到3'朝向:互补区域、第一互补区域识别多核苷酸、第一多核苷酸、一个或多个切割位点、第二多核苷酸、以及与第一互补区域识别多核苷酸互补的第二互补区域识别多核苷酸。在一些实施例中,发夹衔接子库包括以下的混合物:1)包括5'到3'朝向的寡核苷酸:第一互补区域识别多核苷酸、第一多核苷酸、一个或多个切割位点、第二多核苷酸、与第一互补区域识别多核苷酸互补的第二互补区域识别多核苷酸和互补区域;和2)包括5'到3'朝向的寡核苷酸:互补区域、第一互补区域识别多核苷酸、第一多核苷酸、一个或多个切割位点、第二多核苷酸、以及与第一互补区域识别多核苷酸互补的第二互补区域识别多核苷酸。在以上的某些实施例中,第一多核苷酸和第二多核苷酸以5'到3'朝向排列如下:第一多核苷酸的第一部分、第一多核苷酸的第二部分、切割位点、第二多核苷酸的第二部分和第二多核苷酸的第一部分,其中每个多核苷酸的第一部分是互补的,并且每个多核苷酸的第二部分不是互补的。
在某些方面,本文的方法可以使用固定的衔接子进行。在这种方法中,将第一组单链寡核苷酸(例如,单链条形码可变互补区域衔接子)固定到固相。然后将互补寡核苷酸链杂交以形成双链固定的寡核苷酸。使双链靶核酸与固定的寡核苷酸连接(例如,连接)。然后使靶核酸的游离末端与第二组寡核苷酸连接(例如,连接)。可以根据用于将核酸附接到固相的任何合适方法将单链寡核苷酸固定到固相。方法可以包含利用结合对的成员,如例如抗体/抗原、抗体/抗体、抗体/抗体片段、抗体/抗体受体、抗体/蛋白A或蛋白G、半抗原/抗半抗原、生物素/抗生物素蛋白、生物素/链霉抗生物素蛋白、叶酸/叶酸结合蛋白、维生素B12/内因子、化学反应基团/互补化学反应基团等。
如上所述,寡核苷酸池的寡核苷酸的互补区域具有不同的长度和核苷酸序列。互补区域可以设计成适合于询问/检测靶核酸(例如,5'磷酰化核酸)中存在的5'突出端和/或3'突出端的长度、同一性或两者。可以例如基于产生5'磷酰化核酸和/或从中获得靶核酸的核酸样品的类型来设计互补区域。在某些方面,互补区域的核苷酸序列是跨互补区域长度的随机核苷酸序列,例如,使得寡核苷酸池包含具有与怀疑存在于靶核酸(例如,5'磷酰化核酸)中的任何可能的突出端序列互补的互补区域的寡核苷酸。在一些实施例中,所述寡核苷酸池包括寡核苷酸,所述寡核苷酸包括特定突出端长度的所有可能的突出端多核苷酸组合。对于特定突出端长度的所有可能的突出端多核苷酸组合意味着在突出端的整个长度上每个位置可以是A、G、C或T。例如,当每个位置可以是A、G、C或T时,三核苷酸突出端具有43种可能的多核苷酸序列布置(64种可能的多核苷酸)。在一些实施例中,所述寡核苷酸池包括寡核苷酸,所述寡核苷酸包括每个突出端长度的所有可能的突出端多核苷酸组合。例如,包括具有1个与10个碱基长之间的突出端长度的寡核苷酸的寡核苷酸池可以包括以下可能的突出端序列的总数:4+42+43+44+45+46+47+48+49+410
在其它方面,可以特异性地设计互补区域的一个或多个核苷酸序列以询问/检测靶核酸(例如,5'磷酰化核酸)中存在的感兴趣的5'和/或3'突出端序列的一个或多个子集,例如,其中询问/检测这种一个或多个子集对于诊断医学病状的目的是信息性的,鉴定产生5'磷酰化核酸的核酸样品的来源,和/或从中获得靶核酸的核酸样品的来源和/或等。
寡核苷酸池的寡核苷酸的互补区域可以具有任何合适的长度,其合适的长度可以变化,例如,基于产生5'磷酰化核酸和/或从中获得靶核酸的核酸样品的来源。例如,互补区域的长度可以设计为代表/对应于怀疑存在于靶核酸(例如,5'磷酰化核酸)中的任何可能突出端的长度。在某些实施例中,可以特异性地设计互补区域的长度以询问/检测靶核酸(例如,5'磷酰化核酸)中存在的感兴趣的5'和/或3'突出端的一个或多个子集,例如,其中询问/检测这种一个或多个子集对于诊断医学病状的目的是信息性的,鉴定产生5'磷酰化核酸的核酸样品的来源,和/或从中获得靶核酸的核酸样品的来源和/或等。在某些实施例中,互补区域的长度可以设计为通过仅为那个子集提供连接配偶体以富集来自样品的DNA片段的子集。
在某些方面,寡核苷酸池包含具有1个到50个核苷酸长度的不同互补区域的寡核苷酸,如1个到40个、1个到30个、1个到20个、1个到15个、1个到14个、1个到13个、1个到12个、1个到11个、1个到10个、1个到9个、1个到8个、1个到7个、1个到6个、1个到5个、1个到4个、1个到3个、或1个到2个核苷酸长度。根据一些实施例,寡核苷酸池包含具有50个核苷酸或更少、40个核苷酸或更少、30个核苷酸或更少、20个核苷酸或更少、19个核苷酸或更少、18个核苷酸或更少、17个核苷酸或更少、16个核苷酸或更少、15个核苷酸或更少、14个核苷酸或更少、13个核苷酸或更少、12个核苷酸或更少、11个核苷酸或更少、10个核苷酸或更少、9个核苷酸或更少、8个核苷酸或更少、7个核苷酸或更少、6个核苷酸或更少、5个核苷酸或更少、4个核苷酸或更少、3个核苷酸或更少、或2个核苷酸或更少的不同互补区域长度的寡核苷酸。在某些方面,寡核苷酸池包含具有2个核苷酸或更多,如3个核苷酸或更多、4个核苷酸或更多、5个核苷酸或更多、6个核苷酸或更多、7个核苷酸或更多、8个核苷酸或更多、9个核苷酸或更多、10个核苷酸或更多、11个核苷酸或更多、12个核苷酸或更多、13个核苷酸或更多、14个核苷酸或更多、15个核苷酸或更多、16个核苷酸或更多、17个核苷酸或更多、18个核苷酸或更多、19个核苷酸或更多、20个核苷酸或更多、30个核苷酸或更多、40个核苷酸或更多、或50个核苷酸或更多的不同互补区域长度的寡核苷酸。
在一些实施例中,寡核苷酸池的某些寡核苷酸不具有互补区域。这种寡核苷酸可以是平末端的并且可以能够与靶核酸的一个或多个平末端连接(例如,连接)。不具有互补区域的寡核苷酸可以被称为具有长度为零核苷酸的互补区域。
寡核苷酸池的寡核苷酸的互补区域识别序列(例如,条形码)唯一地识别其各自的寡核苷酸中存在的互补区域,并且进而唯一地识别存在于互补区域特异性杂交的靶核酸(例如,5'磷酰化核酸)中的每种类型的突出端(例如,长度、5'或3'和/或等)。通常,与不同长度的突出端杂交的互补区域特异的互补区域识别多核苷酸彼此不同并且是唯一的。通常,对以下具有特异性的互补区域识别多核苷酸彼此不同并且是唯一的:i)与不同长度的突出端杂交的互补区域;和ii)不同类型的互补区域(即3'、5')。通常,没有两个“对互补区域长度具有特异性”的互补区域识别序列在具有不同长度突出端的库的寡核苷酸中。换句话说,对给定长度的互补区域特异的给定互补区域识别序列(或序列组)将仅存在于具有这种给定长度的互补区域(突出端)的寡核苷酸中。具有不同长度的互补区域的寡核苷酸将包含不同的互补区域识别序列(或序列组)。在一些实施例中,对于具有特定长度的突出端的库中的所有寡核苷酸存在一个互补区域识别序列。在一些实施例中,对于具有特定长度的突出端的库中的所有寡核苷酸存在两个互补区域识别序列,使得一个互补区域识别序列对5'突出端的给定长度具有特异性,并且另一个互补区域识别序列对3'突出端的给定长度具有特异性。在一些实施例中,对于具有特定长度的突出端的库中的所有寡核苷酸存在一个或两个互补区域识别序列,而与突出端的序列无关。在一些实施例中,对于具有特定长度的突出端的库中的寡核苷酸存在互补区域识别序列的子集,其中子集中的不同互补区域识别序列对寡核苷酸中的不同互补区域序列具有特异性(例如,除了对互补区域的长度和类型(即5'或3')具有特异性之外)。术语“互补区域识别序列”、“互补区域识别多核苷酸”、“识别多核苷酸”、“可变突出端条形码”、“可变互补区域条形码”和“条形码”在本文可以互换使用。
本文的多核苷酸可以是较大多核苷酸的一部分。较大的多核苷酸可以是寡核苷酸。例如,互补区域识别多核苷酸可以被认为是本文寡核苷酸的区域或结构域。因此,互补区域识别多核苷酸可以称为互补区域识别区域或互补区域识别结构域。两个或更多个多核苷酸(例如,第一多核苷酸和第二多核苷酸)可以各自为相同较大多核苷酸的部分,其中相同的较大多核苷酸可以为例如相同的寡核苷酸。这种两种或更多种多核苷酸可以称为较大多核苷酸的区域或结构域,例如本文寡核苷酸的第一区域和第二区域或本文寡核苷酸的第一结构域和第二结构域。
仅作为实例并且仅出于说明性目的,寡核苷酸池可以包含:第一寡核苷酸子集,其包含互补区域识别序列,其唯一地识别与1个核苷酸长度的5'突出端特异性杂交的互补区域;第二寡核苷酸子集,其包含互补区域识别序列,其唯一地识别与2个核苷酸长度的5'突出端特异性杂交的互补区域;第三寡核苷酸子集,其包含互补区域识别序列,其唯一地识别与3个核苷酸长度的5'突出端特异性杂交的互补区域;第四寡核苷酸子集,其包含互补区域识别序列,其唯一地识别与4个核苷酸长度的5'突出端特异性杂交的互补区域;第五寡核苷酸子集,其包含互补区域识别序列,其唯一地识别与1个核苷酸长度的3'突出端特异性杂交的互补区域;第六寡核苷酸子集,其包含互补区域识别序列,其唯一地识别与2个核苷酸长度的3'突出端特异性杂交的互补区域;第七寡核苷酸子集,其包含互补区域识别序列,其唯一地识别与3个核苷酸长度的3'突出端特异性杂交的互补区域;第八寡核苷酸子集,其包含互补区域识别序列,其唯一地识别与3个核苷酸长度的4'突出端特异性杂交的互补区域;以此类推。
互补区域识别序列(例如,条形码)可以是任何合适的长度,例如,以便提供足够数量的唯一互补区域识别序列,其代表寡核苷酸池中存在的各种不同的互补区域。在某些方面,互补区域识别序列为2个到10个核苷酸长度,例如3个到9个、3个到8个、3个到7个、3个到6个、或3个到5个(例如5个)核苷酸长度。
本文描述的任何寡核苷酸池可以进一步包含不具有互补区域的寡核苷酸,所述寡核苷酸可以包含对不具有互补区域的寡核苷酸特异的识别序列。不包含互补区域的寡核苷酸用于例如检测/询问具有平末端(即没有突出端)的靶核酸(例如,5'磷酰化核酸)的核酸。
寡核苷酸池的寡核苷酸可以包含天然核苷酸、非天然核苷酸(或“核苷酸类似物”)、或天然核苷酸和非天然核苷酸的混合物。可以存在于寡核苷酸中的非天然核苷酸包含但不限于肽核酸(PNA)核苷酸、吗啉代核苷酸、锁核酸(LNA)核苷酸、桥接核酸(BNA)核苷酸、乙二醇核酸(GNA)核苷酸、苏糖核酸(TNA)核苷酸等。根据某些实施例,寡核苷酸池的寡核苷酸包含一个或多个锁核酸(LNA)核苷酸。在某些方面,寡核苷酸的互补区域的一个或多个核苷酸是非天然核苷酸,例如一个或多个LNA核苷酸。例如,寡核苷酸的互补区域的每个核苷酸可以是非天然核苷酸,例如,寡核苷酸的互补区域的每个核苷酸可以是LNA核苷酸。根据某些实施例,寡核苷酸池的寡核苷酸包含一个或多个桥接核酸(BNA)核苷酸。在某些方面,寡核苷酸的互补区域的一个或多个核苷酸是非天然核苷酸,例如一个或多个BNA核苷酸。例如,寡核苷酸的互补区域的每个核苷酸可以是非天然核苷酸,例如,寡核苷酸的互补区域的每个核苷酸可以是BNA核苷酸。
在某些方面,寡核苷酸池的寡核苷酸未被磷酰化。在某些方面,寡核苷酸池的寡核苷酸被磷酰化。在某些方面,寡核苷酸池的寡核苷酸在与靶核酸杂交之后被磷酰化。例如,在与靶核酸杂交并将寡核苷酸中链的3'末端连接到靶核酸中链的5'磷酰化末端之后,寡核苷酸中相反链的5'末端磷酰化,并且然后紧接着连接到靶核酸中相对链的3'末端。在某些方面,寡核苷酸池的寡核苷酸在与靶核酸杂交之前被磷酰化。在这种方面,方法可以包含防止寡核苷酸二聚体形成(例如,通过调节寡核苷酸与靶核酸的比率)和/或移除寡核苷酸二聚体(例如,通过核酸大小选择方法)。
术语“突出端”通常是指核酸分子末端的单链部分。例如,核酸分子可以包含双链或“双链体”区域,其包括一个或多个成对的核苷酸(碱基)和包括一个或多个未配对的核苷酸(碱基)的单链或“突出端”区域。通常,突出端是指核酸分子末端的单链区域(例如,如与双链区域侧接的单链区域相对)。突出端在本文可以描述为5'突出端或3'突出端。5'突出端通常是指核酸分子末端的单链区域,其在3'到5'方向上根据常规核酸方向性读取,从双链体部分结束并且单链部分开始的连接处开始,并在突出端的终点处(游离末端)结束。3'突出端通常是指核酸分子末端的单链区域,其在5'到3'方向上根据常规核酸方向性读取,从双链体部分结束并且单链部分开始的连接处开始,并在突出端的终点处(游离末端)结束。如本文所述,靶核酸可以包括突出端(例如,在核酸分子的一个末端处)并且可以包括两个突出端(例如,在核酸分子的两个末端处)。在一些实施例中,靶核酸包括两个突出端、一个突出端和一个平末端、两个平末端、或这些的组合。在一些实施例中,靶核酸包括两个3'突出端、两个5'突出端、一个3'突出端和一个5'突出端、一个3'突出端和一个平末端、一个5'突出端和一个平末端、两个平末端、或这些的组合。在一些实施例中,靶核酸中的突出端是天然突出端。天然突出端通常是指在将样品组合物与寡核苷酸池组合之前未被修饰(例如,未被填充、未被切割、未被引入)的突出端。天然突出端通常不包含通过使分离的样品与切割剂(例如,核酸内切酶、核酸外切酶、限制酶)接触而产生的突出端。
如本文所述,寡核苷酸可以包括突出端(例如,在寡核苷酸的一个末端处)并且可以包括两个突出端(例如,在寡核苷酸的两个末端处)。在一些实施例中,寡核苷酸包括两个突出端、一个突出端和一个平末端、两个平末端、或这些的组合。在一些实施例中,寡核苷酸包括两个3'突出端、两个5'突出端、一个3'突出端和一个5'突出端、一个3'突出端和一个平末端、一个5'突出端和一个平末端、两个平末端、或这些的组合。对于本文所述的发夹结构寡核苷酸,这种寡核苷酸(例如,处于未切割状态)通常包括一个突出端(例如,5'突出端或3'突出端),并且在某些情况下,没有突出端(即,平末端)。通常,本文寡核苷酸中的突出端中的一个包括互补区域。通常,本文寡核苷酸中的突出端中的一个是互补区域。当在本文中讨论寡核苷酸时,术语“突出端”和“互补区域”可以互换使用。当在本文中讨论寡核苷酸和靶核酸时,术语“突出端”和“突出端区域”可以互换使用。
如本文所用,术语“互补的”或“互补性”是指核苷酸序列,其碱基对通过非共价键合到靶核酸,例如,靶核酸(例如,5'磷酰化核酸)的核酸的突出端区域。在经典的Watson-Crick碱基配对中,腺嘌呤(A)与胸腺嘧啶(T)形成碱基对,与鸟嘌呤(G)在DNA中形成胞嘧啶(C)也是如此。在RNA中,胸腺嘧啶被尿嘧啶(U)取代。因此,A与T互补,并且G与C互补。在RNA中,A与U互补,反之亦然。通常,“互补的”或“互补性”是指至少部分互补的核苷酸序列。这些术语还可以涵盖完全互补的双链体,使得一条链中的每个核苷酸与对应位置中另一条链中的每个核苷酸互补。在某些情况下,核苷酸序列可以与靶标部分互补,其中并非所有核苷酸在所有对应位置都与靶核酸中的每个核苷酸互补。例如,寡核苷酸池的寡核苷酸的互补区域可能与5'核酸的核酸的突出端完美(即100%)互补,或寡核苷酸的互补区域可以共享小于完美的某种程度的互补性(例如,70%、75%、85%、90%、95%、99%)。可以通过比对用于最佳比较目的的序列来确定两个核苷酸序列的同一性百分比(例如,可以在第一序列的序列中引入空位以进行最佳比对)。然后比较对应位置处的核苷酸,并且两个序列之间的同一性百分比是序列共有的相同位置的数量的函数(即,%同一性=相同位置的#/总位置#×100)。当一个序列中的位置被与另一个序列中的对应位置相同的核苷酸占据时,那么分子在那个位置处是相同的。这种数学算法的非限制性实例描述于Karlin等人《美国国家科学院学报(Proc.Natl.Acad.Sci.USA)》90:5873-5877(1993)中。将这种算法并入NBLAST和XBLAST程序(2.0版)中,如Altschul等人《核酸研究(Nucleic Acids Res.)》25:389-3402(1997)中所述。当使用BLAST和Gapped BLAST程序时,可以使用相应程序(例如,NBLAST)的默认参数。在一个方面,用于序列比较的参数可以设置为得分=100,字长=12,或者可以改变(例如,字长=5或字长=20)。
在某些方面,“互补的”或“互补性”可以指结构互补性(例如,突出端互补性)。例如,具有3'、6碱基对突出端的靶核酸可以与具有5'、6碱基对突出端的寡核苷酸具有结构互补性。结构互补性可以包含非特异性碱基配对。在某些实施例中,寡核苷酸突出端包括具有一个或多个核苷酸的互补区域,所述核苷酸能够与靶核酸中的碱基非特异性碱基配对。例如,具有3'、6碱基对突出端的靶核酸可以与具有5'、6碱基对突出端的寡核苷酸具有结构互补性,其中寡核苷酸突出端包括可以在靶核酸突出端中的对应位置处与碱基可能性的全部或一些非特异性配对的一个或多个核苷酸。在某些实施例中,寡核苷酸突出端包括互补区域,其中所有核苷酸能够与靶核酸中的碱基非特异性碱基配对。能够非特异性碱基配对的核苷酸可以称为“通用碱基”,其可以取代上述四种典型碱基中的任何一种(例如,硝基吲哚、5-硝基吲哚、3-硝基吡咯、肌苷、脱氧肌苷、2-脱氧肌苷)或“简并/摆动碱基”,其可以取代四种典型碱基(例如,非天然碱基P和K)中的两种或三种(但不是全部)。在某些实施例中,寡核苷酸突出端包括包括一个或多个通用碱基的互补区域。在某些实施例中,寡核苷酸突出端包括由通用碱基组成的互补区域。
组合步骤期间的“条件”是其中寡核苷酸池的寡核苷酸特异性杂交到靶核酸(例如,5'磷酰化核酸)的核酸的那些条件,所述靶核酸具有在序列上互补并且相对于所述寡核苷酸的所述互补区域具有对应长度的突出区域。在一些实施例中,对应的长度是指相同的长度(即,互补区域和靶核酸突出端中的相同碱基数)。是否发生特异性杂交由如互补区域与突出端区域之间的互补程度、其长度和杂交发生的温度等因素确定,这可以通过互补区域/突出端的熔解温度(TM)告知。熔解温度是指一半互补区域/突出端保持杂交并且一半互补区域/突出端解离成单链的温度。双链体的Tm可以通过实验确定或使用以下公式预测:Tm=81.5+16.6(log10[Na+])+0.41(分数G+C)-(60/N),其中N是链长且[Na+]小于1M。参见Sambrook和Russell(2001;《分子克隆:实验室手册(Molecular Cloning:A LaboratoryManual)》,第3版,冷泉港出版社(Cold Spring Harbor Press),冷泉港纽约(Cold SpringHarbor N.Y.),第10章)。取决于各种杂交条件,依赖于各种参数的其它更先进的模型也可以用于预测互补区域/突出端双链体的Tm。实现特异性核酸杂交的方法可以在例如Tijssen,《生物化学和分子生物学中的实验室技术-与核酸探针的杂交(LaboratoryTechniques in Biochemistry and Molecular Biology-Hybridization with NucleicAcid Probes)》,第I部分,第2章,“杂交原理和核酸探针测定策略概述(Overview ofprinciples of hybridization and the strategy of nucleic acid probe assays)”,Elsevier(1993)中找到。
根据某些实施例,寡核苷酸池的寡核苷酸包含除互补区域和互补区域识别序列之外的一个或多个部分(或“结构域”)。可以提供这种额外部分,例如,以促进利用杂交产物或其衍生物的一种或多种下游应用,如核酸扩增、测序(例如,高通量测序)、或两者。在某些方面,额外的部分(即,除互补区域和互补区域识别序列之外)包含核酸结合结构域。感兴趣的核酸结合结构域包含例如引物结合结构域。根据某些实施例,额外的部分包含测序衔接子的全部或一部分。
“测序衔接子”是指一个或多个核酸结构域,其包含由感兴趣的测序平台利用的核酸序列(或其互补)的至少一部分,如由
Figure BDA0001971867200000221
提供的测序平台(例如,HiSeqTM、MiSeqTM和/或Genome AnalyzerTM测序系统);牛津纳米孔TM技术(Oxford NanoporeTMTechnologies)(例如,MinION测序系统)、Ion TorrentTM(例如,Ion PGMTM和/或IonProtonTM测序系统);Pacific Biosciences(太平洋生物科学)(例如,PACBIO RS II测序系统);Life TechnologiesTM(例如,SOLiD测序系统);罗氏(Roche)(例如,454GS FLX+和/或GSJunior测序系统);或感兴趣的任何其它测序平台。
在某些方面,测序衔接子是或包含选自以下的核酸结构域:特异性结合表面附接的测序平台寡核苷酸的结构域(例如,“捕获位点”或“捕获序列”)(例如,在
Figure BDA0001971867200000222
测序系统中附接到流动池表面的P5或P7寡核苷酸);测序引物结合结构域(例如,
Figure BDA0001971867200000223
平台的Read 1或Read 2引物可以结合的结构域);条形码结构域(例如,通过用特定条形码或“标签”标记来自给定样品的每个分子来唯一地鉴定被测序的核酸的样品来源以实现样品多路复用的结构域;这种“条形码结构域”通常不与本文所述的条形码相同,用作互补区域识别序列);条形码测序引物结合结构域(用于测序条形码的引物结合的结构域);分子识别结构域(例如,分子索引标签,如4、6或其它数目的核苷酸的随机标签),用于唯一地标记感兴趣的分子,例如,基于测序唯一标签的实例数目确定表达水平;任何这种结构域的补充;或其任何组合。在某些方面,条形码结构域(例如,样品索引标签)和分子识别结构域(例如,分子索引标签)可以包含在相同的核酸中。
当寡核苷酸包含包含测序衔接子的全部或一部分的额外部分时,可以使用多种方法将一种或多种额外的测序衔接子和/或测序衔接子的剩余部分添加到杂交产物。例如,可以通过连接、PCR扩增等添加测序衔接子的额外和/或剩余部分。在PCR的情况下,可以使用扩增引物对,其包含第一扩增引物和第二扩增引物,所述第一扩增引物包含3'杂交区域(例如,用于在杂交产物的一个末端处与杂交产物的寡核苷酸部分杂交)和包含测序衔接子的额外和/或剩余部分的5'区域,所述第二扩增引物包含3'杂交区域(用于在杂交产物的末端处与杂交产物的寡核苷酸部分杂交,所述杂交产物的末端与第一扩增引物杂交的末端相对)和包含测序衔接子的额外和/或剩余部分的5'区域。
靶核酸(例如,5'磷酰化核酸)可以是感兴趣的任何核酸。核酸可以是由脱氧核糖核苷酸、核糖核苷酸或其组合构成的任何长度的聚合物,例如10个碱基或更长、20个碱基或更长、50个碱基或更长、100个碱基或更长、500个碱基或更长、1000个碱基或更长、2000个碱基或更长、3000个碱基或更长、4000个碱基或更长、5000个碱基或更长或更多碱基。在某些方面,核酸是由脱氧核糖核苷酸或核糖核苷酸构成的聚合物,例如10个碱基或更少、20个碱基或更少、50个碱基或更少、100个碱基或更少、500个碱基或更少、1000个碱基或更少、2000个碱基或更少、3000个碱基或更少、4000个碱基或更少、或5000个碱基或更少。
在某些方面,靶核酸是脱氧核糖核酸(DNA)。在某些方面,5'磷酰化核酸是5'磷酰化脱氧核糖核酸(DNA)。感兴趣的DNA包含但不限于基因组DNA(包括基因组DNA片段)、线粒体DNA(mtDNA)互补DNA(或“cDNA”,由任何感兴趣的RNA或DNA合成)、重组DNA(例如质粒DNA)等。
根据某些实施例,靶核酸是核糖核酸(RNA)。根据某些实施例,5'磷酰化核酸是5'磷酰化核糖核酸(RNA)。感兴趣的RNA包含但不限于信使RNA(mRNA)、微小RNA(miRNA)、小干扰RNA(siRNA)、交换小干扰RNA(ta-siRNA)、天然小干扰RNA(nat-siRNA)、核糖体RNA(rRNA)、转移RNA(tRNA)、小核仁RNA(snoRNA)、小核RNA(snRNA)、长非编码RNA(lncRNA)、非编码RNA(ncRNA)、转移信使RNA(tmRNA)、前体信使RNA(pre-mRNA)、小Cajal体特异性RNA(scaRNA)、piwi相互作用RNA(piRNA)、内切核糖核酸酶制备的siRNA(esiRNA)、小时间RNA(stRNA)、信号识别RNA、端粒RNA、核酶、或这种RNA类型或亚型的任何组合。在某些方面,主题方法用于检测/识别由二级RNA结构产生的感兴趣RNA中的突出端,例如分子内杂交(例如,茎形成)。
靶核酸(例如,5'磷酰化核酸)可以从任何感兴趣的核酸样品制备,包含但不限于从单个细胞、多个细胞(例如,培养的细胞)、组织、器官或生物体(例如,细菌、酵母等)分离的核酸样品。在某些方面,核酸样品是从动物的一个或多个细胞、组织、器官和/或等分离的。在一些实施例中,动物是哺乳动物(例如,来自人属的哺乳动物、啮齿动物(例如,小鼠或大鼠)、狗、猫、马、牛或感兴趣的任何其它哺乳动物)。在其它方面,核酸样品是从除哺乳动物之外的来源,如细菌、酵母、昆虫(例如,果蝇)、两栖动物(例如,青蛙(例如,非洲爪蟾蜍))、病毒、植物、或任何其它非哺乳核酸样品来源分离/获得的。
可以从现存的生物或动物获得(例如,分离)核酸样品。然而,在其它方面,核酸样品可以从灭绝的(或“古老的”)生物或动物,例如灭绝的哺乳动物,如来自人属的灭绝的哺乳动物获得(例如,分离)。在一些方面,核酸可以作为取证分析的一部分获得。在一些方面,核酸可以作为诊断分析的一部分获得。
在一些实施例中,靶核酸(例如,5'磷酰化核酸)可以包括降解的DNA。降解的DNA可以称为低质量DNA或高度降解的DNA。降解的DNA可能是高度片段化的,并且可能包含损伤,如碱基类似物和经历错误编码病变的无碱基位点。例如,由胞嘧啶残基的脱氨作用引起的测序错误可以存在于从降解的DNA获得的某些序列中(例如,C到T和G到A的错误编码)。
根据某些实施例,靶核酸包括无细胞核酸,例如无细胞DNA、无细胞RNA或两者。根据某些实施例,5'磷酰化核酸由无细胞核酸产生,例如无细胞DNA、无细胞RNA或两者。这种无细胞核酸可以从任何合适的来源获得。在某些方面,无细胞核酸从选自由以下组成的组的体液样品获得:全血、血浆、血清、羊水、唾液、尿液、胸腔积液、支气管灌洗、支气管抽吸物、母奶、初乳、眼泪、精液、腹膜液、胸腔积液和粪便。在一些实施例中,无细胞核酸是无细胞胎儿DNA。在某些方面,无细胞核酸是循环肿瘤DNA。在一些实施例中,无细胞核酸包括传染剂DNA。在一些实施例中,无细胞核酸包括来自移植物的DNA。
如本文所用,术语“无细胞核酸”可以指从基本上没有细胞的来源分离的核酸。无细胞核酸可以称为“细胞外”核酸、“无循环细胞”核酸(例如CCF片段、ccf DNA)和/或“无细胞循环”核酸。无细胞核酸可以存在于血液中并且从血液获得(例如,来自动物的血液,来自人类受试者的血液)。无细胞核酸通常不包含可检测的细胞,并且可以含有细胞元件或细胞残余物。以上描述了无细胞核酸的无细胞来源的非限制性实例。获得无细胞核酸可以包含直接获得样品(例如,收集样品,例如测试样品)或从已经收集样品的另一个获得样品。不受理论的限制,无细胞核酸可以是细胞凋亡和细胞分解的产物,其为无细胞核酸提供基础,所述无细胞核酸通常具有跨光谱的一系列长度(例如,“梯子”)。在一些实施例中,来自测试受试者的样品核酸是无循环细胞核酸。在一些实施例中,无循环细胞核酸来自测试受试者的血浆或血清。在一些方面,无细胞核酸被降解。
无细胞核酸可以包含不同的核酸种类,并且因此本文中在某些实施例中称为“异质的”。例如,来自患有癌症的受试者的样品可以包含来自癌细胞(例如,肿瘤,瘤形成)的核酸和来自非癌细胞的核酸。在另一个实例中,来自怀孕女性的样品可以包含母体核酸和胎儿核酸。在另一个实例中,来自患有感染或传染病的受试者的样品可以包含宿主核酸和来自传染剂(例如,细菌、真菌、原生动物)的核酸。在另一个实例中,来自已经接受移植物的受试者的样品可以包含宿主核酸和来自供体器官或组织的核酸。在一些情况下,癌症、胎儿、传染剂或移植核酸有时占总核酸的约5%到约50%(例如,总核酸的约4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%或49%是癌症、胎儿、传染剂或移植核酸)。在另一个实例中,异质无细胞核酸可以包含来自两个或更多个受试者(例如来自犯罪现场的样品)的核酸。
核酸样品可以是肿瘤核酸样品(即,从肿瘤分离的核酸样品)。如本文所用,“肿瘤”是指所有肿瘤细胞生长和增殖,无论是恶性的还是良性的,以及所有癌前和癌性细胞和组织。术语“癌症”和“癌性”是指或描述哺乳动物中通常以不受调节的细胞生长/增殖为特征的生理状况。癌症的实例包含但不限于癌、淋巴瘤、胚细胞瘤、肉瘤和白血病。这种癌症的更具体的实例包含鳞状细胞癌、小细胞肺癌、非小细胞肺癌、肺腺癌、肺鳞状细胞癌、腹膜癌、肝细胞癌、胃肠癌、胰腺癌、胶质母细胞瘤、宫颈癌、卵巢癌、肝癌、膀胱癌、肝瘤、乳腺癌、结肠癌、结直肠癌、子宫内膜癌或子宫癌、唾液腺癌、肾癌、肝癌、前列腺癌、外阴癌、甲状腺癌、肝癌、各种类型的头颈癌等。
在一些实施例中,提供核酸用于在处理含有核酸的一个或多个样品之后进行本文所述的方法。例如,可以从一个或多个样品提取、分离、纯化或部分纯化核酸和/或浓缩核酸。术语“分离的”通常是指从其原始环境移除(例如,如果是天然存在的自然环境,或者如果是外源表达的宿主细胞),并且因此通过人为干预(例如,“用人的手”)从其原始环境改变的核酸。术语“分离的核酸”可以指从受试者(例如,人类受试者)移除的核酸。可以提供分离的核酸,其具有比源样品中存在的组分的量更少的非核酸组分(例如,蛋白质、脂质、碳水化合物)。包括分离的核酸的组合物可以是不含非核酸组分的约50%到大于99%。包括分离的核酸的组合物可以是不含非核酸组分的约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或大于99%。术语“纯化的”通常是指提供的核酸含有的非核酸组分(例如蛋白质、脂质、碳水化合物)少于在核酸进行纯化程序之前存在的非核酸组分的量。包括纯化的核酸的组合物可以是不含其它非核酸组分的约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或大于99%。在一些实施例中,浓缩核酸(例如,每体积溶液增加核酸的量)。
用于从感兴趣的来源分离、纯化和/或浓缩DNA和RNA的方法、试剂和试剂盒是本领域中已知的并且可商购获得。例如,用于从感兴趣的来源分离DNA的试剂盒包含Qiagen,Inc.(德国城,马里兰州)的
Figure BDA0001971867200000271
Figure BDA0001971867200000272
Figure BDA0001971867200000273
核酸分离/纯化试剂盒;生命技术公司(Life Technologies,Inc.)(加利福尼亚州,卡尔斯巴德)的
Figure BDA0001971867200000274
Figure BDA0001971867200000275
核酸分离/纯化试剂盒;克隆技术实验室公司(Clontech Laboratories,Inc.)(加利福尼亚州,芒廷维尤)的
Figure BDA0001971867200000276
Figure BDA0001971867200000277
核酸分离/纯化试剂盒。在某些方面,核酸从固定的生物样品,例如福尔马林固定的石蜡包埋的(FFPE)组织分离。可以使用市售试剂盒-如Qiagen,Inc.(德国城,马里兰州)的
Figure BDA0001971867200000278
DNA/RNA FFPE试剂盒,生命技术公司(加利福尼亚州,卡尔斯巴德)的用于FFPE的
Figure BDA0001971867200000281
全核酸分离试剂盒,以及克隆技术实验室公司(加利福尼亚州,芒廷维尤)的
Figure BDA0001971867200000282
FFPE试剂盒,(加利福尼亚州,芒廷维尤)的
Figure BDA0001971867200000283
Figure BDA0001971867200000284
Figure BDA0001971867200000285
核酸分离/纯化试剂盒。
当获得(例如,分离)核酸样品的生物、植物、动物等灭绝(或“古老”)时,已知用于回收这种核酸的合适策略,并且包含例如Green等人,(2010)《科学(Science)》328(5979):710-722;Poinar等人,(2006)《科学(Science)》311(5759):392-394;Stiller等人,(2006)《美国国家科学院学报(Proc.Natl.Acad.Sci.USA)》103(37):13578–13584;Miller等人,(2008)《科学(Science)》456(7220):387-90;Rasmussen等人,(2010)《科学(Science)》463(7282):757-762;以及其它地方描述的那些。
在一些实施例中,本文的方法包括在将组合物与寡核苷酸池组合之前制备核酸组合物(例如,包括靶核酸的核酸组合物)。在一些实施例中,制备核酸组合物包括从样品分离核酸,由此生成核酸组合物。在一些实施例中,通过基本上由从样品分离核酸组成的方法制备核酸组合物,由此生成核酸组合物。在一些实施例中,通过基本上由从样品中分离核酸组成的方法制备核酸组合物,由此生成所分离核酸;并且用磷酸盐部分或化学反应性部分修饰所述所分离核酸的一个或两个末端,由此生成所述核酸组合物。在本文中,“基本上由……组成”是指制备的组合物中的核酸可以用适于促进靶核酸组合物与寡核苷酸池(例如,缓冲液、温度修饰)组合的任何试剂或条件进行修饰。
在某些方面,当与库组合时,靶核酸处于溶液中。在某些方面,靶核酸不处于固定的细胞样品中,并且不处于固定的组织样品中。例如,在一些实施例中,方法包括组合核酸组合物溶液和包括寡核苷酸的寡核苷酸池,所述核酸组合物溶液包括不在固定细胞样品中和/或不在固定组织样品中的靶核酸,并且包括突出端;其中寡核苷酸中的一些或全部包括:(i)能够与靶核酸中的突出端杂交的互补区域,和(ii)互补区域识别多核苷酸;库中的寡核苷酸包含不同长度的互补区域;并且互补区域识别多核苷酸对互补区域的一个或多个特征(例如,长度)具有特异性。
在某些方面,本公开的方法进一步包含对杂交的寡核苷酸和核酸(即,在组合步骤期间产生的“杂交产物”)进行测序。“对杂交的寡核苷酸和核酸进行测序”或“对杂交产物进行测序”是指确定杂交的寡核苷酸和核酸/杂交产物或其衍生物的核苷酸序列。可以例如通过连接杂交的寡核苷酸和核酸、PCR扩增杂交产物或其组合来制备杂交的寡核苷酸和核酸/杂交产物的衍生物。
在一些实施例中,测序过程是高度多重化的测序过程。在一些实施例中,测序过程生成测序读数。在一些实施例中,本文的方法包括基于测序读数,确定用于靶核酸的突出端的序列。在一些实施例中,本文的方法包括基于测序读数,确定互补区域识别多核苷酸的序列。在一些实施例中,本文的方法包括包括:确定用于靶核酸的突出端的长度。
测序可以在任何合适的测序平台上进行,包含Sanger测序平台、高通量测序(HTS)(或“下一代测序(NGS)”)平台等。感兴趣的HTS/NGS测序平台包含但不限于
Figure BDA0001971867200000291
提供的测序平台(例如,HiSeqTM、MiSeqTM和/或Genome AnalyzerTM测序系统);牛津纳米孔TM技术(例如,MinION测序系统)、Ion TorrentTM(例如,Ion PGMTM和/或Ion ProtonTM测序系统);Pacific Biosciences(太平洋生物科学)(例如,PACBIO RS II测序系统);LifeTechnologiesTM(例如,SOLiD测序系统);罗氏(Roche)(例如,454GS FLX+和/或GS Junior测序系统);或感兴趣的任何其它测序平台。用于制备用于测序的杂交产物(例如,通过扩增(例如,固相扩增)等)、对扩增子测序和分析测序数据的详细方案可从感兴趣的测序系统的制造商获得。
一些HTS/NGS测序平台要求待测序的核酸在一个末端处具有第一衔接子而在另一个末端处具有第二衔接子,其中第一衔接子和第二衔接子可以相同或不同。图1中示出了用于产生在每个末端处具有不同衔接子的杂交产物的一个示例方案。在图1的具体非限制性实例中,Illumina P5衔接子设置在杂交产物的一个末端处,并且Illumina P7衔接子设置在相对的末端处。因此,寡核苷酸池的寡核苷酸可以设计成在杂交产物的一个末端或两个末端处提供一个或多个测序衔接子(或其部分),以促进产物在所需HTS/NGS测序平台上的下游测序。
当本公开的方法进一步包含对杂交产物进行测序时,所得测序数据可以用于评估靶核酸(例如,5'磷酰化核酸)的多种性质,并因此评估制备5'磷酰化核酸和/或从中获得靶核酸的核酸。根据某些实施例,本公开的方法包含基于测序读数的数量确定靶核酸(例如,5'磷酰化核酸)的突出端含量,所述测序读数包含对应于与靶核酸(例如,5'磷酰化核酸)的核酸杂交的寡核苷酸的各种互补区域的互补区域识别序列。以这种方式,互补区域识别序列(例如,条形码)唯一地识别每种类型的寡核苷酸互补区域,并且进而唯一地识别存在于与互补区域特异性杂交的靶核酸(例如,5'磷酰化核酸)中的每种类型的突出端。“突出端含量”可以包含5'磷酰化核酸(并且因此,制备5'磷酰化核酸的核酸)中存在的突出端的长度、同一性(5'突出端或3'突出端)、序列或其任何组合。在一些实施例中,方法包含基于突出端含量,识别产生5'磷酰化核酸和/或从中获得靶核酸的核酸样品的来源(例如,用于取证目的)。
在一些方面,本文的方法包括分析核酸组合物中的特定突出端。这种方法可以包括根据本文所述的方法对核酸进行测序,以及量化靶核酸中的突出端的量,由此生成突出端量化。在一些实施例中,所述突出端量化针对被表征为以下的突出端:(i)5'突出端;(ii)3'突出端;(iii)特定序列;(iv)特定长度;或(v)(i)、(ii)、(iii)和(iv)中的两个、三个或四个的组合。在一些实施例中,突出端量化是针对突出端,其特征在于(i)5'突出端或3'突出端,和(ii)特定长度。在一些方面,本文的方法包括基于所述突出端量化,识别所述靶核酸组合物源自的所述核酸样品中的靶核酸的来源。在一些实施例中,进行本文的方法用于取证分析。在一些实施例中,进行本文的方法用于诊断分析。
根据本公开的一个实施例的方法示意性地示出在图1中。在此实例中,来自感兴趣核酸样品的核酸被5'磷酰化(例如,使用多核苷酸激酶(PNK))。接下来,将5'磷酰化核酸和寡核苷酸池在寡核苷酸池的寡核苷酸与5'磷酰化核酸的核酸杂交的条件下组合,所述5'磷酰化核酸具有在序列上互补并且相对于寡核苷酸的互补区域(图1中以黑色示出)具有对应长度的突出区域。寡核苷酸包含互补区域识别序列(图1中的“条形码”),其唯一识别其相应的寡核苷酸的互补区域。在此实例中,寡核苷酸池的寡核苷酸作为双链体存在,其包含寡核苷酸和与互补区域相邻的寡核苷酸区域杂交的核酸链(参见例如图1中从顶部起第二个框的“寡核苷酸”和“链”)。同样在此实例中,寡核苷酸包含测序衔接子或其部分(参见例如,图1中从顶部起第二个框的“seq衔接子”(这里,Illumina P5或P7))。在图1所示的具体实施例中,紧接着组合步骤,将杂交的寡核苷酸和核酸彼此连接。同样在此实施例中,使连接产物经历链置换填充反应(例如,使用Bst聚合酶)以在每个末端上完成测序衔接子。图1中示出的此示例方法的产物可以用于感兴趣的下游应用中,如高通量测序(例如,使用Illumina测序平台),例如,以获得关于各种5'磷酰化核酸的突出端含量的信息,并且进而感兴趣的样品中各种原始核酸的信息。
在一些方面,一种方法包括富集一种靶核酸。例如,本文的方法可以包括富集具有特定突出端特征(例如,长度,类型(5'、3')、序列)的一种靶核酸。可以根据特定的互补区域识别多核苷酸实现对具有特定突出端特征的一种靶核酸的富集。例如,根据特定的互补区域识别多核苷酸(例如,根据序列,或根据互补区域识别多核苷酸的另一个特征(例如,修饰)),可以将与本文所述的寡核苷酸复合的某些靶核酸与其余的靶核酸分离。在一些实施例中,方法包括将复合物(与本文的寡核苷酸连接的靶核酸)与与特定互补区域识别多核苷酸特异性杂交的一种或多种结合剂缔合,由此生成富集的复合物。对于术语“特异性杂交”,特异的或特异性,通常是指一个分子与另一个分子(例如,多核苷酸链与互补链)的结合或杂交。也就是说,特异的或特异性是指两个分子之间的稳定复合物的识别、接触和形成,与这两个分子中的任一个与其它分子的识别、接触或复合形成明显较少相比。术语杂交通常是指在两个分子之间形成稳定的复合物。在一些方面,与特定互补区域识别多核苷酸互补的多核苷酸包括结合对的成员。在一些方面,特定互补区域识别多核苷酸中的一个或多个核苷酸包括结合对的成员。结合对可以包含,例如,抗体/抗原、抗体/抗体、抗体/抗体片段、抗体/抗体受体、抗体/蛋白A或蛋白G、半抗原/抗半抗原、生物素/抗生物素蛋白、生物素/链霉抗生物素蛋白、叶酸/叶酸结合蛋白、维生素B12/内因子、化学反应基团/互补化学反应基团等。在一些实施例中,特异性地杂交到特定互补区域识别多核苷酸的一种或多种结合剂可以附接到固体支持物(例如,珠粒)。随后可以根据用于分离生物分子的任何合适方法(例如,下拉测定、使用固体支持物等)来实现对具有特定种的突出端的靶核酸的富集。
在某些方面,本公开的方法包括以下:(i)将所述核酸组合物与所述寡核苷酸池组合,由此形成杂交产物;(ii)将靶核酸与所述杂交产物中的所述寡核苷酸连接,由此生成复合物;(iii)修饰所述复合物中的寡核苷酸,由此生成核酸库;以及(iv)将所述核酸库暴露于测序过程。在某些方面,本公开的方法包括以下:(i)将所述核酸组合物与所述寡核苷酸池组合,由此形成杂交产物;(ii)将靶核酸与所述杂交产物中的所述寡核苷酸连接,由此生成复合物;(iii)将复合物与和特定互补区域识别多核苷酸特异性杂交的一种或多种结合剂缔合,由此生成富集复合物;(iv)修饰所述富集复合物中的寡核苷酸,由此生成核酸库;以及(v)将所述核酸库暴露于测序过程。
在某些方面,本公开的方法基本上由以下组成:(i)将所述核酸组合物与所述寡核苷酸池组合,由此形成杂交产物;(ii)将靶核酸与所述杂交产物中的所述寡核苷酸连接,由此生成复合物;(iii)修饰所述复合物中的寡核苷酸,由此生成核酸库;以及(iv)将所述核酸库暴露于测序过程。在某些方面,本公开的方法基本上由以下组成:(i)将所述核酸组合物与所述寡核苷酸池组合,由此形成杂交产物;(ii)将靶核酸与所述杂交产物中的所述寡核苷酸连接,由此生成复合物;(iii)将复合物与和特定互补区域识别多核苷酸特异性杂交的一种或多种结合剂缔合,由此生成富集复合物;(iv)修饰所述富集复合物中的寡核苷酸,由此生成核酸库;以及(v)将所述核酸库暴露于测序过程。当上述方法“基本上由所述步骤组成”时,方法可以包含与任何所述步骤相关联的额外常规操作(例如,洗涤、加热、冷却、分离、纯化、浓缩、稀释、分离等)。
在一些实施例中,修饰寡核苷酸包括切割寡核苷酸中的一个或多个切割位点(例如,在发夹衔接子中的一个或多个切割位点处切割)。在一些实施例中,其中修饰所述寡核苷酸包括:填充所述寡核苷酸中与所述寡核苷酸中与所述靶核酸中的突出端相互作用的突出端相对的突出端。
组合物
还提供了组合物。组合物用于例如实践本公开的方法,并且可以包含上文描述本公开的方法的部分中描述的以任何期望的组合的任何组分(例如,寡核苷酸池、寡核苷酸组分/区域、靶核酸、5'磷酰化核酸等)。
在一些实施例中,组合物包含寡核苷酸池,所述寡核苷酸池包含寡核苷酸,所述寡核苷酸包含不同长度的互补区域和适于与感兴趣的核酸样品中的突出端特异性杂交的核苷酸序列以及互补区域识别序列。寡核苷酸池、寡核苷酸和寡核苷酸区域和序列可以如上所述在描述主题方法的部分中。
本公开的任何组合物可以存在于容器中。合适的容器包含但不限于管、小瓶和板(例如,96孔或其它孔板)。
在某些方面,组合物包含存在于液体介质中的寡核苷酸池。液体介质可以是水性液体介质,如水、缓冲溶液等。一种或多种添加剂,如盐(例如NaCl、MgCl2、KCl、MgSO4)、缓冲剂(Tris缓冲剂、N-(2-羟乙基)哌嗪-N'-(2-乙磺酸)(HEPES)、2-(N-吗啉代)乙磺酸(MES)、2-(N-吗啉代)乙磺酸钠盐(MES)、3-(N-吗啉代)丙磺酸(MOPS)、N-三[羟基甲基]甲基-3-氨基丙磺酸(TAPS)等)、增溶剂、去污剂(例如非离子型去污剂,如吐温-20等)、核糖核酸酶抑制剂、甘油、螯合剂等可以存在于这种组合物中。
在一些实施例中,本公开的组合物是冻干组合物。冻干保护剂可以包含在这种组合物中,以便在冻干过程期间保护寡核苷酸池免受不稳定条件的影响。例如,已知的冻干保护剂包含糖(包含葡萄糖和蔗糖);多元醇(包含甘露醇、山梨糖醇和甘油);和氨基酸(包含丙氨酸、甘氨酸和谷氨酸)。可以包含约10mM到500nM的量的冻干保护剂。在某些方面,本公开的组合物是从冻干形式重构的液体形式。重构冻干组合物的示例程序是加回一定体积的纯水(通常相当于冻干期间移除的体积);然而,包括缓冲剂、抗菌剂等的溶液可以用于重构。
在某些方面,本公开组合物的寡核苷酸池的寡核苷酸作为双链体存在,其包含寡核苷酸和与互补区域相邻的寡核苷酸区域杂交的核酸链。根据某些实施例,与互补区域相邻的寡核苷酸区域包含互补区域识别序列的全部或一部分。
在一些实施例中,本公开的组合物的寡核苷酸池的寡核苷酸包含除互补区域和互补区域标识序列之外的部分。例如,除互补区域和互补区域标识序列之外的部分可以包含核酸结合结构域。核酸结合结构域可以是引物结合结构域。在某些方面,除互补区域和互补区域标识序列之外的部分包含测序衔接子的全部或一部分。在某些方面,互补区域的核苷酸序列是跨互补区域的长度的随机核苷酸序列。
在某些方面,存在于主题组合物中的寡核苷酸池的寡核苷酸包括一个或多个主链修饰。例如,可以相对于天然DNA或RNA修饰寡核苷酸主链。主链修饰可以包含,例如,用替代性的阴离子、中性和阳离子结构取代磷酸二酯基团或全糖磷酸二酯。在本公开的组合物中,寡核苷酸池的寡核苷酸可以包含天然核苷酸、非天然核苷酸(或“核苷酸类似物”)、或天然核苷酸和非天然核苷酸的混合物。可以存在于寡核苷酸中的非天然核苷酸包含但不限于肽核酸(PNA)核苷酸、吗啉代核苷酸、锁核酸(LNA)核苷酸、桥接核酸(BNA)核苷酸、乙二醇核酸(GNA)核苷酸、苏糖核酸(TNA)核苷酸等。根据某些实施例,寡核苷酸池的寡核苷酸包含一个或多个锁核酸(LNA)核苷酸。在某些方面,寡核苷酸的互补区域的一个或多个核苷酸是非天然核苷酸,例如一个或多个LNA核苷酸。例如,寡核苷酸的互补区域的每个核苷酸可以是非天然核苷酸,例如,寡核苷酸的互补区域的每个核苷酸可以是LNA核苷酸。
在某些方面,存在于主题组合物中的寡核苷酸池的寡核苷酸未被磷酰化。
根据一些实施例,本公开的组合物进一步包含来自感兴趣的核酸样品的核酸,例如,从感兴趣的核酸样品产生的靶核酸(例如,5'磷酰化核酸)。在某些方面,当存在这种核酸时,寡核苷酸池的寡核苷酸与靶核酸的核酸(例如,5'磷酰化核酸)杂交,所述靶核酸具有在序列上互补并且相对于寡核苷酸的互补区域具有对应长度的突出区域。核酸可以是5'磷酰化DNA,例如5'磷酰化基因组DNA(包含基因组DNA片段)、5'磷酰化线粒体DNA等。替代性地或额外地,核酸可以是5'磷酰化RNA。
靶核酸(例如,5'磷酰化核酸)可以来自从生物体、植物、动物等获得的核酸样品。例如,靶核酸(例如,5'磷酰化核酸)可以是现存的动物核酸或灭绝的(例如“古老的”)动物核酸。感兴趣的动物核酸包含,但不限于现存或灭绝的哺乳动物核酸、来自人属的现存或灭绝的哺乳动物的核酸等。
根据某些实施例,靶核酸是无细胞核酸。根据某些实施例,5'磷酰化核酸是5'磷酰化无细胞核酸。感兴趣的无细胞核酸包含,但不限于无细胞胎儿DNA、循环肿瘤DNA等。
试剂盒
如上所述,本公开提供了试剂盒。试剂盒可以包含例如上文描述本公开的方法的部分中描述的以任何期望的组合的任何有用组分(例如,寡核苷酸池、寡核苷酸组分/区域、靶核酸、5'磷酰化核酸等)。
在某些方面,本公开的试剂盒包含上文描述的本公开的任何组合物。试剂盒可以进一步包含用于进行本公开方法的实施例的任何试剂、缓冲液等。根据一些实施例,主题试剂盒包含适用于核酸样品的5'磷酰化核酸的激酶(例如多核苷酸激酶(PNK))、DNA连接酶、适合于执行填充和/或链置换反应的酶(例如,聚合酶)、及其任何组合。
试剂盒的组分可以存在于单独的容器中,或者多个组分可以存在于单个容器中。合适的容器包含单独的管(例如,小瓶)、板(例如,96孔板、384孔板等)的一个或多个孔等。
试剂盒可以包含例如用于使用所述组合物以产生核酸库的说明书。可以将说明书记录在合适的记录媒体上。例如,说明书可以印刷在基材上,如纸或塑料等。因此,说明书可以作为包装说明书存在于试剂盒中、在试剂盒的容器或其组分的标签中(即与包装或次包装有关联)等。在其它实施例中,说明书作为存在于合适的计算机可读存储介质上的电子存储数据文件存在,例如便携式闪存驱动器、DVD、CD-ROM,软盘等。在又其它实施例中,实际说明书不存在于试剂盒中,但是提供了用于从远程源,例如通过因特网获得说明书的手段。此实施例的实例是包含网址的试剂盒,其中可以查看说明书和/或可以从其下载说明书。与说明书一样,用于获得说明书的手段记录在合适的基材上。
实用性
本发明的方法、组合物和试剂盒用于多种背景,包含研究、临床、取证和其它背景。在某些方面,方法用于产生核酸库,其中基于互补区域识别序列与感兴趣的核酸样品的核酸的物理缔合(通过杂交)确定感兴趣的核酸样品的突出端含量,其中互补区域识别序列(例如,条形码)使能够确定与其物理上相关联的核酸中突出端的存在和/或类型。本公开的方法的实施例使能够在感兴趣的核酸样品中大量学习DNA、RNA或两者的末端的分子特性。例如,本公开的方法的实施例使能够大量学习双链DNA或RNA分子是否具有5元或3元突出端,那个突出端有多长等等。本公开的方法的实施例使能够使用标准HTS测序技术对这些分子进行测序,并将所得测序读数分成对应于其具有什么类型的突出端的类别。
使用本公开的方法确定突出端含量可以提供关于制备5'磷酰化核酸和/或从中获得靶核酸的核酸样品的各种有用信息。例如,知道突出端含量在分析例如,来自血浆或其它合适的来源的无细胞DNA(cfDNA)中是有价值的。已经示出,cfDNA衍生自各种来源,包含血细胞、孕妇的胎儿细胞、患有癌症的个体中的肿瘤细胞、来自器官移植受体中的移植器官组织等。通过本公开方法的实施例提供的突出端含量可以用于对测序读数进行分类,例如,通过原始来源以用于诊断目的。
此外,突出端含量可以用于分析来自取证样品的混合DNA。例如,来自精液、血液或感兴趣的其它来源的DNA可以具有对那个来源具有诊断性的最终特性,并且可以基于此信息对DNA序列进行分区。
此外,确定古老的DNA样品(例如,来自灭绝的生物体、植物或动物的样品)中的突出端含量提供了用于表征这种样品以及样品源自的生物、植物、动物等的信息。例如,古老的DNA样品(例如,来自灭绝的哺乳动物的DNA样品)通常包含污染的DNA(例如,污染细菌DNA等)。在这种情况下,当这种类型的突出端与特定的DNA来源相关联时,可以基于检测到的突出端的类型将感兴趣的DNA序列与污染的DNA序列分开。
在某些实施例中,本公开的方法用于确定DNA提取物(例如,古老DNA提取物)中碱基损伤的速率和位置,作为突出端的长度和类型的函数。在以下实验部分中提供了此实施例的进一步细节。
通过说明并不是通过限制提供了下述实例。
实验
在标准库制备方案中,通过填充5'末端并咀嚼3'末端的酶的作用使每个双链DNA或RNA分子的末端平端化。因此,在这些方案中,分子末端的实际同一性丧失。以下实例中呈现了生成测序库的方法,所述方法向每个读数引入条形码序列,其指示原始分子中存在哪种突出端,如果有的话。
实例1-库构建和测序
所用的库制备与图1中示意性示出的一致,本文的方法部分中提供了其随附的描述。此示例方法的特征包含:(i)条形码寡核苷酸(本文中也称为“衔接子”)未被磷酰化,并且因此不能形成多联体,(ii)互补区域是每个长度的所有随机序列的相等比例,并且(iii)条形码方案包含在每个衔接子中,其被测序并指示每个DNA或RNA片段上存在的突出端的长度和同一性(5'或3')。
使用如上所述的条形码寡核苷酸从古老的野牛提取物构建了几个库。在一个对照实验中,样品用酶混合物预处理,所述酶将所有DNA分子平端化(实验APN-09)。在另一组实验中,样品仅用PNK处理(参见图1),并且内源性末端保留在样品中(实验APN-15和APN-16)。
库生成之后,每个库在2x75Illumina MiSeq测序系统上进行测序,以从每个库生成几百万个读数。
实例2-将读数映射到野牛基因组
图2示出了从仅使用PNK(实验APN-15)处理的样品获得的读数的数量,所述PNK使用上述条形码寡核苷酸池映射到野牛基因组。
结果表明,可以量化来自古老DNA提取物的分子的相对比例,所述DNA提取物在其末端上具有不同长度的3'突出端和5'突出端。结果发现:(i)天然平末端分子是罕见的,至少在研究的野牛DNA提取物中,(ii)5'突出端比3'突出端更常见,(或者可能是由于3'突出端没有为了产生适合于测序的分子的确定长度,(iii)识别的重叠包含一个到八个核苷酸的重叠。因为有许多八个核苷酸条形码测序,这可能指示提取物中存在甚至更长的单链重叠。
在对照实验(实验APN-09)中,几乎所有的野牛读数都来自平末端条形码。
实例3-错配率
进一步分析APN-15实验数据以量化野牛序列读数与野牛基因组之间的错配率。此分析旨在示出古老DNA提取物中碱基损伤的速率和位置,作为单链突出端的长度和类型的函数。已经示出,胞嘧啶脱氨基是古老DNA中化学碱基损伤的主要形式。生成尿嘧啶碱基的胞嘧啶脱氨的结果是尿嘧啶被读作胸苷。因此,C到T的变化可以在古老DNA序列数据中常见。如果脱氨基胞嘧啶发生在测序仪读取的相反链上,则然后观察到C到T的互补,即G到A。还已知单链DNA中胞嘧啶脱氨的速率远高于双链DNA中胞嘧啶脱氨的速率。因此,C到T取代的速率可以在每个分子的起始部分中最高,直到突出端的长度,其由对应的条形码序列指示。
图3示出了实验APN-15中C到T和G到A的差异速率,作为分子中位置和单链突出端的长度和类型的函数。在3'突出端分子中,发现G到A的速率高达双链区段开始的点。在3'突出端分子中分析G到A,因为通过将突出的衔接子连接到3'突出端制备分子。因此,脱氨基胞嘧啶将与包含与尿嘧啶互补的A的分子退火。对5'突出端的分析示出了许多相同的特征,但是在补充方面。
实例4-来自健康受试者的血浆和尿液中DNA片段末端的表征
为了研究血浆中和尿液中DNA片段的性质,使用上述条形码可变突出端衔接子集制备几个库,并且在图1中示出。使用Qiagen QIAAMP循环核酸试剂盒从1mL到4mL健康供体血浆和健康供体尿液纯化DNA。用多核苷酸激酶(PNK)处理纯化的DNA以磷酰化所有游离的五元末端。然后,将条形码可变突出端衔接子连接到这些DNA片段。对于此实例,使用单一酶连接策略,并且在此示出结果。对于某些应用,使用双酶连接策略以适应平末端连接酶和切口密封连接酶的非重叠活性。然后用Bst 2.0聚合酶填充连接的衔接子末端。
如图4中所示,DNA片段的长度分布在血浆样品与尿液样品之间不同。通常,血浆DNA片段具有约165碱基对长的模式,其特征在于包裹在组蛋白周围的DNA。不受理论的限制,这与组蛋白上DNA的酶促降解一致,使得DNA片段包括与单一组蛋白相关联的DNA。来自尿液的DNA片段较短并且长度分布没有明确的模式。
包含在衔接子集中的条形码用于确定这些数据中突出端的分布。具体地,将映射到人类基因组的每个测序片段(几乎所有DNA片段)分类为在分子的每个末端上存在哪个条形码。以这种方式,可以在血浆和尿液中检测每个DNA片段末端的同一性。图5示出了血浆序列数据的这些计数。最常见的配置是条形码,其指示分子两个末端上的2个碱基,五元(5')突出端。不受理论的限制,此配置可能是DFF40/CAD凋亡核酸内切酶的结果,其切割特性已经在裸DNA底物上表征。在体外,DFF40/CAD通常留下五元突出端并且优先地在胞嘧啶残基周围切割。对此实例中产生的序列数据的分析示出在片段末端周围富集胞嘧啶碱基。
对来自尿液样品的DNA序列数据进行相同的分析。这些结果示出在图6中。与血浆DNA相比,没有最普遍的单一配置。相反,较长的五元(5')突出端比三元(3')突出端或平末端分子更常观察到。
实例5-发夹条形码可变突出端衔接子
在此实例中,描述了将条形码可变突出端衔接子附接到DNA片段的另一个概念。图7中示意性地示出了此概念,其示出了几种可能配置中的一种。可以将单个发夹衔接子连接到DNA片段的每个末端。由于DNA的极性,将图7中所示的发夹衔接子的顶部链连接到靶DNA分子的五元(5')末端,并将底部链连接到靶DNA分子的三元(3')末端。顶部链的一部分与底部链的一部分互补,其形成衔接子的茎部区域;并且顶部链的一部分不与底部链的一部分互补,其形成衔接子的发夹环区域,如图7中所示。使用几种方法(例如,化学、酶促)中的一种在可切割位点处切割发夹。切割之后,发夹环区域中的顶部序列和底部序列被分成不同的链,在连接的DNA分子的任一末端处形成Y形。存在于Y的臂中的不同序列用作独立的引发位点,用于扩增成标准的高通量测序库。对于Illumina测序平台,衔接子的一条链包含P5衔接子序列,并且相反的链包含P7衔接子序列。
发夹衔接子可以具有条形码和突出端,其允许识别突出端类型(5'或3')和长度,如上所述用于非发夹条形码可变突出端衔接子集。例如,这些发夹衔接子可以在衔接子的5'或3'末端上具有不同长度和不同序列的突出端。一些衔接子库还包含没有突出端的发夹衔接子(即,平末端,用于连接到平末端靶核酸)。
实例6-固定化条形码可变突出端衔接子
在此实例中,描述了将条形码可变突出端衔接子附接到DNA片段的另一个概念。单链P7条形码突出衔接子被5'磷酰化,并且3'末端被生物素化。将生物素化侧固定在链霉抗生物素蛋白上。将P7衔接子的补体杂交以形成双链固定化衔接子。将双链靶核酸连接到固定的衔接子库。将P5条形码突出衔接子连接到固定的靶核酸的游离侧。然后填充衔接子。
实例7-有效回收DNA序列数据和保存DNA分子的历史
从一些来源回收的DNA片段通常是特定核酸酶的作用的结果,所述特定核酸酶可以留下特征性突出端并且主要在特定序列环境中起作用。在此实例中,描述了一种技术方法,其保留了DNA分子上突出端的同一性。此方法适用于通常被认为无法通过取证分析的困难生物样品。例如,核基因组标记的遗传谱通常不可从无根毛干提取的DNA回收。在此实例中,核DNA存在并可从毛干回收,甚至可从100多年前的毛干回收。然而,无论样品的年龄如何,此DNA都以短片段存在(图8)。在毛干中,核DNA片段通常是涉及切割核DNA的酶DNase1L2的特定降解途径的最终产物。在角化细胞形成(包括毛发的细胞的最终成熟)期间,核基因组在核小体之间被切割,使得剩余的DNA在短片段中被发现。因此,即使对于新鲜毛发,通过天然且充分描述的生物过程使存在于毛干中的DNA对于基于PCR的STR分析而言太短。如图9中所示,迷你STR的最小扩增子长度(存在于人类中的最短变体的大小)比毛干中核DNA的典型片段长度长。额外地,从毛干回收的DNA量是可变的并且通常较低。由于这些原因,使用从无根毛干回收的DNA的STR标记的标准PCR扩增通常不起作用。
本文描述的DNA测序库方法保留了关于DNA片段末端状态的信息。此方法使能够从许多样品类型进行取证鉴定,所述样品类型具有通过死后腐烂或通过自然生物过程进行片段化的DNA。例如,无根毛发、老化的血迹和骨碎片都含有短片段的DNA,并且以前很难用于或无法用于取证鉴定。
本文所述的DNA测序库方法在表1中列举的样品板上进行测试,以(1)确定方法在测序库中捕获DNA信息的效率和(2)发现此信息的价值以辨别来自每个来源的分子的历史,可以用于分析复杂的混合物。
Figure BDA0001971867200000431
表1中列出的来源中的每一个都是有用的取证数据的潜在来源,目前认为这些数据具有挑战性或难以处理。在专用洁净室设施中提取DNA之后,(1)量化从每个样品回收的DNA的量,(2)生成编码每个DNA片段末端状态的条形码可变突出端衔接子库,(3)生成使用高效NEB Ultra II试剂盒的标准猎枪库,并且(4)进行传统CODIS标记物板的传统PCR扩增。对于触摸DNA实验,生成HVRI和HVRII扩增子产物用于比较。
这些数据的比较分析允许(1)从条形码可变突出端衔接子库方法与传统方法确定DNA回收的相对效率,以及(2)发现并描述来自这些生物来源的DNA的DNA突出末端的任何差异。
实例8-实施例的实例
以下阐述的实例示出了某些实施例,并不限制技术。
1.一种产生核酸库的方法,其包括:
组合以下:
5'磷酰化核酸;以及
包括寡核苷酸的寡核苷酸池,所述寡核苷酸包括:
不同长度和核苷酸序列的互补区域;以及
互补区域识别序列,
在所述寡核苷酸池的寡核苷酸与所述5'磷酰化核酸的核酸杂交的条件下,所述5'磷酰化核酸具有在序列上互补并且相对于所述寡核苷酸的所述互补区域具有对应长度的突出区域。
2.根据实施例1所述的方法,其中在所述组合之前,所述方法包括通过磷酰化来自核酸样品的核酸的所述5'末端产生所述5'磷酰化核酸。
3.根据实施例1或实施例2所述的方法,其中紧接着所述组合,所述方法包括连接杂交的寡核苷酸和核酸。
4.根据实施例1到3中任一项所述的方法,其中在所述组合期间,所述寡核苷酸池的所述寡核苷酸作为双链体存在,所述双链体包括:
所述寡核苷酸;以及
与邻近所述互补区域的所述寡核苷酸区域杂交的核酸链。
5.根据实施例4所述的方法,其中邻近所述互补区域的所述寡核苷酸的所述区域包括所述互补区域识别序列的所有或一部分。
6.根据实施例4或实施例5所述的方法,其中所述双链体包括与所述核酸杂交的所述末端相对的所述双链体的所述末端处的突出端,并且紧接着所述组合,所述方法包括填充由所述双链体形成的所述突出端。
7.根据实施例1到6中任一项所述的方法,其中所述寡核苷酸池的所述寡核苷酸包括除所述互补区域和所述互补区域识别序列之外的部分。
8.根据实施例7所述的方法,其中除所述互补区域和所述互补区域识别序列之外的所述部分包括核酸结合结构域。
9.根据实施例8所述的方法,其中所述核酸结合结构域是引物结合结构域。
10.根据实施例8或实施例9所述的方法,其中除所述互补区域和所述互补区域识别序列之外的所述部分包括测序衔接子的所有或一部分。
11.根据实施例1到10中任一项所述的方法,其中所述寡核苷酸池的所述寡核苷酸的所述互补区域的所述变化的核苷酸序列是随机的。
12.根据实施例1到11中任一项所述的方法,其中所述寡核苷酸池的所述寡核苷酸包括一个或多个非天然核苷酸。
13.根据实施例12所述的方法,其中所述寡核苷酸的所述互补区域中的一个或多个核苷酸是非天然核苷酸。
14.根据实施例13所述的方法,其中所述寡核苷酸的所述互补区域的每一个核苷酸是非天然核苷酸。
15.根据实施例12到14中任一项所述的方法,其中所述非天然核苷酸是锁核酸(LNA)核苷酸。
16.根据实施例1到15中任一项所述的方法,其中所述寡核苷酸池的所述寡核苷酸未被磷酰化。
17.根据实施例1到16中任一项所述的方法,其中所述5'磷酰化核酸是5'磷酰化脱氧核糖核酸(DNA)。
18.根据实施例17所述的方法,其中所述5'磷酰化DNA是5'磷酰化基因组DNA。
19.根据实施例1到16中任一项所述的方法,其中所述5'磷酰化核酸是5'磷酰化核糖核酸(RNA)。
20.根据实施例1到19中任一项所述的方法,其中所述5'磷酰化核酸是从动物获得的核酸样品制备的。
21.根据实施例20所述的方法,其中所述动物是灭绝动物。
22.根据实施例20或实施例21所述的方法,其中所述动物是哺乳动物。
23.根据实施例22所述的方法,其中所述动物来自人属。
24.根据实施例1到23中任一项所述的方法,其中所述5'磷酰化核酸是由无细胞核酸产生的。
25.根据实施例24所述的方法,其中所述无细胞核酸从选自由以下组成的组的体液样品获得:全血、血浆、血清、羊水、唾液、尿液、胸腔积液、支气管灌洗、支气管抽吸物、母奶、初乳、眼泪、精液、腹膜液、胸腔积液和粪便。
26.根据实施例24或实施例25所述的方法,其中所述无细胞核酸是无细胞胎儿DNA。
27.根据实施例24或实施例25所述的方法,其中所述无细胞核酸的循环肿瘤DNA。
28.根据实施例1到27中任一项所述的方法,其进一步包括对所述杂交的寡核苷酸和核酸进行测序。
29.根据实施例28所述的方法,其中在所述测序之前,所述方法包括连接所述杂交的寡核苷酸和核酸。
30.根据实施例28或29所述的方法,其包括基于测序读数的数量确定所述5'磷酰化核酸的所述突出端含量,所述读数包含对应于与所述5'磷酰化核酸的核酸杂交的寡核苷酸的所述各种互补区域的所述互补区域识别序列。
31.根据实施例30所述的方法,其包括基于所述突出端含量,识别产生所述5'磷酰化核酸的所述核酸样品的所述来源。
32.一种组合物,其包括:
包括寡核苷酸的寡核苷酸池,所述寡核苷酸包括:
不同长度和核苷酸序列的互补区域;以及
互补区域识别序列。
33.根据实施例32所述的组合物,其中所述组合物存在于容器中。
34.根据实施例32或实施例33所述的组合物,其中所述组合物是液体组合物。
35.根据实施例32或实施例33所述的组合物,其中所述组合物是冻干组合物。
36.根据实施例32到35中任一项所述的组合物,其中所述寡核苷酸池的所述寡核苷酸作为双链体存在,所述双链体包括:
所述寡核苷酸;以及
与邻近所述互补区域的所述寡核苷酸区域杂交的核酸链。
37.根据实施例36所述的组合物,其中邻近所述互补区域的所述寡核苷酸的所述区域包括所述互补区域识别序列的所有或一部分。
38.根据实施例32到37中任一项所述的组合物,其中所述寡核苷酸池的所述寡核苷酸包括除所述互补区域和所述互补区域识别多核苷酸之外的部分。
39.根据实施例38所述的组合物,其中除所述互补区域和所述互补区域识别序列之外的所述部分包括核酸结合结构域。
40.根据实施例39所述的组合物,其中所述核酸结合结构域是引物结合结构域。
41.根据实施例39或实施例40所述的组合物,其中除所述互补区域和所述互补区域识别序列之外的所述部分包括测序衔接子的所有或一部分。
42.根据实施例32到41中任一项所述的组合物,其中所述寡核苷酸池的所述寡核苷酸的所述互补区域的所述变化的核苷酸序列是随机的。
43.根据实施例32到42中任一项所述的组合物,其中所述寡核苷酸池的所述寡核苷酸包括一个或多个非天然核苷酸。
44.根据实施例43所述的组合物,其中所述寡核苷酸的所述互补区域中的一个或多个核苷酸是非天然核苷酸。
45.根据实施例44所述的组合物,其中所述寡核苷酸的所述互补区域的每一个核苷酸是非天然核苷酸。
46.根据实施例43到45中任一项所述的组合物,其中所述非天然核苷酸是锁核酸(LNA)核苷酸。
47.根据实施例32到46中任一项所述的组合物,其中所述寡核苷酸池的所述寡核苷酸未被磷酰化。
48.根据实施例32到47中任一项所述的组合物,其包括5'磷酰化核酸。
49.根据实施例48所述的组合物,其中所述寡核苷酸池的寡核苷酸与所述5'磷酰化核酸的核酸杂交,所述5'磷酰化核酸具有在序列上互补并且相对于所述寡核苷酸的所述互补区域具有对应长度的突出区域。
50.根据实施例48或实施例49所述的组合物,其中所述5'磷酰化核酸是5'磷酰化脱氧核糖核酸(DNA)。
51.根据实施例50所述的组合物,其中所述5'磷酰化DNA是5'磷酰化基因组DNA。
52.根据实施例48或实施例49所述的组合物,其中所述5'磷酰化核酸是5'磷酰化核糖核酸(RNA)。
53.根据实施例48到52中任一项所述的组合物,其中所述5'磷酰化核酸是从动物获得的核酸样品制备的。
54.根据实施例53所述的组合物,其中所述动物是灭绝动物。
55.根据实施例53或实施例54所述的组合物,其中所述动物是哺乳动物。
56.根据实施例55所述的组合物,其中所述动物来自人属。
57.根据实施例48到56中任一项所述的组合物,其中所述5'磷酰化核酸是由无细胞核酸产生的。
58.根据实施例57所述的组合物,其中所述无细胞核酸从选自由以下组成的组的体液样品获得:全血、血浆、血清、羊水、唾液、尿液、胸腔积液、支气管灌洗、支气管抽吸物、母奶、初乳、眼泪、精液、腹膜液、胸腔积液和粪便。
59.根据实施例57或实施例58所述的组合物,其中所述无细胞核酸是无细胞胎儿DNA。
60.根据实施例57或实施例58所述的组合物,其中所述无细胞核酸的循环肿瘤DNA。
61.一种试剂盒,其包括:
根据实施例32到47中任一项所述的组合物;以及
用于使用所述组合物产生核酸库的说明书。
62.根据实施例61所述的试剂盒,其进一步包括适用于使核酸样品的核酸5'磷酰化的激酶。
63.根据实施例62所述的试剂盒,其中所述激酶是多核苷酸激酶(PNK)。
64.根据实施例61到63中任一项所述的试剂盒,其进一步包括DNA连接酶。
A1.一种用于产生核酸库的方法,其包括:
组合以下:
包括靶核酸的核酸组合物,其中所述靶核酸中的一些或全部包括突出端;以及
包括寡核苷酸的寡核苷酸池,其中:
所述寡核苷酸中的一些或全部包括(i)能够与靶核酸中的突出端杂交的互补区域和(ii)互补区域识别多核苷酸,
所述池中包括互补区域的所述寡核苷酸包含不同长度的互补区域,并且
所述互补区域识别多核苷酸对所述互补区域的一个或多个特征具有特异性,其中所述一个或多个特征包括所述互补区域的长度;
所述组合的条件为所述寡核苷酸中的互补区域与所述靶核酸中具有对应长度的突出端杂交,由此形成核酸库的杂交产物。
A1.1根据实施例A1所述的方法,其中所述互补区域的所述一个或多个特征进一步包括(i)5'突出端;(ii)3'突出端;(iii)特定序列;(iv)(i)和(iii)的组合;或(v)(ii)和(iii)的组合。
A1.2根据实施例A1或A1.1所述的方法,其中所述靶核酸的一些不包括突出端。
A1.3根据实施例A1、A1.1或A1.2所述的方法,其中所述寡核苷酸的一些不包括互补区域,并且包括对互补区域不具有特异性的识别多核苷酸。
A2.根据实施例A1到A1.3中任一项所述的方法,其中包括突出端的所述靶核酸包括双链部分和单链突出端。
A3.根据实施例A1到A2中任一项所述的方法,其中包括突出端的每个靶核酸在一个末端处包括突出端或在两个末端处包括突出端。
A4.根据实施例A1到A3中任一项所述的方法,其中包括突出端的每个靶核酸的末端或两个末端独立地包括5'突出端或3'突出端。
A5.根据实施例A1到A4中任一项所述的方法,其中所述靶核酸是核糖核酸(RNA)或由RNA产生。
A5.1根据实施例A5所述的方法,其中所述RNA是从细胞中获得的。
A6.根据实施例A1到A4中任一项所述的方法,其中所述靶核酸是脱氧核糖核酸(DNA)或从脱氧核糖核酸(DNA)产生。
A7.根据实施例A6所述的方法,其中所述DNA是从细胞中获得的。
A8.根据实施例A7所述的方法,其中所述DNA是基因组DNA或是由基因组DNA产生的。
A9.根据实施例A1到A8中任一项所述的方法,其中所述靶核酸是从来自动物的样品中获得的。
A10.根据实施例A9所述的方法,其中所述动物是灭绝动物。
A11.根据实施例A9或A10所述的方法,其中所述动物是哺乳动物。
A12.根据实施例A11所述的方法,其中所述动物来自人属。
A13.根据实施例A1到A5、A6和A9到A12中任一项所述的组合物,其中所述靶核酸是无细胞核酸或是由无细胞核酸产生的。
A14.根据实施例A13所述的方法,其中所述无细胞核酸是从选自以下的体液样品中获得的:全血、血浆、血清、羊水、唾液、尿、胸膜积液、支气管灌洗液、支气管吸出物、母奶、初乳、眼泪、精液、腹膜液、胸腔积液和粪便。
A15.根据实施例A13或A14所述的方法,其中所述无细胞核酸包括无细胞胎儿DNA。
A16.根据实施例A13或A14所述的方法,其中所述无细胞核酸包括循环癌DNA。
A17.根据实施例A16所述的方法,其中所述无细胞核酸包括循环肿瘤DNA。
A18.根据实施例A13或A14所述的方法,其中所述无细胞核酸包括宿主DNA和非宿主DNA。
A19.根据实施例A18所述的方法,其中所述非宿主DNA来自传染剂。
A20.根据实施例A18所述的方法,其中所述非宿主DNA来自移植物。
A21.根据实施例A1到A20中任一项所述的方法,其中靶核酸中的突出端是天然突出端。
A22.根据实施例A1到A21中任一项所述的方法,其中在与所述池组合之前,所述靶核酸的长度未被修饰。
A23.根据实施例A1到A22中任一项所述的方法,其包括:在将所述核酸组合物与所述池组合之前,通过基本上由从样品中分离核酸组成的过程制备所述组合物,由此生成所述核酸组合物。
A24.根据实施例A1到A22中任一项所述的方法,其包括:在将所述核酸组合物与所述池组合之前,通过基本上由以下组成的过程制备所述核酸组合物:
从样品中分离核酸,由此生成所分离核酸;以及
用磷酸盐部分或化学反应性部分修饰所述所分离核酸的一个或两个末端,由此生成所述核酸组合物。
A25.根据实施例A1到A24中任一项所述的方法,其中当与所述池组合时,所述靶核酸处于溶液中。
A26.根据实施例A1到A25中任一项所述的方法,其中靶核酸不处于固定的细胞样品中。
A27.根据实施例A1到A25中任一项所述的方法,其中靶核酸不处于固定的组织样品中。
B1.根据实施例A1到A27中任一项所述的方法,其中所述寡核苷酸池包括寡核苷酸,所述寡核苷酸包括突出端。
B2.根据实施例B1所述的方法,其中所述池中的所有寡核苷酸包括突出端。
B3.根据实施例B1或B2所述的方法,其中包括突出端的所述寡核苷酸包括双链部分和单链突出端。
B4.根据实施例B1到B3中任一项所述的方法,其中包括突出端的所述寡核苷酸中的每一个包括一个末端处的突出端或两个末端处的突出端。
B5.根据实施例B1到B4中任一项所述的方法,其中包括突出端的所述寡核苷酸中的每一个的一个端或两个端独立地包括5'突出端或3'突出端。
B5.1根据实施例B5所述的方法,其中在末端处,所述突出端包括所述互补区域。
B5.2根据实施例B5所述的方法,其中所述互补区域识别多核苷酸对包括所述互补区域的所述突出端是5'突出端还是3'突出端具有特异性。
B6.根据实施例B1到B5.2中任一项所述的方法,其中:
所述寡核苷酸池包括寡核苷酸,所述寡核苷酸包括第一链和第二链;以及
所述第一链包括第一多核苷酸,并且所述第二链包括与所述第一多核苷酸互补的第二多核苷酸。
B6.1根据实施例B1到B5.2中任一项所述的方法,其中:
所述寡核苷酸池包括各自基本上由第一链和第二链组成的寡核苷酸;以及
所述第一链包括第一多核苷酸,并且所述第二链包括与所述第一多核苷酸互补的第二多核苷酸。
B7.根据实施例B1到B5.2中任一项所述的方法,其中:
所述寡核苷酸池包括寡核苷酸,所述寡核苷酸包括能够采用发夹结构的一条链;以及
所述一条链包括第一多核苷酸和第二多核苷酸,其中所述第一多核苷酸的一部分与所述第二多核苷酸的一部分互补。
B7.1根据实施例B1到B5.2中任一项所述的方法,其中:
所述寡核苷酸池包括寡核苷酸,所述寡核苷酸各自基本上由能够采用发夹结构的一条链组成;以及
所述寡核苷酸包括第一多核苷酸和第二多核苷酸,其中所述第一多核苷酸的一部分与所述第二多核苷酸的一部分互补。
B8.根据实施例B1到B7.1中任一项所述的方法,其中所述池包括寡核苷酸,所述寡核苷酸包括由三个或更多个核苷酸碱基构成的突出端。
B9.根据实施例B1到B8中任一项所述的方法,其中所述池中的所述寡核苷酸包括长度为1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个核苷酸、或其组合的突出端。
B10.根据实施例B1到B9中任一项所述的方法,其中所述池包括:
寡核苷酸的子集,其包括与靶核酸中长度为1个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为2个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为3个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为4个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为5个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为6个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为7个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为8个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为9个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为10个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为11个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为12个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为13个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为14个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为15个核苷酸的5'突出端杂交的互补区域;或
其组合。
B11.根据实施例B1到B10中任一项所述的方法,其中所述池包括:
寡核苷酸的子集,其包括(i)与靶核酸中长度为1个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为1个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为2个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为2个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为3个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为3个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为4个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为4个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为5个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为5个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为6个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为6个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为7个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为7个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为8个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为8个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为9个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为9个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为10个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为10个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为11个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为11个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为12个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为12个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为13个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为13个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为14个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为14个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;以及
寡核苷酸的子集,其包括(i)与靶核酸中长度为15个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为15个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;或
其部分。
B12.根据实施例B1到B11中任一项所述的方法,其中所述池包括:
寡核苷酸的子集,其包括与靶核酸中长度为1个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为2个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为3个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为4个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为5个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为6个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为7个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为8个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为9个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为10个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为11个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为12个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为13个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为14个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为15个核苷酸的3'突出端杂交的互补区域;或
其组合。
B13.根据实施例B1到B12中任一项所述的方法,其中所述池包括:
寡核苷酸的子集,其包括(i)与靶核酸中长度为1个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为1个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为2个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为2个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为3个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为3个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为4个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为4个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为5个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为5个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为6个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为6个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为7个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为7个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为8个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为8个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为9个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为9个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为10个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为10个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为11个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为11个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为12个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为12个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为13个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为13个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为14个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为14个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;以及
寡核苷酸的子集,其包括(i)与靶核酸中长度为15个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为15个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;或
其部分。
B14.根据实施例B1到B13中任一项所述的方法,其中所述池的所述寡核苷酸中的突出端包括能够与所述靶核酸中的碱基进行特异性碱基配对的核苷酸。
B15.根据实施例B14所述的方法,其中所述池的所述寡核苷酸中的突出端包括核苷酸,所述核苷酸包括腺嘌呤、鸟嘌呤、胞嘧啶、胸苷和尿嘧啶中的两种或更多种。
B16.根据实施例B14或实施例B15所述的方法,其中所述寡核苷酸池包括寡核苷酸,所述寡核苷酸包括特定突出端长度的不同突出端多核苷酸。
B17.根据实施例B16所述的方法,其中所述寡核苷酸池包括寡核苷酸,所述寡核苷酸包括特定突出端长度的所有可能的突出端多核苷酸组合。
B18.根据实施例B17所述的方法,其中所述寡核苷酸池包括寡核苷酸,所述寡核苷酸包括每个突出端长度的所有可能的突出端多核苷酸组合。
B19.根据实施例B14到B18中任一项所述的方法,其中所述池的所述寡核苷酸中的所述突出端多核苷酸是随机的。
B20.根据实施例B1到B19中任一项所述的方法,其中所述池的所述寡核苷酸中的突出端包括能够与所述靶核酸中的碱基进行非特异性碱基配对的核苷酸。
B21.根据实施例B20所述的方法,其中所述池的所述寡核苷酸中的突出端包括硝基吲哚、脱氧肌苷、或其组合。
B22.根据实施例B21所述的方法,其中所述硝基吲哚是5-硝基吲哚。
B23.根据实施例B21或实施例B22所述的方法,其中所述脱氧肌苷是2-脱氧肌苷。
B24.根据实施例B1到B23中任一项所述的方法,其中寡核苷酸的末端能够与靶核酸的、所述寡核苷酸在所述杂交产物中与其杂交的末端共价连接。
B25.根据实施例B24所述的方法,其中寡核苷酸链的3'末端能够与所述靶核酸中的链的、所述寡核苷酸在杂交产物中与其杂交的5'末端共价连接。
B26.根据实施例B1到B25中任一项所述的方法,其中所述寡核苷酸的邻近于所述互补区域的区域包括所述互补区域识别多核苷酸的全部或一部分。
B27.根据实施例B26所述的方法,其中所述池中的所述寡核苷酸在与具有与靶核酸杂交的突出端的末端相对的末端处包括相对突出端。
B28.根据实施例B27所述的方法,其包括:在所述组合之后填充所述相对突出端。
B29.根据实施例B1到B28中任一项所述的方法,其中所述寡核苷酸池的所述寡核苷酸包括除所述互补区域和所述互补区域识别多核苷酸之外的部分。
B30.根据实施例B29所述的方法,其中除所述互补区域和所述互补区域识别多核苷酸之外的部分包括核酸结合结构域。
B31.根据实施例B30所述的方法,其中所述核酸结合结构域是引物结合结构域。
B32.根据实施例B30或B31所述的方法,其中除所述互补区域和所述互补区域识别多核苷酸之外的部分包括测序衔接子的所有或一部分。
B33.根据实施例B1到B32中任一项所述的方法,其中所述寡核苷酸池的所述寡核苷酸包括一个或多个非天然核苷酸。
B34.根据实施例B33所述的方法,其中所述寡核苷酸的所述互补区域的一个或多个核苷酸是非天然核苷酸。
B35.根据实施例B34所述的方法,其中所述寡核苷酸的所述互补区域的每一个核苷酸是非天然核苷酸。
B36.根据实施例B33到B35中任一项所述的方法,其中所述非天然核苷酸是锁核酸(LNA)核苷酸。
B37.根据实施例B1到B36中任一项所述的方法,其中所述寡核苷酸包括一个或多个主链修饰。
C1.根据实施例A1到A27和B1到B37中任一项所述的方法,其包括:将所述杂交产物暴露于所述靶核酸的末端与所述寡核苷酸的、所述末端与其杂交的末端连接的条件下。
C2.根据实施例A1到A27、B1到B37和C1中任一项所述的方法,其中所述组合物中的所述靶核酸是5'磷酰化的。
C3.根据实施例A1到A27、B1到B37和C1或C2中任一项所述的方法,其中所述寡核苷酸池的寡核苷酸不是磷酰化的。
C4.根据实施例A1到A27、B1到B37和C1到C3中任一项所述的方法,其中所述寡核苷酸池的寡核苷酸是磷酰化的。
C5.根据实施例A1到A27、B1到B37和C1到C4中任一项所述的方法,其包括:在将所述核酸组合物与所述寡核苷酸池组合之前,使所述组合物中的所述靶核酸在将5'磷酸盐加入到靶核酸的5'末端的条件下与包括磷酰基转移活性的试剂接触。
C6.根据实施例A1到A27、B1到B37和C1到C4中任一项所述的方法,其包括:在将所述核酸组合物与所述寡核苷酸库组合之前,使所述组合物中的所述靶核酸不与包括磷酰基转移活性的试剂接触。
C7.根据实施例A1到A27、B1到B37和C1到C6中任一项所述的方法,其包括:在将所述核酸组合物与所述寡核苷酸库组合之前,使所述池中的所述寡核苷酸不与包括磷酰基转移活性的试剂接触。
C8.根据实施例C1到C7中任一项所述的方法,其包括:使所述杂交产物在靶核酸的末端与所述寡核苷酸的、所述靶核酸与其杂交的末端共价连接的条件下与包括连接酶活性的试剂接触。
C9.根据实施例C8所述的方法,其中所述杂交产物与包括第一连接酶活性的第一试剂和包括不同于所述第一连接酶活性的第二连接酶活性的第二试剂接触。
C10.根据实施例C9所述的方法,其中所述第一连接酶活性和所述第二连接酶活性独立地选自以下:平末端连接酶活性、切口密封连接酶活性、粘性末端连接酶活性、环化连接酶活性和粘着末端连接酶活性。
C11.根据实施例A1到A27、B1到B37和C1中任一项所述的方法,其中:
所述寡核苷酸中的每一个的末端包括第一化学反应性部分,并且所述靶核酸中的每一个的末端包含第二化学反应性部分;以及
所述第一化学反应性部分能够与所述第二化学反应性部分反应并且在寡核苷酸与所述寡核苷酸与其杂交的靶核酸之间形成共价键。
C12.根据实施例C11所述的方法,其包括:在将所述核酸组合物与所述寡核苷酸池组合之前,使所述组合物中的所述靶核酸在所述第二化学反应性部分结合在所述靶核酸中的每一个的末端处的条件下与一种或多种化学试剂接触。
C13.根据实施例C11或C12所述的方法,其包括:使所述杂交产物连同一种或多种化学试剂暴露于所述第一化学反应性部分与所述第二化学反应性部分反应从而在寡核苷酸与所述寡核苷酸与其杂交的靶核酸之间形成共价键的条件。
C14.根据实施例C11到C13中任一项所述的方法,其中所述第一化学反应性部分能够与所述第二化学反应性部分反应以在所述寡核苷酸与所述寡核苷酸与其杂交的所述靶核酸之间形成1,2,3-三唑。
C15.根据实施例C11到C14中任一项所述的方法,其中所述第一化学反应性部分能够在包括铜的条件下与所述第二化学反应性部分反应。
C16.根据实施例C11到C15中任一项所述的方法,其中所述第一化学反应性部分选自含叠氮化合物的部分和5-辛二炔基脱氧尿嘧啶,并且所述第二化学反应性部分独立地选自含叠氮化合物的部分、己炔基和5-辛二炔基脱氧尿嘧啶。
C17.根据实施例C16所述的方法,其中所述含叠氮化合物的部分是N-羟基琥珀酰亚胺(NHS)酯-叠氮化合物。
D1.根据实施例A1到A27、B7到B37和C1到C17中任一项所述的方法,其中所述寡核苷酸包括能够采用发夹结构的一条链,其中所述一条链包括第一多核苷酸、第二多核苷酸和能够在切割条件下切割的一个或多个切割位点。
D1.1根据实施例A1到A27、B7到B37和C1到C17中任一项所述的方法,其中所述寡核苷酸基本上由能够采用发夹结构的一条链组成,其中所述一条链包括第一多核苷酸、第二多核苷酸和能够在切割条件下切割的一个或多个切割位点。
D1.2根据实施例D1或D1.1所述的方法,其中所述第一多核苷酸包括与所述第二多核苷酸中的第一区域互补的第一区域,并且所述第一多核苷酸包括与所述第二多核苷酸中的第二区域不互补的第二区域。
D2.根据实施例D1、D1.1或D1.2所述的方法,其中所述一个或多个切割位点位于所述第一多核苷酸与所述第二多核苷酸之间。
D3.根据实施例D1到D2中任一项所述的方法,其中所述一个或多个切割位点包括尿嘧啶和/或脱氧尿苷核苷酸。
D4.根据实施例D1到D2中任一项所述的方法,其中所述一个或多个切割位点包括二醇。
D4.1根据实施例D4所述的方法,其中所述二醇是以5'到5'键结合的邻位二醇。
D5.根据实施例D1到D2中任一项所述的方法,其中所述一个或多个切割位点包括限制酶识别位点。
D5.1根据实施例D5所述的方法,其中所述限制酶识别位点是稀有切割酶限制酶识别位点。
D6.根据实施例D1到D5.1中任一项所述的方法,其包括:在所述组合之后,将所述一个或多个切割位点暴露于切割条件,由此切割所述寡核苷酸。
D7.根据实施例D1到D6中任一项所述的方法,其中所述寡核苷酸在5'到3'朝向上包括以下:
5'互补区域识别多核苷酸,
所述第一多核苷酸,
所述一个或多个切割位点,
所述第二多核苷酸,
3'互补区域识别多核苷酸,其与所述5'互补区域识别多核苷酸互补,以及
所述互补区域。
D8.根据实施例D1到D6中任一项所述的方法,其中所述寡核苷酸在5'到3'朝向上包括以下:
所述互补区域,
5'互补区域识别多核苷酸,
所述第一多核苷酸,
所述一个或多个切割位点,
所述第二多核苷酸,以及
3'互补区域识别多核苷酸,其与所述5'互补区域识别多核苷酸互补。
D9.根据实施例D1到D6中任一项所述的方法,其中所述寡核苷酸包括以下的混合物:
(i)在5'到3'朝向上包括以下的寡核苷酸:
5'互补区域识别多核苷酸,
所述第一多核苷酸,
所述一个或多个切割位点,
所述第二多核苷酸,
3'互补区域识别多核苷酸,其与所述5'互补区域识别多核苷酸互补,以及
所述互补区域;以及
(ii)在5'到3'朝向上包括以下的寡核苷酸:
所述互补区域,
5'互补区域识别多核苷酸,
所述第一多核苷酸,
所述一个或多个切割位点,
所述第二多核苷酸,以及
3'互补区域识别多核苷酸,其与所述5'互补区域识别多核苷酸互补。
E1.根据实施例A1到A27、B1到B37、C1到C17和D1到D9中任一项所述的方法,其包括:在所述组合之后,使所述互补区域识别多核苷酸在与所述互补区域识别多核苷酸互补的结合多核苷酸和所述互补区域识别多核苷酸杂交的条件下与包括所述结合多核苷酸的结合剂接触,由此生成结合复合物和未与所述结合剂结合的核酸。
E2.根据实施例E1所述的方法,其中所述结合剂包括固相。
E3.根据实施例E1所述的方法,其中所述结合剂包括接头,并且所述接头与固连接接或能够与其连接。
E4.根据实施例E1到E3中任一项所述的方法,其包括:将结合复合物与未与所述结合剂结合的所述核酸分离。
F1.一种用于对靶核酸进行测序的方法,其包括:
执行实施例A1-A27、B1到B37、C1到C17、D1到D9和E1到E4中任一项所述的方法,由此生成核酸库;
将所述核酸库暴露于测序过程。
F2.根据实施例F1所述的方法,其中所述寡核苷酸中除所述互补区域和所述互补区域识别多核苷酸之外的部分包括测序衔接子的全部或一部分。
F3.根据实施例F1或F2所述的方法,其基本上由以下组成:
(i)将所述核酸组合物与所述寡核苷酸池组合,由此形成杂交产物;
(ii)将靶核酸与所述杂交产物中的所述寡核苷酸连接,由此生成复合物;
(iii)修饰所述复合物中的寡核苷酸,由此生成核酸库;以及
(iv)将所述核酸库暴露于测序过程。
F4.根据实施例F1或F2所述的方法,其基本上由以下组成:
(i)将所述核酸组合物与所述寡核苷酸池组合,由此形成杂交产物;
(ii)将靶核酸与所述杂交产物中的所述寡核苷酸连接,由此生成复合物;
(iii)将复合物与和特定互补区域识别多核苷酸特异性杂交的一种或多种结合剂缔合,由此生成富集复合物;
(iv)修饰所述富集复合物中的寡核苷酸,由此生成核酸库;以及
(v)将所述核酸库暴露于测序过程。
F5.根据实施例F3或F4所述的方法,其中修饰所述寡核苷酸包括:切割所述寡核苷酸中的一个或多个切割位点。
F6.根据实施例F3或F4所述的方法,其中修饰所述寡核苷酸包括:填充所述寡核苷酸中与所述寡核苷酸中与所述靶核酸中的突出端相互作用的突出端相对的突出端。
F7.根据实施例F1到F6中任一项所述的方法,其中所述测序过程是高度多重化的测序过程。
F8.根据实施例F1到F7中任一项所述的方法,其中所述测序过程生成测序读数。
F9.根据实施例F8所述的方法,其包括基于所述测序读数确定所述靶核酸的突出端的序列。
F10.根据实施例F8或F9所述的方法,其包括基于所述测序读数,确定互补区域识别多核苷酸的序列。
F11.根据实施例F8到F10中任一项所述的方法,其包括:确定所述靶核酸的所述突出端的长度。
G1.一种用于分析核酸组合物中的特定突出端的方法,其包括:
根据实施例F1到F11中任一项所述的方法测序核酸;以及
量化靶核酸中的突出端的量,由此生成突出端量化。
G2.根据实施例G1所述的方法,其中所述突出端量化针对被表征为以下的突出端:(i)5'突出端;(ii)3'突出端;(iii)特定序列;(iv)特定长度;或(v)(i)、(ii)、(iii)和(iv)中的两个、三个或四个的组合。
G3.根据实施例G1或G2所述的方法,其中所述突出端量化针对被表征为以下的突出端:(i)5'突出端或3'突出端;和(ii)特定长度。
G4.根据实施例G1到G3中任一项所述的方法,其包括:基于所述突出端量化识别所述核酸样品中所述靶核酸组合物所源自的靶核酸来源。
G5.根据实施例G1到G4中任一项所述的方法,其中所述方法被执行以实现法医分析。
G6.根据实施例G1到G4中任一项所述的方法,其中所述方法被执行以实现诊断分析。
H1.一种组合物,其包括寡核苷酸池,所述寡核苷酸池包括寡核苷酸,其中:
所述寡核苷酸中的一些或全部包括(i)能够与核酸组合物的靶核酸中的突出端杂交的互补区域和(ii)互补区域识别多核苷酸,
所述池中包括互补区域的所述寡核苷酸包含不同长度的互补区域,并且
所述互补区域识别多核苷酸对所述互补区域的一个或多个特征具有特异性,其中所述一个或多个特征包括所述互补区域的长度。
H1.1根据实施例H1所述的组合物,其中所述互补区域的所述一个或多个特征进一步包括(i)5'突出端;(ii)3'突出端;(iii)特定序列;(iv)(i)和(iii)的组合;或(v)(ii)和(iii)的组合。
H1.2根据实施例H1或H1.1所述的组合物,其中所述寡核苷酸的一些不包括互补区域,并且包括对互补区域不具有特异性的识别多核苷酸。
H2.根据实施例H1到H1.2中任一项所述的组合物,其中所述组合物存在于容器中。
H3.根据实施例H1到H2中任一项所述的组合物,其中所述组合物是液体组合物。
H4.根据实施例H1到H2中任一项所述的组合物,其中所述组合物是冻干组合物。
H5.根据实施例H1到H4中任一项所述的组合物,其中所述寡核苷酸池的寡核苷酸与杂交产物中的靶核酸杂交。
H6.根据实施例H1到H5中任一项所述的组合物,其中所述寡核苷酸池包括寡核苷酸,所述寡核苷酸包括突出端。
H7.根据实施例H1到H6中任一项所述的组合物,其中所述池中的所有寡核苷酸包括突出端。
H8.根据实施例H6或H7所述的组合物,其中包括突出端的所述寡核苷酸包括双链部分和单链突出端。
H9.根据实施例H6到H8中任一项所述的组合物,其中包括突出端的所述寡核苷酸中的每一个在一个末端处包括突出端或在两个末端处包括突出端。
H10.根据实施例H6到H9中任一项所述的组合物,其中包括突出端的所述寡核苷酸中的每一个的一个端或两个端独立地包括5'突出端或3'突出端。
H10.1根据实施例H10所述的组合物,其中在一端,所述突出端包括所述互补区域。
H10.2根据实施例H10.1所述的组合物,其中所述互补区域识别多核苷酸对包括所述互补区域的所述突出端是5'突出端还是3'突出端具有特异性。
H11.根据实施例H6到H10.2中任一项所述的组合物,其中:
所述寡核苷酸池包括各自基本上由第一链和第二链组成的寡核苷酸;以及
所述第一链包括第一多核苷酸,并且所述第二链包括与所述第一多核苷酸互补的第二多核苷酸。
H12.根据实施例H6到H10中任一项所述的组合物,其中:
所述寡核苷酸池包括寡核苷酸,所述寡核苷酸各自基本上由能够采用发夹结构的一条链组成;以及
所述寡核苷酸包括第一多核苷酸以及与所述第一多核苷酸互补的第二多核苷酸。
H13.根据实施例H6到H12中任一项所述的组合物,其中所述池包括寡核苷酸,所述寡核苷酸包括由三个或更多个核苷酸碱基构成的突出端。
H14.根据实施例H6到H13中任一项所述的组合物,其中所述池中的所述寡核苷酸包括长度为1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个核苷酸、或其组合的突出端。
H15.根据实施例H6到H14中任一项所述的组合物,其中所述池包括:
寡核苷酸的子集,其包括与靶核酸中长度为1个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为2个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为3个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为4个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为5个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为6个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为7个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为8个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为9个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为10个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为11个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为12个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为13个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为14个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为15个核苷酸的5'突出端杂交的互补区域;或
其组合。
H16.根据实施例H6到H15中任一项所述的组合物,其中所述池包括:
寡核苷酸的子集,其包括(i)与靶核酸中长度为1个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为1个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为2个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为2个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为3个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为3个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为4个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为4个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为5个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为5个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为6个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为6个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为7个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为7个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为8个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为8个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为9个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为9个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为10个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为10个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为11个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为11个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为12个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为12个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为13个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为13个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为14个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为14个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;以及
寡核苷酸的子集,其包括(i)与靶核酸中长度为15个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为15个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;或
其部分。
H17.根据实施例H6到H16中任一项所述的组合物,其中所述池包括:
寡核苷酸的子集,其包括与靶核酸中长度为1个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为2个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为3个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为4个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为5个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为6个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为7个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为8个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为9个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为10个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为11个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为12个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为13个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为14个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为15个核苷酸的3'突出端杂交的互补区域;或
其组合。
H18.根据实施例H6到H17中任一项所述的组合物,其中所述池包括:
寡核苷酸的子集,其包括(i)与靶核酸中长度为1个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为1个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为2个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为2个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为3个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为3个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为4个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为4个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为5个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为5个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为6个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为6个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为7个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为7个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为8个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为8个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为9个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为9个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为10个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为10个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为11个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为11个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为12个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为12个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为13个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为13个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为14个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为14个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;以及
寡核苷酸的子集,其包括(i)与靶核酸中长度为15个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为15个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;或
其部分。
H19.根据实施例H6到H18中任一项所述的组合物,其中所述池的所述寡核苷酸中的突出端包括能够与所述靶核酸中的碱基特异性碱基配对的核苷酸。
H20.根据实施例H19所述的组合物,其中所述池的所述寡核苷酸中的突出端包括核苷酸,所述核苷酸包括腺嘌呤、鸟嘌呤、胞嘧啶、胸苷和尿嘧啶中的两种或更多种。
H21.根据实施例H19或H20所述的组合物,其中所述寡核苷酸池包括寡核苷酸,所述寡核苷酸包括特定突出端长度的不同突出端多核苷酸。
H22.根据实施例H21所述的组合物,其中所述寡核苷酸池包括寡核苷酸,所述寡核苷酸包括特定突出端长度的所有可能的突出端多核苷酸组合。
H23.根据实施例H22所述的组合物,其中所述寡核苷酸池包括寡核苷酸,所述寡核苷酸包括每个突出端长度的所有可能的突出端多核苷酸组合。
H24.根据实施例H19到H23中任一项所述的组合物,其中所述池的所述寡核苷酸中的所述突出端多核苷酸是随机的。
H25.根据实施例H6到H24中任一项所述的组合物,其中所述池的所述寡核苷酸中的突出端包括能够与所述靶核酸中的碱基进行非特异性碱基配对的核苷酸。
H26.根据实施例H6到H25中任一项所述的组合物,其中所述池的所述寡核苷酸中的突出端包括硝基吲哚、脱氧肌苷、或其组合。
H27.根据实施例H26所述的组合物,其中所述硝基吲哚是5-硝基吲哚。
H28.根据实施例H26或H27所述的组合物,其中所述脱氧肌苷是2-脱氧肌苷。
H29.根据实施例H6到H28中任一项所述的组合物,其中寡核苷酸的末端能够与靶核酸的、所述寡核苷酸在所述杂交产物中与其杂交的末端共价连接。
H30.根据实施例H6到H29中任一项所述的组合物,其中寡核苷酸链的3'末端能够与所述靶核酸中的链的、所述寡核苷酸在杂交产物中与其杂交的5'末端共价连接。
H31.根据实施例H6到H30中任一项所述的组合物,其中所述寡核苷酸的邻近于所述互补区域的区域包括所述互补区域识别多核苷酸的全部或一部分。
H32.根据实施例H31所述的组合物,其中所述池中的所述寡核苷酸在与具有与靶核酸杂交的突出端的末端相对的末端处包括相对突出端。
H33.根据实施例H32所述的组合物,其包括:在所述组合之后填充所述相对突出端。
H34.根据实施例H6到H33中任一项所述的组合物,其中所述寡核苷酸池的所述寡核苷酸包括除所述互补区域和所述互补区域识别多核苷酸之外的部分。
H35.根据实施例H34所述的组合物,其中除所述互补区域和所述互补区域识别多核苷酸之外的部分包括核酸结合结构域。
H36.根据实施例H35所述的组合物,其中所述核酸结合结构域是引物结合结构域。
H37.根据实施例H35或H36所述的组合物,其中除所述互补区域和所述互补区域识别多核苷酸之外的部分包括测序衔接子的所有或一部分。
H38.根据实施例H6到H37中任一项所述的组合物,其中所述寡核苷酸池的所述寡核苷酸包括一个或多个非天然核苷酸。
H39.根据实施例H38所述的组合物,其中所述寡核苷酸的所述互补区域的一个或多个核苷酸是非天然核苷酸。
H40.根据实施例H39所述的组合物,其中所述寡核苷酸的所述互补区域的每一个核苷酸是非天然核苷酸。
H41.根据实施例H38到H40中任一项所述的组合物,其中所述非天然核苷酸是锁核酸(LNA)核苷酸。
H42.根据实施例H6到H41中任一项所述的组合物,其中所述寡核苷酸包括一个或多个主链修饰。
H43.根据实施例H1到H42中任一项所述的组合物,其中包括突出端的所述靶核酸中的每一个包括双链部分和单链突出端。
H44.根据实施例H43所述的组合物,其中包括突出端的所述靶核酸中的每一个包括一个末端处的突出端或两个末端处的突出端。
H45.根据实施例H43或H44所述的组合物,其中包括突出端的所述靶核酸中的每一个的一个端或两个端独立地包括5'突出端或3'突出端。
H46.根据实施例H1到H45中任一项所述的组合物,其中所述靶核酸是核糖核酸(RNA)或由RNA产生。
H46.1根据实施例H46所述的组合物,其中所述RNA是从细胞中获得的。
H47.根据实施例H1到H45中任一项所述的组合物,其中所述靶核酸是脱氧核糖核酸(DNA)或从脱氧核糖核酸(DNA)产生。
H48.根据实施例H47所述的组合物,其中所述DNA是从细胞中获得的。
H49.根据实施例H48所述的组合物,其中所述DNA是基因组DNA或是由基因组DNA产生的。
H50.根据实施例H1到H49中任一项所述的组合物,其中所述靶核酸是从来自动物的样品中获得的。
H51.根据实施例H50所述的组合物,其中所述动物是灭绝动物。
H52.根据实施例H50或H51所述的组合物,其中所述动物是哺乳动物。
H53.根据实施例H50、H51或H52所述的组合物,其中所述动物来自人属。
H54.根据实施例H1到H46、H47和H50到H53中任一项所述的组合物,其中所述靶核酸是无细胞核酸或是由无细胞核酸产生的。
H55.根据实施例H54所述的组合物,其中所述无细胞核酸是从选自以下的体液样品中获得的:全血、血浆、血清、羊水、唾液、尿、胸膜积液、支气管灌洗液、支气管吸出物、母奶、初乳、眼泪、精液、腹膜液、胸腔积液和粪便。
H56.根据实施例H54或H55所述的组合物,其中所述无细胞核酸包括无细胞胎儿DNA。
H57.根据实施例H54或H55所述的组合物,其中所述无细胞核酸包括循环癌DNA。
H58.根据实施例H57所述的组合物,其中所述无细胞核酸包括循环肿瘤DNA。
H59.根据实施例H54或H55所述的组合物,其中所述无细胞核酸包括宿主DNA和非宿主DNA。
H60.根据实施例H59所述的组合物,其中所述非宿主DNA来自传染剂。
H61.根据实施例H59所述的组合物,其中所述非宿主DNA来自移植物。
H62.根据实施例H1到H61中任一项所述的组合物,其中靶核酸处于溶液中。
H63.根据实施例H1到H62中任一项所述的组合物,其中靶核酸不处于固定的细胞样品中。
H64.根据实施例H1到H62中任一项所述的组合物,其中靶核酸不处于固定的组织样品中。
I1.一种试剂盒,其包括:
根据实施例H1到H64中任一项所述的组合物;以及
用于使用所述组合物产生核酸库的说明书。
I2.根据实施例I1所述的试剂盒,其进一步包括适用于使核酸样品的核酸5'磷酰化的激酶。
I3.根据实施例I2所述的试剂盒,其中所述激酶是多核苷酸激酶(PNK)。
I4.根据实施例I1到I3中任一项所述的试剂盒,其进一步包括DNA连接酶。
所以,前述仅仅阐释了本公开的原理。认识到本领域技术人员能够想到各种布置,其尽管未在本文明确描述或示出,但体现了本发明的原理并且包含在其精神和范围内。更进一步,本文叙述的所有实例和条件语言主要旨在帮助读者理解由发明人为将来的技术所贡献的本发明的原理和概念,并且应解释为但不限于这种具体叙述的实例和条件。而且,本文叙述本发明的原理、方面和实施例以及其具体实例的描述旨在涵盖结构和其功能等同方案两者。额外地,期望这种等同方案包含目前已知的等同方案和将来发展的等同方案,即,发展的执行相同功能的任何要素,无论结构如何。因此,本发明的范围不旨在限于示出的示例性实施例和本文所述的。相反,本发明的范围和精神由所附的权利要求体现。

Claims (122)

1.一种用于产生核酸库的方法,其包括:
组合以下:
包括靶核酸的核酸组合物,其中所述靶核酸中的一些或全部包括突出端,其中所述靶核酸中的所述突出端是天然突出端;以及
包括寡核苷酸的寡核苷酸池,其中:
所述寡核苷酸中的一些或全部包括(i)能够与靶核酸中的突出端杂交的互补区域和(ii)互补区域识别多核苷酸,
所述池中包括互补区域的所述寡核苷酸包含不同长度的互补区域,并且
所述互补区域识别多核苷酸对所述互补区域的一个或多个特征具有特异性,其中所述一个或多个特征包括所述互补区域的长度;
所述组合的条件为所述寡核苷酸中的互补区域与所述靶核酸中具有对应长度的突出端杂交,由此形成核酸库的杂交产物。
2.根据权利要求1所述的方法,其中所述互补区域的所述一个或多个特征进一步包括(i)5'突出端;(ii)3'突出端;(iii)特定序列;(iv)(i)和(iii)的组合;或(v)(ii)和(iii)的组合。
3.根据权利要求1或2所述的方法,其中所述靶核酸中的一些不包括突出端。
4.根据权利要求1、2或3所述的方法,其中所述寡核苷酸中的一些不包括互补区域并且包括对互补区域不具有特异性的识别多核苷酸。
5.根据权利要求1到4中任一项所述的方法,其中包括突出端的所述靶核酸包括双链部分和单链突出端。
6.根据权利要求1到5中任一项所述的方法,其中包括突出端的每个靶核酸在一个末端处包括突出端或在两个末端处包括突出端。
7.根据权利要求1到6中任一项所述的方法,其中包括突出端的每个靶核酸的末端或两个末端独立地包括5'突出端或3'突出端。
8.根据权利要求1到7中任一项所述的方法,其中所述靶核酸是核糖核酸(RNA)或由RNA产生。
9.根据权利要求8所述的方法,其中所述RNA是从细胞中获得的。
10.根据权利要求1到7中任一项所述的方法,其中所述靶核酸是脱氧核糖核酸(DNA)或是由DNA产生的。
11.根据权利要求10所述的方法,其中所述DNA是从细胞中获得的。
12.根据权利要求11所述的方法,其中所述DNA是基因组DNA或是由基因组DNA产生的。
13.根据权利要求1到12中任一项所述的方法,其中所述靶核酸是从来自动物的样品中获得的。
14.根据权利要求13所述的方法,其中所述动物是灭绝动物。
15.根据权利要求13或14所述的方法,其中所述动物是哺乳动物。
16.根据权利要求15所述的方法,其中所述动物来自人属。
17.根据权利要求1到8、10、13到16中任一项所述的方法,其中所述靶核酸是无细胞核酸或是由无细胞核酸产生的。
18.根据权利要求17所述的方法,其中所述无细胞核酸是从选自以下的体液样品中获得的:全血、血浆、血清、羊水、唾液、尿、胸膜积液、支气管灌洗液、支气管吸出物、母奶、初乳、眼泪、精液、腹膜液、胸腔积液和粪便。
19.根据权利要求17或18所述的方法,其中所述无细胞核酸包括无细胞胎儿DNA。
20.根据权利要求17或18所述的方法,其中所述无细胞核酸包括循环癌DNA。
21.根据权利要求20所述的方法,其中所述无细胞核酸包括循环肿瘤DNA。
22.根据权利要求17或18所述的方法,其中所述无细胞核酸包括宿主DNA和非宿主DNA。
23.根据权利要求22所述的方法,其中所述非宿主DNA来自传染剂。
24.根据权利要求22所述的方法,其中所述非宿主DNA来自移植物。
25.根据权利要求1到24中任一项所述的方法,其中在与所述池组合之前,所述靶核酸的长度未被修饰。
26.根据权利要求1到25中任一项所述的方法,其包括:在将所述核酸组合物与所述池组合之前,通过基本上由从样品中分离核酸组成的过程制备所述组合物,由此生成所述核酸组合物。
27.根据权利要求1到25中任一项所述的方法,其包括:在将所述核酸组合物与所述池组合之前,通过基本上由以下组成的过程制备所述核酸组合物:
从样品中分离核酸,由此生成所分离核酸;以及
用磷酸盐部分或化学反应性部分修饰所述所分离核酸的一个或两个末端,由此生成所述核酸组合物。
28.根据权利要求1到27中任一项所述的方法,其中当与所述池组合时,所述靶核酸处于溶液中。
29.根据权利要求1到28中任一项所述的方法,其中靶核酸不处于固定的细胞样品中。
30.根据权利要求1到28中任一项所述的方法,其中靶核酸不处于固定的组织样品中。
31.根据权利要求1到30中任一项所述的方法,其中所述寡核苷酸池包括寡核苷酸,所述寡核苷酸包括突出端。
32.根据权利要求31所述的方法,其中所述池中的全部寡核苷酸包括突出端。
33.根据权利要求31或32所述的方法,其中包括突出端的所述寡核苷酸包括双链部分和单链突出端。
34.根据权利要求31到33中任一项所述的方法,其中包括突出端的所述寡核苷酸中的每一个在一个末端处包括突出端或在两个末端处包括突出端。
35.根据权利要求31到34中任一项所述的方法,其中包括突出端的所述寡核苷酸中的每一个的末端或两个末端独立地包括5'突出端或3'突出端。
36.根据权利要求35所述的方法,其中在末端处,所述突出端包括所述互补区域。
37.根据权利要求36所述的方法,其中所述互补区域识别多核苷酸对包括所述互补区域的所述突出端是5'突出端还是3'突出端具有特异性。
38.根据权利要求31到37中任一项所述的方法,其中:
所述寡核苷酸池包括寡核苷酸,所述寡核苷酸包括第一链和第二链;并且
所述第一链包括第一多核苷酸,并且所述第二链包括与所述第一多核苷酸互补的第二多核苷酸。
39.根据权利要求31到37中任一项所述的方法,其中:
所述寡核苷酸池包括各自基本上由第一链和第二链组成的寡核苷酸;并且
所述第一链包括第一多核苷酸,并且所述第二链包括与所述第一多核苷酸互补的第二多核苷酸。
40.根据权利要求31到37中任一项所述的方法,其中:
所述寡核苷酸池包括寡核苷酸,所述寡核苷酸包括能够采用发夹结构的一条链;并且
所述一条链包括第一多核苷酸和第二多核苷酸,其中所述第一多核苷酸的一部分与所述第二多核苷酸的一部分互补。
41.根据权利要求31到37中任一项所述的方法,其中:
所述寡核苷酸池包括寡核苷酸,所述寡核苷酸各自基本上由能够采用发夹结构的一条链组成;并且
所述寡核苷酸包括第一多核苷酸和第二多核苷酸,其中所述第一多核苷酸的一部分与所述第二多核苷酸的一部分互补。
42.根据权利要求31到41中任一项所述的方法,其中所述池包括寡核苷酸,所述寡核苷酸包括由三个或更多个核苷酸碱基构成的突出端。
43.根据权利要求31到42中任一项所述的方法,其中所述池中的所述寡核苷酸包括长度为1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个核苷酸或其组合的突出端。
44.根据权利要求31到43中任一项所述的方法,其中所述池包括:
寡核苷酸的子集,其包括与靶核酸中长度为1个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为2个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为3个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为4个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为5个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为6个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为7个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为8个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为9个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为10个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为11个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为12个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为13个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为14个核苷酸的5'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为15个核苷酸的5'突出端杂交的互补区域;或
其组合。
45.根据权利要求31到44中任一项所述的方法,其中所述池包括:
寡核苷酸的子集,其包括(i)与靶核酸中长度为1个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为1个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为2个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为2个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为3个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为3个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为4个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为4个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为5个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为5个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为6个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为6个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为7个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为7个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为8个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为8个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为9个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为9个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为10个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为10个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为11个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为11个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为12个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为12个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为13个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为13个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为14个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为14个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;以及
寡核苷酸的子集,其包括(i)与靶核酸中长度为15个核苷酸的5'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为15个核苷酸的5'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;或
其部分。
46.根据权利要求31到45中任一项所述的方法,其中所述池包括:
寡核苷酸的子集,其包括与靶核酸中长度为1个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为2个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为3个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为4个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为5个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为6个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为7个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为8个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为9个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为10个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为11个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为12个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为13个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为14个核苷酸的3'突出端杂交的互补区域;
寡核苷酸的子集,其包括与靶核酸中长度为15个核苷酸的3'突出端杂交的互补区域;或
其组合。
47.根据权利要求31到46中任一项所述的方法,其中所述池包括:
寡核苷酸的子集,其包括(i)与靶核酸中长度为1个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为1个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为2个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为2个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为3个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为3个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为4个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为4个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为5个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为5个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为6个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为6个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为7个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为7个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为8个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为8个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为9个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为9个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为10个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为10个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为11个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为11个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为12个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为12个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为13个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为13个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;
寡核苷酸的子集,其包括(i)与靶核酸中长度为14个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为14个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;以及
寡核苷酸的子集,其包括(i)与靶核酸中长度为15个核苷酸的3'突出端杂交的互补区域和(ii)对与所述靶核酸中长度为15个核苷酸的3'突出端杂交的互补区域具有特异性的互补区域识别多核苷酸;或
其部分。
48.根据权利要求31到47中任一项所述的方法,其中所述池的所述寡核苷酸中的突出端包括能够与所述靶核酸中的碱基进行特异性碱基配对的核苷酸。
49.根据权利要求48所述的方法,其中所述池的所述寡核苷酸中的突出端包括核苷酸,所述核苷酸包括腺嘌呤、鸟嘌呤、胞嘧啶、胸苷和尿嘧啶中的两种或更多种。
50.根据权利要求48或49所述的方法,其中所述寡核苷酸池包括寡核苷酸,所述寡核苷酸包括特定突出端长度的不同突出端多核苷酸。
51.根据权利要求50所述的方法,其中所述寡核苷酸池包括寡核苷酸,所述寡核苷酸包括特定突出端长度的所有可能的突出端多核苷酸组合。
52.根据权利要求51所述的方法,其中所述寡核苷酸池包括寡核苷酸,所述寡核苷酸包括每个突出端长度的所有可能的突出端多核苷酸组合。
53.根据权利要求48到52中任一项所述的方法,其中所述池的所述寡核苷酸中的所述突出端多核苷酸是随机的。
54.根据权利要求31到53中任一项所述的方法,其中所述池的所述寡核苷酸中的突出端包括能够与所述靶核酸中的碱基进行非特异性碱基配对的核苷酸。
55.根据权利要求54所述的方法,其中所述池的所述寡核苷酸中的突出端包括硝基吲哚、脱氧肌苷或其组合。
56.根据权利要求55所述的方法,其中所述硝基吲哚是5-硝基吲哚。
57.根据权利要求55或56所述的方法,其中所述脱氧肌苷是2-脱氧肌苷。
58.根据权利要求31到57中任一项所述的方法,其中寡核苷酸的末端能够与靶核酸的、所述寡核苷酸在所述杂交产物中与其杂交的末端共价连接。
59.根据权利要求58所述的方法,其中寡核苷酸链的3'末端能够与所述靶核酸中的链的、所述寡核苷酸在杂交产物中与其杂交的5'末端共价连接。
60.根据权利要求31到59中任一项所述的方法,其中所述寡核苷酸的邻近于所述互补区域的区域包括所述互补区域识别多核苷酸的全部或一部分。
61.根据权利要求60所述的方法,其中所述池中的所述寡核苷酸在与具有与靶核酸杂交的突出端的末端相对的末端处包括相对突出端。
62.根据权利要求61所述的方法,其包括:在所述组合之后填充所述相对突出端。
63.根据权利要求31到62中任一项所述的方法,其中所述寡核苷酸池的所述寡核苷酸包括除所述互补区域和所述互补区域识别多核苷酸之外的部分。
64.根据权利要求63所述的方法,其中除所述互补区域和所述互补区域识别多核苷酸之外的部分包括核酸结合结构域。
65.根据权利要求64所述的方法,其中所述核酸结合结构域是引物结合结构域。
66.根据权利要求64或65所述的方法,其中除所述互补区域和所述互补区域识别多核苷酸之外的部分包括测序衔接子的全部或一部分。
67.根据权利要求31到66中任一项所述的方法,其中所述寡核苷酸池的所述寡核苷酸包括一个或多个非天然核苷酸。
68.根据权利要求67所述的方法,其中所述寡核苷酸的所述互补区域的一个或多个核苷酸是非天然核苷酸。
69.根据权利要求68所述的方法,其中所述寡核苷酸的所述互补区域的每一个核苷酸是非天然核苷酸。
70.根据权利要求67到69中任一项所述的方法,其中所述非天然核苷酸是锁核酸(LNA)核苷酸。
71.根据权利要求31到70中任一项所述的方法,其中所述寡核苷酸包括一个或多个主链修饰。
72.根据权利要求1到30和31到71中任一项所述的方法,其包括:将所述杂交产物暴露于所述靶核酸的末端与所述寡核苷酸的、所述末端与其杂交的末端连接的条件下。
73.根据权利要求1到30、31到71和72中任一项所述的方法,其中所述组合物中的所述靶核酸是5'磷酰化的。
74.根据权利要求1到30、31到71、72和73中任一项所述的方法,其中所述寡核苷酸池的寡核苷酸未被磷酰化。
75.根据权利要求1到30、31到71和72到74中任一项所述的方法,其中所述寡核苷酸池的寡核苷酸是磷酰化的。
76.根据权利要求1到30、31到71和72到75中任一项所述的方法,其包括:在将所述核酸组合物与所述寡核苷酸池组合之前,使所述组合物中的所述靶核酸在将5'磷酸盐加入到靶核酸的5'末端的条件下与包括磷酰基转移活性的试剂接触。
77.根据权利要求1到30、31到71和72到75中任一项所述的方法,其包括:在将所述核酸组合物与所述寡核苷酸池组合之前,使所述组合物中的所述靶核酸不与包括磷酰基转移活性的试剂接触。
78.根据权利要求1到30、31到71和72到77中任一项所述的方法,其包括:在将所述核酸组合物与所述寡核苷酸池组合之前,使所述池中的所述寡核苷酸不与包括磷酰基转移活性的试剂接触。
79.根据权利要求72到78中任一项所述的方法,其包括:使所述杂交产物在靶核酸的末端与所述寡核苷酸的、所述靶核酸与其杂交的末端共价连接的条件下与包括连接酶活性的试剂接触。
80.根据权利要求79所述的方法,其中所述杂交产物与包括第一连接酶活性的第一试剂和包括不同于所述第一连接酶活性的第二连接酶活性的第二试剂接触。
81.根据权利要求80所述的方法,其中所述第一连接酶活性和所述第二连接酶活性独立地选自以下:平末端连接酶活性、切口密封连接酶活性、粘性末端连接酶活性、环化连接酶活性和粘着末端连接酶活性。
82.根据权利要求1到30、31到71和72中任一项所述的方法,其中:
所述寡核苷酸中的每一个的末端包括第一化学反应性部分,并且所述靶核酸中的每一个的末端包含第二化学反应性部分;并且
所述第一化学反应性部分能够与所述第二化学反应性部分反应并且在寡核苷酸与所述寡核苷酸与其杂交的靶核酸之间形成共价键。
83.根据权利要求82所述的方法,其包括:在将所述核酸组合物与所述寡核苷酸池组合之前,使所述组合物中的所述靶核酸在所述第二化学反应性部分结合在所述靶核酸中的每一个的末端处的条件下与一种或多种化学试剂接触。
84.根据权利要求82或83所述的方法,其包括:使所述杂交产物连同一种或多种化学试剂暴露于所述第一化学反应性部分与所述第二化学反应性部分反应从而在寡核苷酸与所述寡核苷酸与其杂交的靶核酸之间形成共价键的条件。
85.根据权利要求82到84中任一项所述的方法,其中所述第一化学反应性部分能够与所述第二化学反应性部分反应以在所述寡核苷酸与所述寡核苷酸与其杂交的所述靶核酸之间形成1,2,3-三唑。
86.根据权利要求82到85中任一项所述的方法,其中所述第一化学反应性部分能够在包括铜的条件下与所述第二化学反应性部分反应。
87.根据权利要求82到86中任一项所述的方法,其中所述第一化学反应性部分选自含叠氮化合物的部分和5-辛二炔基脱氧尿嘧啶,并且所述第二化学反应性部分独立地选自含叠氮化合物的部分、己炔基和5-辛二炔基脱氧尿嘧啶。
88.根据权利要求87所述的方法,其中所述含叠氮化合物的部分是N-羟基琥珀酰亚胺(NHS)酯-叠氮化合物。
89.根据权利要求1到30、40到71和72到88中任一项所述的方法,其中所述寡核苷酸包括能够采用发夹结构的一条链,其中所述一条链包括第一多核苷酸、第二多核苷酸和能够在切割条件下切割的一个或多个切割位点。
90.根据权利要求1到30、40到71和72到88中任一项所述的方法,其中所述寡核苷酸基本上由能够采用发夹结构的一条链组成,其中所述一条链包括第一多核苷酸、第二多核苷酸和能够在切割条件下切割的一个或多个切割位点。
91.根据权利要求89或90所述的方法,其中所述第一多核苷酸包括与所述第二多核苷酸中的第一区域互补的第一区域,并且所述第一多核苷酸包括与所述第二多核苷酸中的第二区域不互补的第二区域。
92.根据权利要求89、90或91所述的方法,其中所述一个或多个切割位点位于所述第一多核苷酸与所述第二多核苷酸之间。
93.根据权利要求89到92中任一项所述的方法,其中所述一个或多个切割位点包括尿嘧啶和/或脱氧尿苷核苷酸。
94.根据权利要求89到92中任一项所述的方法,其中所述一个或多个切割位点包括二醇。
95.根据权利要求94所述的方法,其中所述二醇是以5'到5'键结合的邻位二醇。
96.根据权利要求89到92中任一项所述的方法,其中所述一个或多个切割位点包括限制酶识别位点。
97.根据权利要求96所述的方法,其中所述限制酶识别位点是稀有切割酶限制酶识别位点。
98.根据权利要求89到97中任一项所述的方法,其包括:在所述组合之后,将所述一个或多个切割位点暴露于切割条件,由此切割所述寡核苷酸。
99.根据权利要求89到98中任一项所述的方法,其中所述寡核苷酸在5'到3'朝向上包括以下:
5'互补区域识别多核苷酸,
所述第一多核苷酸,
所述一个或多个切割位点,
所述第二多核苷酸,
3'互补区域识别多核苷酸,其与所述5'互补区域识别多核苷酸互补,以及
所述互补区域。
100.根据权利要求89到98中任一项所述的方法,其中所述寡核苷酸在5'到3'朝向上包括以下:
所述互补区域,
5'互补区域识别多核苷酸,
所述第一多核苷酸,
所述一个或多个切割位点,
所述第二多核苷酸,以及
3'互补区域识别多核苷酸,其与所述5'互补区域识别多核苷酸互补。
101.根据权利要求89到98中任一项所述的方法,其中所述寡核苷酸包括以下的混合物:
(i)在5'到3'朝向上包括以下的寡核苷酸:
5'互补区域识别多核苷酸,
所述第一多核苷酸,
所述一个或多个切割位点,
所述第二多核苷酸,
3'互补区域识别多核苷酸,其与所述5'互补区域识别多核苷酸互补,以及
所述互补区域;以及
(ii)在5'到3'朝向上包括以下的寡核苷酸:
所述互补区域,
5'互补区域识别多核苷酸,
所述第一多核苷酸,
所述一个或多个切割位点,
所述第二多核苷酸,以及
3'互补区域识别多核苷酸,其与所述5'互补区域识别多核苷酸互补。
102.根据权利要求31到71、72到88和89到101中任一项所述的方法,其包括:在所述组合之后,使所述互补区域识别多核苷酸在与所述互补区域识别多核苷酸互补的结合多核苷酸和所述互补区域识别多核苷酸杂交的条件下与包括所述结合多核苷酸的结合剂接触,由此生成结合复合物和未与所述结合剂结合的核酸。
103.根据权利要求102所述的方法,其中所述结合剂包括固相。
104.根据权利要求102所述的方法,其中所述结合剂包括接头,并且所述接头与固相连接或能够与其连接。
105.根据权利要求102到104中任一项所述的方法,其包括:将结合复合物与未与所述结合剂结合的所述核酸分离。
106.一种用于对靶核酸进行测序的方法,其包括:
执行根据权利要求1到30、31到71、72到88、89到101和102到105中任一项所述的方法,由此生成核酸库;
将所述核酸库暴露于测序过程。
107.根据权利要求106所述的方法,其中所述寡核苷酸中除所述互补区域和所述互补区域识别多核苷酸之外的部分包括测序衔接子的全部或一部分。
108.根据权利要求106或107所述的方法,其基本上由以下组成:
(i)将所述核酸组合物与所述寡核苷酸池组合,由此形成杂交产物;
(ii)将靶核酸与所述杂交产物中的所述寡核苷酸连接,由此生成复合物;
(iii)修饰所述复合物中的寡核苷酸,由此生成核酸库;以及
(iv)将所述核酸库暴露于测序过程。
109.根据权利要求106或107所述的方法,其基本上由以下组成:
(i)将所述核酸组合物与所述寡核苷酸池组合,由此形成杂交产物;
(ii)将靶核酸与所述杂交产物中的所述寡核苷酸连接,由此生成复合物;
(iii)将复合物与和特定互补区域识别多核苷酸特异性杂交的一种或多种结合剂缔合,由此生成富集复合物;
(iv)修饰所述富集复合物中的寡核苷酸,由此生成核酸库;以及
(v)将所述核酸库暴露于测序过程。
110.根据权利要求108或109所述的方法,其中修饰所述寡核苷酸包括:切割所述寡核苷酸中的一个或多个切割位点。
111.根据权利要求108或109所述的方法,其中修饰所述寡核苷酸包括:填充所述寡核苷酸中与所述寡核苷酸中与所述靶核酸中的突出端相互作用的突出端相对的突出端。
112.根据权利要求106到111中任一项所述的方法,其中所述测序过程是高度多重化的测序过程。
113.根据权利要求106到112中任一项所述的方法,其中所述测序过程生成测序读数。
114.根据权利要求113所述的方法,其包括:基于所述测序读数确定所述靶核酸的突出端的序列。
115.根据权利要求113或114所述的方法,其包括:基于所述测序读数确定互补区域识别多核苷酸的序列。
116.根据权利要求113到115中任一项所述的方法,其包括:确定所述靶核酸的所述突出端的长度。
117.一种用于分析核酸组合物中的特定突出端的方法,其包括:
按照根据权利要求106到116中任一项所述的方法对核酸进行测序;以及
量化靶核酸中的突出端的量,由此生成突出端量化。
118.根据权利要求117所述的方法,其中所述突出端量化针对被表征为以下的突出端:(i)5'突出端;(ii)3'突出端;(iii)特定序列;(iv)特定长度;或(v)(i)、(ii)、(iii)和(iv)中的两个、三个或四个的组合。
119.根据权利要求117或118所述的方法,其中所述突出端量化针对被表征为以下的突出端:(i)5'突出端或3'突出端;和(ii)特定长度。
120.根据权利要求117到119中任一项所述的方法,其包括:基于所述突出端量化识别所述核酸样品中所述靶核酸组合物所源自的靶核酸来源。
121.根据权利要求117到120中任一项所述的方法,其中所述方法被执行以实现法医分析(forensic analysis)。
122.根据权利要求117到120中任一项所述的方法,其中所述方法被执行以实现诊断分析。
CN201780050631.6A 2016-07-15 2017-07-13 产生核酸库的方法 Active CN109563543B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662362904P 2016-07-15 2016-07-15
US62/362,904 2016-07-15
PCT/US2017/041974 WO2018013837A1 (en) 2016-07-15 2017-07-13 Methods of producing nucleic acid libraries

Publications (2)

Publication Number Publication Date
CN109563543A CN109563543A (zh) 2019-04-02
CN109563543B true CN109563543B (zh) 2022-08-30

Family

ID=59388212

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780050631.6A Active CN109563543B (zh) 2016-07-15 2017-07-13 产生核酸库的方法

Country Status (7)

Country Link
US (2) US11299780B2 (zh)
EP (1) EP3485035A1 (zh)
JP (1) JP7048105B2 (zh)
CN (1) CN109563543B (zh)
AU (1) AU2017295717B2 (zh)
CA (1) CA3030430A1 (zh)
WO (1) WO2018013837A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018013837A1 (en) 2016-07-15 2018-01-18 The Regents Of The University Of California Methods of producing nucleic acid libraries
CN111954720A (zh) * 2018-01-12 2020-11-17 克拉雷特生物科学有限责任公司 用于分析核酸的方法和组合物
EP3802864A1 (en) 2018-06-06 2021-04-14 The Regents Of The University Of California Methods of producing nucleic acid libraries and compositions and kits for practicing same
KR20210039406A (ko) * 2018-07-23 2021-04-09 더 차이니즈 유니버시티 오브 홍콩 세포-프리 dna 손상 분석 및 이의 임상적 적용
US20220348906A1 (en) * 2019-04-05 2022-11-03 Claret Bioscience, Llc Methods and compositions for analyzing nucleic acid
US20230014607A1 (en) 2019-10-09 2023-01-19 Claret Bioscience, Llc Methods and compositions for analyzing nucleic acid
WO2022076574A1 (en) 2020-10-08 2022-04-14 Claret Bioscience, Llc Methods and compositions for analyzing nucleic acid

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997046704A1 (en) * 1996-06-06 1997-12-11 Lynx Therapeutics, Inc. Sequencing by ligation of encoded adaptors
WO2000039333A1 (en) * 1998-12-23 2000-07-06 Jones Elizabeth Louise Sequencing method using magnifying tags
WO2014210353A2 (en) * 2013-06-27 2014-12-31 10X Technologies, Inc. Compositions and methods for sample processing

Family Cites Families (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2318288A (en) 1987-08-07 1989-03-09 Genelabs Incorporated Coincidence cloning method and library
US6261774B1 (en) 1990-06-11 2001-07-17 Gilead Sciences, Inc. Truncation selex method
US5744306A (en) 1993-04-19 1998-04-28 Emory University Methods for nucleic acid detection, sequencing, and cloning using exonuclease
US5871697A (en) 1995-10-24 1999-02-16 Curagen Corporation Method and apparatus for identifying, classifying, or quantifying DNA sequences in a sample without sequencing
DE69636725T2 (de) 1995-11-29 2007-09-20 The Anthony Nolan Bone Marrow Trust, Hampstead Verfahren zur trennung und/oder erkennung von dns-molekülen
US5861246A (en) 1996-01-24 1999-01-19 Yale University Multiple selection process for binding sites of DNA-binding proteins
WO1997034015A1 (en) 1996-03-15 1997-09-18 The Penn State Research Foundation Detection of extracellular tumor-associated nucleic acid in blood plasma or serum using nucleic acid amplification assays
US6083693A (en) * 1996-06-14 2000-07-04 Curagen Corporation Identification and comparison of protein-protein interactions that occur in populations
US6013438A (en) 1996-11-27 2000-01-11 Baylor College Of Medicine Assay for detecting apoptotic cells
AU8234798A (en) 1997-07-11 1999-02-08 Brax Group Limited Categorising nucleic acid
US6607878B2 (en) 1997-10-06 2003-08-19 Stratagene Collections of uniquely tagged molecules
AU778438B2 (en) 1999-04-06 2004-12-02 Yale University Fixed address analysis of sequence tags
CA2383264A1 (en) 1999-08-13 2001-02-22 Yale University Binary encoded sequence tags
ATE317024T1 (de) 1999-12-29 2006-02-15 Keygene Nv Verfahren zur erzeugung von oligonukleotiden, im besonderen zur detektion amplifizierter restriktionsfragmente, die durch aflp erhalten wurden
US7300751B2 (en) 2000-06-30 2007-11-27 Syngenta Participations Ag Method for identification of genetic markers
US6596490B2 (en) 2000-07-14 2003-07-22 Applied Gene Technologies, Inc. Nucleic acid hairpin probes and uses thereof
US20040006033A1 (en) 2001-08-06 2004-01-08 Zhu York Yuan-Yuan Methods for identifying low-abundance polynucleotides and related compositions
US6927028B2 (en) 2001-08-31 2005-08-09 Chinese University Of Hong Kong Non-invasive methods for detecting non-host DNA in a host using epigenetic differences between the host and non-host DNA
US20030219878A1 (en) 2002-03-13 2003-11-27 Large Scale Biology Corporation Sticky rice
ATE435301T1 (de) 2003-10-16 2009-07-15 Sequenom Inc Nicht invasiver nachweis fötaler genetischer merkmale
JP5149013B2 (ja) 2004-11-29 2013-02-20 セクエノム,インコーポレイティド メチル化dnaを検出する手段、及び方法
CA2618699C (en) 2005-08-11 2012-10-02 J. Craig Venter Institute, Inc. In vitro recombination method
GB0522310D0 (en) 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
GB0524069D0 (en) 2005-11-25 2006-01-04 Solexa Ltd Preparation of templates for solid phase amplification
EP2602321B1 (en) 2006-05-31 2017-08-23 Sequenom, Inc. Methods and compositions for the extraction and amplification of nucleic acid from a sample
CA2655269A1 (en) 2006-06-16 2007-12-21 Sequenom, Inc. Methods and compositions for the amplification, detection and quantification of nucleic acid from a sample
US20100311602A1 (en) 2006-10-13 2010-12-09 J. Craig Venter Institute, Inc. Sequencing method
WO2009032779A2 (en) 2007-08-29 2009-03-12 Sequenom, Inc. Methods and compositions for the size-specific seperation of nucleic acid from a sample
WO2009032781A2 (en) 2007-08-29 2009-03-12 Sequenom, Inc. Methods and compositions for universal size-specific polymerase chain reaction
WO2009091719A1 (en) 2008-01-14 2009-07-23 Applera Corporation Compositions, methods, and kits for detecting ribonucleic acid
US8206926B2 (en) 2008-03-26 2012-06-26 Sequenom, Inc. Restriction endonuclease enhanced polymorphic sequence detection
US8029993B2 (en) 2008-04-30 2011-10-04 Population Genetics Technologies Ltd. Asymmetric adapter library construction
CA3073079C (en) 2008-09-16 2023-09-26 Sequenom, Inc. Processes and compositions for methylation-based enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses
US8476013B2 (en) 2008-09-16 2013-07-02 Sequenom, Inc. Processes and compositions for methylation-based acid enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses
EP2414545B1 (en) 2009-04-03 2017-01-11 Sequenom, Inc. Nucleic acid preparation compositions and methods
EP2569453B1 (en) 2010-05-14 2015-12-16 Fluidigm Corporation Nucleic acid isolation methods
EP2580378A4 (en) 2010-06-08 2014-01-01 Nugen Technologies Inc MULTIPLEX SEQUENCING METHODS AND COMPOSITION
WO2012103154A1 (en) 2011-01-24 2012-08-02 Nugen Technologies, Inc. Stem-loop composite rna-dna adaptor-primers: compositions and methods for library generation, amplification and other downstream manipulations
SG10201605049QA (en) 2011-05-20 2016-07-28 Fluidigm Corp Nucleic acid encoding reactions
US9139874B2 (en) 2011-07-07 2015-09-22 Life Technologies Corporation Bi-directional sequencing compositions and methods
US9506113B2 (en) 2011-12-28 2016-11-29 Ibis Biosciences, Inc. Nucleic acid ligation systems and methods
US10227587B2 (en) 2012-01-10 2019-03-12 Berry Genomics Co., Ltd. Method for constructing a plasma DNA sequencing library
WO2013131021A1 (en) 2012-03-02 2013-09-06 Sequenom Inc. Methods and processes for non-invasive assessment of genetic variations
KR102028375B1 (ko) 2012-09-04 2019-10-04 가던트 헬쓰, 인크. 희귀 돌연변이 및 카피수 변이를 검출하기 위한 시스템 및 방법
US9982255B2 (en) 2013-03-11 2018-05-29 Kailos Genetics, Inc. Capture methodologies for circulating cell free DNA
WO2014151117A1 (en) 2013-03-15 2014-09-25 The Board Of Trustees Of The Leland Stanford Junior University Identification and use of circulating nucleic acid tumor markers
EP2971097B1 (en) 2013-03-15 2018-08-01 Verinata Health, Inc Generating cell-free dna libraries directly from blood
EP3626866B1 (en) * 2013-08-19 2021-03-24 Abbott Molecular Inc. Next-generation sequencing libraries
DE102013221744B4 (de) * 2013-10-25 2019-05-16 Eberspächer Climate Control Systems GmbH & Co. KG Pumpe, insbesondere zum Fördern von flüssigem Brennstoff für ein Fahrzeugheizgerät
US9546399B2 (en) * 2013-11-13 2017-01-17 Nugen Technologies, Inc. Compositions and methods for identification of a duplicate sequencing read
EP4039811B1 (en) 2014-01-31 2023-09-20 Integrated DNA Technologies, Inc. Improved methods for processing dna substrates
CA2931140C (en) 2014-02-05 2022-08-30 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Error-free sequencing of dna
US10208338B2 (en) 2014-03-03 2019-02-19 Swift Biosciences, Inc. Enhanced adaptor ligation
EP3172341A4 (en) 2014-07-25 2018-03-28 University of Washington Methods of determining tissues and/or cell types giving rise to cell-free dna, and methods of identifying a disease or disorder using same
US9890375B2 (en) 2014-09-12 2018-02-13 Bgi Shenzhen Co., Limited Isolated oligonucleotide and use thereof in nucleic acid sequencing
CA2965500A1 (en) 2014-10-24 2016-04-28 Abbott Molecular Inc. Enrichment of small nucleic acids
WO2016081798A1 (en) 2014-11-20 2016-05-26 Children's Medical Center Corporation Methods relating to the detection of recurrent and non-specific double strand breaks in the genome
JP2018504899A (ja) 2014-12-24 2018-02-22 キージーン・エン・フェー 主鎖媒介性メイトペアシーケンシング
US10590451B2 (en) 2016-07-01 2020-03-17 Personal Genomics, Inc. Methods of constructing a circular template and detecting DNA molecules
WO2018013837A1 (en) 2016-07-15 2018-01-18 The Regents Of The University Of California Methods of producing nucleic acid libraries
US11198865B2 (en) 2017-11-02 2021-12-14 Amanda Raine Splinted ligation adapter tagging
CN111954720A (zh) 2018-01-12 2020-11-17 克拉雷特生物科学有限责任公司 用于分析核酸的方法和组合物

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997046704A1 (en) * 1996-06-06 1997-12-11 Lynx Therapeutics, Inc. Sequencing by ligation of encoded adaptors
WO2000039333A1 (en) * 1998-12-23 2000-07-06 Jones Elizabeth Louise Sequencing method using magnifying tags
WO2014210353A2 (en) * 2013-06-27 2014-12-31 10X Technologies, Inc. Compositions and methods for sample processing

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Preparation of high-quality next-generation sequencing libraries from picogram quantities of target DNA;N. J. PARKINSON等;《GENOME RESEARCH》;20111116;全文 *

Also Published As

Publication number Publication date
JP2019532014A (ja) 2019-11-07
AU2017295717B2 (en) 2021-06-24
EP3485035A1 (en) 2019-05-22
US11299780B2 (en) 2022-04-12
US20200149098A1 (en) 2020-05-14
WO2018013837A1 (en) 2018-01-18
CA3030430A1 (en) 2018-01-18
AU2017295717A1 (en) 2019-01-31
CN109563543A (zh) 2019-04-02
JP7048105B2 (ja) 2022-04-05
US20220389498A1 (en) 2022-12-08

Similar Documents

Publication Publication Date Title
CN109563543B (zh) 产生核酸库的方法
EP3204518B1 (en) Universal blocking oligo system and improved hybridization capture methods for multiplexed capture reactions
Head et al. Library construction for next-generation sequencing: overviews and challenges
US11549135B2 (en) Oligonucleotide-coupled antibodies for single cell or single complex protein measurements
US20220259638A1 (en) Methods and compositions for high throughput sample preparation using double unique dual indexing
EP3377625A1 (en) Method for controlled dna fragmentation
CN111201329A (zh) 具有减少的扩增偏倚的高通量单细胞测序
US11319576B2 (en) Methods of producing nucleic acid libraries and compositions and kits for practicing same
US20230242907A1 (en) Methods of Producing Nucleic Acid Libraries and Compositions and Kits for Practicing Same
AU2019248635B2 (en) Compositions and methods for making controls for sequence-based genetic testing
KR20210079309A (ko) 핵산의 바코딩
US20230279489A1 (en) Barcoded Solid Supports and Methods of Making and Using Same
WO2023237180A1 (en) Optimised set of oligonucleotides for bulk rna barcoding and sequencing
WO2023060138A2 (en) Methods for producing circular deoxyribonucleic acids

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant