CN105189780A - 核酸制备和分析的组合物和方法 - Google Patents

核酸制备和分析的组合物和方法 Download PDF

Info

Publication number
CN105189780A
CN105189780A CN201380070084.XA CN201380070084A CN105189780A CN 105189780 A CN105189780 A CN 105189780A CN 201380070084 A CN201380070084 A CN 201380070084A CN 105189780 A CN105189780 A CN 105189780A
Authority
CN
China
Prior art keywords
polynucleotide
dna
primer
rna
joint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201380070084.XA
Other languages
English (en)
Inventor
张以琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yilin Biological Medicine LLC
Original Assignee
Yilin Biological Medicine LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yilin Biological Medicine LLC filed Critical Yilin Biological Medicine LLC
Publication of CN105189780A publication Critical patent/CN105189780A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation

Abstract

本发明提供了产生单链多核苷酸的方法,其包括使用接头序列、单链多核苷酸扩增和包含BJSA的引物。还提供了使用探针和单链多核苷酸分析期望的多核苷酸上之一个或更多个区域的方法。还提供了可用于这些方法的试剂盒和组合物。

Description

核酸制备和分析的组合物和方法
相关申请的交叉引用
本申请要求于2012年12月3日提交的美国临时专利申请No.61/732,823的优先权权益,其通过引用以其整体并入。
技术领域
本申请一般性地涉及核酸样品制备和测序领域。
背景技术
核酸序列分析工具是鉴定基因改变的基础,其进而可用于诊断遗传疾病、预测对药物治疗的响应性以及分析药物的药物基因组学。由于测序分析经常涉及在有限量的样品中确定稀有的遗传改变,因此灵敏度是一个大的挑战。在分析组织样品(如癌症样品)中的体细胞突变时尤其如此,所述组织样品经常包含与具有突变之细胞混合的正常细胞。
为了增加灵敏度,使用了多种核酸扩增方法。最常用的扩增方法是聚合酶链式反应(“PCR”),其涉及使用Taq聚合酶来进行多个循环的扩增。因为Taq聚合酶固有的保真性(fidelity)问题,所以PCR方法经常产生可掩盖待分析之真正突变的人工突变,使得极难检测样品中的稀有突变。因此,可能降低核酸方法的精确度。
人基因组DNA很复杂并且具有很多重复序列。这为序列分析带来了另外的挑战。首先,目的多核苷酸在多核苷酸混合物中的代表性可能显著不足。其次,分析复杂DNA样品的成本可能极其昂贵,特别是在分析基因组DNA和检测多个遗传突变的情况下。虽然已开发了多种下一代测序方法,但是仍然需要灵敏、精确且有效的核酸制备和测序分析方法。
本文引用的所有参考文献(包括专利申请和出版物)均通过引用以其整体并入。
发明内容
在一个方面中,本申请提供了产生包含不对称接头(adaptor)序列的单链多核苷酸的方法,其包括:i)使一个或更多个DNA片段与以下接头连接:a)包含标签的第一接头,和b)包含识别序列的第二接头;ii)基于标签的存在选择包含所述第一接头的DNA片段;iii)使用包含RNA并与识别序列杂交的引物通过单链多核苷酸扩增来扩增步骤ii)中选择的DNA片段,从而选择性扩增包含所述第二接头的DNA片段。在一些实施方案中,通过使双链靶DNA(例如,基因组DNA)片段化来产生所述一个或更多个DNA片段。在一些实施方案中,使步骤ii)中选择的DNA片段的一条链与其互补链物理分离后,将其用作单链多核苷酸扩增的模板。
在一些实施方案中,提供了由双链靶DNA产生包含接头序列的单链多核苷酸的方法,其包括:i)用限制性内切核酸酶切割双链靶DNA以产生具有5’或3’突出端的DNA片段;ii)使所述DNA片段与接头连接,所述接头包含:a)与所述DNA片段的5’或3’突出端互补的单链5’或3’突出端和b)识别序列;以及iii)使用包含RNA并与识别序列杂交的引物通过单链多核苷酸扩增来扩增与所述接头连接的DNA片段。在一些实施方案中,使与所述接头连接的DNA片段进一步片段化后,对其进行单链多核苷酸扩增。
在根据以上段落所述的任意一个实施方案的一些实施方案中,所述方法还包括由所述单链多核苷酸制备多核苷酸文库。
在根据以上段落所述的任意一个实施方案的一些实施方案中,所述方法还包括将所述单链多核苷酸固定在固体支持物上。
在根据以上段落所述的任意一个实施方案的一些实施方案中,所述方法还包括对所述单链多核苷酸进行分析(例如测序)。
在一些实施方案中,提供了对靶多核苷酸上的一个或更多个期望区域进行分析(例如,测序)的方法,其中所述一个或更多个期望区域可与探针组杂交,所述方法包括:1)使由所述靶多核苷酸产生的单链多核苷酸群与探针组相接触;2)使与探针结合的多核苷酸与其余的多核苷酸分离,其中包含一个或更多个期望区域的多核苷酸被富集;3)对分离的多核苷酸进行分析(例如,测序)。在一些实施方案中,使用包含RNA的引物并使用由所述靶多核苷酸产生的DNA片段作为模板通过单链多核苷酸扩增而由所述靶多核苷酸产生单链多核苷酸群。在一些实施方案中,所述一个或更多个期望区域是癌基因所在的区域。在一些实施方案中,探针组包含至少约10种不同的多核苷酸探针。在一些实施方案中,多核苷酸探针组包含至少约50种不同的多核苷酸探针。在一些实施方案中,靶多核苷酸是RNA。在一些实施方案中,靶多核苷酸是双链DNA(例如,基因组DNA)。在一些实施方案中,单链多核苷酸群通过以上段落所述的方法来产生。
在根据上述任意一个实施方案的一些实施方案中,单链多核苷酸扩增包括:a)在复合体中延伸包含RNA的引物,所述复合体包含:i)待扩增的DNA片段和ii)包含RNA的引物,其中使所述包含RNA的引物与所述待扩增的DNA片段杂交;以及b)用从RNA/DNA杂合体切割RNA的酶切割引物的RNA部分,以使得另一包含RNA的引物与DNA片段杂交并通过链置换来重复引物延伸;从而产生单链多核苷酸的多个拷贝。
在根据上述任意一个实施方案的一些实施方案中,单链多核苷酸扩增包括使用RNA引物。在一些实施方案中,单链多核苷酸扩增包括使用DNA-RNA复合引物。在一些实施方案中,延伸通过选自以下的DNA聚合酶来进行:链置换DNA聚合酶、高保真DNA聚合酶、具有校正活性的聚合酶、T7DNA聚合酶和大肠杆菌(E.coli)DNA聚合酶。在一些实施方案中,从RNA/DNA杂合体切割RNA的酶是RNaseH或RNaseI。
在一些实施方案中,提供了这样的试剂盒,其包含i)包含标签的第一接头;和b)包含识别序列的第二接头;和iii)与所述识别序列杂交的引物。在一些实施方案中,试剂盒还包含与所述标签结合的配体。在一些实施方案中,试剂盒还包含固体支持物。在一些实施方案中,引物包含RNA。在一些实施方案中,引物是RNA引物。在一些实施方案中,引物是DNA/RNA复合引物。在一些实施方案中,引物为约5至约30个核苷酸。在一些实施方案中,试剂盒还包含从RNA/DNA杂合体切割RNA的酶(例如,RNaseH或RNaseI)。在一些实施方案中,试剂盒还包含DNA聚合酶,例如,选自以下的DNA聚合物:链置换DNA聚合酶、高保真DNA聚合酶、具有校正活性的聚合酶、T7DNA聚合酶和大肠杆菌DNA聚合酶。在一些实施方案中,试剂盒还包含DNA连接酶。在一些实施方案中,试剂盒还包含一种或更多种探针。在一些实施方案中,试剂盒还包含用于进行任意一种本文所述方法的说明书。
附图说明
图1描绘了使用不对称接头处理DNA的一种示例性方法。
图2描绘了使用限制性酶消化处理DNA的一种示例性方法。
发明详述
本申请提供了核酸制备和分析的方法,其允许灵敏、精确和有效地确定核酸序列。所述方法通常包括通过使用单链多核苷酸扩增来扩增靶多核苷酸以产生单链多核苷酸。可例如通过添加一个或更多个接头来处理靶核酸,并且可选择包含一个或更多个接头的核酸并将其用于产生单链多核苷酸。可通过使用与单链多核苷酸上的目的区域杂交的探针组进一步富集单链多核苷酸中包含目的区域的多核苷酸。
因此,在一个方面中,本申请提供了产生包含一个或更多个接头的单链多核苷酸的方法。
在另一个方面中,提供了分析靶多核苷酸上的一个或更多个期望区域的方法。
在另一个方面中,提供了可用于本文所述方法的试剂盒、组合物和制品。
I.定义
本文使用的“单链多核苷酸扩增”是指通过在包含靶多核苷酸序列的单链模板核酸上重复延伸单个引物来合成单链子链的多个拷贝。新合成的核酸分子在后续的引物延伸反应期间不能用作产生另外的核酸分子的模板。
本文使用的“扩增”一般是指产生期望序列的两个或更多个拷贝的过程。本文中可互换使用的“多核苷酸”或“核酸”是指任意长度的核苷酸聚合物,包括DNA和RNA。所述核苷酸可以是脱氧核糖核苷酸、核糖核苷酸、经修饰的核苷酸或碱基和/或其类似物、或者可通过DNA聚合酶或RNA聚合酶并入聚合物中的任何底物。多核苷酸可包含经修饰的核苷酸,例如甲基化的核苷酸及其类似物。
本文中使用的“寡核苷酸”一般是指短的、一般为单链的、一般为合成的多核苷酸,其长度一般(但不一定)不超过约200个核苷酸。术语“寡核苷酸”和“多核苷酸”并不互相排斥。以上对于多核苷酸的描述同样完全适用于寡核苷酸。
本文使用的使多核苷酸“片段化”是指使多核苷酸断裂成不同的多核苷酸片段。片段化可例如通过剪切或通过酶促反应来实现。
“引物”一般是短的单链多核苷酸,一般具有游离3’-OH基团,其通过与靶序列杂交而与目的靶标结合,并随后促进与靶标互补之多核苷酸的聚合。
本文使用的术语“标签”是指可用于将连接有标签的分子与不包含所述标签的其他分子分开的部分。
本文使用的术语“末端核苷酸”是指位于核酸分子5’端或3’端的核苷酸。
“杂交”和“退火”是指其中一个或更多个多核苷酸反应以形成复合体的反应,所述复合体通过核苷酸残基碱基之间的氢键键合而稳定化。氢键键合可通过Watson-Crick碱基配对、Hoogstein结合或者通过任何其他序列特异性方式发生。
本文使用的“接头”是指可与多核苷酸片段连接的寡核苷酸。
本文关于两个多核苷酸(如接头和多核苷酸片段)使用的术语“连接”是指两个单独的多核苷酸共价连接以产生具有连续骨架的单个更大的多核苷酸。
术语“3’”一般是指多核苷酸或寡核苷酸中位于同一多核苷酸或寡核苷酸中另一区域或位置下游的区域或位置。
术语“5’”一般是指多核苷酸或寡核苷酸中位于同一多核苷酸或寡核苷酸中另一区域或位置上游的区域或位置。
“5’突出端”是延伸超过双链核酸分子5’端的一段(stretch)未配对核苷酸。例如,5’突出端可以是单个未配对核苷酸,或者其可以为至少5、10、15或超过15个核苷酸长。例如,引物可包含,例如5至25个不与例如模板链中存在的序列和/或靶多核苷酸序列互补的核苷酸。换言之,在引物的其他部分与靶多核苷酸杂交的情况下,5’突出端的核苷酸不与靶多核苷酸序列杂交。
“3’突出端”是延伸超过双链核酸分子3’端的一段未配对核苷酸。例如,3’突出端可以是单个未配对核苷酸,或者其可以为至少5、10、15或超过15个核苷酸长。例如,引物可包含,例如5至25个不与例如模板链中存在的序列和/或靶多核苷酸序列互补的核苷酸。换言之,在引物的其他部分与靶多核苷酸杂交的情况下,3’突出端的核苷酸不与靶多核苷酸序列杂交。
本文使用的术语“靶多核苷酸”是指包含一个或更多个目的序列和正在研究的序列的多核苷酸。
本文使用的“阵列”包括具有空间或光学可寻址(addressable)区域之核酸或其他分子的排列。当阵列是核酸阵列时,核酸可在沿核酸链的任意点被物理吸附、化学吸附或共价连接至所述阵列。
术语“确定”、“测量”、“评价”、“评估”、“测定”和“分析”在本文中可互换使用,是指任意形式的测量并且包括确定要素是否存在。这些术语包括定量确定和/定性确定二者。评估可以是相对的或绝对的。“评估......的存在”包括确定物质存在的量以及确定其是否存在。
本文使用的术语“单核苷酸多态性”或简称“SNP”是指基因组序列中特定位点处的单个核苷酸的改变,导致在群体中以可感知频率(例如,群体中至少1%)出现的两个或更多个替代等位基因。
本文使用的术语“变性”是指使核酸双链体分为两条单链。
术语“富集”是指使样品中特定核酸序列的相对丰度相对于处理前所述样品中最初存在的整体核酸序列水平提高的过程。因此,富集步骤提供了相对百分比或分数提高,而不是直接提高(例如目的核酸序列的绝对拷贝数)。在富集步骤之后,待分析样品可称为富集的多核苷酸或经选择的多核苷酸。
本文使用的核酸样品的“复杂性(complexity)”是指所述样品中存在的不同的独特序列的数目。如果样品不如其所来源的核酸样品复杂,则认为该样品具有“降低的复杂性”。
本文使用的“固体支持物”是指具有与标签结合之特性的固体或半固体材料,所述特性是固有的或者通过连接一些赋予所述特性的组分(例如,抗体、链霉亲和素、核酸或其他结合配体)而实现。这样的结合可以是直接的或间接的。固体支持物的实例包括但不限于硝化纤维素和尼龙膜、琼脂糖或基于纤维素的珠(例如,Sepharose)和顺磁珠。
本文使用的术语“文库”是指核酸序列的集合。
本文使用的术语“特异性杂交”意指核酸与互补序列的核酸杂交。如本文所使用的,核酸分子的一部分可与另一核酸分子上的互补序列特异性杂交。即,对于待与另一分子“特异性杂交”的核酸序列部分来说,不一定需要全长的该序列进行杂交,例如,在分子的5’端可存在不杂交的一段核苷酸,而同一分子的3’端的一段核苷酸与另一分子特异性杂交。
在本文中可互换使用的多核苷酸或寡核苷酸的“部分”或“区域”是2个或更多个碱基的连续序列。在另一些实施方案中,区域或部分是至少约3、5、10、15、20、25个中任意个数的连续核苷酸。
本文使用的序列“突变”是指与参照序列相比目的序列中的任意序列改变。参照序列可以是野生型序列或希望与目的序列进行比较的序列。序列突变包括由诸如替换、缺失或插入的机制而引起的序列中的单核苷酸变化或多于一个核苷酸的改变。单核苷酸多态性(SNP)是本文使用的序列突变的一个实例。
“复合体”是包含例如多肽、核酸、引物等中的任意两种或更多种的分子组,将其组装以一起发挥进行特定反应(如引物延伸反应)的作用。例如,在本发明中,复合体可包含例如DNA模板链和与DNA链杂交的RNA引物。复合体可任选地包含延伸RNA引物的DNA聚合酶。复合体可能是稳定的或不稳定的,并且可被直接或间接检测到。例如,如本文所述,考虑反应的某些组分和反应产物的类型,可推断出复合体的存在。出于本发明的目的,复合体一般是关于最终扩增产物(即子链)形成的中间体。
本文使用的“切割”是指酶促消化,例如,RNA:DNA杂合体之RNA部分的酶促消化。
当例如第一核酸或引物的至少两个连续碱基可与第二核酸的至少一个子序列以反向平行缔合(antiparallelassociation)或杂交组合以形成双链体时,则核酸或引物与另一核酸“互补”。在一些实施方案中,例如引物和靶多核苷酸序列之间的互补不是100%完美的。
“引物延伸反应”是指这样的分子反应,其中核酸聚合酶将一个或更多个核苷酸以模板特异性方式添加到与靶多核苷酸序列杂交之引物的3’端,即,其中通过引物延伸反应产生的子链与靶多核苷酸序列互补。延伸不仅是指添加到引物3’端的第一个核苷酸,还包括由延伸的引物所形成的多核苷酸的任何进一步延伸。
本文使用的“随机引物”是这样的引物,其包含以随机引物的序列可与核酸样品(例如基因组DNA、RNA群等)的一个或更多个序列杂交(在给定的一组条件下)的统计期望(或经验观察)为基础的序列。随机引物的序列可以是或可以不是天然的,或者可存在或可不存在于目的样品的序列库(pool)中。在单一反应混合物中扩增多个不同子链一般但不一定采用具有多重性,优选大的多重性的随机引物。如本领域中公知的,“随机引物”也可以指这样的引物,其是总体被设计成与期望和/或相当多的靶序列杂交的引物群(多个随机引物)中的成员。随机引物可在模板核酸上的多个位点处进行杂交。使用随机引物提供了用于产生与靶多核苷酸互补之引物延伸产物的方法,其不需要预先知道靶标的确切序列。
“反应混合物”是在合适条件下反应以进行特定反应(如引物延伸反应)的组分(例如,一种或更多种多肽、核酸和/或引物)的集合。
本文中可互换使用的“终止多核苷酸序列”或“终止序列”是这样的多核苷酸序列,其通过转移(divert)或阻断子链进一步延伸超过靶多核苷酸序列上的特定位置来促进引物延伸反应的终止。终止序列包含一般在引物杂交位点的3’位与靶多核苷酸序列杂交的部分(或区域)。终止序列中能够与靶多核苷酸序列杂交的部分可涵盖或可不涵盖整个终止序列。例如,终止序列可以是例如在终止位点的5’位和引物杂交位点的3’位与模板核酸一般以高亲和力结合的寡核苷酸。可阻断或可不阻断其3’端通过DNA聚合酶进行的延伸。在引物延伸反应终止之前通过DNA聚合酶最后复制的靶多核苷酸的位点、点或区域即是“终止位点”或“终止点””。
应理解,本文所述的本发明的方面和实施方案包括“由方面和实施方案组成”和/或“基本上由方面和实施方案组成”。
除非另有指明,否则本文使用的没有数量词修饰的名词包括复数。
如本领域技术人员所理解的,本文提及“约”的值或参数包括(并且描述了)涉及该值或参数本身的实施方案。例如,提及“约X”的描述包括“X”的描述。
I.产生包含接头序列的单链多核苷酸的方法
在一个方面中,本申请提供了产生包含接头序列的单链多核苷酸的方法。
在一些实施方案中,所述方法使用不对称接头,即,具有不同序列的接头。使所述接头与DNA片段连接,以使得至少一些DNA片段在一端包含第一接头并且在另一端包含第二接头。然后,选择包含这两种接头的DNA片段。本文所述的不对称接头使得能够确定多核苷酸的方向,其尤其简化了序列分析的过程。在一些实施方案中,接头之一包含与用于单链多核苷酸扩增的引物互补的识别序列,从而允许同时选择包含接头的DNA片段并扩增所选多核苷酸以产生单链多核苷酸。所述单链多核苷酸扩增方法允许靶DNA的高精确扩增。因此,本申请提供了同时允许核酸测序的有效性、灵敏度和精确度的简单且便捷的方法。
因此,在一些实施方案中,提供了产生包含不对称接头序列的单链多核苷酸的方法,其包括:i)使一个或更多个DNA片段与以下接头连接:a)包含标签的第一接头,和b)包含识别序列的第二接头;ii)基于标签的存在选择包含所述第一接头的DNA片段;以及iii)使用包含RNA的引物并使所述引物与所述识别序列杂交通过单链多核苷酸扩增来扩增步骤ii)中选择的DNA片段,从而选择性扩增包含所述第二接头的DNA片段。
在一些实施方案中,提供了产生包含不对称接头序列的单链多核苷酸的方法,其包括:i)使一个或更多个DNA片段与以下接头连接:a)包含标签的第一接头,和b)包含识别序列的第二接头;ii)基于标签的存在选择包含所述第一接头的DNA片段;iii)使用包含RNA的引物并使所述引物与所述识别序列杂交来扩增步骤ii)中选择的DNA片段,从而选择性扩增包含所述第二接头的DNA片段,其中如下扩增所述DNA片段:a)在包含待扩增DNA片段的复合体中延伸包含RNA的引物,以及b)用从RNA/DNA杂合体切割RNA的酶切割引物的RNA部分,以使得另一包含RNA的引物与DNA片段杂交并通过链置换来重复引物延伸。
在一些实施方案中,提供了产生包含不对称接头序列的单链多核苷酸的方法,其包括:i)使一个或更多个DNA片段与以下接头连接:a)包含标签的第一接头,和b)包含识别序列的第二接头;ii)基于标签的存在选择包含所述第一接头的DNA片段;iii)使包含RNA的引物与选择的包含所述第二接头的DNA片段上的识别序列退火;iv)在包含待扩增DNA片段的复合体中延伸所述包含RNA的引物;以及v)用从RNA/DNA杂合体切割RNA的酶切割引物的RNA部分,以使得另一包含RNA的引物与DNA片段杂交并通过链置换来重复引物延伸。
在一些实施方案中,一个或更多个DNA片段由双链靶DNA产生。双链靶DNA可以是基因组DNA、通过引物延伸反应产生的DNA、eDNA、线粒体DNA、叶绿体DNA、质粒DNA、细菌人工染色体、酵母人工染色体或其组合。
在一些实施方案中,双链靶DNA存在于样品中。在一些实施方案中,样品是组织样品。在一些实施方案中,样品是体液样品。在一些实施方案中,样品是肿瘤样品。在一些实施方案中,样品获自患有癌症的个体。在一些实施方案中,样品在产生用于本文所述方法的DNA片段之前进行处理。在一些实施方案中,样品直接用于产生用于本文所述方法的DNA片段。
在一些实施方案中,样品是组织样品。在一些实施方案中,样品是提取自组织样品的多核苷酸。在一些实施方案中,样品是单个细胞。在一些实施方案中,样品是提取自单个细胞的多核苷酸。
在一些实施方案中,双链靶DNA以不多于约500ng的量存在于样品中。在一些实施方案中,每份样品包含至少约1pg、10pg、100pg、1ng、10ng、20ng、30ng、40ng、50ng、60ng、75ng、100ng、150ng、200ng、250ng、300ng、400ng、500ng、1μg、1.5μg、2μg或更多的多核苷酸物质。在一些实施方案中,样品包含不多于约1pg、10pg、100pg、1ng、10ng、20ng、30ng、40ng、50ng、60ng、75ng、100ng、150ng、200ng、250ng、300ng、400ng、500ng、1μg、1.5μg或2μg的多核苷酸物质。
DNA片段可以以多种方式产生。例如,可通过超声波和/或用一种或更多种酶(其可包括DNaseI、Fragmentase及其变体)在适于所述一种或更多种酶产生随机双链核酸断裂的条件下处理来使双链靶DNA片段化。在一些实施方案中,片段化包括用一种或更多种限制性内切核酸酶处理双链靶DNA。所产生片段的平均长度可为约50至约10,000个核苷酸,例如平均长度为约100至约10,000个核苷酸或约500至约25,000个核苷酸。
本文所述接头可以是单链的、双链的或部分双链体。一般来说,部分双链体接头包含一个或更多个单链区域和一个或更多个双链区域。双链接头可包含两条彼此杂交的单独寡核苷酸,并且杂交可留下一个或更多个平端、一个或更多个3’突出端、一个或更多个5’突出端、由错配和/或未配对核苷酸产生的一个或更多个凸起(bulge)或者其任意组合。在一些实施方案中,单链接头包含能够彼此杂交的两个或更多个序列。当单链接头中包含两条这样的可杂交序列时,杂交产生发夹结构(发夹接头)。当两个杂交区域彼此被不可杂交区域分开时,产生了“泡状物(bubble)”。
用于连接两条多核苷酸的方法在本领域中是已知的,包括但不限于酶促方法和非酶促方法(例如,化学方法)。非酶促连接反应的实例包括美国专利No.5,780,613和5,746,930中描述的非酶促连接技术。在一些实施方案中,通过连接酶(如DNA连接酶或RNA连接酶)使接头与多核苷酸片段连接。多种连接酶(其各自具有特征性的反应条件)在本领域中是已知的,包括但不限于NDA+-依赖性连接酶,包括tRNA连接酶、TaqDNA连接酶;ATP-依赖性连接酶,例如T4RNA连接酶、T4DNA连接酶、T3DNA连接酶、T7DNA连接酶、PfuDNA连接酶、DNA连接酶I、DNA连接酶III、DNA连接酶IV;及其基因工程变体。连接可在具有互补突出端的多核苷酸之间或在两个平端之间进行。一般来说,在连接反应中使用5’磷酸盐。5’磷酸盐可由多核苷酸片段、接头或二者提供。5’磷酸盐可根据需要添加到待连接的多核苷酸中或从其中移除。
除了在下文进一步详细描述的标签和识别序列外,第一接头和第二接头还可包含一个或更多个核酸结合位点(例如,用于连接至测序平台,如用于大规模平行测序的流动池,例如由Illumina,Inc.所开发)、一个或更多个随机或近随机(near-random)序列(例如,随机选自一个或更多个位置处的两个或更多个不同核苷酸之组的一个或更多个核苷酸)或者其组合。
本发明方法使用包含标签的第一接头。所述标签使得包含所述第一接头的核酸能够被识别并且能够将其与不含所述第一接头的核酸分开。在某些情况下,标签与配体特异性结合,从而有利于将连接有标签的分子与不含标签的分子分开。示例性的标签/配体对包括但不限于:抗体/抗原、抗原/抗体、抗生物素蛋白/生物素、生物素/抗生物素蛋白、链霉亲和素/生物素、生物素/链霉亲和素、谷胱甘肽/GST、GST/谷胱甘肽、麦芽糖结合蛋白/直链淀粉、直链淀粉/麦芽糖结合蛋白、纤维素结合蛋白和纤维素、纤维素/纤维素结合蛋白等。在一些实施方案中,标签是抗体的表位,例如,his标签或FLAG标签。在一些实施方案中,标签是生物素,并且包含生物素的核酸序列可通过使用其配体抗生物素蛋白或链霉亲和素进行选择。
在一些实施方案中,标签是将其与其他核酸序列区分开的核酸标签序列,并且具有第一接头(其包含核酸标签序列)的多核苷酸可使用与核酸标签序列互补的核酸进行选择。
标签可与第一接头缀合,或者当标签是核酸标签序列时,其可以是第一接头核酸序列的一部分。当标签是与第一接头缀合的分子时,标签分子可直接或间接地与第一接头上的任何核酸残基缀合。例如,在一些实施方案中,标签与第一接头一条链的5’端缀合。在一些实施方案中,标签与第一接头一条链的3’端缀合。在一些实施方案中,标签与第一接头的内部核酸残基缀合。在一些实施方案中,可从核酸残基上切下标签,以使得可在分离步骤后将所述标签移除。
当标签是核酸标签序列时,其可存在于第一接头核酸序列的5’端、3’端或内部区域中。
在一些实施方案中,使用识别标签的配体来选择包含标签的多核苷酸。可使配体与支持材料(直接或间接)偶联,进而为分离由配体识别的包含标签的多核苷酸提供物理或化学手段。
在一些实施方案中,支持材料是固体支持物。例如,配体可直接或间接地与板、管、瓶、烧瓶、磁珠、磁片、多孔基体或任何固体表面等偶联。可用于连接配体与固体支持物的试剂或分子包括但不限于凝集素、抗生物素蛋白/生物素、无机或有机连接分子。物理分离可例如通过过滤、离析(isolation)、磁场、离心、洗涤等来实现。
在一些实施方案中,固体支持物是珠、膜、筒(cartridge)、过滤器、微量滴定板、试管、固体粉末、铸造或挤出模制的模件、筛、纤维、磁性颗粒复合物或任何其他固体材料。固体支持物可涂布有物质如聚乙烯、聚丙烯、聚(4-甲基丁烯)、聚苯乙烯、聚丙烯酸酯、聚对苯二甲酸乙二醇酯、人造丝(rayon)、尼龙、聚(丁酸乙烯酯)、聚偏二氟乙烯(PCDF)、硅氧烷、聚甲醛、纤维素、乙酸纤维素、硝化纤维素等。在一些实施方案中,固体支持物可用配体涂布或可用配体浸渍。
另一些可用于本文所述方法的固体支持物包括但不限于明胶、玻璃、sepharose大珠、葡聚糖微载体如(Pharmacia,Uppsala,Sweden)。还考虑了多糖如琼脂糖(agrose)、藻酸盐、角叉菜聚糖、壳多糖、纤维素、葡聚糖或淀粉,聚丙烯酰胺,聚苯乙烯,聚丙烯醛,聚乙烯醇,聚甲基丙烯酸酯,全氟化碳,无机化合物如二氧化硅、玻璃、硅藻土、矾土、氧化铁或其他金属氧化物,或者由两种或更多种天然聚合物、合成聚合物或无机化合物的任意组合组成的共聚物。在一些实施方案中,固体支持物是柱(例如,Sepharose柱)。
一旦选择了包含含有标签之第一接头的核酸序列,就可使用包含与第二接头上的识别序列杂交之RNA部分的引物如下所述地对其进行单链多核苷酸扩增。因为仅包含第二接头的核酸序列被扩增,所以扩增步骤还构成了允许选择含有第一接头和第二接头二者的多核苷酸的第二选择步骤。
在一些实施方案中,在将DNA片段的一条链用作单链多核苷酸扩增的模板之前,将其与其互补链物理分开。例如,当标签的配体固定在固体支持物上时,可使结合的核酸变性,而不含标签的互补链可从固体支持物洗脱。然后可使洗脱的包含第一接头序列但是不含标签的链进行单链多核苷酸扩增方法。或者,可使结合至固体支持物的核酸链进行单链多核苷酸扩增方法。
第二接头包含可用于引物杂交的识别序列,其进而是单链多核苷酸扩增所需的。识别序列通常但不一定为约5至约200个核苷酸长,包括例如约5至约10、约10至约15、约15至约20、约20至约25、约25至约30、约30至约35、约35至约40、约40至约45、或约45至约50、约50至约100、约100至约200个核苷酸长。在一些实施方案中,引物是RNA引物。在一些实施方案中,引物是RNA/DNA复合引物,并且RNA/DNA嵌合体引物的RNA部分可以是任意的以下长度:引物全长的30%、40%、50%、60%、70%、80%、90%或更长。
在一些实施方案中,本申请还提供了通过使用具有5’或3’突出端的接头制备单链多核苷酸的方法。用限制性内切核酸酶切割的双链靶DNA产生5’或3’突出端。因此,具有与所述5’或3’突出端互补的5’或3’突出端的接头可选择性地与DNA片段的一端连接,从而允许通过使用与接头上的识别序列杂交的引物对DNA片段进行定向扩增。
因此,在一些实施方案中,提供了由双链靶DNA产生包含接头序列的单链多核苷酸的方法,其包括:i)用限制性内切核酸酶切割双链靶DNA以产生具有5’或3’突出端的DNA片段;ii)使所述DNA片段与接头连接,所述接头包含:a)与所述DNA片段的5’或3’突出端互补的单链5’或3’突出端和b)识别序列;以及iii)使用包含RNA的引物并使所述引物与所述识别序列杂交通过单链多核苷酸扩增来扩增与所述接头连接的DNA片段。
在一些实施方案中,提供了由双链靶DNA产生包含接头序列的单链多核苷酸的方法,其包括:i)用限制性内切核酸酶切割所述双链靶DNA以产生具有5’或3’突出端的DNA片段;ii)使所述DNA片段与接头连接,所述接头包含:a)与所述DNA片段的5’或3’突出端互补的单链5’或3’突出端和b)识别序列;以及iii)使用包含RNA的引物并使所述引物与所述识别序列杂交来扩增与所述接头连接的DNA片段,其中如下扩增所述DNA片段:a)在包含待扩增DNA片段的复合体中延伸所述包含RNA的引物,以及b)用从RNA/DNA杂合体切割RNA的酶切割引物的RNA部分,以使得另一包含RNA的引物与DNA片段杂交并通过链置换来重复引物延伸。
在一些实施方案中,提供了由双链靶DNA产生包含接头序列的单链多核苷酸的方法,其包括:i)用限制性内切核酸酶切割双链靶DNA以产生具有5’或3’突出端的DNA片段;ii)使所述DNA片段与接头连接,所述接头包含:a)与所述DNA片段的5’或3’突出端互补的单链5’或3’突出端和b)识别序列;iii)使包含RNA的引物与包含接头的DNA片段上的识别序列退火;iv)在包含待扩增DNA片段的复合体中延伸所述包含RNA的引物;以及v)用从RNA/DNA杂合体切割RNA的酶切割引物的RNA部分,以使得另一包含RNA的引物与DNA片段杂交并通过链置换来重复引物延伸。
在一些实施方案中,预先选择限制位点。通过仔细检查靶DNA上的限制位点并仔细选择限制性内切核酸酶,将能够选择性地扩增DNA片段的一条链。在产生单链多核苷酸之后,可使用经仔细选择以拉下(pulldown)目的多核苷酸的探针对目的多核苷酸进一步富集。
本文还提供了使用本文所述方法产生的单链多核苷酸。因此,例如,在一些实施方案中,提供了这样的单链多核苷酸,其包含:1)包含标签的第一接头;和2)包含识别序列的第二接头。
在一些实施方案中,还提供了使用通过本文所述方法产生的单链多核苷酸产生包含接头序列的多核苷酸文库的方法。
在一些实施方案中,提供了使用通过本文所述方法产生的单链多核苷酸产生阵列(例如,微阵列)的方法。
II.单链多核苷酸扩增
本文所述的单链多核苷酸可由单链或双链DNA或RNA产生。该方法一般包括使用包含RNA部分的引物。在一些实施方案中,引物是RNA引物。在一些实施方案中,引物是DNA/RNA复合引物。使用DNA/RNA引物的单链多核苷酸扩增方法在美国专利NO.6,692,918中进行了描述并在下文中进一步描述。使用RNA引物的单链多核苷酸扩增方法在本文中以及名称为“Single-StrandPolynucleotideAmplificationMethods”之代理人案号70178-30003.00的临时申请中(其与本申请同时提交并通过引用并入本文)进行了描述。
一般来说,扩增方法如下进行:使包含RNA的引物与DNA模板杂交。使用聚合酶(例如,DNA聚合酶)通过延伸引物来实现模板序列的拷贝。从RNA/DNA杂合体切割RNA的酶(例如,RNaseH)从所述杂合体切割(移除)RNA序列,在模板链上留下可用于结合另一引物的序列。由聚合酶(例如,DNA聚合酶)产生另一条链,其置换之前复制的链,产生经置换的延伸产物。
在一些实施方案中,所述方法包括:a)在复合体中延伸包含RNA的引物,所述复合体包含:i)待扩增DNA片段和ii)包含RNA的引物,其中使所述包含RNA的引物与所述待扩增DNA片段杂交;以及b)用从RNA/DNA杂合体切割RNA的酶切割引物的RNA部分,以使得另一包含RNA的引物与DNA片段杂交并通过链置换来重复引物延伸;从而产生单链多核苷酸的多个拷贝。
引物(例如,复合引物或RNA引物)的总长度可以为约10至约40个核苷酸,包括例如约15至约30个核苷酸、约20至约25个核苷酸。在一些实施方案中,引物的长度为至少约10、15、20、25个核苷酸的任意个数。在一些实施方案中,引物的长度不大于约25、30、40或50个核苷酸的任意个数。为了实现杂交(如本领域中公知且理解的,其依赖于另一些因素如离子强度和温度),引物与第二接头的识别部分至少约60%、70%、75%、80%、85%、90%或95%互补。
在一些实施方案中,本文中所述的扩增方法使用DNA聚合酶。在一些实施方案中,DNA聚合酶是能够使核酸引物沿着至少主要由脱氧核糖核苷酸构成的核酸模板延伸的DNA聚合酶。聚合酶应能够从与所置换链结合的多核苷酸置换核酸链,并且一般来说,表现出更大链置换能力(即,与不具有同样链置换能力的其他聚合酶相比)的聚合酶是优选的。在一些实施方案中,DNA聚合酶对于在与核酸链杂交之寡核苷酸的3’端的结合具有高亲和力。在一些实施方案中,DNA聚合酶不具备基本的切口产生(nicking)活性。在一些实施方案中,所述聚合酶具有很少或不具有5’->3’外切核酸酶活性,以使得引物或引物延伸多核苷酸的降解最小化。一般来说,这种外切核酸酶活性取决于诸如pH、盐浓度等因素,所有的这些因素都是本领域的技术人员所熟悉的。其中已缺失5’->3’外切核酸酶活性的突变DNA聚合酶在本领域中是已知的,并且适用于本文所述的扩增方法。用于本发明方法和组合物的合适DNA聚合酶包括美国专利No.5,648,211和5,744,312中公开的那些,其包括exo-Vent(NewEnglandBiolabs)、exo-DeepVent(NewEnglandBiolabs)、Bst(BioRad)、exo-Pfu(Stratagene)、Bca(Panvera)、测序级Taq(Promega)和来自热硫化氢高温厌氧杆菌(thermoanaerobacterthermohydrosulfuricus)的热稳定DNA聚合酶。在一些实施方案中,DNA聚合酶以以下发生率从模板核酸置换引物延伸产物:在聚合酶与引物延伸产物5’端之间发生接触的至少约25%,更优选至少约50%,甚至更优选至少约75%,并且最优选至少约90%的发生率。在一些实施方案中,使用具有链置换活性的热稳定DNA聚合酶。这样的聚合酶在本领域中是已知的,例如美国专利No.5,744,312(及其中所引用的参考文献)中所述的。优选地,DNA聚合酶具有很少或没有校正活性。在一些实施方案中,DNA聚合酶选自链置换DNA聚合酶、高保真DNA聚合酶、具有校正活性的聚合酶、T7DNA聚合酶和大肠杆菌DNA聚合酶I。
在一些实施方案中,从RNA/DNA杂合体切割RNA的酶是切割核糖核苷酸的核糖核酸酶,而不管邻近待切割核糖核苷酸之核苷酸的种类和类型。在一些实施方案中,所述酶不依赖于序列种类进行切割。用于本发明方法和组合物的合适核糖核酸酶的实例在本领域中是公知的,包括核糖核酸酶H(RNaseH)。
适用于进行本文所述方法的反应组分和条件是允许核酸扩增的那些。这样的组分和条件是本领域技术人员已知的并且在多个公开中进行了描述,例如美国专利No.5,679,512和PCT公开No.WO99/42618。例如,缓冲液可以是Tris缓冲液,但是也可使用其他缓冲液,只要缓冲液组分对本发明方法中的酶组分没有抑制作用即可。pH可以为约5至约11,例如约6至约10、约7至约9、约7.5至约8.5、或约8.5。反应混合物还可包含二价金属离子,例如Mg2+或Mn2+,其游离离子的终浓度为约0.01至约10mM,包括例如约1至约5mM。反应混合物还可包含对介质总离子强度作出贡献的其他盐,例如KCI。例如,盐(如KCI)为约0至约100mM,包括约0至约75mM,例如约0至约50mM。反应混合物还可包含单链DNA结合蛋白,例如,其可包含3μgT4gp32(USB)。反应混合物还可包含添加剂,所述添加剂可影响扩增反应性能但不是所述方法中酶组分的活性所必需的。这样的添加剂包括蛋白质(例如BSA)和非离子型去污剂(如NP40或Triton)。还可包含能够维持酶活性的另外的试剂如DTT;例如,可包含浓度为约1至约5mM的DTT。这样的试剂在本领域中是已知的。
适当时,还可包含不抑制所述方法中所采用之RNase的活性的RNase抑制剂(例如,Rnasine)。反应可在恒温下或变动温度下发生。在一些实施方案中,反应等温地进行,这避免了繁琐的热循环过程。在允许本发明寡核苷酸(引物、TSO、阻断序列和/或PTO)与模板多核苷酸杂交并不大幅抑制所采用酶之活性的温度下进行扩增反应。所述温度可以为约25℃至约85℃,包括例如约30℃至约75℃、约37℃至约70℃、或约55℃。在一些实施方案中,在约25℃至约85℃、约30℃至约75℃和约37℃至约70℃的温度下进行反应。
首先,可使包含引物、探针和样品的反应混合物变性(通过在95℃下孵育约2分钟至约5分钟),并且使引物与靶标退火(在55℃下持续约5分钟)。
可提供量为约50μM至约2500μM、约100μM至约2000μM、约500μM至约1700μM或约800μM至约1500μM的核苷酸和/或核苷酸类似物(如脱氧核糖核苷三磷酸),其可用于合成本发明方法中的引物延伸产物。脱氧核糖核苷三磷酸(dNTP)可以以例如约250μM至约500μM的浓度使用。在一些实施方案中,包含这样的核苷酸或核苷酸类似物,其在引物延伸链中的存在增强了该链的置换(例如,通过引起比常规AT、CG碱基配对弱的碱基配对)。这样的核苷酸或核苷酸类似物包括脱氧肌苷和其他经修饰的碱基,其全部在本领域中是已知的。提供量为约0.25mM至约6mM、约0.5mM至约5mM、约0.75mM至约4mM或约1mM至约3mM的核苷酸和/或类似物(如核糖核苷三磷酸),其可用于合成本发明方法中的RNA转录物。
本发明扩增反应中的寡核苷酸组分一般超过待扩增靶核酸序列的数目。其可以以约或至少约以下任意量提供:靶核酸量的10、102、104、106、108、1010、1012倍。引物(复合引物或RNA引物)可以以约或至少约以下任意浓度提供:50nM、100nM、500nM、1000nM、2500nM、5000nM。
在一个实施方案中,在扩增过程起始时同时添加前述组分。在另一个实施方案中,根据扩增反应所需要和/或允许的,在扩增过程期间的合适时间点之前或之后以任意顺序添加所述组分。这样的时间点可由本领域技术人员容易地确定。可在核酸变性步骤之前、变性步骤之后或引物与靶DNA杂交之后将用于根据本发明方法的核酸扩增的酶添加至反应混合物,如通过其热稳定性和/或本领域技术人员已知的其他考虑因素所确定。
可使扩增反应在不同时间点停止并在稍后重新开始。所述时间点可由本领域技术人员容易地确定。用于使反应停止的方法在本领域中是已知的,包括例如将反应混合物冷却至抑制酶活性的温度。使反应重新开始的方法在本领域中也是已知的,包括例如将反应混合物的温度升高至允许酶活性的温度。在一些实施方案中,在使反应重新开始之前、之时或之后补充一种或更多种反应组分。或者,可使反应不间断地进行(即,从开始到结束)。
III.富集目的多核苷酸的方法
本申请提供了分析靶多核苷酸的方法,所述靶多核苷酸包括RNA(例如,双链RNA和单链RNA)以及DNA(例如,双链DNA如基因组DNA)。所述方法一般包括使由所述靶多核苷酸扩增的单链多核苷酸群(例如,通过使用上述的单链多核苷酸扩增方法)与探针组相接触,从而富集包含可与探针杂交的一个或更多个区域的多核苷酸。本文所述的富集方法降低了待分析多核苷酸序列的复杂性,并且使得目的多核苷酸能够更好地呈现在库(pool)中。
因此,在一些实施方案中,所述方法包括:1)使由靶多核苷酸产生的单链多核苷酸群与可与靶多核苷酸上的一个或更多个区域杂交的探针组相接触;以及2)使与探针结合的多核苷酸与其余的多核苷酸分离,其中包含一个或更多个期望区域的多核苷酸被富集。
在一些实施方案中,使用包含RNA的引物通过单链多核苷酸扩增方法由靶多核苷酸产生单链多核苷酸群。在一些实施方案中,单链多核苷酸群包含一个或更多个接头序列,并且例如使用用于产生包含接头序列之单链多核苷酸的一种本文所述方法产生。
本文使用的探针可与任何目的区域杂交。在一些实施方案中,一个或更多个期望区域是癌基因所在的区域。在一些实施方案中,一个或更多个期望区域是其中一个或更多个突变所在的区域。在一些实施方案中,一个或更多个期望区域是其中一种或更多种多态性所在的区域。
探针的数目可基于样品材料的复杂性水平和期望测序的多核苷酸长度来选择。本文所述方法可使用单个寡核苷酸或多个(即,至少2、至少5、至少10、至少50、至少100、至少500、至少1000、至少10,000、至少100,000或更多个寡核苷酸的混合物)不同寡核苷酸来进行。这些寡核苷酸可用于富集多核苷酸序列上的多个(即,至少2、至少5、至少10、至少50、至少100、至少500、至少1000、至少10,000、至少100,000或更多个)不同区域。
本文所述方法中使用的探针可以是任意长度,包括但不限于约200至约500、约500至约1,000、约1,000至约2,000、约2,000至约5,000、约5,000至约10,000、约10,000至约20,000个核苷酸长。在一些实施方案中,提供探针以获得待富集的多核苷酸。例如,在一些实施方案中,探针是待富集多核苷酸的量的至少约以下任意倍数:10、102、103、104或更多倍。在一些实施方案中,探针不多于待富集多核苷酸的量的约10、102、103或104倍。
通过富集方法获得的复杂性降低的水平可使得初始多核苷酸库的复杂性能够降低10%、20%、30%、40%、50%、60%、70%、80%、90%、95%或99%,或者可涉及对仅很少百分比的多核苷酸或甚至几千个碱基对的选择。例如,当由基因组DNA产生初始多核苷酸库时,根据初始基因组的大小和所需的降低水平,多核苷酸的复杂性可从30亿个碱基对减少至1千万个碱基对或更少。使用这种方法,可从复杂群中快速且有效地移除高度重复的DNA序列,所述高度重复的DNA序列占人基因组DNA的例如40%。
IV.分析多核苷酸的方法
可进一步对使用本文所述方法产生的多核苷酸(例如,包含接头的单链多核苷酸和通过探针富集的多核苷酸)进行分析。分析可包括但不限于多核苷酸测序、突变分析、多态性确定等。本文所述方法特别地可用于鉴定多核苷酸样品中的突变、预测个体对药物的响应性、预测个体中药物的药代动力学、预测个体中治疗的治疗结果。所述方法还可用于遗传测试,例如,用于产前筛查的遗传测试。
多核苷酸可通过任何分析方法来进行分析,包括但不限于例如DNA测序(使用Sanger、焦磷酸测序或者Roche/454、Helicos、Illumina/Solexa和ABI(SOLID)的测序系统)、聚合酶链式反应测定、珠阵列测定、引物延伸测定、酶错配切割测定、分支杂交测定、NASBA测定、分子信标测定、循环探针测定、连接酶链式反应测定、侵入性切割结构测定、ARMS测定或夹心杂交测定。可测序或分析多核苷酸分子相对于参照序列之SNP或其他差异的存在。
在一些实施方案中,通过本文所述方法产生的多核苷酸可用于对包含两种或更多种SNP的染色体区进行NP单倍型分析,富集用于配对端测序方法的DNA序列,产生用于长阅读序列的靶片段,分离倒位、缺失和易位断裂点,对整个基因区域(外显子和内含子)进行测序以发现引起异常剪接或调控的突变,以及产生用于染色体成像(如Bionanomatrix、光学作图或基于纤维-FISH的方法)的长探针。
多态性,特别是单核苷酸多态性(“SNP”),基本上随机地分布在整个基因组中。多态性可以是任意长度序列的插入、缺失、重复或重排,包括单核苷酸缺失、插入、或碱基改变。多态性可以是天然的,或者其可与变体表型有关。使用本文所述方法,例如通过富集目的序列,允许在群体的不同个体中或者甚至在来自单一个体的不同样品中基本上可重复地获得复杂性基本类似降低的亚群。由于多态性基本上随机地分布在整个基因组中,因此复杂性降低的核酸序列群中将存在多种多态性序列。可对这种复杂性降低的亚群进行分析以鉴定多态性或确定亚群内多态性基因座的基因型。
本文所述方法还可用于例如药物基因组学的领域,其试图使多态性基因座的特定等位基因的知识与群体中个体响应于特定药物的方式相关联。粗略估计,对于每种药物,10%至40%的个体没有最佳响应。为了产生给定药物的响应谱,必须使接受所述药物的那些个体中关于多态性基因座的基因型与所述药物的治疗结果相关联。这通常通过对大量多态性基因座进行分析来进行。一旦通过分析群体中的多态性基因座估计了遗传药物响应谱,就能够确定临床患者关于与对特定药物的响应有关的那些基因座的基因型。因此,能够鉴定大量个体中的大量多态性基因座的序列对于建立药物响应谱和鉴定用于临床应用的个体基因型都很重要。
使用Illumina测序方法对使用本文所述方法产生的多核苷酸(例如,包含接头的单链多核苷酸和通过探针富集的多核苷酸)进行测序分析。Illumina测序方法包括桥式扩增技术,其中在SBS之前使用与固相结合的引物来延伸和扩增溶液相单链核酸(参见,例如Mercier等(2005)“SolidPhaseDNAAmplification:ABrownianDynamicsStudyofCrowdingEffects.”BiophysicalJournal89:32-42;Bing等(1996)“BridgeAmplification:ASolidPhasePCRSystemfortheAmplificationandDetectionofAllelicDifferencesinSingleCopyGenes.”ProceedingsoftheSeventhInternationalSymposiumonHumanIdentification.PromegaCorporationMadison,WI.)。
Illumina测序技术需要制备侧翼为配对端接头序列的单链核酸。每个配对端接头均包含独特的引物杂交序列。使核酸分布在包被有单链寡核苷酸的流动池(flowcell)表面上,所述单链寡核苷酸对应于单链核酸侧翼接头上存在的引物杂交序列。使接头连接的单链核酸与流动池表面结合并暴露于用于基于聚合酶之延伸的试剂。引发(prime)随着连接片段的游离端/远端与表面上的互补寡核苷酸“桥连”而发生,并且在退火步骤期间,来自一个结合引物的延伸产物与另一结合引物形成第二桥链。重复的变性和延伸导致了单个分子在数百万的独特位置中的局部扩增,从而跨流动池表面产生克隆“簇(cluster)”。
然后,将流动池放置在测序模块内的射流盒(fiuidicscassette)中,向其中添加引物、DNA聚合酶和荧光标记的可逆终止核苷酸(例如A、C、G和T),以允许将单个核苷酸并入每个簇的每个克隆DNA中。在每个并入步骤之后,对整个流动池进行高分辨率成像以鉴定流动池上每个簇位置处并入的核苷酸。在成像步骤之后,进行化学步骤以使并入的核苷酸的3’端解封闭(deblock),以允许随后并入另一核苷酸。进行重复循环(iterativecycle)以产生一系列图像,每张图像表示特定簇上的单碱基延伸。该系统通常产生多至20至50个核苷酸的序列读取。关于这种测序系统的更多细节在例如Bennett等(2005)“Towardthe1,000dollarshumangenome.”Pharmacogenomics6:373-382;Bennett,S.(2004)“SolexaLtd.”Pharmacogenomics5:433-438;和Bentley,D.R.(2006)“Wholegenomere-sequencing.”CurrOpinGenetDev16:545-52中进行了讨论。
制备用于Illumina系统的模板的第一阶段是通过雾化使DNA片段化。然而,所产生片段的宽的尺寸分布是不经济的,因为在雾化之后,可用于后续模板制备步骤的20至200个片段占总DNA的约10%。而且,在雾化之后约一半的DNA汽化(vaporize),意味着仅5%的原始DNA用于制备测序模板。另外,在测序反应之前,将在桥式扩增期间形成的克隆簇中50%的DNA链(例如具有游离5’端的链)除去。
本文提供的方法可容易地适用于Illumina平台。特别地,本文所述的接头序列理想地适合于Illumina测序方法的目的。
在一些实施方案中,使用单分子实时测序来分析通过本文所述方法产生的多核苷酸。单分子实时测序(singlemoleculereal-timesequencing,SMRT)是另一种大规模并行测序技术,其可用于以高通量方式对环化单链核酸进行测序。由PacificBiosciences开发并商业化的SMRT技术依赖于多重零模式波导(ZMW)的阵列,其中例如数千个测序反应可同时发生。ZMW是产生这样的发光观察体积的结构,所述体积小到足以观察例如单链DNA分子通过单一DNA聚合酶的模板依赖性合成(参见,例如Levene等(2003)“ZeroModeWaveguidesforSingleMoleculeAnalysisatHighConcentrations,”Science299:682-686)。当DNA聚合酶将互补的荧光标记核苷酸并入正在合成的DNA链中时,该酶将每一核苷酸在检测体积中保持数十毫秒,例如比未并入核苷酸扩散进出检测体积所用时间量长几个数量级。在此期间,荧光团发射荧光,其颜色对应于核苷酸碱基的种类。然后,作为核苷酸并入循环的一部分,聚合酶将之前使荧光团保持在适当位置的键切割,并且染料从检测体积扩散出来。在并入后,信号立即返回基线并重复该过程。ZWE及其在单分子分析(例如SMRT测序)中的应用的另外的描述可在例如公开的美国专利申请No.2003/0044781和美国专利No.6,917,726中找到,其各自出于所有目的通过引用以其整体并入本文。还参见Levene等(2003)“ZeroModeWaveguidesforsingleMoleculeAnalysisatHighConcentrations,”Science299:682-686和Eid,等(2009)“Real-TimeDNASequencingfromSinglePolymeraseMolecules.”Science323:133-138。
通过本文所述方法产生的多核苷酸可适用于SMRT测序平台。例如,在合成之后,可使用催化单链DNA片段之分子内连接的酶(例如,CircLigaseTM、CircLigaseTMII或ThermoPhageTM)使单链多核苷酸环化,并将其分配到ZMW。或者,可在环化之前使子链片段化。任选地,可在环化之前从片段化子链群富集目的序列,例如如上所述。
在一些实施方案中,分析包括突变分析(包括例如可通过本领域中已知的任意方法进行的突变分析),包括DNA测序、变性HPLC、电泳检测和构象差异研究。
IV.本申请的方法
在一个方面中,本申请提供了分析靶多核苷酸上的一个或更多个期望区域的方法,其中所述一个或更多个期望区域可与探针组杂交,所述方法包括:1)使由所述靶多核苷酸产生的单链多核苷酸群与探针组相接触;2)使与探针结合的多核苷酸与其余的多核苷酸分离,其中包含一个或更多个期望区域的多核苷酸被富集;以及3)分析分离的多核苷酸。
在一些实施方案中,提供了分析靶多核苷酸上的一个或更多个期望区域的方法,其中所述一个或更多个期望区域可与探针组杂交,所述方法包括:1)通过单链多核苷酸扩增来扩增所述靶多核苷酸,以产生单链多核苷酸群;2)使所述单链多核苷酸群与探针组相接触;3)使与探针结合的多核苷酸与其余的多核苷酸分离,其中包含一个或更多个期望区域的多核苷酸被富集;以及4)分析分离的多核苷酸。
在一些实施方案中,提供了分析靶多核苷酸上的一个或更多个期望区域的方法,其中所述一个或更多个期望区域可与探针组杂交,所述方法包括:1)使用包含RNA的引物通过单链多核苷酸扩增来扩增所述靶多核苷酸,以产生单链多核苷酸群;2)使所述单链多核苷酸群与探针组相接触;3)使与探针结合的多核苷酸与其余的多核苷酸分离,其中包含一个或更多个期望区域的多核苷酸被富集;以及4)分析分离的多核苷酸。
在一些实施方案中,提供了分析靶多核苷酸上的一个或更多个期望区域的方法,其中所述一个或更多个期望区域可与探针组杂交,所述方法包括:1)在复合体中延伸包含RNA的引物,所述复合体包含所述靶多核苷酸和所述包含RNA的引物,其中所述包含RNA的引物与所述靶多核苷酸杂交,2)用从RNA/DNA杂合体切割RNA的酶切割引物的RNA部分,以使得另一包含RNA的引物与DNA片段杂交并通过链置换来重复引物延伸,从而产生单链多核苷酸群;3)使所述单链多核苷酸群与探针组相接触;4)使与探针结合的多核苷酸与其余的多核苷酸分离,其中包含一个或更多个期望区域的多核苷酸被富集;以及4)分析分离的多核苷酸。
在一些实施方案中,靶多核苷酸是双链DNA(例如,基因组DNA)。例如,在一些实施方案中,提供了分析个体基因组DNA上一个或更多个期望区域的序列的方法,其包括:1)使基因组DNA片段化以产生DNA片段;2)使所述DNA片段与包含标签的第一接头和包含识别序列的第二接头连接;3)使所述DNA片段进行选择过程,所述选择过程允许基于标签的存在选择包含所述第一接头的DNA片段;4)使用包含RNA并与所述识别序列杂交的引物通过单链多核苷酸扩增来扩增包含所述第一接头的DNA片段,从而产生单链多核苷酸群;5)使所述单链多核苷酸群与可与一个或更多个期望区域杂交的探针组相接触;6)使与探针结合的多核苷酸与其余的单链多核苷酸分离,其中包含一个或更多个期望区域的多核苷酸被富集;以及7)分析分离的多核苷酸分子的序列。
在一些实施方案中,提供了分析个体基因组DNA上一个或更多个期望区域的序列的方法,其包括:1)用限制性内切核酸酶切割基因组DNA以产生具有5’或3’突出端的DNA片段;2)使所述DNA片段与接头连接,所述接头包含:a)与所述5’或3’突出端互补的序列和b)识别序列;3)使用包含RNA部分的引物并使所述引物与所述识别序列杂交来扩增DNA的一条链(例如,通过单链多核苷酸扩增),从而产生单链多核苷酸群;4)使所述单链多核苷酸群与可与一个或更多个期望区域杂交的探针组相接触;5)使与探针结合的多核苷酸与其余的单链多核苷酸分离,其中包含一个或更多个期望区域的多核苷酸被富集;以及6)分析分离的多核苷酸分子的序列。
在一些实施方案中,提供了分析双链DNA(例如,基因组DNA)的方法,其包括:i)使所述双链DNA片段化以产生DNA片段,ii)使一个或更多个DNA片段与以下接头连接:a)包含标签的第一接头,和b)包含识别序列的第二接头;iii)基于标签的存在选择包含所述第一接头的DNA片段;iv)使用包含RNA的引物并使所述引物与所述识别序列杂交通过单链多核苷酸扩增来扩增步骤iii)中选择的DNA片段,从而选择性扩增包含所述第二接头的DNA片段,从而产生单链多核苷酸群;以及v)分析单链多核苷酸。
在一些实施方案中,提供了分析双链DNA(例如,基因组DNA)的方法,其包括:i)使所述双链DNA片段化以产生DNA片段,ii)使一个或更多个DNA片段与以下接头连接:a)包含标签的第一接头,和b)包含识别序列的第二接头;iii)基于标签的存在选择包含所述第一接头的DNA片段;iv)使用包含RNA的引物并使所述引物与所述识别序列杂交通过单链多核苷酸扩增来扩增步骤iii)中选择的DNA片段,从而选择性扩增包含所述第二接头的DNA片段,从而产生单链多核苷酸群;以及v)分析单链多核苷酸,其中如下扩增DNA片段:a)在包含待扩增DNA片段的复合体中延伸包含所述RNA的引物(例如,通过使用DNA聚合酶),以及b)用从RNA/DNA杂合体切割RNA的酶(例如RNaseH)切割引物的RNA部分,以使得另一包含RNA的引物与DNA片段杂交并通过链置换来重复引物延伸。
在一些实施方案中,提供了分析双链DNA(例如,基因组DNA)的方法,其包括:i)使所述双链DNA片段化以产生DNA片段,ii)使一个或更多个DNA片段与以下接头连接:a)包含标签的第一接头,和b)包含识别序列的第二接头;iii)基于标签的存在选择包含所述第一接头的DNA片段;iii)使包含RNA的引物与所选择的包含所述第二接头之DNA片段的识别序列退火;iv)在包含待扩增DNA片段的复合体中延伸所述包含RNA的引物;v)用从RNA/DNA杂合体切割RNA的酶切割引物的RNA部分,以使得另一包含RNA的引物与DNA片段杂交并通过链置换来重复引物延伸,从而产生单链多核苷酸群;以及vi)分析单链多核苷酸。
在一些实施方案中,提供了分析双链DNA(例如,基因组DNA)的方法,其包括:i)使所述双链DNA片段化以产生DNA片段,ii)使一个或更多个DNA片段与以下接头连接:a)包含标签的第一接头;和b)包含识别序列的第二接头;iii)基于标签的存在选择包含所述第一接头的DNA片段;iii)使包含RNA的引物与所选择的包含所述第二接头之DNA片段的识别序列退火;iv)在包含待扩增DNA片段的复合体中延伸所述包含RNA的引物,v)用从RNA/DNA杂合体切割RNA的酶切割引物的RNA部分,以使得另一包含RNA的引物与DNA片段杂交并通过链置换来重复引物延伸,从而产生单链多核苷酸群;vi)使所述单链多核苷酸群与探针组相接触;vii)使与探针结合的多核苷酸与其余多核苷酸分离;以及viii)分析分离的多核苷酸。
在一些实施方案中,提供了分析双链DNA(例如,基因组DNA)的方法,其包括:i)用限制性内切核酸酶切割双链靶DNA以产生具有5’或3’突出端的DNA片段;ii)使所述DNA片段与接头连接,所述接头包含:a)与所述DNA片段的5’或3’突出端互补的单链5’或3’突出端和b)识别序列;以及iii)使用包含RNA的引物并使所述引物与所述识别序列杂交通过单链多核苷酸扩增来扩增与接头连接的DNA片段,从而产生单链多核苷酸群;以及v)分析单链多核苷酸。
在一些实施方案中,提供了分析双链DNA(例如,基因组DNA)的方法,其包括:i)用限制性内切核酸酶切割双链靶DNA以产生具有5’或3’突出端的DNA片段;ii)使所述DNA片段与接头连接,所述接头包含:a)与所述DNA片段的5’或3’突出端互补的单链5’或3’突出端和b)识别序列;以及iii)使用包含RNA的引物并使所述引物与所述识别序列杂交通过单链多核苷酸扩增来扩增与接头连接的DNA片段,从而产生单链多核苷酸群;以及v)分析单链多核苷酸,其中如下扩增DNA片段:a)在包含待扩增DNA片段的复合体中延伸包含RNA的引物(例如通过DNA聚合酶)以及b)用从RNA/DNA杂合体切割RNA的酶(例如RNaseH)切割引物的RNA部分,以使得另一包含RNA的引物与DNA片段杂交并通过链置换来重复引物延伸。
在一些实施方案中,提供了分析双链DNA(例如,基因组DNA)的方法,其包括:i)用限制性内切核酸酶切割双链靶DNA以产生具有5’或3’突出端的DNA片段;ii)使所述DNA片段与接头连接,所述接头包含:a)与所述DNA片段的5’或3’突出端互补的单链5’或3’突出端和b)识别序列;iii)使包含RNA的引物与包含接头之DNA片段的识别序列退火;iv)在包含待扩增DNA片段的复合体中延伸所述包含RNA的引物;v)用从RNA/DNA杂合体切割RNA的酶切割引物的RNA部分,以使得另一包含RNA的引物与DNA片段杂交并通过链置换来重复引物延伸,从而产生单链多核苷酸群;以及vi)分析单链多核苷酸。
在一些实施方案中,提供了分析双链DNA(例如,基因组DNA)的方法,其包括:i)用限制性内切核酸酶切割双链靶DNA以产生具有5’或3’突出端的DNA片段;ii)使所述DNA片段与接头连接,所述接头包含:a)与所述DNA片段的5’或3’突出端互补的单链5’或3’突出端和b)识别序列;iii)使包含RNA并与所述识别序列杂交的引物与包含接头的DNA片段退火;iv)在包含待扩增DNA片段的复合体中延伸所述包含RNA的引物;v)用从RNA/DNA杂合体切割RNA的酶切割引物的RNA部分,以使得另一包含RNA的引物与DNA片段杂交并通过链置换来重复引物延伸,从而产生单链多核苷酸群;vi)使所述单链多核苷酸群与探针组相接触;vii)使与探针结合的多核苷酸与其余的多核苷酸分离;以及viii)分析分离的多核苷酸。
待通过任意本文所述方法分析的多核苷酸可存在于样品中,例如人样品。在一些实施方案中,样品是组织样品。在一些实施方案中,样品是提取自组织样品的多核苷酸。在一些实施方案中,样品是单个细胞。在一些实施方案中,样品是提取自单个细胞的多核苷酸。
本文所述方法还可用于任意一种包括但不限于以下的多核苷酸分析方法:测序多核苷酸、确定多核苷酸中是否存在突变、分析多核苷酸的多态性。
本文所述方法可用于分析来自个体的多核苷酸样品,其可用于包括但不限于以下的目的:1)诊断个体中的疾病(例如癌症)、2)评估个体中发生疾病(例如,癌症)的风险、3)确定个体对治疗方案(例如,癌症治疗)的响应性、4)评价治疗(例如癌症治疗)对个体的效力、5)确定个体的持续治疗(例如癌症治疗)、以及6)预测个体对治疗方案(例如癌症)的响应性。
IV.试剂盒、组合物、试剂和制品
本文中还提供了可用于本文所述方法的试剂盒、试剂和制品。
在一些实施方案中,提供了这样的接头对,其包含含有标签的第一接头和含有识别序列的第二接头。在一些实施方案中,接头对存在于同一组合物中。在一些实施方案中,接头对存在于不同的组合物中。
在一些实施方案中,提供了包含多个多核苷酸片段的组合物,每个多核苷酸片段均在一端包含第一接头并在第二端包含第二接头,其中所述第一接头包含标签,并且其中所述第二接头包含识别序列。在一些实施方案中,组合物中的多核苷酸片段来源于来自不同样品的不同靶核苷酸。这样的组合物可用于例如多重多核苷酸测序。多核苷酸可以是本文所述的单链多核苷酸或者由所述单链多核苷酸产生。在一些实施方案中,提供了多核苷酸文库,其中每个多核苷酸均包含含有标签的第一接头和含有识别序列的第二接头。在一些实施方案中,提供了多核苷酸阵列(例如微阵列),其中每个多核苷酸均包含含有标签的第一接头和含有识别序列的第二接头。
在一些实施方案中,提供了可用于产生包含接头的多核苷酸片段的试剂盒。在一些实施方案中,试剂盒包含第一接头和第二接头。在一些实施方案中,试剂盒还包含引物(例如,RNA引物或DNA/RNA复合引物)。在一些实施方案中,提供了这样的试剂盒,其包含:i)包含标签的第一接头;ii)包含识别序列的第二接头,和iii)与所述识别序列杂交的引物(例如,包含RNA的引物,例如RNA引物或DNA/RNA复合引物)。在一些实施方案中,试剂盒还包含与标签结合的配体。在一些实施方案中,试剂盒还包含固体支持物。在一些实施方案中,试剂盒还包含以下中的一种或更多种:1)DNA连接酶、2)DNA聚合酶(例如,DNA依赖性DNA聚合酶和/或RNA依赖性DNA聚合酶)、3)DNA内切核酸酶、4)DNA激酶、5)DNA外切核酸酶、6)DNA内切核酸酶、7)包含RNaseH活性的酶和8)适用于试剂盒中包含的一种或更多种要素的一种或更多种缓冲剂。在一些实施方案中,试剂盒还包含固体支持物(例如,磁珠)。
在一些实施方案中,试剂盒包含从RNA/DNA杂合体切割RNA的酶,包括但不限于RNaseH或RNaseI。在一些实施方案中,试剂盒还包含DNA聚合酶,例如选自以下的DNA聚合酶:链置换DNA聚合酶、高保真DNA聚合酶、具有校正活性的聚合酶、T7DNA聚合酶和大肠杆菌DNA聚合酶。在一些实施方案中,试剂盒包含DNA连接酶。在一些实施方案中,试剂盒包含适用于任意一种本文所述反应(即连接、单链多核苷酸扩增和富集等)的缓冲剂。这些组分可以以单独试剂盒提供或者可与本文中所述接头和引物一起提供。
在一些实施方案中,试剂盒还包含一种或更多种探针,例如本文所述的任意探针。在一些实施方案中,试剂盒包含至少约50、至少约100、至少约150或更多种探针。探针可以以单独试剂盒提供或者可与本文所述接头和引物或其他试剂一起提供。
本文所述试剂盒还可包含用于使用该试剂盒的组分来实践本发明方法的说明书。用于实践本发明方法的说明书一般记录在合适的记录介质上。例如,说明书可印刷在承印物(substrate)(如纸或塑料等)上。因此,说明书可作为包装插页、试剂盒或其组分的容器的标签(即,与包装或分包装联合)等存在于试剂盒中。在一些实施方案中,说明书作为电子存储数据文件存在于合适的计算机可读存储介质(如CD-ROM、磁盘等)上。在又一些实施方案中,试剂盒中不存在实际说明书,而是提供了用于从远程资源获得说明书的手段,例如通过互联网。该实施方案的一个实例是包含可查看说明书和/或下载说明书之网址的试剂盒。与说明书一样,将这种用于获得说明书的手段记录在合适的承印物上。
试剂盒的多种组分可在单独容器中,其中所述容器可容纳在单个外壳(例如,盒子)中。
本文还提供了制备任意本文所述制品的方法。
实施例
以下是本发明方法和组合物的实施例。应理解,考虑上文提供的一般性描述,可实践多种其他实施方案。
实施例1:
本实施例提供了使用不对称接头方法处理基因组DNA以用于DNA测序的一种示例性方法。图1提供了该方法的流程图。
实施例2:
本实施例提供了使用限制性酶消化方法处理基因组DNA以用于DNA测序的一种示例性方法。图2提供了该方法的流程图。

Claims (37)

1.产生包含不对称接头序列的单链多核苷酸的方法,其包括:
i)使一个或更多个DNA片段与以下接头连接:a)包含标签的第一接头,和b)包含识别序列的第二接头;
ii)基于所述标签的存在选择包含所述第一接头的DNA片段;
iii)使用包含RNA的引物并使所述包含RNA的引物与所述识别序列杂交通过单链多核苷酸扩增来扩增步骤ii)中选择的DNA片段,从而选择性扩增包含所述第二接头的DNA片段。
2.根据权利要求1所述的方法,其中通过使双链靶DNA片段化来产生所述一个或更多个DNA片段。
3.根据权利要求1或权利要求2所述的方法,其中在使步骤ii)中选择的DNA片段的一条链与其互补链物理分离之后,将这条链用作用于所述单链多核苷酸扩增的模板。
4.由双链靶DNA产生包含接头序列的单链多核苷酸的方法,其包括:
i)用限制性内切核酸酶切割所述双链靶DNA以产生具有5’或3’突出端的DNA片段;
ii)使所述DNA片段与接头连接,所述接头包含:a)与所述DNA片段的5’或3’突出端互补的单链5’或3’突出端,和b)识别序列;以及
iii)使用包含RNA的引物并使所述包含RNA的引物与所述识别序列杂交通过单链多核苷酸扩增来扩增与所述接头连接的DNA片段。
5.根据权利要求4所述的方法,其中在使与所述接头连接的DNA片段进一步片段化之后,对其进行单链多核苷酸扩增。
6.根据权利要求1至5中任一项所述的方法,其还包括由所述单链多核苷酸制备多核苷酸文库。
7.根据权利要求1至6中任一项所述的方法,其还包括将所述单链多核苷酸固定在固体支持物上。
8.根据权利要求1至7中任一项所述的方法,其还包括分析所述单链多核苷酸。
9.分析靶多核苷酸上的一个或更多个期望区域的方法,其中所述一个或更多个期望区域可与探针组杂交,所述方法包括:
1)使由所述靶多核苷酸产生的单链多核苷酸群与所述探针组相接触;
2)使与所述探针结合的多核苷酸与其余的多核苷酸分离,其中包含所述一个或更多个期望区域的多核苷酸被富集;以及
3)分析分离的多核苷酸。
10.根据权利要求9所述的方法,其中由所述靶多核苷酸如下产生所述单链多核苷酸群:使用包含RNA的引物和由所述靶多核苷酸产生的DNA片段作为模板通过单链多核苷酸扩增进行。
11.根据权利要求9至10中任一项所述的方法,其中所述一个或更多个期望区域是癌基因所在的区域。
12.根据权利要求9至11中任一项所述的方法,其中所述探针组包含至少约10种不同的多核苷酸探针。
13.根据权利要求12所述的方法,其中多核苷酸探针组包含至少约50种不同的多核苷酸探针。
14.根据权利要求9至13中任一项所述的方法,其中所述靶多核苷酸是RNA。
15.根据权利要求9至13中任一项所述的方法,其中所述靶多核苷酸是双链DNA。
16.根据权利要求9至15中任一项所述的方法,其中通过根据权利要求1至8中任一项所述的方法产生所述单链多核苷酸群。
17.根据权利要求2至8和15至16中任一项所述的方法,其中所述双链DNA是基因组DNA。
18.根据权利要求8至17中任一项所述的方法,其中所述分析包括多核苷酸测序。
19.根据权利要求1至8和9至18中任一项所述的方法,其中所述单链多核苷酸扩增包括:
a)在复合体中延伸所述包含RNA的引物,所述复合体包含:
i)待扩增的DNA片段、和
ii)所述包含RNA的引物,其中所述包含RNA的引物与所述待扩增的DNA片段杂交;以及
b)用从RNA/DNA杂合体切割RNA的酶切割所述引物的RNA部分,以使得另一包含RNA的引物与所述DNA片段杂交并通过链置换来重复引物延伸;
从而产生单链多核苷酸的多个拷贝。
20.根据权利要求1至19中任一项所述的方法,其中所述单链多核苷酸扩增包括使用RNA引物。
21.根据权利要求1至19中任一项所述的方法,其中所述单链多核苷酸扩增包括使用DNA-RNA复合引物。
22.根据权利要求19至21中任一项所述的方法,其中所述延伸通过选自以下的DNA聚合酶进行:链置换DNA聚合酶、高保真DNA聚合酶、具有校正活性的聚合酶、T7DNA聚合酶和大肠杆菌(E.coli)DNA聚合酶。
23.根据权利要求19至22中任一项所述的方法,其中所述从RNA/DNA杂合体切割RNA的酶是RNaseH或RNaseI。
24.试剂盒,其包含:i)包含标签的第一接头;和b)包含识别序列的第二接头;和iii)与所述识别序列杂交的引物。
25.根据权利要求24所述的试剂盒,其还包含与所述标签结合的配体。
26.根据权利要求25所述的试剂盒,其还包含固体支持物。
27.根据权利要求24至26中任一项所述的试剂盒,其中所述引物包含RNA。
28.根据权利要求27所述的试剂盒,其中所述引物是RNA引物。
29.根据权利要求27所述的试剂盒,其中所述引物是DNA/RNA复合引物。
30.根据权利要求24至29中任一项所述的试剂盒,其中所述引物为约5至约30个核苷酸。
31.根据权利要求24至30中任一项所述的试剂盒,其还包含从RNA/DNA杂合体切割RNA的酶。
32.根据权利要求31所述的试剂盒,其中所述酶是RNaseH或RNaseI。
33.根据权利要求24至32中任一项所述的试剂盒,其还包含DNA聚合酶。
34.根据权利要求33所述的试剂盒,其中所述DNA聚合酶选自链置换DNA聚合酶、高保真DNA聚合酶、具有校正活性的聚合酶、T7DNA聚合酶和大肠杆菌DNA聚合酶。
35.根据权利要求24至34中任一项所述的试剂盒,其还包含DNA连接酶。
36.根据权利要求24至35中任一项所述的试剂盒,其还包含一种或更多种探针。
37.根据权利要求24至36中任一项所述的试剂盒,其还包含用于实施根据权利要求1至23中任一项所述方法的说明书。
CN201380070084.XA 2012-12-03 2013-12-02 核酸制备和分析的组合物和方法 Pending CN105189780A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261732823P 2012-12-03 2012-12-03
US61/732,823 2012-12-03
PCT/US2013/072705 WO2014088979A1 (en) 2012-12-03 2013-12-02 Compositions and methods of nucleic acid preparation and analyses

Publications (1)

Publication Number Publication Date
CN105189780A true CN105189780A (zh) 2015-12-23

Family

ID=50883907

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380070084.XA Pending CN105189780A (zh) 2012-12-03 2013-12-02 核酸制备和分析的组合物和方法

Country Status (5)

Country Link
US (1) US20150275285A1 (zh)
EP (1) EP2925893A4 (zh)
CN (1) CN105189780A (zh)
HK (1) HK1217518A1 (zh)
WO (1) WO2014088979A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106103742A (zh) * 2015-01-06 2016-11-09 深圳市海普洛斯生物科技有限公司 一种富集循环肿瘤dna的方法和试剂
CN108517349A (zh) * 2017-02-24 2018-09-11 考利达基因组股份有限公司 基于杂交的钩连接方法
CN109477245A (zh) * 2016-04-15 2019-03-15 美纳里尼硅生物系统股份公司 生成用于大规模平行测序的dna文库的方法和试剂盒
CN110997935A (zh) * 2017-05-16 2020-04-10 剑桥表现遗传学有限公司 表观遗传修饰的检测

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201617643D0 (en) * 2016-10-18 2016-11-30 Oxford University Innovation Limited Method for complete. uniform and specific amplification of ultra-low amounts of input DNA
US10711269B2 (en) * 2017-01-18 2020-07-14 Agilent Technologies, Inc. Method for making an asymmetrically-tagged sequencing library
CN113166742A (zh) * 2018-10-24 2021-07-23 华盛顿大学 用于消耗和富集核酸序列的方法和试剂盒

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020106649A1 (en) * 1999-04-06 2002-08-08 Yale University Fixed address analysis of sequence tags
CN1373812A (zh) * 1999-09-13 2002-10-09 纽亘技术公司 用于多核苷酸序列线性等温扩增的方法及组合物
EP1997889A2 (en) * 2003-01-29 2008-12-03 454 Corporation Method for preparing single-stranded dna libraries

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6197557B1 (en) * 1997-03-05 2001-03-06 The Regents Of The University Of Michigan Compositions and methods for analysis of nucleic acids
CA2365135C (en) * 1999-03-19 2009-08-18 Takara Shuzo Co., Ltd. Method for amplifying nucleic acid sequence
US6692918B2 (en) * 1999-09-13 2004-02-17 Nugen Technologies, Inc. Methods and compositions for linear isothermal amplification of polynucleotide sequences
US7323306B2 (en) * 2002-04-01 2008-01-29 Brookhaven Science Associates, Llc Genome signature tags
US20070141604A1 (en) * 2005-11-15 2007-06-21 Gormley Niall A Method of target enrichment
WO2008045575A2 (en) * 2006-10-13 2008-04-17 J. Craig Venter Institute, Inc. Sequencing method
DE102008061772A1 (de) * 2008-12-11 2010-06-17 Febit Holding Gmbh Verfahren zur Untersuchung von Nukleinsäure-Populationen
EP2580378A4 (en) * 2010-06-08 2014-01-01 Nugen Technologies Inc MULTIPLEX SEQUENCING METHODS AND COMPOSITION
WO2012103154A1 (en) * 2011-01-24 2012-08-02 Nugen Technologies, Inc. Stem-loop composite rna-dna adaptor-primers: compositions and methods for library generation, amplification and other downstream manipulations
CA2852949A1 (en) * 2011-10-19 2013-04-25 Nugen Technologies, Inc. Compositions and methods for directional nucleic acid amplification and sequencing

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020106649A1 (en) * 1999-04-06 2002-08-08 Yale University Fixed address analysis of sequence tags
CN1373812A (zh) * 1999-09-13 2002-10-09 纽亘技术公司 用于多核苷酸序列线性等温扩增的方法及组合物
EP1997889A2 (en) * 2003-01-29 2008-12-03 454 Corporation Method for preparing single-stranded dna libraries

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106103742A (zh) * 2015-01-06 2016-11-09 深圳市海普洛斯生物科技有限公司 一种富集循环肿瘤dna的方法和试剂
CN106103742B (zh) * 2015-01-06 2019-12-10 深圳市海普洛斯生物科技有限公司 一种富集循环肿瘤dna的方法和试剂
CN109477245A (zh) * 2016-04-15 2019-03-15 美纳里尼硅生物系统股份公司 生成用于大规模平行测序的dna文库的方法和试剂盒
CN108517349A (zh) * 2017-02-24 2018-09-11 考利达基因组股份有限公司 基于杂交的钩连接方法
CN108517349B (zh) * 2017-02-24 2023-03-03 深圳华大智造科技股份有限公司 基于杂交的钩连接方法
CN110997935A (zh) * 2017-05-16 2020-04-10 剑桥表现遗传学有限公司 表观遗传修饰的检测

Also Published As

Publication number Publication date
WO2014088979A1 (en) 2014-06-12
EP2925893A4 (en) 2016-09-07
US20150275285A1 (en) 2015-10-01
EP2925893A1 (en) 2015-10-07
HK1217518A1 (zh) 2017-01-13

Similar Documents

Publication Publication Date Title
CN105026576A (zh) 单链多核苷酸扩增方法
US20190024141A1 (en) Direct Capture, Amplification and Sequencing of Target DNA Using Immobilized Primers
EP2970951B1 (en) Methods for nucleic acid sequencing
CN102575293B (zh) 用于核酸特异性分析的探针
WO2020056381A9 (en) PROGRAMMABLE RNA-TEMPLATED SEQUENCING BY LIGATION (rSBL)
US20140162278A1 (en) Methods and compositions for enrichment of target polynucleotides
CN105189780A (zh) 核酸制备和分析的组合物和方法
KR20190034164A (ko) 단일 세포 전체 게놈 라이브러리 및 이의 제조를 위한 조합 인덱싱 방법
US20140024541A1 (en) Methods and compositions for high-throughput sequencing
CN115516109A (zh) 条码化核酸用于检测和测序的方法
KR20150119047A (ko) 폴리뉴클레오티드 바코드 생성
KR20170020704A (ko) 개별 세포 또는 세포 개체군으로부터 핵산을 분석하는 방법
CN105102633A (zh) 包含基因组DNA和cDNA两者的总核酸的富集和新一代测序
US20140024536A1 (en) Apparatus and methods for high-throughput sequencing
WO2011049955A1 (en) Deducing exon connectivity by rna-templated dna ligation/sequencing
CN105209639B (zh) 在固相载体扩增核酸的方法
JP2022503873A (ja) インデックス及びバーコードを使用してアレイ上のリガンドを識別するための方法及び組成物
CN114729349A (zh) 条码化核酸用于检测和测序的方法
US20070148636A1 (en) Method, compositions and kits for preparation of nucleic acids

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1217518

Country of ref document: HK

WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20151223

WD01 Invention patent application deemed withdrawn after publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1217518

Country of ref document: HK