CN110468179A

CN110468179A - 选择性扩增核酸序列的方法

Info

Publication number: CN110468179A
Application number: CN201810440061.8A
Authority: CN
Inventors: 文路; 汤富酬; 任杰; 刘晓萌
Original assignee: Peking University
Current assignee: Peking University
Priority date: 2018-05-10
Filing date: 2018-05-10
Publication date: 2019-11-19
Anticipated expiration: 2038-05-10
Also published as: CN110468179B

Abstract

本发明涉及选择性扩增核酸序列的方法，该方法包括：a.提供在一端包含第一共同序列的多种不同的核酸分子，任选地，多种不同的核酸分子各自还包含与第一共同序列邻接的标签序列，b.将核酸分子与一种或多种引物T2杂交，一种或多种引物T2各自包含位于3’的外侧靶向序列，在聚合酶和核苷酸的存在下延伸引物T2，任选重复这样的杂交和延伸一次或多次，从而获得包含位于3’的第一共同序列互补序列的延伸链，任选地，在聚合酶和核苷酸的存在下使用针对第一共同序列互补序列的引物合成延伸互补链，c.修剪延伸链中的引物T2和任选延伸互补链中的引物T2的互补链，d.将第二共同序列连接至延伸链的5’端或延伸互补链的3’端，和e.任选地，扩增步骤d的产物。

Description

选择性扩增核酸序列的方法

发明领域

本发明涉及核酸扩增领域。具体地，本发明涉及选择性扩增核酸序列的方法，所述方法包括：

a.提供在一端包含第一共同序列的多种不同的核酸分子，任选地，所述多种不同的核酸分子各自还包含与所述第一共同序列邻接的标签序列，

b.将所述核酸分子与一种或多种引物T2杂交，所述一种或多种引物T2各自包含位于3’的外侧靶向序列，

在聚合酶和核苷酸的存在下延伸所述引物T2，

任选重复这样的杂交和延伸一次或多次，

从而获得包含位于3’的第一共同序列互补序列的延伸链，

任选地，在聚合酶和核苷酸的存在下使用针对所述第一共同序列互补序列的引物合成延伸互补链，

c.修剪延伸链中的引物T2和任选延伸互补链中的引物T2的互补链，

d.将第二共同序列连接至所述延伸链的5’端或延伸互补链的3’端，和

e.任选地，扩增步骤d的产物。

发明背景

核酸扩增和所得扩增产物的分析革新了基础和临床科学。这些技术的应用包括分子克隆、核酸测序、基因分型、单核苷酸多态性(SNP)、甲基化和其它多态性及突变的检测和鉴定以及基因表达的定量。

已经发展了多种用于核酸扩增的方法，如链置换扩增、基于转录的扩增和聚合酶链式反应(PCR)。

PCR在大规模研究项目和临床中的应用会产生伴随大量PCR扩增子的生成的多种不同靶序列的扩增。随着项目规模的增加，单独实施所需反应变得成本高昂且效率低下。因此，发展使用通用模板和试剂混合物在同一容器内平行实施多重扩增反应的方法具有重要意义。

多重PCR方法(其中使用多个靶标特异性引物对来扩增多个靶标)仅取得有限的成功。在同一试管中组合全部所需引物极大增加了引物-二聚体和其它副扩增产物生成的频率。由于多重PCR中引物对的增加，潜在引物-二聚体相互作用(或由两种不同引物所生成的假扩增子)的数目将根据使用引物的数目而指数性增加。

因此，现有技术中仍需要用于大量特异性核酸分子同时多重扩增的方法，所述方法能将副反应产物的共同扩增最小化。

DNA甲基化(DNA Methylation)是指DNA的胞嘧啶(C)被加上一个甲基而形成甲基胞嘧啶的化学修饰。它是哺乳动物基因组DNA上主要的表观遗传修饰，几乎全部发生于CpG二核苷酸上。CpG二核苷酸在基因组中并非随机分布：在正常人类成体细胞基因组中，一方面，零散分布于全基因组的CpG位点大多处于甲基化状态，而另一方面，高度聚集于被称为CpG岛(CpG island)的基因组区域的CpG位点则大多处于去甲基化状态。CpG岛主要位于基因启动子，DNA甲基化对于CpG岛的转录调控具有重要作用。去甲基化是CpG岛启动子转录活跃的先决条件，一旦发生甲基化，该区域将招募甲基化DNA结合蛋白和组蛋白脱乙酰酶等一系列因子导致转录沉默。CpG岛超甲基化和全基因组低甲基化是人类肿瘤的普遍现象，参与了肿瘤的发生发展。另外，DNA甲基化参与了多种生理过程的调控，包括X染色体失活、沉默转座子、基因印记、胚胎干细胞分化、生殖细胞发育和学习与记忆。关于其综述可参见Deaton and Bird，2011。

在现有的技术中，全基因组DNA甲基化检测成本非常高，单位点DNA甲基化检测信息量太少，因此需要发展有效的靶向检测方法。如果在亚硫酸氢盐处理之前进行靶向捕获，亚硫酸氢盐处理步骤会导致样本的大量损失，如果在亚硫酸氢盐处理之后进行捕获，步骤繁琐，需要解决甲基化的异质性问题，而且如何捕获高度片段化的DNA样本是一个技术挑战；很多临床样本，如循环游离DNA和甲醛-石蜡固定样本已经是高度片段化，因此技术难度更大。

因此，目前仍然缺乏一种操作简便、精确度高、设计灵活、成本低的靶向DNA甲基化富集检测方法。

发明概述

在一个方面，本发明涉及选择性扩增核酸序列的方法，所述方法包括：

在聚合酶和核苷酸的存在下延伸所述引物T2，

任选重复这样的杂交和延伸一次或多次，

从而获得包含位于3’的第一共同序列互补序列的延伸链，

e.任选地，扩增步骤d的产物。

在具体的实施方案中，提供在一端包含第一共同序列的多种不同的核酸分子的步骤包括：将包含核酸分子的核酸样品与引物T1杂交，所述引物T1包含位于5’的第一共同序列，任选地，所述引物T1还包含在所述第一共同序列的3’的标签序列，在聚合酶和核苷酸的存在下延伸所述引物T1，和任选重复这样的杂交和延伸一次或多次。

在具体的实施方案中，所述引物T1是随机引物。在具体的实施方案中，所述引物T1包含位于3’的用于靶向非独特性核酸序列的靶向序列。在具体的实施方案中，所述非独特性核酸序列是基因组重复序列。在具体的实施方案中，所述非独特性核酸序列是含CpG的序列。

在具体的实施方案中，提供在一端包含第一共同序列的多种不同的核酸分子的步骤包括将第一共同序列和任选标签序列连接至核酸分子的一端。

在具体的实施方案中，通过DNA连接酶或转座酶将第一共同序列和任选标签序列连接至核酸分子的一端。

在具体的实施方案中，方法还包括在步骤a或b之后将来自多于一个核酸样品的核酸分子合并在一起。优选地，来自同一核酸样品的核酸分子具有相同的标签序列。

在具体的实施方案中，在步骤a之前，核酸分子经修饰剂处理，以便将核酸分子中的胞嘧啶转换，而5’甲基胞嘧啶不变。在具体的实施方案中，所述修饰剂为亚硫酸氢盐。

在具体的实施方案中，步骤d包括以下子步骤：d1.将一种或多种靶向探针与步骤b的产物杂交，所述一种或多种靶向探针各自包含位于5’的内侧靶向序列和位于3’的第二共同序列互补序列，并且在杂交后所述位于3’的第二共同序列互补序列位于杂交的延伸链的5’端，d2.在连接酶的存在下将第二共同序列连接在杂交的延伸链的5’端或将第二共同序列连接在杂交的延伸互补链的3’端。

可选地，在具体的实施方案中，步骤c包括以下子步骤：d1.将一种或多种靶向探针与步骤b的产物杂交，所述一种或多种靶向探针各自包含位于5’的第二共同序列互补序列和位于3’的内侧靶向序列，并且在杂交后所述位于5’的第二共同序列互补序列位于杂交的延伸互补链的3’端，d2.在连接酶的存在下将第二共同序列连接在杂交的延伸链的5’端或将第二共同序列连接在杂交的延伸互补链的3’端。

在具体的实施方案中，步骤c的修剪使得延伸链中的引物T2和任选延伸互补链中的引物T2的互补链保留不多于3个核苷酸。

在具体的实施方案中，步骤c的修剪使得延伸链中的引物T2和任选延伸互补链中的引物T2的互补链被完全去除。

在具体的实施方案中，一种或多种引物T2具有合成核苷酸类似物以允许对其修剪。

在具体的实施方案中，一种或多种引物T2包含尿嘧啶以替换胸腺嘧啶。

在具体的实施方案中，一种或多种引物T2各自还包含位于5’的限制性酶切位点。

在具体的实施方案中，所述修剪包括使用识别限制性酶切位点的限制性内切酶消化步骤b的产物，从而获得经限制性消化的产物。

在具体的实施方案中，限制性内切酶选自AcuI,AlwI,BbsI,BbvI,BccI,BceAI,BciVI,BfuAI,BmrI,BpmI,BpuEI,BsaI,BseRI,BsgI,BspMI,BspQI,BsmAI,BsmBI,BsmFI,BspCNI,BtgZI,EarI,EciI,EcoP15I,FauI,FokI,HphI,HpyAV,HaeIII,HgaI,HinfI,MboII,MlyI,MmeI,MnlI,NmeAIII,PleI,SfaNI。在优选的实施方案中，限制性内切酶选自AcuI,BceAI,BpmI,BpuEI,BseRI,BsgI,BsmFI,BtgZI,EciI,EcoP15I,FokI,HphI,MboII,MmeI和NmeAIII。

在具体的实施方案中，一种或多种引物T2各自还包含第三共同序列，

在具体的实施方案中，方法还包括在步骤c之前使用针对第三共同序列和第一共同序列互补序列的引物扩增步骤b的产物。

在具体的实施方案中，一种或多种引物T2的外侧靶向序列各自包含靶向非独特性核酸序列的序列或靶向独特性核酸序列的序列。

在具体的实施方案中，非独特性核酸序列是基因组重复序列。

在具体的实施方案中，非独特性核酸序列是含CpG的序列。

在具体的实施方案中，靶向非独特性核酸序列的序列为CpG短串联序列，CpG短串联序列为长度大于或等于7个核苷酸，且3’端起前7个核苷酸中包含2个或3个CpG。在优选的实施方案中，3’端起前10个核苷酸中C与G之和大于或等于7个。

在具体的实施方案中，靶向非独特性核酸序列的序列选自CGCGCGG，CGGCGGCGG，CGCGCGA，CGCGCGT和CGACGACGA。

在具体的实施方案中，核酸分子在步骤a之前经修饰剂处理，以便将核酸分子中的胞嘧啶转换，而5’甲基胞嘧啶不变。在具体的实施方案中，修饰剂为亚硫酸氢盐。

在具体的实施方案中，第二共同序列包含保护基。在具体的实施方案中，方法还包括在步骤d之后和任选的步骤e之前使外切核酸酶与步骤c的产物接触，以降解非期望的核酸分子。

在具体的实施方案中，方法还包括在步骤b、c、d和/或e之后的回收步骤，以分离获得的产物。

在具体的实施方案中，方法还包括对选择性扩增的核酸序列进行测序。

在其它方面，本发明还涉及试剂盒，其包含用于执行本文所述的方法所需的一种或多种试剂。

附图说明

图1：本发明的核酸扩增方法的一个具体实施方案。

图2：本发明的核酸扩增方法的一个具体实施方案。

发明详述

本发明具有许多优选实施方案，并且本发明的技术细节依赖于本领域技术人员已知的许多专利、申请案和其他参考文献。因此，当在下文中引用或重复专利、申请案或其他参考文献时，应当理解，其全部内容通过引用并入本文。

除非另有说明，否则本发明的实践可以使用在本领域技术范围内的有机化学、聚合物技术、分子生物学(包括重组技术)、细胞生物学、生物化学和免疫学的常规技术和描述。这样的常规技术包括聚合物阵列合成、杂交、连接和使用标记的杂交检测。可以通过参考下文的实施例来获得适当技术的具体说明。但是，当然也可以使用其他等效的常规程序。这样的常规技术和描述可以在标准的实验室手册中找到，例如Genome Analysis:ALaboratory Manual Series(Vols.I-IV)，Using Antibodies:A Laboratory Manual，Cells:A Laboratory Manual，PCR Primer:A Laboratory Manual，and MolecularCloning:A Laboratory Manual(all from Cold Spring Harbor Laboratory Press)，Stryer，L.(1995)Biochemistry(4th Ed.)Freeman，New York，Gait，“OligonucleotideSynthesis:A Practical Approach”1984，IRL Press，London，Nelson and Cox(2000)，Lehninger，Principles of Biochemistry 3^rd Ed.，W.H.Freeman Pub.，New York，N.Y.andBerg et al.(2002)Biochemistry，5^thEd.，W.H.Freeman Pub.，New York，N.Y.，所有这些文献出于所有目的通过引用整体并入本文。

核酸序列和核酸分子

本文所述的方法可用于扩增核酸序列。通常，核酸序列可以在核酸分子中找到。如本文所用，术语“核酸”与“核酸分子”可互换使用，其可以是任何类型的核酸，例如核酸可以是脱氧核糖核酸(DNA)、核糖核酸(RNA)或由核苷酸类似物制成的DNA或RNA的类似物，其可以与“多核苷酸”互换使用。核酸分子可以是单链的、双链的或含有单链和双链序列两者。核酸分子可以是基因组的核酸或细胞外游离核酸。核酸分子可以来自含有核酸分子的任何样品。核酸分子可以来自人，动物，植物，微生物或病毒。在优选的实施方案中，核酸分子来自人类样品。样品可以是新鲜的，来自考古或法医样品，或来自保存的样品如石蜡包埋的组织。所述样品可以是实体组织或生理流体，如血液，血清，血浆，唾液，眼睛晶状体液，脑脊髓液，汗液，尿液，乳汁，腹水，淋巴液，粘液，滑液，腹膜液，或羊水。可以使用本领域技术人员熟知的方法从样品制备核酸分子(参见例如Sambrook等人(1989)“Molecular Cloning：ALaboratory Manual”，2nd Ed.，Cold Spring Harbor Laboratory Press，Cold SpringHarbor)。或者，可以直接使用含有核酸分子的样品。

如本文所用，术语“基因组的核酸”指细胞中的核酸，它可以是基因组本身的核酸，也可以是从基因组衍生(例如转录)的核酸。基因组的核酸还指提供病毒信息的病毒核酸。基因组的核酸可以包含或可以是例如但不限于DNA，RNA，诸如cDNA、mRNA、miRNA、circRNA或tRNA等。基因组的核酸的优选的类型是存在于真核细胞的细胞核中的核酸。基因组的核酸可以是双链或单链、或部分双链、或部分单链或发夹分子。基因组的核酸可以是完整的或片段化的(例如利用限制性内切酶消化、超声、剪切力或本领域已知的其他方法来进行片段化)。在某些情况下，基因组的核酸可包括来自单个基因的全部或一部分的序列或来自多个基因的序列、来自一个或更多个染色体的序列或来自细胞所有染色体的序列。

如本文所用，术语“细胞外游离核酸”是指存在于细胞外的核酸，例如存在于循环系统(例如，血液或血液制品例如血浆)中的核酸。细胞外游离核酸可通过从细胞直接分泌、通过细胞坏死或通过细胞凋亡进入细胞外环境。细胞外游离核酸可以包含或可以是例如但不限于DNA，RNA，诸如cDNA、mRNA、miRNA、circRNA或tRNA等。细胞外游离核酸可以是双链或单链、或部分双链、或部分单链或发夹分子。细胞外游离核酸通常是核酸片段(例如约100-200个核苷酸，特别是约160个核苷酸)。在某些情况下，细胞外游离核酸可包括来自单个基因的全部或一部分的序列或来自多个基因的序列或来自一个或更多个染色体的序列。

核酸分子可以是从成熟信使RNA合成的DNA，RNA或互补DNA(cDNA)序列。如果核酸分子是RNA，则可以使用本领域技术人员公知的方法将RNA逆转录为DNA。在一个优选的实施方案中，核酸分子是DNA。

如本文针对核酸序列(包括核酸分子、引物和探针等)所使用的，“5’”和“3’”用于指示核酸序列的方向。如本领域所熟知的，提及核酸单链的5’端通常是指核酸单链中戊糖的C-5’位置未形成磷酸二酯键的末端核苷酸，核酸单链的3’端通常是指核酸单链中戊糖的C-3’位置未形成磷酸二酯键的末端核苷酸。因此，核酸单链的5’到3’方向也就是核酸单链中戊糖的C-5’位置未形成磷酸二酯键的末端核苷酸到戊糖的C-3’位置未形成磷酸二酯键的末端核苷酸的方向。如果核酸序列为双链，则核酸序列的“5’”和“3’”通常是指该核酸序列的正义链的“5’”和“3’”，但在一些情况下，也可以指该核酸序列的反义链的“5’”和“3’”。

在一些实施方案中，核酸分子可以用修饰剂处理，以便将核酸分子中的胞嘧啶转换，而5’甲基胞嘧啶不变。修饰剂可以例如选自亚硫酸氢盐、乙酸盐或柠檬酸盐，优选地，修饰剂是亚硫酸氢盐。可以使用本领域技术人员熟知的方法用亚硫酸氢盐处理核酸分子，并且可以使用市售试剂按照制造商的方案进行，例如使用MethylCode BisulfiteConversion Kit(Invitrogen)、EZ DNA methylation-Gold Kit(ZYMO)或EpiTectBisulfite Kit(Qiagen)等。

在一些实施方案中，用于本发明的合适量的核酸分子可以是或小于10、9、8、7、6、5、4、3、2、1、0.5、0.1、0.05、0.01、0.005、0.001μg或更少。在优选的实施方案中，适合于本发明的核酸分子的量可以是或小于1000、900、700、500、300、100、70、50、20、10、1、0.5、0.1ng或更少。

在一端包含第一共同序列的多种不同的核酸分子

本文所述的方法通常涉及提供在一端包含第一共同序列的多种不同的核酸分子。

如本文所用，“在一端包含第一共同序列的多种不同的核酸分子”意指多个各自包含不同的靶核酸序列的核酸分子，并且这些核酸分子各自的至少一端被人工引入一段在序列上相同的核酸序列(被称为第一共同序列)。如本文所用，“不同的核酸分子”意指包含不同的靶核酸序列的核酸分子。核酸分子可以仅在一个末端上包含第一共同序列，也可以在两个末端上都包含第一共同序列。

提供在一端包含第一共同序列的多种不同的核酸分子的方法可以是任何合适的方法。这样的方法包括但不限于引物扩增、连接反应、限制性内切酶消化、单链特异性核酸外切酶消化等(可参见例如US2010129874A1)。

在一些实施方案中，这样的方法可以包括使用各自靶向不同靶核酸序列的多种引物来从核酸模板产生多种不同的核酸分子，所述引物包含位于5’的第一共同序列，从而将第一共同序列引入到扩增产物中。核酸模板可以是基因组的核酸或细胞外游离核酸。

在另外的实施方案中，这样的方法可以包括使用靶向非独特性核酸序列的引物来从核酸模板同时产生多种不同的核酸分子，所述引物包含位于5’的第一共同序列，从而将第一共同序列引入到扩增产物中。核酸模板可以是基因组的核酸或细胞外游离核酸。

如本文所用，“共同序列”意指在序列上相同的核酸序列。其长度不受限制，例如可以是至少5、10、15、20、30、40、50、60或70个碱基的长度。如本文所用，“共同序列互补序列”意指具有与共同序列互补的序列的核酸序列。

如本文针对引物所使用的，“靶向”某一核酸序列意指该引物包含与该核酸序列(也称为靶序列或靶核酸序列)至少部分互补的序列从而能够与该核酸序列杂交。如本文所用，引物的“靶向序列”意指引物包含的与靶核酸序列至少部分互补的序列。

如本文所用，“靶核酸序列”是指待研究(例如待扩增、测序等)的核酸序列，例如待研究的基因序列、基因组序列等。

如本文所用，“独特性核酸序列”意指靶核酸序列中的一段序列，其是该靶核酸序列所特有的，换句话说，这样的独特性核酸序列不存在于另一种靶核酸序列或非靶核酸序列中。在某些情况下，独特性核酸序列也可被称为单拷贝序列。

相对应地，“非独特性核酸序列”意指含有不同靶核酸序列的核酸分子所共有的核酸序列。非独特性核酸序列可以是靶核酸序列的一部分或可以是靶核酸序列的邻近序列，例如，非独特性核酸序列可以与靶核酸序列紧邻或相隔1、5、10、20、30、40、50、60、70、80、90、100、200或前述数值之间的数目或更多个核苷酸。因此，靶向非独特性核酸序列的引物的使用能够实现含有不同靶核酸序列的多种核酸分子的同时扩增。这样的非独特性核酸序列可以由本领域技术人员根据靶核酸序列常规地确定，例如根据靶核酸序列在基因组中的位置来选择合适的非独特性核酸序列。非独特性核酸序列的实例可以包括但不限于基因组重复序列和含CpG的序列。

如本文所用，“基因组重复序列”意指在基因组中不同位置出现的相同或对称性片段。基因组重复序列通常包括散在重复序列(interspersed repeat)和串联重复序列(tandem repeat)。散在重复序列是指相对均匀地分布在基因组中的一些重复序列，它们主要起源于转座子(transposon)和逆转座子(retroposon)。散在重复序列可以包括长散在重复(LINE)、短散在重复(SINE)、类反转录病毒转座子(LTR)、DNA转座子(DNA transposon)。串联重复序列由含有1～500个碱基的重复单元构成，这种重复单元首尾依次相连，重复几十到几百万次。串联重复序列主要包括简单重复(simple sequence repeat，SSR)和卫星DNA(DNA satellite)。简单重复序列是由几个碱基连续重复几十次所形成的序列；卫星DNA是重复单元高度重复排列形成的核酸片段，它能够被特定的D N A结合蛋白识别，从而形成染色体的着丝粒、端粒、近端着丝粒。关于基因组重复序列的描述以及鉴定可以参见例如ELerat，Identifying repeats and transposable elements in sequenced genomes:howto find your way through the dense forest of programs.Heredity(2010)104，520–533。

如本文所用，“含CpG的序列”意指在5’至3’方向上含有至少一个CpG的核酸序列。“CpG”是指胞嘧啶(C)和鸟嘌呤(G)的二核苷酸对，其中G在5’至3’方向的DNA链上紧随C之后。

在非独特性核酸序列选自含CpG的序列的实施方案中，靶向非独特性核酸序列的序列的长度通常大于或等于4个核苷酸，并且包含至少1个CpG。在优选的实施方案中，除了CpG以外，靶向非独特性核酸序列的序列包含随机序列。在优选的实施方案中，除了CpG以外，靶向非独特性核酸序列的序列通常只包含C、A和T。在优选的实施方案中，靶向非独特性核酸序列的序列的3’端第二个核苷酸为C。在优选的实施方案中，靶向非独特性核酸序列的序列的3’端起前7个核苷酸中包含1个CpG。在优选的实施方案中，靶向非独特性核酸序列的序列的3’端起前5个核苷酸中包含至少3个C。在优选的实施方案中，靶向非独特性核酸序列的序列的3’端起至少连续3个核苷酸为C。在更优选的实施方案中，靶向非独特性核酸序列的序列包含CpG短串联序列或由其组成。在优选的实施方案中，所述CpG短串联序列的长度大于或等于7个核苷酸，且3’端起前7个核苷酸中包含2个或3个CpG。在优选的实施方案中，CpG短串联序列的3’端起前10个核苷酸中C与G之和大于或等于7个。在优选的实施方案中，CpG短串联序列选自CGCGCGG，CGGCGGCGG，CGCGCGA，CGCGCGT和CGACGACGA。

在一些实施方案中，可以使用连接法将第一共同序列直接或间接连接到核酸分子的末端上。核酸分子可以是基因组的核酸或细胞外游离核酸。用于实现这样的连接的方法是本领域已知的。例如可以采用通过DNA连接酶或转座酶进行的连接。

对于采用通过DNA连接酶进行的连接，例如可以采用平末端连接法或粘性末端互补连接法将第一共同序列连接到核酸分子上。作为示例性描述，平末端连接法可以包括例如对核酸分子在脱氧核苷三磷酸存在下使用DNA聚合酶，例如T4-DNA聚合酶或Klenow聚合酶进行末端修复反应，其产生平端核酸分子；然后可根据本领域已知的任何方法，优选地通过T4-DNA连接酶反应的方法将平末端的第一共同序列与修饰的核酸分子连接。作为示例性描述，粘性末端互补连接法可以包括例如对核酸分子进行末端修复，然后根据本领域已知的任何方法对核酸分子的一条或两条链加多聚A尾部，并根据本领域已知的任何方法，优选地通过T4-DNA连接酶反应与一端为多聚T尾部的第一共同序列进行连接。通过转座酶进行的连接也是本领域已知的。

应理解，在核酸分子的一端或两端上连接第一共同序列的方法不局限于上文列举的示例性方法，而是可以采用能够实现此效果的任何方法。

引物延伸反应

在提供了在一端包含第一共同序列的多种不同的核酸分子之后，本文所述的方法通常涉及使用一种或多种引物T2来对这些核酸分子中的核酸序列进行选择性扩增，这包括将这些核酸分子与一种或多种引物T2杂交，所述一种或多种引物T2各自包含位于3’的外侧靶向序列，在聚合酶和核苷酸的存在下延伸所述引物T2，任选重复这样的杂交和延伸一次或多次，从而获得包含位于3’的第一共同序列互补序列的延伸链，任选地，在聚合酶和核苷酸的存在下使用针对所述第一共同序列互补序列的引物合成延伸互补链。任选地，所述一种或多种引物T2各自还可以包含第三共同序列，这使得可以使用针对所述第三共同序列和所述第一共同序列互补序列的引物来进一步扩增延伸产物。

在一些实施方案中，使用的引物T2可以是靶向独特性核酸序列的引物，从而实现特定靶核酸序列的选择性扩增。

在一些实施方案中，可以使用多种靶向独特性核酸序列的引物T2，从而实现多种靶核酸序列的多重扩增。

在另外的一些实施方案中，可以使用靶向非独特性核酸序列的引物T2，从而实现多种靶核酸序列的多重扩增。在优选的实施方案中，非独特性核酸序列选自但不限于基因组重复序列和含CpG的序列。

本发明的这样的方法是有利的，因为使用单独的引物T2(而非一对引物)来选择性扩增核酸序列，能够有效地避免引物二聚体的产生，从而减少副产物的产生。进一步，靶向非独特性核酸序列的引物的使用还允许对同一类靶核酸序列进行多重扩增，从而允许对这一类靶核酸序列进行随后的分析。例如，可以针对特定的基因组重复序列设计靶向该基因组重复序列的引物，从而允许与该基因组重复序列相关联的各种靶核酸序列的多重扩增。又例如，可以针对含CpG的序列(例如CpG岛)设计靶向该含CpG的序列的引物，从而允许与该含CpG的序列相关联的各种靶核酸序列的多重扩增。

如本文中所用，术语“引物”指在合适的缓冲液中和在适当的温度下，例如在存在4种不同的核苷三磷酸和聚合酶的情况下，能充当核酸合成的起始点的多核苷酸，从引物延伸合成的核酸链在本文中称为“延伸链”，与延伸链互补的核酸链在本文中称为“延伸互补链”。因此，引物包括与靶核酸(模板)杂交的靶向序列。引物一般是寡核苷酸，而且是单链的，然而，引物可指具有双链区段的多核苷酸。适于引物的靶向序列的合适长度取决于引物的预期用途。短的引物分子通常需要较低的温度，以与模板形成足够稳定的杂交复合物。引物不必反映核酸模板的确切序列，但是必须是充分互补的，以便与核酸模板杂交。

在本文所述的方法中，引物通常可以使用四种天然存在的脱氧核苷酸dATP，dTTP，dCTP和dGTP合成。在本发明的一些实施方案中，引物还可以掺入通常不存在于DNA中的天然或合成的脱氧核苷酸类似物。

可以使用本领域技术人员已知的标准引物设计计算机软件技术来设计引物。在引物设计期间考虑的变量可以包括引物长度、GC对含量、解链温度和由引物或引物对扩增的靶核酸的大小。一般而言，引物不应形成发夹结构或自身或异源引物对。在优选的实施方案中，引物可以包含与模板的一部分互补的2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50或更多个碱基的序列。

如本文所用，“随机引物”意指具有随机序列的引物(参见例如美国专利号5,043,272和5,106,727，其通过引用并入本文)。

可以使用可用的寡核苷酸合成程序产生随机引物；可以通过在一个或多个添加步骤中在反应混合物中提供核苷酸残基的混合物(以产生具有随机序列的寡核苷酸的混合物)来引入序列的随机性。因此，随机引物可以通过顺序掺入来自dATP、dCTP、dGTP和dTTP的各25％的混合物的核苷酸残基以形成寡核苷酸来产生。可以使用其他比例的dNTP(例如，将任何一种或多种dNTP的比例增加或减少，并调节其他dNTP的比例，使得总量为100％)。

术语“随机引物”具体包括不同序列的单个寡核苷酸的集合，该寡核苷酸例如可以由通式5'-XXXXX-3'表示，其中X表示被添加到寡核苷酸的来自具有定制百分比的dNTP的混合物的核苷酸残基。例如，如果混合物中含有各25％的dATP、dCTP、dGTP和dTTP，则所示的随机引物将含有在每个位置上以大约25％的概率具有A、C、G或T的寡核苷酸的混合物。

如本文所用，术语“互补”或“基本互补”是指核苷酸或核酸之间的杂交或碱基配对或者双链体形成。如果在一个给定位置上一个核酸的核苷酸能够与另一个核酸的核苷酸形成氢键，则这两个核酸被认为在该位置上是彼此互补的。互补核苷酸一般是A和T(或A和U)或者C和G。当在最佳地比对和比较并适当地进行了核苷酸插入或缺失的情况下，一条链的核苷酸与另一条链的至少大约80％、通常至少大约90％到约95％，甚至大约98％到100％配对时，这两个单链RNA或DNA分子被称为基本互补。

如本文所用，术语“杂交”是指两个单链核酸通过碱基互补配对形成双链结构。杂交可发生于完全互补的核酸链之间或存在少量错配区的“基本互补”核酸链之间。只能在完全互补核酸链间发生杂交的条件称为“严格杂交条件”或“序列特异杂交条件”。基本互补序列的稳定双螺旋体可在非严格杂交条件下获得。耐受的错配程度可通过适当调节杂交条件控制。本领域的技术人员通过考虑一些变量能凭经验可以确定双螺旋的稳定性。这些变量包括：寡核苷酸的长度和碱基对的浓度、离子强度、碱基对错配率。建立用于设计本发明的寡核苷酸或探针的严格和非严格杂交条件的定性和定量考虑事项可参见，例如，Ausubel等人，Short Protocols in Molecular Biology(4th ed.，John Wiley&Sons 1999)；Sambrook等人，Molecular Cloning：A Laboratory Manual(3d ed.，Cold Spring HarborLaboratory Press 2001)：Nucleic Acid Hybridisation：A Practical Approach(B.D.Hames&S.J.Higgins eds.，IRL Press 1985)。

如本文所用，术语“聚合酶”是指合成核酸链或聚合物的酶，包括DNA聚合酶和RNA聚合酶。优选地，本文所用的聚合酶是DNA聚合酶。可以使用的一种聚合酶是Sequenase^TM(来源于噬菌体7DNA聚合酶的酶，其被修饰以改善其测序性质-参见Tabor and Richarson，Proc.Nat.Acad.Sci.USA，84:4767-4771(1987)，可购自例如United States BiochemicalCorporation，Cleveland，Ohio)。可用于代替Sequenase^TM的其它聚合酶包括但不限于DNA聚合酶I的Klenow片段，AMV逆转录酶以及Taq聚合酶。关于可用于本文所述的方法的聚合酶的其他描述还可参见WO05024010和WO06120433，其全部内容通过引用并入本文。

通常使用的引物延伸条件是本领域已知的适合于上述聚合酶的聚合条件。在Sequenase^TM的情况下，聚合条件包括在约室温至约45℃范围内的温度；pH 7至8的缓冲液，优选pH 7.3至7.7；酶浓度为约0.01单位/微升至约1单位/微升，反应时间为约1至约20分钟，优选1至5分钟。用于Sequenase^TM的典型缓冲液由以下组成：0.040M Tris HCl(pH7.5)0.050M氯化钠，0.010M氯化镁，0.010M二硫苏糖醇。在DNA聚合酶I的Klenow片段的情况下，这些典型的条件包括在约10℃至约45℃范围内的温度，优选约15℃至约40℃；pH 6.8至7.4的缓冲液，优选pH 7.0至7.4；酶浓度为约0.01单位/微升至约1单位/微升，优选约0.02至约0.15单位/微升，反应时间为约1至约40分钟。用于DNA聚合酶I的Klenow片段的典型缓冲液由以下组成：0.05M三羟甲基氨基甲烷氯化物，pH 7.5 0.05M氯化镁，0.05M氯化钠，0.010M二硫苏糖醇。

应当理解，这些条件仅是示例性的。当使用其它聚合酶时，应该使用最适合它们的条件，因为通常希望尽可能快地进行聚合反应。为此，通常对于逆转录酶使用42℃的温度；对于Klenow聚合酶为24℃；对于Sequenase^TM为37℃；和对于Taq聚合酶为72℃。此外，为了增强反应，特别是在使用经修饰的dNTP的情况下，使用显著过量的dNTP(超过化学计量)或修饰其他条件如盐浓度可以是有利的。

标签序列

在一些实施方案中，本文所述的方法允许对来自多于一个(例如2，3，4，5，10，15，20，30，40，50，60，70，80，90，100，1000个或更多个)核酸样品的核酸分子同时进行选择性扩增。在这样的实施方案中，通常在来自同一核酸样品的核酸分子的序列中引入独特的标签序列，以使得能够将来自多个核酸样品的核酸分子合并在一起，并且能够通过标签序列鉴定扩增的核酸的来源。这样的标签序列也可称为条形码(barcode)，关于其描述可参见例如Shoemaker等人，Nature Genet.14(4):450-6(1996)；EP 0799897；Fan等人，GenomeRes.10:853-60(2000)；和美国专利号6,150,516，其公开内容通过引用整体并入本文)。

将标签序列引入核酸分子的方法可以是本领域已知的任何合适的方法，包括但不限于例如上文所述的引物延伸法或连接法，以及上述文献中公开的各种方法。

可以在本文所述的方法的任何阶段将标签序列引入核酸分子，随后将来自不同核酸样品的核酸分子合并在一起。优选地，在本发明方法的步骤a中将标签序列引入核酸分子，随后将来自不同核酸样品的核酸分子合并在一起。

因此，在一些实施方案中，本发明方法的步骤a包括将包含核酸分子的核酸样品与引物T1杂交，所述引物T1从5’到3’包含第一共同序列、标签序列和位于3’的用于靶向非独特性核酸序列的靶向序列，在聚合酶和核苷酸的存在下延伸所述引物T1，和任选重复这样的杂交和延伸一次或多次。在具体的实施方案中，方法还包括在步骤a或b之后将来自多于一个核酸样品的核酸分子合并在一起。

在另外的实施方案中，本发明方法的步骤a包括将标签序列和第一共同序列相继连接在核酸分子的同一端。优选地，先将标签序列连接在核酸分子的一端，随后将第一共同序列连接至该标签序列。可选地，将第一共同序列与标签序列连接在一起，随后再连接到核酸分子的一端，优选地，从标签序列的那一端连接到核酸分子的一端。在具体的实施方案中，方法还包括在步骤a或b之后将来自多于一个核酸样品的核酸分子合并在一起。

将第二共同序列连接至延伸链或延伸互补链

本发明还涉及在步骤b之后将第二共同序列连接至延伸链或延伸互补链以获得在5’和3’端均含有已知序列的核酸序列。

在一些实施方案中，可以使用如上文所述的平末端连接法或粘性末端互补连接法将第二共同序列连接至延伸链或延伸互补链。

在优选的实施方案中，使用靶向探针将第二共同序列连接至延伸链或延伸互补链。在本发明的上下文中，由于在步骤b中产生的延伸链已在3’端具有已知序列(即第一共同序列互补序列)，因而一般描述的是将第二共同序列连接至延伸链的5’端或延伸互补链的3’端。然而，本领域技术人员能够容易地理解，在延伸链在5’端而非3’端具有已知序列时，也可以使用靶向探针将第二共同序列连接至延伸链的3’端或延伸互补链的5’端，并且能够根据本说明书的描述对靶向探针的设计进行合理的调整。

如本文所用，引物或靶向探针的“靶向序列”意指与靶核酸序列(例如待扩增的核酸分子、延伸链或延伸互补链的序列)至少部分互补以使得引物或靶向探针能够与靶核酸杂交的核酸序列。如本文所用，“外侧靶向序列”是针对“内侧靶向序列”提及的。通常而言，“外侧靶向序列”是用于核酸序列的第一轮靶向的靶向序列，“内侧靶向序列”是用于核酸序列的第二轮靶向的靶向序列。第一轮靶向可以例如是如本文所述的使用引物T2进行的靶向，第二轮靶向可以例如是如本文所述的使用靶向探针的靶向。在具体的实施方案中，外侧靶向序列针对的靶核酸序列(即外侧靶向位点)和内侧靶向序列针对的靶核酸序列(即内侧靶向位点)可以是相邻的序列。

在使用靶向探针将第二共同序列连接至延伸链的5’端的实施方案中，靶向探针包含位于5’的内侧靶向序列和位于3’的第二共同序列互补序列，并且靶向序列被设计为使得在杂交后所述位于3’的第二共同序列互补序列位于杂交的延伸链的5’端。在优选的实施方案中，靶向探针的位于5’的内侧靶向序列包含与延伸链的序列至少部分互补的序列。在更优选的实施方案中，靶向探针的位于5’的内侧靶向序列包含与延伸链的5’端的序列至少部分互补的序列。

在使用靶向探针将第二共同序列连接至延伸互补链的3’端的实施方案中，靶向探针包含位于3’的内侧靶向序列和位于5’的第二共同序列互补序列，并且靶向序列被设计为使得在杂交后所述位于5’的第二共同序列互补序列位于杂交的延伸互补链的3’端。在优选的实施方案中，靶向探针的位于3’的内侧靶向序列包含与延伸互补链的序列至少部分互补的序列。在更优选的实施方案中，靶向探针的位于3’的内侧靶向序列包含与延伸互补链的5’端的序列至少部分互补的序列。

在一些实施方案中，在将靶向探针与延伸链或延伸互补链杂交之后，方法还包括在连接酶的存在下将第二共同序列连接在杂交的延伸链的5’端或杂交的延伸互补链的3’端。在优选的实施方案中，方法包括在允许杂交的条件下，将靶向探针、延伸链或延伸互补链以及第二共同序列组合在一起，随后在连接酶的存在下将第二共同序列连接至延伸链或延伸互补链。

在一些实施方案中，靶向探针的靶向序列可以包含靶向独特性核酸序列的序列，从而实现特定靶核酸序列的选择性扩增。

在一些实施方案中，可以使用多种不同的靶向探针，从而实现多种靶核酸序列的多重扩增。

在另外的一些实施方案中，靶向探针的靶向序列可以包含靶向非独特性核酸序列的序列，从而实现多种靶核酸序列的多重扩增。在优选的实施方案中，非独特性核酸序列选自但不限于基因组重复序列和含CpG的序列。

本发明的使用靶向探针来连接第二共同序列的方法是有利的，因为靶向探针的使用有利地避免了PCR扩增中可能伴随的引物二聚体的产生以及非特异性扩增的问题。进一步，在本文所述的方法中，靶向探针的使用还允许对靶核酸序列进行第二轮靶向，从而允许靶核酸序列的更精确的选择性扩增。

因此，在优选的实施方案中，本发明提供了选择性扩增核酸序列的方法，所述方法包括：

b.将所述核酸分子与多种引物T2杂交，所述多种引物T2各自包含位于3’的外侧靶向序列，所述外侧靶向序列包含靶向独特性核酸序列的序列，

在聚合酶和核苷酸的存在下延伸所述引物T2，

任选重复这样的杂交和延伸一次或多次，

从而获得包含位于3’的第一共同序列互补序列的延伸链，

d.使用一种或多种靶向探针将第二共同序列连接至所述延伸链的5’端或延伸互补链的3’端，所述一种或多种靶向探针各自包含靶向独特性核酸序列的序列，和

e.任选地，扩增步骤d的产物。

在另外的优选的实施方案中，本发明提供了选择性扩增核酸序列的方法，所述方法包括：

b.将所述核酸分子与一种或多种引物T2杂交，所述一种或多种引物T2各自包含位于3’的外侧靶向序列，所述外侧靶向序列包含靶向非独特性核酸序列的序列，

在聚合酶和核苷酸的存在下延伸所述引物T2，

任选重复这样的杂交和延伸一次或多次，

从而获得包含位于3’的第一共同序列互补序列的延伸链，

e.任选地，扩增步骤d的产物。

连接酶和连接反应

如本文所用，术语“连接酶”是指催化核酸链的5'-磷酸和3'-羟基末端之间磷酸二酯键的分子内形成和分子间形成的核酸修饰酶。连接酶可以获自重组或天然来源。可以使用一种或多种低温(例如，室温或更低)连接酶(例如，T3DNA连接酶、T4DNA连接酶、T7DNA连接酶和/或大肠杆菌DNA连接酶)。连接酶也可以是热稳定的连接酶。可以使用来自嗜热生物的热稳定连接酶。热稳定DNA连接酶的例子包括但不限于：HiFi热稳定DNA连接酶，Ampligase热稳定DNA连接酶，Tth DNA连接酶(来自嗜热栖热菌(Thermus thermophilus)，可购自例如欧基公司(Eurogentec)和GeneCraft公司)；Pfu DNA连接酶(来自激烈火球菌(Pyrococcusfuriosus)的超嗜热连接酶)；Taq连接酶(来自水生栖热菌(Thermusaquaticus))，以及任何其他合适的热稳定连接酶，或其任意组合。

连接反应通常可以含有约1pM至约500nM的每种靶向探针，约1pM至约500nM的每种包含第二共同序列的核酸片段，约3、4、5、6、7或8个单位的连接酶和连接反应缓冲液。

在一些实施方案中，连接反应可以热循环来进行，所述热循环可以包括例如在高温下使核酸链变性(或解链)，在1、2、3、4或5个较低的系列温度下将一种或多种靶向探针退火至靶核酸，和在适应于连接酶的温度下连接核酸序列。在优选的实施方案中，所述热循环可以包括例如在高温下使核酸链变性，在第一较低的温度下将第一种靶向探针退火至靶核酸，随后在第二较低的温度下将第二种靶向探针退火至靶核酸，以此类推，随后在适应于连接酶的温度下连接核酸序列。在一个实施方案中，变性(或解链)温度可以是例如约85、86、87、88、89、90、95或100℃。在优选的实施方案中，变性(或解链)温度可以是例如约90、91、92、93、94、95、96、97或98℃。在另一个实施方案中，靶向探针退火温度可以是例如约30、35、40、45、50、55、60、65、70、75℃或更高。在优选的实施方案中，靶向探针退火温度可以是例如约45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71或72℃。在另一个实施方案中，连接温度可以是例如约30、35、40、45、50、55、60、65、70、75、80℃或更高。在优选的实施方案中，连接温度可以是例如约55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70℃或更高。

在一些实施方案中，连接反应可以在变性(或解链)温度下孵育约5至约60秒。在优选的实施方案中，连接反应可以在变性(或解链)温度下孵育约30秒。在一些实施方案中，连接反应可以在靶向探针退火温度下孵育约30秒至约5分钟。在一个优选的实施方案中，连接反应可以在靶向探针退火温度下孵育约1分钟。在一些实施方案中，连接反应可以在靶向探针退火温度下孵育约1、2、3、4、5、6、7、8、9、10或更多分钟。在一些实施方案中，连接反应可以在连接温度下孵育约30秒至约5分钟。在优选的实施方案中，连接反应可以在连接温度下孵育约1分钟。在一些实施方案中，连接反应可以在所述热循环之前在变性(或解链)温度下预孵育约1、2、3、4、5、6、7、8、9、10、15、20或25分钟。

在优选的实施方案中，连接反应可以在相同的靶向探针退火温度与连接温度下进行。

在一些实施方案中，连接反应可以经历约10、50、100、120、150、200或更多次的所述热循环。

延伸链和/或延伸互补链的修剪

在一些实施方案中，本发明还涉及在将第二共同序列连接至延伸链或延伸互补链之前修剪延伸链的5’端和任选延伸互补链的3’端。在优选的实施方案中，本发明还涉及在将第二共同序列连接至延伸链或延伸互补链之前修剪延伸链的5’端和任选延伸互补链的3’端，以从延伸链中除去引物T2和任选从延伸互补链中除去引物T2的互补链。

在一些实施方案中，可以在本发明的引物T2中掺入合成核苷酸类似物以允许对扩增产物进行修剪。修剪的程度通常可以通过掺入引物T2中的合成核苷酸类似物的位置来确定。在优选的实施方案中，修剪的程度可以是将引物T2完全除去。用于除去合成核苷酸类似物的特定处理已经被设计出来并且是本领域技术人员所熟知的。

在一些实施方案中，合成核苷酸类似物可以选自5-溴脱氧尿苷(BdUR)、5-溴脱氧胞苷(BrdC)或脱氧肌苷。含有BdUR的引物可以在曝光时降解。含有脱氧肌苷的引物可以使用内切核酸酶V进行降解，该酶是在脱氧肌苷残基处识别和切割糖磷酸骨架的酶。

在其他实施方案中，可以首先特异性除去合成核苷酸类似物的碱基，留下无嘌呤或无嘧啶位点(AP位点)和完整的糖-磷酸骨架。然后，糖-磷酸骨架在AP位点处被切割，从而在核酸序列中产生切口。在本发明的优选实施方案中，合成的核苷酸类似物的碱基用DNA糖苷酶来除去。DNA糖苷酶是能够除去某些核苷酸类似物的碱基的酶家族。可以被掺入引物并且是糖苷酶底物的核苷酸类似物的一些例子可以包括脱氧尿苷，脱氧-7-甲基鸟苷，脱氧-5,6-二羟基胸苷，脱氧-3-甲基腺苷，脱氧肌苷，5-甲基-脱氧胞苷，O-6-甲基-脱氧鸟苷，5-碘-脱氧尿苷，8-氧-脱氧鸟嘌呤和1,N⁶-亚乙烯基腺嘌呤。从掺入到核酸序列中的核苷酸类似物中除去碱基的糖苷酶可包括尿嘧啶DNA糖苷酶，7-甲基鸟嘌呤-DNA糖苷酶，5,6-二羟基胸苷糖苷酶，3-甲基腺嘌呤糖苷酶，次黄嘌呤DNA N-糖苷酶，8-羟基鸟嘌呤-DNA糖苷酶和烷基嘌呤-DNA-N-糖苷酶。在一个优选的实施方案中，核苷酸类似物可以是脱氧尿苷。在另一个优选的实施方案中，DNA糖苷酶可以是尿嘧啶DNA糖苷酶。

在一些实施方案中，切割AP位点的处理可以包括但不限于加热，碱性水解，AP内切核酸酶处理如内切核酸酶III，内切核酸酶IV，内切核酸酶VI，内切核酸酶VIII，噬菌体T4UV内切核酸酶等。在一个优选的实施方案中，处理是内切核酸酶VIII处理。

在修剪延伸链的5’端之后，可以使用具有3'至5'单链外切核酸酶活性的酶除去3'末端处产生的单链突出核酸序列(即修剪延伸互补链的3’端)。降解单链核酸的常用3'至5'外切核酸酶可包括外切核酸酶I和外切核酸酶VII。

在另外的实施方案中，可以在本发明的引物T2中引入限制性酶切位点以允许对扩增产物进行修剪。修剪的程度通常取决于具体的限制性酶切位点。在优选的实施方案中，引入引物T2中的限制性酶切位点允许识别该位点的限制性内切酶切割引物T2上从该位点的3’端起数个核苷酸的位置，以及在引物T2的互补链上从相应的识别位点的5’端起数个核苷酸的位置。在优选的实施方案中，引入引物T2中的限制性酶切位点允许将引物T2完全除去。识别这样的限制性酶切位点的限制性内切酶的实例包括但不限于AcuI,AlwI,BbsI,BbvI,BccI,BciVI,BfuAI,BmrI,BpmI,BpuEI,BsaI,BseRI,BsgI,BspMI,BspQI,BsmAI,BsmBI,BsmFI,BspCNI,BtgZI,EarI,EciI,EcoP15I,FauI,FokI,HphI,HpyAV,HaeIII,HgaI,HinfI,MlyI,MmeI,MnlI,NmeAIII,PleI和SfaNI。在优选的实施方案中，限制性内切酶选自AcuI,BceAI,BpmI,BpuEI,BseRI,BsgI,BsmFI,BtgZI,EciI,EcoP15I,FokI,HphI,MboII,MmeI和NmeAIII。

非期望核酸分子的降解

如本文所用，“非期望核酸分子”意指除了被选择性扩增的核酸分子以外的其它核酸分子。

在一些实施方案中，可以在将第二共同序列连接至延伸链或延伸互补链之后加入外切核酸酶或具有外切核酸酶活性的聚合酶以降解非期望核酸分子。

在使用靶向探针将第二共同序列连接至延伸链的5’端的实施方案中，外切核酸酶或具有外切核酸酶活性的聚合酶可以是5'至3'外切核酸酶或具有5'至3'外切核酸酶活性的聚合酶，并且连接至延伸链的5’端的第二共同序列的5’端可以被保护基修饰以具有对5'至3'外切核酸酶活性的抗性。保护寡核苷酸序列的5’端以避免被5'至3'外切核酸酶或具有5'至3'外切核酸酶活性的聚合酶降解的方法是本领域已知的，例如，通过在寡核苷酸序列的5'端包含硫代磷酸酯键，可以使寡核苷酸序列产生外切核酸酶抗性(可参见例如Nikiforov，PCR Methods and Applications，3：285-291,1994)。

在使用靶向探针将第二共同序列连接至延伸互补链的3’端的实施方案中，外切核酸酶或具有外切核酸酶活性的聚合酶可以是3'至5'外切核酸酶或具有3'至5'外切核酸酶活性的聚合酶，并且连接至延伸互补链的3’端的第二共同序列的3’端可以被保护基修饰以具有对3'至5'外切核酸酶活性的抗性。保护寡核苷酸序列的3’端以避免被3'至5'外切核酸酶或具有3'至5'外切核酸酶活性的聚合酶降解的方法是本领域已知的，例如，可以在寡核苷酸序列的3'端引入锁核酸(LNA)、3'-连接的氨基、3'磷酸化、3'乙酰化、3'-封端帽(例如3'-氨基丙基修饰或通过使用3'-3'端键联)、硫代磷酸酯修饰、接头修饰例如地高辛NHS酯、胆固醇基-TEG、生物素化修饰、硫醇修饰或添加各种荧光染料和间隔基例如C3间隔基。

常用的3'至5'外切核酸酶包括但不限于外切核酸酶I、外切核酸酶III和外切核酸酶T，常用的5'至3'外切核酸酶包括但不限于λ外切核酸酶、T5外切核酸酶和T7外切核酸酶。

产物的回收

在一些实施方案中，本文所述的方法还包括在每个步骤之后进行回收步骤，以分离和纯化获得的产物。在一些实施方案中，本文所述的方法还包括在步骤b之后分离和纯化获得的延伸产物。在一些实施方案中，本文所述的方法还包括在步骤c之后分离和纯化获得的连接产物。在一些实施方案中，本文所述的方法还包括在步骤d之后分离和纯化获得的扩增产物。

方法可以采用本领域已知的任何合适的方法进行所述分离和纯化，包括但不局限于磁珠纯化、纯化柱纯化和琼脂糖胶电泳纯化。在一些实施方案中，可以基于目的片段的长度来进行分离和纯化。目的片段(或称为靶片段，即包含靶序列的核酸片段或分子)的长度可以例如是至少约30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、350、400、450、500、550、600bp或上述值之间的任何数值范围，例如80-280bp、100-300bp、160-250bp、160-400bp、180-250bp等。在一个具体的实施方案中，用2％琼脂糖胶电泳的方法选择特定长度的目的片段并进行胶回收纯化。

本文所述的方法的应用

在一些实施方案中，本文所述的方法还包括对选择性扩增的核酸序列进行测序。

如本文所用，对核酸进行“测序”意指测定核酸的核苷酸序列。可以使用本领域已知的任何核酸测序方法来执行所述测序。在优选的实施方案中，所述测序选自电泳测序、合成法测序、连接法测序、联合探针锚定聚合测序、杂交测序、单分子测序和实时测序方法。在优选的实施方案中，所述测序可以选自但不限于Illumina的SBS测序技术(包括GenomeAnalyzer IIx、HiSeq和MiSeq测序平台)、Life Technologies公司的半导体测序技术、ABI公司开发的SOLiD、5500W Series GeneticAnalyzer和Ion Torrent PGM测序平台、BGI的联合探针锚定聚合技术(cPAS)和联合探针锚定连接技术(cPAL)、Roche454的GSJunior和GS FLX+测序平台、HelicosHeliscope技术、PacBioSMRT技术、Oxfordnanopore技术等。

在一些实施方案中，本文所述的方法还包括对分析获得的测序数据。分析测序数据的方法不受限制，例如可以应用任何合适的数据分析和序列比对软件，包括但不限于Bismark、BSMAP、Bowtie和SOAP等。

在一些实施方案中，本文所述的方法可用于检测和发现单核苷酸多态性(SNP)或突变，例如可以包括对选择性扩增的靶核酸序列进行测序，随后与参考基因组的序列进行比对，以鉴定靶基因中的SNP或突变。

在一些实施方案中，本文所述的方法可用于检测宿主核酸样品中存在的病原体核酸，检测样品中稀少的核酸以允许生物标志物的多重扩增或全基因组扩增，或扩增来自降解样品的靶标以允许多重扩增或全基因组扩增。在一个具体的实施方案中，本文所述的方法可以用于检测样品例如血液或粪便中的稀少的肿瘤DNA以允许生物标志物的多重扩增或全基因组扩增。

在一些实施方案中，本文所述的方法可用于检测DNA甲基化，检测和/或测序来自外周样品(血液，粪便)的肿瘤DNA，扩增特定模板中的所有外显子，或扩增特定的模板中的所有保守区域。

在优选的实施方案中，本文所述的方法可用于检测DNA甲基化。在这样的实施方案中，本文所述的方法包括首先用修饰剂处理核酸样品，以便将核酸分子中的胞嘧啶转换，而5’甲基胞嘧啶不变，随后执行如本文所述的步骤a-d。在这样的实施方案中，所述引物T2优选是靶向含CpG的序列的引物。优选地，引物T2包含CpG短串联序列。

本领域技术人员将认识到，本文详述的方法的其他应用是可能的或期望的，并且本文详述的方法的应用不应被解释为限制本发明的范围。

实施例

下面将结合实施例对本发明的实施方案进行详细描述，但是本领域技术人员将会理解，下列实施例仅用于说明本发明，而不应视为限定本发明的范围。实施例中未注明具体条件者，按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者，均为可以通过市购获得的常规产品。

实施例1：靶向25个CpG短串联位点

步骤一、亚硫酸氢盐处理DNA样品。

采用试剂盒MethylCode^TMBisulfite Conversion Kit(Invitrogen)，并按照制造商提供的说明书，对2种模板(商业化人全甲基化基因组DNA(FMG_DNA)和人白细胞基因组DNA(WBC_DNA))进行亚硫酸氢盐处理，具体步骤如下：

1.1制备CT转换试剂(CT Conversion Reagent)溶液：从试剂盒中取出CT转换试剂，加入900μl水、50μl重悬缓冲液和300μl稀释缓冲液，室温短时震荡混匀10分钟待其溶解，室温避光保存；

1.2将500pg至500ng DNA样品共20μl加入PCR管中；

1.3将130μl CT转换试剂溶液加入DNA样品，轻弹或用枪头吹打混匀；

1.4将PCR管在一台热循环仪上进行如下程序：98度----10分钟，64度----2.5小时，4度保存(不超过20小时)备用；

1.5将DNA纯化柱放入收集管中，加入600μl结合缓冲液；

1.6将1.4步骤中的DNA样品加入结合结合缓冲液中，避盖上下颠倒混匀数次；

1.7最大转速(>10,000g)离心30秒，弃过柱液；

1.8加入100μl洗涤缓冲液(已加乙醇)，最大转速离心30秒，弃过柱液；

1.9加入200μl Desulphonation缓冲液，将纯化柱在室温站立15～20分钟；

1.10最大转速离心30秒，弃过柱液；

1.11加入100μl洗涤缓冲液(已加乙醇)，最大转速离心30秒，弃过柱液；

1.12重复1.11一次，将纯化柱放置到一个新的1.5ml离心管中；

1.13加入10μl溶解缓冲液，最大转速离心30秒以洗脱DNA。

步骤二、引物A和DNA聚合酶进行扩增。

以亚硫酸氢盐处理过的3种样品为模板，共设置3组反应，其中组3作为整个实验的对照组：

表1：

2.1将步骤1中得到的DNA在一个PCR管中配置如下扩增反应体系：

表2：

*:引物A：为四种引物混合

A组所用引物A为T1.1(1-4mix):

T1.1-1:

T1.1-2:

T1.1-3:

T1.1-4:

B组所用引物A为T1.2(1-4mix):

T1.2-1:

T1.2-2:

T1.2-3:

T1.2-4:

C组所用引物A为T1.3(1-4mix)：

T1.3-1:

T1.3-2:

T1.3-3:

T1.3-4:

D组所用引物A为CM5.1(1-4mix):

CM5.1-1:

CM5.1-2:

CM5.1-3:

CM5.1-4:

(H＝A/T/C)，其中下划波浪线部分为引物的3’端部分，下划直线部分为引物的5’端部分，双下划线部分为引物A标签序列。(标签可用于区分不同样品，不同样品可加入含不同标签序列的引物A，步骤二或四之后可将带有不同标签序列的样品混到一起纯化再进行后续步骤。)

**:在2.3步骤中加入

2.2将PCR管放入PCR热循环仪中进行如下程序：95度----2分钟，4度保存；

2.3加入1μl Klenow片段(exo-,50U/ul)，混匀，点离；

2.4在PCR热循环仪中进行如下程序：4度----50s,10度----1min,20度----4min,30度----4min,37度----4min；

2.5在PCR热循环仪中进行如下程序以灭活Klenow片段：75度----20分钟，4度----暂停；

步骤三、引物B和DNA聚合酶进行扩增。

3.1在一个PCR管中配置如下扩增反应体系：

表3：

*:引物B：为3种引物混合

A/B/C组所用引物B如下:

T2.5-Mme-D6CGCGCGG:

T2.5-Mme-D6CGCGCGA:

T2.5-Mme-D4CGGCGGCGG:GTGGTGATGACAGGAGTCCA (D＝A/T/G)，其中下划波浪线部分为引物的3’端部分，下划直线部分为引物的5’端部分，下划双直线TCCAAC为Mme1酶切位点。

D组所用引物B如下:

CM6.0-D4:

CM6.1-A-D4:

CM6.1-3CGG-D4:

(D＝A/T/G)，其中下划波浪线部分为引物的3’端部分，下划直线部分为引物的5’端部分。

3.2在冰上将混合物加入2.6的第一轮扩增反应产物中，吹打混匀5～6次；

3.3在PCR热循环仪中进行如下程序：95度---3分钟，50度----2分钟，72度----1分钟，4度----暂停；

步骤四、引物C、引物D和DNA聚合酶进行扩增。

4.1在一个PCR管中配置如下扩增反应体系：

表4：

内容	体积
		Ex Taq Buffer	3μl
引物C(100uM)*	0.6μl
		引物D(50uM)**	1.2μl
dNTP(2.5mM)	3μl
		水	22.2μl
Total	30μl

*：引物C：

T3.0:TTTCCCTACACGACGCTCTTCGATCT；

**：引物D：

A/B/C组所用引物D为：

T4.3-MmeI:GTGGTGATGACAGGAGTCCAACTTCAG；

D组所用引物C为：

P1.0

AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT

引物D为：

P6.2：CAAGCAGAAGACGGCATACGAGATATCGTGGTGACTGGAGTTCAGACGTGTGCT；

4.2在冰上将混合物加入3.3的第二轮扩增反应产物中，吹打混匀5～6次；

4.3在PCR热循环仪中进行如下程序：95度----3分钟；

4.4在PCR热循环仪中进行如下程序：95度----30秒，65度----30秒，72度----1分钟，共15个循环，72度----5分钟，4度暂停。

4.5将带有不同标签序列的产物(A/B/C组)各取30μl混到一起，用zymo DNAClean&Concentrator进行纯化回收。对照D组进行步骤五直接进行步骤十(不进行步骤六至九)。

步骤五、片段选择、纯化。

5.1制备3％琼脂糖凝胶，加入1×SYBR Safe(Invitrogen)；

5.2将4.5的回收产物在3％琼脂糖凝胶中进行电泳分离；

5.3对凝胶中的DNA进行成像分析；

5.4 A/B/C组混合物切胶回收100-300bp的目的片段，D组切胶回收180-250bp的目的片段；

5.5将目的片段进行胶回收纯化(Qiagen，QIAquick Gel Extraction Kit)；

6.步骤六、Mme1酶切及产物回收。

6.1将步骤5中得到的DNA在一个PCR管中配置如下酶切反应体系：

表5：

内容	体积
		Mme1	1μl
10*CutSmart buffer	5μl
		SAM	0.2μl
水+DNA回收产物	43.8μl
		Total	50μl

6.2在冰上将混合物吹打混匀5～6次；

6.3在PCR热循环仪中进行如下反应：37度---30分钟，4度----暂停；

6.4制备3％琼脂糖凝胶，加入1×SYBR Safe(Invitrogen)；

6.5将6.3的酶切产物在3％琼脂糖凝胶中进行电泳分离；

6.6对凝胶中的DNA进行成像分析；

6.7切胶回收80-280bp的目的片段；

6.8将目的片段进行胶回收纯化(Qiagen，QIAquick Gel Extraction Kit)；

步骤七、靶向引物和酶切产物进行杂交连接反应。

此步设置了两个实验组和一个对照组，实验组分别用连接酶HiFi和Ampligase进行实验，对照组中引物只加了引物Lig2.2。为了试外切酶exo1和exo3的效果，每个实验组和对照组又分为三组，分别为只用exo1，只用exo3，exo1和exo3同时用：

表6：

7.1将步骤6中得到的酶切后DNA产物在一个PCR管中配置如下反应体系：

表7：

内容	体积
		Lig2.2(1uM)	3.6μl
10*Buffer2	3μl
		靶向引物(总浓度50nM)*	0.75μl
HiFi/Ampligase	1μl
		水+DNA	21.65μl
Total	30μl

*：靶向引物：为22种引物的混合(其中下划波浪线部分为引物的3’端部分，下划直线部分为引物的5’端部分)，终浓度为5pM/每条引物

La-EMBP1.1:

La-KCNQ5.1:

La-ZEB2.1:

La-IKZF1.1:

La-C9orf50.1:

La-PRKCB.1:GACTGGAGTTCAGACGTGTGCTCTTCCGAT

La-PRKCB.2:

La-COTL1.1:

La-AKR1B1.1:

La-FAR1.1:

La-KCNMB4.1:

Lb-VIM.1:_

Lb-SEPT9.1:

Lb-EMBP1.1:

Lb-CTPS1.1:

Lc-INTER3069.1:

Lc-TBCD.1:

Lc-MDGA1.1:

Lc-ST8SIA6.1:_

Lc-ERN1.1:_

Lc-GLT25D2.1:

Ld-EMBP1.1:

7.2在冰上将混合物吹打混匀5～6次；

7.3在PCR热循环仪中进行如下程序：94度----1分钟；

7.4在PCR热循环仪中进行如下程序：94度---10秒，65度----8分钟，共120个循环，94度----1分钟，4度----暂停；

7.5在7.4反应产物中加入0.5ul外切酶exo1和1ul外切酶exo3，37度，反应15分钟；

步骤八、接头引物Primer1.0、接头引物Primer6.2和DNA聚合酶进行扩增。

此步骤增加了只以水为模板和以第5步回收产物为模板的对照。

8.1在一个PCR管中配置如下扩增反应体系：

表8：

*：Primer1.0：

**：Primer6.2：

(其中波浪线部分为引物的3’端部分，单下划直线部分为引物的5’端部分；双下划线处为Illumina index序列，此处以index9为例)

8.2在冰上将混合物加入7.5的产物中，吹打混匀5～6次；

8.3在PCR热循环仪中进行如下程序：95度----3分钟；

8.4在PCR热循环仪中进行如下程序：95度----30秒，65度----30秒，72度----1分钟，共15个循环，72度----5分钟，4度保存。

步骤九、片段选择、纯化。

9.1制备3％琼脂糖凝胶，加入1×SYBR Safe(Invitrogen)；

9.2将7.4的扩增产物在3％琼脂糖凝胶中进行电泳分离；

9.3对凝胶中的DNA进行成像分析；

9.4切胶回收160-250bp的目的片段；

9.5将目的片段进行胶回收纯化(Qiagen，QIAquick Gel Extraction Kit)；

9.6用Qubit HS Kit(Invitrogen)测定双链DNA浓度，如果浓度偏低，可继续进行如下扩增步骤；

9.7将8.5中纯化得到的DNA在一个PCR管中配置如下扩增反应体系：

表9：

*：Q-P1：AATGATACGGCGACCACCGA

**：Q-P2：CAAGCAGAAGACGGCATACGA

9.8在冰上将混合物吹打混匀5～6次；

9.9在PCR热循环仪中进行如下程序：95度----3分钟；

9.10在PCR热循环仪中进行如下程序：95度----30秒，65度----30秒，72度----1分钟，共3～5个循环，4度保存；

9.11对扩增产物进行片段选择、纯化；

步骤十、高通量测序和数据分析。

10.1用Bioanalyzer_2100分析系统(Agilent)检测高通量测序文库插入片段的大小，并利用QPCR对文库的浓度进行绝对定量分析；

10.2在Illumina HiSeq2500测序仪上，按照读长为150bp的双末端测序，对文库进行高通量测序分析，获得原始测序数据；

10.3数据分析：首先去除任何接头序列和低质量序列，然后应用Bismark软件将数据与参考人类基因组序列(Hg19)进行比对，并以此为基础进行后续的生物信息学分析。

实验结果：

表10：测序信息

*:靶向比例＝靶向映射读数/干净读数

干净读数(Clean reads)：满足以下任一条件的序列将被去掉，保留下来的序列为干净读数(Clean reads)：

(1)质量值(Q)低于5(即错误率大于32)的碱基占比大于50％

(2)为N的碱基占比大于10％

(3)去掉接头序列后，序列长度小于37bp的序列。

独特映射读数(Uniquely mapping reads)：保留只比对到一个位点的序列，如果一条序列可以比对到多个基因组位点，则删除。

CGI映射读数(CGI mapping reads)：位于CpG岛上的序列靶向映射读数(Targeting mapping reads)：位于靶向位点的序列

表11：靶向位点读数信息

序列表

<110> 北京大学

<120> 选择性扩增核酸序列的方法

<130> IDC170195

<160> 52

<170> PatentIn version 3.5

<210> 1

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> T1.1-1

<220>

<221> misc_feature

<222> (32)..(43)

<223> H是A、T或C

<400> 1

tttccctaca cgacgctctt ccgatctttc chhhhhhhhc gch 43

<210> 2

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> T1.1-2

<220>

<221> misc_feature

<222> (32)..(43)

<223> H是A、T或C

<400> 2

tttccctaca cgacgctctt ccgatctttc chhhhhhhcg hch 43

<210> 3

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> T1.1-3

<220>

<221> misc_feature

<222> (32)..(43)

<223> H是A、T或C

<400> 3

tttccctaca cgacgctctt ccgatctttc chhhhhhcgh hch 43

<210> 4

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> T1.1-4

<220>

<221> misc_feature

<222> (32)..(43)

<223> H是A、T或C

<400> 4

tttccctaca cgacgctctt ccgatctttc chhhhhcghh hch 43

<210> 5

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> T1.2-1

<220>

<221> misc_feature

<222> (32)..(43)

<223> H是A、T或C

<400> 5

tttccctaca cgacgctctt ccgatcttcc thhhhhhhhc gch 43

<210> 6

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> T1.2-2

<220>

<221> misc_feature

<222> (32)..(43)

<223> H是A、T或C

<400> 6

tttccctaca cgacgctctt ccgatcttcc thhhhhhhcg hch 43

<210> 7

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> T1.2-3

<220>

<221> misc_feature

<222> (32)..(43)

<223> H是A、T或C

<400> 7

tttccctaca cgacgctctt ccgatcttcc thhhhhhcgh hch 43

<210> 8

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> T1.2-4

<220>

<221> misc_feature

<222> (32)..(43)

<223> H是A、T或C

<400> 8

tttccctaca cgacgctctt ccgatcttcc thhhhhcghh hch 43

<210> 9

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> T1.3-1

<220>

<221> misc_feature

<222> (32)..(43)

<223> H是A、T或C

<400> 9

tttccctaca cgacgctctt ccgatctcta chhhhhhhhc gch 43

<210> 10

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> T1.3-2

<220>

<221> misc_feature

<222> (32)..(43)

<223> H是A、T或C

<400> 10

tttccctaca cgacgctctt ccgatctcta chhhhhhhcg hch 43

<210> 11

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> T1.3-3

<220>

<221> misc_feature

<222> (32)..(43)

<223> H是A、T或C

<400> 11

tttccctaca cgacgctctt ccgatctcta chhhhhhcgh hch 43

<210> 12

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> T1.3-4

<220>

<221> misc_feature

<222> (32)..(43)

<223> H是A、T或C

<400> 12

tttccctaca cgacgctctt ccgatctcta chhhhhcghh hch 43

<210> 13

<211> 39

<212> DNA

<213> 人工序列

<220>

<223> CM5.1-1

<220>

<221> misc_feature

<222> (28)..(39)

<223> H是A、T或C

<400> 13

tttccctaca cgacgctctt ccgatcthhh hhhhhcgch 39

<210> 14

<211> 39

<212> DNA

<213> 人工序列

<220>

<223> CM5.1-2

<220>

<221> misc_feature

<222> (28)..(39)

<223> H是A、T或C

<400> 14

tttccctaca cgacgctctt ccgatcthhh hhhhcghch 39

<210> 15

<211> 39

<212> DNA

<213> 人工序列

<220>

<223> CM5.1-3

<220>

<221> misc_feature

<222> (28)..(39)

<223> H是A、T或C

<400> 15

tttccctaca cgacgctctt ccgatcthhh hhhcghhch 39

<210> 16

<211> 39

<212> DNA

<213> 人工序列

<220>

<223> CM5.1-4

<220>

<221> misc_feature

<222> (28)..(39)

<223> H是A、T或C

<400> 16

tttccctaca cgacgctctt ccgatcthhh hhcghhhch 39

<210> 17

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> T2.5-Mme-D6CGCGCGG

<220>

<221> misc_feature

<222> (28)..(33)

<223> D是A、T或G

<400> 17

gtggtgatga caggagtcca acttcagddd dddcgcgcgg 40

<210> 18

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> T2.5-Mme-D6CGCGCGA

<220>

<221> misc_feature

<222> (28)..(33)

<223> D是A、T或G

<400> 18

gtggtgatga caggagtcca acttcagddd dddcgcgcga 40

<210> 19

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> T2.5-Mme-D4CGGCGGCGG

<220>

<221> misc_feature

<222> (28)..(31)

<223> D是A、T或G

<400> 19

gtggtgatga caggagtcca acttcagddd dcggcggcgg 40

<210> 20

<211> 45

<212> DNA

<213> 人工序列

<220>

<223> CM6.0-D4

<220>

<221> misc_feature

<222> (35)..(38)

<223> D是A、T或G

<400> 20

gtgactggag ttcagacgtg tgctcttccg atctddddcg cgcgg 45

<210> 21

<211> 45

<212> DNA

<213> 人工序列

<220>

<223> CM6.1-A-D4

<220>

<221> misc_feature

<222> (35)..(38)

<223> D是A、T或G

<400> 21

gtgactggag ttcagacgtg tgctcttccg atctddddcg cgcga 45

<210> 22

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> CM6.1-3CGG-D4

<400> 22

gtgactggag ttcagacgtg tgctcttccg atctddddcg gcggcgg 47

<210> 23

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> T3.0

<400> 23

tttccctaca cgacgctctt cgatct 26

<210> 24

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> T4.3-MmeI

<400> 24

gtggtgatga caggagtcca acttcag 27

<210> 25

<211> 58

<212> DNA

<213> 人工序列

<220>

<223> P1.0

<400> 25

aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58

<210> 26

<211> 54

<212> DNA

<213> 人工序列

<220>

<223> P6.2

<400> 26

caagcagaag acggcatacg agatatcgtg gtgactggag ttcagacgtg tgct 54

<210> 27

<211> 55

<212> DNA

<213> 人工序列

<220>

<223> La-EMBP1.1

<400> 27

gactggagtt cagacgtgtg ctcttccgat ctcggcgaga aggtattgga ggagg 55

<210> 28

<211> 63

<212> DNA

<213> 人工序列

<220>

<223> La-KCNQ5.1

<400> 28

gactggagtt cagacgtgtg ctcttccgat ctgtgtttag tagtagtagg tcgtcgtttt 60

tgg 63

<210> 29

<211> 64

<212> DNA

<213> 人工序列

<220>

<223> La-ZEB2.1

<400> 29

gactggagtt cagacgtgtg ctcttccgat ctggtcggtc gatttttttt tatttcgggg 60

tttg 64

<210> 30

<211> 50

<212> DNA

<213> 人工序列

<220>

<223> La-IKZF1.1

<400> 30

gactggagtt cagacgtgtg ctcttccgat ctggtcgagt cggttgcggg 50

<210> 31

<211> 57

<212> DNA

<213> 人工序列

<220>

<223> La-C9orf50.1

<400> 31

gactggagtt cagacgtgtg ctcttccgat ctggtttcgg ggattggagg atttcgg 57

<210> 32

<211> 56

<212> DNA

<213> 人工序列

<220>

<223> La-PRKCB.1

<400> 32

gactggagtt cagacgtgtg ctcttccgat ctggagtcgg agttcgagag gtgtcg 56

<210> 33

<211> 59

<212> DNA

<213> 人工序列

<220>

<223> La-PRKCB.2

<400> 33

gactggagtt cagacgtgtg ctcttccgat ctggtttgtg tttgttttgg agggtagcg 59

<210> 34

<211> 60

<212> DNA

<213> 人工序列

<220>

<223> La-COTL1.1

<400> 34

gactggagtt cagacgtgtg ctcttccgat ctggtttcgt gtatcgagtc ggtttttagg 60

<210> 35

<211> 55

<212> DNA

<213> 人工序列

<220>

<223> La-AKR1B1.1

<400> 35

gactggagtt cagacgtgtg ctcttccgat ctagagtgtg aggcgagttt cgggt 55

<210> 36

<211> 57

<212> DNA

<213> 人工序列

<220>

<223> La-FAR1.1

<400> 36

gactggagtt cagacgtgtg ctcttccgat ctgagatagc ggggttgtta ttgtggc 57

<210> 37

<211> 56

<212> DNA

<213> 人工序列

<220>

<223> La-KCNMB4.1

<400> 37

gactggagtt cagacgtgtg ctcttccgat cttggtgtcg gaggcgtgat ttagtc 56

<210> 38

<211> 56

<212> DNA

<213> 人工序列

<220>

<223> Lb-VIM.1

<400> 38

gactggagtt cagacgtgtg ctcttccgat ctggttgcgg cgaggtttga gttttg 56

<210> 39

<211> 67

<212> DNA

<213> 人工序列

<220>

<223> Lb-SEPT9.1

<400> 39

gactggagtt cagacgtgtg ctcttccgat ctttcgttgt ttattagtta ttatgtcgga 60

tttcgcg 67

<210> 40

<211> 53

<212> DNA

<213> 人工序列

<220>

<223> Lb-EMBP1.1

<400> 40

gactggagtt cagacgtgtg ctcttccgat ctggttcggg ttttcgcggg tag 53

<210> 41

<211> 65

<212> DNA

<213> 人工序列

<220>

<223> Lb-CTPS1.1

<400> 41

gactggagtt cagacgtgtg ctcttccgat cttttttcgt attttcgttt tggaggttag 60

ggtgg 65

<210> 42

<211> 52

<212> DNA

<213> 人工序列

<220>

<223> Lc-INTER3069.1

<400> 42

gactggagtt cagacgtgtg ctcttccgat ctggtcgttt tcgggggcga gg 52

<210> 43

<211> 67

<212> DNA

<213> 人工序列

<220>

<223> Lc-TBCD.1

<400> 43

gactggagtt cagacgtgtg ctcttccgat ctttttattt cgtagttcgg tttatcgcgt 60

tttaggt 67

<210> 44

<211> 59

<212> DNA

<213> 人工序列

<220>

<223> Lc-MDGA1.1

<400> 44

gactggagtt cagacgtgtg ctcttccgat ctaggcggcg tttcgattta ataggttac 59

<210> 45

<211> 51

<212> DNA

<213> 人工序列

<220>

<223> Lc-ST8SIA6.1

<400> 45

gactggagtt cagacgtgtg ctcttccgat ctgagtcgcg agtcggggtc g 51

<210> 46

<211> 62

<212> DNA

<213> 人工序列

<220>

<223> Lc-ERN1.1

<400> 46

gactggagtt cagacgtgtg ctcttccgat ctttagatgt ttcgtgagtt tagtcgtggg 60

ag 62

<210> 47

<211> 58

<212> DNA

<213> 人工序列

<220>

<223> Lc-GLT25D2.1

<400> 47

gactggagtt cagacgtgtg ctcttccgat ctgagggttt tgggaatcgt agtcgtcg 58

<210> 48

<211> 46

<212> DNA

<213> 人工序列

<220>

<223> Ld-EMBP1.1

<400> 48

gactggagtt cagacgtgtg ctcttccgat ctcgagaagg tattgg 46

<210> 49

<211> 56

<212> DNA

<213> 人工序列

<220>

<223> Primer1.0

<400> 49

aatgatacgg cgaccaccga gatctacact ctttccctac acgacgcttc cgatct 56

<210> 50

<211> 54

<212> DNA

<213> 人工序列

<220>

<223> Primer6.2

<400> 50

caagcagaag acggcatacg agatctgatc gtgactggag ttcagacgtg tgct 54

<210> 51

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> Q-P1

<400> 51

aatgatacgg cgaccaccga 20

<210> 52

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> Q-P2

<400> 52

caagcagaag acggcatacg a 21

Claims

1.一种选择性扩增核酸序列的方法，所述方法包括：

在聚合酶和核苷酸的存在下延伸所述引物T2，

任选重复这样的杂交和延伸一次或多次，

从而获得包含位于3’的第一共同序列互补序列的延伸链，

e.任选地，扩增步骤d的产物。

2.权利要求1的方法，其中提供在一端包含第一共同序列的多种不同的核酸分子的步骤包括：

将包含核酸分子的核酸样品与引物T1杂交，所述引物T1包含位于5’的第一共同序列，任选地，所述引物T1还包含在所述第一共同序列的3’的标签序列，

在聚合酶和核苷酸的存在下延伸所述引物T1，和

任选重复这样的杂交和延伸一次或多次，

例如，还包括在步骤a或b之后将来自多于一个核酸样品的核酸分子合并在一起，

例如，来自同一核酸样品的核酸分子具有相同的标签序列，

例如，所述引物T1是随机引物，

例如，所述引物T1包含位于3’的用于靶向非独特性核酸序列的靶向序列，

例如，所述非独特性核酸序列是基因组重复序列，

例如，所述非独特性核酸序列是含CpG的序列。

3.权利要求1的方法，其中提供在一端包含第一共同序列的多种不同的核酸分子的步骤包括将第一共同序列和任选标签序列连接至核酸分子的一端，

例如，所述连接包括通过DNA连接酶或转座酶进行的连接。

例如，来自同一核酸样品的核酸分子具有相同的标签序列。

4.权利要求1-3中任一项的方法，其中步骤d包括以下子步骤：

d1.将一种或多种靶向探针与步骤c的产物杂交，

所述一种或多种靶向探针各自包含位于5’的内侧靶向序列和位于3’的第二共同序列互补序列，并且在杂交后所述位于3’的第二共同序列互补序列位于杂交的延伸链的5’端，或

所述一种或多种靶向探针各自包含位于5’的第二共同序列互补序列和位于3’的内侧靶向序列，并且在杂交后所述位于5’的第二共同序列互补序列位于杂交的延伸互补链的3’端，

d2.在连接酶的存在下将第二共同序列连接在杂交的延伸链的5’端或将第二共同序列连接在杂交的延伸互补链的3’端。

5.权利要求1-4中任一项的方法，其中所述修剪使得延伸链中的引物T2和任选延伸互补链中的引物T2的互补链保留不多于3个核苷酸，

优选地，其中所述修剪使得延伸链中的引物T2和任选延伸互补链中的引物T2的互补链被完全去除，

例如，其中所述一种或多种引物T2具有合成核苷酸类似物以允许对其修剪，

例如，其中所述一种或多种引物T2各自还包含位于5’的限制性酶切位点，

例如，其中所述修剪包括使用识别所述限制性酶切位点的限制性内切酶消化步骤b的产物，从而获得经限制性消化的产物，

例如，其中所述限制性内切酶选自AcuI,AlwI,BbsI,BbvI,BccI,BceAI,BciVI,BfuAI,BmrI,BpmI,BpuEI,BsaI,BseRI,BsgI,BspMI,BspQI,BsmAI,BsmBI,BsmFI,BspCNI,BtgZI,EarI,EciI,EcoP15I,FauI,FokI,HphI,HpyAV,HaeIII,HgaI,HinfI,MboII,MlyI,MmeI,MnlI,NmeAIII,PleI,SfaNI。

6.权利要求1-5中任一项的方法，其中所述一种或多种引物T2各自还包含第三共同序列，

例如，还包括在步骤c之前使用针对所述第三共同序列和所述第一共同序列互补序列的引物扩增步骤b的产物。

7.权利要求1-6中任一项的方法，其中所述一种或多种引物T2的外侧靶向序列各自包含靶向非独特性核酸序列的序列或靶向独特性核酸序列的序列，

例如，所述非独特性核酸序列是基因组重复序列，

例如，所述非独特性核酸序列是含CpG的序列，

例如，其中靶向非独特性核酸序列的序列为CpG短串联序列，所述CpG短串联序列为长度大于或等于7个核苷酸，且3’端起前7个核苷酸中包含2个或3个CpG，

优选地，3’端起前10个核苷酸中C与G之和大于或等于7个，

例如，所述靶向非独特性核酸序列的序列选自CGCGCGG,CGGCGGCGG,CGCGCGA,CGCGCGT和CGACGACGA。

8.权利要求1-7中任一项的方法，其中所述核酸分子在步骤a之前经修饰剂处理，以便将核酸分子中的胞嘧啶转换，而5’甲基胞嘧啶不变，

优选地，所述修饰剂为亚硫酸氢盐。

9.权利要求1-8中任一项的方法，其中所述第二共同序列包含保护基，

例如，还包括在步骤d之后和任选的步骤e之前使外切核酸酶与步骤c的产物接触，以降解非期望的核酸分子。

10.权利要求1-9中任一项的方法，还包括对选择性扩增的核酸序列进行测序。

11.一种试剂盒，其包含用于执行权利要求1-10中任一项的方法所需的一种或多种试剂。