CN110699426A

CN110699426A - 基因目标区域富集方法及试剂盒

Info

Publication number: CN110699426A
Application number: CN201910897689.5A
Authority: CN
Inventors: 郭志伟; 李英辉; 陈倩; 胡荣君
Original assignee: Shanghai Jundi Gene Technology Co Ltd
Current assignee: Shanghai Jundi Gene Technology Co Ltd
Priority date: 2019-01-02
Filing date: 2019-09-20
Publication date: 2020-01-17
Anticipated expiration: 2039-09-20
Also published as: CN110699426B; EP3907296A1; JP7202556B2; JP2022510723A; WO2020140693A1; US20230159984A1; EP3907296A4

Abstract

本发明涉及生物技术领域，特别是涉及一种基因目标区域富集方法及试剂盒。本发明提供一种基因目标区域富集方法，包括：(1)通过特异性探针扩增包括目标区域的片段化DNA，以提供捕获延伸产物，所述的特异性探针包括与所述片段化DNA的目标区域互补的序列，所述特异性探针的3’末端核苷酸被修饰，用于阻止所述特异性探针的3’末端发生连接反应；(2)将步骤(1)所提供的捕获延伸产物的3’末端连接接头DNA，以提供连接产物。本发明所提供的富集方法操作简单、结果可靠，针对片段长度较短的DNA使用，可以最大程度的减少原始分子尤其是稀有分子的损失，最高效地富集目标分子。

Description

基因目标区域富集方法及试剂盒

技术领域

本发明涉及生物技术领域，特别是涉及一种基因目标区域富集方法及试剂盒。

背景技术

基因测序技术自上世纪七十年代问世以来已经历了近半个世纪，1985年PCR技术的横空出世推动了整个分子生物学领域的发展。下一代测序技术(NGS)具有准确、灵敏、通量高的优点，随着测序成本的不断降低，其应用范围不断扩大，但其应用也受到了需求多样化且费时费力的文库构建这一步骤的制约。在对临床样本比如血浆样本的建库过程中，DNA的存在形式通常是短片段的，受损的，单链或部分双链的，对于这些存在形式的尤其是片段小于200bp的DNA来说，现有的PCR技术并不能做到很好的捕获和富集。

对于微小DNA片段的富集，现有技术仍主要使用传统的PCR建库方法或先加接头连接再扩增的方法比如杂交捕获法。但对于前者来说，由于需要双端引物，极大限制了适合扩增的片段的长度，且存在扩增中的偏好性导致产物的高不均一性，以及指数扩增累积的错误导致后续测序结果不准确的问题；而对于后者，虽然对待富集片段长度的要求没有PCR高，但需要先进行连接反应，而连接的效率通常只有20％～50％，导致捕获效率低下，还存在因连接困难容易丢失稀有分子的问题。为了解决NGS的建库问题，近期发展起来的技术还包括诸如分子倒置探针、多重PCR等。分子倒置探针与杂交捕获技术相比，特异性较好，但其口袋状探针设计复杂，也不适用于微小DNA片段的富集。多重PCR技术适合大规模样本，应用最为广泛，但要么引物设计要求极高且扩增子均一性差，要么扩增产物均一性较好但对起始样本浓度要求很高，同样不适用于起始浓度低的微小DNA片段的富集。这些现有技术构建文库时通常需要双端引物，为了去除接头二聚体污染必然引入纯化步骤，这导致小片段的双链 DNA、受损伤的双链DNA和单链DNA分子的信息丢失。然而，在一些转录活跃的基因组区域恰恰是这些存在形式的DNA。综上所述，现有技术对片段化的，尤其是200bp以下的微小DNA进行富集的需求严重未能满足，而找到高效富集片段化DNA目标区域的方法，突破连接效率对富集效果的瓶颈，抑制非目的连接产物的产生，最大程度的捕获稀有分子并保持产物的均一性，是本发明要解决的主要技术问题。

发明内容

鉴于以上所述现有技术的缺点，本发明的目的在于提供一种基因目标区域富集方法，用于解决现有技术中的问题。

为实现上述目的及其他相关目的，本发明提供一种基因目标区域富集方法，包括：

(1)通过特异性探针扩增包括目标区域的片段化DNA，以提供捕获延伸产物，所述的特异性探针包括与所述片段化DNA的目标区域互补的序列，所述特异性探针的3’末端核苷酸被修饰，用于阻止所述特异性探针的3’末端发生连接反应；

(2)将步骤(1)所提供的捕获延伸产物的3’端连接接头DNA，以提供连接产物。

本发明另一方面提供一种用于富集片段化DNA目标区域的试剂盒，包括适用于所述的基因目标区域富集方法的特异性探针和接头DNA。

附图说明

图1是本发明实施例中对于目标区域富集过程的流程示意图。

图2是本发明实施例所构建的文库分子示意图。

图3是本发明实施例中校准品的构建示意图。

图4是本发明实施例中单特异性检测体系的流程示意图。

具体实施方式

本发明发明人经过大量探索性研究，提供了一种基因目标区域富集方法，所述基因目标区域富集方法操作简单、结果可靠，尤其对于短片段核酸具有良好的富集效果，在此基础上完成了本发明。

本发明第一方面提供一种基因目标区域富集方法，包括：

本发明所提供的基因目标区富集方法中，可以包括：通过特异性探针扩增包括目标区域的片段化DNA，以提供捕获延伸产物。反应时，所述特异性探针可以在捕获目标区域互补序列的基础上延伸，获得捕获延伸产物(Capture-Extension Product,CEP)。

所述基因目标区域富集方法中，通过特异性探针扩增包括目标区域的片段化DNA的反应中，包括目标区域的片段化DNA可以是一个，也可以是多个。通常来说，特异性探针与包括目标区域的片段化DNA是一一对应的，即反应体系中特异性探针的数量可以是一种，也可以多种。此步骤所述的延伸指的是对样本的整个预扩增步骤，包括单轮或多轮变性、退火、延伸步骤的循环。优选的实施例中，此步骤实施多轮循环，比如2～100、2～10、10～20、20～30、 30～40、40～60、60～80、80～100个循环，有效地增加包含目标区域的分子数。

所述基因目标区域富集方法中，所述片段化DNA可以是双链DNA、单链DNA和cDNA等，所述cDNA通常可以由RNA反转录获得。对于双链DNA来说，特异性探针可以包括与所述片段化DNA其中一链的目标区域互补的序列。所以本发明的富集方法也适用于片段化 RNA，本领域技术人员可以将RNA反转录成cDNA即可通过本发明所提供的富集方法进行后续操作。所述片段化DNA的长度可以是25～200bps、25～40bps、40～60bps、60～80bps、 80～100bps、100～120bps、120～140bps、140～160bps、160～180bps、或180～200bps。

所述基因目标区域富集方法中，所述步骤(1)的扩增体系中可以包括特异性探针、DNA 聚合酶和dNTP。通过特异性探针扩增包括目标区域的片段化DNA的反应通常可以在DNA聚合酶存在的条件下进行，3'端封闭修饰的探针在高保真聚合酶的作用下结合模板后，封闭基团被切除，探针被活化，从而可以对目标序列进行有效延伸。所述DNA聚合酶可以具有3’- 5’外切酶活性，从而可以切除结合模板后的探针3’端的取代基团，使探针能够延模板延伸，优选可以为高保真DNA聚合酶，用于进一步提高产物的扩增效率和纯度。所述DNA聚合酶也可以是普通的DNA聚合酶(即对应不具有3’-5’外切酶活性)。所述步骤(1)的扩增体系中还包括活性物质，所述活性物质可以用于切除结合目标区域后所述特异性探针的3’末端修饰基团，还可以在捕获延伸体系中与DNA聚合酶(例如，普通的DNA聚合酶)组合，以提升扩增体系的效率，所述活性物质优选为核酸酶。通过特异性探针扩增包括目标区域的片段化DNA的反应通常可以在dNTP存在的条件下进行，所述dNTP通常可以是偶联标记分子的dNTP，所述偶联标记分子可以是包括但不限于生物素等，所述dTNP可以是包括但不限于dCTP、dATP等。所述dNTP还可以偶联有标记分子，所述标记分子可以是生物素等，所述标记分子通常可以用于捕获延伸产物的纯化。

所述基因目标区域富集方法中，所述的特异性探针包括与所述片段化DNA的目标区域互补的序列，从而可以实现对片段化DNA的目标区域的特异性扩增，本领域技术人员可选择合适的片段化DNA的目标区域，并根据片段化DNA的目标区域，设计合适的互补的序列。所述特异性探针可以是3’末端核苷酸被修饰的特异性探针，用于阻止所述特异性探针的3’末端与其他基团发生连接反应，从而可以避免游离探针的自连或连接其它非目的分子，例如，非目的分子可以是接头DNA等。本领域技术人员可选择合适的修饰基团以实现特异性探针 3’末端的修饰，例如，所修饰的基团可以取代特异性探针3’末端核苷酸上的天然基团(例如，羟基等)，以阻止所述特异性探针3’端发生连接反应，所使用的修饰基团通常可以是封闭基团。探针通过互补序列与模板上的目标区域结合后，3’端的修饰基团可以被酶切除，使得探针被活化，从而可以对目标序列进行有效延伸。特异性探针的3’末端修饰基团可以是包括但不限于氢原子、C3 Spacer基团、C6 Spacer基团、磷酸基团(PO₄)、氨基(NH₂)等。不同取代基团的选择对于探针的捕获效果有明显差异，在本发明一优选实施例中，将探针3’端羟基取代为C3 Spacer得到的效果最佳，与其它取代基团相比具有明显优势。所述特异性探针还包括通用序列，所述通用序列通常能被测序系统识别，从而可以将后续提供的连接产物通过测序系统进行测序，例如，对于Ion Torrent测序系统，所述通用序列可以是对应的P1序列。在本发明一优选实施方式中，所述特异性探针3’端尾部区域的碱基可以包含错配，错配的可以是探针3’端最后一个碱基，也可以是接近3’端的碱基；错配的可以是一个碱基，也可以是复数个。该错配不仅不影响探针的特异性和结合效率，还更有利于提高高保真DNA聚合酶的切割效率和保真度。

所述基因目标区域富集方法中，所述步骤(1)中，还可以包括纯化捕获延伸产物。本领域技术人员可选择合适的方法对捕获延伸产物进行纯化，例如，捕获延伸产物的纯化方法可以是包括磁珠纯化等。在本发明一具体实施例中，可以通过标记分子对捕获延伸产物进行纯化，纯化过程可以使用亲和素或者链霉亲和素包被的磁珠的固相纯化方法等。

本发明所提供的基因目标区富集方法中，还可以包括：将步骤(1)所提供的捕获延伸产物的3’端连接接头DNA，以提供连接产物。

所述基因目标区域富集方法中，将捕获延伸产物的3’端连接接头DNA的连接体系中可以包括单链连接酶，所述单链连接酶使接头DNA的5’端连接到所述捕获延伸产物的3’端，所述单链连接酶优选为T4 RNA连接酶或热稳定性RNA连接酶等。

所述基因目标区域富集方法中，所述接头DNA可以是5’末端核苷酸被修饰的、且在步骤(2)的反应温度下为单链结构，从而可以在单链连接酶的催化下，通过捕获延伸产物的3’端羟基与接头DNA5’末端的修饰基团生成共价键，得到连接产物。在本发明一具体实施方式中，接头DNA的5’末端核苷酸(例如，具体可以为的5’末端核苷酸的5位羟基)被磷酸基团取代，从而形成磷酸化修饰，在单链连接酶的催化下，捕获延伸产物的3’端羟基与接头DNA磷酸化的5’末端生成共价键，得到连接产物。在本发明另一具体实施方式中，接头DNA的5’末端核苷酸(例如，具体可以为的5’末端核苷酸的5位羟基)被腺苷基团取代，从而形成腺苷酸化修饰，在5′App DNA/RNA热稳定连接酶的催化下，接头DNA的5’末端可以与捕获延伸产物的3’端发生连接反应。在本发明另一具体实施方式中，接头DNA的5’末端核苷酸(例如，具体可以为的5’末端核苷酸的5位羟基)被磷酸基团取代，从而形成磷酸化修饰，在热稳定RNA连接酶的催化下，接头DNA的5’末端可以与捕获延伸产物的3’端发生连接反应。所述接头DNA也可以是5’端区域具有黏性末端的部分双链结构，其5’端区域的黏性末端具有单链性质，从而可以通过如上所述的方法对5’端进行修饰，在合适的单链连接酶催化下，可以与捕获延伸产物连接。所述接头DNA还可以包括通用序列、样本标签序列、分子标签序列等中的一种或多种的组合，这些序列通常可以被测序系统识别的，从而可以对制备获得的连接产物进行测序。例如，对于Ion Torrent测序系统，所述通用序列可以为A序列，所述样本标签序列可以是barcode，与其对应的分子标签序列等。引入barcode有利于后续的生信分析中对不同来源的样本进行区别，从而实现在单次反应中同时进行多个样本的测序以提高通量。引入分子标签有利于后续的生信分析中识别不同分子，以便进一步对后续扩增中产生的变异进行识别。这些能被测序系统识别的序列的应用，使本发明完成建库后的文库能够通过高通量测序平台进行测序，以提供各种后续研究和临床应用所需要的信息。

在本发明一优选实施例中，所述接头DNA的3’端羟基也被其他基团取代，以阻止所述接头DNA 3’端的连接反应，避免其自连或连接其它非目的分子，比如来自步骤(1)的游离探针。

所述基因目标区域富集方法中，所述步骤(2)中，还可以包括纯化连接产物。本领域技术人员可选择合适的方法对连接产物进行纯化，例如，连接产物的纯化方法可以是包括但不限于硅胶柱纯化、加热处理等。

本发明所提供的基因目标区域富集方法，可以用于基因检测。通过扩增后的连接产物进一步进行基因检测的方法对于本领域技术人员来说应该是已知的。在本发明一具体实施例中，所述目标区域富集的方法可以应用于高通量测序中。在本发明另一具体实施例中，本发明目标区域富集的方法可以应用于基因序列检测中，例如，所述的目标区域包括：序列发生变异的位点，更具体可以是单碱基突变位点区域，碱基缺失位点区域，碱基插入位点区域和融合突变位点区域等。在本发明另一具体实施例中，本发明目标区域富集的方法可以应用于基因修饰状态的检测中，例如，所述的目标区域包括可能存在甲基化位点的区域，再例如，所述的DNA片段经过了重亚硫酸盐的处理。

本发明所提供的基因目标区域富集方法，还可以包括：(3)扩增步骤(2)所提供的连接产物。通常可以通过DNA聚合酶和PCR扩增引物对连接产物进行PCR扩增，通过扩增连接产物，可以进一步富集含有目标区域的DNA的产物。本领域技术人员可选择合适的方法和体系对步骤(2)所提供的连接产物进行扩增，例如，PCR扩增引物具有与所述特异性探针的通用序列和/或所述接头DNA的通用序列相配合，具体的，所述的PCR扩增引物具有与所述特异性探针的通用序列和所述接头DNA的通用序列至少部分互补的序列。

本发明所提供的基因目标区域富集方法，还可以包括：(4)对扩增后的连接产物进行测序，以提供目标区域的测序结果。在对连接产物进行PCR扩增之后，可以通过识别扩增产物中的通用序列对扩增产物进行测序，获得目标区域的测序结果。本领域技术人员可选择合适的方法和体系对扩增后的连接产物进行测序，例如，基于Ion Torrent平台的P1序列和A序列进行测序，获得目标区域的测序结果。需要说明的是，本发明的富集方法可使步骤(2)得到的连接产物包含任意测序通用序列，比如可以是Ion Torrent测序平台，也可以是Illumina 测序平台，当然也可以是其它测序平台的通用序列。

本发明所提供的基因目标区域富集方法，还可以包括：(5)用检测引物1、检测引物2 和探针3检测步骤(2)提供的连接产物，以非二代测序而是PCR检测的手段快速提供目标区域的检测结果。所述的检测引物1、检测引物2和探针3中，至少其一包含基因特异性序列，也即是说，对于不同的基因目标区域，三种引物/探针有关特异性序列的组合可以是单特异性、双特异性或三特异性。在本发明一个实施例中，所述检测引物1包含基因特异性序列，检测引物2和探针3包含通用序列，或检测引物1和检测引物2包含基因特异性序列；或检测引物1和探针3包含基因特异性序列，或检测引物1、检测引物2和探针3均包含基因特异性序列。在一些实施例中，探针3还可以包含标记分子，比如可以是荧光分子，且探针3 的序列与检测引物1或2不互补。

本发明第二方面提供一种用于富集片段化DNA目标区域的试剂盒，包括适用于本发明第一方面所提供的基因目标区域富集方法的特异性探针和接头DNA。所述特异性探针和接头 DNA的结构在本发明第一方面已经详细描述，在此不作赘述。

本发明所提供的试剂盒中，还可以包括以下组分的一种或多种：RNA连接酶、偶联标记分子的dNTP、DNA聚合酶、核酸酶等。其中，RNA连接酶可以是热稳定性RNA连接酶、 T4RNA连接酶、或5′App DNA/RNA热稳定连接酶等；dTNP可以是dCTP，也可以是dATP。所述DNA聚合酶可以是具有3’-5’外切酶活性的DNA聚合酶，优选的，所述DNA聚合酶选用高保真聚合酶。

本发明所提供的试剂盒中，还可以包括用于PCR扩增的正向引物和反向引物，它们通常与特异性探针的通用序列和所述接头DNA的通用序列相配合，具体可以具有与所述特异性探针的通用序列和所述接头DNA的通用序列至少部分互补的序列。

本发明所提供的试剂盒中，还可以包括用于PCR检测的检测引物1、检测引物2和探针 3，三者中至少其一含有基因特异性序列，具体的可以是单特异性、双特异性或三特异性的引物/探针组合。优选的情况下，仅检测引物1包含基因特异性序列，检测流程请参考图4。

在本发明一优选实施例中，通过本发明的方法或试剂盒进行文库构建后，文库分子(例如，步骤(2)所提供的连接产物，结构可以如图2所示)在结构上依次包含以下序列：5’端测序通用序列、基因特异性探针序列、富集到的目标区域序列、接头序列、barcode、分子标签序列、3’端测序通用序列，如图2所示。其中富集到的目标区域包含富集前样本DNA的序列信息，该部分序列的特点是：5’端在基因组上的位置是固定的，由特异性探针决定；而3’端位置不固定，由建库初始的DNA片段化状态决定。因此，在富集后的数据分析中，该序列的3’端在基因组上的位置也可以起到分子标签的作用。分子标签可用于区分不同分子，提高检测的灵敏度与准确性。

本发明的有益效果在于，首先，在连接前先对所有片段化DNA样本的目标区域通过捕获延伸的手段进行预扩增，避免在连接阶段因连接酶连接效率不足所致的原始目标分子的损失或漏检，特别是小片段和稀有分子；预扩增阶段的延伸反应属于线性扩增，没有PCR扩增的偏好性，也不会累积PCR扩增所引入的错误，与常规PCR建库技术相比，产物均一性好且后续的测序结果更准确；其次，预扩增阶段，只需为每个目标基因设计一条长约30bp的单链探针，避开了为短片段如cfDNA和更短片段如ctDNA设计双端引物的困难，既提高了建库成功率还提升了建库便利性；而封闭探针3’端，可以阻断探针与模板之外的非目的连接，有效降低游离探针引起的背景噪声，辅以偶联标记分子的dNTP及其纯化系统，进一步提高目的产物纯度，使样本DNA分子达到理论最高转化率；再次，将接头DNA的5’端修饰后，在单链连接酶催化下能很好地连接到延伸产物的3’端但不会连接到封闭修饰的特异性探针 3’端，同时封闭接头3’端避免接头的自连和错连，提高目的连接产物在终产物中的比例。最后，富集目标区域的过程中，或在探针和接头上设置好测序通用序列、样本标签序列和分子标签序列，达到建库完成后直接测序和数据分析的目的；或用本发明独创的单、双或三特异性引物/探针体系对目标区域进行快速检测。综上所述，本发明的富集方法及试剂盒，操作简单，结果可靠，针对片段长度小于200bp的DNA使用，可以最大程度的减少原始分子尤其是稀有分子的损失，最高效地富集目标分子；且该富集方法及试剂盒保真性极高，通过后续生信手段可使在测序过程中产生的碱基错误得到有效纠正，得到理论上可达到的最高测序准确率。

以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。

在进一步描述本发明具体实施方式之前，应理解，本发明的保护范围不局限于下述特定的具体实施方案；还应当理解，本发明实施例中使用的术语是为了描述特定的具体实施方案，而不是为了限制本发明的保护范围；在本发明说明书和权利要求书中，除非文中另外明确指出，单数形式“一个”、“一”和“这个”包括复数形式。

当实施例给出数值范围时，应理解，除非本发明另有说明，每个数值范围的两个端点以及两个端点之间任何一个数值均可选用。除非另外定义，本发明中使用的所有技术和科学术语与本技术领域技术人员通常理解的意义相同。除实施例中使用的具体方法、设备、材料外，根据本技术领域的技术人员对现有技术的掌握及本发明的记载，还可以使用与本发明实施例中所述的方法、设备、材料相似或等同的现有技术的任何方法、设备和材料来实现本发明。

除非另外说明，本发明中所公开的实验方法、检测方法、制备方法均采用本技术领域常规的分子生物学、生物化学、染色质结构和分析、分析化学、细胞培养、重组DNA技术及相关领域的常规技术。这些技术在现有文献中已有完善说明，具体可参见Sambrook等MOLECULAR CLONING：A LABORATORY MANUAL，Second edition，Cold Spring HarborLaboratory Press， 1989and Third edition，2001；Ausubel等，CURRENT PROTOCOLS INMOLECULAR BIOLOGY， John Wiley&Sons，New York，1987and periodic updates；theseries METHODS IN ENZYMOLOGY，Academic Press，San Diego；Wolffe，CHROMATINSTRUCTURE AND FUNCTION， Third edition，Academic Press，San Diego，1998；METHODSIN ENZYMOLOGY，Vol.304，Chromatin(P.M.Wassarman and A.P.Wolffe，eds.)，AcademicPress，San Diego，1999；和METHODS IN MOLECULAR BIOLOGY，Vol.119，ChromatinProtocols(P.B.Becker，ed.)Humana Press，Totowa，1999等。

实施例1

实施例1中所用寡核苷酸序列如表1所示：

表1

此实施例中的探针包含测序通用序列，即斜体标示的碱基，此处包含有IonTorrent测序系统中的P1序列。表中所有探针的特异性序列都针对EGFR基因21外显子的L858R突变。其中，探针1(SEQ ID NO.1)3’端无修饰，探针2、3和4(SEQ ID NO.2，SEQ IDNO.7， SEQ ID NO.8)3’端羟基被替换为C3 Spacer，探针2p(SEQ ID NO.3)3’端羟基被替换为磷酸基，探针2c(SEQ ID NO.4)3’端羟基被替换为C6 Spacer，探针2n(SEQ ID NO.5)3’端羟基被替换为磷酸基，探针2d(SEQ ID NO.6)3’端羟基被替换为双脱氧胞嘧啶(DDC)；其中，探针3(SEQ ID NO.7)的最后一个碱基为错配碱基，探针4(SEQ ID NO.8)中靠近3’端的G被替换为RNA碱基rG。

接头ABar-X1/2/3(SEQ ID NO.9，SEQ ID NO.10，SEQ ID NO.11)中包含测序通用序列, 即斜体标示的碱基，此处为Ion Torrent测序系统中的A序列；下划线部分序列为barcode，在本发明不同的样本中可以被替换成不同的barcodes，此部分的变化在本发明中不再累述。“N”部分为分子标签序列，其中NNNNNN为随机序列，用以标记同一样本中不同的延伸产物分子。接头ABar-X1和ABar-X2(SEQ ID NO.9，SEQ ID NO.10)的5’端为磷酸化修饰，接头 ABar-X3(SEQ ID NO.11)的5’端为腺苷酸化修饰；ABar-X2和ABar-X3(SEQ IDNO10， SEQ ID NO.11)的3’端的羟基被替换为C3 Spacer。

EF-1和ER-1(SEQ ID NO.12，SEQ ID NO.13)是用于PCR检测EGFR目的序列的前后引物，EM-1(SEQ ID NO.14)为MGB探针。AF和AR(SEQ ID NO.15，SEQ ID NO.16)分别是用来扩增文库的前后引物，与文库中的通用序列，即上述探针中的P1序列和接头中的A 序列匹配。

主要试剂与材料

血浆游离DNA提取试剂盒购自Qiagen；细胞DNA提取试剂盒与纯化单链DNA的试剂盒为RNA Clean Kit购自Tiangen Biotech；热稳定RNA连接酶购自美国Epicentre公司，高保真DNA聚合酶反应体系、Biotin-dCTP及用于纯化的MyOne Strptavidin C1试剂购自Invitrogen， DNA聚合酶、高保真DNA聚合酶和PCR反应试剂盒购自TOYOBO；RNAse H2热稳定性核酸酶购自IDT。Q5高保真DNA聚合酶、T4 RNA连接酶与5′App DNA/RNA热稳定连接酶购自NEB；Agencourt AMPure磁珠购自Beckman；相关过程中定量检测的校准品按照分子克隆常规方法构建，具体构建组成见图3所示。

步骤1、样本准备

用抽提试剂盒提取健康人血浆样本中的cfDNA与NCI-H1975细胞株(该细胞株为EGFR 基因21外显子L858R突变)中的DNA，通过Qubit荧光定量仪对DNA样本定量，将NCI-H1975细胞株的DNA打断成160bp左右的片段，按照10％，1％，0.1％，0.01％的比例掺入到健康人的cfDNA样本中，同时以健康人cfDNA作为空白对照(QC)。

步骤2、捕获延伸

按表2、表3、表4分别配制捕获延伸反应体系。

表2

表3

表4

捕获延伸的PCR程序如表5所示：

表5

捕获延伸程序完成后用RNA Clean Kit试剂盒对延伸产物进行硅胶柱纯化，用60ul洗脱缓冲液洗脱。(本发明中后续所指硅胶柱纯化，都与此步骤相同。)对于表4的延伸产物，在经过硅胶柱纯化后用链霉亲和素包被的磁珠再次纯化，并最终溶解于60ul洗脱缓冲液中。

步骤3、延伸效率检测

按照表6配制延伸产物的PCR检测体系。

表6

组分	用量(μL)	终浓度
			2×Taqman Mix	25	1×
ER-1(10uM)	1.5	300nM
			AF(10uM)	1.5	300nM
EM-1(10uM)	0.5	100nM
			H<sub>2</sub>O	17.5	/
延伸产物/校准品	4	/
			总体积	50	/

检测延伸效率的PCR程序如表7。

表7

步骤4、单链连接

根据步骤3的结果，选择步骤2得到的部分延伸产物分别按表8、表9、表10配制连接反应体系。

表8

表9

表10

得到连接产物后的处理如表11所示。

表11

步骤5、连接效率检测

按照表12配制PCR检测体系对步骤4的连接效率进行检测。

表12

检测连接效率的PCR程序如表13所示。

表13.

步骤6、文库扩增

按表14记载的反应体系和程序对步骤4得到的连接产物进行PCR扩增。

表14

反应结束后，取80μL Agencourt AMPure磁珠对扩增后的文库进行纯化，将纯化产物溶于 30ul洗脱缓冲液中洗脱，至此，待上机测序的文库构建完成。

步骤7、测序与数据分析

将制备好的文库在Ion Proton测序仪上进行测序，相关操作包括油包水PCR、文库富集、芯片加样和上机测序，具体操作流程详见Ion PITM Hi-Q^TM OT2 200Kit说明书和IonPITM Hi-Q^TM Sequencing 200Kit说明书。

实验结果及分析

结果中捕获延伸倍数、捕获效率及连接效率的计算方式如下：

捕获延伸倍率＝捕获后EGFR基因输出拷贝数/捕获前EGFR基因输入拷贝数

捕获效率＝(捕获延伸倍数-1)/捕获延伸循环数×100％

连接效率＝(连接产物输出拷贝数/延伸产物输入拷贝数)×100％

本实施例中所有过程数据(如捕获效率，连接效率)的分析都来自QC样本。

结果1、不同类型的聚合酶对不同探针的捕获延伸结果的影响。

表15.不同类型聚合酶的捕获延伸测试结果(QC样本)

表15中所涉及的捕获延伸反应体系参见表2和表3，其中，高保真聚合酶为2X高保真 DNA聚合酶PCR Master Mix(DNA聚合酶具有3’-5’外切酶活性)，普通聚合酶为2X DNA聚合酶PCR Master Mix(DNA聚合酶不具有3’-5’外切酶活性)，所使用的cfDNA样本为QC 样本，延伸效率检测的方法参见步骤3。

从测试结果可以看出：1)3'端封闭修饰的探针在高保真聚合酶的作用下结合模板后，封闭基团被切除，探针被活化，从而可以对目标序列进行有效延伸；2)热稳定性核酸酶与普通聚合酶联用，针对RNA基团修饰的探针也能起到活化效果，增强了本发明富集方法的适用性；3)不同取代基团的选择对于探针的捕获效果有明显差异，将探针3’端羟基取代为C3 Spacer得到的效果最佳，与其它取代基团相比具有明显优势。故此，本实施例从结果2开始的数据主要是针对将3’端羟基取代为C3 Spacer的探针得到的结果数据。

结果2、不同延伸循环数对部分探针延伸结果的影响。

表16.不同延伸循环数的测试结果(QC样本)

表16中所涉及的捕获延伸反应体系参见表2，所使用的cfDNA样本为QC样本，延伸效率检测的方法参见步骤3。

测试结果表明，通过循环数的增加可以有效提高捕获延伸倍率。

结果3、dNTP是否偶联标记分子对捕获延伸结果的影响。

表17.捕获延伸体系中掺入Biotin-dCTP的测试结果(QC样本)

表17中所涉及的捕获延伸反应体系参见表2和表4，所使用的cfDNA样本为QC样本，延伸效率检测的方法参见步骤3。

从结果可以看出，将偶联了Biotin的dCTP掺入捕获延伸体系，可有效标记延伸产物，提高捕获效率。

结果4、dNTP是否偶联标记分子对连接结果的影响。

表18.捕获延伸体系中掺入Biotin-dCTP后连接反应的测试结果(QC样本)

表18中所涉及的连接反应体系参见表8，其中，延伸产物为根据表2或表4中的体系制备获得的延伸产物，其中，各体系均使用高保真聚合酶，所述高保真聚合酶为2X高保真DNA 聚合酶PCR Master Mix(DNA聚合酶具有3’-5’外切酶活性)，所使用的cfDNA样本为QC样本，连接效率检测的方法参见步骤5。

结果表明，使用将3’端羟基替换为C3 Spacer的探针，配合使用偶联了biotin的dCTP和针对biotin的纯化系统，能获得最好的连接效果；而未经修饰的探针或者dNTP未结合biotin 的反应体系，几乎无法连接。

结果5、不同5’端修饰的探针和不同连接酶对连接效率的影响。

表19.连接体系中不同5’端修饰的探针和不同连接酶的测试结果(QC样本)

表19中所涉及的连接反应体系参见表8、表9和表10，其中，延伸产物为根据表4中的体系制备获得的延伸产物，所使用的cfDNA样本为QC样本，连接效率检测的方法参见步骤5。

结果表明，使用5’端磷酸化修饰的探针配合热稳定RNA连接酶能显著提高连接效果。

结果6、不同3’端修饰的接头DNA对连接效率的影响。

表20.连接体系中不同3’端修饰的接头DNA的连接测试结果(QC样本)

表20中所涉及的连接反应体系参见表8，其中，延伸产物为根据表4中的体系制备获得的延伸产物，所使用的cfDNA样本为QC样本，连接效率检测的方法参见步骤5。

结果表明，使用3’端封闭修饰的接头DNA降低了自连与错连，显著提高了连接效率。

结果7、连接后的不同处理对产物检出率的影响。

表21.连接后不同处理的产物检出率结果(QC样本)

表20中所涉及的连接反应体系参见表8，其中，延伸产物为根据表4中的体系制备获得的延伸产物，所使用的cfDNA样本为QC样本，连接后处理的具体参数参见表11，连接效率检测的方法参见步骤5。

结果表明，连接反应后，硅胶柱纯化或加热处理都可以有效去除或降低连接产物中残留的热稳定RNA连接酶的酶活，从而降低连接产物的背景噪音，提高产物检出率。

结果8、不同反应条件下样本的下机数据。

测序分析的条件设置见表22，测序方法具体参见步骤7，对应表22中条件编号的测序分析结果见表23。cfDNA中突变DNA的不同掺入率条件下的检出结果见表24。

表22.测序分析的条件设置

表22中所涉及PCR扩增获得的连接产物是根据表3、表4中的体系制备获得的延伸产物进一步根据表8～表10的连接反应体系制备获得的连接产物，连接后处理的具体参数参见表11。表23所涉的测序分析结果实验中，所使用的cfDNA样本为QC样本。在表24所涉及的cfDNA中突变DNA的不同掺入率条件实验中，对于同一条件编号的技术方案，仅使用的cfDNA样本中NCI-H1975细胞株的DNA的掺入量有所不同，其他实验步骤均与表22中相同。

表23.测序分析结果

表24. cfDNA中突变DNA的不同掺入率条件下的检出结果

条件编号	1	2	3	4	5	6	7	8	9	10	11
												未掺入	0	0	0	0	0	0	0	0	0	0	0
0.01％掺入	0	0.012％	0	0.021％	0.009％	0	0	0	0	0.019％	0
												0.1％掺入	0	0.13％	0	0.12％	0.14％	0	0.08％	0.11％	0.09％	0.12％	0.08％
1％掺入	0	1.15％	0.48％	1.08％	0.83％	0	1.12％	1.13％	1.11％	1.18％	1.13％
												10％掺入	2.30％	10.25％	9.53％	10.22％	9.89％	5.21％	10.13％	10.23％	9.54％	10.22％	10.15％

由表23和表24可见，编号为2，4，5，10的反应条件下，测序比对率高，检出灵敏度高，可以在突变掺入率低至0.01％的cfDNA样本中检测出突变。结果表明，探针3'羟基的封闭修饰至关重要，可以防止探针自连或与接头相连，大幅降低背景，而结合模板后的探针被切除修饰基团后还能有效延伸；偶联了标记分子的dNTP及其纯化系统，能大幅提高建库产物纯度，对本发明的技术方案提供了有效补充。另外，热稳定性RNA连接酶的选用，接头DNA3’端的封闭，以及连接后的处理，也都能起到提高建库产物纯度和检测灵敏度的作用，分别/共同组成了本发明的技术方案。

实施例2

实施例2中所用寡核苷酸序列如表25所示。

表25

此实施例中的探针包含通用序列，即斜体标示的碱基，此处为Ion Torrent测序系统中的 P1序列。本实施例所用的DNA样本为重亚硫酸盐处理后的DNA样本。其中Probe5(SEQID NO17)针对基因SEPT9的一个甲基化区域，Probe6(SEQ ID NO18)针对基因NDRG4的一个甲基化区域，Probe7(SEQ ID NO19)针对基因BMP3的一个甲基化区域。

接头ABar-X2(SEQ ID NO10)中包含通用序列，即斜体标示的碱基，此处为IonTorrent 测序系统中的A序列；下划线部分的序列为barcode，在不同的样本中可以被替换成不同的 barcodes；“N”部分为分子标签序列；其中，NNNNNN为随机序列，用以标记同一样本中不同的延伸产物分子；接头ABar-X2的5’端为磷酸化修饰。

AF(SEQ ID NO15)和AR(SEQ ID NO16)分别是用来扩增文库的PCR前、后引物，与文库中的通用序列，即上述P1序列和A序列匹配。

主要试剂与材料

重亚硫酸盐转化试剂盒购自Promega，Agencourt AMPure磁珠磁珠购自贝克曼。其他主要试剂与实施例1相同。

步骤1、样本准备

抽提健康人血浆样本与肠癌组织标本5例，通过Qubit荧光定量仪对DNA样本定量。将肠癌组织标本DNA打断成160bp左右的片段，按照10％和5％的比例掺入到健康人血浆样本中，分别构建5％掺入率和10％掺入率的样本，同时以健康人血浆样本作为空白对照。使用Promega的重亚硫酸盐转化试剂盒对健康人血浆样本进行转化。转化后的DNA定量后配制成 1000copies/μL的浓度。

步骤2、捕获延伸

按表26配制捕获延伸反应体系。

表26

捕获延伸PCR程序如表27所示。

表27

捕获延伸完成后对产物进行硅胶柱纯化，用60ul洗脱缓冲液洗脱。表4的捕获延伸产物在硅胶柱纯化后，用链霉亲和素包被的磁珠进一步纯化，并最终溶解于60ul洗脱缓冲液中。

步骤3、单链连接

按表28配制的连接反应体系和条件进行连接反应。

表28

连接后，用硅胶柱纯化连接产物，最后用50ul洗脱缓冲液洗脱。

步骤4、文库扩增

按表29的反应体系和条件对连接产物进行PCR扩增。

表29

反应结束后，取80uL的Agencourt AMPure磁珠对PCR产物进行纯化，再将纯化产物溶于30uL洗脱缓冲液洗脱中。至此，待上机测序的文库构建完成。

步骤5、测序与数据分析

将制备好的文库在Ion Proton上测序，操作步骤包括油包水PCR、文库富集、芯片加样和上机测序，具体操作流程详见Ion PITM Hi-QTM OT2 200Kit说明书和Ion PITM Hi-QTM Sequencing 200Kit说明书。

测序结果分析见表30与表31。

表30.测序结果1

表31.不同肠癌组织标本DNA掺入率下各基因甲基化位点占比

由表30、表31可见，掺入5％、10％肠癌组织DNA的样本与空白样本相比，甲基化程度有明显不同，10％掺入样本的甲基化程度最高，空白样本的甲基化程度最低，与预期相符。结果表明，使用本发明的富集方法，对经重亚硫酸盐处理的DNA片段化样本的目标区域也能很好的进行富集，并应用于基因甲基化程度以及与甲基化程度高度相关的疾病的分析。

实施例3

实施例3和4中所用寡核苷酸序列如表32所示：

表32

主要试剂与材料：

与实施例1相同，qPCR所用校准品按照分子克隆常规方法构建。

步骤1、样本准备

非小细胞肺癌细胞株NCI-H1975同时含有EGFR L858R位点的突变和Q787位点的SNP。使用XX试剂盒提取非小细胞肺癌细胞株NCI-H1975与正常人白细胞的基因组DNA，超声打断基因组DNA到100-300bp的分子量范围。通过Qubit荧光定量仪定量后，按照1％，0.1％，0.03％，0.01％，0％的比例将NCI-H1975的基因组DNA掺入到正常人白细胞的基因组DNA中，并通过本发明实施例1中的步骤2到步骤6对样品进行捕获延伸、连接和扩库准备。

步骤2、不同特异性引物/探针组合的qPCR检测

EGFR基因L858R位点三特异性、双特异性、单特异性检测体系分别如表33-35所示。

表33. L858R位点三特异性检测体系

试剂	用量(μL)	终浓度
			2×Taqman Mix	10	1×
F858(10μM)	0.6	300nM
			R858(10μM)	0.6	300nM
MGB858(10μM)	0.2	100nM
			H2O	6.6	/
校准品或待测样本	2	/
			Total	20	/

表34. L858R位点双特异性检测体系：

试剂	用量(μL)	终浓度
			2×Taqman Mix	10	1×
F858(10μM)	0.6	300nM
			Uni-R(10μM)	0.6	300nM
MGB858(10μM)	0.2	100nM
			H2O	6.6	/
校准品或待测样本	2	/
			Total	20	/

表35. L858R位点单特异性检测体系：

试剂	用量(μL)	终浓度
			2×Taqman Mix	10	1×
F858(10μM)	0.6	300nM
			Uni-R(10μM)	0.6	300nM
Uni-MGB(10μM)	0.2	100nM
			H2O	6.6	/
校准品或待测样本	2	/
			Total	20	/

EGFR基因Q787Q位点三特异性、双特异性、单特异性检测体系分别如表36-38所示。

表36. Q787Q位点三特异性检测体系：

试剂	用量(μL)	终浓度
			2×Taqman Mix	10	1×
F787(10μM)	0.6	300nM
			R787(10μM)	0.6	300nM
MGB787(10μM)	0.2	100nM
			H2O	6.6	/
校准品或待测样本	2	/
			Total	20	/

表37. Q787Q位点双特异性检测体系：

表38. Q787Q位点单特异性检测体系：

试剂	用量(μL)	终浓度
			2×Taqman Mix	10	1×
F787(10μM)	0.6	300nM
			Uni-R(10μM)	0.6	300nM
Uni-MGB(10μM)	0.2	100nM
			H2O	6.6	/
校准品或待测样本	2	/
			Total	20	/

qPCR检测程序如表39所示。

表39.

实验结果及分析

结果1.不同特异性引物/探针组合L858R位点检测结果分别如表40-42所示。其中三特异性、双特异性、单特异性检测体系分别对应表33-35的反应体系。

表40. L858R位点三特异性检测结果(ΔCT＝ABS(mean Qi-Q5))

掺入率	CT1	CT2	CT均值	ΔCT
					1％	26.13	26.49	26.31	11.715
0.1％	30.35	30.56	30.46	7.570
					0.03％	33.43	33.85	33.64	4.385
0.01％	37.34	36.52	36.93	1.095
					0	38.52	37.53	38.03	0

表41. L858R位点双特异性检测结果

表42. L858R位点单特异性检测结果

掺入率	CT1	CT2	CT均值	ΔCT
					1％	23.64	23.52	23.58	12.850
0.1％	27.38	27.02	27.20	9.230
					0.03％	29.24	29.87	29.56	6.875
0.01％	32.29	31.58	31.94	4.495
					0	36.24	36.62	36.43	0

结果2.不同特异性引物/探针组合Q787Q位点检测结果分别如表43-45所示。其中三特异性、双特异性、单特异性检测体系分别对应表36-38的反应体系。

表43. Q787Q位点三特异性检测结果

掺入率	CT1	CT2	CT均值	ΔCT
					1％	26.09	25.85	25.97	11.055
0.1％	30.52	30.82	30.67	6.355
					0.03％	34.07	33.59	33.83	3.195
0.01％	36.82	36.43	36.63	0.400
					0	37.14	36.91	37.03	0

表44. Q787Q位点双特异性检测结果

掺入率	CT1	CT2	CT均值	ΔCT
					1％	25.45	25.48	25.47	10.820
0.1％	29.01	29.48	29.25	7.040
					0.03％	31.77	32.11	31.94	4.345
0.01％	34.12	34.98	34.55	1.735
					0	36.05	36.52	36.29	0

表45. Q787Q位点单特异性检测结果

掺入率	CT1	CT2	CT均值	ΔCT
					1％	24.44	24.17	24.31	11.950
0.1％	27.84	28.19	28.02	8.240
					0.03％	30.45	31.01	30.73	5.525
0.01％	32.98	32.45	32.72	3.540
					0	36.03	36.48	36.26	0

结论：针对不同掺入率的参考品，双特异性体系及单特异性这两种引物/探针的体系，与三特异性体系相比，ΔCT值更大，具有更高的有效分辨率，如果以ΔCT＝3作为cutoff，针对L858R位点，单特异性体系、双特异性体系与三特异性体系的检出限分别是0.01％，0.01％与0.03％；针对Q787位点，检出限分别是0.01％，0.03％与0.01％。由此可见，在掺入率低至 0.03％的情况下，单特异性体系、双特异性体系仍具有可靠的检出率。

实施例4.

本实施例所用寡核苷酸序列如表32所示。主要试剂与材料：与实施例3相同。

步骤1、样本准备

用血浆游离核酸提取试剂盒分别提取男性和女性的血浆游离DNA，用Qubit荧光定量仪定量后，按照1％，0.1％，0.03％，0.01％，0％的比例将男性cfDNA掺入到女性cfDNA样本中，同时以女性cfDNA作为空白对照，并通过本发明实施例1中的步骤2到步骤6对样品进行捕获延伸、连接和扩库准备。

步骤2、不同特异性引物/探针组合的qPCR检测

男性特有SRY基因三特异性、双特异性、单特异性检测体系分别如表46-48所示。

表46.男性特有SRY基因三特异性检测体系：

试剂	用量(μL)	终浓度
			2×Taqman Mix	10	1×
F-SRY(10μM)	0.6	300nM
			R-SRY(10μM)	0.6	300nM
MGB-SRY(10μM)	0.2	100nM
			H2O	6.6	/
校准品或待测样本	2	/
			Total	20	/

表47.男性特有SRY基因二特异性检测体系：

试剂	用量(μL)	终浓度
			2×Taqman Mix	10	1×
F-SRY(10μM)	0.6	300nM
			Uni-R(10μM)	0.6	300nM
MGB-SRY(10μM)	0.2	100nM
			H2O	6.6	/
校准品或待测样本	2	/
			Total	20	/

表48.男性特有SRY基因单特异性检测体系：

qPCR检测程序如表49所示。

表49.

实验结果及分析

结果：不同特异性引物/探针组合男性特有SRY基因检测结果分别如表50-52所示。其中三特异性、双特异性、单特异性检测体系分别对应表46-48的反应体系。

表50.男性特有SRY基因三特异性检测结果(ΔCT＝ABS(mean Qi-Q5))

掺入率	CT1	CT2	CT均值	ΔCT
					1％	31.23	32.08	31.66	13.345
0.1％	35.71	35.94	35.83	9.175
					0.03％	37.85	38.02	37.94	7.065
0.01％	39.25	39.52	39.39	5.615
					0	ND	ND	45.00	0

表51.男性特有SRY基因双特异性检测结果

掺入率	CT1	CT2	CT均值	ΔCT
					1％	30.55	30.99	30.77	14.230
0.1％	34.23	34.98	34.61	10.395
					0.03％	36.32	37.94	37.13	7.870
0.01％	39.48	39.12	39.30	5.700
					0	ND	ND	45.00	0

表52.男性特有SRY基因单特异性检测结果

掺入率	CT1	CT2	CT均值	ΔCT
					1％	29.38	29.68	29.53	15.470
0.1％	33.28	33.89	33.59	11.415
					0.03％	35.45	35.82	35.64	9.365
0.01％	38.21	37.89	38.05	6.950
					0	ND	ND	45.00	0

结论：SRY作为仅在Y染色体上的基因，三种方法检测的灵敏度都较高。如果以ΔCT＝3 作为cut off，单、双、三特异性体系都能达到0.01％的检出灵敏度。但是从具体的CT值上来判断，单特异性体系的检出率更高。

综上所述，本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。

上述实施例仅例示性说明本发明的原理及其功效，而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下，对上述实施例进行修饰或改变。因此，举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变，仍应由本发明的权利要求所涵盖。

序列表

<110> 上海臻迪基因科技有限公司

<120> 基因目标区域富集方法及试剂盒

<150> 2019100024085

<151> 2019-01-02

<160> 30

<170> SIPOSequenceListing 1.0

<210> 1

<211> 57

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

ccgctttcct ctctatgggc agtcggtgat cctggcagcc aggaacgtac tggtgaa 57

<210> 2

<211> 57

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

ccgctttcct ctctatgggc agtcggtgat cctggcagcc aggaacgtac tggtgaa 57

<210> 3

<211> 57

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

ccgctttcct ctctatgggc agtcggtgat cctggcagcc aggaacgtac tggtgaa 57

<210> 4

<211> 57

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

ccgctttcct ctctatgggc agtcggtgat cctggcagcc aggaacgtac tggtgaa 57

<210> 5

<211> 57

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

ccgctttcct ctctatgggc agtcggtgat cctggcagcc aggaacgtac tggtgaa 57

<210> 6

<211> 57

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

ccgctttcct ctctatgggc agtcggtgat cctggcagcc aggaacgtac tggtgaa 57

<210> 7

<211> 57

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

ccgctttcct ctctatgggc agtcggtgat cctggcagcc aggaacgtac tggtgat 57

<210> 8

<211> 58

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

ccgctttcct ctctatgggc agtcggtgat cctggcagcc aggaacgtac tgrgtgat 58

<210> 9

<211> 51

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

ggatccnnnn nncagcttgg actgagtcgg agacacgcag ggatgagatg g 51

<210> 10

<211> 52

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

ggatccnnnn nngttctcct tactgagtcg gagacacgca gggatgagat gg 52

<210> 11

<211> 51

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

ggatccnnnn nnttacctta gctgagtcgg agacacgcag ggatgagatg g 51

<210> 12

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

gatcacagat tttgggc 17

<210> 13

<211> 15

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

tttgcctcct tctgc 15

<210> 14

<211> 16

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 14

aactgctggg tgcgga 16

<210> 15

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 15

gtctcagcct ctctatgggc agtcggtgat 30

<210> 16

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 16

ccatctcatc cctgcgtgtc tccgactcag 30

<210> 17

<211> 49

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 17

ccgctttcct ctctatgggc agtcggtgat tagttggatg ggattattt 49

<210> 18

<211> 58

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 18

ccgctttcct ctctatgggc agtcggtgat ttttttttgg gagtttaaat aaagatta 58

<210> 19

<211> 57

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 19

ccgctttcct ctctatgggc agtcggtgat tttaaaatag agttagtttt agttttt 57

<210> 20

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 20

ttccaggagg cacagaaatt ac 22

<210> 21

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 21

cttccgacga ggtcgatact 20

<210> 22

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 22

catgcacaga gagaaatacc cgaat 25

<210> 23

<211> 13

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 23

cagattttgg gcg 13

<210> 24

<211> 11

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 24

gcgtgatgag t 11

<210> 25

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 25

gcgtggacaa cccccac 17

<210> 26

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 26

cacggtggag gtgaggc 17

<210> 27

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 27

ccatctcatc cctgcgt 17

<210> 28

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 28

tccgactcag taaggagaac ga 22

<210> 29

<211> 64

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 29

ccgctttcct ctctatgggc agtcggtgat ccaatattgt ctttgtgttc ccggacatag 60

tcct 64

<210> 30

<211> 65

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 30

ccgctttcct ctctatgggc agtcggtgat ctatggccat tcttccagga ggcacagaaa 60

ttact 65

Claims

1.一种基因目标区域富集方法，包括：

2.如权利要求1所述的基因目标区域富集方法，其特征在于，所述步骤(1)中，所述片段化DNA包含双链DNA、单链DNA和cDNA，所述片段化DNA的长度为25～200bp；

和/或，所述步骤(1)的扩增体系中包括特异性探针、DNA聚合酶和dNTP。

3.如权利要求2所述的基因目标区域富集方法，其特征在于，所述DNA聚合酶具有3’-5’外切酶活性；

和/或，所述dNTP还偶联有标记分子，所述标记分子优选为生物素。

4.如权利要求1所述的基因目标区域富集方法，其特征在于，所述步骤(1)的扩增体系中还包括用于切除结合目标区域后所述特异性探针的3’末端修饰基团的活性物质，所述活性物质优选为核酸酶；

和/或，所述特异性探针还包括能被测序系统识别的通用序列；

和/或，所述特异性探针的3’末端核苷酸的3位羟基被取代；

和/或，所述特异性探针的3’末端的取代基团选自氢原子、C3Spacer基团、C6Spacer基团、磷酸基团或氨基基团；

和/或，所述特异性探针3’端尾部区域包含错配碱基。

5.如权利要求1所述的基因目标区域富集方法，其特征在于，所述步骤(2)的连接体系中包括单链连接酶，所述单链连接酶优选为T4RNA连接酶或热稳定性RNA连接酶；

和/或，所述接头DNA的5’末端核苷酸被修饰、且在步骤(2)的反应温度下为单链结构，优选的，接头DNA的5’末端核苷酸被磷酸基团或腺苷基团取代；

和/或，所述接头DNA为5’端区域具有黏性末端的部分双链结构；

和/或，所述接头DNA包括能够被测序系统识别的通用序列、样本标签序列、分子标签序列中的一种或多种的组合。

6.如权利要求1所述的基因目标区域富集方法，其特征在于，所述步骤(1)中，还包括纯化捕获延伸产物，捕获延伸产物的纯化方法优选选自磁珠纯化；

和/或，所述步骤(2)中，还包括纯化连接产物，连接产物的纯化方法优选选自硅胶柱纯化和/或加热处理。

7.如权利要求1所述的基因目标区域富集方法，其特征在于，还包括：

(3)扩增步骤(2)所提供的连接产物，优选的，所述步骤(3)中，PCR扩增引物具有与所述特异性探针的通用序列和/或所述接头DNA的通用序列相配合。

8.如权利要求7所述的基因目标区域富集方法，其特征在于，还包括：

(4)对扩增后的连接产物进行测序，以提供目标区域的测序结果。

9.如权利要求1所述的基因目标区域富集方法，还包括：

(5)用检测引物1、检测引物2和探针3检测步骤(2)提供的连接产物，其特征在于，所述检测引物1、检测引物2和探针3中，至少其一包含基因特异性序列；

优选的，所述检测引物1包含基因特异性序列，所述检测引物2和探针3包含通用序列；

和/或，所述检测引物2和/或探针3也包含基因特异性序列；

优选的，所述探针3包含标记分子，且所述探针3的序列与检测引物1或2不互补。

10.如权利要求1所述的基因目标区域富集方法，其特征在于，所述基因目标区域富集方法用于基因检测。

11.一种用于富集片段化DNA目标区域的试剂盒，包括适用于如权利要求1～9任一权利要求所述的基因目标区域富集方法的特异性探针和接头DNA。

12.如权利要求11所述的试剂盒，其特征在于，还包括以下的一种或多种：RNA连接酶，偶联标记分子的dNTP，DNA聚合酶，核酸酶；

和/或，还包括正向引物和反向引物，所述正向引物和反向引物具有与所述特异性探针的通用序列和所述接头DNA的通用序列中至少部分互补的序列。

13.如权利要求12所述的试剂盒，其特征在于，

还包括检测引物1、检测引物2和探针3，三者中至少其一含有基因特异性序列。