CN114250269A

CN114250269A - 一种探针组合物、基于该探针组合物的二代测序文库及其应用

Info

Publication number: CN114250269A
Application number: CN202111633522.1A
Authority: CN
Inventors: 赵兰; 陈云弟; 汪进平; 柴映爽; 罗俊峰
Original assignee: Carrier Gene Technology Suzhou Co ltd; Shanghai Yueer Gene Technology Co ltd; Shanghai Pulmonary Hospital
Current assignee: Carrier Gene Technology Suzhou Co ltd; Shanghai Yueer Gene Technology Co ltd; Shanghai Pulmonary Hospital
Priority date: 2021-12-28
Filing date: 2021-12-28
Publication date: 2022-03-29

Abstract

本发明公开了一种探针组合物、基于该探针组合物的二代测序文库及其应用，属于基因检测技术领域。本发明提供的探针组合物，用于检测靶核酸序列相对于非靶核酸序列的变异，包括阻滞探针和捕获探针，阻滞探针和捕获探针针对非靶核酸序列和靶核酸序列的差异序列进行设计；阻滞探针和非靶核酸序列结合的吉布斯自由能与捕获探针和非靶核酸序列结合的吉布斯自由能之差ΔG_非 ^{阻滞‑捕获}为‑9.5～‑0.5kcal/mol；捕获探针和靶核酸序列结合的吉布斯自由能与阻滞探针和靶核酸序列结合的吉布斯自由能之差ΔG_靶 ^{捕获‑阻滞}为‑8.5～‑0.5kcal/mol。本发明的探针组合物基于选择性靶向富集技术，并提供了一种高灵敏检测低频基因变异的高通量文库的构建方法，能够检测核酸样本中低至0.1％的变异。

Description

一种探针组合物、基于该探针组合物的二代测序文库及其应用

技术领域

本发明涉及基因检测技术领域，尤其涉及一种探针组合物、基于该探针组合物的二代测序文库及其应用。

背景技术

液体活检是以血液等非固态生物组织为标本进行取样和分析的体外诊断技术。液体活检中的“液体”以血液为主，也包括粪便、尿液、唾液以及其他体液样品。液体活检最主要的应用场景是早起筛查、诊断、用药指导、监测、预后管理，以及无创产前检测，除此之外还包括肌肉骨骼系统和结缔组织疾病、传染病和寄生虫病等其他疾病。根据检测物的不同，液体活检技术已发展出几个分支，其中，cfDNA/ctDNA技术是一种常见的液体活检技术。游离DNA(cfDNA)是游离于血液循环系统中的来自细胞的DNA片段，主要来自于细胞凋亡进程中片段化的DNA、坏死细胞的DNA碎片、细胞分泌的外泌体。cfDNA中最重要的一类是循环肿瘤DNA(ctDNA)，ctDNA是进入血液循环系统中的来自肿瘤基因组的DNA片段，携带了突变、插入、缺失、重排、拷贝数异常和/或甲基化等信息，通常在cfDNA中的占比小于1％。

利用高通量测序(NGS，也叫二代测序)技术对ctDNA进行检测的液体活检技术，有望改变肿瘤的诊断和治疗。NGS可以一次性对成千上万个位点进行测序，可以应用到肿瘤筛查，靶向用药选择，耐药鉴定，治疗效果评估等方面。不过受制于测序文库构建流程和测序平台，NGS技术的检测下限一般在2％。基于唯一分子标签(UMI)的文库构建方法可以提高NGS的检测灵敏度至0.1％，但是这通常需要25000X以上的超高测序深度，限制了NGS在检测低于1％的低频变异场景的应用。低频基因变异检测技术除了UMI-NGS外，目前最常用的方法还包括等位基因阻滞扩增系统(ARMS)和数字PCR技术。ARMS和数字PCR技术检测灵敏度可达0.1％，但是只能检测有限位点的变异，检测通量很难提高。因此，目前市场仍需寻找一种对测序深度要求不高，却能够检测低于1％的低频变异的高通量测序技术。

发明内容

为解决上述技术问题，本发明提供了一种基于选择性靶向富集技术的用于变异检测的探针组合物。

本发明的第一个目的是提供一种探针组合物，该探针组合物包括阻滞探针和捕获探针，用于检测靶核酸序列相对于非靶核酸序列的变异，靶核酸序列相对于非靶核酸序列至少存在一个碱基的变异，其中：

阻滞探针和捕获探针针对非靶核酸序列和靶核酸序列的差异序列进行设计；

上述阻滞探针和非靶核酸序列结合的吉布斯自由能(G^阻滞)与捕获探针和非靶核酸序列结合的吉布斯自由能(G^捕获)之差ΔG_非 ^{阻滞-捕获}为-9.5～-0.5kcal/mol；捕获探针和靶核酸序列结合的吉布斯自由能与阻滞探针和靶核酸序列结合的吉布斯自由能之差ΔG_靶 ^{捕获-阻滞}为-8.5～-0.5kcal/mol。

进一步地，ΔG_非 ^{阻滞-捕获}可以是-9.5～-8.5kcal/mol，-8.5～-7.5kcal/mol，-7.5～-6.5kcal/mol，-6.5～-5.5kcal/mol，-5.5～-4.5kcal/mol，-4.5～-3.5kcal/mol，-3.5～-2.5kcal/mol，-2.5～-1.5kcal/mol，-1.5～-0.5kcal/mol。优选地，ΔG_非 ^{阻滞-捕获}为-4.5～-2.5kcal/mol。

进一步地，ΔG_靶 ^{捕获-阻滞}可以是-8.5～-7.5kcal/mol，-7.5～-6.5kcal/mol，-6.5～-5.5kcal/mol，-5.5～-4.5kcal/mol，-4.5～-3.5kcal/mol，-3.5～-2.5kcal/mol，-2.5～-1.5kcal/mol，-1.5～-0.5kcal/mol。优选地，ΔG_靶 ^{捕获-阻滞}为-4.5～-2.5kcal/mol。

本发明的第二个目的是提供一种基于上述探针组合物的二代测序文库的构建方法，包括以下步骤：

(1)将样本DNA片段、阻滞探针和捕获探针进行杂交反应；

(2)对样本DNA片段中的靶核酸片段进行捕获，对捕获的DNA片段进行末端修复和接头(adapter)连接；

(3)对接头连接产物进行样本标签(index)PCR扩增，构建得到上述测序文库。

进一步地，样本DNA为gDNA样本或cfDNA样本，gDNA和cfDNA可以来源于血浆、血清、血液、尿液、汗液、唾液、精液、胸水、腹水、粪便、穿刺样本、石蜡包埋组织切片(FFPE)样本。因此，本发明的探针组合物可用于制备液体活检试剂或组织活检试剂。

进一步地，若样本DNA为gDNA样本，需对其进行基因组打断；若样本为cfDNA样本，由于cfDNA本身已经是自然降解的短片段，则不需要进行打断步骤。

进一步地，基因组打断的方法包括物理打断法和化学打断法，如Covaris超声打断、fragmentase酶切打断等。

进一步地，在步骤(1)中，进行杂交反应时，杂交反应体系中还包括杂交缓冲液和杂交增强剂，杂交增强剂包括二甲基亚砜、甜菜碱、尿素、甲酰胺或十二烷基硫酸钠中的至少一种。

进一步地，在步骤(2)中，上述捕获探针修饰有生物素(阻滞探针上不进行生物素标记)，捕获探针与靶核酸序列杂交后，用修饰有链霉亲和素的磁珠进行亲和捕获。具体地，将链霉亲和素磁珠与杂交反应后的体系共孵育，经清洗、热洗脱和室温洗脱，最后通过高温加热分离链霉亲和素磁珠和被捕获的靶向DNA片段。

进一步地，进行index PCR扩增时，将接头连接产物与带有index序列的引物混合，进行PCR反应。index序列可用于区分不同的样本DNA。

进一步地，上述构建得到的测序文库应用于二代测序平台，测序深度为100X-1000X。

上述探针组合物中，样本DNA中的非靶核酸序列和靶核酸序列、阻滞探针、捕获探针同时进行杂交反应，本发明对其结合的吉布斯自由能进行优化，非靶核酸序列与阻滞探针结合，捕获探针与靶核酸序列结合。捕获探针上带有生物素标记，会与随后的链霉亲和素磁珠进行结合；而阻滞探针上没有生物素标记，非靶核酸序列会在磁珠分离过程中丢失。捕获的DNA片段进行末端修复&加A，接头连接以及index PCR形成最终的测序文库。

本发明具有以下优势：(1)提高了检测的灵敏度，可以检测低至0.1％的变异；(2)测序文库中靶核酸序列被富集，因此，变异检测时不需要高深度的测序，测序数据量也较小，适用于桌面型的测序平台；(3)与传统的杂交文库构建方法相比，本方法可以减少一次PCR，缩短了文库构建的时间,。同时，针对靶核酸序列富集的技术平台，现有技术大都采用定量PCR技术，每管检测的位点少，若想增加位点就需要分管进行检测，样本量的消耗增大，而肿瘤患者大量采血是比较困难的。而本发明属于NGS领域，每管可检测的位点从数百到数千，对样本量的要求更低；(4)在NGS领域，选择性杂交技术与多重扩增技术也存在位点数的巨大差异。多重扩增的位点数存在上限，多到一定程度，就难以优化反应条件来使所有位点都获得理想的检测效果；而本发明的选择性杂交技术可以轻松覆盖整个外显子组，可扩增性好，可在已有的panel中根据科学研究进展增加位点，而不降低产品性能。

借由上述方案，本发明至少具有以下优点：

本发明通过在杂交反应中引入阻滞探针，阻滞探针和捕获探针竞争性地与靶核酸序列/非靶核酸序列结合，根据热动力学差异对阻滞探针和捕获探针进行设计，使得非靶核酸序列与阻滞探针结合，靶核酸序列与捕获探针结合，最终的测序文库中靶核酸序列被富集。本发明的探针组合物或基于其构建的二代测序文库可用于检测低频变异，具有高灵敏度(可检测低至0.1％的变异)、高通量(可同时检测数千变异位点)的优势，对样本数据量要求低，且不依赖于高深度测序(平均测序深度约为1000X)。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，并可依照说明书的内容予以实施，以下以本发明的较佳实施例并配合详细附图说明如后。

附图说明

为了使本发明的内容更容易被清楚的理解，下面根据本发明的具体实施例并结合附图，对本发明作进一步详细的说明。

图1为本发明的选择性靶向富集技术方案示意图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步说明，以使本领域的技术人员可以更好地理解本发明并能予以实施，但所举实施例不作为对本发明的限定。

实施例1

下面以非小细胞肺癌中的热点变异检测和Illumina高通量测序平台为例，结合具体实施例对本发明作进一步的详细说明。

一、探针的设计与合成

针对非小细胞肺癌相关基因变异位点中的热点，根据热动力学原理进行阻滞探针和捕获探针的设计与合成，其中捕获探针用生物素标记，阻滞探针不进行生物素标记。本发明实施例中涉及到的非小细胞肺癌相关基因的变异热点和对应探针编号见表1和表2。

表1非小细胞肺癌基因变异热点及对应探针的序号

表2探针序列信息

本实施例中的探针及技术方案可以应用到不同厂商生产的第二代测序平台，包括但不限于Illumina、ThermoFisher和BGI等。

二、待测样本准备

本发明实施例检测的样本包括4例已知基因变异频率的cfDNA标准品和20例基因变异未知的血浆样本。cfDNA标准品包含6个单碱基变异(SNV)、1个缺失和1个插入，共8个位点，其变异频率经数字PCR检验确认，分别为1％、0.5％、0.1％和0％，各重复检测3次。血浆样本同时采用STE技术和对照技术(ARMS PCR技术)进行基因检测。

血浆样本游离DNA提取的具体步骤如下：

1、将10mL新鲜采集的全血样本在4小时内进行血浆的分离，4℃1600g离心20min，将上清血浆转移至新的离心管。再于16000g离心10min，去除残留细胞，并将上清血浆转移至15mL离心管中。

2、往含有血浆的15mL离心管中依次加入160μL蛋白酶K和400μL样本裂解液，涡旋震荡混匀上述离心管，并于60℃孵育20min。

3、孵育的同时，在另一离心管中依次加入游离DNA裂解/结合液和纳米磁珠(每反应加入5mL游离DNA裂解/结合液和60μL纳米磁珠)制备合适反应体积的纳米磁珠结合溶液并混匀。

4、孵育结束后，将离心管平衡至室温，并将制备好的纳米磁珠结合溶液加入已经完成裂解的血浆样本中，颠倒10次混匀。

5、将离心管以1000rpm转速振荡10min后，置于磁力架上静置5min待管内溶液澄清。

6、小心弃掉上清，将离心管从磁力架上取下，加入1mL洗涤液，并涡旋震荡以重悬纳米磁珠。

7、将已重悬的纳米磁珠溶液转移入一个新的1.5mL离心管，并置于磁力架上静置2min待管内溶液澄清。

8、小心弃掉上清，将离心管从磁力架上取下，加入1mL洗涤液，并涡旋震荡以重悬纳米磁珠。短暂离心后，置于磁力架上静置2min待管内溶液澄清。

9、小心弃掉上清，将离心管从磁力架上取下，加入1mL新鲜制备的二次洗涤液，并涡旋震荡以重悬纳米磁珠。短暂离心后，置于磁力架上静置2min待管内溶液澄清。

10、小心弃掉上清包括管底部残余液体，将离心管置于磁力架上，开盖3min室温晾干。

11、将离心管从磁力架上取下，加入45μL洗脱液，充分震荡离心管以使纳米磁珠重悬，室温静置5min。

12、将离心管短暂离心后，置于磁力架上2min待管内溶液澄清，收集43μL上清(cfDNA)置于另一干净的离心管中保存。

13、取1μL cfDNA用Qubit试剂测定cfDNA的浓度。20例cfDNA样本的浓度测定结果如表3所示。

表3 20例血浆样本cfDNA浓度测定结果

三、文库构建和高通量测序

1、样本浓缩与杂交的步骤如下：

(1)取30ng cfDNA样本置于1.5mL低吸附离心管中并用0.1X TE补足至50μL，并加入7.5μL Human cotDNA和104μL Ampure XP Beads。涡旋混匀，25℃孵育10min。

(2)将离心管置于磁力架上5min至液体完全澄清，使用移液器移弃上清。

(3)沿离心管壁缓慢加入200μL新鲜配制的80％乙醇，静置30sec，使用移液器移弃上清。

(4)重复以上步骤一次。

(5)离心管置于磁力架上，使用10μL吸头移去少量残留乙醇，注意勿吸到磁珠。

(6)将磁珠置于室温干燥2-5min，至乙醇完全挥发。

(7)往离心管中依次加入9.5μL杂交缓冲液，3μL杂交增强剂，3μL捕获探针和3μL阻滞探针，充分混合均匀，室温孵育5min。

(8)将离心管置于磁力架上5min至液体完全澄清，使用移液器转移17μL上清至新的0.2mL PCR管中，瞬时离心，放进PCR仪中，启动如下PCR程序：95℃，30sec(DNA变性反应)；65℃，16hrs(杂交反应)；65℃，∞。

2、链霉亲和素磁珠捕获的步骤如下：

(1)提前30min取出streptavidin beads置于室温平衡，涡旋混匀，吸取50μL至1个1.5mL低吸附离心管中。

(2)向离心管中加入100μL Bead Wash Buffer，轻柔吹吸混匀10次，瞬时离心，置于磁力架上数分钟，待液体完全澄清，使用移液器移弃上清。将离心管从磁力架上移出。

(3)重复以上步骤2次。

(4)向离心管中加入17μL磁珠悬浮液，轻柔吹吸混匀，将离心管置于65℃孵育5min。

(5)待杂交反应结束后，将17μL重悬的链霉亲和素磁珠加入到杂交体系中，并用移液器轻柔吹吸混匀。

(6)65℃孵育45min，每15min轻柔吹吸混匀一次，确保磁珠完全重悬。

(7)孵育结束后，向PCR管中加入100μL 65℃Wash Buffer 1，吹吸混匀含有磁珠的杂交体系。

(8)将PCR管置于磁力架上30sec，待液体完全澄清后，使用移液器吸取移弃上清。

(9)将PCR管从磁力架上移出，加入150μL 65℃Wash Buffer2，轻柔吹吸混匀，放进PCR仪中孵育5min。

(10)重复步骤8和9一次。

(11)将PCR管瞬时离心后置于磁力架上1min，待液体完全澄清后吸取移弃上清，加入150μL室温Wash Buffer 1，涡旋混匀，室温孵育2min。

(12)将PCR管瞬时离心后置于磁力架上1min，待液体完全澄清后吸取移弃上清，加入150μL室温Wash Buffer 3，涡旋混匀，室温孵育2min。

(13)将PCR管瞬时离心后置于磁力架上1分钟，待液体完全澄清后吸取移弃上清，加入150μL室温Wash Buffer 4，涡旋混匀，室温孵育2min。

(14)将PCR管瞬时离心后置于磁力架上1min，待液体完全澄清后吸取移弃上清，之后换用10μL吸头移去少量残余缓冲液。

(15)将PCR管从磁力架上移出，加入42μL Nuclease Free Water，使用移液器轻柔吹吸10次，室温孵育5min。

(16)瞬时离心后，将PCR管置于PCR仪上95℃5min后，立即置于磁力架上30sec，待液体完全澄清后使用移液器转移40μL上清至新的0.2mL PCR管中。

3、末端修复和3’端加A的步骤如下：

(1)往含有样本的0.2mL PCR管中依次加入6μL End Repair&A-Tailing Buffer和4μL End Repair&A-tailing Enzyme，混合均匀，瞬时离心。

(2)将PCR管放入PCR仪，启动如下PCR程序：20℃，30min；65℃，30min；4℃，∞。

4、接头连接的步骤如下：

(1)待上一步反应结束，往PCR管中依次加入2μL Adapter，26μLLigation Buffer，2μL DNA Ligase，混合均匀，瞬时离心。

(2)将PCR管放入PCR仪，启动如下PCR程序：20℃，15min；4℃，∞。

5、连接产物纯化的步骤如下：

(1)待上一步反应结束，往PCR管中加入40μL提前平衡至室温的Ampure XP Beads，混合均匀，25℃孵育5min。

(2)将PCR管瞬时离心后放置于磁力架上5分钟min至液体完全澄清，使用移液器吸取移弃上清。

(4)重复以上步骤一次。

(6)将磁珠置于室温干燥2-5min，至乙醇完全挥发。

(7)移出PCR管，向PCR管中加入21μL Nuclease Free Water，将磁珠悬浮混匀，25℃孵育5min。

(8)将PCR管瞬时离心后放置于磁力架上5min至液体完全澄清，使用移液器小心吸取20μL上清转移至一个新的0.2mL PCR管中。

6、PCR扩增的步骤如下：

(1)往含有纯化的连接产物的PCR管中依次加入25μL 2X HiFi PCR Master Mix和5μL Amplification Primer Mix，混合均匀，瞬时离心。

(2)将PCR管放入PCR仪，启动如下PCR程序：98℃，2min；(98℃，15sec；60℃，30sec；72℃，30sec)X14 cycles；72℃，2min；4℃，∞。

7、文库纯化的步骤如下：

(1)向含有扩增产物的PCR管中加入50μL提前平衡至室温的Ampure XP Beads，混合均匀，25℃孵育5min。

(2)将PCR管瞬时离心后放置于磁力架上5min至液体完全澄清，使用移液器吸取移弃上清。

(4)重复以上步骤一次。

(6)将磁珠置于室温干燥2-5min，至乙醇挥发完全。

(7)移出PCR管，向PCR管中加入21μL TE Solution，将磁珠悬浮混匀，25℃孵育5min。

(8)将PCR管瞬时离心后放置于磁力架上5min至液体完全澄清，使用移液器小心吸取20μL上清转移至一个新的0.2mL PCR管中保存。

8、高通量测序的步骤如下：

构建完成的NGS文库经QC合格后，在Illumina NovaSeq 6000平台上进行2x150 bp的双端测序，平均测序深度为1000X。

四、生物信息学数据分析

NovaSeq 6000产生的NGS原始数据经过删除接头序列、滤除低质量数据和基因组reference比对后，对靶区间内的变异进行识别。标准品和血浆样本的检测结果分别见表4和表5。

表4 4种已知基因变异频率的标准品的检测结果，分别重复3次

注：+表示该位点检测结果为阳性，-表示该位点检测结果为阴性。

表5 20例血浆样本的基因变异检测结果

从表4的结果可以看出，本方案对30ng的cfDNA标准品可以稳定检出低至0.1％变异频率的SNV和INDEL，灵敏度和特异性均达100％。

从表5的结果可以看出，20例血浆样本同时使用本发明的STE技术和对照技术进行了检测，17例样本(8例野生型和9例变异型)两种方法的检测结果完全一致，3例的检测结果存在差异。在这3例检测结果不一致的样本中，有2例样本STE技术检测出了超出对照技术A产品覆盖的范围：14号样本STE检出TP53 R175H变异，而对照技术检测为野生型；19号样本STE检出KRAS Q61H变异而对照技术检测为野生型；有1例样本STE比对照技术多检出1处变异：5号样本STE技术检出EGFR 19DEL和EGFR T790M，而对照技术只检出EGFR 19DEL，没有检出EGFR T790M。

对检测结果不一致的样本用数字PCR技术进行验证。其中14号样本TP53 R175H和19号样本KRAS Q61H经数字PCR验证，两个变异均为真实变异，变异频率分别为1.25％和3.50％。这两个位点由于不在对照技术试剂盒的检测范围内，未检出属正常。5号样本EGFRT790M变异经数字PCR验证，其变异频率为0.09％。

以上数据表明，本发明STE技术可以在较低NGS测序深度的前提下，稳定检出低至0.1％的基因变异。

显然，上述实施例仅仅是为清楚地说明所作的举例，并非对实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

序列表

<110> 上海市肺科医院，阅尔基因技术（苏州）有限公司，上海阅尔基因技术有限公司

<120> 一种探针组合物、基于该探针组合物的二代测序文库及其应用

<160> 64

<170> SIPOSequenceListing 1.0

<210> 1

<211> 120

<212> DNA

<213> （人工序列）

<400> 1

ggcagccagg aacgtactgg tgaaaacacc gcagcatgtc aagatcacag attttgggct 60

ggccaaactg ctgggtgcgg aagagaaaga ataccatgca gaaggaggca aagtaaggag 120

<210> 2

<211> 120

<212> DNA

<213> （人工序列）

<400> 2

caacccccac gtgtgccgcc tgctgggcat ctgcctcacc tccaccgtgc agctcatcac 60

gcagctcatg cccttcggct gcctcctgga ctatgtccgg gaacacaaag acaatattgg 120

<210> 3

<211> 120

<212> DNA

<213> （人工序列）

<400> 3

ctggatccca gaaggtgaga aagttaaaat tcccgtcgct atcaaggaat taagagaagc 60

aacatctccg aaagccaaca aggaaatcct cgatgtgagt ttctgctttg ctgtgtgggg 120

<210> 4

<211> 120

<212> DNA

<213> （人工序列）

<400> 4

tggccaccat gcgaagccac actgacgtgc ctctccctcc ctccaggaag cctacgtgat 60

ggccagcgtg gacaaccccc acgtgtgccg cctgctgggc atctgcctca cctccaccgt 120

<210> 5

<211> 120

<212> DNA

<213> （人工序列）

<400> 5

caaccaagct ctcttgagga tcttgaagga aactgaattc aaaaagatca aagtgctggg 60

ctccggtgcg ttcggcacgg tgtataaggt aaggtccctg gcacaggcct ctgggctggg 120

<210> 6

<211> 120

<212> DNA

<213> （人工序列）

<400> 6

attcgtccac aaaatgattc tgaattagct gtatcgtcaa ggcactcttg cctacgccac 60

cagctccaac taccacaagt ttatattcag tcattttcag caggccttat aataaaaata 120

<210> 7

<211> 120

<212> DNA

<213> （人工序列）

<400> 7

acacaaagaa agccctcccc agtcctcatg tactggtccc tcattgcact gtactcctct 60

tgacctgctg tgtcgagaat atccaagaga caggtttctc catcaattac tacttgcttc 120

<210> 8

<211> 120

<212> DNA

<213> （人工序列）

<400> 8

tgattttgca gaaaacagat ctgtatttat ttcagtgtta cttacctgtc ttgtctttgc 60

tgatgtttca ataaaaggaa ttccataact tcttgctaag tcctgagcct gttttgtgtc 120

<210> 9

<211> 120

<212> DNA

<213> （人工序列）

<400> 9

tccacaaaat ggatccagac aactgttcaa actgatggga cccactccat cgagatttca 60

ctgtagctag accaaaatca cctattttta ctgtgaggtc ttcatgaaga aatatatctg 120

<210> 10

<211> 120

<212> DNA

<213> （人工序列）

<400> 10

ccacattaca tacttaccat gccactttcc cttgtagact gttccaaatg atccagatcc 60

aattctttgt cccactgtaa tctgcccatc aggaatctcc caatcatcac tcgagtcccg 120

<210> 11

<211> 120

<212> DNA

<213> （人工序列）

<400> 11

attcatctac aaagtggttc tggattagct ggattgtcag tgcgcttttc ccaacaccac 60

ctgctccaac caccaccagt ttgtactcag tcatttcaca ccagcaagaa cctgttggaa 120

<210> 12

<211> 120

<212> DNA

<213> （人工序列）

<400> 12

acagaggaag ccttcgcctg tcctcatgta ttggtctctc atggcactgt actcttcttg 60

tccagctgta tccagtatgt ccaacaaaca ggtttcacca tctataacca cttgttttct 120

<210> 13

<211> 120

<212> DNA

<213> （人工序列）

<400> 13

aaaatgacaa agaacagctc aaagcaattt ctacacgaga tcctctctct gaaatcactg 60

agcaggagaa agattttcta tggagtcaca ggtaagtgct aaaatggaga ttctctgttt 120

<210> 14

<211> 120

<212> DNA

<213> （人工序列）

<400> 14

cttagataaa actgagcaag aggctttgga gtatttcatg aaacaaatga atgatgcaca 60

tcatggtggc tggacaacaa aaatggattg gatcttccac acaattaaac agcatgcatt 120

<210> 15

<211> 120

<212> DNA

<213> （人工序列）

<400> 15

ccagggcatc tggatccctg atggggagaa tgtgaaaatt ccagtggcca tcaaagtgtt 60

gagggaaaac acatccccca aagccaacaa agaaatctta gacgtaagcc cctccaccct 120

<210> 16

<211> 120

<212> DNA

<213> （人工序列）

<400> 16

tgtgtggtct cccataccct ctcagcgtac ccttgtcccc aggaagcata cgtgatggct 60

ggtgtgggct ccccatatgt ctcccgcctt ctgggcatct gcctgacatc cacggtgcag 120

<210> 17

<211> 120

<212> DNA

<213> （人工序列）

<400> 17

cccaactaca gaaatggttt caaatgaatc tgtagactac cgagctactt ttccagaagg 60

tatatttcag tttattgttc tgagaaatac ctatacatat acctcagtgg gttgtgacat 120

<210> 18

<211> 120

<212> DNA

<213> （人工序列）

<400> 18

ctttctgtag gctggatgaa aaattcacag tcaaggttgc tgattttggt cttgccagag 60

acatgtatga taaagaatac tatagtgtac acaacaaaac aggtgcaaag ctgccagtga 120

<210> 19

<211> 120

<212> DNA

<213> （人工序列）

<400> 19

aatgaaggtg ccatcattct tgaggaggaa gtagcgtggc cgccaggtct tgatgtactc 60

ccctacagac gtgcgggtgg tgagagccac gcacactcta cccgtcagac cctcgccagg 120

<210> 20

<211> 120

<212> DNA

<213> （人工序列）

<400> 20

tggatcccaa ctgcctaccg ttgccatccg ggctttacgc aaataagtaa gaaggtctcc 60

tccctccatc agttccagga taatgtattg gggttcattc agcagacaaa ctccaagctg 120

<210> 21

<211> 120

<212> DNA

<213> （人工序列）

<400> 21

cgggcgaggg cgggtctctc ggaggaagga cttgaggtct ccccccgcca tgagctccag 60

caggatgaac cggggcaggg attgcaggct caccccaatg cagcgaacaa tgttctggtg 120

<210> 22

<211> 120

<212> DNA

<213> （人工序列）

<400> 22

tgtggcttta cctgatgatc agggcttcca tgaggaaatc cagttcgtcc tgttcagagc 60

acacttcagg cagcgtctgg gcagagaagg ggagggtggg gaggaggagg aggctgtgag 120

<210> 23

<211> 120

<212> DNA

<213> （人工序列）

<400> 23

acacagatca gcgacaggat gacaggaaga gcacagtcac tttgactcac cggtggatga 60

agtggttttc ctccaaatac tgacagccac aggcaatgtc ccgagccacg tgcagaaggt 120

<210> 24

<211> 120

<212> DNA

<213> （人工序列）

<400> 24

tcttcggcgt ctgcaccgag ggccgccccc tgctcatggt ctttgagtat atgcggcacg 60

gggacctcaa ccgcttcctc cggtaccagc acctggcctc agcgctggcc ccggcccctg 120

<210> 25

<211> 120

<212> DNA

<213> （人工序列）

<400> 25

ctggggtcag gtgcagggga agacaatcct tgcttacctg aggaacttat tcaggtctcc 60

atgcttcatg tattcaaaga ccatgatgag ggggtcccca tcgccgcaca ctccatagaa 120

<210> 26

<211> 120

<212> DNA

<213> （人工序列）

<400> 26

ctttcttgcg gagattctct tcctctgtgc gccggtctct cccaggacag gcacaaacac 60

gcacctcaaa gctgttccgt cccagtagat taccactact caggatagga aaagagaagc 120

<210> 27

<211> 120

<212> DNA

<213> （人工序列）

<400> 27

ggtggcaagt ggctcctgac ctggagtctt ccagtgtgat gatggtgagg atgggcctcc 60

ggttcatgcc gcccatgcag gaactgttac acatgtagtt gtagtggatg gtggtacagt 120

<210> 28

<211> 120

<212> DNA

<213> （人工序列）

<400> 28

cctcctccca gagaccccag ttgcaaacca gacctcaggc ggctcatagg gcaccaccac 60

actatgtcga aaagtgtttc tgtcatccaa atactccaca cgcaaatttc cttccactcg 120

<210> 29

<211> 120

<212> DNA

<213> （人工序列）

<400> 29

gtctctccag ccccagctgc tcaccatcgc tatctgagca gcgctcatgg tgggggcagc 60

gcctcacaac ctccgtcatg tgctgtgact gcttgtagat ggccatggcg cggacgcggg 120

<210> 30

<211> 120

<212> DNA

<213> （人工序列）

<400> 30

ggttattctg atttcccatt cttttcttta cttaaatagg gcaagttcac tacagcaagt 60

gatgtgtggg cctttggggt tactttgtgg gagactttca ccttttgtca agaacagccc 120

<210> 31

<211> 120

<212> DNA

<213> （人工序列）

<400> 31

gctggaggag ctagagcttg atgagcagca gcgaaagcgc cttgaggcct ttcttaccca 60

gaagcagaag gtgggagaac tgaaggatga cgactttgag aagatcagtg agctgggggc 120

<210> 32

<211> 120

<212> DNA

<213> （人工序列）

<400> 32

agtttgtggt ctgccagcta aaggtgaaga tatattcctc caattcagga cccacacgac 60

gggaagacaa gttcatgtac tttgagttcc ctcagccgtt acctgtgtgt ggtgatatca 120

<210> 33

<211> 120

<212> DNA

<213> （人工序列）

<400> 33

ggcagccagg aacgtactgg tgaaaacacc gcagcatgtc aagatcacag attttgggcg 60

ggccaaactg ctgggtgcgg aagagaaaga ataccatgca gaaggaggca aagtaaggag 120

<210> 34

<211> 120

<212> DNA

<213> （人工序列）

<400> 34

caacccccac gtgtgccgcc tgctgggcat ctgcctcacc tccaccgtgc agctcatcat 60

gcagctcatg cccttcggct gcctcctgga ctatgtccgg gaacacaaag acaatattgg 120

<210> 35

<211> 120

<212> DNA

<213> （人工序列）

<400> 35

tctgtcatag ggactctgga tcccagaagg tgagaaagtt aaaattcccg tcgctatcaa 60

aacatctccg aaagccaaca aggaaatcct cgatgtgagt ttctgctttg ctgtgtgggg 120

<210> 36

<211> 120

<212> DNA

<213> （人工序列）

<400> 36

tgcgaagcca cactgacgtg cctctccctc cctccaggaa gcctacgtga ttggccagcg 60

ggccagcgtg gacaaccccc acgtgtgccg cctgctgggc atctgcctca cctccaccgt 120

<210> 37

<211> 120

<212> DNA

<213> （人工序列）

<400> 37

caaccaagct ctcttgagga tcttgaagga aactgaattc aaaaagatca aagtgctggc 60

ctccggtgcg ttcggcacgg tgtataaggt aaggtccctg gcacaggcct ctgggctggg 120

<210> 38

<211> 120

<212> DNA

<213> （人工序列）

<400> 38

attcgtccac aaaatgattc tgaattagct gtatcgtcaa ggcactcttg cctacgccat 60

cagctccaac taccacaagt ttatattcag tcattttcag caggccttat aataaaaata 120

<210> 39

<211> 120

<212> DNA

<213> （人工序列）

<400> 39

acacaaagaa agccctcccc agtcctcatg tactggtccc tcattgcact gtactcctcg 60

tgacctgctg tgtcgagaat atccaagaga caggtttctc catcaattac tacttgcttc 120

<210> 40

<211> 120

<212> DNA

<213> （人工序列）

<400> 40

tgattttgca gaaaacagat ctgtatttat ttcagtgtta cttacctgtc ttgtctttgt 60

tgatgtttca ataaaaggaa ttccataact tcttgctaag tcctgagcct gttttgtgtc 120

<210> 41

<211> 120

<212> DNA

<213> （人工序列）

<400> 41

tccacaaaat ggatccagac aactgttcaa actgatggga cccactccat cgagatttct 60

ctgtagctag accaaaatca cctattttta ctgtgaggtc ttcatgaaga aatatatctg 120

<210> 42

<211> 120

<212> DNA

<213> （人工序列）

<400> 42

ccacattaca tacttaccat gccactttcc cttgtagact gttccaaatg atccagatct 60

aattctttgt cccactgtaa tctgcccatc aggaatctcc caatcatcac tcgagtcccg 120

<210> 43

<211> 120

<212> DNA

<213> （人工序列）

<400> 43

attcatctac aaagtggttc tggattagct ggattgtcag tgcgcttttc ccaacaccat 60

ctgctccaac caccaccagt ttgtactcag tcatttcaca ccagcaagaa cctgttggaa 120

<210> 44

<211> 120

<212> DNA

<213> （人工序列）

<400> 44

acagaggaag ccttcgcctg tcctcatgta ttggtctctc atggcactgt actcttcttt 60

tccagctgta tccagtatgt ccaacaaaca ggtttcacca tctataacca cttgttttct 120

<210> 45

<211> 120

<212> DNA

<213> （人工序列）

<400> 45

aaaatgacaa agaacagctc aaagcaattt ctacacgaga tcctctctct gaaatcacta 60

agcaggagaa agattttcta tggagtcaca ggtaagtgct aaaatggaga ttctctgttt 120

<210> 46

<211> 120

<212> DNA

<213> （人工序列）

<400> 46

cttagataaa actgagcaag aggctttgga gtatttcatg aaacaaatga atgatgcacg 60

tcatggtggc tggacaacaa aaatggattg gatcttccac acaattaaac agcatgcatt 120

<210> 47

<211> 120

<212> DNA

<213> （人工序列）

<400> 47

ccagggcatc tggatccctg atggggagaa tgtgaaaatt ccagtggcca tcaaagtgtc 60

gagggaaaac acatccccca aagccaacaa agaaatctta gacgtaagcc cctccaccct 120

<210> 48

<211> 120

<212> DNA

<213> （人工序列）

<400> 48

cataccctct cagcgtaccc ttgtccccag gaagcatacg tgatggctat acgtgatggc 60

ggtgtgggct ccccatatgt ctcccgcctt ctgggcatct gcctgacatc cacggtgcag 120

<210> 49

<211> 120

<212> DNA

<213> （人工序列）

<400> 49

cccaactaca gaaatggttt caaatgaatc tgtagactac cgagctactt ttccagaagt 60

tatatttcag tttattgttc tgagaaatac ctatacatat acctcagtgg gttgtgacat 120

<210> 50

<211> 120

<212> DNA

<213> （人工序列）

<400> 50

ctttctgtag gctggatgaa aaattcacag tcaaggttgc tgattttggt cttgccagaa 60

acatgtatga taaagaatac tatagtgtac acaacaaaac aggtgcaaag ctgccagtga 120

<210> 51

<211> 120

<212> DNA

<213> （人工序列）

<400> 51

aatgaaggtg ccatcattct tgaggaggaa gtagcgtggc cgccaggtct tgatgtactt 60

ccctacagac gtgcgggtgg tgagagccac gcacactcta cccgtcagac cctcgccagg 120

<210> 52

<211> 120

<212> DNA

<213> （人工序列）

<400> 52

tggatcccaa ctgcctaccg ttgccatccg ggctttacgc aaataagtaa gaaggtctct 60

tccctccatc agttccagga taatgtattg gggttcattc agcagacaaa ctccaagctg 120

<210> 53

<211> 120

<212> DNA

<213> （人工序列）

<400> 53

cgggcgaggg cgggtctctc ggaggaagga cttgaggtct ccccccgcca tgagctccat 60

caggatgaac cggggcaggg attgcaggct caccccaatg cagcgaacaa tgttctggtg 120

<210> 54

<211> 120

<212> DNA

<213> （人工序列）

<400> 54

tgtggcttta cctgatgatc agggcttcca tgaggaaatc cagttcgtcc tgttcagagt 60

acacttcagg cagcgtctgg gcagagaagg ggagggtggg gaggaggagg aggctgtgag 120

<210> 55

<211> 120

<212> DNA

<213> （人工序列）

<400> 55

acacagatca gcgacaggat gacaggaaga gcacagtcac tttgactcac cggtggatgc 60

agtggttttc ctccaaatac tgacagccac aggcaatgtc ccgagccacg tgcagaaggt 120

<210> 56

<211> 120

<212> DNA

<213> （人工序列）

<400> 56

tcttcggcgt ctgcaccgag ggccgccccc tgctcatggt ctttgagtat atgcggcaca 60

gggacctcaa ccgcttcctc cggtaccagc acctggcctc agcgctggcc ccggcccctg 120

<210> 57

<211> 120

<212> DNA

<213> （人工序列）

<400> 57

ctggggtcag gtgcagggga agacaatcct tgcttacctg aggaacttat tcaggtctct 60

atgcttcatg tattcaaaga ccatgatgag ggggtcccca tcgccgcaca ctccatagaa 120

<210> 58

<211> 120

<212> DNA

<213> （人工序列）

<400> 58

ctttcttgcg gagattctct tcctctgtgc gccggtctct cccaggacag gcacaaacat 60

gcacctcaaa gctgttccgt cccagtagat taccactact caggatagga aaagagaagc 120

<210> 59

<211> 120

<212> DNA

<213> （人工序列）

<400> 59

ggtggcaagt ggctcctgac ctggagtctt ccagtgtgat gatggtgagg atgggcctct 60

ggttcatgcc gcccatgcag gaactgttac acatgtagtt gtagtggatg gtggtacagt 120

<210> 60

<211> 120

<212> DNA

<213> （人工序列）

<400> 60

cctcctccca gagaccccag ttgcaaacca gacctcaggc ggctcatagg gcaccaccat 60

actatgtcga aaagtgtttc tgtcatccaa atactccaca cgcaaatttc cttccactcg 120

<210> 61

<211> 120

<212> DNA

<213> （人工序列）

<400> 61

gtctctccag ccccagctgc tcaccatcgc tatctgagca gcgctcatgg tgggggcagt 60

gcctcacaac ctccgtcatg tgctgtgact gcttgtagat ggccatggcg cggacgcggg 120

<210> 62

<211> 120

<212> DNA

<213> （人工序列）

<400> 62

ggttattctg atttcccatt cttttcttta cttaaatagg gcaagttcac tacagcaaga 60

gatgtgtggg cctttggggt tactttgtgg gagactttca ccttttgtca agaacagccc 120

<210> 63

<211> 120

<212> DNA

<213> （人工序列）

<400> 63

gctggaggag ctagagcttg atgagcagca gcgaaagcgc cttgaggcct ttcttacccc 60

gaagcagaag gtgggagaac tgaaggatga cgactttgag aagatcagtg agctgggggc 120

<210> 64

<211> 120

<212> DNA

<213> （人工序列）

<400> 64

agtttgtggt ctgccagcta aaggtgaaga tatattcctc caattcagga cccacacgat 60

gggaagacaa gttcatgtac tttgagttcc ctcagccgtt acctgtgtgt ggtgatatca 120

Claims

1.一种探针组合物，其特征在于，所述探针组合物用于检测靶核酸序列相对于非靶核酸序列的变异，该探针组合物包括阻滞探针和捕获探针，其中：

所述阻滞探针和非靶核酸序列结合的吉布斯自由能与捕获探针和非靶核酸序列结合的吉布斯自由能之差ΔG_非 ^{阻滞-捕获}为-9.5～-0.5kcal/mol；所述捕获探针和靶核酸序列结合的吉布斯自由能与阻滞探针和靶核酸序列结合的吉布斯自由能之差ΔG_靶 ^{捕获-阻滞}为-8.5～-0.5kcal/mol。

2.根据权利要求1所述的探针组合物，其特征在于：所述阻滞探针和非靶核酸序列结合的吉布斯自由能与捕获探针和非靶核酸序列结合的吉布斯自由能之差ΔG_非 ^{阻滞-捕获}为-4.5～-2.5kcal/mol；所述捕获探针和靶核酸序列结合的吉布斯自由能与阻滞探针和靶核酸序列结合的吉布斯自由能之差ΔG_靶 ^{捕获-阻滞}为-4.5～-2.5kcal/mol。

3.一种基于权利要求1或2所述的探针组合物的二代测序文库的构建方法，其特征在于，包括以下步骤：

将样本DNA片段、权利要求1或2所述的探针组合物进行杂交反应，杂交反应完成后对样本DNA片段中的靶核酸片段进行捕获，对捕获的靶核酸片段进行末端修复和接头连接，对接头连接产物进行index PCR扩增，构建得到所述二代测序文库。

4.根据权利要求3所述的构建方法，其特征在于：样本DNA片段来源于血浆、血清、血液、尿液、汗液、唾液、精液、胸水、腹水、粪便、穿刺样本和石蜡包埋组织切片样本中的至少一种。

5.根据权利要求3所述的构建方法，其特征在于：杂交反应体系中还包括杂交增强剂。

6.根据权利要求3所述的构建方法，其特征在于：所述捕获探针修饰有生物素。

7.根据权利要求3所述的构建方法，其特征在于：所述的捕获包括将杂交反应得到的杂交产物与修饰有链霉亲和素的磁珠共孵育后分离的步骤。

8.权利要求3-7任一项所述的构建方法构建得到的二代测序文库。

9.根据权利要求8所述的二代测序文库，其特征在于：测序深度为100X-1000X。

10.权利要求1或2所述的探针组合物在制备液体活检试剂或制备组织活检试剂中的应用。