CN112708665A

CN112708665A - 用于肺癌多基因突变测序文库的构建方法与试剂盒

Info

Publication number: CN112708665A
Application number: CN201911025079.2A
Authority: CN
Inventors: 曾杰; 彭璨璨; 吴诗扬; 刘志明
Original assignee: Surexam Bio Tech Co Ltd
Current assignee: Surexam Bio Tech Co Ltd
Priority date: 2019-10-25
Filing date: 2019-10-25
Publication date: 2021-04-27

Abstract

本发明提供了一种用于扩增肺癌驱动基因的捕获探针，其能够覆盖EGFR、ALK、ROS1、KRAS、BRAF、PIK3CA，HER2、RET、MET、NRAS、NTRK1‑3、MAP2K1等多个肺癌驱动基因的热点体细胞突变、插入缺失、结构变异与基因融合类型，且针对NTRK1‑3基因融合，目前国内未有二代测序文库覆盖该融合类型。该探针及制备的试剂盒相对于传统的PCR法对于靶向测序所使用的文库构建方法为杂交捕获法，可有效检出热点体细胞突变、插入缺失、结构变异与基因融合等多种变异类型，且对于多基因多位点的检测也有良好的均一性与灵敏度。而且，使用杂交捕获法进行文库构建仅需要使用DNA样本，对于基因融合的检测无需额外提取RNA样本，减少样本浪费，也无需考虑RNA质量对文库构建的影响。

Description

用于肺癌多基因突变测序文库的构建方法与试剂盒

技术领域

本发明属于生物医学技术领域，特别涉及一种用于肺癌多基因突变测序文库的构建方法与试剂盒。

背景技术

肺癌每年在我国的发病约有78.1万例，死亡约有62.6万例，是目前我国发病率和死亡率均最高的癌症。基于组织病理学结果，肺癌分为小细胞肺癌(SCLC)和非小细胞肺癌(NSCLC)，其中非小细胞肺癌占约80％。近年来，随着分子诊断技术不断发展与新型靶向药物陆续出现，非小细胞肺癌治疗已进入靶向治疗时代。

非小细胞肺癌驱动基因包括EGFR、ALK、ROS1、KRAS、BRAF、PIK3CA，HER2、RET、MET、NRAS、NTRK1-3、MAP2K1等多个基因，与肿瘤的发生、发展、药物疗效相关。目前国内已有多种针对非小细胞肺癌的靶向药物上市，包括EGFR酪氨酸激酶抑制剂(TKI)如吉非替尼、厄洛替尼、阿法替尼、奥希替尼，ALK与ROS1抑制剂克唑替尼等。此外，美国FDA上市NSCLC靶向药物还包括针对ALK融合的色瑞替尼、针对BRAF突变的达拉非尼与曲美替尼、针对NTRK融合的拉罗替尼等多种药物。针对HER2外显子20插入突变、RET融合与MET外显子14跳跃突变，美国国立综合癌症网络(NCCN)也推荐相关药物作为新的治疗选择。此外还有多种靶向药物正在进行临床试验。

目前市场上用于检测基因突变、扩增与融合等基因变异的方法主要包括Sanger测序法、荧光PCR法、液相芯片法、FISH法、IHC法等。然而这些方法均无法同时检出所有上述突变类型，且检测通量与灵敏度也不够高。下一代测序技术(NGS)可满足一次性平行对多样本多位点进行高通量检测的需求，其灵敏度与准确度高，且对于未知突变或融合类型也能检出，更适用于肺癌驱动基因多种基因变异类型检测的应用。目前国内已有几个基于NGS平台的肺癌驱动基因检测的同类产品，然而这些产品检测变异类型与位点相对较少，针对多基因的覆盖度、捕获率及均一性均有待提高，尤其是未有产品检测范围覆盖FDA新上市的抗癌药物拉罗替尼的靶点NTRK1-3的基因融合。

目前市面上对于靶向测序所使用的文库构建方法多为多重PCR法，随着检测位点增加，所需引物数量增加，由于各PCR反应相互竞争，导致均一性下降，甚至部分位点难以检出。且对于基因融合，多重PCR法需使用mRNA进行文库构建，RNA的质量与保存时间也对文库质量存在影响；此外，使用多重PCR法所构建的文库也无法检出基因扩增/缺失等结构变异。

发明内容

基于此，本发明的目的在于提供一种肺癌多基因突变测序文库的构建方法与试剂盒，以实现应用于二代测序的靶向捕获时，具有覆盖度高、捕获率高、均一性好等特点。

为实现上述目的，本发明具体技术方案如下：

一种用于肺癌多基因突变测序的捕获探针，包括如下至少一个基因的捕获探针：

序列如SEQ ID NO.1-SEQ ID NO.2所示的至少一条针对NRAS基因的捕获探针；

序列如SEQ ID NO.2-SEQ ID NO.10所示的至少一条针对RET基因的捕获探针；

序列如SEQ ID NO.11-SEQ ID NO.14所示的至少一条针对KRAS基因的捕获探针；

序列如SEQ ID NO.15-SEQ ID NO.16所示的至少一条针对MAP2K1基因的捕获探针；

序列如SEQ ID NO.17-SEQ ID NO.25所示的至少一条针对ALK基因的捕获探针；

序列如SEQ ID NO.26-SEQ ID NO.32所示的至少一条针对PIK3CA基因的捕获探针；

序列如SEQ ID NO.33-SEQ ID NO.42所示的至少一条针对ROS1基因的捕获探针；

序列如SEQ ID NO.43-SEQ ID NO.53所示的至少一条针对EGFR基因的捕获探针；

序列如SEQ ID NO.54-SEQ ID NO.59所示的至少一条针对MET基因的捕获探针；

序列如SEQ ID NO.60-SEQ ID NO.65所示的至少一条针对BRAF基因的捕获探针；

序列如SEQ ID NO.66-SEQ ID NO.70所示的至少一条针对HER2基因的捕获探针；

序列如SEQ ID NO.71-SEQ ID NO.72所示的至少一条针对NTRK1基因的捕获探针；

序列如SEQ ID NO.73-SEQ ID NO.75所示的至少一条针对NTRK2基因的捕获探针；

序列如SEQ ID NO.76-SEQ ID NO.77所示的至少一条针对NTRK3基因的捕获探针。

本发明还提供一种用于肺癌多基因突变测序的试剂盒，具体技术方案如下：

一种用于肺癌多基因突变测序的试剂盒，包括如上所述的用于肺癌多基因突变测序的捕获探针和接头混合物。

本发明还提供一种非诊断目的构建肺癌多基因突变测序文库的方法，具体技术方案如下：

一种非诊断目的构建肺癌多基因突变测序文库的方法，包括以下步骤：

对DNA样本末端修复加尾、接头连接，得预文库；

对所述预文库进行PCR扩增、纯化、定量；

加入如上所述的捕获探针，杂交；

靶向捕获，得靶向捕获文库；

对所述靶向捕获文库进行PCR扩增、纯化、定量，得肺癌多基因突变测序文库。

基于上述技术方案，本发明具有以下有益效果：

本发明中用于扩增肺癌驱动基因的捕获探针，其能够覆盖EGFR、ALK、ROS1、KRAS、BRAF、PIK3CA，HER2、RET、MET、NRAS、NTRK1-3、MAP2K1等多个肺癌驱动基因的热点体细胞突变、插入缺失、结构变异与基因融合类型，且针对NTRK1-3基因融合，目前国内未有二代测序文库覆盖该融合类型。

本发明所述的文库构建方法与试剂盒，相对于传统的PCR法对于靶向测序所使用的文库构建方法为杂交捕获法，可有效检出热点体细胞突变、插入缺失、结构变异与基因融合等多种变异类型，且对于多基因多位点的检测也有良好的均一性与灵敏度。而且，使用杂交捕获法进行文库构建仅需要使用DNA样本，对于基因融合的检测无需额外提取RNA样本，减少样本浪费，也无需考虑RNA质量对文库构建的影响。

附图说明

图1为构建肺癌驱动基因的多基因测序文库的流程示意图。

具体实施方式

为了便于理解本发明，下面将参照实施例对本发明进行更全面的描述，以下给出了本发明的较佳实施例。但是，本发明可以以许多不同的形式来实现，并不限于本文所描述的实施例。提供这些实施例的目的是使对本发明的公开内容的理解更加透彻全面。应理解，下列实施例中未注明具体条件的实验方法，通常按照常规条件，例如Sambrook等人，分子克隆：实验室手册(New York：Cold Spring Harbor Laboratory Press，1989)中所述的条件，或按照制造厂商所建议的条件。实施例中所用到的各种常用试剂，均为市售产品。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本发明。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。

本发明的一种用于肺癌多基因突变测序的捕获探针，其特征在于，包括如下至少一个基因的捕获探针：

序列如SEQ ID NO.1-SEQ ID NO.2所示的至少一条针对NRAS基因的捕获探针；序列如SEQ ID NO.2-SEQ ID NO.10所示的至少一条针对RET基因的捕获探针；序列如SEQ IDNO.11-SEQ ID NO.14所示的至少一条针对KRAS基因的捕获探针；序列如SEQ ID NO.15-SEQID NO.16所示的至少一条针对MAP2K1基因的捕获探针；序列如SEQ ID NO.17-SEQ IDNO.25所示的至少一条针对ALK基因的捕获探针；序列如SEQ ID NO.26-SEQ ID NO.32所示的至少一条针对PIK3CA基因的捕获探针；序列如SEQ ID NO.33-SEQ ID NO.42所示的至少一条针对ROS1基因的捕获探针；序列如SEQ ID NO.43-SEQ ID NO.53所示的至少一条针对EGFR基因的捕获探针；序列如SEQ ID NO.54-SEQ ID NO.59所示的至少一条针对MET基因的捕获探针；序列如SEQ ID NO.54-SEQ ID NO.59所示的至少一条针对MET基因的捕获探针；序列如SEQ ID NO.60-SEQ ID NO.65所示的至少一条针对BRAF基因的捕获探针；序列如SEQID NO.66-SEQ ID NO.70所示的至少一条针对HER2基因的捕获探针；序列如SEQ ID NO.71-SEQ ID NO.72所示的至少一条针对NTRK1基因的捕获探针；序列如SEQ ID NO.73-SEQ IDNO.75所示的至少一条针对NTRK2基因的捕获探针；序列如SEQ ID NO.76-SEQ ID NO.77所示的至少一条针对NTRK3基因的捕获探针。

在其中一些实施例中，包括如下捕获探针：序列如SEQ ID NO.1-SEQ ID NO.2所示的至少一条针对NRAS基因的捕获探针；和序列如SEQ ID NO.2-SEQ ID NO.10所示的至少一条针对RET基因的捕获探针；和序列如SEQ ID NO.11-SEQ ID NO.14所示的至少一条针对KRAS基因的捕获探针；和序列如SEQ ID NO.15-SEQ ID NO.16所示的至少一条针对MAP2K1基因的捕获探针；和序列如SEQ ID NO.17-SEQ ID NO.25所示的至少一条针对ALK基因的捕获探针；和序列如SEQ ID NO.26-SEQ ID NO.32所示的至少一条针对PIK3CA基因的捕获探针；和序列如SEQ ID NO.33-SEQ ID NO.42所示的至少一条针对ROS1基因的捕获探针；和序列如SEQ ID NO.43-SEQ ID NO.53所示的至少一条针对EGFR基因的捕获探针；和序列如SEQID NO.54-SEQ ID NO.59所示的至少一条针对MET基因的捕获探针；和序列如SEQ IDNO.54-SEQ ID NO.59所示的至少一条针对MET基因的捕获探针；和序列如SEQ ID NO.60-SEQ ID NO.65所示的至少一条针对BRAF基因的捕获探针；和序列如SEQ ID NO.66-SEQ IDNO.70所示的至少一条针对HER2基因的捕获探针；和序列如SEQ ID NO.71-SEQ ID NO.72所示的至少一条针对NTRK1基因的捕获探针；和序列如SEQ ID NO.73-SEQ ID NO.75所示的至少一条针对NTRK2基因的捕获探针；和序列如SEQ ID NO.76-SEQ ID NO.77所示的至少一条针对NTRK3基因的捕获探针。

在其中一些实施例中，包括如下至少一个基因的捕获探针：序列如SEQ ID NO.1-SEQ ID NO.2所示的针对NRAS基因的捕获探针；序列如SEQ ID NO.2-SEQ ID NO.10所示的针对RET基因的捕获探针；序列如SEQ ID NO.11-SEQ ID NO.14所示的针对KRAS基因的捕获探针；序列如SEQ ID NO.15-SEQ ID NO.16所示的针对MAP2K1基因的捕获探针；序列如SEQID NO.17-SEQ ID NO.25所示的针对ALK基因的捕获探针；序列如SEQ ID NO.26-SEQ IDNO.32所示的针对PIK3CA基因的捕获探针；序列如SEQ ID NO.33-SEQ ID NO.42所示的针对ROS1基因的捕获探针；序列如SEQ ID NO.43-SEQ ID NO.53所示的针对EGFR基因的捕获探针；序列如SEQ ID NO.54-SEQ ID NO.59所示的针对MET基因的捕获探针；序列如SEQ IDNO.54-SEQ ID NO.59所示的针对MET基因的捕获探针；序列如SEQ ID NO.60-SEQ ID NO.65所示的针对BRAF基因的捕获探针；序列如SEQ ID NO.66-SEQ ID NO.70所示的针对HER2基因的捕获探针；序列如SEQ ID NO.71-SEQ ID NO.72所示的针对NTRK1基因的捕获探针；序列如SEQ ID NO.73-SEQ ID NO.75所示的针对NTRK2基因的捕获探针；序列如SEQ IDNO.76-SEQ ID NO.77所示的针对NTRK3基因的捕获探针。

优选地，包括如下捕获探针：序列如SEQ ID NO.1-SEQ ID NO.2所示的针对NRAS基因的捕获探针；和序列如SEQ ID NO.2-SEQ ID NO.10所示的针对RET基因的捕获探针；和序列如SEQ ID NO.11-SEQ ID NO.14所示的针对KRAS基因的捕获探针；和序列如SEQ IDNO.15-SEQ ID NO.16所示的针对MAP2K1基因的捕获探针；和序列如SEQ ID NO.17-SEQ IDNO.25所示的针对ALK基因的捕获探针；和序列如SEQ ID NO.26-SEQ ID NO.32所示的针对PIK3CA基因的捕获探针；和序列如SEQ ID NO.33-SEQ ID NO.42所示的针对ROS1基因的捕获探针；和序列如SEQ ID NO.43-SEQ ID NO.53所示的针对EGFR基因的捕获探针；和序列如SEQ ID NO.54-SEQ ID NO.59所示的针对MET基因的捕获探针；和序列如SEQ ID NO.54-SEQID NO.59所示的针对MET基因的捕获探针；和序列如SEQ ID NO.60-SEQ ID NO.65所示的针对BRAF基因的捕获探针；和序列如SEQ ID NO.66-SEQ ID NO.70所示的针对HER2基因的捕获探针；和序列如SEQ ID NO.71-SEQ ID NO.72所示的针对NTRK1基因的捕获探针；和序列如SEQ ID NO.73-SEQ ID NO.75所示的针对NTRK2基因的捕获探针；和序列如SEQ IDNO.76-SEQ ID NO.77所示的针对NTRK3基因的捕获探针。

更优选地，所述捕获探针序列经过修饰。进一步优选地，所述修饰的方法为生物素标记。

本发明的一种用于肺癌多基因突变测序的试剂盒，其特征在于，包括如上任一项所述的用于肺癌多基因突变测序的捕获探针和接头混合物。

优选地，所述捕获探针的工作浓度为0.4pM-0.8pM。

优选地，所述接头混合物包括：P5接头和P7接头。

优选地，所述P5接头上包含有i5index片段与测序引物片段。

优选地，所述P7接头上包含有i7index片段、测序引物片段与分子条形码片段。

更优选地，所述分子条形码片段的核苷酸序列长度为8-10nt。

进一步优选地，所述分子条形码片段的序列为：NVNNDNHNN(SEQ ID NO.78)。

其中，N为简并碱基，对应A/T/C/G；V为简并碱基，对应G/A/C；D为简并碱基，对应G/A/T；H为简并碱基，对应A/T/C。

所述接头序列可去人不同样本来源的子文库，并通过分子条形码片段消除PCR扩增错误与测序错误导致的假阳性从而提高检测灵敏度。不同DNA样本来源的文库构建对应使用不同的接头混合物，每种接头混合物中P5/P7接头的i5/i7index序列各不相同，且i5/i7index序列组合方式唯一。

本发明的文库构建方法所构建的文库所带有的测序引物序列与i5/i7index序列可应用于Illumina公司NextSeq 500等市面上多种常用的二代测序平台。且每一条片段化DNA加上接头之后带有唯一的UMI标签，使其在测序结果处理中可过滤去除存在PCR扩增错误或测序错误的reads(序列)，确保有效reads能真实反映样本DNA的序列信息，降低测出假阳性结果的可能性，从而提高检出灵敏度。

优选地，所述接头混合物中每个接头的工作浓度为140μM-160μM。更优选地，所述接头混合物中每个接头的工作浓度为145μM-155μM。进一步优选为150μM。

更优选地，所述接头的核苷酸序列经修饰。进一步优选地，所述修饰为反向dT、间臂、磷酸化、氨基化、硫代磷酸化中的一种或多种。

优选地，所述试剂盒还包含有末端修复加尾反应体系，包括末端修复加尾酶。

具体地，所述末端修复加尾反应体系包括以下组分：T4DNA连接酶、T4多聚核苷酸激酶与Taq DNA聚合酶。

优选地，所述末端修复加尾反应体系包括以下组分：T4DNA连接酶4U-6U、T4多聚核苷酸激酶9U-11U与Taq DNA聚合酶4U-6U。

更优选地，所述末端修复加尾反应体系包括以下组分：T4DNA连接酶4.5U-5.5U、T4多聚核苷酸激酶9.5U-10.5U与Taq DNA聚合酶4.5U-5.5U。

进一步优选地，所述末端修复加尾反应体系包括以下组分：T4DNA连接酶5U、T4多聚核苷酸激酶10U与Taq DNA聚合酶5U。

本发明的一种非诊断目的构建肺癌多基因突变测序文库的方法，包括以下步骤：

对DNA样本末端修复加尾、接头连接，得预文库；

对所述预文库进行PCR扩增、纯化、定量；

加入如上任一项所述的捕获探针，杂交；

靶向捕获，得靶向捕获文库；

优选地，所述DNA样本包括：由细胞、组织、FFPE、血浆、肺泡灌洗液等样本中提取的DNA。

其中，当DNA样本为由细胞、组织、FFPE中提取的DNA时，在对DNA样本末端修复加尾前，还需对DNA样本进行片段化处理。当DNA样本为由血浆、肺泡灌洗液中提取的DNA时，无需进行样本DNA片段化。

优选地，所述样本DNA起始量为50-1000ng。在一些实施例中，所述样本DNA起始量为50ng、100ng、200ng、300ng或500ng。

优选地，所述样本DNA片段化，其方法为：超声破碎法和/或酶切法。更优选为超声破碎法。

优选地，所述对DNA样本末端修复加尾的反应体系为：DNA样本45-55μL、末端修复加尾缓冲液5-10μL、末端修复加尾酶1.5-2.5μL。

更优选地，末端修复加尾酶包括以下组分：T4DNA连接酶、T4多聚核苷酸激酶与TaqDNA聚合酶。更优选为：T4DNA连接酶4U-6U、T4多聚核苷酸激酶9U-11U与Taq DNA聚合酶4U-6U。进一步优选为：T4DNA连接酶4.5U-5.5U、T4多聚核苷酸激酶9.5U-10.5U与Taq DNA聚合酶4.5U-5.5U。

优选地，所述对DNA样本末端修复加尾的反应程序为：于18-22℃反应28-32min、于65-75℃反应18-22min。

优选地，所述接头连接的反应体系为：如上所述末端修复加尾反应的产物58-62μL、接头混合物4.5-5.5μL、连接缓冲液18-22μL、连接酶4.5-5.5μL，加水至90μL。

优选地，所述接头连接的反应程序为：于18-22℃反应13-17min。

优选地，对所述预文库进行PCR扩增的反应程序如下：

优选地，所述加入捕获探针杂交的反应体系为：杂交缓冲液8-12μL、捕获探针7-9μL、封闭剂1.5-2.5μL、加水至19-21μL。

本发明以下实施例中所用的试剂，包括：末端修复加尾缓冲液、连接缓冲液、连接酶、PCR扩增反应液、封闭剂1、杂交缓冲液、封闭剂2、洗涤液1、洗涤液2、洗涤液3、洗涤液4、磁珠清洗液、杂交缓冲液等，均为IDT公司产品。主要有xGen Hybridization and Wash Kit和缓冲液Buffers。

实施例1

一种检测肺癌多基因体细胞突变与基因融合试剂盒，包含捕获探针混合物、接头混合物与末端修复与加尾反应体系。捕获探针序列如下：

表1 捕获探针序列

所述接头混合物组合，其特征为不同DNA样本来源的文库构建使用不同的接头混合物，每种接头混合物中P5/P7接头的i5/i7index序列各不相同，且i5/i7index序列组合方式唯一。其中各接头混合物中，每种接头的工作浓度为150μM。针对不同样本的文库构建，应使用不同的接头混合物。

所述末端修复与加尾反应体系，包括末端修复与加尾酶，其组分包括：5U T4DNA连接酶、10U T4多聚核苷酸激酶与5U Taq DNA聚合酶。

例如在实施例5中，针对7例样本，接头序列如下表所示：

表2 接头序列

实施例2

使用实施例1所述试剂盒进行样本检测。

一、样本DNA片段化

本实施例中，使用Covaris^TM DNA超声破碎仪将DNA样本片段化至150-400bp，也可选择酶切法进行DNA片段化。

二、末端修复加尾：

按比例配置反应体系如表3。

表3 末端修复加尾反应体系

试剂	用量
		片段化的DNA	50μl
末端修复加尾缓冲液	8μl
		末端修复加尾酶	2μl
Total	60μl

混匀并瞬时离心，按表4的程序进行反应。

表4 末端修复加尾反应程序

温度	时间
		20℃	30min
70℃	20min
		4℃	∞

三、接头连接

配置反应体系，如表5所示。

表5 接头连接反应体系

试剂	用量
		上一步反应产物	60μl
接头混合物*	5μl
		连接缓冲液	20μl
连接酶	5μl
		Total	90μl

*不同样本应使用不同接头混合物。

混匀并瞬时离心，按表6的程序进行反应。

表6 接头连接反应程序

温度	时间
		20℃	15min
4℃	∞

四、连接产物纯化。

1)样品纯化磁珠提前取出，室温静置30min；

2)向上步PCR管的反应产物中加入45μl样品纯化磁珠，混匀，25℃孵育10min；

3)将PCR管短暂离心后置于磁力架上至液体完全澄清，小心弃去上清；

4)沿管壁缓慢加入200μl 80％乙醇，静置30s，小心弃去上清；

5)重复步骤4)一次；

6)将PCR管瞬时离心并置于磁力架上，小心吸走残留乙醇，室温干燥至乙醇挥发完全；

7)取下PCR管，加入26μl无核酸酶水，均匀悬浮磁珠，室温孵育2min；

8)将PCR管置于磁力架上至液体完全澄清，吸取20μl上清至新的PCR管中，置于冰上备用。

五、预文库PCR扩增

配置反应体系(表7)。

表7 预文库扩增反应体系

试剂	用量
		片段筛选产物	25μl
2×PCR扩增反应液	25μl
		Total	50μl

混匀并瞬时离心，扩增反应(程序如表8)。

表8 预文库扩增反应程序

六、预文库纯化与定量

1)向PCR管中加入等体积样品纯化磁珠，室温孵育10min。

2)将PCR管短暂离心后置于磁力架上至液体完全澄清，小心弃去上清。

3)沿管壁缓慢加入200μl 80％乙醇，静置30s，小心弃去上清。

4)重复步骤3)一次。

5)将PCR管瞬时离心并置于磁力架上，小心吸走残留乙醇，室温干燥至乙醇挥发完全。

6)向管中加入20μl TE buffer，室温孵育2min。

7)瞬间离心并将PCR管置于磁力架上至液体完全澄清，小心吸取上清至新的PCR管中。

8)用Qubit 4.0定量。

9)进行琼脂糖凝胶电泳或使用Bioanalyzer(Agilent)进行片段检测。

七、探针杂交

1)按表9将各组分混合于1.5mL低吸附离心管。

表9 文库混合体系

试剂	用量
		上步纯化的预文库(1-12个)	500ng/预文库
封闭剂1	7.5μl

2)加入2倍体积的样本纯化磁珠；

3)涡旋混匀，25℃孵育10min；

4)将离心管置于磁力架上至液体完全澄清，小心弃去上清；

5)沿管壁小心加入大于1倍体积的80％乙醇，静置30s，弃去上清；

6)重复步骤4)一次；

7)短暂离心后将离心管置于磁力架上，吸弃残留乙醇，室温干燥至乙醇完全挥发；

8)按表10配置杂交反应液，加入离心管中；

表10 杂交反应体系

试剂	用量
		杂交缓冲液	10μl
捕获探针混合物	8μl
		封闭剂2	2μl
Total	20μl

9)涡旋混匀，室温孵育5min；

10)将离心管置于磁力架上5-10min至液体完全澄清，使用移液器转移18μl上清至新的PCR管，按表11的程序进行杂交反应。

表11 杂交反应程序

温度	时间
		95℃	10min
60℃	12-16h

八、文库靶向捕获

1)按表12稀释下列试剂；

表12 各试剂稀释配方

	所需体积(μl)	加入NF水体积(μl)
			洗涤液1	176	176
洗涤液2	277	31
			洗涤液3	158	18
洗涤液4	158	18
			磁珠清洗液	317	35

2)分装洗涤液1 120μl与洗涤液4 330μl至PCR管中，置于60℃孵育备用；

3)按表13配置磁珠悬浮液；

表13 磁珠悬浮液

试剂	用量
		杂交缓冲液	12μl
无核酸酶水	5μl
		Total	17μl

4)将链霉亲和素磁珠旋涡混匀，吸取500μl磁珠至1.5mL低吸附管中；

5)加入100μl磁珠洗涤液，轻柔吹打混匀，瞬时离心，置于磁力架上至液体完全澄清，吸弃上清，将离心管移出磁力架；

6)重复步骤4)2次；

7)向离心管中加入17μl磁珠悬浮液，轻柔吹打混匀，将全部磁珠悬浮液转移至1个新的低吸附PCR管；

8)杂交反应后，调整PCR仪热盖温度为70℃；

9)将重悬的链霉亲和素磁珠加到杂交体系中，涡旋混匀；

10)60℃孵育45min，每10-12min轻柔涡旋一次，确保完全重悬；

11)孵育结束后取下PCR管，加入100μl 60℃孵育的洗涤液1，吹打混匀；

12)将PCR管置于磁力架上至液体完全澄清，吸弃上清；

13)将PCR管取下，加入150μl洗涤液4，吹打混匀，60℃孵育5min；

14)重复步骤11)和12)一次；

15)将PCR管瞬时离心，置于磁力架上至液体完全澄清，吸弃上清，加入150μl室温的洗涤液1，涡旋混匀，室温孵育2min；

16)将PCR管瞬时离心，置于磁力架上至液体完全澄清，吸弃上清，加入150μl室温的洗涤液2，涡旋混匀，室温孵育2min；

17)将PCR管瞬时离心，置于磁力架上至液体完全澄清，吸弃上清，加入150μl室温的洗涤液3，涡旋混匀，室温孵育2min；

18)将PCR管瞬时离心，置于磁力架上至液体完全澄清，吸弃上清，用10μl吸头吸弃残留液体；

19)取下PCR管，加入25μl无核酸酶水，吹打混匀，将所有液体移至新的PCR管中。

九、PCR扩增靶向捕获文库

1)按表14配置PCR体系：

表14 PCR扩增靶向捕获文库反应体系

试剂	用量
		2×PCR扩增反应液	25μl
上一步捕获产物	25μl
		Total	50μl

2)按表15的程序进行PCR反应；

表15 PCR扩增靶向捕获文库反应程序

十、文库纯化与定量

1)PCR完成后，取出PCR管置于磁力架上至完全澄清，转移上清至一新的PCR管；

2)向管中加入60μl纯化磁珠，涡旋混匀，室温孵育10min；

3)瞬间离心后，将PCR管置于磁力架上至完全澄清，弃去上清；

4)沿管壁加入150μl 80％乙醇，静置1min，吸弃上清；

5)重复步骤4)一次；

6)将PCR管瞬间离心并置于磁力架上至完全澄清，用10μl吸头吸弃残留乙醇；

7)打开管盖室温干燥至乙醇挥发完全；

8)取下PCR管，加入25μl TE buffer，室温孵育5min；

9)将PCR管置于磁力架上至完全澄清，小心转移上清至一个新的PCR管；

10)使用Qubit对文库进行定量。

十一、文库测序与结果分析

本实施例针对20个DNA样本进行了文库构建，并将所构建文库进行混合、上机测序与数据分析，结果表明(见表16)，所有样本的检测数据Q30>80％，平均深度>500×，覆盖度高，捕获效率高，均一性好，说明使用本发明的文库构建方法可构建出高质量的测序文库。

表16 样本数据质量

序号	样本编号	Q30/％	平均测序深度/×	覆盖度/％	捕获效率/％	均一性/％
							1	144912	89.94	731.14	100	83.75	97.03
2	134323	88.4	751.62	100	82.08	97.29
							3	149282	88.29	743.46	100	83.04	97.07
4	134453	86.15	770.79	100	84.83	98.01
							5	137541	89.46	738.95	100	83.21	98.46
6	130832	85.21	728.02	100	75.01	98.56
							7	145363	88.62	766.78	100	80.88	98.58
8	136859	88.53	754.54	100	76.59	97.62
							9	139172	88.82	754.89	100	84.59	97.94
10	131198	86.98	771.08	100	79.29	97.55
							11	147038	89.02	745.19	100	84.77	97.14
12	148786	85.42	736.02	100	83.94	98.63
							13	131685	86.69	736.27	100	78.68	98.02
14	147869	88.85	763.54	100	80.44	97.96
							15	131258	87.54	736.10	100	78.15	97.92

实施例3不同来源DNA样本对文库测序结果的影响

选择30例来源于石蜡组织切片、新鲜组织或血浆的DNA样本，包括经Sanger测序/FISH法/数字PCR法验证过的20例存在基因变异阳性的样本与10例检测范围内基因变异阴性的样本，使用实施例1的试剂盒，按照实施例2的方法进行文库构建，并进行测序分析，结果表明(见表17)：使用本发明的方法对不同来源的DNA样本进行文库构建并测序，其定性结果与Sanger测序或FISH等金标准检验结果完全一致，稳定可靠。

表17 不同来源DNA样本构建文库测序结果

实施例4不同样本DNA起始量对文库构建的影响

选择6例经Sanger测序验证突变类型不同的样本，使用实施例1的试剂盒，按实施例2的方法，分别加入50ng，100ng，200ng，500ng，1000ng样本DNA进行文库构建，结果表明(如表18)，构建文库的样本核酸浓度低至50ng时，使用本发明所提供的文库构建试剂盒与构建方法仍可正确检测出相应突变，且使用不同起始量的DNA所构建的文库所测得突变率接近。

表18 不同核酸浓度样本文库构建检测结果

实施例5灵敏度验证

选择7例突变类型不同、经数字PCR确定突变率的样本，用野生型样本混合成突变率为0.5％、1％、2％的样本，使用实施例1的试剂盒，按实施例2的方法进行文库构建并上机测序，结果表明(如表19)：本发明所提供的文库构建试剂盒与构建方法可正确检出相应突变类型，且所测突变率与理论值接近。

表19 灵敏度测试结果

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对以上实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

序列表

<110> 益善生物技术股份有限公司

<120> 用于肺癌多基因突变测序文库的构建方法与试剂盒

<160> 91

<170> SIPOSequenceListing 1.0

<210> 1

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

aatgcataac aacaaagaat atgaatatgg atcacatctc taccagagtt aatcaactga 60

tgcaaactct tgcacaaatg ctgaaagctg taccatacct gtctggtctt ggctgaggtt 120

<210> 2

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

tcaatgaatg gaatcccgta actcttggcc agttcgtggg cttgttttgt atcaactgtc 60

cttgttggca aatcacactt gtttcccact agcaccatag gtacatcatc cgagtctttt 120

<210> 3

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

tgctgctgct gccgctgcta ggcaaaggtg agttctgccg gccgccggct cccgcagggg 60

ccagggcgaa gttggcgccg agcagcggag cgggcgcgtt cagaagcgcc tttctgtttg 120

<210> 4

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

gaaaaactcc tgctaagatc ggaattttaa attaatgatt tttttttttt ttgtccttga 60

agaagcctta ttctcaccat ccctcactca cttccctact tcccacagtg gcattgggcc 120

<210> 5

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

tctacttctc gagggatgct tactgggaga agctgtatgt ggaccaggca gccggcacgc 60

ccttgctgta cgtccatgcc ctgcgggacg cccctgagga ggtgcccagc ttccgcctgg 120

<210> 6

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

gccagcatct ctacggcacg taccgcacac ggctgcatga gaacaactgg atctgcatcc 60

aggaggacac cggcctcctc taccttaacc ggagcctgga ccatagctcc tgggagaagc 120

<210> 7

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

tcagtgtccg cagtaaggga gccgccccaa cacccacccc gtgccccacc ccaccccttc 60

ctcaagccgc ccttatcaca gccgctgaca ctgaagcttg gcatggcttc ccccccaccg 120

<210> 8

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

gggtttacac cagccctgga gctcctgcct cctccccatt cccgactgcc tggcagatgt 60

ggccgatgcc cccacagacc tgacttctct ctgcagaccg cggctttccc ctgctcaccg 120

<210> 9

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

gcctggagag agtcctgtac cactcacgag agctgatggc actaacactg ggtttccaag 60

atatccaaat gatagtgtat atgctaactg gatgctttca ccctcagcgg caaaattaat 120

<210> 10

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

ggacacgttt gatagttaac atttctttgt gaaaggtaat ggactcacaa ggggaagaaa 60

catgctgaga atggaaagtc taccggccct ttctttgtga acgtcacatt ggccgagccg 120

<210> 11

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

tgctgtctac tatagctcat atctttttct ccctactaaa aaaaaaaaaa aaaaaaaaaa 60

agctgctgat tatctcaaaa cttttccctt aaaaataaag gtaaatatca gtttccaaat 120

<210> 12

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

atttagttta cttaagactc attaaatcat tagactttat gccaaatata gattagtcta 60

ctacagccat caaaattgtc tcaattataa ttaattccca ctagattaaa aataaatgta 120

<210> 13

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

ctaattatgg aaacaagttt cttatctttt aatacttcaa gttagaatac tacacctaag 60

tagttctaaa gtggttgcca ccttgttacc tttaaaagac atctgctttc tgccaaaatt 120

<210> 14

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 14

aatgtgctga acttaaactt accagattac attataatgc attttttaat tttcacacag 60

ccaggagtct tttcttcttt gctgattttt ttcaatctgt attgtcggat ctccctcacc 120

<210> 15

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 15

cctccctctt tctttcataa aacctctctt tcttccacct ttctccagct aattcatctg 60

gagatcaaac ccgcaatccg gaaccagatc ataagggagc tgcaggttct gcatgagtgc 120

<210> 16

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 16

aactctccgt acatcgtggg cttctatggt gcgttctaca gcgatggcga gatcagtatc 60

tgcatggagc acatggtatg tgacaccctc tcagcctctg gagcaatggc cttaagagtt 120

<210> 17

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 17

tttggtctct ggtttgtgaa ggagccattg cctctctctc ctccacggtc ttagggatcc 60

caaggaagag aagtgagtgt gcgaccgagc tcagggccca ggctggttca tgctattctt 120

<210> 18

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 18

gcttttcaga atggtatcct cgtaatgacc agctccaggg gcagtagcgg cttctaaggg 60

caagccctgt tgctggtagc cgtaattgac attcccacaa gggaagtgac gtagcctgaa 120

<210> 19

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 19

cagaggtacc tccttcatat tggcagtcag cgaagagggc tctaggagca gtgaggcccc 60

cggaagtctc ccagttgcaa cgttaggtgg gacagtacag cttccctcca gccccaggtt 120

<210> 20

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 20

acccctgtcg tgtggctcct tctttgctat aggattattc tttttggtgg gtttctctgt 60

aaaccaggag ccgtacgttg ggttccacaa gctggtgggc ttgtttctgg atccgtggac 120

<210> 21

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 21

cttgtgcaac tccgaaggag ggttggactg agagaatgcc atattcacgt gtcccccttc 60

cacggccggc cctctaggga ctcgaacaga gatctctgca gctgtgggtt tctttgcagc 120

<210> 22

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 22

cttgccagag gaggtggtag gcagaggtgg tggggcagct gggctgcgct cctcctcccg 60

ttttgcctgt tgagagacca ggagaggagg aaccccctca gggtccttgg gcctcacagg 120

<210> 23

<211> 119

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 23

cactttctct tcctcttcca caagtggacc atattctatc ggcaaagcgg tgttgattac 60

atccgggtcc tgccgtaggg gaaattatta aaactttgaa tcagagacaa aaaatgttg 119

<210> 24

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 24

catatttcgg tatttgccat ctttaagact gtttcatata gagtaaatgt tgaccaaagg 60

gagaaaatgt tttacctggg tgcagtattc aatcctctcc aaaatgatgg caaagttggg 120

<210> 25

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 25

cctgtcttca ggctgatgtt gccagcactg agtcattatc cggtatctaa aagaagaagc 60

acattaatta aaataaggag aagcacaatg atgaaaaata tattttcttc cagccccagg 120

<210> 26

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 26

ggacaaccat acatctaatt ccttaaagta gttttatatg taaaacttgc aaagaatcag 60

aacaatgcct ccacgaccat catcaggtga actgtggggc atccacttga tgcccccaag 120

<210> 27

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 27

aatcctagta gaatgtttac taccaaatgg aatgatagtg actttagaat gcctccgtga 60

ggctacatta ataaccataa agcatgaact atttaaagaa gcaagaaaat accccctcca 120

<210> 28

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 28

tcaacttctt caagatgaat cttcttacat tttcgtaagt gttactcaag aagcagaaag 60

ggaagaattt tttgatgaaa caagacgact ttgtgacctt cggctttttc aacccttttt 120

<210> 29

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 29

aaaagtaatt gaaccagtag gcaaccgtga agaaaagatc ctcaatcgag aaattggtat 60

gatacaatat cctattctaa aatgcaaata accataaagc ttaactgttg tccctttcta 120

<210> 30

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 30

ttattgtgat cttccaaatc tacagagttc cctgtttgca aaaaaaacat gttcatgctg 60

tgtatgtaat agaatgttat attctttatg taattttatt aaaggttttg ctatcggcat 120

<210> 31

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 31

gccagtgtgt gaatttgata tggttaaaga tccagaagta caggacttcc gaagaaatat 60

tctgaacgtt tgtaaagaag ctgtggatct tagggacctc aattcacctc atagtagagc 120

<210> 32

<211> 119

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 32

aatgtatgtc tatcctccaa atgtagaatc ttcaccagaa ttgccaaagc acatatataa 60

taaattagat aaaggtaaga aaatgactaa tctactctaa tcattactat agtgcagtc 119

<210> 33

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 33

acatttatca ttctagcaga gttttctttc agtaactact gaatgagagt gtttatctca 60

actctctatt tcccaaacaa cgctattaat cagacccatc tccatatcca ctgtgagtga 120

<210> 34

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 34

gacaggcata gttcaggcct tcaggcttgc cagaagggca gtaagccact tgtttttctt 60

ggcagaaatc tttgtctgca tgtggttcct tctcttcttt cctcagacca caagattcag 120

<210> 35

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 35

attcctggga gcctagagga ccctcagact tttcttcacc ttggccacat tctgtagcaa 60

gtaccatata gtttaaccct tctcggttct tcgtttccat taaagcaact ggcataatgt 120

<210> 36

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 36

catctgaatt caaacaaatc acatcgccat cttcacctgt gaaaaaaata tgaatgttat 60

tctagcatgt atttaattat ttatttgtaa taatatacaa gctatatcag aattatagca 120

<210> 37

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 37

tttgcctacc ccaaaatgct ttctgtgtac attccatttt aactttgttc agttcacagt 60

gcagcgaaaa ctagaaaatt ctgaagaatc aaacttacct tcaaagcttt catttatgac 120

<210> 38

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 38

tccactgttg tttgcttcat ctctggactt ataaatgcta tttaagaaaa aatttctgaa 60

taactgaagt tggtcctgaa ttctatgaaa agtaggtctt tggtcgggtt cttgagccca 120

<210> 39

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 39

gcactgggtc attaaattcc acctaaatat atggggaaag atgggaaagt aaatagcaat 60

tggatataat tactgataac ccaggtaggg tcattttaga aaggaaagaa tctgagttat 120

<210> 40

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 40

atttaagttc cagttcttat tttaacaatt taacaaacta tatcaagagg cctaagattg 60

tatgtgcaca tgtttttgtt tgggggatac atatgttaac ataattaact tacagatcat 120

<210> 41

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 41

caggacaatt tcttggtggc tccagtctcc ctcctgtttg cacatagttt aacacatcaa 60

ggttggaatg agctggataa ggctgatgac caagagttaa aatctcccaa atcagaattc 120

<210> 42

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 42

caaaagacct aagaatagta gagggtttgc tttaattata cttattacaa acaccaggtt 60

tacagtagtt tctccaacaa catttttcct ggggctagca gggtctactt tgtcagtgta 120

<210> 43

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 43

caaccaccgc gcacggcccc ctgactccgt ccagtattga tcgggagagc cggagcgagc 60

tcttcgggga gcagcgatgc gaccctccgg gacggccggg gcagcgctcc tggcgctgct 120

<210> 44

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 44

ggctgcgctc tgcccggcga gtcgggctct ggaggaaaag aaaggtaagg gcgtgtctcg 60

ccggctcccg cgccgccccc ggatcgcgcc ccggaccccg cagcccgccc aaccgcgcac 120

<210> 45

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 45

gctcttaaag ggatatcctc tcctggttta ggtataaact tttgactcac aggacaaatt 60

ctatcattcc tttgggccta ggattgcatt tatttccatg acaaaagggc ctgtctggtg 120

<210> 46

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 46

tttcagcaaa tgaaaacaaa aatataaagc ccatctcctt ttgaatgagc tctaaaacag 60

ttctccactg gacttcagaa caagagggag ctctgggctg ctggctggtt gtgcatttgc 120

<210> 47

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 47

tgtgggttcc ctccggcagg cgacctctcc gcgctgagaa ggttatccgg ataaccaagt 60

aagaaagtac atgaggaggc acagaaagaa aaatgtgaga gataacagca taaacacaca 120

<210> 48

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 48

gtgaagaaac tgctaccctt aatacctgga ccttgaggga ttgttttatt ttagtttttc 60

tgcatttctc agtatttcat gtgatatctg tctttttctt ccagtttgcc aaggcacgag 120

<210> 49

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 49

taacaagctc acgcagttgg gcacttttga agatcatttt ctcagcctcc agaggatgtt 60

caataactgt gaggtggtcc ttgggaattt ggaaattacc tatgtgcaga ggaattatga 120

<210> 50

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 50

tctttccttc ttaaaggttg gtgactttga ttttcctaca caaataaaat tggagaaaat 60

ctaagtggag aaaggcctgg gcagaattcc acttgaagtg tgtttatttt tgctatggca 120

<210> 51

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 51

cgtcctaggg ctccctggac ccattttaga ccttgagttc ttgagttcct caaaagagaa 60

atcacgcatt tatgttttct cttcttagac catccaggag gtggctggtt atgtcctcat 120

<210> 52

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 52

tgccctcaac acagtggagc gaattccttt ggaaaacctg cagatcatca gaggaaatat 60

gtactacgaa aattcctatg ccttagcagt cttatctaac tatgatgcaa ataaaaccgg 120

<210> 53

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 53

actgaaggag ctgcccatga gaaatttaca gggtgagagg ctgggatgcc aaggctgggg 60

gttcataaat gcagacagca gttccgatgg ctcccagcga gcttgtcact caattccacc 120

<210> 54

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 54

gtaaaagtcc agttgggaag ctttatttct gatagattaa atggtatagg tctttcagtt 60

ttctcttcat ttctgacaac tgaactgctc tcgccttgaa cctgttttgg cagataaacc 120

<210> 55

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 55

tctcataatg aaggcccccg ctgtgcttgc acctggcatc ctcgtgctcc tgtttacctt 60

ggtgcagagg agcaatgggg agtgtaaaga ggcactagca aagtccgaga tgaatgtgaa 120

<210> 56

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 56

tatgaagtat cagcttccca acttcaccgc ggaaacaccc atccagaatg tcattctaca 60

tgagcatcac attttccttg gtgccactaa ctacatttat gttttaaatg aggaagacct 120

<210> 57

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 57

tcagaaggtt gctgagtaca agactgggcc tgtgctggaa cacccagatt gtttcccatg 60

tcaggactgc agcagcaaag ccaatttatc aggaggtgtt tggaaagata acatcaacat 120

<210> 58

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 58

ggctctagtt gtcgacacct actatgatga tcaactcatt agctgtggca gcgtcaacag 60

agggacctgc cagcgacatg tctttcccca caatcatact gctgacatac agtcggaggt 120

<210> 59

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 59

tcactgcata ttctccccac agatagaaga gcccagccag tgtcctgact gtgtggtgag 60

cgccctggga gccaaagtcc tttcatctgt aaaggaccgg ttcatcaact tctttgtagg 120

<210> 60

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 60

gcaacaaaat ttgacttcta catgagcgag acatccttaa tgtattttaa aaaaagctat 60

ttaaaagaaa ctccaattta taacattttc ccgctaaaaa tccgaagtta agacatttta 120

<210> 61

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 61

ctcatgtcaa acgtgccact cctcagcaat atttttggtc acctgcactc aaaatttata 60

aaaagaaact tagtttattg cttcaaggaa ataaaagaca tccacatttt ccaaattgtt 120

<210> 62

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 62

ataaaaagaa atagttatag aaaaattatt aagaataata atagaattat taaattctac 60

tgacttccta aattagatct gttcagtttg ccttatctaa cccaggctaa ccgactgcca 120

<210> 63

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 63

acttctcacc tgcaaacaca ggcataggta gggtcttctt ctggagtccc tagtggacat 60

gtgatagctg gcaacaaaag ttgcatgaga aactgaagtt tactacttaa aataaccaag 120

<210> 64

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 64

tgaatgatac aaacccggaa cagaaagtaa agcctctaga agaggctctg ccaattttta 60

gcaatgtcta tgtattttaa cccttggatg ttaaaaatcc aatgttaagt ataaatttta 120

<210> 65

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 65

gtttggggaa aaattatatc tagtctttaa ccacacaagt gttctttggt tcaccttaaa 60

aaaaaagaga gtattttatt caatttaaca tataagcaaa catatgttca tttattttcc 120

<210> 66

<211> 119

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 66

ttcgatgtga ctgtctcctc ccaaatttgt agaccctctt aagatcatgc ttttcagata 60

cttcaaagat tccagaagat atgccccggg ggtcctggaa gccacaaggt aaacacaac 119

<210> 67

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 67

gctgggagtt gccactccca gacttgttgg aatgcagttg gagggggcga gctgggagcg 60

cgcttgctcc caatcacagg agaaggagga ggtggaggag gagggctgct tgaggaagta 120

<210> 68

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 68

taagaatgaa gttgtgaagc tgagattccc ctccattggg accggagaaa ccaggggagc 60

cccccgggca gccgcgcgcc ccttcccacg gggcccttta ctgcgccgcg cgcccggccc 120

<210> 69

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 69

ccacccctcg cagcaccccg cgccccgcgc cctcccagcc gggtccagcc ggagccatgg 60

ggccggagcc gcagtgagca ccatggagct ggcggccttg tgccgctggg ggctcctcct 120

<210> 70

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 70

cgccctcttg ccccccggag ccgcgagcac ccaaggtggg tctggtgtgg ggaggggacg 60

gagcagcggc gggaccctgc cctgtggatg ccccgccgag gtcccgcggc cggcggggcc 120

<210> 71

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 71

gccccaagct ggctaaagct ccttcttatt cccccctctc tttcctgatc tagaaatctg 60

ggggtctgcc atccctgggg ctgaccctgg ccaatgtcac cagtgacctc aacaggaaga 120

<210> 72

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 72

acgtgacgtg ctgggcagag aacgatgtgg gccgggcaga ggtctctgtt caggtcaacg 60

tctcctgtga gtctcagtgg cagctccggc acccaccccc tactcatctc ttcttccctc 120

<210> 73

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 73

ccacttaaga ttatggaact gcagcgaatg acatcgggga caccacgaac agaagtaatg 60

aaatcccttc cacagacgtc actgataaaa ccggtcggga acatctctcg gtgagtggaa 120

<210> 74

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 74

aatatatata tttttccatc tccaggccca gcctccgtta tcagcaatga tgatgactct 60

gccagcccac tccatcacat ctccaatggg agtaacactc catcttcttc ggaaggtggc 120

<210> 75

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 75

ccagatgctg tcattattgg aatgaccaag atccctgtca ttgaaaatcc ccagtacttt 60

ggcatcacca acagtcagct caagccagac acatgtaagt acagctgttt gtacttattg 120

<210> 76

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 76

ccctgggccc tcagccagcc ctcctcctgg tgccggcatg cctctggggt ttaccttcac 60

agccacaagc atcttgtcct tggtcgggct gaggttgtag cactcggcca ggaagacctt 120

<210> 77

<211> 120

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 77

tccaaaggct ccctcaccca gttctcgctt cagcacgatg tctctcctct taatgtgctg 60

cacatctgta ggatggggac aaagaggagg gcagcaaatc agtcctcgtt tggtgacaca 120

<210> 78

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 78

ctgaacgt 8

<210> 79

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 79

actccatc 8

<210> 80

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 80

gatggagt 8

<210> 81

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 81

tggactct 8

<210> 82

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 82

cgatgttc 8

<210> 83

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 83

ccttgatc 8

<210> 84

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 84

aatgacgc 8

<210> 85

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 85

ttgcagac 8

<210> 86

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 86

tgagctgt 8

<210> 87

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 87

acgacttg 8

<210> 88

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 88

atagagcg 8

<210> 89

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 89

cagtccaa 8

<210> 90

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 90

gaagtgct 8

<210> 91

<211> 8

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 91

aactgagc 8

Claims

1.一种用于肺癌多基因突变测序的捕获探针，其特征在于，包括如下至少一个基因的捕获探针：

2.根据权利要求1所述的用于肺癌多基因突变测序的捕获探针，其特征在于，包括如下捕获探针：

序列如SEQ ID NO.1-SEQ ID NO.2所示的至少一条针对NRAS基因的捕获探针；和

序列如SEQ ID NO.2-SEQ ID NO.10所示的至少一条针对RET基因的捕获探针；和

序列如SEQ ID NO.11-SEQ ID NO.14所示的至少一条针对KRAS基因的捕获探针；和

序列如SEQ ID NO.15-SEQ ID NO.16所示的至少一条针对MAP2K1基因的捕获探针；和

序列如SEQ ID NO.17-SEQ ID NO.25所示的至少一条针对ALK基因的捕获探针；和

序列如SEQ ID NO.26-SEQ ID NO.32所示的至少一条针对PIK3CA基因的捕获探针；和

序列如SEQ ID NO.33-SEQ ID NO.42所示的至少一条针对ROS1基因的捕获探针；和

序列如SEQ ID NO.43-SEQ ID NO.53所示的至少一条针对EGFR基因的捕获探针；和

序列如SEQ ID NO.54-SEQ ID NO.59所示的至少一条针对MET基因的捕获探针；和

序列如SEQ ID NO.60-SEQ ID NO.65所示的至少一条针对BRAF基因的捕获探针；和

序列如SEQ ID NO.66-SEQ ID NO.70所示的至少一条针对HER2基因的捕获探针；和

序列如SEQ ID NO.71-SEQ ID NO.72所示的至少一条针对NTRK1基因的捕获探针；和

序列如SEQ ID NO.73-SEQ ID NO.75所示的至少一条针对NTRK2基因的捕获探针；和

3.根据权利要求1所述的用于肺癌多基因突变测序的捕获探针，其特征在于，包括如下至少一个基因的捕获探针：

序列如SEQ ID NO.1-SEQ ID NO.2所示的针对NRAS基因的捕获探针；

序列如SEQ ID NO.2-SEQ ID NO.10所示的针对RET基因的捕获探针；

序列如SEQ ID NO.11-SEQ ID NO.14所示的针对KRAS基因的捕获探针；

序列如SEQ ID NO.15-SEQ ID NO.16所示的针对MAP2K1基因的捕获探针；

序列如SEQ ID NO.17-SEQ ID NO.25所示的针对ALK基因的捕获探针；

序列如SEQ ID NO.26-SEQ ID NO.32所示的针对PIK3CA基因的捕获探针；

序列如SEQ ID NO.33-SEQ ID NO.42所示的针对ROS1基因的捕获探针；

序列如SEQ ID NO.43-SEQ ID NO.53所示的针对EGFR基因的捕获探针；

序列如SEQ ID NO.54-SEQ ID NO.59所示的针对MET基因的捕获探针；

序列如SEQ ID NO.60-SEQ ID NO.65所示的针对BRAF基因的捕获探针；

序列如SEQ ID NO.66-SEQ ID NO.70所示的针对HER2基因的捕获探针；

序列如SEQ ID NO.71-SEQ ID NO.72所示的针对NTRK1基因的捕获探针；

序列如SEQ ID NO.73-SEQ ID NO.75所示的针对NTRK2基因的捕获探针；

序列如SEQ ID NO.76-SEQ ID NO.77所示的针对NTRK3基因的捕获探针。

4.根据权利要求1所述的用于肺癌多基因突变测序的捕获探针，其特征在于，包括如下捕获探针：

序列如SEQ ID NO.1-SEQ ID NO.2所示的针对NRAS基因的捕获探针；和

序列如SEQ ID NO.2-SEQ ID NO.10所示的针对RET基因的捕获探针；和

序列如SEQ ID NO.11-SEQ ID NO.14所示的针对KRAS基因的捕获探针；和

序列如SEQ ID NO.15-SEQ ID NO.16所示的针对MAP2K1基因的捕获探针；和

序列如SEQ ID NO.17-SEQ ID NO.25所示的针对ALK基因的捕获探针；和

序列如SEQ ID NO.26-SEQ ID NO.32所示的针对PIK3CA基因的捕获探针；和

序列如SEQ ID NO.33-SEQ ID NO.42所示的针对ROS1基因的捕获探针；和

序列如SEQ ID NO.43-SEQ ID NO.53所示的针对EGFR基因的捕获探针；和

序列如SEQ ID NO.54-SEQ ID NO.59所示的针对MET基因的捕获探针；和

序列如SEQ ID NO.60-SEQ ID NO.65所示的针对BRAF基因的捕获探针；和

序列如SEQ ID NO.66-SEQ ID NO.70所示的针对HER2基因的捕获探针；和

序列如SEQ ID NO.71-SEQ ID NO.72所示的针对NTRK1基因的捕获探针；和

序列如SEQ ID NO.73-SEQ ID NO.75所示的针对NTRK2基因的捕获探针；和

序列如SEQ ID NO.76-SEQ ID NO.77所示的针对NTRK3基因的捕获探针。

5.一种用于肺癌多基因突变测序的试剂盒，其特征在于，包括权利要求1-6任一项所述的用于肺癌多基因突变测序的捕获探针和接头混合物。

6.根据权利要求5所述的用于肺癌多基因突变测序的试剂盒，其特征在于，所述接头混合物包括：P5接头和P7接头。

7.根据权利要求6所述的用于肺癌多基因突变测序的试剂盒，其特征在于，所述P5接头上包含有i5 index片段与测序引物片段；和/或

所述P7接头上包含有i7 index片段、测序引物片段与分子条形码片段。

8.根据权利要求7所述的用于肺癌多基因突变测序的试剂盒，其特征在于，所述分子条形码片段的序列如SEQ ID NO.78所示。

9.根据权利要求5-8任一项所述的用于肺癌多基因突变测序的试剂盒，其特征在于，所述捕获探针的工作浓度为0.4pM-0.8pM；和/或

所述接头混合物中每个接头的工作浓度为140μM-160μM。

10.一种非诊断目的构建肺癌多基因突变测序文库的方法，其特征在于，包括以下步骤：

对DNA样本末端修复加尾、接头连接，得预文库；

末端修复加尾、接头连接，得预文库；

对所述预文库进行PCR扩增、纯化、定量；

加入如权利要求1-4任一项所述的捕获探针，杂交；

靶向捕获，得靶向捕获文库；