CN117512116A

CN117512116A - 一种用于胆管癌检测的生物标志物及其应用

Info

Publication number: CN117512116A
Application number: CN202311675544.3A
Authority: CN
Inventors: 樊嘉; 周俭; 施国明; 黄晓勇; 锁涛; 郑博豪; 张欣; 江峥增; 韩晶; 薛成; 黄凯; 彭海翔; 纪元; 彭睿
Original assignee: Shanghai Puen Haihui Medical Laboratory Co ltd; Zhongshan Hospital Fudan University
Current assignee: Shanghai Puen Haihui Medical Laboratory Co ltd; Zhongshan Hospital Fudan University
Priority date: 2023-12-07
Filing date: 2023-12-07
Publication date: 2024-02-06

Abstract

本发明公开了一种用于胆管癌检测的生物标志物及其应用。本发明用于胆管癌检测的生物标志物组合，包含了DNA+RNA双水平检测肿瘤组织样本，检测广泛的遗传变异，包括单核苷酸变异(SNVs)、插入缺失(indels)、拷贝数变异(CNV)、基因融合(Fusion)以及微卫星不稳定(MSI)，检测更全面；同时，生物标志物组合还包含了识别潜在样品混杂或污染的位点组合，可实现匹配和校对DNA+RNA样本，使得检测更准确；本发明的生物标志物组合可以用于胆管癌的诊断、治疗、预后等发生发展的各个阶段，为胆管癌的全面、系统化的检测和研究奠定了基础。

Description

一种用于胆管癌检测的生物标志物及其应用

技术领域

本发明涉及一种用于胆管癌检测的生物标志物及其应用，属于生物医学检测技术领域。

背景技术

胆道恶性肿瘤(biliary tract carcinoma，BTC)主要包括胆囊癌(gallbladdercancers，GBC)和肝内外胆管癌(cholangiocarcinomas，CC)。肝内外胆管癌(以下均称为胆管癌)的发病率在全球范围内呈上升趋势。据统计，目前胆管癌发病率占消化道恶性肿瘤的3％，病死率占全世界每年所有癌症相关死亡病例的2％。而在中国，每10万名居民中就有6例以上发病患者。胆管癌起源于胆管上皮，大多为腺癌，根据肿瘤发生的位置不同，分为肝内胆管癌(iCCA)和肝外胆管癌(eCCA)，肝外胆管癌又可分为肝门部胆管癌(pCCA)和远端胆管癌(dCCA)。不同部位的胆管癌在临床表现上各有特征，因此诊断和治疗也不同。由于胆管癌的临床症状不典型，出现症状时常已经晚期，虽然有针对晚期的胆管癌患者一线化疗方案吉西他滨联合铂类，但有效率只有15～26％，疗效不理想，因此对胆管癌的诊断和治疗急需新的策略和方案。

随着下一代测序技术的应用，基因检测、靶向药物组合给癌症患者的治疗有了一个崭新的空间。根据基因组分析，在胆管癌中有近40％的患者存在潜在的可靶向性的基因突变，具有靶向治疗的可能。11％的ICC和3％的胆囊癌可检测到FGFR1-3基因变异；在11％～45％的CCA中检测到FGFR2基因融合，常见的形式主要有FGFR2-ZMYM4、FGFR2-BICC1融合等；晚期/转移性或手术无法切除CCA患者的二线治疗临床试验(FIGHT-202)显示，FGFR2基因易位的CCA患者Pemigatinib(INCB54828)临床治疗效果显著。在HCC中，PIK3CA突变频率约为4％，PTEN缺失突变频率约为7％，临床研究提示，PI3K、AKT和mTOR抑制剂可以作为PIK3CA突变的肿瘤患者潜在的治疗靶点。HER2基因突变在CCA中发生频率约为3.9％，在胆囊癌中约11.0％，研究显示HER2与胆囊癌的预后相关。MET突变在HCC中的发生频率约为1.89％；在CCA中的突变频率约为1.44％。研究发现，HCC患者的肿瘤组织中c-MET表达水平较高，并与索拉非尼的耐药相关；高表达c-MET的HCC细胞中，卡博替尼能够高效抑制MET活性，抑制血管生成、细胞增殖、细胞迁移和侵袭，促进细胞凋亡。因此，胆管癌的基因或者结构变异的识别对于胆管癌的诊断和治疗非常重要。

利用逆转录聚合酶链反应(RT-PCR)、荧光原位杂交(FISH)和最近的下一代测序(NGS)进行分子分析是非常有价值的诊断工具。FISH或RT-PCR分别用于检测基因组水平或转录水平的融合事件，然而这两种方法都有相应的局限性。FISH方法仅能用于鉴别是否发生融合突变，无法确定融合的伴侣基因以及具体断点位置；RT-PCR需要设计特异的引物和探针，仅限于检测已知融合突变，不能用于未知融合突变的检测。

NGS是一种高通量、低成本的工具，可以对多个染色体区域进行平行测序，以检测广泛的遗传变异，包括单核苷酸变异(SNVs)、插入缺失(indels)、易位和拷贝数变异(CNV)。全基因组测序和外显子组测序可以发现新的基因组变化，而靶向NGS是一种成本效益高的技术，用于检测已知的结构变异，可以对感兴趣的特定区域，并进行更深入的测序。特别是靶向NGS，可以在单一检测中富集和测序一组基因或区域，减少成本、周转时间和数据分析负担。这使得它更适合用于诸如FFPE或者活检等稀疏标本道。

发明内容

本发明的目的是：针对现有胆管癌检测技术的不足，本发明提供一种用于胆管癌检测的生物标志物组合及其应用，本发明用于胆管癌检测的生物标志物组合，包含了DNA+RNA双水平检测肿瘤组织样本，检测广泛的遗传变异，包括单核苷酸变异(SNVs)、插入缺失(Indels)、拷贝数变异(CNV)、基因融合(Fusion)以及微卫星不稳定(MSI)，检测更全面；同时，该生物标志物组合还包含了识别潜在样品混杂或污染的位点组合，可实现匹配和校对DNA+RNA样本，使检测更准确；本发明的生物标志物组合可以用于胆管癌的诊断以及治疗和预后等发生发展的各个阶段的病情监测，为胆管癌的全面、系统化的检测和研究奠定了基础。

为达到解决上述问题的目的，本发明采取了以下技术方案：

本发明的第一方面，提供一种生物标志物在制备用于检测胆管癌基因变异的产品中的应用，所述生物标志物包括用于检测胆管癌DNA变异的生物标志物A和用于检测胆管癌RNA变异的生物标志物B；

所述生物标志物A由基因ALK，CDK12，FGFR1，MTOR，PIK3CA，AR，CDKN2A，FGFR3，NF1，PTCH1，ATM，CHEK1，FGFR4，NRAS，PTEN，BARD1，DPYD，FLI1，NRG1，RAD51C，BRAF，EGFR，IDH1，NTRK1，ROS1，BRCA1，ERBB2，IDH2，NTRK3，TSC1，BRCA2，ESR1，KDM6A，PALB2，TSC2，BRIP1，EZH2，KRAS和PDGFRA组成；

所述生物标志物B由ALK，BRAF，ETV6，FGFR1，FGFR2，FGFR3，FGFR4，NRG1，NTRK1，NTRK2，NTRK3，RET，ROS1，FLI1，PDGFB和MET组成。

优选地，所述DNA变异包括基因融合(Fusion)、单核苷酸变异(SNVs)、插入缺失(Indels)、拷贝数变异(CNV)以及微卫星不稳定(MSI)；所述RNA变异包括基因融合(Fusion)。

优选地，所述应用包括以生物标志物的检测试剂制备用于检测胆管癌基因变异的试剂盒。

优选地，所述试剂盒中至少包括用于检测生物标志物的探针。

优选地，所述应用包括以生物标志物作为检测指标制备用于检测胆管癌基因变异的检测系统或检测设备。

本发明的第二方面，提供一种用于检测胆管癌基因变异的试剂盒，所述试剂盒中至少包括用于检测生物标志物的探针。

优选地，所述试剂盒中还包括用于提取样本中的DNA和/或RNA的试剂，所述样本为胆管癌肿瘤组织。

本发明的第三方面，提供一种用于检测胆管癌基因变异的系统或设备，所述系统或设备包括：

数据获取模块，用以获取样本测序数据，所述测序数据为采用检测胆管癌生物标志物组合的探针与预文库进行杂交捕获，经磁珠纯化后得到测序文库，测序文库通过基因测序仪NextSeq 550Dx/Novaseq 6000测序得到测序数据；

数据处理模块，用于将测序数据经过数据预处理、数据比对和质量控制得到符合质控要求的分析数据；

数据检测分析模块，用于测序数据的检测分析；

以及检测结果获取模块；

所述系统或设备通过以下步骤用以实现胆管癌基因变异的检测：

步骤1：获取待测受试者样本中的生物标志物组合表达谱数据，所述生物标志物组合来源于胆管癌患者的肿瘤组织样本；

步骤2：数据处理，所述数据处理具体包括：

步骤2.1，数据预处理：使用软件分析数据测序质量参数Q30碱基占比。如果Q30占比≥60％则质量控制通过；否则质量控制不通过。然后使用Illumina公司的软件将NextSeq550Dx/Novaseq 6000测序产生的BCL文件转化为Fastq文件。再使用Trimmomatic-0.36软件去掉建库中引入的接头序列和低质量碱基片段；

步骤2.2，数据比对：从原始下机数据中去除低质量的碱基和接头序列，对过滤的数据进行碱基质量统计，将测序片段read回帖到参考基因组并统计read数、比对率、测序深度及覆盖度、变异检测；

步骤2.3，数据质量控制：根据样本Q30碱基占比,序列比对到参考基因组比例，目标区域的平均测序深度等参数，决定样本测序质量是否合格；如果Q30≥60％，序列比对到参考基因组比例≥90％，平均测序深度≥300X，则样本测序数据质量控制通过；否则不通过，判定检测失败，需要重新测序；

步骤3：数据分析，SNV/Indels突变检测使用检测软件Vardict V1.8.2-2和MuTect2 V 4.0.12.0联合检测；MSI检测使用软件MSIsensor2；基因融合检测使用软件Manta V1.6.0和Delly2 V1.1.15；CNV检测使用软件cnvkit V0.9.6。分析参数设置要求序列比对质量≥20，碱基质量≥30，其余皆是默认设置；

步骤4：结果获取，如果SNV/Indels的突变丰度≥0.5％，则判定为阳性；反之为阴性；融合基因的突变丰度≥0.5％，则判定为阳性；反之为阴性；MSI的score≥10％，则判定为MSI-H；反之为MSS(微卫星稳定)；CNV的CN≥3.25，则判为阳性，反之为阴性。

本发明的第四方面，提供一种计算机设备，所述计算机设备包括存储器和处理器，所述存储器存储有程序，所述处理器执行所述程序时实现上述技术方案中所述的步骤。

本发明的第五方面，一种计算机可读存储介质，所述计算机可读存储介质包括存储的计算机程序；

其中，在所述计算机程序运行时控制所述计算机可读存储介质实现上述技术方案中所述的步骤。

与现有技术相比，本发明的有益效果在于：

(1)本发明提供的胆管癌相关生物标志物覆盖广，检测性能高

同一标本提取DNA与RNA，经不同前处理后进入相同检测流程，同步测序分析；通过DNA，可检测单核苷酸变异(SNVs)、插入缺失(Indels)拷贝数变异(CNV)以及微卫星不稳定(MSI)；通过RNA，可检测基因融合(Fusion)，DNA结构变异与RNA剪切变异都可产生融合基因，DNA受样本质量影响较小，但探针受未知断点与较大内含子区域限制，易造成漏检；RNA可弥补DNA融合检测不足，发现更多新融合形式，且可检测RNA层面的剪接变异；

(2)检测成本低，适用范围更广

本发明提供的胆管癌生物标志物组合及检测系统，能够实现DNA+RNA双水平检测胆管癌患者肿瘤组织样本的DNA和RNA层面的基因变异，包括单核苷酸变异(SNVs)、插入缺失(Indels)拷贝数变异(CNV)以及微卫星不稳定(MSI)，一个检测分析流程检测多种，成本更低，具有更大的推广价值。

3)分析便捷，可操作性强

本发明的系统，从下机数据到各种变异结果一步即可完成，可同时分析胆管癌检测的多种生物标志物，分析时间大大缩短，为患者争取宝贵的检测分析时间。

附图说明

图1.66个DNA测序样本中检测到442个胚系突变位点上纯合子数目分布图；

图2.DNA和RNA样本匹配分数分布图。灰色框图是DNA和RNA样本不是来自同一个病人情况下的分数分布(共4290个分数)；红色框图是DNA和RNA样本是来自同一个病人情况下的分数(共66个分数)；

图3.SNV/INDEL分布情况；

图4.34例样本拷贝数变异结果；

图5.226例临床样本微卫星不稳定性检测结果；

图6.226例临床样本微卫星不稳定性检测结果；

图7.检测到的DNA和RNA FGFR融合。

具体实施方式

为使本发明更明显易懂，兹以优选实施例，并配合附图作详细说明如下。

实施例1生物标志物的筛选

1、筛选方法

本实施例利用基因组学和技术，对胆管癌(CCA)组织和正常组织进行高通量的基因分析，识别胆管癌组织与正常组织的分子差异，以及在胆管癌中显著上调或下调的候选标志物基因。通过比较分析，寻找胆管癌特异性的表达模式和基因突变，筛选得到用于胆管癌检测的生物标志物组合，包括IDH1/2、FGFR2、PIK3CA、PTEN、BRAF等39种基因用于DNA变异检测，以及FGFR1、FGFR2、FGFR3、FGFR4等16种基因用于RNA融合变异检测，分别如下列表1和表2所示。

表1.DNA变异检测基因列表

ALK	CDK12	FGFR1	MTOR	PIK3CA
					AR	CDKN2A	FGFR3	NF1	PTCH1
ATM	CHEK1	FGFR4	NRAS	PTEN
					BARD1	DPYD	FLI1	NRG1	RAD51C
BRAF	EGFR	IDH1	NTRK1	ROS1
					BRCA1	ERBB2	IDH2	NTRK3	TSC1
BRCA2	ESR1	KDM6A	PALB2	TSC2
					BRIP1	EZH2	KRAS	PDGFRA

表2.RNA融合变异检测基因列表

ALK	BRAF	ETV6	FGFR1	FGFR2
					FGFR3	FGFR4	NRG1	NTRK1	NTRK2
NTRK3	RET	ROS1	FLI1	PDGFB
					MET

本发明的上述生物标志物组合可用于识别潜在样品混杂或污染的位点组合，匹配和校对DNA+RNA样本，使检测更准确；DNA+RNA双水平检测胆管癌患者肿瘤组织样本的DNA和RNA层面的基因变异，更全面的反应肿瘤样本的基因变异情况。匹配和校对DNA+RNA样本使用设定位置的中国人高频胚系突变位点上的纯合子比例来估算样本间的关系。

2、胚系突变位点选择

从1000Genome项目公共胚系突变数据库中选取442个人群中高频率胚系突变，频率(AF，alternative allele frequency)在0.3-0.7之间(0.3<AF<0.7)。这些突变落在JUS70 panel目标范围内。这442个胚系突变在hg19参考基因组上的坐标和在1000Genome人群中的频率，具体如表3所示。

表3.用于计算DNA和RNA测序数据匹配情况的442个人群高频率胚系突变

/>

3、DNA和RNA样本匹配判断方法

使用66个临床样本，分别使用JUS70 panel DNA和RNA测序分析。在分别进行DNA测序数据突变检测和RNA测序数据突变检测后，汇总在442个人群高频胚系位点的DNA和RNA基因型结果。以DNA测序数据结果中442个位点上纯合子突变为基准(假如是n个)，观测RNA测序数据中这100个DNA纯合子突变位点上纯合子突变的个数(k个)。这样DNA样本和RNA样本的匹配分数为

理论上说，在一个位点上同一个人样本中，如果DNA样本是纯合子突变，那么RNA样本观测到的应该是纯合子突变。但是由于目标位点上测序深度也会有随机性的变化，造成在纯合子判断上有些误差。这样的误差会造成DNA纯合子位点上RNA的观测值不一定100％是纯合子突变。但是当这样的观测点较大时(>>60,见图1)，公式1计算的匹配分数会趋向1。而当DNA样本和RNA样本不是来自同一个人时，这个匹配分数会远小于1(见下面)。这样就可以根据匹配分数，通过统计来判断DNA样本和RNA样本是不是来自同一个人。

4、DNA样本检测纯合子数目

在选取这些人群中高频率胚系突变的一个主要目的是保证任何一个人的样本在进行DNA和RNA样本匹配分析中有足够的纯合子突变供分析。我们先来看是否满足这一需要。根据表3中胚系突变的突变频率，可以估计纯合子发生的频率期望值，

这样计算的纯合子频率期望值为0.2363。那么一个DNA样本在442个胚系突变上检测到纯合子数量的期望值就是442×0.2363≈104个。这与我们在66个DNA样本上的观测值非常接近，见图1。

5、DNA和RNA样本匹配分数判别阈值

为了验证上述的理论分析以及寻找DNA和RNA样本匹配分数判别的阈值，我们使用66个人的DNA和RNA测序样本，采用JUS70试剂盒测序分析。分别用不同的DNA和RNA样本的组合匹配，计算匹配分数。总共有66×66＝4356种组合，其中匹配的组合(DNA和RNA样本来自同一个人)有66种，不匹配的组合(DNA和RNA样本来自不同的人)有4290种。值得注意的是，由于匹配分析是以DNA样本纯合子为基准，因此如果DNA和RNA样本来自不同的人，以A人DNA样本为基准计算B人RNA样本的匹配分数，和以B人DNA样本为基准计算A人RNA样本的匹配分数是不同的分析。

分析结果显示，同一个人的DNA和RNA样本匹配分数分布在[0.75，1]这一区间(如图2所示，红色标注)，而不同人的DNA和RNA样本匹配分数分布在[0.14,0.5]。2组分布之间有一个很大而且明显的间距。这一观察与上面的理论设想一致，并且很容易设定一个匹配分数阈值来区分这2组分类。因此，设定DNA和RNA样本匹配分数阈值为0.6。当匹配分数≥0.6时，判为DNA和RNA样本来自同一个人；否则，就是来自不同的人。

实施例2生物标志物的应用

本实施例提供了利用实施例1筛选得到的生物标志物检测胆管癌，方法及过程如下：

1.样本DNA、RNA提取

采用磁珠法石蜡总核酸提取试剂盒依据厂家说明进行FFPE样本的DNA、RNA提取和纯化。对提取的DNA、RNA分别进行精确定量(推荐使用Qubit荧光定量仪)，提取产物DNA于-20℃保存，RNA于-70℃保存。

2.DNA预文库制备

采用文库制备试剂盒(KAPA HyperPlus Kit，Roche，货号07962428001)依据厂家说明进行FFPE样本的DNA文库制备，具体步骤如下：

2.1片段化处理

1)根据样本浓度，取100ng gDNA总量，35μL总体积进行片段化；如样本体积不足35μL，则使用10mM Tris-HCl，pH 8.0溶液补足至35μL。

2)片段化反应液按每个测试配制体系如下：

组分名称	体积(μL)
		剪切酶缓冲液(10X)	5
剪切酶	10
		合计	15

2)将混匀后的片段化反应液取15μL加入到待测样本中，混匀，短暂离心将反应液收集至管底后立即将PCR管放入PCR仪，按如下设置程序并运行：(热盖温度：50℃)

步骤	温度	时间
			预冷	4℃	1min
片段化	37℃	10min
			Hold	4℃	∞

2.2末端修复和加A

1)末端修复反应液按每个测试配制体系如下：

组分名称	体积(μL)
		末端修复缓冲液	7
末端修复酶	3
		合计	10

2)将混匀后的末端修复反应液取10μL加入到片段化后的PCR管中，混匀，短暂离心将反应液收集至管底后立即将PCR管放入PCR仪，按如下设置程序并运行：(热盖温度：85℃)

步骤	温度	时间
			末端修复和加A	65℃	30min
Hold	4℃	∞

3)反应结束后短暂离心置于冰盒上备用。

2.3接头连接

1)配制连接反应液按每个测试配制体系如下：

组分名称	体积(μL)
		连接酶缓冲液	30
DNA连接酶	10
		无核酸酶水	5
合计	45

2)取通用接头5μL加入到末端修复后的PCR管中，震荡混匀短暂离心。

3)加入连接反应液取45μL，混匀并短暂离心，将反应液收集至管底后立即将PCR管放入PCR仪，按如下设置程序并运行：(热盖温度：50℃)

步骤	温度	时间
			接头连接	20℃	15min
Hold	4℃	∞

4)反应结束后短暂离心置于冰盒上备用。

2.4连接产物磁珠纯化

1)推荐使用KAPA HyperPure Beads(Roche，货号08963860001)，取88μL纯化磁珠加至连接产物PCR管中，按照纯化试剂盒说明进行磁珠纯化

2)纯化产物用22μL已平衡至室温的10mM Tris-HCl，pH 8.0溶液洗脱，吸取20μL上清至新的PCR管中，切勿碰触磁珠，置于冰盒上备用。

2.5文库扩增

1)每个样本中加入25μL PCR扩增反应液1和5μL PCR扩增引物(包含样本标签序列)，混匀，短暂离心将反应液收集至管底后立即将PCR管放入PCR仪，按如下设置程序并运行：(热盖温度：105℃)

2)反应结束后置于冰盒上备用。

2.6扩增产物磁珠纯化

1)推荐使用KAPA HyperPure Beads，取45μL纯化磁珠加至PCR管中，按照纯化试剂盒说明进行磁珠纯化。

2)纯化产物用32μL已平衡至室温的10mM Tris-HCl，pH 8.0溶液洗脱，吸取30μL上清至新的PCR管中，切勿碰触磁珠，置于冰盒上备用。

2.7文库质控

1)使用核酸定量试剂盒dsDNA HS Assay Kit及配套仪器测定样本DNA文库的浓度。

2)取样本DNA文库，使用毛细管电泳试剂High Sensitivity D5000 Reagents及配套仪器进行片段质控，文库平均片段长度在200-600bp之间，无明显小片段和大片段杂峰。

3.RNA预文库制备

采用文库制备试剂盒(KAPA RNA HyperPrep Kit，Roche，货号8105952001)依据厂家说明进行FFPE样本的RNA文库制备，具体步骤如下：

3.1RNA片段化

1)取200ng RNA总量，10μL总体积进行片段化；如样本体积不足10μL，则使用10mMTris-HCl，pH 8.0溶液补足至10μL。

2)取10uL剪切预混液(2X)分装到含有10μL RNA的样本中，混匀，短暂离心将反应液收集至管底后立即将PCR管放入PCR仪，按如下设置程序并运行：

步骤	温度	时间
			预冷	4℃	1min
片段化	65℃	1min
			Hold	4℃	∞

3)反应结束后短暂离心置于冰盒上备用。

3.2一链合成

1)配制如下逆转录预混反应液1，振荡混匀，并短暂离心将反应液收集至管底

组分名称	体积(μL)
		逆转录缓冲液	11
逆转录酶	1
		合计	12

2)将混匀后的逆转录预混反应液1取10μL加入到片段化后的PCR管中，混匀，短暂离心将反应液收集至管底后立即将PCR管放入PCR仪，按如下设置程序并运行：(热盖温度：85℃)

温度	时间
		25℃	10min
42℃	15min
		70℃	15min
4℃	∞

3)反应结束后短暂离心置于冰盒上备用。

3.3二链合成

1)配制如下逆转录预混反应液2，振荡混匀，并短暂离心将反应液收集至管底。

2)将混匀后的逆转录预混反应液2取30μL加入到一链合成后的PCR管中，混匀，短暂离心将反应液收集至管底后立即将PCR管放入PCR仪，按如下设置程序并运行：(热盖温度：85℃)

温度	时间
		16℃	∞
16℃	30min
		62℃	10min
4℃	∞

3)反应结束后短暂离心置于冰盒上备用。

3.4接头连接

1)连接反应液按每个测试配制体系如下，振荡混匀，并短暂离心将反应液收集至管底

组分名称	体积(μL)
		连接酶缓冲液	40
DNA连接酶	10
		合计	50

2)取通用接头5μL加入到二链合成后的PCR管中，震荡混匀短暂离心。

3)加入45μL连接反应液，混匀，短暂离心将反应液收集至管底后立即将PCR管放入PCR仪，按如下设置程序并运行：(热盖温度：50℃)

步骤	温度	时间
			接头连接	20℃	15min
Hold	4℃	∞

4)反应结束后短暂离心置于冰盒上备用。

3.5连接产物磁珠纯化

1)推荐使用KAPA HyperPure Beads(Roche)，取70μL纯化磁珠加至连接产物PCR管中，涡旋振荡或使用移液器轻轻吹打至少10次充分混匀，室温静置孵育5min。

2)将PCR管置于磁力架上吸附磁珠，待溶液澄清后，小心吸取上清并弃去。

3)保持PCR管在磁力架上，并加入200μL新鲜配制的80％乙醇，计时30s，小心吸取上清并弃去。

4)再次并加入200μL新鲜配制的80％乙醇，计时30s，小心吸取上清并弃去。

5)保持PCR管始终置于磁力架上，开盖室温干燥磁珠5-10min至无乙醇残留。

6)加入50μL已平衡至室温的10mM Tris-HCl，pH 8.0溶液，涡旋混匀，短暂离心，室温静置孵育2min，以从磁珠上洗脱RNA。

7)加入35μL PEG/NaCl溶液，涡旋振荡或使用移液器轻轻吹打至少10次充分混匀，室温静置孵育5min。

8)孵育结束，短暂离心后将PCR管置于磁力架上吸附磁珠，待溶液澄清后，小心吸取上清并弃去。

9)保持PCR管在磁力架上，并加入200μL新鲜配制的80％乙醇，计时30s，小心吸取上清并弃去；

10)再次并加入200μL新鲜配制的80％乙醇，计时30s，小心吸取上清并弃去。

11)保持PCR管始终置于磁力架上，开盖室温干燥磁珠5-10min至无乙醇残留。

12)加入22μL已平衡至室温的10mM Tris-HCl，pH 8.0溶液，涡旋混匀，短暂离心。

13)室温静置孵育2min，后置于磁力架上，待溶液澄清后，吸取20μL上清至新的PCR管中，切勿碰触磁珠，置于冰盒上备用。

3.6文库扩增

/>

2)反应结束后置于冰盒上备用。

3.7扩增产物磁珠纯化

1)推荐使用KAPA HyperPure Beads，取50μL纯化磁珠加至PCR管中，按照纯化说明进行磁珠纯化。

3.8文库质控

1)使用核酸定量试剂盒dsDNA HS Assay Kit及配套仪器测定样本RNA文库的浓度。

2)取样本RNA文库，使用毛细管电泳试剂High Sensitivity D5000 Reagents及配套仪器进行片段质控，文库平均片段长度在200-600bp之间，无明显小片段和大片段杂峰。

4.文库捕获

采用杂交捕获试剂盒(KAPA HyperCapture Reagent kit及KAPA HyperCaptureBead kit，Roche，货号09075828001和09075798001)对文库进行杂交捕获，捕获探针采用罗氏定制化的JUS70 panel(KAPA HyperChoice，Roche，9052771001)。

4.1文库杂交

1)样本准备

①使用1.5mL离心管，根据样本DNA文库浓度等量混合2-8个文库，一个pool的总量为1μg-4μg。

②使用1.5mL离心管，根据样本RNA文库浓度等量混合2-8个文库，一个pool的总量为1μg-4μg。

③如果pool的体积大于等于45μL，直接进行实验；如果pool的体积小于45μL，则用10mM Tris-HCl，pH 8.0溶液补足至45μL进行实验。

2)杂交反应

①在1.5mL离心管中加入20μL DNA封闭液，加入2倍体积(pool体积+20μL DNA封闭液)已平衡至室温且混匀的磁珠(推荐使用KAPA HyperPure Beads(Roche))，混匀，短暂离心后室温静置孵育10min。

②孵育结束后，将1.5mL离心管置于磁力架上吸附磁珠，待溶液澄清后，小心吸取上清并弃去。

③保持1.5mL离心管在磁力架上，并加入1000μL新鲜配制的80％乙醇，室温静置30s，小心吸取上清并弃去。

④保持1.5mL离心管始终置于磁力架上，开盖室温干燥磁珠至无乙醇残留(确保磁珠不干裂，否则会影响洗脱效率)。

⑤加入13.4μL已平衡至室温的封闭序列，充分涡旋混匀，短暂离心。

4.2探针杂交

1)在离心管种加入用于配制杂交反应液的杂交缓冲液和无核酸酶水；2)振荡混匀，并短暂离心将反应液收集至管底。

3)将混匀后的杂交反应液取43μL加入到杂交反应后的1.5mL离心管中，混匀，短暂离心，室温静置孵育2min。

4)将1.5mL离心管置于磁力架上吸附磁珠，待溶液澄清后，转移56.4μL上清至一个新的PCR管中。

5)向PCR管中加入4μL杂交探针，充分涡旋混匀，短暂离心将反应液收集至管底后立即将PCR管放入PCR仪，按如下设置程序并运行：(热盖温度：105℃)

步骤	温度	时间
			变性	95℃	5min
杂交	55℃	16-20h

4.3洗涤

1)1X洗涤缓冲液按每个pool配制体系如下：

2)将1X洗涤缓冲液1分装到PCR管中，每管分装200μL(每个pool需要2管)，置于55℃PCR仪中提前预热至少15min。

3)将1X洗涤缓冲液2分装到PCR管中，每管分装100μL(每个pool需要1管)，置于55℃PCR仪中提前预热至少15min。

4)充分混匀已平衡至室温的捕获磁珠(推荐使用Dynabeads^TMM-270Streptavidin(Thermo Fisher))。

5)按照一个pool使用50μL捕获磁珠分装到PCR管或1.5mL离心管中，置于磁力架上，待溶液澄清后，小心吸取上清并弃去。

6)保持PCR管或1.5mL离心管在磁力架上，并加入两倍捕获磁珠体积的1X磁珠洗涤缓冲液，充分混匀。

7)将PCR管或1.5mL离心管短暂离心，重新放回磁力架，待溶液澄清后，小心吸取上清并弃去；加入两倍捕获磁珠体积的1X磁珠洗涤缓冲液，充分混匀。

8)将PCR管或1.5mL离心管短暂离心，重新放回磁力架，待溶液澄清后，小心吸取上清并弃去。

9)加入一倍捕获磁珠体积的1X磁珠洗涤缓冲液，充分涡旋混匀，短暂离心，转移50μL至新的PCR管中。

10)将PCR管短暂离心，重新放回磁力架，待溶液澄清后，小心吸取上清并弃去。

11)将杂交结束的样本转移到含捕获磁珠的PCR管中，充分涡旋混匀，短暂离心后立即将PCR管放入PCR仪，55℃孵育15min。

12)保持PCR管在PCR仪上，加入100μL提前预热的1X洗涤缓冲液2，充分混匀。

13)短暂离心后将PCR管置于磁力架上吸附磁珠，待溶液澄清后，小心吸取上清并弃去。

14)保持PCR管在PCR仪上，并加入200μL提前预热的1X洗涤缓冲液1，充分涡旋混匀，短暂离心后立即将PCR管放入PCR仪，55℃孵育5min。

15)孵育结束后，将PCR管从PCR仪中取出，并置于磁力架上吸附磁珠，待溶液澄清后，小心吸取上清并弃去；并加入200μL提前预热的1X洗涤缓冲液1，充分涡旋混匀，短暂离心后立即将PCR管放入PCR仪，55℃孵育5min。

16)孵育结束后，将PCR管从PCR仪中取出，并置于磁力架上吸附磁珠，待溶液澄清后，小心吸取上清并弃去。

17)室温下，向PCR管中加入200μL室温的1X洗涤缓冲液2，充分混匀，短暂离心。

18)室温静置孵育1min后将PCR管置于磁力架上吸附磁珠，待溶液澄清后，小心吸取上清并弃去。

19)室温下，向PCR管中加入200μL室温的1X洗涤缓冲液3，充分混匀，短暂离心后转移至一个新的PCR管中。

20)室温静置孵育1min后将PCR管置于磁力架上吸附磁珠，待溶液澄清后，小心吸取上清并弃去。

21)室温下，向PCR管中加入200μL室温的1X洗涤缓冲液4，充分混匀，短暂离心。

22)室温静置孵育1min后将PCR管置于磁力架上吸附磁珠，待溶液澄清后，小心吸取上清并弃去。

23)将PCR管从磁力架上取下，并加入20μL无核酸酶水到PCR管中，充分涡旋混匀，短暂离心，室温静置孵育2min后进行下一步操作。

4.4捕获文库扩增

1)PCR扩增反应液按每个pool配制体系如下：

组分名称	体积(μL)
		PCR扩增反应液2	25
PCR扩增引物2	5
		合计	30

2)振荡混匀，并短暂离心将反应液收集至管底。

3)将混匀后的PCR扩增反应液取30μL加入到洗涤后的PCR管中，混匀，短暂离心后将反应液收集至管底后立即将PCR管放入PCR仪，按如下设置程序并运行：(热盖温度：105℃)

注*：2-5个文库为一个pool，推荐使用12个循环，6-8个文库为一个pool，推荐使用11个循环。

4)程序结束后立即进行下一步操作。

4.5捕获产物磁珠纯化

1)将扩增后含文库的PCR管涡旋混匀，短暂离心，置于磁力架上吸附至澄清，转移全部上清液到新的PCR管中。

2)推荐使用KAPA HyperPure Beads(Roche)，取70μL纯化磁珠加至PCR管中，按照试剂盒纯化说明进行磁珠纯化。

3)纯化产物用22μL已平衡至室温的10mM Tris-HCl，pH 8.0溶液洗脱，吸取20μL上清至新的PCR管中，切勿碰触磁珠，置于冰盒上备用

4.6捕获文库质控

1)使用核酸定量试剂盒dsDNA HS Assay Kit及配套仪器测定样本捕获文库的浓度。

2)取捕获文库，使用毛细管电泳试剂High Sensitivity D5000 Reagents及配套仪器进行文库片段质控，文库平均片段长度在200-600bp之间，无明显小片段和大片段杂峰。

5.测序

测序文库采用基因测序仪NextSeq 550Dx或Novaseq 6000及配套测序试剂按照厂家说明进行上机测序，产生测序数据。

6.样本数据分析及检测方法

6.1DNA样本数据分析处理过程

采用分析软件对原始下机数据进行分析，分析流程可分为以下步骤：

(1)数据预处理：使用软件分析数据测序质量参数Q30碱基占比。如果Q30占比≥60％则质量控制通过；否则质量控制不通过。然后使用Illumina公司的软件将测序产生的BCL文件转化为Fastq文件。再使用Trimmomatic-0.36软件去掉建库中引入的接头序列和低质量碱基片段。

(2)数据比对：使用bwa Version:0.7.10-r806将片段比对到hg19参考基因组上；

(3)数据质量控制：根据样本Q30碱基占比、序列比对到参考基因组比例，目标区域的平均测序深度等参数，决定样本测序质量是否合格。如Q30≥60％，序列比对到参考基因组比例≥90％，平均测序深度≥300X，则样本测序数据质量控制通过；否则不通过，判定检测失败，需要重新测序。

(4)突变分析：SNV/Indels突变检测使用检测软件Vardict V1.8.2-2和MuTect2 V4.0.12.0联合检测；MSI检测使用软件MSIsensor2；基因融合检测使用软件Manta V1.6.0和Delly2 V1.1.15；CNV检测使用软件cnvkit V0.9.6；使用bcftools v1.7检测样本中的胚系突变。分析参数设置要求序列比对质量≥20，碱基质量≥30，其余皆是默认设置。分析参数使用默认参数设置。

(5)突变注释：使用软件snpEff V5.0C对SNV/Indels，基因融合进行HGVS格式注释。并使用COSMIC数据库(v91)，ClinVar数据库(v20191112)，dbSNP数据库(v145)，1000Genomes数据库(v201508)，ExAC数据库(v0.3)注释。

(6)经过上面处理后质量符合要求的突变，如果SNV/Indels的突变丰度≥0.5％，则判定为阳性；反之为阴性；融合基因的突变丰度≥0.5％，则判定为阳性；反之为阴性；MSI的score≥10％，则判定为MSI-H；反之为MSS(微卫星稳定)；CNV的CN≥3.25，则判为阳性，反之为阴性。

6.2RNA样本数据分析处理过程

(2)数据比对：使用STAR v 2.7.9a比对软件将片段比对到hg19参考基因组上，参数使用默认参数；要求有90％的片段成功比对到人类参考基因组上，样本质量才算合格。

(3)使用arriba v2.1.0检测基因融合。分析参数使用默认参数设置。

(4)阳性判别标准：如果检测到的融合突变可信度(confidence)为high或medium,则为阳性；否则是阴性。

4、226例肝内胆管癌临床样本检测结果

按照上述流程，在226例样本中，共211例检测到SNV/INDEL、CNV、FUSION或MSI-H，总阳性率为93.36％；其中203例检测到了SNV/INDEL(图3)，占比为89.82％；34例样本检测到了CNV(图4)；5例样本检测结果为MSI-H，221例样本检测结果为MSS(图5～6)；25例样本检测到了FGFR2融合(图7)，占比11.06％，与文献报道相似；其中DNA共检测到18个FGFR2融合位点，RNA共检测到21个FGFR2融合位点(图7)，DNA+RNA双水平检测肿瘤组织样本，可以提高FGFR2融合的检出率。

上述实施例仅为本发明的优选实施例，并非对本发明任何形式上和实质上的限制，应当指出，对于本技术领域的普通技术人员，在不脱离本发明的前提下，还将可以做出若干改进和补充，这些改进和补充也应视为本发明的保护范围。

Claims

1.一种生物标志物在制备用于检测胆管癌基因变异的产品中的应用，其特征在于，所述生物标志物包括用于检测胆管癌DNA变异的生物标志物A和用于检测胆管癌RNA变异的生物标志物B；

2.如权利要求1所述的应用，其特征在于，所述DNA变异包括基因融合(Fusion)、单核苷酸变异(SNVs)、插入缺失(Indels)、拷贝数变异(CNV)以及微卫星不稳定(MSI)；所述RNA变异包括基因融合(Fusion)。

3.如权利要求1所述的应用，其特征在于，所述应用包括以生物标志物的检测试剂制备用于检测胆管癌基因变异的试剂盒。

4.如权利要求3所述的应用，其特征在于，所述试剂盒中至少包括用于检测生物标志物的探针。

5.如权利要求1所述的应用，其特征在于，所述应用包括以生物标志物作为检测指标制备用于检测胆管癌基因变异的检测系统或检测设备。

6.一种用于检测胆管癌基因变异的试剂盒，其特征在于，所述试剂盒中至少包括用于检测生物标志物的探针。

7.如权利要求6所述的试剂盒，其特征在于，所述试剂盒中还包括用于提取样本中的DNA和/或RNA的试剂，所述样本为胆管癌肿瘤组织。

8.一种用于检测胆管癌基因变异的系统或设备，其特征在于，所述系统或设备包括：

数据检测分析模块，用于测序数据的检测分析；

以及检测结果获取模块；

步骤2：数据处理，所述数据处理具体包括：

步骤3：数据分析，SNV/Indels突变检测使用检测软件Vardict V1.8.2-2和MuTect2 V4.0.12.0联合检测；MSI检测使用软件MSIsensor2；基因融合检测使用软件Manta V1.6.0和Delly2 V1.1.15；CNV检测使用软件cnvkit V0.9.6。分析参数设置要求序列比对质量≥20，碱基质量≥30，其余皆是默认设置；

9.一种计算机设备，其特征在于，所述计算机设备包括存储器和处理器，所述存储器存储有程序，所述处理器执行所述程序时实现权利要求8中所述的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质包括存储的计算机程序；

其中，在所述计算机程序运行时控制所述计算机可读存储介质实现权利要求8中所述的步骤。