肺腺癌生物标志物及相关应用
技术领域
本发明属于疾病诊断领域,涉及肺腺癌生物标志物及相关应用,具体涉及S100P、COL17A1、CXCL14或GLB1L3在肺腺癌诊断中的应用。
背景技术
肺癌(Lung cancer,LC)是人类最常见的恶性肿瘤之一。2011年,在中国,肺癌患者在所有恶性肿瘤中发病率及死亡率均为最高,发病率约为48.42/100,000,死亡率约为39.27/100,000(McGuire S,World Cancer Report 2014.Geneva,Switzerland:WorldHealth Organization,International Agency for researchon cancer,WHO press,2015[J].2016)。肺癌分为小细胞肺癌(Small cell lung cancer,SCLC)和非小细胞肺癌(Non-small cell lung cancer,NSCLC)两类,非小细胞肺癌占肺癌总数超过85%,NSCLC主要包括:肺腺癌(Lung adenocarcinoma,LUAD)、肺鳞癌(Lung squamous cell carcinoma,LUSC)、腺鳞癌,大细胞癌和肉瘤样癌,其中肺腺癌又占非小细胞肺癌的60%左右。肺腺癌诊断主要依靠症状、体征、实验室检查、影像学检查及病理活检,其中,病理活检为诊断的金标准,主要包括支气管镜检查、针吸细胞学检查以及其他活组织检查等。
肺腺癌早期无明显特殊症状,大多数仍然是常见的呼吸系统症状,如咳嗽,咳痰,胸痛,胸闷,咯血。此外,少数病人亦可出现不同的肺外表现,比如声音嘶哑、肩背疼痛以及骨关节的症状等。临床上,肺腺癌患者较容易发生胸膜转移以及恶性胸腔积液。
肺腺癌可转移到胸外,引起一系列临床症状。研究证实(吕进财等,非小细胞肺癌脑转移放疗研究进展[J].中华放射肿瘤学杂志,2019),在NSCLC患者中,初次诊断脑转移的病人比例可达22%,而在随访治疗中,约50%的患者最终发展为脑转移。有些病人会因为头痛,恶心,呕吐等颅压升高,或精神状态异常而至医院就诊,这可能是因为肿瘤已经转移至颅内,从而引起的一系列神经系统症状。骨转移是肺癌最常见的转移部位之一,一部分肺癌病人可能首先因为骨痛而就诊,在肺癌的各病理组织类型中,骨转移发生率最高的即为肺腺癌,常见于脊柱、肩胛骨、胸骨及肋骨等,可能是由于肺腺癌最常出现在肺边缘的粘液腺及杯状细胞,通过血液转移多见。极少数病人会因发现腹部肿块就诊是因肿瘤转移至腹部。
虽然肺癌的临床诊疗技术一直处于更新和发展中,但由于其起病隐匿、进展迅速的特点,发病率和死亡率仍在不断上升。因此,我们迫切需要探索肺癌发生、发展的分子机制,以找到具有高度特异性以及预测性的诊断靶点。
发明内容
为了弥补现有技术的不足,本发明的目的在于提供与肺腺癌发生发展相关的基因标志物,同时提供一种诊断肺腺癌的产品,实现对肺腺癌的评估、诊断或监测,提高患者的生存率和生存质量。
为了实现上述目的,本发明采用如下技术方案:
本发明在研究中发现,与对照组相比,肺腺癌患者的S100P、COL17A1、CXCL14或GLB1L3表达水平显著上调,ROC曲线下面积AUC分别为0.789428、0.839701、0.814708、0.806952,当进行联合诊断肺腺癌时,AUC均升高。因此S100P、COL17A1、CXCL14或GLB1L3中的至少两种的联合可用于肺腺癌的早期诊断,为肺腺癌致病机理、调控通路研究提供新思路和新角度。
本发明提供了以下基因组合作为诊断肺腺癌的生物标志物的应用:S100P、COL17A1、CXCL14或GLB1L3中的至少两种。基因组合包括S100P+COL17A1、S100P+CXCL14、S100P+GLB1L3、COL17A1+CXCL14、COL17A1+GLB1L3、CXCL14+GLB1L3、S100P+COL17A1+CXCL14、S100P+COL17A1+GLB1L3、S100P+CXCL14+GLB1L3、COL17A1+CXCL14+GLB1L3或S100P+COL17A1+CXCL14+GLB1L3,优选的,基因组合为S100P+COL17A1、S100P+CXCL14、S100P+GLB1L3、COL17A1+CXCL14、COL17A1+GLB1L3、S100P+COL17A1+CXCL14、S100P+COL17A1+GLB1L3、S100P+CXCL14+GLB1L3、COL17A1+CXCL14+GLB1L3或S100P+COL17A1+CXCL14+GLB1L3。
本发明提供了检测样品中基因水平的试剂在制备用于诊断肺腺癌的产品中的应用,所述基因包括S100P、COL17A1、CXCL14或GLB1L3中的至少两种。
进一步,所述试剂包括能够定量S100P、COL17A1、CXCL14或GLB1L3基因mRNA的试剂,和/或能够定量S100P、COL17A1、CXCL14或GLB1L3蛋白的试剂。
进一步,所述产品包括芯片、试纸或试剂盒。
所述芯片包括基因芯片、蛋白质芯片;所述基因芯片包括固相载体以及固定在固相载体的寡核苷酸探针,所述寡核苷酸探针包括用于检测S100P、COL17A1、CXCL14或GLB1L3基因转录水平的针对S100P、COL17A1、CXCL14或GLB1L3基因的寡核苷酸探针;所述蛋白质芯片包括固相载体以及固定在固相载体的S100P、COL17A1、CXCL14或GLB1L3蛋白的特异性抗体。
所述试纸包括检测S100P、COL17A1、CXCL14或GLB1L3表达量的试剂,所述试剂包括与S100P、COL17A1、CXCL14或GLB1L3序列结合的核酸,所述核酸包括能够检测S100P、COL17A1、CXCL14或GLB1L3表达量的探针。
所述试剂盒包括基因检测试剂盒和蛋白免疫检测试剂盒;所述基因检测试剂盒包括用于检测S100P、COL17A1、CXCL14或GLB1L3基因转录水平的试剂;所述蛋白免疫检测试剂盒包括S100P、COL17A1、CXCL14或GLB1L3蛋白的特异性抗体。
作为一种优选的实施方案,所述试剂盒也包括QRT-PCR方法的必要试剂,例如逆转录酶、逆转录酶引物、特异性扩增基因的引物对、热稳定性DNA聚合酶(例如Taq聚合酶)和合适的检测试剂,例如(但不限于)蝎型探针、用于荧光水解探针测定法的探针、分子信标探针、双链DNA的特异性单染料引物或荧光染料(例如溴化乙锭)。热稳定性DNA聚合酶通常可在商业上从多个制造商获得。试剂盒中的额外材料可以包括:合适的反应试管或管形瓶、屏蔽组分,通常是蜡珠,任选包括镁;逆转录酶和PCR阶段的反应混合物(通常为10X),包括必要的缓冲液和试剂,例如dNTP;不含核酸酶或不含RNA酶的水;RNA酶抑制剂;可用于QRT-PCR的逆转录酶和/或PCR阶段的对照核酸和/或任何额外的缓冲液、化合物、辅因子、离子组分、蛋白质和酶、聚合物等。可任选地,试剂盒包括核酸提取试剂和材料。说明书也优选包括在试剂盒内。
进一步,所述试剂盒包括特异性扩增基因的引物对,所述基因选自S100P、COL17A1、CXCL14或GLB1L3中的至少两种。
优选的,所述试剂盒还包括SYBR Green聚合酶链式反应体系;所述SYBR Green聚合酶链式反应体系包括PCR缓冲液、dNTPs、SYBR Green荧光染料。
本发明提供了一种用于诊断肺腺癌的产品,所述产品包括定量S100P、COL17A1、CXCL14或GLB1L3中至少两种基因表达水平的试剂。
进一步,所述试剂包括能够定量S100P、COL17A1、CXCL14或GLB1L3中至少两种基因mRNA的试剂,和/或能够定量S100P、COL17A1、CXCL14或GLB1L3中至少两种基因编码的蛋白的试剂。
定量上述基因mRNA的试剂包括:如PCR、Southern杂交、Northern杂交、点杂交、荧光原位杂交(FISH)、DNA微阵列、ASO法、高通量测序平台等定量地、或半定量地检测基因mRNA表达水平的方法中使用的任何试剂。
优选的,所述定量检测S100P、COL17A1、CXCL14或GLB1L3中的至少两种基因mRNA的试剂包括:特异性识别S100P、COL17A1、CXCL14或GLB1L3的探针;或特异性扩增S100P、COL17A1、CXCL14或GLB1L3的引物;所述定量检测S100P、COL17A1、CXCL14或GLB1L3中的至少两种蛋白的试剂包括:特异性结合S100P、COL17A1、CXCL14或GLB1L3的抗体。
进一步,所述引物序列如SEQ ID NO.1-8所示。其中特异性扩增S100P的引物序列如SEQ ID NO.1-2所示,特异性扩增COL17A1的引物序列如SEQ ID NO.3-4所示,特异性扩增CXCL14的引物序列如SEQ ID NO.5-6所示,特异性扩增GLB1L3的引物序列如SEQ ID NO.7-8所示。
上面所述的引物可以通过化学合成来制备,使用本领域技术人员知道的方法参考已知信息来适当地设计,并通过化学合成来制备。
前面所述的探针可以通过化学合成来制备,通过使用本领域技术人员知道的方法参考已知信息来恰当设计,并通过化学合成来制备,或者可以通过从生物材料制备含有期望核酸序列的基因,并使用设计用于扩增期望核酸序列的引物扩增它来制备。
定量S100P、COL17A1、CXCL14或GLB1L3蛋白的试剂包括如ELISA、放射免疫测定法、免疫组织化学法、Western印迹等能够检测蛋白表达水平的方法中使用的任何试剂。
本发明可用于定量S100P、COL17A1、CXCL14或GLB1L3蛋白的试剂包括针对S100P、COL17A1、CXCL14或GLB1L3蛋白的抗体,所述抗体可以是单克隆抗体、多克隆抗体、多特异性抗体(例如双特异性抗体)。
本发明还提供了一种诊断肺腺癌的方法,所述方法包括如下步骤:
(1)获取受试者含有S100P、COL17A1、CXCL14或GLB1L3基因表达产物的样本;
(2)检测样本中S100P、COL17A1、CXCL14或GLB1L3基因或蛋白的表达水平;
(3)将测得的S100P、COL17A1、CXCL14或GLB1L3基因或蛋白的表达水平与受试者患病与否关联起来;
(4)与正常肺组织相比,如果S100P、COL17A1、CXCL14或GLB1L3基因或蛋白的表达水平升高,则该受试者被诊断为肺腺癌,或判断该受试者患有肺腺癌的风险高。
本发明的基因的联合诊断可以用于评估受试者是否患有肺腺癌;评估肺腺癌细胞的存在;监测受试者肺腺癌的进展;筛选抑制受试者肺腺癌的组合物以及预防具有发展肺腺癌危险的受试者的肺腺癌发病。
在本发明中,
S100P基因(Chromosome 4,NC_000004.12(6693878..6697170))可在GeneBank数据库中查询到;
COL17A1基因(Chromosome 10,NC_000010.11(104031286..104085880,complement))可在GeneBank数据库中查询到;
CXCL14基因(Chromosome 5,NC_000005.10(135570679..135579279,complement))可在GeneBank数据库中查询到;
GLB1L3基因(Chromosome 11,NC_000011.10(134272716..134325307))可在GeneBank数据库中查询到。
本发明的优点和有益效果:
本发明提供了诊断肺腺癌的生物标志物及组合,能够为肺腺癌发生发展机制研究、肺腺癌预测、预后及靶向治疗等研究提供积极帮助。
附图说明
图1是利用QPCR检测五种基因在肺腺癌组织与癌旁组织中的表达情况图,其中图A为S100P,图B为COL17A1,图C为CXCL14,图D为GLB1L3,图E为ITLN1。
具体实施方式
为了更清楚地理解本发明,现参照下列实施例进一步描述本发明。实施例仅用于解释而不以任何方式限制本发明。实施例中未注明具体条件的实验方法为所属领域熟知的常规方法和常规条件,或按照制造商所建议的条件。
实施例1 QPCR验证相关差异表达基因
1、样本收集
收集肺腺癌组织和癌旁组织各59例,所有样本离体后立即放入装有RNA保护液的冻存管中,并在30分钟内置于-80℃冰箱中冷冻保存,整个操作及保存过程遵循无酶原则。
2、提取组织RNA
利用TRIzol RNA提取方法提取肺腺癌组织和癌旁组织中的总RNA。
(1)用液氮预冷研钵,组织样品放入加有液氮的研钵中,在液氮下把组织样品充分研磨成粉末;
(2)把样品粉末转入到装有TRIzol裂解液的2.0ml EP管中,(每ml裂解液可加50mg组织样品)剧烈震荡,充分混匀,平放室温静置5-10min;
(3)10000rpm,4℃离心5min;
(4)吸取上清液至新的2.0ml EP管中,每毫升裂解液加入200μl氯仿/异戊醇,剧烈颠倒混匀;
(5)10000rpm,4℃离心10min;
(6)吸取上清液至新的1.5ml离心管,注意不要吸到中间蛋白层,加入等上清液体积的异丙醇,轻轻颠倒混匀;
(7)放入-20℃冰箱沉淀1h;
(8)13600rpm,4℃离心20min;
(9)吸弃上清,加入1ml 75%乙醇,用移液器吹洗沉淀;
(10)10000rpm,4℃离心3min,吸弃上清,短暂离心,吸去残留液体,晾干3-5min;
(11)用30-100μl DEPC水或者RNase Free水溶解沉淀;
(12)置于-80℃冰箱保存。
3、总RNA逆转录
利用TIANGEN公司的逆转录试剂盒(货号KR106)进行RNA的逆转录(方法按照试剂盒推荐标准流程操作)
(1)去除基因组DNA
将1.0μg的总RNA模板与2.0μl的5×gDNA buffer和RNase Free水混合,终体积为10μl,42℃孵育3min。
(2)逆转录PCR反应体系如表1所记载:
表1逆转录PCR反应体系
(3)逆转录PCR反应条件如表2所记载:
表2逆转录PCR反应条件
4、QPCR反应
(1)引物设计
根据基因序列,设计引物,引物序列如表3所记载:
表3引物序列
(2)配制20μl PCR反应体系:
利用TIANGEN公司的SuperReal PreMix Plus试剂盒(货号:FP205)进行QPCR,体系如表4所记载:
表4QPCR反应体系
试剂 |
体积 |
2×SuperReal PreMix Plus |
10μl |
上游引物 |
0.6μl |
下游引物 |
0.6μl |
cDNA模板 |
2μl |
50×ROX Reference Dye |
2μl |
ddH<sub>2</sub>O |
4.8μl |
(3)PCR反应条件:95℃15min,(95℃10s,55℃30s,72℃32s)进行40个循环,之后95℃15s,60℃60s,95℃15s。以SYBR Green作为荧光标志物,在ABI 7300型荧光定量PCR仪上进行PCR反应,通过熔解曲线分析和电泳确定目的条带,2-ΔΔCT法进行相对定量。
5、结果
如图1所示,与癌旁组织相比,肺腺癌组织中的S100P、COL17A1、CXCL14和GLB1L3的表达水平显著上调,ITLN1的表达水平显著下调,差异具有统计学意义(P<0.01)。
实施例2候选基因ROC曲线分析
1、ROC曲线分析
使用R语言的pROC包分析S100P、COL17A1、CXCL14、GLB1L或ITLN1的受试者工作特征,计算二项精确置信空间,绘制ROC曲线,计算曲线下面积。
2、结果
结果如表5所示,S100P、COL17A1、CXCL14、GLB1L和ITLN1的AUC值高于0.7,其中ITLN1的AUC值最高,当将上述基因进行组合时,S100P、COL17A1、CXCL14、GLB1L中的任意组合,AUC值均显著增加,表明S100P、COL17A1、CXCL14、GLB1L联合诊断比单独应用具有更高的准确性,提示可将S100P、COL17A1、CXCL14、GLB1L的组合应用于肺腺癌的联合诊断。
表5候选基因及其联合的AUC值
基因 |
AUC |
S100P |
0.789428 |
COL17A1 |
0.839701 |
CXCL14 |
0.814708 |
GLB1L3 |
0.806952 |
ITLN1 |
0.901034 |
S100P+COL17A1 |
0.906923 |
S100P+CXCL14 |
0.923872 |
S100P+GLB1L3 |
0.909652 |
S100P+ITLN1 |
0.67179 |
COL17A1+CXCL14 |
0.900029 |
COL17A1+GLB1L3 |
0.906349 |
COL17A1+ITLN1 |
0.641051 |
CXCL14+GLB1L3 |
0.894571 |
CXCL14+ITLN1 |
0.671072 |
GLB1L3+ITLN1 |
0.506751 |
S100P+COL17A1+CXCL14 |
0.956334 |
S100P+COL17A1+GLB1L3 |
0.948578 |
S100P+COL17A1+ITLN1 |
0.799052 |
S100P+CXCL14+GLB1L3 |
0.960069 |
S100P+CXCL14+ITLN1 |
0.839989 |
S100P+GLB1L3+ITLN1 |
0.795892 |
COL17A1+CXCL14+GLB1L3 |
0.931916 |
COL17A1+CXCL14+ITLN1 |
0.786412 |
COL17A1+GLB1L3+ITLN1 |
0.736139 |
CXCL14+GLB1L3+ITLN1 |
0.764148 |
S100P+COL17A1+CXCL14+GLB1L3 |
0.974145 |
S100P+COL17A1+CXCL14+ITLN1 |
0.88308 |
S100P+COL17A1+GLB1L3+ITLN1 |
0.849612 |
S100P+CXCL14+GLB1L3+ITLN1 |
0.881356 |
COL17A1+CXCL14+GLB1L3+ITLN1 |
0.825338 |
S100P+COL17A1+CXCL14+GLB1L3+ITLN1 |
0.904912 |
上述实施例应该被作为说明本发明而不是限制由所附权利要求限定的本发明。正如将要理解的是,大量的变化和组合可用于上面列出的特征而不背离本发明。这样的变化不看作脱离本发明的范围,并且所有这些变型都将被包括在所述权利要求的范围之内。
序列表
<110> 北京泱深生物信息技术有限公司
<120> 肺腺癌生物标志物及相关应用
<160> 12
<170> SIPOSequenceListing 1.0
<210> 1
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
ttcagtgagt tcatagtgtt c 21
<210> 2
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
atttgagtcc tgccttct 18
<210> 3
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
aacgagatgg aactgaagtc 20
<210> 4
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
ttggtggtaa ggatgtaagt c 21
<210> 5
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
gacgtgaaga agctggaa 18
<210> 6
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
gctcttggtg gtgatgata 19
<210> 7
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
agtggagaat gagtatgg 18
<210> 8
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
atcagaggtc aagagaag 18
<210> 9
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
aggctaatac ttacttca 18
<210> 10
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
tagataacac cattctca 18
<210> 11
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
tggacttcga gcaagagatg 20
<210> 12
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
gaaggaaggc tggaagagtg 20