CN117070628A - 胰腺癌预后预测的产品、模型、系统、装置及其应用 - Google Patents
胰腺癌预后预测的产品、模型、系统、装置及其应用 Download PDFInfo
- Publication number
- CN117070628A CN117070628A CN202311051929.2A CN202311051929A CN117070628A CN 117070628 A CN117070628 A CN 117070628A CN 202311051929 A CN202311051929 A CN 202311051929A CN 117070628 A CN117070628 A CN 117070628A
- Authority
- CN
- China
- Prior art keywords
- pancreatic cancer
- lncrna
- seq
- prognosis prediction
- cancer prognosis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 206010061902 Pancreatic neoplasm Diseases 0.000 title claims abstract description 94
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 title claims abstract description 94
- 201000002528 pancreatic cancer Diseases 0.000 title claims abstract description 94
- 208000008443 pancreatic carcinoma Diseases 0.000 title claims abstract description 94
- 238000004393 prognosis Methods 0.000 title claims abstract description 57
- 239000000523 sample Substances 0.000 claims abstract description 14
- 108090000623 proteins and genes Proteins 0.000 claims description 17
- 238000003745 diagnosis Methods 0.000 claims description 12
- 239000000126 substance Substances 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 7
- 102000004169 proteins and genes Human genes 0.000 claims description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 4
- 102000014914 Carrier Proteins Human genes 0.000 claims description 4
- 108091008324 binding proteins Proteins 0.000 claims description 4
- 239000003153 chemical reaction reagent Substances 0.000 claims description 2
- 239000012528 membrane Substances 0.000 claims description 2
- 108020004707 nucleic acids Proteins 0.000 claims description 2
- 102000039446 nucleic acids Human genes 0.000 claims description 2
- 150000007523 nucleic acids Chemical class 0.000 claims description 2
- 239000003814 drug Substances 0.000 abstract description 2
- 108020005198 Long Noncoding RNA Proteins 0.000 description 66
- 230000004083 survival effect Effects 0.000 description 38
- 238000012549 training Methods 0.000 description 20
- 230000036962 time dependent Effects 0.000 description 19
- 230000001575 pathological effect Effects 0.000 description 13
- 230000007170 pathology Effects 0.000 description 13
- 238000000611 regression analysis Methods 0.000 description 13
- 238000013211 curve analysis Methods 0.000 description 12
- 238000002512 chemotherapy Methods 0.000 description 10
- 238000010200 validation analysis Methods 0.000 description 9
- 238000012795 verification Methods 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 8
- 108020004999 messenger RNA Proteins 0.000 description 7
- 238000000034 method Methods 0.000 description 7
- 238000012937 correction Methods 0.000 description 6
- 206010028980 Neoplasm Diseases 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000001325 log-rank test Methods 0.000 description 4
- 230000037361 pathway Effects 0.000 description 4
- 238000007619 statistical method Methods 0.000 description 4
- 238000013103 analytical ultracentrifugation Methods 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000004069 differentiation Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000010201 enrichment analysis Methods 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 238000001959 radiotherapy Methods 0.000 description 3
- 210000002966 serum Anatomy 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 238000000546 chi-square test Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012314 multivariate regression analysis Methods 0.000 description 2
- 239000013610 patient sample Substances 0.000 description 2
- 238000010837 poor prognosis Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 238000012315 univariate regression analysis Methods 0.000 description 2
- 230000003844 B-cell-activation Effects 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 238000010220 Pearson correlation analysis Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 230000036765 blood level Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000000391 smoking effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000013517 stratification Methods 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/178—Oligonucleotides characterized by their use miRNA, siRNA or ncRNA
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- General Health & Medical Sciences (AREA)
- Hospice & Palliative Care (AREA)
- Oncology (AREA)
- Plant Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明属于生物医药领域,具体涉及胰腺癌预后预测的产品、模型、系统、装置及其应用。本发明提供了一种胰腺癌预后预测的产品,包含以下中的至少一种:5‑lncRNA、5‑lncRNA的特异性探针、5‑lncRNA的特异性引物。本发明提高了胰腺癌预后的预测准确性,并且可作为胰腺癌预后更可靠的预测指标。
Description
技术领域
本发明属于生物医药领域,具体涉及胰腺癌预后预测的产品、模型、系统、装置及其应用。
背景技术
胰腺癌是一种异质性很高的恶性肿瘤,发病率高,死亡率高。尽管近年来在治疗上发现了一些令人欣喜的进步,但胰腺癌的预后仍然很差。
预后预测对提高胰腺癌患者的生存时间至关重要,可以根据患者的预后差异针对性地制定个体化治疗方案。TNM分期系统和CA19-9是目前研究比较多的。
AJCC建立的TNM分期系统是预测胰腺癌预后最著名和最受大家认可的工具。然而,一些验证性研究表明,最新的第8版分期系统对胰腺癌的预后预测很有价值,但还有很多方面亟待改善,比如新的N分类(pN1与pN2)不能细分预后,III期要分为IIIA期和IIIB期。此外,TNM分期系统不涉及分子生物学,有先天不足。
CA19-9在此前被大范围研究。术前,CA19-9血清水平正常(<37U/ml)或较低(<100U/ml)与早期胰腺癌相关,并能够独立预测总生存期的改善,而CA19-9血清水平升高(>100U/ml)与不良预后相关。术后,CA19-9血清水平恢复正常或呈下降趋势与生存时间延长有关,呈升高或者没有降低则反映肿瘤残留或者隐匿性转移,预示不良预后。即使在化疗中也有预后预测作用,在化疗开始的第1个6至8周内,CA19-9血清水平降至≤基线水平的20–50%可以预测生存时间延长,并且是总体生存时间的独立预测指标。
然而,CA19-9也有其局限性。CA19-9只在80-85%的胰腺癌患者中升高,其它疾病也可能会升高,这将影响对预后的判断。另外,CA19-9与Lewis血型抗原有关,只有属于Le(α-β+)或Le(α+β-)血型的患者才会表达CA19-9,而5-10%的人血型为Le(α-β-),体内缺乏CA19-9。
综上所述,目前在胰腺癌的预后预测方面仍有诸多不足和局限,有必要寻找更多方法来提高预后预测的准确性,尤其在生物标记物方面。
发明内容
为克服现有技术的不足,本发明的目的在于提供标志物5-lncRNA,能够实现胰腺癌更准确的预后预测。
为实现上述目的,本发明提供如下技术方案:
本发明第一方面提供了一种胰腺癌预后预测的产品,所述产品中包含以下中的至少一种:
5-lncRNA、5-lncRNA的特异性探针、5-lncRNA的特异性引物、5-lncRNA的结合蛋白;
所述的5-lncRNA为5个lncRNA,分别为SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5所示的RNA序列。
进一步地,产品包括以下中的至少一种:
能够检测5-lncRNA表达及表达水平的试剂、基因芯片、蛋白质芯片、试剂盒和核酸膜条。
本发明第二方面提供了一种胰腺癌预后预测模型,利用以下中的至少一种对胰腺癌预后结果进行预测;
5-lncRNA、5-lncRNA的特异性探针、5-lncRNA的特异性引物、5-lncRNA的结合蛋白;
所述的5-lncRNA为5个lncRNA,分别为SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5所示的RNA序列。
进一步地,包括:
输入单元:用于获取样本中5-lncRNA的表达水平;
输出单元:根据5-lncRNA的表达情况,获得胰腺癌预后预测结果。
本发明第三方面提供了一种胰腺癌预后预测系统,含有前述的胰腺癌预后预测模型。
本发明第四方面提供了一种胰腺癌预后预测装置,载有前述的胰腺癌预后预测系统。
本发明第五方面提供了如下任一项应用:
(1)5-lncRNA及其相关物质在制备胰腺癌辅助诊断或胰腺癌预后预测产品中的应用;
(2)5-lncRNA及其相关物质在制备胰腺癌辅助诊断或胰腺癌预后预测工具中的应用;
(3)5-lncRNA及其相关物质在构建胰腺癌诊辅助诊断或胰腺癌预后预测的系统/装置中的应用;
(4)5-lncRNA及其相关物质在构建胰腺癌诊辅助诊断或胰腺癌预后预测的计算机可读存储介质中的应用。
本发明的有益效果:
1.本发明提供的标志物5-lncRNA与OS(总体生存率,Overall survival rate)高度相关;
2.本发明基于标志物5-lncRNA的应用提高了胰腺癌预后的预测准确性,可以用作更可靠的胰腺癌预后预测指标。
附图说明
图1是92个DElncRNA表达谱的火山图。
图2是训练数据集中进行LASSOCox回归分析的结果图,其中,(A)LASSO对OS的参数选择调整图;(B)5个与OS相关的lncRNA的LASSOCox回归系数分布图。
图3是训练数据集中患者的分布以及生存分析和时间依赖性ROC曲线分析结果图,其中,(A)患者的生存状态图;(B)风险评分的累积函数分布图;(C)lncRNAs模型在胰腺癌患者中3年和5年生存率的时间依赖性ROC曲线;(D)胰腺癌患者的总体生存曲线。
图4是训练数据集中高危组和低危组中5个lncRNA表达谱的热图。
图5是验证数据集中患者的分布以及生存分析和时间依赖性ROC曲线分析结果图,其中,(A)患者的生存状态;(B)风险评分的累积函数分布图;(C)lncRNAs模型在胰腺癌患者中3年和5年生存率的时间依赖性ROC曲线;(D)胰腺癌患者的总体生存曲线。
图6是验证数据集中高危组和低危组中5个lncRNA表达谱的热图。
图7是完整数据集中患者的分布以及生存分析和时间依赖性ROC曲线分析结果,其中,(A)患者的生存状态;(B)风险评分的累积函数分布图;(C)lncRNAs模型在胰腺癌患者中3年和5年生存率的时间依赖性ROC曲线;(D)胰腺癌患者的总体生存曲线。
图8是完整数据集中高危组和低危组中5个lncRNA表达谱的热图。
图9(A)病理分期单独使用时胰腺癌患者3年和5年生存率的时间依赖性ROC曲线;(B)lncRNAs模型、病理分期单独使用和lncRNAs模型与病理分期联合时胰腺癌患者3年生存率的时间依赖性ROC曲线;(C)lncRNAs模型、病理分期单独使用和lncRNAs模型与病理分期联合时胰腺癌患者5年生存率的时间依赖性ROC曲线。
图10是lncRNAs模型、化疗史和病理分期联合构建的列线图。
图11是列线图在胰腺癌中的预后预测价值的验证结果图,其中(A)胰腺癌患者中3年和5年生存率的时间依赖性ROC曲线;(B)胰腺癌患者3年生存率的校正曲线;(C)胰腺癌患者5年生存率的校正曲线。
图12是与5个lncRNA共表达的mRNA的KEGG和GO富集通路。
图13是与5个lncRNA共表达的mRNA的KEGG和GO富集通路。
具体实施方式
为了更好地理解本发明,下面结合具体实施例对本发明作进一步的描述,其中实施例中使用的术语是为了描述特定的具体实施方案,不构成对本发明保护范围的限制。
一、实施例的材料和方法
1.软件使用
表1
软件 | 版本 | 中文名称 |
Perl | v5.30.1 | 基因的整理和注释 |
R studio | v3.6.0 | lncRNA的筛选、模型的构建和数据的统计分析 |
SPSS | IBM SPSS Statistics 21 | 数据的统计分析 |
Cytoscape | v3.7.2 | 功能富集分析和绘图 |
2.数据获取
本发明从TCGA数据库(https://portal.gdc.cancer.gov/)下载了182个胰腺癌组织及其邻近正常组织的表达情况和临床信息。因为TCGA的数据属于社区公共资源项目,本发明没有获得额外的伦理批准,但本发明的研究充分遵循了TCGA的发布指南和数据访问政策。
3.数据的处理
本发明用perl对182个组织中的基因进行了整理和注释,然后用R语言的edgeR软件包对组织中的表达谱进行了处理,对比Ensembl ID后,对基因进行分离以筛选出lncRNA。平均表达值大于1的lncRNA将留下来进行下一步的分析。然后,本发明在胰腺癌组织及其邻近正常组织筛选|logFC|>1和p<0.05的差异表达lncRNA,并对其进行单变量回归分析,筛选出与OS相关的lncRNA。
4.基于lncRNA预后模型的构建
删除临床信息不完整、生存时间为0、重复的样本数据后,本发明按1:1的比例,将包含所有本发明需要的数据的样本随机分为一个训练数据集和一个内部验证数据集。然后,本发明在训练数据集中应用LASSOCox回归分析进一步筛选与OS相关的lncRNA,以防止过度拟合。接下来,本发明基于lncRNAs回归系数和表达量的风险评分计算公式,计算每一个患者样本的风险评分,以此来构建胰腺癌的预后预测模型。最后,根据模型中位风险评分的临界值,将患者分为高危组和低危组。
5.lncRNAs模型预后价值的验证和比较
为了进一步验证模型的预后价值,本发明在验证数据集和完整数据集中使用训练数据集筛选的lncRNAs建立预测模型,同样基于模型中位风险评分的临界值,将验证数据集和完整数据集的样本分为高风险组和低风险组。然后,本发明将完整数据集中模型的预后预测能力与之前发表的lncRNAs模型和TNM分期系统进行比较,并探索本发明的模型与TNM分期联合使用时的预后预测能力。
6.模型与临床病理特征相结合列线图的构建
为了进一步探索lncRNAs模型在胰腺癌中的预后预测能力,本发明基于单变量和多变量Cox回归分析筛选的胰腺癌独立预后影响因子,构建了一个模型与临床病理特征相结合的列线图来预测胰腺癌的预后。为了验证列线图的预后预测价值,本发明进行了一致性试验、校正曲线分析和时间依赖性ROC曲线分析。
7.预后lncRNAs的功能预测
本发明从TCGA下载胰腺癌的蛋白编码基因,基于预后lncRNAs和蛋白编码基因之间的表达水平,本发明使用了Pearson相关分析,以筛选出与预后lncRNAs共表达的蛋白编码基因。筛选标准为相关系数绝对值>0.4、p<0.001。筛选出来的蛋白编码基因使用Cytoscape的ClueGO和CluePedia分别进行KEGG、GO功能富集分析和绘图,寻找预后lncRNAs作用的通路。
8.数据的统计分析
单变量Cox回归分析筛选出与OS相关的lncRNA,LASSOCox回归分析进一步选择并以此建立基于lncRNAs的预后预测模型,其中lncRNAs的回归系数是多变量Cox回归分析得出的。Kaplan-Meier和对数秩检验在高风险组和低风险组之间探索了模型对样本风险的分层是否具有统计学意义。使用时间依赖性ROC曲线分析了模型对预后预测的特异度和灵敏度,并以时间依赖性的ROC曲线与坐标横轴的面积(AUC)作为模型的预测精度。在验证和比较研究中,本发明同样使用了Kaplan–Meier和对数秩检验以及时间依赖性ROC曲线分析。为了验证模型的独立性,本发明使用了单变量和多变量回归分析,并在列线图预后预测能力的验证中使用了一致性试验、校正曲线分析和时间依赖性ROC曲线分析。在筛选与预后lncRNAs共表达的蛋白编码基因时,本发明使用了Pearson相关分析。以上的统计分析全部是在R studio上完成的。为了探讨训练数据集和验证数据集中的临床病理特征构成比差异,以及模型的风险评分与临床病理特征的关系,本发明在SPSS软件上进行了卡方检验。
二、实施例的结果
1.与预后相关lncRNAs的筛选
Perl软件整理数据过程中,发现182个组织里,胰腺癌组织有178个(n=178),癌旁的正常组织有4个(n=4)。使用edgeR对比Ensembl ID后,共识别了14447个lncRNA,并在其中筛选出8090个平均表达值大于1的lncRNA,经过进一步操作,本发明得到了92个|logFC|>1和p<0.05的差异表达lncRNA,其中在胰腺癌中表达上调的有3个,表达下调的有89个,它们在胰腺癌组织中的表达情况如图1。随后,单变量Cox回归分析共筛选出5个与OS相关的lncRNA(p<0.05)。
2.基于lncRNAs预后模型的构建和验证
删除临床信息不完整、生存时间为0、重复的样本数据后,剩余174个胰腺癌组织样本,本发明按1:1的比例将其随机分为训练数据集(n=87)和验证数据集(n=87)(表2)。在训练数据集中,本发明使用LASSOCox回归分析进一步确定了这5个lncRNA和OS都有很强的相关性(图2),因此这5个lncRNA都用来构建胰腺癌的预后预测模型,它们的详细信息如(表3),EnsemblID是从Ensembl(http://asia.bl.org/)获取的。
基于风险评分计算公式:多变量回归分析的回归系数*lncRNA表达量,每一个胰腺癌样本的风险评分计算如下:风险评分=-0.23189*AL031658.1的表达量+0.20984*ABCA9-AS1的表达量+0.03709*DNAH17-AS1的表达量+-0.26114*AP003086.1的表达量+0.15556*AC018755.4的表达量。
根据每个样本的风险评分,本发明构建了一个基于5-lncRNA的预后预测模型。基于模型中位风险评分的临界值,将训练数据集(图3)中的样本分为高危组和低危组。Kaplan–Meier和对数秩检验结果显示,低危组明显比高危组有更高的生存率(p<0.01)。为了评估模型在胰腺癌预后中的预测价值,本发明进行了时间依赖性ROC曲线分析,5-lncRNA模型3年和5年生存率的AUC分别为0.748和0.995,有良好的预测能力。在这5个lncRNA中,AL031658.1和AP003086.1的回归系数均为负数,似乎是胰腺癌的保护因素,意味着其高表达将有较低的风险评分。而ABCA9-AS1、DNAH17-AS1和AC018755.4的回归系数为正数,可能为胰腺癌的危险因素,高表达时可能有更高的风险评分。为了显示这5个lncRNA在训练数据集中的表达情况,绘制热图如图4,并根据风险评分对其排名。
表2 174例胰腺癌患者样本的临床信息
表3胰腺癌患者中与OS显著相关的5-lncRNA的详细信息
名称 | Ensembel ID | 位置 | Pa | 风险比a | 系数b | |
AL031658.1 | ENSG00000226239 | chr20:32005671-32031591 | 0.0120 | 0.7677 | -0.23189 | SEQ ID NO:1 |
ABCA9-AS1 | ENSG00000231749 | chr17:68944531-69042784 | 0.0147 | 1.2111 | 0.20984 | SEQ ID NO:2 |
DNAH17-AS1 | ENSG00000267432 | chr17:78484882-78503056 | 0.0276 | 1.1695 | 0.03709 | SEQ ID NO:3 |
AP003086.1 | ENSG00000254420 | chr11:78324758-78444049 | 0.0375 | 0.8268 | -0.26114 | SEQ ID NO:4 |
AC018755.4 | ENSG00000273837 | chr19:51639478-51639931 | 0.0498 | 1.1168 | 0.15556 | SEQ ID NO:5 |
注:数据a和b分别来自训练数据集中的单变量和多变量Cox回归分析。
3.lncRNAs预后模型的验证
为了进一步验证基于5-lncRNA的模型在胰腺癌中的预后预测价值,本发明在验证数据集(图5)和完整数据集(图7)中进行了相同的操作。根据5-lncRNA模型中位风险评分临界值,将测试数据集和完整数据集的患者分为高风险组和低风险组,然后对其进行Kaplan–Meier和对数秩检验,发现两组之间的生存率有显著差异,低危组均明显比高危组有更高的生存率(p<0.01)。时间依赖性ROC曲线分析结果显示,验证数据集3年和5年生存率的AUC分别为0.775和0.907,而完整数据集3年和5年生存率的AUC分别为0.746和0.897,均有强大的预测能力。绘制5个lncRNA在验证数据集和完整数据集的表达谱热图如图6和图8,并根据其风险评分对其排名。
4.lncRNAs模型与临床病理特征的关系
本发明按1:1的比例将数据随机分为训练数据集和完整数据集,因此两组之间的临床病理特征的构成没有显著的差异和偏差,卡方检验的结果证实了这一点(表2)。为了探讨lncRNAs模型与临床病理特征在对胰腺癌OS影响中的关系,本发明分别在训练、验证和完整数据集中,联合lncRNAs模型、年龄、性别、饮酒、放疗史、化疗史、家族史、吸烟、肿瘤分化和病理分期进行单变量和多变量Cox回归分析。结果显示,lncRNAs模型对胰腺癌预后的影响独立于临床病理特征(表4)。在单变量Cox回归分析中,肿瘤分化、病理分期和lncRNAs模型在训练数据集里与OS有较强的相关性(p<0.05),放疗史、化疗史和lncRNAs模型在验证数据集里与OS有较强的相关性(p<0.05),而在完整数据集里,放疗史、化疗史、病理分期和lncRNAs模型与OS有较强的相关性(p<0.05)。但经过多变量Cox回归分析,训练数据集里肿瘤分化、病理分期和lncRNAs模型与OS依然有较强的相关性(p<0.05),验证数据集里化疗史和lncRNAs模型与OS依然有较强的相关性(p<0.05),而完整数据集里剩余化疗史、病理分期和lncRNAs模型,本发明以完整数据集的结果为准。
研究lncRNAs模型的风险评分与临床病理特征的关系时,从表5中可以看出,性别只在训练数据集中在高危组和低危组之间有显著差异(p<0.05),但在验证数据集和完整数据集中在高危组和低危组之间有显著差异(p>0.05),而病理分期在训练数据集和完整数据集中在高危组和低危组之间均有显著差异(p<0.05)。因此,结合卡方值,本发明可以得出结论,lncRNAs模型和病理分期之间存在着正相关。病理期高的患者更有可能有较高的风险评分。
表4 lncRNAs模型在训练、验证和完整数据集中进行单变量和多变量Cox回归分析的结果
表5lncRNAs模型的风险评分与临床病理特征在训练、验证和完整数据集中的相关性
5.lncRNAs模型在评估临床结果中的预后价值
本发明在完整数据集里进行了时间依赖性ROC曲线分析,3年和5年生存率的AUC分别为0.746和0.897。与之前发表的lncRNA模型相比,本发明的lncRNAs模型具有更高的预测能力。
事实上,在本发明的临床实践中,最广为人知和公认的预后风险分类方法是AJCC建立的TNM分期系统。因此,本发明探索了lncRNAs模型和TNM分期系统之间的关系(图9)。结果表明,TNM分期系统的3年和5年生存率AUC分别为0.67和0.723,均低于本发明模型的AUC,这说明本发明的lncRNAs模型具有比TNM分期系统更好的预后预测能力。此外,当本发明的lncRNAs模型与TNM分期系统联合使用时,其3年和5年生存率AUC分别为0.82和0.959,极大提高了胰腺癌预后预测的准确性。
6.预测胰腺癌患者OS列线图的构建
临床上经常联合多个临床病理特征建立预测模型。为了建立一个预测胰腺癌患者OS的临床综合模型,本发明在lncRNAs模型和临床病理特征之中筛选了胰腺癌OS的独立影响因子。如表4所示,在完整数据集中,单变量和多变量Cox回归分析结果表明,lncRNAs模型、化疗史和病理分期是胰腺癌OS的独立影响因子(p<0.05)。因此,本发明使用这三个独立影响因子构建列线图(图10)。每个样本均有其lncRNAs模型风险评分水平、化疗史和病理分期的得分,然后本发明将其获得的三个得分相加计算列线图的总得分,从而预测其3年和5年的生存率,具体分值见表6。为了验证列线图的预测价值,本发明计算了它的C指数,进行了时间依赖性ROC曲线分析并绘制了校正曲线图。结果表明,列线图的C指数为0.677(95%CI:0.614-0.740),3年和5年生存率的AUC分别为0.718、0.786(图11A),预测价值均较高,但稍低于lncRNAs模型。绘制校正曲线,本发明也可以发现,在3年和5年生存率方面,列线图预测值和实际观测值基本吻合(图11B、C),再次证明其预测价值较高。
表6列线图各变量得分情况
7.5个lncRNA的功能的集分析
为了进一步研究这5个lncRNA潜在的生物学作用,本发明将与这5个lncRNA共表达的蛋白编码基因进行了KEGG和GO富集分析。首先,本发明从TCGA下载的胰腺癌数据中提取所有的mRNA,然后在其中筛选出415个在胰腺癌和癌旁正常组织中差异表达的mRNA(|logFC|>2,p<0.05)。然后,本发明用这415个mRNA和本发明之前筛选的5个lncRNA进行Pearson分析,最后获得了339个共表达mRNA(相关系数绝对值>0.4,p<0.001)。基于这339个mRNA,本发明使用Cytoscape的ClueGO进行了KEGG和GO功能富集分析,并用CluePedia绘图,p≤0.05的通路有30个(图12),p≤0.00001的有3个(图13),分别为淋巴细胞活化、B细胞活化和白细胞活化,说明这5个lncRNA对胰腺癌预后的影响与免疫有关。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。
Claims (7)
1.一种胰腺癌预后预测的产品,其特征在于,所述产品中包含以下中的至少一种:
5-lncRNA、5-lncRNA的特异性探针、5-lncRNA的特异性引物、5-lncRNA的结合蛋白;
所述的5-lncRNA为5个lncRNA,分别为SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQID NO:4、SEQ ID NO:5所示的RNA序列。
2.根据权利要求1所述的胰腺癌预后预测的产品,其特征在于,产品包括以下中的至少一种:
能够检测5-lncRNA表达及表达水平的试剂、基因芯片、蛋白质芯片、试剂盒和核酸膜条。
3.一种胰腺癌预后预测模型,其特征在于,利用以下中的至少一种对胰腺癌预后结果进行预测;
5-lncRNA、5-lncRNA的特异性探针、5-lncRNA的特异性引物、5-lncRNA的结合蛋白;
所述的5-lncRNA为5个lncRNA,分别为SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQID NO:4、SEQ ID NO:5所示的RNA序列。
4.根据权利要求3所述的胰腺癌预后预测模型,其特征在于,包括:
输入单元:用于获取样本中5-lncRNA的表达水平;
输出单元:根据5-lncRNA的表达情况,获得胰腺癌预后预测结果。
5.一种胰腺癌预后预测系统,其特征在于,含有权利要求3或4所述的胰腺癌预后预测模型。
6.一种胰腺癌预后预测装置,其特征在于,载有权利要求5所述的胰腺癌预后预测系统。
7.如下任一项应用:
(1)5-lncRNA及其相关物质在制备胰腺癌辅助诊断或胰腺癌预后预测产品中的应用;
(2)5-lncRNA及其相关物质在制备胰腺癌辅助诊断或胰腺癌预后预测工具中的应用;
(3)5-lncRNA及其相关物质在构建胰腺癌诊辅助诊断或胰腺癌预后预测的系统/装置中的应用;
(4)5-lncRNA及其相关物质在构建胰腺癌诊辅助诊断或胰腺癌预后预测的计算机可读存储介质中的应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311051929.2A CN117070628A (zh) | 2023-08-21 | 2023-08-21 | 胰腺癌预后预测的产品、模型、系统、装置及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311051929.2A CN117070628A (zh) | 2023-08-21 | 2023-08-21 | 胰腺癌预后预测的产品、模型、系统、装置及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117070628A true CN117070628A (zh) | 2023-11-17 |
Family
ID=88701830
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311051929.2A Pending CN117070628A (zh) | 2023-08-21 | 2023-08-21 | 胰腺癌预后预测的产品、模型、系统、装置及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117070628A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130178428A1 (en) * | 2011-11-30 | 2013-07-11 | Dave S.B. HOON | Long noncoding rna (lncrna) as a biomarker and therapeutic marker in cancer |
CN106381342A (zh) * | 2016-12-01 | 2017-02-08 | 北京致成生物医学科技有限公司 | 用于胰腺癌诊断或预后的生物标记 |
CN109402254A (zh) * | 2018-09-04 | 2019-03-01 | 复旦大学附属华山医院 | 一种预测胰腺癌术后生存的LncRNA模型及检测试剂盒 |
CN109971862A (zh) * | 2019-02-14 | 2019-07-05 | 辽宁省肿瘤医院 | C9orf139和MIR600HG作为胰腺癌预后标志物及其确立方法 |
US20220088056A1 (en) * | 2018-12-05 | 2022-03-24 | Nitto Denko Corporation | Combination for treating cancer |
CN115992229A (zh) * | 2022-07-22 | 2023-04-21 | 中南大学湘雅三医院 | 一种胰腺癌预后风险评估的lncRNA标记物、模型及其应用 |
CN116092664A (zh) * | 2022-11-25 | 2023-05-09 | 中山大学孙逸仙纪念医院 | 一种胰腺癌预后预测模型建立方法 |
-
2023
- 2023-08-21 CN CN202311051929.2A patent/CN117070628A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130178428A1 (en) * | 2011-11-30 | 2013-07-11 | Dave S.B. HOON | Long noncoding rna (lncrna) as a biomarker and therapeutic marker in cancer |
CN106381342A (zh) * | 2016-12-01 | 2017-02-08 | 北京致成生物医学科技有限公司 | 用于胰腺癌诊断或预后的生物标记 |
CN109402254A (zh) * | 2018-09-04 | 2019-03-01 | 复旦大学附属华山医院 | 一种预测胰腺癌术后生存的LncRNA模型及检测试剂盒 |
US20220088056A1 (en) * | 2018-12-05 | 2022-03-24 | Nitto Denko Corporation | Combination for treating cancer |
CN109971862A (zh) * | 2019-02-14 | 2019-07-05 | 辽宁省肿瘤医院 | C9orf139和MIR600HG作为胰腺癌预后标志物及其确立方法 |
CN115992229A (zh) * | 2022-07-22 | 2023-04-21 | 中南大学湘雅三医院 | 一种胰腺癌预后风险评估的lncRNA标记物、模型及其应用 |
CN116092664A (zh) * | 2022-11-25 | 2023-05-09 | 中山大学孙逸仙纪念医院 | 一种胰腺癌预后预测模型建立方法 |
Non-Patent Citations (2)
Title |
---|
TAO XU 等: "DNAH17-AS1 promotes pancreatic carcinoma by increasing PPME1 expression via inhibition of miR-432-5p", 《WORLD J GASTROENTEROLOGY》, vol. 26, no. 15, pages 1745 - 1757 * |
王雪 等: "7-lncRNA风险评估模型在胰腺癌预后判断中的价值", 《中国现代普通外科进展》, no. 05 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2019228512B2 (en) | Systems and methods for detection of residual disease | |
Gentles et al. | The prognostic landscape of genes and infiltrating immune cells across human cancers | |
Hsu et al. | Identification of potential biomarkers related to glioma survival by gene expression profile analysis | |
Gordon et al. | Translation of microarray data into clinically relevant cancer diagnostic tests using gene expression ratios in lung cancer and mesothelioma | |
CN103733065B (zh) | 用于癌症的分子诊断试验 | |
CA3152591C (en) | Lung cancer biomarkers and uses thereof | |
CN111128299B (zh) | 一种结直肠癌预后显著相关ceRNA调控网络的构建方法 | |
Milanez-Almeida et al. | Cancer prognosis with shallow tumor RNA sequencing | |
CN110577998A (zh) | 预测肝癌术后早期复发风险分子模型的构建及其应用评估 | |
CN111394456B (zh) | 早期肺腺癌患者预后评估系统及其应用 | |
US8030060B2 (en) | Gene signature for diagnosis and prognosis of breast cancer and ovarian cancer | |
CN111128385B (zh) | 一种用于食管鳞癌的预后预警系统及其应用 | |
CN112626218A (zh) | 一种用于预测胰腺癌转移风险的基因表达分类器、体外诊断试剂盒 | |
WO2021006279A1 (en) | Data processing and classification for determining a likelihood score for breast disease | |
CN114203256B (zh) | 基于微生物丰度的mibc分型及预后预测模型构建方法 | |
CN113345592B (zh) | 一种急性髓细胞样白血病预后风险模型的构建及诊断设备 | |
CN114360721A (zh) | 代谢相关子宫内膜癌的预后模型及构建方法 | |
CN117038092A (zh) | 基于Cox回归分析的胰腺癌的预后模型构建方法 | |
CN113430267A (zh) | 一种化疗相关基因表达特征在预测胰腺癌预后中的应用 | |
WO2019232361A1 (en) | Personalized treatment of pancreatic cancer | |
CN117070628A (zh) | 胰腺癌预后预测的产品、模型、系统、装置及其应用 | |
CN115807089A (zh) | 肝细胞肝癌预后生物标志物及应用 | |
Durmaz et al. | A multimodal analysis of genomic and RNA splicing features in myeloid malignancies | |
CN109207581A (zh) | 一种自身免疫性疾病诊断试剂盒和应用 | |
CN116656829B (zh) | 一种预测胃癌不良预后的基因标志物组合、试剂盒及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |