CN116959554A - 一种基于CAFs相关基因的前列腺癌生化复发预测模型及其应用 - Google Patents
一种基于CAFs相关基因的前列腺癌生化复发预测模型及其应用 Download PDFInfo
- Publication number
- CN116959554A CN116959554A CN202310837719.XA CN202310837719A CN116959554A CN 116959554 A CN116959554 A CN 116959554A CN 202310837719 A CN202310837719 A CN 202310837719A CN 116959554 A CN116959554 A CN 116959554A
- Authority
- CN
- China
- Prior art keywords
- gene
- prostate cancer
- cafs
- biochemical recurrence
- cafsrs
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 206010060862 Prostate cancer Diseases 0.000 title claims abstract description 100
- 208000000236 Prostatic Neoplasms Diseases 0.000 title claims abstract description 100
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 65
- 238000004393 prognosis Methods 0.000 claims abstract description 7
- 230000014509 gene expression Effects 0.000 claims description 51
- 239000000523 sample Substances 0.000 claims description 23
- 238000012549 training Methods 0.000 claims description 18
- 101150000187 PTGS2 gene Proteins 0.000 claims description 17
- 238000012360 testing method Methods 0.000 claims description 15
- 230000002980 postoperative effect Effects 0.000 claims description 14
- 101150012094 CDH11 gene Proteins 0.000 claims description 13
- 101150035535 Col5a1 gene Proteins 0.000 claims description 13
- 101150086205 ENG gene Proteins 0.000 claims description 13
- 101150008284 FKBP10 gene Proteins 0.000 claims description 13
- 101100440307 Homo sapiens COL5A2 gene Proteins 0.000 claims description 13
- 101150085994 SRD5A2 gene Proteins 0.000 claims description 13
- 230000004083 survival effect Effects 0.000 claims description 13
- 210000001519 tissue Anatomy 0.000 claims description 13
- 238000000611 regression analysis Methods 0.000 claims description 11
- 238000011156 evaluation Methods 0.000 claims description 9
- 238000010200 validation analysis Methods 0.000 claims description 8
- 238000012163 sequencing technique Methods 0.000 claims description 7
- 238000012795 verification Methods 0.000 claims description 7
- 238000012216 screening Methods 0.000 claims description 6
- 239000003153 chemical reaction reagent Substances 0.000 claims description 5
- 238000001514 detection method Methods 0.000 claims description 4
- 239000002773 nucleotide Substances 0.000 claims description 4
- 125000003729 nucleotide group Chemical group 0.000 claims description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 3
- 238000012937 correction Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 claims description 3
- 238000000034 method Methods 0.000 claims description 3
- 201000010099 disease Diseases 0.000 abstract description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 6
- 238000012544 monitoring process Methods 0.000 abstract description 6
- 206010028980 Neoplasm Diseases 0.000 abstract description 5
- 238000013517 stratification Methods 0.000 abstract description 4
- 238000013461 design Methods 0.000 abstract description 3
- 238000010837 poor prognosis Methods 0.000 abstract description 3
- 210000004027 cell Anatomy 0.000 description 5
- 238000013103 analytical ultracentrifugation Methods 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 4
- 230000036962 time dependent Effects 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 238000011470 radical surgery Methods 0.000 description 3
- 238000001959 radiotherapy Methods 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 2
- 101150028074 2 gene Proteins 0.000 description 1
- 108010037462 Cyclooxygenase 2 Proteins 0.000 description 1
- 102000010834 Extracellular Matrix Proteins Human genes 0.000 description 1
- 108010037362 Extracellular Matrix Proteins Proteins 0.000 description 1
- 101000640851 Homo sapiens 3-oxo-5-alpha-steroid 4-dehydrogenase 2 Proteins 0.000 description 1
- 101000762236 Homo sapiens Cadherin-11 Proteins 0.000 description 1
- 101000941708 Homo sapiens Collagen alpha-1(V) chain Proteins 0.000 description 1
- 101000941594 Homo sapiens Collagen alpha-2(V) chain Proteins 0.000 description 1
- 101000891031 Homo sapiens Peptidyl-prolyl cis-trans isomerase FKBP10 Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000002306 biochemical method Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 210000002744 extracellular matrix Anatomy 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000032361 posttranscriptional gene silencing Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 238000007634 remodeling Methods 0.000 description 1
- 238000011272 standard treatment Methods 0.000 description 1
- 210000002536 stromal cell Anatomy 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6834—Enzymatic or biochemical coupling of nucleic acids to a solid phase
- C12Q1/6837—Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
- G16B5/20—Probabilistic models
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/30—Data warehousing; Computing architectures
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Theoretical Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medical Informatics (AREA)
- Genetics & Genomics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Evolutionary Biology (AREA)
- Immunology (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Bioethics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Microbiology (AREA)
- Oncology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Hospice & Palliative Care (AREA)
- Physiology (AREA)
- General Chemical & Material Sciences (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Data Mining & Analysis (AREA)
- Medicinal Chemistry (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
Abstract
本申请涉及转录组学和肿瘤预后标志物技术领域,具体公开了一种基于CAFs相关基因的前列腺癌生化复发预测模型(CAFsRS)及其应用。本申请构建了含有7个CAFs相关基因的前列腺癌生化复发预测模型,鉴于该模型对生化复发预测的高效价值,设计了一款基于7个CAFs相关基因的基因芯片,对前列腺癌患者的生化复发进行评估,可鉴别预后不良的前列腺癌患者,临床实践中可利用CAFsRS评分对患者进行危险分层,为前列腺癌患者疾病监测和随访管理提供数据支持。
Description
技术领域
本申请涉及转录组学和肿瘤预后标志物技术领域,尤其是涉及一种基于CAFs相关基因的前列腺癌生化复发预测模型(CAFsRS)及其应用。
背景技术
前列腺癌(Prostate cancer,PCa)是全球男性最常见的恶性肿瘤,全球前列腺癌新增病例达到惊人的141.4万例,新增死亡病例达到37.5万例。尽管标准治疗可以治愈部分的局限性前列腺癌患者,但仍然有20%-30%的患者随后将出现生化复发。开发前列腺癌生化复发预测模型有助于患者疾病监测和随访管理。
肿瘤相关成纤维细胞(Cancer-associated fibroblasts,CAFs)是肿瘤微环境中基质细胞的重要组成部分,其参与构建和重塑细胞外基质,与前列腺癌生化复发密切相关。然而,目前尚无基于CAFs相关基因构建前列腺癌生化复发预测模型的研究。
发明内容
本申请的目的在于克服上述现有技术的不足之处而提供一种基于CAFs相关基因的前列腺癌生化复发预测模型(CAFsRS)及其应用。本申请构建了含有7个CAFs相关基因的前列腺癌生化复发预测模型,鉴于该模型对生化复发预测的高效价值,设计了一款基于7个CAFs相关基因的基因芯片,对前列腺癌患者的生化复发进行评估,可鉴别预后不良的前列腺癌患者,临床实践中可利用CAFsRS评分对患者进行危险分层,为前列腺癌患者疾病监测和随访管理提供数据支持。
为实现上述目的,本申请采取的技术方案为:
第一方面,本申请提供了一种基于CAFs相关基因的前列腺癌生化复发预测模型在预测前列腺癌生化复发中的应用,所述前列腺癌生化复发预测模型的评分公式为:
CAFsRS评分=PTGS2基因的表达水平×(-0.239)+FKBP10基因的表达水平×(0.157)+ENG基因的表达水平×(0.507)+CDH11基因的表达水平×(0.231)+COL5A1基因的表达水平×(0.009)+COL5A2基因的表达水平×(0.506)+SRD5A2基因的表达水平×(-0.583);
所述CAFsRS评分与前列腺癌患者术后生化复发相关,CAFsRS评分越高,患者预后越差,术后生化复发时间越短。
当前列腺癌患者CAFsRS评分大于0.828时,属于高风险;小于等于0.828时,属于低风险。
本申请提供了一种基于CAFs相关基因(PTGS2基因、FKBP10基因、ENG基因、CDH11基因、COL5A1基因、COL5A2基因和SRD5A2基因)的前列腺癌生化复发预测模型,该前列腺癌生化复发预测模型在预测前列腺癌患者根治性手术和根治性放疗术后的生化复发方面具有良好的性能。并且,本申请可利用CAFsRS评分对患者进行危险分层,为前列腺癌患者疾病监测和随访管理提供数据支持。
作为本申请所述应用的优选实施方式,所述PTGS2基因、FKBP10基因、ENG基因、CDH11基因、COL5A1基因、COL5A2基因和SRD5A2基因的表达水平是通过基因芯片检测的结果转换为log2(count+1)格式得到的数据。
作为本申请所述应用的优选实施方式,所述基因芯片包括检测CAFs相关基因表达水平的探针,所述探针的核苷酸序列如SEQ ID NO:1~7所示。
作为本申请所述应用的优选实施方式,所述前列腺癌生化复发预测模型的构建方法包括以下步骤:
S1、从GEO数据库中获得前列腺癌和癌旁组织的单细胞转录组测序数据,从TCGA数据库和GEO数据库中获得前列腺癌组织样本的基因表达数据和相应临床数据;R软件“limma”和“sva”包对获得的数据进行批次矫正和标准化处理;
S2、利用单细胞转录组测序数据获取CAFs与其它细胞类型间差异表达的基因,以调整后的p值<0.05和log2|fold change|>0.5作为筛选阈值,最终得到CAFs相关基因;
S3、将TCGA数据库中获得的前列腺癌组织样本分为预测模型的训练集和测试集,将GEO数据库中获得的前列腺癌组织样本作为预测模型的验证集;利用训练集的数据,以p<0.05为筛选标准,基于单因素COX回归分析和LASSO回归分析得到与前列腺癌患者生化复发相关的CAFs相关基因,并用于构建预测模型;所述CAFs相关基因为PTGS2基因、FKBP10基因、ENG基因、CDH11基因、COL5A1基因、COL5A2基因和SRD5A2基因;
S4、基于多因素COX回归分析计算CAFs相关基因的系数并建立前列腺癌生化复发预测模型,所述前列腺癌生化复发预测模型的评分公式为:
CAFsRS评分=PTGS2基因的表达水平×(-0.239)+FKBP10基因的表达水平×(0.157)+ENG基因的表达水平×(0.507)+CDH11基因的表达水平×(0.231)+COL5A1基因的表达水平×(0.009)+COL5A2基因的表达水平×(0.506)+SRD5A2基因的表达水平×(-0.583);所述CAFsRS评分与前列腺癌患者术后生化复发相关,CAFsRS评分越高,患者预后越差,术后生化复发时间越短。
当前列腺癌患者CAFsRS评分大于0.828时,属于高风险;小于等于0.828时,属于低风险。
针对当前临床上尚无可靠的、高效的预测前列腺癌患者术后生化复发的模型,本申请利用转录组学和随访数据构建模型用于预测前列腺癌患者术后1年、3年和5年生化复发的概率。通过分析CAFs相关基因与前列腺癌生化复发的关系,构建基于CAFs相关基因的前列腺癌生化复发预测模型,制备用于检测生化复发预测模型内基因表达水平的芯片,可以实现对前列腺癌患者术后生化复发的预测。临床实践中可以通过CAFsRS评分将患者分为高低分险组,为前列腺癌患者疾病监测和随访管理提供数据支持。
作为本申请所述应用的优选实施方式,所述应用中还包括基于训练集、测试集和验证集,将前列腺癌患者的CAFsRS评分的中位数作为截断值,将前列腺癌患者分为高CAFsRS评分组和低CAFsRS评分组;
应用Kaplan-Meier生存曲线分析高CAFsRS评分组和低CAFsRS评分组的前列腺癌患者的生化复发时间是否具有显著差异性;绘制生存状态散点图比较高CAFsRS评分组和低CAFsRS评分组的前列腺癌患者的生化复发状态;绘制ROC曲线,依据曲线下面积AUC值评估CAFsRS评分预测患者1、3、5年生化复发的效能。
作为本申请所述应用的优选实施方式,所述步骤S1中,从GEO数据库的GSE70770和GSE116918中获得前列腺癌组织样本的基因表达数据和相应临床数据。
第二方面,本申请提供了一种检测CAFs相关基因表达水平的试剂在制备预测前列腺癌生化复发预测产品中的应用,所述CAFs相关基因包括PTGS2基因、FKBP10基因、ENG基因、CDH11基因、COL5A1基因、COL5A2基因和SRD5A2基因。
作为本申请所述应用的优选实施方式,所述CAFs相关基因表达水平通过基因芯片检测PTGS2基因、FKBP10基因、ENG基因、CDH11基因、COL5A1基因、COL5A2基因和SRD5A2基因表达水平的结果转换为log2(count+1)格式得到的数据。
作为本申请所述应用的优选实施方式,所述试剂包括检测CAFs相关基因表达水平的探针,所述探针的核苷酸序列如SEQ ID NO:1~7所示。
第三个方面,本申请提供了一种预测前列腺癌生化复发的基因芯片,所述基因芯片包括检测PTGS2基因、FKBP10基因、ENG基因、CDH11基因、COL5A1基因、COL5A2基因和SRD5A2基因的探针,所述探针的核苷酸序列如SEQ ID NO:1~7所示。
本申请构建了含有7个CAFs相关基因的前列腺癌生化复发预测模型,鉴于该模型对生化复发预测的高效价值,设计了一款基于7个CAFs相关基因的基因芯片,对前列腺癌患者的生化复发进行评估,可鉴别预后不良的前列腺癌患者,临床实践中可利用CAFsRS评分对患者进行危险分层,为前列腺癌患者疾病监测和随访管理提供数据支持。
与现有技术相比,本申请具有以下有益效果:
本申请基于前列腺癌患者CAFs相关基因,利用训练集前列腺癌患者转录组测序数据和相应随访数据,应用COX回归分析和LASSO回归分析构建一种基于CAFs相关基因的前列腺癌生化复发预测模型,可将前列腺癌患者分为高CAFsRS评分和低CAFsRS评分组。在训练集中前列腺癌患者的CAFsRS评分与生化复发正相关(P<0.001)。ROC曲线显示,模型预测前列腺癌患者1年、3年和5年生化复发的AUC分别为0.732、0.773和0.775。测试集和验证集结果显示该模型在预测前列腺癌患者根治性手术和根治性放疗术后的生化复发方面具有良好的性能。并构建一款基于CAFs相关基因的基因表达水平检测芯片,为预测前列腺癌患者术后生化方法提供一种可靠工具。
附图说明
图1为前列腺癌中具有预后价值的CAFs相关基因的获取结果图(图1-A:不同的细胞类型的聚类图;图1-B:不同细胞类型的标记基因的表达热图;图1-C:前列腺癌和癌旁组织差异表达的CAFs相关基因火山图;图1-D:用LASSO进行变量选择的10倍交叉验证结果;图1-E:CAFs的LASSO回归曲线);
图2为CAFsRS评分高低风险组的生化复发预测结果图(图2-A:训练集高低分险组的生存曲线;图2-B:测试集高低分险组的生存曲线;图2-C:GSE70770验证集高低分险组的生存曲线;图2-D:GSE116918验证集高低分险组的生存曲线;图2-E:训练集高低分险组的生存状态散点图;图2-F:测试集高低分险组的生存状态散点图;图2-G:GSE70770验证集高低分险组的生存状态散点图;图2-H:GSE116918验证集高低分险组的生存状态散点图;图2-I:训练集的时间依赖ROC曲线;图2-J:测试集的时间依赖ROC曲线;K:GSE70770验证集的时间依赖ROC曲线;图2-L:GSE116918验证集的时间依赖ROC曲线)。
具体实施方式
为更好的说明本申请的目的、技术方案和优点,下面将结合附图和具体实施例对本申请作进一步说明。
在以下实施例中,所使用的实验方法如无特殊说明,均为常规方法,所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1、一种前列腺癌生化复发预测模型及其构建方法
本实施例提供的前列腺癌生化复发预测模型的构建方法,包括以下步骤:
(1)从GEO数据库下载得到4对前列腺癌和癌旁组织的单细胞转录组测序数据。从TCGA数据库和GEO数据库(GSE70770和GSE116918)下载得到833例患者的前列腺癌组织基因表达数据和相应临床数据。R软件“limma”和“sva”包对数据进行批次矫正和标准化处理。
(2)利用单细胞转录组测序数据获取CAFs与其它细胞类型间差异表达的基因(图1-A),以调整后的p值<0.05和log2|fold change|>0.5作为筛选阈值,最终得到CAFs相关基因(图1-B、图1-C)。
(3)利用TCGA数据库前列腺癌样本,按2:1的比例将所有样本为模型构建的训练集和测试集,将GSE70770和GSE116918作为模型的验证集。应用训练集数据构建预测模型,测试集和验证集对模型进行验证。
(4)利用训练集数据,以p<0.05为筛选标准,基于单因素COX回归分析(图1-D)和LASSO回归分析得到PTGS2基因、FKBP10基因、ENG基因、CDH11基因、COL5A1基因、COL5A2基因和SRD5A2基因等7个与前列腺癌患者生化复发相关的CAFs相关基因(图1-E、图1-F),用于构建预测模型。
(5)基于多因素COX回归分析计算每个基因的系数并建立前列腺癌生化复发预测模型;具体为:CAFsRS评分=PTGS2基因的表达水平×(-0.239)+FKBP10基因的表达水平×(0.157)+ENG基因的表达水平×(0.507)+CDH11基因的表达水平×(0.231)+COL5A1基因的表达水平×(0.009)+COL5A2基因的表达水平×(0.506)+SRD5A2基因的表达水平×(-0.583)。
在本实施例中,PTGS2基因、FKBP10基因、ENG基因、CDH11基因、COL5A1基因、COL5A2基因和SRD5A2基因的表达水平是通过基因芯片检测的结果转换为log2(count+1)格式得到的数据,基因芯片包括检测PTGS2基因、FKBP10基因、ENG基因、CDH11基因、COL5A1基因、COL5A2基因和SRD5A2基因表达水平的探针,所述探针的核苷酸序列如SEQ ID NO:1~7所示(如表1所示)。
表1
实施例2、前列腺癌生化复发预测模型的应用
(1)基于训练集、测试集和验证集样本数据(表2),根据实施例1构建得到的生化复发预测模型计算每位前列腺癌患者的CAFsRS评分,以评分的中位数作为截断值将患者分为高CAFsRS评分组和低CAFsRS评分组。当前列腺癌患者CAFsRS评分大于0.828时,属于高风险;小于等于0.828时,属于低风险。
(2)应用Kaplan-Meier生存曲线分析高低CAFsRS评分组前列腺癌患者的生化复发时间是否具有显著差异性(图2-A~图2-D);绘制生存状态散点图比较高低分险组患者的生化复发状态(图2-E~图2-H)。
(3)进一步地,绘制ROC曲线下面积评估CAFsRS评分预测患者1,3和5年生化复发的效能(图2-I~图2-L),曲线下面积AUC的值越大说明模型的预测效能越好。
(4)测试集和验证集结果表明所述前列腺癌患者CAFsRS评分与术后生化复发密切相关,CAFsRS评分越高,患者预后越差,术后生化复发时间越短,与训练数据集具有一致性的趋势。
表2训练集、测试集和验证集样本的基线数据
如图2所示,本申请建立了基于7个CAFs相关基因的前列腺癌生化复发预测模型,可将前列腺癌患者分为高CAFsRS和低CAFsRS组。在训练集中前列腺癌患者的CAFsRS评分与生化复发正相关(P<0.001)。ROC曲线显示,模型预测前列腺癌患者1年、3年和5年生化复发的AUC分别为0.732、0.773和0.775。测试集和验证集结果显示该模型在预测前列腺癌患者根治性手术和根治性放疗术后的生化复发方面具有良好的性能。
最后所应当说明的是,以上实施例仅用以说明本申请的技术方案而非对本申请保护范围的限制,尽管参照较佳实施例对本申请作了详细说明,本领域的普通技术人员应当理解,可以对本申请的技术方案进行修改或者等同替换,而不脱离本申请技术方案的实质和范围。
Claims (10)
1.一种基于CAFs相关基因的前列腺癌生化复发预测模型在预测前列腺癌生化复发中的应用,其特征在于,所述前列腺癌生化复发预测模型的评分公式为:
CAFsRS评分=PTGS2基因的表达水平×(-0.239)+FKBP10基因的表达水平×(0.157)+ENG基因的表达水平×(0.507)+CDH11基因的表达水平×(0.231)+COL5A1基因的表达水平×(0.009)+COL5A2基因的表达水平×(0.506)+SRD5A2基因的表达水平×(-0.583);
所述CAFsRS评分与前列腺癌患者术后生化复发相关,CAFsRS评分越高,患者预后越差,术后生化复发时间越短。
2.如权利要求1所述的应用,其特征在于,所述PTGS2基因、FKBP10基因、ENG基因、CDH11基因、COL5A1基因、COL5A2基因和SRD5A2基因的表达水平是通过基因芯片检测的结果转换为log2(count+1)格式得到的数据。
3.如权利要求2所述的应用,其特征在于,所述基因芯片包括检测CAFs相关基因表达水平的探针,所述探针的核苷酸序列如SEQ ID NO:1~7所示。
4.如权利要求1~3任一项所述的应用,其特征在于,所述前列腺癌生化复发预测模型的构建方法包括以下步骤:
S1、从GEO数据库中获得前列腺癌和癌旁组织的单细胞转录组测序数据,从TCGA数据库和GEO数据库中获得前列腺癌组织样本的基因表达数据和相应临床数据;R软件“limma”和“sva”包对获得的数据进行批次矫正和标准化处理;
S2、利用单细胞转录组测序数据获取CAFs与其它细胞类型间差异表达的基因,以调整后的p值<0.05和log2|fold change|>0.5作为筛选阈值,最终得到CAFs相关基因;
S3、将TCGA数据库中获得的前列腺癌组织样本分为预测模型的训练集和测试集,将GEO数据库中获得的前列腺癌组织样本作为预测模型的验证集;利用训练集的数据,以p<0.05为筛选标准,基于单因素COX回归分析和LASSO回归分析得到与前列腺癌患者生化复发相关的CAFs相关基因,并用于构建预测模型;所述CAFs相关基因为PTGS2基因、FKBP10基因、ENG基因、CDH11基因、COL5A1基因、COL5A2基因和SRD5A2基因;
S4、基于多因素COX回归分析计算CAFs相关基因的系数并建立前列腺癌生化复发预测模型,所述前列腺癌生化复发预测模型的评分公式为:
CAFsRS评分=PTGS2基因的表达水平×(-0.239)+FKBP10基因的表达水平×(0.157)+ENG基因的表达水平×(0.507)+CDH11基因的表达水平×(0.231)+COL5A1基因的表达水平×(0.009)+COL5A2基因的表达水平×(0.506)+SRD5A2基因的表达水平×(-0.583);所述CAFsRS评分与前列腺癌患者术后生化复发相关,CAFsRS评分越高,患者预后越差,术后生化复发时间越短。
5.如权利要求4所述的应用,其特征在于,所述应用中还包括基于训练集、测试集和验证集,将前列腺癌患者的CAFsRS评分的中位数作为截断值,将前列腺癌患者分为高CAFsRS评分组和低CAFsRS评分组;
应用Kaplan-Meier生存曲线分析高CAFsRS评分组和低CAFsRS评分组的前列腺癌患者的生化复发时间是否具有显著差异性;绘制生存状态散点图比较高CAFsRS评分组和低CAFsRS评分组的前列腺癌患者的生化复发状态;绘制ROC曲线,依据曲线下面积AUC值评估CAFsRS评分预测患者1、3、5年生化复发的效能。
6.如权利要求4所述的应用,其特征在于,所述步骤S1中,从GEO数据库的GSE70770和GSE116918中获得前列腺癌组织样本的基因表达数据和相应临床数据。
7.一种检测CAFs相关基因表达水平的试剂在制备预测前列腺癌生化复发预测产品中的应用,其特征在于,所述CAFs相关基因包括PTGS2基因、FKBP10基因、ENG基因、CDH11基因、COL5A1基因、COL5A2基因和SRD5A2基因。
8.如权利要求7所述的应用,其特征在于,所述CAFs相关基因表达水平通过基因芯片检测PTGS2基因、FKBP10基因、ENG基因、CDH11基因、COL5A1基因、COL5A2基因和SRD5A2基因表达水平的结果转换为log2(count+1)格式得到的数据。
9.如权利要求7所述的应用,其特征在于,所述试剂包括检测CAFs相关基因表达水平的探针,所述探针的核苷酸序列如SEQ ID NO:1~7所示。
10.一种预测前列腺癌生化复发的基因芯片,其特征在于,所述基因芯片包括检测PTGS2基因、FKBP10基因、ENG基因、CDH11基因、COL5A1基因、COL5A2基因和SRD5A2基因的探针,所述探针的核苷酸序列如SEQ ID NO:1~7所示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310837719.XA CN116959554A (zh) | 2023-07-10 | 2023-07-10 | 一种基于CAFs相关基因的前列腺癌生化复发预测模型及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310837719.XA CN116959554A (zh) | 2023-07-10 | 2023-07-10 | 一种基于CAFs相关基因的前列腺癌生化复发预测模型及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116959554A true CN116959554A (zh) | 2023-10-27 |
Family
ID=88445500
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310837719.XA Pending CN116959554A (zh) | 2023-07-10 | 2023-07-10 | 一种基于CAFs相关基因的前列腺癌生化复发预测模型及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116959554A (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101195825A (zh) * | 2007-12-10 | 2008-06-11 | 上海华冠生物芯片有限公司 | 用于乳腺癌预后的基因及其应用 |
CN112011616A (zh) * | 2020-09-02 | 2020-12-01 | 复旦大学附属中山医院 | 预测肝细胞癌肿瘤免疫浸润和术后生存时间的免疫基因预后模型 |
CN112725454A (zh) * | 2021-02-03 | 2021-04-30 | 山东第一医科大学附属省立医院(山东省立医院) | 膀胱癌患者总体生存率预后模型 |
WO2021230663A1 (ko) * | 2020-05-12 | 2021-11-18 | 서울대학교산학협력단 | 초기 유방암 환자의 예후 예측 방법 |
CN115482880A (zh) * | 2022-09-22 | 2022-12-16 | 山西省肿瘤医院 | 一种头颈鳞癌糖酵解相关基因预后模型及构建方法和应用 |
CN115588507A (zh) * | 2022-09-02 | 2023-01-10 | 山西省肿瘤医院 | 一种肺腺癌emt相关基因的预后模型及构建方法和应用 |
WO2023040102A1 (zh) * | 2021-09-16 | 2023-03-23 | 浙江大学 | 判断肝细胞肝癌患者预后的基因模型、构建方法和应用 |
CN116153387A (zh) * | 2023-01-16 | 2023-05-23 | 山西省肿瘤医院 | 一种肺鳞癌患者总体生存率预后模型及应用 |
CN116230081A (zh) * | 2022-12-22 | 2023-06-06 | 中国科学院合肥肿瘤医院 | 一种用于肺腺癌预后预测的生物标志物、应用及模型构建方法 |
-
2023
- 2023-07-10 CN CN202310837719.XA patent/CN116959554A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101195825A (zh) * | 2007-12-10 | 2008-06-11 | 上海华冠生物芯片有限公司 | 用于乳腺癌预后的基因及其应用 |
WO2021230663A1 (ko) * | 2020-05-12 | 2021-11-18 | 서울대학교산학협력단 | 초기 유방암 환자의 예후 예측 방법 |
CN112011616A (zh) * | 2020-09-02 | 2020-12-01 | 复旦大学附属中山医院 | 预测肝细胞癌肿瘤免疫浸润和术后生存时间的免疫基因预后模型 |
CN112725454A (zh) * | 2021-02-03 | 2021-04-30 | 山东第一医科大学附属省立医院(山东省立医院) | 膀胱癌患者总体生存率预后模型 |
WO2023040102A1 (zh) * | 2021-09-16 | 2023-03-23 | 浙江大学 | 判断肝细胞肝癌患者预后的基因模型、构建方法和应用 |
CN115588507A (zh) * | 2022-09-02 | 2023-01-10 | 山西省肿瘤医院 | 一种肺腺癌emt相关基因的预后模型及构建方法和应用 |
CN115482880A (zh) * | 2022-09-22 | 2022-12-16 | 山西省肿瘤医院 | 一种头颈鳞癌糖酵解相关基因预后模型及构建方法和应用 |
CN116230081A (zh) * | 2022-12-22 | 2023-06-06 | 中国科学院合肥肿瘤医院 | 一种用于肺腺癌预后预测的生物标志物、应用及模型构建方法 |
CN116153387A (zh) * | 2023-01-16 | 2023-05-23 | 山西省肿瘤医院 | 一种肺鳞癌患者总体生存率预后模型及应用 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Biswas et al. | A clonal expression biomarker associates with lung cancer mortality | |
Chen et al. | Co-expression network analysis identified FCER1G in association with progression and prognosis in human clear cell renal cell carcinoma | |
US10494677B2 (en) | Predicting cancer outcome | |
CN103299188B (zh) | 用于癌症的分子诊断试验 | |
CN110577998A (zh) | 预测肝癌术后早期复发风险分子模型的构建及其应用评估 | |
CN111833965B (zh) | 一种尿沉渣基因组dna的分类方法、装置和用途 | |
AU2009246256A1 (en) | Biomarkers for the identification, monitoring, and treatment of head and neck cancer | |
CN1484806A (zh) | 基于隐含模式用于从生物数据中识别生物状态的方法 | |
CN111575376A (zh) | 一组用于评估肾透明细胞癌预后的联合基因组及其应用 | |
CN111653314B (zh) | 一种分析识别淋巴管浸润的方法 | |
CN111564214A (zh) | 一种基于7个特殊基因的乳腺癌预后评估模型的建立与验证方法 | |
CN108559777B (zh) | 一种新型分子标记及其在制备用于肾透明细胞癌诊断和预后的试剂盒中的应用 | |
CN113066585A (zh) | 一种基于免疫基因表达特征谱对ⅱ期结直肠癌患者预后进行高效快捷评估的方法 | |
CN115575636A (zh) | 一种用于肺癌检测的生物标志物及其系统 | |
CN115144599A (zh) | 蛋白组合在制备对儿童甲状腺癌进行预后分层的试剂盒中的用途及其试剂盒、系统 | |
CN115881296B (zh) | 一种甲状腺乳头状癌(ptc)风险辅助分层系统 | |
CN104975082A (zh) | 一组用于评估肺癌预后的基因及其应用 | |
CN109735619B (zh) | 与非小细胞肺癌预后相关的分子标志物及其应用 | |
CN115128285B (zh) | 一种蛋白质组合对甲状腺滤泡性肿瘤鉴别评估的试剂盒、系统 | |
CN116013525A (zh) | 一种基于铁死亡特征构建的结直肠癌预后模型及其构建方法 | |
CN116959554A (zh) | 一种基于CAFs相关基因的前列腺癌生化复发预测模型及其应用 | |
CN113774135B (zh) | 一组用于预测高级别浆液性卵巢癌预后的标志物及其应用 | |
CN114171200A (zh) | Ptc预后标志物及其应用、ptc的预后评估模型的构建方法 | |
WO2014052930A2 (en) | Biomarkers for prostate cancer prognosis | |
CN112375832A (zh) | 一种用于表征肺腺癌气阴两虚证的肠道菌群组合及筛选及模型建立方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |