CN116959554A - 一种基于CAFs相关基因的前列腺癌生化复发预测模型及其应用 - Google Patents

一种基于CAFs相关基因的前列腺癌生化复发预测模型及其应用 Download PDF

Info

Publication number
CN116959554A
CN116959554A CN202310837719.XA CN202310837719A CN116959554A CN 116959554 A CN116959554 A CN 116959554A CN 202310837719 A CN202310837719 A CN 202310837719A CN 116959554 A CN116959554 A CN 116959554A
Authority
CN
China
Prior art keywords
gene
prostate cancer
cafs
biochemical recurrence
cafsrs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310837719.XA
Other languages
English (en)
Inventor
许可慰
赖聪
刘成
李卓航
于浩
李奎庆
吴至楷
史卷一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen Memorial Hospital Sun Yat Sen University
Original Assignee
Sun Yat Sen Memorial Hospital Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen Memorial Hospital Sun Yat Sen University filed Critical Sun Yat Sen Memorial Hospital Sun Yat Sen University
Priority to CN202310837719.XA priority Critical patent/CN116959554A/zh
Publication of CN116959554A publication Critical patent/CN116959554A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/20Probabilistic models
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medical Informatics (AREA)
  • Genetics & Genomics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Evolutionary Biology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Bioethics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Microbiology (AREA)
  • Oncology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Hospice & Palliative Care (AREA)
  • Physiology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Data Mining & Analysis (AREA)
  • Medicinal Chemistry (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)

Abstract

本申请涉及转录组学和肿瘤预后标志物技术领域,具体公开了一种基于CAFs相关基因的前列腺癌生化复发预测模型(CAFsRS)及其应用。本申请构建了含有7个CAFs相关基因的前列腺癌生化复发预测模型,鉴于该模型对生化复发预测的高效价值,设计了一款基于7个CAFs相关基因的基因芯片,对前列腺癌患者的生化复发进行评估,可鉴别预后不良的前列腺癌患者,临床实践中可利用CAFsRS评分对患者进行危险分层,为前列腺癌患者疾病监测和随访管理提供数据支持。

Description

一种基于CAFs相关基因的前列腺癌生化复发预测模型及其 应用
技术领域
本申请涉及转录组学和肿瘤预后标志物技术领域,尤其是涉及一种基于CAFs相关基因的前列腺癌生化复发预测模型(CAFsRS)及其应用。
背景技术
前列腺癌(Prostate cancer,PCa)是全球男性最常见的恶性肿瘤,全球前列腺癌新增病例达到惊人的141.4万例,新增死亡病例达到37.5万例。尽管标准治疗可以治愈部分的局限性前列腺癌患者,但仍然有20%-30%的患者随后将出现生化复发。开发前列腺癌生化复发预测模型有助于患者疾病监测和随访管理。
肿瘤相关成纤维细胞(Cancer-associated fibroblasts,CAFs)是肿瘤微环境中基质细胞的重要组成部分,其参与构建和重塑细胞外基质,与前列腺癌生化复发密切相关。然而,目前尚无基于CAFs相关基因构建前列腺癌生化复发预测模型的研究。
发明内容
本申请的目的在于克服上述现有技术的不足之处而提供一种基于CAFs相关基因的前列腺癌生化复发预测模型(CAFsRS)及其应用。本申请构建了含有7个CAFs相关基因的前列腺癌生化复发预测模型,鉴于该模型对生化复发预测的高效价值,设计了一款基于7个CAFs相关基因的基因芯片,对前列腺癌患者的生化复发进行评估,可鉴别预后不良的前列腺癌患者,临床实践中可利用CAFsRS评分对患者进行危险分层,为前列腺癌患者疾病监测和随访管理提供数据支持。
为实现上述目的,本申请采取的技术方案为:
第一方面,本申请提供了一种基于CAFs相关基因的前列腺癌生化复发预测模型在预测前列腺癌生化复发中的应用,所述前列腺癌生化复发预测模型的评分公式为:
CAFsRS评分=PTGS2基因的表达水平×(-0.239)+FKBP10基因的表达水平×(0.157)+ENG基因的表达水平×(0.507)+CDH11基因的表达水平×(0.231)+COL5A1基因的表达水平×(0.009)+COL5A2基因的表达水平×(0.506)+SRD5A2基因的表达水平×(-0.583);
所述CAFsRS评分与前列腺癌患者术后生化复发相关,CAFsRS评分越高,患者预后越差,术后生化复发时间越短。
当前列腺癌患者CAFsRS评分大于0.828时,属于高风险;小于等于0.828时,属于低风险。
本申请提供了一种基于CAFs相关基因(PTGS2基因、FKBP10基因、ENG基因、CDH11基因、COL5A1基因、COL5A2基因和SRD5A2基因)的前列腺癌生化复发预测模型,该前列腺癌生化复发预测模型在预测前列腺癌患者根治性手术和根治性放疗术后的生化复发方面具有良好的性能。并且,本申请可利用CAFsRS评分对患者进行危险分层,为前列腺癌患者疾病监测和随访管理提供数据支持。
作为本申请所述应用的优选实施方式,所述PTGS2基因、FKBP10基因、ENG基因、CDH11基因、COL5A1基因、COL5A2基因和SRD5A2基因的表达水平是通过基因芯片检测的结果转换为log2(count+1)格式得到的数据。
作为本申请所述应用的优选实施方式,所述基因芯片包括检测CAFs相关基因表达水平的探针,所述探针的核苷酸序列如SEQ ID NO:1~7所示。
作为本申请所述应用的优选实施方式,所述前列腺癌生化复发预测模型的构建方法包括以下步骤:
S1、从GEO数据库中获得前列腺癌和癌旁组织的单细胞转录组测序数据,从TCGA数据库和GEO数据库中获得前列腺癌组织样本的基因表达数据和相应临床数据;R软件“limma”和“sva”包对获得的数据进行批次矫正和标准化处理;
S2、利用单细胞转录组测序数据获取CAFs与其它细胞类型间差异表达的基因,以调整后的p值<0.05和log2|fold change|>0.5作为筛选阈值,最终得到CAFs相关基因;
S3、将TCGA数据库中获得的前列腺癌组织样本分为预测模型的训练集和测试集,将GEO数据库中获得的前列腺癌组织样本作为预测模型的验证集;利用训练集的数据,以p<0.05为筛选标准,基于单因素COX回归分析和LASSO回归分析得到与前列腺癌患者生化复发相关的CAFs相关基因,并用于构建预测模型;所述CAFs相关基因为PTGS2基因、FKBP10基因、ENG基因、CDH11基因、COL5A1基因、COL5A2基因和SRD5A2基因;
S4、基于多因素COX回归分析计算CAFs相关基因的系数并建立前列腺癌生化复发预测模型,所述前列腺癌生化复发预测模型的评分公式为:
CAFsRS评分=PTGS2基因的表达水平×(-0.239)+FKBP10基因的表达水平×(0.157)+ENG基因的表达水平×(0.507)+CDH11基因的表达水平×(0.231)+COL5A1基因的表达水平×(0.009)+COL5A2基因的表达水平×(0.506)+SRD5A2基因的表达水平×(-0.583);所述CAFsRS评分与前列腺癌患者术后生化复发相关,CAFsRS评分越高,患者预后越差,术后生化复发时间越短。
当前列腺癌患者CAFsRS评分大于0.828时,属于高风险;小于等于0.828时,属于低风险。
针对当前临床上尚无可靠的、高效的预测前列腺癌患者术后生化复发的模型,本申请利用转录组学和随访数据构建模型用于预测前列腺癌患者术后1年、3年和5年生化复发的概率。通过分析CAFs相关基因与前列腺癌生化复发的关系,构建基于CAFs相关基因的前列腺癌生化复发预测模型,制备用于检测生化复发预测模型内基因表达水平的芯片,可以实现对前列腺癌患者术后生化复发的预测。临床实践中可以通过CAFsRS评分将患者分为高低分险组,为前列腺癌患者疾病监测和随访管理提供数据支持。
作为本申请所述应用的优选实施方式,所述应用中还包括基于训练集、测试集和验证集,将前列腺癌患者的CAFsRS评分的中位数作为截断值,将前列腺癌患者分为高CAFsRS评分组和低CAFsRS评分组;
应用Kaplan-Meier生存曲线分析高CAFsRS评分组和低CAFsRS评分组的前列腺癌患者的生化复发时间是否具有显著差异性;绘制生存状态散点图比较高CAFsRS评分组和低CAFsRS评分组的前列腺癌患者的生化复发状态;绘制ROC曲线,依据曲线下面积AUC值评估CAFsRS评分预测患者1、3、5年生化复发的效能。
作为本申请所述应用的优选实施方式,所述步骤S1中,从GEO数据库的GSE70770和GSE116918中获得前列腺癌组织样本的基因表达数据和相应临床数据。
第二方面,本申请提供了一种检测CAFs相关基因表达水平的试剂在制备预测前列腺癌生化复发预测产品中的应用,所述CAFs相关基因包括PTGS2基因、FKBP10基因、ENG基因、CDH11基因、COL5A1基因、COL5A2基因和SRD5A2基因。
作为本申请所述应用的优选实施方式,所述CAFs相关基因表达水平通过基因芯片检测PTGS2基因、FKBP10基因、ENG基因、CDH11基因、COL5A1基因、COL5A2基因和SRD5A2基因表达水平的结果转换为log2(count+1)格式得到的数据。
作为本申请所述应用的优选实施方式,所述试剂包括检测CAFs相关基因表达水平的探针,所述探针的核苷酸序列如SEQ ID NO:1~7所示。
第三个方面,本申请提供了一种预测前列腺癌生化复发的基因芯片,所述基因芯片包括检测PTGS2基因、FKBP10基因、ENG基因、CDH11基因、COL5A1基因、COL5A2基因和SRD5A2基因的探针,所述探针的核苷酸序列如SEQ ID NO:1~7所示。
本申请构建了含有7个CAFs相关基因的前列腺癌生化复发预测模型,鉴于该模型对生化复发预测的高效价值,设计了一款基于7个CAFs相关基因的基因芯片,对前列腺癌患者的生化复发进行评估,可鉴别预后不良的前列腺癌患者,临床实践中可利用CAFsRS评分对患者进行危险分层,为前列腺癌患者疾病监测和随访管理提供数据支持。
与现有技术相比,本申请具有以下有益效果:
本申请基于前列腺癌患者CAFs相关基因,利用训练集前列腺癌患者转录组测序数据和相应随访数据,应用COX回归分析和LASSO回归分析构建一种基于CAFs相关基因的前列腺癌生化复发预测模型,可将前列腺癌患者分为高CAFsRS评分和低CAFsRS评分组。在训练集中前列腺癌患者的CAFsRS评分与生化复发正相关(P<0.001)。ROC曲线显示,模型预测前列腺癌患者1年、3年和5年生化复发的AUC分别为0.732、0.773和0.775。测试集和验证集结果显示该模型在预测前列腺癌患者根治性手术和根治性放疗术后的生化复发方面具有良好的性能。并构建一款基于CAFs相关基因的基因表达水平检测芯片,为预测前列腺癌患者术后生化方法提供一种可靠工具。
附图说明
图1为前列腺癌中具有预后价值的CAFs相关基因的获取结果图(图1-A:不同的细胞类型的聚类图;图1-B:不同细胞类型的标记基因的表达热图;图1-C:前列腺癌和癌旁组织差异表达的CAFs相关基因火山图;图1-D:用LASSO进行变量选择的10倍交叉验证结果;图1-E:CAFs的LASSO回归曲线);
图2为CAFsRS评分高低风险组的生化复发预测结果图(图2-A:训练集高低分险组的生存曲线;图2-B:测试集高低分险组的生存曲线;图2-C:GSE70770验证集高低分险组的生存曲线;图2-D:GSE116918验证集高低分险组的生存曲线;图2-E:训练集高低分险组的生存状态散点图;图2-F:测试集高低分险组的生存状态散点图;图2-G:GSE70770验证集高低分险组的生存状态散点图;图2-H:GSE116918验证集高低分险组的生存状态散点图;图2-I:训练集的时间依赖ROC曲线;图2-J:测试集的时间依赖ROC曲线;K:GSE70770验证集的时间依赖ROC曲线;图2-L:GSE116918验证集的时间依赖ROC曲线)。
具体实施方式
为更好的说明本申请的目的、技术方案和优点,下面将结合附图和具体实施例对本申请作进一步说明。
在以下实施例中,所使用的实验方法如无特殊说明,均为常规方法,所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1、一种前列腺癌生化复发预测模型及其构建方法
本实施例提供的前列腺癌生化复发预测模型的构建方法,包括以下步骤:
(1)从GEO数据库下载得到4对前列腺癌和癌旁组织的单细胞转录组测序数据。从TCGA数据库和GEO数据库(GSE70770和GSE116918)下载得到833例患者的前列腺癌组织基因表达数据和相应临床数据。R软件“limma”和“sva”包对数据进行批次矫正和标准化处理。
(2)利用单细胞转录组测序数据获取CAFs与其它细胞类型间差异表达的基因(图1-A),以调整后的p值<0.05和log2|fold change|>0.5作为筛选阈值,最终得到CAFs相关基因(图1-B、图1-C)。
(3)利用TCGA数据库前列腺癌样本,按2:1的比例将所有样本为模型构建的训练集和测试集,将GSE70770和GSE116918作为模型的验证集。应用训练集数据构建预测模型,测试集和验证集对模型进行验证。
(4)利用训练集数据,以p<0.05为筛选标准,基于单因素COX回归分析(图1-D)和LASSO回归分析得到PTGS2基因、FKBP10基因、ENG基因、CDH11基因、COL5A1基因、COL5A2基因和SRD5A2基因等7个与前列腺癌患者生化复发相关的CAFs相关基因(图1-E、图1-F),用于构建预测模型。
(5)基于多因素COX回归分析计算每个基因的系数并建立前列腺癌生化复发预测模型;具体为:CAFsRS评分=PTGS2基因的表达水平×(-0.239)+FKBP10基因的表达水平×(0.157)+ENG基因的表达水平×(0.507)+CDH11基因的表达水平×(0.231)+COL5A1基因的表达水平×(0.009)+COL5A2基因的表达水平×(0.506)+SRD5A2基因的表达水平×(-0.583)。
在本实施例中,PTGS2基因、FKBP10基因、ENG基因、CDH11基因、COL5A1基因、COL5A2基因和SRD5A2基因的表达水平是通过基因芯片检测的结果转换为log2(count+1)格式得到的数据,基因芯片包括检测PTGS2基因、FKBP10基因、ENG基因、CDH11基因、COL5A1基因、COL5A2基因和SRD5A2基因表达水平的探针,所述探针的核苷酸序列如SEQ ID NO:1~7所示(如表1所示)。
表1
实施例2、前列腺癌生化复发预测模型的应用
(1)基于训练集、测试集和验证集样本数据(表2),根据实施例1构建得到的生化复发预测模型计算每位前列腺癌患者的CAFsRS评分,以评分的中位数作为截断值将患者分为高CAFsRS评分组和低CAFsRS评分组。当前列腺癌患者CAFsRS评分大于0.828时,属于高风险;小于等于0.828时,属于低风险。
(2)应用Kaplan-Meier生存曲线分析高低CAFsRS评分组前列腺癌患者的生化复发时间是否具有显著差异性(图2-A~图2-D);绘制生存状态散点图比较高低分险组患者的生化复发状态(图2-E~图2-H)。
(3)进一步地,绘制ROC曲线下面积评估CAFsRS评分预测患者1,3和5年生化复发的效能(图2-I~图2-L),曲线下面积AUC的值越大说明模型的预测效能越好。
(4)测试集和验证集结果表明所述前列腺癌患者CAFsRS评分与术后生化复发密切相关,CAFsRS评分越高,患者预后越差,术后生化复发时间越短,与训练数据集具有一致性的趋势。
表2训练集、测试集和验证集样本的基线数据
如图2所示,本申请建立了基于7个CAFs相关基因的前列腺癌生化复发预测模型,可将前列腺癌患者分为高CAFsRS和低CAFsRS组。在训练集中前列腺癌患者的CAFsRS评分与生化复发正相关(P<0.001)。ROC曲线显示,模型预测前列腺癌患者1年、3年和5年生化复发的AUC分别为0.732、0.773和0.775。测试集和验证集结果显示该模型在预测前列腺癌患者根治性手术和根治性放疗术后的生化复发方面具有良好的性能。
最后所应当说明的是,以上实施例仅用以说明本申请的技术方案而非对本申请保护范围的限制,尽管参照较佳实施例对本申请作了详细说明,本领域的普通技术人员应当理解,可以对本申请的技术方案进行修改或者等同替换,而不脱离本申请技术方案的实质和范围。

Claims (10)

1.一种基于CAFs相关基因的前列腺癌生化复发预测模型在预测前列腺癌生化复发中的应用,其特征在于,所述前列腺癌生化复发预测模型的评分公式为:
CAFsRS评分=PTGS2基因的表达水平×(-0.239)+FKBP10基因的表达水平×(0.157)+ENG基因的表达水平×(0.507)+CDH11基因的表达水平×(0.231)+COL5A1基因的表达水平×(0.009)+COL5A2基因的表达水平×(0.506)+SRD5A2基因的表达水平×(-0.583);
所述CAFsRS评分与前列腺癌患者术后生化复发相关,CAFsRS评分越高,患者预后越差,术后生化复发时间越短。
2.如权利要求1所述的应用,其特征在于,所述PTGS2基因、FKBP10基因、ENG基因、CDH11基因、COL5A1基因、COL5A2基因和SRD5A2基因的表达水平是通过基因芯片检测的结果转换为log2(count+1)格式得到的数据。
3.如权利要求2所述的应用,其特征在于,所述基因芯片包括检测CAFs相关基因表达水平的探针,所述探针的核苷酸序列如SEQ ID NO:1~7所示。
4.如权利要求1~3任一项所述的应用,其特征在于,所述前列腺癌生化复发预测模型的构建方法包括以下步骤:
S1、从GEO数据库中获得前列腺癌和癌旁组织的单细胞转录组测序数据,从TCGA数据库和GEO数据库中获得前列腺癌组织样本的基因表达数据和相应临床数据;R软件“limma”和“sva”包对获得的数据进行批次矫正和标准化处理;
S2、利用单细胞转录组测序数据获取CAFs与其它细胞类型间差异表达的基因,以调整后的p值<0.05和log2|fold change|>0.5作为筛选阈值,最终得到CAFs相关基因;
S3、将TCGA数据库中获得的前列腺癌组织样本分为预测模型的训练集和测试集,将GEO数据库中获得的前列腺癌组织样本作为预测模型的验证集;利用训练集的数据,以p<0.05为筛选标准,基于单因素COX回归分析和LASSO回归分析得到与前列腺癌患者生化复发相关的CAFs相关基因,并用于构建预测模型;所述CAFs相关基因为PTGS2基因、FKBP10基因、ENG基因、CDH11基因、COL5A1基因、COL5A2基因和SRD5A2基因;
S4、基于多因素COX回归分析计算CAFs相关基因的系数并建立前列腺癌生化复发预测模型,所述前列腺癌生化复发预测模型的评分公式为:
CAFsRS评分=PTGS2基因的表达水平×(-0.239)+FKBP10基因的表达水平×(0.157)+ENG基因的表达水平×(0.507)+CDH11基因的表达水平×(0.231)+COL5A1基因的表达水平×(0.009)+COL5A2基因的表达水平×(0.506)+SRD5A2基因的表达水平×(-0.583);所述CAFsRS评分与前列腺癌患者术后生化复发相关,CAFsRS评分越高,患者预后越差,术后生化复发时间越短。
5.如权利要求4所述的应用,其特征在于,所述应用中还包括基于训练集、测试集和验证集,将前列腺癌患者的CAFsRS评分的中位数作为截断值,将前列腺癌患者分为高CAFsRS评分组和低CAFsRS评分组;
应用Kaplan-Meier生存曲线分析高CAFsRS评分组和低CAFsRS评分组的前列腺癌患者的生化复发时间是否具有显著差异性;绘制生存状态散点图比较高CAFsRS评分组和低CAFsRS评分组的前列腺癌患者的生化复发状态;绘制ROC曲线,依据曲线下面积AUC值评估CAFsRS评分预测患者1、3、5年生化复发的效能。
6.如权利要求4所述的应用,其特征在于,所述步骤S1中,从GEO数据库的GSE70770和GSE116918中获得前列腺癌组织样本的基因表达数据和相应临床数据。
7.一种检测CAFs相关基因表达水平的试剂在制备预测前列腺癌生化复发预测产品中的应用,其特征在于,所述CAFs相关基因包括PTGS2基因、FKBP10基因、ENG基因、CDH11基因、COL5A1基因、COL5A2基因和SRD5A2基因。
8.如权利要求7所述的应用,其特征在于,所述CAFs相关基因表达水平通过基因芯片检测PTGS2基因、FKBP10基因、ENG基因、CDH11基因、COL5A1基因、COL5A2基因和SRD5A2基因表达水平的结果转换为log2(count+1)格式得到的数据。
9.如权利要求7所述的应用,其特征在于,所述试剂包括检测CAFs相关基因表达水平的探针,所述探针的核苷酸序列如SEQ ID NO:1~7所示。
10.一种预测前列腺癌生化复发的基因芯片,其特征在于,所述基因芯片包括检测PTGS2基因、FKBP10基因、ENG基因、CDH11基因、COL5A1基因、COL5A2基因和SRD5A2基因的探针,所述探针的核苷酸序列如SEQ ID NO:1~7所示。
CN202310837719.XA 2023-07-10 2023-07-10 一种基于CAFs相关基因的前列腺癌生化复发预测模型及其应用 Pending CN116959554A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310837719.XA CN116959554A (zh) 2023-07-10 2023-07-10 一种基于CAFs相关基因的前列腺癌生化复发预测模型及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310837719.XA CN116959554A (zh) 2023-07-10 2023-07-10 一种基于CAFs相关基因的前列腺癌生化复发预测模型及其应用

Publications (1)

Publication Number Publication Date
CN116959554A true CN116959554A (zh) 2023-10-27

Family

ID=88445500

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310837719.XA Pending CN116959554A (zh) 2023-07-10 2023-07-10 一种基于CAFs相关基因的前列腺癌生化复发预测模型及其应用

Country Status (1)

Country Link
CN (1) CN116959554A (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101195825A (zh) * 2007-12-10 2008-06-11 上海华冠生物芯片有限公司 用于乳腺癌预后的基因及其应用
CN112011616A (zh) * 2020-09-02 2020-12-01 复旦大学附属中山医院 预测肝细胞癌肿瘤免疫浸润和术后生存时间的免疫基因预后模型
CN112725454A (zh) * 2021-02-03 2021-04-30 山东第一医科大学附属省立医院(山东省立医院) 膀胱癌患者总体生存率预后模型
WO2021230663A1 (ko) * 2020-05-12 2021-11-18 서울대학교산학협력단 초기 유방암 환자의 예후 예측 방법
CN115482880A (zh) * 2022-09-22 2022-12-16 山西省肿瘤医院 一种头颈鳞癌糖酵解相关基因预后模型及构建方法和应用
CN115588507A (zh) * 2022-09-02 2023-01-10 山西省肿瘤医院 一种肺腺癌emt相关基因的预后模型及构建方法和应用
WO2023040102A1 (zh) * 2021-09-16 2023-03-23 浙江大学 判断肝细胞肝癌患者预后的基因模型、构建方法和应用
CN116153387A (zh) * 2023-01-16 2023-05-23 山西省肿瘤医院 一种肺鳞癌患者总体生存率预后模型及应用
CN116230081A (zh) * 2022-12-22 2023-06-06 中国科学院合肥肿瘤医院 一种用于肺腺癌预后预测的生物标志物、应用及模型构建方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101195825A (zh) * 2007-12-10 2008-06-11 上海华冠生物芯片有限公司 用于乳腺癌预后的基因及其应用
WO2021230663A1 (ko) * 2020-05-12 2021-11-18 서울대학교산학협력단 초기 유방암 환자의 예후 예측 방법
CN112011616A (zh) * 2020-09-02 2020-12-01 复旦大学附属中山医院 预测肝细胞癌肿瘤免疫浸润和术后生存时间的免疫基因预后模型
CN112725454A (zh) * 2021-02-03 2021-04-30 山东第一医科大学附属省立医院(山东省立医院) 膀胱癌患者总体生存率预后模型
WO2023040102A1 (zh) * 2021-09-16 2023-03-23 浙江大学 判断肝细胞肝癌患者预后的基因模型、构建方法和应用
CN115588507A (zh) * 2022-09-02 2023-01-10 山西省肿瘤医院 一种肺腺癌emt相关基因的预后模型及构建方法和应用
CN115482880A (zh) * 2022-09-22 2022-12-16 山西省肿瘤医院 一种头颈鳞癌糖酵解相关基因预后模型及构建方法和应用
CN116230081A (zh) * 2022-12-22 2023-06-06 中国科学院合肥肿瘤医院 一种用于肺腺癌预后预测的生物标志物、应用及模型构建方法
CN116153387A (zh) * 2023-01-16 2023-05-23 山西省肿瘤医院 一种肺鳞癌患者总体生存率预后模型及应用

Similar Documents

Publication Publication Date Title
Biswas et al. A clonal expression biomarker associates with lung cancer mortality
Chen et al. Co-expression network analysis identified FCER1G in association with progression and prognosis in human clear cell renal cell carcinoma
US10494677B2 (en) Predicting cancer outcome
CN103299188B (zh) 用于癌症的分子诊断试验
CN110577998A (zh) 预测肝癌术后早期复发风险分子模型的构建及其应用评估
CN111833965B (zh) 一种尿沉渣基因组dna的分类方法、装置和用途
AU2009246256A1 (en) Biomarkers for the identification, monitoring, and treatment of head and neck cancer
CN1484806A (zh) 基于隐含模式用于从生物数据中识别生物状态的方法
CN111575376A (zh) 一组用于评估肾透明细胞癌预后的联合基因组及其应用
CN111653314B (zh) 一种分析识别淋巴管浸润的方法
CN111564214A (zh) 一种基于7个特殊基因的乳腺癌预后评估模型的建立与验证方法
CN108559777B (zh) 一种新型分子标记及其在制备用于肾透明细胞癌诊断和预后的试剂盒中的应用
CN113066585A (zh) 一种基于免疫基因表达特征谱对ⅱ期结直肠癌患者预后进行高效快捷评估的方法
CN115575636A (zh) 一种用于肺癌检测的生物标志物及其系统
CN115144599A (zh) 蛋白组合在制备对儿童甲状腺癌进行预后分层的试剂盒中的用途及其试剂盒、系统
CN115881296B (zh) 一种甲状腺乳头状癌(ptc)风险辅助分层系统
CN104975082A (zh) 一组用于评估肺癌预后的基因及其应用
CN109735619B (zh) 与非小细胞肺癌预后相关的分子标志物及其应用
CN115128285B (zh) 一种蛋白质组合对甲状腺滤泡性肿瘤鉴别评估的试剂盒、系统
CN116013525A (zh) 一种基于铁死亡特征构建的结直肠癌预后模型及其构建方法
CN116959554A (zh) 一种基于CAFs相关基因的前列腺癌生化复发预测模型及其应用
CN113774135B (zh) 一组用于预测高级别浆液性卵巢癌预后的标志物及其应用
CN114171200A (zh) Ptc预后标志物及其应用、ptc的预后评估模型的构建方法
WO2014052930A2 (en) Biomarkers for prostate cancer prognosis
CN112375832A (zh) 一种用于表征肺腺癌气阴两虚证的肠道菌群组合及筛选及模型建立方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination