CN113539376A - 判断肝细胞肝癌患者预后的基因模型、构建方法和应用 - Google Patents

判断肝细胞肝癌患者预后的基因模型、构建方法和应用 Download PDF

Info

Publication number
CN113539376A
CN113539376A CN202111089547.XA CN202111089547A CN113539376A CN 113539376 A CN113539376 A CN 113539376A CN 202111089547 A CN202111089547 A CN 202111089547A CN 113539376 A CN113539376 A CN 113539376A
Authority
CN
China
Prior art keywords
expression level
prognosis
model
gene
liver cancer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111089547.XA
Other languages
English (en)
Other versions
CN113539376B (zh
Inventor
徐俊杰
蔡秀军
茅琪江
潘浩奇
梁霄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202111089547.XA priority Critical patent/CN113539376B/zh
Publication of CN113539376A publication Critical patent/CN113539376A/zh
Priority to PCT/CN2021/139502 priority patent/WO2023040102A1/zh
Application granted granted Critical
Publication of CN113539376B publication Critical patent/CN113539376B/zh
Priority to US18/358,001 priority patent/US20240021268A1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Data Mining & Analysis (AREA)
  • Chemical & Material Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Genetics & Genomics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Primary Health Care (AREA)
  • Organic Chemistry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Immunology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Microbiology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种判断肝细胞肝癌预后的基因模型及其构建方法和应用。本发明通过比较肝细胞肝癌患者样本的数据和正常患者样本的转录组数据,得到具有差异表达的基因,与细胞外基质基因集整合后通过LASSO‑COX回归模型缩小得到一个18个基因的模型。本发明模型可以对肝细胞肝癌患者的预后进行评估,区分并甄选出预后差的肝细胞肝癌患者,从而指导临床医生提供更积极的治疗方案,同时也能避免对低风险的肝细胞肝癌患者进行过度治疗。通过该基因模型有助于构建一款基于细胞外基质基因的组织芯片,能够对肝细胞肝癌术后患者快速进行预后进行评估,实现临床转化。

Description

判断肝细胞肝癌患者预后的基因模型、构建方法和应用
技术领域
本发明属于生物医学技术领域,具体涉及一种用于判断肝细胞肝癌患者预后的基因模型及应用。
背景技术
肝癌是世界范围内最常见的十大恶性肿瘤之一。全球每年约有50万新增病例,其中肝细胞肝癌占85%。随着肿瘤标志物与影像学检查的推广、外科手术水平和多种新型治疗方式如动脉内化疗栓塞等的发展,原发性肝癌(hepatic cell carcinoma,HCC)的5年生存率有所改善。但总体来说,肝细胞肝癌的预后仍然不尽如人意。其中主要原因之一就是缺少有效的预测肝细胞肝癌患者预后的标志物,从而无法将肝细胞肝癌患者进行风险分层,无法指导临床医生对高风险肝细胞肝癌患者进行早干预早治疗。当前研究表明,肿瘤微环境,尤其是细胞外基质,能够促进肿瘤的生长、侵袭和转移,对肿瘤患者的预后具有较大的影响。
发明内容
针对当前临床缺少有效的判断肝细胞肝癌患者预后的标志物,无法对肝细胞性肝癌患者预后进行判断,本发明从基因层面构建基因组合模型来评估肝细胞肝癌患者的预后,通过对肝细胞肝癌患者的细胞外基质相关基因进行整合分析,从而构建相关基因组合模型,构建一款基于细胞外基质基因的组织芯片,可以实现通过风险评分对肝细胞肝癌患者的预后进行评估。评估得到的结果有助于临床医生对肝癌患者进行分层,为肝细胞肝癌患者的精准治疗提供了可能性。
本发明采用的方案具体如下:
一种判断肝细胞肝癌患者预后的基因模型的构建方法,包括如下步骤:
(1)、获取肝细胞肝癌和正常肝脏组织样本的转录组数据,比较肝细胞肝癌组织样本的数据和正常肝脏组织样本的数据中的差异基因,设定P-value<0.05得到具有显著差异的基因,并将具有显著差异的基因与细胞外基质基因集(559个细胞外基质相关基因)进行整合;
(2)、随后使用LASSO方法进行分析,基于R语言glmnet包使用1000次Cox LASSO回归迭代和10倍交叉验证,将种子基因缩小为18个与HCC预后相关的ECM基因集,包括:MMP1、EPO、MMRN1、S100A9、ADAM9、GPC1、SPP1、GLDN、FGF9、CXCL5、CST7、THBS3、ANXA10、PIK3IP1、MMP25、CLEC3B、PZP和CLEC17A的18个基因组合(表1),并以 18个基因为标志物构建获得肝细胞肝癌预后预测风险评分模型。
一种上述构建方法构建获得的基因模型,具体为:
肝细胞肝癌患者风险评分=(0.069× MMP1表达水平)+(0.049×EPO表达水平)+(0.042×MMRN1表达水平)+(0.036×S100A9表达水平)+(0.027×ADAM9表达水平)+(0.024×GPC1表达水平)+(0.021×SPP1表达水平)+(0.014×GLDN表达水平)+(0.007×FGF9表达水平)+(0.001×CXCL5表达水平)-(0.024×CST7表达水平)-(0.027×THBS3表达水平)-(0.042×ANXA10表达水平)-(0.049×PIK3IP1表达水平)-(0.051×MMP25表达水平)-(0.054×CLEC3B表达水平)-(0.062×PZP表达水平)-(0.069×CLEC17A表达水平)。
进一步地,将TCGA数据库作为训练集,GEO数据库和ICGC数据库作为验证集,对所述基因模型的风险评分进行分析并通过CLIP分期和TMN分期对基因模型进行验证,表明所述肝细胞肝癌患者风险评分与生存期相关,风险评分高的患者生存期短、预后差。
一种上述基因模型在评估肝细胞肝癌预后中的应用。
一种基于细胞外基质基因的组织芯片,所述组织芯片包含检测MMP1、EPO、MMRN1、S100A9、ADAM9、GPC1、SPP1、GLDN、FGF9、CXCL5、CST7、THBS3、ANXA10、PIK3IP1、MMP25、CLEC3B、PZP和CLEC17A的探针。为肝细胞肝癌患者提供精准治疗提供了可能性。能够对肝细胞肝癌术后患者快速进行预后评估,实现临床转化。
本发明的有益效果是:本发明构建了18个基因的基因组合模型,通过该基因模型可以构建一款基于细胞外基质基因的组织芯片,对肝细胞肝癌患者的预后进行评估,能够区分并甄选出预后差的肝细胞肝癌患者,即将肝细胞肝癌患者进行分层,筛选出高风险、预后差的肝细胞肝癌患者,指导临床医生对高风险患者提供更积极的治疗方案,同时也能避免对低风险的肝细胞肝癌患者进行过度治疗。
附图说明
下面结合附图和实施例对本发明进一步说明;
图1为本发明的基因模型的差异基因火山图;
图2为本发明的基因模型的LASSO-Cox回归模型构建图;
图3为本发明的18个基因的组合基因模型图;
图4为训练集TCGA中肝细胞肝癌患者的风险评分分布图;其中横坐标为根据风险评分递增的患者序号,虚线为截断值;
图5为训练集TCGA中肝细胞肝癌患者的生存期分布图;其中横坐标为根据风险评分递增的患者序号,190附近虚线为截断值,120附近和250附近为死亡和存活差异明显的分界线;
图6为验证集GEO中肝细胞肝癌患者的生存期分布图;其中横坐标为根据风险评分递增的患者序号,虚线为截断值;
图7为验证集ICGC中肝细胞肝癌患者的生存期分布图;其中横坐标为根据风险评分递增的患者序号,虚线为截断值;
图8为训练集TCGA中肝细胞肝癌患者不同CLIP分期的风险评分结果图;
图9为训练集TCGA中肝细胞肝癌患者不同TMN分期的风险评分结果图;
图10为训练集TCGA中基于本发明基因模型分组后肝细胞肝癌患者预后与生存期的关系图;
图11为训练集TCGA中基于本发明基因模型分组的肝细胞肝癌患者预后的敏感性和特异性结果图;
图12为验证集GEO中基于本发明基因模型分组的肝细胞肝癌患者预后与生存期的关系图;
图13为验证集ICGA中基于本发明基因模型分组的肝细胞肝癌患者预后与生存期的关系图。
具体实施方式
本发明提供了一种基于细胞外基质基因预测肝细胞肝癌预后的基因模型及应用。即针对肝细胞肝癌患者细胞外基质的差异基因,利用数据库中的肝细胞肝癌组织样本及正常肝脏组织样本数据和统计学分析建立肝细胞肝癌预后的风险模型,能够作为预测肝细胞肝癌患者预后的基因模型,从而构建一款基于细胞外基质基因的组织芯片,有助于对肝细胞肝癌术后患者预后进行评估。其中肝细胞肝癌组织样本纳入及排除的标准为:
(1)术前未曾接受过其他癌症治疗;
(2)无其他恶性肿瘤病史;
(3)具有完善的临床病理资料和随访信息。
下面结合具体的实施例对本发明的效果作进一步说明。
实施例1:构建用于判断肝细胞肝癌患者预后的基因模型
本发明的用于判断肝细胞肝癌患者预后的基因模型,通过如下步骤构建获得:
(1)、先从TCGA数据库(https://portal.gdc.cancer.gov/)中下载371例肝细胞肝癌组织样本和50例正常肝脏组织样本的转录组数据及对应患者的临床信息(包括性别、总生存时间、生存状态等),比较TCGA数据库中肝细胞肝癌组织样本的数据与正常肝脏组织样本中的差异基因,设定P-value<0.05,得到具有显著差异的基因,并将具有显著差异的基因与559个细胞外基质(ECM)相关基因进行整合(见图1)。
(2)、随后使用LASSO方法进行分析,基于R语言glmnet包使用1000次Cox LASSO回归迭代和10倍交叉验证,筛选出有统计意义的18个与ECM相关的候选基因及这些基因的预后AUC、HR值(见表1和图2)。将Cox LASSO回归模型的系数作为权重,构建出一个基于包含MMP1、EPO、MMRN1、S100A9、ADAM9、GPC1、SPP1、GLDN、FGF9、CXCL5、CST7、THBS3、ANXA10、PIK3IP1、MMP25、CLEC3B、PZP和CLEC17A 18个基因为标志物的肝细胞肝癌预后预测风险评分模型(见图3)。
所述肝细胞肝癌预后预测风险评分模型具体为:肝细胞肝癌患者风险评分=(0.069× MMP1表达水平)+(0.049×EPO表达水平)+(0.042×MMRN1表达水平)+(0.036×S100A9表达水平)+(0.027×ADAM9表达水平)+(0.024×GPC1表达水平)+(0.021×SPP1表达水平)+(0.014×GLDN表达水平)+(0.007×FGF9表达水平)+(0.001×CXCL5表达水平)-(0.024×CST7表达水平)-(0.027×THBS3表达水平)-(0.042×ANXA10表达水平)-(0.049×PIK3IP1表达水平)-(0.051×MMP25表达水平)-(0.054×CLEC3B表达水平)-(0.062×PZP表达水平)-(0.069×CLEC17A表达水平)。
表1 LASSO回归模型后得到的18个ECM基因
Figure 149487DEST_PATH_IMAGE001
实施例2:肝细胞肝癌预后预测风险评分模型在评估肝细胞肝癌预后中的应用
将TCGA数据库371例肝细胞肝癌组织样本转录组数据作为训练集,GEO数据库(https://www.ncbi.nlm.nih.gov/geo/)GSE140520中247例肝细胞肝癌组织和ICGC数据库(https://daco.icgc.org/)的203例肝细胞肝癌组织的数据作为验证集,根据风险评分模型分别计算训练集每个肝细胞肝癌患者的评分,取评分的中位数(0.044954)作为截断值将其分为高风险分值组和低风险分值组,绘制两组患者的风险评分和生存期、CLIP分期和TMN分期的关系图(图4-8),验证肝细胞肝癌预后预测风险评分模型的效果。其中,图4和图5为训练集TCGA中肝细胞肝癌患者根据截断值的风险评分分布图和生存期分布图,图6和图7为验证集GEO和ICGC中肝细胞肝癌患者根据截断值的生存期分布图,图8和图9为训练集TCGA中肝细胞肝癌患者不同CLIP分期和TMN分期的风险评分结果,可以看到风险评分越高,患者存活率越高,CLIP分期与TMN分期越高,表明该模型具有良好的肝细胞肝癌分型效果。
进一步地,通过ROC曲线评估模型的预测性能:图10为训练集TCGA数据库中肝细胞肝癌患者的预后与生存期的关系图,其中高风险分值组的肝细胞肝癌患者的生存期短,预后较低风险分值组患者差(见图10),图11、表2为该模型验证HCC预后的敏感性和特异性结果,风险模型的3年AUC为0.81,敏感性为73.7%,特异性为75%;5年AUC为0.79,敏感性为77.3%,特异性为71.7%;用GEO数据库(https://www.ncbi.nlm.nih.gov/geo/)GSE140520中247例肝细胞肝癌组织和ICGC数据库中的203例肝细胞肝癌组织的数据作为验证集进行验证(见图12和图13),结果与TCGA数据库中结果一致,表3为该模型在GEO数据库中验证HCC预后的敏感性和特异性结果,风险模型的3年AUC为0.626,敏感性为68.8%,特异性为55.8%;5年AUC为0.625,敏感性为60.0%,特异性为34.7%;表4为该模型在ICGC数据库钟验证HCC预后的敏感性和特异性结果,风险模型的3年AUC为0.723,敏感性为93.3%,特异性为52.7%;5年AUC为0.717,敏感性为88.9%,特异性为52.3%;风险评分高的患者生存期短、预后差。表明本发明的肝细胞肝癌预后预测风险评分模型可以用于评估肝细胞肝癌预后。
表2 TCGA数据库风险模型的敏感性和特异性检验结果
Figure 4310DEST_PATH_IMAGE002
表3 GEO数据库风险模型的敏感性和特异性检验结果
Figure 252889DEST_PATH_IMAGE003
表4 ICGC数据库风险模型的敏感性和特异性检验结果
风险模型 AUC 敏感性 特异性
3年ROC 0.723 93.3% 52.7%
5年ROC 0.717 88.9% 52.3%
本发明还提供了一种基因芯片,即:将检测MMP1、EPO、MMRN1、S100A9、ADAM9、GPC1、SPP1、GLDN、FGF9、CXCL5、CST7、THBS3、ANXA10、PIK3IP1、MMP25、CLEC3B、PZP和CLEC17A 18个基因的探针按上述模型构建成基因芯片,便于在临床中应用,其中,各基因探针序列优选如表5所示,针对一个基因的多个探针,可以选择探针测试结果的平均值作为该基因最终的表达水平。
表5基因芯片各基因探针序列
Figure 133251DEST_PATH_IMAGE004
Figure 88569DEST_PATH_IMAGE005
上述对具体实施方式的描述是为了便于该技术领域的普通技术人员能理解和使用本发明。熟悉本领域技术人员显然可以容易的对这些具体实施方式做出各种修改,并把在此说明的一般原理应用到其他实施例中,而不必经过创造性的劳动。因此,本发明不限于上述具体实施方式。本领域技术人员根据本发明的原理,不脱离本发明的范畴所做出的改进和修改都应该在本发明的保护范围之内。
序列表
<110> 浙江大学
<120> 判断肝细胞肝癌患者预后的基因模型、构建方法和应用
<160> 24
<170> SIPOSequenceListing 1.0
<210> 1
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
ggatctggag atgggccgat aaagtcagta cgcaaaagaa gagtacgaaa ggactaaact 60
<210> 2
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
gaaccatgaa gacaggatgg gggctggcct ctggctctca tggggtccaa gttttgtgta 60
<210> 3
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gcttgcattt gagtctgaaa atattaacag tgaaatacac tgtgataggg ttttaactgg 60
<210> 4
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
cacaaatgca gacaagcagc tgagcttcga ggagttcatc atgctgatgg cgaggctaac 60
<210> 5
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
atttccgttt ccatcattga ataagtctta ttcagtcatc ggtgaggtta atgcactaat 60
<210> 6
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
aggtccccgg ttgctggtca ggtccccatg gcttgttctc tggaacctga ctttagatgt 60
<210> 7
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
ttttgaagat aaaccgaaac cttccaaaca gtcacttcag tcttaccaag aggctttgca 60
<210> 8
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
tcttggcccc tgtgtgaatt cctgcctttc ccagaaatga gtccagggtg tctgacctca 60
<210> 9
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
gcacgttgtt tacaacaact ctctctacta ccacaaaggg ggttctaata ccctagtgag 60
<210> 10
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
caaaaggact gcggcctgat gcatgctgga aaaagacacg cttttcattt ctgatcagtt 60
<210> 11
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
tttgctgtta ttttatctgc tatgctattg aagttttggc aattgactat agtgtgagcc 60
<210> 12
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
catcacaagg gccctagttc agatagtgaa aggcctgaaa tatatgctgg aggtggaaat 60
<210> 13
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
ggggcgtctt ggtgtattct gcttctccca agaaaacata atttggtcca atctccagta 60
<210> 14
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
tggtgatgct gaggactact aaaatgaaga ggacttggag tactgtgcac tcctctttct 60
<210> 15
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
tttgtgttct ggttaaaacc ctaccactcc cccgcttttt tggcgaatcc tagtaagagt 60
<210> 16
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
aaggaaagat tgtaatctca cctccagatc cataggcttc tgctaggagc atgttgctga 60
<210> 17
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
aaatctcacc atatccattt gacttaggcc ttttggagtt aggcagaagg gcccttcttc 60
<210> 18
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
ccaacctcag tggttcagtg gtgtctgcaa aatgcatcca tcctgccatc tgagtagcag 60
<210> 19
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
atgagaagac atggaatgtt ggaagcagca accgaaacaa agctgaaaac ctgttgcgag 60
<210> 20
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
tttgtgttct ggttaaaacc ctaccactcc cccgcttttt tggcgaatcc tagtaagagt 60
<210> 21
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
ctgtgtgttc tctggatctt ttcagccctg tggtccagtg tccatcacag ccatgctgac 60
<210> 22
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
tcctctccgt gcgcttggag cctctttttg caaataaagt tggtgcagct tcgcggagag 60
<210> 23
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
ctggttttat tcccctgaaa ccaacagtaa aaatgcttga aagatctagc tctgtgagcc 60
<210> 24
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
acattgcccg tgtaagagct gacaccaacc agtccctggt ggaactttgg ggcttattag 60

Claims (5)

1.一种判断肝细胞肝癌患者预后的基因模型的构建方法,其特征在于,包括如下步骤:
(1)、获取肝细胞肝癌和正常肝脏组织样本的转录组数据,比较肝细胞肝癌组织样本的数据和正常肝脏组织样本的数据中的差异基因,设定P-value<0.05得到具有显著差异的基因,并将具有显著差异的基因与细胞外基质基因集进行整合;
(2)、通过LASSO-Cox回归模型进一步缩小步骤(1)整合后的差异基因范围,得到包含MMP1、EPO、MMRN1、S100A9、ADAM9、GPC1、SPP1、GLDN、FGF9、CXCL5、CST7、THBS3、ANXA10、PIK3IP1、MMP25、CLEC3B、PZP和CLEC17A的18个基因组合,并以 18个基因为标志物构建获得判断肝细胞肝癌患者预后的基因模型。
2.一种权利要求1所述构建方法构建获得的基因模型,其特征在于,具体为:
肝细胞肝癌患者风险评分=(0.069× MMP1表达水平)+(0.049×EPO表达水平)+(0.042×MMRN1表达水平)+(0.036×S100A9表达水平)+(0.027×ADAM9表达水平)+(0.024×GPC1表达水平)+(0.021×SPP1表达水平)+(0.014×GLDN表达水平)+(0.007×FGF9表达水平)+(0.001×CXCL5表达水平)-(0.024×CST7表达水平)-(0.027×THBS3表达水平)-(0.042×ANXA10表达水平)-(0.049×PIK3IP1表达水平)-(0.051×MMP25表达水平)-(0.054×CLEC3B表达水平)-(0.062×PZP表达水平)-(0.069×CLEC17A表达水平)。
3.根据权利要求2所述的基因模型,其特征在于,所述肝细胞肝癌患者风险评分与生存期相关,风险评分高的患者生存期短、预后差。
4.一种权利要求2所述基因模型在判断肝细胞肝癌预后中的应用。
5.一种基于细胞外基质基因的组织芯片,其特征在于,所述组织芯片包含检测MMP1、EPO、MMRN1、S100A9、ADAM9、GPC1、SPP1、GLDN、FGF9、CXCL5、CST7、THBS3、ANXA10、PIK3IP1、MMP25、CLEC3B、PZP和CLEC17A的探针。
CN202111089547.XA 2021-09-16 2021-09-16 判断肝细胞肝癌患者预后的基因模型、构建方法和应用 Active CN113539376B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202111089547.XA CN113539376B (zh) 2021-09-16 2021-09-16 判断肝细胞肝癌患者预后的基因模型、构建方法和应用
PCT/CN2021/139502 WO2023040102A1 (zh) 2021-09-16 2021-12-20 判断肝细胞肝癌患者预后的基因模型、构建方法和应用
US18/358,001 US20240021268A1 (en) 2021-09-16 2023-07-24 Gene model for judging prognosis of hepatocellular carcinoma patients, construction method and use thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111089547.XA CN113539376B (zh) 2021-09-16 2021-09-16 判断肝细胞肝癌患者预后的基因模型、构建方法和应用

Publications (2)

Publication Number Publication Date
CN113539376A true CN113539376A (zh) 2021-10-22
CN113539376B CN113539376B (zh) 2022-01-18

Family

ID=78092777

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111089547.XA Active CN113539376B (zh) 2021-09-16 2021-09-16 判断肝细胞肝癌患者预后的基因模型、构建方法和应用

Country Status (3)

Country Link
US (1) US20240021268A1 (zh)
CN (1) CN113539376B (zh)
WO (1) WO2023040102A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114672569A (zh) * 2022-05-24 2022-06-28 浙江大学医学院附属第一医院 基于色氨酸代谢基因的肝癌预后评估方法
CN115019953A (zh) * 2022-05-20 2022-09-06 中山大学附属第一医院 基于基因表达量预测肝细胞癌治疗反应性模型的构建方法
CN115019880A (zh) * 2022-05-05 2022-09-06 中山大学附属第一医院 一种基于ddr和icd基因表达的肝癌预后模型及其构建方法和应用
WO2023040102A1 (zh) * 2021-09-16 2023-03-23 浙江大学 判断肝细胞肝癌患者预后的基因模型、构建方法和应用
CN118098378A (zh) * 2024-04-28 2024-05-28 浙江大学医学院附属邵逸夫医院 一种识别肝细胞肝癌新亚型的基因模型构建方法及应用

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116403076B (zh) * 2023-06-06 2023-08-22 中国科学院深圳先进技术研究院 一种基于dti序列对gbm患者进行风险分层的方法及系统
CN116741271A (zh) * 2023-06-09 2023-09-12 唐山市人民医院 一种食管鳞癌预后预测风险模型的构建方法及其应用
CN116959554A (zh) * 2023-07-10 2023-10-27 中山大学孙逸仙纪念医院 一种基于CAFs相关基因的前列腺癌生化复发预测模型及其应用
CN118256622A (zh) * 2024-03-25 2024-06-28 中山大学附属第一医院 新型标志物及其在肝癌预后评估中的应用
CN118380153B (zh) * 2024-05-06 2024-09-24 重庆市人口和计划生育科学技术研究院 基于铜死亡相关基因的肝癌预后模型及其构建方法和应用

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105063049A (zh) * 2015-08-14 2015-11-18 上海缔达生物科技有限公司 用于肝癌预后评估的微小核酸序列、探针以及试剂盒
CN108630317A (zh) * 2018-05-09 2018-10-09 中国科学院昆明动物研究所 一种基于多基因表达特征谱的肝癌个性化预后评估方法
US20190040469A1 (en) * 2015-09-11 2019-02-07 The Board Of Trustees Of The Leland Stanford Junior University Method of determining the prognosis of hepatocellular carcinomas using a multigene signature associated with metastasis
US20190300965A1 (en) * 2016-07-06 2019-10-03 Youhealth Biotech, Limited Liver cancer methylation markers and uses thereof
CN110499364A (zh) * 2019-07-30 2019-11-26 北京凯昂医学诊断技术有限公司 一种用于检测扩展型遗传病全外显子的探针组及其试剂盒和应用
CN111279195A (zh) * 2017-10-16 2020-06-12 生物预测公司 原发性肝癌的预后和随访方法
CN111402949A (zh) * 2020-04-17 2020-07-10 北京恩瑞尼生物科技股份有限公司 一种肝细胞肝癌患者诊断、预后和复发统一模型的构建方法
CN113241181A (zh) * 2021-06-29 2021-08-10 北京泱深生物信息技术有限公司 一种用于肝癌患者的预后风险评估模型及评估装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101560554B (zh) * 2009-03-06 2011-05-04 复旦大学附属中山医院 一种肝细胞肝癌术后复发预测基因芯片
CN102191323B (zh) * 2011-04-12 2013-02-13 复旦大学附属中山医院 预测肝癌术后生存的实时定量pcr微阵列芯片试剂盒
CN113539376B (zh) * 2021-09-16 2022-01-18 浙江大学 判断肝细胞肝癌患者预后的基因模型、构建方法和应用

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105063049A (zh) * 2015-08-14 2015-11-18 上海缔达生物科技有限公司 用于肝癌预后评估的微小核酸序列、探针以及试剂盒
US20190040469A1 (en) * 2015-09-11 2019-02-07 The Board Of Trustees Of The Leland Stanford Junior University Method of determining the prognosis of hepatocellular carcinomas using a multigene signature associated with metastasis
US20190300965A1 (en) * 2016-07-06 2019-10-03 Youhealth Biotech, Limited Liver cancer methylation markers and uses thereof
CN111279195A (zh) * 2017-10-16 2020-06-12 生物预测公司 原发性肝癌的预后和随访方法
CN108630317A (zh) * 2018-05-09 2018-10-09 中国科学院昆明动物研究所 一种基于多基因表达特征谱的肝癌个性化预后评估方法
CN110499364A (zh) * 2019-07-30 2019-11-26 北京凯昂医学诊断技术有限公司 一种用于检测扩展型遗传病全外显子的探针组及其试剂盒和应用
CN111402949A (zh) * 2020-04-17 2020-07-10 北京恩瑞尼生物科技股份有限公司 一种肝细胞肝癌患者诊断、预后和复发统一模型的构建方法
CN113241181A (zh) * 2021-06-29 2021-08-10 北京泱深生物信息技术有限公司 一种用于肝癌患者的预后风险评估模型及评估装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023040102A1 (zh) * 2021-09-16 2023-03-23 浙江大学 判断肝细胞肝癌患者预后的基因模型、构建方法和应用
CN115019880A (zh) * 2022-05-05 2022-09-06 中山大学附属第一医院 一种基于ddr和icd基因表达的肝癌预后模型及其构建方法和应用
CN115019880B (zh) * 2022-05-05 2024-01-09 中山大学附属第一医院 一种肝癌预后模型及其构建方法和应用
CN115019953A (zh) * 2022-05-20 2022-09-06 中山大学附属第一医院 基于基因表达量预测肝细胞癌治疗反应性模型的构建方法
CN114672569A (zh) * 2022-05-24 2022-06-28 浙江大学医学院附属第一医院 基于色氨酸代谢基因的肝癌预后评估方法
CN118098378A (zh) * 2024-04-28 2024-05-28 浙江大学医学院附属邵逸夫医院 一种识别肝细胞肝癌新亚型的基因模型构建方法及应用

Also Published As

Publication number Publication date
WO2023040102A1 (zh) 2023-03-23
CN113539376B (zh) 2022-01-18
US20240021268A1 (en) 2024-01-18

Similar Documents

Publication Publication Date Title
CN113539376B (zh) 判断肝细胞肝癌患者预后的基因模型、构建方法和应用
CN109897899B (zh) 一种用于局部晚期食管鳞癌预后判断的标志物及其应用
CN110577998A (zh) 预测肝癌术后早期复发风险分子模型的构建及其应用评估
CN110423816B (zh) 乳腺癌预后量化评估系统及应用
ES2938766T3 (es) Firmas génicas para el pronóstico de cáncer
CN109830264B (zh) 肿瘤患者基于甲基化位点进行分类的方法
CN111128385B (zh) 一种用于食管鳞癌的预后预警系统及其应用
CN104046624B (zh) 用于肺癌预后的基因及其应用
CN110580956A (zh) 一组肝癌预后标志物及其应用
JP2016073287A (ja) 腫瘍特性及びマーカーセットの同定のための方法、腫瘍分類、並びに癌のマーカーセット
WO2020157508A1 (en) Method of predicting survival rates for cancer patients
CN104031915A (zh) 用于结直肠癌预后的基因片段及其应用
CN115992229A (zh) 一种胰腺癌预后风险评估的lncRNA标记物、模型及其应用
WO2022156610A1 (zh) 基于基因检测判断肝癌药物敏感性和远期预后的预测工具及其应用
CN113584175A (zh) 一组评估肾乳头状细胞癌进展风险的分子标记及其筛选方法和应用
CN104975082A (zh) 一组用于评估肺癌预后的基因及其应用
CN116769914A (zh) 一种预测胶质瘤预后的标志物及其应用
CN108220445A (zh) 一种评价三阴性乳腺癌风险评估方法
CN114171200A (zh) Ptc预后标志物及其应用、ptc的预后评估模型的构建方法
CN106119406A (zh) 多发性肉芽肿血管炎及微小动脉炎的基因分型诊断试剂盒及使用方法
Druskin et al. INCORPORATING PROSTATE HEALTH INDEX DENSITY, MRI, AND PRIOR NEGATIVE BIOPSY STATUS TO IMPROVE THE DETECTION OF CLINICALLY SIGNIFICANT PROSTATE CANCER: MP35-08
CN110760584A (zh) 前列腺癌疾病进展生物标志物及其应用
CN116287252B (zh) 长链非编码rna apcdd1l-dt在制备检测胰腺癌的产品中的应用
CN116403648B (zh) 一种基于多维分析建立的小细胞肺癌免疫新分型方法
CN116790757A (zh) 一种用于检测肺腺癌不同亚型巨噬细胞浸润水平及预测患者预后的试剂盒

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Xu Junjie

Inventor after: Cai Xiujun

Inventor after: Mao Qijiang

Inventor after: Pan Haoqi

Inventor after: Liang Xiao

Inventor before: Xu Junjie

Inventor before: Cai Xiujun

Inventor before: Mao Qijiang

Inventor before: Pan Haoqi

Inventor before: Liang Xiao