CN108648826B - 一种基于多基因表达特征谱的胰腺癌个性化预后评估方法 - Google Patents

一种基于多基因表达特征谱的胰腺癌个性化预后评估方法 Download PDF

Info

Publication number
CN108648826B
CN108648826B CN201810440131.XA CN201810440131A CN108648826B CN 108648826 B CN108648826 B CN 108648826B CN 201810440131 A CN201810440131 A CN 201810440131A CN 108648826 B CN108648826 B CN 108648826B
Authority
CN
China
Prior art keywords
gene
patient
pancreatic cancer
survival
risk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810440131.XA
Other languages
English (en)
Other versions
CN108648826A (zh
Inventor
李功华
李文兴
黄京飞
赵旭东
代绍兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming Institute of Zoology of CAS
Original Assignee
Kunming Institute of Zoology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming Institute of Zoology of CAS filed Critical Kunming Institute of Zoology of CAS
Priority to CN201810440131.XA priority Critical patent/CN108648826B/zh
Publication of CN108648826A publication Critical patent/CN108648826A/zh
Application granted granted Critical
Publication of CN108648826B publication Critical patent/CN108648826B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Public Health (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Primary Health Care (AREA)
  • Pathology (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Bioethics (AREA)
  • Physiology (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了一种基于多基因表达特征谱的胰腺癌个性化预后评估方法,包括以下步骤:获取胰腺癌预后风险基因列表与基因权重;利用胰腺癌患者肿瘤组织转录组和生存数据构建预后评估模型;根据胰腺癌患者肿瘤组织的基因表达谱计算患者的风险得分;根据患者的风险得分计算患者每年的生存概率。本发明的方法得出的胰腺癌患者每年的生存概率与实际每年存活比率高度一致(线性相关R2=0.980,P值=9.76E‑17)。证实了该方法具有很高的预测准确性,与实际生存状态高度吻合。同时,对于每个肿瘤患者,本发明可以给出该患者特有的生存概率曲线。

Description

一种基于多基因表达特征谱的胰腺癌个性化预后评估方法
技术领域
本发明属于生物技术和医学领域,具体地说,涉及一种基于多基因表达特征谱的胰腺癌个性化预后评估方法。
背景技术
胰腺癌是全球范围内危害较大的一种恶性肿瘤。胰腺癌患者通常只有较短的平均生存期。统计显示,全球范围内胰腺癌男性患者的死亡人数与女性患者的死亡人数差异较小。全球疾病负担(Global Burden of Disease,GBD)数据显示,2016年全球患有胰腺癌的人数为36万,其中中国患病人数为5.7万。2016年全球胰腺癌患者的死亡人数为41万,占总死亡人数的0.74%。中国2016年死亡患者数超过7.2万,占总死亡人数的0.74%。统计结果显示,从1990年到2016年全球胰腺癌患病率和死亡率持续增长,中国患病率和死亡率增长缓慢。
目前国际上通用的的肿瘤分期方法是TNM分期系统,该系统是美国癌症联合委员会(American Joint Committee on Cancer,AJCC)提出的一种恶性肿瘤分类方法。美国国家癌症研究所(National Cancer Institute,NCI)对TNM分期的描述为:T指主要肿瘤的大小和范围,主要肿瘤通常被称为原发性肿瘤。N指患有癌症的附近淋巴结的数目。M指癌症是否已经转移,即从原发性肿瘤扩散到身体的其他部位。根据以上指标可将恶性肿瘤大致分为I期,II期,III期和IV期,其中分期越高表示肿瘤的恶性程度越高。TNM分期系统对肿瘤患者的治疗和预后评估有一定帮助。但是,由于不同个体中肿瘤的发生机制及体内微环境的不同,导致不同患者的生存时间差异巨大,TNM分期系统不能很好地反映出患者的预后状况。研究发现,对于某些诊断为I期的患者可能只有较短的生存期(1-2年),然而对于一些诊断为IV期的患者可能具有较长的生存期(5年及以上)。因此,TNM分期系统可能更倾向于描述一个癌症患者群体的平均水平,对个性化的诊断和治疗适用性较差。另一方面,对于诊断为晚期(III期、IV期)的患者,会给患者及医务人员造成一定的治疗方案选择困难,导致很多本来可以长时间生存的肿瘤患者由于过度医疗或医疗失当而提前死亡;而另一些本应进行适当治疗可以延长生存的患者由于放弃治疗或治疗不当同样导致肿瘤患者提前死亡。
目前,有报道提出利用基因表达谱可以对肿瘤患者进行预后评估。但是,绝大多数报道只是使用单个或数个基因,只能对一个群体进行分类,对个体生存期只能进行定性的划分(如预后好、预后差两个指标)。因此,需要建立更精细的个性化肿瘤预后评估模型来评估患者的生存时间从而选择合适的治疗方案。
发明内容
有鉴于此,本发明提供了一种基于多基因表达特征谱的胰腺癌个性化预后评估方法,能够准确预测胃癌患者每年的存活概率。
为了解决上述技术问题,本发明公开了一种基于多基因表达特征谱的胰腺癌个性化预后评估方法,
包括以下步骤:
步骤1、获取胰腺癌预后风险基因列表与基因权重;
步骤2、利用胰腺癌患者肿瘤组织转录组和生存数据构建预后评估模型;
步骤3、根据胰腺癌患者肿瘤组织的基因表达谱计算患者的风险得分;
步骤4、根据患者的风险得分计算患者每年的生存概率。
可选地,所述步骤1中的获取胰腺癌预后风险基因列表与基因权重具体为:
步骤1.1、从Genomic Data Commons Data Portal数据库中下载胰腺癌患者肿瘤组织和癌旁组织转录组数据以及临床数据,获得胰腺癌患者肿瘤组织基因表达谱FPKM数值,进行对数转换;
步骤1.2、设总样本数为m,将所有样本根据其基因表达值的三分位数分为三组,其中,基因表达值具体是指步骤1.1中获得的FPKM数值,用V表示,对第i个基因记为Vi,利用Cox比例风险模型计算第三分组相比第一分组的生存风险,得出第i个基因的风险比HRi和P值,即得出每一个基因的风险比;定义P值<0.05具有显著性,筛选具有显著性的生存风险基因,记为n1;此外,计算每个基因与患者生存天数的相关性,得出每个基因的相关系数r和P值;定义P值<0.05具有显著性,筛选具有显著性的生存相关基因,记为n2;将生存风险基因和生存相关基因的交集定义为预后风险基因,记为n,则有:
n=n1∩n2 (1)
步骤1.3、根据第i个基因的风险比计算第i个基因的权重Wi,计算公式为:
Figure BDA0001655282970000031
这样就能得出每一个基因的权重,最终得到的胰腺癌预后风险基因列表与基因权重。
可选地,所述胰腺癌预后风险基因列表与基因权重如下表所示:
Figure BDA0001655282970000032
Figure BDA0001655282970000041
Figure BDA0001655282970000051
Figure BDA0001655282970000061
可选地,所述步骤2中的利用胰腺癌患者肿瘤组织转录组和生存数据构建预后评估模型,具体为:
步骤2.1、定义基因表达值为V,根据第i个基因在第j个样本中的表达值和权重计算第i个患者的风险得分Sj;计算公式为:
Figure BDA0001655282970000071
其中,j表示样本编号,m表示样本总数,Vij表示第i个基因在第j个样本中的表达值;
步骤2.2、将所有胰腺癌患者样本按照风险得分从低到高排序,使用滑动窗口模型对每50个样本计算平均风险得分
Figure BDA0001655282970000072
计算公式为:
Figure BDA0001655282970000073
其中j+49表示从样本j开始计数的后50个样本;
步骤2.3、使用Weibull分布对50个样本的生存数据进行曲线拟合,Weibull分布的概率密度函数为:
Figure BDA0001655282970000074
其中k>0是形状参数,λ>0是分布的比例参数;
步骤2.4、对每50个样本计算出
Figure BDA0001655282970000075
所对应的kj和λj;根据经验,kj为一个相对固定的数值,均值为:
Figure BDA0001655282970000076
其中,kj为第j个样本到第j+49个样本生存曲线Weibull分布的形状参数;
比例参数λj的变化范围较大,定义λj
Figure BDA0001655282970000081
的函数关系为:
Figure BDA0001655282970000082
其中,λj表示第j个样本到第j+49个样本生存曲线Weibull分布的比例参数;
其中e为自然对数的底,α、β为函数的参数,对上式取对数得:
Figure BDA0001655282970000083
其中logλj
Figure BDA0001655282970000084
为线性关系,通过线性拟合求解;
根据平均风险得分
Figure BDA0001655282970000085
与Weibull分布参数λj的拟合曲线,得出的函数关系为:
Figure BDA0001655282970000086
Figure BDA0001655282970000087
代入该函数得出预测的λj′,λj′为用该函数计算出的预期分布参数,计算λj与λj′的相关性得相关系数R2=0.978,P值=1.48E-39。
可选地,所述步骤3中的根据胰腺癌患者肿瘤组织的基因表达谱计算患者的风险得分,具体为:获取胰腺癌患者肿瘤组织的第i个基因表达谱的FPKM数值,记为:Vi;第i个基因对应的权重记为:Wi;患者风险得分记为:S;计算公式为:
Figure BDA0001655282970000088
其中i为基因编号,n为基因个数。
可选地,所述步骤4中的根据患者的风险得分计算患者每年的生存概率,具体为:将患者的风险得分S带入Weibull分布的累积分布函数得出该患者的存活概率函数为:
Figure BDA0001655282970000091
其中t为时间,α、β、S、
Figure BDA0001655282970000092
均为固定参数。
与现有技术相比,本发明可以获得包括以下技术效果:
1)连续:本发明能预测肿瘤患者连续时间的生存概率。例如可以给出患者每个月的生存概率、患者每年的生存概率等。而目前临床采用的分型方法只能给出一个定性的判断。
2)更精确:本发明基于多基因表达特征谱的胰腺癌个性化预后评估方法相比传统TNM分期能够更精确地反映患者的生存状态。
3)个性化:对于每个肿瘤患者,本发明可以给出该患者特有的生存概率曲线,这是一般肿瘤预后评估模型所不具备的。
当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有技术效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明预测平均每年生存概率与实际每年存活概率比较;
图2是本发明TNM肿瘤分期与患者生存时间的相关性;
图3是本发明平均风险得分与Weibull分布参数scale的拟合曲线;
图4是本发明平均风险得分与Weibull分布参数scale的拟合残差图;
图5是本发明个性化胰腺癌预后评估结果。
具体实施方式
以下将配合实施例来详细说明本发明的实施方式,藉此对本发明如何应用技术手段来解决技术问题并达成技术功效的实现过程能充分理解并据以实施。
本发明公开了一种基于多基因表达特征谱的胰腺癌个性化预后评估方法,包括以下步骤:
步骤1、获取胰腺癌预后风险基因列表与基因权重,具体为:
步骤1.1、从Genomic Data Commons Data Portal数据库中下载胰腺癌患者肿瘤组织和癌旁组织转录组数据以及临床数据,获得胰腺癌患者肿瘤组织基因表达谱FPKM(Fragments Per Kilobase of transcript per Million fragments mapped)数值,进行对数转换(log2)。
步骤1.2、设总样本数为m,将所有样本根据其基因表达值的三分位数分为三组,其中,基因表达值具体是指步骤1.1中获得的FPKM数值,用V表示,对第i个基因记为Vi,利用Cox比例风险模型计算第三分组相比第一分组的生存风险,得出第i个基因的风险比HRi和P值,即可得出每一个基因的风险比。定义P值<0.05具有显著性,筛选具有显著性的生存风险基因,记为n1。此外,计算每个基因与患者生存天数的相关性,得出每个基因的相关系数r和P值。定义P值<0.05具有显著性,筛选具有显著性的生存相关基因,记为n2。将生存风险基因和生存相关基因的交集定义为预后风险基因,记为n,则有:
n=n1∩n2 (1)
步骤1.3、根据第i个基因的风险比计算第i个基因的权重Wi,计算公式为:
Figure BDA0001655282970000101
这样就能得出每一个基因的权重,最终得到的胰腺癌预后风险基因列表与基因权重见表1。
表1基因名称和权重
Figure BDA0001655282970000111
Figure BDA0001655282970000121
Figure BDA0001655282970000131
Figure BDA0001655282970000141
步骤2、利用胰腺癌患者肿瘤组织转录组和生存数据构建预后评估模型,具体为:
步骤2.1、定义基因表达值为V,根据第i个基因在第j个样本中的表达值和权重计算第i个患者的风险得分Sj;计算公式为:
Figure BDA0001655282970000142
其中,j表示样本编号,m表示样本总数,Vij表示第i个基因在第j个样本中的表达值;
步骤2.2、将所有胰腺癌患者样本按照风险得分从低到高排序,使用滑动窗口模型(Kang HJ et al.Spatio-temporal transcriptome of the human brain.Nature.2011;478(7370):483-489.)对每50个样本计算平均风险得分
Figure BDA0001655282970000143
计算公式为:
Figure BDA0001655282970000144
其中j+49表示从样本j开始计数的后50个样本。
步骤2.3、使用Weibull分布对50个样本的生存数据进行曲线拟合,Weibull分布的概率密度函数为:
Figure BDA0001655282970000145
其中λ>0是形状(shape)参数,λ>0是分布的比例(scale)参数。
步骤2.4、对每50个样本计算出
Figure BDA0001655282970000151
所对应的kj和λj。根据经验,kj为一个相对固定的数值,均值为:
Figure BDA0001655282970000152
其中,kj为第j个样本到第j+49个样本生存曲线Weibull分布的形状参数;
比例参数λj的变化范围较大,定义λj
Figure BDA0001655282970000153
的函数关系为:
Figure BDA0001655282970000154
其中,λj表示第j个样本到第j+49个样本生存曲线Weibull分布的比例参数;
其中e为自然对数的底,α、β为函数的参数,对上式取对数可得:
Figure BDA0001655282970000155
其中logλj
Figure BDA0001655282970000156
为线性关系,可通过线性拟合求解。
如图3所示为平均风险得分
Figure BDA0001655282970000157
与Weibull分布参数λj的拟合曲线,得出的函数关系为:
Figure BDA0001655282970000158
Figure BDA0001655282970000159
代入该函数得出预测的λj′,λj′为用该函数计算出的预期分布参数,计算λj与λj′的相关性可得相关系数R2=0.978,P值=1.48E-39。
通过分析拟合残差图和Q-Q图(图4),表明该模型达到显著性,即平均风险得分
Figure BDA0001655282970000161
与Weibull分布参数λj的函数关系是可信的。
步骤3、根据胰腺癌患者肿瘤组织的基因表达谱计算患者的风险得分,具体为:获取胰腺癌患者肿瘤组织的第i个基因表达谱的FPKM数值(应包含全部或大部分表1中所列基因),记为:Vi(i为基因编号);表1中第i个基因对应的权重记为:Wi(i为基因编号);患者风险得分记为:S;计算公式为:
Figure BDA0001655282970000162
其中i为基因编号,n为表1中列出的基因个数。
步骤4、根据患者的风险得分计算患者每年的生存概率,具体为:将患者的风险得分S带入Weibull分布的累积分布函数可以得出该患者的存活概率函数为:
Figure BDA0001655282970000163
其中t为时间,α、β、S、
Figure BDA0001655282970000164
均为固定参数。
如图5所示为一个患者的存活概率曲线,图中横坐标为天数,纵坐标为存活概率。患者每年的存活概率在曲线下方标出。右上角黑色方框中标出患者存活的实际天数,状态(Status)1表示患者已经死亡。曲线上红色点(Death处)标出患者死亡时对应的天数和存活概率,图中患者死亡时对应的存活概率在0.45左右。
本发明利用TCGA-PAAD转录组和临床数据,对所有胰腺癌患者进行了个性化的生存预测,并利用交叉验证的方法对得到的结果进行了验证。结果显示采用多基因表达特征谱的胰腺癌个性化预后评估方法得出的胰腺癌患者每年的生存概率与实际每年存活比率高度一致(线性相关R2=0.980,P值=9.76E-17,图1)。证实了该方法具有很高的预测准确性,与实际生存状态高度吻合。
如图2所示,TNM分期与胰腺癌患者的生存时间不具有相关性(P值大于0.05)。图1与图2相比较可以得出基于多基因表达特征谱的胰腺癌个性化预后评估方法相比传统TNM分期能够更精确地反映患者的生存状态。
如图5所示,本发明能预测肿瘤患者连续时间的生存概率。例如可以给出患者每个月的生存概率、患者每年的生存概率等。而目前临床采用的分型方法只能给出一个定性的判断。对于每个肿瘤患者,本发明可以给出该患者特有的生存概率曲线,这是一般肿瘤预后评估模型所不具备的。
上述说明示出并描述了发明的若干优选实施例,但如前所述,应当理解发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离发明的精神和范围,则都应在发明所附权利要求的保护范围内。

Claims (1)

1.一种基于多基因表达特征谱的胰腺癌个性化预后评估方法,其特征在于,包括以下步骤:
步骤1、获取胰腺癌预后风险基因列表与基因权重;
步骤2、利用胰腺癌患者肿瘤组织转录组和生存数据构建预后评估模型;
步骤3、根据胰腺癌患者肿瘤组织的基因表达谱计算患者的风险得分;
步骤4、根据患者的风险得分计算患者每年的生存概率;
所述步骤1中的获取胰腺癌预后风险基因列表与基因权重具体为:
步骤1.1、从Genomic Data Commons Data Portal数据库中下载胰腺癌患者肿瘤组织和癌旁组织转录组数据以及临床数据,获得胰腺癌患者肿瘤组织基因表达谱FPKM数值,进行对数转换;
步骤1.2、设总样本数为m,将所有样本根据其基因表达值的三分位数分为三组,其中,基因表达值具体是指步骤1.1中获得的FPKM数值,用V表示,对第i个基因记为Vi,利用Cox比例风险模型计算第三分组相比第一分组的生存风险,得出第i个基因的风险比HRi和P值,即得出每一个基因的风险比;定义P值<0.05具有显著性,筛选具有显著性的生存风险基因,记为N1;此外,计算每个基因与患者生存天数的相关性,得出每个基因的相关系数r和P值;定义P值<0.05具有显著性,筛选具有显著性的生存相关基因,记为N2;将生存风险基因和生存相关基因的交集定义为预后风险基因,记为N,则有:
N=N1∩N2 (1)
步骤1.3、根据第i个基因的风险比计算第i个基因的权重Wi,计算公式为:
Figure DEST_PATH_IMAGE002
这样就能得出每一个基因的权重,最终得到的胰腺癌预后风险基因列表与基因权重;
所述胰腺癌预后风险基因列表与基因权重如下表所示:
Figure FDA0003494125890000022
Figure FDA0003494125890000031
Figure FDA0003494125890000041
Figure FDA0003494125890000051
所述步骤2中的利用胰腺癌患者肿瘤组织转录组和生存数据构建预后评估模型,具体为:
步骤2.1、定义基因表达值为V,根据第i个基因在第j个样本中的表达值和权重计算第i个患者的风险得分Sj;计算公式为:
Figure FDA0003494125890000052
其中,j表示样本编号,m表示样本总数,Vij表示第i个基因在第j个样本中的表达值;
步骤2.2、将所有胰腺癌患者样本按照风险得分从低到高排序,使用滑动窗口模型对每50个样本计算平均风险得分
Figure FDA0003494125890000053
计算公式为:
Figure FDA0003494125890000054
其中j+49表示从样本j开始计数的后50个样本;
步骤2.3、使用Weibull分布对50个样本的生存数据进行曲线拟合,Weibull分布的概率密度函数为:
Figure FDA0003494125890000061
其中k>0是形状参数,λ>0是分布的比例参数;
步骤2.4、对每50个样本计算出
Figure FDA0003494125890000062
所对应的kj和λj;kj为一个固定的数值,均值为:
Figure FDA0003494125890000063
其中,kj为第j个样本到第j+49个样本生存曲线Weibull分布的形状参数;
定义λj
Figure FDA0003494125890000064
的函数关系为:
Figure FDA0003494125890000065
其中,λj表示第j个样本到第j+49个样本生存曲线Weibull分布的比例参数;
其中e为自然对数的底,α、β为函数的参数,对上式取对数得:
Figure FDA0003494125890000066
其中logλj
Figure FDA0003494125890000067
为线性关系,通过线性拟合求解;
根据平均风险得分
Figure FDA0003494125890000068
与Weibull分布参数λj的拟合曲线,得出的函数关系为:
Figure FDA0003494125890000069
Figure FDA00034941258900000610
代入该函数得出预测的λj′,λj′为用该函数计算出的预期分布参数,计算λj与λj′的相关性得相关系数R2=0.978,P值=1.48E-39;
所述步骤3中的根据胰腺癌患者肿瘤组织的基因表达谱计算患者的风险得分,具体为:获取胰腺癌患者肿瘤组织的第i个基因表达谱的FPKM数值,记为:Vi;第i个基因对应的权重记为:Wi;患者风险得分记为:S;计算公式为:
Figure FDA0003494125890000071
其中i为基因编号,n为基因个数;
所述步骤4中的根据患者的风险得分计算患者每年的生存概率,具体为:将患者的风险得分S带入Weibull分布的累积分布函数得出该患者的存活概率函数为:
Figure FDA0003494125890000072
其中t为时间,α、β、S、
Figure FDA0003494125890000073
均为固定参数。
CN201810440131.XA 2018-05-09 2018-05-09 一种基于多基因表达特征谱的胰腺癌个性化预后评估方法 Active CN108648826B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810440131.XA CN108648826B (zh) 2018-05-09 2018-05-09 一种基于多基因表达特征谱的胰腺癌个性化预后评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810440131.XA CN108648826B (zh) 2018-05-09 2018-05-09 一种基于多基因表达特征谱的胰腺癌个性化预后评估方法

Publications (2)

Publication Number Publication Date
CN108648826A CN108648826A (zh) 2018-10-12
CN108648826B true CN108648826B (zh) 2022-04-15

Family

ID=63753954

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810440131.XA Active CN108648826B (zh) 2018-05-09 2018-05-09 一种基于多基因表达特征谱的胰腺癌个性化预后评估方法

Country Status (1)

Country Link
CN (1) CN108648826B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110993104B (zh) * 2019-12-03 2023-06-30 中国医科大学附属第一医院 肿瘤患者生存期预测系统
CN111128385B (zh) * 2020-01-17 2020-11-10 河南科技大学第一附属医院 一种用于食管鳞癌的预后预警系统及其应用
CN111354462B (zh) * 2020-04-14 2024-01-09 中山大学孙逸仙纪念医院 晚期乳腺癌生存概率预测列线图、生存概率预测方法及患者分类方法
CN113234835A (zh) * 2021-07-09 2021-08-10 北京泱深生物信息技术有限公司 预后相关基因及风险模型预测胰腺癌预后的应用

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101356532A (zh) * 2005-05-13 2009-01-28 布鲁塞尔自由大学 基于基因的算法型癌症预后
CN101688240A (zh) * 2007-04-10 2010-03-31 国立台湾大学 通过微rna预测癌症患者的治疗后存活预期
WO2010104473A1 (en) * 2009-03-10 2010-09-16 Agency For Science, Technology And Research A method for the systematic evaluation of the prognostic properties of gene pairs for medical conditions, and certain gene pairs identified
CN104975082A (zh) * 2015-06-05 2015-10-14 复旦大学附属肿瘤医院 一组用于评估肺癌预后的基因及其应用
CN106407689A (zh) * 2016-09-27 2017-02-15 牟合(上海)生物科技有限公司 一种基于基因表达谱的胃癌预后标志物筛选及分类方法
CN107619863A (zh) * 2016-07-12 2018-01-23 百岳特生物科技(上海)有限公司 检测癌症的存在风险的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101356532A (zh) * 2005-05-13 2009-01-28 布鲁塞尔自由大学 基于基因的算法型癌症预后
CN101688240A (zh) * 2007-04-10 2010-03-31 国立台湾大学 通过微rna预测癌症患者的治疗后存活预期
WO2010104473A1 (en) * 2009-03-10 2010-09-16 Agency For Science, Technology And Research A method for the systematic evaluation of the prognostic properties of gene pairs for medical conditions, and certain gene pairs identified
CN104975082A (zh) * 2015-06-05 2015-10-14 复旦大学附属肿瘤医院 一组用于评估肺癌预后的基因及其应用
CN107619863A (zh) * 2016-07-12 2018-01-23 百岳特生物科技(上海)有限公司 检测癌症的存在风险的方法
CN106407689A (zh) * 2016-09-27 2017-02-15 牟合(上海)生物科技有限公司 一种基于基因表达谱的胃癌预后标志物筛选及分类方法

Also Published As

Publication number Publication date
CN108648826A (zh) 2018-10-12

Similar Documents

Publication Publication Date Title
CN108363907B (zh) 一种基于多基因表达特征谱的肺腺癌个性化预后评估方法
CN108630317B (zh) 一种基于多基因表达特征谱的肝癌个性化预后评估方法
CN108648826B (zh) 一种基于多基因表达特征谱的胰腺癌个性化预后评估方法
Klein et al. A genomic classifier improves prediction of metastatic disease within 5 years after surgery in node-negative high-risk prostate cancer patients managed by radical prostatectomy without adjuvant therapy
CN108470111B (zh) 一种基于多基因表达特征谱的胃癌个性化预后评估方法
CN108611416B (zh) 一种基于多基因表达特征谱的宫颈癌个性化预后评估方法
CN108647493B (zh) 一种肾透明细胞癌个性化预后评估方法
CN108733980B (zh) 基于多基因表达特征谱胶质母细胞瘤个性化预后评估方法
Xie et al. Radiomics nomogram for prediction disease-free survival and adjuvant chemotherapy benefits in patients with resected stage I lung adenocarcinoma
CN108320806B (zh) 一种基于多基因表达特征谱的结肠癌个性化预后评估方法
CN115019880B (zh) 一种肝癌预后模型及其构建方法和应用
CN114891887A (zh) 一种三阴性乳腺癌预后基因标志物筛选的方法
CN115019965A (zh) 基于细胞死亡相关基因的肝癌患者生存预测模型构建方法
Dang et al. Clinical and radiological predictors of epidermal growth factor receptor mutation in nonsmall cell lung cancer
CN111748633A (zh) 一种特征miRNA表达谱组合及头颈鳞状细胞癌早期预测方法
CN115482880A (zh) 一种头颈鳞癌糖酵解相关基因预后模型及构建方法和应用
CN113658696B (zh) 一种基于患者年龄、营养指标、肿瘤分期和肿瘤标志物联合预测胃癌预后的预测系统
CN114203256A (zh) 基于微生物丰度的mibc分型及预后预测模型构建方法
Chen et al. N6-methyladenosine-related long noncoding RNA is a potential biomarker for predicting pancreatic cancer prognosis
Zhao et al. Evaluation of treatment efficacy using a Bayesian mixture piecewise linear model of longitudinal biomarkers
Weissferdt et al. Pathologic Processing of Lung Cancer Resection Specimens After Neoadjuvant Therapy
CN113614537A (zh) 癌症预后
Jiang et al. A competing risk nomogram for predicting cancer‐specific death of patients with buccal mucosa cancer
CN114171200A (zh) Ptc预后标志物及其应用、ptc的预后评估模型的构建方法
CN114672569A (zh) 基于色氨酸代谢基因的肝癌预后评估方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant