CN108611416B - 一种基于多基因表达特征谱的宫颈癌个性化预后评估方法 - Google Patents
一种基于多基因表达特征谱的宫颈癌个性化预后评估方法 Download PDFInfo
- Publication number
- CN108611416B CN108611416B CN201810440007.3A CN201810440007A CN108611416B CN 108611416 B CN108611416 B CN 108611416B CN 201810440007 A CN201810440007 A CN 201810440007A CN 108611416 B CN108611416 B CN 108611416B
- Authority
- CN
- China
- Prior art keywords
- patient
- survival
- cervical cancer
- gene
- expression profile
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
Abstract
本发明公开了一种基于多基因表达特征谱的宫颈癌个性化预后评估方法,包括以下步骤:获取宫颈癌预后风险基因列表与基因权重;利用宫颈癌患者肿瘤组织转录组和生存数据构建预后评估模型;根据宫颈癌患者肿瘤组织的基因表达谱计算患者的风险得分;根据患者的风险得分计算患者每年的生存概率。本发明的方法得出的宫颈癌患者每年的生存概率与实际每年存活比率高度一致(线性相关R2=0.988,P值=5.04E‑38)。证实了该方法具有很高的预测准确性,与实际生存状态高度吻合。同时,对于每个肿瘤患者,本发明可以给出该患者特有的生存概率曲线。
Description
技术领域
本发明属于生物技术和医学领域,具体地说,涉及一种基于多基因表达特征谱的宫颈癌个性化预后评估方法。
背景技术
宫颈癌是中国及全球女性高发的恶性肿瘤。全球范围内发展中国家宫颈癌的发病率和死亡率高于发达国家,宫颈癌在发展中国家的发病率仅次于乳腺癌。全球疾病负担(Global Burden of Disease,GBD)数据显示,2016年全球患有宫颈癌的人数达到194万,其中中国患病人数为35万。2016年全球宫颈癌患者的死亡人数为25万,占总死亡人数的0.45%。中国2016年死亡患者数为3.8万,占总死亡人数的0.40%。统计结果显示,从1990年到2016年全球宫颈癌患病率相对稳定,死亡率持续增长。中国宫颈癌患病率和死亡率近几年迅速增加,2016年中国宫颈癌患病率达到全球平均水平。
目前国际上通用的的肿瘤分期方法是TNM分期系统,该系统是美国癌症联合委员会(American Joint Committee on Cancer,AJCC)提出的一种恶性肿瘤分类方法。美国国家癌症研究所(National Cancer Institute,NCI)对TNM分期的描述为:T指主要肿瘤的大小和范围,主要肿瘤通常被称为原发性肿瘤。N指患有癌症的附近淋巴结的数目。M指癌症是否已经转移,即从原发性肿瘤扩散到身体的其他部位。根据以上指标可将恶性肿瘤大致分为I期,II期,III期和IV期,其中分期越高表示肿瘤的恶性程度越高。TNM分期系统对肿瘤患者的治疗和预后评估有一定帮助。但是,由于不同个体中肿瘤的发生机制及体内微环境的不同,导致不同患者的生存时间差异巨大,TNM分期系统不能很好地反映出患者的预后状况。研究发现,对于某些诊断为I期的患者可能只有较短的生存期(1-2年),然而对于一些诊断为IV期的患者可能具有较长的生存期(5年及以上)。因此,TNM分期系统可能更倾向于描述一个癌症患者群体的平均水平,对个性化的诊断和治疗适用性较差。另一方面,对于诊断为晚期(III期、IV期)的患者,会给患者及医务人员造成一定的治疗方案选择困难,导致很多本来可以长时间生存的肿瘤患者由于过度医疗或医疗失当而提前死亡;而另一些本应进行适当治疗可以延长生存的患者由于放弃治疗或治疗不当同样导致肿瘤患者提前死亡。
目前,有报道提出利用基因表达谱可以对肿瘤患者进行预后评估。但是,绝大多数报道只是使用单个或数个基因,只能对一个群体进行分类,对个体生存期只能进行定性的划分(如预后好、预后差两个指标)。因此,需要建立更精细的个性化肿瘤预后评估模型来评估患者的生存时间从而选择合适的治疗方案。
发明内容
有鉴于此,本发明提供了一种基于多基因表达特征谱的宫颈癌个性化预后评估方法,能够准确预测患者每年的存活概率。
为了解决上述技术问题,本发明公开了一种基于多基因表达特征谱的宫颈癌个性化预后评估方法,
包括以下步骤:
步骤1、获取宫颈癌预后风险基因列表与基因权重;
步骤2、利用宫颈癌患者肿瘤组织转录组和生存数据构建预后评估模型;
步骤3、根据宫颈癌患者肿瘤组织的基因表达谱计算患者的风险得分;
步骤4、根据患者的风险得分计算患者每年的生存概率。
可选地,所述步骤1中的获取宫颈癌预后风险基因列表与基因权重具体按照以下步骤实施:
步骤1.1、从Genomic Data Commons Data Portal数据库中下载宫颈癌患者肿瘤组织和癌旁组织转录组数据以及临床数据,获得宫颈癌患者肿瘤组织基因表达谱FPKM数值,进行对数转换;
步骤1.2、设总样本数为m,将所有样本根据其基因表达值的三分位数分为三组,其中,基因表达值是指步骤1.1中获得的FPKM数值,用V表示,对第i个基因记为Vi,利用Cox比例风险模型计算第三分组相比第一分组的生存风险,得出第i个基因的风险比HRi和P值,即得出每一个基因的风险比;定义P值<0.05具有显著性,筛选具有显著性的生存风险基因,记为n1;此外,计算每个基因与患者生存天数的相关性,得出每个基因的相关系数r和P值;定义P值<0.05具有显著性,筛选具有显著性的生存相关基因,记为n2;将生存风险基因和生存相关基因的交集定义为预后风险基因,记为n,则有:
n=n1∩n2 (1)
步骤1.3、根据第i个基因的风险比计算第i个基因的权重Wi,计算公式为:
这样就得到每一个基因的权重,最终得到的宫颈癌预后风险基因列表与基因权重。
可选地,所述的宫颈癌预后风险基因列表与基因权重如下表所示:
可选地,所述步骤2中的利用宫颈癌患者肿瘤组织转录组和生存数据构建预后评估模型具体按照以下步骤实施:
步骤2.1、定义基因表达值为V,定义基因表达值为V,根据第i个基因在第j个样本中的表达值和权重计算第i个患者的风险得分Sj;计算公式为:
其中,j表示样本编号,m表示样本总数,Vij表示第i个基因在第j个样本中的表达值;j+49表示从样本j开始计数的后50个样本;
步骤2.3、使用Weibull分布对50个样本的生存数据进行曲线拟合,Weibull分布的概率密度函数为:
其中k>0是形状参数,λ>0是分布的比例参数;
其中,kj为第j个样本到第j+49个样本生存曲线Weibull分布的形状参数;
其中,λj表示第j个样本到第j+49个样本生存曲线Weibull分布的比例参数;e为自然对数的底,α、β为函数的参数,对上式取对数得:
可选地,所述步骤3中的根据宫颈癌患者肿瘤组织的基因表达谱计算患者的风险得分具体按照以下步骤实施:获取宫颈癌患者肿瘤组织的第i个基因表达谱的FPKM数值,记为:Vi;第i个基因对应的权重记为:Wi;患者风险得分记为:S;计算公式为:
其中i为基因编号,n为表1中列出的基因个数。
可选地,所述步骤4中的根据患者的风险得分计算患者每年的生存概率按照以下步骤实施:将患者的风险得分S带入Weibull分布的累积分布函数得出该患者的存活概率函数为:
与现有技术相比,本发明可以获得包括以下技术效果:
1)连续:本发明能预测肿瘤患者连续时间的生存概率。例如可以给出患者每个月的生存概率、患者每年的生存概率等。而目前临床采用的分型方法只能给出一个定性的判断。
2)更精确:本发明基于多基因表达特征谱的宫颈癌个性化预后评估方法相比传统TNM分期能够更精确地反映患者的生存状态。
3)个性化。对于每个肿瘤患者,本发明可以给出该患者特有的生存概率曲线,这是一般肿瘤预后评估模型所不具备的。
当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有技术效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明预测平均每年生存概率与实际每年存活概率比较;
图2是本发明平均风险得分与Weibull分布参数scale的拟合曲线;
图3是本发明平均风险得分与Weibull分布参数scale的拟合残差图;
图4是本发明个性化宫颈癌预后评估结果。
具体实施方式
以下将配合实施例来详细说明本发明的实施方式,藉此对本发明如何应用技术手段来解决技术问题并达成技术功效的实现过程能充分理解并据以实施。
本发明公开了一种基于多基因表达特征谱的宫颈癌个性化预后评估方法,包括以下步骤:
步骤1、获取宫颈癌预后风险基因列表与基因权重,具体为:
步骤1.1、从Genomic Data Commons Data Portal数据库中下载宫颈癌患者肿瘤组织和癌旁组织转录组数据以及临床数据,获得宫颈癌患者肿瘤组织基因表达谱FPKM(Fragments Per Kilobase of transcript per Million fragments mapped)数值,进行对数转换(log2)。
步骤1.2、设总样本数为m,将所有样本根据其基因表达值的三分位数分为三组,其中,基因表达值是指步骤1.1中获得的FPKM数值,用V表示,对第i个基因记为Vi,利用Cox比例风险模型计算第三分组相比第一分组的生存风险,得出第i个基因的风险比HRi和P值,即可得出每一个基因的风险比。定义P值<0.05具有显著性,筛选具有显著性的生存风险基因,记为n1。此外,计算每个基因与患者生存天数的相关性,得出每个基因的相关系数r和P值。定义P值<0.05具有显著性,筛选具有显著性的生存相关基因,记为n2。将生存风险基因和生存相关基因的交集定义为预后风险基因,记为n,则有:
n=n1∩n2 (1)
步骤1.3、根据第i个基因的风险比计算第i个基因的权重Wi,计算公式为:
这样就得到每一个基因的权重,最终得到的宫颈癌预后风险基因列表与基因权重见表1。
表1基因名称和权重
步骤2、利用宫颈癌患者肿瘤组织转录组和生存数据构建预后评估模型,具体为:
步骤2.1、定义基因表达值为V,定义基因表达值为V,根据第i个基因在第j个样本中的表达值和权重计算第i个患者的风险得分Sj;计算公式为:
其中,j表示样本编号,m表示样本总数,Vij表示第i个基因在第j个样本中的表达值;j+49表示从样本j开始计数的后50个样本;
步骤2.2、将所有宫颈癌患者样本按照风险得分从低到高排序,使用滑动窗口模型(Kang HJ et al.Spatio-temporal transcriptome of the human brain.Nature.2011;478(7370):483-489.)对每50个样本计算平均风险得分计算公式为:
其中j+49表示从样本j开始计数的后50个样本。
步骤2.3、使用Weibull分布对50个样本的生存数据进行曲线拟合,Weibull分布的概率密度函数为:
其中k>0是形状(shape)参数,λ>0是分布的比例(scale)参数。
其中,kj为第j个样本到第j+49个样本生存曲线Weibull分布的形状参数;
其中,λj表示第j个样本到第j+49个样本生存曲线Weibull分布的比例参数;e为自然对数的底,α、β为函数的参数,对上式取对数可得:
步骤3、根据宫颈癌患者肿瘤组织的基因表达谱计算患者的风险得分,具体为:获取宫颈癌患者肿瘤组织的第i个基因表达谱的FPKM数值(应包含全部或大部分表1中所列基因),记为:Vi(i为基因编号);表1中第i个基因对应的权重记为:Wi(i为基因编号);患者风险得分记为:S;计算公式为:
其中i为基因编号,n为表1中列出的基因个数。
步骤4、根据患者的风险得分计算患者每年的生存概率,具体为:将患者的风险得分S带入Weibull分布的累积分布函数可以得出该患者的存活概率函数为:
如图4所示为一个患者的存活概率曲线,图中横坐标为天数,纵坐标为存活概率。患者每年的存活概率在曲线下方标出。右上角黑色方框中标出患者存活的实际天数,状态(Status)0表示患者仍然存活。曲线上绿色点(Alive点)标出患者存活的天数和存活概率,图中患者对应的存活概率在0.63左右。
本发明利用TCGA-CESC转录组和临床数据,对所有宫颈癌患者进行了个性化的生存预测,并利用交叉验证的方法对得到的结果进行了验证。结果显示采用多基因表达特征谱的宫颈癌个性化预后评估方法得出的宫颈癌患者每年的生存概率与实际每年存活比率高度一致(线性相关R2=0.988,P值=5.04E-38,图1)。证实了该方法具有很高的预测准确性,与实际生存状态高度吻合。
同时,图1显示预测平均每年生存概率与实际每年存活概率高度一致。基于多基因表达特征谱的宫颈癌个性化预后评估方法相比传统TNM分期能够更精确地反映患者的生存状态。
如图4所示,本发明能预测肿瘤患者连续时间的生存概率。例如可以给出患者每个月的生存概率、患者每年的生存概率等。而目前临床采用的分型方法只能给出一个定性的判断。对于每个肿瘤患者,本发明可以给出该患者特有的生存概率曲线,这是一般肿瘤预后评估模型所不具备的。
上述说明示出并描述了发明的若干优选实施例,但如前所述,应当理解发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离发明的精神和范围,则都应在发明所附权利要求的保护范围内。
Claims (1)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810440007.3A CN108611416B (zh) | 2018-05-09 | 2018-05-09 | 一种基于多基因表达特征谱的宫颈癌个性化预后评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810440007.3A CN108611416B (zh) | 2018-05-09 | 2018-05-09 | 一种基于多基因表达特征谱的宫颈癌个性化预后评估方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108611416A CN108611416A (zh) | 2018-10-02 |
CN108611416B true CN108611416B (zh) | 2020-12-29 |
Family
ID=63662713
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810440007.3A Active CN108611416B (zh) | 2018-05-09 | 2018-05-09 | 一种基于多基因表达特征谱的宫颈癌个性化预后评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108611416B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111863126B (zh) * | 2020-05-28 | 2024-03-26 | 上海市生物医药技术研究院 | 构建结直肠肿瘤状态评估模型的方法及应用 |
CN111640509A (zh) * | 2020-06-02 | 2020-09-08 | 山东大学齐鲁医院 | 一种宫颈癌术后复发风险预测方法及系统 |
CN111793692A (zh) * | 2020-08-04 | 2020-10-20 | 中国科学院昆明动物研究所 | 一种特征miRNA表达谱组合及肺鳞癌早期预测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101688240A (zh) * | 2007-04-10 | 2010-03-31 | 国立台湾大学 | 通过微rna预测癌症患者的治疗后存活预期 |
CN107463798A (zh) * | 2017-08-02 | 2017-12-12 | 南京高新生物医药公共服务平台有限公司 | 预测结肠腺癌预后的12‑基因表达分类器及其构建方法 |
CN107548498A (zh) * | 2015-01-20 | 2018-01-05 | 南托米克斯有限责任公司 | 用于反应预测高级别膀胱癌中的化疗的系统和方法 |
CN107885973A (zh) * | 2017-11-20 | 2018-04-06 | 沈阳柏敖生信生物科技有限公司 | 一种dna修复基因在大肠癌中的临床研究方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160070852A1 (en) * | 2014-09-04 | 2016-03-10 | National Taiwan University | Prognosis prediction for acute myeloid leukemia by a 3-microrna scoring method |
-
2018
- 2018-05-09 CN CN201810440007.3A patent/CN108611416B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101688240A (zh) * | 2007-04-10 | 2010-03-31 | 国立台湾大学 | 通过微rna预测癌症患者的治疗后存活预期 |
CN107548498A (zh) * | 2015-01-20 | 2018-01-05 | 南托米克斯有限责任公司 | 用于反应预测高级别膀胱癌中的化疗的系统和方法 |
CN107463798A (zh) * | 2017-08-02 | 2017-12-12 | 南京高新生物医药公共服务平台有限公司 | 预测结肠腺癌预后的12‑基因表达分类器及其构建方法 |
CN107885973A (zh) * | 2017-11-20 | 2018-04-06 | 沈阳柏敖生信生物科技有限公司 | 一种dna修复基因在大肠癌中的临床研究方法 |
Non-Patent Citations (1)
Title |
---|
生存分析;hukun1995;《CSDN》;20170913;https://blog.csdn.net/xiaohukun/article/details/77966543,第1-6页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108611416A (zh) | 2018-10-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108363907B (zh) | 一种基于多基因表达特征谱的肺腺癌个性化预后评估方法 | |
CN108630317B (zh) | 一种基于多基因表达特征谱的肝癌个性化预后评估方法 | |
CN108648826B (zh) | 一种基于多基因表达特征谱的胰腺癌个性化预后评估方法 | |
CN108611416B (zh) | 一种基于多基因表达特征谱的宫颈癌个性化预后评估方法 | |
CN112048559B (zh) | 基于m6A相关的IncRNA网络胃癌预后的模型构建及临床应用 | |
CN108647493B (zh) | 一种肾透明细胞癌个性化预后评估方法 | |
CN108470111B (zh) | 一种基于多基因表达特征谱的胃癌个性化预后评估方法 | |
CN108733980B (zh) | 基于多基因表达特征谱胶质母细胞瘤个性化预后评估方法 | |
Xie et al. | Radiomics nomogram for prediction disease-free survival and adjuvant chemotherapy benefits in patients with resected stage I lung adenocarcinoma | |
CN111564214A (zh) | 一种基于7个特殊基因的乳腺癌预后评估模型的建立与验证方法 | |
CN112029854B (zh) | 一种预测结肠癌预后的标志物及其应用 | |
CN114891887A (zh) | 一种三阴性乳腺癌预后基因标志物筛选的方法 | |
CN108320806B (zh) | 一种基于多基因表达特征谱的结肠癌个性化预后评估方法 | |
US20230383364A1 (en) | Prognostic model of hepatocellular carcinoma based on ddr and icd gene expression and construction method and application thereof | |
CN115019965A (zh) | 基于细胞死亡相关基因的肝癌患者生存预测模型构建方法 | |
CN109979532B (zh) | 甲状腺乳头状癌远处转移分子突变预测模型、方法及系统 | |
CN113853444A (zh) | 癌症患者生存率的预测方法 | |
CN114203256A (zh) | 基于微生物丰度的mibc分型及预后预测模型构建方法 | |
CN113658696A (zh) | 一种基于患者年龄、营养指标、肿瘤分期和肿瘤标志物联合预测胃癌预后的预测系统 | |
CN114171200A (zh) | Ptc预后标志物及其应用、ptc的预后评估模型的构建方法 | |
KR102305806B1 (ko) | 임상 정보와 유전자 다형성 정보를 이용한 폐암 환자의 수술 후 예후 예측 방법 | |
Mokbel et al. | A comparison of the performance of EndoPredict clinical and NHS PREDICT in 120 patients treated for ER-positive Breast Cancer | |
CN114678062B (zh) | 基于多组学特征的肝细胞癌预后预测系统及其预测方法 | |
Diep | Variable selection for generalized linear mixed model by L1 penalization for predicting clinical parameters of ovarian cancer | |
Mamoor | Differential expression of glutamic-oxaloacetic transaminase 1-like 1 in human epithelial ovarian cancer. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |