CN115171887A - 基于免疫相关细胞对的黑素瘤预后预测方法及系统 - Google Patents
基于免疫相关细胞对的黑素瘤预后预测方法及系统 Download PDFInfo
- Publication number
- CN115171887A CN115171887A CN202210886164.3A CN202210886164A CN115171887A CN 115171887 A CN115171887 A CN 115171887A CN 202210886164 A CN202210886164 A CN 202210886164A CN 115171887 A CN115171887 A CN 115171887A
- Authority
- CN
- China
- Prior art keywords
- immune
- cell
- pair
- prognosis
- cox regression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004393 prognosis Methods 0.000 title claims abstract description 83
- 201000001441 melanoma Diseases 0.000 title claims abstract description 45
- 238000000034 method Methods 0.000 title claims abstract description 34
- 230000000694 effects Effects 0.000 claims abstract description 37
- 210000004027 cell Anatomy 0.000 claims description 105
- 210000002865 immune cell Anatomy 0.000 claims description 54
- 230000014509 gene expression Effects 0.000 claims description 30
- 210000001165 lymph node Anatomy 0.000 claims description 29
- 230000004083 survival effect Effects 0.000 claims description 23
- 208000025865 Ulcer Diseases 0.000 claims description 18
- 238000012216 screening Methods 0.000 claims description 18
- 231100000397 ulcer Toxicity 0.000 claims description 18
- 238000000611 regression analysis Methods 0.000 claims description 12
- 238000004458 analytical method Methods 0.000 claims description 11
- 210000001744 T-lymphocyte Anatomy 0.000 claims description 8
- 239000012636 effector Substances 0.000 claims description 8
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 210000003297 immature b lymphocyte Anatomy 0.000 claims description 4
- 101000581981 Homo sapiens Neural cell adhesion molecule 1 Proteins 0.000 claims description 2
- 102100027347 Neural cell adhesion molecule 1 Human genes 0.000 claims description 2
- 210000002443 helper t lymphocyte Anatomy 0.000 claims description 2
- 238000001727 in vivo Methods 0.000 claims description 2
- 210000001616 monocyte Anatomy 0.000 claims description 2
- 210000004479 myeloid suppressor cell Anatomy 0.000 claims description 2
- 210000000581 natural killer T-cell Anatomy 0.000 claims description 2
- 210000000822 natural killer cell Anatomy 0.000 claims description 2
- 108090000623 proteins and genes Proteins 0.000 description 22
- 238000001764 infiltration Methods 0.000 description 8
- 230000008595 infiltration Effects 0.000 description 8
- 206010028980 Neoplasm Diseases 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 101000718243 Homo sapiens Adhesion G protein-coupled receptor E5 Proteins 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000009169 immunotherapy Methods 0.000 description 3
- 238000000691 measurement method Methods 0.000 description 3
- 102100026423 Adhesion G protein-coupled receptor E5 Human genes 0.000 description 2
- 102100030886 Complement receptor type 1 Human genes 0.000 description 2
- 101001019615 Homo sapiens Interleukin-18 receptor accessory protein Proteins 0.000 description 2
- 101000945331 Homo sapiens Killer cell immunoglobulin-like receptor 2DL4 Proteins 0.000 description 2
- 101000945351 Homo sapiens Killer cell immunoglobulin-like receptor 3DL1 Proteins 0.000 description 2
- 101001109501 Homo sapiens NKG2-D type II integral membrane protein Proteins 0.000 description 2
- 102100035010 Interleukin-18 receptor accessory protein Human genes 0.000 description 2
- 108010066979 Interleukin-27 Proteins 0.000 description 2
- 102100033633 Killer cell immunoglobulin-like receptor 2DL4 Human genes 0.000 description 2
- 102100033627 Killer cell immunoglobulin-like receptor 3DL1 Human genes 0.000 description 2
- 102100031789 Myeloid-derived growth factor Human genes 0.000 description 2
- 210000003719 b-lymphocyte Anatomy 0.000 description 2
- 238000011088 calibration curve Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 101100007625 Homo sapiens CR1 gene Proteins 0.000 description 1
- 244000207740 Lemna minor Species 0.000 description 1
- 235000006439 Lemna minor Nutrition 0.000 description 1
- 102100022680 NKG2-D type II integral membrane protein Human genes 0.000 description 1
- 230000000259 anti-tumor effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004195 computer-aided diagnosis Methods 0.000 description 1
- 238000013211 curve analysis Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Public Health (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了基于免疫相关细胞对的黑素瘤预后预测方法及系统,通过用免疫相关细胞对的免疫相关风险替代基因表达谱,结合剔除冗余特征的临床预后信息,从临床指标和免疫微环境两个层面建立预后预测模型,再以该预后预测模型进行预测。相比现有技术,由于免疫相关细胞对的免疫相关风险在进行免疫微环境评估时,用相对大小代替绝对大小,能有效解决批次效应产生的误差,此外,本发明还从多个临床预后信息中筛选出非特征冗余的临床关键特征与所述免疫相关细胞对的免疫相关风险配合使用,能以最少的特征数据实现高准确率的预后预测,进一步减少预测的计算机资源消耗。
Description
技术领域
本发明涉计算机辅助诊断技术领域,尤其基于免疫相关细胞对的黑素瘤预后预测方法及系统。
背景技术
黑色素瘤患者的预后预测是指通过黑色素瘤患者的症状、体征或者生理参数来预测黑色素瘤患者的生存曲线或者病情发展过程。
现有的黑色素瘤患者的预后预测一般利用黑素瘤免疫微环境相关特征基因进行预测,该方法从TCGA官网收集黑色素瘤患者表达谱,并使用Estimate算法计算免疫浸润评分,将黑色素瘤患者分为高低两组,并使用R包limma,以基因变化倍数>1.5,P值小于0.05为临界值,筛选得到差异基因。剔除无生存信息样本,将53个与免疫微环境相关的基因进行单因素 Cox回归分析,多因素Cox回归分析,确认了4个与生存期相关的基因,并进行Lasso回归,得到CR1,CD97两个基因;在利用多因素Cox风险回归分析得到两个基因的相关系数,构建出预后评分RiskScore=系数CR1*表达量CR1+系数CD97*表达量CD97[1]。
该方法虽然能预测黑色素瘤患者的生存概率,但仍存在以下缺陷:
①生存曲线P值小于0.05为有统计学差异,由图2可知该模型在某些验证集在生存曲线中并不能满足上述条件,且ROC曲线的AUC在TCGA—SKCM的评估中,AUC均未大于0.7,预测效果较差。
②作者推断上述基因通过增强B细胞浸润,提高抗肿瘤能力,并未涉及免疫微环境其他免疫细胞的分析,从肿瘤浸润细胞角度预测生存率的能力有限。
③riskScore的指标仅为两个基因的表达量乘以相关系数,如果取自两批不同的测序实验,则会有批次效应产生的误差,运用在临床上则会产生较大误差。且可能受到测量方法不同和基因注释带来的误差。
为了解决预测效果差的问题,有学者提出:将从TCGA中提取的471例样本,随机分为训练集(314例)和测试集(154例),提取29个免疫细胞相关基因集,即707个与免疫微环境相关的基因。利用ssGSEA分析29个免疫相关基因集的相对丰度,运用层次聚类,将样本分为三个亚型,高免疫浸润,中免疫浸润,低免疫浸润。使用R包limma进行高组和低组之间的差异基因分析,筛选指标为基因变化倍数>1.5,假阳性率<0.01。筛选出的差异基因采用单因素Cox 回归,筛选指标为P小于0.05,筛选出与预后相关的260个差异基因,使用Lasso回归,参数设置nfold=10,maxit=1000,确定5个核心基因KLRK1、KIR2DL4、IL18RAP、KIR3DL1和IL27, riskscore的计算公式如下:
riskScore=(-0.223747467348802×表达量KLRK1)+(-0.0396703042539578×表达量KIR2DL4)+(-0.0188532070987305×表达量IL18RAP)+(-0.280680702726008×表达量KIR3DL1)+(-0.32145755755514×表达量IL27).
在TCGA数据库中提取了SKCM患者的临床病理信息,进行单因素Cox回归和多因素Cox回归以P<0.05为筛选条件,选取与预后相关的临床指标,利用临床指标和riskScore构建 Nomogram模型,预测生存率[2]。
该方案虽然能一定程度提高预后预测的准确率,却仍然不能解决批次效应产生的误差,且可能受到测量方法不同和基因注释带来的误差。
[1]田毅,潘意,向丽萍,刘宁,刘文,魏露,杨志波.黑素瘤免疫微环境相关特征基因预后风险评分模型的构建[J/OL].中国皮肤性病学杂志 1-14[2022-05-08].DOI:10.13735/j.cjdv.1001-7089.202110166.
[2]TianQ,GaoH,Zhao W,ZhouY,Yang J.Developmentandvalidationofan immunegene set-basedprognostic signature incutaneous melanoma.Future Oncol.2021Nov;17(31):4115-4129. doi:10.2217/fon-2021-0104.Epub 2021Jul 22.PMID:34291650.
发明内容
本发明提供了基于免疫相关细胞对的黑素瘤预后预测方法及系统,用于解决现有的黑素瘤预后预测方法不能解决批次效应产生的误差,准确率低的技术问题。
为解决上述技术问题,本发明提出的技术方案为:
一种基于免疫相关细胞对的黑素瘤预后预测方法,包括以下步骤:
从免疫微环境中筛选出与黑色瘤预后效果相关的免疫关键特征;其中,所述免疫关键特征包括免疫相关细胞对的免疫相关风险;
以减少特征冗余,并提高准确率为目的,从所述临床预后信息中筛选与所述免疫关键特征配合使用的临床关键特征;将所述免疫关键特征与所述临床关键特征进行合并,构建关键特征集;
从历史数据中获取多个黑色素瘤患者的关键特征集及对应的预后效果值,并根据多个黑色素瘤患者的关键特征集及对应的预后效果值构建预后预测模型;
获取目标对象的关键特征集,并将所述关键特征集输入到所述预后预测模型中,得到目标对象的预后效果。
优选的,所述免疫相关细胞对的免疫相关风险通过以下公式计算得到:
IRRS=∑ScoreA|B×Coef_A|B
其中,IRRS为免疫相关细胞对的免疫相关风险,ScoreA|B为免疫细胞对评分,A、B分别为体内两种不同的免疫细胞,细胞对A|B中,当A的表达量>B的表达量时,ScoreA|B记作1,当A的表达量<B的表达量时,ScoreA|B记作0;Coef_A|B为相关细胞对系数。
优选的,所述相关细胞对系数具体为:
当细胞对为效应记忆CD8+T细胞|CD56暗自然杀伤细胞时,所述相关细胞对系数为-0.201895537;
当细胞对为2型辅助T细胞|效应记忆CD8+T细胞时,所述相关细胞对系数为0.162775185;
当细胞对为未成熟B细胞|效应记忆CD4+T细胞时,所述相关细胞对系数为-0.167620476;
当细胞对为自然杀伤T细胞|未成熟B细胞时,所述相关细胞对系数为0.376203094;
当细胞对为髓样抑制细胞|单核细胞时,所述相关细胞对系数为-0.146018787;
当细胞对为效应记忆自然杀伤细胞|中心记忆CD8+T细胞时,所述相关细胞对系数为 -0.32046159。
优选的,所述相关细胞对系数的计算方法如下:
收集黑色素瘤患者的表达谱,去除无生存信息患者的表达谱,并收集所述黑色素瘤患者的临床信息;
基于ssGSEA算法计算28种免疫细胞的丰度,利用单因素Cox回归筛选出与预后相关的免疫细胞,其中,有预后意义的免疫细胞是指单因素coxP小于预设第一阈值的免疫细胞;
设有N种与预后相关的免疫细胞集,记为X1,X2,X3,...,XN,N≤28,每种免疫细胞集均包括多个同类型的免疫细胞;所有的28种免疫细胞集记为X1,X2,X3,...,XN,...,X28;
将与预后相关的N种免疫细胞分别与所有的28种免疫细胞集进行配对,形成多个细胞集对,记为:X1|X1,X1|X2,...,X1X28,...,XN|X1,XN|X2,...,XN|X28;
分别计算每个细胞集对的集配对值:
其集配对值为:Scorex1 i|x1 i′+Scorex1 i|x2 i′+,...,+Scorex1 i|xm′ i′+,...,+Scorexm i|xm′ i′;
其中,分别为免疫细胞集Xi内的第1,2,3,...,m个免疫细胞,分别为免疫细胞集Xi内的第1,2,3,...,m′个免疫细胞,m、m′分别为免疫细胞集Xi内免疫细胞总数,i、i′为免疫细胞的类别,取值范围为1,2,3,...,N;
判断每个细胞集对的集配对值是否处于预设的区间内:
当存在任意细胞集对的集配对值不处于预设的区间内,则剔除掉所述细胞集对,保留集配对值处于预设区间内的细胞集对;
通过单因素cox回归分析,以P<预设阈值为截断值,从保留的细胞集对中筛选出有显著统计学意义的细胞对,之后进行Lasso回归,输出细胞对,再采用多因素Cox回归的方式,计算出相关细胞对系数。
优选的,所述预后预测模型为列线图预测模型,所述预后效果为黑素瘤患者的生存概率,根据多个黑色素瘤患者的关键特征集及对应的预后效果值构建预后预测模型,包括以下步骤:
对TCGA的临床信息进行单因素Cox分析,保留有预后意义的临床变量,筛选的临床变量和IRRS作为关键特征值纳入多因素Cox回归分析,并构建每个关键特征值的多元Cox回归模型;通过R包rms将上述多因素Cox回归分析绘制为列线图。
优选的,所述临床关键特征包括年龄、溃疡、breslow厚度以及淋巴结分期;
所述免疫相关细胞对的免疫相关风险的多元Cox回归模型系数为0.889690055;
所述年龄的多元Cox回归模型系数为0.011632926;
当不存在溃疡时,所述溃疡的多元Cox回归模型系数为0;当存在溃疡时,所述溃疡的多元Cox回归模型系数为0.492972497;
所述breslow厚度的多元Cox回归模型系数为0.010817322;
当所述淋巴结分期为N0时,所述淋巴结分期的多元Cox回归模型系数为0;
当所述淋巴结分期为N1时,所述淋巴结分期的多元Cox回归模型系数为0.54422863;
当所述淋巴结分期为N2时,所述淋巴结分期的多元Cox回归模型系数为1.014801065;
当所述淋巴结分期为N3时,所述淋巴结分期的多元Cox回归模型系数为1.315284101;
每个多元Cox回归模型的常数均为-0.645602725。
优选的,所述列线图预测模型包括:免疫相关细胞对的免疫相关风险分值标尺、年龄分值标尺、溃疡分值标尺、深度分值标尺、淋巴结分期分值标尺以及总分值标尺,总分值标尺对应的预测对象为目标对象的生存概率;获取目标对象的关键特征值,并将所述关键特征值输入到所述预后预测模型中,得到目标对象的预后效果,具体包括:
将目标对象的关键特征值分别与其对应的分值标尺进行比较,得到各个关键特征的评分值,将各个关键特征的评分值相加,得到总评分值,将所述总评分值与总分值标尺进行比较,得到目标对象的生存概率。
一种计算机系统,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述方法的步骤。
本发明具有以下有益效果:
1、本发明中的基于免疫相关细胞对的黑素瘤预后预测方法及系统,通过用免疫相关细胞对的免疫相关风险替代基因表达谱,结合剔除冗余特征的临床预后信息,从临床指标和免疫微环境两个层面建立预后预测模型,再以该预后预测模型进行预测。相比现有技术,由于免疫相关细胞对的免疫相关风险在进行免疫微环境评估时,用相对大小代替绝对大小,一方面可以避免批次效应产生的误差,使得不同患者免疫细胞对评分之间具有可比较性;另一方面也不会受到肿瘤免疫浸润细胞测量方法的不同和基因注释的更新所造成的绝对值差异,因而,使用本发明中的预后预测模型,能有效解决批次效应产生的误差。
2、在优选方案中,本发明还从多个临床预后信息中筛选出特征冗余的关键特征(即年龄、溃疡与否、breslow深度以及TNM分期中的淋巴结分期)与所述免疫相关细胞对的免疫相关风险配合使用,能以最少的特征数据实现高准确率的预后预测,进一步减少预测的计算机资源消耗。
3、在优选方案中,本发明中的于免疫相关细胞对的免疫相关风险评分时,以肿瘤浸润细胞为核心,充分考虑免疫细胞组分不同导致的预后结果不同,能进一步提高预测准确性。
除了上面所描述的目的、特征和优点之外,本发明还有其它的目的、特征和优点。下面将参照附图,对本发明作进一步详细的说明。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实施例提供的一种基于免疫相关细胞对的黑素瘤预后预测方法的流程图;
图2为本发明实施例提供的免疫细胞配对图;
图3为本发明实施例提供的Nomogram模型;
图4为本发明实施例提供的Nomogram模型网页图;
图5为本发明实施例提供的Nomogram模型的受试者工作特征曲线(receiveroperating characteristic curve,简称ROC曲线)图;
图6为本发明实施例提供的Nomogram模型的生存分析图;
图7为本发明实施例提供的Nomogram模型的校准曲线图;
图8为本发明实施例提供的Nomogram模型的决策曲线分析法(Decision CurveAnalysis,DCA)图;
图9为本发明实施例提供的Nomogram模型对GSE54467队列的生存分析图;
图10为本发明实施例提供的Nomogram模型对GSE65904队列的生存分析图;
图11为本发明实施例提供的Nomogram模型对GSE91061,GSE115821,Liu et al三个队列的验证免疫治疗效果预测图。
具体实施方式
以下结合附图对本发明的实施例进行详细说明,但是本发明可以由权利要求限定和覆盖的多种不同方式实施。
实施例一:
如图1所示,本实施中公开了一种基于免疫相关细胞对的黑素瘤预后预测方法,包括:
从免疫微环境中筛选出与黑色瘤预后效果相关的免疫关键特征;其中,所述免疫关键特征包括免疫相关细胞对的免疫相关风险;
以减少特征冗余,并提高准确率为目的,从所述临床预后信息中筛选与所述免疫关键特征配合使用的临床关键特征;将所述免疫关键特征与所述临床关键特征进行合并,构建关键特征集;
从历史数据中获取多个黑色素瘤患者的关键特征集及对应的预后效果值,并根据多个黑色素瘤患者的关键特征集及对应的预后效果值构建预后预测模型;
获取目标对象的关键特征集,并将所述关键特征集输入到所述预后预测模型中,得到目标对象的预后效果。
在本实施例中,所述预后预测模型可以是机器学习模型、回归模型中的任意一种。其中,机器学习模型可采用深度神经网络模型,回归模型可采用线性拟合模型或列线图。
此外,在本实施例中,还公开了一种计算机系统,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述方法的步骤。
本发明中的基于免疫相关细胞对的黑素瘤预后预测方法及系统,通过用免疫相关细胞对的免疫相关风险替代基因表达谱,结合剔除冗余特征的临床预后信息,从临床指标和免疫微环境两个层面建立预后预测模型,再以该预后预测模型进行预测。相比现有技术,由于免疫相关细胞对的免疫相关风险在进行免疫微环境评估时,用相对大小代替绝对大小,一方面可以避免批次效应产生的误差,使得不同患者免疫细胞对评分之间具有可比较性;另一方面也不会受到肿瘤免疫浸润细胞测量方法的不同和基因注释的更新所造成的绝对值差异,因而,使用本发明中的预后预测模型,能有效解决批次效应产生的误差。
实施例二:
实施例二是实施例一的优选实施例,其与实施例一的不同之处,对基于免疫相关细胞对的黑素瘤预后预测方法的具体步骤进行了介绍:
本实施例中公开了一种基于免疫相关细胞对的黑素瘤预后预测方法,包括以下步骤:
步骤一、构建细胞对算法计算黑素瘤预后的免疫相关风险
我们构建的细胞对算法,即基于免疫相关细胞对的免疫相关风险评分(immunerelated risk score,IRRS),计算公式如下:
IRRS=∑ScoreA|B×Coef_A|B
其中:细胞对A|B中,当A的表达量>B的表达量时,ScoreA|B记作1,当A的表达量 <B的表达量时,ScoreA|B记作0,我们采用的细胞对和细胞对系数Coef如下所示:
具体的,IRRS的细胞对的筛选方法如下:
①收集TCGA中黑色素瘤患者的表达谱,去除无生存信息的患者,共458例,并收集其临床信息。
②基于ssGSEA算法计算28个免疫细胞的丰度,利用单因素Cox回归筛选出有预后意义的细胞。
③如图2所示,将与预后相关的免疫细胞分别与除自身以外的其余细胞进行配对,记作A|B,当A的表达量>B的表达量时,记作1,当A的表达量<B的表达量时,记作0,构建出0或1的矩阵,将0或1占总数的80%以上的细胞对去除,留下其余细胞对。
设有总共三个细胞A B C,赋值方式A大于B则A|B为1,B|A为0
集合A包括A,B
集合B包括A,B,C(即整个原集合)
矩阵形式如下:
将A|B细胞对那一列的全部样本的值相加得到总数sum,假如总样本为400个,预设比例为80%和20%,那么sum值大于320或sum小于20,则将该细胞对去除。
④通过单因素cox回归分析,以P<0.05为截断值,筛选出有显著统计学意义的细胞对,之后进行Lasso回归,输出细胞对,再采用多因素Cox回归的方式,计算出相关细胞对系数。
步骤二、基于所述黑素瘤预后的免疫相关风险构建Nomogram预后模型
S21、Nomogram预后模型的构建
对TCGA的临床信息进行单因素Cox分析,保留有预后意义的临床变量,筛选的临床变量和IRRS作为关键特征值纳入多因素Cox回归分析,并构建每个关键特征值的多元Cox回归模型;通过R包rms将上述多因素Cox回归分析绘制为列线图。
我们整合IRRS和临床指标,从肿瘤浸润性免疫细胞和临床特征双方向来进行预后预测,以保证预测效果。引入的临床指标包括:年龄(age)、溃疡与否(ulceration)、breslow深度(breslow depth)、和TNM分期中的淋巴结分期(N),建立的如图3所示的列线图(即nomogram)
其中,所述免疫相关细胞对的免疫相关风险的多元Cox回归模型系数为0.889690055;
其中,所述年龄的多元Cox回归模型系数为0.011632926;
其中,当不存在溃疡时,所述溃疡的多元Cox回归模型系数为0;当存在溃疡时,所述溃疡的多元Cox回归模型系数为0.492972497;
其中,所述breslow厚度的多元Cox回归模型系数为0.010817322;
其中,当所述淋巴结分期为N0时,所述淋巴结分期的多元Cox回归模型系数为0;
当所述淋巴结分期为N1时,所述淋巴结分期的多元Cox回归模型系数为0.54422863;
当所述淋巴结分期为N2时,所述淋巴结分期的多元Cox回归模型系数为1.014801065;
当所述淋巴结分期为N3时,所述淋巴结分期的多元Cox回归模型系数为1.315284101;
每个多元Cox回归模型的常数均为-0.645602725。
S22、Nomogram模型的进一步可视化
常规的Nomogram需要医生用尺子对照,得到患者的风险预测,且可能受到打印模糊的影响,所以为了实现进一步的可视化,我们将其开发为如图4所示的网页模式,仅需输入患者的各项指标即可获得1年、3年、6年的生存预测。
S23、IRRS验证
分析本发明的Nomogram模型的ROC曲线、校准曲线、DCA以及生存分析,其中,Nomogram模型的ROC曲线、校准曲线、DCA以及生存分析如图5-8所示,通过GSE54467,GSE65904两个队列验证预后预测效果,其中两个队列验证预后预测效果如图9、图10所示,并通过GSE91061,GSE115821,Liu et al三个队列验证免疫治疗效果预测效果,其中,免疫治疗效果预测效果如图11所示,从图5-11可以看出,本发明的Nomogram模型ROC曲线和生存分析都证明了本发明中的Nomogram模型具有良好的预后预测能力。
综上所示,本发明在构建模型时,以肿瘤浸润细胞为核心,充分考虑免疫细胞组分不同导致的预后结果不同,并采用免疫细胞对评分,比较两种免疫细胞大小,并以0或1赋值,用相对大小代替绝对大小,如此只需要样本内部进行比较,得到细胞对赋值为0或1,一方面可以避免批次效应产生的误差,使得不同患者免疫细胞对评分之间具有可比较性;另一方面也不会受到肿瘤免疫浸润细胞测量方法的不同和基因注释的更新所造成的绝对值差异,并在免疫细胞对算法的基础上,结合临床预后信息,从临床指标和免疫微环境两个层面建立 nomogram预后模型,以保证预测效果。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于免疫相关细胞对的黑素瘤预后预测方法,其特征在于,包括以下步骤:
从免疫微环境中筛选出与黑色瘤预后效果相关的免疫关键特征;其中,所述免疫关键特征包括免疫相关细胞对的免疫相关风险;
以减少特征冗余,并提高准确率为目的,从所述临床预后信息中筛选与所述免疫关键特征配合使用的临床关键特征;将所述免疫关键特征与所述临床关键特征进行合并,构建关键特征集;
从历史数据中获取多个黑色素瘤患者的关键特征集及对应的预后效果值,并根据多个黑色素瘤患者的关键特征集及对应的预后效果值构建预后预测模型;
获取目标对象的关键特征集,并将所述关键特征集输入到所述预后预测模型中,得到目标对象的预后效果。
2.根据权利要求1所述的基于免疫相关细胞对的黑素瘤预后预测方法,其特征在于,所述免疫相关细胞对的免疫相关风险通过以下公式计算得到:
IRRS=∑ScoreA|B×Coef_A|B
其中,IRRS为免疫相关细胞对的免疫相关风险,ScoreA|B为免疫细胞对评分,A、B分别为体内两种不同的免疫细胞,细胞对A|B中,当A的表达量>B的表达量时,ScoreA|B记作1,当A的表达量<B的表达量时,ScoreA|B记作0;Coef_AB为相关细胞对系数。
3.根据权利要求2所述的基于免疫相关细胞对的黑素瘤预后预测方法,其特征在于,所述相关细胞对系数具体为:
当细胞对为效应记忆CD8+T细胞|CD56暗自然杀伤细胞时,所述相关细胞对系数为-0.201895537;
当细胞对为2型辅助T细胞|效应记忆CD8+T细胞时,所述相关细胞对系数为0.162775185;
当细胞对为未成熟B细胞|效应记忆CD4+T细胞时,所述相关细胞对系数为-0.167620476;
当细胞对为自然杀伤T细胞|未成熟B细胞时,所述相关细胞对系数为0.376203094;
当细胞对为髓样抑制细胞|单核细胞时,所述相关细胞对系数为-0.146018787;
当细胞对为效应记忆自然杀伤细胞|中心记忆CD8+T细胞时,所述相关细胞对系数为-0.32046159。
4.根据权利要求2所述的基于免疫相关细胞对的黑素瘤预后预测方法,其特征在于,所述相关细胞对系数的计算方法如下:
收集黑色素瘤患者的表达谱,去除无生存信息患者的表达谱,并收集所述黑色素瘤患者的临床信息;
基于ssGSEA算法计算28种免疫细胞的丰度,利用单因素Cox回归筛选出与预后相关的免疫细胞,其中,有预后意义的免疫细胞是指单因素cox P小于预设第一阈值的免疫细胞;
设有N种与预后相关的免疫细胞集,记为X1,X2,X3,...,XN,N≤28,每种免疫细胞集均包括多个同类型的免疫细胞;所有的28种免疫细胞集记为X1,X2,X3,...,XN,...,X28;
将与预后相关的N种免疫细胞分别与所有的28种免疫细胞集进行配对,形成多个细胞集对,记为:X1|X1,X1|X2,...,X1X28,...,XN|X1,XN|X2,...,XN|X28;
分别计算每个细胞集对的集配对值:
其集配对值为:Scorex1 i|x1 i′+Scorex1 i|x2 i′+,...,+Scorex1 i|xm′ i′+,...,+Scorexm i|xm′ i′;
其中,分别为免疫细胞集Xi内的第1,2,3,...,m个免疫细胞,分别为免疫细胞集Xi内的第1,2,3,...,m′个免疫细胞,m、m′分别为免疫细胞集Xi内免疫细胞总数,i、i′为免疫细胞的类别,取值范围为1,2,3,...,N;
判断每个细胞集对的集配对值是否处于预设的区间内:
当存在任意细胞集对的集配对值不处于预设的区间内,则剔除掉所述细胞集对,保留集配对值处于预设区间内的细胞集对;
通过单因素cox回归分析,以P<预设阈值为截断值,从保留的细胞集对中筛选出有显著统计学意义的细胞对,之后进行Lasso回归,输出细胞对,再采用多因素Cox回归的方式,计算出相关细胞对系数。
5.根据权利要求1所述的基于免疫相关细胞对的黑素瘤预后预测方法,其特征在于,所述预后预测模型为列线图预测模型,所述预后效果为黑素瘤患者的生存概率,根据多个黑色素瘤患者的关键特征集及对应的预后效果值构建预后预测模型,包括以下步骤:
对TCGA的临床信息进行单因素Cox分析,保留有预后意义的临床变量,筛选的临床变量和IRRS作为关键特征值纳入多因素Cox回归分析,并构建每个关键特征值的多元Cox回归模型;通过R包rms将上述多因素Cox回归分析绘制为列线图。
6.根据权利要求5所述的基于免疫相关细胞对的黑素瘤预后预测方法,其特征在于,所述临床关键特征包括年龄、溃疡、breslow厚度以及淋巴结分期;
所述免疫相关细胞对的免疫相关风险的多元Cox回归模型系数为0.889690055;
所述年龄的多元Cox回归模型系数为0.011632926;
当不存在溃疡时,所述溃疡的多元Cox回归模型系数为0;当存在溃疡时,所述溃疡的多元Cox回归模型系数为0.492972497;
所述breslow厚度的多元Cox回归模型系数为0.010817322;
当所述淋巴结分期为N0时,所述淋巴结分期的多元Cox回归模型系数为0;
当所述淋巴结分期为N1时,所述淋巴结分期的多元Cox回归模型系数为0.54422863;
当所述淋巴结分期为N2时,所述淋巴结分期的多元Cox回归模型系数为1.014801065;
当所述淋巴结分期为N3时,所述淋巴结分期的多元Cox回归模型系数为1.315284101;
每个多元Cox回归模型的常数均为-0.645602725。
7.根据权利要求6所述的基于免疫相关细胞对的黑素瘤预后预测方法,其特征在于,所述列线图预测模型包括:免疫相关细胞对的免疫相关风险分值标尺、年龄分值标尺、溃疡分值标尺、深度分值标尺、淋巴结分期分值标尺以及总分值标尺,总分值标尺对应的预测对象为目标对象的生存概率;获取目标对象的关键特征值,并将所述关键特征值输入到所述预后预测模型中,得到目标对象的预后效果,具体包括:
将目标对象的关键特征值分别与其对应的分值标尺进行比较,得到各个关键特征的评分值,将各个关键特征的评分值相加,得到总评分值,将所述总评分值与总分值标尺进行比较,得到目标对象的生存概率。
8.一种计算机系统,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,处理器执行计算机程序时实现上述权利要求1至7任一方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210886164.3A CN115171887B (zh) | 2022-07-26 | 2022-07-26 | 基于免疫相关细胞对的黑素瘤预后预测系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210886164.3A CN115171887B (zh) | 2022-07-26 | 2022-07-26 | 基于免疫相关细胞对的黑素瘤预后预测系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115171887A true CN115171887A (zh) | 2022-10-11 |
CN115171887B CN115171887B (zh) | 2024-01-09 |
Family
ID=83496391
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210886164.3A Active CN115171887B (zh) | 2022-07-26 | 2022-07-26 | 基于免疫相关细胞对的黑素瘤预后预测系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115171887B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110275089A1 (en) * | 2010-02-18 | 2011-11-10 | Dusan Bogunovic | Methods for predicting survival in metastatic melanoma patients |
CN112011616A (zh) * | 2020-09-02 | 2020-12-01 | 复旦大学附属中山医院 | 预测肝细胞癌肿瘤免疫浸润和术后生存时间的免疫基因预后模型 |
CN112567052A (zh) * | 2018-06-21 | 2021-03-26 | 癌症研究技术有限公司 | 预后和治疗响应预测方法 |
-
2022
- 2022-07-26 CN CN202210886164.3A patent/CN115171887B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110275089A1 (en) * | 2010-02-18 | 2011-11-10 | Dusan Bogunovic | Methods for predicting survival in metastatic melanoma patients |
CN112567052A (zh) * | 2018-06-21 | 2021-03-26 | 癌症研究技术有限公司 | 预后和治疗响应预测方法 |
CN112011616A (zh) * | 2020-09-02 | 2020-12-01 | 复旦大学附属中山医院 | 预测肝细胞癌肿瘤免疫浸润和术后生存时间的免疫基因预后模型 |
Also Published As
Publication number | Publication date |
---|---|
CN115171887B (zh) | 2024-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pepe et al. | Testing for improvement in prediction model performance | |
CN112133365B (zh) | 评估肿瘤微环境的基因集、评分模型及其应用 | |
CN111862085A (zh) | 一种周围型nsclc的隐匿性n2淋巴结转移的预测方法及系统 | |
CN113096739A (zh) | 一种卵巢癌的免疫预后诊断标志物组合的分析方法 | |
CN114724716A (zh) | 进展为2型糖尿病的风险预测的方法、模型训练及装置 | |
CN113355419B (zh) | 一种乳腺癌预后风险预测标志组合物及应用 | |
CN115295075A (zh) | 复杂疾病遗传风险评估模型的构建方法、模型及其应用 | |
CN113517073A (zh) | 肺癌手术后生存率预测方法和系统 | |
CN116092664A (zh) | 一种胰腺癌预后预测模型建立方法 | |
CN115470989A (zh) | 基于机器学习的预测早产儿支气管肺发育不良风险的方法 | |
CN115497622A (zh) | 一种接受抗逆转录病毒疗法的hiv/aids患者免疫重建结果预测模型及其建立方法 | |
CN115033758A (zh) | 肾透明细胞癌预后标记基因的应用及筛选、预后预测方法 | |
CN117936111A (zh) | 肝细胞癌预后评分模型构建方法、装置、设备及存储介质 | |
CN115171887B (zh) | 基于免疫相关细胞对的黑素瘤预后预测系统 | |
Jarman et al. | An integrated framework for risk profiling of breast cancer patients following surgery | |
CN113614537A (zh) | 癌症预后 | |
CN114678062B (zh) | 基于多组学特征的肝细胞癌预后预测系统及其预测方法 | |
CN114672569A (zh) | 基于色氨酸代谢基因的肝癌预后评估方法 | |
CN116469552A (zh) | 一种用于乳腺癌多基因遗传风险评估的方法和系统 | |
KR102305806B1 (ko) | 임상 정보와 유전자 다형성 정보를 이용한 폐암 환자의 수술 후 예후 예측 방법 | |
KR102541510B1 (ko) | 국가건강검진 자료를 이용한 자살 예측 모델 구축 방법 | |
CN110197701B (zh) | 一种新型多发性骨髓瘤诺模图构建方法 | |
CN117174323B (zh) | 一种SFTs整合风险评估系统 | |
CN117476097B (zh) | 一种基于三级淋巴结构特征基因的结直肠癌预后和治疗反应预测模型及其构建方法和应用 | |
CN117766024B (zh) | 一种卵巢癌cd8+ t细胞相关预后评估方法、系统及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |