CN115188475A - 一种狼疮肾炎患者风险预测方法 - Google Patents
一种狼疮肾炎患者风险预测方法 Download PDFInfo
- Publication number
- CN115188475A CN115188475A CN202210858799.2A CN202210858799A CN115188475A CN 115188475 A CN115188475 A CN 115188475A CN 202210858799 A CN202210858799 A CN 202210858799A CN 115188475 A CN115188475 A CN 115188475A
- Authority
- CN
- China
- Prior art keywords
- patient
- survival
- characteristic
- neural network
- risk
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Abstract
本发明公开了一种狼疮肾炎患者风险预测方法,包括:根据LN诊断标准从SLE患者数据库筛选出LN患者,进行数据预处理;从预处理的特征指标中筛选出对LN患者生存结果影响较大的特征指标;将筛选的特征指标输入到代价敏感神经网络中进行训练,直至加权均方误差损失函数收敛,完成对代价敏感神经网络的训练,来预测患者的生存结局,将代价敏感神经网络输出的概率值与筛选出的特征指标一起输入到Cox比例风险模型中,输出各个特征指标对结局变量的贡献度;将各个特征指标对结局变量的贡献度绘制成列线图,预测LN患者的生存时间概率。本发明将代价敏感神经网络和Cox生存模型相融合,提高狼疮肾炎患者风险预测的准确性。
Description
技术领域
本发明涉及智能医疗技术领域,特别是涉及一种狼疮肾炎患者风险预测方法。
背景技术
系统性红斑狼疮(systemic lupus erythematosus,SLE)是一种慢性弥漫性结缔组织,可累及多器官和多系统,肾脏是最常受累的器官之一。大约25%~50%的SLE患者在首次诊断时皆会伴有肾脏症状,高达60%的成年SLE患者出现肾脏症状。虽然在患者中早期使用免疫抑制药物可以降低狼疮肾炎(LN)死亡或者终末期肾病(ESRD)的风险,但建立一种有效的方法来评估患者的预后状态对于指导LN患者的治疗至关重要。
大多数关于LN患者预后的研究集中在使用传统统计方法分析预后和生存因素上:通过单因素分析筛选的预测因子的Cox比例风险模型选择独立预测因子,并使用Kaplan-Meier分析绘制生存曲线。例如,霍普金斯大学展开了关于狼疮性肾炎患者肾缓解状态和长期肾脏生存期的研究;Moroni等人展开了关于狼疮性肾炎患者在临床组织学表现与肾脏结局之间模式变化的研究;Medina-Rosas等人进行关于部分或者完全蛋白尿恢复对狼疮肾炎患者长期肾脏结局的影响的研究,关于SLE恶病质的危险因素及其与疾病活动和损害的关系大多采用该方法。
先前关于狼疮性肾炎预后因素的研究表明,对狼疮性肾炎有许多独立的影响,涉及各个方面,如人口因素、实验室指标、肾活检的病理发现、合并症和并发症,如男性、老年、社会经济地位、肾间质CD8+T细胞浸润和肾活检慢性指数高、终末期肾病等。然而,来自不同研究会有相互矛盾的结果,在其他一些研究中,肾脏组织学分级,男性,年龄和肾脏耀斑的数量与LN患者的预后没有显着相关性。少有研究根据临床病理特征和治疗药物等评估了LN患者的生存状况。如今,机器学习在风湿性疾病中的研究越来越广泛。传统的生存分析使用Cox比例风险模型,这是一个半参数模型,假设患者的死亡风险是其协变量的线性组合,通过建立一个更丰富的生存模型,以更好地非线性拟合协变量。神经网络学习是一种数学模型,可以通过模仿生物神经网络的结构和功能来学习高度复杂的非线性函数。
到目前为止,LN患者的预后和生存状态的评估一直是风湿病学的主要困难和挑战,目前还没有关于评估LN患者生存状况的研究。建立有效的生存状态评估模型,一方面可以避免过度治疗造成的药物副作用和不必要的医疗费用,另一方面可以识别重症患者并及时采取积极措施,改善LN患者的生存结局。
发明内容
针对现有技术中存在的问题,本发明提供一种狼疮肾炎患者风险预测方法,将代价敏感神经网络和Cox生存模型相融合,提高狼疮肾炎患者风险预测的准确性。
为了达到上述目的,本发明采用的技术方案是:一种狼疮肾炎患者风险预测方法,具体包括如下步骤:
步骤S1:从SLE患者数据库按照LN标准筛选出LN患者,根据LN患者记录的特征指标,进行数据预处理;
步骤S2:从预处理后的特征指标中筛选出对LN患者生存结果影响较大的特征指标;
步骤S3:将步骤S2筛选出的特征指标输入到代价敏感神经网络中进行训练,直至加权均方误差损失函数收敛,完成对代价敏感神经网络的训练,通过训练好的代价敏感神经网络预测LN患者的生存结局;
步骤S4:将代价敏感神经网络的输出概率值作为新特征指标与步骤S2筛选出的特征指标一起输入到Cox比例风险模型中,输出各个特征指标对结局变量的贡献度;
步骤S5:将各个特征指标对结局变量的贡献度绘制成列线图,预测LN患者的生存时间概率。
进一步地,所述特征指标包括:临床表现、入院和出院SLEDAI评分、首发症状、器官受累。
进一步地,所述数据预处理包括:对缺失特征处理和异常特征处理;对缺失数据的处理为:对于每一个特征指标,如果超过1/2的LN患者缺失,直接丢弃该特征指标;否则采用均值插值和众数插值法填补该特征指标;对异常特征的处理为:采用箱线图来检测异常特征指标,并通过替换法进行处理。
进一步地,步骤S2将预处理的特征指标均通过Kaplan-Meier方法绘制生存曲线,并使用对数秩检验比较绘制的生存曲线,当检验值P小于0.05时,表明对应的特征指标对LN患者生存结果影响较大,进行保留。
进一步地,所述代价敏感神经网络的模型E(ω,b,v,c)为:
其中,ω为输入层到隐含层的权值矩阵,v为隐含层到输出层的权值矩阵,b为输入层到隐含层的阈值向量,c隐含层到输出层的阈值向量,q为样本总量,样本为LN患者记录,p为样本的索引,l为输出层神经元总数,k为输出层神经元的索引,yk(p)为第p个样本在输出层第k个神经元的实际值;为第p个样本在输出层第k个神经元的输出值。
进一步地,所述加权均方误差损失函数dyn_weight_MSE(y,outx)为:
dyn_weight_MSE(y,outx)=Weight*MSE
其中,y为样本标签,存活为1,死亡为0,outx为代价敏感神经网络的输出概率值,Weight为权重,N为每个批次患者总数,Np为每个批次死亡患者的数量,Nn为每个批次存活患者的数量,MSE为均方误差函数, batchsize为批量大小,yp为第p个样本标签的实际取值,为代价敏感神经网络的输出概率值。
进一步地,所述Cox比例风险模型为:
其中,I为输入到Cox比例风险模型中的特征指标数量,i为输入到Cox比例风险模型中的特征指标索引,xi为第i个特征指标,βi为第i个特征指标的偏回归系数,h0(t)为基准风险函数。
进一步地,步骤S5的过程如下:将各个特征指标对结局变量的贡献度绘制成列线图,预测LN患者的生存时间概率,根据Cox比例风险模型中各个特征指标对结局变量的贡献程度,为每个特征指标的每个取值水平进行赋分,再将各个评分相加得到总评分,最后通过总评分与结局事件发生概率之间的函数转换关系,预测出该LN患者的生存时间概率。
与现有技术相比,本发明具有如下有益效果:本发明狼疮肾炎患者风险预测方法将代价敏感神经网络与Cox比例风险模型进行融合,将代价敏感神经网络预测患者的生存概率作为新特征指标输入Cox比例风险模型中,提高预测的准确性,本发明狼疮肾炎患者风险预测方法不仅能预测出LN患者的生存结局,同时还能预测出患者生存的时间概率,有助于风湿病学家制定个性化的治疗方案,以提高狼疮肾炎患者的生存率和生活质量。
附图说明
图1是本发明狼疮肾炎患者风险预测方法的流程图;
图2是预测LN患者生存结局的代价敏感神经网络测试集的ROC曲线;
图3是绘制的LN患者生存时间概率列线图。
具体实施方式
下面结合附图和具体实施例,进一步阐明本发明。
如图1为本发明狼疮肾炎患者风险预测方法流程图,该狼疮肾炎患者风险预测方法具体包括如下步骤:
步骤S1:从SLE患者数据库按照LN标准筛选出LN患者,每个LN患者均记录特征指标,本发明中特征指标包括:临床表现、入院和出院SLEDAI评分、首发症状、器官受累;并对每个LN患者的特征指标进行数据预处理,包括:对缺失特征处理和异常特征处理;对缺失数据的处理为:对于每一个特征指标,如果超过1/2的LN患者缺失,直接丢弃该特征指标;否则采用均值插值和众数插值法填补该特征指标;对异常特征的处理为:采用箱线图来检测异常特征指标,并通过替换法进行处理。
步骤S2:从预处理的特征指标中筛选出对LN患者生存结果影响较大的特征指标;具体地,将预处理的特征指标均通过Kaplan-Meier方法绘制生存曲线,并使用对数秩检验比较绘制的生存曲线,当检验值P小于0.05时,表明对应的特征指标对LN患者生存结果影响较大,进行保留。
步骤S3:由于筛选出的特征指标对应的存活和死亡患者的样本数量不均衡,如存活样本数多于死亡患者,代价敏感能够对不同类别施加错分惩罚,增加错分少类样本的惩罚力度,从而解决类别不平衡问题,因此,将步骤S2筛选出的特征指标输入到代价敏感神经网络中进行训练,直至加权均方误差损失函数收敛,完成对代价敏感神经网络的训练,将某LN患者的特征指标输入训练好的代价敏感神经网络中,输出代价敏感神经网络的输出概率值,将代价敏感神经网络的输出概率值经过sigmoid转换,预测LN患者的生存结局;
本发明中代价敏感神经网络的模型E(ω,b,v,c)为:
其中,ω为输入层到隐含层的权值矩阵,v为隐含层到输出层的权值矩阵,b为输入层到隐含层的阈值向量,c隐含层到输出层的阈值向量,q为样本总量,样本为LN患者记录,一个样本对应一条LN患者记录,p为样本的索引,l为输出层神经元总数,k为输出层神经元的索引,yk(p)为第p个样本在输出层第k个神经元的实际值;为第p个样本在输出层第k个神经元的输出值。
本发明中加权均方误差损失函数dyn_weight_MSE(y,outx)为:
dyn_weight_MSE(y,outx)=Weight*MSE
其中,y为样本标签,存活为1,死亡为0,outx为预测患者的生存概率,Weight为权重,N为每个批次患者总数,Np为每个批次死亡患者的数量,Nn为每个批次存活患者的数量,MSE为均方误差函数,batchsize为批量大小,本发明中取值为16,yp为第p个样本标签的实际取值,为代价敏感神经网络的输出概率值。
图2是预测LN患者生存结局的代价敏感神经网络测试集的ROC曲线,面对筛选出的特征指标对应的存活和死亡患者的样本数量不均衡的场景,ROC曲线能够更加稳定地反映代价敏感神经网络好坏的指标;AUC表示ROC曲线下的面积,反映了代价敏感神经网络的分类性能,介于0-1之间,AUC越大,分类器效果越好,本发明中代价敏感神经网络的AUC接近0.8,说明该代价敏感神经网络具有较好的分类性能。
步骤S4:将输出的代价敏感神经网络的输出概率值作为新特征指标与步骤S2筛选出的特征指标一起输入到Cox比例风险模型中,输出各个特征指标对结局变量的贡献度,代价敏感神经网络的输出概率值能够描述LN患者的存活或者死亡的概率,作为新特征指标输入到Cox比例风险模型中大大提高生存时间概率预测的准确率;本发明中Cox比例风险模型的基本形式为:
其中,I为输入到Cox比例风险模型中的特征指标数量,i为输入到Cox比例风险模型中的特征指标索引,xi为第i个特征指标,βi为第i个特征指标的偏回归系数,h0(t)为基准风险函数;将上述基本形式进行对数转换,变换成:
将特征指标xi作为回归方程中的自变量,将风险函数h(t)和基准风险函数h0(t)的比值的对数当作因变量,此时Cox回归的表达形式近似逻辑回归的公式,若回归方程中某个自变量对应的偏回归系数βi>0,风险比例HR>1,表明随着该自变量值的增加,风险会增加,生存时间会减少,在临床上,将该自变量称为坏预后因子,相反,将偏回归系数βi<0,风险比例HR<1的自变量称为好预后因子。
步骤S5:将各个特征指标对结局变量的贡献度绘制成列线图,预测LN患者的生存时间概率,具体地,将各个特征指标对结局变量的贡献度绘制成列线图,预测LN患者的生存时间概率,根据Cox比例风险模型中各个特征指标对结局变量的贡献程度,为每个特征指标的每个取值水平进行赋分,再将各个评分相加得到总评分,最后通过总评分与结局事件发生概率之间的函数转换关系,预测出该LN患者的生存时间概率。
如图3为通过本发明狼疮肾炎患者风险预测方法绘制的LN患者生存时间概率列线图,每个特征指标对应一个得分,依次累计各个特征指标的得分,得到总分,然后就有对应1年、2年和5年的生存概率,通过绘制的LN患者生存时间概率列线图,可将复杂的Cox比例风险模型可视化。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施方式,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。
Claims (8)
1.一种狼疮肾炎患者风险预测方法,其特征在于,具体包括如下步骤:
步骤S1:从SLE患者数据库按照LN标准筛选出LN患者,根据LN患者记录的特征指标,进行数据预处理;
步骤S2:从预处理后的特征指标中筛选出对LN患者生存结果影响较大的特征指标;
步骤S3:将步骤S2筛选出的特征指标输入到代价敏感神经网络中进行训练,直至加权均方误差损失函数收敛,完成对代价敏感神经网络的训练,通过训练好的代价敏感神经网络预测LN患者的生存结局;
步骤S4:将代价敏感神经网络的输出概率值作为新特征指标与步骤S2筛选出的特征指标一起输入到Cox比例风险模型中,输出各个特征指标对结局变量的贡献度;
步骤S5:将各个特征指标对结局变量的贡献度绘制成列线图,预测LN患者的生存时间概率。
2.根据权利要求1所述狼疮肾炎患者风险预测方法,其特征在于,所述特征指标包括:临床表现、入院和出院SLEDAI评分、首发症状、器官受累。
3.根据权利要求1所述狼疮肾炎患者风险预测方法,其特征在于,所述数据预处理包括:对缺失特征处理和异常特征处理;对缺失数据的处理为:对于每一个特征指标,如果超过1/2的LN患者缺失,直接丢弃该特征指标;否则采用均值插值和众数插值法填补该特征指标;对异常特征的处理为:采用箱线图来检测异常特征指标,并通过替换法进行处理。
4.根据权利要求1所述狼疮肾炎患者风险预测方法,其特征在于,步骤S2将预处理的特征指标均通过Kaplan-Meier方法绘制生存曲线,并使用对数秩检验比较绘制的生存曲线,当检验值P小于0.05时,表明对应的特征指标对LN患者生存结果影响较大,进行保留。
8.根据权利要求1所述狼疮肾炎患者风险预测方法,其特征在于,步骤S5的过程如下:将各个特征指标对结局变量的贡献度绘制成列线图,预测LN患者的生存时间概率,根据Cox比例风险模型中各个特征指标对结局变量的贡献程度,为每个特征指标的每个取值水平进行赋分,再将各个评分相加得到总评分,最后通过总评分与结局事件发生概率之间的函数转换关系,预测出该LN患者的生存时间概率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210858799.2A CN115188475A (zh) | 2022-07-21 | 2022-07-21 | 一种狼疮肾炎患者风险预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210858799.2A CN115188475A (zh) | 2022-07-21 | 2022-07-21 | 一种狼疮肾炎患者风险预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115188475A true CN115188475A (zh) | 2022-10-14 |
Family
ID=83519349
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210858799.2A Pending CN115188475A (zh) | 2022-07-21 | 2022-07-21 | 一种狼疮肾炎患者风险预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115188475A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117116471A (zh) * | 2023-10-23 | 2023-11-24 | 四川大学华西医院 | 建立预测增殖或非增殖狼疮肾炎模型的方法及预测方法 |
-
2022
- 2022-07-21 CN CN202210858799.2A patent/CN115188475A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117116471A (zh) * | 2023-10-23 | 2023-11-24 | 四川大学华西医院 | 建立预测增殖或非增殖狼疮肾炎模型的方法及预测方法 |
CN117116471B (zh) * | 2023-10-23 | 2024-01-23 | 四川大学华西医院 | 建立预测增殖或非增殖狼疮肾炎模型的方法及预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7702598B2 (en) | Methods and systems for predicting occurrence of an event | |
CN110634563A (zh) | 一种糖尿病肾病-非糖尿病肾病鉴别诊断装置 | |
CN111508603A (zh) | 一种基于机器学习的出生缺陷预测及风险评估方法、系统及电子设备 | |
WO2023087917A1 (zh) | 基于多维分层漂移扩散模型的认知决策评估方法及系统 | |
CN114220540A (zh) | 一种糖尿病肾病风险预测模型的构建方法及应用 | |
CN116705325A (zh) | 一种伤口感染风险评估方法及其系统 | |
CN115188475A (zh) | 一种狼疮肾炎患者风险预测方法 | |
CN113674862A (zh) | 一种基于机器学习的急性肾功能损伤发病预测方法 | |
CN113643756A (zh) | 一种基于深度学习的蛋白质相互作用位点预测方法 | |
CN116189909B (zh) | 基于推举算法的临床医学判别方法及系统 | |
CN117274185A (zh) | 检测方法、检测模型产品、电子设备及计算机存储介质 | |
CN111816303A (zh) | 一种基于机器学习的难治性精神分裂症风险的预测方法 | |
Rahman et al. | Automatic classification of patients with myocardial infarction or myocarditis based only on clinical data: A quick response | |
US20190221309A1 (en) | Coronary Artery Disease Screening Method by Using Cardiovascular Markers and Machine Learning Algorithms | |
RU2723674C1 (ru) | Способ прогнозирования диагноза на основе обработки данных, содержащих медицинские знания | |
CN114141360A (zh) | 基于惩罚cox回归的乳腺癌预测方法 | |
CN113128654A (zh) | 一种用于冠心病预诊断中的改进型随机森林模型及其预诊断系统 | |
Yördan et al. | Hybrid AI-Based Chronic Kidney Disease Risk Prediction | |
Swarna et al. | Detection of Colon Cancer Using Inception V3 and Ensembled CNN Model | |
CN111554348A (zh) | 一种分泌入支气管肺泡灌洗液蛋白质预测方法 | |
Jusman et al. | Comparison Performance of Prostate Cell Images Classification using Pretrained Convolutional Neural Network Models | |
EP3855452A1 (en) | Tumor classification | |
KR102485316B1 (ko) | 딥러닝을 활용한 개인의 전체 유전체 데이터와 암 발생과의 연관성 예측에 관한 방법 | |
Luciani et al. | Finding the needle by modeling the haystack: Pulmonary embolism in an emergency patient with cardiorespiratory manifestations | |
Ivanusa et al. | Prognostic model of acute pancreatitis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |