CN115049069A - 一种可视化交互式的脓毒症早期智能预警方法 - Google Patents

一种可视化交互式的脓毒症早期智能预警方法 Download PDF

Info

Publication number
CN115049069A
CN115049069A CN202210616733.2A CN202210616733A CN115049069A CN 115049069 A CN115049069 A CN 115049069A CN 202210616733 A CN202210616733 A CN 202210616733A CN 115049069 A CN115049069 A CN 115049069A
Authority
CN
China
Prior art keywords
patient
model
feature
sepsis
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210616733.2A
Other languages
English (en)
Inventor
刘澄玉
李润发
杨美程
李建清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202210616733.2A priority Critical patent/CN115049069A/zh
Publication of CN115049069A publication Critical patent/CN115049069A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种可视化交互式的脓毒症早期智能预警方法,具体步骤如下:第一步:病人数据库构建,通过数据库技术,完成病人数据信息的采集与存储;第二步:与数据库技术进行交互,完成病人临床电子病历数据的获取,构建以小时为单位步长的患者表格化时间序列;第三步:数据预处理及特征提取,提取出病人信息采集中反映测量频率、测量时间间隔等信息的特征;第四步:基于LightGBM等算法完成模型的训练及部署,模型训练过程中使用贝叶斯超参数优化算法;第五步:临床可解释、可视化、可交互界面搭建。本发明有效提高了患者风险的预警能力,为ICU医生在病人脓毒症前提前干预,同时可解释、可视化与可交互为ICU病人的辅助决策提供了有力保证。

Description

一种可视化交互式的脓毒症早期智能预警方法
技术领域
本发明涉及医学技术领域,尤其涉及一种可视化交互式的脓毒症早期智能预警方法。
背景技术
脓毒症是重症监护病房中最常见的危急情况之一,发生在机体对感染的反应失去控制之时。由于其严重的发病率,死亡率和医疗费用,它一直是重症监护医学临床和基础研究的重点。脓毒症的病情凶险,病死率高,全球每天约14,000 人死于其并发症。抗生素的早期干预可以提高脓毒症患者的存活率。
随着重症监护病房(Intensive Care Unit,ICU)临床医生被大数据淹没,机器学习及大数据在临床实践中将变得更加重要。开发和实施机器学习算法来预测脓毒症,并评估其对临床实践和患者的影响有很大的价值。因此基于ICU病人的电子健康记录(Electronic Health Record,EHR)数据,使用机器学习方法处理EHR 大数据,获得脓毒症的早期预警模型是可行的办法。但是由于缺乏可解释性,基于机器学习的已开发模型在重症监护室决策支持中显示出较差的实用性。因此开发一个可视化交互式的脓毒症早期智能预警方法具有很高的价值。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提出一种可视化交互式的脓毒症早期智能预警方法,对于辅助临床医生提前干预病人脓毒症的发生有着很高的实际意义。本发明,首先构建病人数据库,然后获取病人临床电子病历数据、对数据进行预处理和特征提取,然后基于LightGBM算法完成模型的训练及部署,利用SHAP、LIME方法对模型进行可解释化分析,利用Flask框架和Vue框架构建前后端系统,实现临床可解释、可视化、可交互界面搭建。
为实现上述目的,本发明提供了一种可视化交互式的脓毒症早期智能预警方法,其步骤如下:
S1:病人数据库构建,通过ICU病房内的呼吸机、心电图机、血糖仪、血气分析仪、医用吊塔、输液泵等仪器完成病人信息的采集,利用MySQL数据库技术完成病人数据的存储;
S2:临床电子病历数据的获取,利用SQL语言完成病人信息的提取,构建以小时为单位步长的患者表格化时间序列,完成Flask框架与病人数据库的交互。脓毒症的定义标准参考Sepsis-3.0标准;
S3:数据预处理与特征提取,提取出病人信息采集中反映测量频率、测量时间间隔等信息的特征,提取临床经验特征;
S4:基于LightGBM算法完成模型的训练及部署,首先利用LightGBM算法,基于贝叶斯超参数优化方法,使用病人的电子病历信息对模型进行训练。将完成训练的模型进行部署,利用模型进行病人脓毒症的预测;
S5:临床可解释、可视化、可交互界面搭建,利用Flask框架和Vue框架构建前后端系统,完成交互。基于可解释信息搭建临床可视化交互界面以辅助临床决策,建立从原始数据和可视化预警信息显示到医生实时风险追踪、再到医生实时干预的全新人工智能决策辅助系统。
进一步地,从电子病历数据中获取包括生命体征、实验室检测、动脉血气值、实验室观察值、合并症、人口统计学资料。其中生命体征包括:心率、温度、心脏收缩压、心脏舒张压、平均动脉压、呼吸频率、血氧饱和度实时采集的生命体征。实验室检查信息包括:碱剩余、尿素氮、钙离子、氯离子,肌酐、血糖、乳酸盐、钾离子、胆红素、红细胞压积、血红蛋白、凝血激活酶时间、白细胞计数、血小板计数、阴离子间隙、白蛋白、谷丙转氨酶、碱性磷酸酶、天冬氨酸转氨酶、国际标准化比值、中性粒细胞;动脉血气值包括:PH、碳酸氢盐、血二氧化碳分压、血氧分压。实验室观察值包括:格拉斯哥昏迷指数、吸氧分数。合并症包括:心肌梗塞、充血性心力衰竭、肾脏疾病、肝病、糖尿病、恶性肿瘤。人口统计学资料包括:年龄、性别、第一次进入ICU类型、身高、体重、BMI、从入院到进入ICU的时间差、进入ICU时间。以小时为单位步长构建融合重症患者多生理参数信息的表格化时间序列,实时反映患者生理状态。脓毒症的定义标准参考Sepsis-3.0标准。
进一步地,对数据进行如下数据预处理和特征提取,预处理包括剔除缺失值超过99.5%以上的特征,对缺失值利用向后填充,再向前填充的方法,部分利用中值填充方法;特征提取依据临床先验知识计算得到BMI,以及缺失值标志序列、当前参数采样与上一次记录差值、过去24小时内生命体征最大值、最小值、中值、标准差、差异标准差,以及根据心率、温度、呼吸频率、肌酐、平均血压、心脏收缩压、血小板计数、胆红素特征进行评估得到的评分特征,同时利用One-hot(独热)编码方法进行特征变换。
进一步地,利用LightGBM算法完成模型的训练及部署,模型训练过程中使用贝叶斯超参数优化算法。贝叶斯优化是利用贝叶斯技术先对目标函数的先验分布模型进行假设,然后通过样本获取相关信息,不断优化模型,最终得到目标函数的后验分布模型。其核心是由两部分构成:一个是高斯过程回归,计算每一点处函数值的均值和方差。一个是根据均值和方差构造采集函数,用于决定本次迭代时在哪个点处进行采样。贝叶斯优化算法首先对目标函数f(x)假设一个先验分布模型,一般常采用的假设是其满足高斯过程。在得到先验分布函数后,开始通过样本点采样对模型进行修正。贝叶斯优化中定义了一个采集函数来确定下一个采样点。通过采集函数确定下一个采样点后,就可以进行一次实验或观察(即通过x得到(f(x)),在超参数调优的场景中,即尝试一个参数组合,得到评估结果。若该采样点结果已经达到任务要求,则算法终止;若未达到任务要求,则将该采样点加入当前已观察的样本点集中,然后对当前的高斯过程模型进行更新。
进一步,使用局部解释方法(Local Interpretable Model-AgnosticExplanations, LIME)和Shapley可加性解释方法(Shapley Additive exPlanations,SHAP)对模型进行可解释性操作。LIME方法主要是通过使用线性模型作为局部代理模型,解释黑盒分类模型LIME在局部解释的过程中强调两个模型解释的标准:一个是解释本身必须可解释,一个是局部保真性。LIME通过最小化保真函数,简单化可解释的代理模型来权衡以上两个标准。其目标函数:
ξ(x)=arg ming∈GΓ(f,g,Πx)+Ω(g)
式中,G表示可解释模型的集合:Ω(g)表示的是模型g的复杂程度;f表示等待解释的模型;Πx表示x的邻近度量以定义x周围的局部性。
SHAP方法中沿用了LIME中的描述,同时使用了可加性的特征归因方法。可加性的特征归因方法(Additive Feature Attribution Method)表达如下式所示,其中, z'∈{0,1}N,M为特征数量,φi∈R,φ0表示在没有简化输入情况下的模型输出, g(z')表示可解释模型输出。
Figure BDA0003674594020000031
SHAP值的作用主要是用于量化每个特征对模型预测所做的贡献,该方法源自博弈论中Shapleyvalue。其基本的设计思想是:首先计算一个特征加入到模型当中的边际贡献,然后计算该特征所有特征序列中不同的边际贡献,最后计算该特征的SHAP值,即该特征所有边际贡献的均值。假设第i个样本为xi,第i个样本的第j个特征为xij,特征的边际贡献为mcij,边的权重为wi,其中f(xij)为xij的SHAP 值,例如第i个样本的第1个特征的SHAP值计算如下:
f(xi1)=mci1w1+...+mci1wn
模型对该样本的预测值为yi,整个模型的基线(通常是所有样本的目标变量的均值)为ybase,那么SHAPvalue服从以下等式:
yi=ybase+f(xi1)+f(xi2)+...+f(xis)
f(xi1)就是第i个样本中第一个特征对最终预测值yi的贡献值,每个特征的SHAP值表示以该特征为条件时模型预测的变化。对于每个功能,SHAP值都说明了其所做贡献,以说明实例的平均模型预测与实际预测之间的差异。当f(xi,1)>0,说明该特征提升了预测值,反之,说明该特征使得贡献降低。
SHAP方法中有三个重要性质:表示特征归因的总和需要等于要解释模型输的局部精确性;表示缺失特征的归因值要等于零的确实性;表示模型发生改变,导致某个特征的边际贡献增加或保持不变,则该归因值也应增加或者保持不变的一致性。
本实施例提供了一种可视化交互式的脓毒症早期智能预警方法,具体包括以下步骤:
1、通过ICU病房内的呼吸机、心电图机、血糖仪、血气分析仪、医用吊塔、输液泵等仪器完成病人信息的采集,利用MySQL数据库技术完成病人数据的存储;
2、基于Flask框架从MySQL数据库获取病人的临床电子病历数据,临床电子病历数据获取的数据包括生命体征、实验室检测、动脉血气值、实验室观察值、合并症、人口统计学资料,以小时为单位步长构建的融合重症患者多生理参数信息的表格化时间序列;
3、数据预处理与特征提取,提取出病人信息采集中反映测量频率、测量时间间隔等信息的特征,提取临床经验特征;
4、基于LightGBM等算法完成模型的训练及部署,模型训练过程中使用贝叶斯超参数优化算法;
5、使用LIME、SHAP方法对模型的预测结果进行可解释性分析。同时将病人数据格式化后以JSON的格式发送给浏览器,前端通过解析数据并在展示界面显示病人的基本信息分析图。前端可解释、可视化、可交互系统主要显示病人脓毒症风险预测变化趋势,同时显示病人生命体征、实验室检测、动脉血气值、实验室观察值、合并症、人口统计学资料等信息,展示解释性结果。本发明利用 Echarts可视化病人的生理数据,使用Ajax技术获取病人的后台记录信息。
以上技术方案存在以下效果:
1、本方法只选取了临床容易收集的患者生命体征、实验室检测、动脉血气值、实验室观察值、合并症、人口统计学资料,在各个医院或机构均易获取,有利于提高模型的泛化能力,同时为减少系统部署复杂度提供有利条件。
2、本方法根据临床经验进行特征处理,有利于挖掘随时间变化的病人的动态生理病理信息,本方法使用的LightGBM模型在表格型数据预测中有很好的性能体现,在模型训练中体现出了较好的预测能力,这有助于提高脓毒症的早期预测准确率。
3、本方法应用局部解释方法(LIME)和Shapley可加性解释方法(SHAP),提供给医生当前模型预测结果的可解释性分析,可以解决当前的“黑箱”模型无法向临床医生解释为何模型输出高风险的难题,对于辅助临床医生决策有重要的实际应用价值。
4、本方法基于临床病人信息提出了一种可视化交互式的脓毒症早期智能预警方法,不仅可以辅助临床医生对病人脓毒症的发生进行提前判断,同时可以对判断给出可解释的分析,进一步将病人的信息可视化,更加将临床医生的诊断推向了智能化,本发明提出的可解释、可视化、可交互的脓毒症早期智能预警系统,对于医疗智能化起到了很好的启发作用。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明可视化交互式的脓毒症早期智能预警方法的流程示意图。
图2为小时步长的表格化时间序列示意图。
图3为LightGBM模型构建流程示意图。
图4为贝叶斯优化算法流程示意图。
图5为利用LIME方法对模型进行解释示意图。
图6为利用SHAP方法对模型进行解释示意图。
图7为重症监护病房可解释、可视化、可交互辅助决策系统示意图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
实施例一
本实施例提供了一种可视化交互式的脓毒症早期智能预警方法,如图1所示,其步骤如下:
步骤1:病人数据库构建,通过ICU病房内的呼吸机、心电图机、血糖仪、血气分析仪、医用吊塔、输液泵等仪器完成病人信息的采集,利用了HDFS分布式文件存储和SPARK框架,利用MySQL数据库技术完成病人数据的存储;
步骤2:临床电子病历数据的获取,利用SQL语言完成病人信息的提取,构建以小时为单位步长的患者表格化时间序列(图2),完成Flask框架与病人数据库的交互。脓毒症的定义标准参考Sepsis-3.0标准;
步骤3:数据预处理与特征提取,提取出病人信息采集中反映测量频率、测量时间间隔等信息的特征,提取临床经验特征;
步骤4:基于LightGBM算法完成模型的训练(图3),首先利用LightGBM算法,基于贝叶斯超参数优化方法(图4),使用病人的电子病历信息对模型进行训练。将完成训练的模型进行部署,利用模型进行病人脓毒症的早期预测;
步骤5:使用LIME(图5)、SHAP(图6)方法对机器学习模型的预测结果进行可解释性分析。如图5所示,LIME方法给出了对于模型预测排名靠前的特征,该图片分为三部门,最左侧是预测结果的概率,中间给出了排名靠前特征的贡献值,右侧是特征的值;如图6所示,SHAP方法给出了模型中贡献值较大的特征,及其贡献值,其中右侧的贡献正值,左侧的贡献负值。
步骤6:临床可视化、可交互、可解释界面搭建,利用Flask框架和Vue框架构建前后端系。基于可解释信息搭建临床可视化交互界面以辅助临床决策,建立从原始数据和可视化预警信息显示,到医生实时风险追踪,再到医生实时干预的全新人工智能决策辅助系统(图7)。
实验效果:
本发明获取从电子病历数据中获取包括生命体征、实验室检测、动脉血气值、实验室观察值、合并症、人口统计学资料。以小时为单位步长构建融合重症患者多生理参数信息的表格化时间序列,实时反映患者生理状态;脓毒症的定义标准参考Sepsis-3.0标准。对数据进行如下数据预处理和特征提取,预处理包括剔除缺失值超过99.5%以上的特征,对缺失值利用向后填充,再向前填充的方法,部分利用中值填充方法;使用LIME、SHAP方法对模型的预测结果进行可解释性分析。同时将病人数据格式化后以JSON的格式发送给浏览器,前端通过解析数据并在展示界面显示病人的基本信息分析图。前端可视化、可交互系统主要显示病人脓毒症风险预测变化趋势以及病人生命体征、实验室检测、动脉血气值、实验室观察值、合并症、人口统计学资料等信息,同时展示解释性结果。本发明利用Echarts可视化病人的生理数据,使用Ajax技术获取病人的后台记录信息。
测试数据:利用重症领域全球范围最具影响力的公开数据库MIMIC-IV数据作为测试数据。使用85%的MIMIC-IV数据作为训练集,15%的MIMIC-IV数据作为测试集,绘制预测区间为6小时的ROC曲线,计算得到此时测试集的 AUROC值为0.8156。同时,可解释步骤给出了高风险因素,这些结果均表明所提出的可解释的脓毒症早期预警方法具有实际临床应用价值。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、改进等,均应包含在本发明保护的范围之内。在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (6)

1.一种可视化交互式的脓毒症早期智能预警方法,其特征在于,包括以下步骤:
S1:病人数据库构建;通过ICU病房内的呼吸机、心电图机、血糖仪、血气分析仪、医用吊塔、输液泵仪器完成病人信息的采集,利用MySQL数据库技术完成病人数据的存储;
S2:临床电子病历数据的获取;利用SQL语言完成病人信息的提取,构建以小时为单位步长的患者表格化时间序列,完成Flask框架与病人数据库的交互,脓毒症的定义标准参考Sepsis-3.0标准;
S3:数据预处理与特征提取;提取出病人信息采集中反映测量频率、测量时间间隔信息的特征,提取临床经验特征;
S4:基于LightGBM算法完成模型的训练及部署;首先利用LightGBM算法,基于贝叶斯超参数优化方法,使用病人的电子病历信息对模型进行训练,将完成训练的模型进行部署,利用模型进行病人脓毒症的早期预测;
S5:临床可解释、可视化、可交互界面搭建;利用Flask框架和Vue框架构建前后端系统,基于可解释信息搭建临床可视化交互界面以辅助临床决策,建立从原始数据和可视化预警信息显示到医生实时风险追踪、再到医生实时干预的全新人工智能决策辅助系统。
2.根据权利要求1所述的一种可视化交互式的脓毒症早期智能预警方法,其特征在于,从电子病历数据中获取包括生命体征、实验室检测、动脉血气值、实验室观察值、合并症、人口统计学资料;其中生命体征包括:心率、温度、心脏收缩压、心脏舒张压、平均动脉压、呼吸频率、血氧饱和度实时采集的生命体征;实验室检查信息包括:碱剩余、尿素氮、钙离子、氯离子、肌酐、血糖、乳酸盐、钾离子、胆红素、红细胞压积、血红蛋白、凝血激活酶时间、白细胞计数、血小板计数、阴离子间隙、白蛋白、谷丙转氨酶、碱性磷酸酶、天冬氨酸转氨酶、国际标准化比值、中性粒细胞;动脉血气值包括:PH、碳酸氢盐、血二氧化碳分压、血氧分压;实验室观察值包括:格拉斯哥昏迷指数、吸氧分数;合并症包括:心肌梗塞、充血性心力衰竭、肾脏疾病、肝病、糖尿病、恶性肿瘤;人口统计学资料包括:年龄、性别、第一次进入ICU类型、身高、体重、BMI、从入院到进入ICU的时间差、进入ICU时间;以小时为单位步长构建融合重症患者多生理参数信息的表格化时间序列,实时反映患者生理状态;脓毒症的定义标准参考Sepsis-3.0标准。
3.根据权利要求1所述的一种可视化交互式的脓毒症早期智能预警方法,其特征在于,对数据进行如下数据预处理和特征提取,预处理包括剔除缺失值超过99.5%以上的特征,对缺失值利用向后填充,再向前填充的方法,部分利用中值填充方法;特征提取依据临床先验知识计算得到身体质量指数,以及缺失值标志序列、当前参数采样与上一次记录差值、过去24小时内生命体征最大值、最小值、中值、标准差、差异标准差,以及根据心率、温度、呼吸频率、肌酐、平均血压、心脏收缩压、血小板、胆红素特征进行评估得到的评分特征,同时利用One-hot编码方法进行特征变换。
4.根据权利要求1所述的一种可视化交互式的脓毒症早期智能预警方法,其特征在于,利用LightGBM算法完成模型的训练及部署,模型训练过程中使用贝叶斯超参数优化算法;贝叶斯优化是利用贝叶斯技术先对目标函数的先验分布模型进行假设,然后通过样本获取相关信息,不断优化模型,最终得到目标函数的后验分布模型。
5.根据权利要求1所述的一种可视化交互式的脓毒症早期智能预警方法,其特征在于,临床可解释、可视化、可交互界面搭建,使用局部解释方法LIME和Shapley可加性解释方法SHAP对模型进行可解释性操作;LIME方法是通过使用线性模型作为局部代理模型,解释黑盒分类模型LIME在局部解释的过程中强调两个模型解释的标准:一个是解释本身必须可解释,一个是局部保真性;LIME通过最小化保真函数,简单化可解释的代理模型来权衡以上两个标准;其目标函数:
ξ(x)=argming∈GΓ(f,g,Πx)+Ω(g)
式中,G表示可解释模型的集合:Ω(g)表示的是模型g的复杂程度;f表示等待解释的模型;Πx表示x的邻近度量以定义x周围的局部性;
SHAP方法中沿用了LIME中的描述,同时使用了可加性的特征归因方法;可加性的特征归因方法表达如下式所示,其中,z'∈{0,1}N,M为特征数量,φi∈R,φ0表示在没有简化输入情况下的模型输出,g(z')表示可解释模型输出。
Figure FDA0003674594010000021
SHAP值的作用主要是用于量化每个特征对模型预测所做的贡献,该方法源自博弈论中Shapleyvalue;其基本的设计思想是:首先计算一个特征加入到模型当中的边际贡献,然后计算该特征所有特征序列中不同的边际贡献,最后计算该特征的SHAP值,即该特征所有边际贡献的均值;假设第i个样本为xi,第i个样本的第j个特征为xij,特征的边际贡献为mcij,边的权重为wi,其中f(xij)为xij的SHAP值,第i个样本的第1个特征的SHAP值计算如下:
f(xi1)=mci1w1+...+mci1wn
模型对该样本的预测值为yi,整个模型的基线为ybase,那么SHAPvalue服从以下等式:
yi=ybase+f(xi1)+f(xi2)+...+f(xis)
f(xi1)就是第i个样本中第一个特征对最终预测值yi的贡献值,每个特征的SHAP值表示以该特征为条件时模型预测的变化;对于每个功能,SHAP值都说明了其所做贡献,以说明实例的平均模型预测与实际预测之间的差异;当f(xi,1)>0,说明该特征提升了预测值,反之,说明该特征使得贡献降低。
6.根据权利要求1所述的一种可视化交互式的脓毒症早期智能预警方法,其特征在于,具体包括以下步骤:
1)通过ICU病房内的呼吸机、心电图机、血糖仪、血气分析仪、医用吊塔、输液泵仪器完成病人信息的采集,利用MySQL数据库技术完成病人数据的存储;
2)基于Flask框架从MySQL数据库获取病人的临床电子病历数据,临床电子病历数据获取的数据包括生命体征、实验室检测、动脉血气值、实验室观察值、合并症、人口统计学资料,以小时为单位步长构建的融合重症患者多生理参数信息的表格化时间序列;
3)数据预处理与特征提取,提取出病人信息采集中反映测量频率、测量时间间隔信息的特征,提取临床经验特征;
4)基于LightGBM算法完成模型的训练及部署,模型训练过程中使用贝叶斯超参数优化算法;
5)使用LIME、SHAP方法对模型的预测结果进行可解释性分析;同时将病人数据格式化后以JSON的格式发送给浏览器,前端通过解析数据并在展示界面显示病人的基本信息分析图;前端可解释、可视化、可交互系统主要显示病人脓毒症风险预测走势,同时显示病人生命体征、实验室检测、动脉血气值、实验室观察值、合并症、人口统计学资料信息,展示解释性结果;利用Echarts可视化病人的生理数据,使用Ajax技术获取病人的后台记录信息。
CN202210616733.2A 2022-06-01 2022-06-01 一种可视化交互式的脓毒症早期智能预警方法 Pending CN115049069A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210616733.2A CN115049069A (zh) 2022-06-01 2022-06-01 一种可视化交互式的脓毒症早期智能预警方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210616733.2A CN115049069A (zh) 2022-06-01 2022-06-01 一种可视化交互式的脓毒症早期智能预警方法

Publications (1)

Publication Number Publication Date
CN115049069A true CN115049069A (zh) 2022-09-13

Family

ID=83158611

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210616733.2A Pending CN115049069A (zh) 2022-06-01 2022-06-01 一种可视化交互式的脓毒症早期智能预警方法

Country Status (1)

Country Link
CN (1) CN115049069A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115458158A (zh) * 2022-09-23 2022-12-09 深圳大学 一种针对脓毒症患者的急性肾损伤预测系统
CN116646074A (zh) * 2023-05-23 2023-08-25 天津大学 基于逻辑回归的脓毒症心力衰竭早期预测系统
CN116959715A (zh) * 2023-09-18 2023-10-27 之江实验室 一种基于时序演进过程解释的疾病预后预测系统
CN117235555A (zh) * 2023-10-17 2023-12-15 北京和兴创联健康科技有限公司 一种基于shap特征聚类技术的脓毒症分型方法及系统
CN117238466A (zh) * 2023-10-27 2023-12-15 上海市浦东新区上钢社区卫生服务中心 一种实现多级联动的资源交互的护理智慧信息管理系统

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115458158A (zh) * 2022-09-23 2022-12-09 深圳大学 一种针对脓毒症患者的急性肾损伤预测系统
CN115458158B (zh) * 2022-09-23 2023-09-15 深圳大学 一种针对脓毒症患者的急性肾损伤预测系统
CN116646074A (zh) * 2023-05-23 2023-08-25 天津大学 基于逻辑回归的脓毒症心力衰竭早期预测系统
CN116959715A (zh) * 2023-09-18 2023-10-27 之江实验室 一种基于时序演进过程解释的疾病预后预测系统
CN116959715B (zh) * 2023-09-18 2024-01-09 之江实验室 一种基于时序演进过程解释的疾病预后预测系统
CN117235555A (zh) * 2023-10-17 2023-12-15 北京和兴创联健康科技有限公司 一种基于shap特征聚类技术的脓毒症分型方法及系统
CN117235555B (zh) * 2023-10-17 2024-04-02 北京和兴创联健康科技有限公司 一种基于shap特征聚类技术的脓毒症分型方法及系统
CN117238466A (zh) * 2023-10-27 2023-12-15 上海市浦东新区上钢社区卫生服务中心 一种实现多级联动的资源交互的护理智慧信息管理系统
CN117238466B (zh) * 2023-10-27 2024-03-01 上海市浦东新区上钢社区卫生服务中心 一种实现多级联动的资源交互的护理智慧信息管理系统

Similar Documents

Publication Publication Date Title
CN115049069A (zh) 一种可视化交互式的脓毒症早期智能预警方法
CN110459328B (zh) 临床监护设备
CN110827993A (zh) 基于集成学习的早期死亡风险评估模型建立方法及装置
CN110246577B (zh) 一种基于人工智能辅助妊娠期糖尿病遗传风险预测的方法
CN114420231B (zh) 一种可解释的急性肾损伤持续预警方法、系统、存储介质及电子设备
CN111067503A (zh) 一种基于心率变异性的睡眠分期方法
JP2007527743A (ja) 心臓関連の病気及び状態のための自動診断及び意思決定支援用システム及び方法
CN114023441A (zh) 基于可解释机器学习模型的严重aki早期风险评估模型、装置及其开发方法
CN112652398A (zh) 一种基于机器学习算法的新冠肺炎重症化预测方法及系统
CN110767316A (zh) 一种创伤输血预测模型建立方法、确定输血量的方法及系统
JP2023544242A (ja) 心イベントを検出及び/又は予測するための、心電図処理システム
CN117174330A (zh) 一种基于机器学习的IgA肾病患者治疗方案推荐方法
CN114023440A (zh) 可解释分层老年mods早期死亡风险评估模型、装置及其建立方法
Huang et al. Detecting paroxysmal atrial fibrillation from normal sinus rhythm in equine athletes using Symmetric Projection Attractor Reconstruction and machine learning
CN116524248B (zh) 医学数据处理装置、方法及分类模型训练装置
CN115547502B (zh) 基于时序数据的血透病人风险预测装置
CN116864104A (zh) 基于人工智能的慢性血栓栓塞性肺动脉高压风险分级系统
CN113012808B (zh) 一种健康预测方法
Fioravanti et al. Machine learning framework for Inter-Beat Interval estimation using wearable Photoplethysmography sensors
Zhou et al. Fully convolutional neural network and PPG signal for arterial blood pressure waveform estimation
CN113449757A (zh) 心衰诊断模型的构建方法、构建系统和心衰诊断装置
Jayasinghe A Real-Time Framework for Arrhythmia Classification
JP2022523835A (ja) 心房細動予測モデル及びその予測システム
Araf et al. Cost-sensitive learning for imbalanced medical data: a review
EP4270402A1 (en) Genogram creation and diagnosis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination