CN113990502A - 一种基于异构图神经网络的icu心衰预测系统 - Google Patents

一种基于异构图神经网络的icu心衰预测系统 Download PDF

Info

Publication number
CN113990502A
CN113990502A CN202111261673.9A CN202111261673A CN113990502A CN 113990502 A CN113990502 A CN 113990502A CN 202111261673 A CN202111261673 A CN 202111261673A CN 113990502 A CN113990502 A CN 113990502A
Authority
CN
China
Prior art keywords
time
data
patient
heart failure
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111261673.9A
Other languages
English (en)
Inventor
应豪超
吴健
徐宇扬
钱思忆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202111261673.9A priority Critical patent/CN113990502A/zh
Publication of CN113990502A publication Critical patent/CN113990502A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种基于异构图神经网络的ICU心衰预测系统,包括计算机存储器和计算机处理器,计算机存储器中存有心衰预测模型;心衰预测模型包括两层时间感知门控图注意力神经网络、一个环境Transformer层以及两层全连接层;计算机处理器执行计算机程序时实现以下步骤:提取心衰相关病人在住院第一次进入ICU后前48小时的实验检测、输液、处方药数据,构成EHR数据;通过提取得到的EHR数据构建时间感知EHR异构图,输入训练好的心衰预测模型得到预测的输出概率,该输出概率的结果用于医生评估当前的治疗方案。利用本发明,可以解决实际应用中通过心衰相关病人第一次进入ICU前48小时数据预测本次住院期间是否会死亡不够准确的问题,从而指导医生的后续治疗方案。

Description

一种基于异构图神经网络的ICU心衰预测系统
技术领域
本发明属于医疗数据处理技术领域,尤其是涉及一种基于异构图神经网络的ICU心衰预测系统。
背景技术
以往患者前往医院接受医生的诊断和质量往往通过纸质记录的方式对过程进行记录。然而通过这种方式的记录,不仅复诊的医生和患者无法方便地查看过去的诊断和检查记录,想要进行临床研究的医生也往往苦于无法获取这些复杂而又混乱的医疗记录。随着大数据时代的来临,各行各业逐渐开始用电子数据的方式记录行业中日常产生的各种数据,临床医疗领域也逐渐开始使用电子健康记录(Electronic Health Record,EHR)的方式对临床医疗数据进行记录、统一整理和存储。
EHR数据是通过电子数据采集的个人健康信息和医疗事件的记录,通过大数据的方式加以整理保存。它往往涵盖了病人长时间内的人口管理信息、诊断信息、实验检测和生化检测等检测记录、收费记录、手术记录和输液记录等治疗记录以及非结构化的医嘱信息和图像信息。随着EHR体系在各个医院的建立,越来越多的临床数据被采集和整理,不仅使得患者和复诊医生能更方便地查看过去的记录,也使得临床医生获得了大量真实且整洁的数据进行临床研究,促进了医学的发展。其中,在其他领域中大放光彩的机器学习和深度学习算法也被引入到了临床医学中,通过机器快速且不会疲劳的大量计算代替人工进行医学规律的发现,辅助医生诊断、预后和治疗。然而,因为EHR数据本身具有的特性以及医疗领域的关键性,传统的机器学习与深度学习方法面临着许多困难,针对临床EHR数据的人工智能算法尚待深入研究。
EHR数据首先由于其作为时序数据,每个医疗变量也都会随着时间的变化而变化,因此每个时间点采集得到的数据与其前后的时间点的数据有着关联关系。此外,不同于采用固定频率采集的心电时序数据或体检数据,EHR数据可能会有不规则的时间间隔,导致传统的时序模型很难进行学习。其次,每个时间点中EHR数据含有的大量医疗变量间常常会有复杂的内在关系,例如几种药物的同时使用会相互影响而产生与单种药物使用的不同效果,同一种疾病也可能会产生多种不同的并发症,并影响患者的多项检测结果。不仅如此,每个时间点中出现的医疗变量数据种类也可能因为医生的选择或其他客观原因,导致部分数据可能会在一些时间点出现删失。
由于ICU EHR数据包括一段时间内各个时间点病人的各种信息,这些信息往往会随着时间的变化呈一定趋势的变化,而这些趋势的变化往往暗示着病人病情的发展状况。不同于其他的EHR数据,ICU中EHR数据的时间间隔和检查频率往往与病人病情发展情况有关,例如该时间点病人病情好转,其主治医生选择的检查的频次可能更为稀疏,而另一时间点病人病情转危,主治医生的访视的频率也会相应地提高。因此,ICU中EHR数据往往会出现不规则的时间间隔。T-LSTM与Data-GRU通过将各个时间点间的时间间隔输入时间衰退函数计算衰退因子。在长短记忆网络(Long Short Term Memory,LSTM)与门控循环单元(GatedRecurrent Unit,GRU)中,通过衰退因子对上一个时间步的记忆进行衰退,作为候选记忆进行后续的计算,有效地处理了非规则间隔的时间序列数据。HiTANet学习了Transformer的思想,将带有时序编码的数据通过标准Transformer模型计算的局部权重,通过计算每个时间点与最后一个时间点的时间间隔,来计算Transformer中的K矩阵,和患者的全局表征计算得到的Q矩阵结合得到全局权重,并与得到的特征相乘,从而对非规则的时间间隔进行建模。
同样地,不同于体检流程中每次都会检查相同的项目,ICU的EHR数据中,每个时间点医疗变量的选择常常也不尽相同。当病人病情转危,主治医生会选择更能洞察当前症状的检测项目以及采取更激进的治疗策略,而当病人病情趋于稳定,医生可能会选择更常规的检测项目与简单的治疗方案。因此ICU中得到的EHR数据往往也会出现不同时间点内不同的项目数据缺失而导致的数据删失(Censored Data)。Data-GRU和UA-CRNN将各个医疗变量视为独立符合联合正态分布的变量,通过高斯过程(Gaussian Process,GP)对整个时间段的EHR数据进行回归拟合后,对缺失的数据使用预测值进行插值。而MedGCN、HeteroMed、GATE则使用图数据结构对删失数据进行建模,通过把数据作为邻接矩阵,把空值作为节点间不存在的边关系而把真实数据作为节点间边的权重,因此图数据结构很好地契合了EHR数据删失的特性。
对于EHR数据而言,大量的医疗变量之间同时往往存在复杂的内在关系。例如疾病间存在复杂的并发症情况,同时使用的多种药物也存在相互影响的问题,而采取不同的治疗手段的组合也会影响病人病情不同的发展。对于ICU内的EHR数据而言,模型预测的结果关乎病人最终是否会死亡。常规的深度学习模型却常常是一个端到端的黑盒模型,往往很难解释模型做出的预测或推荐,但临床医生却很难接受缺乏理由的结论,因此往往要求使用的模型是一个透明可解释的模型。Retain通过训练了两支独立的RNN网络来获得就诊层次的注意力与全局层次的注意力,通过就诊层次的注意力对单次就诊内多种医疗变量的关系进行可解释地表示,在取得了较好表现的同时也提供了结果能与先验知识契合的可解释性。MedGCN、HeteroMed、GATE则通过图数据结构的方式,将不同的医疗变量建模为图中不同的实体节点,通过节点与节点间边的关系对医疗变量间的关系进行建模。
在ICU中,对于一些死亡率极高的大病、特病而言,具有记录的存活样本极其稀少。而对于一些目前已发现治疗方案的疾病而言,其死亡病例常常也会十分罕见,对于一些罕见病更是缺乏用于训练的样本。MetaPred通过元学习(Meta-Learning)的方式,将常见的健忘症、帕金森、痴呆疾病患者数据作为元学习的支持集(元学习中的训练集)进行训练,轻度认知障碍患者作为查询集中的验证集(元学习中的验证集)对模型参数进行选择,最终快速适应目标:查询集中的测试集罕见疾病阿兹海默症中,通过将常见类似疾病学到的知识迁移到罕见病中,促进小样本的快速学习。
发明内容
本发明提供了一种基于异构图神经网络的ICU心衰预测系统,可以解决实际应用中通过心衰相关病人第一次进入ICU前48小时数据预测本次住院期间的死亡风险不够准确的问题,从而指导医生的后续治疗方案。
一种基于异构图神经网络的ICU心衰预测系统,包括计算机存储器、计算机处理器以及存储在所述计算机存储器中并可在所述计算机处理器上执行的计算机程序,所述计算机存储器中存有训练好的心衰预测模型;
所述的心衰预测模型包括依次连接的两层时间感知门控图注意力神经网络、一层环境Transformer层以及两层全连接层;
所述计算机处理器执行所述计算机程序时实现以下步骤:
提取心衰相关病人在住院第一次进入ICU后前48小时的实验检测、输液、处方药数据,构成EHR数据;
通过提取得到的EHR数据构建时间感知EHR异构图,输入两层时间感知门控图注意力神经网络中,将学习得到的图中节点的表征再输入环境Transformer层,进一步提取病人与其他医疗变量节点间的关系形成全局表征,最终得到的全局表征通过两层全连接层得到患者风险预测的输出概率,该输出概率的结果用于指导医生评估当前的治疗方案。
进一步地,提取心衰相关病人在住院第一次进入ICU后前48小时的实验检测、输液、处方药数据时,实验检测数据为前48小时中每小时各类实验检测最后一次得到的数据,输液数据为每小时内输液的总量,处方药数据为每小时内是否使用某种处方药的二分值。
通过提取得到的EHR数据构建时间感知EHR异构图的过程如下:
首先构建由各个时间点病人节点、实验检测节点、输液节点、处方药节点以及连接该时间点病人与所用的实验检测、输液以及处方药的边构成的基础异构图;
其次,引入上一时间点病人节点与当前时间点病人间的时序元路径、上一时间点的输液节点和处方药节点与该时间点病人节点间的时序元路径、上一时间的病人节点与该时间点的输液节点和处方药节点间的时序元路径共三种时序元路径,构成最终的时间感知EHR异构图。
所述时间感知门控图注意力神经网络的工作过程如下:
首先将上一层输入的节点隐藏状态通过与邻接矩阵以及输出参数矩阵相乘得到节点的输出信息;其中对于引入的病人间时序元路径、输液节点与处方药节点与病人节点间的时序元路径、病人节点与输液节点和处方药节点间的时序元路径,时间感知门控图注意力神经网络通过将每次记录的时间差输入时间衰退函数Decay(Δ)=1/log(e+Δ)得到时间衰退因子;
使用得到的时间衰退因子对上述元路径传递的信息进行衰退处理,模拟跨越时间的信息的损失;将所有路径的信息与目标节点的隐藏状态拼接,经过一个包含线性层与Softmax激活函数的软注意力模块生成各条路径注意力作为各类路径所传递的信息比重,将注意力与拼接后的信息进行加权和得到最终的输入信息;
最后,将输入的信息通过以上一层网络输出的目标节点表征作为隐藏状态经过门控循环单元GRU的重置门与遗忘门后,对目标节点的隐藏状态进行更新。
所述环境Transformer层提取病人与其他医疗变量节点间的关系形成全局表征的过程如下:
环境Tranformer层将上一层模型输出的实验检测节点隐藏状态、输液节点隐藏状态与处方药节点隐藏状态进行纵向拼接用于计算键矩阵与值矩阵,将上一层模型输出的病人节点隐藏状态用于计算查询矩阵,通过Transformer框架进一步提取关系特征。
所述的时间感知门控图注意力神经网络中利用注意力机制得到各类医疗变量重要性的平均可视化信息。利用可视化的路径注意力权重起到了自动选择面向EHR数据的异构图路径组合的作用。
所述心衰预测模型的训练过程如下:
(1)由心衰相关病人本次住院第一次进入ICU后前48小时的实验检测、输液、处方药数据构成的EHR数据;
(2)由病人在本次住院期间内是否死亡作为最终标注,标签分别是0、1,对应于在本次住院期间内存活和在本次住院期间内死亡;
(3)基于标注数据,按固定比例对各个类别进行相同的训练集和验证集划分;
(4)对训练集和验证集中的实验检测数据、输液数据、处方药数据进行一定的数据变换和归一化处理,但不影响整体数据尺寸和数值范围分布;
(5)利用时间感知EHR异构图对提取得到的EHR数据进行构图,输入两层时间感知门控图注意力神经网络中,将学习得到的图中节点的表征再输入环境Transformer层输出最终表征进行分类训练,依次迭代所有训练样本更新模型参数直至收敛,得到最佳模型。
具体的,训练过程中,通过Focal Loss作为损失函数对模型进行训练,训练出的模型使用验证集进行验证。利用Focal Loss增加困难样本与少标签样本的权重的方式,处理ICU中EHR数据死亡/存活样本偏态的问题。
与现有技术相比,本发明具有以下有益效果:
(1)本发明在特征提取阶段结合了EHR数据的时序信息与内在关系,更好地学习得到病人地全局表征用于后续的预测,模型效果优于现有的其他模型;
(2)本发明通过注意力机制自动筛选图中节点的多条路径传递的信息,避免了大量的实验工作且能针对患者自适应地提取特征。
附图说明
图1为本发明实施例中时间感知EHR异构图的构图方式;
图2为本发明实施例中心衰预测模型的网络结构图。
具体实施方式
下面结合附图和实施例对本发明做进一步详细描述,需要指出的是,以下所述实施例旨在便于对本发明的理解,而对其不起任何限定作用。
一种基于异构图神经网络的ICU心衰预测系统,包括计算机存储器、计算机处理器以及存储在计算机存储器中并可在计算机处理器上执行的计算机程序,计算机存储器中存有训练好的心衰预测模型。心衰预测模型的构建及训练过程如下:
S101生成数据集
针对心衰相关病人第一次进入ICU后的前48小时的数据,本发明对于实验检测数据取每一小时内最后一次记录,对于输液数据取该小时内输液药物输入的总量,对于处方药数据使用是否在该小时内用药的二分值,得到单个样本,再整合所有样本得到综合样本,对于得到的处方药数据和输液数据进行最大最小值标准化,即数值减去该变量在所有时间内的最小值,并除以最大最小值只差。
本发明中实验检测据举例如动脉收缩压(Arterial Systolic Blood Pressure)、动脉平均血压(Arterial Mean Blood Pressure)、心率(Heart Rate)、呼吸率(Respiratory Rate)、血氧饱和度(SpO2)、血红蛋白(Hemoglobin)、血红蛋白率(Hemoglobin Rate)、血糖(Glucose)、体温(Body Temperature)、吸入氧浓度(FiO2)、广义血氧饱和度(SaO2),输液药物举例如硝酸甘油(Nitroglycerin)、地尔硫卓(Diltiazem)、艾司洛尔(Esmolol),处方药数据举例如美托洛尔(Metoprolol)、阿托伐他汀(Atorvastatin)、辛伐他汀(Simvastatin)、阿司匹林(Aspirin)、氯吡格雷(Clopidogrel)。本发明利用上述实验检测数据、输液数据、处方药数据项目在MIMIC IV、eICU公开数据集上进行测试,得到模型效果好于现有大部分模型。
对于标准化预处理后的实验检测数据,使用0填充空值,并生成掩码区分真实0与填充0(1代表真实值,0代表填充值)。对于输液数据同样生成类似的二分值掩码(1代表在该小时内使用了该种输液药物,0代表该小时内没有使用该种输液药物)。最后进行训练、验证和测试6:2:2的数据集划分操作。
S102图神经网络节点隐藏状态初始化
记生成的实验检测数据掩码为Sl,映射层参数为Wl,记输液数据掩码为Si,映射层参数为Wi,记处方药数据为M,映射层参数为Wm
对于各个时间点的病人,将实验检测数据掩码乘以其映射层参数、输液数据掩码乘以其映射层参数、处方药数据乘以其映射层参数后拼接作为各个时间点病人节点的隐藏状态初始化,即
Figure BDA0003325969330000091
对于实验检测节点,将实验检测节点数量维度的单位矩阵乘以实验检测映射层参数后,通过零矩阵补齐作为初始化,即
Figure BDA0003325969330000092
对于输液节点,将输液节点数量维度的单位矩阵乘以输液映射层参数后,通过零矩阵补齐作为初始化,即
Figure BDA0003325969330000093
对于处方药节点,将处方药节点数量维度的单位矩阵乘以处方药映射层参数后,通过零矩阵补齐作为初始化,即
Figure BDA0003325969330000094
S103时间感知EHR异构图的构建
本发明通过提取得到的EHR数据构建时间感知EHR异构图如图1所示。首先将各个时间点的病人节点
Figure BDA0003325969330000095
与其在该时间点使用的实验检测节点
Figure BDA0003325969330000096
输液节点
Figure BDA0003325969330000097
与处方药节点
Figure BDA0003325969330000098
相连,作为基础EHR异构图,即上述提取的数据分别为病人节点与相应节点间的邻接矩阵。此外,本发明引入了上一时间点病人节点与当前时间点病人间的时序元路径(图1中浅虚线路径)、上一时间点的输液节点和处方药节点与该时间点病人节点间的时序元路径(图1中深实线路径)、上一时间的病人节点与该时间点的输液节点和处方药节点间的时序元路径(图1中浅实线路径)共三种时序元路径,分别代表相邻时间节点间病人的病情联系,真实情况下治疗药物的延后生效以及前一时间点病人状态对后续医生治疗方案的影像,从而人为引入时序信息。最后得到新模型本发明提出的时间感知EHR异构图。
S104模型训练
本发明所选模型的总体结构模块如图2所示,模型将输入数据通过上述初始化后构建时间感知EHR异构图,经过两层时间感知门控图注意力神经网络后提取中间层的各个节点的表征,再通过环境Transformer进一步提取病人与其他医疗变量节点间的关系形成全局表征,最终得到的表征通过两层全连接层得到预测的输出概率。
图1右侧则是时间感知门控图注意力神经网络的具体示意图。其中上一层输入的节点隐藏状态
Figure BDA0003325969330000101
通过与邻接矩阵(Alp,Aip,Amp)以及输出参数矩阵
Figure BDA0003325969330000104
相乘得到节点的输出信息。其中对于对于本发明中引入的病人间时序元路径、输液与处方药节点与病人节点间的时序元路径以及病人节点与输液与处方药节点,本发明提出的时间感知门控图注意力神经网络通过将每次记录的时间差输入时间衰退函数Decay(Δ)=1/log(e+Δ)得到时间衰退因子。对于上述元路径传递的信息本发明使用得到的时间衰退因子对信息进行衰退处理,模拟跨越时间的信息的损失。本发明将所有路径的信息与目标节点的隐藏状态拼接,经过一个包含线性层与Softmax激活函数的软注意力模块生成各条路径注意力作为各类路径所传递的信息比重,将注意力与拼接后的信息进行加权和得到最终的输入信息。最后,本发明将输入的信息通过以上一层网络输出的目标节点表征作为隐藏状态经过门控循环单元(Gated Recurrent Unit,GRU)的重置门与遗忘门后,对目标节点的隐藏状态进行更新。
经过两层时间感知门控图注意力神经网络后,将实验检测节点、输液节点与处方药节点的隐藏状态纵向拼接,经过两个不同的全连接层得到键矩阵与值矩阵。将病人节点隐藏状态经过另一个不同的全连接层后得到查询矩阵。将查询矩阵与键矩阵的转置相乘,除以隐藏状态维度的平方根后乘以值矩阵,得到进一步提取关系后的病人节点隐藏状态。
而后继续将得到的最后一个时间步的病人节点隐藏状态通过后两个全连接层,最后输出分类概率。模型训练的损失函数是Focal Loss,用于处理ICU中死亡与存活的偏态困难样本的学习,迭代次数设置上限为600次,每次输入一个batch的数据,计算损失并反向传播,更新模型参数,直至训练完毕,迭代过程中会保存具有最佳验证效果的模型,若连续10次验证集的分类效果均处于持续下降状态,则退出当前训练,最后得到新模型。
本发明的ICU心衰预测系统,在实际应用中,可以通过心衰相关病人第一次进入ICU前48小时数据预测本次住院期间是否会死亡,根据该预测结果,可以指导医生改进后续的治疗方案。
以上所述的实施例对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的具体实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于异构图神经网络的ICU心衰预测系统,包括计算机存储器、计算机处理器以及存储在所述计算机存储器中并可在所述计算机处理器上执行的计算机程序,其特征在于:所述计算机存储器中存有训练好的心衰预测模型;
所述的心衰预测模型包括依次连接的两层时间感知门控图注意力神经网络、一层环境Transformer层以及两层全连接层;
所述计算机处理器执行所述计算机程序时实现以下步骤:
提取心衰相关病人在住院第一次进入ICU后前48小时的实验检测、输液、处方药数据,构成EHR数据;
通过提取得到的EHR数据构建时间感知EHR异构图,输入两层时间感知门控图注意力神经网络中,将学习得到的图中节点的表征再输入环境Transformer层,进一步提取病人与其他医疗变量节点间的关系形成全局表征,最终得到的全局表征通过两层全连接层得到患者风险预测的输出概率,该输出概率的结果用于医生评估当前的治疗方案。
2.根据权利要求1所述的基于异构图神经网络的ICU心衰预测系统,其特征在于,提取心衰相关病人在住院第一次进入ICU后前48小时的实验检测、输液、处方药数据时,实验检测数据为前48小时中每小时各类实验检测最后一次得到的数据,输液数据为每小时输液的总量,处方药数据为每小时是否使用某种处方药的二分值。
3.根据权利要求1所述的基于异构图神经网络的ICU心衰预测系统,其特征在于,通过提取得到的EHR数据构建时间感知EHR异构图的过程如下:
首先构建由各个时间点病人节点、实验检测节点、输液节点、处方药节点以及连接该时间点病人与所用的实验检测、输液以及处方药的边构成的基础异构图;
其次,引入上一时间点病人节点与当前时间点病人间的时序元路径、上一时间点的输液节点和处方药节点与该时间点病人节点间的时序元路径、上一时间的病人节点与该时间点的输液节点和处方药节点间的时序元路径共三种时序元路径,构成最终的时间感知EHR异构图。
4.根据权利要求3所述的基于异构图神经网络的ICU心衰预测系统,其特征在于,所述时间感知门控图注意力神经网络的工作过程如下:
首先将上一层输入的节点隐藏状态通过与邻接矩阵以及输出参数矩阵相乘得到节点的输出信息;其中对于引入的病人间时序元路径、输液节点与处方药节点与病人节点间的时序元路径、病人节点与输液节点和处方药节点间的时序元路径,时间感知门控图注意力神经网络通过将每次记录的时间差输入时间衰退函数Decay(Δ)=1/log(e+Δ)得到时间衰退因子;
使用得到的时间衰退因子对上述元路径传递的信息进行衰退处理,模拟跨越时间的信息的损失;将所有路径的信息与目标节点的隐藏状态拼接,经过一个包含线性层与Softmax激活函数的软注意力模块生成各条路径注意力作为各类路径所传递的信息比重,将注意力与拼接后的信息进行加权和得到最终的输入信息;
最后,将输入的信息通过以上一层网络输出的目标节点表征作为隐藏状态经过门控循环单元GRU的重置门与遗忘门后,对目标节点的隐藏状态进行更新。
5.根据权利要求4所述的基于异构图神经网络的ICU心衰预测系统,其特征在于,所述环境Transformer层提取病人与其他医疗变量节点间的关系形成全局表征的过程如下:
环境Tranformer层将上一层模型输出的实验检测节点隐藏状态、输液节点隐藏状态与处方药节点隐藏状态进行纵向拼接用于计算键矩阵与值矩阵,将上一层模型输出的病人节点隐藏状态用于计算查询矩阵,通过Transformer框架进一步提取关系特征。
6.根据权利要求1所述的基于异构图神经网络的ICU心衰预测系统,其特征在于,所述的时间感知门控图注意力神经网络中,利用注意力机制得到各类医疗变量重要性的平均可视化信息。
7.根据权利要求1所述的基于异构图神经网络的ICU心衰预测系统,其特征在于,所述心衰预测模型的训练过程如下:
(1)由心衰相关病人本次住院第一次进入ICU后前48小时的实验检测、输液、处方药数据构成的EHR数据;
(2)由病人在本次住院期间内是否死亡作为最终标注,标签分别是0、1,对应于在本次住院期间内存活和在本次住院期间内死亡;
(3)基于标注数据,按固定比例对各个类别进行相同的训练集和验证集划分;
(4)对训练集和验证集中的实验检测数据、输液数据、处方药数据进行一定的数据变换和归一化处理,但不影响整体数据尺寸和数值范围分布;
(5)利用时间感知EHR异构图对提取得到的EHR数据进行构图,输入两层时间感知门控图注意力神经网络中,将学习得到的图中节点的表征再输入环境Transformer层输出最终表征进行分类训练,依次迭代所有训练样本更新模型参数直至收敛,得到最佳模型。
8.根据权利要求7所述的基于异构图神经网络的ICU心衰预测系统,其特征在于,通过Focal Loss作为损失函数对模型进行训练,训练出的模型使用验证集进行验证。
CN202111261673.9A 2021-10-28 2021-10-28 一种基于异构图神经网络的icu心衰预测系统 Pending CN113990502A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111261673.9A CN113990502A (zh) 2021-10-28 2021-10-28 一种基于异构图神经网络的icu心衰预测系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111261673.9A CN113990502A (zh) 2021-10-28 2021-10-28 一种基于异构图神经网络的icu心衰预测系统

Publications (1)

Publication Number Publication Date
CN113990502A true CN113990502A (zh) 2022-01-28

Family

ID=79743248

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111261673.9A Pending CN113990502A (zh) 2021-10-28 2021-10-28 一种基于异构图神经网络的icu心衰预测系统

Country Status (1)

Country Link
CN (1) CN113990502A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115336977A (zh) * 2022-08-03 2022-11-15 中南大学湘雅医院 一种精准icu警报分级评估方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115336977A (zh) * 2022-08-03 2022-11-15 中南大学湘雅医院 一种精准icu警报分级评估方法

Similar Documents

Publication Publication Date Title
US11468998B2 (en) Methods and systems for software clinical guidance
Kim et al. A deep learning model for real-time mortality prediction in critically ill children
WO2021120936A1 (zh) 一种基于多任务学习模型的慢病预测系统
CN110459328B (zh) 临床监护设备
De Bois et al. Adversarial multi-source transfer learning in healthcare: Application to glucose prediction for diabetic people
Pal et al. Deep learning techniques for prediction and diagnosis of diabetes mellitus
CN114420231B (zh) 一种可解释的急性肾损伤持续预警方法、系统、存储介质及电子设备
CN102405473A (zh) 医护点动作医疗系统和方法
Ali et al. Multitask deep learning for cost-effective prediction of patient's length of stay and readmission state using multimodal physical activity sensory data
CN113160986A (zh) 用于预测全身炎症反应综合征发展的模型构建方法及系统
CN116864139A (zh) 疾病风险评估方法、装置、计算机设备及可读存储介质
CN114611879A (zh) 一种基于多任务学习的临床风险预测系统
Ambilwade et al. Medical expert systems for diabetes diagnosis: A survey
RU2752792C1 (ru) Система для поддержки принятия врачебных решений
He et al. A multi-attention collaborative deep learning approach for blood pressure prediction
CN116959715B (zh) 一种基于时序演进过程解释的疾病预后预测系统
CN113990502A (zh) 一种基于异构图神经网络的icu心衰预测系统
Schlosser et al. Visual acuity prediction on real-life patient data using a machine learning based multistage system
KR20210112041A (ko) 앙상블 딥러닝과 형상 융합 기반 심장병 예측을 위한 스마트 헬스케어 모니터링 방법 및 시스템
CN116543917A (zh) 一种针对异构时间序列数据的信息挖掘方法
Suneetha et al. Fine tuning bert based approach for cardiovascular disease diagnosis
Patel et al. Predicting Heart Disease Using Machine Learning Algorithms
CN117112729B (zh) 基于人工智能的医疗资源对接方法及系统
CN115762698B (zh) 一种医疗慢病检查报告数据提取方法及系统
Kumar et al. A Smart Recommendation System for Medicine using Intelligent NLP Techniques

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination