CN109949936A - 一种基于深度学习混合模型的再住院风险预测方法 - Google Patents

一种基于深度学习混合模型的再住院风险预测方法 Download PDF

Info

Publication number
CN109949936A
CN109949936A CN201910190496.6A CN201910190496A CN109949936A CN 109949936 A CN109949936 A CN 109949936A CN 201910190496 A CN201910190496 A CN 201910190496A CN 109949936 A CN109949936 A CN 109949936A
Authority
CN
China
Prior art keywords
feature
model
patient
hospitalized
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910190496.6A
Other languages
English (en)
Other versions
CN109949936B (zh
Inventor
张岩龙
幸勇
邓军
罗林
王利亚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Shu Lian Yi Kang Technology Co Ltd
Original Assignee
Chengdu Shu Lian Yi Kang Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Shu Lian Yi Kang Technology Co Ltd filed Critical Chengdu Shu Lian Yi Kang Technology Co Ltd
Priority to CN201910190496.6A priority Critical patent/CN109949936B/zh
Publication of CN109949936A publication Critical patent/CN109949936A/zh
Application granted granted Critical
Publication of CN109949936B publication Critical patent/CN109949936B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于深度学习混合模型的再住院风险预测方法,该方法包括以下步骤:步骤1:收集数据集,包括患者个体特征和外部环境特征;步骤2:特征分组及预处理,将特征分为静态特征和时间序列特征;步骤3:时间序列特征挖掘,对时间序列特征进行统计分析、构建LDA模型和双向LSTM模型;步骤4:特征拼接,将静态特征和经特征工程处理的时间序列特征融合,作为CNN模型的输入;步骤5:构建CNN模型,预测患者再住院风险。本发明基于深度学习算法,对患者健康医疗大数据及所处外部环境进行研究分析,构建再住院风险预测模型,有助于医疗机构合理安排医疗资源,为患者提供更好的医疗服务,也有助于提升保险机构对参保人再住院风险识别的效率和准确率。

Description

一种基于深度学习混合模型的再住院风险预测方法
技术领域
本发明涉及医疗健康领域、机器学习技术,具体来讲涉及一种基于LDA、LSTM、CNN混合模型的再住院风险预测方法。
背景技术
随着医疗信息化的不断完善,我国医疗机构已迈入到信息化和数字化的时代,医疗健康领域积累了大量数据,为“人工智能+医疗”研究提供了坚实的数据基础。同时,精准健康医疗已被越来越多的国家和机构所重视,而再住院风险预测是精准健康医疗的一个重要研究方向。
精准化和个性化的再住院风险预测对提升医疗公共服务水平和医疗保险统筹规划具有重大的应用价值。在医疗公共服务方面,再住院风险预测有助于医疗机构合理安排医疗资源,为患者提供更好的医疗服务;在医疗保险管理方面,再住院风险预测有助于提升保险机构对参保人理赔风险识别的效率和准确性,为实现差异化服务提供数据支撑。
分析健康医疗大数据的特性及再住院风险预测模型相关研究情况,目前工作还存在一些问题有待研究,主要体现在以下三个方面:(1)再住院风险预测模型主要考虑患者个体特征,忽略了外部环境对患者再住院的影响;(2)对患者疾病变化趋势、治疗路径和患病相似性的信息挖掘不足;(3)目前,构建再住院风险预测模型主要采用传统的机器学习算法,而基于树模型的传统机器学习算法处理大样本量的运行效率极低。
鉴于此,探索基于时间序列模型和主题模型的特征处理方法,探索基于深度学习框架的分类算法,构建再住院风险预测模型,为医疗健康领域个人再住院风险识别提供支撑是本发明主要解决的问题。
发明内容
为解决上述不足,本发明在此提供一种基于深度学习混合模型的再住院风险预测方法。本发明基于深度学习算法,对患者健康医疗大数据及所处外部环境进行研究分析,构建再住院风险预测模型,有助于医疗机构合理安排医疗资源,为患者提供更好的医疗服务,也有助于提升保险机构对参保人再住院风险识别的效率和准确率。
本发明是这样实现的,构造一种基于深度学习混合模型的再住院风险预测方法,其特征在于:该方法包括以下步骤:
步骤1:收集数据集,包括患者个体特征和外部环境特征;
步骤2:特征分组及预处理,将特征分为静态特征和时间序列特征;
步骤3:时间序列特征挖掘,对时间序列特征进行统计分析、构建LDA模型和双向LSTM模型;
步骤4:特征拼接,将静态特征和经特征工程处理的时间序列特征融合,作为CNN模型的输入;
步骤5:构建CNN模型,预测患者再住院风险。
根据本发明所述一种基于深度学习混合模型的再住院风险预测方法,其特征在于:步骤(1)所述的收集数据集,包括如下子步骤:
步骤1.1:获取与患者健康相关的数据和家族史信息;
步骤1.2:获取患者现住址的外部环境特征,包括地区经济水平、空气污染和气象信息;
步骤1.3:设定样本集合和标签集合,所述样本集合为X={x1,K,xn},为患者i的ni条记录,rij为元组(sij,tij),其中sij∈Rd为在时间tij的一个d维向量;划分动态时间分割点,对样本集合未来某个时间段(如1年)是否再住院打标签,标签集合为Y={y1,K,yn},
根据本发明所述一种基于深度学习混合模型的再住院风险预测方法,其特征在于:对于步骤1.3来讲,划分动态时间分割点,包括如下子步骤:
步骤1.3.1:定义时间滑动窗口;
步骤1.3.2:选择时间滑动窗口中的任意一天为时间分割点;
步骤1.3.3:时间分割点之前的样本集合定义为患者特征,时间分割点之后某个时间段(如1年)的样本集合定义为再住院标签。
根据本发明所述一种基于深度学习混合模型的再住院风险预测方法,其特征在于:步骤2所述的特征分组及预处理,包括如下子步骤:
步骤2.1:在特征集中,提取距时间分割点最近的患者基本信息、家族史、外部环境特征,作为静态特征;
步骤2.2:按患者就诊记录、体检记录的时间先后顺序,提取特征集中患者所有的诊疗信息、体检信息、药物治疗信息,作为时间序列特征;
步骤2.3:针对静态特征,对特征进行预处理,即去噪、填补缺失值、离散化处理等;
步骤2.4:针对时间序列特征,对疾病名称和手术操作按ICD(国际疾病分类(International Classification of Diseases,ICD))编码进行标准化处理,对药物名称按社会保险药品分类进行标准化处理,对体检指标是否正常用“0-1”表示。
根据本发明所述一种基于深度学习混合模型的再住院风险预测方法,其特征在于:步骤3所述的时间序列特征挖掘,包括如下子步骤:
步骤3.1:对时间序列特征进行统计分析,包括住院次数计数、住院时长求和、住院费用求平均值、入院病情计数等;
步骤3.2:对时间序列特征中的手术操作按ICD-9编码计数,出院诊断及出院病情按ICD-10编码计数,并分别构建LDA模型,挖掘患者疾病间的相似性;
所述的,LDA模型为隐含狄利克雷分布模型(Latent Dirichlet Allocation),该模型采用词袋模型,将每一篇文档视为一个词频向量,通过将文档表示为一个主题向量来达到特征降维的目的;
将研究期间每个患者所患疾病作为一个文档,每种疾病编码为一个字符,运用LDA模型计算文档之间的语义相似度,寻找字符间的语义主题;
构建LDA模型,包括如下子步骤:输入患者手术操作、出院诊断或出院病情计数;通过分析困惑度与聚类效果计算主题数l;对特征进行训练,构建LDA模型;反复迭代,直至收敛;提取各主题模型前m个主题关键词;
以出院诊断编码为例,主题模型计算公式为:
Topici=αi1*jbbmi1+L+αij*jbbmij+L+αim*jbbmim,(i=1,K,l)
其中,αij为主题模型中出院诊断编码jbbmij的系数;m表示构成每个主题模型中的关键词数量;l表示出院诊断编码的主题数,通过分析困惑度与聚类效果的相关关系确定,计算公式为:
其中,p(w)指训练集中每个单词出现的概率,p(w)=p(z|d)*p(w|z)。p(z|d)表示一个文档中每个主题出现的概率,p(w|z)表示词典中每一个单词在某个主题下出现的概率;
步骤3.3:对时间序列特征,构建双向LSTM模型,挖掘患者的疾病变化趋势及治疗路径;
所述的,LSTM模型为长短期记忆网络(Long Short-Term Memory),通过分析患者本次住院前后所患疾病及药物治疗情况,挖掘患者的疾病变化趋势及治疗路径,计算公式为:
ht=ot⊙tanh(ct)
其中ft,it和ot为三个门控制单元,主要用来控制信息传递;遗忘门ft控制上一个时刻的内部状态ct-1需要丢弃多少信息;输入门it控制当前时刻的候选状态有多少信息需要保留;输出门ot控制当前时刻的内部状态ct有多少信息需要输出给外部状态ht;⊙表示向量元素乘积;ct-1为上一时刻的内部状态;是通过非线性函数得到的获选状态,公式如下所示:
其中tanh()为双曲正切函数;W,U和b为可学习的网络参数;xt为当前时刻的输入数据。在每个时刻t,长短期记忆网络的内部状态ct记录了从开始到当前时刻的历史信息。
根据本发明所述一种基于深度学习混合模型的再住院风险预测方法,其特征在于:步骤4所述的特征拼接,具体包括:根据患者ID,将静态特征和经特征工程处理的时间序列特征融合,得到CNN模型的输入。
根据本发明所述一种基于深度学习混合模型的再住院风险预测方法,其特征在于:步骤5所述的CNN模型构建步骤如下:
步骤5.1:卷积层,输入拼接特征,通过卷积操作提取患者的局部特征信息;
步骤5.2:池化层,从卷积层提取的特征中选出最重要的特征值;
步骤5.3:全连接层,将特征表示映射到样本的标记空间,实现特征降维;
步骤5.4:使用激活函数计算患者属于每个类别的概率,实现分类操作,输出患者再住院分类结果;
步骤5.5:输入测试集,根据样本集合的模型训练结果预测测试集的再住院风险。
本发明具有如下优点:
(1)本发明构建的再住院风险预测模型,除了考虑患者自身特征,还考虑了患者家族史、患者所处环境特征,较好地分析了外部环境对患者再住院的影响,有利于提升再住院风险预测的准确率。
(2)本发明通过时间序列特征挖掘,能更好地捕捉患者既往住院史、体检记录、药物治疗记录对患者再住院的影响。通过统计分析,整体掌握患者既往住院史的严重程度;通过主题模型,对特征进行降维,挖掘患者疾病间的相似性;通过双向LSTM模型,挖掘患者疾病变化趋势及治疗路径。
(3)本发明基于深度学习框架构建再住院风险预测模型,有利于提升预测效果,且适用于处理大样本量,比传统的机器学习算法运行效率更高。
附图说明
图1为一种基于深度学习混合模型的再住院风险预测方法的流程图;
图2为动态时间分割点划分流程图;
图3为特征分组及预处理流程图;
图4为构建LDA模型的流程图;
图5为构建CNN模型的流程图。
具体实施方式
下面将结合附图1-图5对本发明进行详细说明,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明通过改进在此提供一种基于深度学习混合模型的再住院风险预测方法,包括以下步骤:
步骤1:收集数据集,包括患者个体特征和外部环境特征;
步骤2:特征分组及预处理,将特征分为静态特征和时间序列特征;
步骤3:时间序列特征挖掘,对时间序列特征进行统计分析、构建LDA模型和双向LSTM模型;
步骤4:特征拼接,将静态特征和经特征工程处理的时间序列特征融合,作为CNN模型的输入;
步骤5:构建CNN模型,预测患者再住院风险。
所述的收集数据集,包括如下子步骤:
步骤1.1:获取与患者健康相关的数据和家族史信息;
所述的,与患者健康相关的数据包括:
患者基本信息:患者年龄、性别、民族、职业、现住址、婚姻状况等;
临床诊疗信息:研究期间患者每次住院记录的入院时间、出院时间、住院费用、入院病情、手术编码、手术级别、出院诊断编码、出院病情、离院方式等;
药物治疗信息:研究期间患者服用的药物名称及用药量;
体检信息:研究期间患者每次体检的各项体检指标数据;
家族史信息:研究期间患者家庭成员的出院诊断编码计数。
步骤1.2:获取患者现住址的外部环境特征,包括地区经济水平、空气污染和气象信息;
所述的,患者现住址的外部环境特征包括:
地区经济水平:人均可支配收入、人均GDP等;
空气污染:PM2.5、PM10、SO2、NO2、O3、CO的日平均浓度;
气象信息:日平均温度、最高温度、最低温度、日平均相对湿度等。
步骤1.3:设定样本集合和标签集合,所述样本集合为X={x1,K,xn},为患者i的ni条记录,rij为元组(sij,tij),其中sij∈Rd为在时间tij的一个d维向量;划分动态时间分割点,对样本集合未来某个时间段(如1年)是否再住院打标签,标签集合为Y={y1,K,yn},
如图2所示,划分动态时间分割点,包括如下子步骤:
步骤1.3.1:定义时间滑动窗口;
步骤1.3.2:选择时间滑动窗口中的任意一天为时间分割点;
步骤1.3.3:时间分割点之前的样本集合定义为患者特征,时间分割点之后某个时间段(如1年)的样本集合定义为再住院标签。
如图3所示,所述的特征分组及预处理,包括如下子步骤:
步骤2.1:在特征集中,提取距时间分割点最近的患者基本信息、家族史、外部环境特征,作为静态特征;
在具体实施例中,提取静态特征表现为:定义距时间分割点最近的患者住院信息为患者基本信息;定义研究起始时间至时间分割点的外部环境指标的平均值作为外部环境特征;定义研究起始时间至时间分割点的家庭成员所有住院记录中,出院诊断编码的计数为家族史特征。
步骤2.2:按患者就诊记录、体检记录的时间先后顺序,提取特征集中患者所有的诊疗信息、体检信息、药物治疗信息,作为时间序列特征;
步骤2.3:针对静态特征,对特征进行预处理,即去噪、填补缺失值、离散化处理等;
步骤2.4:针对时间序列特征,对疾病名称和手术操作按ICD(国际疾病分类(International Classification of Diseases,ICD))编码进行标准化处理,对药物名称按社会保险药品分类进行标准化处理,对体检指标是否正常用“0-1”表示。
所述的时间序列特征挖掘,包括如下子步骤:
步骤3.1:对时间序列特征进行统计分析,包括住院次数计数、住院时长求和、住院费用求平均值、入院病情计数等;
步骤3.2:对时间序列特征中的手术操作按ICD-9编码计数,出院诊断及出院病情按ICD-10编码计数,并分别构建LDA模型,挖掘患者疾病间的相似性;
所述的,LDA模型为隐含狄利克雷分布模型(Latent Dirichlet Allocation),该模型采用词袋模型,将每一篇文档视为一个词频向量,通过将文档表示为一个主题向量来达到特征降维的目的。
在具体实施例中,将研究期间每个患者所患疾病作为一个文档,每种疾病编码为一个字符,运用LDA模型计算文档之间的语义相似度,寻找字符间的语义主题。
如图4所示,构建LDA模型,包括如下子步骤:输入患者手术操作、出院诊断或出院病情计数;通过分析困惑度与聚类效果计算主题数l;对特征进行训练,构建LDA模型;反复迭代,直至收敛;提取各主题模型前m个主题关键词。
以出院诊断编码为例,主题模型计算公式为:
Topici=αi1*jbbmi1+L+αij*jbbmij+L+αim*jbbmim,(i=1,K,l)
其中,αij为主题模型中出院诊断编码jbbmij的系数;m表示构成每个主题模型中的关键词数量;l表示出院诊断编码的主题数,通过分析困惑度与聚类效果的相关关系确定,计算公式为:
其中,p(w)指训练集中每个单词出现的概率,p(w)=p(z|d)*p(w|z)。p(z|d)表示一个文档中每个主题出现的概率,p(w|z)表示词典中每一个单词在某个主题下出现的概率。
步骤3.3:对时间序列特征,构建双向LSTM模型,挖掘患者的疾病变化趋势及治疗路径。
所述的,LSTM模型为长短期记忆网络(Long Short-Term Memory),通过分析患者本次住院前后所患疾病及药物治疗情况,挖掘患者的疾病变化趋势及治疗路径,计算公式为:
ht=ot⊙tanh(ct)
其中ft,it和ot为三个门控制单元,主要用来控制信息传递;遗忘门ft控制上一个时刻的内部状态ct-1需要丢弃多少信息;输入门it控制当前时刻的候选状态有多少信息需要保留;输出门ot控制当前时刻的内部状态ct有多少信息需要输出给外部状态ht;⊙表示向量元素乘积;ct-1为上一时刻的内部状态;是通过非线性函数得到的获选状态,公式如下所示:
其中tanh()为双曲正切函数;W,U和b为可学习的网络参数;xt为当前时刻的输入数据。在每个时刻t,长短期记忆网络的内部状态ct记录了从开始到当前时刻的历史信息。
所述的特征拼接,具体包括:
步骤4:根据患者ID,将静态特征和经特征工程处理的时间序列特征融合,得到CNN模型的输入。
所述的CNN模型,全称为卷积神经网络(Convolutional Neural Network,CNN),是一种深度前馈人工神经网络。
如图5所示,构建CNN模型包括如下子步骤:
步骤5.1:卷积层,输入拼接特征,通过卷积操作提取患者的局部特征信息;
步骤5.2:池化层,从卷积层提取的特征中选出最重要的特征值;
在具体的实施例中,可使用平均值池化函数,即使用某一个位置相邻数据的平均值来代替网络在该位置的数据,使数据的表示近似保持不变,从而提取对分类最重要的信息。在卷积神经网络中使用池化,在一定程度上可以防止过拟合,有助于模型的优化。
步骤5.3:全连接层,将特征表示映射到样本的标记空间,实现特征降维;
步骤5.4:使用激活函数计算患者属于每个类别的概率,实现分类操作,输出患者再住院分类结果。
在具体的实施例中,可使用Sigmoid函数作为激活函数,将输出响应的值域压缩在[0,1]之间,公式为:
其中x为全连接层的输出结果。
步骤5.5:输入测试集,根据样本集合的模型训练结果预测测试集的再住院风险。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (7)

1.一种基于深度学习混合模型的再住院风险预测方法,其特征在于:该方法包括以下步骤:
步骤1:收集数据集,包括患者个体特征和外部环境特征;
步骤2:特征分组及预处理,将特征分为静态特征和时间序列特征;
步骤3:时间序列特征挖掘,对时间序列特征进行统计分析、构建LDA模型和双向LSTM模型;
步骤4:特征拼接,将静态特征和经特征工程处理的时间序列特征融合,作为CNN模型的输入;
步骤5:构建CNN模型,预测患者再住院风险。
2.根据权利要求1所述一种基于深度学习混合模型的再住院风险预测方法,其特征在于:步骤(1)所述的收集数据集,包括如下子步骤:
步骤1.1:获取与患者健康相关的数据和家族史信息;
步骤1.2:获取患者现住址的外部环境特征,包括地区经济水平、空气污染和气象信息;
步骤1.3:设定样本集合和标签集合,所述样本集合为X={x1,K,xn},为患者i的ni条记录,rij为元组(sij,tij),其中sij∈Rd为在时间tij的一个d维向量;划分动态时间分割点,对样本集合未来某个时间段(如1年)是否再住院打标签,标签集合为Y={y1,K,yn},
3.根据权利要求2所述一种基于深度学习混合模型的再住院风险预测方法,其特征在于:对于步骤1.3来讲,划分动态时间分割点,包括如下子步骤:
步骤1.3.1:定义时间滑动窗口;
步骤1.3.2:选择时间滑动窗口中的任意一天为时间分割点;
步骤1.3.3:时间分割点之前的样本集合定义为患者特征,时间分割点之后某个时间段(如1年)的样本集合定义为再住院标签。
4.根据权利要求1所述一种基于深度学习混合模型的再住院风险预测方法,其特征在于:步骤2所述的特征分组及预处理,包括如下子步骤:
步骤2.1:在特征集中,提取距时间分割点最近的患者基本信息、家族史、外部环境特征,作为静态特征;
步骤2.2:按患者就诊记录、体检记录的时间先后顺序,提取特征集中患者所有的诊疗信息、体检信息、药物治疗信息,作为时间序列特征;
步骤2.3:针对静态特征,对特征进行预处理,即去噪、填补缺失值、离散化处理等;
步骤2.4:针对时间序列特征,对疾病名称和手术操作按ICD编码进行标准化处理,对药物名称按社会保险药品分类进行标准化处理,对体检指标是否正常用“0-1”表示。
5.根据权利要求1所述一种基于深度学习混合模型的再住院风险预测方法,其特征在于:步骤3所述的时间序列特征挖掘,包括如下子步骤:
步骤3.1:对时间序列特征进行统计分析,包括住院次数计数、住院时长求和、住院费用求平均值、入院病情计数等;
步骤3.2:对时间序列特征中的手术操作按ICD-9编码计数,出院诊断及出院病情按ICD-10编码计数,并分别构建LDA模型,挖掘患者疾病间的相似性;
所述的,LDA模型为隐含狄利克雷分布模型(Latent Dirichlet Allocation),该模型采用词袋模型,将每一篇文档视为一个词频向量,通过将文档表示为一个主题向量来达到特征降维的目的;
将研究期间每个患者所患疾病作为一个文档,每种疾病编码为一个字符,运用LDA模型计算文档之间的语义相似度,寻找字符间的语义主题;
构建LDA模型,包括如下子步骤:输入患者手术操作、出院诊断或出院病情计数;通过分析困惑度与聚类效果计算主题数l;对特征进行训练,构建LDA模型;反复迭代,直至收敛;提取各主题模型前m个主题关键词;
以出院诊断编码为例,主题模型计算公式为:
Topici=αi1*jbbmi1+L+αij*jbbmij+L+αim*jbbmim,(i=1,K,l)
其中,αij为主题模型中出院诊断编码jbbmij的系数;m表示构成每个主题模型中的关键词数量;l表示出院诊断编码的主题数,通过分析困惑度与聚类效果的相关关系确定,计算公式为:
其中,p(w)指训练集中每个单词出现的概率,p(w)=p(z|d)*p(w|z)。p(z|d)表示一个文档中每个主题出现的概率,p(w|z)表示词典中每一个单词在某个主题下出现的概率;
步骤3.3:对时间序列特征,构建双向LSTM模型,挖掘患者的疾病变化趋势及治疗路径;
所述的,LSTM模型为长短期记忆网络(Long Short-Term Memory),通过分析患者本次住院前后所患疾病及药物治疗情况,挖掘患者的疾病变化趋势及治疗路径,计算公式为:
其中ft,it和ot为三个门控制单元,主要用来控制信息传递;遗忘门ft控制上一个时刻的内部状态ct-1需要丢弃多少信息;输入门it控制当前时刻的候选状态有多少信息需要保留;输出门ot控制当前时刻的内部状态ct有多少信息需要输出给外部状态ht;⊙表示向量元素乘积;ct-1为上一时刻的内部状态;是通过非线性函数得到的获选状态,公式如下所示:
其中tanh()为双曲正切函数;W,U和b为可学习的网络参数;xt为当前时刻的输入数据。在每个时刻t,长短期记忆网络的内部状态ct记录了从开始到当前时刻的历史信息。
6.根据权利要求1所述一种基于深度学习混合模型的再住院风险预测方法,其特征在于:步骤4所述的特征拼接,具体包括:根据患者ID,将静态特征和经特征工程处理的时间序列特征融合,得到CNN模型的输入。
7.根据权利要求1所述一种基于深度学习混合模型的再住院风险预测方法,其特征在于:步骤5所述的CNN模型构建步骤如下:
步骤5.1:卷积层,输入拼接特征,通过卷积操作提取患者的局部特征信息;
步骤5.2:池化层,从卷积层提取的特征中选出最重要的特征值;
步骤5.3:全连接层,将特征表示映射到样本的标记空间,实现特征降维;
步骤5.4:使用激活函数计算患者属于每个类别的概率,实现分类操作,输出患者再住院分类结果;
步骤5.5:输入测试集,根据样本集合的模型训练结果预测测试集的再住院风险。
CN201910190496.6A 2019-03-13 2019-03-13 一种基于深度学习混合模型的再住院风险预测方法 Active CN109949936B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910190496.6A CN109949936B (zh) 2019-03-13 2019-03-13 一种基于深度学习混合模型的再住院风险预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910190496.6A CN109949936B (zh) 2019-03-13 2019-03-13 一种基于深度学习混合模型的再住院风险预测方法

Publications (2)

Publication Number Publication Date
CN109949936A true CN109949936A (zh) 2019-06-28
CN109949936B CN109949936B (zh) 2023-05-30

Family

ID=67008818

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910190496.6A Active CN109949936B (zh) 2019-03-13 2019-03-13 一种基于深度学习混合模型的再住院风险预测方法

Country Status (1)

Country Link
CN (1) CN109949936B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110347837A (zh) * 2019-07-17 2019-10-18 电子科技大学 一种心血管疾病非计划再住院风险预测方法
CN110957036A (zh) * 2019-10-24 2020-04-03 中国人民解放军总医院 一种基于因果推理构建的疾病预后风险评估模型的方法
CN111048166A (zh) * 2019-12-24 2020-04-21 天津新开心生活科技有限公司 风险级别确定模型训练方法及装置、电子设备、存储介质
CN111612278A (zh) * 2020-06-01 2020-09-01 戴松世 生命状态预测方法、装置、电子设备及存储介质
CN112016760A (zh) * 2020-09-04 2020-12-01 平安科技(深圳)有限公司 多维度信息的组合预测方法、装置、计算机设备及介质
CN112150209A (zh) * 2020-06-19 2020-12-29 南京理工大学 一种基于聚类中心的cnn-lstm时序预测模型的构建方法
CN112185564A (zh) * 2020-10-20 2021-01-05 福州数据技术研究院有限公司 一种基于结构化电子病历的眼科疾病预测方法和存储设备
CN112687376A (zh) * 2021-01-22 2021-04-20 四川大学 一种慢性病群体中资源高消耗人群的个案管理方法
CN112786190A (zh) * 2021-01-14 2021-05-11 金陵科技学院 一种多维数据融合的医疗健康诊疗模型
CN113223711A (zh) * 2021-04-29 2021-08-06 天津大学 基于多模态数据的再入院预测模型
CN113345564A (zh) * 2021-05-31 2021-09-03 电子科技大学 一种基于图神经网络的患者住院时长早期预测方法及装置
CN113496779A (zh) * 2020-03-18 2021-10-12 株式会社日立制作所 患者状态的预测装置、预测方法、以及预测程序
CN113724891A (zh) * 2021-08-31 2021-11-30 平安国际智慧城市科技股份有限公司 医院疫情监测方法、装置及相关设备
CN114792568B (zh) * 2022-06-27 2023-06-06 天津幸福生命科技有限公司 住院风险预测方法及装置、存储介质及电子设备
CN117275699B (zh) * 2023-11-23 2024-02-13 四川省医学科学院·四川省人民医院 一种智慧病房系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140207492A1 (en) * 2010-06-08 2014-07-24 Siemens Medical Solutions Usa, Inc Healthcare Information Technology System for Predicting or Preventing Readmissions
CN104766127A (zh) * 2014-01-02 2015-07-08 深圳市永泰中天软件股份有限公司 一种预测患者手术后住院天数的方法
CN107180283A (zh) * 2017-07-05 2017-09-19 山东大学 一种基于最优特征组合的再住院行为预测系统及方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140207492A1 (en) * 2010-06-08 2014-07-24 Siemens Medical Solutions Usa, Inc Healthcare Information Technology System for Predicting or Preventing Readmissions
CN104766127A (zh) * 2014-01-02 2015-07-08 深圳市永泰中天软件股份有限公司 一种预测患者手术后住院天数的方法
CN107180283A (zh) * 2017-07-05 2017-09-19 山东大学 一种基于最优特征组合的再住院行为预测系统及方法

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110347837A (zh) * 2019-07-17 2019-10-18 电子科技大学 一种心血管疾病非计划再住院风险预测方法
CN110347837B (zh) * 2019-07-17 2022-02-18 电子科技大学 一种心血管疾病非计划再住院风险预测方法
CN110957036A (zh) * 2019-10-24 2020-04-03 中国人民解放军总医院 一种基于因果推理构建的疾病预后风险评估模型的方法
CN111048166A (zh) * 2019-12-24 2020-04-21 天津新开心生活科技有限公司 风险级别确定模型训练方法及装置、电子设备、存储介质
CN113496779A (zh) * 2020-03-18 2021-10-12 株式会社日立制作所 患者状态的预测装置、预测方法、以及预测程序
CN111612278A (zh) * 2020-06-01 2020-09-01 戴松世 生命状态预测方法、装置、电子设备及存储介质
CN112150209A (zh) * 2020-06-19 2020-12-29 南京理工大学 一种基于聚类中心的cnn-lstm时序预测模型的构建方法
CN112150209B (zh) * 2020-06-19 2022-10-18 南京理工大学 一种基于聚类中心的cnn-lstm时序预测模型的构建方法
CN112016760A (zh) * 2020-09-04 2020-12-01 平安科技(深圳)有限公司 多维度信息的组合预测方法、装置、计算机设备及介质
CN112185564A (zh) * 2020-10-20 2021-01-05 福州数据技术研究院有限公司 一种基于结构化电子病历的眼科疾病预测方法和存储设备
CN112786190A (zh) * 2021-01-14 2021-05-11 金陵科技学院 一种多维数据融合的医疗健康诊疗模型
CN112786190B (zh) * 2021-01-14 2024-02-13 金陵科技学院 一种多维数据融合的医疗健康诊疗方法
CN112687376A (zh) * 2021-01-22 2021-04-20 四川大学 一种慢性病群体中资源高消耗人群的个案管理方法
CN113223711A (zh) * 2021-04-29 2021-08-06 天津大学 基于多模态数据的再入院预测模型
CN113345564A (zh) * 2021-05-31 2021-09-03 电子科技大学 一种基于图神经网络的患者住院时长早期预测方法及装置
CN113724891A (zh) * 2021-08-31 2021-11-30 平安国际智慧城市科技股份有限公司 医院疫情监测方法、装置及相关设备
CN114792568B (zh) * 2022-06-27 2023-06-06 天津幸福生命科技有限公司 住院风险预测方法及装置、存储介质及电子设备
CN117275699B (zh) * 2023-11-23 2024-02-13 四川省医学科学院·四川省人民医院 一种智慧病房系统

Also Published As

Publication number Publication date
CN109949936B (zh) 2023-05-30

Similar Documents

Publication Publication Date Title
CN109949936A (zh) 一种基于深度学习混合模型的再住院风险预测方法
CN109460473B (zh) 基于症状提取和特征表示的电子病历多标签分类方法
RU2703679C2 (ru) Способ и система поддержки принятия врачебных решений с использованием математических моделей представления пациентов
CN109599185B (zh) 疾病数据处理方法、装置、电子设备及计算机可读介质
CN111316281B (zh) 基于机器学习的自然语言情境中数值数据的语义分类方法以及系统
CN111382272B (zh) 一种基于知识图谱的电子病历icd自动编码方法
CN106934235B (zh) 一种基于迁移学习的疾病领域间病人相似性度量迁移系统
CN110162779A (zh) 病历质量的评估方法、装置及设备
Stoean et al. Automated detection of presymptomatic conditions in Spinocerebellar Ataxia type 2 using Monte Carlo dropout and deep neural network techniques with electrooculogram signals
CN116364299B (zh) 一种基于异构信息网络的疾病诊疗路径聚类方法及系统
Bardak et al. Improving clinical outcome predictions using convolution over medical entities with multimodal learning
Malone et al. Learning representations of missing data for predicting patient outcomes
CN109360658A (zh) 一种基于词向量模型的疾病模式挖掘方法及装置
Ju et al. 3D-CNN-SPP: A patient risk prediction system from electronic health records via 3D CNN and spatial pyramid pooling
CN117542467B (zh) 基于患者数据的专病标准数据库自动构建方法
Gansky Dental data mining: potential pitfalls and practical issues
Klüver Steering clustering of medical data in a Self-Enforcing Network (SEN) with a cue validity factor
El-Darzi et al. Length of stay-based clustering methods for patient grouping
CN110633368A (zh) 早期结直肠癌非结构化数据的深度学习分类方法
Sharma et al. Comparing Data Mining Techniques Used For Heart Disease Prediction
CN114678126A (zh) 一种疾病追踪预测系统
CN114613465A (zh) 一种脑卒中患病风险预测和个性化治疗推荐方法及系统
CN113643783A (zh) 亚健康人群药品推荐方法、系统、设备及存储介质
Colbaugh et al. Analyzing social media content for security informatics
Bhatia et al. An efficient modular framework for automatic LIONC classification of MedIMG using unified medical language

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant