CN107591204A - 基于时序画像图的再住院预测方法和系统 - Google Patents

基于时序画像图的再住院预测方法和系统 Download PDF

Info

Publication number
CN107591204A
CN107591204A CN201710647309.3A CN201710647309A CN107591204A CN 107591204 A CN107591204 A CN 107591204A CN 201710647309 A CN201710647309 A CN 201710647309A CN 107591204 A CN107591204 A CN 107591204A
Authority
CN
China
Prior art keywords
patient
medical
frequent
portrait
sequential
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710647309.3A
Other languages
English (en)
Other versions
CN107591204B (zh
Inventor
李晖
徐祥朕
郭伟
崔立真
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN201710647309.3A priority Critical patent/CN107591204B/zh
Publication of CN107591204A publication Critical patent/CN107591204A/zh
Application granted granted Critical
Publication of CN107591204B publication Critical patent/CN107591204B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于病人医疗时序画像图的再住院预测方法,包括:从医疗数据中分析提取医疗事件,对提取的医疗事件按时间先后序列化;基于序列化的医疗事件,为每位病人构建医疗时序画像图;采用改进的AGM算法,挖掘所有医疗时序画像图的频繁子图;根据所述频繁子图,采用蒙特卡洛模拟方法,为每位病人的所有频繁子图计算对应的重构系数,基于所述重构系数,采用随机森林算法预测病人是否再住院。根据本发明的技术方案,能够帮助病人提前了解自己的健康状况,也有助于医疗机构提供更好的医疗服务。

Description

基于时序画像图的再住院预测方法和系统
技术领域
本发明属于健康医疗领域,尤其涉及一种基于病人医疗时序画像图的再住院预测方法和系统。
背景技术
中共中央、国务院印发了《“健康中国2030”规划纲要》,《纲要》中明确支出:健康是促进人的全面发展的必然要求,是经济社会发展的基础条件。随着计算机软硬件的快速发展和医疗信息系统的全面覆盖,健康医疗领域逐渐积累了大量的数据。数据挖掘技术能够在大量医疗数据中挖掘出有价值的医疗信息,实现精准的、个性化疾病预防和疾病预警。
在现有基于图的再住院预测和疾病风险预测研究工作中,有人开发了一个称为GEMINI的综合医疗分析系统,为医疗机构提供预测分析结果,该系统由两个部分组成:PROFILING和ANALYTICS。PROFILING组件从各来源提取每个患者的数据,并将它们作为信息存储在病人画像图中;ANALYTICS组件从病人画像图中抽取与预测任务相关的医疗特征,该文献对病人的再住院风险进行了预测,但未在图中考虑不同临床事件之间的时序关系。有人提出一种时序图表示方法,时序图能够捕捉到不同临床事件之间的时序关系,可为预测分析任务提供丰富信息,但在进行相关风险预测时,抛开了图本身的结构,与图结构本身脱离了关系,失去了图表示带来的部分好处。
如何提高再住院预测的准确性,是目前需要本领域技术人员迫切解决的一个技术问题。
发明内容
为了解决上述问题,本发明提供了一种基于病人医疗时序画像图的再住院预测方法和系统,在对病人再住院预测的过程中,首先基于医疗时间的分析处理为每个病人构建医疗时序画像图,然后基于所有的医疗时序画像图进行频繁子图挖掘,然后利用蒙特卡洛模拟方法为每个病人计算相应频繁子图的重构系数,最终利用随机森林算法,把频繁子图的重构系数作为输入预测未来病人是否再住院。
为了实现上述目的,本发明采用如下技术方案:
一种基于病人医疗时序画像图的再住院预测方法,包括以下步骤:
步骤1:从医疗数据中分析提取医疗事件,对提取的医疗事件按时间先后序列化;
步骤2:基于序列化的医疗事件,为每位病人构建医疗时序画像图;
步骤3:采用改进的AGM算法,挖掘所有医疗时序画像图的频繁子图;
步骤4:根据所述频繁子图,采用蒙特卡洛模拟方法,为每位病人的所有频繁子图计算对应的重构系数,基于所述重构系数,采用随机森林算法预测病人是否再住院。
进一步地,所述步骤1包括:
步骤101:分析病人住院记录、普通门诊记录、慢性病记录和体检记录;
步骤102:提取病人的所有医疗事件,包括:诊断、用药和体检及相应的时间,根据事件发生的时间,将每个病人的医疗事件序列化;
步骤103:根据每个人最后一次诊断前一定间隔内的数据是否出现冠心病来给每位病人一个再住院标签。
进一步地,所述步骤102包括:假设一个病人的医疗事件集合为{sn:n=1,2,...,N},其中N是医疗事件序列的数量,每一个事件序列被表示为sn=((xnl,tnl):l=1,2,...,Ln),其中Ln是序列sn的长度,(xn1,tn1)表示在时间tnl能观察到事件xnl
进一步地,所述步骤2包括:
步骤201:每个病人医疗事件的唯一化作为病人时序画像图的顶点;
步骤202:计算顶点之间的权重,得到邻接矩阵;
步骤203:根据所述顶点集合和邻接矩阵,为每个病人构建一个时序画像图。
进一步地,所述步骤202中,
从顶点i到顶点j的权重计算公式为:其中κ(·)是一个非递增函数;在sn中事件i和j的越接近,权重越高。
进一步地,
其中,δ表示时间间隔,△表示时间阈值。
进一步地,所述步骤3包括:
步骤301:基于步骤203产生的时序画像图,定出频繁1顶点子图和频繁2顶点子图;
步骤302:设置k的初始值为2,也就是从2顶点子图开始挖掘多顶点频繁子图;
步骤303:判断两个k频繁子图能否合并,若能合并判断合并后图的所有连通k子图是否都为频繁k子图;
步骤304:若合并后图的所有连通k子图都为频繁k子图,把合并后图加入k+1顶点频繁子图候选集合,否则舍弃;
步骤305:判断k+1顶点频繁子图候选集合中每个子图是否频繁,若频繁,加入到k+1顶点频繁子图集合;
步骤306:判断k+1顶点频繁子图集合是否为空,若为空跳出挖掘,不为空k=k+1继续挖掘频繁k+2顶点子图。
进一步地,所述步骤4包括:
步骤401:使用一定数量的频繁子图作为图基,计算每个病人的频繁子图对应的重构系数;
步骤402:使用蒙特卡洛模拟方法,模拟数万次,计算最优重构系数,构成重构系数向量;
步骤403:基于所述重构系数向量和再住院标签,使用随机森林算法预测病人是否再住院。
根据本发明的另一方面,本发明还提供了一种计算机设备,用于病人的再住院预测,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤,包括:
从医疗数据中分析提取医疗事件,对提取的医疗事件按时间先后序列化;
基于序列化的医疗事件,为每位病人构建医疗时序画像图;
采用改进的AGM算法,挖掘所有医疗时序画像图的频繁子图;
根据所述频繁子图,采用蒙特卡洛模拟方法,为每位病人的所有频繁子图计算对应的重构系数,基于所述重构系数,采用随机森林算法预测病人是否再住院。
根据本发明的另一方面,本发明还提供了一种计算机可读存储介质,其上存储有用于病人的再住院预测的计算机程序,该程序被处理器执行时实现以下步骤:
从医疗数据中分析提取医疗事件,对提取的医疗事件按时间先后序列化;
基于序列化的医疗事件,为每位病人构建医疗时序画像图;
采用改进的AGM算法,挖掘所有医疗时序画像图的频繁子图;
根据所述频繁子图,采用蒙特卡洛模拟方法,为每位病人的所有频繁子图计算对应的重构系数,基于所述重构系数,采用随机森林算法预测病人是否再住院。
本发明的有益效果:
1、本发明分析提取了生命历程的医疗事件,将提取的医疗事件按时间先后顺序进行有序链接,基于有序的医疗事件为每个人构建一个医疗时序画像图。时序图的表示形式压缩了原始数据使其更紧凑,从而有效解决了医疗数据的稀疏性问题,并且为每位病人的分散数据提供了一种全景概括视图。
2、本发明首先为每位病人构建一个医疗时序画像图,然后基于医疗时序画像图对每位病人进行再住院预测。精准和个性化的再住院预测,有助于病人提前了解自己的健康状况,减轻和延缓疾病带来的痛苦以及因疾病带来的经济负担;有助于医疗机构合理安排医疗资源,为病人提供更好的医疗服务;有助于医疗保险机构合理设计医疗保险金额,统筹医疗保险基金。
附图说明
图1是本发明一种病人再住院预测方法整体流程图;
图2是本发明序列化医疗事件的流程图;
图3是本发明时序画像图的构建流程图;
图4是本发明基于改进AGM挖掘频繁子图的流程图;
图5是本发明根据所述频繁子图预测再住院的流程图;
图6为随机森林算法工作机制。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
本发明所涉及的相关名词解释如下:
AGM算法
AGM算法采用了基于顶点的候选子图产生方法,通过逐步增加顶点来增加子图的规模,通过对图事务集的多次扫描,最后挖掘出满足最小支持度阈值的所有频繁子图。
2003年,A Inokuchi等提出了AGM算法,该算法是一个经典的基于图事物集的频繁子图挖掘算法,其形式化描述如下:
输入:图事物数据库G={G1,G2,......,Gn},频繁度阈值f
输出:频繁子图的集合S
(1)S1←频繁1-顶点子图
(2)S2←频繁2-顶点子图
(3)for(k=2;Sk≠Φ;k++){
(4)Ck+1←Φ
(5)for each gi∈Sk do
(6)for each gj∈Sk do{
(7)if(gi,gj的前k-1个顶点和相应的边完全相同,第k个顶点不同,且code(gi)<=code(gj))
(8)c←gigj
(9)if(c的所有连通k子图均在Sk中)
(10)Ck+1←Ck+1∪c}
(11)Sk+1←Φ
(12)for each Gi∈G do{
(13)for each c∈Gk+1do
(14)if(c∈Gi)c.freq++
(15)if(c.freq>=f)
(16)Sk+1←Sk+1∪c}}
在AGM算法中,采用了基于顶点的候选子图产生方法,通过逐步增加顶点来增加子图的规模。通过对图事物集的多次扫描,最后挖掘出满足最小支持度阈值的所有频繁子图。
蒙特卡洛方法
又称随机抽样或统计试验方法,属于计算数学的一个分支。传统的经验方法由于不能逼近真实的物理过程,很难得到满意的结果,而蒙特卡罗方法由于能够真实地模拟实际物理过程,故解决问题与实际非常符合,可以得到很圆满的结果。
随机森林
是用随机的方式建立一个森林,森林里面有很多的决策树组成,随机森林的每一棵决策树之间是没有关联的。在得到森林之后,当有一个新的输入样本进入的时候,就让森林中的每一棵决策树分别进行一下判断,看看这个样本应该属于哪一类,然后看看哪一类被选择最多,就预测这个样本为哪一类。
实施例一
本实施例提供了一种基于病人医疗时序画像图的再住院预测方法,如图1所示,包括以下步骤:
步骤1:从医疗数据中分析提取医疗事件,对提取的医疗事件按时间先后序列化;
步骤2:基于序列化的医疗事件,为每位病人构建医疗时序画像图;
步骤3:采用改进的AGM算法,挖掘所有医疗时序画像图的频繁子图;
步骤4:根据所述频繁子图,采用蒙特卡洛模拟方法,为每位病人的所有频繁子图计算对应的重构系数,基于所述重构系数,采用随机森林算法预测病人是否再住院。
所述步骤1,如图2所示,包括:
步骤101:分析病人的数据集,具体的,对住院记录、普通门诊记录、慢性病记录和体检记录进行分析;
步骤102:提取病人的所有医疗事件,包括:诊断、用药和体检及相应的时间,根据事件发生的时间,将每个病人的医疗事件序列化;
步骤103:根据每个人最后一次诊断前一定间隔内的数据是否出现冠心病来给每位病人一个再住院标签。
具体的,对住院记录、普通门诊记录、慢性病记录和体检记录进行分析可知,病人的医疗事件主要有诊断、用药和体检等。假设有一个人的医疗事件集合{sn:n=1,2,...,N},其中N是医疗事件序列的数量。每一个事件序列被表示为sn=((xnl,tnl):l=1,2,...,Ln),其中Ln是序列sn的长度。即,在序列sn中在时间tnl我们能观察到事件xnl
所述步骤2,如图3所示,包括:
步骤201:每个病人医疗事件的唯一化作为病人时序画像图的顶点,如病人的医疗事件集合为{A,B,C,B,D,E,D,A},则病人时序画像图的顶点集合为{A,B,C,D,E};
步骤202:计算邻接矩阵Wn
从节点i到节点j的权重计算公式为:
其中κ(·)是一个非递增函数;
步骤203:根据所述顶点集合和邻接矩阵Wn,为每个病人构建一个时序画像图。
具体地,序列sn的时序图Gn是有向带权图。事件唯一化作为它的节点集合{1,...,M},从节点i到节点j的权重被定义为:
其中κ(·)是一个非递增函数,在sn中事件i和j的越接近,权重越高。
我们使用指数分布构造时序图:
当δ≤△时,如果事件间隔δ很大的话,权重很小。否则当δ超过时间阈值△时,我们忽视事件对之间的权重。
所述步骤3,如图4所示,包括:
步骤301:基于步骤203产生的时序画像图,定出频繁1顶点子图和频繁2顶点子图;
步骤302:设置k的初始值为2,也就是从2顶点子图开始挖掘多顶点频繁子图;
步骤303:判断两个k频繁子图能否合并,若能合并判断合并后图的所有连通k子图是否都为频繁k子图;
步骤304:若合并后图的所有连通k子图都为频繁k子图,把合并后图加入k+1顶点频繁子图候选集合,否则舍弃;
步骤305:判断k+1顶点频繁子图候选集合中每个子图是否频繁,若频繁,加入到k+1顶点频繁子图集合;
步骤306:判断k+1顶点频繁子图集合是否为空,若为空跳出挖掘,不为空k=k+1继续挖掘频繁k+2顶点子图。
所述改进的AGM算法通过对AGM算法的(7)进行修改得到:
输入:图事物数据库G={G1,G2,......,Gn},频繁度阈值f
输出:频繁子图的集合S
(1)S1←频繁1-顶点子图
(2)S2←频繁2-顶点子图
(3)for(k=2;Sk≠Φ;k++){
(4)Ck+1←Φ
(5)for each gi∈Sk do
(6)for each gj∈Sk do{
(7)if(gi,gj的任意k-1个顶点和相应的边完全相同,只有一个顶点不同,且code(gi)<=code(gj))
(8)c←gigj
(9)if(c的所有连通k子图均在Sk中)
(10)Ck+1←Ck+1∪c}
(11)Sk+1←Φ
(12)for each Gi∈G do{
(13)for each c∈Ck+1do
(14)if(c∈Gi)c.freq++
(15)if(c.freq>=f)
(16)Sk+1←Sk+1∪c}}
所述步骤4,如图5所示,包括:
步骤401:使用一定数量的频繁子图作为图基,计算每个病人的频繁子图对应的重构系数;
步骤402:使用蒙特卡洛模拟方法,模拟数万次,计算最优重构系数,构成重构系数向量;
步骤403:基于所述重构系数向量和再住院标签,使用随机森林算法预测病人是否再住院。
所述步骤401重构系数的计算方法如下:
对每一个时序序列sn构建一个时序图Gn,Gn的邻接矩阵为Wn∈RM×M,假设有K个图基Bi∈RM×M(i=1,2,…,K)和对应的K个系数Ani(i=1,2,…,K),构造下面的公式:
其中A∈RN×K是邻接矩阵的重构系数。为了计算重构系数,最小化重构误差:
使用一定数量的频繁子图作为图基,并根据上述公式计算每个病人图基对应的重构系数。
综上所述,本发明在对病人再住院预测的过程中,基于所有的医疗时序画像图进行频繁子图挖掘,然后利用蒙特卡洛模拟方法为每个病人计算相应频繁子图的重构系数,最终利用随机森林算法,把频繁子图的重构系数作为输入预测未来病人是否再住院。
实施例二
基于本发明的第二目的,根据所述再住院预测方法,本实施例提供了一种计算机设备,用于病人的再住院预测,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现以下步骤,包括:
步骤1:从医疗数据中分析提取医疗事件,对提取的医疗事件按时间先后序列化;
步骤2:基于序列化的医疗事件,为每位病人构建医疗时序画像图;
步骤3:采用改进的AGM算法,挖掘所有医疗时序画像图的频繁子图;
步骤4:根据所述频繁子图,采用蒙特卡洛模拟方法,为每位病人的所有频繁子图计算对应的重构系数,基于所述重构系数,采用随机森林算法预测病人是否再住院。
实施例三
基于本发明的第三目的,根据所述再住院预测方法,本实施例提供了一种计算机可读存储介质,其上存储有用于病人的再住院预测的计算机程序,其特征在于,该程序被处理器执行时实现以下步骤:
步骤1:从医疗数据中分析提取医疗事件,对提取的医疗事件按时间先后序列化;
步骤2:基于序列化的医疗事件,为每位病人构建医疗时序画像图;
步骤3:采用改进的AGM算法,挖掘所有医疗时序画像图的频繁子图;
步骤4:根据所述频繁子图,采用蒙特卡洛模拟方法,为每位病人的所有频繁子图计算对应的重构系数,基于所述重构系数,采用随机森林算法预测病人是否再住院。
以上实施例二和实施例三的装置,各步骤与方法实施例一相对应,具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质;还应当被理解为包括任何介质,所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本发明中的任一方法。
实施例四
基于本发明的第四目的,本实施例提供了一种基于病人医疗时序画像图的再住院预测系统,包括:服务器和如实施例三所述的计算机设备,其中服务器存储有病人历史住院记录、普通门诊记录、慢性病记录和体检记录,所述计算机设备运行时从所述服务器调取数据。
本发明首先为每位病人构建一个医疗时序画像图,然后基于医疗时序画像图对每位病人进行再住院预测。精准和个性化的再住院预测,有助于病人提前了解自己的健康状况,减轻和延缓疾病带来的痛苦以及因疾病带来的经济负担;有助于医疗机构合理安排医疗资源,为病人提供更好的医疗服务;有助于医疗保险机构合理设计医疗保险金额,统筹医疗保险基金。
本领域技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算机装置来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何特定的硬件和软件的结合。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (10)

1.一种基于医疗时序画像图的再住院预测方法,其特征在于,包括以下步骤:
步骤1:从医疗数据中分析提取医疗事件,对提取的医疗事件按时间先后序列化;
步骤2:基于序列化的医疗事件,为每位病人构建医疗时序画像图;
步骤3:采用改进的AGM算法,挖掘所有医疗时序画像图的频繁子图;
步骤4:根据所述频繁子图,采用蒙特卡洛模拟方法,为每位病人的所有频繁子图计算对应的重构系数,基于所述重构系数,采用随机森林算法预测病人是否再住院。
2.如权利要求1所述的再住院预测方法,其特征在于,所述步骤1包括:
步骤101:分析病人住院记录、普通门诊记录、慢性病记录和体检记录;
步骤102:提取病人的所有医疗事件,包括:诊断、用药和体检及相应的时间,根据事件发生的时间,将每个病人的医疗事件序列化;
步骤103:根据每个人最后一次诊断前一定间隔内的数据是否出现冠心病来给每位病人一个再住院标签。
3.如权利要求2所述的再住院预测方法,其特征在于,所述步骤102包括:假设一个病人的医疗事件集合为{sn:n=1,2,...,N},其中N是医疗事件序列的数量,每一个事件序列被表示为sn=((xnl,tnl):l=1,2,...,Ln),其中Ln是序列sn的长度,(xn1,tn1)表示在时间tnl能观察到事件xnl
4.如权利要求3所述的再住院预测方法,其特征在于,所述步骤2包括:
步骤201:每个病人医疗事件的唯一化作为病人时序画像图的顶点;
步骤202:计算从顶点之间的权重,得到邻接矩阵;
步骤203:根据所述顶点集合和邻接矩阵,为每个病人构建一个时序画像图。
5.如权利要求4所述的再住院预测方法,其特征在于,所述步骤202中,
从顶点i到顶点j的权重计算公式为:其中κ(·)是一个非递增函数;在sn中事件i和j的越接近,权重越高。
6.如权利要求1所述的再住院预测方法,其特征在于,所述步骤3包括:
步骤301:基于步骤203产生的时序画像图,定出频繁1顶点子图和频繁2顶点子图;
步骤302:设置k的初始值为2,也就是从2顶点子图开始挖掘多顶点频繁子图;
步骤303:判断两个k频繁子图能否合并,若能合并判断合并后图的所有连通k子图是否都为频繁k子图;
步骤304:若合并后图的所有连通k子图都为频繁k子图,把合并后图加入k+1顶点频繁子图候选集合,否则舍弃;
步骤305:判断k+1顶点频繁子图候选集合中每个子图是否频繁,若频繁,加入到k+1顶点频繁子图集合;
步骤306:判断k+1顶点频繁子图集合是否为空,若为空跳出挖掘,不为空k=k+1继续挖掘频繁k+2顶点子图。
7.如权利要求1所述的再住院预测方法,其特征在于,所述步骤4包括:
步骤401:使用一定数量的频繁子图作为图基,计算每个病人的频繁子图对应的重构系数;
步骤402:使用蒙特卡洛模拟方法,模拟数万次,计算最优重构系数,构成重构系数向量;
步骤403:基于所述重构系数向量和再住院标签,使用随机森林算法预测病人是否再住院。
8.一种计算机设备,用于病人的再住院预测,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现以下步骤,包括:
步骤1:从医疗数据中分析提取医疗事件,对提取的医疗事件按时间先后序列化;
步骤2:基于序列化的医疗事件,为每位病人构建医疗时序画像图;
步骤3:采用改进的AGM算法,挖掘所有医疗时序画像图的频繁子图;
步骤4:根据所述频繁子图,采用蒙特卡洛模拟方法,为每位病人的所有频繁子图计算对应的重构系数,基于所述重构系数,采用随机森林算法预测病人是否再住院。
9.一种计算机可读存储介质,其上存储有用于病人的再住院预测的计算机程序,其特征在于,该程序被处理器执行时实现以下步骤:
步骤1:从医疗数据中分析提取医疗事件,对提取的医疗事件按时间先后序列化;
步骤2:基于序列化的医疗事件,为每位病人构建医疗时序画像图;
步骤3:采用改进的AGM算法,挖掘所有医疗时序画像图的频繁子图;
步骤4:根据所述频繁子图,采用蒙特卡洛模拟方法,为每位病人的所有频繁子图计算对应的重构系数,基于所述重构系数,采用随机森林算法预测病人是否再住院。
10.一种基于医疗时序画像图的再住院预测系统,其特征在于,包括:如权利要求8所述的计算机设备和服务器,所述服务器存储有病人历史住院记录、普通门诊记录、慢性病记录和体检记录。
CN201710647309.3A 2017-08-01 2017-08-01 基于时序画像图的再住院预测方法和系统 Active CN107591204B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710647309.3A CN107591204B (zh) 2017-08-01 2017-08-01 基于时序画像图的再住院预测方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710647309.3A CN107591204B (zh) 2017-08-01 2017-08-01 基于时序画像图的再住院预测方法和系统

Publications (2)

Publication Number Publication Date
CN107591204A true CN107591204A (zh) 2018-01-16
CN107591204B CN107591204B (zh) 2019-02-26

Family

ID=61042131

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710647309.3A Active CN107591204B (zh) 2017-08-01 2017-08-01 基于时序画像图的再住院预测方法和系统

Country Status (1)

Country Link
CN (1) CN107591204B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110085323A (zh) * 2019-04-19 2019-08-02 北京工业大学 一种基于电子病历的诊疗路径发现方法
CN110532317A (zh) * 2019-08-26 2019-12-03 北京百度网讯科技有限公司 案件分析数据处理方法、装置、设备和可读存储介质
CN113192627A (zh) * 2021-04-13 2021-07-30 山东大学 一种基于病人与疾病二部图的再入院预测方法及系统
CN113744886A (zh) * 2020-05-27 2021-12-03 中国科学院软件研究所 一种基于中医医案挖掘的中医辨证论治模式挖掘方法及系统
JP2022107835A (ja) * 2018-07-27 2022-07-22 キヤノンメディカルシステムズ株式会社 医用情報管理装置および医用画像診断装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104636631A (zh) * 2015-03-09 2015-05-20 江苏中康软件有限责任公司 一种基于糖尿病系统大数据的糖尿病概率计算方法
CN106169165A (zh) * 2015-05-20 2016-11-30 詹宇 面向诊疗数据的症状层次关联及预测方法
CN106529177A (zh) * 2016-11-12 2017-03-22 杭州电子科技大学 一种基于医疗大数据的患者画像方法及装置
CN106874663A (zh) * 2017-01-26 2017-06-20 中电科软件信息服务有限公司 心脑血管疾病风险预测方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104636631A (zh) * 2015-03-09 2015-05-20 江苏中康软件有限责任公司 一种基于糖尿病系统大数据的糖尿病概率计算方法
CN106169165A (zh) * 2015-05-20 2016-11-30 詹宇 面向诊疗数据的症状层次关联及预测方法
CN106529177A (zh) * 2016-11-12 2017-03-22 杭州电子科技大学 一种基于医疗大数据的患者画像方法及装置
CN106874663A (zh) * 2017-01-26 2017-06-20 中电科软件信息服务有限公司 心脑血管疾病风险预测方法及系统

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022107835A (ja) * 2018-07-27 2022-07-22 キヤノンメディカルシステムズ株式会社 医用情報管理装置および医用画像診断装置
JP7297980B2 (ja) 2018-07-27 2023-06-26 キヤノンメディカルシステムズ株式会社 医用情報管理装置
CN110085323A (zh) * 2019-04-19 2019-08-02 北京工业大学 一种基于电子病历的诊疗路径发现方法
CN110085323B (zh) * 2019-04-19 2021-04-30 北京工业大学 一种基于电子病历的诊疗路径发现方法
CN110532317A (zh) * 2019-08-26 2019-12-03 北京百度网讯科技有限公司 案件分析数据处理方法、装置、设备和可读存储介质
CN110532317B (zh) * 2019-08-26 2022-06-14 北京百度网讯科技有限公司 案件分析数据处理方法、装置、设备和可读存储介质
CN113744886A (zh) * 2020-05-27 2021-12-03 中国科学院软件研究所 一种基于中医医案挖掘的中医辨证论治模式挖掘方法及系统
CN113744886B (zh) * 2020-05-27 2024-03-19 中国科学院软件研究所 一种基于中医医案挖掘的中医辨证论治模式挖掘方法及系统
CN113192627A (zh) * 2021-04-13 2021-07-30 山东大学 一种基于病人与疾病二部图的再入院预测方法及系统

Also Published As

Publication number Publication date
CN107591204B (zh) 2019-02-26

Similar Documents

Publication Publication Date Title
CN107591204B (zh) 基于时序画像图的再住院预测方法和系统
Ambekar et al. Disease risk prediction by using convolutional neural network
Improta et al. Use of the AHP methodology in system dynamics: Modelling and simulation for health technology assessments to determine the correct prosthesis choice for hernia diseases
Lawson et al. Unlocking data sets by calibrating populations of models to data density: A study in atrial electrophysiology
US11152119B2 (en) Care path analysis and management platform
JP7430295B2 (ja) 個体慢性疾患進行リスク可視化評価方法及びシステム
US20130253942A1 (en) Methods and Apparatus for Smart Healthcare Decision Analytics and Support
CN102405473A (zh) 医护点动作医疗系统和方法
WO2016181490A1 (ja) 分析システム及び分析方法
Krutanard et al. Discovering organizational process models of resources in a hospital using Role Hierarchy Miner
JP7300973B2 (ja) 保健医療データ分析システム及び保健医療データ分析方法
Xie et al. Variations on the theme of slacks-based measure of efficiency: convex hull-based algorithms
Patel et al. Predicting Heart Disease Using Machine Learning Algorithms
Kolekar et al. Design of precision medicine web-service platform towards health care digital twin
Lu et al. Prediction of fractional flow reserve with enhanced ant lion optimized support vector machine
Mesgarpour et al. A review of dynamic bayesian network techniques with applications in healthcare risk modelling
Bolte et al. BayesSPsurv: An R Package to Estimate Bayesian (Spatial) Split-Population Survival Models
KR20200075088A (ko) 순환 신경망과 가우시안 프로세스를 이용한 복합 모델 장치 및 그 동작 방법
Singarathnam et al. Machine learning-based predictive models for cardiovascular risk assessment in data analysis, model development, and clinical implications
Nagappan et al. Heart Disease Prediction Using Data Mining Technique
Molero-Castillo et al. User-centered data mining tool for survival-mortality classification of breast cancer in mexican-origin women
Ben‐Assuli et al. Implementing a Monte‐Carlo simulation on admission decisions
Waris et al. Prediction of heart conditions by consensus K-nearest neighbor algorithm and convolution neural network
Kumar 9 Machinefor Learning
Bolte et al. Bayesian Spatial Split-Population Models for the Social Sciences

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant