CN110164520A - 时空大数据关联的慢病管理装置 - Google Patents

时空大数据关联的慢病管理装置 Download PDF

Info

Publication number
CN110164520A
CN110164520A CN201910438517.1A CN201910438517A CN110164520A CN 110164520 A CN110164520 A CN 110164520A CN 201910438517 A CN201910438517 A CN 201910438517A CN 110164520 A CN110164520 A CN 110164520A
Authority
CN
China
Prior art keywords
disease
information
item set
frequent item
individual activity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201910438517.1A
Other languages
English (en)
Inventor
孙雁飞
许会芬
亓晋
何高峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Post and Telecommunication University
Original Assignee
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Post and Telecommunication University filed Critical Nanjing Post and Telecommunication University
Priority to CN201910438517.1A priority Critical patent/CN110164520A/zh
Publication of CN110164520A publication Critical patent/CN110164520A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

一种时空大数据关联的慢病管理装置,包括:获取单元,适于获取患者的慢病相关信息和个人生活习惯信息;预处理单元,适于对所述慢病相关信息和个人生活习惯信息进行预处理;训练数据生成单元,适于基于预处理后的慢病相关信息和个人生活习惯信息,生成训练数据;聚类单元,适于按照时间和空间对生成的训练数据进行聚类,得到对应的多个聚类;关联分析单元,适于对所述多个聚类进行关联分析,得到个人活动与疾病之间的频繁项集;计算单元,适于基于个人活动与疾病之间的频繁项集,计算得到个人活动与疾病之间的强规则结果集;输出显示单元,适于将所述强规则结果集进行可视化并输出显示。上述的方案,可以提高慢病管理的准确性和效率。

Description

时空大数据关联的慢病管理装置
技术领域
本发明属于医疗技术领域,特别是涉及一种时空大数据关联的慢病管理装置。
背景技术
在大数据时代每个行业每天都产生海量的数据,医疗行业也不例外。随着强大的数据存储、计算平台及移动互联网的发展,现在的趋势是医疗数据的大量爆发及快速的电子数字化,驱动了医疗大数据在临床科研、健康慢病管理、公共卫生等核心领域广泛应用,使得医疗领域成为大数据领域的重要研究部分。利用大数据信息中丰富的资源挖掘出数据背后的意义,对于医疗行业有着不可估量的作用。例如,在诊断信息中存在信息和信息之间的关联关系,通过数据挖掘中的关联分析挖掘数据中隐藏的大量关联规则,对辅助医生做慢病管理方案具有重大意义。关联规则——是指根据数据库中数据项出现在记录中的频繁程度,得出的关于数据项的推导规则。关联规则最初提出的动机是针对购物篮分析(MarketBasket Analysis)问题提出的,通过发现顾客放入“购物篮”中的不同商品之间的关联,分析顾客的购物习惯,这种关联的发现可以帮助零售商了解哪些商品频繁的被顾客同时购买,从而帮助他们开发更好的营销策略。同时关联规则也可以运用到慢病管理,帮助医生做出更好的慢病管理方案。一般的关联规则有两步,第一步根据最小支持度在全部数据中找出频繁项集,第二步在频繁项集中根据最小置信度找到强关联规则。
数据显示,目前我国的慢性病患者已超过3亿人,慢性病致死人数已占到我国因病死亡人数的85%,导致的疾病负担已占到总疾病负担的70%。据预测,到2030年,全球慢病相关的总死亡人数将上升到世界总死亡人数的70%。目前中国65周岁以上老人人数约为1.4亿人,占总人口10.47%,老龄化比例逐年提高,潜在慢病人群基数势必继续扩大,社会将面临日益严重的慢病挑战。同时,以糖尿病为例的慢性病已呈现年轻化发展趋势,严重影响到居民的生活质量和身体健康,慢病管理刻不容缓。
目前,国内外大数据在慢病管理的研究主要集中在临床诊断信息中基本信息和患病信息的挖掘,利用基本信息和患病信息来辅助慢病管理,这就影响了慢病管理的准确性和效率。
发明内容
本发明解决的技术问题是如何提高慢病管理的准确性和效率。
为了达到上述目的,本发明提供一种时空大数据关联的慢病管理装置,所述装置包括:
获取单元,适于获取患者的慢病相关信息和个人生活习惯信息;
预处理单元,适于对获取的患者的慢病相关信息和个人生活习惯信息进行预处理;
训练数据生成单元,适于基于预处理后的患者的慢病相关信息和个人生活习惯信息,生成对应的训练数据;
聚类单元,适于按照时间和空间对生成的训练数据进行聚类分析,得到对应的多个聚类;
关联分析单元,适于对所得到的多个聚类进行关联分析,得到个人活动与疾病之间的频繁项集;
计算单元,适于基于个人活动与疾病之间的频繁项集,计算得到个人活动与疾病之间的强规则结果集;
输出显示单元,适于将所述个人活动与疾病之间的强规则结果集进行可视化并输出显示。
可选地,所述输出显示单元,还适于向用户输出显示对应的慢病管理方案。
可选地,所述预处理单元,适于对获取的患者的慢病相关信息和个人生活习惯信息进行预处理,包括以下至少一项:
对所获取的患者的慢病相关信息和个人生活信息进行准确性审核;
将非文字形式的患者的慢病相关信息和个人生活信息转换为文字形式的患者的慢病相关信息和个人生活信息;
将所获取的患者的慢病相关信息和个人生活信息中的数值进行连续值的离散化处理和缺失值补齐处理。
可选地,所述基于预处理后的患者的慢病相关信息和个人生活习惯信息,生成对应的训练数据,包括:
从所述预处理后的患者的慢病相关信息和个人生活习惯信息中选取预设的慢病相关特征数据;
将所选取的慢病相关特征数据进行特征转换,得到对应的训练数据。
可选地,关联分析单元,适于对每个聚类下的训练数据进行关联分析,得到疾病1-疾病2的频繁项集;基于得到的疾病1-疾病2的频繁项集,得到个人活动与疾病1-疾病2之间的频繁项集;对所述个人活动与疾病1-疾病2之间的频繁项集进行筛选,得到对应的个人活动与疾病1-疾病2之间的最终频繁项集。
可选地,所述关联分析单元,适于计算每个聚类下的数据中每种疾病的出现概率;当疾病的出现概率大于预设的第一支持度阈值时,将对应的训练数据添加到对应的常见疾病候选集;计算所述常见疾病候选集中每两种疾病的第二支持度;当确定计算得到的第二支持度大于预设的第二支持度阈值时,将对应的训练数据添加到对应的疾病1-疾病2之间的频繁项集中。
可选地,所述关联分析单元,适于计算所述两种疾病之间的频繁项集中每两种疾病与个人活动之间的第三支持度;当确定计算得到的第三支持度大于预设的第三支持度阈值时,将对应的训练数据添加到对应的个人活动与疾病1-疾病2之间的频繁项集中;个人活动与疾病1-疾病2之间的频繁项集包括个人活动到疾病1-疾病2的频繁项集和疾病1-疾病2到个人活动的频繁项集。
可选地,所述计算单元,适于计算所述个人活动与疾病之间的强规则结果集中疾病1-疾病2-个人活动的置信度;当计算得到的置信度大于预设的置信度阈值时,将对应的训练数据添加到所述个人活动与疾病之间的强规则结果集中。
与现有技术相比,本发明的有益效果为:
上述的方案,通过对获取的患者的慢病相关信息和个人生活习惯信息进行预处理;基于预处理后的患者的慢病相关信息和个人生活习惯信息,生成对应的训练数据;按照时间和空间对生成的训练数据进行聚类分析,得到对应的多个聚类;对所得到的多个聚类进行关联分析,得到个人活动与疾病之间的频繁项集;基于个人活动与疾病之间的频繁项集,计算得到个人活动与疾病之间的强规则结果集;由于按照时间和空间对生成的训练数据进行聚类分析,可以显著减少数据量,提高慢病管理的效率;同时,得到的个人活动与疾病之间的强规则结果集体现了个人活动与疾病之间的关系,可以对给予医生和患者提供准确的慢病管理建议。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的一种时空大数据关联的慢病管理方法的流程示意图;
图2是本发明实施例的一种时空大数据关联的慢病管理装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。本发明实施例中有关方向性指示(诸如上、下、左、右、前、后等)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。
如背景技术所述,现有技术中在慢病管理的研究主要集中在临床诊断信息中基本信息和患病信息的挖掘,利用基本信息和患病信息来辅助慢病管理,这就影响了慢病管理的准确性和效率。
本发明的技术方案通过对获取的患者的慢病相关信息和个人生活习惯信息进行预处理;基于预处理后的患者的慢病相关信息和个人生活习惯信息,生成对应的训练数据;按照时间和空间对生成的训练数据进行聚类分析,得到对应的多个聚类;对所得到的多个聚类进行关联分析,得到个人活动与疾病之间的频繁项集;基于个人活动与疾病之间的频繁项集,计算得到个人活动与疾病之间的强规则结果集;由于按照时间和空间对生成的训练数据进行聚类分析,可以显著减少数据量,提高慢病管理的效率;同时,得到的个人活动与疾病之间的强规则结果集体现了个人活动与疾病之间的关系,可以对给予医生和患者提供准确的慢病管理建议。
为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
图1是本发明实施例的一种时空大数据关联的慢病管理方法的流程示意图。参见图1,一种时空大数据关联的慢病管理方法,具体可以包括如下的步骤:
步骤S101:获取患者的慢病相关信息和个人生活习惯信息。
在具体实施中,可以根据实际的需要获取患者的慢病相关信息和个人生活习惯信息。其中,通过可穿戴设备、电子病历数据、手写病历数据、个人活动信息问卷形式获取患者的慢病相关信息和个人生活习惯信息,为预测提供数据来源。
例如,通过可穿戴设备获取数据,其主要来自于病人佩戴的终端设备数据,如智能血糖、血压、血脂仪、可穿戴动态心电记录仪、智能手表心率仪,主要包括慢病相关的信息,包括血糖、血脂、血压和心率等;通过电子病历获取慢病类数据,主要包括纸张病历的所有信息,是用电子设备,如计算机、健康卡等,保存、管理、传输和重现的数字化的病人的医疗记录,可适当取代手写纸张病历;通过手写病历获取慢病类数据,是由于现在医院数据并不互通互联,存在信息壁垒,手写病历依然是临场就诊信息记录的重要形式,且在区域医疗信息尚未实现共享的前提下,病历本信息内容是了解患者在不同医院就诊情况的重要依据;个人活动信息的获取可以通过问卷调查形式、电话随访、视频回访等获取个人基本信息、行为信息、活动信息。包括生活作息、生活习惯、饮食习惯等。
步骤S102:对获取的患者的慢病相关信息和个人生活习惯信息进行预处理。
在具体实施中,获取患者的慢病相关信息和个人生活习惯信息可能是不完整的、含噪声、不一致的、高纬度的、重复的,这些数据会影响预测结果,不可以直接使用。因此,在对获取的患者的慢病相关信息和个人生活习惯信息进行预处理,以预处理后的数据可以符合模型的要求,得到高质量的数据,提高数据的预测准确率。
在具体实施中,在对获取的患者的慢病相关信息和个人生活习惯信息进行预处理时,可以包括以下三项中至少一项:
(1)对所获取的患者的慢病相关信息和个人生活信息进行准确性审核。慢病数据来源广泛,其中还包括数据的不同方式的处理,这将导致数据正确性下降,同时可能出现重复多余的数据,需要筛选清楚,将错误的数据纠正删除。比如,一些明显不正确的数据,如年龄200等,这类数据可以直接删除,或者电话核实纠正。
(2)将非文字形式的患者的慢病相关信息和个人生活信息转换为文字形式的患者的慢病相关信息和个人生活信息。非文字形式的患者的慢病相关信息和个人生活信息包括图片、视频、语音等形式的患者的慢病相关信息和个人生活信息转化为文字。例如,心肺疾病中的一些影像、手写病历转化成图片再提取图片中的信息等。再如,为了适应模型,保证模型的统一性,将图片转成文字或数字,便于提取特征和关联信息。另外,对于一些随访记录,如包括视频、电话随访等信息,需要转成文字数字可读性的信息,以便于模型的训练和信息的提取。
(3)将所获取的患者的慢病相关信息和个人生活信息中的数值进行连续值的离散化处理和缺失值补齐处理。主要包括对于图片、视频、语音或者电子病历本身的数值类数据进行数据处理,包括连续值的离散化、数值数据缺失值处理等
步骤S103:基于预处理后的患者的慢病相关信息和个人生活习惯信息,生成对应的训练数据。
在具体实施中,基于预处理后的患者的慢病相关信息和个人生活习惯信息,生成对应的训练数据,即是将原始数据转变为模型的训练数据的过程,目的是获取更好的训练数据特征,使得模型逼近数据的上限。此过程具体可以包括:
首先,从所述预处理后的患者的慢病相关信息和个人生活习惯信息中选取预设的慢病相关特征数据,即进行特征选择,包括剔除不相关或冗余特征的,减少有效特征的个数,以减少模型训练的时间。同时,需要确定病人的姓名、性别、年龄、职业、生活作息、饮食习惯、疾病名称、病症描述、就诊时间、患病地点等相关特征。
接着,将所选取的慢病相关特征数据进行特征转换,得到对应的训练数据。先进行特征组合,换言之,也即是将原始的特征的部分转换成具有和慢病相关的物理意义和现实意义的特征。例如,该系统是在时空大数据下,需要将患病的地点转化成经度和维度,并将经度和维度组合形成一个新的特征。然后,对特征值再处理:对提取的新组合的特征值进行再数据处理,使其满足模型要求。例如,将提取的新组合的特征值归一化处理等。
步骤S104:按照时间和空间对生成的训练数据进行聚类分析,得到对应的多个聚类。
在具体实施中,按照时间和空间对生成的训练数据进行聚类分析,也即是将规整的数据按照时间和空间聚类。其中,时间和空间分别表示病人的年龄和患病地点。
步骤S105:对所得到的多个聚类进行关联分析,得到个人活动与疾病之间的频繁项集。
在具体实施中,对所得到的多个聚类进行关联分析,在每一个聚类下,对规整的数据进行关联分析,挖掘出个人活动与疾病之间的频繁项集。此过程包括如下步骤:
首先,对每个聚类下的训练数据进行关联分析,得到疾病1-疾病2的频繁项集。具体而言,对于多得到的多个聚类中的每个聚类,遍历每个聚类中的所有疾病(即本文中的慢病)种类,统计每种疾病的频度Mx和数据总数M,计算每种疾病出现的概率P,即:
当计算得到每种疾病出现的概率是,通过将每个聚类下的每种疾病出现与的概率与预设的第一支持度阈值进行比较,从而筛选出常见疾病候选集。换言之,当确定某种疾病的出现概率大于所述第一支持度阈值时,将对应的训练数据保留;否则,将对应的训练数据删除,从而筛选出常见疾病候选集。
接着,对于筛选出的常见疾病候选集,采用FP-Growth算法计算出包含两种疾病的频繁项集。具体而言,首先统计前件疾病x1到后件疾病x2的频度Mx1→x2,并统计在候选集H1中所有疾病x1到疾病x2的总数Mx1x2,并计算第二支持度:
其中,当计算得到的两种疾病的第二支持度大于预设的第二支持度阈值时,将对应的训练数据进行保留,从而筛选出符合条件的两种疾病之间的频繁项集,即得到疾病1-疾病2的频繁项集;
之后,基于得到的疾病1-疾病2的频繁项集,得到个人活动与疾病1-疾病2之间的频繁项集。具体地,对于筛选出符合条件的两种疾病之间的频繁项集,再利用FG-Growth算法计算出包括前件疾病x1到后件疾病x2到个人活动或个人活动到前件疾病x1到后件疾病x2频繁项集,也就是个人活动和疾病之间不存在先后顺序的结果集。在本发明一实施例中,统计前件疾病x1到后件疾病x2到个人活动或个人活动到前件疾病x1到后件疾病x2的频度M(x1→x2)∩y,统计所有包含从疾病x1和疾病x2和个人活动y的总数Mx1x2y,计算第三支持度:
当计算得到的第三支持度时,通过将计算得到的第三支持度与预设的第三支持度阈值进行比较,并保留大于第三支持度的疾病对应的训练数,从而筛选出最后的频繁项集,即个人活动和疾病之间不存在先后顺序的结果集,也即得到对应的个人活动与疾病1-疾病2之间的最终频繁项集。
步骤S106:基于个人活动与疾病之间的频繁项集,计算得到个人活动与疾病之间的强规则结果集。
在具体实施中,当对每个聚类执行上述的关联分析操作完成时,得到每个聚类下的多个个人活动和疾病之间不存在先后顺序的结果集。最后,再根据每个聚类下的多个个人活动和疾病之间不存在先后顺序的结果集获得特征之间的关联规则,并根据关联规则建立“疾病1-疾病2-个人活动”结果集合H,即:
首先,计算疾病1-疾病2-个人活动y的置信度:
其中,C(x1→x2→y)表示疾病1-疾病2-个人活动y的置信度,N表示出现的频数,则N((x1→x2)∩y)表示同时出现疾病1到疾病2、个人活动y的频数,N(x1→x2)表示出现疾病1到疾病2的频数
之后,将计算得到的置信度与预设的置信度阈值进行比较,当确定计算得到的置信度大于预设的置信度阈值时,则为强相关规则并保留此规则到强规则结果集H中,从而得到“疾病1-疾病2-个人活动”强规则结果集合。
步骤S107:将所述个人活动与疾病之间的强规则结果集进行可视化并输出显示。
在具体实施中,当得到所述个人活动与疾病之间的强规则结果集合时,将所述个人活动与疾病之间的强规则结果集进行可视化并输出显示,将其与患者的临床信息相结合,可以以真正有效的方式缓解临床医生的活动,为患者提供建议并给与患者提醒。例如,通过所述个人活动与疾病之间的强规则结果集合给医生知识启发,以确定令人担忧的可能的情况。
在本发明一实施例中,所述方法还可以包括:
步骤S108:向用户输出显示对应的慢病管理方案。
在具体实施中,当得到所述个人活动与疾病之间的强规则结果集合,且慢病病人发生相关急性事件时,提醒病人及时就医并给出及时的处理方案和措施,后者根据结果集并结合患者的信息,为治疗计划的可能变化提供建议等。
上述对本发明实施例中的时空大数据关联的慢病管理方法进行详细的描述,下面将对上述的方法对应的装置进行介绍。
图2示出了本发明实施例中的一种时空大数据关联的慢病管理装置的结构示意图。参见图2,所述时空大数据关联的慢病管理装置20,可以包括:
获取单元201,适于获取患者的慢病相关信息和个人生活习惯信息;
预处理单元202,适于对获取的患者的慢病相关信息和个人生活习惯信息进行预处理;在具体实施中,所述预处理单元202,适于对获取的患者的慢病相关信息和个人生活习惯信息进行预处理,包括以下至少一项:对所获取的患者的慢病相关信息和个人生活信息进行准确性审核;将非文字形式的患者的慢病相关信息和个人生活信息转换为文字形式的患者的慢病相关信息和个人生活信息;将所获取的患者的慢病相关信息和个人生活信息中的数值进行连续值的离散化处理和缺失值补齐处理。
训练数据生成单元203,适于基于预处理后的患者的慢病相关信息和个人生活习惯信息,生成对应的训练数据;在本发明一实施例中,所述训练数据生成单元203,适于从所述预处理后的患者的慢病相关信息和个人生活习惯信息中选取预设的慢病相关特征数据;将所选取的慢病相关特征数据进行特征转换,得到对应的训练数据。
聚类单元204,适于按照时间和空间对生成的训练数据进行聚类分析,得到对应的多个聚类;
关联分析单元205,适于对所得到的多个聚类进行关联分析,得到个人活动与疾病之间的频繁项集;在本发明一实施例中,关联分析单元205,适于对每个聚类下的训练数据进行关联分析,得到疾病1-疾病2的频繁项集;基于得到的疾病1-疾病2的频繁项集,得到个人活动与疾病1-疾病2之间的频繁项集;对所述个人活动与疾病1-疾病2之间的频繁项集进行筛选,得到对应的个人活动与疾病1-疾病2之间的最终频繁项集。在本发明另一实施例中,所述关联分析单元205,适于计算每个聚类下的数据中每种疾病的出现概率;当疾病的出现概率大于预设的第一支持度阈值时,将对应的训练数据添加到对应的常见疾病候选集;计算所述常见疾病候选集中每两种疾病的第二支持度;当确定计算得到的第二支持度大于预设的第二支持度阈值时,将对应的训练数据添加到对应的疾病1-疾病2之间的频繁项集中。在本发明又一实施例中,所述关联分析单元205,适于计算所述两种疾病之间的频繁项集中每两种疾病与个人活动之间的第三支持度;当确定计算得到的第三支持度大于预设的第三支持度阈值时,将对应的训练数据添加到对应的个人活动与疾病1-疾病2之间的频繁项集中;个人活动与疾病1-疾病2之间的频繁项集包括个人活动到疾病1-疾病2的频繁项集和疾病1-疾病2到个人活动的频繁项集。
计算单元206,适于基于个人活动与疾病之间的频繁项集,计算得到个人活动与疾病之间的强规则结果集;在本发明一实施例中,所述计算单元206,适于计算所述个人活动与疾病之间的强规则结果集中疾病1-疾病2-个人活动的置信度;当计算得到的置信度大于预设的置信度阈值时,将对应的训练数据添加到所述个人活动与疾病之间的强规则结果集中。
输出显示单元207,适于将所述个人活动与疾病之间的强规则结果集进行可视化并输出显示。在本发明一实施例中,所述输出显示单元207,还适于向用户输出显示对应的慢病管理方案。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令运行时执行所述的时空大数据关联的慢病管理方法的步骤。其中,所述的时空大数据关联的慢病管理方法请参见前述部分的介绍,不再赘述。
本发明实施例还提供了一种终端,包括存储器和处理器,所述存储器上储存有能够在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行所述的时空大数据关联的慢病管理方法的步骤。其中,所述的时空大数据关联的慢病管理方法请参见前述部分的介绍,不再赘述。
采用本发明实施例中的上述方案,通过对获取的患者的慢病相关信息和个人生活习惯信息进行预处理;基于预处理后的患者的慢病相关信息和个人生活习惯信息,生成对应的训练数据;按照时间和空间对生成的训练数据进行聚类分析,得到对应的多个聚类;对所得到的多个聚类进行关联分析,得到个人活动与疾病之间的频繁项集;基于个人活动与疾病之间的频繁项集,计算得到个人活动与疾病之间的强规则结果集;由于按照时间和空间对生成的训练数据进行聚类分析,可以显著减少数据量,提高数据处理的速度和效率;同时,得到的个人活动与疾病之间的强规则结果集体现了个人活动与疾病之间的关系,可以对给予医生和患者提供准确的慢病管理建议。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,本发明要求保护范围由所附的权利要求书、说明书及其等效物界定。

Claims (8)

1.一种时空大数据关联的慢病管理装置,其特征在于,包括:
获取单元,适于获取患者的慢病相关信息和个人生活习惯信息;
预处理单元,适于对获取的患者的慢病相关信息和个人生活习惯信息进行预处理;
训练数据生成单元,适于基于预处理后的患者的慢病相关信息和个人生活习惯信息,生成对应的训练数据;
聚类单元,适于按照时间和空间对生成的训练数据进行聚类分析,得到对应的多个聚类;
关联分析单元,适于对所得到的多个聚类进行关联分析,得到个人活动与疾病之间的频繁项集;
计算单元,适于基于个人活动与疾病之间的频繁项集,计算得到个人活动与疾病之间的强规则结果集;
输出显示单元,适于将所述个人活动与疾病之间的强规则结果集进行可视化并输出显示。
2.根据权利要求1所述的时空大数据关联的慢病管理装置,其特征在于,所述输出显示单元,还适于向用户输出显示对应的慢病管理方案。
3.根据权利要求1所述的时空大数据关联的慢病管理装置,其特征在于,所预处理单元,适于对获取的患者的慢病相关信息和个人生活习惯信息进行预处理,包括以下至少一项:
对所获取的患者的慢病相关信息和个人生活信息进行准确性审核;
将非文字形式的患者的慢病相关信息和个人生活信息转换为文字形式的患者的慢病相关信息和个人生活信息;
将所获取的患者的慢病相关信息和个人生活信息中的数值进行连续值的离散化处理和缺失值补齐处理。
4.根据权利要求1所述的时空大数据关联的慢病管理装置,其特征在于,所述训练数据生成单元,适于从所述预处理后的患者的慢病相关信息和个人生活习惯信息中选取预设的慢病相关特征数据;将所选取的慢病相关特征数据进行特征转换,得到对应的训练数据。
5.根据权利要求1所述的时空大数据关联的慢病管理装置,其特征在于,所述关联分析单元,适于对每个聚类下的训练数据进行关联分析,得到疾病1-疾病2的频繁项集;基于得到的疾病1-疾病2的频繁项集,得到个人活动与疾病1-疾病2之间的频繁项集;对所述个人活动与疾病1-疾病2之间的频繁项集进行筛选,得到对应的个人活动与疾病1-疾病2之间的最终频繁项集。
6.根据权利要求5所述的时空大数据关联的慢病管理装置,其特征在于,所述关联分析单元,适于计算每个聚类下的数据中每种疾病的出现概率;当疾病的出现概率大于预设的第一支持度阈值时,将对应的训练数据添加到对应的常见疾病候选集;计算所述常见疾病候选集中每两种疾病的第二支持度;当确定计算得到的第二支持度大于预设的第二支持度阈值时,将对应的训练数据添加到对应的疾病1-疾病2之间的频繁项集中。
7.根据权利要求5或6所述的时空大数据关联的慢病管理装置,其特征在于,所述关联分析单元,适于计算所述疾病1-疾病2之间的频繁项集中两种疾病之间的频繁项集中每两种疾病与个人活动之间的第三支持度;当确定计算得到的第三支持度大于预设的第三支持度阈值时,将对应的训练数据添加到对应的个人活动与疾病1-疾病2之间的频繁项集中;个人活动与疾病1-疾病2之间的频繁项集包括个人活动到疾病1-疾病2的频繁项集和疾病1-疾病2到个人活动的频繁项集。
8.根据权利要求1所述的时空大数据关联的慢病管理装置,其特征在于,所述计算单元,适于计算所述个人活动与疾病之间的强规则结果集中疾病1-疾病2-个人活动的置信度;当计算得到的置信度大于预设的置信度阈值时,将对应的训练数据添加到所述个人活动与疾病之间的强规则结果集中。
CN201910438517.1A 2019-05-24 2019-05-24 时空大数据关联的慢病管理装置 Withdrawn CN110164520A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910438517.1A CN110164520A (zh) 2019-05-24 2019-05-24 时空大数据关联的慢病管理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910438517.1A CN110164520A (zh) 2019-05-24 2019-05-24 时空大数据关联的慢病管理装置

Publications (1)

Publication Number Publication Date
CN110164520A true CN110164520A (zh) 2019-08-23

Family

ID=67632650

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910438517.1A Withdrawn CN110164520A (zh) 2019-05-24 2019-05-24 时空大数据关联的慢病管理装置

Country Status (1)

Country Link
CN (1) CN110164520A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111785372A (zh) * 2020-05-14 2020-10-16 浙江知盛科技集团有限公司 基于关联规则的协同过滤疾病预测系统及其电子设备
CN112037876A (zh) * 2020-09-16 2020-12-04 陈俊霖 慢性病病程阶段分析系统、装置和存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111785372A (zh) * 2020-05-14 2020-10-16 浙江知盛科技集团有限公司 基于关联规则的协同过滤疾病预测系统及其电子设备
CN112037876A (zh) * 2020-09-16 2020-12-04 陈俊霖 慢性病病程阶段分析系统、装置和存储介质

Similar Documents

Publication Publication Date Title
Johnson et al. Machine learning and decision support in critical care
CN108778097A (zh) 用于评估心力衰竭的装置和方法
CN103493054A (zh) 用于预测心血管病发展的医疗信息技术系统
CN110176283A (zh) 时空大数据关联的慢病管理方法、存储介质和终端
CN111145909B (zh) 诊疗数据处理方法与装置、存储介质、电子设备
WO2021158796A1 (en) Forecasting and explaining user health metrics
CN112786131B (zh) 识别就诊信息的方法及装置、电子设备和存储介质
CN102405473A (zh) 医护点动作医疗系统和方法
CN103678534A (zh) 结合粗糙集和模糊推理的生理信息与健康相关性获取方法
Hsu A decision-making mechanism for assessing risk factor significance in cardiovascular diseases
LK et al. COVID-19 outbreak based coronary heart diseases (CHD) prediction using SVM and risk factor validation
CN110164520A (zh) 时空大数据关联的慢病管理装置
Manna et al. Diabetes prediction model using cloud analytics
CN114420279A (zh) 一种医疗资源推荐方法、装置、设备及存储介质
EP4121972A1 (en) System and methods utilizing artificial intelligence algorithms to analyze wearable activity tracker data
US20230290502A1 (en) Machine learning framework for detection of chronic health conditions
US20210407667A1 (en) Systems and methods for prediction of unnecessary emergency room visits
Tolentino et al. CAREdio: Health screening and heart disease prediction system for rural communities in the Philippines
Chai et al. Edge Computing with Fog-cloud for Heart Data Processing using Particle Swarm Optimized Deep Learning Technique
Uddin et al. A Voice assistive mobile application tool to detect cardiovascular disease using machine learning approach
Wang et al. Deep‐learning‐based renal artery stenosis diagnosis via multimodal fusion
Sharma et al. A Novel Heart Disease Prediction System Using XGBoost Classifier Coupled With ADASYN SMOTE
Jahangiri et al. An Improved Naïve Bayes Approach to Diagnose Cardiovascular Disease: A Case Study
US20220344018A1 (en) Machine Learning Derived Multimorbidity Risk Scores for Generalizable Patient Populations
Awan Machine Learning with Applications to Heart Failure Data Analysis and Processing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20190823

WW01 Invention patent application withdrawn after publication