CN117476217B - 一种慢性心脏病病情发展趋势预测系统 - Google Patents
一种慢性心脏病病情发展趋势预测系统 Download PDFInfo
- Publication number
- CN117476217B CN117476217B CN202311798431.2A CN202311798431A CN117476217B CN 117476217 B CN117476217 B CN 117476217B CN 202311798431 A CN202311798431 A CN 202311798431A CN 117476217 B CN117476217 B CN 117476217B
- Authority
- CN
- China
- Prior art keywords
- patient
- data
- disease
- training
- chronic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000001684 chronic effect Effects 0.000 title claims abstract description 62
- 208000019622 heart disease Diseases 0.000 title claims abstract description 58
- 238000012549 training Methods 0.000 claims abstract description 65
- 201000010099 disease Diseases 0.000 claims abstract description 35
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 35
- 238000011161 development Methods 0.000 claims abstract description 21
- 238000000034 method Methods 0.000 claims abstract description 21
- 238000012216 screening Methods 0.000 claims abstract description 20
- 238000013145 classification model Methods 0.000 claims abstract description 12
- 238000010276 construction Methods 0.000 claims abstract description 10
- 208000020446 Cardiac disease Diseases 0.000 claims abstract description 8
- 238000000605 extraction Methods 0.000 claims abstract description 7
- 208000017667 Chronic Disease Diseases 0.000 claims description 30
- 239000003814 drug Substances 0.000 claims description 30
- 238000003062 neural network model Methods 0.000 claims description 19
- 230000000694 effects Effects 0.000 claims description 15
- 239000000523 sample Substances 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 10
- 208000010125 myocardial infarction Diseases 0.000 claims description 9
- 238000012360 testing method Methods 0.000 claims description 9
- 230000000474 nursing effect Effects 0.000 claims description 8
- 230000002107 myocardial effect Effects 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 7
- 230000007246 mechanism Effects 0.000 claims description 6
- 238000011176 pooling Methods 0.000 claims description 6
- 238000001356 surgical procedure Methods 0.000 claims description 6
- 239000008280 blood Substances 0.000 claims description 5
- 210000004369 blood Anatomy 0.000 claims description 5
- 230000036772 blood pressure Effects 0.000 claims description 5
- 230000000747 cardiac effect Effects 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 4
- 230000009471 action Effects 0.000 claims description 3
- 230000002776 aggregation Effects 0.000 claims description 3
- 238000004220 aggregation Methods 0.000 claims description 3
- 238000004140 cleaning Methods 0.000 claims description 3
- 239000013610 patient sample Substances 0.000 claims description 3
- 230000005750 disease progression Effects 0.000 claims 3
- 239000000654 additive Substances 0.000 claims 1
- 230000000996 additive effect Effects 0.000 claims 1
- 230000000875 corresponding effect Effects 0.000 description 15
- 238000001514 detection method Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000008103 glucose Substances 0.000 description 3
- 206010020772 Hypertension Diseases 0.000 description 2
- 230000001154 acute effect Effects 0.000 description 2
- 206010012601 diabetes mellitus Diseases 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 206010007558 Cardiac failure chronic Diseases 0.000 description 1
- 208000031229 Cardiomyopathies Diseases 0.000 description 1
- 206010019280 Heart failures Diseases 0.000 description 1
- 206010028851 Necrosis Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000003143 atherosclerotic effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 208000018578 heart valve disease Diseases 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 231100000862 numbness Toxicity 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000011477 surgical intervention Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000002759 z-score normalization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/098—Distributed learning, e.g. federated learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Public Health (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明提出一种慢性心脏病病情发展趋势预测系统,涉及智慧医疗技术领域。包括数据库构建与特征提取模块,获取病人关联特征;筛选模块,对云端数据库中的数据进行筛选,进而对医疗服务机构进行筛选;训练模块,基于联邦学习得到训练好的第一预测模型;预测模块,利用第一预测模型对待预测患者病情发展趋势进行初步预测,之后基于预训练的第二分类模型对患者进行分类,判断待预测患者的慢性心脏病发展趋势是否稳定。本发明实现对待预测的慢性心脏病患者个性化定制模型的训练,得到的模型能够更好的匹配某一类型的患者,预测精度高。
Description
技术领域
本发明属于智慧医疗技术领域,尤其涉及一种慢性心脏病病情发展趋势预测系统。
背景技术
慢性心脏病包括冠状动脉粥样硬化性心脏病、慢性心力衰竭、心脏瓣膜病、心肌疾病等,上述疾病的患者往往需要长期服药治疗,进行定期的身体检查,必要时进行手术介入治疗。慢性心脏病的急性发作存在一个黄金救援时间,在黄金救援时间之内,如果患者没有得到较好的救治,将可能导致心肌细胞坏死或心衰竭等情况发生,危及患者生命。因此,对慢性心脏病病发前的预警显得尤为重要。
慢性心脏病是否会急性病发,需要长时间、不间断的观察。随着医疗技术的不断发展,市场上出现了各种生理指标检测装置,通过相关的可穿戴式生理指标检测装置或检测仪器可以检测相关生理指标(例如心率等)。然而,现有的生理指标检测装置在得到患者相关生理指标的检测值后,往往将相关生理指标的当前检测值与正常参考值进行横向对比,并告知患者其相关生理指标的值是否在正常范围内。而对于慢性心脏病患者而言,其相关生理指标的值通常长期不在正常范围内,因此,仅告知患者其相关生理指标的值是否在正常范围内容易导致患者进入麻木状态,无法有效刺激患者对其所患疾病的病情引起重视。
为了使患者对病情保持足够的重视、同时实现预警的准确性,现有技术中存在利用机器学习对患者进行慢性心脏病病情发展趋势进行预测的方法,为了进一步提高预测精度,这些方法一般需要采集患者的实时心电数据,对实时心电数据提取特征去训练模型并进行预测。然而,这种方式仍然存在以下问题:
(1)基于实时心电数据的预警方式在一定程度上提升了预警的准确度,但是,这种方式一般是患者已经产生了不适的感受后,在个人终端主动发起的远程预测请求,对患者有效预测的提前性较差;或者是医院本地终端设定一个时间间隔对患者主动获取实时心电数据进行预测,预测时机的参考意义较差;
(2)由于慢性心脏病的发病与其他慢性疾病(高血压、糖尿病等)的发展之间并非完全独立,而是具有某些隐形的关联关系,而现有技术中在考虑慢性心脏病患者数据特征时,往往忽略了与患者合并的其他种类慢性疾病的关联性,导致预测结果具有片面性;
(3)上述预测方法往往是基于个体数据,使得监测数据本身孤立和不完整,导致了预测的不准确,并且累计了预测误差,导致随着时间的进行,评估结果越来越偏离真实情况。
发明内容
为克服上述现有技术的不足,本发明提供了一种慢性心脏病病情发展趋势预测系统,基于联邦学习训练得到第一预测模型,实现对患者的日常主动监测,以第一预测模型的预测结果为基础,在必要时基于患者实时心电图,对患者进行病情发展趋势二次预警,提高了预测的准确度和提前性。
为实现上述目的,本发明的一个或多个实施例提供了如下技术方案:
一种慢性心脏病病情发展趋势预测系统,包括:
数据库构建与特征提取模块,其用于:获取各医疗服务机构的病人关联数据,构建慢性心脏病患者云端数据库,对数据进行清洗与特征构建,获取病人关联特征;
筛选模块,其用于:基于病人关联特征,计算云端数据库中待预测患者病情与其他患者病情的相关度,对云端数据库中的数据进行筛选,得到总数据集;对总数据集中的数据按照不同的医疗服务机构划分,得到对应于医疗服务机构的数据子集,完成对医疗服务机构的筛选;
训练模块,其用于:将筛选出的医疗服务机构作为客户端,将各个数据子集作为客户端训练集,将云端服务器作为服务端,将总数据集作为服务端训练集,基于联邦学习对XGBoost模型进行训练,得到训练好的第一预测模型;
预测模块,其用于:利用第一预测模型对待预测患者病情发展趋势进行初步预测,判断初步预测结果是否大于设定值,若是,则获取待预测患者的实时心电图,基于预训练的第二分类模型对患者进行分类,判断待预测患者的慢性心脏病发展趋势是否稳定。
可选的,各医疗服务机构的病人关联数据,具体包括:患者在同一医疗服务机构历史就医过程中的所有就医记录数据和患者日常护理数据;
所述就医记录数据包括患者身份识别信息、慢性病种类信息、患病史、手术治疗种类信息、手术时间信息、日常服药种类信息、服药时间信息、是否发生突发事件信息;
所述患者日常护理数据包括日常血压数据、血糖数据、心率数据、心电图数据。
可选的,慢性心脏病患者云端数据库的构建方法为:
在每个医疗服务机构中,每个患者的就医记录数据和患者日常护理数据合并为一个样本数据,选取慢性病种类信息中包含慢性心脏病的患者样本数据,存储于云端数据库中;
判断云端数据库的多个医疗服务机构中,是否存在同一个患者的样本数据,若存在,则进行合并;
将合并后患者的样本数据按照时间先后顺序排列,形成对应于患者的连续数据链;
连续数据链中,将每相邻两个时间的对应种类数据之差与时间之差作商,得到多个商值,将多个商值进行平均,得到患者的平均疗效信息;
将平均疗效信息、患者身份识别信息、慢性病种类信息、患病史、手术治疗种类信息、手术时间信息、日常服药种类信息、服药时间信息、是否发生突发事件信息作为病人关联特征。
可选的,所述数据库构建与特征提取模块,还用于:
分别对慢性病患病种类、患病史、手术治疗种类、手术治疗时间、服药种类、服药时间、平均疗效、突发事件进行编码,设定i=1,2,…n,将第i个患者的病人关联特征表示为:
[Zi,T1i,Ji,TJ i,Yi,TY i, Gi,S],
其中,Zi为慢性病患病种类,T1i为患病史特征,Ji为手术治疗种类特征,TJ i为手术治疗时间特征,Yi为服药种类特征,TY i为服药时间特征,Gi为平均疗效特征;S为突发事件特征。
可选的,所述筛选模块,还用于:
在云端数据库中,选取与待预测患者慢性病患病种类相同的患者,将筛选出的患者所对应的病人关联特征作为集群Q1;
设定患病史偏差阈值,从集群Q1中选取符合患病史偏差阈值的部分慢性心脏病患者,得到集群Q2;
在集群Q2中,选取与待预测病情的慢性病患者手术治疗种类相同的慢性心脏病患者,得到集群Q3;
在集群Q3中,选取与待预测病情的慢性心脏病患者的服药种类重叠度大于设定值的慢性心脏病患者,得到集群Q4;
在集群Q4中,按照以下公式计算病情相关度:
其中,为待预测病情的慢性心脏病患者,/>为集群Q4中的慢性心脏病患者,/>、、/>均为设定常数且/>>/>>/>。
可选的,所述筛选模块,还用于:
按照病情相关度从高到低,对集群Q4中的患者进行排序,选取其中排名靠前的设定数量患者的病人关联特征作为总数据集Q5;
将Q5中的患者按照不同的医疗服务机构划分为多个数据子集Q51、Q52、Q53、…Q5M。
可选的,所述训练模块,还用于基于联邦学习对模型进行训练:
S1:服务端为各个筛选出的客户端分配一个初始值;
S2:服务端预设训练轮数N、预期每轮训练时间、客户端时间完成度惩罚函数;
S3:服务端发送全局模型至筛选出的各客户端,客户端本地训练后生成新一轮的本地模型;
S4:客户端将新一轮的本地模型上传至服务端,由服务端进行聚合,得到新一轮的全局模型;
S5:服务端基于客户端新一轮的实际训练时间、客户端时间完成度惩罚函数,计算惩罚值,向各客户端反馈,将初始值减去惩罚值的差作为各客户端剩余初始值,当某一个客户端剩余初始值为零或负值时,将该客户端剔除;
S6:循环上述步骤S3至S5,直至全局模型收敛。
可选的,所述客户端时间完成度惩罚函数,具体为:
其中,表示服务端预期的每轮训练时间;/>表示客户端每轮实际的训练时间。
可选的,所述第二分类模型为深度神经网络模型,所述深度神经网络模型包括依次连接的一个卷积层、一个最大池化层、多个残差卷积模型、一个平均池化层和一个全连接层,所述残差卷积模型包括多个卷积层以及从第一个卷积层的输入到最后一个卷积层的输出连接的加操作,所述全连接层的尺寸为2,对应于心梗心电图或非心梗心电图。
可选的,所述预测模块还包括对深度神经网络模型进行训练,具体包括:
获取原始数据集,包括心梗心电图和非心梗心电图,对原始数据集进行预处理,并将原始数据集划分训练集、测试集;
搭建深度神经网络模型,利用训练集对深度神经网络模型进行训练,并利用测试集进行测试,直至分类精度满足设定要求,得到训练好的深度神经网络模型,即第二分类模型。
以上一个或多个技术方案存在以下有益效果:
本发明提供了一种慢性心脏病病情发展趋势预测系统,考虑到多个医疗服务机构之间数据的非共享性和隐私性,基于联邦学习训练得到第一预测模型,能够保证第一预测模型的精度,实现对患者的日常主动监测,以第一预测模型的预测结果为基础,在必要时基于患者实时心电图,对患者进行病情发展趋势二次预警,整体来说,较现有技术精确度和提前性更好。
本发明在进行联邦学习之前,通过计算云端数据库中待预测患者病情与其他患者病情的相关度,对云端数据库中的数据进行筛选,筛除掉部分相关性低的医疗服务机构,使其不参与针对该待预测慢性心脏病患者的联邦学习训练过程,使用相关度高的数据集,对待预测的慢性心脏病患者进行个性化定制模型的训练,得到的模型能够更好的匹配某一个或者某一类型的患者,预测精度高。
由于慢性心脏病发展与患者同时患有的其他慢性病之间存在隐形关联,因此本发明考虑多种慢性病共同作用下慢性心脏病患者的病情发展趋势,将平均疗效信息、慢性病种类信息、患病史、手术治疗种类信息、手术时间信息、日常服药种类信息、服药时间信息、是否发生突发事件信息作为病人关联特征,经过层层筛选得到和患者匹配度更高的集群,进而通过病情相关度的计算,更加精确的挑选出与待预测患者关联性更好的样本数据。
本发明在联邦学习训练模型的过程中,设立了惩罚机制,对每一轮训练中超时的客户端进行惩罚,当某一个客户端的初始值扣罚为零或负时,将该客户端剔除,该机制保证了整体的训练效率和训练的有效性。
本发明采用深度神经网络模型作为第二分类模型,能够获得较为精确的实时心电图分类结果。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为第一个实施例的系统结构图。
图2为第一个实施例的深度神经网络模型结构示意图。
图3为第一个实施例的残差卷积模型结构示意图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例一
本实施例公开了基于联邦学习的慢性病患者智慧护理远程监控方法。
如图1所示,一种慢性心脏病病情发展趋势预测系统,包括:
数据库构建与特征提取模块,其用于:获取各医疗服务机构的病人关联数据,构建慢性心脏病患者云端数据库,对数据进行清洗与特征构建,获取病人关联特征;
筛选模块,其用于:基于病人关联特征,计算云端数据库中待预测患者病情与其他患者病情的相关度,对云端数据库中的数据进行筛选,得到总数据集;对总数据集中的数据按照不同的医疗服务机构划分,得到对应于医疗服务机构的数据子集,完成对医疗服务机构的筛选;
训练模块,其用于:将筛选出的医疗服务机构作为客户端,将各个数据子集作为客户端训练集,将云端服务器作为服务端,将总数据集作为服务端训练集,基于联邦学习对XGBoost模型进行训练,得到训练好的第一预测模型;
预测模块,其用于:利用第一预测模型对待预测患者病情发展趋势进行初步预测,判断初步预测结果是否大于设定值,若是,则获取待预测患者的实时心电图,基于预训练的第二分类模型对患者进行分类,判断待预测患者的慢性心脏病发展趋势是否稳定。
进一步的,各医疗服务机构的病人关联数据,具体包括:患者在同一医疗服务机构历史就医过程中的所有就医记录数据和患者日常护理数据;
所述就医记录数据包括患者身份识别信息、慢性病种类信息、患病史、手术治疗种类信息、手术时间信息、日常服药种类信息、服药时间信息、是否发生突发事件信息;
所述患者日常护理数据包括日常血压数据、血糖数据、心率数据、心电图数据。
在本实施例中,医疗服务机构为医院,当患者去医院就医时,就医记录会存储于相应医院的本地存储中心,包括患者的患者身份信息(姓名、身份证号、社保卡号等信息)、症状描述信息、就医具体时间、就医科室、挂号医生信息、化验单据信息、医生诊断、开药记录、取药记录、费用清单、护理信息等等。
具体的,在患者首次就医时,需要为患者建档,之后每次就医时,上述内容都可以记录在电子病历之中,当需要使用时,只需要调取相关电子病历、并对电子病历中的信息进行识别即可。
由于慢性心脏病患者病情需要长期监测,患者家中往往配备有智能手表、血糖仪、血压仪或其他可穿戴设备进行血糖、血压、心率、动态心电图等各项生理指标的获取,获取时间和地点往往由患者本人灵活决定,之后患者需要将上述数据一键传输至医院监控中心,由监控中心进行综合评估和预测,判断该患者的病情是否处于稳定状态,以及是否应该及时干预、送院治疗,以降低突发事件发生后带来的后果。
本实施例中的突发事件包括:患者突发心脏病,例如心梗等。
在获取了患者的治疗数据之后,需要对数据进行预处理,数据预处理是将不同格式的数据转换成统一向量数据并进行拼接,所述格式包括下列的一种或几种:数值型数据、类别型数据、文本型数据、图像型数据。
在本实施例中,所述数值型数据采用Z-Score标准化方法进行转换;所述类别型数据采用One-Hot Encoding方法进行转换;所述文本型数据采用Word Embedding方法转换;所述图像型数据先进行大小归一化和颜色归一化,再通过卷积神经网络映射为向量数据。具体过程均为现有技术,此处不再进行赘述。
进一步的,慢性心脏病患者云端数据库的构建方法为:
在每个医疗服务机构中,每个患者的就医记录数据和患者日常护理数据合并为一个样本数据,选取慢性病种类信息中包含慢性心脏病的患者样本数据,存储于云端数据库中;
判断云端数据库的多个医疗服务机构中是否存在同一个患者的样本数据,若存在,则进行合并;
将合并后患者的样本数据按照时间先后顺序排列,形成对应于患者的连续数据链;
连续数据链中,将每相邻两个时间的对应种类数据之差与时间之差作商,得到多个商值,将多个商值进行平均,得到患者的平均疗效信息;
将平均疗效信息、患者身份识别信息、慢性病种类信息、患病史、手术治疗种类信息、手术时间信息、日常服药种类信息、服药时间信息、是否发生突发事件信息作为病人关联特征。
本实施例考虑了慢性心脏病患者合并有其他慢性病的情形,因为在临床上,慢性心脏病患者往往也同时患有糖尿病、高血压等慢性病,合并考虑这方面的因素,可以进一步提升预测的准确性。考虑在多种慢性病共同作用下,慢性心脏病患者的病情发展趋势,将平均疗效信息加入病人关联特征,能够便于后续更加精确的挑选出与待预测患者关联性更好的样本数据。
进一步的,所述数据库构建与特征提取模块,还用于:
分别对慢性病患病种类、患病史、手术治疗种类、手术治疗时间、服药种类、服药时间、平均疗效、突发事件进行编码,设定i=1,2,…n,将第i个患者的病人关联特征表示为:
[Zi,T1i,Ji,TJ i,Yi,TY i, Gi,S],
其中,Zi为慢性病患病种类,T1i为患病史特征,Ji为手术治疗种类特征,TJ i为手术治疗时间特征,Yi为服药种类特征,TY i为服药时间特征,Gi为平均疗效特征;S为突发事件特征。
为了对数据集进行筛选,挑选出与待预测患者病情更加贴近的其他患者作为训练数据集,进一步的,所述筛选模块,还用于:
在云端数据库中,选取与待预测患者慢性病患病种类相同的患者,将筛选出的患者所对应的病人关联特征作为集群Q1;
设定患病史偏差阈值,从集群Q1中选取符合患病史偏差阈值的部分慢性心脏病患者,得到集群Q2;
在集群Q2中,选取与待预测病情的慢性病患者手术治疗种类相同的慢性心脏病患者,得到集群Q3;
在集群Q3中,选取与待预测病情的慢性心脏病患者的服药种类重叠度大于设定值的慢性心脏病患者,得到集群Q4;
在集群Q4中,按照以下公式计算病情相关度:
其中,为待预测病情的慢性心脏病患者,/>为集群Q4中的慢性心脏病患者,/>、、/>均为设定常数且/>>/>>/>。
所述筛选模块,还用于:
按照病情相关度从高到低,对集群Q4中的患者进行排序,选取其中排名靠前的设定数量患者的病人关联特征作为总数据集Q5;
将Q5中的患者按照不同的医疗服务机构划分为多个数据子集Q51、Q52、Q53、…Q5M,M为被筛选出的医疗服务机构数。
得到多个数据子集Q51、Q52、Q53、…Q5M和其对应的医疗服务机构(即参与联邦学习的客户端)之后,服务端将每一个数据子集发送至其对应的客户端,使客户端利用对应的数据子集进行本地模型的训练。
联邦学习可以打破各个医疗服务机构的数据孤岛,同时还能保护患者隐私,使训练出的模型具备较高的精度。本实施例中,为了对患者的预测尽可能的具备提前性,需要确保联邦学习的训练效率,便于利用训练好的XGBoost模型对患者进行预测。
为了提高联邦学习训练的效率,本实施例中设立了惩罚机制,对超时的客户端进行惩罚,惩罚的程度与该客户端超出的时间与设定时间的比值呈正相关。
为了对多个客户端进行约束,在训练开始之前,服务端为各个筛选出的客户端分配一个初始值,在联邦学习训练过程中,当初始值扣除完毕后,说明该客户端的效率过低,为了保证整体训练效率,将该客户端从联邦学习训练中剔除。
具体的,所述训练模块,还用于基于联邦学习对模型进行训练:
S1:服务端为各个筛选出的客户端分配一个初始值;
S2:服务端预设训练轮数N、预期每轮训练时间、客户端时间完成度惩罚函数;
S3:服务端发送全局模型至筛选出的各客户端,客户端本地训练后生成新一轮的本地模型;
S4:客户端将新一轮的本地模型上传至服务端,由服务端进行聚合,得到新一轮的全局模型;
S5:服务端基于客户端新一轮的实际训练时间、客户端时间完成度惩罚函数,计算惩罚值,向各客户端反馈,将初始值减去惩罚值的差作为各客户端剩余初始值,当某一个客户端剩余初始值为零或负值时,将该客户端剔除;
S6:循环上述步骤S3至S5,直至全局模型收敛。
所述客户端时间完成度惩罚函数,具体为:
其中,表示服务端预期的每轮训练时间;/>表示客户端每轮实际的训练时间。
为了保证第二分类模型的分类精度,如图2、图3所示,所述第二分类模型设置为深度神经网络模型。所述深度神经网络模型包括依次连接的一个卷积层、一个最大池化层、多个残差卷积模型、一个平均池化层和一个全连接层,所述残差卷积模型包括多个卷积层以及从第一个卷积层的输入到最后一个卷积层的输出连接的加操作,所述全连接层的尺寸为2,对应于心梗心电图或非心梗心电图。
本实施例中,深度神经网络包括4个残差卷积模块(Block模块),每个残差卷积模块内包含两个卷积层,以及一个起点为输入,终点为第二个卷积层后的加操作,使得输入特征可以直接和第二个卷积层提取的特征进行数值相加。这样网络只需要计算相比原输入的残差,降低了训练难度。每个卷积层后都对特征进行标准化操作,提高训练速度,并经过ReLU激活函数,提高网络的非线性表达。
最后一个全连接层的输出尺寸为2,对应筛查结果的二分类(例如是心肌梗死心电图或非心肌梗死心电图),便于根据分类结果对患者进行预警。
所述预测模块还包括对深度神经网络模型进行训练,具体包括:
获取原始数据集,包括心梗心电图和非心梗心电图,对原始数据集进行预处理,并将原始数据集划分训练集、测试集;
搭建深度神经网络模型,利用训练集对深度神经网络模型进行训练,并利用测试集进行测试,直至分类精度满足设定要求,得到训练好的深度神经网络模型,即第二分类模型。
本领域技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算机装置来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何特定的硬件和软件的结合。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
Claims (4)
1.一种慢性心脏病病情发展趋势预测系统,其特征在于,包括:
数据库构建与特征提取模块,其用于:获取各医疗服务机构的病人关联数据,构建慢性心脏病患者云端数据库,对数据进行清洗与特征构建,获取病人关联特征;
筛选模块,其用于:基于病人关联特征,计算云端数据库中待预测患者病情与其他患者病情的相关度,对云端数据库中的数据进行筛选,得到总数据集;对总数据集中的数据按照不同的医疗服务机构划分,得到对应于医疗服务机构的数据子集,完成对医疗服务机构的筛选;
训练模块,其用于:将筛选出的医疗服务机构作为客户端,将各个数据子集作为客户端训练集,将云端服务器作为服务端,将总数据集作为服务端训练集,基于联邦学习对XGBoost模型进行训练,得到训练好的第一预测模型;
预测模块,其用于:利用第一预测模型对待预测患者病情发展趋势进行初步预测,判断初步预测结果是否大于设定值,若是,则获取待预测患者的实时心电图,基于预训练的第二分类模型对患者进行分类,判断待预测患者的慢性心脏病发展趋势是否稳定;
各医疗服务机构的病人关联数据,具体包括:患者在同一医疗服务机构历史就医过程中的所有就医记录数据和患者日常护理数据;
所述就医记录数据包括患者身份识别信息、慢性病种类信息、患病史、手术治疗种类信息、手术时间信息、日常服药种类信息、服药时间信息、是否发生突发事件信息;
所述患者日常护理数据包括日常血压数据、血糖数据、心率数据、心电图数据;
慢性心脏病患者云端数据库的构建方法为:
在每个医疗服务机构中,每个患者的就医记录数据和患者日常护理数据合并为一个样本数据,选取慢性病种类信息中包含慢性心脏病的患者样本数据,存储于云端数据库中;
判断云端数据库的多个医疗服务机构中是否存在同一个患者的样本数据,若存在,则进行合并;
将合并后患者的样本数据按照时间先后顺序排列,形成对应于患者的连续数据链;
连续数据链中,将每相邻两个时间的对应种类数据之差与时间之差作商,得到多个商值,将多个商值进行平均,得到患者的平均疗效信息;
将平均疗效信息、患者身份识别信息、慢性病种类信息、患病史、手术治疗种类信息、手术时间信息、日常服药种类信息、服药时间信息、是否发生突发事件信息作为病人关联特征;
所述数据库构建与特征提取模块,还用于:
分别对慢性病患病种类、患病史、手术治疗种类、手术治疗时间、服药种类、服药时间、平均疗效、突发事件进行编码,设定i=1,2,…n,将第i个患者的病人关联特征表示为:
[Zi,T1i,Ji,TJ i,Yi,TY i, Gi,S],
其中,Zi 为慢性病患病种类,T1i为患病史特征,Ji为手术治疗种类特征,TJ i为手术治疗时间特征,Yi为服药种类特征,TY i为服药时间特征,Gi为平均疗效特征;S为突发事件特征;
所述筛选模块,还用于:
在云端数据库中,选取与待预测患者慢性病患病种类相同的患者,将筛选出的患者所对应的病人关联特征作为集群Q1;
设定患病史偏差阈值,从集群Q1中选取符合患病史偏差阈值的部分慢性心脏病患者,得到集群Q2;
在集群Q2中,选取与待预测病情的慢性病患者手术治疗种类相同的慢性心脏病患者,得到集群Q3;
在集群Q3中,选取与待预测病情的慢性心脏病患者的服药种类重叠度大于设定值的慢性心脏病患者,得到集群Q4;
在集群Q4中,按照以下公式计算病情相关度:
其中,为待预测病情的慢性心脏病患者,/>为集群Q4中的慢性心脏病患者,/>、/>、均为设定常数且/>>/>>/>;
考虑在多种慢性病共同作用下,慢性心脏病患者的病情发展趋势,将平均疗效信息加入病人关联特征,能够便于后续更加精确的挑选出与待预测患者关联性更好的样本数据;
所述筛选模块,还用于:
按照病情相关度从高到低,对集群Q4中的患者进行排序,选取其中排名靠前的设定数量患者的病人关联特征作为总数据集Q5;
将Q5中的患者按照不同的医疗服务机构划分为多个数据子集Q51、Q52、Q53、…Q5M,M为被筛选出的医疗服务机构数;
所述训练模块,还用于基于联邦学习对模型进行训练:
S1:服务端为各个筛选出的客户端分配一个初始值;
S2:服务端预设训练轮数N、预期每轮训练时间、客户端时间完成度惩罚函数/>;
S3:服务端发送全局模型至筛选出的各客户端,客户端本地训练后生成新一轮的本地模型;
S4:客户端将新一轮的本地模型上传至服务端,由服务端进行聚合,得到新一轮的全局模型;
S5:服务端基于客户端新一轮的实际训练时间、客户端时间完成度惩罚函数,计算惩罚值,向各客户端反馈,将初始值减去惩罚值的差作为各客户端剩余初始值,当某一个客户端剩余初始值为零或负值时,将该客户端剔除;
S6:循环上述步骤S3至S5,直至全局模型收敛。
2.如权利要求1所述的慢性心脏病病情发展趋势预测系统,其特征在于,
所述客户端时间完成度惩罚函数,具体为:
其中,表示服务端预期的每轮训练时间;/>表示客户端每轮实际的训练时间。
3.如权利要求1所述的慢性心脏病病情发展趋势预测系统,其特征在于,所述第二分类模型为深度神经网络模型,所述深度神经网络模型包括依次连接的一个卷积层、一个最大池化层、多个残差卷积模型、一个平均池化层和一个全连接层,所述残差卷积模型包括多个卷积层以及从第一个卷积层的输入到最后一个卷积层的输出连接的加操作,所述全连接层的尺寸为2,对应于心梗心电图或非心梗心电图。
4.如权利要求3所述的慢性心脏病病情发展趋势预测系统,其特征在于,所述预测模块还包括对深度神经网络模型进行训练,具体包括:
获取原始数据集,包括心梗心电图和非心梗心电图,对原始数据集进行预处理,并将原始数据集划分训练集、测试集;
搭建深度神经网络模型,利用训练集对深度神经网络模型进行训练,并利用测试集进行测试,直至分类精度满足设定要求,得到训练好的深度神经网络模型,即第二分类模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311798431.2A CN117476217B (zh) | 2023-12-26 | 2023-12-26 | 一种慢性心脏病病情发展趋势预测系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311798431.2A CN117476217B (zh) | 2023-12-26 | 2023-12-26 | 一种慢性心脏病病情发展趋势预测系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117476217A CN117476217A (zh) | 2024-01-30 |
CN117476217B true CN117476217B (zh) | 2024-03-26 |
Family
ID=89639910
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311798431.2A Active CN117476217B (zh) | 2023-12-26 | 2023-12-26 | 一种慢性心脏病病情发展趋势预测系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117476217B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117854670A (zh) * | 2024-03-05 | 2024-04-09 | 四川互慧软件有限公司 | 构建糖尿病个性化治疗方案的方法、装置、计算机及介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110444263A (zh) * | 2019-08-21 | 2019-11-12 | 深圳前海微众银行股份有限公司 | 基于联邦学习的疾病数据处理方法、装置、设备及介质 |
CN112836829A (zh) * | 2021-01-26 | 2021-05-25 | 支付宝(杭州)信息技术有限公司 | 一种个性化的隐私保护学习方法、装置以及设备 |
CN113643778A (zh) * | 2021-10-14 | 2021-11-12 | 山东大学齐鲁医院 | 基于电子病历资料的院内心脏骤停筛选方法及系统 |
CN114496233A (zh) * | 2022-04-07 | 2022-05-13 | 广东工业大学 | 一种心肌梗死并发症的辅助诊断系统 |
CN115547437A (zh) * | 2022-09-21 | 2022-12-30 | 哈尔滨理工大学 | 一种基于医疗联邦方的训练系统及训练方法 |
CN115775026A (zh) * | 2022-12-27 | 2023-03-10 | 重庆大学 | 一种基于组织相似度的联邦学习方法 |
WO2023109827A1 (zh) * | 2021-12-15 | 2023-06-22 | 维沃移动通信有限公司 | 客户端筛选方法及装置、客户端及中心设备 |
CN116598012A (zh) * | 2023-04-19 | 2023-08-15 | 浙江大学 | 一种基于联邦学习价值评估的慢性病医疗保健方法和系统 |
CN116662910A (zh) * | 2023-06-28 | 2023-08-29 | 哈尔滨理工大学 | 一种基于联邦学习的多临床分期疾病辅助分类方法及系统 |
CN117251752A (zh) * | 2023-07-14 | 2023-12-19 | 天津医科大学第二医院 | 一种老年病发病概率预测方法及系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200303075A1 (en) * | 2019-03-18 | 2020-09-24 | Kundan Krishna | System and a method to predict occurrence of a chronic diseases |
US20210407678A1 (en) * | 2020-06-24 | 2021-12-30 | Neuropace, Inc. | Systems and methods for using federated learning for training centralized seizure detection and prediction models on decentralized datasets |
-
2023
- 2023-12-26 CN CN202311798431.2A patent/CN117476217B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110444263A (zh) * | 2019-08-21 | 2019-11-12 | 深圳前海微众银行股份有限公司 | 基于联邦学习的疾病数据处理方法、装置、设备及介质 |
CN112836829A (zh) * | 2021-01-26 | 2021-05-25 | 支付宝(杭州)信息技术有限公司 | 一种个性化的隐私保护学习方法、装置以及设备 |
CN113643778A (zh) * | 2021-10-14 | 2021-11-12 | 山东大学齐鲁医院 | 基于电子病历资料的院内心脏骤停筛选方法及系统 |
WO2023109827A1 (zh) * | 2021-12-15 | 2023-06-22 | 维沃移动通信有限公司 | 客户端筛选方法及装置、客户端及中心设备 |
CN114496233A (zh) * | 2022-04-07 | 2022-05-13 | 广东工业大学 | 一种心肌梗死并发症的辅助诊断系统 |
CN115547437A (zh) * | 2022-09-21 | 2022-12-30 | 哈尔滨理工大学 | 一种基于医疗联邦方的训练系统及训练方法 |
CN115775026A (zh) * | 2022-12-27 | 2023-03-10 | 重庆大学 | 一种基于组织相似度的联邦学习方法 |
CN116598012A (zh) * | 2023-04-19 | 2023-08-15 | 浙江大学 | 一种基于联邦学习价值评估的慢性病医疗保健方法和系统 |
CN116662910A (zh) * | 2023-06-28 | 2023-08-29 | 哈尔滨理工大学 | 一种基于联邦学习的多临床分期疾病辅助分类方法及系统 |
CN117251752A (zh) * | 2023-07-14 | 2023-12-19 | 天津医科大学第二医院 | 一种老年病发病概率预测方法及系统 |
Non-Patent Citations (3)
Title |
---|
Investigating automated regression models for estimating left ventricular ejection fraction levels in heart failure patients using circadian ECG features;Younis et al;PLOS ONE;20231211;第18卷(第12期);第e0295653页 * |
融合联邦学习与区块链的医疗数据共享方案;温亚兰 等;计算机工程;20220531;第48卷(第5期);第145-161页 * |
面向移动终端智能的自治学习系统;徐梦炜 等;软件学报;20201031;第31卷(第10期);第3004-3018页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117476217A (zh) | 2024-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3255573A1 (en) | Clinical decision supporting ensemble system and clinical decison supporting method using the same | |
Yu et al. | Personalized health monitoring system of elderly wellness at the community level in Hong Kong | |
US20240186021A1 (en) | Monitoring predictive models | |
WO2022099668A1 (zh) | 一种基于家族遗传病与体征数据关联的精准健康管理与风险预警方法及系统 | |
CN117476217B (zh) | 一种慢性心脏病病情发展趋势预测系统 | |
WO2018128927A1 (en) | Hierarchical health decision support system and method | |
CN111613335A (zh) | 一种健康预警系统及方法 | |
Padhy et al. | [Retracted] IoT‐Based Hybrid Ensemble Machine Learning Model for Efficient Diabetes Mellitus Prediction | |
Pal et al. | Deep learning techniques for prediction and diagnosis of diabetes mellitus | |
CN111276230A (zh) | 一种心脑血管疾病一体化分层管理系统及方法 | |
US20200250496A1 (en) | Sequential minimal optimization algorithm for learning using partially available privileged information | |
CN113241196A (zh) | 基于云-终端协同的远程医疗与分级监控系统 | |
CN113990482A (zh) | 健康数据处理系统及方法 | |
Islam et al. | Portable health clinic: An advanced tele-healthcare system for unreached communities | |
Mounika et al. | Prediction of type-2 diabetes using machine learning algorithms | |
Shafi et al. | Prediction of heart abnormalities using deep learning model and wearabledevices in smart health homes | |
US20240038383A1 (en) | Health Monitoring System | |
Nestor et al. | Preparing a clinical support model for silent mode in general internal medicine | |
US8428965B2 (en) | System for clinical research and clinical management of cardiovascular risk using ambulatory blood pressure monitoring and actigraphy | |
Balnarsaiah et al. | Parkinson’s disease detection using modified ResNeXt deep learning model from brain MRI images | |
CN117292829A (zh) | 一种冠心病分级诊疗信息系统 | |
JP2000099605A (ja) | 健診情報分析サーバおよびネットワーク健康情報システム | |
CN117012380A (zh) | 事件预估方法、装置、设备、存储介质及程序产品 | |
CN114550896A (zh) | 基于人工神经网络的头晕患者急诊预检分诊决策方法、装置及模型 | |
Ko et al. | Real‐Time Remote Patient Monitoring and Alarming System for Noncommunicable Lifestyle Diseases |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |