CN112331349B - 一种脑卒中复发监测系统 - Google Patents
一种脑卒中复发监测系统 Download PDFInfo
- Publication number
- CN112331349B CN112331349B CN202011207792.1A CN202011207792A CN112331349B CN 112331349 B CN112331349 B CN 112331349B CN 202011207792 A CN202011207792 A CN 202011207792A CN 112331349 B CN112331349 B CN 112331349B
- Authority
- CN
- China
- Prior art keywords
- data
- recurrence
- stroke
- patient
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 148
- 208000006011 Stroke Diseases 0.000 title claims abstract description 100
- 206010008190 Cerebrovascular accident Diseases 0.000 title claims description 6
- 230000002490 cerebral effect Effects 0.000 title claims description 6
- 201000010099 disease Diseases 0.000 claims abstract description 68
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 68
- 238000012545 processing Methods 0.000 claims abstract description 47
- 238000003860 storage Methods 0.000 claims abstract description 10
- 238000012549 training Methods 0.000 claims description 66
- 238000012360 testing method Methods 0.000 claims description 41
- 238000000034 method Methods 0.000 claims description 40
- 238000010606 normalization Methods 0.000 claims description 22
- 230000008569 process Effects 0.000 claims description 15
- 230000002159 abnormal effect Effects 0.000 claims description 12
- 238000012795 verification Methods 0.000 claims description 10
- 238000007781 pre-processing Methods 0.000 claims description 9
- 238000007477 logistic regression Methods 0.000 claims description 8
- 238000004140 cleaning Methods 0.000 claims description 6
- 238000004891 communication Methods 0.000 claims description 6
- 238000013480 data collection Methods 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 4
- 230000003993 interaction Effects 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000011002 quantification Methods 0.000 claims description 3
- 238000007405 data analysis Methods 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 24
- 239000008280 blood Substances 0.000 description 7
- 210000004369 blood Anatomy 0.000 description 7
- 230000036772 blood pressure Effects 0.000 description 7
- 235000005911 diet Nutrition 0.000 description 7
- 230000037213 diet Effects 0.000 description 7
- 230000037396 body weight Effects 0.000 description 6
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 3
- 230000036760 body temperature Effects 0.000 description 3
- 239000008103 glucose Substances 0.000 description 3
- 230000002265 prevention Effects 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000012106 screening analysis Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 230000009861 stroke prevention Effects 0.000 description 2
- 201000006474 Brain Ischemia Diseases 0.000 description 1
- 206010008120 Cerebral ischaemia Diseases 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 206010008118 cerebral infarction Diseases 0.000 description 1
- 208000026106 cerebrovascular disease Diseases 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000013497 data interchange Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 208000037907 haemorrhagic injury Diseases 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 208000037821 progressive disease Diseases 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 108010021724 tonin Proteins 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Data Mining & Analysis (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开了一种脑卒中复发监测模型,包括脑卒中数据采集模块,用于多维度采集若干曾患脑卒中患者的病症数据信息和生活数据信息,并将采集到的若干份包含所述病症数据信息和生活数据信息病例数据传输到脑卒中数据处理模块。本发明利用各医院脑卒中患者数据库存储服务器和患者日常生命体征监测终端设备采集到大量的病例数据,并将病例数据量化成样本数据集用作对患者复发监测模型的建立,复发监测模型可以根据患者的病症数据信息和生活数据信息预测处患者复发脑卒中的可能性,该模型建立在对真实患者病例数据进行大数据分析,从而预测结果真实可靠,避免医生人为预测的随机性。
Description
技术领域
本发明涉及智能医疗技术领域,具体涉及一种脑卒中复发监测系统。
背景技术
脑卒中作为一种急性脑血管病,其主要临床表现症状有脑组织缺血及出血性损伤,具体表现为高发病率、高致残率、高死亡率和高复发率。作为一个不可逆的、复杂的、循序渐进的疾病过程,脑卒中没有特定的治疗标准,家庭,社会危害性很大,通过对脑卒中预防筛查分析系统进行脑卒中筛查可以有效预防中风和对治疗效果评估,提高病人预防意识,如果延缓中风发病年龄5-10年,将会减轻对家庭、国家、社会的经济负担和就医负担。
目前临床上预防筛查分析系统借助人工智能技术,找到数据中人不容易总结的组合规律,学习各种组合的可能性。随着近些年机器学习与人工智能技术的高速发展,人工智能应用于脑卒中预防筛查系统成为可能,而且在临床研究中取得了很好的效果。
在大力研究预防筛查分析系统过程可以有效的帮助人们预防脑卒中,但是却忽略了脑卒中的高复发性质,对于曾有脑卒中患病史的患者要进行特别关注,现有技术中,往往是基于病人的临床表现来判断病人是否发病,这样容易错过脑卒中的最佳防范时机,病人的需要到医院由医生进行复发可能性的判定,全然依据医生经验,随机性大,同时,由于患者恐惧心理造成的频繁约诊会大大增加患者和医生的经济和工作。
发明内容
本发明的目的在于提供一种脑卒中复发监测系统,以解决现有技术中病人的需要到医院由医生进行复发可能性的判定,全然依据医生经验,随机性大,以及患者难以消除自身恐惧心理增加医疗负担的技术问题。
为解决上述技术问题,本发明具体提供下述技术方案:
一种脑卒中复发监测系统,包括
脑卒中数据采集模块,用于多维度采集若干曾患脑卒中患者的病症数据信息和生活数据信息,并将采集到的若干份包含所述病症数据信息和生活数据信息病例数据传输到脑卒中数据处理模块;
脑卒中数据处理模块,用于对来自脑卒中数据采集模块的若干份病例数据量化成样本数据集,将样本数据集传输到复发监测模型建立模块用以建立复发监测模型;
复发监测模型建立模块,用于对样本数据集中的由病症数据信息和生活数据信息量化而来的样本数据集分成训练数据集和测试数据集,在训练数据集上进行预测训练,训练完成后用测试数据集验证预测复发的准确性,并持续优化模型直至准确性达到规定阈值,生成最佳复发监测模型,并接收模型监测应用模块输入的患者的病症数据信息和生活数据信息,经过复发监测模型进行监测运算将当前患者复发结果反馈到模型检测应用模块;
模型监测应用模块,用于根据输入的当前患者的病症数据信息和生活数据信息,并将病症数据信息和生活数据信息上传到复发监测模型建立模块,并接收复发监测模型建立模块反馈的当前患者复发结果并生成报告供患者查询;
追踪核实模块,用于对模型监测应用模块的预测的患者进行追踪访问,用以获得患者真实的复发结果,并将真实的复发结果和预测的复发结果相比对获得复发监测模型在真实场景中的应用情况,并根据复发监测模型在真实场景中的应用情况对脑卒中数据采集模块中采集的患者病症数据信息和生活信息进行调整以更新影响预测复发结果的特征,进一步进行模型更新换代。
作为本发明的一种优选方案,所述脑卒中数据采集模块包括各医院脑卒中患者数据库存储服务器和患者日常生命体征监测终端设备,所述各医院脑卒中患者数据库存储服务器用以采集病症数据信息,患者日常生命体征监测终端设备用以采集生活数据信息,所述脑卒中数据采集模块采集病症数据信息和生活数据信息的过程为:
步骤一:随机在各医院的脑卒中患者数据库服务器中抽取总数为
N的患者,获得
N份病症数据信息;
步骤二:将生命体征监测终端设备分配到步骤一中抽取的
N个患者,用以收集获得
N份与病症数据信息一一对应的生活数据信息;
步骤三:将
N份包含病症数据信息和生活数据信息的病例数据通过网络通信传输到脑卒中数据处理模块。
作为本发明的一种优选方案,所述脑卒中数据处理模块将来自于脑卒中数据采集模块的病例数据量化成样本数据集的具体过程为
步骤一:将病例数据中所有的用文字描述属性特征量化成数字描述;
步骤二:对完成特征量化的病例数据进行数据预处理,预处理包括数据清洗和特征规范化:
A1:数据清洗包括重复项处理、缺失项处理和异常项处理,具体方式如下:
重复项处理:遍历
N个病例数据,将
N个病例数据中所有重复数据进行删除到仅保留一条数据,确保
N个病例数据中的所有数据均具有唯一性;
缺失项处理:将
N个病例数据中具有缺失项的数据全部单独提取出来,可对具有缺失项的数据进行删除,或按照
N个病例数据中所有数据在此项处的平均值、众值和中位值进行填充,或-1或Null填充,将其补充成完整性数据回归到
N个病例数据中;
异常项处理:将
N个病例数据中具有异常项的数据全部单独提取出来,可对具有异常项的数据进行删除,或按照
N个病例数据中所有数据在此项处的平均值、众值和中位值替代异常项,或-1或Null填充,将其补充成正常数据回归到
N个病例数据中;
A2:特征规范化包括归一化和标准化,具体方式如下:
归一化:将原始相差较大的数据项映射到[0,1]范围内,假设数据项为
X,该项最大值为
Xmax,最小值为
Xmin,则映射后的数据项标记为
X2=(
X-
Xmin)/(
Xmax-
Xmin) ;归一化在数据量小的
N个病例数据上表现更佳;
标准化:将原始数据变化的均值为0,标准差为1的范围内,假设数据项为
X,该项的平均值为
Xmean,标准差为
σ,则映射后的数据项标记为
X2=(
X-
Xmean)/
σ;标准化在数据量大的
N个病例数据上表现更佳;
步骤三:将经过数据预处理的病例数据汇集形成一个样本总量为
N的样本数据集。
作为本发明的一种优选方案,所述复发监测模型建立模块建立复发监测模型的过程为:
步骤一:将预处理后的数据集分成两个数据集分别为训练数据集和测试数据集:
假设样本数据集标记为
S,测试数据集标记为S_test,训练数据集标记为S_train;
步骤二:对训练数据集进行样本数据训练,训练后的模型运用到测试数据集上获得预测结果:
步骤一:将预处理后的数据集分成两个数据集分别为训练数据集和测试数据集:
假设样本数据集标记为
S,测试数据集标记为S_test,训练数据集标记为S_train;
步骤二:对训练数据集进行样本数据训练,训练后的模型运用到测试数据集上获得预测结果:
在Logistic回归模型基础上训练复发监测模型,获得依据患者病症数据信息和生活数据信息预测患者在未来复发的可能性;
具体步骤为:
选择一个合适的预测函数,标记为
h函数,
h函数为分类函数,用于预测输入训练数据集的复发判断结果;
构造一个Cost函数,用于表示预测的输出(
h)与训练数据类别(
y)之间的偏差,综合考虑所有训练数据的“损失”,将Cost求和或者求平均,记为
J(θ)函数,表示所有训练数据集预测值与实际值的偏差;
J(θ)函数的值越小表示预测函数越准确,求解J(θ)函数的最小值,确定预测函数
h以确定复发监测模型;
步骤三:通过测试数据集的预测结果和真实结果相比对,计算模型评价指标衡量模型预测复发的准确率,标记为
P;
步骤四:将预测复发的准确率与规定阈值标记为
Q相比较,若
P<
Q,对复发监测模型进行参数调优,若
P>
Q,终止对复发监测模型进行参数调优过程,以当前参数带入生成最佳复发监测模型。
作为本发明的一种优选方案,所述脑卒中数据处理模块和复发监测模型建立模块位于由若干服务器和计算主机构建而成的分布式数据处理系统中。
作为本发明的一种优选方案,所述模型监测应用模块为安装有输入患者病症数据信息和生活数据信息的登录门户的智能终端设备,所述登录门户为网页、软件APP或小程序,所述模型监测应用模块与复发监测模型建立模块通过网络通信进行数据交换和业务交互。
作为本发明的一种优选方案,所述追踪核实模块定期向使用登录门户具有访问监测预测复发记录的患者发送核实问卷以获得真实的患者复发情况。
作为本发明的一种优选方案,本发明提出一种脑卒中复发监测系统的监测方法,包括以下步骤:
S100、脑卒中数据采集模块多维度采集若干曾患脑卒中患者的病症数据信息和生活数据信息,并将采集到的若干份包含所述病症数据信息和生活数据信息病例数据传输到脑卒中数据处理模块;
S200、脑卒中数据处理模块对来自脑卒中数据采集模块的若干份病例数据量化成样本数据集,将样本数据集传输到复发监测模型建立模块用以建立复发监测模型;
S300、复发监测模型建立模块对样本数据集中的由病症数据信息和生活数据信息量化而来的样本数据集分成训练数据集和测试数据集,在训练数据集上进行预测训练,训练完成后用测试数据集验证预测复发的准确性,并持续优化模型直至准确性达到规定阈值,生成最佳复发监测模型,并接收模型监测应用模块输入的患者的病症数据信息和生活数据信息,经过复发监测模型进行监测运算将当前患者复发结果反馈到模型检测应用模块,;
S400、模型监测应用模块根据输入的当前患者的病症数据信息和生活数据信息,并将病症数据信息和生活数据信息上传到复发监测模型建立模块,并接收复发监测模型建立模块反馈的当前患者复发结果并生成报告供患者查询;
S500、追踪核实模块对模型监测应用模块的预测的患者进行追踪访问,用以获得患者真实的复发结果,并将真实的复发结果和预测的复发结果相比对获得复发监测模型在真实场景中的应用情况,并根据复发监测模型在真实场景中的应用情况对脑卒中数据采集模块中采集的患者病症数据信息和生活信息进行调整以更新影响预测复发结果的特征,进一步进行模型更新换代。
本发明与现有技术相比较具有如下有益效果:
(1)本发明利用各医院脑卒中患者数据库存储服务器和患者日常生命体征监测终端设备采集到大量的病例数据,并将病例数据量化成样本数据集用作对患者复发监测模型的建立,复发监测模型可以根据患者的病症数据信息和生活数据信息预测处患者复发脑卒中的可能性,该模型建立在对真实患者病例数据进行大数据分析,从而预测结果真实可靠,避免医生人为预测的随机性。
(2)本发明中患者或医生用户只需要将患者的病症数据信息和生活数据信息输入到安装有登录门户的智能终端即可利用复发监测模型对患者进行复发预测,简单高效,并且患者可实时对自身进行复发预测消除恐惧心理,因此复发监测模型有效的减轻了医疗负担。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
图1为本发明实施例提供的脑卒中复发监测模型结构框图;
图2为本发明实施例提供的监测方法流程图。
图中的标号分别表示如下:
1-脑卒中数据采集模块;2-脑卒中数据处理模块;3-复发监测模型建立模块;4-模型监测应用模块;5-追踪核实模块。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明提供了一种脑卒中复发监测系统,包括
脑卒中数据采集模块1,用于多维度采集若干曾患脑卒中患者的病症数据信息和生活数据信息,并将采集到的若干份包含所述病症数据信息和生活数据信息病例数据传输到脑卒中数据处理模块2;
病症数据信息包括但不限于初病时间、患病程度、康复程度、复发时间、复发程度等,生活数据信息包括但不限于血糖、血压、体重、饮食、心率、睡眠、体温等。
脑卒中数据处理模块2,用于对来自脑卒中数据采集模块1的若干份病例数据量化成样本数据集,将样本数据集传输到复发监测模型建立模块3用以建立复发监测模型;
复发监测模型建立模块3,用于对样本数据集中的由病症数据信息和生活数据信息量化而来的样本数据集分成训练数据集和测试数据集,在训练数据集上进行预测训练,训练完成后用测试数据集验证预测复发的准确性,并持续优化模型直至准确性达到规定阈值,生成最佳复发监测模型,并接收模型监测应用模块4输入的患者的病症数据信息和生活数据信息,经过复发监测模型进行监测运算将当前患者复发结果反馈到模型检测应用模块;
模型监测应用模块4,用于根据输入的当前患者的病症数据信息和生活数据信息,并将病症数据信息和生活数据信息上传到复发监测模型建立模块3,并接收复发监测模型建立模块3反馈的当前患者复发结果并生成报告供患者查询;
追踪核实模块5,用于对模型监测应用模块4的预测的患者进行追踪访问,用以获得患者真实的复发结果,并将真实的复发结果和预测的复发结果相比对获得复发监测模型在真实场景中的应用情况,并根据复发监测模型在真实场景中的应用情况对脑卒中数据采集模块1中采集的患者病症数据信息和生活信息进行调整以更新影响预测复发结果的特征,进一步进行模型更新换代。
举例说明:在复发监测模型真实场景中发现复发结果与体温相关性较低,在后续脑卒中数据采集模块1采集的生活数据中将删除体温数据。
所述脑卒中数据采集模块1包括各医院脑卒中患者数据库存储服务器和患者日常生命体征监测终端设备,所述各医院脑卒中患者数据库存储服务器用以采集病症数据信息,患者日常生命体征监测终端设备用以采集生活数据信息,所述脑卒中数据采集模块1采集病症数据信息和生活数据信息的过程为:
步骤一:随机在各医院的脑卒中患者数据库服务器中抽取总数为
N的患者,获得
N份病症数据信息;
步骤二:将生命体征监测终端设备分配到步骤一中抽取的
N个患者,用以收集获得
N份与病症数据信息一一对应的生活数据信息;
步骤三:将
N份包含病症数据信息和生活数据信息的病例数据通过网络通信传输到脑卒中数据处理模块2。
所述脑卒中数据处理模块2将来自于脑卒中数据采集模块1的病例数据量化成样本数据集的具体过程为
步骤一:将病例数据中所有的用文字描述属性特征量化成数字描述;
步骤二:对完成特征量化的病例数据进行数据预处理,预处理包括数据清洗和特征规范化:
A1:数据清洗包括重复项处理、缺失项处理和异常项处理,具体方式如下:
重复项处理:遍历
N个病例数据,将
N个病例数据中所有重复数据进行删除到仅保留一条数据,确保
N个病例数据中的所有数据均具有唯一性;
缺失项处理:将
N个病例数据中具有缺失项的数据全部单独提取出来,可对具有缺失项的数据进行删除,或按照
N个病例数据中所有数据在此项处的平均值、众值和中位值进行填充,或-1或Null填充,将其补充成完整性数据回归到
N个病例数据中;
异常项处理:将
N个病例数据中具有异常项的数据全部单独提取出来,可对具有异常项的数据进行删除,或按照
N个病例数据中所有数据在此项处的平均值、众值和中位值替代异常项,或-1或Null填充,将其补充成正常数据回归到
N个病例数据中;
A2:特征规范化包括归一化和标准化,具体方式如下:
归一化:将原始相差较大的数据项映射到[0,1]范围内,假设数据项为
X,该项最大值为
Xmax,最小值为
Xmin,则映射后的数据项标记为
X2=(
X-
Xmin)/(
Xmax-
Xmin) ;归一化在数据量小的
N个病例数据上表现更佳;
标准化:将原始数据变化的均值为0,标准差为1的范围内,假设数据项为
X,该项的平均值为
Xmean,标准差为
σ,则映射后的数据项标记为
X2=(
X-
Xmean)/
σ;标准化在数据量大的
N个病例数据上表现更佳;
步骤三:将经过数据预处理的病例数据汇集形成一个样本总量为
N的样本数据集。
所述复发监测模型建立模块3建立复发监测模型的过程为:
步骤一:将预处理后的数据集分成两个数据集分别为训练数据集和测试数据集:
假设样本数据集标记为
S,测试数据集标记为S_test,训练数据集标记为S_train;
B1:按固定比例划分,将样本数据集的20%作为测试数据集,80%作为训练数据集,即S_test=20%
S,S_train=80%
S,20%和80%的比例可以在实际使用中进行调整;
B2:K折交叉验证,将全部样本数据集
S分成
k个不相交的子集,假设
S中的训练样例个数为
n,那么每一个自己有
n/k个训练样例,相应的子集为{
s1,
s2,...,
sk};每次从分好的子集里面,拿出一个作为测试集,其他
k-1个作为训练集;在
k-1个训练集上训练出预测模型;把这个模型放到测试集上,得到预测率的平均值,作为该模型的真实预测率;
B3:留一法:假设有
N个样本,将每一个样本作为测试样本,其他
N-1个样本作为训练样本,这样得到
N个监测模型,
N个测试结果,用这
N个结果的平均值来衡量模型的性能;
在实际使用中可对B1、B2和B3进行适当改进,在基础原理的基础加入符合样本需求的划分方法,也可以提出其他不同的数据集划分方法。
步骤二:对训练数据集进行样本数据训练,训练后的模型运用到测试数据集上获得预测结果:
在Logistic回归模型基础上训练监测模型,获得样本数据中患者病例数据信息和生活数据信息在未来复发的可能性;
Logistic回归的原理:分类模型,即可预测患者在未来复发脑卒中的可能性;
Logistic回归的具体步骤:
C1、找一个合适的预测函数,标记为
h函数,该函数就是我们需要找的分类函数,它用来预测输入数据的判断结果;
C2、构造一个Cost函数(损失函数),该函数表示预测的输出(
h)与训练数据类别(
y)之间的偏差,可以是二者之间的差(
h-y)或者是其他的形式。综合考虑所有训练数据的“损失”,将Cost求和或者求平均,记为
J(θ)函数,表示所有训练数据预测值与实际类别的偏差;
C3、
J(θ)函数的值越小表示预测函数越准确(即
h函数越准确),所以这一步需要做的是找到J(θ)函数的最小值,确定预测函数
h确定分类预测模型;
步骤三:通过测试数据集的预测结果和真实结果相比对,计算模型评价指标衡量模型预测复发的准确率,标记为
P,模型评价指标包括精确率、召回率和F1-Measure,因此
P的计算方式有三种,如下:
假设:
TP:把正的判断为正的数目,判断正确,且判为了正,即正的预测为正的;
FN:把正的错判为负的数目,判断错误,且判为了负,即把正的判为了负的;
FP:把负的错判为正的数目,判断错误,且判为了正,即把负的判为了正的
TN:把负的判为负的数目,判断正确,且判为了负,即把负的判为了负的;
在灾害预测模型的预测结果中,结果安全视为正类,危险视为负类;
D1,精确率方式:
P= TP/ (TP+FP)
D2,召回率方式:
P=TP / (TP+FN)
D3,F-Measure是D1和D2加权调和平均:
F-Measure方式:
P=2*TP/(2*TP+FP+FN)。
步骤四:将预测复发的准确率与规定阈值标记为
Q相比较,若
P<
Q,对复发监测模型进行参数调优,若
P>
Q,终止对复发监测模型进行参数调优过程,以当前参数带入生成最佳复发监测模型,在实际使用中根据需要选择相应的准确率计算方式和阈值。
所述脑卒中数据处理模块2和复发监测模型建立模块3位于由若干服务器和计算主机构建而成的分布式数据处理系统中,在进行样本数据集训练时,将样本数据集中样本数据合理分成若干部分,发放到若干服务器和计算主机进行并行训练,训练完成后将若干服务器和计算主机上的结构汇总成训练结果,有效的提高效率,同时在样本数据量巨大分布式系统无法负载时,只需要在分布式系统中接入运算主机扩展运算量和存储量以承载大数据量计算,而复发监测模型的精度依赖于样本数据的充足,分布式系统为其提供了实现的硬件支持。
所述模型监测应用模块4为安装有输入患者病症数据信息和生活数据信息的登录门户的智能终端设备,所述登录门户为网页、软件APP或小程序,所述模型监测应用模块4与复发监测模型建立模块3通过网络通信进行数据交换和业务交互,患者或医院可将接入复发监测模型的登录门户安装到患者使用的智能手机或医院就诊电脑中,用以便于患者和医生输入患者的病症数据信息和生活数据信息,实现商用和民用。
所述追踪核实模块5定期向使用登录门户具有访问监测预测复发记录的患者发送核实问卷以获得真实的患者复发情况。
为了进一步理解在Logistic回归模型基础上训练样本数据获得复发监测模型的过程,以下进行详细描述:
假设样本数据如下表所示:
样本 特征 | 初病时间 | 患病 程度 | 康复 程度 | 复发 时间 | 血糖 | 血压 | 体重 | 饮食 | 心率 |
数据值 | T1 | 轻/重 | 良好/恶劣 | T2 | N | M | L | O | Q |
预处理:
T1
、T2采用年月日计数制,比如2020年1月20日,该数据项之间相差较大且不集中,采用归一化处理;
血糖、血压、体重、饮食、心率:
N、M、L、O和
Q,都采用数字表示比如体重60kg,取数字60作为
N,该数据项之间相差较小且集中,采用标准化处理;
患病程度、康复程度:轻/重、良好/恶劣,直接用1/0表示。
划分训练数据集和测试数据集:采用B1、B2和B3中任一中方法获得S_train,S_test。
在Logistic回归基础上训练预测模型:
Logistic回归模型中训练同样需要两个参数,一个使特征值,另一个使结果值,而S_train中的数据特征值不唯一,因此首先需要对所有特征值的组合进行降维处理,如下:
S_train(初病时间、患病程度、康复程度、血糖、血压、体重、饮食、心率)降维成X_S_train,
S_train(复发时间)作为Y_S_train,
训练数据集样本数据转变为下表:
X_S_train | Y_S_train |
初病时间、患病程度、康复程度、血糖、血压、 体重、 饮食、 心率 | 复发时间 |
样本:x(i) | y(i) |
计算公式为:
n为样本总数
求解最小化的
J(θ)下的模型参数,从而最终获得复发监测模型,而后只需要向模型中输入特征值,而后在运用到患者脑卒中复发预测场景中时,输入患者的各种特征值:初病时间、患病程度、康复程度、血糖、血压、体重、饮食、心率,经过复发监测模型后输出患者复发时间,用于提醒患者进行医疗预警。
在完成模型训练后,采用测试数据集进行评价;
测试数据集如下表:
X_S_test | Y_S_test |
初病时间、患病程度、康复程度、血糖、血压、 体重、 饮食、 心率 | 复发时间 |
样本:x(i) | y(i) |
如图2所示,基于以上脑卒中复发监测模型,本发明提出一种监测方法,包括以下步骤:
S100、脑卒中数据采集模块多维度采集若干曾患脑卒中患者的病症数据信息和生活数据信息,并将采集到的若干份包含所述病症数据信息和生活数据信息病例数据传输到脑卒中数据处理模块;
S200、脑卒中数据处理模块对来自脑卒中数据采集模块的若干份病例数据量化成样本数据集,将样本数据集传输到复发监测模型建立模块用以建立复发监测模型;
S300、复发监测模型建立模块对样本数据集中的由病症数据信息和生活数据信息量化而来的样本数据集分成训练数据集和测试数据集,在训练数据集上进行预测训练,训练完成后用测试数据集验证预测复发的准确性,并持续优化模型直至准确性达到规定阈值,生成最佳复发监测模型,并接收模型监测应用模块输入的患者的病症数据信息和生活数据信息,经过复发监测模型进行监测运算将当前患者复发结果反馈到模型检测应用模块,;
S400、模型监测应用模块根据输入的当前患者的病症数据信息和生活数据信息,并将病症数据信息和生活数据信息上传到复发监测模型建立模块,并接收复发监测模型建立模块反馈的当前患者复发结果并生成报告供患者查询;
S500、追踪核实模块对模型监测应用模块的预测的患者进行追踪访问,用以获得患者真实的复发结果,并将真实的复发结果和预测的复发结果相比对获得复发监测模型在真实场景中的应用情况,并根据复发监测模型在真实场景中的应用情况对脑卒中数据采集模块中采集的患者病症数据信息和生活信息进行调整以更新影响预测复发结果的特征,进一步进行模型更新换代。
本发明利用各医院脑卒中患者数据库存储服务器和患者日常生命体征监测终端设备采集到大量的病例数据,并将病例数据量化成样本数据集用作对患者复发监测模型的建立,复发监测模型可以根据患者的病症数据信息和生活数据信息预测处患者复发脑卒中的可能性,该模型建立在对真实患者病例数据进行大数据分析,从而预测结果真实可靠,避免医生人为预测的随机性;患者或医生用户只需要将患者的病症数据信息和生活数据信息输入到安装有登录门户的智能终端即可利用复发监测模型对患者进行复发预测,简单高效,并且患者可实时对自身进行复发预测消除恐惧心理,因此复发监测模型有效的减轻了医疗负担。
以上实施例仅为本申请的示例性实施例,不用于限制本申请,本申请的保护范围由权利要求书限定。本领域技术人员可以在本申请的实质和保护范围内,对本申请做出各种修改或等同替换,这种修改或等同替换也应视为落在本申请的保护范围内。
Claims (5)
1.一种脑卒中复发监测系统,其特征在于:包括
脑卒中数据采集模块(1),用于多维度采集若干曾患脑卒中患者的病症数据信息和生活数据信息,并将采集到的若干份包含所述病症数据信息和生活数据信息病例数据传输到脑卒中数据处理模块(2);
脑卒中数据处理模块(2),用于对来自脑卒中数据采集模块(1)的若干份病例数据量化成样本数据集,将样本数据集传输到复发监测模型建立模块(3)用以建立复发监测模型;
复发监测模型建立模块(3),用于对样本数据集中的由病症数据信息和生活数据信息量化而来的样本数据集分成训练数据集和测试数据集,在训练数据集上进行预测训练,训练完成后用测试数据集验证预测复发的准确性,并持续优化模型直至准确性达到规定阈值,生成最佳复发监测模型,并接收模型监测应用模块(4)输入的患者的病症数据信息和生活数据信息,经过复发监测模型进行监测运算将当前患者复发结果反馈到模型检测应用模块;
模型监测应用模块(4),用于根据输入的当前患者的病症数据信息和生活数据信息,并将病症数据信息和生活数据信息上传到复发监测模型建立模块(3),并接收复发监测模型建立模块(3)反馈的当前患者复发结果并生成报告供患者查询;
追踪核实模块(5),用于对模型监测应用模块(4)的预测的患者进行追踪访问,用以获得患者真实的复发结果,并将真实的复发结果和预测的复发结果相比对获得复发监测模型在真实场景中的应用情况,并根据复发监测模型在真实场景中的应用情况对脑卒中数据采集模块(1)中采集的患者病症数据信息和生活信息进行调整以更新影响预测复发结果的特征,进一步进行模型更新换代;
所述脑卒中数据处理模块(2)将来自于脑卒中数据采集模块(1)的病例数据量化成样本数据集的具体过程为:
步骤一:将病例数据中所有的用文字描述属性特征量化成数字描述;
步骤二:对完成特征量化的病例数据进行数据预处理,预处理包括数据清洗和特征规范化:
A1:数据清洗包括重复项处理、缺失项处理和异常项处理,具体方式如下:
重复项处理:遍历N个病例数据,将N个病例数据中所有重复数据进行删除到仅保留一条数据,确保N个病例数据中的所有数据均具有唯一性;
缺失项处理:将N个病例数据中具有缺失项的数据全部单独提取出来,可对具有缺失项的数据进行删除,或按照N个病例数据中所有数据在此项处的平均值、众值和中位值进行填充,或-1或Null填充,将其补充成完整性数据回归到N个病例数据中;
异常项处理:将N个病例数据中具有异常项的数据全部单独提取出来,可对具有异常项的数据进行删除,或按照N个病例数据中所有数据在此项处的平均值、众值和中位值替代异常项,或-1或Null填充,将其补充成正常数据回归到N个病例数据中;
A2:特征规范化包括归一化和标准化,具体方式如下:
归一化:将原始相差较大的数据项映射到[0,1]范围内,假设数据项为X,该项最大值为Xmax,最小值为Xmin,则映射后的数据项标记为X2=(X- Xmin)/(Xmax- Xmin) ;归一化在数据量小的N个病例数据上表现更佳;
标准化:将原始数据变化的均值为0,标准差为1的范围内,假设数据项为X,该项的平均值为Xmean,标准差为σ,则映射后的数据项标记为X2=(X - Xmean)/σ;标准化在数据量大的N个病例数据上表现更佳;
步骤三:将经过数据预处理的病例数据汇集形成一个样本总量为N的样本数据集;
所述复发监测模型建立模块(3)建立复发监测模型的过程为:
步骤一:将预处理后的数据集分成两个数据集分别为训练数据集和测试数据集:
假设样本数据集标记为S,测试数据集标记为S_test,训练数据集标记为S_train;
步骤二:对训练数据集进行样本数据训练,训练后的模型运用到测试数据集上获得预测结果:
在Logistic回归模型基础上训练复发监测模型,获得依据患者病症数据信息和生活数据信息预测患者在未来复发的可能性;
具体步骤为:
选择一个合适的预测函数,标记为h函数,h函数为分类函数,用于预测输入训练数据集的复发判断结果;
构造一个Cost函数,用于表示预测的输出(h)与训练数据类别(y)之间的偏差,综合考虑所有训练数据的“损失”,将Cost求和或者求平均,记为J(θ)函数,表示所有训练数据集预测值与实际值的偏差;
J(θ)函数的值越小表示预测函数越准确,求解J(θ)函数的最小值,确定预测函数h以确定复发监测模型;
步骤三:通过测试数据集的预测结果和真实结果相比对,计算模型评价指标衡量模型预测复发的准确率,标记为P;
步骤四:将预测复发的准确率与规定阈值标记为Q相比较,若P<Q,对复发监测模型进行参数调优,若P>Q,终止对复发监测模型进行参数调优过程,以当前参数带入生成最佳复发监测模型。
2.根据权利要求1所述的一种脑卒中复发监测系统,其特征在于:所述脑卒中数据采集模块(1)包括各医院脑卒中患者数据库存储服务器和患者日常生命体征监测终端设备,所述各医院脑卒中患者数据库存储服务器用以采集病症数据信息,患者日常生命体征监测终端设备用以采集生活数据信息,所述脑卒中数据采集模块(1)采集病症数据信息和生活数据信息的过程为:
步骤一:随机在各医院的脑卒中患者数据库服务器中抽取总数为N的患者,获得N份病症数据信息;
步骤二:将生命体征监测终端设备分配到步骤一中抽取的N个患者,用以收集获得N份与病症数据信息一一对应的生活数据信息;
步骤三:将N份包含病症数据信息和生活数据信息的病例数据通过网络通信传输到脑卒中数据处理模块(2)。
3.根据权利要求2所述的一种脑卒中复发监测系统,其特征在于:所述脑卒中数据处理模块(2)和复发监测模型建立模块(3)位于由若干服务器和计算主机构建而成的分布式数据处理系统中。
4.根据权利要求3所述的一种脑卒中复发监测系统,其特征在于:所述模型监测应用模块(4)为安装有输入患者病症数据信息和生活数据信息的登录门户的智能终端设备,所述登录门户为网页、软件APP或小程序,所述模型监测应用模块(4)与复发监测模型建立模块(3)通过网络通信进行数据交换和业务交互。
5.根据权利要求4所述的一种脑卒中复发监测系统,其特征在于:所述追踪核实模块(5)定期向使用登录门户具有访问监测预测复发记录的患者发送核实问卷以获得真实的患者复发情况。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011207792.1A CN112331349B (zh) | 2020-11-03 | 2020-11-03 | 一种脑卒中复发监测系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011207792.1A CN112331349B (zh) | 2020-11-03 | 2020-11-03 | 一种脑卒中复发监测系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112331349A CN112331349A (zh) | 2021-02-05 |
CN112331349B true CN112331349B (zh) | 2023-04-07 |
Family
ID=74324463
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011207792.1A Active CN112331349B (zh) | 2020-11-03 | 2020-11-03 | 一种脑卒中复发监测系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112331349B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113270196B (zh) * | 2021-05-25 | 2023-07-14 | 郑州大学 | 一种脑卒中复发风险感知与行为决策模型构建系统及方法 |
CN113808747B (zh) * | 2021-10-11 | 2023-12-26 | 南昌大学第二附属医院 | 一种缺血性脑卒中复发预测方法 |
CN115662637A (zh) * | 2022-11-08 | 2023-01-31 | 一选(浙江)医疗科技有限公司 | 一种脑中风复发预警系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109670510A (zh) * | 2018-12-21 | 2019-04-23 | 万达信息股份有限公司 | 一种基于深度学习的胃镜活检病理数据筛查系统和方法 |
CN111081377A (zh) * | 2020-01-16 | 2020-04-28 | 四川大学 | 一种坏死性急性胰腺炎患者手术时机预测模型 |
CN111105877A (zh) * | 2019-12-24 | 2020-05-05 | 郑州科技学院 | 基于深度置信网络的慢性病精确干预方法及系统 |
CN111261277A (zh) * | 2018-11-30 | 2020-06-09 | 上海图灵医疗科技有限公司 | 一种基于深度学习模型的心脏疾病的检测方法 |
CN111297366A (zh) * | 2018-12-12 | 2020-06-19 | 中国科学院软件研究所 | 基于日常生活用品的辅助疾病诊断的数据处理方法和诊断装置 |
CN111430029A (zh) * | 2020-03-24 | 2020-07-17 | 浙江达美生物技术有限公司 | 基于人工智能的多维度脑卒中预防筛查方法 |
CN111863276A (zh) * | 2020-07-21 | 2020-10-30 | 集美大学 | 利用细粒度数据的手足口病预测方法、电子设备及介质 |
-
2020
- 2020-11-03 CN CN202011207792.1A patent/CN112331349B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111261277A (zh) * | 2018-11-30 | 2020-06-09 | 上海图灵医疗科技有限公司 | 一种基于深度学习模型的心脏疾病的检测方法 |
CN111297366A (zh) * | 2018-12-12 | 2020-06-19 | 中国科学院软件研究所 | 基于日常生活用品的辅助疾病诊断的数据处理方法和诊断装置 |
CN109670510A (zh) * | 2018-12-21 | 2019-04-23 | 万达信息股份有限公司 | 一种基于深度学习的胃镜活检病理数据筛查系统和方法 |
CN111105877A (zh) * | 2019-12-24 | 2020-05-05 | 郑州科技学院 | 基于深度置信网络的慢性病精确干预方法及系统 |
CN111081377A (zh) * | 2020-01-16 | 2020-04-28 | 四川大学 | 一种坏死性急性胰腺炎患者手术时机预测模型 |
CN111430029A (zh) * | 2020-03-24 | 2020-07-17 | 浙江达美生物技术有限公司 | 基于人工智能的多维度脑卒中预防筛查方法 |
CN111863276A (zh) * | 2020-07-21 | 2020-10-30 | 集美大学 | 利用细粒度数据的手足口病预测方法、电子设备及介质 |
Non-Patent Citations (1)
Title |
---|
曾大军 ; 戴汝为 ; 王飞跃 ; 毛文吉 ; 王全意 ; .传染病信息学和症状监测.科技导报.2007,(21),19-24. * |
Also Published As
Publication number | Publication date |
---|---|
CN112331349A (zh) | 2021-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112331349B (zh) | 一种脑卒中复发监测系统 | |
US11257579B2 (en) | Systems and methods for managing autoimmune conditions, disorders and diseases | |
CN114727766A (zh) | 从图像和专家知识收集和识别皮肤状况的系统 | |
JP2018524137A (ja) | 心理状態を評価するための方法およびシステム | |
CN111968746A (zh) | 一种基于混合深度迁移学习的脑卒中风险预测方法及装置 | |
CN112233736B (zh) | 一种知识库的构建方法和系统 | |
CN104158914A (zh) | 面向家庭的远程尿液检测与健康咨询服务系统及方法 | |
KR20180002234A (ko) | 치매 조기 진단을 위한 스마트 검사장치 및 그 방법 | |
CN105808906A (zh) | 患者个人特性的分析方法及其装置 | |
CN117542474A (zh) | 基于大数据的远程护理监测系统及方法 | |
CN116631564B (zh) | 一种急诊电子病历管理系统及管理方法 | |
CN112185558A (zh) | 基于深度学习的心理健康及康复评定方法、装置及介质 | |
CN118280562B (zh) | 知识图谱驱动的医疗大模型诊断方法 | |
CN112635053A (zh) | 基于大数据的居民健康预警方法、装置、设备和系统 | |
CN111063448A (zh) | 输血不良反应数据库建立方法、存储系统以及主动预警系统 | |
Zhang et al. | Construction of a smart management system for physical health based on IoT and cloud computing with big data | |
CN117854738B (zh) | 一种基于智联终端的医疗护理系统 | |
CN115798662A (zh) | 基于人工智能算法的医院病案管理用病例运送分析系统 | |
CN117898687B (zh) | 多维度生命体征监测方法、装置、系统及智能戒指 | |
Zhang et al. | Exploring unsupervised multivariate time series representation learning for chronic disease diagnosis | |
CN114550896A (zh) | 基于人工神经网络的头晕患者急诊预检分诊决策方法、装置及模型 | |
Verma et al. | Machine learning and IoT‐based model for patient monitoring and early prediction of diabetes | |
CN117854745A (zh) | 一种智能健康管理系统、方法、设备及介质 | |
CN117116482A (zh) | 基于多维度血糖趋势分析预警血糖疾病风险分析系统 | |
KR20180002229A (ko) | 치매 정보 데이터베이스 구축을 위한 에이전트 장치 및 그 운영방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |