CN112331349A - 一种脑卒中复发监测模型及监测方法 - Google Patents

一种脑卒中复发监测模型及监测方法 Download PDF

Info

Publication number
CN112331349A
CN112331349A CN202011207792.1A CN202011207792A CN112331349A CN 112331349 A CN112331349 A CN 112331349A CN 202011207792 A CN202011207792 A CN 202011207792A CN 112331349 A CN112331349 A CN 112331349A
Authority
CN
China
Prior art keywords
data
recurrence
model
stroke
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011207792.1A
Other languages
English (en)
Other versions
CN112331349B (zh
Inventor
刘祚燕
陈可涵
曾宁
曾晓梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
West China Hospital of Sichuan University
Original Assignee
West China Hospital of Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by West China Hospital of Sichuan University filed Critical West China Hospital of Sichuan University
Priority to CN202011207792.1A priority Critical patent/CN112331349B/zh
Publication of CN112331349A publication Critical patent/CN112331349A/zh
Application granted granted Critical
Publication of CN112331349B publication Critical patent/CN112331349B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种脑卒中复发监测模型,包括脑卒中数据采集模块,用于多维度采集若干曾患脑卒中患者的病症数据信息和生活数据信息,并将采集到的若干份包含所述病症数据信息和生活数据信息病例数据传输到脑卒中数据处理模块。本发明利用各医院脑卒中患者数据库存储服务器和患者日常生命体征监测终端设备采集到大量的病例数据,并将病例数据量化成样本数据集用作对患者复发监测模型的建立,复发监测模型可以根据患者的病症数据信息和生活数据信息预测处患者复发脑卒中的可能性,该模型建立在对真实患者病例数据进行大数据分析,从而预测结果真实可靠,避免医生人为预测的随机性。

Description

一种脑卒中复发监测模型及监测方法
技术领域
本发明涉及智能医疗技术领域,具体涉及一种脑卒中复发监测模型及监测方法。
背景技术
脑卒中作为一种急性脑血管病,其主要临床表现症状有脑组织缺血及出血性损伤,具体表现为高发病率、高致残率、高死亡率和高复发率。作为一个不可逆的、复杂的、循序渐进的疾病过程,脑卒中没有特定的治疗标准,家庭,社会危害性很大,通过对脑卒中预防筛查分析系统进行脑卒中筛查可以有效预防中风和对治疗效果评估,提高病人预防意识,如果延缓中风发病年龄5-10年,将会减轻对家庭、国家、社会的经济负担和就医负担。
目前临床上预防筛查分析系统借助人工智能技术,找到数据中人不容易总结的组合规律,学习各种组合的可能性。随着近些年机器学习与人工智能技术的高速发展,人工智能应用于脑卒中预防筛查系统成为可能,而且在临床研究中取得了很好的效果。
在大力研究预防筛查分析系统过程可以有效的帮助人们预防脑卒中,但是却忽略了脑卒中的高复发性质,对于曾有脑卒中患病史的患者要进行特别关注,现有技术中,往往是基于病人的临床表现来判断病人是否发病,这样容易错过脑卒中的最佳防范时机,病人的需要到医院由医生进行复发可能性的判定,全然依据医生经验,随机性大,同时,由于患者恐惧心理造成的频繁约诊会大大增加患者和医生的经济和工作。
发明内容
本发明的目的在于提供一种脑卒中复发监测模型,以解决现有技术中病人的需要到医院由医生进行复发可能性的判定,全然依据医生经验,随机性大,以及患者难以消除自身恐惧心理增加医疗负担的技术问题。
为解决上述技术问题,本发明具体提供下述技术方案:
一种脑卒中复发监测模型,包括
脑卒中数据采集模块,用于多维度采集若干曾患脑卒中患者的病症数据信息和生活数据信息,并将采集到的若干份包含所述病症数据信息和生活数据信息病例数据传输到脑卒中数据处理模块;
脑卒中数据处理模块,用于对来自脑卒中数据采集模块的若干份病例数据量化成样本数据集,将样本数据集传输到复发监测模型建立模块用以建立复发监测模型;
复发监测模型建立模块,用于对样本数据集中的由病症数据信息和生活数据信息量化而来的样本数据集分成训练数据集和测试数据集,在训练数据集上进行预测训练,训练完成后用测试数据集验证预测复发的准确性,并持续优化模型直至准确性达到规定阈值,生成最佳复发监测模型,并接收模型监测应用模块输入的患者的病症数据信息和生活数据信息,经过复发监测模型进行监测运算将当前患者复发结果反馈到模型检测应用模块,;
模型监测应用模块,用于根据输入的当前患者的病症数据信息和生活数据信息,并将病症数据信息和生活数据信息上传到复发监测模型建立模块,并接收复发监测模型建立模块反馈的当前患者复发结果并生成报告供患者查询;
追踪核实模块,用于对模型监测应用模块的预测的患者进行追踪访问,用以获得患者真实的复发结果,并将真实的复发结果和预测的复发结果相比对获得复发监测模型在真实场景中的应用情况,并根据复发监测模型在真实场景中的应用情况对脑卒中数据采集模块中采集的患者病症数据信息和生活信息进行调整以更新影响预测复发结果的特征,进一步进行模型更新换代。
作为本发明的一种优选方案,所述脑卒中数据采集模块包括各医院脑卒中患者数据库存储服务器和患者日常生命体征监测终端设备,所述各医院脑卒中患者数据库存储服务器用以采集病症数据信息,患者日常生命体征监测终端设备用以采集生活数据信息,所述脑卒中数据采集模块采集病症数据信息和生活数据信息的过程为:
步骤一:随机在各医院的脑卒中患者数据库服务器中抽取总数为N的患者,获得N份病症数据信息;
步骤二:将生命体征监测终端设备分配到步骤一中抽取的N个患者,用以收集获得N份与病症数据信息一一对应的生活数据信息;
步骤三:将N份包含病症数据信息和生活数据信息的病例数据通过网络通信传输到脑卒中数据处理模块。
作为本发明的一种优选方案,所述脑卒中数据处理模块将来自于脑卒中数据采集模块的病例数据量化成样本数据集的具体过程为
步骤一:将病例数据中所有的用文字描述属性特征量化成数字描述;
步骤二:对完成特征量化的病例数据进行数据预处理,预处理包括数据清洗和特征规范化:
A1:数据清洗包括重复项处理、缺失项处理和异常项处理,具体方式如下:
重复项处理:遍历N个病例数据,将N个病例数据中所有重复数据进行删除到仅保留一条数据,确保N个病例数据中的所有数据均具有唯一性;
缺失项处理:将N个病例数据中具有缺失项的数据全部单独提取出来,可对具有缺失项的数据进行删除,或按照N个病例数据中所有数据在此项处的平均值、众值和中位值进行填充,或-1或Null填充,将其补充成完整性数据回归到N个病例数据中;
异常项处理:将N个病例数据中具有异常项的数据全部单独提取出来,可对具有异常项的数据进行删除,或按照N个病例数据中所有数据在此项处的平均值、众值和中位值替代异常项,或-1或Null填充,将其补充成正常数据回归到N个病例数据中;
A2:特征规范化包括归一化和标准化,具体方式如下:
归一化:将原始相差较大的数据项映射到[0,1]范围内,假设数据项为X,该项最大值为Xmax,最小值为Xmin,则映射后的数据项标记为X2=(X-Xmin)/(Xmax-Xmin);归一化在数据量小的N个病例数据上表现更佳;
标准化:将原始数据变化的均值为0,标准差为1的范围内,假设数据项为X,该项的平均值为Xmean,标准差为σ,则映射后的数据项标记为X2=(X-Xmean)/σ;标准化在数据量大的N个病例数据上表现更佳;
步骤三:将经过数据预处理的病例数据汇集形成一个样本总量为N的样本数据集。
作为本发明的一种优选方案,所述复发监测模型建立模块建立复发监测模型的过程为:
步骤一:将预处理后的数据集分成两个数据集分别为训练数据集和测试数据集:
假设样本数据集标记为S,测试数据集标记为S_test,训练数据集标记为S_train;
步骤二:对训练数据集进行样本数据训练,训练后的模型运用到测试数据集上获得预测结果:
步骤一:将预处理后的数据集分成两个数据集分别为训练数据集和测试数据集:
假设样本数据集标记为S,测试数据集标记为S_test,训练数据集标记为S_train;
步骤二:对训练数据集进行样本数据训练,训练后的模型运用到测试数据集上获得预测结果:
在Logistic回归模型基础上训练复发监测模型,获得依据患者病症数据信息和生活数据信息预测患者在未来复发的可能性;
具体步骤为:
选择一个合适的预测函数,标记为h函数,h函数为分类函数,用于预测输入训练数据集的复发判断结果;
构造一个Cost函数(损失函数),用于表示预测的输出(h)与训练数据类别(y)之间的偏差,综合考虑所有训练数据的“损失”,将Cost求和或者求平均,记为J(θ)函数,表示所有训练数据集预测值与实际值的偏差;
J(θ)函数的值越小表示预测函数越准确(即h函数越准确),求解J(θ)函数的最小值,确定预测函数h以确定复发监测模型;
步骤三:通过测试数据集的预测结果和真实结果相比对,计算模型评价指标衡量模型预测复发的准确率,标记为P;
步骤四:将预测复发的准确率与规定阈值标记为Q相比较,若P<Q,对复发监测模型进行参数调优,若P>Q,终止对复发监测模型进行参数调优过程,以当前参数带入生成最佳复发监测模型。
作为本发明的一种优选方案,所述脑卒中数据处理模块和复发监测模型建立模块位于由若干服务器和计算主机构建而成的分布式数据处理系统中。
作为本发明的一种优选方案,所述模型监测应用模块为安装有输入患者病症数据信息和生活数据信息的登录门户的智能终端设备,所述登录门户为网页、软件APP或小程序,所述模型监测应用模块与复发监测模型建立模块通过网络通信进行数据交换和业务交互。
作为本发明的一种优选方案,所述追踪核实模块定期向使用登录门户具有访问监测预测复发记录的患者发送核实问卷以获得真实的患者复发情况。
作为本发明的一种优选方案,本发明提出一种脑卒中复发监测模型的监测方法,包括以下步骤:
S100、脑卒中数据采集模块多维度采集若干曾患脑卒中患者的病症数据信息和生活数据信息,并将采集到的若干份包含所述病症数据信息和生活数据信息病例数据传输到脑卒中数据处理模块;
S200、脑卒中数据处理模块对来自脑卒中数据采集模块的若干份病例数据量化成样本数据集,将样本数据集传输到复发监测模型建立模块用以建立复发监测模型;
S300、复发监测模型建立模块对样本数据集中的由病症数据信息和生活数据信息量化而来的样本数据集分成训练数据集和测试数据集,在训练数据集上进行预测训练,训练完成后用测试数据集验证预测复发的准确性,并持续优化模型直至准确性达到规定阈值,生成最佳复发监测模型,并接收模型监测应用模块输入的患者的病症数据信息和生活数据信息,经过复发监测模型进行监测运算将当前患者复发结果反馈到模型检测应用模块,;
S400、模型监测应用模块根据输入的当前患者的病症数据信息和生活数据信息,并将病症数据信息和生活数据信息上传到复发监测模型建立模块,并接收复发监测模型建立模块反馈的当前患者复发结果并生成报告供患者查询;
S500、追踪核实模块对模型监测应用模块的预测的患者进行追踪访问,用以获得患者真实的复发结果,并将真实的复发结果和预测的复发结果相比对获得复发监测模型在真实场景中的应用情况,并根据复发监测模型在真实场景中的应用情况对脑卒中数据采集模块中采集的患者病症数据信息和生活信息进行调整以更新影响预测复发结果的特征,进一步进行模型更新换代。
本发明与现有技术相比较具有如下有益效果:
(1)本发明利用各医院脑卒中患者数据库存储服务器和患者日常生命体征监测终端设备采集到大量的病例数据,并将病例数据量化成样本数据集用作对患者复发监测模型的建立,复发监测模型可以根据患者的病症数据信息和生活数据信息预测处患者复发脑卒中的可能性,该模型建立在对真实患者病例数据进行大数据分析,从而预测结果真实可靠,避免医生人为预测的随机性。
(2)本发明中患者或医生用户只需要将患者的病症数据信息和生活数据信息输入到安装有登录门户的智能终端即可利用复发监测模型对患者进行复发预测,简单高效,并且患者可实时对自身进行复发预测消除恐惧心理,因此复发监测模型有效的减轻了医疗负担。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
图1为本发明实施例提供的脑卒中复发监测模型结构框图;
图2为本发明实施例提供的监测方法流程图。
图中的标号分别表示如下:
1-脑卒中数据采集模块;2-脑卒中数据处理模块;3-复发监测模型建立模块;4-模型监测应用模块;5-追踪核实模块。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明提供了一种脑卒中复发监测模型,包括
脑卒中数据采集模块1,用于多维度采集若干曾患脑卒中患者的病症数据信息和生活数据信息,并将采集到的若干份包含所述病症数据信息和生活数据信息病例数据传输到脑卒中数据处理模块2;
病症数据信息包括但不限于初病时间、患病程度、康复程度、复发时间、复发程度等,生活数据信息包括但不限于血糖、血压、体重、饮食、心率、睡眠、体温等。
脑卒中数据处理模块2,用于对来自脑卒中数据采集模块1的若干份病例数据量化成样本数据集,将样本数据集传输到复发监测模型建立模块3用以建立复发监测模型;
复发监测模型建立模块3,用于对样本数据集中的由病症数据信息和生活数据信息量化而来的样本数据集分成训练数据集和测试数据集,在训练数据集上进行预测训练,训练完成后用测试数据集验证预测复发的准确性,并持续优化模型直至准确性达到规定阈值,生成最佳复发监测模型,并接收模型监测应用模块4输入的患者的病症数据信息和生活数据信息,经过复发监测模型进行监测运算将当前患者复发结果反馈到模型检测应用模块,;
模型监测应用模块4,用于根据输入的当前患者的病症数据信息和生活数据信息,并将病症数据信息和生活数据信息上传到复发监测模型建立模块3,并接收复发监测模型建立模块3反馈的当前患者复发结果并生成报告供患者查询;
追踪核实模块5,用于对模型监测应用模块4的预测的患者进行追踪访问,用以获得患者真实的复发结果,并将真实的复发结果和预测的复发结果相比对获得复发监测模型在真实场景中的应用情况,并根据复发监测模型在真实场景中的应用情况对脑卒中数据采集模块1中采集的患者病症数据信息和生活信息进行调整以更新影响预测复发结果的特征,进一步进行模型更新换代。
举例说明:在复发监测模型真实场景中发现复发结果与体温相关性较低,在后续脑卒中数据采集模块1采集的生活数据中将删除体温数据。
所述脑卒中数据采集模块1包括各医院脑卒中患者数据库存储服务器和患者日常生命体征监测终端设备,所述各医院脑卒中患者数据库存储服务器用以采集病症数据信息,患者日常生命体征监测终端设备用以采集生活数据信息,所述脑卒中数据采集模块1采集病症数据信息和生活数据信息的过程为:
步骤一:随机在各医院的脑卒中患者数据库服务器中抽取总数为N的患者,获得N份病症数据信息;
步骤二:将生命体征监测终端设备分配到步骤一中抽取的N个患者,用以收集获得N份与病症数据信息一一对应的生活数据信息;
步骤三:将N份包含病症数据信息和生活数据信息的病例数据通过网络通信传输到脑卒中数据处理模块2。
所述脑卒中数据处理模块2将来自于脑卒中数据采集模块1的病例数据量化成样本数据集的具体过程为
步骤一:将病例数据中所有的用文字描述属性特征量化成数字描述;
步骤二:对完成特征量化的病例数据进行数据预处理,预处理包括数据清洗和特征规范化:
A1:数据清洗包括重复项处理、缺失项处理和异常项处理,具体方式如下:
重复项处理:遍历N个病例数据,将N个病例数据中所有重复数据进行删除到仅保留一条数据,确保N个病例数据中的所有数据均具有唯一性;
缺失项处理:将N个病例数据中具有缺失项的数据全部单独提取出来,可对具有缺失项的数据进行删除,或按照N个病例数据中所有数据在此项处的平均值、众值和中位值进行填充,或-1或Null填充,将其补充成完整性数据回归到N个病例数据中;
异常项处理:将N个病例数据中具有异常项的数据全部单独提取出来,可对具有异常项的数据进行删除,或按照N个病例数据中所有数据在此项处的平均值、众值和中位值替代异常项,或-1或Null填充,将其补充成正常数据回归到N个病例数据中;
A2:特征规范化包括归一化和标准化,具体方式如下:
归一化:将原始相差较大的数据项映射到[0,1]范围内,假设数据项为X,该项最大值为Xmax,最小值为Xmin,则映射后的数据项标记为X2=(X-Xmin)/(Xmax-Xmin);归一化在数据量小的N个病例数据上表现更佳;
标准化:将原始数据变化的均值为0,标准差为1的范围内,假设数据项为X,该项的平均值为Xmean,标准差为σ,则映射后的数据项标记为X2=(X-Xmean)/σ;标准化在数据量大的N个病例数据上表现更佳;
步骤三:将经过数据预处理的病例数据汇集形成一个样本总量为N的样本数据集。
所述复发监测模型建立模块3建立复发监测模型的过程为:
步骤一:将预处理后的数据集分成两个数据集分别为训练数据集和测试数据集:
假设样本数据集标记为S,测试数据集标记为S_test,训练数据集标记为S_train;
B1:按固定比例划分,将样本数据集的20%作为测试数据集,80%作为训练数据集,即S_test=20%S,S_train=80%S,20%和80%的比例可以在实际使用中进行调整;
B2:K折交叉验证,将全部样本数据集S分成k个不相交的子集,假设S中的训练样例个数为n,那么每一个自己有n/k个训练样例,相应的子集为{s1,s2,...,sk};每次从分好的子集里面,拿出一个作为测试集,其他k-1个作为训练集;在k-1个训练集上训练出预测模型;把这个模型放到测试集上,得到预测率的平均值,作为该模型的真实预测率;
B3:留一法:假设有N个样本,将每一个样本作为测试样本,其他N-1个样本作为训练样本,这样得到N个监测模型,N个测试结果,用这N个结果的平均值来衡量模型的性能;
在实际使用中可对B1、B2和B3进行适当改进,在基础原理的基础加入符合样本需求的划分方法,也可以提出其他不同的数据集划分方法。
步骤二:对训练数据集进行样本数据训练,训练后的模型运用到测试数据集上获得预测结果:
在Logistic回归模型基础上训练监测模型,获得样本数据中患者病例数据信息和生活数据信息在未来复发的可能性;
Logistic回归的原理:分类模型,即可预测患者在未来复发脑卒中的可能性;
Logistic回归的具体步骤:
C1、找一个合适的预测函数,标记为h函数,该函数就是我们需要找的分类函数,它用来预测输入数据的判断结果;
C2、构造一个Cost函数(损失函数),该函数表示预测的输出(h)与训练数据类别(y)之间的偏差,可以是二者之间的差(h-y)或者是其他的形式。综合考虑所有训练数据的“损失”,将Cost求和或者求平均,记为J(θ)函数,表示所有训练数据预测值与实际类别的偏差;
C3、J(θ)函数的值越小表示预测函数越准确(即h函数越准确),所以这一步需要做的是找到J(θ)函数的最小值,确定预测函数h确定分类预测模型;
步骤三:通过测试数据集的预测结果和真实结果相比对,计算模型评价指标衡量模型预测复发的准确率,标记为P,模型评价指标包括精确率、召回率和F1-Measure,因此P的计算方式有三种,如下:
假设:
TP:把正的判断为正的数目,判断正确,且判为了正,即正的预测为正的;
FN:把正的错判为负的数目,判断错误,且判为了负,即把正的判为了负的;
FP:把负的错判为正的数目,判断错误,且判为了正,即把负的判为了正的
TN:把负的判为负的数目,判断正确,且判为了负,即把负的判为了负的;
在灾害预测模型的预测结果中,结果安全视为正类,危险视为负类;
D1,精确率方式:P=TP/(TP+FP)
D2,召回率方式:P=TP/(TP+FN)
D3,F-Measure是D1和D2加权调和平均:
F-Measure方式:P=2*TP/(2*TP+FP+FN)。
步骤四:将预测复发的准确率与规定阈值标记为Q相比较,若P<Q,对复发监测模型进行参数调优,若P>Q,终止对复发监测模型进行参数调优过程,以当前参数带入生成最佳复发监测模型,在实际使用中根据需要选择相应的准确率计算方式和阈值。
所述脑卒中数据处理模块2和复发监测模型建立模块3位于由若干服务器和计算主机构建而成的分布式数据处理系统中,在进行样本数据集训练时,将样本数据集中样本数据合理分成若干部分,发放到若干服务器和计算主机进行并行训练,训练完成后将若干服务器和计算主机上的结构汇总成训练结果,有效的提高效率,同时在样本数据量巨大分布式系统无法负载时,只需要在分布式系统中接入运算主机扩展运算量和存储量以承载大数据量计算,而复发监测模型的精度依赖于样本数据的充足,分布式系统为其提供了实现的硬件支持。
所述模型监测应用模块4为安装有输入患者病症数据信息和生活数据信息的登录门户的智能终端设备,所述登录门户为网页、软件APP或小程序,所述模型监测应用模块4与复发监测模型建立模块3通过网络通信进行数据交换和业务交互,患者或医院可将接入复发监测模型的登录门户安装到患者使用的智能手机或医院就诊电脑中,用以便于患者和医生输入患者的病症数据信息和生活数据信息,实现商用和民用。
所述追踪核实模块5定期向使用登录门户具有访问监测预测复发记录的患者发送核实问卷以获得真实的患者复发情况。
为了进一步理解在Logistic回归模型基础上训练样本数据获得复发监测模型的过程,以下进行详细描述:
假设样本数据如下表所示:
Figure BDA0002757685590000121
预处理:
T1、T2采用年月日计数制,比如2020年1月20日,该数据项之间相差较大且不集中,采用归一化处理;
血糖、血压、体重、饮食、心率:N、M、L、O和Q,都采用数字表示比如体重60kg,取数字60作为N,该数据项之间相差较小且集中,采用标准化处理;
患病程度、康复程度:轻/重、良好/恶劣,直接用1/0表示。
划分训练数据集和测试数据集:采用B1、B2和B3中任一中方法获得S_train,S_test。
在Logistic回归基础上训练预测模型:
Logistic回归模型中训练同样需要两个参数,一个使特征值,另一个使结果值,而S_train中的数据特征值不唯一,因此首先需要对所有特征值的组合进行降维处理,如下:
S_train(初病时间、患病程度、康复程度、血糖、血压、体重、饮食、心率)降维成X_S_train,
S_train(复发时间)作为Y_S_train,
训练数据集样本数据转变为下表:
Figure BDA0002757685590000122
计算公式为:n为样本总数
Logistic函数:
Figure BDA0002757685590000131
Logistic的概率分布:hθ(x)=g(θ01x+θ2x…)
损失函数:
Figure BDA0002757685590000132
Figure BDA0002757685590000133
求解最小化的J(θ)下的模型参数,从而最终获得复发监测模型,而后只需要向模型中输入特征值,而后在运用到患者脑卒中复发预测场景中时,输入患者的各种特征值:初病时间、患病程度、康复程度、血糖、血压、体重、饮食、心率,经过复发监测模型后输出患者复发时间,用于提醒患者进行医疗预警。
在完成模型训练后,采用测试数据集进行评价;
测试数据集如下表:
Figure BDA0002757685590000134
如图2所示,基于以上脑卒中复发监测模型,本发明提出一种监测方法,包括以下步骤:
S100、脑卒中数据采集模块多维度采集若干曾患脑卒中患者的病症数据信息和生活数据信息,并将采集到的若干份包含所述病症数据信息和生活数据信息病例数据传输到脑卒中数据处理模块;
S200、脑卒中数据处理模块对来自脑卒中数据采集模块的若干份病例数据量化成样本数据集,将样本数据集传输到复发监测模型建立模块用以建立复发监测模型;
S300、复发监测模型建立模块对样本数据集中的由病症数据信息和生活数据信息量化而来的样本数据集分成训练数据集和测试数据集,在训练数据集上进行预测训练,训练完成后用测试数据集验证预测复发的准确性,并持续优化模型直至准确性达到规定阈值,生成最佳复发监测模型,并接收模型监测应用模块输入的患者的病症数据信息和生活数据信息,经过复发监测模型进行监测运算将当前患者复发结果反馈到模型检测应用模块,;
S400、模型监测应用模块根据输入的当前患者的病症数据信息和生活数据信息,并将病症数据信息和生活数据信息上传到复发监测模型建立模块,并接收复发监测模型建立模块反馈的当前患者复发结果并生成报告供患者查询;
S500、追踪核实模块对模型监测应用模块的预测的患者进行追踪访问,用以获得患者真实的复发结果,并将真实的复发结果和预测的复发结果相比对获得复发监测模型在真实场景中的应用情况,并根据复发监测模型在真实场景中的应用情况对脑卒中数据采集模块中采集的患者病症数据信息和生活信息进行调整以更新影响预测复发结果的特征,进一步进行模型更新换代。
本发明利用各医院脑卒中患者数据库存储服务器和患者日常生命体征监测终端设备采集到大量的病例数据,并将病例数据量化成样本数据集用作对患者复发监测模型的建立,复发监测模型可以根据患者的病症数据信息和生活数据信息预测处患者复发脑卒中的可能性,该模型建立在对真实患者病例数据进行大数据分析,从而预测结果真实可靠,避免医生人为预测的随机性;患者或医生用户只需要将患者的病症数据信息和生活数据信息输入到安装有登录门户的智能终端即可利用复发监测模型对患者进行复发预测,简单高效,并且患者可实时对自身进行复发预测消除恐惧心理,因此复发监测模型有效的减轻了医疗负担。
以上实施例仅为本申请的示例性实施例,不用于限制本申请,本申请的保护范围由权利要求书限定。本领域技术人员可以在本申请的实质和保护范围内,对本申请做出各种修改或等同替换,这种修改或等同替换也应视为落在本申请的保护范围内。

Claims (8)

1.一种脑卒中复发监测模型,其特征在于:包括
脑卒中数据采集模块(1),用于多维度采集若干曾患脑卒中患者的病症数据信息和生活数据信息,并将采集到的若干份包含所述病症数据信息和生活数据信息病例数据传输到脑卒中数据处理模块(2);
脑卒中数据处理模块(2),用于对来自脑卒中数据采集模块(1)的若干份病例数据量化成样本数据集,将样本数据集传输到复发监测模型建立模块(3)用以建立复发监测模型;
复发监测模型建立模块(3),用于对样本数据集中的由病症数据信息和生活数据信息量化而来的样本数据集分成训练数据集和测试数据集,在训练数据集上进行预测训练,训练完成后用测试数据集验证预测复发的准确性,并持续优化模型直至准确性达到规定阈值,生成最佳复发监测模型,并接收模型监测应用模块(4)输入的患者的病症数据信息和生活数据信息,经过复发监测模型进行监测运算将当前患者复发结果反馈到模型检测应用模块,;
模型监测应用模块(4),用于根据输入的当前患者的病症数据信息和生活数据信息,并将病症数据信息和生活数据信息上传到复发监测模型建立模块(3),并接收复发监测模型建立模块(3)反馈的当前患者复发结果并生成报告供患者查询;
追踪核实模块(5),用于对模型监测应用模块(4)的预测的患者进行追踪访问,用以获得患者真实的复发结果,并将真实的复发结果和预测的复发结果相比对获得复发监测模型在真实场景中的应用情况,并根据复发监测模型在真实场景中的应用情况对脑卒中数据采集模块(1)中采集的患者病症数据信息和生活信息进行调整以更新影响预测复发结果的特征,进一步进行模型更新换代。
2.根据权利要求1所述的一种脑卒中复发监测模型,其特征在于:所述脑卒中数据采集模块(1)包括各医院脑卒中患者数据库存储服务器和患者日常生命体征监测终端设备,所述各医院脑卒中患者数据库存储服务器用以采集病症数据信息,患者日常生命体征监测终端设备用以采集生活数据信息,所述脑卒中数据采集模块(1)采集病症数据信息和生活数据信息的过程为:
步骤一:随机在各医院的脑卒中患者数据库服务器中抽取总数为N的患者,获得N份病症数据信息;
步骤二:将生命体征监测终端设备分配到步骤一中抽取的N个患者,用以收集获得N份与病症数据信息一一对应的生活数据信息;
步骤三:将N份包含病症数据信息和生活数据信息的病例数据通过网络通信传输到脑卒中数据处理模块(2)。
3.根据权利要求2所述的一种脑卒中复发监测模型,其特征在于:所述脑卒中数据处理模块(2)将来自于脑卒中数据采集模块(1)的病例数据量化成样本数据集的具体过程为
步骤一:将病例数据中所有的用文字描述属性特征量化成数字描述;
步骤二:对完成特征量化的病例数据进行数据预处理,预处理包括数据清洗和特征规范化:
A1:数据清洗包括重复项处理、缺失项处理和异常项处理,具体方式如下:
重复项处理:遍历N个病例数据,将N个病例数据中所有重复数据进行删除到仅保留一条数据,确保N个病例数据中的所有数据均具有唯一性;
缺失项处理:将N个病例数据中具有缺失项的数据全部单独提取出来,可对具有缺失项的数据进行删除,或按照N个病例数据中所有数据在此项处的平均值、众值和中位值进行填充,或-1或Null填充,将其补充成完整性数据回归到N个病例数据中;
异常项处理:将N个病例数据中具有异常项的数据全部单独提取出来,可对具有异常项的数据进行删除,或按照N个病例数据中所有数据在此项处的平均值、众值和中位值替代异常项,或-1或Null填充,将其补充成正常数据回归到N个病例数据中;
A2:特征规范化包括归一化和标准化,具体方式如下:
归一化:将原始相差较大的数据项映射到[0,1]范围内,假设数据项为X,该项最大值为Xmax,最小值为Xmin,则映射后的数据项标记为X2=(X-Xmin)/(Xmax-Xmin);归一化在数据量小的N个病例数据上表现更佳;
标准化:将原始数据变化的均值为0,标准差为1的范围内,假设数据项为X,该项的平均值为Xmean,标准差为σ,则映射后的数据项标记为X2=(X-Xmean)/σ;标准化在数据量大的N个病例数据上表现更佳;
步骤三:将经过数据预处理的病例数据汇集形成一个样本总量为N的样本数据集。
4.根据权利要求3所述的一种脑卒中复发监测模型,其特征在于:所述复发监测模型建立模块(3)建立复发监测模型的过程为:
步骤一:将预处理后的数据集分成两个数据集分别为训练数据集和测试数据集:
假设样本数据集标记为S,测试数据集标记为S_test,训练数据集标记为S_train;
步骤二:对训练数据集进行样本数据训练,训练后的模型运用到测试数据集上获得预测结果:
在Logistic回归模型基础上训练复发监测模型,获得依据患者病症数据信息和生活数据信息预测患者在未来复发的可能性;
具体步骤为:
选择一个合适的预测函数,标记为h函数,h函数为分类函数,用于预测输入训练数据集的复发判断结果;
构造一个Cost函数(损失函数),用于表示预测的输出(h)与训练数据类别(y)之间的偏差,综合考虑所有训练数据的“损失”,将Cost求和或者求平均,记为J(θ)函数,表示所有训练数据集预测值与实际值的偏差;
J(θ)函数的值越小表示预测函数越准确(即h函数越准确),求解J(θ)函数的最小值,确定预测函数h以确定复发监测模型;
步骤三:通过测试数据集的预测结果和真实结果相比对,计算模型评价指标衡量模型预测复发的准确率,标记为P;
步骤四:将预测复发的准确率与规定阈值标记为Q相比较,若P<Q,对复发监测模型进行参数调优,若P>Q,终止对复发监测模型进行参数调优过程,以当前参数带入生成最佳复发监测模型。
5.根据权利要求4所述的一种脑卒中复发监测模型,其特征在于:所述脑卒中数据处理模块(2)和复发监测模型建立模块(3)位于由若干服务器和计算主机构建而成的分布式数据处理系统中。
6.根据权利要求5所述的一种脑卒中复发监测模型,其特征在于:所述模型监测应用模块(4)为安装有输入患者病症数据信息和生活数据信息的登录门户的智能终端设备,所述登录门户为网页、软件APP或小程序,所述模型监测应用模块(4)与复发监测模型建立模块(3)通过网络通信进行数据交换和业务交互。
7.根据权利要求6所述的一种脑卒中复发监测模型,其特征在于:所述追踪核实模块(5)定期向使用登录门户具有访问监测预测复发记录的患者发送核实问卷以获得真实的患者复发情况。
8.一种根据权利要求1-7任一项所述脑卒中复发监测模型的监测方法,其特征在于,包括以下步骤:
S100、脑卒中数据采集模块(1)多维度采集若干曾患脑卒中患者的病症数据信息和生活数据信息,并将采集到的若干份包含所述病症数据信息和生活数据信息病例数据传输到脑卒中数据处理模块(2);
S200、脑卒中数据处理模块(2)对来自脑卒中数据采集模块(1)的若干份病例数据量化成样本数据集,将样本数据集传输到复发监测模型建立模块(3)用以建立复发监测模型;
S300、复发监测模型建立模块(3)对样本数据集中的由病症数据信息和生活数据信息量化而来的样本数据集分成训练数据集和测试数据集,在训练数据集上进行预测训练,训练完成后用测试数据集验证预测复发的准确性,并持续优化模型直至准确性达到规定阈值,生成最佳复发监测模型,并接收模型监测应用模块(4)输入的患者的病症数据信息和生活数据信息,经过复发监测模型进行监测运算将当前患者复发结果反馈到模型检测应用模块,;
S400、模型监测应用模块(4)根据输入的当前患者的病症数据信息和生活数据信息,并将病症数据信息和生活数据信息上传到复发监测模型建立模块(3),并接收复发监测模型建立模块(3)反馈的当前患者复发结果并生成报告供患者查询;
S500、追踪核实模块(5)对模型监测应用模块(4)的预测的患者进行追踪访问,用以获得患者真实的复发结果,并将真实的复发结果和预测的复发结果相比对获得复发监测模型在真实场景中的应用情况,并根据复发监测模型在真实场景中的应用情况对脑卒中数据采集模块(1)中采集的患者病症数据信息和生活信息进行调整以更新影响预测复发结果的特征,进一步进行模型更新换代。
CN202011207792.1A 2020-11-03 2020-11-03 一种脑卒中复发监测系统 Active CN112331349B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011207792.1A CN112331349B (zh) 2020-11-03 2020-11-03 一种脑卒中复发监测系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011207792.1A CN112331349B (zh) 2020-11-03 2020-11-03 一种脑卒中复发监测系统

Publications (2)

Publication Number Publication Date
CN112331349A true CN112331349A (zh) 2021-02-05
CN112331349B CN112331349B (zh) 2023-04-07

Family

ID=74324463

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011207792.1A Active CN112331349B (zh) 2020-11-03 2020-11-03 一种脑卒中复发监测系统

Country Status (1)

Country Link
CN (1) CN112331349B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113270196A (zh) * 2021-05-25 2021-08-17 郑州大学 一种脑卒中复发风险感知与行为决策模型构建系统及方法
CN113808747A (zh) * 2021-10-11 2021-12-17 南昌大学第二附属医院 一种缺血性脑卒中复发预测方法
CN115662637A (zh) * 2022-11-08 2023-01-31 一选(浙江)医疗科技有限公司 一种脑中风复发预警系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109670510A (zh) * 2018-12-21 2019-04-23 万达信息股份有限公司 一种基于深度学习的胃镜活检病理数据筛查系统和方法
CN111081377A (zh) * 2020-01-16 2020-04-28 四川大学 一种坏死性急性胰腺炎患者手术时机预测模型
CN111105877A (zh) * 2019-12-24 2020-05-05 郑州科技学院 基于深度置信网络的慢性病精确干预方法及系统
CN111261277A (zh) * 2018-11-30 2020-06-09 上海图灵医疗科技有限公司 一种基于深度学习模型的心脏疾病的检测方法
CN111297366A (zh) * 2018-12-12 2020-06-19 中国科学院软件研究所 基于日常生活用品的辅助疾病诊断的数据处理方法和诊断装置
CN111430029A (zh) * 2020-03-24 2020-07-17 浙江达美生物技术有限公司 基于人工智能的多维度脑卒中预防筛查方法
CN111863276A (zh) * 2020-07-21 2020-10-30 集美大学 利用细粒度数据的手足口病预测方法、电子设备及介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111261277A (zh) * 2018-11-30 2020-06-09 上海图灵医疗科技有限公司 一种基于深度学习模型的心脏疾病的检测方法
CN111297366A (zh) * 2018-12-12 2020-06-19 中国科学院软件研究所 基于日常生活用品的辅助疾病诊断的数据处理方法和诊断装置
CN109670510A (zh) * 2018-12-21 2019-04-23 万达信息股份有限公司 一种基于深度学习的胃镜活检病理数据筛查系统和方法
CN111105877A (zh) * 2019-12-24 2020-05-05 郑州科技学院 基于深度置信网络的慢性病精确干预方法及系统
CN111081377A (zh) * 2020-01-16 2020-04-28 四川大学 一种坏死性急性胰腺炎患者手术时机预测模型
CN111430029A (zh) * 2020-03-24 2020-07-17 浙江达美生物技术有限公司 基于人工智能的多维度脑卒中预防筛查方法
CN111863276A (zh) * 2020-07-21 2020-10-30 集美大学 利用细粒度数据的手足口病预测方法、电子设备及介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
曾大军;戴汝为;王飞跃;毛文吉;王全意;: "传染病信息学和症状监测" *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113270196A (zh) * 2021-05-25 2021-08-17 郑州大学 一种脑卒中复发风险感知与行为决策模型构建系统及方法
CN113808747A (zh) * 2021-10-11 2021-12-17 南昌大学第二附属医院 一种缺血性脑卒中复发预测方法
CN113808747B (zh) * 2021-10-11 2023-12-26 南昌大学第二附属医院 一种缺血性脑卒中复发预测方法
CN115662637A (zh) * 2022-11-08 2023-01-31 一选(浙江)医疗科技有限公司 一种脑中风复发预警系统

Also Published As

Publication number Publication date
CN112331349B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN112331349B (zh) 一种脑卒中复发监测系统
Souri et al. A new machine learning-based healthcare monitoring model for student’s condition diagnosis in Internet of Things environment
CN108197737A (zh) 一种建立医保住院费用预测模型的方法及系统
Yue et al. Fusing location data for depression prediction
CN104158914A (zh) 面向家庭的远程尿液检测与健康咨询服务系统及方法
CN105808906B (zh) 患者个人特性的分析方法及其装置
CN112233736B (zh) 一种知识库的构建方法和系统
CN114639479A (zh) 一种基于医疗知识图谱的智能诊断辅助系统
Folino et al. A comorbidity-based recommendation engine for disease prediction
CN112185558A (zh) 基于深度学习的心理健康及康复评定方法、装置及介质
CN116631564B (zh) 一种急诊电子病历管理系统及管理方法
Zhang et al. Construction of a smart management system for physical health based on IoT and cloud computing with big data
CN112486767A (zh) 云资源的智能监控方法、系统、服务器以及存储介质
Harish Padmanaban et al. Developing a Cognitive Learning and Intelligent Data Analysis‐Based Framework for Early Disease Detection and Prevention in Younger Adults with Fatigue
Yothapakdee et al. Improving the efficiency of machine learning models for predicting blood glucose levels and diabetes risk
Folino et al. A recommendation engine for disease prediction
Verma et al. Machine learning and IoT‐based model for patient monitoring and early prediction of diabetes
CN117854745A (zh) 一种智能健康管理系统、方法、设备及介质
CN112151174A (zh) 一种基于体检数据的用户健康信息分析方法、系统
CN113642669B (zh) 基于特征分析的防欺诈检测方法、装置、设备及存储介质
Manashty et al. A concise temporal data representation model for prediction in biomedical wearable devices
CN110189829A (zh) 一种电力职业人群重大慢性病风险评估方法及系统
CN114649071A (zh) 一种基于真实世界数据的消化性溃疡治疗方案的预测系统
Ying et al. Nursing scheme based on back propagation neural network and probabilistic neural network in chronic kidney disease
US20220254459A1 (en) Data processing method, data processing device, computing device and computer readable storage medium

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant