CN114613465A - 一种脑卒中患病风险预测和个性化治疗推荐方法及系统 - Google Patents

一种脑卒中患病风险预测和个性化治疗推荐方法及系统 Download PDF

Info

Publication number
CN114613465A
CN114613465A CN202210242873.8A CN202210242873A CN114613465A CN 114613465 A CN114613465 A CN 114613465A CN 202210242873 A CN202210242873 A CN 202210242873A CN 114613465 A CN114613465 A CN 114613465A
Authority
CN
China
Prior art keywords
stroke
data
treatment recommendation
personalized treatment
risk prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210242873.8A
Other languages
English (en)
Inventor
张志洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lingnan Normal University
Original Assignee
Lingnan Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lingnan Normal University filed Critical Lingnan Normal University
Priority to CN202210242873.8A priority Critical patent/CN114613465A/zh
Publication of CN114613465A publication Critical patent/CN114613465A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明提出一种脑卒中患病风险预测和个性化治疗推荐方法及系统,包括收集脑卒中筛查对象的生理特征信息和生活数据信息,并将生理特征信息和生活数据信息输入基于极限学习机算法的脑卒中患病风险预测模型和基于决策树算法的个性化治疗推荐模型;脑卒中患病风险预测模型输出脑卒中患病风险预测结果,个性化治疗推荐模型输出个性化治疗推荐方案。解决了多维度的生理特征信息和生活数据信息数据存在的稀疏和不平衡问题,降低了脑卒中患病风险的预测时间并提高了预测准确率,得到准确的个性化治疗推荐方案。

Description

一种脑卒中患病风险预测和个性化治疗推荐方法及系统
技术领域
本发明涉及深度学习领域,更具体地,涉及一种脑卒中患病风险预测和个性化治疗推荐方法及系统。
背景技术
目前脑卒中是我国致死和致残率最高的慢性疾病。由于患脑卒中后具有不可逆、难以痊愈和护理费用高等特性,医疗负担呈现日益增长趋势,因此脑卒中的早期预防和诊断尤为重要,如何准确地预测脑卒中早期患病风险也成为了一项重要的课题。
脑卒中早期患病风险预测研究一般是应用传统的统计学方法,对危险因素与疾病发病之间关系进行线性拟合,再对疾病发病危险进行量化分级,从而开展脑卒中及高风险人群的健康管理。然而,脑卒中的早期诊断和个性化治疗推荐都需要采集多元化多维度的医疗数据以增加患者患病风险预测和就医推荐的准确性,随着数据量的不断增加,数据集将呈现出大规模、超高维、不平衡和稀疏性等特点,导致患病风险预测模型耗时长以及预测准确率低的缺陷。
发明内容
本发明为解决现有脑卒中患病风险预测方法存在的预测耗时长以及预测准确率低,且无法作出有效和准确脑卒中个性化治疗推荐方案的缺陷,提供一种脑卒中患病风险预测和个性化治疗推荐方法及系统。
为解决上述技术问题,本发明的技术方案如下:
第一个方面,本发明提出一种脑卒中患病风险预测方法,包括以下步骤:
建立基于极限学习机算法的脑卒中患病风险预测模型。
收集脑卒中筛查对象的生理特征信息和生活数据信息,利用所述生理特征信息和生活数据信息构建脑卒中数据库。
将所述脑卒中数据库中的数据输入所述脑卒中患病风险预测模型,所述脑卒中患病风险预测模型输出脑卒中患病风险预测结果。
作为优选方案,所述基于极限学习机算法的脑卒中患病风险预测模型的表达式如下所示:
Figure BDA0003543350320000021
其中,f(xi)表示脑卒中患病风险预测结果,xi表示输入的第i个数据,L表示隐含层中节点的个数,β表示网络的输出权重,G(·)表示激活函数,w表示网络的输入权重,bj表示第j个隐含层的阈值;,h(xi)表示隐含层的输出,T表示矩阵转置,
Figure BDA0003543350320000022
表示隐含层的输出矩阵,C表示输出权重和误差之间的差值,S表示每个数据的模糊权值,S的取值范围表示(0,1),n表示输入数据的总数。
作为优选方案,构建脑卒中数据库后,还包括对脑卒中数据库中的数据进行预处理,包括:
步骤A:采用Z-scores方法对数据进行归一化处理,其表达式如下所示:
X′=(X-Mean)/(Sdv)
其中,X表示单个数据的观测值,Mean表示数据的均值,Sdv表示数据的标准差;
步骤B:对数据的缺失值进行清洗,具体包括以下步骤:
步骤B-1:以同一指标的计算结果,采用随机森林算法对重要性高和缺失率低的数据字段的缺失值进行预测和填充;所述以同一指标的计算结果包括数据的均值、中位数和众数;
步骤B-2:删除重要性低和缺失率高的数据字段。
作为优选方案,构建脑卒中数据库的过程中,将所述生理特征信息和生活数据信息通过网络传输至Spark平台,构建Hbase脑卒中数据库。
作为优选方案,所述预测方法还包括使用量子萤火虫算法对脑卒中患病风险预测模型进行优化,具体包括以下步骤:
对脑卒中患病风险预测模型的输入权重和隐含层的阈值进行编码操作,分别得到输入权重的编码和隐含层的阈值的编码;
使用量子萤火虫算法对所述输入权重的编码和所述隐含层的阈值的编码进行迭代优化,得到优化后的脑卒中患病风险预测模型的输入权重和隐含层的阈值。
作为优选方案,所述脑卒中筛查对象的生理特征信息包括:年龄、性别、体重、心率、血压、体温、腹形状况、精神状况、高血压史、脑卒中病史、糖尿病史、心脏病史、吸烟史、饮酒史、高同型半胱氨酸症史、高脂血史、高尿酸史、动脉硬化史动脉狭窄史、动脉闭塞史、足部水肿情况、贫血、白细胞计数、红细胞计数、血小板计数、中性粒细胞数、总胆固醇、甘油三酯数值、高密度脂蛋白数值、低密度脂蛋白数值、血肌酐数值、血糖数值、白蛋白数值、同型半胱氨酸数值、钠数值和钾数值。
所述脑卒中筛查对象的生活数据信息包括:职业、家庭住址、饮食状况、睡眠状况、运动频率和运动热点位置。
第二个方面,本发明提出一种个性化治疗推荐方法,包括以下步骤:
建立基于极限学习机算法的脑卒中患病风险预测模型;
收集脑卒中筛查对象的生理特征信息和生活数据信息,利用所述生理特征信息和生活数据信息构建脑卒中数据库;
将所述脑卒中数据库中的数据输入所述脑卒中患病风险预测模型,所述脑卒中患病风险预测模型输出脑卒中患病风险预测结果;
建立基于决策树算法的个性化治疗推荐模型,将所述脑卒中患病风险预测结果和脑卒中数据库中的数据输入所述个性化治疗推荐模型,所述个性化治疗推荐模型输出个性化治疗推荐方案。
作为优选方案,基于决策树算法的个性化治疗推荐模型输出个性化治疗推荐方案的步骤包括:
利用脑卒中数据库中的数据和脑卒中患病风险预测结果构建个性化治疗推荐数据集D,将个性化治疗推荐数据集D作为个性化治疗推荐模型的输入;
设个性化治疗推荐数据集D中第k类数据特征所占的比例为pk,n为数据个数,则将个性化治疗推荐数据集D的模糊信息熵定义为
Figure BDA0003543350320000031
设个性化治疗推荐数据集D中某特征d有v个可能的取值,则特征d的取值集合记为Dv={d1,d2,...,dv};用特征d对个性化治疗推荐数据集D进行划分所获得的信息增益Gain(D,d),其表达式如下所示:
Figure BDA0003543350320000032
根据信息增益Gain(D,d),选出若干个最优数据特征,得到最优特征数据集Dbest,并计算Dbest中不同推荐类别特征之间的相似度关系;其中,所述推荐类别特征包括医院医生推荐特征集G=(g1,g2,...,gl)和健康常识推荐特征集H=(h1,h2,...,hl),所述相似度关系计算公式如下所示:
Figure BDA0003543350320000041
其中
Figure BDA0003543350320000042
表示医院医生推荐特征取值的平均值,
Figure BDA0003543350320000043
表示健康常识推荐特征取值的平均值,gl表示第l个医院医生推荐特征的取值,hl表示第l个健康常识推荐特征的取值个数。
根据相似度关系计算结果,将最大相似度计算值的对应推荐特征类别发送给用户,从而获得最佳的个性化治疗推荐方案。
作为优选方案,在个性化治疗推荐模型输出个性化治疗推荐方案之后,使用混淆矩阵方法、基于医学指南的统计学方法和用户调查问卷方法对所述脑卒中患病风险预测模型和所述个性化治疗推荐模型进行评估。
第三个方面,本发明还提出一种脑卒中患病风险预测和个性化治疗推荐系统,应用于上述方案所述的脑卒中患病风险预测方法和个性化治疗推荐方法,包括数据采集模块、脑卒中数据库、基于极限学习机算法的脑卒中患病风险预测网络和基于决策树算法的个性化治疗推荐网络。
所述数据采集模块收集脑卒中筛查对象的生理特征信息和生活数据信息,并将所述生理特征信息和所述生活数据信息存储到所述脑卒中数据库。
将所述脑卒中数据库中的数据输入所述脑卒中患病风险预测网络,脑卒中患病风险预测网络输出脑卒中患病风险预测结果;将所述脑卒中患病风险预测结果和脑卒中数据库中的数据输入所述个性化治疗推荐模型,个性化治疗推荐模型输出个性化治疗推荐方案。
与现有技术相比,本发明技术方案的有益效果是:采用基于极限学习机算法构建脑卒中患病风险预测模型和基于决策树算法的个性化治疗推荐模型,能够针对生理特征信息和生活数据信息数据具有的非线性和超高维特征的特点,解决超高维度的生理特征信息和生活数据信息数据存在的稀疏和不平衡问题,降低脑卒中患病风险的预测时间并提高预测准确率,并得到准确的个性化治疗推荐方案。
附图说明
图1为脑卒中患病风险预测方法的流程图。
图2为个性化治疗推荐方法的流程图。
图3为脑卒中患病风险预测和个性化治疗推荐系统的架构图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
请参阅图1,本实施例提出一种脑卒中患病风险预测方法,包括以下步骤:
建立基于极限学习机算法的脑卒中患病风险预测模型。
收集脑卒中筛查对象的生理特征信息和生活数据信息,利用所述生理特征信息和生活数据信息构建脑卒中数据库。
将所述脑卒中数据库中的数据输入所述脑卒中患病风险预测模型,所述脑卒中患病风险预测模型输出脑卒中患病风险预测结果。
在具体实施过程中,将包括脑卒中筛查对象的生理特征信息和生活数据信息的脑卒中相关数据输入脑卒中患病风险预测模型,脑卒中患病风险预测模型输出脑卒中患病风险预测结果,所述脑卒中患病风险预测结果包括高危、中危和低危三种患病风险等级。针对多维度的生理特征信息和生活数据信息数据具有的非线性和超高维特征,以及不平衡和稀疏性的特点,以及普通算法收敛速度慢和容易产生局部最优的问题,采用基于运算速度快和性能佳的极限学习机算法构建脑卒中患病风险预测模型能够降低脑卒中患病风险的预测时间并提高预测准确率,帮助具有脑卒中患病风险人群及时了解自身身体状况,实现对新发脑卒中人群发出风险预警,降低脑卒中发病几率,提高生存几率。
实施例2
本实施例在实施例1提出的脑卒中患病风险预测方法的基础上作出改进。
本实施例中,所述脑卒中筛查对象的生理特征信息和生活数据信息从筛查对象的电子病历数据、体检和检验数据、随访数据和智能穿戴设备数据中获取,所述生理特征信息和生活数据信息均有定性指标的描述和定量指标的描述;所述定性指标的描述以“是”和“否”记录结果,所述定量指标的描述以具体数值为记录结果。
本实施例中,所述筛查对象的电子病历数据、体检和检验数据、随访数据和智能穿戴设备数据从智能穿戴设备、移动端和PC端程序软件导入,并从中筛选出脑卒中筛查对象的生理特征信息和生活数据信息。将生理特征信息和生活数据信息通过网络传输至大数据平台,构建Hbase脑卒中数据库,所述大数据平台以Hadoop分布式文件系统和Spark平台为核心,可以最大化保证脑卒中数据的开放性和安全性,实现计算和存储的高度耦合。
本实施例中,对存储在Hbase脑卒中数据库进行预处理,具体包括以下步骤:
步骤A:采用Z-scores方法对数据进行归一化处理,其表达式如下所示:
X′=(X-Mean)/(Sdv)
其中,X表示单个数据的观测值,Mean表示数据的均值,Sdv表示数据的标准差。
步骤B:对数据的缺失值进行清洗,具体包括以下步骤:
步骤B-1:以同一指标的计算结果,采用随机森林算法对重要性高和缺失率低的数据字段的缺失值进行预测和填充;所述以同一指标的计算结果包括数据的均值、中位数和众数。随机森林是一种集成算法,其中分类标准由一组独立的决策树组成。本实施例中,将每颗决策树视为数据样本的子集,并将决策树的每个节点随机选取175次,以降低决策树之间的相关性,从而降低错误率。为了分割每个节点杂质最低的特征,采用Gini准则数据选取,其表达式如下所示:
Figure BDA0003543350320000061
其中,pk表示某数据样本属于第k类数据的概率。
在每个数据样本都得到标签后,通过采用多数投票法对180个预测无标签的数据样本进行投票。然后使用网格搜索来优化随机森林算法的超参数,并通过K-fold交叉验证来评估对数据的字段的缺失值进行预测和填充的质量。
步骤B-2:删除重要性低和缺失率高的数据字段。
本实施例中,经过预处理之后的脑卒中数据包括脑卒中筛查对象的生理特征信息和生活数据信息,所述生理特征信息包括:年龄、性别、体重、心率、血压、体温、腹形状况、精神状况、高血压史、脑卒中病史、糖尿病史、心脏病史、吸烟史、饮酒史、高同型半胱氨酸症史、高脂血史、高尿酸史、动脉硬化史动脉狭窄史、动脉闭塞史、足部水肿情况、贫血、白细胞计数、红细胞计数、血小板计数、中性粒细胞数、总胆固醇、甘油三酯数值、高密度脂蛋白数值、低密度脂蛋白数值、血肌酐数值、血糖数值、白蛋白数值、同型半胱氨酸数值、钠数值和钾数值。所述生活数据信息包括:职业、家庭住址、饮食状况、睡眠状况、运动频率和运动热点位置。本实施例将60%脑卒中数据作为训练集,40%脑卒中数据作为测试集,使用十字交叉验证方法对所述脑卒中患病风险预测模型和所述个性化治疗推荐模型进行调优。
本实施例中,所述基于极限学习机算法的脑卒中患病风险预测模型的表达式如下所示:
Figure BDA0003543350320000071
其中,f(xi)表示脑卒中患病风险预测结果,xi表示输入的第i个数据,L表示隐含层中节点的个数,β表示网络的输出权重,G(·)表示激活函数,w表示网络的输入权重,bj表示第j个隐含层的阈值;,h(xi)表示隐含层的输出,T表示矩阵转置,
Figure BDA0003543350320000072
表示隐含层的输出矩阵,C表示输出权重和误差之间的差值,S表示每个数据的模糊权值,S的取值范围表示(0,1),n表示输入数据的总数。
本实施例中,将存储在Spark平台中的Hbase脑卒中数据集作为极限学习机算法的输入值x,设置极限学习机算法的输入权值w和隐含层阈值b,隐含层节点个数L,激活函数为Sigmoid,收敛值c,并计算每个数据样本的模糊权重s。通过极限学习机算法的不断迭代运算后,输出值f(x)是脑卒中的患病风险等级,包括:高危、中危和低危三个等级。为了解决脑卒中数据不平衡问题,设置了数据的权重S。若数据x为少数类,则其权值S为
Figure BDA0003543350320000073
若数据x为多数类,则其权值S为
Figure BDA0003543350320000074
其中,f1为标签为1少数类数据的个数,f2为标签为0的多数类数据的个数。
实施例3
本实施例在实施例2提出的脑卒中患病风险预测方法的基础上作出改进。
本实施例中,使用量子萤火虫算法对脑卒中患病风险预测模型的输入权重w和隐含层阈值b进行优化,具体包括以下步骤:
步骤一:设置量子萤火虫算法的初始种群个数m,种群的寻优范围[ao,bo],o=1,2。[ao,bo]为第o个设计变量的寻优范围,ao为下界,bo为上界。在本实施例中两个设计变量的寻优范围均为[0,1]。
步骤二:对萤火虫进行编码,具体编码方法如下:
设每个萤火虫的位置空间为x={x1(t),x2(t),...,xi(t)},使用量子位编码方式进行编码,令xi(t)(0≤i≤n)为萤火虫个体的量子空间位置,每个萤火虫位置占据遍历空间中的两个位置,分别对应量子态|0>和|1>的概率幅,即:
xic(t)=cosθi1(t),cosθi2(t),...,cosθio(t)
xis(t)=sinθi1(t),sinθi2(t),...,sinθio(t)
其中,xic(t)为第i个萤火虫个体的余弦位置,i=1,...,n,n表示萤火虫个体的个体数量,xis(t)为第i个萤火虫个体的正弦位置,t表示迭代次数。
因此,萤火虫个体的量子空间位置编码为:
Figure BDA0003543350320000081
其中,t表示迭代次数,θ表示量子旋转门的旋转角,θio=2π·rand(),rand()为[0,1]上的均匀分布的随机函数。
步骤三:设置迭代次数t=1,计算每个萤火虫个体的目标函数,即每个萤火虫个体的适应度函数。所述目标函数由基于极限学习机算法的脑卒中患病风险预测模型的输出函数表示:
Figure BDA0003543350320000082
步骤四:在[au,bu]上生成xi(t)的反向解
Figure BDA0003543350320000083
因为f(xi)为适应度函数。若
Figure BDA0003543350320000084
则xi(t)为广义精英个体Ni(t);
Figure BDA0003543350320000085
则xi(t)为普通个体Qi(t)。广义精英反向解
Figure BDA0003543350320000086
的求解方法如下:
Figure BDA0003543350320000087
其中,xio为普通萤火虫个体xi在o维上的值,λ为介于0到1之间的随机数,ao(t)=min(N1o(t),N2o(t),...,Npo(t)),bo(t)=min(N1o(t),N2o(t),...,Npo(t)),[ao(t),bo(t)]表示广义精英群体的取值范围,i∈[1,n],o∈[1,O]。
记广义精英个体大小为p(p>1,i=1,2,...,p),p个精英个体表示为:
Figure BDA0003543350320000088
精英个体和普通群体的反向群体构成当前新种群,并计算萤火虫种群的发光亮度,进行排序,选出最优个体xbest(t),将xbest(t)=xio的萤火虫位置记录到标签集xlabel
进一步地,萤火虫种群的发光亮度的求法如下:
萤火虫的发光亮度随着距离光源的距离而减小,加上会被介质吸收,所以发光亮度s(r)的表达式为:
Figure BDA0003543350320000091
其中,s0表示最亮萤火虫的亮度,表示距离r=0时的光强,即发光亮度,可取目标函数值;α表示光吸收系数,是确定收敛速度的参数,一般α∈[0.01,100]。riu为萤火虫i和萤火虫u之间的距离,其计算公式如下所示:
Figure BDA0003543350320000092
式中l表示优化问题维数,vio表示第i只萤火虫第o维的位置。
步骤五:计算萤火虫位置移动操作,萤火虫i被亮度更大的萤火虫o吸引近而更新自己的位置,位置更新方法的表达式如下所示:
Figure BDA0003543350320000093
式中,rand()为[0,1]上的均匀分布的随机函数。η为正相关系数,可根据实际情况调整,即用ηriu代替固定步长,使得萤火虫的步长随着riu的变化而随机产生变化。φiu表示第u个萤火虫对第i个萤火虫的吸引力,
Figure BDA0003543350320000094
φ0表示riu=0处的最大吸引力。
步骤六:如果粒子超越寻优范围,则进行边界调整策略加快调整,否则执行步骤七。进行边界调整策略的表达式如下所示:
Figure BDA0003543350320000095
步骤七:计算位置更新后的群体中每个萤火虫个体的发光亮度。
步骤八:当达到设定的迭代次数时,停止运算。否则,转到步骤4重复操作直至满足结束条件。
步骤九:输出全局最优萤火虫位置xlabel和最优结果ylabel
步骤十:根据全局最优萤火虫位置xlabel和最优结果ylabel,得到优化后的脑卒中患病风险预测模型的输入权重w和隐含层阈值b,并计算加权极限学习机算法的输出函数值,完成基于极限学习机算法的脑卒中患病风险预测模型的构建。
实施例4
请参阅图2,本实施例提出一种个性化治疗推荐方法,包括以下步骤:
S1:收集脑卒中筛查对象的生理特征信息和生活数据信息,利用所述生理特征信息和生活数据信息构建脑卒中数据库。
S2:建立基于极限学习机算法的脑卒中患病风险预测模型,将所述脑卒中数据库中的数据输入所述脑卒中患病风险预测模型,脑卒中患病风险预测模型输出脑卒中患病风险预测结果。
S3:建立基于决策树算法的个性化治疗推荐模型,将脑卒中患病风险预测结果和脑卒中数据库中的数据输入所述个性化治疗推荐模型,个性化治疗推荐模型输出个性化治疗推荐方案。
在具体实施过程中,将包括脑卒中筛查对象的生理特征信息和生活数据信息的脑卒中相关数据输入脑卒中患病风险预测模型,脑卒中患病风险预测模型输出脑卒中患病风险预测结果,所述脑卒中患病风险预测结果包括高危、中危和低危三种患病风险等级。针对多维度的生理特征信息和生活数据信息数据具有的非线性和超高维特征,以及不平衡和稀疏性的特点,以及普通算法收敛速度慢和容易产生局部最优的问题,采用基于运算速度快和性能佳的极限学习机算法构建脑卒中患病风险预测模型能够降低脑卒中患病风险的预测时间并提高预测准确率,帮助具有脑卒中患病风险人群及时了解自身身体状况,实现对新发脑卒中人群发出风险预警,降低脑卒中发病几率,提高生存几率。采用基于决策树算法的个性化治疗推荐模型能够解决多维度的生理特征信息和生活数据信息数据存在的稀疏问题,得到准确的个性化治疗推荐方案,有利于缩短就医时间,提高就医效率以及提升生活质量。
实施例5
本实施例在实施例4提出的个性化治疗推荐方法的基础上作出改进。
本实施例中,基于决策树算法的个性化治疗推荐模型输出个性化治疗推荐方案的步骤包括:
利用脑卒中数据库中的数据和脑卒中患病风险预测结果构建个性化治疗推荐数据集D,将个性化治疗推荐数据集D作为个性化治疗推荐模型的输入;个性化治疗推荐数据集D包括运动热点位置、年龄、性别、职业、家庭住址、饮食状况、精神状况、个人偏好和患病风险预测结果
设个性化治疗推荐数据集D中第k类数据特征所占的比例为pk,n为数据个数,则将个性化治疗推荐数据集D的模糊信息熵定义为
Figure BDA0003543350320000111
设个性化治疗推荐数据集D中某特征d有v个可能的取值,则特征d的取值集合记为Dv={d1,d2,...,dv};用特征d对个性化治疗推荐数据集D进行划分所获得的信息增益Gain(D,d),其表达式如下所示:
Figure BDA0003543350320000112
根据信息增益Gain(D,d),选出运动热点位置、家庭住址、饮食状况、个人偏好和患病风险预测结果最优数据特征,得到最优特征数据集Dbest,并计算Dbest中不同推荐类别特征之间的相似度关系;其中,所述推荐类别特征包括医院医生推荐特征集G=(g1,g2,...,gl)和健康常识推荐特征集H=(h1,h2,...,hl);所述医院医生推荐特征集G包括运动热点位置、个人偏好和患病风险预测结果,所述健康常识推荐特征集H包括个人偏好,饮食状况,患病风险预测结果。所述相似度关系计算公式如下所示:
Figure BDA0003543350320000113
其中
Figure BDA0003543350320000114
表示医院医生推荐特征取值的平均值,
Figure BDA0003543350320000115
表示健康常识推荐特征取值的平均值,gl表示第l个医院医生推荐特征的取值,hl表示第l个健康常识推荐特征的取值个数。
根据相似度关系计算结果,将最大相似度计算值的对应推荐特征类别发送给用户,从而获得最佳的个性化治疗推荐方案。
本实施例中,使用混淆矩阵方法、基于医学指南的统计学法和用户调查问卷方法对所述脑卒中患病风险预测模型和所述个性化治疗推荐模型进行评估,得到评估结果:基于极限学习机算法的脑卒中患病风险预测模型中隐含层最优节点个数为13,模型预测精度为96.13%;基于决策树算法的个性化推荐模型的推荐精度为91.72%。
实施例6
请参阅图3,本实施例提出一种脑卒中患病风险预测和个性化治疗推荐系统应用于上述实施例提出的脑卒中患病风险预测和个性化治疗推荐方法,包括数据采集模块、脑卒中数据库、基于极限学习机算法的脑卒中患病风险预测网络和基于决策树算法的个性化治疗推荐网络。
在具体实施过程中,所述数据采集模块收集脑卒中筛查对象的生理特征信息和生活数据信息,并将所述生理特征信息和所述生活数据信息存储到所述脑卒中数据库。将所述脑卒中数据库中的数据输入所述脑卒中患病风险预测网络,脑卒中患病风险预测网络输出脑卒中患病风险预测结果;将所述脑卒中患病风险预测结果和脑卒中数据库中的数据输入所述个性化治疗推荐模型,个性化治疗推荐模型输出个性化治疗推荐方案。
筛查对象和医生等用户可以使用PC端程序软件和移动端软件将电子病历数据、体检和检验数据、随访数据和智能穿戴设备数据输入到脑卒中患病风险预测和个性化治疗推荐系统中,脑卒中患病风险预测和个性化治疗推荐系统将上述数据存储到大数据平台,并结合脑卒中患病风险预测模型和所述个性化治疗推荐模型对存储的数据进行分析挖掘,形成脑卒中患病风险预测结果和个性化治疗推荐方案,并从PC端和移动端程序软件实时输出医疗预警信息和诊疗建议。
附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (10)

1.一种脑卒中患病风险预测方法,其特征在于,包括以下步骤:
建立基于极限学习机算法的脑卒中患病风险预测模型;
收集脑卒中筛查对象的生理特征信息和生活数据信息,利用所述生理特征信息和生活数据信息构建脑卒中数据库;
将所述脑卒中数据库中的数据输入所述脑卒中患病风险预测模型,所述脑卒中患病风险预测模型输出脑卒中患病风险预测结果。
2.根据权利要求1所述的脑卒中患病风险预测方法,其特征在于,所述基于极限学习机算法的脑卒中患病风险预测模型的表达式如下所示:
Figure FDA0003543350310000011
其中,f(xi)表示脑卒中患病风险预测结果,xi表示输入的第i个数据,L表示隐含层中节点的个数,β表示网络的输出权重,G(·)表示激活函数,w表示网络的输入权重,bj表示第j个隐含层的阈值;,h(xi)表示隐含层的输出,T表示矩阵转置,
Figure FDA0003543350310000012
表示隐含层的输出矩阵,C表示输出权重和误差之间的差值,S表示每个数据的模糊权值,S的取值范围表示(0,1),n表示输入数据的总数。
3.根据权利要求1所述的脑卒中患病风险预测方法,其特征在于,构建脑卒中数据库后,还包括对脑卒中数据库中的数据进行预处理,包括:
步骤A:采用Z-scores方法对数据进行归一化处理,其表达式如下所示:
X′=(X-Mean)/(Sdv)
其中,X表示单个数据的观测值,Mean表示数据的均值,Sdv表示数据的标准差;
步骤B:对数据的缺失值进行清洗,具体包括以下步骤:
步骤B-1:以同一指标的计算结果,采用随机森林算法对重要性高和缺失率低的数据字段的缺失值进行预测和填充;所述以同一指标的计算结果包括数据的均值、中位数和众数;
步骤B-2:删除重要性低和缺失率高的数据字段。
4.根据权利要求1所述的脑卒中患病风险预测方法,其特征在于,构建脑卒中数据库的过程中,将所述生理特征信息和生活数据信息通过网络传输至Spark平台,构建Hbase脑卒中数据库。
5.根据权利要求1所述的脑卒中患病风险预测方法,其特征在于,所述预测方法还包括使用量子萤火虫算法对脑卒中患病风险预测模型进行优化,具体包括以下步骤:
对脑卒中患病风险预测模型的输入权重和隐含层的阈值进行编码操作,分别得到输入权重的编码和隐含层的阈值的编码;
使用量子萤火虫算法对所述输入权重的编码和所述隐含层的阈值的编码进行迭代优化,得到优化后的脑卒中患病风险预测模型的输入权重和隐含层的阈值。
6.根据权利要求1-5任一项所述的脑卒中患病风险预测方法,其特征在于,所述脑卒中筛查对象的生理特征信息包括:年龄、性别、体重、心率、血压、体温、腹形状况、精神状况、高血压史、脑卒中病史、糖尿病史、心脏病史、吸烟史、饮酒史、高同型半胱氨酸症史、高脂血史、高尿酸史、动脉硬化史动脉狭窄史、动脉闭塞史、足部水肿情况、贫血、白细胞计数、红细胞计数、血小板计数、中性粒细胞数、总胆固醇、甘油三酯数值、高密度脂蛋白数值、低密度脂蛋白数值、血肌酐数值、血糖数值、白蛋白数值、同型半胱氨酸数值、钠数值和钾数值;
所述脑卒中筛查对象的生活数据信息包括:职业、家庭住址、饮食状况、睡眠状况、运动频率和运动热点位置。
7.一种个性化治疗推荐方法,其特征在于,包括以下步骤:
建立基于极限学习机算法的脑卒中患病风险预测模型;
收集脑卒中筛查对象的生理特征信息和生活数据信息,利用所述生理特征信息和生活数据信息构建脑卒中数据库;
将所述脑卒中数据库中的数据输入所述脑卒中患病风险预测模型,所述脑卒中患病风险预测模型输出脑卒中患病风险预测结果;
建立基于决策树算法的个性化治疗推荐模型,将所述脑卒中患病风险预测结果和脑卒中数据库中的数据输入所述个性化治疗推荐模型,所述个性化治疗推荐模型输出个性化治疗推荐方案。
8.根据权利要求7所述的个性化治疗推荐方法,其特征在于,基于决策树算法的个性化治疗推荐模型输出个性化治疗推荐方案的步骤包括:
利用脑卒中数据库中的数据和脑卒中患病风险预测结果构建个性化治疗推荐数据集D,将个性化治疗推荐数据集D作为个性化治疗推荐模型的输入;
设个性化治疗推荐数据集D中第k类数据特征所占的比例为pk,n为数据个数,则将个性化治疗推荐数据集D的模糊信息熵定义为
Figure FDA0003543350310000031
设个性化治疗推荐数据集D中某特征d有v个可能的取值,则特征d的取值集合记为Dv={d1,d2,...,dv};用特征d对个性化治疗推荐数据集D进行划分所获得的信息增益Gain(D,d),其表达式如下所示:
Figure FDA0003543350310000032
根据信息增益Gain(D,d),选出若干个最优数据特征,得到最优特征数据集Dbest,并计算Dbest中不同推荐类别特征之间的相似度关系;其中,所述推荐类别特征包括医院医生推荐特征集G=(g1,g2,...,gl)和健康常识推荐特征集H=(h1,h2,...,hl),所述相似度关系计算公式如下所示:
Figure FDA0003543350310000033
其中
Figure FDA0003543350310000034
表示医院医生推荐特征取值的平均值,
Figure FDA0003543350310000035
表示健康常识推荐特征取值的平均值,gl表示第l个医院医生推荐特征的取值,hl表示第l个健康常识推荐特征的取值个数;
根据相似度关系计算结果,将最大相似度计算值的对应推荐特征类别发送给用户,从而获得最佳的个性化治疗推荐方案。
9.根据权利要求7所述的个性化治疗推荐方法,其特征在于,所述推荐方法还包括:在个性化治疗推荐模型输出个性化治疗推荐方案之后,使用混淆矩阵方法、基于医学指南的统计学方法和用户调查问卷方法对所述脑卒中患病风险预测模型和所述个性化治疗推荐模型进行评估。
10.一种脑卒中患病风险预测和个性化治疗推荐系统,其特征在于,包括数据采集模块、脑卒中数据库、基于极限学习机算法的脑卒中患病风险预测网络和基于决策树算法的个性化治疗推荐网络;
所述数据采集模块收集脑卒中筛查对象的生理特征信息和生活数据信息,并将所述生理特征信息和所述生活数据信息存储到所述脑卒中数据库;
将所述脑卒中数据库中的数据输入所述脑卒中患病风险预测网络,脑卒中患病风险预测网络输出脑卒中患病风险预测结果;
将所述脑卒中患病风险预测结果和脑卒中数据库中的数据输入所述个性化治疗推荐模型,个性化治疗推荐模型输出个性化治疗推荐方案。
CN202210242873.8A 2022-03-11 2022-03-11 一种脑卒中患病风险预测和个性化治疗推荐方法及系统 Pending CN114613465A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210242873.8A CN114613465A (zh) 2022-03-11 2022-03-11 一种脑卒中患病风险预测和个性化治疗推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210242873.8A CN114613465A (zh) 2022-03-11 2022-03-11 一种脑卒中患病风险预测和个性化治疗推荐方法及系统

Publications (1)

Publication Number Publication Date
CN114613465A true CN114613465A (zh) 2022-06-10

Family

ID=81862212

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210242873.8A Pending CN114613465A (zh) 2022-03-11 2022-03-11 一种脑卒中患病风险预测和个性化治疗推荐方法及系统

Country Status (1)

Country Link
CN (1) CN114613465A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116403714A (zh) * 2023-04-07 2023-07-07 大连市中心医院 脑卒中end风险预测模型建立方法、装置、end风险预测系统、电子设备及介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116403714A (zh) * 2023-04-07 2023-07-07 大连市中心医院 脑卒中end风险预测模型建立方法、装置、end风险预测系统、电子设备及介质
CN116403714B (zh) * 2023-04-07 2024-01-26 大连市中心医院 脑卒中end风险预测模型建立方法、装置、end风险预测系统、电子设备及介质

Similar Documents

Publication Publication Date Title
CN111292853B (zh) 基于多参数的心血管疾病风险预测网络模型及其构建方法
WO2021120936A1 (zh) 一种基于多任务学习模型的慢病预测系统
Li et al. Research on orthopedic auxiliary classification and prediction model based on XGBoost algorithm
Kim et al. A deep learning model for real-time mortality prediction in critically ill children
Choi et al. Multi-layer representation learning for medical concepts
CN109036553A (zh) 一种基于自动抽取医疗专家知识的疾病预测方法
Khemphila et al. Comparing performances of logistic regression, decision trees, and neural networks for classifying heart disease patients
Peter et al. Study and development of novel feature selection framework for heart disease prediction
Wei et al. Risk assessment of cardiovascular disease based on SOLSSA-CatBoost model
Jiang et al. A hybrid intelligent model for acute hypotensive episode prediction with large-scale data
Zhang et al. A machine learning approach for mortality prediction only using non-invasive parameters
Sahu et al. Cardiovascular risk assessment using data mining inferencing and feature engineering techniques
Duan et al. Early prediction of sepsis using double fusion of deep features and handcrafted features
Steinmeyer et al. Sampling methods and feature selection for mortality prediction with neural networks
Alghatani et al. Precision clinical medicine through machine learning: using high and low quantile ranges of vital signs for risk stratification of ICU patients
CN114613465A (zh) 一种脑卒中患病风险预测和个性化治疗推荐方法及系统
Mansouri et al. Predicting hospital length of stay of neonates admitted to the NICU using data mining techniques
Leng et al. Bi-level artificial intelligence model for risk classification of acute respiratory diseases based on Chinese clinical data
Pattalung et al. Comparison of machine learning algorithms for mortality prediction in intensive care patients on multi-center critical care databases
Navaz et al. The use of data mining techniques to predict mortality and length of stay in an ICU
Theodoraki et al. Innovative data mining approaches for outcome prediction of trauma patients
An et al. TERTIAN: Clinical Endpoint Prediction in ICU via Time‐Aware Transformer‐Based Hierarchical Attention Network
Poor et al. An Artificial Neural Network–Based Pediatric Mortality Risk Score: Development and Performance Evaluation Using Data From a Large North American Registry
Miglani et al. Electronic health record for sustainable eHealth
Sharma et al. A Novel Heart Disease Prediction System Using XGBoost Classifier Coupled With ADASYN SMOTE

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination