CN112086195A - 一种基于自适应集成学习模型的再入院风险预测方法 - Google Patents

一种基于自适应集成学习模型的再入院风险预测方法 Download PDF

Info

Publication number
CN112086195A
CN112086195A CN202010971129.2A CN202010971129A CN112086195A CN 112086195 A CN112086195 A CN 112086195A CN 202010971129 A CN202010971129 A CN 202010971129A CN 112086195 A CN112086195 A CN 112086195A
Authority
CN
China
Prior art keywords
learning model
ensemble learning
adaptive
model
particle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010971129.2A
Other languages
English (en)
Other versions
CN112086195B (zh
Inventor
邱航
张振
郑鑫
胡智栩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202010971129.2A priority Critical patent/CN112086195B/zh
Publication of CN112086195A publication Critical patent/CN112086195A/zh
Application granted granted Critical
Publication of CN112086195B publication Critical patent/CN112086195B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Evolutionary Computation (AREA)
  • Primary Health Care (AREA)
  • Physiology (AREA)
  • Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Epidemiology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于自适应集成学习模型的再入院风险预测方法,包括以下步骤:采集患者的基本信息和临床诊疗信息,并构建临床高维特征矩阵以及再住院标签;对临床高维特征矩阵依次进行数据预处理和KPCA降维,得到降维特征集;构建自适应集成学习模型并根据降维特征集和再住院标签对其训练,将待预测患者的降维特征集输入训练完成的自适应集成学习模型中,得到患者的再入院风险预测结果。本发明提出了一种基于自适应集成学习模型的再入院风险预测方法,通过集成学习模型准确预测患者再入院风险,辅助医生对高风险患者提前采取干预措施,有助于降低患者疾病负担、减轻患者经济负担,有助于降低医院再入院率以及提升医疗服务质量。

Description

一种基于自适应集成学习模型的再入院风险预测方法
技术领域
本发明属于计算机科学领域,具体涉及一种基于自适应集成学习模型的再入院风险预测方法。
背景技术
再入院率是反映医院医疗质量和管理水平的重要指标,准确预测患者再入院风险,为医生和医院管理者提供辅助决策支撑,从而可以有效降低再入院率。在提高医疗服务质量和降低治疗费用的同时,帮助医院更加有效合理的分配医疗资源。目前,关于再入院风险预测研究仍存在一些问题:
再入院风险预测的特征具有高维、非线性的特点,传统的线性降维方式不能取得很好的降维效果。
再入院风险预测主流方法分为两种:一是传统的统计学方法,这类方法的预测精度不高;另一种是机器学习算法,在一定程度上解决传统统计学方法预测精度不足的问题,但预测效果仍有待提升。集成学习模型使用多个基模型的预测结果作为训练一个新的元学习器的特征,已经被成功地应用在一些科学领域的预测,并被证明比单个机器学习模型更有效。但在再入院风险预测的研究中,由于缺乏背景知识,集成学习模型很难选择有效的模型组合,进而影响了模型的预测效果。
发明内容
针对现有技术中的上述不足,本发明提供的一种基于自适应集成学习模型的再入院风险预测方法解决了现有技术中存在的问题。
为了达到上述发明目的,本发明采用的技术方案为:一种基于自适应集成学习模型的再入院风险预测方法,包括以下步骤:
S1、采集患者的基本信息和临床诊疗信息,并通过基本信息和临床诊疗信息构建临床高维特征矩阵以及再住院标签;
S2、对临床高维特征矩阵进行数据预处理,并对预处理后的临床高维特征矩阵进行KPCA降维,得到降维特征集;
S3、构建自适应集成学习模型,并将患者的降维特征集和再住院标签输入自适应集成学习模型进行训练;
S4、将待预测患者的降维特征集输入训练完成的自适应集成学习模型中,得到患者的再入院风险预测结果。
进一步地,所述步骤S3中构建自适应集成学习模型的具体步骤为:
C1、选择备选基模型和元学习器;
C2、通过遗传算法自适应地选择不同元学习器对应的基模型,构建3个最优集成模型;
C3、以权重投票机制为基础,并通过粒子群优化算法调整3个集成模型的权重,获取自适应集成学习模型。
进一步地,所述步骤C1中备选基模型包括支持向量机、逻辑斯特回归、贝叶斯模型、分类和回归树、梯度提升决策树、极端随机树、随机森林、卷积神经网络、多层感知机、极端梯度提升、引导聚集算法和自适应增强算法;
所述步骤C1中元学习器包括线性模型Logistic Regression、树模型Classification and Regression Tree和深度学习模型Multi-layer Perceptron。
进一步地,所述步骤C2包括以下分步骤:
C2.1、对所有备选基模型进行离散化,采用二进制编码方法对离散化后的备选基模型进行编码,并初始化,随机生成M个编码个体;
C2.2、对每个编码个体所对应的基模型和元学习器所构建的集成学习模型进行训练,采用AUC作为适应度函数,并计算训练后每个编码个体的适应度值;
C2.3、将编码个体的适应度值与总群体的适应度值的比值作为选择最优基模型组合的准则,剔除适应度比值较小的N个编码个体;
C2.4、随机添加N个编码个体到现有群体中;
C2.5、设置交叉概率为0.6,从现有群体的每个编码个体中随机抽取两个基模型作为交叉点,并进行交叉操作;
C2.6、设置变异概率为0.1,并对现有群体中每个编码个体进行变异操作;
C2.7、重复步骤C2.2-C2.6若干次,将现有种群中AUC值最大的集成学习模型作为特定元学习器对应的最优集成学习模型;
C2.8、根据步骤C2.1-C2.7所述方法,分别获取步骤C1中3个元学习器对应的3个最优集成学习模型;
所述步骤C2.5中交叉操作具体为交换两个交叉点的选中状态;
所述步骤C2.6中变异操作具体为以设置的变异概率改变基模型的选中状态。
进一步地,所述步骤C3包括以下分步骤:
C3.1、设置每个粒子为自适应集成学习模型中最优集成学习模型的权重,设置适应度函数为最优集成学习模型的AUC值,并初始化l个粒子的速度和位置,所述粒子g为3维向量,其位置Ug和速度Vg为:
Figure BDA0002684088300000031
其中,ug1,ug2,ug3分别表示粒子g的第1、2、3维的位置,vg1,vg2,vg3分别表示粒子g的第1、2、3维的速度;
C3.2、设置迭代次数为B、计数器k=0、个体最优解pbest=0以及全局最优解gbest=0;
C3.3、计算粒子g的适应度函数值,若是适应度函数值大于其个体最优解pbestg,则令个体最优解pbestg为粒子g的当前适应度函数值;
C3.4、更新全局最优解gbest为:
gbest=max{pbest1,pbest2,...,pbestg,...,pbestl}
C3.5、对粒子g的速度和位置进行更新,更新公式为:
Figure BDA0002684088300000041
其中,
Figure BDA0002684088300000042
表示粒子g在第k次迭代的第d维速度更新值,
Figure BDA0002684088300000043
表示粒子g在第k次迭代的第d维的速度,c1表示第一加速度系数,c2表示第二加速度系数,r1和r2均表示[0,1]中的随机数,
Figure BDA0002684088300000044
表示粒子g子在第k次迭代中第d维的最佳位置,
Figure BDA0002684088300000045
表示所有粒子在第k次迭代中第d维的最佳位置,
Figure BDA0002684088300000046
表示粒子g在第k次迭代的第d维位置更新值,
Figure BDA0002684088300000047
表示粒子g在第k次迭代的第d维的位置,d=1,2,3;
C3.6、判断计数器k是否等于迭代次数B,若是则进入步骤C3.7,否则返回步骤C3.3;
C3.7、输出全局最优解为gbest=[u1,u2,u3],并得到自适应集成学习模型final_Model为:
final_Model=u1*Model1+u2*Model2+u3*Model3
其中,u1,u2,u3分别表示ug1,ug2,ug3的全局最优解,Modelf表示第f个最优集成学习模型,uf表示第f个最优集成学习模型的权重,f=1,2,3。
本发明的有益效果为:
(1)本发明针对再入院特征中存在的高维非线性结构问题,采用KPCA进行非线性降维,取得了很好的降维效果。
(2)本发明针对再入院风险预测准确率问题,采用集成学习模型,并提出一种自适应集成学习模型,能够高效地选择不同类型的最优组合模型,进而极大提升再入院风险的预测效果。
(3)本发明提出了一种基于自适应集成学习模型的再入院风险预测方法,通过集成学习模型预测患者再入院风险,准确识别高风险群体,辅助医生对高风险患者提前采取干预措施,有助于降低患者疾病负担、减轻患者经济负担,有助于降低医院再入院率以及提升医疗服务质量。
附图说明
图1为本发明提出的一种基于自适应集成学习模型的再入院风险预测方法流程图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
下面结合附图详细说明本发明的实施例。
如图1所示,一种基于自适应集成学习模型的再入院风险预测方法,包括以下步骤:
S1、采集患者的基本信息和临床诊疗信息,并通过基本信息和临床诊疗信息构建临床高维特征矩阵以及再住院标签;
S2、对临床高维特征矩阵进行数据预处理,并对预处理后的临床高维特征矩阵进行KPCA降维,得到降维特征集;
S3、构建自适应集成学习模型,并将患者的降维特征集和再住院标签输入自适应集成学习模型进行训练;
S4、将待预测患者的降维特征集输入训练完成的自适应集成学习模型中,得到患者的再入院风险预测结果。
核主成分分析(Kernel Principal Component Analysis,KPCA)将原始数据通过核函数映射到高维度空间,再利用PCA算法进行降维。
所述步骤S1中患者基本信息xbasic包括性别、年龄和住院天数;
所述步骤S1中临床诊疗信息包括:
Figure BDA0002684088300000061
其中,xdisease表示疾病编码特征向量,A00,A01,…,Z99表示国际疾病分类ICD-10的三位代码类目,特征的列名称为疾病编码,值为患者患该疾病的次数;xsurgery表示手术编码特征向量,00,01,…,99表示手术与操作编码ICD-9-CM-3的两位类目表,特征的列名称为手术编码,值为患者进行该手术的次数;xmedicine表示药物的解剖学、治疗学及化学分类法ATC的编码特征向量,MD1,MD2,…,MD13表示药物ATC编码分类,特征的列名称为药物ATC编码,值为患者服用该类药物的次数;xlabs表示检验信息特征向量;
所述检验信息特征向量xlabs为:
Figure BDA0002684088300000062
其中,exam1,exam2,...,examn分别表示第1,2,...,n种检验项目,min、median和max分别表示患者住院期间每种检验项目中多次检验数据的最小值、中位数和最大值。
所述步骤S1中临床高维特征矩阵为X=[xbasic,xdisease,xsurgery,xmedicine,xlabs]。
所述步骤S1中再入院标签的获取方式为:根据患者身份证号关联其所有住院信息,并按时间先后顺序排序,若患者第t次出院时间与第t+1次入院时间的时间间隔小于30天且出院主诊断为同一种疾病,则患者的第t次再入院标签为1,否则为0。
所述步骤S2中对临床高维特征矩阵进行数据预处理的具体步骤为:
A1、对临床高维特征矩阵进行缺失值处理,将分类特征的缺失值使用一个随机值替换,将连续特征的缺失值使用其对应的特征平均值代替,得到缺失值处理后的临床高维特征矩阵;
A2、使用one-hot编码方法对缺失值处理后的临床高维特征矩阵的分类特征进行编码,得到编码后的临床高维特征矩阵;
A3、对编码后的临床高维特征矩阵的连续特征进行归一化,得到预处理后的临床高维特征矩阵为X=[x1,x2,…,xt];x1,x2,…,xt∈Rm,Rm表示m维空间向量。
所述步骤S2中对预处理后的临床高维特征矩阵进行KPCA降维的具体方法为:
B1、给定核函数k(xi,xj),得到正定核K,其元素Kij为:
Kij=k(xi,xj)=Φ(xi)·Φ(xj)=Φ(xi)T·Φ(xj)
其中,xi∈X,xj∈X,i=1,2,...,t,j=1,2,...,t,i≠j,Φ表示非线性映射函数,Φ(xi)和Φ(xj)分别表示原始特征空间中的样本点xi和xj通过非线性映射函数Φ映射到高维特征空间的坐标,T表示转置;
B2、根据正定核K计算矩阵L为:
L=K-K·Mm×m-Mm×m·K+Mm×m·K·Mm×m
其中,Mm×m表示每个元素都为1/m的方阵;
B3、获取矩阵L的所有特征值,并将特征值按从大到小的顺序进行排序,计算前p个特征值λ12,...,λp对应的特征向量为δ12,...,δp
B4、根据特征向量δ12,...,δp,获取特征提取算法所需的特征矩阵W=[w1,w2,…,wp],其中特征we计算公式为:
Figure BDA0002684088300000081
其中,e=1,2,…,p,Q=[Φ(x1),Φ(x2),…,Φ(xt)];
B5、根据特征矩阵W,获取降维特征集X′=[x′1,x′2,…,x′t],其元素x′e的计算公式为:
Figure BDA0002684088300000082
其中,x′e∈Rp,Rp表示p维空间向量,k(xi,X)表示给定的核函数。
所述步骤S3中构建自适应集成学习模型的具体步骤为:
C1、选择备选基模型和元学习器;
C2、通过遗传算法自适应地选择不同元学习器对应的基模型,构建3个最优集成模型;
C3、以权重投票机制为基础,并通过粒子群优化算法调整3个集成模型的权重,获取自适应集成学习模型。
所述步骤C1中备选基模型包括支持向量机、逻辑斯特回归、贝叶斯模型、分类和回归树、梯度提升决策树、极端随机树、随机森林、卷积神经网络、多层感知机、极端梯度提升、引导聚集算法和自适应增强算法;
所述步骤C1中元学习器包括线性模型Logistic Regression、树模型Classification and Regression Tree和深度学习模型Multi-layer Perceptron。
所述步骤C2包括以下分步骤:
C2.1、对所有备选基模型进行离散化,采用二进制编码方法对离散化后的备选基模型进行编码,并初始化,随机生成M个编码个体;
C2.2、对每个编码个体所对应的基模型和元学习器所构建的集成学习模型进行训练,采用AUC作为适应度函数,并计算训练后每个编码个体的适应度值;
C2.3、将编码个体的适应度值与总群体的适应度值的比值作为选择最优基模型组合的准则,剔除适应度比值较小的N个编码个体;
C2.4、随机添加N个编码个体到现有群体中;
C2.5、设置交叉概率为0.6,从现有群体的每个编码个体中随机抽取两个基模型作为交叉点,并进行交叉操作;
C2.6、设置变异概率为0.1,并对现有群体中每个编码个体进行变异操作;
C2.7、重复步骤C2.2-C2.6若干次,将现有种群中AUC值最大的集成学习模型作为特定元学习器对应的最优集成学习模型;
C2.8、根据步骤C2.1-C2.7所述方法,分别获取步骤C1中3个元学习器对应的3个最优集成学习模型;
所述步骤C2.5中交叉操作具体为交换两个交叉点的选中状态;
所述步骤C2.6中变异操作具体为以设置的变异概率改变基模型的选中状态。
所述步骤C3包括以下分步骤:
C3.1、设置每个粒子为自适应集成学习模型中最优集成学习模型的权重,设置适应度函数为最优集成学习模型的AUC值,并初始化l个粒子的速度和位置,所述粒子g为3维向量,其位置Ug和速度Vg为:
Figure BDA0002684088300000091
其中,ug1,ug2,ug3分别表示粒子g的第1、2、3维的位置,vg1,vg2,vg3分别表示粒子g的第1、2、3维的速度;
C3.2、设置迭代次数为B、计数器k=0、个体最优解pbest=0以及全局最优解gbest=0;
C3.3、计算粒子g的适应度函数值,若是适应度函数值大于其个体最优解pbestg,则令个体最优解pbestg为粒子g的当前适应度函数值;
C3.4、更新全局最优解gbest为:
gbest=max{pbest1,pbest2,...,pbestg,...,pbestl}
C3.5、对粒子g的速度和位置进行更新,更新公式为:
Figure BDA0002684088300000101
其中,
Figure BDA0002684088300000102
表示粒子g在第k次迭代的第d维速度更新值,
Figure BDA0002684088300000103
表示粒子g在第k次迭代的第d维的速度,c1表示第一加速度系数,c2表示第二加速度系数,r1和r2均表示[0,1]中的随机数,
Figure BDA0002684088300000104
表示粒子g子在第k次迭代中第d维的最佳位置,
Figure BDA0002684088300000105
表示所有粒子在第k次迭代中第d维的最佳位置,
Figure BDA0002684088300000106
表示粒子g在第k次迭代的第d维位置更新值,
Figure BDA0002684088300000107
表示粒子g在第k次迭代的第d维的位置,d=1,2,3;
C3.6、判断计数器k是否等于迭代次数B,若是则进入步骤C3.7,否则返回步骤C3.3;
C3.7、输出全局最优解为gbest=[u1,u2,u3],并得到自适应集成学习模型final_Model为:
final_Model=u1*Model1+u2*Model2+u3*Model3
其中,u1,u2,u3分别表示ug1,ug2,ug3的全局最优解,Modelf表示第f个最优集成学习模型,uf表示第f个最优集成学习模型的权重,f=1,2,3。

Claims (5)

1.一种基于自适应集成学习模型的再入院风险预测方法,其特征在于,包括以下步骤:
S1、采集患者的基本信息和临床诊疗信息,并通过基本信息和临床诊疗信息构建临床高维特征矩阵以及再住院标签;
S2、对临床高维特征矩阵进行数据预处理,并对预处理后的临床高维特征矩阵进行KPCA降维,得到降维特征集;
S3、构建自适应集成学习模型,并将患者的降维特征集和再住院标签输入自适应集成学习模型进行训练;
S4、将待预测患者的降维特征集输入训练完成的自适应集成学习模型中,得到患者的再入院风险预测结果。
2.根据权利要求1所述的基于自适应集成学习模型的再入院风险预测方法,其特征在于,所述步骤S3中构建自适应集成学习模型的具体步骤为:
C1、选择备选基模型和元学习器;
C2、通过遗传算法自适应地选择不同元学习器对应的基模型,构建3个最优集成模型;
C3、以权重投票机制为基础,并通过粒子群优化算法调整3个集成模型的权重,获取自适应集成学习模型。
3.根据权利要求2所述的基于自适应集成学习模型的再入院风险预测方法,其特征在于,所述步骤C1中备选基模型包括支持向量机、逻辑斯特回归、贝叶斯模型、分类和回归树、梯度提升决策树、极端随机树、随机森林、卷积神经网络、多层感知机、极端梯度提升、引导聚集算法和自适应增强算法;
所述步骤C1中元学习器包括线性模型Logistic Regression、树模型Classificationand Regression Tree和深度学习模型Multi-layer Perceptron。
4.根据权利要求3所述的基于自适应集成学习模型的再入院风险预测方法,其特征在于,所述步骤C2包括以下分步骤:
C2.1、对所有备选基模型进行离散化,采用二进制编码方法对离散化后的备选基模型进行编码,并初始化,随机生成M个编码个体;
C2.2、对每个编码个体所对应的基模型和元学习器所构建的集成学习模型进行训练,采用AUC作为适应度函数,并计算训练后每个编码个体的适应度值;
C2.3、将编码个体的适应度值与总群体的适应度值的比值作为选择最优基模型组合的准则,剔除适应度比值较小的N个编码个体;
C2.4、随机添加N个编码个体到现有群体中;
C2.5、设置交叉概率为0.6,从现有群体的每个编码个体中随机抽取两个基模型作为交叉点,并进行交叉操作;
C2.6、设置变异概率为0.1,并对现有群体中每个编码个体进行变异操作;
C2.7、重复步骤C2.2-C2.6若干次,将现有种群中AUC值最大的集成学习模型作为特定元学习器对应的最优集成学习模型;
C2.8、根据步骤C2.1-C2.7所述方法,分别获取步骤C1中3个元学习器对应的3个最优集成学习模型;
所述步骤C2.5中交叉操作具体为交换两个交叉点的选中状态;
所述步骤C2.6中变异操作具体为以设置的变异概率改变基模型的选中状态。
5.根据权利要求4所述的基于自适应集成学习模型的再入院风险预测方法,其特征在于,所述步骤C3包括以下分步骤:
C3.1、设置每个粒子为自适应集成学习模型中最优集成学习模型的权重,设置适应度函数为最优集成学习模型的AUC值,并初始化l个粒子的速度和位置,所述粒子g为3维向量,其位置Ug和速度Vg为:
Figure FDA0002684088290000031
其中,ug1,ug2,ug3分别表示粒子g的第1、2、3维的位置,vg1,vg2,vg3分别表示粒子g的第1、2、3维的速度;
C3.2、设置迭代次数为B、计数器k=0、个体最优解pbest=0以及全局最优解gbest=0;
C3.3、计算粒子g的适应度函数值,若是适应度函数值大于其个体最优解pbestg,则令个体最优解pbestg为粒子g的当前适应度函数值;
C3.4、更新全局最优解gbest为:
gbest=max{pbest1,pbest2,...,pbestg,...,pbestl}
C3.5、对粒子g的速度和位置进行更新,更新公式为:
Figure FDA0002684088290000032
其中,
Figure FDA0002684088290000033
表示粒子g在第k次迭代的第d维速度更新值,
Figure FDA0002684088290000034
表示粒子g在第k次迭代的第d维的速度,c1表示第一加速度系数,c2表示第二加速度系数,r1和r2均表示[0,1]中的随机数,
Figure FDA0002684088290000035
表示粒子g子在第k次迭代中第d维的最佳位置,
Figure FDA0002684088290000036
表示所有粒子在第k次迭代中第d维的最佳位置,
Figure FDA0002684088290000037
表示粒子g在第k次迭代的第d维位置更新值,
Figure FDA0002684088290000038
表示粒子g在第k次迭代的第d维的位置,d=1,2,3;
C3.6、判断计数器k是否等于迭代次数B,若是则进入步骤C3.7,否则返回步骤C3.3;
C3.7、输出全局最优解为gbest=[u1,u2,u3],并得到自适应集成学习模型final_Model为:
final_Model=u1*Model1+u2*Model2+u3*Model3
其中,u1,u2,u3分别表示ug1,ug2,ug3的全局最优解,Modelf表示第f个最优集成学习模型,uf表示第f个最优集成学习模型的权重,f=1,2,3。
CN202010971129.2A 2020-09-16 2020-09-16 一种基于自适应集成学习模型的再入院风险预测方法 Active CN112086195B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010971129.2A CN112086195B (zh) 2020-09-16 2020-09-16 一种基于自适应集成学习模型的再入院风险预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010971129.2A CN112086195B (zh) 2020-09-16 2020-09-16 一种基于自适应集成学习模型的再入院风险预测方法

Publications (2)

Publication Number Publication Date
CN112086195A true CN112086195A (zh) 2020-12-15
CN112086195B CN112086195B (zh) 2023-04-07

Family

ID=73736420

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010971129.2A Active CN112086195B (zh) 2020-09-16 2020-09-16 一种基于自适应集成学习模型的再入院风险预测方法

Country Status (1)

Country Link
CN (1) CN112086195B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113223711A (zh) * 2021-04-29 2021-08-06 天津大学 基于多模态数据的再入院预测模型
CN113380413A (zh) * 2021-06-24 2021-09-10 首都医科大学附属北京天坛医院 一种构建无效再通fr预测模型的方法和装置
CN113468794A (zh) * 2020-12-29 2021-10-01 重庆大学 一种小型密闭空间温湿度预测及反向优化方法
CN113792845A (zh) * 2021-09-07 2021-12-14 未鲲(上海)科技服务有限公司 基于元学习的预测模型训练方法、装置、电子设备及介质
CN114792568A (zh) * 2022-06-27 2022-07-26 天津幸福生命科技有限公司 住院风险预测方法及装置、存储介质及电子设备
CN117809811A (zh) * 2024-02-28 2024-04-02 山东大学第二医院 一种基于人工智能的减重手术术后管理方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512477A (zh) * 2015-12-03 2016-04-20 万达信息股份有限公司 基于降维组合分类算法非计划性再入院风险评估预测模型
CN107180283A (zh) * 2017-07-05 2017-09-19 山东大学 一种基于最优特征组合的再住院行为预测系统及方法
US20170330078A1 (en) * 2017-07-18 2017-11-16 Ashok Reddy Method and system for automated model building
CN107358253A (zh) * 2017-06-12 2017-11-17 中国地质大学(武汉) 一种基于差分演化的自适应集成学习方法及系统
CN108073666A (zh) * 2016-11-17 2018-05-25 财团法人工业技术研究院 整体式学习预测装置与方法、以及计算机可读的存储介质
CN109117864A (zh) * 2018-07-13 2019-01-01 华南理工大学 基于异构特征融合的冠心病风险预测方法、模型及系统
CN110010248A (zh) * 2019-04-17 2019-07-12 电子科技大学 一种基于代价敏感集成学习模型的再入院风险预测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512477A (zh) * 2015-12-03 2016-04-20 万达信息股份有限公司 基于降维组合分类算法非计划性再入院风险评估预测模型
CN108073666A (zh) * 2016-11-17 2018-05-25 财团法人工业技术研究院 整体式学习预测装置与方法、以及计算机可读的存储介质
CN107358253A (zh) * 2017-06-12 2017-11-17 中国地质大学(武汉) 一种基于差分演化的自适应集成学习方法及系统
CN107180283A (zh) * 2017-07-05 2017-09-19 山东大学 一种基于最优特征组合的再住院行为预测系统及方法
US20170330078A1 (en) * 2017-07-18 2017-11-16 Ashok Reddy Method and system for automated model building
CN109117864A (zh) * 2018-07-13 2019-01-01 华南理工大学 基于异构特征融合的冠心病风险预测方法、模型及系统
CN110010248A (zh) * 2019-04-17 2019-07-12 电子科技大学 一种基于代价敏感集成学习模型的再入院风险预测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
YI HONG 等: "To combine steady-state genetic algorithm and ensemble learning for data clustering" *
ZH IXU HU 等: "A Stacking Ensemble Model to Predict Daily Number of Hospital Admissions for Cardiovascular Diseases" *
董红斌 等: "一种基于协同进化方法的聚类集成算法" *
郭海湘 等: "基于差分演化的自适应集成学习算法在不均衡数据分类中的应用" *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113468794A (zh) * 2020-12-29 2021-10-01 重庆大学 一种小型密闭空间温湿度预测及反向优化方法
CN113468794B (zh) * 2020-12-29 2023-05-19 重庆大学 一种小型密闭空间温湿度预测及反向优化方法
CN113223711A (zh) * 2021-04-29 2021-08-06 天津大学 基于多模态数据的再入院预测模型
CN113380413A (zh) * 2021-06-24 2021-09-10 首都医科大学附属北京天坛医院 一种构建无效再通fr预测模型的方法和装置
CN113792845A (zh) * 2021-09-07 2021-12-14 未鲲(上海)科技服务有限公司 基于元学习的预测模型训练方法、装置、电子设备及介质
CN114792568A (zh) * 2022-06-27 2022-07-26 天津幸福生命科技有限公司 住院风险预测方法及装置、存储介质及电子设备
CN117809811A (zh) * 2024-02-28 2024-04-02 山东大学第二医院 一种基于人工智能的减重手术术后管理方法及系统
CN117809811B (zh) * 2024-02-28 2024-05-10 山东大学第二医院 一种基于人工智能的减重手术术后管理方法及系统

Also Published As

Publication number Publication date
CN112086195B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN112086195B (zh) 一种基于自适应集成学习模型的再入院风险预测方法
Che et al. Interpretable deep models for ICU outcome prediction
CN109920501B (zh) 基于卷积神经网络和主动学习的电子病历分类方法及系统
Che et al. Deep computational phenotyping
Pradhan et al. Predict the onset of diabetes disease using Artificial Neural Network (ANN)
WO2021120936A1 (zh) 一种基于多任务学习模型的慢病预测系统
Xu et al. A survey of transfer and multitask learning in bioinformatics
Che et al. Deep learning solutions to computational phenotyping in health care
CN111387938B (zh) 一种基于特征重排一维卷积神经网络的病人心衰死亡风险预测系统
CN116383364B (zh) 一种基于医生反馈与强化学习的医疗问答回复方法及系统
Tavakoli Seq2image: Sequence analysis using visualization and deep convolutional neural network
Bhardwaj et al. Computational biology in the lens of CNN
Louati et al. Evolutionary optimization for CNN compression using thoracic X-ray image classification
Tran et al. Advanced calibration of mortality prediction on cardiovascular disease using feature-based artificial neural network
Oriol Sabat et al. SALAI-Net: species-agnostic local ancestry inference network
Patel Predicting a risk of diabetes at early stage using machine learning approach
CN112201348B (zh) 基于知识感知的多中心临床数据集适配设备
CN116072298B (zh) 一种基于层级标记分布学习的疾病预测系统
Kumar et al. Enhanced decision tree algorithm using genetic algorithm for heart disease prediction
CN110633368A (zh) 早期结直肠癌非结构化数据的深度学习分类方法
Xu et al. DeepHealth: Deep representation learning with autoencoders for healthcare prediction
Ullah et al. Crow-ENN: An Optimized Elman Neural Network with Crow Search Algorithm for Leukemia DNA Sequence Classification
CN114694841A (zh) 一种基于患者电子健康记录的不良事件风险预测方法
Wang et al. Imbalanced learning for hospital readmission prediction using national readmission database
Bhattarai Machine Learning Approach for Prediction of Bone Mineral Density and Fragility Fracture in Osteoporosis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant