CN117637154B - 一种基于优化算法的神经内科重症指标预测方法及系统 - Google Patents

一种基于优化算法的神经内科重症指标预测方法及系统 Download PDF

Info

Publication number
CN117637154B
CN117637154B CN202410114027.7A CN202410114027A CN117637154B CN 117637154 B CN117637154 B CN 117637154B CN 202410114027 A CN202410114027 A CN 202410114027A CN 117637154 B CN117637154 B CN 117637154B
Authority
CN
China
Prior art keywords
severe
model
index
wolf
learning machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410114027.7A
Other languages
English (en)
Other versions
CN117637154A (zh
Inventor
张元媛
王玉琴
成亚琴
柯开富
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Affiliated Hospital of Nantong University
Original Assignee
Affiliated Hospital of Nantong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Affiliated Hospital of Nantong University filed Critical Affiliated Hospital of Nantong University
Priority to CN202410114027.7A priority Critical patent/CN117637154B/zh
Publication of CN117637154A publication Critical patent/CN117637154A/zh
Application granted granted Critical
Publication of CN117637154B publication Critical patent/CN117637154B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种基于优化算法的神经内科重症指标预测方法及系统,涉及神经内科技术领域,该神经内科重症指标方法包括以下步骤:S1、设定神经内科的重症指标,并利用相关性分析与随机森林算法结合的方式从医学数据库中提取与重症指标相关的生理因素;S2、获取患者的基本信息以及基于生理因素检测得到的病历信息;S3、选取生理因素构建训练集与测试集,利用混沌灰狼优化算法优化在线序列极限学习机建立指标预测模型;S4、将病历信息作为模型输入并进行标准化处理。本发明通过设结合相关性分析与随机森林算法进行生理因素分析,再采用混沌灰狼优化算法优化在线序列极限学习机,有效提高了指标预测模型的准确性和泛化能力。

Description

一种基于优化算法的神经内科重症指标预测方法及系统
技术领域
本发明涉及神经内科技术领域,尤其是涉及一种基于优化算法的神经内科重症指标预测方法及系统。
背景技术
神经内科是专注于诊断、治疗和管理与中枢神经系统(包括大脑、脊髓和周围神经)相关的疾病的医学分支,涵盖了多种神经系统疾病,如脑血管疾病、神经肌肉疾病、癫痫、头痛、多发性硬化症等。在神经内科的实践中,需要运用各种神经学检查和影像学技术,如脑电图、磁共振成像(MRI)、计算机断层扫描(CT)等,以全面了解患者的神经系统状况。
神经内科重症指标是用于评估神经系统严重疾病和危及生命情况的关键参数,它们提供了对患者神经状态和整体健康状况的重要信息,包括颅内压、脑电图(EEG)变化、神经肌肉功能状态、脑血管灌注情况等。颅内压是在中枢神经系统疾病中尤为重要的指标,其升高可能反映颅内出血、肿瘤或脑水肿等病理情况。脑电图作为监测神经活动的工具,能够检测癫痫状态、脑功能异常等,对神经内科重症患者的病情评估至关重要。此外,神经肌肉功能状态的监测,如肌电图(EMG)和神经传导速度(NCV)测试,对于诸如重症肌无力等神经肌肉疾病的分析评估提供了关键信息。在重症脑血管疾病中,血流动力学参数、脑血管造影等指标能够反映脑灌注状态,为神经保护提供依据。
神经内科重症指标的全面应用有助于及时干预和管理患者的身体状态,对于改善神经系统疾病患者的机体健康与生活质量具有重要意义。相应的,重症指标预测是一门迅速发展的领域,旨在通过现代医学技术和先进的数据分析方法,提前识别和预测患者可能发展成神经内科重症病情的迹象。尽管现有技术在神经内科重症指标预测方面取得了显著进展,但仍存在一些挑战和不足。首先,对于某些指标参数,其并不能直接通过设备检测直接获取,潜在性较强。其次,现有技术在对多因素交互作用的理解和综合分析方面仍有待加强,神经内科重症通常涉及多个系统和复杂的病理生理学过程,传统的预测方法存在数据相关性较差,求解方法困难且鲁棒性不强等问题。
发明内容
基于此,有必要针对上述技术问题,提供一种基于优化算法的神经内科重症指标预测方法及系统。
第一方面,本发明提供了一种基于优化算法的神经内科重症指标预测方法,该神经内科重症指标方法包括以下步骤:
S1、设定神经内科的重症指标,并利用相关性分析与随机森林算法结合的方式从医学数据库中提取与重症指标相关的生理因素;
S2、获取患者的基本信息以及基于生理因素检测得到的病历信息;
S3、选取生理因素构建训练集与测试集,利用混沌灰狼优化算法优化在线序列极限学习机建立指标预测模型,并进行模型训练与测试;
S4、将病历信息作为模型输入并进行标准化处理,再代入指标预测模型中进行重症指标的分析预测,输出重症指标预测结果。
进一步的,设定神经内科的重症指标,并利用相关性分析与随机森林算法结合的方式从医学数据库中提取与重症指标相关的生理因素包括以下步骤:
S11、依据神经内科涉及的神经系统疾病类型,设定相应的重症指标;
S12、获取医学数据库内医学知识信息,按照数据类型划分为不同因素;
S13、利用皮尔逊相关性分析算法分析重症指标与各个因素之间的相关关系,经过初次筛选得到满足相关性要求的关联因素;
S14、利用随机森林算法对关联因素对于重症指标的重要性进行分析,经过重要性筛选后得到与重症指标密切相关的生理因素。
进一步的,利用皮尔逊相关性分析算法分析重症指标与各个因素之间的相关关系,经过初次筛选得到满足相关性要求的关联因素包括以下步骤:
S131、将重症指标与因素均作为变量,统计医学数据库中每个变量的样本数,再计算每个变量的均值;
S132、利用均值分别计算两两变量之间的协方差与标准差;
S133、利用协方差与标准差计算皮尔逊相关系数,该皮尔逊相关系数的表达式为:
式中,ρX,Y表示皮尔逊相关系数;cov表示协方差;σ表示标准差;X、Y分别表示重症指标与因素对应的变量;
S134、设定相关性阈值,剔除皮尔逊相关系数低于相关性阈值的因素,保留满足相关性要求的因素作为关联因素。
进一步的,利用随机森林算法对关联因素对于重症指标的重要性进行分析,经过重要性筛选后得到与重症指标密切相关的生理因素包括以下步骤:
S141、将重症指标作为目标,关联因素作为特征,并指定随机森林中决策树的数量构建随机森林模型,再进行模型训练与测试;
S142、将随机森林模型建模过程中未参与训练的指标因素数据作为袋外数据,并利用袋外数据计算随机森林模型的原始袋外误差;
S143、将袋外数据中的某个关联因素的顺序进行随机变换,再次计算随机森林模型的变换袋外误差;
S144、利用原始袋外误差与变换袋外误差计算对应变换的关联因素的重要性,重要性的计算公式为:
式中,I表示进行随机变换的关联因素的重要性;N表示决策树的数量,j=1,2,3,…,m;C0表示原始袋外误差;C′表示变换袋外误差;
S145、设定重要性阈值,按照重要性数值的大小进行排序,保留满足重要性阈值的关联因素作为重症指标的生理因素。
进一步的,选取生理因素构建训练集与测试集,利用混沌灰狼优化算法优化在线序列极限学习机建立指标预测模型,并进行模型训练与测试包括以下步骤:
S31、从医学数据库中选取生理因素及其对应的重症指标作为指标预测模型的数据基础,进行标准化处理后划分为训练集与测试集;
S32、初始化在线序列极限学习机的模型参数,再利用混沌灰狼优化算法对模型参数进行全局优化,实现最优个体向模型参数的赋值;
S33、利用训练集建立在线序列极限学习机模型,再基于灰狼位置更新进行在线序列极限学习机模型的局部寻优;
S34、采用最优模型参数建立指标预测模型,再对测试集进行预测。
进一步的,进行标准化处理的流程包括异常值处理、缺失值处理以及归一化处理,实现生理因素与重症指标的标准化;训练集与测试集的比例为70%:30%。
进一步的,初始化在线序列极限学习机的模型参数,再利用混沌灰狼优化算法对模型参数进行全局优化,实现最优个体向模型参数的赋值包括以下步骤:
S321、选择sigmoid函数作为在线序列极限学习机的激励函数,并设定在线序列极限学习机的隐含层节点数;
S322、初始化灰狼优化算法的种群参数,种群参数包括灰狼种群数、最大迭代次数、最大混沌搜索次数以及灰狼种群初始位置;
S323、利用灰狼种群中每个灰狼位置表示在线序列极限学习机的输入节点和隐含层间的权值和隐含层偏差,实现模型参数的赋值,利用灰狼位置赋值的表达式为:
式中,Rt,iter表示在当前迭代中灰狼位置向量;ap,q表示输入节点p到隐含层节点q之间随机产生的初始权值;bq表示隐含层节点q随机产生的隐含层偏差;iter表示当前迭代的次数。
进一步的,利用训练集建立在线序列极限学习机模型,再基于灰狼位置更新进行在线序列极限学习机模型的局部寻优包括以下步骤:
S331、利用训练集建立在线序列极限学习机模型,并计算训练集中样本数据的均方根误差作为每只灰狼的适应度,适应度计算公式为:
式中,fit表示灰狼种群中灰狼的适应度;y1表示在线序列极限学习机模型的训练输出结果;y2表示相同生理因素对应的实际结果;W表示训练集中样本数据的总数,w=1,2,…,W;
S332、选取适应度的数值排列前三位的灰狼,并将三只灰狼个体位置进行标记,作为在线序列极限学习机模型的决策层;
S333、若当前迭代次数小于最大迭代次数时,则对灰狼种群中的每只灰狼个体位置进行更新;
S334、灰狼个体位置进行更新后,再次利用适应度计算公式计算每只灰狼的适应度,并将当前迭代次数加一次;
S335、判断当前迭代次数是否小于最大迭代次数,若小于最大迭代次数,则重复执行步骤S331至步骤S335,若不小于最大迭代次数,则返回全局最优位置,作为在线序列极限学习机模型的初始权值与隐含层偏差。
进一步的,若当前迭代次数小于最大迭代次数时,则对灰狼种群中的每只灰狼个体位置进行更新包括以下步骤:
S3331、分别计算适应度位于前列的三只灰狼参与位置更新的权重系数,权重系数的计算公式为:
式中,ωh表示第h只灰狼的权重系数,h=α,β,δ;Rh(t)表示第h只灰狼在t次迭代时的位置;Rα、Rβ、Rδ分别表示三只灰狼;
S3332、利用三只灰狼各自的权重系数,计算灰狼种群中每只灰狼在下次迭代时的个体位置,实现位置更新,个体位置的计算公式为:
式中,Rk(t+1)表示灰狼种群中第k值灰狼在t+1次迭代时的位置;Rk,h表示第k只灰狼相对于第h只灰狼的位置。
第二方面,本发明还提供了一种基于优化算法的神经内科重症指标预测系统,该神经内科重症指标预测系统包括:
指标参数生成模块,用于设定神经内科的重症指标,并利用相关性分析与随机森林算法结合的方式从医学数据库中提取与重症指标相关的生理因素;
病历信息采集模块,用于获取患者的基本信息以及基于生理因素检测得到的病历信息;
模型训练测试模块,用于选取生理因素构建训练集与测试集,利用混沌灰狼优化算法优化在线序列极限学习机建立指标预测模型,并进行模型训练与测试;
指标预测分析模块,用于将病历信息作为模型输入并进行标准化处理,再代入指标预测模型中进行重症指标的分析预测,输出重症指标预测结果;
其中,指标参数生成模块、病历信息采集模块、模型训练测试模块及指标预测分析模块依次保持连接。
本发明的有益效果为:
1、通过设定神经内科的重症指标并结合相关性分析与随机森林算法,实现了从医学数据库中智能提取与指标相关的生理因素,为建立预测模型提供了全面的特征基础;其次,采用混沌灰狼优化算法优化在线序列极限学习机,不仅充分考虑了模型的全局搜索能力,还提高了模型的收敛性,从而有效提高了指标预测模型的准确性和泛化能力;同时,在构建训练集与测试集时,充分考虑了患者的基本信息和生理因素,提高了模型对个体差异的适应性,从而具备提高预测准确性、适应性和实用性的显著优势。
2、通过采用皮尔逊相关性分析算法对重症指标与各个因素之间的相关关系进行分析,通过初次筛选得到满足相关性要求的关联因素,有助于缩小研究范围,提高后续分析的效率,再配合引入随机森林算法对关联因素的重要性进行分析,进一步提炼与重症指标密切相关的生理因素,随机森林算法具有较强的适应性和鲁棒性,能够有效处理多因素交互的复杂关系,从而在研究中筛选出对重症指标具有显著影响的生理因素。
3、通过在初始化在线序列极限学习机的模型参数后,利用混沌灰狼优化算法进行全局优化,将最优个体的参数赋值给模型,有效提高了模型的整体性能,同时在模型建立的过程中,通过灰狼位置的更新进行在线序列极限学习机模型的局部寻优,进一步提高了模型的拟合能力和对潜在特征的抽取能力,从而使得模型更好地适应复杂的生理因素与重症指标之间的非线性关系,使得模型在未见过的数据上具有较好的泛化性能,为神经内科重症指标的准确预测提供了可靠的工具。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种基于优化算法的神经内科重症指标预测方法的流程图;
图2是根据本发明实施例的一种基于优化算法的神经内科重症指标预测系统的系统框图。
附图标号:1、指标参数生成模块;2、病历信息采集模块;3、模型训练测试模块;4、指标预测分析模块。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参阅图1,提供了一种基于优化算法的神经内科重症指标预测方法,该神经内科重症指标方法包括以下步骤:
S1、设定神经内科的重症指标,并利用相关性分析与随机森林算法结合的方式从医学数据库中提取与重症指标相关的生理因素。
在本发明的描述中,设定神经内科的重症指标,并利用相关性分析与随机森林算法结合的方式从医学数据库中提取与重症指标相关的生理因素包括以下步骤:
S11、依据神经内科涉及的神经系统疾病类型,设定相应的重症指标。
以下是与特定神经系统疾病相关的重症指标示例:
一、脑血管疾病(如中风):
颅内压:脑组织内的压力,可用于评估脑水肿和颅内出血。
脑灌注压:脑血流的压力,关联脑灌注状态。
脑电图(EEG):用于检测脑电活动异常,如癫痫发作。
二、神经肌肉疾病(如重症肌无力):
肌电图(EMG):测量肌肉电活动,可用于评估神经肌肉传导功能。
呼吸功能指标:如呼吸频率、潮气量、肺功能测试,用于监测呼吸系统功能。
三、神经系统感染:
脑脊液分析:检测脑脊液中的细胞、蛋白质等指标,有助于诊断感染。
体温:作为全身性感染的指标。
四、癫痫症状:
脑电图(EEG):检测癫痫发作的脑电活动异常。
五、运动神经元疾病(如运动神经元病):
运动神经元功能评估:包括肌力测试、反射测试,用于评估运动神经元损害程度。
呼吸功能评估:由于部分运动神经元疾病可导致呼吸肌无力。
S12、获取医学数据库内医学知识信息,按照数据类型划分为不同因素。
以下是按照不同数据类型划分为不同因素的示例:
一、影像学数据:
MRI、CT等影像学检查结果,用于评估脑结构、血管状况、肌肉状况等。
二、实验室检查数据:
血液学参数、生化指标、免疫学指标,包括血红蛋白、白细胞计数、炎症标志物等。
三、生理监测数据:
监测颅内压、心率、血压、呼吸频率等生理因素。
四、神经电生理学数据:
脑电图(EEG)、肌电图(EMG)、神经传导速度(NCV)等,用于评估神经系统功能。
五、临床评估数据:
病史、临床症状、神经系统体格检查等医师观察和评估的信息。
S13、利用皮尔逊相关性分析算法分析重症指标与各个因素之间的相关关系,经过初次筛选得到满足相关性要求的关联因素。
在本发明的描述中,利用皮尔逊相关性分析算法分析重症指标与各个因素之间的相关关系,经过初次筛选得到满足相关性要求的关联因素包括以下步骤:
S131、将重症指标与因素均作为变量,统计医学数据库中每个变量的样本数,再计算每个变量的均值。
S132、利用均值分别计算两两变量之间的协方差与标准差。
其中,协方差的计算公式为:
标准差的计算公式为:
式中,n表示变量的样本数,i=1,2,3,…,n;
分表表示重症指标与因素对应变量的均值。
S133、利用协方差与标准差计算皮尔逊相关系数,该皮尔逊相关系数的表达式为:
式中,ρX,Y表示皮尔逊相关系数,cov表示协方差,σ表示标准差。
X、Y分别表示重症指标与因素对应的变量。
S134、设定相关性阈值,剔除皮尔逊相关系数低于相关性阈值的因素,保留满足相关性要求的因素作为关联因素。
相关性阈值的设定需要考虑研究领域的专业知识,依据哪些变量在理论上或实践中应该具有较高的相关性,将这些先验信息作为设定相关性阈值的依据。还需要观察数据的分布情况,了解变量之间的变异性。如果数据波动较小,相关性阈值可以适当降低,以便更敏感地检测到相关关系。反之,如果数据波动较大,可以考虑提高相关性阈值,以降低误认为显著相关的风险。
S14、利用随机森林算法对关联因素对于重症指标的重要性进行分析,经过重要性筛选后得到与重症指标密切相关的生理因素。
在本发明的描述中,利用随机森林算法对关联因素对于重症指标的重要性进行分析,经过重要性筛选后得到与重症指标密切相关的生理因素包括以下步骤:
S141、将重症指标作为目标,关联因素作为特征,并指定随机森林中决策树的数量构建随机森林模型,再进行模型训练与测试。
具体的,需要优先整理数据集,确保包含重症指标和关联因素的相关数据。将数据集划分为随机森林模型训练集和随机森林模型测试集,通常采用交叉验证或保留一部分数据用于测试。再指定随机森林中的决策树数量。决策树数量的选择通常是根据实际问题和计算资源进行调整的,一般情况下,随机森林中的树越多,模型的性能可能越好。使用随机森林模型训练集数据,构建随机森林模型。每个决策树都是根据不同的子样本和特征进行构建。在每个决策树节点上,随机选择一个子集的特征进行分裂。再使用随机森林模型训练集数据对随机森林模型进行训练。每个树都对数据进行拟合,并学习关联因素与重症指标之间的关系。
S142、将随机森林模型建模过程中未参与训练的指标因素数据作为袋外数据,并利用袋外数据计算随机森林模型的原始袋外误差。
其中,袋外数据(Out-of-Bag,简称OOB)是在随机森林模型训练过程中未参与训练的数据,可以用于评估模型的性能。在每次构建决策树的过程中,每个样本都有一定的概率未被选择进入当前决策树的训练样本集,这部分未被选择的数据即为袋外数据。
对于每个样本,通过模型预测得到其重症指标的预测值。将模型对于袋外数据的预测值与实际重症指标值进行比较,计算每个样本的误差。再对所有袋外数据的误差进行平均,得到模型的袋外误差。袋外误差反映了模型在未参与训练的数据上的预测性能。
原始袋外误差可以作为一个评估模型性能的指标,具有与交叉验证类似的效果,而无需划分额外的验证集。通过袋外误差的计算,可以更全面地评估模型的泛化性能,尤其在数据较少时尤为有用。
S143、将袋外数据中的某个关联因素的顺序进行随机变换,再次计算随机森林模型的变换袋外误差。
S144、利用原始袋外误差与变换袋外误差计算对应变换的关联因素的重要性,重要性的计算公式为:
式中,I表示进行随机变换的关联因素的重要性,N表示决策树的数量,j=1,2,3,…,m;C0表示原始袋外误差,C′表示变换袋外误差。
S145、设定重要性阈值,按照重要性数值的大小进行排序,保留满足重要性阈值的关联因素作为重症指标的生理因素。
S2、获取患者的基本信息以及基于生理因素检测得到的病历信息。
其中,基本信息收集包括以下方面:
1、个人信息:包括患者的姓名、年龄、性别、联系方式等。
2、医疗历史:过去的疾病史、手术历史、用药历史等。
依据生理因素检测得到的病历信息记录包括以下方面:
1、生理因素:测量和记录患者的生理因素,如血压、心率、呼吸率、体温等。
2、实验室检查:进行必要的实验室检查,包括血液、尿液、影像学检查等。
3、生物学指标:包括血液中的生物标志物、遗传信息等。
4、症状描述:记录患者的主观症状,包括不适感、疼痛程度、持续时间等。
5、体征观察:记录医生观察到的客观体征,如皮肤颜色、眼底检查等。
6、医生诊断和建议:记录医生的诊断、治疗建议以及患者的反馈。
S3、选取生理因素构建训练集与测试集,利用混沌灰狼优化算法优化在线序列极限学习机建立指标预测模型,并进行模型训练与测试。
在本发明的描述中,选取生理因素构建训练集与测试集,利用混沌灰狼优化算法优化在线序列极限学习机建立指标预测模型,并进行模型训练与测试包括以下步骤:
S31、从医学数据库中选取生理因素及其对应的重症指标作为指标预测模型的数据基础,进行标准化处理后划分为训练集与测试集。
其中,进行标准化处理的流程包括异常值处理、缺失值处理以及归一化处理,实现生理因素与重症指标的标准化。训练集与测试集的比例为70%:30%。
S32、初始化在线序列极限学习机的模型参数,再利用混沌灰狼优化算法对模型参数进行全局优化,实现最优个体向模型参数的赋值。
在本发明的描述中,初始化在线序列极限学习机的模型参数,再利用混沌灰狼优化算法对模型参数进行全局优化,实现最优个体向模型参数的赋值包括以下步骤:
S321、选择sigmoid函数作为在线序列极限学习机的激励函数,并设定在线序列极限学习机的隐含层节点数。
S322、初始化灰狼优化算法的种群参数,种群参数包括灰狼种群数、最大迭代次数、最大混沌搜索次数以及灰狼种群初始位置。
S323、利用灰狼种群中每个灰狼位置表示在线序列极限学习机的输入节点和隐含层间的权值和隐含层偏差,实现模型参数的赋值,利用灰狼位置赋值的表达式为:
式中,Rt,iter表示在当前迭代中灰狼位置向量,ap,q表示输入节点p到隐含层节点q之间随机产生的初始权值,bq表示隐含层节点q随机产生的隐含层偏差,iter表示当前迭代的次数。
S33、利用训练集建立在线序列极限学习机模型,再基于灰狼位置更新进行在线序列极限学习机模型的局部寻优。
在本发明的描述中,利用训练集建立在线序列极限学习机模型,再基于灰狼位置更新进行在线序列极限学习机模型的局部寻优包括以下步骤:
S331、利用训练集建立在线序列极限学习机模型,并计算训练集中样本数据的均方根误差作为每只灰狼的适应度,适应度计算公式为:
式中,fit表示灰狼种群中灰狼的适应度,y1表示在线序列极限学习机模型的训练输出结果,y2表示相同生理因素对应的实际结果,W表示训练集中样本数据的总数,w=1,2,…,W。
S332、选取适应度的数值排列前三位的灰狼,并将三只灰狼个体位置进行标记,作为在线序列极限学习机模型的决策层。
S333、若当前迭代次数小于最大迭代次数时,则对灰狼种群中的每只灰狼个体位置进行更新。
在本发明的描述中,若当前迭代次数小于最大迭代次数时,则对灰狼种群中的每只灰狼个体位置进行更新包括以下步骤:
S3331、分别计算适应度位于前列的三只灰狼参与位置更新的权重系数,权重系数的计算公式为:
式中,ωh表示第h只灰狼的权重系数,h=α,β,δ;Rh(t)表示第h只灰狼在t次迭代时的位置,Rα、Rβ、Rδ分别表示三只灰狼。
S3332、利用三只灰狼各自的权重系数,计算灰狼种群中每只灰狼在下次迭代时的个体位置,实现位置更新,个体位置的计算公式为:
式中,Rk(t+1)表示灰狼种群中第k值灰狼在t+1次迭代时的位置,Rk,h表示第k只灰狼相对于第h只灰狼的位置。
S334、灰狼个体位置进行更新后,再次利用适应度计算公式计算每只灰狼的适应度,并将当前迭代次数加一次。
S335、判断当前迭代次数是否小于最大迭代次数,若小于最大迭代次数,则重复执行步骤S331至步骤S335,若不小于最大迭代次数,则返回全局最优位置,作为在线序列极限学习机模型的初始权值与隐含层偏差。
S34、采用最优模型参数建立指标预测模型,再对测试集进行预测。
S4、将病历信息作为模型输入并进行标准化处理,再代入指标预测模型中进行重症指标的分析预测,输出重症指标预测结果。
S41、将从患者病历中提取的各种信息作为模型的输入。
S42、对输入数据进行预处理,包括缺失值处理、异常值处理等。确保输入数据的质量和完整性;再对输入数据进行标准化处理,使得各个特征具有相似的尺度。
S43、将标准化后的病历信息输入预先建立的指标预测模型中。
S44、模型对输入的病历信息进行分析,并预测与重症指标相关的结果。预测结果包括一个二元分类(例如,是否为重症患者)、多类分类(例如,重症程度的分级)或回归问题(预测具体数值)。
请参阅图2,还提供了一种基于优化算法的神经内科重症指标预测系统,该神经内科重症指标预测系统包括:
指标参数生成模块1,用于设定神经内科的重症指标,并利用相关性分析与随机森林算法结合的方式从医学数据库中提取与重症指标相关的生理因素。
病历信息采集模块2,用于获取患者的基本信息以及基于生理因素检测得到的病历信息。
模型训练测试模块3,用于选取生理因素构建训练集与测试集,利用混沌灰狼优化算法优化在线序列极限学习机建立指标预测模型,并进行模型训练与测试。
指标预测分析模块4,用于将病历信息作为模型输入并进行标准化处理,再代入指标预测模型中进行重症指标的分析预测,输出重症指标预测结果。
其中,指标参数生成模块1、病历信息采集模块2、模型训练测试模块3及指标预测分析模块4依次保持连接。
综上所述,借助于本发明的上述技术方案,通过设定神经内科的重症指标并结合相关性分析与随机森林算法,实现了从医学数据库中智能提取与指标相关的生理因素,为建立预测模型提供了全面的特征基础;其次,采用混沌灰狼优化算法优化在线序列极限学习机,不仅充分考虑了模型的全局搜索能力,还提高了模型的收敛性,从而有效提高了指标预测模型的准确性和泛化能力;同时,在构建训练集与测试集时,充分考虑了患者的基本信息和生理因素,提高了模型对个体差异的适应性,从而具备提高预测准确性、适应性和实用性的显著优势。
通过采用皮尔逊相关性分析算法对重症指标与各个因素之间的相关关系进行分析,通过初次筛选得到满足相关性要求的关联因素,有助于缩小研究范围,提高后续分析的效率,再配合引入随机森林算法对关联因素的重要性进行分析,进一步提炼与重症指标密切相关的生理因素,随机森林算法具有较强的适应性和鲁棒性,能够有效处理多因素交互的复杂关系,从而在研究中筛选出对重症指标具有显著影响的生理因素。
通过在初始化在线序列极限学习机的模型参数后,利用混沌灰狼优化算法进行全局优化,将最优个体的参数赋值给模型,有效提高了模型的整体性能,同时在模型建立的过程中,通过灰狼位置的更新进行在线序列极限学习机模型的局部寻优,进一步提高了模型的拟合能力和对潜在特征的抽取能力,从而使得模型更好地适应复杂的生理因素与重症指标之间的非线性关系,使得模型在未见过的数据上具有较好的泛化性能,为神经内科重症指标的准确预测提供了可靠的工具。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

Claims (6)

1.一种基于优化算法的神经内科重症指标预测方法,其特征在于,该神经内科重症指标方法包括以下步骤:
S1、设定神经内科的重症指标,并利用相关性分析与随机森林算法结合的方式从医学数据库中提取与所述重症指标相关的生理因素;
S2、获取患者的基本信息以及基于所述生理因素检测得到的病历信息;
S3、选取所述生理因素构建训练集与测试集,利用混沌灰狼优化算法优化在线序列极限学习机建立指标预测模型,并进行模型训练与测试;
S4、将所述病历信息作为模型输入并进行标准化处理,再代入所述指标预测模型中进行重症指标的分析预测,输出重症指标预测结果;
其中,所述设定神经内科的重症指标,并利用相关性分析与随机森林算法结合的方式从医学数据库中提取与所述重症指标相关的生理因素包括以下步骤:
S11、依据神经内科涉及的神经系统疾病类型,设定相应的重症指标;
S12、获取医学数据库内医学知识信息,按照数据类型划分为不同因素;
S13、利用皮尔逊相关性分析算法分析所述重症指标与各个所述因素之间的相关关系,经过初次筛选得到满足相关性要求的关联因素;
S14、利用随机森林算法对所述关联因素对于所述重症指标的重要性进行分析,经过重要性筛选后得到与所述重症指标密切相关的生理因素;
所述利用皮尔逊相关性分析算法分析所述重症指标与各个所述因素之间的相关关系,经过初次筛选得到满足相关性要求的关联因素包括以下步骤:
S131、将所述重症指标与所述因素均作为变量,统计所述医学数据库中每个所述变量的样本数,再计算每个所述变量的均值;
S132、利用所述均值分别计算两两所述变量之间的协方差与标准差;
S133、利用所述协方差与所述标准差计算皮尔逊相关系数,该皮尔逊相关系数的表达式为:
式中,ρX,Y表示皮尔逊相关系数;
cov表示协方差;
σ表示标准差;
X、Y分别表示重症指标与因素对应的变量;
S134、设定相关性阈值,剔除所述皮尔逊相关系数低于所述相关性阈值的因素,保留满足相关性要求的因素作为关联因素;
所述利用随机森林算法对所述关联因素对于所述重症指标的重要性进行分析,经过重要性筛选后得到与所述重症指标密切相关的生理因素包括以下步骤:
S141、将所述重症指标作为目标,所述关联因素作为特征,并指定随机森林中决策树的数量构建随机森林模型,再进行模型训练与测试;
S142、将所述随机森林模型建模过程中未参与训练的指标因素数据作为袋外数据,并利用所述袋外数据计算所述随机森林模型的原始袋外误差;
S143、将所述袋外数据中的某个所述关联因素的顺序进行随机变换,再次计算所述随机森林模型的变换袋外误差;
S144、利用所述原始袋外误差与所述变换袋外误差计算对应变换的所述关联因素的重要性,所述重要性的计算公式为:
式中,I表示进行随机变换的关联因素的重要性;
N表示决策树的数量,j=1,2,3,…,m;
C0表示原始袋外误差;
C′表示变换袋外误差;
S145、设定重要性阈值,按照所述重要性数值的大小进行排序,保留满足所述重要性阈值的所述关联因素作为所述重症指标的生理因素;
所述选取所述生理因素构建训练集与测试集,利用混沌灰狼优化算法优化在线序列极限学习机建立指标预测模型,并进行模型训练与测试包括以下步骤:
S31、从所述医学数据库中选取所述生理因素及其对应的所述重症指标作为指标预测模型的数据基础,进行标准化处理后划分为训练集与测试集;
S32、初始化在线序列极限学习机的模型参数,再利用混沌灰狼优化算法对所述模型参数进行全局优化,实现最优个体向所述模型参数的赋值;
S33、利用所述训练集建立在线序列极限学习机模型,再基于灰狼位置更新进行所述在线序列极限学习机模型的局部寻优;
S34、采用最优模型参数建立指标预测模型,再对所述测试集进行预测。
2.根据权利要求1所述的一种基于优化算法的神经内科重症指标预测方法,其特征在于,所述进行标准化处理的流程包括异常值处理、缺失值处理以及归一化处理,实现所述生理因素与所述重症指标的标准化;
所述训练集与所述测试集的比例为70%:30%。
3.根据权利要求2所述的一种基于优化算法的神经内科重症指标预测方法,其特征在于,所述初始化在线序列极限学习机的模型参数,再利用混沌灰狼优化算法对所述模型参数进行全局优化,实现最优个体向所述模型参数的赋值包括以下步骤:
S321、选择sigmoid函数作为所述在线序列极限学习机的激励函数,并设定所述在线序列极限学习机的隐含层节点数;
S322、初始化灰狼优化算法的种群参数,所述种群参数包括灰狼种群数、最大迭代次数、最大混沌搜索次数以及灰狼种群初始位置;
S323、利用灰狼种群中每个灰狼位置表示所述在线序列极限学习机的输入节点和隐含层间的权值和隐含层偏差,实现模型参数的赋值,利用灰狼位置赋值的表达式为:
式中,Rt,iter表示在当前迭代中灰狼位置向量;
ap,q表示输入节点p到隐含层节点q之间随机产生的初始权值;
bq表示隐含层节点q随机产生的隐含层偏差;
iter表示当前迭代的次数。
4.根据权利要求3所述的一种基于优化算法的神经内科重症指标预测方法,其特征在于,所述利用所述训练集建立在线序列极限学习机模型,再基于灰狼位置更新进行所述在线序列极限学习机模型的局部寻优包括以下步骤:
S331、利用所述训练集建立在线序列极限学习机模型,并计算所述训练集中样本数据的均方根误差作为每只灰狼的适应度,适应度计算公式为:
式中,fit表示灰狼种群中灰狼的适应度;
y1表示在线序列极限学习机模型的训练输出结果;
y2表示相同生理因素对应的实际结果;
W表示训练集中样本数据的总数,w=1,2,…,W;
S332、选取所述适应度的数值排列前三位的灰狼,并将三只灰狼个体位置进行标记,作为所述在线序列极限学习机模型的决策层;
S333、若当前迭代次数小于最大迭代次数时,则对所述灰狼种群中的每只灰狼个体位置进行更新;
S334、所述灰狼个体位置进行更新后,再次利用适应度计算公式计算每只灰狼的适应度,并将当前迭代次数加一次;
S335、判断当前迭代次数是否小于所述最大迭代次数,若小于所述最大迭代次数,则重复执行步骤S331至步骤S335,若不小于所述最大迭代次数,则返回全局最优位置,作为所述在线序列极限学习机模型的初始权值与隐含层偏差。
5.根据权利要求4所述的一种基于优化算法的神经内科重症指标预测方法,其特征在于,所述若当前迭代次数小于最大迭代次数时,则对所述灰狼种群中的每只灰狼个体位置进行更新包括以下步骤:
S3331、分别计算所述适应度位于前列的三只灰狼参与位置更新的权重系数,所述权重系数的计算公式为:
式中,ωh表示第h只灰狼的权重系数,h=α,β,δ;
Rh(t)表示第h只灰狼在t次迭代时的位置;
Rα、Rβ、Rδ分别表示三只灰狼;
S3332、利用三只灰狼各自的权重系数,计算灰狼种群中每只灰狼在下次迭代时的个体位置,实现位置更新,个体位置的计算公式为:
式中,Rk(t+1)表示灰狼种群中第k值灰狼在t+1次迭代时的位置;
Rk,h表示第k只灰狼相对于第h只灰狼的位置。
6.一种基于优化算法的神经内科重症指标预测系统,用于实现权利要求1-5中任一项所述基于优化算法的神经内科重症指标预测方法,其特征在于,该神经内科重症指标预测系统包括:
指标参数生成模块,用于设定神经内科的重症指标,并利用相关性分析与随机森林算法结合的方式从医学数据库中提取与所述重症指标相关的生理因素;
病历信息采集模块,用于获取患者的基本信息以及基于所述生理因素检测得到的病历信息;
模型训练测试模块,用于选取所述生理因素构建训练集与测试集,利用混沌灰狼优化算法优化在线序列极限学习机建立指标预测模型,并进行模型训练与测试;
指标预测分析模块,用于将所述病历信息作为模型输入并进行标准化处理,再代入所述指标预测模型中进行重症指标的分析预测,输出重症指标预测结果;
其中,所述指标参数生成模块、所述病历信息采集模块、所述模型训练测试模块及所述指标预测分析模块依次保持连接。
CN202410114027.7A 2024-01-27 2024-01-27 一种基于优化算法的神经内科重症指标预测方法及系统 Active CN117637154B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410114027.7A CN117637154B (zh) 2024-01-27 2024-01-27 一种基于优化算法的神经内科重症指标预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410114027.7A CN117637154B (zh) 2024-01-27 2024-01-27 一种基于优化算法的神经内科重症指标预测方法及系统

Publications (2)

Publication Number Publication Date
CN117637154A CN117637154A (zh) 2024-03-01
CN117637154B true CN117637154B (zh) 2024-03-29

Family

ID=90032524

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410114027.7A Active CN117637154B (zh) 2024-01-27 2024-01-27 一种基于优化算法的神经内科重症指标预测方法及系统

Country Status (1)

Country Link
CN (1) CN117637154B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106355192A (zh) * 2016-08-16 2017-01-25 温州大学 一种基于混沌灰狼优化的支持向量机方法
CN112116952A (zh) * 2020-08-06 2020-12-22 温州大学 基于扩散及混沌局部搜索的灰狼优化算法的基因选择方法
CN112652398A (zh) * 2020-12-22 2021-04-13 浙江大学 一种基于机器学习算法的新冠肺炎重症化预测方法及系统
WO2022198761A1 (zh) * 2021-03-22 2022-09-29 江苏大学 一种基于决策树和改进smote算法的哮喘病诊断系统
CN116646078A (zh) * 2023-07-19 2023-08-25 中国人民解放军总医院 一种基于人工智能的心血管急危重症临床决策支持系统及设备
WO2023241012A1 (zh) * 2022-06-16 2023-12-21 南京医科大学 基于深度学习的脑卒中早期康复后功能预测模型建立方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113642613B (zh) * 2021-07-23 2023-10-10 温州大学 基于改进樽海鞘群算法的医学疾病特征选择方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106355192A (zh) * 2016-08-16 2017-01-25 温州大学 一种基于混沌灰狼优化的支持向量机方法
CN112116952A (zh) * 2020-08-06 2020-12-22 温州大学 基于扩散及混沌局部搜索的灰狼优化算法的基因选择方法
CN112652398A (zh) * 2020-12-22 2021-04-13 浙江大学 一种基于机器学习算法的新冠肺炎重症化预测方法及系统
WO2022198761A1 (zh) * 2021-03-22 2022-09-29 江苏大学 一种基于决策树和改进smote算法的哮喘病诊断系统
WO2023241012A1 (zh) * 2022-06-16 2023-12-21 南京医科大学 基于深度学习的脑卒中早期康复后功能预测模型建立方法
CN116646078A (zh) * 2023-07-19 2023-08-25 中国人民解放军总医院 一种基于人工智能的心血管急危重症临床决策支持系统及设备

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
基于KNN和RF算法构建危重患者全因死亡预测模型的研究;李惠萍;胡安民;;中国卫生统计;20200425(第02期);全文 *
基于混沌灰狼优化算法的氧化铝质量指标预测模型;徐辰华;李成县;王尤军;林小峰;;广西大学学报(自然科学版);20161225(第06期);全文 *
基于随机森林的原发性高血压心血管风险预后模型;崔伟锋;刘萧萧;韩静旖;范军铭;;中国老年学杂志;20200225(第04期);全文 *
应用人工神经网络预测ICU患者院内感染;潘思旭;廖吕钊;徐那菲;王希;江荣林;;全科医学临床与教育;20200630(第06期);全文 *

Also Published As

Publication number Publication date
CN117637154A (zh) 2024-03-01

Similar Documents

Publication Publication Date Title
US20200337580A1 (en) Time series data learning and analysis method using artificial intelligence
EP3846685A1 (en) Analysis of cardiac data
CN112641451B (zh) 基于单通道脑电信号多尺度残差网络睡眠分期方法及系统
Ferrari et al. Dealing with confounders and outliers in classification medical studies: The Autism Spectrum Disorders case study
CN112967803A (zh) 基于集成模型的急诊患者早期死亡率预测方法及系统
JP7404581B1 (ja) 自己監督グラフクラスタリングに基づく慢性腎症亜型マイニングシステム
Mahyoub et al. Comparison analysis of machine learning algorithms to rank alzheimer’s disease risk factors by importance
CN116864104A (zh) 基于人工智能的慢性血栓栓塞性肺动脉高压风险分级系统
Manimurugan Classification of Alzheimer's disease from MRI Images using CNN based Pre-trained VGG-19 Model
CN117637154B (zh) 一种基于优化算法的神经内科重症指标预测方法及系统
Sukaria et al. Epileptic seizure detection using convolution neural networks
CN117017310A (zh) 基于知识蒸馏的声电双模先天性心脏病预测装置
Deepa et al. Experimental evaluation of artificial intelligence assisted heart disease prediction using deep learning principle
Valton et al. The importance of group specification in computational modelling of behaviour
Lavanya et al. Robust Analysis of Deep Learning Algorithm for Brain Computer Interface (BCI) Systems based on EEG Signals
US20240156414A1 (en) Method for Predicting Age from Resting-State Scalp EEG Signals Using Deep Convolutional Neural Networks
Ayub et al. Deep 3D-CNN using Resonance Imaging for Diagnosing Alzheimer’s
Khalaf et al. Predicting Acute Respiratory Failure Using Fuzzy Classifier
Elen et al. A hybrid machine learning model for classifying time series
Baysal Assessment of Undergraduate Student Graduation Projects Focusing on Deep Learning in Biomedical Sciences
Wang et al. Higher-order interaction of brain microstructural and functional connectome
Maweu Validation and Interpretable Model Explanations for Synthesized Data in Healthcare
Darmawahyuni et al. Analysis of Classifier Performance on ECG Interpretation for Precision Medicine: Which performance metrics should we use?
Surya et al. Premature Discovery of Long-Term Prolonged Renal Disorder Using Machine Learning Algorithm
Muetunda et al. Improving Mental Disorder Predictions using Feature-Based Machine Learning Techninques

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant