CN111445978B - 运动方案反应性预测模型及建模方法、电子设备 - Google Patents

运动方案反应性预测模型及建模方法、电子设备 Download PDF

Info

Publication number
CN111445978B
CN111445978B CN202010221951.7A CN202010221951A CN111445978B CN 111445978 B CN111445978 B CN 111445978B CN 202010221951 A CN202010221951 A CN 202010221951A CN 111445978 B CN111445978 B CN 111445978B
Authority
CN
China
Prior art keywords
exercise
indexes
motion
given
scheme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010221951.7A
Other languages
English (en)
Other versions
CN111445978A (zh
Inventor
张永亮
叶骏
陈娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dongliang Health Technology Co ltd
Original Assignee
Beijing Dongliang Health Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dongliang Health Technology Co ltd filed Critical Beijing Dongliang Health Technology Co ltd
Priority to CN202010221951.7A priority Critical patent/CN111445978B/zh
Publication of CN111445978A publication Critical patent/CN111445978A/zh
Application granted granted Critical
Publication of CN111445978B publication Critical patent/CN111445978B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/30ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to physical therapies or activities, e.g. physiotherapy, acupressure or exercising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Theoretical Computer Science (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Physical Education & Sports Medicine (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本发明公开一种运动方案反应性预测模型及建模方法、电子设备,所述运动方案反应性预测模型的建模方法,包括如下步骤:S101:采集训练数据并进行预处理,所述采集训练数据并进行预处理的方法包括:采集代谢疾病患者的指标和运动信息数据;通过评价代谢疾病患者的指标得到运动方案效果;以及通过分析运动方案效果筛选出显著影响因素;S102:设置XGBoost的训练参数;S103:以显著影响因素和运动信息数据作为模型的输入,以运动方案效果作为模型的输出,基于XGBoost算法采用十折交叉验证法对模型进行训练;S104:使用步骤S103中训练好的模型进行预测。本发明建立的预测模型能够辅助医生形成更有效的运动方案,提高运动干预效果。

Description

运动方案反应性预测模型及建模方法、电子设备
技术领域
本发明涉及生物医学工程技术与运动健康领域,具体涉及一种运动方案反应性预测模型及建模方法。
背景技术
运动对代谢疾病的预防和治疗的作用不容忽视,研究表明适量的运动可以改善代谢疾病的血糖、血压和血脂情况。但是目前医生开具的运动方案存在如下问题:
(1)运动方案的效果不可控,医生在开具运动方案之前,只清楚该运动方案可以改善患者的代谢情况,但不清楚这种运动方案可以改善到什么程度。
(2)目前的运动方案无法做到有针对性,针对同种疾病的患者,医生开具的运动方案可能是一样的,但由于个体其他条件的差异,实际产生的效果是不一样的,因此对于同种运动方案,有些患者的改善效果很好,有些患者的改善效果很差。
(3)运动方案过于粗放,医生按照指南开具的是规定用户运动强度、运动时间、运动频次和运动类型,未能具体量化患者的更多运动信息,诸如运动时间的选择、强度过大的运动时间,无效的运动时间、运动效率以及评价这些运动信息对干预效果的影响。
因此,亟待开发一种预测模型,能够针对不同的患者做到有针对性的运动方案。
发明内容
为了使医生对开具的运动方案的效果可以预测,本发明的提供一种运动方案反应性预测模型及建模方法、电子设备。
根据本发明的第一方面,本发明公开一种运动方案反应性预测模型的建模方法,包括如下步骤:
S101:采集训练数据并进行预处理,所述采集训练数据并进行预处理的方法包括:采集训练用的代谢疾病患者的指标和运动信息数据;通过评价代谢疾病患者的指标得到运动方案效果;以及通过分析运动方案效果筛选出显著影响因素;其中,所述代谢疾病患者的指标包括一般指标、综合评估指标、运动风险和代谢指标;
S102:设置XGBoost的训练参数;
S103:以显著影响因素和运动信息数据作为模型的输入,以运动方案效果作为模型的输出,基于XGBoost算法采用十折交叉验证法对模型进行训练;
S104:使用步骤S103中训练好的模型进行预测。
根据本发明的一示例实施方式,所述一般指标包括年龄、性别、受教育程度和疾病史,所述一般指标在给定运动周期开始前采集。
根据本发明的一示例实施方式,所述综合评估指标包括运动心肺能力、静息心电图指标和超声心动图指标,所述综合评估指标分别在给定运动周期开始前和给定运动周期结束后采集。
根据本发明的一示例实施方式,所述运动风险分为低危、中危和高危,所述运动风险通过问卷进行评估。运动风险在基线期进行评估,基线期(baseline period)指的是临床研究中,患者已经过筛选加入研究,但还未开始运动干预的这一段时间。
根据本发明的一示例实施方式,所述代谢指标包括空腹血糖、舒张压、收缩压、总胆固醇、甘油三酯和体重,所述代谢指标分别在给定运动周期开始前和给定运动周期结束后采集。
根据本发明的一示例实施方式,所述运动信息数据包括运动量、运动强度、运动时间、运动类型、运动类型个数、运动次数和运动时机选择,所述运动信息数据在给定运动周期内每周进行采集。
根据本发明的一示例实施方式,所述给定运动周期为1个月以上。
根据本发明的一示例实施方式,通过评价代谢疾病患者的指标得到运动方案效果的方法包括:基于给定运动周期开始和给定运动周期结束的代谢指标变化情况,评价运动方案效果为有效或无效,满足一下所有条件则认为运动方案有效,反之则认为运动方案无效:
如果患有糖尿病时,给定运动周期结束时的空腹血糖值低于给定运动周期开始时的空腹血糖值且降低超过给定血糖阈值;
如果患有高血压时,给定运动周期结束时的血压低于给定运动周期开始时的血压,且收缩压至少降低给定收缩压阈值和舒张压至少降低给定舒张压阈值,其中所述血压包括收缩压和舒张压;
如果患血脂异常时,给定运动周期结束时的血脂低于给定运动周期开始时的血脂,且总胆固醇至少降低给定总胆固醇阈值和甘油三酯至少降低给定甘油三酯阈值,其中所述血脂包括总胆固醇和甘油三酯;
如果肥胖或超重时,给定运动周期结束时的体重低于给定运动周期开始时的体重,且控制在正常水平,且至少降低给定体重阈值。
根据本发明的一示例实施方式,所述通过分析运动方案效果筛选出显著影响因素的方法包括:基于单变量分析筛选法分析代谢疾病患者的指标,对于服从正态分布的数据采用独立T检验,对于不服从正态分布的数据采用Wilconxon秩和检验。在构建模型之前,面临的第一步往往就是降维,或者说筛选特征。单变量分析筛选法的主要思路就是根据统计检验的方法分别对每个变量进行检验,然后排序选择分数最高的那些特征。
根据本发明的一示例实施方式,所述设置XGBoost的训练参数的内容包括:树的最大深度设置为6;学习率设为0.3;学习目标定义为:运动方案有效定义为1,运动方案无效定义为0;迭代次数设置为50棵。
根据本发明的一示例实施方式,所述基于XGBoost算法采用十折交叉验证法对模型进行训练的方法包括:采用XGBoost算法生成一个分类树的集合,每个分类树利用十折交叉验证法进行训练,将对应每棵树的叶子节点得分相加,对第i个样本的特征计算出预测估计值,建立目标函数,再将机器学习模型输出的预测估计值经过四舍五入后定义为运动方案效果的有无,其中,i为1到n的自然数,n表示训练用的代谢疾病患者的样本数量,n为大于或等于1000的自然数。
为了充分利用样本及确保算法的准确性,采用十折交叉验证法将n例患者的数据集分成十份,分为训练集和测试集,轮流将其中的9份作为训练数据,1份作为测试数据进行试验。
根据本发明的一示例实施方式,所述对第i个样本的特征计算出的预测估计值的计算公式如公式1所示:
Figure BDA0002426401100000041
其中,fk表示每一棵回归树的预测结果,K为回归树的数量,xi表示第i个样本的特征,yi表示第i个样本的预测估计值,公式1表示给定一个输入值xi,输出值为K棵回归树的预测估计值yi
第t次迭代的目标函数如公式2所示:
Figure BDA0002426401100000042
其中,l是一个可以微分的损失函数,yi,yi ~(t-1)表示第t-1次迭代中第i个样本的实际值yi ~(t-1)与预测值yi之间的差异,ft(xi)是经过第t次迭代后第i个样本的预测结果,Ω(ft)是复杂度的惩罚函数,用来避免过拟合,t为大于1的自然数。
根据本发明的一示例实施方式,所述使用步骤S103中训练好的模型进行预测的方法包括:
采集需要预测的代谢疾病患者的指标和运动信息数据;
从需要预测的代谢疾病患者的指标中筛选出显著影响因素;和
将需要预测的代谢疾病患者的显著影响因素和运动信息数据输入训练好的模型中,得到运动方案反应性预测结果。
根据本发明的第二方面,本发明公开一种运动方案反应性预测模型,包括:
训练数据采集模块,所述训练数据采集模块与运动方案有效性分析模块、显著影响因素筛选模块、算法模块连接,用于采集训练用的代谢疾病患者的指标和运动信息数据;
测试数据采集模块,所述测试数据采集模块与显著影响因素筛选模块、算法模块连接,用于采集需要预测的代谢疾病患者的指标和运动信息数据;
运动方案有效性分析模块,所述运动方案有效性分析模块与训练数据采集模块、显著影响因素筛选模块、算法模块连接,用于通过训练用的代谢疾病患者的指标分析运动方案的有效性;
显著影响因素筛选模块,所述显著影响因素筛选模块与训练数据采集模块、测试数据采集模块、运动方案有效性分析模块、算法模块连接,用于根据训练用的代谢疾病患者的指标和运动方案有效性分析出显著影响因素,还用于筛选出需要预测的代谢疾病患者的显著影响因素;和
算法模块,所述算法模块用于根据训练用的代谢疾病患者的显著影响因素、运动信息数据和运动方案有效性进行训练,还用于接收需要预测的代谢疾病患者的显著影响因素和运动信息数据,并输出预测数据所对应的运动方案的有效性。
根据本发明的一示例实施方式,所述算法模块包括训练参数模块和XGBoost函数模块,所述训练参数模块存储XGBoost算法中的训练参数,包括树的最大深度、学习率、学习目标和迭代次数,所述XGBoost函数包括XGBoost算法中的调用函数,所述XGBoost算法中的调用函数包括train函数和predict函数。
根据本发明的一示例实施方式,所述预测模型根据所述运动方案反应性预测模型的建模方法建立。
根据本发明的第三方面,本发明公开一种电子设备,包括:处理器、存储器和总线,所述处理器和所述存储器通过所述总线完成相互间的通信,所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,能够执行所述运动方案反应性预测模型的建模方法。
本发明提供了一种运动方案反应性预测模型及建模方法,该模型基于XGBoost机器学习算法构建,能够预测患者经过一个给定运动周期的干预后,细化的运动方案带来的效果是否能够使患者的代谢指标改善到目标值,从而辅助医生形成更有效的运动方案,提高运动干预效果。在运动方案效果有无的定义中,本发明还针对血糖、血压血脂给定了阈值,这种阈值既可以用来定义运动方案效果的有无,也可以理解为希望患者能够改善的程度,当预测模型通过输入运动方案预测该运动方案可以满足达到效果时,也可以认为该方案可以实现给定设置的改善程度,因此,本发明的预测模型能够让医生直观地看到运动方案对患者代谢的改善程度。
附图说明
通过参照附图详细描述其示例实施例,本发明的上述和其它目标、特征及优点将变得更加显而易见。
图1是运动方案反应性预测模型的建模方法流程图。
图2是运动方案反应性预测模型的模块关系图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本发明的描述将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。附图仅为本发明的示意性图解,并非一定是按比例绘制。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本发明的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、步骤等。在其它情况下,不详细示出或描述公知结构、方法、实现或者操作以避免喧宾夺主而使得本发明的各方面变得模糊。
本发明的第一种实施方式公开了一种运动方案反应性预测模型的建模方法,如图1所示,包括以下步骤:
步骤101:采集训练数据并进行预处理;
步骤102:设置XGBoost的训练参数;
步骤103:基于XGBoost算法采用十折交叉验证法对模型进行训练;
步骤104:使用步骤S103中训练好的模型进行预测。
步骤101中,采集训练数据并进行预处理的方法包括如下步骤:
步骤S201:采集n例训练用的代谢疾病患者的指标和运动信息数据,n为大于或等于1000的自然数。代谢疾病患者的指标包括一般指标、综合评估指标、运动风险和代谢指标。一般指标包括年龄、性别、受教育程度和疾病史,一般指标在给定运动周期开始前采集。综合评估指标包括运动心肺能力、静息心电图指标和超声心动指标,综合评估指标分别在给定运动周期开始前和给定运动周期结束后采集。运动风险分为低危、中危和高危,运动风险在基线期通过问卷进行评估。代谢指标包括空腹血糖、舒张压、收缩压、总胆固醇、甘油三酯和体重,代谢指标分别在给定运动周期开始前和给定运动周期结束后采集。运动信息数据包括运动量、运动强度、运动时间、运动类型、运动类型个数、运动次数和运动时机选择,运动信息数据在给定运动周期内每周进行采集。给定运动周期为1个月以上。采集代谢疾病患者的指标和运动信息数据时,对所有指标和运动信息数据参数进行归一化处理,保证所有指标数值的范围在0-1之间。
步骤S202:通过评价代谢疾病患者的指标得到运动方案效果,运动方案效果为有效或无效,基于给定运动周期开始和给定运动周期结束的代谢指标变化情况得出,满足以下条件则认为有效,否则认为无效:
如果患有糖尿病时,给定运动周期结束时的空腹血糖值低于给定运动周期开始时的空腹血糖值且超过给定血糖阈值,给定血糖阈值用Athra表示;
如果患有高血压时,给定运动周期结束时的收缩低于给定运动周期开始时的收缩压且收缩压至少降低给定收缩压阈值、并且给定运动周期结束时的舒张压低于运动周期开始时的舒张压且舒张压至少降低给定舒张压阈值,给定收缩压阈值用Bthra表示,给定舒张压阈值用Bthrb表示;
如果患血脂异常时,给定运动周期结束时的总胆固醇低于给定运动周期开始时的总胆固醇且总胆固醇至少降低给定总胆固醇阈值、并且给定运动周期结束时的甘油三酯低于运动周期开始时的甘油三酯且甘油三酯至少降低给定甘油三酯阈值,给定总胆固醇阈值用Cthra表示,给定甘油三酯阈值用Cthrb表示;
如果肥胖或超重时,给定运动周期结束时的体重低于给定运动周期开始时的体重,且控制在正常水平,且至少降低给定体重阈值,给定体重阈值用Dthra表示。
步骤S203:通过分析运动方案效果筛选出显著影响因素,基于单变量分析筛选法分析代谢疾病患者的指标,对于服从正态分布的数据采用独立T检验,对于不服从正态分布的数据采用Wilconxon秩和检验。
步骤102中,设置XGBoost的四个训练参数:
树的最大深度设置为6,树的最大深度即为树的层数,通常树的层数越深模型越复杂;
学习率设置为0.3,学习率即每次调整参数需要走的距离,适当的学习率可以准确找到损失函数的最小值,即为模型参数的最优解;
学习目标,即定义模型的输出,模型的输出需要判断运动方案为有效或无效,是二分类问题,因此定义运动方案有效为1,运动方案无效为0;
迭代次数,表示定义模型会用到多少课树,将迭代次数设置为50棵。
在XGBoost中设置训练参数,输入以下代码:
param=['max_depth':6,'eta':0.3,'silent':0,'obejctive':'binary:logistic']
其中,max_depth表示树的最大深度,eta表示学习率,slient表示静默模式,objective表示学习目标参数,binary:logistic表示模型中输出二分类的逻辑回归的概率。
步骤103中,开始训练模型,以显著影响因素和运动信息数据作为模型的输入,以运动方案效果作为模型的输出,基于XGBoost算法采用十折交叉验证法对模型进行训练。在XGBoost机器学习系统中调用XGBoost中的train函数,输入以下代码:
bst=xgb.train(param,dtrain,50)
其中,bst表示最后train训练后的结果,50表示迭代次数。
train函数在调用的过程中,通过以下原理进行计算:
采用XGBoost算法生成一个分类树的集合,每个分类树利用十折交叉验证法进行训练,将对应每棵树的叶子节点得分相加,对第i个样本的特征计算出预测估计值,建立目标函数,再将机器学习模型输出的预测估计值经过四舍五入后定义为运动方案的有无,其中,i为1到n的自然数。
对第i个样本的特征计算出的预测估计值的计算公式如公式1所示:
Figure BDA0002426401100000091
其中,fk表示每一棵回归树的预测结果,K为回归树的数量,xi表示第i个样本的特征,yi表示第i个样本的预测估计值,公式1表示给定一个输入值xi,输出值为K棵回归树的预测估计值yi
第t次迭代的目标函数如公式2所示:
Figure BDA0002426401100000092
其中,l是一个可以微分的损失函数,yi,yi ~(t-1)表示第t-1次迭代中的第i个样本的实际值yi ~(t-1)与预测值yi之间的差异,ft(xi)是经过第t次迭代后第i个样本的预测结果,Ω(ft)是复杂度的惩罚函数,用来避免过拟合,t为大于1的自然数。
步骤104中,用步骤S103中训练好的模型进行预测,具体方法为:
步骤S301:采集m例需要预测的代谢疾病患者的指标和运动信息数据,m为大于或等于100的自然数,采集代谢疾病患者的指标和运动信息数据时,对所有指标和运动信息数据参数进行归一化处理,保证所有指标数值的范围在0-1之间;
步骤S302:从需要预测的代谢疾病患者的指标中筛选出显著影响因素;
步骤S303:将需要预测的代谢疾病患者的显著影响因素和运动信息数据输入训练好的模型中,调用XGBoost中的predict函数,机器学习模型输出的预测估计值如果输出的数值≥0.5则认为运动方案有效,如果输出的数值<0.5则认为运动方案无效;因此,将predict输出的结果百分数通过round函数四舍五入转换成0或1,最终输出的结果为预测运动方案效果的有无,运动方案有效则输出1,运动方案无效则输出0。通过输入以下代码实现:
test_preds=bst.predict(dtest)
test_predictions=[round(value)for value in test_preds]
y_test=dtest.get_label()
test_accuracy=accuracy_score(y_test,test_predictions)
训练好的模型最终输出值为0或1,直观地显示运动方案的有效或无效。
本发明的第二种实施方式公开了一种运动方案反应性预测模型,该预测模型根据第一种实施方式的建模方法建立,如图2所示,包括:训练数据采集模块1、测试数据采集模块2、运动方案有效性分析模块3、显著影响因素筛选模块4和算法模块5;算法模块1与训练数据采集模块1、测试数据采集模块2、运动方案有效性分析模块3、显著影响因素筛选模块4连接,显著影响因素筛选模块4与测试数据采集模块2、训练数据采集模块1、运动方案有效性分析模块3、算法模块5连接,运动方案有效性分析模块3与训练数据采集模块1、显著影响因素分析模块4、算法模块5连接。
训练数据采集模块1用于采集训练用的代谢疾病患者的指标和运动信息数据;测试数据采集模块2用于采集需要预测的代谢疾病患者的指标和运动信息数据;运动方案有效性分析模块3用于通过训练用的代谢疾病患者的指标分析运动方案的有效性;显著影响因素筛选模块4用于根据训练用的代谢疾病患者的指标和运动方案有效性分析出显著影响因素,还用于筛选出需要预测的代谢疾病患者的指标中的显著影响因素;算法模块5用于根据训练用的代谢疾病患者的显著影响因素、运动信息数据和运动方案有效性进行训练,还用于接收需要预测的代谢疾病患者的显著影响因素和运动信息数据,并输出预测数据所对应的运动方案的有效性。算法模块5包括训练参数模块和XGBoost函数模块,训练参数模块存储XGBoost算法中的训练参数,包括树的最大深度、学习率、学习目标和迭代次数,XGBoost函数模块包括XGBoost算法中的调用函数,调用函数包括train函数和predict函数。
本发明以上基于XGBoost机器学习算法构建的预测模型,能够预测患者经过一个给定运动周期的干预后,能够判断医生对代谢疾病患者所开具的细化的运动方案是否能够使患者的代谢指标改善到目标值,从而辅助医生形成更有效的运动方案,提高运动干预效果。
本发明的第三种实施方式公开了一种电子设备,包括:处理器、存储器和总线,处理器和存储器通过总线完成相互间的通信,存储器存储有可被处理器执行的程序指令,处理器调用所述程序指令,能够执行第一种实施方式的运动方案反应性预测模型的建模方法。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

Claims (9)

1.一种运动方案反应性预测模型的建模方法,其特征在于,包括如下步骤:
S101:采集训练数据并进行预处理,所述采集训练数据并进行预处理的方法包括:采集n例训练用的不同的代谢疾病患者的指标和运动信息数据,n为大于或等于1000的自然数;通过评价代谢疾病患者的指标得到运动方案效果;以及通过分析运动方案效果筛选出显著影响因素;其中,所述代谢疾病患者的指标包括一般指标、综合评估指标、运动风险、代谢指标,所述运动信息数据包括运动量、运动强度、运动时间、运动类型、运动类型个数、运动次数和运动时机选择,所述显著影响因素从代谢疾病患者的指标中筛选出,所述通过评价代谢疾病患者的指标得到运动方案效果的方法包括:基于给定运动周期开始和给定运动周期结束的代谢指标变化情况,评价运动方案效果为有效或无效,给定运动周期为一个月以上;所述一般指标包括年龄、性别、受教育程度和疾病史,所述一般指标在给定运动周期开始前采集;
所述综合评估指标包括运动心肺能力、静息心电图指标和超声心动图指标,所述综合评估指标分别在给定运动周期开始前和给定运动周期结束后采集;
S102:设置XGBoost的训练参数;
S103:以显著影响因素和运动信息数据作为模型的输入,以运动方案效果作为模型的输出,基于XGBoost算法采用十折交叉验证法对模型进行训练;
S104:使用步骤S103中训练好的模型进行预测;
所述基于XGBoost算法采用十折交叉验证法对模型进行训练的方法包括:
采用XGBoost算法生成一个分类树的集合,每个分类树利用十折交叉验证法进行训练,将对应每棵树的叶子节点得分相加,对第i个样本的特征计算出预测估计值,建立目标函数,再将机器学习模型输出的预测估计值经过四舍五入后定义为运动方案效果的有无;其中,i为1到n的自然数,n表示训练用的代谢疾病患者的样本数量,n为大于或等于1000的自然数;
所述对第i个样本的特征计算出的预测估计值的计算公式如公式1所示:
公式1
Figure 673596DEST_PATH_IMAGE001
其中,fk表示每一棵回归树的预测结果,K为回归树的数量,xi表示第i个样本的特征,yi表示第i个样本的预测估计值,公式1表示给定一个输入值xi,输出值为K棵回归树的预测估计值yi
2.根据权利要求1所述的运动方案反应性预测模型的建模方法,其特征在于,所述运动风险分为低危、中危和高危,所述运动风险通过问卷进行评估;
所述代谢指标包括空腹血糖、舒张压、收缩压、总胆固醇、甘油三酯和体重,所述代谢指标分别在给定运动周期开始前和给定运动周期结束后采集;
所述运动信息数据在给定运动周期内的每周进行采集。
3.根据权利要求1所述的运动方案反应性预测模型的建模方法,其特征在于,满足以下所有条件则认为运动方案有效,反之则认为运动方案无效:
如果患有糖尿病时,给定运动周期结束时的空腹血糖值低于给定运动周期开始时的空腹血糖值且降低超过给定血糖阈值,
如果患有高血压时,给定运动周期结束时的血压低于给定运动周期开始时的血压,且收缩压至少降低给定收缩压阈值和舒张压至少降低给定舒张压阈值,其中所述血压包括收缩压和舒张压,
如果患血脂异常时,给定运动周期结束时的血脂低于给定运动周期开始时的血脂,且总胆固醇至少降低给定总胆固醇阈值和甘油三酯至少降低给定甘油三酯阈值,其中所述血脂包括总胆固醇和甘油三酯,
如果肥胖或超重时,给定运动周期结束时的体重低于给定运动周期开始时的体重,且控制在正常水平,且至少降低给定体重阈值。
4.根据权利要求1所述的运动方案反应性预测模型的建模方法,其特征在于,所述通过分析运动方案效果筛选出显著影响因素的方法包括:基于单变量分析筛选法分析代谢疾病患者的指标,对于服从正态分布的数据采用独立T检验,对于不服从正态分布的数据采用Wilconxon秩和检验。
5.根据权利要求1所述的运动方案反应性预测模型的建模方法,其特征在于,第t次迭代的目标函数如公式2所示:
公式2
Figure 731681DEST_PATH_IMAGE003
其中,l是一个可微分的损失函数,yi,yi ~(t-1)表示第t-1次迭代中的第i个样本的实际值yi ~(t-1)与预测值yi之间的差异,ft(xi)是经过第t次迭代后第i个样本的预测结果,Ω(ft)是复杂度的惩罚函数,t为大于1的自然数。
6.根据权利要求1所述的运动方案反应性预测模型的建模方法,其特征在于,所述使用步骤S103中训练好的模型进行预测的方法包括:
采集需要预测的代谢疾病患者的指标和运动信息数据;
从需要预测的代谢疾病患者的指标中筛选出显著影响因素;和
将需要预测的代谢疾病患者的显著影响因素和运动信息数据输入训练好的模型中,得到运动方案反应性的预测结果。
7.一种运动方案反应性预测模型,其特征在于,根据权利要求1-6所述的建模方法建立,包括:
训练数据采集模块,所述训练数据采集模块与运动方案有效性分析模块、显著影响因素筛选模块、算法模块连接,用于采集n例训练用的代谢疾病患者的指标和运动信息数据,n为大于或等于1000的自然数;其中,所述代谢疾病患者的指标包括一般指标、综合评估指标、运动风险和代谢指标,所述运动信息数据包括运动量、运动强度、运动时间、运动类型、运动类型个数、运动次数和运动时机选择;
测试数据采集模块,所述测试数据采集模块与显著影响因素筛选模块、算法模块连接,用于采集需要预测的代谢疾病患者的指标和运动信息数据;
运动方案有效性分析模块,所述运动方案有效性分析模块与训练数据采集模块、显著影响因素筛选模块、算法模块连接,用于通过训练用的代谢疾病患者的指标分析运动方案的有效性,基于给定运动周期开始和给定运动周期结束的代谢指标变化情况,评价运动方案效果为有效或无效,给定运动周期为一个月以上;
显著影响因素筛选模块,所述显著影响因素筛选模块与训练数据采集模块、测试数据采集模块、运动方案有效性分析模块、算法模块连接,用于根据训练用的代谢疾病患者的指标和运动方案有效性分析出显著影响因素,还用于筛选出需要预测的显著影响因素,所述显著影响因素从代谢疾病患者的指标中筛选出;和
算法模块,所述算法模块用于根据训练用的代谢疾病患者的显著影响因素、运动信息数据和运动方案有效性进行训练,还用于接收需要预测的代谢疾病患者的显著影响因素和运动信息数据,并输出预测数据所对应的运动方案的有效性。
8.根据权利要求7所述运动方案反应性预测模型,其特征在于,所述算法模块包括训练参数模块和XGBoost函数模块,所述训练参数模块存储XGBoost算法中的训练参数,包括树的最大深度、学习率、学习目标和迭代次数,所述XGBoost函数模块包括XGBoost算法中的调用函数,所述XGBoost算法中的调用函数包括train函数和predict函数。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,
所述处理器和所述存储器通过所述总线完成相互间的通信,所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,能够执行如权利要求1-6中任一项所述的运动方案反应性预测模型的建模方法。
CN202010221951.7A 2020-03-26 2020-03-26 运动方案反应性预测模型及建模方法、电子设备 Active CN111445978B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010221951.7A CN111445978B (zh) 2020-03-26 2020-03-26 运动方案反应性预测模型及建模方法、电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010221951.7A CN111445978B (zh) 2020-03-26 2020-03-26 运动方案反应性预测模型及建模方法、电子设备

Publications (2)

Publication Number Publication Date
CN111445978A CN111445978A (zh) 2020-07-24
CN111445978B true CN111445978B (zh) 2021-12-07

Family

ID=71654379

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010221951.7A Active CN111445978B (zh) 2020-03-26 2020-03-26 运动方案反应性预测模型及建模方法、电子设备

Country Status (1)

Country Link
CN (1) CN111445978B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111968748A (zh) * 2020-08-21 2020-11-20 南通大学 一种糖尿病并发症预测模型的建模方法
CN113936771B (zh) * 2021-12-17 2022-04-15 北京因数健康科技有限公司 一种健康指标目标的迭代生成方法及装置
CN114582463A (zh) * 2022-05-05 2022-06-03 成都尚医信息科技有限公司 一种基于机器学习的个性化运动指导系统及方法
CN117198517B (zh) * 2023-06-27 2024-04-30 安徽省立医院(中国科学技术大学附属第一医院) 基于机器学习的运动反应性评估和预测模型的建模方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8155735B2 (en) * 2006-09-19 2012-04-10 The Cleveland Clinic Foundation Prediction and prevention of postoperative atrial fibrillation in cardiac surgery patients
CN108447540A (zh) * 2018-03-15 2018-08-24 广州大象健康科技有限公司 一种采集运动健康数据生成运动处方的方法
CN109065113A (zh) * 2018-07-12 2018-12-21 山东师范大学 基于机器学习的人体减重方案推荐方法、系统及介质
CN110322947A (zh) * 2019-06-14 2019-10-11 电子科技大学 一种基于深度学习的高血压老年人运动处方推荐方法
CN110782991A (zh) * 2019-10-23 2020-02-11 吉林大学 一种辅助心脏病患者康复运动的实时评价方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8155735B2 (en) * 2006-09-19 2012-04-10 The Cleveland Clinic Foundation Prediction and prevention of postoperative atrial fibrillation in cardiac surgery patients
CN108447540A (zh) * 2018-03-15 2018-08-24 广州大象健康科技有限公司 一种采集运动健康数据生成运动处方的方法
CN109065113A (zh) * 2018-07-12 2018-12-21 山东师范大学 基于机器学习的人体减重方案推荐方法、系统及介质
CN110322947A (zh) * 2019-06-14 2019-10-11 电子科技大学 一种基于深度学习的高血压老年人运动处方推荐方法
CN110782991A (zh) * 2019-10-23 2020-02-11 吉林大学 一种辅助心脏病患者康复运动的实时评价方法

Also Published As

Publication number Publication date
CN111445978A (zh) 2020-07-24

Similar Documents

Publication Publication Date Title
CN111445978B (zh) 运动方案反应性预测模型及建模方法、电子设备
US8554580B2 (en) Automated management of medical data using expert knowledge and applied complexity science for risk assessment and diagnoses
Buongiorno et al. Deep learning for processing electromyographic signals: A taxonomy-based survey
Jaimes et al. A stress-free life: just-in-time interventions for stress via real-time forecasting and intervention adaptation
US20100217094A1 (en) Point-of-care enactive medical system and method
Nemat et al. Blood glucose level prediction: advanced deep-ensemble learning approach
CN114203295B (zh) 脑卒中风险预测干预方法及系统
Assegie et al. An empirical study on machine learning algorithms for heart disease prediction
Kumar et al. Hybrid Bijective soft set-Neural network for ECG arrhythmia classification
Chen et al. Toward reliable signals decoding for electroencephalogram: A benchmark study to EEGNeX
CN111445980B (zh) 膳食方案反应性预测模型及建模方法、电子设备
Huynh et al. Probabilistic domain-knowledge modeling of disorder pathogenesis for dynamics forecasting of acute onset
CN115394448B (zh) 冠心病运动反应性预测模型的建模方法、模型、设备
Faust et al. The role of real-time in biomedical science: A meta-analysis on computational complexity, delay and speedup
CN115547502B (zh) 基于时序数据的血透病人风险预测装置
WO2021072084A1 (en) Systems and methods for cognitive diagnostics for neurological disorders: parkinson's disease and comorbid depression
CN112329921B (zh) 基于深度表征学习和强化学习的利尿剂剂量推理设备
CN101512567A (zh) 从确定性模型中导出概率模型的方法和装置
Madhuri et al. Novel Internet of Things Based Disease Diagnosis Framework for Smart Healthcare Schemes using Combined Optimized Artificial Intelligence Approach
Popa et al. Risk Estimator using a Multi-Layer Perceptron Network for Coronary Artery Disease Prevention.
KR102536982B1 (ko) 문진표를 이용한 인공지능 기반의 질병 예측 방법 및 장치
Pattabiraman et al. Heart Disease Prediction Desktop Application Using Supervised Learning
Meng Deep Learning-Based Prediction Frameworks for Longitudinal Data Analysis
Halawani et al. Nature-Inspired Metaheuristic Algorithm with deep learning for Healthcare Data Analysis
Reddy An Efficient Healthcare Monitoring System for Cardiovascular Diseases using Deep Modified Neural Networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant