CN117976142A - 一种基于XGBoost和SHAP值的慢性病精准干预系统 - Google Patents
一种基于XGBoost和SHAP值的慢性病精准干预系统 Download PDFInfo
- Publication number
- CN117976142A CN117976142A CN202410389885.2A CN202410389885A CN117976142A CN 117976142 A CN117976142 A CN 117976142A CN 202410389885 A CN202410389885 A CN 202410389885A CN 117976142 A CN117976142 A CN 117976142A
- Authority
- CN
- China
- Prior art keywords
- xgboost
- data
- user
- model
- chronic disease
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 208000017667 Chronic Disease Diseases 0.000 title claims abstract description 42
- 230000036541 health Effects 0.000 claims abstract description 18
- 238000000034 method Methods 0.000 claims abstract description 18
- 238000012549 training Methods 0.000 claims abstract description 12
- 201000010099 disease Diseases 0.000 claims abstract description 9
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 9
- 238000004458 analytical method Methods 0.000 claims abstract description 7
- 238000004140 cleaning Methods 0.000 claims abstract description 6
- 238000005457 optimization Methods 0.000 claims abstract description 3
- 238000007781 pre-processing Methods 0.000 claims abstract description 3
- 230000006870 function Effects 0.000 claims description 31
- 235000005911 diet Nutrition 0.000 claims description 15
- 230000037213 diet Effects 0.000 claims description 15
- 230000003442 weekly effect Effects 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 6
- 230000001684 chronic effect Effects 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 5
- 238000003066 decision tree Methods 0.000 claims description 4
- 238000012502 risk assessment Methods 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 claims description 2
- 230000002401 inhibitory effect Effects 0.000 claims description 2
- 230000003993 interaction Effects 0.000 claims description 2
- 238000005259 measurement Methods 0.000 claims description 2
- 230000009467 reduction Effects 0.000 claims description 2
- 238000012795 verification Methods 0.000 claims description 2
- 238000002790 cross-validation Methods 0.000 abstract 1
- 230000002354 daily effect Effects 0.000 description 19
- 235000013305 food Nutrition 0.000 description 14
- 210000003205 muscle Anatomy 0.000 description 12
- 239000008280 blood Substances 0.000 description 11
- 210000004369 blood Anatomy 0.000 description 11
- 230000009471 action Effects 0.000 description 6
- 230000036772 blood pressure Effects 0.000 description 5
- 230000000291 postprandial effect Effects 0.000 description 5
- 235000013311 vegetables Nutrition 0.000 description 5
- 235000019577 caloric intake Nutrition 0.000 description 4
- 206010012601 diabetes mellitus Diseases 0.000 description 4
- 201000001421 hyperglycemia Diseases 0.000 description 4
- 230000004060 metabolic process Effects 0.000 description 4
- 230000002265 prevention Effects 0.000 description 4
- 235000020985 whole grains Nutrition 0.000 description 4
- 244000068988 Glycine max Species 0.000 description 3
- 235000010469 Glycine max Nutrition 0.000 description 3
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 3
- 244000046052 Phaseolus vulgaris Species 0.000 description 3
- 240000008042 Zea mays Species 0.000 description 3
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 3
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 3
- 230000037396 body weight Effects 0.000 description 3
- 235000005822 corn Nutrition 0.000 description 3
- 238000013480 data collection Methods 0.000 description 3
- 230000003203 everyday effect Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000002641 glycemic effect Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 235000015598 salt intake Nutrition 0.000 description 3
- 230000035488 systolic blood pressure Effects 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 241000251468 Actinopterygii Species 0.000 description 2
- 235000001674 Agaricus brunnescens Nutrition 0.000 description 2
- 208000024172 Cardiovascular disease Diseases 0.000 description 2
- 244000096857 Dioscorea batatas Species 0.000 description 2
- 206010020772 Hypertension Diseases 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 210000000476 body water Anatomy 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 235000013325 dietary fiber Nutrition 0.000 description 2
- 230000035622 drinking Effects 0.000 description 2
- 235000013601 eggs Nutrition 0.000 description 2
- 235000013312 flour Nutrition 0.000 description 2
- 235000021384 green leafy vegetables Nutrition 0.000 description 2
- 235000012054 meals Nutrition 0.000 description 2
- 235000013336 milk Nutrition 0.000 description 2
- 239000008267 milk Substances 0.000 description 2
- 210000004080 milk Anatomy 0.000 description 2
- LPUQAYUQRXPFSQ-DFWYDOINSA-M monosodium L-glutamate Chemical compound [Na+].[O-]C(=O)[C@@H](N)CCC(O)=O LPUQAYUQRXPFSQ-DFWYDOINSA-M 0.000 description 2
- 235000013923 monosodium glutamate Nutrition 0.000 description 2
- 239000004223 monosodium glutamate Substances 0.000 description 2
- 235000021110 pickles Nutrition 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000035485 pulse pressure Effects 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 235000013555 soy sauce Nutrition 0.000 description 2
- 230000009182 swimming Effects 0.000 description 2
- 230000009184 walking Effects 0.000 description 2
- 235000019737 Animal fat Nutrition 0.000 description 1
- 240000007087 Apium graveolens Species 0.000 description 1
- 244000205754 Colocasia esculenta Species 0.000 description 1
- 235000006481 Colocasia esculenta Nutrition 0.000 description 1
- 206010010774 Constipation Diseases 0.000 description 1
- 235000002722 Dioscorea batatas Nutrition 0.000 description 1
- 235000006536 Dioscorea esculenta Nutrition 0.000 description 1
- 235000003416 Dioscorea oppositifolia Nutrition 0.000 description 1
- 239000004278 EU approved seasoning Substances 0.000 description 1
- 240000008620 Fagopyrum esculentum Species 0.000 description 1
- 235000009419 Fagopyrum esculentum Nutrition 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 208000029549 Muscle injury Diseases 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 241000237502 Ostreidae Species 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- 235000013559 Schnittsellerie Nutrition 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 210000001015 abdomen Anatomy 0.000 description 1
- 210000000577 adipose tissue Anatomy 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 235000015241 bacon Nutrition 0.000 description 1
- 235000015278 beef Nutrition 0.000 description 1
- 235000008429 bread Nutrition 0.000 description 1
- 235000021329 brown rice Nutrition 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 239000008162 cooking oil Substances 0.000 description 1
- 208000029078 coronary artery disease Diseases 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 235000006694 eating habits Nutrition 0.000 description 1
- 235000019197 fats Nutrition 0.000 description 1
- 235000019688 fish Nutrition 0.000 description 1
- 235000011194 food seasoning agent Nutrition 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 230000001121 heart beat frequency Effects 0.000 description 1
- 235000003642 hunger Nutrition 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 210000003141 lower extremity Anatomy 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- -1 monosodium glutamate Chemical class 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 235000020636 oyster Nutrition 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 244000144977 poultry Species 0.000 description 1
- 235000021075 protein intake Nutrition 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
- 230000002040 relaxant effect Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 208000001076 sarcopenia Diseases 0.000 description 1
- 235000015067 sauces Nutrition 0.000 description 1
- 159000000000 sodium salts Chemical class 0.000 description 1
- 235000014347 soups Nutrition 0.000 description 1
- 230000037351 starvation Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 210000001364 upper extremity Anatomy 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明涉及疾病分析技术领域,具体涉及一种基于XGBoost和SHAP值的慢性病精准干预系统,干预系统包括有云平台、用户端设备与管理端设备,干预步骤为:S1、收集慢性病用户的基本信息和上传的日常健康数据,对其进行数据清洗和预处理,以确保数据质量和一致性;S2、根据S1步骤中确定的数据项,构建XGBoost算法基础模型,并结合交叉验证与极值寻优优化方法对模型进行训练和调优,针对特定的慢性病人群。本发明通过将XGBoost算法与SHAP值分析相结合,实现对慢性病的预测,同时利用SHAP值发现和解释模型的关键特征,为个性化的干预方案提供科学依据,此外,本系统具备较高的扩展性和适应性,并能够根据不同疾病类型进行针对性的优化和调整,带来更好的使用前景。
Description
技术领域
本发明属于疾病分析技术领域,具体为一种基于XGBoost和SHAP值的慢性病精准干预系统。
背景技术
在全球范围内,慢性病的高发态势已对个体健康和公共卫生构成了严重挑战,根据国际糖尿病联盟的调查数据显示,中国已成为全球糖尿病患者数量最多的国家,几乎是排名第二的印度的两倍,另据国家心血管病中心的数据显示,我国18岁及以上的居民中,高血压的患病率高达27.5%,也就是说每四个成年人中就有一人患有高血压,更引人注目的是,心血管疾病在城乡居民疾病死亡原因中所占比例最大,2019年农村和城市的CVD分别占死因的46.74%和44.26%,换句话说,每五例死亡病例中就有两例是因CVD而死亡,在心血管疾病的死亡原因中,冠心病占了53%。因此,本发明着重关注这三种慢性病的健康管理,提出了一种基于XGBoost和SHAP值的慢性病精准干预系统。
发明内容
针对现有技术的不足,本发明提供了一种基于XGBoost和SHAP值的慢性病精准干预系统,以解决以上技术问题。
为实现上述目的,本发明提供如下技术方案:一种基于XGBoost和SHAP值的慢性病精准干预系统,干预系统包括有云平台、用户端设备与管理端设备,干预步骤为:
S1、收集慢性病用户的基本信息和上传的日常健康数据,对其进行数据清洗和预处理,以确保数据质量和一致性;
S2、根据S1步骤中确定的数据项,构建XGBoost算法基础模型,并结合交叉验证与极值寻优优化方法对模型进行训练和调优,针对特定的慢性病人群,提取与疾病相关的影响因素,并构建数据集;
S3、利用SHAP值方法分析特征对预测结果的贡献度,得出每个特征的正负影响关系,为干预方案的制定提供依据;
S4、根据S3步骤中得到的患者的个体特征和模型分析结果,生成适合该患者的精准运动饮食干预方案,并通过用户界面展示给医生和患者,以指导治疗和健康管理;
S5、经过一段时间对S4步骤中生成的运动饮食方案的干预,将用户的数值变化通过用户界面展示给用户,生成相关的周报和月报,让用户实时了解自己干预的效果,并根据用户数值的变化及时更新用户的干预方案,直至用户各项数值达到稳定的健康状态。
优先地,S1步骤中根据人体数值的极限确定输入数据的合理范围进行数据清洗,对于数据的缺失值,通过多重插补技术进行填充,以保证数据的无偏估计,得到模型训练的数据集为:
其中n是样本数,m是数据的维度;
对应患者的慢性病标签集为:
其中l为慢性病类型数量。
优先地,S2步骤中XGBoost算法基于Boosting学习方法进行构建,Boosting的思想通过迭代的方式,每次训练一个新的弱学习器,然后将其加入到已有的弱学习器集合中,从而不断提高整个模型的准确性,XGBoost是由k个弱学习器组成的一个加法模型,假设我们第t次迭代要训练的树模型为:
(1)
其中,是第t次迭代后样本i的预测结果,/>是前t-1次分类器相加的结果,是第t个分类器;
XGboost的损失函数为:
(2)
其中,是模型预测的慢性病患者标签,/>是真实的慢性病患者标签,n是患者数量;
其目的是通过模型训练,使得预测结果与真实标签差值L最小,模型的预测精度由模型的偏差和方差共同决定,损失函数代表了模型的偏差,为了降低方差,需要在目标函数中添加正则项,以防止过拟合,因此,目标函数由模型的损失函数 L 和抑制模型复杂度的正则项Ω组成,目标函数的定义如下:
(3)
其中,正则项是将全部t个弱学习器的复杂度进行求和,添加到目标函数中作为正则化项。
优先地,由于XGBoost是boosting族中的算法,所以遵从前向分步加法,以第t 步的模型为例,模型对第i个样本 的预测值为:
(4)
其中,是由第t-1的模型给出的预测值,是已知常数,/>是这次需要加入的新模型的预测值,此时,目标函数就可以写成:
(5)
此时公式(5)只有一个变量,其余都是已知量或可通过已知量计算出来的,我们将正则化项进行拆分,由于前t-1个学习器的结构已经确定,因此前t-1棵树的复杂度之和可以用一个常量表示/>,如公式(6)所示:
(6)
公式(6)中的t表示输入数据的总数目,优化目标为最小化目标函数minObj。
优先地,针对公式(5)中唯一变量,通过决策树的形式将模型参数化,将公式(5)中正则化项通过决策树的形式进一步拆分为如下公式:
(7)
公式(7)中为树的深度,/>为叶子节点个数,/>为惩罚项系数,/>为/> 正则化项,代入后得目标函数为:
(8)
下面将 从对每一项输入数据的输出求和,转为对每一个叶子节点的输出求和,公式为如下:
(9)
公式(9)中 是被分到第 /> 个叶子节点中的 /> 的序号集合;
设定公式(9)树的结构是确定的,即公式(8)中/>和/>两个参数是确定的,/>也是确定的,剩下的自变量就只有/>,得到了一个一元二次方程,将问题转化为求解该方程的极值。
优先地,考虑二次项系数的正负性,是惩罚项系数,是非负的,而,是损失函数的二阶导数,使用平方损失,它的二阶导函数恒为正数,因此目标函数二次项系数也恒为正,根据一元二次方程的性质,求解目标函数的最小值;
(10)
代入公式(9)可求得:
(11)
公式(11)中为确定的树结构,/>作为评分函数,用来计算树结构的得分;
最后通过贪心算法来求得树结构的局部最优解:
假设和/>是分割后的左节点和右节点的/>的序号集合,/>,那么每次分裂后/>的减少值为:
(12)
通过公式(12)最佳的分裂点,不断分裂,最终得到XGBoost模型得到日常数据对慢性病标签的影响程度。
优先地,S3步骤中的Shap值算法详细步骤为如下:
A1、定义基准值,为了计算Shap值,需要定义一个基准值,基准值是一个参考点,它表示在没有任何特征影响的情况下的预测结果,选择整个训练集的平均预测值作为基准值;
A2、计算Shaply值,对于每个样本和每个特征,Shaply值衡量了该特征对于模型预测结果的贡献程度,通过迭代地添加或移除特征,观察预测结果的变化,并计算不同特征组合的贡献;
A3、解释预测结果,Shaply值解释每个特征对于预测结果的影响,以及不同特征组合对于预测结果的贡献,即Shapf(x)值如公式:
(13)
其中样本预测值,/>是定义的基准,/>是特征i的Shaply值,z是样本的指示向量,表示在所有的M个特征中。
优先地,S3步骤中得到的Shap值可以反馈给用户患有各种慢性病的风险概率,定义50%为边界,则风险评估公式为:
(14)
其中和/>是性别和各慢性病对应的权重系数,若风险概率大于50%,则定义为患有该慢性病,风险概率小于50则说明不具备该慢性病的风险,概率越大风险越高,反之则越健康。
优先地,S4步骤中通过计算出各个测量数据的Shaply值,对其进行降序排列,将结果反馈给用户和管理端,管理端的医生将结合云服务器中的处方库,向用户推送针对性的运动和饮食方案,并通过线上指导互动,帮助用户完成日常生活方式的调整。
优先地,S5步骤中将用户的日常数据变化清晰地展示给用户,并生成相应的周报,该周报包括有降低或增加的风险程度、哪些数据有明显的增加或减少与哪些方面的数据还需要注意提醒,根据用户干预后的数据及时更新运动和饮食方案。
与现有技术相比,本发明的有益效果如下:
本发明通过将XGBoost算法与SHAP值分析相结合,通过XGBoost模型实现对慢性病的预测,同时利用SHAP值发现和解释模型的关键特征,为个性化的干预方案提供科学依据,此外,本系统具备较高的扩展性和适应性,并能够根据不同疾病类型进行针对性的优化和调整,带来更好的使用前景。
本发明利用XGBoost模型和SHAP值分析方法,准确识别个体慢性病患者在日常健康数据上的差异,实现个体患者慢性病风险评估和干预方案的精准制定,该系统基于大规模的日常数据以及患者的性别、年龄和患病标签,结合机器学习算法,能够全面评估患者的健康状况,提供健康报告,并根据个体数据差异,提供精准、个性化的饮食和运动建议,生成有效的健康管理方案,对患者的健康和康复具有重要的指导意义。
附图说明
图1为本发明干预系统流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种基于XGBoost和SHAP值的慢性病精准干预系统,慢性病精准干预系统包括云平台、用户端设备与管理端设备,云平台包括数据收集模块,影响因素提取模块、评估指导模块以及存储模块,数据收集模块包括数据采集和数据清洗,影响因素提取模块包括XGboost特征提取、训练拟合、极值寻优以及Shap解释等操作,以此将用户上传的数据通过该模块分析后得到用户与疾病相关的因素并排序,训练拟合,是根据以往用户上传的历史数据以及患病标签进行训练,使得训练结果与用户实际标签相符,极值寻优,则通过贪心算法、求极值等操作不断优化算法模型,以提高算法的精度,评估指导模块根据提取的特征数据生成相应健康报告,并从存储模块中选取相应的运动饮食方案,存储模块保存用户上传的数据,以及预先设置的运动、饮食方案库,用户端设备功能如下:
首先上传日常健康数据,日常健康数据包括手环数据,体脂秤记录、血糖记录、血压记录,详细的数据种类如下表所示;
表1为用户上传的数据种类
其中心率记录为用户每5分钟记录的心率数,取用户一天的心率均值和心率方差,所述血糖类型包括空腹、餐前、餐后和睡前几种类型;
用户通过客户端上传数据至云平台,并从云平台接收患者异常数据预警和风险评估,同时通过小程序获取来自管理端设备生成的健康报告、运动饮食方案和在线指导,用户根据精准化干预方案调整日常生活方式,定期生成周报和月报,直观了解干预效果,系统会根据用户数据变化及时更新干预方案并反馈给用户,直至用户达到健康的稳态。
下面采用三组高血糖患者案例来具体说明精准化得到影响用户患有慢性病身体健康情况;
高血糖患者1
健康风险
1.血糖值偏高,空腹血糖正常值为4.4-6.1mmol/L,患者为6.38mmol/L;
2.疑似心跳频率异常,血压偏高,正常收缩压为90-139mmHg,患者为139处于上限值;
3.体水分不足,正常体水分应为55%-65%,患者为53%。
饮食建议
1.合理控制能量摄入量是糖尿病营养治疗的首要原则,建议每日能量摄入1700-2000kcal,维持健康体重;
2.关注血压值变化和心率数据,应减少钠盐摄入,每天食盐摄入不宜超过5g,同时注意味精、酱油、蚝油、咸菜等隐形盐的摄入;
3.主食定量,优选全谷物和低血糖生成指数食物,其中全谷物和杂豆类等低GI食物,应占主食的1/3 以上,可适当选择荞麦面、燕麦面、玉米等食材;
4.膳食纤维具有较好的防治糖尿病的作用,可有效的改善糖代谢,降低血压、降血脂和防止便秘,可适当选择叶类蔬菜、芹菜、菌菇类食材;
5.多吃蔬菜水果,每日饮水1500-1700ml。
运动建议
1.运动前做准备活动,应控制运动心率不高于100,由于年龄较大,运动中要注意防跌倒、防骨折;
2.建议每日三餐后进行散步,有利于餐后血糖控制,每日运动步数建议6000-8000步;
3.每周3天进行抗阻增肌运动,隔天进行,每天8-10个动作,每个动作做3组,每组重复8-15次,可选用哑铃、水瓶、沙袋、弹力带等抗阻运动设备。
高血糖患者2
健康风险
1.血糖值偏高,空腹血糖正常值为4.4-6.1mmol/L,患者为7.2mmol/L;
2.肌肉衰减风险较高,该年龄女性正常肌肉量为29.1-34,7kg,患者为29.6kg,处于下限值;
3.基础代谢较低,该年龄女性正常基础代谢应高于1300kcal,患者仅为881kcal。
饮食建议
1.建议每日能量摄入1000-1300kcal,维持健康体重,适当增肌;
2.选择GI≤55的低升糖指数食物,如全谷物、杂豆类、蔬菜等,这些食物富含膳食纤维,且含有丰富的VB1、VB2,以及钾、镁等矿物质,更耐饥饿,可有效减缓餐后血糖波动。可适当选择玉米、糙米、黄豆、叶类蔬菜、菌菇等食物;
3.每日蛋白质摄入推荐40-60g,建议以鸡蛋、牛奶、牛肉、鱼肉、大豆及其制品等优蛋白为主,有助于提高基础代谢,预防肌肉衰减辅助增肌;
4.改变进食习惯,先汤菜后主食,有利于控制餐后血糖,防止血糖大幅波动;
5.每日饮水1500-1700ml。
运动建议
1.运动前可选择3-5个拉伸动作进行10分钟热身,运动过程中注意防止跌倒;
2.每天进行30-40分钟有氧运动,控制运动心率不高于120,可选择广场舞、骑自行车、快步走、游泳等运动形式;
3.每周3天进行抗阻运动,隔天进行,每次不少于20分钟,可选择弹力带或水瓶作为抗阻运动工具,预防少肌症。
高血糖患者3
健康风险
1.血压偏高,正常收缩压为90-139mmHg,患者为137mmHg,处于上限值;
2.肌肉衰减风险较高,该年龄男性正常肌肉量为49.4-59.4kg,患者为52.4kg,需要增肌;
3.脉压差大,脉压差的正常值为30-60mmHg,患者为69mmHg。
饮食建议
1.建议每日能量摄入1600-2000kcal,维持健康体重,适当增肌;
2.培养清淡口味,每日烹调油使用量宜控制在25g以内,少吃动物脂肪,适当控制富含胆固醇的食物,食盐用量每日不宜超过5g,同时,注意限制酱油、鸡精、味精、咸菜、咸肉、酱菜等含盐量较高的调味品和食物的使用;
3.主食要定量,碳水化合物主要来源以全谷物、各种豆类、蔬菜等为好,可适当用蒸煮的玉米、山药、芋头、土豆等部分替代馒头、米饭等主食;
4.餐餐都应有蔬菜,每天应达500g,其中深色蔬菜占一半以上;天天有奶类和大豆,常吃鱼、禽,适量蛋和畜肉,预防肌肉衰减,辅助增肌;
5.每日饮水1500-1700ml。
运动建议
1.运动前做准备活动,运动中注意防跌倒、防骨折,控制最高运动心率在110以内;
2.每天进行40-50分钟的有氧运动,如步行、骑自行车、游泳均可,有氧运动建议安排在三餐后进行,有助于餐后血糖控制;
3.隔天进行一次抗阻运动,可选择俯卧撑、平板支撑、哑铃等锻炼上肢、下肢和腰腹背核心肌肉群的抗阻运动,每次20-30分钟,运动后注意拉伸放松,防止肌肉受伤。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型。
Claims (10)
1.一种基于XGBoost和SHAP值的慢性病精准干预系统,其特征在于,
干预系统包括有云平台、用户端设备与管理端设备,干预步骤为:
S1、收集慢性病用户的基本信息和上传的日常健康数据,对其进行数据清洗和预处理,以确保数据质量和一致性;
S2、根据S1步骤中确定的数据项,构建XGBoost算法基础模型,并结合交叉验证与极值寻优优化方法对模型进行训练和调优,针对特定的慢性病人群,提取与疾病相关的影响因素,并构建数据集;
S3、利用SHAP值方法分析特征对预测结果的贡献度,得出每个特征的正负影响关系,为干预方案的制定提供依据;
S4、根据S3步骤中得到的患者的个体特征和模型分析结果,生成适合该患者的精准运动饮食干预方案,并通过用户界面展示给医生和患者,以指导治疗和健康管理;
S5、经过一段时间对S4步骤中生成的运动饮食方案的干预,将用户的数值变化通过用户界面展示给用户,生成相关的周报和月报,让用户实时了解自己干预的效果,并根据用户数值的变化及时更新用户的干预方案,直至用户各项数值达到稳定的健康状态。
2.根据权利要求1所述的基于XGBoost和SHAP值的慢性病精准干预系统,其特征在于:S1步骤中根据人体数值的极限确定输入数据的合理范围进行数据清洗,对于数据的缺失值,通过多重插补技术进行填充,以保证数据的无偏估计,得到模型训练的数据集为:
;
其中n是样本数,m是数据的维度;
对应患者的慢性病标签集为:
;
其中l为慢性病类型数量。
3.根据权利要求1所述的基于XGBoost和SHAP值的慢性病精准干预系统,其特征在于:S2步骤中XGBoost算法基于Boosting学习方法进行构建,Boosting的思想通过迭代的方式,每次训练一个新的弱学习器,然后将其加入到已有的弱学习器集合中,从而不断提高整个模型的准确性,XGBoost是由k个弱学习器组成的一个加法模型,假设我们第t次迭代要训练的树模型为:
(1)
其中,是第t次迭代后样本i的预测结果,/>是前t-1次分类器相加的结果,是第t个分类器;
XGboost的损失函数为:
(2)
其中,是模型预测的慢性病患者标签,/>是真实的慢性病患者标签,n是患者数量;
其目的是通过模型训练,使得预测结果与真实标签差值L最小,模型的预测精度由模型的偏差和方差共同决定,损失函数代表了模型的偏差,为了降低方差,需要在目标函数中添加正则项,以防止过拟合,因此,目标函数由模型的损失函数 L 和抑制模型复杂度的正则项Ω组成,目标函数的定义如下:
(3)
其中,正则项是将全部t个弱学习器的复杂度进行求和,添加到目标函数中作为正则化项。
4.根据权利要求3所述的基于XGBoost和SHAP值的慢性病精准干预系统,其特征在于:由于XGBoost是boosting族中的算法,所以遵从前向分步加法,以第t 步的模型为例,模型对第i个样本 的预测值为:
(4)
其中,是由第t-1的模型给出的预测值,是已知常数,/>是这次需要加入的新模型的预测值,此时,目标函数就可以写成:
(5)
此时公式(5)只有一个变量,其余都是已知量或可通过已知量计算出来的,我们将正则化项进行拆分,由于前t-1个学习器的结构已经确定,因此前t-1棵树的复杂度之和可以用一个常量表示/>,如公式(6)所示:
(6)
公式(6)中的t表示输入数据的总数目,优化目标为最小化目标函数min Obj。
5.根据权利要求4所述的基于XGBoost和SHAP值的慢性病精准干预系统,其特征在于:针对公式(5)中唯一变量,通过决策树的形式将模型参数化,将公式(5)中正则化项通过决策树的形式进一步拆分为如下公式:
(7)
公式(7)中为树的深度,/>为叶子节点个数,/>为惩罚项系数,/>为/> 正则化项,代入后得目标函数为:
(8)
下面将 从对每一项输入数据的输出求和,转为对每一个叶子节点的输出求和,公式为如下:
(9)
公式(9)中 是被分到第 /> 个叶子节点中的 /> 的序号集合;
设定公式(9)树的结构是确定的,即公式(8)中/>和/>两个参数是确定的,/>也是确定的,剩下的自变量就只有/>,得到了一个一元二次方程,将问题转化为求解该方程的极值。
6.根据权利要求5所述的基于XGBoost和SHAP值的慢性病精准干预系统,其特征在于:考虑二次项系数的正负性,是惩罚项系数,是非负的,而 />,是损失函数的二阶导数,使用平方损失,它的二阶导函数恒为正数,因此目标函数二次项系数也恒为正,根据一元二次方程的性质,求解目标函数的最小值;
(10)
代入公式(9)可求得:
(11)
公式(11)中为确定的树结构,/>作为评分函数,用来计算树结构的得分;
最后通过贪心算法来求得树结构的局部最优解:
假设和/>是分割后的左节点和右节点的/>的序号集合,/>,那么每次分裂后/>的减少值为:
(12)
通过公式(12)最佳的分裂点,不断分裂,最终得到XGBoost模型得到日常数据对慢性病标签的影响程度。
7.根据权利要求1所述的基于XGBoost和SHAP值的慢性病精准干预系统,其特征在于:S3步骤中的Shap值算法详细步骤为如下:
A1、定义基准值,为了计算Shap值,需要定义一个基准值,基准值是一个参考点,它表示在没有任何特征影响的情况下的预测结果,选择整个训练集的平均预测值作为基准值;
A2、计算Shaply值,对于每个样本和每个特征,Shaply值衡量了该特征对于模型预测结果的贡献程度,通过迭代地添加或移除特征,观察预测结果的变化,并计算不同特征组合的贡献;
A3、解释预测结果,Shaply值解释每个特征对于预测结果的影响,以及不同特征组合对于预测结果的贡献,即Shapf(x)值如公式:
(13)
其中样本预测值,/>是定义的基准,/>是特征i的Shaply值,z是样本的指示向量,表示在所有的M个特征中。
8.根据权利要求1所述的基于XGBoost和SHAP值的慢性病精准干预系统,其特征在于:S3步骤中得到的Shap值可以反馈给用户患有各种慢性病的风险概率,定义50%为边界,则风险评估公式为:
(14)
其中和/>是性别和各慢性病对应的权重系数,若风险概率大于50%,则定义为患有该慢性病,风险概率小于50则说明不具备该慢性病的风险,概率越大风险越高,反之则越健康。
9.根据权利要求1所述的基于XGBoost和SHAP值的慢性病精准干预系统,其特征在于:S4步骤中通过计算出各个测量数据的Shaply值,对其进行降序排列,将结果反馈给用户和管理端,管理端的医生将结合云服务器中的处方库,向用户推送针对性的运动和饮食方案,并通过线上指导互动,帮助用户完成日常生活方式的调整。
10.根据权利要求1所述的基于XGBoost和SHAP值的慢性病精准干预系统,其特征在于:S5步骤中将用户的日常数据变化清晰地展示给用户,并生成相应的周报,该周报包括有降低或增加的风险程度、哪些数据有明显的增加或减少与哪些方面的数据还需要注意提醒,根据用户干预后的数据及时更新运动和饮食方案。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410389885.2A CN117976142A (zh) | 2024-04-02 | 2024-04-02 | 一种基于XGBoost和SHAP值的慢性病精准干预系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410389885.2A CN117976142A (zh) | 2024-04-02 | 2024-04-02 | 一种基于XGBoost和SHAP值的慢性病精准干预系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117976142A true CN117976142A (zh) | 2024-05-03 |
Family
ID=90851873
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410389885.2A Pending CN117976142A (zh) | 2024-04-02 | 2024-04-02 | 一种基于XGBoost和SHAP值的慢性病精准干预系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117976142A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111445980A (zh) * | 2020-03-26 | 2020-07-24 | 北京动亮健康科技有限公司 | 膳食方案反应性预测模型及建模方法、电子设备 |
CN114242245A (zh) * | 2021-12-23 | 2022-03-25 | 中国人民解放军总医院第一医学中心 | 一种基于电子病历记录数据预测糖尿病肾病发生风险的机器学习方法、系统和装置 |
CN114927230A (zh) * | 2022-04-11 | 2022-08-19 | 四川大学华西医院 | 基于机器学习的重症心衰患者预后决策支持系统及方法 |
CN115101199A (zh) * | 2022-05-16 | 2022-09-23 | 中国人民解放军总医院 | 用于重症老年患者的可解释公平早期死亡风险评估模型、装置、及其建立方法 |
CN115346598A (zh) * | 2022-07-26 | 2022-11-15 | 电子科技大学 | 一种慢性肾脏病遗传基因风险筛查系统 |
-
2024
- 2024-04-02 CN CN202410389885.2A patent/CN117976142A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111445980A (zh) * | 2020-03-26 | 2020-07-24 | 北京动亮健康科技有限公司 | 膳食方案反应性预测模型及建模方法、电子设备 |
CN114242245A (zh) * | 2021-12-23 | 2022-03-25 | 中国人民解放军总医院第一医学中心 | 一种基于电子病历记录数据预测糖尿病肾病发生风险的机器学习方法、系统和装置 |
CN114927230A (zh) * | 2022-04-11 | 2022-08-19 | 四川大学华西医院 | 基于机器学习的重症心衰患者预后决策支持系统及方法 |
CN115101199A (zh) * | 2022-05-16 | 2022-09-23 | 中国人民解放军总医院 | 用于重症老年患者的可解释公平早期死亡风险评估模型、装置、及其建立方法 |
CN115346598A (zh) * | 2022-07-26 | 2022-11-15 | 电子科技大学 | 一种慢性肾脏病遗传基因风险筛查系统 |
Non-Patent Citations (1)
Title |
---|
FULIANG YI ET AL: "XGBoost-SHAP-based interpretable diagnostic framework for alzheimer’s disease", BMC MEDICAL INFORMATICS AND DECISION MAKING, vol. 23, 25 July 2023 (2023-07-25), pages 1 - 14 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Clinton et al. | The world cancer research fund/American institute for cancer research third expert report on diet, nutrition, physical activity, and cancer: impact and future directions | |
US10817778B2 (en) | Customized cooking utilizing deep learning neuromorphic computing of hyperspectral input | |
CN110097946A (zh) | 一种基于营养成分分析的饮食推荐方法 | |
US20190290172A1 (en) | Systems and methods for food analysis, personalized recommendations, and health management | |
Meng et al. | Lifestyle factors and chronic diseases: application of a composite risk index | |
KR102161774B1 (ko) | 영양소 조합비율을 통한 맞춤형 식단 조절 시스템을 이용한 맞춤형 식단 조절 방법 | |
KR20190009405A (ko) | 개인 맞춤형 자동화 식단 제공방법 | |
US20220230730A1 (en) | Recipe recommendation method and device, computing device and storage medium | |
CN109243580A (zh) | 一种降血糖的智能营养配餐系统及饮食管理方法 | |
CN109243578A (zh) | 减脂监控方法、装置及系统 | |
CN109509539A (zh) | 一种饮食习惯健康风险评估方法 | |
CN111261260A (zh) | 一种膳食推荐系统 | |
KR20190119236A (ko) | 생체 및 습관정보를 이용한 개인 맞춤형 인공지능 정보제공 시스템 및 방법 | |
CN116453652A (zh) | 糖尿病患者饮食量控制方法、装置、计算机设备及其存储介质 | |
CN113936774A (zh) | 一种饮食推荐方法、装置、系统、存储介质及电子设备 | |
Chen et al. | A chronic disease diet recommendation system based on domain ontology and decision tree | |
KR20110050955A (ko) | 개인 맞춤형 물품구매 및 식단추천 서비스 제공방법 | |
Pop et al. | Particle swarm optimization-based method for generating healthy lifestyle recommendations | |
CN109036512A (zh) | 一种用于减重的膳食评分方法及实现该方法的装置 | |
JP3185839U (ja) | 糖尿病治療困難者支援システム及び肥満症治療困難者支援システム | |
CN117976142A (zh) | 一种基于XGBoost和SHAP值的慢性病精准干预系统 | |
KR20180073779A (ko) | 개인 맞춤형 자동화 식단 제공방법 | |
CN113744840A (zh) | 基于集中供餐环境实现个性化即时营养评价及指导的系统及其方法 | |
CN103500431A (zh) | 瘦身图谱减肥方法 | |
Ritenbaugh et al. | Dietary acculturation among the Dogrib Indians of the Canadian northwest territories |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination |