CN113796852B - 一种基于梯度提升决策树模型算法的糖尿病足预测方法 - Google Patents

一种基于梯度提升决策树模型算法的糖尿病足预测方法 Download PDF

Info

Publication number
CN113796852B
CN113796852B CN202111165298.8A CN202111165298A CN113796852B CN 113796852 B CN113796852 B CN 113796852B CN 202111165298 A CN202111165298 A CN 202111165298A CN 113796852 B CN113796852 B CN 113796852B
Authority
CN
China
Prior art keywords
characteristic
plantar
plantar pressure
value
pressure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111165298.8A
Other languages
English (en)
Other versions
CN113796852A (zh
Inventor
杨琨
桑胜波
张婕妮
吴玉广
穆汉栋
郝润芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taiyuan University of Technology
Original Assignee
Taiyuan University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taiyuan University of Technology filed Critical Taiyuan University of Technology
Priority to CN202111165298.8A priority Critical patent/CN113796852B/zh
Publication of CN113796852A publication Critical patent/CN113796852A/zh
Application granted granted Critical
Publication of CN113796852B publication Critical patent/CN113796852B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/103Detecting, measuring or recording devices for testing the shape, pattern, colour, size or movement of the body or parts thereof, for diagnostic purposes
    • A61B5/1036Measuring load distribution, e.g. podologic studies
    • A61B5/1038Measuring plantar pressure during gait
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/68Arrangements of detecting, measuring or recording means, e.g. sensors, in relation to patient
    • A61B5/6801Arrangements of detecting, measuring or recording means, e.g. sensors, in relation to patient specially adapted to be attached to or worn on the body surface
    • A61B5/6802Sensor mounted on worn items
    • A61B5/6804Garments; Clothes
    • A61B5/6807Footwear
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7275Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Surgery (AREA)
  • Veterinary Medicine (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physiology (AREA)
  • Psychiatry (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Dentistry (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本发明一种基于梯度提升决策树模型算法的糖尿病足预测方法,属于糖尿病足分析检测技术领域;所要解决的技术问题为:提供一种基于梯度提升决策树模型算法的糖尿病足预测方法的改进;解决该技术问题采用的技术方案为:在待测人员足底设置柔性压力传感器,采集相应的足底压力数据,再使用震动觉阈值检测仪对待测人员的双足趾骨关节头、内踝处进行震动感觉阈值检测,测试多次取均值记录;将足底压力数据构建足底总压力与时间变换曲线,并处理测试者单个步态周期的足底压力数据;将提取到的足底压力数据进行分区,对得到的特征值进行分区域成比例特征缩放,将特征值进行比例运算得到新的缩放后特征值;本发明应用于在医疗辅助诊断领域康复的步态预测。

Description

一种基于梯度提升决策树模型算法的糖尿病足预测方法
技术领域
本发明一种基于梯度提升决策树模型算法的糖尿病足预测方法,属于糖尿病足分析检测技术领域。
背景技术
随着人们生活水平的不断改善,随之而来的是慢性病患病比例的不断提高,糖尿病足作为糖尿病常见的并发症,具有病程长、难治愈的特点,且长期发病将会导致截肢,严重时危及生命;目前可以通过早期筛查做到对糖尿病足风险的预防,也可以提高患病初期的治愈率,筛查预防的方式主要通过分析人体化验数据或简单观察,不能准确把握病情发展情况,缺少快速且相对准确的糖尿病足预测方法。
目前关于糖尿病足的研究证实了足底压力可用于预测糖尿病足溃疡,对糖尿病患者足底压力的筛查可以检测糖尿病足风险人群,采用缓解足底压力的干预治疗方式可以有效的防止和治疗足溃疡形成;针对足底压力分析主要采用震动感觉阈值VPT检测方法,是一种简单、易操作的能够有效筛查糖尿病周围神经病变DPN的方法,VPT也是一种有效的关于足部溃疡发生风险程度的评价手段,是预测糖尿病足发生风险的可靠指标,对糖尿病患者VPT检测,可帮助发现糖尿病足风险患者,及早采取相应的预见性护理措施;根据国内研究标准以震动阈值风险VPT≤10V为正常,VPT>10V为异常,其中10V<VPT≤15V为轻危,15V<VPT≤25V为中危,VPT>25V为高危,采用该检测方法可以有效减少患者糖尿病足的发生率。
但是,现有的糖尿病足预测技术仅根据足底压力各项特征对糖尿病足进行预测,单一特征来源使糖尿病足预测结果特别是在区分异常情况的风险等级结果方面的准确率受限。
发明内容
本发明为了克服现有技术中存在的不足,所要解决的技术问题为:提供一种基于梯度提升决策树模型算法的糖尿病足预测方法的改进。
为了解决上述技术问题,本发明采用的技术方案为:一种基于梯度提升决策树模型算法的糖尿病足预测方法,包括如下预测步骤:
步骤一:在待测人员足底设置柔性压力传感器,采集相应的足底压力数据,再使用震动感觉阈值检测仪对待测人员的双足趾骨关节头、内踝处进行震动感觉阈值检测,测试多次取均值记录;
步骤二:根据步骤1中采集的足底压力数据构建足底总压力与时间变换曲线,并处理测试者单个步态周期的足底压力数据;
在足底总压力与时间变换曲线最小值1s的领域内是足中部支撑期,根据足底压力最小值提取足部支撑期1s内的足底压力数据;
步骤三:将提取到的足底压力数据进行分区,具体分为:第1趾T1、第2-5脚趾T2-5、第1跖骨底M1、第2跖骨底M2、第3跖骨底M3、第4跖骨底Ml4、第5跖骨底M5、足弓MF、足后跟内侧HM、足后跟外侧HL共十个区域;
分别提取计算上述十个区域相应的特征值,具体包括:足底压力峰值、压力时间积分、前足后足压力峰值比;
步骤四:对得到的特征值进行分区域成比例特征缩放,具体将步骤三中得到的特征值进行比例运算得到新的缩放后特征值;
步骤五:将足底压力特征值与缩放后的特征值进行特征交叉,求笛卡尔积形成的合成特征,并打上标签;
步骤六:特征选择消除不相关的变量,采用特征递归消除的随机森林算法把需要的特征集合初始化为整个数据集合,每次剔除一个排序准则分数最小的数据,直到获得最后的特征集;
步骤七:训练GBDT模型,将结果和对应标签定义为四类,分别为:
正常k=1、异常-低危风险k=2、异常-中危风险k=3、异常-高危风险k=4;
步骤八:采用logloss作为损失函数将Fkm(xi)转成对应的概率
通过计算概率来预测结果分类;
式中Fkm表示梯度提升决策树过程拟合回归树的值,其中k表示分类转换成k个二分类后第k个类别,m表示拟合的第m颗回归树,e为自然常数欧拉数xi表示输入特征,i表示第i个特征,Pki(xi)表示Fkm(xi)对应类别的概率;
P1i对应预测结果为正常的概率;
P2i对应预测结果为异常-低危的概率;
P3i对应预测结果为异常-中危的概率;
P4i对应预测结果为异常-高危的概率。
所述步骤三中提取计算足底压力峰值的具体方法为:
以抽样间隔为0.2s取样提取足中部支撑区域5个特征时间点,利用特征时间点选取得到5组足底压力矩阵,根据足底分区提取各区域足底压力峰值,提取计算公式为:
F=maxn∈[1,N]P(n)|L,其中,n=1,2,…,N,为足底压力信号长度,r=1,2,…,8,9,10表示足底10个区域,P(n)为足底某个区域的足底压力值,L代表左脚;
得到5组区域峰值后再各自按区域分组取均值,得到特征数据峰值PP=[p1,p2,p3,……,p10];
所述步骤三中提取计算压力时间积分的具体方法为:
将压力时间积分值定义为PTI,根据足底压力积分公式:
计算得到特征数组的压力时间积分PTI=[i1,i2,i3,……,i10],该特征用于检查足部功能是否受到损伤;
所述步骤三中提取计算前足后足压力峰值比的具体方法为:
将前足后足压力峰值比定义为F/R,根据公式计算得到前后足压力峰值比FR,式中r1是前足区域,包括T1、T2-T5区域,r2是后足区域,包括MF、HL、HF区域。
所述步骤四中成比例特征缩放运算的具体步骤为:
将步骤三中得到的PP和PTI数据进行比例运算,计算公式为:
式中i=1,2,3,……,10分别对应10个区域的PP和PTI数据;
分别得到新特征数组PP’=[P1,P2,P3,……,P10]和PTI’=[I1,I2,I3,……,I10];
对于震动感觉阈值VPT和FR数据采用max标准化缩放计算公式:
计算得到新特征数组VPT’和FR’;
将从上述步骤得到的足底压力特征PP’,PTI,FR’与VPT’特征进行特征交叉,求笛卡尔积形成的合成特征,并打上标签,然后执行步骤六。
所述步骤七中训练GBDT模型的具体方法为:
将预测定义标签K=4的分类结果转换为4个二分类问题,训练4个分类回归树;
首先将步骤六中选择后的特征子集做一步one-hot,基于下式计算概率:
式中Fkm(x)表示梯度提升决策树过程拟合回归树的值,Pkm(x)表示Fkm(x)对应类别的概率,其中k表示分类转换成k个二分类后第k个类别,m表示拟合的第m颗回归树,e为自然常数欧拉数,xi表示步骤六中特征子集的集合,i表示第i个特征集;
然后基于下式计算负梯度值
式中是分类损失函数,k表示分类转换成k个二分类后第k个类别,i表示第i个特征集,yik表示二分类结果yik=0表示第i个特征集属于不属于第k类,yik=1表示第i个特征集属于第k类;
基于上式寻找回归树的最佳划分节点,采用MSE分裂准则,具体计算过程如下:
遍历所有特征的取值,将每个特征值依次作为分裂点,然后计算左子结点与右子结点上的MSE,寻找两者加和最小的一个;
以该节点为分裂点以拟合一颗回归树,给这棵树的每个叶子节点分别赋一个参数来拟合残差,叶子节点更新值为:
式中Rjkm表示建好树后的叶子节点区域,j表示第j个节点,k表示分类转换成k个二分类后第k个类别,i表示第i个特征集;
通过下式计算得到叶子节点更新:
Fkm(xi)=Fk,m-1(xi)+η*∑xi∈Rjkmγjkm*I(xi∈Rjkm);
式中η表示学习率;
基于上述方法继续拟合第二三四类别的第一颗树,在所有类别第一颗树拟合完成后开始拟合第二树,反复进行,直到训练4轮结束,拟合第二个类别的第一颗树。
本发明相对于现有技术具备的有益效果为:本发明提供一种基于足底压力和VPT特征交叉的梯度提升决策树GBDT模型算法的早期糖尿病足预测方法,本发明提出了对足底压力传感器和震动阈值检测设备所采集数据的处理方式,并且将足底压力和VPT特征进行交叉,为判别早期糖尿病足结果及严重等级提供一种更加简便且准确的方法,提高了糖尿病足预测的准确率和鲁棒性;采用该预测方法不仅可以提取多种与糖尿病足相关的足底压力特征,同时设计将糖尿病足风险等级极大相关的震动感觉阈值VPT特征与多种足底压力特征交叉,使GBDT模型输入特征更加完整,提高了糖尿病足早期诊断风险预测等级的识别精度;同时利用足底总压力-时间信号提取检测者的数据特征,针对处理的足底压力和VPT特征设计了特征缩放的处理方式,规避了被测试者BMI对足底压力相关特征的影响,提高了诊断系统的效率;本发明使用特征递归消除的随机森林算法(RFE-RF)提取主要特征送入GBDT输入端,采用logloss为损失函数对GBDT模型结果转换为概率,检测出正常足和糖尿病足低危、中危、高危风险三个等级,能够有效提高糖尿病足的检测准确率和检测效率。
附图说明
下面结合附图对本发明做进一步说明:
图1为本发明足底总压力-时间变换曲线的示意图;
图2为本发明关于足底压力图像的分区示意图;
图3为本发明预测方法的步骤流程图。
具体实施方式
如图1至图3所示,本发明基于模式识别、机器学习领域,具体提供一种基于足底压力和VPT特征交叉的GBDT早期糖尿病足预测方法,该方法可以组合足底压力特征和VPT特征,有较好的分类功能对未发生糖尿病足患者进行更科学更准确的风险评估,通过及时有效的监测糖尿病患者足底压力,尽早的检测出糖尿病患者的足部病变情况,从而提醒患者及时就医确诊,对足底增加减压保护措施,防止溃疡的进一步发展和恶化,最终减少足溃疡发生。
本发明采用的GBDT(Gradient Boosting Decision Tree)是一种应用广且效果好的监督机器学习模型,包含了决策树学习和梯度提升两部分。GBDT通过多轮迭代,每轮迭代产生一个弱分类器,每个分类器在上一轮分类器的残差基础上进行训练;弱分类器一般会选择为分类回归树(CART TREE);GBDT模型算法适合低维数据,既可以处理离散值又可以处理连续值,调参时间短,预测准确率相对较高并且对异常值的鲁棒性较强。
本发明提出一种基于足底压力和VPT特征融合的GBDT早期糖尿病足预测方法,包括以下步骤:
步骤一:数据采集;主要通过柔性足底压力传感器组分别采集每个患有糖尿病但没有糖尿病风险的患者、患有糖尿病且具有患糖尿病足风险的患者、糖尿病足患者、健康正常人的足底压力特征数据。再通过震动觉阈值检测仪分别对每个患有糖尿病但没有糖尿病风险的患者、患有糖尿病且具有患糖尿病足风险的患者、糖尿病足患者、健康正常人的双足趾骨关节头及内踝处进行震动感觉阈值(VPT)检测,测试3次取均值记录。
步骤二:自动抽取足部支撑期足底压力数据;根据步骤1中采集的足底压力数据构建足底总压力-时间变换曲线,处理测试者单个步态周期的足底压力数据。由于在行走过程中的足底动力学特点一般呈现M形,即驼峰形。在足底总压力变换曲线最小值1s的领域内是足中部支撑期,根据足底压力最小值提取足部支撑期1s内的足底压力数据(如图1所示)。
步骤三:足底压力数据进行分区提取;将足底分为:第1趾(T1)、第2—5脚趾(T2—5)、第1跖骨底(M1)、第2跖骨底(M2)、第3跖骨底(M3)、第4跖骨底(Ml4)、第5跖骨底(M5)、足弓(MF)、足后跟内侧(HM)、足后跟外侧(HL)十个区域(如图2所示),分区域各自提取以下特征值:
计算步骤3.1:足底压力峰值:
以抽样间隔为0.2s取样提取足中部支撑区域5个特征时间点,利用特征时间点选取得到5组足底压力矩阵,根据足底分区提取各区域足底压力峰值,提取公式为F=maxn∈[1,N]P(n)|L,其中,n=1,2,…,N,为足底压力信号长度,r=1,2,…,8,9,10表示足底10个区域,P(n)为足底某个区域的足底压力值,L代表左脚。得到5组区域峰值后再各自按区域分组取均值,得到特征数据峰值PP=[p1,p2,p3,……,p10]。
计算步骤3.2:压力时间积分PTI。根据足底压力积分公式:
得到特征数组压力时间积分PTI=[i1,i2,i3,……,i10]。
早期的足底压力升高不一定会导致峰值压力升高,反而会导致PTI升高。这个特征可以用来进行早期判断,检查足部功能是否受到损伤。
计算步骤3.3:前足后足压力峰值比F/R:
F/R可以作为衡量神经病变患者足底压力变化的一个工具。与其他类型的受试者相比,患有神经病变的糖尿病患者的前足与后足的压力峰值都会增加,随着神经病变程度的加深,前足与后足的压力峰值也会随之增加,并且在最严重的神经病变患者身上,前后足压力峰值比(F/R)会增加。根据公式计算得到前后足压力峰值比FR;
上式中r1是前足区域(包括第一跖骨关节区域、第二、三跖骨关节区域、第四、五跖骨关节区域、大拇指区域),r2是后足区域(包括足中内外两侧区域、足跟内外两侧区域)。
步骤四、特征缩放;为了过滤被测者BMI指数对于足底压力产生的影响,且提高梯度下降速度,设计一种分区域成比例特征缩放方法,
将步骤三中的PP和PTI数据进行比例运算式中i=1,2,3,……,10分别对应10个区域的PP和PTI数据。
分别得到新特征数组PP’=[P1,P2,P3,……,P10]和PTI’=[I1,I2,I3,……,I10];
对于VPT和FR数据采用max标准化缩放方法得到新特征数组VPT’和FR’。
步骤五、特征交叉;将步骤三和四中得到的足底压力特征PP’,PTI,FR’与VPT’特征进行特征交叉,求笛卡尔积形成的合成特征集合X。
步骤六、特征选择;特征选择消除不相关的变量,改进模型精度,规避过拟合的现象。采用特征递归消除的随机森林算法(RFE-RF)把需要的特征集合初始化为整个数据集合,每次剔除一个排序准则分数最小的数据,直到获得最后的特征集。
具体步骤如下:
(1):将交叉的特征集合X变为(n(n-1))/2个集合子集Xj,Nj是第j类训练样本的总个数。
(2):使用RFE-RF方法对数据集合Xj进行特征选择,所得到的对应特征引子集为:
(3):将得到的特征子集Fj进行合并,得到最终的特征子集为
步骤七、训练GBDT模型;分类结果共有4类:
正常,异常-低风险,异常-中危风险,异常-低危风险;
分别对应标签:
正常k=1、异常-低危风险k=2、异常-中危风险k=3、异常-高危风险k=4;
首先利用步骤六中选择后的特征子集F的集合xi,其中i表示第i组特征子集,做一步one-hot具体将预测的K=4个分类结果转换为4个二分类问题,训练4个分类回归树。接着对拟合回归树值Fkm(xi)进行初始化,其中k表示第k个分类,m表示拟合的第m颗树,令Fkm(xi)=0。利用公式计算出Fkm(xi)对应类别概率。
其次计算负梯度值:
接着,寻找回归树的最佳划分节点。在GBDT的建树中,可以采用如MSE,MAE等作为分裂准则来确定分裂点(启发式)。
本发明采用的分裂准则是MSE,具体计算过程如下:遍历所有特征的取值,将每个特征值依次作为的分裂点,然后计算左子结点与右子结点上的MSE,寻找两者加和最小的一个。
以该节点为分裂点以拟合一颗回归树,给这棵树的每个叶子节点分别赋一个参数来拟合残差,叶子节点更新值为:
通过公式:
Fkm(xi)=Fk,m-1(xi)+η*∑xi∈Rjkmγjkm*I(xi∈Rjkm);
计算得到第一类别(k=1)第一颗树m=1的拟合结果F1,2(xi);
按照相同方法来拟合第二三四类别的第一颗树。在所有类别第一颗树拟合完成后开始拟合第二树。反复进行,直到训练4轮结束。拟合第二个类别(类别)的第一颗树。
步骤八、预测分类;
采用logloss作为损失函数将累加的结果Fkm(xi)转成概率计算概率P1i对应预测结果为正常的概率。P2i对应预测结果为异常-低危的概率。P3i对应预测结果为异常-中危的概率。P4i对应预测结果为异常-高危的概率。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (1)

1.一种基于梯度提升决策树模型算法的糖尿病足预测方法,其特征在于:包括如下预测步骤:
步骤一:在待测人员足底设置柔性压力传感器,采集相应的足底压力数据,再使用震动感觉阈值检测仪对待测人员的双足趾骨关节头、内踝处进行震动感觉阈值检测,测试多次取均值记录;
步骤二:根据步骤1中采集的足底压力数据构建足底总压力与时间变换曲线,并处理测试者单个步态周期的足底压力数据;
在足底总压力与时间变换曲线最小值1s的领域内是足中部支撑期,根据足底压力最小值提取足部支撑期1s内的足底压力数据;
步骤三:将提取到的足底压力数据进行分区,具体分为:第1趾T1、第2-5脚趾T2-5、第1跖骨底M1、第2跖骨底M2、第3跖骨底M3、第4跖骨底Ml4、第5跖骨底M5、足弓MF、足后跟内侧HM、足后跟外侧HL共十个区域;
分别提取计算上述十个区域相应的特征值,具体包括:足底压力峰值、压力时间积分、前足后足压力峰值比;
步骤四:对得到的特征值进行分区域成比例特征缩放,具体将步骤三中得到的特征值进行比例运算得到新的缩放后特征值;
步骤五:将足底压力特征值与缩放后的特征值进行特征交叉,求笛卡尔积形成的合成特征,并打上标签;
步骤六:特征选择消除不相关的变量,采用特征递归消除的随机森林算法把需要的特征集合初始化为整个数据集合,每次剔除一个排序准则分数最小的数据,直到获得最后的特征集;
步骤七:训练GBDT模型,将结果和对应标签定义为四类,分别为:
正常k=1、异常-低危风险k=2、异常-中危风险k=3、异常-高危风险k=4;
步骤八:采用logloss作为损失函数将Fkm(xi)转成对应的概率
通过计算概率来预测结果分类;
式中Fkm表示梯度提升决策树过程拟合回归树的值,其中k表示分类转换成k个二分类后第k个类别,m表示拟合的第m颗回归树,e为自然常数欧拉数xi表示输入特征,i表示第i个特征,Pki(xi)表示Fkm(xi)对应类别的概率;
P1i对应预测结果为正常的概率;
P2i对应预测结果为异常-低危的概率;
P3i对应预测结果为异常-中危的概率;
P4i对应预测结果为异常-高危的概率;
所述步骤三中提取计算足底压力峰值的具体方法为:
以抽样间隔为0.2s取样提取足中部支撑区域5个特征时间点,利用特征时间点选取得到5组足底压力矩阵,根据足底分区提取各区域足底压力峰值,提取计算公式为:
F=maxn∈[1,N]P(n)|L,其中,n=1,2,…,N,为足底压力信号长度,r=1,2,…,8,9,10表示足底10个区域,P(n)为足底某个区域的足底压力值,L代表左脚;
得到5组区域峰值后再各自按区域分组取均值,得到特征数据峰值PP=[p1,p2,p3,……,p10];
所述步骤三中提取计算压力时间积分的具体方法为:
将压力时间积分值定义为PTI,根据足底压力积分公式:
计算得到特征数组的压力时间积分PTI=[i1,i2,i3,……,i10],该特征用于检查足部功能是否受到损伤;
所述步骤三中提取计算前足后足压力峰值比的具体方法为:
将前足后足压力峰值比定义为F/R,根据公式计算得到前后足压力峰值比FR,式中r1是前足区域,包括T1、T2-T5区域,r2是后足区域,包括MF、HL、HF区域;
所述步骤四中成比例特征缩放运算的具体步骤为:
将步骤三中得到的PP和PTI数据进行比例运算,计算公式为:
式中i=1,2,3,……,10分别对应10个区域的PP和PTI数据;
分别得到新特征数组PP’=[P1,P2,P3,……,P10]和PTI’=[I1,I2,I3,……,I10];
对于震动感觉阈值VPT和FR数据采用max标准化缩放计算公式:
计算得到新特征数组VPT’和FR’;
将从上述步骤得到的足底压力特征PP’,PTI,FR’与VPT’特征进行特征交叉,求笛卡尔积形成的合成特征,并打上标签,然后执行步骤六;
所述步骤七中训练GBDT模型的具体方法为:
将预测定义标签K=4的分类结果转换为4个二分类问题,训练4个分类回归树;
首先将步骤六中选择后的特征子集做一步one-hot,基于下式计算概率:
式中Fkm(x)表示梯度提升决策树过程拟合回归树的值,Pkm(x)表示Fkm(x)对应类别的概率,其中k表示分类转换成k个二分类后第k个类别,m表示拟合的第m颗回归树,e为自然常数欧拉数,xi表示步骤六中特征子集的集合,i表示第i个特征集;
然后基于下式计算负梯度值:
式中是分类损失函数,k表示分类转换成k个二分类后第k个类别,i表示第i个特征集,yik表示二分类结果yik=0表示第i个特征集属于不属于第k类,yik=1表示第i个特征集属于第k类;
基于上式寻找回归树的最佳划分节点,采用MSE分裂准则,具体计算过程如下:
遍历所有特征的取值,将每个特征值依次作为分裂点,然后计算左子结点与右子结点上的MSE,寻找两者加和最小的一个;
以该节点为分裂点以拟合一颗回归树,给这棵树的每个叶子节点分别赋一个参数来拟合残差,叶子节点更新值为:
式中Rjkm表示建好树后的叶子节点区域,j表示第j个节点,k表示分类转换成k个二分类后第k个类别,i表示第i个特征集;
通过下式计算得到叶子节点更新:
Fkm(xi)=Fk,m-1(xi)+η*∑xi∈Rjkmγjkm*I(xi∈Rjkm);
式中η表示学习率;
基于上述方法继续拟合第二三四类别的第一颗树,在所有类别第一颗树拟合完成后开始拟合第二树,反复进行,直到训练4轮结束,拟合第二个类别的第一颗树。
CN202111165298.8A 2021-09-30 2021-09-30 一种基于梯度提升决策树模型算法的糖尿病足预测方法 Active CN113796852B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111165298.8A CN113796852B (zh) 2021-09-30 2021-09-30 一种基于梯度提升决策树模型算法的糖尿病足预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111165298.8A CN113796852B (zh) 2021-09-30 2021-09-30 一种基于梯度提升决策树模型算法的糖尿病足预测方法

Publications (2)

Publication Number Publication Date
CN113796852A CN113796852A (zh) 2021-12-17
CN113796852B true CN113796852B (zh) 2023-09-08

Family

ID=78939036

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111165298.8A Active CN113796852B (zh) 2021-09-30 2021-09-30 一种基于梯度提升决策树模型算法的糖尿病足预测方法

Country Status (1)

Country Link
CN (1) CN113796852B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116204784B (zh) * 2022-12-30 2023-09-08 成都天仁民防科技有限公司 一种基于das的地铁隧道外部危害作业入侵识别方法
CN117547287B (zh) * 2023-11-14 2024-04-09 首都医科大学宣武医院 一种基于多生理参数的糖尿病足风险评估系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015166489A2 (en) * 2014-04-28 2015-11-05 Yeda Research And Development Co. Ltd. Method and apparatus for predicting response to food
CN105997318A (zh) * 2016-04-26 2016-10-12 四川大学 针对糖尿病患者脚型个性化减压鞋垫的制作方法及系统
CN110197720A (zh) * 2019-03-12 2019-09-03 平安科技(深圳)有限公司 糖尿病的预测方法及装置、存储介质、计算机设备
CN110200597A (zh) * 2019-05-27 2019-09-06 上海理工大学 糖尿病足智能鞋垫
CN111329484A (zh) * 2020-02-24 2020-06-26 华南理工大学 基于足底压力信息时空域特征的糖尿病足风险预警装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8374682B2 (en) * 2005-04-04 2013-02-12 Hypermed Imaging, Inc. Hyperspectral imaging in diabetes and peripheral vascular disease

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015166489A2 (en) * 2014-04-28 2015-11-05 Yeda Research And Development Co. Ltd. Method and apparatus for predicting response to food
CN105997318A (zh) * 2016-04-26 2016-10-12 四川大学 针对糖尿病患者脚型个性化减压鞋垫的制作方法及系统
CN110197720A (zh) * 2019-03-12 2019-09-03 平安科技(深圳)有限公司 糖尿病的预测方法及装置、存储介质、计算机设备
CN110200597A (zh) * 2019-05-27 2019-09-06 上海理工大学 糖尿病足智能鞋垫
CN111329484A (zh) * 2020-02-24 2020-06-26 华南理工大学 基于足底压力信息时空域特征的糖尿病足风险预警装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于深度置信网络与梯度提升决策树的糖尿病检测方法;曲文龙;宋晓明;曲嘉一;;吉林师范大学学报(自然科学版)(第03期);全文 *

Also Published As

Publication number Publication date
CN113796852A (zh) 2021-12-17

Similar Documents

Publication Publication Date Title
CN113796852B (zh) 一种基于梯度提升决策树模型算法的糖尿病足预测方法
El Maachi et al. Deep 1D-Convnet for accurate Parkinson disease detection and severity prediction from gait
CN110110633B (zh) 一种基于机器学习的偏瘫步态自动识别和分析的方法
CN108090509B (zh) 一种数据长度自适应的心电图分类方法
Shalin et al. Prediction of freezing of gait in Parkinson’s disease from foot plantar-pressure arrays using a convolutional neural network
Alharthi et al. Deep learning for ground reaction force data analysis: Application to wide-area floor sensing
Mamun et al. Vocal feature guided detection of parkinson’s disease using machine learning algorithms
CN114129169B (zh) 一种生物电信号数据识别方法、系统、介质和设备
CN113317780A (zh) 一种基于长短时记忆神经网络的异常步态检测方法
CN113171082A (zh) 一种前束交叉韧带损伤评估方法及装置
CN108109696B (zh) 一种数据处理方法和装置
JP2024061599A (ja) 階層図ニューラルネットワークに基づく疾患診療過程異常識別システム
CN116864104A (zh) 基于人工智能的慢性血栓栓塞性肺动脉高压风险分级系统
WO2023160149A1 (zh) 体脂率的测量方法、装置及计算机可读存储介质
CN116013514A (zh) 一种基于多参数融合的一体化糖尿病足预测系统
CN113545771A (zh) 一种基于足底压力的集成k近邻帕金森病定量诊断系统
KR102350593B1 (ko) 딥러닝 앙상블을 이용한 멀티모달 센서 기반의 보행 패턴 분류를 위한 장치 및 방법
CN115281662A (zh) 一种慢性踝关节不稳智能辅助诊断系统
Riyaz et al. Ensemble Learning for Coronary Heart Disease Prediction
CN114864086A (zh) 一种基于肺功能报告模板的疾病预测方法
KR102474407B1 (ko) 빠른 속도 보행에서의 보행 변인을 이용한 노인 인지장애 심각도 예측 방법 및 시스템
Alharthi Explainable AI and Machine Learning Towards Human Gait Deterioration Analysis
Pan et al. Research on Assessment of Diabetic Foot Neuropathy Based on Multi-subdomain Classification Algorithm
Singla et al. The diagnosis of diabetic nephropathy using neuro-fuzzy expert system
CN117079760B (zh) 华法林剂量调整方法、系统及临床辅助决策系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant