CN113796852A - 一种基于梯度提升决策树模型算法的糖尿病足预测方法 - Google Patents

一种基于梯度提升决策树模型算法的糖尿病足预测方法 Download PDF

Info

Publication number
CN113796852A
CN113796852A CN202111165298.8A CN202111165298A CN113796852A CN 113796852 A CN113796852 A CN 113796852A CN 202111165298 A CN202111165298 A CN 202111165298A CN 113796852 A CN113796852 A CN 113796852A
Authority
CN
China
Prior art keywords
pressure
characteristic
plantar
foot
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111165298.8A
Other languages
English (en)
Other versions
CN113796852B (zh
Inventor
杨琨
桑胜波
张婕妮
吴玉广
穆汉栋
郝润芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taiyuan University of Technology
Original Assignee
Taiyuan University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taiyuan University of Technology filed Critical Taiyuan University of Technology
Priority to CN202111165298.8A priority Critical patent/CN113796852B/zh
Publication of CN113796852A publication Critical patent/CN113796852A/zh
Application granted granted Critical
Publication of CN113796852B publication Critical patent/CN113796852B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/103Detecting, measuring or recording devices for testing the shape, pattern, colour, size or movement of the body or parts thereof, for diagnostic purposes
    • A61B5/1036Measuring load distribution, e.g. podologic studies
    • A61B5/1038Measuring plantar pressure during gait
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/68Arrangements of detecting, measuring or recording means, e.g. sensors, in relation to patient
    • A61B5/6801Arrangements of detecting, measuring or recording means, e.g. sensors, in relation to patient specially adapted to be attached to or worn on the body surface
    • A61B5/6802Sensor mounted on worn items
    • A61B5/6804Garments; Clothes
    • A61B5/6807Footwear
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7275Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Surgery (AREA)
  • Physics & Mathematics (AREA)
  • Veterinary Medicine (AREA)
  • Biophysics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physiology (AREA)
  • Psychiatry (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Dentistry (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本发明一种基于梯度提升决策树模型算法的糖尿病足预测方法,属于糖尿病足分析检测技术领域;所要解决的技术问题为:提供一种基于梯度提升决策树模型算法的糖尿病足预测方法的改进;解决该技术问题采用的技术方案为:在待测人员足底设置柔性压力传感器,采集相应的足底压力数据,再使用震动觉阈值检测仪对待测人员的双足趾骨关节头、内踝处进行震动感觉阈值检测,测试多次取均值记录;将足底压力数据构建足底总压力与时间变换曲线,并处理测试者单个步态周期的足底压力数据;将提取到的足底压力数据进行分区,对得到的特征值进行分区域成比例特征缩放,将特征值进行比例运算得到新的缩放后特征值;本发明应用于在医疗辅助诊断领域康复的步态预测。

Description

一种基于梯度提升决策树模型算法的糖尿病足预测方法
技术领域
本发明一种基于梯度提升决策树模型算法的糖尿病足预测方法,属于糖尿病足分析检测技术领域。
背景技术
随着人们生活水平的不断改善,随之而来的是慢性病患病比例的不断提高,糖尿病足作为糖尿病常见的并发症,具有病程长、难治愈的特点,且长期发病将会导致截肢,严重时危及生命;目前可以通过早期筛查做到对糖尿病足风险的预防,也可以提高患病初期的治愈率,筛查预防的方式主要通过分析人体化验数据或简单观察,不能准确把握病情发展情况,缺少快速且相对准确的糖尿病足预测方法。
目前关于糖尿病足的研究证实了足底压力可用于预测糖尿病足溃疡,对糖尿病患者足底压力的筛查可以检测糖尿病足风险人群,采用缓解足底压力的干预治疗方式可以有效的防止和治疗足溃疡形成;针对足底压力分析主要采用震动感觉阈值VPT检测方法,是一种简单、易操作的能够有效筛查糖尿病周围神经病变DPN的方法,VPT也是一种有效的关于足部溃疡发生风险程度的评价手段,是预测糖尿病足发生风险的可靠指标,对糖尿病患者VPT检测,可帮助发现糖尿病足风险患者,及早采取相应的预见性护理措施;根据国内研究标准以震动阈值风险VPT≤10V为正常,VPT>10V为异常,其中10V<VPT≤15V为轻危,15V<VPT≤25V为中危,VPT>25V为高危,采用该检测方法可以有效减少患者糖尿病足的发生率。
但是,现有的糖尿病足预测技术仅根据足底压力各项特征对糖尿病足进行预测,单一特征来源使糖尿病足预测结果特别是在区分异常情况的风险等级结果方面的准确率受限。
发明内容
本发明为了克服现有技术中存在的不足,所要解决的技术问题为:提供一种基于梯度提升决策树模型算法的糖尿病足预测方法的改进。
为了解决上述技术问题,本发明采用的技术方案为:一种基于梯度提升决策树模型算法的糖尿病足预测方法,包括如下预测步骤:
步骤一:在待测人员足底设置柔性压力传感器,采集相应的足底压力数据,再使用震动感觉阈值检测仪对待测人员的双足趾骨关节头、内踝处进行震动感觉阈值检测,测试多次取均值记录;
步骤二:根据步骤1中采集的足底压力数据构建足底总压力与时间变换曲线,并处理测试者单个步态周期的足底压力数据;
在足底总压力与时间变换曲线最小值1s的领域内是足中部支撑期,根据足底压力最小值提取足部支撑期1s内的足底压力数据;
步骤三:将提取到的足底压力数据进行分区,具体分为:第1趾T1、第2-5脚趾T2-5、第1跖骨底M1、第2跖骨底M2、第3跖骨底M3、第4跖骨底Ml4、第5跖骨底M5、足弓MF、足后跟内侧HM、足后跟外侧HL共十个区域;
分别提取计算上述十个区域相应的特征值,具体包括:足底压力峰值、压力时间积分、前足后足压力峰值比;
步骤四:对得到的特征值进行分区域成比例特征缩放,具体将步骤三中得到的特征值进行比例运算得到新的缩放后特征值;
步骤五:将足底压力特征值与缩放后的特征值进行特征交叉,求笛卡尔积形成的合成特征,并打上标签;
步骤六:特征选择消除不相关的变量,采用特征递归消除的随机森林算法把需要的特征集合初始化为整个数据集合,每次剔除一个排序准则分数最小的数据,直到获得最后的特征集;
步骤七:训练GBDT模型,将结果和对应标签定义为四类,分别为:
正常k=1、异常-低危风险k=2、异常-中危风险k=3、异常-高危风险k=4;
步骤八:采用logloss作为损失函数将Fkm(xi)转成对应的概率
Figure BDA0003291475000000021
通过计算概率来预测结果分类;
式中Fkm表示梯度提升决策树过程拟合回归树的值,其中k表示分类转换成k个二分类后第k个类别,m表示拟合的第m颗回归树,e为自然常数欧拉数xi表示输入特征,i表示第i个特征,Pki(xi)表示Fkm(xi)对应类别的概率;
P1i对应预测结果为正常的概率;
P2i对应预测结果为异常-低危的概率;
P3i对应预测结果为异常-中危的概率;
P4i对应预测结果为异常-高危的概率。
所述步骤三中提取计算足底压力峰值的具体方法为:
以抽样间隔为0.2s取样提取足中部支撑区域5个特征时间点,利用特征时间点选取得到5组足底压力矩阵,根据足底分区提取各区域足底压力峰值,提取计算公式为:
F=maxn∈[1,N]P(n)|L,其中,n=1,2,…,N,为足底压力信号长度,r=1,2,…,8,9,10表示足底10个区域,P(n)为足底某个区域的足底压力值,L代表左脚;
得到5组区域峰值后再各自按区域分组取均值,得到特征数据峰值PP=[p1,p2,p3,……,p10];
所述步骤三中提取计算压力时间积分的具体方法为:
将压力时间积分值定义为PTI,根据足底压力积分公式:
Figure BDA0003291475000000031
计算得到特征数组的压力时间积分PTI=[i1,i2,i3,……,i10],该特征用于检查足部功能是否受到损伤;
所述步骤三中提取计算前足后足压力峰值比的具体方法为:
将前足后足压力峰值比定义为F/R,根据公式
Figure BDA0003291475000000032
计算得到前后足压力峰值比FR,式中r1是前足区域,包括T1、T2-T5区域,r2是后足区域,包括MF、HL、HF区域。
所述步骤四中成比例特征缩放运算的具体步骤为:
将步骤三中得到的PP和PTI数据进行比例运算,计算公式为:
Figure BDA0003291475000000033
式中i=1,2,3,……,10分别对应10个区域的PP和PTI数据;
分别得到新特征数组PP’=[P1,P2,P3,……,P10]和PTI’=[I1,I2,I3,……,I10];
对于震动感觉阈值VPT和FR数据采用max标准化缩放计算公式:
Figure BDA0003291475000000034
计算得到新特征数组VPT’和FR’;
将从上述步骤得到的足底压力特征PP’,PTI,FR’与VPT’特征进行特征交叉,求笛卡尔积形成的合成特征,并打上标签,然后执行步骤六。
所述步骤七中训练GBDT模型的具体方法为:
将预测定义标签K=4的分类结果转换为4个二分类问题,训练4个分类回归树;
首先将步骤六中选择后的特征子集做一步one-hot,基于下式计算概率:
Figure BDA0003291475000000035
式中Fkm(x)表示梯度提升决策树过程拟合回归树的值,Pkm(x)表示Fkm(x)对应类别的概率,其中k表示分类转换成k个二分类后第k个类别,m表示拟合的第m颗回归树,e为自然常数欧拉数,xi表示步骤六中特征子集的集合,i表示第i个特征集;
然后基于下式计算负梯度值:
Figure BDA0003291475000000041
式中
Figure BDA0003291475000000042
是分类损失函数,k表示分类转换成k个二分类后第k个类别,i表示第i个特征集,yik表示二分类结果yik=0表示第i个特征集属于不属于第k类,yik=1表示第i个特征集属于第k类;
基于上式寻找回归树的最佳划分节点,采用MSE分裂准则,具体计算过程如下:
遍历所有特征的取值,将每个特征值依次作为分裂点,然后计算左子结点与右子结点上的MSE,寻找两者加和最小的一个;
以该节点为分裂点以
Figure BDA0003291475000000043
拟合一颗回归树,给这棵树的每个叶子节点分别赋一个参数来拟合残差,叶子节点更新值为:
Figure BDA0003291475000000044
式中Rjkm表示建好树后的叶子节点区域,j表示第j个节点,k表示分类转换成k个二分类后第k个类别,i表示第i个特征集;
通过下式计算得到叶子节点更新:
Fkm(xi)=Fk,m-1(xi)+η*∑xi∈Rjkmγjkm*I(xi∈Rjkm);
式中η表示学习率;
基于上述方法继续拟合第二三四类别的第一颗树,在所有类别第一颗树拟合完成后开始拟合第二树,反复进行,直到训练4轮结束,拟合第二个类别的第一颗树。
本发明相对于现有技术具备的有益效果为:本发明提供一种基于足底压力和VPT特征交叉的梯度提升决策树GBDT模型算法的早期糖尿病足预测方法,本发明提出了对足底压力传感器和震动阈值检测设备所采集数据的处理方式,并且将足底压力和VPT特征进行交叉,为判别早期糖尿病足结果及严重等级提供一种更加简便且准确的方法,提高了糖尿病足预测的准确率和鲁棒性;采用该预测方法不仅可以提取多种与糖尿病足相关的足底压力特征,同时设计将糖尿病足风险等级极大相关的震动感觉阈值VPT特征与多种足底压力特征交叉,使GBDT模型输入特征更加完整,提高了糖尿病足早期诊断风险预测等级的识别精度;同时利用足底总压力-时间信号提取检测者的数据特征,针对处理的足底压力和VPT特征设计了特征缩放的处理方式,规避了被测试者BMI对足底压力相关特征的影响,提高了诊断系统的效率;本发明使用特征递归消除的随机森林算法(RFE-RF)提取主要特征送入GBDT输入端,采用logloss为损失函数对GBDT模型结果转换为概率,检测出正常足和糖尿病足低危、中危、高危风险三个等级,能够有效提高糖尿病足的检测准确率和检测效率。
附图说明
下面结合附图对本发明做进一步说明:
图1为本发明足底总压力-时间变换曲线的示意图;
图2为本发明关于足底压力图像的分区示意图;
图3为本发明预测方法的步骤流程图。
具体实施方式
如图1至图3所示,本发明基于模式识别、机器学习领域,具体提供一种基于足底压力和VPT特征交叉的GBDT早期糖尿病足预测方法,该方法可以组合足底压力特征和VPT特征,有较好的分类功能对未发生糖尿病足患者进行更科学更准确的风险评估,通过及时有效的监测糖尿病患者足底压力,尽早的检测出糖尿病患者的足部病变情况,从而提醒患者及时就医确诊,对足底增加减压保护措施,防止溃疡的进一步发展和恶化,最终减少足溃疡发生。
本发明采用的GBDT(Gradient Boosting Decision Tree)是一种应用广且效果好的监督机器学习模型,包含了决策树学习和梯度提升两部分。GBDT通过多轮迭代,每轮迭代产生一个弱分类器,每个分类器在上一轮分类器的残差基础上进行训练;弱分类器一般会选择为分类回归树(CART TREE);GBDT模型算法适合低维数据,既可以处理离散值又可以处理连续值,调参时间短,预测准确率相对较高并且对异常值的鲁棒性较强。
本发明提出一种基于足底压力和VPT特征融合的GBDT早期糖尿病足预测方法,包括以下步骤:
步骤一:数据采集;主要通过柔性足底压力传感器组分别采集每个患有糖尿病但没有糖尿病风险的患者、患有糖尿病且具有患糖尿病足风险的患者、糖尿病足患者、健康正常人的足底压力特征数据。再通过震动觉阈值检测仪分别对每个患有糖尿病但没有糖尿病风险的患者、患有糖尿病且具有患糖尿病足风险的患者、糖尿病足患者、健康正常人的双足趾骨关节头及内踝处进行震动感觉阈值(VPT)检测,测试3次取均值记录。
步骤二:自动抽取足部支撑期足底压力数据;根据步骤1中采集的足底压力数据构建足底总压力-时间变换曲线,处理测试者单个步态周期的足底压力数据。由于在行走过程中的足底动力学特点一般呈现M形,即驼峰形。在足底总压力变换曲线最小值1s的领域内是足中部支撑期,根据足底压力最小值提取足部支撑期1s内的足底压力数据(如图1所示)。
步骤三:足底压力数据进行分区提取;将足底分为:第1趾(T1)、第2—5脚趾(T2—5)、第1跖骨底(M1)、第2跖骨底(M2)、第3跖骨底(M3)、第4跖骨底(Ml4)、第5跖骨底(M5)、足弓(MF)、足后跟内侧(HM)、足后跟外侧(HL)十个区域(如图2所示),分区域各自提取以下特征值:
计算步骤3.1:足底压力峰值:
以抽样间隔为0.2s取样提取足中部支撑区域5个特征时间点,利用特征时间点选取得到5组足底压力矩阵,根据足底分区提取各区域足底压力峰值,提取公式为F=maxn∈[1,N]P(n)|L,其中,n=1,2,…,N,为足底压力信号长度,r=1,2,…,8,9,10表示足底10个区域,P(n)为足底某个区域的足底压力值,L代表左脚。得到5组区域峰值后再各自按区域分组取均值,得到特征数据峰值PP=[p1,p2,p3,……,p10]。
计算步骤3.2:压力时间积分PTI。根据足底压力积分公式:
Figure BDA0003291475000000061
得到特征数组压力时间积分PTI=[i1,i2,i3,……,i10]。
早期的足底压力升高不一定会导致峰值压力升高,反而会导致PTI升高。这个特征可以用来进行早期判断,检查足部功能是否受到损伤。
计算步骤3.3:前足后足压力峰值比F/R:
F/R可以作为衡量神经病变患者足底压力变化的一个工具。与其他类型的受试者相比,患有神经病变的糖尿病患者的前足与后足的压力峰值都会增加,随着神经病变程度的加深,前足与后足的压力峰值也会随之增加,并且在最严重的神经病变患者身上,前后足压力峰值比(F/R)会增加。根据公式
Figure BDA0003291475000000062
计算得到前后足压力峰值比FR;
上式中r1是前足区域(包括第一跖骨关节区域、第二、三跖骨关节区域、第四、五跖骨关节区域、大拇指区域),r2是后足区域(包括足中内外两侧区域、足跟内外两侧区域)。
步骤四、特征缩放;为了过滤被测者BMI指数对于足底压力产生的影响,且提高梯度下降速度,设计一种分区域成比例特征缩放方法,
将步骤三中的PP和PTI数据进行比例运算
Figure BDA0003291475000000063
式中i=1,2,3,……,10分别对应10个区域的PP和PTI数据。
分别得到新特征数组PP’=[P1,P2,P3,……,P10]和PTI’=[I1,I2,I3,……,I10];
对于VPT和FR数据采用max标准化缩放方法
Figure BDA0003291475000000064
得到新特征数组VPT’和FR’。
步骤五、特征交叉;将步骤三和四中得到的足底压力特征PP’,PTI,FR’与VPT’特征进行特征交叉,求笛卡尔积形成的合成特征集合X。
步骤六、特征选择;特征选择消除不相关的变量,改进模型精度,规避过拟合的现象。采用特征递归消除的随机森林算法(RFE-RF)把需要的特征集合初始化为整个数据集合,每次剔除一个排序准则分数最小的数据,直到获得最后的特征集。
具体步骤如下:
(1):将交叉的特征集合X变为(n(n-1))/2个集合子集Xj,Nj是第j类训练样本的总个数。
Figure BDA0003291475000000071
(2):使用RFE-RF方法对数据集合Xj进行特征选择,所得到的对应特征引子集为:
Figure BDA0003291475000000072
(3):将得到的特征子集Fj进行合并,得到最终的特征子集为
Figure BDA0003291475000000073
步骤七、训练GBDT模型;分类结果共有4类:
正常,异常-低风险,异常-中危风险,异常-低危风险;
分别对应标签:
正常k=1、异常-低危风险k=2、异常-中危风险k=3、异常-高危风险k=4;
首先利用步骤六中选择后的特征子集F的集合xi,其中i表示第i组特征子集,做一步one-hot具体将预测的K=4个分类结果转换为4个二分类问题,训练4个分类回归树。接着对拟合回归树值Fkm(xi)进行初始化,其中k表示第k个分类,m表示拟合的第m颗树,令Fkm(xi)=0。利用公式
Figure BDA0003291475000000074
(softmax)计算出Fkm(xi)对应类别概率。
其次计算负梯度值:
Figure BDA0003291475000000075
接着,寻找回归树的最佳划分节点。在GBDT的建树中,可以采用如MSE,MAE等作为分裂准则来确定分裂点(启发式)。
本发明采用的分裂准则是MSE,具体计算过程如下:遍历所有特征的取值,将每个特征值依次作为的分裂点,然后计算左子结点与右子结点上的MSE,寻找两者加和最小的一个。
以该节点为分裂点以
Figure BDA0003291475000000082
拟合一颗回归树,给这棵树的每个叶子节点分别赋一个参数来拟合残差,叶子节点更新值为:
Figure BDA0003291475000000081
通过公式:
Fkm(xi)=Fk,m-1(xi)+η*∑xi∈Rjkmγjkm*I(xi∈Rjkm);
计算得到第一类别(k=1)第一颗树m=1的拟合结果F1,2(xi);
按照相同方法来拟合第二三四类别的第一颗树。在所有类别第一颗树拟合完成后开始拟合第二树。反复进行,直到训练4轮结束。拟合第二个类别(类别)的第一颗树。
步骤八、预测分类;
采用logloss作为损失函数将累加的结果Fkm(xi)转成概率
Figure BDA0003291475000000083
计算概率P1i对应预测结果为正常的概率。P2i对应预测结果为异常-低危的概率。P3i对应预测结果为异常-中危的概率。P4i对应预测结果为异常-高危的概率。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (4)

1.一种基于梯度提升决策树模型算法的糖尿病足预测方法,其特征在于:包括如下预测步骤:
步骤一:在待测人员足底设置柔性压力传感器,采集相应的足底压力数据,再使用震动感觉阈值检测仪对待测人员的双足趾骨关节头、内踝处进行震动感觉阈值检测,测试多次取均值记录;
步骤二:根据步骤1中采集的足底压力数据构建足底总压力与时间变换曲线,并处理测试者单个步态周期的足底压力数据;
在足底总压力与时间变换曲线最小值1s的领域内是足中部支撑期,根据足底压力最小值提取足部支撑期1s内的足底压力数据;
步骤三:将提取到的足底压力数据进行分区,具体分为:第1趾T1、第2-5脚趾T2-5、第1跖骨底M1、第2跖骨底M2、第3跖骨底M3、第4跖骨底Ml4、第5跖骨底M5、足弓MF、足后跟内侧HM、足后跟外侧HL共十个区域;
分别提取计算上述十个区域相应的特征值,具体包括:足底压力峰值、压力时间积分、前足后足压力峰值比;
步骤四:对得到的特征值进行分区域成比例特征缩放,具体将步骤三中得到的特征值进行比例运算得到新的缩放后特征值;
步骤五:将足底压力特征值与缩放后的特征值进行特征交叉,求笛卡尔积形成的合成特征,并打上标签;
步骤六:特征选择消除不相关的变量,采用特征递归消除的随机森林算法把需要的特征集合初始化为整个数据集合,每次剔除一个排序准则分数最小的数据,直到获得最后的特征集;
步骤七:训练GBDT模型,将结果和对应标签定义为四类,分别为:
正常k=1、异常-低危风险k=2、异常-中危风险k=3、异常-高危风险k=4;
步骤八:采用logloss作为损失函数将Fkm(xi)转成对应的概率
Figure FDA0003291474990000011
通过计算概率来预测结果分类;
式中Fkm表示梯度提升决策树过程拟合回归树的值,其中k表示分类转换成k个二分类后第k个类别,m表示拟合的第m颗回归树,e为自然常数欧拉数xi表示输入特征,i表示第i个特征,Pki(xi)表示Fkm(xi)对应类别的概率;
P1i对应预测结果为正常的概率;
P2i对应预测结果为异常-低危的概率;
P3i对应预测结果为异常-中危的概率;
P4i对应预测结果为异常-高危的概率。
2.根据权利要求1所述的一种基于梯度提升决策树模型算法的糖尿病足预测方法,其特征在于:所述步骤三中提取计算足底压力峰值的具体方法为:
以抽样间隔为0.2s取样提取足中部支撑区域5个特征时间点,利用特征时间点选取得到5组足底压力矩阵,根据足底分区提取各区域足底压力峰值,提取计算公式为:
F=maxn∈[1,N]P(n)|L,其中,n=1,2,…,N,为足底压力信号长度,r=1,2,…,8,9,10表示足底10个区域,P(n)为足底某个区域的足底压力值,L代表左脚;
得到5组区域峰值后再各自按区域分组取均值,得到特征数据峰值PP=[p1,p2,p3,……,p10];
所述步骤三中提取计算压力时间积分的具体方法为:
将压力时间积分值定义为PTI,根据足底压力积分公式:
Figure FDA0003291474990000021
计算得到特征数组的压力时间积分PTI=[i1,i2,i3,……,i10],该特征用于检查足部功能是否受到损伤;
所述步骤三中提取计算前足后足压力峰值比的具体方法为:
将前足后足压力峰值比定义为F/R,根据公式
Figure FDA0003291474990000022
计算得到前后足压力峰值比FR,式中r1是前足区域,包括T1、T2-T5区域,r2是后足区域,包括MF、HL、HF区域。
3.根据权利要求2所述的一种基于梯度提升决策树模型算法的糖尿病足预测方法,其特征在于:所述步骤四中成比例特征缩放运算的具体步骤为:
将步骤三中得到的PP和PTI数据进行比例运算,计算公式为:
Figure FDA0003291474990000023
式中i=1,2,3,……,10分别对应10个区域的PP和PTI数据;
分别得到新特征数组PP’=[P1,P2,P3,……,P10]和PTI’=[I1,I2,I3,……,I10];
对于震动感觉阈值VPT和FR数据采用max标准化缩放计算公式:
Figure FDA0003291474990000024
计算得到新特征数组VPT’和FR’;
将从上述步骤得到的足底压力特征PP’,PTI,FR’与VPT’特征进行特征交叉,求笛卡尔积形成的合成特征,并打上标签,然后执行步骤六。
4.根据权利要求3所述的一种基于梯度提升决策树模型算法的糖尿病足预测方法,其特征在于:所述步骤七中训练GBDT模型的具体方法为:
将预测定义标签K=4的分类结果转换为4个二分类问题,训练4个分类回归树;
首先将步骤六中选择后的特征子集做一步one-hot,基于下式计算概率:
Figure FDA0003291474990000031
式中Fkm(x)表示梯度提升决策树过程拟合回归树的值,Pkm(x)表示Fkm(x)对应类别的概率,其中k表示分类转换成k个二分类后第k个类别,m表示拟合的第m颗回归树,e为自然常数欧拉数,xi表示步骤六中特征子集的集合,i表示第i个特征集;
然后基于下式计算负梯度值:
Figure FDA0003291474990000032
式中
Figure FDA0003291474990000033
是分类损失函数,k表示分类转换成k个二分类后第k个类别,i表示第i个特征集,yik表示二分类结果yik=0表示第i个特征集属于不属于第k类,yik=1表示第i个特征集属于第k类;
基于上式寻找回归树的最佳划分节点,采用MSE分裂准则,具体计算过程如下:
遍历所有特征的取值,将每个特征值依次作为分裂点,然后计算左子结点与右子结点上的MSE,寻找两者加和最小的一个;
以该节点为分裂点以
Figure FDA0003291474990000034
拟合一颗回归树,给这棵树的每个叶子节点分别赋一个参数来拟合残差,叶子节点更新值为:
Figure FDA0003291474990000035
式中Rjkm表示建好树后的叶子节点区域,j表示第j个节点,k表示分类转换成k个二分类后第k个类别,i表示第i个特征集;
通过下式计算得到叶子节点更新:
Fkm(xi)=Fk,m-1(xi)+η*∑xi∈Rjkmγjkm*I(xi∈Rjkm);
式中η表示学习率;
基于上述方法继续拟合第二三四类别的第一颗树,在所有类别第一颗树拟合完成后开始拟合第二树,反复进行,直到训练4轮结束,拟合第二个类别的第一颗树。
CN202111165298.8A 2021-09-30 2021-09-30 一种基于梯度提升决策树模型算法的糖尿病足预测方法 Active CN113796852B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111165298.8A CN113796852B (zh) 2021-09-30 2021-09-30 一种基于梯度提升决策树模型算法的糖尿病足预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111165298.8A CN113796852B (zh) 2021-09-30 2021-09-30 一种基于梯度提升决策树模型算法的糖尿病足预测方法

Publications (2)

Publication Number Publication Date
CN113796852A true CN113796852A (zh) 2021-12-17
CN113796852B CN113796852B (zh) 2023-09-08

Family

ID=78939036

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111165298.8A Active CN113796852B (zh) 2021-09-30 2021-09-30 一种基于梯度提升决策树模型算法的糖尿病足预测方法

Country Status (1)

Country Link
CN (1) CN113796852B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116204784A (zh) * 2022-12-30 2023-06-02 成都天仁民防科技有限公司 一种基于das的地铁隧道外部危害作业入侵识别方法
CN117373688A (zh) * 2023-11-07 2024-01-09 爱奥乐医疗器械(深圳)有限公司 慢性病数据处理方法、装置、电子设备和存储介质
CN117547287A (zh) * 2023-11-14 2024-02-13 首都医科大学宣武医院 一种基于多生理参数的糖尿病足风险评估系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070016079A1 (en) * 2005-04-04 2007-01-18 Freeman Jenny E Hyperspectral imaging in diabetes and peripheral vascular disease
WO2015166489A2 (en) * 2014-04-28 2015-11-05 Yeda Research And Development Co. Ltd. Method and apparatus for predicting response to food
CN105997318A (zh) * 2016-04-26 2016-10-12 四川大学 针对糖尿病患者脚型个性化减压鞋垫的制作方法及系统
CN110197720A (zh) * 2019-03-12 2019-09-03 平安科技(深圳)有限公司 糖尿病的预测方法及装置、存储介质、计算机设备
CN110200597A (zh) * 2019-05-27 2019-09-06 上海理工大学 糖尿病足智能鞋垫
CN111329484A (zh) * 2020-02-24 2020-06-26 华南理工大学 基于足底压力信息时空域特征的糖尿病足风险预警装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070016079A1 (en) * 2005-04-04 2007-01-18 Freeman Jenny E Hyperspectral imaging in diabetes and peripheral vascular disease
WO2015166489A2 (en) * 2014-04-28 2015-11-05 Yeda Research And Development Co. Ltd. Method and apparatus for predicting response to food
CN105997318A (zh) * 2016-04-26 2016-10-12 四川大学 针对糖尿病患者脚型个性化减压鞋垫的制作方法及系统
CN110197720A (zh) * 2019-03-12 2019-09-03 平安科技(深圳)有限公司 糖尿病的预测方法及装置、存储介质、计算机设备
CN110200597A (zh) * 2019-05-27 2019-09-06 上海理工大学 糖尿病足智能鞋垫
CN111329484A (zh) * 2020-02-24 2020-06-26 华南理工大学 基于足底压力信息时空域特征的糖尿病足风险预警装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
曲文龙;宋晓明;曲嘉一;: "基于深度置信网络与梯度提升决策树的糖尿病检测方法", 吉林师范大学学报(自然科学版), no. 03 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116204784A (zh) * 2022-12-30 2023-06-02 成都天仁民防科技有限公司 一种基于das的地铁隧道外部危害作业入侵识别方法
CN116204784B (zh) * 2022-12-30 2023-09-08 成都天仁民防科技有限公司 一种基于das的地铁隧道外部危害作业入侵识别方法
CN117373688A (zh) * 2023-11-07 2024-01-09 爱奥乐医疗器械(深圳)有限公司 慢性病数据处理方法、装置、电子设备和存储介质
CN117373688B (zh) * 2023-11-07 2024-06-04 爱奥乐医疗器械(深圳)有限公司 慢性病数据处理方法、装置、电子设备和存储介质
CN117547287A (zh) * 2023-11-14 2024-02-13 首都医科大学宣武医院 一种基于多生理参数的糖尿病足风险评估系统
CN117547287B (zh) * 2023-11-14 2024-04-09 首都医科大学宣武医院 一种基于多生理参数的糖尿病足风险评估系统

Also Published As

Publication number Publication date
CN113796852B (zh) 2023-09-08

Similar Documents

Publication Publication Date Title
CN113796852A (zh) 一种基于梯度提升决策树模型算法的糖尿病足预测方法
CN111951975B (zh) 一种基于深度学习模型gpt-2的脓毒症早期预警方法
CN111631719B (zh) 一种用于预测老年人跌倒风险的方法
CN111329484A (zh) 基于足底压力信息时空域特征的糖尿病足风险预警装置
Mahmood et al. Early detection of clinical parameters in heart disease by improved decision tree algorithm
Ramirez-Bautista et al. Classification of plantar foot alterations by fuzzy cognitive maps against multi-layer perceptron neural network
CN111387938A (zh) 一种基于特征重排一维卷积神经网络的病人心衰死亡风险预测系统
KR20230001096A (ko) 컨볼루션 인공신경망을 이용한 심방세동과 울혈성 심부전의 분류방법
Parisi et al. Artificial intelligence for clinical gait diagnostics of knee osteoarthritis: an evidence-based review and analysis
CN111599462A (zh) 基于认知学习的身体异常气味智能筛查系统
CN113317780A (zh) 一种基于长短时记忆神经网络的异常步态检测方法
Liang et al. Elderly fall risk prediction with plantar center of force using convlstm algorithm
Silva et al. Fusion of clinical, self-reported, and multisensor data for predicting falls
CN113171082A (zh) 一种前束交叉韧带损伤评估方法及装置
Chee et al. Gait acceleration-based diabetes detection using hybrid deep learning
CN116861252A (zh) 一种基于平衡功能异常的跌倒评估模型的构建方法
CN116564521A (zh) 一种慢性病风险评估模型建立方法、介质及系统
Hong et al. Gated temporal convolutional neural network and expert features for diagnosing and explaining physiological time series: a case study on heart rates
KR102511511B1 (ko) 뇌졸중 환자의 임상 데이터를 이용한 운동 기능 회복 예후 예측 장치 및 그 방법
CN113545771B (zh) 一种基于足底压力的集成k近邻帕金森病定量诊断系统
Akyol Growing and Pruning Based Deep Neural Networks Modeling for Effective Parkinson's Disease Diagnosis
Ali et al. Cardiovascular disease detection using multiple machine learning algorithms and their performance analysis
Riyaz et al. Ensemble learning for coronary heart disease prediction
US20220262516A1 (en) Atrial Fibrillation Prediction Model And Prediction System Thereof
Haddi et al. Relevance Vector Machine as Data-Driven Method for Medical Decision Making

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant