CN117290686A - 一种预测患者跌倒风险的模型的构建方法 - Google Patents
一种预测患者跌倒风险的模型的构建方法 Download PDFInfo
- Publication number
- CN117290686A CN117290686A CN202311560971.7A CN202311560971A CN117290686A CN 117290686 A CN117290686 A CN 117290686A CN 202311560971 A CN202311560971 A CN 202311560971A CN 117290686 A CN117290686 A CN 117290686A
- Authority
- CN
- China
- Prior art keywords
- model
- risk
- gait
- data
- balance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010276 construction Methods 0.000 title abstract description 9
- 230000005021 gait Effects 0.000 claims abstract description 106
- 238000011156 evaluation Methods 0.000 claims abstract description 20
- 238000012216 screening Methods 0.000 claims abstract description 8
- 238000007781 pre-processing Methods 0.000 claims abstract description 4
- 238000000034 method Methods 0.000 claims description 37
- 238000012545 processing Methods 0.000 claims description 20
- 230000002159 abnormal effect Effects 0.000 claims description 17
- 238000012360 testing method Methods 0.000 claims description 14
- 238000012549 training Methods 0.000 claims description 13
- 238000007477 logistic regression Methods 0.000 claims description 10
- 238000007637 random forest analysis Methods 0.000 claims description 10
- 238000012706 support-vector machine Methods 0.000 claims description 10
- 238000005457 optimization Methods 0.000 claims description 9
- 238000003066 decision tree Methods 0.000 claims description 6
- 230000035945 sensitivity Effects 0.000 claims description 5
- 230000004580 weight loss Effects 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 3
- 238000012352 Spearman correlation analysis Methods 0.000 claims description 2
- 238000010801 machine learning Methods 0.000 abstract description 5
- 230000005856 abnormality Effects 0.000 description 3
- 238000010219 correlation analysis Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 206010017577 Gait disturbance Diseases 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000013058 risk prediction model Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/285—Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/103—Detecting, measuring or recording devices for testing the shape, pattern, colour, size or movement of the body or parts thereof, for diagnostic purposes
- A61B5/11—Measuring movement of the entire body or parts thereof, e.g. head or hand tremor, mobility of a limb
- A61B5/112—Gait analysis
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/40—Detecting, measuring or recording for evaluating the nervous system
- A61B5/4005—Detecting, measuring or recording for evaluating the nervous system for evaluating the sensory system
- A61B5/4023—Evaluating sense of balance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
- G06F18/2113—Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24147—Distances to closest patterns, e.g. nearest neighbour classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Public Health (AREA)
- Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Heart & Thoracic Surgery (AREA)
- Veterinary Medicine (AREA)
- Animal Behavior & Ethology (AREA)
- Physiology (AREA)
- Surgery (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Epidemiology (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Dentistry (AREA)
- Primary Health Care (AREA)
- Databases & Information Systems (AREA)
- Neurology (AREA)
- Neurosurgery (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种预测患者跌倒风险的模型的构建方法,该构建方法包括:数据的采集、数据的预处理以及模型构建等步骤。本发明针对平衡能力数据以及步态能力数据,通过筛选出与平衡能力数据相关性较高的第一风险特征以及与步态能力数据相关性较高的第二风险特征,采用8种二分类的机器学习模型针对平衡能力和步态能力分别进行模型构建,并分别计算7种模型评价指标,分别选取AUROC最高的预测患者跌倒风险的模型作为最终模型,该模型能够实现对患者步态和平衡能力的快速预测,模型效果较好,且得到的评估结果更加能体现真实的平衡能力与步态能力,提高了患者跌倒风险预测结果的准确度。
Description
技术领域
本发明涉及跌倒风险预测领域,尤其涉及一种预测患者跌倒风险的模型的构建方法。
背景技术
据估计,每年有超过30%的65岁以上人士和约50%的85岁以上人士会发生跌倒。而跌倒者中有12%~42%会导致受伤。此外,一旦个人发生了跌倒,他们第二次跌倒的可能性就会增加50%。相较于年轻同龄人,老年患者的与跌倒相关的死亡率更高。
跌倒通常是多因素共同作用的结果,包括步态和平衡障碍。通常需要医生结合标准化评分量表评估患者的平衡和步态能力,费时费力。此外,现有传感器采集到数据与标准评分量表存在差异,为直观评判患者跌倒风险带来挑战。基于此,本发明提供了一种预测患者跌倒风险的模型的构建方法,基于传感器数据并结合标准评分量表的评判标准采用8种机器学习模型,建立了跌倒风险预测模型,可实现对患者步态和平衡能力快速预测。
发明内容
基于此,有必要针对上述技术问题,提供一种预测患者跌倒风险的模型的构建方法。
本发明提供了一种预测患者跌倒风险的模型的构建方法,包括如下步骤:
数据的采集,采集平衡能力数据和步态能力数据,其中,平衡能力数据包括平衡能力异常数据和平衡能力正常数据,且平衡能力数据包含38个第一原始特征,步态能力数据包括步态能力异常数据和步态能力正常数据,且步态能力数据包含20个第二原始特征;
数据的预处理,将平衡能力数据和步态能力数据均进行缺失值填充处理,随后采用随机森林特征筛选方法,从第一原始特征和第二原始特征中,分别筛选出平衡能力数据和步态能力数据中前10个重要特征后,再采用spearman相关性分析方法,分别选取在平衡能力数据和步态能力数据中相关性较高的特征作为风险特征,得到第一风险特征和第二风险特征,其中,第一风险特征为与平衡能力数据相关性较高的8个第一原始特征,第二风险特征为与步态能力数据相关性较高的6个第二原始特征,并将平衡能力数据和步态能力数据进行标准化处理;
模型构建,将包含第一风险特征的平衡能力数据以及包含第二风险特征的步态能力数据分别划分成训练集和测试集,采用SMOTE算法对平衡能力数据和步态能力数据的训练集均进行过采样处理,基于选取的第一风险特征,构建8种预测患者跌倒风险的第一模型,并将平衡能力数据中测试集的第一风险特征作为输入值输入至第一模型中,计算7种模型评价指标,选取AUROC最高的预测患者跌倒风险的第一模型作为基于平衡能力的最终模型,基于选取的第二风险特征,构建8种预测患者跌倒风险的第二模型,并将步态能力数据中测试集的第二风险特征作为输入值输入至第二模型中,计算7种模型评价指标,选取AUROC最高的预测患者跌倒风险的第二模型作为基于步态能力的最终模型。
在本发明的一些具体实施方案中,所述将采集的平衡能力数据和步态能力数据进行缺失值填充处理,具体包括:采用中位数对平衡能力数据和步态能力数据中的缺失值进行缺失值填充处理。
在本发明的一些具体实施方案中,所述第一风险特征包括体重指数、测试者前庭感知的轨迹长度、患侧的摆幅均值、测试者双脚左右摆幅的最大值、测试者前庭感知左右摆幅的最大值、患侧的轨迹长度、测试者前庭感知的摆速均值以及健侧的前后摆幅的最大值,所述第二风险特征包括体重指数、年龄、减重、测试者双支撑时间的均值、测试者步宽的均值以及测试者站立时间的均值。
在本发明的一些具体实施方案中,所述标准化处理的公式如下:
其中,μ表示平均值,σ表示标准差,表示待标准化的平衡能力数据或步态能力数
据,表示标准化的平衡能力数据或步态能力数据。
在本发明的一些具体实施方案中,所述将包含第一风险特征的平衡能力数据以及包含第二风险特征的步态能力数据分别划分成训练集和测试集,具体包括:将包含第一风险特征的平衡能力数据以及包含第二风险特征的步态能力数据均按照7:3的比例划分成训练集和测试集。
在本发明的一些具体实施方案中,所述8种预测患者跌倒风险的第一模型和8种预测患者跌倒风险的第二模型均包括朴素贝叶斯模型、K最近邻模型、支持向量机模型、逻辑斯谛回归模型、决策树模型、AdaBoost模型、XGBoost模型以及随机森林模型。
在本发明的一些具体实施方案中,所述7种模型评价指标包括准确率、敏感性、特异性、精确率、F1分数、AUROC和AUPRC。
在本发明的一些具体实施方案中,在所述选取AUROC最高的预测患者跌倒风险的第一模型作为基于平衡能力的最终模型以及选取AUROC最高的预测患者跌倒风险的第二模型作为基于步态能力的最终模型之后,均还包括:基于随机搜索,将最终模型进行超参数优化处理,将剩余的7种预测患者跌倒风险的第一模型和第二模型均进行默认超参数优化处理。
在本发明的一些具体实施方案中,在所述模型构建步骤之后,还包括采用列线图分别对多个第一风险特征以及多个第二风险特征进行整合,分别构建平衡能力评分图以及步态能力评分图,用于预测平衡能力或步态能力是否正常。
本发明还提供了所述的构建方法获得的预测患者跌倒风险的模型。
本发明的优点及有益效果在于:
本发明提供的一种预测患者跌倒风险的模型的构建方法,针对平衡能力数据以及步态能力数据,通过筛选出与平衡能力数据相关性较高的第一风险特征以及与步态能力数据相关性较高的第二风险特征,采用8种二分类的机器学习模型针对平衡能力和步态能力分别进行模型构建,并分别计算7种模型评价指标,分别选取AUROC最高的预测患者跌倒风险的模型作为最终模型,该模型能够实现对患者步态和平衡能力的快速预测,模型效果较好,且得到的评估结果更加能体现真实的平衡能力与步态能力,提高了患者跌倒风险预测结果的准确度。
附图说明
图1为预测患者跌倒风险的模型的构建方法的流程图;
图2为平衡能力评分图;
图3为步态能力评分图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,下面通过具体实施方式结合附图对本发明做进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明旨在解决现有技术中存在的不足之处,针对平衡能力以及步态能力,分别构建一套预测患者跌倒风险的模型,该两套预测患者跌倒风险的模型基于下述预测患者跌倒风险的模型的构建方法,包括如下步骤:
S101、数据的采集,采集平衡能力数据和步态能力数据,其中,平衡能力数据包括平衡能力异常数据和平衡能力正常数据,且平衡能力数据包含38个第一原始特征,步态能力数据包括步态能力异常数据和步态能力正常数据,且步态能力数据包含20个第二原始特征。
在一种实施方式中,例如:采集1527例平衡能力数据,其中,包含1407例平衡能力异常数据和120例平衡能力正常数据;又如:采集1995例步态能力数据,其中,包含1857例步态能力异常数据和138例步态能力正常数据,应当理解的是,此处的平衡能力异常数据和步态能力异常数据均代表着患者的平衡能力异常数据和步态能力异常数据,同理,平衡能力正常数据和步态能力正常数据均代表着正常人的平衡能力正常数据和步态能力正常数据。
S102、数据的预处理,将平衡能力数据和步态能力数据均进行缺失值填充处理,随后采用随机森林特征筛选方法,从第一原始特征和第二原始特征中,分别筛选出平衡能力数据和步态能力数据中前10个重要特征后,再采用spearman相关性分析方法,分别选取在平衡能力数据和步态能力数据中相关性较高的特征作为风险特征,得到第一风险特征和第二风险特征,其中,第一风险特征为与平衡能力数据相关性较高的8个第一原始特征,第二风险特征为与步态能力数据相关性较高的6个第二原始特征,并将平衡能力数据和步态能力数据进行标准化处理。
在一种实施方式中,所述将采集的平衡能力数据和步态能力数据进行缺失值填充处理,具体包括:采用中位数对平衡能力数据和步态能力数据中的缺失值进行缺失值填充处理,基于缺失值填充处理,能够在较大程度上还原了缺失数据的风险表现,为后续的建模性能带来较好提升。
在一种实施方式中,基于随机森林特征筛选方法筛,从第一原始特征和第二原始特征中,选出前10个重要特征后,再采用spearman相关性分析方法,分别选取相关性较高的特征作为风险特征,得到第一风险特征和第二风险特征,其中,为构建基于平衡能力数据的模型选取了第一风险特征,该第一风险特征为与平衡能力数据相关性较高的8个第一原始特征,具体包括:体重指数、测试者前庭感知的轨迹长度、患侧的摆幅均值、测试者双脚左右摆幅的最大值、测试者前庭感知左右摆幅的最大值、患侧的轨迹长度、测试者前庭感知的摆速均值以及健侧的前后摆幅的最大值;另外,为构建基于步态能力数据的模型选取了第二风险特征,该第二风险特征为与步态能力数据相关性较高的6个第二原始特征,具体包括:体重指数、年龄、减重、测试者双支撑时间的均值、测试者步宽的均值以及测试者站立时间的均值。
在一种实施方式中,将平衡能力数据和步态能力数据进行标准化处理,其中,标准化处理的公式如下:
其中,μ表示平均值,σ表示标准差,表示待标准化的平衡能力数据或步态能力数
据,表示标准化的平衡能力数据或步态能力数据,其作用是将平衡能力异常数据或步态
能力异常数据值线性变换到均值0,方差1的分布下,以减少规模、特征、分布差异等对后续
构建模型的影响。
S103、模型构建,将包含第一风险特征的平衡能力数据以及包含第二风险特征的步态能力数据分别划分成训练集和测试集,采用SMOTE算法对平衡能力数据和步态能力数据的训练集均进行过采样处理,基于选取的第一风险特征,构建8种预测患者跌倒风险的第一模型,并将平衡能力数据中测试集的第一风险特征作为输入值输入至第一模型中,计算7种模型评价指标,选取AUROC最高的预测患者跌倒风险的第一模型作为基于平衡能力的最终模型,基于选取的第二风险特征,构建8种预测患者跌倒风险的第二模型,并将步态能力数据中测试集的第二风险特征作为输入值输入至第二模型中,计算7种模型评价指标,选取AUROC最高的预测患者跌倒风险的第二模型作为基于步态能力的最终模型。
在一种实施方式中,包含第一风险特征的平衡能力异常数据以及包含第二风险特征的步态能力异常数据分别按照7:3的比例拆分为训练集和测试集,并对平衡能力数据和步态能力数据的训练集使用SMOTE算法进行过采样处理,该方法通过在少数类样本(正常人)之间插值生成合成样本,可以增加正常样本的数目,从而可以改善训练集中正常异常样本不均衡的问题及增强模型的泛化能力。
在一种实施方式中,为了寻找到最优的模型,本发明针对平衡能力和步态能力,分别采用8种二分类的机器学习模型进行训练,该8种预测患者跌倒风险的模型为朴素贝叶斯模型、K最近邻模型、支持向量机模型、逻辑斯谛回归模型、决策树模型、AdaBoost模型、XGBoost模型以及随机森林模型,并且分别计算7种模型评价指标,7种模型评价指标具体包括:准确率、敏感性、特异性、精确率、F1分数、AUROC和AUPRC,分别选取AUROC最高的预测患者跌倒风险的模型作为最终模型,针对平衡能力和步态能力,对8种预测患者跌倒风险的模型分别进行7种模型评价的结果如下表1-2。
表1 基于平衡能力的模型的模型评价指标
模型 | 准确率 | 敏感性 | 特异性 | 精确率 | F1分数 | AUROC | AUPRC |
朴素贝叶斯模型 | 33% | 28% | 83% | 95% | 0.44 | 0.73 | 0.97 |
K最近邻模型 | 74% | 75% | 58% | 96% | 0.84 | 0.78 | 0.98 |
支持向量机模型 | 79% | 81% | 58% | 96% | 0.88 | 0.80 | 0.98 |
逻辑斯谛回归模型 | 65% | 62% | 92% | 99% | 0.77 | 0.78 | 0.98 |
决策树模型 | 80% | 84% | 33% | 94% | 0.88 | 0.59 | 0.96 |
AdaBoost模型 | 75% | 78% | 42% | 94% | 0.85 | 0.64 | 0.95 |
XGBoost模型 | 86% | 90% | 33% | 94% | 0.92 | 0.75 | 0.97 |
随机森林模型 | 88% | 94% | 25% | 94% | 0.94 | 0.76 | 0.97 |
表2 基于步态能力的模型的模型评价指标
模型 | 准确率 | 敏感性 | 特异性 | 精确率 | F1分数 | AUROC | AUPRC |
朴素贝叶斯模型 | 32% | 27% | 93% | 98% | 0.44 | 0.68 | 0.97 |
K最近邻模型 | 68% | 69% | 50% | 95% | 0.80 | 0.62 | 0.96 |
支持向量机模型 | 53% | 52% | 64% | 95% | 0.67 | 0.66 | 0.95 |
逻辑斯谛回归模型 | 66% | 64% | 86% | 98% | 0.78 | 0.84 | 0.99 |
决策树模型 | 78% | 81% | 29% | 94% | 0.88 | 0.55 | 0.96 |
AdaBoost模型 | 73% | 75% | 43% | 95% | 0.84 | 0.76 | 0.98 |
XGBoost模型 | 86% | 90% | 36% | 95% | 0.92 | 0.78 | 0.98 |
随机森林模型 | 85% | 88% | 36% | 95% | 0.91 | 0.76 | 0.98 |
由上表1-2可知,对于平衡能力的预测患者跌倒风险的模型而言,支持向量机模型的AUROC最高,因此,将支持向量机模型作为基于平衡能力的最终模型;对于步态能力的预测患者跌倒风险的模型而言,逻辑斯谛回归模型的AUROC最高,因此,将逻辑斯谛回归模型作为基于步态能力的最终模型。
在一种实施方式中,在选取AUROC最高的预测患者跌倒风险的第一模型作为基于平衡能力的最终模型以及选取AUROC最高的预测患者跌倒风险的第二模型作为基于步态能力的最终模型之后,均还包括:基于随机搜索,将最终模型进行超参数优化处理,将剩余的7种预测患者跌倒风险的第一模型和第二模型均进行默认超参数优化处理。
在一种实施方式中,例如:在基于平衡能力的模型中,对支持向量机模型采用随机搜索的方法进行超参数优化,如:支持向量机的超参数:,/>,其他剩余的7种模型则采用默认超参数优化。
在一种实施方式中,例如:在基于步态能力的模型中,对逻辑斯谛回归模型采用随机搜索的方法进行超参数优化,如:逻辑斯谛回归的超参数:,其他剩余的7种模型则采用默认超参数优化;另外,考虑到较高的敏感性,更适用于实际应用,因此对逻辑斯谛回归模型的预测概率进行了阈值调节,阈值可设置为0.4。
在一种实施方式中,不同模型的默认超参数具体如下:
(1)随机森林模型的默认超参数为:,/>,,/>;
(2)XGBoost模型的默认超参数为:,/>,;
(3)朴素贝叶斯模型的默认超参数为:;
(4)K最近邻模型的默认超参数为:,/>,/>;
(5)支持向量机模型的默认超参数为:,/>,/>,/>,;
(6)逻辑斯谛回归模型的默认超参数为:,/>,/>,;
(7)决策树模型的默认超参数为:,/>,/>,;
(8)AdaBoost模型的默认超参数为:,/>,,/>。
S104、采用列线图分别对多个第一风险特征以及多个第二风险特征进行整合,分别构建平衡能力评分图以及步态能力评分图,用于预测平衡能力或步态能力是否正常。
在一种实施方式中,采用列线图对多个第一风险特征进行整合,生成平衡能力评分图,根据多个第一风险特征的分值,并将所有第一风险特征的分值相加,基于所有第一风险特征的分值之和与平衡能力异常预测概率的映射关系,预测平衡能力是否正常,如:参考附图2所示,其中,附图2中包含测试者双脚左右摆幅的最大值、测试者前庭感知左右摆幅的最大值以及患侧的轨迹长度三种第一风险特征,分别查找每种第一风险特征的分值,如测试者双脚左右摆幅的最大值为5mm时,其分值为8分,测试者前庭感知左右摆幅的最大值取值为50mm时,其分值为0分,患侧的轨迹长度取值为100mm时,其分值为11分,此时三种第一风险特征的总分是19分,则对应于平衡能力异常预测概率为0.7,因此,表明有70%的可能性为异常。
在一种实施方式中,采用列线图对多个第二风险特征进行整合,生成步态能力评分图,根据多个第二风险特征的分值,并将所有第二风险特征的分值相加,基于所有第二风险特征的分值之和与步态能力异常预测概率的映射关系,预测步态能力是否正常,如:参考附图3所示,其中,附图3中包含年龄、减重以及测试者双支撑时间的均值三种第二风险特征,分别查找每种第二风险特征的分值,这里将年龄划分成4个组分,分别为中青年(≤45岁)、中年(45-60岁)、中老年(60-75岁)、老年(≥75岁),将减重划分成3个组分,分别为低(≤5.5kg)、中(5.5-10kg)、高(≥10kg),如测试者双支撑时间的均值取值为1s时,年龄是中年,减重是低时,三种第二风险特征的分值分别为:6分、6分、6分,此时第二风险特征的总分是18分,则对应于步态能力异常预测概率为0.75,因此,表明有75%的可能性为异常。
在一种实施方式中,本发明还提供了一种预测患者跌倒风险的模型,该模型是基于前述的预测患者跌倒风险的模型的构建方法获得的。
综上,本发明提供了一种预测患者跌倒风险的模型的构建方法,针对平衡能力数据以及步态能力数据,基于传感器数据以及标准评分量表的评判标准,通过筛选出与平衡能力数据相关性较高的第一风险特征以及与步态能力数据相关性较高的第二风险特征,采用8种机器学习模型,分别构建基于平衡能力的模型和步态能力的模型,并基于模型评价指标,分别选取AUROC最高的预测患者跌倒风险的模型作为最终模型,该模型用于实现对患者步态和平衡能力的快速预测,模型预测效果较好,具体来说,对于平衡能力的预测而言,AUROC为0.801,且在总评分大于40时,可预测患者具有较高风险的平衡能力异常(有90%的可能性为异常),对于步态能力的预测而言,AUROC为0.841,且在总评分大于20时,可预测患者具有较高风险的步态能力异常(有85%的可能性为异常);另外,得到的评估结果更加能体现真实的平衡能力与步态能力,提高了患者跌倒风险预测结果的准确度。
以上内容是结合具体的实施方式对本发明所做的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (9)
1.一种预测患者跌倒风险的模型的构建方法,其特征在于,包括:
数据的采集,采集平衡能力数据和步态能力数据,其中,平衡能力数据包括平衡能力异常数据和平衡能力正常数据,且平衡能力数据包含38个第一原始特征,步态能力数据包括步态能力异常数据和步态能力正常数据,且步态能力数据包含20个第二原始特征;
数据的预处理,将平衡能力数据和步态能力数据均进行缺失值填充处理,随后采用随机森林特征筛选方法,从第一原始特征和第二原始特征中,分别筛选出平衡能力数据和步态能力数据中前10个重要特征后,再采用spearman相关性分析方法,分别选取在平衡能力数据和步态能力数据中相关性较高的特征作为风险特征,得到第一风险特征和第二风险特征,其中,第一风险特征为与平衡能力数据相关性较高的8个第一原始特征,第二风险特征为与步态能力数据相关性较高的6个第二原始特征,并将平衡能力数据和步态能力数据进行标准化处理;
模型构建,将包含第一风险特征的平衡能力数据以及包含第二风险特征的步态能力数据分别划分成训练集和测试集,采用SMOTE算法对平衡能力数据和步态能力数据的训练集均进行过采样处理,基于选取的第一风险特征,构建8种预测患者跌倒风险的第一模型,并将平衡能力数据中测试集的第一风险特征作为输入值输入至第一模型中,计算7种模型评价指标,选取AUROC最高的预测患者跌倒风险的第一模型作为基于平衡能力的最终模型,基于选取的第二风险特征,构建8种预测患者跌倒风险的第二模型,并将步态能力数据中测试集的第二风险特征作为输入值输入至第二模型中,计算7种模型评价指标,选取AUROC最高的预测患者跌倒风险的第二模型作为基于步态能力的最终模型。
2.根据权利要求1所述的一种预测患者跌倒风险的模型的构建方法,其特征在于,所述将采集的平衡能力数据和步态能力数据进行缺失值填充处理,具体包括:采用中位数对平衡能力数据和步态能力数据中的缺失值进行缺失值填充处理。
3.根据权利要求1所述的一种预测患者跌倒风险的模型的构建方法,其特征在于,所述第一风险特征包括体重指数、测试者前庭感知的轨迹长度、患侧的摆幅均值、测试者双脚左右摆幅的最大值、测试者前庭感知左右摆幅的最大值、患侧的轨迹长度、测试者前庭感知的摆速均值以及健侧的前后摆幅的最大值,所述第二风险特征包括体重指数、年龄、减重、测试者双支撑时间的均值、测试者步宽的均值以及测试者站立时间的均值。
4.根据权利要求1所述的一种预测患者跌倒风险的模型的构建方法,其特征在于,所述标准化处理的公式如下:
其中,μ表示平均值,σ表示标准差,/>表示待标准化的平衡能力数据或步态能力数据,/>表示标准化的平衡能力数据或步态能力数据。
5.根据权利要求1所述的一种预测患者跌倒风险的模型的构建方法,其特征在于,所述将包含第一风险特征的平衡能力数据以及包含第二风险特征的步态能力数据分别划分成训练集和测试集,具体包括:将包含第一风险特征的平衡能力数据以及包含第二风险特征的步态能力数据均按照7:3的比例划分成训练集和测试集。
6.根据权利要求1所述的一种预测患者跌倒风险的模型的构建方法,其特征在于,所述8种预测患者跌倒风险的第一模型和8种预测患者跌倒风险的第二模型均包括朴素贝叶斯模型、K最近邻模型、支持向量机模型、逻辑斯谛回归模型、决策树模型、AdaBoost模型、XGBoost模型以及随机森林模型。
7.根据权利要求1所述的一种预测患者跌倒风险的模型的构建方法,其特征在于,所述7种模型评价指标包括准确率、敏感性、特异性、精确率、F1分数、AUROC和AUPRC。
8.根据权利要求1所述的一种预测患者跌倒风险的模型的构建方法,其特征在于,在所述选取AUROC最高的预测患者跌倒风险的第一模型作为基于平衡能力的最终模型以及选取AUROC最高的预测患者跌倒风险的第二模型作为基于步态能力的最终模型之后,均还包括:基于随机搜索,将最终模型进行超参数优化处理,将剩余的7种预测患者跌倒风险的第一模型和第二模型均进行默认超参数优化处理。
9.根据权利要求1所述的一种预测患者跌倒风险的模型的构建方法,其特征在于,在所述模型构建步骤之后,还包括采用列线图分别对多个第一风险特征以及多个第二风险特征进行整合,分别构建平衡能力评分图以及步态能力评分图,用于预测平衡能力或步态能力是否正常。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311560971.7A CN117290686A (zh) | 2023-11-22 | 2023-11-22 | 一种预测患者跌倒风险的模型的构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311560971.7A CN117290686A (zh) | 2023-11-22 | 2023-11-22 | 一种预测患者跌倒风险的模型的构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117290686A true CN117290686A (zh) | 2023-12-26 |
Family
ID=89253818
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311560971.7A Pending CN117290686A (zh) | 2023-11-22 | 2023-11-22 | 一种预测患者跌倒风险的模型的构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117290686A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106447489A (zh) * | 2016-09-12 | 2017-02-22 | 中山大学 | 一种基于部分堆栈融合的用户信用评估模型 |
CN115579148A (zh) * | 2022-10-19 | 2023-01-06 | 中南大学湘雅医院 | 医学识别模型构建方法与医学数据处理方法 |
CN116861252A (zh) * | 2023-07-28 | 2023-10-10 | 上海市徐汇区中心医院 | 一种基于平衡功能异常的跌倒评估模型的构建方法 |
CN116959723A (zh) * | 2023-07-28 | 2023-10-27 | 上海市徐汇区中心医院 | 一种老年人防跌倒的评价与训练方法和系统 |
-
2023
- 2023-11-22 CN CN202311560971.7A patent/CN117290686A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106447489A (zh) * | 2016-09-12 | 2017-02-22 | 中山大学 | 一种基于部分堆栈融合的用户信用评估模型 |
CN115579148A (zh) * | 2022-10-19 | 2023-01-06 | 中南大学湘雅医院 | 医学识别模型构建方法与医学数据处理方法 |
CN116861252A (zh) * | 2023-07-28 | 2023-10-10 | 上海市徐汇区中心医院 | 一种基于平衡功能异常的跌倒评估模型的构建方法 |
CN116959723A (zh) * | 2023-07-28 | 2023-10-27 | 上海市徐汇区中心医院 | 一种老年人防跌倒的评价与训练方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Carey et al. | Modeling training loads and injuries: the dangers of discretization | |
Carey et al. | Predictive modelling of training loads and injury in Australian football | |
Kim et al. | A data-driven artificial intelligence model for remote triage in the prehospital environment | |
CN110196814B (zh) | 一种软件质量评价方法 | |
Impellizzeri et al. | Acute to random workload ratio is ‘as’ associated with injury as acute to actual chronic workload ratio: time to dismiss ACWR and its components | |
CN112633601B (zh) | 疾病事件发生概率的预测方法、装置、设备及计算机介质 | |
CN114628033A (zh) | 疾病风险预测方法、装置、设备及存储介质 | |
CN116502742A (zh) | 一种基于梯度提升决策树的风险行为信息预测方法及系统 | |
Amarullah et al. | Planning decision support system using building mall AHP (Analytical Hierarchy Process) | |
CN108595432A (zh) | 医疗文书纠错方法 | |
Barrio et al. | Comparison of two discrimination indexes in the categorisation of continuous predictors in time-to-event studies | |
US20230386665A1 (en) | Method and device for constructing autism spectrum disorder (asd) risk prediction model | |
Silva et al. | Fusion of clinical, self-reported, and multisensor data for predicting falls | |
CN105354414A (zh) | 一种基于层次分析的人体健康状况评估方法 | |
KR102187344B1 (ko) | 결정 트리를 이용한 반려동물 진단 방법 및 장치 | |
CN112397204A (zh) | 一种预测高原病的方法、装置、计算机设备和存储介质 | |
Zumeta-Olaskoaga et al. | Prediction of sports injuries in football: a recurrent time-to-event approach using regularized Cox models | |
CN117290686A (zh) | 一种预测患者跌倒风险的模型的构建方法 | |
US20230060794A1 (en) | Diagnostic Tool | |
CN106709522B (zh) | 一种基于改进模糊三角数的高压电缆施工缺陷分级方法 | |
Lavalley‐Morelle et al. | Multivariate joint model under competing risks to predict death of hospitalized patients for SARS‐CoV‐2 infection | |
Mythily et al. | An efficient feature selection algorithm for health care data analysis | |
Wolfe et al. | Models developed by three techniques did not achieve acceptable prediction of binary trauma outcomes | |
CN113096815A (zh) | 一种基于logistic回归的慢性肾病预测方法 | |
Schwarzerova et al. | An innovative perspective on metabolomics data analysis in biomedical research using concept drift detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |