CN117373584A - 一种急性肾损伤的动态预测方法及系统 - Google Patents

一种急性肾损伤的动态预测方法及系统 Download PDF

Info

Publication number
CN117373584A
CN117373584A CN202311682021.1A CN202311682021A CN117373584A CN 117373584 A CN117373584 A CN 117373584A CN 202311682021 A CN202311682021 A CN 202311682021A CN 117373584 A CN117373584 A CN 117373584A
Authority
CN
China
Prior art keywords
clinical
model
feature
prediction
patient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311682021.1A
Other languages
English (en)
Other versions
CN117373584B (zh
Inventor
杨莉
徐大民
张宇慧
郑茜子
赵酉璐
吕继成
徐菱忆
周庆庆
王瑞国
许娟
高剑伟
聂瑞
史文钊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University First Hospital
Original Assignee
Peking University First Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University First Hospital filed Critical Peking University First Hospital
Priority to CN202311682021.1A priority Critical patent/CN117373584B/zh
Publication of CN117373584A publication Critical patent/CN117373584A/zh
Application granted granted Critical
Publication of CN117373584B publication Critical patent/CN117373584B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明涉及一种急性肾损伤的动态预测方法及系统,该方法包括:采集患者的临床时序数据;将临床时序数据进行处理得到临床性特征;基于多种特征筛选模型进行特征筛选,得到20个最优基础临床性特征;基于tsfresh技术对最优基础临床性特征进行时序特征增强处理,得到增强临床性特征;将拼接临床性特征作为输入值输入至多种模型中进行训练,选取AUROC最高的模型作为预测模型;将目标患者当前时刻的临床时序数据输入至预测模型中,将预测模型的输出作为预测结果。能够实现对患者AKI的状态预测,预测结果的准确性较高。

Description

一种急性肾损伤的动态预测方法及系统
技术领域
本发明涉及急性肾损伤预测技术领域,尤其涉及一种急性肾损伤的动态预测方法及系统。
背景技术
急性肾损伤(acute kidney injury,AKI)是不同病因导致的肾功能短期内急剧下降或丧失。住院患者中,AKI发生率高(10%~25%)、病因多样、病情复杂,且肾损伤早期隐袭、后期进展迅速,一旦发展为重症AKI,患者往往并发多器官衰竭,死亡率极高(50%~75%)。迄今为止仍缺乏有效的AKI治疗药物,临床以支持、对症、透析治疗为主,如何有效进行AKI的院内早期防治是当前全球肾脏病领域面临的重大问题和挑战。
AKI患者广泛分布于临床各学科,全国多中心流行病学调查显示,在我国的不同级别医院中,AKI患者的漏误诊率高达78%,并且存在病因筛查不足、药物剂量不当等诸多诊疗问题;而无论是在内科系统、外科系统,还是重症监护室,AKI发生以前,常见的诱因包括容量不足、低血压和药物,是相对可以去除且可逆的。因此,将关注点从治疗提前至预防、早期识别高危患者、尽早和主动地提供预防和处理措施,对于降低AKI的发生率、避免疾病进展、降低患者的院内死亡风险具有重要意义。
近年来,随着电子信息技术的发展、大数据和人工智能的应用,我们能够准确地挖掘医疗信息并处理大量数据,为临床研究提供更准确、可靠的数据基础。在医院积累了大量患者的临床时序数据的基础上,我们有机会构建早期筛查模型来预测急性肾损伤(AKI)的发生。然而,如何充分利用患者的临床时序数据来动态预测AKI发生的概率,仍然是医疗界亟需解决的问题。
为此,本发明提供了一种急性肾损伤的动态预测方法及系统,该方法可以充分利用历史患者的临床时序数据,并应用机器学习等技术,有望解决如何动态预测AKI发生概率的问题,这将为医疗实践提供更精确、个体化的预测工具,有助于早期干预和改善患者的预后。
发明内容
基于此,有必要针对上述技术问题,提供一种急性肾损伤的动态预测方法及系统。
为解决上述技术问题,本发明提供了一种急性肾损伤的动态预测方法,包括:
根据预设时间间隔采集患者的临床时序数据;
将临床时序数据依次进行离群特征点处理、缺失值填充处理和生成特征列处理,得到临床性特征;
基于多种特征筛选模型进行特征筛选,分别筛选出20个基础临床性特征,并选取AUROC最高的特征筛选模型作为指标最优模型,得到20个最优基础临床性特征;
基于tsfresh技术对最优基础临床性特征进行时序特征增强处理,得到增强临床性特征;
将最优基础临床性特征和增强临床性特征进行拼接,得到拼接临床性特征,将拼接临床性特征作为输入值输入至多种模型中进行训练,并选取AUROC最高的模型作为预测模型;
将目标患者当前时刻的临床时序数据输入至预测模型中,并将预测模型的输出作为预测结果。
可选地,所述患者包括AKI患者和非AKI患者,对AKI患者的临床时序数据,采集的临床时序数据截止到AKI发生时间点之前,对非AKI患者的临床时序数据,采集的临床时序数据截止到出院时间点。
可选地,所述临床时序数据包括基线特征、最新特征和变化趋势特征。
可选地,所述特征筛选模型包括Lasso回归模型、RF模型和 LightGBM模型。
可选地,所述基于多种特征筛选模型进行特征筛选,分别筛选出20个基础临床性特征,并选取AUROC最高的特征筛选模型作为指标最优模型,得到20个最优基础临床性特征,具体包括:根据预设时间间隔采集的临床时序数据,对AKI患者,预设预测未来多个时段是否发生AKI的多个task任务,并标记相应task任务的label属性值,其中,每个预测未来时段的数值为预设时间间隔的数值的整数倍,将包含task任务的label属性值和临床性特征划分成第一训练集和第一验证集,将第一训练集分别输入至Lasso回归模型、RF模型和LightGBM模型中进行训练,分别得到训练过程中筛选出的20个基础临床性特征,再将第一验证集分别输入至Lasso回归模型、RF模型和 LightGBM模型中进行验证,计算AUROC评价指标,选取AUROC最高的特征筛选模型作为指标最优模型,并将指标最优模型筛选出的20个基础临床性特征作为20个最优基础临床性特征。
可选地,所述基于tsfresh技术对最优基础临床性特征进行时序特征增强处理,得到增强临床性特征,具体包括:将20个最优基础临床性特征作为输入值,基于tsfresh技术,对20个最优基础临床性特征进行时序特征增强处理,得到增强临床性特征,其中,增强临床性特征包括相关统计特征、滚动窗口特征、分布特征、时序特征和信息论特征。
可选地,所述模型包括LR模型、RandomForest模型、LightGBM模型和XGboost模型。
可选地,所述将最优基础临床性特征和增强临床性特征进行拼接,得到拼接临床性特征,将拼接临床性特征作为输入值输入至多种模型中进行训练,并选取AUROC最高的模型作为预测模型,具体包括:将20个最优基础临床性特征和增强临床性特征进行拼接,得到拼接临床性特征,将拼接临床性特征划分成第二训练集和第二验证集,将第二训练集分别输入至LR模型、RandomForest模型、LightGBM模型和XGboost模型,再将第二验证集分别输入至LR模型、RandomForest模型、LightGBM模型和XGboost模型中进行验证,计算AUROC评价指标,选取AUROC最高的模型作为预测模型。
本发明还提供了一种急性肾损伤的动态预测系统,包括:
数据采集模块,用于根据预设时间间隔采集患者的临床时序数据;
数据预处理模块,用于将临床时序数据依次进行离群特征点处理、缺失值填充处理和生成特征列处理,得到临床性特征;
特征筛选模块,用于基于多种特征筛选模型进行特征筛选,分别筛选出20个基础临床性特征,并选取AUROC最高的特征筛选模型作为指标最优模型,得到20个最优基础临床性特征;
特征增强模块,用于基于tsfresh技术对最优基础临床性特征进行时序特征增强处理,得到增强临床性特征;
模型训练模块,用于将最优基础临床性特征和增强临床性特征进行拼接,得到拼接临床性特征,将拼接临床性特征作为输入值输入至多种模型中进行训练,并选取AUROC最高的模型作为预测模型;
AKI预测模块,用于将目标患者当前时刻的临床时序数据输入至预测模型中,并将预测模型的输出作为预测结果。
可选地,所述患者包括AKI患者和非AKI患者,对AKI患者的临床时序数据,采集的临床时序数据截止到AKI发生时间点之前,对非AKI患者的临床时序数据,采集的临床时序数据截止到出院时间点。
本发明的优点及有益效果在于:本发明提供的一种急性肾损伤的动态预测方法及系统,该方法能够基于目标患者的临床时序数据进行端到端的最优基础临床性特征提取以及时序特征增强,进而得到与AKI相关的拼接临床性特征,通过输入至预测模型中得到目标患者的AKI发病概率,该方法不仅能够提高预测结果的准确性,还能够实现全流程端到端预测,无需人为干预,节省大量医疗资源。
附图说明
图1为本发明实施例中一种急性肾损伤的动态预测方法的流程图;
图2为本发明实施例中一种急性肾损伤的动态预测系统的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,下面通过具体实施方式结合附图对本发明做进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
为便于对本实施例进行理解,下面对本发明实施例进行详细介绍。
实施例一
图1为本发明实施例一提供的急性肾损伤的动态预测方法的流程图。
参考图1,该方法包括以下步骤:
S101、根据预设时间间隔采集患者的临床时序数据。
在本实施例中,患者包括AKI患者和非AKI患者,对AKI患者的临床时序数据,采集的临床时序数据截止到AKI发生时间点之前,对非AKI患者的临床时序数据,采集的临床时序数据截止到出院时间点。
在本实施例中,临床时序数据包括基线特征、最新特征和变化趋势特征。
在本实施例中,基线特征包括但不限于:人口学特征(例如:性别、年龄等)、既往史特征(例如:肝硬化、高血压、冠心病、心肌炎、糖尿病、慢性胃炎等)、体征特征(例如:BMI、身高、体重、呼吸频率、心率等)、检查检验特征(例如:基本血常规特征、基本生化特征、尿液全项、粪便特征等)。
在本实施例中,最新特征包括但不限于:用药特征(例如:利尿药、脱水药、抗肿瘤药物等)、检验特征等。
在本实施例中,变化趋势特征包括但不限于:基本血常规特征、炎症相关特征、基本生化特征的最大值、最小值、变化率等。
在本实施例中,预设时间间隔如每6小时采集一次前述的临床时序数据,该时间间隔可根据实际情况灵活设置,在此不再进行限定。
在本实施例中,根据预设时间间隔采集患者的临床时序数据,例如包括:采集65000名患者的临床时序数据,其中,临床时序数据包括基线特征、最新特征和变化趋势特征,这三种特征组合起来,采用每6小时采集一次的时间间隔,形成临床时序数据,每个患者在住院期间,对于AKI患者而言,采集的临床时序数据截止到AKI发生时间点之前,对于非AKI患者而言,采集的临床时序数据截止到出院时间点。
S102、将临床时序数据依次进行离群特征点处理、缺失值填充处理和生成特征列处理,得到临床性特征。
在本实施例中,为提升后续建模性能,本发明还对临床时序数据依次进行了离群特征点处理、缺失值填充处理和生成特征列处理,其中,离群特征点处理主要基于统计方法的离群点检测,利用基于百分位数的箱线图方法计算数据点与均值之间的偏差或与分位数的关系,确定其是否为离群点;缺失值填充处理主要包括对特征缺失率进行统计,缺失率高于预设阈值的特征进行列删除处理,对于连续性特征的缺失采用当前特征列的中位数进行填充,对于离散型特征的缺失采用当前特征列的众数进行填充;生成特征列处理主要包括对一些特定的两列特征进行组合的方式生成目标特征列,如尿素特征列与肌酐特征列进行组合生成尿素/肌酐特征列。
S103、基于多种特征筛选模型进行特征筛选,分别筛选出20个基础临床性特征,并选取AUROC最高的特征筛选模型作为指标最优模型,得到20个最优基础临床性特征。
在本实施例中,本发明涉及的特征筛选模型主要采用Lasso回归模型、RF模型和LightGBM模型。
在本实施例中,基于多种特征筛选模型进行特征筛选,分别筛选出20个基础临床性特征,并选取AUROC最高的特征筛选模型作为指标最优模型,得到20个最优基础临床性特征,具体包括:根据预设时间间隔采集的临床时序数据,对AKI患者,预设预测未来多个时段是否发生AKI的多个task任务,并标记相应task任务的label属性值,其中,每个预测未来时段的数值为预设时间间隔的数值的整数倍,将包含task任务的label属性值和临床性特征划分成第一训练集和第一验证集,将第一训练集分别输入至Lasso回归模型、RF模型和LightGBM模型中进行训练,分别得到训练过程中筛选出的20个基础临床性特征,再将第一验证集分别输入至Lasso回归模型、RF模型和 LightGBM模型中进行验证,计算AUROC评价指标,选取AUROC最高的特征筛选模型作为指标最优模型,并将指标最优模型筛选出的20个基础临床性特征作为20个最优基础临床性特征,结果如下表1所示,选取AUROC最高的LightGBM模型作为指标最优模型,同时将LightGBM模型选出的20个基础临床性特征作为20个最优基础临床性特征。
表1 三种特征筛选模型的模型评价指标
在本实施例中,根据预设时间间隔采集的临床时序数据,对AKI患者,预设预测未来多个时段是否发生AKI的多个task任务,并标记相应task任务的label属性值,例如包括:根据预设时间间隔(例如6小时)采集的临床时序数据,对AKI患者,预设了三个task任务,分别包括:task1任务、task2任务和task3任务,其中,task1任务为预测未来24H内是否发生AKI,task2任务为预测未来48H内是否发生AKI,task3任务为预测未来72H内是否发生AKI,此处应当注意的是:未来24H、未来48H、未来72H均为预设时间间隔(6小时)的整数倍,并分别相应标记task任务的label属性值,即预测未来24H内是否发生AKI的task1任务只对AKI发生时间点之前的24H内(包括24H)标记为1,也就是AKI发生时间点前4条记录,其余标记为0;预测未来48H内是否发生AKI的task2任务只对AKI发生时间点之前的48H内(包括48H)标记为1,也就是AKI发生时间点前8条记录,其余标记为0;预测未来72H内是否发生AKI的task3任务只对AKI发生时间点之前的72H内(包括72H)标记为1,也就是AKI发生时间点前12条记录,其余标记为0。
S104、基于tsfresh技术对最优基础临床性特征进行时序特征增强处理,得到增强临床性特征。
在本实施例中,基于tsfresh技术对最优基础临床性特征进行时序特征增强处理,得到增强临床性特征,具体包括:将20个最优基础临床性特征作为输入值,基于tsfresh技术,对20个最优基础临床性特征进行时序特征增强处理,得到增强临床性特征,其中,增强临床性特征包括相关统计特征、滚动窗口特征、分布特征、时序特征和信息论特征。
在本实施例中,相关统计特征(Statistical Features)包括但不限于:均值、标准差、最小值、最大值、峰度、偏度等描述时间序列分布和形状的统计量。
在本实施例中,滚动窗口特征(Rolling Features)包括但不限于:通过在滚动窗口上计算统计特征,捕捉时间序列的局部模式;例如,滚动平均、滚动标准差等。
在本实施例中,分布特征(Distribution Features)包括但不限于:基于时间序列的分布特性,提取出分布参数和统计量;例如,高斯分布的均值和标准差。
在本实施例中,时序特征(Temporal Features)包括但不限于:描述时间序列的时序模式和动态行为,例如,自相关、周期性、趋势等。
在本实施例中,信息论特征(Information-Theoretic Features)包括但不限于:基于信息论的概念;例如,熵、互信息等,用于衡量时间序列的复杂性和不确定性。
S105、将最优基础临床性特征和增强临床性特征进行拼接,得到拼接临床性特征,将拼接临床性特征作为输入值输入至多种模型中进行训练,并选取AUROC最高的模型作为预测模型。
在本实施例中,本发明涉及的模型包括LR模型、RandomForest模型、LightGBM模型和XGboost模型。
在本实施例中,将最优基础临床性特征和增强临床性特征进行拼接,得到拼接临床性特征,将拼接临床性特征作为输入值输入至多种模型中进行训练,并选取AUROC最高的模型作为预测模型,具体包括:将20个最优基础临床性特征和增强临床性特征进行拼接,得到拼接临床性特征,将拼接临床性特征划分成第二训练集和第二验证集,将第二训练集分别输入至LR模型、RandomForest模型、LightGBM模型和XGboost模型,再将第二验证集分别输入至LR模型、RandomForest模型、LightGBM模型和XGboost模型中进行验证,计算AUROC评价指标,选取AUROC最高的模型作为预测模型。
在本实施例中,将最优基础临床性特征和增强临床性特征进行拼接,得到拼接临床性特征,例如包括:最优基础临床性特征的特征维度为20维,增强临床性特征的特征维度为200维,拼接的步骤为:20维+200维=220维,得到220维的拼接临床性特征,再将220维的拼接临床性特征划分成第二训练集和第二验证集,将第二训练集分别输入至LR模型、RandomForest模型、LightGBM模型和XGboost模型,随后将第二验证集分别输入至LR模型、RandomForest模型、LightGBM模型和XGboost模型中进行验证,计算AUROC评价指标,选取AUROC最高的模型作为预测模型,结果如下表2所示,选取AUROC最高的RandomForest模型作为预测模型。
表2 四种模型的模型评价指标
S106、将目标患者当前时刻的临床时序数据输入至预测模型中,并将预测模型的输出作为预测结果。
本实施例提供的一种急性肾损伤的动态预测方法,包括:根据预设时间间隔采集患者的临床时序数据;将临床时序数据依次进行离群特征点处理、缺失值填充处理和生成特征列处理,得到临床性特征;基于多种特征筛选模型进行特征筛选,分别筛选出20个基础临床性特征,并选取AUROC最高的特征筛选模型作为指标最优模型,得到20个最优基础临床性特征;基于tsfresh技术对最优基础临床性特征进行时序特征增强处理,得到增强临床性特征;将最优基础临床性特征和增强临床性特征进行拼接,得到拼接临床性特征,将拼接临床性特征作为输入值输入至多种模型中进行训练,并选取AUROC最高的模型作为预测模型;将目标患者当前时刻的临床时序数据输入至预测模型中,并将预测模型的输出作为预测结果;该实施方法基于患者的临床时序数据进行端到端的最优基础临床性特征提取以及时序特征增强,进而得到与AKI相关的拼接临床性特征,通过输入至预测模型中,能够得到目标患者的AKI发病概率,不仅能够提高预测结果的准确性,有效利用历史患者的临床时序数据来动态预测AKI的发生概率,还能够实现全流程端到端预测,无需人为干预,节省大量医疗资源。
实施例二
本实施例在上述实施例一的基础上,提供一种急性肾损伤的动态预测系统200,请参见图2,用于实现上述实施例一所述的一种急性肾损伤的动态预测方法的步骤,该系统200主要包括:数据采集模块210、数据预处理模块220、特征筛选模块230、特征增强模块240、模型训练模块250以及AKI预测模块260,其中,
数据采集模块210,用于根据预设时间间隔采集患者的临床时序数据;
数据预处理模块220,用于将临床时序数据依次进行离群特征点处理、缺失值填充处理和生成特征列处理,得到临床性特征;
特征筛选模块230,用于基于多种特征筛选模型进行特征筛选,分别筛选出20个基础临床性特征,并选取AUROC最高的特征筛选模型作为指标最优模型,得到20个最优基础临床性特征;
特征增强模块240,用于基于tsfresh技术对最优基础临床性特征进行时序特征增强处理,得到增强临床性特征;
模型训练模块250,用于将最优基础临床性特征和增强临床性特征进行拼接,得到拼接临床性特征,将拼接临床性特征作为输入值输入至多种模型中进行训练,并选取AUROC最高的模型作为预测模型;
AKI预测模块260,用于将目标患者当前时刻的临床时序数据输入至预测模型中,并将预测模型的输出作为预测结果。
在本实施例中,数据采集模块210采集的患者包括AKI患者和非AKI患者,对AKI患者的临床时序数据,采集的临床时序数据截止到AKI发生时间点之前,对非AKI患者的临床时序数据,采集的临床时序数据截止到出院时间点。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

Claims (10)

1.一种急性肾损伤的动态预测方法,其特征在于,包括:
根据预设时间间隔采集患者的临床时序数据;
将临床时序数据依次进行离群特征点处理、缺失值填充处理和生成特征列处理,得到临床性特征;
基于多种特征筛选模型进行特征筛选,分别筛选出20个基础临床性特征,并选取AUROC最高的特征筛选模型作为指标最优模型,得到20个最优基础临床性特征;
基于tsfresh技术对最优基础临床性特征进行时序特征增强处理,得到增强临床性特征;
将最优基础临床性特征和增强临床性特征进行拼接,得到拼接临床性特征,将拼接临床性特征作为输入值输入至多种模型中进行训练,并选取AUROC最高的模型作为预测模型;
将目标患者当前时刻的临床时序数据输入至预测模型中,并将预测模型的输出作为预测结果。
2.根据权利要求1所述的一种急性肾损伤的动态预测方法,其特征在于,所述患者包括AKI患者和非AKI患者,对AKI患者的临床时序数据,采集的临床时序数据截止到AKI发生时间点之前,对非AKI患者的临床时序数据,采集的临床时序数据截止到出院时间点。
3.根据权利要求1所述的一种急性肾损伤的动态预测方法,其特征在于,所述临床时序数据包括基线特征、最新特征和变化趋势特征。
4.根据权利要求1所述的一种急性肾损伤的动态预测方法,其特征在于,所述特征筛选模型包括Lasso回归模型、RF模型和 LightGBM模型。
5.根据权利要求4所述的一种急性肾损伤的动态预测方法,其特征在于,所述基于多种特征筛选模型进行特征筛选,分别筛选出20个基础临床性特征,并选取AUROC最高的特征筛选模型作为指标最优模型,得到20个最优基础临床性特征,具体包括:根据预设时间间隔采集的临床时序数据,对AKI患者,预设预测未来多个时段是否发生AKI的多个task任务,并标记相应task任务的label属性值,其中,每个预测未来时段的数值为预设时间间隔的数值的整数倍,将包含task任务的label属性值和临床性特征划分成第一训练集和第一验证集,将第一训练集分别输入至Lasso回归模型、RF模型和 LightGBM模型中进行训练,分别得到训练过程中筛选出的20个基础临床性特征,再将第一验证集分别输入至Lasso回归模型、RF模型和 LightGBM模型中进行验证,计算AUROC评价指标,选取AUROC最高的特征筛选模型作为指标最优模型,并将指标最优模型筛选出的20个基础临床性特征作为20个最优基础临床性特征。
6.根据权利要求1所述的一种急性肾损伤的动态预测方法,其特征在于,所述基于tsfresh技术对最优基础临床性特征进行时序特征增强处理,得到增强临床性特征,具体包括:将20个最优基础临床性特征作为输入值,基于tsfresh技术,对20个最优基础临床性特征进行时序特征增强处理,得到增强临床性特征,其中,增强临床性特征包括相关统计特征、滚动窗口特征、分布特征、时序特征和信息论特征。
7.根据权利要求1所述的一种急性肾损伤的动态预测方法,其特征在于,所述模型包括LR模型、RandomForest模型、LightGBM模型和XGboost模型。
8.根据权利要求7所述的一种急性肾损伤的动态预测方法,其特征在于,所述将最优基础临床性特征和增强临床性特征进行拼接,得到拼接临床性特征,将拼接临床性特征作为输入值输入至多种模型中进行训练,并选取AUROC最高的模型作为预测模型,具体包括:将20个最优基础临床性特征和增强临床性特征进行拼接,得到拼接临床性特征,将拼接临床性特征划分成第二训练集和第二验证集,将第二训练集分别输入至LR模型、RandomForest模型、LightGBM模型和XGboost模型,再将第二验证集分别输入至LR模型、RandomForest模型、LightGBM模型和XGboost模型中进行验证,计算AUROC评价指标,选取AUROC最高的模型作为预测模型。
9.一种急性肾损伤的动态预测系统,其特征在于,包括:
数据采集模块,用于根据预设时间间隔采集患者的临床时序数据;
数据预处理模块,用于将临床时序数据依次进行离群特征点处理、缺失值填充处理和生成特征列处理,得到临床性特征;
特征筛选模块,用于基于多种特征筛选模型进行特征筛选,分别筛选出20个基础临床性特征,并选取AUROC最高的特征筛选模型作为指标最优模型,得到20个最优基础临床性特征;
特征增强模块,用于基于tsfresh技术对最优基础临床性特征进行时序特征增强处理,得到增强临床性特征;
模型训练模块,用于将最优基础临床性特征和增强临床性特征进行拼接,得到拼接临床性特征,将拼接临床性特征作为输入值输入至多种模型中进行训练,并选取AUROC最高的模型作为预测模型;
AKI预测模块,用于将目标患者当前时刻的临床时序数据输入至预测模型中,并将预测模型的输出作为预测结果。
10.根据权利要求9所述的一种急性肾损伤的动态预测系统,其特征在于,所述患者包括AKI患者和非AKI患者,对AKI患者的临床时序数据,采集的临床时序数据截止到AKI发生时间点之前,对非AKI患者的临床时序数据,采集的临床时序数据截止到出院时间点。
CN202311682021.1A 2023-12-08 2023-12-08 一种急性肾损伤的动态预测方法及系统 Active CN117373584B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311682021.1A CN117373584B (zh) 2023-12-08 2023-12-08 一种急性肾损伤的动态预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311682021.1A CN117373584B (zh) 2023-12-08 2023-12-08 一种急性肾损伤的动态预测方法及系统

Publications (2)

Publication Number Publication Date
CN117373584A true CN117373584A (zh) 2024-01-09
CN117373584B CN117373584B (zh) 2024-03-12

Family

ID=89389670

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311682021.1A Active CN117373584B (zh) 2023-12-08 2023-12-08 一种急性肾损伤的动态预测方法及系统

Country Status (1)

Country Link
CN (1) CN117373584B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117831772A (zh) * 2024-03-05 2024-04-05 北京大学第一医院(北京大学第一临床医学院) 一种急性肾损伤临床辅助决策系统

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120077690A1 (en) * 2010-09-24 2012-03-29 University Of Pittsburgh - Of The Commonwealth System Of Higher Education Biomarkers of renal injury
WO2018223006A1 (en) * 2017-06-02 2018-12-06 The Henry M. Jackson Foundation For The Advancement Of Military Medicine, Inc. Predictive factors for acute kidney injury
CN111612278A (zh) * 2020-06-01 2020-09-01 戴松世 生命状态预测方法、装置、电子设备及存储介质
CN111915596A (zh) * 2020-08-07 2020-11-10 杭州深睿博联科技有限公司 一种肺结节良恶性预测方法及装置
CN111949708A (zh) * 2020-08-10 2020-11-17 中国平安人寿保险股份有限公司 基于时序特征提取的多任务预测方法、装置、设备及介质
CN112992346A (zh) * 2021-04-09 2021-06-18 中山大学附属第三医院(中山大学肝脏病医院) 重症脊髓损伤预后的预测模型的建立方法
US20210327540A1 (en) * 2018-08-17 2021-10-21 Henry M. Jackson Foundation For The Advancement Of Military Medicine Use of machine learning models for prediction of clinical outcomes
CN113657503A (zh) * 2021-08-18 2021-11-16 上海交通大学 一种基于多模态数据融合的恶性肝肿瘤分类方法
CN113674862A (zh) * 2021-07-08 2021-11-19 中国科学院国家空间科学中心 一种基于机器学习的急性肾功能损伤发病预测方法
CN113903458A (zh) * 2021-10-26 2022-01-07 北京大学第三医院(北京大学第三临床医学院) 急性肾损伤早期预测方法及装置
CN114121285A (zh) * 2021-12-02 2022-03-01 青岛市第六人民医院 肾损伤风险数据预测系统、预测方法、计算机设备及介质
CN114420231A (zh) * 2022-01-14 2022-04-29 东南大学 一种可解释的急性肾损伤持续预警方法、系统、存储介质及电子设备
CN115732080A (zh) * 2022-11-23 2023-03-03 湖州市中心医院 一种基于多模态深度学习的数据处理预测系统及方法
CN116705326A (zh) * 2023-06-30 2023-09-05 中山大学中山眼科中心 一种终末期肾病疗效评估与并发症风险预测系统
CN116825349A (zh) * 2023-06-15 2023-09-29 北京科技大学 一种aki风险预测方法、装置及计算机可读存储介质
CN117133454A (zh) * 2023-07-21 2023-11-28 南京医科大学附属逸夫医院 动态可解释的2型糖尿病患者造影剂急性肾损伤预测平台
US20230380742A1 (en) * 2022-05-25 2023-11-30 Taichung Veterans General Hospital Acute kidney injury predicting system and method thereof

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120077690A1 (en) * 2010-09-24 2012-03-29 University Of Pittsburgh - Of The Commonwealth System Of Higher Education Biomarkers of renal injury
WO2018223006A1 (en) * 2017-06-02 2018-12-06 The Henry M. Jackson Foundation For The Advancement Of Military Medicine, Inc. Predictive factors for acute kidney injury
US20210327540A1 (en) * 2018-08-17 2021-10-21 Henry M. Jackson Foundation For The Advancement Of Military Medicine Use of machine learning models for prediction of clinical outcomes
CN111612278A (zh) * 2020-06-01 2020-09-01 戴松世 生命状态预测方法、装置、电子设备及存储介质
CN111915596A (zh) * 2020-08-07 2020-11-10 杭州深睿博联科技有限公司 一种肺结节良恶性预测方法及装置
CN111949708A (zh) * 2020-08-10 2020-11-17 中国平安人寿保险股份有限公司 基于时序特征提取的多任务预测方法、装置、设备及介质
CN112992346A (zh) * 2021-04-09 2021-06-18 中山大学附属第三医院(中山大学肝脏病医院) 重症脊髓损伤预后的预测模型的建立方法
CN113674862A (zh) * 2021-07-08 2021-11-19 中国科学院国家空间科学中心 一种基于机器学习的急性肾功能损伤发病预测方法
CN113657503A (zh) * 2021-08-18 2021-11-16 上海交通大学 一种基于多模态数据融合的恶性肝肿瘤分类方法
CN113903458A (zh) * 2021-10-26 2022-01-07 北京大学第三医院(北京大学第三临床医学院) 急性肾损伤早期预测方法及装置
CN114121285A (zh) * 2021-12-02 2022-03-01 青岛市第六人民医院 肾损伤风险数据预测系统、预测方法、计算机设备及介质
CN114420231A (zh) * 2022-01-14 2022-04-29 东南大学 一种可解释的急性肾损伤持续预警方法、系统、存储介质及电子设备
US20230380742A1 (en) * 2022-05-25 2023-11-30 Taichung Veterans General Hospital Acute kidney injury predicting system and method thereof
CN115732080A (zh) * 2022-11-23 2023-03-03 湖州市中心医院 一种基于多模态深度学习的数据处理预测系统及方法
CN116825349A (zh) * 2023-06-15 2023-09-29 北京科技大学 一种aki风险预测方法、装置及计算机可读存储介质
CN116705326A (zh) * 2023-06-30 2023-09-05 中山大学中山眼科中心 一种终末期肾病疗效评估与并发症风险预测系统
CN117133454A (zh) * 2023-07-21 2023-11-28 南京医科大学附属逸夫医院 动态可解释的2型糖尿病患者造影剂急性肾损伤预测平台

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
刘东峰: "基于时间序列的急性肾损伤发病风险的预测研究", 《中国优秀硕士学位论文全文数据库 (基础科学辑)》, pages 002 - 1115 *
袁柏荣: "应用机器学习建立北京协和医院急性肾损伤预测模型:单中心研究计划", 《协和医学杂志》, vol. 12, no. 6, 31 December 2021 (2021-12-31), pages 913 - 921 *
邬金鸣等: "国内外急性肾损伤预测研究进展", 《中华医学图书情报杂志》, vol. 30, no. 6, 30 June 2021 (2021-06-30), pages 17 - 28 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117831772A (zh) * 2024-03-05 2024-04-05 北京大学第一医院(北京大学第一临床医学院) 一种急性肾损伤临床辅助决策系统

Also Published As

Publication number Publication date
CN117373584B (zh) 2024-03-12

Similar Documents

Publication Publication Date Title
CN117373584B (zh) 一种急性肾损伤的动态预测方法及系统
CN105528529B (zh) 基于大数据分析的中医临床技能评价体系的数据处理方法
CN104699985A (zh) 一种医疗大数据采集分析系统及方法
CN108648827A (zh) 心脑血管疾病风险预测方法及装置
Attallah An intelligent ECG-based tool for diagnosing COVID-19 via ensemble deep learning techniques
WO2019229528A2 (en) Using machine learning to predict health conditions
Nuuttila et al. Validity of the wrist-worn polar vantage V2 to measure heart rate and heart rate variability at rest
Baldoumas et al. A prototype photoplethysmography electronic device that distinguishes congestive heart failure from healthy individuals by applying natural time analysis
WO2019041710A1 (zh) 基于健康检查一体机的慢病管理系统及方法
Rykov et al. Activity tracker–based metrics as digital markers of cardiometabolic health in working adults: Cross-sectional study
CN106919804A (zh) 基于临床数据的药物推荐方法、推荐装置及服务器
CN116110577A (zh) 一种基于大数据的健康监测分析方法及系统
CN112466459B (zh) 静脉血栓栓塞症主动预测、预警及全周期智能化管理系统
CN112967803A (zh) 基于集成模型的急诊患者早期死亡率预测方法及系统
CN106845140A (zh) 一种基于尿比重和尿量监测的肾衰竭预警方法及系统
Buman et al. Behavioral periodicity detection from 24 h wrist accelerometry and associations with cardiometabolic risk and health-related quality of life
Ramazi et al. Multi-modal predictive models of diabetes progression
Giorgio et al. FPGA-based decision support system for ECG analysis
Sacchi et al. Improving risk-stratification of Diabetes complications using temporal data mining
US8428965B2 (en) System for clinical research and clinical management of cardiovascular risk using ambulatory blood pressure monitoring and actigraphy
Derevitskii et al. Analysis course of the disease of type 2 diabetes patients using Markov chains and clustering methods.
Yu et al. Work-in-progress: On the feasibility of lightweight scheme of real-time atrial fibrillation detection using deep learning
US11810652B1 (en) Computer decision support for determining surgery candidacy in stage four chronic kidney disease
CN114783587A (zh) 严重急性肾损伤智能预测系统
Ali et al. A Machine Learning Approach for Early COVID-19 Symptoms Identification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant