CN115995298B - 心脏术后aki发生概率确定方法及系统、辅助决策系统 - Google Patents

心脏术后aki发生概率确定方法及系统、辅助决策系统 Download PDF

Info

Publication number
CN115995298B
CN115995298B CN202310277664.1A CN202310277664A CN115995298B CN 115995298 B CN115995298 B CN 115995298B CN 202310277664 A CN202310277664 A CN 202310277664A CN 115995298 B CN115995298 B CN 115995298B
Authority
CN
China
Prior art keywords
aki
data
order
model
heart
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310277664.1A
Other languages
English (en)
Other versions
CN115995298A (zh
Inventor
赵韡
蔡建芳
袁靖
刁晓林
赵帅
夏芸
郭丛丛
刘莉莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuwai Hospital of CAMS and PUMC
Original Assignee
Fuwai Hospital of CAMS and PUMC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuwai Hospital of CAMS and PUMC filed Critical Fuwai Hospital of CAMS and PUMC
Priority to CN202310277664.1A priority Critical patent/CN115995298B/zh
Publication of CN115995298A publication Critical patent/CN115995298A/zh
Application granted granted Critical
Publication of CN115995298B publication Critical patent/CN115995298B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

本公开涉及一种心脏术后AKI发生概率确定方法及系统、辅助决策系统。本公开通过对采集得到的目标患者在心脏手术围术期的特征数据进行预处理,得到目标特征数据,基于预设的FFM模型对目标患者的目标特征数据进行二阶组合特征计算,得到与心脏术后AKI风险相关的二阶组合特征数据,其中,二阶组合特征数据是由目标特征数据中,一阶连续特征离散化之后的特征和一阶离散特征组合得到的特征数据,将目标患者在心脏手术围术期的目标特征数据和二阶组合特征数据输入预设的预测模型,为模型输入增加了与心脏术后AKI相关的关键二阶组合特征信息,能够在早期预测目标患者的心脏术后AKI发生概率,并提高预测结果的准确度。

Description

心脏术后AKI发生概率确定方法及系统、辅助决策系统
技术领域
本公开涉及人工智能技术领域,尤其涉及一种心脏术后AKI发生概率确定方法及系统、辅助决策系统。
背景技术
心脏手术相关急性肾损伤(cardiac surgery-associated acute kidneyinjury,CSA-AKI)是心脏外科术后常见的严重并发症之一,目前尚无干预措施能够逆转疾病进程,只能通过早期诊断、早期干预的方式来阻止病情恶化,提高临床疗效。然而,临床对心脏术后AKI进行诊断时,只有在患者的肾功能明显受损,肌酐值上升到预设阈值时才能被诊断为心脏术后AKI,具有一定的滞后性,而早期识别心脏术后AKI风险患者往往需要医生人工评估,评估的准确性难以保证。因此,如何通过非人工的方式在早期预测心脏术后AKI的并发概率,提高预测结果的准确性是需要解决的技术问题。
发明内容
为了解决上述技术问题,本公开提供了一种心脏术后AKI发生概率确定方法及系统、辅助决策系统。
本公开实施例的第一方面提供了一种心脏术后AKI发生概率确定方法,该方法包括:
数据采集,采集目标患者在心脏手术围术期的特征数据;
数据预处理,对所述特征数据进行预处理,得到所述目标患者在心脏手术围术期的目标特征数据;
二阶组合特征计算,基于预设的FFM模型对所述目标患者在心脏手术围术期的目标特征数据进行二阶组合特征计算,得到与心脏术后AKI风险相关的二阶组合特征数据,其中,所述二阶组合特征数据是由所述目标特征数据中,一阶连续特征离散化之后的特征和一阶离散特征组合得到的特征数据;
AKI概率预测,将所述目标患者在心脏手术围术期的目标特征数据和所述二阶组合特征数据输入预设的预测模型,确定得到所述目标患者发生AKI的概率。
可选的,所述二阶组合特征计算,包括:
将所述目标患者在心脏手术围术期的目标特征数据输入预设的FFM模型,计算所述目标特征数据中的一阶离散特征和一阶连续特征离散化之后的特征之间,每一对组合特征在对应特征域的隐向量点积的绝对值;
按照绝对值从大到小的顺序对所述组合特征进行排序;
基于高于预设排序的二阶组合特征计算对应的二阶组合特征数据,并将所述二阶组合特征数据作为与心脏术后AKI风险相关的二阶组合特征数据。
可选的,所述数据采集之前,所述方法还包括:
采集多个心脏术后患者在心脏手术围术期的样本特征数据和对应的AKI标签;
对所述多个心脏术后患者的样本特征数据进行预处理,得到训练数据;
基于所述多个心脏术后患者对应的训练数据和AKI标签训练FFM模型,用于计算与心脏术后AKI风险相关的二阶组合特征,并获得训练好的FFM模型。
可选的,所述基于所述多个心脏术后患者对应的训练数据和AKI标签训练FFM模型得到与心脏术后AKI风险相关的二阶组合特征之后,所述方法还包括:
基于所述与心脏术后AKI风险相关的二阶组合特征计算所述训练数据的二阶组合特征数据,得到与心脏术后AKI风险相关的二阶组合特征数据集;
基于所述训练数据、所述二阶组合特征数据集以及所述多个心脏术后患者对应的AKI标签,训练用于预测AKI发生概率的预测模型。
本公开实施例的第二方面提供了一种心脏术后AKI发生概率确定系统,该系统包括:
数据采集模块,用于采集目标患者在心脏手术围术期的特征数据;
数据预处理模块,用于对所述特征数据进行预处理,得到所述目标患者在心脏手术围术期的目标特征数据;
二阶组合特征计算模块,用于基于预设的FFM模型对所述目标患者在心脏手术围术期的目标特征数据进行二阶组合特征计算,得到与心脏术后AKI风险相关的二阶组合特征数据,其中,所述二阶组合特征数据是由所述目标特征数据中一阶连续特征离散化之后的特征和一阶离散特征组合得到的特征数据;
AKI概率预测模块,用于将所述目标患者在心脏手术围术期的目标特征数据和所述二阶组合特征数据输入预设的预测模型,确定得到所述目标患者发生AKI的概率。
可选的,所述二阶组合特征计算模块,包括:
绝对值计算单元,用于将所述目标患者在心脏手术围术期的目标特征数据输入预设的FFM模型,计算所述目标特征数据中的一阶离散特征和一阶连续特征离散化之后的特征之间每一对组合特征在对应特征域的隐向量点积的绝对值;
排序单元,用于按照绝对值从大到小的顺序对所述组合特征进行排序;
组合单元,用于分别基于排序高于预设排序序号的每个组合特征生成对应的二阶组合特征数据,并将所述二阶组合特征数据作为与心脏术后AKI风险相关的二阶组合特征数据。
可选的,所述系统还包括:
FFM模型训练模块,用于接收数据预处理模块发来的所述多个心脏术后患者对应的训练数据、数据采集模块发来的AKI标签,训练FFM模型。
可选的,还包括:
预测模型训练模块,用于接收所述的数据预处理模块发来的多个心脏术后患者对应的训练数据,二阶组合特征计算模块发来的二阶组合样本特征数据集,数据采集模块发来的AKI标签;根据所述训练数据、所述二阶组合样本特征数据集以及所述多个心脏术后患者对应的AKI标签,训练用于预测AKI发生概率的预测模型。
本公开实施例的第三方面提供了一种辅助决策系统,该系统包括心脏术后AKI发生概率确定系统,还包括辅助决策模块,辅助决策模块包括:
分级单元,用于对目标患者发生AKI的概率进行分级处理,得到所述目标患者发生AKI的风险等级;
知识查找单元,用于查找不同风险等级的AKI的处理知识;
提示单元,用于向所述目标患者的临床医师发送包含所述风险等级和所述处理知识的提示信息。
本公开实施例的第四方面提供了一种计算机设备,包括存储器和处理器,以及计算机程序,其中,存储器中存储有计算机程序,当计算机程序被处理器执行时,实现如上述第一方面的心脏术后AKI发生概率确定方法。
本公开实施例的第五方面提供了一种计算机可读存储介质,存储介质中存储有计算机程序,当计算机程序被处理器执行时,实现如上述第一方面的心脏术后AKI发生概率确定方法。
本公开实施例提供的技术方案与现有技术相比具有如下优点:
在本公开实施例提供的心脏术后AKI发生概率确定方法及系统、辅助决策系统,能够基于预设的FFM模型对目标患者在心脏手术围术期的目标特征数据进行二阶组合特征计算,得到与心脏术后AKI风险相关的二阶组合特征数据,为预设的预测模型输入增加了与心脏术后AKI相关的关键二阶组合特征信息,能够在早期预测目标患者的心脏术后AKI发生概率,并提高预测结果的准确度。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本公开实施例提供的一种心脏术后AKI发生概率确定方法的流程图;
图2是本公开实施例提供的一种计算二阶组合特征的方法的流程图;
图3是本公开实施例提供的一种训练FFM模型的方法的流程图;
图4是本公开实施例提供的一种训练预测模型的方法的流程图;
图5是本公开实施例提供的一种心脏术后AKI发生概率确定系统的结构示意图;
图6是本公开实施例提供的一种辅助决策系统的结构示意图;
图7是本公开实施例提供的一种计算机设备的结构示意图。
具体实施方式
为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
图1是本公开实施例提供的一种心脏术后AKI发生概率确定方法的流程图,该方法可以由一种心脏术后AKI发生概率确定系统执行。如图1所示,本实施例提供的心脏术后AKI发生概率确定方法包括如下步骤:
S101、数据采集,采集目标患者在心脏手术围术期的特征数据。
本公开实施例中的AKI可以理解为急性肾损伤(acute kidney injury,AKI),是指由多种病因和危险因素导致的肾小球滤过率快速下降而出现的临床综合征。
本公开实施例中的目标患者可以理解为心脏手术后需要评估AKI发生概率的患者。
本公开实施例中的围术期可以理解为包含手术前、手术中及手术后的一段时期,具体可以是从确定接受手术治疗时起,直到与这次手术有关的治疗基本结束为止的一段时间。
本公开实施例中的特征数据可以理解为生理特征数据,可以包括生物基础学统计特征、心血管相关特征,术中特征等,具体地,特征数据可以包括患者体重、糖尿病史、化验信息、心功能评级、手术类型、术中红细胞用量等,在此不做限定。
本公开实施例中,心脏术后AKI发生概率确定系统可以进行数据采集,对需要评估AKI并发概率的目标患者,在确定进行心脏手术到接受术后治疗之间的围术期数据进行采集。具体地,特征数据在患者数据更新时,会触发数据采集模块采集最新数据,根据实际需要,也可以每隔预定时间采集数据,比如12小时进行一次采集。
S102、数据预处理,对所述特征数据进行预处理,得到所述目标患者在心脏手术围术期的目标特征数据。
本公开实施例中的目标特征数据可以理解为经过数据预处理后得到的特征数据。
本公开实施例中,心脏术后AKI发生概率确定系统可以在采集得到目标患者在心脏手术围术期的特征数据后,对得到的特征数据进行数据预处理,得到目标患者在心脏手术围术期的目标特征数据。
在本公开实施例的一种示例性的实施方式中,数据预处理可以包括空值填充、关键特征筛选、决策树分箱,具体地,所述的每个特征数据均包括连续特征数据和离散特征数据,心脏术后AKI发生概率确定系统可以将采集到的特征数据中空值率高于预设阈值,比如8%的连续特征数据进行剔除,并基于预先建立的回归拟合模型,将经过剔除处理后的连续特征数据中的空值替换为拟合值,实现空值填充,再对采集到的特征数据中,离散特征数据中的空值添加缺失类,得到经过空值填充处理后的离散特征和连续特征,再基于套索算法(Least Absolute Shrinkage and Selection Operator,Lasso)从中筛选出关键特征,得到特征筛选后的连续特征和离散特征,再对每一个特征筛选后的连续特征和标签去拟合树模型,将树节点的分裂阈值作为分箱的切点,输出分箱后的连续特征,即连续特征离散化之后的特征,因为连续特征和离散特征均为一阶特征,因此将连续特征离散化之后的特征与离散特征定义为一阶连续特征离散化之后的特征、一阶离散特征,并将一阶连续特征离散化之后的特征、一阶离散特征确定为目标患者在心脏手术围术期的目标特征数据,其中目标特征数据中的每个数据,都是由同一个特征数据预处理得到的一阶连续特征离散化之后的特征、一阶离散特征组成。
S103、二阶组合特征计算,基于预设的FFM模型对所述目标患者在心脏手术围术期的目标特征数据进行二阶组合特征计算,得到与心脏术后AKI风险相关的二阶组合特征数据,其中,所述二阶组合特征数据是由所述目标特征数据中,一阶连续特征离散化之后的特征和一阶离散特征组合得到的特征数据。
本公开实施例中的FFM模型可以理解为预先训练完成的域分解机模型(Field-aware Factorization Machine,FFM)模型,FFM模型能够挖掘特征之间的相关信息,以提升模型效果。
本公开实施例中的心脏术后AKI可以理解为与心脏手术的相关急性肾损伤(cardiac surgery-associated acute kidney injury,CSA-AKI),为心脏外科术后常见的严重并发症之一。
本公开实施例中的二阶组合特征数据可以理解为对目标特征数据中的特征进行组合之后得到的特征数据,具体地,目标特征数据中包含一阶连续特征和一阶离散特征,二阶组合特征数据为对一阶连续特征进行离散化处理之后的特征,与一阶离散特征进行组合后得到的特征数据。
本公开实施例中,心脏术后AKI发生概率确定系统可以在对特征数据进行预处理得到目标特征数据之后,进行二阶组合特征计算,基于预设的FFM模型对目标特征数据进行二阶组合特征计算,得到与心脏术后AKI风险相关的二阶组合特征数据,具体地,可以将目标特征数据输入预训练的FFM模型中,得到FFM模型输出的二阶组合特征数据。
S104、AKI概率预测,将所述目标患者在心脏手术围术期的目标特征数据和所述二阶组合特征数据输入预设的预测模型,确定得到所述目标患者发生AKI的概率。
本公开实施例中的预测模型可以理解为预先训练完成的用于预测患者发生AKI的概率的模型。
本公开实施例中,心脏术后AKI发生概率确定系统可以在获得目标患者与心脏术后AKI风险相关的二阶组合特征数据后,进行AKI概率预测,将目标患者的目标特征数据和二阶组合特征数据输入预设的预测模型中,得到输出的目标患者发生AKI的概率。
本公开实施例通过数据采集,采集目标患者在心脏手术围术期的特征数据,数据预处理,对特征数据进行预处理,得到目标患者在心脏手术围术期的目标特征数据,二阶组合特征计算,基于预设的FFM模型对目标患者在心脏手术围术期的目标特征数据进行二阶组合特征计算,得到与心脏术后AKI风险相关的二阶组合特征数据,其中,二阶组合特征数据是由目标特征数据中,一阶连续特征离散化之后的特征和一阶离散特征组合得到的特征数据,AKI概率预测,将目标患者在心脏手术围术期的目标特征数据和二阶组合特征数据输入预设的预测模型,确定得到目标患者发生AKI的概率,为模型输入增加了与心脏术后AKI相关的关键二阶组合特征信息,能够在病程早期预测目标患者的心脏术后AKI发生概率,并提高预测结果的准确度。
图2是本公开实施例提供的一种计算二阶组合特征的方法的流程图,如图2所示,在上述实施例的基础上,可以通过如下方法计算二阶组合特征。
S201、将所述目标患者在心脏手术围术期的目标特征数据输入预设的FFM模型,计算所述目标特征数据中的一阶离散特征和一阶连续特征离散化之后的特征之间,每一对组合特征在对应特征域的隐向量点积的绝对值。
本公开实施例中的特征域可以理解为一类特征的集合,每个特征域可以包含该特征的多种特征值,比如性别这个特征域的取值可以包含男、女这两类,在该特征域内,女性对应的特征取值可以是1或0。
本公开实施例中的隐向量可以理解为用于表示特征之间交互关系的参数。
本公开实施例中,心脏术后AKI发生概率确定系统可以在将目标患者在心脏手术围术期的目标特征数据输入预设的FFM模型后,将同一特征数据预处理后获得的一阶连续特征离散化之后的特征和一阶离散特征之间进行组合,得到组合特征,并获得目标特征数据中的每一对组合特征在其所对应的特征域内的隐向量,计算各组合特征对应的隐向量点积的绝对值。
在本公开实施例的一种示例性的实施方式中,FFM的模型可以表示为:
Figure SMS_1
其中,n代表目标特征数量,i、j为编号,x i x j 特征,f i、 f j 分别代表x i、 x j 特征对应的特征域,w o 代表偏置项,w i 代表权重,V i,fi V j,fi 分别代表特征、在其对应的特征域的隐向量
S202、按照绝对值从大到小的顺序对所述组合特征进行排序。
本公开实施例中,心脏术后AKI发生概率确定系统可以在确定组合特征在对应特征域的隐向量点积的绝对值之后,按照绝对值的从大到小的顺序对绝对值进行排序,并基于组合特征与绝对值之间的对应关系,根据绝对值排序对组合特征进行排序,得到组合特征序列。
S203、基于高于预设排序的二阶组合特征计算对应的二阶组合特征数据,并将所述二阶组合特征数据作为与心脏术后AKI风险相关的二阶组合特征数据。
本公开实施例中,心脏术后AKI发生概率确定系统可以在得到对组合特征排序后的组合特征序列后,根据预先设定的排序,将排序高于预设排序的组合特征,即组合特征序列中靠前的预设排序个组合特征,确定为二阶组合特征数据,并将这些二阶组合特征数据作为与心脏术后AKI风险相关的二阶组合特征数据。
本公开实施例通过将目标患者在心脏手术围术期的目标特征数据输入预设的FFM模型,计算目标特征数据中的一阶离散特征和一阶连续特征离散化之后的特征之间,每一对组合特征在对应特征域的隐向量点积的绝对值,按照绝对值从大到小的顺序对组合特征进行排序,基于高于预设排序的二阶组合特征计算对应的二阶组合特征数据,并将二阶组合特征数据作为与心脏术后AKI风险相关的二阶组合特征数据,能够通过FFM模型得到与心脏术后AKI相关的关键二阶组合特征信息,从而在将特征数据输入预测模型,得到预测概率时,获得更准确的预测结果。
图3是本公开实施例提供的一种训练FFM模型的方法的流程图,如图3所示,在上述实施例的基础上,可以通过如下方法训练FFM模型。
S301、采集多个心脏术后患者在心脏手术围术期的样本特征数据和对应的AKI标签。
本公开实施例中的样本特征数据可以理解为用于作为模型训练样本的,预先收集的历史患者的特征数据。
本公开实施例中的AKI标签可以理解为根据改善全球肾脏病预后组织(KidneyDisease: Improving Global Outcomes,KDIGO)的标准确定的,患者是否并发AKI的标签。
本公开实施例中,心脏术后AKI发生概率确定系统可以通过患者纳排,对多个心脏术后患者在心脏手术围术期的样本特征数据,以及该患者是否并发AKI的AKI标签进行采集。
在本公开实施例的一种示例性的实施方式中,心脏术后AKI发生概率确定系统可以从预设数据库中获取预先存储的心脏术后患者的病例信息,从病例信息中提取各患者的样本特征数据和对应的是否并发AKI的AKI标签。
S302、对所述多个心脏术后患者的样本特征数据进行预处理,得到训练数据。
本公开实施例中的训练数据可以理解为用于输入到FFM模型中,对FFM模型进行训练的数据。
本公开实施例中,心脏术后AKI发生概率确定系统可以在获得多个心脏术后患者的样本特征数据后,对获得的样本特征数据进行预处理,得到用于对FFM模型进行训练的训练数据。
在本公开实施例的一种示例性的实施方式中,心脏术后AKI发生概率确定系统可以在对获得的样本特征数据进行预处理时,预处理步骤可以包括S102中的空值填充、关键特征筛选,还可以包括决策树分箱处理,根据经过空值填充、关键特征筛选后的样本特征数据中的连续特征数据,以及对应的AKI标签拟合得到决策树模型,将树节点的分裂阈值作为分箱的切点,输出分箱后的特征,即连续特征离散化后的特征,并将样本特征数据预处理得到的连续特征离散化后的特征与离散特征确定为训练数据。
S303、基于所述多个心脏术后患者对应的训练数据和AKI标签训练FFM模型,用于计算与心脏术后AKI风险相关的二阶组合特征,并获得训练好的FFM模型。
本公开实施例中,心脏术后AKI发生概率确定系统可以在获得多个心脏术后患者对应的训练数据后,根据采集术后患者的样本特征数据和AKI标签时,二者之间的对应关系,确定各训练数据对应的AKI标签,并将训练数据和AKI标签输入到预设的FFM模型框架中,对其进行训练,得到训练好的FFM模型。
本公开实施例通过采集多个心脏术后患者在心脏手术围术期的样本特征数据和对应的AKI标签,对多个心脏术后患者的样本特征数据进行预处理,得到训练数据,基于多个心脏术后患者对应的训练数据和AKI标签训练FFM模型,用于计算与心脏术后AKI风险相关的二阶组合特征,并获得训练好的FFM模型,能够在FFM模型框架的基础上进一步对其进行训练,使得训练好的FFM模型具备提取与心脏术后AKI风险相关的二阶组合特征的能力,进而在后续对患者并发AKI的概率进行预测时,将与心脏术后AKI风险相关的二阶组合特征作为预测模型的输入数据,提高预测结果的准确度。
图4是本公开实施例提供的一种训练预测模型的方法的流程图。如图4所示,在上述实施例的基础上,可以通过如下方法训练预测模型。
S401、基于所述与心脏术后AKI风险相关的二阶组合特征计算所述训练数据的二阶组合特征数据,得到与心脏术后AKI风险相关的二阶组合特征数据集。
本公开实施例中,心脏术后AKI发生概率确定系统可以在得到用于计算与心脏术后AKI风险相关的二阶组合特征的FFM模型之后,通过该训练好的FFM模型得到与心脏术后AKI风险相关的二阶组合特征,再基于这些二阶组合特征,计算训练数据相对应的二阶组合特征,将计算结果的集合确定为与心脏术后AKI风险相关的二阶组合特征数据集。
S402、基于所述训练数据、所述二阶组合特征数据集以及所述多个心脏术后患者对应的AKI标签,训练用于预测AKI发生概率的预测模型。
本公开实施例中,心脏术后AKI发生概率确定系统可以在获得训练数据、二阶组合特征数据集以及多个心脏术后患者对应的AKI标签后,将这些数据输入预设的预测模型框架,对预测模型框架进行训练,得到训练好的预测模型。
在本公开实施例的一种示例性的实施方式中,心脏术后AKI发生概率确定系统可以在获得训练数据、二阶组合特征数据集和AKI标签后,将其按照预设比例划分为训练集和测试集,将训练集中包含的训练数据、二阶组合特征数据集和AKI标签输入预设的预测模型框架,得到初步训练完成的预测模型,再将测试集中的训练数据和二阶组合特征数据集输入该初步训练完成的预测模型,将得到的AKI概率与这些训练数据对应的AKI标签进行比对,并对该模型的准确度进行评估,如果准确度高于或等于预设准确度,可以确定该模型合格,将其确定为训练好的预测模型,如果准确度低于预设准确度,可以确定该模型不合格,需要对模型进行重新训练或进一步训练,示例的,可以采集更多的训练数据、二阶组合特征数据集和AKI标签对模型进行进一步训练。
在本公开实施例的一种示例性的实施方式中,预设的预测模型框架可以是通过五折交叉验证法构建的集成预测框架,该框架的基模型可以包括支持向量机(supportvector machines,SVM)模型、随机森林(Random forest,RF)模型、K近邻(KNN)模型、极端梯度提升树(eXtreme Gradient Boosting,XGBoost)模型、轻量梯度提升机(Light GradientBoosting Machine,LightGBM)模型,元模型可以是逻辑回归(Logistic regression,LR)模型。
本公开实施例通过基于与心脏术后AKI风险相关的二阶组合特征计算训练数据的二阶组合特征数据,得到与心脏术后AKI风险相关的二阶组合特征数据集,基于训练数据、二阶组合特征数据集以及多个心脏术后患者对应的AKI标签,训练用于预测AKI发生概率的预测模型,能够在训练预测模型时,将与心脏术后AKI相关的关键二阶组合特征信息作为训练数据之一,使得最终得到的预测模型具有更高的风险评估性能,提高AKI发生概率预测结果的准确度。
图5是本公开实施例提供的一种心脏术后AKI发生概率确定系统的结构示意图。如图5所示,该心脏术后AKI发生概率确定系统500包括:数据采集模块510,数据预处理模块520,二阶组合特征计算模块530,AKI概率预测模块540,其中,数据采集模块510,用于采集目标患者在心脏手术围术期的特征数据;数据预处理模块520,用于对所述特征数据进行预处理,得到所述目标患者在心脏手术围术期的目标特征数据;二阶组合特征计算模块530,用于基于预设的FFM模型对所述目标患者在心脏手术围术期的目标特征数据进行二阶组合特征计算,得到与心脏术后AKI风险相关的二阶组合特征数据,其中,所述二阶组合特征数据是由所述目标特征数据中一阶连续特征离散化之后的特征和一阶离散特征组合得到的特征数据;AKI概率预测模块540,用于将所述目标患者在心脏手术围术期的目标特征数据和所述二阶组合特征数据输入预设的预测模型,确定得到所述目标患者发生AKI的概率。
可选的,所述二阶组合特征计算模块530,包括:绝对值计算单元,用于将所述目标患者在心脏手术围术期的目标特征数据输入预设的FFM模型,计算所述目标特征数据中的一阶离散特征和一阶连续特征离散化之后的特征之间每一对组合特征在对应特征域的隐向量点积的绝对值;排序单元,用于按照绝对值从大到小的顺序对所述组合特征进行排序;组合单元,用于分别基于排序高于预设排序序号的每个组合特征生成对应的二阶组合特征数据,并将所述二阶组合特征数据作为与心脏术后AKI风险相关的二阶组合特征数据。
可选的,所述心脏术后AKI发生概率确定系统500还包括:FFM模型训练模块,用于接收数据预处理模块发来的所述多个心脏术后患者对应的训练数据、数据采集模块发来的AKI标签,训练FFM模型。
可选的,所述心脏术后AKI发生概率确定系统500还包括:预测模型训练模块,用于接收所述的数据预处理模块发来的多个心脏术后患者对应的训练数据,二阶组合特征计算模块发来的二阶组合样本特征数据集,数据采集模块发来的AKI标签;根据所述训练数据、所述二阶组合样本特征数据集以及所述多个心脏术后患者对应的AKI标签,训练用于预测AKI发生概率的预测模型。
本实施例提供的心脏术后AKI发生概率确定系统能够执行上述任一实施例所述的方法,其执行方式和有益效果类似,在这里不再赘述。
图6是本公开实施例提供的一种辅助决策系统的结构示意图,如图6所示,该辅助决策系统600包括心脏术后AKI发生概率确定系统500,还包括辅助决策模块610,所述辅助决策模块610包括:分级单元611,用于对目标患者发生AKI的概率进行分级处理,得到所述目标患者发生AKI的风险等级;知识查找单元612,用于查找不同风险等级的AKI的处理知识;提示单元613,用于向所述目标患者的临床医师发送包含所述风险等级和所述处理知识的提示信息。
本实施例提供的辅助决策系统能够在获得目标患者发生AKI的概率之后,对概率进行分级处理,得到对应的风险等级,再根据风险等级查找与该风险等级对应的处理知识,并将包含有风险等级和处理知识的提示信息发送给目标患者的临床医师,能够根据患者的实际情况确定规范化的处理知识,并将处理知识发送给患者对应的临床医师,以使临床医师根据收到的处理知识采取相应的治疗或预防措施,避免因医师经验不足或其他原因延误对患者病情的处理。
图7是本公开实施例提供的一种计算机设备的结构示意图。
如图7所示,该计算机设备可以包括处理器710以及存储有计算机程序指令的存储器720。
具体地,上述处理器710可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
存储器720可以包括用于信息或指令的大容量存储器。举例来说而非限制,存储器720可以包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个及其以上这些的组合。在合适的情况下,存储器720可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器720可在综合网关设备的内部或外部。在特定实施例中,存储器720是非易失性固态存储器。在特定实施例中,存储器720包括只读存储器(Read-Only Memory,ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(Programmable ROM,PROM)、可擦除PROM(Electrical Programmable ROM,EPROM)、电可擦除PROM(Electrically ErasableProgrammable ROM,EEPROM)、电可改写ROM(Electrically Alterable ROM,EAROM)或闪存,或者两个或及其以上这些的组合。
处理器710通过读取并执行存储器720中存储的计算机程序指令,以执行本公开实施例所提供的心脏术后AKI发生概率确定方法的步骤。
在一个示例中,该计算机设备还可包括收发器730和总线740。其中,如图7所示,处理器710、存储器720和收发器730通过总线740连接并完成相互间的通信。
总线740包括硬件、软件或两者。举例来说而非限制,总线可包括加速图形端口(Accelerated Graphics Port,AGP)或其他图形总线、增强工业标准架构(ExtendedIndustry Standard Architecture,EISA)总线、前端总线(Front Side BUS,FSB)、超传输(Hyper Transport,HT)互连、工业标准架构(Industrial Standard Architecture,ISA)总线、无限带宽互连、低引脚数(Low Pin Count,LPC)总线、存储器总线、微信道架构(MicroChannel Architecture,MCA)总线、外围控件互连(Peripheral Component Interconnect,PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(Serial Advanced TechnologyAttachment,SATA)总线、视频电子标准协会局部(Video Electronics StandardsAssociation Local Bus,VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线740可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
本公开实施例还提供了一种计算机可读存储介质,该存储介质可以存储有计算机程序,当计算机程序被处理器执行时,使得处理器实现本公开实施例所提供的心脏术后AKI发生概率确定方法。
上述的存储介质可以例如包括计算机程序指令的存储器720,上述指令可由心脏术后AKI发生概率确定设备的处理器710执行以完成本公开实施例所提供的心脏术后AKI发生概率确定方法。可选的,存储介质可以是非临时性计算机可读存储介质,例如,非临时性计算机可读存储介质可以是ROM、随机存取存储器(Random Access Memory,RAM)、光盘只读存储器(Compact Disc ROM,CD-ROM)、磁带、软盘和光数据存储设备等。上述计算机程序可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (11)

1.一种心脏术后AKI发生概率确定方法,其特征在于,包括:
数据采集,采集目标患者在心脏手术围术期的特征数据,所述特征数据包括患者体重、糖尿病史、化验信息、心功能评级、手术类型、术中红细胞用量;
数据预处理,对所述特征数据进行预处理,得到所述目标患者在心脏手术围术期的目标特征数据;
二阶组合特征计算,基于预设的FFM模型对所述目标患者在心脏手术围术期的目标特征数据进行二阶组合特征计算,得到与心脏术后AKI风险相关的二阶组合特征数据,其中,所述二阶组合特征数据是由所述目标特征数据中,一阶连续特征离散化之后的特征和一阶离散特征组合得到的特征数据;
AKI概率预测,将所述目标患者在心脏手术围术期的目标特征数据和所述二阶组合特征数据输入预设的预测模型,确定得到所述目标患者发生AKI的概率,所述预测模型为对预测模型框架进行训练得到的,所述预测模型框架为通过五折交叉验证法构建的集成预测框架,所述集成预测框架的基模型包括支持向量机模型、随机森林模型、K近邻模型、极端梯度提升树模型、轻量梯度提升机模型,所述集成预测框架的元模型为逻辑回归模型。
2.根据权利要求1所述的方法,其特征在于,所述二阶组合特征计算,包括:
将所述目标患者在心脏手术围术期的目标特征数据输入预设的FFM模型,计算所述目标特征数据中的一阶离散特征和一阶连续特征离散化之后的特征之间,每一对二阶组合特征在对应特征域的隐向量点积的绝对值;
按照绝对值从大到小的顺序对所述二阶组合特征进行排序;
基于高于预设排序的二阶组合特征计算对应的二阶组合特征数据,并将所述二阶组合特征数据作为与心脏术后AKI风险相关的二阶组合特征数据。
3.根据权利要求1所述的方法,其特征在于,所述数据采集之前,所述方法还包括:
采集多个心脏术后患者在心脏手术围术期的样本特征数据和对应的AKI标签;
对所述多个心脏术后患者的样本特征数据进行预处理,得到训练数据;
基于所述多个心脏术后患者对应的训练数据和AKI标签训练FFM模型,用于计算与心脏术后AKI风险相关的二阶组合特征,并获得训练好的FFM模型。
4.根据权利要求3所述的方法,其特征在于,所述基于所述多个心脏术后患者对应的训练数据和AKI标签训练FFM模型,用于计算与心脏术后AKI风险相关的二阶组合特征之后,所述方法还包括:
基于所述与心脏术后AKI风险相关的二阶组合特征计算所述训练数据的二阶组合特征数据,得到与心脏术后AKI风险相关的二阶组合特征数据集;
基于所述训练数据、所述二阶组合特征数据集以及所述多个心脏术后患者对应的AKI标签,训练用于预测AKI发生概率的预测模型。
5.一种心脏术后AKI发生概率确定系统,其特征在于,包括:
数据采集模块,用于采集目标患者在心脏手术围术期的特征数据,所述特征数据包括患者体重、糖尿病史、化验信息、心功能评级、手术类型、术中红细胞用量;
数据预处理模块,用于对所述特征数据进行预处理,得到所述目标患者在心脏手术围术期的目标特征数据;
二阶组合特征计算模块,用于基于预设的FFM模型对所述目标患者在心脏手术围术期的目标特征数据进行二阶组合特征计算,得到与心脏术后AKI风险相关的二阶组合特征数据,其中,所述二阶组合特征数据是由所述目标特征数据中一阶连续特征离散化之后的特征和一阶离散特征组合得到的特征数据;
AKI概率预测模块,用于将所述目标患者在心脏手术围术期的目标特征数据和所述二阶组合特征数据输入预设的预测模型,确定得到所述目标患者发生AKI的概率,所述预测模型为对预测模型框架进行训练得到的,所述预测模型框架为通过五折交叉验证法构建的集成预测框架,所述集成预测框架的基模型包括支持向量机模型、随机森林模型、K近邻模型、极端梯度提升树模型、轻量梯度提升机模型,所述集成预测框架的元模型为逻辑回归模型。
6.根据权利要求5所述的系统,其特征在于,所述二阶组合特征计算模块,包括:
绝对值计算单元,用于将所述目标患者在心脏手术围术期的目标特征数据输入预设的FFM模型,计算所述目标特征数据中的一阶离散特征和一阶连续特征离散化之后的特征之间每一对二阶组合特征在对应特征域的隐向量点积的绝对值;
排序单元,用于按照绝对值从大到小的顺序对所述二阶组合特征进行排序;
组合单元,用于分别基于排序高于预设排序序号的每个组合特征生成对应的二阶组合特征数据,并将所述二阶组合特征数据作为与心脏术后AKI风险相关的二阶组合特征数据。
7.根据权利要求6所述的系统,其特征在于,所述系统还包括:
FFM模型训练模块,用于接收数据预处理模块发来的多个心脏术后患者对应的训练数据、数据采集模块发来的AKI标签,训练FFM模型。
8.根据权利要求7所述的系统,其特征在于,还包括:
预测模型训练模块,用于接收所述的数据预处理模块发来的多个心脏术后患者对应的训练数据,二阶组合特征计算模块发来的二阶组合样本特征数据集,数据采集模块发来的AKI标签;根据所述训练数据、所述二阶组合样本特征数据集以及所述多个心脏术后患者对应的AKI标签,训练用于预测AKI发生概率的预测模型。
9.一种辅助决策系统,其特征在于,包括权利要求5-8任一所述的心脏术后AKI发生概率确定系统,还包括辅助决策模块,所述辅助决策模块包括:
分级单元,用于对目标患者发生AKI的概率进行分级处理,得到所述目标患者发生AKI的风险等级;
知识查找单元,用于查找不同风险等级的AKI的处理知识;
提示单元,用于向所述目标患者的临床医师发送包含所述风险等级和所述处理知识的提示信息。
10.一种计算机设备,其特征在于,包括:存储器、处理器,以及计算机程序;其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如权利要求1-4中任一项所述的方法。
11.一种计算机可读存储介质,其特征在于,所述存储介质中存储有计算机程序,当所述计算机程序被处理器执行时,实现如权利要求1-4中任一项所述的方法。
CN202310277664.1A 2023-03-21 2023-03-21 心脏术后aki发生概率确定方法及系统、辅助决策系统 Active CN115995298B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310277664.1A CN115995298B (zh) 2023-03-21 2023-03-21 心脏术后aki发生概率确定方法及系统、辅助决策系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310277664.1A CN115995298B (zh) 2023-03-21 2023-03-21 心脏术后aki发生概率确定方法及系统、辅助决策系统

Publications (2)

Publication Number Publication Date
CN115995298A CN115995298A (zh) 2023-04-21
CN115995298B true CN115995298B (zh) 2023-06-09

Family

ID=85992240

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310277664.1A Active CN115995298B (zh) 2023-03-21 2023-03-21 心脏术后aki发生概率确定方法及系统、辅助决策系统

Country Status (1)

Country Link
CN (1) CN115995298B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111524598A (zh) * 2020-04-21 2020-08-11 赵述武 一种围术期并发症预测方法及系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3282948A4 (en) * 2015-04-15 2019-04-03 The Johns Hopkins University URINE DETECTION SYSTEM AND DEVICES AND METHOD FOR MONITORING RENAL FUNCTION
KR20200003407A (ko) * 2017-07-28 2020-01-09 구글 엘엘씨 전자 건강 기록으로부터 의료 이벤트를 예측 및 요약하기 위한 시스템 및 방법
TWI755108B (zh) * 2020-10-22 2022-02-11 中國醫藥大學 急性腎損傷評估方法及急性腎損傷評估系統
CN113178243A (zh) * 2021-04-26 2021-07-27 南京医科大学 体外循环心脏手术后急性肾损伤早期预警方法及系统
CN114188014A (zh) * 2021-09-28 2022-03-15 中国医学科学院阜外医院 一种患者院内不良预后预测模型构建方法、系统及应用
CN114049952A (zh) * 2021-10-12 2022-02-15 中国人民解放军总医院第一医学中心 一种基于机器学习的术后急性肾损伤智能预测方法及装置
CN113903458A (zh) * 2021-10-26 2022-01-07 北京大学第三医院(北京大学第三临床医学院) 急性肾损伤早期预测方法及装置
CN114121278A (zh) * 2021-11-04 2022-03-01 广西医科大学第一附属医院 一种基于年龄及临床指标的心脏瓣膜置换术后aki风险的预测模型

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111524598A (zh) * 2020-04-21 2020-08-11 赵述武 一种围术期并发症预测方法及系统

Also Published As

Publication number Publication date
CN115995298A (zh) 2023-04-21

Similar Documents

Publication Publication Date Title
Srivastava et al. Medi-Assist: A Decision Tree based Chronic Diseases Detection Model
US10339464B2 (en) Systems and methods for generating biomarker signatures with integrated bias correction and class prediction
Zhao et al. Predicting outcomes of chronic kidney disease from EMR data based on Random Forest Regression
EP3471107A1 (en) Medical device and computer-implemented method of predicting risk, occurrence or progression of adverse health conditions in test subjects in subpopulations arbitrarily selected from a total population
JP6313757B2 (ja) 統合デュアルアンサンブルおよび一般化シミュレーテッドアニーリング技法を用いてバイオマーカシグネチャを生成するためのシステムおよび方法
JP7361187B2 (ja) 医療データの自動化された検証
CN111564223B (zh) 传染病生存概率的预测方法、预测模型的训练方法及装置
CN105224807B (zh) 病例审核规则提取方法及装置,病例审核方法及系统
CN111834017A (zh) 一种精神药物治疗效果预测方法,系统和装置
Ruyssinck et al. Random survival forests for predicting the bed occupancy in the intensive care unit
CN114373546A (zh) 疾病风险评估方法、装置及存储介质
CN115995298B (zh) 心脏术后aki发生概率确定方法及系统、辅助决策系统
Özkan et al. Effect of data preprocessing on ensemble learning for classification in disease diagnosis
Praveen et al. Diabetes Prediction with Ensemble Learning Techniques in Machine Learning
US20230145258A1 (en) Predicting a Diagnostic Test Result From Patient Laboratory Testing History
Khozama et al. Study the Effect of the Risk Factors in the Estimation of the Breast Cancer Risk Score Using Machine Learning
Alotaibi et al. Early prediction of gestational diabetes using machine learning techniques
CN117409951A (zh) 辅助诊断方法、装置、设备、产品、系统及介质
Joshi et al. A Review on Application of Machine Learning in Medical Diagnosis
Schwarzerova et al. An innovative perspective on metabolomics data analysis in biomedical research using concept drift detection
Mareeswari et al. Predicting Chronic Kidney Disease Using KNN Algorithm
Au-Yeung et al. Using machine learning to refer patients with chronic kidney disease to secondary care
Muflikhah et al. Improving Performance for Diabetic Nephropathy Detection Using Adaptive Synthetic Sampling Data in Ensemble Method of Machine Learning Algorithms
Akhtar et al. Effective voting ensemble of homogenous ensembling with multiple attribute-selection approaches for improved identification of thyroid disorder. Electron. 2021; 10 (23): 3026
Muthulakshmi et al. Big Data Analytics for Heart Disease Prediction using Regularized Principal and Quadratic Entropy Boosting

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant