CN114203306A - 医疗事件预测模型训练方法、医疗事件预测方法及装置 - Google Patents
医疗事件预测模型训练方法、医疗事件预测方法及装置 Download PDFInfo
- Publication number
- CN114203306A CN114203306A CN202111468141.2A CN202111468141A CN114203306A CN 114203306 A CN114203306 A CN 114203306A CN 202111468141 A CN202111468141 A CN 202111468141A CN 114203306 A CN114203306 A CN 114203306A
- Authority
- CN
- China
- Prior art keywords
- rule
- medical event
- event
- medical
- prediction model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Pathology (AREA)
- Artificial Intelligence (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开了一种本发明实施例医疗事件模型训练方法、医疗事件预测方法、装置、计算机可读存储介质及设备。预测模型训练方法包括:获取多个对象的健康档案的多个特征变量数据以及事件结果数据并构建样本集合,进一步根据样本集合,构建多个决策树,从而根据多个决策树的路径和多个特征变量数据,生成多个规则特征向量,由此,基于多个规则特征向量以及事件结果数据进行模型训练,得到医疗事件预测模型。规则特征向量是基于至少两个特征变量的多个生物标志物,据此来预测医疗事件,具有更高的预测准确性。并且可以利用基于多个变量的规则特征进行模型训练,使得预测模型具有非常直观的可解释性。
Description
技术领域
本发明涉及医学数据挖掘技术领域,尤其涉及一种医疗事件模型训练方法、医疗事件预测方法、装置、计算机可读存储介质及设备。
背景技术
近年来,随着各种疾病发生率的逐年上升,疾病的预防和治疗越来越受到大家的关注。为了更好地实现疾病的预防和治疗,虽然已经开发出很多用于辅助治疗和显示的计算机方法,但是很少有能够对健康状况进行预测的方法及系统。如何及时准确地对病人的健康状况进行预测,进而对医疗事件进行解释,有助于医生及时提供更好的治疗方案。
医疗过程的医疗事件预测无论是对于医生还是患者都具有比较高的关注度也具有较高的参考价值,例如:手术后的住院时间、手术后是否产生并发症、ICU(IntensiveCare Unit,重症加强护理病房)住院时间、ICU住院患者死亡率等。这些医疗事件结果以及影响这些医疗事件结果的因素能够为临床医生提供更好的决策或干预建议。
对此,目前也有一些应用于医疗事件结果或者影响因素的预测模型,但大多采用单个的生物标志物或临床变量来进行预测,准确率和可解释性均较差。
发明内容
本发明实施例为了解决上述问题,创造性地提供一种医疗事件模型训练方法、医疗事件预测方法、装置、计算机可读存储介质及设备。
根据本发明第一方面,提供了一种医疗事件预测模型训练方法,所述方法包括:获取多个对象的健康档案的多个特征变量数据以及事件结果数据,并构建样本集合;根据所述样本集合,构建多个决策树;根据所述多个决策树的路径和所述多个特征变量数据,生成多个规则特征向量;基于所述多个规则特征向量以及事件结果数据进行模型训练,得到医疗事件预测模型。
根据本发明一实施方式,所述根据所述多个决策树的路径和所述多个特征变量数据,生成多个规则特征向量,包括:根据所述多个决策树的路径,生成多个规则特征,每一特征规则包括至少两个特征变量;将所述多个特征变量数据与所述多个特征规则进行融合,生成多个规则特征向量。
根据本发明一实施方式,所述基于所述多个规则特征向量以及事件结果数据进行模型训练,包括:对所述多个规则特征向量进行批量规则嵌入;对批量嵌入的规则特征向量进行规则转换和注意力转换,得到转换向量;对批量嵌入的规则特征向量和所述转换向量进行规则选择,得到选择向量;基于所述选择向量,利用预估器预测多个规则特征对所述医疗事件的事件结果的影响程度。
根据本发明一实施方式,所述基于所述多个规则特征向量以及事件结果数据进行模型训练,包括:对所述多个规则特征向量进行批量规则嵌入;对批量嵌入的规则特征向量进行规则转换、注意力转换,得到转换向量;对批量嵌入的规则特征向量和所述转换向量进行规则选择,得到选择向量;对批量嵌入的规则特征向量和所述选择向量进行规则转换、线性转换和全连接,以预测对象的医疗事件的事件结果。
根据本发明一实施方式,所述对批量嵌入的规则特征向量和所述选择向量进行规则转换,包括:对批量嵌入的规则特征向量和所述选择向量进行全连接、批量嵌入和线性转换。
根据本发明一实施方式,所述方法还包括:基于多个对象的健康档案的多个特征变量数据以及事件结果数据,对所述医疗事件预测模型进行验证,得到验证结果;根据所述验证结果,对所述医疗事件预测模型进行优化。
根据本发明第二方面,还提供了一种医疗事件预测方法,所述方法包括:获取目标对象的健康档案的多个目标变量数据;生成基于所述多个目标变量数据的多个目标规则特征;根据所述多个目标规则特征,利用医疗事件预测模型,对所述目标对象的医疗事件进行预测,得到预测结果,其中,所述预测结果包括所述目标对象的医疗事件的事件结果以及所述多个目标规则特征对所述目标对象的医疗事件的事件结果的影响程度。
根据本发明一实施方式,所述医疗事件预测模型采用如上所述的医疗事件预测模型训练方法进行训练。
根据本发明第三方面,还提供了一种医疗事件预测模型训练装置,所述装置包括:第一获取单元,用于获取多个对象的健康档案的多个特征变量数据以及事件结果数据,并构建样本集合;构建单元,用于根据所述样本集合,构建多个决策树;生成单元,用于根据所述多个决策树的路径和所述多个特征变量数据,生成多个规则特征向量;训练单元,用于基于所述多个规则特征向量以及事件结果数据进行模型训练,得到医疗事件预测模型。
根据本发明第四方面,还提供了一种医疗事件预测装置,所述装置包括:第二获取单元,用于获取目标对象的健康档案的多个目标变量数据;特征生成单元,用于生成基于所述多个目标变量数据的多个目标规则特征;预测单元,用于根据所述多个目标规则特征,利用医疗事件预测模型,对所述目标对象的医疗事件进行预测,得到预测结果,其中,所述预测结果包括所述目标对象的医疗事件的事件结果以及所述多个目标规则特征对所述目标对象的医疗事件的事件结果的影响程度。
根据本发明第五方面,还提供了一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行以下至少一者:所述程序时实现如上文所述的医疗事件预测模型训练方法;如权利要求7或8所述的医疗事件预测方法。
根据本发明第六方面,还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行以下至少一者:时用于执行如上文所述的医疗事件预测模型训练方法;如权利要求7或8所述的医疗事件预测方法。
本发明实施例医疗事件模型训练方法、医疗事件预测方法、装置、计算机可读存储介质及设备。预测模型训练方法包括:获取多个对象的健康档案的多个特征变量数据以及事件结果数据并构建样本集合,进一步根据样本集合,构建多个决策树,从而根据多个决策树的路径和多个特征变量数据,生成多个规则特征向量,由此,基于多个规则特征向量以及事件结果数据进行模型训练,得到医疗事件预测模型。规则特征向量是基于至少两个特征变量的多个生物标志物,据此来预测医疗事件,具有更高的预测准确性。并且可以利用基于多个变量的规则特征进行模型训练,使得预测模型具有非常直观的可解释性。
需要理解的是,本发明的教导并不需要实现上面的全部有益效果,而是特定的技术方案可以实现特定的技术效果,并且本发明的其他实施方式还能够实现上面未提到的有益效果。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
在附图中,相同或对应的标号表示相同或对应的部分。
图1示出了本发明实施例医疗事件预测模型训练方法的实现流程示意图;
图2示出了本发明实施例医疗事件预测模型的模型架构示意图;
图3示出了本发明实施例医疗事件预测模型中GBDT模块的框架示意图;
图4示出了本发明实施例医疗事件预测模型中TabNet模块的RT的框架结构示意图;
图5示出了本发明实施例医疗事件预测模型中TabNet模块的AT的框架结构示意图;
图6示出了本发明实施例医疗事件预测方法的实现流程示意图;
图7示出了本发明实施例医疗事件预测模型训练装置的组成结构示意图;
图8示出了本发明实施例医疗事件预测装置的组成结构示意图;
图9示出了本发明实施例设备的组成结构示意图。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为使本发明更加透彻和完整,并能够将本发明的范围完整地传达给本领域的技术人员。
下面结合附图和具体实施例对本发明的技术方案进一步详细阐述。
图1示出了本发明实施例医疗事件预测模型训练方法的实现流程图。
参考图1,本发明实施例医疗事件预测模型训练方法,至少包括如下操作流程:操作101,获取多个对象的健康档案的多个特征变量数据以及事件结果数据,并构建样本集合;操作102,根据样本集合,构建多个决策树;操作103,根据多个决策树的路径和多个特征变量数据,生成多个规则特征向量;操作104,基于多个规则特征向量以及事件结果数据进行模型训练,得到医疗事件预测模型。
在操作101中,获取多个对象的健康档案的多个特征变量数据以及事件结果数据,并构建样本集合。
在本发明这一实施方式中,医疗事件可以是手术后的住院时间、手术后是否产生并发症、ICU(Intensive Care Unit,重症加强护理病房)住院时间、ICU住院患者死亡率等。
在本发明这一实施方式中,以ICU住院时间为例,对方案进行说明。需要说明的是,此处以及下文均将ICU住院时间作为本发明实施例中所预测的医疗事件。但是实际应用过程中,本发明实施例医疗事件预测模型训练方法以及本发明实施例医疗事件预测方法均可以应用于其他适用的医疗事件预测过程。
在本发明这一实施方式中,可以从医疗机构的EMR(Electronic Medical Record,电子病历)中获取基于多个对象的健康档案中多个变量构建样本集合。这里,多个对象即为医疗机构的多个患者。
在本发明这一实施方式中,多个特征变量可以是对患者的医疗事件产生影响的多个医疗特征。举例说明,多个特征变量数据特征变量数据可以包括患者所患疾病的医疗特征属性,例如:红细胞数量、白细胞数量等医学检测指标。特征变量数据还可以包括与医学事件的事件结果相关的患者信息,例如:患者年龄、性别、基础疾病以及是否从事特殊工种的职业等。
在本发明这一实施方式中,事件结果数据可以是多个患者的ICU住院天数等。
举例说明,为了提高预测模型对医疗事件的预测准确度,针对手术难度大,术后并发症多的开颅手术,训练专门的术后ICU住院时间预测模型。
需要说明的是,本发明实施例仅仅是为了更清楚对方案进行说明,以专门的术后ICU住院时间预测模型为例,对方案进行说明,但是实际应用过程中,可以将本发明实施例提供的医疗事件预测模型训练方法应用于其他多个适用的场景。
在本发明这一实施方式中,可以获取ICU数据平台的EMR,基于医院数据库和NLP的分布式技术架构,生成结构化的患者数据,包括人口统计信息、诊断信息、生命体征、实验室信息、手术信息等。
根据医疗事件预测模型研究的纳入和排除标准,首先收集年龄≥18岁的已成年需要接受开颅手术并且需要ICU治疗的患者。然后,对患者的EMR数据进行预处理。具体的,可以保留至少有一次完整ICU检查记录的病例,排除LoICUS(ICU住院时间)为空或记录不正确的患者,还可以排除LoICUS过长或过短的患者。LoICUS过长或过短的标准可以根据实际情况进行设定,例如可以设定LoICUS超过365天为LoICUS过长,LoICUS少于24小时为LoICUS过短。
经过样本纳排处理之后,将医疗事件定义为LoICUS。根据ICU中位住院时间将LoICUS分为两类。例如,根据多次实验数据得到,LoICUS的中位数为12.39天。这里,阳性病例可以定义为开颅术后LoICUS超过12.39天,标签为1。阴性病例定义为此类患者的LoICUS少于12.39天,标签为0。
在本发明这一实施方式中,对于LoICUS的统计信息,可以统计患者LoICUS的均值、标准差、最小值、下分位数、中位数、上分位数和最大值。
进一步的,对于纳入模型训练的对象的EMR的多个特征变量。选择填充率大于70%的特征变量,具体指针对某一特征变量,70%以上的患者的EMR中具有这一特征变量的相应数据。患者在ICU住院期间的很多特征变量是不断变化的,如生命体征和实验室检查数据,对此,可以提取患者在ICU住院期间这些特征变量的第一、最大和最小值。这里还可以对特征变量进行细化,例如,可以将特征变量分为术前变量和术后变量。特征变量可以是患者所患疾病的医疗特征属性,例如:红细胞数量、白细胞数量等医学检测指标。特征变量还可以是与医学事件的事件结果相关的患者信息,例如:患者年龄、性别、基础疾病以及是否从事特殊工种的职业等。
基于ML(Machine Language,机器学习)中的特征工程技术,选择所有特征变量作为预测模型的输入矩阵将会带来较大的数据处理量,并且无关特征变量将会对数据的处理带来较大的干扰,影响数据处理的结果。因此,这里,需要筛选与临床实践和医疗事件相关度较高的特征变量。对于离散特征变量,可以采用卡方检验确定与临床实践和医疗事件的相关度。对于符合正态分布的连续特征变量,可以采用student t检验。对于不符合正态分布的特征变量,采用Wilcoxon检验。如果上述针对特征变量的假设检验的p值小于0.05,则相应的特征变量具有统计显著性,否则,不具有统计显著性。最后筛选出100个具有统计学意义的特征变量,其中7个是术前特征变量,93个是术后特征变量。
需要说明的是,无论是预测模型的训练,还是利用预测模型进行医疗事件的过程中,均可以采用预测模型中通用的缺失值填充方式对缺失值进行填充。对于连续特征变量,可以通过均值填充,对于离散特征变量,可以通过众数填充失值。
在操作102中,根据样本集合,构建多个决策树。
在本发明这一实施方式中,可以采用GBDT算法通过生成多棵可加树以进一步训练医疗事件预测模型。与传统的基于神经网络的黑盒模型相比,基于决策树的模型具有良好的可解释性和训练时间优势。
在本发明这一实施方式中,基于样本集合中的多个特征变量训练多个决策树,多棵决策树之间是非独立的加法树,后一棵树在前一个树的基础上学习误差。具体的实施细节可以参考下文结合图2~5对预测模型架构的描述。
在操作103中,根据多个决策树的路径和多个特征变量数据,生成多个规则特征向量。
在本发明这一实施方式中,根据所述多个决策树的路径和所述多个特征变量数据,生成多个规则特征向量,可以采用以下操作实现:根据所述多个决策树的路径,生成多个规则特征,每一特征规则包括至少两个特征变量;将所述多个特征变量数据与所述多个特征规则进行融合,生成多个规则特征向量。
举例说明,决策树可以表示为节点和边,节点包括根节点、内部节点和叶节点。通过节点的任何路径都可以转化为规则特征。规则特征是由决策树的多个路径组成的粗粒度的医学规则。为了降低预测模型的复杂度,这里可以对决策树的最大深度进行设置。规则特征可以是一些医学指标或患者医学特征属性的集合,例如:年龄范围70以上并且术后白细胞数量大于设定值。
对于多个规则特征中的任意规则特征,可以将该规则特征转换为嵌入向量,嵌入大小可以设定,这里嵌入大小可以是对象的数量。每一对象具有的多个变量对应于每一第一规则均可以生成一个规则特征。由此,基于多个第一规则,可以生成基于多个对象的变量的多个规则特征。具体的规则特征生成方法将在下文结合图2-5进行详细说明,此处不再赘述。
操作104,基于所述多个规则特征向量以及事件结果数据进行模型训练,得到医疗事件预测模型。
在本发明这一实施方式中,基于所述多个规则特征向量以及事件结果数据进行模型训练,可以采用如下操作实现:对所述多个规则特征向量进行批量规则嵌入;对批量嵌入的规则特征向量进行规则转换和注意力转换,得到转换向量;对批量嵌入的规则特征向量和所述转换向量进行规则选择,得到选择向量;基于所述选择向量,利用预估器预测多个规则特征对所述医疗事件的事件结果的影响程度。
举例说明,可以采用由几个步骤组成的加性模型TabNet来预测多个规则特征对所述医疗事件的事件结果的影响程度。具体的,可以将所有规则的嵌入向量都被输入到TabNet中,并且可以将规则特征进行批量嵌入。具体的,可以每一批次选择一部分规则特征嵌入到规则转换器中,规则特征的宽度batch的大小可以根据实际情况进行设定。其中,规则转换器用于实现对向量的规则转换。具体地,可以参考下文图2~5对医疗事件预测模型架构中对TabNet模块的详细描述,此处不再赘述。
需要说明的是,多个规则特征对所述医疗事件的事件结果的影响程度可以以多种形式来示出,例如:可以以每一规则特征对所述医疗事件的事件结果的影响值、影响因数、影响权重的方式示出。还可以抽取多个规则特征对所述医疗事件的事件结果的影响较大的设定个数的规则特征。同样的,还可以以其他适合的方式来示出多个规则特征对所述医疗事件的事件结果的影响程度。
在本发明这一实施方式中,所述基于所述多个规则特征向量以及事件结果数据进行模型训练,包括:对所述多个规则特征向量进行批量规则嵌入;对批量嵌入的规则特征向量进行规则转换、注意力转换,得到转换向量;对批量嵌入的规则特征向量和所述转换向量进行规则选择,得到选择向量;对批量嵌入的规则特征向量和所述选择向量进行规则转换、线性转换和全连接,以预测对象的医疗事件的事件结果。
举例说明,对批量嵌入的规则特征向量进行注意力转换可以通过图2~5中的AT(Attentive Transformer,注意力转换)来实现。对批量嵌入的规则特征向量和所述选择向量进行线性转换可以通过图2-5中的GLU(Gated Linear Unit,门控线性单元)或ReLU(Rectified Linear Unit,修正线性函数)来实现。
在本发明这一实施方式中,所述对批量嵌入的规则特征向量和所述选择向量进行规则转换,包括:对批量嵌入的规则特征向量和所述选择向量进行全连接、批量嵌入和线性转换。
同样的,可以参考下文图2~5对医疗事件预测模型架构中对TabNet模块的详细描述,此处不再赘述。
在本发明这一实施方式中,还基于多个对象的健康档案中对象的医疗事件,对预测模型进行验证,得到验证结果,并根据验证结果对预测模型进行优化。
举例说明,可以利用病例对照策略来构建规则的验证数据,并进行风险分析以验证规则特征与医疗事件之间的相关性,从而验证预测模型对医疗事件对预测准确性。
图2示出了本发明实施例医疗事件预测模型的模型架构示意图。
如图2所示,本发明实施例医疗事件预测模型的模型称为RTN(Rules-TabNet)模型。预测模型的训练和利用预测模型对患者的医疗事件可以基于医疗机构的电子病历进行预测。
RTN模型包括GBDT(Gradient Boosting Decision Trees,梯度提升决策树)模块、RE(Rules Embedding,规则嵌入)模块、TabNet(编码器)模块和Output模块。对于梯度提升树及树分解模块,也可以分为梯度提升树模块和树分解模块两个相对独立的模块。
在本发明这一实施方式中,首先在输入模块(Input)对电子病历中的数据进行数据预处理,筛选符合模型训练要求的特征变量。将筛选后的患者数据作为GBDT模块的输入。对电子病历中的数据进行数据预处理的具体操作可以参考上文操作101的描述,此处不再赘述。
采用基于梯度上升的树模型生成多个规则,与基于神经网络的黑盒模型相比,基于树的模型具有良好的可解释性和训练时间优势,因此这里采用GBDT算法通过生成多棵可加树来训练预测模型。
图3示出了本发明实施例医疗事件预测模型中GBDT模块的框架示意图。
参考图3,可以训练n棵非独立的加法树,后一棵树Ti在前一棵树Ti-1的基础上学习误差。模型的输出将通过将所有加法树的结果相加来计算,每个加法树都分配了一个权重值Wi。
在模型的参数调整之后,我们接下来从模型生成规则特征。模型中的所有树模型都可以表示为决策树,树模型可以表示为节点(根节点NR,内部节点NI,叶节点NL)和边,Ti={NR,NI,NL,E}。通过NR中的E连接NI或NL将树分解为规则特征,通过NR的任何路径都可以转化为规则特征,得到由K个规则组成的粗粒度医学规则特征库RK。为了降低模型的复杂性,可以采用策略来限制树的大小。如图3所示,如果我们的模型的最大深度设置为2,那么在RK中有三种类型的规则,RK={NR→E→NI;NR→E→NI→E→NL;NR→E→NL}。
举例说明在本发明这一实施方式中树分解的过程,T1={1×NR,1×NI,3×NL,4×E},树中有3层,可以生成4条规则,如下所示:
·NR→E→NI:x0<a0;
·NR→E→NL:x0≥a0;
·NR→E→NI→E→NL:x0<a0&x2=a2;
·NR→E→NI→E→NL:x0<a0&x2≠a2.
最后,从该模型可以导出总共K条规则,tn是第n棵树中NL的数目。
在本发明这一实施方式中,规则嵌入模块(Rules Embedding)对于GBDT导出的K个粗粒度医学规则特征,我们将RK中的每个规则R转换为规则特征向量r(i)1×n=[r1,r2,…,rm,…,rn],其中n是嵌入大小,也称为样本数据集合中的患者数,rm是第m个患者的嵌入表示。数据的规则特征向量可以表示为Xn×K。
在本发明这一实施方式中,采用TabNet编码器来多个规则特征对所述医疗事件的事件结果的影响程度。
图4示出了本发明实施例医疗事件预测模型中TabNet模块的RT的框架结构示意图。
在本发明这一实施方式中,RT模块设置了四个F-B-G层,每个层由全连接(FC)层、BRE和门控线性单元(GLU)组成。对每个F-B-G进行跳跃连接过程,在最后三个F-B-G后采用来稳定网络的学习过程。(A[i],E[i])是在步骤i中split后的RT的输出,A[i]是下个模块的输入,E[i]用于生成步骤i的结果。
图5示出了本发明实施例医疗事件预测模型中TabNet单元的AT的框架结构示意图。
与Softmax相比,Sparemax是一种归一化方法,可以获得更稀疏的结果。γ是松弛参数,这意味着如果γ>1,则该特征可以在后续步骤中以更高的权重再次使用。hi(A[i-1])是图2中AT的F-B的输出。
在步骤i中的AT到Mask[i]再到RT之后,A[i]将被输入到步骤(i+1)的AT中,E[i]将被输入到步骤i的ReLU中以获得第i个估计器的输出。
最后,RTN的输出是所有estimator的结果之和,第i个estimator的输出是ReLU(E[i]),RTN的最终输出如式(5)所示。Softmax用于对开颅手术患者的LoICUS进行分类。
通过上述方案可知,与传统的基于神经网络的黑盒模型相比,医疗事件模型训练方法、医疗事件预测方法中的预测模型架构具有很强的自身可解释性。
在本发明这一实施方式中,利用预估器预测多个规则特征对所述医疗事件的事件结果的影响程度的具体的计算方法如下。
对于步骤i的样本b,Eb[i]是RT的输出之一,Eb[i]的维数是B×NE。当Eb,j[i]≤0时,步骤i的输出是ReLU(E[i])=0,其中j是NE中的一维规则特征。
步骤i中样本b的贡献是cb[i]。
cb[i]越大,其对医疗事件的影响越明显,在RTN中也被称为步骤i的权重。因此,样本b中规则特征j的对所述医疗事件的事件结果的影响程度是所有步骤中Mask的权重之和。如果RTN中有N个步骤,则规则重要性的规范化表示如式(7)所示。
在本发明这一实施方式中,还设置了规则验证操作。
根据RTN计算的所有规则特征对所述医疗事件的事件结果的影响程度,对所述医疗事件的事件结果的影响程度非零的规则特征RRTN将可以用于对预测模型进行验证。可以采用实验的方式对RRTN中的每个规则进行验证,也可以采用对医疗机构的患者的历史数据和医疗事件的事件结果对规则特征进行验证。根据验证结果,不断优化预测模型的模型参数,从而进一步提高预测模型的预测精准度。
本发明实施例医疗事件模型训练方法、医疗事件预测方法、装置、计算机可读存储介质及设备。预测模型训练方法包括:获取多个对象的健康档案的多个特征变量数据以及事件结果数据并构建样本集合,进一步根据样本集合,构建多个决策树,从而根据多个决策树的路径和多个特征变量数据,生成多个规则特征向量,由此,基于多个规则特征向量以及事件结果数据进行模型训练,得到医疗事件预测模型。规则特征向量是基于至少两个特征变量的多个生物标志物,据此来预测医疗事件,具有更高的预测准确性。并且可以利用基于多个变量的规则特征进行模型训练,使得预测模型具有非常直观的可解释性。
图6示出了本发明实施例医疗事件预测方法的实现流程示意图。
参考图6,本发明实施例医疗事件预测方法,至少包括如下操作流程:操作601,获取目标对象的健康档案的多个目标变量数据;操作602,生成基于所述多个目标变量数据的多个目标规则特征;操作603,根据所述多个目标规则特征,利用医疗事件预测模型,对所述目标对象的医疗事件进行预测,得到预测结果,其中,所述预测结果包括所述目标对象的医疗事件的事件结果以及所述多个目标规则特征对所述目标对象的医疗事件的事件结果的影响程度。
在本发明这一实施方式中,所述医疗事件预测模型采用如上所述的医疗事件预测模型训练方法进行训练。
其中,操作601~603的其他具体实现过程可以参考图1~5所示实施例中的具体实现过程,这里不再赘述。
如图7所示,为本发明医疗事件预测模型训练装置的一个具体实施例。本实施例装置,即用于执行图1~5方法的实体装置。其技术方案本质上与上述实施例一致,上述实施例中的相应描述同样适用于本实施例中。参考图7,本发明实施例提供一种医疗事件预测模型训练装置,装置70包括:第一获取单元701,用于获取多个对象的健康档案的多个特征变量数据以及事件结果数据,并构建样本集合;构建单元702,用于根据所述样本集合,构建多个决策树;生成单元703,用于根据所述多个决策树的路径和所述多个特征变量数据,生成多个规则特征向量;训练单元704,用于基于所述多个规则特征向量以及事件结果数据进行模型训练,得到医疗事件预测模型。
在本发明这一实施方式中,生成单元703具体用于:根据所述多个决策树的路径,生成多个规则特征,每一特征规则包括至少两个特征变量;将所述多个特征变量数据与所述多个特征规则进行融合,生成多个规则特征向量。
在本发明这一实施方式中,训练单元704具体用于:对所述多个规则特征向量进行批量规则嵌入;对批量嵌入的规则特征向量进行规则转换和注意力转换,得到转换向量;对批量嵌入的规则特征向量和所述转换向量进行规则选择,得到选择向量;基于所述选择向量,利用预估器预测多个规则特征对所述医疗事件的事件结果的影响程度。
在本发明这一实施方式中,训练单元704具体用于:对所述多个规则特征向量进行批量规则嵌入;对批量嵌入的规则特征向量进行规则转换、注意力转换,得到转换向量;对批量嵌入的规则特征向量和所述转换向量进行规则选择,得到选择向量;对批量嵌入的规则特征向量和所述选择向量进行规则转换、线性转换和全连接,以预测对象的医疗事件的事件结果。
在本发明这一实施方式中,训练单元704对批量嵌入的规则特征向量和所述选择向量进行规则转换,具体用于:对批量嵌入的规则特征向量和所述选择向量进行全连接、批量嵌入和线性转换。
在本发明这一实施方式中,该装置还包括验证单元用于:基于多个对象的健康档案的多个特征变量数据以及事件结果数据,对所述医疗事件预测模型进行验证,得到验证结果;根据所述验证结果,对所述医疗事件预测模型进行优化。
如图8所示,为本发明医疗事件预测装置的一个具体实施例。本实施例装置,即用于执行图6方法的实体装置。其技术方案本质上与上述实施例一致,上述实施例中的相应描述同样适用于本实施例中。参考图8,本发明实施例提供一种医疗事件预测装置,装置80包括:装置80包括:第二获取单元801,用于获取目标对象的健康档案的多个目标变量数据;特征生成单元802,用于生成基于所述多个目标变量数据的多个目标规则特征;预测单元803,用于根据所述多个目标规则特征,利用医疗事件预测模型,对所述目标对象的医疗事件进行预测,得到预测结果,其中,所述预测结果包括所述目标对象的医疗事件的事件结果以及所述多个目标规则特征对所述目标对象的医疗事件的事件结果的影响程度。
图9是本发明实施例提供的一种设备的结构示意图。在硬件层面,该设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatilememory),例如至少1个磁盘存储器等。当然,该设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图9中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放执行指令。具体地,执行指令即可被执行的计算机程序。存储器可以包括内存和非易失性存储器,并向处理器提供执行指令和数据。
在一种可能实现的方式中,处理器从非易失性存储器中读取对应的执行指令到内存中然后运行,也可从其它设备上获取相应的执行指令,以在逻辑层面上形成医疗事件预测训练装置或医疗事件预测装置。处理器执行存储器所存放的执行指令,以通过执行的执行指令实现本发明任一实施例中提供的医疗事件预测训练方法或医疗事件预测方法。
上述如本发明图7所示实施例提供的医疗事件预测训练装置或上述如本发明图8所示实施例提供的医疗事件预测装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
本发明实施例还提出了一种可读介质,该可读存储介质存储有执行指令,存储的执行指令被电子设备的处理器执行时,能够使该电子设备执行本发明任一实施例中提供的医疗事件预测训练方法或医疗事件预测方法,并具体用于执行如图1~6所示的方法。
前述各个实施例中的电子设备可以为计算机。
本领域内的技术人员应明白,本发明的实施例可提供为方法或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例,或软件和硬件相结合的形式。
本发明中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上仅为本发明的实施例而已,并不用于限制本发明。对于本领域技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。
Claims (12)
1.一种医疗事件预测模型训练方法,其特征在于,所述方法包括:
获取多个对象的健康档案的多个特征变量数据以及事件结果数据,并构建样本集合;
根据所述样本集合,构建多个决策树;
根据所述多个决策树的路径和所述多个特征变量数据,生成多个规则特征向量;
基于所述多个规则特征向量以及事件结果数据进行模型训练,得到医疗事件预测模型。
2.根据权利要求1所述的方法,其特征在于,所述根据所述多个决策树的路径和所述多个特征变量数据,生成多个规则特征向量,包括:根据所述多个决策树的路径,生成多个规则特征,每一特征规则包括至少两个特征变量;
将所述多个特征变量数据与所述多个特征规则进行融合,生成多个规则特征向量。
3.根据权利要求1所述的方法,其特征在于,所述基于所述多个规则特征向量以及事件结果数据进行模型训练,包括:
对所述多个规则特征向量进行批量规则嵌入;
对批量嵌入的规则特征向量进行规则转换和注意力转换,得到转换向量;
对批量嵌入的规则特征向量和所述转换向量进行规则选择,得到选择向量;
基于所述选择向量,利用预估器预测多个规则特征对所述医疗事件的事件结果的影响程度。
4.根据权利要求1所述的方法,其特征在于,所述基于所述多个规则特征向量以及事件结果数据进行模型训练,包括:
对所述多个规则特征向量进行批量规则嵌入;
对批量嵌入的规则特征向量进行规则转换、注意力转换,得到转换向量;
对批量嵌入的规则特征向量和所述转换向量进行规则选择,得到选择向量;
对批量嵌入的规则特征向量和所述选择向量进行规则转换、线性转换和全连接,以预测对象的医疗事件的事件结果。
5.根据权利要求3或4所述的方法,所述对批量嵌入的规则特征向量和所述选择向量进行规则转换,包括:
对批量嵌入的规则特征向量和所述选择向量进行全连接、批量嵌入和线性转换。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于多个对象的健康档案的多个特征变量数据以及事件结果数据,对所述医疗事件预测模型进行验证,得到验证结果;
根据所述验证结果,对所述医疗事件预测模型进行优化。
7.一种医疗事件预测方法,其特征在于,所述方法包括:
获取目标对象的健康档案的多个目标变量数据;
生成基于所述多个目标变量数据的多个目标规则特征;
根据所述多个目标规则特征,利用医疗事件预测模型,对所述目标对象的医疗事件进行预测,得到预测结果,其中,所述预测结果包括所述目标对象的医疗事件的事件结果以及所述多个目标规则特征对所述目标对象的医疗事件的事件结果的影响程度。
8.根据权利要求7所述的方法,其特征在于,所述医疗事件预测模型采用权利要求1-6中任一项所述的医疗事件预测模型训练方法进行训练。
9.一种医疗事件预测模型训练装置,其特征在于,所述装置包括:
第一获取单元,用于获取多个对象的健康档案的多个特征变量数据以及事件结果数据,并构建样本集合;
构建单元,用于根据所述样本集合,构建多个决策树;
生成单元,用于根据所述多个决策树的路径和所述多个特征变量数据,生成多个规则特征向量;
训练单元,用于基于所述多个规则特征向量以及事件结果数据进行模型训练,得到医疗事件预测模型。
10.一种医疗事件预测装置,其特征在于,所述装置包括:
第二获取单元,用于获取目标对象的健康档案的多个目标变量数据;
特征生成单元,用于生成基于所述多个目标变量数据的多个目标规则特征;
预测单元,用于根据所述多个目标规则特征,利用医疗事件预测模型,对所述目标对象的医疗事件进行预测,得到预测结果,其中,所述预测结果包括所述目标对象的医疗事件的事件结果以及所述多个目标规则特征对所述目标对象的医疗事件的事件结果的影响程度。
11.一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现以下至少一者:
如权利要求1-6中任一项所述的医疗事件预测模型训练方法;
如权利要求7或8所述的医疗事件预测方法。
12.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行下至少一者:
如权利要求1-6中任一项所述的医疗事件预测模型训练方法;
如权利要求7或8所述的医疗事件预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111468141.2A CN114203306A (zh) | 2021-12-03 | 2021-12-03 | 医疗事件预测模型训练方法、医疗事件预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111468141.2A CN114203306A (zh) | 2021-12-03 | 2021-12-03 | 医疗事件预测模型训练方法、医疗事件预测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114203306A true CN114203306A (zh) | 2022-03-18 |
Family
ID=80650431
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111468141.2A Pending CN114203306A (zh) | 2021-12-03 | 2021-12-03 | 医疗事件预测模型训练方法、医疗事件预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114203306A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116434968A (zh) * | 2023-06-14 | 2023-07-14 | 之江实验室 | 一种层级聚类约束的多标签细粒度术后并发症预测装置 |
-
2021
- 2021-12-03 CN CN202111468141.2A patent/CN114203306A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116434968A (zh) * | 2023-06-14 | 2023-07-14 | 之江实验室 | 一种层级聚类约束的多标签细粒度术后并发症预测装置 |
CN116434968B (zh) * | 2023-06-14 | 2023-08-25 | 之江实验室 | 一种层级聚类约束的多标签细粒度术后并发症预测装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111512322B (zh) | 使用神经网络 | |
US20120271612A1 (en) | Predictive modeling | |
Padula et al. | Machine learning methods in health economics and outcomes research—the PALISADE checklist: a good practices report of an ISPOR task force | |
US20180285969A1 (en) | Predictive model training and selection for consumer evaluation | |
US20220044809A1 (en) | Systems and methods for using deep learning to generate acuity scores for critically ill or injured patients | |
CN110111885B (zh) | 属性预测方法、装置、计算机设备及计算机可读存储介质 | |
CN112037922A (zh) | 病理数据的分析方法、装置、计算机设备和存储介质 | |
Lin et al. | Predicting wait times in pediatric ophthalmology outpatient clinic using machine learning | |
WO2020049404A2 (en) | Visualization of social determinants of health | |
TWI697851B (zh) | 電子裝置與模型更新方法 | |
CN116864139A (zh) | 疾病风险评估方法、装置、计算机设备及可读存储介质 | |
CN114203306A (zh) | 医疗事件预测模型训练方法、医疗事件预测方法及装置 | |
JP2024061599A (ja) | 階層図ニューラルネットワークに基づく疾患診療過程異常識別システム | |
Saab et al. | Comparison of machine learning algorithms for classifying adverse-event related 30-day hospital readmissions: potential implications for patient safety | |
CN113066531B (zh) | 风险预测方法、装置、计算机设备及存储介质 | |
US11809826B2 (en) | Assertion detection in multi-labelled clinical text using scope localization | |
CN113782192A (zh) | 基于因果推断的分群模型构建方法和医疗数据处理方法 | |
Khozama et al. | Study the Effect of the Risk Factors in the Estimation of the Breast Cancer Risk Score Using Machine Learning | |
Berdaly et al. | Comparative machine-learning approach: study for heart diseases | |
Miryala et al. | Revolutionizing Dental Imaging: A Comprehensive Study on the Integration of Artificial Intelligence in Dental and Maxillofacial Radiology | |
US20230105348A1 (en) | System for adaptive hospital discharge | |
US11636933B2 (en) | Summarization of clinical documents with end points thereof | |
US20220223284A1 (en) | Systems and methods for modelling a human subject | |
Kalina | Regression modelling as a basis of clinical decision support | |
Ojo | An Ensemble Approach to Addressing Fairness in Hospital Readmission Prediction for Diabetes Patients |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |