CN110175697B

CN110175697B - 一种不良事件风险预测系统及方法

Info

Publication number: CN110175697B
Application number: CN201910337460.6A
Authority: CN
Inventors: 胡盛寿; 赵韡; 袁昕; 陈凯; 吴岳; 王薇薇; 刁晓林
Original assignee: Individual
Current assignee: Fuwai Hospital of CAMS and PUMC
Priority date: 2019-04-25
Filing date: 2019-04-25
Publication date: 2021-05-25
Anticipated expiration: 2039-04-25
Also published as: CN110175697A

Abstract

本发明公开了一种不良事件风险预测系统及方法，本发明实施例在医疗系统网络侧搭建不良事件风险预测系统，所述系统获取临床数据，并根据对临床数据的质控、标准化及分组处理后，建立得到每个临床主题的不良事件风险预测模型。当所述系统接收到获取携带患者的临床数据的不良事件风险预测请求时，根据患者的临床数据匹配得到对应临床主题的不良事件风险预测模型，获取其中的不良事件风险预测信息，及获取到风险预测值，根据所述各不良事件风险预测信息进行综合评估得到预测结果，并将所述预测结果携带在获取不良事件风险预测响应中发送。这样，本发明实施例就实现了对临床数据的统一管理，且依据临床数据提供患者的不良事件风险预测信息。

Description

一种不良事件风险预测系统及方法

技术领域

本发明涉及计算机技术领域，特别涉及一种不良事件风险预测系统及方法。

背景技术

随着计算机技术在医疗领域的应用，在医疗系统领域中采用计算机对医疗过程中的临床数据进行管理成为了发展趋势。通常，在采用计算机对临床数据进行管理的过程中，常常是将所有在医疗过程涉及的各项医疗操作及临床医疗数据都存储到计算机中，当使用时直接调用使用即可。

采用上述方式虽然可以实现对临床数据的存储及调取，但是，还存在缺陷：第一，当一个医疗系统为一个互联网络时，没有说明如何在互联网络中对不同计算机上传的临床数据进行统一管理，使得用户通过互联网络无法及时且准确访问到所需要的临床数据；第二，对于医疗人员来说，其不仅仅需要是患者的临床数据，而且需要的是患者的治疗信息或病程发展的医疗信息，而存储在计算机中的临床数据都是未经整理，比较杂乱，无法获取到针对患者的提示性的医疗信息。

因此，发明人在研究后发现，如何创建一个具有整理临床数据，且能够根据临床数据生成患者的不良事件风险预测信息的统一医疗系统成为了一个亟待解决的技术问题。

发明内容

有鉴于此，本发明实施例提供一种不良事件风险预测系统，该系统能够实现对临床数据的统一管理，且依据临床数据提供患者的不良事件风险预测信息。

本发明实施例还提供一种不良事件风险预测方法，该方法能够实现对临床数据的统一管理，且依据临床数据提供患者的不良事件风险预测信息。

本发明实施例是这样实现的：

一种不良事件风险预测系统，包括：主题库生成模块、数据质控及标准化模块、患者分组器、模型生成模块、模型选择器及综合风险预测模块，其中，

主题库生成模块，用于根据设定的各主题库下的主体标识码提取对应的患者及所述患者关联的临床数据；

数据质控及标准化模块，用于对关联后的各主题库下的临床数据进行质量控制，及标准化处理；

患者分组器，用于基于主题库生成模块设定的主体标识码，根据各主题库中患者关联的临床数据风险值，获得患者分组结果，并确定每个分组所包含的待预测的不良事件风险类型；

模型生成模块，用于生成所述各主题库中预设的不良事件风险预测模型；

模型选择器，用于根据新增患者的临床数据匹配得到对应临床主题及患者分组下的不良事件风险预测模型，获取其中的不良事件风险预测信息，并发送至综合风险提示模块；

综合风险提示模块，用于接收携带新增患者的临床数据的不良事件风险预测请求，将患者的临床数据发送给模型选择器，并接收模型选择器返回的与所述新增患者对应的不良事件风险预测信息，获取与该新增患者对应的各不良事件风险的预测值，与综合风险预测结果，同时携带在获取不良事件风险预测响应中发送。

所述主题生成模块，还用于所述关联为：临床数据所属患者的唯一标识码、临床路径各操作及时间信息、所述患者诊疗路径中各个阶段临床表现及代谢特征的临床数据关联。

所述数据质控及标准化处理模块包括数据质控单元及数据标准化单元，其中，

数据质控单元，用于对所述主题库内关联的临床数据集合进行正确性校验、及异常数据标记；

数据标准化单元，用于对所述主题库内关联的临床数据集合进行标准化处理，包括：数据归一化子模块、数据分箱子模块及异常数据处理子模块，

其中，数据归一化子模块，用于对所述主题库内关联的临床数据集合进行归一化处理；

数据分箱子模块，用于根据设置的待预测的不良事件风险类型对关联后的临床数据集合进行自适应分箱；

异常数据处理子模块，用于将数据质控单元标记的异常数据进行规范化处理，包括但不限于剔除或置空或补值，针对处理过的异常数据生成异常数据统计表。

所述患者分组器包括患者分组指标权重预设单元、患者组别生成单元及权重自动更新单元，其中，

患者分组指标权重预设单元，用于设置权重值W_K.M，其中K是所述主题库内临床数据变量的数量值，M是不良事件风险类型数量值；

患者组别生成单元，用于根据权重值W0_K.M，对质控及标准化的临床数据，按照临床主题进行分组，确定每个分组的分组类型及包含的不良事件风险类型；

权重自动更新单元，用于对所设置的权重值W_K.M进行实时更新，其中所述权重值W0_K.M为初始预设值。

所述模型生成模块包括模型数据集单元及模型生成器单元，其中，

模型数据集单元，用于获取所述主题库临床数据及各不良事件风险类型与标识；

模型生成器单元，用于生成与所述模型数据集单元对应的不良事件风险预测模型，所述模型生成器单元针对各不良事件风险类型，根据设定比例，将所述模型数据集单元中的临床数据分为两组但可不限于两组，一组为训练组，另一组为验证组，用训练组的临床数据分别基于不同算法生成针对当前所述主题库的不良事件风险预测模型，所述不同算法包括但不限于随机森林算法、神经网络算法及支持向量机算法，基于验证组判断各算法所建模型效果，并根据包括但不限于正确性和有效性，得到最适宜所述当前主题库下不良事件风险的模型。

所述模型生成器单元，还用于在不良事件风险预测模型建模过程中进行自适应参数调整，其中，所述有效性验证维度及其重要程度依次为准确率、阳性检出率及假阳性率，

依据临床可接受阳性检出阈值与假阳性率，

其惩罚因子初始值为

惩罚因子变化步长为Δα，直至其中一种的同一临床主题的不良事件风险模型有效性达到预期值。

所述综合风险预测模块包括独立风险预测单元及综合风险评估单元，其中，

独立风险预测单元，用于接收所述模型选择器发送的新增待分析患者的不良事件风险预测模型类型，及不良事件风险预测信息，并根据患者临床数据，分别得到所述新增患者的各项不良事件风险预测值；

综合风险评估单元，用于基于所述新增患者所在组别，给予不同组别下各个不良事件风险预测信息发生时赋予的相应权重，根据权重计算得到不良事件风险预测值。

所述主题库生成模块中相关联的临床数据实时更新；

所述术后不良事件风险主题生成模块的临床数据更新时，所述系统的其他模块所关联的处理临床数据的过程相应更新。

一种不良事件风险预测方法，在医疗系统网络侧搭建不良事件风险预测系统，该方法还包括：

所述系统根据设定的各主题库下的主体标识码提取对应的患者及所述患者关联的临床数据，对关联后的各主题库下的临床数据进行质量控制，及标准化处理；

所述系统根据各主题库中患者关联的临床数据风险值，获得患者分组结果，并确定每个分组所包含的待预测的不良事件风险类型；

所述系统生成所述各主题库中预设的不良事件风险预测模型；

所述系统接收携带新增患者的临床数据的不良事件风险预测请求，根据新增患者的临床数据匹配得到对应临床主题及患者分组下的不良事件风险预测模型，获取其中的不良事件风险预测信息，获取与该新增患者对应的各不良事件风险的预测值，与综合风险预测结果，同时携带在获取不良事件风险预测响应中发送。

所述相关联的临床数据实时更新；

所述系统的后续处理相关联的临床数据过程相应更新。

如上可见，本发明实施例在医疗系统网络侧搭建不良事件风险预测系统，所述系统获取临床数据，并根据对临床数据的质控、标准化及分组处理后，建立得到每个临床主题的不良事件风险预测模型。当所述系统接收到获取携带患者的临床数据的不良事件风险预测请求时，根据患者的临床数据匹配得到对应临床主题的不良事件风险预测模型，获取其中的不良事件风险预测信息，及获取到风险预测值，根据所述各不良事件风险预测信息进行综合评估得到预测结果，并将所述预测结果携带在获取不良事件风险预测响应中发送。这样，本发明实施例就实现了对临床数据的统一管理，且依据临床数据提供患者的不良事件风险预测信息。

附图说明

图1为本发明实施例提供的不良事件风险预测系统结构示意图；

图2为本发明实施例提供的不良事件风险预测方法流程图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚明白，以下参照附图并举实施例，对本发明进一步详细说明。

本发明实施例为了实现对临床数据的统一管理，且依据临床数据提供患者的不良事件风险预测信息，本发明实施例在医疗系统网络侧搭建不良事件风险预测系统，所述系统获取临床数据，并根据对临床数据的质控、标准化及分组处理后，建立得到每个临床主题的不良事件风险预测模型。当所述系统接收到获取携带患者的临床数据的不良事件风险预测请求时，根据患者的临床数据匹配得到对应临床主题的不良事件风险预测模型，获取其中的不良事件风险预测信息，及获取到风险预测值，根据所述各不良事件风险预测信息进行综合评估得到预测结果，并将所述预测结果携带在获取不良事件风险预测响应中发送。这样，本发明实施例就实现了对临床数据的统一管理，且依据临床数据提供患者的不良事件风险预测信息。

图1为本发明实施例提供的不良事件风险预测系统结构示意图，包括：主题库生成模块、数据质控及标准化模块、患者分组器、模型生成模块、模型选择器及综合风险预测模块，其中，

在该系统中，所述主题库，用于在关联临床数据时，基于主题库设定主题标识码，该标识码是基于某个临床指标进行辨识的，指标选定与组别划分可以是可以人工维护的字典(也可以成为知识图谱)，或使用聚类算法进行分组；这样，在患者分组器对临床数据对临床数据进行分组时，基于设定的主体标识码。

在该系统中，临床主题的含义针对的是疾病类型，比如心血管疾病中换车分组包括的冠心患者及瓣膜患者等等。

在该系统中，主题生成模块，是基于不良事件风险预测的相关文献、临床路径各操作节点，结合医生临床经验生成知识库及关联规则，基于所设置的知识库及关联规则建立的。主题库生成模块根据所设置的知识库及关联规则，对所获取的临床数据进行关联，包括但不限于：临床数据所属患者的唯一标识码、临床路径各操作及时间信息、所述患者诊疗路径中各个阶段临床表现及代谢特征等临时数据进行关联。

在该系统中，所述主题生成模块中相关联的临床数据实时更新，在更新时，也可以设置更新频率和更新条件，按照所设置的更新频率及更新频率进行更新。比如更新频率以每个工作日进行更新，更新条件可以根据需求设定以患者出院为限。

在该系统中，所述主题生成模块的临床数据更新时，所述系统的其他模块的处理临床数据过程也相应更新。

在该系统中，所述数据质控及标准化处理模块主要包括数据质控单元及数据标准化单元，其中，

数据质控单元，用于对所述主题库内关联的临床数据集合进行正确性校验、及异常数据标记；其中，正确性校验通过判断所述主题生成模块的临床数据提取结果的数据空值是否在预设空值阈值范围内及数据分布确定，如果数据空值占比大于设置的空值阈值范围，则进行标记；如果所述主题生成模块的临床数据提取结果的数据离散的与预设值间的差值不在设定的差值阈值范围内，则进行异常数据的标识；

数据标准化单元，用于对所述主题库内关联的临床数据集合进行标准化处理，主要包括数据标准化子模块、数据分箱子模块及异常数据处理子模块，其中，

数据标准化子模块，用于对所述主题库内关联的临床数据集合进行归一化处理，以避免由于量纲不同引起的指标贡献度差异；

数据分箱子模块，用于根据设置的待预测的不良事件风险类型对关联后的临床数据集合进行自适应分箱，此分箱方法根据每次分组结果得到的信息熵进行再处理，直至分箱结果得到的信息熵达到预设熵值；

在该系统中，所述患者分组器包括患者分组指标权重预设单元、患者组别生成单元及权重自动更新单元，其中，

患者分组指标权重预设单元，用于设置权重值W_K.M，其中K是所述主题库内临床数据变量的数量值，M是不良事件风险类型数量值，其中所述权重值W0_K.M为初始预设值，W0_K.M矩阵中的各项值均是根据医生经验及文献设定；

患者组别生成单元，用于根据权重值W0_K.M，对质控及标准化的临床数据，按照临床主题进行分组，确定每个分组的分组类型及包含的不良事件风险类型；具体地，是将N个患者根据预设的M个不良事件风险类型依次进行分类，对到M个患者的临床数据分组结果，分组结果以C_K.M矩阵形式进行存储，同时生成分组指标权重变异矩阵W_K.M；在这里，所述分组过程可以通过多种算法实现，如Knn或Kmeans等，其中分组过程各指标贡献值根据所述权重值W_K.M计算得到，首次分组依据预设权重初始值W0_K.M计算得到；

权重自动更新单元，用于对所设置的权重值W_K.M进行实时更新；具体地，基于预设权重初始值W0_K.M，以指标权重变异矩阵W_K.M进行更新得到，所述指标权重变异矩阵W_K.M是基于分组算法中指标对分组结果的贡献度，即信息熵得到的。

在该系统中，模型生成模块包括模型数据集单元及模型生成器单元，其中，

模型数据集单元，用于获取所述主题库临床数据及各不良事件风险类型与标识；具体地说，获取分组结果C_K.M中各个不良事件风险类型对应的临床数据；

模型生成器单元，用于生成与所述模型数据集单元对应的不良事件风险预测模型，所述模型生成器单元针对各不良事件风险类型；具体地说，在生成时，根据设定比例，比如2∶1将所述模型数据集单元中的临床数据分为两组，但可以不限定为两组，一组为训练组，另一组为验证组，用训练组的临床数据分别基于不同算法生成针对当前所述主题库的不良事件风险预测模型，所述不同算法包括但不限于随机森林算法、神经网络算法及支持向量机算法，基于验证组判断各算法所建模型效果，并根据包括但不限于正确性和有效性，得到最适宜所述当前主题库下不良事件风险的模型。更进一步地，还用于在不良事件风险预测模型建模过程中进行自适应参数调整，其中，所述有效性验证维度及其重要程度依次为准确率、阳性检出率及假阳性率。因此为提高阳性检出率，依据临床可接受阳性检出阈值与假阳性率，其惩罚因子初始值为

惩罚因子变化步长为Δα，直至其中一种的同一临床主题的不良事件风险模型有效性达到预期值。同时进一步，根据三种算法预测结果，依据设置的投票规则，综合判断每个临床主题的不良事件风险模型，并以该综合判断结果作为每个临床主题的不良事件风险模型的触发项。

在该系统中，模型选择器，主要基于待分析患者的临床数据，根据所述患者分组器中的患者分组指标权重W_K.M判断患者所属的分组，匹配得到对应临床主题的不良事件风险预测模型，获取其中的不良事件风险预测信息。

在该系统中，所述综合风险预测模块中具体包括独立风险预测单元及综合风险评估单元，其中，

综合风险评估单元，用于基于所述新增患者所在组别，给予不同组别下各个不良事件风险预测信息发生时赋予的相应权重，根据权重计算得到不良事件风险预测值。根据该风险预测值就可以判断其风险程度，若风险预测值在(0，f1)之间，f为设置的风险预测临界值，则提示低风险，如果在(f1，f2)之间，则提示中等风险，如果在(f2，fmax)之间，则提示高风险。

这样，本发明实施例提供的系统中，所述综合风险提示模块，还用于评估得到预测结果的为针对不良事件风险类型的概率值。

图2为本发明实施例提供的不良事件风险预测方法流程图，在医疗系统网络侧搭建不良事件风险预测系统，其具体步骤为：

步骤201、所述系统根据设定的各主题库下的主体标识码提取对应的患者及所述患者关联的临床数据，对关联后的各主题库下的临床数据进行质量控制，及标准化处理；

步骤202、所述系统根据各主题库中患者关联的临床数据风险值，获得患者分组结果，并确定每个分组所包含的待预测的不良事件风险类型；生成所述各主题库中预设的不良事件风险预测模型；

步骤203、所述系统接收携带新增患者的临床数据的不良事件风险预测请求，根据新增患者的临床数据匹配得到对应临床主题及患者分组下的不良事件风险预测模型，获取其中的不良事件风险预测信息，获取与该新增患者对应的各不良事件风险的预测值，与综合风险预测结果，同时携带在获取不良事件风险预测响应中发送。

在该方法中，所述相关联的临床数据实时更新；

所述系统的后续处理相关联的临床数据过程相应更新。

在该方法中，所述对临床数据的质控及标准化为：

对所述主题库内关联的临床数据集合进行正确性校验、及异常数据标记；

对所述主题库内关联的临床数据集合进行归一化处理；

根据设置的待预测的不良事件风险类型对关联后的临床数据集合进行自适应分箱；

将数据质控单元标记的异常数据进行规范化处理，包括但不限于剔除或置空或补值，针对处理过的异常数据生成异常数据统计表。

在该方法中，所述分组为：设置权重值W_K.M，其中K是所述主题库内临床数据变量的数量值，M是不良事件风险类型数量值，根据权重值W0_K.M，对质控及标准化的临床数据，按照临床主题进行分组，确定每个分组的分组类型及包含的不良事件风险类型。所述权重值W_K.M可实时更新，更新的过程为：基于预设权重初始值W0_K.M，以指标权重变异矩阵W_K.M进行更新得到，所述指标权重变异矩阵W_K.M为基于设置的分组算法中指标对分组结果的信息熵得到的。

在该方法中，所述建立每个临床主题的不良事件风险预测模型的过程为：

根据设定比例，根据设定比例，将所述模型数据集单元中的临床数据分为两组，一组为训练组，另一组为验证组，用训练组的临床数据分别基于不同算法生成针对当前所述主题库的不良事件风险预测模型，所述不同算法包括但不限于随机森林算法、神经网络算法及支持向量机算法，基于验证组判断各算法所建模型效果，并根据包括但不限于正确性和有效性，得到最适宜所述当前主题库下不良事件风险的模型。

可以看出，采用本发明实施例提供的系统及方法，实现了对临床数据的统一管理，且依据临床数据提供患者的不良事件风险预测信息。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。

Claims

1.一种不良事件风险预测系统，其特征在于，包括：主题库生成模块、数据质控及标准化模块、患者分组器、模型生成模块、模型选择器及综合风险预测模块，其中，

2.如权利要求1所述的系统，其特征在于，所述主题库生成模块，还用于所述关联为：临床数据所属患者的唯一标识码、临床路径各操作及时间信息、所述患者诊疗路径中各个阶段临床表现及代谢特征的临床数据关联。

3.如权利要求1所述的系统，其特征在于，所述数据质控及标准化处理模块包括数据质控单元及数据标准化单元，其中，

异常数据处理子模块，用于将数据质控单元标记的异常数据进行规范化处理，包括剔除或置空或补值，针对处理过的异常数据生成异常数据统计表。

4.如权利要求1所述的系统，其特征在于，所述患者分组器包括患者分组指标权重预设单元、患者组别生成单元及权重自动更新单元，其中，

患者组别生成单元，用于根据权重值WO_K.M，对质控及标准化的临床数据，按照临床主题进行分组，确定每个分组的分组类型及包含的不良事件风险类型；

权重自动更新单元，用于对所设置的权重值W_K.M进行实时更新，其中所述权重值WO_K.M为初始预设值。

5.如权利要求1所述的系统，其特征在于，所述模型生成模块包括模型数据集单元及模型生成器单元，其中，

模型生成器单元，用于生成与所述模型数据集单元对应的不良事件风险预测模型，所述模型生成器单元针对各不良事件风险类型，根据设定比例，将所述模型数据集单元中的临床数据分为至少两组，一组为训练组，另一组为验证组，用训练组的临床数据分别基于不同算法生成针对当前所述主题库的不良事件风险预测模型，所述不同算法包括随机森林算法、神经网络算法及支持向量机算法，基于验证组判断各算法所建模型效果，并根据正确性和有效性，得到所述主题库下不良事件风险的模型。

6.如权利要求5所述的系统，其特征在于，所述模型生成器单元，还用于在不良事件风险预测模型建模过程中进行自适应参数调整，其中，所述有效性验证维度及其重要程度依次为准确率、阳性检出率及假阳性率，

依据临床可接受阳性检出阈值与假阳性率，

其惩罚因子初始值为

7.如权利要求1所述的系统，其特征在于，所述综合风险预测模块包括独立风险预测单元及综合风险评估单元，其中，

8.如权利要求1所述的系统，其特征在于，所述主题库生成模块中相关联的临床数据实时更新；

所述主题库生成模块中相关联的临床数据更新时，所述系统的其他模块所关联的处理临床数据的过程相应更新。

9.一种不良事件风险预测方法，其特征在于，在医疗系统网络侧搭建不良事件风险预测系统，该方法还包括：

10.如权利要求9所述的方法，其特征在于，所述患者关联的临床数据实时更新；

所述系统的后续处理相关联的临床数据过程相应更新。