CN115831339A

CN115831339A - 基于深度学习的医疗系统风险管控事前预测方法、系统

Info

Publication number: CN115831339A
Application number: CN202310143517.5A
Authority: CN
Inventors: 谢君; 章毅; 王增; 石锐; 徐修远; 郭际香; 周泠宇; 曾国军
Original assignee: Chengdu Aijiafeishite Technology Co ltd; West China Hospital of Sichuan University
Current assignee: Chengdu Aijiafeishite Technology Co ltd; West China Hospital of Sichuan University
Priority date: 2023-02-21
Filing date: 2023-02-21
Publication date: 2023-03-21
Anticipated expiration: 2043-02-21
Also published as: CN115831339B

Abstract

本发明公开了一种基于深度学习的医疗系统风险管控事前预测方法、系统，涉及医疗系统的风险管控技术领域，用于解决现有的基于神经网络的风险预测因数据量庞大、风险评价指标造成的风险评估准确率低的问题。其包括LSTM网络、CNN卷积网络以及注意力双向RNN网络的风险种类预测模型；训练时，采用BP反馈传播算法进行梯度回传，使用平均绝对误差MAE区分风险种类，使用均方根误差RMSE对风险评估等级回归学习。本发明通过采用不同风险类别的算法来预测未发生的风险、采用注意力机制使神经网络的风险评估准确率更高。

Description

基于深度学习的医疗系统风险管控事前预测方法、系统

技术领域

本发明属于人工智能技术领域，涉及医疗系统的风险管控，更具体的是涉及一种基于深度学习的医疗系统风险管控事前预测方法、系统。

背景技术

医院作为广泛使用计算机的机构，在医疗的各个方面，医学辅助型计算机程序日益增多。在医院推动数字化转型的过程中，为了对多应用、多维度人员进行统一管理，医院拟采用数字身份建立全域统一的身份安全管控体系。

在该体系中，针对每一位医师数字身份的风险管控尤为重要。目前，在安全维度，需要建立事前预警、事中控制、事后追溯的动态监管模块，该模块通常将风险评估指标作为动态监管的重要内容。针对风险管控的预测在最近几年已经被广泛研究，这些研究大多数集中对已经发生的安全事件进行风险种类评估，真正的着眼于用户风险的事前预测却鲜有研究。目前典型的动态风险预测方法基于三个阶段：（1）完成数据收集和预处理，主要是对风险进行选择和分类；（2）选择合适的特征选择算法，包括主成分分析法、遗传算法、支持向量机算法、神经网络算法等，在为每个选择的特征选择合适的模型后，将其分别进行应用；（3）使用准备好的数据集训练对应的分类算法，并根据最后的风险预测结果，调整对应的参数，完善其风险预测的准确率。

近10年来，风险管控的预测方法一直在进步，根据有无使用神经网络方法可以将其分为两个阶段：没有使用神经网络方法的传统阶段，以及基于神经网络方法的阶段。传统阶段风险管控的预测是基于支持向量机的方法的，如Lang Zhang, Haiqing Hu 和 DanZhang在他们的中小企业信用风险种类评估中提出了基于SVM的商业银行信用风险预测模型，该方法是一种新的模式识别技术，作为一种基于核函数的机器学习方法，支持向量机在解决非线性可分离分类问题上具有显著优势。在风险预测中，存在这多种风险评估指标，通常是一种多分类的问题，虽然多维分类比二维分类复杂，但两者的原理非常相似。支持向量机利用线性分离超平面产生边界最大的分类器，用于最简单的二元分类任务。Ping等人(Ping&Yongheng, 2011)提出了一种基于svm的基于客户变量的混合信用评分模型，该模型包括四种方法:(1)使用粗糙邻域设置输入特征选择;(2)应用网格搜索优化RBF核参数;(3)利用混合最优输入特征和模型;(4)与其他方法的准确性比较。结果表明，与其他混合分类器相比，基于svm的混合分类器和粗糙邻域集的信用评分能力最好。它们也优于线性判别分析、逻辑回归等机器学习的方法。

基于前馈神经网络的风险事前预警的方法，目前在此领域也有许多研究成果。Weiwei Liu, Zhiwei Lian和Bo ZhaoBensic（Bensic等人，2005年）通过比较逻辑回归、神经网络（NNs）和分类回归树（CART）决策树的准确性，研究了小企业贷款中信用评分的一些重要特征。结果表明，概率神经网络模型实现了最高的“命中率”和最低的I型错误（Bensic等人，2005）。West（West，2000）研究了五种神经网络信用评分模型的准确性；即多层感知器、专家混合、径向基函数、学习矢量量化和模糊自适应共振。结果表明，专家和RBF神经网络模型的混合比多层感知器方法更敏感（West，2000）。然而，Eliana Angelini 等人开发了两个神经网络系统，一个具有标准前馈网络，另一个具有专用架构。通过应用标准反向传播算法的微小变化，他们对经典前馈网络进行了非常有效的调整，如果误差低于给定阈值，则不会传播误差。

由于医疗系统信息的敏感程度高、数据量大、风险种类分类复杂、评估等级也较为严格，现有的风险预测方法并不能有较好的预测效果。在基于用户数字身份的风险预测方法中，要么是基于传统的支持向量机方法，这个方法不仅设计起来十分繁琐，而且所提取的特征的有效性也难以保证。基于神经网络的方法，可以使用神经网络自动地从各种风险指标中提取本质特征，这些方法考虑到了风险的种类、风险的时间等因素，但是由于在实际的应用中使用的前馈神经网络等需要的数据量十分庞大，并且准确率并不高。本发明研究了一种针对不同风险类别的算法，来检测未发生的风险；在风险评价指标方面，之前的方法大多数是围绕着用户的信用评价指标，或者基于了一些简单的特征维度，评估风险等级，本发明基于注意力机制，使得神经网络可以以更高的精度的评估影响风险等级的特征，进而有效地对风险等级进行评估。

发明内容

本发明的目的在于：为了解决现有的基于神经网络的风险预测因数据量庞大、风险评价指标造成的风险评估准确率低的问题，本发明提供一种基于深度学习的医疗系统风险管控事前预测方法、系统，通过采用不同风险类别的算法来预测未发生的风险、采用注意力机制使神经网络的风险评估准确率更高。

本发明为了实现上述目的具体采用以下技术方案：

一种基于深度学习的医疗系统风险管控事前预测方法，包括如下步骤：

步骤S1，获取样本数据

从医学辅助诊断系统中获取风险评估样本数据，并对风险评估样本数据标注标签，所述标签包括风险种类、风险评估等级；

步骤S2，搭建风险种类预测模型

搭建风险种类预测模型，风险种类预测模型包括LSTM网络、CNN卷积网络以及注意力双向RNN网络；

步骤S3，训练风险种类预测模型

利用步骤S1获取的样本数据输入步骤S2搭建的风险种类预测模型，对风险种类预测模型进行训练；

步骤S4，实时预测

获取医学辅助诊断系统中待预测的实时数据，将实时数据输入训练好的风险种类预测模型，得到预测结果；

其中，在步骤S3进行训练时，采用BP反馈传播算法进行梯度回传，使用平均绝对误差MAE区分风险种类，使用均方根误差RMSE对风险评估等级回归学习，每一次迭代学习之后，比较两类误差大小；如果当前误差小于上一次迭代的误差，就保存当前模型，然后继续训练，直到达到最大迭代次数。

作为优选，风险评估样本数据包括文本数据、时间序列信号数据和IP地址序列数据；

文本数据经自然语言处理后作为风险种类预测模型的输入。

作为优选，风险种类预测模型包括：

依次串联的LSTM网络、CNN卷积网络以及注意力双向RNN网络，风险评估样本数据作为LSTM网络的输入，LSTM网络的输出作为CNN卷积网络的输入，CNN卷积网络的输出作为注意力双向RNN网络的输入；

或者，依次串联的CNN卷积网络、LSTM网络以及注意力双向RNN网络，风险评估样本数据作为CNN卷积网络的输入，CNN卷积网络的输出作为LSTM网络的输入，LSTM网络的输出作为注意力双向RNN网络的输入；

或者，并列的LSTM网络、CNN卷积网络以及再串联注意力双向RNN网络，风险评估样本数据作为均作为LSTM网络、CNN卷积网络的输入，LSTM网络、CNN卷积网络的输出均作为注意力双向RNN网络的输入；

或者，并列的LSTM网络、CNN卷积网络以及再串联注意力双向RNN网络，风险评估样本数据作为均作为LSTM网络的输入，风险评估样本数据和LSTM网络的输出作为CNN卷积网络的输入，LSTM网络、CNN卷积网络的输出均作为注意力双向RNN网络的输入；

或者，并列的LSTM网络、CNN卷积网络以及再串联注意力双向RNN网络，风险评估样本数据作为均作为CNN卷积网络的输入，风险评估样本数据和CNN卷积网络的输出作为LSTM网络的输入，LSTM网络、CNN卷积网络的输出均作为注意力双向RNN网络的输入。

作为优选，风险种类预测模型包括：并列的LSTM网络、CNN卷积网络以及再串联注意力双向RNN网络；

其中，风险评估样本数据中的健康指标S作为CNN卷积网络的输入，风险评估样本数据中的风险种类M、风险评估等级

的名称和风险标签

作为LSTM网络的输入，LSTM网络、CNN卷积网络的输出均作为注意力双向RNN网络的输入。

作为优选，平均绝对误差MAE的计算公式为：

；

均方根误差RMSE的计算公式为：

；

其中，

为测量实际观测值，

为预测值，

为样本总数，

表示第

个样本。

作为优选，在步骤S3进行训练时，还利用风险评估样本数据对风险种类预测模型进行样本周期性训练，通过构建交通流阵列进行样本周期性训练，具体方法为：

假定

和

分别表示前一天和前一周获得的大小为

和

的交通流阵列，

和

是前一天和前一周到当前预测时间t的对应时间，那么

和

分别被表示为：

其中，n表示测试时间点的个数，p表示测试站点的个数，

表示以一天为间隔的测试时间点的个数，

表示以一周为间隔的测试时间点的个数，

表示上游第一个交通流阵列，

表示下游最后一个交通流阵列，h表示预测的范围大小。

作为优选，在构建交通流阵列时，采用均值插补的方式对风险评估样本数据中的缺失值、异常值进行插补。

一种基于深度学习的医疗系统风险管控事前预测系统，包括：

样本数据获取模块，用于从医学辅助诊断系统中获取风险评估样本数据，并对风险评估样本数据标注标签，所述标签包括风险种类、风险评估等级；

风险种类预测模型搭建模块，用于搭建风险种类预测模型，风险种类预测模型包括LSTM网络、CNN卷积网络以及注意力双向RNN网络；

风险种类预测模型训练模块，用于利用样本数据获取模块获取的样本数据输入风险种类预测模型搭建模块搭建的风险种类预测模型，对风险种类预测模型进行训练；

实时预测模块，用于获取医学辅助诊断系统中待预测的实时数据，将实时数据输入训练好的风险种类预测模型，得到预测结果；

其中，在风险种类预测模型训练模块进行训练时，采用BP反馈传播算法进行梯度回传，使用平均绝对误差MAE区分风险种类，使用均方根误差RMSE对风险评估等级回归学习，每一次迭代学习之后，比较两类误差大小；如果当前误差小于上一次迭代的误差，就保存当前模型，然后继续训练，直到达到最大迭代次数。

本发明的有益效果如下：

1、本发明中，通过搭建包括LSTM网络、CNN卷积网络以及注意力双向RNN网络在内的风险种类预测模型对风险进行预测，其能够有效降低事前风险预测的不确定性，为后续风险等级评估提供数据准备；基于注意力机制，通过综合分析风险等级，风险类型名称，风险标签，对等级类型进行准确判定，从而更精确的预测事前风险的等级。

2、本发明中，由于医生工作的周期性，在工作日和周末或节假日之间的流量模式差异导致数据也具有周期性，使用前几天和前几周的样本数据对风险种类预测模型进行训练，以便能够对此类行为进行最佳建模并准确预测未来风险。

附图说明

图1是本发明的流程示意图；

图2是本发明中风险种类预测模型的结构示意图；

图3是本发明中LSTM网络、CNN卷积网络以及注意力双向RNN网络的几种混合模型；

其中，a、b、c、d、e表示五种不同的混合模型。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1

一种基于深度学习的医疗系统风险管控事前预测方法，在使用混合深度神经网络的基础上，引入了注意力机制融合多种风险评估指标对可能发生的风险进行等级评估。

在评估之前，定义了6个风险评估指标，分别是：陌生IP地址访问、身份验证失败次数过多、多设备登录同一账号、用户数据异常泄露、用户突然活跃、用户异地登录，每个风险评估指标的含义为：

陌生IP地址访问：用户被陌生IP地址的系统访问用户数据及敏感类信息，根据陌生IP地址的被标记次数以及历史操作将风险类型分为低、中、高三种评价等级。

身份验证失败次数过多：用户需要通过指纹识别，人脸识别等验证方式总共的失败次数过多；根据失败的次数，有低、中、高三种评价等级。

多设备登录同一账号：用户通过多设备登录同一账号，增加用户账户被盗的风险；根据设备的多少，有低、中、高三种评价等级。

用户数据异常泄露：用户个人隐私数据如定位信息，指纹人脸信息，身份证信息遭受异常访问甚至泄露；根据涉及数据的隐私程度和泄露多少有低、中、高三种评价等级。

用户突然活跃：用户已长时间未登录之后，突然登录频率过高；根据活跃程度以及距离上一次登录的时间有低、中、高三种评价等级。

用户异地登录：用户登录时非经常使用的IP地址访问系统，根据陌生IP地址的位置以及与经常使用的IP地址的距离大小，有低、中、高三种评价等级。

在定义好上述风险评估指标后，医疗系统风险管控事前预测方法具体包括以下步骤，如图1所示：

步骤S1，获取样本数据

从医学辅助诊断系统中获取风险评估样本数据，并对风险评估样本数据标注标签，所述标签包括风险种类、风险评估等级。

本实施例中的样本数据来自于华西医院各类医学辅助诊断系统，采集了上述6类共计1000多个样本数据、以及样本数据对应的风险等级，各类风险的数据均匀分布。

对于风险种类的标签，对于每一例样本数据的风险评估等级，都由不同风险评估专家进行多轮标注标定，保证每一个标签准确与客观性，对于有争议的等级划分，会进行磋商讨论，决定其是否纳入样本数据。对于风险种类，根据前述定义的六种风险评估指标的标准进行判定，并对应的打上标签。

对于获取的样本数据，进行数据预处理。每例样本数据的常见数据类型包括文本数据、时间序列信号数据和IP地址序列数据。对于文本数据，将统一转换为向量，使分类任务变为向量匹配任务。对于时间序列信号数据，将嵌入特征名称，并基于特征名称和任务标签之间的具体差异为不同的时间序列信号分配不同的权重；对于IP地址序列数据，将每个IP地址做好标记，并分析出该IP地址的所在地理位置，根据用户常用IP地址算出两个IP地址的距离。

受限于机器硬件的性能，一个冗长复杂的非结构化文本会极大地较低训练的效率。在送入网络计算之前需要将该类非结构化文本通过人工进行分段，将冗长复杂的文本删减并模块化，然后通过自然语言处理（NLP）将该文本结构化，方便将文本类的数据转换为语义向量。即，文本数据经自然语言处理后作为风险种类预测模型的输入，邀请了多个风险专家，对文本类风险评估指标进行交叉注释，保证非结构化文本信息的标签能够被精确注释，使其转化为语义向量后丢失更少的语义特征。

步骤S2，搭建风险种类预测模型

搭建风险种类预测模型，风险种类预测模型包括LSTM网络、CNN卷积网络以及注意力双向RNN网络。

为了解决网络风险数据中的时间依赖性，使用最先进的递归神经网络（RNN），使用长-短期记忆网络（即LSTM网络）作为经典的递归神经网络（RNN）来预测时间维度上的风险数据。

为了考虑不同风险种类之间的空间相关性，卷积神经网络（即CNN卷积网络）可以单独使用，也可以与LSTM网络结合使用。本实施例中，将LSTM网络与CNN卷积网络进行结合使用，且将CNN卷积网络的二维卷积层、二维池化层替换为三维卷积层、三维池化层，这样保留了残差网络的捷径连接结构，提高预测性能。

如图2所示，风险评估样本数据中的健康指标S作为CNN卷积网络的输入，风险评估样本数据中的风险种类M、风险评估等级

的名称和风险标签

LSTM网络、CNN卷积网络以及注意力双向RNN网络连接成各种形式的混合模型，具体连接形式如图3所示。图3给出了a、b、c、d、e五种串并联混合模型，具体如下：

如图3（a）所示，风险种类预测模型包括依次串联的LSTM网络、CNN卷积网络以及注意力双向RNN网络，风险评估样本数据作为LSTM网络的输入，LSTM网络的输出作为CNN卷积网络的输入，CNN卷积网络的输出作为注意力双向RNN网络的输入；

或者如图3（b）所示，风险种类预测模型包括依次串联的CNN卷积网络、LSTM网络以及注意力双向RNN网络，风险评估样本数据作为CNN卷积网络的输入，CNN卷积网络的输出作为LSTM网络的输入，LSTM网络的输出作为注意力双向RNN网络的输入；

或者如图3（c）所示，风险种类预测模型包括并列的LSTM网络、CNN卷积网络以及再串联注意力双向RNN网络，风险评估样本数据作为均作为LSTM网络、CNN卷积网络的输入，LSTM网络、CNN卷积网络的输出均作为注意力双向RNN网络的输入；

或者如图3（d）所示，风险种类预测模型包括并列的LSTM网络、CNN卷积网络以及再串联注意力双向RNN网络，风险评估样本数据作为均作为LSTM网络的输入，风险评估样本数据和LSTM网络的输出作为CNN卷积网络的输入，LSTM网络、CNN卷积网络的输出均作为注意力双向RNN网络的输入；

或者如图3（e）所示，风险种类预测模型包括并列的LSTM网络、CNN卷积网络以及再串联注意力双向RNN网络，风险评估样本数据作为均作为CNN卷积网络的输入，风险评估样本数据和CNN卷积网络的输出作为LSTM网络的输入，LSTM网络、CNN卷积网络的输出均作为注意力双向RNN网络的输入。

步骤S3，训练风险种类预测模型

在步骤S3进行训练时，包括几种训练处理：

一是利用风险评估样本数据对风险种类预测模型进行样本周期性训练，通过构建交通流阵列进行样本周期性训练，具体方法为：

假定

和

分别表示前一天和前一周获得的大小为

和

的交通流阵列，

和

是前一天和前一周到当前预测时间t的对应时间，那么

和

分别被表示为：

其中，n表示测试时间点的个数，p表示测试站点的个数，

表示以一天为间隔的测试时间点的个数，

表示以一周为间隔的测试时间点的个数，

表示上游第一个交通流阵列，

表示下游最后一个交通流阵列，h表示预测的范围大小。

二是在构建交通流阵列时，采用均值插补的方式对风险评估样本数据中的缺失值、异常值进行插补。经实验，采用均值插补技术的串并联混合网络在预测的历史数据时获得了最低的误差。

三是采用BP反馈传播算法进行梯度回传，使用平均绝对误差MAE区分风险种类，使用均方根误差RMSE对风险评估等级回归学习，每一次迭代学习之后，比较两类误差大小；如果当前误差小于上一次迭代的误差，就保存当前模型，然后继续训练，直到达到最大迭代次数。

其中，平均绝对误差MAE的计算公式为：

；

均方根误差RMSE的计算公式为：

；

其中，

为测量实际观测值，

为预测值，

为样本总数，

表示第

个样本。

步骤S4，实时预测

获取医学辅助诊断系统中待预测的实时数据，将实时数据输入训练好的风险种类预测模型，得到预测结果。

实施例2

一种基于深度学习的医疗系统风险管控事前预测系统，在使用混合深度神经网络的基础上，引入了注意力机制融合多种风险评估指标对可能发生的风险进行等级评估。

在定义好上述风险评估指标后，医疗系统风险管控事前预测系统如图1所示,具体包括：

样本数据获取模块,用于从医学辅助诊断系统中获取风险评估样本数据，并对风险评估样本数据标注标签，所述标签包括风险种类、风险评估等级。

风险种类预测模型搭建模块，用于搭建风险种类预测模型，风险种类预测模型包括LSTM网络、CNN卷积网络以及注意力双向RNN网络。

的名称和风险标签

在风险种类预测模型训练模块进行训练时，包括几种训练处理：

假定

和

分别表示前一天和前一周获得的大小为

和

的交通流阵列，

和

是前一天和前一周到当前预测时间t的对应时间，那么

和

分别被表示为：

其中，n表示测试时间点的个数，p表示测试站点的个数，

表示以一天为间隔的测试时间点的个数，

表示以一周为间隔的测试时间点的个数，

表示上游第一个交通流阵列，

表示下游最后一个交通流阵列，h表示预测的范围大小。

其中，平均绝对误差MAE的计算公式为：

；

均方根误差RMSE的计算公式为：

；

其中，

为测量实际观测值，

为预测值，

为样本总数，

表示第

个样本。

实时预测模块，实时预测

Claims

1.一种基于深度学习的医疗系统风险管控事前预测方法，其特征在于，包括如下步骤：

步骤S1，获取样本数据

步骤S2，搭建风险种类预测模型

步骤S3，训练风险种类预测模型

步骤S4，实时预测

2.如权利要求1所述的一种基于深度学习的医疗系统风险管控事前预测方法，其特征在于：风险评估样本数据包括文本数据、时间序列信号数据和IP地址序列数据；

文本数据经自然语言处理后作为风险种类预测模型的输入。

3.如权利要求1所述的一种基于深度学习的医疗系统风险管控事前预测方法，其特征在于，风险种类预测模型包括：

4.如权利要求1所述的一种基于深度学习的医疗系统风险管控事前预测方法，其特征在于：风险种类预测模型包括：并列的LSTM网络、CNN卷积网络以及再串联注意力双向RNN网络；

的名称和风险标签

5.如权利要求1所述的一种基于深度学习的医疗系统风险管控事前预测方法，其特征在于：

平均绝对误差MAE的计算公式为：

；

均方根误差RMSE的计算公式为：

；

其中，

为测量实际观测值，

为预测值，

为样本总数，

表示第

个样本。

6.如权利要求1所述的一种基于深度学习的医疗系统风险管控事前预测方法，其特征在于：在步骤S3进行训练时，还利用风险评估样本数据对风险种类预测模型进行样本周期性训练，通过构建交通流阵列进行样本周期性训练，具体方法为：

假定

和

分别表示前一天和前一周获得的大小为

和

的交通流阵列，

和

是前一天和前一周到当前预测时间t的对应时间，那么

和

分别被表示为：

其中，n表示测试时间点的个数，p表示测试站点的个数，

表示以一天为间隔的测试时间点的个数，

表示以一周为间隔的测试时间点的个数，

表示上游第一个交通流阵列，

表示下游最后一个交通流阵列，h表示预测的范围大小。

7.如权利要求6所述的一种基于深度学习的医疗系统风险管控事前预测方法，其特征在于：在构建交通流阵列时，采用均值插补的方式对风险评估样本数据中的缺失值、异常值进行插补。

8.一种基于深度学习的医疗系统风险管控事前预测系统，其特征在于，包括：