CN115831339A - 基于深度学习的医疗系统风险管控事前预测方法、系统 - Google Patents
基于深度学习的医疗系统风险管控事前预测方法、系统 Download PDFInfo
- Publication number
- CN115831339A CN115831339A CN202310143517.5A CN202310143517A CN115831339A CN 115831339 A CN115831339 A CN 115831339A CN 202310143517 A CN202310143517 A CN 202310143517A CN 115831339 A CN115831339 A CN 115831339A
- Authority
- CN
- China
- Prior art keywords
- risk
- network
- sample data
- prediction model
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000013135 deep learning Methods 0.000 title claims abstract description 17
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 94
- 230000002457 bidirectional effect Effects 0.000 claims abstract description 56
- 238000012549 training Methods 0.000 claims abstract description 41
- 238000013528 artificial neural network Methods 0.000 claims abstract description 36
- 238000011156 evaluation Methods 0.000 claims abstract description 36
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 14
- 238000012502 risk assessment Methods 0.000 claims description 85
- 238000012360 testing method Methods 0.000 claims description 16
- 238000003745 diagnosis Methods 0.000 claims description 13
- 238000002372 labelling Methods 0.000 claims description 11
- 230000000737 periodic effect Effects 0.000 claims description 9
- 230000002159 abnormal effect Effects 0.000 claims description 8
- 230000036541 health Effects 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 4
- 238000011144 upstream manufacturing Methods 0.000 claims description 4
- 238000007405 data analysis Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 claims description 2
- 230000005540 biological transmission Effects 0.000 claims 1
- 230000007246 mechanism Effects 0.000 abstract description 5
- 239000013598 vector Substances 0.000 description 9
- 238000012706 support-vector machine Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000003058 natural language processing Methods 0.000 description 4
- 238000011176 pooling Methods 0.000 description 4
- 230000000306 recurrent effect Effects 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000012369 In process control Methods 0.000 description 1
- 240000000233 Melia azedarach Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010965 in-process control Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012847 principal component analysis method Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000013058 risk prediction model Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于深度学习的医疗系统风险管控事前预测方法、系统,涉及医疗系统的风险管控技术领域,用于解决现有的基于神经网络的风险预测因数据量庞大、风险评价指标造成的风险评估准确率低的问题。其包括LSTM网络、CNN卷积网络以及注意力双向RNN网络的风险种类预测模型;训练时,采用BP反馈传播算法进行梯度回传,使用平均绝对误差MAE区分风险种类,使用均方根误差RMSE对风险评估等级回归学习。本发明通过采用不同风险类别的算法来预测未发生的风险、采用注意力机制使神经网络的风险评估准确率更高。
Description
技术领域
本发明属于人工智能技术领域,涉及医疗系统的风险管控,更具体的是涉及一种基于深度学习的医疗系统风险管控事前预测方法、系统。
背景技术
医院作为广泛使用计算机的机构,在医疗的各个方面,医学辅助型计算机程序日益增多。在医院推动数字化转型的过程中,为了对多应用、多维度人员进行统一管理,医院拟采用数字身份建立全域统一的身份安全管控体系。
在该体系中,针对每一位医师数字身份的风险管控尤为重要。目前,在安全维度,需要建立事前预警、事中控制、事后追溯的动态监管模块,该模块通常将风险评估指标作为动态监管的重要内容。针对风险管控的预测在最近几年已经被广泛研究,这些研究大多数集中对已经发生的安全事件进行风险种类评估,真正的着眼于用户风险的事前预测却鲜有研究。目前典型的动态风险预测方法基于三个阶段:(1)完成数据收集和预处理,主要是对风险进行选择和分类;(2)选择合适的特征选择算法,包括主成分分析法、遗传算法、支持向量机算法、神经网络算法等,在为每个选择的特征选择合适的模型后,将其分别进行应用;(3)使用准备好的数据集训练对应的分类算法,并根据最后的风险预测结果,调整对应的参数,完善其风险预测的准确率。
近10年来,风险管控的预测方法一直在进步,根据有无使用神经网络方法可以将其分为两个阶段:没有使用神经网络方法的传统阶段,以及基于神经网络方法的阶段。传统阶段风险管控的预测是基于支持向量机的方法的,如Lang Zhang, Haiqing Hu 和 DanZhang在他们的中小企业信用风险种类评估中提出了基于SVM的商业银行信用风险预测模型,该方法是一种新的模式识别技术,作为一种基于核函数的机器学习方法,支持向量机在解决非线性可分离分类问题上具有显著优势。在风险预测中,存在这多种风险评估指标,通常是一种多分类的问题,虽然多维分类比二维分类复杂,但两者的原理非常相似。支持向量机利用线性分离超平面产生边界最大的分类器,用于最简单的二元分类任务。Ping等人(Ping&Yongheng, 2011)提出了一种基于svm的基于客户变量的混合信用评分模型,该模型包括四种方法:(1)使用粗糙邻域设置输入特征选择;(2)应用网格搜索优化RBF核参数;(3)利用混合最优输入特征和模型;(4)与其他方法的准确性比较。结果表明,与其他混合分类器相比,基于svm的混合分类器和粗糙邻域集的信用评分能力最好。它们也优于线性判别分析、逻辑回归等机器学习的方法。
基于前馈神经网络的风险事前预警的方法,目前在此领域也有许多研究成果。Weiwei Liu, Zhiwei Lian和Bo ZhaoBensic(Bensic等人,2005年)通过比较逻辑回归、神经网络(NNs)和分类回归树(CART)决策树的准确性,研究了小企业贷款中信用评分的一些重要特征。结果表明,概率神经网络模型实现了最高的“命中率”和最低的I型错误(Bensic等人,2005)。West(West,2000)研究了五种神经网络信用评分模型的准确性;即多层感知器、专家混合、径向基函数、学习矢量量化和模糊自适应共振。结果表明,专家和RBF神经网络模型的混合比多层感知器方法更敏感(West,2000)。然而,Eliana Angelini 等人开发了两个神经网络系统,一个具有标准前馈网络,另一个具有专用架构。通过应用标准反向传播算法的微小变化,他们对经典前馈网络进行了非常有效的调整,如果误差低于给定阈值,则不会传播误差。
由于医疗系统信息的敏感程度高、数据量大、风险种类分类复杂、评估等级也较为严格,现有的风险预测方法并不能有较好的预测效果。在基于用户数字身份的风险预测方法中,要么是基于传统的支持向量机方法,这个方法不仅设计起来十分繁琐,而且所提取的特征的有效性也难以保证。基于神经网络的方法,可以使用神经网络自动地从各种风险指标中提取本质特征,这些方法考虑到了风险的种类、风险的时间等因素,但是由于在实际的应用中使用的前馈神经网络等需要的数据量十分庞大,并且准确率并不高。本发明研究了一种针对不同风险类别的算法,来检测未发生的风险;在风险评价指标方面,之前的方法大多数是围绕着用户的信用评价指标,或者基于了一些简单的特征维度,评估风险等级,本发明基于注意力机制,使得神经网络可以以更高的精度的评估影响风险等级的特征,进而有效地对风险等级进行评估。
发明内容
本发明的目的在于:为了解决现有的基于神经网络的风险预测因数据量庞大、风险评价指标造成的风险评估准确率低的问题,本发明提供一种基于深度学习的医疗系统风险管控事前预测方法、系统,通过采用不同风险类别的算法来预测未发生的风险、采用注意力机制使神经网络的风险评估准确率更高。
本发明为了实现上述目的具体采用以下技术方案:
一种基于深度学习的医疗系统风险管控事前预测方法,包括如下步骤:
步骤S1,获取样本数据
从医学辅助诊断系统中获取风险评估样本数据,并对风险评估样本数据标注标签,所述标签包括风险种类、风险评估等级;
步骤S2,搭建风险种类预测模型
搭建风险种类预测模型,风险种类预测模型包括LSTM网络、CNN卷积网络以及注意力双向RNN网络;
步骤S3,训练风险种类预测模型
利用步骤S1获取的样本数据输入步骤S2搭建的风险种类预测模型,对风险种类预测模型进行训练;
步骤S4,实时预测
获取医学辅助诊断系统中待预测的实时数据,将实时数据输入训练好的风险种类预测模型,得到预测结果;
其中,在步骤S3进行训练时,采用BP反馈传播算法进行梯度回传,使用平均绝对误差MAE区分风险种类,使用均方根误差RMSE对风险评估等级回归学习,每一次迭代学习之后,比较两类误差大小;如果当前误差小于上一次迭代的误差,就保存当前模型,然后继续训练,直到达到最大迭代次数。
作为优选,风险评估样本数据包括文本数据、时间序列信号数据和IP地址序列数据;
文本数据经自然语言处理后作为风险种类预测模型的输入。
作为优选,风险种类预测模型包括:
依次串联的LSTM网络、CNN卷积网络以及注意力双向RNN网络,风险评估样本数据作为LSTM网络的输入,LSTM网络的输出作为CNN卷积网络的输入,CNN卷积网络的输出作为注意力双向RNN网络的输入;
或者,依次串联的CNN卷积网络、LSTM网络以及注意力双向RNN网络,风险评估样本数据作为CNN卷积网络的输入,CNN卷积网络的输出作为LSTM网络的输入,LSTM网络的输出作为注意力双向RNN网络的输入;
或者,并列的LSTM网络、CNN卷积网络以及再串联注意力双向RNN网络,风险评估样本数据作为均作为LSTM网络、CNN卷积网络的输入,LSTM网络、CNN卷积网络的输出均作为注意力双向RNN网络的输入;
或者,并列的LSTM网络、CNN卷积网络以及再串联注意力双向RNN网络,风险评估样本数据作为均作为LSTM网络的输入,风险评估样本数据和LSTM网络的输出作为CNN卷积网络的输入,LSTM网络、CNN卷积网络的输出均作为注意力双向RNN网络的输入;
或者,并列的LSTM网络、CNN卷积网络以及再串联注意力双向RNN网络,风险评估样本数据作为均作为CNN卷积网络的输入,风险评估样本数据和CNN卷积网络的输出作为LSTM网络的输入,LSTM网络、CNN卷积网络的输出均作为注意力双向RNN网络的输入。
作为优选,风险种类预测模型包括:并列的LSTM网络、CNN卷积网络以及再串联注意力双向RNN网络;
其中,风险评估样本数据中的健康指标S作为CNN卷积网络的输入,风险评估样本数据中的风险种类M、风险评估等级的名称和风险标签作为LSTM网络的输入,LSTM网络、CNN卷积网络的输出均作为注意力双向RNN网络的输入。
作为优选,平均绝对误差MAE的计算公式为:
均方根误差RMSE的计算公式为:
作为优选,在步骤S3进行训练时,还利用风险评估样本数据对风险种类预测模型进行样本周期性训练,通过构建交通流阵列进行样本周期性训练,具体方法为:
其中,n表示测试时间点的个数,p表示测试站点的个数,表示以一天为间隔的测试时间点的个数,表示以一周为间隔的测试时间点的个数,表示上游第一个交通流阵列,表示下游最后一个交通流阵列,h表示预测的范围大小。
作为优选,在构建交通流阵列时,采用均值插补的方式对风险评估样本数据中的缺失值、异常值进行插补。
一种基于深度学习的医疗系统风险管控事前预测系统,包括:
样本数据获取模块,用于从医学辅助诊断系统中获取风险评估样本数据,并对风险评估样本数据标注标签,所述标签包括风险种类、风险评估等级;
风险种类预测模型搭建模块,用于搭建风险种类预测模型,风险种类预测模型包括LSTM网络、CNN卷积网络以及注意力双向RNN网络;
风险种类预测模型训练模块,用于利用样本数据获取模块获取的样本数据输入风险种类预测模型搭建模块搭建的风险种类预测模型,对风险种类预测模型进行训练;
实时预测模块,用于获取医学辅助诊断系统中待预测的实时数据,将实时数据输入训练好的风险种类预测模型,得到预测结果;
其中,在风险种类预测模型训练模块进行训练时,采用BP反馈传播算法进行梯度回传,使用平均绝对误差MAE区分风险种类,使用均方根误差RMSE对风险评估等级回归学习,每一次迭代学习之后,比较两类误差大小;如果当前误差小于上一次迭代的误差,就保存当前模型,然后继续训练,直到达到最大迭代次数。
本发明的有益效果如下:
1、本发明中,通过搭建包括LSTM网络、CNN卷积网络以及注意力双向RNN网络在内的风险种类预测模型对风险进行预测,其能够有效降低事前风险预测的不确定性,为后续风险等级评估提供数据准备;基于注意力机制,通过综合分析风险等级,风险类型名称,风险标签,对等级类型进行准确判定,从而更精确的预测事前风险的等级。
2、本发明中,由于医生工作的周期性,在工作日和周末或节假日之间的流量模式差异导致数据也具有周期性,使用前几天和前几周的样本数据对风险种类预测模型进行训练,以便能够对此类行为进行最佳建模并准确预测未来风险。
附图说明
图1是本发明的流程示意图;
图2是本发明中风险种类预测模型的结构示意图;
图3是本发明中LSTM网络、CNN卷积网络以及注意力双向RNN网络的几种混合模型;
其中,a、b、c、d、e表示五种不同的混合模型。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
一种基于深度学习的医疗系统风险管控事前预测方法,在使用混合深度神经网络的基础上,引入了注意力机制融合多种风险评估指标对可能发生的风险进行等级评估。
在评估之前,定义了6个风险评估指标,分别是:陌生IP地址访问、身份验证失败次数过多、多设备登录同一账号、用户数据异常泄露、用户突然活跃、用户异地登录,每个风险评估指标的含义为:
陌生IP地址访问:用户被陌生IP地址的系统访问用户数据及敏感类信息,根据陌生IP地址的被标记次数以及历史操作将风险类型分为低、中、高三种评价等级。
身份验证失败次数过多:用户需要通过指纹识别,人脸识别等验证方式总共的失败次数过多;根据失败的次数,有低、中、高三种评价等级。
多设备登录同一账号:用户通过多设备登录同一账号,增加用户账户被盗的风险;根据设备的多少,有低、中、高三种评价等级。
用户数据异常泄露:用户个人隐私数据如定位信息,指纹人脸信息,身份证信息遭受异常访问甚至泄露;根据涉及数据的隐私程度和泄露多少有低、中、高三种评价等级。
用户突然活跃:用户已长时间未登录之后,突然登录频率过高;根据活跃程度以及距离上一次登录的时间有低、中、高三种评价等级。
用户异地登录:用户登录时非经常使用的IP地址访问系统,根据陌生IP地址的位置以及与经常使用的IP地址的距离大小,有低、中、高三种评价等级。
在定义好上述风险评估指标后,医疗系统风险管控事前预测方法具体包括以下步骤,如图1所示:
步骤S1,获取样本数据
从医学辅助诊断系统中获取风险评估样本数据,并对风险评估样本数据标注标签,所述标签包括风险种类、风险评估等级。
本实施例中的样本数据来自于华西医院各类医学辅助诊断系统,采集了上述6类共计1000多个样本数据、以及样本数据对应的风险等级,各类风险的数据均匀分布。
对于风险种类的标签,对于每一例样本数据的风险评估等级,都由不同风险评估专家进行多轮标注标定,保证每一个标签准确与客观性,对于有争议的等级划分,会进行磋商讨论,决定其是否纳入样本数据。对于风险种类,根据前述定义的六种风险评估指标的标准进行判定,并对应的打上标签。
对于获取的样本数据,进行数据预处理。每例样本数据的常见数据类型包括文本数据、时间序列信号数据和IP地址序列数据。对于文本数据,将统一转换为向量,使分类任务变为向量匹配任务。对于时间序列信号数据,将嵌入特征名称,并基于特征名称和任务标签之间的具体差异为不同的时间序列信号分配不同的权重;对于IP地址序列数据,将每个IP地址做好标记,并分析出该IP地址的所在地理位置,根据用户常用IP地址算出两个IP地址的距离。
受限于机器硬件的性能,一个冗长复杂的非结构化文本会极大地较低训练的效率。在送入网络计算之前需要将该类非结构化文本通过人工进行分段,将冗长复杂的文本删减并模块化,然后通过自然语言处理(NLP)将该文本结构化,方便将文本类的数据转换为语义向量。即,文本数据经自然语言处理后作为风险种类预测模型的输入,邀请了多个风险专家,对文本类风险评估指标进行交叉注释,保证非结构化文本信息的标签能够被精确注释,使其转化为语义向量后丢失更少的语义特征。
步骤S2,搭建风险种类预测模型
搭建风险种类预测模型,风险种类预测模型包括LSTM网络、CNN卷积网络以及注意力双向RNN网络。
为了解决网络风险数据中的时间依赖性,使用最先进的递归神经网络(RNN),使用长-短期记忆网络(即LSTM网络)作为经典的递归神经网络(RNN)来预测时间维度上的风险数据。
为了考虑不同风险种类之间的空间相关性,卷积神经网络(即CNN卷积网络)可以单独使用,也可以与LSTM网络结合使用。本实施例中,将LSTM网络与CNN卷积网络进行结合使用,且将CNN卷积网络的二维卷积层、二维池化层替换为三维卷积层、三维池化层,这样保留了残差网络的捷径连接结构,提高预测性能。
如图2所示,风险评估样本数据中的健康指标S作为CNN卷积网络的输入,风险评估样本数据中的风险种类M、风险评估等级的名称和风险标签作为LSTM网络的输入,LSTM网络、CNN卷积网络的输出均作为注意力双向RNN网络的输入。
LSTM网络、CNN卷积网络以及注意力双向RNN网络连接成各种形式的混合模型,具体连接形式如图3所示。图3给出了a、b、c、d、e五种串并联混合模型,具体如下:
如图3(a)所示,风险种类预测模型包括依次串联的LSTM网络、CNN卷积网络以及注意力双向RNN网络,风险评估样本数据作为LSTM网络的输入,LSTM网络的输出作为CNN卷积网络的输入,CNN卷积网络的输出作为注意力双向RNN网络的输入;
或者如图3(b)所示,风险种类预测模型包括依次串联的CNN卷积网络、LSTM网络以及注意力双向RNN网络,风险评估样本数据作为CNN卷积网络的输入,CNN卷积网络的输出作为LSTM网络的输入,LSTM网络的输出作为注意力双向RNN网络的输入;
或者如图3(c)所示,风险种类预测模型包括并列的LSTM网络、CNN卷积网络以及再串联注意力双向RNN网络,风险评估样本数据作为均作为LSTM网络、CNN卷积网络的输入,LSTM网络、CNN卷积网络的输出均作为注意力双向RNN网络的输入;
或者如图3(d)所示,风险种类预测模型包括并列的LSTM网络、CNN卷积网络以及再串联注意力双向RNN网络,风险评估样本数据作为均作为LSTM网络的输入,风险评估样本数据和LSTM网络的输出作为CNN卷积网络的输入,LSTM网络、CNN卷积网络的输出均作为注意力双向RNN网络的输入;
或者如图3(e)所示,风险种类预测模型包括并列的LSTM网络、CNN卷积网络以及再串联注意力双向RNN网络,风险评估样本数据作为均作为CNN卷积网络的输入,风险评估样本数据和CNN卷积网络的输出作为LSTM网络的输入,LSTM网络、CNN卷积网络的输出均作为注意力双向RNN网络的输入。
步骤S3,训练风险种类预测模型
利用步骤S1获取的样本数据输入步骤S2搭建的风险种类预测模型,对风险种类预测模型进行训练;
在步骤S3进行训练时,包括几种训练处理:
一是利用风险评估样本数据对风险种类预测模型进行样本周期性训练,通过构建交通流阵列进行样本周期性训练,具体方法为:
其中,n表示测试时间点的个数,p表示测试站点的个数,表示以一天为间隔的测试时间点的个数,表示以一周为间隔的测试时间点的个数,表示上游第一个交通流阵列,表示下游最后一个交通流阵列,h表示预测的范围大小。
二是在构建交通流阵列时,采用均值插补的方式对风险评估样本数据中的缺失值、异常值进行插补。经实验,采用均值插补技术的串并联混合网络在预测的历史数据时获得了最低的误差。
三是采用BP反馈传播算法进行梯度回传,使用平均绝对误差MAE区分风险种类,使用均方根误差RMSE对风险评估等级回归学习,每一次迭代学习之后,比较两类误差大小;如果当前误差小于上一次迭代的误差,就保存当前模型,然后继续训练,直到达到最大迭代次数。
其中,平均绝对误差MAE的计算公式为:
均方根误差RMSE的计算公式为:
步骤S4,实时预测
获取医学辅助诊断系统中待预测的实时数据,将实时数据输入训练好的风险种类预测模型,得到预测结果。
实施例2
一种基于深度学习的医疗系统风险管控事前预测系统,在使用混合深度神经网络的基础上,引入了注意力机制融合多种风险评估指标对可能发生的风险进行等级评估。
在评估之前,定义了6个风险评估指标,分别是:陌生IP地址访问、身份验证失败次数过多、多设备登录同一账号、用户数据异常泄露、用户突然活跃、用户异地登录,每个风险评估指标的含义为:
陌生IP地址访问:用户被陌生IP地址的系统访问用户数据及敏感类信息,根据陌生IP地址的被标记次数以及历史操作将风险类型分为低、中、高三种评价等级。
身份验证失败次数过多:用户需要通过指纹识别,人脸识别等验证方式总共的失败次数过多;根据失败的次数,有低、中、高三种评价等级。
多设备登录同一账号:用户通过多设备登录同一账号,增加用户账户被盗的风险;根据设备的多少,有低、中、高三种评价等级。
用户数据异常泄露:用户个人隐私数据如定位信息,指纹人脸信息,身份证信息遭受异常访问甚至泄露;根据涉及数据的隐私程度和泄露多少有低、中、高三种评价等级。
用户突然活跃:用户已长时间未登录之后,突然登录频率过高;根据活跃程度以及距离上一次登录的时间有低、中、高三种评价等级。
用户异地登录:用户登录时非经常使用的IP地址访问系统,根据陌生IP地址的位置以及与经常使用的IP地址的距离大小,有低、中、高三种评价等级。
在定义好上述风险评估指标后,医疗系统风险管控事前预测系统如图1所示,具体包括:
样本数据获取模块,用于从医学辅助诊断系统中获取风险评估样本数据,并对风险评估样本数据标注标签,所述标签包括风险种类、风险评估等级。
本实施例中的样本数据来自于华西医院各类医学辅助诊断系统,采集了上述6类共计1000多个样本数据、以及样本数据对应的风险等级,各类风险的数据均匀分布。
对于风险种类的标签,对于每一例样本数据的风险评估等级,都由不同风险评估专家进行多轮标注标定,保证每一个标签准确与客观性,对于有争议的等级划分,会进行磋商讨论,决定其是否纳入样本数据。对于风险种类,根据前述定义的六种风险评估指标的标准进行判定,并对应的打上标签。
对于获取的样本数据,进行数据预处理。每例样本数据的常见数据类型包括文本数据、时间序列信号数据和IP地址序列数据。对于文本数据,将统一转换为向量,使分类任务变为向量匹配任务。对于时间序列信号数据,将嵌入特征名称,并基于特征名称和任务标签之间的具体差异为不同的时间序列信号分配不同的权重;对于IP地址序列数据,将每个IP地址做好标记,并分析出该IP地址的所在地理位置,根据用户常用IP地址算出两个IP地址的距离。
受限于机器硬件的性能,一个冗长复杂的非结构化文本会极大地较低训练的效率。在送入网络计算之前需要将该类非结构化文本通过人工进行分段,将冗长复杂的文本删减并模块化,然后通过自然语言处理(NLP)将该文本结构化,方便将文本类的数据转换为语义向量。即,文本数据经自然语言处理后作为风险种类预测模型的输入,邀请了多个风险专家,对文本类风险评估指标进行交叉注释,保证非结构化文本信息的标签能够被精确注释,使其转化为语义向量后丢失更少的语义特征。
风险种类预测模型搭建模块,用于搭建风险种类预测模型,风险种类预测模型包括LSTM网络、CNN卷积网络以及注意力双向RNN网络。
为了解决网络风险数据中的时间依赖性,使用最先进的递归神经网络(RNN),使用长-短期记忆网络(即LSTM网络)作为经典的递归神经网络(RNN)来预测时间维度上的风险数据。
为了考虑不同风险种类之间的空间相关性,卷积神经网络(即CNN卷积网络)可以单独使用,也可以与LSTM网络结合使用。本实施例中,将LSTM网络与CNN卷积网络进行结合使用,且将CNN卷积网络的二维卷积层、二维池化层替换为三维卷积层、三维池化层,这样保留了残差网络的捷径连接结构,提高预测性能。
如图2所示,风险评估样本数据中的健康指标S作为CNN卷积网络的输入,风险评估样本数据中的风险种类M、风险评估等级的名称和风险标签作为LSTM网络的输入,LSTM网络、CNN卷积网络的输出均作为注意力双向RNN网络的输入。
LSTM网络、CNN卷积网络以及注意力双向RNN网络连接成各种形式的混合模型,具体连接形式如图3所示。图3给出了a、b、c、d、e五种串并联混合模型,具体如下:
如图3(a)所示,风险种类预测模型包括依次串联的LSTM网络、CNN卷积网络以及注意力双向RNN网络,风险评估样本数据作为LSTM网络的输入,LSTM网络的输出作为CNN卷积网络的输入,CNN卷积网络的输出作为注意力双向RNN网络的输入;
或者如图3(b)所示,风险种类预测模型包括依次串联的CNN卷积网络、LSTM网络以及注意力双向RNN网络,风险评估样本数据作为CNN卷积网络的输入,CNN卷积网络的输出作为LSTM网络的输入,LSTM网络的输出作为注意力双向RNN网络的输入;
或者如图3(c)所示,风险种类预测模型包括并列的LSTM网络、CNN卷积网络以及再串联注意力双向RNN网络,风险评估样本数据作为均作为LSTM网络、CNN卷积网络的输入,LSTM网络、CNN卷积网络的输出均作为注意力双向RNN网络的输入;
或者如图3(d)所示,风险种类预测模型包括并列的LSTM网络、CNN卷积网络以及再串联注意力双向RNN网络,风险评估样本数据作为均作为LSTM网络的输入,风险评估样本数据和LSTM网络的输出作为CNN卷积网络的输入,LSTM网络、CNN卷积网络的输出均作为注意力双向RNN网络的输入;
或者如图3(e)所示,风险种类预测模型包括并列的LSTM网络、CNN卷积网络以及再串联注意力双向RNN网络,风险评估样本数据作为均作为CNN卷积网络的输入,风险评估样本数据和CNN卷积网络的输出作为LSTM网络的输入,LSTM网络、CNN卷积网络的输出均作为注意力双向RNN网络的输入。
风险种类预测模型训练模块,用于利用样本数据获取模块获取的样本数据输入风险种类预测模型搭建模块搭建的风险种类预测模型,对风险种类预测模型进行训练;
在风险种类预测模型训练模块进行训练时,包括几种训练处理:
一是利用风险评估样本数据对风险种类预测模型进行样本周期性训练,通过构建交通流阵列进行样本周期性训练,具体方法为:
其中,n表示测试时间点的个数,p表示测试站点的个数,表示以一天为间隔的测试时间点的个数,表示以一周为间隔的测试时间点的个数,表示上游第一个交通流阵列,表示下游最后一个交通流阵列,h表示预测的范围大小。
二是在构建交通流阵列时,采用均值插补的方式对风险评估样本数据中的缺失值、异常值进行插补。经实验,采用均值插补技术的串并联混合网络在预测的历史数据时获得了最低的误差。
三是采用BP反馈传播算法进行梯度回传,使用平均绝对误差MAE区分风险种类,使用均方根误差RMSE对风险评估等级回归学习,每一次迭代学习之后,比较两类误差大小;如果当前误差小于上一次迭代的误差,就保存当前模型,然后继续训练,直到达到最大迭代次数。
其中,平均绝对误差MAE的计算公式为:
均方根误差RMSE的计算公式为:
实时预测模块,实时预测
获取医学辅助诊断系统中待预测的实时数据,将实时数据输入训练好的风险种类预测模型,得到预测结果。
Claims (8)
1.一种基于深度学习的医疗系统风险管控事前预测方法,其特征在于,包括如下步骤:
步骤S1,获取样本数据
从医学辅助诊断系统中获取风险评估样本数据,并对风险评估样本数据标注标签,所述标签包括风险种类、风险评估等级;
步骤S2,搭建风险种类预测模型
搭建风险种类预测模型,风险种类预测模型包括LSTM网络、CNN卷积网络以及注意力双向RNN网络;
步骤S3,训练风险种类预测模型
利用步骤S1获取的样本数据输入步骤S2搭建的风险种类预测模型,对风险种类预测模型进行训练;
步骤S4,实时预测
获取医学辅助诊断系统中待预测的实时数据,将实时数据输入训练好的风险种类预测模型,得到预测结果;
其中,在步骤S3进行训练时,采用BP反馈传播算法进行梯度回传,使用平均绝对误差MAE区分风险种类,使用均方根误差RMSE对风险评估等级回归学习,每一次迭代学习之后,比较两类误差大小;如果当前误差小于上一次迭代的误差,就保存当前模型,然后继续训练,直到达到最大迭代次数。
2.如权利要求1所述的一种基于深度学习的医疗系统风险管控事前预测方法,其特征在于:风险评估样本数据包括文本数据、时间序列信号数据和IP地址序列数据;
文本数据经自然语言处理后作为风险种类预测模型的输入。
3.如权利要求1所述的一种基于深度学习的医疗系统风险管控事前预测方法,其特征在于,风险种类预测模型包括:
依次串联的LSTM网络、CNN卷积网络以及注意力双向RNN网络,风险评估样本数据作为LSTM网络的输入,LSTM网络的输出作为CNN卷积网络的输入,CNN卷积网络的输出作为注意力双向RNN网络的输入;
或者,依次串联的CNN卷积网络、LSTM网络以及注意力双向RNN网络,风险评估样本数据作为CNN卷积网络的输入,CNN卷积网络的输出作为LSTM网络的输入,LSTM网络的输出作为注意力双向RNN网络的输入;
或者,并列的LSTM网络、CNN卷积网络以及再串联注意力双向RNN网络,风险评估样本数据作为均作为LSTM网络、CNN卷积网络的输入,LSTM网络、CNN卷积网络的输出均作为注意力双向RNN网络的输入;
或者,并列的LSTM网络、CNN卷积网络以及再串联注意力双向RNN网络,风险评估样本数据作为均作为LSTM网络的输入,风险评估样本数据和LSTM网络的输出作为CNN卷积网络的输入,LSTM网络、CNN卷积网络的输出均作为注意力双向RNN网络的输入;
或者,并列的LSTM网络、CNN卷积网络以及再串联注意力双向RNN网络,风险评估样本数据作为均作为CNN卷积网络的输入,风险评估样本数据和CNN卷积网络的输出作为LSTM网络的输入,LSTM网络、CNN卷积网络的输出均作为注意力双向RNN网络的输入。
7.如权利要求6所述的一种基于深度学习的医疗系统风险管控事前预测方法,其特征在于:在构建交通流阵列时,采用均值插补的方式对风险评估样本数据中的缺失值、异常值进行插补。
8.一种基于深度学习的医疗系统风险管控事前预测系统,其特征在于,包括:
样本数据获取模块,用于从医学辅助诊断系统中获取风险评估样本数据,并对风险评估样本数据标注标签,所述标签包括风险种类、风险评估等级;
风险种类预测模型搭建模块,用于搭建风险种类预测模型,风险种类预测模型包括LSTM网络、CNN卷积网络以及注意力双向RNN网络;
风险种类预测模型训练模块,用于利用样本数据获取模块获取的样本数据输入风险种类预测模型搭建模块搭建的风险种类预测模型,对风险种类预测模型进行训练;
实时预测模块,用于获取医学辅助诊断系统中待预测的实时数据,将实时数据输入训练好的风险种类预测模型,得到预测结果;
其中,在风险种类预测模型训练模块进行训练时,采用BP反馈传播算法进行梯度回传,使用平均绝对误差MAE区分风险种类,使用均方根误差RMSE对风险评估等级回归学习,每一次迭代学习之后,比较两类误差大小;如果当前误差小于上一次迭代的误差,就保存当前模型,然后继续训练,直到达到最大迭代次数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310143517.5A CN115831339B (zh) | 2023-02-21 | 2023-02-21 | 基于深度学习的医疗系统风险管控事前预测方法、系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310143517.5A CN115831339B (zh) | 2023-02-21 | 2023-02-21 | 基于深度学习的医疗系统风险管控事前预测方法、系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115831339A true CN115831339A (zh) | 2023-03-21 |
CN115831339B CN115831339B (zh) | 2023-04-28 |
Family
ID=85521955
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310143517.5A Active CN115831339B (zh) | 2023-02-21 | 2023-02-21 | 基于深度学习的医疗系统风险管控事前预测方法、系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115831339B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA3000166A1 (en) * | 2017-04-03 | 2018-10-03 | Royal Bank Of Canada | Systems and methods for cyberbot network detection |
CN109214191A (zh) * | 2018-09-18 | 2019-01-15 | 北京理工大学 | 一种利用深度学习预测软件安全漏洞的方法 |
CN109754852A (zh) * | 2019-01-08 | 2019-05-14 | 中南大学 | 基于电子病历的心血管疾病风险预测方法 |
CN110415791A (zh) * | 2019-01-29 | 2019-11-05 | 四川大学华西医院 | 一种病种库建立系统及方法 |
CN111401062A (zh) * | 2020-03-25 | 2020-07-10 | 支付宝(杭州)信息技术有限公司 | 文本的风险识别方法、装置及设备 |
CN111818093A (zh) * | 2020-08-28 | 2020-10-23 | 支付宝(杭州)信息技术有限公司 | 用于进行风险评估的神经网络系统、方法及装置 |
CN112085384A (zh) * | 2020-09-08 | 2020-12-15 | 华侨大学 | 一种基于模糊推理与lstm结合的邮寄物风险评价方法与系统 |
CN112291098A (zh) * | 2020-10-30 | 2021-01-29 | 北京源堡科技有限公司 | 一种网络安全风险预测方法及其相关装置 |
CN115579141A (zh) * | 2022-10-21 | 2023-01-06 | 浙江工业大学 | 一种可解释疾病风险预测模型构建方法以及疾病风险预测装置 |
-
2023
- 2023-02-21 CN CN202310143517.5A patent/CN115831339B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA3000166A1 (en) * | 2017-04-03 | 2018-10-03 | Royal Bank Of Canada | Systems and methods for cyberbot network detection |
CN109214191A (zh) * | 2018-09-18 | 2019-01-15 | 北京理工大学 | 一种利用深度学习预测软件安全漏洞的方法 |
CN109754852A (zh) * | 2019-01-08 | 2019-05-14 | 中南大学 | 基于电子病历的心血管疾病风险预测方法 |
CN110415791A (zh) * | 2019-01-29 | 2019-11-05 | 四川大学华西医院 | 一种病种库建立系统及方法 |
CN111401062A (zh) * | 2020-03-25 | 2020-07-10 | 支付宝(杭州)信息技术有限公司 | 文本的风险识别方法、装置及设备 |
CN111818093A (zh) * | 2020-08-28 | 2020-10-23 | 支付宝(杭州)信息技术有限公司 | 用于进行风险评估的神经网络系统、方法及装置 |
CN112085384A (zh) * | 2020-09-08 | 2020-12-15 | 华侨大学 | 一种基于模糊推理与lstm结合的邮寄物风险评价方法与系统 |
CN112291098A (zh) * | 2020-10-30 | 2021-01-29 | 北京源堡科技有限公司 | 一种网络安全风险预测方法及其相关装置 |
CN115579141A (zh) * | 2022-10-21 | 2023-01-06 | 浙江工业大学 | 一种可解释疾病风险预测模型构建方法以及疾病风险预测装置 |
Non-Patent Citations (6)
Title |
---|
RUI SHI等: "Group visualization of class-discriminative features" * |
ZHUANGWEI SHI等: "Attention-based CNN-LSTM and XGBoost hybrid model for stock prediction" * |
曹鲁喆: "基于深度学习的校园网络安全态势要素提取与评估方法研究" * |
章毅: "对新常态下银行票据风险防控的现实思考" * |
胡莹莹: "基于深度学习的网络安全态势要素提 取方法研究" * |
陈静: "基于GA-CNN-LSTM模型的设备异常检测研究" * |
Also Published As
Publication number | Publication date |
---|---|
CN115831339B (zh) | 2023-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11487941B2 (en) | Techniques for determining categorized text | |
CN111178456B (zh) | 异常指标检测方法、装置、计算机设备和存储介质 | |
Buzau et al. | Hybrid deep neural networks for detection of non-technical losses in electricity smart meters | |
US11194691B2 (en) | Anomaly detection using deep learning models | |
US20200382536A1 (en) | Anomaly detection in cybersecurity and fraud applications | |
CN113011973B (zh) | 基于智能合约数据湖的金融交易监管模型的方法及设备 | |
Bello et al. | Machine Learning Approaches for Enhancing Fraud Prevention in Financial Transactions | |
CN112910859B (zh) | 基于c5.0决策树和时序分析的物联网设备监测预警方法 | |
Yiğit et al. | Automatic detection of power quality disturbance using convolutional neural network structure with gated recurrent unit | |
He et al. | MTAD‐TF: Multivariate Time Series Anomaly Detection Using the Combination of Temporal Pattern and Feature Pattern | |
Dou et al. | Pc 2 a: predicting collective contextual anomalies via lstm with deep generative model | |
Raviprasad et al. | Accuracy determination using deep learning technique in cloud-based IoT sensor environment | |
Jiménez et al. | Machine learning and neural network for maintenance management | |
CN117094184B (zh) | 基于内网平台的风险预测模型的建模方法、系统及介质 | |
CN115296933B (zh) | 一种工业生产数据风险等级评估方法及系统 | |
CN113837481B (zh) | 一种基于区块链的金融大数据管理系统 | |
Ayodeji et al. | An empirical evaluation of attention-based multi-head models for improved turbofan engine remaining useful life prediction | |
Zhang et al. | Biometric Authentication and Correlation Analysis Based on CNN‐SRU Hybrid Neural Network Model | |
CN113935413A (zh) | 一种基于卷积神经网的配网录波文件波形识别方法 | |
Haroon et al. | Application of machine learning in forensic science | |
Wen et al. | A network security situation awareness method based on gru in big data environment | |
Dang et al. | seq2graph: discovering dynamic dependencies from multivariate time series with multi-level attention | |
Sebastian et al. | A comparative analysis of deep neural network models in IoT‐based smart systems for energy prediction and theft detection | |
Xiong et al. | L-RBF: A customer churn prediction model based on lasso+ RBF | |
CN115831339B (zh) | 基于深度学习的医疗系统风险管控事前预测方法、系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |