CN115359870B - 一种基于层次图神经网络的疾病诊疗过程异常识别系统 - Google Patents
一种基于层次图神经网络的疾病诊疗过程异常识别系统 Download PDFInfo
- Publication number
- CN115359870B CN115359870B CN202211287887.8A CN202211287887A CN115359870B CN 115359870 B CN115359870 B CN 115359870B CN 202211287887 A CN202211287887 A CN 202211287887A CN 115359870 B CN115359870 B CN 115359870B
- Authority
- CN
- China
- Prior art keywords
- diagnosis
- treatment
- node
- nodes
- event
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 291
- 238000000034 method Methods 0.000 title claims abstract description 88
- 230000008569 process Effects 0.000 title claims abstract description 62
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 39
- 201000010099 disease Diseases 0.000 title claims abstract description 18
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 18
- 238000012549 training Methods 0.000 claims abstract description 52
- 238000003062 neural network model Methods 0.000 claims abstract description 18
- 238000010586 diagram Methods 0.000 claims abstract description 16
- 239000013598 vector Substances 0.000 claims description 120
- 230000002159 abnormal effect Effects 0.000 claims description 47
- 239000011159 matrix material Substances 0.000 claims description 30
- 238000004364 calculation method Methods 0.000 claims description 15
- 238000010276 construction Methods 0.000 claims description 14
- 230000015654 memory Effects 0.000 claims description 13
- 230000006403 short-term memory Effects 0.000 claims description 12
- 238000007781 pre-processing Methods 0.000 claims description 10
- 230000005856 abnormality Effects 0.000 claims description 9
- 230000007787 long-term memory Effects 0.000 claims description 9
- 230000003213 activating effect Effects 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 abstract description 3
- 238000011002 quantification Methods 0.000 abstract description 3
- 238000004458 analytical method Methods 0.000 abstract description 2
- 230000004927 fusion Effects 0.000 abstract description 2
- 239000010410 layer Substances 0.000 description 26
- 230000006870 function Effects 0.000 description 10
- 230000004913 activation Effects 0.000 description 8
- 230000006399 behavior Effects 0.000 description 4
- 229940079593 drug Drugs 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 238000009533 lab test Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000003759 clinical diagnosis Methods 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Pathology (AREA)
- Biophysics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本发明公开了一种基于层次图神经网络的疾病诊疗过程异常识别系统,包括数据采集模块、数据预处理模块、层次图神经网络构建模块、诊疗过程异常评分计算模块和诊疗过程异常识别应用模块。本发明提出层次图神经网络模型构建和训练方法,对复杂的纵向电子病历数据进行建模分析,实现对时序信息和共现信息的融合利用;本发明将疾病诊疗过程异常分为诊疗事件异常、就诊异常和患者异常三个层次,由低层次、细粒度的诊疗事件层次到高层次、粗粒度的患者层次,设计诊疗过程异常的分层量化和综合评价方法,并给出诊疗过程异常的分类方法,精确定位异常具体发生在哪次就诊哪个诊疗步骤。
Description
技术领域
本发明属于医疗健康信息技术领域,具体涉及一种基于层次图神经网络的疾病诊疗过程异常识别系统。
背景技术
在临床诊疗过程中,即使是具有相同诊断的患者,也会具有不同的临床表现和疾病发展轨迹。患者异质性会导致相同诊断的患者具有差异巨大的诊疗过程。此外,医护人员对临床指南要求的诊疗方案和干预措施掌握不足、对临床指南的依从性不足,以及涉及诊疗过程的医疗费用和医保报销等原因,在导致诊疗过程差异的同时,也会引入不正确的或者不合规的医疗行为,导致患者的治疗效果下降和医疗费用增加等问题。因此,在真实医疗场景中,在差异巨大的诊疗过程中识别出异常的诊疗行为,有助于辅助医护人员根据患者的病情变化做出及时的、正确的诊疗方案调整,提高诊疗质量,改善治疗预后;有助于规范诊疗行为,控制医保费用。
现有的诊疗过程异常识别方案主要有:(1)基于高斯分布的方法:基于数据遵循高斯分布的假设,对诊疗行为的样本值作频率分布图,将在平均值加减3倍标准差以外的样本标记为异常数据。这种方法需要数据本身具备正态性,且均值和方差本身都对异常值很敏感,很容易受到影响。此外,该方法只能处理单一就诊事件,不能同时利用多种诊疗数据,并且忽略了纵向电子病历的时序信息。(2)基于主题模型的方法:将电子病历数据以就诊为单位进行划分,用主题模型挖掘每次就诊的主题,以此得到给定主题特定诊疗事件出现的概率,以及给定就诊特定主题出现的概率。概率相乘可以得到给定就诊特定诊疗事件出现的概率,根据此概率判断诊疗事件是否异常。该方法忽视了诊疗过程时间维度的信息,诊疗事件之间有时间先后顺序,就诊之间也有时间先后顺序。(3)基于贝叶斯网络的方法:将每个诊疗事件作为一个节点,通过构建贝叶斯网络对每个节点进行异常识别并给出异常评分值。在进行异常检测后,每个节点的异常评分值都综合了当前时刻和过去时刻的信息。该方法中的节点异常初始评分依赖于专家标注,主观性大,且获取成本高。此外,该方法无法利用不同就诊事件之间的时序信息。
电子病历数据复杂,不仅包含人口统计学、生物标志物和临床特征等多维数据,且具有复杂的纵向时序信息,患者有多次就诊信息,不同时间有不同的诊疗事件。现有方法难以处理复杂的纵向电子病历数据,无法利用不同就诊数据之间的关系。此外,在临床诊疗过程中,除了很大程度上偏离正常诊疗过程的异常患者,异常也可以表现为单次就诊事件异常,或者是就诊过程中的单个诊疗事件异常。仅根据单次诊疗事件的出现与否和出现先后顺序无法直接判断该诊疗事件是否有异常,需要将该诊疗事件放到患者的该次就诊事件,甚至患者的所有诊疗记录中进行综合判断。
发明内容
针对现有技术的不足,本发明提出一种基于层次图神经网络的疾病诊疗过程异常识别系统。
本发明的目的是通过以下技术方案实现的:一种基于层次图神经网络的疾病诊疗过程异常识别系统,包括:
(1)数据采集模块:用于采集患者的基本信息和患者诊疗数据;
(2)数据预处理模块:对数据采集模块采集的数据进行预处理,构建诊疗事件集合、就诊集合和患者集合;
(3)层次图神经网络构建模块,包括以下子模块:
诊疗过程层次网络构建子模块:用于构建包含诊疗事件、就诊、患者三个层次的诊疗过程层次网络;
节点初始向量表示获取子模块:采用分层表示学习方法获取诊疗事件节点、就诊节点和患者节点的初始向量表示;
模型构建与训练子模块:基于各层次节点初始向量表示构建层次图神经网络模型,利用图注意力机制进行多个层次的综合训练;
(4)诊疗过程异常评分计算模块:根据层次图神经网络训练结果分层次计算异常值,逐层识别诊疗过程异常;
(5)诊疗过程异常识别应用模块:将患者结构化数据进行预处理后分为诊疗事件节点、就诊节点和患者节点,计算不同节点的初始向量表示,利用层次图神经网络模型得到训练后的节点向量表示,并结合节点初始向量表示计算各层次节点异常值,从而找出异常节点。
进一步地,所述诊疗过程层次网络构建子模块中,将诊疗事件集合、就诊集合与患者集合构成节点集合;每一次就诊与当次就诊中发生的所有诊疗事件相连构成诊疗事件就诊边集合,每一个患者与该患者的所有就诊相连构成就诊患者边集合,将诊疗事件就诊边集合与就诊患者边集合构成边集合;所述节点集合和所述边集合共同构成诊疗过程层次网络。
进一步地,所述节点初始向量表示获取子模块中,将每次就诊中的诊疗事件按时间排列,利用词袋模型进行训练,获得诊疗事件节点初始向量表示;依次用诊疗事件长短期记忆自编码器模型和就诊长短期记忆自编码器模型获得就诊节点初始向量表示和患者节点初始向量表示。
进一步地,所述诊疗事件节点初始向量表示,通过对诊疗事件节点进行独热编码,利用词袋模型对诊疗事件节点的独热编码结果进行训练获得,具体为:
获得诊疗事件节点的独热编码;以就诊为单位按时间顺序排列诊疗事件节点生成诊疗事件序列;观察窗口长度为L,按顺序每一个诊疗事件节点的前、后各L个诊疗事件节点作为词袋模型的输入节点,每个输入节点都乘以输入权重矩阵并加和得到隐层向量;隐层向量乘以输出权重矩阵,再用softmax激活处理后得到诊疗事件节点的预测值;
用诊疗事件节点的重构损失进行训练,得到词袋模型的输入权重矩阵;训练结束后,将诊疗事件节点的独热编码和输入权重矩阵相乘得到诊疗事件节点初始向量表示。
进一步地,所述就诊节点初始向量表示的获取具体为:以就诊为单位按时间顺序排列诊疗事件节点生成诊疗事件序列,构建诊疗事件长短期记忆自编码器模型,输入诊疗事件序列,用诊疗事件节点的重构损失进行训练,训练完成后,用诊疗事件长短期记忆自编码器模型的编码器将诊疗事件序列编码成固定长度的向量,得到就诊节点初始向量表示。
进一步地,所述患者节点初始向量表示的获取具体为:以患者为单位按时间顺序排列就诊节点生成就诊序列,构建就诊长短期记忆自编码器模型,输入就诊序列,用就诊节点的重构损失进行训练,训练完成后,用就诊长短期记忆自编码器模型的编码器将就诊序列编码成固定长度的向量,得到患者节点初始向量表示。
进一步地,所述模型构建与训练子模块中,利用L2范数计算经过层次图神经网络后的节点向量表示与初始向量表示的图节点重构损失;利用交叉熵计算图关系重构损失;利用图节点重构损失和图关系重构损失对层次图神经网络模型进行训练。
进一步地,所述层次图神经网络模型的训练过程中,将节点初始向量表示和节点邻接矩阵输入层次图神经网络,所述层次图神经网络具有若干层图注意力层;对于某节点,每一层图注意力层逐个计算其邻居节点和其自身之间的相似系数,通过相似系数计算该层注意力系数,利用该层注意力系数对该节点在该层的节点向量表示进行更新,该节点经过所有层图注意力训练后,得到该节点对应的节点向量表示。
进一步地,所述诊疗过程异常评分计算模块中,对于某次就诊,计算诊疗事件集合中每个诊疗事件与该次就诊的内积,激活后得到每个诊疗事件出现概率,即为诊疗事件异常值;
定义下限阈值和上限阈值,并且定义两种诊疗事件异常判断方式:如果诊疗事件异常值小于下限阈值,并且该诊疗事件在该次就诊中出现了,则为意外事件;如果诊疗事件异常值大于上限阈值,并且该诊疗事件在该次就诊中没有出现,则为消失事件。
进一步地,所述诊疗过程异常评分计算模块中,从根据层次图神经网络重构后的节点邻接矩阵中提取重构的诊疗事件与就诊的连接关系,构建重构诊疗事件就诊邻接矩阵;同时提取重构的就诊与患者的连接关系,构建重构就诊患者邻接矩阵;根据原始及重构诊疗事件就诊邻接矩阵、原始及重构就诊患者邻接矩阵、节点初始向量表示以及训练后的节点向量表示,计算就诊节点异常值和患者节点异常值,并分别与各自异常值阈值相比较,从而判断是否为异常节点。
本发明的有益效果是:本发明提出层次图神经网络模型构建和训练方法,对复杂的纵向电子病历数据进行建模分析,实现对时序信息和共现信息的融合利用;本发明将疾病诊疗过程异常分为诊疗事件异常、就诊异常和患者异常三个层次,由低层次、细粒度的诊疗事件层次到高层次、粗粒度的患者层次,设计诊疗过程异常的分层量化和综合评价方法,并给出诊疗过程异常的分类方法,精确定位异常具体发生在哪次就诊哪个诊疗步骤。
附图说明
图1为本发明实施例提供的疾病诊疗过程异常识别系统结构图;
图2为本发明实施例提供的诊疗过程层次网络结构图;
图3为本发明实施例提供的词袋模型CBOW结构图;
图4为本发明实施例提供的诊疗事件长短期记忆自编码器结构图;
图5为本发明实施例提供的层次图神经网络模型结构图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其它不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
本发明实施例提供一种基于层次图神经网络的疾病诊疗过程异常识别系统,如图1所示,该系统包括数据采集模块、数据预处理模块、层次图神经网络构建模块、诊疗过程异常评分计算模块和诊疗过程异常识别应用模块。每个模块的具体功能如下:
一、数据采集模块:用于采集患者的基本信息和患者诊疗数据,患者诊疗数据包括患者就诊信息以及诊断、实验室检验、医学检查、手术和用药数据。
二、数据预处理模块:对数据采集模块采集的数据进行预处理。实验室检验数据根据正常参考范围,将实验室检验的结果分为偏低、偏高和正常三种结果类别,保留实验室检验名称、结果类别;医学检查、手术数据用简单的自然语言处理技术处理,保留检查部位、类别和手术名称。得到诊断集合、检验集合、手术集合和用药集合,将所述诊断集合、检验集合、手术集合和用药集合合并构成诊疗事件集合,诊疗事件集合中的元素称为诊疗事件;将患者就诊信息构成就诊集合;患者构成患者集合。
三、层次图神经网络构建模块,包括诊疗过程层次网络构建子模块、节点初始向量表示获取子模块、模型构建与训练子模块,下面详细阐述每个子模块的实现过程。
(1)诊疗过程层次网络构建子模块
如图2所示,构建包含诊疗事件、就诊、患者三个层次的诊疗过程层次网络。诊疗事
件集合为,就诊集合为,患者集合为,其中分别表示诊疗事件数量、就诊数量和患者数量。
诊疗事件集合、就诊集合与患者集合一起构成节点集合,节点个数。
每一次就诊与当次就诊中发生的所有诊疗事件相连构成诊疗事件就诊边集合;每一个患者与该患者的所有就诊相连构成就诊患者边集
合。诊疗事件就诊边集合与就诊患者边集合一起构成边集合。节点集合N与边集合S共同构成了诊疗过程层次网络。
(2)节点初始向量表示获取子模块
将电子病历中每次就诊中的诊疗事件按照时间顺序排列,利用词袋模型CBOW进行训练,获得诊疗事件节点初始向量表示。将诊疗事件节点初始向量表示输入诊疗事件长短期记忆自编码器模型,用诊疗事件节点的重构损失进行训练,获得就诊节点初始向量表示。将就诊节点初始向量表示输入就诊长短期记忆自编码器模型,用就诊节点的重构损失进行训练,获得患者节点初始向量表示。具体地:
首先对所有诊疗事件节点进行独热编码,然后用词袋模型CBOW对诊疗事件节点的
独热编码结果进行训练。如图3所示,诊疗事件节点的独热编码结果为一个长度是的
向量,记为。以就诊为单位,将每次就诊中的诊疗事件节点按照就诊时间顺序排列成一个
诊疗事件序列。观察窗口长度为L,按顺序每一个诊疗事件节点的前L个诊疗事件节点和后L
个诊疗事件节点作为输入节点,诊疗事件节点前或后不足L个诊疗事件节点的则用0向量填
充缺少的诊疗事件节点,每个输入节点都乘以输入权重矩阵W并加和得到隐层向量H:
其中,为中第j维的取值,为中第j维的取值。用Adam优化器反向传播进
行词袋模型训练,得到词袋模型的权重矩阵W。尝试观察窗口长度2、3、5选取训练效果较好
的词袋模型。训练结束后,诊疗事件节点的初始向量表示通过诊疗事件节点的独热编
码和输入权重矩阵W得到,计算公式为:
获得所有诊疗事件节点初始向量表示后,将诊疗事件节点以就诊为单位按时间
顺序排列为诊疗事件序列,T是该次就诊中诊疗事件的数量,其中
诊疗事件节点的初始向量表示即为。如图4所示,构建诊疗事件长短期记忆自编码器
模型,输入诊疗事件序列进行训练。诊疗事件长短期记忆自编码器模型分为编码器和解码器两个部分,通过潜在向量C相连,每个部分都由长短期记忆单元
LSTM组成。编码器和解码器中长短期记忆单元数量相同,通过改变单元的数量支持不同长
度的诊疗事件输入序列和诊疗事件输出序列。将诊疗事件序列输入编码器后得到一个潜在
向量C,然后将潜在向量C作为解码器的输入,对潜在向量C进行解码,逐步输出重构的诊疗
事件序列,用诊疗事件节点的重构损失对诊疗事件长短期记忆
自编码器模型进行训练。
其中,是L2范数,是诊疗事件节点的初始向量表示。训练完成后,用编
码器部分对原诊疗事件序列进行编码,得到的潜在向量C是长度和一样的向量,将该向
量作为该诊疗事件序列所代表的就诊节点初始向量表示。得到就诊节点初始向量表示后,按照就诊节点初始向量表示的获取方法,来获取患者节点初始向量表示。以患者为单
位按时间顺序排列患者的就诊生成就诊序列,构建就诊长短期记忆自编码器模型,用就诊
节点的重构损失进行训练。训练完成后,用编码器将就诊序列编码成固定长度的向量,得到
患者节点初始向量表示。
至此,得到诊疗事件节点、就诊节点和患者节点的初始向量表示。
(3)模型构建与训练子模块
基于各层次节点初始向量表示构建层次图神经网络模型,利用图注意力机制进行训练。利用L2范数计算经过层次图神经网络后的节点向量表示与初始向量表示的图节点重构损失;利用交叉熵计算图关系重构损失。用两个部分的重构损失对层次图神经网络模型进行训练。
第一步,构建层次图神经网络,如图5所示。层次图神经网络中的节点初始向量表
示由诊疗事件节点初始向量表示、就诊节点初始向量表示和患者节点初始向量表示组成,
节点初始向量表示,是对向量进行拼接。根据诊疗事件就诊边集合构建诊疗事件就诊邻接矩阵;根据就诊患者边集合构建就诊患者邻接矩阵;
根据边集合S构建层次图神经网络中的节点邻接矩阵A,节点邻接矩阵A的信息由诊疗事件
就诊邻接矩阵和就诊患者邻接矩阵中的信息组成。层次图神经网络由M层图注意力
层和重构损失两部分组成。
第二步,训练层次图神经网络。将节点初始向量表示B和节点邻接矩阵A输入层次
图神经网络,用图注意力机制对节点初始向量表示进行更新。对于节点的初始向量表示,在第m层图注意力层的节点向量表示为。对于节点以及其邻居节点,每一层
图注意力层逐个计算邻居节点和其自身之间的相似系数:
其中,是激活函数,是节点在第m层的节点向量表示。节点经过M层图
注意力训练后,得到节点向量表示。对所有节点都进行M层图注意力训练,得到总体节点
向量表示,由更新后的诊疗事件节点向量表示、就诊节点向量表示和患者节点
向量表示构成,。
第三步,根据图节点重构损失和图关系重构损失构建层次图神经网络模型的总体损失函数。总体损失函数L为:
四、诊疗过程异常评分计算模块
根据层次图神经网络训练结果分层次计算异常值,逐层识别诊疗过程异常。根据相邻节点之间的关系计算异常值,并根据异常值判断节点是否异常。
定义下限阈值和上限阈值,和的取值根据实验进行设置,或者根
据经验将其设为,,并且定义两种诊疗事件异常判断方式,意外事
件:,并且在就诊中出现了,即该诊疗事件发生率很低,但是事件发生了;消
失事件:,并且在就诊中没有出现,即该诊疗事件发生率很高,但是事件没
有发生。
其中,是sigmoid激活函数,、是和的连接关系分别在中对应的值,是和的连接关系分别在中对应的值,是就诊中诊疗事件的数量,是患者的就诊数量,是调整不同损
失项重要性的超参数。对于就诊节点,当节点异常值大于设定的异常值阈值时,即判断该
节点为异常。对于患者节点,当节点异常值大于设定的异常值阈值时,即判断该节点为异
常。和分别为就诊节点和患者节点的异常值阈值,其取值根据实验进行设置。
五、诊疗过程异常识别应用模块
将患者结构化数据进行预处理后分为诊疗事件节点、就诊节点和患者节点,诊疗事件节点进行独热编码后输入训练好的词袋模型,得到诊疗事件节点初始向量表示。将诊疗事件节点初始向量表示输入训练好的诊疗事件长短期记忆自编码器模型中的编码器,获得就诊节点初始向量表示。同样将就诊节点初始向量表示输入训练好的就诊长短期记忆自编码器模型的编码器,获得患者节点初始向量表示。
将各节点输入层次图神经网络模型,得到更新后的诊疗事件向量表示、就诊向量表示和患者向量表示。用更新后的向量表示和更新前的向量表示计算各层次节点异常值,与阈值相比较,找出异常的节点。
本发明采用分层表示学习方法获取诊疗事件节点、就诊节点和患者节点的初始向量表示。先用词袋模型获得诊疗事件节点的初始向量表示。然后依次用诊疗事件长短期记忆自编码器模型和就诊长短期记忆自编码器模型获得就诊节点初始向量表示和患者节点初始向量表示。不仅保留了诊疗事件和就诊的时序信息,且各层次向量表示都包含上一层的信息。
本发明提出层次图神经网络模型,模型包含诊疗事件、就诊、患者三个层次的信息以及层次之间的互相关系,通过图注意力机制以及四个重构损失对层次图神经网络进行多个层次的综合训练。
本发明基于层次图神经网络模型,将疾病诊疗过程异常分为诊疗事件异常、就诊异常和患者异常三个层次的异常,设计诊疗过程异常的分层量化和综合评价方法。每个层次的节点都根据相邻的节点之间的关系计算异常值,并给出诊疗事件异常的分类方法,精确定位异常具体发生在哪次就诊哪个诊疗步骤。
以上所述仅是本发明的优选实施方式,虽然本发明已以较佳实施例披露如上,然而并非用以限定本发明。任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何的简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。
Claims (6)
1.一种基于层次图神经网络的疾病诊疗过程异常识别系统,其特征在于,包括:
(1)数据采集模块:用于采集患者的基本信息和患者诊疗数据;
(2)数据预处理模块:对数据采集模块采集的数据进行预处理,构建诊疗事件集合、就诊集合和患者集合;
(3)层次图神经网络构建模块,包括以下子模块:
诊疗过程层次网络构建子模块:用于构建包含诊疗事件、就诊、患者三个层次的诊疗过程层次网络,具体为,将诊疗事件集合、就诊集合与患者集合构成节点集合;每一次就诊与当次就诊中发生的所有诊疗事件相连构成诊疗事件就诊边集合,每一个患者与该患者的所有就诊相连构成就诊患者边集合,将诊疗事件就诊边集合与就诊患者边集合构成边集合;所述节点集合和所述边集合共同构成诊疗过程层次网络;
节点初始向量表示获取子模块:采用分层表示学习方法获取诊疗事件节点、就诊节点和患者节点的初始向量表示,具体为,将电子病历中每次就诊中的诊疗事件按时间排列,利用词袋模型进行训练,获得诊疗事件节点初始向量表示;依次用诊疗事件长短期记忆自编码器模型和就诊长短期记忆自编码器模型获得就诊节点初始向量表示和患者节点初始向量表示;
模型构建与训练子模块:基于各层次节点初始向量表示构建层次图神经网络模型,利用图注意力机制进行多个层次的综合训练;
(4)诊疗过程异常评分计算模块:根据层次图神经网络训练结果分层次计算异常值,逐层识别诊疗过程异常,具体为:
对于某次就诊,计算诊疗事件集合中每个诊疗事件与该次就诊的内积,激活后得到每个诊疗事件出现概率,即为诊疗事件异常值;
定义下限阈值和上限阈值,并且定义两种诊疗事件异常判断方式:如果诊疗事件异常值小于下限阈值,并且该诊疗事件在该次就诊中出现了,则为意外事件;如果诊疗事件异常值大于上限阈值,并且该诊疗事件在该次就诊中没有出现,则为消失事件;
从根据层次图神经网络重构后的节点邻接矩阵中提取重构的诊疗事件与就诊的连接关系,构建重构诊疗事件就诊邻接矩阵;同时提取重构的就诊与患者的连接关系,构建重构就诊患者邻接矩阵;根据原始及重构诊疗事件就诊邻接矩阵、原始及重构就诊患者邻接矩阵、节点初始向量表示以及训练后的节点向量表示,计算就诊节点异常值和患者节点异常值,并分别与各自异常值阈值相比较,从而判断是否为异常节点;
(5)诊疗过程异常识别应用模块:将患者结构化数据进行预处理后分为诊疗事件节点、就诊节点和患者节点,计算不同节点的初始向量表示,利用层次图神经网络模型得到训练后的节点向量表示,并结合节点初始向量表示计算各层次节点异常值,从而找出异常节点。
2.根据权利要求1所述的一种基于层次图神经网络的疾病诊疗过程异常识别系统,其特征在于,所述诊疗事件节点初始向量表示,通过对诊疗事件节点进行独热编码,利用词袋模型对诊疗事件节点的独热编码结果进行训练获得,具体为:
获得诊疗事件节点的独热编码;以就诊为单位按时间顺序排列诊疗事件节点生成诊疗事件序列;观察窗口长度为L,按顺序每一个诊疗事件节点的前、后各L个诊疗事件节点作为词袋模型的输入节点,每个输入节点都乘以输入权重矩阵并加和得到隐层向量;隐层向量乘以输出权重矩阵,再用softmax激活处理后得到诊疗事件节点的预测值;
用诊疗事件节点的重构损失进行训练,得到词袋模型的输入权重矩阵;训练结束后,将诊疗事件节点的独热编码和输入权重矩阵相乘得到诊疗事件节点初始向量表示。
3.根据权利要求1所述的一种基于层次图神经网络的疾病诊疗过程异常识别系统,其特征在于,所述就诊节点初始向量表示的获取具体为:以就诊为单位按时间顺序排列诊疗事件节点生成诊疗事件序列,构建诊疗事件长短期记忆自编码器模型,输入诊疗事件序列,用诊疗事件节点的重构损失进行训练,训练完成后,用诊疗事件长短期记忆自编码器模型的编码器将诊疗事件序列编码成固定长度的向量,得到就诊节点初始向量表示。
4.根据权利要求1所述的一种基于层次图神经网络的疾病诊疗过程异常识别系统,其特征在于,所述患者节点初始向量表示的获取具体为:以患者为单位按时间顺序排列就诊节点生成就诊序列,构建就诊长短期记忆自编码器模型,输入就诊序列,用就诊节点的重构损失进行训练,训练完成后,用就诊长短期记忆自编码器模型的编码器将就诊序列编码成固定长度的向量,得到患者节点初始向量表示。
5.根据权利要求1所述的一种基于层次图神经网络的疾病诊疗过程异常识别系统,其特征在于,所述模型构建与训练子模块中,利用L2范数计算经过层次图神经网络后的节点向量表示与初始向量表示的图节点重构损失;利用交叉熵计算图关系重构损失;利用图节点重构损失和图关系重构损失对层次图神经网络模型进行训练。
6.根据权利要求5所述的一种基于层次图神经网络的疾病诊疗过程异常识别系统,其特征在于,所述层次图神经网络模型的训练过程中,将节点初始向量表示和节点邻接矩阵输入层次图神经网络,所述层次图神经网络具有若干层图注意力层;对于某节点,每一层图注意力层逐个计算其邻居节点和其自身之间的相似系数,通过相似系数计算该层的注意力系数,利用该层的注意力系数对该节点在该层的节点向量表示进行更新,该节点经过所有层图注意力训练后,得到该节点对应的节点向量表示。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211287887.8A CN115359870B (zh) | 2022-10-20 | 2022-10-20 | 一种基于层次图神经网络的疾病诊疗过程异常识别系统 |
JP2023095902A JP7365747B1 (ja) | 2022-10-20 | 2023-06-09 | 階層図ニューラルネットワークに基づく疾患診療過程異常識別システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211287887.8A CN115359870B (zh) | 2022-10-20 | 2022-10-20 | 一种基于层次图神经网络的疾病诊疗过程异常识别系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115359870A CN115359870A (zh) | 2022-11-18 |
CN115359870B true CN115359870B (zh) | 2023-03-24 |
Family
ID=84008912
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211287887.8A Active CN115359870B (zh) | 2022-10-20 | 2022-10-20 | 一种基于层次图神经网络的疾病诊疗过程异常识别系统 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7365747B1 (zh) |
CN (1) | CN115359870B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116759041B (zh) * | 2023-08-22 | 2023-12-22 | 之江实验室 | 一种考虑诊疗事件关系的医疗时序数据生成方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109659033A (zh) * | 2018-12-18 | 2019-04-19 | 浙江大学 | 一种基于循环神经网络的慢性疾病病情变化事件预测装置 |
CN111667917A (zh) * | 2020-06-10 | 2020-09-15 | 北京小白世纪网络科技有限公司 | 一种基于神经网络实现中医诊疗的方法、系统及设备 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101977645B1 (ko) * | 2017-08-25 | 2019-06-12 | 주식회사 메디웨일 | 안구영상 분석방법 |
CN109659035A (zh) | 2018-12-13 | 2019-04-19 | 平安医疗健康管理股份有限公司 | 基于机器学习的就诊数据异常识别方法、设备及存储介质 |
CN111754476B (zh) * | 2019-06-19 | 2024-07-19 | 科亚医疗科技股份有限公司 | 用于解剖树结构的疾病量化建模的方法及系统 |
CN110909867A (zh) * | 2019-11-26 | 2020-03-24 | 南通恒趣新材料有限公司 | 一种基于力导图的图神经网络可视分析方法 |
CN111370084B (zh) * | 2020-02-07 | 2023-10-03 | 山东师范大学 | 基于BiLSTM的电子健康记录表示学习方法及系统 |
CN111738335A (zh) * | 2020-06-23 | 2020-10-02 | 鲁东大学 | 一种基于神经网络的时间序列数据异常检测方法 |
CN113516226A (zh) * | 2021-05-18 | 2021-10-19 | 长沙理工大学 | 一种基于图神经网络的混合模型多元时序异常检测方法 |
CN113517076A (zh) * | 2021-07-30 | 2021-10-19 | 齐鲁工业大学 | 基于图神经网络与迁移学习的疾病病例数预测方法及系统 |
CN113990495B (zh) * | 2021-12-27 | 2022-04-29 | 之江实验室 | 一种基于图神经网络的疾病诊断预测系统 |
CN114564573A (zh) * | 2022-03-14 | 2022-05-31 | 天津大学 | 基于异构图神经网络的学术合作关系预测方法 |
CN114881115A (zh) * | 2022-04-02 | 2022-08-09 | 中国科学院计算技术研究所 | 一种基于图神经网络的多变量时间序列异常检测方法及系统 |
CN114496234B (zh) * | 2022-04-18 | 2022-07-19 | 浙江大学 | 一种基于认知图谱的全科患者个性化诊疗方案推荐系统 |
CN114783603A (zh) * | 2022-04-18 | 2022-07-22 | 北京交通大学 | 基于多源图神经网络融合的患病风险预测方法及系统 |
CN115185736B (zh) * | 2022-09-09 | 2023-01-31 | 南京航空航天大学 | 基于图卷积神经网络的微服务调用链异常检测方法及装置 |
-
2022
- 2022-10-20 CN CN202211287887.8A patent/CN115359870B/zh active Active
-
2023
- 2023-06-09 JP JP2023095902A patent/JP7365747B1/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109659033A (zh) * | 2018-12-18 | 2019-04-19 | 浙江大学 | 一种基于循环神经网络的慢性疾病病情变化事件预测装置 |
CN111667917A (zh) * | 2020-06-10 | 2020-09-15 | 北京小白世纪网络科技有限公司 | 一种基于神经网络实现中医诊疗的方法、系统及设备 |
Non-Patent Citations (1)
Title |
---|
浅析BP神经网络技术在医院信息系统中的应用;易焱琪等;《科技创新与生产力》;20170210(第02期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
JP7365747B1 (ja) | 2023-10-20 |
JP2024061599A (ja) | 2024-05-07 |
CN115359870A (zh) | 2022-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109659033B (zh) | 一种基于循环神经网络的慢性疾病病情变化事件预测装置 | |
JP7459386B2 (ja) | グラフニューラルネットワークに基づく疾患診断予測システム | |
CN113421652B (zh) | 对医疗数据进行分析的方法、训练模型的方法及分析仪 | |
CN109599177B (zh) | 一种基于病历的深度学习预测医疗轨迹的方法 | |
CN107392109A (zh) | 一种基于深度神经网络的新生儿疼痛表情识别方法 | |
CN112184658A (zh) | 用于非小细胞肺癌预后生存预测的方法、介质及电子设备 | |
CN109065171B (zh) | 基于集成学习的川崎病风险评估模型的构建方法及系统 | |
CN112884551B (zh) | 一种基于近邻用户和评论信息的商品推荐方法 | |
CN113744873A (zh) | 一种基于任务分解策略的发热待查辅助鉴别诊断系统 | |
CN115359870B (zh) | 一种基于层次图神经网络的疾病诊疗过程异常识别系统 | |
CN117034142B (zh) | 一种不平衡医疗数据缺失值填充方法及系统 | |
CN109166626B (zh) | 一种消化性溃疡病人的医疗指标缺失数据补全方法 | |
CN115579141A (zh) | 一种可解释疾病风险预测模型构建方法以及疾病风险预测装置 | |
CN114300081B (zh) | 基于电子病历多模态数据的预测设备、系统和存储介质 | |
US20220237883A1 (en) | Image processing method and apparatus and storage medium | |
CN113077901B (zh) | 一种电子病历分析装置和方法 | |
CN116959715B (zh) | 一种基于时序演进过程解释的疾病预后预测系统 | |
Sinra et al. | Automated Classification of COVID-19 Chest X-ray Images Using Ensemble Machine Learning Methods | |
CN116522070A (zh) | 一种机械零部件无监督智能故障诊断方法及系统 | |
CN116092668A (zh) | 一种融合多元异构数据的心衰患者再入院预测方法 | |
Subramanian et al. | Wearable Sensor-Based Monitoring and Classification Using Deep Learning For Personalized Healthcare | |
CN118570570B (zh) | 一种基于图像识别技术的中医舌象辨识系统及方法 | |
CN118230946B (zh) | 一种痛风病分期和预测系统、设备及介质 | |
CN114420300B (zh) | 中国老年认知损害预测模型 | |
Scientific | INTELLIGENT ALZHEIMER’S DISEASE PREDICTION USING EXPLAINABLE BOOSTING MACHINE |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |