CN115359870B - 一种基于层次图神经网络的疾病诊疗过程异常识别系统 - Google Patents

一种基于层次图神经网络的疾病诊疗过程异常识别系统 Download PDF

Info

Publication number
CN115359870B
CN115359870B CN202211287887.8A CN202211287887A CN115359870B CN 115359870 B CN115359870 B CN 115359870B CN 202211287887 A CN202211287887 A CN 202211287887A CN 115359870 B CN115359870 B CN 115359870B
Authority
CN
China
Prior art keywords
diagnosis
treatment
node
nodes
event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211287887.8A
Other languages
English (en)
Other versions
CN115359870A (zh
Inventor
李劲松
徐铭鸿
池胜强
田雨
周天舒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Lab
Original Assignee
Zhejiang Lab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Lab filed Critical Zhejiang Lab
Priority to CN202211287887.8A priority Critical patent/CN115359870B/zh
Publication of CN115359870A publication Critical patent/CN115359870A/zh
Application granted granted Critical
Publication of CN115359870B publication Critical patent/CN115359870B/zh
Priority to JP2023095902A priority patent/JP7365747B1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明公开了一种基于层次图神经网络的疾病诊疗过程异常识别系统,包括数据采集模块、数据预处理模块、层次图神经网络构建模块、诊疗过程异常评分计算模块和诊疗过程异常识别应用模块。本发明提出层次图神经网络模型构建和训练方法,对复杂的纵向电子病历数据进行建模分析,实现对时序信息和共现信息的融合利用;本发明将疾病诊疗过程异常分为诊疗事件异常、就诊异常和患者异常三个层次,由低层次、细粒度的诊疗事件层次到高层次、粗粒度的患者层次,设计诊疗过程异常的分层量化和综合评价方法,并给出诊疗过程异常的分类方法,精确定位异常具体发生在哪次就诊哪个诊疗步骤。

Description

一种基于层次图神经网络的疾病诊疗过程异常识别系统
技术领域
本发明属于医疗健康信息技术领域,具体涉及一种基于层次图神经网络的疾病诊疗过程异常识别系统。
背景技术
在临床诊疗过程中,即使是具有相同诊断的患者,也会具有不同的临床表现和疾病发展轨迹。患者异质性会导致相同诊断的患者具有差异巨大的诊疗过程。此外,医护人员对临床指南要求的诊疗方案和干预措施掌握不足、对临床指南的依从性不足,以及涉及诊疗过程的医疗费用和医保报销等原因,在导致诊疗过程差异的同时,也会引入不正确的或者不合规的医疗行为,导致患者的治疗效果下降和医疗费用增加等问题。因此,在真实医疗场景中,在差异巨大的诊疗过程中识别出异常的诊疗行为,有助于辅助医护人员根据患者的病情变化做出及时的、正确的诊疗方案调整,提高诊疗质量,改善治疗预后;有助于规范诊疗行为,控制医保费用。
现有的诊疗过程异常识别方案主要有:(1)基于高斯分布的方法:基于数据遵循高斯分布的假设,对诊疗行为的样本值作频率分布图,将在平均值加减3倍标准差以外的样本标记为异常数据。这种方法需要数据本身具备正态性,且均值和方差本身都对异常值很敏感,很容易受到影响。此外,该方法只能处理单一就诊事件,不能同时利用多种诊疗数据,并且忽略了纵向电子病历的时序信息。(2)基于主题模型的方法:将电子病历数据以就诊为单位进行划分,用主题模型挖掘每次就诊的主题,以此得到给定主题特定诊疗事件出现的概率,以及给定就诊特定主题出现的概率。概率相乘可以得到给定就诊特定诊疗事件出现的概率,根据此概率判断诊疗事件是否异常。该方法忽视了诊疗过程时间维度的信息,诊疗事件之间有时间先后顺序,就诊之间也有时间先后顺序。(3)基于贝叶斯网络的方法:将每个诊疗事件作为一个节点,通过构建贝叶斯网络对每个节点进行异常识别并给出异常评分值。在进行异常检测后,每个节点的异常评分值都综合了当前时刻和过去时刻的信息。该方法中的节点异常初始评分依赖于专家标注,主观性大,且获取成本高。此外,该方法无法利用不同就诊事件之间的时序信息。
电子病历数据复杂,不仅包含人口统计学、生物标志物和临床特征等多维数据,且具有复杂的纵向时序信息,患者有多次就诊信息,不同时间有不同的诊疗事件。现有方法难以处理复杂的纵向电子病历数据,无法利用不同就诊数据之间的关系。此外,在临床诊疗过程中,除了很大程度上偏离正常诊疗过程的异常患者,异常也可以表现为单次就诊事件异常,或者是就诊过程中的单个诊疗事件异常。仅根据单次诊疗事件的出现与否和出现先后顺序无法直接判断该诊疗事件是否有异常,需要将该诊疗事件放到患者的该次就诊事件,甚至患者的所有诊疗记录中进行综合判断。
发明内容
针对现有技术的不足,本发明提出一种基于层次图神经网络的疾病诊疗过程异常识别系统。
本发明的目的是通过以下技术方案实现的:一种基于层次图神经网络的疾病诊疗过程异常识别系统,包括:
(1)数据采集模块:用于采集患者的基本信息和患者诊疗数据;
(2)数据预处理模块:对数据采集模块采集的数据进行预处理,构建诊疗事件集合、就诊集合和患者集合;
(3)层次图神经网络构建模块,包括以下子模块:
诊疗过程层次网络构建子模块:用于构建包含诊疗事件、就诊、患者三个层次的诊疗过程层次网络;
节点初始向量表示获取子模块:采用分层表示学习方法获取诊疗事件节点、就诊节点和患者节点的初始向量表示;
模型构建与训练子模块:基于各层次节点初始向量表示构建层次图神经网络模型,利用图注意力机制进行多个层次的综合训练;
(4)诊疗过程异常评分计算模块:根据层次图神经网络训练结果分层次计算异常值,逐层识别诊疗过程异常;
(5)诊疗过程异常识别应用模块:将患者结构化数据进行预处理后分为诊疗事件节点、就诊节点和患者节点,计算不同节点的初始向量表示,利用层次图神经网络模型得到训练后的节点向量表示,并结合节点初始向量表示计算各层次节点异常值,从而找出异常节点。
进一步地,所述诊疗过程层次网络构建子模块中,将诊疗事件集合、就诊集合与患者集合构成节点集合;每一次就诊与当次就诊中发生的所有诊疗事件相连构成诊疗事件就诊边集合,每一个患者与该患者的所有就诊相连构成就诊患者边集合,将诊疗事件就诊边集合与就诊患者边集合构成边集合;所述节点集合和所述边集合共同构成诊疗过程层次网络。
进一步地,所述节点初始向量表示获取子模块中,将每次就诊中的诊疗事件按时间排列,利用词袋模型进行训练,获得诊疗事件节点初始向量表示;依次用诊疗事件长短期记忆自编码器模型和就诊长短期记忆自编码器模型获得就诊节点初始向量表示和患者节点初始向量表示。
进一步地,所述诊疗事件节点初始向量表示,通过对诊疗事件节点进行独热编码,利用词袋模型对诊疗事件节点的独热编码结果进行训练获得,具体为:
获得诊疗事件节点的独热编码;以就诊为单位按时间顺序排列诊疗事件节点生成诊疗事件序列;观察窗口长度为L,按顺序每一个诊疗事件节点的前、后各L个诊疗事件节点作为词袋模型的输入节点,每个输入节点都乘以输入权重矩阵并加和得到隐层向量;隐层向量乘以输出权重矩阵,再用softmax激活处理后得到诊疗事件节点的预测值;
用诊疗事件节点的重构损失进行训练,得到词袋模型的输入权重矩阵;训练结束后,将诊疗事件节点的独热编码和输入权重矩阵相乘得到诊疗事件节点初始向量表示。
进一步地,所述就诊节点初始向量表示的获取具体为:以就诊为单位按时间顺序排列诊疗事件节点生成诊疗事件序列,构建诊疗事件长短期记忆自编码器模型,输入诊疗事件序列,用诊疗事件节点的重构损失进行训练,训练完成后,用诊疗事件长短期记忆自编码器模型的编码器将诊疗事件序列编码成固定长度的向量,得到就诊节点初始向量表示。
进一步地,所述患者节点初始向量表示的获取具体为:以患者为单位按时间顺序排列就诊节点生成就诊序列,构建就诊长短期记忆自编码器模型,输入就诊序列,用就诊节点的重构损失进行训练,训练完成后,用就诊长短期记忆自编码器模型的编码器将就诊序列编码成固定长度的向量,得到患者节点初始向量表示。
进一步地,所述模型构建与训练子模块中,利用L2范数计算经过层次图神经网络后的节点向量表示与初始向量表示的图节点重构损失;利用交叉熵计算图关系重构损失;利用图节点重构损失和图关系重构损失对层次图神经网络模型进行训练。
进一步地,所述层次图神经网络模型的训练过程中,将节点初始向量表示和节点邻接矩阵输入层次图神经网络,所述层次图神经网络具有若干层图注意力层;对于某节点,每一层图注意力层逐个计算其邻居节点和其自身之间的相似系数,通过相似系数计算该层注意力系数,利用该层注意力系数对该节点在该层的节点向量表示进行更新,该节点经过所有层图注意力训练后,得到该节点对应的节点向量表示。
进一步地,所述诊疗过程异常评分计算模块中,对于某次就诊,计算诊疗事件集合中每个诊疗事件与该次就诊的内积,激活后得到每个诊疗事件出现概率,即为诊疗事件异常值;
定义下限阈值和上限阈值,并且定义两种诊疗事件异常判断方式:如果诊疗事件异常值小于下限阈值,并且该诊疗事件在该次就诊中出现了,则为意外事件;如果诊疗事件异常值大于上限阈值,并且该诊疗事件在该次就诊中没有出现,则为消失事件。
进一步地,所述诊疗过程异常评分计算模块中,从根据层次图神经网络重构后的节点邻接矩阵中提取重构的诊疗事件与就诊的连接关系,构建重构诊疗事件就诊邻接矩阵;同时提取重构的就诊与患者的连接关系,构建重构就诊患者邻接矩阵;根据原始及重构诊疗事件就诊邻接矩阵、原始及重构就诊患者邻接矩阵、节点初始向量表示以及训练后的节点向量表示,计算就诊节点异常值和患者节点异常值,并分别与各自异常值阈值相比较,从而判断是否为异常节点。
本发明的有益效果是:本发明提出层次图神经网络模型构建和训练方法,对复杂的纵向电子病历数据进行建模分析,实现对时序信息和共现信息的融合利用;本发明将疾病诊疗过程异常分为诊疗事件异常、就诊异常和患者异常三个层次,由低层次、细粒度的诊疗事件层次到高层次、粗粒度的患者层次,设计诊疗过程异常的分层量化和综合评价方法,并给出诊疗过程异常的分类方法,精确定位异常具体发生在哪次就诊哪个诊疗步骤。
附图说明
图1为本发明实施例提供的疾病诊疗过程异常识别系统结构图;
图2为本发明实施例提供的诊疗过程层次网络结构图;
图3为本发明实施例提供的词袋模型CBOW结构图;
图4为本发明实施例提供的诊疗事件长短期记忆自编码器结构图;
图5为本发明实施例提供的层次图神经网络模型结构图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其它不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
本发明实施例提供一种基于层次图神经网络的疾病诊疗过程异常识别系统,如图1所示,该系统包括数据采集模块、数据预处理模块、层次图神经网络构建模块、诊疗过程异常评分计算模块和诊疗过程异常识别应用模块。每个模块的具体功能如下:
一、数据采集模块:用于采集患者的基本信息和患者诊疗数据,患者诊疗数据包括患者就诊信息以及诊断、实验室检验、医学检查、手术和用药数据。
二、数据预处理模块:对数据采集模块采集的数据进行预处理。实验室检验数据根据正常参考范围,将实验室检验的结果分为偏低、偏高和正常三种结果类别,保留实验室检验名称、结果类别;医学检查、手术数据用简单的自然语言处理技术处理,保留检查部位、类别和手术名称。得到诊断集合、检验集合、手术集合和用药集合,将所述诊断集合、检验集合、手术集合和用药集合合并构成诊疗事件集合,诊疗事件集合中的元素称为诊疗事件;将患者就诊信息构成就诊集合;患者构成患者集合。
三、层次图神经网络构建模块,包括诊疗过程层次网络构建子模块、节点初始向量表示获取子模块、模型构建与训练子模块,下面详细阐述每个子模块的实现过程。
(1)诊疗过程层次网络构建子模块
如图2所示,构建包含诊疗事件、就诊、患者三个层次的诊疗过程层次网络。诊疗事 件集合为
Figure 622235DEST_PATH_IMAGE001
,就诊集合为
Figure 899894DEST_PATH_IMAGE002
,患者集合为
Figure 538686DEST_PATH_IMAGE003
,其中
Figure 548275DEST_PATH_IMAGE004
分别表示诊疗事件数量、就诊数量和患者数量。 诊疗事件集合、就诊集合与患者集合一起构成节点集合
Figure 221702DEST_PATH_IMAGE005
,节点个数
Figure 670263DEST_PATH_IMAGE006
每一次就诊与当次就诊中发生的所有诊疗事件相连构成诊疗事件就诊边集合
Figure 796351DEST_PATH_IMAGE007
;每一个患者与该患者的所有就诊相连构成就诊患者边集 合
Figure 854306DEST_PATH_IMAGE008
。诊疗事件就诊边集合与就诊患者边集合一起构成边集合
Figure 149283DEST_PATH_IMAGE009
。节点集合N与边集合S共同构成了诊疗过程层次网络
Figure 1701DEST_PATH_IMAGE010
(2)节点初始向量表示获取子模块
将电子病历中每次就诊中的诊疗事件按照时间顺序排列,利用词袋模型CBOW进行训练,获得诊疗事件节点初始向量表示。将诊疗事件节点初始向量表示输入诊疗事件长短期记忆自编码器模型,用诊疗事件节点的重构损失进行训练,获得就诊节点初始向量表示。将就诊节点初始向量表示输入就诊长短期记忆自编码器模型,用就诊节点的重构损失进行训练,获得患者节点初始向量表示。具体地:
首先对所有诊疗事件节点进行独热编码,然后用词袋模型CBOW对诊疗事件节点的 独热编码结果进行训练。如图3所示,诊疗事件节点
Figure 116550DEST_PATH_IMAGE011
的独热编码结果为一个长度是
Figure 712617DEST_PATH_IMAGE012
的 向量,记为
Figure 862101DEST_PATH_IMAGE013
。以就诊为单位,将每次就诊中的诊疗事件节点按照就诊时间顺序排列成一个 诊疗事件序列。观察窗口长度为L,按顺序每一个诊疗事件节点的前L个诊疗事件节点和后L 个诊疗事件节点作为输入节点,诊疗事件节点前或后不足L个诊疗事件节点的则用0向量填 充缺少的诊疗事件节点,每个输入节点都乘以输入权重矩阵W并加和得到隐层向量H
Figure 150999DEST_PATH_IMAGE014
隐层向量H乘以输出权重矩阵
Figure 753144DEST_PATH_IMAGE015
,再用softmax激活处理后得到诊疗事件节点
Figure 887322DEST_PATH_IMAGE016
的 预测值
Figure 156892DEST_PATH_IMAGE017
。诊疗事件节点的重构损失
Figure 351113DEST_PATH_IMAGE018
计算公式为:
Figure 706133DEST_PATH_IMAGE019
其中,
Figure 909581DEST_PATH_IMAGE020
Figure 266613DEST_PATH_IMAGE021
中第j维的取值,
Figure 410498DEST_PATH_IMAGE022
Figure 220192DEST_PATH_IMAGE023
中第j维的取值。用Adam优化器反向传播进 行词袋模型训练,得到词袋模型的权重矩阵W。尝试观察窗口长度2、3、5选取训练效果较好 的词袋模型。训练结束后,诊疗事件节点
Figure 463216DEST_PATH_IMAGE024
的初始向量表示
Figure 940334DEST_PATH_IMAGE025
通过诊疗事件节点的独热编 码
Figure 243402DEST_PATH_IMAGE021
和输入权重矩阵W得到,计算公式为:
Figure 540391DEST_PATH_IMAGE026
获得所有诊疗事件节点初始向量表示
Figure 587106DEST_PATH_IMAGE027
后,将诊疗事件节点以就诊为单位按时间 顺序排列为诊疗事件序列
Figure 918731DEST_PATH_IMAGE028
,T是该次就诊中诊疗事件的数量,其中 诊疗事件节点
Figure 658279DEST_PATH_IMAGE029
的初始向量表示即为
Figure 176985DEST_PATH_IMAGE030
。如图4所示,构建诊疗事件长短期记忆自编码器 模型,输入诊疗事件序列进行训练。诊疗事件长短期记忆自编码器模型分为编码器
Figure 525927DEST_PATH_IMAGE031
和解码器
Figure 947943DEST_PATH_IMAGE032
两个部分,通过潜在向量C相连,每个部分都由长短期记忆单元 LSTM组成。编码器和解码器中长短期记忆单元数量相同,通过改变单元的数量支持不同长 度的诊疗事件输入序列和诊疗事件输出序列。将诊疗事件序列输入编码器后得到一个潜在 向量C,然后将潜在向量C作为解码器的输入,对潜在向量C进行解码,逐步输出重构的诊疗 事件序列
Figure 91348DEST_PATH_IMAGE033
,用诊疗事件节点的重构损失
Figure 864394DEST_PATH_IMAGE034
对诊疗事件长短期记忆 自编码器模型进行训练。
Figure 17027DEST_PATH_IMAGE035
其中,
Figure 559129DEST_PATH_IMAGE036
是L2范数,
Figure 607857DEST_PATH_IMAGE037
是诊疗事件节点
Figure 122059DEST_PATH_IMAGE038
的初始向量表示。训练完成后,用编 码器部分对原诊疗事件序列进行编码,得到的潜在向量C是长度和
Figure 547225DEST_PATH_IMAGE039
一样的向量,将该向 量作为该诊疗事件序列所代表的就诊节点初始向量表示
Figure 209412DEST_PATH_IMAGE040
。得到就诊节点初始向量表示
Figure 429041DEST_PATH_IMAGE041
后,按照就诊节点初始向量表示的获取方法,来获取患者节点初始向量表示。以患者为单 位按时间顺序排列患者的就诊生成就诊序列,构建就诊长短期记忆自编码器模型,用就诊 节点的重构损失进行训练。训练完成后,用编码器将就诊序列编码成固定长度的向量,得到 患者节点初始向量表示
Figure 940794DEST_PATH_IMAGE042
至此,得到诊疗事件节点、就诊节点和患者节点的初始向量表示。
(3)模型构建与训练子模块
基于各层次节点初始向量表示构建层次图神经网络模型,利用图注意力机制进行训练。利用L2范数计算经过层次图神经网络后的节点向量表示与初始向量表示的图节点重构损失;利用交叉熵计算图关系重构损失。用两个部分的重构损失对层次图神经网络模型进行训练。
第一步,构建层次图神经网络,如图5所示。层次图神经网络中的节点初始向量表 示由诊疗事件节点初始向量表示、就诊节点初始向量表示和患者节点初始向量表示组成, 节点初始向量表示
Figure 671115DEST_PATH_IMAGE043
Figure 420765DEST_PATH_IMAGE044
是对向量进行拼接。根据诊疗事件就诊边集合
Figure 578339DEST_PATH_IMAGE045
构建诊疗事件就诊邻接矩阵
Figure 46229DEST_PATH_IMAGE046
;根据就诊患者边集合
Figure 845820DEST_PATH_IMAGE047
构建就诊患者邻接矩阵
Figure 715556DEST_PATH_IMAGE048
; 根据边集合S构建层次图神经网络中的节点邻接矩阵A,节点邻接矩阵A的信息由诊疗事件 就诊邻接矩阵
Figure 44032DEST_PATH_IMAGE049
和就诊患者邻接矩阵
Figure 999218DEST_PATH_IMAGE050
中的信息组成。层次图神经网络由M层图注意力 层和重构损失两部分组成。
第二步,训练层次图神经网络。将节点初始向量表示B和节点邻接矩阵A输入层次 图神经网络,用图注意力机制对节点初始向量表示进行更新。对于节点
Figure 569877DEST_PATH_IMAGE051
的初始向量表示
Figure 61163DEST_PATH_IMAGE052
,在第m层图注意力层的节点向量表示为
Figure 59075DEST_PATH_IMAGE053
。对于节点
Figure 268602DEST_PATH_IMAGE051
以及其邻居节点
Figure 377372DEST_PATH_IMAGE054
,每一层 图注意力层逐个计算邻居节点
Figure 734884DEST_PATH_IMAGE055
和其自身之间的相似系数
Figure 169276DEST_PATH_IMAGE056
Figure 600520DEST_PATH_IMAGE057
其中,
Figure 512981DEST_PATH_IMAGE058
是第m层共享参数,对节点向量表示进行线性映射,第一层输入的是节 点
Figure 713281DEST_PATH_IMAGE051
的初始向量表示
Figure 52995DEST_PATH_IMAGE059
Figure 971535DEST_PATH_IMAGE060
是映射函数,实现向量到实数的映射,可以通过单层神 经网络实现。第m层注意力系数
Figure 687687DEST_PATH_IMAGE061
计算公式如下:
Figure 506607DEST_PATH_IMAGE062
其中,
Figure 518688DEST_PATH_IMAGE063
是激活函数。
用注意力系数对
Figure 688638DEST_PATH_IMAGE064
进行更新,计算公式如下:
Figure 709946DEST_PATH_IMAGE065
其中,
Figure 117794DEST_PATH_IMAGE066
是激活函数,
Figure 831934DEST_PATH_IMAGE067
是节点
Figure 958022DEST_PATH_IMAGE068
在第m层的节点向量表示。节点
Figure 517441DEST_PATH_IMAGE051
经过M层图 注意力训练后,得到节点向量表示
Figure 45375DEST_PATH_IMAGE069
。对所有节点都进行M层图注意力训练,得到总体节点 向量表示
Figure 918697DEST_PATH_IMAGE070
Figure 532081DEST_PATH_IMAGE071
由更新后的诊疗事件节点向量表示
Figure 629613DEST_PATH_IMAGE072
、就诊节点向量表示
Figure 277632DEST_PATH_IMAGE073
和患者节点 向量表示
Figure 67995DEST_PATH_IMAGE074
构成,
Figure 903096DEST_PATH_IMAGE075
利用L2范数计算训练后的节点向量表示与初始向量表示的图节点重构损失,诊疗 事件节点重构损失为
Figure 568433DEST_PATH_IMAGE076
,就诊节点重构损失为
Figure 572423DEST_PATH_IMAGE077
,患者节点重构损失为
Figure 32223DEST_PATH_IMAGE078
利用交叉熵计算图关系重构损失,根据层次图神经网络获得的节点向量表示对层 次图神经网络进行重构,重构后的邻接矩阵
Figure 121664DEST_PATH_IMAGE079
为:
Figure 59533DEST_PATH_IMAGE080
其中,
Figure 918030DEST_PATH_IMAGE081
Figure 548732DEST_PATH_IMAGE082
的转置矩阵,
Figure 391048DEST_PATH_IMAGE083
是sigmoid激活函数。计算图关系重构损失
Figure 132608DEST_PATH_IMAGE084
Figure 845611DEST_PATH_IMAGE085
其中
Figure 912793DEST_PATH_IMAGE086
第三步,根据图节点重构损失和图关系重构损失构建层次图神经网络模型的总体损失函数。总体损失函数L为:
Figure 722966DEST_PATH_IMAGE087
其中,
Figure 2638DEST_PATH_IMAGE088
是调整不同损失项重要性的超参数,默认设置为0.1。利用患者诊疗数 据进行层次图神经网络模型训练,确定模型参数。
四、诊疗过程异常评分计算模块
根据层次图神经网络训练结果分层次计算异常值,逐层识别诊疗过程异常。根据相邻节点之间的关系计算异常值,并根据异常值判断节点是否异常。
对于某次就诊
Figure 599841DEST_PATH_IMAGE089
,计算诊疗事件集合E中每个诊疗事件与就诊
Figure 808231DEST_PATH_IMAGE089
的内积,激活后得 到该诊疗事件出现概率,即为该诊疗事件的异常值。诊疗事件节点
Figure 858095DEST_PATH_IMAGE090
的异常值
Figure 442923DEST_PATH_IMAGE091
计算公式 为:
Figure 894633DEST_PATH_IMAGE092
其中,
Figure 539503DEST_PATH_IMAGE093
是sigmoid激活函数。
定义下限阈值
Figure 811084DEST_PATH_IMAGE094
和上限阈值
Figure 199602DEST_PATH_IMAGE095
Figure 505819DEST_PATH_IMAGE096
Figure 587170DEST_PATH_IMAGE097
的取值根据实验进行设置,或者根 据经验将其设为
Figure 611626DEST_PATH_IMAGE098
Figure 803835DEST_PATH_IMAGE099
,并且定义两种诊疗事件异常判断方式,意外事 件:
Figure 698979DEST_PATH_IMAGE100
,并且
Figure 951231DEST_PATH_IMAGE101
在就诊
Figure 197405DEST_PATH_IMAGE102
中出现了,即该诊疗事件发生率很低,但是事件发生了;消 失事件:
Figure 916007DEST_PATH_IMAGE103
,并且
Figure 931236DEST_PATH_IMAGE104
在就诊
Figure 587345DEST_PATH_IMAGE102
中没有出现,即该诊疗事件发生率很高,但是事件没 有发生。
从重构后的邻接矩阵
Figure 822280DEST_PATH_IMAGE105
中提取重构的诊疗事件与就诊的连接关系,构建重构诊疗 事件就诊邻接矩阵
Figure 854827DEST_PATH_IMAGE106
;提取重构的就诊与患者的连接关系,构建重构就诊患者邻接矩阵
Figure 491607DEST_PATH_IMAGE107
。就诊节点
Figure 318617DEST_PATH_IMAGE102
的异常值
Figure 775269DEST_PATH_IMAGE108
计算公式为:
Figure 814769DEST_PATH_IMAGE109
患者节点
Figure 571635DEST_PATH_IMAGE110
的异常值
Figure 631863DEST_PATH_IMAGE111
计算公式为:
Figure 841390DEST_PATH_IMAGE112
其中,
Figure 950161DEST_PATH_IMAGE113
是sigmoid激活函数,
Figure 295953DEST_PATH_IMAGE114
Figure 464767DEST_PATH_IMAGE115
Figure 896010DEST_PATH_IMAGE116
Figure 808471DEST_PATH_IMAGE102
的连接关系分别在
Figure 286069DEST_PATH_IMAGE117
中对应的值,
Figure 625783DEST_PATH_IMAGE118
Figure 777279DEST_PATH_IMAGE119
Figure 729317DEST_PATH_IMAGE120
的连接关系分别在
Figure 282658DEST_PATH_IMAGE121
中对应的值,
Figure 560318DEST_PATH_IMAGE122
是就诊
Figure 199109DEST_PATH_IMAGE123
中诊疗事件的数量,
Figure 220417DEST_PATH_IMAGE124
是患者
Figure 362686DEST_PATH_IMAGE125
的就诊数量,
Figure 309782DEST_PATH_IMAGE126
是调整不同损 失项重要性的超参数。对于就诊节点,当节点异常值大于设定的异常值阈值
Figure 202914DEST_PATH_IMAGE127
时,即判断该 节点为异常。对于患者节点,当节点异常值大于设定的异常值阈值
Figure 995289DEST_PATH_IMAGE128
时,即判断该节点为异 常。
Figure 24687DEST_PATH_IMAGE127
Figure 142685DEST_PATH_IMAGE128
分别为就诊节点和患者节点的异常值阈值,其取值根据实验进行设置。
五、诊疗过程异常识别应用模块
将患者结构化数据进行预处理后分为诊疗事件节点、就诊节点和患者节点,诊疗事件节点进行独热编码后输入训练好的词袋模型,得到诊疗事件节点初始向量表示。将诊疗事件节点初始向量表示输入训练好的诊疗事件长短期记忆自编码器模型中的编码器,获得就诊节点初始向量表示。同样将就诊节点初始向量表示输入训练好的就诊长短期记忆自编码器模型的编码器,获得患者节点初始向量表示。
将各节点输入层次图神经网络模型,得到更新后的诊疗事件向量表示、就诊向量表示和患者向量表示。用更新后的向量表示和更新前的向量表示计算各层次节点异常值,与阈值相比较,找出异常的节点。
本发明采用分层表示学习方法获取诊疗事件节点、就诊节点和患者节点的初始向量表示。先用词袋模型获得诊疗事件节点的初始向量表示。然后依次用诊疗事件长短期记忆自编码器模型和就诊长短期记忆自编码器模型获得就诊节点初始向量表示和患者节点初始向量表示。不仅保留了诊疗事件和就诊的时序信息,且各层次向量表示都包含上一层的信息。
本发明提出层次图神经网络模型,模型包含诊疗事件、就诊、患者三个层次的信息以及层次之间的互相关系,通过图注意力机制以及四个重构损失对层次图神经网络进行多个层次的综合训练。
本发明基于层次图神经网络模型,将疾病诊疗过程异常分为诊疗事件异常、就诊异常和患者异常三个层次的异常,设计诊疗过程异常的分层量化和综合评价方法。每个层次的节点都根据相邻的节点之间的关系计算异常值,并给出诊疗事件异常的分类方法,精确定位异常具体发生在哪次就诊哪个诊疗步骤。
以上所述仅是本发明的优选实施方式,虽然本发明已以较佳实施例披露如上,然而并非用以限定本发明。任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何的简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。

Claims (6)

1.一种基于层次图神经网络的疾病诊疗过程异常识别系统,其特征在于,包括:
(1)数据采集模块:用于采集患者的基本信息和患者诊疗数据;
(2)数据预处理模块:对数据采集模块采集的数据进行预处理,构建诊疗事件集合、就诊集合和患者集合;
(3)层次图神经网络构建模块,包括以下子模块:
诊疗过程层次网络构建子模块:用于构建包含诊疗事件、就诊、患者三个层次的诊疗过程层次网络,具体为,将诊疗事件集合、就诊集合与患者集合构成节点集合;每一次就诊与当次就诊中发生的所有诊疗事件相连构成诊疗事件就诊边集合,每一个患者与该患者的所有就诊相连构成就诊患者边集合,将诊疗事件就诊边集合与就诊患者边集合构成边集合;所述节点集合和所述边集合共同构成诊疗过程层次网络;
节点初始向量表示获取子模块:采用分层表示学习方法获取诊疗事件节点、就诊节点和患者节点的初始向量表示,具体为,将电子病历中每次就诊中的诊疗事件按时间排列,利用词袋模型进行训练,获得诊疗事件节点初始向量表示;依次用诊疗事件长短期记忆自编码器模型和就诊长短期记忆自编码器模型获得就诊节点初始向量表示和患者节点初始向量表示;
模型构建与训练子模块:基于各层次节点初始向量表示构建层次图神经网络模型,利用图注意力机制进行多个层次的综合训练;
(4)诊疗过程异常评分计算模块:根据层次图神经网络训练结果分层次计算异常值,逐层识别诊疗过程异常,具体为:
对于某次就诊,计算诊疗事件集合中每个诊疗事件与该次就诊的内积,激活后得到每个诊疗事件出现概率,即为诊疗事件异常值;
定义下限阈值和上限阈值,并且定义两种诊疗事件异常判断方式:如果诊疗事件异常值小于下限阈值,并且该诊疗事件在该次就诊中出现了,则为意外事件;如果诊疗事件异常值大于上限阈值,并且该诊疗事件在该次就诊中没有出现,则为消失事件;
从根据层次图神经网络重构后的节点邻接矩阵中提取重构的诊疗事件与就诊的连接关系,构建重构诊疗事件就诊邻接矩阵;同时提取重构的就诊与患者的连接关系,构建重构就诊患者邻接矩阵;根据原始及重构诊疗事件就诊邻接矩阵、原始及重构就诊患者邻接矩阵、节点初始向量表示以及训练后的节点向量表示,计算就诊节点异常值和患者节点异常值,并分别与各自异常值阈值相比较,从而判断是否为异常节点;
(5)诊疗过程异常识别应用模块:将患者结构化数据进行预处理后分为诊疗事件节点、就诊节点和患者节点,计算不同节点的初始向量表示,利用层次图神经网络模型得到训练后的节点向量表示,并结合节点初始向量表示计算各层次节点异常值,从而找出异常节点。
2.根据权利要求1所述的一种基于层次图神经网络的疾病诊疗过程异常识别系统,其特征在于,所述诊疗事件节点初始向量表示,通过对诊疗事件节点进行独热编码,利用词袋模型对诊疗事件节点的独热编码结果进行训练获得,具体为:
获得诊疗事件节点的独热编码;以就诊为单位按时间顺序排列诊疗事件节点生成诊疗事件序列;观察窗口长度为L,按顺序每一个诊疗事件节点的前、后各L个诊疗事件节点作为词袋模型的输入节点,每个输入节点都乘以输入权重矩阵并加和得到隐层向量;隐层向量乘以输出权重矩阵,再用softmax激活处理后得到诊疗事件节点的预测值;
用诊疗事件节点的重构损失进行训练,得到词袋模型的输入权重矩阵;训练结束后,将诊疗事件节点的独热编码和输入权重矩阵相乘得到诊疗事件节点初始向量表示。
3.根据权利要求1所述的一种基于层次图神经网络的疾病诊疗过程异常识别系统,其特征在于,所述就诊节点初始向量表示的获取具体为:以就诊为单位按时间顺序排列诊疗事件节点生成诊疗事件序列,构建诊疗事件长短期记忆自编码器模型,输入诊疗事件序列,用诊疗事件节点的重构损失进行训练,训练完成后,用诊疗事件长短期记忆自编码器模型的编码器将诊疗事件序列编码成固定长度的向量,得到就诊节点初始向量表示。
4.根据权利要求1所述的一种基于层次图神经网络的疾病诊疗过程异常识别系统,其特征在于,所述患者节点初始向量表示的获取具体为:以患者为单位按时间顺序排列就诊节点生成就诊序列,构建就诊长短期记忆自编码器模型,输入就诊序列,用就诊节点的重构损失进行训练,训练完成后,用就诊长短期记忆自编码器模型的编码器将就诊序列编码成固定长度的向量,得到患者节点初始向量表示。
5.根据权利要求1所述的一种基于层次图神经网络的疾病诊疗过程异常识别系统,其特征在于,所述模型构建与训练子模块中,利用L2范数计算经过层次图神经网络后的节点向量表示与初始向量表示的图节点重构损失;利用交叉熵计算图关系重构损失;利用图节点重构损失和图关系重构损失对层次图神经网络模型进行训练。
6.根据权利要求5所述的一种基于层次图神经网络的疾病诊疗过程异常识别系统,其特征在于,所述层次图神经网络模型的训练过程中,将节点初始向量表示和节点邻接矩阵输入层次图神经网络,所述层次图神经网络具有若干层图注意力层;对于某节点,每一层图注意力层逐个计算其邻居节点和其自身之间的相似系数,通过相似系数计算该层的注意力系数,利用该层的注意力系数对该节点在该层的节点向量表示进行更新,该节点经过所有层图注意力训练后,得到该节点对应的节点向量表示。
CN202211287887.8A 2022-10-20 2022-10-20 一种基于层次图神经网络的疾病诊疗过程异常识别系统 Active CN115359870B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202211287887.8A CN115359870B (zh) 2022-10-20 2022-10-20 一种基于层次图神经网络的疾病诊疗过程异常识别系统
JP2023095902A JP7365747B1 (ja) 2022-10-20 2023-06-09 階層図ニューラルネットワークに基づく疾患診療過程異常識別システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211287887.8A CN115359870B (zh) 2022-10-20 2022-10-20 一种基于层次图神经网络的疾病诊疗过程异常识别系统

Publications (2)

Publication Number Publication Date
CN115359870A CN115359870A (zh) 2022-11-18
CN115359870B true CN115359870B (zh) 2023-03-24

Family

ID=84008912

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211287887.8A Active CN115359870B (zh) 2022-10-20 2022-10-20 一种基于层次图神经网络的疾病诊疗过程异常识别系统

Country Status (2)

Country Link
JP (1) JP7365747B1 (zh)
CN (1) CN115359870B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116759041B (zh) * 2023-08-22 2023-12-22 之江实验室 一种考虑诊疗事件关系的医疗时序数据生成方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109659033A (zh) * 2018-12-18 2019-04-19 浙江大学 一种基于循环神经网络的慢性疾病病情变化事件预测装置
CN111667917A (zh) * 2020-06-10 2020-09-15 北京小白世纪网络科技有限公司 一种基于神经网络实现中医诊疗的方法、系统及设备

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101977645B1 (ko) * 2017-08-25 2019-06-12 주식회사 메디웨일 안구영상 분석방법
CN109659035A (zh) 2018-12-13 2019-04-19 平安医疗健康管理股份有限公司 基于机器学习的就诊数据异常识别方法、设备及存储介质
CN111754476B (zh) * 2019-06-19 2024-07-19 科亚医疗科技股份有限公司 用于解剖树结构的疾病量化建模的方法及系统
CN110909867A (zh) * 2019-11-26 2020-03-24 南通恒趣新材料有限公司 一种基于力导图的图神经网络可视分析方法
CN111370084B (zh) * 2020-02-07 2023-10-03 山东师范大学 基于BiLSTM的电子健康记录表示学习方法及系统
CN111738335A (zh) * 2020-06-23 2020-10-02 鲁东大学 一种基于神经网络的时间序列数据异常检测方法
CN113516226A (zh) * 2021-05-18 2021-10-19 长沙理工大学 一种基于图神经网络的混合模型多元时序异常检测方法
CN113517076A (zh) * 2021-07-30 2021-10-19 齐鲁工业大学 基于图神经网络与迁移学习的疾病病例数预测方法及系统
CN113990495B (zh) * 2021-12-27 2022-04-29 之江实验室 一种基于图神经网络的疾病诊断预测系统
CN114564573A (zh) * 2022-03-14 2022-05-31 天津大学 基于异构图神经网络的学术合作关系预测方法
CN114881115A (zh) * 2022-04-02 2022-08-09 中国科学院计算技术研究所 一种基于图神经网络的多变量时间序列异常检测方法及系统
CN114496234B (zh) * 2022-04-18 2022-07-19 浙江大学 一种基于认知图谱的全科患者个性化诊疗方案推荐系统
CN114783603A (zh) * 2022-04-18 2022-07-22 北京交通大学 基于多源图神经网络融合的患病风险预测方法及系统
CN115185736B (zh) * 2022-09-09 2023-01-31 南京航空航天大学 基于图卷积神经网络的微服务调用链异常检测方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109659033A (zh) * 2018-12-18 2019-04-19 浙江大学 一种基于循环神经网络的慢性疾病病情变化事件预测装置
CN111667917A (zh) * 2020-06-10 2020-09-15 北京小白世纪网络科技有限公司 一种基于神经网络实现中医诊疗的方法、系统及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
浅析BP神经网络技术在医院信息系统中的应用;易焱琪等;《科技创新与生产力》;20170210(第02期);全文 *

Also Published As

Publication number Publication date
JP7365747B1 (ja) 2023-10-20
JP2024061599A (ja) 2024-05-07
CN115359870A (zh) 2022-11-18

Similar Documents

Publication Publication Date Title
CN109659033B (zh) 一种基于循环神经网络的慢性疾病病情变化事件预测装置
JP7459386B2 (ja) グラフニューラルネットワークに基づく疾患診断予測システム
CN113421652B (zh) 对医疗数据进行分析的方法、训练模型的方法及分析仪
CN109599177B (zh) 一种基于病历的深度学习预测医疗轨迹的方法
CN107392109A (zh) 一种基于深度神经网络的新生儿疼痛表情识别方法
CN112184658A (zh) 用于非小细胞肺癌预后生存预测的方法、介质及电子设备
CN109065171B (zh) 基于集成学习的川崎病风险评估模型的构建方法及系统
CN112884551B (zh) 一种基于近邻用户和评论信息的商品推荐方法
CN113744873A (zh) 一种基于任务分解策略的发热待查辅助鉴别诊断系统
CN115359870B (zh) 一种基于层次图神经网络的疾病诊疗过程异常识别系统
CN117034142B (zh) 一种不平衡医疗数据缺失值填充方法及系统
CN109166626B (zh) 一种消化性溃疡病人的医疗指标缺失数据补全方法
CN115579141A (zh) 一种可解释疾病风险预测模型构建方法以及疾病风险预测装置
CN114300081B (zh) 基于电子病历多模态数据的预测设备、系统和存储介质
US20220237883A1 (en) Image processing method and apparatus and storage medium
CN113077901B (zh) 一种电子病历分析装置和方法
CN116959715B (zh) 一种基于时序演进过程解释的疾病预后预测系统
Sinra et al. Automated Classification of COVID-19 Chest X-ray Images Using Ensemble Machine Learning Methods
CN116522070A (zh) 一种机械零部件无监督智能故障诊断方法及系统
CN116092668A (zh) 一种融合多元异构数据的心衰患者再入院预测方法
Subramanian et al. Wearable Sensor-Based Monitoring and Classification Using Deep Learning For Personalized Healthcare
CN118570570B (zh) 一种基于图像识别技术的中医舌象辨识系统及方法
CN118230946B (zh) 一种痛风病分期和预测系统、设备及介质
CN114420300B (zh) 中国老年认知损害预测模型
Scientific INTELLIGENT ALZHEIMER’S DISEASE PREDICTION USING EXPLAINABLE BOOSTING MACHINE

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant