CN117174319B - 一种基于知识图谱的脓毒症时序预测方法及系统 - Google Patents
一种基于知识图谱的脓毒症时序预测方法及系统 Download PDFInfo
- Publication number
- CN117174319B CN117174319B CN202311452738.7A CN202311452738A CN117174319B CN 117174319 B CN117174319 B CN 117174319B CN 202311452738 A CN202311452738 A CN 202311452738A CN 117174319 B CN117174319 B CN 117174319B
- Authority
- CN
- China
- Prior art keywords
- diagnosis
- target
- sepsis
- information
- time sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 206010040047 Sepsis Diseases 0.000 title claims abstract description 139
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000003745 diagnosis Methods 0.000 claims abstract description 271
- 239000011159 matrix material Substances 0.000 claims abstract description 87
- 238000005516 engineering process Methods 0.000 claims abstract description 10
- 230000008569 process Effects 0.000 claims description 27
- 239000013598 vector Substances 0.000 claims description 26
- 238000000605 extraction Methods 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 15
- 238000010276 construction Methods 0.000 claims description 12
- 238000013507 mapping Methods 0.000 claims description 12
- 239000003814 drug Substances 0.000 claims description 11
- 229940079593 drug Drugs 0.000 claims description 10
- 238000007781 pre-processing Methods 0.000 claims description 9
- 230000003213 activating effect Effects 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 238000001228 spectrum Methods 0.000 claims description 4
- 208000024891 symptom Diseases 0.000 claims 1
- 238000012512 characterization method Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 9
- 230000004913 activation Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 238000012549 training Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 210000003734 kidney Anatomy 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 208000004990 Cardiorenal syndrome Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000004768 organ dysfunction Effects 0.000 description 1
- 238000010837 poor prognosis Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明涉及一种基于知识图谱的脓毒症时序预测方法及系统;该方法包括:获取脓毒症患者的时序诊次信息,形成诊次数据集;基于CCS或ICD编码技术,构建医学本体图谱;基于医学本体图谱,构建目标脓毒症患者的诊次图谱;基于诊次图谱,生成诊次邻接矩阵和诊次特征矩阵;将诊次邻接矩阵和诊次特征矩阵分别输入至ST‑GCN网络模型中,得到目标脓毒症患者诊次T的诊断预测结果。本发明通过将脓毒症患者患者的时序诊次信息和医学知识图谱相结合,实现全流程端到端预测,不仅有利于模型提取出患者更准确的表征,提升模型预测的准确性,还能够对大量减少医生的工作量,节省医疗资源。
Description
技术领域
本发明涉及脓毒症预测技术领域,尤其涉及一种基于知识图谱的脓毒症时序预测方法及系统。
背景技术
脓毒症是指因感染引起的宿主反应失调导致的危及生命的器官功能障碍,具有发病率高、预后差及病死率高等特点,严重威胁患者的生命健康。部分脓毒症患者的心脏和肾脏会同时出现功能障碍,这种由脓毒症诱发的心肾共病被称为脓毒症心肾综合征(cardiorenal syndrome,CRS)。早期预测脓毒症CRS患者的发病概率,有助于医生早期采取积极治疗措施,改善患者不良结局,延长患者生存时间,如何利用患者的临床信息构建有效的早筛模型仍是目前需要解决的问题。
图神经网络(Graph Neural Networks,GNN)是一类用于处理图数据的深度学习模型,与传统的机器学习模型不同之处在于:
1、数据结构上,传统机器学习模型通常处理向量或矩阵格式的数据,而图神经网络可以处理图结构类型的优势。
2、局部性,传统机器学习模型假设样本独立同分布,图神经网络模型可以通过邻居节点来捕获节点周围的局部关系,可以更好的利用图结构的信息。
但图神经网络也存在一些问题,如何利用好患者的多次时序诊次信息来构建临床图谱,仍是目前需要解决的问题。
为此,本发明提供了一种基于知识图谱的脓毒症时序预测方法及系统。
发明内容
基于此,有必要针对上述技术问题,提供一种基于知识图谱的脓毒症时序预测方法及系统。
为了实现上述目的,本发明提供了一种基于知识图谱的脓毒症时序预测方法,包括:
获取脓毒症患者的时序诊次信息,将时序诊次信息进行预处理,形成诊次数据集;其中,将时序诊次信息进行预处理,包括:抽取脓毒症患者的时序诊次信息,对时序诊次信息进行标准化处理以及对时序诊次信息进行医疗编码映射,得到时序诊次数据集;
基于CCS或ICD编码技术,构建医学本体图谱;
基于医学本体图谱,根据目标脓毒症患者的时序诊次信息,构建目标脓毒症患者的诊次图谱;
基于诊次图谱,生成诊次邻接矩阵和诊次特征矩阵;
将诊次邻接矩阵和诊次特征矩阵分别输入至ST-GCN网络模型中,得到目标脓毒症患者诊次T的诊断预测结果。
具体的,所述时序诊次信息包括患者入住的诊断信息、用药信息以及治疗过程信息。
具体的,所述基于医学本体图谱,根据目标脓毒症患者的时序诊次信息,构建目标脓毒症患者的诊次图谱,具体包括:
将医学本体图谱定义为,其中,医学本体图谱中的各节点与诊次数据集中的医学代码节点相同;
提取目标脓毒症患者的时序诊次信息,形成目标脓毒症患者的诊次集合,其中,/>表示目标脓毒症患者的第T-1次诊次信息;
基于同一目标脓毒症患者的时序诊次信息与医学本体图谱中编码code的映射关系,在医学本体图谱中选取子图作为目标脓毒症患者的诊次图谱/>,/>,其中,M表示诊次的多个医疗编码集合,/>表示祖先节点集合,a表示CCS或ICD中的编码code,a1表示第一个祖先节点在CCS或ICD中的编码code,a2表示第二个祖先节点在CCS或ICD中的编码code,/>表示第/>个祖先节点在CCS或ICD中的编码code。
具体的,生成所述诊次邻接矩阵,具体包括:基于目标脓毒症患者的诊次图谱,根据诊次图谱/>中的节点以及节点的边,将诊次图谱/>又定义为/>,其中,V表示诊次图谱/>的节点集合,且/>,/>表示同一目标脓毒症患者的时序诊次信息与医学本体图谱中编码code的映射关系,E表示诊次图谱/>的边集合,并从E中生成诊次邻接矩阵/>。
具体的,生成所述诊次特征矩阵,具体包括:将诊次图谱的节点集合V中的每个节点均进行/>编码处理,其中,在对每个节点进行/>编码处理过程中,每个节点的时序诊次信息中均包含相关诊断信息、用药信息以及治疗过程相关信息的三类信息,对每一类信息均进行/>编码处理,形成相应种类的/>编码,并将三种类别的编码进行拼接,得到目标脓毒症患者的相应节点的向量,将每个节点的向量进行相加,得到目标脓毒症患者的诊次特征矩阵/>,其中,p表示目标脓毒症患者,X表示每次诊次向量,*表示所有诊次集合。
具体的,所述将诊次邻接矩阵和诊次特征矩阵分别输入至ST-GCN网络模型中,得到目标脓毒症患者诊次T的诊断预测结果,具体包括:将诊次邻接矩阵和诊次特征矩阵分别输入至ST-GCN网络模型中,采用诊次特征矩阵进行层归一化处理,基于ST-GCN网络模型,将诊次邻接矩阵和诊次特征矩阵进行空间和时间的卷积处理,分别得到不同的卷积提取特征结果,其中,ST-GCN网络模型由6层ST-GCN unit单位堆叠而成,将经过第二层ST-GCN unit单位提取的卷积提取特征结果、经过第四层ST-GCN unit单位提取的卷积提取特征结果以及经过第六层ST-GCN unit单位提取的卷积提取特征结果进行组合,并通过最后一层的全连接层和sigmoid激活函数层,对向量进行multi-hot预测,其中,/>代表目标脓毒症患者P第T次的诊次向量X,得到目标脓毒症患者诊次T的诊断预测结果。
具体的,所述ST-GCN网络模型中前两层ST-GCN unit单位有64个输出通道,中间两层ST-GCN unit单位有128个输出通道,最后两层ST-GCN unit单位有256个输出通道。
本发明还提供了一种基于知识图谱的脓毒症时序预测系统,包括:
数据采集模块,用于获取脓毒症患者的时序诊次信息,将时序诊次信息进行预处理,形成诊次数据集;
医学本体图谱构建模块,用于基于CCS或ICD编码技术,构建医学本体图谱;
诊次图谱构建模块,用于基于医学本体图谱,根据目标脓毒症患者的时序诊次信息,构建目标脓毒症患者的诊次图谱;
矩阵构建模块,用于基于诊次图谱,生成诊次邻接矩阵和诊次特征矩阵;
ST-GCN模块,用于将诊次邻接矩阵和诊次特征矩阵分别输入至ST-GCN网络模型中,得到目标脓毒症患者诊次T的诊断预测结果。
本发明还提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并且可以在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述方法的步骤。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述方法的步骤。
本发明的优点及有益效果在于:本发明提供的一种基于知识图谱的脓毒症时序预测方法及系统,该方法通过将脓毒症患者患者的时序诊次信息和医学知识图谱相结合,实现全流程端到端预测,无需人为干预,不仅有利于模型提取出患者更准确的表征,提升模型预测的准确性,还能够对大量减少医生的工作量,节省医疗资源。
附图说明
图1为一种基于知识图谱的脓毒症时序预测方法的流程图;
图2为医学本体图谱的部分示意图;
图3为模型训练框架图的示意图;
图4为一种基于知识图谱的脓毒症时序预测系统的结构示意图;
图5为电子设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,下面通过具体实施方式结合附图对本发明做进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
实施例一
图1为本发明实施例一提供的一种基于知识图谱的脓毒症时序预测方法的流程图。
参考图1,该方法主要包括以下步骤:
S101、获取脓毒症患者的时序诊次信息,将时序诊次信息进行预处理,形成诊次数据集。
在本实施例中,时序诊次信息包括患者入住的诊断信息、用药信息以及治疗过程信息。
例如:本发明总共收集2000名脓毒症患者的时序诊次信息进行后续模型训练和预测。
在本实施例中,将时序诊次信息进行预处理,以便提升后续建模性能,预处理的具体步骤包括:抽取脓毒症患者的时序诊次信息,对时序诊次信息进行标准化处理以及对时序诊次信息进行医疗编码映射,得到时序诊次数据集。
S102、基于CCS或ICD编码技术,构建医学本体图谱。
在本实施例中,本发明采用CCS或ICD编码技术对医学本体图谱进行构建,其中,CCS或ICD编码技术为现有技术(包括但不限于参考CN112183026B),采用的CCS或ICD编码技术均为国际公认的医疗编码,并且具有树状结构,参考图2,形成医学本体图谱,该医学本体图谱为一种无向分层树状结构保存的医学概念拓扑图。
S103、基于医学本体图谱,根据目标脓毒症患者的时序诊次信息,构建目标脓毒症患者的诊次图谱。
在本实施例中,基于医学本体图谱,根据目标脓毒症患者的时序诊次信息,构建目标脓毒症患者的诊次图谱,具体包括:
将医学本体图谱定义为,其中,医学本体图谱中的各节点与诊次数据集中的医学代码节点相同;
提取目标脓毒症患者的时序诊次信息,形成目标脓毒症患者的诊次集合,其中,/>表示目标脓毒症患者的第T-1次诊次信息;
基于同一目标脓毒症患者的时序诊次信息与医学本体图谱中编码code的映射关系,在医学本体图谱中选取子图作为目标脓毒症患者的诊次图谱/>,/>,其中,M表示诊次的多个医疗编码集合,/>表示祖先节点集合,a表示医学本体节点,且a也表示CCS或ICD中的编码code,a1表示第一个祖先节点在CCS或ICD中的编码code,a2表示第二个祖先节点在CCS或ICD中的编码code,/>表示第/>个祖先节点在CCS或ICD中的编码code。
在本实施例中,首先将医学本体图谱定义为,其中,医学本体图谱中的各节点与诊次数据集中的医学代码节点相同;并且在医学本体图谱/>中存在子图/>,/>,其中,M表示诊次的多个医疗编码集合,/>表示祖先节点集合,a表示CCS或ICD中的编码code,因此,对于给定的目标脓毒症患者的诊次集合/>,在诊次集合中,可用/>表示目标脓毒症患者的第i次诊次信息,基于同一目标脓毒症患者的时序诊次信息与医学本体图谱中编码code的映射关系,该诊次集合与选取的子图/>,可以用于对诊次特征矩阵/>中的诊断code进行预测,而对于一个病人的诊次而言,当进行就医过程后,就会形成医生诊断,例如诊断该病人得哪种病,这种病在CCS或ICD中对应有一个特定的编码code。
S104、基于诊次图谱,生成诊次邻接矩阵和诊次特征矩阵。
在本实施例中,生成诊次邻接矩阵,具体包括:基于目标脓毒症患者的诊次图谱,根据诊次图谱/>中的节点以及节点的边,将诊次图谱/>又定义为/>,其中,V表示诊次图谱/>的节点集合,且/>,E表示诊次图谱/>的边集合,并从E中生成诊次邻接矩阵/>。
在本实施例中,生成诊次特征矩阵,具体包括:将诊次图谱的节点集合V中的每个节点均进行/>编码处理,其中,在对每个节点进行/>编码处理过程中,每个节点的时序诊次信息中均包含相关诊断信息、用药信息以及治疗过程相关信息的三类信息,对每一类信息均进行/>编码处理,形成相应种类的/>编码,并将三种类别的/>编码进行拼接,得到目标脓毒症患者的相应节点的向量,将每个节点的向量进行相加,得到目标脓毒症患者的诊次特征矩阵/>,其中,p表示目标脓毒症患者,X表示每次诊次向量,*表示所有诊次集合。
在本实施例中,对于一个图而言,通常定义两个概念,分别为图中的节点以及图中节点的边,即目标脓毒症患者的诊次图谱又可以进行如下定义,,其中,V表示诊次图谱/>的节点集合,且/>,E表示诊次图谱/>的边集合,并且从E中可以直接生成诊次邻接矩阵/>。
在本实施例中,对于诊次图谱的节点集合V,/>,对V中的每个节点均进行/>编码处理,在进行/>编码处理过程中,由于时序诊次信息中包含相关诊断信息、用药信息以及治疗过程相关信息的三类信息,每一类信息都可以形成编码,例如:所有脓毒症患者的全部诊断有100种,假设:a,b,c,d……一直到最后一个诊断为z,总数为100代表全部诊断,那么一个脓毒症患者A的诊断为d,d在这100种诊断的位置值为1,其余位置为0,用0,0,0,1,0,0,……0,0,0,0,0,总数为100,代表相关诊断信息(即诊断)的/>编码,治疗过程相关信息(即过程)及用药信息(即药物治疗)类似,将其进行拼接得到该脓毒症患者这次诊次的/>编码信息,其中,脓毒症患者的每个诊次向量都可以通过本次诊次之前的所有节点的向量之和得到,即可生成目标脓毒症患者的诊次特征矩阵/>,其中,p表示目标脓毒症患者,X表示每次诊次向量,*表示所有诊次集合,用于赋值该脓毒症患者的所有诊次,最终预测的诊次向量/>可以通过将向量/>到向量/>的所有向量进行叠加得到,即/>表示脓毒症患者P的所有时序诊次信息,该诊次特征矩阵不仅包含了医学拓扑结构信息,还包含了脓毒症患者多次就诊的时序诊次信息。
S105、将诊次邻接矩阵和诊次特征矩阵分别输入至ST-GCN网络模型中,得到目标脓毒症患者诊次T的诊断预测结果。
在本实施例中,将诊次邻接矩阵和诊次特征矩阵分别输入至ST-GCN网络模型中,
得到目标脓毒症患者诊次T的诊断预测结果,具体包括:将诊次邻接矩阵和诊次特征矩阵分
别输入至ST-GCN网络模型中,采用诊次特征矩阵进行层归一化处理,基于ST-GCN网络模型,
将诊次邻接矩阵和诊次特征矩阵进行空间和时间的卷积处理,分别得到不同的卷积提取特
征结果,其中,ST-GCN网络模型由6层ST-GCN unit单位堆叠而成,将经过第二层ST-GCN
unit单位提取的卷积提取特征结果、经过第四层ST-GCN unit单位提取的卷积提取特征结
果以及经过第六层ST-GCN unit单位提取的卷积提取特征结果进行组合,并通过最后一层
的全连接层和sigmoid激活函数层,对向量进行multi-hot预测,得到目标脓毒症患者诊
次T的诊断预测结果。
在本实施例中,本发明涉及的ST-GCN网络模型是对诊次邻接矩阵和诊次特征矩阵进行空间和时间的卷积处理,通过设置不同的输出通道,以得到不同的卷积提取特征结果,其中,ST-GCN网络模型中前两层ST-GCN unit单位有64个输出通道,中间两层ST-GCN unit单位有128个输出通道,最后两层ST-GCN unit单位有256个输出通道,应当理解的是,卷积提取特征结果的每个数字实际不代表任何意义,但是组合起来用于代表当前诊次的隐藏层输出,分别将第二层ST-GCN unit单位、第四层ST-GCN unit单位以及第六层ST-GCN unit单位提取出来的隐藏层输出进行组合,再通过最后一层的全连接层和sigmoid激活函数层,剩余的第一层ST-GCN unit单位、第三层ST-GCN unit单位以及第五层ST-GCN unit单位也用于参与预测,参考图3所示的模型训练框架图,第二层ST-GCN unit单位的输入需要第一层ST-GCN unit单位的输出,而在第二层ST-GCN unit单位输出时输出两份相同的隐藏层输出,其中一份用于参与第三层ST-GCN unit单位的隐藏层计算,另一份用于与第四层ST-GCNunit单位的隐藏层输出以及第六层ST-GCN unit单位的隐藏层输出进行组合拼接,以便对向量进行multi-hot预测;而最后一层的全连接层和sigmoid激活函数层均不属于上述的ST-GCN unit单位,全连接层和sigmoid激活函数层分别是一个单独的网络层进行输出,sigmoid激活函数层为一个激活函数,其公式为/> ,进而将输出结果映射到0-1之前,用于代表每个诊断code的概率,并且选取最大概率的诊断code作为模型的诊次T的诊断预测结果。
本实施例提供的一种基于知识图谱的脓毒症时序预测方法,包括:获取脓毒症患者的时序诊次信息,将时序诊次信息进行预处理,形成诊次数据集;基于CCS或ICD编码技术,构建医学本体图谱;基于医学本体图谱,根据目标脓毒症患者的时序诊次信息,构建目标脓毒症患者的诊次图谱;基于诊次图谱,生成诊次邻接矩阵和诊次特征矩阵;将诊次邻接矩阵和诊次特征矩阵分别输入至ST-GCN网络模型中,得到目标脓毒症患者诊次T的诊断预测结果;该实施方法通过将脓毒症患者患者的时序诊次信息和医学知识图谱相结合,实现全流程端到端预测,无需人为干预,不仅有利于模型提取出患者更准确的表征,提升模型预测的准确性,还能够对大量减少医生的工作量,节省医疗资源。
实施例二
本实施例在上述实施例一的基础上,提供一种基于知识图谱的脓毒症时序预测系统200,请参见图4,用于实现上述实施例一所述的一种基于知识图谱的脓毒症时序预测方法的步骤,该系统200主要包括:数据采集模块210、医学本体图谱构建模块220、诊次图谱构建模块230、矩阵构建模块240以及ST-GCN模块250,其中,
数据采集模块210,用于获取脓毒症患者的时序诊次信息,将时序诊次信息进行预处理,形成诊次数据集;
医学本体图谱构建模块220,用于基于CCS或ICD编码技术,构建医学本体图谱;
诊次图谱构建模块230,用于基于医学本体图谱,根据目标脓毒症患者的时序诊次信息,构建目标脓毒症患者的诊次图谱;
矩阵构建模块240,用于基于诊次图谱,生成诊次邻接矩阵和诊次特征矩阵;
ST-GCN模块250,用于将诊次邻接矩阵和诊次特征矩阵分别输入至ST-GCN网络模型中,得到目标脓毒症患者诊次T的诊断预测结果。
实施例三
本实施例在上述实施例一的基础上,还提供一种电子设备,请参见附图5,图5示出的电子设备300仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。
如图5所示,电子设备300可以包括处理装置(例如中央处理器、图形处理器等)301,其可以根据存储在只读存储器(ROM)302中的程序或者从存储装置308加载到随机访问存储器(RAM)303中的程序而执行各种适当的动作和处理。在RAM 303中,还存储有电子设备300操作所需的各种程序和数据。处理装置301、ROM 302以及RAM 303通过总线304彼此相连。输入/输出(I/O)接口305也连接至总线304。
通常,以下装置可以连接至I/O接口305:包括例如触摸屏、触摸板、键盘、鼠标、摄像头等的输入装置306,包括例如液晶显示器(LCD)、扬声器等的输出装置307,包括例如磁带、硬盘等的存储装置308,以及通信装置309。通信装置309可以允许电子设备300与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备300,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图5中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本公开的一些实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的一些实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的一些实施例中,该计算机程序可以通过通信装置309从网络上被下载和安装,或者从存储装置308被安装,或者从ROM 302被安装。在该计算机程序被处理装置301执行时,执行本公开的一些实施例的方法中限定的上述功能。
实施例四
本实施例在上述实施例一的基础上,还提供计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
需要说明的是,本公开的一些实施例上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的一些实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的一些实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在本实施例中,客户端、服务器可以利用诸如HTTP(HyperTextTransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述装置中所包含的,也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取训练数据,将上述训练数据进行转化得到初始数据;基于上述初始数据确定初始规则库,并对上述初始规则库进行参数优化得到目标规则库;根据预设激活权重计算公式对上述目标规则库中的规则进行计算得到激活权重;根据测试数据和上述激活权重,确定异常信息。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的一些实施例的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开的一些实施例中的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括数据获取单元、规则确定单元权重计算单元和异常确定单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,数据获取单元还可以被描述为“获取训练数据的单元”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
以上内容是结合具体的实施方式对本发明所做的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
显然,本领域的技术人员应该明白,上述本发明的各步骤实施方式可以以不同于本发明的方式执行,模拟方法及实验设备包括但不限于上述说明。上述本发明的各步骤在某些情况下可以以不同于此处的顺序执行,上述所示或描述的步骤,可将它们分开执行。所以,本发明不限制于任何特定的硬件和软件结合。
以上内容是结合具体的实施方式对本发明所做的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (5)
1.一种基于知识图谱的脓毒症时序预测方法,其特征在于,包括:
获取脓毒症患者的时序诊次信息,将时序诊次信息进行预处理,形成诊次数据集;其中,将时序诊次信息进行预处理,包括:抽取脓毒症患者的时序诊次信息,对时序诊次信息进行标准化处理以及对时序诊次信息进行医疗编码映射,得到时序诊次数据集;
基于CCS或ICD编码技术,构建医学本体图谱;
基于医学本体图谱,根据目标脓毒症患者的时序诊次信息,构建目标脓毒症患者的诊次图谱;
基于诊次图谱,生成诊次邻接矩阵和诊次特征矩阵;
将诊次邻接矩阵和诊次特征矩阵分别输入至ST-GCN网络模型中,得到目标脓毒症患者诊次T的诊断预测结果;
所述时序诊次信息包括患者入住的诊断信息、用药信息以及治疗过程信息;
所述基于医学本体图谱,根据目标脓毒症患者的时序诊次信息,构建目标脓毒症患者的诊次图谱,具体包括:
将医学本体图谱定义为,其中,医学本体图谱中的各节点与诊次数据集中的医学代码节点相同;
提取目标脓毒症患者的时序诊次信息,形成目标脓毒症患者的诊次集合,其中,/>表示目标脓毒症患者的第T-1次诊次信息;
基于同一目标脓毒症患者的时序诊次信息与医学本体图谱中编码code的映射关系,在医学本体图谱中选取子图作为目标脓毒症患者的诊次图谱/>,/>,其中,M表示诊次的多个医疗编码集合,/>表示祖先节点集合,a表示CCS或ICD中的编码code,a1表示第一个祖先节点在CCS或ICD中的编码code,a2表示第二个祖先节点在CCS或ICD中的编码code,/>表示第/>个祖先节点在CCS或ICD中的编码code;
生成所述诊次邻接矩阵,具体包括:基于目标脓毒症患者的诊次图谱,根据诊次图谱中的节点以及节点的边,将诊次图谱/>又定义为/>,其中,V表示诊次图谱/>的节点集合,且/>,/>表示同一目标脓毒症患者的时序诊次信息与医学本体图谱中编码code的映射关系,E表示诊次图谱/>的边集合,并从E中生成诊次邻接矩阵/>;
生成所述诊次特征矩阵,具体包括:将诊次图谱的节点集合V中的每个节点均进行编码处理,其中,在对每个节点进行/>编码处理过程中,每个节点的时序诊次信息中均包含相关诊断信息、用药信息以及治疗过程相关信息的三类信息,对每一类信息均进行/>编码处理,形成相应种类的/>编码,并将三种类别的/>编码进行拼接,得到目标脓毒症患者的相应节点的向量,将每个节点的向量进行相加,得到目标脓毒症患者的诊次特征矩阵/>,其中,p表示目标脓毒症患者,X表示每次诊次向量,*表示所有诊次集合;
所述将诊次邻接矩阵和诊次特征矩阵分别输入至ST-GCN网络模型中,得到目标脓毒症患者诊次T的诊断预测结果,具体包括:将诊次邻接矩阵和诊次特征矩阵分别输入至ST-GCN网络模型中,采用诊次特征矩阵进行层归一化处理,基于ST-GCN网络模型,将诊次邻接矩阵和诊次特征矩阵进行空间和时间的卷积处理,分别得到不同的卷积提取特征结果,其中,ST-GCN网络模型由6层ST-GCN unit单位堆叠而成,将经过第二层ST-GCN unit单位提取的卷积提取特征结果、经过第四层ST-GCN unit单位提取的卷积提取特征结果以及经过第六层ST-GCN unit单位提取的卷积提取特征结果进行组合,并通过最后一层的全连接层和sigmoid激活函数层,对向量进行multi-hot预测,其中,/>代表目标脓毒症患者P第T次的诊次向量X,得到目标脓毒症患者诊次T的诊断预测结果。
2.根据权利要求1所述的一种基于知识图谱的脓毒症时序预测方法,其特征在于,所述ST-GCN网络模型中前两层ST-GCN unit单位有64个输出通道,中间两层ST-GCN unit单位有128个输出通道,最后两层ST-GCN unit单位有256个输出通道。
3.一种基于知识图谱的脓毒症时序预测系统,其特征在于,包括:
数据采集模块,用于获取脓毒症患者的时序诊次信息,将时序诊次信息进行预处理,形成诊次数据集;
医学本体图谱构建模块,用于基于CCS或ICD编码技术,构建医学本体图谱;
诊次图谱构建模块,用于基于医学本体图谱,根据目标脓毒症患者的时序诊次信息,构建目标脓毒症患者的诊次图谱;
矩阵构建模块,用于基于诊次图谱,生成诊次邻接矩阵和诊次特征矩阵;
ST-GCN模块,用于将诊次邻接矩阵和诊次特征矩阵分别输入至ST-GCN网络模型中,得到目标脓毒症患者诊次T的诊断预测结果;
时序诊次信息包括患者入住的诊断信息、用药信息以及治疗过程信息;
基于医学本体图谱,根据目标脓毒症患者的时序诊次信息,构建目标脓毒症患者的诊次图谱,具体包括:
将医学本体图谱定义为,其中,医学本体图谱中的各节点与诊次数据集中的医学代码节点相同;
提取目标脓毒症患者的时序诊次信息,形成目标脓毒症患者的诊次集合,其中,/>表示目标脓毒症患者的第T-1次诊次信息;
基于同一目标脓毒症患者的时序诊次信息与医学本体图谱中编码code的映射关系,在医学本体图谱中选取子图作为目标脓毒症患者的诊次图谱/>,/>,其中,M表示诊次的多个医疗编码集合,/>表示祖先节点集合,a表示CCS或ICD中的编码code,a1表示第一个祖先节点在CCS或ICD中的编码code,a2表示第二个祖先节点在CCS或ICD中的编码code,/>表示第/>个祖先节点在CCS或ICD中的编码code;
生成所述诊次邻接矩阵,具体包括:基于目标脓毒症患者的诊次图谱,根据诊次图谱中的节点以及节点的边,将诊次图谱/>又定义为/>,其中,V表示诊次图谱/>的节点集合,且/>,/>表示同一目标脓毒症患者的时序诊次信息与医学本体图谱中编码code的映射关系,E表示诊次图谱/>的边集合,并从E中生成诊次邻接矩阵/>;
生成所述诊次特征矩阵,具体包括:将诊次图谱的节点集合V中的每个节点均进行编码处理,其中,在对每个节点进行/>编码处理过程中,每个节点的时序诊次信息中均包含相关诊断信息、用药信息以及治疗过程相关信息的三类信息,对每一类信息均进行/>编码处理,形成相应种类的/>编码,并将三种类别的/>编码进行拼接,得到目标脓毒症患者的相应节点的向量,将每个节点的向量进行相加,得到目标脓毒症患者的诊次特征矩阵/>,其中,p表示目标脓毒症患者,X表示每次诊次向量,*表示所有诊次集合;
将诊次邻接矩阵和诊次特征矩阵分别输入至ST-GCN网络模型中,得到目标脓毒症患者诊次T的诊断预测结果,具体包括:将诊次邻接矩阵和诊次特征矩阵分别输入至ST-GCN网络模型中,采用诊次特征矩阵进行层归一化处理,基于ST-GCN网络模型,将诊次邻接矩阵和诊次特征矩阵进行空间和时间的卷积处理,分别得到不同的卷积提取特征结果,其中,ST-GCN网络模型由6层ST-GCN unit单位堆叠而成,将经过第二层ST-GCN unit单位提取的卷积提取特征结果、经过第四层ST-GCN unit单位提取的卷积提取特征结果以及经过第六层ST-GCN unit单位提取的卷积提取特征结果进行组合,并通过最后一层的全连接层和sigmoid激活函数层,对向量进行multi-hot预测,其中,/>代表目标脓毒症患者P第T次的诊次向量X,得到目标脓毒症患者诊次T的诊断预测结果。
4.一种电子设备,包括存储器、处理器以及存储在所述存储器中并且可以在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至2中任一项所述方法的步骤。
5.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至2中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311452738.7A CN117174319B (zh) | 2023-11-03 | 2023-11-03 | 一种基于知识图谱的脓毒症时序预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311452738.7A CN117174319B (zh) | 2023-11-03 | 2023-11-03 | 一种基于知识图谱的脓毒症时序预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117174319A CN117174319A (zh) | 2023-12-05 |
CN117174319B true CN117174319B (zh) | 2024-03-01 |
Family
ID=88947318
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311452738.7A Active CN117174319B (zh) | 2023-11-03 | 2023-11-03 | 一种基于知识图谱的脓毒症时序预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117174319B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111367961A (zh) * | 2020-02-27 | 2020-07-03 | 西安交通大学 | 基于图卷积神经网络的时序数据事件预测方法、系统及其应用 |
CN111370122A (zh) * | 2020-02-27 | 2020-07-03 | 西安交通大学 | 一种基于知识指导的时序数据风险预测方法、系统及其应用 |
CN112037912A (zh) * | 2020-09-09 | 2020-12-04 | 平安科技(深圳)有限公司 | 基于医疗知识图谱的分诊模型训练方法、装置及设备 |
CN115426671A (zh) * | 2022-09-01 | 2022-12-02 | 中国电信股份有限公司 | 图神经网络训练、无线小区故障预测方法、系统及设备 |
CN115658927A (zh) * | 2022-11-17 | 2023-01-31 | 浙江大学 | 一种面向时序知识图谱的无监督实体对齐方法及装置 |
CN116364299A (zh) * | 2023-03-30 | 2023-06-30 | 之江实验室 | 一种基于异构信息网络的疾病诊疗路径聚类方法及系统 |
CN116562449A (zh) * | 2023-05-10 | 2023-08-08 | 山东师范大学 | 基于知识图谱与时空图卷积的行人流量预测方法及系统 |
CN116682553A (zh) * | 2023-08-02 | 2023-09-01 | 浙江大学 | 一种融合知识与患者表示的诊断推荐系统 |
CN116956002A (zh) * | 2022-11-16 | 2023-10-27 | 腾讯科技(深圳)有限公司 | 诊疗信息预测模型的训练方法、装置、设备及存储介质 |
-
2023
- 2023-11-03 CN CN202311452738.7A patent/CN117174319B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111367961A (zh) * | 2020-02-27 | 2020-07-03 | 西安交通大学 | 基于图卷积神经网络的时序数据事件预测方法、系统及其应用 |
CN111370122A (zh) * | 2020-02-27 | 2020-07-03 | 西安交通大学 | 一种基于知识指导的时序数据风险预测方法、系统及其应用 |
CN112037912A (zh) * | 2020-09-09 | 2020-12-04 | 平安科技(深圳)有限公司 | 基于医疗知识图谱的分诊模型训练方法、装置及设备 |
WO2021151325A1 (zh) * | 2020-09-09 | 2021-08-05 | 平安科技(深圳)有限公司 | 基于医疗知识图谱的分诊模型训练方法、装置及设备 |
CN115426671A (zh) * | 2022-09-01 | 2022-12-02 | 中国电信股份有限公司 | 图神经网络训练、无线小区故障预测方法、系统及设备 |
CN116956002A (zh) * | 2022-11-16 | 2023-10-27 | 腾讯科技(深圳)有限公司 | 诊疗信息预测模型的训练方法、装置、设备及存储介质 |
CN115658927A (zh) * | 2022-11-17 | 2023-01-31 | 浙江大学 | 一种面向时序知识图谱的无监督实体对齐方法及装置 |
CN116364299A (zh) * | 2023-03-30 | 2023-06-30 | 之江实验室 | 一种基于异构信息网络的疾病诊疗路径聚类方法及系统 |
CN116562449A (zh) * | 2023-05-10 | 2023-08-08 | 山东师范大学 | 基于知识图谱与时空图卷积的行人流量预测方法及系统 |
CN116682553A (zh) * | 2023-08-02 | 2023-09-01 | 浙江大学 | 一种融合知识与患者表示的诊断推荐系统 |
Non-Patent Citations (2)
Title |
---|
一种面向临床领域时序知识图谱的链接预测模型;陈德华;殷苏娜;乐嘉锦;王梅;潘乔;朱立峰;;计算机研究与发展(12);全文 * |
单时序特征图卷积网络融合预测方法;李昊天;盛益强;;计算机与现代化(09);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117174319A (zh) | 2023-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11152119B2 (en) | Care path analysis and management platform | |
US11276495B2 (en) | Systems and methods for predicting multiple health care outcomes | |
US20110112380A1 (en) | Method and System for Optimal Estimation in Medical Diagnosis | |
US10923234B2 (en) | Analysis and verification of models derived from clinical trials data extracted from a database | |
CN113191479B (zh) | 联合学习的方法、系统、节点及存储介质 | |
US20190095793A1 (en) | Sensor quality upgrade framework | |
CN115985513B (zh) | 一种基于多组学癌症分型的数据处理方法、装置及设备 | |
CN112768056A (zh) | 基于联合学习框架的疾病预测模型建立方法和装置 | |
CN115330669A (zh) | 预测解剖结构的疾病量化参数的计算机实现的方法、系统及存储介质 | |
Stephen et al. | IOT-Based Generic Health Monitoring with Cardiac Classification Using Edge Computing. | |
WO2022178995A1 (zh) | Ct图像去噪处理方法、装置、计算机设备及介质 | |
CN110088748A (zh) | 问题生成方法和装置、问诊系统、计算机可读存储介质 | |
JP2020042645A (ja) | 時系列データ分析装置、時系列データ分析方法、および時系列データ分析プログラム | |
CN117174319B (zh) | 一种基于知识图谱的脓毒症时序预测方法及系统 | |
CN112397194B (zh) | 用于生成患者病情归因解释模型的方法、装置和电子设备 | |
CN115658877B (zh) | 基于强化学习的药物推荐方法、装置、电子设备和介质 | |
CN116543917A (zh) | 一种针对异构时间序列数据的信息挖掘方法 | |
Sufriyana et al. | Deep-insight visible neural network (DI-VNN) for improving interpretability of a non-image deep learning model by data-driven ontology | |
CN115862881A (zh) | 医嘱信息的确定方法、装置、存储介质及电子设备 | |
US20230252268A1 (en) | Predicting states of a test entity | |
CN114610648A (zh) | 一种测试方法、装置及设备 | |
CN110335679B (zh) | 一种基于多粒度图模式挖掘的生存预测方法及系统 | |
CN116543853A (zh) | 药物相互作用预测方法、计算机设备及介质 | |
CN115803821A (zh) | 智能分诊方法、装置、存储介质及电子设备 | |
CN117747124B (zh) | 基于网络激发图分解的医学大模型逻辑反演方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |