CN117594241B - 基于时序知识图谱邻域推理的透析低血压预测方法及装置 - Google Patents
基于时序知识图谱邻域推理的透析低血压预测方法及装置 Download PDFInfo
- Publication number
- CN117594241B CN117594241B CN202410052402.XA CN202410052402A CN117594241B CN 117594241 B CN117594241 B CN 117594241B CN 202410052402 A CN202410052402 A CN 202410052402A CN 117594241 B CN117594241 B CN 117594241B
- Authority
- CN
- China
- Prior art keywords
- patient
- dialysis
- month
- time sequence
- constructing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000502 dialysis Methods 0.000 title claims abstract description 127
- 208000001953 Hypotension Diseases 0.000 title claims abstract description 77
- 230000036543 hypotension Effects 0.000 title claims abstract description 76
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000001631 haemodialysis Methods 0.000 claims abstract description 27
- 230000000322 hemodialysis Effects 0.000 claims abstract description 27
- 238000013528 artificial neural network Methods 0.000 claims abstract description 14
- 230000004927 fusion Effects 0.000 claims abstract description 13
- 238000010276 construction Methods 0.000 claims abstract description 9
- 230000008569 process Effects 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 12
- 230000009466 transformation Effects 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000007689 inspection Methods 0.000 claims description 3
- 238000005065 mining Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000007429 general method Methods 0.000 description 3
- 230000036772 blood pressure Effects 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 206010062300 Procedural hypotension Diseases 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 239000003146 anticoagulant agent Substances 0.000 description 1
- 229940127219 anticoagulant drug Drugs 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 208000021822 hypotensive Diseases 0.000 description 1
- 230000001077 hypotensive effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000003055 low molecular weight heparin Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Public Health (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Primary Health Care (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Epidemiology (AREA)
- Pathology (AREA)
- Biomedical Technology (AREA)
- External Artificial Organs (AREA)
Abstract
本发明提出一种基于时序知识图谱邻域推理的透析低血压预测方法,包括,获取患者的透析数据集;根据透析数据集构建血液透析患者时序知识图谱,并构建多月份的时序窗口数据;从血液透析患者时序知识图谱中提取患者图谱邻域信息;根据患者图谱邻域信息对时序窗口数据进行融合;根据融合的结果使用人工神经网络进行患者低血压的预测。通过本发明提出的方法,可用于预测透析低血压发生、挖掘透析低血压的高危因素,从而帮助透析患者降低低血压发病率。本发明中的知识图谱构建和推理方法较为通用,能够推广到医学场景中利用时序数据进行医学事件预测的任务。
Description
技术领域
本发明属于大数据、人工智能、血液透析与知识图谱领域。
背景技术
透析中低血压(intradialytic hypotension,IDH)是透析患者最常见的并发症之一,它降低了患者的生活质量、甚至提高了患者的死亡风险。对透析中低血压进行预测能够指导医师提前采取措施,从而降低低血压的发生率。然而,当前的IDH预测研究大部分都还依赖于传统的机器学习模型,对深度学习模型的应用和探索还停留在浅表阶段。深度学习社区近年来涌现了很多复杂的架构,例如RNN,CNN,GNN。它们引入不同的归纳偏置,让模型高效的的处理和学习不同类型的数据。
知识图谱是一种基于图结构的数据表示方式,图中节点代表现实世界的实体,边代表实体间的关系。知识图谱不仅包含了丰富的结构化信息,例如三元组,也包含了大量的隐式信息,例如邻域、多跳路径和隐式逻辑规则。通过对先验知识和各个种类的信息的使用,基于知识图谱的推理能取得更加精准的结果。此外,知识图谱也提供了灵活的数据表示方式。图中节点可以代表不同模态的实体,从而让复杂场景中异质信息的表示和融合更加方便。近年来有越来越多的工作在研究多模态知识图的谱推理。基于知识图谱的上述优点,基于知识图谱推理的透析中低血压预测的研究是很值得的。
透析预测场景和知识图谱通用推理场景存在一定的区别,这给知识图谱推理的落地带来一定的挑战。(1)透析场景数据丰富、知识缺少。由于透析低血压缺乏广泛一致的共识,缺乏足够的领域知识来构建概念性实体间的关联关系,该场景仅拥有大量的患者病历数据。需要解决基于大量的患者病历数据利用知识图谱推理模型进行透析预测的问题。(2)泛化性要求对推理信息使用的限制。通用场景中,推理模型为每一个节点学习一个嵌入,然后基于这些嵌入来进行信息聚合和后续推理。透析场景中,为了让模型的推理过程能泛化到未见过的患者,不能为不同患者节点学习单独嵌入。本发明要寻找一种可泛化的推理方式来解决低血压预测问题。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的目的在于提出一种基于时序知识图谱邻域推理的透析低血压预测方法,用于低血压预测。
为达上述目的,本发明第一方面实施例提出了一种基于时序知识图谱邻域推理的透析低血压预测方法,包括:
获取患者的透析数据集;
根据所述透析数据集构建血液透析患者时序知识图谱,并构建多月份的时序窗口数据;
从所述血液透析患者时序知识图谱中提取患者图谱邻域信息;
根据所述患者图谱邻域信息对所述时序窗口数据进行融合;
根据融合的结果使用人工神经网络进行患者低血压的预测。
另外,根据本发明上述实施例的一种基于时序知识图谱邻域推理的透析低血压预测方法还可以具有以下附加的技术特征:
进一步地,在本发明的一个实施例中,所述根据所述透析数据集构建血液透析患者时序知识图谱,包括:
对所述透析数据集进行预处理,得到透析session数据库和透析实时数据库;其中,session指患者通过透析机器完成一次透析的过程,通常为4小时左右;
根据所述透析session数据库和所述透析实时数据库构建session粒度数据;
基于session粒度数据构建月份粒度数据集;
根据所述月份粒度数据集构建患者时序知识图谱。
进一步地,在本发明的一个实施例中,所述基于session粒度数据构建月份粒度数据集,包括:
对于session粒度数据,增加月份相关的特征,从所述session数据数据中获得本月透析次数,从基本信息中获得透析龄、年龄,从检查数据中透析前后的指标计算透析期间的数值变换,然后将session层次的数据压缩到月份层次;
对于文本型数值,若字段分布集中,使用众数代表当月取值,若字段分布分散,使用不同类型的频率来描述该字段;
对于数值型数据,通过月份内的平均值作为该月份的取值。
进一步地,在本发明的一个实施例中,所述根据所述月份粒度数据集构建患者时序知识图谱,包括:
以特征的类型为边,所述特征的具体取值为实体;对于每个月份的记录,创建一个虚拟的患者节点,以所述患者节点为中心,通过不同的边连接所述特征取值的实体,对于特征取值为空的则该边不存在。
进一步地,在本发明的一个实施例中,所述从所述血液透析患者时序知识图谱中提取患者图谱邻域信息,包括:
基于患者当月的知识图谱和患者当月可见特征掩码,通过可见特征引导的图卷积对患者第i个月的邻域信息进行聚合,获得了所述患者在观测窗口第个月份的表示:
其中,代表关系r的注意力,/>代表关系r的变换矩阵,/>代表节点u的嵌入。
进一步地,在本发明的一个实施例中,所述根据所述患者图谱邻域信息对所述时序窗口数据进行融合,包括:
将时序窗口内不同的月份依次输入到LSTM中,以最后一个月份在LSTM的输出作为患者p在该窗口的表示,LSTM的每一步的形式化定义如下:
,
其中,,o,h,c分别代表LSTM的输出,隐藏状态,细胞状态,T为时序窗口的长度,/>代表融合了时序窗口中所有月份后的患者表示。
进一步地,在本发明的一个实施例中,所述根据融合的结果使用人工神经网络进行患者低血压的预测,包括:
将患者在某个观测窗口的表示输入人工神经网络MLP,获得该窗口中患者最后一个月出现频繁低血压的概率。
为达上述目的,本发明第二方面实施例提出了一种基于时序知识图谱邻域推理的透析低血压预测装置,包括以下模块:
获取模块,用于获取患者的透析数据集;
构建模块,用于根据所述透析数据集构建血液透析患者时序知识图谱,并构建多月份的时序窗口数据;
提取模块,用于从所述血液透析患者时序知识图谱中提取患者图谱邻域信息;
融合模块,用于根据所述患者图谱邻域信息对所述时序窗口数据进行融合;
预测模块,用于根据融合的结果使用人工神经网络进行患者低血压的预测。
为达上述目的,本发明第三方面实施例提出了一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如上所述的一种基于时序知识图谱邻域推理的透析低血压预测方法。
为达上述目的,本发明第四方面实施例提出了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上所述的一种基于时序知识图谱邻域推理的透析低血压预测方法。
本发明实施例提出的基于时序知识图谱邻域推理的透析低血压预测方法,提出了一种构建时序血液透析患者知识图谱的通用方法,并为透析低血压预测领域提供了新的深度学习的方法。本发明将知识图谱推理运用到透析低血压预测,克服了落地过程中低血压场景特点和泛化性要求带来的2个困难。本发明可用于预测透析低血压发生、挖掘透析低血压的高危因素,从而帮助透析患者降低低血压发病率。本发明提出的方法在透析场景中较为通用,虽然本发明以月份为粒度来阐述,但本发明的建模方式和处理方法也可以推广到session和实时的预测场景上。本发明中的知识图谱构建和推理方法较为通用,能够推广到医学场景中利用时序数据进行医学事件预测的任务。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例所提供的一种基于时序知识图谱邻域推理的透析低血压预测方法的流程示意图;
图2为本发明实施例所提供的一种基于时序知识图谱邻域推理的透析低血压预测方法总体设计示意图;
图3为本发明实施例所提供的一种患者图谱邻域信息提取示意图;
图4为本发明实施例所提供的一种患者观测窗口时序信息融合示意图;
图5为本发明实施例所提供的一种基于患者邻域和时序信息的低血压预测示意图;
图6为本发明实施例所提供的一种基于时序知识图谱邻域推理的透析低血压预测装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的基于时序知识图谱邻域推理的透析低血压预测方法。
图1为本发明实施例所提供的一种基于时序知识图谱邻域推理的透析低血压预测方法的流程示意图。
如图1所示,该基于时序知识图谱邻域推理的透析低血压预测方法包括以下步骤:
S101:获取患者的透析数据集;
本发明基于北京市的一家医院提供的透析数据集,数据集的使用已获得医院的同意。该数据集由4个数据库组成,包含了532个患者的透析情况。本发明使用了2017年1月到2022年8月期间的患者数据来构建本发明本工作的数据集。平均上看,患者每月进行1次体检,1周进行3次透析,每次透析进行4个小时。实时数据由透析机记录,每小时产生1条。数据库包含的信息表1所示。
表1
S102:根据所述透析数据集构建血液透析患者时序知识图谱,并构建多月份的时序窗口数据;
进一步地,在本发明的一个实施例中,所述根据所述透析数据集构建血液透析患者时序知识图谱,包括:
对所述透析数据集进行预处理,得到透析session数据库和透析实时数据库;其中,session指患者通过透析机器完成一次透析的过程,通常为4小时左右;
根据所述透析session数据库和所述透析实时数据库构建session粒度数据;
基于session粒度数据构建月份粒度数据集;
根据所述月份粒度数据集构建患者时序知识图谱。
具体地,针对不同的数据库本发明采用了不同的预处理方式。
对于实验室检查,本发明首先对错误值进行去除,例如负数结果、非数值的无意义字符。然后对缺失值进行处理,如果空值前60天内有结果,则用最近的结果进行填充,填充完后,本发明去除空值比例超过85%的特征。
对于透析实时数据,本发明根据医生人工给出的范围去除错误值。对于透析session数据,本发明首先根据医生人工给出的范围去除错误值。然后进行缺失值处理,包括:利用冗余的列计算缺失特征,部分透析前指标通过透析实时数据的第0个小时的值进行补全。
在session粒度数据构建上,本发明首先基于透析session数据库和透析实时数据库,构建session粒度的数据。
本发明对透析session数据库里的特征进行进一步处理,并对session低血压进行判定。此外,本发明对一些透析中重要指标进行计算,例如超滤率,体重干体重差, 透析期间体重增长。最后,移除session数据里的冗余的字段。
本发明以透析期间SBP减少的值≥20mmHg作为session低血压定义。具体来说,一个session对应的实时数据里,若任意一条记录的SBP+20小于该session的SBP,则该session被判定为透析中低血压(IDH)。
进一步地,在本发明的一个实施例中,所述基于session粒度数据构建月份粒度数据集,包括:
对于session粒度数据,增加月份相关的特征,从所述session数据数据中获得本月透析次数,从基本信息中获得透析龄、年龄,从检查数据中透析前后的指标计算透析期间的数值变换,然后将session层次的数据压缩到月份层次;
对于文本型数值,若字段分布集中,使用众数代表当月取值,若字段分布分散,使用不同类型的频率来描述该字段;
对于数值型数据,通过月份内的平均值作为该月份的取值。
对于时序患者知识图谱构建,本发明首先将月份粒度的数据进行处理,然后将其构建为患者知识图谱。接着,为了利用多个月份的信息进行预测,本发明将多个月份的数据构建为一个时序观测窗口。最后,本发明对所有时序窗口进行划分,获得最终的数据集。
本发明对所有的数值型的字段通过使用Quantile-based discretization进行离散化,处理将其划分为5个区间。对于低血压频率,本发明以30%为阈值,将频率大于等于30%的月份视为IDH,其他视为血压正常。
进一步地,在本发明的一个实施例中,所述根据所述月份粒度数据集构建患者时序知识图谱,包括:
以特征的类型为边,所述特征的具体取值为实体;对于每个月份的记录,创建一个虚拟的患者节点,以所述患者节点为中心,通过不同的边连接所述特征取值的实体,对于特征取值为空的则该边不存在。
构建的一个样例如图2所示。
为了利用多个月份内的信息来进行IDH预测,本发明基于前面的月份数据进一步构建了多月份的时序窗口数据。构建时序观测窗口时,本发明设置观测窗口的长度T=6,并在月份数据中除去月份记录数量少于T的患者。在剩余的月份数据中,对于每一个月份,若该月份之前的T-1个数量的月份有记录,则将这T个月份视为一个独立的观测窗口。为了让观测窗口之间独立和防止数据泄露,每个窗口仅保留最后一个月低血压发生的情况作为预测目标,该窗口内剩余月份的血压情况不可见。
完成数据集构建后,本发明为模型训练对数据集进行划分。在所有时序窗口中,本发明保留1000个窗口作为验证集,用来搜索模型的最佳超参数,保留1000个窗口作为测试集,用来报告模型的性能。划分时,本发明保证了不同划分内的窗口内最后一个月的统计数据、低血压频率接近。
时序窗口数据集是基于月份数据集构建的,并且月份数据集中不包含重复的月份。因此,本发明首先介绍月份粒度数据集的情况。
月份数据集包含了532患者的18309独立的月份信息。该数据集上共有104个特征,特征及其类型的总结如表2所示。数据集上,不同月份记录的可见特征数量(取值非空特征)是不一样的,可见特征数量的平均值和标准差是77±18。
表2
月份内IDH频率的均值和标准差为:40.9%±31.6%。根据30%为界限划为频繁低血压后,频繁低血压月份共占10460个月份(57.4%)。
对于最终的时序知识图谱,其统计数据如下:该时序数据集包含了458名患者的15807个独立的观测窗口。该知识图谱上总共有505个实体(例如:心率69.8-74.5,男性,低分子肝素),105个关系(例如:透析前心率,性别,抗凝剂)。
S103:从所述血液透析患者时序知识图谱中提取患者图谱邻域信息;
下面讲述如何在时序窗口患者知识图谱上利用基于知识图谱邻域信息的可泛化推理进行低血压预测。本发明首先使用一个可见特征引导的图卷积模块对月份层次的患者邻域信息进行聚合,以患者的邻域结构来作为可泛化的患者表示。然后,本发明使用序列模型对时序窗口内的不同月份的患者状态信息进行融合,获得患者在该窗口内的表示。最后本发明通过预测MLP对患者窗口表示进行处理和变换,获得最终的预测结果。
在下面的叙述中,知识图谱以来表示,其中/>代表实体集合,/>代表关系集合。实体集合/>中的节点由特征取值、透析结果节点和虚拟的患者节点/>组成。关系集合/>的关系由数据集中所有患者的全部可见特征的类型组成。
首先,对时序窗口中某个单独的月份上的患者图谱的领域信息聚合。
输入由两部份组成:1)患者当月的知识图谱。2)患者当月可见特征掩码。患者p在时序窗口第个月的知识图谱可用一个集合/>表示。患者在该月份的可见特征掩码用/>表示。该向量中元素的取值如下:
当且仅当患者在月时通过关系/>连接到了某个特征实体,/>。
进一步地,在本发明的一个实施例中,所述从所述血液透析患者时序知识图谱中提取患者图谱邻域信息,包括:
基于患者当月的知识图谱和患者当月可见特征掩码,通过可见特征引导的图卷积对患者第i个月的邻域信息进行聚合,获得了所述患者在观测窗口第个月份的表示:
其中,代表关系r的注意力,/>代表关系r的变换矩阵,/>代表节点u的嵌入。
卷积器由2部分组成:1)特征注意力模块 2)患者为中心的异质图卷积。
特征注意力模块以特征掩码为输入,获得一个注意力向量/>。特征掩码首先输入到一个注意力MLP里,获得原始注意力分数/>
原始注意力分数经过掩码修正后经过一个softmax函数,获得最终的注意力
其中代表元素积。最终的注意力/>的每一个维度/>代表某个关系在该特征分布下的重要性。
患者为中心的异质图卷积是基于RGCN设计的。RGCN为每一个节点赋予一个嵌入/>,为每一个关系/>赋予一个变换矩阵/>,通过关系变换矩阵,将不同类型的节点变换到同一空间中。最后对对变换后的邻域节点/>和中心节点/>的表示求和,获得邻域节点的信息/>。
在本发明的卷积中,本发明去掉了患者的嵌入,并利用特征注意力模块提供的注意力,有选择的聚合重要的邻居信息。该聚合方式的形式化定义如上面的公式所示。
通过可见特征引导的图卷积,本发明获得了患者在观测窗口第/>个月份的表示/>。该过程的示意图如图3所示。
S104:根据所述患者图谱邻域信息对所述时序窗口数据进行融合;
具体地,患者p在一个长度为观测窗口的多个月份的时序知识图谱对应的嵌入。一个长度为/>的时序窗口中包含了某个患者多个月份的患者知识图谱,这些知识图谱对应的嵌入的列表是输入,一个嵌入的序列/>,对应到了患者/>的长度为/>的时序窗口中所有月份的患者知识图谱/>。
进一步地,在本发明的一个实施例中,所述根据所述患者图谱邻域信息对所述时序窗口数据进行融合,包括:
将时序窗口内不同的月份依次输入到LSTM中,以最后一个月份在LSTM的输出作为患者p在该窗口的表示,LSTM的每一步的形式化定义如下:
,
其中,,o,h,c分别代表LSTM的输出,隐藏状态,细胞状态,T为时序窗口的长度,/>代表融合了时序窗口中所有月份后的患者表示。
本发明以代表融合了时序窗口中所有月份后的患者表示。该过程的示意图如图4所示。
S105:根据融合的结果使用人工神经网络进行患者低血压的预测。
进一步地,在本发明的一个实施例中,所述根据融合的结果使用人工神经网络进行患者低血压的预测,包括:
将患者在某个观测窗口的表示输入人工神经网络MLP,获得该窗口中患者最后一个月出现频繁低血压的概率。
具体地,输入为患者p在某个观测窗口的表示。我们使用一个预测MLP对患者的窗口表示进行变换和处理,获得该窗口中患者最后一个月出现频繁低血压的概率。
最后输出患者p在某个窗口内最后一个月会出现频繁低血压的概率。
该过程的示意图如图5所示。
我们使用二分类交叉熵函数来定义患者p在某个时序窗口的损失:
其中当患者在窗口中最后一个月有低血压时,其他情况时/>。
最终的损失为训练集上不同患者所有窗口的损失的和。
本发明实施例提出的基于时序知识图谱邻域推理的透析低血压预测方法,提出了一种构建时序血液透析患者知识图谱的通用方法,并为透析低血压预测领域提供了新的深度学习的方法。本发明将知识图谱推理运用到透析低血压预测,克服了落地过程中低血压场景特点和泛化性要求带来的2个困难。本发明可用于预测透析低血压发生、挖掘透析低血压的高危因素,从而帮助透析患者降低低血压发病率。本发明提出的方法在透析场景中较为通用,虽然本发明以月份为粒度来阐述,但本发明的建模方式和处理方法也可以推广到session和实时的预测场景上。本发明中的知识图谱构建和推理方法较为通用,能够推广到医学场景中利用时序数据进行医学事件预测的任务。
1)本发明提出了一种构建时序血液透析患者知识图谱的通用方法,能够基于透析医学中心的多个患者数据库的信息,构建出一个具有时序信息患者知识图谱。在该发明中,本发明以月份为粒度,构造了观测窗口长度为半年的时序知识图谱。但该方法可推广到实时和session为粒度的场景中,构建观测窗口为多个timestamp和多个session的时序知识图谱,从而进行实时粒度或是session粒度的透析中低血压预测。基于透析患者数据库来构建的时序知识图谱的方法较为本发明的一个关键技术,应予以保护。
2)本发明提出一种基于时序患者知识图谱的可泛化邻域推理的血液透析低血压预测方法。该方法从患者的特征节点构成的邻域中获得可泛化的表示,然后用序列模型对观测窗口内不同月份的表示进行信息交互和融合,最后将融合了时序和邻域信息的患者表示经过神经网络获得最终的预测。该预测推理方法克服了知识图谱推理落地过程中低血压场景特点和泛化性要求带来的2个困难,并取得了理想的预测结果,是本发明的一个关键技术,应予以保护。
3)本发明中的患者知识图谱构建和在知识图谱上用患者领域信息进行推理的方法较为通用,能够推广到医学场景中利用时序数据进行医学事件预测的任务。基于本文所述的构造方法和推理方法来解决时序医学事件预测的方法为本发明的一个关键技术,应予以保护。
为了实现上述实施例,本发明还提出基于时序知识图谱邻域推理的透析低血压预测装置。
图6为本发明实施例提供的一种基于时序知识图谱邻域推理的透析低血压预测装置的结构示意图。
如图6所示,该基于时序知识图谱邻域推理的透析低血压预测装置包括:获取模块100,构建模块200,提取模块300,融合模块400,预测模块500,其中,
获取模块,用于获取患者的透析数据集;
构建模块,用于根据所述透析数据集构建血液透析患者时序知识图谱,并构建多月份的时序窗口数据;
提取模块,用于从所述血液透析患者时序知识图谱中提取患者图谱邻域信息;
融合模块,用于根据所述患者图谱邻域信息对所述时序窗口数据进行融合;
预测模块,用于根据融合的结果使用人工神经网络进行患者低血压的预测。
为达上述目的,本发明第三方面实施例提出了一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如上所述的基于时序知识图谱邻域推理的透析低血压预测方法。
为达上述目的,本发明第四方面实施例提出了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上所述的基于时序知识图谱邻域推理的透析低血压预测方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、 “示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (7)
1.一种基于时序知识图谱邻域推理的透析低血压预测方法,其特征在于,包括以下步骤:
获取患者的透析数据集;
根据所述透析数据集构建血液透析患者时序知识图谱,并构建多月份的时序窗口数据;
从所述血液透析患者时序知识图谱中提取患者图谱邻域信息;
根据所述患者图谱邻域信息对所述时序窗口数据进行融合;
根据融合的结果使用人工神经网络进行患者低血压的预测;
其中,所述根据所述透析数据集构建血液透析患者时序知识图谱,包括:
对所述透析数据集进行预处理,得到透析session数据库和透析实时数据库;其中,session指患者通过透析机器完成一次透析的过程;
根据所述透析session数据库和所述透析实时数据库构建session粒度数据;
基于session粒度数据构建月份粒度数据集;
根据所述月份粒度数据集构建患者时序知识图谱;
其中,所述根据所述月份粒度数据集构建患者时序知识图谱,包括:
以特征的类型为边,所述特征的具体取值为实体;对于每个月份的记录,创建一个虚拟的患者节点,以所述患者节点为中心,通过不同的边连接所述特征取值的实体,对于特征取值为空的则该边不存在;
其中,所述从所述血液透析患者时序知识图谱中提取患者图谱邻域信息,包括:
基于患者当月的知识图谱和患者当月可见特征掩码,通过可见特征引导的图卷积对患者第i个月的邻域信息进行聚合,获得了所述患者在观测窗口第个月份的表示:
其中,代表关系r的注意力,/>代表关系r的变换矩阵,/>代表节点u的嵌入,集合/>表示患者p在时序窗口第/>个月的知识图谱。
2.根据权利要求1所述的方法,其特征在于,所述基于session粒度数据构建月份粒度数据集,包括:
对于session粒度数据,增加月份相关的特征,从所述session粒度数据中获得本月透析次数,从基本信息中获得透析龄、年龄,从检查数据中透析前后的指标计算透析期间的数值变换,然后将session层次的数据压缩到月份层次;
对于文本型数值,若字段分布集中,使用众数代表当月取值,若字段分布分散,使用不同类型的频率来描述该字段;
对于数值型数据,通过月份内的平均值作为该月份的取值。
3.根据权利要求1所述的方法,其特征在于,所述根据所述患者图谱邻域信息对所述时序窗口数据进行融合,包括:
将时序窗口内不同的月份依次输入到LSTM中,以最后一个月份在LSTM的输出作为患者p在该窗口的表示,LSTM的每一步的形式化定义如下:
,
其中,,o,h,c分别代表LSTM的输出,隐藏状态,细胞状态,T为时序窗口的长度,/>代表融合了时序窗口中所有月份后的患者表示。
4.根据权利要求1所述的方法,其特征在于,所述根据融合的结果使用人工神经网络进行患者低血压的预测,包括:
将患者在某个观测窗口的表示输入人工神经网络MLP,获得该窗口中患者最后一个月出现频繁低血压的概率,/>代表融合了时序窗口中所有月份后的患者表示。
5.一种基于时序知识图谱邻域推理的透析低血压预测装置,其特征在于,包括以下模块:
获取模块,用于获取患者的透析数据集;
构建模块,用于根据所述透析数据集构建血液透析患者时序知识图谱,并构建多月份的时序窗口数据;
提取模块,用于从所述血液透析患者时序知识图谱中提取患者图谱邻域信息;
融合模块,用于根据所述患者图谱邻域信息对所述时序窗口数据进行融合;
预测模块,用于根据融合的结果使用人工神经网络进行患者低血压的预测;
其中,所述根据所述透析数据集构建血液透析患者时序知识图谱,包括:
对所述透析数据集进行预处理,得到透析session数据库和透析实时数据库;其中,session指患者通过透析机器完成一次透析的过程;
根据所述透析session数据库和所述透析实时数据库构建session粒度数据;
基于session粒度数据构建月份粒度数据集;
根据所述月份粒度数据集构建患者时序知识图谱;
其中,所述根据所述月份粒度数据集构建患者时序知识图谱,包括:
以特征的类型为边,所述特征的具体取值为实体;对于每个月份的记录,创建一个虚拟的患者节点,以所述患者节点为中心,通过不同的边连接所述特征取值的实体,对于特征取值为空的则该边不存在;
其中,所述从所述血液透析患者时序知识图谱中提取患者图谱邻域信息,包括:
基于患者当月的知识图谱和患者当月可见特征掩码,通过可见特征引导的图卷积对患者第i个月的邻域信息进行聚合,获得了所述患者在观测窗口第个月份的表示:
其中,代表关系r的注意力,/>代表关系r的变换矩阵,/>代表节点u的嵌入,集合/>表示患者p在时序窗口第/>个月的知识图谱。
6.一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-4中任一所述的基于时序知识图谱邻域推理的透析低血压预测方法。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-4任意一项所述的基于时序知识图谱邻域推理的透析低血压预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410052402.XA CN117594241B (zh) | 2024-01-15 | 2024-01-15 | 基于时序知识图谱邻域推理的透析低血压预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410052402.XA CN117594241B (zh) | 2024-01-15 | 2024-01-15 | 基于时序知识图谱邻域推理的透析低血压预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117594241A CN117594241A (zh) | 2024-02-23 |
CN117594241B true CN117594241B (zh) | 2024-04-30 |
Family
ID=89922187
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410052402.XA Active CN117594241B (zh) | 2024-01-15 | 2024-01-15 | 基于时序知识图谱邻域推理的透析低血压预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117594241B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020217095A1 (en) * | 2019-04-26 | 2020-10-29 | Tao Yang | Method and apparatus for natural language processing of medical text in chinese |
WO2020220545A1 (zh) * | 2019-06-27 | 2020-11-05 | 平安科技(深圳)有限公司 | 基于长短期记忆模型的疾病预测方法、装置和计算机设备 |
WO2021142534A1 (en) * | 2020-01-13 | 2021-07-22 | Knowtions Research Inc. | Method and system of using hierarchical vectorisation for representation of healthcare data |
CN113434692A (zh) * | 2021-06-22 | 2021-09-24 | 上海交通大学医学院附属仁济医院 | 图神经网络模型构建、诊疗方案推荐方法、系统及设备 |
CN113673244A (zh) * | 2021-01-04 | 2021-11-19 | 腾讯科技(深圳)有限公司 | 医疗文本处理方法、装置、计算机设备和存储介质 |
CN114255884A (zh) * | 2021-12-13 | 2022-03-29 | 首都医科大学附属北京安贞医院 | 一种高血压药物治疗知识图谱构建方法以及装置 |
CN115171871A (zh) * | 2022-05-06 | 2022-10-11 | 东南大学 | 一种基于知识图谱与注意力机制的心血管疾病预测方法 |
CN115938586A (zh) * | 2022-12-28 | 2023-04-07 | 苏州中科先进技术研究院有限公司 | Emdr辅助情绪评估及干预方法、设备以及存储介质 |
CN116186281A (zh) * | 2022-12-27 | 2023-05-30 | 中国人民解放军国防科技大学 | 一种基于多关系选择的动态知识图谱推理方法及系统 |
CN117079815A (zh) * | 2023-08-21 | 2023-11-17 | 哈尔滨工业大学 | 一种基于图神经网络的心血管疾病风险预测模型构建方法 |
CN117316466A (zh) * | 2023-11-28 | 2023-12-29 | 中国人民解放军总医院 | 一种基于知识图谱与自然语言处理技术的临床决策方法、系统及设备 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200003762A1 (en) * | 2018-06-29 | 2020-01-02 | Bioelectron Technology Corporation | Diagnostics Platform for Mitochondrial Dysfunctions/Diseases |
US20220375618A1 (en) * | 2021-05-11 | 2022-11-24 | Electronics And Telecommunications Research Institute | Method and apparatus of calculating comprehensive disease index |
-
2024
- 2024-01-15 CN CN202410052402.XA patent/CN117594241B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020217095A1 (en) * | 2019-04-26 | 2020-10-29 | Tao Yang | Method and apparatus for natural language processing of medical text in chinese |
WO2020220545A1 (zh) * | 2019-06-27 | 2020-11-05 | 平安科技(深圳)有限公司 | 基于长短期记忆模型的疾病预测方法、装置和计算机设备 |
WO2021142534A1 (en) * | 2020-01-13 | 2021-07-22 | Knowtions Research Inc. | Method and system of using hierarchical vectorisation for representation of healthcare data |
CN113673244A (zh) * | 2021-01-04 | 2021-11-19 | 腾讯科技(深圳)有限公司 | 医疗文本处理方法、装置、计算机设备和存储介质 |
CN113434692A (zh) * | 2021-06-22 | 2021-09-24 | 上海交通大学医学院附属仁济医院 | 图神经网络模型构建、诊疗方案推荐方法、系统及设备 |
CN114255884A (zh) * | 2021-12-13 | 2022-03-29 | 首都医科大学附属北京安贞医院 | 一种高血压药物治疗知识图谱构建方法以及装置 |
CN115171871A (zh) * | 2022-05-06 | 2022-10-11 | 东南大学 | 一种基于知识图谱与注意力机制的心血管疾病预测方法 |
CN116186281A (zh) * | 2022-12-27 | 2023-05-30 | 中国人民解放军国防科技大学 | 一种基于多关系选择的动态知识图谱推理方法及系统 |
CN115938586A (zh) * | 2022-12-28 | 2023-04-07 | 苏州中科先进技术研究院有限公司 | Emdr辅助情绪评估及干预方法、设备以及存储介质 |
CN117079815A (zh) * | 2023-08-21 | 2023-11-17 | 哈尔滨工业大学 | 一种基于图神经网络的心血管疾病风险预测模型构建方法 |
CN117316466A (zh) * | 2023-11-28 | 2023-12-29 | 中国人民解放军总医院 | 一种基于知识图谱与自然语言处理技术的临床决策方法、系统及设备 |
Non-Patent Citations (1)
Title |
---|
基于大数据技术的医学知识图谱构建方法;孙郑煜;鄂海红;宋美娜;王宁;;软件;20200115(01);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117594241A (zh) | 2024-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | A novel three-way decision method in a hybrid information system with images and its application in medical diagnosis | |
CN107656952A (zh) | 平行智能病例推荐模型的建模方法 | |
Jiang et al. | A hybrid intelligent model for acute hypotensive episode prediction with large-scale data | |
WO2022166158A1 (zh) | 一种基于卷积生存网络的血透并发症长期风险预测系统 | |
CN109213871A (zh) | 患者信息知识图谱构建方法、可读存储介质和终端 | |
WO2024008043A1 (zh) | 一种基于因果关系挖掘的临床数据自动化生成方法及系统 | |
CN114077673A (zh) | 一种基于btbc模型的知识图谱构建方法 | |
CN113223656A (zh) | 一种基于深度学习的药物组合预测方法 | |
CN114822874B (zh) | 一种基于特征偏差对齐的方剂功效分类方法 | |
CN116564553A (zh) | 一种基于共病特征的用药效果预测方法 | |
CN113362931B (zh) | 基于知识图谱的归因分析方法、装置和系统 | |
CN117034142B (zh) | 一种不平衡医疗数据缺失值填充方法及系统 | |
CN117594241B (zh) | 基于时序知识图谱邻域推理的透析低血压预测方法及装置 | |
CN117370565A (zh) | 一种信息检索方法及系统 | |
CN115985513A (zh) | 一种基于多组学癌症分型的数据处理方法、装置及设备 | |
CN115631823A (zh) | 相似病例推荐方法及系统 | |
CN114613497A (zh) | 基于gbdt样例级的病患样本的智能医学辅助诊断方法 | |
Milecki et al. | MEDIMP: 3D Medical Images and clinical Prompts for renal transplant representation learning | |
CN114003684A (zh) | 一种基于开放世界假设的医疗信息关系预测方法及系统 | |
AU2021100217A4 (en) | Traditional Chinese Medicine Data Processing Method and System Combining Attribute-based Constrained Concept Lattice | |
Yanling et al. | Research on entity recognition and knowledge graph construction based on TCM medical records | |
Papageorgiou et al. | Complementary use of fuzzy decision trees and augmented fuzzy cognitive maps for decision making in medical informatics | |
CN115240854B (zh) | 一种胰腺炎预后数据的处理方法及其系统 | |
Du et al. | A Novel Hybrid CNN-BiLSTM-Attention Model for Diabetes Prediction | |
Fraccaroli | Explainable Deep Learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |