CN115858820B - 一种基于医疗知识图谱的预测方法、装置、电子设备和存储介质 - Google Patents

一种基于医疗知识图谱的预测方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN115858820B
CN115858820B CN202310106016.XA CN202310106016A CN115858820B CN 115858820 B CN115858820 B CN 115858820B CN 202310106016 A CN202310106016 A CN 202310106016A CN 115858820 B CN115858820 B CN 115858820B
Authority
CN
China
Prior art keywords
knowledge graph
entity
entities
layer
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310106016.XA
Other languages
English (en)
Other versions
CN115858820A (zh
Inventor
刘鹏
张真
张堃
贾先译
江兴斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Innovative Data Technologies Inc
Original Assignee
Nanjing Innovative Data Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Innovative Data Technologies Inc filed Critical Nanjing Innovative Data Technologies Inc
Priority to CN202310106016.XA priority Critical patent/CN115858820B/zh
Publication of CN115858820A publication Critical patent/CN115858820A/zh
Application granted granted Critical
Publication of CN115858820B publication Critical patent/CN115858820B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本申请公开了一种基于医疗知识图谱的预测方法、装置、电子设备和存储介质,所述预测方法通过获取医疗知识图谱架构,所述医疗知识图谱架构至少包括顺序排列的症状或指标类、疾病类、治疗手段类,每个所述类包括至少一个实体,且相邻的所述类之间的实体之间为全连接关系;将所述医疗知识图谱架构作为神经网络通过病例数据集进行训练直至所述神经网络训练完成,以最终训练完成的所述神经网络及其对应的实体间的连接关系的权重作为医疗知识图谱;根据预测的已知条件向所述医疗知识图谱中的实体赋予量化值,根据所述医疗知识图谱的权重计算所述医疗知识图谱上其他实体的量化值,根据所述量化值以及实体所属层的概念预测关于医疗的结果。

Description

一种基于医疗知识图谱的预测方法、装置、电子设备和存储介质
技术领域
本申请涉及到知识图谱技术领域,特别是一种基于医疗知识图谱的预测方法、装置、电子设备和存储介质。
背景技术
知识图谱是一种揭示实体之间关系的语义网络,可以对现实世界的事物及其相互关系进行形式化地描述。知识图谱是人工智能技术的重要分支,在搜索引擎构建、自然语言处理、智能情景分析等领域发挥着重要作用。医疗领域的知识图谱能够给临床医生、患者和科研工作者等提供帮助。但是现有的知识图谱对于关系的描述基于语义信息,通常无法量化,而医学领域给出可量化的预测具有实际意义,因此现有的医疗知识图谱尚无法做到。
发明内容
本申请实施例提供了一种基于医疗知识图谱的预测方法、装置、电子设备和存储介质,用于解决现有的医疗知识图谱无法给出可量化的预测的技术问题。
本发明的第一个方面,提供一种基于医疗知识图谱的预测方法,包括:
获取医疗知识图谱架构,所述医疗知识图谱架构至少包括顺序排列的症状或指标类、疾病类、治疗手段类,每个所述类包括至少一个实体,且相邻的所述类之间的实体之间为全连接关系;
获取病例数据集,所述病例数据集覆盖所有所述类的实体,所述病例数据集中的每个病例数据中包括所述类中的两类实体以及实体的量化值,所述病例数据中的实体之间的关系与所述医疗知识图谱架构中所代表的对应的部分语义关系一致;
将所述医疗知识图谱架构作为神经网络通过所述病例数据集进行训练直至所述神经网络训练完成;其中,所述训练的过程中,将每个所述病例数据中的位于输入-输出方向上靠前一层的实体的量化值赋予所述神经网络对应的节点,根据当前所述神经网络权重获得所述神经网络上与所述病例数据中位于输入-输出方向上靠后一层的实体对应的节点的输出,基于所述输出与所述病例数据中位于输入-输出方向上靠后一层的实体的实际值之间的误差对实体间连接关系的权重进行调整;其中,所述当前所述神经网络为根据前一病例数据训练后获得的神经网络;以最终训练完成的所述神经网络及其对应的实体间的连接关系的权重作为医疗知识图谱;
向所述医疗知识图谱中的所述输入-输出方向上最后一层以外的某一层上的实体赋予量化值,其中,被赋予量化值的所述实体为预测的已知条件,根据所述医疗知识图谱的权重计算所述医疗知识图谱上所述输入-输出方向上位于所述某一层的后部的层的实体的量化值,根据所述量化值以及实体所属层的概念预测关于医疗的结果。
进一步的,所述医疗知识图谱架构还包括治疗结果类,所述治疗结果类在所述输入-输出方向上位于所述治疗手段类之后。
进一步的,所述症状或指标类中的至少部分实体具有相同的语义含义,所述部分实体具有不同的等级,所述等级用于指示所述语义含义所代表的症状或指标的严重程度。
进一步的,所述将所述医疗知识图谱架构作为神经网络通过所述病例数据集进行训练,包括:
对所述全连接关系中每条边的权重赋予初始值;其中,所述权重为随机数且均小于1,与同一所述实体具有连接关系的前一层的实体的总权重之和为1。
进一步的,所述基于所述输出与所述病例数据中位于输入-输出方向上靠后一层的实体的实际值之间的误差对实体间连接关系的权重进行调整,包括:按照自所述神经网络的由后向前的方向逐层调整。
进一步的,所述逐层调整时采用误差函数梯度下降法进行调整。
本申请的第二个方面,提供一种基于医疗知识图谱的预测装置,包括:
知识图谱获取模块,用于获取医疗知识图谱架构,所述医疗知识图谱架构至少包括顺序排列的症状或指标类、疾病类、治疗手段类,每个所述类包括至少一个实体,且相邻的所述类之间的实体之间为全连接关系;
数据集获取模块,用于获取病例数据集,所述病例数据集覆盖所有所述类的实体,所述病例数据集中的每个病例数据中包括所述类中的两类实体以及实体的量化值,所述病例数据中的实体之间的关系与所述医疗知识图谱架构中所代表的对应的部分语义关系一致;
训练模块,用于将所述医疗知识图谱架构作为神经网络通过所述病例数据集进行训练直至所述神经网络训练完成;其中,所述训练的过程中,将每个所述病例数据中的位于输入-输出方向上靠前一层的实体的量化值赋予所述神经网络对应的节点,根据当前所述神经网络权重获得所述神经网络上与所述病例数据中位于输入-输出方向上靠后一层的实体对应的节点的输出,基于所述输出与所述病例数据中位于输入-输出方向上靠后一层的实体的实际值之间的误差对实体间连接关系的权重进行调整;其中,所述当前所述神经网络为根据前一病例数据训练后获得的神经网络;以最终训练完成的所述神经网络及其对应的实体间的连接关系的权重作为知识图谱;
预测模块,用于向所述医疗知识图谱中的所述输入-输出方向上最后一层以外的某一层上的实体赋予量化值,其中,被赋予量化值的所述实体为预测的已知条件,根据所述医疗知识图谱的权重计算所述医疗知识图谱上所述输入-输出方向上位于所述某一层的后部的层的实体的量化值,根据所述量化值以及实体所属层的概念预测关于医疗的结果。
进一步的,所述训练模块,包括:
权重初始赋值模块,用于对所述全连接关系中每条边的权重赋予初始值;其中,所述权重为随机数且均小于1,与同一所述实体具有连接关系的前一层的实体的总权重之和为1。
本申请的第三个方面,提供一种电子设备,包括处理器、存储器和存储在所述存储器内的计算机程序,所述计算机程序被配置为被所述处理器运行时执行上述第一方面所述的方法。
本申请的第四个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序用于执行上述第一方面所述的方法。
有益效果
本发明的实施例提供了一种基于医疗知识图谱的预测方法,通过获取医疗知识图谱架构,所述医疗知识图谱架构至少包括顺序排列的症状或指标类、疾病类、治疗手段类,每个所述类包括至少一个实体,且相邻的所述类之间的实体之间为全连接关系;获取病例数据集,所述病例数据集覆盖所有所述类的实体,所述病例数据集中的每个病例数据中包括所述类中的两类实体以及实体的量化值,所述病例数据中的实体之间的关系与所述医疗知识图谱架构中所代表的对应的部分语义关系一致;将所述医疗知识图谱架构作为神经网络通过所述病例数据集进行训练直至所述神经网络训练完成;其中,所述训练的过程中,将每个所述病例数据中的位于输入-输出方向上靠前一层的实体的量化值赋予所述神经网络对应的节点,根据当前所述神经网络权重获得所述神经网络上与所述病例数据中位于输入-输出方向上靠后一层的实体对应的节点的输出,基于所述输出与所述病例数据中位于输入-输出方向上靠后一层的实体的实际值之间的误差对实体间连接关系的权重进行调整;其中,所述当前所述神经网络为根据前一病例数据训练后获得的神经网络;以最终训练完成的所述神经网络及其对应的实体间的连接关系的权重作为医疗知识图谱;向所述医疗知识图谱中的所述输入-输出方向上最后一层以外的某一层上的实体赋予量化值,其中,被赋予量化值的所述实体为预测的已知条件,根据所述医疗知识图谱的权重计算所述医疗知识图谱上所述输入-输出方向上位于所述某一层的后部的层的实体的量化值,根据所述量化值以及实体所属层的概念预测关于医疗的结果。通过本申请解决了传统的医疗知识图谱无法体现实体之间量化关系,从而能够根据带有权重的知识图谱根据症状或指标进行相应疾病的预测以及相应治疗手段的推荐,由于实体之间的连接关系均带有权重,因此可以实现对疾病预测的排序以及治疗手段推荐的排序。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的一种基于医疗知识图谱的预测方法的流程图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本发明的实施例针对现有的医疗知识图谱无法体现关系之间的强弱,从而无法根据症状或指标对疾病可能性进行带量预测,以及根据疾病对治疗方式进行带量推荐。本发明的实施例提供一种基于医疗知识图谱的预测方法,将实体之间的连线强弱用权重的方式呈现出来,可以代表连接关系上的一个实体对另一个实体的影响力的大小。
如图1所示为本发明实施例的一种基于医疗知识图谱的预测方法的流程示意图,所述一种基于医疗知识图谱的预测方法包括以下步骤:
步骤S102、获取医疗知识图谱架构,所述医疗知识图谱架构至少包括顺序排列的症状或指标类、疾病类、治疗手段类,每个所述类包括至少一个实体,且相邻的所述类之间的实体之间为全连接关系。
上述医疗知识图谱架构与全连接神经网络架构相同,属于症状或指标类的实体例如咳嗽、头晕、白细胞数量、尿蛋白定量等构成神经网络的一层,属于疾病类的实体例如上呼吸道感染、肾小球肾炎等构成神经网络的一层,属于治疗手段类的实体例如抗生素消炎、激素冲击等构成神经网络的一层。每层中的实体数量不必都相同,相邻层的实体之间构成全连接关系,即使实际上某个实体与相邻层的另一个实体不相关但仍需要对二者建立连接,他们之间的关系只要通过赋予连接关系的权重为0即可表达,若实际上某个实体与相邻的另一个实体相关,相关程度的强弱通过权重大小的调整即可表达。
步骤S104、获取病例数据集,所述病例数据集覆盖所有所述类的实体,所述病例数据集中的每个病例数据中包括所述类中的两类实体以及实体的量化值,所述病例数据中的实体之间的关系与所述医疗知识图谱架构中所代表的对应的部分语义关系一致。
上述数据集是作为训练数据用的,因此,数据集中的数据与上述知识图谱架构中的实体对应,并且语义关系也对应。一个完整的病例,记录了患者自诉症状、查体情况、检查结果、疾病诊断以及治疗手段,将其中的自述症状、查体情况、检查结果归为症状或指标类,将疾病诊断归为疾病类,将治疗手段归为治疗手段类。数据量以及数据质量均较好的病例主要来源于管理较为规范的大型医院。为了完成对上述神经网络的训练,将每个病历中涉及的内容拆分成包括两个类的病例数据,例如1种病例数据包括了症状或指标类和疾病类两类实体,另1种病例数据包括了疾病类和治疗手段类两类实体,还有1种病例数据包括了症状或指标类和治疗手段类两类实体,即一个完整的病例可拆成3个病例数据,对于某些不完整的病例根据该病例所包含的类的数量进行对应拆分获得病例数据。
步骤S106、将所述医疗知识图谱架构作为神经网络通过所述病例数据集进行训练直至所述神经网络训练完成;其中,所述训练的过程中,将每个所述病例数据中的位于输入-输出方向上靠前一层的实体的量化值赋予所述神经网络对应的节点,根据当前所述神经网络权重获得所述神经网络上与所述病例数据中位于输入-输出方向上靠后一层的实体对应的节点的输出,基于所述输出与所述病例数据中位于输入-输出方向上靠后一层的实体的实际值之间的误差对实体间连接关系的权重进行调整;其中,所述当前所述神经网络为根据前一病例数据训练后获得的神经网络;以最终训练完成的所述神经网络及其对应的实体间的连接关系的权重作为医疗知识图谱。
选择所述知识图谱的输入端和输出端分别作为神经网络的输入端和输出端,所述输入端和输出端之间即为神经网络的隐藏层,在本实施例中这些隐藏层的层结构以及每个节点即实体的含义是显现的。在此基础上,每次选用所述数据集中的一个数据,获得所述数据中的不同的两类实体及其量化值,定义这两类实体为第一类实体和第二类实体,其中第一类实体位于输入-输出方向上靠前一层中,第二类实体位于输入-输出方向上靠后一层中。将所述第一类实体的量化值赋给知识图谱中对应的实体,按照输入-输出方向以及当前知识图谱中的每条边的权重向后传播获得所述第二类实体中每个实体的计算值,对比所述数据中对应的第二实体的量化值,能够获得关于第二实体处的误差。上述误差是由与所述第二实体在其前方具有关联关系的实体以及关联的权重强弱决定的。因此,为了调整权重,可以依据上述误差和网络结构自所述第二实体处向前传递上述误差,并优化权重。上述训练过程,类似有监督的神经网络训练过程,但所述数据和常规的神经网络所需的训练数据不同,实际在训练时,不是所有数据都必须以输入端为输入,因为只有是具有不同的两个层之间的数据都可以拿来训练,因此,实际的输入端是根据当前数据中位于输入-输出方向上靠前的一层所在的位置决定的。但整个网络作为整体,是可以同步训练的。即本发明的实施例中的数据可以对应网络中任意两个不同层,而不必一定是输入层和输出层,这样每个数据单独针对对应的相关层进行训练和调整权重,当层之间的距离间隔较小时,则小范围内调整权重,当层之间的距离间隔较大时,则大范围内调整权重。
本发明的实施例具体通过神经网络的训练过程来实现上述权重的显现,神经网络与知识图谱有类似的结构,其具有多层节点,且层与层之间具有连接关系,但神经网络除了输入和输出层以外,其内部的隐藏层为黑盒,当神经网络训练完成后即可投入使用,人们不会关注中间的黑盒基体什么网络结构以及层与层之间的权重。本申请的实施例另辟蹊径,从神经网络训练的本质出发,将上述训练过程对权重的调整过程显现化,从而将神经网络的黑盒变成白盒,获得了带有权重的知识图谱。基于上述带权重的知识图谱,可以直观的看到每个实体对其他有关联的实体的影响因子即连接关系的权重,由此,可以知道每个症状或指标类的具体实体对应的不同疾病类的可能性的大小、每个疾病类的具体实体对应的不同治疗手段的具体可能性的大小,可以给用户学习和诊断时参考,其中用户可以是医生、医学生、科研人员、有问诊需求的普通人员等。
上述医疗知识图谱可以以多种方式呈现给用户,例如作为一种医疗问诊平台,其主要用户为有问诊需求的普通人员,在交互的初始状态下,给出输入入口,用户可以根据已知的条件选择具体的知识图谱的层作为输入入口或者系统根据语义识别自动识别用户输入所对应的知识图谱的层。例如已知症状,则选择症状或指标类为输入入口,并将相应的症状进行输入,系统识别用户的输入例如将与用户输入的症状对应的实体记为1,其他输入层的实体记为0,然后根据神经网络的传递规则计算知识图谱中其他层对应的实体的量化值,这里计算时主要用到权重以及S激活函数。最后输出时,可以呈现给用户多种不同的结果,包括各个层中得分排名靠前的实体,某些疾病诊断的可能性排名,某些治疗手段的可能性排名等,以供用户根据需要查阅。
步骤S108、向所述医疗知识图谱中的所述输入-输出方向上最后一层以外的某一层上的实体赋予量化值,其中,被赋予量化值的所述实体为预测的已知条件,根据所述医疗知识图谱的权重计算所述医疗知识图谱上所述输入-输出方向上位于所述某一层的后部的层的实体的量化值,根据所述量化值以及实体所属层的概念预测关于医疗的结果。
通过上述过程对医疗知识图谱进行查询,在最后输出时,可以呈现给用户多种不同的结果,包括各个层中得分排名靠前的实体,某些疾病诊断的可能性排名,某些治疗手段的可能性排名等,以供用户根据需要查阅。
某些实施例中,所述医疗知识图谱架构还包括治疗结果类,所述治疗结果类在所述输入-输出方向上位于所述治疗手段类之后。这依赖于对于病例的追踪,特别是一些较为复杂的疾病,可能治疗结果没有明显的结论,因此,经过训练的知识图谱能够对整体预后进行初步预测,有助于在该疾病领域梳理出疾病与预后之间的关联,以进一步助益疾病的治疗。
某些实施例中,由于很多疾病具有不同程度的症状或指标,因此为了能够增加细粒度,所述症状或指标类中的至少部分实体具有相同的语义含义,所述部分实体具有不同的等级,所述等级用于指示所述语义含义所代表的症状或指标的严重程度。系统可根据用户的输入进行自动识别以对应到具体的实体中,从而提高预测的准确度。
在上述实施例中,在训练之初,对所述全连接关系中每条边的权重赋予初始值;其中,所述权重为随机数且均小于1,与同一所述实体具有连接关系的前一层的实体的总权重之和为1。后续的数据均在前一次调整的权重的基础上重复同样的过程,从而进行多次权重调整,并且因为数据集覆盖所有的实体,所以能对知识网络中每条连接关系进行权重调整。
因此,随着训练过程的推进,所述知识图谱中各个连接关系上的权重在逐步调整,始终显现并随着训练结束后获得较为可靠的权重。由此,获得的知识图谱为带权重的知识图谱,对于有直接或间接连接关系的实体均能够量化一个实体对另一个实体的影响大小,能够基于此知识网络更加客观地给出推理。
在上述实施例中,步骤S106中所述基于所述输出与所述病例数据中位于输入-输出方向上靠后一层的实体的实际值之间的误差对实体间连接关系的权重进行调整,包括:按照自所述神经网络的由后向前的方向逐层调整。
上述过程即为反向误差传播,所谓反向是与神经网络的输入-输出方向相反,即沿输出向输入方向传播误差,并且后一节点上的误差是与与该节点有直接或间接连接关系的节点有关的,因此,通过反向推理能够推算出这些关联节点的相应误差。具体所述反向传播误差计算,包括如下步骤:
步骤S1061、获得所述神经网络在误差传播方向上当前节点中每个节点误差;
步骤S1062、将所述每个节点误差沿按照误差传播方向上后一层节点与所述当前节点的边的权重的比例进行分割获得分割误差;
步骤S1063、将所述分割误差向前一层中对应的节点传播,并将所述前一层中同一节点获得的分割误差求和得到该同一节点的误差。
通过上述反向误差传播获得每个节点的误差,并且根据网络结构重新调整权重使得误差控制在可接受的范围内。
上述误差消失调整过程采用误差函数梯度下降法进行调整。每条连接关系上的权重调整通过下式计算:,其中,E为误差函数。为学习率,用于调节变化的强度以防止超调。W为某一条连接关系上的权重。
代表误差函数斜率,
上述误差函数斜率公式中,k为下一层实体,j为上一层实体,为下一层实体对应的量化值,为下一层实体的计算量,()函数为S激活函数,为j层的实体与k层的实体之间的权重,为j层实体的输出值,是在与j层实体连接的输入信号上进行加权求和并引用S激活函数得到的结果。
本发明的另一个实施例,提供一种电子设备,包括处理器、存储器和存储在所述存储器内的计算机程序,所述计算机程序被配置为被所述处理器运行时执行前述实施例中所述的一种基于医疗知识图谱的预测方法。
本发明的另一个实施例,提供一种存储介质,其上存储有计算机程序,所述计算机程序用于执行所前述实施例中的一种基于医疗知识图谱的预测方法。
这些计算机程序也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤,对应与不同的步骤可以通过不同的模块来实现。
例如,通过多个功能模块构成的本发明实施例的一种基于医疗知识图谱的预测装置,包括:
知识图谱获取模块,用于获取医疗知识图谱架构,所述医疗知识图谱架构至少包括顺序排列的症状或指标类、疾病类、治疗手段类,每个所述类包括至少一个实体,且相邻的所述类之间的实体之间为全连接关系。
数据集获取模块,用于获取病例数据集,所述病例数据集覆盖所有所述类的实体,所述病例数据集中的每个病例数据中包括所述类中的两类实体以及实体的量化值,所述病例数据中的实体之间的关系与所述医疗知识图谱架构中所代表的对应的部分语义关系一致。
训练模块,用于将所述医疗知识图谱架构作为神经网络通过所述病例数据集进行训练直至所述神经网络训练完成;其中,所述训练的过程中,将每个所述病例数据中的位于输入-输出方向上靠前一层的实体的量化值赋予所述神经网络对应的节点,根据当前所述神经网络权重获得所述神经网络上与所述病例数据中位于输入-输出方向上靠后一层的实体对应的节点的输出,基于所述输出与所述病例数据中位于输入-输出方向上靠后一层的实体的实际值之间的误差对实体间连接关系的权重进行调整;其中,所述当前所述神经网络为根据前一病例数据训练后获得的神经网络;以最终训练完成的所述神经网络及其对应的实体间的连接关系的权重作为知识图谱。
预测模块,用于向所述医疗知识图谱中的所述输入-输出方向上最后一层以外的某一层上的实体赋予量化值,其中,被赋予量化值的所述实体为预测的已知条件,根据所述医疗知识图谱的权重计算所述医疗知识图谱上所述输入-输出方向上位于所述某一层的后部的层的实体的量化值,根据所述量化值以及实体所属层的概念预测关于医疗的结果。
在上述实施例中,所述知识图谱获取模块,包括:
实体分类模块,用于获取实体并对所述实体进行语义分类,按所述单一方向的语义序列将所述实体按照所对应的语义类别及序列位置进行分布。
在上述实施例中,所述训练模块,包括:
权重初始赋值模块,用于对所述全连接关系中每条边的权重赋予初始值;其中,所述权重为随机数且均小于1,与同一所述实体具有连接关系的前一层的实体的总权重之和为1。
上述程序可以运行在处理器中,或者也可以存储在存储器中(或称为计算机可读介质),计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存 (PRAM)、静态随机存取存储器 (SRAM)、动态随机存取存储器 (DRAM)、其他类型的随机存取存储器 (RAM)、只读存储器 (ROM)、电可擦除可编程只读存储器 (EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘 (DVD) 或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体 (transitory media),如调制的数据信号和载波。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种基于医疗知识图谱的预测方法,其特征在于:
获取医疗知识图谱架构,所述医疗知识图谱架构至少包括顺序排列的症状或指标类、疾病类、治疗手段类,每个所述类包括至少一个实体,且相邻的所述类之间的实体之间为全连接关系;
获取病例数据集,所述病例数据集覆盖所有所述类的实体,所述病例数据集中的每个病例数据中包括所述类中的两类实体以及实体的量化值,所述病例数据中的实体之间的关系与所述医疗知识图谱架构中所代表的对应的部分语义关系一致;
将所述医疗知识图谱架构作为神经网络通过所述病例数据集进行训练直至所述神经网络训练完成;其中,所述训练的过程中,将每个所述病例数据中的位于输入-输出方向上靠前一层的实体的量化值赋予所述神经网络对应的节点,根据当前所述神经网络权重获得所述神经网络上与所述病例数据中位于输入-输出方向上靠后一层的实体对应的节点的输出,基于所述输出与所述病例数据中位于输入-输出方向上靠后一层的实体的实际值之间的误差对实体间连接关系的权重进行调整;其中,所述当前所述神经网络为根据前一病例数据训练后获得的神经网络;以最终训练完成的所述神经网络及其对应的实体间的连接关系的权重作为医疗知识图谱;
向所述医疗知识图谱中的所述输入-输出方向上最后一层以外的某一层上的实体赋予量化值,其中,被赋予量化值的所述实体为预测的已知条件,根据所述医疗知识图谱的权重计算所述医疗知识图谱上所述输入-输出方向上位于所述某一层的后部的层的实体的量化值,根据所述量化值以及实体所属层的概念预测关于医疗的结果。
2.根据权利要求1所述的方法,其特征在于,所述医疗知识图谱架构还包括治疗结果类,所述治疗结果类在所述输入-输出方向上位于所述治疗手段类之后。
3.根据权利要求1所述的方法,其特征在于,所述症状或指标类中的至少部分实体具有相同的语义含义,所述部分实体具有不同的等级,所述等级用于指示所述语义含义所代表的症状或指标的严重程度。
4.根据权利要求1所述的方法,其特征在于,所述将所述医疗知识图谱架构作为神经网络通过所述病例数据集进行训练,包括:
对所述全连接关系中每条边的权重赋予初始值;其中,所述权重为随机数且均小于1,与同一所述实体具有连接关系的前一层的实体的总权重之和为1。
5.根据权利要求4所述的方法,其特征在于,所述基于所述输出与所述病例数据中位于输入-输出方向上靠后一层的实体的实际值之间的误差对实体间连接关系的权重进行调整,包括:按照自所述神经网络的由后向前的方向逐层调整。
6.根据权利要求5所述的方法,其特征在于,所述逐层调整时采用误差函数梯度下降法进行调整。
7.基于医疗知识图谱的预测装置,其特征在于,包括:
知识图谱获取模块,用于获取医疗知识图谱架构,所述医疗知识图谱架构至少包括顺序排列的症状或指标类、疾病类、治疗手段类,每个所述类包括至少一个实体,且相邻的所述类之间的实体之间为全连接关系;
数据集获取模块,用于获取病例数据集,所述病例数据集覆盖所有所述类的实体,所述病例数据集中的每个病例数据中包括所述类中的两类实体以及实体的量化值,所述病例数据中的实体之间的关系与所述医疗知识图谱架构中所代表的对应的部分语义关系一致;
训练模块,用于将所述医疗知识图谱架构作为神经网络通过所述病例数据集进行训练直至所述神经网络训练完成;其中,所述训练的过程中,将每个所述病例数据中的位于输入-输出方向上靠前一层的实体的量化值赋予所述神经网络对应的节点,根据当前所述神经网络权重获得所述神经网络上与所述病例数据中位于输入-输出方向上靠后一层的实体对应的节点的输出,基于所述输出与所述病例数据中位于输入-输出方向上靠后一层的实体的实际值之间的误差对实体间连接关系的权重进行调整;其中,所述当前所述神经网络为根据前一病例数据训练后获得的神经网络;以最终训练完成的所述神经网络及其对应的实体间的连接关系的权重作为知识图谱;
预测模块,用于向所述医疗知识图谱中的所述输入-输出方向上最后一层以外的某一层上的实体赋予量化值,其中,被赋予量化值的所述实体为预测的已知条件,根据所述医疗知识图谱的权重计算所述医疗知识图谱上所述输入-输出方向上位于所述某一层的后部的层的实体的量化值,根据所述量化值以及实体所属层的概念预测关于医疗的结果。
8.根据权利要求7所述的装置,其特征在于,所述训练模块,包括:
权重初始赋值模块,用于对所述全连接关系中每条边的权重赋予初始值;其中,所述权重为随机数且均小于1,与同一所述实体具有连接关系的前一层的实体的总权重之和为1。
9.一种电子设备,其特征在于:包括处理器、存储器和存储在所述存储器内的计算机程序,所述计算机程序被配置为被所述处理器运行时执行所述权利要求1~6中任意一项所述的方法。
10.一种计算机可读存储介质,其特征在于:其上存储有计算机程序,所述计算机程序用于执行所述权利要求1~6中任意一项所述的方法。
CN202310106016.XA 2023-02-13 2023-02-13 一种基于医疗知识图谱的预测方法、装置、电子设备和存储介质 Active CN115858820B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310106016.XA CN115858820B (zh) 2023-02-13 2023-02-13 一种基于医疗知识图谱的预测方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310106016.XA CN115858820B (zh) 2023-02-13 2023-02-13 一种基于医疗知识图谱的预测方法、装置、电子设备和存储介质

Publications (2)

Publication Number Publication Date
CN115858820A CN115858820A (zh) 2023-03-28
CN115858820B true CN115858820B (zh) 2023-05-12

Family

ID=85657944

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310106016.XA Active CN115858820B (zh) 2023-02-13 2023-02-13 一种基于医疗知识图谱的预测方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN115858820B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117690600B (zh) * 2024-02-01 2024-04-30 北方健康医疗大数据科技有限公司 基于知识图谱的传染病预测方法、系统、终端及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110277167A (zh) * 2019-05-31 2019-09-24 南京邮电大学 基于知识图谱的慢性非传染性疾病风险预测系统
CN113535974B (zh) * 2021-06-28 2024-04-09 科大讯飞华南人工智能研究院(广州)有限公司 诊断推荐方法及相关装置、电子设备、存储介质
CN115171880A (zh) * 2022-07-04 2022-10-11 山东浪潮智慧医疗科技有限公司 一种融合症状权重的疾病推荐系统

Also Published As

Publication number Publication date
CN115858820A (zh) 2023-03-28

Similar Documents

Publication Publication Date Title
Singh et al. DMENet: diabetic macular edema diagnosis using hierarchical ensemble of CNNs
Mattila et al. Design and application of a generic clinical decision support system for multiscale data
Padula et al. Machine learning methods in health economics and outcomes research—the PALISADE checklist: a good practices report of an ISPOR task force
US20180211727A1 (en) Automated Evidence Based Identification of Medical Conditions and Evaluation of Health and Financial Benefits Of Health Management Intervention Programs
US9135399B2 (en) Determining disease state of a patient by mapping a topological module representing the disease, and using a weighted average of node data
CN115858820B (zh) 一种基于医疗知识图谱的预测方法、装置、电子设备和存储介质
Pargent et al. Best practices in supervised machine learning: A tutorial for psychologists
CN112543934A (zh) 一种确定异常程度的方法、相应的计算机可读介质和分布式癌症分析系统
CN114549469A (zh) 一种基于置信度校准的深层神经网络医疗图像诊断方法
Luo et al. Using machine‐learning methods to support health‐care professionals in making admission decisions
Bizjak et al. Deep shape features for predicting future intracranial aneurysm growth
US20220101176A1 (en) System and method for generating a direction inquiry response from biological extractions using machine learning
CN116894973B (zh) 一种基于集成学习的髋关节病变智能自标注方法及装置
CN109101883A (zh) 一种抑郁倾向评价装置及系统
Barbini et al. A comparative analysis of predictive models of morbidity in intensive care unit after cardiac surgery–Part I: model planning
Vimbi et al. Interpreting artificial intelligence models: a systematic review on the application of LIME and SHAP in Alzheimer’s disease detection
Wang et al. Analysis and Prediction of Gestational Diabetes Mellitus by the Ensemble Learning Method
US20220044328A1 (en) Machine learning systems and methods to evaluate a claim submission
Song et al. Study on health management decision support system
US20210174027A1 (en) Assertion Detection in Multi-Labelled Clinical Text using Scope Localization
CN114897057A (zh) 基于多模态数据融合的阴虚证智能诊断系统、方法、设备
EP4179545A1 (en) Estimating patient risk of cytokine storm using knowledge graphs
Dong et al. Performance Prediction of Listed Companies in Smart Healthcare Industry: Based on Machine Learning Algorithms
Pandey et al. A Practical Approach for Machine Learning and Deep Learning Algorithms: Tools and Techniques Using MATLAB and Python
CN110210984A (zh) 大病医保政策调整对基金支出影响的量化方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant