CN112037912B - 基于医疗知识图谱的分诊模型训练方法、装置及设备 - Google Patents

基于医疗知识图谱的分诊模型训练方法、装置及设备 Download PDF

Info

Publication number
CN112037912B
CN112037912B CN202010941859.8A CN202010941859A CN112037912B CN 112037912 B CN112037912 B CN 112037912B CN 202010941859 A CN202010941859 A CN 202010941859A CN 112037912 B CN112037912 B CN 112037912B
Authority
CN
China
Prior art keywords
vector
graph
training
symptom
symptoms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010941859.8A
Other languages
English (en)
Other versions
CN112037912A (zh
Inventor
李彦轩
孙行智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202010941859.8A priority Critical patent/CN112037912B/zh
Priority to PCT/CN2020/124218 priority patent/WO2021151325A1/zh
Publication of CN112037912A publication Critical patent/CN112037912A/zh
Application granted granted Critical
Publication of CN112037912B publication Critical patent/CN112037912B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Animal Behavior & Ethology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明涉及一种人工智能技术领域的智能决策应用领域,揭露一种基于医疗知识图谱的分诊模型训练方法、装置、设备及介质,包括:获取医疗知识图谱,采用图神经网络对医疗知识图谱进行表征学习,获取图谱症状向量;获取疾病对应的医学节点集,医学节点集包括同一疾病的症状、用药和检验检查,采用图神经网络对医学节点集进行表征学习,获取表征同一疾病对应的症状、用药和检验检查关联关系的节点集关联向量;获取训练症状和与训练症状对应的科室标签,基于训练症状对节点集关联向量进行筛选,获取与训练症状对应的目标向量;采用图谱症状向量、训练症状、与训练症状对应的科室标签和目标向量,对TextCNN模型进行模型训练,获取分诊模型。

Description

基于医疗知识图谱的分诊模型训练方法、装置及设备
技术领域
本发明涉及基于人工智能技术领域的智能决策应用领域,具体提供一种基于医疗知识图谱的分诊模型训练方法、装置、设备及介质。
背景技术
随着计算机技术不断地发展,人工智能技术被应用到生活的方方面面,为人们提供更多便利。近年来,人工智能方法被应用于分诊模型中,以利用分诊模型实现为用户智能化确定科室,提供工作效率。但是现有技术中通常是基于异质图训练得到的分诊模型,该分诊模型的训练过程仅仅依据异质图,没有很好地将医学知识融入到分诊模型的建模的过程中,得到的分诊模型鲁棒性和精度不高。
发明内容
本发明实施例提供一种基于医疗知识图谱的分诊模型训练方法、装置、计算机设备及存储介质,以解决现有分诊模型训练存在的鲁棒性和精度不高的问题。
一种基于医疗知识图谱的分诊模型训练方法,包括:
获取医疗知识图谱,采用图神经网络对所述医疗知识图谱进行表征学习,获取图谱症状向量;
获取疾病对应的医学节点集,所述医学节点集包括同一疾病的症状、用药和检验检查,采用图神经网络对所述医学节点集进行表征学习,获取表征同一疾病对应的症状、用药和检验检查关联关系的节点集关联向量;
获取训练症状和与所述训练症状对应的科室标签,基于所述训练症状对所述节点集关联向量进行筛选,获取与所述训练症状对应的目标向量;
采用所述图谱症状向量、所述训练症状、与所述训练症状对应的科室标签和所述目标向量,对TextCNN模型进行模型训练,获取分诊模型。
一种基于医疗知识图谱的分诊模型训练装置,包括:
图谱症状向量获取模块,用于获取医疗知识图谱,采用图神经网络对所述医疗知识图谱进行表征学习,获取图谱症状向量;
节点集关联向量获取模块,用于获取疾病对应的医学节点集,所述医学节点集包括同一疾病的症状、用药和检验检查,采用图神经网络对所述医学节点集进行表征学习,获取表征同一疾病对应的症状、用药和检验检查关联关系的节点集关联向量;
目标向量获取模块,用于获取训练症状和与所述训练症状对应的科室标签,基于所述训练症状对所述节点集关联向量进行筛选,获取与所述训练症状对应的目标向量;
分诊模型获取模块,用于采用所述图谱症状向量、所述训练症状、与所述训练症状对应的科室标签和所述目标向量,对TextCNN模型进行模型训练,获取分诊模型。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于医疗知识图谱的分诊模型训练方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于医疗知识图谱的分诊模型训练方法的步骤。
上述基于医疗知识图谱的分诊模型训练方法、装置、计算机设备及存储介质,获取医疗知识图谱,采用图神经网络对所述医疗知识图谱进行表征学习,获取图谱症状向量,可以实现高效、自动化地获得医疗知识图谱对应的图谱关联向量,减少人工提取节点特征的工作量。获取疾病对应的医学节点集,采用图神经网络对所述医学节点集进行表征学习,获取表征同一疾病对应的症状、用药和检验检查关联关系的节点集关联向量,以实现对同一疾病的信息进行挖掘,深入学习同一疾病的信息间关联性,以使获得的节点集关联向量具有更深层的联系,以提升分诊模型的鲁棒性,使得后续生成的分诊模型准确率更高。采用训练症状对所述节点集关联向量进行筛选,获取与所述训练症状对应的目标向量,确保模型训练样本具有对应关系,保证模型训练的可行性。将采用所述图谱症状向量、所述训练症状、与所述训练症状对应的科室标签和所述目标向量作为模型训练样本,采用所述图谱症状向量、所述训练症状、与所述训练症状对应的科室标签和所述目标向量,对TextCNN模型进行模型训练,获取分诊模型,使得分诊模型可反映医学节点深层的关联关系,提升分诊模型的鲁棒性和并提高训练得到的分诊模型的准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中基于医疗知识图谱的分诊模型训练方法的一应用环境示意图;
图2是本发明一实施例中基于医疗知识图谱的分诊模型训练方法的一流程图;
图3是本发明一实施例中基于医疗知识图谱的分诊模型训练方法的另一流程图;
图4是本发明一实施例中基于医疗知识图谱的分诊模型训练方法的另一流程图;
图5是本发明一实施例中基于医疗知识图谱的分诊模型训练方法的另一流程图;
图6是本发明一实施例中基于医疗知识图谱的分诊模型训练方法的另一流程图;
图7是本发明一实施例中基于医疗知识图谱的分诊模型训练方法的异质图;
图8是本发明一实施例中基于医疗知识图谱的分诊模型训练装置的一原理框图;
图9是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的基于医疗知识图谱的分诊模型训练方法,该基于医疗知识图谱的分诊模型训练方法可应用如图1所示的应用环境中。具体地,该基于医疗知识图谱的分诊模型训练方法应用在基于医疗知识图谱的分诊模型训练系统中,该基于医疗知识图谱的分诊模型训练系统包括如图1所示的客户端和服务器,客户端与服务器通过网络进行通信,用于实现快速地根据用户的症状输出对应的科室,实现自动化分类,提高工作效率。其中,客户端又称为用户端,是指与服务器相对应,为客户提供本地服务的程序。客户端可安装在但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备上。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一实施例中,如图2所示,提供一种基于医疗知识图谱的分诊模型训练方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:
S201:获取医疗知识图谱,采用图神经网络对医疗知识图谱进行表征学习,获取图谱症状向量。
其中,医疗知识图谱是包括症状(如发热和咳嗽等)、疾病(如肺炎和发烧等)、用药(是指治疗疾病的药,例如泰洛和布洛芬等)和检验检查(检测疾病的项目,例如CT等)等医学节点中至少一种的图谱,该医疗知识图谱具体是依据医学节点对应的医学特征间的关联关系得到的,医疗知识图谱包括同质图和异质图。医学节点包括症状、疾病、用药和检验检查。节点特征是指医学节点对应的特征,例如,医学节点为症状,则节点特征为咳嗽等。
同质图是医学节点和边类型的数量均只有一种的图,该医学节点对应医学概念,边为节点特征是否存在相似关系。也就是说,同质图是同一医学节点的相似的节点特征或者不相似的节点特征组成的图,反映节点特征之间是否存在相似关系的图。同质图包括用药同质图、疾病同质图、症状同质图和检验检查同质图,例如将药效相同的用药相连,药效不同的用药不相连所形成的图确定为用药同质图,在用药同质图中边关系代表对某种疾病的用药组合或成分相近的用药。同理地,将相似的疾病相连,不相似的疾病不相连所形成的图确定为疾病同质图。同理地,将相似的症状相连,不相似的症状不相连所形成的图确定为症状同质图,在症状同质图中,存在边关系的两个节点为相似症状,可能是同一种疾病的两个常见症状,也可能是表现相近的两种症状。
异质图指的是医学节点或边类型的数量大于一种的图,如图7所示。本实施例中,异质图的医学节点包括症状、疾病、用药和检验检查,也就是说,异质图为症状、疾病、用药和检验检查等医学特征对应的节点特征形成的图,异质图中相连的节点特征关联性较强,不相连的节点特征关联性较弱,后续对异质图进行表征学习,得到异质图的深层信息。
本实施例中,采用图神经网络对医疗知识图谱进行表征学习,以得到医疗知识图谱中各个医学节点对应的图谱关联向量,该图谱关联向量包括图谱症状向量、图谱疾病向量、图谱用药向量和图谱检验检查向量,并从图谱关联向量中获取图谱症状向量,以便后续对图谱症状向量进行训练。其中,图谱关联向量是指与医疗知识图谱对应的向量。
表征学习是采用计算机学习一个特征的技术的集合,是将数据转换成为能够被机器学习和开发的一种学习形式。本实施例中采用图神经网络对医疗知识图谱进行表征学习,以将医疗知识图谱转化为对应的图谱关联向量。本示例中,医疗知识图谱包括症状、疾病、用药和检验检查等医学节点所形成的图谱,则其对应的图谱关联向量包括图谱症状向量、图谱疾病向量、图谱用药向量和图谱检验检查向量。
具体地,采用图神经网络(指图卷积神经网络)学习同质图中同一医学节点对应的各个节点特征和边的关系,依据同质图的节点特征和边之间的关系形成目标同质向量,具体是采用图神经网络(指图卷积神经网络)分别学习用药同质图、疾病同质图、症状同质图和检验检查同质图中各个节点特征和边的关系,依据同质图的节点特征和边之间的关系形成目标同质向量,因此,该目标同质向量包括同质症状向量、同质疾病向量、同质用药向量和同质检验检查向量,依据同质症状向量、同质疾病向量、同质用药向量和同质检验检查向量初始化图神经网络(指基于注意力机制的异质图神经网络),采用初始化后的图神经网络对异质图的各个医学节点对应的节点特征进行表征学习,以获取用于表征异质图的医学节点的连接关系的图谱关联向量,该图谱关联向量包括图谱症状向量、图谱疾病向量、图谱用药向量和图谱检验检查向量,可以实现高效、自动化地获得医疗知识图谱对应的图谱关联向量,减少人工提取节点特征的步骤。本实施例中,依据目标同质向量初始化图神经网络,再利用初始化后的图神经网络对异质图进行表征学习,使得初始化后的图神经网络可以在同质图中医学节点之间的关联性的基础上对异质图进行表征学习,以有效全面地提取异质图的深层信息。
图神经网络旨在将计算机学中的图结构转化成可以量化且对深度学习模型友好的向量形式。图神经网络可以忽略图结构中节点的输入顺序,在计算过程中,节点的表示受其周围邻居节点的影响,但图本身连接不变;图结构的表示,使得可以进行基于图的解释和推理,从而提取图结构的中节点与节点之间的关联关系。图神经网络包括基于注意力机制的异质图神经网络(HAN)和图卷积网络(GCN)等。
S202:获取疾病对应的医学节点集,医学节点集包括同一疾病的症状、用药和检验检查,采用图神经网络对医学节点集进行表征学习,获取表征同一疾病对应的症状、用药和检验检查关联关系的节点集关联向量。
其中,医学节点集是以疾病为中心,将同一疾病相关的症状、用药和检验检查的对应的节点特征形成集合。例如,以肺炎为例,与肺炎相关的症状为呼吸困难、咳嗽和发热;与肺炎相关的用药为抗生素;与肺炎相关的检验检查为肺部CT,则肺炎对应的医学节点集为肺炎-呼吸困难、咳嗽和发热-抗生素-肺部CT。
节点集关联向量是表征同一疾病对应的症状、用药和检验检查对应的节点特征的关联关系的向量。
本实施例中,采用图神经网络对同一疾病形成的医学节点集的关系进行表征学习,得到同一疾病的医学节点集关系形成的节点集关联向量,以实现对同一疾病的信息进行挖掘,深入学习同一疾病的节点特征的关联性,以使获得的节点集关联向量具有更深层的联系,以提升分诊模型的鲁棒性,使得后续生成的分诊模型准确率更高。
S203:获取训练症状和与训练症状对应的科室标签,基于训练症状对节点集关联向量进行筛选,获取与训练症状对应的目标向量。
其中,训练症状是指用于进行训练TextCNN模型的症状。科室标签是与训练症状对应的科室,该科室标签为训练标签,例如,若训练症状为皮肤问题,则对应的科室标签为皮肤科。
目标向量是指与训练症状相对应的向量,例如,训练症状对应的症状为咳嗽,则根据该症状从节点集关联向量中筛选出目标向量。本实施例中,根据训练症状对节点集关联向量进行筛选,以匹配出训练症状对应的目标向量,确保模型训练样本具有对应关系,保证模型训练的可行性。
S204:采用图谱症状向量、训练症状、与训练症状对应的科室标签和目标向量,对TextCNN模型进行模型训练,获取分诊模型。
其中,分诊模型是用于根据用户的症状自动化为用户确定对应科室的模型。
本实施例中,基于采用图谱症状向量、训练症状、与训练症状对应的科室标签和目标向量,形成用于进行模型训练的训练样本,将该训练样本输入TextCNN模型进行模型训练,获取分诊模型。可以理解地,图谱症状向量从不同疾病和不同疾病的症状、用药、检验检查的维度为模型提供训练数据,目标向量从同一疾病的的症状、用药、检验检查的维度为模型提供训练数据,因此,可以为模型训练提供全面的信息,且图谱症状向量和目标向量包括了医学节点深层的关联关系,以提升分诊模型的鲁棒性和并提高训练得到的分诊模型的准确性。
本实施例所提供的基于医疗知识图谱的分诊模型训练方法,获取医疗知识图谱,采用图神经网络对医疗知识图谱进行表征学习,获取图谱症状向量,可以实现高效、自动化地获得医疗知识图谱对应的图谱关联向量,减少人工提取节点特征的工作量。获取疾病对应的医学节点集,采用图神经网络对医学节点集进行表征学习,获取表征同一疾病对应的症状、用药和检验检查关联关系的节点集关联向量,以实现对同一疾病的信息进行挖掘,深入学习同一疾病的信息间关联性,以使获得的节点集关联向量具有更深层的联系,以提升分诊模型的鲁棒性,使得后续生成的分诊模型准确率更高。采用训练症状对节点集关联向量进行筛选,获取与训练症状对应的目标向量,确保模型训练样本具有对应关系,保证模型训练的可行性。将采用图谱症状向量、训练症状、与训练症状对应的科室标签和目标向量作为模型训练样本,采用图谱症状向量、训练症状、与训练症状对应的科室标签和目标向量,对TextCNN模型进行模型训练,获取分诊模型,使得分诊模型可反映医学节点深层的关联关系,提升分诊模型的鲁棒性和并提高训练得到的分诊模型的准确性。
在一实施例中,如图3所示,步骤S201,即采用图神经网络对医疗知识图谱进行表征学习,获取图谱症状向量,包括:
S301:对医疗知识图谱进行处理,获取图谱邻接矩阵,图谱邻接矩阵包括同质邻接矩阵和异质邻接矩阵。
其中,图谱邻接矩阵与医疗知识图谱对应的矩阵,以将医疗知识图谱转化为计算机可以识别的矩阵。同质邻接矩阵是与同质图对应的邻接矩阵。异质邻接矩阵是与异质图对应的邻接矩阵。
本实施例中,根据医疗知识图谱的医学节点获取全集矩阵,具体是依据医学节点对应的节点特征与节点特征之间的关联关系初始化全集矩阵,形成图谱邻接矩阵,该图谱邻接矩阵为计算机可以识别的矩阵。
以异质图为例,异质图中包括肺炎、咳嗽、肺部CT、慢性咽炎和慢严舒柠等节点特征,则该异质图形成的全集矩阵为:
肺炎 咳嗽 肺部CT 慢性咽炎 慢严舒柠
肺炎 0 0 0 0 0
咳嗽 0 0 0 0 0
肺部CT 0 0 0 0 0
慢性咽炎 0 0 0 0 0
慢严舒柠 0 0 0 0 0
然后,根据节点特征之间的关联关系初始化全集矩阵,具有连接关系的节点特征,则置为1,没有关联关系的节点特征,则置为0,由于肺炎与咳嗽和肺部CT连接,慢性咽炎与咳嗽和慢严舒柠连接,则得到异质图对应的如下所示的异质邻接矩阵:
肺炎 咳嗽 肺部CT 慢性咽炎 慢严舒柠
肺炎 0 1 1 0 0
咳嗽 1 0 0 1 0
肺部CT 1 0 0 0 0
慢性咽炎 0 1 0 0 1
慢严舒柠 0 0 0 1 0
S302:采用图卷积网络对同质邻接矩阵进行表征学习,获取目标同质向量。
其中,图卷积网络是用于对图片或者其他具有欧几里得结构的图结构进行处理,以提取图结构信息的网络。
目标同质向量是对同质邻接矩阵进行表征学习所获取的向量,该目标同质向量包括同质症状向量、同质疾病向量、同质用药向量和同质检验检查向量。
本实施例中,采用图卷积网络对同质邻接矩阵进行表征学习,以得到同质图的节点特征的关联关系,使得目标同质向量具有深层的关联关系。
S303:采用目标同质向量对基于注意力机制的异质图神经网络的节点特征向量进行初始化。
具体地,采用目标同质向量对基于注意力机制的异质图神经网络的节点特征向量进行初始化,使得初始化后的基于注意力机制的异质图神经网络可以预先学习到同一个医学节点的关联关系,从而更好地学习异质图的深层关联信息,使得后续生成的分诊模型鲁棒性较佳,且有助于提高基于注意力机制的异质图神经网络得到图谱关联向量的速度。
本实施例中目标同质向量包括同质症状向量、同质疾病向量、同质用药向量和同质检验检查向量,可采用同质症状向量、同质疾病向量、同质用药向量和同质检验检查向量,分别对基于注意力机制的异质图神经网络中的症状、疾病、用药和检验检查等节点特征映射前的初始向量进行初始化。
S304:采用初始化后的基于注意力机制的异质图神经网络对异质邻接矩阵进行表征学习,获取图谱关联向量。
本实施例采用初始化后的基于注意力机制的异质图神经网络能够更好地学习到异质图中的节点特征的深层关联关系,以使得到的图谱关联向量表征异质图的深层信息。
相比于现有技术仅对异质图进行表征学习,得到的医学节点的关联信息较少且不全面,使得训练得到的分诊模型效果不佳,而且现有对异质图进行训练的异质图神经网络常常随机初始化,表征学习过程中不能很好地提取异质图的深层信息的问题。本实施例,采用目标同质向量对基于注意力机制的异质图神经网络的节点特征向量进行初始化,使得初始化后的基于注意力机制的异质图神经网络可以预先学习到同一个医学节点的关联关系,从而更好地学习异质图的深层关联信息,使得后续生成的分诊模型鲁棒性好且有效提供模型精确性。
本实施例所提供的基于医疗知识图谱的分诊模型训练方法,对医疗知识图谱进行处理,获取图谱邻接矩阵,以得到计算机可以识别并处理的矩阵。采用图卷积网络对同质邻接矩阵进行表征学习,获取目标同质向量,采用图卷积网络对同质邻接矩阵进行表征学习,以得到同质图的医学节点的关联关系,使得目标同质向量具有深层的关联关系。采用目标同质向量对基于注意力机制的异质图神经网络的节点特征向量进行初始化,使得初始化后的基于注意力机制的异质图神经网络可以预先学习到同一个医学节点的关联关系,以使得到的基于注意力机制的异质图神经网络可以更好地学习异质图的深层关联信息,使得后续生成的分诊模型鲁棒性较佳,且加快了基于注意力机制的异质图神经网络得到图谱关联向量的速度。采用初始化后的基于注意力机制的异质图神经网络对异质邻接矩阵进行表征学习,获取图谱关联向量,为分诊模型提供深层关联信息的训练数据,以提高分诊模型的精度。
在一实施例中,如图4所示,步骤S301,即对医疗知识图谱进行处理,获取图谱邻接矩阵,包括:
S401:获取医疗知识图谱中的医学节点,基于医学节点确定对应的节点特征。
其中,节点特征是指医学节点对应的节点特征,例如,医学节点为疾病,节点特征为肺炎、发烧和慢性咽炎等。
S402:基于节点特征构建全集矩阵,基于节点特征的连接关系对全集矩阵进行初始化,获取图谱邻接矩阵。
本实施例中,根据医学节点的节点特征之间的关联关系初始化全集矩阵,具有连接关系的节点特征,则置为1,没有关联关系的节点特征,则置为0,根实现节点特征获得计算机可以识别的图谱邻接矩阵,为后续的表征学习提供基础。
本实施例所提供的基于医疗知识图谱的分诊模型训练方法,获取医疗知识图谱中的医学节点,基于医学节点确定对应的节点特征。基于节点特征构建全集矩阵,基于节点特征的连接关系对全集矩阵进行初始化,以获取计算机可以识别的图谱邻接矩阵,为后续的表征学习提供基础。
在一实施例中,如图5所示,步骤S201,即获取医疗知识图谱,包括:
S501:根据至少两种疾病之间的关联关系形成疾病同质图,根据至少两种症状之间的关联关系形成症状同质图,根据至少两种用药之间的关联关系形成用药同质图,根据至少两种检验检查之间的关联关系形成检验检查同质图。
其中,同质图是医学节点和边类型的数量均为一种的图。
作为一示例,服务器查询数据库,以确定各种疾病,根据至少两种疾病的关联关系,形成疾病同质图,例如,若两种疾病是相似的疾病,则两者之间相连;若两种疾病非相似的疾病,则两者之间不相连,以形成疾病同质图。
作为一示例,服务器查询数据库,以确定各种症状,根据至少两种症状的关联关系,形成症状同质图,例如,若两种症状是相似的症状,则两者之间相连,若两种症状非相似的症状,则两者之间不相连,以形成症状同质图。
作为一示例,服务器查询数据库,以确定各种用药,根据至少两种用药的关联关系,形成用药同质图,例如,若两种用药是相似的用药,则两者之间相连,若两种用药非相似的用药,则两者之间不相连,以形成用药同质图。
作为一示例,服务器查询数据库,以确定各种检验检查,根据至少两种检验检查的关联关系,形成检验检查同质图,例如,若两种检验检查是相似的检验检查,则两者之间相连,若两种检验检查非相似的检验检查,则两者之间不相连,以形成检验检查同质图。
S502:将疾病同质图、症状同质图、用药同质图和检验检查同质图确定为同质图。
S503:根据疾病、症状、用药和检验检查的关联关系形成异质图;
本实施例中,服务器查询数据库,以疾病为中心,连接同一疾病对应的症状、用药和检验检查,并根据症状、用药和检验检查连接疾病所形成的关联关系,形成异质图,该异质图中包含不同疾病、症状、用药和检验检查之间的深层的关联关系。
S504:将同质图和异质图,确定为医疗知识图谱。
本实施例所提供的基于医疗知识图谱的分诊模型训练方法,将疾病同质图、症状同质图、用药同质图和检验检查同质图确定为同质图,以反映医疗知识图谱中疾病、症状、用药和检验查验等节点特征对应的目标同质向量,以便后续利用目标同质向量对基于注意力机制的异质图神经网络进行初始化,提取异质图中的深层信息,确保图谱关联向量的信息更加完整。根据疾病、症状、用药和检验检查的关联关系形成异质图,将同质图和异质图,确定为医疗知识图谱,实现后续根据同质图和异质图得到的图谱关联向量更加全面,避免仅对异质图得到的训练数据具有局限性,获得的模型精度不高。
在一实施例中,步骤S202,即采用图神经网络对医学节点集进行表征学习,获取表征同一疾病对应的症状、用药和检验检查关联关系的节点集关联向量,包括:将医学节点集对应的节点特征转化为节点集邻接矩阵,采用图神经网络对节点集邻接矩阵进行表征学习,获取节点集关联向量。
本实施例中,将表征同一疾病对应的症状、用药和检验检查关联关系的节点特征进行转化,形成同一疾病对应对应的节点全集矩阵,对节点全集矩阵进行初始化,以得到对应的节点集邻接矩阵,采用图神经网络对节点集邻接矩阵进行表征学习,获取节点集关联向量,以便后续根据节点集关联向量和图谱关联向量得到更为信息更为全面的拼接向量,以得到鲁棒性高、泛化能力强的分诊模型。
在一实施例中,TextCNN模型包括第一嵌入层和第二嵌入层;如图6所示,步骤204,即采用图谱症状向量、训练症状、与训练症状对应的科室标签和目标向量,对TextCNN模型进行模型训练,获取分诊模型,包括:
S601:在第一嵌入层对图谱症状向量进行映射操作,获取图谱嵌入向量。
其中,第一嵌入层是用于对图谱症状向量进行降维处理的层,以使谱图症状向量映射为维数较低的图谱嵌入向量。
本示例中,第一嵌入层中采用预先设置的映射表对图谱症状向量进行处理,以得到图谱嵌入向量,从而减少图谱症状向量的维数,减低后续的运算难度。
S602:在第二嵌入层对目标向量进行映射操作,获取目标嵌入向量。
其中,第二嵌入层是用于对目标向量进行降维处理的层,以使目标向量映射为维数较低的目标嵌入向量。
具体地,在第二嵌入层中采用预先设置的映射表对目标向量进行处理,以得到目标嵌入向量,从而减少目标嵌入向量的维数,减低后续的运算难度。
S603:基于训练症状对图谱嵌入向量和目标嵌入向量进行拼接,获取拼接向量。
其中,拼接向量是根据图谱嵌入向量和目标嵌入向量得到的向量,以形成具有深层意义的向量,本示例中,在分诊模型训练过程中充分利用获取信息更为全面的拼接向量,使得获取的分诊模型泛化能力强,鲁棒性高。
本实施例中,采用TensorFlow的tf.concat()函数对图谱嵌入向量和目标嵌入向量进行拼接,快速得到拼接向量。
S604:在卷积层对拼接向量进行卷积操作,获取卷积关联向量,将卷积关联向量输入输出层,获取预测输出结果。
其中,预测输出结果是预测的与训练症状对应的科室结果。
本实施例中,采用输出层计算训练症状对应的可能的科室的概率,并将概率最大的科室作为预测输出结果,以实现依据模型训练样本得到对应的预测输出结果。
S605:基于预测输出结果与科室标签,计算预测误差损失,根据预测误差损失,更新TextCNN模型的参数,在TextCNN模型收敛时,获取分诊模型。
本实施例中,预测误差损失是表示预测输出结果与科室标签的误差。
具体地,对预测误差损失进行求偏导得到梯度值,根据梯度值更新TextCNN模型的参数,实现对TextCNN模型的调优,当预测误差损失小于预设阈值,则TextCNN模型收敛,将textcnn模型确定为分诊模型;若否,则重复步骤S601-S605,直至TextCNN模型收敛。
本实施例所提供的基于医疗知识图谱的模型训练,在第一嵌入层对图谱症状向量进行映射操作,获取图谱嵌入向量,在第二嵌入层对目标向量进行映射操作,获取目标嵌入向量,从而减少图谱症状向量的维数,减低后续的运算难度。基于训练症状对图谱嵌入向量和目标嵌入向量进行拼接,获取拼接向量,在分诊模型训练过程中充分利用获取信息更为全面的拼接向量,使得获取的分诊模型泛化能力强,鲁棒性高。在卷积层对拼接向量进行卷积操作,获取卷积关联向量,将卷积关联向量输入输出层,获取预测输出结果。基于预测输出结果与科室标签,计算预测误差损失,根据预测误差损失,更新TextCNN模型的参数,在TextCNN模型收敛时,获取分诊模型。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种基于医疗知识图谱的分诊模型训练装置,该基于医疗知识图谱的分诊模型训练装置与上述实施例中基于医疗知识图谱的分诊模型训练方法一一对应。如图8所示,该基于医疗知识图谱的分诊模型训练装置包括图谱症状向量获取模块801、节点集关联向量获取模块802、目标向量获取模块803和分诊模型获取模块804。各功能模块详细说明如下:
图谱症状向量获取模块801,用于获取医疗知识图谱,采用图神经网络对医疗知识图谱进行表征学习,获取图谱症状向量;
节点集关联向量获取模块802,用于获取疾病对应的医学节点集,医学节点集包括同一疾病的症状、用药和检验检查,采用图神经网络对医学节点集进行表征学习,获取表征同一疾病对应的症状、用药和检验检查关联关系的节点集关联向量;
目标向量获取模块803,用于获取训练症状和与训练症状对应的科室标签,基于训练症状对节点集关联向量进行筛选,获取与训练症状对应的目标向量;
分诊模型获取模块804,用于采用图谱症状向量、训练症状、与训练症状对应的科室标签和目标向量,对TextCNN模型进行模型训练,获取分诊模型。
优选地,图谱症状向量获取模块801,包括:图谱邻接矩阵获取单元、目标同质向量获取单元、初始化单元和图谱关联向量获取单元。
图谱邻接矩阵获取单元,用于对医疗知识图谱进行处理,获取图谱邻接矩阵,图谱邻接矩阵包括同质邻接矩阵和异质邻接矩阵;
目标同质向量获取单元,用于采用图卷积网络对同质邻接矩阵进行表征学习,获取目标同质向量;
初始化单元,用于采用目标同质向量对基于注意力机制的异质图神经网络的节点特征向量进行初始化;
图谱关联向量获取单元,用于采用初始化后的基于注意力机制的异质图神经网络对异质邻接矩阵进行表征学习,获取图谱关联向量。
优选地,图谱邻接矩阵获取单元,包括:节点特征确定子单元和图谱邻接矩阵获取子单元。
节点特征确定子单元,用于获取医疗知识图谱中的医学节点,基于医学节点确定对应的节点特征;
图谱邻接矩阵获取子单元,用于基于节点特征构建全集矩阵,基于节点特征的连接关系对全集矩阵进行初始化,获取图谱邻接矩阵。
优选地,图谱症状向量获取模块801,包括:关联关系确定单元、同质图确定单元、异质图确定单元和医疗知识图谱确定单元。
关联关系确定单元,用于根据至少两种疾病之间的关联关系形成疾病同质图,根据至少两种症状之间的关联关系形成症状同质图,根据至少两种用药之间的关联关系形成用药同质图,根据至少两种检验检查之间的关联关系形成检验检查同质图;
同质图确定单元,用于将疾病同质图、症状同质图、用药同质图和检验检查同质图确定为同质图;
异质图确定单元,用于根据疾病、症状、用药和检验检查的关联关系形成异质图,
医疗知识图谱确定单元,用于将同质图和异质图,确定为医疗知识图谱。
优选地,节点集关联向量获取模块802,包括:节点集关联向量获取单元。
节点集关联向量获取单元,用于将医学节点集对应的节点特征转化为节点集邻接矩阵,采用图神经网络对节点集邻接矩阵进行表征学习,获取节点集关联向量。
优选地,分诊模型获取模块804,包括:图谱嵌入向量获取单元、目标嵌入向量获取单元、拼接向量获取单元、预测输出结果获取单元和分诊模型获取单元。
图谱嵌入向量获取单元,用于在第一嵌入层对图谱症状向量进行映射操作,获取图谱嵌入向量;
目标嵌入向量获取单元,用于在第二嵌入层对目标向量进行映射操作,获取目标嵌入向量;
拼接向量获取单元,用于基于训练症状对图谱嵌入向量和目标嵌入向量进行拼接,获取拼接向量;
预测输出结果获取单元,用于在卷积层对拼接向量进行卷积操作,获取卷积关联向量,将卷积关联向量输入输出层,获取预测输出结果;
分诊模型获取单元,用于基于预测输出结果与科室标签,计算预测误差损失,根据预测误差损失,更新TextCNN模型的参数,在TextCNN模型收敛时,获取分诊模型。
关于基于医疗知识图谱的分诊模型训练装置的具体限定可以参见上文中对于基于医疗知识图谱的分诊模型训练方法的限定,在此不再赘述。上述基于医疗知识图谱的分诊模型训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储异质图。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于医疗知识图谱的分诊模型训练方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中基于医疗知识图谱的分诊模型训练方法的步骤,例如图2所示的步骤S201-S204,或者图3至图6中所示的步骤,为避免重复,这里不再赘述。或者,处理器执行计算机程序时实现基于医疗知识图谱的分诊模型训练装置这一实施例中的各模块/单元的功能,例如图8所示的图谱症状向量获取模块801、节点集关联向量获取模块802、目标向量获取模块803和分诊模型获取模块804的功能,为避免重复,这里不再赘述。
在一实施例中,提供一计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中基于医疗知识图谱的分诊模型训练方法的步骤,例如图2所示的步骤S201-S204,或者图3至图6中所示的步骤,为避免重复,这里不再赘述。或者,处理器执行计算机程序时实现基于医疗知识图谱的分诊模型训练装置这一实施例中的各模块/单元的功能,例如图8所示的图谱症状向量获取模块801、节点集关联向量获取模块802、目标向量获取模块803和分诊模型获取模块804的功能,为避免重复,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (7)

1.一种基于医疗知识图谱的分诊模型训练方法,其特征在于,包括:
获取医疗知识图谱,采用图神经网络对所述医疗知识图谱进行表征学习,获取图谱症状向量;
所述采用图神经网络对所述医疗知识图谱进行表征学习,获取图谱症状向量,包括:
对所述医疗知识图谱进行处理,获取图谱邻接矩阵,所述图谱邻接矩阵包括同质邻接矩阵和异质邻接矩阵;
采用图卷积网络对同质邻接矩阵进行表征学习,获取目标同质向量;
采用所述目标同质向量对基于注意力机制的异质图神经网络的节点特征向量进行初始化;
采用初始化后的基于注意力机制的异质图神经网络对所述异质邻接矩阵进行表征学习,获取图谱关联向量;
获取疾病对应的医学节点集,所述医学节点集包括同一疾病的症状、用药和检验检查,采用图神经网络对所述医学节点集进行表征学习,获取表征同一疾病对应的症状、用药和检验检查关联关系的节点集关联向量;
获取训练症状和与所述训练症状对应的科室标签,基于所述训练症状对所述节点集关联向量进行筛选,获取与所述训练症状对应的目标向量;
采用所述图谱症状向量、所述训练症状、与所述训练症状对应的科室标签和所述目标向量,对TextCNN模型进行模型训练,获取分诊模型;
所述TextCNN模型包括第一嵌入层和第二嵌入层;所述采用所述图谱症状向量、所述训练症状、与所述训练症状对应的科室标签和所述目标向量,对TextCNN模型进行模型训练,获取分诊模型,包括:
在所述第一嵌入层对所述图谱症状向量进行映射操作,获取图谱嵌入向量;
在所述第二嵌入层对所述目标向量进行映射操作,获取目标嵌入向量;
基于训练症状对所述图谱嵌入向量和所述目标嵌入向量进行拼接,获取拼接向量;
在卷积层对拼接向量进行卷积操作,获取卷积关联向量,将所述卷积关联向量输入输出层,获取预测输出结果;
基于所述预测输出结果与所述科室标签,计算预测误差损失,根据预测误差损失,更新所述TextCNN模型的参数,在所述TextCNN模型收敛时,获取分诊模型。
2.如权利要求1所述的基于医疗知识图谱的分诊模型训练方法,其特征在于,所述对所述医疗知识图谱进行处理,获取图谱邻接矩阵,包括:
获取所述医疗知识图谱中的医学节点,基于所述医学节点确定对应的节点特征;
基于所述节点特征构建全集矩阵,基于所述节点特征的连接关系对所述全集矩阵进行初始化,获取图谱邻接矩阵。
3.如权利要求1所述的基于医疗知识图谱的分诊模型训练方法,其特征在于,所述获取医疗知识图谱,包括:
根据至少两种疾病之间的关联关系形成疾病同质图,根据至少两种症状之间的关联关系形成症状同质图,根据至少两种用药之间的关联关系形成用药同质图,根据至少两种检验检查之间的关联关系形成检验检查同质图;
将所述疾病同质图、症状同质图、用药同质图和检验检查同质图确定为同质图;
根据疾病、症状、用药和检验检查的关联关系形成异质图;
将所述同质图和所述异质图,确定为医疗知识图谱。
4.如权利要求1所述的基于医疗知识图谱的分诊模型训练方法,其特征在于,所述采用图神经网络对所述医学节点集进行表征学习,获取表征同一疾病对应的症状、用药和检验检查关联关系的节点集关联向量,包括:
将所述医学节点集对应的节点特征转化为节点集邻接矩阵,采用图神经网络对所述节点集邻接矩阵进行表征学习,获取节点集关联向量。
5.一种基于医疗知识图谱的分诊模型训练装置,其特征在于,包括:
图谱症状向量获取模块,用于获取医疗知识图谱,采用图神经网络对所述医疗知识图谱进行表征学习,获取图谱症状向量;
所述图谱症状向量获取模块,包括:
图谱邻接矩阵获取单元,用于对所述医疗知识图谱进行处理,获取图谱邻接矩阵,所述图谱邻接矩阵包括同质邻接矩阵和异质邻接矩阵;
目标同质向量获取单元,用于采用图卷积网络对同质邻接矩阵进行表征学习,获取目标同质向量;
初始化单元,用于采用所述目标同质向量对基于注意力机制的异质图神经网络的节点特征向量进行初始化;
图谱关联向量获取单元,用于采用初始化后的基于注意力机制的异质图神经网络对所述异质邻接矩阵进行表征学习,获取图谱关联向量;
节点集关联向量获取模块,用于获取疾病对应的医学节点集,所述医学节点集包括同一疾病的症状、用药和检验检查,采用图神经网络对所述医学节点集进行表征学习,获取表征同一疾病对应的症状、用药和检验检查关联关系的节点集关联向量;
目标向量获取模块,用于获取训练症状和与所述训练症状对应的科室标签,基于所述训练症状对所述节点集关联向量进行筛选,获取与所述训练症状对应的目标向量;
分诊模型获取模块,用于采用所述图谱症状向量、所述训练症状、与所述训练症状对应的科室标签和所述目标向量,对TextCNN模型进行模型训练,获取分诊模型;
所述TextCNN模型包括第一嵌入层和第二嵌入层;所述采用所述图谱症状向量、所述训练症状、与所述训练症状对应的科室标签和所述目标向量,对TextCNN模型进行模型训练,获取分诊模型,包括:
在所述第一嵌入层对所述图谱症状向量进行映射操作,获取图谱嵌入向量;
在所述第二嵌入层对所述目标向量进行映射操作,获取目标嵌入向量;
基于训练症状对所述图谱嵌入向量和所述目标嵌入向量进行拼接,获取拼接向量;
在卷积层对拼接向量进行卷积操作,获取卷积关联向量,将所述卷积关联向量输入输出层,获取预测输出结果;
基于所述预测输出结果与所述科室标签,计算预测误差损失,根据预测误差损失,更新所述TextCNN模型的参数,在所述TextCNN模型收敛时,获取分诊模型。
6.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述基于医疗知识图谱的分诊模型训练方法的步骤。
7.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述基于医疗知识图谱的分诊模型训练方法的步骤。
CN202010941859.8A 2020-09-09 2020-09-09 基于医疗知识图谱的分诊模型训练方法、装置及设备 Active CN112037912B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010941859.8A CN112037912B (zh) 2020-09-09 2020-09-09 基于医疗知识图谱的分诊模型训练方法、装置及设备
PCT/CN2020/124218 WO2021151325A1 (zh) 2020-09-09 2020-10-28 基于医疗知识图谱的分诊模型训练方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010941859.8A CN112037912B (zh) 2020-09-09 2020-09-09 基于医疗知识图谱的分诊模型训练方法、装置及设备

Publications (2)

Publication Number Publication Date
CN112037912A CN112037912A (zh) 2020-12-04
CN112037912B true CN112037912B (zh) 2023-07-11

Family

ID=73583926

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010941859.8A Active CN112037912B (zh) 2020-09-09 2020-09-09 基于医疗知识图谱的分诊模型训练方法、装置及设备

Country Status (2)

Country Link
CN (1) CN112037912B (zh)
WO (1) WO2021151325A1 (zh)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112559640B (zh) * 2020-12-06 2023-06-06 支付宝(杭州)信息技术有限公司 图谱表征系统的训练方法及装置
CN113609337A (zh) * 2021-02-24 2021-11-05 腾讯科技(深圳)有限公司 图神经网络的预训练方法、训练方法、装置、设备及介质
CN113674856B (zh) * 2021-04-15 2023-12-12 腾讯科技(深圳)有限公司 基于人工智能的医学数据处理方法、装置、设备及介质
CN113077894A (zh) * 2021-04-26 2021-07-06 中南大学湘雅三医院 基于图卷积神经网络的皮肤诊断系统、方法、设备及介质
CN113470811B (zh) * 2021-06-16 2024-10-01 广州中康数字科技有限公司 一种基于深度强化学习的辅助智能问诊系统
CN113704492B (zh) * 2021-08-26 2024-02-27 山东大学 一种老年照护数据知识图谱的构建方法及系统
CN113707322B (zh) * 2021-08-31 2023-09-19 平安科技(深圳)有限公司 信息预测模型的训练方法、装置、计算机设备及存储介质
CN113808664B (zh) * 2021-09-26 2024-03-19 平安科技(深圳)有限公司 基于机器学习的抗体筛选方法及装置
CN114037079B (zh) * 2021-11-25 2024-08-06 江苏科技大学 基于图神经网络与知识图谱的气缸盖多故障整体诊断方法
CN113990495B (zh) * 2021-12-27 2022-04-29 之江实验室 一种基于图神经网络的疾病诊断预测系统
CN114840663A (zh) * 2022-02-14 2022-08-02 阿里巴巴(中国)有限公司 模型训练方法和装置、文本分类方法、电子设备及存储介质
CN114564623B (zh) * 2022-03-10 2023-09-26 天津大学 基于实体与关系聚合图的知识图谱嵌入模型
CN114678113B (zh) * 2022-03-14 2023-07-18 浙江大学 一种基于卷积神经网络的智能急诊预检分诊系统
CN114496234B (zh) * 2022-04-18 2022-07-19 浙江大学 一种基于认知图谱的全科患者个性化诊疗方案推荐系统
CN116110588B (zh) * 2022-05-10 2024-04-26 北京理工大学 基于动态邻接矩阵和时空注意力的医学时间序列预测方法
CN114842927B (zh) * 2022-05-20 2024-06-07 华东师范大学 一种知识图谱注意力网络的药物与通路的关联预测方法
CN115719640B (zh) * 2022-11-02 2023-08-08 联仁健康医疗大数据科技股份有限公司 中医主次症状识别系统、装置、电子设备及其存储介质
CN115658927B (zh) * 2022-11-17 2023-04-11 浙江大学 一种面向时序知识图谱的无监督实体对齐方法及装置
CN115687932B (zh) * 2022-12-23 2023-03-28 阿里健康科技(中国)有限公司 多元组数据标注方法、模型训练方法、装置、设备和介质
CN115985491B (zh) * 2023-03-21 2023-07-18 安徽通灵仿生科技有限公司 一种介入式心室导管泵的医学信息处理系统
CN116646072A (zh) * 2023-05-18 2023-08-25 肇庆医学高等专科学校 一种前列腺诊断神经网络模型的训练方法及装置
CN117010494B (zh) * 2023-09-27 2024-01-05 之江实验室 一种基于因果表示学习的医学数据生成方法及系统
CN117038105B (zh) * 2023-10-08 2023-12-15 武汉纺织大学 一种基于信息增强图神经网络的药物重定位方法及系统
CN117174319B (zh) * 2023-11-03 2024-03-01 神州医疗科技股份有限公司 一种基于知识图谱的脓毒症时序预测方法及系统
CN117747125A (zh) * 2023-12-22 2024-03-22 重庆邮电大学 一种利用疾病知识图谱发现疾病-症状关联关系的方法
CN118398174A (zh) * 2024-04-22 2024-07-26 脉景(杭州)健康管理有限公司 一种面向专病的问诊引导方法、系统及电子设备
CN118193797B (zh) * 2024-05-17 2024-07-26 之江实验室 一种业务执行的方法、装置、存储介质及电子设备
CN118486453B (zh) * 2024-07-02 2024-10-11 厦门智数联科技有限公司 基于人工智能的疾病预警系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106408561A (zh) * 2016-09-10 2017-02-15 天津大学 一种基于图像纹理特征的无参考图像质量评价方法
CN108182262A (zh) * 2018-01-04 2018-06-19 华侨大学 基于深度学习和知识图谱的智能问答系统构建方法和系统
WO2020082560A1 (zh) * 2018-10-25 2020-04-30 平安科技(深圳)有限公司 文本关键词提取方法、装置、设备及计算机可读存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8630868B2 (en) * 2010-11-21 2014-01-14 Datagenno Interactive Research Ltda. Method and system to exchange information about diseases
US20160246919A1 (en) * 2013-10-08 2016-08-25 The Regents Of The University Of California Predictive optimization of network system response
CN105023073A (zh) * 2014-04-16 2015-11-04 北京百和园科技有限公司 一种基于人工神经网络的医院智能评估分诊系统
US20180218126A1 (en) * 2017-01-31 2018-08-02 Pager, Inc. Determining Patient Symptoms and Medical Recommendations Based on Medical Information
US20180218127A1 (en) * 2017-01-31 2018-08-02 Pager, Inc. Generating a Knowledge Graph for Determining Patient Symptoms and Medical Recommendations Based on Medical Information
CN109166618A (zh) * 2017-06-28 2019-01-08 京东方科技集团股份有限公司 分诊系统和分诊方法
US20190279767A1 (en) * 2018-03-06 2019-09-12 James Stewart Bates Systems and methods for creating an expert-trained data model
CN109635122A (zh) * 2018-11-28 2019-04-16 平安科技(深圳)有限公司 智能疾病问询方法、装置、设备及存储介质
CN110675944A (zh) * 2019-09-20 2020-01-10 京东方科技集团股份有限公司 分诊方法及装置、计算机设备及介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106408561A (zh) * 2016-09-10 2017-02-15 天津大学 一种基于图像纹理特征的无参考图像质量评价方法
CN108182262A (zh) * 2018-01-04 2018-06-19 华侨大学 基于深度学习和知识图谱的智能问答系统构建方法和系统
WO2020082560A1 (zh) * 2018-10-25 2020-04-30 平安科技(深圳)有限公司 文本关键词提取方法、装置、设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN112037912A (zh) 2020-12-04
WO2021151325A1 (zh) 2021-08-05

Similar Documents

Publication Publication Date Title
CN112037912B (zh) 基于医疗知识图谱的分诊模型训练方法、装置及设备
WO2022068196A1 (zh) 跨模态的数据处理方法、装置、存储介质以及电子装置
CN112949786B (zh) 数据分类识别方法、装置、设备及可读存储介质
CN111506714A (zh) 基于知识图嵌入的问题回答
US20180060722A1 (en) Machine learning method and apparatus based on weakly supervised learning
US20200160154A1 (en) Systems and methods for assessing item compatibility
US11714921B2 (en) Image processing method with ash code on local feature vectors, image processing device and storage medium
JP2022543954A (ja) キーポイント検出方法、キーポイント検出装置、電子機器及び記憶媒体
US11928597B2 (en) Method and system for classifying images using image embedding
WO2021051497A1 (zh) 肺结核判定方法、装置、计算机设备及存储介质
EP4361843A1 (en) Neural network searching method and related device
CN111832581B (zh) 肺部特征识别方法、装置、计算机设备及存储介质
US20230281390A1 (en) Systems and methods for enhanced review comprehension using domain-specific knowledgebases
CN112530550A (zh) 影像报告生成方法、装置、计算机设备和存储介质
Zhu et al. Joint affine and deformable three‐dimensional networks for brain MRI registration
Polat A modified DeepLabV3+ based semantic segmentation of chest computed tomography images for COVID‐19 lung infections
CN111192660A (zh) 一种影像报告分析方法、设备及计算机存储介质
CN112016311A (zh) 基于深度学习模型的实体识别方法、装置、设备及介质
CA3068891C (en) Method and system for generating a vector representation of an image
WO2022178995A1 (zh) Ct图像去噪处理方法、装置、计算机设备及介质
TWI816078B (zh) 樣本分群探勘方法
CN117594183A (zh) 基于反事实数据增强的放射学报告生成方法
US20240104348A1 (en) Temporal-Aware and Local-Aggregation Graph Neural Networks
CN114420221B (zh) 一种基于知识图谱辅助的多任务药物筛选方法和系统
Zhang et al. Semi‐supervised graph convolutional networks for the domain adaptive recognition of thyroid nodules in cross‐device ultrasound images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40040602

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant