CN112447300A

CN112447300A - 基于图神经网络的医疗查询方法、装置、计算机设备及存储介质

Info

Publication number: CN112447300A
Application number: CN202011364216.8A
Authority: CN
Inventors: 李佳琳; 李昌昊; 王健宗
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2020-11-27
Filing date: 2020-11-27
Publication date: 2021-03-05
Anticipated expiration: 2040-11-27
Also published as: CN112447300B; WO2021213160A1

Abstract

本发明公开了基于图神经网络的医疗查询方法、装置、计算机设备及存储介质，属于人工智能领域。本发明可根据数据库中的数据表的表名及列名构建由表节点和列节点组成的关系图网络，通过关系图网络表示数据库中表与表之间的关联关系；能够对接收到的查询请求进行实体识别以确定查询词，计算查询词与关系图网络中网络节点的词向量得到词向量序列，通过编码器对词向量序列编码得到编码序列，通过解码器对编码序列解码，以得到查询语句，从而根据查询语句查询数据库获取查询结果，从而达到提高查询效率的目的，同时简化了用户对多维度信息查询时的查询步骤，并减低了学习训练的时间成本。

Description

基于图神经网络的医疗查询方法、装置、计算机设备及存储介质

技术领域

本发明涉及人工智能领域，尤其涉及基于图神经网络的医疗查询方法、装置、计算机设备及存储介质。

背景技术

现有医疗行业的医疗数据(如：患者就诊信息、科室人员信息、药物开具历史信息等)通常以表格的形式存储在数据库中，不同的数据表对应着不同的信息，表与表之间依靠一些关系连接，专业人员查询资料需要采用SQL语句来对不同的表进行精准整合和查询。但对于缺乏这方面专业语句知识的人员来说，想要查询数据库中的数据，只能通过选择开发人员设定好的选项来查询数据，但这种查询形式限制了数据查询的自由性，并不能满足用户的所有查询需求。

针对这一问题，目前主要采用机器学习的方式，通过采集大量的SQL语句以及这些语句对应的查询结果标注信息训练查询模型，通过训练后的查询模型查询数据库，从而满足用户复杂多变的查询需求。但该方法存在标注工作量大、训练时间长而且针对全新的数据库时原有标注下训练的模型会难以复用导致需要重新训练，以及耗时长的缺陷。

发明内容

针对现有查询数据库的方法学习训练时间长的问题，现提供一种旨在可降低学习训练的时间成本，查询效率高的基于图神经网络的医疗查询方法、装置、计算机设备及存储介质。

为实现上述目的，本发明提供一种基于图神经网络的医疗查询方法，包括：

提取数据库中各个数据表的表名及对应的列名，将所述表名作为表节点、所述列名作为列节点，并将相应的表节点与相应的列节点进行连接，将不同数据表中相同列名对应的不同表名的表节点进行连接，形成关系图网络，所述关系图网络的网络节点包括表节点和列节点；

获取查询请求，对所述查询请求进行实体识别获取查询词；

计算所述查询词与所述关系图网络中网络节点的词向量，生成词向量序列；

采用编码器对所述词向量序列进行编码获取编码序列；

采用解码器对所述编码序列进行解码以获取查询语句；

根据所述查询语句查询所述数据库获取查询结果。

可选的，获取查询请求，对所述查询请求进行实体识别获取查询词，包括：

获取所述查询请求；

采用BERT分词器对所述查询请求进行实体识别，以获取所述查询词。

可选的，计算所述查询词与所述关系图网络中网络节点的词向量，生成词向量序列，包括：

将所述查询词逐个与所述关系图网络中的所述表节点进行匹配，获取与所有所述查询词匹配的所述表节点；

根据所述表节点的个数选择查询模式；

根据选择的查询模式，计算与所有所述查询词匹配的所述表节点以及与所述表节点关联的网络节点的词向量，生成词向量序列。

可选的，所述查询模块包括单表查询模式和多表查询模块；

根据所述表节点的个数选择查询模式，包括：

当所述表节点的个数为1个时，选择所述单表查询模式；

当所述表节点的个数为大于1个时，选择所述多表查询模式。

可选的，根据选择的查询模式，计算与所有所述查询词匹配的所述表节点以及与所述表节点关联的网络节点的词向量，生成词向量序列，包括：

当所述查询模式为单表查询模式时，获取与所有所述查询词匹配的所述表节点，以及与所述表节点关联的列节点，分别计算所述查询词与表节点以及列节点的词向量，以生成所述词向量序列；

当所述查询模式为多表查询模式时，获取与所有所述查询词匹配的所述表节点，以及与每一个所述表节点关联的列节点以及其他表节点，分别计算所述查询词与所述表节点以及相应的所述列节点的词向量，以生成所述词向量序列。

可选的，采用编码器对所述词向量序列进行编码获取编码序列，包括：

将所述词向量序列输入所述编码器进行编码获取编码初始序列，采用注意力模型计算每个词向量的权重值，将每个所述词向量的权重值与所述编码初始序列中相应的编码初始向量进行计算，获取编码向量，根据所述编码向量生成所述编码序列。

可选的，采用解码器对所述编码序列进行解码以获取查询语句，包括：

将所述编码序列输入到所述解码器进行解码，以获取候选词汇序列，所述候选词汇为表节点的表名或列节点的列名；

根据每一个所述候选词汇对应的编码向量，分别计算每一所述候选词汇的分值，将分值最高的所述候选词汇作为目标词汇，将所述目标词汇与预设语句库中的语句进行匹配，获取与所述目标词汇匹配的所述查询语句。

为实现上述目的，本发明还提供一种基于图神经网络的医疗查询装置，包括：

构建单元，用于提取数据库中各个数据表的表名及对应的列名，将所述表名作为表节点、所述列名作为列节点，并将相应的表节点与相应的列节点进行连接，将不同数据表中相同列名对应的不同表名的表节点进行连接，形成关系图网络，所述关系图网络的网络节点包括表节点和列节点；

识别单元，用于获取查询请求，对所述查询请求进行实体识别获取查询词；

生成单元，用于计算所述查询词与所述关系图网络中网络节点的词向量，生成词向量序列；

编码单元，用于采用编码器对所述词向量序列进行编码获取编码序列；

解码单元，用于采用解码器对所述编码序列进行解码以获取查询语句；

查询单元，用于根据所述查询语句查询所述数据库获取查询结果。

为实现上述目的，本发明还提供一种计算机设备，所述计算机设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述方法的步骤。

为实现上述目的，本发明还提供一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现上述方法的步骤。

本发明提供的基于图神经网络的医疗查询方法、装置、计算机设备及存储介质，可根据数据库中的数据表的表名及列名构建由表节点和列节点组成的关系图网络，通过关系图网络表示数据库中表与表之间的关联关系；能够对接收到的查询请求进行实体识别以确定查询词，计算查询词与关系图网络中网络节点的词向量得到词向量序列，通过编码器对词向量序列编码得到编码序列，通过解码器对编码序列解码，以得到查询语句，从而根据查询语句查询数据库获取查询结果，从而达到提高查询效率的目的，同时简化了用户对多维度信息查询时的查询步骤，并减低了学习训练的时间成本。

附图说明

图1为本发明所述的基于图神经网络的医疗查询方法的一种实施例的流程图；

图2为本发明生成词向量序列的一种实施例的流程图；

图3为本发明所述基于图神经网络的医疗查询装置的一种实施例的模块图；

图4为本发明计算机设备的一个实施例的硬件架构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

需要说明的是，在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

本发明提供的基于图神经网络的医疗查询方法、装置、计算机设备及存储介质适用于智慧医疗领域。本发明可根据数据库中的数据表的表名及列名构建由表节点和列节点组成的关系图网络，通过关系图网络表示数据库中表与表之间的关联关系；能够对接收到的查询请求进行实体识别以确定查询词，计算查询词与关系图网络中网络节点的词向量得到词向量序列，通过编码器对词向量序列编码得到编码序列，通过解码器对编码序列解码，以得到查询语句，从而根据查询语句查询数据库获取查询结果，从而达到提高查询效率的目的，同时简化了用户对多维度信息查询时的查询步骤，并减低了学习训练的时间成本。

实施例一

请参阅图1，本实施例的一种基于图神经网络的医疗查询方法，包括以下步骤：

S1.提取数据库中各个数据表的表名及对应的列名，将所述表名作为表节点、所述列名作为列节点，并将相应的表节点与相应的列节点进行连接，将不同数据表中相同列名对应的不同表名的表节点进行连接，形成关系图网络。

其中，所述关系图网络的网络节点包括表节点和列节点。

本实施例中，数据库为医疗数据库，数据表可以包括患者信息表(列名可包括：患者姓名、性别、患者id等)、时间信息表(列名可包括：时间段id、就诊患者姓名等)、就诊信息表(列名可包括：就诊id、病情描述、开具药物等)等信息表。通过提取各个信息表的表名以及表中相应的列名构建关系图网络，其中，表名对应关系图网络中的表节点，列名对应关系图网络中的列节点。在关系图网络中，表节点与表节点之间通过相同的列节点构建关联关系，例如：患者信息表中的患者id的列名与就诊信息表中的患者id列名相同，由于两个表的列名对应的列节点相同，因此患者信息表对应的表节点与就诊信息表的表节点之间存在关联关系。

需要强调的是，为进一步保证上述数据表的私密和安全性，上述数据表还可以存储于一区块链的节点中。

S2.获取查询请求，对所述查询请求进行实体识别获取查询词。

进一步地，步骤S2可包括：获取所述查询请求，采用BERT分词器对所述查询请求进行实体识别，以获取所述查询词。

作为举例而非限定，接收到用户输入的自然语言的查询请求，如“查询在2月份医生为病患X开具最多的药物的名称”，采用BERT分词器对查询请求进行实体识别，以获取查询词：2月份，患者X，最多的药物名称。

本实施例中，BERT分词器为应用NER(Named Entity Recognition，命名实体识别)数据集对BERT中文预训练模型进行训练后得到的分词器。通过BERT分词器实现对查询请求中的名词、否定词以及其他形容词如“最多的”的提取。

S3.计算所述查询词与所述关系图网络中网络节点的词向量，生成词向量序列。

进一步地，参阅图2所示步骤S3可包括以下步骤：

S31.将所述查询词逐个与所述关系图网络中的所述表节点进行匹配，获取与所有所述查询词匹配的所述表节点。

本实施例中，当查询词有多个时，可逐个将每一查询词与关系图网络中的所有表节点进行匹配，以获取匹配的表节点以及表节点的个数。

S32.根据所述表节点的个数选择查询模式。

其中，所述查询模块包括单表查询模式和多表查询模块。

具体地，步骤S32可包括：当所述表节点的个数为1个时，选择所述单表查询模式；当所述表节点的个数为大于1个时，选择所述多表查询模式；当表节点的个数小于1个时，生成无法查询的消息并输出，以向反馈用户。

S33.根据选择的查询模式，计算与所有所述查询词匹配的所述表节点以及与所述表节点关联的网络节点的词向量，生成词向量序列。

具体地，步骤S33可包括：当所述查询模式为单表查询模式时，获取与所有所述查询词匹配的所述表节点，以及与所述表节点关联的列节点，分别计算所述查询词与表节点以及列节点的词向量，以生成所述词向量序列。

本实施例中，当与查询词匹配的表节点只有一个时，表示关系图网络中与查询词匹配的表只有一个，可采用单表查询模式进行查询，获取与该表的表节点关联的列节点，通过公式(1)计算每个网络节点(表节点和列节点)与查询词的相关程度，即步骤S1中所构建的关系图网络中网络节点与查询词中每个词x_i的相关度s_link，并且通过softmax归一化得到一个概率分布(作用是统一概率范围到0至1之间便于计算)，取其中最大一个概率作为与查询词的相关度：

其中，v为需要学习的模式，该模式指不同词汇的数字、药品名称等可以对应的数据库表中的对应的列名，如2月可对应列名：time，张三可对应用户信息表中列名：name等。取其中最大的一个概率作为查询词x_i与网络节点的相关度，用这个相关度和初始向量(即查询请求中每个查询词x_i的向量表示)得到基于查询词的向量，经过L层(L数量基于不同输入词汇数量定义，直到完成所有节点的最终词向量转换)GNN得到每个网络节点基于查询词相关度的最终词向量，经过GNN模块处理后使每个网络节点可以和用户问题做更好的对齐，以便后续的编码。

具体地，步骤S33可包括：当所述查询模式为多表查询模式时，获取与所有所述查询词匹配的所述表节点，以及与每一个所述表节点关联的列节点以及其他表节点，分别计算所述查询词与所述表节点以及相应的所述列节点的词向量，以生成所述词向量序列。

本实施例中，当与查询词匹配的表节点有多个时，表示关系图网络中与查询词匹配的表只有多个，可采用多表查询模式进行查询，获取与该表的表节点关联的列节点和与该表的表节点关联的其他表节点，以及与其他表节点关联的其他列节点。从步骤S1网络中选取与查询词相关联的表节点和列节点(如：与病患信息表对应的表节点关联的列节点可包括：病患id、病患姓名等列节点；与诊信息表对应的表节点关联的列节点可包括：病患id、药物名称、时间等列节点；与药物信息表对应的表节点关联的列节点可包括：药物id)，通过公式(1)计算每个网络节点(表节点和列节点)与查询词的相关程度，即步骤S1中所构建的关系图网络中网络节点与查询词中每个词x_i的相关度s_link，并且通过softmax归一化得到一个概率分布(作用是统一概率范围到0至1之间便于计算)，取其中最大一个概率作为与查询词的相关度，用这个相关度和初始向量(即查询请求中每个查询词x_i的向量表示)得到基于查询词的向量，经过L层(L数量基于不同输入词汇数量定义，直到完成所有节点的最终词向量转换)GNN得到每个网络节点基于查询词相关度的最终词向量，经过GNN模块处理后使每个网络节点可以和用户问题做更好的对齐，以便后续的编码。

S4.采用编码器对所述词向量序列进行编码获取编码序列。

进一步地，步骤S4可包括：将所述词向量序列输入所述编码器进行编码获取编码初始序列，采用注意力模型计算每个词向量的权重值，将每个所述词向量的权重值与所述编码初始序列中相应的编码初始向量进行计算，获取编码向量，根据所述编码向量生成所述编码序列。

本实施例中，通过步骤S3完成了针对词的初步编码，即基于网络节点间的关系完成网络节点与查询词关联程度的对应。继续将步骤S3中得到的结合了基于查询词的相关度的每个词向量输入语义解析模型中进行编码(Encoding)，在该过程中输入的序列，即步骤S3中得到的词向量序列，通过编码器转化成一个编码后的向量的编码序列。

具体地，在编码阶段基于双向LSTM网络对步骤S3中计算得到的每个节点的最终词向量进行编码，其工作原理可理解为，每一个节点词向量作为一个独立的输入，输入到双向LSTM编码器，在该编码器中通过捉到当前时刻t的过去和未来的特征，即每一个输入都会参考前后输入的内容，从而确保在编码时保留最多的时序信息。同时在编码过程中会加入Attention模型，即注意力模型，这种模型在产生输出的时候，还会产生一个“注意力范围”表示接下来输出的时候要重点关注输入序列中的哪些部分，然后根据关注的区域来产生下一个输出。该注意力模型基于原始问题对每个节点的词向量计算一个权重值，会赋予每个进行编码的词向量不同的关注比重。上述编码步骤能够确保输出时能够针对上下文语境、重点关注的内容等进行更合理的输出判断。

S5.采用解码器对所述编码序列进行解码以获取查询语句。

进一步地，步骤S5可包括：将所述编码序列输入到所述解码器进行解码，以获取候选词汇序列，所述候选词汇为表节点的表名或列节点的列名；根据每一个所述候选词汇对应的编码向量，分别计算每一所述候选词汇的分值，将分值最高的所述候选词汇作为目标词汇，将所述目标词汇与预设语句库中的语句进行匹配，获取与所述目标词汇匹配的所述查询语句。

本实施例中的查询语句采用SQL语句。

在步骤S4中完成序列的编码后，可以获得一个包含每个节点词向量对与查询词对应关系以及包含每个词向量前后关系的向量的序列，将其输入解码器进行解码。本实施例中的解码器使用的是LSTM网络，基于该网络在解码的时候，每一步都会基于权重值选择性的从向量序列中挑选一个子集进行进一步处理，这样在产生每一个输出的时候，都能够做到充分利用输入序列携带的信息，包括上下文以及关注度信息。解码输出时，如输出的是操作词汇(如“最多”)，则完成最多所对应的操作SQL单词以及该操作输出的位置顺序。如果输出的是表名(Header)/列名(Table)这类词(如药品、患者等)，则用该向量与数据库表格的Header/Table计算一个分数(计算使用该向量解码输出的查询SQL词汇的向量与基于原始输入的自然语言问题中的相关词汇，基于节点连接计算距离)，该分数指代SQL单词与表格中各个Header/Table的关联程度。进一步获取解码时SQL单词与表格中各个的联系程度并选择分数最高的作为最终输出，并进行SQL语句的输出匹配，并完成最终的完整SQL查询语句的输出。这样可以利用多表完成SQL语句的解码输出，并且确保所输出的SQL语句为经由语义编码一解析器所处理后结合多表关联输出的最优解析结果。系统会将该结果作为最终SQL查询语句输出。

S6.根据所述查询语句查询所述数据库获取查询结果。

本实施例中，若解码后输出的查询语句可完成查询，则向用户输出查询结果，如查询结果符合本次用户实际查询需求，则确认本次查询中的节点之间的关联性并更新该关联到原有图网络中。如无法基于解码输出的SQL语句完成查询(如查询不到表、或输出结果不符合查询需要入需要输出药品名称但输出了数量等)，则将未查询到的查询结果反馈至用户，以便于用户根据该查询结果再次输入查询请求进行查询。

在本实施例中，基于图神经网络的医疗查询方法可根据数据库中的数据表的表名及列名构建由表节点和列节点组成的关系图网络，通过关系图网络表示数据库中表与表之间的关联关系；能够对接收到的查询请求进行实体识别以确定查询词，计算查询词与关系图网络中网络节点的词向量得到词向量序列，通过编码器对词向量序列编码得到编码序列，通过解码器对编码序列解码，以得到查询语句，从而根据查询语句查询数据库获取查询结果，从而达到提高查询效率的目的，同时简化了用户对多维度信息查询时的查询步骤，并减低了学习训练的时间成本。

考虑到现有的查询数据库的方法往往忽略了数据库模式的结构，如当一个有两列的表，其中每列都是另外两个表的外键(Foreign key)，以该表描述其他两表间的多对多关系时现有的方法难以准确表达。本实施例的基于图神经网络的医疗查询方法利用图神经网络(GNN)实现的语义解析数据库查询，能够通过GNN有效计算所查询文本信息中所提及的每张表格间隐含的相互关联，完成对表格对SQL输出暗含的约束提取与表达，从而达到进一步提升准确率的效果。本实施例结合自然语言处理技术，能够为现有的智慧医疗系统提供有力支持，简化的医务人员对多维度信息的查询步骤，降低学习成本，提高工作效率，也能够减少在数据标注以及模型训练上所需的人工和时间成本。

实施例二

请参阅图3，本实施例的一种基于图神经网络的医疗查询装置1，包括：构建单元11、识别单元12、生成单元13、编码单元14、解码单元15和查询单元16。

构建单元11，用于提取数据库中各个数据表的表名及对应的列名，将所述表名作为表节点、所述列名作为列节点，并将相应的表节点与相应的列节点进行连接，将不同数据表中相同列名对应的不同表名的表节点进行连接，形成关系图网络，所述关系图网络的网络节点包括表节点和列节点。

其中，所述关系图网络的网络节点包括表节点和列节点。

识别单元12，用于获取查询请求，对所述查询请求进行实体识别获取查询词。

进一步地，识别单元12可获取所述查询请求，采用BERT分词器对所述查询请求进行实体识别，以获取所述查询词。

本实施例中，BERT分词器为应用NER数据集对BERT中文预训练模型进行训练后得到的分词器。通过BERT分词器实现对查询请求中的名词、否定词以及其他形容词如“最多的”的提取。

生成单元13，用于计算所述查询词与所述关系图网络中网络节点的词向量，生成词向量序列。

进一步地，生成单元13用于将所述查询词逐个与所述关系图网络中的所述表节点进行匹配，获取与所有所述查询词匹配的所述表节点；根据所述表节点的个数选择查询模式；根据选择的查询模式，计算与所有所述查询词匹配的所述表节点以及与所述表节点关联的网络节点的词向量，生成词向量序列。

其中，所述查询模块包括单表查询模式和多表查询模块。

具体地，当所述表节点的个数为1个时，选择所述单表查询模式；当所述表节点的个数为大于1个时，选择所述多表查询模式；当表节点的个数小于1个时，生成无法查询的消息并输出，以向反馈用户。

当所述查询模式为单表查询模式时，获取与所有所述查询词匹配的所述表节点，以及与所述表节点关联的列节点，分别计算所述查询词与表节点以及列节点的词向量，以生成所述词向量序列。

本实施例中，当与查询词匹配的表节点只有一个时，表示关系图网络中与查询词匹配的表只有一个，可采用单表查询模式进行查询，获取与该表的表节点关联的列节点，通过公式(1)计算每个网络节点(表节点和列节点)与查询词的相关程度。

具体地，当所述查询模式为多表查询模式时，获取与所有所述查询词匹配的所述表节点，以及与每一个所述表节点关联的列节点以及其他表节点，分别计算所述查询词与所述表节点以及相应的所述列节点的词向量，以生成所述词向量序列。

本实施例中，当与查询词匹配的表节点有多个时，表示关系图网络中与查询词匹配的表只有多个，可采用多表查询模式进行查询，获取与该表的表节点关联的列节点和与该表的表节点关联的其他表节点，以及与其他表节点关联的其他列节点。网络中选取与查询词相关联的表节点和列节点(如：与病患信息表对应的表节点关联的列节点可包括：病患id、病患姓名等列节点；与诊信息表对应的表节点关联的列节点可包括：病患id、药物名称、时间等列节点；与药物信息表对应的表节点关联的列节点可包括：药物id)，通过公式(1)计算每个网络节点(表节点和列节点)与查询词的相关程度，即步骤S1中所构建的关系图网络中网络节点与查询词中每个词x_i的相关度s_link，并且通过softmax归一化得到一个概率分布(作用是统一概率范围到0至1之间便于计算)，取其中最大一个概率作为与查询词的相关度，用这个相关度和初始向量(即查询请求中每个查询词x_i的向量表示)得到基于查询词的向量，经过L层(L数量基于不同输入词汇数量定义，直到完成所有节点的最终词向量转换)GNN得到每个网络节点基于查询词相关度的最终词向量，经过GNN模块处理后使每个网络节点可以和用户问题做更好的对齐，以便后续的编码。

编码单元14，用于采用编码器对所述词向量序列进行编码获取编码序列。

进一步地，编码单元14可包括：将所述词向量序列输入所述编码器进行编码获取编码初始序列，采用注意力模型计算每个词向量的权重值，将每个所述词向量的权重值与所述编码初始序列中相应的编码初始向量进行计算，获取编码向量，根据所述编码向量生成所述编码序列。

解码单元15，用于采用解码器对所述编码序列进行解码以获取查询语句。

进一步地，解码单元15可包括：将所述编码序列输入到所述解码器进行解码，以获取候选词汇序列，所述候选词汇为表节点的表名或列节点的列名；根据每一个所述候选词汇对应的编码向量，分别计算每一所述候选词汇的分值，将分值最高的所述候选词汇作为目标词汇，将所述目标词汇与预设语句库中的语句进行匹配，获取与所述目标词汇匹配的所述查询语句。

查询单元16，用于根据所述查询语句查询所述数据库获取查询结果。

在本实施例中，基于图神经网络的医疗查询装置1可通过构建单元11根据数据库中的数据表的表名及列名构建由表节点和列节点组成的关系图网络，通过关系图网络表示数据库中表与表之间的关联关系；采用识别单元12对接收到的查询请求进行实体识别以确定查询词；利用生成单元13计算查询词与关系图网络中网络节点的词向量得到词向量序列，通过编码单元14中的编码器对词向量序列编码得到编码序列，通过解码单元15中的解码器对编码序列解码，以得到查询语句，从而利用查询单元16根据查询语句查询数据库获取查询结果，从而达到提高查询效率的目的，同时简化了用户对多维度信息查询时的查询步骤，并减低了学习训练的时间成本。

实施例三

为实现上述目的，本发明还提供一种计算机设备2，该计算机设备2包括多个计算机设备2，实施例二的基于图神经网络的医疗查询装置1的组成部分可分散于不同的计算机设备2中，计算机设备2可以是执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器，或者多个服务器所组成的服务器集群)等。本实施例的计算机设备2至少包括但不限于：可通过系统总线相互通信连接的存储器21、处理器23、网络接口22以及基于图神经网络的医疗查询装置1(参考图4)。需要指出的是，图4仅示出了具有组件-的计算机设备2，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

本实施例中，所述存储器21至少包括一种类型的计算机可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，存储器21可以是计算机设备2的内部存储单元，例如该计算机设备2的硬盘或内存。在另一些实施例中，存储器21也可以是计算机设备2的外部存储设备，例如该计算机设备2上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。当然，所述存储器21还可以既包括计算机设备2的内部存储单元也包括其外部存储设备。本实施例中，存储器21通常用于存储安装于计算机设备2的操作系统和各类应用软件，例如实施例一的基于图神经网络的医疗查询方法的程序代码等。此外，存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器23在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器23通常用于控制计算机设备2的总体操作例如执行与所述计算机设备2进行数据交互或者通信相关的控制和处理等。本实施例中，所述处理器23用于运行所述存储器21中存储的程序代码或者处理数据，例如运行所述的基于图神经网络的医疗查询装置1等。

所述网络接口22可包括无线网络接口或有线网络接口，该网络接口22通常用于在所述计算机设备2与其他计算机设备2之间建立通信连接。例如，所述网络接口22用于通过网络将所述计算机设备2与外部终端相连，在所述计算机设备2与外部终端之间的建立数据传输通道和通信连接等。所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication，GSM)、宽带码分多址(WidebandCode Division Multiple Access，WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。

需要指出的是，图4仅示出了具有部件21-23的计算机设备2，但是应理解的是，并不要求实施所有示出的部件，可以替代的实施更多或者更少的部件。

在本实施例中，存储于存储器21中的所述基于图神经网络的医疗查询装置1还可以被分割为一个或者多个程序模块，所述一个或者多个程序模块被存储于存储器21中，并由一个或多个处理器(本实施例为处理器23)所执行，以完成本发明。

实施例四

为实现上述目的，本发明还提供一种计算机可读存储介质，其包括多个存储介质，如闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等，其上存储有计算机程序，程序被处理器23执行时实现相应功能。本实施例的计算机可读存储介质用于存储基于图神经网络的医疗查询装置1，被处理器23执行时实现实施例一的基于图神经网络的医疗查询方法。

本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种基于图神经网络的医疗查询方法，其特征在于，包括：

获取查询请求，对所述查询请求进行实体识别获取查询词；

采用编码器对所述词向量序列进行编码获取编码序列；

采用解码器对所述编码序列进行解码以获取查询语句；

根据所述查询语句查询所述数据库获取查询结果。

2.根据权利要求1所述的基于图神经网络的医疗查询方法，其特征在于，获取查询请求，对所述查询请求进行实体识别获取查询词，包括：

获取所述查询请求；

3.根据权利要求1所述的基于图神经网络的医疗查询方法，其特征在于，计算所述查询词与所述关系图网络中网络节点的词向量，生成词向量序列，包括：

根据所述表节点的个数选择查询模式；

4.根据权利要求3所述的基于图神经网络的医疗查询方法，其特征在于，所述查询模块包括单表查询模式和多表查询模块；

根据所述表节点的个数选择查询模式，包括：

当所述表节点的个数为1个时，选择所述单表查询模式；

当所述表节点的个数为大于1个时，选择所述多表查询模式。

5.根据权利要求4所述的基于图神经网络的医疗查询方法，其特征在于，根据选择的查询模式，计算与所有所述查询词匹配的所述表节点以及与所述表节点关联的网络节点的词向量，生成词向量序列，包括：

6.根据权利要求1所述的基于图神经网络的医疗查询方法，其特征在于，采用编码器对所述词向量序列进行编码获取编码序列，包括：

7.根据权利要求1所述的基于图神经网络的医疗查询方法，其特征在于，采用解码器对所述编码序列进行解码以获取查询语句，包括：

8.一种基于图神经网络的医疗查询装置，其特征在于，包括：

9.一种计算机设备，其特征在于，所述计算机设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现权利要求1至7任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7任一项所述方法的步骤。