CN113254620A

CN113254620A - 基于图神经网络的应答方法、装置、设备及存储介质

Info

Publication number: CN113254620A
Application number: CN202110686886.XA
Authority: CN
Inventors: 陆林炳; 刘志慧; 金培根; 林加新; 李炫�
Original assignee: Ping An Life Insurance Company of China Ltd
Current assignee: Ping An Life Insurance Company of China Ltd
Priority date: 2021-06-21
Filing date: 2021-06-21
Publication date: 2021-08-13
Anticipated expiration: 2041-06-21
Also published as: CN113254620B

Abstract

本发明涉及人工智能的分类模型技术领域，本发明公开了一种基于图神经网络的应答方法、装置、设备及存储介质，所述方法包括：通过获取问答请求中的用户音频文件；进行语音识别，得到用户文本问题；进行业务场景特征提取，识别出业务场景结果；从基于专家知识领域的召回候选库中获取候选问题，并构建各候选问题的图结构；通过语义召回模型分别对用户文本问题和各候选问题的图结构进行共享参数的词向量转换，并通过词袋聚合得到用户语义向量，以及逐层词袋聚合得到候选语义向量，获取最大语义相似度；返回并播报应答文本。因此，本发明实现了有效加入句子间的结构信息，利用问题的一阶及二阶邻居相关信息进行补充，有效提高了问题召回模型的效果。

Description

基于图神经网络的应答方法、装置、设备及存储介质

技术领域

本发明涉及分类模型技术领域，尤其涉及一种基于图神经网络的应答方法、装置、设备及存储介质。

背景技术

目前，语义召回模型被广泛地应用于AI问答系统中，随着科技的发展，越来越多的地方以AI问答系统来代替人工问答，以提高认为处理效率。其中，语义召回模型在其中担任重要角色。

然而，随着信息时代的高速发展，模型需要处理的语料数据也越来越庞大，精度也越来越高，覆盖面也越来越广，就要求当前的语义召回模型收集大量的训练样本，但是在某些业务场景中获取训练样本十分昂贵或者艰难，例如业务场景为购物咨询、医疗问答等等，在训练样本少的情况下，仅考虑两个句子间的语义相似度，就会导致大量的知识缺失或者学习不够充分，以及损失了问题之间存在的结构联系，以致语义召回模型的准确率低的技术问题。

发明内容

本发明提供一种基于图神经网络的应答方法、装置、计算机设备及存储介质，实现了能够有效的加入句子间的结构信息，利用问题的一阶及二阶邻居相关信息进行补充，有效的提高了问题召回模型的效果。

一种基于图神经网络的应答方法，包括：

接收用户的问答请求，获取所述问答请求中的用户音频文件；

对所述用户音频文件进行语音识别，得到用户文本问题；

对所述用户文本问题进行业务场景特征提取，根据提取的所述业务场景特征识别出业务场景结果；

从基于专家知识领域的召回候选库中获取与所述业务场景结果匹配的候选问题，并构建各所述候选问题的图结构；

通过语义召回模型分别对所述用户文本问题和各所述候选问题的图结构进行共享参数的词向量转换，并对词向量转换后的所述用户文本问题进行词袋聚合，得到用户语义向量，以及通过所述语义召回模型中的图神经网络对各词向量转换后的所述候选问题进行逐层词袋聚合，得到与各所述候选问题一一对应的候选语义向量，获取所述用户语义向量与各所述候选语义向量的最大语义相似度；

返回与所述最大语义相似度对应的所述候选问题对应的应答文本，以及播报所述应答文本。

一种基于图神经网络的应答装置，包括：

接收模块，用于接收用户的问答请求，获取所述问答请求中的用户音频文件；

识别模块，用于对所述用户音频文件进行语音识别，得到用户文本问题；

提取模块，用于对所述用户文本问题进行业务场景特征提取，根据提取的所述业务场景特征识别出业务场景结果；

构建模块，用于从基于专家知识领域的召回候选库中获取与所述业务场景结果匹配的候选问题，并构建各所述候选问题的图结构；

召回模块，用于通过语义召回模型分别对所述用户文本问题和各所述候选问题的图结构进行共享参数的词向量转换，并对词向量转换后的所述用户文本问题进行词袋聚合，得到用户语义向量，以及通过所述语义召回模型中的图神经网络对各词向量转换后的所述候选问题进行逐层词袋聚合，得到与各所述候选问题一一对应的候选语义向量，获取所述用户语义向量与各所述候选语义向量的最大语义相似度；

返回模块，用于返回与所述最大语义相似度对应的所述候选问题对应的应答文本，以及播报所述应答文本。

一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述基于图神经网络的应答方法的步骤。

一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述基于图神经网络的应答方法的步骤。

本发明提供的基于图神经网络的应答方法、装置、计算机设备及存储介质，通过获取问答请求中的用户音频文件；对所述用户音频文件进行语音识别，得到用户文本问题；对所述用户文本问题进行业务场景特征提取，根据提取的所述业务场景特征识别出业务场景结果；从基于专家知识领域的召回候选库中获取与所述业务场景结果匹配的候选问题，并构建各所述候选问题的图结构；通过语义召回模型分别对所述用户文本问题和各所述候选问题的图结构进行共享参数的词向量转换，并进行词袋聚合，得到用户语义向量，以及进行逐层词袋聚合，得到候选语义向量，获取所述用户语义向量与各所述候选语义向量的最大语义相似度；返回应答文本，以及播报所述应答文本，如此，实现了通过语音识别技术识别用户音频文件中欧的用户文本问题，并提取业务场景特征识别出业务场景结果，从基于专家知识领域的召回候选库中国获取相匹配的候选问题，并构建各候选问题的图结构，运用共享参数的词向量转换、词袋聚合，以及图神经网络的逐层词袋聚合，确定出用户文本问题和候选问题之间的最大语义相似度，并返回应答文本，能够有效的加入句子间的结构信息，利用问题的一阶及二阶邻居相关信息进行补充，有效的提高了问题召回模型的效果，不仅仅单纯的考虑两个句子间的语义相似度，也考虑句子之间的各阶邻居的信息，同时具有良好的扩展性，提高了回答准确率，持续提升用户在使用过程的满意度。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例中基于图神经网络的应答方法的应用环境示意图；

图2是本发明一实施例中基于图神经网络的应答方法的流程图；

图3是本发明一实施例中基于图神经网络的应答方法的步骤S40的流程图；

图4是本发明一实施例中基于图神经网络的应答方法的步骤S402的流程图；

图5是本发明一实施例中基于图神经网络的应答方法的步骤S50的流程图；

图6是本发明一实施例中基于图神经网络的应答装置的原理框图；

图7是本发明一实施例中计算机设备的示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供的基于图神经网络的应答方法，可应用在如图1的应用环境中，其中，客户端(计算机设备或终端)通过网络与服务器进行通信。其中，客户端(计算机设备或终端)包括但不限于为各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一实施例中，如图2所示，提供一种基于图神经网络的应答方法，其技术方案主要包括以下步骤S10-S60：

S10，接收用户的问答请求，获取所述问答请求中的用户音频文件。

可理解地，在所述用户需要发出语音问题的时候，触发所述问答请求，所述问答请求包括所述用户音频文件，所述用户音频文件为采集所述用户提出问题的音频格式的文件。

S20，对所述用户音频文件进行语音识别，得到用户文本问题。

可理解地，所述语音识别(Automatic Speech Recognition，ASR)以音频文件为研究对象，通过语音信号处理和模式识别，把音频信号转变为相应文本内容的技术，所述语音识别的过程为首先，对输入的音频文件进行预处理，例如：首尾端的静音切除，降低干扰，静音切除的操作，然后进行声音分帧，把声音切开成一小段一小段，每小段称为一帧，其次，提取语音特征(MFCC特征)，将每一帧波形变成一个包含声音信息的多维向量，最后，根据语音识别的模型，将计算机中存放的字典与提取的语音特征进行匹配，以及通过查表解码匹配后的结果，输出与其结果对应的文本内容的过程，所述用户文本问题为经过所述语音识别处理的文本内容。

S30，对所述用户文本问题进行业务场景特征提取，根据提取的所述业务场景特征识别出业务场景结果。

可理解地，所述业务场景特征为所述用户文本问题所属的业务场景类别，所述识别的过程为提取用户问题中与业务场景相关的特征，即将所述用户问题进行词向量转换，对词向量转换后的所述用户问题进行业务场景特征提取，从而根据提取的所述业务场景特征进行分类，得到所述业务场景结果。

S40，从基于专家知识领域的召回候选库中获取与所述业务场景结果匹配的候选问题，并构建各所述候选问题的图结构。

可理解地，所述召回候选库为通过基于专家知识领域的知识图谱生成的与各个所述业务场景类别对应的所述候选问题，所述候选问题为各个业务场景类别中经过对所述知识图谱中的各个载体进行关联关系分析生成的在各个业务场景下会提出的问题。

其中，构建各所述候选问题的图结构的过程为获取所述召回候选库中与所述候选问题关联的一阶召回相似问题及与其对应的一阶实时采集次数，和与各所述一阶召回相似问题关联的二阶召回相似问题及与其对应的二阶实时采集次数，所述一阶召回相似问题为与所述候选问题相似的问题，所述一阶实时采集次数为服务器中对于该一阶召回相似问题被选取的次数，所述一阶实时采集次数为实时采集的共享的该一阶召回相似问题被选取的累加次数，体现了用户在提出候选问题时选择召回的所有一阶召回相似问题中选取用户最符合的一阶召回相似问题的次数；创建以所述候选问题为中心的图结构，根据所有所述一阶召回相似问题及与其对应的所述一阶实时采集次数，建立与所述候选问题的一阶边连接关系，构建所述图结构的一阶邻居；根据所有所述二阶召回相似问题及与其对应的所述二阶实时采集次数，建立与各所述一阶召回相似问题的二阶边连接关系，构建所述图结构的二阶邻居，如此构建了该候选问题的所述图结构。

在一实施例中，如图3所示，所述步骤S40中，即所述从基于专家知识领域的召回候选库中获取与所述业务场景结果匹配的候选问题，并构建各所述候选问题的图结构，包括：

S401，获取所述召回候选库中与所述候选问题关联的一阶召回相似问题及与其对应的一阶实时采集次数，和与各所述一阶召回相似问题关联的二阶召回相似问题及与其对应的二阶实时采集次数。

可理解地，所述一阶召回相似问题为通过基于专家知识领域的问句生成模型对所述候选问题进行问句生成处理后得到的与所述候选问题相似的问题，所述一阶实时采集次数为实时采集的共享的该一阶召回相似问题被选取的累加次数，体现了用户在提出候选问题时选择召回的所有一阶召回相似问题中选取用户最符合的一阶召回相似问题的次数，所述二阶召回相似问题获取的过程为对所述一阶召回相似问题进行分词处理，划分出多个一阶单元词；通过词性检测模型对各所述一阶单元词进行词性识别，得到各所述一阶单元词的词性结果；根据所有所述一阶单元词的词性结果，通过基于专家知识领域的问句生成模型进行问句生成，生成与所述一阶召回相似问题对应的多个所述二阶召回相似问题，所述二阶召回相似问题为与所述一阶召回相似问题相似的问题，所述二阶实时采集次数为实时采集的共享的该二阶召回相似问题被选取的累加次数，体现了用户在提出一阶召回相似问题时选择召回的所有二阶召回相似问题中选取用户最符合的二阶召回相似问题的次数。

在一实施例中，所述步骤S401之前，即所述获取所述召回候选库中与所述候选问题关联的一阶召回相似问题及与其对应的一阶实时采集次数，和与各所述一阶召回相似问题关联的二阶召回相似问题及与其对应的二阶实时采集次数之前，包括：

对所述候选问题进行分词处理，划分出多个单元词。

可理解地，所述分词处理为将所述候选问题划分成单个词语或者字，从而将划分出的词语或者字记录为所述单元词。

通过词性检测模型对各所述单元词进行词性识别，得到各所述单元词的词性结果。

可理解地，所述词性识别模型为训练完成的用于识别出输入的词语或者字的词性的神经网络模型，所述词性识别为以语法特征(包括句法功能和形态变化)为主要依据、兼顾词汇意义对词进行划分的结果，词性包括名词、动词、形容词、数量词、代词、副词、介词、连词、助词、叹词、拟声词等，通过对各个所述单元词及其相邻的单元词进行提取词性特征，根据提取的所述词性特征进行分类出该单元词的词性，即为其词性结果。

根据所有所述单元词的词性结果，通过基于专家知识领域的问句生成模型进行问句生成，生成与所述候选问题对应的多个所述一阶召回相似问题。

可理解地，所述问句生成模型为基于专家知识领域训练完成且集成了的所有问句模板的模型，根据所有所述单元词的词性结果进行分类，将各所述单元词根据各所述问句模板中的相应位置进行填充，将填充后的问句模板确定为待处理问句，所述问句生成模型还为通过知识关系进行训练获得的神经网络模型，通过所述问句生成模型对各所述待处理问句进行知识关系校验，所述知识关系校验为根据对各所述待处理问句中的名词实体和动词实体进行实体之间的关联关系进行识别的过程。

其中，所述问句生成模型的网络结构可以根据需求设定，比如网络结构可以为LSTM、Bi-LSTM、BERT等网络结构。

本发明实现了通过对所述候选问题进行分词处理，划分出多个单元词；通过词性检测模型对各所述单元词进行词性识别，得到各所述单元词的词性结果；根据所有所述单元词的词性结果，通过基于专家知识领域的问句生成模型进行问句生成，生成与所述候选问题对应的多个所述一阶召回相似问题，如此，实现了运用分词处理、词性识别和基于专家知识领域的问句生成模型自动生成多个一阶召回相似问题，为后续的图结构构建提供数据基础，从而提高了整个语义识别的准确率。

在一实施例中，所述步骤S4013中，即所述根据所有所述单元词的词性结果，通过基于专家知识领域的问句生成模型进行问句生成，生成与所述候选问题对应的多个所述一阶召回相似问题，包括：

通过所述问句生成模型对所有与所述候选问题对应的所述词性结果进行分类及筛选处理，得到与预设词性相同的待处理词。

可理解地，所述预设词性可以根据需求设定，比如设置为名词和动词，因为一般问句通过主谓语组成体现用户的问题方向，从所有所述词性结果中，将与所述预设词性相同的所述词性结果对应的所述单元词记录为所述待处理词。

通过所述问句生成模型将所有所述待处理词填充至问句模板库中的各问句模板中，得到与各所述问句模板对应的待处理问句。

可理解地，将所述待处理词填充至各所述问句模板中的相应位置，从而得到各所述待处理问句。

运用Bi-LSTM算法，通过所述问句生成模型中的基于专家知识领域的问句校验模型，对各所述待处理问句进行知识关系校验，得到各所述待处理问句的校验结果。

可理解地，所述Bi-LSTM算法为正向和逆向共同编码以进行上下文语义识别的算法，所述问句生成模型还为通过知识关系进行训练获得的神经网络模型，通过所述问句生成模型对各所述待处理问句进行知识关系校验，所述知识关系校验为根据对各所述待处理问句中的名词实体和动词实体进行实体之间的关联关系进行识别的过程，所述实体之间的关联关系为主谓之间的合理性，即名词和动词之间的逻辑合理关系。

将与所述校验结果为合格对应的所述待处理问句记录为所述一阶召回相似问题。

可理解地，将知识关系校验合格的所述待处理问句确定为所述一阶召回相似问题。

本发明实现了通过所述问句生成模型对所有与所述候选问题对应的所述词性结果进行分类及筛选处理，得到与预设词性相同的待处理词；通过所述问句生成模型将所有所述待处理词填充至问句模板库中的各问句模板中，得到与各所述问句模板对应的待处理问句；运用Bi-LSTM算法，通过所述问句生成模型中的基于专家知识领域的问句校验模型，对各所述待处理问句进行知识关系校验，得到各所述待处理问句的校验结果；将与所述校验结果为合格对应的所述待处理问句记录为所述一阶召回相似问题，如此，实现了自动生成一阶召回相似问题。

在一实施例中，所述步骤S4013之后，即所述根据所有所述单元词的词性结果，通过基于专家知识领域的问句生成模型进行问句生成，生成与所述候选问题对应的多个所述一阶召回相似问题之后，包括：

接收与所述候选问题对应的召回请求，并返回与所述候选问题对应的所有所述一阶召回相似问题。

可理解地，所述召回请求为不同的用户在不同的终端或者客户端输入该候选问题或者选取该候选问题之后，并需要确认返回的一阶召回相似问题是否存在时触发的指令，所述一阶召回相似问题为通过基于专家知识领域的问句生成模型对所述候选问题进行问句生成处理后得到的与所述候选问题相似的问题，获取所有与所述候选问题对应的一阶召回相似问题，并返回至与所述召回请求对应的用户的终端或者客户端，以展示给用户进行选取。

接收选取指令，并累加与所述选取指令中选取的一阶召回相似问题对应的所述一阶实时采集次数；所述选取指令为用户实时从返回的所有所述一阶召回相似问题中选取的一个所述一阶召回相似问题的指令。

可理解地，所述选取指令也即为接收到返回的所有所述一阶召回相似问题的终端或者客户端后，与其对应的用户在返回的所有所述一阶召回相似问题中选取并确认其中一个一阶召回相似问题之后触发的指令，接收到所述选取指令之后，对与所述选取指令中被选取的所述一阶召回相似问题对应的所述一阶实时采集次数进行累加一。

本发明实现了自动通过服务器共享所有一阶召回相似问题，通过实时累加与一阶召回相似问题对应的一阶实时采集次数，做到对所述候选问题的图结构实时刷新，能够提高后续对图结构的图卷积提高语义识别的准确率。

S402，创建以所述候选问题为中心的图结构，根据所有所述一阶召回相似问题及与其对应的所述一阶实时采集次数，建立与所述候选问题的一阶边连接关系，构建所述图结构的一阶邻居。

可理解地，构建所述图结构的一阶邻居的过程为将各所述一阶召回相似问题均与所述候选问题连接，构成各所述一阶召回相似问题与所述候选问题的一阶边，将与所述一阶召回相似问题对应的所述一阶实时采集次数赋予与该一阶召回相似问题连接的所述一阶边，赋予完所有所述一阶边的图结构后，得到所述图结构的一阶邻居。

在一实施例中，如图4所示，所述步骤S402中，即所述创建以所述候选问题为中心的图结构，根据所有所述一阶召回相似问题及与其对应的所述一阶实时采集次数，建立与所述候选问题的一阶边连接关系，构建所述图结构的一阶邻居，包括：

S4021，将各所述一阶召回相似问题均与所述候选问题连接，构成各所述一阶召回相似问题与所述候选问题的一阶边。

可理解地，以所述候选问题为中心，分别与各所述一阶召回相似问题连接，将连接所述一阶召回相似问题与所述候选问题的边长记录为与该一阶召回相似问题对应的所述一阶边。

S4022，将与所述一阶召回相似问题对应的所述一阶实时采集次数赋予与该一阶召回相似问题连接的所述一阶边。

可理解地，将与所述一阶召回相似问题对应的所述一阶实时采集次数赋予与其连接的所述一阶边，即通过该一阶实时采集次数设置为与其对应的一阶边的边长，如此，能够更加直观的体现所述一阶召回相似问题与所述候选问题之间的关联程度。

S4023，赋予完所有所述一阶边的图结构后，得到所述图结构的一阶邻居。

可理解地，对所有所述一阶边均赋完与其相应的值，从而构建出该图结构的一阶邻居。

本发明实现了通过将各所述一阶召回相似问题均与所述候选问题连接，构成各所述一阶召回相似问题与所述候选问题的一阶边；将与所述一阶召回相似问题对应的所述一阶实时采集次数赋予与该一阶召回相似问题连接的所述一阶边；赋予完所有所述一阶边的图结构后，得到所述图结构的一阶邻居，如此，能够更加科学地、客观地、直观地构建图结构的一阶邻居，为后续的召回提供了数据基础，提高了召回问题的准确率。

S403，根据所有所述二阶召回相似问题及与其对应的所述二阶实时采集次数，建立与各所述一阶召回相似问题的二阶边连接关系，构建所述图结构的二阶邻居。

可理解地，构建所述图结构的二阶邻居的过程为将各所述一阶召回相似问题与其生成的所述二阶召回相似问题连接，构成各所述一阶召回相似问题与其生成的所述二阶召回相似问题的二阶边，将与所述二阶召回相似问题对应的所述二阶实时采集次数赋予与该二阶召回相似问题连接的所述二阶边，将赋予完所有所述二阶边的图结构确定为所述图结构的二阶邻居。

S404，将构建二阶邻居之后的图结构记录为该候选问题的图结构。

可理解地，同理对所有所述二阶边均赋完与其相应的值，从而构建出该图结构的二阶邻居。

本发明实现了通过获取所述召回候选库中与所述候选问题关联的一阶召回相似问题及与其对应的一阶实时采集次数，和与各所述一阶召回相似问题关联的二阶召回相似问题及与其对应的二阶实时采集次数；创建以所述候选问题为中心的图结构，根据所有所述一阶召回相似问题及与其对应的所述一阶实时采集次数，建立与所述候选问题的一阶边连接关系，构建所述图结构的一阶邻居；根据所有所述二阶召回相似问题及与其对应的所述二阶实时采集次数，建立与各所述一阶召回相似问题的二阶边连接关系，构建所述图结构的二阶邻居；将构建二阶邻居之后的图结构记录为该候选问题的图结构，如此，通过构建候选问题的图结构便于后续图神经网络进行语义向量的提取及转换，提高语义相似度识别的准确性。

S50，通过语义召回模型分别对所述用户文本问题和各所述候选问题的图结构进行共享参数的词向量转换，并对词向量转换后的所述用户文本问题进行词袋聚合，得到用户语义向量，以及通过所述语义召回模型中的图神经网络对各词向量转换后的所述候选问题进行逐层词袋聚合，得到与各所述候选问题一一对应的候选语义向量，获取所述用户语义向量与各所述候选语义向量的最大语义相似度。

可理解地，所述共享参数的词向量转换为应用相同的超参的词向量模块输出相同维度的转换过程，通过共享参数可以共用一个词库，拥有共享的语义信息，并转换成相同维度的向量，即运用one-hot编码，将所述用户文本问题和各所述候选问题的图结构中的文本转换成相同维度的向量，所述词袋聚合处理的过程为对所述词向量转换后的用户文本问题进行加和平均处理的过程，从而得到与所述用户文本问题对应的所述用户语义向量，所述用户语义向量表明了所述用户文本问题的语义的向量聚合结果，所述逐层词袋聚合的处理过程包括多层词袋聚合处理和逐层聚合处理，所述逐层词袋聚合的处理过程为：首先，通过所述图神经网络对所述候选问题和与所述候选问题的图结构的所述一阶向量组及所述二阶向量组进行所述词袋聚合处理，得到与所述候选问题的对应的所述中心语义向量、所述一阶语义向量和所述二阶语义向量；其次，通过所述图神经网络根据所述二阶语义向量以及与其对应的所述二阶召回相似问题连接的所述二阶边，对与所述二阶召回相似问题连接的所述一阶语义向量进行第一逐层聚合处理，也即进行图卷积处理，得到与所述一阶语义向量对应的一阶聚合向量；最后，通过所述图神经网络根据所有与所述候选问题连接的所述一阶聚合向量，对所述候选向量进行第二逐层聚合处理，得到与所述候选问题对应的候选语义向量，

所述候选语义向量为表明了所述候选问题的语义的向量聚合结果。

其中，获取所述用户语义向量与各所述候选语义向量的最大语义相似度中运用的相似度匹配算法可以根据需求设定，比如最小编辑距离算、TF-IDF匹配算法和余弦相似度算法等等，所述最大语义相似度为与所述用户文本问题最接近和最相似的候选问题。

在一实施例中，如图5所示，所述步骤S50中，即所述通过语义召回模型分别对所述用户文本问题和各所述候选问题的图结构进行共享参数的词向量转换，并对词向量转换后的所述用户文本问题进行词袋聚合，得到用户语义向量，以及通过所述语义召回模型中的图神经网络对各词向量转换后的所述候选问题进行逐层词袋聚合，得到与各所述候选问题一一对应的候选语义向量，获取所述用户语义向量与各所述候选语义向量的最大语义相似度，包括：

S501，通过所述语义召回模型中的共享参数的转换模块分别对所述用户文本问题和所述候选问题的图结构进行词向量转换，得到向量集合；所述向量集合包括与所述用户文本问题对应的用户向量、与所述候选问题对应的候选向量、与各所述一阶召回相似问题对应的一阶向量组以及与各所述二阶召回相似问题对应的二阶向量组。

可理解地，所述共享参数的词向量转换为应用相同的超参的词向量模块输出相同维度的转换过程，通过共享参数可以共用一个词库，拥有共享的语义信息，并转换成相同维度的向量，即运用one-hot编码，将所述用户文本问题和各所述候选问题的图结构中的文本转换成相同维度的向量。

S502，通过所述语义召回模型中的卷积神经网络对所述用户向量进行词袋聚合处理，得到与所述用户文本问题对应的所述用户语义向量。

可理解地，所述词袋聚合处理的过程为对进行词向量转换后的所述用户文本问题进行求和平均处理，从而得到与所述用户文本问题对应的所述用户语义向量，所述用户语义向量表明了所述用户文本问题的语义的向量聚合结果，即A_emb＝reduce_mean([向量a1、向量a2、…、向量an])。

S503，通过所述图神经网络对所述候选问题和与所述候选问题的图结构的所述一阶向量组及所述二阶向量组进行多层词袋聚合处理，分别得到与所述候选问题的对应的所述中心语义向量、所述一阶语义向量和所述二阶语义向量。

可理解地，所述多层词袋聚合处理的过程为对词向量转换后的所述候选问题进行求和平均得到与该候选问题对应的所述中心语义向量，同时对与所述一阶召回相似问题对应的一阶向量组进行求和平均得到与该一阶召回相似问题对应的所述一阶语义向量，以及对与所述二阶召回相似问题对应的二阶向量组进行求和平均得到与该二阶召回相似问题对应的二阶语义向量的过程。

S504，通过所述图神经网络根据与相同的所述一阶召回相似问题连接的所述二阶召回相似问题对应的所述二阶语义向量以及所述二阶边，对该一阶召回相似问题对应的所述一阶语义向量进行第一逐层聚合处理，得到与该一阶召回相似问题对应的一阶聚合向量。

可理解地，所述第一逐层聚合处理的过程为将与相同的一个所述一阶召回相似问题连接的所有所述二阶语义向量进行加权处理，得到与该一阶召回相似问题对应的二阶初聚合向量，即将各所述二阶语义向量和与其对应的权重相乘，得到该二阶语义向量的二阶值，再将所有二阶值求和得到二阶初聚合向量，其中，与二阶语义向量对应的权重通过与其对应的二阶边占所有与相同的一阶召回相似问题对应的二阶边的占比获得，最后，对与该一阶召回相似问题对应的所述二阶初聚合向量和所述一阶语义向量进行求和取平均，得到与该一阶召回相似问题对应的所述一阶聚合向量的处理过程，也即先对相同一个所述一阶召回相似问题的所有所述二阶召回相似问题进行加权求和处理后，再对处理后的结果与该一阶召回相似问题对应的所述一阶语义向量求和取平均，得到与该一阶召回相似问题对应的一阶聚合向量的过程。

其中，一个所述一阶召会相似问题对应一个所述一阶聚合向量。

S505，通过所述图神经网络根据所有与所述候选问题连接的所述一阶召回相似问题对应的所述一阶聚合向量，对该候选问题进行第二逐层聚合处理，得到与所述候选问题对应的候选语义向量；

可理解地，所述第二逐层聚合处理的过程为对与所述候选问题连接的所述一阶召回相似问题对应的所述一阶聚合向量，赋予权重(与所述一阶召回相似问题对应的所述一阶边占所有所述一阶边的占比)，将各所述一阶聚合向量和与各所述一阶聚合向量一一对应的权重相乘并求和，得到一阶初聚合向量，将该所述一阶初聚合向量和所述候选语义向量求和取平均，得到所述候选语义向量的过程。

其中，一个所述候选问题对应一个所述候选语义向量，一个所述用户问题对应多个所述候选问题。

S506，运用余弦相似度算法，确定出所述用户语义向量与各所述候选语义向量的最大语义相似度。

可理解地，所述余弦相似度算法为计算两个文本向量之间的余弦相似程度的算法，也即计算所述用户语义向量和每一个所述候选语义向量之间的余弦值，通过该余弦值衡量所述用户语义向量和所述候选语义向量之间的相似程度，所述最大语义相似度为所有计算获得的余弦值中最大的余弦值。

本发明实现了通过所述语义召回模型中的共享参数的转换模块分别对所述用户文本问题和所述候选问题的图结构进行词向量转换，得到向量集合；通过所述语义召回模型中的卷积神经网络对所述用户向量进行词袋聚合处理，得到与所述用户文本问题对应的所述用户语义向量；通过所述图神经网络对所述候选问题和与所述候选问题的图结构的所述一阶向量组及所述二阶向量组进行多层词袋聚合处理，分别得到与所述候选问题的对应的所述中心语义向量、所述一阶语义向量和所述二阶语义向量；通过所述图神经网络根据与相同的所述一阶召回相似问题连接的所述二阶召回相似问题对应的所述二阶语义向量以及所述二阶边，对该一阶召回相似问题对应的所述一阶语义向量进行第一逐层聚合处理，得到与该一阶召回相似问题对应的一阶聚合向量；通过所述图神经网络根据所有与所述候选问题连接的所述一阶召回相似问题对应的所述一阶聚合向量，对该候选问题进行第二逐层聚合处理，得到与所述候选问题对应的候选语义向量；运用余弦相似度算法，确定出所述用户语义向量与各所述候选语义向量的最大语义相似度，如此，实现了通过共享参数的转换模块、词袋聚合、余弦相似度算法以及通过图神经网络对候选问题的图结构进行逐层词袋聚合，自动确定出用户文本问题和候选问题之间的最大语义相似度，能够有效的加入句子间的结构信息，利用问题的一阶及二阶邻居相关信息进行补充，有效的提高了问题召回模型的效果只是单纯的考虑两个句子间的语义相似度。

S60，返回与所述最大语义相似度对应的所述候选问题对应的应答文本，以及播报所述应答文本。

可理解地，从应答库中查找到与所述最大语义相似度对应的所述候选问题相对应的所述应答文本，所述应答文本与所述候选问题一一对应，所述应答文本为应答与其对应的候选问题的文本内容，并通过语音播报的方式播报该应答文本。

本发明实现了通过接收用户的问答请求，获取所述问答请求中的用户音频文件；对所述用户音频文件进行语音识别，得到用户文本问题；对所述用户文本问题进行业务场景特征提取，根据提取的所述业务场景特征识别出业务场景结果；从基于专家知识领域的召回候选库中获取与所述业务场景结果匹配的候选问题，并构建各所述候选问题的图结构；通过语义召回模型分别对所述用户文本问题和各所述候选问题的图结构进行共享参数的词向量转换，并对词向量转换后的所述用户文本问题进行词袋聚合，得到用户语义向量，以及通过所述语义召回模型中的图神经网络对各词向量转换后的所述候选问题进行逐层词袋聚合，得到与各所述候选问题一一对应的候选语义向量，获取所述用户语义向量与各所述候选语义向量的最大语义相似度；返回与所述最大语义相似度对应的所述候选问题对应的应答文本，以及播报所述应答文本，如此，实现了通过语音识别技术识别用户音频文件中欧的用户文本问题，并提取业务场景特征识别出业务场景结果，从基于专家知识领域的召回候选库中国获取相匹配的候选问题，并构建各候选问题的图结构，运用共享参数的词向量转换、词袋聚合，以及图神经网络的逐层词袋聚合，确定出用户文本问题和候选问题之间的最大语义相似度，并返回应答文本，能够有效的加入句子间的结构信息，利用问题的一阶及二阶邻居相关信息进行补充，有效的提高了问题召回模型的效果，不仅仅单纯的考虑两个句子间的语义相似度，也考虑句子之间的各阶邻居的信息，同时具有良好的扩展性，提高了回答准确率，持续提升用户在使用过程的满意度。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

在一实施例中，提供一种基于图神经网络的应答装置，该基于图神经网络的应答装置与上述实施例中基于图神经网络的应答方法一一对应。如图6所示，该基于图神经网络的应答装置包括接收模块11、识别模块12、提取模块13、构建模块14、召回模块15和返回模块16。各功能模块详细说明如下：

接收模块11，用于接收用户的问答请求，获取所述问答请求中的用户音频文件；

识别模块12，用于对所述用户音频文件进行语音识别，得到用户文本问题；

提取模块13，用于对所述用户文本问题进行业务场景特征提取，根据提取的所述业务场景特征识别出业务场景结果；

构建模块14，用于从基于专家知识领域的召回候选库中获取与所述业务场景结果匹配的候选问题，并构建各所述候选问题的图结构；

召回模块15，用于通过语义召回模型分别对所述用户文本问题和各所述候选问题的图结构进行共享参数的词向量转换，并对词向量转换后的所述用户文本问题进行词袋聚合，得到用户语义向量，以及通过所述语义召回模型中的图神经网络对各词向量转换后的所述候选问题进行逐层词袋聚合，得到与各所述候选问题一一对应的候选语义向量，获取所述用户语义向量与各所述候选语义向量的最大语义相似度；

返回模块16，用于返回与所述最大语义相似度对应的所述候选问题对应的应答文本，以及播报所述应答文本。

关于基于图神经网络的应答装置的具体限定可以参见上文中对于基于图神经网络的应答方法的限定，在此不再赘述。上述基于图神经网络的应答装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是客户端或者服务端，其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括可读存储介质、内存储器。该可读存储介质存储有操作系统、计算机程序和数据库。该内存储器为可读存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于图神经网络的应答方法。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述实施例中基于图神经网络的应答方法。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述实施例中基于图神经网络的应答方法。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

Claims

1.一种基于图神经网络的应答方法，其特征在于，包括：

对所述用户音频文件进行语音识别，得到用户文本问题；

2.如权利要求1所述的基于图神经网络的应答方法，其特征在于，所述从基于专家知识领域的召回候选库中获取与所述业务场景结果匹配的候选问题，并构建各所述候选问题的图结构，包括：

获取所述召回候选库中与所述候选问题关联的一阶召回相似问题及与其对应的一阶实时采集次数，和与各所述一阶召回相似问题关联的二阶召回相似问题及与其对应的二阶实时采集次数；

创建以所述候选问题为中心的图结构，根据所有所述一阶召回相似问题及与其对应的所述一阶实时采集次数，建立与所述候选问题的一阶边连接关系，构建所述图结构的一阶邻居；

根据所有所述二阶召回相似问题及与其对应的所述二阶实时采集次数，建立与各所述一阶召回相似问题的二阶边连接关系，构建所述图结构的二阶邻居；

将构建二阶邻居之后的图结构记录为该候选问题的图结构。

3.如权利要求2所述的基于图神经网络的应答方法，其特征在于，所述获取所述召回候选库中与所述候选问题关联的一阶召回相似问题及与其对应的一阶实时采集次数，和与各所述一阶召回相似问题关联的二阶召回相似问题及与其对应的二阶实时采集次数之前，包括：

对所述候选问题进行分词处理，划分出多个单元词；

通过词性检测模型对各所述单元词进行词性识别，得到各所述单元词的词性结果；

4.如权利要求3所述的基于图神经网络的应答方法，其特征在于，所述根据所有所述单元词的词性结果，通过基于专家知识领域的问句生成模型进行问句生成，生成与所述候选问题对应的多个所述一阶召回相似问题，包括：

通过所述问句生成模型对所有与所述候选问题对应的所述词性结果进行分类及筛选处理，得到与预设词性相同的待处理词；

通过所述问句生成模型将所有所述待处理词填充至问句模板库中的各问句模板中，得到与各所述问句模板对应的待处理问句；

运用Bi-LSTM算法，通过所述问句生成模型中的基于专家知识领域的问句校验模型，对各所述待处理问句进行知识关系校验，得到各所述待处理问句的校验结果；

5.如权利要求4所述的基于图神经网络的应答方法，其特征在于，所述根据所有所述单元词的词性结果，通过基于专家知识领域的问句生成模型进行问句生成，生成与所述候选问题对应的多个所述一阶召回相似问题之后，包括：

接收与所述候选问题对应的召回请求，并返回与所述候选问题对应的所有所述一阶召回相似问题；

6.如权利要求2所述的基于图神经网络的应答方法，其特征在于，所述创建以所述候选问题为中心的图结构，根据所有所述一阶召回相似问题及与其对应的所述一阶实时采集次数，建立与所述候选问题的一阶边连接关系，构建所述图结构的一阶邻居，包括：

将各所述一阶召回相似问题均与所述候选问题连接，构成各所述一阶召回相似问题与所述候选问题的一阶边；

将与所述一阶召回相似问题对应的所述一阶实时采集次数赋予与该一阶召回相似问题连接的所述一阶边；

赋予完所有所述一阶边的图结构后，得到所述图结构的一阶邻居。

7.如权利要求2所述的基于图神经网络的应答方法，其特征在于，所述通过语义召回模型分别对所述用户文本问题和各所述候选问题的图结构进行共享参数的词向量转换，并对词向量转换后的所述用户文本问题进行词袋聚合，得到用户语义向量，以及通过所述语义召回模型中的图神经网络对各词向量转换后的所述候选问题进行逐层词袋聚合，得到与各所述候选问题一一对应的候选语义向量，获取所述用户语义向量与各所述候选语义向量的最大语义相似度，包括：

通过所述语义召回模型中的共享参数的转换模块分别对所述用户文本问题和所述候选问题的图结构进行词向量转换，得到向量集合；所述向量集合包括与所述用户文本问题对应的用户向量、与所述候选问题对应的候选向量、与各所述一阶召回相似问题对应的一阶向量组以及与各所述二阶召回相似问题对应的二阶向量组；

通过所述语义召回模型中的卷积神经网络对所述用户向量进行词袋聚合处理，得到与所述用户文本问题对应的所述用户语义向量；

通过所述图神经网络对所述候选问题和与所述候选问题的图结构的所述一阶向量组及所述二阶向量组进行多层词袋聚合处理，分别得到与所述候选问题的对应的所述中心语义向量、所述一阶语义向量和所述二阶语义向量；

通过所述图神经网络根据与相同的所述一阶召回相似问题连接的所述二阶召回相似问题对应的所述二阶语义向量以及所述二阶边，对该一阶召回相似问题对应的所述一阶语义向量进行第一逐层聚合处理，得到与该一阶召回相似问题对应的一阶聚合向量；

通过所述图神经网络根据所有与所述候选问题连接的所述一阶召回相似问题对应的所述一阶聚合向量，对该候选问题进行第二逐层聚合处理，得到与所述候选问题对应的候选语义向量；

运用余弦相似度算法，确定出所述用户语义向量与各所述候选语义向量的最大语义相似度。

8.一种基于图神经网络的应答装置，其特征在于，包括：

9.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述基于图神经网络的应答方法。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述基于图神经网络的应答方法。