CN112749262A

CN112749262A - 基于人工智能的问答处理方法、装置、电子设备及存储介质

Info

Publication number: CN112749262A
Application number: CN202010720482.3A
Authority: CN
Inventors: 周辉阳; 闫昭
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-07-24
Filing date: 2020-07-24
Publication date: 2021-05-04
Anticipated expiration: 2040-07-24
Also published as: CN112749262B

Abstract

本发明提供了一种基于人工智能的问答处理方法、装置、电子设备及计算机可读存储介质；方法包括：分别对问题以及问题对应的答案进行编码处理，得到对应问题的编码特征以及对应答案的编码特征；对问题的编码特征以及答案的编码特征进行融合处理，得到融合特征；对融合特征进行问题预测处理，得到与问题相似的相似问题；基于问题、相似问题以及对应的答案构建知识图谱，并基于知识图谱响应问答服务请求。通过本发明，能够提高智能问答服务的智能化程度。

Description

基于人工智能的问答处理方法、装置、电子设备及存储介质

技术领域

本发明涉及人工智能技术，尤其涉及一种基于人工智能的问答处理方法、装置、电子设备及计算机可读存储介质。

背景技术

人工智能(Artificial Intelligence，AI)是计算机科学的一个综合技术，通过研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科，涉及领域广泛，例如自然语言处理技术以及机器学习/深度学习等几大方向，随着技术的发展，人工智能技术将在更多的领域得到应用，并发挥越来越重要的价值。

智能问答服务是以一问一答形式，精确的定位用户所需要的提问知识，为用户提供个性化的信息服务。丰富的问答语料是提供精准的问答服务的基础。问题语料的缺失将会影响基于问答语料的问答服务的智能化程度。

发明内容

本发明实施例提供一种基于人工智能的问答处理方法、装置、电子设备及计算机可读存储介质，能够提高智能问答服务的智能化程度。

本发明实施例的技术方案是这样实现的：

本发明实施例提供一种基于人工智能的问答处理方法，包括：

分别对问题以及所述问题对应的答案进行编码处理，得到对应所述问题的编码特征以及对应所述答案的编码特征；

对所述问题的编码特征以及所述答案的编码特征进行融合处理，得到融合特征；

对所述融合特征进行问题预测处理，得到与所述问题相似的相似问题；

基于所述问题、所述相似问题以及所述对应的答案构建知识图谱，并基于所述知识图谱响应问答服务请求。

本发明实施例提供一种基于人工智能的问答处理装置，包括：

编码模块，用于分别对问题以及所述问题对应的答案进行编码处理，得到对应所述问题的编码特征以及对应所述答案的编码特征；

融合模块，用于对所述问题的编码特征以及所述答案的编码特征进行融合处理，得到融合特征；

解码模块，用于对所述融合特征进行问题预测处理，得到与所述问题相似的相似问题；

处理模块，用于基于所述问题、所述相似问题以及所述对应的答案构建知识图谱，并基于所述知识图谱响应问答服务请求。

上述技术方案中，所述编码模块还用于对所述问题进行特征提取处理，得到所述问题的词向量以及所述问题的位置向量，并

对所述问题的词向量以及所述问题的位置向量进行融合处理，得到所述问题的编码特征。

上述技术方案中，所述编码模块还用于对所述问题进行词编码处理，得到所述问题的词向量，并

对所述问题中各词语的位置进行位置编码处理，得到所述问题的位置向量。

上述技术方案中，所述编码模块还用于将所述问题的词向量与所述问题的位置向量进行拼接处理，得到所述问题的编码特征；或者，

将所述问题的词向量与所述答案的位置向量相加，得到所述问题的编码特征。

上述技术方案中，所述编码模块还用于对所述问题对应的答案进行特征提取处理，得到所述答案的词向量以及所述答案的位置向量，并

对所述答案的词向量以及所述答案的位置向量进行融合处理，得到所述答案的编码特征。

上述技术方案中，所述编码模块还用于对所述答案进行词编码处理，得到所述答案的词向量，并

对所述答案中各词语的位置进行位置编码处理，得到所述答案的位置向量。

上述技术方案中，所述编码模块还用于将所述答案的词向量与所述答案的位置向量进行拼接处理，得到所述答案的编码特征；或者，

将所述答案的词向量与所述答案的位置向量相加，得到所述答案的编码特征。

上述技术方案中，所述解码模块还用于对所述融合特征进行解码处理，生成与所述答案以及所述问题对应的词语向量；

根据生成的所述词语向量的顺序，对所述词语向量对应的词语进行组合处理，得到与所述问题相似的相似问题。

上述技术方案中，所述解码模块还用于对所述融合特征进行解码处理，生成与所述答案以及所述问题对应的第1个词语向量；

对所述第1个词语向量对应的第1个词语的编码特征、以及所述融合特征进行拼接处理，得到第1拼接特征；

对所述第i-1拼接特征进行解码处理，生成与所述答案以及所述问题对应的第i个词语向量；

对所述第i个词语向量对应的第i个词语的编码特征、以及第i-1拼接特征进行拼接处理，得到第i拼接特征；

对所述第i拼接特征进行解码处理，生成与所述答案以及所述问题对应的第i+1个词语向量；

其中，2≤i≤N-1，i为自然数，N为与所述答案以及所述问题对应的词语向量的数量。

上述技术方案中，所述编码模块还用于对所述第i个词语向量进行特征提取处理，得到所述第i个词语向量对应的第i个词语的词向量以及所述第i个词语的位置向量，其中，所述第i个词语的位置向量用于表征所述第i个词语在生成的多个词语中的位置；

对所述第i个词语的词向量以及所述第i个词语的位置向量进行融合处理，得到所述第i个词语的编码特征。

上述技术方案中，所述解码模块还用于对所述第i拼接特征进行注意力编码，得到第i注意力向量；

对所述第i注意力向量进行非线性映射处理，得到与所述答案以及所述问题对应的第i+1个词语向量的概率分布；

将所述概率分布中最大概率所对应的词语向量确定为所述第i+1个词语向量。

上述技术方案中，所述装置还包括：

训练模块，用于对样本对中的问题样本以及答案样本进行融合处理，得到融合特征，并

对所述融合特征进行问题预测处理，得到与所述答案样本以及所述问题样本对应的待生成词语的概率值；

根据所述待生成词语的概率值，构建问题生成模型的损失函数；

更新所述问题生成模型的参数直至所述损失函数收敛，将所述损失函数收敛时所述问题生成模型的更新的参数，作为训练后的所述问题生成模型的参数。

本发明实施例提供一种用于问答处理的电子设备，所述电子设备包括：

存储器，用于存储可执行指令；

处理器，用于执行所述存储器中存储的可执行指令时，实现本发明实施例提供的基于人工智能的问答处理方法。

本发明实施例提供一种计算机可读存储介质，存储有可执行指令，用于引起处理器执行时，实现本发明实施例提供的基于人工智能的问答处理方法。

本发明实施例具有以下有益效果：

通过对问题的编码特征以及答案的编码特征进行融合处理，并对得到的融合特征进行问题预测处理，得到大量与问题相似的相似问题，从而通过生成的相似问题丰富问题语料，为精准的问答服务奠定基础，能够准确地响应问答服务请求，从而提高智能问答服务的智能化程度。

附图说明

图1A-图1B是本发明实施例提供的问答处理系统的应用场景示意图；

图2是本发明实施例提供的用于问答处理的电子设备500的结构示意图；

图3-图6是本发明实施例提供的基于人工智能的问答处理方法的流程示意图；

图7是相关技术中对于问答型任务语料补充的方案示意图；

图8A-图8E是相关技术中问答平台答复问题的示意图；

图9是本发明实施例提供的问答平台扩充语料的示意图；

图10A-图10D是本发明实施例提供的问答平台答复问题的示意图；

图11是本发明实施例提供的基于问题生成模型的问题生成挖掘方法的流程示意图；

图12是本发明实施例提供的seq2seq模式的流程示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步地详细描述，所描述的实施例不应视为对本发明的限制，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

在以下的描述中，所涉及的术语“第一\第二”仅仅是是区别类似的对象，不代表针对对象的特定排序，可以理解地，“第一\第二”在允许的情况下可以互换特定的顺序或先后次序，以使这里描述的本发明实施例能够以除了在这里图示或描述的以外的顺序实施。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本发明实施例的目的，不是旨在限制本发明。

对本发明实施例进行进一步详细说明之前，对本发明实施例中涉及的名词和术语进行说明，本发明实施例中涉及的名词和术语适用于如下的解释。

1)深度学习(Deep Learning，DL)：机器学习(Machine Learning，ML)领域中一个新的研究方向，被引入机器学习使其更接近于最初的目标—人工智能(ArtificialIntelligence，AI)。深度学习是学习样本数据的内在规律和表示层次，这些学习过程中获得的信息，对诸如文字、图像和声音等数据的解释有很大的帮助。深度学习的最终目标是让机器能够像人一样具有分析学习能力，能够识别文字、图像和声音等数据。

2)知识图谱(Knowledge Graph)：在图书情报界称为知识域可视化或知识领域映射地图，是显示知识发展进程与结构关系的一系列各种不同的图形，用可视化技术描述知识资源及其载体，挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。

3)变压器的双向编码器表示(Bidirectional Encoder Representations fromTransformer，BERT)模型：BERT模型的目标是利用大规模无标注语料进行训练，以获得文本的语义表示，该文本的语义表示包含丰富语义信息，然后将文本的语义表示在特定自然语言处理(Natural Language Processing，NLP)任务中作微调，最终应用于该NLP任务。

4)序列对序列(seq2seq)模型：属于一种编码器-解码器结构，其中编码器-解码器结构就是利用两个循环神经网络，一个循环神经网络作为编码器，另一个循环神经网络作为解码器。编码器负责将输入序列压缩成指定长度的向量(序列的语义向量)，可以将最后一个输入的隐状态作为语义向量，也可以对最后一个隐状态做一个变换以得到语义向量，还可以将输入序列的所有隐状态做一个变换以得到语义变量。

下面说明本发明实施例提供的用于头部装饰处理的电子设备的示例性应用。

本发明实施例提供的用于问答处理的电子设备可以是各种类型的终端设备或服务器，其中，服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云计算服务的云服务器；终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接，本发明在此不做限制。

以服务器为例，例如可以是部署在云端的服务器集群，向用户开放人工智能云服务(AI as a Service，AIaaS)，AIaaS平台会把几类常见的AI服务进行拆分，并在云端提供独立或者打包的服务，这种服务模式类似于一个AI主题商城，所有的用户都可以通过应用程序编程接口的方式来接入使用AIaaS平台提供的一种或者多种人工智能服务。

例如，其中的一种人工智能云服务可以为问答处理服务，即云端的服务器封装有本发明实施例提供的问答处理的程序。用户通过终端(运行客户端，例如教育学习客户端、搜索客户端等)调用云服务中的问答处理服务，以使部署在云端的服务器调用封装的问答处理的程序，根据问题以及问题对应的答案，生成与问题相似的相似问题，基于问题、相似问题以及对应的答案构建知识图谱，后续基于知识图谱响应问答服务请求，例如，对于教育学习应用，在基于问题、相似问题以及对应的答案构建知识图谱后，学生提出问题，则根据提出的问题，查询知识图谱，当在知识图谱中查询到该提出的问题，则继续在知识图谱中查询与该提出的问题对应的答案，并将查询到的答案反馈给学生；对于搜索应用，在基于问题、相似问题以及对应的答案构建知识图谱后，用户在搜索框中输入问题，则在知识图谱中查询与该提出的问题对应的答案时，将查询到的答案反馈给用户。

参见图1A，图1A是本发明实施例提供的问答处理系统10的应用场景示意图，终端200通过网络300连接服务器100，网络300可以是广域网或者局域网，又或者是二者的组合。

终端200(运行有客户端，例如教育学习客户端、搜索客户端等)可以被用来获取问答服务请求(包括用户提出的问题)，例如，用户在教育学习客户端中输入问题，输入完成后，终端自动获取问答服务请求。

在一些实施例中，终端中运行的客户端中可以植入有问答处理插件，用以在客户端本地实现基于人工智能的问答处理方法。例如，终端200获取问答服务请求后，调用问答处理插件，以实现基于人工智能的问答处理方法，根据问题以及问题对应的答案，生成与问题相似的相似问题，基于问题、相似问题以及对应的答案构建知识图谱，并基于知识图谱搜索用于响应问答服务请求的答案，，例如，对于教育学习应用，在基于问题、相似问题以及对应的答案构建知识图谱后，学生提出问题，则在知识图谱中查询到与该提出的问题对应的答案，并将查询到的答案反馈给学生。

在一些实施例中，终端200获取问答服务请求后，调用服务器100的问答处理接口(可以提供为云服务的形式，即问答处理服务)，服务器100根据问题以及问题对应的答案，生成与问题相似的相似问题，基于问题、相似问题以及对应的答案构建知识图谱，并基于知识图谱搜索用于响应问答服务请求的答案，例如，对于搜索应用，在基于问题、相似问题以及对应的答案构建知识图谱后，用户在搜索框中输入问题，则在知识图谱中查询与该提出的问题对应的答案时，将查询到的答案反馈给用户。

参见图1B，图1B是本发明实施例提供的问答处理系统的另一种场景示意图，图1B示出图1A中的网络300为区块链网络(示例性示出了共识节点300-1至共识节点300-4)。区块链网络的类型是灵活多样的，例如可以为公有链、私有链或联盟链中的任意一种。以公有链为例，任何业务主体的电子设备例如终端，都可以在不需要授权的情况下接入区块链网络，以作为区块链的共识节点，例如终端200-1映射为区块链网络中的共识节点300-1，终端200-2映射为区块链网络中的共识节点300-2，终端200-3映射为区块链网络中的共识节点300-3，服务器100映射为区块链网络中的共识节点300-4；以联盟链为例，业务主体在获得授权后其下辖的电子设备可以接入区块链网络，例如终端。

例如，学生在终端200-1(包含客户端，例如教育学习客户端)上输入问题，终端200-1向服务器100发出问答服务请求，服务器100根据问题以及问题对应的答案生成相似问题后，根据问题、相似问题以及对应的答案生成对应更新操作的交易，在交易中指定了实现更新操作需要调用的智能合约、以及向智能合约传递的参数，交易还携带了服务器的数字证书、签署的数字签名(例如，使用服务器的数字证书中的私钥，对交易的摘要进行加密得到)，并将交易广播到区块链网络中的共识节点。

例如，终端200-2(共识节点300-2)接收到交易时，对交易携带的数字证书和数字签名进行验证，以验证问题与相似问题是否相似，相似问题与答案是否匹配等，当验证成功后，签署节点自己的数字签名(例如，共识节点300-2的私钥对交易的摘要进行加密得到)，将签署标签后的交易广播到区块链网络中的共识节点中，继续进行共识。其中，终端可以自动进行验证，还可以由终端所对应的用户给出验证结果，每个终端验证通过后将对其签署数字签名(即背书)，当问题、相似问题以及对应的答案有足够的背书时，才会用于后续知识图谱的构建过程。其中，进行验证的用户可以获得一定的奖励，并记录在区块链网络中，例如终端包括的客户端可以有一定的虚拟币，避免后续需要购买虚拟币才能得到想要的答案等。

当服务器100再次接收到交易时，继续对交易携带的数字证书和数字签名进行验证，当验证通过且确定交易被共识成功的次数超过共识阈值时，验证成功后，基于问题、相似问题以及对应的答案构建知识图谱，并基于知识图谱响应问答服务请求，签署节点自己的数字签名，并返回终端，即保证了知识图谱的准确性，以准确地响应问答服务请求。并且，通过终端验证问题、相似问题以及对应的答案的方式，可以节约服务器对问题、相似问题以及对应的答案验证的开销，并通过多个终端对问题、相似问题以及对应的答案的验证，可以保证知识图谱的准确性。

下面说明本发明实施例提供的用于问答处理的电子设备的结构，用于头部装饰处理的电子设备可以是各种终端，例如手机、电脑等。

参见图2，图2是本发明实施例提供的用于问答处理的电子设备500的结构示意图，以电子设备500是服务器为例说明，图2所示的用于问答处理的电子设备500包括：至少一个处理器510、存储器550、至少一个网络接口520和用户接口530。电子设备500中的各个组件通过总线系统540耦合在一起。可理解，总线系统540用于实现这些组件之间的连接通信。总线系统540除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图2中将各种总线都标为总线系统540。

处理器510可以是一种集成电路芯片，具有信号的处理能力，例如通用处理器、数字信号处理器(DSP，Digital Signal Processor)，或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等，其中，通用处理器可以是微处理器或者任何常规的处理器等。

存储器550包括易失性存储器或非易失性存储器，也可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(ROM，Read Only Memory)，易失性存储器可以是随机存取存储器(RAM，Random Access Memory)。本发明实施例描述的存储器550旨在包括任意适合类型的存储器。存储器550可选地包括在物理位置上远离处理器510的一个或多个存储设备。

在一些实施例中，存储器550能够存储数据以支持各种操作，这些数据的示例包括程序、模块和数据结构或者其子集或超集，下面示例性说明。

操作系统551，包括用于处理各种基本系统服务和执行硬件相关任务的系统程序，例如框架层、核心库层、驱动层等，用于实现各种基础业务以及处理基于硬件的任务；

网络通信模块552，用于经由一个或多个(有线或无线)网络接口520到达其他计算设备，示例性的网络接口520包括：蓝牙、无线相容性认证(WiFi)、和通用串行总线(USB，Universal Serial Bus)等；

在一些实施例中，本发明实施例提供的基于人工智能的问答处理装置可以采用软件方式实现，例如，可以是上文所述的终端中的问答处理插件，可以是上文所述的服务器中问答处理服务。

当然，不局限于此，本发明实施例提供的基于人工智能的问答处理装置可以提供为各种软件实施例，包括应用程序、软件、软件模块、脚本或代码在内的各种形式。

图2示出了存储在存储器550中的基于人工智能的问答处理装置555，其可以是程序和插件等形式的软件，例如问答处理插件，并包括一系列的模块，包括编码模块5551、融合模块5552、解码模块5553、处理模块5554以及训练模块5555；其中，编码模块5551、融合模块5552、解码模块5553、处理模块5554用于实现本发明实施例提供的问答处理功能，训练模块5555用于实现对问答生成模型的训练。

根据上文可以理解，本发明实施例提供的基于人工智能的问答处理方法可以由各种类型的用于问答处理的电子设备实施，例如智能终端和服务器等。

下面结合本发明实施例提供的服务器的示例性应用和实施，说明本发明实施例提供的基于人工智能的问答处理方法。参见图3，图3是本发明实施例提供的基于人工智能的问答处理方法的流程示意图，结合图3示出的步骤进行说明。

在下面步骤中，涉及的问题以及问题对应的答案是从数据库中众多的问答对中筛选出来的。

在一些实施例中，在获取问题以及问题对应的答案之前，确定数据库中候选问题被选用的频率，根据候选问题被选用的频率，从多个候选问题中确定出需要进行问答处理的问题以及问题对应的答案。例如，确定出候选问题被用户选用的频率，当候选问题被选用的频率大于选用阈值时，将该候选问题确定为需要进行问答处理的问题，以根据问题以及问题对应的答案进行后续问答处理；确定出候选问题被用户选用的频率，根据候选问题被用户选用的频率，对候选问题进行降序排序，将排序在前的至少一个候选问题作为需要进行问答处理的问题，以根据问题以及问题对应的答案进行后续问答处理。因此，从数据库中筛选出被高频率选中的问题，并对筛选出的问题以及问题对应的答案进行问答处理，得到与问题相似的相似问题，从而提高被高频率选中的问题的多样性，以便后续提高问题以及答案的命中率。

在一些实施例中，在获取问题以及问题对应的答案之前，确定数据库中候选答案的准确率(即表征答案回答问题的准确程度)，根据候选答案的准确率，从多个候选答案中确定出需要进行问答处理的答案以及答案对应的问题。例如，确定出数据库中多个候选答案的准确率，当候选答案的准确率大于准确率阈值时，将该候选答案确定为需要进行问答处理的答案，以根据答案对应的问题以及答案进行后续问答处理；确定出数据库中多个候选答案的准确率，根据候选答案的准确率，对候选答案进行降序排序，将排序在前的至少一个候选答案作为需要进行问答处理的答案，以根据答案以及答案对应的问题进行后续问答处理。因此，从数据库中筛选出准确率高的答案，并对筛选出的答案以及答案对应的问题进行问答处理，得到与问题相似的相似问题，从而提高高准确率的答案对应的问题的多样性，以便后续提高问题以及答案的命中率以及答案的准确率。

在步骤101中，分别对问题以及问题对应的答案进行编码处理，得到对应问题的编码特征以及对应答案的编码特征。

在服务器从数据库中筛选出问题以及问题对应的答案之后，为了根据问题以及答案，生成与问题相似的相似问题，需要对问题进行编码，得到对应问题的编码特征，对问题对应的答案进行编码，得到对应答案的编码特征，以便后续根据问题的编码特征以及答案的编码特征，对问题以及答案进行融合。

参见图4，图4是本发明实施例提供的基于人工智能的问答处理方法的一个可选的流程示意图，图4示出图3中的步骤101可通过步骤1011-1012实现：在步骤1011中，对问题进行特征提取处理，得到问题的词向量以及问题的位置向量；在步骤1012中，对问题的词向量以及问题的位置向量进行融合处理，得到问题的编码特征。

例如，通过问题生成模型中的编码器对问题进行特征提取，以得到问题的词向量以及问题的位置向量，并通过编码器对问题的词向量以及问题的位置向量进行融合，得到问题的编码特征，即问题的编码特征包括问题中各个词语在问题中的位置，则问题的编码特征能够准确地表征该问题，以便后续根据问题的编码特征进行准确地解码处理。

在一些实施例中，对问题进行特征提取处理，得到问题的词向量以及问题的位置向量，包括：对问题进行词编码处理，得到问题的词向量，并对问题中各词语的位置进行位置编码处理，得到问题的位置向量。

承接上述示例，通过变压器的双向编码器表示(Bidirectional Encoder Representations from Transformer，BERT)模型对问题进行词编码，以得到问题的词向量，并通过BERT模型对问题中各词语的位置进行位置编码，得到问题的位置向量，该问题的位置向量用于表征问题中各词语在问题中的位置。其中，本发明实施例并不局限于BERT模型，其他的编码器也适用于本发明实施例。

在一些实施例中，对问题的词向量以及问题的位置向量进行融合处理，得到问题的编码特征，包括：将问题的词向量与问题的位置向量进行拼接处理，得到问题的编码特征；或者，将问题的词向量与答案的位置向量相加，得到问题的编码特征。

承接上述示例，在服务器得到问题的词向量以及问题的位置向量后，需要对问题的词向量以及问题的位置向量进行融合，以得到问题的编码特征，后续根据问题的编码特征进行解码处理，其中融合的方式包括：对问题的词向量以及问题的位置向量进行拼接，将拼接结果确定为问题的编码特征，或者，将问题的词向量以及问题的位置向量进行加和，将加和结果确定为问题的编码特征。

参见图4，图4是本发明实施例提供的基于人工智能的问答处理方法的一个可选的流程示意图，图4示出图3中的步骤101可通过步骤1013-1014实现：在步骤1013中，对问题对应的答案进行特征提取处理，得到答案的词向量以及答案的位置向量；在步骤1014中，对答案的词向量以及答案的位置向量进行融合处理，得到答案的编码特征。

例如，通过问题生成模型中的编码器对问题对应的答案进行特征提取，以得到答案的词向量以及答案的位置向量，并通过编码器对答案的词向量以及答案的位置向量进行融合，得到答案的编码特征，即答案的编码特征包括答案中各个词语在答案中的位置，则答案的编码特征能够准确地表征该答案，以便后续根据答案的编码特征进行准确地解码处理。

在一些实施例中，对问题对应的答案进行特征提取处理，得到答案的词向量以及答案的位置向量，包括：对答案进行词编码处理，得到答案的词向量，并对答案中各词语的位置进行位置编码处理，得到答案的位置向量。

承接上述示例，通过BERT模型对答案进行词编码，以得到答案的词向量，并通过BERT模型对答案中各词语的位置进行位置编码，得到答案的位置向量，该答案的位置向量用于表征答案中各词语在答案中的位置。其中，本发明实施例并不局限于BERT模型，其他的编码器也适用于本发明实施例。

在一些实施例中，对答案的词向量以及答案的位置向量进行融合处理，得到答案的编码特征，包括：将答案的词向量与答案的位置向量进行拼接处理，得到答案的编码特征；或者，将答案的词向量与答案的位置向量相加，得到答案的编码特征。

承接上述示例，在服务器得到答案的词向量以及答案的位置向量后，需要对答案的词向量以及答案的位置向量进行融合，以得到答案的编码特征，后续根据答案的编码特征进行解码处理，其中融合的方式包括：对答案的词向量以及答案的位置向量进行拼接，将拼接结果确定为答案的编码特征，或者，将答案的词向量以及答案的位置向量进行加和，将加和结果确定为答案的编码特征。

在步骤102中，对问题的编码特征以及答案的编码特征进行融合处理，得到融合特征。

例如，在服务器得到问题的编码特征以及答案的编码特征后，可以拼接问题的编码特征以及答案的编码特征，得到融合特征，以实现问题的编码特征以及答案的编码特征的融合，以便后续根据融合特征进行解码处理。

在一些实施例中，可以先拼接问题以及问题对应的答案，得到拼接文本，然后对拼接文本进行编码处理，得到融合特征，例如，对拼接文本进行特征提取，得到拼接文本的词向量以及拼接文本的位置向量，对拼接文本的词向量以及拼接文本的位置向量进行融合，得到融合特征，其中，拼接文本的位置向量用于表征拼接文本中各词语在拼接文本中的位置。

在步骤103中，对融合特征进行问题预测处理，得到与问题相似的相似问题。

例如，在服务器得到融合特征后，可以对融合特征进行问题预测，得到与问题相似的相似问题，以便后续基于问题、相似问题以及答案，构建知识图谱以响应用户的问答服务请求。

参见图5，图5是本发明实施例提供的基于人工智能的问答处理方法的一个可选的流程示意图，图5示出图3中的步骤103可通过步骤1031-1032实现：在步骤1031中，对融合特征进行解码处理，生成与答案以及问题对应的词语向量；在步骤1032中，根据生成的词语向量的顺序，对词语向量对应的词语进行组合处理，得到与问题相似的相似问题。

例如，通过问题生成模型中的解码器对融合特征进行解码，以序列对序列(seq2seq)模式依次生成与答案以及问题对应的词语向量，在获得所有的词语向量后，根据生成的词语向量的顺序，组合词语向量对应的词语，以生成与问题相似的相似问题。

参见图6，图6是本发明实施例提供的基于人工智能的问答处理方法的一个可选的流程示意图，图6示出图5中的步骤1031可通过步骤10311-10315实现：在步骤10311中，对融合特征进行解码处理，生成与答案以及问题对应的第1个词语向量；在步骤10312中，对第1个词语向量对应的第1个词语的编码特征、以及融合特征进行拼接处理，得到第1拼接特征；在步骤10313中，对第i-1拼接特征进行解码处理，生成与答案以及问题对应的第i个词语向量；在步骤10314中，对第i个词语向量对应的第i个词语的编码特征、以及第i-1拼接特征进行拼接处理，得到第i拼接特征；在步骤10315中，对第i拼接特征进行解码处理，生成与答案以及问题对应的第i+1个词语向量。

其中，2≤i≤N-1，i为自然数，N为与答案以及问题对应的词语向量的数量。在服务器得到融合特征后，通过问题生成模型中的变压器(transformer)对融合特征进行解码处理，得到与答案以及问题对应的第1个词语向量，然后，对第1个词语向量对应的第1个词语的编码特征、以及融合特征进行拼接处理，得到第1拼接特征；对第1拼接特征进行解码处理，生成与答案以及问题对应的第2个词语向量，对对第2个词语向量对应的第2个词语的编码特征、以及第1拼接特征进行拼接处理，得到第2拼接特征；对第2拼接特征进行解码处理，生成与答案以及问题对应的第3个词语向量，继续进行拼接以及解码处理，直至生成与答案以及问题对应的第N个词语向量。其中，本发明实施例并不局限于transformer，其他的解码器也适用于本发明实施例。

在一些实施例中，对第i个词语向量对应的第i个词语的编码特征、以及第i-1拼接特征进行拼接处理之前，还包括：对第i个词语向量进行特征提取处理，得到第i个词语向量对应的第i个词语的词向量以及第i个词语的位置向量，其中，第i个词语的位置向量用于表征第i个词语在生成的多个词语中的位置；对第i个词语的词向量以及第i个词语的位置向量进行融合处理，得到第i个词语的编码特征。

承接上述示例，通过问题生成模型中的编码器对第i个词语向量进行特征提取，以得到第i个词语向量对应的第i个词语的词向量以及第i个词语的位置向量，并通过编码器对第i个词语的词向量以及第i个词语的位置向量进行融合，得到第i个词语的编码特征，即第i个词语的编码特征包括第i个词语在生成的多个词语中的位置信息，则第i个词语的编码特征能够准确地表征该第i个词语，以便后续根据第i个词语的编码特征继续进行后续解码操作。其中，第1个词语向量的编码过程与第i个词语向量的编码过程类似。

在一些实施例中，通过问题生成模型中的编码器进行以下处理：先对融合特征进行自注意力编码处理，得到第1注意力向量，然后对第1注意力向量进行非线性映射，得到与答案以及问题对应的第1个词语向量的概率分布，该概率分布中包括多个词语向量(第1个候选词语向量)的概率值，最后将概率分布中最大概率所对应的词语向量确定为第1个词语向量。

在一些实施例中，对第i拼接特征进行解码处理，生成与答案以及问题对应的第i+1个词语向量，包括：对第i拼接特征进行注意力编码，得到第i注意力向量；对第i注意力向量进行非线性映射处理，得到与答案以及问题对应的第i+1个词语向量的概率分布；将概率分布中最大概率所对应的词语向量确定为第i+1个词语向量。

承接上述示例，通过问题生成模型中的编码器进行以下处理：先对第i拼接特征进行自注意力编码处理，得到第i注意力向量，然后对第i注意力向量进行非线性映射，得到与答案以及问题对应的第i+1个词语向量的概率分布，该概率分布中包括多个词语向量(第i+1个候选词语向量)的概率值，最后将概率分布中最大概率所对应的词语向量确定为第i+1个词语向量。

在一些实施例中，为了通过问题生成模型可以生成相似问题，需要对问题生成模型进行训练，其训练过程包括：对样本对中的问题样本以及答案样本进行融合处理，得到融合特征，并对融合特征进行问题预测处理，得到与答案样本以及问题样本对应的待生成词语的概率值；根据待生成词语的概率值，构建问题生成模型的损失函数；更新问题生成模型的参数直至损失函数收敛，将损失函数收敛时问题生成模型的更新的参数，作为训练后的问题生成模型的参数。

例如，通过问题生成模型对样本对中的问题样本以及答案样本分别进行编码处理，得到对应问题样本的编码特征以及对应答案样本的编码特征，对问题样本的编码特征以及答案样本的编码特征进行融合处理，得到融合特征，对融合特征进行问题预测处理，依次得到多个与答案样本以及问题样本对应的待生成词语的概率值，根据多个待生成词语的概率值，确定问题生成模型的损失函数的值后，可以判断问题生成模型的损失函数的值是否超出预设阈值，当问题生成模型的损失函数的值超出预设阈值时，基于问题生成模型的损失函数确定问题生成模型的误差信号，将误差信息在问题生成模型中反向传播，并在传播的过程中更新各个层的模型参数。

这里，对反向传播进行说明，将训练样本数据输入到神经网络模型的输入层，经过隐藏层，最后达到输出层并输出结果，这是神经网络模型的前向传播过程，由于神经网络模型的输出结果与实际结果有误差，则计算输出结果与实际值之间的误差，并将该误差从输出层向隐藏层反向传播，直至传播到输入层，在反向传播的过程中，根据误差调整模型参数的值；不断迭代上述过程，直至收敛。其中，问题生成模型属于神经网络模型。

在步骤104中，基于问题、相似问题以及对应的答案构建知识图谱，并基于知识图谱响应问答服务请求。

例如，在服务器得到与问题相似的相似问题后，基于问题、相似问题以及对应的答案构建知识图谱，后续在服务器接收到问答服务请求后，基于知识图谱搜索出对应问答服务请求的问题以及问题对应的答案，以响应问答服务请求。

在一些实施例中，在得到与问题相似的相似问题之后，根据问题或者相似问题或者答案所属的类型，将问题、相似问题以及答案存储至对应类型的存储区域中，后续在进行智能问答服务时，首先确定被提的问题所属的类型，然后在对应类型的存储区域中搜索对应的答案，以加快查询速度。其中，问题或者相似问题或者答案所属的类型包括科目(例如，语文、数学)、区域(例如，湖北省、湖南省)、人群(例如，学生、老师)，例如，根据答案所属的类型，将问题、相似问题以及答案存储至对应类型的文件夹中。

在一些实施例中，在服务器得到与问题相似的相似问题后，将问题、相似问题以及答案存储至数据库。在到达预设的时间点时，对数据库中存储的问题、相似问题以及答案进行定期的清理，确定数据库中问题以及相似问题被选用的频率，当问题以及相似问题被选用的频率低于选用阈值时，将数据库中的该问题、相似问题以及答案删除，以节约存储空间。

在一些实施例中，在服务器得到与问题相似的相似问题后，服务器将相似问题以及答案发送至区块链网络，通过区块链网络中的共识节点对相似问题以及答案进行共识验证，当相似问题以及答案验证通过后，才将问题、相似问题以及对应的答案存储至数据库，进行后续的智能问答服务，从而提高问题、答案的命中率。其中，进行验证的共识节点(使用客户端的用户)可以获得奖励，并将奖励记录在区块链网络中，例如用户可以获得虚拟币，从而可以避免需要购买虚拟币才能得到想要的答案。

下面，将说明本发明实施例在一个实际的应用场景中的示例性应用。

本发明实施例可以应用于问答的应用场景中，如图1A所示，终端200通过网络300连接部署在云端的服务器100，在终端200上安装教育学习应用，终端200在获取问答服务请求后，将问答服务请求发送至服务器100，服务器100接收到问答服务请求后，通过训练好的问题生成模型，生成与问题相似的相似问题，并基于问题、相似问题以及答案响应问答服务请求，通过生成的相似问题进行语料补充。

相关技术中，在各个领域以及百科的建设过程之中，语料是非常重要的核心资产，对于各个具体的任务型的领域，有了语料才能训练一个好的模型，模型才能识别属于这个领域的语料。对于问答型的任务，语料就更为重要，更多的语料才能让产品更加的智能化，能回答用户各种千奇百怪的问题。其核心包括语料的数量和质量，语料的数量是指语料要够多，数量要够大，语料的质量是指语料的质量要好，要能包含用户的各种方式的问法。当然，问答型的任务中算法也是非常核心的技能，算法能让相似的问题得到召回，进而回答用户的问题，所以，算法的泛化性能对于整个服务质量的提升都是非常关键的作用。其中，模型的训练也需要语料，即一个好的模型需要很多高质量语料的支撑才能得以实现。因此，语料对于问答型的任务特别重要。

其中，增加问答型任务的语料是一个难点，其难点在于：一方面难以获取大量的用户的真实问法；二是难以获取大量的各种不同的问法。

在建设问答型任务的语料过程中，一般有两种途径，分别为：1)通过人力进行处理，即通过人力的搜索进行语料的添加补全，语料补全之后还需要开发人员进行审核才能上线；2)通过日志挖掘进行语料的添加补全，比如通过关键字或者关键词的挖掘，即采用关键字或者关键词召回一些用户的查询请求(query)，然后审核召回的query是否属于需要的领域，当确认属于需要的领域之后，入库该召回的query(语料)，例如AA课堂的客服语料，可以通过关键词(“AA课堂”)等来召回所有的含有“AA课堂”的语料。

相关技术中对于问答型任务语料补充的方案如图7所示，一种途径是通过人力来对指定领域的语料进行扩展，其中补充的要求是：补充该领域的相关query对应口语化的语料，即是人们经常提问的语料，而且对应同一问题的问法要不同，在通过人工补充完语料后，还需要开发人员对补充的语料进行审核，审核通过的语料才能上线运营。另一种途径是利用数据挖掘技术，进行日志挖掘，通过关键词或者关键字进行语料召回，其中，召回的语料可能不全是该领域的目标语料，例如，关键词是“课堂”，召回的一些语料是“我想听课堂这首歌”、“帮我导航到课堂这个地方”、“课堂今天的温度是多少”，可以看出这三个语料的领域分别属于音乐、导航、天气，根本就不属于问答型的课堂领域，最后对召回的语料进行审核，审核通过的语料才能上线运营。

虽然通过相关技术可以扩充相关语料，但是相关技术的语料补充方案存在以下问题：1)人力、物力需求大，一个人一天只能处理1000左右的新增语料，对于用户千奇百怪和各种不同的问法来说(问法本身就是无穷的)，需要投入巨大的人力资源，否则很长时间都不能完成好这项任务；2)周期长，即人工处理的周期慢，而且数量也不多，若要完成该项任务，需要耗费大量时间；3)开发人员负担大，开发人员平时有很多新的任务、需求需要开发，如果还要加上审核任务的话，任务十分繁重，很难保证新的需求能够顺利完成；4)日志本身的局限性，因为日志本来就是用户提的问题，但是如果用户的群体不够大，提的问题的数量和问法不够多，那么日志本身就没有多少有价值的语料，因此日志挖掘将得不到大量的、高质量的、有用的语料；5)日志挖掘的精度和审核难度也需要耗费人力资源的，例如，关键词是“课堂”，召回的一些语料是“我想听课堂这首歌”、“帮我导航到课堂这个地方”、“课堂今天的温度是多少”，可以看出这三个语料的领域分别属于音乐、导航、天气，根本就不属于问答型的课堂领域，即通过日志挖掘出的语料的精准度不高，假设挖掘出的语料只有20％的可用率，对于上亿或者几百亿级别的日志，召回有上百万的语料，其中只有20％是有用的语料，则需要耗费大量人力资源去进行标注、审核。

为了解决上述问题，本发明实施例提出一种基于问题生成(Question Generation，QG)模型的问题生成挖掘方法(基于人工智能的问答处理方法)，生成各种相似问题，以获取各种不同的问法，并扩充语料。首先对QG模型进行训练，得到训练好的QG模型(相似问题生成模型)，然后针对具体领域的相关语料，将语料输入相似问题生成的模型，分别对每个语料进行问法扩展，例如，输入一条语料，相似问题生成的模型扩展出20条或者更多的语料，从而解决语料的泛化、高质量、数据量的问题。

本发明实施例可以应用于AA叮当的各个领域的语料补充任务，当需要补充语料或者扩展语料时，可以通过模型进行语料添加，从而保证每个领域的语料的高可用性和问法的多样性，使得人工智能产品在各个领域的体验结果越来越准确，提升用户的满意程度。

相关技术中，由于语料的问题，问答平台不能支持很多的问法，如图8A所示，在问答平台的输入框801中输入“学生被禁止进入课堂”，由于问答平台不能支持该问法(问题)，则问答平台输出回复语“我该好好学习了，居然没听懂你在说什么”；如图8B所示，在问答平台的输入框801中输入“学生进不了课堂，禁止进入了”，由于问答平台不能支持该问法(问题)，则问答平台输出回复语“我该好好学习了，居然没听懂你在说什么”；如图8C所示，在问答平台的输入框801中输入“学生被禁止进入AA课堂怎么办”，由于问答平台不能支持该问法(问题)，则问答平台输出回复语“我没有理解到你的意思，可以换个方式问我吗？”；如图8D所示，在问答平台的输入框801中输入“学生进不了课堂，怎么办”，由于问答平台不能支持该问法(问题)，则问答平台输出回复语“我没有理解到你的意思，可以换个方式问我吗？”；如图8E所示，在问答平台的输入框801中输入“学生进不去课堂怎么办”，由于问答平台不能支持该问法(问题)，则问答平台输出回复语“我没有理解到你的意思，可以换个方式问我吗？”。

本发明实施例为了解决上述问题，将某个问题作为相似问题生成的模型的输入，相似问题生成的模型输出相似问题，例如输入为“学生进不了我的课堂”，相似问题生成的模型输出为：“学生被禁止进入课堂”、“学生进不了课堂，禁止进入了”、“学生被禁止进入AA课堂怎么办”、“学生进不了课堂，怎么办”、“学生进不去AA课堂怎么办”、“学生怎么找到我的课堂”……，然后将这些问题、相似问题以及对应的答案输入到问答平台中，并上线发布，如图9所示，在问答管理的输入框901中输入问题：“学生进不了我的课堂”、“学生被禁止进入课堂”、“学生进不了课堂，禁止进入了”、“学生被禁止进入AA课堂怎么办”、“学生进不了课堂，怎么办”、“学生进不去AA课堂怎么办”、“学生怎么找到我的课堂”；输入答案：“学生可以换一个账号进入老师直播间”。

在将这些问题、相似问题以及对应的答案输入到问答平台中之后，问答平台可以支持各种问答，扩展了问答平台的召回能力，不论用户怎么问这类问题，问答平台都能够准确地进行回答。例如，如图10A所示，在问答平台的输入框1001中输入“学生被禁止进入AA课堂怎么办”，则问答平台输出回复语“学生可以换一个账号进入老师直播间”；如图10B所示，在问答平台的输入框1001中输入“学生被禁止进入课堂”，则问答平台输出回复语“学生可以换一个账号进入老师直播间”；如图10C所示，在问答平台的输入框1001中输入“学生进不了我的课堂”，则问答平台输出回复语“学生可以换一个账号进入老师直播间”；如图10D所示，在问答平台的输入框1001中输入“学生进不了课堂，禁止进入了”，则问答平台输出回复语“学生可以换一个账号进入老师直播间”。

如图11所示，本发明实施例提出的基于问题生成(Question Generation，QG)模型的问题生成挖掘方法包括几个关键点，分别为1)BERT编码；2)transformer解；3)seq2seq模式；4)QG模型；5)迁移学习；6)相似问答对的模型参数微调(fine_tune)；7)相似语料的输出。

1)BERT编码

由于BERT编码在动态词向量的特征提取上表现比较好，BERT编码比特征提取器(例如卷积神经网络(Convolutional Neural Networks，CNN)、循环神经网络(RecurrentNeural Network，RNN)、长短期记忆网络(Long Short-Term Memory，LSTM)、语言模型嵌入(Embeddings from Language Models，ELMo)、生成性预训练(Generative Pre-Training，GPT)等)效果都要好。因此，本发明实施例采用BERT作为特征提取器，即编码器。

2)transformer解码

由于transformer中自带的注意力(attention)机制，会让模型自动的去寻找当前最需要关注的信息，并且transformer解码效果也很好，transformer比解码器(例如CNN、RNN、LSTM、ELMo、GPT等)的解码效果都要好。因此，本发明实施例采用transformer作为解码器。

3)seq2seq模式

由于本发明实施例中的问题生成模型是一个问题生成的模型，不是分类模型或者其他的模型，由于生成的问题之间是有联系的，即生成的下文是依赖于上文的输出的，例如，当模型已经输出“我是中国”，现在需要预测下一个字，则将输入和已经得到的输出“我是中国”一起作为输入，以预测下一个词，得到“人”，则最新的结果就是“我是中国人”。因此，本发明实施例采用seq2seq的模式，生成模型的输入，即生成的下文是依赖于上文的输出的。如图12所示，将正文与答案输入至问题生成模型，则问题生成模型第一次的输出为问题中的第一个词q₁，然后将q₁作为输入，输入至问题生成模型，则问题生成模型第二次的输出为问题中的第二个词q₂，然后将q₂作为输入，输入至问题生成模型，则问题生成模型第三次的输出为问题中的第三个词q₃，将q₃作为输入，输入至问题生成模型，直至问题生成模型输出结束符SEP，则问题生成模型输出对应答案的问题。

4)QG模型

通过BERT编码、transformer解码以及seq2seq模式的组合得到一个QG模型的基本框架。QG模型的输入一般是一段文字或者一篇文档，即文本(content)，并加上人工标注的一些答案(answer)，QG模型的输出为针对答案而生成的对应的问题。例如，有一段文字“刘XX在家中排行老四，幼时随家人搬到了九龙钻石山的木屋区居住，并和姐弟一起帮助家里打理卖稀饭的生意。刘XX在读书期间，积极参加校内学校剧社的表演，在老师杜XX的指导下学习戏剧方面的知识。此外，他还参与包括编剧在内的幕后制作。中六上学期后，他到电视广播有限公司的艺员训练班受训，从而开始了演艺之路”，将“杜XX”标注出来作为答案，QG模型针对“杜XX”提出问题，则QG模型的输出为：“刘XX在戏剧方面的老师是谁？”。

5)迁移学习

该迁移学习是一种思想迁移，将通用领域的知识转移到特定领域，即将QG模型应用到生成相似问题。首先确定目标，即能对数据库中已有语料进行扩展，能够得到对应的相似语料，也就是同样的意思但是不同的问法和说法的语料，以扩充语料，提升模型的能力和线上的满意度。迁移学习的建模过程为：存在A-B问答对(A为问题，B为A的答案)，希望得到A’(即A的相似问题)。例如，数据库中恰好已经有了相似问题的问答对，如表1所示：

表1

如表1所示，数据库中有A、A’-B(即多个问题对应一个答案，那么这多个问题本身就是相似问题)，通过QG模型，将A和B作为输入(A作为QG模型中的content，B作为QG模型中的answer)，将A’作为目标输出，以训练模型。在预测的时候，将A和B作为输入，模型输出大量的A’。

6)相似问答对的fine_tune

这里，对QG模型进行具体的fine_tune(模型参数微调)。通过fine_tune来微调QG模型参数，使得QG模型能适用于当前设定的场景。fine_tune就是通过线上所有的相似问答对，例如表1的数据，对QG模型进行训练，训练的数据格式为：将A和B作为输入(A作为QG模型中的content，B作为QG模型中的answer)，将A’作为QG模型的目标输出(A’为相似问题，B为对应的答案)，这样得到训练后的QG模型(相似问题生成模型)。

7)相似语料的输出

这里，将需要补充的领域数据(问答任务型语料)作为输入，例如，将数据库中的A-B形式的问答对作为输入，通过相似问题生成模型得到A的相似的各种不同的问法的相似问题。例如，相似问题生成模型的输入为：A是“学生进不了我的课堂”、B是“学生可以换一个账号进入老师直播间。”，通过相似问题生成模型进行问答处理，得到A的相似问题为[“学生被禁止进入课堂”、“学生进不了课堂，禁止进入了”、“学生被禁止进入腾讯课堂怎么办”、“学生进不了课堂，怎么办”、“生进不去腾讯课堂怎么办”……]。最后，筛选确定的相似问题导入问答平台，并进行发布，形成线上真实的问答能力。

综上，本发明实施例提出的基于人工智能的问答处理方法对于各个领域的语料补充和扩展都非常重要，不用花费大量的人力和物力去做语料扩充，构建的QG模型也适用于相关领域的语料挖掘和文本生成等任务。

至此已经结合本发明实施例提供的服务器的示例性应用和实施，说明本发明实施例提供的基于人工智能的问答处理方法，下面继续说明本发明实施例提供的基于人工智能的问答处理装置555中各个模块配合实现问答处理的方案。

编码模块5551，用于分别对问题以及所述问题对应的答案进行编码处理，得到对应所述问题的编码特征以及对应所述答案的编码特征；融合模块5552，用于对所述问题的编码特征以及所述答案的编码特征进行融合处理，得到融合特征；解码模块5553，用于对所述融合特征进行问题预测处理，得到与所述问题相似的相似问题；处理模块5554，用于基于所述问题、所述相似问题以及所述对应的答案构建知识图谱，并基于所述知识图谱响应问答服务请求。

在一些实施例中，所述编码模块5551还用于对所述问题进行特征提取处理，得到所述问题的词向量以及所述问题的位置向量，并对所述问题的词向量以及所述问题的位置向量进行融合处理，得到所述问题的编码特征。

在一些实施例中，所述编码模块5551还用于对所述问题进行词编码处理，得到所述问题的词向量，并对所述问题中各词语的位置进行位置编码处理，得到所述问题的位置向量。

在一些实施例中，所述编码模块5551还用于将所述问题的词向量与所述问题的位置向量进行拼接处理，得到所述问题的编码特征；或者，将所述问题的词向量与所述答案的位置向量相加，得到所述问题的编码特征。

在一些实施例中，所述编码模块5551还用于对所述问题对应的答案进行特征提取处理，得到所述答案的词向量以及所述答案的位置向量，并对所述答案的词向量以及所述答案的位置向量进行融合处理，得到所述答案的编码特征。

在一些实施例中，所述编码模块5551还用于对所述答案进行词编码处理，得到所述答案的词向量，并对所述答案中各词语的位置进行位置编码处理，得到所述答案的位置向量。

在一些实施例中，所述编码模块5551还用于将所述答案的词向量与所述答案的位置向量进行拼接处理，得到所述答案的编码特征；或者，将所述答案的词向量与所述答案的位置向量相加，得到所述答案的编码特征。

在一些实施例中，所述解码模块5553还用于对所述融合特征进行解码处理，生成与所述答案以及所述问题对应的词语向量；根据生成的所述词语向量的顺序，对所述词语向量对应的词语进行组合处理，得到与所述问题相似的相似问题。

在一些实施例中，所述解码模块5553还用于对所述融合特征进行解码处理，生成与所述答案以及所述问题对应的第1个词语向量；对所述第1个词语向量对应的第1个词语的编码特征、以及所述融合特征进行拼接处理，得到第1拼接特征；对所述第i-1拼接特征进行解码处理，生成与所述答案以及所述问题对应的第i个词语向量；对所述第i个词语向量对应的第i个词语的编码特征、以及第i-1拼接特征进行拼接处理，得到第i拼接特征；对所述第i拼接特征进行解码处理，生成与所述答案以及所述问题对应的第i+1个词语向量；其中，2≤i≤N-1，i为自然数，N为与所述答案以及所述问题对应的词语向量的数量。

在一些实施例中，所述编码模块5551还用于对所述第i个词语向量进行特征提取处理，得到所述第i个词语向量对应的第i个词语的词向量以及所述第i个词语的位置向量，其中，所述第i个词语的位置向量用于表征所述第i个词语在生成的多个词语中的位置；对所述第i个词语的词向量以及所述第i个词语的位置向量进行融合处理，得到所述第i个词语的编码特征。

在一些实施例中，所述解码模块5553还用于对所述第i拼接特征进行注意力编码，得到第i注意力向量；对所述第i注意力向量进行非线性映射处理，得到与所述答案以及所述问题对应的第i+1个词语向量的概率分布；将所述概率分布中最大概率所对应的词语向量确定为所述第i+1个词语向量。

在一些实施例中，所述装置还包括：训练模块5555，用于对样本对中的问题样本以及答案样本进行融合处理，得到融合特征，并对所述融合特征进行问题预测处理，得到与所述答案样本以及所述问题样本对应的待生成词语的概率值；根据所述待生成词语的概率值，构建问题生成模型的损失函数；更新所述问题生成模型的参数直至所述损失函数收敛，将所述损失函数收敛时所述问题生成模型的更新的参数，作为训练后的所述问题生成模型的参数。

本发明实施例提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行本发明实施例上述的基于人工智能的问答处理方法。

本发明实施例提供一种存储有可执行指令的计算机可读存储介质，其中存储有可执行指令，当可执行指令被处理器执行时，将引起处理器执行本发明实施例提供的基于人工智能的问答处理方法，例如，如图3-图6示出的基于人工智能的问答处理方法。

在一些实施例中，计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器；也可以是包括上述存储器之一或任意组合的各种设备。

在一些实施例中，可执行指令可以采用程序、软件、软件模块、脚本或代码的形式，按任意形式的编程语言(包括编译或解释语言，或者声明性或过程性语言)来编写，并且其可按任意形式部署，包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。

作为示例，可执行指令可以但不一定对应于文件系统中的文件，可以可被存储在保存其它程序或数据的文件的一部分，例如，存储在超文本标记语言(HTML，Hyper TextMarkup Language)文档中的一个或多个脚本中，存储在专用于所讨论的程序的单个文件中，或者，存储在多个协同文件(例如，存储一个或多个模块、子程序或代码部分的文件)中。

作为示例，可执行指令可被部署为在一个计算设备上执行，或者在位于一个地点的多个计算设备上执行，又或者，在分布在多个地点且通过通信网络互连的多个计算设备上执行。

以上所述，仅为本发明的实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和范围之内所作的任何修改、等同替换和改进等，均包含在本发明的保护范围之内。

Claims

1.一种基于人工智能的问答处理方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述对问题进行编码处理，得到对应所述问题的编码特征，包括：

对所述问题进行特征提取处理，得到所述问题的词向量以及所述问题的位置向量，并

3.根据权利要求2所述的方法，其特征在于，所述对所述问题进行特征提取处理，得到所述问题的词向量以及所述问题的位置向量，包括：

对所述问题进行词编码处理，得到所述问题的词向量，并

4.根据权利要求2所述的方法，其特征在于，所述对所述问题的词向量以及所述问题的位置向量进行融合处理，得到所述问题的编码特征，包括：

将所述问题的词向量与所述问题的位置向量进行拼接处理，得到所述问题的编码特征；或者，

5.根据权利要求1所述的方法，其特征在于，所述对所述问题对应的答案进行编码处理，得到对应所述答案的编码特征，包括：

对所述问题对应的答案进行特征提取处理，得到所述答案的词向量以及所述答案的位置向量，并

6.根据权利要求5所述的方法，其特征在于，所述对所述问题对应的答案进行特征提取处理，得到所述答案的词向量以及所述答案的位置向量，包括：

对所述答案进行词编码处理，得到所述答案的词向量，并

7.根据权利要求5所述的方法，其特征在于，所述对所述答案的词向量以及所述答案的位置向量进行融合处理，得到所述答案的编码特征，包括：

将所述答案的词向量与所述答案的位置向量进行拼接处理，得到所述答案的编码特征；或者，

8.根据权利要求1所述的方法，其特征在于，所述对所述融合特征进行问题预测处理，得到对应所述答案的与所述问题相似的相似问题，包括：

对所述融合特征进行解码处理，生成与所述答案以及所述问题对应的词语向量；

9.根据权利要求8所述的方法，其特征在于，所述对所述融合特征进行解码处理，生成与所述答案以及所述问题对应的词语向量，包括：

对所述融合特征进行解码处理，生成与所述答案以及所述问题对应的第1个词语向量；

10.根据权利要求9所述的方法，其特征在于，所述对所述第i个词语向量对应的第i个词语的编码特征、以及第i-1拼接特征进行拼接处理之前，还包括：

对所述第i个词语向量进行特征提取处理，得到所述第i个词语向量对应的第i个词语的词向量以及所述第i个词语的位置向量，其中，所述第i个词语的位置向量用于表征所述第i个词语在生成的多个词语中的位置；

11.根据权利要求9所述的方法，其特征在于，所述对所述第i拼接特征进行解码处理，生成与所述答案以及所述问题对应的第i+1个词语向量，包括：

对所述第i拼接特征进行注意力编码，得到第i注意力向量；

12.根据权利要求1所述的方法，其特征在于，所述方法还包括：

对样本对中的问题样本以及答案样本进行融合处理，得到融合特征，并

13.一种基于人工智能的问答处理装置，其特征在于，所述装置包括：

14.一种电子设备，其特征在于，所述电子设备包括：

存储器，用于存储可执行指令；

处理器，用于执行所述存储器中存储的可执行指令时，实现权利要求1至12任一项所述的基于人工智能的问答处理方法。

15.一种计算机可读存储介质，其特征在于，存储有可执行指令，用于引起处理器执行时，实现权利要求1至12任一项所述的基于人工智能的问答处理方法。