CN116756278A

CN116756278A - 机器问答方法以及装置

Info

Publication number: CN116756278A
Application number: CN202310558238.5A
Authority: CN
Inventors: 陈高杰
Original assignee: Alibaba China Co Ltd
Current assignee: Alibaba China Co Ltd
Priority date: 2023-05-15
Filing date: 2023-05-15
Publication date: 2023-09-15

Abstract

本说明书实施例提供机器问答方法以及装置，其中所述机器问答方法包括：获取问句文本和参考文本，其中，所述参考文本包含与所述问句文本相关联的知识信息；将所述问句文本和所述参考文本输入问答模型，获得答案文本，其中，所述问答模型基于多个样本对训练获得，所述样本对包括样本问句组和样本答案，所述样本问句组包括样本问句和样本参考语句，所述样本问句组携带有权重标签，所述权重标签基于所述样本参考语句的优先级以及所述样本参考语句与所述样本问句之间的相关性确定。通过基于包含权重标签以及样本答案的样本对训练问答模型，从而提升由问答模型输出的，问句文本和参考文本对应的答案文本的准确度和可控性。

Description

机器问答方法以及装置

技术领域

本说明书实施例涉及计算机技术领域，特别涉及一种机器问答方法。

背景技术

随着计算机技术的不断发展，用户对于文本准确度的需求逐渐提升。

为了提升文本准确度，通常会结合与问句文本相关的文本，来生成问句文本对应的答案文本；但当前基于问句文本的相关文本生成的答案文本，仍然存在不符合用户需求的情况。

因此，需要提供更可靠的方案生成问句文本对应的答案文本。

发明内容

有鉴于此，本说明书实施例提供了一种机器问答方法。本说明书一个或者多个实施例同时涉及一种机器问答装置，一种计算设备，一种计算机可读存储介质以及一种计算机程序，以解决现有技术中存在的技术缺陷。

根据本说明书实施例的第一方面，提供了一种机器问答方法，包括：

获取问句文本和参考文本，其中，所述参考文本包含与所述问句文本相关联的知识信息；

将所述问句文本和所述参考文本输入问答模型，获得答案文本，其中，所述问答模型基于多个样本对训练获得，所述样本对包括样本问句组和样本答案，所述样本问句组包括样本问句和样本参考语句，所述样本问句组携带有权重标签，所述权重标签基于所述样本参考语句的优先级以及所述样本参考语句与所述样本问句之间的相关性确定。

根据本说明书实施例的第二方面，提供了问答模型训练方法，应用于云侧设备，包括：

在样本集中获取目标样本对，其中，所述目标样本对为所述样本集中的任一样本对；

将所述目标样本对中的样本问句组输入问答模型，获得所述问答模型输出的预测答案；

根据所述预测答案、所述样本问句组携带的权重标签和所述目标样本对中的样本答案，计算模型损失值；

根据所述模型损失值对所述问答模型进行训练，直至达到模型训练停止条件，获得训练完成的所述问答模型；

将所述问答模型的模型参数返回至端侧设备。

根据本说明书实施例的第三方面，提供了另一种机器问答方法，应用于云测设备，包括：

接收端侧设备发送的问句文本和参考文本，其中，所述参考文本包含与所述问句文本相关联的知识信息；

将所述问句文本和所述参考文本输入问答模型，获得答案文本，并将所述答案文本返回至所述端侧设备，其中，所述问答模型基于多个样本对训练获得，所述样本对包括样本问句组和样本答案，所述样本问句组包括样本问句和样本参考语句，所述样本问句组携带有权重标签，所述权重标签基于所述样本参考语句的优先级以及所述样本参考语句与所述样本问句之间的相关性确定。

根据本说明书实施例的第四方面，提供了一种智能客服问答方法，包括：

接收前端用户发送的问句文本；

基于所述问句文本，确定参考文本，其中，所述参考文本包含与所述问句文本相关联的知识信息；

将所述问句文本和所述参考文本输入问答模型，获得目标答案文本，其中，所述问答模型基于多个样本对训练获得，所述样本对包括样本问句组和样本答案，所述样本问句组包括样本问句和样本参考语句，所述样本问句组携带有权重标签，所述权重标签基于所述样本参考语句的优先级以及所述样本参考语句与所述样本问句之间的相关性确定；

向所述前端用户反馈所述目标答案文本。

根据本说明书实施例的第五方面，提供了一种机器问答装置，包括：

获取模块，被配置为获取问句文本和参考文本，其中，所述参考文本包含与所述问句文本相关联的知识信息；

输入模块，被配置为将所述问句文本和所述参考文本输入问答模型，获得答案文本，其中，所述问答模型基于多个样本对训练获得，所述样本对包括样本问句组和样本答案，所述样本问句组包括样本问句和样本参考语句，所述样本问句组携带有权重标签，所述权重标签基于所述样本参考语句的优先级以及所述样本参考语句与所述样本问句之间的相关性确定。

根据本说明书实施例的第六方面，提供了一种计算设备，包括：

存储器和处理器；

所述存储器用于存储计算机可执行指令，所述处理器用于执行所述计算机可执行指令，该计算机可执行指令被处理器执行时实现上述机器问答方法的步骤。

根据本说明书实施例的第七方面，提供了一种计算机可读存储介质，其存储有计算机可执行指令，该指令被处理器执行时实现上述机器问答方法的步骤。

根据本说明书实施例的第八方面，提供了一种计算机程序，其中，当所述计算机程序在计算机中执行时，令计算机执行上述机器问答方法的步骤。

本说明书一个实施例实现了，获取问句文本和参考文本，其中，所述参考文本包含与所述问句文本相关联的知识信息；将所述问句文本和所述参考文本输入问答模型，获得答案文本，其中，所述问答模型基于多个样本对训练获得，所述样本对包括样本问句组和样本答案，所述样本问句组包括样本问句和样本参考语句，所述样本问句组携带有权重标签，所述权重标签基于所述样本参考语句的优先级以及所述样本参考语句与所述样本问句之间的相关性确定。

通过获取问句文本以及参考文本，从而便于基于与问句文本相关联的知识信息生成问句文本对应的答案文本，提升答案文本的准确度；问答模型基于包含权重标签以及样本答案的样本对训练获得，从而使问答模型具备对于权重进行分析的功能，进而可以提升基于问句文本和参考文本输出的答案文本的准确度和可控性。

附图说明

图1是本说明书一个实施例提供的一种机器问答方法的场景示意图；

图2是本说明书一个实施例提供的一种机器问答方法的流程图；

图3是本说明书一个实施例提供的一种问答模型训练方法的流程图；

图4是本说明书一个实施例提供的另一种机器问答方法的流程图；

图5是本说明书一个实施例提供的一种智能客服问答方法的处理过程流程图；

图6是本说明书一个实施例提供的一种机器问答装置的结构示意图；

图7是本说明书一个实施例提供的一种计算设备的结构框图。

具体实施方式

在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本说明书内涵的情况下做类似推广，因此本说明书不受下面公开的具体实施的限制。

在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本说明书一个或多个实施例范围的情况下，第一也可以被称为第二，类似地，第二也可以被称为第一。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

此外，需要说明的是，本说明书一个或多个实施例所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)，均为经用户授权或者经过各方充分授权的信息和数据，并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准，并提供有相应的操作入口，供用户选择授权或者拒绝。

首先，对本说明书一个或多个实施例涉及的名词术语进行解释。

q-doc相关性模型：query-doc相关性模型，可以计算query与doc之间相关性的模型。

FID模型：Fusion-in-Decodermodels模型，利用召回模型，在知识库中召回若干与给定的原文相关的文本，然后再将问题分别与原文以及相关文本进行拼接，拼接后的结果分别进行编码，再将编码的结果进行连接，把连接的结果给到解码层，由解码层生成答案。

目前，在用户与智能客服的全自动对话流程中，会存在机器无法回答问题或回复答案无法全面解决用户问题的情况。在该情况下，会利用多源信息，如商品属性信息、人人对话语料、商品评论等优质知识加以利用，进行统一的答案生成，用以实时的回复用户线上的问题，或供商家/企业优化现有的知识，提升机器人对话的质量，缓解人工客服的需求，更好更全面的解决用户问题，提升用户的满意度。与此同时，大量不同来源的知识的置信度和优先级是不同的，为实现答案的准确和输入知识的模型可控，本说明书的机器问答方法，通过融合多源知识权重解码，进行可控的答案生成，提升答案文本的准确度。

在本说明书中，提供了一种机器问答方法，本说明书同时涉及一种机器问答装置，一种计算设备，以及一种计算机可读存储介质，在下面的实施例中逐一进行详细说明。

参见图1，图1示出了根据本说明书一个实施例提供的一种机器问答方法的场景示意图，具体包括：

获取样本问句，即获取用户问题文本以及用户对话的上下文文本；将问题文本以及上下文文本作为样本问句，通过检索模块的检索引擎在知识库中检索与样本问句相关的知识信息，如，商家文档、商品/品类/属性、用户评论/日志等作为样本参考语句，确定样本参考语句对应的源信息，并基于源信息确定样本参考语句的优先级；将样本问句和样本参考语句输入至相关性模型，获得样本问句和样本参考语句之间的相关性；计算相关性与优先级的加权平均，获得权重标签；根据样本问句和样本参考语句生成样本问句组，并为样本问句组添加所述权重标签，具体为将样本问句与参考语句中的各知识信息分别拼接，得到多个样本问句组，并为各样本问句添加权重标签，如图1所示，基于用户问题和知识1进行拼接生成样本问句组，并为该样本问句组添加权重标签w；根据样本问句对应的样本答案和携带有权重标签的样本问句组，生成样本对；通过上述过程生成多个样本对组成样本集。

在样本集中获取目标样本对，其中，目标样本对为样本集中的任一样本对；将目标样本对中的样本问句组输入问答模型，获得问答模型输出的预测答案，具体为将样本问句组输入编码层，得到隐向量；对编码器得到的各隐向量进行拼接，并输入至解码层；解码层完成基于权重对文本中的词汇进行分配，即对文本进行词概率分布调整，得到问答模型输出的预测权重和预测问题答案；解码层接收编码层基于目标样本对获得的编码文本，从而在隐向量和注意力层的注意力权重中引入目标样本对的权重；根据预测问题答案和样本答案计算答案损失值，并基于问答模型输出的预测权重和编码层输出的目标样本对的权重标签计算权重损失值；根据权重损失值和答案损失值计算得到模型损失值，基于模型损失值对问答模型的模型参数进行调整，直至达到模型训练停止条件，得到训练完成的问答模型。

在获得训练完成的问答模型后，获取问句文本，并基于问句文本检索与问句文本相关的知识信息，生成参考文本；将问句文本与参考文本中的各知识信息分别进行拼接，获得多个待编码文本；将多个待编码文本分别输入至问答模型的编码层，获得各待编码文本对应的编码文本；拼接各编码文本，获得待解码文本；将待解码文本输入至所述问答模型的解码层，获得答案文本。

参见图2，图2示出了根据本说明书一个实施例提供的一种机器问答方法的流程图，具体包括以下步骤。

步骤202：获取问句文本和参考文本，其中，所述参考文本包含与所述问句文本相关联的知识信息。

其中，问句文本是指可生成对应的答案的文本，实际应用中，问句文本可以仅包含一个问题，或由问题与其上下文沟通的内容组成；参考文本是指与问句文本存在相关关系的文本，例如，问句文本为“衣服的尺码多少”，参考文本可以是商品详情页中的尺码信息；实际应用中参考文本中包含的是与问句文本相关的一个或多个知识信息，例如，参考文本可以是问句文本中商品的详情页信息、商品评论信息、历史对话信息等多维度的知识信息。

具体的，接收问句答案获取请求，响应于问句答案获取请求，获取问句文本和包含与问句文本相关联的知识信息的参考文本，以便后续基于问句文本和参考文本，获得问句文本对应的答案文本。

在本说明书一具体实施方式中，接收问句答案获取请求，获取问句文本“什么时间发货”，以及参考文本“发货历史记录”。

通过获取问句文本以及包含与问句文本相关联的知识信息的参考文本，以便后续基于问句文本和参考文本获得问句文本对应的答案文本。

在实际应用中，参考文本是基于对问题文本进行检索获得的，具体的，获取参考文本的方法可以包括：

确定所述问句文本对应的答案数据库；

基于所述问句文本在所述答案数据库中检索所述样本问句相关联的知识信息；

根据各知识信息生成参考文本。

其中，答案数据库是指存储有答案数据的数据库，实际应用中，答案数据库中的答案数据可以是历史会话记录、历史商品属性信息等等；基于问句文本在答案数据库中查找相关的知识信息，例如，问句文本为“商品A有几个颜色”，则知识信息可以是商品详情页、历史对话记录中与商品A相关的对话信息等。

具体的，对问句文本进行解析，确定问句文本包含的关键词或问句文本对应的语义；基于关键词或语义在答案数据库中检索与问句文本相关联的知识信息，作为参考文本。

在本说明书一具体实施方式中，在采购平台上，确定问句文本对应的数据库为采购记录数据库；基于问句文本“2月的采购数量是多少”，在采购记录库中检索与问句文本相关的知识信息；基于检出的知识信息生成问句文本的参考文本。

通过根据问句文本在答案数据库中检索与问句文本对应的参考文本，以便后续可以基于参考文本中的知识信息生成准确度更高的答案文本。

步骤204：将所述问句文本和所述参考文本输入问答模型，获得答案文本，其中，所述问答模型基于多个样本对训练获得，所述样本对包括样本问句组和样本答案，所述样本问句组包括样本问句和样本参考语句，所述样本问句组携带有权重标签，所述权重标签基于所述样本参考语句的优先级以及所述样本参考语句与所述样本问句之间的相关性确定。

实际应用中，在获得问句文本和参考文本后，可以将问句文本和参考文本输入至预先训练完成的问答模型，获得问答模型输出的答案文本。

其中，问答模型是指可以基于输入的问句文本输出问句文本对应的答案文本的神经网络模型；答案文本是指问句文本对应的答案，例如，问句文本为“衣服A的尺码？”，答案文本则可以为“L”。

问答模型可以基于多个样本对进行训练获得，其中，样本对是指包含样本问句组和样本答案的数据对；样本问句组是指由样本问句和样本参考语句生成的数据组；样本问句是指已预先确定对应答案的文本；样本答案是指样本文本对应的答案；样本参考语句是指包含与样本问句相关联的知识信息的文本；权重标签是指为样本问句和样本参考语句设置的相关性标签；样本参考语句的优先级是指样本参考语句中不同维度知识信息的优先级，例如，在商品评论信息和历史对话信息中，历史对话信息优先级更高；样本参考问句与样本问句之间的相关性是指样本参考问句与样本问句之间的关联程度。

具体的，将获得的问句文本和参考文本输入至训练完成的问答模型中，获得问答模型输出的问句文本对应的答案文本。

在实际应用中，问答模型可以是包含编码层和解码层的神经网络模型，例如，FID模型；具体的，将所述问句文本和所述参考文本输入问答模型，获得答案文本的方法可以包括：

将所述问句文本与所述参考文本中的各知识信息分别进行拼接，获得多个待编码文本；

将所述多个待编码文本分别输入至问答模型的编码层，获得各待编码文本对应的编码文本；

拼接各编码文本，获得待解码文本；

将所述待解码文本输入至所述问答模型的解码层，获得答案文本。

其中，待编码文本是指将问句文本与知识信息进行拼接，得到的文本；编码文本是指编码层对待编码文本进行编码处理得到的文本特征；待解码文本是指由编码层输出的各编码文本组成的文本。

具体的，将问句文本和参考文本中的知识信息分别进行拼接，得到各知识信息对应的待编码文本；将各待编码文本输入问答模型的编码层，得到编码层输出的各待编码文本对应的编码文本；对输出的各编码文本进行拼接，得到待解码文本；将待解码文本输出问答模型的解码层，获得问答模型输出的答案文本。

在本说明书一具体实施方式中，将问句文本a与参考文本中的知识信息1、知识信息2和知识信息3进行拼接，具体为，将问句文本a与知识信息1进行拼接，得到待编码文本1；将问句文本a与知识信息2进行拼接，得到待编码文本2；将问句文本a与知识信息3进行拼接，得到待编码文本3；将待编码文本1、待编码文本2和待编码文本3分别输入问答模型的编码层，获得各待编码文本对应的编码文本；将编码文本1、编码文本2和编码文本3进行拼接，得到待解码文本；将待解码文本输入问答模型的解码层，获得答案文本。

通过将问句文本和参考文本输入至预先基于样本对训练完成的问答模型中，从而可以得到问句文本对应的答案文本，提升获得的答案文本的准确度。

实际应用中，将所述问句文本和所述参考文本输入问答模型之前，还包括：

根据所述模型损失值对所述问答模型进行训练，直至达到模型训练停止条件，获得训练完成的所述问答模型。

其中，样本集是指由样本对组成的集合；目标样本对是指在样本集中随机选取的样本对；预测答案是指问答模型基于样本问句组输出的答案；模型损失值是指用于对问答模型的模型参数进行调整的损失值。

具体的，在样本集中任意选取目标样本对；将目标样本对中的样本问句组输入至问答模型，获得问答模型输出的预测答案；将预测答案、目标样本对中的样本答案以及样本问句组的权重标签计算模型损失值；根据模型损失值对问答模型进行训练，直至达到模型训练停止条件，得到训练完成的问答模型。

本说明书中为了提升生成的答案文本的准确度和可控性，可以基于答案损失值和权重损失值对问答模型的模型参数进行调整。

具体的，根据所述预测答案、所述样本问句组携带的权重标签和所述目标样本对中的样本答案，计算模型损失值之前，还包括：

确定所述问答模型输出的预测权重标签。

其中，预测权重标签是指由问答模型基于输入的样本问句组输出的权重标签。

相应地，根据所述预测答案、所述样本问句组携带的权重标签和所述目标样本对中的样本答案，计算模型损失值的方法可以包括：

基于所述目标样本对中的样本答案和所述预测答案，计算答案损失值；

根据所述预测权重标签和所述样本问句组携带的权重标签，计算权重损失值；

基于所述答案损失值和所述权重损失值，计算模型损失值。

其中，答案损失值是指基于问答模型输出的预测答案与样本对中包含样本答案计算得到的损失值；权重损失值是指基于问答模型输出的预设权重标签与样本对中样本问句组携带有的权重标签，计算得到损失值；在确定权重损失值和答案损失值后，可以计算权重损失值与答案损失值之间的加权平均数，作为模型损失值。

具体的，确定问答模型输出的预测答案以及样本文本中的样本答案，计算预测答案与样本答案之间的答案损失值；确定问答模型输出的预测权重标签和样本问句组的权重标签，计算预测权重标签与权重标签之间的权重损失值；计算权重损失值与答案损失值之间的加权平均数，得到模型损失值，其中，加权可以基于场景需求进行设定，本说明书对于加权的设定不做具体限定；基于模型损失值可以对问答模型的模型参数进行调整。

在本说明书一具体实施方式中，基于样本答案和预测答案计算得到答案损失值，基于预测权重标签和权重标签计算得到的权重损失值；计算答案损失值与权重损失值之间的加权平均数，其中，加权为答案损失值占60％，权重损失值占40％。

通过根据权重损失值和答案损失值计算模型损失值，进而可以基于模型损失值调整问答模型的模型参数，提升问答模型输出的答案文本的准确性和可控性。

实际应用中，在样本集中获取目标样本对之前，还包括：

获取样本问句、样本参考语句以及所述样本问句对应的样本答案，其中，所述样本参考语句包含与所述样本问句相关联的知识信息；

确定所述样本参考语句对应的源信息，并基于所述源信息确定所述样本参考语句的优先级；

确定所述样本问句和所述样本参考语句之间的相关性；

根据所述优先级和所述相关性确定权重标签；

根据所述样本问句和所述样本参考语句生成样本问句组，并为所述样本问句组添加所述权重标签；

基于所述样本答案和携带有所述权重标签的样本问句组，生成样本对。

其中，源信息是指样本参考语句对应的数据来源信息；在样本参考语句中包含与样本文本相关联的一个或多个知识信息，不同的知识信息可以对应不同的源信息，例如，知识信息1对应的源信息为“商品评价”，知识2对应的源信息为“历史会话记录”。

具体的，基于样本集生成请求，获取样本问句、样本参考语句以及样本问句对应的样本答案，其中，样本参考语句包含与样本问句相关联的知识信息；获取样本参考语句对应的源信息，并基于源信息确定样本参考语句的优先级；确定样本问句和样本参考语句之间的相关性；根据优先级和相关性确定权重标签；根据样本问句和样本参考语句生成样本问句组，并为样本问句组添加权重标签；基于样本答案和携带有权重标签的样本问句组，生成样本对；基于上述步骤生成一个或多个样本对，组成样本集。

在本说明书一具体实施方式中，响应于样本集生成请求，获取样本问句、样本参考语句以及样本问句对应的样本答案，其中，样本参考语句包含与样本问句相关联的知识信息1和知识信息2；确定知识信息1对应的源信息1和知识信息2对应的源信息2；基于源信息1和源信息2确定知识信息1的优先级和知识信息2的优先级；计算样本问句和样本参考语句之间的相关性分数；根据优先级和相关性分数计算权重标签；根据样本问句和样本参考语句生成样本问句组，并为样本问句组添加权重标签；组合样本答案和携带有权重标签的样本问句组，获得目标样本对；将目标样本对添加至样本集。

通过样本参考语句和权重标签生成样本对，从而便于后续基于权重标签和样本参考语句对问答模型进行训练，提升问答模型生成答案文本的准确度。

在实际应用中，为各样本问句均生成对应的样本参考语句效率较低，故样本参考语句也可以通过基于样本问句进行检索得到；

具体的，所述获取样本参考语句的方法可以包括：

确定所述样本问句对应的答案数据库；

基于所述样本问句在所述答案数据库中检索所述样本问句对应的样本参考语句。

具体的，响应于样本集生成请求，获取样本问句，样本问句可以是在历史会话记录中截取的，或采用问句模型生成的，本说明书不做具体限定；基于样本问句在答案数据库中检索与样本问句对应的知识信息；基于检索到的各维度的知识信息生成样本参考语句。

在本说明书一具体实施方式中，在采购平台上，确定样本问句对应的数据库为采购记录数据库；基于样本问句“2月的采购数量是多少”，在采购记录库中检索与样本语句相关的知识信息；基于检出的知识信息生成样本语句的样本参考语句。

通过基于样本问句在答案数据库中检索知识信息，提升了获得样本参考语句效率，进而提升了生成样本集的效率。

在实际应用中，样本问句与样本参考语句之间的相关性可以通过模型进行计算；具体的，

确定所述样本问句和所述样本参考语句之间的相关性的方法可以包括：

将所述样本问句和所述样本参考语句输入相关性计算模型，获得所述相关性计算模型输出的相关性。

其中，相关性计算模型是指可以基于输入的两个数据，输出对应的相关性的模型。

例如，将样本问句和样本参考语句输入至q-doc相关性模型中，得到q-doc相关性模型输出的相关性分数。

通过相关性计算模型计算样本问句和样本参考语句之间的相关性，从而用于生成样本问句的权重标签，进而后续可以基于权重标签计算权重损失值，从而提升问答模型输出的答案文本的可控性。

参见图3，图3示出了根据本说明书一个实施例提供的一种问答模型训练方法，应用于云侧设备，具体包括以下步骤。

步骤302：在样本集中获取目标样本对，其中，所述目标样本对为所述样本集中的任一样本对。

步骤304：将所述目标样本对中的样本问句组输入问答模型，获得所述问答模型输出的预测答案。

步骤306：根据所述预测答案、所述样本问句组携带的权重标签和所述目标样本对中的样本答案，计算模型损失值。

步骤308：根据所述模型损失值对所述问答模型进行训练，直至达到模型训练停止条件，获得训练完成的所述问答模型。

步骤310：将所述问答模型的模型参数返回至端侧设备。

本说明书的问答模型训练方法，应用于云侧设备，在样本集中获取目标样本对，其中，所述目标样本对为所述样本集中的任一样本对；将所述目标样本对中的样本问句组输入问答模型，获得所述问答模型输出的预测答案；根据所述预测答案、所述样本问句组携带的权重标签和所述目标样本对中的样本答案，计算模型损失值；根据所述模型损失值对所述问答模型进行训练，直至达到模型训练停止条件，获得训练完成的所述问答模型；将所述问答模型的模型参数返回至端侧设备。通过样本答案和权重标签计算模型损失值，从而在答案文本生成准确度以及可控性两个方面提升问答模型的文本生成效果；并且，端侧设备可以通过调用云测设备上训练完成的问答模型的模型参数，从而实现对问答模型的调用，避免占用端侧设备的计算资源进行模型训练，节省了端侧设备的计算资源。

参见图4，图4示出了根据本说明书一个实施例提供的另一种机器问答方法的流程图，应用于云测设备，具体包括以下步骤。

步骤402：接收端侧设备发送的问句文本，并基于所述问句文本获取参考文本，其中，所述参考文本包含与所述问句文本相关联的知识信息。

具体的，可以接收端侧设备发送的问句文本，再由云测设备基于问句文本检索参考文本；或接收端侧设备发送的文本问句和端侧设备基于问句文本检索得到的参考文本。

步骤404：将所述问句文本和所述参考文本输入问答模型，获得答案文本，并将所述答案文本返回至所述端侧设备，其中，所述问答模型基于多个样本对训练获得，所述样本对包括样本问句组和样本答案，所述样本问句组包括样本问句和样本参考语句，所述样本问句组携带有权重标签，所述权重标签基于所述样本参考语句的优先级以及所述样本参考语句与所述样本问句之间的相关性确定。

本说明书应用于云测设备的机器问答方法，接收端侧设备发送的问句文本和参考文本，其中，所述参考文本包含与所述问句文本相关联的知识信息；将所述问句文本和所述参考文本输入问答模型，获得答案文本，并将所述答案文本返回至所述端侧设备，其中，所述问答模型基于多个样本对训练获得，所述样本对包括样本问句组和样本答案，所述样本问句组包括样本问句和样本参考语句，所述样本问句组携带有权重标签，所述权重标签基于所述样本参考语句的优先级以及所述样本参考语句与所述样本问句之间的相关性确定。

通过云测设备接收端侧设备发送的问句文本和参考文本，并输入至问答模型，获得问答模型输出的答案文本；将生成的答案文本返回至端侧设备展示，避免展示端侧设备的资源进行问答模型的应用，节省了端侧设备的计算资源。

下述结合附图5，以本说明书提供的机器问答方法在智能客服问答的应用为例，对所述机器问答方法进行进一步说明。其中，图5示出了本说明书一个实施例提供的一种智能客服问答方法的处理过程流程图，具体包括以下步骤。

步骤502：接收前端用户发送的问句文本。

步骤504：基于所述问句文本，确定参考文本，其中，所述参考文本包含与所述问句文本相关联的知识信息。

步骤506：将所述问句文本和所述参考文本输入问答模型，获得目标答案文本，其中，所述问答模型基于多个样本对训练获得，所述样本对包括样本问句组和样本答案，所述样本问句组包括样本问句和样本参考语句，所述样本问句组携带有权重标签，所述权重标签基于所述样本参考语句的优先级以及所述样本参考语句与所述样本问句之间的相关性确定。

步骤508：向所述前端用户反馈所述目标答案文本。

本说明书的智能客服问答方法，接收前端用户发送的问句文本；基于所述问句文本，确定参考文本，其中，所述参考文本包含与所述问句文本相关联的知识信息；将所述问句文本和所述参考文本输入问答模型，获得目标答案文本，其中，所述问答模型基于多个样本对训练获得，所述样本对包括样本问句组和样本答案，所述样本问句组包括样本问句和样本参考语句，所述样本问句组携带有权重标签，所述权重标签基于所述样本参考语句的优先级以及所述样本参考语句与所述样本问句之间的相关性确定；向所述前端用户反馈所述目标答案文本。通过获取问句文本以及参考文本，从而便于基于与问句文本相关联的知识信息生成问句文本对应的答案文本，提升答案文本的准确度；问答模型基于包含权重标签以及样本答案的样本对训练获得，从而使问答模型具备对于权重进行分析的功能，进而可以提升基于问句文本和参考文本输出的答案文本的准确度和可控性。

与上述方法实施例相对应，本说明书还提供了机器问答装置实施例，图6示出了本说明书一个实施例提供的一种机器问答装置的结构示意图。如图6所示，该装置包括：

获取模块602，被配置为获取问句文本和参考文本，其中，所述参考文本包含与所述问句文本相关联的知识信息；

输入模块604，被配置为将所述问句文本和所述参考文本输入问答模型，获得答案文本，其中，所述问答模型基于多个样本对训练获得，所述样本对包括样本问句组和样本答案，所述样本问句组包括样本问句和样本参考语句，所述样本问句组携带有权重标签，所述权重标签基于所述样本参考语句的优先级以及所述样本参考语句与所述样本问句之间的相关性确定。

可选地，所述装置还包括训练模块，被配置为：

可选地，所述训练模块，进一步被配置为：

确定所述问答模型输出的预测权重标签；

相应地，根据所述预测答案、所述样本问句组携带的权重标签和所述目标样本对中的样本答案，计算模型损失值，包括：

基于所述答案损失值和所述权重损失值，计算模型损失值。

可选地，所述训练模块，进一步被配置为：

确定所述样本问句和所述样本参考语句之间的相关性；

根据所述优先级和所述相关性确定权重标签；

可选地，所述训练模块，进一步被配置为：

确定所述样本问句对应的答案数据库；

可选地，所述训练模块，进一步被配置为：

可选地，所述获取模块602，进一步被配置为：

确定所述问句文本对应的答案数据库；

根据各知识信息生成参考文本。

可选地，所述输入模块604，进一步被配置为：

拼接各编码文本，获得待解码文本；

本说明书的机器问答装置，获取模块，被配置为获取问句文本和参考文本，其中，所述参考文本包含与所述问句文本相关联的知识信息；输入模块，被配置为将所述问句文本和所述参考文本输入问答模型，获得答案文本，其中，所述问答模型基于多个样本对训练获得，所述样本对包括样本问句组和样本答案，所述样本问句组包括样本问句和样本参考语句，所述样本问句组携带有权重标签，所述权重标签基于所述样本参考语句的优先级以及所述样本参考语句与所述样本问句之间的相关性确定。

上述为本实施例的一种机器问答装置的示意性方案。需要说明的是，该机器问答装置的技术方案与上述的机器问答方法的技术方案属于同一构思，机器问答装置的技术方案未详细描述的细节内容，均可以参见上述机器问答方法的技术方案的描述。

图7示出了根据本说明书一个实施例提供的一种计算设备700的结构框图。该计算设备700的部件包括但不限于存储器710和处理器720。处理器720与存储器710通过总线730相连接，数据库750用于保存数据。

计算设备700还包括接入设备740，接入设备740使得计算设备700能够经由一个或多个网络760通信。这些网络的示例包括公用交换电话网(PSTN，PublicSwitchedTelephoneNetwork)、局域网(LAN，LocalAreaNetwork)、广域网(WAN，WideAreaNetwork)、个域网(PAN，PersonalAreaNetwork)或诸如因特网的通信网络的组合。接入设备740可以包括有线或无线的任何类型的网络接口(例如，网络接口卡(NIC，networkinterfacecontroller))中的一个或多个，诸如IEEE802.11无线局域网(WLAN，WirelessLocalAreaNetwork)无线接口、全球微波互联接入(Wi-MAX，WorldwideInteroperabilityforMicrowaveAccess)接口、以太网接口、通用串行总线(USB，UniversalSerialBus)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC，NearFieldCommunication)。

在本说明书的一个实施例中，计算设备700的上述部件以及图7中未示出的其他部件也可以彼此相连接，例如通过总线。应当理解，图7所示的计算设备结构框图仅仅是出于示例的目的，而不是对本说明书范围的限制。本领域技术人员可以根据需要，增添或替换其他部件。

计算设备700可以是任何类型的静止或移动计算设备，包括移动计算机或移动计算设备(例如，平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如，智能手机)、可佩戴的计算设备(例如，智能手表、智能眼镜等)或其他类型的移动设备，或者诸如台式计算机或个人计算机(PC，PersonalComputer)的静止计算设备。计算设备700还可以是移动式或静止式的服务器。

其中，处理器720用于执行如下计算机可执行指令，该计算机可执行指令被处理器执行时实现上述机器问答方法的步骤。

上述为本实施例的一种计算设备的示意性方案。需要说明的是，该计算设备的技术方案与上述的机器问答方法的技术方案属于同一构思，计算设备的技术方案未详细描述的细节内容，均可以参见上述机器问答方法的技术方案的描述。

本说明书一实施例还提供一种计算机可读存储介质，其存储有计算机可执行指令，该计算机可执行指令被处理器执行时实现上述机器问答方法的步骤。

上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是，该存储介质的技术方案与上述的机器问答方法的技术方案属于同一构思，存储介质的技术方案未详细描述的细节内容，均可以参见上述机器问答方法的技术方案的描述。

本说明书一实施例还提供一种计算机程序，其中，当所述计算机程序在计算机中执行时，令计算机执行上述机器问答方法的步骤。

上述为本实施例的一种计算机程序的示意性方案。需要说明的是，该计算机程序的技术方案与上述的机器问答方法的技术方案属于同一构思，计算机程序的技术方案未详细描述的细节内容，均可以参见上述机器问答方法的技术方案的描述。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

所述计算机指令包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，RandomAccessMemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据专利实践的要求进行适当的增减，例如在某些地区，根据专利实践，计算机可读介质不包括电载波信号和电信信号。

需要说明的是，对于前述的各方法实施例，为了简便描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本说明书实施例并不受所描述的动作顺序的限制，因为依据本说明书实施例，某些步骤可以采用其它顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定都是本说明书实施例所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其它实施例的相关描述。

以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节，也不限制该发明仅为所述的具体实施方式。显然，根据本说明书实施例的内容，可作很多的修改和变化。本说明书选取并具体描述这些实施例，是为了更好地解释本说明书实施例的原理和实际应用，从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。

Claims

1.一种机器问答方法，包括：

2.如权利要求1所述的方法，将所述问句文本和所述参考文本输入问答模型之前，还包括：

3.如权利要求2所述的方法，根据所述预测答案、所述样本问句组携带的权重标签和所述目标样本对中的样本答案，计算模型损失值之前，还包括：

确定所述问答模型输出的预测权重标签；

基于所述答案损失值和所述权重损失值，计算模型损失值。

4.如权利要求2所述的方法，在样本集中获取目标样本对之前，还包括：

确定所述样本问句和所述样本参考语句之间的相关性；

根据所述优先级和所述相关性确定权重标签；

5.根据权利要求4所述的方法，所述获取样本参考语句，包括：

确定所述样本问句对应的答案数据库；

6.如权利要求4所述的方法，确定所述样本问句和所述样本参考语句之间的相关性，包括：

7.如权利要求1所述的方法，获取参考文本，包括：

确定所述问句文本对应的答案数据库；

根据各知识信息生成参考文本。

8.如权利要求1所述的方法，将所述问句文本和所述参考文本输入问答模型，获得答案文本，包括：

拼接各编码文本，获得待解码文本；

9.一种问答模型训练方法，应用于云侧设备，包括：

将所述问答模型的模型参数返回至端侧设备。

10.一种机器问答方法，应用于云侧设备，包括：

接收端侧设备发送的问句文本，并基于所述问句文本获取参考文本，其中，所述参考文本包含与所述问句文本相关联的知识信息；

11.一种智能客服问答方法，包括：

接收前端用户发送的问句文本；

向所述前端用户反馈所述目标答案文本。

12.一种机器问答装置，包括：

13.一种计算设备，包括：

存储器和处理器；

所述存储器用于存储计算机可执行指令，所述处理器用于执行所述计算机可执行指令，该计算机可执行指令被处理器执行时实现权利要求1至11任意一项所述方法的步骤。

14.一种计算机可读存储介质，其存储有计算机可执行指令，该计算机可执行指令被处理器执行时实现权利要求1至11任意一项所述方法的步骤。