CN115129829A

CN115129829A - 问答计算方法、服务器及存储介质

Info

Publication number: CN115129829A
Application number: CN202110326248.7A
Authority: CN
Inventors: 邓扬; 李雅亮; 丁博麟
Original assignee: Alibaba Singapore Holdings Pte Ltd
Current assignee: Alibaba Innovation Co
Priority date: 2021-03-26
Filing date: 2021-03-26
Publication date: 2022-09-30

Abstract

本申请实施例提供一种问答计算方法、服务器及存储介质。在本实施例中，为针对对象发起的用户问题进行自动问答计算时，可根据用户问题以及对象的描述信息，计算答案编码特征，并根据用户问题以及用户的历史数据计算用户的角色偏好特征，进而可综合考虑多种不同维度的数据进行自动问答计算，以匹配得到符合用户个性化需求的答案。基于这种实施方式，可充分利用对象的描述信息以及用户的历史数据，提高自动问答计算结果的有效性，有利于满足用户实际的提问需求。

Description

问答计算方法、服务器及存储介质

技术领域

本申请涉及人工智能技术领域，尤其涉及一种问答计算方法、服务器及存储介质。

背景技术

随着人工智能技术的发展，智能问答逐渐走入人们的生活。用户可通过终端设备向问答平台发起问题咨询，问答平台可为用户咨询的问题匹配合适的答案并返回给用户。例如，在电子商务场景中，为提供更良好的网上购物体验，电子商务平台提供了产品问题解答(Product Question Answering，PQA)服务，PQA服务可以自动生成产品相关的答案，并充当智能在线购物助手以改善客户购物体验。

在现有技术中，问答平台通常从给定问题的相关评论中识别用户的意见来提供“是或否”的答案，或者基于给定问题和评论片段之间的语义相关性给出答案。但是，这种问答计算方式给出的答案未考虑用户的实际需求，无法针对用户问题给出有效的答案。因此，有待提出一种解决方案。

发明内容

本申请实施例的多个方面提供一种问答计算方法、服务器及存储介质，用以提高问答计算结果的有效性，满足用户真实的问答计算需求。

本申请实施例提供一种问答计算方法，包括：接收终端设备发送的用户问题，所述用户问题由用户针对对象发起；根据所述用户问题以及所述对象的描述信息，计算所述用户问题对应的答案编码特征；根据所述用户的历史数据，计算所述用户的角色偏好特征；利用所述答案编码特征以及所述角色偏好特征，计算所述用户问题对应的个性化答案。

本申请实施例还提供一种问答计算方法，包括：展示第一界面，所述第一界面包括对象的至少一个提问入口；响应用户发出的提问入口触发操作，展示与被触发提问入口适配的问答界面；通过所述问答界面获取用户针对所述对象发起的用户问题，并将所述用户问题发送给服务器，以供所述服务器根据所述用户问题、所述对象的描述信息以及所述用户的历史数据确定所述用户问题的个性化答案。

本申请实施例还提供一种服务器，包括：存储器、处理器以及通信组件；所述存储器，用于存储一条或多条计算机指令；所述处理器，用于执行一条或多条计算机指令，以用于执行本申请实施例提供的问答计算方法。

本申请实施例还提供一种终端设备，包括：存储器、处理器以及通信组件；所述存储器，用于存储一条或多条计算机指令；所述处理器，用于执行一条或多条计算机指令，以用于执行本申请实施例提供的问答计算方法。

本申请实施例还提供一种存储有计算机程序的计算机可读存储介质，所述计算机程序被执行时能够实现本申请实施例提供方法中的步骤。

在本申请实施例中，为针对对象发起的用户问题进行自动问答计算时，可根据用户问题以及对象的描述信息，计算答案编码特征，并根据用户问题以及用户的历史数据计算用户的角色偏好特征，进而可综合考虑多种不同维度的数据进行自动问答计算，以匹配得到符合用户个性化需求的答案。基于这种实施方式，可充分利用对象的描述信息以及用户的历史数据，提高自动问答计算结果的有效性，有利于满足用户实际的提问需求。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为本申请一示例性实施例提供的一种问答计算系统的结构示意图；

图2为本申请一示例性实施例提供的个性化答案生成模型的结构示意图；

图3为本申请一示例性实施例提供的一种问答计算方法的方法流程图；

图4为本申请另一示例性实施例提供的一种问答计算方法的方法流程图；

图5为本申请另一示例性实施例提供的一种服务器的结构示意图；

图6为本申请一示例性实施例提供的一种终端设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在一些应用场景中，存在问答计算需求。现有技术中，满足问答计算需求的方式通常是将用户问题和已有问题进行匹配，找到与用户问题匹配的已有问题，并将该已有问题对应的答案返回给用户。或者，从给定问题的相关评论中识别用户的评论来提供“是或否”的答案。或者，基于给定问题和评论片段之间的语义相关性给出答案。但是，这种问答计算方式的答案有效性较低。例如，针对同一产品而言，用户1可能更希望在答案中获取产品的价格信息，用户2可能更希望在答案中获取产品的质量信息，用户3可能更希望在答案中获取产品的重量信息。若不考虑用户的实际需求而给出统一的答案，则用户无法从答案中获取有效的信息。

针对上述技术问题，本申请的一些示例性实施例提供了一种解决方案，以下部分将结合附图进行详细说明。

图1为本申请一示例性实施例提供的一种问答计算系统的结构示意图。如图1所示，该问答计算系统10包括：终端设备11和服务器12。

终端设备11与服务器12之间可以是无线或有线网络连接。在本实施例中，若终端设备11通过移动网络与服务器12通信连接，该移动网络的网络制式可以为2G(GSM)、2.5G(GPRS)、3G(WCDMA、TD-SCDMA、CDMA2000、UTMS)、4G(LTE)、4G+(LTE+)、5G、WiMax等中的任意一种。

终端设备11可以是智能手机、平板电脑、个人电脑、穿戴设备等。终端设备11可以是一台或多台。其中，终端设备11通常包括至少一个处理单元、至少一个存储器以及显示器。处理单元和存储器的数量取决于终端设备11的配置和类型。

显示器可以包括屏幕，主要用于显示各类信息。可选地，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。该触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与该触摸或滑动操作相关的持续时间和压力等信息。

存储器可以包括易失性的，例如RAM，也可以包括非易失性的，例如只读存储器(Read-Only Memory，ROM)、闪存等，或者也可以同时包括两种类型。存储器内通常存储有操作系统(Operating System，OS)、一个或多个应用程序，也可以存储有程序数据等。

除了处理单元、存储器以及显示器之外，终端设备11还包括一些基本配置，例如网卡芯片、IO总线、音视频组件等。可选地，终端设备11还可以包括一些外围设备，例如键盘、鼠标、输入笔、打印机等。这些外围设备在本领域中是众所周知的，在此不做赘述。

在本实施例中，终端设备11主要用于在人机交互过程中，获取用户针对对象发起的用户问题，并将用户问题发送给服务器12。根据人机交互场景以及终端设备11实现形态的不同，终端设备11与用户进行人机交互的方式也会有所不同。通常，终端设备11可向用户提供人机交互界面、语音输入接口等多种形式的人机交互接口。用户需要提问时，可通过终端设备11提供的人机交互接口向终端设备11输入用户问题。

在一些应用场景中，终端设备11可以向用户提供第一界面作为人机交互界面，该人机交互界面的实现形态可以是网页、或者应用页面，或者窗口等。为了便于用户针对不同类别的问题进行提问，该第一界面包括至少一个与问题类别对应的提问入口。

例如，在电商平台提供的商品页面，可展示一商品提问入口，用户可根据提问需求，触发该至少一个提问入口以发起提问请求。响应用户发出的提问入口触发操作，终端设备11展示与被触发提问入口适配的问答界面。用户可在该问答界面上输入需要咨询的问题(简称为用户问题)，终端设备11获取用户问题之后，将用户问题发送至服务器12，以供服务器12为该用户问题匹配答案并返回。终端设备11可在接收到服务器12返回的该用户问题的答案后，将该答案输出至该问答界面，以供用户查看。

在问答计算系统10中，服务器12主要面向终端设备11提供问答计算服务，例如接收终端设备11发送的用户问题，为该用户问题匹配答案并将匹配到的答案返回给终端设备11。服务器12可以是任何可提供计算服务，能够响应服务请求并进行处理的设备，例如可以是常规服务器、云服务器、云主机、虚拟中心等。服务器12的构成主要包括处理器、硬盘、内存、系统总线等，和通用的计算机架构类似。

在本实施例中，服务器12接收终端设备11发送的用户问题之后，可确定用户问题关联的对象、该对象的至少一个关联事实以及发起用户问题的用户的历史数据。在计算用户问题对应的答案时，服务器12可根据该用户问题以及该对象的描述信息，计算该用户问题对应的答案编码特征，并根据该用户的历史数据，计算该用户的角色偏好特征。

其中，对象，可实现为实体对象，例如有形的商品、物品等；或者，可实现为虚拟对象，例如电子书、音视频、电子游戏、网络软件等；或者，还可实现为服务类对象，例如即时配送服务、外卖服务、家政服务、广告服务、云计算服务等，本实施例包含但不限于此。

其中，对象的描述信息，又可称为支持事实(supporting facts)，通常包括该对象的产品说明信息、属性信息、用户对产品的评论信息中的至少一种。在描述对象时，可从对象的多个方面(aspect)对对象进行描述，因此，对象的描述信息可包括多个方面的描述信息片段。例如，针对相机这一对象而言，其描述信息片段可包括：镜头参数、品牌、重量、焦距等不同方面的描述信息。针对智能手机这一对象而言，其描述信息片段可包括：相机参数、声音、配置、价格等不同方面的描述信息。

其中，用户的历史数据，通常指的是用户生成的内容(user-generated content，UGC)，包括但不限于用户在历史时间段发布的针对对象的评论、针对对象的提问以及针对其他用户的提问给出的答复，本实施例不做限制。基于用户的历史数据，可分析用户对对象某一或者某些方面的关注偏好。例如，可根据用户1的历史数据中大量对对象重量的评论数据，分析出用户1关注对象的重量；可根据用户2的历史数据中大量对对象的价格的评论数据，分析出用户2更关注对象的价格等等。

在本实施例中，服务器12可获取大量用户的历史数据以及对象的描述信息，在获取到用户问题后，服务器12可基于信息检索(Information Retrieval，IR)系统从大量的历史数据以及描述信息中，检索出与用户问题关联的历史数据以及对象的描述信息。以下实施例记载的历史数据以及描述信息，指的是IR系统检索出的与用户问题关联的历史数据和描述信息，后续不再赘述。

在本实施例中，获取到历史数据对应的文本或者描述信息对应的文本后，可对文本进行分块，得到文本片段。例如，可将历史数据对应的文本或描述信息对应的文本分割成设定长度的片段；或者，可按照句子的长度，将历史数据对应的文本或者描述信息对应的文本分割为多个句子，每个句子对应一个片段。

其中，对对象的描述信息进行分割得到的数据片段可表达为：F＝{f1，f2，...，fk}。

其中，对用户的历史数据片段进行分割得到的数据片段可表达为：H＝{h1，h2，...，hk}。

其中，服务器12根据用户问题以及对象的描述信息，计算出的用户问题对应的答案编码特征的操作，可基于文本特征提取算法实现。例如，word2vec算法、GloVe算法、fasttext算法或者基于注意力机制的特征提取算法，本实施例不做限制。用户问题对应的答案编码特征，不受用户个性化信息的影响，可用于计算出普适性较高的答案。

其中，服务器12根据用户的历史数据，计算用户的角色偏好特征的操作，可基于人工神经网络(Artificial Neural Networks)模型实现。例如可包括但不限于：深度神经网络(Deep Neural Networks)、循环神经网络(Recurrent Neural Networks)模型、递归神经网络(Recursive Neural Networks)、卷积神经网络(Convolutional Neural Networks)、图卷积神经网络(Graph Convolutional Network,GCN)以及深度生成模型(DeepGenerative Models)中的任意一种，或者上述一种或者多种深度学习模型变形得到的模型，本实施例不做限制。

接下来，服务器12可利用计算得到的答案编码特征以及该角色偏好特征，计算该用户问题对应的个性化答案。

其中，利用答案编码特征以及角色偏好特征，计算用户问题对应的个性化答案时，可基于回归模型，计算上述多种特征影响下的词表分布概率，并根据词表分布概率，确定答案包含的具体词汇。此部分将在后续实施例中进行详细介绍，此处不做主赘述。

图1对服务器12针对不同用户生成的个性化答案进行了示意，如图1所示，基于用户1的历史数据分析得到用户偏好关注手机的拍照性能时，可在用户针对手机发出性能相关的提问时，为用户生成手机拍照性能相关的答案。基于用户2的历史数据分析得到用户偏好关注手机的游戏性能时，可在用户针对手机发出性能相关的提问时，为用户生成手机运行游戏时的性能表现相关的答案。

在本实施例中，服务器为针对对象发起的用户问题进行自动问答计算时，可根据用户问题以及对象的描述信息，计算答案编码特征，并根据用户问题以及用户的历史数据计算用户的角色偏好特征，进而可综合考虑多种不同维度的数据进行自动问答计算，以匹配得到符合用户个性化需求的答案。基于这种实施方式，可充分利用对象的描述信息以及用户的历史数据，提高自动问答计算结果的有效性，有利于满足用户实际的提问需求。

在一些示例性的实施例中，服务器12可基于个性化答案生成(PersonalizedAnswer Generation,PAGE)模型生成个性化的答案。

如图2所示，PAGE模型包括：

基础编码器-解码器模块(Basic Encoder-decoder Architecture，BEDA)，用于生成不具个性化的通用答案，以下简称BEDA。

角色历史数据合并模块(Persona History Incorporation，PHI)，用于将用户的历史数据作为知识级用户偏好建模的外部知识，以下简称PHI。

角色偏好建模模块(Persona Preference Modeling，PPM)，用于采用主题模型来捕获方面级别的用户偏好，并动态提供基于用户偏好的角色词表，以下简称PPM。

角色信息汇总模块(Persona Information Summarizer，PIS)，用于总结生成个性化答案的多视角的用户偏好信息，并基于多视角的用户偏好信息生成个性化答案，以下简称PIS。

接下来，将结合图2所示的PAGE模型，对本申请实施例提供的问答计算方法进行进一步示例性说明。

在本实施例中，预测用户问题对应的答案，可基于一个轮次的预测操作或者多个轮次的预测操作。在一些情况下，答案包含一个词汇，此时需要一个轮次的预测操作即可得到答案。在另一些情况下，答案可包含多个词汇，此次需要多个轮次的预测操作，每个预测轮次可预测得到一个词汇，多个预测轮次预测得到的词汇前后连接即可得到完整的答案。其中，每一个轮次的词汇预测操作算法具有一定的相似性，以下将以任一轮次(即第t轮次)的预测操作为例进行示例性说明。

可选地，服务器12在根据用户问题以及对象的描述信息，计算该用户问题对应的答案编码特征时，可根据用户问题与描述信息片段之间的关联特征以及用户问题与已有的答案信息，计算当前轮次的答案词特征。其中，若当前预测轮次并非为第一个预测轮次，则可该已有答案可包括：当前轮次的前一轮次预测的答案，即第t-1轮次输出的答案；若当前预测轮次为第一个预测轮次，则已有答案可包括：当前轮次的答案指代信息。即，若已有答案为空，则可采用指代信息(例如答案的指代符号)作为已有答案，以便于后续计算。

计算答案编码特征时，服务器12可计算用户问题与该对象的描述信息之间的关联特征，作为描述信息的事实表达，并可计算用户问题与已有答案之间的关联特征，作为当前预测轮次的问题编码特征。

接下来，服务器12可根据该描述信息的事实表达与该当前预测轮次的问题编码特征之间的关联特征，确定当前轮次的答案编码特征。

上述实施例记载的计算描述信息的事实表达的操作，可基于BEDA中的自注意力编码器层以及双向注意力(Bi-Attention)编码器层实现。

可选地，服务器12可将用户问题与描述信息片段输入BEDA，在自注意力编码器层中，获取该用户问题的自注意力特征以及该描述信息片段的注意力特征。其中，自注意力特征可基于多头注意力(MultiHead)算法进行计算。该计算过程可采用以下公式进行表达：

C*＝MultiHead(X*，X*，X*) (1)

O*＝LayerNorm(FFN(C*)+X*) (2)

其中，*∈{q，f1，f2，...，fk}，LayerNorm()表示归一化层的计算，FFN()表示前向反馈网络的计算。MultiHead()表示多头注意力计算。C*用于表示中间计算结果，O*用于表示自注意力编码器层的输出。

其中，*＝q时，X_q表示输入的用户问题的文本，O_q表示自注意力编码器层输出的用户问题的自注意力特征。

其中，*＝fk时，X_fk表示输入的描述信息片段的文本，O_fk表示自注意力编码器层输出的描述信息片段fk的自注意力特征。

接下来，在双向注意力编码器层中，可计算该用户问题的自注意力特征与描述信息的自注意力特征的双向注意力特征，作为该描述信息的事实表达。其中，该描述信息的事实表达用于表达用户问题与描述信息片段之间的深层关联关系。

以描述信息中的任一描述信息片段为例，计算双向注意力特征时，首先可计算该用户问题的自注意力特征与该描述信息片段的自注意力特征的相似性，并基于该相似性，确定该用户问题的注意力权重以及该描述信息片段的注意力权重。

其中，该相似性可采用相似性矩阵进行表达。以第k个描述信息片段fk为例，计算用户问题的自注意力特征与描述信息片段的自注意力特征的相似性的过程，可如以下公式所示：

其中ω_U∈R^3mh×1，ω_U是可训练的权重向量，o表示元素乘法，[；]表示串联运算，m表示词向量的维度、R表示矩阵维度。U_fk∈R^Lq×Lf，其中，Lq表示用户问题q的句子长度，Lf表示描述信息片段f的句子长度。

其中，基于相似性矩阵计算注意力权重的方式可参考以下公式所示：

A_fk＝softmax(U_fk) (4-1)

其中，A_fk和B_fk是行和列标准化的相似性向量，A_fk为用户问题对描述信息片段fk的注意力权重，B_fk为描述信息片段fk对用户问题的注意权重，softmax()表示回归计算。

基于前述计算得到的注意力权重，可对用户问题以及描述信息片段进行加权计算，得到加权后的用户问题以及描述信息片段，如以下公式所示：

其中，

表示加权后的用户问题；

表示加权后的描述信息片段fk。

接下来，将加权后的用户问题以及描述信息片段进行串联，得到描述信息的事实表达，如以下公式所示：

其中，BiAttention()表示双向注意力计算。

上述实施例记载的计算当前轮次的问题编码特征的操作，可基于BEDA中的解码器层实现。

可选地，在解码器层，可计算已有答案的自注意力特征，并计算该用户问题的自注意力特征与该已有答案的自注意力特征之间的多头注意力特征，作为该当前预测轮次的问题编码特征。如以下公式所示：

M_a＝MultiHead(X_a，X_a，X_a) (7)

M_q＝MultiHead(M_a，O_q，O_q) (8)

其中，X_a表示已有答案的文本，M_a表示已有答案的自注意力特征，M_q表示用户问题的自注意力特征与已有答案的自注意力特征之间的多头注意力特征，即当前预测轮次的问题编码特征。

接下来，服务器12可根据该描述信息的事实表达Y_f与该当前预测轮次的问题编码特征M_q之间的关联特征，确定当前轮次的答案编码特征。

可选地，服务器12可在解码器层，根据该描述信息的事实表达与该当前预测轮次的问题编码特征之间的关联特征，确定当前轮次的答案编码特征M_f：

M_f＝MultiHead(M_q，Y_f，Y_f) (9)

Odec1＝FFN(M_f) (10)

其中，M_f用表示答案编码特征，Odec1表示解码器输出的答案编码特征M_f的解码结果。其中，Y_f表示参与计算的描述信息片段的事实表达的串联结果Y_f＝[Y_f1，Y_f2，...，Y_fk]，Y_f∈R^kLf×mh。

获取到解码器对当前轮次的答案编码特征M_f的解码结果Odec1之后，服务器12可将Odec1映射到全局词表中，得到词表分布概率P_v(a_t)。其中，全局词表指的是为不同用户提供的通用性词表，该全局词表不受用户偏好影响。可选地，在本实施例中，将答案编码特征的解码结果映射到全局词表中的操作，可基于预先训练的回归模型实现。如以下公式所示：

P_v(a_t)＝softmax(W_vOdec1+b_v) (11)

其中，W_v、b_v为训练阶段可学习的映射参数，W_v∈R^mh×|V|和b_v∈R^|V|，|V|表示该全局词表的词汇大小。其中，a_t用于指代第t个预测轮次的预测出的答案。

在一些示例性的实施例中，根据发起用户问题的用户的历史数据，计算得到的该用户的角色偏好特征，可包括用户的知识级(knowledge-level)偏好特征、用户的方面级(aspect-level)偏好特征以及用户的词汇级偏好特征中的至少一种。以下将分别介绍上述多种角色偏好特征的可选计算方式。

其中，知识级偏好特征，是将用户的历史数据作为先验知识，从中提取用户个人的认知经验得到的特征。

可选地，服务器12获取到用户的大量历史数据片段后，可基于用户问题对大量历史数据片段进行检索，以检索到与用户问题关联的历史数据片段，得到用于计算个性化答案的历史数据：H＝{h1，h2，...，hk}。

在PAGE模型中，PHI在对用户的历史数据片段进行合并时，可利用BEDA，可计算该用户问题与该历史数据之间的关联特征，得到该用户的知识级偏好特征Y_h。

可选地，用户问题与历史数据片段之间的关联特征，可实现为用户问题的自注意力特征与历史数据片段的自注意力特征之间的双向注意力特征。如以下公式所示：

C_hk＝MultiHead(X_hk，X_hk，X_hk) (12)

O_hk＝LayerNorm(FFN(C_hk)+X_hk) (13)

Y_hk＝BiAttention(O_hk，O_q) (14)

其中，X_hk表示输入的历史数据片段hk的文本，C_hk表示中间计算过程，Ohk表示历史数据片段hk的自注意力特征。Y_hk表示用户问题与历史数据片段hk之间的双向注意力特征。分别计算用户问题与历史数据片段h1，h2，...，hk的双向注意力特征后，并将每个历史数据片段得到的特征进行串联输出，可得到用户的知识级偏好特征Y_h＝{Y₁，Y₂...Y_hk，Y_h∈R^kLf ^×mh。

在本实施例中，方面级偏好特征，用于表征用户对对象的某一方面或者某一些方面的偏好。例如，用于表征用户对相机的镜头方面的偏好、对相机的品牌方面的偏好、对相机的重量方面的偏好等。

在本实施例中，词汇级偏好特征，用于表征用户在用词方面的偏好，即用户的语言风格。

在图2所示的PAGE模型中，服务器12可基于PPM，根据该历史数据包含的词汇在该对象的至少一个描述方面上的分布特征，计算用户对对象的方面级偏好特征。服务器12还可基于PPM，根据该历史数据包含的词汇在全局词表中的分布特征，计算该用户的词汇级偏好特征。基于词汇级偏好特征，可确定用户的角色词表。

其中，PPM可采用基于神经网络的主题模型(neural topic model)捕获用户潜在的方面级偏好特征，并动态地提供基于用户偏好的角色词表。以下将对主题模型的建模过程进行示例性说明。

服务器12可将一组历史数据片段H＝{h1，h2，...，hk}输入PPM，PPM可将历史数据片段加工成角色词袋(bag-of-words，BoW)，该角色词袋分布表示为d。

如图2所示，在基于神经网络的变量推理过程中，神经网络的输入为角色词袋分布d。在神经网络中，首先通过多层感知机(MLP)将角色词袋分布d编码为连续高斯变量μ和σ，如以下公式所示:

μ＝FFNμ(FFNd(d)) (15-1)

log(σ²)＝FFNσ(FFNd(d)) (15-2)

接下来，构造以均值μ和σ²为协方差矩阵对角线的对角线高斯先验分布x＝N(μ，σ²)：

x～N(μ，σ²) (16)

基于高斯先验分布，可以使用重新参数化技巧(re-parameterization trick)为高斯先验分布x构造无偏梯度估计器。

接下来，标记一个潜在变量θ，θ∈R^K，K表示方面类别的数量，该潜在变量可由高斯先验分布导出。对先验分布x进行基于softmax的回归操作，以计算方面级别的用户偏好种类的概率分布(即方面分布)：

θ＝softmax(W_xx+b_x) (17)

其中，W_x和b_x为可学习的线性变换的权重和偏置参数。在训练时，可采用高斯随机采样得到的样本∈重新参数化x＝μ+∈·σ，其中，∈∈N(0，I)，并使用(θ|d)来表示近似真实后验(θ|d)的变数推理过程。对于角色词袋中的某一词汇w_n，将其方面分配(aspectassignment，即词汇所属的方面类别)表示为z_n，并采用神经网络来参数化多项方面分布(aspect distribution)，重构词袋分布d的过程为：

z_n～Multi(θ)，n∈[1，|V_bow|] (18)

其中，β_zn表示给定方面分配zn的词汇的方面分布，V_bow是BoW词袋的词汇量的大小。接下来，通过以下公式计算边际概率：

为了明确地对用户偏好进行建模，可通过方面向量T和Bow词向量V的乘积构造词β的方面分布，T∈R^K×mh，V∈R^|Vbow|×mh，如以下公式所示：

β＝softmax(TV^T) (21)

其中，方面向量T是一个用于表示基于方面的特征的特征向量。β∈R^K×|Vbow|可以被视为各个方面类别和角色词袋中的词汇之间的语义相似性矩阵。接下来，可基于相似性矩阵，分离方面级别的用户偏好以及词汇级别的用户偏好。

接下来，可确定重构得到的用户个性化的词袋分布d′，d′＝θ·β。基于用户个性化的词袋分布，可确定用户的角色词表。

方面分布θ与方面向量T相结合，可为每个用户构建方面级别的用户偏好向量Y_t(即方面级偏好特征)，如以下公式所示：

Y_t＝θ·T (22-1)

词袋分布d′与BoW的词向量V相结合，可为每个用户构建词汇级别的用户偏好向量Y_p(即词汇级偏好特征)，如以下公式所示：

Y_p＝d′·V (22-2)

其中，用户的方面级偏好特征被进一步集成到答案解码阶段，用于对方面级用户偏好进行建模；词汇级偏好向量被用于使用用户偏好的语言样式来增强生成的答案。

在训练阶段，PPM可采用基于负变数下限定义的目标函数L_PPM对基于神经网络的主题模型进行优化，如以下公式所示：

其中，D_KL表示计算KL散度(Kullback-Leibler，又称相对熵散度)，P()表示概率计算。

其中，给定一个样本

潜在变量zn可以被整合为：

上述目标函数L_PPM可表示为：

基于上述各实施例的记载，针对每一个轮次的预测操作而言，在获取到本轮次的答案编码特征以及角色偏好特征之后，可利用该答案编码特征以及该角色偏好特征，计算该用户问题对应的个性化答案，以下将进行示例性说明。

可选地，可将当前轮次的答案编码特征输入回归模型，得到词表分布概率，如公式前述的公式11的记载。在以下实施例中，为便于描述和区分，将公式11示意的根据答案编码特征生成的词表分布概率，描述为第一词表分布概率。

接下来，服务器12可基于PAGE模型中的BEDA，进一步对该当前预测轮次的答案编码特征、该用户的知识级偏好特征以及该用户的方面级偏好特征进行融合，得到融合特征。

可选地，计算融合特征的方式，可基于多头注意力算法实现。BEDA可计算该当前预测轮次的答案编码特征与该用户的知识级偏好特征之间的多头注意力特征，得到受知识级偏好影响的答案编码特征；计算该受知识级偏好影响的答案编码特征与该用户的方面级偏好特征之间的多头注意力特征，得到该融合特征。如以下公式所示：

M_h＝MultiHead(M_f，Y_h，Y_h) (26)

M_p＝MultiHead(M_h，Y_t，Y_t) (27)

O_dec2＝FFN(M_p)) (28)

其中，M_f为前述步骤计算得到的当前预测轮次的答案编码特征，Y_h表示用户的知识级偏好特征，Y_t表示用户的方面级偏好特征，M_h表示受知识级偏好影响的答案编码特征，M_p用于表示中间计算过程，O_dec2表示计算得到的融合特征。

接下来，可选地，服务器12可基于PAGE模型中的PIS，根据该融合特征以及扩展词表，计算受角色偏好影响的词表分布概率，此处描述为第二词表分布概率。在计算第二词表分布概率时，综合考虑了用户的角色偏好特征，可将用户的偏好映射在答案词汇的生成过程，使得最终生成的答案满足用户的个性化需求。

获取到第一词表分布概率以及第二词表分布概率后，可根据第一词表分布概率以及第二词表分布概率，确定当前轮次的综合词表分布概率，并根据综合词表分布概率，确定分布概率满足设定条件的词汇，作为当前轮次预测得到的词汇。

以下将对计算第二词表分布概率的可选实施方式进行示例性说明。

可选地，在PIS中，可将该融合特征输入回归模型，得到已有词源中的原词汇作为当前轮次的答案词汇的注意力权重；该已有词源包括：该用户问题、该历史数据、该描述信息和/或该用户的词汇级偏好特征对应的角色词表。

也就是说，可计算将用户问题中的原词汇为当前轮次的答案词汇的注意力权重；计算该历史数据片段中的每个词汇作为当前轮次的答案词汇的注意力权重；计算描述信息片段数据中的每个词汇作为当前轮次的答案词汇的注意力权重；计算用户的角色词表中的每个偏好词汇中作为当前轮次的答案词汇的注意力权重。如以下公式所示：

其中，W*、W*s、ω*以及b*是需要学习的参数，s_t表示解码器在第t个轮次输出的融合特征，即第t个预测轮次输出的O_dec2；

表示计算得到的注意力权重。其中，*＝q时，Y_*＝Oq，以避免符号混乱。

其中，*＝q时，可将该融合特征s_t以及该用户问题的特征Y_q(即O_q)输入回归模型，计算该用户问题中的每个词汇作为当前轮次的答案词汇的第一注意力权重，即：

其中，*＝h时，可将该融合特征s_t以及该用户的知识级偏好特征Y_h输入回归模型，计算该历史数据中的每个词汇作为当前轮次的答案词汇的第二权重，即

其中，*＝f时，可将该融合特征s_t以及该对象的描述信息片段的事实表达Y_f输入回归模型，计算该描述信息中的每个词汇作为当前轮次的答案词汇的第三注意力权重，即

其中，*＝p时，可将该融合特征s_t以及该用户的词汇级偏好特征Y_p输入回归模型，计算该用户的角色词表中的每个偏好词汇中作为当前轮次的答案词汇的第四注意力权重，即

接下来，可根据该已有词源中的原词汇作为当前轮次的答案词汇的注意力权重以及相同词汇在扩展词表中的概率分布，计算该已有词源中的原词汇的基于注意力的概率分布。其中，扩展词表由全局词表中的词、用户问题中的词、对象的描述信息中的词、用户的历史数据中的词以及角色词表中的词组成。如以下公式所示：

其中，P_q(a_t)表示用户问题中的词汇的基于注意力的词汇概率分布、P_f(a_t)表示描述信息中的词汇的基于注意力的词汇概率分布、P_h(a_t)表示历史数据中的词汇的基于注意力的词汇概率分布、P_p(a_t)表示角色词表的词汇的中基于注意力的词汇概率分布。以P_q(a_t)的计算过程为例，

表示用户问题中的第i个词的注意力权重，用户问题中的第i个词，与扩展词表中的第ω个词对应。将用户问题中的第i个词的注意力权重与扩展词表中第i个词的概率分布叠加，得到用户问题中的第i个词的基于注意力的概率分布。

基于上述各实施例的计算，可确定该第一词表分布概率以及该第二词表分布概率对应的多概率分布矩阵，如以下公式所示：

P_all(a_t)＝[P_v(a_t)，P_q(a_t)，P_f(a_t)，P_h(a_t)，P_p(a_t)] (33)

值得说明的是，由于本申请实施例提供的方法基于多个维度计算得到的概率确定综合词表分布概率，因此，在计算综合词表分布概率之前，可计算多个维度计算得到的概率各自的权重信息。

可选地，服务器12可首先根据该已有词源中的原词汇作为当前轮次的答案词汇的注意力权重，计算该已有词源中的原词汇作为当前轮次的答案词汇的上下文向量。即，基于注意力权重

计算上下文向量

如以下公式所示：

其中，*＝q时，可计算该用户问题的特征Y_q的转置矩阵与该第一注意力权重

乘积，得到该问题中的每个词汇对应的上下文向量，即

其中，*＝h时，计算该用户的知识级偏好特征Y_h的转置矩阵与该第二注意力权重

的乘积，得到该历史数据中的每个词汇对应的上下文向量，即

其中，*＝f时，计算该对象的描述信息片段的事实表达Y_f的转置矩阵与该第三注意力权重

的乘积，得到该描述信息中的每个词汇对应的上下文向量，即

其中，*＝p时，计算该用户的词汇级偏好特征Y_p的转置矩阵与该第四注意力权重

的乘积，得到该用户的每个偏好词汇对应的上下文向量，即

接下来，可将该融合特征以及每种已有词源对应的上下文向量输入回归模型，得到多概率权重信息，如以下公式所示：

其中，W_γ和b_γ为训练阶段需要学习的参数，γ用于确定概率分布的每个视图的权重的多视图指针标量。

基于多概率分布矩阵以及多概率权重信息，服务器12可计算当前轮次的综合词表分布概率。可选地，服务器12可计算该多概率分布矩阵的转置矩阵与该多概率权重信息的乘积，得到该当前轮次的综合词表分布概率，如以下公式所示：

P(a_t)＝P_all(a_t)^Tγ (35)

获得综合词表分布概率后，选择分布概率满足设定条件的词汇，作为当前轮次的答案词汇。其中，分布概率满足设定条件可包括：分布概率排序靠前的词汇或者分布概率大于设定阈值，本实施例不做限制。

还值得说明的是，在一些可选的实施例中，服务器12可采用端到端的方式对潜在的角色偏好信息以及个性化答案的生成过程进行联合学习。除了前述公式25中示意的目标函数之外，端到端的训练过程所需的目标函数还可包括：用于训练答案生成过程的目标函数，如以下公式所示：

为了确保PPM中结果偏好嵌入的多样性，可目标函数L PPM中添加了一个正则化项L_R来区分每个方面偏好的方面向量T：

L_R＝||T·T^T-I|| (37)

其中，I是恒等式矩阵。基于上述，端到端的模型训练的总目标函数可表示为L_PPM、L_QA以及L_R的加权和，如以下公式所示：

L＝L_PPM+λ₁(L_QA+λ₁L_R) (38)

其中，λ₁、λ₂是用于平衡损失的超参数。

本申请上述以及下述各实施例提供的问答计算系统可应用于多种应用场景中。例如，商品售前咨询场景、商品的售后服务场景、药品服用咨询场景等，本申请对此不作限制。

以下将以商品售前咨询场景为例进行示例性说明。

在商品售前咨询场景中，在购物前，用户可通过终端设备11对商品进行提问。服务器12可针对用户的提问进行解答。在一些实施例中，电商平台可通过终端设备11向用户提供机器人客服的售前咨询服务。终端设备11展示的商品页面可包含一客服咨询入口，用户触发该客服咨询入口，即可进入机器人客服页面，并发起提问。机器人客服获取用户问题后，可将用户问题发送至服务器12。服务器12可根据该用户问题以及该商品的描述信息，计算用户问题对应的答案编码特征，并基于该用户的历史数据，计算该用户的角色偏好特征。基于答案编码特征以及角色偏好特征，服务器12可为该用户问题计算出更加满足用户咨询意图的个性化答案。

例如，用户通过终端设备11提供的某一服装商品页面查看商品信息时，可通过该服装商品页面提供的客服咨询入口进入机器人客服页面，并向机器人客服发起提问：“这件衣服怎么样”。机器人客服可将该用户问题发送至服务器12。

服务器12接收到该用户问题时，可基于PAGE模型计算该用户问题个性化偏答案。在计算角色偏好特征时，若该用户的历史数据中，关于服装版型的评论数据以及提问数据较多，服务器12计算出的用户的角色偏好特征可包括服装版型偏好。若该用户历史评论数据以及提问数据中，口语化的表达较多，则服务器12计算出的用户的角色偏好特征可包括口语化语言风格偏好。基于答案编码特征以及角色偏好特征，服务器12为该用户问题计算出的个性化答案可以是：收腰版型，显瘦神器呦。

若该用户的历史数据中，关于服装面料的评论数据以及提问数据较多，且用户的语言风格偏好较为正式的文字表达，则基于答案编码特征以及角色偏好特征，服务器12为该用户问题计算出的个性化答案可以是：这件衣服是纯棉面料，手感柔软，透气性好。

计算得到个性化答案之后，服务器12可将个性化答案发送至终端设备11，并由终端设备11在机器人客服页面以对话的形式进行展示。

在另一些实施例中，电商平台可通过终端设备11向用户提供“问大家”的咨询服务。基于该咨询服务，用户可向购买过商品的其他用户发起提问，电商平台也可针对用户的提问进行回答。通常，终端设备11展示的商品页面可包含一提问入口，用户触发该提问入口后，可输入需要咨询的问题并提交该问题。终端设备11获取用户问题后，可将用户问题发送至服务器12。一方面，服务器12可向购买过该商品的其他用户发送提问消息，以获取其他用户针对该问题给出的答案。另一方面，服务器12可基于前述实施例记载的PAGE模型为用户计算个性化答案。

例如，用户通过终端设备11提供的某一水果商品的商品页面查看商品信息时，可通过该商品页面提供的“问大家”控件进入提问页面，并输入问题：“这款水果商品的品质好吗？”。终端设备11可将该用户问题发送至服务器12。

服务器12接收到该用户问题时，可将该用户问题发送至曾购买该水果商品的其他用户的终端设备，并获取其他用户的答案。获取到其他用户的答案后，服务器12可将其他用户的答案发送至终端设备11。终端设备11可在“问大家”页面中与该用户问题对应的答案显示区域，显示其他用户的答案。

同时，服务器12可基于PAGE模型计算该用户问题个性化答案。在计算该用户的角色偏好特征时，若该用户的历史数据中，关于水果商品的新鲜度评论数据以及提问数据较多，服务器12计算出的用户的角色偏好特征可包括新鲜度偏好。若该用户历史评论数据以及提问数据中，口语化的表达较多，则服务器12计算出的用户的角色偏好特征可包括口语化语言风格偏好。基于答案编码特征以及角色偏好特征，服务器12为该用户问题计算出的个性化答案可以是：太新鲜啦，就像树上刚摘的一样哦。若该用户的历史数据中，关于水果商品的口感的评论数据以及提问数据较多，且用户的语言风格偏好较为正式的文字表达，则基于答案编码特征以及角色偏好特征，服务器12为该用户问题计算出的个性化答案可以是：这款水果入口微酸，回味甘甜。

计算得到个性化答案之后，服务器12可将个性化答案发送至终端设备11。终端设备11可在“问大家”页面中，将该个性化答案作为用户问题对应的答案之一进行展示。

上述各实施例描述了本申请提供的问答计算系统的系统结构以及系统功能，以下部分将结合附图对本申请实施例提供的问答计算方法进行具体说明。

图3是本申请一示例性实施例提供的一种问答计算方法的方法流程图，该实施例可基于图1所示的问答计算系统实现，主要是从服务器的角度进行的描述。如图3所示，该方法包括：

步骤301、接收终端设备发送的用户问题，所述用户问题由用户针对对象发起。

步骤302、根据所述用户问题以及所述对象的描述信息，计算所述用户问题对应的答案编码特征。

步骤303、根据所述用户的历史数据，计算所述用户的角色偏好特征。

步骤304、利用所述答案编码特征以及所述角色偏好特征，计算所述用户问题对应的个性化答案。

在一些示例性的实施例中，根据所述用户问题以及所述对象的描述信息，计算所述用户问题对应的答案编码特征的一种方式，可包括：计算所述用户问题与所述描述信息之间的关联特征，作为所述描述信息的事实表达；以及，

计算所述用户问题与已有答案之间的关联特征，作为当前预测轮次的问题编码特征；其中，所述已有答案包括：当前轮次的前一轮次预测的答案或当前预测轮次的答案指代信息；根据所述描述信息的事实表达与所述当前预测轮次的问题编码特征之间的关联特征，确定当前轮次的答案编码特征。

在一些示例性的实施例中，计算所述用户问题与所述描述信息之间的关联特征，作为所述描述信息的事实表达的一种方式，可包括：针对所述描述信息中的任一描述信息片段，获取所述用户问题的自注意力特征以及所述描述信息片段的注意力特征；计算所述用户问题的自注意力特征与所述描述信息片段的注意力特征的双向注意力特征，作为所述描述信息片段的事实表达。

在一些示例性的实施例中，预测当前轮次的答案时，计算所述用户问题与已有答案之间的关联特征，作为当前预测轮次的答案编码特征的一种方式，可包括：获取所述用户问题的自注意力特征以及所述已有答案的自注意力特征；计算所述用户问题的自注意力特征与所述已有答案的自注意力特征之间的多头注意力特征，作为所述当前预测轮次的答案编码特征。

在一些示例性的实施例中，根据所述用户的历史数据，计算所述用户的角色偏好特征的一种方式，可包括：根据所述用户问题与所述历史数据之间的关联特征，计算所述用户的知识级偏好特征；和/或，根据所述历史数据包含的词汇在所述对象的至少一个描述方面上的分布特征，计算所述用户对所述对象的方面级偏好特征；和/或，根据所述历史数据包含的词汇在全局词表中的分布特征，计算所述用户的角色词表和词汇级偏好特征。

在一些示例性的实施例中，根据所述用户问题与所述历史数据之间的关联特征，计算所述用户的知识级偏好特征的一种方式，可包括：针对所述历史数据中的任一历史数据片段，获取所述历史数据片段的自注意力特征；计算所述历史数据片段的自注意力特征与所述用户问题的自注意力特征之间的双向注意力特征，得到所述用户的知识级偏好特征。

在一些示例性的实施例中，根据所述历史数据包含的词汇在所述对象的至少一个描述方面上的分布特征，计算所述用户对所述对象的方面级偏好特征的一种方式，可包括：获取所述历史数据包含的词汇，作为所述用户的角色词袋；将所述角色词袋输入主题模型，得到所述角色词袋中的每个词汇在所述对象的至少一个描述方面的上的分布特征；根据所述角色词袋中的每个词汇在所述对象的至少一个描述方面的上的分布特征，确定所述用户的方面级偏好特征。

在一些示例性的实施例中，利用所述答案编码特征以及所述角色偏好特征，计算所述用户问题对应的个性化答案的一种方式，可包括：将当前轮次的答案编码特征输入回归模型，得到第一词表分布概率；对所述当前预测轮次的答案编码特征、所述用户的知识级偏好特征以及所述用户的方面级偏好特征进行融合，得到融合特征；根据所述融合特征以及扩展词表，计算第二词表分布概率；根据所述第一词表分布概率以及所述第二词表分布概率，确定当前轮次的综合词表分布概率；根据所述综合词表分布概率，确定分布概率满足设定条件的词汇，作为当前轮次预测得到的词汇。

在一些示例性的实施例中，对所述当前预测轮次的答案编码特征、所述用户的知识级偏好特征以及所述用户的方面级偏好特征进行融合，得到融合特征的一种方式，可包括：计算所述当前预测轮次的答案编码特征与所述用户的知识级偏好特征之间的多头注意力特征，得到受知识级偏好影响的答案编码特征；计算所述受知识级偏好影响的答案编码特征与所述用户的方面级偏好特征之间的多头注意力特征，得到受知识级偏好以及方面级偏好影响的所述融合特征。

在一些示例性的实施例中，根据所述融合特征以及扩展词表，计算第二词表分布概率的一种方式，可包括：将所述融合特征输入回归模型，得到已有词源中的原词汇作为当前轮次的答案词汇的注意力权重；所述已有词源包括：所述用户问题、所述历史数据、所述描述信息和/或所述用户的词汇级偏好特征对应的角色词表；根据所述已有词源中的原词汇作为当前轮次的答案词汇的注意力权重以及相同词汇在扩展词表中的概率分布，计算所述已有词源中的原词汇的基于注意力的概率分布。

在一些示例性的实施例中，将所述融合特征输入回归模型，得到已有词源中的每个词汇作为当前轮次的答案词汇的注意力权重，包括以下至少一种：将所述融合特征以及所述用户问题的特征输入回归模型，计算所述用户问题中的每个词汇作为当前轮次的答案词汇的第一注意力权重；将所述融合特征以及所述用户的知识级偏好特征输入回归模型，计算所述历史数据中的每个词汇作为当前轮次的答案词汇的第二注意力权重；将所述融合特征以及所述描述信息的事实表达输入回归模型，计算所述描述信息中的每个词汇作为当前轮次的答案词汇的第三注意力权重；将所述融合特征以及所述用户的词汇级偏好特征输入回归模型，计算所述用户的每个偏好词汇中作为当前轮次的答案词汇的第四注意力权重。

在一些示例性的实施例中，根据所述第一词表分布概率以及所述第二词表分布概率，确定当前轮次的综合词表分布概率的一种方式，可包括：确定所述第一词表分布概率以及所述第二词表分布概率对应的多概率分布矩阵；根据所述已有词源中的原词汇作为当前轮次的答案词汇的注意力权重，计算所述已有词源中的原词汇作为当前轮次的答案词汇的上下文向量；将所述融合特征以及所述已有词源中的原词汇作为当前轮次的答案词汇的上下文向量输入回归模型，得到多概率权重信息；基于所述多概率分布矩阵以及所述多概率权重信息，得到所述当前轮次的综合词表分布概率。

在一些示例性的实施例中，根据所述已有词源中的原词汇作为当前轮次的答案词汇的注意力权重，计算所述已有词源中的原词汇作为当前轮次的答案词汇的上下文向量，包括以下至少一种：计算所述用户问题的特征的转置矩阵与所述第一注意力权重乘积，得到所述问题中的每个词汇对应的上下文向量；计算所述用户的知识级偏好特征的转置矩阵与所述第二注意力权重的乘积，得到所述历史数据中的每个词汇对应的上下文向量；计算所述描述信息片段的事实表达的转置矩阵与所述第三注意力权重的乘积，得到所述描述信息中的每个词汇对应的上下文向量；计算所述用户的词汇级偏好特征的转置矩阵与所述第四注意力权重的乘积，得到所述用户的每个偏好词汇对应的上下文向量。

本实施例中，为针对对象发起的用户问题进行自动问答计算时，可根据用户问题以及对象的描述信息，计算答案编码特征，并根据用户问题以及用户的历史数据计算用户的角色偏好特征，进而可综合考虑多种不同维度的数据进行自动问答计算，以匹配得到符合用户个性化需求的答案。基于这种实施方式，可充分利用对象的描述信息以及用户的历史数据，提高自动问答计算结果的有效性，有利于满足用户实际的提问需求。

图4是本申请另一示例性实施例提供的一种问答计算方法的方法流程图，该实施例可基于图1所示的问答计算系统实现，主要是从服务器的角度进行的描述。如图4所示，该方法包括：

步骤401、展示第一界面，所述第一界面包括对象的至少一个提问入口。

步骤402、响应用户发出的提问入口触发操作，展示与被触发提问入口适配的问答界面。

步骤403、通过所述问答界面获取用户针对所述对象发起的用户问题，并将所述用户问题发送给服务器，以供所述服务器根据所述用户问题、所述对象的描述信息以及所述用户的历史数据确定所述用户问题的个性化答案。

本实施例中，用户问题以及对象的描述信息可用于计算答案编码特征，用户问题以及用户的历史数据可用于计算用户的角色偏好特征。进而，可综合考虑多种不同维度的数据进行自动问答计算，以匹配得到符合用户个性化需求的答案，提高自动问答计算结果的有效性。

本实施例提供的问答计算方法，可由上述实施例记载的问答计算系统中的终端设备实现，未在本实施例中详尽描述的技术细节和有益效果，可参见上述各实施例中记载的与终端设备相关的内容，此处不再赘述。

需要说明的是，上述实施例所提供方法的各步骤的执行主体均可以是同一设备，或者，该方法也由不同设备作为执行主体。比如，步骤301至步骤304的执行主体可以为设备A；又比如，步骤301和302的执行主体可以为设备A，步骤303和304的执行主体可以为设备B；等等。

需要说明的是，在上述实施例及附图中的描述的一些流程中，包含了按照特定顺序出现的多个操作，但是应该清楚了解，这些操作可以不按照其在本文中出现的顺序来执行或并行执行，操作的序号如401、402等，仅仅是用于区分开各个不同的操作，序号本身不代表任何的执行顺序。另外，这些流程可以包括更多或更少的操作，并且这些操作可以按顺序执行或并行执行。需要说明的是，本文中的“第一”、“第二”等描述，是用于区分不同的消息、设备、模块等，不代表先后顺序，也不限定“第一”和“第二”是不同的类型。

以上描述了问答计算方法适用于服务器12的可选实施例，如图5所示，在一些示例性实施例中，用于执行上述问答计算方法的服务器12可包括：存储器501、处理器502、图通信组件503以及电源组件504。

存储器501可被配置为存储其它各种数据以支持在服务器12上的操作。这些数据的示例包括用于在服务器12上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

在本实施例中，存储器501用于存储一条或多条计算机指令。

处理器502，耦合至存储器501，用于执行存储器501中的一条或多条计算机指令，以用于：通过图通信组件503接收终端设备发送的用户问题，所述用户问题由用户针对对象发起；根据所述用户问题以及所述对象的描述信息，计算所述用户问题对应的答案编码特征；根据所述用户的历史数据，计算所述用户的角色偏好特征；利用所述答案编码特征以及所述角色偏好特征，计算所述用户问题对应的个性化答案。

在一些示例性的实施例中，处理器502在根据所述用户问题以及所述对象的描述信息，计算所述用户问题对应的答案编码特征时，具体用于：计算所述用户问题与所述描述信息之间的关联特征，作为所述描述信息的事实表达；以及，计算所述用户问题与已有答案之间的关联特征，作为当前预测轮次的问题编码特征；其中，所述已有答案包括：当前轮次的前一轮次预测的答案或当前预测轮次的答案指代信息；根据所述描述信息的事实表达与所述当前预测轮次的问题编码特征之间的关联特征，确定当前轮次的答案编码特征。

在一些示例性的实施例中，处理器502在计算所述用户问题与所述描述信息之间的关联特征，作为所述描述信息的事实表达时，具体用于：针对所述描述信息中的任一描述信息片段，获取所述用户问题的自注意力特征以及所述描述信息片段的注意力特征；计算所述用户问题的自注意力特征与所述描述信息片段的注意力特征的双向注意力特征，作为所述描述信息片段的事实表达。

在一些示例性的实施例中，处理器502在预测当前轮次的答案时，计算所述用户问题与已有答案之间的关联特征，作为当前预测轮次的问题编码特征时，具体用于：获取所述用户问题的自注意力特征以及所述已有答案的自注意力特征；计算所述用户问题的自注意力特征与所述已有答案的自注意力特征之间的多头注意力特征，作为所述当前预测轮次的问题编码特征。

在一些示例性的实施例中，处理器502在根据所述用户的历史数据，计算所述用户的角色偏好特征时，具体用于：根据所述用户问题与所述历史数据之间的关联特征，计算所述用户的知识级偏好特征；和/或，根据所述历史数据包含的词汇在所述对象的至少一个描述方面上的分布特征，计算所述用户对所述对象的方面级偏好特征；和/或，根据所述历史数据包含的词汇在全局词表中的分布特征，计算所述用户的角色词表和词汇级偏好特征。

在一些示例性的实施例中，处理器502在根据所述用户问题与所述历史数据之间的关联特征，计算所述用户的知识级偏好特征时，具体用于：针对所述历史数据中的任一历史数据片段，获取所述历史数据片段的自注意力特征；计算所述历史数据片段的自注意力特征与所述用户问题的自注意力特征之间的双向注意力特征，得到所述用户的知识级偏好特征。

在一些示例性的实施例中，处理器502在根据所述历史数据包含的词汇在所述对象的至少一个描述方面上的分布特征，计算所述用户对所述对象的方面级偏好特征时，具体用于：获取所述历史数据包含的词汇，作为所述用户的角色词袋；将所述角色词袋输入主题模型，得到所述角色词袋中的每个词汇在所述对象的至少一个描述方面的上的分布特征；根据所述角色词袋中的每个词汇在所述对象的至少一个描述方面的上的分布特征，确定所述用户的方面级偏好特征。

在一些示例性的实施例中，处理器502在利用所述答案编码特征以及所述角色偏好特征，计算所述用户问题对应的个性化答案时，具体用于：将当前轮次的答案编码特征输入回归模型，得到第一词表分布概率；对所述当前预测轮次的答案编码特征、所述用户的知识级偏好特征以及所述用户的方面级偏好特征进行融合，得到融合特征；根据所述融合特征以及扩展词表，计算第二词表分布概率；根据所述第一词表分布概率以及所述第二词表分布概率，确定当前轮次的综合词表分布概率；根据所述综合词表分布概率，确定分布概率满足设定条件的词汇，作为当前轮次预测得到的词汇。

在一些示例性的实施例中，处理器502在对所述当前预测轮次的答案编码特征、所述用户的知识级偏好特征以及所述用户的方面级偏好特征进行融合，得到融合特征时，具体用于：计算所述当前预测轮次的答案编码特征与所述用户的知识级偏好特征之间的多头注意力特征，得到受知识级偏好影响的答案编码特征；计算所述受知识级偏好影响的答案编码特征与所述用户的方面级偏好特征之间的多头注意力特征，得到受知识级偏好以及方面级偏好影响的所述融合特征。

在一些示例性的实施例中，处理器502在根据所述融合特征以及扩展词表，计算第二词表分布概率时，具体用于：将所述融合特征输入回归模型，得到已有词源中的原词汇作为当前轮次的答案词汇的注意力权重；所述已有词源包括：所述用户问题、所述历史数据、所述描述信息和/或所述用户的词汇级偏好特征对应的角色词表；根据所述已有词源中的原词汇作为当前轮次的答案词汇的注意力权重以及相同词汇在扩展词表中的概率分布，计算所述已有词源中的原词汇的基于注意力的概率分布。

在一些示例性的实施例中，处理器502在将所述融合特征输入回归模型，得到已有词源中的每个词汇作为当前轮次的答案词汇的注意力权重时，具体用于执行以下至少一种操作：将所述融合特征以及所述用户问题的特征输入回归模型，计算所述用户问题中的每个词汇作为当前轮次的答案词汇的第一注意力权重；将所述融合特征以及所述用户的知识级偏好特征输入回归模型，计算所述历史数据中的每个词汇作为当前轮次的答案词汇的第二注意力权重；将所述融合特征以及所述描述信息的事实表达输入回归模型，计算所述描述信息中的每个词汇作为当前轮次的答案词汇的第三注意力权重；将所述融合特征以及所述用户的词汇级偏好特征输入回归模型，计算所述用户的每个偏好词汇中作为当前轮次的答案词汇的第四注意力权重。

在一些示例性的实施例中，处理器502在根据所述第一词表分布概率以及所述第二词表分布概率，确定当前轮次的综合词表分布概率时，具体用于：确定所述第一词表分布概率以及所述第二词表分布概率对应的多概率分布矩阵；根据所述已有词源中的原词汇作为当前轮次的答案词汇的注意力权重，计算所述已有词源中的原词汇作为当前轮次的答案词汇的上下文向量；将所述融合特征以及所述已有词源中的原词汇作为当前轮次的答案词汇的上下文向量输入回归模型，得到多概率权重信息；基于所述多概率分布矩阵以及所述多概率权重信息，得到所述当前轮次的综合词表分布概率。

在一些示例性的实施例中，处理器502在根据所述已有词源中的原词汇作为当前轮次的答案词汇的注意力权重，计算所述已有词源中的原词汇作为当前轮次的答案词汇的上下文向量时，具体用于执行以下至少一种操作：计算所述用户问题的特征的转置矩阵与所述第一注意力权重乘积，得到所述问题中的每个词汇对应的上下文向量；计算所述用户的知识级偏好特征的转置矩阵与所述第二注意力权重的乘积，得到所述历史数据中的每个词汇对应的上下文向量；计算所述描述信息片段的事实表达的转置矩阵与所述第三注意力权重的乘积，得到所述描述信息中的每个词汇对应的上下文向量；计算所述用户的词汇级偏好特征的转置矩阵与所述第四注意力权重的乘积，得到所述用户的每个偏好词汇对应的上下文向量。

相应地，本申请实施例还提供一种存储有计算机程序的计算机可读存储介质，计算机程序被执行时能够实现上述方法实施例中可由服务器执行的方法实施例中各步骤。

如图6所示，在一些示例性实施例中，用于执行上述问答计算方法的终端设备11可包括：存储器601、处理器602以及通信组件603、显示组件604、音频组件605以及电源组件606。

存储器601可被配置为存储其它各种数据以支持在终端设备11上的操作。这些数据的示例包括用于在终端设备11上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

在本实施例中，存储器601用于存储一条或多条计算机指令。

处理器602，耦合至存储器601，用于执行存储器601中的一条或多条计算机指令，以用于：通过显示组件604展示第一界面，所述第一界面包括对象的至少一个提问入口；响应用户发出的提问入口触发操作，展示与被触发提问入口适配的问答界面；通过所述问答界面获取用户针对所述对象发起的用户问题，并将所述用户问题发送给服务器，以供所述服务器根据所述用户问题、所述对象的描述信息以及所述用户的历史数据确定所述用户问题的个性化答案。

其中，显示组件604包括液晶显示器(LCD)和触摸面板(TP)。如果显示组件604包括触摸面板，显示组件604可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与触摸或滑动操作相关的持续时间和压力。

在一可选实施方式中，音频组件605被存储为输出和/或输入音频信号。例如，音频组件605包括一个麦克风(MIC)，当音频组件605所在设备处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器601或经由通信组件603发送。例如，在一些可选实施例中，终端设备11可通过音频组件605的麦克风接收用户输入的语音信号，对语音信号进行语音识别以及语义识别，以确定用户问题或者与用户问题相关的用户行为特征。在一些实施例中，音频组件605还包括一个扬声器，用于输出音频信号。例如，可用于输出用户问题对应的答案。

在一可选实施方式中，电源组件606用于为终端设备11的各种组件提供电力。电源组件可以包括电源管理系统，一个或多个电源，及其他与为终端设备11生成、管理和分配电力相关联的组件。

相应地，本申请实施例还提供一种存储有计算机程序的计算机可读存储介质，计算机程序被执行时能够实现上述方法实施例中可由终端设备执行的方法实施例中各步骤。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

以上仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种问答计算方法，其特征在于，包括：

接收终端设备发送的用户问题，所述用户问题由用户针对对象发起；

根据所述用户问题以及所述对象的描述信息，计算所述用户问题对应的答案编码特征；

根据所述用户的历史数据，计算所述用户的角色偏好特征；

利用所述答案编码特征以及所述角色偏好特征，计算所述用户问题对应的个性化答案。

2.根据权利要求1所述的方法，其特征在于，根据所述用户问题以及所述对象的描述信息，计算所述用户问题对应的答案编码特征，包括：

计算所述用户问题与所述描述信息之间的关联特征，作为所述描述信息的事实表达；以及，

计算所述用户问题与已有答案之间的关联特征，作为当前预测轮次的问题编码特征；其中，所述已有答案包括：当前轮次的前一轮次预测的答案或当前预测轮次的答案指代信息；

根据所述描述信息的事实表达与所述当前预测轮次的问题编码特征之间的关联特征，确定当前轮次的答案编码特征。

3.根据权利要求2所述的方法，其特征在于，计算所述用户问题与所述描述信息之间的关联特征，作为所述描述信息的事实表达，包括：

针对所述描述信息中的任一描述信息片段，获取所述用户问题的自注意力特征以及所述描述信息片段的注意力特征；

计算所述用户问题的自注意力特征与所述描述信息片段的注意力特征的双向注意力特征，作为所述描述信息片段的事实表达。

4.根据权利要求2所述的方法，其特征在于，预测当前轮次的答案时，计算所述用户问题与已有答案之间的关联特征，作为当前预测轮次的问题编码特征，包括：

获取所述用户问题的自注意力特征以及所述已有答案的自注意力特征；

计算所述用户问题的自注意力特征与所述已有答案的自注意力特征之间的多头注意力特征，作为所述当前预测轮次的问题编码特征。

5.根据权利要求2所述的方法，其特征在于，根据所述用户的历史数据，计算所述用户的角色偏好特征，包括：

根据所述用户问题与所述历史数据之间的关联特征，计算所述用户的知识级偏好特征；和/或，

根据所述历史数据包含的词汇在所述对象的至少一个描述方面上的分布特征，计算所述用户对所述对象的方面级偏好特征；和/或，

根据所述历史数据包含的词汇在全局词表中的分布特征，计算所述用户的角色词表和词汇级偏好特征。

6.根据权利要求5所述的方法，其特征在于，根据所述用户问题与所述历史数据之间的关联特征，计算所述用户的知识级偏好特征，包括：

针对所述历史数据中的任一历史数据片段，获取所述历史数据片段的自注意力特征；

计算所述历史数据片段的自注意力特征与所述用户问题的自注意力特征之间的双向注意力特征，得到所述用户的知识级偏好特征。

7.根据权利要求5所述的方法，其特征在于，根据所述历史数据包含的词汇在所述对象的至少一个描述方面上的分布特征，计算所述用户对所述对象的方面级偏好特征，包括：

获取所述历史数据包含的词汇，作为所述用户的角色词袋；

将所述角色词袋输入主题模型，得到所述角色词袋中的每个词汇在所述对象的至少一个描述方面的上的分布特征；

根据所述角色词袋中的每个词汇在所述对象的至少一个描述方面的上的分布特征，确定所述用户的方面级偏好特征。

8.根据权利要求5所述的方法，其特征在于，利用所述答案编码特征以及所述角色偏好特征，计算所述用户问题对应的个性化答案，包括：

将当前轮次的答案编码特征输入回归模型，得到第一词表分布概率；

对所述当前预测轮次的答案编码特征、所述用户的知识级偏好特征以及所述用户的方面级偏好特征进行融合，得到融合特征；

根据所述融合特征以及扩展词表，计算第二词表分布概率；

根据所述第一词表分布概率以及所述第二词表分布概率，确定当前轮次的综合词表分布概率；

根据所述综合词表分布概率，确定分布概率满足设定条件的词汇，作为当前轮次预测得到的词汇。

9.根据权利要求8所述的方法，其特征在于，对所述当前预测轮次的答案编码特征、所述用户的知识级偏好特征以及所述用户的方面级偏好特征进行融合，得到融合特征，包括：

计算所述当前预测轮次的答案编码特征与所述用户的知识级偏好特征之间的多头注意力特征，得到受知识级偏好影响的答案编码特征；

计算所述受知识级偏好影响的答案编码特征与所述用户的方面级偏好特征之间的多头注意力特征，得到受知识级偏好以及方面级偏好影响的所述融合特征。

10.根据权利要求8所述的方法，其特征在于，根据所述融合特征以及扩展词表，计算第二词表分布概率，包括：

将所述融合特征输入回归模型，得到已有词源中的原词汇作为当前轮次的答案词汇的注意力权重；所述已有词源包括：所述用户问题、所述历史数据、所述描述信息和/或所述用户的词汇级偏好特征对应的角色词表；

根据所述已有词源中的原词汇作为当前轮次的答案词汇的注意力权重以及相同词汇在扩展词表中的概率分布，计算所述已有词源中的原词汇的基于注意力的概率分布。

11.根据权利要求10所述的方法，其特征在于，将所述融合特征输入回归模型，得到已有词源中的每个词汇作为当前轮次的答案词汇的注意力权重，包括以下至少一种：

将所述融合特征以及所述用户问题的特征输入回归模型，计算所述用户问题中的每个词汇作为当前轮次的答案词汇的第一注意力权重；

将所述融合特征以及所述用户的知识级偏好特征输入回归模型，计算所述历史数据中的每个词汇作为当前轮次的答案词汇的第二注意力权重；

将所述融合特征以及所述描述信息的事实表达输入回归模型，计算所述描述信息中的每个词汇作为当前轮次的答案词汇的第三注意力权重；

将所述融合特征以及所述用户的词汇级偏好特征输入回归模型，计算所述用户的每个偏好词汇中作为当前轮次的答案词汇的第四注意力权重。

12.根据权利要求11所述的方法，其特征在于，根据所述第一词表分布概率以及所述第二词表分布概率，确定当前轮次的综合词表分布概率，包括：

确定所述第一词表分布概率以及所述第二词表分布概率对应的多概率分布矩阵；

根据所述已有词源中的原词汇作为当前轮次的答案词汇的注意力权重，计算所述已有词源中的原词汇作为当前轮次的答案词汇的上下文向量；

将所述融合特征以及所述已有词源中的原词汇作为当前轮次的答案词汇的上下文向量输入回归模型，得到多概率权重信息；

基于所述多概率分布矩阵以及所述多概率权重信息，得到所述当前轮次的综合词表分布概率。

13.根据权利要求12所述的方法，其特征在于，根据所述已有词源中的原词汇作为当前轮次的答案词汇的注意力权重，计算所述已有词源中的原词汇作为当前轮次的答案词汇的上下文向量，包括以下至少一种：

计算所述用户问题的特征的转置矩阵与所述第一注意力权重乘积，得到所述问题中的每个词汇对应的上下文向量；

计算所述用户的知识级偏好特征的转置矩阵与所述第二注意力权重的乘积，得到所述历史数据中的每个词汇对应的上下文向量；

计算所述描述信息片段的事实表达的转置矩阵与所述第三注意力权重的乘积，得到所述描述信息中的每个词汇对应的上下文向量；

计算所述用户的词汇级偏好特征的转置矩阵与所述第四注意力权重的乘积，得到所述用户的每个偏好词汇对应的上下文向量。

14.一种问答计算方法，其特征在于，包括：

展示第一界面，所述第一界面包括对象的至少一个提问入口；

响应用户发出的提问入口触发操作，展示与被触发提问入口适配的问答界面；

通过所述问答界面获取用户针对所述对象发起的用户问题，并将所述用户问题发送给服务器，以供所述服务器根据所述用户问题、所述对象的描述信息以及所述用户的历史数据确定所述用户问题的个性化答案。

15.一种服务器，其特征在于，包括：存储器、处理器以及通信组件；

所述存储器，用于存储一条或多条计算机指令；

所述处理器，用于执行一条或多条计算机指令，以用于执行权利要求1-13任一项所述的方法中的步骤。

16.一种终端设备，其特征在于，包括：存储器、处理器以及通信组件；

所述存储器，用于存储一条或多条计算机指令；

所述处理器，用于执行一条或多条计算机指令，以用于执行权利要求14所述的方法中的步骤。

17.一种存储有计算机程序的计算机可读存储介质，其特征在于，所述计算机程序被执行时能够实现权利要求1-14任一项所述方法中的步骤。