CN111026854A

CN111026854A - 一种答案质量的评估方法

Info

Publication number: CN111026854A
Application number: CN201911236857.2A
Authority: CN
Inventors: 韩伟红; 赫中翮; 陈雷霆; 李广新
Original assignee: Guangdong Electronic Information Engineering Research Institute of UESTC
Current assignee: Guangdong Electronic Information Engineering Research Institute of UESTC
Priority date: 2019-12-05
Filing date: 2019-12-05
Publication date: 2020-04-17

Abstract

本发明属于自动应答的技术领域，具体涉及一种答案质量的评估方法，包括如下步骤，步骤一、采用BLSTM模型，对问答对的文本特征进行评估；步骤二、抽取若干个非文本特征，对所述问答对的非文本特征进行评估；步骤三、综合所述文本特征的评估和所述非文本特征的评估，然后将候选答案的综合得分从高到低进行排序，最后从所述候选答案中选择出最佳答案。本发明通过结合问答对的文本和非文本的特征以评估答案质量，有助于提高问题和答案的匹配度，从而提高答案的质量。

Description

一种答案质量的评估方法

技术领域

本发明属于自动应答的技术领域，具体涉及一种答案质量的评估方法。

背景技术

对社区问答网站的答案质量评估方法是当前的研究热点之一。早期社区问答系统中关对答案选择的研究一般会把答案质量看作问题和答案的匹配度。默认情况下文本匹配度越高则答案质量越高，反之越低。常用的文本相似度匹配多集中于词语的匹配，如Okapi模型、语言模型和空间向量模型。但是这些方法主要使用文本相似性技术进行问题和答案之间的字符串匹配，它忽略了问题和答案的语义相似和句法分析。

为了进一步提高答案质量，研究人员把文本特征作为答案评估的一个基本元素。把字符间的编辑树距离，句法树中的词的最小编辑距离和浅层语义树中词之间的编辑距离作为特征训练支持向量机模型，并对问题和候选答案的相关性进行预测，最终对候选答案的概率进行排序，并选出最佳答案。

最近，卷积神经网络(CNN)被用来短文本的评估，其在短文本匹配中取得了显著的效果相比现今的其他方法。之后，许多方法也被用来从一系列候选答案序列中选择高质量的答案，例如深度学习被用于问答对的文本特征评估,这些研究表明答案质量评估的重要性，如果答案质量预测模型能够向用户返回高质量答案，其将会提高该网站的用户使用量，然而，发明人发现许多方法单独研究非文本特征和文本特征，使得这些方法在答案质量评估方面显得不完善。

发明内容

本发明的目的在于：针对现有技术的不足，提供一种答案质量的评估方法，通过结合问答对的文本和非文本的特征以评估答案质量，有助于提高问题和答案的匹配度，从而提高答案的质量。

为了实现上述目的，本发明采用如下技术方案：

一种答案质量的评估方法，包括如下步骤：

步骤一、采用BLSTM模型，对问答对的文本特征进行评估；

步骤二、抽取若干个非文本特征，对所述问答对的非文本特征进行评估；

步骤三、综合所述文本特征的评估和所述非文本特征的评估，然后将候选答案的综合得分从高到低进行排序，最后从所述候选答案中选择出最佳答案。

需要说明的是，本发明的评估方法中，首先，采用BLSTM模型来评估答案的文本质量，然后，抽取了若干个非文本特征，来对答案的非文本特征进行评估，最后综合两个方面的评估值，根据综合值的大小，对答案质量进行排序；其中，候选答案可以通过独立的企业级搜索应用服务器得到，服务器对外提供Web-service的API接口，用户可以通过http请求，向搜索引擎服务器提交一定格式的XML文件，生成索引，也可以通过Http Get操作提出查找请求，并得到XML格式的返回结果，对将候选答案的综合得分从高到低进行排序，最后从候选答案中选择出最佳答案；非文本特征的数量为11个，但非文本特征的数量可以根据实际应用场景进行调整，此外，通过BLSTM模型训练后，训练得出代表文本相似性大小的概率，有利于找出最佳答案，从而提高答案的质量。

作为本发明所述的一种答案质量的评估方法的一种改进，所述步骤一中，对所述问答对的所述文本特征进行评估方法，包括：

从所述问答对的句子顺序读取，然后输出每个所述问答对的相关性得分。

作为本发明所述的一种答案质量的评估方法的一种改进，所述步骤一中，还包括：

采用两个独立的隐藏层来处理来自前面和后面的上下文数据。

作为本发明所述的一种答案质量的评估方法的一种改进，所述BLSTM模型包括若干个LSTM重复模块，所述LSTM重复模块包括交互的记忆状态Ct、遗忘门i、输入门f及输出门o。

作为本发明所述的一种答案质量的评估方法的一种改进，所述遗忘门i为以上一单元的输出h_t-1和本单元的输入x_t为输入的sigmoid函数，为记忆状态C_t-1中的每一项产生一个在[0,1]内的值，来控制上一单元状态被遗忘的程度。

作为本发明所述的一种答案质量的评估方法的一种改进，所述输出门使用sigmoid激活函数来确定内容输出，然后再使用tanh激活函数对所述记忆状态的内容进行处理。

作为本发明所述的一种答案质量的评估方法的一种改进，所述步骤二中，还包括：

计算全部所述候选答案的每个所述非文本特征的平均分数；

计算所述候选答案的每个所述非文本特征得分与所述平均分数之间的距离。

作为本发明所述的一种答案质量的评估方法的一种改进，若干个所述非文本特征包括答案的长度、答案的名词数、答案的动词数。

作为本发明所述的一种答案质量的评估方法的一种改进，若干个所述非文本特征还包括答案的形容词数、问题的长度、问题和答案的余弦距离。

作为本发明所述的一种答案质量的评估方法的一种改进，所述非文本特征的数量为10个～13个。

本发明的有益效果在于，本发明包括如下步骤，步骤一、采用BLSTM模型，对问答对的文本特征进行评估；步骤二、抽取若干个非文本特征，对所述问答对的非文本特征进行评估；步骤三、综合所述文本特征的评估和所述非文本特征的评估，然后将候选答案的综合得分从高到低进行排序，最后从所述候选答案中选择出最佳答案。本发明通过结合问答对的文本和非文本的特征以评估答案质量，有助于提高问题和答案的匹配度，从而提高答案的质量。

附图说明

图1为本发明中BLSTM模型的结构示意图。

图2为本发明中LSTM重复模块的结构示意图。

图3为本发明中LSTM的内部示意图。

具体实施方式

如在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可理解，硬件制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名称的差异来作为区分组件的方式，而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”为一开放式用语，故应解释成“包含但不限定于”。“大致”是指在可接受的误差范围内，本领域技术人员能够在一定误差范围内解决技术问题，基本达到技术效果。

在本发明的描述中，需要理解的是，术语“上”、“下”、“前”、“后”、“左”、“右”、水平”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

在发明中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。

以下结合附图对本发明作进一步详细说明，但不作为对本发明的限定。

如图1～3所示，一种答案质量的评估方法，包括如下步骤：

步骤一、采用BLSTM模型，对问答对的文本特征进行评估；

步骤二、抽取若干个非文本特征，对问答对的非文本特征进行评估；

步骤三、综合文本特征的评估和非文本特征的评估，然后将候选答案的综合得分从高到低进行排序，最后从候选答案中选择出最佳答案。

需要说明的是，本发明的评估方法中，首先，采用BLSTM模型来评估答案的文本质量，然后，抽取了若干个非文本特征，来对答案的非文本特征进行评估，最后综合两个方面的评估值，根据综合值的大小，对答案质量进行排序；其中，候选答案可以通过独立的企业级搜索应用服务器得到，服务器对外提供Web-service的API接口，用户可以通过http请求，向搜索引擎服务器提交一定格式的XML文件，生成索引，也可以通过Http Get操作提出查找请求，并得到XML格式的返回结果，对将候选答案的综合得分从高到低进行排序，最后从候选答案中选择出最佳答案；于本实施例中，非文本特征的数量为11个，但本发明不以此为限，非文本特征的数量可以根据实际应用场景进行调整，此外，通过BLSTM模型训练后，训练得出代表文本相似性大小的概率，有利于找出最佳答案，从而提高答案的质量。

优选的，步骤一中，对问答对的文本特征进行评估方法，包括：

从问答对的句子顺序读取，然后输出每个问答对的相关性得分。

优选的，步骤一中，还包括：

需要说明的是：预测可能需要由前面若干输入和后面若干输入共同决定，这样会更加准确，因此采用了双向循环神经网络，即前面从1时刻到t时刻正向计算一遍，得到并保存每个时刻向前隐含层的输出，在后面沿着时刻t到时刻1反向计算一遍，得到并保存每个时刻向后隐含层的输出。最后在每个时刻结合前面和后面的相应时刻输出的结果得到最终的输出，用数学表达式如下：

h_t＝f(w₁x_t+w₂h_t-1)

h′_t＝f(w₃x_t+w₅h′_t+1)

o_t＝g(w₄h_t+w₆h′_t)

优选的，BLSTM模型包括若干个LSTM重复模块，LSTM重复模块包括交互的记忆状态Ct、遗忘门i、输入门f及输出门o。其工作原理由以下公式表示，

i_t＝δ(W_xix_t+W_hixh_t-1+b_i) (1)

f_t＝δ(W_xfx_t+W_hfh_t-1+b_f) (2)

o_t＝δ(W_xox_t+W_hoh_t-1+b_o) (3)

c_in_t＝tanh(W_xcx_t+W_hch_t-1+b_{c_in}) (4)

h_t＝o_t·tanh(c_t) (6)

其具体工作过程如图3所示。

优选的，遗忘门i为以上一单元的输出h_t-1和本单元的输入x_t为输入的sigmoid函数，为记忆状态C_t-1中的每一项产生一个在[0，1]内的值，来控制上一单元状态被遗忘的程度。

优选的，输出门使用sigmoid激活函数来确定内容输出，然后再使用tanh激活函数对记忆状态的内容进行处理。

优选的，步骤二中，还包括：

计算全部候选答案的每个非文本特征的平均分数；

计算候选答案的每个非文本特征得分与平均分数之间的距离。

需要说明的是：计算每个候选答案的11个特征分数，然后，将从问题的所有候选答案中计算每个特征的平均分数，在问题答案对中，将计算来自所有答案的每个特征的平均分数与每个答案特征的分数之间的距离，显然，距离越小意味着答案是最佳答案的概率越高，最后，候选答案基于距离排名，如果候选答案是最佳答案，则它在每个特征中将具有小距离，并且其特征距离分数将排在顶部。在本发明中，定义一个矩阵来存储排名结果。每个特征的秩结构将表示如下：

矩阵中的每一列表示一个特征，一条线表示候选答案。矩阵中的每个元素表示特征j上的候选答案i的秩。为了评估非文本质量的答案，整合所有功能的排名得分。总结每个候选答案的所有特征。非文本分数的方程表示如下：

最后，通过线性方程组合每个候选答案的文本特征和非文本特征。该线性方程的最终得分表示候选答案的得分。线性方程如下：

优选的，若干个非文本特征包括答案的长度、答案的名词数、答案的动词数。

优选的，若干个非文本特征还包括答案的形容词数、问题的长度、问题和答案的余弦距离。

优选的，非文本特征的数量为10个～13个。

根据上述说明书的揭示和教导，本发明所属领域的技术人员还能够对上述实施方式进行变更和修改。因此，本发明并不局限于上述的具体实施方式，凡是本领域技术人员在本发明的基础上所作出的任何显而易见的改进、替换或变型均属于本发明的保护范围。此外，尽管本说明书中使用了一些特定的术语，但这些术语只是为了方便说明，并不对本发明构成任何限制。

Claims

1.一种答案质量的评估方法，其特征在于，包括如下步骤：

步骤一、采用BLSTM模型，对问答对的文本特征进行评估；

2.如权利要求1所述的一种答案质量的评估方法，其特征在于，所述步骤一中，对所述问答对的所述文本特征进行评估方法，包括：

3.如权利要求1所述的一种答案质量的评估方法，其特征在于，所述步骤一中，还包括：

4.如权利要求1所述的一种答案质量的评估方法，其特征在于：所述BLSTM模型包括若干个LSTM重复模块，所述LSTM重复模块包括交互的记忆状态Ct、遗忘门i、输入门f及输出门o。

5.如权利要求4所述的一种答案质量的评估方法，其特征在于：所述遗忘门i为以上一单元的输出h_t-1和本单元的输入x_t为输入的sigmoid函数，为记忆状态C_t-1中的每一项产生一个在[0,1]内的值，来控制上一单元状态被遗忘的程度。

6.如权利要求4所述的一种答案质量的评估方法，其特征在于：所述输出门使用sigmoid激活函数来确定内容输出，然后再使用tanh激活函数对所述记忆状态的内容进行处理。

7.如权利要求1所述的一种答案质量的评估方法，其特征在于，所述步骤二中，还包括：

计算全部所述候选答案的每个所述非文本特征的平均分数；

8.如权利要求1所述的一种答案质量的评估方法，其特征在于：若干个所述非文本特征包括答案的长度、答案的名词数、答案的动词数。

9.如权利要求8所述的一种答案质量的评估方法，其特征在于：若干个所述非文本特征还包括答案的形容词数、问题的长度、问题和答案的余弦距离。

10.如权利要求1所述的一种答案质量的评估方法，其特征在于：所述非文本特征的数量为10个～13个。