CN111930931B

CN111930931B - 一种摘要评价方法及装置

Info

Publication number: CN111930931B
Application number: CN202010697992.3A
Authority: CN
Inventors: 蔡晓东; 蒋鹏
Original assignee: Guilin University of Electronic Technology
Current assignee: Guilin University of Electronic Technology
Priority date: 2020-07-20
Filing date: 2020-07-20
Publication date: 2024-05-24
Anticipated expiration: 2040-07-20
Also published as: CN111930931A

Abstract

本发明提供一种摘要评价方法及装置，方法包括：录入摘要信息和原文信息，将摘要信息和原文信息作为待评价语句信息；将所述待评价语句信息输入预先构建的语义相似模型中的语义相似度处理得到语义相似度得分；对所述待评价语句信息的评价得分处理得到ROUGE得分；根据语义相似度得分对ROUGE得分的最优融合分析得到最优融合组；对最优融合组的融合分数计算得到最优融合分数，并通过最优融合分数得到摘要评价分数。本发明实现了既计算了待评价语句的共现信息又计算了待评价语句的深层语义信息，提高了对摘要的客观评分能力，也避免评价分数受参考摘要主观性的影响。

Description

一种摘要评价方法及装置

技术领域

本发明主要涉及语言处理技术领域，具体涉及一种摘要评价方法及装置。

背景技术

在自然语言处理中，文本摘要是该领域中的热点研究方向，文本摘要包括抽取式和生成式摘要，抽取式摘要通过抽取算法在原文中抽取重要的语句组成摘要，而生成式摘要则通过大量的预料来训练模型使得模型具有生成摘要的能力。

近年来摘要已经取得了不错的发展，但摘要的评价标准却发展缓慢，摘要的评价标准包括内部评价和外部评价，外部评价是利用提取的摘要参与一些任务例如文档检索等进而判断摘要的优劣；而内部评价是判断系统摘要与参考摘要之间的信息重合度判断摘要的质量。例如ROUGE评价和BLUE评价都是内部评价，这种评价方法的优点是稳定性和健壮性，但这种评价方法的缺点是未考虑到待评价语句的深层语义，当待评价句子之间的共现信息较少时而句子内部的深层语义相同时，这种评价方法不合理。

发明内容

本发明所要解决的技术问题是针对现有技术的不足，提供一种摘要评价方法及装置。

本发明解决上述技术问题的技术方案如下：一种摘要评价方法，包括如下步骤：

录入摘要信息和原文信息，将所述摘要信息和原文信息作为待评价语句信息；

将所述待评价语句信息输入预先构建的语义相似模型中进行语义相似度处理，得到语义相似度得分；

对所述待评价语句信息进行评价得分处理，得到ROUGE得分；

根据所述语义相似度得分对所述ROUGE得分进行最优融合分析，得到最优融合组；

对所述最优融合组进行融合分数计算，得到最优融合分数，并通过所述最优融合分数得到摘要评价分数。

本发明解决上述技术问题的另一技术方案如下：一种摘要评价装置，包括：

语句信息获得模块，用于录入摘要信息和原文信息，将所述摘要信息和原文信息作为待评价语句信息；

语义相似处理模块，用于将所述待评价语句信息输入预先构建的语义相似模型中进行语义相似度处理，得到语义相似度得分；

ROUGE得分处理模块，用于对所述待评价语句信息进行评价得分处理，得到ROUGE得分；

最优融合分析模块，用于根据所述语义相似度得分对所述ROUGE得分进行最优融合分析，得到最优融合组；

摘要评价分数获得模块，用于对所述最优融合组进行融合分数计算，得到最优融合分数，并通过所述最优融合分数得到摘要评价分数。

本发明的有益效果是：通过将待评价语句信息输入预先构建的语义相似模型中的语义相似度处理得到语义相似度得分，并对待评价语句信息的评价得分处理得到ROUGE得分，根据语义相似度得分对ROUGE得分的最优融合分析得到最优融合组，对最优融合组的融合分数计算得到最优融合分数，并通过最优融合分数得到摘要评价分数，实现了既计算了待评价语句的共现信息又计算了待评价语句的深层语义信息，提高了对摘要的客观评分能力，也避免评价分数受参考摘要主观性的影响。

附图说明

图1为本发明一实施例提供的摘要评价方法的流程示意图；

图2为本发明一实施例提供的摘要评价装置的模块框图。

具体实施方式

以下结合附图对本发明的原理和特征进行描述，所举实例只用于解释本发明，并非用于限定本发明的范围。

图1为本发明一实施例提供的摘要评价方法的流程示意图。

如图1所示，一种摘要评价方法，包括如下步骤：

对所述待评价语句信息进行评价得分处理，得到ROUGE得分；

上述实施例中，将待评价语句信息输入预先构建的语义相似模型中的语义相似度处理得到语义相似度得分，并对待评价语句信息的评价得分处理得到ROUGE得分，根据语义相似度得分对ROUGE得分的最优融合分析得到最优融合组，对最优融合组的融合分数计算得到最优融合分数，并通过最优融合分数得到摘要评价分数，实现了既计算了待评价语句的共现信息又计算了待评价语句的深层语义信息，提高了对摘要的客观评分能力，也避免评价分数受参考摘要主观性的影响。

可选地，作为本发明的一个实施例，所述得到语义相似度得分的过程包括：

构建LSTM长短时记忆网络，并根据所述LSTM长短时记忆网络对所述待评价语句信息进行编码，得到编码信息；

对所述编码信息进行选择门挑选计算，得到关键信息向量；

将所述关键信息向量输入至所述语义相似模型的匹配层进行信息匹配处理，得到两个匹配向量；

将两个所述匹配向量一并输入至所述语义相似模型的融合层进行融合处理，得到融合向量；

将所述融合向量输入至所述语义相似模型的预测层进行预测处理，得到得到语义相似度得分。

应理解地，所述匹配层、所述融合层和所述预测层都为现有技术。

应理解地，将所述待评价语句信息在所述语义相似模型中进行编码，编码完成后求出所述待评价语句信息的隐藏层向量，即LSTM长短时记忆网络，再有选择门提取所述待评价语句信息的所述关键信息向量，再通过匹配层、融合层和预测层计算得到语义相似度得分。

具体地，所述LSTM长短时记忆网络的表达式为第三方程组，所述第三方程组为：

f_t＝σ(W_fw_t+U_fh_t-1+b_f)，

i_t＝σ(W_iw_t+U_ih_t-1+b_i)，

o_t＝σ(W_ow_t+U_oh_t-1+b_o)，

c_t＝f_t⊙c_t-1+i_t⊙c_t1，

h_t＝o_ttanh(c_t)，

其中，f_t为遗忘门输出，i_t为输入门输出，o_t为输出门输出，W_f为遗忘门权重矩阵，W_i为输入门权重矩阵，W_o为输出门权重矩阵，W_c为选择门权重矩阵，b_f为遗忘门偏置向量，b_i为输入门偏置向量，b_o为输出门偏置向量，b_c为选择门偏置向量，为新的记忆信息，c_t为更新的网络单元的记忆内容，σ为sigmoid激活函数，⊙为元素乘积，h_t-1为t-1时刻的隐藏层输出，w_t为t时刻的输入信息。

具体地，所述关键信息向量依次输入至所述语义相似模型的匹配层，其表达式为第四方程组，所述第四方程组为：

其中，W₁、W₂、W₃、W₄、W₅和W₆均为权重矩阵，fm(.)为余弦函数，为前向词嵌入向量，/>为反向词嵌入向量，/>为前向注意力权重，/>为反向注意力权重。

上述实施例中，根据所述LSTM长短时记忆网络对所述待评价语句信息的编码得到编码信息；对所述待评价语句编码信息的选择门挑选计算得到关键信息向量；将所述关键信息向量依次输入至所述语义相似模型的匹配层、融合层和预测层中得到语义相似度得分，实现了自动获得语义相似度得分，提高了对摘要的客观评分能力，避免了评价分数受参考摘要主观性的影响。

可选地，作为本发明的一个实施例，所述得到关键信息向量的过程包括：

通过第一方程组对所述编码信息进行选择门挑选计算，得到关键信息向量，所述第一方程组为：

s＝h_n，

sGate_i＝σ(W_sh_i+U_ss+b)，

其中，s为句向量，h_n为隐藏层中第n个向量，n为隐藏层中向量数，h_i为隐藏层中第i个向量，sGate_i为选择系数，h'_i为关键信息向量，W_s为权重矩阵，U_s为偏置向量，b为任意一个句子上下文向量，σ为sigmoid激活函数，为元素之间的点乘。

上述实施例中，通过第一方程组对所述待评价语句编码信息的选择门挑选计算得到关键信息向量，提高了对摘要的客观评分能力，避免了评价分数受参考摘要主观性的影响。

可选地，作为本发明的一个实施例，所述得到ROUGE得分的过程包括：

利用ROUGE算法对所述待评价语句信息进行评价得分处理，得到ROUGE得分。

应理解地，所述ROUGE算法指的是ROUGE(Recall-Oriented Understudy forGisting Evaluation)，在2004年由ISI的Chin-Yew Lin提出的一种自动摘要评价方法，现被广泛应用于DUC(Document Understanding Conference)的摘要评测任务中；ROUGE基于摘要中n元词(n-gram)的共现信息来评价摘要，是一种面向n元词召回率的评价方法；基本思想为由多个专家分别生成人工摘要，构成标准摘要集，将系统生成的自动摘要与人工生成的标准摘要相对比，通过统计二者之间重叠的基本单元(n元语法、词序列和词对)的数目，来评价摘要的质量，通过与专家人工摘要的对比，提高评价系统的稳定性和健壮性，该方法现已成为摘要评价技术的通用标注之一；ROUGE准则由一系列的评价方法组成，包括ROUGE-N(N＝1、2、3、4，分别代表基于1元词到4元词的模型)，ROUGE-L，ROUGE-S,ROUGE-W，ROUGE-SU等。在自动文摘相关研究中，一般根据自己的具体研究内容选择合适的ROUGE方法。

上述实施例中，利用ROUGE算法对所述待评价语句信息的评价得分处理得到ROUGE得分，提高了对摘要的客观评分能力，避免了评价分数受参考摘要主观性的影响。

可选地，作为本发明的一个实施例，所述得到最优融合组的过程包括：

根据所述语义相似度得分对所述ROUGE得分进行置信距离计算，得到置信距离矩阵；

对所述置信距离矩阵进行关系矩阵计算，得到关系矩阵，所述关系矩阵包括多个1和多个0；

对所述多个1的数量进行统计，得到关系矩阵1的数量，根据统计出的所述关系矩阵1的数量得到关系矩阵第一数量；

对所述多个0的数量进行统计，得到关系矩阵0的数量，根据统计出的所述关系矩阵0的数量得到关系矩阵第二数量；

当所述关系矩阵第一数量大于等于所述关系矩阵第二数量时，则得到最优融合组。

应理解地，将所述ROUGE得分与所述语义相似度得分输入特征得分融合算法中计算得到所述置信距离矩阵和所述关系矩阵，并使用所述置信距离矩阵和所述关系矩阵寻找最优融合组。

上述实施例中，根据所述语义相似度得分对所述ROUGE得分的置信距离计算得到置信距离矩阵；对所述置信距离矩阵的关系矩阵计算得到关系矩阵，所述关系矩阵包括多个1和多个0；对所述多个1的数量的统计得到关系矩阵1的数量，根据统计出的所述关系矩阵1的数量得到关系矩阵第一数量；对所述多个0的数量的统计得到关系矩阵0的数量，根据统计出的所述关系矩阵0的数量得到关系矩阵第二数量；当所述关系矩阵第一数量大于等于所述关系矩阵第二数量时，则得到最优融合组，实现了既计算了待评价语句的共现信息又计算了待评价语句的深层语义信息，提高了对摘要的客观评分能力，也避免评价分数受参考摘要主观性的影响。

可选地，作为本发明的一个实施例，所述根据所述语义相似度得分对所述ROUGE得分进行置信距离计算，得到置信距离矩阵的过程包括：

通过第一式对所述语义相似度得分和所述ROUGE得分进行置信距离计算，得到置信距离矩阵，所述第一式为：

其中，

其中，D₂为置信距离矩阵，x_i为ROUGE得分，x_j为语义相似度得分，σ_i为x_i的标准差，σ_j为x_j的标准差，d_ij和d_ji均为置信距离测度。

上述实施例中，通过第一式对所述语义相似度得分和所述ROUGE得分的置信距离计算得到置信距离矩阵，为之后的计算提供数据支撑，提高了对摘要的客观评分能力，也避免评价分数受参考摘要主观性的影响。

可选地，作为本发明的一个实施例，所述对所述置信距离矩阵进行关系矩阵计算，得到关系矩阵的过程包括：

通过第二式对所述置信距离矩阵进行关系矩阵计算，得到关系矩阵，所述第二式为：

其中，

其中，R₂为关系矩阵，r_ij为关系系数，β_ij为界限值。

上述实施例中，通过第二式对所述置信距离矩阵的关系矩阵计算得到关系矩阵。

可选地，作为本发明的一个实施例，所述对所述最优融合组进行融合分数计算，得到最优融合分数的过程包括：

利用极大似然估计法对所述最优融合组进行融合分数计算，得到最优融合分数，具体为：

通过第二方程组对所述最优融合组进行融合分数计算，得到最优融合分数，所述第二方程组包括第一式、第二式、第三式、第四式、第五式和第六式；

其中，通过所述第一式得到条件概率，所述第一式为：

通过所述第二式、第三式和第四式得到极大似然估计对数，所述第二式为：

所述第三式为：

所述第四式为：

通过所述第五式得到极大似然估计导数，所述第五式为：

通过所述第六式得到最优融合分数，所述第六式为：

其中，为极大似然函数，/>为最优融合分数，x_i为最优融合组，p_i(x_i|θ)为条件概率，σ_i为标准差，/>为条件概率的连乘，为最优融合数，θ为条件概率，/>为偏导数符号，x_l为评价分数。

上述实施例中，利用极大似然估计法对所述最优融合组的融合分数计算得到最优融合分数，实现了既计算了待评价语句的共现信息又计算了待评价语句的深层语义信息，提高了对摘要的客观评分能力，也避免评价分数受参考摘要主观性的影响。

图2为本发明一实施例提供的摘要评价装置的模块框图。

可选地，作为本发明的另一个实施例，如图2所示，一种摘要评价装置，包括：

可选地，作为本发明的一个实施例，所述语义相似处理模块具体用于：

对所述编码信息进行选择门挑选计算，得到关键信息向量；

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。用于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种摘要评价方法，其特征在于，包括如下步骤：

对所述待评价语句信息进行评价得分处理，得到ROUGE得分；

对所述最优融合组进行融合分数计算，得到最优融合分数，并通过所述最优融合分数得到摘要评价分数；

所述对所述最优融合组进行融合分数计算，得到最优融合分数的过程包括：

其中，通过所述第一式得到条件概率，所述第一式为：

所述第三式为：

所述第四式为：

通过所述第五式得到极大似然估计导数，所述第五式为：

通过所述第六式得到最优融合分数，所述第六式为：

2.根据权利要求1所述的摘要评价方法，其特征在于，所述得到语义相似度得分的过程包括：

对所述编码信息进行选择门挑选计算，得到关键信息向量；

3.根据权利要求2所述的摘要评价方法，其特征在于，所述得到关键信息向量的过程包括：

s＝h_n，

sGate_i＝σ(W_sh_i+U_ss+b)，

其中，s为句向量，h_n为隐藏层中第n个向量，n为隐藏层中向量数，h_i为隐藏层中第i个向量，sGate_i为选择系数，h^' _i为关键信息向量，W_s为权重矩阵，U_s为偏置向量，b为任意一个句子上下文向量，σ为sigmoid激活函数，为元素之间的点乘。

4.根据权利要求1所述的摘要评价方法，其特征在于，所述得到ROUGE得分的过程包括：

5.根据权利要求4所述的摘要评价方法，其特征在于，所述得到最优融合组的过程包括：

6.根据权利要求5所述的摘要评价方法，其特征在于，所述根据所述语义相似度得分对所述ROUGE得分进行置信距离计算，得到置信距离矩阵的过程包括：

其中，

7.根据权利要求6所述的摘要评价方法，其特征在于，所述对所述置信距离矩阵进行关系矩阵计算，得到关系矩阵的过程包括：

其中，

其中，R₂为关系矩阵，r_ij为关系系数，β_ij为界限值。

8.一种摘要评价装置，其特征在于，包括：

摘要评价分数获得模块，用于对所述最优融合组进行融合分数计算，得到最优融合分数，并通过所述最优融合分数得到摘要评价分数；

其中，通过所述第一式得到条件概率，所述第一式为：

所述第三式为：

所述第四式为：

通过所述第五式得到极大似然估计导数，所述第五式为：

通过所述第六式得到最优融合分数，所述第六式为：

9.根据权利要求8所述的摘要评价装置，其特征在于，所述语义相似处理模块具体用于：

对所述编码信息进行选择门挑选计算，得到关键信息向量；