CN109933665A

CN109933665A - 评论识别的装置和方法

Info

Publication number: CN109933665A
Application number: CN201910195321.4A
Authority: CN
Inventors: 辛秉哲; 刘兆来; 李大任; 孙先; 李大海
Original assignee: Wise Four Seas (beijing) Technology Co Ltd
Current assignee: Wise Four Seas (beijing) Technology Co Ltd
Priority date: 2019-03-14
Filing date: 2019-03-14
Publication date: 2019-06-25

Abstract

本发明提供了一种评论识别的装置和方法，能提高负面评论识别的效率，并保证识别的精确度。装置包括：获取单元，被配置成获取待识别的评论；以及识别单元，被配置成利用融合识别模型对该待识别的评论进行识别得到识别结果，其中，该融合识别模型的参数通过对预先训练好的第一识别模型的参数和迭代生出的第二识别模型的参数加权求和得到，该融合识别模型的架构相同于该第一识别模型的架构和该第二识别模型的架构的其中一者或任一者，该识别结果包括该待识别的评论是否属于负面于社区讨论氛围的评论的判断。

Description

评论识别的装置和方法

技术领域

本发明涉及自然语言处理领域，具体而言，涉及一种评论识别的装置和方法。

背景技术

文本分类问题是自然语言处理领域中一个非常基础与重要的问题，文本分类应用的领域非常广泛，包括垃圾邮件过滤、不健康文本识别。在许多网络社区中都会出现带有讽刺性用语、不文明用语、话里带刺或讽刺性等的负面评论，这些负面评论往往是不利于社区讨论氛围的评论，容易引起社区的成员对喷、互骂等行为，非常影响社区成员的阅读与讨论，需要从网络社区的评论中删除这些负面的评论，这就需要首先识别出这些负面的评论。实际上由于中国语言的博大精深、互联网文化语言的多态性，会有很多新词和一词多义的现象，例如阴阳怪气的评论与嘲讽式评论是难以自动识别的。现有的识别方法只能通过人工识别并借助于用户举报的方式实现，具体地，需要配置人员人工查看海量的评论；用户也可以对负面的评论进行举报，举报的评论经由审核人员进行审核。但是现有的识别方法识别效率较低。

有鉴于此，如何提供一种识别方法，以提高负面评论识别的效率，并保证识别的精确度，成为亟待解决的技术问题。

发明内容

有鉴于此，本发明的目的在于提供一种评论识别的装置和方法，以提高负面评论识别的效率，并保证识别的精确度。

第一方面，本发明实施例提供了一种评论识别的装置，包括：

获取单元，被配置成获取待识别的评论；以及

识别单元，被配置成利用融合识别模型对该待识别的评论进行识别得到识别结果，其中，该融合识别模型的参数通过对预先训练好的第一识别模型的参数和迭代生出的第二识别模型的参数加权求和得到，该融合识别模型的架构相同于该第一识别模型的架构和该第二识别模型的架构的其中一者或任一者，该识别结果包括该待识别的评论是否属于负面于社区讨论氛围的评论的判断。

第二方面，本发明实施例还提供了一种评论识别的方法，包括：

获取待识别的评论；以及

利用融合识别模型对该待识别的评论进行识别得到识别结果，其中，该融合识别模型的参数通过对预先训练好的第一识别模型的参数和迭代生出的第二识别模型的参数加权求和得到，该融合识别模型的架构相同于该第一识别模型的架构和该第二识别模型的架构的其中一者或任一者，该识别结果包括该待识别的评论是否属于负面于社区讨论氛围的评论的判断。

该装置和方法至少能实现如下效果之一：一方面，利用融合识别模型对待识别的评论进行识别得到该待识别的评论是否属于负面于社区讨论氛围的评论的判断的识别结果，相较于依靠人工识别的现有技术，能够提高识别的效率；另一方面，该融合识别模型的参数通过对预先训练好的第一识别模型的参数和迭代生出的第二识别模型的参数加权求和得到，从而相较于使用第一识别模型和第二识别模型，使用该融合识别模型能够从该待识别的评论中提取到更准确的特征，并根据提取到的特征得到更准确的识别结果，即本方案相较于现有技术，能提高负面评论识别的效率，并保证识别的精确度。

附图说明

本公开可以通过参考下文中结合附图所给出的描述而得到更好的理解，附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分。在附图中：

图1是根据本公开内容的一个实施方式的评论识别的装置的示例性框图；

图2是根据本公开内容的另一个实施方式的评论识别的装置的示例性框图；

图3是根据本公开内容的一个实施方式的评论识别的方法的示例性流程图；

图4是根据本公开内容的另一个实施方式的评论识别的方法的示例性流程图。

具体实施方式

在下文中将结合附图对本公开内容的示例性实施方式进行描述。为了清楚和简明起见，在说明书中并未描述实际实施方式的所有特征。然而，应该了解，在开发任何这种实际实施方式的过程中可以做出很多特定于实施方式的决定，以便实现开发人员的具体目标，并且这些决定可能会随着实施方式的不同而有所改变。

在此，还需要说明的一点是，为了避免因不必要的细节而模糊了本公开，在附图中仅仅示出了与根据本公开内容的方案密切相关的装置结构，而省略了与本公开关系不大的其他细节。

应理解的是，本公开内容并不会由于如下参照附图的描述而只限于所描述的实施形式。在本文中，在可行的情况下，实施方式可以相互组合、不同实施方式之间的特征替换或借用、在一个实施方式中省略一个或多个特征。

现有技术中在对负面的评论进行识别时，主要依靠人工来识别，识别效率较低。

为了解决现有技术出现的负面的评论识别效率较低的问题，本发明公开一种评论识别的方案，可以通过执行下述步骤实现：

(1)在第一时刻利用第一识别模型的训练样本训练该第一识别模型，在第二时刻利用第二识别模型的训练样本训练该第二识别模型，通过对该第一识别模型的参数和该第二识别模型的参数进行加权求和得到融合识别模型的参数，利用该融合识别模型的参数构建该融合识别模型，其中，该第一时刻早于该第二时刻，该第二识别模型的训练样本的真子集包括该第一识别模型的训练样本，该融合识别模型的架构相同于该第一识别模型的架构和该第二识别模型的架构的其中一者或任一者，该第二识别模型的架构包括第一网络、第二网络、第三网络、注意力层和分类器，其中，

该第一网络和该第二网络的结构相同，该第一网络包括嵌入层和卷积神经网络，该第一网络的嵌入层的输出作为该第一网络的卷积神经网络的输入；

该第三网络包括特征转换层和特征拼接层，该特征转换层被配置成将该特征转换层的输入转换成token序列，该特征拼接层被配置成将该特征拼接层的输入拼接起来，该第二网络的卷积神经网络的输出和该特征转换层的输出作为该特征拼接层的输入；

该第一网络的卷积神经网络的输出和该特征拼接层的输出作为该注意力层的输入，该注意力层的输出作为该分类器的输入。

需要说明的是，为了更好的训练第一识别模型和第二识别模型，在构造第一识别模型和第二识别模型的训练样本时，需要使训练样本包含正样本和负样本，其中，正样本为包含负面关键词的评论，负样本为不包含负面关键词的评论。以第一识别模型的训练样本的正样本的构造为例说明构造过程。具体地，可以从网络社区中筛选出一部分包含负面关键词的评论作为第一识别模型的训练样本中的正样本的一部分，然后再从网络社区中筛选出一部分不包含负面关键词的评论，从该不包含负面关键词的评论中提取出关键词，将该不包含负面关键词的评论中的关键词替换为负面关键词，将替换后的评论作为第一识别模型的训练样本中的正样本的另一部分。其中，负面关键词具体可以从网络社区中被踩过很多次的评论中提取。

(2)获取待识别的评论和该待识别的评论的评论对象，通过对该待识别的评论进行分词构造该待识别的评论的文本特征，通过对该评论对象进行分词构造该评论对象的文本特征，构造该评论对象的数值特征和语气特征，其中，该数值特征包括该评论对象的长度和/或该评论对象包含的第一标点符号的数量，该语气特征包括该评论对象包含的语气词和表情符。

(3)通过将该待识别的评论的文本特征输入该融合识别模型的第一网络、将该评论对象的文本特征输入该融合识别模型的第二网络、将该评论对象的数值特征和语气特征输入该融合识别模型的第三网络得到该融合识别模型的分类器的输出，将该融合识别模型的分类器的输出作为表示该待识别的评论是否是负面的评论的识别结果。负面于社区讨论氛围的评论在示例中可包括阴阳怪气的评论或嘲讽式评论。

经过上述3个步骤即可对该待识别的评论是否是负面的评论进行识别。

下面，对本发明评论识别的装置和方法进行详细说明。

参看图1，本发明公开一种评论识别的装置，包括：

获取单元10，被配置成获取待识别的评论；以及

识别单元11，被配置成利用融合识别模型对该待识别的评论进行识别得到识别结果，其中，该融合识别模型的参数通过对预先训练好的第一识别模型的参数和迭代生出的第二识别模型的参数加权求和得到，该融合识别模型的架构相同于该第一识别模型的架构和该第二识别模型的架构的其中一者或任一者，该识别结果包括该待识别的评论是否属于负面于社区讨论氛围的评论的判断。

本实施例中，需要说明的是，该第一识别模型的架构和该第二识别模型的架构相同，该第一识别模型和该第二识别模型分别使用不同的训练样本进行训练。该识别模型的参数为对该第一识别模型的参数和该第二识别模型的参数加权求和的结果，其中，该第二识别模型的参数的权重大于该第一识别模型的参数的权重，具体该第一识别模型的参数的权重和该第二识别模型的参数的权重可以根据需要设置，只要保证二者之和为1即可。在确定出该识别模型的参数后，根据该识别模型的参数即可构建该识别模型。

本发明实施例提供的评论识别的装置，一方面，利用融合识别模型对待识别的评论进行识别得到该待识别的评论是否属于负面于社区讨论氛围的评论的判断的识别结果，相较于依靠人工识别的现有技术，能够提高识别的效率；另一方面，该融合识别模型的参数通过对预先训练好的第一识别模型的参数和迭代生出的第二识别模型的参数加权求和得到，从而相较于使用第一识别模型和第二识别模型，使用该融合识别模型能够从该待识别的评论中提取到更准确的特征，并根据提取到的特征得到更准确的识别结果，即本方案相较于现有技术，能提高负面评论识别的效率，并保证识别的精确度。

图2是根据本公开内容的另一个实施方式的评论识别的装置的示例性框图，参见图2，在前述装置实施例的基础上，该装置还可以包括：构建单元20，可以被配置成在第一时刻利用该第一识别模型的训练样本训练该第一识别模型，在第二时刻利用该第二识别模型的训练样本训练该第二识别模型，其中，该第一时刻早于该第二时刻，该第二识别模型的训练样本的真子集包括该第一识别模型的训练样本。

本实施例中，可以理解的是，网络社区中的评论随着时间的增长会越来越多，这时就可以在原有训练样本的基础上加入新的训练样本对第二识别模型进行模型训练，以此得到新的识别模型。举例来说，假设在t1时刻利用原有训练样本训练第一识别模型M1，在t2时刻利用包含原有训练样本的新的训练样本训练第二识别模型M2，则可以对第一识别模型M1的参数和第二识别模型M2的参数进行加权求和得到融合识别模型M的参数，根据融合识别模型M的参数构建架构与第一识别模型的架构相同的融合识别模型M。该新的训练样本可以通过在原有训练样本的基础上逐渐增加新的训练样本得到，增加的新的训练样本包括正样本和负样本。融合识别模型M可以周期性更新，其更新周期可以根据需要设置。在某一个周期到达时，在在上一个周期到达时训练第二识别模型M2所使用的训练样本的基础上增加一部分正样本和负样本构建新的训练样本，利用新的训练样本再次训练第二识别模型M2，然后对第一识别模型M1的参数和再次训练的第二识别模型M2的参数进行加权求和得到融合识别模型M的新参数，根据融合识别模型M的新参数重新构建融合识别模型M。

本实施例中，通过包含该第一识别模型的训练样本的该第二识别模型的训练样本训练该第二识别模型，并基于该第一识别模型和该第二识别模型构建该融合识别模型，相较于前述实施例，本实施例构建出的融合识别模型能从待识别的评论中提取到更准确的特征，因而识别准确度更高。

在前述装置实施例的基础上，该第二识别模型的架构可以包括第一网络、第二网络、第三网络、注意力层和分类器，其中，

本实施例中，需要说明的是，该第一网络和该第二网络的结构相同，均包含一个嵌入层和一个卷积神经网络，输入该第一网络、该第二网络的数据直接输入到对应的嵌入层，对应的嵌入层的输出输入到对应的卷积神经网络，对应的卷积神经网络的输出即为对应的该第一网络或该第二网络的输出。卷积神经网络可以使用ResNet网络。

该第三网络包括特征转换层和特征拼接层，输入该第三网络的数据直接输入到该特征转换层，该特征转换层的输出连同该第二网络的输出输入到该特征拼接层，该特征拼接层的输出即为该第三网络的输出。

该第一网络的输出和该第三网络的输出输入到该注意力层，该注意力层的输出输入到该分类器，该分类器的输出即为该识别模型的输出。

在前述装置实施例的基础上，该获取单元还可以被配置成获取该待识别的评论的评论对象；

该识别单元还可以被配置成构造该待识别的评论的文本特征和该评论对象的文本特征，以及该评论对象的数值特征和语气特征，通过将该待识别的评论的文本特征输入该融合识别模型的第一网络、将该评论对象的文本特征输入该融合识别模型的第二网络、将该评论对象的数值特征和语气特征输入该融合识别模型的第三网络得到该融合识别模型的分类器的输出，将该融合识别模型的分类器的输出作为该识别结果。

本实施例中，需要说明的是，对该待识别的评论进行识别时，输入到该融合识别模型中的数据包括：该待识别的评论的文本特征、该待识别的评论的评论对象的文本特征，以及该评论对象的数值特征和语气特征。通过将该待识别的评论的文本特征输入该融合识别模型的第一网络、将该评论对象的文本特征输入该融合识别模型的第二网络、将该评论对象的数值特征和语气特征输入该融合识别模型的第三网络，使该融合识别模型的三个网络中每个网络单独提取特征，相较于将所有数据拼接一起提取特征的常规分类方法，本发明实施例一方面提取的特征的种类较多，另一方面能够避免特征之间的干扰，使得本发明实施例提取的特征的准确性和稳定性较强，从而能够保证该待识别的评论是否是负面的评论的识别结果的准确性和稳定性。

在前述装置实施例的基础上，该识别单元还可以被配置成通过对该待识别的评论进行分词构造该待识别的评论的文本特征，通过对该评论对象进行分词构造该评论对象的文本特征，该数值特征包括该评论对象的长度和/或该评论对象包含的第一标点符号的数量，该语气特征包括该评论对象包含的语气词和表情符。

本实施例中，该待识别的评论的文本特征包括对该待识别的评论进行分词的分词结果，还可以包括该待识别的评论中的标点符号。该数值特征包括该评论对象的长度和/或该评论对象包含的第一标点符号的数量，其中，第一标点符号可以根据需要设置为句号、感叹号等。该语气特征包括该评论对象包含的语气词和表情符，其中，该评论对象包含的语气词的构造过程可以包括：从该评论对象中提取出关键词，识别提取出的关键词的词性，将词性为语气词的关键词作为该评论对象包含的语气词。

参看图3，本发明公开一种评论识别的方法，包括：

S30、获取待识别的评论；以及

S31、利用融合识别模型对该待识别的评论进行识别得到识别结果，其中，该融合识别模型的参数通过对预先训练好的第一识别模型的参数和迭代生出的第二识别模型的参数加权求和得到，该融合识别模型的架构相同于该第一识别模型的架构和该第二识别模型的架构的其中一者或任一者，该识别结果包括该待识别的评论是否属于负面于社区讨论氛围的评论的判断。

本发明实施例提供的评论识别的方法，一方面，利用融合识别模型对待识别的评论进行识别得到该待识别的评论是否属于负面于社区讨论氛围的评论的判断的识别结果，相较于依靠人工识别的现有技术，能够提高识别的效率；另一方面，该融合识别模型的参数通过对预先训练好的第一识别模型的参数和迭代生出的第二识别模型的参数加权求和得到，从而相较于使用第一识别模型和第二识别模型，使用该融合识别模型能够从该待识别的评论中提取到更准确的特征，并根据提取到的特征得到更准确的识别结果，即本方案相较于现有技术，能提高负面评论识别的效率，并保证识别的精确度。

图4是根据本公开内容的另一个实施方式的评论识别的方法的示例性流程图，参看图4，在前述方法实施例的基础上，在所述利用融合识别模型对该待识别的评论进行识别得到识别结果之前，该方法还可以包括：

S40、在第一时刻利用该第一识别模型的训练样本训练该第一识别模型，在第二时刻利用该第二识别模型的训练样本训练该第二识别模型，其中，该第一时刻早于该第二时刻，该第二识别模型的训练样本的真子集包括该第一识别模型的训练样本。

本实施例中，可以理解的是，网络社区中的评论随着时间的增长会越来越多，这时就可以在原有训练样本的基础上加入新的训练样本对第二识别模型进行模型训练，以此得到新的识别模型。举例来说，假设在t1时刻利用原有训练样本训练第一识别模型M1，在t2时刻利用包含原有训练样本的新的训练样本训练第二识别模型M2，则可以对第一识别模型M1的参数和第二识别模型M2的参数进行加权求和得到融合识别模型M的参数，根据融合识别模型M的参数构建架构与第一识别模型的架构相同的融合识别模型M。该新的训练样本可以通过在原有训练样本的基础上逐渐增加新的训练样本得到，增加的新的训练样本包括正样本和负样本。融合识别模型M的更新周期可以根据需要设置。在某一个周期到达时，在在上一个周期到达时训练第二识别模型M2所使用的训练样本的基础上增加一部分正样本和负样本构建新的训练样本，利用新的训练样本再次训练第二识别模型M2，然后对第一识别模型M1的参数和再次训练的第二识别模型M2的参数进行加权求和得到融合识别模型M的新参数，根据融合识别模型M的新参数重新构建融合识别模型M。

在前述方法实施例的基础上，该第二识别模型的架构可以包括第一网络、第二网络、第三网络、注意力层和分类器，其中，

在前述方法实施例的基础上，所述获取待识别的评论，还可以包括：

获取该待识别的评论的评论对象；

所述利用融合识别模型对该待识别的评论进行识别得到识别结果，可以包括：

构造该待识别的评论的文本特征和该评论对象的文本特征，以及该评论对象的数值特征和语气特征，通过将该待识别的评论的文本特征输入该融合识别模型的第一网络、将该评论对象的文本特征输入该融合识别模型的第二网络、将该评论对象的数值特征和语气特征输入该融合识别模型的第三网络得到该融合识别模型的分类器的输出，将该融合识别模型的分类器的输出作为该识别结果。

在前述方法实施例的基础上，所述构造该待识别的评论的文本特征和该评论对象的文本特征，以及该评论对象的数值特征和语气特征，可以包括：

通过对该待识别的评论进行分词构造该待识别的评论的文本特征，通过对该评论对象进行分词构造该评论对象的文本特征，该数值特征包括该评论对象的长度和/或该评论对象包含的第一标点符号的数量，该语气特征包括该评论对象包含的语气词和表情符。

上文已经参考附图描述了本公开的优选实施例，当然，本公开并不限于上面的示例。在所附的权利要求的范围内，本领域的技术人员可以进行各种改变和修改，并且应当明白，这些改变和修改自然落入本公开的技术范围内。

Claims

1.一种评论识别的装置，包括：

获取单元，被配置成获取待识别的评论；以及

2.根据权利要求1所述的装置，该装置还包括：构建单元，被配置成在第一时刻利用该第一识别模型的训练样本训练该第一识别模型，在第二时刻利用该第二识别模型的训练样本训练该第二识别模型，其中，该第一时刻早于该第二时刻，该第二识别模型的训练样本的真子集包括该第一识别模型的训练样本。

3.根据权利要求1或2所述的装置，其中，该第二识别模型的架构包括第一网络、第二网络、第三网络、注意力层和分类器，其中，

4.根据权利要求3所述的装置，其中，该获取单元还被配置成获取该待识别的评论的评论对象；

该识别单元还被配置成构造该待识别的评论的文本特征和该评论对象的文本特征，以及该评论对象的数值特征和语气特征，通过将该待识别的评论的文本特征输入该融合识别模型的第一网络、将该评论对象的文本特征输入该融合识别模型的第二网络、将该评论对象的数值特征和语气特征输入该融合识别模型的第三网络得到该融合识别模型的分类器的输出，将该融合识别模型的分类器的输出作为该识别结果。

5.根据权利要求4所述的装置，其中，该识别单元还被配置成通过对该待识别的评论进行分词构造该待识别的评论的文本特征，通过对该评论对象进行分词构造该评论对象的文本特征，该数值特征包括该评论对象的长度和/或该评论对象包含的第一标点符号的数量，该语气特征包括该评论对象包含的语气词和表情符。

6.一种评论识别的方法，包括：

获取待识别的评论；以及

7.根据权利要求6所述的方法，在所述利用融合识别模型对该待识别的评论进行识别得到识别结果之前，该方法还包括：

在第一时刻利用该第一识别模型的训练样本训练该第一识别模型，在第二时刻利用该第二识别模型的训练样本训练该第二识别模型，其中，该第一时刻早于该第二时刻，该第二识别模型的训练样本的真子集包括该第一识别模型的训练样本。

8.根据权利要求6或7所述的方法，其中，该第二识别模型的架构包括第一网络、第二网络、第三网络、注意力层和分类器，其中，

9.根据权利要求8所述的方法，其中，所述获取待识别的评论还包括：

获取该待识别的评论的评论对象；

所述利用融合识别模型对该待识别的评论进行识别得到识别结果，包括：

构造该待识别的评论的文本特征和该评论对象的文本特征，以及该评论对象的数值特征和语气特征，通过将该待识别的评论的文本特征输入该融合识别模型的第一网络、将该评论对象的文本特征输入该融合识别模型的第二网络、将该评论对象的数值特征和语气特征输入该识别模型的第三网络得到该融合识别模型的分类器的输出，将该融合识别模型的分类器的输出作为该识别结果。

10.根据权利要求9所述的方法，其中，所述构造该待识别的评论的文本特征和该评论对象的文本特征，以及该评论对象的数值特征和语气特征，包括：