CN117332084B

CN117332084B - 一种适用于同时检测恶意评论和虚假新闻的机器学习方法

Info

Publication number: CN117332084B
Application number: CN202311235587.XA
Authority: CN
Inventors: 谢成; 杨群; 周永鹏; 杨铁龙
Original assignee: Beijing Yuanhe Technology Co ltd
Current assignee: Beijing Yuanhe Technology Co ltd
Priority date: 2023-09-22
Filing date: 2023-09-22
Publication date: 2024-05-03
Anticipated expiration: 2043-09-22
Also published as: CN117332084A

Abstract

本发明提供一种适用于同时检测恶意评论和虚假新闻的方法，通过选取单独的恶意评论或虚假新闻检测中可能有效的可解释性参数集合以及对应的分类模型集合进行两两组合，并基于现有恶意评论资料集合A和虚假新闻资料集合B构成的合集C进行训练和验证，采用评估值=准确率+精确率+召回率+F1的评估指标对结果进行筛选，得到了一种可解释性参数与分类模型的优化组合，使其无论用于恶意评论还是虚假新闻的检测，都能获得较好的检测效果。

Description

一种适用于同时检测恶意评论和虚假新闻的机器学习方法

技术领域

本发明涉及自然语言处理领域，尤其是指一种适用于同时检测英文恶意评论和虚假新闻的方法。

背景技术

在现代社会中，随着互联网和社交媒体的普及，恶意评论和虚假新闻的问题逐渐凸显出来。恶意评论可能会给个人和社会带来负面影响，而虚假新闻可能会误导公众，破坏信息传播的可信度。因此，针对恶意评论和虚假新闻的准确检测和识别成为了当今信息社会中的重要问题。以往的检测技术通常是通过建立敏感词库，通过模板匹配的方法来检测；近年来，随着人工智能技术的快速发展，已经有人尝试通过人工智能来检测这种恶意评论或是虚假新闻，但现有的检测技术存在以下缺陷：一是所选的模型参数不具有可解释性，不利于模型的持续改进以及一些要求模型检测效果高度可控的场景；二是现有的检测方法往往只针对一种情形有较好的效果，例如采用的某种模型、参数组合在检测恶意评论时准确率较高，但用于检测虚假新闻时，由于虚假新闻相较于恶意评论文本较长、不包括明显的敏感词等特性，导致检测效果不佳，克服这个缺陷的方法通常是对同一文本分别采用适用于恶意评论和虚假新闻的两种不同算法进行两次检测，但这又会导致检测成本过高。

因而，如何选择合适的可解释性参数与特定的机器算法模型相结合，使其在检测恶意评论和虚假新闻时，都能获得较好的检测效果，是当前亟待解决的问题。

发明内容

本发明是为了解决上述问题而进行的，目的在于需求一种可解释性参数与机器学习模型的优化组合，使其无论用于恶意评论还是虚假新闻的检测，都能获得较好的检测效果。

本发明为了实现上述目的，采用以下方案：

本发明第一方面提供了一种适用于同时检测英文恶意评论和虚假新闻的方法，所述恶意评论为短文本结构，所述虚假新闻为长文本结构，所述方法包括以下步骤：

一、构建现有恶意评论资料集合A和虚假新闻资料集合B

对集合A进行二分类，将其中的数据分为伤害数据和无伤害数据；

对集合B进行二分类，将其中的数据分为伤害数据和无伤害数据；

二、构建混合文本资料集合C

从集合A中抽取部分伤害数据和无伤害数据构成集合A1，从集合B中抽取部分伤害数据和无伤害数据构成集合B1，将A1与B1合并构成集合C；

三、资料清理

对集合C中的数据进行英文断词，过滤标点符号、超链接、停用词，拼写检查；

四、待测试特征的提取

从集合C中提取出以下7种类别的待测试特征：

基础特征类别a，包括文本长度、文本中的全英大写字词出现次数、文本中大写字词出现次数与文本长度的比值、文本中出现数字的数量、文本中出现数字的数量与文本长度的比值、文本中的句子总数6个特征；

情感特征类别b，包括情感极性、愤怒、期待、厌恶、恐惧、喜悦、悲伤、惊讶、信任这9个特征；

词向量与段落向量特征类别c，包括由gensim模块提取出的50个Word2vec特征和50个Doc2vec特征；

BERT向量特征类别d，包括768个特征；

混合特征类别e，e为a，b两种类别的特征集合，包括15个特征；

混合特征类别f，f为a，b，c三种类别的特征集合，包括115个特征；

混合特征类别g，g为a，b，c，d四种类别的特征集合，包括883个特征；

五、构建训练集和测试集

将集合C拆分为训练集和测试集两部分，其中测试集由相同数量的伤害数据和无伤害数据组成，训练集则为集合C排除测试集之后剩余的数据集合；

六、选择待测试的分类模型

选择LR、SVM、MLP、XGBoot 4种模型作为待测试的分类模型；

七、确定最优特征与分类模型的组合

基于步骤五的训练集和测试集，将a、b、c、d、e、f、g七组特征分别作为LR、SVM、MLP、XGBoot四个模型的输入特征进行训练和测试，获得28个评估值组成的评估值集合E＝{e_1,e₂,…,e₂₈}，其中每个评估值＝准确率+精确率+召回率+F1，选取集合E中最大的值对应的特征类别和分类模型作为最优特征与分类模型的组合；

八、判断当前文本是否为恶意评论或虚假新闻

基于步骤七选取的最优特征与分类模型的组合，提取当前文本中对应的特征并输入对应训练后的分类模型，判断出当前文本是否为恶意评论或虚假新闻。

优选的，所述集合A包括以下7种数据：

恶意：含有恶意内容的评论；

严重恶意：恶意程度更加严重的评论内容；

淫秽：含有淫秽用语的评论内容；

威胁：含有威胁意图的评论内容；

侮辱：对目标有针对性侮辱的内容；

身分仇恨：针对目标的种族、身分带有仇恨攻击意图的内容；

非恶意：未含恶意或伤害意图的评论；

所述集合B包含有虚假新闻和真实新闻两种数据；

所述对集合A进行二分类，将其中的数据分为伤害数据和无伤害数据，对集合B进行二分类，将其中的数据分为伤害数据和无伤害数据包括：对集合A进行二分类，其中恶意、严重恶意、淫秽、威胁、侮辱、身份仇恨6种数据对应为伤害数据，非恶意数据对应为无伤害数据；对集合B进行二分类，其中虚假新闻对应为伤害数据，真实新闻对应为无伤害数据。

优选的，从集合A中抽取部分伤害数据和无伤害数据构成集合A1，从集合B中抽取部分伤害数据和无伤害数据构成集合B1，将A1与B1合并构成集合C包括：从集合A中抽取出δ笔伤害数据与δ笔无伤害数据构成集合A1，从集合B中抽取出δ笔伤害数据与δ笔无伤害数据构成集合B1，将A1与B1合并构成集合C。

优选的，步骤五中，测试集中的数据量为集合C的20％。

本发明第二方面提供了一种适用于同时检测英文恶意评论和虚假新闻的方法，所述恶意评论为短文本结构，所述虚假新闻为长文本结构，所述方法包括以下步骤：

一、构建现有恶意评论资料集合A和虚假新闻资料集合B

二、构建混合文本资料集合C

三、资料清理

四、文本特征的提取

从集合C中提取出以下4种类别的特征：

BERT向量特征类别d，包括768个特征；

五、模型训练

将混合特征类别g包含的883个特征作为输入特征，基于集合C来训练SVM模型；

六、判断当前文本是否为恶意评论或虚假新闻

基于混合特征类别g提取当前文本中对应的883个特征并输入训练后的SVM模型，判断当前文本是否为恶意评论或虚假新闻。

优选的，所述集合A包括以下7种数据：

恶意：含有恶意内容的评论；

严重恶意：恶意程度更加严重的评论内容；

淫秽：含有淫秽用语的评论内容；

威胁：含有威胁意图的评论内容；

侮辱：对目标有针对性侮辱的内容；

非恶意：未含恶意或伤害意图的评论；

所述集合B包含有虚假新闻和真实新闻两种数据；

发明的作用与效果

本发明通过选取单独的恶意评论或虚假新闻检测中可能有效的可解释性参数集合以及对应的分类模型集合进行两两组合，并基于现有恶意评论资料集合A和虚假新闻资料集合B构成的合集C进行训练和验证，采用评估值＝准确率+精确率+召回率+F1的评估指标对结果进行筛选，得到了一种可解释性参数与分类模型的优化组合，使其无论用于恶意评论还是虚假新闻的检测，都能获得较好的检测效果。

附图说明

图1为本发明实施例1的流程图；

图2为本发明实施例2的流程图。

具体实施方式

下面结合实施例对本发明做进一步说明。

本发明的实施例1：

如图1所示，本发明适用于同时检测恶意评论和虚假新闻的方法实现如下：

一种适用于同时检测英文恶意评论和虚假新闻的方法，所述恶意评论为短文本结构，所述虚假新闻为长文本结构，所述方法包括以下步骤：

一、构建现有恶意评论资料集合A和虚假新闻资料集合B

所述集合A包括以下7种数据：

恶意：含有恶意内容的评论；

严重恶意：恶意程度更加严重的评论内容；

淫秽：含有淫秽用语成分的评论内容；

威胁：含有威胁意图的评论内容；

侮辱：对目标有针对性侮辱的内容；

非恶意：未含恶意或伤害意图的评论；

对集合A进行二分类，其中恶意、严重恶意、淫秽、威胁、侮辱、身份仇恨6种数据对应为伤害数据，非恶意数据对应为无伤害数据；

所述集合B包含有虚假新闻和真实新闻两种数据，对集合B进行二分类，其中虚假新闻对应为伤害数据，真实新闻对应为无伤害数据；

二、构建混合文本资料集合C

从集合A中抽取出δ笔伤害数据与δ笔无伤害数据构成集合A1，从集合B中抽取出δ笔伤害数据与δ笔无伤害数据构成集合B1，将A1与B1合并构成集合C；

三、资料清理

四、待测试特征的提取

从集合C中提取出以下7种类别的待测试特征：

BERT向量特征类别d，包括768个特征；

可以看到，上述7种类别的待测试特征共同的特点是都具有可解释性；

五、构建训练集和测试集

将集合C拆分为训练集和测试集两部分，其中测试集由相同数量的伤害数据和无伤害数据组成，且测试集中的数据量为集合C的20％，训练集则为集合C排除测试集之后剩余的数据集合；

六、选择待测试的分类模型

选择LR、SVM、MLP、XGBoot 4种模型作为待测试的分类模型；

七、确定最优特征与分类模型的组合

基于步骤五的训练集和测试集，将a，b，c，d，e，f，g七组特征分别作为LR/SVM/MLP/XGBoot模型的输入特征进行训练和测试，获得28组评估值组成的评估值集合E＝{e_1,e₂,…,e₂₈}，其中每个评估值＝准确率+精确率+召回率+F1，选取集合E中最大的值对应的特征类别和分类模型作为最优特征与分类模型的组合；

八、判断当前文本是否为恶意评论或虚假新闻

基于步骤七选取的最优特征与分类模型的组合，提取当前文本中对应的特征并输入对应分类模型，判断出当前文本是否为恶意评论或虚假新闻。

这里的恶意评论资料集合A可以是数据建模与分析竞赛平台－Kaggle网站上的知名恶意评论分类竞赛(Toxic Comment Classification Challenge)所提供的数据集(Kaggle，2017)。虚假新闻资料集合B可以是Kaggle平台上的Fake and Real News Dataset(Ahmed et al.,2017,2018)，内容由2016年间美国政治类的真实与虚假新闻文章所组成。

当采用上述数据集执行该实施例技术方案时，在步骤七获得了如表1所示的28组评估结果，可以看到，对于混合文本资料集合C而言，目前最好的特征类别与分类器组合是使用基础+情感+词向量与段落向量+BERT特征的所有特征类别组合(编号g)，与其搭配的分类器为SVM分类器。

表1

基于上述实验结果，进一步可以得到本发明的实施例2：

如图2所示，本发明适用于同时检测恶意评论和虚假新闻的方法实现如下：

一、构建现有恶意评论资料集合A和虚假新闻资料集合B

所述集合A包括以下7种数据：

恶意：含有恶意内容的评论；

严重恶意：恶意程度更加严重的评论内容；

淫秽：含有淫秽用语成分的评论内容；

威胁：含有威胁意图的评论内容；

侮辱：对目标有针对性侮辱的内容；

非恶意：未含恶意或伤害意图的评论；

所述集合B包含有虚假新闻和真实新闻两种数据；

对集合A进行二分类，其中恶意、严重恶意、淫秽、威胁、侮辱、身份仇恨6种数据对应为伤害数据，非恶意数据对应为无伤害数据；对集合B进行二分类，其中虚假新闻对应为伤害数据，真实新闻对应为无伤害数据；

二、构建混合文本资料集合C

三、资料清理

四、文本特征的提取

从集合C中提取出以下4种类别的特征：

BERT向量特征类别d，包括768个特征；

五、模型训练

六、判断当前文本是否为恶意评论或虚假新闻

基于以上实施例可以看到，本发明提供的检测方法可以仅用一套参数和算法的组合，就能够检测恶意评论和虚假新闻的混合文本，其手段是通过选取单独的恶意评论或虚假新闻检测中可能有效的可解释性参数集合以及对应的分类模型集合进行两两组合，并基于现有恶意评论资料集合A和虚假新闻资料集合B构成的合集C进行训练和验证，采用评估值＝准确率+精确率+召回率+F1的评估指标对结果进行筛选，从而得到一种可解释性参数与分类模型的优化组合，使其无论用于恶意评论还是虚假新闻的检测，都能获得较好的检测效果。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种适用于同时检测英文恶意评论和虚假新闻的方法，所述恶意评论为短文本结构，所述虚假新闻为长文本结构，其特征在于,所述方法包括以下步骤：

一、构建现有恶意评论资料集合A和虚假新闻资料集合B

在现有恶意评论资料集合A和虚假新闻资料集合B的基础上，

对集合A进行二分类，将其中的数据分为伤害数据和无伤害数据，其中伤害数据对应于恶意评论，无伤害数据对应于非恶意评论；

对集合B进行二分类，将其中的数据分为伤害数据和无伤害数据，其中伤害数据对应于虚假新闻，无伤害数据对应于真实新闻；

二、构建混合文本资料集合C

三、资料清理

四、待测试特征的提取

从集合C中提取出以下7种类别的待测试特征：

基础特征类别a，包括文本长度、文本中的全英大写字词出现次数、文本中大写字词出现次数与文本长度的比值、文本中出现数字的数量、文本中出现数字的数量与文本长度的比值、文本中的句子总数这6个特征；

BERT向量特征类别d，包括768个特征；

五、构建训练集和测试集

六、选择待测试的分类模型

选择LR、SVM、MLP、XGBoot 4种模型作为待测试的分类模型；

七、确定最优特征与分类模型的组合

八、判断当前文本是否为恶意评论或虚假新闻

2.根据权利要求1所述的方法，其特征在于，所述集合A包括以下7种数据：

恶意：含有恶意内容的评论；

严重恶意：恶意程度更加严重的评论内容；

淫秽：含有淫秽用语的评论内容；

威胁：含有威胁意图的评论内容；

侮辱：对目标有针对性侮辱的内容；

身份仇恨：针对目标的种族、身份带有仇恨攻击意图的内容；

非恶意：未含恶意或伤害意图的评论；

所述集合B包含有虚假新闻和真实新闻两种数据；

3.根据权利要求1所述的方法，其特征在于，从集合A中抽取部分伤害数据和无伤害数据构成集合A1，从集合B中抽取部分伤害数据和无伤害数据构成集合B1，将A1与B1合并构成集合C包括：从集合A中抽取出δ笔伤害数据与δ笔无伤害数据构成集合A1，从集合B中抽取出δ笔伤害数据与δ笔无伤害数据构成集合B1，将A1与B1合并构成集合C，其中δ为大于零的整数。

4.根据权利要求1所述的方法，其特征在于，步骤五中，测试集中的数据量为集合C的20％。

5.一种适用于同时检测英文恶意评论和虚假新闻的方法，所述恶意评论为短文本结构，所述虚假新闻为长文本结构，所述方法包括以下步骤：

一、构建现有恶意评论资料集合A和虚假新闻资料集合B

二、构建混合文本资料集合C

三、资料清理

四、文本特征的提取

从集合C中提取出以下4种类别的特征：

BERT向量特征类别d，包括768个特征；

进而得到混合特征类别g，g为a，b，c，d四种类别的特征集合，包括883个特征；

五、模型训练

六、判断当前文本是否为恶意评论或虚假新闻

6.根据权利要求5所述的方法，其特征在于，所述集合A包括以下7种数据：

恶意：含有恶意内容的评论；

严重恶意：恶意程度更加严重的评论内容；

淫秽：含有淫秽用语的评论内容；

威胁：含有威胁意图的评论内容；

侮辱：对目标有针对性侮辱的内容；

非恶意：未含恶意或伤害意图的评论；

所述集合B包含有虚假新闻和真实新闻两种数据；

7.根据权利要求5所述的方法，其特征在于，从集合A中抽取部分伤害数据和无伤害数据构成集合A1，从集合B中抽取部分伤害数据和无伤害数据构成集合B1，将A1与B1合并构成集合C包括：从集合A中抽取出δ笔伤害数据与δ笔无伤害数据构成集合A1，从集合B中抽取出δ笔伤害数据与δ笔无伤害数据构成集合B1，将A1与B1合并构成集合C。