CN114615667B

CN114615667B - 一种网络舆情告警风暴抑制方法

Info

Publication number: CN114615667B
Application number: CN202210512805.9A
Authority: CN
Inventors: 曾曦; 廖方圆; 魏刚; 刘锟; 张毅; 胡瑞雪; 蒲存伟; 蒋涛
Original assignee: Chengdu Rongwei Software Service Co ltd; CETC 30 Research Institute
Current assignee: Chengdu Rongwei Software Service Co ltd; CETC 30 Research Institute
Priority date: 2022-05-12
Filing date: 2022-05-12
Publication date: 2022-09-23
Anticipated expiration: 2042-05-12
Also published as: CN114615667A

Abstract

本发明提供了一种网络舆情告警风暴抑制方法，包括：步骤1、接收传统关键字告警触发机制产生的原始告警数据流；步骤2、将原始告警数据流划分为多条事件告警数据子流；步骤3、将事件告警数据子流推送到告警风暴抑制层，通过告警风暴抑制层内部的抑制规则进行拦截或归并，降低告警噪音；步骤4、输出抑制后的告警信息，将告警信息托送给用户，同时提示告警原因。本发明提出的方案兼容现有舆情告警机制，采用即插即用的动态抑制层机制，仅产生热度急剧变化、重要媒体提及等关键告警点，符合人的注意力关注规律，有效抑制了告警风暴产生；具备反馈优化机制，通过用户提交的告警反馈信息，对当前抑制规则进行调整，进一步提升告警抑制准确率。

Description

一种网络舆情告警风暴抑制方法

技术领域

本发明涉及认知域网络安全领域，特别涉及一种网络舆情告警风暴抑制方法。

背景技术

随着移动智能设备和互联网的普及，大量网民通过论坛、社交媒体等互联网应用分享身边所发生的事并对网络中的事件发表自己的评论，由于互联网传播具有全天候、突发性及快速性等特点，一个地方性的小事件很容易就会演变成具有较大影响力的全国性舆情事件，甚至有些不法分子还会利用网络来扭曲真相传播谣言，如果不加控制就会给社会造成极大的负面影响。因此对网信办、公安等管理机构而言，如何准确、实时的从海量的互联网信息中获取到民众关心和讨论的热点事件或者话题，识别其中可能引起较大影响的不良事件进行提前告警格外重要。

现有的舆情告警技术存在以下问题：

（1）对每条单一的网络信息进行关键词组合匹配、正负面判断，规则过于简单，缺乏时间跨度上的整体分析，未能体现网络舆情事件是由大量关联信息构成并具有产生、潜伏、爆发、衰落周期等传播特征，对同一事件易反复触发告警，从而形成告警风暴。

（2）告警信息与用户关注点未关联，触发告警的根本原因未报告，容易导致用户忽视关键性告警。

（3）未建立告警反馈机制，用户不关注的告警信息未反馈给告警算法模型进行调整，非重要告警还会反复持续推送。

发明内容

针对现有的舆情告警方法存在的告警信息过多过频、告警根因不明、无反馈改良机制等问题，提出了一种网络舆情告警风暴抑制方法，该方法可应用于各类舆情监测系统，将现有告警识别机制前置，仅作为预判断环节，同时引入多层面告警风暴抑制方法，对非重要告警进行过滤降频。

本发明采用的技术方案如下：一种网络舆情告警风暴抑制方法，包括：

步骤1、接收传统关键字告警触发机制产生的原始告警数据流；

步骤2、将原始告警数据流划分为多条事件告警数据子流；

步骤3、将事件告警数据子流推送到告警风暴抑制层，通过告警风暴抑制层内部的抑制规则进行拦截或归并，降低告警噪音；

步骤4、输出抑制后的告警信息，将告警信息推送给用户，同时提示告警原因。

进一步的，还包括步骤5，若用户判断收到的某一条告警通知为告警噪音，通过反向传输通道反馈抑制请求至告警风暴抑制层，告警风暴抑制层分析该请求特征，调整对应的抑制规则参数；后续如产生具有相同特征的告警，则对其进行抑制。

进一步的，所述步骤3中，告警风暴抑制层包括热度变化抑制层、榜单变化抑制层以及传播媒体置信度抑制层，事件告警数据子流中每个话题分别经热度变化抑制层、榜单变化抑制层以及传播媒体置信度抑制层的抑制规则判断，满足抑制规则的话题进行告警抑制，不满足抑制规则的话题，则产生正式告警信息并反馈告警原因；对于同一事件在多个抑制层同时产生的告警信息，将其融合为一条告警信息推送。

进一步的，所述热度变化抑制层工作过程为：

步骤3.1.1、计算事件告警数据子流中每个话题的热度；

步骤3.1.2、利用线性回归算法得到每个话题的热度随时间的变化函数，计算变化函数的导数，从而得到热度在每个时刻的变化率；

步骤3.1.3、判断热度变化率是否大于设定的阈值，若是，则对该话题产生正式告警信息并反馈告警原因；若否，则进行告警抑制。

进一步的，热度的计算方法为：

其中，

指的是每个话题中第j个帖子数据的热度值，

指的是第j个帖子数据的点赞数，

指的是第j个帖子数据的转发数，

是指第j个帖子数据的评论数，a、b、c分别为计算话题热度时点赞数、转发数、评论数的权重值，

、

、

分别表示该帖子所附带的点赞、转发、评论信息的权威度的加权和，

中x取值为a、b、c，

表示点赞、转发或者评论该帖子的第i个用户的权威度；

指的是第i个话题的热度值，它由该话题中所包含的所有帖子附带的热度值计算加权算术和得到，

为每个帖子发帖者的权威度，n为每个话题中包含的帖子的个数。

进一步的，榜单变化印制层的工作过程为：

步骤3.2.1、计算事件告警数据子流中每个话题与重要社交媒体榜单中话题的相似度，判断该相似度是否大于设定的阈值，若是则进入步骤3.2.2，若否则进入步骤3.2.5；

步骤3.2.2、判断该话题在重要社交媒体榜单上的排名是否上升，若否则进入步骤3.2.3，若是则进入步骤3.2.6；

步骤3.2.3、计算每个话题与本地热点话题榜单中话题的相似度，若该相似度大于设定的阈值，则进入步骤3.2.4；若小于设定阈值，则进入步骤3.2.5；

步骤3.2.4、判断该话题在本地热点话题榜单上的排名是否上升，若上升，则进入步骤3.2.6；若没有上升，则进入步骤3.2.5；

步骤3.2.5、对该话题进行告警抑制；

步骤3.2.6、对该话题产生正式告警并反馈告警原因。

进一步的，所述步骤3.2.1或3.2.3中相似度计算方法为：

其中，

为两个话题之间的相似度，

、

分别表示话题a和话题b的关键词列表，

表示两个话题列表中重复关键词的个数。

进一步的，传播媒体置信度抑制层的工作过程为：

步骤3.3.1、获取事件告警数据子流中每个话题中被传播媒体提及的次数，其中，传播媒体由用户根据需求选择设定；

步骤3.3.2、计算传播媒体置信度，判断传播媒体置信度是否大于设定的阈值，若是，则对对应话题产生正式告警；若否，则对该话题进行告警抑制。

进一步的，所述传播媒体置信度的计算方法为：

其中，

表示话题的传播媒体置信度，

表示第i个传播媒体平台的权重，根据每个传播媒体自身的影响力大小来确定，

表示该话题被第i个传播媒体提及的次数，M表示用户定义的传播媒体平台的个数。

进一步的，所述步骤5的具体过程为：

步骤5.1、根据用户反馈将告警信息划分为错误告警、重复告警和正确告警，并统计单位时间内每个告警原因产生的错误告警或重复告警的次数；

步骤5.2、判断每个告警原因产生的错误告警或重复告警的次数是否大于设定的阈值，若是，则将该告警原因对应的告警信息作为告警噪声，反馈至对应的告警风暴抑制层中，调整对应抑制规则。

与现有技术相比，采用上述技术方案的有益效果为：

（1）对现有舆情告警机制全面兼容，由于网络舆情告警抑制方法作为现有告警数据流的后置处理，数据格式、接口可以沿用，具有良好的适应性。

（2）采用即插即用的动态抑制层机制，通过插入事件热度过滤、榜单变化过滤、传播媒体置信度过滤等层面对前置生成的告警数据流进行抑制，告警信息被归并、拦截后，仅产生热度急剧变化、重要媒体提及等关键告警点，符合人的注意力关注规律，有效抑制了告警风暴产生。

（3）具备反馈优化机制，通过用户客户端提交的告警反馈信息，抽取生成特征后对当前运行抑制层规则进行调整，能够进一步提升告警抑制准确率。

附图说明

图1为本发明提出的网络舆情告警风暴抑制方法流程图。

图2为本发明中热度变化抑制层工作流程图。

图3为本发明中榜单变化抑制层工作流程图。

图4为本发明中传播媒体置信度抑制层工作流程图。

图5为本发明中反馈优化机制流程图。

具体实施方式

下面详细描述本申请的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的，仅用于解释本申请，而不能理解为对本申请的限制。相反，本申请的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。

由于现有的舆情告警方法存在的告警信息过多过频、告警根因不明、无反馈改良机制等问题，本实施例提出了一种网络舆情告警风暴抑制方法，能够应用于各类舆情监测系统，将现有的告警识别机制前置，仅作为预判断环节，同时引入多层面告警风暴抑制方法，对非重要告警进行过滤降频。如图1所示，一种网络舆情告警风暴抑制方法，具体包括：

步骤2、将原始告警数据流划分为多条事件告警数据子流；

步骤4、输出抑制后的告警信息，将告警信息推送给用户，同时提示告警原因，最终在用户终端显示。

需要说明的是，本实施例步骤1中原始告警数据流可根据现有的前置告警源直接获取，为现有方法，在此不做赘述。

具体的，步骤2中可采用聚类或者分类的方法将告警数据流划分为多条事件告警数据子流。

同时为了保证告警信息抑制的准确性，在本抑制方法中，还引入了正反馈机制，通过用户在客户端提交的告警反馈信息，抽取生成特征后对当前运行抑制层规则进行调整，能够进一步提升告警抑制准确率。具体的，还包括步骤5，若用户判断收到的某一条告警通知为告警噪音，通过反向传输通道反馈抑制请求至告警风暴抑制层，告警风暴抑制层分析该请求特征，调整对应的抑制规则参数；后续如产生具有相同特征的告警，则对其进行抑制。

在本实施例中，如图1所示，将告警风暴抑制层分为了热度变化抑制层、榜单变化抑制层以及传播媒体置信度抑制层三层，事件告警数据子流中每个话题分别经热度变化抑制层、榜单变化抑制层以及传播媒体置信度抑制层的抑制规则判断，满足抑制规则的话题进行告警抑制，不满足抑制规则的话题，则产生正式告警信息并反馈告警原因；对于同一事件在多个抑制层同时产生的告警信息，将其融合为一条告警信息推送。通过将抑制规则划分成热度、榜单变化、传煤体置信度三类，符合人的注意力关注规律，能够有效抑制告警风暴产生。

具体的，在热度变化抑制层中，主要是通过每个话题所携带的发帖数、点赞数、转发数以及评论数来计算每个话题在不同时间点的热度，以及热度的变化率，从而来判断该话题是否应当产生正式的告警通知，如图2所示，该层的具体抑制告警过程为：

步骤3.1.1、计算事件告警数据子流中每个话题的热度；

步骤3.1.2、利用线性回归算法得到每个话题的热度随时间的变化函数，计算变化函数在每个时间点上的导数，从而得到热度在每个时刻的变化率；

同时针对该层，在本实施例中提出的对应的热度的计算方法为：

其中，

指的是每个话题中第j个帖子数据的热度值，

指的是第j个帖子数据的点赞数，

指的是第j个帖子数据的转发数，

是指第j个帖子数据的评论数，a、b、c分别为计算话题热度时点赞数、转发数、评论数的权重值，在权重值a、b、c的计算过程中：首先分别计算每个事件告警数据子流中所有帖子点赞数、转发数、评论数的累加和，然后将点赞数的权重a确定为1，将点赞数累加和除以转发数、评论数累加和的结果分别作为转发数和评论数的权重b,c的值。

、

、

中x取值为a、b、c，

表示点赞、转发或者评论该帖子的第i个用户的权威度；

在榜单抑制层中，主要利用相似度算法计算每个话题与用户定义的重要社交媒体热点话题榜单中话题的相似度，以及每个话题与用户定义的本地热点话题榜单中话题的相似度情况来进行告警抑制，如图3所示，该层的告警抑制过程具体为：

步骤3.2.5、对该话题进行告警抑制；

步骤3.2.6、对该话题产生正式告警并反馈告警原因。

同时，本实施例提出了对应的相似度计算方法为：

其中，

为两个话题之间的相似度，

、

分别表示话题a和话题b的关键词列表，

表示两个话题列表中重复关键词的个数。

在传播媒体置信度抑制层中，本实施例主要对事件告警数据子流中每个话题深入挖掘其中所隐含的传播媒体置信度信息，并根据传播媒体的置信度大小，来判断是否对舆情告警话题进行抑制，对不同传播媒体置信度的话题进行不同的处理，对于传播媒体置信度低的网络舆情告警话题进行抑制，而对于传播媒体置信度高的网络舆情告警话题则产生一次正式告警。其中传播媒体榜单根据用户自身的应用需求，根据不同的应用场景自行定义，每个话题中传播媒体的置信度由话题中每个帖子所涉及到的传播媒体出现的次数以及每个传播媒体自身的影响力权重来确定。具体的，如图4所示，该层的告警抑制过程为：

其中，传播媒体置信度的计算方法为：

其中，

表示话题的传播媒体置信度，

在本实施例中，引入反馈优化机制的主要目的是利用使用者的反馈信息，来更新算法模型的参数和设定的阈值，使得在保证对舆情告警风暴信息有效抑制的情况下，提高该算法模型的准确性。如图5所示，反馈优化机制的具体过程为：

步骤5.2、判断每个告警原因产生的错误告警或重复告警的次数是否大于设定的阈值，若是，则将该告警原因对应的告警信息作为告警噪声，反馈至对应的告警风暴抑制层中，调整对应抑制规则。其中，调整对应抑制规则是指对设定的阈值进行调整。

例如，在一段时间内，用户反馈基于热度产生的告警信息具有较多错误告警信息和重复告警信息，则将这些错误告警信息作为负样本，利用这些样本来修正热度抑制层的参数，从而减少热度抑制层产生的错误或者重复告警信息。

需要说明的是，在本发明实施例的描述中，除非另有明确的规定和限定，术语“设置”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是直接连接，也可以通过中间媒介间接连接。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义；实施例中的附图用以对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

尽管上面已经示出和描述了本申请的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本申请的限制，本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种网络舆情告警风暴抑制方法，其特征在于，包括：

步骤2、将原始告警数据流划分为多条事件告警数据子流；

步骤4、输出抑制后的告警信息，将告警信息推送给用户，同时提示告警原因

所述步骤3中，告警风暴抑制层包括热度变化抑制层、榜单变化抑制层以及传播媒体置信度抑制层，事件告警数据子流中每个话题分别经热度变化抑制层、榜单变化抑制层以及传播媒体置信度抑制层的抑制规则判断，满足抑制规则的话题进行告警抑制，不满足抑制规则的话题，则产生正式告警信息并反馈告警原因；对于同一事件在多个抑制层同时产生的告警信息，将其融合为一条告警信息推送；

所述热度变化抑制层工作过程为：

步骤3.1.1、计算事件告警数据子流中每个话题的热度；

步骤3.1.3、判断热度变化率是否大于设定的阈值，若是，则对该话题产生正式告警信息并反馈告警原因；若否，则进行告警抑制；

所述榜单变化抑制层工作过程为：步骤3.2.1、计算事件告警数据子流中每个话题与重要社交媒体榜单中话题的相似度，判断该相似度是否大于设定的阈值，若是则进入步骤3.2.2，若否则进入步骤3.2.5；

步骤3.2.5、对该话题进行告警抑制；

步骤3.2.6、对该话题产生正式告警并反馈告警原因；

所述传播媒体置信度抑制层工作过程为：获取事件告警数据子流中每个话题被传播媒体提及的次数，并根据对应传播媒体的置信度大小，判断是否对舆情告警话题进行抑制；

热度的计算方法为：