CN114615667B - 一种网络舆情告警风暴抑制方法 - Google Patents

一种网络舆情告警风暴抑制方法 Download PDF

Info

Publication number
CN114615667B
CN114615667B CN202210512805.9A CN202210512805A CN114615667B CN 114615667 B CN114615667 B CN 114615667B CN 202210512805 A CN202210512805 A CN 202210512805A CN 114615667 B CN114615667 B CN 114615667B
Authority
CN
China
Prior art keywords
alarm
topic
suppression
storm
suppression layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210512805.9A
Other languages
English (en)
Other versions
CN114615667A (zh
Inventor
曾曦
廖方圆
魏刚
刘锟
张毅
胡瑞雪
蒲存伟
蒋涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Rongwei Software Service Co ltd
CETC 30 Research Institute
Original Assignee
Chengdu Rongwei Software Service Co ltd
CETC 30 Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Rongwei Software Service Co ltd, CETC 30 Research Institute filed Critical Chengdu Rongwei Software Service Co ltd
Priority to CN202210512805.9A priority Critical patent/CN114615667B/zh
Publication of CN114615667A publication Critical patent/CN114615667A/zh
Application granted granted Critical
Publication of CN114615667B publication Critical patent/CN114615667B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/80Arrangements enabling lawful interception [LI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/30Network architectures or network communication protocols for network security for supporting lawful interception, monitoring or retaining of communications or communication related information
    • H04L63/302Network architectures or network communication protocols for network security for supporting lawful interception, monitoring or retaining of communications or communication related information gathering intelligence information for situation awareness or reconnaissance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Technology Law (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Alarm Systems (AREA)

Abstract

本发明提供了一种网络舆情告警风暴抑制方法,包括:步骤1、接收传统关键字告警触发机制产生的原始告警数据流;步骤2、将原始告警数据流划分为多条事件告警数据子流;步骤3、将事件告警数据子流推送到告警风暴抑制层,通过告警风暴抑制层内部的抑制规则进行拦截或归并,降低告警噪音;步骤4、输出抑制后的告警信息,将告警信息托送给用户,同时提示告警原因。本发明提出的方案兼容现有舆情告警机制,采用即插即用的动态抑制层机制,仅产生热度急剧变化、重要媒体提及等关键告警点,符合人的注意力关注规律,有效抑制了告警风暴产生;具备反馈优化机制,通过用户提交的告警反馈信息,对当前抑制规则进行调整,进一步提升告警抑制准确率。

Description

一种网络舆情告警风暴抑制方法
技术领域
本发明涉及认知域网络安全领域,特别涉及一种网络舆情告警风暴抑制方法。
背景技术
随着移动智能设备和互联网的普及,大量网民通过论坛、社交媒体等互联网应用分享身边所发生的事并对网络中的事件发表自己的评论,由于互联网传播具有全天候、突发性及快速性等特点,一个地方性的小事件很容易就会演变成具有较大影响力的全国性舆情事件,甚至有些不法分子还会利用网络来扭曲真相传播谣言,如果不加控制就会给社会造成极大的负面影响。因此对网信办、公安等管理机构而言,如何准确、实时的从海量的互联网信息中获取到民众关心和讨论的热点事件或者话题,识别其中可能引起较大影响的不良事件进行提前告警格外重要。
现有的舆情告警技术存在以下问题:
(1)对每条单一的网络信息进行关键词组合匹配、正负面判断,规则过于简单,缺乏时间跨度上的整体分析,未能体现网络舆情事件是由大量关联信息构成并具有产生、潜伏、爆发、衰落周期等传播特征,对同一事件易反复触发告警,从而形成告警风暴。
(2)告警信息与用户关注点未关联,触发告警的根本原因未报告,容易导致用户忽视关键性告警。
(3)未建立告警反馈机制,用户不关注的告警信息未反馈给告警算法模型进行调整,非重要告警还会反复持续推送。
发明内容
针对现有的舆情告警方法存在的告警信息过多过频、告警根因不明、无反馈改良机制等问题,提出了一种网络舆情告警风暴抑制方法,该方法可应用于各类舆情监测系统,将现有告警识别机制前置,仅作为预判断环节,同时引入多层面告警风暴抑制方法,对非重要告警进行过滤降频。
本发明采用的技术方案如下:一种网络舆情告警风暴抑制方法,包括:
步骤1、接收传统关键字告警触发机制产生的原始告警数据流;
步骤2、将原始告警数据流划分为多条事件告警数据子流;
步骤3、将事件告警数据子流推送到告警风暴抑制层,通过告警风暴抑制层内部的抑制规则进行拦截或归并,降低告警噪音;
步骤4、输出抑制后的告警信息,将告警信息推送给用户,同时提示告警原因。
进一步的,还包括步骤5,若用户判断收到的某一条告警通知为告警噪音,通过反向传输通道反馈抑制请求至告警风暴抑制层,告警风暴抑制层分析该请求特征,调整对应的抑制规则参数;后续如产生具有相同特征的告警,则对其进行抑制。
进一步的,所述步骤3中,告警风暴抑制层包括热度变化抑制层、榜单变化抑制层以及传播媒体置信度抑制层,事件告警数据子流中每个话题分别经热度变化抑制层、榜单变化抑制层以及传播媒体置信度抑制层的抑制规则判断,满足抑制规则的话题进行告警抑制,不满足抑制规则的话题,则产生正式告警信息并反馈告警原因;对于同一事件在多个抑制层同时产生的告警信息,将其融合为一条告警信息推送。
进一步的,所述热度变化抑制层工作过程为:
步骤3.1.1、计算事件告警数据子流中每个话题的热度;
步骤3.1.2、利用线性回归算法得到每个话题的热度随时间的变化函数,计算变化函数的导数,从而得到热度在每个时刻的变化率;
步骤3.1.3、判断热度变化率是否大于设定的阈值,若是,则对该话题产生正式告警信息并反馈告警原因;若否,则进行告警抑制。
进一步的,热度的计算方法为:
Figure 100002_DEST_PATH_IMAGE001
Figure 393976DEST_PATH_IMAGE002
Figure 100002_DEST_PATH_IMAGE003
Figure 134399DEST_PATH_IMAGE004
Figure 100002_DEST_PATH_IMAGE005
Figure 365660DEST_PATH_IMAGE006
其中,
Figure 100002_DEST_PATH_IMAGE007
指的是每个话题中第j个帖子数据的热度值,
Figure 143648DEST_PATH_IMAGE008
指的是第j个帖子数据的点赞数,
Figure 100002_DEST_PATH_IMAGE009
指的是第j个帖子数据的转发数,
Figure 661217DEST_PATH_IMAGE010
是指第j个帖子数据的评论数,a、b、c分别为计算话题热度时点赞数、转发数、评论数的权重值,
Figure 100002_DEST_PATH_IMAGE011
Figure 764302DEST_PATH_IMAGE012
Figure 100002_DEST_PATH_IMAGE013
分别表示该帖子所附带的点赞、转发、评论信息的权威度的加权和,
Figure 923888DEST_PATH_IMAGE014
中x取值为a、b、c,
Figure 100002_DEST_PATH_IMAGE015
表示点赞、转发或者评论该帖子的第i个用户的权威度;
Figure 553452DEST_PATH_IMAGE016
指的是第i个话题的热度值,它由该话题中所包含的所有帖子附带的热度值计算加权算术和得到,
Figure 100002_DEST_PATH_IMAGE017
为每个帖子发帖者的权威度,n为每个话题中包含的帖子的个数。
进一步的,榜单变化印制层的工作过程为:
步骤3.2.1、计算事件告警数据子流中每个话题与重要社交媒体榜单中话题的相似度,判断该相似度是否大于设定的阈值,若是则进入步骤3.2.2,若否则进入步骤3.2.5;
步骤3.2.2、判断该话题在重要社交媒体榜单上的排名是否上升,若否则进入步骤3.2.3,若是则进入步骤3.2.6;
步骤3.2.3、计算每个话题与本地热点话题榜单中话题的相似度,若该相似度大于设定的阈值,则进入步骤3.2.4;若小于设定阈值,则进入步骤3.2.5;
步骤3.2.4、判断该话题在本地热点话题榜单上的排名是否上升,若上升,则进入步骤3.2.6;若没有上升,则进入步骤3.2.5;
步骤3.2.5、对该话题进行告警抑制;
步骤3.2.6、对该话题产生正式告警并反馈告警原因。
进一步的,所述步骤3.2.1或3.2.3中相似度计算方法为:
Figure 382868DEST_PATH_IMAGE018
其中,
Figure 100002_DEST_PATH_IMAGE019
为两个话题之间的相似度,
Figure 97883DEST_PATH_IMAGE020
Figure 100002_DEST_PATH_IMAGE021
分别表示话题a和话题b的关键词列表,
Figure 795581DEST_PATH_IMAGE022
表示两个话题列表中重复关键词的个数。
进一步的,传播媒体置信度抑制层的工作过程为:
步骤3.3.1、获取事件告警数据子流中每个话题中被传播媒体提及的次数,其中,传播媒体由用户根据需求选择设定;
步骤3.3.2、计算传播媒体置信度,判断传播媒体置信度是否大于设定的阈值,若是,则对对应话题产生正式告警;若否,则对该话题进行告警抑制。
进一步的,所述传播媒体置信度的计算方法为:
Figure 100002_DEST_PATH_IMAGE023
其中,
Figure 889439DEST_PATH_IMAGE024
表示话题的传播媒体置信度,
Figure 100002_DEST_PATH_IMAGE025
表示第i个传播媒体平台的权重,根据每个传播媒体自身的影响力大小来确定,
Figure 279969DEST_PATH_IMAGE026
表示该话题被第i个传播媒体提及的次数,M表示用户定义的传播媒体平台的个数。
进一步的,所述步骤5的具体过程为:
步骤5.1、根据用户反馈将告警信息划分为错误告警、重复告警和正确告警,并统计单位时间内每个告警原因产生的错误告警或重复告警的次数;
步骤5.2、判断每个告警原因产生的错误告警或重复告警的次数是否大于设定的阈值,若是,则将该告警原因对应的告警信息作为告警噪声,反馈至对应的告警风暴抑制层中,调整对应抑制规则。
与现有技术相比,采用上述技术方案的有益效果为:
(1)对现有舆情告警机制全面兼容,由于网络舆情告警抑制方法作为现有告警数据流的后置处理,数据格式、接口可以沿用,具有良好的适应性。
(2)采用即插即用的动态抑制层机制,通过插入事件热度过滤、榜单变化过滤、传播媒体置信度过滤等层面对前置生成的告警数据流进行抑制,告警信息被归并、拦截后,仅产生热度急剧变化、重要媒体提及等关键告警点,符合人的注意力关注规律,有效抑制了告警风暴产生。
(3)具备反馈优化机制,通过用户客户端提交的告警反馈信息,抽取生成特征后对当前运行抑制层规则进行调整,能够进一步提升告警抑制准确率。
附图说明
图1为本发明提出的网络舆情告警风暴抑制方法流程图。
图2为本发明中热度变化抑制层工作流程图。
图3为本发明中榜单变化抑制层工作流程图。
图4为本发明中传播媒体置信度抑制层工作流程图。
图5为本发明中反馈优化机制流程图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。相反,本申请的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
由于现有的舆情告警方法存在的告警信息过多过频、告警根因不明、无反馈改良机制等问题,本实施例提出了一种网络舆情告警风暴抑制方法,能够应用于各类舆情监测系统,将现有的告警识别机制前置,仅作为预判断环节,同时引入多层面告警风暴抑制方法,对非重要告警进行过滤降频。如图1所示,一种网络舆情告警风暴抑制方法,具体包括:
步骤1、接收传统关键字告警触发机制产生的原始告警数据流;
步骤2、将原始告警数据流划分为多条事件告警数据子流;
步骤3、将事件告警数据子流推送到告警风暴抑制层,通过告警风暴抑制层内部的抑制规则进行拦截或归并,降低告警噪音;
步骤4、输出抑制后的告警信息,将告警信息推送给用户,同时提示告警原因,最终在用户终端显示。
需要说明的是,本实施例步骤1中原始告警数据流可根据现有的前置告警源直接获取,为现有方法,在此不做赘述。
具体的,步骤2中可采用聚类或者分类的方法将告警数据流划分为多条事件告警数据子流。
同时为了保证告警信息抑制的准确性,在本抑制方法中,还引入了正反馈机制,通过用户在客户端提交的告警反馈信息,抽取生成特征后对当前运行抑制层规则进行调整,能够进一步提升告警抑制准确率。具体的,还包括步骤5,若用户判断收到的某一条告警通知为告警噪音,通过反向传输通道反馈抑制请求至告警风暴抑制层,告警风暴抑制层分析该请求特征,调整对应的抑制规则参数;后续如产生具有相同特征的告警,则对其进行抑制。
在本实施例中,如图1所示,将告警风暴抑制层分为了热度变化抑制层、榜单变化抑制层以及传播媒体置信度抑制层三层,事件告警数据子流中每个话题分别经热度变化抑制层、榜单变化抑制层以及传播媒体置信度抑制层的抑制规则判断,满足抑制规则的话题进行告警抑制,不满足抑制规则的话题,则产生正式告警信息并反馈告警原因;对于同一事件在多个抑制层同时产生的告警信息,将其融合为一条告警信息推送。通过将抑制规则划分成热度、榜单变化、传煤体置信度三类,符合人的注意力关注规律,能够有效抑制告警风暴产生。
具体的,在热度变化抑制层中,主要是通过每个话题所携带的发帖数、点赞数、转发数以及评论数来计算每个话题在不同时间点的热度,以及热度的变化率,从而来判断该话题是否应当产生正式的告警通知,如图2所示,该层的具体抑制告警过程为:
步骤3.1.1、计算事件告警数据子流中每个话题的热度;
步骤3.1.2、利用线性回归算法得到每个话题的热度随时间的变化函数,计算变化函数在每个时间点上的导数,从而得到热度在每个时刻的变化率;
步骤3.1.3、判断热度变化率是否大于设定的阈值,若是,则对该话题产生正式告警信息并反馈告警原因;若否,则进行告警抑制。
同时针对该层,在本实施例中提出的对应的热度的计算方法为:
Figure DEST_PATH_IMAGE027
Figure 216701DEST_PATH_IMAGE002
Figure 124614DEST_PATH_IMAGE003
Figure 869716DEST_PATH_IMAGE004
Figure 434077DEST_PATH_IMAGE005
Figure 264630DEST_PATH_IMAGE006
其中,
Figure 445075DEST_PATH_IMAGE007
指的是每个话题中第j个帖子数据的热度值,
Figure 169318DEST_PATH_IMAGE008
指的是第j个帖子数据的点赞数,
Figure 777017DEST_PATH_IMAGE009
指的是第j个帖子数据的转发数,
Figure 94865DEST_PATH_IMAGE010
是指第j个帖子数据的评论数,a、b、c分别为计算话题热度时点赞数、转发数、评论数的权重值,在权重值a、b、c的计算过程中:首先分别计算每个事件告警数据子流中所有帖子点赞数、转发数、评论数的累加和,然后将点赞数的权重a确定为1,将点赞数累加和除以转发数、评论数累加和的结果分别作为转发数和评论数的权重b,c的值。
Figure 203636DEST_PATH_IMAGE011
Figure 657751DEST_PATH_IMAGE028
Figure 701930DEST_PATH_IMAGE013
分别表示该帖子所附带的点赞、转发、评论信息的权威度的加权和,
Figure DEST_PATH_IMAGE029
中x取值为a、b、c,
Figure 100550DEST_PATH_IMAGE030
表示点赞、转发或者评论该帖子的第i个用户的权威度;
Figure 888378DEST_PATH_IMAGE016
指的是第i个话题的热度值,它由该话题中所包含的所有帖子附带的热度值计算加权算术和得到,
Figure DEST_PATH_IMAGE031
为每个帖子发帖者的权威度,n为每个话题中包含的帖子的个数。
在榜单抑制层中,主要利用相似度算法计算每个话题与用户定义的重要社交媒体热点话题榜单中话题的相似度,以及每个话题与用户定义的本地热点话题榜单中话题的相似度情况来进行告警抑制,如图3所示,该层的告警抑制过程具体为:
步骤3.2.1、计算事件告警数据子流中每个话题与重要社交媒体榜单中话题的相似度,判断该相似度是否大于设定的阈值,若是则进入步骤3.2.2,若否则进入步骤3.2.5;
步骤3.2.2、判断该话题在重要社交媒体榜单上的排名是否上升,若否则进入步骤3.2.3,若是则进入步骤3.2.6;
步骤3.2.3、计算每个话题与本地热点话题榜单中话题的相似度,若该相似度大于设定的阈值,则进入步骤3.2.4;若小于设定阈值,则进入步骤3.2.5;
步骤3.2.4、判断该话题在本地热点话题榜单上的排名是否上升,若上升,则进入步骤3.2.6;若没有上升,则进入步骤3.2.5;
步骤3.2.5、对该话题进行告警抑制;
步骤3.2.6、对该话题产生正式告警并反馈告警原因。
同时,本实施例提出了对应的相似度计算方法为:
Figure 56054DEST_PATH_IMAGE018
其中,
Figure 271135DEST_PATH_IMAGE019
为两个话题之间的相似度,
Figure 422630DEST_PATH_IMAGE020
Figure 748569DEST_PATH_IMAGE021
分别表示话题a和话题b的关键词列表,
Figure 177277DEST_PATH_IMAGE022
表示两个话题列表中重复关键词的个数。
在传播媒体置信度抑制层中,本实施例主要对事件告警数据子流中每个话题深入挖掘其中所隐含的传播媒体置信度信息,并根据传播媒体的置信度大小,来判断是否对舆情告警话题进行抑制,对不同传播媒体置信度的话题进行不同的处理,对于传播媒体置信度低的网络舆情告警话题进行抑制,而对于传播媒体置信度高的网络舆情告警话题则产生一次正式告警。其中传播媒体榜单根据用户自身的应用需求,根据不同的应用场景自行定义,每个话题中传播媒体的置信度由话题中每个帖子所涉及到的传播媒体出现的次数以及每个传播媒体自身的影响力权重来确定。具体的,如图4所示,该层的告警抑制过程为:
步骤3.3.1、获取事件告警数据子流中每个话题中被传播媒体提及的次数,其中,传播媒体由用户根据需求选择设定;
步骤3.3.2、计算传播媒体置信度,判断传播媒体置信度是否大于设定的阈值,若是,则对对应话题产生正式告警;若否,则对该话题进行告警抑制。
其中,传播媒体置信度的计算方法为:
Figure 687893DEST_PATH_IMAGE023
其中,
Figure 202051DEST_PATH_IMAGE024
表示话题的传播媒体置信度,
Figure 331681DEST_PATH_IMAGE032
表示第i个传播媒体平台的权重,根据每个传播媒体自身的影响力大小来确定,
Figure 739528DEST_PATH_IMAGE026
表示该话题被第i个传播媒体提及的次数,M表示用户定义的传播媒体平台的个数。
在本实施例中,引入反馈优化机制的主要目的是利用使用者的反馈信息,来更新算法模型的参数和设定的阈值,使得在保证对舆情告警风暴信息有效抑制的情况下,提高该算法模型的准确性。如图5所示,反馈优化机制的具体过程为:
步骤5.1、根据用户反馈将告警信息划分为错误告警、重复告警和正确告警,并统计单位时间内每个告警原因产生的错误告警或重复告警的次数;
步骤5.2、判断每个告警原因产生的错误告警或重复告警的次数是否大于设定的阈值,若是,则将该告警原因对应的告警信息作为告警噪声,反馈至对应的告警风暴抑制层中,调整对应抑制规则。其中,调整对应抑制规则是指对设定的阈值进行调整。
例如,在一段时间内,用户反馈基于热度产生的告警信息具有较多错误告警信息和重复告警信息,则将这些错误告警信息作为负样本,利用这些样本来修正热度抑制层的参数,从而减少热度抑制层产生的错误或者重复告警信息。
需要说明的是,在本发明实施例的描述中,除非另有明确的规定和限定,术语“设置”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是直接连接,也可以通过中间媒介间接连接。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义;实施例中的附图用以对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (6)

1.一种网络舆情告警风暴抑制方法,其特征在于,包括:
步骤1、接收传统关键字告警触发机制产生的原始告警数据流;
步骤2、将原始告警数据流划分为多条事件告警数据子流;
步骤3、将事件告警数据子流推送到告警风暴抑制层,通过告警风暴抑制层内部的抑制规则进行拦截或归并,降低告警噪音;
步骤4、输出抑制后的告警信息,将告警信息推送给用户,同时提示告警原因
所述步骤3中,告警风暴抑制层包括热度变化抑制层、榜单变化抑制层以及传播媒体置信度抑制层,事件告警数据子流中每个话题分别经热度变化抑制层、榜单变化抑制层以及传播媒体置信度抑制层的抑制规则判断,满足抑制规则的话题进行告警抑制,不满足抑制规则的话题,则产生正式告警信息并反馈告警原因;对于同一事件在多个抑制层同时产生的告警信息,将其融合为一条告警信息推送;
所述热度变化抑制层工作过程为:
步骤3.1.1、计算事件告警数据子流中每个话题的热度;
步骤3.1.2、利用线性回归算法得到每个话题的热度随时间的变化函数,计算变化函数的导数,从而得到热度在每个时刻的变化率;
步骤3.1.3、判断热度变化率是否大于设定的阈值,若是,则对该话题产生正式告警信息并反馈告警原因;若否,则进行告警抑制;
所述榜单变化抑制层工作过程为:步骤3.2.1、计算事件告警数据子流中每个话题与重要社交媒体榜单中话题的相似度,判断该相似度是否大于设定的阈值,若是则进入步骤3.2.2,若否则进入步骤3.2.5;
步骤3.2.2、判断该话题在重要社交媒体榜单上的排名是否上升,若否则进入步骤3.2.3,若是则进入步骤3.2.6;
步骤3.2.3、计算每个话题与本地热点话题榜单中话题的相似度,若该相似度大于设定的阈值,则进入步骤3.2.4;若小于设定阈值,则进入步骤3.2.5;
步骤3.2.4、判断该话题在本地热点话题榜单上的排名是否上升,若上升,则进入步骤3.2.6;若没有上升,则进入步骤3.2.5;
步骤3.2.5、对该话题进行告警抑制;
步骤3.2.6、对该话题产生正式告警并反馈告警原因;
所述传播媒体置信度抑制层工作过程为:获取事件告警数据子流中每个话题被传播媒体提及的次数,并根据对应传播媒体的置信度大小,判断是否对舆情告警话题进行抑制;
热度的计算方法为:
Figure DEST_PATH_IMAGE001
Figure 93441DEST_PATH_IMAGE002
Figure DEST_PATH_IMAGE003
Figure 728691DEST_PATH_IMAGE004
Figure DEST_PATH_IMAGE005
Figure 180532DEST_PATH_IMAGE006
其中,
Figure DEST_PATH_IMAGE007
指的是每个话题中第j个帖子数据的热度值,
Figure 310162DEST_PATH_IMAGE008
指的是第j个帖子数据的点赞数,
Figure DEST_PATH_IMAGE009
指的是第j个帖子数据的转发数,
Figure 344108DEST_PATH_IMAGE010
是指第j个帖子数据的评论数,a、b、c分别为计算话题热度时点赞数、转发数、评论数的权重值,
Figure DEST_PATH_IMAGE011
Figure 838674DEST_PATH_IMAGE012
Figure DEST_PATH_IMAGE013
分别表示该帖子所附带的点赞、转发、评论信息的权威度的加权和,
Figure 840128DEST_PATH_IMAGE014
中x取值为a、b、c,
Figure DEST_PATH_IMAGE015
表示点赞、转发或者评论该帖子的第i个用户的权威度;
Figure 757138DEST_PATH_IMAGE016
指的是第i个话题的热度值,它由该话题中所包含的所有帖子附带的热度值计算加权算术和得到,
Figure DEST_PATH_IMAGE017
为每个帖子发帖者的权威度,n为每个话题中包含的帖子的个数。
2.根据权利要求1所述的网络舆情告警风暴抑制方法,其特征在于,还包括步骤5,若用户判断收到的某一条告警通知为告警噪音,通过反向传输通道反馈抑制请求至告警风暴抑制层,告警风暴抑制层分析该请求特征,调整对应的抑制规则参数;后续如产生具有相同特征的告警,则对其进行抑制。
3.根据权利要求1所述的网络舆情告警风暴抑制方法,其特征在于,所述步骤3.2.1或3.2.3中相似度计算方法为:
Figure 98120DEST_PATH_IMAGE018
其中,
Figure DEST_PATH_IMAGE019
为两个话题之间的相似度,
Figure 825905DEST_PATH_IMAGE020
Figure DEST_PATH_IMAGE021
分别表示话题a和话题b的关键词列表,
Figure 796879DEST_PATH_IMAGE022
表示两个话题列表中重复关键词的个数。
4.根据权利要求1所述的网络舆情告警风暴抑制方法,其特征在于,传播媒体置信度抑制层的具体工作过程为:
步骤3.3.1、获取事件告警数据子流中每个话题中被传播媒体提及的次数,其中,传播媒体由用户根据需求选择设定;
步骤3.3.2、计算传播媒体置信度,判断传播媒体置信度是否大于设定的阈值,若是,则对对应话题产生正式告警;若否,则对该话题进行告警抑制。
5.根据权利要求4所述的网络舆情告警风暴抑制方法,其特征在于,所述传播媒体置信度的计算方法为:
Figure DEST_PATH_IMAGE023
其中,
Figure 205994DEST_PATH_IMAGE024
表示话题的传播媒体置信度,
Figure DEST_PATH_IMAGE025
表示第i个传播媒体平台的权重,根据每个传播媒体自身的影响力大小来确定,
Figure 463800DEST_PATH_IMAGE026
表示该话题被第i个传播媒体提及的次数,M表示用户定义的传播媒体平台的个数。
6.根据权利要求2所述的网络舆情告警风暴抑制方法,其特征在于,所述步骤5的具体过程为:
步骤5.1、根据用户反馈将告警信息划分为错误告警、重复告警和正确告警,并统计单位时间内每个告警原因产生的错误告警或重复告警的次数;
步骤5.2、判断每个告警原因产生的错误告警或重复告警的次数是否大于设定的阈值,若是,则将该告警原因对应的告警信息作为告警噪声,反馈至对应的告警风暴抑制层中,调整对应抑制规则。
CN202210512805.9A 2022-05-12 2022-05-12 一种网络舆情告警风暴抑制方法 Active CN114615667B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210512805.9A CN114615667B (zh) 2022-05-12 2022-05-12 一种网络舆情告警风暴抑制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210512805.9A CN114615667B (zh) 2022-05-12 2022-05-12 一种网络舆情告警风暴抑制方法

Publications (2)

Publication Number Publication Date
CN114615667A CN114615667A (zh) 2022-06-10
CN114615667B true CN114615667B (zh) 2022-09-23

Family

ID=81870564

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210512805.9A Active CN114615667B (zh) 2022-05-12 2022-05-12 一种网络舆情告警风暴抑制方法

Country Status (1)

Country Link
CN (1) CN114615667B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111966919A (zh) * 2020-07-13 2020-11-20 江汉大学 一种事件消息的处理方法、装置及设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8949676B2 (en) * 2012-05-11 2015-02-03 International Business Machines Corporation Real-time event storm detection in a cloud environment
CN107784083A (zh) * 2017-09-30 2018-03-09 北京合力智联科技有限公司 一种网络舆情信息有效性的自动识别处理方法
CN109241429A (zh) * 2018-09-05 2019-01-18 食品安全与营养(贵州)信息科技有限公司 一种食品安全舆情监控方法及系统
US20210359899A1 (en) * 2018-09-11 2021-11-18 Telefonaktiebolaget Lm Ericsson (Publ) Managing Event Data in a Network
CN110263238B (zh) * 2019-06-21 2021-10-15 浙江华坤道威数据科技有限公司 一种基于大数据的舆情聆听系统
CN112434226A (zh) * 2020-12-15 2021-03-02 易研信息科技有限公司 一种网络舆情监测预警方法
CN113609424B (zh) * 2021-06-22 2024-06-11 深圳市网联安瑞网络科技有限公司 一种针对网络舆情热度的计算与预警系统及方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111966919A (zh) * 2020-07-13 2020-11-20 江汉大学 一种事件消息的处理方法、装置及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Requirements for Limiting the Rate of Event Notifications draft-niemi-sipping-event-throttle-reqs-02;A. Niemi等;《IETF 》;20030630;全文 *

Also Published As

Publication number Publication date
CN114615667A (zh) 2022-06-10

Similar Documents

Publication Publication Date Title
CN112085039B (zh) 一种基于随机森林的icmp隐蔽通道检测方法
US20160248802A1 (en) Systems and methods for reporter-based filtering of electronic communications and messages
US7610344B2 (en) Sender reputations for spam prevention
CN110263238B (zh) 一种基于大数据的舆情聆听系统
Scherrer et al. Non-gaussian and long memory statistical characterizations for internet traffic with anomalies
Yu et al. Unsupervised online anomaly detection with parameter adaptation for KPI abrupt changes
CN103795612A (zh) 即时通讯中的垃圾和违法信息检测方法
Ansari et al. Adaptive fusion by reinforcement learning for distributed detection systems
CN112434298B (zh) 一种基于自编码器集成的网络威胁检测系统
CN107609103A (zh) 一种基于推特的事件检测方法
CN111191096B (zh) 全网爱国舆情事件识别及流行度跟踪方法
Osman et al. Artificial neural network model for decreased rank attack detection in RPL based on IoT networks
CN113904881B (zh) 一种入侵检测规则误报处理方法和装置
CN104166726A (zh) 一种面向微博文本流的突发关键词检测方法
CN110289992B (zh) 一种报文处理方法及装置
CN110519266B (zh) 一种基于统计学方法的cc攻击检测的方法
CN114615667B (zh) 一种网络舆情告警风暴抑制方法
CN111932427B (zh) 一种基于多模态数据的突发公共安全事件检测方法及系统
CN111953504A (zh) 异常流量检测方法和装置、计算机可读存储介质
CN113254485A (zh) 实时数据流异常检测方法及系统
CN110083701A (zh) 一种基于平均影响力的网络空间群体性事件预警系统
CN115934808B (zh) 一种融入关联分析和风暴抑制机制的网络舆情预警方法
CN109558483A (zh) 一种基于朴素贝叶斯模型的谣言识别方法
El Sibai et al. Efficient anomaly detection on sampled data streams with contaminated phase I data
Elmas The Role of Compromised Accounts in Social Media Manipulation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant