CN111966919A - 一种事件消息的处理方法、装置及设备 - Google Patents
一种事件消息的处理方法、装置及设备 Download PDFInfo
- Publication number
- CN111966919A CN111966919A CN202010668137.XA CN202010668137A CN111966919A CN 111966919 A CN111966919 A CN 111966919A CN 202010668137 A CN202010668137 A CN 202010668137A CN 111966919 A CN111966919 A CN 111966919A
- Authority
- CN
- China
- Prior art keywords
- message
- propagation
- rumor
- event
- propagation structure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title abstract description 14
- 238000012545 processing Methods 0.000 claims abstract description 68
- 230000011218 segmentation Effects 0.000 claims abstract description 36
- 238000007781 pre-processing Methods 0.000 claims abstract description 33
- 230000005540 biological transmission Effects 0.000 claims abstract description 28
- 238000000034 method Methods 0.000 claims abstract description 26
- 238000007499 fusion processing Methods 0.000 claims abstract description 10
- 238000004590 computer program Methods 0.000 claims description 12
- 238000003860 storage Methods 0.000 claims description 11
- 238000012549 training Methods 0.000 claims description 10
- 238000004458 analytical method Methods 0.000 claims description 9
- 238000012706 support-vector machine Methods 0.000 description 54
- 238000001514 detection method Methods 0.000 description 12
- 230000007246 mechanism Effects 0.000 description 10
- 230000007480 spreading Effects 0.000 description 10
- 238000003892 spreading Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 230000000644 propagated effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 206010044565 Tremor Diseases 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请提供了一种事件消息的处理方法、装置及设备,用于准确识别事件消息是否属于谣言消息。方法包括:获取目标社交平台中待检测的事件消息;对事件消息进行文本分词处理,得到分词信息;将分词信息与预设的舆情特征信息进行匹配处理,并得到对应的预处理结果;对预处理结果进行数据融合处理,得到SVM模型相匹配的特征向量信息;将特征向量信息输入SVM模型以进行消息传播结构识别处理,并得到SVM模型输出的特征向量对应的消息传播结构识别结果;结合预设的谣言消息传播结构特征,判断消息传播结构识别结果是否符合谣言消息传播结构,并确定事件消息是否为谣言消息。
Description
技术领域
本申请涉及社交领域,尤其涉及一种事件消息的处理方法、装置及设备。
背景技术
随着智能手机等用户终端(User Equipment,UE)的普及以及社交平台的不断发展,在传统媒体传播渠道的基础上,如博客、微博、微信、贴吧、论坛、抖音等自媒体平台,愈发成为网络用户了解新闻资讯的主要途径,在这些自媒体平台上,越来越多的网络舆情热点事件,发挥着日益重要的积极作用。
然而,在网络用户更为便捷地获取到新闻资讯的同时,这也意味着网络流言也更容易在短时间内进行广泛的传播,这可能对社会公共次序的安全稳定造成一定程序的影响。一些别有用心的用户为了达到个人目的,借助于舆情的手段,在网络上发布、传播不实信息甚至谣言,扰乱社会秩序,或者利用普遍大众的不满和怨恨恶意炒作,以及滥用话语权,微博上公然“约架”等,影响了社会和谐稳定。
因此,在社交网络的管理工作中,辨别网络舆情好坏并抑制谣言在社交网络上的传播,存在着必要性。而在现有技术的研究过程中,发明人发现,由于社交网络存在着较大的动态特征和不可预知性,舆情在社交网络中传播后可能会使整个网络系统不稳定,而现有的舆情监控方案,在舆情的监控上,则存在着预测精确度不稳定的情况,导致部分舆情事件,未及时进行有效的舆情管理,不仅影响了网络用户的体验,也可能还扰乱了社会秩序。
发明内容
本申请提供了一种事件消息的处理方法、装置及设备,用于准确识别事件消息是否属于谣言消息,从而可根据识别结果在目标社交平台中精准、有效地防止谣言的传播。
第一方面,本申请提供了一种事件消息的处理方法,方法包括:
获取目标社交平台中待检测的事件消息,其中,事件消息包含消息内容以及传播用户标识;
对事件消息进行文本分词处理,得到分词信息;
将分词信息与预设的舆情特征信息进行匹配处理,以完成预处理,并得到对应的预处理结果;
对预处理结果进行数据融合处理,得到SVM模型相匹配的特征向量信息,其中,SVM模型用于识别输入的待检测消息的消息传播结构,SVM模型是由标注有消息传播结构的不同事件消息训练初始SVM模型训练得到的;
将特征向量信息输入SVM模型以进行消息传播结构识别处理,并得到SVM模型输出的特征向量对应的消息传播结构识别结果;
结合预设的谣言消息传播结构特征,判断消息传播结构识别结果是否符合谣言消息传播结构,并确定事件消息是否为谣言消息。
结合本申请第一方面,在本申请第一方面第一种可能的实现方式中,结合预设的谣言消息传播结构特征,判断消息传播结构识别结果是否符合谣言消息传播结构包括:
从消息传播结构识别结果中,提取对应的认证用户的节点数量v、非认证且满足预设条件的非认证用户的节点数量d、普通用户的节点数量m,其中,预设条件为听众数量与好友数量之间的比值大于比值阈值,比值阈值大于1,听众数量大于预设的听众数量阈值;
根据认证用户的节点数量v、非认证用户的节点数量d、普通用户的节点数量m以及预设的节点结构分析策略,判断消息传播结构识别结果是否符合谣言消息传播结构。
结合本申请第一方面第一种可能的实现方式,在本申请第一方面第二种可能的实现方式中,根据认证用户的节点数量v、非认证用户的节点数量d、普通用户的节点数量m以及预设的节点结构分析策略,判断消息传播结构识别结果是否符合谣言消息传播结构包括:
提取事件消息在第一跳传播阶段时的认证用户的节点数量v1、非认证用户的节点数量d1以及普通用户的节点数量m1;
结合本申请第一方面,在本申请第一方面第三种可能的实现方式中,消息传播结构识别结果的数据结构为传播树结构,传播树结构中的每个用户节点的节点信息包括消息创造者u、消息时间戳t、发布消息的终端类型c、多媒体存在标识i。
结合本申请第一方面,在本申请第一方面第四种可能的实现方式中,舆情特征信息包括源消息特征、消息源用户特征和转发消息特征。
第二方面,本申请提供了一种事件消息的处理装置,装置包括:
收发单元,用于获取目标社交平台中待检测的事件消息,其中,事件消息包含消息内容以及传播用户标识;
处理单元,具体用于对事件消息进行文本分词处理,得到分词信息;以及,
将分词信息与预设的舆情特征信息进行匹配处理,以完成预处理,并得到对应的预处理结果;以及,
对预处理结果进行数据融合处理,得到SVM模型相匹配的特征向量信息,其中,SVM模型用于识别输入的待检测消息的消息传播结构,SVM模型是由标注有消息传播结构的不同事件消息训练初始SVM模型训练得到的;以及,
将特征向量信息输入SVM模型以进行消息传播结构识别处理,并得到SVM模型输出的特征向量对应的消息传播结构识别结果;以及,
结合预设的谣言消息传播结构特征,判断消息传播结构识别结果是否符合谣言消息传播结构,并确定事件消息是否为谣言消息。
结合本申请第二方面,在本申请第二方面第一种可能的实现方式中,处理单元,具体用于:
从消息传播结构识别结果中,提取对应的认证用户的节点数量v、非认证且满足预设条件的非认证用户的节点数量d、普通用户的节点数量m,其中,预设条件为听众数量与好友数量之间的比值大于比值阈值,比值阈值大于1,听众数量大于预设的听众数量阈值;
根据认证用户的节点数量v、非认证用户的节点数量d、普通用户的节点数量m以及预设的节点结构分析策略,判断消息传播结构识别结果是否符合谣言消息传播结构。
结合本申请第二方面第一种可能的实现方式,在本申请第二方面第二种可能的实现方式中,处理单元,具体用于:
提取事件消息在第一跳传播阶段时的认证用户的节点数量v1、非认证用户的节点数量d1以及普通用户的节点数量m1;
结合本申请第二方面,在本申请第二方面第三种可能的实现方式中,消息传播结构识别结果的数据结构为传播树结构,传播树结构中的每个用户节点的节点信息包括消息创造者u、消息时间戳t、发布消息的终端类型c、多媒体存在标识i。
结合本申请第二方面,在本申请第二方面第四种可能的实现方式中,舆情特征信息包括源消息特征、消息源用户特征和转发消息特征。
第三方面,本申请提供了事件消息的处理设备,包括处理器,处理器用于执行存储器中存储的计算机程序时实现如上述第一方面的任一步骤。
第四方面,本申请提供了可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上述第一方面的任一步骤。
从以上技术方案可以看出,本申请具有以下优点:
在目标社交平台中,当存在需要检测的事件消息时,本申请先对该事件消息进行文本分词处理,得到分词信息,其中,事件消息包含消息内容以及传播用户标识,再将该分词信息与预设的舆情特征信息进行匹配处理,以完成预处理,并得到对应的预处理结果,再对预处理结果进行数据融合处理,得到SVM模型相匹配的特征向量信息,其中,SVM模型用于识别输入的待检测消息的消息传播结构,SVM模型是由标注有消息传播结构的不同事件消息训练初始SVM模型训练得到的,然后将特征向量信息输入SVM模型以进行消息传播结构识别处理,并得到SVM模型输出的特征向量对应的消息传播结构识别结果,如此可结合预设的谣言消息传播结构特征,判断消息传播结构识别结果是否符合谣言消息传播结构,并确定事件消息是否为谣言消息。
在这过程中,对于事件消息,先是在消息内容上通过分词特征与舆情消息特征进行预处理的匹配,再结合消息传播结构与谣言消息传播结构特征的识别,进一步确定该事件消息是否为谣言消息,通过两层检测机制,精确分析事件消息与谣言之间的相关性,进而在一定程度上可精确地确定其是否为谣言消息,如此在目标社交平台中可根据识别结果在目标社交平台中精准、有效地防止谣言的传播,促进目标社交平台的动态特性稳定,抑制平台内谣言的网络传播能力,保障目标社交平台的用户体验,维护社会秩序。
附图说明
图1为本申请事件消息的处理方法的一种流程示意图;
图2为本申请识别目标用户节点的一种流程示意图;
图3为本申请事件消息的处理装置的一种结构示意图;
图4为本申请事件消息的处理设备的一种流程示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在以下的说明中,本申请的具体实施例将参考由一部或多部计算机所执行的步骤及符号来说明,除非另有述明。因此,这些步骤及操作将有数次提到由计算机执行,本文所指的计算机执行包括了由代表了以一结构化型式中的数据的电子信号的计算机处理单元的操作。此操作转换该数据或将其维持在该计算机的内存系统中的位置处,其可重新配置或另外以本领域测试人员所熟知的方式来改变该计算机的运作。该数据所维持的数据结构为该内存的实体位置,其具有由该数据格式所定义的特定特性。但是,本申请原理以上述文字来说明,其并不代表为一种限制,本领域测试人员将可了解到以下所述的多种步骤及操作亦可实施在硬件当中。
本申请的原理使用许多其它泛用性或特定目的运算、通信环境或组态来进行操作。所熟知的适合用于本申请的运算系统、环境与组态的范例可包括(但不限于)手持电话、个人计算机、服务器、多处理器系统、微电脑为主的系统、主架构型计算机、及分布式运算环境,其中包括了任何的上述系统或装置。
本申请中的术语“第一”、“第二”和“第三”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。
首先,在介绍本申请之前,先介绍下本申请关于应用背景的相关内容。
本申请提供的事件消息的处理方法、装置以及计算机可读存储介质,可应用于事件消息的处理设备上,用于在一定程度上准确识别事件消息是否属于谣言消息。
事件消息的处理设备,具体可以为服务器、物理主机、UE等设备,还可采用设备集群的方式存在。其中,UE,具体可以为智能手机、平板电脑、笔记本电脑、个人数字助理(Personal Digital Assistant,PDA)、台式电脑、电脑一体机等不同类型的终端设备。
下面,开始介绍本申请提供的事件消息的处理方法。
参阅图1,图1示出了本申请事件消息的处理方法的一种流程示意图,本申请提供的事件消息的处理方法,可包括如下步骤S101至步骤S106:
步骤S101,获取目标社交平台中待检测的事件消息,其中,事件消息包含消息内容以及传播用户;
该目标社交平台,可以为任意指定的社交平台,例如可能存在舆情传播事件的博客、微博、微信、贴吧、论坛、抖音等自媒体平台,具体针对的社交平台,可随实际需要调整,具体的,运营社交平台的服务器,可在工作人员的操作下,配置本申请提供的事件消息的处理方法。
该事件消息,可以为在短时间内在目标社交平台中广泛传播性质的消息,并指向某一事件。具体的,例如可以配置一检测时间段的长度阈值,当存在一检测时间段内某个事件广泛传播次数达到次数阈值时,即可将该事件对应的消息识别为本申请中待检测的事件消息。
其中,事件消息具有可以为目标社交平台中直接传播的消息本身,也可以是目标社交平台中传播的消息经过汇总、提取得到的,事件消息可带本身的消息内容以及传播消息的用户的用户标识。
步骤S102,对事件消息进行文本分词处理,得到分词信息;
本申请对于待检测的事件消息,在谣言的识别上,主要可分为两层检测机制。在首层检测机制中,针对的是事件消息的内容本身。
具体的,先在文本内容上对事件消息进文本分词处理,以得到事件消息中的关键字信息、语义信息、不确定信息等类型的信息,这些信息作为本申请中的分词信息。
步骤S103,将分词信息与预设的舆情特征信息进行匹配处理,以完成预处理,并得到对应的预处理结果;
该舆情特征信息,用于在文本内容上描述预先定义、确认为舆情消息的文本特征,如此则可结合该舆情特征信息,对当前待检测的事件消息在文本层面上对应的分词信息,进行匹配,得到本申请第一层检测机制中的检测结果,该检测结果,在本申请中也可称为预处理结果,可用于确认事件消息在文本内容上属于具有舆情消息的基本特征,这也是谣言消息所具有的基本特征。
步骤S104,对预处理结果进行数据融合处理,得到SVM模型相匹配的特征向量信息,其中,SVM模型用于识别输入的待检测消息的消息传播结构,SVM模型是由标注有消息传播结构的不同事件消息训练初始SVM模型训练得到的;
其次,本申请中的第二层检测机制,是由SVM模型实现的,该SVM模型,全称为支持向量机(Support Vector Machines,SVM)模型,SVM模型本质上可以理解为特征空间中最大化间隔的线性分类器,也可理解为是一种二分类模型,用于通过二分类处理。
在本申请中,由于SVM模型是由标注有消息传播结构的不同事件消息训练初始SVM模型训练得到的,因此可通过二分类的方式,识别输入的待检测消息的消息传播结构。
如此,在调用SVM模型以在消息传播结构上判断事件消息是否为谣言消息时,可将上述得到预处理结果(分词信息与舆情特征信息的匹配结果)进行标准化处理,以在不同社交平台以及平台内不同消息传播方式形成的消息存在形式,可转化为统一的、SVM模型可接受到消息存在形式,即转化为SVM模型相匹配的特征向量信息。
步骤S105,将特征向量信息输入SVM模型以进行消息传播结构识别处理,并得到SVM模型输出的特征向量对应的消息传播结构识别结果;
在将待检测的事件消息对应的特征向量信息输入SVM模型后,即可得到模型输出的事件消息对应的消息传播结构识别结果。
步骤S106,结合预设的谣言消息传播结构特征,判断消息传播结构识别结果是否符合谣言消息传播结构,并确定事件消息是否为谣言消息。
得到事件消息对应的消息传播结构识别结果,即可结合预先配置的谣言消息传播结构特征,判断事件消息的消息传播结构是否符合谣言消息传播结构,若符合,则可确定事件消息为谣言消息,若不符合,则可确定事件消息为非谣言消息,即,为正常消息,以此实现本申请中的第二层检测机制。
从上述内容可看出,在目标社交平台中,当存在需要检测的事件消息时,本申请先对该事件消息进行文本分词处理,得到分词信息,其中,事件消息包含消息内容以及传播用户,再将该分词信息与预设的舆情特征信息进行匹配处理,以完成预处理,并得到对应的预处理结果,再对预处理结果进行数据融合处理,得到SVM模型相匹配的特征向量信息,其中,SVM模型用于识别输入的待检测消息的消息传播结构,SVM模型是由标注有消息传播结构的不同事件消息训练初始SVM模型训练得到的,然后将特征向量信息输入SVM模型以进行消息传播结构识别处理,并得到SVM模型输出的特征向量对应的消息传播结构识别结果,如此可结合预设的谣言消息传播结构特征,判断消息传播结构识别结果是否符合谣言消息传播结构,并确定事件消息是否为谣言消息。
在这过程中,对于事件消息,先是在消息内容上通过分词特征与舆情消息特征进行预处理的匹配,再结合消息传播结构与谣言消息传播结构特征的识别,进一步确定该事件消息是否为谣言消息,通过两层检测机制,精确分析事件消息与谣言之间的相关性,进而在一定程度上可精确地确定其是否为谣言消息,如此在目标社交平台中可根据识别结果在目标社交平台中精准、有效地防止谣言的传播,促进目标社交平台的动态特性稳定,抑制平台内谣言的网络传播能力,保障目标社交平台的用户体验,维护社会秩序。
下面,则继续图1对应实施例中各步骤在实际应用时可能应用的优化实现方式。
在一种示例性的实现方式中,上述提及的舆情特征信息,具体可包括源消息特征、消息源用户特征和转发消息特征。
下面,则可以一组实例参数作为示例性的介绍。
表1-一种舆情特征信息的信息结构
从上面的表1可看出,在本申请中,对于舆情特征信息,具体可包括源消息特征、消息源用户特征和转发消息特征三大类特征,进一步的,还可在该三大类特征下,继续细分出不同的小类特征,通过这类细分的舆情特征,从而可精细、精确地定义舆情消息的文本特征,进而在本申请第一层检测机制中,可结合舆情特征信息,在文本内容层面上精确地确认事件消息是否存在舆情消息的基本特征,也确认是否存在谣言消息所具有的基本特征。
在又一种示例性的实现方式中,消息传播结构识别结果的数据结构为传播树结构,传播树结构中的每个用户节点的节点信息包括消息创造者u、消息时间戳t、发布消息的终端类型c、多媒体存在标识i。
可以理解,传播树结构的数据结构,具有由于其树状结构的数据呈现方式,因此在后续进行消息传播结构的比对时,大大提高比对效率,快速结合预设的谣言消息传播结构特征,判断出消息传播结构识别结果是否符合谣言消息传播结构。
在又一种示例性的实现方式中,判断消息传播结构识别结果是否符合谣言消息传播结构,如图2示出的判断消息传播结构识别结果是否符合谣言消息传播结构一种流程成示意图,可包括:
步骤S201,从消息传播结构识别结果中,提取对应的认证用户的节点数量v、非认证且满足预设条件的非认证用户的节点数量d、普通用户的节点数量m,其中,预设条件为听众数量与好友数量之间的比值大于比值阈值,比值阈值大于1,听众数量大于预设的听众数量阈值;
可以理解,在目标社交平台中,可以为平台用户配置认证机制,该认证机制用于供用户主动进行认证,认证其真实身份、是否存在发言异常行为等,通过认证的平台用户可认为是有效的正常用户。
其次,对于未认证用户,则还可结合如上述说明的,考虑从听众数量和好友数量的比例,来判断是否为有效的正常用户,当然,在未认证的情况下,这些用户介于认证用户与普通用户之间。
普通用户,指的是未认证,且听众数量、好友数量较低的用户,又或者是未认证、听众数量较少的用户,这些用户普遍存在于一些不活跃用户中,这可能为一些用户群体注册的小号,用来发布不恰当的消息言论,相比上述两种类型的用户,传播谣言的可能性比较高。
其中,示例性的,事件消息每次在传播时,其对应的认证用户的节点数量v、非认证用户的节点数量d、普通用户的节点数量m,具体可携带在上述提及的源消息特征、消息源用户特征和转发消息特征中,又或者,可根据事件消息的传播途径、传播记录,汇总、提取出这些信息。
该预设的听众数量阈值,可随实际需要调整,例如4000、5000等数量。
步骤S202,根据认证用户的节点数量v、非认证用户的节点数量d、普通用户的节点数量m以及预设的节点结构分析策略,判断消息传播结构识别结果是否符合谣言消息传播结构。
可以理解,在SVM模型识别出的消息传播结构识别结果中,通过携带的这三种类型的用户节点数量,可以获悉本次事件消息的消息传播结构,从而,结合用户的节点结构分析策略,则可判断本次事件消息的消息传播结构是否符合谣言传播结构,进而判断本次事件消息是否为谣言消息。
在该设置下,通过配置三种类型的用户节点,以此可精确评估事件消息的消息传播结构的特征,如此达到精确判断事件的消息传播结构是否符合谣言传播结构、本次事件消息是否为谣言消息的效果。
在又一种示例性的实现方式中,具体的,根据上述三种类型的用户节点进行谣言消息传播结构的符合性判断,具体可以为:
提取事件消息在第一跳传播阶段时的认证用户的节点数量v1、非认证用户的节点数量d1以及普通用户的节点数量m1;
可以理解,事件消息的第一跳传播阶段,可以理解为该事件消息在整个传播过程中,其处于的最初阶段,介于最开始的发布到开始蔓延传播之间。
在此处,可配置两个传播结构系数,以区分消息传播结构中的用户节点组成结构,并以此确定是否符合谣言消息传播结构,其中,β1以及β2可随工作人员配置,或者通过针对平台用户的行为习惯收集数据,例如分布函数模拟处理、问卷调查汇总处理、大数据分析,并展开数据的清理、集成、选择、变换、挖掘和模式评估工作确定得到。
后续的,若确定本次事件消息为谣言,则可投入目标社交平台的谣言管理中,即,在目标社交平台中,对该事件消息的传播进行谣言提示或者过滤处理。
例如,在UE侧以推送、弹窗等提醒方式向用户进行谣言提示,提示谣言的内容,例如当前事件消息为谣言、当前事件消息是否存在谣言的风险等,也可直接对相关的事件消息进行过滤、删除处理,达到谣言管理的目的。
为便于更好的实施本申请提供的事件消息的处理方法,本申请还提供事件消息的处理装置。
参阅图3,图3为本申请事件消息的处理装置的一种结构示意图,在本申请中,事件消息的处理装置300具体可包括如下结构:
收发单元301,用于获取目标社交平台中待检测的事件消息,其中,事件消息包含消息内容以及传播用户标识;
处理单元302,具体用于对事件消息进行文本分词处理,得到分词信息;以及,
将分词信息与预设的舆情特征信息进行匹配处理,以完成预处理,并得到对应的预处理结果;以及,
对预处理结果进行数据融合处理,得到SVM模型相匹配的特征向量信息,其中,SVM模型用于识别输入的待检测消息的消息传播结构,SVM模型是由标注有消息传播结构的不同事件消息训练初始SVM模型训练得到的;以及,
将特征向量信息输入SVM模型以进行消息传播结构识别处理,并得到SVM模型输出的特征向量对应的消息传播结构识别结果;以及,
结合预设的谣言消息传播结构特征,判断消息传播结构识别结果是否符合谣言消息传播结构,并确定事件消息是否为谣言消息。
在一种示例性的实现方式中,处理单元302,具体用于:
从消息传播结构识别结果中,提取对应的认证用户的节点数量v、非认证且满足预设条件的非认证用户的节点数量d、普通用户的节点数量m,其中,预设条件为听众数量与好友数量之间的比值大于比值阈值,比值阈值大于1,听众数量大于预设的听众数量阈值;
根据认证用户的节点数量v、非认证用户的节点数量d、普通用户的节点数量m以及预设的节点结构分析策略,判断消息传播结构识别结果是否符合谣言消息传播结构。
在又一种示例性的实现方式中,处理单元302,具体用于:
提取事件消息在第一跳传播阶段时的认证用户的节点数量v1、非认证用户的节点数量d1以及普通用户的节点数量m1;
在又一种示例性的实现方式中,消息传播结构识别结果的数据结构为传播树结构,传播树结构中的每个用户节点的节点信息包括消息创造者u、消息时间戳t、发布消息的终端类型c、多媒体存在标识i。
在又一种示例性的实现方式中,舆情特征信息包括源消息特征、消息源用户特征和转发消息特征。
本申请还提供了事件消息的处理设备,参阅图4,图4示出了本申请事件消息的处理设备的一种结构示意图,具体的,本申请事件消息的处理设备包括处理器401,处理器401用于执行存储器402中存储的计算机程序时实现如图1及图2对应任意实施例中事件消息的处理方法的各步骤;或者,处理器401用于执行存储器402中存储的计算机程序时实现如图3对应实施例中各单元的功能。
示例性的,计算机程序可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器402中,并由处理器401执行,以完成本申请。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在计算机装置中的执行过程。
事件消息的处理设备可包括,但不仅限于处理器401、存储器402、输入输出设备403。本领域技术人员可以理解,示意仅仅是事件消息的处理设备的示例,并不构成对事件消息的处理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如事件消息的处理设备还可以包括网络接入设备、总线等,处理器401、存储器402、输入输出设备403以及网络接入设备等通过总线相连。
处理器401可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,处理器是事件消息的处理设备的控制中心,利用各种接口和线路连接整个事件消息的处理设备的各个部分。
存储器402可用于存储计算机程序和/或模块,处理器401通过运行或执行存储在存储器402内的计算机程序和/或模块,以及调用存储在存储器402内的数据,实现计算机装置的各种功能。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据事件消息的处理设备的使用所创建的数据(比如音频数据、视频数据等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器401用于执行存储器402中存储的计算机程序时,具体可实现以下功能:
获取目标社交平台中待检测的事件消息,其中,事件消息包含消息内容以及传播用户标识;
对事件消息进行文本分词处理,得到分词信息;
将分词信息与预设的舆情特征信息进行匹配处理,以完成预处理,并得到对应的预处理结果;
对预处理结果进行数据融合处理,得到SVM模型相匹配的特征向量信息,其中,SVM模型用于识别输入的待检测消息的消息传播结构,SVM模型是由标注有消息传播结构的不同事件消息训练初始SVM模型训练得到的;
将特征向量信息输入SVM模型以进行消息传播结构识别处理,并得到SVM模型输出的特征向量对应的消息传播结构识别结果;
结合预设的谣言消息传播结构特征,判断消息传播结构识别结果是否符合谣言消息传播结构,并确定事件消息是否为谣言消息。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的事件消息的处理装置、设备及其相应单元的具体工作过程,可以参考如图1及图2对应任意实施例中事件消息的处理方法的说明,具体在此不再赘述。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请如图1及图2对应任意实施例中事件消息的处理方法中的步骤,具体操作可参考如图1及图2对应任意实施例中事件消息的处理方法的说明,在此不再赘述。
其中,该计算机可读存储介质可以包括:只读存储器(Read Only Memory,ROM)、随机存取记忆体(Random Access Memory,RAM)、磁盘或光盘等。
由于该计算机可读存储介质中所存储的指令,可以执行本申请如图1及图2对应任意实施例中事件消息的处理方法中的步骤,因此,可以实现本申请如图1及图2对应任意实施例中事件消息的处理方法所能实现的有益效果,详见前面的说明,在此不再赘述。
以上对本申请提供的事件消息的处理方法、装置、设备以及计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种事件消息的处理方法,其特征在于,所述方法包括:
获取目标社交平台中待检测的事件消息,其中,所述事件消息包含消息内容以及传播用户标识;
对所述事件消息进行文本分词处理,得到分词信息;
将所述分词信息与预设的舆情特征信息进行匹配处理,以完成预处理,并得到对应的预处理结果;
对所述预处理结果进行数据融合处理,得到SVM模型相匹配的特征向量信息,其中,所述SVM模型用于识别输入的待检测消息的消息传播结构,所述SVM模型是由标注有消息传播结构的不同事件消息训练初始SVM模型训练得到的;
将所述特征向量信息输入所述SVM模型以进行消息传播结构识别处理,并得到所述SVM模型输出的所述特征向量对应的消息传播结构识别结果;
结合预设的谣言消息传播结构特征,判断所述消息传播结构识别结果是否符合谣言消息传播结构,并确定所述事件消息是否为谣言消息。
2.根据权利要求1所述的方法,其特征在于,所述结合预设的谣言消息传播结构特征,判断所述消息传播结构识别结果是否符合谣言消息传播结构包括:
从所述消息传播结构识别结果中,提取对应的认证用户的节点数量v、非认证且满足预设条件的非认证用户的节点数量d、普通用户的节点数量m,其中,所述预设条件为听众数量与好友数量之间的比值大于比值阈值,所述比值阈值大于1,所述听众数量大于预设的听众数量阈值;
根据所述认证用户的节点数量v、所述非认证用户的节点数量d、所述普通用户的节点数量m以及预设的节点结构分析策略,判断所述消息传播结构识别结果是否符合谣言消息传播结构。
4.根据权利要求1所述的方法,其特征在于,所述消息传播结构识别结果的数据结构为传播树结构,所述传播树结构中的每个用户节点的节点信息包括消息创造者u、消息时间戳t、发布消息的终端类型c、多媒体存在标识i。
5.根据权利要求1所述的方法,其特征在于,所述舆情特征信息包括源消息特征、消息源用户特征和转发消息特征。
6.一种事件消息的处理装置,其特征在于,所述装置包括:
收发单元,用于获取目标社交平台中待检测的事件消息,其中,所述事件消息包含消息内容以及传播用户标识;
处理单元,具体用于对所述事件消息进行文本分词处理,得到分词信息;以及,
将所述分词信息与预设的舆情特征信息进行匹配处理,以完成预处理,并得到对应的预处理结果;以及,
对所述预处理结果进行数据融合处理,得到SVM模型相匹配的特征向量信息,其中,所述SVM模型用于识别输入的待检测消息的消息传播结构,所述SVM模型是由标注有消息传播结构的不同事件消息训练初始SVM模型训练得到的;以及,
将所述特征向量信息输入所述SVM模型以进行消息传播结构识别处理,并得到所述SVM模型输出的所述特征向量对应的消息传播结构识别结果;以及,
结合预设的谣言消息传播结构特征,判断所述消息传播结构识别结果是否符合谣言消息传播结构,并确定所述事件消息是否为谣言消息。
7.根据权利要求6所述的装置,其特征在于,所述处理单元,具体用于:
从所述消息传播结构识别结果中,提取对应的认证用户的节点数量v、非认证且满足预设条件的非认证用户的节点数量d、普通用户的节点数量m,其中,所述预设条件为听众数量与好友数量之间的比值大于比值阈值,所述比值阈值大于1,所述听众数量大于预设的听众数量阈值;
根据所述认证用户的节点数量v、所述非认证用户的节点数量d、所述普通用户的节点数量m以及预设的节点结构分析策略,判断所述消息传播结构识别结果是否符合谣言消息传播结构。
9.一种事件消息的处理设备,其特征在于,包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时执行如权利要求1至5任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至5任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010668137.XA CN111966919A (zh) | 2020-07-13 | 2020-07-13 | 一种事件消息的处理方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010668137.XA CN111966919A (zh) | 2020-07-13 | 2020-07-13 | 一种事件消息的处理方法、装置及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111966919A true CN111966919A (zh) | 2020-11-20 |
Family
ID=73361781
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010668137.XA Pending CN111966919A (zh) | 2020-07-13 | 2020-07-13 | 一种事件消息的处理方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111966919A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114615667A (zh) * | 2022-05-12 | 2022-06-10 | 中国电子科技集团公司第三十研究所 | 一种网络舆情告警风暴抑制方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105045857A (zh) * | 2015-07-09 | 2015-11-11 | 中国科学院计算技术研究所 | 一种社交网络谣言识别方法及系统 |
CN106354845A (zh) * | 2016-08-31 | 2017-01-25 | 上海交通大学 | 基于传播结构的微博谣言识别方法和系统 |
CN108038240A (zh) * | 2017-12-26 | 2018-05-15 | 武汉大学 | 基于内容、用户多因素分析的社交网络谣言检测方法 |
CN110990683A (zh) * | 2019-11-29 | 2020-04-10 | 重庆邮电大学 | 一种基于地域与情感特征的微博谣言集成识别方法及装置 |
CN111144131A (zh) * | 2019-12-25 | 2020-05-12 | 北京中科研究院 | 一种基于预训练语言模型的网络谣言检测方法 |
-
2020
- 2020-07-13 CN CN202010668137.XA patent/CN111966919A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105045857A (zh) * | 2015-07-09 | 2015-11-11 | 中国科学院计算技术研究所 | 一种社交网络谣言识别方法及系统 |
CN106354845A (zh) * | 2016-08-31 | 2017-01-25 | 上海交通大学 | 基于传播结构的微博谣言识别方法和系统 |
CN108038240A (zh) * | 2017-12-26 | 2018-05-15 | 武汉大学 | 基于内容、用户多因素分析的社交网络谣言检测方法 |
CN110990683A (zh) * | 2019-11-29 | 2020-04-10 | 重庆邮电大学 | 一种基于地域与情感特征的微博谣言集成识别方法及装置 |
CN111144131A (zh) * | 2019-12-25 | 2020-05-12 | 北京中科研究院 | 一种基于预训练语言模型的网络谣言检测方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114615667A (zh) * | 2022-05-12 | 2022-06-10 | 中国电子科技集团公司第三十研究所 | 一种网络舆情告警风暴抑制方法 |
CN114615667B (zh) * | 2022-05-12 | 2022-09-23 | 中国电子科技集团公司第三十研究所 | 一种网络舆情告警风暴抑制方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240134946A1 (en) | Online identity reputation | |
CN110311902B (zh) | 一种异常行为的识别方法、装置及电子设备 | |
WO2021143497A1 (zh) | 一种基于存证区块链的侵权存证方法、装置及设备 | |
JP7029003B2 (ja) | パスワード保護質問設定方法及び装置 | |
CN106874253A (zh) | 识别敏感信息的方法及装置 | |
CN104980402B (zh) | 一种识别恶意操作的方法及装置 | |
CN111125118B (zh) | 关联数据查询方法、装置、设备及介质 | |
CN108234454B (zh) | 一种身份认证方法、服务器及客户端设备 | |
CN110347900B (zh) | 一种关键词的重要度计算方法、装置、服务器及介质 | |
CN111966920B (zh) | 舆情传播的稳定条件的预测方法、装置及设备 | |
CN111966919A (zh) | 一种事件消息的处理方法、装置及设备 | |
CN112099870B (zh) | 文档处理方法、装置、电子设备及计算机可读存储介质 | |
CN111027065B (zh) | 一种勒索病毒识别方法、装置、电子设备及存储介质 | |
CN112182520B (zh) | 非法账号的识别方法、装置、可读介质及电子设备 | |
CN107277640A (zh) | 基于直播平台的互动方法、装置和存储介质 | |
CN107077509B (zh) | 一种改进浏览体验的方法、装置和设备 | |
CN111429920B (zh) | 用户区分方法、用户行为库确定方法、装置及设备 | |
CN115470489A (zh) | 检测模型训练方法、检测方法、设备以及计算机可读介质 | |
JP6680472B2 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
WO2015078124A1 (zh) | 一种网络数据处理方法及装置 | |
CN112507220A (zh) | 信息推送方法、装置及介质 | |
CN113220949A (zh) | 一种隐私数据识别系统的构建方法及装置 | |
CN112417301A (zh) | 信息推送方法、装置、服务器和存储介质 | |
CN113259150B (zh) | 一种数据处理方法、系统以及存储介质 | |
CN113553347B (zh) | 基于区块链的数据处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |