CN109471881B - 一种基于时空扫描的网络舆情预警监测方法 - Google Patents

一种基于时空扫描的网络舆情预警监测方法 Download PDF

Info

Publication number
CN109471881B
CN109471881B CN201810838973.0A CN201810838973A CN109471881B CN 109471881 B CN109471881 B CN 109471881B CN 201810838973 A CN201810838973 A CN 201810838973A CN 109471881 B CN109471881 B CN 109471881B
Authority
CN
China
Prior art keywords
data
scanning
time
network account
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810838973.0A
Other languages
English (en)
Other versions
CN109471881A (zh
Inventor
邵玉斌
高凌云志
张琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming University of Science and Technology
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN201810838973.0A priority Critical patent/CN109471881B/zh
Publication of CN109471881A publication Critical patent/CN109471881A/zh
Application granted granted Critical
Publication of CN109471881B publication Critical patent/CN109471881B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明涉及一种基于时空扫描的网络舆情预警监测方法,属于舆情预警与监测技术领域。获取每个网络账户的ID;以每一个网络账户ID作为一个单独的监测点,将网络账户ID信息存放于数据库;以时间节点统计各网络账户的接收与发送数据量;以账户间发送数据量来确认个账户之间的数据关系距离;统计生成全局数据量矩阵;根据账户信息与时间节点统计的数据量来生成各账户间的距离矩阵;控制参数确定扫描范围;计算扫描区域内的对数广义似然比,对每次数据存放入数据库;判断是否扫描完成,若未完成则继续扫描,若完成则对所有时空扫描数据进行处理分析;对所有时空扫描数据降序排序,分析排序后数据信息得出疑似爆发的网络账户与关联账户。

Description

一种基于时空扫描的网络舆情预警监测方法
技术领域
本发明涉及一种基于时空扫描的网络舆情预警监测方法,属于舆情预警与监测技术领域。
背景技术
随着互联网在全球范围内的飞速发展,中国的互联网用户也达到了相当庞大的数量,在互联网时代,网络媒体称为一种新型的媒体方式,因此,网络成为社会舆情的主要载体之一。
信息的快速传播是互联网的一个重要特性,信息在网络上的主要传播内容一般都是公众对于现实生活中的一些热点话题的讨论或者是对于焦点问题所持有的较强影响力、倾向性的情感、态度、意见、言论或观点。承载这些网络内容的网络载体主要体现在大型论坛上的发帖、跟帖、个人博客、微信推送、社交软件群之类。由于互联网具有虚拟性、隐蔽性、发散性、渗透性和随意性等特点,越来越多的网民乐意通过这种渠道来表达观点、传播思想。
网络舆情是互联网上一种特有的、强大的舆论力量,其往往作用于热门事件、焦点话题并对事态的发展产生巨大的影响。由于网络传播速度之快,在短时间内会产生大面积的扩散,对社会影响巨大,特别是当出现负面的网络舆情时,若不能及时了解、有效引导,很容易形成舆论危机,严重时可能会引起民众恐慌,甚至影响公共安全。
互联网是一个开放的大环境,网民的个人观点能够随意的表述,在不明真相的情况下,很容易出现错误的跟风现象,从而产生大量的错误的、虚假的信息,同时可能存在不法分子,通过在网络上蓄意传播诈骗信息、负面新闻等方式进行网络犯罪。由于网民的基数巨大,很容易产生舆情,怎样在舆情大面积传播之前,对其进行预警和监测成了舆情防护的重点。
虽然,国家信息安全相关部门出台了很多措施来对舆情进行管制,提出了很多不同的解决方案和预防方案。但是,截止目前为止,还没有出现一种高效的、准确的针对信息传播舆情预防、监测方法。
发明内容
本发明要解决的技术问题是提供一种基于时空扫描的网络舆情预警监测方法,用以解决上述问题。
本发明的技术方案是:一种基于时空扫描的网络舆情预警监测方法:
第一步:获取网络账户的ID信息;
第二步:以网络账户ID作为一个单独的信息监测点,并将账户ID信息存放入数据库;
第三步:以分钟、小时或天作为时间节点T_dot对数据进行划分;
第四步:以时间节点统计各网络账户的接收与发送数据量;
第五步:以账户间发送数据量来确认各账户之间的数据关系距离L_list;
第六步:结合数据库中的ID信息,对网络账户的接收与发送数据量进行统计并生成全局数据量矩阵
Figure GDA0003468249930000021
其中;每一行为一个网络账户监测点z=1...Z,每一列为当前监测点在时间节点T_dot上的数据总量T_data;
第七步:结合数据库中的ID信息,结合各账户之间的数据关系距离L_list,生成个账户之间的数据关系距离矩阵L_cd;
第八步:控制扫描参数,确定扫描区域范围,控制扫描的关键参数如扫描半径R,扫描圆心SCENTER,最大扫描半径R_max,扫描节点量T_scan,最大扫描节点量T_max等控制扫描区域范围;
第九步:计算扫描区域内的对数广义似然比LGLRA,并将每次的扫描结果存放入数据库中;
第十步:判断是否对全局扫描完成,若未完成全部扫描,则继续返回到扫描步骤循环扫描,若扫描完成,则跳出扫描循环;
第十一步:对所有时空扫描数据降序排序,分析排序后数据信息得出疑似爆发的网络账户与关联账户;
所述监测点的选择应表现为单独的网络账户ID上,在获取每一个网络账户ID之后,将每一个网络账户ID作为一个单独的监测点存放入数据库之中。
所述时间节点T_dot以分钟、小时或天作为单位,并以选定的时间节点来统计各个网络账户的接收数据量T_data_in与发送数据量T_data_out;以账户之间的发送数据量T_data_out来确认账户之间的数据关系距离L_list。账户数据的交互量,会引起相互之间的数据关系距离产生不同。
所述网络账户在时间节点上的数据总量T_data为当前接收数据量T_data_in与发送数据量T_data_out的总和,结合数据库中的ID信息,对网络账户的接收数据量T_data_in与发送数据量T_data_out进行统计并生成全局数据量矩阵C_zd,结合数据库中的ID信息,结合各账户之间的数据关系距离L_list,生成个账户之间的数据关系距离矩阵L_cd。
所述控制扫描参数包括扫描半径R,扫描圆心SCENTER,最大扫描半径R_max,扫描节点量T_scan,最大扫描节点量T_max,计算扫描区域内的对数广义似然比LGLRA,将每次的扫描结果数据存放入数据库,每次扫描后,判别是否扫描完成,未完成时循环继续扫描,直至扫描完成。
所述对所有时空扫描数据降序排序具体为对数据库中的扫描数据进行处理,将所有的时空扫描数据,按照对数广义似然比LGLRA降序排序并进行数据清洗。
本发明的有益效果是:可以高效的、准确的针对网络上信息传播舆情进行预防和监测,为净化网络,监控和监管网络垃圾信息提供帮助。
附图说明
图1是本发明的步骤流程图;
具体实施方式
下面结合附图和具体实施方式,对本发明作进一步说明。
一种基于时空扫描的网络舆情预警监测方法:
第一步:获取每个网络账户的ID信息,在每一个网络用户的使用过程中,都会存在一个相对于的网络账户,获取当前账户的信息,例如IP信息、账户名等作为其ID信息;
第二步:以每一个网络账户ID作为一个单独的信息监测点,并将账户ID信息存放入数据库,其主要的表述方式如式1所示,每一个监测点都是单一存在的,在数据库中对其进行有序储存,每一个监测点对应一行,其可作为后续查询索引表;
Figure GDA0003468249930000041
第三步:以分钟、小时或天作为时间节点T_dot对数据进行划分,时间节点的作用主要是细分数据的区间量,当某一地区的数据量将少时,可以放大时间节点的比例,比如以天为时间节点来对数据进行划分,如果某一地区的数据量比较大,那么可以减小时间节点,例如用分钟或小时来对数据量进行划分;
第四步:以时间节点统计各网络账户的接收与发送数据总量T_data;如式2所示,当前实例是以分钟作为时间节点对数据总量进行统计,每一行代表一个监测点,每一列代表一个时间节点中的数据量,例如第一行其数据为[5 7 2 2 3 1 0 4 3 6 4 6 5 4]表示是机构No.1在某14分钟的数据总量,第一列数值为5,表示在这14分钟的第1分钟的数据总量为5条数据,第七列的数值为0,表示在当前分钟,即第7分钟的数据总量为0,既没有发送数据也没有接收数据。
Figure GDA0003468249930000042
第五步:以账户间发送数据量来确认各账户之间的数据关系距离L_list,账户间的距离,由主动发送量来确定,如表1所示,在表1中列举的为No.1针对于其余7个No.2~No.8监测点的发送数据量,使用
Figure GDA0003468249930000043
来计算数据关系距离比例值,此专利中lam=300,如表1中所示,No.1相对于No.3的发送数据量为30条,则两监测点数据关系距离为10,No.1相对于No.6的发送数据量为0条,即表示没有数据量发送,则两监测点数据关系距离为无穷大+∞,由于相互的数据发送量不尽相同,如表2中所示,以No.3为主时,相对于No.1的发送数据量为120条,则其与No.1的数据关系距离为2.5,数据关系距离L_list其数值越大,表示距离越远,数值越小,表示距离越近;
Figure GDA0003468249930000051
表1
Figure GDA0003468249930000052
表2
第六步:结合数据库中的ID信息,对网络账户的接收与发送数据量进行统计并生成全局数据量矩阵
Figure GDA0003468249930000053
其中;每一行为一个网络账户监测点z=1...Z,每一列为当前监测点在时间节点T_dot上的数据总量T_data,如式2所示,第一行其数据为[5 7 2 2 3 1 0 4 3 6 4 6 5 4]表示是机构No.1在某14分钟区间中的数据总量按照每分钟的时间节点分布,第一列数值为5,表示在这14分钟的第1分钟的数据总量为5条数据,第七列的数值为0,表示在当前分钟,即第7分钟的数据总量为0,既没有发送数据也没有接收数据。
第七步:结合数据库中的ID信息,结合各账户之间的数据关系距离L_list,生成个账户之间的数据关系距离矩阵L_cd,如式3所示,每一行代表一个网络账户监测点,其后依次为相对于其他监测点的数据关系距离L_list,以第一行为例[0 7 2 4 3 1 2.5 4]其中L11=0表示相对于自己的距离为0,L17=2.5表示1号监测点相对于No.7的距离为2.5,以下各行、列以此类推;
Figure GDA0003468249930000061
第八步:控制扫描参数,确定扫描区域范围,控制扫描的关键参数如扫描半径R,扫描圆心SCENTER,最大扫描半径R_max,扫描节点量T_scan,最大扫描节点量T_max等控制扫描区域范围;
第九步:计算扫描区域内的对数广义似然比LGLRA其计算公式为:
Figure GDA0003468249930000062
其中,C是全部C_zd矩阵上的全部数据总量的总和
Figure GDA0003468249930000063
CA是所有与圆心监测点扫描半径内的数据量总和
Figure GDA0003468249930000064
μA是所有与圆心监测点扫描半径内的数据量总期望和
Figure GDA0003468249930000065
将每次的扫描结果存放入数据库中;
第十步:判断是否对全局扫描完成,若未完成全部扫描,则继续返回到扫描步骤循环扫描,若扫描完成,则跳出扫描循环;
第十一步:对所有时空扫描数据降序排序,分析排序后数据信息得出疑似爆发的网络账户与关联账户;
以上结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims (4)

1.一种基于时空扫描的网络舆情预警监测方法,其特征在于:
第一步:获取每个网络账户的ID信息;
第二步:以每一个网络账户ID作为一个单独的信息监测点,并将账户ID信息存放入数据库;
第三步:以时间节点对数据进行划分;
第四步:以时间节点统计各网络账户的接收与发送数据量;
第五步:以账户间发送数据量来确认各账户之间的数据关系距离L_list;
所述时间节点T_dot以分钟、小时或天作为单位,并以选定的时间节点来统计各个网络账户的接收数据量T_data_in与发送数据量T_data_out;以账户之间的发送数据量T_data_out来确认账户之间的数据关系距离,L_list,账户间的距离,由主动发送量来确定,使用
Figure FDA0003468249920000011
来计算数据关系距离比例值,lam=300;
第六步:结合数据库中的ID信息,对网络账户的接收与发送数据量进行统计并生成全局数据量矩阵;
第七步:结合数据库中的ID信息,结合各账户之间的数据关系距离L_list,生成个账户之间的数据关系距离L_list矩阵;
所述网络账户在时间节点上的数据总量T_data为当前接收数据量T_data_in与发送数据量T_data_out的总和,结合数据库中的ID信息,对网络账户的接收数据量T_data_in与发送数据量T_data_out进行统计并生成全局数据量矩阵C_zd,结合数据库中的ID信息,结合各账户之间的数据关系距离L_list,生成个账户之间的数据关系距离矩阵L_cd;
第八步:控制扫描参数,确定扫描区域范围;
第九步:计算扫描区域内的对数广义似然比,并将每次的扫描结果存放入数据库中;
计算扫描区域内的对数广义似然比LGLRA其计算公式为:
Figure FDA0003468249920000021
其中,C是全部C_zd矩阵上的全部数据总量的总和
Figure FDA0003468249920000022
CA是所有与圆心监测点扫描半径内的数据量总和
Figure FDA0003468249920000023
μA是所有与圆心监测点扫描半径内的数据量总期望和
Figure FDA0003468249920000024
第十步:判断是否对全局扫描完成,若未完成全部扫描,则继续返回到扫描步骤循环扫描,若扫描完成,则跳出扫描循环;
第十一步:对所有时空扫描数据降序排序,分析排序后数据信息得出疑似爆发的网络账户与关联账户。
2.根据权利要求1所述的基于时空扫描的网络舆情预警监测方法,其特征在于:所述监测点的选择应表现为单独的网络账户ID上,在获取每一个网络账户ID之后,将每一个网络账户ID作为一个单独的监测点存放入数据库之中。
3.根据权利要求1所述的基于时空扫描的网络舆情预警监测方法,其特征在于:所述控制扫描参数包括扫描半径R,扫描圆心SCENTER,最大扫描半径R_max,扫描节点量T_scan,最大扫描节点量T_max,计算扫描区域内的对数广义似然比LGLRA,将每次的扫描结果数据存放入数据库,每次扫描后,判别是否扫描完成,未完成时循环继续扫描,直至扫描完成。
4.根据权利要求1所述的基于时空扫描的网络舆情预警监测方法,其特征在于:所述对所有时空扫描数据降序排序具体为对数据库中的扫描数据进行处理,将所有的时空扫描数据,按照对数广义似然比LGLRA降序排序并进行数据清洗。
CN201810838973.0A 2018-07-27 2018-07-27 一种基于时空扫描的网络舆情预警监测方法 Active CN109471881B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810838973.0A CN109471881B (zh) 2018-07-27 2018-07-27 一种基于时空扫描的网络舆情预警监测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810838973.0A CN109471881B (zh) 2018-07-27 2018-07-27 一种基于时空扫描的网络舆情预警监测方法

Publications (2)

Publication Number Publication Date
CN109471881A CN109471881A (zh) 2019-03-15
CN109471881B true CN109471881B (zh) 2022-04-12

Family

ID=65660088

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810838973.0A Active CN109471881B (zh) 2018-07-27 2018-07-27 一种基于时空扫描的网络舆情预警监测方法

Country Status (1)

Country Link
CN (1) CN109471881B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572687A (zh) * 2013-10-17 2015-04-29 北大方正集团有限公司 微博传播的关键用户识别方法和装置
CN105117484A (zh) * 2015-09-17 2015-12-02 广州银讯信息科技有限公司 一种互联网舆情监测方法和系统
CN106980692A (zh) * 2016-05-30 2017-07-25 国家计算机网络与信息安全管理中心 一种基于微博特定事件的影响力计算方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
UA93065U (uk) * 2014-07-01 2014-09-10 Товариство З Обмеженою Відповідальністю "Ал.Ві.Технологія" Система інтерактивного моніторингу для вивчення суспільної думки, проведення маркетингових та соціальних досліджень та демонстрації рекламних матеріалів на електронних пристроях в касовій зоні торговельних мереж

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572687A (zh) * 2013-10-17 2015-04-29 北大方正集团有限公司 微博传播的关键用户识别方法和装置
CN105117484A (zh) * 2015-09-17 2015-12-02 广州银讯信息科技有限公司 一种互联网舆情监测方法和系统
CN106980692A (zh) * 2016-05-30 2017-07-25 国家计算机网络与信息安全管理中心 一种基于微博特定事件的影响力计算方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于微博的突发事件网络舆情监测方法研究;杨书宁;《中国优秀硕士学位论文全文数据库 社会科学I辑》;20150815(第8期);第2-5节 *

Also Published As

Publication number Publication date
CN109471881A (zh) 2019-03-15

Similar Documents

Publication Publication Date Title
Cresci et al. Cashtag piggybacking: Uncovering spam and bot activity in stock microblogs on Twitter
Resende et al. Analyzing textual (mis) information shared in WhatsApp groups
CN103150374B (zh) 一种识别微博异常用户的方法和系统
CN103795612B (zh) 即时通讯中的垃圾和违法信息检测方法
Comarela et al. Understanding factors that affect response rates in twitter
CN102609475A (zh) 微博内容监测方法及监测系统
CN103117891B (zh) 微博平台上的僵尸用户探测方法
David et al. Features combination for the detection of malicious Twitter accounts
CN107403007A (zh) 一种基于网络的微博消息可信度判别模型的方法
Uzar The connection between freedom of the press and environmental quality: an investigation on emerging market countries
Woo et al. An event-driven SIR model for topic diffusion in web forums
Wang et al. Exploring rumor combating behavior of social media on NIMBY conflict: Temporal modes, frameworks and strategies
Boireau Determining political stances from twitter timelines: The belgian parliament case
CN109471881B (zh) 一种基于时空扫描的网络舆情预警监测方法
CN111885011B (zh) 一种业务数据网络安全分析挖掘的方法及系统
Evans et al. Credibility assessment of financial stock tweets
Alsuhibany A space-and-time efficient technique for big data security analytics
Kong et al. Towards the prediction problems of bursting hashtags on T witter
Son Quick-and-wide propagation of disaster tweets: Why it matters and how to measure it
Mathur et al. Dynamic SEIZ in online social networks: epidemiological modeling of untrue information
CN115391674A (zh) 网络社区虚假信息高效抑制方法及装置、设备、存储介质
CN113660147A (zh) 一种基于模糊熵的ip会话序列周期性评估方法
Saito et al. Burst detection in a sequence of tweets based on information diffusion model
Yamak et al. Automatic detection of multiple account deception in social media
Mezghani et al. Online social network phenomena: buzz, rumor and spam

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant