CN109471881B

CN109471881B - 一种基于时空扫描的网络舆情预警监测方法

Info

Publication number: CN109471881B
Application number: CN201810838973.0A
Authority: CN
Inventors: 邵玉斌; 高凌云志; 张琪
Original assignee: Kunming University of Science and Technology
Current assignee: Kunming University of Science and Technology
Priority date: 2018-07-27
Filing date: 2018-07-27
Publication date: 2022-04-12
Anticipated expiration: 2038-07-27
Also published as: CN109471881A

Abstract

本发明涉及一种基于时空扫描的网络舆情预警监测方法，属于舆情预警与监测技术领域。获取每个网络账户的ID；以每一个网络账户ID作为一个单独的监测点，将网络账户ID信息存放于数据库；以时间节点统计各网络账户的接收与发送数据量；以账户间发送数据量来确认个账户之间的数据关系距离；统计生成全局数据量矩阵；根据账户信息与时间节点统计的数据量来生成各账户间的距离矩阵；控制参数确定扫描范围；计算扫描区域内的对数广义似然比，对每次数据存放入数据库；判断是否扫描完成，若未完成则继续扫描，若完成则对所有时空扫描数据进行处理分析；对所有时空扫描数据降序排序，分析排序后数据信息得出疑似爆发的网络账户与关联账户。

Description

一种基于时空扫描的网络舆情预警监测方法

技术领域

本发明涉及一种基于时空扫描的网络舆情预警监测方法，属于舆情预警与监测技术领域。

背景技术

随着互联网在全球范围内的飞速发展，中国的互联网用户也达到了相当庞大的数量，在互联网时代，网络媒体称为一种新型的媒体方式，因此，网络成为社会舆情的主要载体之一。

信息的快速传播是互联网的一个重要特性，信息在网络上的主要传播内容一般都是公众对于现实生活中的一些热点话题的讨论或者是对于焦点问题所持有的较强影响力、倾向性的情感、态度、意见、言论或观点。承载这些网络内容的网络载体主要体现在大型论坛上的发帖、跟帖、个人博客、微信推送、社交软件群之类。由于互联网具有虚拟性、隐蔽性、发散性、渗透性和随意性等特点，越来越多的网民乐意通过这种渠道来表达观点、传播思想。

网络舆情是互联网上一种特有的、强大的舆论力量，其往往作用于热门事件、焦点话题并对事态的发展产生巨大的影响。由于网络传播速度之快，在短时间内会产生大面积的扩散，对社会影响巨大，特别是当出现负面的网络舆情时，若不能及时了解、有效引导，很容易形成舆论危机，严重时可能会引起民众恐慌，甚至影响公共安全。

互联网是一个开放的大环境，网民的个人观点能够随意的表述，在不明真相的情况下，很容易出现错误的跟风现象，从而产生大量的错误的、虚假的信息，同时可能存在不法分子，通过在网络上蓄意传播诈骗信息、负面新闻等方式进行网络犯罪。由于网民的基数巨大，很容易产生舆情，怎样在舆情大面积传播之前，对其进行预警和监测成了舆情防护的重点。

虽然，国家信息安全相关部门出台了很多措施来对舆情进行管制，提出了很多不同的解决方案和预防方案。但是，截止目前为止，还没有出现一种高效的、准确的针对信息传播舆情预防、监测方法。

发明内容

本发明要解决的技术问题是提供一种基于时空扫描的网络舆情预警监测方法，用以解决上述问题。

本发明的技术方案是：一种基于时空扫描的网络舆情预警监测方法：

第一步：获取网络账户的ID信息；

第二步：以网络账户ID作为一个单独的信息监测点，并将账户ID信息存放入数据库；

第三步：以分钟、小时或天作为时间节点T_dot对数据进行划分；

第四步：以时间节点统计各网络账户的接收与发送数据量；

第五步：以账户间发送数据量来确认各账户之间的数据关系距离L_list；

第六步：结合数据库中的ID信息，对网络账户的接收与发送数据量进行统计并生成全局数据量矩阵

其中；每一行为一个网络账户监测点z＝1...Z，每一列为当前监测点在时间节点T_dot上的数据总量T_data；

第七步：结合数据库中的ID信息，结合各账户之间的数据关系距离L_list，生成个账户之间的数据关系距离矩阵L_cd；

第八步：控制扫描参数，确定扫描区域范围，控制扫描的关键参数如扫描半径R,扫描圆心SCENTER，最大扫描半径R_max，扫描节点量T_scan，最大扫描节点量T_max等控制扫描区域范围；

第九步：计算扫描区域内的对数广义似然比LGLR_A，并将每次的扫描结果存放入数据库中；

第十步：判断是否对全局扫描完成，若未完成全部扫描，则继续返回到扫描步骤循环扫描，若扫描完成，则跳出扫描循环；

第十一步：对所有时空扫描数据降序排序，分析排序后数据信息得出疑似爆发的网络账户与关联账户；

所述监测点的选择应表现为单独的网络账户ID上，在获取每一个网络账户ID之后，将每一个网络账户ID作为一个单独的监测点存放入数据库之中。

所述时间节点T_dot以分钟、小时或天作为单位，并以选定的时间节点来统计各个网络账户的接收数据量T_data_in与发送数据量T_data_out；以账户之间的发送数据量T_data_out来确认账户之间的数据关系距离L_list。账户数据的交互量，会引起相互之间的数据关系距离产生不同。

所述网络账户在时间节点上的数据总量T_data为当前接收数据量T_data_in与发送数据量T_data_out的总和，结合数据库中的ID信息，对网络账户的接收数据量T_data_in与发送数据量T_data_out进行统计并生成全局数据量矩阵C_zd，结合数据库中的ID信息，结合各账户之间的数据关系距离L_list，生成个账户之间的数据关系距离矩阵L_cd。

所述控制扫描参数包括扫描半径R,扫描圆心SCENTER，最大扫描半径R_max，扫描节点量T_scan，最大扫描节点量T_max，计算扫描区域内的对数广义似然比LGLR_A，将每次的扫描结果数据存放入数据库，每次扫描后，判别是否扫描完成，未完成时循环继续扫描，直至扫描完成。

所述对所有时空扫描数据降序排序具体为对数据库中的扫描数据进行处理，将所有的时空扫描数据，按照对数广义似然比LGLR_A降序排序并进行数据清洗。

本发明的有益效果是：可以高效的、准确的针对网络上信息传播舆情进行预防和监测，为净化网络，监控和监管网络垃圾信息提供帮助。

附图说明

图1是本发明的步骤流程图；

具体实施方式

下面结合附图和具体实施方式，对本发明作进一步说明。

一种基于时空扫描的网络舆情预警监测方法：

第一步：获取每个网络账户的ID信息，在每一个网络用户的使用过程中，都会存在一个相对于的网络账户，获取当前账户的信息，例如IP信息、账户名等作为其ID信息；

第二步：以每一个网络账户ID作为一个单独的信息监测点，并将账户ID信息存放入数据库，其主要的表述方式如式1所示，每一个监测点都是单一存在的，在数据库中对其进行有序储存，每一个监测点对应一行，其可作为后续查询索引表；

第三步：以分钟、小时或天作为时间节点T_dot对数据进行划分，时间节点的作用主要是细分数据的区间量，当某一地区的数据量将少时，可以放大时间节点的比例，比如以天为时间节点来对数据进行划分，如果某一地区的数据量比较大，那么可以减小时间节点，例如用分钟或小时来对数据量进行划分；

第四步：以时间节点统计各网络账户的接收与发送数据总量T_data；如式2所示，当前实例是以分钟作为时间节点对数据总量进行统计，每一行代表一个监测点，每一列代表一个时间节点中的数据量，例如第一行其数据为[5 7 2 2 3 1 0 4 3 6 4 6 5 4]表示是机构No.1在某14分钟的数据总量，第一列数值为5，表示在这14分钟的第1分钟的数据总量为5条数据，第七列的数值为0，表示在当前分钟，即第7分钟的数据总量为0，既没有发送数据也没有接收数据。

第五步：以账户间发送数据量来确认各账户之间的数据关系距离L_list，账户间的距离，由主动发送量来确定，如表1所示，在表1中列举的为No.1针对于其余7个No.2～No.8监测点的发送数据量，使用

来计算数据关系距离比例值，此专利中lam＝300，如表1中所示，No.1相对于No.3的发送数据量为30条，则两监测点数据关系距离为10，No.1相对于No.6的发送数据量为0条，即表示没有数据量发送，则两监测点数据关系距离为无穷大+∞，由于相互的数据发送量不尽相同，如表2中所示，以No.3为主时，相对于No.1的发送数据量为120条，则其与No.1的数据关系距离为2.5，数据关系距离L_list其数值越大，表示距离越远，数值越小，表示距离越近；

表1

表2

其中；每一行为一个网络账户监测点z＝1...Z，每一列为当前监测点在时间节点T_dot上的数据总量T_data，如式2所示，第一行其数据为[5 7 2 2 3 1 0 4 3 6 4 6 5 4]表示是机构No.1在某14分钟区间中的数据总量按照每分钟的时间节点分布，第一列数值为5，表示在这14分钟的第1分钟的数据总量为5条数据，第七列的数值为0，表示在当前分钟，即第7分钟的数据总量为0，既没有发送数据也没有接收数据。

第七步：结合数据库中的ID信息，结合各账户之间的数据关系距离L_list，生成个账户之间的数据关系距离矩阵L_cd，如式3所示，每一行代表一个网络账户监测点，其后依次为相对于其他监测点的数据关系距离L_list，以第一行为例[0 7 2 4 3 1 2.5 4]其中L₁₁＝0表示相对于自己的距离为0，L₁₇＝2.5表示1号监测点相对于No.7的距离为2.5，以下各行、列以此类推；

第九步：计算扫描区域内的对数广义似然比LGLR_A其计算公式为：

其中，C是全部C_zd矩阵上的全部数据总量的总和

C_A是所有与圆心监测点扫描半径内的数据量总和

μ_A是所有与圆心监测点扫描半径内的数据量总期望和

将每次的扫描结果存放入数据库中；

以上结合附图对本发明的具体实施方式作了详细说明，但是本发明并不限于上述实施方式，在本领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims

1.一种基于时空扫描的网络舆情预警监测方法，其特征在于：

第一步：获取每个网络账户的ID信息；

第二步：以每一个网络账户ID作为一个单独的信息监测点，并将账户ID信息存放入数据库；

第三步：以时间节点对数据进行划分；

第四步：以时间节点统计各网络账户的接收与发送数据量；

所述时间节点T_dot以分钟、小时或天作为单位，并以选定的时间节点来统计各个网络账户的接收数据量T_data_in与发送数据量T_data_out；以账户之间的发送数据量T_data_out来确认账户之间的数据关系距离，L_list，账户间的距离，由主动发送量来确定，使用

来计算数据关系距离比例值，lam＝300；

第六步：结合数据库中的ID信息，对网络账户的接收与发送数据量进行统计并生成全局数据量矩阵；

第七步：结合数据库中的ID信息，结合各账户之间的数据关系距离L_list，生成个账户之间的数据关系距离L_list矩阵；

所述网络账户在时间节点上的数据总量T_data为当前接收数据量T_data_in与发送数据量T_data_out的总和，结合数据库中的ID信息，对网络账户的接收数据量T_data_in与发送数据量T_data_out进行统计并生成全局数据量矩阵C_zd，结合数据库中的ID信息，结合各账户之间的数据关系距离L_list，生成个账户之间的数据关系距离矩阵L_cd；

第八步：控制扫描参数，确定扫描区域范围；

第九步：计算扫描区域内的对数广义似然比，并将每次的扫描结果存放入数据库中；

计算扫描区域内的对数广义似然比LGLR_A其计算公式为：

其中，C是全部C_zd矩阵上的全部数据总量的总和

C_A是所有与圆心监测点扫描半径内的数据量总和

μ_A是所有与圆心监测点扫描半径内的数据量总期望和

第十一步：对所有时空扫描数据降序排序，分析排序后数据信息得出疑似爆发的网络账户与关联账户。

2.根据权利要求1所述的基于时空扫描的网络舆情预警监测方法，其特征在于：所述监测点的选择应表现为单独的网络账户ID上，在获取每一个网络账户ID之后，将每一个网络账户ID作为一个单独的监测点存放入数据库之中。

3.根据权利要求1所述的基于时空扫描的网络舆情预警监测方法，其特征在于：所述控制扫描参数包括扫描半径R,扫描圆心SCENTER，最大扫描半径R_max，扫描节点量T_scan，最大扫描节点量T_max，计算扫描区域内的对数广义似然比LGLR_A，将每次的扫描结果数据存放入数据库，每次扫描后，判别是否扫描完成，未完成时循环继续扫描，直至扫描完成。

4.根据权利要求1所述的基于时空扫描的网络舆情预警监测方法，其特征在于：所述对所有时空扫描数据降序排序具体为对数据库中的扫描数据进行处理，将所有的时空扫描数据，按照对数广义似然比LGLR_A降序排序并进行数据清洗。