CN107908645A

CN107908645A - 一种基于渗流分析的在线社交平台谣言传播的免疫方法

Info

Publication number: CN107908645A
Application number: CN201710929836.3A
Authority: CN
Inventors: 高佳利; 李大庆; 赵子龙
Original assignee: Beihang University
Current assignee: Beihang University
Priority date: 2017-10-09
Filing date: 2017-10-09
Publication date: 2018-04-13
Anticipated expiration: 2037-10-09
Also published as: CN107908645B

Abstract

本发明提供一种基于渗流分析的在线社交平台谣言传播的免疫方法，步骤如下：一、对实际微博谣言数据信息进行预处理；二、针对已预处理的数据信息，基于用户之间的转发与被转发关系，建立谣言传播网络；三、基于已有的谣言网络信息，依据不同谣言网络的共同参与者的相互关系建立谣言耦合网络；四、从不同角度对谣言耦合网络进行渗流分析，对比不同渗流方法对谣言网络的抑制效果，提出有效的免疫方法；通过以上步骤，本发明基于实际在线社交平台上谣言传播数据建立网络，并根据网络间的联系建立谣言耦合网络，从不同角度对耦合网络进行渗流分析，从而对谣言网络的脆弱性进行评估和量化，能对进一步免疫在线社交网络的谣言传播提供强有力的方法支撑。

Description

一种基于渗流分析的在线社交平台谣言传播的免疫方法

技术领域

本发明提出一种基于渗流分析的在线社交平台谣言传播的免疫方法，它涉及网络科学中的渗流理论和耦合网络分析，属于信息传播学与网络科学的交叉技术领域。

背景技术

互联网技术的快速发展使得信息交互更加便捷，一系列依托网络媒介迅速产生并传播的网络谣言对社会造成了很大影响。《中国新媒体发展报告(2013)》发布称，在2012年媒体中报道的671条谣言中，有34.7％的谣言是通过微博为渠道进行传播的。因此，基于新浪微博的实际谣言数据信息进行分析，掌握在线社交平台上谣言的传播规律，对谣言传播进行及时有效的免疫刻不容缓。

谣言传播和病毒传播都是网络上的传播过程。现有谣言传播模型借助随机过程的方法来分析谣言传播，这种方法在一定近似条件下是合理的，但是不能完全符合在线社交平台上谣言传播的实际过程。基于数学的谣言传播模型尽管具有高度的抽象性、严密的逻辑性，但这些模型对谣言传播过程描述均是非直观的且不可求解的。

掌握谣言传播规律的目的是为了对谣言实行有效免疫，令谣言传播带来的损失降到最低。以往对谣言传播的免疫方法主要分为两大类：一类是从谣言本身的传播过程和谣言传播所在的网络结构特征进行预防和控制；一类是施行外部干预策略，如对网络中的个体进行谣言免疫。波兰学者Grabowski等研究了由线上多人组成的虚拟社会网络，发现人类行为的幂律特性会抑制谣言传播。汪小帆等研究了具有幂律度分布的无标度网络上的聚类系数对谣言传播的影响，得出可以通过增大网络聚类系数的方法来有效地抑制谣言传播的结论。通过个体免疫来遏制谣言传播的方法主要有随机免疫、目标免疫和熟人免疫三种。随机免疫方法是完全随机地选取网络中的一部分节点进行免疫，它不考虑节点的连接度，平等对待度大的节点和度小的节点，在免疫过程中对节点的选择没有优先顺序，西班牙的R.Pastor-Satorras研究表明如果在无标度网络中实施随机免疫策略，几乎要免疫网络中所有的节点才能保证切断谣言的传播，这种方法显然是不经济的，也是不现实的。目标免疫是通过有选择地对少量关键节点进行免疫，它能够克服随机免疫中几乎要对所有节点都进行免疫才能保证消除谣言的弊端，这种免疫方法比较有效，但却需要了解网络的全局信息。熟人免疫是从全体节点中随机选出一定比例的节点，再从每一个被选出的节点中选择它的一个邻居节点进行免疫。

本发明克服了原有谣言传播模型与免疫方法存在的弊端。已有的谣言传播模型缺乏实际谣言传播数据支撑，对谣言传播过程的刻画具有局限性，没有完全体现实际在线社交网络平台上谣言传播过程的特点，因此不能精准地描述谣言传播过程。本发明基于采集到的实际在线社交网络平台上谣言传播数据信息，针对谣言数据信息建立谣言传播网络，可以实现精准可视化谣言传播的实际过程；已有抑制谣言传播的免疫方法为基于谣言传播网络的免疫方法，旨在抑制某条谣言网络的传播，这些方法的缺点是比较低效，不能实现快速有效地对大规模同时期在在线社交网络平台上传播的多条谣言进行抑制，故均已不适用免疫谣言在在线社交网络平台上的传播。本发明基于已建立的谣言网络信息，依据不同谣言网络共同参与者之间的关系建立谣言耦合网络，考虑同时期内社交网络平台上多条谣言网络的传播，可为进一步同时免疫多条谣言网络提供方法支撑。

发明内容

(一)发明的目的

本发明的目的是：针对社交网络上谣言传播的免疫问题，本发明提供了一种基于渗流分析的在线社交平台谣言传播的免疫方法,利用不同渗流方法对谣言网络的脆弱性进行评价和量化，对进一步免疫在线社交网络的谣言传播提供强有力的方法支撑。

本发明的理论基础：现实中的网络系统通常会相互作用从而构成耦合网络。对于相互依赖的耦合网络来说，当其中一个网络中的节点失去功能，那么和它所对应的另一个网络中的节点也就失去功能，从而形成了级联失效。比如互联网以电网为支撑，故障会在两者之间来回传递，使得耦合网络中蕴含着很大的脆弱性。2003年意大利的一座电站的关闭导致了互联网通讯的失灵，继而造成更多电站的故障，从而引发大规模停电事故。2010年，以色列巴依兰大学Shlomo Havlin教授等人以2003年意大利大规模停电的数据为例提出了第一个研究耦合网络的理论框架，结果表明，由于耦合网络内部之间的相互作用，使得耦合网络比单个网络面对随机攻击变得更加脆弱。耦合网络的研究不仅具有重要的理论价值，更具有重要的实际价值。

本发明利用实际在线社交网络上的谣言传播数据建立谣言传播网络，基于耦合网络理论依据谣言传播网络之间的关系进一步建立谣言耦合网络，对谣言耦合网络进行渗流分析，给出对网络不同攻击方法的评价，特别是利用渗流理论对谣言耦合网络的脆弱性进行评估和量化。

(二)技术方案

本发明的技术解决方案：建立一种基于渗流分析的在线社交平台谣言传播的免疫方法。本发明首先对收集到的实际微博谣言网络数据进行预处理，得到每条微博谣言网络的信息，包括参与微博网络传播的用户信息和转发关系信息，通常情况下设定每次转发为网络中的“边”，参与微博传播的用户设定为网络中的“节点”，以此首先建立对应于实际微博谣言数据的谣言传播网络；之后基于已有的谣言网络信息，依据不同谣言网络的共同参与者之间的相互关系，建立谣言耦合网络，并从不同角度对谣言耦合网络进行渗流分析，对比不同渗流方法对耦合网络的抑制效果，能对进一步免疫多条在线社交网络的谣言传播提供强有力的方法支撑。

本发明建立一种基于渗流分析的在线社交平台谣言传播的免疫方法，其步骤如下：

步骤一、对实际微博谣言数据信息进行预处理；

本发明基于满足以下要求的微博谣言数据：

(a)微博标识信息：每条微博各自的标识码信息，即微博标识码，用以查找和标识该条微博；

(b)用户信息：参与每条谣言传播网络的用户信息；

(c)转发信息：每条谣言网络中需包含明确的转发时间、转发与被转发的用户之间的信息；

其具体作法如下：

由于现实采集到的数据往往是有缺失或是有错误数据的，如微博标识信息缺失、用户信息错位、转发信息不完全，这时候需要运用数据补偿、数据筛选等方法对数据进行预处理。首先对微博标识信息进行数据筛选，筛除标识信息不完全的情况，其次逐一检查每条微博内部所包含信息，如有转发信息或用户信息缺失情况，则试图重新采集相应微博或用户信息或其他数据挖掘方法进行数据补偿。利用数据筛选、数据补偿的方法来保证每条微博特有的标识信息、每个用户信息、每条转发信息的正确性和完整性；

步骤二、针对已预处理的实际微博谣言数据信息，基于用户之间的转发与被转发关系，建立谣言传播网络；

其具体作法如下：

将实际微博谣言数据信息，包括每条谣言网络中的用户信息和转发信息，分别抽象成网络中的节点和边：每一个参与该微博传播的用户都可抽象为该谣言网络中的节点，在此条微博谣言数据信息中，每次转发与被转发的关系可抽象为该谣言网络中的连边；按以上规则可将收集到的每条微博谣言数据均抽象为谣言传播网络；具体实现方法为：首先在编程环境下导入复杂网络模块，先创建一个空图，导入已预处理过的数据，每读取一条转发与被转发关系，相应地向图内添加一条边，读取数据完毕时即谣言网络建成；

步骤三、基于已有的谣言网络信息，依据不同谣言网络的共同参与者的相互关系建立谣言耦合网络；

其具体作法如下：

基于步骤二中已建立的谣言网络信息，可以发现不同谣言网络中有一些共同参与者的存在，即有一部分用户，重复参与多条谣言网络的传播过程，以此对应于多条谣言网络之间的联系；依据谣言网络之间共同参与者的关系，建立谣言耦合网络；在新的谣言耦合网络中，节点代表原每条谣言网络信息，并检查每对单网(即新谣言耦合网络中的每对节点)间是否有共同参与者，若存在共同参与者，则认为此对单网间有联系，即对应新谣言耦合网络中的此对节点间存在连边，连边权重为此对网络间的重复率，重复率的计算方法为同时参与该对网络的节点数与参与该对单网节点的总数之比；按以上规则遍历每对谣言单网并记录每对连边(若存在)及其权重，以此建立谣言耦合网络；具体实现方法为：对比每两条谣言网络的用户标识码信息，若有重复标识码，即该用户重复参与两条谣言网络的传播，此对单网间在耦合网络中存在链接，则在新网中的两节点间添加连边，连边权重为重复参与这两条网络的用户标识码总数与参与两条网络总人数之比，以此规则创建谣言耦合网络；

步骤四、从不同角度对谣言耦合网络进行渗流分析，对比不同渗流方法对谣言网络的抑制效果，提出有效的免疫方法；

其具体作法如下：

将一个网络中的部分节点及与这些节点相连接的边去除，这一过程称为渗流。以往的谣言传播免疫研究方法均为基于单网的免疫方法，即对谣言传播网络进行渗流分析，譬如随机免疫即随机删除网络中的一部分节点来观察免疫效果。本发明基于步骤三中建立的谣言耦合网络对谣言耦合网络进行点渗流或边渗流；

采用不同的渗流方法，能使我们对谣言耦合网络的结构、鲁棒性有更全面的了解。这里分别采用的渗流方法为按边的权重渗流、按节点强度渗流和基于节点度进行渗流；比如按边的权重渗流即设定一组渗流阈值，将耦合网络中权重大于某渗流阈值的连边全部删除，分别观察网络中最大子团占比的变化情况；以渗流理论为基础，本发明对谣言耦合网络应用不同渗流方法进行渗流，并对比不同渗流方法对多条谣言网络的抑制效果，对不同渗流方法，将删除边或点之后耦合网络中剩余的边或点占全网的比例作为自变量，对应的最大子团占比为因变量，将不同渗流方法得出的曲线绘制在一张图上对比，该曲线所围成的面积最小者为最优渗流方法，此时可实现快速有效攻击谣言耦合网络，以此作为最有效的免疫方法；

通过以上步骤，本发明基于实际在线社交平台上谣言传播数据建立网络，并根据网络间的联系建立谣言耦合网络，从不同角度对耦合网络进行渗流分析，从而对谣言网络的脆弱性进行评估和量化，能对进一步免疫在线社交网络的谣言传播提供强有力的方法支撑。

(三)优点和功效

相比较于传统谣言模型建立与谣言免疫方法，本发明所采用的基于渗流分析的谣言传播网络的免疫方法具有如下优势：

(a)真实可靠性：用模型研究谣言是学术界常用的方法，然而谣言传播是以人为主体的多因素、多变量的复杂体系，所以一直很难找到合适的定量分析方法对它们进行科学、准确的描述，并且传统的谣言模型也不适用于模拟新媒体时代在线社交网络平台上的谣言传播过程。本发明基于真实在线社交网络平台上的谣言传播数据，通过构建谣言网络的方式直观复现谣言在社交网络上的传播来可视化谣言传播过程，使研究结果更具真实可靠性。

(b)全局性：与以往基于网络进行谣言免疫的方法不同，本发明从多条谣言网络的全局信息出发，利用谣言网络之间的关系建立谣言耦合网络，并基于渗流理论对谣言耦合网络进行渗流分析，对比不同渗流方法对谣言耦合网络的免疫效果。与以往只对谣言网络进行免疫的方法相比，本发明从大规模同时期在在线社交网络平台上传播的多条谣言网络及其之间的关系出发建立谣言耦合网络，研究出发点更具全局性，可为进一步同时免疫多条谣言网络提供方法支撑。

(c)高效性：渗流方法得到的评价结果具有更高的有效性。以往针对网络中的谣言控制问题提出的许多免疫方法如熟人免疫、目标免疫、随机免疫或者不能精准地描述实际在线社交网络平台上的谣言传播过程，或者比较低效，这些免疫方法已经不适用于对在线社交网络平台上的谣言传播的免疫，本发明基于从不同角度对谣言耦合网络进行渗流分析，并对谣言耦合网络的脆弱性进行评价和量化。与传统免疫方法相比，本发明同时考虑了大规模同时期在在线社交网络平台上传播的多条谣言网络及其免疫，即基于渗流分析的谣言传播网络的免疫方法更具有针对性、快速有效性。

综上，这种新方法的研究结果将对免疫在线社交网络上的谣言传播提供强有力的方法支撑。

附图说明

图1为本发明所述方法流程示意图。

图2为本发明中每对谣言网络对应到谣言耦合网络中的示意图。

图中序号、符号、代号说明如下：

图2中：A表示A网络

B表示B网络

A、B网络相互重叠的阴影部分表示同时参与A、B网络的节点总数。

具体实施方式

为使本发明要解决的技术问题、技术方案更加清楚，下面将结合附图及具体实施案例进行详细描述。

本发明的目的在于克服现有谣言传播模型及谣言传播免疫方法在真实性、有效性以及全局性方面的不足之处，提供一种基于渗流分析的微博谣言传播网络的免疫方法。在本发明中，以实际微博谣言数据信息为基础，构建微博谣言传播网络，并基于已有的谣言网络信息，依据不同谣言网络的共同参与者的相互关系建立新的谣言耦合网络，通过不同角度、不同方法对谣言耦合网络进行渗流过程分析，对比不同渗流方法对谣言传播网络的抑制效果。从而对谣言网络的脆弱性进行评价和量化，对进一步免疫在线社交网络的谣言传播提供强有力的方法支撑。

本发明一种基于渗流分析的微博谣言传播网络的免疫方法，见图1所示，在实施案例中的具体步骤如下：

步骤一：对实际微博谣言数据信息进行预处理；

本发明以某一条实际微博谣言传播网络数据信息为例，该条微博谣言传播网络具有特有的标识信息，其中每个参与此微博传播的用户具有各自的标识号码，各自独立，没有重复。该条微博谣言传播中，每次转发关系对应转发用户与被转发用户之间的一条边，边具有各自的标识信息，没有重复。现实采集到的数据往往是有缺失或是有错误数据的，比如微博标识码缺失、用户标识号码缺失、转发信息重复，用户信息错位、转发信息不完全，这时候需要运用数据筛选、数据补偿等方法对数据进行预处理，首先对微博标识信息进行数据筛选，筛除标识信息不完全的情况，其次逐一检查每条微博内部所包含信息，如有转发信息或用户信息缺失情况，则试图重新采集相应微博或用户信息或其他数据挖掘方法进行数据补偿。利用数据筛选、数据补偿的方法来保证每条微博自有的标识信息、每个用户信息、每条转发信息的正确性和完整性；

将实际微博谣言数据信息，包括每条谣言网络中的用户信息和转发信息，分别抽象成网络中的节点和边，每一个参与该微博传播的用户都可抽象为该谣言网络中的节点，在此条微博谣言数据信息中，每次转发与被转发的关系可抽象为该谣言网络中的连边。并根据用户与转发之间的对应关系建立节点和边之间的拓扑联系。实现方法为基于编程环境中的复杂网络模块建立网络，首先对预处理后的数据文件进行格式读取，并利用参与此条微博的每个用户的标识码信息向网络图中增加节点，利用每次转发信息即每条边的信息向网络图中增加边的连接，按以上规则建立谣言传播网络。

步骤三、基于已有的谣言网络信息，依据不同谣言网络的共同参与者的相互关系建立一个新的谣言耦合网络；

为探寻网络之间如图2中(A、B网络相互重叠的阴影部分表示同时参与A、B网络的节点总数)的共同参与者的联系，利用不同谣言网络中的共同参与者的相互关系建立一个新的谣言耦合网路，将步骤二中建立的每个网络均抽象为新耦合网络中的每个节点，即新网络中的节点数为原谣言单网总数，并计算每对单网(即新谣言耦合网络中的每对节点)间是否有共同参与者，若存在共同

参与者，则认为此对单网间有联系，即对应新谣言耦合网络中的此对

节点间存在连边，连边权重为此对网络间的重复率，如下列公式所示：

式中：

Weight：连边权重

S_A∩B：同时参与社交谣言网络A与网络B的节点数目

S_A∪B：参与社交谣言网络A与网络B的总节点数目

其重复率的计算方法即为同时参与该对网络的节点数S_A∩B与参与该对节点总数S_A∪B之比，按以上规则遍历每对谣言网络并记录每对连边(若存在)及其权重，建立新的谣言耦合网络。

步骤四：用不同方法对新的谣言耦合网络进行渗流分析。

谣言耦合网络建成后，为分析单网之间联系的强弱，分别从以下几个角度对谣言耦合网络进行渗流分析：

(a)从节点度的角度进行渗流分析：设定一定的阈值范围，删除耦合网络中度超过此阈值的节点，按一定精度选取阈值，以网络中最大子团的占比来观察网络的破裂程度；

(b)从节点强度的角度进行渗流分析：与节点度渗流分析类似，删除耦合网络中节点强度超过一定阈值的节点并记录此刻网络中最大子团占比来观察耦合网络的破坏程度；

(c)从边的权重角度进行渗流分析：设定一组阈值，逐步删除边的权重大于某阈值的连边并记录最大子团占比；

对比上述几种渗流方法，按可使谣言耦合网络破裂最快的原则选取最佳的渗流方法，此时该渗流方法对网络的抑制效果最好，即可对在线社交网络的谣言传播的免疫提供强有力的方法支撑。

本发明未详细阐述部分属于本领域公知技术。

以上所述，仅为本发明部分具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本领域的人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。

Claims

1.一种基于渗流分析的在线社交平台谣言传播的免疫方法，其特征在于：其步骤如下：

步骤一、对实际微博谣言数据信息进行预处理；

2.根据权利要求1所述的一种基于渗流分析的在线社交平台谣言传播的免疫方法，其特征在于：在步骤一中所述的“对实际微博谣言数据信息进行预处理”，其作法如下：

本发明所述的“实际微博谣言数据”满足以下要求：

(b)用户信息：参与每条谣言传播网络的用户信息；

其具体作法如下：

由于现实采集到的数据往往是有缺失及有错误数据的，如微博标识信息缺失、用户信息错位、转发信息不完全，这时候需要运用数据补偿、数据筛选方法对数据进行预处理；首先对微博标识信息进行数据筛选，筛除标识信息不完全的情况，其次逐一检查每条微博内部所包含信息，如有转发信息及用户信息缺失情况，则试图重新采集相应微博或用户信息及其他数据挖掘方法进行数据补偿；利用数据筛选、数据补偿的方法来保证每条微博特有的标识信息、每个用户信息、每条转发信息的正确性和完整性。

3.根据权利要求1所述的一种基于渗流分析的在线社交平台谣言传播的免疫方法，其特征在于：在步骤二中所述的“针对已预处理的实际微博谣言数据信息，基于用户之间的转发与被转发关系，建立谣言传播网络”，其具体作法如下：

将实际微博谣言数据信息，包括每条谣言网络中的用户信息和转发信息，分别抽象成网络中的节点和边：每一个参与该微博传播的用户都抽象为该谣言网络中的节点，在此条微博谣言数据信息中，每次转发与被转发的关系抽象为该谣言网络中的连边；按以上规则将收集到的每条微博谣言数据均抽象为谣言传播网络；具体实现方法为：首先在编程环境下导入复杂网络模块，先创建一个空图，导入已预处理过的数据，每读取一条转发与被转发关系，相应地向图内添加一条边，读取数据完毕时即谣言网络建成。

4.根据权利要求1所述的一种基于渗流分析的在线社交平台谣言传播的免疫方法，其特征在于：在步骤三中所述的“基于已有的谣言网络信息，依据不同谣言网络的共同参与者的相互关系建立谣言耦合网络”，其具体作法如下：

基于步骤二中已建立的谣言网络信息，能发现不同谣言网络中有共同参与者的存在，即有一部分用户，重复参与多条谣言网络的传播过程，以此对应于多条谣言网络之间的联系；依据谣言网络之间共同参与者的关系，建立谣言耦合网络；在新的谣言耦合网络中，节点代表原每条谣言网络信息，并检查每对单网即新谣言耦合网络中的每对节点间是否有共同参与者，若存在共同参与者，则认为此对单网间有联系，即对应新谣言耦合网络中的此对节点间存在连边，连边权重为此对网络间的重复率，重复率的计算方法为同时参与该对网络的节点数与参与该对单网节点的总数之比；按以上规则遍历每对谣言单网并记录每对连边及其权重，以此建立谣言耦合网络；具体实现方法为：对比每两条谣言网络的用户标识码信息，若有重复标识码，即该用户重复参与两条谣言网络的传播，此对单网间在耦合网络中存在链接，则在新网中的两节点间添加连边，连边权重为重复参与这两条网络的用户标识码总数与参与两条网络总人数之比，以此规则创建谣言耦合网络。

5.根据权利要求1所述的一种基于渗流分析的在线社交平台谣言传播的免疫方法，其特征在于：在步骤四中所述的“从不同角度对谣言耦合网络进行渗流分析，对比不同渗流方法对谣言网络的抑制效果，提出有效的免疫方法”，其具体作法如下：

将一个网络中的部分节点及与这些节点相连接的边去除，这一过程称为渗流；本发明基于步骤三中建立的谣言耦合网络对谣言耦合网络进行点渗流及边渗流；

采用不同的渗流方法，能使我们对谣言耦合网络的结构、鲁棒性有更全面的了解；这里分别采用的渗流方法为按边的权重渗流、按节点强度渗流和基于节点度进行渗流；比如按边的权重渗流即设定一组渗流阈值，将耦合网络中权重大于一渗流阈值的连边全部删除，分别观察网络中最大子团占比的变化情况；以渗流理论为基础，本发明对谣言耦合网络应用不同渗流方法进行渗流，并对比不同渗流方法对多条谣言网络的抑制效果，对不同渗流方法，将删除边及点之后耦合网络中剩余的边及点占全网的比例作为自变量，对应的最大子团占比为因变量，将不同渗流方法得出的曲线绘制在一张图上对比，该曲线所围成的面积最小者为最优渗流方法，此时能实现快速有效攻击谣言耦合网络，以此作为最有效的免疫方法。