CN110826003A

CN110826003A - 一种基于删边聚簇的非法或有害网络信息传播控制方法

Info

Publication number: CN110826003A
Application number: CN201911064458.2A
Authority: CN
Inventors: 李黎; 王曌华; 王小明; 张立臣; 李鹏
Original assignee: Shaanxi Normal University
Current assignee: Shaanxi Normal University
Priority date: 2019-11-01
Filing date: 2019-11-01
Publication date: 2020-02-21
Anticipated expiration: 2039-11-01
Also published as: CN110826003B

Abstract

一种基于删边聚簇的非法或有害网络信息传播控制方法，包括如下步骤：S100：建立社交网络，进行初始化设置；S200：基于经典社团结构划分GN算法得到基于边介数的降序删边顺序；S300：利用广度优先搜索算法BFS确定删边数目k1；S400：通过聚簇密度变化和信息传播门槛值确定删边数目k2；S500：取k1与k2中较小的值，确定删边数目k；S600：根据GN算法中所得到的降序删边顺序，逻辑的删除一条满足条件的边；S700：重复步骤S600，直至删边数目达到k。

Description

一种基于删边聚簇的非法或有害网络信息传播控制方法

技术领域

本公开属于复杂网络应用领域，具体涉及一种基于删边聚簇的非法或有害网络信息传播控制方法。

背景技术

社交网络的流行升温和迅猛发展不仅带来了信息传播技术的根本性变革，而且正一步一步改变着人们的生产和生活方式、人际交往以及思维方式，对社会生活的各个领域和人类自身的生存与发展产生了广泛而深刻的影响。目前，社交网络涵盖以人类社交为核心的所有网络服务形式，从历史维度来看，它将是一个推动互联网向现实世界无限靠近的关键力量。网络舆情作为一种新生的舆论力量，是社会舆情在互联网空间的映射，是社会舆情的直接反映。然而，目前各国都面临非法或有害网络信息的大量传播问题，例如典型的造谣一张嘴，辟谣跑断腿。

发明内容

鉴于此，本公开提供了一种基于删边聚簇的非法或有害网络信息传播控制方法，包括如下步骤：

S100：建立社交网络，进行初始化设置；

S200：基于经典社团结构划分GN算法得到基于边介数的降序删边顺序；

S300：利用广度优先搜索算法BFS确定删边数目k1；

S400：通过聚簇密度变化和信息传播门槛值确定删边数目k2；

S500：取k1与k2中较小的值，确定删边数目k；

S600：根据GN算法中所得到的降序删边顺序，逻辑的删除一条满足条件的边；

S700：重复步骤S600，直至删边数目达到k。

通过上述技术方案，本方法在保证网络连通性的情况下结合传播非法或有害网络信息的风险代价，通过临时管制或删除网络系统中信息传播演化中最重要的边，使得非法或有害网络信息在传播的过程中被延缓或被阻断，有效降低非法或有害网络信息的传播速度，控制非法或有害网络信息的传播范围，并且成本开销较小，易于实现。

附图说明

图1是本公开一个实施例中所提供的一种基于删边聚簇的非法或有害网络信息传播控制方法的流程示意图；

图2是本公开一个实施例中所提供的社会关系网络示意图；

图3是本公开一个实施例中门槛值变化对Zachary网络的影响结果对比图；

图4是本公开一个实施例中门槛值变化对Dolphin网络的影响结果对比图；

图5是本公开一个实施例中Zachary网络聚簇密度变化结果对比图；

图6是本公开一个实施例中Dolphin网络聚簇密度变化结果对比图；

图7是本公开一个实施例中Zachary网络的I(t)变化曲线结果对比图；

图8是本公开一个实施例中Dolphin网络I(t)变化曲线结果对比图。

具体实施方式

下面结合附图对本公开进行进一步的详细说明。

在一个实施例中，参见图1至图8，其公开了一种基于删边聚簇的非法或有害网络信息传播控制方法，包括如下步骤：

S100：建立社交网络，进行初始化设置；

S300：利用广度优先搜索算法BFS确定删边数目k1；

S400：通过聚簇密度变化和信息传播门槛值确定删边数目k2；

S500：取k1与k2中较小的值，确定删边数目k；

S700：重复步骤S600，直至删边数目达到k。

就该实施例而言，本方法通过移除最少数目的边资源不仅保证了网络基本功能不受影响，而且能对非法或有害网络信息的传播起到有效地延缓和阻挡效果，方案容易部署实施，成本开销比较低。

就本公开而言，发明人发现：在已有相关研究中，人们更多地研究了疾病、信息和舆论等的传播现象，但对于传播行为在社会网络上的研究甚少。现有很多研究都没有考虑非法或有害信息与行为传播的交互作用，没有把二者结合起来。事实上，信息与行为之间是相互联系、相互影响的。一方面，个体的行为会受到相关信息的影响，这种信息的累积作用就是一种社会强化效应；另一方面，个体的行为本身也会给周围的个体一种示范信息，从而影响他人产生跟随行为。

每个紧密的小团体内部的个体有可能平时都生活在相同或相似的圈子中，即他们对接触到的某一事件可能持有相似的观点。值得注意的是，在紧密团体结构的边缘，对同一事件持有不同的看法很难闯入到联系比较紧密的团体内部。人们倾向于与他们相近的人互动，而来自外部的传播行为想要闯入一个紧密的社会团体是很困难的。

节点个体倾向于拥有较多的邻居节点支持其行为，也就是说，节点个体在不能有效判断的情况下，会依据比例较高的邻居节点的行为来优化生成自身的决策。本实施例的基本思想是利用边介数特性优选删边进而优化网络中聚簇结构实现有效控制非法或有害网络信息的传播。

本方法通过优选删边，可以快速地优化网络中聚簇结构，提高非法或有害网络信息传播过程中所经过聚簇的簇密度。在网络中信息传播门槛值不变的情况下，随着不同聚簇之间连边的减少，聚簇密度逐渐增加，越来越多的节点个体会倾向选择与所属聚簇结构相同的行为，使得非法或有害网络信息很难从一个聚簇传播到另一个聚簇，进而延缓或阻挡非法或有害网络信息的传播。具体来看，本方法具有以下特点：

(1)逻辑意义的删边。本方法中删边是逻辑上的临时删边，不等同于物理意义上的删边。在实际网络系统中可能意味着在某个时间段内关闭网络链路或通过软件暂时关闭链路、也可能意味着绕道。例如在舆情传播的过程中逻辑删边意味着临时隔离或其他管制措施。

(2)有限数目的删边。本方法中有限删边的数目由网络基本功能和信息传播的门槛值共同决定。在保证网络基本功能不受影响的情况下，即网络基本连通的情况下统计得到删边数目k1；在信息传播门槛值q给定的情况下，通过删边观察网络中聚簇密度的变化，统计最大规模聚簇的簇密度，当其簇密度大于(1-q)时，确定删边数目k2。比较k1和k2的值，取二者之中较小的值。

(3)本方法是一种与初始传播源无关的传播控制方法，即无论初始参与者在哪一些节点上，本方法都能有效地控制非法或有害网络信息的传播。

在另一个实施例中，所述的非法或有害网络信息是非法或有害的舆情信息。

在另一个实施例中，所述S100步骤进一步包括：

所述社交网络为G(N，E)，其中N为社交网络中节点的集合，n＝|N|表示网络中节点个数；E为网络中边的集合，m＝|E|表示网络中边的个数，E中的每条边都有N中的一对节点与之对应，并且这种对应关系包含于网络的邻接矩阵A中；

所述初始化设置具体为：给定一个含有n个节点m条边的社交网络G(N，E)，用A(t)表示t时刻网络的邻接矩阵。

在另一个实施例中，所述S300步骤进一步包括：利用广度优先搜索算法BFS统计随着删边数目的增加，网络中最大连通子图规模的变化情况，在满足给定网络连通需求的情况下，统计删边数目k1。

就该实施例而言，鉴于网络结构决定网络功能，而网络的基本功能是与网络连通性密切相关的。在删边聚簇的过程中，为保证网络基本功能不受影响，本方法中用网络连通性来反映网络基本功能。

在另一个实施例中，所述S400步骤进一步包括：

在非法或有害网络信息传播门槛值q给定的情况下，通过删边观察网络中聚簇密度的变化，统计最大规模聚簇的聚簇密度，当其聚簇密度大于(1-q)时，确定删边数目k2。

就该实施例而言，有限删边数目与聚簇的聚簇密度和舆情传播门槛值有关。网络中的密集区域会对具有一定门槛值的舆情传播产生影响。也就是说舆情传播门槛值一定的情况下，剩余网络中密集区域的密集程度越高，即聚簇密度越大，越不容易形成舆情信息传播的级联。

删边和模型没有关系，删边和两个因素有关系：1在保证网络连通性的情况下删边介数大的边，找到删边数目会引起网络连通性改变的删边数目k1；2是每删边(删除边介数大的边)一次重新计算网络拓扑结构中的簇密度变化，直到找出满足网络中簇密度大于等于(1-q)的删边数目k2。在具体统计的过程中，为了降低时间复杂度，可近似的只统计所删除边的端节点所在的聚簇的簇密度变化。

结合前文所述，社会关系网络中往往具有簇(社团)结构，社团内部节点之间的连接相对较为紧密，各个社团之间的连接较为稀疏。社会学经典的理论“弱连接强度”指出，从网络角度看，关系密切的朋友往往组成紧密的小团体，弱连接(weaktie)对应这些团体之间的稀疏的联系，强连接(Strongtie)则对应于团体内部的紧密的联系。每一个紧密的小团体内部的个体很有可能平时都生活在相同或相似的圈子中，即他们对接触到的某一事件可能持有相似的观点。也正是因此，在社团结构内部，当节点个体周围足够多的邻居对某一事件采取某种行为时，该节点个体也可能倾向于对同一事件采取相同的行为。值得注意的是，在社团结构的边缘，对同一事件持有不同的看法却很难闯入到联系比较紧密的社团内部。人们倾向于与他们相近的人互动，而来自网外部的舆情信息想要闯入一个紧密的社会团体是很困难的。

将网络中节点之间联系比较紧密的区域，即密集连接区域，称为网络中的聚簇结构。在聚簇结构中，如果一个节点属于某聚簇，那么该节点的多数邻居节点也倾向于属于该聚簇。

我们称一个节点集为密度为ρ的聚簇，若其中每个节点至少有比例ρ的网络邻居也属于这个节点集合。聚簇中每个节点都有特定比例的邻居属于相同的聚簇，这意味着它们之间具有某种内部“凝聚力”。在任何一个连通的网络图中，所有节点的集合总是密度为1的聚簇，因为一个节点所有的网络邻居必然也在网络中。

如图2所示，由节点1、2、3、4和5所在的密集区域是密度为4/5的聚簇1，由节点6、7、8和9所在的密集区域是密度为2/3的聚簇2，10、11、12组成密度为1/2的聚簇3。根据聚簇密度的定义，在节点1、2、3、4、5，5个节点组成的聚簇1中，只有节点5与别的聚簇有连边，在节点5的直接邻居中，4个邻居都属于聚簇1，一个邻居属于聚簇2，即每个节点至少有4/5的网络邻居也在这个聚簇1中。所以聚簇1的密度是4/5。

网络中最高介数的边，一般意义下是承载所有节点对之间最短路径上流量之和最大的边，是连接不同聚簇结构之间的连边。如图2中，边介数最大的边是节点5与7的连边(5-7)。当选择边介数较大的边进行删除或管制时，意味着暂时切断了聚簇结构之间的连边，增大了聚簇密度。例如，在图2中删除边介数最大的两条边(5-7)和(9-10)之后，三个聚簇的密度分别变为1、0.66和0.66，其中，聚簇1的簇密度增加了0.2，聚簇3的簇密度增加了0.16。

给定一个网络图，引入初用节点集和剩余网络。考虑一个信息传播的行为，信息传播的源节点组成初用节点集，初用节点集是与具体的信息传播行为相关的；剩余网络表示除了初用节点以外的所有节点组成的部分。

考虑一个初用节点集，它们收到某舆情信息并选择传播该舆情的行为，即初用节点集表示初始舆情传播的参与者；其它所有节点有的还没有接收到舆情信息，有的接收到舆情信息但选择不参与舆情传播行为，即其它节点表示不参与者。随后，每个节点根据其邻居节点的选择行为来优化自己的决策。

在另一个实施例中，所述S600步骤中的逻辑的删除一条满足条件的边具体是指：在某个时间段内关闭网络链路或通过软件暂时关闭链路或另寻其他途径。

就该实施例而言，在舆情传播的过程中意味着临时隔离或其他管制措施。

在另一个实施例中，本方法是随机选取初始参与者的数目和位置。

就该实施例而言，随机选取节点作为初始参与者，对舆情传播控制具有普适性。

在另一个实施例中，所述非法或有害网络信息传播的门槛值越小，表示节点个体有比例较低的邻居节点参与的行为就能促使其也选择参与。

就该实施例而言，利用门槛值q(q∈(0，1))来刻画舆情传播行为的风险代价。舆情信息传播门槛值q越小，表示参与传播该舆情的风险代价就越小，即节点个体有比例较低的邻居节点参与的行为就能促使其也选择参与。所以可知，受关注度越高且门槛值越低的舆情，越容易在网络上传播。

弱连接对应网络图中不同簇之间的连边，一般也是图中边介数比较大的边。门槛值扩散模型揭示了弱连接的优势，那些我们不常见到的人，往往形成一个社会网络的捷径。他们提供一些信息来源，比如新的工作机会，这些信息我们通常没有机会通过其他的途径获取。以图2为例，(5，7)这条边连接不同的聚簇结构，得以相互传递消息。但考虑到不实舆情信息的传播，情况就非常不同了，参与传播舆情的行为不仅是接收到了舆情信息，还涉及到参与的行为，这种参与舆情传播的行为具有一定的风险，还可能造成一定的危害，带来负面社会影响。因此，节点个体接收到不实的、具有争议性的舆情信息，倾向于拥有较高的门槛值支持其行为，也就是会参考其比例较高的邻居节点的行为来优化自身的决策。

在图2中，假设节点6和7是初始舆情传播的参与者，剩余网络中节点5和10比它们所在聚簇中的其它节点拥有更丰富的信息，它们可以从节点7和9接收到舆情信息，但考虑到参与舆情传播的风险，它们会根据大多数邻居的行为进行决策，即倾向于它们所在聚簇的大多数邻居节点的行为。假设某舆情传播门槛值q＝0.4。我们可以检验初始舆情参与节点6和7所在聚簇2中所有节点都将参与舆情传播变为I态，但节点5和10不会参与舆情传播，因为节点5所在的聚簇1和节点10所在的聚簇3中的节点都没有参与舆情传播，所以舆情传播门槛值为0.4的舆情将不会传播到聚簇1和3中。

考虑一个行为A的初用节点集，剩余网络中的节点采用行为A的门槛值为q。如果剩余网络包含一个密度大于1-q的聚簇，则这个初用节点集不能产生一个完全级联。如果一个初用节点集不能产生一个完全级联，并且门槛值为q，则剩余网络中一定包含一个密度大于1-q的聚簇。

由此可知，网络中的密集区域会对具有一定门槛值的舆情传播产生影响。也就是说舆情传播门槛值一定的情况下，剩余网络中密集区域的密集程度越高，即聚簇的密度越大，越不容易形成舆情信息传播的级联。基于优选删边优化网络结构生成更多密度值更大的聚簇结构实现延缓或阻断舆情信息级联的实质。

在另一个实施例中，构建基于元胞自动机的网络舆情传播模型。基于SIS模型可以建模本公开中信息传播的演化过程。

元胞自动机(CellularAutomata，CA)是一种能够模拟具有内部相互作用的动力系统。通常一个CA主要由元胞空间C、有限状态集Q、元胞邻域V和元胞状态转换规则函数δ这四大元素组成，可以表示为CA＝(C，Q，V，δ)。

我们将运用元胞自动机对网络舆情的传播过程进行建模。对于一个有N个个体组成的社会网络，其中每个个体处于以下两种状态之一：不参与者(S)，即对舆情信息未知，或接收到舆情信息但选择不参与传播；参与者(I)，即表示接收到舆情信息并参与舆情传播。借鉴传染病研究中传统的易染-感染-易染(susceptible-infected-susceptible)的SIS模型，建立我们的基于元胞自动机的SIS舆情传播模型。

现有一些SIS传播模型中整个传播过程中信息传播率是恒定的而不符合实际的情况，在我们的SIS元胞自动机舆情传播模型中，节点个体是否参与舆情传播是与节点个体所处的位置以及节点个体的邻居节点倾向性有关的。考虑到信息传播具有社会强化效应，节点个体从一个邻居节点收到某舆情信息和从大多数的邻居节点都收到该舆情信息的情况是不一样的，不同情况会对节点个体行为决策造成不同的影响，节点个体会依赖自己邻居的行为进行决策。注意，在我们的SIS元胞自动机舆情传播模型中，不参与者节点A会受到其邻居中参与者的影响，A的邻居中的不参与者B也会受到其自身邻居中参与者的影响，这个过程实际上是一个连锁反应，我们称参与舆情信息传播的连锁反应为舆情信息级联。

本公开的SIS舆情传播模型有两种状态，不参与者(S)和参与者(I)。β是恢复率，表示由参与者(I)转变为不参与者(S)的概率，p表示不参与者的直接邻居中参与者个数占邻居总数的比率，q为舆情传播门槛值，用来刻画舆情传播行为的风险代价。不参与者与参与者之间的状态转换关系为：不参与者的邻居节点中参与者节点数占邻居节点总数的比例大于等于门槛值时，不参与者的状态会发生变化，由不参与者转换为参与者，否则保持不参与转态；参与者会以β的概率转换为不参与状态。

在社交网络中，节点和拓扑属性是基本的元素。社交网络中的每个用户是网络中的一个节点，节点之间的关系代表着用户之间的社交关系，也代表着用户间的影响关系。所以网络系统可表示为G＝(N，E)，其中，N为网络中节点的集合，n＝|N|表示网络中节点个数；E为网络中边的集合，m＝|E|表示网络中边的个数。E中的每条边都有N中的一对节点与之对应，并且这种对应关系包含于网络的邻接矩阵A中。网络中的每个节点都看作一个元胞，则n个节点的网络就可看作包含n个元胞的元胞自动机。根据元胞自动机的四要素可建立如下模型：

元胞邻域V：网络邻接矩阵A能够反映网络的拓扑结构，这里采用A表示元胞空间中各个元胞邻居之间的关系。因此，t时刻元胞i的邻居就可以表示为A(t)中第i行所有取值为1的元素集合，这里用a_ij＝1(a_ij∈A(t))表示元胞i和元胞j之间存在连接的边，并且a_ii＝a_jj＝0

有限状态集Q：在SIS模型中，节点对应元胞的状态分为不参与状态和参与状态，即参与者和不参与者，并分别用0和1表示，因此可得状态集Q＝{0，1}。

令s_i(t)(s_i(t)∈Q)来表示元胞i在t时刻的状态变量。

状态转换规则：

本模型中，在每一时刻t，如果不参与者周围参与者邻居比例大于等于门槛值，则不参与者转变为参与者，如果周围邻居参与者比例小于门槛值，则保持不参与状态；同时参与者也会以β的概率恢复为不参与者。参与者(I)和不参与者(S)之间的状态转换函数可以表示为：

其中，上横线表示取反操作，h表示参与者和不参与者之间的状态转换判断函数，表示如下：

其中，λ取(0，1)之间的随机数；β代表恢复率，表示从参与者转变为不参与者的概率。

p表示节点i的邻居中参与节点所占比例，可表示为：

m_i(t)表示t时刻节点i的邻居中参与节点的个数：

n_i(t)表示t时刻节点i的邻居的总个数：

设I(t)表示t时刻参与者所占比例，I(t)值越大表示舆情在网络中传播的规模越广泛。S(t)表示t时刻不参与者所占比例；显然，在任何时刻以下等式始终满足：

I(t)+S(t)＝1

因此，根据上述元胞自动机的组成要素，我们可以基于元胞自动机建立舆情传播的SIS模型。

为验证该基于删边聚簇的非法或有害网络信息传播控制方法(Clusteringwithlinksremoved，CLR)的有效性，在给定网络拓扑图和舆情传播门槛值的情况下，分析比较本方法和典型删边方法对非法或有害舆情传播控制的性能。选取了具有代表性的Zachary空手道俱乐部实际网络和Dolphin海豚社团网络模型为例进行仿真分析。Zachary空手道俱乐部网络是一个包含34个节点78条边的“基准”社会网络。Dolphin宽吻海豚是一个包含62个节点，159条边的定向社交网络。实验基于元胞自动机的SIS舆情传播模型，首先分析了舆情传播门槛值对舆情传播演化的影响，然后针对聚簇结构进行分析，揭示CLR方法控制舆情传播的实质，最后分析了CLR方法舆情传播控制的性能，并与其他典型方法进行对比，验证了CLR方法的有效性。在仿真实验中，每条曲线值都表示运行50个轮次以上的平均值。

在另一个实施例中，还包括：进行舆情传播门槛值分析。

引入门槛值q来刻画舆情传播行为的风险代价。舆情传播门槛值q越大，表示参与舆情传播的风险代价就越大。参与不实舆情传播具有一定的风险，因此个体倾向于拥有较多的邻居支持其行为，即节点个体会加入到有比例较高的邻居节点参与的行为。

在空手道俱乐部网络的仿真实验中，随机选择两个节点21和34作为舆情信息的传播源节点，给定舆情传播的一系列门槛值q为0.2，0.25，0.3，0.35，0.4，其中恢复率都为0.2。实验设置25个仿真时步，如图3所示，x轴表示时间的变化，y轴表示参与者节点占网络节点总数的比例。

由图3可以看出不同舆情传播门槛值对舆情传播有重大的影响。当舆情传播门槛值比较小时，q＝0.2，0.25和0.3时，在第10个时步之后就有80％以上节点个体参与到舆情传播，变为参与者状态I。但当舆情传播门槛值增大了一些，q＝0.35和0.4时，选择参与舆情传播的节点数目随着时间延迟增幅缓慢，特别是q＝0.4的曲线随着时步延迟只有小幅波动基本上是平的，表明在第5个时步以后就几乎没有节点个体再选择参与舆情传播。分析其原因可知：(1)当舆情传播门槛值较低时，只要有比例比较低的邻居节点参与了舆情传播，节点个体也就会由不参与者变为参与者。也就是说舆情传播门槛值越低，即参与舆情传播的风险代价越小，舆情信息就非常容易在网络中传播；(2)随着舆情传播门槛值的增加，节点个体会倾向参与有比例较高的邻居节点参与的行为。舆情传播门槛值越大，即参与舆情传播的风险代价越大，节点个体行为决策就越慎重，那些不实、有争议的舆情信息传播范围就非常有限。

在海豚社交网络中，随机选择两个节点6和58作为舆情信息的传播源节点，设置信息传播的门槛值q为0.2，0.25，0.3，0.35。

从图4中可以得到如图3所得的相关结论。总之，门槛值q刻画了舆情传播行为的风险代价，不同的舆情事件会对应不同的门槛值，不同的舆情传播门槛值对舆情传播有重大的影响。受到广泛关注并且传播门槛值低的舆情信息，其传播行为风险较低，越容易在网络中以较快的速度和较广的范围传播开来。反之，未经权威发布的、传播门槛值较高的舆情信息，其传播行为风险较高，越不容易在网络中大规模传播。

在另一个实施例中，还包括：进行舆情传播中簇密度变化分析。

在舆情传播门槛值一定的情况下，网络聚簇密度的提高会阻碍网络中舆情的传播。

如图5所示，Zachary空手道俱乐部的网络拓扑中初始状态下有2个聚簇，密度为0.4的聚簇1和密度为0.6的聚簇2。运用CLR方法基于边介数优选删边之后，使得聚簇结构更紧密，密度分别提升为0.8和0.75。

初始的Dolphin网络中有两个密度为0.6和0.5的聚簇，运用CLR方法之后聚簇1和聚簇2的簇密度都提升为0.75。

图5和图6描述了基于删边聚簇CLR方法前后网络结构的聚簇密度变化的情况，从而揭示了删边聚簇CLR方法可以快速提升全网范围内聚簇的簇密度。因为在舆情传播门槛值一定的情况下，剩余网络中聚簇的密度越大，越不容易形成舆情信息传播的级联。即随着网络中聚簇密度的提升，能够延缓或阻断具有一定门槛值的舆情传播，这也是CLR方法能够有效控制舆情传播的实质。

在另一个实施例中，进行对舆情传播影响的分析。

为进一步验证CLR方法的有效性，在给定网络拓扑图和有限删边约束的情况下，分析比较CLR方法和基于度删边方法对舆情传播控制的性能。其中，基于度删边方法的核心思想是：在给定网络初始矩阵A(t)，给每条边赋权W_ij，W_ij为一条边两端节点i和j度之积，将边权按由大到小排序；然后删除W_ij最大的那条边(需要注意的是：若W_ij值最大的边有多条，则随机选择一条边删除)；最后重复上述过程直至删边数目满足条件即可。

设置仿真参数，给定舆情传播门槛值q＝0.2，恢复率β＝0.2，在空手道俱乐部网络中随机选择两个传播源节点，设置25个仿真时步，实验结果取50次实验的平均值。进行对比的无删边策略表示在不进行任何干预的情况下，舆情传播信息基于SIS模型在初始网络图中演化的结果。

图7描述了在删边数目相同的情况下，Zachary网络在不同删边方法作用下网络中舆情传播参与者所占比例I(t)的变化趋势。图8描述了在删除相同数目边的情况下，Dolphin网络在不同删边方法作用下网络中舆情传播参与者所占比例I(t)的变化趋势。

从图7和图8中数据分析可知：(1)从网络中舆情传播参与者人数I(t)的变化趋势可看出，与无删边方案和基于度删边方法相比，CLR删边方法能够有效控制舆情传播的速度和规模；(2)不论是面向Zachary网络(如图7)，还是Dolphin网络(如图8)都可以看出，CLR方法能显著地控制舆情的传播速度和范围，验证了CLR方法的可行性和有效性。

尽管以上结合附图对本公开的实施方案进行了描述，但本公开并不局限于上述的具体实施方案和应用领域，上述的具体实施方案仅仅是示意性的、指导性的，而不是限制性的。本领域的普通技术人员在本说明书的启示下和在不脱离本公开权利要求所保护的范围的情况下，还可以做出很多种的形式，这些均属于本公开保护之列。

Claims

1.一种基于删边聚簇的非法或有害网络信息传播控制方法，包括如下步骤：

S100：建立社交网络，进行初始化设置；

S300：利用广度优先搜索算法BFS确定删边数目k1；

S400：通过聚簇密度变化和信息传播门槛值确定删边数目k2；

S500：取k1与k2中较小的值，确定删边数目k；

S700：重复步骤S600，直至删边数目达到k。

2.根据权利要求1所述的方法，所述S100步骤进一步包括：优选的，所述社交网络为G(N，E)，其中N为社交网络中节点的集合，n＝|N|表示网络中节点个数；E为网络中边的集合，m＝|E|表示网络中边的个数，E中的每条边都有N中的一对节点与之对应，并且这种对应关系包含于网络的邻接矩阵A中；

3.根据权利要求1所述的方法，所述S300步骤进一步包括：利用广度优先搜索算法BFS统计随着删边数目的增加，网络中最大连通子图规模的变化情况，在满足给定网络连通需求的情况下，统计删边数目k1。

4.根据权利要求1所述的方法，所述S400步骤进一步包括：

在网络中信息传播门槛值q给定的情况下，通过删边观察网络中聚簇密度的变化，统计最大规模聚簇的聚簇密度，当其聚簇密度大于(1-q)时，确定删边数目k2。

5.根据权利要求1所述的方法，所述S600步骤中的逻辑的删除一条满足条件的边具体是指：在某个时间段内关闭网络链路或通过软件暂时关闭链路或另寻其他途径。

6.根据权利要求1所述的方法，本方法是随机选取初始参与者的数目和位置。

7.根据权利要求1所述的方法，所述信息传播门槛值越小，表示节点个体有比例较低的邻居节点参与的行为就能促使其也选择参与。