CN107682200A - 一种基于有限观测的互联网传播源定位的方法 - Google Patents

一种基于有限观测的互联网传播源定位的方法 Download PDF

Info

Publication number
CN107682200A
CN107682200A CN201711017867.8A CN201711017867A CN107682200A CN 107682200 A CN107682200 A CN 107682200A CN 201711017867 A CN201711017867 A CN 201711017867A CN 107682200 A CN107682200 A CN 107682200A
Authority
CN
China
Prior art keywords
node
network
nodes
source
observer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711017867.8A
Other languages
English (en)
Inventor
张子柯
许帅帅
周银座
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Normal University
Original Assignee
Hangzhou Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Normal University filed Critical Hangzhou Normal University
Priority to CN201711017867.8A priority Critical patent/CN107682200A/zh
Publication of CN107682200A publication Critical patent/CN107682200A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

一种基于有限观测的互联网传播源定位的方法,包括:步骤1,网络构造模块;步骤2,选取传播源和观测节点,具体包括选取传播源和选取观测者节点;步骤3,进行疾病传播;步骤4,筛选候选传播源节点。本发明采用了网络拓扑和传播的时序信息的相关性来解决传播源的定位问题,给出了一个对于不同的网络结构上的疾病传播的溯源问题的统一的解决框架。对于控制疾病的扩散和负面信息传播,具有重要的指导意义。

Description

一种基于有限观测的互联网传播源定位的方法
技术领域
本发明是一种解决疾病在社会网络中或者信息在社交网络上传播的源定位的方法。
背景技术
当今世界疾病或者是信息在社会网络上的传播是非常普遍的,例如流行病的传播或者是信息的扩散。一般来说,这样的情况可以被建模为一个在社会网络上的类流行病的谣言传播模型。因此一个人在网络上发布一段信息或者是谣言可以在相对较短的时间里面传播给大量的人。在一些地方,发布谣言是违法的,执法机构需要采取行动来确定谣言的来源,如果传播源是匿名的话,这就需要花费大量的时间和精力来追溯,并且通常这是很困难的。
理解和控制疾病在网络中的传播是当今一项非常重要的科学任务。这一目标的实现在减轻传染病引起的流行病,遏制计算机病毒的传播,控制网络谣言的扩散等方面有着非常重要的应用价值。利用网络拓扑特性和感染节点的观测信息来识别谣言或者是病毒的来源是一项非常值得去做而又有挑战性的工作。根除疾病或者是谣言的源头有重大的现实意义,并且可以使我们进一步的理解网络结构在信息级联中的放大作用。
传播的随机性使得对于传播源的定位在本质上是困难的。事实上,不同的初始条件可以在观测时间内产生相同的结果。通过某种估计鉴于所有观测到的网络中的信息,来定位传播源除非在非常特殊的网络结构下,通常都是很棘手的。尤其是在观测的信息十分有限的情况下。而这又正是在进行传播源的定位时所有面临的问题。例如,当我们想要定位一个垃圾邮件的发送者,我们不可能监测到网络中所有的节点的状态。所以在已知信息极少并且不同的网络拓扑下都可以应用并且有不错的结果的估算法是很必要的。
现有的溯源仅有理论方法,没有实用技术,需要收集和观测大量的关于疾病的传播过程的信息,没有有效的利用网络的拓扑结构和疾病或者谣言在网络上传播的时序信息。
发明内容
本发明要克服现有技术的缺点,提供一种基于有限观测的互联网传播源定位的方法。
本发明利用网络的拓扑结构和疾病传播的时序信息的相关性,提供了一种传播源定位的方法,在技术上实现了对疾病传播源或者谣言的发布者的定位问题,解决了现有方法时效性弱、计算效率低下等问题。丰富了对于疾病传播过程的认识和理解。
一种基于有限观测的互联网传播源定位的方法,包括如下步骤:
步骤1,网络构造模块;
利用经典的网络模型构造算法生成指定大小的全连通网络,包括BA无标度网络或者ER随机网络。在构造ER随机网络的过程中,要在传统的构造算法基础上通过额外的检测算法来确保网络的全连通性。
步骤2,选取传播源和观测节点;
21.选取传播源;
当全连通的网络构造完成之后,在网络中随机选择一个节点作为疾病的传播源或者谣言的发布者;
22.选取观测者节点;
通过引入复杂网络中刻画节点重要性的指标度中心性来作为选取观测节点的依据。在构造网络之后,通过计算可以得到网络中的每一个节点的度中心性,即该节点的邻居节点的个数。该溯源方法将度中心性最大的一定数量的节点,通常不会超过总节点数量的十分之一,选做观测节点;
步骤3,进行疾病传播;
使用经典的疾病传播模型SI在上述构造的网络中进行疾病的传播,在初始时刻t0,网络中只有一个节点处于被感染的状态,该节点就是上述选择的传播源节点。在传播的过程中,针对每一个观测者节点记录两方面的信息:1,该观测者节点被感染的时刻;2,该观测者节点被哪一个邻居节点感染。
步骤4,筛选候选传播源节点;
网络中的节点被感染的时间与该节点到传播源的距离之间存在正相关关系。另外传播源节点和观测者节点之间的最短路径长度在很大的概率上大于传播源和传染给该观测者的邻居节点之间的最短路径长度。对于网络中的任一个非观测节点,如果该节点到超过一半的观测节点的距离大于等于到传染给该观测节点的邻居节点的距离,那么将这一节点称为候选的传播源节点。
对于每一个属于候选传播源集合C的节点s’,该节点距离所有的观测者节点的最短路径长度构成一个向量Ds’={ds’1,ds’2,…,ds’On},如前所述其中On表示观测者的个数;所有的观测者的感染时间可以表示为一个向量T={t1,t2,…,tOn}。然后使用Pearson相关性计算每一个候选传播源节点对应的向量Dc和向量T的相关性,相关性最大的节点为本方法给出的疾病的传播源或者是谣言的发布者。其中Pearson相关性的计算公式如下:
其中表示点s′到所有的观测者的平均距离,表示所有观测者的平均感染时间。
本发明的有益效果是:本发明采用了网络拓扑和传播的时序信息的相关性来解决传播源的定位问题,给出了一个对于不同的网络结构上的疾病传播的溯源问题的统一的解决框架。对于控制疾病的扩散和负面信息传播,具有重要的指导意义。
附图说明
图1是使用无标度网络构造算法或者随机网络构造算法所生成的一个全连通的网络。
图2是在网络中选择传播源节点和观测者节点的示意图,在该图中将2号节点选择为传播源节点,将4号和6号节点选择为观测者节点。之后使用经典的疾病传播模型SI在网络中进行疾病传播,在疾病的传播过程中,每一个观测者节点记录两个信息:1,什么时刻被感染,2,被哪一个邻居节点感染。从图中与观测者相连的边的箭头方向可以看出,观测者节点4被节点5感染,观测者节点6被节点7感染。
图3是使用三角形标出了所有的非观测者节点,这些节点分别是1,2,3,5,7和8。接下来则通过计算这些节点是否满足到超过一半的观测者节点的距离都大于到相应的观测者的感染来源节点的距离来筛选候选传播源节点。例如对于非观测者节点7来说,该节点到两个观测者节点4和6的距离分别为d74和d76,到这两个观测者的感染来源的节点5和7的距离分别为d75和d77,通过比较可以得到d74>d75,d76>d77,即节点7满足了到超过一半的观测者节点的距离都大于到相应的观测者的感染来源节点的距离,所以节点7被选择为感染来源节点。
图4是在经过了筛选候选传播源节点之后所形成的图,其中候选传播源节点包括3,5,7和8。节点1和节点2变为灰色,表明节点1和节点2不满足称为候选传播源节点的条件。并且针对每一个候选的传播源节点,在图中标示了该节点到所有传播源节点的距离组成的向量。例如对于候选传播源节点7来说,这个向量表示为D7={d74,d76}。
图5是针对候选传播源节点计算该节点到所有观测者的距离向量和所有观测者的感染时间向量的相关性结果的示例图。通过这一步骤得到每一个候选传播源的r值,该值对应于该节点作为疾病传播源的可能性。
具体实施方式
下面结合附图,进一步说明本发明的技术方案。
一种基于有限观测的互联网传播源定位的方法,包括如下步骤:
步骤1,网络构造模块;
利用经典的网络模型构造算法生成指定大小的全连通网络,包括BA无标度网络或者ER随机网络。在构造ER随机网络的过程中,要在传统的构造算法基础上通过额外的检测算法来确保网络的全连通性。构造的网络如图1所示。
步骤2,选取传播源和观测节点;
21.选取传播源;
当全连通的网络构造完成之后,在网络中随机选择一个节点作为疾病的传播源或者谣言的发布者。如图2中将2号节点选取为源节点。
22.选取观测者节点;
通过引入复杂网络中刻画节点重要性的指标度中心性来作为选取观测节点的依据。在构造网络之后,通过计算可以得到网络中的每一个节点的度中心性,即该节点的邻居节点的个数。该溯源方法将度中心性最大的一定数量的节点,通常不会超过总节点数量的十分之一,选做观测节点。如图2中将节点4和节点6选取为观测者节点。这里使用On表示观测者的个数。
步骤3,进行疾病传播;
使用经典的疾病传播模型SI在上述构造的网络中进行疾病的传播,在初始时刻t0,网络中只有一个节点处于被感染的状态,该节点就是上述选择的传播源节点。在传播的过程中,针对每一个观测者节点记录两方面的信息:1,该观测者节点被感染的时刻;2,该观测者节点被哪一个邻居节点感染。所以当传播结束之后,可以得到关于两个观测者的信息是:观测者4和观测者6的感染时间;观测者4的感染来源是节点5,观测者6的感染来源是节点7。
步骤4,筛选候选传播源节点;
通过我们的分析得到,网络中的节点被感染的时间与该节点到传播源的距离之间存在正相关关系。另外传播源节点和观测者节点之间的最短路径长度在很大的概率上大于传播源和传染给该观测者的邻居节点之间的最短路径长度。对于网络中的任一个非观测节点,如果该节点到超过一半的观测节点的距离大于等于到传染给该观测节点的邻居节点的距离,那么我们将这一节点称为候选的传播源节点。
如图3,非观测者节点分别为1,2,3,5,7和8,接下来从这些非观测者节点中挑选候选传播源,例如针对非观测者节点7来说,利用上述提到的条件来判断其是否为候选的传播源,对于第一个观测者节点4:节点7到该观测者节点4的距离d74大于到该观测者的感染来源节点的距离d75;另外对于第二个观测节点,节点7到该观测节点的距离d76大于d77。所以根据对候选传播源的筛选条件,针对节点7来说就是:如果节点7到两个观测者节点4和6满足到其中的任意一个观测节点的距离大于到这一个观测节点的感染来源节点的距离的话,那么该节点7就被筛选为候选传播源节点。对其他的非观测者节点给出相同的判别过程,对于节点1:d15>d14,d17>d16,节点1不满足候选传播源节点的要求;对于节点2:d25>d24,d27=d26,节点2不满足候选传播源节点的要求;对于节点3:d35>d34,d37<d36,节点3满足候选传播源节点的要求;对于节点5:d55<d54,d57<d56,节点5满足候选传播源节点的要求;对于节点8:d85<d84,d87>d86,节点8满足候选传播源节点的要求;所以经过判断之后,得出候选观测者集合C={3,5,7,8},如图4所示。
对于每一个属于候选传播源集合C的节点s’,该节点距离所有的观测者节点的最短路径长度构成一个向量Ds’={ds’1,ds’2,…,ds’On},如图4中所示,如前所述其中On表示观测者的个数;所有的观测者的感染时间可以表示为一个向量T={t1,t2,…,tOn}。然后使用Pearson相关性计算每一个候选传播源节点对应的向量Dc和向量T的相关性,如图5所示,相关性最大的节点为本方法给出的疾病的传播源或者是谣言的发布者。其中Pearson相关性的计算公式如下:
其中表示点s′到所有的观测者的平均距离,表示所有观测者的平均感染时间。
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。

Claims (1)

1.一种基于有限观测的互联网传播源定位的方法,包括如下步骤:
步骤1,网络构造模块;
利用经典的网络模型构造算法生成指定大小的全连通网络,包括BA无标度网络或者ER随机网络;在构造ER随机网络的过程中,要在传统的构造算法基础上通过额外的检测算法来确保网络的全连通性;
步骤2,选取传播源和观测节点;
21.选取传播源;
当全连通的网络构造完成之后,在网络中随机选择一个节点作为疾病的传播源或者谣言的发布者;
22.选取观测者节点;
通过引入复杂网络中刻画节点重要性的指标度中心性来作为选取观测节点的依据;在构造网络之后,通过计算可以得到网络中的每一个节点的度中心性,即该节点的邻居节点的个数;该溯源方法将度中心性最大的一定数量的节点,通常不会超过总节点数量的十分之一,选做观测节点;
步骤3,进行疾病传播;
使用经典的疾病传播模型SI在上述构造的网络中进行疾病的传播,在初始时刻t0,网络中只有一个节点处于被感染的状态,该节点就是上述选择的传播源节点;在传播的过程中,针对每一个观测者节点记录两方面的信息:1,该观测者节点被感染的时刻;2,该观测者节点被哪一个邻居节点感染;
步骤4,筛选候选传播源节点;
网络中的节点被感染的时间与该节点到传播源的距离之间存在正相关关系;另外传播源节点和观测者节点之间的最短路径长度在很大的概率上大于传播源和传染给该观测者的邻居节点之间的最短路径长度;对于网络中的任一个非观测节点,如果该节点到超过一半的观测节点的距离大于等于到传染给该观测节点的邻居节点的距离,那么将这一节点称为候选的传播源节点;
对于每一个属于候选传播源集合C的节点s’,该节点距离所有的观测者节点的最短路径长度构成一个向量Ds’={ds’1,ds’2,…,ds’On},其中On表示观测者的个数;所有的观测者的感染时间可以表示为一个向量T={t1,t2,…,tOn};然后使用Pearson相关性计算每一个候选传播源节点对应的向量Dc和向量T的相关性,相关性最大的节点为本方法给出的疾病的传播源或者是谣言的发布者;其中Pearson相关性的计算公式如下:
<mrow> <msub> <mi>r</mi> <msup> <mi>s</mi> <mo>&amp;prime;</mo> </msup> </msub> <mo>=</mo> <mfrac> <mrow> <msubsup> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>O</mi> <mi>n</mi> </msub> </msubsup> <mrow> <mo>(</mo> <msub> <mi>d</mi> <mrow> <msup> <mi>is</mi> <mo>&amp;prime;</mo> </msup> </mrow> </msub> <mo>-</mo> <mover> <mi>d</mi> <mo>&amp;OverBar;</mo> </mover> <mo>)</mo> </mrow> <mrow> <mo>(</mo> <msub> <mi>t</mi> <mi>i</mi> </msub> <mo>-</mo> <mover> <mi>t</mi> <mo>&amp;OverBar;</mo> </mover> <mo>)</mo> </mrow> </mrow> <msqrt> <mrow> <msubsup> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>O</mi> <mi>n</mi> </msub> </msubsup> <msup> <mrow> <mo>(</mo> <msub> <mi>d</mi> <mrow> <msup> <mi>is</mi> <mo>&amp;prime;</mo> </msup> </mrow> </msub> <mo>-</mo> <mover> <mi>d</mi> <mo>&amp;OverBar;</mo> </mover> <mo>)</mo> </mrow> <mn>2</mn> </msup> <msubsup> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>O</mi> <mi>n</mi> </msub> </msubsup> <msup> <mrow> <mo>(</mo> <msub> <mi>t</mi> <mi>i</mi> </msub> <mo>-</mo> <mover> <mi>t</mi> <mo>&amp;OverBar;</mo> </mover> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> </mfrac> <mo>,</mo> </mrow>
其中表示点s′到所有的观测者的平均距离,表示所有观测者的平均感染时间。
CN201711017867.8A 2017-10-26 2017-10-26 一种基于有限观测的互联网传播源定位的方法 Pending CN107682200A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711017867.8A CN107682200A (zh) 2017-10-26 2017-10-26 一种基于有限观测的互联网传播源定位的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711017867.8A CN107682200A (zh) 2017-10-26 2017-10-26 一种基于有限观测的互联网传播源定位的方法

Publications (1)

Publication Number Publication Date
CN107682200A true CN107682200A (zh) 2018-02-09

Family

ID=61142529

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711017867.8A Pending CN107682200A (zh) 2017-10-26 2017-10-26 一种基于有限观测的互联网传播源定位的方法

Country Status (1)

Country Link
CN (1) CN107682200A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109065179A (zh) * 2018-08-22 2018-12-21 昆明理工大学 一种疾病传染过程的空时动态模拟方法
CN109120431A (zh) * 2018-07-12 2019-01-01 深圳大学 复杂网络中传播源选择的方法、装置及终端设备
CN110445654A (zh) * 2019-08-12 2019-11-12 中国矿业大学 一种基于社区划分的社交网络多源谣言溯源方法及系统
CN113553541A (zh) * 2021-06-04 2021-10-26 扬州大学 一种独立级联模型下基于独立路径分析的源定位方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105528407A (zh) * 2015-12-04 2016-04-27 杭州师范大学 一种获取l个具有最佳传播影响力用户的方法和装置
CN105574191A (zh) * 2015-12-26 2016-05-11 中国人民解放军信息工程大学 在线社会网络多源点信息溯源系统及其方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105528407A (zh) * 2015-12-04 2016-04-27 杭州师范大学 一种获取l个具有最佳传播影响力用户的方法和装置
CN105574191A (zh) * 2015-12-26 2016-05-11 中国人民解放军信息工程大学 在线社会网络多源点信息溯源系统及其方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
XUEQI CHENG ET AL.: "《Social Media Processing: 6th National Conference, SMP 2017, Beijing, China, September 14-17,2017, Proceedings》", 24 October 2017 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109120431A (zh) * 2018-07-12 2019-01-01 深圳大学 复杂网络中传播源选择的方法、装置及终端设备
CN109120431B (zh) * 2018-07-12 2021-11-16 深圳大学 复杂网络中传播源选择的方法、装置及终端设备
CN109065179A (zh) * 2018-08-22 2018-12-21 昆明理工大学 一种疾病传染过程的空时动态模拟方法
CN109065179B (zh) * 2018-08-22 2021-10-22 昆明理工大学 一种疾病传染过程的空时动态模拟方法
CN110445654A (zh) * 2019-08-12 2019-11-12 中国矿业大学 一种基于社区划分的社交网络多源谣言溯源方法及系统
CN110445654B (zh) * 2019-08-12 2020-09-04 中国矿业大学 一种基于社区划分的社交网络多源谣言溯源方法及系统
CN113553541A (zh) * 2021-06-04 2021-10-26 扬州大学 一种独立级联模型下基于独立路径分析的源定位方法
CN113553541B (zh) * 2021-06-04 2023-10-13 扬州大学 一种独立级联模型下基于独立路径分析的源定位方法

Similar Documents

Publication Publication Date Title
CN107682200A (zh) 一种基于有限观测的互联网传播源定位的方法
Wen et al. A sword with two edges: Propagation studies on both positive and negative information in online social networks
Shang Subgraph robustness of complex networks under attacks
Zhao et al. Multiple routes transmitted epidemics on multiplex networks
Husein et al. Modeling the transmission of infectious disease in a dynamic network
Kivelä et al. Multiscale analysis of spreading in a large communication network
Feng et al. Influence maximization with novelty decay in social networks
CN106991617B (zh) 一种基于信息传播的微博社交关系提取算法
Redmond et al. Temporal subgraph isomorphism
Lu et al. The impact of information dissemination strategies to epidemic spreading on complex networks
Allard et al. The Role of Directionality, Heterogeneity, and Correlations in Epidemic Risk and Spread
Tan et al. Optimal detection of influential spreaders in online social networks
Chen et al. Influence blocking maximization on networks: Models, methods and applications
Gajewski et al. Multiple propagation paths enhance locating the source of diffusion in complex networks
Zhang et al. Link transmission centrality in large-scale social networks
Dong et al. RETRACTED: Flow online identification method for the encrypted Skype
Zareie et al. Centrality measures in fuzzy social networks
Malladi et al. Decentralized aggregation design and study of federated learning
CN117395043A (zh) 跨域攻击路径的评估方法、装置、设备及存储介质
Król On modelling social propagation phenomenon
Yuan et al. On modeling the crowding and psychological effects in network-virus prevalence with nonlinear epidemic model
Feng et al. Recovering information recipients in social media via provenance
Chen et al. Identifying the superspreader in proactive backward contact tracing by deep learning
Lev et al. State-based targeted vaccination
Meng et al. A study of rumor spreading with epidemic model based on network topology

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180209

RJ01 Rejection of invention patent application after publication