CN105574191B - 在线社会网络多源点信息溯源系统及其方法 - Google Patents

在线社会网络多源点信息溯源系统及其方法 Download PDF

Info

Publication number
CN105574191B
CN105574191B CN201510988067.5A CN201510988067A CN105574191B CN 105574191 B CN105574191 B CN 105574191B CN 201510988067 A CN201510988067 A CN 201510988067A CN 105574191 B CN105574191 B CN 105574191B
Authority
CN
China
Prior art keywords
node
source point
information
observation
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510988067.5A
Other languages
English (en)
Other versions
CN105574191A (zh
Inventor
赵宇
程晓涛
王晓雷
刘彩霞
冯莉
王领伟
刘宗海
杨梅樾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PLA Information Engineering University
Original Assignee
PLA Information Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PLA Information Engineering University filed Critical PLA Information Engineering University
Priority to CN201510988067.5A priority Critical patent/CN105574191B/zh
Publication of CN105574191A publication Critical patent/CN105574191A/zh
Application granted granted Critical
Publication of CN105574191B publication Critical patent/CN105574191B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种在线社会网络多源点信息溯源系统及其方法,其方法为,通过在网络中布置部分观察节点,获取网络中消息传播的范围及接受消息的时刻,首先将多次接收信息的观察节点的时间性和空间性映射到网络结构中,初步确定源点范围,并通过重启式随机游走算法确定源点备选集与时延备选集;再次利用备选集中源点与单次观察节点在空间和时间上的相近性,将定位问题转化为聚类问题,设计基于近邻传播学习的聚类算法,找到最优的代表点集合,确定源点的数量与位置。本发明充分利用节点接收消息的时间维信息,在无需获知网络中全部用户节点状态信息的条件下,较为准确地确定传播源点的数量和位置,有效控制有害信息传播,维护社会和谐稳定。

Description

在线社会网络多源点信息溯源系统及其方法
技术领域
本发明涉及网络安全领域,特别涉及一种在线社会网络多源点信息溯源系统及其方法。
背景技术
随着各种新兴媒体的广泛应用,信息流动模式和服务模式也发生了重大变化,网民均可借助第三方应用平台生产信息、部署软件、提供服务,这使得信息源急剧增大,信息发布方式多样,互联网上任何一个人都有可能是信息的发送者和接收者,社会事件在网络中随着不同的意识形态、社会思潮逐步演化并不断发酵、扩散,形成一个又一个热点问题。尤其是针对网络中的不良信息传播者,如何有效实现信息溯源,对于实现网络舆情监管,及时了解网络舆情的发展动向具有重要意义,并将为从源头上实现网络舆情治理提供有力指导。
现有的信息溯源研究已经取得了部分进展。但是,仍存在以下局限和不足:一、目前的溯源方法多以网络快照为研究背景,而且大多数研究方法需要获取全部感染节点的状态,在线社会网网络中实时获知全部节点的状态难以实现;二、在静态快照为前提的背景下不具备节点获取信息的时间信息,无法利用时间维度信息来提高追溯源点的准确性,而在线社会网络中观察节点通常可以确定节点获取信息的时刻;三、针对多点溯源问题,现有方法通常都有限制条件,在确定源点数量的条件下确定源点的位置,目前还没有对未知源点数量条件下的溯源方法。在线社会网络中并不容易实时的获取所有节点的状态,因此,目前的大多数静态方法并不适用于在线社会网络中确定信息传播源点。
发明内容
针对现有技术中的不足,本发明提供一种在线社会网络多源点信息溯源系统及其方法,在解决不确定信息源点数量情况下,在网络中布置部分观察节点来代替获取全部节点状态的方式,获取消息是由哪些邻居节点接收的以及接收到消息的时刻来完成信息溯源,充分利用时间维度来提高确定信息源点的准确性。
按照本发明所提供的设计方案,一种在线社会网络多源点信息溯源系统,包含原始数据采集模块、备选集选取模块、基于近邻传播的聚类模块、协同反馈模块,
原始数据采集模块,构建在线社会网络结构并在网络中布置观察节点,对观察节点接收到的节点信息进行量化表示;
备选集选取模块,根据接收时间、节点信息与网络结构的映射关系,缩小信息源点范围,采用重启式随机游走算法确定备选源点集和时延备选集;
基于近邻传播的聚类模块,利用单次接收的观察节点和备选源点集在空间和时间上的相近性确定信息源点的位置和数量,通过设计基于近邻传播的聚类算法,对观察节点与备选源点集中节点进行聚类,一个聚类中心的代表点为一个可能的信息源点;
协同反馈模块,对基于近邻传播的聚类结果进行检测,并判断检测结果是否达到预定标准,若达到预定标准,则结束执行,否则,根据检测结果生成备选集调节命令,分别发送给备选集选定模块和基于近邻传播的聚类模块,备选集选定模块和基于近邻传播的聚类模块根据备选集调节命令调节备选源点集和每跳时延备选集范围。
上述的,基于近邻传播的聚类算法:计算观察节点和备选源点集的相似度,构造相似度矩阵,这里的相似度不是基于欧几里得空间,而是基于空间跳数与传播时间的比例关系;对近邻传播的对象有所限制,因为观察节点不可能成为信息源点,而且同一紧密时间块的备选节点集中只可能确定一个信息源点。
上述的,协同反馈模块对基于近邻传播的聚类结果进行检测,并判断检测结果是否达到预定标准,具体是指:协同反馈模块执行基于近邻传播的聚类算法,完成迭代循环,判断迭代过程中迭代次数是否达到规定数值或迭代过程中改变的信息量是否小于设定阈值,迭代过程中改变的信息量小于设定阈值即指近邻传播迭代过程中所有观察节点的归属不再变化,。
一种在线社会网络多源点信息溯源方法,包含如下步骤:
步骤1.构建在线社会网络结构,并在网络结构中布置多个观察节点,对观察节点接收到的信息进行量化;
步骤2.根据观察节点中多次接收信息的节点,将信息的传播方向信息与传播时间信息映射到网络结构中,确定备选源点集和时延备选集;
步骤3.确定观察节点中单次接收信息的观察节点;
步骤4.计算单次接收信息的观察节点和备选源点集的相似度,构造相似度矩阵,确定信息源点数量及位置,并确定信息源点的传播与影响范围,执行基于近邻传播的聚类算法;
步骤5.对基于近邻传播的聚类结果进行迭代,当迭代次数达到规定数值或迭代过程中改变的信息量小于设定阈值时,迭代过程中改变的信息量小于设定阈值即指近邻传播迭代过程中所有观察节点的归属不再变化,则进入步骤7,否则,生成备选源点集调节指令,进入下一步骤;
步骤6.根据备选源点集调节指令,调节备选源点集的范围,将观察节点的邻居节点作为备选源点集,返回步骤4;
步骤7.确定全部信息源点的数量与位置,结束执行过程。
优选的,所述步骤2具体包含如下步骤:
步骤2.1假设步骤1中布置k个观察节点,并定义观察节点集合为每个观察节点的节点信息用表示,其中,oi表示k个观察节点中第i个观察节点;vi,j表示观察节点i从邻居节点j接收到了信息,ti,j记录了接收信息的时刻,m为接收到信息的次数,将多次接收信息的观察节点的方向信息与时间信息映射到网络结构中,定义时刻集合Tcpt={ti,ti+1,...,ti+k}中,如果k≥2且ti+k-ti≤2u,其中,u为每一跳时延的方差,那么时刻集合Tcpt定义为紧密时间块,对应的邻居节点为紧密时间块节点集Vcpt={vi,vi+1,...,vi+k},定义节点prn,pth是紧密时间块节点集Vcpt={vi,vi+1,...,vi+k}的共同前趋,n代表观察节点拥有相同前趋的邻居节点个数;pth表示共同前趋到紧密时间块节点的路径的跳数;
步骤2.2根据网络结构特征,根据观察节点为信息源点的概率,针对任意紧密时间块节点集Vcpt={vi,vi+1,...,vi+k},假设prn,pth的路径路数都相同,Pr={prn,pth}则为共同前趋集合,共同前趋集合的类型用|Pr|来表示,p(prn,pth)表示共同前趋prn,pth成为信息源点的概率的大小,如果|Pr1|≤|Pr2|,那么max(p(O=Pr1))≥max(p(O=Pr2)),初步确定信息源点的范围和位置;
步骤2.3根据网络结构与观察节点接收信息关系,通过紧密时间块得到信息源点的方向、数量和与距离,根据首达时间点与紧密时间块的关系获取观察节点与信息源点之间的最短距离,缩小备选源点集范围,确定每跳时延的均值和方差,缩小备选源点集范围,确定每跳时延的均值和方差;采用重启式随机游走算法确定备选源点集和时延备选集,以观察节点的邻居节点为出发源点,根据驻留时间和共同节点情况,确定信息源点和每跳时延。
上述的,步骤2.3中根据首达时间点与紧密时间块的关系获取观察节点与信息源 点之间的最短距离具体指:多次接收信息的观察节点中,在接收时间轴上,根据首达时间与 紧密时间块的关系,分为三种情况:情况1:多次接收到信息的观察节点时间轴上,t1为观察 节点接收到信息的首达时间,Tcpt是该观察节点的首个紧密时间块,并且满足观察 对应的网络结构,Pr是Tcpt的共同前趋集,PTHo,pr是观察节点到共同前趋的路径集合,如果并且满足公式(1)则利用该前趋节点进一步确定每 一跳时延备选集,在紧密时间块前到达观察节点的信息存在由共同前趋通过最短路径传播 的可能,或由另外一个跳数较少的信息源点传播,通过判断共同前趋到观察节点是否存在 比通过紧密时间块的邻居到达观察节点路径更短的路径,即通过是否满足公式(1)来判断, 将满足公式(1)的共同前趋pr纳入时延确定备选集VTpre中,在备选源点集中确定每一跳的 时延,若共同前趋到源点的最短路径与通过紧密时间块的节点到达源点的路径比和首达时 间与紧密时间块平均值相近,则选取最相近的共同前趋来确定每一跳时延,该共同前趋选 取需要满足式(2)利用共同前趋来计 算出每一跳的时延,纳入时延备选集Tpre中;情况2:当首达时间t1∈Tcpt1时,即紧密时间块的 第一个节点为首达节点,首达节点同紧密时间块内的其它节点共同体现信息源点的方向特 征,对应到网络结构图中,该邻居节点在共同前趋节点与观察节点之间的最短路径上,需要 联合其它节点,联合与紧密时间块最近的节点vk,观察节点接收该节点的时刻为tk,考 查时间轴与网络结构的对应关系,如果满足式(3)则该共 同前趋通过紧密时间块到达源点为最短距离,将该共同前趋pr纳入时延备选集 VTpre中,在备选节点集中确定每一跳的时延;同理,满足式(4)的共同前趋纳入到时延备选集Tpre中; 情况3:针对时间轴上如果对应在网络结构中不满足情况1中的公式(1),则判定观 察节点接收到的信息来源于多个信息源点,无法确定路径与到达时间的比例关系,无法确 定源点和每一跳的时延。
上述的,所述步骤4具体包含如下内容:计算单次观察节点和备选源点集的相似性度量,构造相似度矩阵,观察节点的节点信息观察节点与备选源点集的相似度公式表示为:每一跳的时延服从正态分布,由备选源点集确定均值为μ,均方差为σ,相似度的范围为[0,-∞)。
上述的,步骤5中对基于近邻传播的聚类结果进行迭代具体是指:根据迭代公式完成迭代 循环,当迭代次数达到规定数值或迭代过程中改变的信息量小于设定阈值,迭代完成,计算的备选源点,其中,λ为阻尼因子,0<λ<1,i代表观察节点,k代表备 选源点。
上述的,步骤6具体指:在达到一定的迭代次数时,对于部分节点满足min(s(i,k))>ε的情况,说明这些节点不在已经归类的信息源点范围内,ε代表观察节点与信息源点的一个相似度阈值,具体值根据信息溯源的过程确定;需要通过将单次观察节点的邻居信息节点作为备选源点集,返回步骤4执行,直至找到所有观察节点的信息源点。
本发明的有益效果:
本发明在在线社会网络中不确定源点数量情况下完成信息溯源,以记录部分观察节点状态方式代替获取全部感染节点状态,解决现有技术中在线社会网络中实时获知全部节点状态也难以实现的情况;相较于以往采用网络快照的方式,本发明充分利用时间维度来提高确定信息源点的准确性,提供了一种在未知源点数量条件下的信息溯源,有效实现信息溯源,及时对网络舆情进行监管,便于及时了解网络舆情的发展动向,从信息源头上为实现网络舆情治理提供有力指导。
附图说明:
图1为本发明的在线社会网络多源点信息溯源系统示意图;
图2为本发明的在线社会网络多源点信息溯源方法流程示意图;
图3为本发明的信息溯源场景示意图;
图4为本发明的观察节点接收时间分布与网络结构映射示意图;
图5为本发明的采用重启式随机游走算法流程示意图。
具体实施方式:
下面结合附图和技术方案对本发明作进一步详细的说明,并通过优选的实施例详细说明本发明的实施方式,但本发明的实施方式并不限于此。
实施例一,参见图1所示,一种在线社会网络多源点信息溯源系统,包含原始数据采集模块、备选集选取模块、基于近邻传播的聚类模块、协同反馈模块,
原始数据采集模块,构建在线社会网络结构并在网络中布置观察节点,对观察节点接收到的节点信息进行量化表示;
备选集选取模块,根据接收时间、节点信息与网络结构的映射关系,缩小信息源点范围,采用重启式随机游走算法确定备选源点集和时延备选集;
基于近邻传播的聚类模块,利用单次接收的观察节点和备选源点集在空间和时间上的相近性确定信息源点的位置和数量,通过设计基于近邻传播的聚类算法,对观察节点与备选源点集中节点进行聚类,一个聚类中心的代表点为一个可能的信息源点;
协同反馈模块,对近邻传播学习模型进行检测,并判断检测结果是否达到预定标准,若达到预定标准,则结束执行,否则,根据检测结果生成备选集调节命令,分别发送给备选集选定模块和基于近邻传播的聚类模块,备选集选定模块和基于近邻传播的聚类模块根据备选集调节命令调节备选源点集和每跳时延备选集范围。
实施例二,与实施例一基本相同,不同之处在于:基于近邻传播的聚类算法,首先计算观察节点和备选源点集的相似度,构造相似度矩阵,这里的相似度不是基于欧几里得空间,而是基于空间跳数与传播时间的比例关系;其次对近邻传播的对象有所限制,因为观察节点不可能成为信息源点,而且同一紧密时间块的备选节点集中只可能确定一个信息源点。
协同反馈模块对基于近邻传播的聚类结果进行检测,并判断检测结果是否达到预定标准,具体是指:协同反馈模块执行近邻传播聚类算法,完成迭代循环,判断迭代过程中迭代次数是否达到规定数值或迭代过程中改变的信息量是否小于设定阈值,迭代过程中改变的信息量小于设定阈值即指近邻传播迭代过程中所有观察节点的归属不再变化。
实施例三,参见图2~4所示,一种在线社会网络多源点信息溯源方法,包含如下步骤:
步骤1.构建在线社会网络结构,并在网络结构中布置多个观察节点,对观察节点接收到的信息进行量化;
步骤2.根据观察节点中多次接收信息的节点,将信息的传播方向信息与传播时间信息映射到网络结构中,确定备选源点集和时延备选集;
步骤3.确定观察节点中单次接收信息的观察节点;
步骤4.计算单次接收信息的观察节点和备选源点集的相似度,相似度为基于空间跳数与传播时间的比例关系,构造相似度矩阵,确定信息源点数量及位置,并确定信息源点的传播与影响范围,执行基于近邻传播的聚类算法;
步骤5.对基于近邻传播的聚类结果进行迭代,当迭代次数达到规定数值或迭代过程中改变的信息量小于设定阈值时,迭代过程中改变的信息量小于设定阈值即指近邻传播迭代过程中所有观察节点的归属不再变化,则进入步骤7,否则,生成备选源点集调节指令,进入下一步骤;
步骤6.根据备选源点集调节指令,调节备选源点集的范围,将观察节点的邻居节点作为备选源点集,返回步骤4;
步骤7.确定全部信息源点的数量与位置,结束执行过程。
实施例四,参见图2~5所示,一种在线社会网络多源点信息溯源方法,包含如下步骤:
步骤1.构建在线社会网络结构,并在网络结构中布置多个观察节点,对观察节点接收到的信息进行量化,假设布置k个观察节点,并定义观察节点集合为每个观察节点的节点信息用表示,其中,oi表示k个观察节点中第i个观察节点;vi,j表示观察节点i从邻居节点j接收到了信息,ti,j记录了接收信息的时刻,m为接收到信息的次数;
步骤2.根据观察节点中多次接收信息的节点,将信息的传播方向信息与传播时间信息映射到网络结构中,确定备选源点集和时延备选集,具体包含如下步骤:
步骤2.1将多次接收信息的观察节点的方向信息与时间信息映射到网络结构中,定义时刻集合Tcpt={ti,ti+1,...,ti+k}中,如果k≥2且ti+k-ti≤2u,其中,u为每一跳时延的方差,那么时刻集合Tcpt定义为紧密时间块,对应的邻居节点为紧密时间块节点集Vcpt={vi,vi+1,...,vi+k},定义节点prn,pth是紧密时间块节点集Vcpt={vi,vi+1,...,vi+k}的共同前趋,n代表观察节点拥有相同前趋的邻居节点个数;pth表示共同前趋到紧密时间块节点的路径的跳数;
步骤2.2根据网络结构特征,根据观察节点为信息源点的概率,针对任意紧密时间块节点集Vcpt={vi,vi+1,...,vi+k},假设prn,pth的路径路数都相同,Pr={prn,pth}则为共同前趋集合,共同前趋集合的类型用|Pr|来表示,p(prn,pth)表示共同前趋prn,pth成为信息源点的概率的大小,如果|Pr1|≤|Pr2|,那么max(p(O=Pr1))≥max(p(O=Pr2)),初步确定信息源点的范围和位置;
步骤2.3根据网络结构与观察节点接收信息关系,通过紧密时间块得到信息源点 的方向、数量和与距离,根据首达时间点与紧密时间块的关系获取观察节点与信息源点之 间的最短距离,缩小备选源点集范围,确定每跳时延的均值和方差,缩小备选源点集范围, 确定每跳时延的均值和方差;采用重启式随机游走算法确定备选源点集和时延备选集,以 观察节点的邻居节点为出发源点,根据驻留时间和共同节点情况,确定信息源点和每跳时 延,根据首达时间点与紧密时间块的关系获取观察节点与信息源点之间的最短距离具体 指:多次接收信息的观察节点中,在接收时间轴上,根据首达时间与紧密时间块的关系,分 为三种情况:情况1:多次接收到信息的观察节点时间轴上,t1为观察节点接收到信息的首 达时间,Tcpt是该观察节点的首个紧密时间块,并且满足观察对应的网络结构,Pr是 Tcpt的共同前趋集,PTHo,pr是观察节点到共同前趋的路径集合,如果并且满足公 式(1)则利用该前趋节点进一步确定每一跳时延备选集,在紧 密时间块前到达观察节点的信息存在由共同前趋通过最短路径传播的可能,或由另外一个 跳数较少的信息源点传播,通过判断共同前趋到观察节点是否存在比通过紧密时间块的邻 居到达观察节点路径更短的路径,即通过是否满足公式(1)来判断,将满足公式(1)的共同 前趋pr纳入时延确定备选集VTpre中,在备选源点集中确定每一跳的时延,若共同前趋到源 点的最短路径与通过紧密时间块的节点到达源点的路径比和首达时间与紧密时间块平均 值相近,则选取最相近的共同前趋来确定每一跳时延,该共同前趋选取需要满足式(2)利用共同前趋来计算出每一跳的时 延,纳入时延备选集Tpre中;情况2:当首达时间t1∈Tcpt1时,即紧密时间块的第一个节点为首 达节点,首达节点同紧密时间块内的其它节点共同体现信息源点的方向特征,对应到网络 结构图中,该邻居节点在共同前趋节点与观察节点之间的最短路径上,需要联合其它节点, 联合与紧密时间块最近的节点vk,观察节点接收该节点的时刻为tk,考查时间轴与网络结构 的对应关系,如果满足式(3)则该共同前趋通过紧密时间块到 达源点为最短距离,将该共同前趋pr纳入时延备选集VTpre中,在备选节点集中确定每一跳 的时延;同理,满足式(4)的共同前趋 纳入到时延备选集Tpre中;情况3:针对时间轴上如果对应在网络结构中不满足情况 1中的公式(1),则判定观察节点接收到的信息来源于多个信息源点,无法确定路径与到达 时间的比例关系,无法确定源点和每一跳的时延;
步骤3.确定观察节点中单次接收信息的观察节点;
步骤4.计算单次接收信息的观察节点和备选源点集的相似度,相似度为基于空间跳数与传播时间的比例关系,构造相似度矩阵,确定信息源点数量及位置,并确定信息源点的传播与影响范围,执行基于近邻传播的聚类算法,具体包含如下内容:计算单次观察节点和备选源点集的相似性度量,构造相似度矩阵,观察节点的节点信息观察节点与备选源点集的相似度公式表示为:每一跳的时延服从正态分布,由备选源点集确定均值为μ,均方差为σ,相似度的范围为[0,-∞),相似度最大为0,表示在此溯源过程中,信息源点满足时延与跳数的关系,备选源点在后续的迭代过程中一定为该观察节点的信息源点;-∞表示该信息源点与观察节点之间不存在路径,该备选源点一定不是该观察节点的信息源点;另外,观察节点不可能成为信息源点,将观察节点之间的相近度设置为负无穷大;同一紧密时间块的共同前趋不可能都成为源点,因此同一前趋的备选节点之间的相似度设置负无穷大;
步骤5.对基于近邻传播的聚类结果进行迭代,当迭代次数达到规定数值或迭代过 程中改变的信息量小于设定阈值时,迭代过程中改变的信息量小于设定阈值即指近邻传播 迭代过程中所有观察节点的归属不再变化,则进入步骤7,否则,生成备选源 点集调节指令,进入下一步骤,具体迭代过程为:根据迭代公式完成迭代 循环,当迭代次数达到规定数值或迭代过程中改变的信息量小于设定阈值,迭代过程中改 变的信息量小于设定阈值即指近邻传播迭代过程中所有观察节点的归属不再变化,迭代完 成,计算的备选源点,其中,λ为阻尼因子,0<λ<1,i代表观察节 点,k代表备选源点;
步骤6.根据备选源点集调节指令,调节备选源点集的范围,将观察节点的邻居节点作为备选源点集,因为在达到一定的迭代次数时,对于部分节点满足min(s(i,k))>ε的情况,可能为信息源点的离群点,ε代表观察节点与信息源点的一个相似度阈值,具体值根据信息溯源的过程确定;需要通过将单次观察节点的邻居信息节点作为备选源点集,返回步骤4执行,直至找到所有观察节点的信息源点;
步骤7.确定全部信息源点的数量与位置,结束执行过程。
本发明并不局限于上述具体实施方式,本领域技术人员还可据此做出多种变化,但任何与本发明等同或者类似的变化都应涵盖在本发明权利要求的范围内。

Claims (8)

1.一种在线社会网络多源点信息溯源系统,其特征在于:包含原始数据采集模块、备选集选取模块、基于近邻传播的聚类模块、协同反馈模块,
原始数据采集模块,构建在线社会网络结构并在网络中布置观察节点,对观察节点接收到的节点信息进行量化表示;
备选集选取模块,根据接收时间、节点信息与网络结构的映射关系,缩小信息源点范围,采用重启式随机游走算法确定备选源点集和时延备选集;
基于近邻传播的聚类模块,利用单次接收的观察节点和备选源点集在空间和时间上的相近性确定信息源点的位置和数量,通过设计基于近邻传播的聚类算法,对观察节点与备选源点集中节点进行聚类,一个聚类中心的代表点为一个可能的信息源点;
协同反馈模块,对基于近邻传播的聚类结果进行检测,并判断检测结果是否达到预定标准,若达到预定标准,则结束执行,否则,根据检测结果生成备选集调节命令,分别发送给备选集选定模块和基于近邻传播的聚类模块,备选集选定模块和基于近邻传播的聚类模块根据备选集调节命令调节备选源点集和每跳时延备选集范围;判断检查结果是否达到预定标准具体是指:协同反馈模块执行基于近邻传播的聚类算法,完成迭代循环,判断迭代过程中迭代次数是否达到规定数值或迭代过程中改变的信息量是否小于设定阈值,迭代过程中改变的信息量小于设定阈值即指近邻传播迭代过程中所有观察节点的归属不再变化。
2.根据权利要求1所述的在线社会网络多源点信息溯源系统,其特征在于:基于近邻传播的聚类算法,首先计算观察节点和备选源点集的相似度,相似度为基于空间跳数与传播时间的比例关系,构造相似度矩阵。
3.一种在线社会网络多源点信息溯源方法,其特征在于:包含如下步骤:
步骤1.构建在线社会网络结构,并在网络结构中布置多个观察节点,对观察节点接收到的信息进行量化;
步骤2.根据观察节点中多次接收信息的节点,将信息的传播方向信息与传播时间信息映射到网络结构中,确定备选源点集和时延备选集;
步骤3.确定观察节点中单次接收信息的观察节点;
步骤4.计算单次接收信息的观察节点和备选源点集的相似度,相似度为基于空间跳数与传播时间的比例关系,构造相似度矩阵,确定信息源点数量及位置,并确定信息源点的传播与影响范围,执行基于近邻传播的聚类算法;
步骤5.对基于近邻传播的聚类结果进行迭代,当迭代次数达到规定数值或迭代过程中改变的信息量小于设定阈值时,迭代过程中改变的信息量小于设定阈值即指近邻传播迭代过程中所有观察节点的归属不再变化,则进入步骤7,否则,生成备选源点集调节指令,进入下一步骤;
步骤6.根据备选源点集调节指令,调节备选源点集的范围,将观察节点的邻居节点作为备选源点集,返回步骤4;
步骤7.确定全部信息源点的数量与位置,结束执行过程。
4.根据权利要求3中所述的在线社会网络多源点信息溯源方法,其特征在于:所述步骤2具体包含如下步骤:
步骤2.1假设步骤1中布置k个观察节点,并定义观察节点集合为每个观察节点的节点信息用表示,其中,oi表示k个观察节点中第i个观察节点;vi,j表示观察节点i从邻居节点j接收到了信息,ti,j记录了接收信息的时刻,m为接收到信息的次数,将多次接收信息的观察节点的方向信息与时间信息映射到网络结构中,定义时刻集合Tcpt={ti,ti+1,...,ti+k}中,如果k≥2且ti+k-ti≤2u,其中,u为每一跳时延的方差,那么时刻集合Tcpt定义为紧密时间块,对应的邻居节点为紧密时间块节点集Vcpt={vi,vi+1,...,vi+k},定义节点prn,pth是紧密时间块节点集Vcpt={vi,vi+1,...,vi+k}的共同前趋,n代表观察节点拥有相同前趋的邻居节点个数;pth表示共同前趋到紧密时间块节点的路径的跳数;
步骤2.2根据网络结构特征,根据观察节点为信息源点的概率,针对任意紧密时间块节点集Vcpt={vi,vi+1,...,vi+k},设定prn,pth的路径路数都相同,Pr={prn,pth}则为共同前趋集合,共同前趋集合的类型用|Pr|来表示,p(prn,pth)表示共同前趋prn,pth成为信息源点的概率的大小,如果两种共同前趋集合Pr1、Pr2的类型|Pr1|、|Pr2|满足|Pr1|≤|Pr2|,那么max(p(O=Pr1))≥max(p(O=Pr2)),初步确定信息源点的范围和位置;
步骤2.3根据网络结构与观察节点接收信息关系,通过紧密时间块得到信息源点的方向、数量和与距离,根据首达时间点与紧密时间块的关系获取观察节点与信息源点之间的最短距离,缩小备选源点集范围,确定每跳时延的均值和方差,缩小备选源点集范围,确定每跳时延的均值和方差;采用重启式随机游走算法确定备选源点集和时延备选集,以观察节点的邻居节点为出发源点,根据驻留时间和共同节点情况,确定信息源点和每跳时延。
5.根据权利要求4所述的在线社会网络多源点信息溯源方法,其特征在于:步骤2.3中根据首达时间点与紧密时间块的关系获取观察节点与信息源点之间的最短距离具体指:多次接收信息的观察节点中,在接收时间轴上,根据首达时间与紧密时间块的关系,分为三种情况:情况1:多次接收到信息的观察节点时间轴上,t1为观察节点接收到信息的首达时间,Tcpt1是该观察节点的首个紧密时间块,并且满足观察对应的网络结构,Pr是Tcpt的共同前趋集,ptho,pr是观察节点到共同前趋的路径集合,如果并且满足公式(1)min|ptho,pr|<min|pthvi,pr|+1,则利用前趋节点进一步确定每一跳时延备选集,在紧密时间块前到达观察节点的信息由共同前趋通过最短路径传播,或由另外一个跳数较少的信息源点传播,通过判断共同前趋到观察节点是否存在比通过紧密时间块的邻居到达观察节点路径更短的路径,即通过是否满足公式(1)来判断,将满足公式(1)的共同前趋pr纳入时延确定备选集VTpre中,在备选源点集中确定每一跳的时延,若共同前趋到源点的最短路径与通过紧密时间块的节点到达源点的路径比和首达时间与紧密时间块平均值趋于等值,则选取最相近的共同前趋来确定每一跳时延,该共同前趋选取需要满足式(2)利用共同前趋来计算出每一跳的时延,纳入时延备选集Tpre中;情况2:当首达时间t1∈Tcpt1时,即紧密时间块的第一个节点为首达节点,首达节点同紧密时间块内的其它节点共同体现信息源点的方向特征,对应到网络结构图中,邻居节点在共同前趋节点与观察节点之间的最短路径上,联合其它节点,联合与紧密时间块最近的节点vk,观察节点接收该节点的时刻为tk,考查时间轴与网络结构的对应关系,如果满足式(3)则共同前趋通过紧密时间块到达源点为最短距离,将共同前趋pr纳入时延备选集VTpre中,在备选节点集中确定每一跳的时延;同理,满足式(4)的共同前趋纳入到时延备选集Tpre中;情况3:针对时间轴上如果对应在网络结构中不满足情况1中的公式(1),则判定观察节点接收到的信息来源于多个信息源点,无法确定路径与到达时间的比例关系,无法确定源点和每一跳的时延。
6.根据权利要求4所述的在线社会网络多源点信息溯源方法,其特征在于:所述步骤4具体包含如下内容:计算单次观察节点和备选源点集的相似性度量,构造相似度矩阵,观察节点的节点信息观察节点与备选源点集的相似度公式表示为:由备选源点集确定均方差为σ,相似度的范围为[0,-∞)。
7.根据权利要求6所述的在线社会网络多源点信息溯源方法,其特征在于:步骤5中对基于近邻传播的聚类结果进行迭代具体是指:根据迭代公式
完成迭代循环,当迭代次数达到规定数值或迭代过程中改变的信息量小于设定阈值,迭代过程中改变的信息量小于设定阈值即指近邻传播迭代过程中所有观察节点的归属不再变化,迭代完成,计算的备选源点,其中,λ为阻尼因子,0<λ<1,i代表观察节点,k代表备选源点。
8.根据权利要求7所述的在线社会网络多源点信息溯源方法,其特征在于:步骤6具体指:在达到一定的迭代次数时,对于部分节点满足min(s(i,k))>ε的情况,说明这些节点不在已经归类的信息源点范围内,为信息源点的离群点,ε代表观察节点与信息源点的一个相似度阈值,具体值根据信息溯源的过程确定;需要通过将单次观察节点的邻居信息节点作为备选源点集,返回步骤4执行,直至找到所有观察节点的信息源点。
CN201510988067.5A 2015-12-26 2015-12-26 在线社会网络多源点信息溯源系统及其方法 Active CN105574191B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510988067.5A CN105574191B (zh) 2015-12-26 2015-12-26 在线社会网络多源点信息溯源系统及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510988067.5A CN105574191B (zh) 2015-12-26 2015-12-26 在线社会网络多源点信息溯源系统及其方法

Publications (2)

Publication Number Publication Date
CN105574191A CN105574191A (zh) 2016-05-11
CN105574191B true CN105574191B (zh) 2018-10-23

Family

ID=55884322

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510988067.5A Active CN105574191B (zh) 2015-12-26 2015-12-26 在线社会网络多源点信息溯源系统及其方法

Country Status (1)

Country Link
CN (1) CN105574191B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106355091B (zh) * 2016-08-26 2019-01-29 西南大学 基于生物智能的传播源定位方法
CN106484680A (zh) * 2016-10-21 2017-03-08 天津海量信息技术股份有限公司 一种资讯传播过程的内容溯源的计算方法
CN108021582B (zh) * 2016-11-04 2020-12-04 中国移动通信集团湖南有限公司 互联网舆情监控方法及装置
CN106557985B (zh) * 2016-11-21 2020-03-24 云南大学 一种基于随机游走的社交网络信息传播源求解方法
CN106789333B (zh) * 2017-01-16 2019-08-23 东北大学 一种基于时间分层的复杂网络传播源点定位方法
CN106888159B (zh) * 2017-02-28 2020-08-11 东南大学 群组间消息传播路径挖掘方法与系统
CN107038593B (zh) * 2017-04-06 2020-07-21 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种基于防伪溯源系统的异常数据处理方法及系统
CN107682200A (zh) * 2017-10-26 2018-02-09 杭州师范大学 一种基于有限观测的互联网传播源定位的方法
CN109522464A (zh) * 2018-10-22 2019-03-26 西南石油大学 信息源检测方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103412872A (zh) * 2013-07-08 2013-11-27 西安交通大学 一种基于有限节点驱动的微博社会网络信息推荐方法
CN103902557A (zh) * 2012-12-26 2014-07-02 中国移动通信集团贵州有限公司 一种色情信息源的定位方法和系统
CN104199884A (zh) * 2014-08-19 2014-12-10 东北大学 一种基于r覆盖率优先的社交网络观察点选取方法
CN104850549A (zh) * 2014-02-13 2015-08-19 夷希数码科技(上海)有限公司 一种网络舆情的监控方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103902557A (zh) * 2012-12-26 2014-07-02 中国移动通信集团贵州有限公司 一种色情信息源的定位方法和系统
CN103412872A (zh) * 2013-07-08 2013-11-27 西安交通大学 一种基于有限节点驱动的微博社会网络信息推荐方法
CN104850549A (zh) * 2014-02-13 2015-08-19 夷希数码科技(上海)有限公司 一种网络舆情的监控方法
CN104199884A (zh) * 2014-08-19 2014-12-10 东北大学 一种基于r覆盖率优先的社交网络观察点选取方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Locating the Source of Diffusion in Large-Scale Networks;Pedro C. Pinto等;《PHYSICAL REVIEW LETTERS》;20120810;第068702-1至068702-5页 *
微博信息传播网络的结构属性分析;王晓明等;《中文信息学报》;20140630;第28卷(第3期);第55-60页 *
面向社交网络信息源定位的观察点部署方法;张聿博等;《软件学报》;20141231;第25卷(第12期);第2837-2851页 *

Also Published As

Publication number Publication date
CN105574191A (zh) 2016-05-11

Similar Documents

Publication Publication Date Title
CN105574191B (zh) 在线社会网络多源点信息溯源系统及其方法
CN110610242A (zh) 一种联邦学习中参与者权重的设置方法及装置
CN109005055B (zh) 基于多尺度拓扑空间的复杂网络信息节点重要度评价方法
CN110311902A (zh) 一种异常行为的识别方法、装置及电子设备
CN113780436B (zh) 一种基于综合度的复杂网络关键节点识别方法
CN111222029B (zh) 一种网络舆情信息传播中关键节点选择方法
Baccelli et al. Pairwise stochastic bounded confidence opinion dynamics: Heavy tails and stability
CN109948066B (zh) 一种基于异构信息网络的兴趣点推荐方法
CN105843829B (zh) 一种基于分层模型的大数据可信性度量方法
CN105893637A (zh) 大规模微博异构信息网络中的链接预测方法
CN103326904A (zh) 一种基于多参数认知的快速网络拓扑推断方法
Chen et al. Opinion dynamics of social-similarity-based Hegselmann–Krause model
CN109242250A (zh) 一种基于模糊熵权法与云模型的用户行为可信度检测方法
CN110247805A (zh) 一种基于k壳分解的识别传播关键节点的方法及装置
CN110084423A (zh) 一种基于局部相似性的链路预测方法
Yilmaz et al. Misinformation propagation in online social networks: game theoretic and reinforcement learning approaches
JP7106997B2 (ja) データ分析システムおよびデータ分析方法
CN111210357A (zh) 基于社交网络信息交互的用户影响力获取方法
CN116484113A (zh) 一种基于动态信任感知的群体观点预测方法及系统
CN114401192B (zh) 一种多sdn控制器协同训练方法
CN113780656B (zh) 基于聚类解耦的复杂产品多源变更传播影响力预测方法
CN114529096A (zh) 基于三元闭包图嵌入的社交网络链路预测方法及系统
Xiang Topological analysis, endogenous mechanisms, and supply risk propagation in the polycrystalline silicon trade dependency network
CN107018027A (zh) 一种基于贝叶斯估计和共同邻居节点度的链路预测方法
CN107332687A (zh) 一种基于贝叶斯估计和共同邻居的链路预测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant