CN112037078B - 一种对异构网络异质结点上谣言传播情况预测方法和系统 - Google Patents

一种对异构网络异质结点上谣言传播情况预测方法和系统 Download PDF

Info

Publication number
CN112037078B
CN112037078B CN202010474678.9A CN202010474678A CN112037078B CN 112037078 B CN112037078 B CN 112037078B CN 202010474678 A CN202010474678 A CN 202010474678A CN 112037078 B CN112037078 B CN 112037078B
Authority
CN
China
Prior art keywords
account
state
social
accounts
adjacent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010474678.9A
Other languages
English (en)
Other versions
CN112037078A (zh
Inventor
林旺群
金松昌
林彬
王伟
尹桂信
李妍
田成平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin (binhai) Intelligence Military-Civil Integration Innovation Center
Evaluation Argument Research Center Academy Of Military Sciences Pla China
National Defense Technology Innovation Institute PLA Academy of Military Science
Original Assignee
Tianjin (binhai) Intelligence Military-Civil Integration Innovation Center
Evaluation Argument Research Center Academy Of Military Sciences Pla China
National Defense Technology Innovation Institute PLA Academy of Military Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin (binhai) Intelligence Military-Civil Integration Innovation Center, Evaluation Argument Research Center Academy Of Military Sciences Pla China, National Defense Technology Innovation Institute PLA Academy of Military Science filed Critical Tianjin (binhai) Intelligence Military-Civil Integration Innovation Center
Priority to CN202010474678.9A priority Critical patent/CN112037078B/zh
Publication of CN112037078A publication Critical patent/CN112037078A/zh
Application granted granted Critical
Publication of CN112037078B publication Critical patent/CN112037078B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Abstract

本发明提供了一种对异构网络异质结点上谣言传播情况预测方法和系统,包括:获取多个社交网络拓扑结构、社交网络上账号与现实社会成员的映射关系以及各账号的状态;计算各现实社会成员在不同社交网络间的转发概率;基于多个社交网络拓扑结构、社交网络上账号与现实社会成员的映射关系、各账号的状态以及各现实社会成员在不同社交网络间的转发概率,预测表征谣言传播情况的各种状态的账号的变化量。本申请考虑了谣言在多个异构网络间传播的情况,相比于当前存在的谣言预测方法,本申请考虑更全面,更能反映谣言的真实传播规律,进而得出更贴近实际的结论,具有更强的指导意义和实践价值。

Description

一种对异构网络异质结点上谣言传播情况预测方法和系统
技术领域
本发明属于谣言传播预测技术领域,具体涉及一种对异构网络异质结点上谣言传播情况预测方法和系统。
背景技术
随着各类社交网络的蓬勃发展,通过社交平台分享消息日益成为人们重要的交流途径。由于通过社交网络平台发布消息具有传播速度快、地域限制小、用户门槛低、消耗成本少等特点,网络水军借助社交网络发布谣言、发起人身攻击、挑起内部矛盾、煽动仇恨等行为层出不穷,对社会危害巨大,已引起高度重视。根据社交网络的具体特点建立合适的谣言传播模型,有利于分析谣言传播路径和规律,从而能够有针对性的采取措施,具有及其重要社会意义。
当前网络谣言传播模型主要集中为两类:第一类是基于流行病传播的谣言传播模型。这类模型将流行病传播模型(如:SIS、SIR、SEIR等)应用迁移到谣言传播建模当中,将谣言在人际关系网络中的传播过程类比于病毒的扩散传播过程。这类模型存在的主要问题是没有考虑谣言传播过程中节点的异质性,比如社交网络中具有众多好友(粉丝)的“权威节点”发布谣言的传播力度远比只有少数几个好友(粉丝)的“孤独节点”发布谣言的危害要大得多。第二类是基于复杂网络的谣言传播模型。这类模型虽然也有少数成果考虑不同节点的异质性对谣言传播的影响,但没有考虑谣言在社交网络中的传播具有“异构网络”传播特点。因此如果网络谣言建模过程只考虑谣言在单个网络中的传播,将会对谣言的传播力度预估存在严重不足甚至不准确。
发明内容
为克服上述现有技术的不足,本发明提出一种对异构网络异质结点上谣言传播情况预测方法,其改进之处在于,包括:
获取多个社交网络拓扑结构、社交网络上账号与现实社会成员的映射关系以及各账号的状态;
计算各现实社会成员在不同社交网络间的转发概率;
基于多个社交网络拓扑结构、社交网络上账号与现实社会成员的映射关系、各账号的状态以及各现实社会成员在不同社交网络间的转发概率,预测表征谣言传播情况的各种状态的账号的变化量;
所述状态包括:未接触谣言或辟谣信息的未知状态、接触过谣言或辟谣信息但并不转发的沉默状态、转发谣言的传谣状态和针对谣言进行辟谣的辟谣状态。
优选的,所述基于多个社交网络拓扑结构、社交网络上账号与现实社会成员的映射关系、各账号的状态以及各现实社会成员在不同社交网络间的转发概率,预测表征谣言传播情况的各种状态的账号的变化量,包括:
基于多个社交网络拓扑结构,分别获取各社交网络上各账号的具有社交关系的相邻账号的状态,并根据相邻账号的状态分别计算各状态的账号被相邻账号影响发生变化的第一变化量;
基于账号与现实社会成员的映射关系,分别获取各现实社会成员在不同社交网络上账号的状态,并根据同一现实社会成员在其他社交网络上账号的状态和现实社会成员在不同社交网络间的转发概率分别计算各状态的账号被同一现实社会成员在其他社交网络上账号影响发生变化的第二变化量;
对所述第一变化量和第二变化量求和,得到表征谣言传播情况的各种状态的账号的变化量。
优选的,所述未知状态的账号的变化量的计算式如下:
Figure GDA0002881835570000021
式中,ΔU表示未知状态的账号的变化量;
i、j和x标记不同社交网络,k标记社交网络上的账号,y标记现实社会成员;
K表示社交网络总个数;uk表示处于未知状态的账号k;Ui(t)表示t时刻社交网络i上所有的处于未知状态的账号;
Figure GDA0002881835570000022
表示t时刻社交网络i上账号k的相邻账号中处于传谣状态的账号占所有相邻账号的比重;di(k)表示社交网络i上账号k的相邻账号总数;
Figure GDA0002881835570000023
表示t时刻社交网络i上账号k的相邻账号中处于辟谣状态的账号占所有相邻账号的比重;vj(k)表示社交网络j上的账号k,vx(k)表示社交网络x上的账号k;V(y)表示对应账号k的现实社会成员y在所有社交网络中的账号;B(t)表示t时刻所有社交网络中所有处于传谣状态的账号,R(t)表示t时刻所有社交网络中所有处于辟谣状态的账号;TPji(y,t-1)表示t-1时刻对应账号k的现实社会成员y在社交网络i和j上用相应账号转发同一消息的概率,TPxi(y,t-1)表示t-1时刻对应账号k的现实社会成员y在社交网络i和x上用相应账号转发同一消息的概率;α表示未知状态的账号与传谣状态的相邻账号接触后转变为传谣状态的概率,β表示未知状态的账号与传谣状态的相邻账号接触后转变为沉默状态的概率,γ表示未知状态的账号与传谣状态的相邻账号接触后转变为辟谣状态的概率;σ表示未知状态的账号与辟谣状态的相邻账号接触后转变为传谣状态的概率,δ表示未知状态的账号与辟谣状态的相邻账号接触后转变为沉默状态的概率,τ表示未知状态的账号与辟谣状态的相邻账号接触后转变为辟谣状态的概率。
优选的,所述传谣状态的账号的变化量的计算式如下:
Figure GDA0002881835570000031
式中,Δ|B|表示传谣状态的账号的变化量;
i和j标记社交网络,k和o标记社交网络上的账号,y标记现实社会成员;
K表示社交网络总个数;vi(k)表示社交网络i上的账号k,vj(k)社交网络j上的账号k;Ui(t)表示t时刻社交网络i上所有的处于未知状态的账号;
Figure GDA0002881835570000032
表示t时刻社交网络i上账号k的相邻账号中处于传谣状态的账号占所有相邻账号的比重;di(k)表示社交网络i上账号k的相邻账号总数;
Figure GDA0002881835570000033
表示t时刻社交网络i上账号k的相邻账号中处于辟谣状态的账号占所有相邻账号的比重;V(y)表示对应账号k的现实社会成员y在所有社交网络中的账号;B(t)表示t时刻所有社交网络中所有处于传谣状态的账号;TPji(y)表示对应账号k的现实社会成员y在社交网络i和j上用相应账号转发同一消息的概率;b(o)表示传谣状态的账号o;Bi(t)表示t时刻社交网络i中所有处于传谣状态的账号;
Figure GDA0002881835570000034
表示t时刻社交网络i上账号o的相邻账号中处于传谣状态的账号占所有相邻账号的比重;di(o)表示社交网络i上账号o的相邻账号总数;
Figure GDA0002881835570000035
表示t时刻社交网络i上账号o的相邻账号中处于辟谣状态的账号占所有相邻账号的比重;α表示未知状态的账号与传谣状态的相邻账号接触后转变为传谣状态的概率;σ表示未知状态的账号与辟谣状态的相邻账号接触后转变为传谣状态的概率;
Figure GDA0002881835570000036
表示传谣状态的账号与传谣状态的相邻账号接触后转变为沉默状态的概率,η表示传谣状态的账号与辟谣状态的相邻账号接触后转变为沉默状态的概率。
优选的,所述辟谣状态的账号的变化量的计算式如下:
Figure GDA0002881835570000041
式中,Δ|R|表示辟谣状态的账号的变化量;
i和j标记社交网络,k标记社交网络上的账号,y标记现实社会成员;
K表示社交网络总个数;ui(k)表示社交网络i上处于未知状态的账号k;U(t)表示t时刻所有社交网络中处于未知状态的账号;
Figure GDA0002881835570000042
表示t时刻社交网络i上账号k的相邻账号中处于传谣状态的账号占所有相邻账号的比重;di(k)表示社交网络i上账号k的相邻账号总数;
Figure GDA0002881835570000043
表示t时刻社交网络i上账号k的相邻账号中处于辟谣状态的账号占所有相邻账号的比重;vj(k)表示社交网络j上的账号k;V(y)表示对应账号k的现实社会成员y在所有社交网络中的账号;R(t)表示t时刻所有社交网络中所有处于辟谣状态的账号;TPji(y)表示对应账号k的现实社会成员y在社交网络i和j上用相应账号转发同一消息的概率;γ表示未知状态的账号与传谣状态的相邻账号接触后转变为辟谣状态的概率;τ表示未知状态的账号与辟谣状态的相邻账号接触后转变为辟谣状态的概率。
优选的,所述沉默状态的账号的变化量的计算式如下:
Figure GDA0002881835570000044
式中,Δ|S|表示沉默状态的账号的变化量;
i和j标记社交网络,k标记社交网络上的账号,y标记现实社会成员;
K表示社交网络总个数;vi(k)表示社交网络i上的账号k,vj(k)示社交网络j上的账号k;Si(t)表示t时刻社交网络i上所有的处于沉默状态的账号;di(k)表示社交网络i上账号k的相邻账号总数;
Figure GDA0002881835570000045
表示t时刻社交网络i上账号k的相邻账号中处于辟谣状态的账号占所有相邻账号的比重;V(y)表示对应账号k的现实社会成员y在所有社交网络中的账号;R(t)表示t时刻所有社交网络中处于辟谣状态的账号;TPji(y)表示对应账号k的现实社会成员y在社交网络i和j上用相应账号转发同一消息的概率;ε表示沉默状态的账号与辟谣状态的相邻账号接触后转变为辟谣状态的概率。
优选的,所述现实社会成员在不同社交网络间的转发概率的计算式如下:
Figure GDA0002881835570000051
式中,TPij(y)表示现实社会成员y在社交网络i和j上用相应账号转发同一消息的概率,Py表示现实社会成员y,Ni表示社交网络i,Nj表示社交网络j。
优选的,所述预测表征谣言传播情况的各种状态的账号的变化量之后,还包括:
对表征谣言传播情况的各种状态的账号的变化量进行多次预测;
取多次预测的各种状态的账号的变化量的平均值,作为最终的各种状态的账号的变化量。
基于同一发明构思,本发明还提供了一种对异构网络异质结点上谣言传播情况预测系统,其特征在于,包括:数据获取模块、转发率模块和变化量模块;
所述数据获取模块,用于获取多个社交网络拓扑结构、社交网络上账号与现实社会成员的映射关系以及各账号的状态;
所述转发率模块,用于计算各现实社会成员在不同社交网络间的转发概率;
所述变化量模块,用于基于多个社交网络拓扑结构、社交网络上账号与现实社会成员的映射关系、各账号的状态以及各现实社会成员在不同社交网络间的转发概率,预测表征谣言传播情况的各种状态的账号的变化量;
所述状态包括:未接触谣言或辟谣信息的未知状态、接触过谣言或辟谣信息但并不转发的沉默状态、转发谣言的传谣状态和针对谣言进行辟谣的辟谣状态。
优选的,所述变化量模块包括:第一变化量单元、第二变化量单元和总变化量单元;
所述第一变化量单元,用于基于多个社交网络拓扑结构,分别获取各社交网络上各账号的具有社交关系的相邻账号的状态,并根据相邻账号的状态分别计算各状态的账号被相邻账号影响发生变化的第一变化量;
所述第二变化量单元,用于基于账号与现实社会成员的映射关系,分别获取各现实社会成员在不同社交网络上账号的状态,并根据同一现实社会成员在其他社交网络上账号的状态和现实社会成员在不同社交网络间的转发概率分别计算各状态的账号被同一现实社会成员在其他社交网络上账号影响发生变化的第二变化量;
所述总变化量单元,用于对所述第一变化量和第二变化量求和,得到表征谣言传播情况的各种状态的账号的变化量。
与最接近的现有技术相比,本发明具有的有益效果如下:
本发明提供了一种对异构网络异质结点上谣言传播情况预测方法和系统,包括:获取多个社交网络拓扑结构、社交网络上账号与现实社会成员的映射关系以及各账号的状态;计算各现实社会成员在不同社交网络间的转发概率;基于多个社交网络拓扑结构、社交网络上账号与现实社会成员的映射关系、各账号的状态以及各现实社会成员在不同社交网络间的转发概率,预测表征谣言传播情况的各种状态的账号的变化量;状态包括:未接触谣言或辟谣信息的未知状态、接触过谣言或辟谣信息但并不转发的沉默状态、转发谣言的传谣状态和针对谣言进行辟谣的辟谣状态。本申请考虑了谣言在多个异构网络间传播的情况,相比于当前存在的谣言预测方法,本申请考虑更全面,更能反映谣言的真实传播规律,进而得出更贴近实际的结论,具有更强的指导意义和实践价值。
附图说明
图1为本发明提供的一种对异构网络异质结点上谣言传播情况预测方法流程示意图;
图2为本发明涉及的多个社交网络拓扑结构以及账号与现实社会成员的映射关系示意图;
图3为本发明涉及的多网络中的谣言传播过程示意图;
图4为本发明涉及的现实社会中同一人在多个网络中转发同一消息的概率矩阵示意图;
图5为本发明涉及的多网络情况下影响某个网络节点状态的因素示意图;
图6为本发明涉及的多网络中未知者节点的状态转移示意图;
图7为本发明涉及的多网络中传谣者节点的状态转移示意图;
图8为本发明涉及的多网络中辟谣者状态转移示意图;
图9为本发明涉及的多网络中的沉默节点的状态转移示意图;
图10为本涉及的多网络谣言传播模型仿真条件下某一社交网络中各类节点密度随时间变化示意图;
图11为本发明涉及的单网络仿真条件下各类节点密度随时间变化示意图;
图12为本发明提供的一种对异构网络异质结点上谣言传播情况预测系统基本结构示意图;
图13为本发明提供的一种对异构网络异质结点上谣言传播情况预测系统详细结构示意图。
具体实施方式
下面结合附图对本发明的具体实施方式做进一步的详细说明。
社交网络中的节点是社会自然人在网络空间的映射;而社交网络中的连接关系则是社会自然人在物理世界的连接关系在网络空间的扩展,这些连接关系可能包括了部分的物理世界的连接关系。考虑到很多社会自然人会在多种社交网络和平台上开设账户并产生活动,而每种社交网络的核心业务侧重不同,所以社会自然人在诸多社交网络中映射的节点是异质节点。考虑到不同的社交网络在拓扑结构、规模、度分布等存在诸多差异,本发明面临的将会是异构社交网络。现有的对谣言传播的监测方法大多集中在物理世界的口口相传和单一社交网络转发关系,无法对跨社交网络的谣言传播进行有效监测。但是,一个社会自然人可能会在多个社交网络上传播同一消息,因此,谣言存在跨网络转发的可能,而事实上确实如此。只研究单一网络中的谣言传播,会面临某些传播是无源之水、无本之木得困境,往往会出得以偏概全的结论。
本发明将网络中的节点即账号分成传谣者、辟谣者、未知者和沉默者4类,4类账号的状态分别是:传谣状态、辟谣状态、未知状态和沉默状态,未知状态也可称之为正常状态,未知者也可称之为正常者。未知状态未接触谣言或辟谣信息;沉默状态接触过谣言或辟谣信息但并不转发;传谣状态转发谣言;辟谣状态针对谣言进行辟谣。本发明主要从多网络的角度出发,预测同一则谣言在多个社交网络中传播过程中,各类节点在不同的时刻或者时间段内数量的变化情况,同时为确定谣言传播途径、溯源分析、舆情引导和管控提供技术支撑,最终为维护网络安全和社会稳定起到正向作用。
为了便于后续表述,先将本发明中用到的变量及其定义说明罗列与表1中。
表1变量与定义
Figure GDA0002881835570000071
Figure GDA0002881835570000081
概率参数说明:
α:表示未知状态的账号与传谣状态的相邻账号接触后转变为传谣状态的概率;
β:表示未知状态的账号与传谣状态的相邻账号接触后转变为沉默状态的概率;
γ:表示未知状态的账号与传谣状态的相邻账号接触后转变为辟谣状态的概率;
σ:表示未知状态的账号与辟谣状态的相邻账号接触后转变为传谣状态的概率;
δ:表示未知状态的账号与辟谣状态的相邻账号接触后转变为沉默状态的概率;
τ:表示未知状态的账号与辟谣状态的相邻账号接触后转变为辟谣状态的概率;
Figure GDA0002881835570000082
表示传谣状态的账号与传谣状态的相邻账号接触后转变为沉默状态的概率;
η:表示传谣状态的账号与辟谣状态的相邻账号接触后转变为沉默状态的概率;
ε:表示沉默状态的账号与辟谣状态的相邻账号接触后转变为辟谣状态的概率;
标记说明:
i、j和x标记不同社交网络;k和o标记社交网络上的账号;y标记现实社会成员。
实施例1:
本发明提供的一种对异构网络异质结点上谣言传播情况预测方法流程示意图如图1所示,包括:
步骤1:获取多个社交网络拓扑结构、社交网络上账号与现实社会成员的映射关系以及各账号的状态;
步骤2:计算各现实社会成员在不同社交网络间的转发概率;
步骤3:基于多个社交网络拓扑结构、社交网络上账号与现实社会成员的映射关系、各账号的状态以及各现实社会成员在不同社交网络间的转发概率,预测表征谣言传播情况的各种状态的账号的变化量;
状态包括:未接触谣言或辟谣信息的未知状态、接触过谣言或辟谣信息但并不转发的沉默状态、转发谣言的传谣状态和针对谣言进行辟谣的辟谣状态。
具体的,一种对异构网络异质结点上谣言传播情况预测方法包括:
第一步,获取多个社交网络拓扑结构以及账号与现实社会成员的映射关系。
不同的社交网络平台一般面向不同的业务类型,网络拓扑结构也大不一样,但无论拓扑如何,其中的节点即账号都是现实社会中的人在网络虚拟空间的一种映射,而现实社会中的人是唯一的,没有任何两个人是相同的,如图2所示。另外,考虑到当前社交网络基本都实现了实名制,无论是身份证登记,还是手机号绑定,抑或是邮箱绑定等,社交网络中的每一个节点基本都能确定其对应的在现实社会中的人员(获取这些数据可能需要一定的权限),将这些对应关系收集起来,形成如下所示的账号矩阵AE。
Figure GDA0002881835570000091
账号矩阵AE是一个大小为K*M的矩阵,其中K表示参与谣言传播的社交网络平台的集合N的大小(如表1中变量AE所示),M表示N中所有节点对应的账号的持有者社会自然人集合P的大小。
账号矩阵AE中的一列表示对应的社会自然人在各网络中持有账号的情况(这里忽略小号、马甲等非正常账号);账号矩阵AE中的一行表示对应网络中各账号与社会自然人的对应情况。账号矩阵AE中的元素AEi,y表示社会自然人集合P中id为y的个体Py在第i个社交网络即网络Ni中持有账号的情况,取值为0或者1,取值0表示个体Py没有在网络Ni持有账号并产生活动,取值1表示个体Py在网络Ni持有账号并产生了活动。
基于图2所示的多网络,下面给出了一个K=3,M=7账号矩阵的示例,以表征7个社会自然人在3个社交网络中的账号分布情况。以个体P1为例,其在N1和N3中持有账号,对应的元素AE1,1和AE3,1为1,而AE2,1为0。
Figure GDA0002881835570000101
第二步,计算转发概率矩阵。
在多网络的谣言传播过程中,某个节点的状态除了受其所在的网络中周围邻居节点的影响外,还受该节点关联的社会自然人在其他社交网络中的节点状态的影响。在谣言传播过程中,谣言除了在同一网络内传播之外,还存在跨网络传播的问题,如图3所示。跨网络传播主要是指社会自然人在某网络中接触到谣言之后,社会自然人使用其他网络中的账号在其他网络中广播发送的过程。这说明,跨网络转发的前提是社会自然人在某网络中已经接触到了该谣言相关信息。图3中实心圆表示在该时刻已经感染为传谣状态的节点,虚线箭头表示同网络内传播的示意图,而实线箭头表示跨网络传播的过程,最下方的椭圆圈中的卡通人物表示在不同时刻被谣言感染的社会自然人。
图3所示为谣言/辟谣信息在相邻的3个时间点在多网络中进行传播的示意图。以谣言的传播为例,在不考虑辟谣者的情形下,图中的实心圆代表传谣者节点,空心节点代表未知节点或沉默节点。在tf时刻,网络N1中的节点v1(2)和网络N2中的节点v2(5)分别在本网络转发了一条谣言,它们的邻居节点都会接触到该谣言信息。接下来,在tf+1时刻,v1(2)的邻居节点v1(3)和v2(5)的邻居节点v2(2)相信了谣言并进行了转发,同时v1(2)又将该谣言转发到了本人在网络NK的账号vK(2)上。在tf+2时刻,v1(3)将谣言转发到了本人在网络N2的账号v2(3)上,v2(5)将谣言转发到了本人在网络N1的账号v1(5)上,vK(5)和vK(1)因受其邻居vK(2)转发的谣言的影响相信并转发了该谣言。
对于多网络中的谣言及辟谣信息的传播,既要考虑同一网络内部的谣言及辟谣信息的传播过程,也要考虑跨网络的谣言及辟谣信息的传播,因为不同的社会成员的不同社交网络中的账号之间没有直接连接关系,所以这里主要指社会成员自身在多个社交网络中注册的账号之间的传播,也就是图3中v1(2)将消息转发给vK(2)的过程,这个过程可能通过手工复制粘贴或者类似的转发按钮等实现。
考虑到社会成员对信息转发的偏好的差异性,我们为每一个社会成员定义跨网络转发的概率分布,然后通过矩阵的形式来表示所有社会成员在不同社交网络中转发消息的概率,如图4所示。社会成员跨网络转发的概率矩阵形式化表示如公式1所示。
TP=TP(P,N,t)=TP(1,t),TP(2,t),…,TP(M,t) (公式1)
其中,TP(y)和TP(y,t)是TP(y,N,t)的简写形式,y表示社会自然人集合P中的某个成员,记为Py。在不同的时刻,TP(y)可能并不相同在时间明确且不引起歧义的情况下,TP(y,t)可以简写成TP(y)。TP(y)的形式化定义公式2所示。
Figure GDA0002881835570000111
转发概率计算的方法为:同一节点中在两个网络转发同一消息占该节点在两个网络中转发过的消息数的比例,如公式3所示。
Figure GDA0002881835570000112
例如,Py在网络Ni中曾经转发了50条消息,在网络Nj中转发过25条消息,在这75条消息中有15条是相同的,也就是说有15条转发消息是Py同时转发到Ni和Nj中的,则Py将Ni中的消息转发到Nj中的概率为15/(50+25-15)=0.25,Py将Nj中的消息转发到Ni中的概率也是15/(50+25-15)=0.25。图4给出了一个真实的多网络转发概率矩阵示意图。从图中可以看到,对于任何一个社会成员,其跨网络转发概率矩阵是对角元素为1的对称矩阵,一般还是存在大量0的稀疏矩阵。除对角线元素外的全0行或者全0列表示该社会成员没有此网络中的账号,或者该账号没有转发过该社会成员其他网络中的任何消息,同时该社会成员的其他网络账号也没有转发过该网络中的消息。
第三步,计算不同时刻各种状态节点的变化量。
针对某一个具体的谣言,所有社交网络中的节点只能处于4种状态的一种,即未知状态、传谣状态、沉默状态和辟谣状态,其中传谣状态和辟谣状态互为矛盾状态。同一个社会成员在多个网络中对应的节点不能处于矛盾状态,也就是同一个社会成员在不同社交网络中的表态不能自相矛盾。考虑到沉默状态和未知状态不会跨网络传播,所以这里,我们假设只有谣言和辟谣信息才能跨网络传播。另外,我们假定对于每一个社会成员而言,其从某个网络将谣言信息或者辟谣信息转发到其他网络中的概率是独立的。
通过前面的描述可知,多网络情况下,影响某个节点状态的因素既包括同网络内的邻居节点的状态,还包括该节点对应的社会成员在其他网络中的对应节点的状态,如图5所示。在图5中,影响节点v1(3)的当前状态的因素已经用实线圆、加粗连线和带箭头的线进行突出显示,主要包括前一时刻处于辟谣状态的v1(1)、处于沉默状态的v1(2)、处于传谣状态的v1(4)、处于未知状态的v1(5),以及前一时刻P3在其他网络中的节点(v2(3)、v3(3),…,vK(3))的状态。一般地,在同一个网络内,某用户接触到谣言或者辟谣信息可能有延迟,或者即使接触到也可能并不会立即转发,因为这涉及到多个用户之间的转发,所以,我们假设谣言信息和辟谣信息在不删除的情况下会一直影响其周围邻居的状态。而跨网络的谣言或辟谣信息传播,与同网络内的谣言或者辟谣信息转发不太一样,这主要是因为这种转发是同一个人所为,可能不会有较大的延迟,但我们仍假设谣言或者辟谣信息不删除的情况下,在它们在某个网络被转发之后的各个时刻都可能被转发到其他跨网络。
下面对各网络中四类节点的数量随时间变化的情况分别进行讨论。
未知者节点数量随时间变化的情况
对于未知者节点,其状态转移图如图6所示。对于t时刻的任意一个未知者节点ui(k),其t+1时刻的状态取决于其邻居节点集合ni(k)中所有节点在t时刻的状态,和对应ui(k)的Py所有的网络节点V(y)在t时刻开始时的状态。假定在t时刻ni(k)中处于未知状态的节点占ni(k)大小的比重为
Figure GDA0002881835570000121
处于传谣状态的节点占ni(k)小的比重为
Figure GDA0002881835570000122
处于沉默状态的节点占ni(k)大小的比重为
Figure GDA0002881835570000127
处于辟谣状态的节点占ni(k)大小的比重为
Figure GDA0002881835570000123
ui(k)对应的社会成员Py对应的所有社交网络中的节点集合V(y)中,在t时刻处于未知状态的节点集合为V(y)∩U(t),处于传播状态的节点集合为V(y)∩B(t),处于沉默状态的节点集合为V(y)∩S(t),处于辟谣状态的节点集合为V(y)∩R(t)。
在多网络情况下,ui(k)节点的状态转移图如图6所示。图中“接触邻居”表示的关系是指ui(k)受到同网络中的邻居的影响,“跨网转发”表示的是Py将其他网络中将谣言或者辟谣信息借助ui(k)再次转发,转发概率如公式3所示。基于图6,我们可以计算ui(k)节点转移成其他状态的概率如公式4下。
首先计算ui(k)节点在t+1时刻保持状态不变的概率。在只考虑同网络的邻居节点影响的情况下,ui(k)节点保持状态不变的概率如公式4所示,ui(k)节点状态改变的概率如公式5所示。
在只考虑跨网转发的情况下,ui(k)在t+1时刻的状态只受前一时刻V(y)中各节点的影响,或者更准确地说,只受V(y)中的传谣者节点V(y)∩B(t)和辟谣者节点V(y)∩R(t)的影响。在只考虑跨网转发的情况下,ui(k)节点在t+1时刻状态不变的概率,即ui(k)不参与跨网转发的概率可以用公式6表示。考虑到我们前期假设,社会成员在不同社交网络中对同一转发消息的态度不能互相矛盾,公式6等号右边进行相乘的两项表达式是不能同时存在的,这里只给出了一般性表达,不进行精简。在只考虑跨网转发的情况下,ui(k)转发其他网络中的谣言信息(即变成传谣者)的概率可用公式7表示,ui(k)转发其他网络中的辟谣信息(变成辟谣者)的概率可用公式8表示。
Figure GDA0002881835570000124
Figure GDA0002881835570000125
Figure GDA0002881835570000126
Figure GDA0002881835570000131
Figure GDA0002881835570000132
综合公式4-公式8可知,ui(k)∈Ui(t)在t+1时刻状态保持不变的概率(即邻居和跨网络都不对该节点产生影响的概率)如公式9所示。
Figure GDA0002881835570000133
ui(k)∈Ui(t)在t+1时刻变成沉默者的概率如公式10所示。
Figure GDA0002881835570000134
ui(k)∈Ui(t)在t+1时刻变成传谣者的概率如公式11所示。
Figure GDA0002881835570000135
ui(k)∈Ui(t)在t+1时刻变成辟谣者的概率如公式12所示。
Figure GDA0002881835570000136
考虑到4种状态转移关系中,不存在从其他3种状态转成未知状态的情形,所以,我们可以计算在t+1时刻各网络以及总网络中未知者数量的增量,如公式13和公式14所示。
Figure GDA0002881835570000137
Figure GDA0002881835570000138
其中0<i≤K。(公式13)
Figure GDA0002881835570000139
传谣者节点数量随时间变化的情况
对于传谣者节点,其状态转移图如图7所示。从图7可知,t时刻为传谣状态的节点在t+1时刻的状态只与其在本网络中的邻居在t时刻的状态有关,而与该节点对应的社会自然人在其他网络中节点的状态无关。基于我们前面的假设可知,若节点bi(k)在t时刻为传谣状态,则除了bi(k)外,V(y)中的其他节点不可能处于辟谣状态,否则就会出现在同一时刻Py在不同网络中对同一谣言信息持有相互矛盾的态度。此时,V(y)中除bi(k)外的处于未知状态或者沉默状态的节点,则因为它们都不会发送任何消息,所以不会对bi(k)在t+1时刻的状态产生影响;V(y)中除bi(k)外还有节点处于传谣状态,说明Py至少在2个网络中传播了该谣言,这种情况下,我们认为bi(k)在t+1时刻的状态不会发生变化。因此,我们可以计算在t+1时刻各网络以及总网络中传谣者减少的数量,如公式15和公式16所示。
Figure GDA0002881835570000141
Figure GDA0002881835570000142
其中,0<i≤K。(公式15)
Figure GDA0002881835570000143
从图6至图9状态转移图可知,在t+1时刻网络中传谣者增加的数量来自于t时刻的处于未知状态的节点。因此,结合公式11,我们可以计算t+1时刻各网络以及总网络中传谣者增加的数量,如公式17和公式18所示。
Figure GDA0002881835570000144
Figure GDA0002881835570000145
综合公式15-公式18,我们可以计算在t+1时刻各网络以及总网络中传谣者数量的变化量,如公式19和公式20所示。
Figure GDA0002881835570000146
Figure GDA0002881835570000147
辟谣者节点数量随时间变化的情况
对于辟谣者节点,其状态转移图如图8所示。从图8可知,t时刻为辟谣状态的节点在t+1时刻的状态只与其在本网络总的邻居在t时刻的状态有关,而与该节点对应的社会成员在其他网络中节点的状态无关。基于我们前面的假设可知,若节点ri(k)在t时刻为辟谣状态,则除了ri(k)外,V(y)中的其他节点不可能处于传谣状态,否则就会出现在同一时刻Py在不同网络中对同一谣言信息持有相互矛盾的态度。此时,V(y)中除ri(k)外的其他节点中处于未知状态或者沉默状态的节点,则因为它们都不会发送任何消息,所以不会对ri(k)在t+1时刻的状态产生影响;V(y)中除ri(k)外的其他节点若有处于辟谣状态的节点,说明Py至少在2个网络中传播了该辟谣信息,这种情况下,我们认为ri(k)在t+1时刻的状态不会发生变化。因此,我们可以计算在t+1时刻各网络中辟谣者数量变化情况,如公式21、公式22和公式23所示。Δ|Ri|-=0,其中,0<i≤K。(公式21)
Figure GDA0002881835570000151
Figure GDA0002881835570000152
在t+1时刻所有网络中辟谣者数量变化情况如公式24所示。
Figure GDA0002881835570000153
沉默者节点数量随时间变化的情况
对于沉默者节点,其状态转移图如图9所示。从图9可知,t时刻为沉默状态的节点在t+1时刻的状态除了与其在本网络中的邻居在t时刻的状态有关,还与该节点对应的社会成员在其他网络中的辟谣者节点有关。从图9可知,无论是同网络内的节点的影响还是跨网络转发的影响,沉默者在下一时刻只有两种状态,要么保持沉默状态,要么变成辟谣者。对于节点si(k)∈Si(t),其对应的社会成员Py在t时刻处于辟谣状态的节点集合为V(y)∩R(t),其邻居节点中处于辟谣状态的节点比重为
Figure GDA0002881835570000154
因此,可以计算在t+1时刻si(k)保持不变的概率,如公式25所示。
Figure GDA0002881835570000155
进而,在t+1时刻si(k)变成辟谣者的概率,如公式26所示。
Figure GDA0002881835570000156
基于公式26,可以计算出任意网络中沉默者在t+1时刻减少的数量,如公式27所示,和所有网络中沉默者数量在t+1时刻的减少量,如公式28所示。
Figure GDA0002881835570000157
Figure GDA0002881835570000158
从图6和图7可知,t+1时刻沉默者增加的数量取决于t时刻网络中的未知者和传谣者。由t时刻的未知者转变成t+1时刻的沉默者的数量可以从公式10得出。由t时刻的传谣者转变成t+1时刻的沉默者的数量可以从公式15得出。因此,可以计算t+1时刻任意网络中的沉默者数量增加的数量,如公式29所示,和所有网络中沉默者增加的数量,如公式30所示。
Figure GDA0002881835570000161
Figure GDA0002881835570000162
其中0<i≤K(公式29)
Figure GDA0002881835570000163
进而,可以计算t+1时刻任意网络中沉默者节点的变化量,如公式31所示,和所有网络中沉默者节点的变化量,如公式32所示。
Figure GDA0002881835570000164
Figure GDA0002881835570000165
其中0<i≤K(公式31)
Figure GDA0002881835570000166
综合以上,可以得出基于本模型的多网络谣言传播模型如公式33所示:
Figure GDA0002881835570000167
第四步,通过多次计算不同时刻各种状态节点的变化量,求取平均值以逼近真实值。
考虑到大量随机因素可能会影响到同一网络内谣言相关信息的转发,而会影响社会自然人进行跨网络转发的情况。个体的行为可能会影响到谣言相关信息的整体传播情况。为了尽量逼近真实情况,可以采用多次求解然后求取平均的方法。具体来说,就是基于公式33,通过多次计算4种类型节点的数量变化情况,然后求平均值,将平均值作为本时刻的节点数量变化量,并以此作为基点,进行后续时刻的迭代。
最后,为了更加直观明了给出本专利提出的预测方法的准确性,我们给出了相同初始条件下,传统单网络中谣言传播和多网络中谣言传播过程中同一个网络中的各类节点形成的种群的密度随时间变化的示意图,如图10和图11所示。其中,具体初始条件为:网络规模N=200,节点的邻居数的平均值即平均度为6,0时刻全部都是正常节点,1时刻开始出现1个传谣者,2时刻出现第一个辟谣者。
对比图10和图11可知,多网络的引入,会加速谣言相关信息在网络中的传播,对应到图中,传谣者密度达到峰值的时间大幅度提前,传谣者密度从峰值下降一半的时间也大幅缩短,说明多网络情况下,谣言传播速度和消散速度更快。而两种情况下,辟谣者密度变化速度远不如传谣者密度大,我们分析原因在于:(1)大部分人比较关注谣言,对转发谣言比较感兴趣(或者影响到自己切身利益)或者说是比较敏感,对于辟谣信息不太敏感或者感兴趣,没有比较强的动机进行跨网络转发;(2)一般情况下,谣言的传播者数量远大于辟谣信息传播者数量。
另外,需要说明的是,图10和图11是小规模网络仿真的结果,不代表真实大规模网络中的结果。实际上,真实社交网络中,某些谣言由于传播率低,而社交网络太大,最终会出现大量社交网络节点根本没有接触到这些谣言。在这种情况下,网络中的正常者节点的密度就不会下降为0。
实施例2:
基于同一发明构思,本发明还提供了一种对异构网络异质结点上谣言传播情况预测系统,由于这些设备解决技术问题的原理与对异构网络异质结点上谣言传播情况预测方法相似,重复之处不再赘述。
该系统基本结构如图12所示,包括:数据获取模块、转发率模块和变化量模块;
数据获取模块,用于获取多个社交网络拓扑结构、社交网络上账号与现实社会成员的映射关系以及各账号的状态;
转发率模块,用于计算各现实社会成员在不同社交网络间的转发概率;
变化量模块,用于基于多个社交网络拓扑结构、社交网络上账号与现实社会成员的映射关系、各账号的状态以及各现实社会成员在不同社交网络间的转发概率,预测表征谣言传播情况的各种状态的账号的变化量;
状态包括:未接触谣言或辟谣信息的未知状态、接触过谣言或辟谣信息但并不转发的沉默状态、转发谣言的传谣状态和针对谣言进行辟谣的辟谣状态。
对异构网络异质结点上谣言传播情况预测系统详细结构如图13所示。
其中,变化量模块包括:第一变化量单元、第二变化量单元和总变化量单元;
第一变化量单元,用于基于多个社交网络拓扑结构,分别获取各社交网络上各账号的具有社交关系的相邻账号的状态,并根据相邻账号的状态分别计算各状态的账号被相邻账号影响发生变化的第一变化量;
第二变化量单元,用于基于账号与现实社会成员的映射关系,分别获取各现实社会成员在不同社交网络上账号的状态,并根据同一现实社会成员在其他社交网络上账号的状态和现实社会成员在不同社交网络间的转发概率分别计算各状态的账号被同一现实社会成员在其他社交网络上账号影响发生变化的第二变化量;
总变化量单元,用于对第一变化量和第二变化量求和,得到表征谣言传播情况的各种状态的账号的变化量。
其中,该系统还包括:最终计算模块;最终计算模块包括:多次预测单元和平均值单元;
多次预测单元,用于对表征谣言传播情况的各种状态的账号的变化量进行多次预测;
平均值单元,用于取多次预测的各种状态的账号的变化量的平均值,作为最终的各种状态的账号的变化量。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用于说明本申请的技术方案而非对其保护范围的限制,尽管参照上述实施例对本申请进行了详细的说明,所属领域的普通技术人员应当理解:本领域技术人员阅读本申请后依然可对申请的具体实施方式进行种种变更、修改或者等同替换,但这些变更、修改或者等同替换,均在申请待批的权利要求保护范围之内。

Claims (4)

1.一种对异构网络异质结点上谣言传播情况预测方法,其特征在于,包括:
获取多个社交网络拓扑结构、社交网络上账号与现实社会成员的映射关系以及各账号的状态;
计算各现实社会成员在不同社交网络间的转发概率;
基于多个社交网络拓扑结构、社交网络上账号与现实社会成员的映射关系、各账号的状态以及各现实社会成员在不同社交网络间的转发概率,预测表征谣言传播情况的各种状态的账号的变化量;
所述状态包括:未接触谣言或辟谣信息的未知状态、接触过谣言或辟谣信息但并不转发的沉默状态、转发谣言的传谣状态和针对谣言进行辟谣的辟谣状态;
所述基于多个社交网络拓扑结构、社交网络上账号与现实社会成员的映射关系、各账号的状态以及各现实社会成员在不同社交网络间的转发概率,预测表征谣言传播情况的各种状态的账号的变化量,包括:
基于多个社交网络拓扑结构,分别获取各社交网络上各账号的具有社交关系的相邻账号的状态,并根据相邻账号的状态分别计算各状态的账号被相邻账号影响发生变化的第一变化量;
基于账号与现实社会成员的映射关系,分别获取各现实社会成员在不同社交网络上账号的状态,并根据同一现实社会成员在其他社交网络上账号的状态和现实社会成员在不同社交网络间的转发概率分别计算各状态的账号被同一现实社会成员在其他社交网络上账号影响发生变化的第二变化量;
对所述第一变化量和第二变化量求和,得到表征谣言传播情况的各种状态的账号的变化量;
所述未知状态的账号的变化量的计算式如下:
Figure FDA0002982878660000011
式中,ΔU表示未知状态的账号的变化量;
i、j和x标记不同社交网络,k标记社交网络上的账号,y标记现实社会成员;
K表示社交网络总个数;uk表示处于未知状态的账号k;Ui(t)表示t时刻社交网络i上所有的处于未知状态的账号;
Figure FDA0002982878660000021
表示t时刻社交网络i上账号k的相邻账号中处于传谣状态的账号占所有相邻账号的比重;di(k)表示社交网络i上账号k的相邻账号总数;
Figure FDA0002982878660000022
表示t时刻社交网络i上账号k的相邻账号中处于辟谣状态的账号占所有相邻账号的比重;vj(k)表示社交网络j上的账号k,vx(k)表示社交网络x上的账号k;V(y)表示对应账号k的现实社会成员y在所有社交网络中的账号;B(t)表示t时刻所有社交网络中所有处于传谣状态的账号,R(t)表示t时刻所有社交网络中所有处于辟谣状态的账号;TPji(y,t-1)表示t-1时刻对应账号k的现实社会成员y在社交网络i和j上用相应账号转发同一消息的概率,TPxi(y,t-1)表示t-1时刻对应账号k的现实社会成员y在社交网络i和x上用相应账号转发同一消息的概率;α表示未知状态的账号与传谣状态的相邻账号接触后转变为传谣状态的概率,β表示未知状态的账号与传谣状态的相邻账号接触后转变为沉默状态的概率,γ表示未知状态的账号与传谣状态的相邻账号接触后转变为辟谣状态的概率;σ表示未知状态的账号与辟谣状态的相邻账号接触后转变为传谣状态的概率,δ表示未知状态的账号与辟谣状态的相邻账号接触后转变为沉默状态的概率,τ表示未知状态的账号与辟谣状态的相邻账号接触后转变为辟谣状态的概率;
所述传谣状态的账号的变化量的计算式如下:
Figure FDA0002982878660000023
式中,Δ|B|表示传谣状态的账号的变化量;
i和j标记社交网络,k和o标记社交网络上的账号,y标记现实社会成员;
K表示社交网络总个数;vi(k)表示社交网络i上的账号k,vj(k)社交网络j上的账号k;Ui(t)表示t时刻社交网络i上所有的处于未知状态的账号;
Figure FDA0002982878660000024
表示t时刻社交网络i上账号k 的相邻账号中处于传谣状态的账号占所有相邻账号的比重;di(k)表示社交网络i上账号k的相邻账号总数;
Figure FDA0002982878660000031
表示t时刻社交网络i上账号k的相邻账号中处于辟谣状态的账号占所有相邻账号的比重;V(y)表示对应账号k的现实社会成员y在所有社交网络中的账号;B(t)表示t时刻所有社交网络中所有处于传谣状态的账号;TPji(y)表示对应账号k的现实社会成员y在社交网络i和j上用相应账号转发同一消息的概率;b(o)表示传谣状态的账号o;Bi(t)表示t时刻社交网络i中所有处于传谣状态的账号;
Figure FDA0002982878660000032
表示t时刻社交网络i上账号o的相邻账号中处于传谣状态的账号占所有相邻账号的比重;di(o)表示社交网络i上账号o的相邻账号总数;
Figure FDA0002982878660000033
表示t时刻社交网络i上账号o的相邻账号中处于辟谣状态的账号占所有相邻账号的比重;α表示未知状态的账号与传谣状态的相邻账号接触后转变为传谣状态的概率;σ表示未知状态的账号与辟谣状态的相邻账号接触后转变为传谣状态的概率;
Figure FDA0002982878660000034
表示传谣状态的账号与传谣状态的相邻账号接触后转变为沉默状态的概率,η表示传谣状态的账号与辟谣状态的相邻账号接触后转变为沉默状态的概率;
所述辟谣状态的账号的变化量的计算式如下:
Figure FDA0002982878660000035
式中,Δ|R|表示辟谣状态的账号的变化量;
i和j标记社交网络,k标记社交网络上的账号,y标记现实社会成员;
K表示社交网络总个数;ui(k)表示社交网络i上处于未知状态的账号k;U(t)表示t时刻所有社交网络中处于未知状态的账号;
Figure FDA0002982878660000036
表示t时刻社交网络i上账号k的相邻账号中处于传谣状态的账号占所有相邻账号的比重;di(k)表示社交网络i上账号k的相邻账号总数;
Figure FDA0002982878660000037
表示t时刻社交网络i上账号k的相邻账号中处于辟谣状态的账号占所有相邻账号的比重;vj(k)表示社交网络j上的账号k;V(y)表示对应账号k的现实社会成员y在所有社交网络中的账号;R(t)表示t时刻所有社交网络中所有处于辟谣状态的账号;TPji(y)表示对应账号k的现实社会成员y在社交网络i和j上用相应账号转发同一消息的概率;γ表示未知状态的账号与传谣状态的相邻账号接触后转变为辟谣状态的概率;τ表示未知状态的账号与辟谣状态的相邻账号接触后转变为辟谣状态的概率;
所述沉默状态的账号的变化量的计算式如下:
Figure FDA0002982878660000041
式中,Δ|S|表示沉默状态的账号的变化量;
i和j标记社交网络,k标记社交网络上的账号,y标记现实社会成员;
K表示社交网络总个数;vi(k)表示社交网络i上的账号k,vj(k)示社交网络j上的账号k;Si(t)表示t时刻社交网络i上所有的处于沉默状态的账号;di(k)表示社交网络i上账号k的相邻账号总数;
Figure FDA0002982878660000042
表示t时刻社交网络i上账号k的相邻账号中处于辟谣状态的账号占所有相邻账号的比重;V(y)表示对应账号k的现实社会成员y在所有社交网络中的账号;R(t)表示t时刻所有社交网络中处于辟谣状态的账号;TPji(y)表示对应账号k的现实社会成员y在社交网络i和j上用相应账号转发同一消息的概率;ε表示沉默状态的账号与辟谣状态的相邻账号接触后转变为辟谣状态的概率。
2.如权利要求1所述的方法,其特征在于,所述现实社会成员在不同社交网络间的转发概率的计算式如下:
Figure FDA0002982878660000043
式中,TPij(y)表示现实社会成员y在社交网络i和j上用相应账号转发同一消息的概率,Py表示现实社会成员y,Ni表示社交网络i,Nj表示社交网络j。
3.如权利要求1所述的方法,其特征在于,所述预测表征谣言传播情况的各种状态的账号的变化量之后,还包括:
对表征谣言传播情况的各种状态的账号的变化量进行多次预测;
取多次预测的各种状态的账号的变化量的平均值,作为最终的各种状态的账号的变化量。
4.一种对异构网络异质结点上谣言传播情况预测系统,其特征在于,包括:数据获取模块、转发率模块和变化量模块;
所述数据获取模块,用于获取多个社交网络拓扑结构、社交网络上账号与现实社会成员的映射关系以及各账号的状态;
所述转发率模块,用于计算各现实社会成员在不同社交网络间的转发概率;
所述变化量模块,用于基于多个社交网络拓扑结构、社交网络上账号与现实社会成员的映射关系、各账号的状态以及各现实社会成员在不同社交网络间的转发概率,预测表征谣言传播情况的各种状态的账号的变化量;
所述状态包括:未接触谣言或辟谣信息的未知状态、接触过谣言或辟谣信息但并不转发的沉默状态、转发谣言的传谣状态和针对谣言进行辟谣的辟谣状态;
所述变化量模块包括:第一变化量单元、第二变化量单元和总变化量单元;
所述第一变化量单元,用于基于多个社交网络拓扑结构,分别获取各社交网络上各账号的具有社交关系的相邻账号的状态,并根据相邻账号的状态分别计算各状态的账号被相邻账号影响发生变化的第一变化量;
所述第二变化量单元,用于基于账号与现实社会成员的映射关系,分别获取各现实社会成员在不同社交网络上账号的状态,并根据同一现实社会成员在其他社交网络上账号的状态和现实社会成员在不同社交网络间的转发概率分别计算各状态的账号被同一现实社会成员在其他社交网络上账号影响发生变化的第二变化量;
所述总变化量单元,用于对所述第一变化量和第二变化量求和,得到表征谣言传播情况的各种状态的账号的变化量;
所述未知状态的账号的变化量的计算式如下:
Figure FDA0002982878660000051
式中,ΔU表示未知状态的账号的变化量;
i、j和x标记不同社交网络,k标记社交网络上的账号,y标记现实社会成员;
K表示社交网络总个数;uk表示处于未知状态的账号k;Ui(t)表示t时刻社交网络i上所有的处于未知状态的账号;
Figure FDA0002982878660000052
表示t时刻社交网络i上账号k的相邻账号中处于传谣状态的账号占所有相邻账号的比重;di(k)表示社交网络i上账号k的相邻账号总数;
Figure FDA0002982878660000053
表示t时刻社交网络i上账号k的相邻账号中处于辟谣状态的账号占所有相邻账号的比重;vj(k)表示社交网络j上的账号k,vx(k)表示社交网络x上的账号k;V(y)表示对应账号k的现实社会成员y在所有社交网络中的账号;B(t)表示t时刻所有社交网络中所有处于传谣状态的账号,R(t)表示t时刻所有社交网络中所有处于辟谣状态的账号;TPji(y,t-1)表示t-1时刻对应账号k的现实社会成员y在社交网络i和j上用相应账号转发同一消息的概率,TPxi(y,t-1)表示t-1时刻对应账号k的现实社会成员y在社交网络i和x上用相应账号转发同一消息的概率;α表示未知状态的账号与传谣状态的相邻账号接触后转变为传谣状态的概率,β表示未知状态的账号与传谣状态的相邻账号接触后转变为沉默状态的概率,γ表示未知状态的账号与传谣状态的相邻账号接触后转变为辟谣状态的概率;σ表示未知状态的账号与辟谣状态的相邻账号接触后转变为传谣状态的概率,δ表示未知状态的账号与辟谣状态的相邻账号接触后转变为沉默状态的概率,τ表示未知状态的账号与辟谣状态的相邻账号接触后转变为辟谣状态的概率;
所述传谣状态的账号的变化量的计算式如下:
Figure FDA0002982878660000061
式中,Δ|B|表示传谣状态的账号的变化量;
i和j标记社交网络,k和o标记社交网络上的账号,y标记现实社会成员;
K表示社交网络总个数;vi(k)表示社交网络i上的账号k,vj(k)社交网络j上的账号k;Ui(t)表示t时刻社交网络i上所有的处于未知状态的账号;
Figure FDA0002982878660000062
表示t时刻社交网络i上账号k的相邻账号中处于传谣状态的账号占所有相邻账号的比重;di(k)表示社交网络i上账号k的相邻账号总数;
Figure FDA0002982878660000063
表示t时刻社交网络i上账号k的相邻账号中处于辟谣状态的账号占所有相邻账号的比重;V(y)表示对应账号k的现实社会成员y在所有社交网络中的账号;B(t)表示t时刻所有社交网络中所有处于传谣状态的账号;TPji(y)表示对应账号k的现实社会成员y在社交网络i和j上用相应账号转发同一消息的概率;b(o)表示传谣状态的账号o;Bi(t)表示t时刻社交网络i中所有处于传谣状态的账号;
Figure FDA0002982878660000071
表示t时刻社交网络i上账号o的相邻账号中处于传谣状态的账号占所有相邻账号的比重;di(o)表示社交网络i上账号o的相邻账号总数;
Figure FDA0002982878660000072
表示t时刻社交网络i上账号o的相邻账号中处于辟谣状态的账号占所有相邻账号的比重;α表示未知状态的账号与传谣状态的相邻账号接触后转变为传谣状态的概率;σ表示未知状态的账号与辟谣状态的相邻账号接触后转变为传谣状态的概率;
Figure FDA0002982878660000073
表示传谣状态的账号与传谣状态的相邻账号接触后转变为沉默状态的概率,η表示传谣状态的账号与辟谣状态的相邻账号接触后转变为沉默状态的概率;
所述辟谣状态的账号的变化量的计算式如下:
Figure FDA0002982878660000074
式中,Δ|R|表示辟谣状态的账号的变化量;
i和j标记社交网络,k标记社交网络上的账号,y标记现实社会成员;
K表示社交网络总个数;ui(k)表示社交网络i上处于未知状态的账号k;U(t)表示t时刻所有社交网络中处于未知状态的账号;
Figure FDA0002982878660000075
表示t时刻社交网络i上账号k的相邻账号中处于传谣状态的账号占所有相邻账号的比重;di(k)表示社交网络i上账号k的相邻账号总数;
Figure FDA0002982878660000076
表示t时刻社交网络i上账号k的相邻账号中处于辟谣状态的账号占所有相邻账号的比重;vj(k)表示社交网络j上的账号k;V(y)表示对应账号k的现实社会成员y在所有社交网络中的账号;R(t)表示t时刻所有社交网络中所有处于辟谣状态的账号;TPji(y)表示对应账号k的现实社会成员y在社交网络i和j上用相应账号转发同一消息的概率;γ表示未知状态的账号与传谣状态的相邻账号接触后转变为辟谣状态的概率;τ表示未知状态的账号与辟谣状态的相邻账号接触后转变为辟谣状态的概率;
所述沉默状态的账号的变化量的计算式如下:
式中,Δ|S|表示沉默状态的账号的变化量;
i和j标记社交网络,k标记社交网络上的账号,y标记现实社会成员;
Figure FDA0002982878660000081
K表示社交网络总个数;vi(k)表示社交网络i上的账号k,vj(k)示社交网络j上的账号k;Si(t)表示t时刻社交网络i上所有的处于沉默状态的账号;di(k)表示社交网络i上账号k的相邻账号总数;
Figure FDA0002982878660000082
表示t时刻社交网络i上账号k的相邻账号中处于辟谣状态的账号占所有相邻账号的比重;V(y)表示对应账号k的现实社会成员y在所有社交网络中的账号;R(t)表示t时刻所有社交网络中处于辟谣状态的账号;TPji(y)表示对应账号k的现实社会成员y在社交网络i和j上用相应账号转发同一消息的概率;ε表示沉默状态的账号与辟谣状态的相邻账号接触后转变为辟谣状态的概率。
CN202010474678.9A 2020-05-29 2020-05-29 一种对异构网络异质结点上谣言传播情况预测方法和系统 Active CN112037078B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010474678.9A CN112037078B (zh) 2020-05-29 2020-05-29 一种对异构网络异质结点上谣言传播情况预测方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010474678.9A CN112037078B (zh) 2020-05-29 2020-05-29 一种对异构网络异质结点上谣言传播情况预测方法和系统

Publications (2)

Publication Number Publication Date
CN112037078A CN112037078A (zh) 2020-12-04
CN112037078B true CN112037078B (zh) 2021-07-02

Family

ID=73578796

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010474678.9A Active CN112037078B (zh) 2020-05-29 2020-05-29 一种对异构网络异质结点上谣言传播情况预测方法和系统

Country Status (1)

Country Link
CN (1) CN112037078B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113726802B (zh) * 2021-09-02 2023-02-03 中国人民解放军国防科技大学 一种网络病毒传播分析方法、装置、计算机设备和介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8768782B1 (en) * 2011-06-10 2014-07-01 Linkedin Corporation Optimized cloud computing fact checking
US9529974B2 (en) * 2008-02-25 2016-12-27 Georgetown University System and method for detecting, collecting, analyzing, and communicating event-related information
CN107451923A (zh) * 2017-07-14 2017-12-08 北京航空航天大学 一种基于转发网络层次分析的在线社交网络谣言预测方法
CN110781411A (zh) * 2019-11-05 2020-02-11 重庆邮电大学 一种基于辟谣消息的谣言传播控制方法
CN110807556A (zh) * 2019-11-05 2020-02-18 重庆邮电大学 对微博谣言或/和辟谣话题传播趋势的预测方法及装置
CN110825948A (zh) * 2019-11-05 2020-02-21 重庆邮电大学 基于促谣-辟谣消息和表示学习的谣言传播控制方法
CN110991742A (zh) * 2019-12-04 2020-04-10 清华大学 一种社交网络信息转发概率预测方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106844697B (zh) * 2017-01-25 2019-07-23 中国矿业大学 一种基于潜在传播集的社交网络信息传播跟踪方法
CN109064348B (zh) * 2018-09-06 2021-10-08 上海交通大学 一种在社交网络中封锁谣言社区并抑制谣言传播的方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9529974B2 (en) * 2008-02-25 2016-12-27 Georgetown University System and method for detecting, collecting, analyzing, and communicating event-related information
US8768782B1 (en) * 2011-06-10 2014-07-01 Linkedin Corporation Optimized cloud computing fact checking
CN107451923A (zh) * 2017-07-14 2017-12-08 北京航空航天大学 一种基于转发网络层次分析的在线社交网络谣言预测方法
CN110781411A (zh) * 2019-11-05 2020-02-11 重庆邮电大学 一种基于辟谣消息的谣言传播控制方法
CN110807556A (zh) * 2019-11-05 2020-02-18 重庆邮电大学 对微博谣言或/和辟谣话题传播趋势的预测方法及装置
CN110825948A (zh) * 2019-11-05 2020-02-21 重庆邮电大学 基于促谣-辟谣消息和表示学习的谣言传播控制方法
CN110991742A (zh) * 2019-12-04 2020-04-10 清华大学 一种社交网络信息转发概率预测方法及系统

Also Published As

Publication number Publication date
CN112037078A (zh) 2020-12-04

Similar Documents

Publication Publication Date Title
Dong et al. Studies on the population dynamics of a rumor-spreading model in online social networks
Wang et al. Users’ mobility enhances information diffusion in online social networks
Sun et al. Gesundheit! modeling contagion through facebook news feed
CN106682770B (zh) 一种基于好友圈子的动态微博转发行为预测系统及方法
CN107566249B (zh) 一种训练用于预测社交网络用户转发消息的模型的方法
Qu et al. Efficient online summarization of large-scale dynamic networks
CN111222029A (zh) 一种网络舆情信息传播中关键节点选择方法
Zhao et al. Impact of individual interest shift on information dissemination in modular networks
CN111127233A (zh) 一种社交网络无向有权图中用户核值计算方法
CN108334953B (zh) 一种基于权重更新的社交网络信任度学习方法
CN112037078B (zh) 一种对异构网络异质结点上谣言传播情况预测方法和系统
CN109816544B (zh) 基于接触概率的信息传播模型实现方法及装置
Holme et al. Impact of misinformation in temporal network epidemiology
CN107809363A (zh) 一种网络信息传播控制方法和装置
Zhang et al. Research on the information dissemination mechanisms of weibo in scale-free networks
Liu et al. Strong social graph based trust-oriented graph pattern matching with multiple constraints
WO2018077301A1 (zh) 账号筛选方法和装置
CN111178678B (zh) 基于社团影响力的网络节点重要性评估方法
Cui et al. Modeling information diffusion in time-varying community networks
Qu et al. Tracing truth and rumor diffusions over mobile social networks: Who are the initiators?
CN106844697B (zh) 一种基于潜在传播集的社交网络信息传播跟踪方法
Baggio The mechanism for spreading online reputation.
CN111382345B (zh) 话题筛选和发布的方法、装置和服务器
Feng et al. Information diffusion efficiency in online social networks
CN112712210A (zh) 突发性话题传播规模预测方法、系统、处理终端、介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant