CN108304521B - 基于演化博弈的微博谣言传播的分析方法与系统 - Google Patents

基于演化博弈的微博谣言传播的分析方法与系统 Download PDF

Info

Publication number
CN108304521B
CN108304521B CN201810071416.0A CN201810071416A CN108304521B CN 108304521 B CN108304521 B CN 108304521B CN 201810071416 A CN201810071416 A CN 201810071416A CN 108304521 B CN108304521 B CN 108304521B
Authority
CN
China
Prior art keywords
user
microblog
data
rumor
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810071416.0A
Other languages
English (en)
Other versions
CN108304521A (zh
Inventor
韦世红
陈迪强
唐宏
于海洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN201810071416.0A priority Critical patent/CN108304521B/zh
Publication of CN108304521A publication Critical patent/CN108304521A/zh
Application granted granted Critical
Publication of CN108304521B publication Critical patent/CN108304521B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于社交网络建模与数据挖掘领域,具体涉及到一种基于演化博弈的微博谣言传播的分析方法与系统;所述方法包括:构建微博数据信息数据库,抓取微博用户资料和数据资料,进行数据预处理;提取所述微博用户资料和数据资料的相关属性;根据演化博弈的理论来定义各个节点的收益矩阵,以及各个节点的邻居节点中不同策略选择所占的比例,根据复制动态方程构建话题驱动力;构建谣言传播动力学模型。本发明通过兼顾谣言信息本身的特殊性,将辟谣信息引入到传统的SIR模型中,提出一种SKIR微博谣言传播动力学模型,从而实现对真实世界中微博谣言传播过程的分析。

Description

基于演化博弈的微博谣言传播的分析方法与系统
技术领域
本发明属于社交网络建模与数据挖掘领域,具体涉及到一种基于演化博弈的微博谣言传播的分析方法与系统。
背景技术
微博作为当前最热门的社交网络平台之一,是人们获取和分享信息的重要场所,其在为人们提供方便的同时,也成为了众多网络谣言滋生的乐土。微博庞大的用户群体,使得谣言的传播速度和范围都得到了前所未有的提升,给社会的和谐安定造成了严重的威胁。研究微博谣言传播问题对于理解、预测和疏导舆情有着重要的理论和现实意义,正引起各国政府和社会的广泛关注和重视。
目前,常见的微博谣言传播分析都是通过构建微博谣言传播模型实现的。现有的谣言传播模型虽然在一定程度上可以刻画谣言传播过程中各阶段所呈现的特征,但是由于缺乏完整的谣言传播动力学机制分析,受限于简单的参数设定,未曾考虑到谣言信息本身的特殊性—谣言和辟谣信息的共生性,以及人们的从众心理以及利弊权衡心理,节点间的规则也较为简单,最终导致所构建的模型无法完整、真实的模拟现实世界中微博谣言的传播过程。由此,这些模型对真实世界的谣言传播状况的分析与真实微博谣言情况还存在差距。对比文件 CN106126700A一种微博谣言传播的分析方法所采用的UASR微博谣言传播模型,能够对微博谣言传播进行有效的分析,但该模型仅考虑了谣言单条信息的影响因素,而忽略了辟谣消息对谣言传播的影响,同时还忽略了用户在面对选择时的趋利性心理和从众心理。
发明内容
为实现以上发明目的,本发明提出了一种基于演化博弈论的谣言传播分析方法与系统,
所述具体包括以下四个步骤:
步骤1、构建微博数据信息数据库,抓取微博用户资料和数据资料,对抓取后的微博用户资料和数据资料进行数据预处理;
步骤2、提取微博用户资料和数据资料的相关属性,根据所述相关属性构建微博用户的社交影响力;
步骤3、根据演化博弈的理论和所述微博用户的社交影响力来定义各个节点的收益矩阵;利用所述收益矩阵根据复制动态方程构建话题驱动力;
步骤4、根据所述话题驱动力,构建谣言传播动力学模型,根据谣言传播动力学模型对微博谣言传播过程进行分析。
进一步的,所述构建微博数据信息数据库,抓取微博用户资料和数据资料,对抓取后的微博用户资料和数据资料进行数据预处理包括:选定一条微博,选择所述微博的转发用户中的第一用户作为起始用户,将所述第一用户加入到待抓取的用户的队列中,从所述待抓取的用户的队列中选取一个用户,抓取其资料和发布的微博数据,然后抓取参与转发所述微博的下一个用户,如此循环下去,直到抓取完所有需要的数据。
进一步的,步骤2中所述用户属性的提取方法为:从用户本身活跃度fuser(i)、邻居节点影响力fnei(i)以及微博热度finf(t)来提取用户属性。
进一步的,所述用户本身活跃度fuser(i)包括:根据所述步骤101中抓取的数据通过用户本身的关注数以及转发和原创微博的数目衡量用户的活跃度;
fuser(i)=χjk
其中,χj=ρ×Num[orig(i)]+Num[retw(i)],ρ∈[0,1]为弱化系数,Num[orig(i)]为用户i在话题发起前一个月的原创微博数量,Num[retw(i)]是用户i在话题发起前一个月的转发微博数量;χk为用户i的关注者数量;
所述邻居节点影响力fnei(i)包括:在评估邻居节点影响力的过程中引入信息传播带动力,即邻居节点的原创微博和转发微博的参与量,将邻居节点的粉丝量作为一个影响力指标,从而来构成邻居节点的影响力;
Figure BDA0001558257010000031
其中,χm为该用户的微博的平均参与度,χn为该用户的粉丝数目,所述参与量包括:评论数、转发数以及点赞数;
所述微博热度finf(t)包括:引入半衰期函数表示信息从发布到慢慢衰减直至死亡的过程;
Figure BDA0001558257010000032
其中,t表示从话题发起到当前时候的时间,w为正则系数。
进一步的,步骤3中所述的用户策略包括:“传谣”和“辟谣”,“传谣”表示用户相信谣言信息,“辟谣”表示用户相信辟谣信息。
进一步的,步骤3中所述的收益矩阵如下:
Figure BDA0001558257010000033
其中,a(t)=α×fuser+β×f1nei(i)×f1inf(t),b(t)=α×fuser+β×f2nei(i)×f2inf(t),a(t)表示用户传谣的收益,b(t)表示用户辟谣的收益;α为节点受自身因素的比重,β为节点受自身因素和环境因素影响的比重,f1nei(i)表示谣言信息的邻居节点影响;f2nei(i)表示辟谣信息的邻居节点影响;f1inf(t)表示谣言信息的微博热度, f2inf(t)表示辟谣信息的微博热度。
进一步的,步骤3中所述话题驱动力包括:
Figure BDA0001558257010000034
其中,k(t)=p1(t)×a(t)-p2(t)×b(t),k(t)表示复制动态方程;p1(t)为t时刻邻居节点中传谣节点的比例,p2(t)为t时刻用户邻居节点中辟谣节点的比例。
进一步的,步骤4中所述谣言传播动力学模型方程包括:
Figure BDA0001558257010000041
Figure BDA0001558257010000042
Figure BDA0001558257010000043
Figure BDA0001558257010000044
其中,所述用户节点状态包括:易感状态S、辟谣状态K、传谣状态I和移除状态R;
Figure BDA0001558257010000045
表示易感状态S的动态变化;
Figure BDA0001558257010000046
表示传谣状态I的动态变化,
Figure BDA0001558257010000047
表示辟谣状态K的动态变化,
Figure BDA0001558257010000048
表示移除状态的动态变化;μ表示易感状态S向辟谣状态K转移的概率也即是话题驱动力,λ表示易感状态到感染状态的概率,γ表示易感状态S向移除状态R转换的概率,η表示感染状态I向辟谣状态K转移的概率,
Figure BDA0001558257010000049
表示辟谣状态K或传谣状态I向移除状态R的概率,I(t) 表示用户在t时刻处于传谣的状态,S(t)表示用户在t时刻处于易感的状态,K(t)表示用户在t时刻处于辟谣的状态。
优选的,本发明还提出的了一种用于实现一种基于演化博弈的微博谣言传播的分析的系统:
所述系统包括获取数据模块、提取数据属性模块、演化博弈模块、构建谣言信息传播模块,以及谣言分析模块;
所述获取数据模块用于抓取微博用户资料和数据资料;
所述提取数据属性模块用于提取所述微博用户资料和数据资料的相关属性;
所述演化博弈模块用于定义各个节点的收益矩阵以及构建话题驱动力;
所述构建谣言信息传播模块用于构建谣言传播动力学模型;
所述谣言分析模块用于分析谣言。
进一步的,所述获取数据模块用于抓取微博用户资料和数据资料包括:所述获取数据模块构建微博数据信息数据库,抓取微博用户资料和数据资料,并进行数据预处理操作具体包括:所述获取数据模块选定一条微博,选择所述微博的转发用户中的第一用户作为起始用户,将所述第一用户加入到待抓取的用户的队列中,每次所述待抓取的用户的队列选取一个用户,抓取其资料和发布的微博数据,抓取参与转发所述微博的下一个用户,如此循环下去,直到抓取完所有需要的数据。
进一步的,所述提取数据属性模块用于提取所述微博用户资料和数据资料的相关属性包括:所述提取数据属性模块分别从用户本身活跃度fuser(i)、邻居节点影响力fnei(i)以及微博热度finf(t)来进行用户属性的提取;所述提取数据属性模块根据所述用户属性的定义来构建社交影响力;
所述用户本身活跃度fuser(i)包括:根据所述步骤1中抓取的数据通过用户本身的关注数以及转发和原创微博的数目衡量用户的活跃度;
fuser(i)=χjk
其中,χj=ρ×Num[orig(i)]+Num[retw(i)],ρ∈[0,1]为弱化系数,Num[orig(i)]为用户i在话题发起前一个月的原创微博数量,Num[retw(i)]是用户i在话题发起前一个月的转发微博数量;χk为用户i的关注者数量;
所述邻居节点影响力fnei(i)包括:在评估邻居节点影响力的过程中引入信息传播带动力,即邻居节点的原创微博和转发微博的参与量,将邻居节点的粉丝量作为一个影响力指标,从而来构成邻居节点的影响力;
Figure BDA0001558257010000051
其中,χm为该用户的微博的平均参与度,χn为该用户的粉丝数目,所述参与量包括:评论数、转发数以及点赞数;
所述微博热度finf(t)包括:引入半衰期函数表示信息从发布到慢慢衰减直至死亡的过程;
Figure BDA0001558257010000061
其中,t表示从话题发起到当前时候的时间,w为正则系数。
进一步的,所述演化博弈模块用于定义各个节点的收益矩阵以及构建话题驱动力具体包括:所述演化博弈模块根据演化博弈的理论来定义各个节点的收益矩阵以及用户策略;根据复制动态方程得到话题驱动力,所述话题驱动力包括:
Figure BDA0001558257010000062
其中,k(t)=p1(t)×a(t)-p2(t)×b(t),k(t)表示复制动态方程;p1(t)为t时刻邻居节点中传谣节点的比例,p2(t)为t时刻用户邻居节点中辟谣节点的比例。。
进一步的,所述构建谣言信息传播模块用于构建谣言传播动力学模型包括:所述构建谣言信息模块划分用户节点状态,定义用户状态转换规则,对所述用户节点状态转换做出假定,将辟谣信息引入到传统的传染病模型中,构造一种谣言传播动力学模型,所述谣言分析模块根据所述构建谣言信息模块所构建的谣言传播动力学模型对谣言信息进行分析;所述动力学模型方程包括:
Figure BDA0001558257010000063
Figure BDA0001558257010000064
Figure BDA0001558257010000065
Figure BDA0001558257010000066
其中,所述用户节点状态包括:易感状态S、辟谣状态K、传谣状态I和移除状态R;
Figure BDA0001558257010000067
表示易感状态S的动态变化;
Figure BDA0001558257010000068
表示传谣状态I的动态变化,
Figure BDA0001558257010000071
表示辟谣状态K的动态变化,
Figure BDA0001558257010000072
表示移除状态的动态变化;μ表示易感状态S向辟谣状态K转移的概率,λ表示易感状态到感染状态的概率,γ表示易感状态S向移除状态R转换的概率,η表示感染状态I向辟谣状态K转移的概率,
Figure BDA0001558257010000073
表示辟谣状态K或传谣状态I向移除状态R的概率,I(t)表示用户在t时刻处于传谣的状态,S(t)表示用户在t时刻处于易感的状态,K(t)表示用户在t 时刻处于辟谣的状态。
本发明的有益效果:本发明充分考虑谣言自身的特殊性、以及人们的心理因素,构建谣言的传播动力学模型。在构造社交影响力方面分别从用户自身、邻居节点和话题本身三个方面考虑,为节点间状态转变提供理论依据;其次引入演化博弈理论,以此来说明心理因素对用户行为的影响,最后,考虑到谣言信息的特殊性,将辟谣信息引入到传统的传染病模型中,构造出一种新的模型。从而揭示出谣言传播过程中的潜在机制,更加准确的分析谣言的传播规律。
附图说明
图1为本发明的基于演化博弈的微博谣言传播分析方法流程图;
图2为本发明的节点状态转换示意图;
图3为本发明的谣言传播动力学模型的框架图。
具体实施方式
为了更好的说明本发明的内容,以下参考说明书附图并举实施例的,对本发明的具体实施例作进一步的阐述。
本发明的一种基于演化博弈的微博谣言传播分析方法,如图1所示,包括以下步骤:
步骤101:构建微博数据信息数据库,抓取微博用户资料和数据资料,对抓取后的微博用户资料和数据资料进行数据预处理;利用网页数据抓取软件,在新浪微博平台上面,找到相关的数据进行抓取,并对所需数据进行预处理。
步骤102:提取所述微博用户资料和数据资料的相关属性,根据所述相关属性构建微博用户的社交影响力;分别从用户、关注者、信息本身三方面进行用户属性的提取,根据其属性的定义来构建社交影响力。
步骤103:根据演化博弈的理论和所述微博用户的社交影响力来定义各个节点的收益矩阵,以及各个节点的邻居节点中不同策略选择所占的比例,利用所述收益矩阵根据复制动态方程构建话题驱动力;具体包括:根据演化博弈的理论来定义各个节点的收益矩阵,以及各个节点的邻居节点中不同策略选择所占的比例,根据复制动态方程构建话题驱动力;首先,根据演化博弈的理论来定义各个节点的收益矩阵,以及各个节点的邻居节点中不同策略选择所占的比例,最后根据复制动态方程构建话题驱动力。
步骤104:构建谣言传播动力学模型,根据所述话题驱动力,根据谣言传播动力学模型对微博谣言传播过程进行分析;具体包括:利用演化博弈理论和节点间的影响力构造节点状态转换的概率,并将辟谣信息引入到传统的传染病模型中,构建一种改进的谣言传播动力学模型。
具体说明本发明的详细实施过程,包括如下:
构建微博数据信息数据库,通过网页数据抓取工具抓取微博用户资料和数据资料,并进行系列数据预处理操作。
优选的,通过网页数据抓取工具对指定网页的数据进行抓取,获得需要的数据。其过程为:先选定一条微博,然后选择转发用户中的一个用户作为起始用户,将其加入到待抓取的用户的队列中,每次从队列中选取一个用户,抓取其资料和发布的微博数据,然后抓取参与转发的下一个用户,如此循环下去,直到抓取完所有需要的数据。
优选的,评估微博用户的社交影响力,从用户本身和邻居节点以及微博本身热度三个方面进行评估:
(1)用户本身活跃度fuser(i)的度量;根据步骤101中抓取的数据通过用户本身的关注数以及转发和原创微博的数目衡量用户的活跃度。
fuser(i)=χjk,其中χj=ρ×Num[orig(i)]+Num[retw(i)],ρ∈[0,1]为弱化系数,Num[orig(i)]和Num[retw(i)]分别是用户i在话题发起前一个月的原创微博数量和转发微博数量;χk为用户i的关注者数量。
(2)邻居节点影响力fnei(i)的评估;在评估邻居节点影响力的过程中引入信息传播带动力,即邻居节点的原创和转发微博的参与量,包括评论数和转发数以及点赞数。同时将邻居节点的粉丝量作为一个影响力指标,从而来构成邻居节点的影响力。
Figure BDA0001558257010000091
其中χm为该用户的微博的平均参与度,χn为该用户的粉丝数目。
(3)微博热度finf(t)的计算。由于信息在传播的过程中,其热度会随着时间的推移而衰减,所以本发明中引入半衰期函数表示信息从发布到慢慢衰减直至死亡的过程。
Figure BDA0001558257010000092
其中t表示从话题发起到当前时候的时间,w为正则系数。
进一步的,根据演化博弈的理论来定义各个节点的收益矩阵,以及各个节点的邻居节点中不同策略选择所占的比例,根据复制动态方程构建话题驱动力包括:定义用户策略和收益矩阵,由复制动态方程,得出话题驱动力包括:
(1)定义用户策略和收益矩阵。在定义用户策略方面,本发明定义了两种策略:“传谣”和“辟谣”,“传谣”表示该用户相信谣言信息,“辟谣”表示该用户相信辟谣信息;收益矩阵如下:
Figure BDA0001558257010000093
其中a(t)=α×fuser+β×f1nei(i)×f1inf(t),b(t)=α×fuser+β×f2nei(i)×f2inf(t),α为节点受自身因素的比重,β为节点受自身因素和环境因素影响的比重,f1nei(i)表示谣言信息的邻居节点影响;f2nei(i)表示辟谣信息的邻居节点影响;f1inf(t)表示谣言信息的微博热度,f2inf(t)表示辟谣信息的微博热度。
(2)由复制动态方程,得出话题驱动力;
所述话题驱动力包括:
Figure BDA0001558257010000101
其中,k(t)=p1(t)×a(t)-p2(t)×b(t),k(t)表示复制动态方程;p1(t)为t时刻邻居节点中传谣节点的比例,p2(t)为t时刻用户邻居节点中辟谣节点的比例。
进一步的,构建谣言传播动力学模型,根据模型对微博谣言传播进行分析,其中,本发明的谣言传播动力学模型(简称SKIR模型);
(1)用户节点状态划分;根据谣言在传播过程中,微博用户对谣言的了解程度以及所采取的态度,将用户节点划分为四个状态;分别为易感状态 (Susceptible,S)、辟谣状态(Known,K)、传谣状态(Infected,I)、移除状态(Removed,R);
易感状态S:处于该状态的用户没有听过任何谣言。
辟谣状态K:处于该状态的用户表示已经知道谣言但不相信谣言并且传播了辟谣信息。
传谣状态I:处于该状态的用户已经知道了谣言并传播了谣言信息。
移除状态R:处于该状态的用户由于遗忘或者是对谣言及辟谣信息失去兴趣,不再受到其他节点影响,也不再传播谣言及辟谣信息。
(2)用户状态转换规则定义:
优选的,所述易感状态S向传谣状态I转换概率μ(t)与话题驱动力相同;易感状态S向传谣状态I转换概率μ(t)的计算公式如下:
Figure BDA0001558257010000102
其中k1(t)=p1(t)×a(t)-p2(t)×b(t),p1(t)为t时刻邻居节点中传谣节点的比例,p2(t)为t时刻用户邻居节点中辟谣节点的比例。
易感状态S向辟谣状态K转换概率λ(t)的计算公式如下:
Figure BDA0001558257010000111
其中k2(t)=p2(t)×b(t)-p1(t)×a(t),p1(t)为t时刻邻居节点中传谣节点的比例,p2(t)为t时刻用户邻居节点中辟谣节点的比例。
辟谣状态K、传谣状态I向移除状态R转换的概率为
Figure BDA0001558257010000112
假定对一条微博消息,同一个微博用户最多只能转载一次,即处于已知状态的节点在经过一定的时间步后,会由于遗忘或者失去兴趣而自动进入移除状态。
易感状态S向移除状态R转换的概率为γ。由于在社交网络中有些用户一早就知道谣言或者对谣言和辟谣都不感兴趣,所以即使知道了谣言却也不参与,所以就进入到了移除状态。
传谣状态I向辟谣状态K转换的概率为η。在社交网络难免会存在一些用户,开始不了解真相,或者受到邻居的影响传播谣言消息,后来才了解到事情真相,然后传播辟谣消息。本发明的传播辟谣消息的状态,更加符合微博谣言传播的真实情况。
(3)用户节点状态转换的假定:
本模型对用户状态转换做如下两点假设:
节点状态由易感状态S向辟谣状态K、传谣状态I的转换不能自发的进行,本模型认为需要接受到来自其他节点的谣言信息或者辟谣信息。
假定用户传播信息后,经过一段时间就会对该信息失去兴趣,从而成为移除者。
由于谣言传播具有爆发性、时长短的特点,认为在研究时间段内用户群体的粉丝增长和减少相互持平,所以本发明采用的模型认为参与传播的用户总数始终保持一个常数N。
(4)将辟谣信息引入到传统的传染病模型中,构造一种基于演化博弈和辟谣信息的谣言传播动力学模型。谣言传播动力学模型方程如下:
Figure BDA0001558257010000113
Figure BDA0001558257010000121
Figure BDA0001558257010000122
Figure BDA0001558257010000123
其中,所述用户节点状态包括:易感状态S、辟谣状态K、传谣状态I和移除状态R;
Figure BDA0001558257010000124
表示易感状态S的动态变化;
Figure BDA0001558257010000125
表示传谣状态I的动态变化,
Figure BDA0001558257010000126
表示辟谣状态K的动态变化,
Figure BDA0001558257010000127
表示移除状态的动态变化;μ表示易感状态S向辟谣状态K转移的概率,λ表示易感状态到感染状态的概率,γ表示易感状态S向移除状态R转换的概率,η表示感染状态I向辟谣状态K转移的概率,
Figure BDA0001558257010000128
表示辟谣状态K或传谣状态I向移除状态R的概率,I(t)表示用户在t时刻处于传谣的状态,S(t)表示用户在t时刻处于易感的状态,K(t)表示用户在t 时刻处于辟谣的状态。
本发明的一种用于实现一种基于演化博弈的微博谣言传播的分析的系统,包括:如图2所示为本发明的状态转移示意图,表明网络拓扑结构中各个节点,经过本发明模型处理后输出的是易感状态节点、传谣状态节点、辟谣状态节点、移除状态节点,以及各个节点之间的状态转移规律。
进一步的,如图3所示,根据信息本身特征、邻居节点属性以及用户个人属性得到了互斥的辟谣消息影响力和谣言消息影响力;其中,信息本身特征包括n个特征(特征1、特征2以及特征n等);邻居节点属性包括n个属性(属性1、属性2以及属性n等);用户个人属性包括n个属性(属性1、属性2以及属性n等);从而分别得到了辟谣消息影响力和谣言消息影响力,在结合各自的辟谣消息参与度和谣言消息参与度,得出转换概率,也即是易感状态S、辟谣状态K、移除状态R以及传谣状态I四个状态间相互转换的概率;从而结合SKIR 复杂网络谣言模型对谣言进行分析;图3中,μ表示易感状态S向辟谣状态K 转移的概率,λ表示易感状态到感染状态的概率,γ表示易感状态S向移除状态 R转换的概率,η表示感染状态I向辟谣状态K转移的概率,ψ表示辟谣状态K 或传谣状态I向移除状态R的概率;本发明的基于演化博弈的微博谣言传播分析系统包括:获取数据模块,提取数据属性模块,构建动态演化博弈模块,构建复杂网络谣言所述系统包括获取数据模块、提取数据属性模块、演化博弈模块、构建谣言信息传播模块,以及谣言分析模块;
所述获取数据模块用于抓取微博用户资料和数据资料;
所述提取数据属性模块用于提取所述微博用户资料和数据资料的相关属性;
所述演化博弈模块用于定义各个节点的收益矩阵以及构建话题驱动力;
所述构建谣言信息传播模块用于构建谣言传播动力学模型;
所述谣言分析模块用于分析谣言。
进一步的,所述获取数据模块用于抓取微博用户资料和数据资料包括:所述获取数据模块构建微博数据信息数据库,抓取微博用户资料和数据资料,并进行数据预处理操作具体包括:所述获取数据模块选定一条微博,选择所述微博的转发用户中的第一用户作为起始用户,将所述第一用户加入到待抓取的用户的队列中,每次所述待抓取的用户的队列选取一个用户,抓取其资料和发布的微博数据,抓取参与转发所述微博的下一个用户,如此循环下去,直到抓取完所有需要的数据。
进一步的,所述提取数据属性模块用于提取所述微博用户资料和数据资料的相关属性包括:所述提取数据属性模块分别从用户本身活跃度fuser(i)、邻居节点影响力fnei(i)以及微博热度finf(t)来进行用户属性的提取;所述提取数据属性模块根据所述用户属性的定义来构建社交影响力;
所述用户本身活跃度fuser(i)包括:根据所述步骤101中抓取的数据通过用户本身的关注数以及转发和原创微博的数目衡量用户的活跃度;
fuser(i)=χjk
其中,χj=ρ×Num[orig(i)]+Num[retw(i)],ρ∈[0,1]为弱化系数,Num[orig(i)]为用户i在话题发起前一个月的原创微博数量,Num[retw(i)]是用户i在话题发起前一个月的转发微博数量;χk为用户i的关注者数量;
所述邻居节点影响力fnei(i)包括:在评估邻居节点影响力的过程中引入信息传播带动力,即邻居节点的原创微博和转发微博的参与量,将邻居节点的粉丝量作为一个影响力指标,从而来构成邻居节点的影响力;
Figure BDA0001558257010000141
其中,χm为该用户的微博的平均参与度,χn为该用户的粉丝数目,所述参与量包括:评论数、转发数以及点赞数;
所述微博热度finf(t)包括:引入半衰期函数表示信息从发布到慢慢衰减直至死亡的过程;
Figure BDA0001558257010000142
其中,t表示从话题发起到当前时候的时间,w为正则系数。
进一步的,所述演化博弈模块用于定义各个节点的收益矩阵以及构建话题驱动力具体包括:所述演化博弈模块根据演化博弈的理论来定义各个节点的收益矩阵以及用户策略;根据复制动态方程得到话题驱动力,所述话题驱动力包括:
Figure BDA0001558257010000143
其中,k(t)=p1(t)×a(t)-p2(t)×b(t),k(t)表示复制动态方程;p1(t)为t时刻邻居节点中传谣节点的比例,p2(t)为t时刻用户邻居节点中辟谣节点的比例。
进一步的,所述构建谣言信息传播模块用于构建谣言传播动力学模型包括:所述构建谣言信息模块划分用户节点状态,定义用户状态转换规则,对所述用户节点状态转换做出假定,将辟谣信息引入到传统的传染病模型中,构造一种谣言传播动力学模型,所述谣言分析模块根据所述构建谣言信息模块所构建的谣言传播动力学模型对谣言信息进行分析;所述动力学模型方程包括:
Figure BDA0001558257010000151
Figure BDA0001558257010000152
Figure BDA0001558257010000153
Figure BDA0001558257010000154
其中,所述用户节点状态包括:易感状态S、辟谣状态K、传谣状态I和移除状态R;
Figure BDA0001558257010000155
表示易感状态S的动态变化;
Figure BDA0001558257010000156
表示传谣状态I的动态变化,
Figure BDA0001558257010000157
表示辟谣状态K的动态变化,
Figure BDA0001558257010000158
表示移除状态的动态变化;μ表示易感状态S向辟谣状态K转移的概率,λ表示易感状态到感染状态的概率,γ表示易感状态S向移除状态R转换的概率,η表示感染状态I向辟谣状态K转移的概率,
Figure BDA0001558257010000159
表示辟谣状态K或传谣状态I向移除状态R的概率,I(t)表示用户在t时刻处于传谣的状态,S(t)表示用户在t时刻处于易感的状态,K(t)表示用户在t 时刻处于辟谣的状态。
本发明提出一种能够比较完整、真实的模拟现实世界中微博谣言的传播过程的分析方法。为了对微博谣言传播情况进行更好的分析,本发明在构建社交影响力的时候,从用户节点本身的活跃度、邻居节点的影响力以及信息本身热度三个方面考虑;其次,考虑到谣言传播过程中用户的从众和利弊权衡心理,以及遗忘规律等心理因素,利用演化博弈理论构建节点间状态转变规律;最后,兼顾谣言信息本身的特殊性,将辟谣信息引入到传统的SIR传染病模型中,提出一种SKIR微博谣言传播动力学模型,从而实现对真实世界中微博谣言传播过程的分析。
所应理解的是,本发明一种基于演化博弈的微博谣言传播的分析方法与用于实现基于演化博弈的微博谣言传播的分析的系统是同一构思的不同实现方式,系统实施例未描述部分可以参考方法实施例相应部分的描述,反之亦然。
应当指出上述具体的实施例,可以使本领域的技术人员和读者更全面地理解本发明创造的实施方法,应该被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。因此,尽管本发明说明书参照附图和实施例对本发明创造已进行了详细的说明,但是,本领域的技术人员应当理解,仍然可以对本发明创造进行修改或者等同替换,总之,一切不脱离本发明创造的精神和范围的技术方案及其改进,其均应涵盖在本发明创造专利的保护范围中。

Claims (8)

1.一种基于演化博弈的微博谣言传播的分析方法,其特征在于,包括以下几个步骤:
步骤1、构建微博数据信息数据库,抓取微博用户资料和数据资料,对抓取后的微博用户资料和数据资料进行数据预处理;
步骤2、提取微博用户资料和数据资料的相关属性,根据所述相关属性构建微博用户的社交影响力;
步骤3、根据演化博弈的理论和所述微博用户的社交影响力来定义各个节点的收益矩阵;利用所述收益矩阵根据复制动态方程构建话题驱动力;
步骤4、根据所述话题驱动力,构建谣言传播动力学模型,根据谣言传播动力学模型对微博谣言传播过程进行分析;
所述谣言传播动力学模型方程表示为:
Figure FDA0003288030610000011
Figure FDA0003288030610000012
Figure FDA0003288030610000013
Figure FDA0003288030610000014
其中,所述用户节点状态包括:易感状态S、辟谣状态K、传谣状态I和移除状态R;
Figure FDA0003288030610000015
表示易感状态S的动态变化;
Figure FDA0003288030610000016
表示传谣状态I的动态变化,
Figure FDA0003288030610000017
表示辟谣状态K的动态变化,
Figure FDA0003288030610000018
表示移除状态R的动态变化;μ表示易感状态S向辟谣状态K转移的概率也即是话题驱动力,λ表示易感状态到感染状态的概率,γ表示易感状态S向移除状态R转换的概率,η表示感染状态I向辟谣状态K转移的概率,
Figure FDA0003288030610000021
表示辟谣状态K或传谣状态I向移除状态R的概率,I(t)表示用户在t时刻处于传谣的状态,S(t)表示用户在t时刻处于易感的状态,K(t)表示用户在t时刻处于辟谣的状态。
2.根据权利要求1所述的一种基于演化博弈的微博谣言传播的分析方法,其特征在于,所述构建微博数据信息数据库,抓取微博用户资料和数据资料,对抓取后的微博用户资料和数据资料进行数据预处理包括:选定一条微博,选择所述微博的转发用户中的第一用户作为起始用户,将所述第一用户加入到待抓取的用户的队列中,从所述待抓取的用户的队列中选取一个用户,抓取其资料和发布的微博数据,然后抓取参与转发所述微博的下一个用户,如此循环下去,直到抓取完所有需要的数据。
3.根据权利要求1所述的一种基于演化博弈的微博谣言传播的分析方法,其特征在于,步骤2中所述用户属性的提取方法为:从用户本身活跃度fuser(i)、邻居节点影响力fnei(i)以及微博热度finf(t)来提取用户属性。
4.根据权利要求3所述的一种基于演化博弈的微博谣言传播的分析方法,其特征在于,
所述用户本身活跃度fuser(i)包括:根据所述步骤101中抓取的数据通过用户本身的关注数以及转发和原创微博的数目衡量用户的活跃度;
fuser(i)=χjk
其中,χj=ρ×Num[orig(i)]+Num[retw(i)],ρ∈[0,1]为弱化系数,Num[orig(i)]为用户i在话题发起前一个月的原创微博数量,Num[retw(i)]是用户i在话题发起前一个月的转发微博数量;χk为用户i的关注者数量;
所述邻居节点影响力fnei(i)包括:在评估邻居节点影响力的过程中引入信息传播带动力,即邻居节点的原创微博和转发微博的参与量,将邻居节点的粉丝量作为一个影响力指标,从而来构成邻居节点的影响力;
Figure FDA0003288030610000022
其中,χm为该用户的微博的平均参与度,χn为该用户的粉丝数目,所述参与量包括:评论数、转发数以及点赞数;
所述微博热度finf(t)包括:引入半衰期函数表示信息从发布到慢慢衰减直至死亡的过程;
Figure FDA0003288030610000031
其中,t表示从话题发起到当前时候的时间,w为正则系数。
5.根据权利要求4所述的一种基于演化博弈的微博谣言传播的分析方法,其特征在于,步骤3中所述的用户策略包括:“传谣”和“辟谣”,“传谣”表示用户相信谣言信息,“辟谣”表示用户相信辟谣信息。
6.根据权利要求5所述的一种基于演化博弈的微博谣言传播的分析方法,其特征在于,步骤3中所述的收益矩阵如下:
Figure FDA0003288030610000032
其中,a(t)=α×fuser+β×f1nei(i)×f1inf(t),b(t)=α×fuser+β×f2nei(i)×f2inf(t),a(t)表示用户传谣的收益,b(t)表示用户辟谣的收益;α为节点受自身因素的比重,β为节点受自身因素和环境因素影响的比重;f1nei(i)表示谣言信息的邻居节点影响;f2nei(i)表示辟谣信息的邻居节点影响;f1inf(t)表示谣言信息的微博热度,f2inf(t)表示辟谣信息的微博热度。
7.根据权利要求6所述的一种基于演化博弈的微博谣言传播的分析方法,其特征在于,步骤3中所述话题驱动力包括:
Figure FDA0003288030610000033
其中,k(t)=p1(t)×a(t)-p2(t)×b(t),k(t)表示复制动态方程;p1(t)为t时刻邻居节点中传谣节点的比例,p2(t)为t时刻用户邻居节点中辟谣节点的比例。
8.一种用于实现权利要求1-7任一所述的一种基于演化博弈的微博谣言传播的分析的系统,其特征在于,所述系统包括获取数据模块、提取数据属性模块、演化博弈模块、构建谣言信息传播模块,以及谣言分析模块;
所述获取数据模块用于抓取微博用户资料和数据资料;
所述提取数据属性模块用于提取所述微博用户资料和数据资料的相关属性;
所述演化博弈模块用于定义各个节点的收益矩阵以及构建话题驱动力;
所述构建谣言信息传播模块用于构建谣言传播动力学模型;
所述谣言分析模块用于分析谣言。
CN201810071416.0A 2018-01-25 2018-01-25 基于演化博弈的微博谣言传播的分析方法与系统 Active CN108304521B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810071416.0A CN108304521B (zh) 2018-01-25 2018-01-25 基于演化博弈的微博谣言传播的分析方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810071416.0A CN108304521B (zh) 2018-01-25 2018-01-25 基于演化博弈的微博谣言传播的分析方法与系统

Publications (2)

Publication Number Publication Date
CN108304521A CN108304521A (zh) 2018-07-20
CN108304521B true CN108304521B (zh) 2021-11-16

Family

ID=62866567

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810071416.0A Active CN108304521B (zh) 2018-01-25 2018-01-25 基于演化博弈的微博谣言传播的分析方法与系统

Country Status (1)

Country Link
CN (1) CN108304521B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109829112B (zh) * 2019-01-31 2023-11-14 平安科技(深圳)有限公司 基于大数据的裂变话题跟踪方法、装置和计算机设备
CN110519083B (zh) * 2019-08-06 2021-09-24 电子科技大学 基于演化博弈论的混合策略异构社交网络信息扩散分析
CN110795641B (zh) * 2019-11-05 2022-09-27 重庆邮电大学 基于表示学习的网络谣言传播控制方法
CN110807556B (zh) * 2019-11-05 2022-05-31 重庆邮电大学 对微博谣言或/和辟谣话题传播趋势的预测方法及装置
CN110781411B (zh) * 2019-11-05 2022-06-28 重庆邮电大学 一种基于辟谣消息的谣言传播控制方法
CN110851736B (zh) * 2019-11-11 2022-07-01 重庆邮电大学 一种基于三方动态博弈的谣言传播控制方法
CN112269945B (zh) * 2020-11-03 2022-10-18 重庆邮电大学 基于谣言辟谣促谣和三方认知博弈的信息传播预测方法
CN112396150B (zh) * 2020-11-09 2023-09-26 江汉大学 谣言事件的分析方法、装置、设备及计算机可读存储介质
CN112396151B (zh) * 2020-11-09 2023-09-26 江汉大学 谣言事件的分析方法、装置、设备及计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104091206A (zh) * 2014-06-18 2014-10-08 北京邮电大学 基于演化博弈论的社交网络信息传播预测方法
CN104133897A (zh) * 2014-08-01 2014-11-05 哈尔滨工程大学 一种基于话题影响力的微博话题溯源方法
CN106126700A (zh) * 2016-07-01 2016-11-16 复旦大学 一种微博谣言传播的分析方法
CN106682991A (zh) * 2016-12-21 2017-05-17 重庆邮电大学 一种基于在线社交网络的信息传播模型及其传播方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104091206A (zh) * 2014-06-18 2014-10-08 北京邮电大学 基于演化博弈论的社交网络信息传播预测方法
CN104133897A (zh) * 2014-08-01 2014-11-05 哈尔滨工程大学 一种基于话题影响力的微博话题溯源方法
CN106126700A (zh) * 2016-07-01 2016-11-16 复旦大学 一种微博谣言传播的分析方法
CN106682991A (zh) * 2016-12-21 2017-05-17 重庆邮电大学 一种基于在线社交网络的信息传播模型及其传播方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
熟悉机制、媒体及辟谣者对谣言传播影响的研究;陈超;《中国优秀硕士学位论文全文数据库信息科技辑》;20180115;论文第5节 *

Also Published As

Publication number Publication date
CN108304521A (zh) 2018-07-20

Similar Documents

Publication Publication Date Title
CN108304521B (zh) 基于演化博弈的微博谣言传播的分析方法与系统
CN106651030B (zh) 一种改进的rbf神经网络热点话题用户参与行为预测方法
CN106126700B (zh) 一种微博谣言传播的分析方法
CN105809554B (zh) 一种社交网络中用户参与热点话题的预测方法
CN110825948B (zh) 基于促谣-辟谣消息和表示学习的谣言传播控制方法
Dong et al. Studies on the population dynamics of a rumor-spreading model in online social networks
CN103793489B (zh) 一种在线社交网络中社群话题的发现方法
CN105095419B (zh) 一种面向微博特定类型用户的信息影响力最大化方法
CN108776844A (zh) 基于上下文感知张量分解的社交网络用户行为预测方法
CN108230169B (zh) 基于社交影响力的信息传播模型及态势感知系统及方法
CN108153884B (zh) 一种微博谣言传播的分析方法
CN110851736B (zh) 一种基于三方动态博弈的谣言传播控制方法
CN111222029A (zh) 一种网络舆情信息传播中关键节点选择方法
CN113254719B (zh) 一种基于地位理论的在线社交网络信息传播方法
CN109829114A (zh) 一种基于用户行为的话题流行度预测系统及方法
CN110825980A (zh) 一种基于对抗生成网络的微博话题推送方法
CN116228449A (zh) 一种基于演化博弈的分析在线社交网络信息传播动力学的方法
Yao et al. An interactive propagation model of multiple information in complex networks
CN109816544B (zh) 基于接触概率的信息传播模型实现方法及装置
CN103488885B (zh) 基于mmsb的微博网络用户行为分析方法
CN108520337B (zh) 一种基于网络风险熵差的谣言风险评估方法
CN111414552B (zh) 一种在线社交网络谣言传播范围的估计方法
Tang et al. A dynamic microblog network and information dissemination in “@” mode
Tang et al. Rumor diffusion in an interests-based dynamic social network
CN114298009A (zh) 混合信息传播动力学模型及其信息传播分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant