CN108304521A - 基于演化博弈的微博谣言传播的分析方法与系统 - Google Patents
基于演化博弈的微博谣言传播的分析方法与系统 Download PDFInfo
- Publication number
- CN108304521A CN108304521A CN201810071416.0A CN201810071416A CN108304521A CN 108304521 A CN108304521 A CN 108304521A CN 201810071416 A CN201810071416 A CN 201810071416A CN 108304521 A CN108304521 A CN 108304521A
- Authority
- CN
- China
- Prior art keywords
- rumour
- user
- microblogging
- data
- state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 38
- 239000011159 matrix material Substances 0.000 claims abstract description 19
- 238000000034 method Methods 0.000 claims abstract description 15
- 230000008569 process Effects 0.000 claims abstract description 11
- 206010070834 Sensitisation Diseases 0.000 claims description 33
- 230000008313 sensitization Effects 0.000 claims description 33
- 230000007480 spreading Effects 0.000 claims description 30
- 230000008859 change Effects 0.000 claims description 18
- 238000000605 extraction Methods 0.000 claims description 15
- 208000015181 infectious disease Diseases 0.000 claims description 12
- 244000046052 Phaseolus vulgaris Species 0.000 claims description 11
- 235000010627 Phaseolus vulgaris Nutrition 0.000 claims description 11
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 claims description 9
- 230000000694 effects Effects 0.000 claims description 5
- 230000006870 function Effects 0.000 claims description 5
- 210000003813 thumb Anatomy 0.000 claims description 5
- 230000003313 weakening effect Effects 0.000 claims description 4
- 230000007613 environmental effect Effects 0.000 claims description 3
- 101100257011 Mus musculus Skil gene Proteins 0.000 abstract description 4
- 238000007418 data mining Methods 0.000 abstract description 2
- 238000012546 transfer Methods 0.000 description 5
- 230000007704 transition Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 230000006854 communication Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 208000035473 Communicable disease Diseases 0.000 description 1
- 244000097202 Rathbunia alamosensis Species 0.000 description 1
- 235000009776 Rathbunia alamosensis Nutrition 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005553 drilling Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000001394 metastastic effect Effects 0.000 description 1
- 206010061289 metastatic neoplasm Diseases 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000007430 reference method Methods 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 230000031068 symbiosis, encompassing mutualism through parasitism Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于社交网络建模与数据挖掘领域,具体涉及到一种基于演化博弈的微博谣言传播的分析方法与系统;所述方法包括:构建微博数据信息数据库,抓取微博用户资料和数据资料,进行数据预处理;提取所述微博用户资料和数据资料的相关属性;根据演化博弈的理论来定义各个节点的收益矩阵,以及各个节点的邻居节点中不同策略选择所占的比例,根据复制动态方程构建话题驱动力;构建谣言传播动力学模型。本发明通过兼顾谣言信息本身的特殊性,将辟谣信息引入到传统的SIR模型中,提出一种SKIR微博谣言传播动力学模型,从而实现对真实世界中微博谣言传播过程的分析。
Description
技术领域
本发明属于社交网络建模与数据挖掘领域,具体涉及到一种基于演化博弈的微博谣言传播的分析方法与系统。
背景技术
微博作为当前最热门的社交网络平台之一,是人们获取和分享信息的重要场所,其在为人们提供方便的同时,也成为了众多网络谣言滋生的乐土。微博庞大的用户群体,使得谣言的传播速度和范围都得到了前所未有的提升,给社会的和谐安定造成了严重的威胁。研究微博谣言传播问题对于理解、预测和疏导舆情有着重要的理论和现实意义,正引起各国政府和社会的广泛关注和重视。
目前,常见的微博谣言传播分析都是通过构建微博谣言传播模型实现的。现有的谣言传播模型虽然在一定程度上可以刻画谣言传播过程中各阶段所呈现的特征,但是由于缺乏完整的谣言传播动力学机制分析,受限于简单的参数设定,未曾考虑到谣言信息本身的特殊性—谣言和辟谣信息的共生性,以及人们的从众心理以及利弊权衡心理,节点间的规则也较为简单,最终导致所构建的模型无法完整、真实的模拟现实世界中微博谣言的传播过程。由此,这些模型对真实世界的谣言传播状况的分析与真实微博谣言情况还存在差距。对比文件 CN106126700A一种微博谣言传播的分析方法所采用的UASR微博谣言传播模型,能够对微博谣言传播进行有效的分析,但该模型仅考虑了谣言单条信息的影响因素,而忽略了辟谣消息对谣言传播的影响,同时还忽略了用户在面对选择时的趋利性心理和从众心理。
发明内容
为实现以上发明目的,本发明提出了一种基于演化博弈论的谣言传播分析方法与系统,
所述具体包括以下四个步骤:
步骤1、构建微博数据信息数据库,抓取微博用户资料和数据资料,对抓取后的微博用户资料和数据资料进行数据预处理;
步骤2、提取微博用户资料和数据资料的相关属性,根据所述相关属性构建微博用户的社交影响力;
步骤3、根据演化博弈的理论和所述微博用户的社交影响力来定义各个节点的收益矩阵;利用所述收益矩阵根据复制动态方程构建话题驱动力;
步骤4、根据所述话题驱动力,构建谣言传播动力学模型,根据谣言传播动力学模型对微博谣言传播过程进行分析。
进一步的,所述构建微博数据信息数据库,抓取微博用户资料和数据资料,对抓取后的微博用户资料和数据资料进行数据预处理包括:选定一条微博,选择所述微博的转发用户中的第一用户作为起始用户,将所述第一用户加入到待抓取的用户的队列中,从所述待抓取的用户的队列中选取一个用户,抓取其资料和发布的微博数据,然后抓取参与转发所述微博的下一个用户,如此循环下去,直到抓取完所有需要的数据。
进一步的,步骤2中所述用户属性的提取方法为:从用户本身活跃度fuser(i)、邻居节点影响力fnei(i)以及微博热度finf(t)来提取用户属性。
进一步的,所述用户本身活跃度fuser(i)包括:根据所述步骤101中抓取的数据通过用户本身的关注数以及转发和原创微博的数目衡量用户的活跃度;
fuser(i)=χj+χk
其中,χj=ρ×Num[orig(i)]+Num[retw(i)],ρ∈[0,1]为弱化系数,Num[orig(i)]为用户i在话题发起前一个月的原创微博数量,Num[retw(i)]是用户i在话题发起前一个月的转发微博数量;χk为用户i的关注者数量;
所述邻居节点影响力fnei(i)包括:在评估邻居节点影响力的过程中引入信息传播带动力,即邻居节点的原创微博和转发微博的参与量,将邻居节点的粉丝量作为一个影响力指标,从而来构成邻居节点的影响力;
其中,χm为该用户的微博的平均参与度,χn为该用户的粉丝数目,所述参与量包括:评论数、转发数以及点赞数;
所述微博热度finf(t)包括:引入半衰期函数表示信息从发布到慢慢衰减直至死亡的过程;
其中,t表示从话题发起到当前时候的时间,w为正则系数。
进一步的,步骤3中所述的用户策略包括:“传谣”和“辟谣”,“传谣”表示用户相信谣言信息,“辟谣”表示用户相信辟谣信息。
进一步的,步骤3中所述的收益矩阵如下:
其中,a(t)=α×fuser+β×f1nei(i)×f1inf(t),b(t)=α×fuser+β×f2nei(i)×f2inf(t),a(t)表示用户传谣的收益,b(t)表示用户辟谣的收益;α为节点受自身因素的比重,β为节点受自身因素和环境因素影响的比重,f1nei(i)表示谣言信息的邻居节点影响;f2nei(i)表示辟谣信息的邻居节点影响;f1inf(t)表示谣言信息的微博热度, f2inf(t)表示辟谣信息的微博热度。
进一步的,步骤3中所述话题驱动力包括:
其中,k(t)=p1(t)×a(t)-p2(t)×b(t),k(t)表示复制动态方程;p1(t)为t时刻邻居节点中传谣节点的比例,p2(t)为t时刻用户邻居节点中辟谣节点的比例。
进一步的,步骤4中所述谣言传播动力学模型方程包括:
其中,所述用户节点状态包括:易感状态S、辟谣状态K、传谣状态I和移除状态R;表示易感状态S的动态变化;表示传谣状态I的动态变化,表示辟谣状态K的动态变化,表示移除状态的动态变化;μ表示易感状态S向辟谣状态K转移的概率也即是话题驱动力,λ表示易感状态到感染状态的概率,γ表示易感状态S向移除状态R转换的概率,η表示感染状态I向辟谣状态K转移的概率,表示辟谣状态K或传谣状态I向移除状态R的概率,I(t) 表示用户在t时刻处于传谣的状态,S(t)表示用户在t时刻处于易感的状态,K(t) 表示用户在t时刻处于辟谣的状态。
优选的,本发明还提出的了一种用于实现一种基于演化博弈的微博谣言传播的分析的系统:
所述系统包括获取数据模块、提取数据属性模块、演化博弈模块、构建谣言信息传播模块,以及谣言分析模块;
所述获取数据模块用于抓取微博用户资料和数据资料;
所述提取数据属性模块用于提取所述微博用户资料和数据资料的相关属性;
所述演化博弈模块用于定义各个节点的收益矩阵以及构建话题驱动力;
所述构建谣言信息传播模块用于构建谣言传播动力学模型;
所述谣言分析模块用于分析谣言。
进一步的,所述获取数据模块用于抓取微博用户资料和数据资料包括:所述获取数据模块构建微博数据信息数据库,抓取微博用户资料和数据资料,并进行数据预处理操作具体包括:所述获取数据模块选定一条微博,选择所述微博的转发用户中的第一用户作为起始用户,将所述第一用户加入到待抓取的用户的队列中,每次所述待抓取的用户的队列选取一个用户,抓取其资料和发布的微博数据,抓取参与转发所述微博的下一个用户,如此循环下去,直到抓取完所有需要的数据。
进一步的,所述提取数据属性模块用于提取所述微博用户资料和数据资料的相关属性包括:所述提取数据属性模块分别从用户本身活跃度fuser(i)、邻居节点影响力fnei(i)以及微博热度finf(t)来进行用户属性的提取;所述提取数据属性模块根据所述用户属性的定义来构建社交影响力;
所述用户本身活跃度fuser(i)包括:根据所述步骤1中抓取的数据通过用户本身的关注数以及转发和原创微博的数目衡量用户的活跃度;
fuser(i)=χj+χk
其中,χj=ρ×Num[orig(i)]+Num[retw(i)],ρ∈[0,1]为弱化系数,Num[orig(i)]为用户i在话题发起前一个月的原创微博数量,Num[retw(i)]是用户i在话题发起前一个月的转发微博数量;χk为用户i的关注者数量;
所述邻居节点影响力fnei(i)包括:在评估邻居节点影响力的过程中引入信息传播带动力,即邻居节点的原创微博和转发微博的参与量,将邻居节点的粉丝量作为一个影响力指标,从而来构成邻居节点的影响力;
其中,χm为该用户的微博的平均参与度,χn为该用户的粉丝数目,所述参与量包括:评论数、转发数以及点赞数;
所述微博热度finf(t)包括:引入半衰期函数表示信息从发布到慢慢衰减直至死亡的过程;
其中,t表示从话题发起到当前时候的时间,w为正则系数。
进一步的,所述演化博弈模块用于定义各个节点的收益矩阵以及构建话题驱动力具体包括:所述演化博弈模块根据演化博弈的理论来定义各个节点的收益矩阵以及用户策略;根据复制动态方程得到话题驱动力,所述话题驱动力包括:
其中,k(t)=p1(t)×a(t)-p2(t)×b(t),k(t)表示复制动态方程;p1(t)为t时刻邻居节点中传谣节点的比例,p2(t)为t时刻用户邻居节点中辟谣节点的比例。。
进一步的,所述构建谣言信息传播模块用于构建谣言传播动力学模型包括:所述构建谣言信息模块划分用户节点状态,定义用户状态转换规则,对所述用户节点状态转换做出假定,将辟谣信息引入到传统的传染病模型中,构造一种谣言传播动力学模型,所述谣言分析模块根据所述构建谣言信息模块所构建的谣言传播动力学模型对谣言信息进行分析;所述动力学模型方程包括:
其中,所述用户节点状态包括:易感状态S、辟谣状态K、传谣状态I和移除状态R;表示易感状态S的动态变化;表示传谣状态I的动态变化,表示辟谣状态K的动态变化,表示移除状态的动态变化;μ表示易感状态S向辟谣状态K转移的概率,λ表示易感状态到感染状态的概率,γ表示易感状态S向移除状态R转换的概率,η表示感染状态I向辟谣状态K转移的概率,表示辟谣状态K或传谣状态I向移除状态R的概率,I(t)表示用户在t时刻处于传谣的状态,S(t)表示用户在t时刻处于易感的状态,K(t)表示用户在t 时刻处于辟谣的状态。
本发明的有益效果:本发明充分考虑谣言自身的特殊性、以及人们的心理因素,构建谣言的传播动力学模型。在构造社交影响力方面分别从用户自身、邻居节点和话题本身三个方面考虑,为节点间状态转变提供理论依据;其次引入演化博弈理论,以此来说明心理因素对用户行为的影响,最后,考虑到谣言信息的特殊性,将辟谣信息引入到传统的传染病模型中,构造出一种新的模型。从而揭示出谣言传播过程中的潜在机制,更加准确的分析谣言的传播规律。
附图说明
图1为本发明的基于演化博弈的微博谣言传播分析方法流程图;
图2为本发明的节点状态转换示意图;
图3为本发明的谣言传播动力学模型的框架图。
具体实施方式
为了更好的说明本发明的内容,以下参考说明书附图并举实施例的,对本发明的具体实施例作进一步的阐述。
本发明的一种基于演化博弈的微博谣言传播分析方法,如图1所示,包括以下步骤:
步骤101:构建微博数据信息数据库,抓取微博用户资料和数据资料,对抓取后的微博用户资料和数据资料进行数据预处理;利用网页数据抓取软件,在新浪微博平台上面,找到相关的数据进行抓取,并对所需数据进行预处理。
步骤102:提取所述微博用户资料和数据资料的相关属性,根据所述相关属性构建微博用户的社交影响力;分别从用户、关注者、信息本身三方面进行用户属性的提取,根据其属性的定义来构建社交影响力。
步骤103:根据演化博弈的理论和所述微博用户的社交影响力来定义各个节点的收益矩阵,以及各个节点的邻居节点中不同策略选择所占的比例,利用所述收益矩阵根据复制动态方程构建话题驱动力;具体包括:根据演化博弈的理论来定义各个节点的收益矩阵,以及各个节点的邻居节点中不同策略选择所占的比例,根据复制动态方程构建话题驱动力;首先,根据演化博弈的理论来定义各个节点的收益矩阵,以及各个节点的邻居节点中不同策略选择所占的比例,最后根据复制动态方程构建话题驱动力。
步骤104:构建谣言传播动力学模型,根据所述话题驱动力,根据谣言传播动力学模型对微博谣言传播过程进行分析;具体包括:利用演化博弈理论和节点间的影响力构造节点状态转换的概率,并将辟谣信息引入到传统的传染病模型中,构建一种改进的谣言传播动力学模型。
具体说明本发明的详细实施过程,包括如下:
构建微博数据信息数据库,通过网页数据抓取工具抓取微博用户资料和数据资料,并进行系列数据预处理操作。
优选的,通过网页数据抓取工具对指定网页的数据进行抓取,获得需要的数据。其过程为:先选定一条微博,然后选择转发用户中的一个用户作为起始用户,将其加入到待抓取的用户的队列中,每次从队列中选取一个用户,抓取其资料和发布的微博数据,然后抓取参与转发的下一个用户,如此循环下去,直到抓取完所有需要的数据。
优选的,评估微博用户的社交影响力,从用户本身和邻居节点以及微博本身热度三个方面进行评估:
(1)用户本身活跃度fuser(i)的度量;根据步骤101中抓取的数据通过用户本身的关注数以及转发和原创微博的数目衡量用户的活跃度。
fuser(i)=χj+χk,其中χj=ρ×Num[orig(i)]+Num[retw(i)],ρ∈[0,1]为弱化系数,Num[orig(i)]和Num[retw(i)]分别是用户i在话题发起前一个月的原创微博数量和转发微博数量;χk为用户i的关注者数量。
(2)邻居节点影响力fnei(i)的评估;在评估邻居节点影响力的过程中引入信息传播带动力,即邻居节点的原创和转发微博的参与量,包括评论数和转发数以及点赞数。同时将邻居节点的粉丝量作为一个影响力指标,从而来构成邻居节点的影响力。
其中χm为该用户的微博的平均参与度,χn为该用户的粉丝数目。
(3)微博热度finf(t)的计算。由于信息在传播的过程中,其热度会随着时间的推移而衰减,所以本发明中引入半衰期函数表示信息从发布到慢慢衰减直至死亡的过程。
其中t表示从话题发起到当前时候的时间,w为正则系数。
进一步的,根据演化博弈的理论来定义各个节点的收益矩阵,以及各个节点的邻居节点中不同策略选择所占的比例,根据复制动态方程构建话题驱动力包括:定义用户策略和收益矩阵,由复制动态方程,得出话题驱动力包括:
(1)定义用户策略和收益矩阵。在定义用户策略方面,本发明定义了两种策略:“传谣”和“辟谣”,“传谣”表示该用户相信谣言信息,“辟谣”表示该用户相信辟谣信息;收益矩阵如下:
其中a(t)=α×fuser+β×f1nei(i)×f1inf(t),b(t)=α×fuser+β×f2nei(i)×f2inf(t),α为节点受自身因素的比重,β为节点受自身因素和环境因素影响的比重,f1nei(i)表示谣言信息的邻居节点影响;f2nei(i)表示辟谣信息的邻居节点影响;f1inf(t)表示谣言信息的微博热度,f2inf(t)表示辟谣信息的微博热度。
(2)由复制动态方程,得出话题驱动力;
所述话题驱动力包括:
其中,k(t)=p1(t)×a(t)-p2(t)×b(t),k(t)表示复制动态方程;p1(t)为t时刻邻居节点中传谣节点的比例,p2(t)为t时刻用户邻居节点中辟谣节点的比例。
进一步的,构建谣言传播动力学模型,根据模型对微博谣言传播进行分析,其中,本发明的谣言传播动力学模型(简称SKIR模型);
(1)用户节点状态划分;根据谣言在传播过程中,微博用户对谣言的了解程度以及所采取的态度,将用户节点划分为四个状态;分别为易感状态 (Susceptible,S)、辟谣状态(Known,K)、传谣状态(Infected,I)、移除状态(Removed,R);
易感状态S:处于该状态的用户没有听过任何谣言。
辟谣状态K:处于该状态的用户表示已经知道谣言但不相信谣言并且传播了辟谣信息。
传谣状态I:处于该状态的用户已经知道了谣言并传播了谣言信息。
移除状态R:处于该状态的用户由于遗忘或者是对谣言及辟谣信息失去兴趣,不再受到其他节点影响,也不再传播谣言及辟谣信息。
(2)用户状态转换规则定义:
优选的,所述易感状态S向传谣状态I转换概率μ(t)与话题驱动力相同;易感状态S向传谣状态I转换概率μ(t)的计算公式如下:
其中k1(t)=p1(t)×a(t)-p2(t)×b(t),p1(t)为t时刻邻居节点中传谣节点的比例,p2(t)为t时刻用户邻居节点中辟谣节点的比例。
易感状态S向辟谣状态K转换概率λ(t)的计算公式如下:
其中k2(t)=p2(t)×b(t)-p1(t)×a(t),p1(t)为t时刻邻居节点中传谣节点的比例,p2(t)为t时刻用户邻居节点中辟谣节点的比例。
辟谣状态K、传谣状态I向移除状态R转换的概率为假定对一条微博消息,同一个微博用户最多只能转载一次,即处于已知状态的节点在经过一定的时间步后,会由于遗忘或者失去兴趣而自动进入移除状态。
易感状态S向移除状态R转换的概率为γ。由于在社交网络中有些用户一早就知道谣言或者对谣言和辟谣都不感兴趣,所以即使知道了谣言却也不参与,所以就进入到了移除状态。
传谣状态I向辟谣状态K转换的概率为η。在社交网络难免会存在一些用户,开始不了解真相,或者受到邻居的影响传播谣言消息,后来才了解到事情真相,然后传播辟谣消息。本发明的传播辟谣消息的状态,更加符合微博谣言传播的真实情况。
(3)用户节点状态转换的假定:
本模型对用户状态转换做如下两点假设:
节点状态由易感状态S向辟谣状态K、传谣状态I的转换不能自发的进行,本模型认为需要接受到来自其他节点的谣言信息或者辟谣信息。
假定用户传播信息后,经过一段时间就会对该信息失去兴趣,从而成为移除者。
由于谣言传播具有爆发性、时长短的特点,认为在研究时间段内用户群体的粉丝增长和减少相互持平,所以本发明采用的模型认为参与传播的用户总数始终保持一个常数N。
(4)将辟谣信息引入到传统的传染病模型中,构造一种基于演化博弈和辟谣信息的谣言传播动力学模型。谣言传播动力学模型方程如下:
其中,所述用户节点状态包括:易感状态S、辟谣状态K、传谣状态I和移除状态R;表示易感状态S的动态变化;表示传谣状态I的动态变化,表示辟谣状态K的动态变化,表示移除状态的动态变化;μ表示易感状态S向辟谣状态K转移的概率,λ表示易感状态到感染状态的概率,γ表示易感状态S向移除状态R转换的概率,η表示感染状态I向辟谣状态K转移的概率,表示辟谣状态K或传谣状态I向移除状态R的概率,I(t)表示用户在t时刻处于传谣的状态,S(t)表示用户在t时刻处于易感的状态,K(t)表示用户在t 时刻处于辟谣的状态。
本发明的一种用于实现一种基于演化博弈的微博谣言传播的分析的系统,包括:如图2所示为本发明的状态转移示意图,表明网络拓扑结构中各个节点,经过本发明模型处理后输出的是易感状态节点、传谣状态节点、辟谣状态节点、移除状态节点,以及各个节点之间的状态转移规律。
进一步的,如图3所示,根据信息本身特征、邻居节点属性以及用户个人属性得到了互斥的辟谣消息影响力和谣言消息影响力;其中,信息本身特征包括n个特征(特征1、特征2以及特征n等);邻居节点属性包括n个属性(属性1、属性2以及属性n等);用户个人属性包括n个属性(属性1、属性2以及属性n等);从而分别得到了辟谣消息影响力和谣言消息影响力,在结合各自的辟谣消息参与度和谣言消息参与度,得出转换概率,也即是易感状态S、辟谣状态K、移除状态R以及传谣状态I四个状态间相互转换的概率;从而结合SKIR 复杂网络谣言模型对谣言进行分析;图3中,μ表示易感状态S向辟谣状态K 转移的概率,λ表示易感状态到感染状态的概率,γ表示易感状态S向移除状态 R转换的概率,η表示感染状态I向辟谣状态K转移的概率,ψ表示辟谣状态K 或传谣状态I向移除状态R的概率;本发明的基于演化博弈的微博谣言传播分析系统包括:获取数据模块,提取数据属性模块,构建动态演化博弈模块,构建复杂网络谣言所述系统包括获取数据模块、提取数据属性模块、演化博弈模块、构建谣言信息传播模块,以及谣言分析模块;
所述获取数据模块用于抓取微博用户资料和数据资料;
所述提取数据属性模块用于提取所述微博用户资料和数据资料的相关属性;
所述演化博弈模块用于定义各个节点的收益矩阵以及构建话题驱动力;
所述构建谣言信息传播模块用于构建谣言传播动力学模型;
所述谣言分析模块用于分析谣言。
进一步的,所述获取数据模块用于抓取微博用户资料和数据资料包括:所述获取数据模块构建微博数据信息数据库,抓取微博用户资料和数据资料,并进行数据预处理操作具体包括:所述获取数据模块选定一条微博,选择所述微博的转发用户中的第一用户作为起始用户,将所述第一用户加入到待抓取的用户的队列中,每次所述待抓取的用户的队列选取一个用户,抓取其资料和发布的微博数据,抓取参与转发所述微博的下一个用户,如此循环下去,直到抓取完所有需要的数据。
进一步的,所述提取数据属性模块用于提取所述微博用户资料和数据资料的相关属性包括:所述提取数据属性模块分别从用户本身活跃度fuser(i)、邻居节点影响力fnei(i)以及微博热度finf(t)来进行用户属性的提取;所述提取数据属性模块根据所述用户属性的定义来构建社交影响力;
所述用户本身活跃度fuser(i)包括:根据所述步骤101中抓取的数据通过用户本身的关注数以及转发和原创微博的数目衡量用户的活跃度;
fuser(i)=χj+χk
其中,χj=ρ×Num[orig(i)]+Num[retw(i)],ρ∈[0,1]为弱化系数,Num[orig(i)]为用户i在话题发起前一个月的原创微博数量,Num[retw(i)]是用户i在话题发起前一个月的转发微博数量;χk为用户i的关注者数量;
所述邻居节点影响力fnei(i)包括:在评估邻居节点影响力的过程中引入信息传播带动力,即邻居节点的原创微博和转发微博的参与量,将邻居节点的粉丝量作为一个影响力指标,从而来构成邻居节点的影响力;
其中,χm为该用户的微博的平均参与度,χn为该用户的粉丝数目,所述参与量包括:评论数、转发数以及点赞数;
所述微博热度finf(t)包括:引入半衰期函数表示信息从发布到慢慢衰减直至死亡的过程;
其中,t表示从话题发起到当前时候的时间,w为正则系数。
进一步的,所述演化博弈模块用于定义各个节点的收益矩阵以及构建话题驱动力具体包括:所述演化博弈模块根据演化博弈的理论来定义各个节点的收益矩阵以及用户策略;根据复制动态方程得到话题驱动力,所述话题驱动力包括:
其中,k(t)=p1(t)×a(t)-p2(t)×b(t),k(t)表示复制动态方程;p1(t)为t时刻邻居节点中传谣节点的比例,p2(t)为t时刻用户邻居节点中辟谣节点的比例。
进一步的,所述构建谣言信息传播模块用于构建谣言传播动力学模型包括:所述构建谣言信息模块划分用户节点状态,定义用户状态转换规则,对所述用户节点状态转换做出假定,将辟谣信息引入到传统的传染病模型中,构造一种谣言传播动力学模型,所述谣言分析模块根据所述构建谣言信息模块所构建的谣言传播动力学模型对谣言信息进行分析;所述动力学模型方程包括:
其中,所述用户节点状态包括:易感状态S、辟谣状态K、传谣状态I和移除状态R;表示易感状态S的动态变化;表示传谣状态I的动态变化,表示辟谣状态K的动态变化,表示移除状态的动态变化;μ表示易感状态S向辟谣状态K转移的概率,λ表示易感状态到感染状态的概率,γ表示易感状态S向移除状态R转换的概率,η表示感染状态I向辟谣状态K转移的概率,表示辟谣状态K或传谣状态I向移除状态R的概率,I(t)表示用户在t时刻处于传谣的状态,S(t)表示用户在t时刻处于易感的状态,K(t)表示用户在t 时刻处于辟谣的状态。
本发明提出一种能够比较完整、真实的模拟现实世界中微博谣言的传播过程的分析方法。为了对微博谣言传播情况进行更好的分析,本发明在构建社交影响力的时候,从用户节点本身的活跃度、邻居节点的影响力以及信息本身热度三个方面考虑;其次,考虑到谣言传播过程中用户的从众和利弊权衡心理,以及遗忘规律等心理因素,利用演化博弈理论构建节点间状态转变规律;最后,兼顾谣言信息本身的特殊性,将辟谣信息引入到传统的SIR传染病模型中,提出一种SKIR微博谣言传播动力学模型,从而实现对真实世界中微博谣言传播过程的分析。
所应理解的是,本发明一种基于演化博弈的微博谣言传播的分析方法与用于实现基于演化博弈的微博谣言传播的分析的系统是同一构思的不同实现方式,系统实施例未描述部分可以参考方法实施例相应部分的描述,反之亦然。
应当指出上述具体的实施例,可以使本领域的技术人员和读者更全面地理解本发明创造的实施方法,应该被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。因此,尽管本发明说明书参照附图和实施例对本发明创造已进行了详细的说明,但是,本领域的技术人员应当理解,仍然可以对本发明创造进行修改或者等同替换,总之,一切不脱离本发明创造的精神和范围的技术方案及其改进,其均应涵盖在本发明创造专利的保护范围中。
Claims (9)
1.一种基于演化博弈的微博谣言传播的分析方法,其特征在于,包括以下几个步骤:
步骤1、构建微博数据信息数据库,抓取微博用户资料和数据资料,对抓取后的微博用户资料和数据资料进行数据预处理;
步骤2、提取微博用户资料和数据资料的相关属性,根据所述相关属性构建微博用户的社交影响力;
步骤3、根据演化博弈的理论和所述微博用户的社交影响力来定义各个节点的收益矩阵;利用所述收益矩阵根据复制动态方程构建话题驱动力;
步骤4、根据所述话题驱动力,构建谣言传播动力学模型,根据谣言传播动力学模型对微博谣言传播过程进行分析。
2.根据权利要求1所述的一种基于演化博弈的微博谣言传播的分析方法,其特征在于,所述构建微博数据信息数据库,抓取微博用户资料和数据资料,对抓取后的微博用户资料和数据资料进行数据预处理包括:选定一条微博,选择所述微博的转发用户中的第一用户作为起始用户,将所述第一用户加入到待抓取的用户的队列中,从所述待抓取的用户的队列中选取一个用户,抓取其资料和发布的微博数据,然后抓取参与转发所述微博的下一个用户,如此循环下去,直到抓取完所有需要的数据。
3.根据权利要求1所述的一种基于演化博弈的微博谣言传播的分析方法,其特征在于,步骤2中所述用户属性的提取方法为:从用户本身活跃度fuser(i)、邻居节点影响力fnei(i)以及微博热度finf(t)来提取用户属性。
4.根据权利要求3所述的一种基于演化博弈的微博谣言传播的分析方法,其特征在于,
所述用户本身活跃度fuser(i)包括:根据所述步骤101中抓取的数据通过用户本身的关注数以及转发和原创微博的数目衡量用户的活跃度;
fuser(i)=χj+χk
其中,χj=ρ×Num[orig(i)]+Num[retw(i)],ρ∈[0,1]为弱化系数,Num[orig(i)]为用户i在话题发起前一个月的原创微博数量,Num[retw(i)]是用户i在话题发起前一个月的转发微博数量;χk为用户i的关注者数量;
所述邻居节点影响力fnei(i)包括:在评估邻居节点影响力的过程中引入信息传播带动力,即邻居节点的原创微博和转发微博的参与量,将邻居节点的粉丝量作为一个影响力指标,从而来构成邻居节点的影响力;
其中,χm为该用户的微博的平均参与度,χn为该用户的粉丝数目,所述参与量包括:评论数、转发数以及点赞数;
所述微博热度finf(t)包括:引入半衰期函数表示信息从发布到慢慢衰减直至死亡的过程;
其中,t表示从话题发起到当前时候的时间,w为正则系数。
5.根据权利要求4所述的一种基于演化博弈的微博谣言传播的分析方法,其特征在于,步骤3中所述的用户策略包括:“传谣”和“辟谣”,“传谣”表示用户相信谣言信息,“辟谣”表示用户相信辟谣信息。
6.根据权利要求5所述的一种基于演化博弈的微博谣言传播的分析方法,其特征在于,步骤3中所述的收益矩阵如下:
其中,a(t)=α×fuser+β×f1nei(i)×f1inf(t),b(t)=α×fuser+β×f2nei(i)×f2inf(t),a(t)表示用户传谣的收益,b(t)表示用户辟谣的收益;α为节点受自身因素的比重,β为节点受自身因素和环境因素影响的比重;f1nei(i)表示谣言信息的邻居节点影响;f2nei(i)表示辟谣信息的邻居节点影响;f1inf(t)表示谣言信息的微博热度,f2inf(t)表示辟谣信息的微博热度。
7.根据权利要求6所述的一种基于演化博弈的微博谣言传播的分析方法,其特征在于,步骤3中所述话题驱动力包括:
其中,k(t)=p1(t)×a(t)-p2(t)×b(t),k(t)表示复制动态方程;p1(t)为t时刻邻居节点中传谣节点的比例,p2(t)为t时刻用户邻居节点中辟谣节点的比例。
8.根据权利要求1所述的一种基于演化博弈的微博谣言传播的分析方法,其特征在于,步骤4中所述谣言传播动力学模型方程包括:
其中,所述用户节点状态包括:易感状态S、辟谣状态K、传谣状态I和移除状态R;表示易感状态S的动态变化;表示传谣状态I的动态变化,表示辟谣状态K的动态变化,表示移除状态的动态变化;μ表示易感状态S向辟谣状态K转移的概率也即是话题驱动力,λ表示易感状态到感染状态的概率,γ表示易感状态S向移除状态R转换的概率,η表示感染状态I向辟谣状态K转移的概率,表示辟谣状态K或传谣状态I向移除状态R的概率,I(t)表示用户在t时刻处于传谣的状态,S(t)表示用户在t时刻处于易感的状态,K(t)表示用户在t时刻处于辟谣的状态。
9.一种用于实现权利要求1-8任一所述的一种基于演化博弈的微博谣言传播的分析的系统,其特征在于,所述系统包括获取数据模块、提取数据属性模块、演化博弈模块、构建谣言信息传播模块,以及谣言分析模块;
所述获取数据模块用于抓取微博用户资料和数据资料;
所述提取数据属性模块用于提取所述微博用户资料和数据资料的相关属性;
所述演化博弈模块用于定义各个节点的收益矩阵以及构建话题驱动力;
所述构建谣言信息传播模块用于构建谣言传播动力学模型;
所述谣言分析模块用于分析谣言。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810071416.0A CN108304521B (zh) | 2018-01-25 | 2018-01-25 | 基于演化博弈的微博谣言传播的分析方法与系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810071416.0A CN108304521B (zh) | 2018-01-25 | 2018-01-25 | 基于演化博弈的微博谣言传播的分析方法与系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108304521A true CN108304521A (zh) | 2018-07-20 |
CN108304521B CN108304521B (zh) | 2021-11-16 |
Family
ID=62866567
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810071416.0A Active CN108304521B (zh) | 2018-01-25 | 2018-01-25 | 基于演化博弈的微博谣言传播的分析方法与系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108304521B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109829112A (zh) * | 2019-01-31 | 2019-05-31 | 平安科技(深圳)有限公司 | 基于大数据的裂变话题跟踪方法、装置和计算机设备 |
CN110519083A (zh) * | 2019-08-06 | 2019-11-29 | 电子科技大学 | 基于演化博弈论的混合策略异构社交网络信息扩散分析 |
CN110781411A (zh) * | 2019-11-05 | 2020-02-11 | 重庆邮电大学 | 一种基于辟谣消息的谣言传播控制方法 |
CN110795641A (zh) * | 2019-11-05 | 2020-02-14 | 重庆邮电大学 | 基于表示学习的网络谣言传播控制方法 |
CN110807556A (zh) * | 2019-11-05 | 2020-02-18 | 重庆邮电大学 | 对微博谣言或/和辟谣话题传播趋势的预测方法及装置 |
CN110851736A (zh) * | 2019-11-11 | 2020-02-28 | 重庆邮电大学 | 一种基于三方动态博弈的谣言传播控制方法 |
CN112269945A (zh) * | 2020-11-03 | 2021-01-26 | 重庆邮电大学 | 基于谣言辟谣促谣和三方认知博弈的信息传播预测方法 |
CN112396151A (zh) * | 2020-11-09 | 2021-02-23 | 江汉大学 | 谣言事件的分析方法、装置、设备及计算机可读存储介质 |
CN112396150A (zh) * | 2020-11-09 | 2021-02-23 | 江汉大学 | 谣言事件的分析方法、装置、设备及计算机可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104091206A (zh) * | 2014-06-18 | 2014-10-08 | 北京邮电大学 | 基于演化博弈论的社交网络信息传播预测方法 |
CN104133897A (zh) * | 2014-08-01 | 2014-11-05 | 哈尔滨工程大学 | 一种基于话题影响力的微博话题溯源方法 |
CN106126700A (zh) * | 2016-07-01 | 2016-11-16 | 复旦大学 | 一种微博谣言传播的分析方法 |
CN106682991A (zh) * | 2016-12-21 | 2017-05-17 | 重庆邮电大学 | 一种基于在线社交网络的信息传播模型及其传播方法 |
-
2018
- 2018-01-25 CN CN201810071416.0A patent/CN108304521B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104091206A (zh) * | 2014-06-18 | 2014-10-08 | 北京邮电大学 | 基于演化博弈论的社交网络信息传播预测方法 |
CN104133897A (zh) * | 2014-08-01 | 2014-11-05 | 哈尔滨工程大学 | 一种基于话题影响力的微博话题溯源方法 |
CN106126700A (zh) * | 2016-07-01 | 2016-11-16 | 复旦大学 | 一种微博谣言传播的分析方法 |
CN106682991A (zh) * | 2016-12-21 | 2017-05-17 | 重庆邮电大学 | 一种基于在线社交网络的信息传播模型及其传播方法 |
Non-Patent Citations (1)
Title |
---|
陈超: "熟悉机制、媒体及辟谣者对谣言传播影响的研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109829112B (zh) * | 2019-01-31 | 2023-11-14 | 平安科技(深圳)有限公司 | 基于大数据的裂变话题跟踪方法、装置和计算机设备 |
CN109829112A (zh) * | 2019-01-31 | 2019-05-31 | 平安科技(深圳)有限公司 | 基于大数据的裂变话题跟踪方法、装置和计算机设备 |
CN110519083B (zh) * | 2019-08-06 | 2021-09-24 | 电子科技大学 | 基于演化博弈论的混合策略异构社交网络信息扩散分析 |
CN110519083A (zh) * | 2019-08-06 | 2019-11-29 | 电子科技大学 | 基于演化博弈论的混合策略异构社交网络信息扩散分析 |
CN110795641B (zh) * | 2019-11-05 | 2022-09-27 | 重庆邮电大学 | 基于表示学习的网络谣言传播控制方法 |
CN110807556A (zh) * | 2019-11-05 | 2020-02-18 | 重庆邮电大学 | 对微博谣言或/和辟谣话题传播趋势的预测方法及装置 |
CN110807556B (zh) * | 2019-11-05 | 2022-05-31 | 重庆邮电大学 | 对微博谣言或/和辟谣话题传播趋势的预测方法及装置 |
CN110781411B (zh) * | 2019-11-05 | 2022-06-28 | 重庆邮电大学 | 一种基于辟谣消息的谣言传播控制方法 |
CN110795641A (zh) * | 2019-11-05 | 2020-02-14 | 重庆邮电大学 | 基于表示学习的网络谣言传播控制方法 |
CN110781411A (zh) * | 2019-11-05 | 2020-02-11 | 重庆邮电大学 | 一种基于辟谣消息的谣言传播控制方法 |
CN110851736A (zh) * | 2019-11-11 | 2020-02-28 | 重庆邮电大学 | 一种基于三方动态博弈的谣言传播控制方法 |
CN112269945A (zh) * | 2020-11-03 | 2021-01-26 | 重庆邮电大学 | 基于谣言辟谣促谣和三方认知博弈的信息传播预测方法 |
CN112269945B (zh) * | 2020-11-03 | 2022-10-18 | 重庆邮电大学 | 基于谣言辟谣促谣和三方认知博弈的信息传播预测方法 |
CN112396151A (zh) * | 2020-11-09 | 2021-02-23 | 江汉大学 | 谣言事件的分析方法、装置、设备及计算机可读存储介质 |
CN112396150A (zh) * | 2020-11-09 | 2021-02-23 | 江汉大学 | 谣言事件的分析方法、装置、设备及计算机可读存储介质 |
CN112396150B (zh) * | 2020-11-09 | 2023-09-26 | 江汉大学 | 谣言事件的分析方法、装置、设备及计算机可读存储介质 |
CN112396151B (zh) * | 2020-11-09 | 2023-09-26 | 江汉大学 | 谣言事件的分析方法、装置、设备及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108304521B (zh) | 2021-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108304521A (zh) | 基于演化博弈的微博谣言传播的分析方法与系统 | |
CN103064917B (zh) | 一种面向微博的特定倾向的高影响力用户群发现方法 | |
CN104991956B (zh) | 基于主题概率模型的微博传播群体划分与账户活跃度评估方法 | |
Sun et al. | Research on Public Opinion Propagation Model in Social Network Based on Blockchain. | |
CN107808067B (zh) | 基于网络结构与用户心理特质的信息传播预测系统及方法 | |
CN103279887B (zh) | 一种基于信息理论的微博传播可视化分析方法 | |
Wan et al. | Information propagation model based on hybrid social factors of opportunity, trust and motivation | |
CN110825948A (zh) | 基于促谣-辟谣消息和表示学习的谣言传播控制方法 | |
CN112084373B (zh) | 一种基于图嵌入的多源异构网络用户对齐方法 | |
CN107391542A (zh) | 一种基于文件知识图谱的开源软件社区专家推荐方法 | |
CN107169873A (zh) | 一种多特征融合的微博用户权威度评价方法 | |
CN108230169B (zh) | 基于社交影响力的信息传播模型及态势感知系统及方法 | |
CN107194819A (zh) | 基于元胞自动机的信息传播模型 | |
CN109408726B (zh) | 问答网站中问题回答者推荐方法 | |
CN115712772A (zh) | 一种基于话题关联的话题传播预测方法 | |
Zhang et al. | Impact of simplicial complexes on epidemic spreading in partially mapping activity-driven multiplex networks | |
CN108965287A (zh) | 一种基于有限临时删边的病毒传播控制方法 | |
CN107995278A (zh) | 一种基于城域级物联网感知数据的场景智能分析系统与方法 | |
CN106844697B (zh) | 一种基于潜在传播集的社交网络信息传播跟踪方法 | |
Jiang et al. | Study on coupled social network public opinion communication based on improved SEIR | |
CN112580879A (zh) | 一种基于图神经网络的信息流行度预测方法 | |
Li et al. | Dual Graph Neural Networks for Dynamic Users’ Behavior Prediction on Social Networking Services | |
CN112396150B (zh) | 谣言事件的分析方法、装置、设备及计算机可读存储介质 | |
CN108170725A (zh) | 集成多特征信息的社交网络用户关系强度计算方法和装置 | |
Keehn | Can We Bridge The Divide? Right‐Wing Memes as Political Education |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |