CN110807556B - 对微博谣言或/和辟谣话题传播趋势的预测方法及装置 - Google Patents

对微博谣言或/和辟谣话题传播趋势的预测方法及装置 Download PDF

Info

Publication number
CN110807556B
CN110807556B CN201911068520.5A CN201911068520A CN110807556B CN 110807556 B CN110807556 B CN 110807556B CN 201911068520 A CN201911068520 A CN 201911068520A CN 110807556 B CN110807556 B CN 110807556B
Authority
CN
China
Prior art keywords
rumor
user
dagger
information
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911068520.5A
Other languages
English (en)
Other versions
CN110807556A (zh
Inventor
黄振
肖云鹏
李暾
王佐成
彭文勤
朱洋甫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN201911068520.5A priority Critical patent/CN110807556B/zh
Publication of CN110807556A publication Critical patent/CN110807556A/zh
Application granted granted Critical
Publication of CN110807556B publication Critical patent/CN110807556B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Development Economics (AREA)
  • Biomedical Technology (AREA)
  • Game Theory and Decision Science (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于用户行为预测领域,涉及对微博谣言或/和辟谣话题传播趋势的预测方法及装置;方法包括获取参与微博谣言话题或/和辟谣话题的数据源信息,提取相关属性;使用多元线性回归算法构造影响力函数;构建出转发谣言信息和转发辟谣信息的博弈策略,建立出谣言与辟谣互影响力模型,计算出谣言与辟谣的互影响力;基于表示学习的方法将用户节点映射到像素空间,构建当前时刻的用户转发图像,利用卷积神经网络预测下一时刻的用户转发图像;将互影响力与下一时刻用户转发图像相融合,建立出逻辑回归预测模型,预测用户在下一时刻是否参与谣言话题或/和辟谣话题;本发明能够有效地预测出微博谣言话题和辟谣话题的传播趋势,有利于舆情的控制和处理。

Description

对微博谣言或/和辟谣话题传播趋势的预测方法及装置
技术领域
本发明属于网络舆情分析领域,涉及用户转发分析技术,尤其是有向社交网络中的谣言和辟谣信息共同传播的分析,具体涉及对微博谣言或/和辟谣话题传播趋势的预测方法及装置。
背景技术
谣言从古至今都存在。传统上,谣言是通过人与人之间口耳相传,传播速度慢、范围小。当今互联网发展迅速,微信、微博、博客等社交媒体已经渗入到人们日常生活的方方面面。社交网络的出现给人们带来了极大的便利,却也为谣言提供了传播渠道。它可以通过社交网络在不同地区,相距很远的陌生人之间传播,这意味着谣言的传播速度和范围比以往任何时候都更远、更快。因此,开展谣言和辟谣话题传播预测模型研究,有助于掌握群体转发特性分布,对网络舆情的引导和管控都具有重要意义。
近年来,许多学者对谣言传播模型进行了大量的研究,主要是基于SIR传染病模型、机器学习算法模型和深度学习算法模型。基于SIR传染病的预测模型主要是将用户划分为三种状态:易感者(S),感染者(I),免疫者(R)。状态S的用户不知道谣言,因此很容易受到谣言的感染,状态I的用户知道谣言,并积极传播谣言,而状态R的用户知道谣言,但不传播谣言。基于机器学习算法模型主要是提取影响用户传播的用户特征、文本特征特征因素,将问题转化为分类或回归问题,机器学习中的算法具有处理海量数据的优势,适用于处理社交网络中复杂的问题。
虽然众多学者对话题传播预测模型进行了大量的研究,并取得了相当不错的成果,但仍存在一些技术问题:
1.用户关系的隐秘性。话题传播空间下用户关系和用户行为具有复杂性和多样性,用户参与行为不仅受到显式关注的好友影响,还会受到隐式好友参与行为的影响,因此确定用户之间的隐式关系对预测用户参与行为至关重要。
2.辟谣信息与谣言的对抗性。由于谣言和辟谣信息本身的竞争关系,一部分用户可能通过辟谣信息识破谣言,因此辟谣信息对谣言传播的影响是不容忽视的。
3.谣言话题传播的动态时限性。谣言在社交网络中的传播具有很强的时限性,谣言话题热度会随着时间的推移呈现先迅速增长而后逐渐降低的变化。
发明内容
基于现有技术存在的问题,为了更准确地预测谣言的传播趋势,本发明引入辟谣信息,针对谣言与辟谣信息之间的竞争关系,利用演化博弈量化谣言与辟谣信息之间的互影响力,结合信息内容与用户自身特征建立谣言和辟谣话题传播预测模型。提出了一种对微博谣言或/和辟谣话题传播趋势的预测方法及装置。
一种对微博谣言或/和辟谣话题传播趋势的预测方法,所述方法包括以下步骤:
S1、获取参与微博谣言话题或/和辟谣话题的数据源信息,提取出参与用户的相关属性,包括提取出用户的内部属性特征和外部属性特征;
S2、综合参与用户的内部属性特征和外部属性特征,使用多元线性回归算法,构造谣言与辟谣信息的影响力函数;
S3、构建出转发谣言信息和转发辟谣信息的博弈策略,基于影响力函数,建立出谣言与辟谣互影响力模型,计算出谣言与辟谣的互影响力;
S4、基于表示学习的方法将各个用户节点映射到像素空间,构建出当前时刻的用户转发图像,利用卷积神经网络预测出下一时刻的用户转发图像;
S5、将谣言与辟谣的互影响力与卷积神经网络预测的用户转发图像相融合,建立出逻辑回归预测模型,从而预测出各个用户在下一时刻是否参与谣言话题或/和辟谣话题的讨论。
进一步的,本发明的一种对微博谣言话题或/和辟谣话题传播趋势的预测装置,所述装置包括:
API接口模块,用于接收用户参与微博谣言话题或/和辟谣话题的数据源信息;
数据分类模块,用于提取用户的内部属性特征和外部属性特征;
谣言与辟谣互影响力模型构造模块,基于博弈理论,量化出谣言与辟谣的互影响力;
卷积神经网络模型模块,用于构造卷积神经网络,预测出下一时刻的用户转发图像;
逻辑回归预测模块,用于将谣言与辟谣的互影响力与下一时刻的用户转发图像融合,预测出用户在下一时刻是否参与谣言话题或/和辟谣话题的讨论。
本发明的有益效果:
1、本发明利用表示学习方法重构用户关系网络,在预测用于行为时不仅考虑了用户显示好友对用户的影响,还考虑了隐式好友对用户的影响,使得对社交网络中用户行为的预测更加准确。
2、本发明考虑了谣言和辟谣的竞争关系,并将谣言-辟谣互影响力融入到预测模型中,该方法不仅可以的反出谣言与辟谣信息的对抗性,还反映出在多消息传播过程中人们的从众性的心理行为。
3、本发明在分析图结构的数据时,巧妙地利用卷积神经网络局部连接和权值共享的能力,很大程度的减少了计算量,使得使用本发明方法或者制造本发明装置的成本降低。
4、可以应用于企业产品和服务的推广,有助于掌握群体行为特性分布,分析潜在客户群体,因此获得良好的经济、社会效益,也可以使监管部门更准确地掌握网络谣言事件的传播,并加以引导和管控。
附图说明
图1为本发明提出的对微博谣言话题或/和辟谣话题传播趋势的预测方法的优选实施例流程图;
图2为本发明的基于表示学习和谣言-辟谣信息的话题传播预测模型;
图3为本发明的用户转发预测示例图;
图4为本发明的算法user2pixel流程示例图;
图5为本发明的随机游走生成用户节点序列示例图;
图6为本发明的特征学习将用户映射到二维空间示例图;
图7为本发明的特征学习过程中扩散过程示例图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
在一个实施例中,一种对微博谣言话题或/和辟谣话题传播趋势的预测方法,所述方法至少包括以下步骤:
第一步:获取参与微博谣言话题或/和辟谣话题的用户数据源信息。
第二步:提取用户的相关属性。
第三步:建立基于表示学习的谣言-辟谣信息话题传播预测模型,预测出用户在下一时刻是否参与谣言话题或/和辟谣话题的讨论。
在另一个优选实施例中,一种对微博谣言话题或/和辟谣话题传播趋势的预测方法,如图1所示,所述方法包括以下步骤:
S1、获取参与微博谣言话题或/和辟谣话题的数据源信息,提取出参与用户的相关属性,包括提取出用户的内部属性特征和外部属性特征;
S2、综合参与用户的内部属性特征和外部属性特征,使用多元线性回归算法,构造谣言与辟谣信息的影响力函数;
S3、构建出转发谣言信息和转发辟谣信息的博弈策略,基于影响力函数,建立出谣言与辟谣互影响力模型,计算出谣言与辟谣的互影响力;
S4、基于表示学习的方法将各个用户节点映射到像素空间,构建出当前时刻的用户转发图像,利用卷积神经网络预测出下一时刻的用户转发图像;
S5、将谣言与辟谣的互影响力与卷积神经网络预测的用户转发图像相融合,建立出逻辑回归预测模型,从而预测出各个用户在下一时刻是否参与谣言话题或/和辟谣话题的讨论。
当然,作为一个优选实施方式,对于本发明提出的一种对微博谣言话题或/和辟谣话题传播趋势的预测方法还可以包括步骤S6和S7;
S6、将一系列预测出的各个用户在下一时刻是否参与谣言话题或/和辟谣话题的讨论的数据形成传播趋势,并实时发送给微博的管理员;
S7、管理员根据接收到的传播趋势,控制微博谣言话题进行限流,辟谣话题进行引流。
另外,在一个可实现方式,图2给出了本发明方法的一种框架结构图,本实施例将本发明分为四个架构模块包括:
第一架构:获取用户基本信息、用户关系数据以及用户历史行为数据;
第二架构:将第一架构的信息分别通过谣言传播空间和辟谣传播空间进行传播,从而整理出外部因素和内部因素,两者的内部因素一致,而外部因素则有所不同。
第三架构:采用user2pixel算法,构建出当前时刻的用户转发图像,并基于卷积神经网络CNN建立出谣言传播预测模型和辟谣传播预测模型;通过用户内外部因素,基于演化博弈理论建立出谣言-辟谣博弈模型;将卷积神经网络预测的用户转发图像与谣言与辟谣的互影响力相融合,建立出逻辑回归预测模型。
第四架构:根据上述预测模型,预测出用户是否会参加话题,包括谣言话题和辟谣话题,计算出话题的动力因子,从而确定话题的热度趋势。
其中,本发明的整个预测过程可参考如图3所示;将谣言和辟谣信息话题相关信息及被预测的用户信息和用户关系网络输入到预测模型中,经过S2-S5步骤处理后,输出预测结果,即用户是否转发谣言或辟谣信息。
其中,所述参与谣言话题或/和辟谣用户的数据源信息至少包括用户转发谣言话题、辟谣话题的时间;用户评论谣言话题、辟谣话题的时间;用户的关注信息和被关注信息;用户历史所转发和评论的消息。
在一个实施例中,数据源的获取可以直接从现有的公开数据集中下载或者利用成熟的社交平台的公共API获取。
优选的,需要获取的是在谣言-辟谣信息话题生命周期内参与者的基本信息和历史行为数据,并对数据进行预处理。
进一步的,还可根据数据特点对时间周期进行分片。
在另一个实施例中,上述步骤S1获取数据源,还可主要分以下2个步骤:
S11:获取原始数据。通过社交网络公共API或直接下载现有数据源都可以得到原始数据。
S12:简单的数据清洗。通常获取的原始数据都是非结构化的,不能直接用于数据分析,经过简单的数据清洗可以使大部分非结构化数据结构化。例如,删除重复数据、清理无效节点等。
在一个实施例中,用户的相关属性包括分别从用户、好友、信息三方面来提取相关属性。
另一方面,所述相关属性还可包括以下内容:
在社交网络中,用户对谣言和辟谣信息的传播行为受多方面因素影响,比如:用户的个人兴趣、好友的传播行为及谣言和辟谣信息在传播过程中的相互影响等等。基于此,本发明从用户内部和外部因素出发,即内部属性特征和外部属性特征,提取影响用户传播行为的因素,具体如下:
所述用户的内部属性特征包括:
用户个人属性Att(ui):
Att(ui)=[gender(ui),city(ui),fansNum(ui),friendsNum(ui)]
用户个人属性包括用户的性别、所在城市、粉丝数和好友数等等,这些属性与用户是否会转发话题信息具有一定的相关性。
其中,gender(ui)表示用户ui的性别,city(ui)表示用户ui的所在城市,fansNum(ui)表示用户ui的粉丝数,friendsNum(ui)表示用户ui的好友数;
用户活跃度Act(ui):
Act(ui)=α*originalNum(ui)+retweetNum(ui);
越活跃的用户在遇到话题信息时转发的可能性就越大。因此本发明根据用户的历史行为数据定义用户活跃度。
其中,originalNum(ui)表示用户原创微博的数量;retweetNum(ui)表示用户转发微博的数量。经常转发微博的用户比经常发表微博的用户更容易转发谣言话题,即用户的原创的行为对用户活跃度的影响力小于用户转发行为。因此定义系数α∈[0,1]来弱化原创微博数对用户活跃度的影响。
用户历史转发率Ret(ui):
Figure BDA0002260181010000071
用户转发的微博数占用户获取的全部微博数的比例,在一定程度上反应了用户在接触新信息时会转发的概率,而用户获取的信息主要来源于好友原创和转发的微博。
其中totalTweetNum(ui)表示用户从好友那里获取的全部微博数量。
所述用户的外部属性特征包括:
在社交网络中,用户通常会受到好友的传播行为影响而参与某个话题。而不同好友的影响力也不尽相同,故本发明引入函数
Figure BDA0002260181010000072
量化好友对用户的影响力。
用户的好友带动力Fri(ui):
Figure BDA0002260181010000073
其中用户uj为用户ui的好友,
Figure BDA0002260181010000074
表示用户平均转发数。该因素在一定程度上反映了好友对个人的影响力。
提取用户全部微博的关键内容组成一篇“文章”,利用表示学习算法doc2vec将此“文章”与信息向量化,并计算信息向量与此“文章”向量的余弦距离度量用户兴趣与信息的相似性。因此本发明定义信息与用户关联度为:
信息与用户关联度Rel(ui):
Figure BDA0002260181010000081
其中向量
Figure BDA0002260181010000082
表示谣言向量,向量
Figure BDA0002260181010000083
表示发布的“文章”向量,||||表示向量的长度。该因素在一定程度上反映了信息内容对个人的影响力。
信息在社交网络中的传播具有很强的时限性,信息在社交网络中的传播具有很强的时限性,一些话题往往会在很短的时间内成为热门,因此本发明使用传播速率函数
Figure BDA0002260181010000084
表示信息的在当前时刻的热度。但信息热度在达到峰值后又会迅速下降,这一过程与元素的半衰期相似,故本发明又引入半衰期函数
Figure BDA0002260181010000085
因此定义信息传播影响力为:
信息传播影响力Spr(t):
Figure BDA0002260181010000086
其中,retweetNum(ui)表示用户ui在过去一个月内转发微博的数量;totalTweetNum(ui)表示用户ui在过去一个月内从好友处获取的全部微博数量;用户uj为用户ui的好友,
Figure BDA0002260181010000087
表示用户uj在过去一个月发起信息的平均转发数;向量
Figure BDA0002260181010000088
表示目标信息,向量
Figure BDA0002260181010000089
表示用户过去发布的微博;t0、tn-1和tn分别表示目标信息产生的时刻、当前时刻的前一时刻和当前时刻;tergatNum(tn)和tergatNum(tn-1)分别表示截止到当前时刻及前一时刻目标信息的转发次数,w为半衰期。
在一个实施例中,综合参与用户的内部属性特征和外部属性特征,使用多元线性回归算法,构造谣言与辟谣信息的影响力函数包括:
在社交网络中,用户对信息的传播行为受到多方面因素影响,本发明将这些因素分为用户内部和外部因素,并构造信息影响力函数Inf(ui)。
首先,本发明从用户个人属性、用户活跃度和用户历史转发率三个方面构建内部影响因素fin(ui),从好友带动力、信息与用户关联度和信息传播影响力三个方面构建外部影响因素fout(ui);
fin(ui)=[Att(ui),Act(ui),Ret(ui)]
fout(ui)=[Fri(ui),Rel(ui),Spr(t)]
然后,综合用户内部和外部因素,使用多元线性回归算法,构造谣言和辟谣信息的影响力函数:
Figure BDA0002260181010000091
Figure BDA0002260181010000092
其中,ρ0表示信息影响力的起点,ρ1表示内部属性特征因素在信息影响力中所占的比重;ρ2表示外部属性特征因素在信息影响力中所占的比重,fin(ui)表示用户ui的内部属性特征;
Figure BDA0002260181010000093
表示谣言信息对用户ui的外部属性特征;
Figure BDA0002260181010000094
表示辟谣信息对用户ui的外部属性特征。
在社交网络中,用户可能会同时接收到谣言和辟谣信息,由于谣言与辟谣信息的对抗性,用户在传播一条信息时需要考虑到另一条信息的影响。因此本文基于演化博弈理论提出谣言-辟谣互影响力模型Mut,量化谣言影响力。首先,依据博弈理论定义两种博弈策略:“转发谣言信息”和“转发辟谣信息”。用P1、P2分别表示好友中转发谣言和转发辟谣信息的比例,在好友中两种策略都不参与的节点不对其他用户的策略选择产生影响,因此本发明不对其考虑,所以P1+P2=1。两种策略的收益函数为:
Prorumor(ui)=P1×Infrumor(ui);
Figure BDA0002260181010000095
然后,利用演化博弈理论度量谣言与辟谣的互影响力,其表达公式包括:
Figure BDA0002260181010000096
Figure BDA0002260181010000097
其中,Mutrumor(ui)表示经过相互影响后的谣言信息对用户ui传播行为的影响力;Mutanti_rumor(ui)表示经过相互影响后的辟谣信息对用户ui传播行为的影响力;Prorumor(ui)表示用户ui转发谣言消息的收益函数;Proanti_rumor(ui)表示用户ui转发辟谣消息的收益函数;P1表示用户ui好友中转发谣言信息的比例,P2表示用户ui好友中转发辟谣消息的比例。
所述步骤S4包括:
S41、利用节点嵌入算法将用户映射到二维空间,通过切割和扩散的形式生成用户像素阵列;将t时刻的用户转发数据对应输入到像素阵列的像素点中,形成t时刻的用户转发图像iamget
S42、在卷积神经网络模型中输入当前时刻t的前n个时刻用户转发图像
Figure BDA0002260181010000101
输出下一时刻用户转发图像Rt+1(ui)。
在另一个实施例中,所述步骤S4包括:
S401、利用节点嵌入算法中的随机游走方式,生成线性用户节点序列;
S402、采用特征学习方法,获取线性用户节点之间的关联性,并将其映射到高维空间;
S403、通过降维方法,将用户节点向量降至二维空间;
S404、将用户映射到二维空间后,通过切割和扩散的形式生成用户像素阵列;
S405、将t时刻的用户转发数据对应输入到像素阵列的像素点中,形成t时刻的用户转发图像;
S406、在卷积神经网络模型中输入前n个时刻用户转发图像
Figure BDA0002260181010000102
Figure BDA0002260181010000103
输出为下一时刻用户转发图像Rt+1(ui)。
作为一种可实现方式,关于映射,本发明提出user2pixel算法将用户传播空间映射到像素空间,并构建用户转发图像。
更进一步的,user2pixel算法分为三个步骤:第一步,利用节点嵌入算法将用户节点映射到二维空间。第二步,在保持点与点之间相对位置的前提下,通过切割、扩散生成用户像素阵列。第三步,将用户行为数据填入到像素阵列中对应的像素点,得到“用户转发图像”。具体流程如图4所示。
本发明利用Node2vec算法,学习用户关系网络中节点和边的特征,同时考虑到局部和宏观信息将用户节点嵌入到二维空间。该算法主要分为两部分:随机游走和特征学习。
随机游走:记源节点c0=u,随机游走选择下一节点公式为:
Figure BDA0002260181010000111
其中Z为正则化因子,πvx为非正则化的节点v到节点x的转移概率,即令πvx为边(v,x)的权重πvx=ωvx。二阶随机游走将πvx=ωvx改进为πvx=αpq(t,x)·ωvx。
Figure BDA0002260181010000112
引入p和q参数,是为了在广度优先遍历(BFS)和深度优先遍历(DFS)中达到一个平衡,同时考虑到网络中的局部和宏观的信息。通过随机游走生成线性用户节点序列,如图5所示。
特征学习:在随机游走得到用户节点序列的基础上,利用特征学习方法Skip-gram,挖掘用户之间的关联性并映射到高维空间,并通过T-SNE非线性降维方法在保持用户节点相对关系的情况下将用户节点向量降至二维空间,如图6所示。
作为一个更为具体的实现方式,用户节点在二维空间处于连续分布,本发明通过以下两步方法在尽可能保留节点与节点之间相对位置的前提下将用户二维分布转化为用户像素阵列。首先,用一定距离纵横切割二维空间,切割形成包含全部用户的网格空间,每个网格中包含零个或多个用户节点。然后,对于存在多个用户节点的网格,只保留其中一个节点,将其它点扩散到周围网格中。
具体过程如下:
切割:首先根据全网用户节点在二维空间分布情况,确定切割距离
Figure BDA0002260181010000121
然后从原点向x、y轴正负方向以d的距离进行切割,直到将全部用户节点包含在切割范围内为止,切割后形成一个包含全部用户节点的网格空间,每个网格中会包含零个或多个用户节点。
扩散:为了消除网格空间包含多个用户节点的网格,本发明从中心网格开始,以顺时针螺旋顺序处理每一个网格。处理包含多个节点的网格时,保留最靠近中心网格的点,将多余的点往周围扩散,扩散位置有上、右上、右、右下、下、左下、左、左上等八个网格。扩散时应遵循三个规则,第一、不往内层网格扩散,即只能往同层和外层网格扩散;第二、扩散时优先考虑不含节点的网格;第三、不往同层网格中强制扩散,即当周围没有合适的网格扩散时,应按照多余点与保留点的相对位置往外层强制扩散,如图7所示。扩散完成后每个网格中最多只含一个用户节点,本发明将每个网格看作是一个像素点,便得到了用户像素阵列pix(ui)。
通过以上步骤将用户节点映射到像素阵列中,使得在像素阵列中关系越好的用户之间相距越近。本发明将t时刻用户转发行为数据填入到像素阵列中表示用户的像素点,对于没有表示用户的像素点填零补充,得到t时刻的用户转发图像,并记为imaget
关于卷积神经网络模型,本发明还给出了一种实现方式,考虑到谣言传播的动态时限性,而单个用户转发图像不能体现时间特征,因此本文将历史n个时刻的用户转发图像叠加成三维用户转发图像,即增加第三维度:时间维度。针对三维用户转发图像包含用户转发行为、用户关系和时间信息的时空特性,本发明利用卷积神经网络较强的局部时空特征学习能力,实现对用户参与行为的预测。卷积神经网络模型输入为前n个时刻用户转发图像
Figure BDA0002260181010000122
输出为下一时刻用户转发图像:Rt+1(ui),本发明用cnn_model表示卷积神经网络模型,则可将此部分表示为:
Figure BDA0002260181010000123
所述步骤S5包括:
考虑到谣言和辟谣信息在传播过程中的竞争关系,本发明利用逻辑回归算法,将谣言互影响力与卷积神经网络预测的用户转发结果相融合,实现对用户群体行为更准确的预测。其逻辑回归函数形式为:
Figure BDA0002260181010000131
其中,θ0表示逻辑回归截距;θ1表示谣言/辟谣驱动因素的参数;θ2表示t+1时刻用户转发图像的参数;Mut(ui)表示谣言或辟谣信息对用户ui传播行为的影响力,Rt+1(ui)表示卷积神经网络预测出在t+1时刻的用户转发图像,logistic(b|ui)表示用户ui在下一时刻是否参与谣言话题或/和辟谣话题的讨论,b表示动作,包括转发动作、点赞动作以及评论动作,本实施例指转发动作;由于逻辑回归函数是二分类模型,最终的值要么是0要么是1;而本实施例中,0就是表示该用户不转发此信息,1表示转发。
一种对微博谣言话题或/和辟谣话题传播趋势的预测装置,所述装置包括:
API接口模块,用于接收用户参与微博谣言话题或/和辟谣话题的数据源信息;
数据分类模块,用于提取用户的内部属性特征和外部属性特征;
谣言与辟谣互影响力模型构造模块,基于博弈理论,量化出谣言与辟谣的互影响力;
卷积神经网络模型模块,用于构造卷积神经网络,预测出下一时刻的用户转发图像;
逻辑回归预测模块,用于将谣言与辟谣的互影响力与下一时刻的用户转发图像融合,预测出用户在下一时刻是否参与谣言话题或/和辟谣话题的讨论。
所述谣言与辟谣互影响力模型构造模块包括:
多元线性回归单元,用于构建谣言与辟谣信息的影响力函数;
博弈单元,用于构建转发谣言信息和转发辟谣信息的博弈策略;
谣言与辟谣互影响力模型单元,基于谣言与辟谣信息的影响力函数,利用演化博弈论,量化出谣言与辟谣的互影响力。
所述卷积神经网络模型模块包括:
节点嵌入模块,用于构造节点嵌入算法,输入t时刻的用户转发数据,输出t时刻的用户转发图像;
卷积神经模型,用于输入当前时刻以及历史时刻的用户转发图像,输出下一时刻的用户转发图像。
所述逻辑回归预测模块以Sigmoid函数作为分类边界线,其中至少包括两个加法器、两个乘法器以及一个除法器,用于构建逻辑回归公式。
在一个可实现方式中,本发明的预测装置还包括微博服务器和控制端;将预测到的传播趋势通过API接口模块发送至微博服务器,控制端实时调用微博服务器的传播趋势信息,对预测到的传播趋势进行控制,包括采用限流、引流以及审核等方式进行控制,具体的控制方式还可参考任意相关的现有技术。
本发明解决了谣言话题或/辟谣话题的传播趋势问题,根据该趋势可以及时推送问题,得到很好的实时性效果;让传播趋势信息更准,更快的推送到需求人面前。本发明能将舆情信息提前发现和有效的控制,就会避免很多的群体性事件,将线上的社会变得更加和谐,稳定。另外,本发明能够及早的发现信息传播中的变化,尽早的对信息的传播趋势做出预测成为了信息实时推送和社会网络舆情监测的主要部分;能够给后续的舆情监控带来强有力的帮助。
可以理解的是,本发明的预测方法和预测装置的部分特征可以相互引用,本发明为了节省篇幅,则不再一一例举。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
以上所举实施例,对本发明的目的、技术方案和优点进行了进一步的详细说明,所应理解的是,以上所举实施例仅为本发明的优选实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内对本发明所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种对微博谣言话题或/和辟谣话题传播趋势的预测方法,其特征在于,所述方法包括以下步骤:
S1、获取参与微博谣言话题或/和辟谣话题的数据源信息,提取出参与用户的相关属性,包括提取出用户的内部属性特征和外部属性特征;
S2、综合参与用户的内部属性特征和外部属性特征,使用多元线性回归算法,构造谣言与辟谣信息的影响力函数;
S3、构建出转发谣言信息和转发辟谣信息的博弈策略,基于影响力函数,建立出谣言与辟谣互影响力模型,计算出谣言与辟谣的互影响力;
所述谣言与辟谣的互影响力的表达公式包括:
Figure FDA0003588996010000011
Figure FDA0003588996010000012
其中,Mutrumor(ui)表示经过相互影响后的谣言信息对用户ui传播行为的影响力;Mutanti_rumor(ui)表示经过相互影响后的辟谣信息对用户ui传播行为的影响力;Prorumor(ui)表示用户ui转发谣言消息的收益函数,Prorumor(ui)=P1×Infrumor(ui);Infrumor(ui)表示谣言消息的影响力函数;Proanti_rumor(ui)表示用户ui转发辟谣消息的收益函数,Proanti_rumor(ui)=P2×Infanti_rumor(ui);Infanti_umor(ui)表示辟谣消息的影响力函数;P1表示用户ui好友中转发谣言信息的比例,P2表示用户ui好友中转发辟谣消息的比例,P1+P2=1;
S4、基于表示学习的方法将各个用户节点映射到像素空间,构建出当前时刻的用户转发图像,利用卷积神经网络预测出下一时刻的用户转发图像;
S5、将谣言与辟谣的互影响力与卷积神经网络预测的用户转发图像相融合,建立出逻辑回归预测模型,从而预测出各个用户在下一时刻是否参与谣言话题或/和辟谣话题的讨论。
2.根据权利要求1所述的一种对微博谣言话题或/和辟谣话题传播趋势的预测方法,其特征在于,所述参与谣言话题或/和辟谣用户的数据源信息包括用户转发谣言话题、辟谣话题的时间;用户评论谣言话题、辟谣话题的时间;用户的关注信息和被关注信息;用户历史所转发和评论的消息。
3.根据权利要求1或2所述的一种对微博谣言话题或/和辟谣话题传播趋势的预测方法,其特征在于,
所述用户的内部属性特征包括:
用户个人属性Att(ui):
Att(ui)=[gender(ui),city(ui),fansNum(ui),friendsNum(ui)
用户活跃度Act(ui):
Act(ui)=α*originalNum(ui)+retweetNum(ui);
用户历史转发率Ret(ui):
Figure FDA0003588996010000021
所述用户的外部属性特征包括:
用户的好友带动力Fri(ui):
Figure FDA0003588996010000022
信息与用户关联度Rel(ui):
Figure FDA0003588996010000023
信息传播影响力Spr(t):
Figure FDA0003588996010000024
其中,gender(ui)表示用户ui的性别,city(ui)表示用户ui的所在城市,fansNum(ui)表示用户ui的粉丝数,friendsNum(ui)表示用户ui的好友数;α∈[0,1],表示弱化原创微博数对用户活跃度的影响因子;originalNum(ui)表示用户原创微博的数量;retweetNum(ui)表示用户ui在过去一个月内转发微博的数量;totalTweetNum(ui)表示用户ui在过去一个月内从好友处获取的全部微博数量;用户uj为用户ui的好友,
Figure FDA0003588996010000031
表示用户uj在过去一个月发起信息的平均转发数;向量
Figure FDA0003588996010000032
表示目标信息,向量
Figure FDA0003588996010000033
表示用户过去发布的微博;t0、tn-1和tn分别表示目标信息产生的时刻、当前时刻的前一时刻和当前时刻;tergatNum(tn)和tergatNum(tn-1)分别表示截止到当前时刻tn及前一时刻tn-1目标信息的转发次数,w为半衰期。
4.根据权利要求1所述的一种对微博谣言话题或/和辟谣话题传播趋势的预测方法,其特征在于,所述谣言与辟谣信息的影响力函数的表达公式包括:
Figure FDA0003588996010000034
Figure FDA0003588996010000035
其中,ρ0表示信息影响力的起点,ρ1表示内部属性特征因素在信息影响力中所占的比重;ρ2表示外部属性特征因素在信息影响力中所占的比重,fin(ui)表示用户ui的内部属性特征;
Figure FDA0003588996010000036
表示谣言信息对用户ui的外部属性特征;
Figure FDA0003588996010000037
表示辟谣信息对用户ui的外部属性特征。
5.根据权利要求1所述的一种对微博谣言话题或/和辟谣话题传播趋势的预测方法,其特征在于,所述步骤S4包括:
S41、利用节点嵌入算法将用户映射到二维空间,通过切割和扩散的形式生成用户像素阵列;将t时刻的用户转发数据对应输入到像素阵列的像素点中,形成t时刻的用户转发图像imaget
S42、在卷积神经网络模型中输入当前t时刻的前n个时刻用户转发图像
Figure FDA0003588996010000038
输出下一时刻即t+1时刻用户转发图像Rt+1(ui)。
6.根据权利要求1所述的一种对微博谣言话题或/和辟谣话题传播趋势的预测方法,其特征在于,所述步骤S5包括:
Figure FDA0003588996010000039
其中,θ0表示逻辑回归截距;θ1表示谣言/辟谣驱动因素的参数;θ2表示t+1时刻用户转发图像的参数;Mut(ui)表示谣言或辟谣信息对用户ui传播行为的影响力,Rt+1(ui)表示卷积神经网络预测出在t+1时刻的用户转发图像,logistic(b|ui)表示用户ui在下一时刻是否参与谣言话题或/和辟谣话题的讨论。
7.一种对微博谣言话题或/和辟谣话题传播趋势的预测装置,其特征在于,所述装置包括:
API接口模块,用于接收用户参与微博谣言话题或/和辟谣话题的数据源信息;
数据分类模块,用于提取用户的内部属性特征和外部属性特征;
谣言与辟谣互影响力模型构造模块,基于博弈理论,量化出谣言与辟谣的互影响力;
所述谣言与辟谣互影响力模型构造模块包括:
多元线性回归单元,用于构建谣言与辟谣信息的影响力函数;
博弈单元,用于构建转发谣言信息和转发辟谣信息的博弈策略;
谣言与辟谣互影响力模型单元,基于谣言与辟谣信息的影响力函数,利用演化博弈论,量化出谣言与辟谣的互影响力,表示为:
Figure FDA0003588996010000041
Figure FDA0003588996010000042
其中,Mutrumor(ui)表示经过相互影响后的谣言信息对用户ui传播行为的影响力;Mutanti_rumor(ui)表示经过相互影响后的辟谣信息对用户ui传播行为的影响力;Prorumor(ui)表示用户ui转发谣言消息的收益函数,Prorumor(ui)=P1×Infrumor(ui);Infrumor(ui)表示谣言消息的影响力函数;Proanti_rumor(ui)表示用户ui转发辟谣消息的收益函数,Proanti_rumor(ui)=P2×Infanti_rumor(ui);Infanti_umor(ui)表示辟谣消息的影响力函数;P1表示用户ui好友中转发谣言信息的比例,P2表示用户ui好友中转发辟谣消息的比例,P1+P2=1;
卷积神经网络模型模块,用于构造卷积神经网络,预测出下一时刻的用户转发图像;
逻辑回归预测模块,用于将谣言与辟谣的互影响力与下一时刻的用户转发图像融合,预测出用户在下一时刻是否参与谣言话题或/和辟谣话题的讨论。
8.根据权利要求7所述的一种对微博谣言话题或/和辟谣话题传播趋势的预测装置,其特征在于,所述卷积神经网络模型模块包括:
节点嵌入模块,用于构造节点嵌入算法,输入t时刻的用户转发数据,输出t时刻的用户转发图像;
卷积神经模型,用于输入当前时刻以及历史时刻的用户转发图像,输出下一时刻的用户转发图像。
CN201911068520.5A 2019-11-05 2019-11-05 对微博谣言或/和辟谣话题传播趋势的预测方法及装置 Active CN110807556B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911068520.5A CN110807556B (zh) 2019-11-05 2019-11-05 对微博谣言或/和辟谣话题传播趋势的预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911068520.5A CN110807556B (zh) 2019-11-05 2019-11-05 对微博谣言或/和辟谣话题传播趋势的预测方法及装置

Publications (2)

Publication Number Publication Date
CN110807556A CN110807556A (zh) 2020-02-18
CN110807556B true CN110807556B (zh) 2022-05-31

Family

ID=69501230

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911068520.5A Active CN110807556B (zh) 2019-11-05 2019-11-05 对微博谣言或/和辟谣话题传播趋势的预测方法及装置

Country Status (1)

Country Link
CN (1) CN110807556B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112037078B (zh) * 2020-05-29 2021-07-02 中国人民解放军军事科学院评估论证研究中心 一种对异构网络异质结点上谣言传播情况预测方法和系统
CN111800422B (zh) * 2020-07-06 2022-05-17 中国人民公安大学 扭曲信息的干预方法、装置及电子设备
CN112001072B (zh) * 2020-08-17 2023-06-16 东北财经大学 基于爆发阈值及用户体验的谣言抑制方法
CN112199468B (zh) * 2020-09-23 2022-09-30 夏一雪 一种大数据环境下网络舆情人工智能决策系统
CN112269945B (zh) * 2020-11-03 2022-10-18 重庆邮电大学 基于谣言辟谣促谣和三方认知博弈的信息传播预测方法
CN112464082B (zh) * 2020-11-05 2022-06-28 重庆邮电大学 基于稀疏表示和张量补全的谣言-辟谣博弈传播控制方法
CN112418525B (zh) * 2020-11-24 2022-06-10 重庆邮电大学 社交话题群体行为的预测方法、装置及计算机存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105045857A (zh) * 2015-07-09 2015-11-11 中国科学院计算技术研究所 一种社交网络谣言识别方法及系统
CN106126700A (zh) * 2016-07-01 2016-11-16 复旦大学 一种微博谣言传播的分析方法
CN107451923A (zh) * 2017-07-14 2017-12-08 北京航空航天大学 一种基于转发网络层次分析的在线社交网络谣言预测方法
CN107908645A (zh) * 2017-10-09 2018-04-13 北京航空航天大学 一种基于渗流分析的在线社交平台谣言传播的免疫方法
CN108153884A (zh) * 2017-12-26 2018-06-12 厦门大学 一种微博谣言传播的分析方法
CN108304521A (zh) * 2018-01-25 2018-07-20 重庆邮电大学 基于演化博弈的微博谣言传播的分析方法与系统
CN108763574A (zh) * 2018-06-06 2018-11-06 电子科技大学 一种基于梯度提升树的微博谣言检测算法与谣言检测特征集合
CN110134873A (zh) * 2019-04-15 2019-08-16 周口师范学院 一种基于转发网络层次分析的微博谣言预测方法
CN110309430A (zh) * 2019-07-04 2019-10-08 电子科技大学 一种基于演化博弈论的社交网络舆情发展分析方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105045857A (zh) * 2015-07-09 2015-11-11 中国科学院计算技术研究所 一种社交网络谣言识别方法及系统
CN106126700A (zh) * 2016-07-01 2016-11-16 复旦大学 一种微博谣言传播的分析方法
CN107451923A (zh) * 2017-07-14 2017-12-08 北京航空航天大学 一种基于转发网络层次分析的在线社交网络谣言预测方法
CN107908645A (zh) * 2017-10-09 2018-04-13 北京航空航天大学 一种基于渗流分析的在线社交平台谣言传播的免疫方法
CN108153884A (zh) * 2017-12-26 2018-06-12 厦门大学 一种微博谣言传播的分析方法
CN108304521A (zh) * 2018-01-25 2018-07-20 重庆邮电大学 基于演化博弈的微博谣言传播的分析方法与系统
CN108763574A (zh) * 2018-06-06 2018-11-06 电子科技大学 一种基于梯度提升树的微博谣言检测算法与谣言检测特征集合
CN110134873A (zh) * 2019-04-15 2019-08-16 周口师范学院 一种基于转发网络层次分析的微博谣言预测方法
CN110309430A (zh) * 2019-07-04 2019-10-08 电子科技大学 一种基于演化博弈论的社交网络舆情发展分析方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Two-stage predictions of evolutionary dynamics during the rumor dissemination;PengLu等;《Physica A:Statistical Methanics and its Applications》;20190301;第517卷;349-369 *
一种基于最大熵原理的社交网络用户关系分析模型;肖云鹏等;《电子与信息学报》;20170430;第39卷(第4期);778-784 *
基于节点从众博弈的社交网络谣言传播模型;刘亚州等;《计算机工程》;20181015(第10期);303-308,313 *
微博网络事件谣言信息扩散准确预测仿真;刘向阳等;《计算机仿真》;20180815(第08期);452-456 *
社会系统理论视域下的网络谣言风险分析;刘艳等;《领导科学》;20130515;11-12 *

Also Published As

Publication number Publication date
CN110807556A (zh) 2020-02-18

Similar Documents

Publication Publication Date Title
CN110807556B (zh) 对微博谣言或/和辟谣话题传播趋势的预测方法及装置
US9483580B2 (en) Estimation of closeness of topics based on graph analytics
CN106651030B (zh) 一种改进的rbf神经网络热点话题用户参与行为预测方法
CN103064917B (zh) 一种面向微博的特定倾向的高影响力用户群发现方法
CN110795641B (zh) 基于表示学习的网络谣言传播控制方法
CN109063010B (zh) 一种基于PageRank的意见领袖挖掘方法
CN105809554B (zh) 一种社交网络中用户参与热点话题的预测方法
CN110442790A (zh) 推荐多媒体数据的方法、装置、服务器和存储介质
CN110825948B (zh) 基于促谣-辟谣消息和表示学习的谣言传播控制方法
US20180048597A1 (en) Method and device for implementing instant communication
US11336596B2 (en) Personalized low latency communication
US10726087B2 (en) Machine learning system and method to identify and connect like-minded users
CN108230169A (zh) 基于社交影响力的信息传播模型及态势感知系统及方法
CN115712772A (zh) 一种基于话题关联的话题传播预测方法
CN107346333B (zh) 一种基于链路预测的在线社交网络好友推荐方法与系统
Yu et al. Collaborative group embedding and decision aggregation based on attentive influence of individual members: A group recommendation perspective
US20170286975A1 (en) Data Infrastructure and Method for Estimating Influence Spread in Social Networks
CN109816544B (zh) 基于接触概率的信息传播模型实现方法及装置
Liu et al. Understanding information diffusion with psychological field dynamic
Shen et al. The influence of cross-platform and spread sources on emotional information spreading in the 2E-SIR two-layer network
CN117217946A (zh) 一种传播影响力的确定方法、装置、设备及存储介质
CN115495671A (zh) 一种基于图结构迁移的跨领域谣言传播控制方法
Ahmad et al. Predicting friendship intensity in online social networks
De Meo et al. Improving the compactness in social network thematic groups by exploiting a multi-dimensional user-to-group matching algorithm
CN114547480A (zh) 一种基于多平台融合的深度学习推荐方法以及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant