CN103279484A - 一种面向微博客系统中未来意见领袖的创建方法及系统 - Google Patents

一种面向微博客系统中未来意见领袖的创建方法及系统 Download PDF

Info

Publication number
CN103279484A
CN103279484A CN2013101441524A CN201310144152A CN103279484A CN 103279484 A CN103279484 A CN 103279484A CN 2013101441524 A CN2013101441524 A CN 2013101441524A CN 201310144152 A CN201310144152 A CN 201310144152A CN 103279484 A CN103279484 A CN 103279484A
Authority
CN
China
Prior art keywords
user
game
opinion
leader
action
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013101441524A
Other languages
English (en)
Other versions
CN103279484B (zh
Inventor
程学旗
李静远
邢国亮
王元卓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Computing Technology of CAS
Original Assignee
Institute of Computing Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Computing Technology of CAS filed Critical Institute of Computing Technology of CAS
Priority to CN201310144152.4A priority Critical patent/CN103279484B/zh
Publication of CN103279484A publication Critical patent/CN103279484A/zh
Application granted granted Critical
Publication of CN103279484B publication Critical patent/CN103279484B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明提供一种面向微博客系统中未来意见领袖的创建方法及系统,方法包括:步骤1,初始化网络环境;步骤2,选择博弈发起方用户;步骤3,选择博弈接收方用户;步骤4,构建博弈收益矩阵;步骤5,计算是否存在纳什均衡点,如果存在则选择使双方用户收益和最大的纳什均衡点,根据纳什均衡点执行相应的关系动作和消息动作,如果不存在则选择执行使博弈发起方用户收益最大的关系动作或消息动作;步骤6,更新用户属性;步骤7,计算意见领袖特征值;步骤8,根据意见领袖特征值的变化趋势,获得成为意见领袖的用户特征组合,利用用户特征组合创建未来意见领袖。本发明在博弈过程中选择用户行为,对微博系统中网络拓扑结构生成与变化进行评估。

Description

一种面向微博客系统中未来意见领袖的创建方法及系统
技术领域
本发明涉及互联网信息管理领域,尤其涉及一种面向微博客系统中未来意见领袖的创建方法及系统。
背景技术
微博客(MicroBlog),一种新的社交网络媒体,是一个基于用户关系的信息分享、传播以及获取平台,用户可以通过WEB、WAP以及各种客户端组建个人社区,以140字左右的文字更新信息,并实现即时分享。微博”是一种新型的交流方式,虽然没有包含太多新的技术,但全新的表达个人思想的方式让所有刚接触微博的人耳目一新,它改变了人们写博客的方式,它也让写博客又进一步地平民化了。在“微博”时代,微小的个人事件都可能会进入网络。博客说“大事”,微博讲“小事”,已成为当下不少年轻人的网络生活新方式。2006年Twitter上线,标志着微博客时代的到来。
作为社交网络的一种形态,微博客已经成为舆论的主要载体,twitter平台拥有的用户数量已经超过5亿,每天发布的微博数目也超过3亿,而每天接受的查询数目要达到16亿。而在中国本土,随着自己本土化的微博客平台诸如新浪微博、腾讯微博等的兴起,微博客平台已经成为了网民的新宠。仅仅新浪微博一家,其用户数量已经突破3亿,每天发布超过1亿条微博数量。如此庞大的用户数量和如此巨大的信息发布量都让微博客平台在公共媒体领域具备了非常大的影响力,最近一年的网络突发事件中,微博客都起到了明显的新闻第一平台的作用。
自20世纪50年代“意见领袖”概念被提出以来,“意见领袖”在传播中的作用越来越受到重视,伴随着互联网的普及而生的网络“意见领袖”,更是对社会舆论的形成和引导造成了巨大影响。微博“意见领袖”是受高度关注的一群人,在微博中这个关注度可以通过两个数字加以量化证明:一是粉丝数,二是微博被转载数。微博受关注度的大小和微博主本人及其所发信息有很大关系。在现实社会中具有一定身份地位的名人,凭借已有的名气就能在微博上轻松拥有大量粉丝,他们所发的信息,即使是家长里短的絮叨,也会因名人效应而广受关注。其次,处于信息源上端的微博主,通过发布最快捷、最权威信息,也可以迅速获取关注度。这点在突发事件发生时表现得尤为突出。
申请号为201210250116.1的在先中国专利申请公开了一种面向网络论坛的意见领袖挖掘方法,其利用爬虫抓取论坛数据,并利用消息中间件提高数据处理的实时性;提取网页信息,利用中文分词系统进行分词,并利用谱聚类方法对垃圾评论进行过滤;利用情感语料库进行文本倾向性分析;设定意见领袖的选取标准值,确定意见领袖。该申请能准确挖掘出符合选取标准的意见领袖,但是却没有体现出成为意见领袖的过程中用户行为选择的过程,不能体现出什么样的用户才能成为意见领袖,对不符合选取标准的用户哪些更有可能成为意见领袖没有提及。
发明内容
本发明提供一种面向微博客系统中未来意见领袖的创建方法及系统,通过用户间的博弈结果创建社交网络中未来意见领袖,很好的体现了在博弈过程中用户行为选择的过程,并且可以对微博系统中网络拓扑结构生成与变化进行评估。
为实现上述发明目的,本发明提供了一种面向微博客系统中未来意见领袖的创建方法,该方法包括:
步骤1,初始化网络环境,所述网络环境包括用户属性和用户之间的关系网络;
步骤2,根据公式(e1*p1+e2*p2)/P从所述网络环境中实时选择博弈发起方用户,其中p1和p2分别为产生消息动作和关系动作的期望值,P为产生消息动作和关系动作的加权期望和,e1和e2分别表示消息动作和关系动作在选择过程中所占的权重;
步骤3,选择博弈接受方用户,其中选中与博弈发起方距离为1,2和大于2的用户概率分别为α=0.5,β=0.4,γ=0.1,首先选择博弈接受方与发起方的距离,然后再在与博弈发起方距离为选定距离的用户集合中按照步骤2选出博弈接收方;
步骤4,基于所述博弈发起方用户和博弈接收方用户的用户属性,根据用户收益计算函数构建博弈收益矩阵;
步骤5,根据所述博弈收益矩阵计算是否存在纳什均衡点,如果存在,则选择使双方用户收益和最大的纳什均衡点,根据所述纳什均衡点执行相应的关系动作和消息动作,如果不存在,则选择执行对博弈发起方用户收益最大的关系动作或消息动作;
步骤6,更新参与博弈的博弈发起方用户和博弈接收方用户的用户属性;
步骤7,根据意见领袖公式计算新加入的博弈用户组中每一个博弈用户的意见领袖特征值;
步骤8,根据所述意见领袖特征值的变化趋势,获得成为意见领袖的用户特征组合,利用所述用户特征组合创建未来意见领袖。
其中所述步骤4中的用户收益计算函数为:
Ua=α*qb+β*Δcba+γ*Δcab+δ*I+r
Ub=α*qa+β*Δcab+γ*Δcba+δ*I+r
其中qa,qb分别所述博弈发起方用户A和博弈接收方用户B的平均消息质量,Δcab表示A对B的信任度的变化,Δcba表示B对A的信任度的变化,I表示A、B之间的兴趣交叉度,r为表示用户不确定性的随机分量,Ua、Ub分别表示用户A和B的收益函数,qa、qb分别为用户A和B的平均消息质量,α,β,γ,δ分别表示四个因素在收益中所占比重,其中α+β+γ+δ=1
其中所述步骤7中的意见领袖公式为:
Figure BDA00003090965700031
其中K1,K2,K3分别代表意见领袖的三个特征的权重,三个特征为朋友质量,粉丝质量和消息质量,an代表粉丝数目,fn代表朋友数目,Mq代表消息质量。
进一步的,所述步骤7中的意见领袖公式中:
K1+K2+K3=1,并且0<K1,K2,K3<1。
为实现上述发明目的,本发明还提供一种面向微博客系统中未来意见领袖的创建系统,该系统包括:
网络环境初始化模块,初始化网络环境,所述网络环境包括用户属性和用户之间的关系网络;
博弈用户选择模块,根据公式(e1*p1+e2*p2)/P从所述网络环境中实时选择博弈发起方用户,其中p1和p2分别为产生消息动作和关系动作的期望值,P为产生消息动作和关系动作的加权期望和,e1和e2分别表示消息动作和关系动作在选择过程中所占的权重,
博弈模块,选择博弈接受方用户,其中选中与博弈发起方距离为1,2和大于2的用户概率分别为α=0.5,β=0.4,γ=0.1,首先选择博弈接受方与发起方的距离,然后再在与博弈发起方距离为选定距离的用户集合中按照博弈用户选择模块中的方式选出博弈接收方;
博弈收益矩阵构建模块,基于所述博弈发起方用户和博弈接收方用户的用户属性,根据用户收益计算函数构建博弈收益矩阵;
纳什均衡点计算模块,根据所述博弈收益矩阵计算是否存在纳什均衡点,如果存在,则选择使双方用户收益和最大的纳什均衡点,根据所述纳什均衡点执行相应的关系动作和消息动作,如果不存在,则选择执行对博弈发起方用户收益最大的关系动作或消息动作;
更新用户属性模块,更新参与博弈的博弈发起方用户和博弈接收方用户的用户属性;
特征值计算模块,根据意见领袖公式计算新加入的博弈用户组中每一个博弈用户的意见领袖特征值;
结果获得模块,根据所述意见领袖特征值的变化趋势,获得成为意见领袖的用户特征组合,利用所述用户特征组合创建未来意见领袖。其中所述博弈收益矩阵构建模块中的用户收益计算函数为:
Ua=α*qb+β*Δcba+γ*Δcab+δ*I+r
Ub=α*qa+β*Δcab+γ*Δcba+δ*I+r
其中qa,qb分别所述博弈发起方用户A和博弈接收方用户B的平均消息质量,Δcab表示A对B的信任度的变化,Δcba表示B对A的信任度的变化,I表示A、B之间的兴趣交叉度,r为表示用户不确定性的随机分量,Ua、Ub为用户A和B的收益函数,qa、qb为用户A和B的平均消息质量,α,β,γ,δ分别表示四个因素在收益中所占比重,α+β+γ+δ=1。
其中所述特征值计算模块中的意见领袖公式为:
Figure BDA00003090965700051
其中K1,K2,K3分别代表意见领袖的三个特征的权重,三个特征为朋友质量,粉丝质量和消息质量,an代表粉丝数目,fn代表朋友数目,Mq代表消息质量。
进一步的,所述特征值计算模块中的意见领袖公式中满足:
K1+K2+K3=1,并且0<K1,K2,K3<1。
本发明的有益功效在于:
通过用户间的博弈结果挖掘社交网络中(如微博客系统中)未来意见领袖,很好的体现了在博弈过程中用户行为选择的过程,并且可以对微博系统中网络拓扑结构生成与变化进行评估。本发明针对当前意见领袖在微博客系统中的重要性,不失为一种微博客中见领袖的创建机制。
以下结合附图和具体实施例对本发明进行详细描述,但不作为对本发明的限定。
附图说明
图1是本发明的面向微博客系统中未来意见领袖的创建方法流程图;
图2是本发明的面向微博客系统中未来意见领袖的创建系统示意图;
图3是本发明的面向微博客系统中心的网络环境中未来意见领袖的评估方法流程图。
具体实施方式
图1是本发明的面向微博客系统中未来意见领袖的创建方法流程图。如图1所示,该方法包括:
步骤1,初始化网络环境,所述网络环境包括用户属性和用户之间的关系网络;
步骤2,根据公式(e1*p1+e2*p2)/P从所述网络环境中实时选择博弈发起方用户,其中p1和p2分别为产生消息动作和关系动作的期望值,P为产生消息动作和关系动作的加权期望和,e1和e2分别表示消息动作和关系动作在选择过程中所占的权重,
步骤3,选择博弈接受方用户,其中选中与博弈发起方距离为1,2和大于2的用户概率分别为α=0.5,β=0.4,γ=0.1,首先选择博弈接受方与发起方的距离,然后再在与博弈发起方距离为选定距离的用户集合中按照步骤2选出博弈接收方;
步骤4,基于所述博弈发起方用户和博弈接收方用户的用户属性,根据用户收益计算函数构建博弈收益矩阵;
步骤5,根据所述博弈收益矩阵计算是否存在纳什均衡点,如果存在,则选择使双方用户收益和最大的纳什均衡点,根据所述纳什均衡点执行相应的关系动作和消息动作,如果不存在,则选择执行对博弈发起方用户收益最大的关系动作或消息动作;
步骤6,更新参与博弈的博弈发起方用户和博弈接收方用户的用户属性;
步骤7,根据意见领袖公式计算新加入的博弈用户组中每一个博弈用户的意见领袖特征值;
步骤8,根据所述意见领袖特征值的变化趋势,获得成为意见领袖的用户特征组合,利用所述用户特征组合创建未来意见领袖。
其中所述步骤4中的用户收益计算函数为:
Ua=α*qb+β*Δcba+γ*Δcab+δ*I+r
Ub=α*qa+β*Δcab+γ*Δcba+δ*I+r
其中qa,qb分别所述博弈发起方用户A和博弈接收方用户B的平均消息质量,Δcab表示A对B的信任度的变化,Δcba表示B对A的信任度的变化,I表示A、B之间的兴趣交叉度,r为表示用户不确定性的随机分量,Ua、Ub为用户A和B的收益函数,qa、qb为用户A和B的平均消息质量,α,β,γ,δ分别表示四个因素在收益中所占比重,α+β+γ+δ=1。
其中所述步骤7中的意见领袖公式为:
其中K1,K2,K3分别代表意见领袖的三个特征的权重,三个特征为朋友质量,粉丝质量和消息质量,an代表粉丝数目,fn代表朋友数目,Mq代表消息质量。
进一步的,所述步骤7中的意见领袖公式中:
K1+K2+K3=1,并且0<K1,K2,K3<1。
所述步骤8通过计算每个用户的意见领袖特征值,定义意见领袖特征值超过阀指0.6的用户为意见领袖,选择意见领袖特征值持续快速增长的用户为未来意见领袖。
图2是本发明的面向微博客系统中未来意见领袖的创建系统示意图。如图2所示,该系统包括:
网络环境初始化模块100,初始化网络环境,所述网络环境包括用户属性和用户之间的关系网络;
博弈用户选择模块200,根据公式(e1*p1+e2*p2)/P从所述网络环境中实时选择博弈发起方用户,其中p1和p2分别为产生消息动作和关系动作的期望值,P为产生消息动作和关系动作的加权期望和,e1和e2分别表示消息动作和关系动作在选择过程中所占的权重,
博弈模块300,选择博弈接受方用户,其中选中与博弈发起方距离为1,2和大于2的用户概率分别为α=0.5,β=0.4,γ=0.1,首先选择博弈接受方与发起方的距离,然后再在与博弈发起方距离为选定距离的用户集合中按照博弈用户选择模块中的方式选出博弈接收方;
博弈收益矩阵构建模块400,基于所述博弈发起方用户和博弈接收方用户的用户属性,根据用户收益计算函数构建博弈收益矩阵;
纳什均衡点计算模块500,根据所述博弈收益矩阵计算是否存在纳什均衡点,如果存在,则选择使双方用户收益和最大的纳什均衡点,根据所述纳什均衡点执行相应的关系动作和消息动作,如果不存在,则选择执行对博弈发起方用户收益最大的关系动作或消息动作;
更新用户属性模块600,更新参与博弈的博弈发起方用户和博弈接收方用户的用户属性;
特征值计算模块700,根据意见领袖公式计算新加入的博弈用户组中每一个博弈用户的意见领袖特征值;
结果获得模块800,根据所述意见领袖特征值的变化趋势,获得成为意见领袖的用户特征组合,利用所述用户特征组合创建未来意见领袖。其中所述博弈收益矩阵构建模块400中的用户收益计算函数为:
Ua=α*qb+β*Δcba+γ*Δcab+δ*I+r
Ub=α*qa+β*Δcab+γ*Δcba+δ*I+r
其中qa,qb分别所述博弈发起方用户A和博弈接收方用户B的平均消息质量,Δcab表示A对B的信任度的变化,Δcba表示B对A的信任度的变化,I表示A、B之间的兴趣交叉度,r为表示用户不确定性的随机分量,Ua、Ub为用户A和B的收益函数,qa、qb为用户A和B的平均消息质量,α,β,γ,δ分别表示四个因素在收益中所占比重,α+β+γ+δ=1。
其中所述特征值计算模块700中的意见领袖公式为:
Figure BDA00003090965700081
其中K1,K2,K3分别代表意见领袖的三个特征的权重,三个特征为朋友质量,粉丝质量和消息质量,an代表粉丝数目,fn代表朋友数目,Mq代表消息质量。
进一步的,所述特征值计算模块700中的意见领袖公式中满足:
K1+K2+K3=1,并且0<K1,K2,K3<1。
所述结果获得模块800,通过计算每个用户的意见领袖特征值,定义意见领袖特征值超过阀指0.6的用户为意见领袖,选择意见领袖特征值持续快速增长的用户为未来意见领袖。
具体而言,对于初始化网络环境中网络环境初始化为对用户的不同属性特征按一定比例组合分布在初始网络环境中。在模拟实验中初始化一个网络环境,包括初始化用户属性和初始化用户之间的关系网络,其中用户属性又包括用户的固有属性和用户的可变属性,固有属性是短时间内不会改变的属性,可以用来表示一个用户的内在特征的属性,这些属性主要有以下几点构成:1、用户的消息质量分布函数,2、用户的消息动作频率函数,3、用户的关系动作频率函数,4、用户所属领域。可变属性是指会随着时间改变的属性,主要有以下几点构成:1、用户的粉丝数目,2、用户的朋友数目,3、用户的平均消息质量,4、用户的意见领袖特征值,5、用户在当前时刻产生一个消息动作的期望(与该用户的消息动作频率函数有关),6、用户在当前时刻产生一个关系动作的期望(与该用户的关系动作频率函数有关)。7、用户与其他用户的关系和信任强度,其中信任强度决定了该用户对另一用户是要关注、取消关注或是维持现状。其中步骤S101在实施方案1和实施方案2中又不完全相同,在实施方案1中,步骤S101要初始化的是一个新的网络环境,要对所有的用户属性初始化,在实验方案2中则只需要对新加入的一批用户初始化产生一个新的网路。
而对于选择博弈用户,可以具体分为:
步骤2-1)、从所有用户中按一定策略选择一定比例的用户作为博弈发起方,该策略为希望产生动作期望值越大的用户被选中的概率越大,即一个用户上次动作时间到下次期望动作时间距离越近被选中的概率越大;
步骤2-2)、针对步骤2-1)中选出的每一个博弈发起用户,按照一定策略选择一个博弈接收用户,该策略为以一定概率选择与博弈发起方一定距离的用户,系统中所有用户被选择的概率之和为1,其中与博弈发起方距离越近的用户被选择成为博弈接收方的概率越大;
步骤2-3)对步骤2-2)中选出的每一对参与博弈的用户,根据用户的属性构建收益函数矩阵,找到本次博弈的纳什均衡点,参与博弈的用户按照纳什均衡点产生相应的动作,如果没有纳什均衡点,则按发起方优先选择一组动作组合。
用户在某一时刻从网络中选出要参与本轮博弈的用户对,每个博弈包括两个用户,博弈发起方和博弈接收方,因此博弈用户选择模块可以分为两个部分,博弈发起方用户选择和博弈接收方用户选择,首先从网络中选择一定比例的博弈发起方用户,具体选择哪个用户与用户当前时刻产生消息动作和关系动作的期望有关,期望越大被选则的概率越大,设某个时刻某个用户A产生消息动作的期望值为p1,产生关系动作的期望值为p2,所有用户产生消息动作和关系动作的加权期望和为P,则在该时刻该用户被选择成为一个博弈发起方用户的概率为(e1*p1+e2*p2)/P,其中e1和e2表示两个动作在选择过程中所占的权重。当博弈发起方用户选好后,对每一个博弈发起方用户,选择其对应的博弈接受方用户,具体哪个用户被选择与该用户和发起方的距离有关,与接收方距离越近被选择的概率越大。
而对于博弈过程,在选择博弈用户中选出了某一时刻所有要参与博弈的用户对,对于每一对要参与博弈的用户,首先根据用户的当前属性构建博弈收益矩阵,根据收益矩阵找到本次博弈的纳什均衡点,如果没有纳什均衡点,则按一定策略(发起方收益最大,在图3的具体流程中介绍)选择一组动作组合,参与博弈的用户根据选择的动作组合做出相应的动作。
当用户属性更新后就开始下一轮的博弈过程,随着博弈的进行,用户的属性特征也在改变,根据用户特征变化规律可以观察得出在一个新的网络环境中哪一类用户成为一件领袖的概率更大,或者在一个成熟的网络环境中,一个新的用户加进来后具备什么样的属性可以更快的成为意见领袖。
图3是本发明的面向微博客系统中心的网络环境中未来意见领袖的评估方法流程图。如图3所示,参与博弈的用户又两个,一个是博弈发起方,另一个为博弈接收方,首先要规定参与博弈用户的动作,其中博弈发起方的动作有消息动作UPD和关系动作REL,以及无动作IGN,其中IGN仅限于博弈接收方用户,表示对博弈发起方采取的动作,博弈接收方不采取任何措施。其次要规定不同动作组合下的用户收益,用户的收益跟双方的动作有关,博弈双方又根据收益选择自己相对应的动作。在本系统中,用户的收益主要从两方面来表示,1、消息内容角度,主要表现为用户的消息质量。以及对另一个用户消息的感兴趣程度(与用户所属领域相关)。2、关系角度,主要表现为两个用户之间的信任强度的变化。另外再加上一个随机因子,来表示用户行为的不确定性。在博弈过程中,首先要提取用户的部分固定属性和可变属性(S201),然后根据用户属性和上文提到的动作和收益构造收益矩阵(S202),(用户的收益函数以及收益矩阵的构建如下:
意见领袖特征计算公式:
K 1 A | an - a &OverBar; | + K 2 fn F + K 3 M q
K1,K2,K3分别代表意见领袖的三个特征的权重,三个特征为朋友质量,粉丝质量和消息质量。其中K1+K2+K3=1,并且0<K1,K2,K3<1.an代表粉丝数目,fn代表朋友数目,Mq代表消息质量。
用户收益计算函数:
Ua=α*qb+β*Δcba+γ*Δcab+δ*I+r
Ub=α*qa+β*Δcab+γ*Δcba+δ*I+r
其中qa,qb分别表示用户A和B的平均消息质量。Δcab表示用户A对用户B的信任度的变化,Δcba表示用户B对用户A的信任度的变化。I表示两个博弈用户之间的兴趣交叉度。r为随机分量,用来表示用户的不确定性。要计算用户A、B之间的信任度的变化,我们引入另外两个变量,Pr和Pf,Pr用户代表产生或接受到消息动作的期望,Pf表示用户产生或接受到关系动作的期望值。用户A的期望值分别为Par和Paf。期望值的计算公式如下:
Figure BDA00003090965700102
Pf=et-λ+∈,其中λ表示用户产生下一个动作的期望时刻,根据用户的内在特征计算得出,t表示当前博弈时刻。
用户的内在特征可以用一个四元组(Mq,Mf,Ft,Ff,I)来表示。其中:
Mq表示消息质量,用来表示用户的消息质量的分布模型,在本发明中,我们定义了四种分布模型,(mq1,mq2,mq3,mq4),意义如下:
mq1,用来表示那些对自己发的消息质量非常在乎的用户群体,其质量分布函数为 P ( B ) = &Integral; a b ( &lambda; + 1 ) x &lambda; dx , 其中=1,2,3,……。
mq2,与mq1相反,mq2用来表示那些对自己发的消息质量并不在乎的用户群体,这些用户发布的消息一般很少被人关注,其质量分布函数为 P ( B ) = &Integral; a b | ( &lambda; + 1 ) ( x - 1 ) &lambda; | dx , 其中=1,2,3,……。
mq3,介于mq1和mq2之间,该类用户也比较在乎自己发布的消息质量,但实际上发布的消息质量有好有坏,其质量分布函数为
Figure BDA00003090965700113
其中当0≤x≤0.5时,f(x)=4x;当0.5<x≤1时,f(x)=-4x+4。
mq4,用来表示机器人用户行为,该类用户发布的消息质量维持一个水平不变,其分布函数为 P ( B ) = &Integral; a b 1 b - a dx .
Mf表示用户发消息频率,表示用户连续发两条消息之间间隔时间的概率分布。在本发明中,我们定义了两种频率函数(mf1,mf2),意义如下:
mf1,为泊松分布类型,表示用户两次发消息的时间间隔服从泊松分布,分布函数为 P ( x = k ) = &lambda; k K ! e - &lambda; .
mf2,表示该用户为机器人行为,即用户发消息频率恒定,分布函数为
Figure BDA00003090965700116
其中表示连续发两条消息的最长时间间隔。
Ft为用户的关注行为,用来表示用户是更倾向于关注意见领袖还是关注自己感兴趣的用户。在本发明中,我们定义了两种频率函数(ft1,ft2),意义如下:
ft1,表示用户更倾向于关注意见领袖。
ft2,表示用户更倾向于关注自己感兴趣的用户,不管是意见领袖还是普通用户。
Ff表示采取关注行为的频率,表示用户连续两次关注之间间隔时间的概率分布。在本发明中,我们定义了两种频率函数(ff1,ff2),意义如下:
ff1,为泊松分布类型,表示用户两次采取关注或取消关注行为的时间间隔服从泊松分布,分布函数为
Figure BDA00003090965700121
ff2,表示该用户为机器人行为,即用户关注行为频率恒定,分布函数为 P ( B ) = &Integral; a b 1 b - a dx .
Figure BDA00003090965700124
表示用户的兴趣,通过一组向量来表示,(i1,i2,i3,i4),代表但并不局限与以下四个方面,新闻、娱乐、体育、技术。两个用户之间的兴趣交叉可以通过向量余弦来表示。
根据以上内容所述,我们得出了如下结论:
当用户非常关注自己的消息质量时,即用户消息质量类型为mq1时,比其他用户更有可能成为意见领袖。
发消息频率满足mf1(泊松分布)的用户比其他用户更有可能成为意见领袖。
关注频率满足ff2(机器人行为)的用户比其他用户更有可能成为意见领袖。
而其中的收益矩阵如下:
Figure BDA00003090965700123
对于表中的U1,U3,U5
Δcba=k*(1-cba)*Pbr*qa+∈
对于表中的U2,U4,U6
Δcba=k*(1-cba)*Pbf+∈
对于表中的U1,U2:
Δcab=k*(1-cab)*Par*qb+∈
对于表中的U3,U4
Δcab=k*(1-cab)*Paf+∈
对于表中的U2,U4,U6
Δcab=k*qb+∈
Ua1-Ua6为用户A在不同动作组合下的收益函数,Ua1为用户A选择UPD动作,用户B选择REP动作的情况下,用户A的收益函数。在收益矩阵中A为博弈发起方,B为博弈接收方。收益函数矩阵是博弈的核心,在每一个时刻,首先根据博弈双方的状态构建收益矩阵,然后根据收益矩阵来选择博弈双方的具体动作。
Ua1-Ua6为用户A在不同动作组合下的收益函数,Ua1为用户A选择UPD动作,用户B选择REP动作的情况下,用户A的收益函数。在收益矩阵中A为博弈发起方,B为博弈接收方。收益函数矩阵是博弈的核心,在每一个时刻,首先根据博弈双方的状态构建收益矩阵,然后根据收益矩阵来选择博弈双方的具体动作。Ub1-Ub6是用户B在不同动作组合下的收益函数,Pr用户代表产生或接受到消息动作的期望,Pf表示用户产生或接受到关系动作的期望值。用户A的期望值分别为Par和Paf。用户B的期望值分别为Pbr和Pbf。k参数表示用户信任度的变化比例,其中k∈[0,1],本系统中设置k=0.7。
根据收益矩阵来计算是否存在纳什均衡(S203),如果存在一个或多个,则选择一个纳什均衡,使双方用户收益和最大。如果不存在纳什均衡点(S204),则采用如下策略选取一组动作组合,选取策略为使得博弈发起方收益最大,即选择博弈发起方偏向的一组策略。当选择的动作中包含消息动作时,执行消息动作(S205),其中消息动作UPD包括:1、发布一条消息,2、转发一条消息,3、回复一条消息。博弈用户以一定的概率产生3个消息动作中的一个。当选择的动作中包含消息动作时,执行消息动作(S206),其中关系动作REL包括:1、关注一个用户,2、取消关注一个用户,3、维持现状。具体产生哪个关系动作取决于采取关系动作的用户对另一个用户的信任程度,当信任值低于某个阀值后,采取取消关注,当高于某个阀值后采取关注动作,其他情况下不改变当前状态,只改变用户之间的信任度。S206为执行一个关系动作,在系统中,用户A对用户B有一个信任度cab∈[0,1],特别的,我们设置取消关注的阀指为0.2,关注的阀指为0.6.每次博弈后更新A对B的信任度。
当cab0.6时,用户A对用户B产生一个关注动作,如果A已经关注B,则该关注动作不会产生新的关系。
当cab≤0.2时,A对B产生一个取消关注动作。如果A没有关注B,则维持现状。
当0.2<cab<0.6时,A、B的关系维持现状,只修改他们的信任度。
当然,本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims (8)

1.一种面向微博客系统中未来意见领袖的创建方法,其特征在于,包括:
步骤1,初始化网络环境,所述网络环境包括用户属性和用户之间的关系网络;
步骤2,根据公式(e1*p1+e2*p2)/P从所述网络环境中实时选择博弈发起方用户,其中p1和p2分别为产生消息动作和关系动作的期望值,P为产生消息动作和关系动作的加权期望和,e1和e2分别表示消息动作和关系动作在选择过程中所占的权重;
步骤3,选择博弈接受方用户,其中选中与所述博弈发起方用户距离为1,2和大于2的用户概率分别为α=0.5,β=0.4,γ=0.1,首先选择博弈接受方与发起方的距离,然后再在与博弈发起方距离为选定距离的用户集合中按照步骤2选出博弈接收方;
步骤4,基于所述博弈发起方用户和博弈接收方用户的用户属性,根据用户收益计算函数构建博弈收益矩阵;
步骤5,根据所述博弈收益矩阵计算是否存在纳什均衡点,如果存在,则选择使双方用户收益和最大的纳什均衡点,根据所述纳什均衡点执行相应的关系动作和消息动作,如果不存在,则选择执行使博弈发起方用户收益最大的关系动作或消息动作;
步骤6,更新参与博弈的博弈发起方用户和博弈接收方用户的用户属性;
步骤7,根据意见领袖公式计算新加入的博弈用户组中每一个博弈用户的意见领袖特征值;
步骤8,根据所述意见领袖特征值的变化趋势获得成为意见领袖的用户特征组合,利用所述用户特征组合创建未来意见领袖。
2.如权利要求1所述的面向微博客系统中未来意见领袖的创建方法,其特征在于,所述步骤4中的用户收益计算函数为:
Ua=α*qb+β*Δcba+γ*Δcab+δ*I+r
Ub=α*qa+β*Δcab+γ*Δcba+δ*I+r
其中qa,qb分别所述博弈发起方用户A和博弈接收方用户B的平均消息质量,Δcab表示A对B的信任度的变化,Δcba表示B对A的信任度的变化,I表示A、B之间的兴趣交叉度,r为表示用户不确定性的随机分量,Ua为用户a的收益函数,qb为用户b的平均消息质量,α,β,γ,δ分别表示四个因素在收益中所占比重,α+β+γ+δ=1。
3.如权利要求1所述的面向微博客系统中未来意见领袖的创建方法,其特征在于,所述步骤7中的意见领袖公式为:
Figure FDA00003090965600021
其中K1,K2,K3分别代表意见领袖的三个特征的权重,三个特征为朋友质量,粉丝质量和消息质量,an代表粉丝数目,fn代表朋友数目,Mq代表消息质量。
4.如权利要求3所述的面向微博客系统中未来意见领袖的创建方法,其特征在于,所述步骤7中的意见领袖公式中:
K1+K2+ K3=1,并且0<K1,K2,K3<1。
5.一种面向微博客系统中未来意见领袖的创建系统,其特征在于,包括:
网络环境初始化模块,初始化网络环境,所述网络环境包括用户属性和用户之间的关系网络;
博弈用户选择模块,根据公式(e1*p1+e2*p2)/P从所述网络环境中实时选择博弈发起方用户,其中p1和p2分别为产生消息动作和关系动作的期望值,P为产生消息动作和关系动作的加权期望和,e1和e2分别表示消息动作和关系动作在选择过程中所占的权重;
博弈模块,选择博弈接受方用户,其中选中与博弈发起方距离为1,2和大于2的用户概率分别为α=0.5,β=0.4,γ=0.1,首先选择博弈接受方与发起方的距离,然后再在与博弈发起方距离为选定距离的用户集合中按照博弈用户选择模块中的方式选出博弈接收方;
博弈收益矩阵构建模块,基于所述博弈发起方用户和博弈接收方用户的用户属性,根据用户收益计算函数构建博弈收益矩阵;
纳什均衡点计算模块,根据所述博弈收益矩阵计算是否存在纳什均衡点,如果存在,则选择使双方用户收益和最大的纳什均衡点,根据所述纳什均衡点执行相应的关系动作和消息动作,如果不存在,则选择执行博弈发起方用户的关系动作和消息动作;
更新用户属性模块,更新参与博弈的博弈发起方用户和博弈接收方用户的用户属性;
特征值计算模块,根据意见领袖公式计算新加入的博弈用户组中每一个博弈用户的意见领袖特征值;
结果获得模块,根据所述意见领袖特征值的变化趋势,获得成为意见领袖的用户特征组合,利用所述用户特征组合创建未来意见领袖。
6.如权利要求5所述的面向微博客系统中未来意见领袖的创建系统,其特征在于,所述博弈收益矩阵构建模块中的用户收益计算函数为:
Ua=α*qb+β*Δcba+γ*Δcab+δ*I+r
Ub=α*qa+β*Δcab+γ*Δcba+δ*I+r
其中qa,qb分别所述博弈发起方用户A和博弈接收方用户B的平均消息质量,Δcab表示A对B的信任度的变化,Δcba表示B对A的信任度的变化,I表示A、B之间的兴趣交叉度,r为表示用户不确定性的随机分量,Ua为用户a的收益函数,qb为用户b的平均消息质量,α,β,γ,δ分别表示四个因素在收益中所占比重,α+β+γ+δ=1。
7.如权利要求5所述的面向微博客系统中未来意见领袖的创建系统,其特征在于,所述特征值计算模块中的意见领袖公式为:
Figure FDA00003090965600031
其中K1,K2,K3分别代表意见领袖的三个特征的权重,三个特征为朋友质量,粉丝质量和消息质量,an代表粉丝数目,fn代表朋友数目,Mq代表消息质量。
8.如权利要求7所述的面向微博客系统中未来意见领袖的创建系统,其特征在于,所述特征值计算模块中的意见领袖公式中满足:
K1+K2+K3=1,并且0<K1,K2,K3<1。
CN201310144152.4A 2013-04-23 2013-04-23 一种面向微博客系统中未来意见领袖的创建方法及系统 Active CN103279484B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310144152.4A CN103279484B (zh) 2013-04-23 2013-04-23 一种面向微博客系统中未来意见领袖的创建方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310144152.4A CN103279484B (zh) 2013-04-23 2013-04-23 一种面向微博客系统中未来意见领袖的创建方法及系统

Publications (2)

Publication Number Publication Date
CN103279484A true CN103279484A (zh) 2013-09-04
CN103279484B CN103279484B (zh) 2016-03-30

Family

ID=49062004

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310144152.4A Active CN103279484B (zh) 2013-04-23 2013-04-23 一种面向微博客系统中未来意见领袖的创建方法及系统

Country Status (1)

Country Link
CN (1) CN103279484B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104091206A (zh) * 2014-06-18 2014-10-08 北京邮电大学 基于演化博弈论的社交网络信息传播预测方法
CN109857871A (zh) * 2019-01-28 2019-06-07 重庆邮电大学 一种基于社交网络海量情景数据的用户关系发现方法
CN110489658A (zh) * 2019-07-12 2019-11-22 北京邮电大学 基于双图模型的在线社交网络意见领袖挖掘方法
CN111831881A (zh) * 2020-07-04 2020-10-27 西安交通大学 一种基于网站流量日志数据与优化谱聚类算法的恶意爬虫检测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040167814A1 (en) * 1999-08-31 2004-08-26 Comsort, Inc. System for influence network marketing
CN102609460A (zh) * 2012-01-13 2012-07-25 中国科学院计算技术研究所 微博客数据采集方法及系统
CN102662956A (zh) * 2012-03-05 2012-09-12 西北工业大学 一种基于用户话题链接行为的社交网络意见领袖识别方法
CN102890702A (zh) * 2012-07-19 2013-01-23 中国人民解放军国防科学技术大学 一种面向网络论坛的意见领袖挖掘方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040167814A1 (en) * 1999-08-31 2004-08-26 Comsort, Inc. System for influence network marketing
CN102609460A (zh) * 2012-01-13 2012-07-25 中国科学院计算技术研究所 微博客数据采集方法及系统
CN102662956A (zh) * 2012-03-05 2012-09-12 西北工业大学 一种基于用户话题链接行为的社交网络意见领袖识别方法
CN102890702A (zh) * 2012-07-19 2013-01-23 中国人民解放军国防科学技术大学 一种面向网络论坛的意见领袖挖掘方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王君泽 等: "微博客意见领袖识别模型研究", 《新闻与传播研究》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104091206A (zh) * 2014-06-18 2014-10-08 北京邮电大学 基于演化博弈论的社交网络信息传播预测方法
CN104091206B (zh) * 2014-06-18 2017-07-28 北京邮电大学 基于演化博弈论的社交网络信息传播预测方法
CN109857871A (zh) * 2019-01-28 2019-06-07 重庆邮电大学 一种基于社交网络海量情景数据的用户关系发现方法
CN110489658A (zh) * 2019-07-12 2019-11-22 北京邮电大学 基于双图模型的在线社交网络意见领袖挖掘方法
CN111831881A (zh) * 2020-07-04 2020-10-27 西安交通大学 一种基于网站流量日志数据与优化谱聚类算法的恶意爬虫检测方法
CN111831881B (zh) * 2020-07-04 2023-03-21 西安交通大学 一种基于网站流量日志数据与优化谱聚类算法的恶意爬虫检测方法

Also Published As

Publication number Publication date
CN103279484B (zh) 2016-03-30

Similar Documents

Publication Publication Date Title
CN103064917B (zh) 一种面向微博的特定倾向的高影响力用户群发现方法
CN103024017B (zh) 一种社交网络重要目标及社区群体识别方法
Hu et al. Disassortative mixing in online social networks
Jin et al. Research on social network structure and public opinions dissemination of micro-blog based on complex network analysis
CN106991617B (zh) 一种基于信息传播的微博社交关系提取算法
CN103593393B (zh) 基于微博互动关系挖掘社交圈的方法及装置
CN103984775A (zh) 一种推荐好友的方法和设备
CN103179198B (zh) 基于多关系网络的话题影响力个体挖掘方法
CN103279484A (zh) 一种面向微博客系统中未来意见领袖的创建方法及系统
Fatemi et al. A community based social recommender system for individuals & groups
CN106372239A (zh) 一种基于异质网络的社交网络事件关联分析方法
CN105608624A (zh) 基于用户体验的微博大数据兴趣社区分析优化方法
CN105550275A (zh) 一种微博转发量预测方法
CN105592405A (zh) 基于派系过滤和标签传播的移动通信用户群组构造方法
Wang et al. A genealogy of information spreading on microblogs: A Galton-Watson-based explicative model
CN109726319A (zh) 一种基于交互关系的用户影响力分析方法
Nissanke Linking economic growth to poverty reduction under globalization
CN103279483B (zh) 一种面向微博客的话题流行范围评估方法及系统
Möhlmeier et al. A degree‐distance‐based connections model with negative and positive externalities
CN104683370A (zh) 一种内容聚合方法、服务器、客户端以及系统
CN103995886B (zh) 一种多维度产品设计知识推送框架与构建方法
CN110851684B (zh) 一种基于三元关联图的社交话题影响力识别方法及装置
Xuan et al. Empirical analysis of Internet telephone network: From user ID to phone
Fu et al. Preferential information dynamics model for online social networks
Sun et al. A trust-augmented voting scheme for collaborative privacy management

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20130904

Assignee: Branch DNT data Polytron Technologies Inc

Assignor: Institute of Computing Technology, Chinese Academy of Sciences

Contract record no.: 2018110000033

Denomination of invention: Creating method and creating system facing future opinion leaders in micro-blog system

Granted publication date: 20160330

License type: Common License

Record date: 20180807

EE01 Entry into force of recordation of patent licensing contract