CN105183728A - 一种微博中人物关联关系分析方法 - Google Patents
一种微博中人物关联关系分析方法 Download PDFInfo
- Publication number
- CN105183728A CN105183728A CN201410234624.XA CN201410234624A CN105183728A CN 105183728 A CN105183728 A CN 105183728A CN 201410234624 A CN201410234624 A CN 201410234624A CN 105183728 A CN105183728 A CN 105183728A
- Authority
- CN
- China
- Prior art keywords
- microblog users
- social circle
- utility value
- microblogging
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种微博中人物关联关系分析方法,所述算法步骤包括:(1)通过原始信息,获得博主的基础微博信息,如注册地、粉丝数、关注数、微博数;(2)找出该博主的关注人信息;(3)找出该博主的相互关注人信息;(4)找出博主的所有博文信息;(5)找出微博上与博主具有相同博文的博主信息;(6)找出博主的信息以及博主其他人的微博信息;(7)找出博主微博中的地点信息,并获得微博中的相同时间范围内的相同地点信息;(8)对步骤2和3中的信息进行人物关系权重运算,对步骤4、5和6进行互动频度权重计算,对步骤7进行线下关系判断;(9)获得博主的微博关联关系列表。
Description
技术领域
本发明涉及一种微博分析方法,具体来说涉及一种微博中人物关联关系分析方法。
背景技术
微博的出现使得互联网上的信息传播越来越快捷,微博的出现使得个人媒体走上互联网的历史舞台,这使得微博中的人际关系同时具有多元化、个人化、行业化、从众化、临时聚合化等复杂的特征,如何研究微博中的人际关系,是互联网信息传播研究中的重要一环。然而目前无相关技术方案分析微博中的人际关系,大多通过人工方式来判断特定的两个或几个博主之间是否有关注关系。
发明内容
本发明所要解决的技术问题在于克服上述现有技术中存在的缺陷,而提供一种微博中人物关联关系分析方法,针对微博博主进行互联网人际关系分析,从海量数据中抽取该博主在微博上的各类关联关系,从而为微博信息的传播提供分析依据。
为实现上述目的,本发明提供一种微博中人物关联关系分析方法,所述算法步骤包括:
(1)通过原始信息,获得博主的基础微博信息,如注册地、粉丝数、关注数、微博数;
(2)找出该博主的关注人信息;
(3)找出该博主的相互关注人信息;
(4)找出博主的所有博文信息;
(5)找出微博上与博主具有相同博文的博主信息;
(6)找出博主的信息以及博主其他人的微博信息;
(7)找出博主微博中的地点信息,并获得微博中的相同时间范围内的相同地点信息;
(8)对步骤2和3中的信息进行人物关系权重运算,对步骤4、5和6进行互动频度权重计算,对步骤7进行线下关系判断;
(9)获得博主的微博关联关系列表。
优选地,所述微博中人物关联关系分析方法还包括:
A1,获取与目标微博用户具有互动行为的微博用户集合;
B1,依据互动行为关系,构造用户关系拓扑图,并基于构造的用户关系拓扑图挖掘得到全联通子图,计算挖掘得到的各全联通子图的效用值并分别存储;
C1,针对每一全联通子图,依据互动行为关系生成每一全联通子图对应的扩充微博用户集合;
D1,在扩充微博用户集合中,获取与微博用户集合中的任一微博用户具有互动行为、且不属于微博用户集合的微博用户,加入存储的扩充微博用户集合对应的全联通子图,形成社交圈候选集合;
E1,计算社交圈候选集合的效用值,确定社交圈候选集合的效用值大于或等于对应存储的效用值,更新对应存储的效用值以及全联通子图;
F1,判断加入社交圈候选集合中的微博用户是否为扩充微博用户集合中的最后一个微博用户,如果不是,遍历扩充微博用户集合,返回执行步骤D1,否则,形成社交圈集合。
优选地,在所述形成社交圈集合的步骤之前,该方法进一步包括:
A11,在微博互动行为日志中,获取与微博用户集合中的任一微博用户具有互动行为、且不属于微博用户集合的微博用户,构建二级互动集合;
A12,将获取的微博用户加入存储的全联通子图,形成二级社交圈候选集合;
A13,计算二级社交圈候选集合的效用值,如果二级社交圈候选集合的效用值大于或等于对应存储的效用值,更新对应存储的效用值,用二级社交圈候选集合更新存储的全联通子图;否则,不作处理;
A14,判断获取的微博用户是否为二级互动集合中的最后一个微博用户,如果不是,遍历二级互动集合,返回执行步骤A12;否则,获取存储的全联通子图信息,执行所述形成社交圈集合的流程。
优选地,每一所述二级社交圈候选集合以及该二级社交圈候选集合的效用值对应一个存储单元。
优选地,所述互动行为包括:转发微博、评论微博、私信以及其它微博用户。
优选地,计算所述效用值的效用函数为:Utility(T)为全取通子图T的效用值;Weight(Eα)为全联通子图T中内部边α的效用值;ETin为全联通子图T中所有节点包含的内部边;Weight(Eβ)为全联通子图T中所有节点与全联通子图T之外的、且在微博用户集合S中的任意节点形成的边β的效用值;ETout为全联通子图T中所有节点与全联通子图T之外的、且在微博用户集合S中的任意节点形成的所有边。
优选地,所述确定社交圈候选集合的效用值大于或等于对应存储的效用值,其中,Utility(Z)为将微博用户W融合至全联通子图T中形成的社交圈候选集合Z的效用值;Weight(Ea′)为社交圈候选集合Z中内部边a′的效用值;EZin为社交圈候选集合Z中所有节点包含的内部边;Weight(Eβ′)为社交圈候选集合Z中所有节点与社交圈候选集合Z之外的、且在微博用户集合S中的任意节点形成的边β′的效用值;EZout为社交圈候选集合Z中所有节点与社交圈候选集合Z之外的、且在微博用户集合S中的任意节点形成的所有边;Utility(T)为存储的效用值
本发明提供了一种微博中人物关联关系分析方法,针对微博博主进行互联网人际关系分析,从海量数据中抽取该博主在微博上的各类关联关系,从而为微博信息的传播提供分析依据。
具体实施方式:
下面对发明的实施例进一步详述。
一种微博中人物关联关系分析方法,所述算法涉骤包括:
(1)通过原始信息,获得博主的基础微博信息,如注册地、粉丝数、关注数、微博数;
(2)找出该博主的关注人信息;
(3)找出该博主的相互关注人信息;
(4)找出博主的所有博文信息;
(5)找出微博上与博主具有相同博文的博主信息;
(6)找出博主的信息以及博主其他人的微博信息;
(7)找出博主微博中的地点信息,并获得微博中的相同时间范围内的相同地点信息;
(8)对步骤2和3中的信息进行人物关系权重运算,对步骤4、5和6进行互动频度权重计算,对步骤7进行线下关系判断;
(9)获得博主的微博关联关系列表。
所述微博中人物关联关系分析方法还包括:
A1,获取与目标微博用户具有互动行为的微博用户集合;
B1,依据互动行为关系,构造用户关系拓扑图,并基于构造的用户关系拓扑图挖掘得到全联通子图,计算挖掘得到的各全联通子图的效用值并分别存储;
C1,针对每一全联通子图,依据互动行为关系生成每一全联通子图对应的扩充微博用户集合;
D1,在扩充微博用户集合中,获取与微博用户集合中的任一微博用户具有互动行为、且不属于微博用户集合的微博用户,加入存储的扩充微博用户集合对应的全联通子图,形成社交圈候选集合;
E1,计算社交圈候选集合的效用值,确定社交圈候选集合的效用值大于或等于对应存储的效用值,更新对应存储的效用值以及全联通子图;
F1,判断加入社交圈候选集合中的微博用户是否为扩充微博用户集合中的最后一个微博用户,如果不是,遍历扩充微博用户集合,返回执行步骤D1,否则,形成社交圈集合。
在所述形成社交圈集合的步骤之前,该方法进一步包括:
A11,在微博互动行为日志中,获取与微博用户集合中的任一微博用户具有互动行为、且不属于微博用户集合的微博用户,构建二级互动集合;
A12,将获取的微博用户加入存储的全联通子图,形成二级社交圈候选集合;
A13,计算二级社交圈候选集合的效用值,如果二级社交圈候选集合的效用值大于或等于对应存储的效用值,更新对应存储的效用值,用二级社交圈候选集合更新存储的全联通子图;否则,不作处理;
A14,判断获取的微博用户是否为二级互动集合中的最后一个微博用户,如果不是,遍历二级互动集合,返回执行步骤A12,否则,获取存储的全联通子图信息,执行所述形成社交圈集合的流程。
每一所述二级社交圈候选集合以及该二级社交圈候选集合的效用值对应一个存储单元。
所述互动行为包括:转发微博、评论微博、私信以及其它微博用户。
计算所述效用值的效用函数为:Utility(T)为全联通子图T的效用值;Weight(Eα)为全联通子图T中内部边α的效用值;ETin为全联通子图T中所有节点包含的内部边;Weight(Eβ)为全联通子图T中所有节点与全联通子图T之外的、且在微博用户集合S中的任意节点形成的边β的效用值;ETout为全联通子图T中所有节点与全联通子图T之外的、且在微博用户集合S中的任意节点形成的所有边。
所述确定社交图候选集合的效用值大于或等于对应存储的效用值,其中,Utility(Z)为将微博用户W融合至全联通子图T中形成的社交圈候选集合Z的效用值;Weight(Ea′)为社交圈候选集合Z中内部边a′的效用值;EZin为社交圈候选集合Z中所有节点包含的内部边;Weight(Eβ′)为社交圈候选集合Z中所有节点与社交圈候选集合Z之外的、且在微博用户集合S中的任意节点形成的边β′的效用值;EZout为社交圈候选集合Z中所有节点与社交圈候选集合Z之外的、且在微博用户集合S中的任意节点形成的所有边;Utility(T)为存储的效用值。
以上对本发明的实施例进行了详细说明,但所述内容仅为本发明的较佳实施例,不能被认为用于限定本发明的实施范围。凡依本发明申请范围所作的均等变化与改进等,均应仍归属于本发明的专利涵盖范围之内。
Claims (7)
1.一种微博中人物关联关系分析方法,所述算法步骤包括:
(1)通过原始信息,获得博主的基础微博信息,如注册地、粉丝数、关注数、微博数;
(2)找出该博主的关注人信息;
(3)找出该博主的相互关注人信息;
(4)找出博主的所有博文信息;
(5)找出微博上与博主具有相同博文的博主信息;
(6)找出博主的信息以及博主其他人的微博信息;
(7)找出博主微博中的地点信息,并获得微博中的相同时间范围内的相同地点信息;
(8)对步骤2和3中的信息进行人物关系权重运算,对步骤4、5和6进行互动频度权重计算,对步骤7进行线下关系判断;
(9)获得博主的微博关联关系列表。
2.根据权利要求1中所述的微博中人物关联关系分析方法,其特征在于:所述微博中人物关联关系分析方法还包括:
A1,获取与目标微博用户具有互动行为的微博用户集合;
B1,依据互动行为关系,构造用户关系拓扑图,并基于构造的用户关系拓扑图挖掘得到全联通子图,计算挖掘得到的各全联通子图的效用值并分别存储;
C1,针对每一全联通子图,依据互动行为关系生成每一全联通子图对应的扩充微博用户集合;
D1,在扩充微博用户集合中,获取与微博用户集合中的任一微博用户具有互动行为、且不属于微博用户集合的微博用户,加入存储的扩充微博用户集合对应的全联通子图,形成社交圈候选集合;
E1,计算社交圈候选集合的效用值,确定社交圈候选集合的效用值大于或等于对应存储的效用值,更新对应存储的效用值以及全联通子图;
F1,判断加入社交圈候选集合中的微博用户是否为扩充微博用户集合中的最后一个微博用户,如果不是,遍历扩充微博用户集合,返回执行步骤D1,否则,形成社交圈集合。
3.根据权利要求2中所述的微博中人物关联关系分析方法,其特征在于:在所述形成社交圈集合的步骤之前,该方法进一步包括:
A11,在微博互动行为日志中,获取与微博用户集合中的任一微博用户具有互动行为、且不属于微博用户集合的微博用户,构建二级互动集合;
A12,将获取的微博用户加入存储的全联通子图,形成二级社交圈候选集合;
A13,计算二级社交圈候选集合的效用值,如果二级社交圈候选集合的效用值大于或等于对应存储的效用值,更新对应存储的效用值,用二级社交圈候选集合更新存储的全联通子图;否则,不作处理;
A14,判断获取的微博用户是否为二级互动集合中的最后一个微博用户,如果不是,遍历二级互动集合,返回执行步骤A12,否则,获取存储的全联通子图信息,执行所述形成社交圈集合的流程。
4.根据权利要求3中所述的微博中人物关联关系分析方法,其特征在于:每一所述二级社交圈候选集合以及该二级社交圈候选集合的效用值对应一个存储单元。
5.根据权利要求3中所述的微博中人物关联关系分析方法,其特征在于:所述互动行为包括:转发微博、评论微博、私信以及其它微博用户。
6.根据权利要求3中所述的微博中人物关联关系分析方法,其特征在于:计算所述效用值的效用函数为:Utility(T)为全联通子图T的效用值;Weight(Eα)为全联通子图T中内部边α的效用值;ETin为全联通子图T中所有节点包含的内部边;Weight(Eβ)为全联通子图T中所有节点与全联通子图T之外的、且在微博用户集合S中的任意节点形成的边β的效用值;ETout为全联通子图T中所有节点与全联通子图T之外的、且在微博用户集合S中的任意节点形成的所有边。
7.根据权利要求3中所述的微博中人物关联关系分析方法,其特征在于:所述确定社交圈候选集合的效用值大于或等于对应存储的效用值,其中,Utility(Z)为将微博用户W融合至全联通子图T中形成的社交圈候选集合Z的效用值;Weight(Ea′)为社交圈候选集合Z中内部边a′的效用值;EZin为社交圈候选集合Z中所有节点包含的内部边;Weight(Eβ′)为社交圈候选集合Z中所有节点与社交圈候选集合Z之外的、且在微博用户集合S中的任意节点形成的边β′的效用值;EZout为社交圈候选集合Z中所有节点与社交圈候选集合Z之外的、且在微博用户集合S中的任意节点形成的所有边;Utility(T)为存储的效用值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410234624.XA CN105183728A (zh) | 2014-05-30 | 2014-05-30 | 一种微博中人物关联关系分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410234624.XA CN105183728A (zh) | 2014-05-30 | 2014-05-30 | 一种微博中人物关联关系分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105183728A true CN105183728A (zh) | 2015-12-23 |
Family
ID=54905817
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410234624.XA Pending CN105183728A (zh) | 2014-05-30 | 2014-05-30 | 一种微博中人物关联关系分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105183728A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106294564A (zh) * | 2016-07-27 | 2017-01-04 | 乐视控股(北京)有限公司 | 一种视频推荐方法及装置 |
CN107463551A (zh) * | 2017-07-17 | 2017-12-12 | 广州特道信息科技有限公司 | 社交网络人际关系的分析方法及装置 |
CN107481154A (zh) * | 2017-07-17 | 2017-12-15 | 广州特道信息科技有限公司 | 社交网络人际关系的分析方法及装置 |
CN108228608A (zh) * | 2016-12-14 | 2018-06-29 | 北大方正集团有限公司 | 人物的推荐方法、系统及终端 |
CN110472680A (zh) * | 2019-08-08 | 2019-11-19 | 京东城市(北京)数字科技有限公司 | 目标分类方法、装置和计算机可读存储介质 |
-
2014
- 2014-05-30 CN CN201410234624.XA patent/CN105183728A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106294564A (zh) * | 2016-07-27 | 2017-01-04 | 乐视控股(北京)有限公司 | 一种视频推荐方法及装置 |
CN108228608A (zh) * | 2016-12-14 | 2018-06-29 | 北大方正集团有限公司 | 人物的推荐方法、系统及终端 |
CN107463551A (zh) * | 2017-07-17 | 2017-12-12 | 广州特道信息科技有限公司 | 社交网络人际关系的分析方法及装置 |
CN107481154A (zh) * | 2017-07-17 | 2017-12-15 | 广州特道信息科技有限公司 | 社交网络人际关系的分析方法及装置 |
CN110472680A (zh) * | 2019-08-08 | 2019-11-19 | 京东城市(北京)数字科技有限公司 | 目标分类方法、装置和计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103795613B (zh) | 一种在线社交网络中朋友关系预测的方法 | |
TWI536297B (zh) | Risk control method and system of network virtual users | |
CN105183728A (zh) | 一种微博中人物关联关系分析方法 | |
WO2017167071A1 (zh) | 一种对应用程序进行项目评估的方法及系统 | |
CN107341220B (zh) | 一种多源数据融合方法和装置 | |
CN107403092B (zh) | 一种手机app隐私风险量化评估方法 | |
CN109783614B (zh) | 一种社交网络待发布文本的差分隐私泄露检测方法及系统 | |
TW201504829A (zh) | 圖像搜尋、獲取圖像文字資訊的方法及裝置 | |
CN103745000A (zh) | 一种中文微博客的热点话题检测方法 | |
CN105095625B (zh) | 点击率预估模型建立方法、装置及信息提供方法、系统 | |
CN104915354B (zh) | 多媒体文件推送方法及装置 | |
CN105868267B (zh) | 一种移动社交网络用户兴趣的建模方法 | |
Mathur et al. | Factors influencing professionals’ decision for cloud computing adoption | |
CN104090971A (zh) | 面向个性化应用的跨网络行为关联方法 | |
CN105678590A (zh) | 一种面向社交网络基于云模型的topN推荐方法 | |
CN103593393A (zh) | 基于微博互动关系挖掘社交圈的方法及装置 | |
CN110197404A (zh) | 可降低流行度偏差的个性化长尾商品推荐方法和系统 | |
Ju et al. | Relationship strength estimation based on Wechat Friends Circle | |
TW201510901A (zh) | 對建議系統的基於強度之建模 | |
Xiao et al. | Towards confidence interval estimation in truth discovery | |
TW201719569A (zh) | 社交業務特徵用戶的識別方法和裝置 | |
Umair et al. | Discovering personal places from location traces | |
CN107194492A (zh) | 一种基于位置社交网络的商家推荐的优化方法 | |
Zhang et al. | Sport location-based user clustering with privacy-preservation in wireless iot-driven healthcare | |
CN105373591B (zh) | 移动社交网络中基于时空行为模式的用户兴趣模型构建方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20151223 |
|
WD01 | Invention patent application deemed withdrawn after publication |