CN105608625A - 一种基于微博用户质量的信息影响力评估方法 - Google Patents

一种基于微博用户质量的信息影响力评估方法 Download PDF

Info

Publication number
CN105608625A
CN105608625A CN201610003416.8A CN201610003416A CN105608625A CN 105608625 A CN105608625 A CN 105608625A CN 201610003416 A CN201610003416 A CN 201610003416A CN 105608625 A CN105608625 A CN 105608625A
Authority
CN
China
Prior art keywords
user
quality
information
influence
microblog
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610003416.8A
Other languages
English (en)
Inventor
杨武
于淼
王巍
苘大鹏
玄世昌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN201610003416.8A priority Critical patent/CN105608625A/zh
Publication of CN105608625A publication Critical patent/CN105608625A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及社会网络数据挖掘领域,具体涉及一种基于微博用户质量的信息影响力评估方法。本发明包括数据采集;数据处理;用户质量计算;动态消息影响力计算。本发明提出一种基于微博用户质量的信息影响力评估方法,该技术主要考虑参与微博信息传播的用户质量,来对传统的影响力最大化问题进行改进。并取得了良好的影响效果。本发明能够有效的评估微博消息影响力,屏蔽机器人粉丝造成的虚假微博影响力。

Description

一种基于微博用户质量的信息影响力评估方法
技术领域
本发明涉及社会网络数据挖掘领域,具体涉及一种基于微博用户质量的信息影响力评估方法。
背景技术
随着社会网络的飞速发展,社会媒体的多样化,以及社会网络用户的迅速增长,加速了社会网络的大数据时代的来临。微博作为一个典型的社会网络平台,被大量的研究人员所关注。
早前的微博影响力的研究,主要是针对用户影响力的研究,广泛的研究人员认为,微博的转发数和关注数可以代表微博消息的影响力。然而,近年来随着微博网络的兴起,微博中产生了大量的用户,同时也产生了大量的僵尸粉丝以及机器人用户。僵尸用户以及机器人用户的产生,对消息影响力的评价产生了巨大的冲击。例如,用户可以通过购买机器人用户大量的转发其消息来形成虚假的影响力,已达到误导其他用户的目的。
微博消息影响力的评价对网络舆情和商业领域都有着重大的作用。在舆情领域中,如何正确的评价一条信息的影响力是微博热门话题和突发话题检测的关键。在商业领域,如何有效的评价一条信息的影响力可以帮助商家正确的评价广告投放的效果。现有的消息影响力仅考虑微博的转发数和回复数,并没有考虑参与微博消息的用户,以及信息的传播结构和时间属性。
本文针对现有的消息影响力评估问题的不足,重点考虑参与信息传播的用户,提出了一种基于微博用户质量的信息影响力评估方法。该算法能够有效的评估微博消息的真实影响力。
发明内容
本发明的目的在于提供一种利用从微博网络上获取的用户属性信息,通考虑时间权重和结构权重来计算微博信息影响力的基于微博用户质量的信息影响力评估方法。
本发明的目的是这样实现的:
数据采集:
A1获取参与微博信息传播的用户的配置信息,包括粉丝数,关注数;
A2获取微博信息传播过程中的用户间的转发关系和回复关系;
A3获取用户转发和回复信息的时间;
数据处理:
B1根据信息传播的转发和回复关系构建信息传播结构图;
B2根据参与微博信息传播的用户的操作行为分类用户;
用户质量计算:
C1采用用户的粉丝数和关注数比作为用户质量的初始值;
C2根据用户参与信息传播的操作类型计算用户质量;
C3根据用户参与信息的时间给予不同的权重值;
C4根据用户在信息传播中的层级给予不同的权重值;
动态消息影响力计算:
D1根据参与的用户的时间考虑时间衰减来计算微博消息的影响力。
本发明的有益效果在于:
本发明提出一种基于微博用户质量的信息影响力评估方法,该技术主要考虑参与微博信息传播的用户质量,来对传统的影响力最大化问题进行改进。并取得了良好的影响效果。
本发明能够有效的评估微博消息影响力,屏蔽机器人粉丝造成的虚假微博影响力。
附图说明
图1是本发明第一实施例提供的基于微博用户质量的信息影响力评估方法的总体流程图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。
为实现上诉发明目的,本发明提供一种基于微博用户质量的信息影响力评估方法实现包括以下阶段:
A1数据采集;
A2数据处理;
A3用户质量计算;
A4动态计算消息影响力;
所述步骤A1中,其所述数据采集的步骤包括:
步骤A11:获取参与微博信息传播的用户的配置信息,包括粉丝数,关注数;
步骤A12:获取微博信息传播过程中的用户间的转发关系和回复关系;
步骤A13:获取用户转发和回复信息的时间;
所述步骤A2中,其所述数据处理的步骤包括:
步骤A21:根据信息传播的转发和回复关系计算用户所属层级;
步骤A22:根据参与微博信息传播的用户的操作行为分类用户;
所述步骤A3中,其所述用户质量计算的步骤为:
步骤A31:采用用户的粉丝数和关注数比作为用户质量的初始值;
步骤A32:根据用户参与信息传播的操作类型计算用户质量。
步骤A33:根据用户参与信息的时间给予不同的权重值。
步骤A34:根据用户在信息传播中的层级给予不同的权重值。
所述步骤A4中,其所述的动态计算消息影响力步骤为:
步骤A41:根据参与的用户的时间考虑时间衰减来计算微博消息的影响力。
图1是本发明第一实施例提供的微博特定类型用户的影响力最大化的总体流程图,该方法详述如下:
在步骤101,数据采集是指从微博网络中获取用户的粉丝数、关注数配置信息,同时提取微博消息的转发与回复关系,以及操作时间。
在步骤102中,数据处理是指根据用户的操作信息将用户分类成为转发用户和回复用户。
根据用户在信息传播过程中的转发关系和回复关系计算用户所在层级。
在步骤103中,用户质量计算主要是根据用户的粉丝数和关注数给予初始的用户质量。
Q ( u ) = follower u followee u
其中followeru表示u用户的粉丝数,followeeu表示u用户的关注数。
如果用户为转发用户则用户的质量为
m u = &lambda; n Q ( u ) 3 Q ( u ) &GreaterEqual; 1 &lambda; n Q ( u ) Q ( u ) < 1 - - - ( 2 )
其中λ为调节系数。
如果用户为回复用户
m u = 1 Q ( u ) &GreaterEqual; 1 a n d n = 0 Q ( u ) Q ( u ) < 1 a n d n = 0 0 n &NotEqual; 0 - - - ( 3 )
其中n表示u对消息的回复次数。
然而在真实的计算中,尽管用户拥有很低的用户质量,但是如果通过大量的低质量转发也会产生一定的影响力累积。因此本专利考虑针对大量低质量用户参与的惩罚机制,惩罚机制如下:
w(t)=N×f(4)
其中N表示低于一定阈值的用户个数,f表示惩罚系数。
本专利考虑,用户在不同时间段内的转发会产生不同的效果,例如在晚上的上网高峰期,用户转发后其粉丝转发他的转发的概率会更大。因此给予本文的时间权重。
T t = 1 t &Element; 6 : 00 ~ 9 : 00 o r 18 : 00 ~ 22 : 00 0.5 o t h e r w i s e - - - ( 5 )
本专利考虑时间重要性的同时考虑信息的传播结构,具有高影响力的信息其传播具有高转发层级。因此针对用户的层级结构给予层级权重。
S(u)=βhu(5)
其中β表示层级全值,hu表示u用户转发所在的层级。
在步骤104中,动态影响力计算,是指根据消息影响力的衰减,动态的计算信息的影响力。
针对以上的用户质量计算给予了本文的信息影响力计算公式如下:
&Delta;M m ( t ) = &Sigma; m u &Element; T R ( t ) S ( u ) m u T i , j + &Sigma; m u &Element; T C ( t ) &rho;m u + w ( t ) - - - ( 6 )
由于在真实信息的传播过程中,信息的影响力是具有衰减的,因此针对上文的信息影响力公式,给予动态的影响力计算公式如下:
Mm(t)=μMm(t-1)+ΔMm(t)(7)
其中μ为衰减系数。

Claims (1)

1.一种基于微博用户质量的信息影响力评估方法,其特征在于,包括如下步骤:数据采集:
A1获取参与微博信息传播的用户的配置信息,包括粉丝数,关注数;
A2获取微博信息传播过程中的用户间的转发关系和回复关系;
A3获取用户转发和回复信息的时间;
数据处理:
B1根据信息传播的转发和回复关系构建信息传播结构图;
B2根据参与微博信息传播的用户的操作行为分类用户;
用户质量计算:
C1采用用户的粉丝数和关注数比作为用户质量的初始值;
C2根据用户参与信息传播的操作类型计算用户质量;
C3根据用户参与信息的时间给予不同的权重值;
C4根据用户在信息传播中的层级给予不同的权重值;
动态消息影响力计算:
D1根据参与的用户的时间考虑时间衰减来计算微博消息的影响力。
CN201610003416.8A 2016-01-04 2016-01-04 一种基于微博用户质量的信息影响力评估方法 Pending CN105608625A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610003416.8A CN105608625A (zh) 2016-01-04 2016-01-04 一种基于微博用户质量的信息影响力评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610003416.8A CN105608625A (zh) 2016-01-04 2016-01-04 一种基于微博用户质量的信息影响力评估方法

Publications (1)

Publication Number Publication Date
CN105608625A true CN105608625A (zh) 2016-05-25

Family

ID=55988543

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610003416.8A Pending CN105608625A (zh) 2016-01-04 2016-01-04 一种基于微博用户质量的信息影响力评估方法

Country Status (1)

Country Link
CN (1) CN105608625A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106257459A (zh) * 2016-08-03 2016-12-28 哈尔滨工程大学 一种基于关键用户的微博信息传播预测方法
CN106933949A (zh) * 2017-01-20 2017-07-07 浙江大学 一种控制社交网络中影响力爆发的规划方法
CN109492924A (zh) * 2018-11-21 2019-03-19 哈尔滨工程大学 一种基于微博用户自身和行为价值二阶的影响力评估方法
CN110909227A (zh) * 2018-09-18 2020-03-24 北京国双科技有限公司 一种分析新闻价值度的方法及装置
CN113807733A (zh) * 2021-09-28 2021-12-17 杭州网易云音乐科技有限公司 一种用户影响力评价方法、装置、介质和电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
于淼: "微博消息影响力评估及最大化算法研究", 《中国优秀硕士学位论文全文数据库》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106257459A (zh) * 2016-08-03 2016-12-28 哈尔滨工程大学 一种基于关键用户的微博信息传播预测方法
CN106257459B (zh) * 2016-08-03 2019-11-01 哈尔滨工程大学 一种基于关键用户的微博信息传播预测方法
CN106933949A (zh) * 2017-01-20 2017-07-07 浙江大学 一种控制社交网络中影响力爆发的规划方法
CN110909227A (zh) * 2018-09-18 2020-03-24 北京国双科技有限公司 一种分析新闻价值度的方法及装置
CN109492924A (zh) * 2018-11-21 2019-03-19 哈尔滨工程大学 一种基于微博用户自身和行为价值二阶的影响力评估方法
CN109492924B (zh) * 2018-11-21 2022-05-17 哈尔滨工程大学 一种基于微博用户自身和行为价值二阶的影响力评估方法
CN113807733A (zh) * 2021-09-28 2021-12-17 杭州网易云音乐科技有限公司 一种用户影响力评价方法、装置、介质和电子设备

Similar Documents

Publication Publication Date Title
CN105608625A (zh) 一种基于微博用户质量的信息影响力评估方法
Manning et al. Two decades of stability and change in age at first union formation
CN109508416B (zh) 基于评论数量的微博舆情事件热度与发展趋势预测方法
CN103064917B (zh) 一种面向微博的特定倾向的高影响力用户群发现方法
CN103678669B (zh) 一种社交网络中的社区影响力评估系统及方法
Pittel et al. Climate policy and ancillary benefits: A survey and integration into the modelling of international negotiations on climate change
CN109063010A (zh) 一种基于PageRank的意见领袖挖掘方法
CN103179198B (zh) 基于多关系网络的话题影响力个体挖掘方法
CN105095419A (zh) 一种面向微博特定类型用户的信息影响力最大化方法
CN106126700A (zh) 一种微博谣言传播的分析方法
CN106055627A (zh) 话题领域中社交网络关键节点的识别方法
CN103617279A (zh) 基于Pagerank方法的微博信息传播影响力评估模型的实现方法
Golden et al. Economic and political influence on tobacco tax rates: a nationwide analysis of 31 years of state data
CN105574003A (zh) 一种基于评论文本和评分分析的信息推荐方法
CN106294590A (zh) 一种基于半监督学习的社交网络垃圾用户过滤方法
CN109726319A (zh) 一种基于交互关系的用户影响力分析方法
CN105550275A (zh) 一种微博转发量预测方法
CN108549632A (zh) 一种基于情感分析的社交网络影响力传播模型构建方法
CN105095988A (zh) 社交网络信息爆发检测方法与系统
CN105847149A (zh) 基于多层网络的无线容迟网络路由方法
CN106649685A (zh) 考虑带评论转发行为的seiar谣言传播过程描述方法
CN115712772A (zh) 一种基于话题关联的话题传播预测方法
CN113268976A (zh) 一种面向微博的话题影响力评估方法
CN103200073A (zh) 一种信息处理方法和装置
CN108268618A (zh) 一种微博热度分析获取方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160525