CN107169873A - 一种多特征融合的微博用户权威度评价方法 - Google Patents
一种多特征融合的微博用户权威度评价方法 Download PDFInfo
- Publication number
- CN107169873A CN107169873A CN201710455299.3A CN201710455299A CN107169873A CN 107169873 A CN107169873 A CN 107169873A CN 201710455299 A CN201710455299 A CN 201710455299A CN 107169873 A CN107169873 A CN 107169873A
- Authority
- CN
- China
- Prior art keywords
- mtd
- mrow
- user
- mfrac
- mtr
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 33
- 230000004927 fusion Effects 0.000 title claims abstract description 17
- 238000000034 method Methods 0.000 claims abstract description 39
- 230000001902 propagating effect Effects 0.000 claims abstract description 25
- 230000000694 effects Effects 0.000 claims abstract description 19
- 230000008569 process Effects 0.000 claims abstract description 17
- 244000097202 Rathbunia alamosensis Species 0.000 claims abstract description 7
- 235000009776 Rathbunia alamosensis Nutrition 0.000 claims abstract description 7
- 238000000205 computational method Methods 0.000 claims abstract description 5
- 239000011159 matrix material Substances 0.000 claims description 52
- 239000013598 vector Substances 0.000 claims description 25
- 244000046052 Phaseolus vulgaris Species 0.000 claims description 14
- 235000010627 Phaseolus vulgaris Nutrition 0.000 claims description 14
- 230000003542 behavioural effect Effects 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000005259 measurement Methods 0.000 claims description 4
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 3
- 238000012986 modification Methods 0.000 claims description 3
- 230000004048 modification Effects 0.000 claims description 3
- 238000011158 quantitative evaluation Methods 0.000 claims description 3
- 238000013210 evaluation model Methods 0.000 abstract description 3
- 238000002474 experimental method Methods 0.000 abstract description 3
- 238000000605 extraction Methods 0.000 abstract description 2
- 238000012360 testing method Methods 0.000 abstract description 2
- 238000012795 verification Methods 0.000 abstract 1
- 238000011160 research Methods 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000004744 fabric Substances 0.000 description 2
- 239000000843 powder Substances 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000036461 convulsion Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明公开了一种多特征融合的微博用户权威度评价方法,该方法在新浪微博的用户信息体系的基础上,总结出了用户基本信息完整度、用户传播影响力、用户活跃度以及用户平台指数4项影响用户权威度的特征,并分别给出了提取与计算方法。在用户信息传播影响力的计算中,提出了一种基于PageRank算法改进的UserRank模型,并通过实验验证了其相对于PageRank算法更加有效。最后,基于层次分析法确定了4项用户特征的权值,构建了多特征融合的微博用户权威度评价模型并进行了相关实验。实验结果表明,本发明提出的方法计算的微博用户权威度比较合理,为用户权威度的定量评价提供了一种可行的解决方案。
Description
技术领域
本发明涉及大数据分析技术领域,具体地说,涉及一种多特征融合的微博用户权威度评价方法。
背景技术
微博(Weibo),即微型博客(MicroBlog)的简称,是一种基于有线或无线互联网终端向平台发布精短共享信息的即时信息网络,可通过计算机、手机、掌上电脑等多种终端进行微博的浏览、发布和评论。微博以其独特的开发性、实时性与互动性已然发展成为人们日常生活中不可或缺的信息传播媒介,以极快的速度影响着社会的传播格局。微博用户不仅包括普通的平民用户,还包括了许多知名人物以及一些权威机构或政府职能部门,其用户层次跨度较大,也使其成为社会热门话题产生的聚集地。因此,对微博传播的特点及影响因素的研究已经成为重要的研究课题。其中,微博用户作为信息发布和传播的主体,微博用户权威度是微博传播影响因素中的一个极为重要的评判指标。
目前国内外对微博用户权威度评价方法的研究已经开展了不少的研究工作,也取得了很多研究成果,国外对于用户权威度评价的研究大多集中在对Twitter用户的研究,而国内则大多集中在对新浪微博用户的研究,其目的都是为了构建一种合理的用户权威度评价模型,为微博信息的获取、舆情的分析、社会关系网络的挖掘等方面的研究提供帮助。
目前用户权威度评价的方法主要有以下几类:第一类方法,也是最简单的方法,就是通过用户的粉丝数量直接衡量用户的权威度。第二类方法,也是目前比较主流的用户权威评价方法,就是参考搜索引擎中常用于网页排名的PageRank算法构建微博用户权威评价体系,通过微博用户关注与被关注关系网络来计算微博用户的权威度。第三类计算用户权威度的方法则是考虑用户行为信息,包括用户发布的微博、转发的微博、评论的微博、关注与被关注的情况以及其活跃度等方面的因素,综合评价用户的权威度。
发明内容
本发明的目的在于提供一种多特征融合的微博用户权威度评价方法。该方法在新浪微博的用户信息体系的基础上,总结出了用户基本信息完整度、用户传播影响力、用户活跃度以及用户平台指数4项影响用户权威度的特征,并分别给出了提取与计算方法。在用户信息传播影响力的计算中,提出了一种基于PageRank算法改进的UserRank模型,并通过实验验证了其相对于PageRank算法更加有效。最后,基于层次分析法确定了4项用户特征的权值,构建了多特征融合的微博用户权威度评价模型并进行了相关实验。实验结果表明,本发明提出的方法计算的微博用户权威度比较合理,为用户权威度的定量评价提供了一种可行的解决方案。该方法解决以下几个方面的问题:
1、针对微博用户的权威度评价,提出了一种多特征融合的微博用户权威度定量评价方法,充分考虑微博用户的个人信息指标和微博用户的行为数据指标。
2、针对微博用户权威度评价中用户基本信息完整度、用户传播影响力、用户活跃度以及用户平台指数4项影响用户权威度的特征融合问题,提出了采用层次分析法确定各个特征的权值的方法,解决了微博用户权威度的定量计算问题。
3、针对用户信息完整度评价问题,提出了采用微博用户在注册微博平台账号时,愿意向公众公开的个人基本信息标签占微博用户基本信息体系标签总数的比例的定量计算方法。
4、针对用户信息传播影响力的计算,提出了一种基于PageRank算法改进的UserRank模型,考虑了用户转发微博与评论微博对用户信息传播影响力计算的影响。
5、针对用户获取度计算问题,提出了采用为微博用户在一定时间内发布微博数目与评论其它微博用户微博的数目的线性加权求和对时间的均值的定量计算方法。
6、针对用户平台指数计算问题,提出了采用层次分析法,综合考虑用户是否是认证用户、是否是VIP用户以及用户勋章数三项指标,将官方评价体系定量的引入到了用户的权威度评价体系中。
为实现上述技术目的,达到上述技术效果,其技术方案具体为:
一种多特征融合的微博用户权威度评价方法,包括以下步骤:
步骤1、建立多特征融合的微博用户权威度定量评价体系:根据用户权威度评价的要求,通过分析新浪微博的用户信息平台,提取微博用户的个人信息指标和微博用户的行为数据指标,构建用户权威度(Authority)评价指标特征四元组E(fUI,fUR,fUA,fUPA),其中,fUI为用户基本信息完整度,fUR为用户传播影响力,fUA为用户活跃度,fUPA为用户平台指数,将用户权威度定义为评价指标特征四元组E(fUI,fUR,fUA,fUPA)中各个评价指标特征的线性加权和,如式(1)所示:
Authority=w1·fUI+w2·fUR+w3·fUA+w1·fUPI (1)
其中,wi(i=1,2,3,4)各个评价指标特征的权值系数,满足wi>0且
步骤2、用户特征指标权值的确定:权值系数的确定本发明采用层次分析法中的特征向量法,具体的权重的计算过程如下:
(1)构造用户权威度评价特征的判断矩阵如式(2)所示:
其中,判断矩阵A中的元素aij表示两个特征相比,特征i的重要程度比特征j重要程度重要的倍数,一般是引入数字1-9及其导数作为度量;
(2)求解判断矩阵的最大特征值的特征向量,并进行一致性检验;对式(2)的用户特征判断矩阵A采用Matlab的eig()函数求取全部特征值,构成对角阵D如式(3)所示,并求取判断矩阵A的所有特征向量构成的列向量矩阵V如式(4)所示:
通过式(3)得到用户判断矩阵A的最大特征值λmax=4.0080,则矩阵A的最大特征值特征向量为w=[0.0909,0.8413,0.2611,0.4646]T;
(3)对上面求出来的特征向量w进行归一化处理即得到式(1)中各个用户特征的权值为(w1,w2,w3,w4)=(0.0548,0.5075,0.1575,0.2802);
步骤3、用户基本信息完整度的计算:将用户基本信息完整度UI(User Integrity)定义为微博用户在注册微博平台账号时,愿意向公众公开的个人基本信息标签占微博用户基本信息体系标签总数的比例;其计算如式(7)所示:
其中,n为微博用户基本信息体系中标签的总数量,取值为12,IPi的定义如式(8)所示:
步骤4、用户传播影响力的计算:设FU(Uj,Ui)表示用户Uj转发用户Ui微博的次数,CU(Uj,Ui)为用户Uj评论用户Ui微博的次数,利用微博用户间转发与评论微博的次数给微博用户关注关系添加关系价值如式(9)所示:
W(Uj,Ui)=α·FU(Uj,Ui)+β·CU(Uj,Ui) (9)
其中,α和β分别代表转发微博与评论微博的权值系数,满足α>0,β>0且α+β=1;采用微博用户关注与被关注的关系价值,定义用户的微博传播指数为:若存在用户Ui,其粉丝的集合为B,则用户Ui的微博传播指数为其粉丝集合B中所有粉丝对其关注的权值之和,计算如式(10)所示:
利用用户的微博传播指数对PageRank算法进行改进,在微博用户关系之间引入关系权值,构建用户传播影响力的UserRank算法,那么UserRank值即为用户传播影响力,计算方式如式(11)所示:
其中,UR(Ui)表示用户Ui在用户关注关系网络中的传播影响力,q为阻尼系数;
步骤5、用户活跃度的计算:根据微博用户发布微博的数目和微博用户评论其它微博用户微博的数目,定义用户活跃度UA为微博用户在一定时间内发布微博数目与评论其它微博用户微博的数目的线性加权求和对时间的均值,计算如式(12)所示:
其中,n表示计算时间段的总天数,取近期的一个月或者一年的数据进行计算,或者定义为从注册日起到现在为止的所有数据;wi与ci分别表示用户在第i天发布的微博的数目与评论其它微博用户微博的数目,α和β分别表示用户发布微博数目与评论微博数目的权值,且满足α>0,β>0且α+β=1;它们所占比例相同,即α=β=0.5;
步骤6、用户平台指数的计算:根据用户权威度评价特征提取的用户权威度评价特征,用户平台指数包含3项内容,分别是是否是认证用户、是否是VIP用户以及用户勋章数;采用这三项内容构建用户平台指数的计算方法如式(13)所示:
UPI=α·A+β·M+γ·M (13)
其中,A表示微博用户是否经过平台认证,M表示微博用户具有的勋章数,V表示微博用户是否是VIP会员用户,α、β和γ为三者的权值,由于这三项特征之间相对的重要性并不相同,同样采用层次分析法中的特征向量法确定各自的权值,构建用户平台指数判断矩阵如式(14)所示:
通过计算,得到式(14)的判断矩阵A的最大特征值为λmax=3.0015,计算判断矩阵的一致性比例为CR=0.0014,远远小于0.1,符合一致性检验结果,说明式(14)的构造的判断矩阵是合理的;最后,将最大特征值的特征向量进行归一化处理,得到用户平台指标的各项用户特征的权值为(α,β,γ)=(0.7373,0.0853,0.1773)。
进一步,步骤1中所述个人信息指标主要包括:个人资料、联系方式、职业信息、教育信息以及标签信息这五个大类的用户基本信息;所述用户行为数据,主要包括:用户粉丝数、微博被转发次数、微博被评论次数、用户关注数、用户发布微博总数、用户评论微博总数以及用户注册日期时间的行为数据。
进一步,步骤2中用户特征判断矩阵的一致性检验过程如下:
①计算一致性指标CI(Consistency Index)如式(5)所示:
②查找判断矩阵对应的平均随机一致性指标RI;
③计算一致性比例CR如式(6)所示:
当CR<0.1时,则认为构建的判断矩阵的一致性是可以接受的,否则,需要对判断矩阵做相应的修改再次计算;
通过一致性检验,构建的用户权威度评价的用户特征判断矩阵的一致性比例为CR=0.0030,远小于0.1,符合一致性检验结果。
本发明具有以下有益效果:
1、本发明综合考虑微博用户的个人信息、行为数据和官方认证数据,总结了影响微博用户权威度的四个不同的特征指标:用户基本信息完整度、用户传播影响力、用户活跃度以及用户平台指数,采用层次分析法中的特征向量法,构造用户权威度评价特征的判断矩阵,并通过计算确定了各个特征的权值,构建了多特征融合的微博用户评价体系。使得微博用户权威度可定量计算,并排除了“僵尸粉”对评价结果的影响,取得了较好的效果。
2、本发明针对用户信息传播影响力的计算,基于用户关系价值提出了一种PageRank算法改进的UserRank模型,通过构建用户关注与被关注关系网络,将用户转发微博与评论微博作为关系价值引入关系网络之中,构建了用户信息传播影响力的计算模型,计算的用户传播影响力更加接近实际。
3、本发明将微博官方评价体系引入用户权威度评价模型之中,采用层次分析法,综合考虑用户是否是认证用户、是否是VIP用户以及用户勋章数三项指标,使得用户权威度的评价更加全面。权威。
附图说明
图1为用户权威度评价体系层次结构;
图2为用户关注关系网络。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。
1、多特征融合的微博用户权威度定量评价体系
本发明根据用户权威度评价的要求,通过分析新浪微博的用户信息平台,提取微博用户的个人信息指标和微博用户的行为数据指标。个人信息指标主要包括:个人资料、联系方式、职业信息、教育信息以及标签信息这五个大类的用户基本信息。用户行为数据,主要包括:用户粉丝数、微博被转发次数、微博被评论次数、用户关注数、用户发布微博总数、用户评论微博总数以及用户注册日期时间等行为数据。另外,新浪微博的官方用户的平台认证属于微博官方认证,具有较高权威性,也将其作为用户权威度评价的一个重要指标。针对以上提取的微博用户个人信息与行为信息,对影响微博用户权威度的基本影响因素进行整理,构建了多特征融合的微博用户权威度评价的四个评价纬度:用户基本信息完整度、用户传播影响力、用户活跃度以及用户平台指数。构建用户权威度评价体系层次结构如图1所示:
按照图1所示的用户权威度评价体系层次结构,我们构建用户权威度(Authority)评价指标特征四元组E(fUI,fUR,fUA,fUPA),其中,fUI为用户基本信息完整度,fUR为用户传播影响力,fUA为用户活跃度,fUPA为用户平台指数,将用户权威度定义为评价指标特征四元组E(fUI,fUR,fUA,fUPA)中各个评价指标特征的线性加权和,如式(1)所示:
Authority=w1·fUI+w2·fUR+w3·fUA+w1·fUPI (1)
其中,wi(i=1,2,3,4)各个评价指标特征的权值系数,满足wi>0且
2、用户特征指标权值的确定
权值系数的确定本发明采用层次分析法中的特征向量法,具体的权重的计算过程如下:
(1)构造用户权威度评价特征的判断矩阵如式(2)所示:
其中,判断矩阵A中的元素aij表示两个特征相比,特征i的重要程度比特征j重要程度重要的倍数,一般是引入数字1-9及其导数作为度量。在微博用户权威度评价中,因为用户权威度的最直接体现就是用户的信息传播影响力,因此,其相对于其它因素,其重要程度最大。同时,鉴于平台认证信息经过了一定的官方审查,本身具有较高的权威性,因此用户的平台指数重要性占其次。最后,用户活跃度与用户基本信息完整度与用户权威有一定的关系但没有直接性的体现,因此它们的重要性较小。通过多次实验及第(2)的一致性检验,得到了如式(2)所示的用户权威度评价特征的判断矩阵。
(2)求解判断矩阵的最大特征值的特征向量,并进行一致性检验。对式(2)的用户特征判断矩阵A采用Matlab的eig()函数求取全部特征值,构成对角阵D如式(3)所示,并求取判断矩阵A的所有特征向量构成的列向量矩阵V如式(4)所示:
通过式(3)我们可以得到用户判断矩阵A的最大特征值λmax=4.0080,则矩阵A的最大特征值特征向量为w=[0.0909,0.8413,0.2611,0.4646]T。
用户特征判断矩阵的一致性检验过程如下:
①计算一致性指标CI(Consistency Index)如式(5)所示:
②查找判断矩阵对应的平均随机一致性指标RI(Random Index)。
表1给出了1-6阶的正互反矩计算1000次得到的平均随机一致性指标。
表1 平均随机一致性指标RI
③计算一致性比例CR(Consistency Ratio)如式(6)所示:
当CR<0.1时,则认为构建的判断矩阵的一致性是可以接受的,否则,需要对判断矩阵做相应的修改再次计算。
通过一致性检验,本发明构建的用户权威度评价的用户特征判断矩阵的一致性比例为CR=0.0030,远小于0.1,符合一致性检验结果。
(3)对上面求出来的特征向量w进行归一化处理即可得到式(1)中各个用户特征的权值为(w1,w2,w3,w4)=(0.0548,0.5075,0.1575,0.2802)。
3、用户基本信息完整度的计算
本发明根据新浪微博的用户基本信息体系机构,总结了5大类共12项个人基本信息,构建微博用户基本信息体系如表2所示:
表2 微博用户基本信息体系
根据以上微博用户信息体系,本发明将用户基本信息完整度UI(User Integrity)定义为微博用户在注册微博平台账号时,愿意向公众公开的个人基本信息标签占微博用户基本信息体系标签总数的比例。其计算如式(7)所示:
其中,n为微博用户基本信息体系中标签的总数量,根据表3所示,本发明中取值为12,IPi的定义如式(8)所示:
4、用户传播影响力的计算
微博用户信息的传播主要依靠用户之间的关注与被关注的关系,根据微博的用户关注关系可形成一种用户关注关系网络有向图如图2所示,其中圆点代表微博用户,箭头代表关注与被关注的关系。用户间的这种网络关系与网页之间的链接结构非常相识,在微博中,一个微博用户关注其他的微博用户相当于网页中从当前页面链接到其它页面,同样,一个微博用户被其他微博用户关注相当于网页中当前页面被其它页面链接。在网页搜索中对网页排名的计算中常常使用PageRank算法,PageRank算法又称Google左侧排名或佩奇排名,是由Google创始人拉里·佩奇和谢尔盖·布林于1997年在构建早期的搜索系统原型时提出的链接分析算法,此后,PageRank算法成为了其它搜索引擎和学术界十分关注的计算模型。目前很多重要的链接分析算法都是在PageRank算法基础上衍生出来的。但是,在计算微博用户传播影响力时,除了需要考虑到微博用户之间的关注与被关注的关系,还要考虑到“僵尸粉”的影响。因此,在本发明中,我们在PageRank算法的基础之上引入两个微博用户之间的互动关系,即微博被转发与被评论的次数,以此构建计算用户传播影响力的UserRank算法。
本发明将微博用户的微博被转发数目与被评论数目作为关系价值融入到我们的评价体系中,用微博用户的微博被转发数目与被评论数目给每条连线进行赋值,对PageRank算法进行改进,构建用于计算微博用户传播影响力的UserRank算法,使其更加适用于微博用户影响力的计算。
设FU(Uj,Ui)表示用户Uj转发用户Ui微博的次数,CU(Uj,Ui)为用户Uj评论用户Ui微博的次数,利用微博用户间转发与评论微博的次数给微博用户关注关系添加关系价值如式(9)所示:
W(Uj,Ui)=α·FU(Uj,Ui)+β·CU(Uj,Ui) (9)
其中,α和β分别代表转发微博与评论微博的权值系数,满足α>0,β>0且α+β=1。采用微博用户关注与被关注的关系价值,定义用户的微博传播指数为:若存在用户Ui,其粉丝的集合为B,则用户Ui的微博传播指数为其粉丝集合B中所有粉丝对其关注的权值之和,计算如式(10)所示:
利用用户的微博传播指数对PageRank算法进行改进,在微博用户关系之间引入关系权值,构建用户传播影响力的UserRank算法,那么UserRank值(以下称UR值)即为用户传播影响力,计算方式如式(11)所示:
其中,UR(Ui)表示用户Ui在用户关注关系网络中的传播影响力,q为阻尼系数。
5、用户活跃度的计算
本发明引入用户活跃度概念用于描述用户在微博中的主动行为发生的频率。微博用户的主动行为主要包括微博用户关注其他用户、发布微博、浏览微博、转发微博、评论微博等。简单来说,用户活跃度就是微博用户在平台中与其他用户(包括好友、粉丝、关注者等)进行互动的行为频率。由于微博用户关注其它用户和浏览微博的行为很难搜集到时间节点的信息,因此本发明中并没有将其纳入用户活跃度的度量体系之中。根据微博用户发布微博的数目和微博用户评论其它微博用户微博的数目,定义用户活跃度UA(UserActivity)为微博用户在一定时间内发布微博数目与评论其它微博用户微博的数目的线性加权求和对时间的均值,计算如式(12)所示:
其中,n表示计算时间段的总天数,可以取近期的一个月或者一年的数据进行计算,也可以定义为从注册日起到现在为止的所有数据。wi与ci分别表示用户在第i天发布的微博的数目与评论其它微博用户微博的数目,α和β分别表示用户发布微博数目与评论微博数目的权值,且满足α>0,β>0且α+β=1。一般认为它们所占比例相同,即α=β=0.5。
6、用户平台指数的计算
本发明根据前文表1用户权威度评价特征我们提取的用户权威度评价特征,用户平台指数包含3项内容,分别是是否是认证用户、是否是VIP用户以及用户勋章数。采用这三项内容我们构建用户平台指数的计算方法如式(13)所示:
UPI=α·A+β·M+γ·M (13)
其中,A表示微博用户是否经过平台认证,M表示微博用户具有的勋章数,V表示微博用户是否是VIP会员用户,α、β和γ为三者的权值,由于这三项特征之间相对的重要性并不相同,同样采用层次分析法中的特征向量法确定各自的权值。在此,本发明构建用户平台指数判断矩阵如式(14)所示:
通过计算,得到式(14)的判断矩阵A的最大特征值为λmax=3.0015,计算判断矩阵的一致性比例为CR=0.0014,远远小于0.1,符合一致性检验结果,说明式(14)的构造的判断矩阵是合理的。最后,将最大特征值的特征向量进行归一化处理,得到用户平台指标的各项用户特征的权值为(α,β,γ)=(0.7373,0.0853,0.1773)。
以上所述,仅为本发明较佳的具体实施方式,本发明的保护范围不限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可显而易见地得到的技术方案的简单变化或等效替换均落入本发明的保护范围内。
Claims (2)
1.一种多特征融合的微博用户权威度评价方法,其特征在于,包括以下步骤:
步骤1、建立多特征融合的微博用户权威度定量评价体系:根据用户权威度评价的要求,通过分析新浪微博的用户信息平台,提取微博用户的个人信息指标和微博用户的行为数据指标,构建用户权威度评价指标特征四元组E(fUI,fUR,fUA,fUPA),其中,fUI为用户基本信息完整度,fUR为用户传播影响力,fUA为用户活跃度,fUPA为用户平台指数;将用户权威度定义为评价指标特征四元组E(fUI,fUR,fUA,fUPA)中各个评价指标特征的线性加权和,如式(1)所示:
Authority=w1·fUI+w2·fUR+w3·fUA+w1·fUPI (1)
其中,wi(i=1,2,3,4)为各个评价指标特征的权值系数,满足wi>0且
步骤2、用户特征四元组中各评价指标的权值系数确定:本发明采用层次分析法中的特征向量法对权值系数进行确定,具体的权重计算过程如下:
(1)构造用户权威度评价特征的判断矩阵如式(2)所示:
<mrow>
<mi>A</mi>
<mo>=</mo>
<mfenced open = "[" close = "]">
<mtable>
<mtr>
<mtd>
<mn>1</mn>
</mtd>
<mtd>
<mfrac>
<mn>1</mn>
<mn>9</mn>
</mfrac>
</mtd>
<mtd>
<mfrac>
<mn>1</mn>
<mn>3</mn>
</mfrac>
</mtd>
<mtd>
<mfrac>
<mn>1</mn>
<mn>5</mn>
</mfrac>
</mtd>
</mtr>
<mtr>
<mtd>
<mn>9</mn>
</mtd>
<mtd>
<mn>1</mn>
</mtd>
<mtd>
<mn>3</mn>
</mtd>
<mtd>
<mn>2</mn>
</mtd>
</mtr>
<mtr>
<mtd>
<mn>3</mn>
</mtd>
<mtd>
<mfrac>
<mn>1</mn>
<mn>3</mn>
</mfrac>
</mtd>
<mtd>
<mn>1</mn>
</mtd>
<mtd>
<mfrac>
<mn>1</mn>
<mn>2</mn>
</mfrac>
</mtd>
</mtr>
<mtr>
<mtd>
<mn>5</mn>
</mtd>
<mtd>
<mfrac>
<mn>1</mn>
<mn>2</mn>
</mfrac>
</mtd>
<mtd>
<mn>2</mn>
</mtd>
<mtd>
<mn>1</mn>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>2</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,判断矩阵A中的元素aij表示两个特征相比,特征i的重要程度比特征j重要程度重要的倍数,一般是引入数字1-9及其导数作为度量;
(2)求解判断矩阵的最大特征值的特征向量,并进行一致性检验;对式(2)的用户特征判断矩阵A采用Matlab的eig()函数求取全部特征值,构成对角阵D如式(3)所示,并求取判断矩阵A的所有特征向量构成的列向量矩阵V如式(4)所示:
<mrow>
<mi>D</mi>
<mo>=</mo>
<mfenced open = "[" close = "]">
<mtable>
<mtr>
<mtd>
<mn>4.0080</mn>
</mtd>
<mtd>
<mn>0</mn>
</mtd>
<mtd>
<mn>0</mn>
</mtd>
<mtd>
<mn>0</mn>
</mtd>
</mtr>
<mtr>
<mtd>
<mn>0</mn>
</mtd>
<mtd>
<mrow>
<mn>2.5883</mn>
<mi>e</mi>
<mo>-</mo>
<mn>16</mn>
</mrow>
</mtd>
<mtd>
<mn>0</mn>
</mtd>
<mtd>
<mn>0</mn>
</mtd>
</mtr>
<mtr>
<mtd>
<mn>0</mn>
</mtd>
<mtd>
<mn>0</mn>
</mtd>
<mtd>
<mrow>
<mo>-</mo>
<mn>0.0040</mn>
<mo>+</mo>
<mn>0.1785</mn>
<mi>i</mi>
</mrow>
</mtd>
<mtd>
<mn>0</mn>
</mtd>
</mtr>
<mtr>
<mtd>
<mn>0</mn>
</mtd>
<mtd>
<mn>0</mn>
</mtd>
<mtd>
<mn>0</mn>
</mtd>
<mtd>
<mrow>
<mo>-</mo>
<mn>0.0040</mn>
<mo>-</mo>
<mn>0.1785</mn>
<mi>i</mi>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>3</mn>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<mi>V</mi>
<mo>=</mo>
<mfenced open = "[" close = "]">
<mtable>
<mtr>
<mtd>
<mn>0.0909</mn>
</mtd>
<mtd>
<mrow>
<mo>-</mo>
<mn>0.1622</mn>
</mrow>
</mtd>
<mtd>
<mrow>
<mn>0.0267</mn>
<mo>-</mo>
<mn>0.0266</mn>
<mi>i</mi>
</mrow>
</mtd>
<mtd>
<mrow>
<mn>0.0267</mn>
<mo>-</mo>
<mn>0.0266</mn>
<mi>i</mi>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mn>0.8413</mn>
</mtd>
<mtd>
<mn>0.9733</mn>
</mtd>
<mtd>
<mrow>
<mn>0.7942</mn>
<mo>+</mo>
<mn>0.0000</mn>
<mi>i</mi>
</mrow>
</mtd>
<mtd>
<mrow>
<mn>0.7942</mn>
<mo>+</mo>
<mn>0.0000</mn>
<mi>i</mi>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mn>0.2611</mn>
</mtd>
<mtd>
<mn>0.1622</mn>
</mtd>
<mtd>
<mrow>
<mo>-</mo>
<mn>0.1965</mn>
<mo>+</mo>
<mn>0.1992</mn>
<mi>i</mi>
</mrow>
</mtd>
<mtd>
<mrow>
<mo>-</mo>
<mn>0.1965</mn>
<mo>+</mo>
<mn>0.1992</mn>
<mi>i</mi>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mn>0.4646</mn>
</mtd>
<mtd>
<mn>0.0000</mn>
</mtd>
<mtd>
<mrow>
<mo>-</mo>
<mn>0.2243</mn>
<mo>-</mo>
<mn>0.4892</mn>
<mi>i</mi>
</mrow>
</mtd>
<mtd>
<mrow>
<mo>-</mo>
<mn>0.2243</mn>
<mo>-</mo>
<mn>0.4892</mn>
<mi>i</mi>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>4</mn>
<mo>)</mo>
</mrow>
</mrow>
通过式(3)得到用户判断矩阵A的最大特征值λmax=4.0080,则矩阵A的最大特征值特征向量为w=[0.0909,0.8413,0.2611,0.4646]T;
用户特征判断矩阵的一致性检验过程如下:
①计算一致性指标CI如式(5)所示:
<mrow>
<mi>C</mi>
<mi>I</mi>
<mo>=</mo>
<mfrac>
<mrow>
<msub>
<mi>&lambda;</mi>
<mrow>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
</mrow>
</msub>
<mo>-</mo>
<mi>n</mi>
</mrow>
<mrow>
<mi>n</mi>
<mo>-</mo>
<mn>1</mn>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>5</mn>
<mo>)</mo>
</mrow>
</mrow>
②查找判断矩阵对应的平均随机一致性指标RI;
③计算一致性比例CR如式(6)所示:
<mrow>
<mi>C</mi>
<mi>R</mi>
<mo>=</mo>
<mfrac>
<mrow>
<mi>C</mi>
<mi>I</mi>
</mrow>
<mrow>
<mi>R</mi>
<mi>I</mi>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>6</mn>
<mo>)</mo>
</mrow>
</mrow>
1
当CR<0.1时,则认为构建的判断矩阵的一致性是能接受的,否则,需要对判断矩阵做相应的修改再次计算;
通过一致性检验,构建的用户权威度评价的用户特征判断矩阵的一致性比例为CR=0.0030,远小于0.1,符合一致性检验结果;
(3)对上面求出来的特征向量w进行归一化处理即得到式(1)中各个用户特征的权值系数为(w1,w2,w3,w4)=(0.0548,0.5075,0.1575,0.2802);
步骤3、用户基本信息完整度的计算:将用户基本信息完整度UI(User Integrity)定义为微博用户在注册微博平台账号时,愿意向公众公开的个人基本信息标签占微博用户基本信息体系标签总数的比例;其计算如式(7)所示:
<mrow>
<mi>U</mi>
<mi>I</mi>
<mo>=</mo>
<mfrac>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<msub>
<mi>IP</mi>
<mi>i</mi>
</msub>
</mrow>
<mi>n</mi>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>7</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,n为微博用户基本信息体系中标签的总数量,取值为12,IPi的定义如式(8)所示:
步骤4、用户传播影响力的计算:设FU(Uj,Ui)表示用户Uj转发用户Ui微博的次数,CU(Uj,Ui)为用户Uj评论用户Ui微博的次数,利用微博用户间转发与评论微博的次数给微博用户关注关系添加关系价值如式(9)所示:
W(Uj,Ui)=α·FU(Uj,Ui)+β·CU(Uj,Ui) (9)
其中,α和β分别代表转发微博与评论微博的权值系数,满足α>0,β>0且α+β=1;采用微博用户关注与被关注的关系价值,定义用户的微博传播指数为:若存在用户Ui,其粉丝的集合为B,则用户Ui的微博传播指数为其粉丝集合B中所有粉丝对其关注的权值之和,计算如式(10)所示:
<mrow>
<mi>T</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>U</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<munder>
<mo>&Sigma;</mo>
<mrow>
<msub>
<mi>U</mi>
<mi>j</mi>
</msub>
<mo>&Element;</mo>
<mi>B</mi>
</mrow>
</munder>
<mi>W</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>U</mi>
<mi>j</mi>
</msub>
<mo>,</mo>
<msub>
<mi>U</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>10</mn>
<mo>)</mo>
</mrow>
</mrow>
利用用户的微博传播指数对PageRank算法进行改进,在微博用户关系之间引入关系权值,构建用户传播影响力的UserRank算法,那么UserRank值即为用户传播影响力,计算方式如式(11)所示:
<mrow>
<mi>U</mi>
<mi>R</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>U</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mi>q</mi>
<munder>
<mo>&Sigma;</mo>
<mrow>
<msub>
<mi>U</mi>
<mi>j</mi>
</msub>
<mo>&Element;</mo>
<mi>B</mi>
</mrow>
</munder>
<mfrac>
<mrow>
<mi>U</mi>
<mi>R</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>U</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>&CenterDot;</mo>
<mi>W</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>U</mi>
<mi>j</mi>
</msub>
<mo>,</mo>
<msub>
<mi>U</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<mi>T</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>U</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
<mo>+</mo>
<mfrac>
<mrow>
<mn>1</mn>
<mo>-</mo>
<mi>q</mi>
</mrow>
<mi>n</mi>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>11</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,UR(Ui)表示用户Ui在用户关注关系网络中的传播影响力,q为阻尼系数;
步骤5、用户活跃度的计算:根据微博用户发布微博的数目和微博用户评论其它微博用户微博的数目,定义用户活跃度UA为微博用户在一定时间内发布微博数目与评论其它微博用户微博的数目的线性加权求和对时间的均值,计算如式(12)所示:
<mrow>
<mi>U</mi>
<mi>A</mi>
<mo>=</mo>
<mfrac>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<mrow>
<mo>(</mo>
<mi>&alpha;</mi>
<mo>&CenterDot;</mo>
<msub>
<mi>w</mi>
<mi>i</mi>
</msub>
<mo>+</mo>
<mi>&beta;</mi>
<mo>&CenterDot;</mo>
<msub>
<mi>c</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
<mi>n</mi>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>12</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,n表示计算时间段的总天数,取近期的一个月或者一年的数据进行计算,或者定义为从注册日起到现在为止的所有数据;wi与ci分别表示用户在第i天发布的微博的数目与评论其它微博用户微博的数目,α和β分别表示用户发布微博数目与评论微博数目的权值,且满足α>0,β>0且α+β=1;它们所占比例相同,即α=β=0.5;
步骤6、用户平台指数的计算:根据用户权威度评价特征提取的用户权威度评价特征,用户平台指数包含3项内容,分别是是否是认证用户、是否是VIP用户以及用户勋章数;采用这三项内容构建用户平台指数的计算方法如式(13)所示:
UPI=α·A+β·M+γ·M (13)
其中,A表示微博用户是否经过平台认证,M表示微博用户具有的勋章数,V表示微博用户是否是VIP会员用户,α、β和γ为三者的权值,由于这三项特征之间相对的重要性并不相同,同样采用层次分析法中的特征向量法确定各自的权值,构建用户平台指数判断矩阵如式(14)所示:
<mrow>
<mi>A</mi>
<mo>=</mo>
<mfenced open = "[" close = "]">
<mtable>
<mtr>
<mtd>
<mn>1</mn>
</mtd>
<mtd>
<mn>9</mn>
</mtd>
<mtd>
<mn>4</mn>
</mtd>
</mtr>
<mtr>
<mtd>
<mfrac>
<mn>1</mn>
<mn>9</mn>
</mfrac>
</mtd>
<mtd>
<mn>1</mn>
</mtd>
<mtd>
<mfrac>
<mn>1</mn>
<mn>2</mn>
</mfrac>
</mtd>
</mtr>
<mtr>
<mtd>
<mfrac>
<mn>1</mn>
<mn>4</mn>
</mfrac>
</mtd>
<mtd>
<mn>2</mn>
</mtd>
<mtd>
<mn>1</mn>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>14</mn>
<mo>)</mo>
</mrow>
</mrow>
通过计算,得到式(14)的判断矩阵A的最大特征值为λmax=3.0015,计算判断矩阵的一致性比例为CR=0.0014,远远小于0.1,符合一致性检验结果,说明式(14)的构造的判断矩阵是合理的;最后,将最大特征值的特征向量进行归一化处理,得到用户平台指标的各项用户特征的权值为(α,β,γ)=(0.7373,0.0853,0.1773)。
2.根据权利要求1所述的多特征融合的微博用户权威度评价方法,其特征在于,步骤1中所述个人信息指标主要包括:个人资料、联系方式、职业信息、教育信息以及标签信息这五个大类的用户基本信息;所述用户行为数据,主要包括:用户粉丝数、微博被转发次数、微博被评论次数、用户关注数、用户发布微博总数、用户评论微博总数以及用户注册日期时间的行为数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710455299.3A CN107169873B (zh) | 2017-06-16 | 2017-06-16 | 一种多特征融合的微博用户权威度评价方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710455299.3A CN107169873B (zh) | 2017-06-16 | 2017-06-16 | 一种多特征融合的微博用户权威度评价方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107169873A true CN107169873A (zh) | 2017-09-15 |
CN107169873B CN107169873B (zh) | 2021-05-11 |
Family
ID=59818983
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710455299.3A Active CN107169873B (zh) | 2017-06-16 | 2017-06-16 | 一种多特征融合的微博用户权威度评价方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107169873B (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109145223A (zh) * | 2018-09-28 | 2019-01-04 | 合肥工业大学 | 一种基于社交影响力传播的社交推荐方法 |
CN109271584A (zh) * | 2018-08-29 | 2019-01-25 | 杭州电子科技大学 | 基于改进版PageRank以及综合影响力的推荐方法 |
CN109508416A (zh) * | 2018-11-09 | 2019-03-22 | 四川大学 | 基于评论数量的微博舆情事件热度与发展趋势预测方法 |
CN110020154A (zh) * | 2017-12-04 | 2019-07-16 | 北京京东尚科信息技术有限公司 | 用于确定用户影响力的方法及装置 |
CN110059240A (zh) * | 2019-03-20 | 2019-07-26 | 重庆邮电大学 | 一种基于影响等级的网络用户责任指数计算方法 |
CN111523049A (zh) * | 2020-04-15 | 2020-08-11 | 苏州跃盟信息科技有限公司 | 对象的权威值的确定方法、装置、存储介质和处理器 |
CN111667200A (zh) * | 2020-07-09 | 2020-09-15 | 腾讯科技(深圳)有限公司 | 一种权威度确定方法、装置、设备及存储介质 |
CN111859074A (zh) * | 2020-07-29 | 2020-10-30 | 东北大学 | 基于深度学习的网络舆情信息源影响力评估方法及系统 |
CN112395510A (zh) * | 2019-08-15 | 2021-02-23 | 北京京东尚科信息技术有限公司 | 基于活跃度确定目标用户的方法和装置 |
CN112801561A (zh) * | 2021-04-13 | 2021-05-14 | 腾讯科技(深圳)有限公司 | 用户关系确定方法、装置、存储介质及电子设备 |
CN113434783A (zh) * | 2021-07-02 | 2021-09-24 | 北京中奥淘数据科技有限公司 | 网络用户影响力的计算方法、装置及电子设备 |
CN113807616A (zh) * | 2021-10-22 | 2021-12-17 | 重庆理工大学 | 基于时空注意力和异构图卷积网络的信息扩散预测系统 |
WO2022068659A1 (zh) * | 2020-09-30 | 2022-04-07 | 深圳前海微众银行股份有限公司 | 信息的推送方法、装置和存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090210935A1 (en) * | 2008-02-20 | 2009-08-20 | Jamie Alan Miley | Scanning Apparatus and System for Tracking Computer Hardware |
CN101770487A (zh) * | 2008-12-26 | 2010-07-07 | 聚友空间网络技术有限公司 | 社交网络中用户影响力的计算方法和系统 |
CN105205146A (zh) * | 2015-09-18 | 2015-12-30 | 国家计算机网络与信息安全管理中心 | 一种计算微博用户影响力的方法 |
-
2017
- 2017-06-16 CN CN201710455299.3A patent/CN107169873B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090210935A1 (en) * | 2008-02-20 | 2009-08-20 | Jamie Alan Miley | Scanning Apparatus and System for Tracking Computer Hardware |
CN101770487A (zh) * | 2008-12-26 | 2010-07-07 | 聚友空间网络技术有限公司 | 社交网络中用户影响力的计算方法和系统 |
CN105205146A (zh) * | 2015-09-18 | 2015-12-30 | 国家计算机网络与信息安全管理中心 | 一种计算微博用户影响力的方法 |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110020154A (zh) * | 2017-12-04 | 2019-07-16 | 北京京东尚科信息技术有限公司 | 用于确定用户影响力的方法及装置 |
CN109271584A (zh) * | 2018-08-29 | 2019-01-25 | 杭州电子科技大学 | 基于改进版PageRank以及综合影响力的推荐方法 |
CN109271584B (zh) * | 2018-08-29 | 2022-02-15 | 杭州电子科技大学 | 基于改进版PageRank以及综合影响力的推荐方法 |
CN109145223B (zh) * | 2018-09-28 | 2021-03-09 | 合肥工业大学 | 一种基于社交影响力传播的社交推荐方法 |
CN109145223A (zh) * | 2018-09-28 | 2019-01-04 | 合肥工业大学 | 一种基于社交影响力传播的社交推荐方法 |
CN109508416B (zh) * | 2018-11-09 | 2021-11-23 | 四川大学 | 基于评论数量的微博舆情事件热度与发展趋势预测方法 |
CN109508416A (zh) * | 2018-11-09 | 2019-03-22 | 四川大学 | 基于评论数量的微博舆情事件热度与发展趋势预测方法 |
CN110059240A (zh) * | 2019-03-20 | 2019-07-26 | 重庆邮电大学 | 一种基于影响等级的网络用户责任指数计算方法 |
CN112395510A (zh) * | 2019-08-15 | 2021-02-23 | 北京京东尚科信息技术有限公司 | 基于活跃度确定目标用户的方法和装置 |
CN111523049A (zh) * | 2020-04-15 | 2020-08-11 | 苏州跃盟信息科技有限公司 | 对象的权威值的确定方法、装置、存储介质和处理器 |
CN111523049B (zh) * | 2020-04-15 | 2023-06-13 | 苏州跃盟信息科技有限公司 | 对象的权威值的确定方法、装置、存储介质和处理器 |
CN111667200A (zh) * | 2020-07-09 | 2020-09-15 | 腾讯科技(深圳)有限公司 | 一种权威度确定方法、装置、设备及存储介质 |
CN111667200B (zh) * | 2020-07-09 | 2023-09-19 | 腾讯科技(深圳)有限公司 | 一种权威度确定方法、装置、设备及存储介质 |
CN111859074A (zh) * | 2020-07-29 | 2020-10-30 | 东北大学 | 基于深度学习的网络舆情信息源影响力评估方法及系统 |
CN111859074B (zh) * | 2020-07-29 | 2023-12-29 | 东北大学 | 基于深度学习的网络舆情信息源影响力评估方法及系统 |
WO2022068659A1 (zh) * | 2020-09-30 | 2022-04-07 | 深圳前海微众银行股份有限公司 | 信息的推送方法、装置和存储介质 |
CN112801561A (zh) * | 2021-04-13 | 2021-05-14 | 腾讯科技(深圳)有限公司 | 用户关系确定方法、装置、存储介质及电子设备 |
CN113434783A (zh) * | 2021-07-02 | 2021-09-24 | 北京中奥淘数据科技有限公司 | 网络用户影响力的计算方法、装置及电子设备 |
CN113807616B (zh) * | 2021-10-22 | 2022-11-04 | 重庆理工大学 | 基于时空注意力和异构图卷积网络的信息扩散预测系统 |
CN113807616A (zh) * | 2021-10-22 | 2021-12-17 | 重庆理工大学 | 基于时空注意力和异构图卷积网络的信息扩散预测系统 |
Also Published As
Publication number | Publication date |
---|---|
CN107169873B (zh) | 2021-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107169873A (zh) | 一种多特征融合的微博用户权威度评价方法 | |
Hu et al. | HERS: Modeling influential contexts with heterogeneous relations for sparse and cold-start recommendation | |
Zhang et al. | Evaluating geo-social influence in location-based social networks | |
CN107784066A (zh) | 信息推荐方法、装置、服务器及存储介质 | |
CN108509551A (zh) | 一种基于Spark环境下的微博网络关键用户挖掘系统及方法 | |
Xu et al. | A personalized information recommendation system for R&D project opportunity finding in big data contexts | |
CN104133897B (zh) | 一种基于话题影响力的微博话题溯源方法 | |
CN105069717A (zh) | 一种基于游客信任度的个性化旅游线路推荐方法 | |
Wan et al. | Information propagation model based on hybrid social factors of opportunity, trust and motivation | |
Wang et al. | Collaborative filtering with aspect-based opinion mining: A tensor factorization approach | |
CN104598450A (zh) | 一种网络舆情事件的热度分析方法及系统 | |
Zhang et al. | CRATS: An LDA-based model for jointly mining latent communities, regions, activities, topics, and sentiments from geosocial network data | |
CN106991160A (zh) | 一种基于用户影响力以及内容的微博传播预测方法 | |
CN109034960A (zh) | 一种基于用户节点嵌入的多属性推断的方法 | |
CN104317881B (zh) | 一种基于用户话题权威性的微博重排序方法 | |
CN102737027B (zh) | 个性化搜索方法及系统 | |
Zhang et al. | Proposing a new friend recommendation method, FRUTAI, to enhance social media providers' performance | |
Liu et al. | Forced bachelors, migration and HIV transmission risk in the context of China's gender imbalance: a meta-analysis | |
Yang et al. | Recommender system-based diffusion inferring for open social networks | |
He et al. | Next point-of-interest recommendation via a category-aware Listwise Bayesian Personalized Ranking | |
Yigit et al. | Extended topology based recommendation system for unidirectional social networks | |
Wang | The influence of electronic word-of-mouth on the decision-making of online travel booking | |
CN109636682A (zh) | 一种教学资源自动收集系统 | |
CN108062385A (zh) | 用户兴趣挖掘的方法及系统 | |
Cai et al. | An extension of social network group decision-making based on trustrank and personas |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230413 Address after: 100000 Office B-319, 3rd Floor, Building 2, Yard 1, Nongda South Road, Haidian District, Beijing Patentee after: Beijing Hongwen Zhitong Technology Co.,Ltd. Address before: 100101 No. 35 middle Fourth Ring Road, Chaoyang District, Beijing Patentee before: BEIJING INFORMATION SCIENCE AND TECHNOLOGY University |
|
TR01 | Transfer of patent right |