CN112052995A - 基于融合情感倾向主题的社交网络用户影响力预测方法 - Google Patents

基于融合情感倾向主题的社交网络用户影响力预测方法 Download PDF

Info

Publication number
CN112052995A
CN112052995A CN202010895010.1A CN202010895010A CN112052995A CN 112052995 A CN112052995 A CN 112052995A CN 202010895010 A CN202010895010 A CN 202010895010A CN 112052995 A CN112052995 A CN 112052995A
Authority
CN
China
Prior art keywords
user
theme
emotional tendency
influence
list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010895010.1A
Other languages
English (en)
Other versions
CN112052995B (zh
Inventor
梁颖
王然
徐向华
李平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN202010895010.1A priority Critical patent/CN112052995B/zh
Publication of CN112052995A publication Critical patent/CN112052995A/zh
Application granted granted Critical
Publication of CN112052995B publication Critical patent/CN112052995B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Mathematical Physics (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computing Systems (AREA)
  • Computational Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Primary Health Care (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于融合情感倾向主题的社交网络用户影响力预测方法。现有方法影响力计算结果笼统,无法有效的体现用户的实际影响力。本发明方法首先提取用户带有不同情感倾向的主题信息,建立对应的用户博文信息列表;然后,建立用户‑情感倾向主题影响力矩阵,获取情感倾向主题相似、邻居相似、用户相似信息;最后,建立预测模型,对未观察到的情感倾向主题进行影响力预测。本发明方法融入情感倾向,结合行为用户属性,使得影响力度量的值更加的准确,更能反应一个用户的影响力程度,使得能够预测用户在未观察到的主题上的影响力,不局限于用户的历史数据观察到的主题,并融合多种相似信息,弥补数据稀疏问题,预测结果更加的准确。

Description

基于融合情感倾向主题的社交网络用户影响力预测方法
技术领域
本发明属于社交网络分析技术领域,涉及一种基于融合情感倾向主题的社交网络用户影响力预测方法。
背景技术
社交网络是互联网时代信息传播的重要组成部分,随着计算机技术的普及和发展,越来越多的用户通过在微博、推特(Twitter)等社交网络平台上发表内容、传播信息,并影响到其他的用户。分析社交网络中的这种影响力,对了解社交用户的行动内因、信息在网络中的传播因素以及预测信息在网络中的传播范围等都具有重要的意义。
社交网络影响力体现在用户对其他用户的影响程度,是指用户自身的社交行为通过社交网络中的社交关系,使其他用户产生相关行为的一种现象,具体表现在点赞、转发等。对社交网络影响力的分析,是指通过收集用户在社交网络上的历史数据,如博文内容、转发次数、回复内容等相关信息,分析用户在社交网络上的影响力,从而用于商业营销、广告投放、舆情控制等诸多领域。
目前对社交网络影响力的度量分析方法大致从两个角度出发,一个是从宏观层面考虑,分析用户在网络中的拓扑结构属性,如Granovertter等利用用户节点之间的邻居重叠比例来计算影响力。这种基于网络拓扑结构的影响力度量方法比较简单,但是没有考虑用户的文本信息和交互信息,影响力计算结果太过笼统,无法有效的体现用户的实际影响力。另一个是从主题角度上考虑的,用户在不同的主题上会有着不同的影响力,如数码博主在手机话题上对其他用户的影响力会高于在政治主题上的影响力。然而,这种方法存在两个问题。首先是忽略了用户的博文主题中含有的情感倾向,以政治主题为例,一个对该主题情感积极的用户,被其他用户带有消极情绪的政治相关主题影响的概率会很小,同一个主题可以表现出不同的情感倾向,不同情感倾向的主题,对用户来说也应有着不同程度的影响力。其次是无法对未观察到的主题进行影响力度量预测,即无法预测用户在潜在的主题上的影响力。
发明内容
本发明的目的就是针对现有方法中存在的问题,提供一种基于融合情感倾向主题的社交网络用户影响力预测方法,能够在不同情感倾向的主题上,度量并预测用户的影响力。
本发明方法通过提取用户历史博文中的主题信息,结合其中表现出来的情感倾向,根据点赞、评论、转发等多种行为和行为用户属性(行为用户是指对用户的博文进行点赞、评论、转发等操作的用户),计算用户在该情感倾向主题上的影响力,并建立用户-情感倾向主题影响力矩阵。利用矩阵分解技术,得到对应的用户潜在特征矩阵和情感倾向主题特征矩阵,并融合情感倾向主题相似、邻居相似、用户相似等额外信息,以减少影响力矩阵稀疏带来的影响,建立用户在未观察到的情感倾向主题上的影响力预测模型。
本发明方法包括如下步骤:
步骤A.提取用户u在博文的情感倾向,建立对应用户在情感倾向主题z下的博文信息列表Lz(u);
步骤B.根据行为用户属性和行为特征计算影响力,建立用户-情感倾向主题影响力矩阵;
步骤C.获取情感倾向主题z的相似情感倾向主题列表SimST(z)、用户u的邻居相似用户列表SimNB(u)、用户u的相似用户列表SimU(u);
步骤D.建立预测模型,对用户在未观察到的情感倾向主题进行影响力预测。
进一步,步骤A中采用粗粒度的情感分析方法提取用户博文的情感倾向,具体方法是:
根据博文内容,用情感分析工具将其情感倾向识别为正向或负向,并用LDA方法提取主题信息,将情感倾向和主题信息组合成情感倾向主题,并将博文信息按照情感倾向主题,建立对应的列表;所述的博文信息包括博文内容、点赞、转发、评论;
设用户集合U={u1,u2,u3,…,uM},情感倾向集合为S,主题集合为T;M为用户数量,um表示第m个用户,m=1,2,…,M;定义用户u∈U的情感倾向s∈S,主题t∈T,两者组合为情感倾向主题z=(s,t);
设情感倾向主题集合Z={z1,z2,z3,…,zN},N为情感倾向主题数量,zn表示第n个情感倾向主题,n=1,2,…,N;
用户u在情感倾向主题为z下的博文信息列表Lz(u)={W1,W2,W3,…,WR},R表示用户u在情感倾向主题为z的博文数量,Wr表示列表中的第r条博文相关信息,包括对应的博文内容、点赞、评论、转发,r=1,2,…,R。
进一步,步骤B是根据步骤A中用户博文列表上所获得的点赞、转发、评论行为和行为用户的属性,计算相应的影响力,从而获取用户在某个情感倾向主题上的影响力,然后建立用户-情感倾向主题影响力矩阵。具体方法是:
B1.根据用户u在情感倾向主题z下的博文信息列表Lz(u),统计其中三种行为用户列表,分别为点赞用户列表LLz(u)、转发用户列表FLz(u)和评论用户列表CLz(u);
B2.根据三种行为用户列表中行为用户的粉丝数量、关注数量、原创博文数量和用户等级,计算出行为用户的属性强度;
行为用户v的属性强度
Figure BDA0002658174420000031
v∈U;其中n1(v),n2(v),n3(v)分别表示行为用户v的粉丝数量、关注数量和原创微博数量,l(v)表示行为用户v的等级,γ为对应的权重,
Figure BDA0002658174420000032
γ1表示粉丝数量权重、γ2表示关注数量权重、γ3表示原创微博数量权重、γ4表示行为用户等级权重,其中粉丝数量的重最大,关注数量权重最小;
该方法考虑行为用户的属性强度的原因是,每个用户的行为所表示的影响程度应该是不同的。一个等级高、粉丝量多的用户转发一条博文,与一个等级低、粉丝量少的用户转发一条博文,所带来的影响力应该是不同的。用户本身具有不同的影响力等级,因而,需要考虑行为用户自身的属性;
B3.根据行为用户的属性强度,计算用户u在情感倾向主题z下的影响力fz(u):
Figure BDA0002658174420000033
其中,w1,w2,w3分别表示点赞用户、转发用户、评论用户对用户u的影响权重,
Figure BDA0002658174420000034
其中转发用户和评论用户的影响权重大于点赞用户的影响权重。
B4.定义用户u的已观察到的情感倾向主题列表UserST(u),将主题z添加到UserST(u)中,并定义已观察到的情感倾向主题z所对应的用户列表StUser(z),将用户u添加到列表StUser(z)中;建立用户和情感倾向主题之间映射关系;
B5.根据用户在情感倾向主题下的影响力,建立M×N的用户-情感倾向主题影响力矩阵FMN;影响力矩阵FMN的行向量
Figure BDA0002658174420000035
列向量
Figure BDA0002658174420000036
Figure BDA0002658174420000037
Figure BDA0002658174420000038
表示第m个用户在第n个情感倾向主题下的影响力。
进一步,步骤C中获取额外相似信息,用来弥补用户-情感倾向主题矩阵稀疏问题。相似信息包括情感倾向主题相似、邻居相似和用户相似。
C1.获取情感倾向主题z的相似情感倾向主题列表SimST(z)的具体方法是:
C11.计算情感倾向主题z中所对应的主题t的词向量;
C12.遍历主题集合,对所遍历的主题
Figure BDA0002658174420000041
计算词向量,其中
Figure BDA0002658174420000042
未被标记;
C13.计算主题
Figure BDA0002658174420000043
的词向量与主题t的词向量的相似度,并标记主题
Figure BDA0002658174420000044
C14.根据给定阈值,判断两个词向量是否相似:如果不相似,则返回C12,遍历下一个主题;如果相似,进入C15;
C15.根据情感倾向主题z所对应的情感倾向s,与所遍历的主题
Figure BDA0002658174420000045
组合成相似情感倾向主题
Figure BDA0002658174420000046
并添加至相似情感倾向主题列表SimST(z),并将z添加至相似情感倾向主题列表
Figure BDA0002658174420000047
返回C12,遍历下一个主题,直到全部被标记。
C2.获取用户u的邻居相似用户列表SimNB(u)的具体方法是:
C21.获取用户u的所有邻居节点,包括关注用户,粉丝用户;
C22.遍历用户集合U,对所遍历的用户
Figure BDA0002658174420000048
其中
Figure BDA0002658174420000049
没有被标记,获取用户
Figure BDA00026581744200000410
的所有邻居节点;
C23.计算用户u和用户
Figure BDA00026581744200000411
的邻居相似度,并标记
Figure BDA00026581744200000412
C24.根据给定阈值,判断两个用户的邻居是否相似:如果不相似,返回C22,遍历下一个用户;如果相似,将用户
Figure BDA00026581744200000413
添加至相似邻居用户列表SimNB(u),并将用户u添加至相似邻居用户列表
Figure BDA00026581744200000414
返回C22,遍历下一个用户,直到全部被遍历。
C3.获取用户u的相似用户列表SimU(u)的具体方法是:
C31.根据影响力矩阵FMN,获取用户u的情感倾向主题影响力向量;
C32.遍历用户集合,对所遍历的用户
Figure BDA00026581744200000415
其中
Figure BDA00026581744200000416
没有被标记,获取用户
Figure BDA00026581744200000417
的情感倾向主题影响力向量;
C33.计算用户
Figure BDA00026581744200000418
和用户u的情感倾向主题影响力向量之间的相似度,并标记
Figure BDA00026581744200000419
C34.根据给定阈值,判断两个用户的情感倾向主题影响力向量是否相似:如果不相似,返回C32,遍历下一个用户;如果相似,将用户
Figure BDA00026581744200000420
添加至相似用户列表SimU(u),并将用户u添加至相似用户列表SimU(u),返回C32,遍历下一个用户,直到全部被标记。
进一步,步骤D建立预测模型,是根据用户-情感倾向主题影响力矩阵和相似信息,综合建立影响力预测模型,定义用户u在未观察到的情感倾向主题为z的影响力为
Figure BDA0002658174420000051
其预测模型为:
Figure BDA0002658174420000052
Figure BDA0002658174420000053
是基于用户-情感倾向主题影响力矩阵FMN分解的结果,pu表示用户相关向量,qz表示情感倾向主题相关向量,pu和qz的维度与情感倾向主题数量N一致,T表示转置;
Auz表示情感倾向主题z的相似情感倾向主题列表SimST(z)对用户u的影响力计算的作用强度,
Figure BDA0002658174420000054
其中,
Figure BDA0002658174420000055
表示用户u在相似情感倾向主题
Figure BDA0002658174420000056
下的影响力
Figure BDA0002658174420000057
对结果的作用权重,SimST(z)∩UserST(u)表示在用户u的已观察到的情感倾向主题列表中,与情感倾向主题z相似的情感倾向主题集合;
Buz表示用户u的邻居相似用户列表SimNB(u)对用户u的影响力计算的作用强度,
Figure BDA0002658174420000058
Figure BDA0002658174420000059
其中,
Figure BDA00026581744200000510
表示邻居相似用户
Figure BDA00026581744200000511
在情感倾向主题z下的影响力
Figure BDA00026581744200000512
对结果的作用权重,SimNB(u)∩StUser(z)表示用户u的邻居相似用户集合的子集,该子集用户的历史博文信息中包含情感倾向主题z;
Cuz表示用户u的相似用户列表SimU(u)对用户u的影响力计算的作用强度,
Figure BDA00026581744200000513
Figure BDA00026581744200000514
其中,
Figure BDA00026581744200000515
表示相似用户
Figure BDA00026581744200000516
在情感倾向主题z下的影响力
Figure BDA00026581744200000517
对结果的作用权重,SimU(u)∩StUser(z)表示用户u的相似用户集合的子集,该子集用户的历史博文信息中包含情感倾向主题z。
对预测模型进行训练,模型训练过程与一般求解方法类似,本发明对此不做叙述。利用预测模型对用户在未观察到的情感倾向主题进行影响力预测。
本发明在基于主题的影响力度量方法中,融入情感倾向,细化了用户的影响力度量方式,并结合行为用户属性,使得影响力度量的值更加的准确,更能反应一个用户的影响力程度。另外,建立用户的影响力预测模型,使得能够预测用户在未观察到的主题上的影响力,不局限于用户的历史数据观察到的主题,并融合多种相似信息,弥补数据稀疏问题,使得预测结果更加的准确。
附图说明
图1为本发明方法的实现流程图。
图2为本发明方法中建立用户-情感倾向主题影响力矩阵的流程图。
图3为本发明方法中获取相似情感倾向主题列表的流程图;
图4为本发明方法中获取邻居相似用户列表的流程图;
图5为本发明方法中获取相似用户列表的流程图。
具体实施方式
以下结合附图和实施实例对本发明加以详细说明。
基于融合情感倾向主题的社交网络用户影响力预测方法,总的实现流程如图1所示:
步骤A.提取用户u在博文的情感倾向,建立对应用户在情感倾向主题z下的博文信息列表Lz(u);具体是:
根据博文内容,用情感分析工具将其情感倾向识别为正向或负向,并用LDA方法提取主题信息,将情感倾向和主题信息组合成情感倾向主题,并将博文信息按照情感倾向主题,建立对应的列表;博文信息包括博文内容、点赞、转发、评论;
设用户集合U={u1,u2,u3,…,uM},情感倾向集合为S,主题集合为T;M为用户数量,um表示第m个用户,m=1,2,…,M;定义用户u∈U的情感倾向s∈S,主题t∈T,两者组合为情感倾向主题z=(s,t);
设情感倾向主题集合Z={z1,z2,z3,…,zN},N为情感倾向主题数量,zn表示第n个情感倾向主题,n=1,2,…,N;
用户u在情感倾向主题为z下的博文信息列表Lz(u)={W1,W2,W3,…,WR},R表示用户u在情感倾向主题为z的博文数量,Wr表示列表中的第r条博文相关信息,包括对应的博文内容、点赞、评论、转发,r=1,2,…,R。
步骤B.根据行为用户属性和行为特征计算影响力,建立用户-情感倾向主题影响力矩阵;具体实现流程如图2所示:
B1.根据用户u在情感倾向主题z下的博文信息列表Lz(u),统计其中三种行为用户列表,分别为点赞用户列表LLz(u)、转发用户列表FLz(u)和评论用户列表CLz(u);
B2.根据三种行为用户列表中行为用户的粉丝数量、关注数量、原创博文数量和用户等级,计算出行为用户的属性强度;
行为用户v的属性强度
Figure BDA0002658174420000071
v∈U;其中n1(v),n2(v),n3(v)分别表示行为用户v的粉丝数量、关注数量和原创微博数量,l(v)表示行为用户v的等级,γ为对应的权重,
Figure BDA0002658174420000072
γ1表示粉丝数量权重、γ2表示关注数量权重、γ3表示原创微博数量权重、γ4表示行为用户等级权重,其中粉丝数量的重最大,关注数量权重最小;
B3.根据行为用户的属性强度,计算用户u在情感倾向主题z下的影响力fz(u):
Figure BDA0002658174420000073
其中,w1,w2,w3分别表示点赞用户、转发用户、评论用户对用户u的影响权重,
Figure BDA0002658174420000074
其中转发用户和评论用户的影响权重大于点赞用户的影响权重;
即用户u在情感倾向主题z下的影响力与其他用户的属性和行为有关;
B4.定义用户u的已观察到的情感倾向主题列表UserST(u),将主题z添加到UserST(u)中,并定义已观察到的情感倾向主题z所对应的用户列表StUser(z),将用户u添加到列表StUser(z)中;建立用户和情感倾向主题之间映射关系;
B5.根据用户在情感倾向主题下的影响力,建立M×N的用户-情感倾向主题影响力矩阵FMN;影响力矩阵FMN的行向量
Figure BDA0002658174420000075
列向量
Figure BDA0002658174420000076
Figure BDA0002658174420000077
Figure BDA0002658174420000078
表示第m个用户在第n个情感倾向主题下的影响力。
步骤C.根据用户影响力矩阵FMN和全部用户集合U,获取情感倾向主题z的相似情感倾向主题列表SimST(z)、用户u的邻居相似用户列表SimNB(u)、用户u的相似用户列表SimU(u)。
获取情感倾向主题z的相似情感倾向主题列表SimST(z)的具体方法如图3:
C11.计算情感倾向主题z中所对应的主题t的词向量tV;具体的:根据词向量计算工具word2vec,计算主题词t的词向量tV=[tv1,tv2,tv3,…tvP],J为词向量的维数,tvj表示第j维分量;j=1,2,…,J;
C12.遍历主题集合,对所遍历的主题
Figure BDA0002658174420000081
计算词向量
Figure BDA0002658174420000082
其中
Figure BDA0002658174420000083
未被标记;具体的:根据词向量计算工具word2vec,计算主题词
Figure BDA0002658174420000084
的词向量
Figure BDA0002658174420000085
J为词向量的维数,
Figure BDA0002658174420000086
表示第j维分量;j=1,2,…,J;
C13.计算主题
Figure BDA0002658174420000087
的词向量与主题t的词向量的相似度,并标记主题
Figure BDA0002658174420000088
具体的:词向量之间的相似度计算方法利用欧式距离定义为:
Figure BDA0002658174420000089
C14.根据给定阈值,判断两个词向量是否相似:如果不相似,则返回C12,遍历下一个主题;如果相似,进入C15;
C15.根据情感倾向主题z所对应的情感倾向s,与所遍历的主题
Figure BDA00026581744200000810
组合成相似情感倾向主题
Figure BDA00026581744200000811
并添加至相似情感倾向主题列表SimST(z),并将z添加至相似情感倾向主题列表
Figure BDA00026581744200000812
返回C12,遍历下一个主题,直到全部被标记。
获取用户u的邻居相似用户列表SimNB(u)的具体方法如图4:
C21.获取用户u的所有邻居节点,包括关注用户,粉丝用户;具体的:定义用户u的邻居节点为Ne(u);
C22.遍历用户集合U,对所遍历的用户
Figure BDA00026581744200000813
其中
Figure BDA00026581744200000814
没有被标记,获取用户
Figure BDA00026581744200000815
的所有邻居节点,定义用户
Figure BDA00026581744200000816
的邻居节点为
Figure BDA00026581744200000817
C23.计算用户u和用户
Figure BDA00026581744200000818
的邻居相似度,并标记
Figure BDA00026581744200000819
具体的,定义两个用户之间的邻居相似度为
Figure BDA00026581744200000820
Figure BDA00026581744200000821
Figure BDA00026581744200000822
表示两者的邻居重叠数量,|Ne(u)|表示u的邻居数量;
C24.根据给定阈值,判断两个用户的邻居是否相似:如果不相似,返回C22,遍历下一个用户;如果相似,将用户
Figure BDA00026581744200000823
添加至相似邻居用户列表SimNB(u),并将用户u添加至相似邻居用户列表
Figure BDA00026581744200000824
返回C22,遍历下一个用户,直到全部被遍历。
获取用户u的相似用户列表SimU(u)的具体方法如图5:
C31.根据影响力矩阵FMN,获取用户u在矩阵中对应行的情感倾向主题影响力向量uf;
C32.遍历用户集合,对所遍历的用户
Figure BDA00026581744200000825
其中
Figure BDA00026581744200000826
没有被标记,获取用户
Figure BDA00026581744200000827
在矩阵中对应行的情感倾向主题影响力向量
Figure BDA0002658174420000091
C33.计算用户
Figure BDA0002658174420000092
和用户u的情感倾向主题影响力向量之间的相似度,并标记
Figure BDA0002658174420000093
具体的,用户的影响力向量之间的相似度用欧式距离定义:
Figure BDA0002658174420000094
C34.根据给定阈值,判断两个用户的情感倾向主题影响力向量是否相似:如果不相似,返回C32,遍历下一个用户;如果相似,将用户
Figure BDA0002658174420000095
添加至相似用户列表SimU(u),并将用户u添加至相似用户列表SimU(u),返回C32,遍历下一个用户,直到全部被标记。
步骤D.建立预测模型,对用户在未观察到的情感倾向主题进行影响力预测。根据用户-情感倾向主题影响力矩阵和相似信息,综合建立影响力预测模型,定义用户u在未观察到的情感倾向主题为z的影响力为
Figure BDA0002658174420000096
其预测模型为:
Figure BDA0002658174420000097
Figure BDA0002658174420000098
是基于用户-情感倾向主题影响力矩阵FMN分解的结果,pu表示用户相关向量,qz表示情感倾向主题相关向量,pu和qz的维度与情感倾向主题数量N一致,T表示转置;
Auz表示情感倾向主题z的相似情感倾向主题列表SimST(z)对用户u的影响力计算的作用强度,
Figure BDA0002658174420000099
其中,
Figure BDA00026581744200000910
表示用户u在相似情感倾向主题
Figure BDA00026581744200000911
下的影响力
Figure BDA00026581744200000912
对结果的作用权重,SimST(z)∩UserST(u)表示在用户u的已观察到的情感倾向主题列表中,与情感倾向主题z相似的情感倾向主题集合;
Buz表示用户u的邻居相似用户列表SimNB(u)对用户u的影响力计算的作用强度,
Figure BDA00026581744200000913
Figure BDA00026581744200000914
其中,
Figure BDA00026581744200000915
表示邻居相似用户
Figure BDA00026581744200000916
在情感倾向主题z下的影响力
Figure BDA00026581744200000917
对结果的作用权重,SimNB(u)∩StUser(z)表示用户u的邻居相似用户集合的子集,该子集用户的历史博文信息中包含情感倾向主题z;
Cuz表示用户u的相似用户列表SimU(u)对用户u的影响力计算的作用强度,
Figure BDA00026581744200000918
Figure BDA00026581744200000919
其中,
Figure BDA00026581744200000920
表示相似用户
Figure BDA00026581744200000921
在情感倾向主题z下的影响力
Figure BDA00026581744200000922
对结果的作用权重,SimU(u)∩StUser(z)表示用户u的相似用户集合的子集,该子集用户的历史博文信息中包含情感倾向主题z。
利用预测模型对用户在未观察到的情感倾向主题进行影响力预测。
该方法融合情感倾向主题的用户影响力预测方法,是通过行为用户的属性和行为特征,计算用户在融合情感倾向主题上的影响力,在主题上更加细化,从而能更准确的反应用户的影响力程度;建立用户影响力矩阵,利用矩阵分解方法,并提出一种更全面的相似信息计算方法,通过获取相似情感倾向主题、邻居相似用户和相似用户弥补矩阵中的数值稀疏问题,更准确的对用户在未观察到的主题上的影响力进行预测。综上,该方法能更全面的度量并预测用户在不同主题上的影响力,同时将情感倾向融入其中,更能准确反映一个用户对其他用户的影响程度。

Claims (7)

1.基于融合情感倾向主题的社交网络用户影响力预测方法,其特征在于,该方法具体是:
步骤A.提取用户u在博文的情感倾向,建立对应用户在情感倾向主题z下的博文信息列表Lz(u);
步骤B.根据行为用户属性和行为特征计算影响力,建立用户-情感倾向主题影响力矩阵;
步骤C.获取情感倾向主题z的相似情感倾向主题列表SimST(z)、用户u的邻居相似用户列表SimNB(u)、用户u的相似用户列表SimU(u);
步骤D.建立预测模型,对用户在未观察到的情感倾向主题进行影响力预测。
2.如权利要求1所述的基于融合情感倾向主题的社交网络用户影响力预测方法,其特征在于,步骤A具体方法是:
根据博文内容,用情感分析工具将其情感倾向识别为正向或负向,并用LDA方法提取主题信息,将情感倾向和主题信息组合成情感倾向主题,并将博文信息按照情感倾向主题,建立对应的列表;所述的博文信息包括博文内容、点赞、转发、评论;
设用户集合U={u1,u2,u3,…,uM},情感倾向集合为S,主题集合为T;M为用户数量,um表示第m个用户,m=1,2,…,M;定义用户u∈U的情感倾向s∈S,主题t∈T,两者组合为情感倾向主题z=(s,t);
设情感倾向主题集合Z={z1,z2,z3,…,zN},N为情感倾向主题数量,zn表示第n个情感倾向主题,n=1,2,…,N;
用户u在情感倾向主题为z下的博文信息列表Lz(u)={W1,W2,W3,…,WR},R表示用户u在情感倾向主题为z的博文数量,Wr表示列表中的第r条博文相关信息,包括对应的博文内容、点赞、评论、转发,r=1,2,…,R。
3.如权利要求2所述的基于融合情感倾向主题的社交网络用户影响力预测方法,其特征在于,步骤B具体方法是:
B1.根据用户u在情感倾向主题z下的博文信息列表Lz(u),统计其中三种行为用户列表,分别为点赞用户列表LLz(u)、转发用户列表FLz(u)和评论用户列表CLz(u);
B2.根据三种行为用户列表中行为用户的粉丝数量、关注数量、原创博文数量和用户等级,计算出行为用户的属性强度;
行为用户v的属性强度
Figure FDA0002658174410000021
v∈U;其中n1(v),n2(v),n3(v)分别表示行为用户v的粉丝数量、关注数量和原创微博数量,l(v)表示行为用户v的等级,γ为对应的权重,
Figure FDA0002658174410000022
γ1表示粉丝数量权重、γ2表示关注数量权重、γ3表示原创微博数量权重、γ4表示行为用户等级权重,其中粉丝数量的重最大,关注数量权重最小;
B3.根据行为用户的属性强度,计算用户u在情感倾向主题z下的影响力fz(u):
Figure FDA0002658174410000023
其中,w1,w2,w3分别表示点赞用户、转发用户、评论用户对用户u的影响权重,
Figure FDA0002658174410000024
其中转发用户和评论用户的影响权重大于点赞用户的影响权重;
B4.定义用户u的已观察到的情感倾向主题列表UserST(u),将主题z添加到UserST(u)中,并定义已观察到的情感倾向主题z所对应的用户列表StUser(z),将用户u添加到列表StUser(z)中;建立用户和情感倾向主题之间映射关系;
B5.根据用户在情感倾向主题下的影响力,建立M×N的用户-情感倾向主题影响力矩阵FMN;影响力矩阵FMN的行向量
Figure FDA0002658174410000025
列向量
Figure FDA0002658174410000026
Figure FDA0002658174410000027
表示第m个用户在第n个情感倾向主题下的影响力。
4.如权利要求3所述的基于融合情感倾向主题的社交网络用户影响力预测方法,其特征在于,步骤C中获取情感倾向主题z的相似情感倾向主题列表SimST(z)具体方法是:
C11.计算情感倾向主题z中所对应的主题t的词向量;
C12.遍历主题集合,对所遍历的主题
Figure FDA0002658174410000028
计算词向量,其中
Figure FDA0002658174410000029
未被标记;
C13.计算主题
Figure FDA00026581744100000210
的词向量与主题t的词向量的相似度,并标记主题
Figure FDA00026581744100000211
C14.根据给定阈值,判断两个词向量是否相似:如果不相似,则返回C12,遍历下一个主题;如果相似,进入C15;
C15.根据情感倾向主题z所对应的情感倾向s,与所遍历的主题
Figure FDA0002658174410000031
组合成相似情感倾向主题
Figure FDA0002658174410000032
并添加至相似情感倾向主题列表SimST(z),并将z添加至相似情感倾向主题列表
Figure FDA0002658174410000033
返回C12,遍历下一个主题,直到全部被标记。
5.如权利要求3所述的基于融合情感倾向主题的社交网络用户影响力预测方法,其特征在于,步骤C中获取用户u的邻居相似用户列表SimNB(u)的具体方法是:
C21.获取用户u的所有邻居节点,包括关注用户,粉丝用户;
C22.遍历用户集合U,对所遍历的用户
Figure FDA0002658174410000034
其中
Figure FDA0002658174410000035
没有被标记,获取用户
Figure FDA0002658174410000036
的所有邻居节点;
C23.计算用户u和用户
Figure FDA0002658174410000037
的邻居相似度,并标记
Figure FDA0002658174410000038
C24.根据给定阈值,判断两个用户的邻居是否相似:如果不相似,返回C22,遍历下一个用户;如果相似,将用户
Figure FDA0002658174410000039
添加至相似邻居用户列表SimNB(u),并将用户u添加至相似邻居用户列表
Figure FDA00026581744100000317
返回C22,遍历下一个用户,直到全部被遍历。
6.如权利要求3所述的基于融合情感倾向主题的社交网络用户影响力预测方法,其特征在于,步骤C中获取用户u的相似用户列表SimU(u)的具体方法是:
C31.根据影响力矩阵FMN,获取用户u的情感倾向主题影响力向量;
C32.遍历用户集合,对所遍历的用户
Figure FDA00026581744100000310
其中
Figure FDA00026581744100000311
没有被标记,获取用户
Figure FDA00026581744100000312
的情感倾向主题影响力向量;
C33.计算用户
Figure FDA00026581744100000313
和用户u的情感倾向主题影响力向量之间的相似度,并标记
Figure FDA00026581744100000314
C34.根据给定阈值,判断两个用户的情感倾向主题影响力向量是否相似:如果不相似,返回C32,遍历下一个用户;如果相似,将用户
Figure FDA00026581744100000318
添加至相似用户列表SimU(u),并将用户u添加至相似用户列表SimU(u),返回C32,遍历下一个用户,直到全部被标记。
7.如权利要求4、5或6所述的基于融合情感倾向主题的社交网络用户影响力预测方法,其特征在于,步骤D具体方法是:
定义用户u在未观察到的情感倾向主题为z的影响力为
Figure FDA00026581744100000315
其预测模型为:
Figure FDA00026581744100000316
Figure FDA0002658174410000041
是基于用户-情感倾向主题影响力矩阵FMN分解的结果,pu表示用户相关向量,qz表示情感倾向主题相关向量,pu和qz的维度与情感倾向主题数量N一致,T表示转置;
Auz表示情感倾向主题z的相似情感倾向主题列表SimST(z)对用户u的影响力计算的作用强度,
Figure FDA0002658174410000042
其中,
Figure FDA0002658174410000043
表示用户u在相似情感倾向主题
Figure FDA0002658174410000044
下的影响力
Figure FDA0002658174410000045
对结果的作用权重,SimST(z)∩UserST(u)表示在用户u的已观察到的情感倾向主题列表中,与情感倾向主题z相似的情感倾向主题集合;
Buz表示用户u的邻居相似用户列表SimNB(u)对用户u的影响力计算的作用强度,
Figure FDA0002658174410000046
其中,
Figure FDA0002658174410000047
表示邻居相似用户
Figure FDA0002658174410000048
在情感倾向主题z下的影响力
Figure FDA0002658174410000049
对结果的作用权重,SimNB(u)∩StUser(z)表示用户u的邻居相似用户集合的子集,该子集用户的历史博文信息中包含情感倾向主题z;
Cuz表示用户u的相似用户列表SimU(u)对用户u的影响力计算的作用强度,
Figure FDA00026581744100000410
其中,
Figure FDA00026581744100000411
表示相似用户
Figure FDA00026581744100000412
在情感倾向主题z下的影响力
Figure FDA00026581744100000413
对结果的作用权重,SimU(u)∩StUser(z)表示用户u的相似用户集合的子集,该子集用户的历史博文信息中包含情感倾向主题z。
CN202010895010.1A 2020-08-31 2020-08-31 基于融合情感倾向主题的社交网络用户影响力预测方法 Active CN112052995B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010895010.1A CN112052995B (zh) 2020-08-31 2020-08-31 基于融合情感倾向主题的社交网络用户影响力预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010895010.1A CN112052995B (zh) 2020-08-31 2020-08-31 基于融合情感倾向主题的社交网络用户影响力预测方法

Publications (2)

Publication Number Publication Date
CN112052995A true CN112052995A (zh) 2020-12-08
CN112052995B CN112052995B (zh) 2023-08-01

Family

ID=73607131

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010895010.1A Active CN112052995B (zh) 2020-08-31 2020-08-31 基于融合情感倾向主题的社交网络用户影响力预测方法

Country Status (1)

Country Link
CN (1) CN112052995B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113157858A (zh) * 2021-03-25 2021-07-23 上海柏观数据科技有限公司 一种基于情感词匹配与频度结合的情感程度检测方法
CN113923226A (zh) * 2021-10-15 2022-01-11 北京智融云河科技有限公司 区块链下的邻居节点管理方法、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101770487A (zh) * 2008-12-26 2010-07-07 聚友空间网络技术有限公司 社交网络中用户影响力的计算方法和系统
CN104123352A (zh) * 2014-07-10 2014-10-29 西安理工大学 面向微博的话题层次用户影响力度量方法
CN106780073A (zh) * 2017-01-11 2017-05-31 中南大学 一种考虑用户行为和情感的社会网络影响力最大化初始节点选取方法
CN108038240A (zh) * 2017-12-26 2018-05-15 武汉大学 基于内容、用户多因素分析的社交网络谣言检测方法
CN108549632A (zh) * 2018-04-03 2018-09-18 重庆邮电大学 一种基于情感分析的社交网络影响力传播模型构建方法
CN109684646A (zh) * 2019-01-15 2019-04-26 江苏大学 一种基于话题影响力的微博话题情感分析方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101770487A (zh) * 2008-12-26 2010-07-07 聚友空间网络技术有限公司 社交网络中用户影响力的计算方法和系统
CN104123352A (zh) * 2014-07-10 2014-10-29 西安理工大学 面向微博的话题层次用户影响力度量方法
CN106780073A (zh) * 2017-01-11 2017-05-31 中南大学 一种考虑用户行为和情感的社会网络影响力最大化初始节点选取方法
CN108038240A (zh) * 2017-12-26 2018-05-15 武汉大学 基于内容、用户多因素分析的社交网络谣言检测方法
CN108549632A (zh) * 2018-04-03 2018-09-18 重庆邮电大学 一种基于情感分析的社交网络影响力传播模型构建方法
CN109684646A (zh) * 2019-01-15 2019-04-26 江苏大学 一种基于话题影响力的微博话题情感分析方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113157858A (zh) * 2021-03-25 2021-07-23 上海柏观数据科技有限公司 一种基于情感词匹配与频度结合的情感程度检测方法
CN113923226A (zh) * 2021-10-15 2022-01-11 北京智融云河科技有限公司 区块链下的邻居节点管理方法、设备及存储介质
CN113923226B (zh) * 2021-10-15 2024-03-01 北京智融云河科技有限公司 区块链下的邻居节点管理方法、设备及存储介质

Also Published As

Publication number Publication date
CN112052995B (zh) 2023-08-01

Similar Documents

Publication Publication Date Title
Wang et al. Top-N personalized recommendation with graph neural networks in MOOCs
US9483580B2 (en) Estimation of closeness of topics based on graph analytics
CN107341571B (zh) 一种基于量化社会影响力的社交网络用户行为预测方法
Ayyaz et al. HCF-CRS: A Hybrid Content based Fuzzy Conformal Recommender System for providing recommendations with confidence
CN104199818B (zh) 一种基于分类的社会化推荐方法
WO2022179384A1 (zh) 一种社交群体的划分方法、划分系统及相关装置
CN111177559B (zh) 文旅服务推荐方法、装置、电子设备及存储介质
CN111143704B (zh) 一种融合用户影响关系的在线社区好友推荐方法及系统
CN112733018A (zh) 一种基于图神经网络gnn和多任务学习的会话推荐方法
Seo et al. Point of interest recommendations based on the anchoring effect in location-based social network services
Wang et al. Multitask feature learning approach for knowledge graph enhanced recommendations with RippleNet
CN112052995A (zh) 基于融合情感倾向主题的社交网络用户影响力预测方法
CN110909230A (zh) 一种网络热点分析方法及系统
CN111681084A (zh) 一种基于社交关系影响因素的电商平台推荐方法
Khan et al. Comparative analysis on Facebook post interaction using DNN, ELM and LSTM
Yang et al. Bilateral knowledge graph enhanced online course recommendation
CN112818234B (zh) 一种网络舆情信息分析处理方法及系统
WO2019242453A1 (zh) 信息处理方法及装置、存储介质、电子装置
CN114282077A (zh) 一种基于会话数据的会话推荐方法及系统
Berlanga et al. Quality indicators for social business intelligence
Sapkota et al. A network-centric approach for estimating trust between open source software developers
CN112287225B (zh) 一种对象推荐方法及装置
CN114997723A (zh) 面向企业经营活动的多源异构区块链质量评估模型的构建方法
Li et al. The Impact of Network Structure on Knowledge Adoption: A Network Text Analysis on Knowledge-Sharing Platforms
CN111460318B (zh) 基于显性和隐性信任的协同过滤推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Wang Ran

Inventor after: Liang Ying

Inventor after: Xu Xianghua

Inventor after: Li Ping

Inventor before: Liang Ying

Inventor before: Wang Ran

Inventor before: Xu Xianghua

Inventor before: Li Ping

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant