CN112052995B - 基于融合情感倾向主题的社交网络用户影响力预测方法 - Google Patents
基于融合情感倾向主题的社交网络用户影响力预测方法 Download PDFInfo
- Publication number
- CN112052995B CN112052995B CN202010895010.1A CN202010895010A CN112052995B CN 112052995 B CN112052995 B CN 112052995B CN 202010895010 A CN202010895010 A CN 202010895010A CN 112052995 B CN112052995 B CN 112052995B
- Authority
- CN
- China
- Prior art keywords
- user
- influence
- emotion
- topic
- tendency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 166
- 238000000034 method Methods 0.000 title claims abstract description 52
- 230000004927 fusion Effects 0.000 title claims abstract description 8
- 239000011159 matrix material Substances 0.000 claims abstract description 32
- 230000003542 behavioural effect Effects 0.000 claims abstract description 22
- 238000004364 calculation method Methods 0.000 claims abstract description 15
- 239000013598 vector Substances 0.000 claims description 45
- 230000002996 emotional effect Effects 0.000 claims description 17
- 238000004458 analytical method Methods 0.000 claims description 7
- 230000000694 effects Effects 0.000 claims description 6
- SLXKOJJOQWFEFD-UHFFFAOYSA-N 6-aminohexanoic acid Chemical compound NCCCCCC(O)=O SLXKOJJOQWFEFD-UHFFFAOYSA-N 0.000 claims description 5
- 238000000354 decomposition reaction Methods 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims description 3
- 230000017105 transposition Effects 0.000 claims description 3
- 238000005259 measurement Methods 0.000 abstract description 2
- 238000007796 conventional method Methods 0.000 abstract 1
- 230000006399 behavior Effects 0.000 description 19
- 238000005516 engineering process Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 230000011273 social behavior Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- Mathematical Physics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Pure & Applied Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computing Systems (AREA)
- Computational Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Primary Health Care (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了基于融合情感倾向主题的社交网络用户影响力预测方法。现有方法影响力计算结果笼统,无法有效的体现用户的实际影响力。本发明方法首先提取用户带有不同情感倾向的主题信息,建立对应的用户博文信息列表;然后,建立用户‑情感倾向主题影响力矩阵,获取情感倾向主题相似、邻居相似、用户相似信息;最后,建立预测模型,对未观察到的情感倾向主题进行影响力预测。本发明方法融入情感倾向,结合行为用户属性,使得影响力度量的值更加的准确,更能反应一个用户的影响力程度,使得能够预测用户在未观察到的主题上的影响力,不局限于用户的历史数据观察到的主题,并融合多种相似信息,弥补数据稀疏问题,预测结果更加的准确。
Description
技术领域
本发明属于社交网络分析技术领域,涉及一种基于融合情感倾向主题的社交网络用户影响力预测方法。
背景技术
社交网络是互联网时代信息传播的重要组成部分,随着计算机技术的普及和发展,越来越多的用户通过在微博、推特(Twitter)等社交网络平台上发表内容、传播信息,并影响到其他的用户。分析社交网络中的这种影响力,对了解社交用户的行动内因、信息在网络中的传播因素以及预测信息在网络中的传播范围等都具有重要的意义。
社交网络影响力体现在用户对其他用户的影响程度,是指用户自身的社交行为通过社交网络中的社交关系,使其他用户产生相关行为的一种现象,具体表现在点赞、转发等。对社交网络影响力的分析,是指通过收集用户在社交网络上的历史数据,如博文内容、转发次数、回复内容等相关信息,分析用户在社交网络上的影响力,从而用于商业营销、广告投放、舆情控制等诸多领域。
目前对社交网络影响力的度量分析方法大致从两个角度出发,一个是从宏观层面考虑,分析用户在网络中的拓扑结构属性,如Granovertter等利用用户节点之间的邻居重叠比例来计算影响力。这种基于网络拓扑结构的影响力度量方法比较简单,但是没有考虑用户的文本信息和交互信息,影响力计算结果太过笼统,无法有效的体现用户的实际影响力。另一个是从主题角度上考虑的,用户在不同的主题上会有着不同的影响力,如数码博主在手机话题上对其他用户的影响力会高于在政治主题上的影响力。然而,这种方法存在两个问题。首先是忽略了用户的博文主题中含有的情感倾向,以政治主题为例,一个对该主题情感积极的用户,被其他用户带有消极情绪的政治相关主题影响的概率会很小,同一个主题可以表现出不同的情感倾向,不同情感倾向的主题,对用户来说也应有着不同程度的影响力。其次是无法对未观察到的主题进行影响力度量预测,即无法预测用户在潜在的主题上的影响力。
发明内容
本发明的目的就是针对现有方法中存在的问题,提供一种基于融合情感倾向主题的社交网络用户影响力预测方法,能够在不同情感倾向的主题上,度量并预测用户的影响力。
本发明方法通过提取用户历史博文中的主题信息,结合其中表现出来的情感倾向,根据点赞、评论、转发等多种行为和行为用户属性(行为用户是指对用户的博文进行点赞、评论、转发等操作的用户),计算用户在该情感倾向主题上的影响力,并建立用户-情感倾向主题影响力矩阵。利用矩阵分解技术,得到对应的用户潜在特征矩阵和情感倾向主题特征矩阵,并融合情感倾向主题相似、邻居相似、用户相似等额外信息,以减少影响力矩阵稀疏带来的影响,建立用户在未观察到的情感倾向主题上的影响力预测模型。
本发明方法包括如下步骤:
步骤A.提取用户u在博文的情感倾向,建立对应用户在情感倾向主题z下的博文信息列表Lz(u);
步骤B.根据行为用户属性和行为特征计算影响力,建立用户-情感倾向主题影响力矩阵;
步骤C.获取情感倾向主题z的相似情感倾向主题列表SimST(z)、用户u的邻居相似用户列表SimNB(u)、用户u的相似用户列表SimU(u);
步骤D.建立预测模型,对用户在未观察到的情感倾向主题进行影响力预测。
进一步,步骤A中采用粗粒度的情感分析方法提取用户博文的情感倾向,具体方法是:
根据博文内容,用情感分析工具将其情感倾向识别为正向或负向,并用LDA方法提取主题信息,将情感倾向和主题信息组合成情感倾向主题,并将博文信息按照情感倾向主题,建立对应的列表;所述的博文信息包括博文内容、点赞、转发、评论;
设用户集合U={u1,u2,u3,…,uM},情感倾向集合为S,主题集合为T;M为用户数量,um表示第m个用户,m=1,2,…,M;定义用户u∈U的情感倾向s∈S,主题t∈T,两者组合为情感倾向主题z=(s,t);
设情感倾向主题集合Z={z1,z2,z3,…,zN},N为情感倾向主题数量,zn表示第n个情感倾向主题,n=1,2,…,N;
用户u在情感倾向主题为z下的博文信息列表Lz(u)={W1,W2,W3,…,WR},R表示用户u在情感倾向主题为z的博文数量,Wr表示列表中的第r条博文相关信息,包括对应的博文内容、点赞、评论、转发,r=1,2,…,R。
进一步,步骤B是根据步骤A中用户博文列表上所获得的点赞、转发、评论行为和行为用户的属性,计算相应的影响力,从而获取用户在某个情感倾向主题上的影响力,然后建立用户-情感倾向主题影响力矩阵。具体方法是:
B1.根据用户u在情感倾向主题z下的博文信息列表Lz(u),统计其中三种行为用户列表,分别为点赞用户列表LLz(u)、转发用户列表FLz(u)和评论用户列表CLz(u);
B2.根据三种行为用户列表中行为用户的粉丝数量、关注数量、原创博文数量和用户等级,计算出行为用户的属性强度;
行为用户v的属性强度v∈U;其中n1(v),n2(v),n3(v)分别表示行为用户v的粉丝数量、关注数量和原创微博数量,l(v)表示行为用户v的等级,γ为对应的权重,/>γ1表示粉丝数量权重、γ2表示关注数量权重、γ3表示原创微博数量权重、γ4表示行为用户等级权重,其中粉丝数量的重最大,关注数量权重最小;
该方法考虑行为用户的属性强度的原因是,每个用户的行为所表示的影响程度应该是不同的。一个等级高、粉丝量多的用户转发一条博文,与一个等级低、粉丝量少的用户转发一条博文,所带来的影响力应该是不同的。用户本身具有不同的影响力等级,因而,需要考虑行为用户自身的属性;
B3.根据行为用户的属性强度,计算用户u在情感倾向主题z下的影响力fz(u):其中,w1,w2,w3分别表示点赞用户、转发用户、评论用户对用户u的影响权重,/>其中转发用户和评论用户的影响权重大于点赞用户的影响权重。
B4.定义用户u的已观察到的情感倾向主题列表UserST(u),将主题z添加到UserST(u)中,并定义已观察到的情感倾向主题z所对应的用户列表StUser(z),将用户u添加到列表StUser(z)中;建立用户和情感倾向主题之间映射关系;
B5.根据用户在情感倾向主题下的影响力,建立M×N的用户-情感倾向主题影响力矩阵FMN;影响力矩阵FMN的行向量列向量/> 表示第m个用户在第n个情感倾向主题下的影响力。
进一步,步骤C中获取额外相似信息,用来弥补用户-情感倾向主题矩阵稀疏问题。相似信息包括情感倾向主题相似、邻居相似和用户相似。
C1.获取情感倾向主题z的相似情感倾向主题列表SimST(z)的具体方法是:
C11.计算情感倾向主题z中所对应的主题t的词向量;
C12.遍历主题集合,对所遍历的主题计算词向量,其中/>未被标记;
C13.计算主题的词向量与主题t的词向量的相似度,并标记主题/>
C14.根据给定阈值,判断两个词向量是否相似:如果不相似,则返回C12,遍历下一个主题;如果相似,进入C15;
C15.根据情感倾向主题z所对应的情感倾向s,与所遍历的主题组合成相似情感倾向主题/>并添加至相似情感倾向主题列表SimST(z),并将z添加至相似情感倾向主题列表/>返回C12,遍历下一个主题,直到全部被标记。
C2.获取用户u的邻居相似用户列表SimNB(u)的具体方法是:
C21.获取用户u的所有邻居节点,包括关注用户,粉丝用户;
C22.遍历用户集合U,对所遍历的用户其中/>没有被标记,获取用户/>的所有邻居节点;
C23.计算用户u和用户的邻居相似度,并标记/>
C24.根据给定阈值,判断两个用户的邻居是否相似:如果不相似,返回C22,遍历下一个用户;如果相似,将用户添加至相似邻居用户列表SimNB(u),并将用户u添加至相似邻居用户列表/>返回C22,遍历下一个用户,直到全部被遍历。
C3.获取用户u的相似用户列表SimU(u)的具体方法是:
C31.根据影响力矩阵FMN,获取用户u的情感倾向主题影响力向量;
C32.遍历用户集合,对所遍历的用户其中/>没有被标记,获取用户/>的情感倾向主题影响力向量;
C33.计算用户和用户u的情感倾向主题影响力向量之间的相似度,并标记/>
C34.根据给定阈值,判断两个用户的情感倾向主题影响力向量是否相似:如果不相似,返回C32,遍历下一个用户;如果相似,将用户添加至相似用户列表SimU(u),并将用户u添加至相似用户列表SimU(u),返回C32,遍历下一个用户,直到全部被标记。
进一步,步骤D建立预测模型,是根据用户-情感倾向主题影响力矩阵和相似信息,综合建立影响力预测模型,定义用户u在未观察到的情感倾向主题为z的影响力为其预测模型为:/>
是基于用户-情感倾向主题影响力矩阵FMN分解的结果,pu表示用户相关向量,qz表示情感倾向主题相关向量,pu和qz的维度与情感倾向主题数量N一致,T表示转置;
Auz表示情感倾向主题z的相似情感倾向主题列表SimST(z)对用户u的影响力计算的作用强度,其中,/>表示用户u在相似情感倾向主题/>下的影响力/>对结果的作用权重,SimST(z)∩UserST(u)表示在用户u的已观察到的情感倾向主题列表中,与情感倾向主题z相似的情感倾向主题集合;
Buz表示用户u的邻居相似用户列表SimNB(u)对用户u的影响力计算的作用强度, 其中,/>表示邻居相似用户/>在情感倾向主题z下的影响力对结果的作用权重,SimNB(u)∩StUser(z)表示用户u的邻居相似用户集合的子集,该子集用户的历史博文信息中包含情感倾向主题z;
Cuz表示用户u的相似用户列表SimU(u)对用户u的影响力计算的作用强度, 其中,/>表示相似用户/>在情感倾向主题z下的影响力/>对结果的作用权重,SimU(u)∩StUser(z)表示用户u的相似用户集合的子集,该子集用户的历史博文信息中包含情感倾向主题z。
对预测模型进行训练,模型训练过程与一般求解方法类似,本发明对此不做叙述。利用预测模型对用户在未观察到的情感倾向主题进行影响力预测。
本发明在基于主题的影响力度量方法中,融入情感倾向,细化了用户的影响力度量方式,并结合行为用户属性,使得影响力度量的值更加的准确,更能反应一个用户的影响力程度。另外,建立用户的影响力预测模型,使得能够预测用户在未观察到的主题上的影响力,不局限于用户的历史数据观察到的主题,并融合多种相似信息,弥补数据稀疏问题,使得预测结果更加的准确。
附图说明
图1为本发明方法的实现流程图。
图2为本发明方法中建立用户-情感倾向主题影响力矩阵的流程图。
图3为本发明方法中获取相似情感倾向主题列表的流程图;
图4为本发明方法中获取邻居相似用户列表的流程图;
图5为本发明方法中获取相似用户列表的流程图。
具体实施方式
以下结合附图和实施实例对本发明加以详细说明。
基于融合情感倾向主题的社交网络用户影响力预测方法,总的实现流程如图1所示:
步骤A.提取用户u在博文的情感倾向,建立对应用户在情感倾向主题z下的博文信息列表Lz(u);具体是:
根据博文内容,用情感分析工具将其情感倾向识别为正向或负向,并用LDA方法提取主题信息,将情感倾向和主题信息组合成情感倾向主题,并将博文信息按照情感倾向主题,建立对应的列表;博文信息包括博文内容、点赞、转发、评论;
设用户集合U={u1,u2,u3,…,uM},情感倾向集合为S,主题集合为T;M为用户数量,um表示第m个用户,m=1,2,…,M;定义用户u∈U的情感倾向s∈S,主题t∈T,两者组合为情感倾向主题z=(s,t);
设情感倾向主题集合Z={z1,z2,z3,…,zN},N为情感倾向主题数量,zn表示第n个情感倾向主题,n=1,2,…,N;
用户u在情感倾向主题为z下的博文信息列表Lz(u)={W1,W2,W3,…,WR},R表示用户u在情感倾向主题为z的博文数量,Wr表示列表中的第r条博文相关信息,包括对应的博文内容、点赞、评论、转发,r=1,2,…,R。
步骤B.根据行为用户属性和行为特征计算影响力,建立用户-情感倾向主题影响力矩阵;具体实现流程如图2所示:
B1.根据用户u在情感倾向主题z下的博文信息列表Lz(u),统计其中三种行为用户列表,分别为点赞用户列表LLz(u)、转发用户列表FLz(u)和评论用户列表CLz(u);
B2.根据三种行为用户列表中行为用户的粉丝数量、关注数量、原创博文数量和用户等级,计算出行为用户的属性强度;
行为用户v的属性强度v∈U;其中n1(v),n2(v),n3(v)分别表示行为用户v的粉丝数量、关注数量和原创微博数量,l(v)表示行为用户v的等级,γ为对应的权重,/>γ1表示粉丝数量权重、γ2表示关注数量权重、γ3表示原创微博数量权重、γ4表示行为用户等级权重,其中粉丝数量的重最大,关注数量权重最小;
B3.根据行为用户的属性强度,计算用户u在情感倾向主题z下的影响力fz(u):其中,w1,w2,w3分别表示点赞用户、转发用户、评论用户对用户u的影响权重,/>其中转发用户和评论用户的影响权重大于点赞用户的影响权重;
即用户u在情感倾向主题z下的影响力与其他用户的属性和行为有关;
B4.定义用户u的已观察到的情感倾向主题列表UserST(u),将主题z添加到UserST(u)中,并定义已观察到的情感倾向主题z所对应的用户列表StUser(z),将用户u添加到列表StUser(z)中;建立用户和情感倾向主题之间映射关系;
B5.根据用户在情感倾向主题下的影响力,建立M×N的用户-情感倾向主题影响力矩阵FMN;影响力矩阵FMN的行向量列向量/> 表示第m个用户在第n个情感倾向主题下的影响力。
步骤C.根据用户影响力矩阵FMN和全部用户集合U,获取情感倾向主题z的相似情感倾向主题列表SimST(z)、用户u的邻居相似用户列表SimNB(u)、用户u的相似用户列表SimU(u)。
获取情感倾向主题z的相似情感倾向主题列表SimST(z)的具体方法如图3:
C11.计算情感倾向主题z中所对应的主题t的词向量tV;具体的:根据词向量计算工具word2vec,计算主题词t的词向量tV=[tv1,tv2,tv3,…tvP],J为词向量的维数,tvj表示第j维分量;j=1,2,…,J;
C12.遍历主题集合,对所遍历的主题计算词向量/>其中/>未被标记;具体的:根据词向量计算工具word2vec,计算主题词/>的词向量/>J为词向量的维数,/>表示第j维分量;j=1,2,…,J;
C13.计算主题的词向量与主题t的词向量的相似度,并标记主题/>具体的:词向量之间的相似度计算方法利用欧式距离定义为:/>
C14.根据给定阈值,判断两个词向量是否相似:如果不相似,则返回C12,遍历下一个主题;如果相似,进入C15;
C15.根据情感倾向主题z所对应的情感倾向s,与所遍历的主题组合成相似情感倾向主题/>并添加至相似情感倾向主题列表SimST(z),并将z添加至相似情感倾向主题列表/>返回C12,遍历下一个主题,直到全部被标记。
获取用户u的邻居相似用户列表SimNB(u)的具体方法如图4:
C21.获取用户u的所有邻居节点,包括关注用户,粉丝用户;具体的:定义用户u的邻居节点为Ne(u);
C22.遍历用户集合U,对所遍历的用户其中/>没有被标记,获取用户/>的所有邻居节点,定义用户/>的邻居节点为/>
C23.计算用户u和用户的邻居相似度,并标记/>具体的,定义两个用户之间的邻居相似度为/> 表示两者的邻居重叠数量,|Ne(u)|表示u的邻居数量;
C24.根据给定阈值,判断两个用户的邻居是否相似:如果不相似,返回C22,遍历下一个用户;如果相似,将用户添加至相似邻居用户列表SimNB(u),并将用户u添加至相似邻居用户列表/>返回C22,遍历下一个用户,直到全部被遍历。
获取用户u的相似用户列表SimU(u)的具体方法如图5:
C31.根据影响力矩阵FMN,获取用户u在矩阵中对应行的情感倾向主题影响力向量uf;
C32.遍历用户集合,对所遍历的用户其中/>没有被标记,获取用户/>在矩阵中对应行的情感倾向主题影响力向量/>
C33.计算用户和用户u的情感倾向主题影响力向量之间的相似度,并标记/>具体的,用户的影响力向量之间的相似度用欧式距离定义:/>
C34.根据给定阈值,判断两个用户的情感倾向主题影响力向量是否相似:如果不相似,返回C32,遍历下一个用户;如果相似,将用户添加至相似用户列表SimU(u),并将用户u添加至相似用户列表SimU(u),返回C32,遍历下一个用户,直到全部被标记。
步骤D.建立预测模型,对用户在未观察到的情感倾向主题进行影响力预测。根据用户-情感倾向主题影响力矩阵和相似信息,综合建立影响力预测模型,定义用户u在未观察到的情感倾向主题为z的影响力为其预测模型为:/>
是基于用户-情感倾向主题影响力矩阵FMN分解的结果,pu表示用户相关向量,qz表示情感倾向主题相关向量,pu和qz的维度与情感倾向主题数量N一致,T表示转置;
Auz表示情感倾向主题z的相似情感倾向主题列表SimST(z)对用户u的影响力计算的作用强度,其中,/>表示用户u在相似情感倾向主题/>下的影响力/>对结果的作用权重,SimST(z)∩UserST(u)表示在用户u的已观察到的情感倾向主题列表中,与情感倾向主题z相似的情感倾向主题集合;
Buz表示用户u的邻居相似用户列表SimNB(u)对用户u的影响力计算的作用强度, 其中,/>表示邻居相似用户/>在情感倾向主题z下的影响力对结果的作用权重,SimNB(u)∩StUser(z)表示用户u的邻居相似用户集合的子集,该子集用户的历史博文信息中包含情感倾向主题z;
Cuz表示用户u的相似用户列表SimU(u)对用户u的影响力计算的作用强度, 其中,/>表示相似用户/>在情感倾向主题z下的影响力/>对结果的作用权重,SimU(u)∩StUser(z)表示用户u的相似用户集合的子集,该子集用户的历史博文信息中包含情感倾向主题z。
利用预测模型对用户在未观察到的情感倾向主题进行影响力预测。
该方法融合情感倾向主题的用户影响力预测方法,是通过行为用户的属性和行为特征,计算用户在融合情感倾向主题上的影响力,在主题上更加细化,从而能更准确的反应用户的影响力程度;建立用户影响力矩阵,利用矩阵分解方法,并提出一种更全面的相似信息计算方法,通过获取相似情感倾向主题、邻居相似用户和相似用户弥补矩阵中的数值稀疏问题,更准确的对用户在未观察到的主题上的影响力进行预测。综上,该方法能更全面的度量并预测用户在不同主题上的影响力,同时将情感倾向融入其中,更能准确反映一个用户对其他用户的影响程度。
Claims (4)
1.基于融合情感倾向主题的社交网络用户影响力预测方法,其特征在于,该方法具体是:
步骤A.提取用户u在博文的情感倾向,建立对应用户在情感倾向主题z下的博文信息列表Lz(u);具体方法是:
根据博文内容,用情感分析工具将其情感倾向识别为正向或负向,并用LDA方法提取主题信息,将情感倾向和主题信息组合成情感倾向主题,并将博文信息按照情感倾向主题,建立对应的列表;所述的博文信息包括博文内容、点赞、转发、评论;
设用户集合U={u1,u2,u3,…,uM},情感倾向集合为S,主题集合为T;M为用户数量,um表示第m个用户,m=1,2,…,M;定义用户u∈U的情感倾向s∈S,主题t∈T,两者组合为情感倾向主题z=(s,t);
设情感倾向主题集合Z={z1,z2,z3,…,zN},N为情感倾向主题数量,zn表示第n个情感倾向主题,n=1,2,…,N;
用户u在情感倾向主题为z下的博文信息列表Lz(u)={W1,W2,W3,…,WR},R表示用户u在情感倾向主题为z的博文数量,Wr表示列表中的第r条博文相关信息,包括对应的博文内容、点赞、评论、转发,r=1,2,…,R;
步骤B.根据行为用户属性和行为特征计算影响力,建立用户-情感倾向主题影响力矩阵;具体方法是:
B1.根据用户u在情感倾向主题z下的博文信息列表Lz(u),统计其中三种行为用户列表,分别为点赞用户列表LLz(u)、转发用户列表FLz(u)和评论用户列表CLz(u);
B2.根据三种行为用户列表中行为用户的粉丝数量、关注数量、原创博文数量和用户等级,计算出行为用户的属性强度;
行为用户v的属性强度v∈U;其中n1(v),n2(v),n3(v)分别表示行为用户v的粉丝数量、关注数量和原创微博数量,l(v)表示行为用户v的等级,γ为对应的权重,/>γ1表示粉丝数量权重、γ2表示关注数量权重、γ3表示原创微博数量权重、γ4表示行为用户等级权重,其中粉丝数量的重最大,关注数量权重最小;
B3.根据行为用户的属性强度,计算用户u在情感倾向主题z下的影响力fz(u):其中,w1,w2,w3分别表示点赞用户、转发用户、评论用户对用户u的影响权重,/>其中转发用户和评论用户的影响权重大于点赞用户的影响权重;
B4.定义用户u的已观察到的情感倾向主题列表UserST(u),将主题z添加到UserST(u)中,并定义已观察到的情感倾向主题z所对应的用户列表StUser(z),将用户u添加到列表StUser(z)中;建立用户和情感倾向主题之间映射关系;
B5.根据用户在情感倾向主题下的影响力,建立M×N的用户-情感倾向主题影响力矩阵FMN;影响力矩阵FMN的行向量列向量 表示第m个用户在第n个情感倾向主题下的影响力;
步骤C.获取情感倾向主题z的相似情感倾向主题列表SimST(z)、用户u的邻居相似用户列表SimNB(u)、用户u的相似用户列表SimU(u);
步骤D.建立预测模型,对用户在未观察到的情感倾向主题进行影响力预测;具体方法是:
定义用户u在未观察到的情感倾向主题为z的影响力为其预测模型为:
是基于用户-情感倾向主题影响力矩阵FMN分解的结果,pu表示用户相关向量,qz表示情感倾向主题相关向量,pu和qz的维度与情感倾向主题数量N一致,T表示转置;
Auz表示情感倾向主题z的相似情感倾向主题列表SimST(z)对用户u的影响力计算的作用强度,其中,/>表示用户u在相似情感倾向主题/>下的影响力/>对结果的作用权重,SimST(z)∩UserST(u)表示在用户u的已观察到的情感倾向主题列表中,与情感倾向主题z相似的情感倾向主题集合;
Buz表示用户u的邻居相似用户列表SimNB(u)对用户u的影响力计算的作用强度,其中,/>表示邻居相似用户/>在情感倾向主题z下的影响力/>对结果的作用权重,SimNB(u)∩StUser(z)表示用户u的邻居相似用户集合的子集,该子集用户的历史博文信息中包含情感倾向主题z;
Cuz表示用户u的相似用户列表SimU(u)对用户u的影响力计算的作用强度,其中,/>表示相似用户/>在情感倾向主题z下的影响力/>对结果的作用权重,SimU(u)∩StUser(z)表示用户u的相似用户集合的子集,该子集用户的历史博文信息中包含情感倾向主题z。
2.如权利要求1所述的基于融合情感倾向主题的社交网络用户影响力预测方法,其特征在于,步骤C中获取情感倾向主题z的相似情感倾向主题列表SimST(z)具体方法是:
C11.计算情感倾向主题z中所对应的主题t的词向量;
C12.遍历主题集合,对所遍历的主题计算词向量,其中/>未被标记;
C13.计算主题的词向量与主题t的词向量的相似度,并标记主题/>
C14.根据给定阈值,判断两个词向量是否相似:如果不相似,则返回C12,遍历下一个主题;如果相似,进入C15;
C15.根据情感倾向主题z所对应的情感倾向s,与所遍历的主题组合成相似情感倾向主题/>并添加至相似情感倾向主题列表SimST(z),并将z添加至相似情感倾向主题列表返回C12,遍历下一个主题,直到全部被标记。
3.如权利要求1所述的基于融合情感倾向主题的社交网络用户影响力预测方法,其特征在于,步骤C中获取用户u的邻居相似用户列表SimNB(u)的具体方法是:
C21.获取用户u的所有邻居节点,包括关注用户,粉丝用户;
C22.遍历用户集合U,对所遍历的用户其中/>没有被标记,获取用户/>的所有邻居节点;
C23.计算用户u和用户的邻居相似度,并标记/>
C24.根据给定阈值,判断两个用户的邻居是否相似:如果不相似,返回C22,遍历下一个用户;如果相似,将用户添加至相似邻居用户列表SimNB(u),并将用户u添加至相似邻居用户列表/>返回C22,遍历下一个用户,直到全部被遍历。
4.如权利要求1所述的基于融合情感倾向主题的社交网络用户影响力预测方法,其特征在于,步骤C中获取用户u的相似用户列表SimU(u)的具体方法是:
C31.根据影响力矩阵FMN,获取用户u的情感倾向主题影响力向量;
C32.遍历用户集合,对所遍历的用户其中/>没有被标记,获取用户/>的情感倾向主题影响力向量;
C33.计算用户和用户u的情感倾向主题影响力向量之间的相似度,并标记/>
C34.根据给定阈值,判断两个用户的情感倾向主题影响力向量是否相似:如果不相似,返回C32,遍历下一个用户;如果相似,将用户添加至相似用户列表SimU(u),并将用户u添加至相似用户列表SimU(u),返回C32,遍历下一个用户,直到全部被标记。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010895010.1A CN112052995B (zh) | 2020-08-31 | 2020-08-31 | 基于融合情感倾向主题的社交网络用户影响力预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010895010.1A CN112052995B (zh) | 2020-08-31 | 2020-08-31 | 基于融合情感倾向主题的社交网络用户影响力预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112052995A CN112052995A (zh) | 2020-12-08 |
CN112052995B true CN112052995B (zh) | 2023-08-01 |
Family
ID=73607131
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010895010.1A Active CN112052995B (zh) | 2020-08-31 | 2020-08-31 | 基于融合情感倾向主题的社交网络用户影响力预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112052995B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113157858A (zh) * | 2021-03-25 | 2021-07-23 | 上海柏观数据科技有限公司 | 一种基于情感词匹配与频度结合的情感程度检测方法 |
CN113923226B (zh) * | 2021-10-15 | 2024-03-01 | 北京智融云河科技有限公司 | 区块链下的邻居节点管理方法、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101770487A (zh) * | 2008-12-26 | 2010-07-07 | 聚友空间网络技术有限公司 | 社交网络中用户影响力的计算方法和系统 |
CN104123352A (zh) * | 2014-07-10 | 2014-10-29 | 西安理工大学 | 面向微博的话题层次用户影响力度量方法 |
CN109684646A (zh) * | 2019-01-15 | 2019-04-26 | 江苏大学 | 一种基于话题影响力的微博话题情感分析方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106780073B (zh) * | 2017-01-11 | 2021-05-25 | 中南大学 | 一种考虑用户行为和情感的社会网络影响力最大化初始节点选取方法 |
CN108038240A (zh) * | 2017-12-26 | 2018-05-15 | 武汉大学 | 基于内容、用户多因素分析的社交网络谣言检测方法 |
CN108549632B (zh) * | 2018-04-03 | 2022-02-11 | 重庆邮电大学 | 一种基于情感分析的社交网络影响力传播模型构建方法 |
-
2020
- 2020-08-31 CN CN202010895010.1A patent/CN112052995B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101770487A (zh) * | 2008-12-26 | 2010-07-07 | 聚友空间网络技术有限公司 | 社交网络中用户影响力的计算方法和系统 |
CN104123352A (zh) * | 2014-07-10 | 2014-10-29 | 西安理工大学 | 面向微博的话题层次用户影响力度量方法 |
CN109684646A (zh) * | 2019-01-15 | 2019-04-26 | 江苏大学 | 一种基于话题影响力的微博话题情感分析方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112052995A (zh) | 2020-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bamakan et al. | Opinion leader detection: A methodological review | |
Srivastava et al. | Words are important: A textual content based identity resolution scheme across multiple online social networks | |
Dhelim et al. | Mining user interest based on personality-aware hybrid filtering in social networks | |
Logesh et al. | Learning recency and inferring associations in location based social network for emotion induced point-of-interest recommendation. | |
Al-Yazidi et al. | Measuring reputation and influence in online social networks: a systematic literature review | |
CN112052995B (zh) | 基于融合情感倾向主题的社交网络用户影响力预测方法 | |
Manoharan et al. | An Intelligent Fuzzy Rule‐Based Personalized News Recommendation Using Social Media Mining | |
Ahmed et al. | Prediction of customer’s perception in social networks by integrating sentiment analysis and machine learning | |
AlMansour et al. | A model for recalibrating credibility in different contexts and languages-a twitter case study | |
Zhang et al. | Improvement of collaborative filtering recommendation algorithm based on intuitionistic fuzzy reasoning under missing data | |
Khan et al. | Comparative analysis on Facebook post interaction using DNN, ELM and LSTM | |
Safari et al. | User behavior mining on social media: a systematic literature review | |
Peacock et al. | Effectiveness of social media sentiment analysis tools with the support of emoticon/emoji | |
Saraswathi et al. | Deep Learning Enabled Social Media Recommendation Based on User Comments. | |
Wu et al. | Detecting Crowdturfing in Social Media. | |
CN110633410A (zh) | 信息处理方法及装置、存储介质、电子装置 | |
Li et al. | Modeling and analysis of group user portrait through WeChat mini program | |
Berlanga et al. | Quality indicators for social business intelligence | |
CN118071400A (zh) | 基于图计算技术在信息消费领域的应用方法及系统 | |
İş et al. | A Profile Analysis of User Interaction in Social Media Using Deep Learning. | |
Tharwat et al. | The role of trust to enhance the recommendation system based on social network | |
Hasan et al. | Measuring user influence in real-time on twitter using behavioural features | |
Iqbal et al. | Association rule analysis-based identification of influential users in the social media | |
CN112487303A (zh) | 一种基于社交网络用户属性的主题推荐方法 | |
Cheng et al. | Dynamical Modeling, Analysis, and Control of Information Diffusion over Social Networks: A Deep Learning‐Based Recommendation Algorithm in Social Network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information | ||
CB03 | Change of inventor or designer information |
Inventor after: Wang Ran Inventor after: Liang Ying Inventor after: Xu Xianghua Inventor after: Li Ping Inventor before: Liang Ying Inventor before: Wang Ran Inventor before: Xu Xianghua Inventor before: Li Ping |
|
GR01 | Patent grant | ||
GR01 | Patent grant |