CN111143704A - 一种融合用户影响关系的在线社区好友推荐方法及系统 - Google Patents
一种融合用户影响关系的在线社区好友推荐方法及系统 Download PDFInfo
- Publication number
- CN111143704A CN111143704A CN201911322563.1A CN201911322563A CN111143704A CN 111143704 A CN111143704 A CN 111143704A CN 201911322563 A CN201911322563 A CN 201911322563A CN 111143704 A CN111143704 A CN 111143704A
- Authority
- CN
- China
- Prior art keywords
- user
- network
- influence
- users
- friend
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 88
- 230000008569 process Effects 0.000 claims abstract description 19
- 239000011159 matrix material Substances 0.000 claims description 74
- 238000000354 decomposition reaction Methods 0.000 claims description 30
- 239000013598 vector Substances 0.000 claims description 20
- 238000010276 construction Methods 0.000 claims description 15
- 230000003993 interaction Effects 0.000 claims description 14
- 230000000694 effects Effects 0.000 abstract description 8
- 230000006399 behavior Effects 0.000 description 75
- 230000006870 function Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000003542 behavioural effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 230000003997 social interaction Effects 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Databases & Information Systems (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Pure & Applied Mathematics (AREA)
- Educational Administration (AREA)
- Mathematical Optimization (AREA)
- Development Economics (AREA)
- Mathematical Analysis (AREA)
- Marketing (AREA)
- Computational Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Software Systems (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Algebra (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种融合用户影响关系的在线社区好友推荐方法及装置,该方法的具体过程为:步骤1.构建隐性用户行为网络,所述用户行为网络包括无向加权用户行为网络和有向加权用户行为网络;基于有向加权用户行为网络计算在线社区中基于兴趣的用户影响关系;步骤2.基于所述无向加权用户行为网络,获取具有相似兴趣的用户社团;步骤3.基于目标用户所在的社团,构建用户好友关系网络;基于所述用户影响关系构建用户影响关系网络;步骤4.结合用户好友关系网络和用户影响关系网络进行好友推荐。本发明具有更好的好友推荐效果。
Description
技术领域
本发明属于互联网信息推荐技术领域,具体涉及一种融合用户影响关系的在线社区好友推荐方法及系统。
背景技术
互联网和信息技术的不断发展使信息的产生和传播方式发生了翻天覆地的变化,人们也逐渐将网络作为沟通交流的重要渠道。在线社区是网络中出现的社会聚集,社区成员因为共同的兴趣在社区中进行交流讨论。随着在线社区的日益流行,用户往往难以快速有效地发现自己真正感兴趣的用户,造成了严重的信息过载问题。发现社区成员感兴趣的好友不仅能够帮助用户建立有效的社交关系进而促进用户间的沟通交流,也有助于保持和促进在线社区的持续繁荣。
现有方法往往通过分析好友关系网络、用户资料或用户生成内容进行好友推荐,这几种方法往往忽略用户社会化关系对好友推荐的协同作用,不适用于在线社区场景。现有基于好友关系网络的方法往往只考虑用户间的显性社交关系网络,如好友关系或关注关系等,而忽略了在线社区用户之间的潜在社会关系,如话题的共同参与等。基于用户资料的在线社区好友推荐方法大多根据用户的个人属性信息等进行推荐,但是这类方法往往面临用户资料不完整和推荐不准确等问题。基于用户生成内容的方法往往从文本的角度探索用户之间的相似关系,进而完成好友推荐,但这类方法大多忽略了用户之间的其他社会化信息,如用户之间的交互关系和相似属性等。
好友推荐是为目标用户推荐其可能感兴趣的其他用户的过程,被推荐的其他用户称为项目。根据已有的好友关系网络,可以构建用户之间的评分矩阵。协同过滤是推荐系统中最为流行的方法之一,基于模型的协同过滤方法使用数据挖掘和机器学习技术从训练数据中的用户评分数据学习用户行为模式,进而预测出用户对项目的评分。矩阵分解方法是一种高效的基于模型的协同推荐方法,该方法通过对评分矩阵进行低秩近似实现评分预测。矩阵分解的核心思想认为用户的兴趣及被推荐项目的固有属性往往只受少数几个因素的影响。具体地,该方法将用户对项目的评分R分解为l×n维度的用户潜在特征矩阵U和l×m维度的项目潜在特征矩阵V,其中l为潜在特征维度,n为用户数量,m为项目数量。潜在特征矩阵U为用户的兴趣特征矩阵,表示各个用户在潜在特征上的兴趣程度。潜在特征矩阵V为项目的固有特征矩阵,表示各个被推荐项目在潜在特征上的固有属性。在线社区中既有的好友关系较少,对应的好友关系矩阵R=(Rij)n×n往往较为稀疏,其中存在大量的缺失项。基于矩阵分解得到的两个特征矩阵可以对矩阵R=(Rij)n×n中的缺失项进行评分预测得到
矩阵分解假设用户和项目的潜在特征向量及观察到的评分数据条件概率服从高斯先验分布,根据损失函数可得到最有可能的潜在特征矩阵。矩阵分解方法的概率图模型如图1所示。现有的矩阵分解方法认为用户与用户之间以及项目与项目之间都是相互独立的,忽略了用户之间以及项目之间可能存在的关联关系。在线社区中蕴含着广泛的社会化信息。一方面,用户的生成内容和个人属性信息能够较为客观地反映该用户的兴趣,这些信息可用于判断不同用户是否具有相似性或者是否可能成为好友。另一方面,不同用户之间往往存在潜在的社会关联关系,如用户的发帖和回帖关系,这些关系也能够在一定程度上体现不同用户的相似性。而现有的矩阵分解方法不考虑用户的这些社会化信息,因此难以有效地为用户推荐潜在好友。
在线社区中存在用户生成内容、用户属性和用户发回帖等纷繁复杂的社会化信息,其形式包括文本、属性信息及交互记录等。如何有效提取并集成这些社会化信息,从而能够准确度量用户间潜在的社会化关系值得探索。另外,如何对现有的矩阵分解方法进行改进,并将在线社区用户之间潜在的社会化关系融入到矩阵分解的过程中有待研究。
发明内容
为了帮助在线社区用户更有效地发现感兴趣的好友,本发明提出一种融合用户影响关系的在线社区好友推荐方法及系统。
实现本发明的技术方案如下:
一种融合用户影响关系的在线社区好友推荐方法,具体过程为:
步骤1.构建隐性用户行为网络,所述用户行为网络包括无向加权用户行为网络和有向加权用户行为网络;基于有向加权用户行为网络计算在线社区中基于兴趣的用户影响关系;
步骤2.基于所述无向加权用户行为网络,获取具有相似兴趣的用户社团;
步骤3.基于目标用户所在的社团,构建用户好友关系网络;基于所述用户影响关系构建用户影响关系网络;
步骤4.结合用户好友关系网络和用户影响关系网络进行好友推荐。
进一步地,本发明所述步骤1的基于兴趣的影响关系为:对于任意两个用户vi和vj,定义用户vi对用户vj基于兴趣的影响程度为Sij,
Sij=WSij·USij (3)
其中,WSij表示用户vi对用户vj的用户交互程度,USij表示用户vi与用户vj间的相似程度。
进一步地,本发明所述用户的相似程度由行为模式相似程度、属性相似程度和生成内容主题相似程度确定。
进一步地,本发明所述用户行为网络以用户为节点,当用户之间存在共同兴趣时,对应的网络用户存在连边,连边表示用户之间的隐性社会关系,连边权重表示对应用户之间隐性社会关系的强弱。
进一步地,本发明所述无向加权用户行为网络中权重为:
其中,fi和fj分别表示用户vi和用户vj的权重,即用户vi和用户vj参与话题数量,wij表示初始用户行为网络中边的权重;
所述初始用户行为网络中边的权重wij为:
其中,threads(vi)和threads(vj)分别表示用户vi和用户vj参与过的话题集合,NUp表示话题p的参与人数。
进一步地,本发明所述有向加权用户行为网络中权重为:
其中,fi表示边的出发用户vi的权重,即用户vi参与话题数量,wij表示初始用户行为网络中边的权重;
所述初始用户行为网络中边的权重wij为:
其中,threads(vi)和threads(vj)分别表示用户vi和用户vj参与过的话题集合,NUp表示话题p的参与人数。
进一步地,本发明将用户好友关系矩阵R=(Rij)n×n分解为两个矩阵乘积的形式:
R≈UTV. (23)
其中,U和V对应用户的两个潜在特征矩阵,矩阵U和矩阵V中的每一列Ui和Vj分别代表用户vi与用户vj的潜在特征向量,则用户vi与用户vj建立好友关系的概率可以表示为:
用户好友关系矩阵R=(Rij)n×n和用户影响关系矩阵S=(Sij)n×n中的用户数量均为n,
则矩阵U中用户vi的特征向量可表示为:
其中,Ni表示用户影响关系网络中连接到用户vi的用户集合,Ski表示用户vk对用户vi基于兴趣的影响程度,Uk表示用户vk在各个潜在特征上的兴趣程度;
则矩阵V中用户vj的特征向量可表示为:
其中,Nj表示用户影响关系网络中连接到用户vj的用户集合,Skj表示用户vk对用户vj基于兴趣的影响程度,Vk表示用户vk在各个潜在特征上的固有属性。
一种融合用户影响关系的在线社区好友推荐装置,包括行为网络构建模块、社团获取模块、好友/影响关系网络构建模块及好友推荐模块;
行为网络构建模块,用于构建隐性用户行为网络,所述用户行为网络包括无向加权用户行为网络和有向加权用户行为网络;基于有向加权用户行为网络计算在线社区中基于兴趣的用户影响关系;
社团获取模块,基于所述无向加权用户行为网络,获取具有相似兴趣的用户社团;
好友/影响关系网络构建模块,基于目标用户所在的社团,构建用户好友关系网络;基于所述用户影响关系构建用户影响关系网络;
好友推荐模块,结合用户好友关系网络和用户影响关系网络进行好友推荐。
有益效果
现有推荐方法往往基于单一信息实现好友推荐,忽略了在线社区中蕴含的用户兴趣偏好及相互影响关系。本发明根据在线社区中的丰富社会化信息构建了基于兴趣的相互影响关系,将用户间的相互影响关系作为社会化信息引入到好友推荐系统中。在矩阵分解的过程中有效地融合了用户间的社会化信息,从而得到更好的好友推荐效果。
附图说明
图1为传统矩阵分解的概率图模型;
图2为在线社区好友推荐示意图;
图3为好友关系推荐方法流程图;
图4初始用户行为网络构建过程的示意图;
图5无向加权用户行为网络的构建过程示意图;
图6有向加权用户行为网络的构建过程示意图;
图7融合用户影响关系的矩阵分解概率图模型。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述。
如图2所示,在线社区中的用户影响关系反映用户之间基于兴趣的相互影响程度。根据用户之间的话题参与行为、用户生成内容和个体属性特征,可以计算用户之间的相互影响关系。本发明在已知现有用户好友关系网络和用户影响关系网络的情况下,预测在线社区中未连接的两个用户之间形成好友关系的概率,从而实现在线社区中的好友推荐。
如图3所示,本发明的过程为:首先基于数据集中的用户话题参与信息,构建无向加权用户行为网络用于发现用户社团,并以用户社团为单位,获取好友推荐所需的训练集和测试集。然后从训练集中获取所需数据分别构建用户影响关系网络和用户好友关系网络进行矩阵分解,获取用户间形成好友关系的可能性评分,实现好友推荐。
本发明一种融合用户影响关系的在线社区好友推荐方法,主要包括以下步骤:
步骤1.构建隐性用户行为网络,并计算在线社区中基于兴趣的用户影响关系,所述用户行为网络包括无向加权用户行为网络和有向加权用户行为网络;
用户影响关系反映个体间基于兴趣的相互影响程度,具有较大社会影响力,且与目标个体存在更相似的主题、行为模式和属性特征的用户往往对其他个体拥有更强的影响程度。本发明从用户间的用户交互程度和用户间的相似程度两个方面考虑对在线社区中的用户影响关系进行建模。其中,用户间的相似程度包括用户行为模式相似程度、用户属性相似程度和用户生成内容主题相似程度。
定义1基于兴趣的用户影响关系:对于任意两个用户vi和vj,定义用户vi对用户vj基于兴趣的影响程度Sij为:
Sij=WSij·USij (3)
其中,WSij表示用户vi对用户vj的用户交互程度,USij表示用户vi与用户vj间的相似程度。用户之间基于兴趣的相互影响程度构成了用户之间的影响关系。
定义2用户相似程度:对于任意两个用户vi和vj,用户间的相似程度USij可表示为:
USij=β1·SRij+β2·PSij+β3·CSij. (4)
其中,SRij、PSij和CSij分别表示用户vi与用户vj间的行为模式相似程度、属性相似程度和生成内容主题相似程度,β1、β2、β3分别表示行为模式相似程度、属性相似程度和用户生成内容主题相似程度的权重系数。即用户间的相似程度定义为用户行为模式相似程度、用户属性相似程度和用户生成内容主题相似程度的加权平均。
首先根据在线社区中的用户行为构建隐性用户行为网络,描述用户参与活动形成的连接关系,包括无向加权用户行为网络和有向加权用户行为网络。网络以用户为节点,当用户之间存在共同兴趣时,对应的网络用户存在连边。连边表示用户之间的隐性社会关系,连边权重表示对应用户之间隐性社会关系的强弱。
定义话题的流行程度为参与该话题的人数,记为NU。将参与人数的倒数1NU作为该话题对两个共同参与用户之间权重的贡献,初始用户行为网络B中两个用户之间的权重为所有话题对这两个用户权重贡献的总和:
其中,wij是用户vi与用户vj之间边的权重,threads(vi)和threads(vj)分别表示用户vi和用户vj参与过的话题集合,NUp表示话题p的参与人数。将每个用户参与过的话题数量作为网络中用户的权重,表示健康社区中用户话题参与的活跃程度,记用户vi的参与话题数量为fi。以表1数据为例构建的初始用户行为网络如图4所示。
表1用户话题参与行为数据示例
初始用户行为网络在一定程度上反映了用户间的共同行为,但忽略了用户本身的活跃程度对网络连边权重的影响。本发明基于初始用户行为网络B,分两个步骤构建无向加权用户行为网络Bn。首先将初始用户行为网络中边的权重进行初始标准化:
其中,fi和fj分别表示用户vi和用户vj的权重,wij表示初始用户行为网络中边的权重。然后将网络中的最大权重作为标准进行标准化:
其中,wij'为网络中用户点vi与用户vj之间的连边权重。基于表1数据构建的无向加权用户行为网络Bn如图5所示。
首先基于初始用户行为网络B,将网络B中连接两个用户的无向边变为两个权重相同的有向边。然后考虑网络中的用户权重信息,将边的权重初始标准化为:
其中,fi表示边的出发用户vi的权重。初始标准化后的结果如图4所示。最后,对网络中边的权重进一步标准化:
在隐性用户行为网络构建的基础上,结合在线社区中的其他社会化信息构建用户影响关系。
(1)用户交互程度
基于有向加权用户行为网络使用社会交互强度衡量网络中的用户交互程度(详见Rice R E,Grant A E,Schmitz J,Torobin J.Individual and network influenceson the adoption and perceived outcomes of electronic messaging[J].SocialNetworks,1990,12(1):27-55.)。由于网络中用户间的交互程度会随着用户间距离的增大而减弱,使用dijkstra算法计算用户vi和vj在网络中的最短路径(详见Dijkstra E W.Anote on two problems in connection with graphs[J].Numerische Mathematik,1959,1(1):269-271.):
设用户vi和vj在网络中的最短路径pathij={v1,v2,...,vd},如果网络中有多条最短路径,选择具有最大权重的最短路径。则用户vi对用户vj的初始用户交互程度WSij'为:
WSij'=w(vi,v1)”×w(v1,v2)”×…×w(vd,vj)”, (11)
其中,w(vi,vj)”表示有向加权用户行为网络中用户vi与用户vj间的连边权重,{v1,v2,...,vd}表示用户vi到用户vj的最短路径。将用户vi到用户的用户交互程度定义为用户vi到用户vj的初始用户交互程度WSij'占网络中所有用户到用户vj的初始用户交互程度总和的比例:
(2)行为模式相似程度
基于有向加权用户行为网络使用SimRank算法计算网络中任意两个用户间在结构上的相似程度(详见Jeh G,Widom J.SimRank:a measure of structural-contextsimilarity[C].Proceedings of the Eighth ACM Sigkdd International Conferenceon Knowledge Discovery and Data Mining.ACM,2002:538-543.)。SimRank的基本思想是如果网络中的两个用户相似,那么与这两个用户相连的用户也相似。对于有向网络中的任意两个用户u和v,通过以下方式计算用户间的相似程度:
其中,c是0到1之间的常数,和分别表示有向加权用户行为网络中从某一用户到用户u和用户v的连边权重,I(u)和I(v)分别表示连接到用户u和用户v的用户集合,且当或时s(u,v)=0。通过递归可计算任意两个用户间的SimRank值。记SRij为网络中用户vi与用户vj间的行为模式相似程度,有SRij=SRji。
(3)用户属性相似程度
使用用户属性信息计算用户vi和用户vj的用户属性相似程度PSij。对于无序属性,可通过匹配系数计算属性相似性:
其中,zik表示用户vi的第k个属性;对于有序属性或数值属性,属性相似度可表示为:
其中,diff=|zik-zjk|,maxdk和mindk分别表示第k个属性中所有差值的最大值和最小值。将用户vi与用户vj的属性相似性PSij表示为用户所有属性相似性的平均值:
其中,|Z|表示用户属性的数量,且PSij=PSji。
(4)用户生成内容主题相似程度
使用潜在狄利克雷分布对用户生成内容进行特征分析,获取各文档的主题分布及其相似程度(详见Blei D M,Ng A Y,Jordan M I.Latent dirichlet allocation[J].Journal of Machine Learning Research,2003,3(1):993-1022.)。获取到的用户兴趣特征文档主题分布可以表示为Ti={ti,1,ti,2,...,ti,K},其中K为主题数目,ti,k表示用户vi对应兴趣特征文档di在第k主题上的权重。使用标准化的余弦相似度度量任意两个用户vi与vj之间的生成内容主题相似程度为:
(5)相似度权重
对用户相似程度的三个计算指标,即用户行为模式相似程度SR、属性相似程度PS和用户生成内容相似程度CS,使用XGBoost(eXtreme Gradient Boosting)模型进行学习,判断各个指标对用户相似程度的重要性(详见Chen T,Guestrin C.XGBoost:A ScalableTree Boosting System[C].Proceedings of the 22nd ACM Sigkdd InternationalConference on Knowledge Discovery and Data Mining.ACM,2016:785-794.)。
步骤2.基于所述无向加权用户行为网络,获取具有相似兴趣的用户社团。
根据步骤1构建的无向加权用户行为网络反映了用户之间的共同兴趣关联关系。基于无向加权用户行为网络,使用模块度算法可以得到具有相似兴趣的用户社团。本发明使用模块度算法进行层次化用户社团发现。模块度算法常用于度量网络中各社区内部联系的强度,算法的优化目标是最大化整个网络的模块度:
其中,|En|表示整个网络中边的数量;A=(Aij)n×n代表网络邻接矩阵,其中Aij表示无向加权用户行为网络Bn中用户间的连接权重;δ(Ci,Cj)表示用户vi和用户vj是否在同一社区;ki和kj分别表示用户vi和用户vj的度。上述各个变量的计算方式如下所示:
为了避免用户社区过大,在社团划分过程中对得到的较大子社团进行进一步的迭代划分,直到所有的社团规模不超过一定阈值或者不可再继续划分。
步骤3.基于目标用户所在的社团,构建用户好友关系网络;基于所述用户影响关系构建用户影响关系网络。
即根据目标用户所在的社团,首先基于数据集中的现有好友关系构建用户好友关系网络,然后根据步骤1计算得到的用户影响关系构建用户影响关系网络。
步骤4.结合用户好友关系网络和用户影响关系网络进行好友推荐。
首先将用户间的好友关系邻接矩阵看作用户间的相互评分,然后在对现有矩阵分解方法进行改进的基础上,将用户影响关系融入到好友关系矩阵的分解过程中,并对模型进行求解以获取用户间的评分信息,最终实现好友关系推荐。
基于兴趣的用户影响关系能够有效获取在线社区中的用户社会化关系,衡量用户间基于兴趣的相互影响程度。因此,本发明提出融合用户影响关系的矩阵分解方法进行好友推荐。
本发明对传统矩阵分解方法进行改进,将用户间的相互影响关系融合到传统矩阵分解过程中,提出适用于在线社区的好友关系推荐方法。好友关系推荐的具体实现过程如下:
将用户好友关系对应的邻接矩阵R=(Rij)n×n看作用户项目评分矩阵进行矩阵分解。若用户vi与用户vj之间存在好友关系,则认为两个用户互相感兴趣,有Rij=Rji=1,否则Rij=Rji=0。基于用户好友关系矩阵R,使用矩阵分解方法学习用户的潜在特征向量,预测用户间形成好友关系的可能性。在此场景下,矩阵分解方法将矩阵映射为两个新的l维潜在特征空间,评分可近似表示为潜在特征空间中向量的内积。用户好友关系矩阵R=(Rij)n×n可以分解为两个矩阵乘积的形式:
R≈UTV. (23)
其中,U和V对应用户的两个潜在特征矩阵,l表示潜在特征的维度。矩阵U和矩阵V中的每一列Ui和Vj分别代表用户vi与用户vj的潜在特征向量,则用户vi与用户vj建立好友关系的概率可以表示为:
将用户影响关系网络融入到矩阵分解过程。传统矩阵分解方法认为用户之间以及项目之间都是相互独立的,只根据用户项目评分矩阵本身对缺失项进行预测。然而,用户的兴趣偏好往往容易受到其他用户的影响。基于用户影响关系网络,可以得到网络中其他用户对目标用户的影响程度。用户的偏好受到网络中其他个体的影响,即用户的潜在特征向量与该用户在网络中存在影响关系的个体相关。记用户好友关系矩阵R=(Rij)n×n和用户影响关系矩阵S=(Sij)n×n中的用户数量均为n,则矩阵U中用户vi的特征向量可表示为:
其中,Ni表示用户影响关系网络中连接到用户vi的用户集合。本发明同时将用户看作被评价对象,他们之间同样存在相互影响关系,则矩阵V中用户vj的特征向量可表示为:
即对用户影响关系网络中邻居用户的潜在特征向量进行加权,可以估计目标用户的潜在特征向量。用户影响关系网络的引入不改变现有用户好友关系R的条件分布,只对用户的潜在特征向量产生影响。用户关系网络R中任意两个用户之间的连边是基于高斯分布产生的,则基于当前用户好友关系R中每对用户连边与非连边的产生过程,观测到的好友关系矩阵R的概率分布可以记为:
同样的,被评价用户的潜在特征向量可表示为:
上面两个式子中的第一项是均值为0的高斯先验,防止过拟合。第二项表示在邻居用户潜在特征的影响下目标用户潜在特征的条件分布。经过贝叶斯推断,已知用户影响关系网络和现有用户好友关系,潜在特征向量的先验分布为:
对应的概率图模型如图7所示。
构建融合用户影响关系的损失函数并求解。对潜在特征向量的先验分布取对数后,将模型进一步转变为带有二次正则化项的误差平方和形式,得到目标函数:
其中,g'(x)为logistic函数的导数,且g'(x)=e-x/(1+e-x)2。在迭代过程中,U和V基于前一轮的潜变量不断更新,直至达到最大迭代次数或误差值小于设定的阈值。
最终根据获取到的矩阵分解形式可以预测用户之间形成好友关系的可能性,进而实现好友推荐。
本发明首先基于在线社区中的用户生成内容、发回帖行为和用户属性等社会化信息建立了用户之间的相互影响关系,能够有效挖掘在线社区用户之间潜在的社会化关系,为用户好友推荐奠定基础。其次,本发明对传统矩阵分解方法进行改进,将用户之间的好友关系推荐问题看作用户对项目的评分预测问题。以用户影响关系作为模型的先验信息估计用户的潜在特征向量,从而将用户影响关系有效地融合到好友推荐过程,最终对用户之间形成好友关系的可能性进行预测。
一种融合用户影响关系的在线社区好友推荐装置,包括行为网络构建模块、社团获取模块、好友/影响关系网络构建模块及好友推荐模块;
行为网络构建模块,用于构建隐性用户行为网络,所述用户行为网络包括无向加权用户行为网络和有向加权用户行为网络;基于有向加权用户行为网络计算在线社区中基于兴趣的用户影响关系;
社团获取模块,基于所述无向加权用户行为网络,获取具有相似兴趣的用户社团;
好友/影响关系网络构建模块,基于目标用户所在的社团,构建用户好友关系网络;基于所述用户影响关系构建用户影响关系网络;
好友推荐模块,结合用户好友关系网络和用户影响关系网络进行好友推荐。
实验评估过程如下:
为了验证本发明提出的好友推荐方法的有效性,采集糖尿病病患交流社区甜蜜家园中的数据进行实验评估。分别使用基于用户生成内容的推荐方法(CUR)、基于用户属性的推荐方法(UserProfile)基于用户行为模式的推荐方法(HealthRank)、基于用户的协同推荐方法(UserCF)和基于矩阵分解的协同推荐方法(BaseMF)作为对比方法评估好友推荐的有效性。
使用本发明提出的方法(SocialUR)及上述对比方法分别计算当前未连接的用户之间形成好友关系的可能性,使用测试集对预测结果进行评价。各个模型得到的结果以用户之间形成好友关系的概率方式呈现,使用均方根误差(Root Mean Square Error,RMSE)和平均绝对误差(Mean Absolute Error,MAE)两个指标对模型的推荐结果进行评价。RMSE和MAE用于衡量观测值与真实值之间的偏差程度,这两个指标的值越小,表明方法的推荐效果越好。它们的计算方法分别为:
实验结果如表2所示,相比选取的现有其他方法,使用SocialUR获取的实验结果在RMSE和MAE指标上均明显较小,表明SocialUR方法对用户之间好友关系的预测偏差低于其他对比方法。对比方法中推荐效果较好的依次为基于用户属性的方法、基于矩阵分解的协同推荐方法和基于用户生成内容的方法,基于用户的协同推荐方法和基于用户行为模式的推荐方法表现较差。
表2好友推荐方法实验结果评估
本发明在对现有矩阵分解方法进行改进的基础上,将基于兴趣的用户影响关系融入到好友关系矩阵的分解过程中,提出了融合用户影响关系的矩阵分解好友推荐方法。该方法综合考虑在线社区用户之间的社会化信息,并结合现有好友关系网络实现用户社交关系推荐。本发明能够帮助在线社区成员发现感兴趣的用户,从而更有效地获取社会支持。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种融合用户影响关系的在线社区好友推荐方法,其特征在于,具体过程为:
步骤1.构建隐性用户行为网络,所述用户行为网络包括无向加权用户行为网络和有向加权用户行为网络;基于有向加权用户行为网络计算在线社区中基于兴趣的用户影响关系;
步骤2.基于所述无向加权用户行为网络,获取具有相似兴趣的用户社团;
步骤3.基于目标用户所在的社团,构建用户好友关系网络;基于所述用户影响关系构建用户影响关系网络;
步骤4.结合用户好友关系网络和用户影响关系网络进行好友推荐。
2.根据权利要求1所述融合用户影响关系的在线社区好友推荐方法,其特征在于,所述步骤1的基于兴趣的影响关系为:对于任意两个用户vi和vj,定义用户vi对用户vj基于兴趣的影响程度为Sij,
Sij=WSij·USij
其中,WSij表示用户vi对用户vj的用户交互程度,USij表示用户vi与用户vj间的相似程度。
3.根据权利要求2所述融合用户影响关系的在线社区好友推荐方法,其特征在于,所述用户的相似程度由行为模式相似程度、属性相似程度和生成内容主题相似程度确定。
4.根据权利要求1所述融合用户影响关系的在线社区好友推荐方法,其特征在于,所述用户行为网络以用户为节点,当用户之间存在共同兴趣时,对应的网络用户存在连边,连边表示用户之间的隐性社会关系,连边权重表示对应用户之间隐性社会关系的强弱。
7.根据权利要求1所述融合用户影响关系的在线社区好友推荐方法,其特征在于,将用户好友关系矩阵R=(Rij)n×n分解为两个矩阵乘积的形式:
R≈UTV.
其中,U和V对应用户的两个潜在特征矩阵,矩阵U和矩阵V中的每一列Ui和Vj分别代表用户vi与用户vj的潜在特征向量,则用户vi与用户vj建立好友关系的概率可以表示为:
用户好友关系矩阵R=(Rij)n×n和用户影响关系矩阵S=(Sij)n×n中的用户数量均为n,
则矩阵U中用户vi的特征向量可表示为:
其中,Ni表示用户影响关系网络中连接到用户vi的用户集合,Ski表示用户vk对用户vi基于兴趣的影响程度,Uk表示用户vk在各个潜在特征上的兴趣程度;
则矩阵V中用户vj的特征向量可表示为:
其中,Nj表示用户影响关系网络中连接到用户vj的用户集合,Skj表示用户vk对用户vj基于兴趣的影响程度,Vk表示用户vk在各个潜在特征上的固有属性。
8.一种融合用户影响关系的在线社区好友推荐装置,其特征在于,包括行为网络构建模块、社团获取模块、好友/影响关系网络构建模块及好友推荐模块;
行为网络构建模块,用于构建隐性用户行为网络,所述用户行为网络包括无向加权用户行为网络和有向加权用户行为网络;基于有向加权用户行为网络计算在线社区中基于兴趣的用户影响关系;
社团获取模块,基于所述无向加权用户行为网络,获取具有相似兴趣的用户社团;
好友/影响关系网络构建模块,基于目标用户所在的社团,构建用户好友关系网络;基于所述用户影响关系构建用户影响关系网络;
好友推荐模块,结合用户好友关系网络和用户影响关系网络进行好友推荐。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911322563.1A CN111143704B (zh) | 2019-12-20 | 2019-12-20 | 一种融合用户影响关系的在线社区好友推荐方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911322563.1A CN111143704B (zh) | 2019-12-20 | 2019-12-20 | 一种融合用户影响关系的在线社区好友推荐方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111143704A true CN111143704A (zh) | 2020-05-12 |
CN111143704B CN111143704B (zh) | 2023-10-20 |
Family
ID=70518989
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911322563.1A Active CN111143704B (zh) | 2019-12-20 | 2019-12-20 | 一种融合用户影响关系的在线社区好友推荐方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111143704B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113343114A (zh) * | 2021-07-05 | 2021-09-03 | 云南大学 | 一种多特征融合的社交网络好友推荐方法及装置 |
CN113836444A (zh) * | 2021-09-30 | 2021-12-24 | 中国科学院深圳先进技术研究院 | 一种线性时间好友推荐方法、系统、终端以及存储介质 |
CN113901333A (zh) * | 2021-10-11 | 2022-01-07 | 东方财富信息股份有限公司 | 一种融合了图结构与文本特征的好友推荐方法 |
CN114707044A (zh) * | 2021-12-29 | 2022-07-05 | 哈尔滨理工大学 | 基于社区发现的集体社交行为的提取方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104021233A (zh) * | 2014-06-30 | 2014-09-03 | 电子科技大学 | 一种基于社区发现的社交网络好友推荐方法 |
US20140279618A1 (en) * | 2013-03-15 | 2014-09-18 | Xerox Corporation | Method and apparatus for recommending topic-cohesive and interactive implicit communities in social customer relationship management |
CN106777274A (zh) * | 2016-06-16 | 2017-05-31 | 北京理工大学 | 一种中文旅游领域知识图谱构建方法及系统 |
CN108090197A (zh) * | 2017-12-22 | 2018-05-29 | 河南科技大学 | 一种多维社交网络的社区发现方法 |
-
2019
- 2019-12-20 CN CN201911322563.1A patent/CN111143704B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140279618A1 (en) * | 2013-03-15 | 2014-09-18 | Xerox Corporation | Method and apparatus for recommending topic-cohesive and interactive implicit communities in social customer relationship management |
CN104021233A (zh) * | 2014-06-30 | 2014-09-03 | 电子科技大学 | 一种基于社区发现的社交网络好友推荐方法 |
CN106777274A (zh) * | 2016-06-16 | 2017-05-31 | 北京理工大学 | 一种中文旅游领域知识图谱构建方法及系统 |
CN108090197A (zh) * | 2017-12-22 | 2018-05-29 | 河南科技大学 | 一种多维社交网络的社区发现方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113343114A (zh) * | 2021-07-05 | 2021-09-03 | 云南大学 | 一种多特征融合的社交网络好友推荐方法及装置 |
CN113343114B (zh) * | 2021-07-05 | 2022-10-28 | 云南大学 | 一种多特征融合的社交网络好友推荐方法及装置 |
CN113836444A (zh) * | 2021-09-30 | 2021-12-24 | 中国科学院深圳先进技术研究院 | 一种线性时间好友推荐方法、系统、终端以及存储介质 |
CN113836444B (zh) * | 2021-09-30 | 2024-04-19 | 中国科学院深圳先进技术研究院 | 一种线性时间好友推荐方法、系统、终端以及存储介质 |
CN113901333A (zh) * | 2021-10-11 | 2022-01-07 | 东方财富信息股份有限公司 | 一种融合了图结构与文本特征的好友推荐方法 |
CN114707044A (zh) * | 2021-12-29 | 2022-07-05 | 哈尔滨理工大学 | 基于社区发现的集体社交行为的提取方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111143704B (zh) | 2023-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yang et al. | Friend or frenemy? Predicting signed ties in social networks | |
CN111143704B (zh) | 一种融合用户影响关系的在线社区好友推荐方法及系统 | |
Fire et al. | Computationally efficient link prediction in a variety of social networks | |
Shen et al. | Learning personal+ social latent factor model for social recommendation | |
CN108647800B (zh) | 一种基于节点嵌入的在线社交网络用户缺失属性预测方法 | |
Wachs et al. | Why do men get more attention? Exploring factors behind success in an online design community | |
CN112507246B (zh) | 一种融合全局和局部社会兴趣影响的社会推荐方法 | |
CN106708953A (zh) | 基于离散粒子群优化的局部社区检测协同过滤推荐方法 | |
Beigi et al. | Similar but different: Exploiting users’ congruity for recommendation systems | |
CN110647678A (zh) | 一种基于用户性格标签的推荐方法 | |
Hachaj et al. | Clustering of trending topics in microblogging posts: A graph-based approach | |
Pipergias Analytis et al. | The structure of social influence in recommender networks | |
Zhang et al. | Integrating ego, homophily, and structural factors to measure user influence in online community | |
Huang et al. | Information fusion oriented heterogeneous social network for friend recommendation via community detection | |
Sun et al. | Overlapping community detection based on information dynamics | |
Zheng et al. | Flickr group recommendation based on user-generated tags and social relations via topic model | |
Ebrahimi et al. | Personalized recommender system based on social relations | |
Zhu et al. | The impact of common neighbor algorithm on individual friend choices and online social networks | |
CN110543601B (zh) | 一种基于中智集的上下文感知兴趣点推荐方法及系统 | |
Zhao et al. | Exploiting homophily-based implicit social network to improve recommendation performance | |
Qader et al. | Dual-stage social friend recommendation system based on user interests | |
Stafford et al. | Social network analysis of virtual worlds | |
Daher et al. | Identifying influential users on twitter: a case study from Paris attacks | |
Yu et al. | A multi-attribute collaborative filtering recommendation algorithm based on improved group decision-making | |
Pascoal et al. | A social-evolutionary approach to compose a similarity function used on event recommendation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |