CN111143704A

CN111143704A - 一种融合用户影响关系的在线社区好友推荐方法及系统

Info

Publication number: CN111143704A
Application number: CN201911322563.1A
Authority: CN
Inventors: 颜志军; 杨杭州; 高慧颖; 贾琳; 尹秋菊; 彭飞
Original assignee: Beijing Institute of Technology BIT
Current assignee: Beijing Institute of Technology BIT
Priority date: 2019-12-20
Filing date: 2019-12-20
Publication date: 2020-05-12
Anticipated expiration: 2039-12-20
Also published as: CN111143704B

Abstract

本发明提供一种融合用户影响关系的在线社区好友推荐方法及装置，该方法的具体过程为：步骤1.构建隐性用户行为网络，所述用户行为网络包括无向加权用户行为网络和有向加权用户行为网络；基于有向加权用户行为网络计算在线社区中基于兴趣的用户影响关系；步骤2.基于所述无向加权用户行为网络，获取具有相似兴趣的用户社团；步骤3.基于目标用户所在的社团，构建用户好友关系网络；基于所述用户影响关系构建用户影响关系网络；步骤4.结合用户好友关系网络和用户影响关系网络进行好友推荐。本发明具有更好的好友推荐效果。

Description

一种融合用户影响关系的在线社区好友推荐方法及系统

技术领域

本发明属于互联网信息推荐技术领域，具体涉及一种融合用户影响关系的在线社区好友推荐方法及系统。

背景技术

互联网和信息技术的不断发展使信息的产生和传播方式发生了翻天覆地的变化，人们也逐渐将网络作为沟通交流的重要渠道。在线社区是网络中出现的社会聚集，社区成员因为共同的兴趣在社区中进行交流讨论。随着在线社区的日益流行，用户往往难以快速有效地发现自己真正感兴趣的用户，造成了严重的信息过载问题。发现社区成员感兴趣的好友不仅能够帮助用户建立有效的社交关系进而促进用户间的沟通交流，也有助于保持和促进在线社区的持续繁荣。

现有方法往往通过分析好友关系网络、用户资料或用户生成内容进行好友推荐，这几种方法往往忽略用户社会化关系对好友推荐的协同作用，不适用于在线社区场景。现有基于好友关系网络的方法往往只考虑用户间的显性社交关系网络，如好友关系或关注关系等，而忽略了在线社区用户之间的潜在社会关系，如话题的共同参与等。基于用户资料的在线社区好友推荐方法大多根据用户的个人属性信息等进行推荐，但是这类方法往往面临用户资料不完整和推荐不准确等问题。基于用户生成内容的方法往往从文本的角度探索用户之间的相似关系，进而完成好友推荐，但这类方法大多忽略了用户之间的其他社会化信息，如用户之间的交互关系和相似属性等。

好友推荐是为目标用户推荐其可能感兴趣的其他用户的过程，被推荐的其他用户称为项目。根据已有的好友关系网络，可以构建用户之间的评分矩阵。协同过滤是推荐系统中最为流行的方法之一，基于模型的协同过滤方法使用数据挖掘和机器学习技术从训练数据中的用户评分数据学习用户行为模式，进而预测出用户对项目的评分。矩阵分解方法是一种高效的基于模型的协同推荐方法，该方法通过对评分矩阵进行低秩近似实现评分预测。矩阵分解的核心思想认为用户的兴趣及被推荐项目的固有属性往往只受少数几个因素的影响。具体地，该方法将用户对项目的评分R分解为l×n维度的用户潜在特征矩阵U和l×m维度的项目潜在特征矩阵V，其中l为潜在特征维度，n为用户数量，m为项目数量。潜在特征矩阵U为用户的兴趣特征矩阵，表示各个用户在潜在特征上的兴趣程度。潜在特征矩阵V为项目的固有特征矩阵，表示各个被推荐项目在潜在特征上的固有属性。在线社区中既有的好友关系较少，对应的好友关系矩阵R＝(R_ij)_n×n往往较为稀疏，其中存在大量的缺失项。基于矩阵分解得到的两个特征矩阵可以对矩阵R＝(R_ij)_n×n中的缺失项进行评分预测得到

则R＝(R_ij)_n×n中的缺失项可以通过

中的评分进行估计并产生推荐。矩阵分解问题可以转化为机器学习中的最优化问题，加入正则项的损失函数可以定义为：

其中，

为指示函数，用来表示评分矩阵中对应元素是否缺失，不缺失时

否则

λ_U和λ_V为正则系数。

矩阵分解假设用户和项目的潜在特征向量及观察到的评分数据条件概率服从高斯先验分布，根据损失函数可得到最有可能的潜在特征矩阵。矩阵分解方法的概率图模型如图1所示。现有的矩阵分解方法认为用户与用户之间以及项目与项目之间都是相互独立的，忽略了用户之间以及项目之间可能存在的关联关系。在线社区中蕴含着广泛的社会化信息。一方面，用户的生成内容和个人属性信息能够较为客观地反映该用户的兴趣，这些信息可用于判断不同用户是否具有相似性或者是否可能成为好友。另一方面，不同用户之间往往存在潜在的社会关联关系，如用户的发帖和回帖关系，这些关系也能够在一定程度上体现不同用户的相似性。而现有的矩阵分解方法不考虑用户的这些社会化信息，因此难以有效地为用户推荐潜在好友。

在线社区中存在用户生成内容、用户属性和用户发回帖等纷繁复杂的社会化信息，其形式包括文本、属性信息及交互记录等。如何有效提取并集成这些社会化信息，从而能够准确度量用户间潜在的社会化关系值得探索。另外，如何对现有的矩阵分解方法进行改进，并将在线社区用户之间潜在的社会化关系融入到矩阵分解的过程中有待研究。

发明内容

为了帮助在线社区用户更有效地发现感兴趣的好友，本发明提出一种融合用户影响关系的在线社区好友推荐方法及系统。

实现本发明的技术方案如下：

一种融合用户影响关系的在线社区好友推荐方法，具体过程为：

步骤1.构建隐性用户行为网络，所述用户行为网络包括无向加权用户行为网络和有向加权用户行为网络；基于有向加权用户行为网络计算在线社区中基于兴趣的用户影响关系；

步骤2.基于所述无向加权用户行为网络，获取具有相似兴趣的用户社团；

步骤3.基于目标用户所在的社团，构建用户好友关系网络；基于所述用户影响关系构建用户影响关系网络；

步骤4.结合用户好友关系网络和用户影响关系网络进行好友推荐。

进一步地，本发明所述步骤1的基于兴趣的影响关系为：对于任意两个用户v_i和v_j，定义用户v_i对用户v_j基于兴趣的影响程度为S_ij，

S_ij＝WS_ij·US_ij (3)

其中，WS_ij表示用户v_i对用户v_j的用户交互程度，US_ij表示用户v_i与用户v_j间的相似程度。

进一步地，本发明所述用户的相似程度由行为模式相似程度、属性相似程度和生成内容主题相似程度确定。

进一步地，本发明所述用户行为网络以用户为节点，当用户之间存在共同兴趣时，对应的网络用户存在连边，连边表示用户之间的隐性社会关系，连边权重表示对应用户之间隐性社会关系的强弱。

进一步地，本发明所述无向加权用户行为网络中权重为：

其中，f_i和f_j分别表示用户v_i和用户v_j的权重，即用户v_i和用户v_j参与话题数量，w_ij表示初始用户行为网络中边的权重；

所述初始用户行为网络中边的权重w_ij为：

其中，threads(v_i)和threads(v_j)分别表示用户v_i和用户v_j参与过的话题集合，NU_p表示话题p的参与人数。

进一步地，本发明所述有向加权用户行为网络中权重为：

其中，f_i表示边的出发用户v_i的权重，即用户v_i参与话题数量，w_ij表示初始用户行为网络中边的权重；

所述初始用户行为网络中边的权重w_ij为：

进一步地，本发明将用户好友关系矩阵R＝(R_ij)_n×n分解为两个矩阵乘积的形式：

R≈U^TV. (23)

其中，U和V对应用户的两个潜在特征矩阵，矩阵U和矩阵V中的每一列U_i和V_j分别代表用户v_i与用户v_j的潜在特征向量，则用户v_i与用户v_j建立好友关系的概率可以表示为：

用户好友关系矩阵R＝(R_ij)_n×n和用户影响关系矩阵S＝(S_ij)_n×n中的用户数量均为n，

则矩阵U中用户v_i的特征向量可表示为：

其中，N_i表示用户影响关系网络中连接到用户v_i的用户集合，S_ki表示用户v_k对用户v_i基于兴趣的影响程度，U_k表示用户v_k在各个潜在特征上的兴趣程度；

则矩阵V中用户v_j的特征向量可表示为：

其中，N_j表示用户影响关系网络中连接到用户v_j的用户集合，S_kj表示用户v_k对用户v_j基于兴趣的影响程度，V_k表示用户v_k在各个潜在特征上的固有属性。

一种融合用户影响关系的在线社区好友推荐装置，包括行为网络构建模块、社团获取模块、好友/影响关系网络构建模块及好友推荐模块；

行为网络构建模块，用于构建隐性用户行为网络，所述用户行为网络包括无向加权用户行为网络和有向加权用户行为网络；基于有向加权用户行为网络计算在线社区中基于兴趣的用户影响关系；

社团获取模块，基于所述无向加权用户行为网络，获取具有相似兴趣的用户社团；

好友/影响关系网络构建模块，基于目标用户所在的社团，构建用户好友关系网络；基于所述用户影响关系构建用户影响关系网络；

好友推荐模块，结合用户好友关系网络和用户影响关系网络进行好友推荐。

有益效果

现有推荐方法往往基于单一信息实现好友推荐，忽略了在线社区中蕴含的用户兴趣偏好及相互影响关系。本发明根据在线社区中的丰富社会化信息构建了基于兴趣的相互影响关系，将用户间的相互影响关系作为社会化信息引入到好友推荐系统中。在矩阵分解的过程中有效地融合了用户间的社会化信息，从而得到更好的好友推荐效果。

附图说明

图1为传统矩阵分解的概率图模型；

图2为在线社区好友推荐示意图；

图3为好友关系推荐方法流程图；

图4初始用户行为网络构建过程的示意图；

图5无向加权用户行为网络的构建过程示意图；

图6有向加权用户行为网络的构建过程示意图；

图7融合用户影响关系的矩阵分解概率图模型。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整的描述。

如图2所示，在线社区中的用户影响关系反映用户之间基于兴趣的相互影响程度。根据用户之间的话题参与行为、用户生成内容和个体属性特征，可以计算用户之间的相互影响关系。本发明在已知现有用户好友关系网络和用户影响关系网络的情况下，预测在线社区中未连接的两个用户之间形成好友关系的概率，从而实现在线社区中的好友推荐。

如图3所示，本发明的过程为：首先基于数据集中的用户话题参与信息，构建无向加权用户行为网络用于发现用户社团，并以用户社团为单位，获取好友推荐所需的训练集和测试集。然后从训练集中获取所需数据分别构建用户影响关系网络和用户好友关系网络进行矩阵分解，获取用户间形成好友关系的可能性评分，实现好友推荐。

本发明一种融合用户影响关系的在线社区好友推荐方法，主要包括以下步骤：

步骤1.构建隐性用户行为网络，并计算在线社区中基于兴趣的用户影响关系，所述用户行为网络包括无向加权用户行为网络和有向加权用户行为网络；

用户影响关系反映个体间基于兴趣的相互影响程度，具有较大社会影响力，且与目标个体存在更相似的主题、行为模式和属性特征的用户往往对其他个体拥有更强的影响程度。本发明从用户间的用户交互程度和用户间的相似程度两个方面考虑对在线社区中的用户影响关系进行建模。其中，用户间的相似程度包括用户行为模式相似程度、用户属性相似程度和用户生成内容主题相似程度。

定义1基于兴趣的用户影响关系：对于任意两个用户v_i和v_j，定义用户v_i对用户v_j基于兴趣的影响程度S_ij为：

S_ij＝WS_ij·US_ij (3)

其中，WS_ij表示用户v_i对用户v_j的用户交互程度，US_ij表示用户v_i与用户v_j间的相似程度。用户之间基于兴趣的相互影响程度构成了用户之间的影响关系。

定义2用户相似程度：对于任意两个用户v_i和v_j，用户间的相似程度US_ij可表示为：

US_ij＝β₁·SR_ij+β₂·PS_ij+β₃·CS_ij. (4)

其中，SR_ij、PS_ij和CS_ij分别表示用户v_i与用户v_j间的行为模式相似程度、属性相似程度和生成内容主题相似程度，β₁、β₂、β₃分别表示行为模式相似程度、属性相似程度和用户生成内容主题相似程度的权重系数。即用户间的相似程度定义为用户行为模式相似程度、用户属性相似程度和用户生成内容主题相似程度的加权平均。

首先根据在线社区中的用户行为构建隐性用户行为网络，描述用户参与活动形成的连接关系，包括无向加权用户行为网络和有向加权用户行为网络。网络以用户为节点，当用户之间存在共同兴趣时，对应的网络用户存在连边。连边表示用户之间的隐性社会关系，连边权重表示对应用户之间隐性社会关系的强弱。

定义话题的流行程度为参与该话题的人数，记为NU。将参与人数的倒数1NU作为该话题对两个共同参与用户之间权重的贡献，初始用户行为网络B中两个用户之间的权重为所有话题对这两个用户权重贡献的总和：

其中，w_ij是用户v_i与用户v_j之间边的权重，threads(v_i)和threads(v_j)分别表示用户v_i和用户v_j参与过的话题集合，NU_p表示话题p的参与人数。将每个用户参与过的话题数量作为网络中用户的权重，表示健康社区中用户话题参与的活跃程度，记用户v_i的参与话题数量为f_i。以表1数据为例构建的初始用户行为网络如图4所示。

表1用户话题参与行为数据示例

初始用户行为网络在一定程度上反映了用户间的共同行为，但忽略了用户本身的活跃程度对网络连边权重的影响。本发明基于初始用户行为网络B，分两个步骤构建无向加权用户行为网络B_n。首先将初始用户行为网络中边的权重进行初始标准化：

其中，f_i和f_j分别表示用户v_i和用户v_j的权重，w_ij表示初始用户行为网络中边的权重。然后将网络中的最大权重作为标准进行标准化：

其中，w_ij'为网络中用户点v_i与用户v_j之间的连边权重。基于表1数据构建的无向加权用户行为网络B_n如图5所示。

无向加权用户行为网络可以有效获取用户间的连接强度，但不能区分来自每个用户对连边强度的影响，忽略了用户之间的差异。为了解决这个问题，分三个步骤构建有向加权用户行为网络

首先基于初始用户行为网络B，将网络B中连接两个用户的无向边变为两个权重相同的有向边。然后考虑网络中的用户权重信息，将边的权重初始标准化为：

其中，f_i表示边的出发用户v_i的权重。初始标准化后的结果如图4所示。最后，对网络中边的权重进一步标准化：

最终，构建了有向加权用户行为网络

其中w_ij”为网络中用户v_i到用户v_j的连边权重。根据表1数据的有向加权用户行为网络

的构建过程如图6所示。

在隐性用户行为网络构建的基础上，结合在线社区中的其他社会化信息构建用户影响关系。

(1)用户交互程度

基于有向加权用户行为网络

使用社会交互强度衡量网络中的用户交互程度(详见Rice R E,Grant A E,Schmitz J,Torobin J.Individual and network influenceson the adoption and perceived outcomes of electronic messaging[J].SocialNetworks,1990,12(1):27-55.)。由于网络中用户间的交互程度会随着用户间距离的增大而减弱，使用dijkstra算法计算用户v_i和v_j在网络中的最短路径(详见Dijkstra E W.Anote on two problems in connection with graphs[J].Numerische Mathematik,1959,1(1):269-271.)：

设用户v_i和v_j在网络中的最短路径path_ij＝{v₁,v₂,...,v_d}，如果网络中有多条最短路径，选择具有最大权重的最短路径。则用户v_i对用户v_j的初始用户交互程度WS_ij'为：

WS_ij'＝w(v_i,v₁)”×w(v₁,v₂)”×…×w(v_d,v_j)”, (11)

其中，w(v_i,v_j)”表示有向加权用户行为网络

中用户v_i与用户v_j间的连边权重，{v₁,v₂,...,v_d}表示用户v_i到用户v_j的最短路径。将用户v_i到用户的用户交互程度定义为用户v_i到用户v_j的初始用户交互程度WS_ij'占网络中所有用户到用户v_j的初始用户交互程度总和的比例：

由于有向加权用户行为网络

中用户间的连边具有方向性，一般有WS_ij≠WS_ji。

(2)行为模式相似程度

基于有向加权用户行为网络

使用SimRank算法计算网络中任意两个用户间在结构上的相似程度(详见Jeh G,Widom J.SimRank:a measure of structural-contextsimilarity[C].Proceedings of the Eighth ACM Sigkdd International Conferenceon Knowledge Discovery and Data Mining.ACM,2002:538-543.)。SimRank的基本思想是如果网络中的两个用户相似，那么与这两个用户相连的用户也相似。对于有向网络中的任意两个用户u和v，通过以下方式计算用户间的相似程度：

其中，c是0到1之间的常数，

和

分别表示有向加权用户行为网络

中从某一用户到用户u和用户v的连边权重，I(u)和I(v)分别表示连接到用户u和用户v的用户集合，且当

或

时s(u,v)＝0。通过递归可计算任意两个用户间的SimRank值。记SR_ij为网络中用户v_i与用户v_j间的行为模式相似程度，有SR_ij＝SR_ji。

(3)用户属性相似程度

使用用户属性信息计算用户v_i和用户v_j的用户属性相似程度PS_ij。对于无序属性，可通过匹配系数计算属性相似性：

其中，z_ik表示用户v_i的第k个属性；对于有序属性或数值属性，属性相似度可表示为：

其中，diff＝|z_ik-z_jk|，max_dk和min_dk分别表示第k个属性中所有差值的最大值和最小值。将用户v_i与用户v_j的属性相似性PS_ij表示为用户所有属性相似性的平均值：

其中，|Z|表示用户属性的数量，且PS_ij＝PS_ji。

(4)用户生成内容主题相似程度

使用潜在狄利克雷分布对用户生成内容进行特征分析，获取各文档的主题分布及其相似程度(详见Blei D M,Ng A Y,Jordan M I.Latent dirichlet allocation[J].Journal of Machine Learning Research,2003,3(1):993-1022.)。获取到的用户兴趣特征文档主题分布可以表示为T_i＝{t_i,1,t_i,2,...,t_i,K}，其中K为主题数目，t_i,k表示用户v_i对应兴趣特征文档d_i在第k主题上的权重。使用标准化的余弦相似度度量任意两个用户v_i与v_j之间的生成内容主题相似程度为：

(5)相似度权重

对用户相似程度的三个计算指标，即用户行为模式相似程度SR、属性相似程度PS和用户生成内容相似程度CS，使用XGBoost(eXtreme Gradient Boosting)模型进行学习，判断各个指标对用户相似程度的重要性(详见Chen T,Guestrin C.XGBoost:A ScalableTree Boosting System[C].Proceedings of the 22nd ACM Sigkdd InternationalConference on Knowledge Discovery and Data Mining.ACM,2016:785-794.)。

步骤2.基于所述无向加权用户行为网络，获取具有相似兴趣的用户社团。

根据步骤1构建的无向加权用户行为网络反映了用户之间的共同兴趣关联关系。基于无向加权用户行为网络，使用模块度算法可以得到具有相似兴趣的用户社团。本发明使用模块度算法进行层次化用户社团发现。模块度算法常用于度量网络中各社区内部联系的强度，算法的优化目标是最大化整个网络的模块度：

其中，|E_n|表示整个网络中边的数量；A＝(A_ij)_n×n代表网络邻接矩阵，其中A_ij表示无向加权用户行为网络B_n中用户间的连接权重；δ(C_i,C_j)表示用户v_i和用户v_j是否在同一社区；k_i和k_j分别表示用户v_i和用户v_j的度。上述各个变量的计算方式如下所示：

为了避免用户社区过大，在社团划分过程中对得到的较大子社团进行进一步的迭代划分，直到所有的社团规模不超过一定阈值或者不可再继续划分。

步骤3.基于目标用户所在的社团，构建用户好友关系网络；基于所述用户影响关系构建用户影响关系网络。

即根据目标用户所在的社团，首先基于数据集中的现有好友关系构建用户好友关系网络，然后根据步骤1计算得到的用户影响关系构建用户影响关系网络。

首先将用户间的好友关系邻接矩阵看作用户间的相互评分，然后在对现有矩阵分解方法进行改进的基础上，将用户影响关系融入到好友关系矩阵的分解过程中，并对模型进行求解以获取用户间的评分信息，最终实现好友关系推荐。

基于兴趣的用户影响关系能够有效获取在线社区中的用户社会化关系，衡量用户间基于兴趣的相互影响程度。因此，本发明提出融合用户影响关系的矩阵分解方法进行好友推荐。

本发明对传统矩阵分解方法进行改进，将用户间的相互影响关系融合到传统矩阵分解过程中，提出适用于在线社区的好友关系推荐方法。好友关系推荐的具体实现过程如下：

将用户好友关系对应的邻接矩阵R＝(R_ij)_n×n看作用户项目评分矩阵进行矩阵分解。若用户v_i与用户v_j之间存在好友关系，则认为两个用户互相感兴趣，有R_ij＝R_ji＝1，否则R_ij＝R_ji＝0。基于用户好友关系矩阵R，使用矩阵分解方法学习用户的潜在特征向量，预测用户间形成好友关系的可能性。在此场景下，矩阵分解方法将矩阵映射为两个新的l维潜在特征空间，评分可近似表示为潜在特征空间中向量的内积。用户好友关系矩阵R＝(R_ij)_n×n可以分解为两个矩阵乘积的形式：

R≈U^TV. (23)

其中，U和V对应用户的两个潜在特征矩阵，l表示潜在特征的维度。矩阵U和矩阵V中的每一列U_i和V_j分别代表用户v_i与用户v_j的潜在特征向量，则用户v_i与用户v_j建立好友关系的概率可以表示为：

将用户影响关系网络融入到矩阵分解过程。传统矩阵分解方法认为用户之间以及项目之间都是相互独立的，只根据用户项目评分矩阵本身对缺失项进行预测。然而，用户的兴趣偏好往往容易受到其他用户的影响。基于用户影响关系网络，可以得到网络中其他用户对目标用户的影响程度。用户的偏好受到网络中其他个体的影响，即用户的潜在特征向量与该用户在网络中存在影响关系的个体相关。记用户好友关系矩阵R＝(R_ij)_n×n和用户影响关系矩阵S＝(S_ij)_n×n中的用户数量均为n，则矩阵U中用户v_i的特征向量可表示为：

其中，N_i表示用户影响关系网络中连接到用户v_i的用户集合。本发明同时将用户看作被评价对象，他们之间同样存在相互影响关系，则矩阵V中用户v_j的特征向量可表示为：

即对用户影响关系网络中邻居用户的潜在特征向量进行加权，可以估计目标用户的潜在特征向量。用户影响关系网络的引入不改变现有用户好友关系R的条件分布，只对用户的潜在特征向量产生影响。用户关系网络R中任意两个用户之间的连边是基于高斯分布

产生的，则基于当前用户好友关系R中每对用户连边与非连边的产生过程，观测到的好友关系矩阵R的概率分布可以记为：

其中，g(x)＝1/(1+e^-x)将

标准化到[0,1]范围；Ν(x|μ,σ²)表示均值为μ方差为σ²的高斯分布；

为指示函数，如用户v_i与用户v_j存在好友关系，则

否则

用户的潜在特征向量表示为：

同样的，被评价用户的潜在特征向量可表示为：

上面两个式子中的第一项是均值为0的高斯先验，防止过拟合。第二项表示在邻居用户潜在特征的影响下目标用户潜在特征的条件分布。经过贝叶斯推断，已知用户影响关系网络和现有用户好友关系，潜在特征向量的先验分布为：

对应的概率图模型如图7所示。

构建融合用户影响关系的损失函数并求解。对潜在特征向量的先验分布取对数后，将模型进一步转变为带有二次正则化项的误差平方和形式，得到目标函数：

其中，

对所有用户对应的U_i和V_j使用梯度下降法最小化目标函数：

其中，g'(x)为logistic函数的导数，且g'(x)＝e^-x/(1+e^-x)²。在迭代过程中，U和V基于前一轮的潜变量不断更新，直至达到最大迭代次数或误差值小于设定的阈值。

最终根据获取到的矩阵分解形式可以预测用户之间形成好友关系的可能性，进而实现好友推荐。

本发明首先基于在线社区中的用户生成内容、发回帖行为和用户属性等社会化信息建立了用户之间的相互影响关系，能够有效挖掘在线社区用户之间潜在的社会化关系，为用户好友推荐奠定基础。其次，本发明对传统矩阵分解方法进行改进，将用户之间的好友关系推荐问题看作用户对项目的评分预测问题。以用户影响关系作为模型的先验信息估计用户的潜在特征向量，从而将用户影响关系有效地融合到好友推荐过程，最终对用户之间形成好友关系的可能性进行预测。

实验评估过程如下：

为了验证本发明提出的好友推荐方法的有效性，采集糖尿病病患交流社区甜蜜家园中的数据进行实验评估。分别使用基于用户生成内容的推荐方法(CUR)、基于用户属性的推荐方法(UserProfile)基于用户行为模式的推荐方法(HealthRank)、基于用户的协同推荐方法(UserCF)和基于矩阵分解的协同推荐方法(BaseMF)作为对比方法评估好友推荐的有效性。

使用本发明提出的方法(SocialUR)及上述对比方法分别计算当前未连接的用户之间形成好友关系的可能性，使用测试集对预测结果进行评价。各个模型得到的结果以用户之间形成好友关系的概率方式呈现，使用均方根误差(Root Mean Square Error，RMSE)和平均绝对误差(Mean Absolute Error，MAE)两个指标对模型的推荐结果进行评价。RMSE和MAE用于衡量观测值与真实值之间的偏差程度，这两个指标的值越小，表明方法的推荐效果越好。它们的计算方法分别为：

其中，R_ij表示测试集中的真实评分，即用户间是否存在好友关系；

表示模型预测的评分，即用户间存在好友关系的可能性；u为测试集中的评分数量，即用户之间社交关系的数量。

实验结果如表2所示，相比选取的现有其他方法，使用SocialUR获取的实验结果在RMSE和MAE指标上均明显较小，表明SocialUR方法对用户之间好友关系的预测偏差低于其他对比方法。对比方法中推荐效果较好的依次为基于用户属性的方法、基于矩阵分解的协同推荐方法和基于用户生成内容的方法，基于用户的协同推荐方法和基于用户行为模式的推荐方法表现较差。

表2好友推荐方法实验结果评估

本发明在对现有矩阵分解方法进行改进的基础上，将基于兴趣的用户影响关系融入到好友关系矩阵的分解过程中，提出了融合用户影响关系的矩阵分解好友推荐方法。该方法综合考虑在线社区用户之间的社会化信息，并结合现有好友关系网络实现用户社交关系推荐。本发明能够帮助在线社区成员发现感兴趣的用户，从而更有效地获取社会支持。

综上所述，以上仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。