CN106126549A

CN106126549A - 一种基于概率矩阵分解的社区信任推荐方法及其系统

Info

Publication number: CN106126549A
Application number: CN201610428024.6A
Authority: CN
Inventors: 张礼名; 李卫民; 李珣锋; 刘炜
Original assignee: Road To Hong Kong Transfar Logistics Co Ltd
Current assignee: Road To Hong Kong Transfar Logistics Co Ltd
Priority date: 2016-06-16
Filing date: 2016-06-16
Publication date: 2016-11-16

Abstract

本发明适用于社交网络信息推荐领域，提供了一种基于概率矩阵分解的社区信任推荐方法及其系统，所述方法包括：获取用户的行为数据，得到社区集合；根据用户信息、用户关系、所需推荐的项目信息以及所述社区集合，构建社区数据模型，得到用户间信任关系；根据信任关系，构建概率矩阵分解模型，对所述模型进行求解，计算得出推荐信息；按照预定的推荐规则，将所述推荐信息中的所需项目信息推荐给对应的用户。本发明实施例将用户的社区关系引入信任关系中，对同一社区的用户与不同社区的用户区分开来，使得信任关系能够更准确地反映用户间真实关系，从而避免单方面的互动关系也被认为是信任关系的情况，大大提高了基于信任的推荐算法的准确性。

Description

一种基于概率矩阵分解的社区信任推荐方法及其系统

技术领域

本发明属于社交网络信息推荐领域，尤其涉及一种基于概率矩阵分解的社区信任推荐方法及其系统。

背景技术

由于在线社交网络的发展方便了用户交互数据和社会关系数据的获取和收集，因此如何利用用户的社交网络信息解决传统的推荐算法中存在的问题成为了研究热点。为了获取到冷启动用户的兴趣特征，研究者们开始利用额外的社会信息源(朋友关系，组员关系和社会信任)来提升推荐准确性，这些算法通常也可以称作社会推荐算法。目前，研究者又提出了很多基于信任的推荐算法，证实了信任也能够提升推荐算法的性能。

但是，基于信任的推荐算法很多是把用户间的互动关系(譬如关注其动态、对其某个观点点赞、单方面或者双方添加成为网络朋友、对其发表的状态加以评论等)直接看作了信任关系，这点大大影响推荐算法的性能。

研究者发现，社交网络上的处于同一小组或者同一社区的用户很有可能有相同的兴趣。与社交网络上组员关系相比，生活在同一社区中的亲朋好友间的信任关系更加可信，现实中的亲朋好友的推荐更值得信赖，可靠性更高。国外网站Social media link(SML)的统计数据表明，对购买行为影响最大的人的前三位排名从高到低分别是家庭成员(77％)，亲密朋友(77％)，专业人士(55％)。SML的分析人员Nielsen发现，84％的消费者认为从朋友和家人那里得到的推荐建议是最值得信赖的一种广告形式。由此可见消费者在购物时对朋友和家人的推荐有很高的信任。

因此，研究者认为，如果将社区关系引入信任关系中，那么将不仅会降低单方面互动关系对信任关系的影响，而且还会提高基于信任的推荐算法的准确性。

发明内容

本发明实施例提供一种基于概率矩阵分解的社区信任推荐方法，旨在解决现有的基于概率矩阵分解的推荐算法无法降低单方面互动关系对信任关系的影响和推荐算法准确性不高的问题。

本发明实施例是这样实现的，一种基于概率矩阵分解的社区信任推荐方法，所述方法包括：

获取用户的行为数据，并根据所述行为数据将用户进行分类，得到社区集合；

根据用户信息、用户关系、所需推荐的项目信息以及所述社区集合，构建社区数据模型，得到用户间信任关系；

根据所述信任关系，构建概率矩阵分解模型，对所述模型进行求解，计算得出推荐信息；

按照预定的推荐规则，将所述推荐信息中的所需项目信息推荐给对应的用户。

本发明实施例还提供一种基于概率矩阵分解的社区信任推荐系统，所述系统包括：

用户分类单元，用于获取用户的行为数据，并根据所述行为数据将用户进行分类，得到社区集合；

社区数据模型构建单元，用于根据用户信息、用户关系、所需推荐的项目信息以及所述社区集合，构建社区数据模型，得到用户间信任关系；

推荐信息计算单元，用于根据所述信任关系，构建概率矩阵分解模型，对所述模型进行求解，计算得出推荐信息；

项目推荐单元，用于按照预定的推荐规则，将所述推荐信息中的所需项目信息推荐给对应的用户。

本发明实施例将用户的社区关系引入信任关系中，对同一社区的用户与不同社区的用户区分开来，使得信任关系能够更准确地反映用户间真实关系，从而避免单方面的互动关系也被认为是信任关系的情况，大大提高了基于信任的推荐算法的准确性。

附图说明

图1是本发明实施例提供的本发明实施例提供的基于概率矩阵分解的社区信任推荐方法的实现流程图；

图2是本发明实施例提供的所述获取用户的行为数据，并根据所述行为数据将用户进行分类，得到社区集合的实现流程图；

图3是本发明实施例提供的所述对所述模型进行求解，计算得出推荐信息的实现流程图；

图4是本发明实施例提供的本发明实施例提供的所述按照预定的推荐规则，将所述推荐信息中的所需项目信息推荐给对应的用户的实现流程图；

图5是本发明实施例提供的参数α对社区推荐方法的影响图；

图6是本发明实施例提供的三种推荐方法模型的MAE值变化图；

图7是本发明实施例提供的三种推荐方法模型的RMSE值变化图；

图8是本发明实施例提供的基于概率矩阵分解的社区信任推荐系统的具体结构图；

图9是本发明实施例提供的所述用户分类单元的具体结构图；

图10是本发明实施例提供的推荐信息计算单元的具体结构图；

图11是本发明实施例提供的所述项目推荐单元的具体结构图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明实施例将用户的社区关系引入信任关系中，对同一社区的用户与不同社区的用户区分开来，使得信任关系能够更准确地反映用户间真实关系，从而避免单方面的互动关系也被认为是信任关系的情况。

实施例1：

图1示出了本发明实施例提供的基于概率矩阵分解的社区信任推荐方法的实现流程，详述如下：

S101、获取用户的行为数据，并根据所述行为数据将用户进行分类，得到社区集合。

其中，所述行为数据包括职业、地理位置、购买记录以及搜索记录中一种或者多种。

一般来说，用户的行为数据应当是具有一定差异性的用户的个人数据，以便将用户与其他人区分开来，也是因为如此，行为数据相似或者相同的用户间的信任关系会高于行为数据不同的用户。在本发明实施例中，将行为数据相似或者相同的用户归类为一个社区，用户间的信任关系也转变为社区信任关系。

S102、根据用户信息、用户关系、所需推荐的项目信息以及所述社区集合，构建社区数据模型，得到用户间信任关系。

在本发明实施例中，所述社区数据模型包括：

用户集合：U＝{u₁，u₂，…，u_n}，n表示用户数量；

项目集合：I＝{i₁，i₂，…，i_m}，m表示项目数量；

社区集合：C＝{c₁，c₂，…，c_k}，k表示社区数量；

用户关系矩阵T：由n行n列组成，矩阵元素t_ui表示用户u与用户i的社交网络关系；

信任关系矩阵V：由n行n列组成，矩阵元素v_ui表示用户u与用户i的信任关系，其中v_ui满足

v_ui＝s_ui·t_ui；

且α和β为固定常数。

在本发明实施例中，用户关系矩阵T通常情况是不对称的稀疏矩阵，譬如，用户u₁对用户u₂的关注关系不一定存在用户u₂对用户u₁的关注关系，用户u₂对用户u₁的观点表示赞成不代表用户u₁对用户u₂观点赞同，因为用户u₂可能未发表过任何观点。所以，当u₁信任u₂的观点，u₂信任u₃的观点时，一般情况下这种关系不存在传递，即不能直接推测出u₁信任u₃。从社交网络中获取的用户关系大多是成对的，这其实是不合理的，尤其是在表示信任这一关系上。由于同一社区内用户间的信任度要比一般用户间的信任度要高，所以，需要在获取了社交网络上的用户关系之后，对用户间的信任关系进行分析计算，并引入社区关系，予以赋值。

其中，α和β为固定常数，可以在构建社区数据模型时进行定义，也可以采用实验学习的方式得出，并不断调整。

S103、根据所述信任关系，构建概率矩阵分解模型，对所述模型进行求解，计算得出推荐信息。

在本发明实施例中，所述推荐信息选用常见的评分，即计算得出的推荐信息是用户对某一项目的预测评分，此时，预测评分与实际评分的差异就是评价社区信任推荐方法准确性的重要标准。

S104、按照预定的推荐规则，将所述推荐信息中的所需项目信息推荐给对应的用户。

实施例2：

图2示出了本发明实施例提供的所述获取用户的行为数据，并根据所述行为数据将用户进行分类，得到社区集合的实现流程，进一步包括如下步骤：

S201、采用K-means聚类方法对用户进行聚类分析，得到社区集合，并将用于标识所述社区集合的社区属性存储至用户信息。

常用的分类算法有K-means聚类，蚁群算法，相似度计算等。本发明实施例采用K-means聚类方法，通过分析行为数据对用户进行了聚类分析，使得每个用户拥有相应的社区属性。

此时，由于社区属性属于能够标识用户的用户特征，因此，在本发明中，将社区属性存储至用户信息，以便后续模型的求解。

实施例3：

在本发明实施例中，所述概率分解矩阵模型包括：

用户特征矩阵P：用于记录用户信息，由l行n列组成，l表示所述用户信息的条数；

项目特征矩阵Q：用于记录项目信息，由m行l列组成；

用户评分矩阵R：用于记录用户对项目的评分数据，由m行n列组成，矩阵元素表示用户u对项目i的评分，且满足：

{\hat{r}}_{ui} = Q_{i} P_{u};

其中，P_u为P的第u列，表示用户u的用户信息，Q_i为Q的第i行，表示项目i的项目信息。

在本发明实施例中，用户信息可以包括用户的粉丝数量、关注数量、评论数量等数据，同样的，项目信息也可以包括项目的点击数量、分享数量、评论数量等数据。

实施例4：

图3示出了本发明实施例提供的所述对所述模型进行求解，计算得出推荐信息的实现流程，进一步包括如下步骤：

S301、分析用户评分矩阵R，得到其条件概率分布满足：

p (R | P, Q, σ_{R}^{2}) = Π_{u = 1}^{n} Π_{i = 1}^{m} {[G ({\hat{r}}_{ui} | g (Q_{i} P_{u}), σ_{R}^{2})]}^{I_{ui}^{R}},

其中，为用户评分矩阵R的方差；表示r_ui服从均值为g(Q_iP_u)，方差为的高斯分布，且g(Q_iP_u)满足

g (Q_{i} P_{u}) = \frac{1}{1 + e^{Q_{i} P_{u}}},

表示将Q_iP_u映射到[0，1]内；为指示函数，如果用户u对项目i有评分，则如果用户u对项目i没有评分，则

S302、根据所述条件概率分布，经过贝叶斯推理，得出概率分解矩阵模型的先验概率满足：

\begin{matrix} p (P, Q | R, T, V, σ_{R}^{2}, σ_{T}^{2}, σ_{P}^{2}, σ_{Q}^{2}) \\ = Π_{u = 1}^{n} Π_{i = 1}^{m} {[G ({\hat{r}}_{ui} | g (Q_{i} | P_{u}), σ_{R}^{2})]}^{I_{ui}^{R}} \cdot Π_{u = 1}^{n} G (P_{u} | Σ_{i &Element; U} v_{ui} P_{u}, σ_{T}^{2}) \\ \cdot Π_{u = 1}^{n} G (P_{u} | 0, σ_{P}^{2}) \cdot Π_{i = 1}^{m} G (Q_{i} | 0, σ_{Q}^{2}), \end{matrix}

其中，为用户关系矩阵T的方差，为用户特征矩阵P的方差，为项目特征矩阵Q的方差，∑_i∈U v_ui为用户u与其他用户的信任关系之和，表示P_u服从均值为∑_i∈U v_uiP_u，方差为的高斯分布，表示P_i服从均值为0，方差为的高斯分布，表示Q_i服从均值为0，方差为的高斯分布；

S303、对所述先验概率等式两边同时取对数得：

\begin{matrix} \ln [p (P, Q | R, T, V, σ_{R}^{2}, σ_{T}^{2}, σ_{P}^{2}, σ_{Q}^{2})] \\ = - \frac{1}{σ_{R}^{2}} Σ_{u = 1}^{n} Σ_{i = 1}^{m} I_{ui}^{R} {({\hat{r}}_{ui} - g (Q_{i} P_{u}))}^{2} \\ - \frac{1}{σ_{T}^{2}} Σ_{u = 1}^{n} {(P_{u} - Σ_{i &Element; U} v_{ui} P_{u})}^{T} (P_{u} - Σ_{i &Element; U} v_{ui} P_{u}) \\ - \frac{1}{σ_{P}^{2}} Σ_{u = 1}^{n} {| | P_{u} | |}^{2} - \frac{1}{σ_{Q}^{2}} Σ_{i = 1}^{m} {| | Q_{i} | |}^{2} - \frac{1}{2} \ln_{R}^{2} Σ_{u = 1}^{n} Σ_{i = 1}^{m} I_{ui}^{R} \\ - \frac{1}{2} [(| U | \cdot l) \ln σ_{P}^{2} + (| I | \cdot l) \ln_{Q}^{2} + (| U | \cdot l) \ln σ_{T}^{2}] + D, \end{matrix}

其中，表示用户特征矩阵P中每个数据的平方和，表示项目特征矩阵Q中每个数据的平方和，D表示一与概率分解矩阵模型无关的常数。

S304、使先验概率最大化，得到损失函数：

\begin{matrix} Loss (R, V, T, P, Q) \\ = \frac{1}{2} Σ_{u = 1}^{n} Σ_{i = 1}^{m} I_{ui}^{R} {({\hat{r}}_{ui} - g (Q_{i} P_{u}))}^{2} \\ + \frac{γ_{V}}{2} Σ_{u = 1}^{n} {(P_{u} - Σ_{i &Element; U} v_{ui} P_{u})}^{T} (P_{u} - Σ_{i &Element; U} v_{ui} P_{u}) \\ + \frac{γ_{P}}{2} Σ_{u = 1}^{n} {| | P_{u} | |}^{2} + \frac{γ_{Q}}{2} Σ_{i = 1}^{m} {| | Q_{i} | |}^{2}, \end{matrix}

其中，

在本发明实施例中，基于概率矩阵分解的社区信任推荐方法模型中用户特征矩阵不仅由用户本身特征和用户的社交关系决定，还会受到其社区信任关系的影响。

S305、采用随机梯度下降法，对所述损失函数求解，求得损失函数Loss(R，V，T，P，Q)对于P_u和Q_i的偏导数：

\{\begin{matrix} \frac{&PartialD; Loss}{&PartialD; P_{u}} = - ({\hat{r}}_{ui} - g (Q_{i} P_{u})) Σ_{i = 1}^{m} I_{ui}^{R} Q_{i} + γ_{V} (P_{u} - Σ_{i &Element; U} v_{ui} P_{u}) \\ + γ_{V} Σ_{u &Element; U^{T}} v_{iu} (P_{i} - Σ_{i &Element; U} v_{in} P_{n}) + γ_{P} P_{u} \\ \frac{&PartialD; Loss}{&PartialD; Q_{i}} = - ({\hat{r}}_{ui} - g (Q_{i} P_{u})) Σ_{i = 1}^{m} I_{ui}^{Q} Q_{i} + γ_{Q} Q_{i} \end{matrix};

S306、将P_u和Q_i按下降速度快的方向调整并进行迭代更新，其更新规则满足：

\{\begin{matrix} P_{u} = P_{u} &LeftArrow; v \frac{&PartialD; Loss}{&PartialD; P_{u}} \\ Q_{i} = Q_{i} &LeftArrow; v \frac{&PartialD; Loss}{&PartialD; Q_{i}} \end{matrix},

直至满足预定条件，其中，v为在一定范围内的随机数值。

在本发明实施例中，对损失函数的求解还可以采用交替最小二乘法等其他方法，只要最终求解结果为预测评分，则均在本发明的保护范围内。

S307、根据最终获得的P′_u和Q′_i，求得推荐信息表示用户u对项目i的预测评分，其中，满足：

{\hat{r}}_{ui}^{'} = Q_{i}^{'} P_{i}^{'} .

在本发明实施例中，P′_u为新的用户特征矩阵的列向量，Q′_i为新的项目特征矩阵的行向量。

其中，学习速率v一般情况下可以设置为0.01或者是一个比较小的数。如果需要上述模型快速收敛，在一定的范围内也可以适当增大。在迭代更新的过程中，所述预定条件包括迭代更新次数不超过预定值，或者v不小于预定正数阈值。

实施例5：

图4示出了本发明实施例提供的所述按照预定的推荐规则，将所述推荐信息中的所需项目信息推荐给对应的用户的实现流程，进一步包括如下步骤：

S401、比较用户u对所有项目的预测评分，选取其最大值并将对应的项目j的项目信息Q_j推荐给用户u。

实施例6：

为了更直观地表现本发明提供的推荐方法的性能，本发明实施例还采用对比试验来评价方法的预测优劣。

对比方法：为了对比反映出本发明的有效性，本发明把矩阵分解(MF)模型这一经典模型作为一个对比例。由于MF仅仅学习评分矩阵，未考虑用户的社会关系，而SocialMF使用了用户间的信任关系推荐，因此，也把基本的SocialMF模型作为另一个对比例。

评价指标：对于基于评分的推荐方法，很多时候是靠计算预测值和真实值之间的误差来评价一个推荐方法的优劣。Mean Absolute Error(MAE)和Root Mean SquaredError(RMSE)是推荐方法中常用的评价指标。MAE和RMSE一样，值越小说明推荐方法的预测精度越高，说明预测值越接近真实值。

MAE的计算公式如下：

MAE = \frac{Σ_{u = 1}^{n} Σ_{i = 1}^{m} {Test}_{ui} | r_{ui} - {\hat{r}}_{ui}}{Σ_{u = 1}^{n} Σ_{i = 1}^{m} {Test}_{ui}};

RMSE的计算公式如下：

RMSE = \sqrt{\frac{Σ_{u = 1}^{n} Σ_{i = 1}^{m} {Test}_{ui} {(r_{ui} - {\hat{r}}_{ui})}^{2}}{Σ_{u = 1}^{n} Σ_{i = 1}^{m} {Test}_{ui}}};

由于RMSE记录的是评分点的预测误差的平方，然后平均后再开方，所以对于同样的预测分析，RMSE值大于MAE。

试验过程：本发明使用的数据集是从大众点评网上历时一周采集的，采集的用户数据至少评分一次，项目(酒店)至少被打分一次。该数据集包含了45109个用户对于3383家酒店的92290条评分信息还包括了134560条用户间的关注关系，该数据的稀疏度为1-92290/(45109×3383)＝0.06％。

由于试验数据的酒店样本主要位于上海市15个区，所以本发明实施例选择聚类个数为15，即k＝15的情况进行了实验，为每个用户分配其社区属性。随后，令β＝1一α，分别令α等于0.5、0.6、0.7、0.8和0.9，实验结果如图5所示。

从图5可以得出α确实对实验结果有影响，证明了用户对于不同社区确实存在信任差异。从图5中还可以看出当α的取值为0.6时，MAE取得了最小值，即α＝0.6时，推荐效果最好。

为了能够证明本发明确实能够在预测评分时有较高的准确性，本发明实施例又分别将结果与对比例矩阵分解(MF)模型和对比例SocialMF模型进行对照，实验结果如图6所示。

进一步地，为了检验本发明的准确性和稳定性，本发明实施例还采用了交叉验证法，将上述数据集随机分成10份，依次把这10份中的1份作为测试集，另外9份作为实验集，并将最后得到平均的MAE值作为实验结果，实验结果如图7。

从图6和图7可以看出，和MF模型和SocialMF模型相比，基于概率矩阵分解的社区信任推荐方法取得了更小的MAE和RMSE，并且MAE曲线总是位于MF模型和SocialMF模型下方。并且，可以看到社区信任推荐方法在迭代到15次的时候就已经开始收敛，而SocialMF模型迭代到第25次才收敛，说明本专利提出的方法可以在更少的迭代次数下取得更小的MAE和RMSE，这对需要在线实时响应用户需求的推荐系统中，可以给用户更好的用户体验。

其中，图6和图7中的CT-PMF即为本发明实施例提供的基于概率分解矩阵的社区推荐方法模型。

从图6和图7中还可以得出如下结论，引入了用户的社交关系的方法确实比传统的协同过滤方法在评分预测上更准确，因为SocialMF和社区信任推荐方法曲线都位于MF下方。

由此可以得出，本发明实施例是这三种方法模型中效果最好的，不仅可以在较少的迭代次数下获得更高的推荐准确性，而且还是对用户社交关系更有效的利用。

实施例7：

图8示出了本发明实施例提供的基于概率矩阵分解的社区信任推荐系统的具体结构，详述如下：

用户分类单元801，用于获取用户的行为数据，并根据所述行为数据将用户进行分类，得到社区集合。

社区数据模型构建单元802，用于根据用户信息、用户关系、所需推荐的项目信息以及所述社区集合，构建社区数据模型，得到用户间信任关系。

在本发明实施例中，所述社区数据模型包括：

用户集合：U＝{u₁，u₂，…，u_n}，n表示用户数量；

项目集合：I＝{i₁，i₂，…，i_m}，m表示项目数量；

社区集合：C＝{c₁，c₂，…，c_k}，k表示社区数量；

v_ui＝s_ui·t_ui；

且α和β为固定常数。

推荐信息计算单元803，用于根据所述信任关系，构建概率矩阵分解模型，对所述模型进行求解，计算得出推荐信息。

项目推荐单元804，用于按照预定的推荐规则，将所述推荐信息中的所需项目信息推荐给对应的用户。

实施例8：

图9示出了本发明实施例提供的所述用户分类单元801进一步包括：

聚类分析模块901，用于采用K-means聚类方法对用户进行聚类分析，得到社区集合，并将用于标识所述社区集合的社区属性存储至用户信息。

实施例9：

在本发明实施例中，所述概率分解矩阵模型包括：

项目特征矩阵Q：用于记录项目信息，由m行l列组成；

{\hat{r}}_{ui} = Q_{i} P_{u};

实施例10：

图10示出了本发明实施例提供的推荐信息计算单元803进一步包括：

条件概率计算模块1001，用于分析用户评分矩阵R，得到其条件概率分布满足：

p (R | P, Q, σ_{R}^{2}) = Π_{u = 1}^{n} Π_{i = 1}^{m} {[G ({\hat{r}}_{ui} | g (Q_{i} P_{u}), σ_{R}^{2})]}^{I_{ui}^{R}},

g (Q_{i} P_{u}) = \frac{1}{1 + e^{Q_{i} P_{u}}},

先验概率计算模块1002，用于根据所述条件概率分布，经过贝叶斯推理，得出概率分解矩阵模型的先验概率满足：

\begin{matrix} p (P, Q | R, T, V, σ_{R}^{2}, σ_{T}^{2}, σ_{P}^{2}, σ_{Q}^{2}) \\ = Π_{u = 1}^{n} Π_{i = 1}^{m} {[G ({\hat{r}}_{ui} | g (Q_{i} | P_{u}), σ_{R}^{2})]}^{I_{ui}^{R}} \cdot Π_{u = 1}^{n} G (P_{u} | Σ_{i &Element; U} v_{ui} P_{u}, σ_{T}^{2}) \\ \cdot Π_{u = 1}^{n} G (P_{u} | 0, σ_{P}^{2}) \cdot Π_{i = 1}^{m} G (Q_{i} | 0 {, σ}_{Q}^{2}), \end{matrix}

其中，为用户关系矩阵T的方差，为用户特征矩阵P的方差，为项目特征矩阵Q的方差，∑_i∈U v_ui为用户u与其他用户的信任关系之和，表示P_u服从均值为∑_i∈U v_uiP_u，方差为的高斯分布，表示P_i服从均值为0，方差为的高斯分布，表示Q_i服从均值为0，方差为的高斯分布。

等式计算模块1003，用于对所述先验概率等式两边同时取对数得：

\begin{matrix} \ln [p (P, Q | R, T, V, σ_{R}^{2}, σ_{T}^{2}, σ_{P}^{2}, σ_{Q}^{2})] \\ = - \frac{1}{σ_{R}^{2}} Σ_{u = 1}^{n} Σ_{i = 1}^{m} I_{ui}^{R} {({\hat{r}}_{ui} - g (Q_{i} P_{u}))}^{2} \\ - \frac{1}{σ_{T}^{2}} Σ_{u = 1}^{n} {(P_{u} - Σ_{i &Element; U} v_{ui} P_{u})}^{T} (P_{u} - Σ_{i &Element; U} v_{ui} P_{u}) \\ - \frac{1}{σ_{P}^{2}} Σ_{u = 1}^{n} {| | P_{u} | |}^{2} - \frac{1}{σ_{Q}^{2}} Σ_{i = 1}^{m} {| | Q_{i} | |}^{2} - \frac{1}{2} \ln_{R}^{2} Σ_{u = 1}^{n} Σ_{i = 1}^{m} I_{ui}^{R} \\ - \frac{1}{2} [(| U | \cdot l) \ln σ_{P}^{2} + (| I | \cdot l) {\ln σ}_{Q}^{2} + (| U | \cdot l) \ln_{Q}^{2}] + D, \end{matrix}

损失函数计算模块1004，用于使先验概率最大化，得到损失函数：

\begin{matrix} Loss (R, V, T, P, Q) \\ = \frac{1}{2} Σ_{u = 1}^{n} Σ_{i = 1}^{m} I_{ui}^{R} {({\hat{r}}_{ui} - g (Q_{i} P_{u}))}^{2} \\ + \frac{γ_{V}}{2} Σ_{u = 1}^{n} {(P_{u} - Σ_{i &Element; U} v_{ui} P_{u})}^{T} (P_{u} - Σ_{i &Element; U} v_{ui} P_{u}) \\ + \frac{γ_{P}}{2} Σ_{u = 1}^{n} {| | P_{u} | |}^{2} + \frac{γ_{Q}}{2} Σ_{i = 1}^{m} {| | Q_{i} | |}^{2}, \end{matrix}

其中，

损失函数求解模块1005，用于采用随机梯度下降法，对所述损失函数求解，求得损失函数Loss(R，V，T，P，Q)对于P_u和Q_i的偏导数：

\{\begin{matrix} \frac{&PartialD; Loss}{&PartialD; P_{u}} = - ({\hat{r}}_{ui} - g (Q_{i} P_{u})) Σ_{i = 1}^{m} I_{ui}^{R} Q_{i} + γ_{V} (P_{u} - Σ_{i &Element; U} v_{ui} P_{u}) \\ + γ_{V} Σ_{u &Element; U^{T}} v_{iu} (P_{i} - Σ_{i &Element; U} v_{in} P_{n}) + γ_{P} P_{u} \\ \frac{&PartialD; Loss}{&PartialD; Q_{i}} = - ({\hat{r}}_{ui} - g (Q_{i} P_{u})) Σ_{i = 1}^{m} I_{ui}^{Q} Q_{i} + γ_{Q} Q_{i} \end{matrix};

迭代更新模块1006，将P_u和Q_i按下降速度快的方向调整并进行迭代更新，其更新规则满足：

\{\begin{matrix} P_{u} = P_{u} &LeftArrow; v \frac{&PartialD; Loss}{&PartialD; P_{u}} \\ Q_{i} = Q_{i} &LeftArrow; v \frac{&PartialD; Loss}{&PartialD; Q_{i}} \end{matrix},

直至满足预定条件，其中，v为在一定范围内的随机数值。

推荐信息计算模块1007，用于根据最终获得的P′_u和Q′_i，求得推荐信息表示用户u对项目i的预测评分，其中，满足：

{\hat{r}}_{ui}^{'} = Q_{i}^{'} P_{i}^{'} .

实施例11：

图11示出了本发明实施例提供的所述项目推荐单元804进一步包括：

最高预测推荐模块1101，用于比较用户u对所有项目的预测评分，选取其最大值并将对应的项目j的项目信息Q_j推荐给用户u。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于概率矩阵分解的社区信任推荐方法，其特征在于，所述方法包括：

2.如权利要求1所述的社区信任推荐方法，其特征在于，所述获取用户的行为数据，并根据所述行为数据将用户进行分类，得到社区集合进一步包括如下步骤：

采用K-means聚类方法对用户进行聚类分析，得到社区集合，并将用于标识所述社区集合的社区属性存储至用户信息。

3.如权利要求1所述的社区信任推荐方法，其特征在于，所述行为数据包括职业、地理位置、购买记录以及搜索记录中一种或者多种。

4.如权利要求1所述的社区信任推荐方法，其特征在于，所述社区数据模型包括：

用户集合：U＝{u₁，u₂，…，u_n}，n表示用户数量；

项目集合：I＝{i₁，i₂，…，i_m}，m表示项目数量；

社区集合：C＝{c₁，c₂，…，c_k}，k表示社区数量；

v_ui＝s_ui·t_ui；

且α和β为固定常数。

5.如权利要求4所述的社区信任推荐方法，其特征在于，所述概率分解矩阵模型包括：

项目特征矩阵Q：用于记录项目信息，由m行l列组成，所述项目信息的条数与所述用户信息的条数一致；

{\hat{r}}_{u i} = Q_{i} P_{u};

6.如权利要求5所述的社区信任推荐方法，其特征在于，所述对所述模型进行求解，计算得出推荐信息进一步包括如下步骤：

分析用户评分矩阵R，得到其条件概率分布满足：

p (R | P, Q, σ_{R}^{2}) = Π_{u = 1}^{n} Π_{i = 1}^{m} {[G ({\hat{r}}_{u i} | g (Q_{i} P_{u}), σ_{R}^{2})]}^{I_{u i}^{R}},

g (Q_{i} P_{u}) = \frac{1}{1 + e^{Q_{i} P_{u}}},

根据所述条件概率分布，得出概率分解矩阵模型的先验概率满足：

\begin{matrix} p (P, Q | R, T, V, σ_{R}^{2}, σ_{T}^{2}, σ_{P}^{2}, σ_{Q}^{2}) \\ = Π_{u = 1}^{n} Π_{i = 1}^{m} {[G ({\hat{r}}_{u i} | g (Q_{i} P_{u}), σ_{R}^{2})]}^{I_{u i}^{R}} \cdot Π_{u = 1}^{n} G (P_{u} | Σ_{i &Element; U} v_{u i} P_{u}, σ_{T}^{2}) \\ \cdot Π_{u = 1}^{n} G (P_{u} | 0, σ_{P}^{2}) \cdot Π_{i = 1}^{m} G (Q_{i} | 0, σ_{Q}^{2}) \end{matrix},

其中，为用户关系矩阵T的方差，为用户特征矩阵P的方差，为项目特征矩阵Q的方差，∑_i∈Uv_ui为用户u与其他用户的信任关系之和，表示P_u服从均值为∑_i∈Uv_uiP_u，方差为的高斯分布，表示P_i服从均值为0，方差为的高斯分布，表示Q_i服从均值为0，方差为的高斯分布；

对所述先验概率等式两边同时取对数得：

\begin{matrix} \ln [p (P, Q | R, T, V, σ_{R}^{2}, σ_{T}^{2}, σ_{P}^{2}, σ_{Q}^{2})] \\ = - \frac{1}{σ_{R}^{2}} Σ_{u = 1}^{n} Σ_{i = 1}^{m} I_{u i}^{R} {({\hat{r}}_{u i} - g (Q_{i} P_{u}))}^{2} \\ - \frac{1}{σ_{T}^{2}} Σ_{u = 1}^{n} {(P_{u} - Σ_{i &Element; U} v_{u i} P_{u})}^{T} (P_{u} - Σ_{i &Element; U} v_{u i} P_{u}) \\ - \frac{1}{σ_{P}^{2}} Σ_{u = 1}^{n} | | P_{u} | |^{2} - \frac{1}{σ_{Q}^{2}} Σ_{i = 1}^{m} | | Q_{i} | |^{2} - \frac{1}{2} {lnσ}_{R}^{2} Σ_{u = 1}^{n} Σ_{i = 1}^{m} I_{u i}^{R} \\ - \frac{1}{2} [(| U | \cdot l) {lnσ}_{P}^{2} + (| I | \cdot l) {lnσ}_{Q}^{2} + (| U | \cdot l) {lnσ}_{T}^{2}] + D \end{matrix},

其中，表示用户特征矩阵P中每个数据的平方和，表示项目特征矩阵Q中每个数据的平方和，D表示一与概率分解矩阵模型无关的常数；

使先验概率最大化，得到损失函数：

\begin{matrix} L o s s (R, V, T, P, Q) \\ = \frac{1}{2} Σ_{u = 1}^{n} Σ_{i = 1}^{m} I_{u i}^{R} {({\hat{r}}_{u i} - g (Q_{i} P_{u}))}^{2} \\ + \frac{γ_{V}}{2} Σ_{u = 1}^{n} {(P_{u} - Σ_{i &Element; U} v_{u i} P_{u})}^{T} (P_{u} - Σ_{i &Element; U} v_{u i} P_{u}) \\ + \frac{γ_{P}}{2} Σ_{u = 1}^{n} | | P_{u} | |^{2} + \frac{γ_{Q}}{2} Σ_{i = 1}^{m} | | Q_{i} | |^{2} \end{matrix},

其中，

采用随机梯度下降法，对所述损失函数求解，求得损失函数Loss(R，V，T，P，Q)对于P_u和Q_i的偏导数：

\{\begin{matrix} \frac{\partial L o s s}{\partial P_{u}} = - ({\hat{r}}_{u i} - g (Q_{i} P_{u})) Σ_{i = 1}^{m} I_{u i}^{R} Q_{i} + γ_{V} (P_{u} - Σ_{i &Element; U} v_{u i} P_{u}) \\ + γ_{V} Σ_{u &Element; U^{T}} v_{i u} (P_{i} - Σ_{i &Element; U} v_{i n} P_{n}) + γ_{P} P_{u} \\ \frac{\partial L o s s}{\partial Q_{i}} = - ({\hat{r}}_{u i} - g (Q_{i} P_{u})) Σ_{i = 1}^{m} I_{u i}^{R} Q_{i} + γ_{Q} Q_{i} \end{matrix};

将P_u和Q_i按下降速度快的方向调整并进行迭代更新，其更新规则满足：

\{\begin{matrix} P_{u} = P_{u} &LeftArrow; v \frac{\partial L o s s}{\partial P_{u}} \\ Q_{i} = Q_{i} &LeftArrow; v \frac{\partial L o s s}{\partial Q_{i}} \end{matrix},

直至满足预定条件，其中，v为在一定范围内的随机数值；

根据最终获得的P′_u和Q′_i，求得推荐信息表示用户u对项目i的预测评分，其中，满足：

{\hat{r}}_{u i}^{'} = Q_{i}^{'} P_{u}^{'} .

7.如权利要求6所述的社区信任推荐方法，其特征在于，所述预定条件包括迭代更新次数不超过预定值，或者v不小于预定正数阈值。

8.如权利要求7所述的社区信任推荐方法，其特征在于，所述按照预定的推荐规则，将所述推荐信息中的所需项目信息推荐给对应的用户进一步包括如下步骤：

比较用户u对所有项目的预测评分，选取其最大值并将对应的项目j的项目信息Q_j推荐给用户u。

9.一种基于概率矩阵分解的社区信任推荐系统，其特征在于，所述系统包括：

10.如权利要求9所述的社区信任推荐系统，其特征在于，所述用户分类单元进一步包括：

聚类分析模块，用于采用K-means聚类方法对用户进行聚类分析，得到社区集合，并将用于标识所述社区集合的社区属性存储至用户信息。

11.如权利要求9所述的社区信任推荐系统，其特征在于，所述行为数据包括职业、地理位置、购买记录以及搜索记录中一种或者多种。

12.如权利要求9所述的社区信任推荐系统，其特征在于，所述社区数据模型包括：

用户集合：U＝{u₁，u₂，…，u_n}，n表示用户数量；

项目集合：I＝{i₁，i₂，…，i_m}，m表示项目数量；

社区集合：C＝{c₁，c₂，…，c_k}，k表示社区数量；

v_ui＝s_ui·t_ui；

且α和β为固定常数。

13.如权利要求12所述的社区信任推荐系统，其特征在于，所述概率分解矩阵模型包括：

用户特征矩阵P：用于记录用户信息，由l行n列组成，l表示所述个人信息的条数；

项目特征矩阵Q：用于记录项目信息，由m行l列组成；

{\hat{r}}_{u i} = Q_{i} P_{u};

14.如权利要求13所述的社区信任推荐系统，其特征在于，所述推荐信息计算单元进一步包括：

条件概率计算模块，用于分析用户评分矩阵R，得到其条件概率分布满足：

p (R | P, Q, σ_{R}^{2}) = Π_{u = 1}^{n} Π_{i = 1}^{m} {[G ({\hat{r}}_{u i} | g (Q_{i} P_{u}), σ_{R}^{2})]}^{I_{u i}^{R}},

g (Q_{i} P_{u}) = \frac{1}{1 + e^{Q_{i} P_{u}}},

先验概率计算模块，用于根据所述条件概率分布，得出概率分解矩阵模型的先验概率满足：

\begin{matrix} p (P, Q | R, T, V, σ_{R}^{2}, σ_{T}^{2}, σ_{P}^{2}, σ_{Q}^{2}) \\ = Π_{u = 1}^{n} Π_{i = 1}^{m} {[G ({\hat{r}}_{u i} | g (Q_{i} P_{u}), σ_{R}^{2})]}^{I_{u i}^{R}} \cdot Π_{u = 1}^{n} G (P_{u} | Σ_{i &Element; U} v_{u i} P_{u}, σ_{T}^{2}) \\ \cdot Π_{u = 1}^{n} G (P_{u} | 0, σ_{P}^{2}) \cdot Π_{i = 1}^{m} G (Q_{i} | 0, σ_{Q}^{2}) \end{matrix},

等式计算模块，用于对所述先验概率等式两边同时取对数得：

\begin{matrix} \ln [p (P, Q | R, T, V, σ_{R}^{2}, σ_{T}^{2}, σ_{P}^{2}, σ_{Q}^{2})] \\ = - \frac{1}{σ_{R}^{2}} Σ_{u = 1}^{n} Σ_{i = 1}^{m} I_{u i}^{R} {({\hat{r}}_{u i} - g (Q_{i} P_{u}))}^{2} \\ - \frac{1}{σ_{T}^{2}} Σ_{u = 1}^{n} {(P_{u} - Σ_{i &Element; U} v_{u i} P_{u})}^{T} (P_{u} - Σ_{i &Element; U} v_{u i} P_{u}) \\ - \frac{1}{σ_{R}^{2}} Σ_{u = 1}^{n} | | P_{u} | |^{2} + \frac{1}{σ_{Q}^{2}} Σ_{i = 1}^{m} | | Q_{i} | |^{2} - \frac{1}{2} {lnσ}_{R}^{2} Σ_{u = 1}^{n} Σ_{i = 1}^{m} I_{u i}^{R} \\ - \frac{1}{2} [(| U | \cdot l) {lnσ}_{R}^{2} + (| I | \cdot l) {lnσ}_{Q}^{2} + (| U | \cdot l) {lnσ}_{T}^{2}] + D \end{matrix},

损失函数计算模块，用于使先验概率最大化，得到损失函数：

\begin{matrix} L o s s (R, V, T, P, Q) \\ = \frac{1}{2} Σ_{u = 1}^{n} Σ_{i = 1}^{m} I_{u i}^{R} {({\hat{r}}_{u i} - g (Q_{i} P_{u}))}^{2} \\ + \frac{γ_{V}}{2} Σ_{u = 1}^{n} {(P_{u} - Σ_{i &Element; U} v_{u i} P_{u})}^{T} (P_{u} - Σ_{i &Element; U} v_{u i} P_{u}) \\ + \frac{γ_{P}}{2} Σ_{u = 1}^{n} | | P_{u} | |^{2} + \frac{γ_{Q}}{2} Σ_{i = 1}^{m} | | Q_{i} | |^{2} \end{matrix},

其中，

损失函数求解模块，用于采用随机梯度下降法，对所述损失函数求解，求得损失函数Loss(R，V，T，P，Q)对于P_u和Q_i的偏导数：

\{\begin{matrix} \frac{\partial L o s s}{\partial P_{u}} = - ({\hat{r}}_{u i} - g (Q_{i} P_{u})) Σ_{i = 1}^{m} I_{u i}^{R} Q_{i} + γ_{V} (P_{u} - Σ_{i &Element; U} v_{u i} P_{u}) \\ + γ_{V} Σ_{u &Element; U^{T}} v_{i u} (P_{i} - Σ_{i &Element; U} v_{i n} P_{n}) + γ_{P} P_{u} \\ \frac{\partial L o s s}{\partial Q_{i}} = - ({\hat{r}}_{u i} - g (Q_{i} P_{u})) Σ_{i = 1}^{m} I_{u i}^{R} Q_{i} + γ_{Q} Q_{i} \end{matrix};

迭代更新模块，用于将P_u和Q_i按下降速度快的方向调整并进行迭代更新，其更新规则满足：

\{\begin{matrix} P_{u} = P_{u} &LeftArrow; v \frac{\partial L o s s}{\partial P_{u}} \\ Q_{i} = Q_{i} &LeftArrow; v \frac{\partial L o s s}{\partial Q_{i}} \end{matrix},

直至满足预定条件，其中，v为在一定范围内的随机数值；

推荐信息计算模块，用于根据最终获得的P′_u和Q′_i，求得推荐信息表示用户u对项目i的预测评分，其中，满足：

{\hat{r}}_{u i}^{'} = Q_{i}^{'} P_{u}^{'} .

15.如权利要求14所述的社区信任推荐系统，其特征在于，所述预定条件包括迭代更新次数不超过预定值，或者v不小于预定正数阈值。

16.如权利要求15所述的社区信任推荐系统，其特征在于，所述项目推荐单元进一步包括：

最高预测推荐模块，用于比较用户u对所有项目的预测评分，选取其最大值并将对应的项目j的项目信息Q_j推荐给用户u。