CN105761154A

CN105761154A - 一种社会化推荐方法及装置

Info

Publication number: CN105761154A
Application number: CN201610222113.5A
Authority: CN
Inventors: 石川; 郑静; 刘剑
Original assignee: Beijing University of Posts and Telecommunications
Current assignee: Beijing University of Posts and Telecommunications
Priority date: 2016-04-11
Filing date: 2016-04-11
Publication date: 2016-07-13
Anticipated expiration: 2036-04-11
Also published as: CN105761154B

Abstract

本发明实施例提供的一种社会化推荐方法及装置，可以接收异质信息网络中的第一用户发送的推荐请求；判断所述异质信息网络中是否存在所述第一用户未知的第一物品；如果是，根据第一预测模型，确定所述第一用户对每个所述第一物品的预测评分，其中，所述第一预测模型为：Bˊ是用户相似性规则化项；并将预测评分不小于预设值的所述第一物品推荐给所述第一用户。由于第一预设模型中的用户相似性规则化项Bˊ，对高相似性用户和低相似性用户均具有良好的约束性。因此，相比于现有技术中的基础社会化推荐算法SoMF，本发明提供的一种社会化推荐方法及装置，对第一用户未知的第一物品的预测评分更准确，使得推荐效果更好，更能满足用户的需求。

Description

一种社会化推荐方法及装置

技术领域

本发明涉及推荐技术领域，特别是涉及一种社会化推荐方法及装置。

背景技术

随着互联网信息技术的迅猛发展，网络信息的产生和分享变得更加容易，人们也越来越倾向于在网上获取有用信息。但是，互联网进入到海量数据时代的同时也带来了信息过载(informationoverload)的问题，电子商务网站、视频网站和社交网站等每天都有大量的内容发布，网站的浏览用户也在不断增加。

面对过量信息，对于用户而言，仅仅通过网站索引、搜索引擎等工具寻找有用信息并不能完全满足用户需求，当用户无法精确描述搜索内容时，获取需要的信息更是犹如大海捞针，既费时又伤神；对于内容提供商而言，如何有效利用网络数据更友好、精确地定位用户喜好，向用户推送感兴趣的内容以形成网站核心优势，提高用户的黏性，最大程度地利用网络信息实现利益的最大化变成了一个难题。

在这样的情况下，出现了推荐系统，它采用各种推荐方法与实际相结合，自动地为用户提供经济的、高质量的个性化推荐。推荐系统对用户的过往记录等加以利用推测出用户的潜在爱好并向用户作推荐，并不需要用户明确地提出自己的需求，这一点与搜索引擎不同，搜索引擎需要用户明确需求，输入精确的搜索关键字才能为用户找到需要的物品。

近几年，社交网络的日益普及极大地丰富了用户的社会活动，在社交网络中存在丰富的社会关系，如Facebook的朋友关系、Twitter的关注关系和Epinions的信任关系等等。用户的兴趣爱好一般会受到他们在社交网站上结交的朋友的影响或者与朋友的偏好相似，在选择一样新的物品时用户更倾向于向朋友寻求建议而非询问陌生人。针对社交网络社会化推荐算法就是在这样的背景下被提出。

社交网络是一种典型的复杂异质信息网络。所谓异质信息网络(HeterogeneousInformationNetwork)是指，网络中的实体对象类型|A|＞1或链接不同实体对象之间的关系类型|R|＞1的网络。在网络中，一个结点代表一个实体对象，一条边代表被这条边连接的两个实体对象间的关系，例如豆瓣网站就是一个异质信息网络，其中用户、电影、群组和演员就是不同的实体对象，用户和用户间的关系为朋友关系，用户和电影的关系为评分和被评分的关系。连接异质信息网络中的两个实体对象的路径被称为元路径。

研究人员针对社交网络提出的基础社会化推荐算法SoMF的约束模型如下：

\min_{U, V} J = A + α B + λ_{1} C

上式中，其中，m×n的矩阵R代表的是m个用户对n个物品的评分，R_ij表示用户i对物品j的评分；I_ij为指示函数，当用户i存在对物品j的评分行为时I_ij取1，否则I_ij取0；U和V是通过对R进行矩阵分解得到的两个低秩隐性特征矩阵，U∈R^m×f，V∈R^n×f，其中f＜＜min(m，n)为隐性特征矩阵的维数；U_i是用户对应的隐性特征矩阵U的第i行元素所形成的用户i的隐性特征向量；V_j是物品对应的隐性特征矩阵V的第j行元素所形成的物品j的隐性特征向量；S_U是基于元路径计算获得的用户相似度矩阵，S_U(i,j)是矩阵S_U中第i行第j列的元素，表示用户i与用户j的相似度；α为系数；λ₁是规则化系数，用于防止过拟合；||||²为弗罗宾尼斯范数。

上式中的“B”项为社会规则化项，是基础社会化推荐算法中的约束项，当两个用户较为相似时，社会规则化项会约束这两个用户的隐性特征向量使二者更为接近；然而，上述基础社会化推荐算法存在如下缺陷：

当两个用户不相似时，约束项B可能并不会起作用，甚至可能也会迫使这两个不相似用户的隐性特征向量接近，这与实际情况相反。也就是说基础社会化推荐算法的约束项B在两个用户不相似时并不能起到很好的约束作用。例如，当S_U(i，j)较大时，社会规则化项约束矩阵分解的结果，使用户i和用户j的隐性特征向量U_i和U_j间拥有较小的欧氏距离，也就是限制分解后得到的待推荐的用户与该用户的相似用户的喜好相似。但是，当S_U(i，j)值较小，即用户i和用户j并不太相似时，因为该基础社会化推荐算法是使上式整体最小化，此时社会规则化项同样会使用户隐性特征向量U_i和U_j间拥有较小的欧氏距离，这与实际情况相悖。事实上这两个用户是不太相似的，甚至差异较大。

可见，由于现有的社会规则化项B的局限性，使得现有的社会化推荐算法只适用于高相似度的用户，对低相似度的用户并不适用，推荐效果不理想。

发明内容

本发明实施例的目的在于提供一种社会化推荐方法及装置，同时适用于低相似性用户和高相似性用户，推荐效果更优。

为了实现上述目的，本发明实施例公开了一种社会化推荐方法，所述方法包括：

接收异质信息网络中的第一用户发送的推荐请求；

判断所述异质信息网络中是否存在所述第一用户未知的第一物品；

如果是，根据第一预测模型，确定所述第一用户对每个所述第一物品的预测评分；其中，所述第一预测模型为：其中，B'为用户相似性规则化项；m×n的矩阵R代表的是m个用户对n个物品的评分，R_ij表示用户i对物品j的评分；I_ij为指示函数，当用户i存在对物品j的打分行为时I_ij取1，否则I_ij取0；U和V是通过对R进行矩阵分解得到的两个低秩隐性特征矩阵，U∈R^m×f，V∈R^n×f，其中f＜＜min(m，n)为隐性特征矩阵的维数；U_i是用户对应的隐性特征矩阵U的第i行元素所形成的用户i的隐性特征向量；V_j是物品对应的隐性特征矩阵V的第j行元素所形成的物品j的隐性特征向量；S_U是基于元路径计算获得的用户相似度矩阵；S_U(i,j)是矩阵S_U中第i行第j列的元素，表示用户i与用户j的相似度；α为经验系数；γ为经验系数，用于控制函数的径向强度；λ₁是规则化系数，用于防止过拟合；||||²为弗罗宾尼斯范数；

将预测评分不小于预设值的所述第一物品推荐给所述第一用户。

优选的，所述根据第一预测模型，确定所述第一用户对每个所述第一物品的预测评分包括：

根据所述第一预测模型及第一修正项的和，确定所述第一用户对每个所述第一物品的预测评分；其中所述第一修正项为：λ₂D，其中w_U为利用不同元路径计算获得S_U时的元路径的权重系数向量，λ₂是规则化系数。

优选的，所述根据所述第一预测模型及第一修正项的和，确定所述第一用户对每个所述第一物品的预测评分包括：

根据预设的物品相似性规则化项，对所述第一修正项进行校正，将校正后的第一修正项记为第二修正项；其中，所述预设的物品相似性规则化项为：βE，β为经验系数，S_I是基于元路径计算获得的物品相似度矩阵；S_I(i,j)为是矩阵S_I中第i行第j列的元素，表示物品i与物品j的相似度；所述第二修正项为：λ₂D'，w_I为利用不同元路径计算获得S_I时的元路径的权重系数向量；

根据所述第一预测模型、预设的物品相似性规则化项及所述第二修正项的和，确定所述第一用户对每个所述第一物品的预测评分。

优选的，所述判断所述异质信息网络中是否存在所述第一用户未知的第一物品包括：

根据所述异质信息网络中保存的所述第一用户的浏览记录，判断所述异质信息网络中是否存在所述第一用户未知的第一物品。

优选的，在所述接收异质信息网络中的第一用户发送的推荐请求后，在所述根据第一预测模型，确定所述第一用户对每个所述第一物品的预测评分前，所述方法还包括：

根据保存的m个用户对n个物品的评分的m×n的矩阵R，判断所述第一用户是否为所述m个用户中的用户；

如果是，执行所述根据第一预测模型，确定所述第一用户对每个所述第一物品的预测评分的步骤；

否则，将所述第一用户对所述矩阵R中的n个物品的评分信息添加到所述矩阵R中，对所述矩阵R进行更新后，执行所述根据第一预测模型，确定所述第一用户对每个所述第一物品的预测评分的步骤。

为了实现上述目的，本发明实施例还公开了一种社会化推荐装置，所述装置包括：推荐请求接收模块、第一判断模块、预测评分确定模块和推荐模块，

所述推荐请求接收模块，用于接收异质信息网络中的第一用户发送的推荐请求；

所述第一判断模块，用于判断所述异质信息网络中是否存在所述第一用户未知的第一物品；

所述预测评分确定模块，用于在所述第一判断模块获得的判断结果为是的情况下，根据第一预测模型，确定所述第一用户对每个所述第一物品的预测评分；其中，所述第一预测模型为：其中，B'为用户相似性规则化项；m×n的矩阵R代表的是m个用户对n个物品的评分，R_ij表示用户i对物品j的评分；I_ij为指示函数，当用户i存在对物品j的打分行为时I_ij取1，否则I_ij取0；U和V是通过对R进行矩阵分解得到的两个低秩隐性特征矩阵，U∈R^m×f，V∈R^n×f，其中f＜＜min(m，n)为隐性特征矩阵的维数；U_i是用户对应的隐性特征矩阵U的第i行元素所形成的用户i的隐性特征向量；V_j是物品对应的隐性特征矩阵V的第j行元素所形成的物品j的隐性特征向量；S_U是基于元路径计算获得的用户相似度矩阵；S_U(i,j)是矩阵S_U中第i行第j列的元素，表示用户i与用户j的相似度；α为经验系数；γ为经验系数，用于控制函数的径向强度；λ₁是规则化系数，用于防止过拟合；||||²为弗罗宾尼斯范数；

所述推荐模块，用于将预测评分不小于预设值的所述第一物品推荐给所述第一用户。

优选的，所述预测评分确定模块，具体用于根据所述第一预测模型及第一修正项的和，确定所述第一用户对每个所述第一物品的预测评分；其中所述第一修正项为：λ₂D，其中w_U为利用不同元路径计算获得S_U时的元路径的权重系数向量，λ₂是规则化系数。

优选的，所述预测评分确定模块包括：校正子模块和预测评分确定子模块，

所述校正子模块，用于根据预设的物品相似性规则化项，对所述第一修正项进行校正，将校正后的第一修正项记为第二修正项；其中，所述预设的物品相似性规则化项为：βE，β为经验系数，S_I是基于元路径计算获得的物品相似度矩阵；S_I(i,j)为是矩阵S_I中第i行第j列的元素，表示物品i与物品j的相似度；所述第二修正项为：λ₂D'，w_I为利用不同元路径计算获得S_I时的元路径的权重系数向量；

所述预测评分确定子模块，用于根据所述第一预测模型、预设的物品相似性规则化项及所述第二修正项的和，确定所述第一用户对每个所述第一物品的预测评分。

优选的，所述第一判断模块，具体用于根据所述异质信息网络中保存的所述第一用户的浏览记录，判断所述异质信息网络中是否存在所述第一用户未知的第一物品。

优选的，所述装置还包括：第二判断模块、第一触发模块和第二触发模块，

所述第二判断模块，用于根据保存的m个用户对n个物品的评分的m×n的矩阵R，判断所述第一用户是否为所述m个用户中的用户；

所述第一触发模块，用于在所述第二判断模块获得的判断结果为是时触发所述预测评分确定模块；

所述第二触发模块，用于在所述第二判断模块获得的判断结果为否时，将所述第一用户对所述矩阵R中的n个物品的评分信息添加到所述矩阵R中，对所述矩阵R进行更新后，触发所述预测评分确定模块。

本发明实施例提供的一种社会化推荐方法及装置，可以接收异质信息网络中的第一用户发送的推荐请求；判断所述异质信息网络中是否存在所述第一用户未知的第一物品；如果是，根据第一预测模型，确定所述第一用户对每个所述第一物品的预测评分，其中，所述第一预测模型为：B'是用户相似性规则化项，且并将预测评分不小于预设值的所述第一物品推荐给所述第一用户。由于第一预设模型中的用户相似性规则化项B'，对高相似性用户和低相似性用户均具有良好的约束性。因此，相比于现有技术中的基础社会化推荐算法，本发明提供的一种社会化推荐方法及装置，对第一用户未知的第一物品的预测评分更准确，从而使推荐效果更好，更能满足用户的需求。当然，实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种社会化推荐方法的流程图；

图2为本发明实施例提供的另一种社会化推荐方法的流程图；

图3为本发明实施例提供的另一种社会化推荐方法的流程图；

图4为图3所示的实施例中的参数α和β的大小对推荐效果的影响示意图；

图5为图3所示的实施例中的参数α和β的大小对推荐效果的影响另一示意图；

图6为本发明实施例提供的另一种社会化推荐方法的流程图；

图7为本发明实施例提供的一种社会化推荐装置的结构图；

图8为本发明实施例提供的另一种社会化推荐装置的结构图；

图9为本发明实施例提供的另一种社会化推荐装置的结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供了一种社会化推荐方法及装置，应用于服务器，具体的可以应用于为社交网站、购物网站等异质信息网络服务的服务器中。下面分别进行说明。

首先对本发明实施例提供的一种社会化推荐方法进行说明。

如图1所示，本发明实施例提供了一种社会化推荐方法，该方法可以包括如下步骤：

S101、接收异质信息网络中的第一用户发送的推荐请求；

第一用户发送的推荐请求，可以是第一用户登录异质信息网络的登录请求，例如，用户登录豆瓣网的登录请求；也可以是第一用户主动点击异质信息网络所在网页或客户端页面上推荐按钮的操作，例如第一用户登录QQ音乐后，点击“今日推荐”这样的按钮。

S102、判断所述异质信息网络中是否存在所述第一用户未知的第一物品；如果是，执行步骤S103；

其中，第一用户未知的第一物品是指，第一用户从未浏览或关注过的物品；当然，第一用户未知的第一物品的数量可以是1个以上。

具体的，服务器可以根据异质信息网络中保存的第一用户的浏览记录，判断所述异质信息网络中是否存在所述第一用户未知的第一物品；

或者，服务器也可以根据异质信息网络中保存的第一用户的关注记录，判断该异质信息网络中是否存在第一用户未知的第一物品。

S103、根据第一预测模型，确定所述第一用户对每个所述第一物品的预测评分；

即在确定第一用户未知的第一物品后，根据第一预测模型预测第一用户对每个第一物品的预测评分，并根据预测评分的结果向第一用户做推荐。

第一预测模型为：

其中， α为经验系数；λ₁是规则化系数，用于防止过拟合。

在第一预测模型中，A是基础低秩矩阵分解模型，称为基础项，表示用户对物品的评分信息，用A单独作为预测模型时的推荐算法被称为基础低秩矩阵分解算法PMF；B'是用户相似性规则化项，在本发明的实施例中B'被称为第一约束项；C是修正项。

在A中，m×n的矩阵R代表的是异质信息网络中m个用户对n个物品的全部评分，用户对物品的评分的取值范围在1到K(K为整数且大于1)之间，R_ij表示用户i对物品j的评分；I_ij为指示函数，当用户i存在对物品j的打分行为时I_ij取1，否则I_ij取0；U和V是通过对R进行矩阵分解得到的两个低秩隐性特征矩阵，U∈R^m×f，V∈R^n×f，其中f＜＜min(m，n)为隐性特征矩阵的维数；U_i是用户对应的隐性特征矩阵U的第i行元素所形成的用户i的隐性特征向量，V_j是物品对应的隐性特征矩阵V的第j行元素所形成的物品j的隐性特征向量，计算U_i和V_j具体过程属于现有技术，此处不做赘述；

其中，对R进行矩阵分解的主要思想就是使函数L(R,U,V)的值达到最小：

在B'中，S_U是基于元路径计算获得的用户相似度矩阵；S_U(i,j)是矩阵S_U中第i行第j列的元素，表示用户i与用户j的相似度；γ为经验系数，用于控制函数的径向强度；||||²为弗罗宾尼斯范数；

元路径，是指连接异质信息网络中的两个实体的不同路径的排序组合，代表着实体间的语义关系。一条元路径∏被定义为它描述了在结点R₁和R_l+1之间，通过一系列的结点类型R₁,…，R_l+1和链路边L₁,…,L_l的一条路径。

具体的，可以采用现有的HeteSim算法计算S_U(i,j)。

由于，现有技术中公开的基础社会化推荐算法SoMF中的约束项B，在用户i和用户j并不相似时，即当S_U(i，j)值较小时，为了使基础社会化推荐算法SoMF的约束模型整体最小化，仍会使用户i的隐性特征向量U_i和用户j的隐性特征向量U_j间拥有较小的欧氏距离，即使||U_i-U_j||²较小，但这与这两个用户不相似的事实是不符的。理想的情况应该是：如果两个用户具有较高相似性，那么他们的隐性特征向量之间的距离应该比较小；如果两个用户(或物品)的相似性较低，那么他们的隐性特征向量间的距离相对于其他相似用户应该更大。

因此，针对于现有技术中约束项B只适用于高相似性用户的局限性，本发明实施例根据“相似性规则化项是使两个用户的隐性特征向量的距离与他们在实际生活中的相似性呈负相关关系”这一基本思想，对现有技术中的用户相似性规则化项进行了改进，提供了一种新的用户相似性规则化项B'作为第一约束项；

B'中的指数函数的取值范围为[0,1]，正好符合上述“相似性规则化项是使两个用户的隐性特征向量的距离与他们在实际生活中的相似性呈负相关关系”这一基本思想，使得本发明提供的用户相似性规则化项B'不仅可以实现相似的用户之间的相似性约束，还可以对不相似的用户之间的相似性进行约束。

S104、将预测评分不小于预设值的所述第一物品推荐给所述第一用户。

当用户对物品的评分的取值范围在1到K(K为整数且大于1)之间时，这里的预设值应为大于1小于K的整数。以豆瓣网上用户对电影的评分为例，K一般等于5，预设值可以设为3，即当利用本发明实施例提供的第一预测模型对第一用户未知的第一电影的预测评分不小于3时，可将第一电影推荐给第一用户。

由于第一预测模型中的第一约束项B'，不仅可以实现高相似性用户之间的相似性约束，还可以对不相似的用户之间的相似性进行约束，而且对低相似性用户和高相似性用户的约束结果都更符合实际情况。因此，相比于基础社会化推荐算法，本发明实施例提供的一种社会化推荐方法，对第一用户未知的第一物品的预测评分更准确，从而使推荐效果更好，更能满足用户的需求。

在图1所示的实施例中的步骤S103中，由于第一预测模型中的第一约束项B'中的用户相似度矩阵S_U是基于元路径计算获得的，而采用不同的元路径计算获得的用户相似度矩阵S_U是不同的。

因此，优选的，如图2所示，在图1所示的实施例的基础上，本发明实施例提供了另一种社会化推荐方法，该方法为每条元路径设置权重系数，通过对所有元路径下计算的相似度进行整合，得到用户的综合相似度矩阵S_U，并利用不同元路径的权重系数组成的向量构建出第一修正项，采用该第一修正项对第一预测模型得出的预测结果进行修正，使得对第一用户未知的第一物品的预测评分更加准确，该方法可以包括：

S101、接收异质信息网络中的第一用户发送的推荐请求；

同图1所示的实施例中的步骤S101。

S102、判断所述异质信息网络中是否存在所述第一用户未知的第一物品；

同图1所示的实施例中的步骤S102。

S201、根据所述第一预测模型及第一修正项的和，确定所述第一用户对每个所述第一物品的预测评分；

其中，第一预测模型即为图1所示的方法实施例中的第一预测模型，此处不再赘述；

其中，第一修正项为：λ₂D，其中w_U为计算综合相似度矩阵S_U时所采用的不同的元路径的权重系数组成的向量，λ₂是规则化系数，用于防止过拟合；

下面对利用不同元路径，计算获得用户综合相似度矩阵S_U的过程进行说明：

用表示为元路径链接下的用户的相似性矩阵，用表示元路径链接下的用户i和用户j的相似度，用表示链接用户的全部的元路径集合P_U中元路径对应的权重系数，则用户综合相似度矩阵：

S_{U} = Σ_{p = 1}^{| P_{U} |} w_{U}^{(p)} S_{U}^{(p)}

其中，且具体的，链接用户i和用户j的元路径的权重系数可以根据该条元路径的重要程度来设置；在无法确定每条元路径的重要程度的情况下，也可以取平均值；

具体的，也可以采用现有的HeteSim算法计算

具体的，w_U即为计算综合相似度矩阵S_U时所采用的元路径集合P_U中的每条元路径对应的权重系数组成的向量，可以表示为：

同图1所示的实施例中的步骤S104。

由于图1和图2所示的实施例中的第一预测模型中的第一约束项B'，仅考虑了异质信息网络中的用户相似性规则化项，并未考虑异质信息网络中的物品相似性规则化项。然而，如不考虑物品相似性规则化项，则不能很好地解决用户或物品的冷启动问题，从而导致物品或用户冷启动时的预测评分结果不够准确。冷启动包括：物品的冷启动和用户的冷启动；物品的冷启动可以是指这个物品只被异质信息网络中的很少的用户知晓；用户的冷启动可以是指这个用户是一个新注册用户，或该用户是非活跃用户，例如豆瓣网中的月登录次数很少的用户可以被定义为非活跃用户。

因此，优选的，如图3所示，在图2所示的实施例的基础上，本发明实施例提供了另一种社会化推荐方法，该方法可以包括：

S101、接收异质信息网络中的第一用户发送的推荐请求；

同图1所示的实施例中的步骤S101。

同图1所示的实施例中的步骤S102。

S301、根据预设的物品相似性规则化项，对所述第一修正项进行校正，将校正后的第一修正项记为第二修正项；

其中，预设的物品相似性规则化项为：βE，

β为经验系数，在本发明的实施例中E被称为第二约束项；

在第二约束项E中，S_I是基于元路径计算获得的物品相似度矩阵；S_I(i,j)为是矩阵S_I中第i行第j列的元素，表示物品i与物品j的相似度；V_i和V_j分别是物品对应的隐性特征矩阵V的第i行和第j行元素所形成的物品i和物品j的隐性特征向量，计算V_i和V_j具体过程属于现有技术，此处不做赘述；γ依然为经验系数，用于控制函数的径向强度；

具体的，也可以采用现有的HeteSim算法计算S_I(i,j)。

由于第二约束项E中的指数函数的取值范围为[0,1]，使得第二约束项E与第一约束项B'一样，也正好符合“两个物品的隐性特征向量的距离与他们在实际生活中的相似性呈负相关关系”这一基本思想。因此，本发明提供的第二约束项E，不仅可以实现相似的物品之间的相似性约束，还可以对不相似的物品之间的相似性进行约束。

在考虑了预设的物品相似性规则化项后，第一修正项因不能对物品相似性规则化项的预测结果进行修正，而使得预测结果不够准确，因此，还可以根据预设的物品相似性规则化项对第一修正项进行校正，校正后的第一修正项被记为第二修正项；

具体的，第二修正项为：λ₂D'

其中，w_U为计算综合相似度矩阵S_U时所采用的不同的元路径的权重系数组成的向量；w_I为计算综合相似度矩阵S_I时所采用的不同的元路径的权重系数组成的向量；λ₂是规则化系数，用于防止过拟合。

下面对利用不同元路径计算获得物品综合相似度矩阵S_I的过程进行说明：

用表示元路径链接下的物品之间的相似性矩阵，用表示元路径链接下的物品i和物品j的相似度，用表示链接物品的全部的元路径集合P_I中对应的权重，则物品综合相似度矩阵：

S_{I} = Σ_{p = 1}^{| P_{I} |} w_{I}^{(p)} S_{I}^{(p)}

其中，且具体的，链接物品i和物品j的元路径的权重系数可以根据该条元路径的重要程度来设置；在无法确定每条元路径的重要程度的情况下，也可以取平均值；

具体的，w_I即为计算综合相似度矩阵S_I时所采用的元路径集合P_I中的每条元路径对应的权重系数组成的向量，w_I可以表示为：

S302、根据所述第一预测模型、预设的物品相似性规则化项及所述第二修正项的和，确定所述第一用户对每个所述第一物品的预测评分；

具体的，第一预测模型、预设的物品相似性规则化项及第二修正项的和为：

\min_{U, V} J = A + {αB}^{'} + β E + λ_{1} C + λ_{2} D^{'}

上式的输出结果就是第一用户对第一物品的预测评分结果。

优选的，本发明实施例还根据实验结果对经验系数α和β进行了优化。

参数α和β分别控制第一约束项B'和第二约束项E的比例，即控制用户和物品的相似性对预测评分结果的影响程度。如果参数α和β的值取无限小，那么第一约束项B'和第二约束项E基本不起作用，此时的预测评分结果基本上与基础的概率矩阵分解模型A的预测结果相同；相反，如果参数α和β的值取无限大，那么第一约束项B'和第二约束项E将起主导作用，而用户对物品的评分信息(基础概率矩阵分解模型A)基本上对预测结果不造成影响。这两种极端情况都不是本发明所希望的。因此，有必要对经验系数α和β进行优化，使评分信息(基础概率矩阵分解模型A)和相似性信息(第一约束项B'和第二约束项E)对预测评分结果都能够起作用，以达到更好的推荐效果。

本发明通过实验分析参数α和β的不同取值对推荐效果的影响。在实验中，采用平均权重的方法整合不同的用户之间或者物品之间的元路径下计算出的相似性矩阵，得到用户或者物品的综合相似性矩阵，并在用户和物品的相似性矩阵保持不变的基础上，进行参数α和β的学习优化。对α和β取值从0开始，由0.001呈10倍依次增长到1000，α和β取不同值时获得的预测结果如图4和图5所示。图4的纵坐标为平均绝对误差MAE，也就是预测结果的评价指标为MAE；图5的纵坐标为均方根误差RMSE，也就是预测结果的评价指标为RMSE。平均绝对误差MAE是所有单个的真实值和实验求得的预测值的差取绝对值以后求和再取平均。均方根误差RMSE是所有单个的真实值和实验求得的预测值的误差的平方和与计算次数|R|的比值再取平方根。

从图4和图5中可以看出，α和β对两个评价指标MAE和RMSE的影响非常相似，两个参数同时取10的时候推荐效果最好，因此，优选的α＝β＝10。

同图1所示的实施例中的步骤S104。

在图3所示的实施例中，可以对用户和物品的隐性特征矩阵U和V，以及链接用户或物品的元路径的权重系数w_U和w_I进行优化。

下面首先对用户和物品的隐性特征矩阵U和V的优化过程进行说明。

在假设链接用户元路径的权重向量和链接物品的权重向量保持不变的基础上，采用梯度下降算法优化用户和物品的隐性特征矩阵U和V；优化方法如下：

\frac{\partial J}{\partial U_{i}} = Σ_{j = 1}^{n} I_{i j} (U_{i} V_{j}^{T} - R_{i j}) V_{j} + α Σ_{j = 1}^{m} γ [(S_{U} (i, j) - e^{- γ | | U_{i} - U_{j} | |^{2}}) e^{- γ | | U_{i} - U_{j} | |^{2}} (U_{i} - U_{j})] + λ_{1} U_{i}

\frac{\partial J}{\partial V_{j}} = Σ_{i = 1}^{m} I_{i j} (U_{i} V_{j}^{T} - R_{i j}) U_{i} + β Σ_{i = 1}^{n} γ [(S_{I} (i, j) - e^{- γ | | V_{i} - V_{j} | |^{2}}) e^{- γ | | V_{i} - V_{j} | |^{2}} (V_{i} - V_{j})] + λ_{1} V_{j}

即，对U_i和V_j相对于J求偏导，找J的极小值点，当二者的偏导数为0时，获得的U_i和V_j即为较优的用户和物品的隐性特征向量，由较优的隐性特征向量组成的矩阵U和V则为优化后的隐性特征矩阵。

下面对链接用户或物品的元路径的权重系数的优化过程进行说明。

在假设用户和物品的隐性特征矩阵U和V不变的基础上，优化链接用户或物品的元路径的权重系数w_U和w_I，具体方法如下：

使用tandardtrustregionreflective算法中的优化函数对w_U和w_I进行优化。其中，w_U的优化函数为以下标准二次公式：

\min_{w_{U}} (\frac{1}{2} w_{U}^{T} H_{U} w_{U} + f_{U}^{T} w_{U})

\begin{matrix} s . t . & Σ_{p = 1}^{| P_{U} |} w_{U}^{(P)} = 1, & w_{U}^{(P)} &GreaterEqual; 0 \end{matrix}

其中，H_U是一个|P_U|×|P_U|的对称矩阵，矩阵中的元素H_U(i,j)的计算公式如下：

f_U是一个长度为|P_U|的列向量，f_U中的元素f_U(p)的计算公式如下：

f_{U} (p) = - \frac{α}{4} Σ_{i = 1}^{m} Σ_{j = 1}^{m} S_{U}^{(p)} (i, j) e^{- γ | | U_{i} - U_{j} | |^{2}}

当式取最小值时，对应的w_U即为最优。

同理，可以对w_I进行优化。

本发明还通过实验，对本发明图3所示的实施例提供的一种社会化推荐方法的有效性进行了验证。具体验证过程如下：

1)确定数据集

共采用两个数据集分别进行验证，将两个数据集分别称为第一数据集和第二数据集。其中，第一数据集来自豆瓣网，第二数据集来自美国知名点评网站yelp。两个数据集都属于异质信息网络。

第一数据集包括：用户、用户与用户的社交关系、电影、电影的基本信息(包括：导演、演员和电影类型)和用户对电影的评分，评分的取值为[1,5]；第二数据集包括：用户、业务以及用户对业务的评分，评分的取值为[1,5]。对第一数据集和第二数据集的具体描述见表1。表1中的平均关系度A-B，指的是平均每个A与n个B有关系，例如，在用户-电影关系中，与每个用户有关联的电影的个数，简单的说，就是平均每个用户对电影的评分数量，反过来B对A的平均关系度就是平均每部电影有多少个用户给它进行了评分。

表1第一数据集和第二数据集的信息描述表

2)确定对比和评价指标

在实验中，将本发明图3所示的实施例提供的一种社会化推荐方法采用的越策模型称为“双重相似性约束算法(DSR，DualSimilarityRegularizationforRecommendation，)”，即将第一预测模型、预设的物品相似性规则化项及所述第二修正项的和：称为DSR算法。并将DSR算法分别与现有技术中的以下几种算法进行发对比：

①基础低秩矩阵分解算法PMF，即仅利用基础低秩矩阵分解模型A进行评分预测；

②基础社会化推荐算法SoMF；

③社会化协同过滤算法HeteCF，现有技术中的另一种社会化推荐算法。

比较时，本发明提供的DSR算法中的参数取：γ＝1，α＝β＝10，λ₁＝1，λ₂＝10⁸。

比较时，对于第一数据集，采用7条具有丰富语义的用户元路径和5条物品元路径，利用现有的HeteSim算法计算用户和物品的相似性矩阵S_U和S_I；对于第二数据集，采用2条具有丰富语义的用户元路径和2条物品元路径，利用现有的HeteSim算法计算用户和物品的相似性矩阵S_U和S_I。

比较时，对于第一数据集，分别采用80％、60％和40％的数据集作为训练集，剩余的数据作为测试集。对于第二数据集，考虑到数据集的稀疏性，实验分别使用90％、80％和60％的数据集作为训练集，剩余的数据作为测试集。例如，选取80％的第一数据集作为训练集，意味着在实验的过程中随机地从总的数据集中选取80％的数据进行学习得到用户和物品的隐性特征向量，再利用剩余20％的数据和预测的评分数据进行测试，从而判断DSR的有效性。

所有的实验都独立地随机选取10次数据进行交叉验证，也就是在同一个比例的训练数据下每个实验都进行10次，10次实验的结果进行加权平均后得到最后的实验结果。

比较时，采用前文提及的平均绝对误差MAE和均方根误差RMSE作为评价指标评价预测评分的预测效果。

3)预测效果对比

采用各算法对第一数据集的预测效果如表2所示，采用各算法对第二数据集的预测效果如表3所示，在表2和表3中，将各算法相对于“基础低秩矩阵分解算法PMF”的MAE和RMSE的提升幅度作为最终的评价效果的考量指标。

表2各算法对第一数据集的预测结果的有效性对比表

表3各算法对第二数据集的预测结果的有效性对比表

从表2和表3中可以看出，相对于现有技术中的其它三种算法，本发明图3所示的实施例提供的DSR算法的预测效果明显优于其它算法，值得注意的是，DSR对第二数据集这种数据比较稀疏的数据集的预测效果的提升也很明显。

由此可见，由于本发明图3所示的实施例不仅考虑了用户相似性规则化项对预测结果的影响，还考虑了物品相似性规则化项对评分结果的影响。因此，应用本发明图3所示的实施例提供的一种社会化推荐方法，不仅能很好地解决用户或物品的冷启动问题，还能提升数据稀疏的数据集的中的预测效果，推荐效果更优。

如图6所示，在图1所示的实施例的基础上，本发明实施例还提供了另一种社会化推荐方法，在执行步骤S101后、执行步骤S102前，该方法还可以包括：

S105、根据保存的m个用户对n个物品的评分的m×n的矩阵R，判断所述第一用户是否为所述m个用户中的用户；如果是，执行步骤S102；否则，执行步骤S106；

服务器上保存的m×n的矩阵R代表的是异质信息网络中m个用户对n个物品的全部评分，服务器可以根据矩阵R中是否存在第一用户对所述n个物品的评分信息，判断第一用户是否为所述m个用户中的用户。

S106、将所述第一用户对所述矩阵R中的n个物品的评分信息添加到所述矩阵R中，对所述矩阵R进行更新后，执行步骤S102。

可以理解的是，当第一用户为m个用户中的用户时，说明矩阵R中包含第一用户对该矩阵中的n个物品的评分信息，利用矩阵R构建的第一预设模型也考虑了第一用户的信息，从而使得利用第一预设模型对第一用户未知的第一物品的预测评分结果更为准确。因此，应用图6所示的实施例提供的一种社会化推荐方法，可以进一步提高预测评分的准确性，提升了推荐效果。

综上，本发明实施例提供的一种社会化推荐方法，可以接收异质信息网络中的第一用户发送的推荐请求；判断所述异质信息网络中是否存在所述第一用户未知的第一物品；如果是，根据第一预测模型，确定所述第一用户对每个所述第一物品的预测评分，其中，所述第一预测模型为：B'是用户相似性规则化项，且并将预测评分不小于预设值的所述第一物品推荐给所述第一用户。由于第一预设模型中的用户相似性规则化项B'，对高相似性用户和低相似性用户均具有良好的约束性。因此，相比于现有技术中的基础社会化推荐算法SoMF，本发明提供的一种社会化推荐方法，对第一用户未知的第一物品的预测评分更准确，推荐效果更好，更能满足用户的需求。

相应于图1所示的方法实施例，如图7所示，本发明还提供了一种社会化推荐装置，应用于服务器，该装置可以包括：推荐请求接收模块101、第一判断模块102、预测评分确定模块103和推荐模块104，

推荐请求接收模块101，用于接收异质信息网络中的第一用户发送的推荐请求；

第一用户发送的推荐请求，可以是第一用户登录异质信息网络的登录请求；也可以是第一用户主动点击异质信息网络所在网页或客户端页面上推荐按钮的操作。

第一判断模块102，用于判断所述异质信息网络中是否存在所述第一用户未知的第一物品；

具体的，第一判断模块102可以根据述异质信息网络中保存的第一用户的浏览记录，判断该异质信息网络中是否存在第一用户未知的第一物品；

或者，第一判断模块102可以根据异质信息网络中保存的第一用户的关注记录，判断该异质信息网络中是否存在第一用户未知的第一物品。

预测评分确定模块103，用于在所述第一判断模块102获得的判断结果为是的情况下，根据第一预测模型，确定所述第一用户对每个所述第一物品的预测评分；

第一预测模型为：

其中， α为经验系数；λ₁是规则化系数，用于防止过拟合；

在第一预测模型中，A是低秩矩阵分解模型，称为基础项，表示用户对物品的评分信息，用A单独作为预测模型时的推荐算法被称为基础低秩矩阵分解算法PMF；B'是用户相似性规则化项，在本发明的实施例中B'被称为第一约束项；C是修正项。

具体的，可以采用现有的HeteSim算法计算S_U(i,j)。

推荐模块104，用于将预测评分不小于预设值的所述第一物品推荐给所述第一用户。

由于第一预测模型中的第一约束项B'，不仅可以实现高相似性用户之间的相似性约束，还可以对不相似的用户之间的相似性进行约束，而且对低相似性用户和高相似性用户的约束结果都更符合实际情况。因此，相比于基础社会化推荐算法，本发明实施例提供的一种社会化推荐装置，对第一用户未知的第一物品的预测评分更准确，从而使推荐效果更好，更能满足用户的需求。

在图7所示的实施例中，由于第一预测模型中的第一约束项B'中的用户相似度矩阵S_U是基于元路径计算获得的，而采用不同的元路径计算获得的用户相似度矩阵S_U是不同的。

因此，在图7所示的实施例的基础上，需要为每条元路径设置权重系数，对所有元路径下计算的相似度进行整合，得到用户的综合相似度矩阵S_U，并利用不同元路径的权重系数组成的向量构建出第一修正项，采用该第一修正项对第一预测模型得出的预测结果进行修正，使得对第一用户未知的第一物品的预测评分更加准确。

这样预测评分确定模块103，具体用于根据所述第一预测模型及第一修正项的和，确定所述第一用户对每个所述第一物品的预测评分；

其中所述第一修正项为：λ₂D，其中w_U为计算综合相似度矩阵S_U时所采用的不同的元路径的权重系数组成的向量，w_U可以表示为：，P_U为计算综合相似度矩阵S_U时所采用的元路径的集合；λ₂是规则化系数，用于防止过拟合。

具体的，利用不同元路径计算获得用户综合相似度矩阵S_U的过程，以及不同元路径的权重系数的设置方法，与图2所示的方法实施例相同，这里不再赘述。

在图7所示的实施例的基础上，如图8所示，本发明实施例还提供了另一种社会化推荐装置，该装置可以包括：推荐请求接收模块101、第一判断模块102、预测评分确定模块103和推荐模块104，

其中，预测评分确定模块103包括：校正子模块301和预测评分确定子模块302，

校正子模块301，用于根据预设的物品相似性规则化项，对所述第一修正项进行校正，将校正后的第一修正项记为第二修正项；

其中，所述预设的物品相似性规则化项为：βE，β为经验系数，S_I是基于元路径计算获得的物品相似度矩阵；S_I(i,j)为是矩阵S_I中第i行第j列的元素，表示物品i与物品j的相似度；V_i和V_j分别是物品对应的隐性特征矩阵V的第i行和第j行元素所形成的物品i和物品j的隐性特征向量计算V_i和V_j具体过程属于现有技术，此处不做赘述；γ依然为经验系数，用于控制函数的径向强度；

其中，第二修正项为：λ₂D'，w_U为计算综合相似度矩阵S_U时所采用的不同的元路径的权重系数组成的向量，w_U可以表示为：，P_U为计算综合相似度矩阵S_U时所采用的元路径的集合；；w_I为计算综合相似度矩阵S_I时所采用的不同的元路径的权重系数组成的向量，w_I可以表示为：，P_I为计算综合相似度矩阵S_I时所采用的元路径的集合；λ₂是规则化系数，用于防止过拟合；

具体的，利用不同元路径计算获得用户综合相似度矩阵S_I的过程，以及不同元路径的权重系数的设置方法，与图3所示的方法实施例中相同，这里不再赘述。

具体的，也可以采用现有的HeteSim算法计算S_I(i,j)。

预测评分确定子模块302，用于根据所述第一预测模型、预设的物品相似性规则化项及所述第二修正项的和，确定所述第一用户对每个所述第一物品的预测评分；

\min_{U, V} J = A + {αB}^{'} + β E + λ_{1} C + λ_{2} D^{'}

上式的输出结果就是第一用户对第一物品的预测评分结果。

优选的，α＝β＝10。

由于本发明图8所示的实施例不仅考虑了用户相似性规则化项对预测结果的影响，还考虑了物品相似性规则化项对评分结果的影响。因此，应用本发明图9所示的实施例提供的一种社会化推荐装置，不仅能很好地解决用户或物品的冷启动问题，还能提升数据稀疏的数据集的中的预测效果，推荐效果更优。

在图7所示的实施例的基础上，如图9所示，本发明实施例还提供了另一种社会化推荐装置，该装置可以包括：第二判断模块105、第一触发模块106和第二触发模块107，

第二判断模块105，用于根据保存的m个用户对n个物品的评分的m×n的矩阵R，判断所述第一用户是否为所述m个用户中的用户；

具体的，服务器上保存的m×n的矩阵R代表的是异质信息网络中m个用户对n个物品的全部评分，第二判断模块105可以根据矩阵R中是否存在第一用户对所述n个物品的评分信息，判断第一用户是否为所述m个用户中的用户。

第一触发模块106，用于在所述第二判断模块获得的判断结果为是时触发所述预测评分确定模块102；

第二触发模块107，用于在所述第二判断模块获得的判断结果为否时，将所述第一用户对所述矩阵R中的n个物品的评分信息添加到所述矩阵R中，对所述矩阵R进行更新后，触发所述预测评分确定模块102；

可以理解的是，当第一用户为m个用户中的用户时，说明矩阵R中包含第一用户对该矩阵中的n个物品的评分信息，利用矩阵R构建的第一预设模型也考虑了第一用户的信息，从而使得利用第一预设模型对第一用户未知的第一物品的预测评分结果更为准确。因此，应用图9所示的实施例提供的一种社会化推荐装置，可以进一步提高预测评分的准确性，推荐效果也进一步得到了提升。

综上，本发明实施例提供的一种社会化推荐装置，可以接收异质信息网络中的第一用户发送的推荐请求；判断所述异质信息网络中是否存在所述第一用户未知的第一物品；如果是，根据第一预测模型，确定所述第一用户对每个所述第一物品的预测评分，其中，所述第一预测模型为：B'是用户相似性规则化项，且并将预测评分不小于预设值的所述第一物品推荐给所述第一用户。由于第一预设模型中的用户相似性规则化项B'，对高相似性用户和低相似性用户均具有良好的约束性。因此，相比于现有技术中的基础社会化推荐算法，本发明提供的一种社会化推荐装置，对第一用户未知的第一物品的预测评分更准确，推荐效果更好，更能满足用户的需求。

需要说明的是，在本发明提供的实施例中，λ₁、λ₂和γ的取值一般是根据具体的应用场景通过实验来确定的，在确定λ₁、λ₂和γ的取值时，将λ₁、λ₂和γ的初始值设为0.01，然后以10倍的梯度增长，然后根据实验结果从中选取最优值。

对于装置实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种社会化推荐方法，其特征在于，所述方法包括：

接收异质信息网络中的第一用户发送的推荐请求；

2.根据权利要求1所述的方法，其特征在于，所述根据第一预测模型，确定所述第一用户对每个所述第一物品的预测评分包括：

3.根据权利要求2所述的方法，其特征在于，所述根据所述第一预测模型及第一修正项的和，确定所述第一用户对每个所述第一物品的预测评分包括：

4.根据权利要求1-3中任一项所述的方法，其特征在于，所述判断所述异质信息网络中是否存在所述第一用户未知的第一物品包括：

5.根据权利要求1所述的方法，其特征在于，在所述接收异质信息网络中的第一用户发送的推荐请求后，在所述根据第一预测模型，确定所述第一用户对每个所述第一物品的预测评分前，所述方法还包括：

6.一种社会化推荐装置，其特征在于，所述装置包括：推荐请求接收模块、第一判断模块、预测评分确定模块和推荐模块，

7.根据权利要求6所述的装置，其特征在于，所述预测评分确定模块，具体用于根据所述第一预测模型及第一修正项的和，确定所述第一用户对每个所述第一物品的预测评分；其中所述第一修正项为：λ₂D，其中w_U为利用不同元路径计算获得S_U时的元路径的权重系数向量，λ₂是规则化系数。

8.根据权利要求7所述的装置，其特征在于，所述预测评分确定模块包括：校正子模块和预测评分确定子模块，

9.根据权利要求6-8中任一项所述的装置，其特征在于，所述第一判断模块，具体用于根据所述异质信息网络中保存的所述第一用户的浏览记录，判断所述异质信息网络中是否存在所述第一用户未知的第一物品。

10.根据权利要求6所述的装置，其特征在于，所述装置还包括：第二判断模块、第一触发模块和第二触发模块，