CN103246672A - 对用户进行个性化推荐的方法和装置 - Google Patents

对用户进行个性化推荐的方法和装置 Download PDF

Info

Publication number
CN103246672A
CN103246672A CN2012100288965A CN201210028896A CN103246672A CN 103246672 A CN103246672 A CN 103246672A CN 2012100288965 A CN2012100288965 A CN 2012100288965A CN 201210028896 A CN201210028896 A CN 201210028896A CN 103246672 A CN103246672 A CN 103246672A
Authority
CN
China
Prior art keywords
sigma
user
product
similarity
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012100288965A
Other languages
English (en)
Other versions
CN103246672B (zh
Inventor
陈恩红
吴乐
宝腾飞
向彪
徐林莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology of China USTC
Original Assignee
University of Science and Technology of China USTC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology of China USTC filed Critical University of Science and Technology of China USTC
Priority to CN201210028896.5A priority Critical patent/CN103246672B/zh
Publication of CN103246672A publication Critical patent/CN103246672A/zh
Application granted granted Critical
Publication of CN103246672B publication Critical patent/CN103246672B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种对用户进行个性化推荐的方法和装置。该方法主要包括:利用用户的标签数据计算用户之间的相似度,利用产品的标签数据计算产品之间的相似度,根据相似度信息获取每个用户和每项产品的邻居集合;基于所述用户和产品的邻居集合信息,采取最近邻居矩阵分解算法计算出用户和产品的特征向量;根据用户和产品的特征向量,预测用户对未评分产品的评分数据,根据所述评分数据对用户进行个性化产品推荐。本发明实施例能在矩阵分解模型中引入了标签信息、邻居集合信息,使得相似的用户/产品具有相似的特征向量,因此既拥有矩阵分解模型的优点,又能够在全局结构中抓住邻居间的强关系。

Description

对用户进行个性化推荐的方法和装置
技术领域
本发明涉及计算机应用领域,具体涉及一种对用户进行个性化推荐的方法和装置。
背景技术
随着信息技术和互联网的蓬勃发展,网络上的资源呈爆炸式增长。例如:Netflix上有数万部电影,Amazon上有数百万本书,Taobao上有上亿件商品。面对如此多的信息,如果利用传统的信息搜索引擎进行信息搜索,得到的千篇一律的信息排序结果,无法根据不同用户的偏好提供相应的服务。因此,海量的信息空间在带给用户多元化选择的同时,反而使用户迷失在信息的海洋中,用户不得不花费大量的时间成本来寻找所需的消息,即所谓的“信息超载”现象。针对上述问题,个性化推荐系统孕育而生,该系统能够根据用户的历史行为预测用户的兴趣特征,为不同的用户量身推荐个性化的产品。与传统的信息搜索引擎“一对多”的服务方式不同,个性化推荐系统提供的是“一对一”的服务,更能符合用户需求。
推荐算法是个性化推荐系统的核心和关键部分,其性能的优劣直接影响了推荐系统的推荐效果。目前,最常用的个性化推荐系统包括以下两类:基于内容的推荐系统和协同过滤推荐系统。基于内容的推荐系统需要分别对用户和产品建立配置文件,通过用户填写的个人信息、用户的产品购买记录以及用户对产品的描述信息,建立和更新用户的配置文件。该系统可以比较用户的配置文件与产品的配置文件的相似度,并直接向用户推荐与其配置文件最相似的产品。而协同过滤推荐系统并不需要建立用户和产品的配置文件,它能够根据用户的
历史行为(如用户浏览购买行为,用户对产品的评分)推断出用户对产品的偏好程度进而进行推荐。协同过滤技术无需用户的个人信息,不涉及到隐私问题,且简单有效,这些优点使得协同过滤技术成为迄今为止应用最成功的个性化推荐技术。
在协同过滤技术中,通常将用户、类目的二元关系组成一个二维矩阵,矩阵中第i行第j列的值表示用户i对产品j的评分。一般而言,由于用户评分的产品相对于所有产品而言很少,所以该矩阵特别稀疏(稀疏度=1-矩阵中有评分的项/矩阵大小),很多稀疏度都在99%以上。因此,仅仅利用评分数据来预测用户的偏好是不够的。Web2.0技术的出现,使得用户从被动的“信息”接收者变成了主动的信息参与者。很多以用户为中心的应用孕育而生,如社会化标签系统。这些系统允许用户为不同的产品随意的打上标签数据,从而便于用户查找分类信息。现有技术中还没有综合利用用户-产品的评分数据以及用户的标签数据来对用户进行个性化推荐的方法。
发明内容
本发明实施例提供了一种对用户进行个性化推荐的方法和装置,以实现对用户进行有效的个性化产品推荐。
一种对用户进行个性化推荐的方法,包括:
利用用户的标签数据计算用户之间的相似度,利用产品的标签数据计算产品之间的相似度,根据相似度信息获取每个用户和每项产品的邻居集合;
基于所述用户和产品的邻居集合信息,采取最近邻居矩阵分解算法计算出用户和产品的特征向量;
根据用户和产品的特征向量,预测用户对未评分产品的评分数据,根据所述评分数据对用户进行个性化产品推荐。
一种对用户进行个性化推荐的装置,包括:
邻居集合获取模块,用于利用用户的标签数据计算用户之间的相似度,利用产品的标签数据计算产品之间的相似度,根据相似度信息获取每个用户和每项产品的邻居集合;
特征向量获取模块,用于基于所述用户和产品的邻居集合信息,采取最近邻居矩阵分解算法计算出用户和产品的特征向量;
个性化推荐处理模块,用于根据用户和产品的特征向量,预测用户对未评分产品的评分数据,根据所述评分数据对用户进行个性化产品推荐。
由上述本发明的实施例提供的技术方案可以看出,本发明实施例提出了一种新型的个性化推荐算法框架,该算法能整合用户的评分数据和标签数据,在矩阵分解模型中引入了标签信息、邻居集合信息,因此既拥有矩阵分解模型的优点,又能够在全局结构中抓住邻居间的强关系。在公开数据集上的实验结果表明,本发明实施例的最近邻居矩阵分解算法远远优于现今最流行的矩阵分解算法和最近邻算法。
附图说明
图1为本发明实施例一提出的一种结合用户-产品的评分数据和用户的标签数据对用户进行个性化推荐的方法的处理流程图;
图2为本发明实施例一提出的一种用户和产品特征向量的后验分布的计算原理示意图;
图3为本发明实施例二提出的一种对用户进行个性化推荐的装置的结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图,以对本发明实施例进行清楚、完整地描述人员。
实施例一
在协同过滤的算法中,有两个最基本的算法:最近邻算法和矩阵分解算法,其中最近邻算法包括基于用户的最近邻算法和基于产品的最近邻算法,两个算法的共同特点都是通过评分矩阵寻找到每个用户或者是每个产品的K个最近邻居,通过K个最近邻居的评分预测用户对产品的喜爱程度。其中基于用户的最近邻居算法假定:如果两个用户对相同的产品有相似的评分,那么他们很可能对其他产品也有相似的评分。而基于产品的最近邻居算法假定:如果很多用户对两个不同的产品有相似的评分,那么其他用户对这两个产品也应有相似的评分。
矩阵分解算法,如奇异值分解,通过对用户-产品评分矩阵进行降维处理,将用户和产品同时表示在一个相同的低维稠密空间,从而使用户和产品具有了可比性。产品向量的每一个维度表示产品的一个潜在属性。比如,当产品为电影时,矩阵分解模型可能将维度分解为喜剧片,动作片,科幻片以及现实主义电影或者浪漫主义电影等等。用户特征向量对应的维度表示了用户对该维度的喜爱程度。所以当用户和产品在对应低维度表示越接近时候,用户可能越喜欢该部电影,此时用户i对产品j的评分可以用用户特征向量Ui和产品特征向量Vj的线性点乘表示。
上述最近邻算法和矩阵分解算法从不同程度分析了用户-产品评分数据。最近邻居模型擅长于抓住评分数据中的局部性信息,它依据一些最重要的邻居信息预测评分,而忽略了大多数评分。因此该算法不能抓住评分矩阵中隐藏的全局微弱的关系。而矩阵分解模型具有能够抓住评分矩阵的全局结构,却不能像最近邻算法一样——抓住一小部分邻居之间存在的强关系。因此,本发明实施例考虑到能否通过标签数据查找用户或者产品的近邻,并将邻居信息引入到矩阵分解模型中,提高个性化推荐算法的准确度。
传统的协同过滤算法一般只利用到了显式的用户-产品评分矩阵,而在实际的推荐系统中,用户给产品打的标签信息也隐式反映用户的偏好,也概括化的反映了产品的特征信息。本发明实施例将这种标签信息也考虑进入用户-产品评分矩阵模型中,进一步提高了算法的精确度。
该实施例提出的一种结合用户-产品的评分数据和用户的标签数据对用户进行个性化推荐的方法的处理流程如图1所述,包括如下的处理步骤:
步骤11、建立用户-产品评分矩阵、用户-标签信息矩阵和产品-标签信息矩阵。
假设个性化推荐系统中分别有M个用户,N个产品,L个标签。RM*N为用户-产品评分矩阵,其中Rij表示用户i对产品j的评分。PM*L和QN*L分别表示用户-标签和产品-标签信息矩阵,Pil表示用户i与标签l的交互程度,Qjl表示产品j与标签l的交互程度,Pil(Qjl)的值越大,表明用户i(产品j)越喜爱此标签。
在实际的社会化标签系统中,用户不仅可以给他们看过的产品评分,还可以个性化的为产品打上标签。这些标签信息从一定程度上反映了用户的偏好和产品的属性信息。如:用户A观看了电影“罗马假日”,为其打上标签“奥黛丽赫本经典爱情”;用户B观看了电影“魂断蓝桥”,为其打上标签“爱情,经典,费雯丽,美国”。因为用户A和用户B同时拥有标签“经典”和“爱情”,所以我们可以认为A和B的偏好相似。而对于电影“罗马假日”和“魂断蓝桥”,它们拥有共同的标签“爱情,电影”,所以当用户C观看过“罗马假日”后,我们可以向他推荐“魂断蓝桥”。
在社会化标签系统中,“用户”,“产品”,“标签”构成了其最基本的三项元素。这三者之间的关系可以用一个三元图来表示。我们分别沿着“产品”和“用户”这两个维度将三元图分解为二元图,相应得到用户-标签信息矩阵P和产品-标签信息矩阵Q。
对于用户-标签信息矩阵P,Pil是用户i对标签l的权重值,Pil的具体计算公式是:
Pil=tf(i,l)*ln(L/d(fl))    (1)
其中tf(i,l)表示用户i的标签记录中标签l出现的归一化频率,df(l)表示使用过标签l的用户数。
相应的,我们可以根据公式(1)可以计算产品-标签矩阵Q,Qjl是产品j对标签l的权重值,Qjl的具体计算公式是:
Qjl=tf(j,l)*ln(L/df(l))
其中tf(j,l)表示产品j的标签记录中标签l出现的归一化频率,df(l)表示使用过标签l的产品数。
本发明实施例提出了最近邻居矩阵分解算法,该算法目的是通过分析矩阵P,Q和R获得一个高质量的D维的用户特征矩阵UD*M和产品特征矩阵VD*N,其中Ui和Vj分别代表了用户i的特征向量和产品j的特征向量。但是与传统矩阵分解算法不同的是,最近邻居矩阵分解算法考虑了邻居信息——相似的用户/产品具有相似的特征表示,NUi/NVj分别表示用户i/产品j的邻居集合。算法的目的就是使用低维的表示
Figure BDA0000134819370000071
逼近真实的评分矩阵R。
在实际应用中,从后端数据库中取出所有的用户对产品的评分记录以及用户对产品的标签记录后,需要对数据进行预处理。对于某些评分项目非常少的用户或者是产品,由于可利用的信息非常少,无法准确的进行推荐,因此我们必须剔除这部分数据。在评分数据中,我们挑选出的每个用户必须至少对3项产品进行评分,每个产品至少被3个用户评分过。由于标签的随意性,必须预处理选择有代表性的标签,本发明实施例要求对于每个标签至少同时被3个不同的用户和产品拥有过。
步骤12、利用标签数据分别计算用户之间和产品之间的相似度,根据相似度信息获取每个用户和每项产品的邻居集合。
利用公式(1),根据所述用户-标签矩阵P分别得到用户i在标签空间中对应的向量
Figure BDA0000134819370000072
用户j在标签空间中对应的向量用户i和用户j之间的相似度s(i,j)可以用这两个向量之间的cosine夹角来衡量:
s ( i , j ) = cos ( i → , j → ) = i → × j → | | i → | | × | | j → | | - - - ( 2 )
相应的,每个产品i或者j都可以看做L维标签空间的一个向量,产品i和产品j之间的相似度t(i,j)可以用这两个向量之间的cosine夹角来衡量:
t ( i , j ) = cos ( i → , j → ) = i → × j → | | i → | | × | | j → | |
根据上述s(i,j)可以建立用户相似度矩阵S,根据上述t(i,j)可以建立产品相似度矩阵T。
在电子商务网站中,我们仅仅需要一小部分的邻居信息。对于每个用户i,我们仅保存与其相似度最高的K个邻居集合NUi,并计算他们与用户i的相似度。同时对于每项产品j,我们也计算出与其相似度最高的K个邻居集合NVj并保存它们与产品j的相似度。为了后续计算上的方便,我们将每个用户的K个邻居集合的相似度归一化:
∀ j ∈ N Ui s ( i , j ) = s ( i , j ) Σ l ∈ Nui s ( i , l ) - - - ( 3 )
上述等式确保了∑l∈Nuis(i,j)=1。
同样的,我们将每个产品的K个邻居集合的相似度归一化:
∀ j ∈ Nvj t ( i , j ) = t ( i , j ) Σ l ∈ Nvj t ( j , l )
上述等式确保了∑l∈Nvjt(j,l)=1。
步骤13、基于所述用户和产品的邻居集合信息,采取最近邻居矩阵分解算法计算出用户和产品的特征向量。
将用户i的邻居集合中的所有用户的特征向量的平均值加上一个随机高斯噪声得到用户i的特征向量Ui,用户i的特征向量Ui的计算方法如下:
U i = Σ l ∈ Nui s ( i , j ) * U l + θ , θ ~ N ( 0 , σ U 2 )
上述等式中噪声θ符合均值为0,方差为σ2的高斯分布。假设系统中有M个用户,用户之间的相似度s已知,对每个用户的特征向量我们均采用上述等式计算,可得到如下公式:
p ( U | s , σ U 2 ) = Π i = 1 M N ( Σ i ∈ Nui s ( i , l ) * U l , σ u 2 ) - - - ( 4 )
公式(4)表示了用户特征矩阵U的先验概率密度函数。
将产品j的邻居集合中的所有产品的特征向量的平均值加上一个随机高斯噪声得到产品j的特征向量,产品j的特征向量Vj的计算方法如下:
V j = Σ l ∈ Nvj t ( j , l ) * V l + θ , θ ~ N ( 0 , σ V 2 )
上述等式中产品特征向量V的偏差θ符合均值为0,方差为σ2v的高斯分布。假设系统中有N项产品,产品之间相似度t已知,对每项产品我们均采用上述等式计算,可得到如下公式:
p ( V | T , σ V 2 ) = Π j = 1 N N ( Σ j ∈ Nvj t ( j , l ) * V l , σ V 2 ) - - - ( 5 )
公式(5)刻画了产品特征矩阵V的先验概率密度函数。
最近邻居矩阵分解模型的核心思想是将利用标签数据得到的相似度信息结合到传统的矩阵分解模型中。在得到上述用户特征矩阵U和产品特征矩阵V的情况下,用户-产品评分矩阵R的似然函数p(R|U,V,σ2)的计算方法如下:
p ( R | U , V , σ 2 ) = Π i = 1 M Π j = 1 N [ N ( R ij | U i T V j , σ 2 ) ] Yij - - - ( 6 )
上述公式6中的R为用户-产品评分矩阵,U为用户特征矩阵,V为产品特征矩阵,表示用户i的特征向量Ui的转置,N(x|μ,σ2)是均值为u,方差为σ2的高斯分布,Y是指示矩阵,当用户i对产品j评过分时,Yij=1;否则Yij=0。
在已知用户-产品评分矩阵R,用户相似度矩阵S和产品相似度矩阵T的情况下,通过贝叶斯推断:后验概率∝先验概率*似然函数。其中用户和产品的特征向量U和V的先验概率密度函数分别在公式(4)和公式(5)中给出,公式(6)给出了评分数据R的似然函数因此我们获得了以下关于用户和产品特征矩阵的后验概率分布:
p ( U , V | R , σ 2 , σ U 2 , σ V 2 ) ∝ p ( R | U , V , σ 2 ) p ( U | S , σ U 2 ) p ( V | T , σ V 2 )
= Π i = 1 M Π j = 1 N [ N ( R ij | U i T V j , σ 2 ) ] Yij - - - ( 7 )
* Π i = 1 M N ( Σ l ∈ Nui s ( i , l ) * U l , σ U 2 ) * Π j = 1 n N ( Σ j ∈ Nvj t ( j , l ) * V l , σ V 2 )
上述公式(7)的计算原理示意图如图2所示,从图2可以明显的看到,与传统的矩阵分解算法不同的是,用户和产品的特征向量不仅受评分矩阵的影响,而且受到他们的邻居集合的影响。通过求所述用户和产品特征矩阵的后验概率分布的最大值得到所述用户和产品特征矩阵的具体数值。
对公式(7)取对数,得到的关于用户和产品特征向量的后验概率如下:
ln p ( U , V | R , σ 2 , σ U 2 , σ V 2 ) = - 1 2 σ 2 Σ i = 1 M Σ j = 1 N Y ij ( R ij - U i T V j ) 2
- 1 2 σ U 2 Σ i = 1 M ( U i - Σ l ∈ Nui s ( i , l ) * U l ) T ( U i - Σ l ∈ Nui s ( i , l ) * U l ) - - - ( 8 )
- 1 2 σ V 2 Σ j = 1 N ( V j - Σ l ∈ Nvj t ( j , l ) * V l ) T ( V j - Σ l ∈ Nvj t ( j , l ) * V l ) + C
其中,C是一个不受用户和产品特征向量影响的常数。固定高斯分布的超参数σ2,σ2 U和σ2 V,最大化(8)等同于最小化下面的平方和误差函数E:
E = Σ i = 1 M Σ j = 1 N Y ij ( R ij - U i T V j ) 2
+ λ U Σ i = 1 M ( U i - Σ l ∈ Nui s ( i , l ) * U l ) T ( U i - Σ l ∈ Nui s ( i , l ) * U l ) - - - ( 9 )
+ λ V Σ j = 1 N ( V j - Σ l ∈ Nvj t ( j , l ) * V l ) T ( V j - Σ l ∈ Nvj t ( j , l ) * V l )
在上述等式中, λ U = σ 2 σ U 2 , λ V = σ 2 σ V 2 .
因为等式(9)是同时关于U和V的一个平方和误差,所以无法找到最优解。但是我们可以通过对每个用户和产品特征向量采取梯度下降法,求得局部最优解:
∂ E ∂ Ui = Σ j = 1 N ( R ij - U i T V j ) ( - V j ) + λ U ( U i - Σ l ∈ Nui s ( i , l ) * U l ) - - - ( 10 )
- λ U Σ l ∈ Nui s ( l , i ) ( U l - Σ j ∈ Nul s ( j , l ) * U j )
∂ E ∂ V j = Σ i = 1 M ( R ij - U i T V j ) ( - U i ) + λ V ( V j - Σ l ∈ Nvj t ( j , l ) * V l ) - - - ( 11 )
- λ V Σ j ∈ NVj t ( l , j ) ( V l - Σ i ∈ Nvl t ( i , l ) * V i )
在实际应用中,上述Ui和Vj的计算过程是一个多次迭代的过程,该多次迭代的过程如下:
初始化U和V为小的随机变量
Figure BDA0000134819370000111
其中,stepsize设定为一个很小的常数,如0.001。MAX_LOOP为最大循环迭代次数,在算法的实践过程中,通常迭代100次左右即可收敛。Ui和Vj的求解过程实际上是一个逐步逼近的过程,Ui和Vj均取最后一次迭代的结果作为最终值。将所有用户的Ui和Vj组成低维、稠密的用户、产品特征矩阵U和V。
步骤14、根据用户和产品的特征向量,预测用户对未评分产品的评分,对用户进行个性化产品推荐。
对于每个用户,预测其对未评分产品的评分,选取得分最高的前设定数量该(K)个产品作为候选推荐列表。
我们利用上一步得到的用户特征向量Ui、产品特征向量Vj预测每个用户对未评分产品的预测评分,例如:对于用户i,产品j是其未评分产品,则预测评分
Figure BDA0000134819370000112
并按预测得分从高到低选择前L个产品,作为每个用户的候选推荐列表。
从上述用户的候选推荐列表中,按照一定的规则进一步挑选K个产品进行推荐,其中K<L,挑选的原则可以按照得分高低,也可以按照产品主题覆盖范围的广泛性等。
用户的体验反馈数据对提高推荐效果有着十分重要的作用。比如:可以通过用户是否浏览购买推荐产品来判断用户对推荐的喜爱程度,并针对这些用户反馈数据相应的对推荐算法进行修改,进一步提高用户对推荐系统的满意程度。
实施例二
该实施例提供了一种对用户进行个性化推荐的装置,其具体结构如图3所示,包括如下的模块:
邻居集合获取模块31,用于利用用户的标签数据计算用户之间的相似度,利用产品的标签数据计算产品之间的相似度,根据相似度信息获取每个用户和每项产品的邻居集合;
特征向量获取模块32,用于基于所述用户和产品的邻居集合信息,采取最近邻居矩阵分解算法计算出用户和产品的特征向量;
个性化推荐处理模块33,用于根据用户和产品的特征向量,预测用户对未评分产品的评分数据,根据所述评分数据对用户进行个性化产品推荐。
具体的,所述的邻居集合获取模块31,还用于对于用户-标签信息矩阵P,Pil是用户i对标签l的权重值,Pil的具体计算公式是:
Pil=tf(i,l)*ln(L/d(fl))
其中tf(i,l)表示用户i的标签记录中标签l出现的归一化频率,df(l)表示使用过标签l的用户数;
对于产品-标签矩阵Q,Qjl是产品j对标签l的权重值,Qjl的具体计算公式是:
Qjl=tf(j,l)*ln(L/df(l))
其中tf(j,l)表示产品j的标签记录中标签l出现的归一化频率,df(l)表示使用过标签l的产品数;
根据所述用户-标签矩阵P分别得到用户i在标签空间中对应的向量
Figure BDA0000134819370000131
用户j在标签空间中对应的向量
Figure BDA0000134819370000132
用户i和用户j之间的相似度s(i,j)的计算方法如下:
s ( i , j ) = cos ( i → , j → ) = i → × j → | | i → | | × | | j → | | - - - ( 2 )
对于用户i,选取与其相似度最高的设定数量个用户组成邻居集合NUi,并计算所述设定数量个用户与用户i之间的相似度,并将所述设定数量个用户与用户i之间的相似度归一化:
∀ j ∈ N Ui s ( i , j ) = s ( i , j ) Σ l ∈ Nui s ( i , l )
上述等式确保了∑l∈Nuis(i,j)=1;
根据所述产品-标签矩阵P分别得到产品i在标签空间中对应的向量
Figure BDA0000134819370000136
产品j在标签空间中对应的向量
Figure BDA0000134819370000137
产品i和产品j之间的相似度s(i,j)的计算方法如下:
t ( i , j ) = cos ( i → , j → ) = i → × j → | | i → | | × | | j → | |
对于产品i,选取与其相似度最高的设定数量个产品组成邻居集合Nvj,并计算所述设定数量个产品与产品i之间的相似度,并将所述设定数量个产品与产品i之间的相似度归一化:
∀ j ∈ Nvj t ( i , j ) = t ( i , j ) Σ l ∈ Nvj t ( j , l )
上述等式确保了∑l∈Nvjt(j,l)=1。
具体的,所述的特征向量获取模块32,还用于将用户i的邻居集合中的所有用户的特征向量的平均值加上一个随机高斯噪声得到用户i的特征向量Ui,计算方法如下:
U i = Σ l ∈ Nui s ( i , j ) * U l + θ , θ ~ N ( 0 , σ U 2 )
所述随机高斯噪声θ符合均值为0,方差为σ2的高斯分布
Figure BDA0000134819370000141
将所有用户的特征向量组成用户特征矩阵U,
当系统中有M个用户,每个用户之间的相似度已知,则用户特征矩阵U的先验概率密度函数
Figure BDA0000134819370000142
的计算方法如下:
p ( U | s , σ U 2 ) = Π i = 1 M N ( Σ i ∈ Nui s ( i , l ) * U l , σ u 2 )
将产品j的邻居集合中的所有产品的特征向量的平均值加上一个随机高斯噪声得到产品j的特征向量,产品j的特征向量Vj的计算方法如下:
V j = Σ l ∈ Nvj t ( j , l ) * V l + θ , θ ~ N ( 0 , σ V 2 )
所述随机高斯噪声θ符合均值为0,方差为σ2的高斯分布
Figure BDA0000134819370000145
将所有产品的特征向量组成产品特征矩阵U;
当系统中有N个产品,每个产品之间的相似度已知,则产品特征矩阵V的先验概率密度函数
Figure BDA0000134819370000146
的计算方法如下:
p ( V | T , σ V 2 ) = Π j = 1 N N ( Σ j ∈ Nvj t ( j , l ) * V l , σ V 2 )
根据所述用户特征矩阵U和产品特征矩阵V,计算出用户-产品评分矩阵R的似然函数p(R|U,V,σ2):
p ( R | U , V , σ 2 ) = Π i = 1 M Π j = 1 N [ N ( R ij | U i T V j , σ 2 ) ] Yij
所述Y是指示矩阵,当用户i对产品j评过分时,Yij=1;否则Yij=0;
根据所述
Figure BDA0000134819370000149
p(R|U,V,σ2)之间的乘积得到用户和产品特征矩阵的后验概率分布,通过求所述用户和产品特征矩阵的后验概率分布的最大值得到所述用户和产品特征矩阵的具体数值。
具体的,所述的特征向量获取模块32,还用于将所有用户之间的相似度的值组成用户相似度矩阵S,将所有产品之间的相似度的值组成产品相似度矩阵T,根据所述用户-产品评分矩阵R,用户相似度矩阵S和产品相似度矩阵T的情况下,通过贝叶斯推断得到用户和产品特征矩阵的后验概率分布
Figure BDA0000134819370000151
p ( U , V | R , σ 2 , σ U 2 , σ V 2 ) ∝ p ( R | U , V , σ 2 ) p ( U | S , σ U 2 ) p ( V | T , σ V 2 )
= Π i = 1 M Π j = 1 N [ N ( R ij | U i T V j , σ 2 ) ] Yij
* Π i = 1 M N ( Σ l ∈ Nui s ( i , l ) * U l , σ U 2 ) * Π j = 1 n N ( Σ j ∈ Nvj t ( j , l ) * V l , σ V 2 )
对上式取对数,得到:
ln p ( U , V | R , σ 2 , σ U 2 , σ V 2 ) = - 1 2 σ 2 Σ i = 1 M Σ j = 1 N Y ij ( R ij - U i T V j ) 2
- 1 2 σ U 2 Σ i = 1 M ( U i - Σ l ∈ Nui s ( i , l ) * U l ) T ( U i - Σ l ∈ Nui s ( i , l ) * U l )
- 1 2 σ V 2 Σ j = 1 N ( V j - Σ l ∈ Nvj t ( j , l ) * V l ) T ( V j - Σ l ∈ Nvj t ( j , l ) * V l ) + C
其中,所述C是一个不受用户和产品特征向量影响的常数,所述σ2,σ2 U和σ2 V为设定的高斯分布的超参数;
最大化所述
Figure BDA0000134819370000158
等同于最小化平方和误差函数E,其中:
E = Σ i = 1 M Σ j = 1 N Y ij ( R ij - U i T V j ) 2
+ λ U Σ i = 1 M ( U i - Σ l ∈ Nui s ( i , l ) * U l ) T ( U i - Σ l ∈ Nui s ( i , l ) * U l ) - - - ( 9 )
+ λ V Σ j = 1 N ( V j - Σ l ∈ Nvj t ( j , l ) * V l ) T ( V j - Σ l ∈ Nvj t ( j , l ) * V l )
所述 λ U = σ 2 σ U 2 , λ V = σ 2 σ V 2
对每个用户的特征向量Ui、每个产品的特征向量Vj采取梯度下降法,求得局部最优解:
∂ E ∂ Ui = Σ j = 1 N ( R ij - U i T V j ) ( - V j ) + λ U ( U i - Σ l ∈ Nui s ( i , l ) * U l )
- λ U Σ j ∈ NUj s ( l , j ) ( V l - Σ j ∈ Nvl s ( j , l ) * U i )
∂ E ∂ V j = Σ i = 1 M ( R ij - U i T V j ) ( - U i ) + λ V ( V j - Σ l ∈ Nvj t ( j , l ) * V l )
- λ V Σ j ∈ NVj t ( l , j ) ( V l - Σ i ∈ Nvl t ( i , l ) * V i )
通过多次迭代的过程求得Ui和Vj的最终值,该多次迭代的过程如下:
初始化U和V为小的随机变量
Figure BDA0000134819370000163
其中,stepsize设定为一个很小的常数,如0.001。MAX_LOOP为最大循环迭代次数,在算法的实践过程中,通常迭代100次左右即可收敛。Ui和Vj的求解过程实际上是一个逐步逼近的过程,Ui和Vj均取最后一次迭代的结果作为最终值。
具体的,所述的个性化推荐处理模块33,还用于设用户i的未评分产品j的预测评分为Rij,Rij的计算方法为:
R ij = U i T V j
Ui为用户i的特征向量,Vj为产品j的特征向量,
按预测得分从高到低选择设定数量个产品作为用户i的推荐产品列表。
应用本发明实施例的装置对用户进行个性化推荐的具体处理过程与前述方法实施例类似,此处不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
综上所述,本发明实施例提出了一种新型的个性化推荐算法框架,该算法能整合用户的评分数据和标签数据,在矩阵分解模型中引入了标签信息、邻居集合信息,因此既拥有矩阵分解模型的优点,又能够在全局结构中抓住邻居间的强关系。在公开数据集上的实验结果表明,本发明实施例的最近邻居矩阵分解算法远远优于现今最流行的矩阵分解算法和最近邻算法。
通过在经典的Movielens数据集上实验,本发明实施例的最近邻居矩阵分解算法比基于用户的最近邻居算法,基于产品的最近邻居算法和概率矩阵分解算法精确度分别提高了8%,3.5%和5%左右。(值得注意的是,这是一个非常大的准确度提升。Netflix比赛为第一个将他们的影片推荐系统精确度提高10%的队伍100万美元,而这历时三年被一个由工程师,统计学家,研究专家组成的团队获得。)
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (10)

1.一种对用户进行个性化推荐的方法,其特征在于,包括:
利用用户的标签数据计算用户之间的相似度,利用产品的标签数据计算产品之间的相似度,根据相似度信息获取每个用户和每项产品的邻居集合;
基于所述用户和产品的邻居集合信息,采取最近邻居矩阵分解算法计算出用户和产品的特征向量;
根据用户和产品的特征向量,预测用户对未评分产品的评分数据,根据所述评分数据对用户进行个性化产品推荐。
2.根据权利要求1所述的对用户进行个性化推荐的方法,其特征在于,所述的利用用户的标签数据计算用户之间的相似度,利用产品的标签数据计算产品之间的相似度,根据相似度信息获取每个用户和每项产品的邻居集合,包括:
对于用户-标签信息矩阵P,Pil是用户i对标签l的权重值,Pil的具体计算公式是:
Pil=tf(i,l)*ln(L/d(fl))
其中tf(i,l)表示用户i的标签记录中标签l出现的归一化频率,df(l)表示使用过标签l的用户数;
对于产品-标签矩阵Q,Qjl是产品j对标签l的权重值,Qjl的具体计算公式是:
Qjl=tf(j,l)*ln(L/df(l))
其中tf(j,l)表示产品j的标签记录中标签l出现的归一化频率,df(l)表示使用过标签l的产品数;
根据所述用户-标签矩阵P分别得到用户i在标签空间中对应的向量用户j在标签空间中对应的向量
Figure FDA0000134819360000012
用户i和用户j之间的相似度s(i,j)的计算方法如下:
s ( i , j ) = cos ( i → , j → ) = i → × j → | | i → | | × | | j → | |
对于用户i,选取与其相似度最高的设定数量个用户组成邻居集合NUi,并计算所述设定数量个用户与用户i之间的相似度,并将所述设定数量个用户与用户i之间的相似度归一化:
∀ j ∈ N Ui s ( i , j ) = s ( i , j ) Σ l ∈ Nui s ( i , l )
l∈Nuis(i,j)=1;
根据所述产品-标签矩阵P分别得到产品i在标签空间中对应的向量产品j在标签空间中对应的向量
Figure FDA0000134819360000024
产品i和产品j之间的相似度s(i,j)的计算方法如下:
t ( i , j ) = cos ( i → , j → ) = i → × j → | | i → | | × | | j → | |
对于产品i,选取与其相似度最高的设定数量个产品组成邻居集合Nvj,并计算所述设定数量个产品与产品i之间的相似度,并将所述设定数量个产品与产品i之间的相似度归一化:
∀ j ∈ Nvj t ( i , j ) = t ( i , j ) Σ l ∈ Nvj t ( j , l )
上述等式确保了∑l∈Nvjt(j,l)=1。
3.根据权利要求1所述的对用户进行个性化推荐的方法,其特征在于,所述的基于所述用户和产品的邻居集合信息,采取最近邻居矩阵分解算法计算出用户和产品的特征向量,包括:
将用户i的邻居集合中的所有用户的特征向量的平均值加上一个随机高斯噪声得到用户i的特征向量Ui,计算方法如下:
U i = Σ l ∈ Nui s ( i , j ) * U l + θ , θ ~ N ( 0 , σ U 2 )
所述随机高斯噪声θ符合均值为0,方差为σ2的高斯分布
Figure FDA0000134819360000029
将所有用户的特征向量组成用户特征矩阵U,
当系统中有M个用户,每个用户之间的相似度已知,则用户特征矩阵U的先验概率密度函数
Figure FDA0000134819360000031
的计算方法如下:
p ( U | s , σ U 2 ) = Π i = 1 M N ( Σ i ∈ Nui s ( i , l ) * U l , σ u 2 )
将产品j的邻居集合中的所有产品的特征向量的平均值加上一个随机高斯噪声得到产品j的特征向量,产品j的特征向量Vj的计算方法如下:
V j = Σ l ∈ Nvj t ( j , l ) * V l + θ , θ ~ N ( 0 , σ V 2 )
所述随机高斯噪声θ符合均值为0,方差为σ2的高斯分布
Figure FDA0000134819360000034
将所有产品的特征向量组成产品特征矩阵U;
当系统中有N个产品,每个产品之间的相似度已知,则产品特征矩阵V的先验概率密度函数
Figure FDA0000134819360000035
的计算方法如下:
p ( V | T , σ V 2 ) = Π j = 1 N N ( Σ j ∈ Nvj t ( j , l ) * V l , σ V 2 )
根据所述用户特征矩阵U和产品特征矩阵V,计算出用户-产品评分矩阵R的似然函数p(R|U,V,σ2):
p ( R | U , V , σ 2 ) = Π i = 1 M Π j = 1 N [ N ( R ij | U i T V j , σ 2 ) ] Yij
所述Y是指示矩阵,当用户i对产品j评过分时,Yij=1;否则Yij=0;
根据所述
Figure FDA0000134819360000038
p(R|U,V,σ2)之间的乘积得到用户和产品特征矩阵的后验概率分布,通过求所述用户和产品特征矩阵的后验概率分布的最大值得到所述用户和产品特征矩阵的具体数值。
4.根据权利要求3所述的对用户进行个性化推荐的方法,其特征在于,所述的根据所述
Figure FDA0000134819360000039
p(R|U,V,σ2)之间的乘积得到用户和产品特征矩阵的后验概率分布,通过求所述用户和产品特征矩阵的后验概率分布的最大值得到所述用户和产品特征矩阵的具体数值,包括:
将所有用户之间的相似度的值组成用户相似度矩阵S,将所有产品之间的相似度的值组成产品相似度矩阵T,根据所述用户-产品评分矩阵R,用户相似度矩阵S和产品相似度矩阵T的情况下,通过贝叶斯推断得到用户和产品特征矩阵的后验概率分布
Figure FDA0000134819360000041
p ( U , V | R , σ 2 , σ U 2 , σ V 2 ) ∝ p ( R | U , V , σ 2 ) p ( U | S , σ U 2 ) p ( V | T , σ V 2 )
= Π i = 1 M Π j = 1 N [ N ( R ij | U i T V j , σ 2 ) ] Yij
* Π i = 1 M N ( Σ l ∈ Nui s ( i , l ) * U l , σ U 2 ) * Π j = 1 n N ( Σ j ∈ Nvj t ( j , l ) * V l , σ V 2 )
对上式取对数,得到:
ln p ( U , V | R , σ 2 , σ U 2 , σ V 2 ) = - 1 2 σ 2 Σ i = 1 M Σ j = 1 N Y ij ( R ij - U i T V j ) 2
- 1 2 σ U 2 Σ i = 1 M ( U i - Σ l ∈ Nui s ( i , l ) * U l ) T ( U i - Σ l ∈ Nui s ( i , l ) * U l )
- 1 2 σ V 2 Σ j = 1 N ( V j - Σ l ∈ Nvj t ( j , l ) * V l ) T ( V j - Σ l ∈ Nvj t ( j , l ) * V l ) + C
其中,所述C是一个不受用户和产品特征向量影响的常数,所述σ2,σ2 U和σ2 V为设定的高斯分布的超参数;
最大化所述
Figure FDA0000134819360000048
等同于最小化平方和误差函数E,其中:
E = Σ i = 1 M Σ j = 1 N Y ij ( R ij - U i T V j ) 2
+ λ U Σ i = 1 M ( U i - Σ l ∈ Nui s ( i , l ) * U l ) T ( U i - Σ l ∈ Nui s ( i , l ) * U l )
+ λ V Σ j = 1 N ( V j - Σ l ∈ Nvj t ( j , l ) * V l ) T ( V j - Σ l ∈ Nvj t ( j , l ) * V l )
所述 λ U = σ 2 σ U 2 , λ V = σ 2 σ V 2
对每个用户的特征向量Ui、每个产品的特征向量Vj采取梯度下降法,求得局部最优解:
∂ E ∂ Ui = Σ j = 1 N ( R ij - U i T V j ) ( - V j ) + λ U ( U i - Σ l ∈ Nui s ( i , l ) * U l )
- λ U Σ l ∈ Nui s ( l , i ) ( U l - Σ j ∈ Nul s ( j , l ) * U j )
∂ E ∂ V j = Σ i = 1 M ( R ij - U i T V j ) ( - U i ) + λ V ( V j - Σ l ∈ Nvj t ( j , l ) * V l )
- λ V Σ j ∈ NVj t ( l , j ) ( V l - Σ i ∈ Nvl t ( i , l ) * V i )
通过多次迭代的过程求解所述Ui和Vj,所述Ui和Vj均取最后一次迭代的结果作为最终值。
5.根据权利要求1、2、3或4所述的对用户进行个性化推荐的方法,其特征在于,所述的根据用户和产品的特征向量,预测用户对未评分产品的评分数据,根据所述评分数据对用户进行个性化产品推荐,包括:
设用户i的未评分产品j的预测评分为Rij,Rij的计算方法为:
R ij = U i T V j
Ui为用户i的特征向量,Vj为产品j的特征向量,
按预测得分从高到低选择设定数量个产品作为用户i的推荐产品列表。
6.一种对用户进行个性化推荐的装置,其特征在于,包括:
邻居集合获取模块,用于利用用户的标签数据计算用户之间的相似度,利用产品的标签数据计算产品之间的相似度,根据相似度信息获取每个用户和每项产品的邻居集合;
特征向量获取模块,用于基于所述用户和产品的邻居集合信息,采取最近邻居矩阵分解算法计算出用户和产品的特征向量;
个性化推荐处理模块,用于根据用户和产品的特征向量,预测用户对未评分产品的评分数据,根据所述评分数据对用户进行个性化产品推荐。
7.根据权利要求6所述的对用户进行个性化推荐的装置,其特征在于:
所述的邻居集合获取模块,还用于对于用户-标签信息矩阵P,Pil是用户i对标签l的权重值,Pil的具体计算公式是:
Pil=tf(i,l)*ln(L/d(fl))
其中tf(i,l)表示用户i的标签记录中标签l出现的归一化频率,df(l)表示使用过标签l的用户数;
对于产品-标签矩阵Q,Qjl是产品j对标签l的权重值,Qjl的具体计算公式是:
Qjl=tf(j,l)*ln(L/df(l))
其中tf(j,l)表示产品j的标签记录中标签l出现的归一化频率,df(l)表示使用过标签l的产品数;
根据所述用户-标签矩阵P分别得到用户i在标签空间中对应的向量
Figure FDA0000134819360000061
用户j在标签空间中对应的向量
Figure FDA0000134819360000062
用户i和用户j之间的相似度s(i,j)的计算方法如下:
s ( i , j ) = cos ( i → , j → ) = i → × j → | | i → | | × | | j → | |
对于用户i,选取与其相似度最高的设定数量个用户组成邻居集合NUi,并计算所述设定数量个用户与用户i之间的相似度,并将所述设定数量个用户与用户i之间的相似度归一化:
∀ j ∈ N Ui s ( i , j ) = s ( i , j ) Σ l ∈ Nui s ( i , l )
l∈Nuis(i,j)=1;
根据所述产品-标签矩阵P分别得到产品i在标签空间中对应的向量
Figure FDA0000134819360000066
产品j在标签空间中对应的向量
Figure FDA0000134819360000067
产品i和产品j之间的相似度s(i,j)的计算方法如下:
t ( i , j ) = cos ( i → , j → ) = i → × j → | | i → | | × | | j → | |
对于产品i,选取与其相似度最高的设定数量个产品组成邻居集合Nvj,并计算所述设定数量个产品与产品i之间的相似度,并将所述设定数量个产品与产品i之间的相似度归一化:
∀ j ∈ Nvj t ( i , j ) = t ( i , j ) Σ l ∈ Nvj t ( j , l )
上述等式确保了∑l∈Nvjt(j,l)=1。
8.根据权利要求6所述的对用户进行个性化推荐的装置,其特征在于:
所述的特征向量获取模块,还用于将用户i的邻居集合中的所有用户的特征向量的平均值加上一个随机高斯噪声得到用户i的特征向量Ui,计算方法如下:
U i = Σ l ∈ Nui s ( i , j ) * U l + θ , θ ~ N ( 0 , σ U 2 )
所述随机高斯噪声θ符合均值为0,方差为σ2的高斯分布
Figure FDA0000134819360000072
将所有用户的特征向量组成用户特征矩阵U,
当系统中有M个用户,每个用户之间的相似度已知,则用户特征矩阵U的先验概率密度函数的计算方法如下:
p ( U | s , σ U 2 ) = Π i = 1 M N ( Σ i ∈ Nui s ( i , l ) * U i , σ u 2 )
将产品j的邻居集合中的所有产品的特征向量的平均值加上一个随机高斯噪声得到产品j的特征向量,产品j的特征向量Vj的计算方法如下:
V j = Σ l ∈ Nvj t ( j , l ) * V l + θ , θ ~ N ( 0 , σ V 2 )
所述随机高斯噪声θ符合均值为0,方差为σ2的高斯分布
Figure FDA0000134819360000076
将所有产品的特征向量组成产品特征矩阵U;
当系统中有N个产品,每个产品之间的相似度已知,则产品特征矩阵V的先验概率密度函数
Figure FDA0000134819360000077
的计算方法如下:
p ( V | T , σ V 2 ) = Π j = 1 N N ( Σ j ∈ Nvj t ( j , l ) * V l , σ V 2 )
根据所述用户特征矩阵U和产品特征矩阵V,计算出用户-产品评分矩阵R的似然函数p(R|U,V,σ2):
p ( R | U , V , σ 2 ) = Π i = 1 M Π j = 1 N [ N ( R ij | U i T V j , σ 2 ) ] Yij
所述Y是指示矩阵,当用户i对产品j评过分时,Yij=1;否则Yij=0;
根据所述
Figure FDA0000134819360000081
p(R|U,V,σ2)之间的乘积得到用户和产品特征矩阵的后验概率分布,通过求所述用户和产品特征矩阵的后验概率分布的最大值得到所述用户和产品特征矩阵的具体数值。
9.根据权利要求8所述的对用户进行个性化推荐的装置,其特征在于:
所述的特征向量获取模块,还用于将所有用户之间的相似度的值组成用户相似度矩阵S,将所有产品之间的相似度的值组成产品相似度矩阵T,根据所述用户-产品评分矩阵R,用户相似度矩阵S和产品相似度矩阵T的情况下,通过贝叶斯推断得到用户和产品特征矩阵的后验概率分布
Figure FDA0000134819360000082
p ( U , V | R , σ 2 , σ U 2 , σ V 2 ) ∝ p ( R | U , V , σ 2 ) p ( U | S , σ U 2 ) p ( V | T , σ V 2 )
= Π i = 1 M Π j = 1 N [ N ( R ij | U i T V j , σ 2 ) ] Yij
* Π i = 1 M N ( Σ l ∈ Nui s ( i , l ) * U l , σ U 2 ) * Π j = 1 n N ( Σ j ∈ Nvj t ( j , l ) * V l , σ V 2 )
对上式取对数,得到:
ln p ( U , V | R , σ 2 , σ U 2 , σ V 2 ) = - 1 2 σ 2 Σ i = 1 M Σ j = 1 N Y ij ( R ij - U i T V j ) 2
- 1 2 σ U 2 Σ i = 1 M ( U i - Σ l ∈ Nui s ( i , l ) * U l ) T ( U i - Σ l ∈ Nui s ( i , l ) * U l )
- 1 2 σ V 2 Σ j = 1 N ( V j - Σ l ∈ Nvj t ( j , l ) * V l ) T ( V j - Σ l ∈ Nvj t ( j , l ) * V l ) + C
其中,所述C是一个不受用户和产品特征向量影响的常数,所述σ2,σ2 U和σ2 V为设定的高斯分布的超参数;
最大化所述等同于最小化平方和误差函数E,其中:
E = Σ i = 1 M Σ j = 1 N Y ij ( R ij - U i T V j ) 2
+ λ U Σ i = 1 M ( U i - Σ l ∈ Nui s ( i , l ) * U l ) T ( U i - Σ l ∈ Nui s ( i , l ) * U l )
+ λ V Σ j = 1 N ( V j - Σ l ∈ Nvj t ( j , l ) * V l ) T ( V j - Σ l ∈ Nvj t ( j , l ) * V l )
所述 λ U = σ 2 σ U 2 , λ V = σ 2 σ V 2
对每个用户的特征向量Ui、每个产品的特征向量Vj采取梯度下降法,求得局部最优解:
∂ E ∂ Ui = Σ j = 1 N ( R ij - U i T V j ) ( - V j ) + λ U ( U i - Σ l ∈ Nui s ( i , l ) * U l )
- λ U Σ l ∈ Nui s ( l , i ) ( U l - Σ j ∈ Nul s ( j , l ) * U j )
∂ E ∂ V j = Σ i = 1 M ( R ij - U i T V j ) ( - U i ) + λ V ( V j - Σ l ∈ Nvj t ( j , l ) * V l )
- λ V Σ j ∈ NVj t ( l , j ) ( V l - Σ i ∈ Nvl t ( i , l ) * V i )
通过多次迭代的过程求解所述ui和Vj,所述Ui和Vj均取最后一次迭代的结果作为最终值。
10.根据权利要求6至9任一项所述的对用户进行个性化推荐的装置,其特征在于:
所述的个性化推荐处理模块,还用于设用户i的未评分产品j的预测评分为Rij,Rij的计算方法为:
R ij = U i T V j
Ui为用户i的特征向量,Vj为产品j的特征向量,
按预测得分从高到低选择设定数量个产品作为用户i的推荐产品列表。
CN201210028896.5A 2012-02-09 2012-02-09 对用户进行个性化推荐的方法和装置 Active CN103246672B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210028896.5A CN103246672B (zh) 2012-02-09 2012-02-09 对用户进行个性化推荐的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210028896.5A CN103246672B (zh) 2012-02-09 2012-02-09 对用户进行个性化推荐的方法和装置

Publications (2)

Publication Number Publication Date
CN103246672A true CN103246672A (zh) 2013-08-14
CN103246672B CN103246672B (zh) 2016-06-08

Family

ID=48926196

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210028896.5A Active CN103246672B (zh) 2012-02-09 2012-02-09 对用户进行个性化推荐的方法和装置

Country Status (1)

Country Link
CN (1) CN103246672B (zh)

Cited By (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104079960A (zh) * 2013-12-05 2014-10-01 深圳市腾讯计算机系统有限公司 文件推荐方法和装置
CN104077365A (zh) * 2014-06-12 2014-10-01 百度移信网络技术(北京)有限公司 一种增强相似度关联的相似性度量方法以及系统
CN104091139A (zh) * 2014-07-11 2014-10-08 北京信息科技大学 一种q参数的获取方法及装置
CN104301323A (zh) * 2014-10-23 2015-01-21 中国科学院大学 均衡第三方应用个性化服务和用户隐私信息安全的方法
CN104754010A (zh) * 2013-12-31 2015-07-01 华为技术有限公司 信息处理的方法及业务平台
CN105005701A (zh) * 2015-07-24 2015-10-28 成都康赛信息技术有限公司 一种基于属性与评分的个性化推荐方法
CN105069483A (zh) * 2015-08-21 2015-11-18 中国地质大学(武汉) 一种对分类数据集进行测试的方法
CN105095256A (zh) * 2014-05-07 2015-11-25 阿里巴巴集团控股有限公司 基于用户之间相似度进行信息推送的方法及装置
CN105183925A (zh) * 2015-10-30 2015-12-23 合一网络技术(北京)有限公司 内容关联推荐方法及装置
CN105302880A (zh) * 2015-10-14 2016-02-03 合一网络技术(北京)有限公司 内容关联推荐方法及装置
CN105426550A (zh) * 2015-12-28 2016-03-23 Tcl集团股份有限公司 一种基于用户质量模型的协同过滤标签推荐方法及系统
CN105488207A (zh) * 2015-12-10 2016-04-13 合一网络技术(北京)有限公司 网络资源的语义编码方法和装置
CN105630742A (zh) * 2015-12-28 2016-06-01 广州酷狗计算机科技有限公司 特征向量计算方法及装置
CN105740210A (zh) * 2016-03-17 2016-07-06 腾讯科技(深圳)有限公司 一种信息相似度确定方法及装置
CN105761154A (zh) * 2016-04-11 2016-07-13 北京邮电大学 一种社会化推荐方法及装置
CN105868422A (zh) * 2016-06-21 2016-08-17 东北大学 一种基于弹性维特征向量优化抽取的协同过滤推荐方法
CN106294727A (zh) * 2016-08-09 2017-01-04 北京千安哲信息技术有限公司 一种推荐信息的方法及设备
CN106326369A (zh) * 2016-08-12 2017-01-11 广州优视网络科技有限公司 应用专题推荐方法、装置及服务器
CN106407364A (zh) * 2016-09-08 2017-02-15 北京百度网讯科技有限公司 一种基于人工智能的信息推荐方法和装置
CN106651519A (zh) * 2016-12-23 2017-05-10 广州赛宝认证中心服务有限公司 基于标签信息的个性化推荐方法和系统
CN106651461A (zh) * 2016-12-30 2017-05-10 重庆邮电大学 基于灰理论的电影个性化推荐方法
CN106815216A (zh) * 2015-11-30 2017-06-09 北京云莱坞文化传媒有限公司 一种故事筛选及精准展现的方法和装置
CN106874374A (zh) * 2016-12-31 2017-06-20 杭州益读网络科技有限公司 一种基于用户历史行为交互分析的推荐推送方法
CN106874355A (zh) * 2016-12-28 2017-06-20 浙江浙大网新集团有限公司 同时融入社交关系和用户相似度的协同过滤方法
CN106991193A (zh) * 2017-04-26 2017-07-28 努比亚技术有限公司 获取物品相似度的方法及终端、计算机可读存储介质
CN107016589A (zh) * 2016-08-10 2017-08-04 阿里巴巴集团控股有限公司 推荐产品的确定方法及装置
CN107239993A (zh) * 2017-05-24 2017-10-10 海南大学 一种基于拓展标签的矩阵分解推荐方法及系统
CN107833117A (zh) * 2017-12-13 2018-03-23 合肥工业大学 一种考虑标签信息的贝叶斯个性化排序推荐方法
CN107967627A (zh) * 2017-12-05 2018-04-27 北京工业大学 一种基于内容的线性回归理财产品推荐方法
CN108038120A (zh) * 2017-11-01 2018-05-15 平安科技(深圳)有限公司 协同过滤推荐方法、电子设备及计算机可读存储介质
CN108073702A (zh) * 2017-12-14 2018-05-25 北京木业邦科技有限公司 木材产品推荐方法、装置及计算机可读存储介质
CN108287904A (zh) * 2018-05-09 2018-07-17 重庆邮电大学 一种基于社会化卷积矩阵分解的文档上下文感知推荐方法
CN108415928A (zh) * 2018-01-18 2018-08-17 郝宁宁 一种基于加权混合k-最近邻算法的图书推荐方法与系统
CN108429865A (zh) * 2017-02-13 2018-08-21 中国移动通信集团广东有限公司 一种产品推荐处理方法及装置
CN108665323A (zh) * 2018-05-20 2018-10-16 北京工业大学 一种用于理财产品推荐系统的集成方法
CN108694647A (zh) * 2018-05-11 2018-10-23 北京三快在线科技有限公司 一种商户推荐理由的挖掘方法及装置,电子设备
CN108711075A (zh) * 2018-05-22 2018-10-26 阿里巴巴集团控股有限公司 一种产品推荐方法和装置
CN109034941A (zh) * 2018-06-13 2018-12-18 平安科技(深圳)有限公司 产品推荐方法、装置、计算机设备和存储介质
CN109117943A (zh) * 2018-07-24 2019-01-01 中国科学技术大学 利用多属性信息增强网络表征学习的方法
CN109389447A (zh) * 2017-08-04 2019-02-26 北京京东尚科信息技术有限公司 项目推荐方法、项目推荐系统以及计算机可读介质
CN109408712A (zh) * 2018-09-30 2019-03-01 重庆誉存大数据科技有限公司 一种旅行社用户多维信息画像的构建方法
CN109740655A (zh) * 2018-12-26 2019-05-10 西安电子科技大学 基于矩阵分解及神经协同过滤的物品评分预测方法
CN109753275A (zh) * 2018-12-10 2019-05-14 东软集团股份有限公司 应用编程接口的推荐方法、装置、存储介质和电子设备
WO2020107806A1 (zh) * 2018-11-30 2020-06-04 华为技术有限公司 一种推荐方法及装置
WO2021077814A1 (zh) * 2019-10-23 2021-04-29 支付宝(杭州)信息技术有限公司 一种由用户终端执行的推送模型优化方法和装置
CN113158024A (zh) * 2021-02-26 2021-07-23 中国科学技术大学 一种纠正推荐系统流行度偏差的因果推理方法
CN113269610A (zh) * 2021-05-25 2021-08-17 索信达(北京)数据技术有限公司 银行产品的推荐方法、装置及存储介质
CN113592605A (zh) * 2021-08-10 2021-11-02 平安银行股份有限公司 基于相似产品的产品推荐方法、装置、设备及存储介质
CN115829301A (zh) * 2023-02-22 2023-03-21 山东心法科技有限公司 一种基于组织团队配置的辅助管理方法、设备及介质
CN117974330A (zh) * 2024-03-28 2024-05-03 华侨大学 基于混合模型的互联网保险评分预测方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090199243A1 (en) * 2008-01-31 2009-08-06 Kabushiki Kaisha Toshiba Recommended Program Retrieval Device, and Recommended Program Retrieval Method
CN101751448A (zh) * 2009-07-22 2010-06-23 中国科学院自动化研究所 一种基于情景信息的个性化资源信息的推荐方法
CN102129463A (zh) * 2011-03-11 2011-07-20 北京航空航天大学 一种融合项目相关性的基于pmf的协同过滤推荐系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090199243A1 (en) * 2008-01-31 2009-08-06 Kabushiki Kaisha Toshiba Recommended Program Retrieval Device, and Recommended Program Retrieval Method
CN101751448A (zh) * 2009-07-22 2010-06-23 中国科学院自动化研究所 一种基于情景信息的个性化资源信息的推荐方法
CN102129463A (zh) * 2011-03-11 2011-07-20 北京航空航天大学 一种融合项目相关性的基于pmf的协同过滤推荐系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王金辉: "基于标签的协同过滤稀疏性问题研究", 《中国优秀硕士学位论文全文数据库 (经济与管理科学辑)》 *

Cited By (75)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104079960A (zh) * 2013-12-05 2014-10-01 深圳市腾讯计算机系统有限公司 文件推荐方法和装置
US9930419B2 (en) 2013-12-05 2018-03-27 Tencent Technology (Shenzhen) Company Limited File recommendation method and device
CN104079960B (zh) * 2013-12-05 2015-10-07 深圳市腾讯计算机系统有限公司 文件推荐方法和装置
US10516745B2 (en) 2013-12-31 2019-12-24 Huawei Technologies Co., Ltd. Information processing method and service platform
CN104754010B (zh) * 2013-12-31 2019-01-25 华为技术有限公司 信息处理的方法及业务平台
CN104754010A (zh) * 2013-12-31 2015-07-01 华为技术有限公司 信息处理的方法及业务平台
WO2015100976A1 (zh) * 2013-12-31 2015-07-09 华为技术有限公司 信息处理的方法及业务平台
CN105095256A (zh) * 2014-05-07 2015-11-25 阿里巴巴集团控股有限公司 基于用户之间相似度进行信息推送的方法及装置
CN105095256B (zh) * 2014-05-07 2019-06-11 阿里巴巴集团控股有限公司 基于用户之间相似度进行信息推送的方法及装置
CN104077365B (zh) * 2014-06-12 2018-04-27 百度移信网络技术(北京)有限公司 一种增强相似度关联的相似性度量方法以及系统
CN104077365A (zh) * 2014-06-12 2014-10-01 百度移信网络技术(北京)有限公司 一种增强相似度关联的相似性度量方法以及系统
CN104091139A (zh) * 2014-07-11 2014-10-08 北京信息科技大学 一种q参数的获取方法及装置
CN104301323A (zh) * 2014-10-23 2015-01-21 中国科学院大学 均衡第三方应用个性化服务和用户隐私信息安全的方法
CN104301323B (zh) * 2014-10-23 2017-10-31 中国科学院大学 均衡第三方应用个性化服务和用户隐私信息安全的方法
CN105005701A (zh) * 2015-07-24 2015-10-28 成都康赛信息技术有限公司 一种基于属性与评分的个性化推荐方法
CN105069483A (zh) * 2015-08-21 2015-11-18 中国地质大学(武汉) 一种对分类数据集进行测试的方法
CN105069483B (zh) * 2015-08-21 2019-01-01 中国地质大学(武汉) 一种对分类数据集进行测试的方法
CN105302880A (zh) * 2015-10-14 2016-02-03 合一网络技术(北京)有限公司 内容关联推荐方法及装置
CN105183925A (zh) * 2015-10-30 2015-12-23 合一网络技术(北京)有限公司 内容关联推荐方法及装置
CN106815216A (zh) * 2015-11-30 2017-06-09 北京云莱坞文化传媒有限公司 一种故事筛选及精准展现的方法和装置
CN105488207A (zh) * 2015-12-10 2016-04-13 合一网络技术(北京)有限公司 网络资源的语义编码方法和装置
CN105630742A (zh) * 2015-12-28 2016-06-01 广州酷狗计算机科技有限公司 特征向量计算方法及装置
CN105630742B (zh) * 2015-12-28 2019-05-07 广州酷狗计算机科技有限公司 特征向量计算方法及装置
CN105426550A (zh) * 2015-12-28 2016-03-23 Tcl集团股份有限公司 一种基于用户质量模型的协同过滤标签推荐方法及系统
CN105426550B (zh) * 2015-12-28 2020-02-07 Tcl集团股份有限公司 一种基于用户质量模型的协同过滤标签推荐方法及系统
CN105740210A (zh) * 2016-03-17 2016-07-06 腾讯科技(深圳)有限公司 一种信息相似度确定方法及装置
CN105740210B (zh) * 2016-03-17 2020-06-16 腾讯科技(深圳)有限公司 一种信息相似度确定方法及装置
CN105761154B (zh) * 2016-04-11 2019-10-15 北京邮电大学 一种社会化推荐方法及装置
CN105761154A (zh) * 2016-04-11 2016-07-13 北京邮电大学 一种社会化推荐方法及装置
CN105868422A (zh) * 2016-06-21 2016-08-17 东北大学 一种基于弹性维特征向量优化抽取的协同过滤推荐方法
CN106294727A (zh) * 2016-08-09 2017-01-04 北京千安哲信息技术有限公司 一种推荐信息的方法及设备
CN107016589A (zh) * 2016-08-10 2017-08-04 阿里巴巴集团控股有限公司 推荐产品的确定方法及装置
CN106326369A (zh) * 2016-08-12 2017-01-11 广州优视网络科技有限公司 应用专题推荐方法、装置及服务器
CN106407364A (zh) * 2016-09-08 2017-02-15 北京百度网讯科技有限公司 一种基于人工智能的信息推荐方法和装置
CN106651519B (zh) * 2016-12-23 2019-11-12 广州赛宝认证中心服务有限公司 基于标签信息的个性化推荐方法和系统
CN106651519A (zh) * 2016-12-23 2017-05-10 广州赛宝认证中心服务有限公司 基于标签信息的个性化推荐方法和系统
CN106874355A (zh) * 2016-12-28 2017-06-20 浙江浙大网新集团有限公司 同时融入社交关系和用户相似度的协同过滤方法
CN106651461A (zh) * 2016-12-30 2017-05-10 重庆邮电大学 基于灰理论的电影个性化推荐方法
CN106874374A (zh) * 2016-12-31 2017-06-20 杭州益读网络科技有限公司 一种基于用户历史行为交互分析的推荐推送方法
CN108429865B (zh) * 2017-02-13 2020-10-16 中国移动通信集团广东有限公司 一种产品推荐处理方法及装置
CN108429865A (zh) * 2017-02-13 2018-08-21 中国移动通信集团广东有限公司 一种产品推荐处理方法及装置
CN106991193B (zh) * 2017-04-26 2020-03-13 努比亚技术有限公司 获取物品相似度的方法及终端、计算机可读存储介质
CN106991193A (zh) * 2017-04-26 2017-07-28 努比亚技术有限公司 获取物品相似度的方法及终端、计算机可读存储介质
CN107239993A (zh) * 2017-05-24 2017-10-10 海南大学 一种基于拓展标签的矩阵分解推荐方法及系统
CN109389447A (zh) * 2017-08-04 2019-02-26 北京京东尚科信息技术有限公司 项目推荐方法、项目推荐系统以及计算机可读介质
CN108038120A (zh) * 2017-11-01 2018-05-15 平安科技(深圳)有限公司 协同过滤推荐方法、电子设备及计算机可读存储介质
CN107967627A (zh) * 2017-12-05 2018-04-27 北京工业大学 一种基于内容的线性回归理财产品推荐方法
CN107833117A (zh) * 2017-12-13 2018-03-23 合肥工业大学 一种考虑标签信息的贝叶斯个性化排序推荐方法
CN107833117B (zh) * 2017-12-13 2020-03-17 合肥工业大学 一种考虑标签信息的贝叶斯个性化排序推荐方法
CN108073702A (zh) * 2017-12-14 2018-05-25 北京木业邦科技有限公司 木材产品推荐方法、装置及计算机可读存储介质
CN108415928B (zh) * 2018-01-18 2022-05-31 山东畅想云教育科技有限公司 一种基于加权混合k-最近邻算法的图书推荐方法与系统
CN108415928A (zh) * 2018-01-18 2018-08-17 郝宁宁 一种基于加权混合k-最近邻算法的图书推荐方法与系统
CN108287904A (zh) * 2018-05-09 2018-07-17 重庆邮电大学 一种基于社会化卷积矩阵分解的文档上下文感知推荐方法
CN108694647A (zh) * 2018-05-11 2018-10-23 北京三快在线科技有限公司 一种商户推荐理由的挖掘方法及装置,电子设备
CN108665323A (zh) * 2018-05-20 2018-10-16 北京工业大学 一种用于理财产品推荐系统的集成方法
WO2019223379A1 (zh) * 2018-05-22 2019-11-28 阿里巴巴集团控股有限公司 一种产品推荐方法和装置
CN108711075A (zh) * 2018-05-22 2018-10-26 阿里巴巴集团控股有限公司 一种产品推荐方法和装置
CN109034941A (zh) * 2018-06-13 2018-12-18 平安科技(深圳)有限公司 产品推荐方法、装置、计算机设备和存储介质
CN109034941B (zh) * 2018-06-13 2023-03-31 平安科技(深圳)有限公司 产品推荐方法、装置、计算机设备和存储介质
CN109117943A (zh) * 2018-07-24 2019-01-01 中国科学技术大学 利用多属性信息增强网络表征学习的方法
CN109408712A (zh) * 2018-09-30 2019-03-01 重庆誉存大数据科技有限公司 一种旅行社用户多维信息画像的构建方法
WO2020107806A1 (zh) * 2018-11-30 2020-06-04 华为技术有限公司 一种推荐方法及装置
US11586941B2 (en) 2018-11-30 2023-02-21 Huawei Technologies Co., Ltd. Recommendation method and apparatus
CN109753275A (zh) * 2018-12-10 2019-05-14 东软集团股份有限公司 应用编程接口的推荐方法、装置、存储介质和电子设备
CN109753275B (zh) * 2018-12-10 2022-04-12 东软集团股份有限公司 应用编程接口的推荐方法、装置、存储介质和电子设备
CN109740655A (zh) * 2018-12-26 2019-05-10 西安电子科技大学 基于矩阵分解及神经协同过滤的物品评分预测方法
WO2021077814A1 (zh) * 2019-10-23 2021-04-29 支付宝(杭州)信息技术有限公司 一种由用户终端执行的推送模型优化方法和装置
CN113158024B (zh) * 2021-02-26 2022-07-15 中国科学技术大学 一种纠正推荐系统流行度偏差的因果推理方法
CN113158024A (zh) * 2021-02-26 2021-07-23 中国科学技术大学 一种纠正推荐系统流行度偏差的因果推理方法
CN113269610A (zh) * 2021-05-25 2021-08-17 索信达(北京)数据技术有限公司 银行产品的推荐方法、装置及存储介质
CN113592605A (zh) * 2021-08-10 2021-11-02 平安银行股份有限公司 基于相似产品的产品推荐方法、装置、设备及存储介质
CN113592605B (zh) * 2021-08-10 2023-08-22 平安银行股份有限公司 基于相似产品的产品推荐方法、装置、设备及存储介质
CN115829301A (zh) * 2023-02-22 2023-03-21 山东心法科技有限公司 一种基于组织团队配置的辅助管理方法、设备及介质
CN115829301B (zh) * 2023-02-22 2023-09-29 山东心法科技有限公司 一种基于组织团队配置的辅助管理方法、设备及介质
CN117974330A (zh) * 2024-03-28 2024-05-03 华侨大学 基于混合模型的互联网保险评分预测方法及装置

Also Published As

Publication number Publication date
CN103246672B (zh) 2016-06-08

Similar Documents

Publication Publication Date Title
CN103246672A (zh) 对用户进行个性化推荐的方法和装置
Zuo et al. Tag-aware recommender systems based on deep neural networks
Zhang et al. Deep Learning over Multi-field Categorical Data: –A Case Study on User Response Prediction
Akerkar et al. Intelligent techniques for data science
Pitas Graph-based social media analysis
CN111898031A (zh) 一种获得用户画像的方法及装置
Anwar et al. Machine learning techniques for book recommendation: an overview
Wang et al. Recurrent recommendation with local coherence
Cao et al. Service recommendation based on attentional factorization machine
Kumar et al. Word semantics based 3-d convolutional neural networks for news recommendation
Hain et al. The promises of Machine Learning and Big Data in entrepreneurship research
Singh et al. Relative similarity based approach for improving aggregate recommendation diversity
Jensen et al. A predictive model of music preference using pairwise comparisons
Shang et al. Deep learning generic features for cross-media retrieval
Nadee et al. Acquiring user information needs for recommender systems
Yu et al. Computer Image Content Retrieval considering K‐Means Clustering Algorithm
Coba et al. Replicating and improving Top-N recommendations in open source packages
Xue et al. An incremental group-specific framework based on community detection for cold start recommendation
Modarresi et al. An efficient deep learning model for recommender systems
Su et al. I_ConvCF: Item-based convolution collaborative filtering recommendation
CN110990164A (zh) 账户检测方法和装置、账户检测模型的训练方法和装置
Gkalelis et al. Subclass deep neural networks: re-enabling neglected classes in deep network training for multimedia classification
Sun et al. Leveraging user personality and tag information for one class collaborative filtering
Huang et al. Pairwise-based hierarchical gating networks for sequential recommendation
Tan et al. Learning Global Additive Explanations of Black-Box Models

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant