CN106294859A - 一种基于属性耦合矩阵分解的项目推荐方法 - Google Patents

一种基于属性耦合矩阵分解的项目推荐方法 Download PDF

Info

Publication number
CN106294859A
CN106294859A CN201610705485.3A CN201610705485A CN106294859A CN 106294859 A CN106294859 A CN 106294859A CN 201610705485 A CN201610705485 A CN 201610705485A CN 106294859 A CN106294859 A CN 106294859A
Authority
CN
China
Prior art keywords
project
prime
user
coupling
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610705485.3A
Other languages
English (en)
Inventor
余永红
徐劲松
赵卫滨
蒋晶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nupt Institute Of Big Data Research At Yancheng Co Ltd
Original Assignee
Nupt Institute Of Big Data Research At Yancheng Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nupt Institute Of Big Data Research At Yancheng Co Ltd filed Critical Nupt Institute Of Big Data Research At Yancheng Co Ltd
Priority to CN201610705485.3A priority Critical patent/CN106294859A/zh
Publication of CN106294859A publication Critical patent/CN106294859A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于项目属性耦合矩阵分解的项目推荐方法,包括如下步骤:首先,给定项目的属性信息,采用耦合对象相似度度量指标计算项目之间的相似度;然后利用矩阵分解算法学习用户和项目的隐藏特征向量,在学习项目隐藏特征向量过程中,利用项目的属性信息构建正则化项,约束矩阵分解的执行过程,使得属性信息相似的项目具有相似的隐藏特征向量;最后,根据学习的用户和项目隐藏特征向量,使用用户和项目隐藏特征向量的内积预测用户对未评分项目的评分,根据预测评分为用户提供个性化的项目推荐。本发明解决推荐系统中项目的相似度计算、项目端冷启动和推荐精度的问题。

Description

一种基于属性耦合矩阵分解的项目推荐方法
技术领域
本发明涉及数据挖掘技术领域,尤其涉及一种基于属性耦合矩阵分解的项目推荐方法。
背景技术
随着互联网技术的不断发展,从海量数据中找到有价值的相关信息变得越来越困难,用户面临着严重的信息过载问题。推荐系统通过分析用户的历史活动数据,挖掘用户的潜在偏好,为用户提供个性化的推荐服务,成为解决信息过载问题的有效手段,近年来受到学术界和工业界的广泛关注。推荐系统的典型应用包括Amazon和淘宝的商品推荐、Netflix的电影推荐、Last.fm的音乐推荐、LinkedIn的朋友推荐、Google News的新闻推荐等等。这些互联网应用或者电商平台通过部署推荐系统,一方面满足了用户的个性化需求,减轻了信息过载的问题;另一方面提高了用户的忠诚度,增加了企业的营业收入。目前,推荐系统已经成为信息服务平台不可缺失的组成部分。
在推荐系统的研究中,协同过滤算法是目前应用最广泛的推荐技术。协同过滤算法通过分析用户的历史活动记录,挖掘用户的隐藏偏好,根据用户的隐藏偏好为用户提供个性化的推荐服务。然而,协同过滤算法存在数据稀疏、冷启动等问题。数据稀疏导致协同过滤算法不能准确地根据用户的评分数据计算用户或者项目之间的相似性,从而严重影响协同过滤推荐算法的准确性。冷启动指由于与新注册用户和新加入系统项目相关的评分数据较少,协同过滤推荐算法不能准确的找到相似用户或者项目,因而不能为新注册用户提供个性化推荐,或者将新加入系统的项目推荐给感兴趣的用户。
自Netflix竞赛以来,由于在处理大规模数据方面良好的可扩展性和准确的预测能力,基于矩阵分解的推荐算法受到学术界和工业界的广泛关注。由于不能有效地从用户-项目评分矩阵中学习具有较少评分的用户或者新加入系统的项目的隐藏特征向量,矩阵分解的推荐算法同样存在冷启动问题。但是,矩阵分解技术提供了一个灵活的框架,可以通过融合其它信息源来减轻冷启动问题,如社交网络信息等。虽然已经存在很多研究工作利用各种额外的信息源来改进矩阵分解推荐算法的性能,但是大部分研究工作专注于解决用户端的冷启动问题,而忽视了推荐系统中的项目端的冷启动问题。
近年来,一些推荐算法在矩阵分解技术基础上,利用用户评论信息来减轻项目端的冷启动问题。这些方法基本上是结合矩阵分解和概率主题模型来改进推荐算法的性能。然而,通过概率主题模型学习到的项目特征表示可能不够简洁有效,并且与矩阵分解的基本假设(仅少量的隐藏因子影响用户的偏好和刻画项目的特征)不一致。而且,很难处理用户评论信息的随机性,以致于不能很好描述用户之间、项目之间的相似性。
发明内容
本发明所要解决的技术问题是针对背景技术中所涉及到的缺陷,提供一种基于属性耦合矩阵分解的项目推荐方法,重点从项目属性信息中挖掘项目之间的相关性,并将项目之间的相关性与用户-项目评分数据相结合,解决推荐系统中的项目端冷启动问题,达到提高推荐系统性能的目的。
本发明为解决上述技术问题采用以下技术方案:
一种基于属性耦合矩阵分解的项目推荐方法,包含以下步骤:
步骤1),对于待推荐项目的属性信息,采用耦合对象相似度度量指标计算各个项目之间的相似度;
步骤2),根据项目之间耦合对象相似度,构建包含项目属性信息的正则化项;
步骤3),在矩阵分解算法基础上,结合包含项目信息的正则化项,采用梯度下降技术学习用户和项目的隐藏特征向量;
步骤4),根据学习的用户和项目隐藏特征向量,使用用户和项目隐藏特征向量的内积预测用户对未评分项目的评分,根据预测评分为用户提供项目推荐。
作为本发明一种基于属性耦合矩阵分解的项目推荐方法进一步的优化方案,所述步骤1)中,根据以下公式计算项目之间的耦合对象相似度:
C O S ( i , i ′ ) = Σ j = 1 l δ j A ( a i j , a i ′ j )
其中,aij和ai'j是项目i和项目i'在特征aj上的属性值,为耦合属性值相似度,l为项目特征的数量,i为大于零的自然数,j为大于零小于l的自然数;
所述特征aj上属性值aij和ai'j之间的耦合属性值相似度计算公式如下:
δ j A ( a i j , a i ′ j ) = δ j I a ( a i j , a i ′ j ) * δ j I e ( a i j , a i ′ j )
其中,分别表示特征内耦合属性值相似度和特征间耦合属性值相似度;
特征内耦合属性值相似度的计算公式如下:
δ j I a ( q i j , a i ′ j ) = | g j ( a i j ) | . | g j ( a i ′ j ) | | g j ( a i j ) | + | g j ( a i ′ j ) | + | g j ( a i j ) | . | g j ( a i ′ j ) |
其中,gj(aij)和gj(ai'j)分别表示在待推荐项目的集合中、项目的特征aj上属性值等于aij与ai'j的项目集合,|gj(aij)|和|gj(ai'j)|分别表示集合gj(aij)和gj(ai'j)中项目的个数;
特征间耦合属性值相似度的计算方法如下:
δ j I e ( a i j , a i ′ j ) = Σ k = 1 , k ≠ j l α k δ j | k ( a i j , a i ′ j )
其中,αk是特征ak(k≠j)的权重参数,αk∈[0,1]。δj|k(aij,ai'j)是属性值aij与ai'j在特征ak(k≠j)下的特征间耦合属性值相似度;
δj|k(aij,ai'j)的计算公式如下:
δ j | k = Σ w ∈ ∩ min { P k | j ( { w } | a i j ) , P k | j ( { w } | a i ′ j ) }
其中,∩为集合的交集。为所有在特征aj上取值aij的项目在特征ak上属性值集合;
Pk|j({w}|aij)和Pk|j({w}|ai'j)是分别为aij和ai'j的信息条件概率,其计算公式如下:
P k | j ( { w } | x ) = | g k ( w ) ∩ g j ( x ) | | g j ( x ) |
Pk|j({w}|x)描述了特征aj取属性值x条件下,特征ak取值为w的条件分布。
作为本发明一种基于属性耦合矩阵分解的项目推荐方法进一步的优化方案,所述步骤2)中根据以下公式构建包含项目属性信息的正则化项:
β 2 Σ i = 1 M Σ i ′ = 1 M c o s ( i , i ′ ) | | q i - q i ′ | | F 2
其中,β为控制正则化项的影响程度的正则化参数;M为推荐系统中项目的数量,cos(i,i')为项目i和项目i'的耦合对象相似度;qi和qi'分别为项目i和项目i'的隐藏特征向量;表示Frobenius范式;
令项目隐藏特征矩阵Q为[q1,q2,...,qM],ei=[0,0,...,1,...,0]T为元素列向量,则
β 2 Σ i = 1 M Σ i ′ = 1 M c o s ( i , i ′ ) | | q i - q i ′ | | F 2 = β 2 Σ i = 1 M Σ i ′ = 1 M c o s ( i , i ′ ) | | Qe i - Qe i ′ | | F 2 = β 2 Σ i = 1 M Σ i ′ = 1 M c o s ( i , i ′ ) t r ( ( Q ( e i - e i ′ ) ) T Q ( e i - e i ′ ) ) = β 2 t r ( QLQ T )
其中,L=Λ-S为拉普拉斯矩阵,为项目耦合相似度矩阵,S中元素Si,j=cos(i,j)表示项目i和项目j之间的耦合相似度,Λ为对角矩阵,对角元素
作为本发明一种基于属性耦合矩阵分解的项目推荐方法进一步的优化方案,所述步骤3)的详细步骤为:
步骤3.1),根据用户-项目评分矩阵和由项目的属性信息计算得到的项目耦合相似度矩阵S,在矩阵分解目标函数的基础上加上包含项目属性信息的正则化项,基于属性耦合矩阵分解的推荐方法的目标函数如下:
其中为用户隐藏特征矩阵,K为隐藏特征向量的维数,Ω为用户-项目评分矩阵R中可观测项(u,i)的集合,λ1和λ2为正则化控制参数,u代表用户;
步骤3.2),利用包含项目属性信息的正则化项的变化形式替换目标函数中的最后一项,将其转化为:
其中,W为指示矩阵,如果用户u对项目i评分过,则Wui=1,否则为0;⊙表示Hadamard积操作;
步骤3.3),根据以下公式计算目标函数关于隐藏特征矩阵P和Q的偏导数:
步骤3.4),使用梯度下降的方法求解用户隐藏特征矩阵P和项目隐藏特征矩阵Q。
作为本发明一种基于属性耦合矩阵分解的项目推荐方法进一步的优化方案,所述步骤4)中,用户u对未评分过项目j的预测评分的计算方法如下:
R ~ u j = p u T q j
其中,pu和qj分别为用户u和项目j的隐藏特征向量。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
1.通过耦合对象相似度度量指标计算项目之间的相似度,更加准确的捕获项目之间的相关性;
2.在矩阵分解技术的基础上,融合项目的属性信息,约束矩阵分解的执行过程,更加准确的学习项目的隐藏特征向量,减轻推荐系统中的项目端冷启动问题。
附图说明
图1是本发明一种基于属性耦合矩阵分解的项目推荐方法的流程示意图。
具体实施方式
下面结合附图对本发明的技术方案做进一步的详细说明:
如图1所示,本发明公开了一种基于属性耦合矩阵分解的项目推荐方法,包含以下步骤:
步骤1),对于待推荐项目的属性信息,采用耦合对象相似度度量指标计算项目之间的相似度;
步骤2),根据项目之间耦合对象相似度,构建包含项目属性信息的正则化项;
步骤3),在矩阵分解算法基础上,结合包含项目信息的正则化项,采用梯度下降技术学习用户和项目的隐藏特征向量;
步骤4),根据学习的用户和项目隐藏特征向量,使用用户和项目隐藏特征向量的内积预测用户对未评分项目的评分,根据预测评分为用户提供项目推荐。
所述步骤1)中,根据以下公式计算项目之间的耦合对象相似度:
C O S ( i , i ′ ) = Σ j = 1 l δ j A ( a i j , a i ′ j )
其中,aij和ai'j是项目i和项目i'在特征aj上的属性值,为耦合属性值相似度(CAVS),l为项目特征的数量,i为大于零的自然数,j为大于零小于l的自然数;
耦合属性值相似度(CAVS)由两部分组成:特征内耦合属性值相似度(IaAVS)和特征间耦合属性值相似度(IeAVS)。
所述特征aj上属性值aij和ai'j之间的耦合属性值相似度计算公式如下:
δ j A ( a i j , a i ′ j ) = δ j I a ( a i j , a i ′ j ) * δ j I e ( a i j , a i ′ j )
其中,分别表示特征内耦合属性值相似度(IaAVS)和特征间耦合属性值相似度(IeAVS)。
特征内耦合属性值相似度(IaAVS)从属性值频率分布的角度刻画同一特征下不同属性值之间的相似度。
特征内耦合属性值相似度(IaAVS)的计算公式如下:
δ j I a ( q i j , a i ′ j ) = | g j ( a i j ) | . | g j ( a i ′ j ) | | g j ( a i j ) | + | g j ( a i ′ j ) | + | g j ( a i j ) | . | g j ( a i ′ j ) |
其中,gj(aij)和gj(ai'j)分别表示在待推荐项目的集合中、项目的特征aj上属性值等于aij与ai'j的项目集合,|gj(aij)|和|gj(ai'j)|分别表示集合gj(aij)和gj(ai'j)中项目的个数。
特征间耦合属性值相似度(IeAVS)综合考虑了在特征aj内属性值为aij和ai'j的条件下的其他特征ak(k≠j)的属性值分布情况。
特征间耦合属性值相似度(IeAVS)的计算方法如下:
δ j I e ( a i j , a i ′ j ) = Σ k = 1 , k ≠ j l α k δ j | k ( a i j , a i ′ j )
其中,αk是特征ak(k≠j)的权重参数,αk∈[0,1]。δj|k(aij,ai'j)是属性值aij与ai'j在特征ak(k≠j)下的特征间耦合属性值相似度。
δj|k(aij,ai'j)的计算公式如下:
δ j | k = Σ w ∈ ∩ min { P k | j ( { w } | a i j ) , P k | j ( { w } | a i ′ j ) }
其中,∩为集合的交集。为所有在特征aj上取值aij的项目在特征ak上属性值集合。
Pk|j({w}|aij)和Pk|j({w}|ai'j)是分别为aij和ai'j的信息条件概率,其计算公式如下:
P k | j ( { w } | x ) = | g k ( w ) ∩ g j ( x ) | | g j ( x ) |
Pk|j({w}|x)描述了特征aj取属性值x条件下,特征ak取值为w的条件分布。
所述步骤2)中根据以下公式构建包含项目属性信息的正则化项:
β 2 Σ i = 1 M Σ i ′ = 1 M c o s ( i , i ′ ) | | q i - q i ′ | | F 2
其中,β为控制正则化项的影响程度的正则化参数;M为推荐系统中项目的数量,cos(i,i')为项目i和项目i'的耦合对象相似度;qi和qi'分别为项目i和项目i'的隐藏特征向量;表示Frobenius范式。
在上述正则化项中,较大的cos(i,i')值意味着qi和qi'之间的距离必须相对的小。因此,包含项目属性信息的正则化项使得属性相似的项目具有相似的隐藏特征向量。
设项目隐藏特征矩阵Q为[q1,q2,...,qM],ei=[0,0,...,1,...,0]T为元素列向量,即第i个元素为1,其余元素为0,则qi=Qei。包含项目属性信息的正则化项可以转换为如下形式:
β 2 Σ i = 1 M Σ i ′ = 1 M c o s ( i , i ′ ) | | q i - q i ′ | | F 2 = β 2 Σ i = 1 M Σ i ′ = 1 M c o s ( i , i ′ ) | | Qe i - Qe i ′ | | F 2 = β 2 Σ i = 1 M Σ i ′ = 1 M c o s ( i , i ′ ) t r ( ( Q ( e i - e i ′ ) ) T Q ( e i - e i ′ ) ) = β 2 t r ( QLQ T )
其中,L=Λ-S为拉普拉斯矩阵,为项目耦合相似度矩阵,S中元素Si,j=cos(i,j)表示项目i和项目j之间的耦合相似度,Λ为对角矩阵,对角元素
所述步骤3)的详细步骤为:
步骤3.1),根据用户-项目评分矩阵和由项目的属性信息计算得到的项目耦合相似度矩阵S,在矩阵分解目标函数的基础上加上包含项目属性信息的正则化项,基于属性耦合矩阵分解的推荐方法的目标函数如下:
其中为用户隐藏特征矩阵,K为隐藏特征向量的维数,Ω为用户-项目评分矩阵R中可观测项(u,i)的集合,λ1和λ2为正则化控制参数,u代表用户;
步骤3.2),利用包含项目属性信息的正则化项的变化形式替换目标函数中的最后一项,将其转化为:
其中W为指示矩阵,如果用户u对项目i评分过,则Wui=1,否则为0;⊙表示Hadamard积操作;
步骤3.3),根据以下公式计算目标函数关于隐藏特征矩阵P和Q的偏导数:
步骤3.4),使用梯度下降的方法求解用户隐藏特征矩阵P和项目隐藏特征矩阵Q。
所述步骤4)中用户u对未评分过项目j的预测评分的计算方法如下:
R ~ u j = p u T q j
pu和qj分别为用户u和项目j的隐藏特征向量。
对于用户u,计算完所有未评分项目的预测评分后,根据预测评分值,推荐预测评分值高的k项给用户u。
下面以具体实例来说明其具体步骤:
首先,根据用户对项目的评分记录,构建用户-项目评分矩阵R。
设推荐系统中包含N个用户,M个项目,用户对项目的评分记录在服务端一般记为(u,i,Rui)三元组形式。根据用户的评分记录中用户编号和项目编号,将所有用户的评分记录转化用户-项目评分矩阵其中Rui表示用户u对项目i的评分。
然后,从项目的描述信息中抽取项目的属性信息,构建项目-属性矩阵IA。
设l为项目属性的个数,每个项目由属性值向量表示,即:[ai1,ai2,...,ail],其中aij表示项目i在第j个属性下的属性值。所有项目的属性值向量构成项目-属性矩阵IA。
其次,在项目-属性矩阵基础上,根据耦合对象相似度的定义计算项目之间的耦合相似度,构建项目相似度矩阵S和拉普拉斯矩阵L。
为了计算项目i和项目i'之间的耦合对象相似度,对于每个特征aj,计算项目i和项目i'在特征aj下属性值aij和ai'j的耦合属性值相似度计算步骤如下:
步骤A),计算特征内耦合属性值相似度其计算公式如下:
δ j I a ( q i j , a i ′ j ) = | g j ( a i j ) | . | g j ( a i ′ j ) | | g j ( a i j ) | + | g j ( a i ′ j ) | + | g j ( a i j ) | . | g j ( a i ′ j ) |
其中gj(aij)和gj(ai'j)分别表示项目集合O中项目的特征aj上属性值等于aij与ai'j的项目集合。|gj(aij)|和|gj(ai'j)|分别表示集合gj(aij)和gj(ai'j)中项目的个数。
步骤B),计算特征间耦合属性值相似度其计算公式如下:
δ j I e ( a i j , a i ′ j ) = Σ k = 1 , k ≠ j l α k δ j | k ( a i j , a i ′ j )
其中αk是特征ak(k≠j)的权重参数,αk∈[0,1]。δj|k(aij,ai'j)是属性值aij与ai'j在特征ak(k≠j)下的特征间耦合属性值相似度。δj|k(aij,ai'j)的计算公式如下:
δ j | k = Σ w ∈ ∩ min { P k | j ( { w } | a i j ) , P k | j ( { w } | a i ′ j ) }
其中,∩为集合的交集。为所有在特征aj上取值aij的项目在特征ak上属性值集合。Pk|j({w}|aij)和Pk|j({w}|ai'j)是信息条件概率,其计算公式如下:
P k | j ( { w } | x ) = | g k ( w ) ∩ g j ( x ) | | g j ( x ) |
步骤C),根据特征内耦合属性值相似度和特征间耦合属性值相似度计算项目i和项目i'在特征aj下属性值aij和ai'j的耦合属性值相似度其计算公式如下:
δ j A ( a i j , a i ′ j ) = δ j I a ( a i j , a i ′ j ) * δ j I e ( a i j , a i ′ j )
按照步骤A)到步骤C),针对每个特征aj(1<j<l),计算属性值aij和ai'j的耦合属性值相似度然后,计算项目i和项目i'之间的耦合对象相似度,其计算公式如下:
C O S ( i , i &prime; ) = &Sigma; j = 1 l &delta; j A ( a i j , a i &prime; j )
对于每对项目i和项目i',计算完它们之间的耦合相似度后,构建项目相似度矩阵S,使得Si,i'=cos(i,i')。
根据项目相似度矩阵S,计算拉普拉斯矩阵L,其计算公式如下:
L=Λ-S
其中Λ为对角矩阵,对角元素
接着,利用梯度下降的方法学习用户和项目隐藏特征矩阵P和Q。
为用户隐藏特征矩阵,为项目隐藏特征矩阵,K为隐藏特征向量的维数,λ1和λ2为正则化控制参数,W为指示矩阵,如果用户u对项目i评分过,则Wui=1,否则为0。⊙表示Hadamard积操作。计算目标函数关于隐藏特征矩阵P和Q的偏导数,其计算公式如下:
根据更新公式不断更新隐藏特征矩阵P和Q,直至目标函数收敛。隐藏特征矩阵的更新公式如下:
其中η为学习比率参数。
最后,预测用户u对未评分过项目j的评分其计算方法如下:
R ~ u j = p u T q j
pu和qj分别为用户u和项目j的隐藏特征向量。
对于用户u,计算完所有未评分项目的预测评分后,根据预测评分值,推荐预测评分值高的k项给用户u。
本技术领域技术人员可以理解的是,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种基于属性耦合矩阵分解的项目推荐方法,其特征在于,包含以下步骤:
步骤1),对于待推荐项目的属性信息,采用耦合对象相似度度量指标计算各个项目之间的相似度;
步骤2),根据项目之间耦合对象相似度,构建包含项目属性信息的正则化项;
步骤3),在矩阵分解算法基础上,结合包含项目信息的正则化项,采用梯度下降技术学习用户和项目的隐藏特征向量;
步骤4),根据学习的用户和项目隐藏特征向量,使用用户和项目隐藏特征向量的内积预测用户对未评分项目的评分,根据预测评分为用户提供项目推荐。
2.根据权利要求1所述的基于属性耦合矩阵分解的项目推荐方法,其特征在于,所述步骤1)中,根据以下公式计算各个项目之间的耦合对象相似度:
C O S ( i , i &prime; ) = &Sigma; j = 1 l &delta; j A ( a i j , a i &prime; j )
其中,aij和ai'j是项目i和项目i'在特征aj上的属性值,为耦合属性值相似度,l为项目特征的数量,i为大于零的自然数,j为大于零小于l的自然数;
所述特征aj上属性值aij和ai'j之间的耦合属性值相似度计算公式如下:
&delta; j A ( a i j , a i &prime; j ) = &delta; j I a ( a i j , a i &prime; j ) * &delta; j I e ( a i j , a i &prime; j )
其中,分别表示特征内耦合属性值相似度和特征间耦合属性值相似度;
特征内耦合属性值相似度的计算公式如下:
&delta; j I a ( a i j , a i &prime; j ) = | g j ( a i j ) | . | g j ( a i &prime; j ) | | g j ( a i j ) | + | g j ( a i &prime; j ) | + | g j ( a i j ) | . | g j ( a i &prime; j ) |
其中,gj(aij)和gj(ai'j)分别表示在待推荐项目的集合中、项目的特征aj上属性值等于aij与ai'j的项目集合,|gj(aij)|和|gj(ai'j)|分别表示集合gj(aij)和gj(ai'j)中项目的个数;
特征间耦合属性值相似度的计算方法如下:
&delta; j I e ( a i j , a i &prime; j ) = &Sigma; k = 1 , k &NotEqual; j l &alpha; k &delta; j | k ( a i j , a i &prime; j )
其中,αk是特征ak(k≠j)的权重参数,αk∈[0,1]。δj|k(aij,ai'j)是属性值aij与ai'j在特征ak(k≠j)下的特征间耦合属性值相似度;
δj|k(aij,ai'j)的计算公式如下:
&delta; j | k = &Sigma; w &Element; &cap; min { P k | j ( { w } | a i j ) , P k | j ( { w } | a i &prime; j ) }
其中,∩为集合的交集。为所有在特征aj上取值aij的项目在特征ak上属性值集合;
Pk|j({w}|aij)和Pk|j({w}|ai'j)是分别为aij和ai'j的信息条件概率,其计算公式如下:
P k | j ( { w } | x ) = | g k ( w ) &cap; g j ( x ) | | g j ( x ) |
Pk|j({w}|x)描述了特征aj取属性值x条件下,特征ak取值为w的条件分布。
3.根据权利要求2所述的基于属性耦合矩阵分解的项目推荐方法,其特征在于,所述步骤2)中根据以下公式构建包含项目属性信息的正则化项:
&beta; 2 &Sigma; i = 1 M &Sigma; i &prime; = 1 M c o s ( i , i &prime; ) | | q i - q i &prime; | | F 2
其中,β为控制正则化项的影响程度的正则化参数;M为推荐系统中项目的数量,cos(i,i')为项目i和项目i'的耦合对象相似度;qi和qi'分别为项目i和项目i'的隐藏特征向量;表示Frobenius范式;
令项目隐藏特征矩阵Q为[q1,q2,...,qM],ei=[0,0,...,1,...,0]T为元素列向量,则
&beta; 2 &Sigma; i = 1 M &Sigma; i &prime; = 1 M c o s ( i , i &prime; ) | | q i - q i &prime; | | F 2 = &beta; 2 &Sigma; i = 1 M &Sigma; i &prime; = 1 M c o s ( i , i &prime; ) | | Qe i - Qe i &prime; | | F 2 = &beta; 2 &Sigma; i = 1 M &Sigma; i &prime; = 1 M c o s ( i , i &prime; ) t r ( ( Q ( e i - e i &prime; ) ) T Q ( e i - e i &prime; ) ) = &beta; 2 t r ( QLQ T )
其中,L=Λ-S为拉普拉斯矩阵,为项目耦合相似度矩阵,S中元素Si,j=cos(i,j)表示项目i和项目j之间的耦合相似度,Λ为对角矩阵,对角元素
4.根据权利要求3所述的基于属性耦合矩阵分解的项目推荐方法,其特征在于,所述步骤3)的详细步骤为:
步骤3.1),根据用户-项目评分矩阵和由项目的属性信息计算得到的项目耦合相似度矩阵S,在矩阵分解目标函数的基础上加上包含项目属性信息的正则化项,基于属性耦合矩阵分解的推荐方法的目标函数如下:
其中为用户隐藏特征矩阵,K为隐藏特征向量的维数,Ω为用户-项目评分矩阵R中可观测项(u,i)的集合,λ1和λ2为正则化控制参数,u代表用户;
步骤3.2),利用包含项目属性信息的正则化项的变化形式替换目标函数中的最后一项,将其转化为:
其中,W为指示矩阵,如果用户u对项目i评分过,则Wui=1,否则为0;⊙表示Hadamard积操作;
步骤3.3),根据以下公式计算目标函数关于隐藏特征矩阵P和Q的偏导数:
步骤3.4),使用梯度下降的方法求解用户隐藏特征矩阵P和项目隐藏特征矩阵Q。
5.根据权利要求4所述的基于属性耦合矩阵分解的项目推荐方法,其特征在于,所述步骤4)中,用户u对未评分过项目j的预测评分的计算方法如下:
R ~ u j = p u T q j
其中,pu和qj分别为用户u和项目j的隐藏特征向量。
CN201610705485.3A 2016-08-22 2016-08-22 一种基于属性耦合矩阵分解的项目推荐方法 Pending CN106294859A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610705485.3A CN106294859A (zh) 2016-08-22 2016-08-22 一种基于属性耦合矩阵分解的项目推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610705485.3A CN106294859A (zh) 2016-08-22 2016-08-22 一种基于属性耦合矩阵分解的项目推荐方法

Publications (1)

Publication Number Publication Date
CN106294859A true CN106294859A (zh) 2017-01-04

Family

ID=57615358

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610705485.3A Pending CN106294859A (zh) 2016-08-22 2016-08-22 一种基于属性耦合矩阵分解的项目推荐方法

Country Status (1)

Country Link
CN (1) CN106294859A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106651549A (zh) * 2017-01-09 2017-05-10 山东大学 一种融合供需链的个性化汽车推荐方法及系统
CN107273438A (zh) * 2017-05-24 2017-10-20 深圳大学 一种推荐方法、装置、设备及存储介质
CN108052534A (zh) * 2017-11-15 2018-05-18 南京邮电大学 一种基于地理特征的房地产推荐方法
CN108228833A (zh) * 2018-01-04 2018-06-29 浙江大学 一种利用用户倾向性学习解决社区项目推荐任务的方法
CN108376152A (zh) * 2018-02-02 2018-08-07 西北工业大学 一种基于矩阵分解的工作者推荐方法
CN108648783A (zh) * 2018-03-12 2018-10-12 杭州电子科技大学 一种医技检查项目相似性快速判别方法
CN109670914A (zh) * 2018-12-17 2019-04-23 华中科技大学 一种基于时间动态特性的产品推荐方法
CN110807154A (zh) * 2019-11-08 2020-02-18 内蒙古工业大学 一种基于混合深度学习模型的推荐方法与系统
CN110851731A (zh) * 2019-09-25 2020-02-28 浙江工业大学 一种用户属性耦合相似和兴趣语义相似的协同过滤推荐方法
CN110851701A (zh) * 2019-09-25 2020-02-28 浙江工业大学 一种基于用户上下文耦合相似度的概率矩阵分解推荐方法
CN111931043A (zh) * 2020-07-23 2020-11-13 重庆邮电大学 一种科技资源的推荐方法及系统
CN113407661A (zh) * 2021-08-18 2021-09-17 鲁东大学 基于鲁棒矩阵分解的离散哈希检索方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104111925A (zh) * 2013-04-16 2014-10-22 中国移动通信集团公司 项目推荐方法和装置
CN104156436A (zh) * 2014-08-13 2014-11-19 福州大学 一种社交云媒体协同过滤推荐方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104111925A (zh) * 2013-04-16 2014-10-22 中国移动通信集团公司 项目推荐方法和装置
CN104156436A (zh) * 2014-08-13 2014-11-19 福州大学 一种社交云媒体协同过滤推荐方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
YONGHONG YU ET AL: "A Coupled Clustering Approach for Items Recommendation", 《PAKDD 2013》 *
余永红: "一种基于耦合对象相似度的项目推荐算法", 《计算机科学》 *
高榕等: "一种融合情景和评论信息的位置社交网络兴趣点推荐模型", 《计算机研究与发展》 *

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106651549A (zh) * 2017-01-09 2017-05-10 山东大学 一种融合供需链的个性化汽车推荐方法及系统
CN106651549B (zh) * 2017-01-09 2019-10-01 山东大学 一种融合供需链的个性化汽车推荐方法及系统
CN107273438B (zh) * 2017-05-24 2021-02-23 深圳大学 一种推荐方法、装置、设备及存储介质
CN107273438A (zh) * 2017-05-24 2017-10-20 深圳大学 一种推荐方法、装置、设备及存储介质
CN108052534A (zh) * 2017-11-15 2018-05-18 南京邮电大学 一种基于地理特征的房地产推荐方法
CN108228833A (zh) * 2018-01-04 2018-06-29 浙江大学 一种利用用户倾向性学习解决社区项目推荐任务的方法
CN108228833B (zh) * 2018-01-04 2021-08-03 浙江大学 一种利用用户倾向性学习解决社区项目推荐任务的方法
CN108376152A (zh) * 2018-02-02 2018-08-07 西北工业大学 一种基于矩阵分解的工作者推荐方法
CN108648783B (zh) * 2018-03-12 2021-08-10 杭州电子科技大学 一种医技检查项目相似性快速判别方法
CN108648783A (zh) * 2018-03-12 2018-10-12 杭州电子科技大学 一种医技检查项目相似性快速判别方法
CN109670914A (zh) * 2018-12-17 2019-04-23 华中科技大学 一种基于时间动态特性的产品推荐方法
CN110851731A (zh) * 2019-09-25 2020-02-28 浙江工业大学 一种用户属性耦合相似和兴趣语义相似的协同过滤推荐方法
CN110851701A (zh) * 2019-09-25 2020-02-28 浙江工业大学 一种基于用户上下文耦合相似度的概率矩阵分解推荐方法
CN110851731B (zh) * 2019-09-25 2022-05-03 浙江工业大学 一种用户属性耦合相似和兴趣语义相似的协同过滤推荐方法
CN110807154A (zh) * 2019-11-08 2020-02-18 内蒙古工业大学 一种基于混合深度学习模型的推荐方法与系统
CN110807154B (zh) * 2019-11-08 2021-06-01 内蒙古工业大学 一种基于混合深度学习模型的推荐方法与系统
CN111931043A (zh) * 2020-07-23 2020-11-13 重庆邮电大学 一种科技资源的推荐方法及系统
CN111931043B (zh) * 2020-07-23 2023-09-29 重庆邮电大学 一种科技资源的推荐方法及系统
CN113407661A (zh) * 2021-08-18 2021-09-17 鲁东大学 基于鲁棒矩阵分解的离散哈希检索方法
CN113407661B (zh) * 2021-08-18 2021-11-26 鲁东大学 基于鲁棒矩阵分解的离散哈希检索方法

Similar Documents

Publication Publication Date Title
CN106294859A (zh) 一种基于属性耦合矩阵分解的项目推荐方法
CN103514255B (zh) 一种基于项目层次类别的协同过滤推荐方法
CN103631929B (zh) 一种用于搜索的智能提示的方法、模块和系统
CN104615767B (zh) 搜索排序模型的训练方法、搜索处理方法及装置
US11544578B2 (en) Method, device and equipment for fusing different instances describing same entity
CN109933721B (zh) 一种融合用户隐式物品偏好与隐式信任的可解释推荐方法
CN104156436B (zh) 一种社交云媒体协同过滤推荐方法
Gressman et al. Global classical solutions of the Boltzmann equation with long-range interactions
US20140195518A1 (en) System and Method for Data Mining Using Domain-Level Context
CN105740381B (zh) 一种基于复杂网络特性及神经网络聚类挖掘用户兴趣的方法
CN103544312B (zh) 基于社交网络的招聘信息匹配方法
CN104615687A (zh) 一种面向知识库更新的实体细粒度分类方法与系统
CN107145523A (zh) 基于迭代匹配的大型异构知识库对齐方法
CN105869016A (zh) 一种基于卷积神经网络的点击通过率预估方法
CN111400612A (zh) 一种融合社交影响和项目关联的个性化推荐方法
CN113360580A (zh) 基于知识图谱的异常事件检测方法、装置、设备及介质
Aydin et al. Applications of fractional calculus in equiaffine geometry: plane curves with fractional order
CN103150667A (zh) 一种基于本体结构的个性化推荐方法
Giorgi et al. Limit theorems for weighted and regular multilevel estimators
Bi et al. MM-GNN: Mix-moment graph neural network towards modeling neighborhood feature distribution
CN105446954A (zh) 一种面向科技大数据的项目查重方法
Pougué-Biyong et al. Learning stance embeddings from signed social graphs
Gauding et al. Generalised scale-by-scale energy-budget equations and large-eddy simulations of anisotropic scalar turbulence at various Schmidt numbers
CN112905906B (zh) 一种融合局部协同与特征交叉的推荐方法及系统
CN104133808B (zh) 基于复杂对应系统的用户行为一致性度测量方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170104

RJ01 Rejection of invention patent application after publication