CN106021298A - 一种基于非对称加权相似度的协同过滤推荐方法及系统 - Google Patents

一种基于非对称加权相似度的协同过滤推荐方法及系统 Download PDF

Info

Publication number
CN106021298A
CN106021298A CN201610289621.5A CN201610289621A CN106021298A CN 106021298 A CN106021298 A CN 106021298A CN 201610289621 A CN201610289621 A CN 201610289621A CN 106021298 A CN106021298 A CN 106021298A
Authority
CN
China
Prior art keywords
similarity
user
asymmetric
targeted customer
scoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610289621.5A
Other languages
English (en)
Other versions
CN106021298B (zh
Inventor
刘竹松
欧仕华
李志科
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN201610289621.5A priority Critical patent/CN106021298B/zh
Publication of CN106021298A publication Critical patent/CN106021298A/zh
Application granted granted Critical
Publication of CN106021298B publication Critical patent/CN106021298B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于非对称加权相似度的协同过滤推荐方法及系统,方法包括:根据用户共同评分项目所占的比例确定用户相似度非对称加权因子;根据用户相似度非对称加权因子分别采用余弦相似度度量法和均方差度量法计算拥有共同评分项目用户之间的相似度;采用矩阵分解梯度下降法对用户的原始相似度矩阵进行拟合计算,求出没有共同评分项目用户之间的相似度;根据拥有共同评分项目或没有共同评分项目用户之间的相似度选择k个相似度最大的用户作为目标用户的邻居,并根据这k个邻居的数据预测目标用户对未评分项目的评分;根据预测的结果生成目标用户的推荐项目。本发明具有用户相似度计算准确和推荐质量高的优点,可广泛应用于推荐技术领域。

Description

一种基于非对称加权相似度的协同过滤推荐方法及系统
技术领域
本发明涉及推荐技术领域,尤其是一种基于非对称加权相似度的协同过滤推荐方法及系统。
背景技术
互联网技术的迅猛发展把我们带进了信息爆炸的时代,海量信息的同时呈现,不仅使用户很难从中发现自已感兴趣的内容,而且使得大量少为人知的信息成为网络中的“暗信息”,无法被一般用户获取。推荐系统通过建立用户与项目(例如:产品、电影、音乐、节目等)之间的二元关系,利用用户历史选择信息或相似性关系挖掘用户潜在的兴趣爱好,进而进行推荐。
协同过滤是当前推荐系统中最常用的一种方法和技术,其基本思想是根据用户之前的喜好以及其他兴趣相近的用户的选择来给用户推荐内容。在推荐系统中,确定用户的相似度对于协同过滤推荐系统的推荐质量具有非常重要的影响。传统的协同过滤推荐系统利用不同用户间的共同评分项目来计算用户相似性,主要的相似性计算方法包括余弦相似性方法和相关相似性方法;目标用户对未评分项目的评分通过相似性较大的邻居对项目的评分的加权平均值进行预测。
然而,目前的协同过滤推荐系统在进行相似度计算时存在着以下缺陷或不足:
1)未考虑用户之间的共同已评分项目在所有已评分项目中所占的比例大小,导致其在两个用户共同已评分项目很少且评分相近时给出二者具有高相似度的错误结果(尽管二者在其它项目上的评分差异较大),影响了用户相似度计算的准确性;
2)假设用户之间相互的相似度是相等的,但这个假设在某些情况下会不成立,导致误判用户的相似度;
3)未考虑数据稀疏和冷启动问题,无法保证数据稀疏时或冷启动时的推荐质量。
发明内容
为解决上述技术问题,本发明的目的在于:提供一种用户相似度计算准确和推荐质量高的,基于非对称加权相似度的协同过滤推荐方法。
本发明的另一目的在于:提供一种用户相似度计算准确和推荐质量高的,基于非对称加权相似度的协同过滤推荐系统。
本发明所采取的技术方案是:
一种基于非对称加权相似度的协同过滤推荐方法,包括以下步骤:
A、根据用户共同评分项目所占的比例确定用户相似度非对称加权因子;
B、根据用户相似度非对称加权因子分别采用余弦相似度度量法和均方差度量法计算拥有共同评分项目用户之间的相似度;
C、采用矩阵分解梯度下降法对用户的原始相似度矩阵进行拟合计算,求出没有共同评分项目用户之间的相似度;
D、根据拥有共同评分项目或没有共同评分项目用户之间的相似度选择k个相似度最大的用户作为目标用户的邻居,并根据这k个邻居的数据预测目标用户对未评分项目的评分;
E、根据预测的结果生成目标用户的推荐项目。
进一步,所述步骤A包括:
A1、计算两个用户共同评分项目在目标用户所有已评分项目中的比例大小,以获取用户共同评分项目所占的比例;
A2、根据计算的比例得到初步的相似度加权因子,所述初步的相似度加权因子w(u,v)的表达式为:
w ( u , v ) = 1 - exp ( | T u v | | T v | ) ,
其中,v代表目标用户,u代表除目标用户v外的其它用户,Tuv为用户u和用户v的共同已评分项目集合,Tv为目标用户v的已评分项目集合,“||”符号用于求取集合的元素个数;
A3、将初步的相似度加权因子w(u,v)与索伦森指数相乘,得到最终的用户相似度非对称加权因子,所述用户相似度非对称加权因子asyw(u,v)的表达式为:
a s y w ( u , v ) = w ( u , v ) · S R S ( u , v ) = ( 1 - exp ( | T u v | | T v | ) ) · 2 | T u v | | T u | + | T v | ,
其中,SRS(u,v)为用户u和目标用户v的索伦森指数,Tu为用户u的已评分项目集合。
进一步,所述步骤B具体为:
根据用户相似度非对称加权因子asyw(u,v)分别计算余弦相似度度量法和均方差度量法的加权相似度,所述余弦相似度度量法的余弦加权相似度AWCOSw(u,v)的计算公式为:
A W C O S w ( u , v ) = C O S s i m ( u , v ) . a s y w ( u , v ) = Σ p ∈ T u v r u , p r v , p Σ p ∈ T u v r u , p 2 Σ p ∈ T u v r v , p 2 · ( 1 - exp ( | T u v | | T v | ) ) · 2 | T u v | | T u | + | T v | ,
所述均方差度量法的均方差加权相似度AWMSDsim(u,v)的计算公式为:
A W M S D s i m ( u , v ) = M S D s i m ( u , v ) · a s y w ( u , v ) = ( 1 - Σ p ∈ T u v ( r u , p - r v , p ) 2 L ( | T u v | ) ) · ( 1 - exp ( | T u v | | T v | ) ) · 2 | T u v | | T u | + | T v | ,
其中,COSsim(u,v)为用户u和目标用户v的非加权余弦相似度,MSDsim(u,v)为均方差度量法的非加权均方差相似度,ru,p为用户u对项目p的评分,rv,p为用户v对项目p的评分,L(|Tuv|)为用户u和目标用户v的均方差相似度阈值。
进一步,所述步骤C包括:
C1、将n×n阶的用户相似度矩阵S={Su,v}分解为两个用户特征向量U∈Rq×n和Z∈Rq×n,其中,n为用户的总数,q为用户维特征向量的维度,Su,v∈(0,1]表示根据均方差加权相似度AWCOS或均方差加权相似度AWMSD计算得到的用户u和用户v的相似度;Uu和Zv分别是特征向量U和Z中的列向量,分别表示用户u和用户v的q维特征向量;Rq×n为q×n维向量空间;
C2、采用梯度下降法调整U和Z,并在调整结束后通过U和Z的内积拟合原始相似矩阵S,最终得到没有共同评分项目用户之间的相似度。
进一步,所述步骤C2包括:
C21、确定梯度下降法所采用的目标函数,所述目标函数G(U,Z)的表达式为:
G ( U , Z ) = 1 2 Σ u = 1 n Σ v = 1 n I u v R ( S u , v - U u T Z v ) 2 + 1 2 ( λ 1 | | U | | F 2 + λ 2 | | Z | | F 2 ) ,
其中,λ1和λ2均为设定的权重系数,且λ1>0,λ2>0,||·||F是Frobeinus范数,是共同评分项目指示函数,若用户u和用户v存在基于AWCOS或AWMSD计算出来的相似度,则否则
C22、采用梯度下降法交替固定U和Z,通过最小化目标函数G(U,Z)求出G(U,Z)取最小值时对应的U和Z,然后以求出的U和Z的内积拟合原始相似矩阵S,最终得到没有共同评分项目用户之间的相似度。
进一步,所述步骤D根据这k个邻居的数据预测目标用户对未评分项目的评分时所采用的预测公式为:
P ( v , i ) = r ‾ v + Σ u = 1 k s i m ( u , v ) - r u , i Σ u = 1 k | s i m ( u , v ) | ,
其中,P(v,i)为目标用户v对未评分项目i的可能评分,sim(u,v)为用户u和目标用户v的相似度,“||”符号用于求取集合的元素个数,ru,i为用户u对目标用户v的未评分项目i的评分,为目标用户v对所有已评分项目评分的平均分。
本发明所采取的另一技术方案是:
一种基于非对称加权相似度的协同过滤推荐系统,包括:
非对称加权因子确定模块,用于根据用户共同评分项目所占的比例确定用户相似度非对称加权因子;
第一相似度计算模块,用于根据用户相似度非对称加权因子分别采用余弦相似度度量法和均方差度量法计算拥有共同评分项目用户之间的相似度;
第二相似度计算模块,用于采用矩阵分解梯度下降法对用户的原始相似度矩阵进行拟合计算,求出没有共同评分项目用户之间的相似度;
评分预测模块,用于根据拥有共同评分项目或没有共同评分项目用户之间的相似度选择k个相似度最大的用户作为目标用户的邻居,并根据这k个邻居的数据预测目标用户对未评分项目的评分;
推荐项目生成模块,用于根据预测的结果生成目标用户的推荐项目;
所述非对称加权因子确定模块的输出端依次通过第一相似度计算模块、第二相似度计算模块和评分预测模块进而与推荐项目生成模块的输入端连接。
进一步,所述非对称加权因子确定模块包括:
比例计算单元,用于计算两个用户共同评分项目在目标用户所有已评分项目中的比例大小,以获取用户共同评分项目所占的比例;
初步相似度加权因子获取单元,用于根据计算的比例得到初步的相似度加权因子,所述初步的相似度加权因子w(u,v)的表达式为:
w ( u , v ) = 1 - exp ( | T u v | | T v | ) ,
其中,v代表目标用户,u代表除目标用户v外的其它用户,Tuv为用户u和用户v的共同已评分项目集合,Tv为目标用户v的已评分项目集合,“||”符号用于求取集合的元素个数;
用户相似度非对称加权因子确定单元,用于将初步的相似度加权因子w(u,v)与索伦森指数相乘,得到最终的用户相似度非对称加权因子,所述用户相似度非对称加权因子asyw(u,v)的表达式为:
a s y w ( u , v ) = w ( u , v ) · S R S ( u , v ) = ( 1 - exp ( | T u v | | T v | ) ) · 2 | T u v | | T u | + | T v | ,
其中,SRS(u,v)为用户u和目标用户v的索伦森指数,Tu为用户u的已评分项目集合;
所述比例计算单元的输出端依次通过初步相似度加权因子获取单元和用户相似度非对称加权因子确定单元进而与第一相似度计算模块的输入端连接。
进一步,所述第一相似度计算模块具体执行以下操作:
根据用户相似度非对称加权因子asyw(u,v)分别计算余弦相似度度量法和均方差度量法的加权相似度,所述余弦相似度度量法的余弦加权相似度AWCOSw(u,v)的计算公式为:
A W C O S w ( u , v ) = C O S s i m ( u , v ) . a s y w ( u , v ) = Σ p ∈ T u v r u , p r v , p Σ p ∈ T u v r u , p 2 Σ p ∈ T u v r v , p 2 · ( 1 - exp ( | T u v | | T v | ) ) · 2 | T u v | | T u | + | T v | ,
所述均方差度量法的均方差加权相似度AWMSDsim(u,v)的计算公式为:
A W M S D s i m ( u , v ) = M S D s i m ( u , v ) · a s y w ( u , v ) = ( 1 - Σ p ∈ T u v ( r u , p - r v , p ) 2 L ( | T u v | ) ) · ( 1 - exp ( | T u v | | T v | ) ) · 2 | T u v | | T u | + | T v | ,
其中,COSsim(u,v)为用户u和目标用户v的非加权余弦相似度,MSDsim(u,v)为均方差度量法的非加权均方差相似度,ru,p为用户u对项目p的评分,rv,p为用户v对项目p的评分,L(|Tuv|)为用户u和目标用户v的均方差相似度阈值。
进一步,所述第二相似度计算模块包括:
分解单元,用于将n×n阶的用户相似度矩阵S={Su,v}分解为两个用户特征向量U∈Rq×n和Z∈Rq×n,其中,n为用户的总数,q为用户维特征向量的维度,Su,v∈(0,1]表示根据均方差加权相似度AWCOS或均方差加权相似度AWMSD计算得到的用户u和用户v的相似度;Uu和Zv分别是特征向量U和Z中的列向量,分别表示用户u和用户v的q维特征向量;Rq×n为q×n维向量空间;
梯度下降法调整单元,用于采用梯度下降法调整U和Z,并在调整结束后通过U和Z的内积拟合原始相似矩阵S,最终得到没有共同评分项目用户之间的相似度;
所述第一相似度计算模块的输出端依次通过分解单元和梯度下降法调整单元进而与评分预测模块的输入端连接。
本发明的方法的有益效果是:根据用户共同评分项目所占的比例确定用户相似度非对称加权因子,然后根据用户相似度非对称加权因子分别采用余弦相似度度量法和均方差度量法计算拥有共同评分项目用户之间的相似度,在进行用户相似度计算时考虑了用户之间的共同已评分项目在所有已评分项目中所占的比例大小,且用户相似度非对称加权因子采用了非对称加权因子来取代传统的对称加权因子,不再认为用户之间相互的相似度是相等的,提高了用户相似度计算的准确性;采用矩阵分解梯度下降法对用户的原始相似度矩阵进行拟合计算,通过矩阵分解技术来拟合没有共同评分项目用户之间的相似度,提高了数据稀疏时或冷启动时的推荐质量。
本发明的系统的有益效果是:非对称加权因子确定模块根据用户共同评分项目所占的比例确定用户相似度非对称加权因子,然后在非对称加权因子确定模块根据用户相似度非对称加权因子分别采用余弦相似度度量法和均方差度量法计算拥有共同评分项目用户之间的相似度,在进行用户相似度计算时考虑了用户之间的共同已评分项目在所有已评分项目中所占的比例大小,且用户相似度非对称加权因子采用了非对称加权因子来取代传统的对称加权因子,不再认为用户之间相互的相似度是相等的,提高了用户相似度计算的准确性;第二相似度计算模块采用矩阵分解梯度下降法对用户的原始相似度矩阵进行拟合计算,通过矩阵分解技术来拟合没有共同评分项目用户之间的相似度,提高了数据稀疏时或冷启动时的推荐质量。
附图说明
图1为本发明一种基于非对称加权相似度的协同过滤推荐方法的整体流程图;
图2为本发明一种基于非对称加权相似度的协同过滤推荐系统的整体框图;
图3为实施例二基于MSD、AWMSD、MF-AMSD和SVD的方法对MovieLens数据集进行处理的均方根误差对比图;
图4为实施例二基于MSD、AWMSD、MF-AMSD和SVD的方法对MovieLens数据集进行处理的均方根误差对比图;
图5为实施例二基于MSD、AWMSD、MF-AMSD和SVD的方法对Douban数据集进行处理的均方根误差对比图;
图6为实施例二基于MSD、AWMSD、MF-AMSD和SVD的方法对Douban数据集进行处理的平均绝对误差对比图。
具体实施方式
参照图1,一种基于非对称加权相似度的协同过滤推荐方法,包括以下步骤:
A、根据用户共同评分项目所占的比例确定用户相似度非对称加权因子;
B、根据用户相似度非对称加权因子分别采用余弦相似度度量法和均方差度量法计算拥有共同评分项目用户之间的相似度;
C、采用矩阵分解梯度下降法对用户的原始相似度矩阵进行拟合计算,求出没有共同评分项目用户之间的相似度;
D、根据拥有共同评分项目或没有共同评分项目用户之间的相似度选择k个相似度最大的用户作为目标用户的邻居,并根据这k个邻居的数据预测目标用户对未评分项目的评分;
E、根据预测的结果生成目标用户的推荐项目。
进一步作为优选的实施方式,所述步骤A包括:
A1、计算两个用户共同评分项目在目标用户所有已评分项目中的比例大小,以获取用户共同评分项目所占的比例;
A2、根据计算的比例得到初步的相似度加权因子,所述初步的相似度加权因子w(u,v)的表达式为:
w ( u , v ) = 1 - exp ( | T u v | | T v | ) ,
其中,v代表目标用户,u代表除目标用户v外的其它用户,Tuv为用户u和用户v的共同已评分项目集合,Tv为目标用户v的已评分项目集合,“||”符号用于求取集合的元素个数;
A3、将初步的相似度加权因子w(u,v)与索伦森指数相乘,得到最终的用户相似度非对称加权因子,所述用户相似度非对称加权因子asyw(u,v)的表达式为:
a s y w ( u , v ) = w ( u , v ) · S R S ( u , v ) = ( 1 - exp ( | T u v | | T v | ) ) · 2 | T u v | | T u | + | T v | ,
其中,SRS(u,v)为用户u和目标用户v的索伦森指数,Tu为用户u的已评分项目集合。
进一步作为优选的实施方式,所述步骤B具体为:
根据用户相似度非对称加权因子asyw(u,v)分别计算余弦相似度度量法和均方差度量法的加权相似度,所述余弦相似度度量法的余弦加权相似度AWCOSw(u,v)的计算公式为:
A W C O S w ( u , v ) = C O S s i m ( u , v ) . a s y w ( u , v ) = Σ p ∈ T u v r u , p r v , p Σ p ∈ T u v r u , p 2 Σ p ∈ T u v r v , p 2 · ( 1 - exp ( | T u v | | T v | ) ) · 2 | T u v | | T u | + | T v | ,
所述均方差度量法的均方差加权相似度AWMSDsim(u,v)的计算公式为:
A W M S D s i m ( u , v ) = M S D s i m ( u , v ) · a s y w ( u , v ) = ( 1 - Σ p ∈ T u v ( r u , p - r v , p ) 2 L ( | T u v | ) ) · ( 1 - exp ( | T u v | | T v | ) ) · 2 | T u v | | T u | + | T v | ,
其中,COSsim(u,v)为用户u和目标用户v的非加权余弦相似度,MSDsim(u,v)为均方差度量法的非加权均方差相似度,ru,p为用户u对项目p的评分,rv,p为用户v对项目p的评分,L(|Tuv|)为用户u和目标用户v的均方差相似度阈值。
进一步作为优选的实施方式,所述步骤C包括:
C1、将n×n阶的用户相似度矩阵S={Su,v}分解为两个用户特征向量U∈Rq×n和Z∈Rq×n,其中,n为用户的总数,q为用户维特征向量的维度,Su,v∈(0,1]表示根据均方差加权相似度AWCOS或均方差加权相似度AWMSD计算得到的用户u和用户v的相似度;Uu和Zv分别是特征向量U和Z中的列向量,分别表示用户u和用户v的q维特征向量;Rq×n为q×n维向量空间;
C2、采用梯度下降法调整U和Z,并在调整结束后通过U和Z的内积拟合原始相似矩阵S,最终得到没有共同评分项目用户之间的相似度。
进一步作为优选的实施方式,所述步骤C2包括:
C21、确定梯度下降法所采用的目标函数,所述目标函数G(U,Z)的表达式为:
G ( U , Z ) = 1 2 Σ u = 1 n Σ v = 1 n I u v R ( S u , v - U u T Z v ) 2 + 1 2 ( λ 1 | | U | | F 2 + λ 2 | | Z | | F 2 ) ,
其中,λ1和λ2均为设定的权重系数,且λ1>0,λ2>0,||·||F是Frobeinus范数,是共同评分项目指示函数,若用户u和用户v存在基于AWCOS或AWMSD计算出来的相似度,则否则
C22、采用梯度下降法交替固定U和Z,通过最小化目标函数G(U,Z)求出G(U,Z)取最小值时对应的U和Z,然后以求出的U和Z的内积拟合原始相似矩阵S,最终得到没有共同评分项目用户之间的相似度。
进一步作为优选的实施方式,所述步骤D根据这k个邻居的数据预测目标用户对未评分项目的评分时所采用的预测公式为:
P ( v , i ) = r ‾ v + Σ u = 1 k s i m ( u , v ) - r u , i Σ u = 1 k | s i m ( u , v ) | ,
其中,P(v,i)为目标用户v对未评分项目i的可能评分,sim(u,v)为用户u和目标用户v的相似度,“||”符号用于求取集合的元素个数,ru,i为用户u对目标用户v的未评分项目i的评分,为目标用户v对所有已评分项目评分的平均分。
参照图2,一种基于非对称加权相似度的协同过滤推荐系统,包括:
非对称加权因子确定模块,用于根据用户共同评分项目所占的比例确定用户相似度非对称加权因子;
第一相似度计算模块,用于根据用户相似度非对称加权因子分别采用余弦相似度度量法和均方差度量法计算拥有共同评分项目用户之间的相似度;
第二相似度计算模块,用于采用矩阵分解梯度下降法对用户的原始相似度矩阵进行拟合计算,求出没有共同评分项目用户之间的相似度;
评分预测模块,用于根据拥有共同评分项目或没有共同评分项目用户之间的相似度选择k个相似度最大的用户作为目标用户的邻居,并根据这k个邻居的数据预测目标用户对未评分项目的评分;
推荐项目生成模块,用于根据预测的结果生成目标用户的推荐项目;
所述非对称加权因子确定模块的输出端依次通过第一相似度计算模块、第二相似度计算模块和评分预测模块进而与推荐项目生成模块的输入端连接。
参照图2,进一步作为优选的实施方式,所述非对称加权因子确定模块包括:
比例计算单元,用于计算两个用户共同评分项目在目标用户所有已评分项目中的比例大小,以获取用户共同评分项目所占的比例;
初步相似度加权因子获取单元,用于根据计算的比例得到初步的相似度加权因子,所述初步的相似度加权因子w(u,v)的表达式为:
w ( u , v ) = 1 - exp ( | T u v | | T v | ) ,
其中,v代表目标用户,u代表除目标用户v外的其它用户,Tuv为用户u和用户v的共同已评分项目集合,Tv为目标用户v的已评分项目集合,“||”符号用于求取集合的元素个数;
用户相似度非对称加权因子确定单元,用于将初步的相似度加权因子w(u,v)与索伦森指数相乘,得到最终的用户相似度非对称加权因子,所述用户相似度非对称加权因子asyw(u,v)的表达式为:
a s y w ( u , v ) = w ( u , v ) · S R S ( u , v ) = ( 1 - exp ( | T u v | | T v | ) ) · 2 | T u v | | T u | + | T v | ,
其中,SRS(u,v)为用户u和目标用户v的索伦森指数,Tu为用户u的已评分项目集合;
所述比例计算单元的输出端依次通过初步相似度加权因子获取单元和用户相似度非对称加权因子确定单元进而与第一相似度计算模块的输入端连接。
进一步作为优选的实施方式,所述第一相似度计算模块具体执行以下操作:
根据用户相似度非对称加权因子asyw(u,v)分别计算余弦相似度度量法和均方差度量法的加权相似度,所述余弦相似度度量法的余弦加权相似度AWCOSw(u,v)的计算公式为:
A W C O S w ( u , v ) = C O S s i m ( u , v ) . a s y w ( u , v ) = Σ p ∈ T u v r u , p r v , p Σ p ∈ T u v r u , p 2 Σ p ∈ T u v r v , p 2 · ( 1 - exp ( | T u v | | T v | ) ) · 2 | T u v | | T u | + | T v | ,
所述均方差度量法的均方差加权相似度AWMSDsim(u,v)的计算公式为:
A W M S D s i m ( u , v ) = M S D s i m ( u , v ) · a s y w ( u , v ) = ( 1 - Σ p ∈ T u v ( r u , p - r v , p ) 2 L ( | T u v | ) ) · ( 1 - exp ( | T u v | | T v | ) ) · 2 | T u v | | T u | + | T v | ,
其中,COSsim(u,v)为用户u和目标用户v的非加权余弦相似度,MSDsim(u,v)为均方差度量法的非加权均方差相似度,ru,p为用户u对项目p的评分,rv,p为用户v对项目p的评分,L(|Tuv|)为用户u和目标用户v的均方差相似度阈值。
参照图2,进一步作为优选的实施方式,所述第二相似度计算模块包括:
分解单元,用于将n×n阶的用户相似度矩阵S={Su,v}分解为两个用户特征向量U∈Rq×n和Z∈Rq×n,其中,n为用户的总数,q为用户维特征向量的维度,Su,v∈(0,1]表示根据均方差加权相似度AWCOS或均方差加权相似度AWMSD计算得到的用户u和用户v的相似度;Uu和Zv分别是特征向量U和Z中的列向量,分别表示用户u和用户v的q维特征向量;Rq×n为q×n维向量空间;
梯度下降法调整单元,用于采用梯度下降法调整U和Z,并在调整结束后通过U和Z的内积拟合原始相似矩阵S,最终得到没有共同评分项目用户之间的相似度;
所述第一相似度计算模块的输出端依次通过分解单元和梯度下降法调整单元进而与评分预测模块的输入端连接。
下面结合说明书附图和具体实施例对本发明作进一步解释和说明。
实施例一
本实施例对本发明所涉及的相关理论及实现原理进行解释和说明。
(一)传统的用户相似度计算方法
传统的用户相似度计算方法有三种:相关系数、余弦相似度和均方差。本发明主要使用余弦相似度和均方差来设计相似度度量模型。
在推荐系统中,用户的评分数据可以表示为一个m行n列的用户-项目评分矩阵Ru,其中,m是用户的个数,n是项目的个数。用户和项目分别在集合U和T中。
第h行第j列的元素rh,j表示用户uh对项目tj的评分。用户u和用户v各自的评分向量为Ru={ru,1,ru,2,…,ru,n}和Rv={rv,1,rv,2,…,rv,n},可由评分向量得到两者的评分均值去掉未评分项目可分别求得u和v的已评分项目集合Tu={tj|tj∈T∧ru,j≠0}和Tv={tj|tj∈T∧rv,j≠0},传统用户相似度度量方法使用两个用户的共同已评分项目集合Tuv={tj|tj∈T∧ru,j≠0∧rv,j≠0}来计算两者的相似度。
(1)基于余弦相似度的用户相似度度量方法(即COS方法)
基于余弦相似度的用户相似度度量方法所采用的计算公式为:
C O S s i m ( u , v ) = R u · R v | | R u | | · | | R v | | = Σ p ∈ T u v r u , p r v , p Σ p ∈ T u v r u , p 2 Σ p ∈ T u v r 2 v , p - - - ( 1 )
(2)基于均方差的用户相似度度量方法(即MSD方法)
基于均方差的用户相似度度量方法所采用的计算公式为:
M S D si m ( u , v ) = L - M S D ( u , v ) L = 1 - Σ p ∈ T u v ( r u , p - r v , p ) 2 L ( | T u v | ) - - - ( 2 )
其中,ru,p是用户u对项目p的评分,是用户u对所有已评分项目的平均评分,L是均方差的阈值,若两用户之间的均方差超过L,则认为两者之间没有相似度。
然而,上述两种相似度度量方法存在一些问题。首先,当两个用户共同已评分项目很少而且评分相近,传统的相似度度量方法会得出两者具有高相似度的结果,但是两者在其他项目上的评分有可能存在较大差异性,这样会导致错误的判断,因此相似度度量方法还需要考虑用户之间的共同已评分项目在已评分项目中占的比例大小。其次,传统相似度度量方法认为两个用户之间的相似性关系是平等的,这些方法都是基于用户彼此相似度sim(u,v)=sim(v,u)的假设。表1就给出了一个用户-项目评分矩阵的例子(没有分数代表未评分),从表1可以看出,对于U5来说,U6的评分信息与其非常相近,但反过来就不一定成立,因此相似度度量方法有必要把这两种情况区分开来。
表1用户-项目评分矩阵例子
I1 I2 I3 I4 I5 I6
U1 2 3
U2 4 5 3
U3 2 2 3 3 2
U4 3 1
U5 3 3
U6 2 1 3 2 3 2
(二)非对称的加权相似度度量方法
为了解决(一)所提到的两种问题,本文对基于余弦相似度和均方差的传统方法进行改进,提出一种非对称的加权相似度度量方法。该非对称的加权相似度度量方法的实现过程如下:
首先,本发明提出了一种考虑两个用户共同已评分项目在目标用户的已评分项目中所占比例的加权因子,该加权因子表述为:
w ( u , v ) = 1 - exp ( | T u v | | T v | ) - - - ( 3 )
公式(3)尽管考虑了两个用户的共同已评分项目所占的比例,但忽略了共同已评分项目在两个用户的已评分项目并集中占的比例,该比例称为索伦森指数(SRS),继续改进加权因子,方法如下:
a s y w ( u , v ) = w ( u , v ) · S R S ( u , v ) = ( 1 - exp ( | T u v | | T v | ) ) · 2 | T u v | | T u | + | T v | - - - ( 4 )
然后,使用公式(4)的加权因子改进传统的相似度度量方法,以形成本发明非对称的加权相似度度量方法。其方法如下:
(1)加权后的基于余弦相似度的相似度度量方法(即AWCOS方法)
加权后的基于余弦相似度的相似度度量方法所采用的公式为:
A W C O S w ( u , v ) = C O S s i m ( u , v ) . a s y w ( u , v ) = Σ p ∈ T u v r u , p r v , p Σ p ∈ T u v r u , p 2 Σ p ∈ T u v r v , p 2 · ( 1 - exp ( | T u v | | T v | ) ) · 2 | T u v | | T u | + | T v | - - - ( 5 )
(2)加权后的基于均方差的相似度度量方法(即AWMSD方法)
A W M S D s i m ( u , v ) = M S D s i m ( u , v ) · a s y w ( u , v ) = ( 1 - Σ p ∈ T u v ( r u , p - r v , p ) 2 L ( | T u v | ) ) · ( 1 - exp ( | T u v | | T v | ) ) · 2 | T u v | | T u | + | T v | - - - ( 6 )
下面使用表1的例子来说明上述改进的用户相似度度量方法。表2和表3分别给出了根据传统的基于余弦相似度和均方差的用户相似度度量方法计算出来的用户相似矩阵。从表中可以看出,传统方法得到的用户相似矩阵是对称的,如sim(U2,U3)=sim(U3,U2)。而表4和表5则分别给出了根据AWCOS和AWMSD方法得到的非对称用户相似矩阵。从表4和5中可观察到sim(U6,U3)>sim(U6,U5),也就是说在U6看来,U3比U5与自己更相似,表1里三者的评分数据体现了这一点。但表3传统基于均方差的相似度度量方法却得到了相反的结论,而本发明所提出的非对称加权因子成功修正了这个缺点。从表4和5中还能观察到sim(U5,U3)>sim(U5,U6),其中,(U5,U3)和(U5,U6)的共同已评分项目都是I3和I6,且评分都相同,导致这两对用户之间相似度不等的原因是共同已评分项目分别在U3和U6的已评分项目中占的比例不相等,证明本发明所提出的非对称加权因子已经考虑共同已评分项目在已评分项目中所占比例对用户相似度结果的影响。
表2基于传统的COS方法得到的用户相似矩阵
U1 U2 U3 U4 U5 U6
U1 * 0.66 0.53 0.59 0.55
U2 * 0.75 * 0.5 0.74
U3 0.66 0.75 0.35 0.77 0.92
U4 0.53 * 0.35 * 0.28
U5 0.59 0.5 0.77 * 0.76
U6 0.55 0.74 0.92 0.28 0.76
表3基于传统的MSD方法得到的用户相似矩阵
U1 U2 U3 U4 U5 U6
U1 * 1 0.92 1 0.96
U2 * 0.75 * 0.67 0.75
U3 1 0.75 0.92 1 0.98
U4 0.92 * 0.92 * 0.79
U5 1 0.67 1 * 1
U6 0.96 0.75 0.98 0.79 1
表4采用本发明的AWCOS方法得到的用户相似矩阵
U1 U2 U3 U4 U5 U6
U1 * 0.38 0.13 0.15 0.27
U2 * 0.56 * 0.07 0.49
U3 0.15 0.34 0.02 0.18 0.83
U4 0.13 * 0.05 * 0.14
U5 0.15 0.1 0.44 * 0.38
U6 0.09 0.25 0.7 0.05 0.13
表5采用本发明的AWMSD方法得到的用户相似矩阵
U1 U2 U3 U4 U5 U6
U1 * 0.36 0.18 0.2 0.3
U2 * 0.36 * 0.08 0.32
U3 0.19 0.25 0.05 0.19 0.57
U4 0.18 * 0.1 * 0.25
U5 0.2 0.1 0.36 * 0.32
U6 0.14 0.2 0.51 0.11 0.14
(三)用户相似矩阵分解
矩阵分解的基本思想是用低阶矩阵来拟合原始矩阵,本发明主要通过梯度下降法将用户相似矩阵分解为两个用户特征向量,然后通过两个用户特征向量内积获得未知的用户相似度数据。
令S={Su,v}表示一个n×n阶的用户相似矩阵,其中,Su,v∈(0,1]表示根据AWCOS或AWMSD计算得到的用户u和用户v的相似度,n是用户总数。这两个用户的特征向量分别表示为U∈Rq×n和Z∈Rq×n,Uu和Zv都是列向量,分别表示用户u和用户v的q维特征向量。本发明通过调整低阶矩阵U和Z,使其乘积不断逼近原始相似矩阵S,以此来拟合未知的相似度数据。因此可以定义如下的目标函数:
G ( U , Z ) = 1 2 Σ u = 1 n Σ v = 1 n I u v R ( S u , v - U u T Z v ) 2 + 1 2 ( λ 1 | | U | | F 2 + λ 2 | | Z | | F 2 ) - - - ( 7 )
其中,λ1和λ2均为设定的权重系数,且λ1>0,λ2>0,||·||F是Frobeinus范数,是指示函数,若用户u和用户v存在基于AWCOS或AWMSD计算出来的相似度,则否则
本文使用矩阵分解梯度下降法交替固定U和Z,通过最小化目标函数求得U和Z,以拟合原始相似矩阵,从而求得未知的相似度数据。然后选择k个相似度最大的用户作为目标用户的邻居,通过评分预测函数P(v,i)预测用户v对项目i的可能评分,其计算公式如下:
P ( v , i ) = r ‾ v + Σ u = 1 k s i m ( u , v ) - r u , i Σ u = 1 k | s i m ( u , v ) | - - - ( 8 )
实施例二
参照图3-6,本发明的第二实施例:
本实施例使用的数据集为MovieLens和Douban,两数据集分别包含100000和116221条评分记录,评分范围在1和5之间,评分值越高表示用户越喜欢该项目。把评分数据随机分为两个不相交的集合:训练集和测试集,分别占80%和20%。每种相似度度量方法通过训练集预测未知评分值,使用测试集来评估每种方法的预测准确率。
为了评估所提方法的预测准确率,本发明采用两种常用的指标:均方根误差(RMSE)和平均绝对误差(MAE),计算公式如下:
R A S E = 1 M Σ u , i ( R u , i - R ‾ u , i ) 2 - - - ( 9 )
M A E = 1 M Σ u , i | R u , i - R ‾ u , i | - - - ( 10 )
其中,Ru,i表示用户u对项目i的实际评分,表示用户u对项目i的预测评分,M表示预测评分的数量。RMSE和MAE越大表示预测的质量越差。
本实施例所采用的对比算法包括:
(1)基于余弦相似度和均方差的传统协同过滤算法:COS和MSD。
(2)使用非对称加权因子改进后的传统方法:AWCOS和AWMSD。
(3)使用非对称加权因子和矩阵分解技术改进后的传统方法:MF-AWCOS和MF-AWMSD。
(3)SVD算法,一个基于维度下降的经典算法,通过把用户-项目评分矩阵拆分为3个矩阵求解缺失评分项。
为了尽量保留评分信息,AWMSD和MF-AWMSD方法里相似度阈值L设置为12。
为了观察不同算法对推荐精度的影响,本实施例在MovieLens和Douban两个数据集上进行测试,比较算法在不同最近邻居数量下的性能。最近邻居数量分别取20、40、60、80、100、120、140、160、180、200,测试结果展示在图3到图6中,在此只画出MSD、AWMSD、MF-AWMSD和SVD四种算法的结果,另外三种算法的结论相似,这里不再赘述。由图3和图4MovieLens数据集上的测试结果可以得到如下结论:
(1)若只使用非对称加权因子改进MSD算法,推荐质量提升效果并不明显,相对来说非对称加权因子更适用于改进COS算法。
(2)对于MovieLens数据集,基于MSD的三种算法总体性能高于另外三种基于COS的算法。当最近邻居数目为200时,MF-AWCOS方法与COS方法相比,RMSE提高了7.8%,MAE提高了6%。MF-AWMSD方法与MSD方法相比,RMSE提高了5.8%,MAE提高了4.6%,加权因子和矩阵分解技术对基于COS的算法的改进效果更明显。
图5和图6是Douban数据集上的测试结果。改进后的算法应用在Douban数据集比应用在MovieLens数据集具有更明显的改善效果,因为Douban数据集的抽样数据更为稀疏,使用矩阵分解技术拟合未知用户的相似度对提高推荐质量具有更显著的效果。
针对传统协同过滤算法里对称相似度计算方法会导致用户相似度测量值存在误差,数据稀疏和冷启动问题会导致推荐质量不高等这两个问题,本发明提出了一种非对称的加权相似度协同过滤方法及系统,通过计算用户共同评分项目所占比例来确定用户相似度非对称加权因子,以表现用户之间相互影响的差异性;通过加权因子和传统相似度度量方法确定用户相似矩阵,并使用矩阵分解梯度下降法来拟合没有共同评分项目的用户之间的相似度数据。本发明不仅能计算拥有共同评分项目用户之间的相似度,而且还能够计算没有共同评分项目用户之间的相似度。
以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (10)

1.一种基于非对称加权相似度的协同过滤推荐方法,其特征在于:包括以下步骤:
A、根据用户共同评分项目所占的比例确定用户相似度非对称加权因子;
B、根据用户相似度非对称加权因子分别采用余弦相似度度量法和均方差度量法计算拥有共同评分项目用户之间的相似度;
C、采用矩阵分解梯度下降法对用户的原始相似度矩阵进行拟合计算,求出没有共同评分项目用户之间的相似度;
D、根据拥有共同评分项目或没有共同评分项目用户之间的相似度选择k个相似度最大的用户作为目标用户的邻居,并根据这k个邻居的数据预测目标用户对未评分项目的评分;
E、根据预测的结果生成目标用户的推荐项目。
2.根据权利要求1所述的一种基于非对称加权相似度的协同过滤推荐方法,其特征在于:所述步骤A包括:
A1、计算两个用户共同评分项目在目标用户所有已评分项目中的比例大小,以获取用户共同评分项目所占的比例;
A2、根据计算的比例得到初步的相似度加权因子,所述初步的相似度加权因子w(u,v)的表达式为:
w ( u , v ) = 1 - exp ( | T u v | | T v | ) ,
其中,v代表目标用户,u代表除目标用户v外的其它用户,Tuv为用户u和用户v的共同已评分项目集合,Tv为目标用户v的已评分项目集合,“||”符号用于求取集合的元素个数;
A3、将初步的相似度加权因子w(u,v)与索伦森指数相乘,得到最终的用户相似度非对称加权因子,所述用户相似度非对称加权因子asyw(u,v)的表达式为:
a s y w ( u , v ) = w ( u , v ) · S R S ( u , v ) = ( 1 - exp ( | T u v | | T v | ) ) · 2 | T u v | | T u | + | T v | ,
其中,SRS(u,v)为用户u和目标用户v的索伦森指数,Tu为用户u的已评分项目集合。
3.根据权利要求2所述的一种基于非对称加权相似度的协同过滤推荐方法,其特征在于:所述步骤B具体为:
根据用户相似度非对称加权因子asyw(u,v)分别计算余弦相似度度量法和均方差度量法的加权相似度,所述余弦相似度度量法的余弦加权相似度AWCOSw(u,v)的计算公式为:
A W C O S w ( u , v ) = C O S s i m ( u , v ) . a s y w ( u , v ) = Σ p ∈ T u v r u , p r v , p Σ p ∈ T u v r u , p 2 Σ p ∈ T u v r v , p 2 · ( 1 - exp ( | T u v | | T v | ) ) · 2 | T u v | | T u | + | T v | ,
所述均方差度量法的均方差加权相似度AWMSDsim(u,v)的计算公式为:
A W M S D s i m ( u , v ) = M S D s i m ( u , v ) · a s y w ( u , v ) = ( 1 - Σ p ∈ T u v ( r u , p - r v , p ) 2 L ( | T u v | ) ) · ( 1 - exp ( | T u v | | T v | ) ) · 2 | T u v | | T u | + | T v | ,
其中,COSsim(u,v)为用户u和目标用户v的非加权余弦相似度,MSDsim(u,v)为均方差度量法的非加权均方差相似度,ru,p为用户u对项目p的评分,rv,p为用户v对项目p的评分,L(|Tuv|)为用户u和目标用户v的均方差相似度阈值。
4.根据权利要求3所述的一种基于非对称加权相似度的协同过滤推荐方法,其特征在于:所述步骤C包括:
C1、将n×n阶的用户相似度矩阵S={Su,v}分解为两个用户特征向量U∈Rq×n和Z∈Rq×n,其中,n为用户的总数,q为用户维特征向量的维度,Su,v∈(0,1]表示根据均方差加权相似度AWCOS或均方差加权相似度AWMSD计算得到的用户u和用户v的相似度;Uu和Zv分别是特征向量U和Z中的列向量,分别表示用户u和用户v的q维特征向量;Rq×n为q×n维向量空间;
C2、采用梯度下降法调整U和Z,并在调整结束后通过U和Z的内积Zv拟合原始相似矩阵S,最终得到没有共同评分项目用户之间的相似度。
5.根据权利要求4所述的一种基于非对称加权相似度的协同过滤推荐方法,其特征在于:所述步骤C2包括:
C21、确定梯度下降法所采用的目标函数,所述目标函数G(U,Z)的表达式为:
G ( U , Z ) = 1 2 Σ u = 1 n Σ v = 1 n I u v R ( S u , v - U u T Z z ) 2 + 1 2 ( λ 1 | | U | | F 2 + λ 2 | | Z | | F 2 ) ,
其中,λ1和λ2均为设定的权重系数,且λ1>0,λ2>0,||·||F是Frobeinus范数,是共同评分项目指示函数,若用户u和用户v存在基于AWCOS或AWMSD计算出来的相似度,则否则
C22、采用梯度下降法交替固定U和Z,通过最小化目标函数G(U,Z)求出G(U,Z)取最小值时对应的U和Z,然后以求出的U和Z的内积Zv拟合原始相似矩阵S,最终得到没有共同评分项目用户之间的相似度。
6.根据权利要求1-5任一项所述的一种基于非对称加权相似度的协同过滤推荐方法,其特征在于:所述步骤D根据这k个邻居的数据预测目标用户对未评分项目的评分时所采用的预测公式为:
P ( v , i ) = r ‾ v + Σ u = 1 k s i m ( u , v ) - r u , i Σ u = 1 k | s i m ( u , v ) | ,
其中,P(v,i)为目标用户v对未评分项目i的可能评分,sim(u,v)为用户u和目标用户v的相似度,“||”符号用于求取集合的元素个数,ru,i为用户u对目标用户v的未评分项目i的评分,为目标用户v对所有已评分项目评分的平均分。
7.一种基于非对称加权相似度的协同过滤推荐系统,其特征在于:包括:
非对称加权因子确定模块,用于根据用户共同评分项目所占的比例确定用户相似度非对称加权因子;
第一相似度计算模块,用于根据用户相似度非对称加权因子分别采用余弦相似度度量法和均方差度量法计算拥有共同评分项目用户之间的相似度;
第二相似度计算模块,用于采用矩阵分解梯度下降法对用户的原始相似度矩阵进行拟合计算,求出没有共同评分项目用户之间的相似度;
评分预测模块,用于根据拥有共同评分项目或没有共同评分项目用户之间的相似度选择k个相似度最大的用户作为目标用户的邻居,并根据这k个邻居的数据预测目标用户对未评分项目的评分;
推荐项目生成模块,用于根据预测的结果生成目标用户的推荐项目;
所述非对称加权因子确定模块的输出端依次通过第一相似度计算模块、第二相似度计算模块和评分预测模块进而与推荐项目生成模块的输入端连接。
8.根据权利要求1所述的一种基于非对称加权相似度的协同过滤推荐系统,其特征在于:所述非对称加权因子确定模块包括:
比例计算单元,用于计算两个用户共同评分项目在目标用户所有已评分项目中的比例大小,以获取用户共同评分项目所占的比例;
初步相似度加权因子获取单元,用于根据计算的比例得到初步的相似度加权因子,所述初步的相似度加权因子w(u,v)的表达式为:
w ( u , v ) = 1 - exp ( | T u v | | T v | ) ,
其中,v代表目标用户,u代表除目标用户v外的其它用户,Tuv为用户u和用户v的共同已评分项目集合,Tv为目标用户v的已评分项目集合,“||”符号用于求取集合的元素个数;
用户相似度非对称加权因子确定单元,用于将初步的相似度加权因子w(u,v)与索伦森指数相乘,得到最终的用户相似度非对称加权因子,所述用户相似度非对称加权因子asyw(u,v)的表达式为:
a s y w ( u , v ) = w ( u , v ) · S R S ( u , v ) = ( 1 - exp ( | T u v | | T v | ) ) · 2 | T u v | | T u | + | T v | ,
其中,SRS(u,v)为用户u和目标用户v的索伦森指数,Tu为用户u的已评分项目集合;
所述比例计算单元的输出端依次通过初步相似度加权因子获取单元和用户相似度非对称加权因子确定单元进而与第一相似度计算模块的输入端连接。
9.根据权利要求8所述的一种基于非对称加权相似度的协同过滤推荐系统,其特征在于:所述第一相似度计算模块具体执行以下操作:
根据用户相似度非对称加权因子asyw(u,v)分别计算余弦相似度度量法和均方差度量法的加权相似度,所述余弦相似度度量法的余弦加权相似度AWCOSw(u,v)的计算公式为:
A W C O S w ( u , v ) = C O S s i m ( u , v ) . a s y w ( u , v ) = Σ p ∈ T u v r u , p r v , p Σ p ∈ T u v r u , p 2 Σ p ∈ T u v r v , p 2 · ( 1 - exp ( | T u v | | T v | ) ) · 2 | T u v | | T u | + | T v | ,
所述均方差度量法的均方差加权相似度AWMSDsim(u,v)的计算公式为:
A W M S D s i m ( u , v ) = M S D s i m ( u , v ) · a s y w ( u , v ) = ( 1 - Σ p ∈ T u v ( r u , p - r v , p ) 2 L ( | T u v | ) ) · ( 1 - exp ( | T u v | | T v | ) ) · 2 | T u v | | T u | + | T v | ,
其中,COSsim(u,v)为用户u和目标用户v的非加权余弦相似度,MSDsim(u,v)为均方差度量法的非加权均方差相似度,ru,p为用户u对项目p的评分,rv,p为用户v对项目p的评分,L(|Tuv|)为用户u和目标用户v的均方差相似度阈值。
10.根据权利要求9所述的一种基于非对称加权相似度的协同过滤推荐系统,其特征在于:所述第二相似度计算模块包括:
分解单元,用于将n×n阶的用户相似度矩阵S={Su,v}分解为两个用户特征向量U∈Rq×n和Z∈Rq×n,其中,n为用户的总数,q为用户维特征向量的维度,Su,v∈(0,1]表示根据均方差加权相似度AWCOS或均方差加权相似度AWMSD计算得到的用户u和用户v的相似度;Uu和Zv分别是特征向量U和Z中的列向量,分别表示用户u和用户v的q维特征向量;Rq×n为q×n维向量空间;
梯度下降法调整单元,用于采用梯度下降法调整U和Z,并在调整结束后通过U和Z的内积Zv拟合原始相似矩阵S,最终得到没有共同评分项目用户之间的相似度;
所述第一相似度计算模块的输出端依次通过分解单元和梯度下降法调整单元进而与评分预测模块的输入端连接。
CN201610289621.5A 2016-05-03 2016-05-03 一种基于非对称加权相似度的协同过滤推荐方法及系统 Expired - Fee Related CN106021298B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610289621.5A CN106021298B (zh) 2016-05-03 2016-05-03 一种基于非对称加权相似度的协同过滤推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610289621.5A CN106021298B (zh) 2016-05-03 2016-05-03 一种基于非对称加权相似度的协同过滤推荐方法及系统

Publications (2)

Publication Number Publication Date
CN106021298A true CN106021298A (zh) 2016-10-12
CN106021298B CN106021298B (zh) 2019-05-28

Family

ID=57081718

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610289621.5A Expired - Fee Related CN106021298B (zh) 2016-05-03 2016-05-03 一种基于非对称加权相似度的协同过滤推荐方法及系统

Country Status (1)

Country Link
CN (1) CN106021298B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108269172A (zh) * 2018-01-18 2018-07-10 四川大学 基于综合相似度迁移的协同过滤算法
CN108355349A (zh) * 2018-03-14 2018-08-03 张伟东 游戏系统
CN108804683A (zh) * 2018-06-13 2018-11-13 重庆理工大学 结合矩阵分解和协同过滤算法的电影推荐方法
CN108959332A (zh) * 2017-08-03 2018-12-07 中国人民解放军国防科学技术大学 一种利用高维辅助信息修正的内容推荐方法及推荐系统
CN109636509A (zh) * 2018-11-20 2019-04-16 华中科技大学 一种基于非对称距离构建子矩阵的评分预测方法
CN110287373A (zh) * 2019-07-02 2019-09-27 齐鲁工业大学 基于评分预测和用户特征的协同过滤电影推荐方法及系统
CN112532627A (zh) * 2020-11-27 2021-03-19 平安科技(深圳)有限公司 冷启动推荐方法、装置、计算机设备及存储介质
CN112765458A (zh) * 2021-01-07 2021-05-07 同济大学 基于度量分解和标签自适应分配权重的混合推荐方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100030764A1 (en) * 2008-07-30 2010-02-04 At&T Corp. Recommender System Utilizing Collaborative Filtering Combining Explicit and Implicit Feedback with both Neighborhood and Latent Factor Models
CN102779131A (zh) * 2011-05-12 2012-11-14 同济大学 基于用户间多相似度的协同过滤推荐方法
CN104298787A (zh) * 2014-11-13 2015-01-21 吴健 一种基于融合策略的个性化推荐方法及装置
CN104778280A (zh) * 2015-05-04 2015-07-15 合肥工业大学 基于近邻传播的文本数据流聚类算法
CN104966219A (zh) * 2015-07-21 2015-10-07 Tcl集团股份有限公司 一种基于词频加权技术的个性化协同过滤推荐方法及系统
CN105095476A (zh) * 2015-08-12 2015-11-25 西安电子科技大学 基于Jaccard均衡距离的协同过滤推荐方法
CN105404700A (zh) * 2015-12-30 2016-03-16 山东大学 一种基于协同过滤的视频栏目推荐系统及推荐方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100030764A1 (en) * 2008-07-30 2010-02-04 At&T Corp. Recommender System Utilizing Collaborative Filtering Combining Explicit and Implicit Feedback with both Neighborhood and Latent Factor Models
CN102779131A (zh) * 2011-05-12 2012-11-14 同济大学 基于用户间多相似度的协同过滤推荐方法
CN104298787A (zh) * 2014-11-13 2015-01-21 吴健 一种基于融合策略的个性化推荐方法及装置
CN104778280A (zh) * 2015-05-04 2015-07-15 合肥工业大学 基于近邻传播的文本数据流聚类算法
CN104966219A (zh) * 2015-07-21 2015-10-07 Tcl集团股份有限公司 一种基于词频加权技术的个性化协同过滤推荐方法及系统
CN105095476A (zh) * 2015-08-12 2015-11-25 西安电子科技大学 基于Jaccard均衡距离的协同过滤推荐方法
CN105404700A (zh) * 2015-12-30 2016-03-16 山东大学 一种基于协同过滤的视频栏目推荐系统及推荐方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108959332A (zh) * 2017-08-03 2018-12-07 中国人民解放军国防科学技术大学 一种利用高维辅助信息修正的内容推荐方法及推荐系统
CN108959332B (zh) * 2017-08-03 2021-09-14 中国人民解放军国防科学技术大学 一种利用高维辅助信息修正的内容推荐方法及推荐系统
CN108269172B (zh) * 2018-01-18 2020-02-18 四川大学 基于综合相似度迁移的协同过滤方法
CN108269172A (zh) * 2018-01-18 2018-07-10 四川大学 基于综合相似度迁移的协同过滤算法
CN108355349A (zh) * 2018-03-14 2018-08-03 张伟东 游戏系统
CN108804683A (zh) * 2018-06-13 2018-11-13 重庆理工大学 结合矩阵分解和协同过滤算法的电影推荐方法
CN108804683B (zh) * 2018-06-13 2021-11-23 重庆理工大学 结合矩阵分解和协同过滤算法的电影推荐方法
CN109636509A (zh) * 2018-11-20 2019-04-16 华中科技大学 一种基于非对称距离构建子矩阵的评分预测方法
CN109636509B (zh) * 2018-11-20 2020-12-18 华中科技大学 一种基于非对称距离构建子矩阵的评分预测方法
CN110287373A (zh) * 2019-07-02 2019-09-27 齐鲁工业大学 基于评分预测和用户特征的协同过滤电影推荐方法及系统
CN112532627A (zh) * 2020-11-27 2021-03-19 平安科技(深圳)有限公司 冷启动推荐方法、装置、计算机设备及存储介质
CN112532627B (zh) * 2020-11-27 2022-03-29 平安科技(深圳)有限公司 冷启动推荐方法、装置、计算机设备及存储介质
CN112765458A (zh) * 2021-01-07 2021-05-07 同济大学 基于度量分解和标签自适应分配权重的混合推荐方法

Also Published As

Publication number Publication date
CN106021298B (zh) 2019-05-28

Similar Documents

Publication Publication Date Title
CN106021298A (zh) 一种基于非对称加权相似度的协同过滤推荐方法及系统
Hu et al. HERS: Modeling influential contexts with heterogeneous relations for sparse and cold-start recommendation
CN106682114A (zh) 一种融合用户信任关系和评论信息的个性化推荐方法
CN104199818B (zh) 一种基于分类的社会化推荐方法
CN103761237A (zh) 一种基于用户特征及其信任度的协同过滤推荐方法
CN106022865A (zh) 一种基于评分和用户行为的商品推荐方法
CN110647678B (zh) 一种基于用户性格标签的推荐方法
CN109783734A (zh) 一种基于项目属性的混合协同过滤推荐算法
CN106682121A (zh) 一种基于用户兴趣变化的时效推荐方法
CN106021329A (zh) 基于用户相似度的稀疏数据协同过滤推荐方法
KR101356948B1 (ko) Sns에서 사회적 이웃의 관심사와 사회적 활동의 토픽을 통해 사용자 관심사를 추론하는 방법 및 그 시스템
CN104794367A (zh) 基于隐语义模型的就医资源评分与推荐方法
CN104850645B (zh) 一种基于矩阵分解的主动学习评分引导方法及系统
Dai et al. Smooth neighborhood recommender systems
CN116541607B (zh) 基于商品检索数据分析的智能推荐方法
CN102208087A (zh) 信息推荐装置
CN106846029B (zh) 基于遗传算法和新型相似度计算策略的协同过滤推荐算法
CN111324807A (zh) 基于信任度的协同过滤推荐方法
CN102779131B (zh) 基于用户间多相似度的协同过滤推荐方法
CN106919699A (zh) 一种面向大规模用户的个性化信息推荐方法
CN114385930A (zh) 一种兴趣点推荐方法及系统
CN108694234A (zh) 一种基于改进协同过滤算法的服务推荐模型
CN112861019A (zh) 基于惩罚课程热力度和用户活跃度的课程推荐方法及系统
CN104572915B (zh) 一种基于内容环境增强的用户事件相关度计算方法
CN106651427A (zh) 基于用户行为的数据关联方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190528

CF01 Termination of patent right due to non-payment of annual fee