CN110717103B - 基于堆栈降噪编码器改进的协同过滤方法 - Google Patents

基于堆栈降噪编码器改进的协同过滤方法 Download PDF

Info

Publication number
CN110717103B
CN110717103B CN201910953239.3A CN201910953239A CN110717103B CN 110717103 B CN110717103 B CN 110717103B CN 201910953239 A CN201910953239 A CN 201910953239A CN 110717103 B CN110717103 B CN 110717103B
Authority
CN
China
Prior art keywords
user
project
item
matrix
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910953239.3A
Other languages
English (en)
Other versions
CN110717103A (zh
Inventor
高天寒
蒋蕾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN201910953239.3A priority Critical patent/CN110717103B/zh
Publication of CN110717103A publication Critical patent/CN110717103A/zh
Application granted granted Critical
Publication of CN110717103B publication Critical patent/CN110717103B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于堆栈降噪编码器改进的协同过滤方法,涉及推荐系统技术领域,本发明从用户相似性和项目相似性两个维度来做评分预测,使用加权因子的变化控制两种评分预测的比重来得到综合的评分预测,根据综合评分预测对项目进行降序排序,将集合的top‑n推荐给用户,提高了推荐系统的有效性和推荐质量。此外本发明将深度学习中的神经网络模型降噪自动编码器融入到协同过滤中,利用神经网络可以学习到用户和项目的深层次特征,这些特征相比于原数据能够更有效地表达用户和项目的特征,更好地计算用户之间的相似性和项目之间的相似性,从而缓解传统协同过滤中存在的数据稀疏性和冷启动等问题,提高推荐质量。

Description

基于堆栈降噪编码器改进的协同过滤方法
技术领域
本发明涉及推荐系统技术领域,具体涉及一种基于堆栈降噪编码器改进的协同过滤方法。
背景技术
近年来,随着云计算、大数据、物联网等技术的迅猛发展,互联网空间中各类应用的层出不穷引发了数据规模的爆炸式增长。大数据中蕴含着丰富的价值与巨大的潜力,将给人类社会带来变革性的发展,但同时也带来了严重“信息过载”问题,如何快速有效地从纷繁复杂的数据中获取有价值的信息成为了当前大数据发展的关键难题.推荐系统作为解决“信息过载”问题的有效方法,已经成为学术界和工业界的关注热点并得到了广泛应用,形成了众多相关研究成果。
在推荐系统中最重要的就是推荐算法,最经典的推荐算法就是协同过滤。但是传统的协同过滤存在数据稀疏性和新用户,新物品的冷启动等问题,这就会使推荐质量不高,用户体验差。深度学习是机器学习的一个新领域,它能够将复杂的低层特征形成抽象的、精简的高层表示,其强大的学习方式和数据处理能力解决了很多识别方面的难题。在推荐系统领域中,可以利用深度学习对用户或者项目内容进行特征提取,再应用于协同过滤中。堆栈降噪自编码器是深度学习中一种常用的神经网络模型,能够提取复杂高维的特征,其隐层的输出可以看作是用户或者项目的特征表示,再基于这种隐层的特征表示计算用户或者项目之间的相似度,利用用户或者项目之间的相似度给用户做推荐,可以有效地缓解数据的稀疏和冷启动问题。
发明内容
针对现有技术存在的问题,本发明提供一种基于堆栈降噪编码器改进的协同过滤方法。
基于堆栈降噪编码器改进的协同过滤方法,具体步骤如下:
步骤1:从实例数据集中提取用户的属性信息、项目的属性信息以及用户对项目的评分数据,通过用户的评分数据,建立评分矩阵,即用户评分矩阵;
所述用户的属性信息包括用户的性别,年龄和职业;
所述项目的属性信息包括项目的类型;
步骤2:将所述评分矩阵分为用户交互矩阵和项目得分矩阵,将用户交互矩阵和用户属性信息矩阵拼接后得到用户信息矩阵,将项目得分矩阵和项目属性信息矩阵拼接后得到项目信息矩阵;
所述用户信息矩阵,是对用户的年龄做离散化处理后,得到包括用户年龄,性别,职业的用户属性信息矩阵,再和用户交互矩阵拼接,得到用户的信息矩阵;
所述项目信息矩阵,具体统计每个项目的包含的类型,项目具有该属性则记为1,项目没有该属性则记为0,得到项目属性矩阵,再和项目的得分矩阵拼接,得到项目的信息矩阵;
步骤3:将得到的用户信息矩阵和项目信息矩阵分别输入到两个堆栈降噪自动编码器中,进行特征提取后分别得到用户和项目的隐表示,即用户和项目的低维度特征向量;
所述用户的低维度特征向量,是把用户的信息矩阵输入到堆栈降噪自动编码器中,对其逐层训练,调整参数,利用得到的参数计算第二个隐藏层的输出,即用户的低维度特征向量;
所述项目的低维度特征向量,是把项目的信息矩阵输入到堆栈降噪自动编码器中,对其逐层训练,调整参数,利用得到的参数计算第二个隐藏层的输出,即项目的低维度特征向量;
步骤4:利用用户和项目的低维度特征向量分别计算用户之间的相似度和项目之间的相似度,根据得到的相似度分别对用户相似度和项目相似度做评分预测;
步骤5:使用加权因子的变化控制用户和项目两种评分预测的比重来得到综合的评分预测,根据综合评分预测对项目进行降序排序,将排序后的项目集合中的前n个项目,即top-n推荐给用户。
所述步骤4中:
所述利用用户的低维度特征向量计算用户之间的相似度,通过如下相似度计算公式进行计算:
Figure GDA0003155502370000021
式中,sim(u,v)为用户u和用户v的相似度;
Figure GDA0003155502370000022
Figure GDA0003155502370000023
表示用户u和用户v经过栈式降噪自编码器压缩成的s维特征向量;
所述利用项目的低维度特征向量计算项目之间的相似度,通过如下相似度计算公式进行计算:
Figure GDA0003155502370000024
式中,sim1(i,j)为项目i和项目j的相似度;
Figure GDA0003155502370000025
Figure GDA0003155502370000026
表示项目i和项目j经过栈式降噪自编码器压缩成的t维特征向量;
所述根据得到的用户相似度做评分预测,通过如下的评分预测公式计算:
Figure GDA0003155502370000027
式中,Qu为用户u对与项目i的基于用户的评分预测,S(u,K)是和用户u兴趣最相似的K个用户的集合,N(i)是对项目i评分过的用户集合,sim(u,v)是用户u和用户v之间的相似度,
Figure GDA0003155502370000031
是用户u对他评过分的所有项目评分的平均值,rvi用户v对项目i的评分,
Figure GDA0003155502370000032
是用户v对他评过分的所有项目评分的平均值;
所述根据得到的项目相似度做评分预测,通过如下的评分预测公式计算
Figure GDA0003155502370000033
式中,QI为用户u对与项目i的基于项目的评分预测,S(i,K)是和项目i最相似的项目集合,N(u)是用户u评分过的项目集合,sim(i,j)是项目间的相似度,
Figure GDA0003155502370000034
是项目i的平均分,
Figure GDA0003155502370000035
是项目j的平均分,ruj用户u对项目j的评分;
所述步骤5中:
所述使用加权因子的变化控制两种评分预测的比重来得到综合的评分预测通过如下的公式来计算:
Q=βQu+(1-β)QI
式中,Q为用户对项目的综合的评分预测,β∈[0,1]为控制两者预测评分的权重。
本发明的有益效果:
本发明不仅使用了用户的评分数据,更考虑到了用户属性和项目属性,解决了新用户没有历史行为数据,不能计算用户相似性,从而造成无法准确的预测新用户的喜好,推荐质量不高等问题。同时,解决了新项目没有评分不能计算相似性的隐式推荐问题,很好的缓解了新用户和新项目的冷启动问题。本发明从用户相似性和项目相似性两个维度来做评分预测,提高了推荐系统的有效性和推荐质量。另外,本发明将深度学习中的神经网络模型降噪自动编码器融入到协同过滤中,利用神经网络可以学习到用户和项目的深层次特征,这些特征相比于原数据能够更有效地表达用户和项目的特征,更好地计算用户之间的相似性和项目之间的相似性,从而缓解传统协同过滤中存在的数据稀疏性和冷启动等问题,提高推荐质量。
附图说明
图1为本发明具体实施方式的方法总体流程图。
具体实施方式
为了使本发明的目的、技术方案及优势更加清晰,下面结合附图和具体实施例对本发明做进一步详细说明。此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
基于堆栈降噪编码器改进的协同过滤方法,流程如图1所示,包括如下步骤:
步骤1:从实例数据集中提取用户的属性信息、项目的属性信息以及用户对项目的评分数据,通过用户的评分数据,建立评分矩阵,即用户评分矩阵;
所述用户的属性信息包括用户的性别,年龄和职业;
所述项目的属性信息包括项目的类型;
步骤2:将所述评分矩阵分为用户交互矩阵和项目得分矩阵,将用户交互矩阵和用户属性信息矩阵拼接后得到用户信息矩阵,将项目得分矩阵和项目属性信息矩阵拼接后得到项目信息矩阵;
所述用户信息矩阵,是对用户的年龄做离散化处理后,得到包括用户年龄,性别,职业的用户属性信息矩阵,再和用户交互矩阵拼接,得到用户的信息矩阵;
所述项目信息矩阵,具体统计每个项目的包含的类型,项目具有该属性则记为1,项目没有该属性则记为0,得到项目属性矩阵,再和项目的得分矩阵拼接,得到项目的信息矩阵;
步骤3:将得到的用户信息矩阵和项目信息矩阵分别输入到两个堆栈降噪自动编码器中,进行特征提取后分别得到用户和项目的隐表示,即用户和项目的低维度特征向量;
所述用户的低维度特征向量,是把用户的信息矩阵输入到堆栈降噪自动编码器中,对其逐层训练,调整参数,利用得到的参数计算第二个隐藏层的输出,即用户的低维度特征向量;
所述项目的低维度特征向量,是把项目的信息矩阵输入到堆栈降噪自动编码器中,对其逐层训练,调整参数,利用得到的参数计算第二个隐藏层的输出,即项目的低维度特征向量;
确定堆栈降噪自动编码器的网络结构,为一个输入层,两个隐藏层和一个输出层;
步骤3.1:将用户信息矩阵输入到堆栈降噪自动编码器计算用户的低维度特征向量,包括以下步骤:
步骤3.1.1:训练堆栈降噪自动编码器第一层的神经网络,经过编码函数
Figure GDA0003155502370000041
计算后得到第一个隐藏层的激活向量
Figure GDA0003155502370000042
其中W1∈Rk×l是权值矩阵,b1∈Rm ×1是偏置向量;
步骤3.1.2:将步骤3.1.1中得到的第一个隐藏层的激活向量
Figure GDA0003155502370000043
作为堆栈降噪自动编码器第二个隐藏层的输入,通过编码函数
Figure GDA0003155502370000044
计算后得到第二个隐藏层的激活向量
Figure GDA0003155502370000045
其中W1'∈Rj×k是权值矩阵,b'1∈Rm×1是偏置向量;
步骤3.1.3:将步骤3.1.2中得到的第二个隐藏层的输出
Figure GDA0003155502370000046
作为堆栈降噪自动编码器最后一个输出层的输入,通过解码函数
Figure GDA0003155502370000047
计算后得到网络的输出
Figure GDA0003155502370000048
其中W1”∈Rl×j是权值矩阵,b1”∈Rm×1是偏置向量;
步骤3.1.4:将步骤3.1.3得到的网络的输出
Figure GDA0003155502370000049
和原始的用户的信息矩阵通过如下公式获得目标函数:
Figure GDA0003155502370000051
其中,λ是正则化参数,用来防止过拟合,U是用户信息矩阵,
Figure GDA0003155502370000052
是堆栈降噪自动编码器的输出,W1,W1',W1”是权值矩阵,b1,b'1,b1”是偏置向量;
步骤3.1.5:训练整个堆栈降噪自动编码器网络,不停更新参数,最小化目标函数,直到算法收敛;
本实施例使用的一种有效的训练自动编码器的方法是随机梯度下降法(Stochastic Gradient Descent,SGD),对参数W1,W1',W1”,b1,b1',b1”进行随机初始化;重复迭代T轮,在每轮迭代中,以随机顺序遍历每个训练样本,计算随机梯度
Figure GDA0003155502370000053
Figure GDA0003155502370000054
沿随机梯度方向,更新参数:
Figure GDA0003155502370000055
其中T为最大迭代次数,α为梯度下降的步长,即学习率;对于每次输入的数据,算法中的随机梯度
Figure GDA0003155502370000056
可用反向传播(Back Propagation,BP)算法计算,其中前向传播,通过步骤3.1.1,3.1.2和3.1.3得到
Figure GDA0003155502370000057
反向传播则通过公式
Figure GDA0003155502370000058
计算输出层的误差
Figure GDA0003155502370000059
通过公式
Figure GDA00031555023700000510
以及
Figure GDA00031555023700000511
计算隐藏层误差
Figure GDA00031555023700000512
Figure GDA00031555023700000513
其中
Figure GDA00031555023700000518
运算符表示向量对应维度上的元素相乘;再通过公式
Figure GDA00031555023700000514
对随机梯度进行计算;
步骤3.1.5:利用步骤3.1.4训练结束后得到的参数W1,W1',W1”,b1,b'1,b1”和
Figure GDA00031555023700000515
Figure GDA00031555023700000516
计算得到用户的隐表示,即用户的低维度特征向量,用户的深层次表示。
步骤3.2:将项目信息矩阵输入到另外一个堆栈降噪自动编码器计算项目的低维度特征向量,包括以下步骤:
步骤3.2.1:训练堆栈降噪自动编码器第一层的神经网络,经过编码函数
Figure GDA00031555023700000517
计算后得到第一个隐藏层的激活向量
Figure GDA0003155502370000061
其中W2∈Rs×p是权值矩阵,b2∈Rn ×1是偏置向量;
步骤3.2.2:将步骤3.2.1得到的第一个隐藏层的激活向量
Figure GDA0003155502370000062
作为堆栈降噪自动编码器第二个隐藏层的输入,通过编码函数
Figure GDA0003155502370000063
计算后得到第二个隐藏层的激活向量
Figure GDA0003155502370000064
其中W'2∈Rt×s是权值矩阵,b'2∈Rn×1是偏置向量;
步骤3.2.3:将步骤3.2.2得到的第二个隐藏层的输出
Figure GDA0003155502370000065
作为堆栈降噪自动编码器最后一个输出层的输入,通过解码函数
Figure GDA0003155502370000066
计算后得到网络的输出
Figure GDA0003155502370000067
其中W″2∈Rp×t是权值矩阵,b″2∈Rn×1是偏置向量;
步骤3.2.4:将步骤3.2.3得到的网络的输出
Figure GDA0003155502370000068
和原始的项目的信息矩阵通过如下公式获得目标函数
Figure GDA0003155502370000069
其中,λ是正则化参数,用来防止过拟合,I是用户信息矩阵,
Figure GDA00031555023700000618
是堆栈降噪自动编码器的输出,W2,W′2,W″2是权值矩阵,b2,b'2,b'2'是偏置向量;
步骤3.2.5:训练整个堆栈降噪自动编码器网络,不停更新参数,最小化目标函数,直到算法收敛;本实施例中使用的一种有效的训练自动编码器的方法是随机梯度下降法(Stochastic Gradient Descent,SGD),对参数W2,W′2,W″2,b2,b'2,b″2进行随机初始化,重复迭代T轮,在每轮迭代中,以随机顺序遍历每个训练样本,计算随机梯度
Figure GDA00031555023700000610
Figure GDA00031555023700000611
沿随机梯度方向,更新参数:
Figure GDA00031555023700000612
其中T为最大迭代次数,α为梯度下降的步长,即学习率,对于每次输入的数据,算法中的随机梯度
Figure GDA00031555023700000613
可用反向传播(Back Propagation,BP)算法计算,其中前向传播,根据步骤3.2.1,3.2.2和3.2.3得到
Figure GDA00031555023700000614
反向传播则通过公式
Figure GDA00031555023700000615
计算输出层的误差
Figure GDA00031555023700000616
通过公式
Figure GDA00031555023700000617
以及
Figure GDA0003155502370000071
计算隐藏层误差
Figure GDA0003155502370000072
Figure GDA0003155502370000073
其中
Figure GDA00031555023700000716
运算符表示向量对应维度上的元素相乘;再通过公式
Figure GDA0003155502370000074
对随机梯度进行计算;
步骤3.2.6:利用步骤3.2.5训练结束后得到的参数W2,W′2,W″2,b2,b′2,b″2
Figure GDA0003155502370000075
Figure GDA0003155502370000076
计算得到项目的隐表示,即项目的低维度特征向量,项目的深层次表示;
步骤4:利用用户和项目的低维度特征向量分别计算用户之间的相似度和项目之间的相似度,根据得到的相似度分别对用户相似度和项目相似度做评分预测;
所述利用用户的低维度特征向量计算用户之间的相似度,通过如下相似度计算公式进行计算:
Figure GDA0003155502370000077
式中,sim(u,v)为用户u和用户v的相似度;
Figure GDA0003155502370000078
Figure GDA0003155502370000079
表示用户u和用户v经过栈式降噪自编码器压缩成的s维特征向量;
所述利用项目的低维度特征向量计算项目之间的相似度,通过如下相似度计算公式进行计算:
Figure GDA00031555023700000710
式中,sim1(i,j)为项目i和项目j的相似度;
Figure GDA00031555023700000711
Figure GDA00031555023700000712
表示项目i和项目j经过栈式降噪自编码器压缩成的t维特征向量;
所述根据得到的用户相似度做评分预测,通过如下的评分预测公式计算:
Figure GDA00031555023700000713
式中,Qu为用户u对与项目i的基于用户的评分预测,S(u,K)是和用户u兴趣最相似的K个用户的集合,N(i)是对项目i评分过的用户集合,sim(u,v)是用户u和用户v之间的相似度,
Figure GDA00031555023700000714
是用户u对他评过分的所有项目评分的平均值,rvi用户v对项目i的评分,
Figure GDA00031555023700000715
是用户v对他评过分的所有项目评分的平均值;
所述根据得到的项目相似度做评分预测,通过如下的评分预测公式计算
Figure GDA0003155502370000081
式中,QI为用户u对与项目i的基于项目的评分预测,S(i,K)是和项目i最相似的项目集合,N(u)是用户u评分过的项目集合,sim(i,j)是项目间的相似度,
Figure GDA0003155502370000082
是项目i的平均分,
Figure GDA0003155502370000083
是项目j的平均分,ruj用户u对项目j的评分;
步骤5:使用加权因子的变化控制用户和项目两种评分预测的比重来得到综合的评分预测,根据综合评分预测对项目进行降序排序,将排序后的项目集合中的前n个项目,即top-n推荐给用户;
所述使用加权因子的变化控制两种评分预测的比重来得到综合的评分预测通过如下的公式来计算:
Q=βQu+(1-β)QI
式中,Q为用户对项目的综合的评分预测,β∈[0,1]为控制两者预测评分的权重。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;因而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。

Claims (3)

1.一种基于堆栈降噪编码器改进的协同过滤方法,其特征在于:包括以下步骤:
步骤1:从实例数据集中提取用户的属性信息、项目的属性信息以及用户对项目的评分数据,通过用户的评分数据,建立评分矩阵,即用户评分矩阵;
所述用户的属性信息包括用户的性别,年龄和职业;
所述项目的属性信息包括项目的类型;
步骤2:将所述评分矩阵分为用户交互矩阵和项目得分矩阵,将用户交互矩阵和用户属性信息矩阵拼接后得到用户信息矩阵,将项目得分矩阵和项目属性信息矩阵拼接后得到项目信息矩阵;
所述用户信息矩阵,是对用户的年龄做离散化处理后,得到包括用户年龄,性别,职业的用户属性信息矩阵,再和用户交互矩阵拼接,得到用户的信息矩阵;
所述项目信息矩阵,具体统计每个项目的包含的类型,项目具有该属性则记为1,项目没有该属性则记为0,得到项目属性矩阵,再和项目的得分矩阵拼接,得到项目的信息矩阵;
步骤3:将得到的用户信息矩阵和项目信息矩阵分别输入到两个堆栈降噪自动编码器中,进行特征提取后分别得到用户和项目的隐表示,即用户和项目的低维度特征向量;
所述用户的低维度特征向量,是把用户的信息矩阵输入到堆栈降噪自动编码器中,对其逐层训练,调整参数,利用得到的参数计算第二个隐藏层的输出,即用户的低维度特征向量;
所述项目的低维度特征向量,是把项目的信息矩阵输入到堆栈降噪自动编码器中,对其逐层训练,调整参数,利用得到的参数计算第二个隐藏层的输出,即项目的低维度特征向量;
步骤4:利用用户和项目的低维度特征向量分别计算用户之间的相似度和项目之间的相似度,根据得到的相似度分别对用户相似度和项目相似度做评分预测;
步骤5:使用加权因子的变化控制用户和项目两种评分预测的比重来得到综合的评分预测,根据综合评分预测对项目进行降序排序,将排序后的项目集合中的前n个项目,即top-n推荐给用户。
2.根据权利要求1所述的基于堆栈降噪编码器改进的协同过滤方法,其特征在于:所述步骤4中:
所述利用用户的低维度特征向量计算用户之间的相似度,通过如下相似度计算公式进行计算:
Figure FDA0003155502360000011
式中,sim(u,v)为用户u和用户v的相似度;
Figure FDA0003155502360000012
Figure FDA0003155502360000013
表示用户u和用户v经过栈式降噪自编码器压缩成的s维特征向量;
所述利用项目的低维度特征向量计算项目之间的相似度,通过如下相似度计算公式进行计算:
Figure FDA0003155502360000021
式中,sim1(i,j)为项目i和项目j的相似度;
Figure FDA0003155502360000022
Figure FDA0003155502360000023
表示项目i和项目j经过栈式降噪自编码器压缩成的t维特征向量;
所述根据得到的用户相似度做评分预测,通过如下的评分预测公式计算:
Figure FDA0003155502360000024
式中,Qu为用户u对与项目i的基于用户的评分预测,S(u,K)是和用户u兴趣最相似的K个用户的集合,N(i)是对项目i评分过的用户集合,sim(u,v)是用户u和用户v之间的相似度,
Figure FDA0003155502360000025
是用户u对他评过分的所有项目评分的平均值,rvi用户v对项目i的评分,
Figure FDA0003155502360000026
是用户v对他评过分的所有项目评分的平均值;
所述根据得到的项目相似度做评分预测,通过如下的评分预测公式计算
Figure FDA0003155502360000027
式中,QI为用户u对与项目i的基于项目的评分预测,S(i,K)是和项目i最相似的项目集合,N(u)是用户u评分过的项目集合,sim(i,j)是项目间的相似度,
Figure FDA0003155502360000028
是项目i的平均分,
Figure FDA0003155502360000029
是项目j的平均分,ruj用户u对项目j的评分。
3.根据权利要求1所述的基于堆栈降噪编码器改进的协同过滤方法,其特征在于:所述步骤5中:
所述使用加权因子的变化控制两种评分预测的比重来得到综合的评分预测通过如下的公式来计算:
Q=βQu+(1-β)QI
式中,Q为用户对项目的综合的评分预测,β∈[0,1]为控制两者预测评分的权重。
CN201910953239.3A 2019-10-09 2019-10-09 基于堆栈降噪编码器改进的协同过滤方法 Active CN110717103B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910953239.3A CN110717103B (zh) 2019-10-09 2019-10-09 基于堆栈降噪编码器改进的协同过滤方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910953239.3A CN110717103B (zh) 2019-10-09 2019-10-09 基于堆栈降噪编码器改进的协同过滤方法

Publications (2)

Publication Number Publication Date
CN110717103A CN110717103A (zh) 2020-01-21
CN110717103B true CN110717103B (zh) 2021-08-31

Family

ID=69212395

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910953239.3A Active CN110717103B (zh) 2019-10-09 2019-10-09 基于堆栈降噪编码器改进的协同过滤方法

Country Status (1)

Country Link
CN (1) CN110717103B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112085158A (zh) * 2020-07-21 2020-12-15 西安工程大学 一种基于堆栈降噪自编码器的图书推荐方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108874960A (zh) * 2018-06-06 2018-11-23 电子科技大学 一种在线学习中基于降噪自编码器混合模型的课程视频推荐算法
CN109783739A (zh) * 2019-01-23 2019-05-21 北京工业大学 一种基于层叠稀疏降噪自编码器增强的协同过滤推荐方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7231607B2 (en) * 2002-07-09 2007-06-12 Kaleidescope, Inc. Mosaic-like user interface for video selection and display

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108874960A (zh) * 2018-06-06 2018-11-23 电子科技大学 一种在线学习中基于降噪自编码器混合模型的课程视频推荐算法
CN109783739A (zh) * 2019-01-23 2019-05-21 北京工业大学 一种基于层叠稀疏降噪自编码器增强的协同过滤推荐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A novel deep hybrid recommender system based on auto-encoder with neural collaborative filtering;Yu Liu等;《Big Data Mining and Analytics》;20180524;全文 *
基于降噪堆栈式自动编码机的协同过滤推荐算法;牛宝君;《中国优秀硕士学位论文全文数据库 信息科技辑》;20181215;全文 *

Also Published As

Publication number Publication date
CN110717103A (zh) 2020-01-21

Similar Documents

Publication Publication Date Title
CN110232480B (zh) 利用变分的正则化流实现的项目推荐方法及模型训练方法
CN111797321B (zh) 一种面向不同场景的个性化知识推荐方法及系统
CN111274398B (zh) 一种方面级用户产品评论情感分析方法及系统
EP3295381B1 (en) Augmenting neural networks with sparsely-accessed external memory
CN109389151B (zh) 一种基于半监督嵌入表示模型的知识图谱处理方法和装置
CN113256367B (zh) 用户行为历史数据的商品推荐方法、系统、设备及介质
US10592777B2 (en) Systems and methods for slate optimization with recurrent neural networks
Jiao et al. A novel learning rate function and its application on the SVD++ recommendation algorithm
CN112115377A (zh) 一种基于社交关系的图神经网络链路预测推荐方法
CN112085525A (zh) 一种基于混合模型的用户网络购买行为预测研究方法
CN110781401A (zh) 一种基于协同自回归流实现的Top-n项目推荐方法
CN113268669A (zh) 基于联合神经网络的面向关系挖掘的兴趣点推荐方法
CN112396492A (zh) 基于图注意力网络和双向长短期记忆网络的会话推荐方法
CN112085158A (zh) 一种基于堆栈降噪自编码器的图书推荐方法
CN111178986A (zh) 用户-商品偏好的预测方法及系统
CN110717103B (zh) 基于堆栈降噪编码器改进的协同过滤方法
CN116911949A (zh) 基于边界排名损失和邻域感知图神经网络的物品推荐方法
CN109918564A (zh) 一种面向完全冷启动的上下文自动编码推荐方法及系统
US20230124258A1 (en) Embedding optimization for machine learning models
CN112559905B (zh) 一种基于双模式注意力机制和社交相似度的会话推荐方法
Zeng et al. RACMF: robust attention convolutional matrix factorization for rating prediction
CN117194966A (zh) 对象分类模型的训练方法和相关装置
CN113743440A (zh) 一种信息处理方法及装置、存储介质
CN110956528B (zh) 一种电商平台的推荐方法及系统
CN113705217A (zh) 一种面向电力领域知识学习的文献推荐方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant