CN112149734A - 一种基于堆叠自编码器的跨域推荐方法 - Google Patents

一种基于堆叠自编码器的跨域推荐方法 Download PDF

Info

Publication number
CN112149734A
CN112149734A CN202011009508.XA CN202011009508A CN112149734A CN 112149734 A CN112149734 A CN 112149734A CN 202011009508 A CN202011009508 A CN 202011009508A CN 112149734 A CN112149734 A CN 112149734A
Authority
CN
China
Prior art keywords
domain
user
encoder
cross
self
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011009508.XA
Other languages
English (en)
Other versions
CN112149734B (zh
Inventor
曲立平
任建南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN202011009508.XA priority Critical patent/CN112149734B/zh
Publication of CN112149734A publication Critical patent/CN112149734A/zh
Application granted granted Critical
Publication of CN112149734B publication Critical patent/CN112149734B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于跨域推荐算法技术领域,具体涉及一种基于堆叠自编码器的跨域推荐方法。本发明针对纯跨域推荐存在的数据稀疏性问题,提供可提高推荐的评分预测精准度和分类精准度一种基于堆叠自编码器的跨域推荐方法。本发明对基于用户的跨域堆叠自编码器和基于项目的跨域堆叠自编码器两个模型同时学习并对学习结果进行比较,选出最优的推荐结果,从而提高推荐的评分预测精准度和分类精准度。本发明将跨域信息引入自动编码器中,以了解用户和商品的更深层的非线性网络结构。发明通过对目标域用户向量的扩展,并且结合深度学习有效地解决了稀疏性问题,在评分预测和Top‑n推荐方面优于其他模型。

Description

一种基于堆叠自编码器的跨域推荐方法
技术领域
本发明属于跨域推荐算法技术领域,具体涉及一种基于堆叠自编码器的跨域推荐方法。
背景技术
随着大数据和互联网技术的飞速发展,网络中各种应用生成的数据呈爆炸性增长,导致 严重的信息过载问题。用户从大量资源(例如文本,图像,视频和商品)中找到满足其个性 化需求的信息已经变得非常困难。推荐系统是解决上述问题的关键技术之一。与搜索引擎不 同,推荐系统研究用户的历史行为数据,进行统计并分析他们的兴趣和偏好,从而引导用户 找到自己的信息需求并实现个性化推荐。目前,该技术被广泛应用于电子商务,社交网络, 新闻源,视频网站等领域。目前,推荐系统主要用于两个任务。首先,它们用于预测给定项 目对用户的效用。在此任务中,用户首先选择他们感兴趣的项目,推荐系统然后预测用户将 对项目给予的评分。其次,推荐系统用于向用户推荐项目列表。在这种情况下,系统选择最 相关的项目列表推荐给用户。
传统的个性化推荐系统基于单领域,即根据用户对某个域的偏好功能在域中为用户提供 推荐服务。但是,随着用户和项目规模的快速增长,传统推荐算法的缺陷逐渐暴露出来。在 大多数推荐系统中,每个用户仅对少量项目进行评分,评分矩阵中超过90%的评分为空。在 这种情况下,要查找不同用户或项目之间的相似性是一个挑战,这种类型的问题称为稀疏性。 冷启动问题是稀疏性的特例,它主要包括如何推荐尚未交互任何项目的新用户,以及如何处 理从未评分或购买过的项目。稀疏性和冷启动问题导致推荐的性能下降,从而阻碍了算法的 进一步推广。研究表明,来自不同领域(电影和书籍)或不同平台(社交媒体和电子商务) 的用户兴趣偏好或项目功能之间存在强烈的相关性和依赖性。基于这种现象,学术界提出了 跨域推荐技术:从其他领域获得有效的用户偏好或项目特征,以丰富目标域中的数据,准确 地预测用户行为,并提供更合理和个性化的推荐服务。在过去的十年中,有关跨域推荐的相 关研究取得了很大的进步。跨域推荐是Winoto和Tang在2008年中首次提出的。他们认为, 虽然跨域推荐不如单领域推荐准确,但可能会使推荐结果更加多样化。跨域推荐使用两个不 同域中的相似性将源域的数据迁移到目标域,从而提高了目标域的准确性和多样性。
自编码器(autoencoder,AE)是一类在半监督学习和非监督学习中使用的人工神经网络 (Artificial Neural Networks,ANNs),其功能是通过将输入信息作为学习目标,对输入信息进 行表征学习(representation learning)。自编码器包含编码器(encoder)和解码器(decoder) 两部分。自编码器具有一般意义上表征学习算法的功能,通常被应用于降维(dimensionality reduction)和异常值检测(anomaly detection)。近些年深度学习的广泛应用,自编码器与推荐 系统的结合也成为了推荐领域的新的研究方向。与传统的推荐方法相比,基于自编码器的推 荐算法通过结合底层特征形成了更密集的高层语义抽象,从而自动发现数据的分布式特征表 示,更好地提取用户和项目的特征,解决了传统推荐算法中人为设计特征的问题。
从以往的研究工作可知,传统的单一领域推荐算法存在较大的限制,尤其是冷启动问题 以及数据稀疏问题。跨域推荐虽然在理论上对这两个问题能够有效地缓解,但是纯跨域推荐 仍然存在数据稀疏性问题,所以即使引入其他数据不是很明显,大多数用户也只会与少量项 目交互。深度学习在跨域系统中的应用不是很广泛,它通常用于模型训练过程中,仍然有许 多值得探索的方向,还有更多的改进空间。因此,我们尝试将跨域推荐与深度学习相结合, 并发明一种集成跨域信息的堆叠式自动编码器的推荐模型。将深度学习算法与跨域推荐结合 后,可以有效利用多源异构数据,可以更有效地缓解稀疏性问题。
发明内容
本发明的目的在于针对现有技术中纯跨域推荐存在的数据稀疏性问题,提供可提高推荐 的评分预测精准度和分类精准度一种基于堆叠自编码器的跨域推荐方法。
本发明的目的通过如下技术方案来实现:包括以下步骤:
步骤1:获取源数据域的用户-项目-评分数据和目标域的用户-项目-评分数据,包括源数 据域的用户-项目-评分数据集Rs、目标域的用户-项目-评分数据集Rt、源数据域的项目集和 目标域的项目集;所述的源数据域和目标数据域有公共的用户集M;
步骤2:将向量
Figure BDA0002697105800000021
输入到训练好的基于用户的跨域堆叠自编码器模型中,得到预 测向量
Figure BDA0002697105800000022
Figure BDA0002697105800000023
Figure BDA0002697105800000024
Figure BDA0002697105800000025
Figure BDA0002697105800000026
其中,
Figure BDA0002697105800000027
Figure BDA0002697105800000028
是源数据域中用户u对项目i的评分,i=1,2,...,Ns,Ns为源数据域的项目集中项目数量;
Figure BDA0002697105800000029
Figure BDA00026971058000000210
是目标域中用户u对项目j的 评分,j=1,2,...,Nt,Nt为目标域的项目集中项目数量;u∈M;W1、W2和W3为权重矩阵; p1、p2和p3为偏置项;f1和f3为Sigmoid激活函数,f2为Identity激活函数;
步骤3:将向量
Figure BDA0002697105800000031
输入到训练好的基于项目的跨域堆叠自编码器模型中,得到预 测向量
Figure BDA0002697105800000032
Figure BDA0002697105800000033
Figure BDA0002697105800000034
Figure BDA0002697105800000035
其中,
Figure BDA0002697105800000036
m为用户集M中用户的数量;
Figure BDA0002697105800000037
W4、W5和W6为权重矩阵;p4、p5和p6为偏置项;
步骤4:分别计算基于用户的跨域堆叠自编码器模型与基于项目的跨域堆叠自编码器模 型的RMSE值
Figure BDA0002697105800000038
Figure BDA0002697105800000039
选择对应RMSE值较大的预测向量作为最终预 测向量;
Figure BDA00026971058000000310
Figure BDA00026971058000000311
步骤5:根据最终预测向量得到用户集M中每个用户对目标域中所有项目的评分,取前 n个评分最高的项目向用户进行推荐。
本发明还可以包括:
所述的步骤2中基于用户的跨域堆叠自编码器模型的训练方法具体为:
步骤2.1:取部分输入的向量
Figure BDA00026971058000000312
构造训练集;
步骤2.2:将训练集中向量
Figure BDA00026971058000000313
和向量
Figure BDA00026971058000000314
横向连接作为堆叠自编码器的输入层,通过三层自 编码器的运算得到输出结果
Figure BDA00026971058000000315
步骤2.3:计算损失函数Luser
Figure BDA00026971058000000316
其中,μ为正则化参数:
步骤2.4:将损失函数Luser和预先设置好的学习率λ作为输入代入到Adam算法中,Adam 算法通过迭代不断地更新W1、W2、W3、p1、p2和p3,直到Luser趋于预先设定的固定值δ, 得到最优参数;
Figure BDA0002697105800000041
步骤2.5:将训练得到的最优参数W1、W2、W3、p1、p2和p3输入到基于用户的跨域堆 叠自编码器模型中,完成基于用户的跨域堆叠自编码器模型的训练。
所述的步骤3中基于项目的跨域堆叠自编码器模型的训练方法具体为:
步骤3.1:取部分输入的向量
Figure BDA0002697105800000042
构造训练集;
步骤3.2:将训练集中向量
Figure BDA0002697105800000043
作为堆叠自编码器的输入层,通过三层自编码器的 运算得到输出结果
Figure BDA0002697105800000044
步骤3.3:计算损失函数Litem
Figure BDA0002697105800000045
其中,
Figure BDA0002697105800000046
为正则化参数;
步骤3.4:将损失函数Litem和预先设置好的学习率λ作为输入代入到Adam算法中,Adam 算法通过迭代不断地更新W4、W5、W6、p4、p5和p6,直到Litem趋于预先设定的固定值δ, 得到最优参数;
Figure BDA0002697105800000047
步骤3.5:将训练得到的最优参数W4、W5、W6、p4、p5和p6输入到基于项目的跨域堆 叠自编码器模型中,完成基于项目的跨域堆叠自编码器模型的训练。
本发明的有益效果在于:
本发明针对纯跨域推荐存在的数据稀疏性问题,提供可提高推荐的评分预测精准度和分 类精准度一种基于堆叠自编码器的跨域推荐方法。本发明对基于用户的跨域堆叠自编码器和 基于项目的跨域堆叠自编码器两个模型同时学习并对学习结果进行比较,选出最优的推荐结 果,从而提高推荐的评分预测精准度和分类精准度。本发明将跨域信息引入自动编码器中, 以了解用户和商品的更深层的非线性网络结构。发明通过对目标域用户向量的扩展,并且结 合深度学习有效地解决了稀疏性问题,在评分预测和Top-n推荐方面优于其他模型。
附图说明
图1是本发明中基于用户的跨域堆叠自编码器模型图。
图2是本发明中基于项目的跨域堆叠自编码器模型图。
图3是一种基于堆叠自编码器的跨域推荐方法的框架图。
具体实施方式
下面结合附图对本发明做进一步描述。
本发明属于跨域推荐算法技术领域,涉及深度学习的跨域推荐算法研究以及自编码器的 研究。本发明主要是针对现有技术中存在的稀疏性问题,提出一种基于堆叠自编码器的跨域 推荐方法,包含两个子算法,分别为基于用户的跨域堆叠自编码器和基于项目的跨域堆叠自 编码器。两个模型同时学习并对学习结果进行比较,选出最优的推荐结果,从而提高推荐的 评分预测精准度和分类精准度。
一种基于堆叠自编码器的跨域推荐方法,包括以下步骤:
步骤1:获取源数据域的用户-项目-评分数据和目标域的用户-项目-评分数据,包括源数 据域的用户-项目-评分数据集Rs、目标域的用户-项目-评分数据集Rt、源数据域的项目集和 目标域的项目集;所述的源数据域和目标数据域有公共的用户集M;
步骤2:将向量
Figure BDA0002697105800000051
输入到训练好的基于用户的跨域堆叠自编码器模型中,得到预 测向量
Figure BDA0002697105800000052
Figure BDA0002697105800000053
Figure BDA0002697105800000054
Figure BDA0002697105800000055
Figure BDA0002697105800000056
其中,
Figure BDA0002697105800000057
Figure BDA0002697105800000058
是源数据域中用户u对项目i的评分,i=1,2,...,Ns,Ns为源数据域的项目集中项目数量;
Figure BDA0002697105800000059
Figure BDA00026971058000000510
是目标域中用户u对项目j的 评分,j=1,2,...,Nt,Nt为目标域的项目集中项目数量;u∈M;W1、W2和W3为权重矩阵; p1、p2和p3为偏置项;f1和f3为Sigmoid激活函数,f2为Identity激活函数;
基于用户的跨域堆叠自编码器模型的训练方法具体为:
步骤2.1:取部分输入的向量
Figure BDA00026971058000000511
构造训练集;
步骤2.2:将训练集中向量
Figure BDA0002697105800000061
和向量
Figure BDA0002697105800000062
横向连接作为堆叠自编码器的输入层,通过三层自 编码器的运算得到输出结果
Figure BDA0002697105800000063
步骤2.3:计算损失函数Luser
Figure BDA0002697105800000064
其中,μ为正则化参数:
步骤2.4:将损失函数Luser和预先设置好的学习率λ作为输入代入到Adam算法中,Adam 算法通过迭代不断地更新W1、W2、W3、p1、p2和p3,直到Luser趋于预先设定的固定值δ, 得到最优参数;
Figure BDA0002697105800000065
步骤2.5:将训练得到的最优参数W1、W2、W3、p1、p2和p3输入到基于用户的跨域堆 叠自编码器模型中,完成基于用户的跨域堆叠自编码器模型的训练。
步骤3:将向量
Figure BDA0002697105800000066
输入到训练好的基于项目的跨域堆叠自编码器模型中,得到预 测向量
Figure BDA0002697105800000067
Figure BDA0002697105800000068
Figure BDA0002697105800000069
Figure BDA00026971058000000610
其中,
Figure BDA00026971058000000611
m为用户集M中用户的数量;
Figure BDA00026971058000000612
W4、W5和W6为权重矩阵;p4、p5和p6为偏置项;
基于项目的跨域堆叠自编码器模型的训练方法具体为:
步骤3.1:取部分输入的向量
Figure BDA00026971058000000613
构造训练集;
步骤3.2:将训练集中向量
Figure BDA00026971058000000614
作为堆叠自编码器的输入层,通过三层自编码器的 运算得到输出结果
Figure BDA00026971058000000615
步骤3.3:计算损失函数Litem
Figure BDA0002697105800000071
其中,
Figure BDA0002697105800000072
为正则化参数;
步骤3.4:将损失函数Litem和预先设置好的学习率λ作为输入代入到Adam算法中,Adam 算法通过迭代不断地更新W4、W5、W6、p4、p5和p6,直到Litem趋于预先设定的固定值δ, 得到最优参数;
Figure BDA0002697105800000073
步骤3.5:将训练得到的最优参数W4、W5、W6、p4、p5和p6输入到基于项目的跨域堆 叠自编码器模型中,完成基于项目的跨域堆叠自编码器模型的训练。
步骤4:分别计算基于用户的跨域堆叠自编码器模型与基于项目的跨域堆叠自编码器模 型的RMSE值
Figure BDA0002697105800000074
Figure BDA0002697105800000075
选择对应RMSE值较大的预测向量作为最终预 测向量;
Figure BDA0002697105800000076
Figure BDA0002697105800000077
步骤5:根据最终预测向量得到用户集M中每个用户对目标域中所有项目的评分,取前 n个评分最高的项目向用户进行推荐。
与现有技术相比,本发明的有益效果是:
(1)本发明是一种基于堆叠自编码器的跨域推荐方法,该方法将跨域信息引入自动编码 器中,以了解用户和商品的更深层的非线性网络结构。
(2)本发明从两个方面评估推荐模型,即预测准确性和分类准确性。预测准确性是系统 预测用户对某项商品的偏好的能力的度量。分类的准确性是衡量信息检索任务的质量。目标 是为用户找到最相关的前n个项目。
(3)本发明通过对目标域用户向量的扩展,并且结合深度学习有效地解决了稀疏性问题, 在评分预测和Top-n推荐方面优于其他模型。
实施例1:
附图1为本发明实施例提供的基于用户的跨域堆叠自编码器模型图,附图2为本发明实 施例提供的基于项目的跨域堆叠自编码器模型图。附图3为本发明实施例提供的基于堆叠自 编码器的跨域推荐算法的框架图。结合上述模型图和框架图,本实施例公开了基于因子分解 机制的跨域推荐算法具体如下:
(1)给出的源数据域的用户-项目-评分数据集Rs和目标域的用户-项目-评分数据集Rt,源 数据域和目标数据域有公共的用户集M,以及源数据域的项目集Ns和目标域的项目集Nt
Figure BDA0002697105800000081
是源数据域中用户u对项目i的评分,
Figure BDA0002697105800000082
是目标数据域中用户u对项目i的评分。
(2)将向量
Figure BDA0002697105800000083
和向量
Figure BDA0002697105800000084
即评分矩阵的行向量作为基于 用户的跨域堆叠自编码器的输入层,如附图1所示,将向量ri={r1i,r2i,...,rMi},即评分矩阵的 列向量作为基于项目的跨域堆叠自编码器的输入层,如附图2所示。
(3)训练基于用户的跨域堆叠自编码器模型,将向量
Figure BDA0002697105800000085
和向量
Figure BDA0002697105800000086
横向连接作为堆叠自编 码器的输入层,通过三层自编码器的运算得到输出结果
Figure BDA0002697105800000087
公式如下:
Figure RE-GDA0002764692190000088
Figure BDA0002697105800000089
Figure BDA00026971058000000810
Figure BDA00026971058000000811
其中W1,W2和W3为权重矩阵,p1,p2和p3为偏置项。最后,通过Adam方法优化损失 函数,函数公式如下,其中μ为正则化参数:
Figure RE-GDA00027646921900000812
将Luser和预先设置好的学习率λ作为输入代入到Adam算法中,Adam是训练模型参数最 常用的一种算法,它有固定的流程以及输入和输出,通过几百次的迭代,不断地更新W1,W2和W3,p1,p2和p3,直到Luser趋于一个固定值δ,这个固定值是预先设定好的,一般为0.0001。 此时参数是最优的,这里将Adam算法流程简化为如下公式:
Figure BDA00026971058000000813
将训练好的参数重新代入到公式(2)-(4)中计算,得到预测向量
Figure BDA00026971058000000814
(4)训练基于项目的跨域堆叠自编码器模型,将向量ri作为堆叠自编码器的输入层,通 过三层自编码器的运算得到输出结果yi,公式如下:
g1(ri)=f1(ri×W1+p1) (7)
g2(ri)=f2(g1(ri)×W2+p2) (8)
yi=f3(g2(ri)×W3+p3) (9)
其中W1,W2和W3为权重矩阵,p1,p2和p3为偏置项。最后,通过Adam方法优化损失 函数,函数公式如下,其中
Figure BDA0002697105800000091
为正则化参数:
Figure RE-GDA0002764692190000092
将Litem和预先设置好的学习率λ作为输入代入到Adam算法中,通过几百次的迭代,不 断地更新W1,W2和W3,p1,p2和p3,直到Luser趋于一个固定值δ,这个固定值是预先设定 好的,一般为0.0001,此时参数是最优的,如下所示:
Figure RE-GDA0002764692190000093
将训练好的参数重新代入到公式(7)-(9)中计算,得到预测向量
Figure BDA0002697105800000094
(5)最后得到两个算法模型的预测向量
Figure BDA0002697105800000095
Figure BDA0002697105800000096
但在实际的场景中,这两种算法各有优 劣,本专利的创新点就是可以将两个算法合并到一起同时计算,并取最优化的结果,利用均 方根误差(Root Mean Square Error,RMSE)可以评价两个算法的好坏,分别计算两个模型的 RMSE值,将
Figure BDA0002697105800000097
Figure BDA0002697105800000098
分别带入公式(12)中计算,RMSE值较大的向量为最终的预测向量。
Figure RE-GDA0002764692190000099
其中,T为测试集,rui为测试集中用户u对i的评分,
Figure BDA00026971058000000910
测试集中预测的评分,公式(10) 中
Figure BDA00026971058000000911
取值分别为
Figure BDA00026971058000000912
Figure BDA00026971058000000913
这个输出向量表示为每个用户对所有项目的评分,因为原始数据集 中只有用户对一少部分的项目具有评分,通过模型的计算可以得到全部的项目评分,即模型 可以进行评分预测。在实际的场景中可以取前n个评分最高的项目向用户进行推荐,这就是 top-n推荐。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员 来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等 同替换、改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.一种基于堆叠自编码器的跨域推荐方法,其特征在于,包括以下步骤:
步骤1:获取源数据域的用户-项目-评分数据和目标域的用户-项目-评分数据,包括源数据域的用户-项目-评分数据集Rs、目标域的用户-项目-评分数据集Rt、源数据域的项目集和目标域的项目集;所述的源数据域和目标数据域有公共的用户集M;
步骤2:将向量
Figure FDA0002697105790000011
输入到训练好的基于用户的跨域堆叠自编码器模型中,得到预测向量
Figure FDA0002697105790000012
Figure FDA0002697105790000013
Figure FDA0002697105790000014
Figure FDA0002697105790000015
Figure FDA0002697105790000016
其中,
Figure FDA0002697105790000017
Figure FDA0002697105790000018
是源数据域中用户u对项目i的评分,i=1,2,...,Ns,Ns为源数据域的项目集中项目数量;
Figure FDA0002697105790000019
Figure FDA00026971057900000110
是目标域中用户u对项目j的评分,j=1,2,...,Nt,Nt为目标域的项目集中项目数量;u∈M;W1、W2和W3为权重矩阵;p1、p2和p3为偏置项;f1和f3为Sigmoid激活函数,f2为Identity激活函数;
步骤3:将向量
Figure FDA00026971057900000111
输入到训练好的基于项目的跨域堆叠自编码器模型中,得到预测向量
Figure FDA00026971057900000112
Figure FDA00026971057900000113
Figure FDA00026971057900000114
Figure FDA00026971057900000115
其中,
Figure FDA00026971057900000116
m为用户集M中用户的数量;
Figure FDA00026971057900000117
W4、W5和W6为权重矩阵;p4、p5和p6为偏置项;
步骤4:分别计算基于用户的跨域堆叠自编码器模型与基于项目的跨域堆叠自编码器模型的RMSE值
Figure FDA00026971057900000118
Figure FDA00026971057900000119
选择对应RMSE值较大的预测向量作为最终预测向量;
Figure FDA0002697105790000021
Figure FDA0002697105790000022
步骤5:根据最终预测向量得到用户集M中每个用户对目标域中所有项目的评分,取前n个评分最高的项目向用户进行推荐。
2.根据权利要求1所述的一种基于堆叠自编码器的跨域推荐方法,其特征在于:所述的步骤2中基于用户的跨域堆叠自编码器模型的训练方法具体为:
步骤2.1:取部分输入的向量
Figure FDA0002697105790000023
构造训练集;
步骤2.2:将训练集中向量
Figure FDA0002697105790000024
和向量
Figure FDA0002697105790000025
横向连接作为堆叠自编码器的输入层,通过三层自编码器的运算得到输出结果
Figure FDA0002697105790000026
步骤2.3:计算损失函数Luser
Figure FDA0002697105790000027
其中,μ为正则化参数:
步骤2.4:将损失函数Luser和预先设置好的学习率λ作为输入代入到Adam算法中,Adam算法通过迭代不断地更新W1、W2、W3、p1、p2和p3,直到Luser趋于预先设定的固定值δ,得到最优参数;
Figure FDA0002697105790000028
步骤2.5:将训练得到的最优参数W1、W2、W3、p1、p2和p3输入到基于用户的跨域堆叠自编码器模型中,完成基于用户的跨域堆叠自编码器模型的训练。
3.根据权利要求1或2所述的一种基于堆叠自编码器的跨域推荐方法,其特征在于:所述的步骤3中基于项目的跨域堆叠自编码器模型的训练方法具体为:
步骤3.1:取部分输入的向量
Figure FDA0002697105790000029
构造训练集;
步骤3.2:将训练集中向量
Figure FDA00026971057900000210
作为堆叠自编码器的输入层,通过三层自编码器的运算得到输出结果
Figure FDA00026971057900000211
步骤3.3:计算损失函数Litem
Figure FDA0002697105790000031
其中,
Figure FDA0002697105790000032
为正则化参数;
步骤3.4:将损失函数Litem和预先设置好的学习率λ作为输入代入到Adam算法中,Adam算法通过迭代不断地更新W4、W5、W6、p4、p5和p6,直到Litem趋于预先设定的固定值δ,得到最优参数;
Figure FDA0002697105790000033
步骤3.5:将训练得到的最优参数W4、W5、W6、p4、p5和p6输入到基于项目的跨域堆叠自编码器模型中,完成基于项目的跨域堆叠自编码器模型的训练。
CN202011009508.XA 2020-09-23 2020-09-23 一种基于堆叠自编码器的跨域推荐方法 Active CN112149734B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011009508.XA CN112149734B (zh) 2020-09-23 2020-09-23 一种基于堆叠自编码器的跨域推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011009508.XA CN112149734B (zh) 2020-09-23 2020-09-23 一种基于堆叠自编码器的跨域推荐方法

Publications (2)

Publication Number Publication Date
CN112149734A true CN112149734A (zh) 2020-12-29
CN112149734B CN112149734B (zh) 2022-04-05

Family

ID=73897994

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011009508.XA Active CN112149734B (zh) 2020-09-23 2020-09-23 一种基于堆叠自编码器的跨域推荐方法

Country Status (1)

Country Link
CN (1) CN112149734B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113935477A (zh) * 2021-12-17 2022-01-14 深圳佑驾创新科技有限公司 推荐模型的训练方法、推荐方法及计算机可读存储介质
CN115438732A (zh) * 2022-09-06 2022-12-06 重庆理工大学 面向冷启动用户基于分类偏好迁移的跨域推荐方法
CN116910375A (zh) * 2023-09-13 2023-10-20 南京大数据集团有限公司 一种基于用户偏好多样性的跨域推荐方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108647251A (zh) * 2018-04-20 2018-10-12 昆明理工大学 基于宽深度门循环联合模型的推荐排序方法
CN109241440A (zh) * 2018-09-29 2019-01-18 北京工业大学 一种基于深度学习的面向隐式反馈推荐方法
CN109783739A (zh) * 2019-01-23 2019-05-21 北京工业大学 一种基于层叠稀疏降噪自编码器增强的协同过滤推荐方法
US20190251435A1 (en) * 2018-02-09 2019-08-15 Daniel Shiebler Matching cross domain user affinity with co-embeddings

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190251435A1 (en) * 2018-02-09 2019-08-15 Daniel Shiebler Matching cross domain user affinity with co-embeddings
CN108647251A (zh) * 2018-04-20 2018-10-12 昆明理工大学 基于宽深度门循环联合模型的推荐排序方法
CN109241440A (zh) * 2018-09-29 2019-01-18 北京工业大学 一种基于深度学习的面向隐式反馈推荐方法
CN109783739A (zh) * 2019-01-23 2019-05-21 北京工业大学 一种基于层叠稀疏降噪自编码器增强的协同过滤推荐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HUIKAI SHAO 等: "Cross-Domain Palmprint Recognition Based on Transfer Convolutional Autoencoder", 《2019 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP)》 *
刘欢 等: "基于跨域对抗学习的零样本分类", 《计算机研究与发展》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113935477A (zh) * 2021-12-17 2022-01-14 深圳佑驾创新科技有限公司 推荐模型的训练方法、推荐方法及计算机可读存储介质
CN113935477B (zh) * 2021-12-17 2022-02-22 深圳佑驾创新科技有限公司 推荐模型的训练方法、推荐方法及计算机可读存储介质
CN115438732A (zh) * 2022-09-06 2022-12-06 重庆理工大学 面向冷启动用户基于分类偏好迁移的跨域推荐方法
CN115438732B (zh) * 2022-09-06 2023-05-26 重庆理工大学 面向冷启动用户基于分类偏好迁移的跨域推荐方法
CN116910375A (zh) * 2023-09-13 2023-10-20 南京大数据集团有限公司 一种基于用户偏好多样性的跨域推荐方法及系统
CN116910375B (zh) * 2023-09-13 2024-01-23 南京大数据集团有限公司 一种基于用户偏好多样性的跨域推荐方法及系统

Also Published As

Publication number Publication date
CN112149734B (zh) 2022-04-05

Similar Documents

Publication Publication Date Title
CN112149734B (zh) 一种基于堆叠自编码器的跨域推荐方法
Shah et al. Recommender systems: An overview of different approaches to recommendations
CN106682114B (zh) 一种融合用户信任关系和评论信息的个性化推荐方法
CN106802956B (zh) 一种基于加权异构信息网络的电影推荐方法
CN108460619B (zh) 一种提供融合显隐式反馈的协同推荐模型的方法
Kommineni et al. Machine learning based efficient recommendation system for book selection using user based collaborative filtering algorithm
Saleh et al. Promoting the performance of vertical recommendation systems by applying new classification techniques
Do et al. Dynamic weighted hybrid recommender systems
Feng et al. Improving group recommendations via detecting comprehensive correlative information
Sridhar et al. Content-Based Movie Recommendation System Using MBO with DBN.
Wang et al. Emrm: Enhanced multi-source review-based model for rating prediction
Ai et al. Online-rating prediction based on an improved opinion spreading approach
CN110968675B (zh) 一种基于多领域语义融合的推荐方法及系统
CN112256966B (zh) 基于半监督因子分解机的物品推荐方法
Mu et al. Auxiliary stacked denoising autoencoder based collaborative filtering recommendation
Usha et al. Data Mining Techniques used in the Recommendation of E-commerce services
Fathan et al. Impact of matrix factorization and regularization hyperparameter on a recommender system for movies
Quan et al. Heterogeneous neural collaborative filtering for a business recommender system
Chen et al. Trust-based collaborative filtering algorithm in social network
Gao et al. Deep learning with consumer preferences for recommender system
Narang et al. Deep content-collaborative recommender system (DCCRS)
Dang et al. A hybrid framework for enhancing correlation to solve cold-start problem in recommender systems
Suo et al. Entity Recommendation Via Integrating Multiple Types of Implicit Feedback in Heterogeneous Information Network
CN117171449B (zh) 一种基于图神经网络的推荐方法
CN113239265B (zh) 基于连接矩阵的个性化推荐方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant