CN113536116A - 基于双流sliced wasserstein自编码器的跨域推荐方法 - Google Patents

基于双流sliced wasserstein自编码器的跨域推荐方法 Download PDF

Info

Publication number
CN113536116A
CN113536116A CN202110728906.5A CN202110728906A CN113536116A CN 113536116 A CN113536116 A CN 113536116A CN 202110728906 A CN202110728906 A CN 202110728906A CN 113536116 A CN113536116 A CN 113536116A
Authority
CN
China
Prior art keywords
domain
user
cross
data
encoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110728906.5A
Other languages
English (en)
Other versions
CN113536116B (zh
Inventor
聂婕
赵紫安
魏志强
叶敏
左子杰
谢华鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ocean University of China
Original Assignee
Ocean University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ocean University of China filed Critical Ocean University of China
Priority to CN202110728906.5A priority Critical patent/CN113536116B/zh
Publication of CN113536116A publication Critical patent/CN113536116A/zh
Application granted granted Critical
Publication of CN113536116B publication Critical patent/CN113536116B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Abstract

本发明属于跨域推荐技术领域,公开了基于双流sliced wasserstein自编码器的跨域推荐方法,将数据输入到跨域推荐模型的编码器中,经过编码器可以得到用户隐空间上的特征向量,将上述的特征向量输入到跨域推荐模型的解码器中,得到重构的用户交互向量,对两个域用户特征向量加以高斯分布的限制,同时使用Sliced Wasserstein距离来缓解分布不平衡的问题,达到高精度的推荐效果,解决现有跨域推荐存在的数据稀疏性问题以及变分自编码器带来的分布不对齐问题。

Description

基于双流sliced wasserstein自编码器的跨域推荐方法
技术领域
本发明属于跨域推荐技术领域,特别涉及基于双流sliced wasserstein自编码器的跨域推荐方法。
背景技术
跨域推荐通过构建统一的隐空间实现多域表征的对齐和跨域重建,目前最前沿的跨域表征是基于多域变分自编码器架构的跨域表征模型。该模型的优势是能够基于变分推理实现跨域分布的对齐,但是,该模型在隐变量分布对齐的过程中采用KL散度,无法准确刻画分布差异,导致模型收敛缓慢;其次,该模型采用确定性解码函数,无法对重构表征的分布进行准确刻画,导致重构的多样性缺失;第三,在跨域重建的过程中聚焦于共性特征的建模,忽略了多域的差异性。同时针对跨域上的因变量的迁移,我们提出使用SWAE来提高正交变换的性能,刻画不同域上用户的特征。因此针对以上三个问题,本项目提出了一种基于典型相关和域差异刻画的跨域推荐架构。
在跨域推荐问题上大多模型是在构建一个高质量的用户特征向量,其次在该特征向量入手,通过某种算法或网络架构将学习到的特征映射到另一个域上。多数找寻该特征向量的方法包括但不限于使用线性网络层、变分自编码器以及其他自编码器。在跨域问题上则有应用迁移学习的思想,将网络权重或者特征向量进行迁移,同时有模型在特征向量训练过程中就使用共享权重,以及堆对不同域上的特征向量应用正交变换等方法。
目前多数构建特征向量的模型采用ae自编码器的架构。其中包括去噪自编码器(denoising autoencoder),该类模型只能重构输入和输出,缺少一定的生成能力,并且只能将数据映射到一个固定的空间,这导致模型的泛化能力很弱。除此之外变分自编码器(variational autoencoder)采用了变分推理,构成了上述模型的生成能力。但是该方法根据K-L散度衡量特征空间和先验空间的差异,从而导致一对多的重构误差和空间之间的不对齐问题。
因此,我们提出使用Sliced Wasserstein autoencoder来解决上述问题,该方法同时具备应有的生成能力,而且该方法基于最佳传输原理,避免了kl散度的弱点。本发明的目的在于针对现有技术中纯跨域推荐存在的数据稀疏性问题以及变分自编码器带来的分布不对齐问题,提供可提高推荐精准度的基于双流Sliced Wasserstein的跨域推荐方法。
发明内容
针对现有技术存在的不足,本发明提供一种基于双流sliced wasserstein自编码器的跨域推荐方法,将双流Sliced Wasserstein自编码器用于跨域推荐场景中,使用可训练的参数矩阵进行特征的迁移,使用Sliced Wasserstein对迁移后的特征进行对齐,有效地提高了迁移的能力,以增强最终的推荐效果。
为了解决上述技术问题,本发明采用的技术方案是:
基于双流sliced wasserstein自编码器的跨域推荐方法,包括以下步骤:
S1、获取输入数据
获取A数据域的用户-项目-评分数据和B域的用户-项目-评分数据,得到用户i在a域的交互数据xi,用户i在b域的交互数据yi
S2、将上述数据输入到跨域推荐模型的编码器中,经过编码器可以得到用户隐空间上的特征向量:
zx=σ(Wxxi+cu+bx)
zy=σ(Wyyi+cu+by)
Wx、Wy、cu分别是编码器中可训练的参数矩阵,bx、by为偏置,σ为激活函数;
S3、将上述的特征向量输入到跨域推荐模型的解码器中,得到重构的用户交互向量:
Figure BDA0003138598500000021
Figure BDA0003138598500000022
得到4个重构的用户交互向量,
Figure BDA0003138598500000023
代表从A域恢复得来的用户在A域交互向量,
Figure BDA0003138598500000024
代表从B域恢复来的用户在A域的交互向量,
Figure BDA0003138598500000025
代表从B域恢复得来的用户在B域交互向量,
Figure BDA0003138598500000026
代表从A域恢复来的用户在B域的交互向量,σ为激活函数,Wx′、Wy′分别是解码器中可训练的参数矩阵,bx′、by′为偏置;
S4、对两个域S2中所述用户隐空间上的特征向量和S3中所述重构的用户交互向量加以高斯分布的限制,同时计算其与高斯分布之间的Sliced Wasserstein距离,通过损失函数来训练跨域推荐模型中的所有参数,使用Adam优化器进行参数的迭代更新。
进一步的,步骤S1中,两个域上具有共同的用户,则一个用户在不同域上有如下的数据对(xi,yi),其中,在将数据输入跨域推荐模型进行后续步骤时,使用用户的隐反馈数据,xi、yi是代表对所有用户是否有交互的向量,有则为1,否则为0。
进一步的,步骤S4中,损失函数包括两部分:一是高斯对齐;二是特征学习,包括重构损失以及跨域特征对齐损失,
高斯对齐部分的损失如下:
Figure BDA0003138598500000031
Figure BDA0003138598500000032
代表两个均值为0、方差为1的高斯分布;
特征学习部分的损失如下:
Figure BDA0003138598500000033
其中,ce代表交叉熵损失,
上述SW1为模为1的sliced wasersstein距离,计算方法如下:
Figure BDA0003138598500000034
ηl为随机采样的向量,[m]为对数据切片的索引,L为投影的个数。
与现有技术相比,本发明优点在于:
(1)本发明采用双流Sliced Wasserstein自编码器代替多域变分自编码器,利用sliced Wasserstein距离代替KL散度,提升跨域推荐模型生成能力,具有更好的提取特征的能力,可以在不同数据域上得到一个更高质量的用户特征向量。本发明首次将双流SWAE模型应用于跨域推荐场景中,可以有效地提高用户特征空间的表征能力。当两个分布之间没有交集时,传统的变分自编码器无法准确衡量分布的差异,而本发明通过计算Wasserstein距离,可以在分布没有交集时也能判断他们之间的差异。
(2)本发明使用可训练的参数矩阵进行特征的迁移,同时使用SlicedWasserstein对迁移后的特征进行对齐,有效地提高了迁移的能力,以增强最终的推荐效果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的方法原理示意图。
具体实施方式
下面结合附图及具体实施例对本发明作进一步的说明。
结合图1所示,基于双流sliced wasserstein自编码器的跨域推荐方法,包括以下步骤:
S1、获取输入数据
获取A数据域的用户-项目-评分数据和B域的用户-项目-评分数据,得到用户i在a域的交互数据xi,用户i在b域的交互数据yi
上述两个域上具有共同的用户,则一个用户在不同域上有如下的数据对(xi,yi),其中,在将数据输入跨域推荐模型进行后续步骤时,使用用户的隐反馈数据,即xi、yi代表对所有用户是否有交互的向量,有则为1,否则为0。
S2、将上述数据输入到跨域推荐模型的编码器中,经过编码器可以得到用户隐空间上的特征向量:
zx=σ(Wxxi+cu+bx)
zy=σ(Wyyi+cu+by)
Wx、Wy、cu分别是编码器中可训练的参数矩阵,bx、by为偏置,σ为激活函数,使用ReLU。
S3、将上述的特征向量输入到跨域推荐模型的解码器中,得到重构的用户交互向量,即预测的交互:
Figure BDA0003138598500000051
Figure BDA0003138598500000052
这里会得到4个重构的用户交互向量,
Figure BDA0003138598500000053
代表从A域恢复得来的用户在A域交互向量,
Figure BDA0003138598500000054
代表从B域恢复来的用户在A域的交互向量,
Figure BDA0003138598500000055
代表从B域恢复得来的用户在B域交互向量,
Figure BDA0003138598500000056
代表从A域恢复来的用户在B域的交互向量,Wx′、Wy′分别是解码器中可训练的参数矩阵,bx′、by′为偏置;σ为激活函数,使用ReLU。
S4、为了使不同域学习到的用户特征向量分布对齐,对两个域S2中所述用户隐空间上的特征向量和S3中所述重构的用户交互向量加以高斯分布的限制,同时计算其与高斯分布之间的Sliced Wasserstein距离,来缓解分布不平衡的问题,通过损失函数来训练跨域推荐模型中的所有参数,使用Adam优化器进行参数的迭代更新。
损失函数包括两部分:一是高斯对齐;二是特征学习,包括重构损失以及跨域特征对齐损失,
高斯对齐部分的损失如下:
Figure BDA0003138598500000057
Figure BDA0003138598500000058
代表两个均值为0、方差为1的高斯分布;
特征学习部分的损失如下:
Figure BDA0003138598500000059
其中,SW1(zx,zyW′x)+SW1(zy,zxW′y)为重构损失,ce代表交叉熵损失,
Figure BDA00031385985000000510
为跨域特征对齐损失。
上述SW1为模为1的sliced wasersstein距离,计算方法如下:
Figure BDA00031385985000000511
ηl为随机采样的向量,[m]为对数据切片的索引,L为投影的个数。通过Sliced切片操作将Wasserstein距离计算投影到低维空间,降低计算复杂度的同时增强了特征的表示能力。
下表为利用本发明所述跨域推荐方法进行的电影域-书籍域上的推荐效果:
Figure BDA0003138598500000061
其中有三个指标,hr,ndcg,mrr,都是来评判推荐的性能,分数越高代表着推荐效果越好。具体做法是,给跨域推荐模型一组测试数据,该数据会包括用户没有买过的一些物品,例如一组数据包括100个,1个真实买过的物品,99个没有买过的物品,指标得分越高,代表着模型对真实物品推荐的位置更靠前(例如真实买过物品的预测排在100的第五位的得分要比排在第20位要高)。
综上所述,本发明将Sliced Wasserstein自编码器应用在跨域推荐场景上,可以具备更好的生成能力以及提取特征的能力,可以在不同数据域上得到一个更高质量的用户特征向量,并且,当两个分布之间没有交集时,传统的变分自编码器(VAE)计算公式会得出0,此时无法准确衡量分布的差异,而本发明通过计算Wasserstein距离,可以在分布没有交集时也能判断他们之间的差异。同时,本发明采用Sliced切片操作将Wasserstein距离计算投影到低维空间,降低计算复杂度的同时增强了特征的表示能力。同时我们采用正交变换重构,可以将特征向量通过矩阵映射到别的域,这增强了在该域上的推荐效果。
当然,上述说明并非是对本发明的限制,本发明也并不限于上述举例,本技术领域的普通技术人员,在本发明的实质范围内,做出的变化、改型、添加或替换,都应属于本发明的保护范围。

Claims (3)

1.基于双流sliced wasserstein自编码器的跨域推荐方法,其特征在于,包括以下步骤:
S1、获取输入数据
获取A数据域的用户-项目-评分数据和B域的用户-项目-评分数据,得到用户i在a域的交互数据xi,用户i在b域的交互数据yi
S2、将上述数据输入到跨域推荐模型的编码器中,经过编码器可以得到用户隐空间上的特征向量:
zx=σ(Wxxi+cu+bx)
zy=σ(Wyyi+cu+by)
Wx、Wy、cu分别是编码器中可训练的参数矩阵,bx、by为偏置,σ为激活函数;
S3、将上述的特征向量输入到跨域推荐模型的解码器中,得到重构的用户交互向量:
Figure FDA0003138598490000011
Figure FDA0003138598490000012
得到4个重构的用户交互向量,
Figure FDA0003138598490000013
代表从A域恢复得来的用户在A域交互向量,
Figure FDA0003138598490000014
代表从B域恢复来的用户在A域的交互向量,
Figure FDA0003138598490000015
代表从B域恢复得来的用户在B域交互向量,
Figure FDA0003138598490000016
代表从A域恢复来的用户在B域的交互向量,σ为激活函数,Wx′、Wy′分别是解码器中可训练的参数矩阵,bx′、by′为偏置;
S4、对两个域S2中所述用户隐空间上的特征向量和S3中所述重构的用户交互向量加以高斯分布的限制,同时计算其与高斯分布之间的Sliced Wasserstein距离,通过损失函数来训练跨域推荐模型中的所有参数,使用Adam优化器进行参数的迭代更新。
2.根据权利要求1所述的基于双流sliced wasserstein自编码器的跨域推荐方法,其特征在于,步骤S1中,两个域上具有共同的用户,则一个用户在不同域上有如下的数据对(xi,yi),其中,在将数据输入跨域推荐模型进行后续步骤时,使用用户的隐反馈数据,xi、yi是代表对所有用户是否有交互的向量,有则为1,否则为0。
3.根据权利要求2所述的基于双流sliced wasserstein自编码器的跨域推荐方法,其特征在于,步骤S4中,损失函数包括两部分:一是高斯对齐;二是特征学习,包括重构损失以及跨域特征对齐损失,
高斯对齐部分的损失如下:
Figure FDA0003138598490000021
Figure FDA0003138598490000022
代表两个均值为0、方差为1的高斯分布;
特征学习部分的损失如下:
Figure FDA0003138598490000023
其中,ce代表交叉熵损失,
上述SW1为模为1的sliced wasersstein距离,计算方法如下:
Figure FDA0003138598490000024
ηl为随机采样的向量,[m]为对数据切片的索引,L为投影的个数。
CN202110728906.5A 2021-06-29 2021-06-29 基于双流sliced wasserstein自编码器的跨域推荐方法 Active CN113536116B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110728906.5A CN113536116B (zh) 2021-06-29 2021-06-29 基于双流sliced wasserstein自编码器的跨域推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110728906.5A CN113536116B (zh) 2021-06-29 2021-06-29 基于双流sliced wasserstein自编码器的跨域推荐方法

Publications (2)

Publication Number Publication Date
CN113536116A true CN113536116A (zh) 2021-10-22
CN113536116B CN113536116B (zh) 2023-11-28

Family

ID=78126227

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110728906.5A Active CN113536116B (zh) 2021-06-29 2021-06-29 基于双流sliced wasserstein自编码器的跨域推荐方法

Country Status (1)

Country Link
CN (1) CN113536116B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108647226A (zh) * 2018-03-26 2018-10-12 浙江大学 一种基于变分自动编码器的混合推荐方法
CN110059220A (zh) * 2019-04-12 2019-07-26 北京工业大学 一种基于深度学习与贝叶斯概率矩阵分解的电影推荐方法
CN111859142A (zh) * 2020-07-28 2020-10-30 山东大学 一种基于互联互通家居平台的跨设备迁移推荐系统及其工作方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108647226A (zh) * 2018-03-26 2018-10-12 浙江大学 一种基于变分自动编码器的混合推荐方法
CN110059220A (zh) * 2019-04-12 2019-07-26 北京工业大学 一种基于深度学习与贝叶斯概率矩阵分解的电影推荐方法
CN111859142A (zh) * 2020-07-28 2020-10-30 山东大学 一种基于互联互通家居平台的跨设备迁移推荐系统及其工作方法

Also Published As

Publication number Publication date
CN113536116B (zh) 2023-11-28

Similar Documents

Publication Publication Date Title
Kalofolias et al. Matrix completion on graphs
Jun et al. Distribution augmentation for generative modeling
Radchenko et al. Improved variable selection with forward-lasso adaptive shrinkage
CN111460528B (zh) 一种基于Adam优化算法的多方联合训练方法及系统
Zhang et al. Direct fidelity estimation of quantum states using machine learning
Zhang et al. Quaternion collaborative filtering for recommendation
Liu et al. A deep framework assembling principled modules for CS-MRI: unrolling perspective, convergence behaviors, and practical modeling
Andrews et al. Maximum likelihood inference in weakly identified DSGE models
CN113536116A (zh) 基于双流sliced wasserstein自编码器的跨域推荐方法
Cheng et al. User-controllable arbitrary style transfer via entropy regularization
Contardo et al. Representation learning for cold-start recommendation
CN115374863A (zh) 样本生成方法、装置、存储介质和设备
Tucci et al. Deep neural networks based surrogate model for topology optimization of electromagnetic devices
Tan et al. Calibrated adversarial algorithms for generative modelling
Li et al. Neural collaborative autoencoder
CN115481415A (zh) 基于纵向联邦学习的通信成本优化方法、系统、设备及介质
CN114547276A (zh) 基于三通道图神经网络的会话推荐方法
CN111242379A (zh) 一种基于随机傅里叶特征的核递归最大相关熵时间序列在线预测方法
Yokoyama et al. An Accurate Graph Generative Model with Tunable Features
Ha et al. Reweighted nuclear norm regularization: A SPARSEVA approach
Bondarenko Constructing networks of quantum channels for state preparation
Wu et al. Predicting nash equilibria in bimatrix games using a robust bi-channel convolutional neural network
CN112507225B (zh) 一种基于双层优化的推荐系统数据调试方法
Wei et al. Pretraining binarization encoders for recommendation acceleration
Zhou et al. Unexp-DIN: Unexpected Deep Interest Network for Recommendation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant