CN113536116A - 基于双流sliced wasserstein自编码器的跨域推荐方法 - Google Patents
基于双流sliced wasserstein自编码器的跨域推荐方法 Download PDFInfo
- Publication number
- CN113536116A CN113536116A CN202110728906.5A CN202110728906A CN113536116A CN 113536116 A CN113536116 A CN 113536116A CN 202110728906 A CN202110728906 A CN 202110728906A CN 113536116 A CN113536116 A CN 113536116A
- Authority
- CN
- China
- Prior art keywords
- domain
- user
- cross
- data
- encoder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 239000013598 vector Substances 0.000 claims description 50
- 230000003993 interaction Effects 0.000 claims description 27
- 238000009826 distribution Methods 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 6
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 230000002452 interceptive effect Effects 0.000 claims description 3
- 238000012512 characterization method Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000005012 migration Effects 0.000 description 5
- 238000013508 migration Methods 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000007792 addition Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
Abstract
本发明属于跨域推荐技术领域,公开了基于双流sliced wasserstein自编码器的跨域推荐方法,将数据输入到跨域推荐模型的编码器中,经过编码器可以得到用户隐空间上的特征向量,将上述的特征向量输入到跨域推荐模型的解码器中,得到重构的用户交互向量,对两个域用户特征向量加以高斯分布的限制,同时使用Sliced Wasserstein距离来缓解分布不平衡的问题,达到高精度的推荐效果,解决现有跨域推荐存在的数据稀疏性问题以及变分自编码器带来的分布不对齐问题。
Description
技术领域
本发明属于跨域推荐技术领域,特别涉及基于双流sliced wasserstein自编码器的跨域推荐方法。
背景技术
跨域推荐通过构建统一的隐空间实现多域表征的对齐和跨域重建,目前最前沿的跨域表征是基于多域变分自编码器架构的跨域表征模型。该模型的优势是能够基于变分推理实现跨域分布的对齐,但是,该模型在隐变量分布对齐的过程中采用KL散度,无法准确刻画分布差异,导致模型收敛缓慢;其次,该模型采用确定性解码函数,无法对重构表征的分布进行准确刻画,导致重构的多样性缺失;第三,在跨域重建的过程中聚焦于共性特征的建模,忽略了多域的差异性。同时针对跨域上的因变量的迁移,我们提出使用SWAE来提高正交变换的性能,刻画不同域上用户的特征。因此针对以上三个问题,本项目提出了一种基于典型相关和域差异刻画的跨域推荐架构。
在跨域推荐问题上大多模型是在构建一个高质量的用户特征向量,其次在该特征向量入手,通过某种算法或网络架构将学习到的特征映射到另一个域上。多数找寻该特征向量的方法包括但不限于使用线性网络层、变分自编码器以及其他自编码器。在跨域问题上则有应用迁移学习的思想,将网络权重或者特征向量进行迁移,同时有模型在特征向量训练过程中就使用共享权重,以及堆对不同域上的特征向量应用正交变换等方法。
目前多数构建特征向量的模型采用ae自编码器的架构。其中包括去噪自编码器(denoising autoencoder),该类模型只能重构输入和输出,缺少一定的生成能力,并且只能将数据映射到一个固定的空间,这导致模型的泛化能力很弱。除此之外变分自编码器(variational autoencoder)采用了变分推理,构成了上述模型的生成能力。但是该方法根据K-L散度衡量特征空间和先验空间的差异,从而导致一对多的重构误差和空间之间的不对齐问题。
因此,我们提出使用Sliced Wasserstein autoencoder来解决上述问题,该方法同时具备应有的生成能力,而且该方法基于最佳传输原理,避免了kl散度的弱点。本发明的目的在于针对现有技术中纯跨域推荐存在的数据稀疏性问题以及变分自编码器带来的分布不对齐问题,提供可提高推荐精准度的基于双流Sliced Wasserstein的跨域推荐方法。
发明内容
针对现有技术存在的不足,本发明提供一种基于双流sliced wasserstein自编码器的跨域推荐方法,将双流Sliced Wasserstein自编码器用于跨域推荐场景中,使用可训练的参数矩阵进行特征的迁移,使用Sliced Wasserstein对迁移后的特征进行对齐,有效地提高了迁移的能力,以增强最终的推荐效果。
为了解决上述技术问题,本发明采用的技术方案是:
基于双流sliced wasserstein自编码器的跨域推荐方法,包括以下步骤:
S1、获取输入数据
获取A数据域的用户-项目-评分数据和B域的用户-项目-评分数据,得到用户i在a域的交互数据xi,用户i在b域的交互数据yi,
S2、将上述数据输入到跨域推荐模型的编码器中,经过编码器可以得到用户隐空间上的特征向量:
zx=σ(Wxxi+cu+bx)
zy=σ(Wyyi+cu+by)
Wx、Wy、cu分别是编码器中可训练的参数矩阵,bx、by为偏置,σ为激活函数;
S3、将上述的特征向量输入到跨域推荐模型的解码器中,得到重构的用户交互向量:
得到4个重构的用户交互向量,代表从A域恢复得来的用户在A域交互向量,代表从B域恢复来的用户在A域的交互向量,代表从B域恢复得来的用户在B域交互向量,代表从A域恢复来的用户在B域的交互向量,σ为激活函数,Wx′、Wy′分别是解码器中可训练的参数矩阵,bx′、by′为偏置;
S4、对两个域S2中所述用户隐空间上的特征向量和S3中所述重构的用户交互向量加以高斯分布的限制,同时计算其与高斯分布之间的Sliced Wasserstein距离,通过损失函数来训练跨域推荐模型中的所有参数,使用Adam优化器进行参数的迭代更新。
进一步的,步骤S1中,两个域上具有共同的用户,则一个用户在不同域上有如下的数据对(xi,yi),其中,在将数据输入跨域推荐模型进行后续步骤时,使用用户的隐反馈数据,xi、yi是代表对所有用户是否有交互的向量,有则为1,否则为0。
进一步的,步骤S4中,损失函数包括两部分:一是高斯对齐;二是特征学习,包括重构损失以及跨域特征对齐损失,
高斯对齐部分的损失如下:
特征学习部分的损失如下:
其中,ce代表交叉熵损失,
上述SW1为模为1的sliced wasersstein距离,计算方法如下:
ηl为随机采样的向量,[m]为对数据切片的索引,L为投影的个数。
与现有技术相比,本发明优点在于:
(1)本发明采用双流Sliced Wasserstein自编码器代替多域变分自编码器,利用sliced Wasserstein距离代替KL散度,提升跨域推荐模型生成能力,具有更好的提取特征的能力,可以在不同数据域上得到一个更高质量的用户特征向量。本发明首次将双流SWAE模型应用于跨域推荐场景中,可以有效地提高用户特征空间的表征能力。当两个分布之间没有交集时,传统的变分自编码器无法准确衡量分布的差异,而本发明通过计算Wasserstein距离,可以在分布没有交集时也能判断他们之间的差异。
(2)本发明使用可训练的参数矩阵进行特征的迁移,同时使用SlicedWasserstein对迁移后的特征进行对齐,有效地提高了迁移的能力,以增强最终的推荐效果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的方法原理示意图。
具体实施方式
下面结合附图及具体实施例对本发明作进一步的说明。
结合图1所示,基于双流sliced wasserstein自编码器的跨域推荐方法,包括以下步骤:
S1、获取输入数据
获取A数据域的用户-项目-评分数据和B域的用户-项目-评分数据,得到用户i在a域的交互数据xi,用户i在b域的交互数据yi。
上述两个域上具有共同的用户,则一个用户在不同域上有如下的数据对(xi,yi),其中,在将数据输入跨域推荐模型进行后续步骤时,使用用户的隐反馈数据,即xi、yi代表对所有用户是否有交互的向量,有则为1,否则为0。
S2、将上述数据输入到跨域推荐模型的编码器中,经过编码器可以得到用户隐空间上的特征向量:
zx=σ(Wxxi+cu+bx)
zy=σ(Wyyi+cu+by)
Wx、Wy、cu分别是编码器中可训练的参数矩阵,bx、by为偏置,σ为激活函数,使用ReLU。
S3、将上述的特征向量输入到跨域推荐模型的解码器中,得到重构的用户交互向量,即预测的交互:
这里会得到4个重构的用户交互向量,代表从A域恢复得来的用户在A域交互向量,代表从B域恢复来的用户在A域的交互向量,代表从B域恢复得来的用户在B域交互向量,代表从A域恢复来的用户在B域的交互向量,Wx′、Wy′分别是解码器中可训练的参数矩阵,bx′、by′为偏置;σ为激活函数,使用ReLU。
S4、为了使不同域学习到的用户特征向量分布对齐,对两个域S2中所述用户隐空间上的特征向量和S3中所述重构的用户交互向量加以高斯分布的限制,同时计算其与高斯分布之间的Sliced Wasserstein距离,来缓解分布不平衡的问题,通过损失函数来训练跨域推荐模型中的所有参数,使用Adam优化器进行参数的迭代更新。
损失函数包括两部分:一是高斯对齐;二是特征学习,包括重构损失以及跨域特征对齐损失,
高斯对齐部分的损失如下:
特征学习部分的损失如下:
上述SW1为模为1的sliced wasersstein距离,计算方法如下:
ηl为随机采样的向量,[m]为对数据切片的索引,L为投影的个数。通过Sliced切片操作将Wasserstein距离计算投影到低维空间,降低计算复杂度的同时增强了特征的表示能力。
下表为利用本发明所述跨域推荐方法进行的电影域-书籍域上的推荐效果:
其中有三个指标,hr,ndcg,mrr,都是来评判推荐的性能,分数越高代表着推荐效果越好。具体做法是,给跨域推荐模型一组测试数据,该数据会包括用户没有买过的一些物品,例如一组数据包括100个,1个真实买过的物品,99个没有买过的物品,指标得分越高,代表着模型对真实物品推荐的位置更靠前(例如真实买过物品的预测排在100的第五位的得分要比排在第20位要高)。
综上所述,本发明将Sliced Wasserstein自编码器应用在跨域推荐场景上,可以具备更好的生成能力以及提取特征的能力,可以在不同数据域上得到一个更高质量的用户特征向量,并且,当两个分布之间没有交集时,传统的变分自编码器(VAE)计算公式会得出0,此时无法准确衡量分布的差异,而本发明通过计算Wasserstein距离,可以在分布没有交集时也能判断他们之间的差异。同时,本发明采用Sliced切片操作将Wasserstein距离计算投影到低维空间,降低计算复杂度的同时增强了特征的表示能力。同时我们采用正交变换重构,可以将特征向量通过矩阵映射到别的域,这增强了在该域上的推荐效果。
当然,上述说明并非是对本发明的限制,本发明也并不限于上述举例,本技术领域的普通技术人员,在本发明的实质范围内,做出的变化、改型、添加或替换,都应属于本发明的保护范围。
Claims (3)
1.基于双流sliced wasserstein自编码器的跨域推荐方法,其特征在于,包括以下步骤:
S1、获取输入数据
获取A数据域的用户-项目-评分数据和B域的用户-项目-评分数据,得到用户i在a域的交互数据xi,用户i在b域的交互数据yi,
S2、将上述数据输入到跨域推荐模型的编码器中,经过编码器可以得到用户隐空间上的特征向量:
zx=σ(Wxxi+cu+bx)
zy=σ(Wyyi+cu+by)
Wx、Wy、cu分别是编码器中可训练的参数矩阵,bx、by为偏置,σ为激活函数;
S3、将上述的特征向量输入到跨域推荐模型的解码器中,得到重构的用户交互向量:
得到4个重构的用户交互向量,代表从A域恢复得来的用户在A域交互向量,代表从B域恢复来的用户在A域的交互向量,代表从B域恢复得来的用户在B域交互向量,代表从A域恢复来的用户在B域的交互向量,σ为激活函数,Wx′、Wy′分别是解码器中可训练的参数矩阵,bx′、by′为偏置;
S4、对两个域S2中所述用户隐空间上的特征向量和S3中所述重构的用户交互向量加以高斯分布的限制,同时计算其与高斯分布之间的Sliced Wasserstein距离,通过损失函数来训练跨域推荐模型中的所有参数,使用Adam优化器进行参数的迭代更新。
2.根据权利要求1所述的基于双流sliced wasserstein自编码器的跨域推荐方法,其特征在于,步骤S1中,两个域上具有共同的用户,则一个用户在不同域上有如下的数据对(xi,yi),其中,在将数据输入跨域推荐模型进行后续步骤时,使用用户的隐反馈数据,xi、yi是代表对所有用户是否有交互的向量,有则为1,否则为0。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110728906.5A CN113536116B (zh) | 2021-06-29 | 2021-06-29 | 基于双流sliced wasserstein自编码器的跨域推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110728906.5A CN113536116B (zh) | 2021-06-29 | 2021-06-29 | 基于双流sliced wasserstein自编码器的跨域推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113536116A true CN113536116A (zh) | 2021-10-22 |
CN113536116B CN113536116B (zh) | 2023-11-28 |
Family
ID=78126227
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110728906.5A Active CN113536116B (zh) | 2021-06-29 | 2021-06-29 | 基于双流sliced wasserstein自编码器的跨域推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113536116B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108647226A (zh) * | 2018-03-26 | 2018-10-12 | 浙江大学 | 一种基于变分自动编码器的混合推荐方法 |
CN110059220A (zh) * | 2019-04-12 | 2019-07-26 | 北京工业大学 | 一种基于深度学习与贝叶斯概率矩阵分解的电影推荐方法 |
CN111859142A (zh) * | 2020-07-28 | 2020-10-30 | 山东大学 | 一种基于互联互通家居平台的跨设备迁移推荐系统及其工作方法 |
-
2021
- 2021-06-29 CN CN202110728906.5A patent/CN113536116B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108647226A (zh) * | 2018-03-26 | 2018-10-12 | 浙江大学 | 一种基于变分自动编码器的混合推荐方法 |
CN110059220A (zh) * | 2019-04-12 | 2019-07-26 | 北京工业大学 | 一种基于深度学习与贝叶斯概率矩阵分解的电影推荐方法 |
CN111859142A (zh) * | 2020-07-28 | 2020-10-30 | 山东大学 | 一种基于互联互通家居平台的跨设备迁移推荐系统及其工作方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113536116B (zh) | 2023-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kalofolias et al. | Matrix completion on graphs | |
Jun et al. | Distribution augmentation for generative modeling | |
Radchenko et al. | Improved variable selection with forward-lasso adaptive shrinkage | |
CN111460528B (zh) | 一种基于Adam优化算法的多方联合训练方法及系统 | |
Zhang et al. | Direct fidelity estimation of quantum states using machine learning | |
Zhang et al. | Quaternion collaborative filtering for recommendation | |
Liu et al. | A deep framework assembling principled modules for CS-MRI: unrolling perspective, convergence behaviors, and practical modeling | |
Andrews et al. | Maximum likelihood inference in weakly identified DSGE models | |
CN113536116A (zh) | 基于双流sliced wasserstein自编码器的跨域推荐方法 | |
Cheng et al. | User-controllable arbitrary style transfer via entropy regularization | |
Contardo et al. | Representation learning for cold-start recommendation | |
CN115374863A (zh) | 样本生成方法、装置、存储介质和设备 | |
Tucci et al. | Deep neural networks based surrogate model for topology optimization of electromagnetic devices | |
Tan et al. | Calibrated adversarial algorithms for generative modelling | |
Li et al. | Neural collaborative autoencoder | |
CN115481415A (zh) | 基于纵向联邦学习的通信成本优化方法、系统、设备及介质 | |
CN114547276A (zh) | 基于三通道图神经网络的会话推荐方法 | |
CN111242379A (zh) | 一种基于随机傅里叶特征的核递归最大相关熵时间序列在线预测方法 | |
Yokoyama et al. | An Accurate Graph Generative Model with Tunable Features | |
Ha et al. | Reweighted nuclear norm regularization: A SPARSEVA approach | |
Bondarenko | Constructing networks of quantum channels for state preparation | |
Wu et al. | Predicting nash equilibria in bimatrix games using a robust bi-channel convolutional neural network | |
CN112507225B (zh) | 一种基于双层优化的推荐系统数据调试方法 | |
Wei et al. | Pretraining binarization encoders for recommendation acceleration | |
Zhou et al. | Unexp-DIN: Unexpected Deep Interest Network for Recommendation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |