CN112395494B

CN112395494B - 一种基于生成对抗网络的双向动态推荐系统

Info

Publication number: CN112395494B
Application number: CN202011101268.6A
Authority: CN
Inventors: 房笑宇; 夏彬; 曹陈涵; 韩悦
Original assignee: Nanjing University of Posts and Telecommunications
Current assignee: Nanjing University of Posts and Telecommunications
Priority date: 2020-10-15
Filing date: 2020-10-15
Publication date: 2022-10-14
Anticipated expiration: 2040-10-15
Also published as: CN112395494A

Abstract

本发明公开了一种基于生成对抗网络的双向动态推荐方法，采用了两个生成对抗网络，其中一个训练生成对抗网络中的生成器并利用通用数据集学习主体选择客体，另一个训练生成对抗网络中的生成器并利用通用数据集学习客体选择主体的偏好，最后用训练得到的已经收敛的生成对抗网络分别对互惠推荐系统中的主体以及客体分别进行推荐，本发明能够根据用户相关性以及用户选择同时迭代，灵活地生成多个推荐选择，对用户的偏爱性捕捉更加敏捷。

Description

一种基于生成对抗网络的双向动态推荐系统

技术领域

本发明涉及推荐系统技术领域，特别涉及一种基于生成对抗网络的双向动态推荐系统。

背景技术

随着互联网规模在不断的扩大，其存在的信息在以指数级的速度快速增长，大量种类繁多且异常复杂的信息充斥在我们的周围，同时也造成了信息过载现象的发生。用户无法有效的汲取互联网信息，许多有用的信息被“闲置”，不能及时的被用户所发现，造成信息资源的严重浪费。

近年来，推荐系统领域发展迅速，现已深入到我们日常生活之中，例如网络购物以及网络招聘等场景。一种有效的推荐算法，可以帮助用户快速找到所需的信息，从而大大提升信息的检索效率。推荐策略是推荐系统中不可忽视的部分，基于用户喜爱度对物体进行排名的Top-N推荐策略是当前比较流行的方法之一，各种基于Top-N策略的推荐算法在最近几年层出不穷，核心思想是根据文本信息获得用户与商品之间相关性，并将其按递减的顺序进行排序，每个用户可以得到独立的个性化推荐列表，最终相关性排名最高的商品会被推荐给用户。夏彬等人在Vrer:Contextbased venue recommendation using embeddedspace ranking SVM in location-based social network.Expert Syst.Appl.83:18–29,2017.中提出了一种将文本特征转化到嵌入式空间之中的推荐算法。该算法使用支持向量机对用户喜爱度进行分类，达到一种排序的目的，从而将排序问题转变为基于支持向量机的分类任务。但是，随着推荐算法的不断发展，对于基于兴趣点的推荐系统的需求变得越来越多样且复杂，普通的Top-N推荐算法已经不能满足需求。另外，E-learning系统的出现给推荐系统带来了新的挑战，不同的学习活动之间以及课程之间的复杂关系让学生个体很难挑选到合适学习计划。为此，吴等人在A fuzzy tree matchingbased personalized e-learning recommender system.以及A fuzzy tree matchingbased personalised e-learning recommender system.中提出了一种树形结构的学习活动模型和学生资料模型以提供一种合适的课程学习方案。该算法不同于序列化的推荐算法，学生可以从有多个分支的树形结构推荐方案中选择符合他们要求的分支。曾等人在M-skyline:Taking sunkcost and alternative recommendation in consideration for skyline query onuncertain data.中提出了一种M-Skyline查询模型，该模型在原推荐方案错误时提供其他可选的推荐方案以增加算法的鲁棒性。

现有技术申请号为CN105279180A的专利中，公开了一种双向推荐算法框架，该框架由三部分组成，分别是：框架的建立及更新、二分图的分区和推荐推理。本发明提出了将用户的相关属性用一个二分图来表示，分为自身属性和全局属性。自身属性记录的是用户的共同爱好，而全局属性管理的是整个交互网络的质量。通过两个真实数据集(网上约会和在线招聘)的实证评价，很好的证明了该框架的有效性。

现有的Top-N推荐算法假设用户对排名最高的商品的喜爱度是最高的，非最高排名的商品是为了增加推荐的容错率，换句话说，当相关性最高的商品不是用户所喜爱的，那么依次推荐其他物品。但是，当传统算法错误的预测用户与物品的相关性时，就会导致每个推荐的物品都不是用户所需要的，由此产生错误的推荐。此外，传统算法所得到的相关性列表是静态的，也就是说是非实时的，但是用户对某个物品的喜爱度是变化的，从而导致传统算法产生的推荐列表并不符合用户现有的喜爱度。由此可见，现有采用Top-N策略的推荐算法存在诸多缺陷。

发明内容

发明目的：本发明的目的是提供一种基于生成对抗网络的双向动态推荐系统，能够根据用户相关性以及用户选择同时迭代，灵活地生成多个推荐选择，对用户偏爱性捕捉更加敏捷。

技术方案：本发明所述的一种基于生成对抗网络的双向动态推荐系统，包括有以下步骤：

S1：收集推荐系统双方主体客体之间的历史相互选择数据，分别对其进行重新分配分组，即针对对主体推荐客体的行为中，采用数据处理模块，构建以主体为中心的通用数据集；针对对客体推荐主体的行为中，采用数据处理模块，构建以客体为中心的通用数据集；

其中采用数据处理模块分别构建以主体为中心的通用数据集和以客体为中心的通用数据集的具体构建步骤如下：

S1.1：采集主体客体双方之间的历史选择信息，以此作为模型学习的样本，并对原始信息进行格式化处理；

S1.2：分别对主体客体按照排列次序进行数字化编码，将字符形式的名称转换为模型可读取的数字化格式；

S1.3：若主体的数量为u，客体的数量为v，分别以主体为中心构建u*v维和以客体为中心构建v*u维矩阵，在u*v维的矩阵中，第零行依次存放每个主体，第零列依次存放每个客体，矩阵中第(i，j)位置的数据表示第i个主体对第j个客体的偏好权重；

S1.4：在v*u维矩阵中，第零行依次放置每个客体，第零列以此放置每个主体；

S1.5：假若主体和客体之间并没有历史选择记录，那么在各自的矩阵中对应位置权重值为0；

S2：对抗网络中设置有两个生成器，训练对抗网络中的一个生成器，利用通用数据集学习主体选择客体的偏好；训练生成对抗网络中的另一个生成器，利用通用数据集学习客体选择主体的偏好；

S3：使用两个判别器分别对两个生成器生成的数据进行判别后，分别得到具有推荐合适主体的生成器和具有推荐合适客体的生成器；

S4：训练得到已经收敛的生成对抗网，并使用两个可利用的生成器为主客体分别进行生成推荐。

进一步的，所述S2中生成器包括有三个输入，以主体为中心分别为：被推荐主体；前一个推荐客体；把以前一个推荐客体为中心进行推荐主体的序列；

以客体为中心分别为：被推荐客体；前一个推荐主体；把以前一个推荐主体为中心进行推荐客体的序列。

进一步的，所述S2中生成器模型为一个三层的循环神经网络，训练过程如下：

S2.1：将原始主体样本及以客体为中心的生成器针生成的主体样本分别编码成128维数组形式的数据信息作为网络的输入；

S2.2：将编码后的数据输入到第一层长短期记忆神经网络中，用于提取特征信息；

S2.3：对上步骤中的两个特征向量进行融合，将融合后的特征向量输入到第二层的长短期记忆神经网络中，提取更深层的特征信息；

S2.4：在以主体为中心的生成器中，第三层网络接入一个线性回归模型，输出维度为客体的数目，最终使用sigmoid函数进行推荐排序；同样的，以客体为中心的生成器与之类似，第三层网络接入一个线性回归模型，输出维度为主体的数目，最终使用sigmoid函数进行推荐排序；

S2.5：生成器的损失函数包括两部分组成，对第一部分的损失函数使用交叉熵函数，衡量生成推荐序列与真实序列之间的差异性；对第二部分损失函数使用均方误差函数，衡量主体与针对错误推荐客体进行推荐的主体之间的相似度，具体公式如下：

loss(x_i,y_i)+(x_i-y_i)²

S2.6：生成器训练完毕，获得推荐模型。

进一步的，所述S3中判别器分别针对以不同主客体为中心的场景下所生成的数据进行判别，是否为生成器生成的假数据，具体的训练过程如下：

S3.1：对原始数据进行标记为真，以数字1来表示，将生成器生成的数据标记为假，用数字0表示；

S3.2：判别器网络中的特征提取部分由输入为128维，输出为128维的两层长短期记忆网络构成，将原始数据和生成器生成的数据输入网络，提取数据中潜在的特征信息；

S3.3：将提取到的128维特征值输入到线性回归模型中，128维的特征信息即可转换成1维特征，线性回归函数如下公式所示，其中x表示输入样本，k为样本数据的维度，β＝{β₁、β₂、…β_k}为参数，y为最终输出：

y＝β₀+β₁x_t1+β₂x_t2+…+β_kx_tk

S3.4：将降维后的特征信息输入到sigmoid函数中，将特征映射到0-1之间，作为判断类别的依据，Sigmoid函数如下公式所示，x为输入特征，S(x)为函数映射后的输出：

S3.5：使用交叉熵函数作为判别器网络的损失函数，并利用反向传播算法对整个网络进行优化，交叉熵函数如下公式所示，其中N为样本数量，p为真实样本的预测概率，y为样本真实所属类别，L为最终的损失：

进一步的，所述判别器的具体训练过程中，采用随机更换生成器的方法，来降低判别器的学习速率，避免因为判别器收敛速度过快，导致的生成器在训练的过程中因判别器的准确率过高从而学习不到有效的信息，导致生成器无法生成可利用的样本的情况，具体的实施方式如下：

a：以主体为样本的判别器，搭配其对应网络中的生成器以及以客体为中心的生成对抗网络的生成器来共同指导训练过程；

b：在最初的判别器的训练中，使用对应网络的生成器指导训练，正确指导判别的学习方向，使判别器可以学习正确的样本分布；

c：在训练过程中，判别器每迭代1次，本算法以百分之二十的概率更换生成器；

d：假若在判别器的一次迭代完成之后，下次迭代过程中的生成器更换成了以客体为中心的生成对抗网络中的生成器，那么该迭代过程中，判别器的优化方向将会朝着错误的方向进行学习，则判定此次迭代的训练过程不是有效的训练过程；

e：以客体为中心的生成对抗网络中的判别器的训练与上述步骤类似。

进一步的，所述S4中可利用的生成器为主客体分别进行生成推荐的具体过程如下：

S4.1：在首次以主体为中心的推荐过程中，将主体的ID进行编码后输入到对应的生成器网络中，生成器会生成相应的推荐，此时生成器的输入只有一项；

S4.2：在非首次的推荐过程中，将主体的ID，上次推荐过程中主体拒绝的客体ID以及在反向推荐过程中针对该客体进行推荐的主体ID输入到模型中，即可得到相应的推荐内容；

S4.3：在使用该模型进行生成推荐时，假若主体对生成器所推荐的客体持续不满意时，模型将会一直迭代生成推荐客体，并且在生成新的推荐客体时，仍会将上一次被拒绝的客体推荐的部分依据，直至主体对推荐客体达到满意；

S4.4：在对客体进行推荐的过程中，将客体的ID进行编码后输入到对应的生成器网络中，生成器会生成相应的推荐，此时生成器的输入只有一项；

S4.5：在非首次的推荐过程中，将客体的ID，上次推荐过程中客体拒绝的主体ID以及在反向推荐过程中针对该主体进行推荐的客体ID输入到模型中，即可得到相应的推荐内容；

S4.6：在使用该模型进行生成推荐时，假若客体对生成器所推荐的主体持续不满意时，模型将会一直迭代生成推荐主体，并且在生成新的推荐主体时，仍会将上一次被拒绝的主体推荐的部分依据，直至客体对推荐主体达到满意。

有益效果：(1)本发明利用两个生成对抗网络的算法架构，分别学习双向推荐系统中主客体的偏好性，使得整个系统在捕捉用户习惯细节方面更加细致，具备个性化精准推荐的能力，降低其他系统中推荐错误率的问题；(2)本系统新一次的推荐结果是根据前一次的推荐结果作为依据生成的，从而使得系统与用户的交互是实时的，可以达到动态推荐的目的，解决传统推荐算法中静态性的缺点。

附图说明

图1是互惠推荐算法框架图；

图2是生成对抗网络中生成器的作用机制。

具体实施方式

下面结合附图和具体实施例，进一步阐明本发明。

如图1-2所示，本发明总共可以分为4个步骤：

S1.1：采集主体客体双方之间的历史选择信息，以此作为模型学习的样本，并对原始信息进行格式化处理。

S1.2：分别对主体客体按照排列次序进行数字化编码，将字符形式的名称转换为模型可读取的数字化格式。

S1.3：若主体的数量为u，客体的数量为v，分别以主体为中心构建u*v维和以客体为中心构建v*u维矩阵。在u*v维的矩阵中，第零行依次存放每个主体，第零列依次存放每个客体，矩阵中第(i，j)位置的数据表示第i个主体对第j个客体的偏好权重。

S1.4：类似的，在v*u维矩阵中，第零行依次放置每个客体，第零列以此放置每个主体。

S1.5：特殊的，假若主体和客体之间并没有历史选择记录，那么在各自的矩阵中对应位置权重值为0。

其中生成器包括有三个输入，以主体为中心分别为：被推荐主体；前一个推荐客体；把以前一个推荐客体为中心进行推荐主体的序列；

并且生成器模型为一个三层的循环神经网络，训练过程如下：

loss(x_i,y_i)＝(x_i-y_i)²

S2.6：生成器训练完毕，获得推荐模型。

其中判别器分别针对以不同主客体为中心的场景下所生成的数据进行判别，是否为生成器生成的假数据，具体的训练过程如下：

y＝β₀+β₁x_t1+β₂x_t2+…+β_kx_tk

在本步骤中，为了避免因为判别器收敛速度过快，导致的生成器在训练的过程中因判别器的准确率过高从而学习不到有效的信息，导致生成器无法生成可利用的样本的情况，判别器采用随机更换生成器的方法，来降低判别器的学习速率，具体的实施方式如下：

e：以客体为样本的判别器，搭配其对应网络中的生成器以及以主体为中心的生成对抗网络的生成器来共同指导训练过程；

f：在最初的判别器的训练中，使用对应网络的生成器指导训练，正确指导判别的学习方向，使判别器可以学习正确的样本分布；

g：在训练过程中，判别器每迭代1次，本算法以百分之二十的概率更换生成器；

h：假若在判别器的一次迭代完成之后，下次迭代过程中的生成器更换成了以主体为中心的生成对抗网络中的生成器，那么该迭代过程中，判别器的优化方向将会朝着错误的方向进行学习，则判定此次迭代的训练过程不是有效的训练过程。

S4：训练得到已经收敛的生成对抗网，并使用两个可利用的生成器为主客体分别进行生成推荐，具体步骤如下：

S4.4：在对客体进行推荐的过程中的相应模型使用方法与上述步骤类似。

最后应当说明的是：所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

Claims

1.一种基于生成对抗网络的双向动态推荐方法，其特征在于：包括有以下步骤：

S1：收集推荐系统双方主体客体之间的历史相互选择数据，分别对其进行重新分配分组，即针对主体推荐客体的行为中，采用数据处理模块，构建以主体为中心的通用数据集；针对客体推荐主体的行为中，采用数据处理模块，构建以客体为中心的通用数据集；

S1.4：在v*u维矩阵中，第零行依次放置每个客体，第零列以此放置每个主体；假若主体和客体之间并没有历史选择记录，那么在各自的矩阵中对应位置权重值为0；

S4：训练得到已经收敛的生成对抗网络，并使用两个可利用的生成器为主客体分别进行生成推荐。

2.根据权利要求1所述的一种基于生成对抗网络的双向动态推荐方法，其特征在于：所述S2中生成器包括有三个输入，以主体为中心分别为：被推荐主体；前一个推荐客体；以前一个推荐客体为中心进行推荐主体的序列；

以客体为中心分别为：被推荐客体；前一个推荐主体；以前一个推荐主体为中心进行推荐客体的序列。

3.根据权利要求1所述的一种基于生成对抗网络的双向动态推荐方法，其特征在于：所述S2中生成器模型为一个三层的循环神经网络，训练过程如下：

S2.1：将原始主体样本及以客体为中心的生成器中生成的主体样本分别编码成128维数组形式的数据信息作为网络的输入；

S2.3：对S2.2中的两个特征向量进行融合，将融合后的特征向量输入到第二层的长短期记忆神经网络中，提取更深层的特征信息；

loss(x_i,y_i)＝(x_i-y_i)²

S2.6：生成器训练完毕，获得推荐模型。

4.根据权利要求1所述的一种基于生成对抗网络的双向动态推荐方法，其特征在于：所述S3中判别器分别针对以不同主客体为中心的场景下所生成的数据进行判别，是否为生成器生成的假数据，具体的训练过程如下：

y＝β₀+β₁x_t1+β₂x_t2+…+β_kx_tk

5.根据权利要求4所述的一种基于生成对抗网络的双向动态推荐方法，其特征在于：所述判别器的具体训练过程中，采用随机更换生成器的方法，来降低判别器的学习速率，避免因为判别器收敛速度过快，导致的生成器在训练的过程中因判别器的准确率过高从而学习不到有效的信息，导致生成器无法生成可利用的样本的情况，具体的步骤如下：

c：在训练过程中，判别器每迭代1次，以百分之二十的概率更换生成器；

g：在训练过程中，判别器每迭代1次，以百分之二十的概率更换生成器；

6.根据权利要求1所述的一种基于生成对抗网络的双向动态推荐方法，其特征在于：所述S4中可利用的生成器为主客体分别进行生成推荐的具体过程如下：

S4.2：在非首次的推荐过程中，将主体的ID，上次推荐过程中主体拒绝的客体ID以及在反向推荐过程中针对该客体进行推荐的主体ID输入到模型中，得到相应的推荐内容；

S4.3：在使用该模型进行生成推荐时，假若主体对生成器所推荐的客体持续不满意时，模型将会一直迭代生成推荐客体，并且在生成新的推荐客体时，仍会将上一次被拒绝的客体推荐的部分依据输入到生成器中，直至主体对推荐客体达到满意；

S4.5：在非首次的推荐过程中，将客体的ID，上次推荐过程中客体拒绝的主体ID以及在反向推荐过程中针对该主体进行推荐的客体ID输入到模型中，得到相应的推荐内容；

S4.6：在使用该模型进行生成推荐时，假若客体对生成器所推荐的主体持续不满意时，模型将会一直迭代生成推荐主体，并且在生成新的推荐主体时，仍会将上一次被拒绝的主体推荐的部分依据输入到生成器中，直至客体对推荐主体达到满意。