CN113268660A

CN113268660A - 一种基于生成对抗网络的多样性推荐方法、装置及服务器

Info

Publication number: CN113268660A
Application number: CN202110465784.5A
Authority: CN
Inventors: 苏畅; 朱仙灵
Original assignee: Chongqing University of Post and Telecommunications
Current assignee: Chongqing University of Post and Telecommunications
Priority date: 2021-04-28
Filing date: 2021-04-28
Publication date: 2021-08-17
Anticipated expiration: 2041-04-28
Also published as: CN113268660B

Abstract

本发明属于人工智能技术领域，具体涉及一种基于生成对抗网络的多样性推荐方法、装置及服务器；所述方法包括通过矩阵分解得到用户矩阵和物品矩阵；所述用户矩阵中包括用户对物品的偏好信息，所述物品矩阵中包括物品的特征信息；将用户对物品的偏好信息和物品的特征信息输入到生成对抗网络；将生成对抗网络中的生成器和判别器进行对抗学习以生成推荐物品；采用最大边缘相关多样性算法对推荐物品进行排序，并向用户输出排序靠前的若干推荐物品；本发明能够保证推荐结果是既具备多样性又具备准确性，保证了推荐效果。

Description

一种基于生成对抗网络的多样性推荐方法、装置及服务器

技术领域

本发明属于人工智能技术领域，具体涉及一种基于生成对抗网络的多样性推荐方法、装置及服务器。

背景技术

近年来，随着云计算、大数据、物联网等技术的迅猛发展，互联网空间中各类应用的层出不穷引发了数据规模的爆炸式增长。大数据中蕴含着丰富的价值与巨大的潜力，将给人类社会带来变革性的发展，但同时也带来了严重的“信息过载”问题，如何快速有效地从纷繁复杂的数据中获取有价值的信息成为了当前大数据发展的关键问题。

推荐系统(Recommender System)是一种过滤信息的方法。推荐系统可以通过用户的历史行为，建模用户偏好，向用户提供个性化的信息内容。推荐系统已经在电子商务和内容提供商中得到广泛的应用。对于用户而言，推荐系统可以帮助用户过滤信息，节省时间，发现用户感兴趣的内容，缓解信息过载问题。对服务提供商而言，推荐系统可以提高服务质量，增加用户体验，提升用户对网站的满意和依赖度，为网站带来直接的收益。如今，从电商平台到社交网站，从休闲娱乐到知识获取，推荐系统已经是各类网站的核心竞争力。

但是，当前的个性化推荐系统和相应算法大多数关注如何提高推荐算法的准确性，通常会根据与用户个人喜好和兴趣的匹配程度来选择排名靠前的项目(例如产品，电影)，而忽略了推荐结果的多样性。结果是越来越多的用户被局限到一个相对“狭窄”的推荐结果集里，用户可能感兴趣的一些信息却被忽略掉了。例如协同过滤方式有利于受欢迎的项目，因此可能会给用户推荐受欢迎的但是用户已知的项目。基于内容的过滤可能会产生与用户兴趣相匹配的项目，但是其涵盖的主题范围非常狭窄。

发明内容

为了使推荐系统在保持推荐结果准确性的同时，在多样性方面也呈现出优秀的表现，提出了一种基于生成对抗网络的多样性推荐方法、装置及服务器。本申请基于生成对抗网络，利用矩阵分解技术以及结合用户兴趣深度改进的最大边缘相关多样性算法，提出了一种多样性推荐模型，以生成多样化且又具有良好准确性的推荐结果。通过在两个真实数据集上实验验证，结果表明本发明能够有效地提高推荐结果的多样性，同时在推荐结果的准确性上也表现良好。

第一方面，本发明提供了一种基于生成对抗网络的多样性推荐方法，所述方法包括：

通过矩阵分解得到用户矩阵和物品矩阵；所述用户矩阵中包括用户对物品的偏好信息，所述物品矩阵中包括物品的特征信息；

将用户对物品的偏好信息和物品的特征信息输入到生成对抗网络，进行对抗学习以生成推荐物品；采用最大边缘相关多样性算法对推荐物品进行排序，并向用户输出排序靠前的若干推荐物品。

在一种可能实现的方式中，本发明利用用户兴趣深度对所述最大边缘相关多样性算法进行改进，能够得到使得大用户兴趣深度用户的多样性权重更大，更加关心多样性的提升；同时减小用户兴趣深度用户的多样性权重，优先保证其准确性。

第二方面，本发明还提供了一种基于生成对抗网络的多样性推荐装置，包括：

矩阵分解模块，用于得到用户矩阵和物品矩阵，其中所述用户矩阵中包括用户对物品的偏好信息，所述物品矩阵中包括物品的特征信息；

生成对抗网络模块，将用户对物品的偏好信息和物品的特征信息输入到生成对抗网络，进行对抗学习以生成推荐物品；

排序模块，用于采用最大边缘相关多样性算法对推荐物品进行排序；

推荐模块，用于向用户输出排序靠前的若干推荐物品。

第三方面，本发明还提供了一种服务器，包括存储器和处理器，所述存储器中储存有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行以下步骤：

将用户对物品的偏好信息和物品的特征信息输入到生成对抗网络，进行对抗学习以生成推荐物品；

采用最大边缘相关多样性算法对推荐物品进行排序，并向用户输出排序靠前的若干推荐物品。

本发明的有益效果：

本发明利用对抗生成网络与最大边缘相关多样性结合的方式来保证推荐结果的多样性和相关性；本发明还增加了用户兴趣深度d(u)有关的权重，来使得大用户兴趣深度用户的多样性权重更大，更加关心多样性的提升；同时减小用户兴趣深度用户的多样性权重，优先保证其准确性。以此来实现针对不同兴趣深度的用户参数λ自适应调整，从而提升整体的推荐质量。

附图说明

图1是本发明中的基于生成对抗网络的多样性推荐场景架构图；

图2是本发明实施例中的基于生成对抗网络的多样性推荐方法流程图；

图3是本发明实施例中的生成对抗网络的训练流程图；

图4是本发明实施例中的基于生成对抗网络的多样性推荐装置结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在以下的说明中，本发明的具体实施例将参考由一部或多部计算机所执行的步骤及符号来说明，除非另有说明。因此，这些步骤及操作将有数次提到由计算机执行，本文所指的计算机执行包括了由代表了以一结构化型式中的数据的电子信号的计算机处理单元的操作。此操作转换该数据或将其维持在该计算机的内存系统中的位置处，其可重新配置或另外以本领域测试人员所熟知的方式来改变该计算机的运作。该数据所维持的数据结构为该内存的实体位置，其具有由该数据格式所定义的特定特性。但是，本发明原理以上述文字来说明，其并不代表为一种限制，本领域测试人员将可了解到以下所述的多种步骤及操作亦可实施在硬件当中。

本文所使用的术语“模块”或“单元”可看做为在该运算系统上执行的软件对象。本文所述的不同组件、模块、引擎及服务可看做为在该运算系统上的实施对象。而本文所述的装置及方法优选的以软件的方式进行实施，当然也可在硬件上进行实施，均在本发明保护范围之内。

为了保证生成的推荐结果是既多样又相关，也即是保持推荐结果准确性的同时，在多样性方面也呈现出优秀的表现，类似于实际的用户交互历史。本发明的推荐模型采用了对抗学习框架，利用矩阵分解技术以及结合用户兴趣深度改进的最大边缘相关多样性算法，提出了一种多样性算法模型，以生成多样化且又具有良好准确性的推荐结果。简单的说，推荐模型主要分为两个步骤，首先通过生成对抗网络得到初步的推荐结果，然后对推荐结果进行重新排序。通过在两个真实数据集上实验验证，本发明的推荐模型能够有效地提高推荐结果的多样性，同时在推荐结果的准确性上也表现良好。

请参阅图1，图1是本发明实施例中的基于生成对抗网络的多样性推荐场景架构图，对于训练集数据利用矩阵分解的方式提取出用户对物品的偏好信息以及物品的特征信息；对于每个用户，生成器首先通过矩阵分解来得到用户矩阵和物品矩阵。用户矩阵中包含了用户对于物品的偏好信息，物品矩阵中包含了物品的特征信息。然后根据用户矩阵中用户对于物品的偏好信息进行对抗训练以生成推荐物品，而模型的判别器试图在生成器生成的物品与真实的数据之间进行区分。通过对抗学习，生成器能够生成与实际真实数据非常相似的相关推荐结果，使得判别器无法轻易区分。最后我们采用对最大边缘相关多样性算法(Maximal Marginal Relevance,MMR)改进后的方法来对推荐物品进行排序，减少排序结果的冗余，同时保证结果的相关性。

请参阅图2，图2是本发明实施例中的基于生成对抗网络多样性推荐方法流程图，所述方法包括：

101、通过矩阵分解得到用户矩阵和物品矩阵；所述用户矩阵中包括用户对物品的偏好信息，所述物品矩阵中包括物品的特征信息；

本发明实施例中，为了获取用户矩阵和物品矩阵，首先需要从平台/网站/服务器中获取用户与物品的交互数据，其中，物品在本申请实施例中既可以为实体商品，也可以为多媒体资源比如视频，还可以为实际生活中的服务，甚至还可以为股票、债券甚至数字货币等虚拟资源，本申请实施例对此不进行具体限定。示例性地，本申请实施例可以应用在游戏推荐场景下，相应地，用户指代游戏玩家，物品指代游戏道具；所述交互数据则可以指的是用户查看/使用/购买了该游戏道具等。

这些实际的交互数据是由一系列的隐变量的影响下产生的(通常隐变量带有统计分布的假设，就是隐变量之间，或者隐变量和显式变量之间的关系，本发明往往认为是由某种分布产生的)，这些隐变量代表了用户和物品一部分共有的特征，在物品身上表现为属性特征，在用户身上表现为偏好特征。

矩阵分解后得到的两个包含隐变量的小矩阵，一个代表用户的隐含特征，一个代表物品的隐含特征，矩阵的元素值代表着相应用户或物品对各项隐因子的符合程度，有正面的也有负面的。

以电影为例，电影可能具有一些隐藏因子：演员、题材、主题、年代…，而用户针对这些隐因子有偏好特征属性，为了便于理解，假设隐因子数量k是2，分别代表着喜剧片和动作片两种题材，矩阵分解后的两个小矩阵，分布代表着电影对这两种题材的符合程度以及用户对这两种题材的偏好程度。

以豆瓣网用户对电影的评分矩阵为例，矩阵分解就是把原来的大矩阵，近似分解成两个小矩阵的乘积，在实际推荐计算时不再使用大矩阵，而是使用分解得到的两个小矩阵。按照矩阵分解的原理，原来的大矩阵会分解成两个小矩阵，这里多出来一个k维向量，就是隐因子向量(Latent Factor Vector)，类似的表达还有隐因子、隐向量、隐含特征、隐语义、隐变量等。

本发明中所采用的矩阵分解的公式如下：

其中，

表示用户u对物品i的偏好得分，x_u和y_i分别表示用户u的物品i经过矩阵分解后得到的一维向量，

是一个sigmoid函数。

102、将用户对物品的偏好信息和物品的特征信息输入到生成对抗网络，进行对抗学习以生成推荐物品；

本发明实施例中将采用IRGAN(基于生成式对抗网络的信息检索算法(Information Retrieval Generative Adversarial Net，IRGAN))算法；IRGAN将GAN用在信息检索(Information Retrieval)领域，通过GAN的思想将生成检索模型和判别检索模型统一起来，对于生成器采用了基于策略梯度的强化学习来训练，在三种典型的IR任务上(四个数据集)得到了更显著的效果。

其中，所述生成式检索模型(query->document)认为查询query和文件document之间存在潜在的生成过程，其缺点在于很难利用其它相关的信息，比如链接数，点击数等document和document之间的相关数据。

所述判别式检索模型(query+document->relevance)同时考虑query和document作为特征，预测它们的相关性，其缺点在于缺乏获取有用特征的方法。

GAN里面的生成器和判别器通过相互博弈来完成工作，生成模型用来挑选出用户看起来会喜欢的物品来骗过判别模型，然而判别模型的目的是尽量的辨别出用户真正喜欢的物品以及生成模型生成的物品。

所述生成对抗网络中的生成器和判别器中的损失函数表示如下：

其中，

表示生成器以及分类器的对抗损失；G^*表示生成器；D^*表示分类器；θ和φ分别表示生成对抗网络中的两个优化参数；U代表用户集合，i代表物品，r代表相关性，p_true(i|u,r)代表真实数据的概率分布，即为判别器，p_θ(i|u,r)则代表生成数据的概率分布，即为生成器；d表示数据范围；D(i|u)用来评估用户u与物品i的相关性，则：

其中，f_φ(i,u)表示用户u和物品i的相关性得分；在推荐的任务场景下，用来衡量用户和物品i的相关性得分，即上文矩阵分解公式中的

用于提供给判别器进行计算。

判别器的目的是最大化辨别真实数据和生成的相关物品的对数似然函数，通过真实的相关性高的物品以及那些优化生成模型之后得到的物品，可以从判别模型中得到优化参数：

生成模型尝试去最小化目标，它符合物品的真实相关分布p_true(i|u_n,r)，并且基于此，从全部物品中进行采样，用来欺骗判别模型。但由于本发明的生成模型与GAN有所不同，本发明生成的是已知存在的物品，而不是他们的特征。因此，本发明中的生成器的采样是离散的，不能直接通过梯度下降来更新参数，本发明使用基于强化学习的策略梯度法来更新生成器的参数，公式如下：

其中，I代表物品集合；

表示对优化参数θ进行梯度求解。

在一些实施例中，请参阅图3，所述生成对抗网络的训练过程包括：

301、输入生成器p_θ(i|u,r)和判别器p_true(i|u,r)，以及相关度f_φ(i,u)和训练集S；

302、随机初始化生成器的参数θ，φ；

303、在当前迭代过程中，训练生成器生成k个物品，并使用

更新参数θ；可连续训练g次生成器；

304、使用当前生成器生成的物品作为假样本，训练集中的高度相关性的样本作为真实样本，连续训练d次判别器，按照公式

更新判别器的参数φ；

305、重复步骤303和步骤304，直至所述生成对抗网络收敛。

在本实施例中，初代的生成器Generator0会生成很模糊的物品，这个时候本发明把Generator0产生的物品作为0标签，真实的物品作为1标签丢入到初代的判别器Discriminator0中训练，得到新一代判别器Discriminator1，这个判别器能够辨认真实物品和Generator0产生的假物品，如果输入是一个真实物品，Discriminator1会输出1，如果输入是一个Generator0生成的物品，Discriminator1会输出0。然后，训练Generator0，目标是使得Discriminator1判断生成器生成的物品为真实物品(输出标签为1)，以这个为目标训练得到的Generator1能够成功骗过Discriminator1。对于Discriminator1，如果输入是一个Generator1生成的物品，它会输出1。上面两个步骤就完成了一次博弈，接着会不断迭代这个博弈，Discriminator1会进化成Discriminator2能够成功分辨Generator1产生的是假物品(输出0标签)，然后Generator1为了骗过Discriminator2又会进化成Generator2。不断迭代这个过程，最后就能生成一些逼真的物品。

103、采用最大边缘相关多样性算法对推荐物品进行排序，并向用户输出排序靠前的若干推荐物品。

本发明中利用用户活跃度和用户交互的所有物品所涉及的种类数量计算出用户兴趣深度；对所述用户兴趣深度做对数平滑，将对数平滑后的用户兴趣深度作为多样性权重，利用最大边缘相关多样性算法求取出物品排序。

所采用的最大边缘相关多样性算法的计算公式表示为：

其中，MMR^*表示最大边缘相关多样性值；R表示输入的列表，即输入的物品集合；S表示返回的物品集合；R\S表示在输入的物品集合去掉了返回的物品集合中，初始时，R为生成对抗网络输出的推荐物品集合，S为空集，后续更新时，S将从R中获得一系列的推荐物品；d(u)是用户u的兴趣深度，

k(u)表示用户u的活跃度；w(u)表示用户u交互的所有物品所涉及的种类数量；λ表示用户参数，即调节排序结果相关与多样性的权重系数；D_i表示物品集合R\S中的第i个物品；D_j表示返回的物品集合S中的第j个物品；Sim₁(D_i,u)表示物品D_i与用户u之间的相关度；Sim₂(D_i,D_j)表示物品D_i与物品D_j之间的相似度。

其中，d(u)是本发明定义的用户兴趣深度，log(d(u))＝lg(10+d(u))是本发明所定义的一个对数用户兴趣深度，表示对所有用户兴趣深度d(u)做对数平滑；能够缩小数据的绝对数值，便于后续计算，并且增加了用户兴趣深度d(u)有关的权重，来使得大用户兴趣深度用户的多样性权重更大，更加关心多样性的提升；同时减小用户兴趣深度用户的多样性权重，优先保证其准确性。以此来实现针对不同兴趣深度的用户参数λ自适应调整，从而提升整体的推荐质量。。

用户活跃度定义可以参照以下公式：

k(u)＝|I(u)|

k(i)＝|U(i)|

其中，k(u)表示用户u的活跃度，k(i)表示物品i的流行度，I(u)代表用户u交互过的所有物品，U(i)代表交互过物品i的所有用户。

用户兴趣深度和用户交互的所有物品所涉及的种类数量的定义：

上式给出了用户兴趣深度d(u)的定义，其中，w(u)表示用户交互的所有物品所涉及的种类数量，例如一个用户只看了《美国队长》和《星际穿越》这两部电影，前者在类别里面属于动作、科幻和冒险类，后者属于剧情、科幻和冒险类。那么这个用户的用户活跃度k(u)为2，用户交互的所有物品所涉及的种类数量w(u)值为4(加起来是动作、科幻、冒险和剧情)，用户兴趣深度d(u)的值为0.5。其中，值得一提的是，通过本发明定义可以看出，w(u)的值通常为正整数。

其中，关于本实施例中的相关度Sim₁(D_i,u)即为用户u和物品D_i的相关性得分，可以根据上述实施例求得。关于本实施例中的相似度Sim₂(D_i,D_j)常用的相似度计算有余弦相似度和皮尔逊相关性系数(pearson correlation coefficient)。

本实施例中使用了两个数据集来验证本发明推荐模型的效果，即MovieLens数据集和Anime数据集。由于本发明比较注重隐式反馈，因此本发明将MovieLens数据集的5分评价和Anime数据集中的10分评价视为正面反馈，其他的视为未知反馈。对于Anime数据集，本发明排除了评分数量少于300的用户和物品。并且在两个数据集上，都采用了4:1的比例随机划分训练集和测试集数据。本发明使用常规模型初始化生成器的参数提高生成对抗网络训练效率。初始化生成对抗网络的生成器的参数进行采样后，通过固定生成器或者判别器来进行对抗训练。对于这两个数据集，学习率设为0.01，参数λ设置为0.5；与传统的生成对抗网络IRGAN相比，本发明在多样性的数据指标(覆盖率)上能够得到明显地提升，同时在准确性的数据指标(如准确率指标，排序准确率指标)上能够基本持平；与传统的MMR算法相比，本发明在准确性的数据指标(如准确率指标，排序准确率指标)上能够得到明显地提升，在多样性的数据指标(覆盖率)上能够能够基本持平。

由于多样化推荐通常被视为双准则优化问题，通常都是在推荐结果的多样性和准确性之间设置一个参数进行权衡。但是在大多数多样化的研究方法中，该参数通常为一个全局参数，这也就意味着所有用户都使用同一个参数来对推荐结果的多样性和准确性进行权衡。然而不同的用户可能对多样性有不同的偏好。一些用户可能有非常集中的兴趣，而另一些用户可能有非常广泛的兴趣。本发明实施例增加了用户兴趣深度d(u)有关的权重，来使得大用户兴趣深度用户的多样性权重更大，更加关心多样性的提升；同时减小用户兴趣深度用户的多样性权重，优先保证其准确性。以此来实现针对不同兴趣深度的用户参数λ自适应调整，从而提升整体的推荐质量。

请参阅图2，图2是本发明实施例中的一种基于生成对抗网络的多样性推荐装置结构图，包括：

100、矩阵分解模块，用于得到用户矩阵和物品矩阵，其中所述用户矩阵中包括用户对物品的偏好信息，所述物品矩阵中包括物品的特征信息；

200、生成对抗网络模块，将用户对物品的偏好信息和物品的特征信息输入到生成对抗网络，进行对抗学习以生成推荐物品；

300、排序模块，用于采用最大边缘相关多样性算法对推荐物品进行排序；

400、推荐模块，用于向用户输出排序靠前的若干推荐物品。

在本实施例中，将从服务器的角度进行描述，该服务器中集成有上述一种基于生成对抗网络的多样性推荐装置；所述服务器，包括存储器和处理器，所述存储器中储存有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行以下步骤：

本发明中的所述服务器配置有经过训练的多样性推荐模型(也称物品推荐模型)，以基于多样性推荐模型实现在不同场景中进行物品推荐。另外，在使用多样性推荐模型之前，还需要先对多样性推荐模型进行对抗性训练。

可选地，服务器是独立的物理服务器，或者是多个物理服务器构成的服务器集群或者分布式系统，或者是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network，内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。

本申请实施例提供的物品推荐方法、装置及服务器，可以应用于为用户推荐物品的任何场景下。

比如，购物网站为用户推荐商品的场景、服务网站为用户推荐增值服务的场景、视频网站为用户推荐视频的场景等。可选地，推荐的物品可以为实体商品，也可以为多媒体资源比如视频，还可以为实际生活中的服务，甚至还可以为股票、债券甚至数字货币等虚拟资源，本申请实施例对此不进行具体限定。

在本发明的描述中，需要理解的是，术语“同轴”、“底部”、“一端”、“顶部”、“中部”、“另一端”、“上”、“一侧”、“顶部”、“内”、“外”、“前部”、“中央”、“两端”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

在本发明中，除非另有明确的规定和限定，术语“安装”、“设置”、“连接”、“固定”、“旋转”等术语应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或成一体；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通或两个元件的相互作用关系，除非另有明确的限定，对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种基于生成对抗网络的多样性推荐方法，其特征在于，所述方法包括：

2.根据权利要求1所述的一种基于生成对抗网络的多样性推荐方法，其特征在于，所述通过矩阵分解得到用户矩阵和物品矩阵包括获得用户和物品之间的历史交互数据，采用矩阵分解法获得用户与物品之间的潜在向量表示，并划分为用户矩阵和物品矩阵。

3.根据权利要求1所述的一种基于生成对抗网络的多样性推荐方法，其特征在于，所述将用户对物品的偏好信息和物品的特征信息输入到生成对抗网络，进行对抗学习以生成推荐物品包括利用生成器挑选出用户偏好的可能物品；将挑选出的物品输入到判别器中与用户偏好的真实物品进行判别，采用对抗学习的方式以训练生成器和判别器。

4.根据权利要求3所述的一种基于生成对抗网络的多样性推荐方法，其特征在于，所述对抗学习的过程包括随机初始化生成器的参数；采用训练集对所述生成器和所述判别器进行预训练；每轮训练过程中生成器生成k个物品，使用基于强化学习的策略梯度法来更新生成器的参数，并连续训练多轮生成器；使用当前训练过程生成器生成的物品作为假样本，将训练集中的相关性较高的样本作为真实样本；连续训练多次判别器，并通过真实样本和生成的假样本的对数似然函数的相关性来更新判别器的参数。

5.根据权利要求1所述的一种基于生成对抗网络的多样性推荐方法，其特征在于，所述采用最大边缘相关多样性算法对推荐物品进行排序包括利用用户活跃度和用户交互的所有物品所涉及的种类数量计算出用户兴趣深度；对所述用户兴趣深度做对数平滑，将对数平滑后的用户兴趣深度作为多样性权重，利用最大边缘相关多样性算法求取出物品排序。

6.根据权利要求5所述的一种基于生成对抗网络的多样性推荐方法，其特征在于，所采用的最大边缘相关多样性算法的计算公式表示为：

其中，R表示输入的列表，即输入的物品集合；S表示返回的物品集合；R\S表示在输入的物品集合去掉了返回的物品集合中；d(u)是用户u的兴趣深度，

7.一种基于生成对抗网络的多样性推荐装置，其特征在于，包括：

推荐模块，用于向用户输出排序靠前的若干推荐物品。

8.一种服务器，其特征在于，包括存储器和处理器，所述存储器中储存有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行以下步骤：