CN110827120A

CN110827120A - 基于gan网络的模糊推荐方法、装置、电子设备及存储介质

Info

Publication number: CN110827120A
Application number: CN201910994793.6A
Authority: CN
Inventors: 刘起东; 徐明亮; 吕培; 李亚飞
Original assignee: Zhengzhou University
Current assignee: Zhengzhou University
Priority date: 2019-10-18
Filing date: 2019-10-18
Publication date: 2020-02-21

Abstract

本发明涉及商品推荐技术领域，具体涉及一种基于GAN网络的模糊推荐方法、电子设备及存储介质。该模糊推荐方法包括以下步骤：从历史交互数据中获取用户特征向量和商品特征向量；将所述用户特征向量和商品特征向量拼接为一个向量输入判别器，并将筛选出的评分高于预设阈值的商品加入候选集合；根据所述候选集合中的所述商品特征向量和所述用户特征向量分析用户偏好以得到用户偏好分布；从所述用户偏好分布中随机抽选多个商品作为推荐列表。本实施例根据用户偏好按照概率随机生成推荐列表，不仅能够保证准确性，而且同时也给新上市的商品提供了被推荐的机会，有利于新商品的推广。

Description

基于GAN网络的模糊推荐方法、装置、电子设备及存储介质

技术领域

本发明涉及商品推荐技术领域，具体涉及一种基于GAN网络的模糊推荐方法、电子设备及存储介质。

背景技术

推荐系统帮助理解每一位访问者的喜好和意图，基于与用户的实时交互为用户定制推荐内容从而提升用户的购物体验。此外，商家也可以借助推荐系统模拟销售人员向客户提供商品建议和信息以增加产品的浏览和销售机会，提升商品的销售额。据VentureBeat统计，亚马逊的推荐系统为其提供了35％的商品销售额。在长期困扰电子商务的诚信/物流/现金流问题得到解决后，应用推荐系统提升网站的形象和竞争力，提升消费者的购物体验已经成为开展电子商务、增加企业竞争力的新趋势。

现有关于推荐系统的研究《Social collaborative filtering by trust》(Yang,B.,Lei,Y.,Liu,J.,&Li,W.IEEE transactions on pattern analysis and machineintelligence,2017)主要集中在如何利用更多的数据来提升推荐的质量，却忽视了推荐系统的实时性和动态可扩展性。实时性关乎用户体验，反映的是推荐系统针对个性化请求的快速反馈能力；动态可扩展性关乎系统生命周期，当有新的节点加入或者新的交互行为产生，一个好的推荐系统应该能够实时根据动态变化的数据快速更新推荐策略且不需要重新训练整个算法的模型。推荐系统的实时性和动态可扩展性非常关键，不亚于推荐算法精度的重要程度《Learning Multi-granularity Dynamic Network Representations forSocial Recommendation》(Liu,P.,Zhang,L.,&Gulla,J.A.Joint European Conferenceon Machine Learning and Knowledge Discovery in Databases 2018)。因此，研究能够动态更新、实时反馈的个性化推荐系统具有重要的科学意义和广阔的应用前景。

推荐系统中的数据大部分是基于图表示的网络数据。图是不规则的，每张图大小不同、节点无序，每个节点都具有不同数目的邻近节点，使得一些在图像中常用的重要运算(如卷积)不能直接应用于图。此外，现有机器学习算法的核心假设是实例之间彼此独立。然而，网络数据中的每个实例都与周围的其它实例相关，并含有一些复杂的链接信息，如引用、朋友关系和相互作用等等《A survey on network embedding》(Cui,P.,Wang,X.,Pei,J.,&Zhu,W.IEEE Transactions on Knowledge and Data Engineering,2018)。除此之外，推荐系统中的网络数据是动态变化的，每时每刻都有新的节点加入或者新的交互行为产生《Learning Multi-granularity Dynamic Network Representations for SocialRecommendation》(Liu,P.,Zhang,L.,&Gulla,J.A.Joint European Conference onMachine Learning and Knowledge Discovery in Databases 2018)。因此，如何处理动态变化的网络数据，以实现推荐系统实时动态反馈，是目前推荐系统所面临的关键挑战。

作为2018年十大突破性技术之一，生成对抗网络(GAN)通过一种特殊形式的对抗来提高人工智能的学习能力，在计算机视觉、语音处理、自然语言方面相继取得了突破，达到甚至超越了人类水平：《Generative adversarial nets》(Goodfellow,I.,Pouget-Abadie,J.,Mirza,M.,Xu,B.,Warde-Farley,D.,Ozair,S.,...&Bengio,Y.Advances inneural information processing systems,2014)《Conditional generativeadversarial nets.》(Mirza,M.,&Osindero,S.arXiv 2014)《Seqgan:Sequencegenerative adversarial nets with policy gradient.》(Yu,L.,Zhang,W.,Wang,J.,&Yu,Y.Thirty-First AAAI Conference on Artificial Intelligence 2017)《Deepgenerative image models using a

laplacian pyramid of adversarial networks》(Denton,E.L.,Chintala,S.,&Fergus,R.)《Generative image modeling using styleand structure adversarial networks》(Wang,X.,&Gupta,A.European Conference onComputer Vision 2016)。GAN这种无监督方式的学习能力受到了很多研究者的青睐，也是解决推荐系统实时推荐的最优选择。由于推荐系统中数据的表征方式为图形，该表征方式限制了GAN的发挥，制约了其在推荐系统中的发展。

网络表征学习(Network Representation Learning)，又称作网络嵌入(NetworkEmbedding)，旨在将图中的每一个顶点映射到一个潜在的低维向量空间中并保持图的拓扑结构、顶点信息等等：《Network representation learning:A survey》(Zhang,D.,Yin,J.,Zhu,X.,&Zhang,C.IEEE transactions on Big Data.2018)《Heterogeneous networkembedding via deep architectures》(Chang,S.,Han,W.,Tang,J.,Qi,G.J.,Aggarwal,C.C.,&Huang,T.S.Proceedings of the 21th ACM SIGKDD International Conferenceon Knowledge Discovery and Data Mining.2015)《Label informed attributednetwork embedding》(Huang,X.,Li,J.,&Hu,X.Proceedings of the Tenth ACMInternational Conference on Web Search and Data Mining,2017)《Deepwalk:Onlinelearning of social representations.》(Perozzi,B.,Al-Rfou,R.,&Skiena,S.Proceedings of the 20th ACM SIGKDD international conference on Knowledgediscovery and data mining 2014)《node2vec:Scalable feature learning fornetworks.》(Grover,A.,&Leskovec,J.Proceedings of the 22nd ACM SIGKDDinternational conference on Knowledge discovery and data mining 2016)《Line:Large-scale information network embedding.》(Tang,J.,Qu,M.,Wang,M.,Zhang,M.,Yan,J.,&Mei,Q.Proceedings of the 24th international conference on world wideweb 2015)。基于随机游走的网络表征学习算法不仅可以将网络数据转化为节点的矢量，还可以自然地支持增量更新，随着图的变化来细化模型《Scalable graph embedding forasymmetric proximity.》(Zhou,C.,Liu,Y.,Liu,X.,Liu,Z.,&Gao,J.Thirty-First AAAIConference on Artificial Intelligence 2017)。

发明人在实践中，发现上述现有技术存在以下缺陷：

现有的推荐方法中采用的是Top-N列表的方式进行推荐，在该推荐方法的作用下，新上市的商品排名会比较靠后，不利于新商品的推广。

发明内容

为了解决上述技术问题，本发明的目的在于提供一种基于GAN网络的模糊推荐方法、电子设备及存储介质，所采用的技术方案具体如下：

第一方面，本发明实施例提出了一种基于GAN网络的模糊推荐方法该模糊推荐方法包括以下步骤：

从历史交互数据中获取用户特征向量和商品特征向量；

将所述用户特征向量和商品特征向量拼接为一个向量输入判别器，并将筛选出的评分高于预设阈值的商品加入候选集合；

根据所述候选集合中的所述商品特征向量和所述用户特征向量分析用户偏好以得到用户偏好分布；

从所述用户偏好分布中随机抽选多个商品作为推荐列表。

进一步，所述根据所述候选集合中的商品的特征向量及所述用户特征向量分析用户偏好以得到用户偏好分布，包括：

将所述候选集合中的商品特征向量及所述用户特征向量输入生成器，得到用户偏好分布；其中，所述生成器和判别器均是通过使用多个用户样本和商品样本进行机器学习训练获得的。

进一步，所述生成器和判别器的训练过程包括以下步骤：

将所述用户特征向量和所述商品特征向量拼接为一个向量；

将所述向量输入生成器进行用户的偏好分析训练；

在所述偏好分析训练的过程中，由生成器根据所述向量生成多个负样本；判别器根据所述负样本和实际的正样本进行训练，并更新所述判别器的参数和所述生成器的参数；交替训练所述判别器和所述生成器。

进一步，所述获取用户特征向量，包括：

利用随机游走算法对网络数据进行采样并生成具有相似偏好的用户正样本短列表；

设置大小固定的滑动窗口，并依次生成用户正样本和用户负样本；

将所述用户正样本和用户负样本同时输入基于负采样的Skip-Gram模型，得到更新后的用户特征向量集合。

进一步，所述获取商品特征向量的方法与获取所述用户特征向量的方法相同。

第二方面，本发明实施例提出了一种基于GAN网络的模糊推荐装置，该模糊推荐装置包括：

特征向量获取单元，用于从历史交互数据中获取用户特征向量和商品特征向量。

鉴别单元，用于将所述用户特征向量和商品特征向量拼接为一个向量输入判别器，并将筛选出的评分高于预设阈值的商品加入候选集合。

生成单元，用于根据所述候选集合中的所述商品特征向量和所述用户特征向量分析用户偏好以得到用户偏好分布。

推荐单元，用于从所述用户偏好分布中随机抽选多个商品作为推荐列表。

进一步，所述特征向量获取单元还包括：

偏好列表生成单元，用于利用随机游走算法对网络数据进行采样并生成具有相似偏好的用户正样本短列表；

样本获取单元，用于设置大小固定的滑动窗口，并依次生成用户正样本和用户负样本；和

特征向量生成单元，用于将所述用户正样本和用户负样本同时输入基于负采样的Skip-Gram模型，得到用户特征向量集合。

进一步，该模糊推荐装置还包括模型训练单元，该模型训练单元包括：

向量拼接单元，用于将所述用户特征向量和所述商品特征向量拼接为一个向量；

训练单元，用于将所述向量输入生成器进行用户的偏好分析训练；在所述偏好分析训练的过程中，由生成器根据所述向量生成多个负样本；判别器根据所述负样本和实际的正样本进行训练，并更新所述判别器的参数和所述生成器的参数；交替训练所述判别器和所述生成器。

第三方面，本发明实施例提出了一种电子设备，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：执行上述任意一种基于GAN网络的模糊推荐方法。

第四方面，本发明实施例提出了一种存储介质，该存储介质中存储有计算机可读的程序指令，所述程序指令被处理器执行时实现权上述任意一种基于GAN网络的模糊推荐方法。

本发明具有如下有益效果：

本发明实施例提供了一种基于GAN网络的模糊推荐方法，该方法根据拼接后的用户商品特征向量筛选出的评分高于预设阈值的商品加入候选集合，并根据该候选集合中的商品的特征向量及所述用户特征向量分析用户偏好以得到用户偏好分布，并从该用户偏好分布中随机抽选多个商品作为推荐列表。本实施例根据用户偏好按照概率随机生成推荐列表，不仅能够保证准确性，而且同时也给新上市的商品提供了被推荐的机会，有利于新商品的推广。

附图说明

图1为本发明一个实施例所提供的整体推荐系统框架图；

图2为本发明一个实施例所提供的基于随机游走网络嵌入模型；

图3为本发明一个实施例所提供的网络数据处理的流程图；

图4为本发明一个实施例所提供的GAN网络训练模型；

图5为本发明一个实施例所提供的GAN网络训练流程图；

图6为本发明一个实施例所提供的推荐列表生成模型；

图7为本发明一个实施例所提供的一种基于GAN网络的模糊推荐方法的流程图；

图8为本发明一个实施例所提供的一种基于GAN网络的模糊推荐装置的结构框图；

图9为本发明一个实施例所提供的关于特征向量获取单元的结构框图；

图10为本发明一个实施例所提供的关于模型训练单元的结构框图；

图11为本发明一个实施例所提供的一种电子设备。

具体实施方式

为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效，以下结合附图及较佳实施例，对依据本发明提出的一种基于GAN网络的模糊推荐方法、电子设备及存储介质，其具体实施方式、结构、特征及其功效，详细说明如下。在下述说明中，不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外，一或多个实施例中的特定特征、结构、或特点可由任何合适形式组合。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的属于只是为了描述具体的实施例的目的，不是旨在于限制本发明。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。

下面结合附图具体的说明本发明所提供的一种基于GAN网络的模糊推荐方法、电子设备及存储介质的具体方案。

请参阅图1，其示出了本发明一个实施例提供的一种基于GAN网络的模糊推荐方法的系统框架图，由于目前常用的推荐方法是Top-N列表生成方式，其推荐的列表比较单一，其他商品不能得到有效的推广，特别不利于新商品的推广。因此本发明实施例所提供的推荐方法是按照概率随机生成推荐列表，该种随机生成的方式能够在用户每次登录都有微小的随机的变化，使推荐列表更加多样性，在本发明实施例中将该种推荐方法称之为模糊推荐，以下不再声明。由于图的表征数据不好处理，因此提出网络嵌入算法，将图转化为GAN比较擅长处理的数据表征方式。由于推荐系统的图是动态变化的，因此需要将动态变化的图转化为实时更新的矢量。由图1可知该系统框架包括四大部分：标准化、特征提取、网络嵌入和实时推荐；标准化是将用户属性数据标准化为第一用户特征向量；特征提取是指对物品描述数据进行特征提取得到第一物品特征向量；网络嵌入是指根据历史交互数据从用户的社交网络数据中提取第二用户特征向量，同时从用户评分数据中得到第三用户特征向量和第二物品特征向量；实时推荐是指将由第一用户特征向量、第二用户特征向量及第三用户特征向量构成用户特征向量和由第一物品特征向量及第二物品特征向量构成以及物品特征向量作为GAN生成模型的输入，进而得到个性化推荐列表。

为了更加清楚的说明本发明实施例，下面将分别介绍网络数据处理阶段、模型训练阶段和推荐列表生成阶段。

对于网络数据处理阶段：该网络数据处理阶段的目的是获得每个用户的用户特征向量以及每个商品的商品特征向量。其中用户特征向量和商品特征向量的获取方法相同，下面以获取用户特征向量为例来具体说明：

具体的，首先，令I(u)表示用户u评分过的所有商品集合；U(i)表示对商品i有过评分的所有用户集合。请参阅图2和图3，该网络数据处理阶段包括以下步骤：

步骤301，利用随机游走算法对网络数据进行采样并生成具有相似偏好的用户正样本短列表。

具体的，请参阅图2，首先从用户集合中的任意一个节点出发，例如以u₁作为样本序列的第一个元素，之后从I(u₁)中随机抽取一个节点i₁，并记录下u₁对i₁的评分r＝1。在图2所示的例子中U(i₁)有四个节点{u₁，u₂，u₃，u_n}，从中筛选掉对i₁评分不等于r的用户u₃；在剩下的集合{u₁，u₂，u_n}中随机选取一个节点，例如将u₂作为序列中的第二个元素，从u₂出发，重复上述步骤直到生成一个用户正样本短列表，如图2中间部分所示，这个列表就是一组正相关的样本序列。图中，不同的颜色深度表示不同的评分等级，其中评分等级按照数字1～5进行区分。

步骤302，设置大小固定的滑动窗口，并依次生成用户正样本和用户负样本。

具体的，用户正样本是指对某些商品具有相似评分的用户节点对，用户正样本的获取方法是以用户正样本短列表中的每一个元素为中心，设置一个大小固定的滑动窗口，窗口内的所有元素都能与当前元素组成一组用户正样本。用户负样本是指对商品评分存在不同偏好的用户节点对，用户负样本的获取方法是选取与当前元素偏好不同的节点代替当前元素并与窗口内的元素组成的节点对。

用户正样本和用户负样本具体的获取方法是：对于用户正样本短列表中的任意一个元素u，从当前元素u的I(u)集合中随机选取一个节点i，之后在U(i)中按照概率随机选取一个节点v作为替代节点。对于每一个节点v，其作为负采样节点被选中的概率Pr(v)可以用下式进行表达：

其中，r_u,i表示用户u对商品i的评分、r_v,i表示用户v对商品i的评分、r_t,i表示用户t对商品i的评分，|x|表示x的绝对值，|x|的值越大说明节点v与当前元素u的差异也就越大，其作为负相关节点的身份也就越重要，也就越有可能被选中作为替代节点。

步骤303，将所述用户正样本和用户负样本同时输入基于负采样的Skip-Gram模型，得到更新后的用户特征向量集合。

具体的，通过步骤301和步骤302的方法得到用户正样本和用户负样本之后，根据《Distributed representations of words and phrases and theircompositionality.》(Mikolov,T.,Sutskever,I.,Chen,K.,Corrado,G.S.,&Dean,J.Advances in neural information processing systems.2013)所公开的基于负采样的Skip-Gram模型(SGNS)，求出每个用户的矢量表示，并将得到的每个用户特征向量加入到用户特征向量集合中。具体表现为用随机梯度下降算法来优化下面的目标函数：

其中，

为要学习的用户u_i的特征向量表示、

表示用户u_j的特征向量的转置、

表示用户u_l的特征向量的转置。σ(x)＝1/(1+exp(-x))表示sigmoid函数。u_l～P(u_i)表示从分布P(u_i)中随机抽取的噪声用户，这里P(u_i)采用的是均匀分布，即从除u_i之外的用户中进行随机抽取。

表示观测到的用户正样本的期望值，

表示从噪声分布中随机抽取的k个用户负样本的期望值，其中P(u_i)采用均匀分布。SGNS的目的是希望通过同时最大化用户正样本期望概率和最小化用户负样本期望概率来学习节点的矢量表示。

综上所述，本发明实施例中的用户特征向量集合和商品特征向量集合的获取方法相同，均是利用随机游走算法对网络数据进行采样并生成偏好相似、实体类型相同的正样本短列表；根据设置大小固定的滑动窗口依次生成正样本集合和负样本集合；将正样本集合和负样本集合分别输入基于负采样的Skip-Gram模型(SGNS)依次得到样本的矢量表示。

对于模型训练阶段：该模型训练阶段的目的是使生成器所生成的偏好分布更加接近真实的偏好分布，并获得最优的生成器。请参阅图4和图5，生成器需要通过使用多个用户样本和商品样本进行机器学习训练获得，判别器和生成器的训练过程如下：

步骤501，获取用户特征向量和所述商品特征向量。

具体的，在网络数据处理阶段，获得每一个用户u的矢量表示

以及每一个商品i的矢量表示

步骤502，将步骤501中获取的用户特征向量

依次与商品特征向量

拼接为输入向量输入生成器进行用户的偏好分析训练。

在所述偏好分析训练的过程中，由生成器根据用户的特征向量和商品的特征向量生成多个负样本，也即从商品集合中选取几个与商品i可能相关的商品，将该负样本与客观世界中观测到的实际的正样本进行训练。

判别器的目标函数如下所示：

其中，p_θ(i|u,I)表示生成器生成的用户u对给定商品集合I中商品i的偏好程度，p_true(i|u,I)表示事实上客观存在的用户u对给定商品集合I中商品i的偏好程度。判别器的目的就是尽可能的识别出正样本对和负样本对，

表示判别器对节点对

的评分值，符号

表示向量间的拼接操作。根据文献《Learning to rank using gradientdescent.》(Burges,C.,Shaked,T.,Renshaw,E.,Lazier,A.,Deeds,M.,Hamilton,N.,&Hullender,G.N.Proceedings of the 22nd International Conference on Machinelearning,2005)所公开的RankNet方法，采用两层的神经网络来计算。通过两层网络的深度表示获得节点对的非线性表达，最终得到预测值：

其中，W₁∈R^l×k表示第一层全链接层的权重，b₁∈R^l表示隐含层的偏置向量，W₂∈R^l和b₂分别表示输出层的权重和偏置向量。由于

可微，所以通过梯度下降算法来优化判别器的目标函数，求出判别器的参数，并根据相应的参数优化判别器。

生成器的目的是希望其生成的用户偏好分布尽可能的接近真实的偏好分布以骗过判别器，所以在判别器不变的情况下，通过最小化生成器的目标函数来优化生成器的参数：

其中，

表示用户u的矢量表示，

表示商品i的矢量表示，θ^*表示学习到的最优参数集合。

生成器的目的就是希望生成一个比较好的概率分布p_θ(i|u,I)，具体公式为：

其中，

表示生成器对节点对的估分值。

生成器采用与判别器相同的两层的神经网络来计算：

其中，θ＝{W₁,W₂,b₁,b₂}表示要学习的参数集合。由于从分布p_θ(i|u,I)中抽取的节点是离散的，所以不能直接采用梯度下降的方法来优化目标函数，因此采用强化学习中的策略梯度下降算法求出生成模型的参数，并根据相应的参数优化生成模型，该算法在文献《Seqgan:Sequence generative adversarial nets with policy gradient.》(Yu,L.,Zhang,W.,Wang,J.,&Yu,Y.Thirty-First AAAI Conference on ArtificialIntelligence 2017)中公开记载，具体的：

令

那么

其中

可以看作是强化学习中的奖励(reward)。然而

为了使得“奖励”有正有负，对上述式子进行了简单修改如下：

生成器根据预测的用户偏好分布生成商品列表，与客观存在的商品列表一同发送给判别器进行鉴别，判别器根据鉴别结果交替训练上述生成器和判别器，直到判别器不再发生变化时，将相应判别器和生成器投入使用，生成推荐列表。

对于推荐列表生成阶段，推荐列表生成阶段的目的是根据训练好的判别器和生成器获得推荐列表。请参阅图6和图7推荐列表获取的步骤如下：

步骤701，获取用户特征向量以及商品特征向量。

针对每一个用户，首先从存储于数据库的历史交互数据中获取用户特征向量和商品特征向量。

步骤702，将根据步骤701中得到的用户特征向量和商品特征向量拼接为一个向量输入判别器中，并筛选出评分高于预设阈值的商品加入候选集合。

将用户特征向量和商品特征向量拼接为一个向量输入判别器，判别器判断商品的评分与预设阈值的关系，将评分高于预设阈值的商品加入候选集合。候选集合用于存储用户可能偏好的商品，将用户可能偏好的商品存放于候选集合中以便后续从该集合中进一步筛选。根据评分的类型及规则，预先设置用户可能偏好的商品的阈值，评分高于该预设阈值表明用户至少不讨厌此商品，因此相关的新商品应高于预设阈值，评分低于该预设阈值表明用户不喜欢该商品。

具体的，将节点对输入判别器，根据判别器筛选出评分高于预设阈值th的商品，也即满足

过滤掉评分低于预设阈值的商品，并将所筛选出的商品加入候选集合。由于评分低于预设阈值的商品是用户肯定不喜欢的商品，因此直接过滤掉，不加入候选集合。将用户肯定不喜欢的商品过滤掉能够减少生成器不必要的工作量，达到为生成器减压的效果。

步骤703，根据候选集合中的商品特征向量和用户特征向量分析用户偏好以得到用户偏好分布。

将候选集合中的商品的特征向量及用户特征向量输入生成器中，生成相应的用户偏好分布。

步骤704，从用户偏好分布中随机抽选多个商品作为推荐列表。

从用户偏好分布中，根据概率随机抽选多个商品作为最终的推荐列表。这样按照概率随机生成推荐列表的方式不仅能够保证准确性，而且同时也给新上市的商品提供了机会，一定程度上缓解了冷启动问题。

综上所述，本发明实施例提供了一种基于GAN网络的模糊推荐方法，该方法根据拼接后的用户商品特征向量筛选出的评分高于预设阈值的商品加入候选集合，并根据该候选集合中的商品的特征向量及所述用户特征向量分析用户偏好以得到用户偏好分布，并从该用户偏好分布中随机抽选多个商品作为推荐列表。本实施例根据用户偏好按照概率随机生成推荐列表，不仅能够保证准确性，而且同时也给新上市的商品提供了被推荐的机会。

请参阅图8，本发明实施例还提供了一种基于GAN网络的模糊推荐装置的结构框图，该模糊推荐装置包括：特征向量获取单元801、鉴别单元802、生成单元803和推荐单元804。

特征向量获取单元801用于获取用户特征向量以及商品特征向量。

鉴别单元802用于将用户特征向量和商品特征向量拼接为一个向量输入判别器，并将筛选出的评分高于预设阈值的商品加入候选集合。

生成单元803用于根据候选集合中的用户特征向量和商品特征向量分析用户偏好以得到用户偏好分布。

推荐单元804用于从用户偏好分布中随机抽选多个商品作为推荐列表。

优选的，请参阅图9，该特征向量获取单元801还包括偏好列表生成单元8011、样本获取单元8012和特征向量生成单元8013。具体的：偏好列表生成单元8011用于利用随机游走算法对网络数据进行采样并生成具有相似偏好的用户正样本短列表；样本获取单元8012用于设置大小固定的滑动窗口，并依次生成用户正样本和用户负样本；特征向量生成单元8013用于将用户正样本和用户负样本同时输入基于负采样的Skip-Gram模型，得到用户特征向量集合。

优选的，请参阅图10，该模糊推荐装置还包括模型训练单元805，该模型训练单元805包括向量拼接单元8051和训练单元8052。向量拼接单元8051用于将用户特征向量和商品特征向量拼接为一个向量；训练单元8052用于将该向量输入生成器进行用户的偏好分析训练；在偏好分析训练的过程中，由生成器根据节点对生成多个负样本；判别器根据负样本和实际的正样本进行训练，并更新判别器的参数和生成器的参数；交替训练判别器和生成器。

综上所述，本发明实施例提供了一种基于GAN网络的模糊推荐装置，该装置包括特征向量获取单元、鉴别单元、生成单元和推荐单元，其中，特征向量获取单元用于获取并将用户特征向量以及商品特征向量拼接为一个向量；鉴别单元用于将根据该向量筛选出的评分高于预设阈值的商品加入候选集合；生成单元用于根据候选集合中的节点对分析用户偏好以得到用户偏好分布；推荐单元用于从用户偏好分布中随机抽选多个商品作为推荐列表。本实施例通过特征向量获取单元、鉴别单元、生成单元和推荐单元，根据用户偏好按照概率随机生成推荐列表，不仅能够迎合用户的偏好，而且随机推荐中能够随机推荐新上市的商品，每次推荐都是随机的，伴随着微小的变化，带给客户多样性的体验。

本发明还提出了一种电子设备，请参阅图11，该电子设备可以是终端设备，该终端设备用于实施上述任意一种实施例中所提供的基于GAN网络的模糊推荐方法。具体的，该终端设备包括处理器901、存储器902、RF单元903、输入单元904、显示单元905和电源906等部件。本领域技术人员可以理解，在图11中所示出的终端设备的结构并不构成对终端设备的限定，可以包括比图示更多或者更少的部件，或者组合某些部件，或者不同的部件的布置。其中：

RF单元903可用于收发信息，信号的接收和发送，特别地，将基站的下行信息接收后，交由一个或者一个以上处理器进行处理；另外，将涉及上行的数据发送给基站。通常，RF电路包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM)卡、收发信机、耦合器、LNA(Low Noise Amplifier，低噪声放大器)、双工器等。此外，RF电路903还可以通过无线通信与网络和其他设备通信。该无线通信可以使用任意一种通信标准或协议，包括但不限于GSM(Global System of Mobile communication，全球移动通讯系统)、GPRS(General Packet Radio Service，通用分组无线服务)、CDMA(Code DivisionMultiple Access，码分多址)、WCDMA(Wideband Code Division Multiple Access,宽带码分多址)、LTE(Long Term Evolution,长期演进)、电子邮件、SMS(Short MessagingService，短消息服务)等。

存储器902可用于存储软件程序以及模块，处理器901通过运行存储在存储器902的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器902可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据终端设备的使用所创建的数据(比如视频数据、电话本等)等。此外，存储器902可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器902还可以包括存储器控制器，以提供处理器和输入单元对存储器的访问。具体在本实施例中，存储器中存储有一个或者一个以上的程序，且经配置以由一个或者一个以上处理器执行。上述一个或者一个以上程序包含用于执行上述方法实施例提供的基于GAN网络的模糊推荐方法的指令。

输入单元904可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地，输入单元904可包括图像输入设备以及其他输入设备。图像输入设备可以是摄像头，也可以是光电扫描设备。除了图像输入设备，输入单元还可以包括其他输入设备。具体地，其他输入设备可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。终端设备可包括至少一种输入单元，用户获取用户输入的网络数据。

显示单元905可用于显示由用户输入的信息或提供给用户的信息以及终端设备的各种图形用户接口，这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元可包括显示面板，可选的，可以采用LCD(LiquidCrystalDisplay，液晶显示器)、OLED(OrganicLight-EmittingDiode，有机发光二极管)等形式来配置显示面板。

处理器901是终端设备的控制中心，利用各种接口和线路连接整个终端设备的各个部分，通过运行或执行存储在存储器内的软件程序和/或模块，以及调用存储在存储器902内的数据，执行终端设备的各种功能和处理数据，从而对终端设备进行整体监控。可选的，处理器901可包括一个或多个处理核心；优选的，处理器901可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器中。

终端设备还包括给各个部件供电的电源906(比如电池)，优选的，电源906可以通过电源管理系统与处理器逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

尽管未示出，终端设备还可以包括WIFI模块等，在此不再赘述。

本发明实施例还提供了一种存储介质，所述存储介质中保存有用于实现由处理器加载并执行以实现上述任意一种方法实施例提供的基于GAN网络的模糊推荐方法的至少一条指令、至少一段程序、代码集或指令集。

可选地，在本实施例中，上述存储介质可以位于计算机网络的多个网络服务器中的至少一个网络服务器。

可选地，在本实施例中，上述存储介质可以包括但不限于：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种基于GAN网络的模糊推荐方法，其特征在于，该模糊推荐方法包括以下步骤：

从历史交互数据中获取用户特征向量和商品特征向量；

从所述用户偏好分布中随机抽选多个商品作为推荐列表。

2.根据权利要求1所述的一种基于GAN网络的模糊推荐方法，其特征在于，所述根据所述候选集合中的商品的特征向量及所述用户特征向量分析用户偏好以得到用户偏好分布，包括：

3.根据权利要求2所述的一种基于GAN网络的模糊推荐方法，其特征在于，所述生成器和判别器的训练过程包括以下步骤：

将所述用户特征向量和所述商品特征向量拼接为一个向量；

将所述向量输入生成器进行用户的偏好分析训练；

4.根据权利要求1~3任意一项所述的一种基于GAN网络的模糊推荐方法，其特征在于，所述获取用户特征向量，包括：

5.根据权利要求4所述的一种基于GAN网络的模糊推荐方法，其特征在于，所述获取商品特征向量的方法与获取所述用户特征向量的方法相同。

6.一种基于GAN网络的模糊推荐装置，其特征在于，该模糊推荐装置包括：

特征向量获取单元，用于从历史交互数据中获取用户特征向量和商品特征向量；

鉴别单元，用于将所述用户特征向量和商品特征向量拼接为一个向量输入判别器，并将筛选出的评分高于预设阈值的商品加入候选集合；

生成单元，用于根据所述候选集合中的所述商品特征向量和所述用户特征向量分析用户偏好以得到用户偏好分布；

7.根据权利要求6所述的一种基于GAN网络的模糊推荐装置，其特征在于，所述特征向量获取单元还包括：

8.根据权利要求6所述的一种基于GAN网络的模糊推荐装置，其特征在于，该模糊推荐装置还包括模型训练单元，该模型训练单元包括：

9.一种电子设备，其特征在于，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：执行权利要求1至5中任意一项所述的方法。

10.一种存储介质，该存储介质中存储有计算机可读的程序指令，其特征在于，所述程序指令被处理器执行时实现权利要求1至5中任意一项所述的方法。