CN113343117B

CN113343117B - 对抗网络模型的训练方法、信息推荐方法及相关设备

Info

Publication number: CN113343117B
Application number: CN202110777132.5A
Authority: CN
Inventors: 李长林; 蒋宁; 王洪斌; 吴海英; 沈春泽; 曹磊; 席泽西
Original assignee: Mashang Consumer Finance Co Ltd
Current assignee: Mashang Consumer Finance Co Ltd
Priority date: 2021-07-09
Filing date: 2021-07-09
Publication date: 2022-05-17
Anticipated expiration: 2041-07-09
Also published as: CN113343117A

Abstract

本申请提供一种生成对抗网络模型的训练方法、信息推荐方法及相关设备，该方法包括：将样本数据进行向量转换，获得第一向量集和第二向量集，第一向量集包括由用户数据转换获得的一阶特征向量，第二向量集包括由对象数据转换获得的一阶特征向量；将第一向量集和第二向量集输入生成网络，获得生成向量；利用生成向量对判别网络进行训练；生成网络包括分解机网络层、深度神经网络层和输出层，分解机网络层用于对一阶特征向量进行特征提取获得第一特征向量，对一阶特征向量进行组合后的二阶特征向量进行特征提取获得第二特征向量，深度神经网络层用于对基于一阶特征向量构建的高阶特征向量进行特征提取获得第三特征向量，输出层的输出为生成向量。

Description

对抗网络模型的训练方法、信息推荐方法及相关设备

技术领域

本申请属于人工智能领域，尤其涉及一种对抗网络模型的训练方法、信息推荐方法及相关设备。

背景技术

随着人工智能的发展，生成对抗网络(generative adversarial network，GAN)在计算机视觉(Computer Version，CV)、自然语言处理(Natuarl Language Processing，NLP)等领域取得了巨大的成功。为此，考虑将GAN应用于信息检索的工作。现有技术中，针对生成对抗网络模型的训练通常采用用户的历史交互信息作为模型输入，这样将会导致生成对抗网络模型不能完全捕获文本信息，导致训练的生成对抗网络模型的预测能力较低。

发明内容

本申请实施例提供一种对抗网络模型的训练方法、信息推荐方法及相关设备，以解决将GAN应用于信息检索时，预测能力较低的问题。

为了解决上述技术问题，本申请是这样实现的：

第一方面，本申请实施例提供了一种生成对抗网络模型的训练方法，待训练对抗网络模型包括生成网络和判别网络，所述方法包括：

将样本数据进行向量转换，获得第一向量集和第二向量集，所述样本数据包括用户数据和对象数据，所述第一向量集包括基于所述用户数据转换获得的多个一阶特征向量，所述第二向量集包括基于所述对象数据转换获得的多个一阶特征向量；

将所述第一向量集和第二向量集输入所述生成网络，获得生成向量，所述生成向量用于表示基于所述生成网络生成的用户偏好序列；

利用所述生成向量对所述判别网络进行训练，获得生成对抗网络模型；

其中，所述生成网络包括分解机网络层、深度神经网络层和输出层，所述分解机网络层用于对所述一阶特征向量进行特征提取获得第一特征向量，以及对所述一阶特征向量进行两两组合后的二阶特征向量进行特征提取获得第二特征向量，所述深度神经网络层用于对基于所述一阶特征向量构建的高阶特征向量进行特征提取获得第三特征向量，所述输出层的输入为所述第一特征向量、第二特征向量和第三特征向量，所述输出层的输出为所述生成向量。

第二方面，本申请实施例提供了一种信息推荐方法，包括：

将目标用户的用户数据和目标对象数据进行向量转换，获得第三向量集和第四向量集，所述第三向量集包括基于所述目标用户的用户数据转换获得的多个一阶特征向量，所述第四向量集包括基于所述目标对象数据转换获得的多个一阶特征向量；

将所述第三向量集和第四向量集输入至通过生成对抗网络模型训练的生成网络，获得目标生成向量；

基于所述目标生成向量确定是否向所述目标用户推荐所述目标对象数据；

其中，所述生成网络包括分解机网络层、深度神经网络层和输出层，所述分解机网络层用于对所述一阶特征向量进行特征提取获得第一特征向量，以及对所述一阶特征向量进行两两组合后的二阶特征向量进行特征提取获得第二特征向量，所述深度神经网络层用于对基于所述一阶特征向量构建的高阶特征向量进行特征提取获得第三特征向量，所述输出层的输入为所述第一特征向量、第二特征向量和第三特征向量，所述输出层的输出为所述目标生成向量。

本申请实施例由于利用生成网络对用户数据和对象数据进行了深度和广度的特征提取，从而可以提高生成网络的预测能力，进而提升信息推荐的准确度。

第三方面，本申请实施例提供了一种生成对抗网络模型的训练装置，待训练对抗网络模型包括生成网络和判别网络，所述装置包括：

第一转换模块，用于将样本数据进行向量转换，获得第一向量集和第二向量集，所述样本数据包括用户数据和对象数据，所述第一向量集包括基于所述用户数据转换获得的多个一阶特征向量，所述第二向量集包括基于所述对象数据转换获得的多个一阶特征向量；

第一输入模块，用于将所述第一向量集和第二向量集输入所述生成网络，获得生成向量，所述生成向量用于表示基于所述生成网络生成的用户偏好序列；

训练模块，用于利用所述生成向量对所述判别网络进行训练，获得生成对抗网络模型；

第四方面，本申请实施例提供了一种信息推荐装置，包括：

第二转换模块，用于将目标用户的用户数据和目标对象数据进行向量转换，获得第三向量集和第四向量集，所述第三向量集包括基于所述目标用户的用户数据转换获得的多个一阶特征向量，所述第四向量集包括基于所述目标对象数据转换获得的多个一阶特征向量；

第二输入模块，用于将所述第三向量集和第四向量集输入至通过生成对抗网络模型训练的生成网络，获得目标生成向量；

确定模块，用于基于所述目标生成向量确定是否向所述目标用户推荐所述目标对象数据；

第五方面，本发明实施例提供了一种电子设备，包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现上述生成对抗网络模型的训练方法的步骤，或者实现上述信息推荐方法的步骤。

第六方面，本发明实施例提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被所述处理器执行时实现上述生成对抗网络模型的训练方法的步骤，或者实现上述信息推荐方法的步骤。

本申请实施例通过将样本数据进行向量转换，获得第一向量集和第二向量集，所述样本数据包括用户数据和对象数据，所述第一向量集包括基于所述用户数据转换获得的多个一阶特征向量，所述第二向量集包括基于所述对象数据转换获得的多个一阶特征向量；将所述第一向量集和第二向量集输入生成网络，获得生成向量，所述生成向量用于表示基于所述生成网络生成的用户偏好序列；利用所述生成向量对所述判别网络进行训练，获得生成对抗网络模型；其中，所述生成网络包括分解机网络层、深度神经网络层和输出层，所述分解机网络层用于对所述一阶特征向量进行特征提取获得第一特征向量，以及对所述一阶特征向量进行两两组合后的二阶特征向量进行特征提取获得第二特征向量，所述深度神经网络层用于对基于所述一阶特征向量构建的高阶特征向量进行特征提取获得第三特征向量，所述输出层的输入为所述第一特征向量、第二特征向量和第三特征向量，所述输出层的输出为所述生成向量。本申请实施例中由于利用生成网络对用户数据和对象数据进行了深度和广度的特征提取，使得训练好的生成网络可以更好的获取用户的偏好信息，因此，从而使用生成网络进行信息推荐时，可以提高生成网络预测能力。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的生成对抗网络模型的训练方法的流程图；

图2是本申请实施例提供的生成对抗网络模型的训练框架示意图；

图3是本申请实施例提供的生成对抗网络模型中生成网络的结构示意图；

图4是本申请实施例提供的信息推荐方法的流程图；

图5是本申请实施例提供的生成对抗网络模型的训练装置的结构图；

图6是本申请实施例提供的信息推荐装置的结构图；

图7是本申请实施例提供的电子设备的结构图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

GAN(generative adversarial network)网络，即生成对抗网络，是一种机器学习方法。由Ian J.Goodfello等人于2014年在Generative Adversarial Nets论文中提出。其中在GAN网络中包含两个模型，分别是生成模型(generative model G)和判别模型(discriminative model D)。GAN网络在CV(计算机视觉)、NLP(自然语言处理)等领域取得了巨大的成功，使得GAN成为近年来在机器学习领域的新宠，引起了学术界和工业界的重视，这里以生成图片简要介绍。GAN启发自博弈论中的二人零和博弈(two-player game)，GAN模型中的两位博弈方分别由生成式模型和判别式模型充当。生成模型G捕捉样本数据的分布，用服从某一分布(均匀分布，高斯分布等)的噪声z生成一个类似真实训练数据的样本，追求效果是越像真实样本越好；判别模型D是一个二分类器，估计一个样本来自于训练数据(而非生成数据)的概率，如果样本来自于真实的训练数据，D输出大概率，否则，D输出小概率。在训练的过程中，生成网络G的目标就是生成假的图片去骗过判别网络D，而判别网络D的目标就是能够分辨出某一张图片是不是由G生成的。这就变成了一个博弈的过程，同时G和D的能力也在训练的过程中逐渐提高。在训练的过程中固定一方，更新另一方的网络权重，交替迭代，在这个过程中，双方都极力优化自己的网络，从而形成竞争对抗，直到双方达到一个动态的平衡(纳什均衡)。在最理想的情况下，此时生成模型G恢复了训练数据的分布(造出了和真实数据一模一样的样本)，D不再能够区分真实图片和伪造图片时，训练过程达到平衡，准确率为50％。

相比于GAN在CV、NLP等领域生成任务上大放异彩的应用，信息检索中融入GAN面临着诸多复杂挑战。如梯度消失和模型奔溃(mode collapse)等问题，以及推荐模型中的过程是离散的，难以直接进行模型训练等。在常规的实施方式中，针对生成对抗网络模型的训练通常采用用户的历史交互信息作为模型输入，这样将会导致生成对抗网络模型不能完全捕获文本信息，导致训练的生成对抗网络模型的预测能力较低。本申请实施例通过将用户数据和对象数据转换获得的多个一阶特征向量输入生成网络，获得生成向量，该生成向量用于表示基于生成网络生成的用户偏好序列；并利用生成向量对判别网络进行训练，获得生成对抗网络模型。本申请实施例中由于利用生成网络对用户数据和对象数据进行了深度和广度的特征提取，使得训练好的生成网络可以更好的获取用户的偏好信息，因此，从而使用生成网络进行信息推荐时，可以提高生成网络预测能力。具体实施方式请参见下文。

参见图1，图1是本申请实施例提供的一种生成对抗网络模型的训练方法的流程图，所述生成对抗网络模型包括生成网络和判别网络，如图1和图2所示，所述方法包括以下步骤：

步骤101，将样本数据进行向量转换，获得第一向量集和第二向量集，所述样本数据包括用户数据和对象数据，所述第一向量集包括基于所述用户数据转换获得的多个一阶特征向量，所述第二向量集包括基于所述对象数据转换获得的多个一阶特征向量；

本申请实施例中，上述用户数据可以为基于交互产生的数据，即可以包括一个或者多个用户的行为数据。例如，包括但不限于年龄、性别、注册时间、消费等结构化数据，也可以仅一步包括用户的隐式信息，例如包括用户的历史浏览、收藏、点赞和关注等内容。其中，第一向量集可以包括多个一阶特征向量，第一向量集中的每一个一阶特征向量可以表示用户的行为数据中的一个特征数据。例如，身高为一个特征数据，年龄为一个特征数据，体重为一个特征数据。

上述对象数据可以包括多个对象的对象信息，上述对象信息可以包括但不限于对象标识、对象介绍描述、对象评价以及销售情况等。其中，第二向量集可以包括多个一阶特征向量，第二向量集中的每一个一阶特征向量可以表示用户的行为数据中的一个特征数据。例如，历史浏览的对象的评价数据为一个特征数据，历史浏览的对象的销售数据为一个特征数据。

应理解，上述对象可以理解为物品、食物和虚拟服务等，物品可以理解为商品，具体可以包括虚拟物品，例如游戏礼包、Q币等，也可以包括实际物品，例如可以为背包、衣服和手势等物品。上述虚拟服务可以包括旅游服务等。也就是说基于本申请训练的生成对抗网络模型可以应用于物品推荐、食物推荐和虚拟服务推荐等，当然还可以应用于其他信息推荐的场景中，在此不再一一列举。以下各实施例中，以对象为物品为例进行说明。

步骤102，将所述第一向量集和第二向量集输入生成网络，获得生成向量，所述生成向量用于表示基于所述生成网络生成的用户偏好序列；

本申请实施例中，上述生成网络的结构如图3所示，所述生成网络包括分解机网络层、深度神经网络层和输出层，所述分解机网络层用于对所述一阶特征向量进行特征提取获得第一特征向量，以及对所述一阶特征向量进行两两组合后的二阶特征向量进行特征提取获得第二特征向量，所述深度神经网络层用于对基于所述一阶特征向量构建的高阶特征向量进行特征提取获得第三特征向量，所述输出层的输入为所述第一特征向量、第二特征向量和第三特征向量，所述输出层的输出为所述生成向量。

本申请实施例中，上述分解机网络层可以理解为基于FM算法构建的FM网络模型，上述深度神经网络层可以理解为基于DNN算法构建的DNN网络信息，联合训练FM模型和DNN模型，同时学习低阶特征组合和高阶特征组合。其中，FM算法对一阶特征以及由一阶特征两两组合而成的二阶特征进行特征的提取；DNN算法对由输入的一阶特征进行全连接等操作形成的高阶特征进行特征的提取。应理解，基于FM算法进行特征提取的方式可以理解为广度的特征提取方式，基于DNN算法进行特征提取的方式可以理解为深度的特征提取方式。这样，通过结合深度和广度的特征提取方式，可以更好的获取用户的偏好信息。

上述输出层可以采用softmax构建，计算每一用户与每一物品之间的喜爱程度的概率，获得上述生成向量；上述输出层也可以采用concat层，用于对各向量进行拼接，获得用于表示每一用户与每一物品之间的喜爱程度的生成向量。

可选地，上述生成向量也可以称之为用户偏好序列，基于生成网络得到的用户偏好序列与真实序列的近似程度，决定着生成网络性能的优劣。由此可得生成网络的损失函数L_G为：

其中，γ_α是生成网络的正则化系数，P_T是真实序列，P_G是生成网络得到的用户偏好序列，即上述生成向量。可选地，上述真实序列可以理解为基于上述样本数据确定的用户真实的喜爱序列，具体可以通过真实向量表示。上述i表示某一个物品对应的生成向量，j表示某一个物品的真实向量，(i,j|u)可以理解为：用户u关联的某一物品对应的生成向量和用户u关联的某一物品对应的真实向量。

步骤103，利用所述生成向量对所述判别网络进行训练，获得生成对抗网络模型。

本申请实施例中，可以使用贝叶斯个性化排序(Bayesian PersonalizedRanking,以下简称BPR)算法作为判别网络，用于区分真实向量和生成向量。应理解，判别网络进行训练的训练方式可以根据实际需要进行设置，例如，在一些实施例中，可以采用梯度训练的方式对判别网络进行训练。在对所述判别网络进行梯度训练的过程中，基于判别网络的梯度对生成向量进行训练。

本申请实施例通过利用生成网络对用户数据和对象数据进行了深度和广度的特征提取，使得训练好的生成网络可以更好的获取用户的偏好信息，因此，从而使用生成网络进行信息推荐时，可以提高生成网络预测能力。

可选地，在一些实施例中，上述判别网络的输出D_β(i,j|u)满足：

其中，

代表用户u对i的喜爱程度，D_β(i,j|u)表示与j相比用户更偏爱i的概率，v_u和v_i分别是用户和物品的隐向量，b_i是物品的偏置表示。由此可得判别网络的损失函数为：

其中，γ_β是D的正则化系数。

上述生成网络可以由判别网络输出的梯度进行训练，采用梯度策略(PolicyGradient)方式优化生成网络，此时则有：

基于Policy Gradient的方法，使用

作为反馈结果，进而调整生成网络的网络参数。由于对数计算可能出现极值的情况，使训练过程不易收敛，因此可以采用

作为反馈结果指导网络参数的更新迭代。

判别网络依赖数据对<u,i,j>来训练，采用SGD方式优化模型：

其中，

表示生成值与真实值的差距。另外，依据

式中

满足：

可选地，在一些实施例中，所述利用所述生成向量对所述判别网络进行训练，获得生成对抗网络模型包括：

将所述生成向量与所述样本数据对应的真实向量进行组合，获得多个第一特征组合向量，所述第一特征组合向量包括用于表示用户的用户向量、一个所述生成向量和一个所述真实向量，所述真实向量用于表示用户的真实偏好序列；

按照预设的采样方式对所述多个第一特征组合向量进行采样，获得采样结果；

利用所述采样结果对所述判别网络进行训练。

本申请实施例中，上述第一特征组合向量可以通过<u,i,j>表示，即对真实向量和生成向量通过三元组的形式得到第一特征组合向量。其中i可以理解为生成网络生成的用户u对某一物品的喜爱程度的向量表示，j可以理解为基于样本数据确定的用户u对某一物品的真实喜爱程度的向量表示。

可选的，上述采样方式可以根据实际情况进行设置，例如，在一些实施例中上述采样方式满足：所述生成向量的数量大于所述真实向量的数量，例如，所述生成向量的数量与所述真实向量的数量的比值为预设比值。优选地，所述预设比值为2。具体地，可以通过获取一个j与2个i对应，使得所述生成向量的数量与所述真实向量的数量的比值为2，例如，可以通过<u,i₁,j>和<u,i₂,j>作为一次采样组合，保证所述生成向量的数量与所述真实向量的数量的比值为2。

可选的，采样时可以控制一半采样数据为热度靠前的物品对应的生成向量和真实向量，一半采样数据为热度靠后的物品对应的生成向量和真实向量。这样，可以使采样数据更加贴合用户的真实情况，使采样数据更能精确表示用户的偏好。

由于在信息推荐应用场景中，样本数据是离散的数据，造成推荐系统中的数据非常稀疏，在采样的过程中容易出现与用户没有交互的样本数据，这样会使得判别网络容易轻易分辨样本，导致判别网络无法反馈给生成网络供其训练学习，起不到模型训练的作用。本申请实施例中，通过设置生成向量(负例)的数量大于真实向量(正例)的数量，从而可以增加判别网络分辨的难度，有效缓解由于没有交互的样本数据导致出现判别网络容易轻易分辨样本的情况，因此可以有效提升判别网络的反馈，进而提升生成网络的性能。

可选地，在一些实施例中，所述将所述第一向量集和第二向量集输入生成网络，获得生成向量的步骤之前，所述方法还包括：

利用预训练数据分别对所述生成网络和所述判别网络进行预训练。

现有技术中，GAN网络具有许多优势，使其在很多领域发挥了巨大的作用。但是，GAN网络也存在着训练过程复杂的问题。

一：训练不稳定问题，容易出现震荡和收敛假象。因为判别网络损失降级会改善生成网络的损失，反之亦然，因此无法根据损失函数的值来判断收敛。

二：模型崩溃问题，GAN的训练过程可能发生崩溃问题，生成网络开始退化，总是生成同样的样本点，无法继续学习。当生成网络崩溃时，判别网络也会对相似的样本点指向相似的方向，训练无法继续。

在本申请实施例中，通过预训练来优化GAN网络的训练问题，即分别对生成网络和判别网络进行预训练。生成模型G是在DeepFM算法基础上完成的，该算法既可以作为特征提取器，也可以独立使用完成推荐过程，因此可以预训练生成模型G；判别模型D是在BPR算法基础上完成的，依据采样数据对的特点，可采用矩阵分解的方式预训练判别模型D。通过预训练，使得模型已经完成了初步学习，模型有了初步的收敛，也即模型的参数已经进行了初步调参，在后续训练时，只需对模型参数进行优化，不需要从初始参数开始调整模型参数了，从而解决了模型训练过程中容易出现震荡和收敛假象的问题；同时，通过提前学习知识，在进行模型训练时，也防止GAN网络训练过程中出现模型崩溃等问题，也即，模型预训练不但可以加快模型整体训练速度，而且解决了现有技术在GAN网络存在着训练过程复杂的问题。

在本申请实施例中，当生成网络和判别网络处于稳定状态时，生成对抗网络模型再依据对应的优化方式不断迭代持续优化，进一步提升网络的效果。

需要说明的是，本申请实施例中介绍的多种可选的实施方式，彼此可以相互结合实现，也可以单独实现，对此本申请实施例不作限定。

参照图4，本申请实施例还提供一种信息推荐方法，包括：

步骤401，将目标用户的用户数据和目标对象数据进行向量转换，获得第三向量集和第四向量集，所述第三向量集包括基于所述目标用户的用户数据转换获得的多个一阶特征向量，所述第四向量集包括基于所述目标对象数据转换获得的多个一阶特征向量；

步骤402，将所述第三向量集和第四向量集输入至通过生成对抗网络模型训练的生成网络，获得目标生成向量；

步骤403，基于所述目标生成向量确定是否向所述目标用户推荐所述目标对象数据。

本申请实施例中，上述生成网络是基于上述生成对抗网络模型的训练方法对待训练生成对抗网络模型进行训练获得的生成对抗网络中的生成网络。其中输出的目标向量可以表示目标用户喜欢目标对象数据的程度或概率，可以通过目标用户喜欢目标对象数据的程度或概率从而可以确定是否向目标用户推荐目标对象数据。

本申请实施例中，生成网络对第三向量集和第四向量集的处理过程可以参照上述实施例中生成网络对第一向量集和第二向量集的处理过程。可选地，所述生成网络包括分解机网络层、深度神经网络层和输出层，所述分解机网络层用于对所述一阶特征向量进行特征提取获得第一特征向量，以及对所述一阶特征向量进行两两组合后的二阶特征向量进行特征提取获得第二特征向量，所述深度神经网络层用于对基于所述一阶特征向量构建的高阶特征向量进行特征提取获得第三特征向量，所述输出层的输入为所述第一特征向量、第二特征向量和第三特征向量，所述输出层的输出为所述目标生成向量。

参见图5，图5是本申请实施例提供的生成对抗网络模型的训练装置的结构图，待训练对抗网络模型包括生成网络和判别网络，如图5所示，生成对抗网络模型的训练装置500包括：

第一转换模块501，用于将样本数据进行向量转换，获得第一向量集和第二向量集，所述样本数据包括用户数据和对象数据，所述第一向量集包括基于所述用户数据转换获得的多个一阶特征向量，所述第二向量集包括基于所述对象数据转换获得的多个一阶特征向量；

第一输入模块502，用于将所述第一向量集和第二向量集输入生成网络，获得生成向量，所述生成向量用于表示基于所述生成网络生成的用户偏好序列；

训练模块503，用于利用所述生成向量对所述判别网络进行训练，获得生成对抗网络模型；

可选地，所述训练模块503包括：

组合单元，用于将所述生成向量与所述样本数据对应的真实向量进行组合，获得多个第一特征组合向量，所述第一特征组合向量包括用于表示用户的用户向量、一个所述生成向量和一个所述真实向量，所述真实向量用于表示用户的真实偏好序列；

采样单元，用于按照预设的采样方式对所述多个第一特征组合向量进行采样，获得采样结果；

训练单元，用于利用所述采样结果对所述判别网络进行训练。

可选地，所述采样方式满足：所述生成向量的数量与所述真实向量的数量的比值为预设比值，优选地，所述预设比值为2。

可选地，所述生成对抗网络模型的训练装置还包括：

预训练模块，用于利用预训练数据分别对所述生成网络和所述判别网络进行预训练。

本申请实施例提供的电子设备能够实现图1的方法实施例中的各个过程，为避免重复，这里不再赘述。

参见图6，图6是本申请实施例提供的信息推荐装置的结构图，如图6所示，信息推荐装置600包括：

确定模块，用于基于所述目标生成向量确定是否向所述目标用户推荐所述目标对象数据。

可选地，所述生成网络包括分解机网络层、深度神经网络层和输出层，所述分解机网络层用于对所述一阶特征向量进行特征提取获得第一特征向量，以及对所述一阶特征向量进行两两组合后的二阶特征向量进行特征提取获得第二特征向量，所述深度神经网络层用于对基于所述一阶特征向量构建的高阶特征向量进行特征提取获得第三特征向量，所述输出层的输入为所述第一特征向量、第二特征向量和第三特征向量，所述输出层的输出为所述目标生成向量。

图7为实现本申请各个实施例的一种电子设备的硬件结构示意图。

该电子设备700包括但不限于：射频单元701、网络模块702、音频输出单元703、输入单元704、传感器705、显示单元706、用户输入单元707、接口单元708、存储器709、处理器710、以及电源711等部件。本领域技术人员可以理解，图7中示出的电子设备结构并不构成对电子设备的限定，电子设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。在本申请实施例中，电子设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。

其中，处理器710，用于执行以下操作：

将所述第一向量集和第二向量集输入生成网络，获得生成向量，所述生成向量用于表示基于所述生成网络生成的用户偏好序列；

或者，处理器710，用于执行以下操作：

基于所述目标生成向量确定是否向所述目标用户推荐所述目标对象数据。

本申请实施例通过由于利用生成网络对用户数据和对象数据进行了深度和广度的特征提取，使得训练好的生成网络可以更好的获取用户的偏好信息，因此，从而使用生成网络进行信息推荐时，可以提高生成网络预测能力。

应理解的是，本申请实施例中，射频单元701可用于收发信息或通话过程中，信号的接收和发送，具体的，将来自基站的下行数据接收后，给处理器710处理；另外，将上行的数据发送给基站。通常，射频单元701包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外，射频单元701还可以通过无线通信系统与网络和其他设备通信。

电子设备通过网络模块702为用户提供了无线的宽带互联网访问，如帮助用户收发电子邮件、浏览网页和访问流式媒体等。

音频输出单元703可以将射频单元701或网络模块702接收的或者在存储器709中存储的音频数据转换成音频信号并且输出为声音。而且，音频输出单元703还可以提供与电子设备700执行的特定功能相关的音频输出(例如，呼叫信号接收声音、消息接收声音等等)。音频输出单元703包括扬声器、蜂鸣器以及受话器等。

输入单元704用于接收音频或视频信号。输入单元704可以包括图形处理器(Graphics Processing Unit，GPU)7041和麦克风7042，图形处理器7041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元706上。经图形处理器7041处理后的图像帧可以存储在存储器709(或其它存储介质)中或者经由射频单元701或网络模块702进行发送。麦克风7042可以接收声音，并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元701发送到移动通信基站的格式输出。

电子设备700还包括至少一种传感器705，比如光传感器、运动传感器以及其他传感器。具体地，光传感器包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板7061的亮度，接近传感器可在电子设备700移动到耳边时，关闭显示面板7061和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别电子设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；传感器705还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等，在此不再赘述。

显示单元706用于显示由用户输入的信息或提供给用户的信息。显示单元706可包括显示面板7061，可以采用液晶显示器(Liquid Crystal Display，LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板7061。

用户输入单元707可用于接收输入的数字或字符信息，以及产生与电子设备的用户设置以及功能控制有关的键信号输入。具体地，用户输入单元707包括触控面板7071以及其他输入设备7072。触控面板7071，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板7071上或在触控面板7071附近的操作)。触控面板7071可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器710，接收处理器710发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板7071。除了触控面板7071，用户输入单元707还可以包括其他输入设备7072。具体地，其他输入设备7072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆，在此不再赘述。

进一步的，触控面板7071可覆盖在显示面板7061上，当触控面板7071检测到在其上或附近的触摸操作后，传送给处理器710以确定触摸事件的类型，随后处理器710根据触摸事件的类型在显示面板7061上提供相应的视觉输出。虽然在图7中，触控面板7071与显示面板7061是作为两个独立的部件来实现电子设备的输入和输出功能，但是在某些实施例中，可以将触控面板7071与显示面板7061集成而实现电子设备的输入和输出功能，具体此处不做限定。

接口单元708为外部装置与电子设备700连接的接口。例如，外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元708可以用于接收来自外部装置的输入(例如，数据信息、电力等等)并且将接收到的输入传输到电子设备700内的一个或多个元件或者可以用于在电子设备700和外部装置之间传输数据。

存储器709可用于存储软件程序以及各种数据。存储器709可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器709可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

处理器710是电子设备的控制中心，利用各种接口和线路连接整个电子设备的各个部分，通过运行或执行存储在存储器709内的软件程序和/或模块，以及调用存储在存储器709内的数据，执行电子设备的各种功能和处理数据，从而对电子设备进行整体监控。处理器710可包括一个或多个处理单元；优选的，处理器710可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器710中。

电子设备700还可以包括给各个部件供电的电源711(比如电池)，优选的，电源711可以通过电源管理系统与处理器710逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

另外，电子设备700包括一些未示出的功能模块，在此不再赘述。

优选的，本申请实施例还提供一种电子设备，包括处理器710，存储器709，存储在存储器709上并可在所述处理器710上运行的计算机程序，该计算机程序被处理器710执行时实现上述生成对抗网络模型的训练方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

本申请实施例还提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述生成对抗网络模型的训练方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。其中，所述的计算机可读存储介质，如只读存储器(Read-Only Memory，简称ROM)、随机存取存储器(Random AccessMemory，简称RAM)、磁碟或者光盘等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

上面结合附图对本申请的实施例进行了描述，但是本申请并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本申请的启示下，在不脱离本申请宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本申请的保护之内。

Claims

1.一种生成对抗网络模型的训练方法，其特征在于，待训练生成对抗网络模型包括生成网络和判别网络，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述利用所述生成向量对所述判别网络进行训练，获得生成对抗网络模型包括：

利用所述采样结果对所述判别网络进行训练，获得生成对抗网络模型。

3.根据权利要求2所述的方法，其特征在于，所述采样方式满足：所述生成向量的数量与所述真实向量的数量的比值为预设比值。

4.根据权利要求1所述的方法，其特征在于，所述将所述第一向量集和第二向量集输入生成网络，获得生成向量的步骤之前，所述方法还包括：

5.一种信息推荐方法，其特征在于，包括：

6.根据权利要求5所述的方法，其特征在于，所述通过生成对抗网络模型训练的生成网络是如权利要求1至4中任一项所述的生成对抗网络模型的训练方法训练得到的。

7.一种生成对抗网络模型的训练装置，其特征在于，待训练生成对抗网络模型包括生成网络和判别网络，所述装置包括：

8.一种信息推荐装置，其特征在于，包括：

9.一种电子设备，其特征在于，包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1至4中任一项所述的生成对抗网络模型的训练方法的步骤，或者所述计算机程序被所述处理器执行时实现如权利要求5至6中任一项所述的信息推荐方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1-4中任一项所述的生成对抗网络模型的训练方法的步骤，或者所述计算机程序被所述处理器执行时实现如权利要求5至6中任一项所述的信息推荐方法的步骤。