CN112287238A

CN112287238A - 用户特征的确定方法和装置、存储介质及电子设备

Info

Publication number: CN112287238A
Application number: CN202011596287.0A
Authority: CN
Inventors: 顾立瑞
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-12-30
Filing date: 2020-12-30
Publication date: 2021-01-29
Anticipated expiration: 2040-12-30
Also published as: CN112287238B

Abstract

本发明公开了一种用户特征的确定方法和装置、存储介质及电子设备。其中，该方法包括：通过两组训练样本分别训练双训练神经网络模型中的用户的训练神经网络模和媒体资源的神经网络模型，得到用户的目标神经网络模型和媒体资源的目标神经网络模型，通过用户的目标神经网络模型得到用于对目标用户与预设的媒体资源进行匹配的用户表征向量的目的，从而实现了根据用户的神经网络模型得到用于对目标用户与预设的媒体资源进行匹配的用户表征向量的技术效果，进而解决了由于用户特征信息挖掘不足，导致媒体资源推送精准度不高的技术问题。

Description

用户特征的确定方法和装置、存储介质及电子设备

技术领域

本发明涉及数据处理领域，具体而言，涉及一种用户特征的确定方法和装置、存储介质及电子设备。

背景技术

随着大数据的兴起，人们可以接收各个平台推送的各类媒体资源的，但媒体推送资源向用户推送媒体资源时，一般是根据用户的相关数据，为用户标记标签，根据用户标签推送对应的媒体资源。其中，用户标记标签通常是根据用户信息进行确定的，例如，分析用户最近一段时间内经常浏览的网页或点击的视频，确定出用户的标签信息。即分析出用户与那些物品或媒体资源关联性较大，进行向用户推送该物品的媒体资源。如，推送该物品的广告信息。

现有技术中，通过一个矩阵分解模型，只需要一个用户对物品的评分矩阵。针对不同的优化目标，曝光点击/点击转化的评分为1，曝光未点击/点击未转化的评分为0，生成用户对物品的评分矩阵。矩阵分解尝试使用K-因子模型找到User矩阵和Item矩阵，User矩阵的每一行即为用户的表征向量，Item矩阵的每一列即为物品的表征向量。这种做法，只使用的用户对物品的评分矩阵，效果不是很好，而且随着数据量增加以及分解的矩阵维度增加，模型耗时会快速增加。

针对上述的问题，目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种用户特征的确定方法和装置、存储介质及电子设备，以至少解决现有技术中，由于用户特征信息挖掘不足，导致媒体资源推送精准度低的技术问题。

根据本发明实施例的一个方面，提供了一种用户特征的确定方法，包括：获取一组第一训练样本、一组第二训练样本以及一组实际操作信息，其中，每个所述第一训练样本包括样本用户的属性信息，每个所述第二训练样本包括一个样本媒体资源的属性信息，每个所述实际操作信息用于表示所述样本用户对对应的一个样本媒体资源的实际操作；使用所述一组第一训练样本、所述一组第二训练样本以及所述一组实际操作信息对双训练神经网络模型中的第一训练神经网络模型和第二训练神经网络模型进行训练，得到对应的第一目标神经网络模型和第二目标神经网络模型，其中，所述第一训练神经网络模型用于根据输入的所述第一训练样本输出所述样本用户的训练用户表征向量，所述第二训练神经网络模型用于根据输入的所述第二训练样本输出所述样本媒体资源的训练资源表征向量，所述一组实际操作信息、所述训练用户表征向量和所述训练资源表征向量用于对所述第一训练神经网络模型和所述第二训练神经网络模型进行调整；将目标用户的目标属性信息输入到所述第一目标神经网络模型，得到所述第一目标神经网络模型输出的所述目标用户的目标用户表征向量，其中，所述目标用户表征向量用于对所述目标用户与预设的媒体资源进行匹配。

根据本发明实施例的另一方面，还提供了一种用户特征的确定装置，包括：第一获取单元，用于获取一组第一训练样本、一组第二训练样本以及一组实际操作信息，其中，每个所述第一训练样本包括样本用户的属性信息，每个所述第二训练样本包括一个样本媒体资源的属性信息，每个所述实际操作信息用于表示所述样本用户对对应的一个样本媒体资源的实际操作；训练单元，用于使用所述一组第一训练样本、所述一组第二训练样本以及所述一组实际操作信息对双训练神经网络模型中的第一训练神经网络模型和第二训练神经网络模型进行训练，得到对应的第一目标神经网络模型和第二目标神经网络模型，其中，所述第一训练神经网络模型用于根据输入的所述第一训练样本输出所述样本用户的训练用户表征向量，所述第二训练神经网络模型用于根据输入的所述第二训练样本输出所述样本媒体资源的训练资源表征向量，所述一组实际操作信息、所述训练用户表征向量和所述训练资源表征向量用于对所述第一训练神经网络模型和所述第二训练神经网络模型进行调整；确定单元，用于将目标用户的目标属性信息输入到所述第一目标神经网络模型，得到所述第一目标神经网络模型输出的所述目标用户的目标用户表征向量，其中，所述目标用户表征向量用于对所述目标用户与预设的媒体资源进行匹配。

根据本发明实施例的又一方面，还提供了一种计算机可读的存储介质，该计算机可读的存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述用户特征的确定方法。

根据本发明实施例的又一方面，还提供了一种电子设备，包括存储器和处理器，上述存储器中存储有计算机程序，上述处理器被设置为通过所述计算机程序执行上述的用户特征的确定方法。

根据本发明实施例的又一方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述用户特征的确定方面或者用户特征的确定方面的各种可选实现方式中提供的用户特征的确定方法。

在本发明实施例中，通过获取一组第一训练样本、一组第二训练样本以及一组实际操作信息，其中，每个第一训练样本包括样本用户的属性信息，每个第二训练样本包括一个样本媒体资源的属性信息，每个实际操作信息用于表示样本用户对对应的一个样本媒体资源的实际操作；使用一组第一训练样本、一组第二训练样本以及一组实际操作信息对双训练神经网络模型中的第一训练神经网络模型和第二训练神经网络模型进行训练，得到对应的第一目标神经网络模型和第二目标神经网络模型，其中，第一训练神经网络模型用于根据输入的第一训练样本输出样本用户的训练用户表征向量，第二训练神经网络模型用于根据输入的第二训练样本输出样本媒体资源的训练资源表征向量，一组实际操作信息、训练用户表征向量和训练资源表征向量用于对第一训练神经网络模型和第二训练神经网络模型进行调整；将目标用户的目标属性信息输入到第一目标神经网络模型，得到第一目标神经网络模型输出的目标用户的目标用户表征向量，其中，目标用户表征向量用于对目标用户与预设的媒体资源进行匹配，达到了通过两组训练样本分别训练双训练神经网络模型中的用户的训练神经网络模和媒体资源的神经网络模型，得到用户的目标神经网络模型和媒体资源的目标神经网络模型，通过用户的目标神经网络模型得到用于对目标用户与预设的媒体资源进行匹配的用户表征向量的目的，从而实现了根据用户的神经网络模型得到用于对目标用户与预设的媒体资源进行匹配的用户表征向量的技术效果，进而解决了由于用户特征信息挖掘不足，导致媒体资源推送精准度低的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明实施例的一种可选的用户特征的确定方法的应用环境的示意图；

图2是根据本发明实施例的一种可选的用户特征的确定方法的流程图；

图3是根据本发明实施例的一种可选的基于双塔神经网络模型的用户隐式特征挖掘方法的流程图；

图4是根据本发明实施例的一种可选的双塔神经网络模型的流程图；

图5是根据本发明实施例的一种可选的不同维度的embedding特征的效果示意图；

图6是根据本发明实施例的一种可选的用户特征的确定装置的结构示意图；

图7是根据本发明实施例的一种可选的电子设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为了更好的理解本申请，对部分名词解释如下：

隐式特征：是一种特征表征形式。相对于显示特征，其每一维度特征都具有不可解释性，是一个embedding表征向量。

双塔模型：是一种深度模型结构。分为用户塔和物品塔，分别对用户特征和物品特征做多层表征，最终在输出层求出用户对物品的点击率。

根据本发明实施例的一个方面，提供了一种用户特征的确定方法，可选地，作为一种可选的实施方式，上述用户特征的确定方法可以但不限于应用于如图1所示的环境中。终端102、网络104以及服务器106。

服务器106可以通过网络104从终端102中获取一组第一训练样本、一组第二训练样本以及一组实际操作信息，其中，每个第一训练样本包括样本用户的属性信息，每个第二训练样本包括一个样本媒体资源的属性信息，每个实际操作信息用于表示样本用户对对应的一个样本媒体资源的实际操作，服务器106使用一组第一训练样本、一组第二训练样本以及一组实际操作信息对双训练神经网络模型中的第一训练神经网络模型和第二训练神经网络模型进行训练，得到对应的第一目标神经网络模型和第二目标神经网络模型，其中，第一训练神经网络模型用于根据输入的第一训练样本输出样本用户的训练用户表征向量，第二训练神经网络模型用于根据输入的第二训练样本输出样本媒体资源的训练资源表征向量，一组实际操作信息、训练用户表征向量和训练资源表征向量用于对第一训练神经网络模型和第二训练神经网络模型进行调整；将目标用户的目标属性信息输入到第一目标神经网络模型，得到第一目标神经网络模型输出的目标用户的目标用户表征向量，其中，目标用户表征向量用于对目标用户与预设的媒体资源进行匹配，达到了通过两组训练样本分别训练双训练神经网络模型中的用户的训练神经网络模和媒体资源的神经网络模型，得到用户的目标神经网络模型和媒体资源的目标神经网络模型，通过用户的目标神经网络模型得到用于对目标用户与预设的媒体资源进行匹配的用户表征向量的目的，从而实现了根据用户的神经网络模型得到用于对目标用户与预设的媒体资源进行匹配的用户表征向量的技术效果，进而解决了由于用户特征信息挖掘不足，导致媒体资源推送精准度低的技术问题。

其中，上述用户特征的确定方法可以由终端102完成，也可以有服务器106完成、也可以通过终端102与服务器106共同完成。上述仅是一种示例，本实施例中对此不作任何限定。

可选地，在本实施例中，上述终端设备可以是配置有目标客户端的终端设备，可以包括但不限于以下至少之一：手机（如Android手机、iOS手机等）、笔记本电脑、平板电脑、掌上电脑、MID（Mobile Internet Devices，移动互联网设备）、PAD、台式电脑、智能电视等。目标客户端可以是视频客户端、即时通信客户端、浏览器客户端、教育客户端等。上述网络可以包括但不限于：有线网络，无线网络，其中，该有线网络包括：局域网、城域网和广域网，该无线网络包括：蓝牙、WIFI及其他实现无线通信的网络。上述服务器可以是单一服务器，也可以是由多个服务器组成的服务器集群，或者是云服务器。上述仅是一种示例，本实施例中对此不作任何限定。

可选地，作为一种可选的实施方式，如图2所示，上述用户特征的确定方法包括：

步骤S202，获取一组第一训练样本、一组第二训练样本以及一组实际操作信息，其中，每个第一训练样本包括样本用户的属性信息，每个第二训练样本包括一个样本媒体资源的属性信息，每个实际操作信息用于表示样本用户对对应的一个样本媒体资源的实际操作。

步骤S204，使用一组第一训练样本、一组第二训练样本以及一组实际操作信息对双训练神经网络模型中的第一训练神经网络模型和第二训练神经网络模型进行训练，得到对应的第一目标神经网络模型和第二目标神经网络模型，其中，第一训练神经网络模型用于根据输入的第一训练样本输出样本用户的训练用户表征向量，第二训练神经网络模型用于根据输入的第二训练样本输出样本媒体资源的训练资源表征向量，一组实际操作信息、训练用户表征向量和训练资源表征向量用于对第一训练神经网络模型和第二训练神经网络模型进行调整。

步骤S206，将目标用户的目标属性信息输入到第一目标神经网络模型，得到第一目标神经网络模型输出的目标用户的目标用户表征向量，其中，目标用户表征向量用于对目标用户与预设的媒体资源进行匹配。

可选的，在本实施例中，通过上述用户特征的确定方法可以包括但不限于使用更多的数据源、更有效的数据挖掘算法，挖掘出更多更好的特征，确定的用户特征可以包括但不限于用于在广告在线系统和广告离线系统上，提升媒体资源的点击率预测（PredictClick-Through-Rate，简称为pCTR）/转化率预测（Predict Click Value Rate，简称为pCVR）准确的效果，同时显著提升标签量级。

其中，在本实施例中，上述双训练神经网络模型可以包括但不限于双塔模型，双训练神经网络模型包括两支神经网络模型，一支神经网络模型是基于用户数据用于获取用户表征向量，一支神经网络模型是基于资源数据获取资源表征向量。上述媒体资源可以包括但不限于广告资源、视频资源、图片资源等等。上述双训练神经网络模型可以理解为双塔模型。

以广告资源为例，上述实际操作信息可以包括但不限于用户点击曝光的媒体资源，用户未点击曝光的媒体资源，上述一个样本媒体资源的属性信息包括但不限于广告资源曝光且被点击，广告资源曝光未被点击等实际操作。上述目标用户的属性信息可以包括广告资源曝光且点击的用户、广告资源曝光未点击的用户。

在本实施例中，一组第一训练样本数据包括但不限于用户兴趣数据，扣费数据，其中，兴趣数据可以包括商业兴趣，营销兴趣，手机app兴趣，媒体兴趣，商圈类目兴趣等等，维度超过1万维；扣费数据为用户在每个站点*每个行业上的扣费信息，共有1千多维；上述一组第一训练样本用于训练双神经网络中的第一训练神经网络模型（用户塔），第一训练神经网络模型用于得到样本用户的训练用户表征向量；一组第二训练样本数据包括但不限于广告数据，广告数据可以包括广告基础属性，广告长度，平均浏览时长，点击数，曝光数等，维度超过1w维；上述一组第二训练样本用于训练双神经网络中的第二训练神经网络模型（物品塔），第二训练神经网络模型用于得到媒体资源的训练资源表征向量。

需要说明的是，在本实施例中，将目标用户的目标属性信息输入到第一目标神经网络模型，得到第一目标神经网络模型输出的目标用户的目标用户表征向量，其中，目标用户表征向量用于对目标用户与预设的媒体资源进行匹配。也就是说，在本实施例中，通过一个双神经网络模型（双塔模型），在第一目标神经网络模型（用户塔）和第二神经网络模型（物品塔）分别对用户和物品做embedding表征，把用户塔部分中间隐层拿出来作为用户的表征向量。从而根据用户表征向量对用户与预设的媒体资源进行匹配，进一步的，可以根据匹配结果确定向用户推荐的媒体资源，由于根据双神经网络模型可以得到用户更多的隐性特征，从而可以向用户精准投放媒体资源，提高媒体资源的曝光率以及通过媒体资源的转化率。

还需要说明的是，上述一组第一训练样本可以包括到不限于一个用户的一组属性信息、多个用户对应的多组属性信息，例如，用户ID1的属性信息S1（a，b，c，d，e），即用户包括5个属性信息。上述一组第二训练样本可以包括多个媒体资源对应的多组媒体资源的属性信息。

在本实施例中，上述训练样本的数据可以存储在分布式数据仓库，分布是数据仓库具有高可用性和高可伸缩性，用于海量数据存储和海量数据分析的分布式数据处理系统。它向用户提供类似SQL的接口，可以提供PB级的存储和TB级的计算能力，来满足日益增长的海量数据分析需求，帮助发现更多用户价值。

在本实施例中，一条训练样本可以表示一个用户对一条广告的曝光/点击/转化行为，包含：1.label：曝光且点击/点击且转化为1；曝光未点击/点击未转化为0；2.feature：用户特征（用户侧的画像和兴趣等特征）；广告特征（广告侧的基础属性和一些基于文本和图片提取的特征）。将这两部分特征拼接在一起。

可选的，在本实施例中，使用一组第一训练样本、一组第二训练样本以及一组实际操作信息对双训练神经网络模型中的第一训练神经网络模型和第二训练神经网络模型进行训练，得到对应的第一目标神经网络模型和第二目标神经网络模型，包括：

S1，将一组第一训练样本中当前的第一训练样本输入到第一训练神经网络模型中，得到第一训练神经网络模型输出的样本用户的第一训练用户表征向量，将一组第二训练样本中当前的第二训练样本输入到第二训练神经网络模型中，得到第二训练神经网络模型输出的第一样本媒体资源的第二训练资源表征向量，其中，当前的第一训练样本包括样本用户的当前属性信息，当前的第二训练样本包括第一样本媒体资源的当前属性信息；

S2，对第一训练表征向量与第二训练表征向量进行匹配，得到第一预测操作信息，其中，第一预测操作信息用于表示样本用户对第一样本媒体资源的预测操作；

S3，在第一预测操作信息与一组实际操作信息中对应的第一实际操作信息不满足预设的损失条件的情况下，对双训练神经网络模型中的第一训练神经网络模型和第二训练神经网络模型进行调整。

在本实施例中，损失条件可以是损失函数满足的条件，损失函数是用来估量模型的预测值与真实值的不一致程度，它是一个非负实值函数，损失函数越小，模型的鲁棒性就越好。训练模型的过程，就是不断的迭代计算，在迭代计算的过程中，可以使用梯度下降的优化算法，使得损失函数越来越小。其中，梯度下降是一种使损失函数越来越小的优化算法，可以在无求解机器学习算法的模型参数，即约束优化问题。

在本实施例中，可以调整双训神经网络模型中的模型参数，例如，参数的取值，可以采用梯度下降的方法调整模型参数的取值，使得预测和实际之间的损失函数的取值变小，进而完成双训练神经网络模型中的第一训练神经网络模型和第二训练神经网络模型进行调整。

在本实施例中，根据第一训练样本训练第一神经网络模型，根据第二训练样本训练第二神经模型。需要说明的是，第一神经网络模型可以理解为双塔神经网络模型中的用户塔，第二神经网络可以理解为双塔神经网络模型中的物品塔。

在实际应用中，双神经网络模型可以包括输入层、投影层以及输出层。其在双神经网络模型训练的过程可以如下：

首先是输入层，用户塔的输入包含：用户最近30天中每天的广告扣费数据等序列型特征；用户商业兴趣，营销兴趣等离散型特征；用户媒体兴趣，商圈类目兴趣等连续性特征。物品塔的输入包含：广告的一级分类，二级分类等离散型特征，广告长度，平均浏览时长，点击数，曝光数等连续性特征。2）然后是投影层，序列型特征和离散型特征在被嵌入成向量后，序列向量会输送给序列特征提取模块进行序列信息抽取，离散型特征会输送给特征交叉模块进行特征交叉。将序列表征向量（物品塔侧没有序列）、交叉表征和连续型特征拼接起来并输送给多层全连接层进行矩阵变换，进而将用户侧的用户表征向量和物品侧的物品表征向量映射至统一语义空间。3）最后在输出层，用户侧的用户表征向量和物品侧的物品表征向量映射至统一语义空间后，并经过L2正则化，两者向量再通过点积运算进行交互匹配，最终通过Sigmoid函数进行缩放。最终把用户塔部分中间隐层确作为用户的表征向量。

其中，在第一预测操作信息与一组实际操作信息中对应的第一实际操作信息满足损失条件的情况下，结束对双训练神经网络模型中的第一训练神经网络模型和第二训练神经网络模型进行的训练，其中，结束训练时的第一训练神经网络模型为第一目标神经网络模型，结束训练时的第二训练神经网络模型为第二目标神经网络模型。

在本实施例中，用户的一组时间操作信息是预先对样本数据标注得到的实际操作信息，例如，标记用户点击媒体资源的标注，没有点击媒体资源的标注，媒体资源AD1标注为点击的媒体资源，AD2标注为未点击的媒体资源。在第一预测操作信息与一组实际操作信息中对应的第一实际操作信息满足损失条件的情况下，结束对双训练神经网络模型中的第一训练神经网络模型和第二训练神经网络模型进行的训练，得到该参数状态下的双神经网络模型为训练好的神经网络模型。

通过本申请提供的实施例，获取一组第一训练样本、一组第二训练样本以及一组实际操作信息，其中，每个第一训练样本包括样本用户的属性信息，每个第二训练样本包括一个样本媒体资源的属性信息，每个实际操作信息用于表示样本用户对对应的一个样本媒体资源的实际操作；使用一组第一训练样本、一组第二训练样本以及一组实际操作信息对双训练神经网络模型中的第一训练神经网络模型和第二训练神经网络模型进行训练，得到对应的第一目标神经网络模型和第二目标神经网络模型，其中，第一训练神经网络模型用于根据输入的第一训练样本输出样本用户的训练用户表征向量，第二训练神经网络模型用于根据输入的第二训练样本输出样本媒体资源的训练资源表征向量，一组实际操作信息、训练用户表征向量和训练资源表征向量用于对第一训练神经网络模型和第二训练神经网络模型进行调整；将目标用户的目标属性信息输入到第一目标神经网络模型，得到第一目标神经网络模型输出的目标用户的目标用户表征向量，其中，目标用户表征向量用于对目标用户与预设的媒体资源进行匹配，达到了通过两组训练样本分别训练双训练神经网络模型中的用户的训练神经网络模和媒体资源的神经网络模型，得到用户的目标神经网络模型和媒体资源的目标神经网络模型，通过用户的目标神经网络模型得到用于对目标用户与预设的媒体资源进行匹配的用户表征向量的目的，从而实现了根据用户的神经网络模型得到用于对目标用户与预设的媒体资源进行匹配的用户表征向量的技术效果，进而解决了由于用户特征信息挖掘不足，导致媒体资源推送精准度不高的技术问题。

可选的，将一组第一训练样本中当前的第一训练样本输入到第一训练神经网络模型中，得到第一训练神经网络模型输出的样本用户的第一训练用户表征向量，可以包括：根据当前的第一训练样本中的序列型数据、离散型数据和连续型数据，获取样本用户的第一序列型特征、第一离散型特征和第一连续型特征；将第一序列型特征转换为第一序列向量，并将第一离散型特征转换为第一离散向量；对第一序列向量进行序列信息抽取，得到序列表征特征；对第一离散向量进行特征交叉，得到第一交叉表征特征；根据序列表征特征、第一交叉表征特征和第一连续型特征，确定第一训练用户表征向量。

在本实施例中，序列型数据可以包括但不限于用户在过去一个月中每天或每周点击浏览不同的物品，并且这些物品一般都会有三级分类，我们分别以各级分类，来提取用户在时间序列上的不同类目的物品点击浏览特征。离散型数据可以包括但不限于用户性别、省份、城市、手机品牌、受教育程度等。连续型数据可以包括但不限于用户的年龄，物品的平均浏览时长，点击数，曝光数等。

可选的，根据序列表征特征、第一交叉表征特征和第一连续型特征，确定第一训练用户表征向量，可以包括：将序列表征向量、第一交叉表征特征和第一连续型特征进行拼接，得到第一拼接特征；第一拼接特征输入到第一全连接层，得到第一全连接层输出的第一训练用户表征向量。

可选的，将一组第二训练样本中当前的第二训练样本输入到第二训练神经网络模型中，得到第二训练神经网络模型输出的第一样本媒体资源的第二训练资源表征向量，可以包括：根据当前的第二训练样本中的离散型数据和连续型数据，获取第一样本媒体资源的第二离散型特征和第二连续型特征；将第二离散型特征转换为第二离散向量；对第二离散型向量进行特征交叉，得到第二交叉表征特征；根据第二交叉表征特征和第二连续型特征，确定第二训练资源表征向量。

可选的，根据第二交叉表征特征和第一连续型特征，确定第二训练资源表征向量，可以包括：将第二交叉表征特征和第一连续型特征，确定第二训练资源表征向量进行拼接，得到第二拼接特征；将第二拼接特征输入到第二全连接层，得到第二全连接层输出的第二训练资源表征向量。

可选的，获取一组第一训练样本、一组第二训练样本以及一组实际操作信息，可以包括：获取样本用户的一组序列型数据、一组离散型数据和一组连续型数据，得到一组第一训练样本；获取一组样本媒体资源中的每个样本媒体资源的一组离散型数据和一组连续型数据，得到一组第二训练样本。

可选的，上述方法还可以包括：将目标用户的目标表征向量与待推荐的目标媒体资源的目标资源表征向量进行匹配；在目标表征向量与目标资源表征向量匹配的情况下，将目标媒体资源确定为待推荐给目标用户的媒体资源。

可选的，上述方法还可以包括：将目标媒体资源的属性信息输入到第二目标神经网络模型，得到第二目标神经网络模型输出的目标媒体资源的目标资源表征向量，其中，目标资源表征向量用于对目标媒体资源与预设的用户进行匹配。

可选地，作为一种可选的实施方式，本申请还提供了一种基于双塔模型的用户隐式特征挖掘方法。

在本实施例中，通过一个双塔神经网络模型，以用户兴趣数据，扣费数据，广告数据为数据输入，以真实的用户曝光点击/曝光未点击，点击转化/点击未转化行为为优化目标，通过双塔神经模型的训练和预测，把用户塔部分的用户表征向量作为用户的隐式特征。如图3所示，基于双塔神经网络模型的用户隐式特征挖掘方法的流程图。具体过程如下。

步骤S31，数据输入；

将获取的扣费数据、广告数据以及兴趣数据输入至双塔神经网络模型（相当于上述双训练神经网络模型）。

其中，在数据输入前，需要对数据积累。

在本实施例中，主要使用用户兴趣数据，扣费数据，广告数据这三种。其中，兴趣数据包括商业兴趣，营销兴趣，手机app兴趣，媒体兴趣，商圈类目兴趣等等，维度超过1万维；扣费数据为用户在每个站点*每个行业上的扣费信息，共有1千多维；广告数据包括广告基础属性，广告长度，平均浏览时长，点击数，曝光数等，维度超过1w维；将用户兴趣数据，扣费数据，广告数据作为双塔模型的特征输入。其中，可以将用户兴趣数据、扣费数据输入到双塔模型中的用户塔（第一训练神经网络），将广告数据输入到物品塔（第二训练神经网络）。

步骤S32，样本生成；

根据步骤S31中的输入的数据生成正负样本，训练集和验证集，其中，训练集用于训练双塔神经网络，验证集用于对训练好的双塔神经网络进行验证，其中，可以将样本数据按照1：1方式划分为训练集合验证集，即样本数据中的一半的数据作为训练集，一半的数据作为验证集，上述样本数据的划分仅是一种示实例，在本实施例中不做具体限定。

需要说明的是，在步骤S32样本生成阶段，对于不同的优化目标，对正负样本定义方式有所不同。

如当优化pCTR时，正样本为曝光且点击用户，负样本为曝光未点击用户；当优化pCVR时，正样本为点击且转化用户，负样本为点击未转化用户，其中，正负样本作为训练数据输入至双塔神经网络模型中。

由于在线网络正负样本生成过程中，正样本明显少于负样本，所以为典型非均衡数据集，那么当正样本过少时，需要对其进行过采样，当负样本过多时，要对其欠采样。通过对比不同正负样本比例的实验效果，将正负样本比例设置为1:5。

在模型训练和评估过程中，如果样本个数过少，可能会导致模型训练不充分；样本数据太多，会增加模型训练耗时。经过评估，将正样本个数设置在10万到40万。并且这里为了防止特征信息泄露，在选择获取样本的日期为特征日期之后3天。

步骤S33，特征抽取；

在本实施例中，使用双塔神经网络模型来进行特征抽取。如图4所示，双塔神经网络模型的流程图。

双塔神经网络模型自下而上主要包括：输入层、投影层和输出层，自左至右分为：用户塔和物品塔，将用户侧的表征向量和物品侧的表征向量进行点积运算得到最终的输出。

1）输入层，用户塔的输入包含：用户最近30天中每天的广告扣费数据等序列型特征；用户商业兴趣，营销兴趣等离散型特征；用户媒体兴趣，商圈类目兴趣等连续性特征。物品塔的输入包含：广告的一级分类，二级分类等离散型特征，广告长度，平均浏览时长，点击数，曝光数等连续性特征。

2）投影层，序列型特征和离散型特征在被嵌入成向量后，序列向量会输送给序列特征提取模块进行序列信息抽取，离散型特征会输送给特征交叉模块进行特征交叉。将序列表征向量（物品塔侧没有序列）、交叉表征和连续型特征拼接起来并输送给多层全连接层进行矩阵变换，进而将用户侧的用户表征向量和物品侧的物品表征向量映射至统一语义空间。

其中，特征交叉模块在原始双塔模型中，模型并不能显式的构造高阶交叉特征，如果需要引入交叉特征，则需要人工的设计特征交叉。面对大量的高维稀疏特征，存在了大量的交叉组合方式，人工的设计特征交叉，不仅需要消耗大量的人力和尝试成本，而且容易遗漏部分重要的交叉特征。基于以上的问题，针对显式的构造高阶交叉特征方面，在本实施例中，双塔模型中进行了网络结构的改造，使用DCN式交叉（Cross Network）。

在本实施例中，在双塔模型的双边特征交叉模块均尝试了DCN式交叉，将输入进来的离散值特征的embedding铺平拼接起来，再输送给Cross Network进行特征的显式高阶交叉，将高阶表征作为后续的一部分输入。并通过变化Cross Layer的层数来调整特征交叉的阶数。

其中，序列特征提取在最初的双塔模型中，模型不能很好的处理序列特征，如果需要引入序列数据，需要对序列数据进行人工的特征提取，做成离散型特征或者连续型特征。人工的特征提取往往带来了很多局限性，不同的序列数据中往往蕴含着不同的信息规律，人工提取的方式难以真正捕获到这些语义内涵。为了解决这些问题，在本实施例中，在双塔模型中引入了对序列数据进行特征提取的网络模块，使得模型能够自动的挖掘序列数据中蕴含的信息，在优化过程中主要尝试了Transformer。

Transformer结构，其能捕获序列数据中物品与物品之间的关联性，进而学习出更深层次的表征向量。在Transformer中，输入矩阵E主要通过两个步骤的计算得到输出Y，分别是：Multi-Head Self-Attention和Feed Forward Network。

通过引入Transformer结构进行序列数据的特征提取，可以对序列中的任意两个物品通过自注意力计算直接联系起来，更容易捕获那些深层次的相互依赖的隐含信息。

3）输出层，用户侧的用户表征向量和物品侧的物品表征向量映射至统一语义空间后，并经过L2正则化，两者向量再通过点积运算进行交互匹配，最终通过Sigmoid函数进行缩放。

最终把用户塔部分中间隐层拿出来作为用户的表征向量。

需要说明的是，在本实施例中，双塔神经网路模型可以设置用户embedding特征的输出维度，如图5所示，不同维度的embedding特征的效果示意图。

步骤S34，特征压缩；

在特征压缩阶段，为了特征能够入TDE，再对embedding特征进行一个低损压缩，在尽可能减少特征损失的前提下，尽可能的压缩数据大小。

步骤35，效果评估。

在效果评估阶段，离线评估主要对比新特征对模型的auc（Area Under Curve）提升等指标，在线评估主要对比新特征在线网络广告消耗点击率（Click-Through-Rate，简称为CTR）/转化率（Click Value Rate，简称为CVR）等的指标提升。

通过本申请提供的实施例，通过一个双塔神经网络模型，在用户塔和物品塔分别对用户和物品做embedding表征，把用户塔部分中间隐层拿出来作为用户的表征向量，使用本申请中对用户隐式特征进行挖掘，特征用户广告在线系统的模型当中，提高广告信息的点击量，以及广告的转化。

需要说明的是，现有技术中，使用双塔神经网络模型，一般都是作为分类模型预测用户做什么事情的概率，使用的是双塔神经网络模型的output。

在本实施例中，上述通过双塔神经网络模型挖掘用户隐式特征，把双塔神经网络模型的用户塔部分的User Represention拿出来作为用户的embedding特征，更有利于投放广告的曝光、点击。

在本实施例中，双塔神经网络模型的特征输入，也使用了较多的特征，使用用户兴趣数据，扣费数据，广告数据这三种。其中，兴趣数据包括商业兴趣，营销兴趣，手机app兴趣，媒体兴趣，商圈类目兴趣等等，维度超过1万维；扣费数据为用户在每个站点*每个行业上的扣费信息，共有1千多维；广告数据包括广告基础属性，广告长度，平均浏览时长，点击数，曝光数等，维度超过1w维；将用户兴趣数据，扣费数据，广告数据作为双塔模型的特征输入。更加精确广告的投放。

还需要说明的是，现有技术中，通过一个矩阵分解模型，只需要一个用户对物品的评分矩阵。针对不同的优化目标，曝光点击/点击转化的评分为1，曝光未点击/点击未转化的评分为0，生成用户对物品的评分矩阵。矩阵分解尝试使用K-因子模型找到User矩阵和Item矩阵，User矩阵的每一行即为用户的表征向量，Item矩阵的每一列即为物品的表征向量。这种做法，只使用的用户对物品的评分矩阵，并没有使用用户特征和物品特征，以及用户和物品相结合的特征，所以效果不是很好，而且随着数据量增加以及分解的矩阵维度增加，模型耗时会快速增加。本实施例中，使用用户特征和物品特征，以及用户和物品相结合的特征，提供高了模型的精确性。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。

根据本发明实施例的另一个方面，还提供了一种用于实施上述用户特征的确定方法的用户特征的确定装置。如图6所示，该用户特征的确定装置包括：第一获取单元61、训练单元63以及确定单元65。

第一获取单元61，用于获取一组第一训练样本、一组第二训练样本以及一组实际操作信息，其中，每个第一训练样本包括样本用户的属性信息，每个第二训练样本包括一个样本媒体资源的属性信息，每个实际操作信息用于表示样本用户对对应的一个样本媒体资源的实际操作。

训练单元63，用于使用一组第一训练样本、一组第二训练样本以及一组实际操作信息对双训练神经网络模型中的第一训练神经网络模型和第二训练神经网络模型进行训练，得到对应的第一目标神经网络模型和第二目标神经网络模型，其中，第一训练神经网络模型用于根据输入的第一训练样本输出样本用户的训练用户表征向量，第二训练神经网络模型用于根据输入的第二训练样本输出样本媒体资源的训练资源表征向量，一组实际操作信息、训练用户表征向量和训练资源表征向量用于对第一训练神经网络模型和第二训练神经网络模型进行调整。

确定单元65，用于将目标用户的目标属性信息输入到第一目标神经网络模型，得到第一目标神经网络模型输出的目标用户的目标用户表征向量，其中，目标用户表征向量用于对目标用户与预设的媒体资源进行匹配。

可选的，上述训练单元63，可以包括：训练模块，用于将一组第一训练样本中当前的第一训练样本输入到第一训练神经网络模型中，得到第一训练神经网络模型输出的样本用户的第一训练用户表征向量，将一组第二训练样本中当前的第二训练样本输入到第二训练神经网络模型中，得到第二训练神经网络模型输出的第一样本媒体资源的第二训练资源表征向量，其中，当前的第一训练样本包括样本用户的当前属性信息，当前的第二训练样本包括第一样本媒体资源的当前属性信息；匹配模块，用于对第一训练表征向量与第二训练表征向量进行匹配，得到第一预测操作信息，其中，第一预测操作信息用于表示样本用户对第一样本媒体资源的预测操作；调整模块，用于在第一预测操作信息与一组实际操作信息中对应的第一实际操作信息不满足预设的损失条件的情况下，对双训练神经网络模型中的第一训练神经网络模型和第二训练神经网络模型进行调整。

通过本申请提供的实施例，第一获取单元61获取一组第一训练样本、一组第二训练样本以及一组实际操作信息，其中，每个第一训练样本包括样本用户的属性信息，每个第二训练样本包括一个样本媒体资源的属性信息，每个实际操作信息用于表示样本用户对对应的一个样本媒体资源的实际操作；训练单元63使用一组第一训练样本、一组第二训练样本以及一组实际操作信息对双训练神经网络模型中的第一训练神经网络模型和第二训练神经网络模型进行训练，得到对应的第一目标神经网络模型和第二目标神经网络模型，其中，第一训练神经网络模型用于根据输入的第一训练样本输出样本用户的训练用户表征向量，第二训练神经网络模型用于根据输入的第二训练样本输出样本媒体资源的训练资源表征向量，一组实际操作信息、训练用户表征向量和训练资源表征向量用于对第一训练神经网络模型和第二训练神经网络模型进行调整；确定单元65将目标用户的目标属性信息输入到第一目标神经网络模型，得到第一目标神经网络模型输出的目标用户的目标用户表征向量，其中，目标用户表征向量用于对目标用户与预设的媒体资源进行匹配。达到了通过两组训练样本分别训练双训练神经网络模型中的用户的训练神经网络模和媒体资源的神经网络模型，得到用户的目标神经网络模型和媒体资源的目标神经网络模型，通过用户的目标神经网络模型得到用于对目标用户与预设的媒体资源进行匹配的用户表征向量的目的，从而实现了根据用户的神经网络模型得到用于对目标用户与预设的媒体资源进行匹配的用户表征向量的技术效果，进而解决了由于用户特征信息挖掘不足，导致媒体资源推送精准度不高的技术问题。

可选的，上述装置还可以包括：结束单元，用于在第一预测操作信息与一组实际操作信息中对应的第一实际操作信息满足损失条件的情况下，结束对双训练神经网络模型中的第一训练神经网络模型和第二训练神经网络模型进行的训练，其中，结束训练时的第一训练神经网络模型为第一目标神经网络模型，结束训练时的第二训练神经网络模型为第二目标神经网络模型。

其中，上述训练模块，可以包括：

1）第一获取子模块，用于根据当前的第一训练样本中的序列型数据、离散型数据和连续型数据，获取样本用户的第一序列型特征、第一离散型特征和第一连续型特征。

2）转换子模块，用于将第一序列型特征转换为第一序列向量，并将第一离散型特征转换为第一离散向量。

3）第一得到子模块，用于对第一序列向量进行序列信息抽取，得到序列表征特征。

4）第二得到子模块，用于对第一离散向量进行特征交叉，得到第一交叉表征特征。

5）第一确定子模块，用于根据序列表征特征、第一交叉表征特征和第一连续型特征，确定第一训练用户表征向量。

6）第二获取子模块，用于根据当前的第二训练样本中的离散型数据和连续型数据，获取第一样本媒体资源的第二离散型特征和第二连续型特征。

7）转换子模块，用于将第二离散型特征转换为第二离散向量；

8）第三得到子模块，用于对第二离散型向量进行特征交叉，得到第二交叉表征特征。

9）第二确定子模块，用于根据第二交叉表征特征和第二连续型特征，确定第二训练资源表征向量。

其中，上述第一确定子模块，还用于执行如下操作：将序列表征向量、第一交叉表征特征和第一连续型特征进行拼接，得到第一拼接特征；第一拼接特征输入到第一全连接层，得到第一全连接层输出的第一训练用户表征向量。

其中，上述第二确定子模块，还用于执行如下操作：将第二交叉表征特征和第一连续型特征，确定第二训练资源表征向量进行拼接，得到第二拼接特征；将第二拼接特征输入到第二全连接层，得到第二全连接层输出的第二训练资源表征向量。

可选的，上述获取单元61，可以包括：第一获取模块，用于获取样本用户的一组序列型数据、一组离散型数据和一组连续型数据，得到一组第一训练样本；第二获取模块，用于获取一组样本媒体资源中的每个样本媒体资源的一组离散型数据和一组连续型数据，得到一组第二训练样本。

可选的，上述装置还可以包括：匹配单元，用于将目标用户的目标表征向量与待推荐的目标媒体资源的目标资源表征向量进行匹配；推送单元，用于在目标表征向量与目标资源表征向量匹配的情况下，将目标媒体资源确定为待推荐给目标用户的媒体资源。

可选的，上述装置还可以包括：输出单元，用于将目标媒体资源的属性信息输入到第二目标神经网络模型，得到第二目标神经网络模型输出的目标媒体资源的目标资源表征向量，其中，目标资源表征向量用于对目标媒体资源与预设的用户进行匹配。

根据本发明实施例的又一个方面，还提供了一种用于实施上述用户特征的确定方法的电子设备，该电子设备可以是图1所示的终端设备或服务器。本实施例以该电子设备为服务器为例来说明。如图7所示，该电子设备包括存储器702和处理器704，该存储器702中存储有计算机程序，该处理器704被设置为通过计算机程序执行上述任一项方法实施例中的步骤。

可选地，在本实施例中，上述电子设备可以位于计算机网络的多个网络设备中的至少一个网络设备。

可选地，在本实施例中，上述处理器可以被设置为通过计算机程序执行以下步骤：

S1，获取一组第一训练样本、一组第二训练样本以及一组实际操作信息，其中，每个第一训练样本包括样本用户的属性信息，每个第二训练样本包括一个样本媒体资源的属性信息，每个实际操作信息用于表示样本用户对对应的一个样本媒体资源的实际操作；

S2，使用一组第一训练样本、一组第二训练样本以及一组实际操作信息对双训练神经网络模型中的第一训练神经网络模型和第二训练神经网络模型进行训练，得到对应的第一目标神经网络模型和第二目标神经网络模型，其中，第一训练神经网络模型用于根据输入的第一训练样本输出样本用户的训练用户表征向量，第二训练神经网络模型用于根据输入的第二训练样本输出样本媒体资源的训练资源表征向量，一组实际操作信息、训练用户表征向量和训练资源表征向量用于对第一训练神经网络模型和第二训练神经网络模型进行调整；

S3，将样本用户的目标属性信息输入到第一目标神经网络模型，得到第一目标神经网络模型输出的样本用户的样本用户表征向量，其中，样本用户表征向量用于对样本用户与预设的媒体资源进行匹配。

可选地，本领域普通技术人员可以理解，图7所示的结构仅为示意，电子装置电子设备也可以是智能手机（如Android手机、iOS手机等）、平板电脑、掌上电脑以及移动互联网设备（Mobile Internet Devices，MID）、PAD等终端设备。图7其并不对上述电子装置电子设备的结构造成限定。例如，电子装置电子设备还可包括比图7中所示更多或者更少的组件（如网络接口等），或者具有与图7所示不同的配置。

其中，存储器702可用于存储软件程序以及模块，如本发明实施例中的用户特征的确定方法和装置对应的程序指令/模块，处理器704通过运行存储在存储器702内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的用户特征的确定方法。存储器702可包括高速随机存储器，还可以包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器702可进一步包括相对于处理器704远程设置的存储器，这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中，存储器702具体可以但不限于用于第一训练样本、第二训练样本、用户的属性信息、媒体资源的属性信息、实际操作信息、双训练神经网络模型以及目标用户表征向量、样本用户表征向量等信息。作为一种示例，如图7所示，上述存储器702中可以但不限于包括上述用户特征的确定装置中的第一获取单元61、训练单元63以及确定单元65。此外，还可以包括但不限于上述用户特征的确定装置中的其他模块单元，本示例中不再赘述。

可选地，上述的传输装置706用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中，传输装置706包括一个网络适配器（Network Interface Controller，NIC），其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中，传输装置706为射频（Radio Frequency，RF）模块，其用于通过无线方式与互联网进行通讯。

此外，上述电子设备还包括：显示器708，用于显示上述待推荐的目标媒体资源；和连接总线710，用于连接上述电子设备中的各个模块部件。

在其他实施例中，上述终端设备或者服务器可以是一个分布式系统中的一个节点，其中，该分布式系统可以为区块链系统，该区块链系统可以是由该多个节点通过网络通信的形式连接形成的分布式系统。其中，节点之间可以组成点对点（P2P，Peer To Peer）网络，任意形式的计算设备，比如服务器、终端等电子设备都可以通过加入该点对点网络而成为该区块链系统中的一个节点。

根据本申请的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述用户特征的确定方面或者用户特征的确定方面的各种可选实现方式中提供的用户特征的确定方法。其中，该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

可选地，在本实施例中，上述计算机可读的存储介质可以被设置为存储用于执行以下步骤的计算机程序：

S3，将目标用户的目标属性信息输入到第一目标神经网络模型，得到第一目标神经网络模型输出的目标用户的目标用户表征向量，其中，目标用户表征向量用于对目标用户与预设的媒体资源进行匹配。

可选地，在本实施例中，本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、只读存储器（Read-Only Memory，ROM）、随机存取器（Random Access Memory，RAM）、磁盘或光盘等。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在上述计算机可读取的存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在存储介质中，包括若干指令用以使得一台或多台计算机设备（可为个人计算机、服务器或者网络设备等）执行本发明各个实施例所述方法的全部或部分步骤。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的客户端，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种用户特征的确定方法，其特征在于，包括：

获取一组第一训练样本、一组第二训练样本以及一组实际操作信息，其中，每个所述第一训练样本包括样本用户的属性信息，每个所述第二训练样本包括一个样本媒体资源的属性信息，每个所述实际操作信息用于表示所述样本用户对对应的一个样本媒体资源的实际操作；

使用所述一组第一训练样本、所述一组第二训练样本以及所述一组实际操作信息对双训练神经网络模型中的第一训练神经网络模型和第二训练神经网络模型进行训练，得到对应的第一目标神经网络模型和第二目标神经网络模型，其中，所述第一训练神经网络模型用于根据输入的所述第一训练样本输出所述样本用户的训练用户表征向量，所述第二训练神经网络模型用于根据输入的所述第二训练样本输出所述样本媒体资源的训练资源表征向量，所述一组实际操作信息、所述训练用户表征向量和所述训练资源表征向量用于对所述第一训练神经网络模型和所述第二训练神经网络模型进行调整；

将目标用户的目标属性信息输入到所述第一目标神经网络模型，得到所述第一目标神经网络模型输出的所述目标用户的目标用户表征向量，其中，所述目标用户表征向量用于对所述目标用户与预设的媒体资源进行匹配。

2.根据权利要求1所述的方法，其特征在于，所述使用所述一组第一训练样本、所述一组第二训练样本以及所述一组实际操作信息对双训练神经网络模型中的第一训练神经网络模型和第二训练神经网络模型进行训练，得到对应的第一目标神经网络模型和第二目标神经网络模型，包括：

将所述一组第一训练样本中当前的第一训练样本输入到所述第一训练神经网络模型中，得到所述第一训练神经网络模型输出的所述样本用户的第一训练用户表征向量，将所述一组第二训练样本中当前的第二训练样本输入到所述第二训练神经网络模型中，得到所述第二训练神经网络模型输出的第一样本媒体资源的第二训练资源表征向量，其中，所述当前的第一训练样本包括所述样本用户的当前属性信息，所述当前的第二训练样本包括所述第一样本媒体资源的当前属性信息；

对所述第一训练表征向量与所述第二训练表征向量进行匹配，得到第一预测操作信息，其中，所述第一预测操作信息用于表示所述样本用户对所述第一样本媒体资源的预测操作；

在所述第一预测操作信息与所述一组实际操作信息中对应的第一实际操作信息不满足预设的损失条件的情况下，对所述双训练神经网络模型中的所述第一训练神经网络模型和所述第二训练神经网络模型进行调整。

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：

在所述第一预测操作信息与所述一组实际操作信息中对应的第一实际操作信息满足所述损失条件的情况下，结束对所述双训练神经网络模型中的所述第一训练神经网络模型和所述第二训练神经网络模型进行的训练，其中，结束训练时的所述第一训练神经网络模型为所述第一目标神经网络模型，结束训练时的所述第二训练神经网络模型为所述第二目标神经网络模型。

4.根据权利要求2所述的方法，其特征在于，所述将所述一组第一训练样本中当前的第一训练样本输入到所述第一训练神经网络模型中，得到所述第一训练神经网络模型输出的所述样本用户的第一训练用户表征向量，包括：

根据所述当前的第一训练样本中的序列型数据、离散型数据和连续型数据，获取所述样本用户的第一序列型特征、第一离散型特征和第一连续型特征；

将所述第一序列型特征转换为第一序列向量，并将所述第一离散型特征转换为第一离散向量；

对所述第一序列向量进行序列信息抽取，得到序列表征特征；

对所述第一离散向量进行特征交叉，得到第一交叉表征特征；

根据所述序列表征特征、所述第一交叉表征特征和所述第一连续型特征，确定所述第一训练用户表征向量。

5.根据权利要求4所述的方法，其特征在于，所述根据所述序列表征特征、所述第一交叉表征特征和所述第一连续型特征，确定所述第一训练用户表征向量，包括：

将所述序列表征向量、所述第一交叉表征特征和所述第一连续型特征进行拼接，得到第一拼接特征；

将所述第一拼接特征输入到第一全连接层，得到所述第一全连接层输出的所述第一训练用户特征向量。

6.根据权利要求2所述的方法，其特征在于，所述将所述一组第二训练样本中当前的第二训练样本输入到所述第二训练神经网络模型中，得到所述第二训练神经网络模型输出的第一样本媒体资源的第二训练资源表征向量，包括：

根据所述当前的第二训练样本中的离散型数据和连续型数据，获取所述第一样本媒体资源的第二离散型特征和第二连续型特征；

将所述第二离散型特征转换为第二离散向量；

对所述第二离散型向量进行特征交叉，得到第二交叉表征特征；

根据所述第二交叉表征特征和所述第二连续型特征，确定所述第二训练资源表征向量。

7.根据权利要求6所述的方法，其特征在于，所述根据所述第二交叉表征特征和所述第二连续型特征，确定所述第二训练资源表征向量，包括：

将所述第二交叉表征特征和所述第二连续型特征进行拼接，得到第二拼接特征；

将所述第二拼接特征输入到第二全连接层，得到所述第二全连接层输出的所述第二训练资源表征向量。

8.根据权利要求1至7中任一项所述的方法，其特征在于，所述获取一组第一训练样本、一组第二训练样本以及一组实际操作信息，包括：

获取所述样本用户的一组序列型数据、一组离散型数据和一组连续型数据，得到所述一组第一训练样本；

获取一组样本媒体资源中的每个样本媒体资源的一组离散型数据和一组连续型数据，得到所述一组第二训练样本。

9.根据权利要求1至7中任一项所述的方法，其特征在于，所述方法还包括：

将所述目标用户的所述目标表征向量与待推荐的目标媒体资源的目标资源表征向量进行匹配；

在所述目标表征向量与所述目标资源表征向量匹配的情况下，将所述目标媒体资源确定为待推荐给所述目标用户的媒体资源。

10.根据权利要求9所述的方法，其特征在于，所述方法还包括：

将所述目标媒体资源的属性信息输入到所述第二目标神经网络模型，得到所述第二目标神经网络模型输出的所述目标媒体资源的目标资源表征向量，其中，所述目标资源表征向量用于对所述目标媒体资源与预设的用户进行匹配。

11.一种用户特征的确定装置，其特征在于，包括：

第一获取单元，用于获取一组第一训练样本、一组第二训练样本以及一组实际操作信息，其中，每个所述第一训练样本包括样本用户的属性信息，每个所述第二训练样本包括一个样本媒体资源的属性信息，每个所述实际操作信息用于表示所述样本用户对对应的一个样本媒体资源的实际操作；

训练单元，用于使用所述一组第一训练样本、所述一组第二训练样本以及所述一组实际操作信息对双训练神经网络模型中的第一训练神经网络模型和第二训练神经网络模型进行训练，得到对应的第一目标神经网络模型和第二目标神经网络模型，其中，所述第一训练神经网络模型用于根据输入的所述第一训练样本输出所述样本用户的训练用户表征向量，所述第二训练神经网络模型用于根据输入的所述第二训练样本输出所述样本媒体资源的训练资源表征向量，所述一组实际操作信息、所述训练用户表征向量和所述训练资源表征向量用于对所述第一训练神经网络模型和所述第二训练神经网络模型进行调整；

确定单元，用于将目标用户的目标属性信息输入到所述第一目标神经网络模型，得到所述第一目标神经网络模型输出的所述目标用户的目标用户表征向量，其中，所述目标用户表征向量用于对所述目标用户与预设的媒体资源进行匹配。

12.根据权利要求11所述的装置，其特征在于，所述训练单元，包括：

训练模块，用于将所述一组第一训练样本中当前的第一训练样本输入到所述第一训练神经网络模型中，得到所述第一训练神经网络模型输出的所述样本用户的第一训练用户表征向量，将所述一组第二训练样本中当前的第二训练样本输入到所述第二训练神经网络模型中，得到所述第二训练神经网络模型输出的第一样本媒体资源的第二训练资源表征向量，其中，所述当前的第一训练样本包括所述样本用户的当前属性信息，所述当前的第二训练样本包括所述第一样本媒体资源的当前属性信息；

匹配模块，用于对所述第一训练表征向量与所述第二训练表征向量进行匹配，得到第一预测操作信息，其中，所述第一预测操作信息用于表示所述样本用户对所述第一样本媒体资源的预测操作；

调整模块，用于在所述第一预测操作信息与所述一组实际操作信息中对应的第一实际操作信息不满足预设的损失条件的情况下，对所述双训练神经网络模型中的所述第一训练神经网络模型和所述第二训练神经网络模型进行调整。

13.根据权利要求12所述的装置，其特征在于，所述装置还包括：

结束单元，用于在所述第一预测操作信息与所述一组实际操作信息中对应的第一实际操作信息满足所述损失条件的情况下，结束对所述双训练神经网络模型中的所述第一训练神经网络模型和所述第二训练神经网络模型进行的训练，其中，结束训练时的所述第一训练神经网络模型为所述第一目标神经网络模型，结束训练时的所述第二训练神经网络模型为所述第二目标神经网络模型。

14.一种计算机可读的存储介质，其特征在于，所述计算机可读的存储介质包括存储的程序，其中，所述程序运行时执行所述权利要求1至10任一项中所述的方法。

15.一种电子设备，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为通过所述计算机程序执行所述权利要求1至10任一项中所述的方法。