CN110147882A

CN110147882A - 神经网络模型的训练方法、人群扩散方法、装置及设备

Info

Publication number: CN110147882A
Application number: CN201811023331.1A
Authority: CN
Inventors: 梁鹏; 陈戈; 黄东波; 姜磊
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2018-09-03
Filing date: 2018-09-03
Publication date: 2019-08-20
Anticipated expiration: 2038-09-03
Also published as: CN110147882B

Abstract

本申请公开了一种神经网络模型的训练方法、人群扩散方法、装置及设备，属于信息推荐领域。所述方法包括：获取m个种子人群的人群包embedding向量，所述种子人群中包括多个样本用户；获取全量用户中多个用户的用户embedding向量；所述人群包embedding向量和所述用户embedding向量是通过同一个神经网络模型得到的；根据所述人群包embedding向量和所述用户embedding向量之间的向量相似度，确定对所述种子人群进行扩散的扩散人群。本申请不需要针对每个种子人群分别建立LR模型，避免了不同种子人群的LR模型无法对比及迁移所带来的工程性能问题。

Description

神经网络模型的训练方法、人群扩散方法、装置及设备

技术领域

本申请涉及信息推荐领域，特别涉及一种神经网络模型的训练方法、人群扩散方法、装置及设备。

背景技术

人群扩散是指基于已有的种子人群预测出其他扩散人群的技术。

相关技术中使用基于LR(Logistic Regression，逻辑回归)模型的人群扩散方法。该人群扩散方法采用“一次扩展、一次建模”的方式。当存在一个种子人群时，利用该种子人群包对LR模型进行训练，得到训练后的LR模型。利用训练后的LR模型从候选的用户帐号中预测出扩散人群。

在训练LR模型的过程中，先提取种子人群中多个用户的用户特征作为正样本，再提取不属于种子人群的多个其它用户的用户特征作为负样本，然后根据正样本和负样本对LR模型进行训练，得到训练后的LR模型。

对于n个种子人群的人群扩散场景，上述方法需要对每个种子人群都分别进行一次“提取正负样本→训练LR模型→使用LR模型进行预测”的过程。也即，需要提取n次正样本和负样本、对n个LR模型进行分别训练、对n个LR模型分别进行预测，因此限制了整个系统的性能上限，使得上述方法无法做到实时或近乎实时的响应。

发明内容

本申请实施例提供了一种神经网络模型的训练方法、人群扩散方法、装置及设备，可以用于解决相关技术中使用LR模型进行人群推荐时，需要对每个种子人群分别进行一次“提取正负样本→训练LR模型→使用LR模型进行预测”的过程，限制了整个系统的性能上线，使得上述方法无法做到实时会近乎实时的响应的问题。所述技术方案如下：

根据本申请的一个方面，提供了一种神经网络模型的训练方法，所述方法包括：

根据样本用户所属的种子人群的人群包embedding向量，合并得到所述样本用户的第一人群特征；

将所述样本用户的第一人群特征和第一用户画像特征进行拼接，得到神经网络模型的第一输入层数据；

将所述第一输入层数据输入至神经网络模型中进行训练，得到预测误差；

在未满足训练结束条件时，根据反向传播算法对所述预测误差进行反向传播，更新所述神经网络模型中的权重和所述人群包embedding向量；

在满足所述训练结束条件时，结束所述神经网络模型的训练。

根据本申请的另一方面，提供了一种人群扩散方法，所述方法包括：

获取m个种子人群的人群包embedding向量，每个所述种子人群中包括多个样本用户，m为正整数；

获取全量用户中每个用户的用户embedding向量；所述人群包embedding向量和所述用户embedding向量是通过同一个神经网络模型得到的，所述神经网络模型是基于所述样本用户的人群特征和用户画像特征训练得到的，所述样本用户的人群特征是根据所述样本用户所属的所述种子人群的所述人群包embedding向量得到的；

根据所述人群包embedding向量和所述用户embedding向量之间的向量相似度，确定对所述种子人群进行扩散的扩散人群。

根据本申请的另一方面，提供了一种神经网络模型的训练装置，所述装置包括：

合并模块，用于根据样本用户所属的种子人群的人群包embedding向量，合并得到所述样本用户的人群特征；

拼接模块，用于将所述样本用户的人群特征和用户画像特征进行拼接，得到神经网络模型的输入层数据；

训练模块，用于将所述输入层数据输入至神经网络模型中进行训练，得到预测误差；

所述训练模块，还用于在未满足训练结束条件时，根据反向传播算法对所述预测误差进行反向传播，更新所述神经网络模型中的权重和所述人群包embedding向量；

所述训练模块，还用于在满足所述训练结束条件时，结束所述神经网络模型的训练。

根据本申请的另一方面，提供了一种人群扩散装置，所述装置包括：

第一获取模块，用于获取m个种子人群的人群包embedding向量，每个所述种子人群中包括多个样本用户，m为正整数；

第二获取模块，用于获取全量用户中每个用户的用户embedding向量；所述人群包embedding向量和所述用户embedding向量是通过同一个神经网络模型得到的，所述神经网络模型是基于所述样本用户的人群特征和用户画像特征训练得到的，所述样本用户的人群特征是根据所述样本用户所属的所述种子人群的所述人群包embedding向量得到的；

确定模块，用于根据所述人群包embedding向量和所述用户embedding向量之间的向量相似度，确定对所述种子人群进行扩散的扩散人群。

根据本申请的再一方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述指令、所述程序、所述代码集或所述指令集由所述处理器加载并执行以实现如上方面所述的神经网络模型的训练方法，或如上方面所述的人群扩散方法。

根据本申请的再一方面，提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述指令、所述程序、所述代码集或所述指令集由处理器加载并执行以实现如上方面所述的神经网络模型的训练方法，或如上方面所述的人群扩散方法。

本申请实施例提供的技术方案带来的有益效果至少包括：

通过同一个神经网络模型生成每个种子人群的人群包embedding向量，以及每个用户的用户embedding向量，根据人群包embedding向量和用户embedding向量之间的向量相似度，确定对种子人群进行扩散的扩散人群；由于人群包embedding向量和用户embedding向量都是基于同一个神经网络模型来计算得到的，所以本申请不需要针对每个种子人群分别建立LR模型，减少了对多个LR模型分别进行样本构建、模型训练和模型预测的繁琐工作量，避免了不同种子人群的LR模型无法对比及迁移所带来的工程性能问题。

在本申请中，还由于人群包embedding向量和用户embedding向量都可以预先计算得到，在人群扩散时的计算工作主要是计算两个向量之间的向量相似度，因此本申请能够达到实时或近乎实时的响应速度，将相关技术中短则十几分钟、长则数十分钟的扩散时延变为近实时的响应。

相关技术中的LR模型是一种广义线性模型，模型表达能力有限，对非线性问题的处理能力有限，而且LR模型所依赖的人工特征工程的成本较高。在本申请中，神经网络模型能够有效地纳入异构特征、将异构特征进行交叉组合，降低人工特征工程的成本、采用更为复杂的非线性特征来增强模型的表达能力和泛化能力。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一个示例性实施例提供的神经网络模型的训练方法的流程图；

图2是本申请一个示例性实施例提供的种子人群的人群包embedding向量的示意图；

图3是本申请一个示例性实施例提供的以平均方式将人群包embedding向量进行合并的示意图；

图4是本申请一个示例性实施例提供的以取最大值方式将人群包embedding向量进行合并的示意图；

图5是本申请一个示例性实施例提供的神经网络模型的结构示意图；

图6是本申请一个示例性实施例提供的神经网络模型的训练示意图；

图7是本申请一个示例性实施例提供的线下预测阶段的方法流程图；

图8是本申请一个示例性实施例提供的人群扩散方法的方法流程图；

图9是本申请一个示例性实施例提供的人群扩散方法的方法流程图；

图10是本申请一个示例性实施例提供的人群扩散方法的方法流程图；

图11是本申请一个示例性实施例提供的人群扩散方法的界面示意图；

图12是本申请一个示例性实施例提供的广告投放系统的框图；

图13是本申请一个示例性实施例提供的人群扩散方法的方法流程图；

图14是本申请一个示例性实施例提供的神经网络模型的训练装置的框图；

图15是本申请一个示例性实施例提供的人群扩散装置的框图；

图16是本申请一个示例性实施例提供的服务器的结构框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

以下为本申请涉及的若干个名词的简介或解释：

种子人群：由广告投放者提供的第一手用户数据。每个种子人群包括若干个用户，每个种子人群可近似视为一组具有相同或相似特征的用户。示意性的，一个种子人群包括：用户1、用户2、用户4,…,用户999；另一个种子人群包括：用户2、用户4、用户5，…，用户1000。

人群扩散：是指基于已有的种子人群预测出其他扩散人群的技术。理论上，扩散人群与种子人群具有相同或相似特征。

扩散人群：通过人群扩散技术预测得出的一组用户。每个扩散人群包括若干个用户。

用户：业务逻辑中的服务对象，用户可以采用一个用户标识来表示。以即时通讯程序为例，每个用户采用一个即时通讯帐号来表示；以手机上的一些应用程序为例，每个用户采用一个手机号码来表示。在本申请中，用户、用户帐号、帐号、人可视为同一概念，人群可视为帐号集合。

全量用户：所有可用于信息推荐的用户，信息推荐包括广告投放、新闻推荐、商品推荐中的至少一种。可选地，每个用户属于一个或多个种子人群，

样本用户：用于训练神经网络模型的用户。样本用户是全量用户的子集。

用户的人群特征：根据用户所属的种子人群所生成的特征。当种子人群采用人群包embedding向量表示时，人群特征采用该用户所属种子人群的人群包embedding向量合并得到。

合并：将多个m维embedding向量在每个维度上的取值进行平均后得到一个新的m维embedding向量的过程；或，对多个m维embedding向量取每个维度上的最大值，从而得到一个新的m维embedding向量的过程。

用户的用户画像特征：建立在一系列属性数据之上的用户模型。用户画像特征包括：人口属性特征、设备特征、行为特征和标签特征中的至少一种。

拼接：是当用户的人群特征采用m维的第一向量表示，用户画像特征采用n维的第二向量表示时，将第一向量和第二向量按序组合为m+n维的第三向量的过程。该第三向量可作为神经网络模型的输入层。

订单截断：根据用户和种子人群的对应关系，以及每个种子人群所对应的信息投放订单，为该用户筛选候选投放信息的过程。

在本申请实施例中，将人群扩散问题建模为一个多分类问题，针对不同的种子人群采用同一个神经网络模型来进行人群扩散。整个过程可分为三个阶段：

1、神经网络模型的训练过程；

2、利用神经网络模型对全量用户进行线下预测的过程；

3、利用神经网络模型对种子人群进行线上预测的过程。

第一阶段：神经网络模型的训练过程。

图1示出了本申请一个示例性实施例提供的神经网络模型的训练方法的流程图。该方法可以应用于计算机设备中，该方法包括：

步骤101，根据样本用户所属的种子人群的人群包embedding向量，合并得到样本用户的人群特征；

人群包embedding向量是以词嵌入向量对种子人群进行特征表示的向量。或者说，人群包embedding向量是在人群空间中对种子人群进行表示的向量。

每个种子人群对应各自的人群包embedding向量，每个人群包embedding向量可以是M维向量，M为正整数。在如图2的示意性例子中，假设存在1000个种子人群，每个种子人群对应各自的7维向量，1000个种子人群的人群包embedding向量构成一个1000*7的向量矩阵。

向量矩阵中的各个人群包embedding向量可通过初始化方式得到。在一个可选的实施例中，采用随机化方式对各个种子人群的人群包embedding向量进行初始化。示意性的，计算机设备采用随机数生成算法生成每个人群包embedding向量中的数值。

每个样本用户属于一个或多个种子人群，基于每个样本用户所属的种子人群的人群包embedding向量，能够合并得到每个样本用户相应的人群特征。人群特征是用于表示用户所属的种子人群的特征。

当某个样本用户仅属于一个种子人群时，将该样本用户所属的种子人群的人群包embedding向量作为该样本用户的人群特征。

当某个样本用户属于两个以上的种子人群时，根据样本用户所属的两个以上的种子人群的人群包embedding向量，合并得到样本用户的人群特征。

在如图3的示意性例子中，当样本用户属于两个以上的种子人群：种子人群1、种子人群3、…、种子人群x时，种子人群1的人群包embedding向量为[0.1，0.2，0.8，0.9，0.2，0.4，0.6]，种子人群3的人群包embedding向量为[0.8，0.2，0.2，0.2，0.0，0.6，0.6]，…，种子人群x的人群包embedding向量为[0.5，0.7，0.2，0.5，0.6，0.7，0.8]。由于每个种子人群的人群包embedding向量为M维向量，将每个M维的人群包embedding向量中的第i维度值进行平均，1≤i≤M，合并得到一个新的M维向量作为该样本用户的人群特征。比如，将每个人群包embedding向量中的第1维度值0.1、0.8、…、0.5进行平均，从而得到该样本用户的人群特征中的第1维度值0.45，以此类推。

在如图4的示意性例子中，当样本用户属于两个以上的种子人群：种子人群1、种子人群3、…、种子人群x时，种子人群1的人群包embedding向量11为[0.1，0.2，0.8，0.9，0.2，0.4，0.6]，种子人群3的人群包embedding向量11为[0.8，0.2，0.2，0.2，0.0，0.6，0.6]，…，种子人群x的人群包embedding向量11为[0.5，0.7，0.2，0.5，0.6，0.7，0.8]。由于每个种子人群的人群包embedding向量11为M维向量，将每个M维的人群包embedding向量中的第i维度值筛选出最大值，1≤i≤M，合并得到一个新的M维向量作为该样本用户的人群特征12。比如，将每个人群包embedding向量中的第1维度值0.1、0.8、…、0.5筛选出最大值，从而得到该样本用户的人群特征中的第1维度值0.8，以此类推。

步骤102，将样本用户的人群特征和用户画像特征进行拼接，得到神经网络模型的输入层数据；

样本用户的人群特征是用于表示样本用户所属种子人群的特征，该人群特征可采用向量形式进行表达。

样本用户的用户画像特征是用于表示样本用户在用户画像上的特征，该用户画像特征可采用向量形式进行表达。用户画像特征包括：人口属性特征、设备特征、行为特征和标签特征中的至少一种。

人口属性特征是用于指示用户在人物基础属性上的特征。示意性的，人口属性特征包括：性别、年龄、学历、婚姻情况、地址、收入中的至少一种。

设备特征是用于指示用户所使用的电子设备的特征。示意性的，设备特征包括：硬件型号、操作系统类型、生产厂商、国别版本、唯一硬件标识码、网络地址中的至少一种。

行为特征是用于指示用户在使用互联网服务时的各种行为所产生的特征。示意性的，行为特征包括：阅读行为、点赞行为、回复行为、购买行为、网络社交行为、加入会员行为中的至少一种。

标签特征是由系统或其他用户以标签形式为该用户标定的特征。示意性的，标签特征包括：幽默、善良、90后、金牛座、美食、起床困难户、宅女、韩剧达人、旅游、完美主义等。

可选地，人口属性特征、设备特征、行为特征和标签特征均采用向量表示。

对于每个样本用户，将样本用户的人群特征和用户画像特征进行拼接，能够多维度和多样化的对样本用户进行表示，拼接后得到的向量可作为神经网络模型的输入层数据17。参考图3或图4，在得到样本用户的人群特征12后，将样本用户的人群特征12、人口属性特征13、设备特征14、行为特征15、标签特征16进行依次拼接，得到神经网络模型的输入层数据17。

步骤103，将输入层数据输入至神经网络模型中进行训练，得到预测误差；

该神经网络模型是用于计算每个用户的用户embedding向量的模型。该神经网络模型可以是深度神经网络(Deep Neural Network，DNN)，还可以是卷积神经网络(Convolutional Neural Network，CNN)，还可以是递归神经网络(Recurrent NeuralNetwork，RNN)，本申请实施例对此不加以限定。

在如图5的一个示意性例子中，神经网络模型20包括：输入层21、k个隐藏层22和分类层23，k为正整数。K个隐藏层22采用的激活函数可以是ReLU(Rectified Linear Units，修正线性单元)，分类层23是sigmoid(S型生长曲线)、softmax(逻辑斯谛函数)、hierarchical(层级聚类)和sampled softmax(采样逻辑斯谛函数)中的任意一种。

上述k个隐藏层22是在训练过程和使用过程均使用的神经网络层，分类层23是在训练过程中使用的神经网络层。

分类层23用于输出样本用户属于每个种子人群的预测概率。由于样本用户实际所属的种子人群是事先已知的，将预测概率和样本用户实际所属的种子人群进行比对，即可得到预测误差。以分类层23是sampled softmax为例，该预测误差采用交叉熵损失来表示，交叉熵是用来判定实际输出与期望输出的接近程度的一种参数。

将一组输入层数据输入神经网络模型进行训练，视为一次训练过程。当一次训练过程结束后，计算机设备判定本次训练过程是否满足训练结束条件。训练结束条件包括但不限于如下两种情况：

一、预测误差小于设定阈值；

该设定阈值由技术人员预先设定，或根据训练过程进行随时调整。

二、训练次数大于设定次数。

由于某些情况下，长时间训练也无法使得预测误差小于某个设定阈值。因此也可按照训练次数来设定训练结束条件，比如该训练次数达到10000次，则停止训练。

当本次训练过程未满足训练结束条件时，进入步骤104；当本次训练过程满足训练结束条件时，进入步骤105。

步骤104，在未满足训练结束条件时，根据反向传播算法对预测误差进行反向传播，更新神经网络模型中的权重以及人群包embedding向量；

在如图6所示的一个示意性例子中，计算机设备采用基于梯度下降的反向传播(Back propagation)算法对预测误差进行反向传播，从而更新神经网络模型中的权重以及向量矩阵中的人群包embedding向量。

步骤105，在满足训练结束条件时，结束神经网络模型的训练。

由于在反向传播过程中，每个人群包embedding向量也会得到更新。因此当训练结束时，会得到每个种子人群的人群包embedding向量。

同时，还会得到训练完毕的神经网络模型，该神经网络模型用于计算每个用户的用户embedding向量。

综上所述，本实施例提供的方法，使用人群包embedding向量来合并得到样本用户的人群特征，将样本用户的人群特征和用户画像特征进行拼接得到神经网络模型的输入层数据，能够多维度和多样化地对样本用户进行特征表示，从而训练得到用于计算用户embedding向量的神经网络模型，同时在训练完毕后得到每个种子人群的人群包embedding向量。

第二阶段：利用神经网络模型对全量用户进行线下预测的过程。

在基于图1的可选实施例中，在神经网络模型训练完毕后，采用训练后的神经网络模型对全量用户中的每个用户的用户embedding向量进行预测。如图7所示，在步骤105之后还包括如下步骤：

步骤106，对于全量用户中的每个用户，根据该用户所属的种子人群的人群包embedding向量，合并得到用户的人群特征；

与样本用户类似的，全量用户中的每个用户也属于一个或多个种子人群，基于每个用户所属的种子人群的人群包embedding向量，能够合并得到每个用户相应的人群特征。可选地，若存在某一个用户不属于任何一个种子人群的特例，则将该用户的人群特征设置为空或者预设值。

当某个用户仅属于一个种子人群时，将该用户所属的种子人群的人群包embedding向量作为该用户的人群特征。

当某个用户属于两个以上的种子人群时，根据用户所属的两个以上的种子人群的人群包embedding向量，合并得到该用户的人群特征。合并过程可参考步骤101中的描述，不再赘述。

步骤107，将用户的人群特征和用户画像特征进行拼接，得到神经网络模型的输入层数据；

用户的人群特征是用于表示用户所属种子人群的特征，该人群特征可采用向量形式进行表达。

用户的用户画像特征是用于表示用户在用户画像上的特征，该用户画像特征可采用向量形式进行表达。用户画像特征包括：人口属性特征、设备特征、行为特征和标签特征中的至少一种。可选地，人口属性特征、设备特征、行为特征和标签特征均采用向量表示。

对于每个用户，将用户的人群特征和用户画像特征进行拼接，能够多维度和多样化的对用户进行表示，拼接后得到的向量可作为神经网络模型的输入层数据。

步骤108，将输入层数据输入神经网络模型进行预测，得到用户的用户embedding向量。

在如图5的一个示意性例子中，神经网络模型20包括：输入层21、k个隐藏层22和分类层23，k为正整数。K个隐藏层22采用的激活函数可以是ReLU，分类层23是sigmoid、softmax、hierarchical和sampled softmax中的任意一种。

需要说明的是，分类层23仅在训练过程中使用。本步骤将输入层数据输入K个隐藏层22后，将K个隐藏层22的输出作为用户embedding向量，不需要经过分类层23。

计算机设备存储每个用户的用户embedding向量。

综上所述，本实施例提供的方法，使用训练完毕的神经网络模型对全量用户的用户embedding向量进行预测，能够基于统一的神经网络模型来得到各个种子人群的人群包embedding向量和各个用户的用户embedding向量，而统一的神经网络模型能够极大地提升工程性能，打破了相关技术中多个模型间无法比较和迁移的藩篱。

第三阶段：利用神经网络模型对种子人群进行线上预测的过程。

图8示出了本申请一个示例性实施例提供的人群扩散方法的流程图。该方法可以应用于计算机设备中，该方法包括：

步骤801，获取m个种子人群的人群包embedding向量，m为正整数；

每个种子人群中包括多个用户。对于任意种子人群中的多个用户，该多个用户中的全部或部分用户是训练过程中的样本用户。

m个种子人群的人群包embedding向量是在上述第一阶段训练得到的。该m个种子人群的人群包embedding向量可以存储在数据库中。计算机设备从数据库中读取m个种子人群的人群包embedding向量。

步骤802，获取全量用户中多个用户的用户embedding向量；

全量用户中每个用户的用户embedding向量是在上述第二阶段训练得到的。该全量用户中每个用户的用户embedding向量可以存储在数据库中。计算机设备从数据库中读取多个用户的用户embedding向量，该多个用户可以是全量用户。

步骤801可以与步骤802同时执行，步骤802也可以在步骤801之前或之后执行，本实施例对此不加以限定。

步骤803，根据人群包embedding向量和用户embedding向量之间的向量相似度，确定对种子人群进行扩散的扩散人群。

人群包embedding向量是用于代表种子人群的特征，用户embedding向量是用于代表用户的特征，人群包embedding向量和用户embedding向量之间的向量相似度用于表征种子人群和用户之间的相似程度。当用户与某一种子人群之间的相似程度越高时，表明该用户有更大概率适合作为该种子人群的扩散人群。

可选地，向量相似度采用两个向量之间的余弦距离来表征。该余弦距离采用人群包embedding向量和用户embedding向量之间的乘积计算得到。

结合参考图5，神经网络模型中还包括处理层24，该处理层24用于在预测过程中将人群包embedding向量和用户embedding向量进行相乘。

综上所述，本实施例提供的方法，通过同一个神经网络模型生成每个种子人群的人群包embedding向量，以及每个用户的用户embedding向量，根据人群包embedding向量和用户embedding向量之间的向量相似度，确定对种子人群进行扩散的扩散人群；由于人群包embedding向量和用户embedding向量都是基于同一个神经网络模型来计算得到的，所以本申请不需要针对每个种子人群分别建立LR模型，减少了对多个LR模型分别进行样本构建、模型训练和模型预测的繁琐工作量，避免了不同种子人群的LR模型无法对比及迁移所带来的工程性能问题。

上述步骤803存在至少两种不同的实现方式：

第一，基于离线计算的实现方式，可适用于需要进行订单库存预估的场景，比如品牌广告。品牌广告是以树立产品品牌形象，提高品牌的市场占有率为直接目的的广告。品牌广告的投放通常是基于某一预设数量进行的，因此需要在投放过程中进行订单库存预估。本文中的“订单”是指广告订单。

第二，基于在线计算的实现方式，可适用于不需要进行订单库存预估的场景，比如效果广告。效果广告是广告主只需要为可衡量的结果付费的广告。

针对上述第一种实现方式，在基于图8的可选实施例中，步骤803可替换为步骤8031至步骤8034，如图9所示：

步骤8031，通过离线计算方式将目标种子人群的人群包embedding向量与每个用户的用户embedding向量相乘得到向量相似度，目标种子人群是m个种子人群中的一个；

对于m个种子人群中的任意一个目标种子人群，建立离线计算任务。该离线计算任务用于将目标种子人群的人群包embedding向量乘以全量用户的用户embedding向量，得到目标种子人群与每个用户之间的第一向量相似度。

步骤8032，获取按照向量相似度由大到小排序的前k个用户；

计算机设备按照向量相似度将全量用户中的各个用户按照由大到小的顺序进行排序，选取排序在前k个的用户(比如2亿个用户)作为该目标种子人群的扩展人群。其中，k为正整数，比如k＝2亿个用户。

步骤8033，将前k个用户采用倒排索引进行存储；

计算机设备将前k个用户采用倒排索引灌入数据库中进行存储。该倒排索引中存储有用户和目标种子人群的对应关系。

可选地，该倒排索引采用键-值(key-value)存储形式。其中，key是用户的用户标识，value是该用户所对应的种子人群。

可选地，该数据库是Redis数据库。

步骤8034，根据用户和目标种子人群的对应关系，在信息投放过程中进行订单截断；

当需要向用户投放广告时，在Redis数据库中查询该用户所对应的目标种子人群，每个用户对应一个或多个目标种子人群。

每个目标种子人群对应各自的广告订单，订单截断是指根据目标种子人群对应的广告订单为该用户筛选候选投放广告的过程。示意性的，某个用户X对应目标种子人群A和目标种子人群B，目标种子人群A对应广告A1和A2，目标种子人群B对应广告B1、B2和B3，则计算机设备可以将广告A1、广告A2、广告B1、广告B2和广告B3确定为该用户X的候选投放广告。

然后，计算机设备可根据排序条件对广告A1、广告A2、广告B1、广告B2和广告B3进行排序，将排序在最前面的一个广告确定为向该用户X投放的广告。示意性的，排序条件包括每个广告的广告订单的剩余未投放数。

针对上述第二种实现方式，在基于图8的可选实施例中，步骤803可替换为步骤803a至步骤803c，如图10所示：

步骤803a，通过在线计算方式将目标用户的用户embedding向量和每个种子人群的人群包embedding向量相乘得到向量相似度，目标用户是全量用户中的一个；

在目标用户打开了APP(Application，应用程序)或某个视频之类的在线投放场景中，计算机设备通过在线计算方式将目标用户的用户embedding向量和每个种子人群的人群包embedding向量相乘得到第二向量相似度。

步骤803b，获取按照向量相似度由大到小排序的前p个种子人群；

计算机设备按照向量相似度将各个种子人群用户按照由大到小的顺序进行排序，选取排序在前p个的种子人群。此时，目标用户可视为前p个种子人群的扩散用户。

步骤803c，根据目标用户和前p个种子人群的对应关系，在信息投放过程中进行订单截断；

前p个种子人群对应各自的广告订单，订单截断是指根据前p个种子人群对应的广告订单为该目标用户筛选候选投放广告的过程。示意性的，目标用户Y对应种子人群C和种子人群D，种子人群C对应广告C1、C2和C3，种子人群D对应广告D1、D2和D3，则计算机设备可以将广告C1、广告C2、广告C3、广告D1、广告D2和广告D3确定为该目标用户Y的候选投放广告。

然后，计算机设备可根据排序条件对广告C1、广告C2、广告C3、广告D1、广告D2和广告D3进行排序，将排序在最前面的一个广告确定为向该目标用户Y投放的广告。示意性的，排序条件包括每个广告的广告订单的剩余未投放数。

其中，订单截断是指根据前p个种子人群对应的广告订单为目标用户筛选候选投放广告的过程。

本申请实施例提供的人群扩散方法，可以应用于广告投放、信息推荐等应用场中。根据广告主提供的有限数量的种子人群，扩展出与种子人群对应的扩展人群，该扩展人群包括大量扩展出的潜在用户。

比如，在广告投放场景中，假设广告主提供的种子人群中包括实际使用过广告主产品的多个用户，而广告主希望对该种子人群进行扩展，得到扩展人群。然后将广告投放至扩展人群，以吸引更多潜在用户购买广告主的产品。

在一个实施例中，广告平台可以为广告主提供人群扩散功能。图11是本申请实施例提供的一种广告平台的主界面P1的示意图，广告主登录广告平台后，如果该广告平台存储有该广告主的种子人群(目标用户集合)，则广告主可以通过点击主界面中的“人群生成”菜单中的“人群扩散”选项，进入人群扩散界面，然后在该人群扩散界面中选择要扩散的种子人群，并配置人群扩散要求，最后点击“扩散”选项，确定种子人群的扩散人群。其中，该人群扩展界面包括“媒体选择”和“扩展倾向”的选项列表，以及“人群相似度”拉杆。“媒体选择”和“扩展倾向”用于配置待扩散用户的数据源，“人群相似度”拉杆用于配置扩散人群与种子人群的相似度，进而控制扩散人群的规模。其中，不同的人群相似度对应不同的扩散人群规模。进一步地，当该广告平台未存储有种子人群时，广告主还可以通过该广告平台的主界面中的“上传人群”选项，上传该广告主的种子人群，或者，通过该广告平台的主界面中的“定制人群”选项，定制该广告主的种子人群，本申请实施例对广告主的种子人群的设置方式不做限定。

图12示出了本申请一个示例性实施例提供的广告投放系统200的结构框图。该广告投放系统200包括：终端220、广告平台240和广告主终端260。

终端220通过无线网络或有线网络与广告平台220相连。终端220可以是智能手机、游戏主机、台式计算机、平板电脑、电子书阅读器、MP3播放器、MP4播放器和膝上型便携计算机中的至少一种。终端220安装和运行有支持广告投放的应用程序。该应用程序可以是声音社交应用程序、即时通讯应用程序、团队语音应用程序、基于话题或频道或圈子进行人群聚合的社交类应用程序、基于购物的社交类应用程序、浏览器程序、视频程序中的任意一种。终端220是第一用户使用的终端，终端220中运行的应用程序内登录有第一用户帐号。

终端220通过无线网络或有线网络与服务器240相连。

广告平台240包括一台服务器、多台服务器、云计算平台和虚拟化中心中的至少一种。广告平台240用于为支持广告投放的应用程序提供后台服务。可选地，广告平台240承担主要计算工作，终端220和广告主终端260承担次要计算工作；或者，广告平台240承担次要计算工作，终端220和广告主终端260承担主要计算工作；或者，广告平台240、终端220和广告主终端260三者之间采用分布式计算架构进行协同计算。

可选地，广告平台240包括：接入服务器242、广告投放服务器244和数据库246。接入服务器242用于提供终端220以及广告主终端260的接入服务。广告投放服务器244用于提供广告投放有关的后台服务。广告投放服务器244可以是一台或多台。当广告投放服务器244是多台时，存在至少两台广告投放服务器244用于提供不同的服务，和/或，存在至少两台广告投放服务器244用于提供相同的服务，比如以负载均衡方式提供同一种服务，本申请实施例对此不加以限定。

广告主终端260是由广告投放者所使用的终端。

终端220可以泛指多个终端中的一个，广告主终端260可以泛指多个终端中的一个，本实施例仅以终端220和广告主终端260来举例说明。终端220和广告主终端260的终端类型相同或不同，该终端类型包括：智能手机、游戏主机、台式计算机、平板电脑、电子书阅读器、MP3播放器、MP4播放器和膝上型便携计算机中的至少一种。

本领域技术人员可以知晓，上述终端的数量可以更多或更少。比如上述终端可以仅为一个，或者上述终端为几十个或几百个，或者更多数量，此时上述广告投放系统还包括其他终端。本申请实施例对终端的数量和设备类型不加以限定。

图13是本申请实施例提供的一种广告投放场景中的人群扩展方法的流程图。该方法可以由图12中的广告平台240来执行。如图13所示，广告投放服务器可以先从数据库246内获取多个种子人群，然后利用多个种子人群中每个用户embedding向量对预设网络模型进行训练，并可以在训练过程中更新得到人群包embedding向量矩阵，该人群包embedding向量矩阵包括多个种子人群的人群包embedding向量。之后，利用训练好的预设网络模型，对数据库246内的全量用户进行预测，得到用户embedding向量矩阵，该用户embedding向量矩阵包括全量用户中每个用户的用户embedding向量。

训练得到人群包embedding向量矩阵，以及预测得到用户embedding向量矩阵之后，在进行线上人群扩展时，可以根据下游业务的不同实现不同的设计，最主要的区别在于是否需要线下落地产出扩展人群。

具体地，如果下游业务是品牌广告，可以采用图13中的点划线指示流程进行人群扩展。对于品牌广告，由于需要进行在投放过程中库存预估，因此可以通过线下离线任务进行离线矩阵相乘，也即是，根据人群包embedding向量矩阵，确定多个种子人群的人群包embedding向量，然后对于该多个种子人群中的每个种子人群，将该种子人群的人群包embedding向量乘以全量用户中每个用户的用户embedding向量，取乘积较大的前m个用户组成该种子人群的扩展人群，并产出多个种子人群的扩展人群。产出的多个扩展人群一方面可以倒排灌库建立倒排索引，供广告订单进行人群包定向截断时查询；另一方面可以进行人群库存预估，供投放引擎库存预估时查询。

另外，如果下游业务是效果广告，则无需事先产出扩展人群，可以采用图13中的虚线指示流程进行人群扩展。例如，可以将人群包embedding向量矩阵中多个人群包embedding特征向量推送到广告引擎服务器并加载进内存，并将用户embedding向量矩阵中全量用户中每个用户的用户embedding向量灌库，也即是，将全量用户中每个用户的用户embedding向量存储在数据库246中，并建立全量用户中每个用户的用户embedding向量的正排序索引。之后，线上订单人群定向截断时，可以查询目标用户的用户embedding向量，并将目标用户的用户embedding向量与多个种子人群的人群包embedding特征向量分别进行相乘，然后取乘积较大的前k个人群进行定向截断。

本申请直接颠覆了相关技术中经典人群扩展使用的一个种子人群对应一个LR模型的二分类方案架构，将人群扩展问题建模成一个多分类的人群推荐问题并使用一个统一的深度学习模型去解决该问题。统一模型极大地提升了工程性能，使得人群扩展能够获得近乎实时的在线响应，同时打破了多模型间无法比较和迁移的藩篱，模型采取深度学习方案，极大降低了特征工程成本的同时增强了模型的泛化能力。

以下为本申请的装置实施例，对于装置实施例中未详细阐述的细节，可参考上述对应的方法实施例。

图14示出了本申请一个示例性实施例提供的神经网络模型的训练装置的框图。该训练装置可实现成为广告投放服务器的全部或一部分。该装置包括：

合并模块1420，用于根据样本用户所属的种子人群的人群包embedding向量，合并得到所述样本用户的人群特征；

拼接模块1440，用于将所述样本用户的人群特征和用户画像特征进行拼接，得到神经网络模型的输入层数据；

训练模块1460，用于将所述输入层数据输入至神经网络模型中进行训练，得到预测误差；

所述训练模块1420，还用于在未满足训练结束条件时，根据反向传播算法对所述预测误差进行反向传播，更新所述神经网络模型中的权重和所述人群包embedding向量；

所述训练模块1420，还用于在满足所述训练结束条件时，结束所述神经网络模型的训练。

在一个可选的实施例中，所述合并模块1420，用于当所述样本用户属于两个以上的种子人群时，初始化得到所述两个以上种子人群的人群包embedding向量；将所述两个以上的种子人群的人群包embedding向量的对应维度值进行平均，合并得到所述样本用户的人群特征。

在一个可选的实施例中，所述合并模块1420，用于当所述样本用户属于两个以上的种子人群时，初始化得到所述两个以上种子人群的人群包embedding向量；将所述两个以上的种子人群的人群包embedding向量的对应维度值取最大值，合并得到所述样本用户的人群特征。

在一个可选的实施例中，所述合并模块1420，用于采用随机化方式对所述两个以上种子人群的人群包embedding向量进行初始化。

在一个可选的实施例中，所述用户画像特征包括：人口属性特征、设备特征、行为特征和标签特征中的至少一种。

在一个可选的实施例中，所述神经网络模型包括：k个隐藏层和一个分类层，k为正整数；

所述k个隐藏层采用的激活函数是修正线性单元ReLU；

所述分类层是S型生长曲线sigmoid、逻辑斯谛函数softmax、层级聚类hierarchical和采样逻辑斯谛函数sampled softmax中的任意一种；

其中，所述k个隐藏层是在训练过程和预测过程中均使用的神经网络层，所述分类层是仅在所述训练过程中使用的神经网络层。

在一个可选的实施例中，所述装置还包括：预测模块1480；

所述合并模块1420，用于对于全量用户中的每个用户，根据所述用户所属的种子人群的人群包embedding向量，合并得到所述用户的人群特征；

所述拼接模块1440，用于将所述用户的人群特征和用户画像特征进行拼接，得到所述神经网络模型的输入层数据；

所述预测模块1480，用于将所述输入层数据输入所述神经网络模型进行预测，得到所述用户的用户embedding向量。

图15示出了本申请一个示例性实施例提供的人群扩散装置的框图。该人群扩散装置可实现成为广告投放服务器的全部或一部分。该装置包括：

第一获取模块1520，用于获取m个种子人群的人群包embedding向量，每个所述种子人群中包括多个样本用户，m为正整数；

第二获取模块1540，用于获取全量用户中每个用户的用户embedding向量；所述人群包embedding向量和所述用户embedding向量是通过同一个神经网络模型得到的，所述神经网络模型是基于所述样本用户的人群特征和用户画像特征训练得到的，所述样本用户的人群特征是根据所述样本用户所属的所述种子人群的所述人群包embedding向量得到的；

确定模块1560，用于根据所述人群包embedding向量和所述用户embedding向量之间的向量相似度，确定对所述种子人群进行扩散的扩散人群。

在一个可选的实施例中，所述装置还包括：订单截断模块1580；

所述确定模块1560，用于通过离线计算方式将目标种子人群的人群包embedding向量与每个用户的用户embedding向量相乘得到所述向量相似度，所述目标种子人群是所述m个种子人群中的一个；获取按照所述向量相似度由大到小排序的前k个用户；将所述前k个用户采用倒排索引进行存储，所述倒排索引中存储有所述用户和所述目标种子人群的对应关系；

所述订单截断模块1580，用于根据所述用户和所述目标种子人群的对应关系，在信息投放过程中进行订单截断；

其中，所述订单截断是指根据所述目标种子人群对应的广告订单为所述用户筛选候选投放广告的过程。

所述确定模块1560，用于通过线上计算方式将所述目标用户的用户embedding向量和每个种子人群的人群包embedding向量相乘得到所述向量相似度，所述目标用户是所述全量用户中的一个；获取按照所述向量相似度由大到小排序的前p个种子人群；

所述订单截断模块1580，用于根据所述目标用户和所述前p个种子人群的对应关系，在信息投放过程中进行订单截断；

其中，所述订单截断是指根据所述前p个种子人群对应的广告订单为所述目标用户筛选候选投放广告的过程。

图16是本申请实施例提供的一种服务器的结构框图。该服务器可以是广告平台中的服务器。具体来讲：

服务器1000包括中央处理单元(CPU)1001、随机存取存储器(RAM)1002和只读存储器(ROM)1003的系统存储器1004，以及连接系统存储器1004和中央处理单元1001的系统总线1005。服务器1000还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(I/O系统)1006，和用于存储操作系统1013、应用程序1014和其他程序模块1015的大容量存储设备1007。

基本输入/输出系统1006包括有用于显示信息的显示器1008和用于用户输入信息的诸如鼠标、键盘之类的输入设备1009。其中显示器1008和输入设备1009都通过连接到系统总线1005的输入输出控制器1010连接到中央处理单元1001。基本输入/输出系统1006还可以包括输入输出控制器1010以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地，输入输出控制器1010还提供输出到显示屏、打印机或其他类型的输出设备。

大容量存储设备1007通过连接到系统总线1005的大容量存储控制器(未示出)连接到中央处理单元1001。大容量存储设备1007及其相关联的计算机可读介质为服务器1000提供非易失性存储。也就是说，大容量存储设备1007可以包括诸如硬盘或者CD-ROM驱动器之类的计算机可读介质(未示出)。

不失一般性，计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM、EEPROM、闪存或其他固态存储其技术，CD-ROM、DVD或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然，本领域技术人员可知计算机存储介质不局限于上述几种。上述的系统存储器1004和大容量存储设备1007可以统称为存储器。

根据本申请的各种实施例，服务器1000还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器1000可以通过连接在系统总线1005上的网络接口单元1011连接到网络1012，或者说，也可以使用网络接口单元1011来连接到其他类型的网络或远程计算机系统(未示出)。

上述存储器还包括一个或者一个以上的程序，一个或者一个以上程序存储于存储器中，被配置由CPU执行。所述一个或者一个以上程序包含用于进行本申请实施例提供的神经网络模型的训练方法，和/或人群扩散方法的指令。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种神经网络模型的训练方法，其特征在于，所述方法包括：

根据样本用户所属的种子人群的人群包embedding向量，合并得到所述样本用户的人群特征；

将所述样本用户的人群特征和用户画像特征进行拼接，得到神经网络模型的输入层数据；

将所述输入层数据输入至神经网络模型中进行训练，得到预测误差；

2.根据权利要求1所述的训练方法，其特征在于，所述根据样本用户所属的种子人群的人群包embedding向量，合并得到所述样本用户的人群特征，包括：

当所述样本用户属于两个以上的种子人群时，初始化得到所述两个以上种子人群的人群包embedding向量；

将所述两个以上的种子人群的人群包embedding向量的对应维度值进行平均，合并得到所述样本用户的人群特征。

3.根据权利要求1所述的训练方法，其特征在于，所述根据样本用户所属的种子人群的人群包embedding向量，合并得到所述样本用户的人群特征，包括：

将所述两个以上的种子人群的人群包embedding向量的对应维度值取最大值，合并得到所述样本用户的人群特征。

4.根据权利要求2或3所述的训练方法，其特征在于，所述初始化得到所述两个以上种子人群的人群包embedding向量：

采用随机化方式对所述两个以上种子人群的人群包embedding向量进行初始化。

5.根据权利要求1至3任一所述的训练方法，其特征在于，所述用户画像特征包括：人口属性特征、设备特征、行为特征和标签特征中的至少一种。

6.根据权利要求1至3任一所述的训练方法，其特征在于，所述神经网络模型包括：k个隐藏层和一个分类层，k为正整数；

所述k个隐藏层采用的激活函数是修正线性单元ReLU；

7.根据权利要求1至3任一所述的训练方法，其特征在于，所述方法还包括：

对于全量用户中的每个用户，根据所述用户所属的种子人群的人群包embedding向量，合并得到所述用户的人群特征；

将所述用户的人群特征和用户画像特征进行拼接，得到所述神经网络模型的输入层数据；

将所述输入层数据输入所述神经网络模型进行预测，得到所述用户的用户embedding向量。

8.一种人群扩散方法，其特征在于，所述方法包括：

获取m个种子人群的人群包embedding向量，所述种子人群中包括多个样本用户，m为正整数；

获取全量用户中多个用户的用户embedding向量；所述人群包embedding向量和所述用户embedding向量是通过同一个神经网络模型得到的，所述神经网络模型是基于所述样本用户的人群特征和用户画像特征训练得到的，所述样本用户的人群特征是根据所述样本用户所属的所述种子人群的所述人群包embedding向量得到的；

9.根据权利要求8所述的方法，其特征在于，所述根据所述人群包embedding向量和所述用户embedding向量之间的向量相似度，确定对所述种子人群进行扩散的扩散人群，包括：

通过离线计算方式将目标种子人群的人群包embedding向量与每个用户的用户embedding向量相乘得到所述向量相似度，所述目标种子人群是所述m个种子人群中的一个；

获取按照所述向量相似度由大到小排序的前k个用户；

将所述前k个用户采用倒排索引进行存储，所述倒排索引中存储有所述用户和所述目标种子人群的对应关系；

所述方法还包括：

根据所述用户和所述目标种子人群的对应关系，在信息投放过程中进行订单截断；

10.根据权利要求8所述的方法，其特征在于，所述根据所述人群包embedding向量和所述用户embedding向量之间的向量距离，确定对所述种子人群进行扩散的扩散人群，包括：

通过在线计算方式将所述目标用户的用户embedding向量和每个种子人群的人群包embedding向量相乘得到所述向量相似度，所述目标用户是所述全量用户中的一个；

获取按照所述向量相似度由大到小排序的前p个种子人群；

所述方法还包括：

根据所述目标用户和所述前p个种子人群的对应关系，在信息投放过程中进行订单截断；

11.一种神经网络模型的训练装置，其特征在于，所述装置包括：

12.一种人群扩散装置，其特征在于，所述装置包括：

13.根据权利要求12所述的装置，其特征在于，所述装置还包括：订单截断模块；

所述确定模块，用于通过离线计算方式将目标种子人群的人群包embedding向量与每个用户的用户embedding向量相乘得到所述向量相似度，所述目标种子人群是所述m个种子人群中的一个；获取按照所述向量相似度由大到小排序的前k个用户；将所述前k个用户采用倒排索引进行存储，所述倒排索引中存储有所述用户和所述目标种子人群的对应关系；

所述订单截断模块，用于根据所述用户和所述目标种子人群的对应关系，在信息投放过程中进行订单截断；

14.根据权利要求12所述的装置，其特征在于，所述装置还包括：订单截断模块；

所述确定模块，用于通过线上计算方式将所述目标用户的用户embedding向量和每个种子人群的人群包embedding向量相乘得到所述向量相似度，所述目标用户是所述全量用户中的一个；获取按照所述向量相似度由大到小排序的前p个种子人群；

所述订单截断模块，用于根据所述目标用户和所述前p个种子人群的对应关系，在信息投放过程中进行订单截断；

15.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述指令、所述程序、所述代码集或所述指令集由所述处理器加载并执行以实现如权利要求1-7任一项所述的神经网络模型的训练方法，或如权利要求8-10任一项所述的人群扩散方法。

16.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述指令、所述程序、所述代码集或所述指令集由处理器加载并执行以实现如权利要求1-7任一项所述的神经网络模型的训练方法，或如权利要求8-10任一项所述的人群扩散方法。