CN112967100B

CN112967100B - 相似人群扩展方法、装置、计算设备以及介质

Info

Publication number: CN112967100B
Application number: CN202110362949.6A
Authority: CN
Inventors: 曹偲; 蒋能学; 徐可; 王梓良; 马雨浩; 郑玮; 王成林
Original assignee: Hangzhou Netease Cloud Music Technology Co Ltd
Current assignee: Hangzhou Netease Cloud Music Technology Co Ltd
Priority date: 2021-04-02
Filing date: 2021-04-02
Publication date: 2024-03-15
Anticipated expiration: 2041-04-02
Also published as: CN112967100A

Abstract

本公开实施例提供了一种相似人群扩展方法、装置、计算设备以及介质，涉及计算机技术领域。该方法包括：对种子用户集中各个种子用户进行聚类处理，得到多个用户类簇；基于用户类簇内各个种子用户的用户行为数据确定用户类簇的价值系数；确定多个候选用户中每个候选用户与各个用户类簇的相似度；基于候选用户与各个用户类簇对应的相似度以及价值系数，确定候选用户的用户价值分；基于用户价值分，从多个候选用户中选取目标候选用户作为种子用户集的相似人群。根据本公开实施例的技术方案，能够根据用户具有的潜在广告投放价值大小进行相似人群扩展，使得生成的扩展用户能够最大程度匹配所投放的广告内容，提高所投放广告的转化率。

Description

相似人群扩展方法、装置、计算设备以及介质

技术领域

本公开的实施方式涉及计算机技术领域，更具体地，本公开的实施方式涉及相似人群扩展方法、相似人群扩展装置、计算设备以及介质。

背景技术

本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

随着互联网技术的发展，越来越多的广告主通过互联网广告平台投放广告，如何提高广告平台上的广告投放效果成为了关注的焦点。

在相关技术方案中，采用相似人群扩展的方式寻找与种子用户相似的候选用户，对候选用户进行广告投放，例如，根据种子用户在不同维度的用户特征对种子用户进行分类，得到多个用户类簇，选取与各个用户类簇相似的候选用户进行广告投放。

发明内容

但是，上述技术方案中，在对种子用户进行相似人群扩展时，没有考虑用户之间的差异，难以为所投放的广告内容筛选出具有较高潜在转化率的用户。

为此，非常需要一种改进的相似人群扩展方法、相似人群扩展装置、计算设备以及介质。

在本公开实施例的第一方面中，提供了一种相似人群扩展方法，包括：对种子用户集中各个种子用户进行聚类处理，得到多个用户类簇；基于所述用户类簇内各个种子用户的用户行为数据确定所述用户类簇的价值系数，所述价值系数用于衡量所述用户类簇内的种子用户的价值；确定多个候选用户中每个候选用户与各个用户类簇的相似度；基于所述候选用户与各个用户类簇对应的所述相似度以及所述价值系数，确定所述候选用户的用户价值分；基于所述用户价值分，从所述多个候选用户中选取目标候选用户作为所述种子用户集的相似人群。

根据第一方面，在本公开的一些实施例中，所述用户行为数据包括在预定时间段的点击行为数据，所述基于所述用户类簇内各个种子用户的用户行为数据确定所述用户类簇的价值系数，包括：基于所述点击行为数据，确定各个用户类簇内的种子用户的总点击次数以及对应的总曝光次数；将所述总点击次数与所述总曝光次数的比值，作为所述用户类簇的价值系数。

根据第一方面，在本公开的一些实施例中，所述基于所述候选用户与各个用户类簇对应的所述相似度以及所述价值系数，确定所述候选用户的用户价值分，包括：将所述候选用户与所述用户类簇对应的所述价值系数与所述相似度进行加权运算；将加权运算的结果作为所述候选用户与所述用户类簇对应的类簇价值分；基于所述候选用户与各个所述用户类簇对应的类簇价值分，确定所述候选用户的用户价值分。

根据第一方面，在本公开的一些实施例中，所述基于所述候选用户与各个用户类簇对应的所述相似度以及所述价值系数，确定所述候选用户的用户价值分，包括：基于所述候选用户与各个所述用户类簇对应的所述相似度的大小，确定所述候选用户所属的用户类簇；将所述候选用户所属的用户类簇的价值系数，作为所述候选用户的用户价值分。

根据第一方面，在本公开的一些实施例中，所述基于所述用户价值分，从所述多个候选用户中选取目标候选用户作为所述种子用户集的相似人群，包括：基于各个候选用户的所述用户价值分对所述多个候选用户进行排序；按照排序的结果选取预定数量的目标候选用户作为所述种子用户集的相似人群。

根据第一方面，在本公开的一些实施例中，所述确定多个候选用户中每个候选用户与各个用户类簇的相似度，包括：获取所述候选用户的用户特征向量以及各个所述用户类簇的类簇中心向量；确定所述用户特征向量与各个所述类簇中心向量之间的距离；基于所述距离确定所述用户特征向量与各个所述类簇中心向量之间的相似度。

根据第一方面，在本公开的一些实施例中，所述对种子用户集中各个种子用户进行聚类处理，包括：获取种子用户集中各个种子用户的特征向量，所述特征向量包括用户特征以及待推荐对象的特征；基于各个种子用户的特征向量，对种子用户集中各个种子用户进行聚类处理。

根据第一方面，在本公开的一些实施例中，所述方法还包括：采用双塔模型获取所述种子用户的所述特征向量，所述双塔模型包括用户塔网络和待推荐对象塔网络。

根据第一方面，在本公开的一些实施例中，所述方法还包括：周期性地获取所述种子用户的用户特征以及所述待推荐对象的对象特征；基于所述用户特征以及所述对象特征对所述双塔模型进行训练。

根据第一方面，在本公开的一些实施例中，所述基于所述用户特征以及所述对象特征对所述双塔模型进行训练，包括：将所述用户特征输入所述用户塔网络，得到所述种子用户的用户嵌入向量；将所述对象特征输入所述待推荐对象塔网络，得到所述待推荐对象的对象嵌入向量；确定所述用户嵌入向量与所述对象嵌入向量的相似度，基于所述相似度通过激活函数确定预测值，所述预测值为表示所述用户特征与所述对象特征相似程度的值；基于标签值与预测值确定所述双塔模型的损失函数，基于所述损失函数对所述双塔网络进行训练。

在本公开实施例的第二方面中，提供了一种相似人群扩展装置，包括：聚类处理模块，用于对种子用户集中各个种子用户进行聚类处理，得到多个用户类簇；类簇价值确定模块，用于基于所述用户类簇内各个种子用户的用户行为数据确定所述用户类簇的价值系数，所述价值系数用于衡量所述用户类簇内的种子用户的价值；相似度确定模块，用于确定多个候选用户中每个候选用户与各个用户类簇的相似度；价值分确定模块，用于基于所述候选用户与各个用户类簇对应的所述相似度以及所述价值系数，确定所述候选用户的用户价值分；扩展模块，用于基于所述用户价值分，从所述多个候选用户中选取目标候选用户作为所述种子用户集的相似人群。

根据第二方面，在本公开的一些实施例中，所述用户行为数据包括在预定时间段的点击行为数据，所述类簇价值确定模块具体用于：基于所述点击行为数据，确定各个用户类簇内的种子用户的总点击次数以及对应的总曝光次数；将所述总点击次数与所述总曝光次数的比值，作为所述用户类簇的价值系数。

根据第二方面，在本公开的一些实施例中，所述价值分确定模块具体用于：将所述候选用户与所述用户类簇对应的所述价值系数与所述相似度进行加权运算；将加权运算的结果作为所述候选用户与所述用户类簇对应的类簇价值分；基于所述候选用户与各个所述用户类簇对应的类簇价值分，确定所述候选用户的用户价值分。

根据第二方面，在本公开的一些实施例中，所述价值分确定模块具体还用于：基于所述候选用户与各个所述用户类簇对应的所述相似度的大小，确定所述候选用户所属的用户类簇；将所述候选用户所属的用户类簇的价值系数，作为所述候选用户的用户价值分。

根据第二方面，在本公开的一些实施例中，所述扩展模块具体用于：基于各个候选用户的所述用户价值分对所述多个候选用户进行排序；按照排序的结果选取预定数量的目标候选用户作为所述种子用户集的相似人群。

根据第二方面，在本公开的一些实施例中，所述相似度确定模块具体用于：获取所述候选用户的用户特征向量以及各个所述用户类簇的类簇中心向量；确定所述用户特征向量与各个所述类簇中心向量之间的距离；基于所述距离确定所述用户特征向量与各个所述类簇中心向量之间的相似度。

根据第二方面，在本公开的一些实施例中，所述聚类处理模块具体用于：获取种子用户集中各个种子用户的特征向量，所述特征向量包括用户特征以及待推荐对象的特征；基于各个种子用户的特征向量，对种子用户集中各个种子用户进行聚类处理。

根据第二方面，在本公开的一些实施例中，所述装置还包括：特征确定模块，用于采用双塔模型获取所述种子用户的所述特征向量，所述双塔模型包括用户塔网络和待推荐对象塔网络。

根据第二方面，在本公开的一些实施例中，所述装置还包括：周期性获取模块，用于周期性地获取所述种子用户的用户特征以及所述待推荐对象的对象特征；训练模块，用于基于所述用户特征以及所述对象特征对所述双塔模型进行训练。

根据第二方面，在本公开的一些实施例中，所述训练模块具体用于：将所述用户特征输入所述用户塔网络，得到所述种子用户的用户嵌入向量；将所述对象特征输入所述待推荐对象塔网络，得到所述待推荐对象的对象嵌入向量；确定所述用户嵌入向量与所述对象嵌入向量的相似度，基于所述相似度通过激活函数确定预测值，所述预测值为表示所述用户特征与所述对象特征相似程度的值；基于标签值与预测值确定所述双塔模型的损失函数，基于所述损失函数对所述双塔网络进行训练。

在本公开实施例的第三方面中，提供了一种计算设备，包括：处理器和存储器，所述存储器存储有可执行指令，所述处理器用于调用所述存储器存储的可执行指令执行如上述第一方面中任一项所述的方法。

在本公开实施例的第四方面中，提供了一种介质，其上存储有程序，该程序被处理器执行时实现如上述第一方面中任一项所述的方法。

根据本公开实施例的技术方案，一方面，对种子用户进行聚类得到多个用户类簇，基于用户类簇内种子用户的用户行为数据例如点击率确定该用户类簇的价值系数，能够得到或赋予不同的用户类簇相应的广告投放价值；另一方面，基于候选用户与用户类簇对应的相似度以及价值系数，确定候选用户的用户价值分，基于用户价值分进行相似人群扩展，能够根据用户具有的潜在广告投放价值大小进行相似人群扩展，使得生成的扩展用户能够最大程度匹配所投放的广告内容，提高所投放广告的转化率，同时也能够提高广告系统整体流量的利用率。

附图说明

通过参考附图阅读下文的详细描述，本公开示例性实施例的上述以及其他目的、特征和优点将变得易于理解。在附图中，以示例性而非限制性的方式示出了本公开的若干实施方式，其中：

图1示意性地示出了根据本公开实施例的相似人群扩展方法的应用场景的示意图；

图2示意性地示出了根据本公开的一些实施例的相似人群扩展方法的流程图；

图3示意性地示出了根据本公开的一些实施例的双塔模型的示意图；

图4示意性地示出了实施根据本公开的一些实施例的相似人群扩展方法的相似人群扩展系统的架构示意图；

图5示意性地示出了根据本公开的一些实施例的用户价值统计模块的示意图；

图6示意性地示出了根据本公开的一些实施例的曝光点击数据格式的示意图；

图7示意性地示出了根据本公开的一些实施例的聚合数据格式的示意图；

图8示意性地示出了根据本公开的一些实施例的计算机可读存储介质的示意图；

图9示意性地示出了根据本公开的一些实施例的相似人群扩展装置的结构示意图；

图10示意性示出了根据本公开的一些实施例的计算设备的结构示意图。

在附图中，相同或对应的标号表示相同或对应的部分。

具体实施方式

下面将参考若干示例性实施例来描述本公开的原理和精神。应当理解，给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本公开，而并非以任何方式限制本公开的范围。相反，提供这些实施方式是为了使本公开更加透彻和完整，并且能够将本公开的范围完整地传达给本领域的技术人员。

本领域技术人员知道，本公开的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此，本公开可以具体实现为以下形式，即：完全的硬件、完全的软件(包括固件、驻留软件、微代码等)，或者硬件和软件结合的形式。

根据本公开的实施方式，提出了一种相似人群扩展方法、装置、计算设备和介质。

在本文中，需要理解的是，所涉及的术语：

相似人群扩展：基于广告主提供的种子用户，通过一定的算法评估，找到更多具有高潜在价值的相似人群，从而帮助广告主精准定向受众目标，降低广告的转化成本。

种子用户：对于广告主来说的高价值用户，例如广告主提供的认为符合其广告投放要求的受众用户，通常是广告主的成功转化用户。

价值系数：用于衡量用户类簇内的种子用户的广告投放价值。例如，用户类簇内的种子用户的点击率或转化率越高，则价值系数越大。

用户价值分：用于衡量用户具有的潜在广告投放价值。

此外，附图中的任何元素数量均用于示例而非限制，以及任何命名都仅用于区分，而不具有任何限制含义。

下面参考本公开的若干代表性实施方式，详细阐释本公开的原理和精神。

发明概述

本发明人发现，为了解决如何提高广告投放效果的问题，在一种技术方案中，通过特征提取模型得到种子用户和候选用户的特征向量；根据种子用户的特征向量对种子用户进行聚类，得到k个聚类中心向量；确定候选用户的特征向量与各个聚类中心向量的相似度，根据相似度大小选择预设数量的候选用户。然而，该技术方案在对种子用户进行相似人群扩展时，没有考虑用户之间广告投放价值的差异，难以为所投放的广告内容筛选出具有较高潜在转化率的用户。

基于上述内容，本公开的基本思想在于：对种子用户进行聚类得到多个用户类簇，基于用户类簇内种子用户的用户行为数据例如点击率确定该用户类簇的价值系数，基于候选用户与用户类簇对应的相似度以及价值系数，确定候选用户的用户价值分，基于用户价值分进行相似人群扩展。根据本公开实施例的技术方案，一方面，对种子用户进行聚类得到多个用户类簇，基于用户类簇内种子用户的用户行为数据例如点击率确定该用户类簇的价值系数，能够得到或赋予不同的用户类簇相应的广告投放价值；另一方面，基于候选用户与用户类簇对应的相似度以及价值系数，确定候选用户的用户价值分，基于用户价值分进行相似人群扩展，能够根据用户具有的潜在广告投放价值大小进行相似人群扩展，使得生成的扩展用户能够最大程度匹配所投放的广告内容，提高所投放广告的转化率，同时也能够提高广告系统整体流量的利用率。

在介绍了本公开的基本原理之后，下面具体介绍本公开的各种非限制性实施方式。

应用场景总览

需要注意的是，下述应用场景仅是为了便于理解本公开的精神和原理而示出，本公开的实施方式在此方面不受任何限制。相反，本公开的实施方式可以应用于适用的任何场景。

图1示意性地示出了根据本公开实施例的相似人群扩展方法的应用场景的框图。

参照图1所示，该应用场景可以包括：至少一个客户端110以及服务器120，其中，客户端110上安装有能够进行广告投放的应用程序，服务器120用于对客户端110进行广告投放。客户端110与服务器120之间通过网络130进行通信。以购物应用程序的广告投放场景为例，客户端110上安装有购物应用程序，服务器120获取客户端110上的购物应用程序的用户行为数据，确定种子用户集；对种子用户集中各个种子用户进行聚类处理，得到多个用户类簇；基于用户类簇内各个种子用户的用户行为数据确定用户类簇的价值系数，价值系数用于衡量用户类簇内的种子用户的价值；确定多个候选用户中每个候选用户与各个用户类簇的相似度；基于候选用户与各个用户类簇对应的相似度以及价值系数，确定候选用户的用户价值分；基于用户价值分，从多个候选用户中选取目标候选用户作为种子用户集的相似人群，基于相似人群在客户端110的购物应用程序上进行广告投放。

需要说明的是，虽然以购物应用程序的广告投放场景为例进行说明，但是本领域普通技术人员应该理解的是，本公开示例实施例中相似人群扩展方法还可以应用于其他适当的广告投放场景例如社交软件中的广告投放场景、音乐播放软件中的广告投放场景等，本公开对此不进行特殊限定。

进一步地，客户端110可以为手机、平板电脑、台式计算机、便携笔记本式计算机或车载式终端等。服务器120可以为包含独立主机的物理服务器，或者为主机集群承载的虚拟服务器，或者为云服务器。网络130可以为有线网络或无线网络，例如，网络130可以为PSTN(Public Switched Telephone Network，公共交换电话网络)或因特网。

示例性方法

下面结合上述的应用场景，参考图2来描述根据本公开示例性实施例的相似人群扩展方法。该相似人群扩展方法可以应用于图1的服务器120。需要注意的是，上述应用场景仅是为了便于理解本公开的精神和原理而示出，本公开的实施例在此方面不受任何限制。相反，本公开的实施例可以应用于适用的任何场景。

参照图2所示，在步骤S210中，对种子用户集中各个种子用户进行聚类处理，得到多个用户类簇。

在示例实施例中，可以采用聚类模型对种子用户集中各个种子用户进行聚类处理，得到多个用户类簇。聚类模型可以为k-means聚类模型、基于密度的聚类模型，也可以为其他适当的聚类模型例如高斯混合模型或均值漂移聚类模型等，这同样在本公开的保护范围内。

以购物应用程序的广告推荐场景为例，采用k-means聚类模型对种子用户集中各个种子用户进行聚类处理，种子用户集可以为已购买待投放广告对应商品的用户的集合，聚类处理的流程如下：(1)首先输入k的值，k表示有k个聚类中心向量，即聚类得到的用户类簇的个数；(2)从种子用户集中随机选取k个种子用户的特征向量作为初始的聚类中心向量，用户的特征向量可以包括用户特征，也可以包括用户特征和用户偏好的商品特征；(3)对种子用户集中每个种子用户的特征向量，计算与每一个聚类中心向量的距离，取距离最近的聚类中心向量的类别作为该种子用户的类别；(4)对于k个用户类簇，计算用户类簇内所有种子用户的特征向量的平均向量作为新的聚类中心向量；(5)重复执行步骤(3)和步骤(4)，得到k个聚类中心向量即k个用户类簇以及每个用户所属的用户类簇。用户类簇代表的类型可以表示用户所偏好的商品的类型例如型号、尺寸、颜色等参数。

需要说明的是，距离可以为欧式距离或曼哈顿距离，也可以为其他适当的距离例如切比雪夫距离或汉明距离等，这同样在本公开的保护范围内。

在步骤S220中，基于用户类簇内各个种子用户的用户行为数据确定用户类簇的价值系数，价值系数用于衡量用户类簇内的种子用户的价值。

在示例实施例中，价值系数用于衡量用户类簇内的种子用户的价值，例如，价值系数可以用于衡量用户类簇内种子用户点击广告的点击概率，或者用于衡量用户类簇内种子用户购买广告对应商品的购买概率。以购物应用程序的广告推荐场景为例，价值系数可以衡量用户类簇内的种子用户购买广告对应商品的概率。

需要说明的是，虽然点击概率或者购买概率为例对价值系数进行说明，但是本领域普通技术人员应该理解的是，价值系数还可以为其他适当的值，例如观看广告的时长或收藏广告商品的概率等，这同样在本公开的保护范围内。

进一步地，在一些示例实施例中，用户行为数据包括在预定时间段的点击行为数据，基于用户类簇内各个种子用户的点击行为数据，确定用户类簇的价值系数。举例而言，基于用户类簇内各个种子用户的点击行为数据，确定各个用户类簇内的种子用户的总点击次数以及对应的广告总曝光次数；将总点击次数与广告总曝光次数的比值，作为用户类簇的价值系数。

需要说明的是，用户行为数据还可以包括其他适当的行为数据，以购物应用程序的广告推荐场景为例，用户行为数据还可以包括收藏商品行为数据、购买商品行为数据等，这同样在本公开的保护范围内。

进一步地，在另一些示例实施例中，以购物应用程序的广告推荐场景为例，基于用户类簇内各个种子用户的点击后购买商品行为数据，确定各个用户类簇内的种子用户的总购买次数以及对应的广告总点击次数；将总购买次数与广告总点击次数的比值，作为用户类簇的价值系数。

在步骤S230中，确定多个候选用户中每个候选用户与各个用户类簇的相似度。

在示例实施例中，获取候选用户的用户特征向量以及各个用户类簇的类簇中心向量；确定用户特征向量与各个类簇中心向量之间的距离，根据距离确定用户特征向量与类簇中心向量之间的相似度。

在步骤S240中，基于候选用户与各个用户类簇对应的相似度以及价值系数，确定候选用户的用户价值分。

在一些示例实施例中，将候选用户与用户类簇对应的价值系数与相似度进行加权运算；将加权运算的结果作为候选用户与用户类簇对应的类簇价值分；基于候选用户与各个用户类簇对应的类簇价值分，确定候选用户的用户价值分。例如，将候选用户与用户类簇对应的价值系数与相似度进行相乘；将相乘运算的结果作为候选用户与用户类簇对应的类簇价值分；从候选用户与各个用户类簇对应的类簇价值分中，选取最大的类簇价值分，作为候选用户的用户价值分。

在另一些示例实施例中，基于候选用户与各个用户类簇对应的相似度的大小，确定候选用户所属的用户类簇；将候选用户所属的用户类簇的价值系数，作为候选用户的用户价值分。

在步骤S250中，基于用户价值分，从多个候选用户中选取目标候选用户作为种子用户集的相似人群。

在示例实施例中，基于各个候选用户的用户价值分对多个候选用户进行排序；按照排序的结果选取预定数量的目标候选用户作为种子用户集的相似人群。举例而言，在得到各个候选用户的用户价值分之后，按照用户价值分从大到小的顺序对候选用户进行排序，根据人群扩展需求，选取前预定数量个候选用户作为扩展的相似人群。

根据图2的示例实施例的技术方案，一方面，对种子用户进行聚类得到多个用户类簇，基于用户类簇内种子用户的用户行为数据例如点击率确定该用户类簇的价值系数，能够得到或赋予不同的用户类簇相应的广告投放价值；另一方面，基于候选用户与用户类簇对应的相似度以及价值系数，确定候选用户的用户价值分，基于用户价值分进行相似人群扩展，能够根据用户具有的潜在广告投放价值大小进行相似人群扩展，使得生成的扩展用户能够最大程度匹配所投放的广告内容，提高所投放广告的转化率，同时也能够提高广告系统整体流量的利用率。

此外，为了根据广告主的广告投放需求更好地进行相似人群扩展，在对用户进行聚类时，考虑使用包含用户维度和广告维度的特征向量进行聚类。因此，在示例实施例中，获取种子用户集中各个种子用户的特征向量，特征向量包括用户特征以及待推荐对象的特征。举例而言，可以采用双塔模型获取种子用户的特征向量，双塔模型包括用户塔网络和待推荐对象塔网络。

进一步地，在示例实施例中，将用户特征输入用户塔网络，得到种子用户的用户嵌入向量；将对象特征输入所述待推荐对象塔网络，得到待推荐对象的对象嵌入向量；确定用户嵌入向量与对象嵌入向量的相似度，基于相似度通过激活函数确定预测值，预测值为表示用户特征与对象特征相似程度的值；基于标签值与预测值确定所述双塔模型的损失函数，基于损失函数对双塔网络进行训练。下面，结合图3对本公开示例实施例中的双塔模型进行详细的说明。

参照图3所示的双塔模型的模型结构示意图，模型自下而上输入用户特征310和广告特征320，用户特征310和广告特征320分别经过嵌入层330和嵌入层340即EmbeddingLayer转化为嵌入向量，之后分别经过若干多层感知机350和多层感知机360(图中示例为3层)进行特征提取，分别得到用户嵌入向量和广告嵌入向量，例如最后一层多层感知机输出的嵌入向量可以是32维的向量。该模型从形式上看，像是左右两个塔，因此称之为双塔模型，用户侧称为用户塔网络350，广告侧称为广告塔网络360即待推荐对象塔网络。用户塔网络350的最后一层输出的用户嵌入向量与广告塔网络360最后一层的输出的广告嵌入向量进入到相似计算层370，相似计算层370计算用户嵌入向量和广告嵌入向量的相似度例如余弦相似度，得到的相似度结果输入到激活函数380例如sigmoid函数，通过激活函数380得到用户嵌入向量和广告特征向量的相似预测值p，基于相似预测值p与真实相似标签值y计算损失函数loss，基于损失函数计算梯度并从上到下反向传播，更新模型参数值。其中，双塔模型中用户塔网络350的最后一层的输出作为用户的特征向量或嵌入向量embedding表示。

进一步地，模型训练可以采用随机梯度下降方法求解模型参数，优化器为Adagrad，并添加正则项例如dropout和L2减少模型过拟合。模型训练目标为最小化损失函数loss，损失函数loss可以通过下式(1)来计算：

其中，loss为损失函数，yi为待预测对象向量与用户向量的相似标签值，p为yi对应的预测值，评估指标可以为AUC(Area Under the Curve，ROC曲线下的面积)、召回率等。

此外，在示例实施例中，周期性地获取种子用户的用户特征以及待推荐对象的对象特征；基于用户特征以及对象特征对双塔模型进行训练。通过周期性地例如每天训练双塔模型，能够保证及时捕捉到用户的兴趣迁移，将用户的行为变化更新到用户嵌入向量或特征向量中。

根据图3的示例实施例中的技术方案，根据用户特征和广告特征对种子用户进行聚类，能够同时考虑用户特征和广告特征进行广告投放，从而能够针对不同广告主的扩展需求更精准地进行广告投放。

图4示意性地示出了实施根据本公开的一些实施例的相似人群扩展方法的相似人群扩展系统的架构示意图。

参照图4所示，样本处理模块405用于获取样本数据，样本数据包括用户数据、广告数据以及用户是否点击广告的数据。特征获取模块410用于从样本处理模块405获取样本数据，从样本数据中提取用户特征、广告特征以及是否点击的标签数据。双塔模型训练模块415用于基于用户特征、广告特征以及标签数据训练双塔模型，这样在建模时就同时考虑了用户特征和广告特征。种子用户特征生成模块420用于基于训练完成的双塔模型对种子用户进行预测，获取对应的种子用户的特征向量例如32维度的嵌入embedding向量。候选用户特征生成模块430用于对候选用户进行预测，获取对应的候选用户的特征向量例如32维的嵌入embedding向量。种子用户聚类模块425用于根据种子用户的特征向量或嵌入embedding向量，进行聚类处理例如k-means聚类，得到k个聚类中心向量(例如，k＝20)。用户价值统计模块445根据日志收集处理模块440收集的日志，统计每个种子用户预定时间段的点击曝光情况，例如统计点击率。用户类簇价值计算模块450用于对种子用户聚类结果的每个用户类簇，计算该用户类簇内所有种子用户的点击数与曝光数的比值，得到该用户类簇的平均点击率，以此作为该用户类簇或聚类中心的价值系数。相似人群扩展模块435计算候选用户的特征向量与每个用户类簇的聚类中心向量的相似度例如余弦相似度，并乘上对应用户类簇的价值系数，作为候选用户对于该用户类簇的类簇价值分，因此，每个候选用户可以得到k个(k＝20)类簇价值分，取最大的用户价值分作为候选用户的用户价值分。相似人群扩展模块435根据用户价值分从大到小的顺序对多个候选用户进行排序，取前预设数量例如前100个候选用户作为相似人群扩展的扩展用户。在获得扩展用户之后，即可对扩展用户进行广告投放。下面，对图4中的各个模块进行详细的说明。

种子用户特征生成模块420在双塔模型训练完成后，从样本处理模块405获取种子用户的特征，通过双塔模型进行模型预测，得到种子用户的用户嵌入embedding向量，并写入指定的文件系统例如HDFS(Hadoop Distributed File System，Hadoop分布式文件系统)供后续处理使用。

候选用户特征生成模块430在双塔模型训练完成后，从样本处理模块405获取候选用户的特征，通过双塔模型进行模型预测，得到候选用户的用户嵌入embedding向量，并写入指定的文件系统例如HDFS供后续处理使用。

种子用户聚类模块425对种子用户进行聚类处理例如k-means聚类，以k(例如k＝20)个聚类中心向量作为种子用户集的用户类簇代表。k-means聚类的流程如下：(1)首先输入k的值，k表示有k个聚类中心向量，即聚类得到的用户类簇的个数；(2)从种子用户集中随机选取k个种子用户的特征向量作为初始的聚类中心向量，用户的特征向量可以包括用户特征，也可以包括用户特征和用户偏好的商品特征；(3)对种子用户集中每个种子用户的特征向量，计算与每一个聚类中心向量的距离，取距离最近的聚类中心向量的类别作为该种子用户的类别；(4)对于k个用户类簇，计算用户类簇内所有种子用户的特征向量的平均向量作为新的聚类中心向量；(5)重复执行步骤(3)和步骤(4)，得到k个聚类中心向量即k个用户类簇以及每个用户所属的用户类簇。

下面，以k＝2，特征向量或嵌入向量的维度为2为例，举例说明k-means聚类流程：

假如有6个种子用户，user1、user2、user3、user4、user5、user6，6个种子用户对应的特征向量分别为e1、e2、e3、e4、e5、e6，其中e1＝(1.1,0.1)、e2＝(0.12,1.2)、e3＝(1.08,0.11)、e4＝(1.11,0.09)、e5＝(0.09,1.11)、e6＝(0.10,1.10)。

(1)输入k＝2，表示聚类的用户类簇个数为2；

(2)从种子用户中随机选取2个种子用户的嵌入向量作为初始聚类中心向量，假设随机选取的嵌入向量为e1和e4，e1表示用户类簇1的聚类中心c1，e4表示用户类簇2的聚类中心c2；

(3)对种子用户集中的每个种子用户的嵌入向量，计算与每一个用户类簇的聚类中心向量的欧几里得距离，取距离最近的聚类中心向量的类别作为该种子用户的类别：

对于用户user1，其嵌入向量e1与聚类中心向量c1和c2的欧式距离分别为下式(2)和(3)：

由于d1<d2，即聚类中心向量c1距离用户user1更近，因此，取聚类中心向量c1的类别，也就是用户类簇1，作为user1的类别。

对于user2，其嵌入向量e2与聚类中心向量c1和c2的欧式距离分别为下式(4)和(5)：

由于，d1>d2，即聚类中心向量c2距离user2更近，取聚类中心向量c2的类别，也就是用户类簇2，作为user2的类别。

同理，对于user3、user4、user5、user6都可以得到相应的类别，分别为:用户类簇1，用户类簇2，用户类簇1，用户类簇1。

(4)对于k＝2个用户类簇，计算用户类簇内所有用户的嵌入向量的平均向量作为新的聚类中心向量；

对于用户类簇1，其包含的用户为user1、user3、user5、user6，取这四个用户的平均嵌入向量为新的聚类中心向量，即e1、e3、e5、e6的平均值((1.1+1.08+0.09+0.1)/4，(0.1+0.11+1.11+1.10)/4)也就是向量(0.5925，0.605)作为新的聚类中心向量。

对于用户类簇2，其包含的用户为user2、user4，取这2个用户的平均嵌入向量为新的聚类中心，即e2,e4的平均值((0.12+1.11)/2，(1.2+0.09)/2)也就是(0.615，0.645)作为新的聚类中心。

因此，得到了两个新的聚类中心向量为c1＝(0.5925，0.605)，c2＝(0.615，0.645)

(5)重复步骤(3)、(4)若干次例如100次。可以得到每个种子用户最终的所属的用户类簇以及该用户类簇的聚类中心向量。

用户价值统计模块445用于统计每个种子用户预定时间段的点击曝光情况，例如统计点击率。不同种子用户对于广告转换率的贡献价值是不同的，因此，可以将广告点击率作为用户的价值度量，通过用户价值统计模块445计算得到用户的点击曝光情况。

参照图5所示，用户价值统计模块445包括点击日志获取单元510、曝光日志获取单元520、消息队列单元530、离线处理单元540、离线存储单元550以及数据库560。其中，点击日志或单元510用于获取种子用户的对广告的点击日志，曝光日志获取单元520用于获取广告的曝光日志，广告的曝光日志和点击日志被发送到消息队列单元530，消息队列单元530用于通过队列的形式组织广告的点击日志和曝光日志，离线处理单元540从消息队列单元530获取点击日志和曝光日志，将日志解析、转化之后存储至离线存储单元550对应的数据库560。其中，广告的曝光数据和点击数据会解析成如图6的形式，其中，曝光数据包括：req_uid(请求标识)，user_id(用户标识)，sponsor_id(广告主标识)，exp_time(曝光时间)，exposure(是否曝光)；点击数据包括：req_uid(请求标识)，user_id(用户标识)，sponsor_id(广告主标识)，click_time(点击时间)，click(是否点击)

离线处理单元540根据请求标识req_uid将曝光日志和点击日志进行关联，之后对日志进行聚合，得到用户对广告主的曝光点击数据，新的聚合数据形式如图7所示，其中，聚合数据包括：req_uid(请求标识)，user_id(用户标识)，sponsor_id(广告主标识)，exp_time(曝光时间)，exp_num(曝光次数)，click_num(点击次数)。

在得到用户的曝光、点击统计信息之后，将用户点击次数除以曝光此书就可以得到用户的点击率，即用户价值度量。离线处理单元540在得到用户的聚合数据之后将聚合数据写入离线存储单元550。数据库560定时从离线存储单元550取出格式化的用户聚合数据，插入数据库560中。当需要查询指定时间内用户的价值度量即点击率时，可以根据曝光时间和用户标识进行筛选。离线处理单元540可以为Spark、MapReduce等，离线存储单元550可以为HDFS。

用户类簇价值计算模块450用于计算每个用户类簇内所有种子用户的点击数与曝光数的比值，得到该用户类簇的平均点击率，以平均点击率作为该用户类簇或聚类中心的价值系数。为了体现不同的种子用户在人群扩展时的价值不同，可以赋予不同用户类簇不同的价值系数，例如价值系数可以为平均点击率。在示例实施例中，该价值系数的计算方法如下：

(1)从种子用户聚类模块425的聚类结果中获得每个种子用户的user_id(用户标识)和所属的用户类簇即cluster_id，记为data1；

(2)以user_id、exp_time和sponsor_id为查询条件，从离线处理单元540生成的聚合数据中抽取预定时间段例如一个月内种子用户的聚合数据，记为data2；

(3)以user_id为关键字段，将data1和data2进行关联聚合，可以得到每个种子用户在一个月内的所有曝光点击数据以及所属用户类簇，形式如下：

user_id(用户标识)，exp_sum_1m(曝光总次数)，click_sum_1m(点击总次数)，cluster_id(用户类簇)

(4)按照用户类簇cluster_id进行聚合，可以得到每个聚类中心的曝光总次数exp_sum_1m和点击总次数click_sum_1m，可以通过下式(6)计算价值系数：

importance＝click_sum_1m/exp_sum_1m (6)

其中，importance为每个聚类中心的价值系数，该价值系数用于计算每个用户的用户价值分。

下面，举例说明计算用户类簇的价值系数的过程。假设用户类簇的数量为2，现有6个种子用户user1、user2、…、user6，其，对应的用户类簇的类别分别为c1、c2、c1、c1、c2、c2。价值系数的计算流程如下：

(1)获得每个种子用户的user_id(用户标识)和所属的用户类簇的类别cluster_id，记为data1；

即查询上述6个user_id，在近一个月内的exp_time范围内，sponsor_id不限的条件下，6个种子用户的聚合数据；

(3)以user_id为关键字段，将data1和data2进行关联聚合，可以得到每个种子用户在一个月内的所有曝光点击数据以及所属用户类簇的类别，形式如下：

user_id(用户标识)，exp_sum_1m(曝光总次数)，click_sum_1m(点击总次数)，cluster_id(用户类簇)。假设聚合得到的数据为下表1所示：

表1.预定时间段内的聚合数据

(4)根据上表1中的数据按照cluster_id进行聚合，可以得到每个聚类中心的曝光总次数exp_sum_1m和点击总次数click_sum_1m。即把步骤(3)中的数据分别聚合为用户类簇c1和c2的数据，结果如下表2所示：

表2.预定时间段内的总点击曝光数据

cluster_id	exp_sum_1m	click_sum_1m
			c1	300	47
c2	300	79

通过上式(6)计算每个聚类中心的价值系数importance：

对于用户类簇c1，importance＝click_sum_1m/exp_sum_1m＝47/300＝0.1567

对于用户类簇c2，importance＝click_sum_1m/exp_sum_1m＝79/300＝0.2633

相似人群扩展模块435用于对于每个候选用户(user_i，embedding_i)，分别计算候选用户的嵌入向量与各个用户类簇的聚类中心向量cluster_j的相似度，基于候选用户与用户类簇对应的相似度以及价值系数，确定候选用户的类簇价值分score_ij，从类簇价值分中选取最大值作为用户价值分用户价值分越大，表示该用户对于广告转换率的贡献价值，返回结果的排序越靠前。在生成相似人群扩展结果之前，需要计算用户的用户价值分，计算用户价值分的核心流程如表3所示。

表3.计算用户扩展得分伪代码

其中，user_i表示用户i的用户标识；embedding_i表示用户i的嵌入向量；lookalike_j表示聚类中心j的embedding向量；importance_j表示聚类中心j的价值系数；score_ij表示用户user_i相对于用户类簇的聚类中心lookalike_j的类簇价值分；cosine_sim<x，y>表示x，y两个向量之间的余弦相似度；表示用户价值分。

进一步地，在示例实施例中，在计算得到每个用户的用户价值分之后，按照用户价值分从大到小进行排序，可以得到用户的排序数据：用户标识(user_id)，序号(index)；之后根据广告主扩展需求，选取序号小于指定扩展用户数量的候选用户作为相似人群扩展的结果。

根据图4的示例实施例中的技术方案，一方面，根据用户特征和广告特征对种子用户进行聚类，能够同时考虑用户特征和广告特征进行广告投放，从而能够针对不同广告主的扩展需求更精准地进行广告投放；另一方面；基于用户类簇内种子用户的用户行为数据例如点击率确定该用户类簇的价值系数，能够得到或赋予不同的用户类簇相应的广告投放价值；另一方面，基于候选用户与用户类簇对应的相似度以及价值系数，确定候选用户的用户价值分，基于用户价值分进行相似人群扩展，能够根据用户具有的潜在广告投放价值大小进行相似人群扩展，使得生成的扩展用户能够最大程度匹配所投放的广告内容，提高所投放广告的转化率，同时也能够提高广告系统整体流量的利用率。

示例性介质

在介绍了本公开示例性实施例的方法之后，接下来，对本公开示例性实施例的介质进行说明。

在一些可能的实施例中，本公开的各个方面还可以实现为一种介质，其上存储有程序代码，当所述程序代码被设备的处理器执行时用于实现本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施例的相似人群扩展方法中的步骤。

在一些可能的实施例中，所述设备的处理器执行所述程序代码时用于实现如下步骤：步骤S210，对种子用户集中各个种子用户进行聚类处理，得到多个用户类簇；步骤S220，基于用户类簇内各个种子用户的用户行为数据确定用户类簇的价值系数，价值系数用于衡量用户类簇内的种子用户的价值；步骤S230，确定多个候选用户中每个候选用户与各个用户类簇的相似度；步骤S240，基于候选用户与各个用户类簇对应的相似度以及价值系数，确定候选用户的用户价值分；步骤S250，基于用户价值分，从多个候选用户中选取目标候选用户作为种子用户集的相似人群。

参考图8所示，描述了根据本公开的实施例的用于实现上述相似人群扩展方法的程序产品800，其可以采用便携式紧凑盘只读存储器并包括程序代码，并可以在终端设备，例如个人电脑上运行。然而，本公开的程序产品不限于此。

需要说明的是：上述的介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于：电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器、只读存储器、可擦式可编程只读存储器、光纤、便携式紧凑盘只读存储器、光存储器件、磁存储器件、或者上述的任意合适的组合。

可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于：电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、有线、光缆、射频信号等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络——包括局域网或广域网—连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

示例性装置

在介绍了本公开示例性实施例的介质之后，接下来，参考图9对本公开示例性实施例的相似人群扩展装置进行说明。

参照图9所示，相似人群扩展装置900包括：聚类处理模块910，用于对种子用户集中各个种子用户进行聚类处理，得到多个用户类簇；类簇价值确定模块920，用于基于所述用户类簇内各个种子用户的用户行为数据确定所述用户类簇的价值系数，所述价值系数用于衡量所述用户类簇内的种子用户的价值；相似度确定模块930，用于确定多个候选用户中每个候选用户与各个用户类簇的相似度；价值分确定模块940，用于基于所述候选用户与各个用户类簇对应的所述相似度以及所述价值系数，确定所述候选用户的用户价值分；扩展模块950，用于基于所述用户价值分，从所述多个候选用户中选取目标候选用户作为所述种子用户集的相似人群。

在本公开的一些实施例中，所述用户行为数据包括在预定时间段的点击行为数据，所述类簇价值确定模块920具体用于：基于所述点击行为数据，确定各个用户类簇内的种子用户的总点击次数以及对应的总曝光次数；将所述总点击次数与所述总曝光次数的比值，作为所述用户类簇的价值系数。

在本公开的一些实施例中，所述价值分确定模块940具体用于：将所述候选用户与所述用户类簇对应的所述价值系数与所述相似度进行加权运算；将加权运算的结果作为所述候选用户与所述用户类簇对应的类簇价值分；基于所述候选用户与各个所述用户类簇对应的类簇价值分，确定所述候选用户的用户价值分。

在本公开的一些实施例中，所述价值分确定模块940具体还用于：基于所述候选用户与各个所述用户类簇对应的所述相似度的大小，确定所述候选用户所属的用户类簇；将所述候选用户所属的用户类簇的价值系数，作为所述候选用户的用户价值分。

在本公开的一些实施例中，所述扩展模块950具体用于：基于各个候选用户的所述用户价值分对所述多个候选用户进行排序；按照排序的结果选取预定数量的目标候选用户作为所述种子用户集的相似人群。

在本公开的一些实施例中，所述相似度确定模块930具体用于：获取所述候选用户的用户特征向量以及各个所述用户类簇的类簇中心向量；确定所述用户特征向量与各个所述类簇中心向量之间的距离；基于所述距离确定所述用户特征向量与各个所述类簇中心向量之间的相似度。

在本公开的一些实施例中，所述聚类处理模块910具体用于：获取种子用户集中各个种子用户的特征向量，所述特征向量包括用户特征以及待推荐对象的特征；基于各个种子用户的特征向量，对种子用户集中各个种子用户进行聚类处理。

在本公开的一些实施例中，所述装置900还包括：特征确定模块，用于采用双塔模型获取所述种子用户的所述特征向量，所述双塔模型包括用户塔网络和待推荐对象塔网络。

在本公开的一些实施例中，所述装置还包括：周期性获取模块，用于周期性地获取所述种子用户的用户特征以及所述待推荐对象的对象特征；训练模块，用于基于所述用户特征以及所述对象特征对所述双塔模型进行训练。

在本公开的一些实施例中，所述训练模块具体用于：将所述用户特征输入所述用户塔网络，得到所述种子用户的用户嵌入向量；将所述对象特征输入所述待推荐对象塔网络，得到所述待推荐对象的对象嵌入向量；确定所述用户嵌入向量与所述对象嵌入向量的相似度，基于所述相似度通过激活函数确定预测值，所述预测值为表示所述用户特征与所述对象特征相似程度的值；基于标签值与预测值确定所述双塔模型的损失函数，基于所述损失函数对所述双塔网络进行训练。

由于图9的示例实施例的相似人群扩展装置的各个功能模块与上述相似人群扩展方法的示例实施例的步骤对应，因此对于本公开装置实施例中未披露的细节，请参照本公开上述的相似人群扩展方法的实施例。

示例性计算设备

在介绍了本公开示例性实施例的方法、介质和装置之后，接下来，介绍根据本公开的另一示例性实施例的计算设备。

所属技术领域的技术人员能够理解，本公开的各个方面可以实现为系统、方法或程序产品。因此，本公开的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“系统”。

在一些可能的实施例中，根据本公开实施例的计算设备可以至少包括至少一个处理器、以及至少一个存储器。其中，所述存储器存储有程序代码，当所述程序代码被所述处理器执行时，使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施例的相似人群扩展方法中的步骤。例如，所述处理器可以执行如图2中所示的步骤：步骤S210，对种子用户集中各个种子用户进行聚类处理，得到多个用户类簇；步骤S220，基于用户类簇内各个种子用户的用户行为数据确定用户类簇的价值系数，价值系数用于衡量用户类簇内的种子用户的价值；步骤S230，确定多个候选用户中每个候选用户与各个用户类簇的相似度；步骤S240，基于候选用户与各个用户类簇对应的相似度以及价值系数，确定候选用户的用户价值分；步骤S250，基于用户价值分，从多个候选用户中选取目标候选用户作为种子用户集的相似人群。

下面参照图10来描述根据本公开的示例实施例的电子设备1000。图10所示的电子设备1000仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图10所示，电子设备1000以通用计算设备的形式表现。电子设备1000的组件可以包括但不限于：上述至少一个处理单元1010、上述至少一个存储单元1020、连接不同系统组件(包括存储单元1020和处理单元1010)的总线1030。

总线1030表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器、外围总线、图形加速端口、处理器或者使用多种总线结构中的任意总线结构的局域总线。

存储单元1020可以包括易失性存储器形式的可读介质，例如RAM(Random AccessMemory，随机存取存储器)1021和/或高速缓存存储器1022，还可以进一步包括ROM(Read-Only Memory，只读存储器)1023。

存储单元1020还可以包括具有一组(至少一个)程序模块1024的程序/实用工具1025，这样的程序模块1024包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

电子设备1000也可以与一个或多个外部设备1040(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或者多个使得用户能与电子设备1000交互的设备通信，和/或与使得电子设备1000能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1050进行。并且，电子设备1000还可以通过网络适配器1060与一个或者多个网络(例如局域网，广域网和/或公共网络，例如因特网)通信。如图所示，网络适配器1060通过总线1030与电子设备1000的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备1000使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID(Redundant Arrays ofIndependent Disks，独立冗余磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。

应当注意，尽管在上文详细描述中提及了相似人群扩展装置的若干单元或子单元，但是这种划分仅仅是示例性的，并非是强制性的。实际上，根据本公开的实施方式，上文描述的两个或更多模块或单元的特征和功能可以在一个模块或单元中具体化。反之，上文描述的一个模块或单元的特征和功能可以进一步划分为由多个模块或单元来具体化。

此外，尽管在附图中以特定顺序描述了本公开方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

虽然已经参考若干具体实施方式描述了本公开的精神和原理，但是应该理解，本公开并不限于所公开的具体实施方式，对各方面的划分也不意味着这些方面中的特征不能组合以进行受益，这种划分仅是为了表述的方便。本公开旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims

1.一种相似人群扩展方法，其特征在于，包括：

对种子用户集中各个种子用户进行聚类处理，得到多个用户类簇；

基于用户在预定时间段的点击行为数据，确定各个用户类簇内的种子用户的总点击次数以及对应的总曝光次数；将所述总点击次数与所述总曝光次数的比值，作为所述用户类簇的价值系数，所述价值系数用于衡量所述用户类簇内的种子用户的价值；

确定多个候选用户中每个候选用户与各个用户类簇的相似度；

基于所述候选用户与各个用户类簇对应的所述相似度以及所述价值系数，确定所述候选用户的用户价值分；

基于所述用户价值分，从所述多个候选用户中选取目标候选用户作为所述种子用户集的相似人群；

所述基于所述候选用户与各个用户类簇对应的所述相似度以及所述价值系数，确定所述候选用户的用户价值分，包括：将所述候选用户与所述用户类簇对应的所述价值系数与所述相似度进行加权运算；将加权运算的结果作为所述候选用户与所述用户类簇对应的类簇价值分；基于所述候选用户与各个所述用户类簇对应的类簇价值分，确定所述候选用户的用户价值分；或者，

基于所述候选用户与各个所述用户类簇对应的所述相似度的大小，确定所述候选用户所属的用户类簇；将所述候选用户所属的用户类簇的价值系数，作为所述候选用户的用户价值分。

2.根据权利要求1所述的方法，其特征在于，所述基于所述用户价值分，从所述多个候选用户中选取目标候选用户作为所述种子用户集的相似人群，包括：

基于各个候选用户的所述用户价值分对所述多个候选用户进行排序；

按照排序的结果选取预定数量的目标候选用户作为所述种子用户集的相似人群。

3.根据权利要求1或2所述的方法，其特征在于，所述确定多个候选用户中每个候选用户与各个用户类簇的相似度，包括：

获取所述候选用户的用户特征向量以及各个所述用户类簇的类簇中心向量；

确定所述用户特征向量与各个所述类簇中心向量之间的距离；

基于所述距离确定所述用户特征向量与各个所述类簇中心向量之间的相似度。

4.根据权利要求1或2所述的方法，其特征在于，所述对种子用户集中各个种子用户进行聚类处理，包括：

获取种子用户集中各个种子用户的特征向量，所述特征向量包括用户特征以及待推荐对象的特征；

基于各个种子用户的特征向量，对种子用户集中各个种子用户进行聚类处理。

5.根据权利要求4所述的方法，其特征在于，所述方法还包括：

采用双塔模型获取所述种子用户的所述特征向量，所述双塔模型包括用户塔网络和待推荐对象塔网络。

6.根据权利要求5所述的方法，其特征在于，所述方法还包括：

周期性地获取所述种子用户的用户特征以及所述待推荐对象的对象特征；

基于所述用户特征以及所述对象特征对所述双塔模型进行训练。

7.根据权利要求6所述的方法，其特征在于，所述基于所述用户特征以及所述对象特征对所述双塔模型进行训练，包括：

将所述用户特征输入所述用户塔网络，得到所述种子用户的用户嵌入向量；

将所述对象特征输入所述待推荐对象塔网络，得到所述待推荐对象的对象嵌入向量；

确定所述用户嵌入向量与所述对象嵌入向量的相似度，基于所述相似度通过激活函数确定预测值，所述预测值为表示所述用户特征与所述对象特征相似程度的值；

基于标签值与预测值确定所述双塔模型的损失函数，基于所述损失函数对所述双塔模型进行训练。

8.一种相似人群扩展装置，其特征在于，包括：

聚类处理模块，用于对种子用户集中各个种子用户进行聚类处理，得到多个用户类簇；

类簇价值确定模块，用于基于用户在预定时间段的点击行为数据，确定各个用户类簇内的种子用户的总点击次数以及对应的总曝光次数；将所述总点击次数与所述总曝光次数的比值，作为所述用户类簇的价值系数，所述价值系数用于衡量所述用户类簇内的种子用户的价值；

相似度确定模块，用于确定多个候选用户中每个候选用户与各个用户类簇的相似度；

价值分确定模块，用于将所述候选用户与所述用户类簇对应的所述价值系数与所述相似度进行加权运算；将加权运算的结果作为所述候选用户与所述用户类簇对应的类簇价值分；基于所述候选用户与各个所述用户类簇对应的类簇价值分，确定所述候选用户的用户价值分；或者，基于所述候选用户与各个所述用户类簇对应的所述相似度的大小，确定所述候选用户所属的用户类簇；将所述候选用户所属的用户类簇的价值系数，作为所述候选用户的用户价值分；

扩展模块，用于基于所述用户价值分，从所述多个候选用户中选取目标候选用户作为所述种子用户集的相似人群。

9.根据权利要求8所述的装置，其特征在于，所述扩展模块具体用于：

10.根据权利要求8或9所述的装置，其特征在于，所述相似度确定模块具体用于：

11.根据权利要求8或9所述的装置，其特征在于，所述聚类处理模块具体用于：

12.根据权利要求11所述的装置，其特征在于，所述装置还包括：

特征确定模块，用于采用双塔模型获取所述种子用户的所述特征向量，所述双塔模型包括用户塔网络和待推荐对象塔网络。

13.根据权利要求12所述的装置，其特征在于，所述装置还包括：

周期性获取模块，用于周期性地获取所述种子用户的用户特征以及所述待推荐对象的对象特征；

训练模块，用于基于所述用户特征以及所述对象特征对所述双塔模型进行训练。

14.根据权利要求13所述的装置，其特征在于，所述训练模块具体用于：

15.一种计算设备，包括：处理器和存储器，所述存储器存储有可执行指令，所述处理器用于调用所述存储器存储的可执行指令执行如权利要求1至7中任一项所述的方法。

16.一种介质，其上存储有程序，所述程序被处理器执行时实现如权利要求1至7中任一项所述的方法。