CN113378071A

CN113378071A - 广告推荐方法及装置、电子设备、存储介质

Info

Publication number: CN113378071A
Application number: CN202110934140.6A
Authority: CN
Inventors: 陈程; 王贺; 李涵
Original assignee: Wuhan Zhuoer Digital Media Technology Co ltd
Current assignee: Wuhan Zhuoer Digital Media Technology Co ltd
Priority date: 2021-08-16
Filing date: 2021-08-16
Publication date: 2021-09-10

Abstract

本申请公开了一种广告推荐方法及装置、电子设备、存储介质，方法包括：获取目标用户的档案数据和生成数据；其中，目标用户属于不活跃用户；生成数据为用户与广告间产生关联的数据；将目标用户的档案数据与生成数据拼接后进行降维处理，得到目标用户对应的特征向量；将目标用户对应的特征向量输入预先训练好的推荐模型中，得到目标用户对应的分类结果；其中，推荐模型预先利用种子用户作为正样本用户，属于活跃且对目标广告不感兴趣的用户作为负样本用户进行训练得到；种子用户至少包括活跃用户中对目标广告感兴趣并已转化的用户；若分类结果为正向，向目标用户推荐目标广告；分类结果为正向表征目标用户与种子用户的相似程度满足预设条件。

Description

广告推荐方法及装置、电子设备、存储介质

技术领域

本申请涉及广告推荐技术领域，特别涉及一种广告推荐方法及装置、电子设备、存储介质。

背景技术

为了使得更多用户参与活动或者购买商品等，所以会向用户推荐相应的广告，而如何准确向用户推荐用户感兴趣并可能进行转化的广告，从而可以提高广告的转化率尤为重要。

现今主要使用的方法是获取用户的广告行为数据，即获取用户对广告进行操作时所产生的数据，并将用户的广告行为数据转化为向量，得到用户对应的行为数据的向量，然后基于各个用户对应的行为数据的向量，通过计算向量用户之间的相似度对用户进行聚类，从将相似的用户聚为同一类簇。最后，将针对每个类簇中的用户的特征，查找与该类簇相匹配的广告并推荐给该类簇中的用户。

但是，现有的方式主要从广告的角度抽取用户的广告行为数据进行分析，没有考虑到不活跃用户，在系统中的操作较少，因此能获取到的该类型的用户的广告行为数据比较少，因此所得到聚类效果太差，从而无法准备地向这类型的用户推荐其感兴趣并且有极大概率进行转化的广告。

发明内容

基于上述现有技术的不足，本申请提供了一种广告推荐方法及装置、电子设备、存储介质，以解决现有技术对不活跃用户的广告推荐不够准确的问题。

为了实现上述目的，本申请提供了以下技术方案：

本申请第一方面提供了一种广告推荐方法，包括：

获取目标用户的档案数据以及生成数据；其中，所述目标用户属于不活跃用户；所述生成数据为用户与广告间产生关联的数据；

将所述目标用户的档案数据与生成数据拼接后进行降维处理，得到所述目标用户对应的特征向量；

将所述目标用户对应的特征向量输入预先训练好的推荐模型中，得到所述目标用户对应的分类结果；其中，所述推荐模型预先利用种子用户作为正样本用户，属于活跃且对目标广告不感兴趣的用户作为负样本用户进行训练得到；所述种子用户至少包括活跃用户中，对所述目标广告感兴趣并已转化所述目标广告的用户；

若所述目标用户对应的分类结果为正向，则向所述目标用户推荐所述目标广告；其中，所述分类结果为正向表征所述目标用户与所述种子用户的相似程度满足预设条件。

可选地，在上述的方法中，所述推荐模型的训练方法，包括：

从多个用户中筛选出所述正样本用户以及所述负样本用户；

获取每个所述样本用户的档案数据以及生成数据；其中，所述样本用户包括所述正样本用户以及所述负样本用户；

分别针对每个所述样本用户，将所述样本用户的档案数据与生成数据拼接后进行降维处理，得到所述样本用户对应的特征向量；

利用所述正样本用户对应的特征向量以及所述负样本用户对应的特征向量，对待训练的推荐模型进行迭代训练，得到训练好的所述推荐模型；其中，所述推荐模型基于回归的Look-Alike算法构建。

可选地，在上述的方法中，所述从多个用户中筛选出正样本用户以及负样本用户，包括：

将多个用户划分为活跃用户集合和不活跃用户集合；

分别将所述活跃用户集合和所述不活跃用户集合中的所述用户，划分为感兴趣用户集合和不感兴趣用户集合；其中，所述感兴趣用户集合包括对所述目标广告感兴趣的用户；所述不感兴趣用户集合包括对所述目标广告不感兴趣的用户；

分别将所述活跃用户集合中属于所述感兴趣用户集合和不感兴趣用户集合中的所述用户，划分为转化用户集合以及非转化用户集合；

将所述活跃用户集合中的所述感兴趣用户集合中的所述转化用户集合中的各个所述用户确定为种子用户；

将所述种子用户确定为所述正样本用户，以及将所述不活跃用户集合中的所述不感兴趣用户集合中的所述用户确定为所述负样本用户。

可选地，在上述的方法中，所述利用所述正样本用户对应的特征向量以及所述负样本用户对应的特征向量，对待训练的推荐模型进行迭代训练，得到训练好的所述推荐模型之后，还包括：

分别将所述多个用户中的每个剩余用户对应的特征向量输入训练好的所述推荐模型中，得到每个所述剩余用户对应的预测值；其中，所述剩余用户指代所述多个用户中不属于所述正样本用户和所述负样本用户的其余用户；所述预测值用于表征与所述种子用户的相似程度；

基于所述剩余用户对应的预测值，从所述剩余用户中选取出预设比例的多个所述剩余用户，并将选取出的所述剩余用户新增为种子用户；其中，选取出的所述剩余用户对应的预测值大于任意一个未被选取的所述剩余用户对应的预测值；

利用当前的所有所述种子用户对应的特征向量对训练好的所述推荐模型进行优化训练，得到最终训练好的所述推荐模型。

本申请第二方面提供了一种广告推荐装置，包括：接收单元以及处理单元；

所述接收单元，用于获取目标用户的档案数据以及生成数据；其中，所述目标用户属于不活跃用户；所述生成数据为用户与广告间产生关联的数据；

所述处理单元，用于将所述目标用户的档案数据与生成数据拼接后进行降维处理，得到所述目标用户对应的特征向量，以及将所述目标用户对应的特征向量输入预先训练好的推荐模型中，得到所述目标用户对应的分类结果；并在所述目标用户对应的分类结果为正向时，向所述目标用户推荐所述目标广告；

其中，所述推荐模型预先利用种子用户作为正样本用户，属于活跃且对目标广告不感兴趣的用户作为负样本用户进行训练得到；所述种子用户至少包括活跃用户中，对所述目标广告感兴趣并已转化所述目标广告的用户；所述分类结果为正向表征所述目标用户与所述种子用户的相似程度满足预设条件。

可选地，在上述的装置中，所述处理单元还用于：

从多个用户中筛选出所述正样本用户以及所述负样本用户；

可选地，在上述的装置中，所述处理单元执行所述从多个用户中筛选出所述正样本用户以及所述负样本用户时，用于：

将多个用户划分为活跃用户集合和不活跃用户集合；

可选地，在上述的装置中，所述处理单元还用于：

本申请第三方面提供了一种电子设备，包括：

存储器和处理器；

其中，所述存储器用于存储程序；

所述处理器用于执行所述程序，所述程序被执行时，具体用于实现如上述任意一项所述的广告推荐方法。

本申请第四方面提供了一种计算机存储介质，用于存储计算机程序，所述计算机程序被执行时，用于实现如上述任意一项所述的广告推荐方法。

本申请提供的一种广告推荐方法，获取属于不活跃用户的目标用户的档案数据以及生成数据，生成数据为表征用户与广告间产生关联的数据，不再是获取用户广告行为数据。将目标用户的档案数据与生成数据拼接后进行降维处理，得到目标用户对应的特征向量。然后，将目标用户对应的特征向量输入预先训练好的推荐模型中，得到所述目标用户对应的分类结果。由于，推荐模型预先利用种子用户作为正样本用户，属于活跃且对目标广告不感兴趣的用户作为负样本用户进行训练得到，而种子用户至少包括活跃用户中，对目标广告感兴趣并已转化所述目标广告的用户，因此若目标用户对应的分类结果为正向，表征目标用户与种子用户的相似程度较高，所以此时向目标用户推荐目标广告。从而在不使用用户的广告行为数据情况下，准确地得到对目标广告感兴趣会进行转化的用户，并推荐给用户，进而可以有效地提高广告的转化率。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请实施例提供的一种广告推荐方法的流程图；

图2为本申请实施例提供的一种推荐模型的训练方法的流程图；

图3为本申请实施例提供的筛选正样本用户和负样本用户的方法的流程图；

图4为本申请另一实施例提供的一种广告推荐装置的结构示意图；

图5为本申请另一实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在本申请中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本申请实施例提供了一种广告推荐方法，如图1所示，具体包括以下步骤：

S101、获取目标用户的档案数据以及生成数据。

其中，目标用户属于不活跃用户。不活跃用户主要指的是操作信息相对较少的用户，特别是对广告进行操作比较少的用户。其中，用户是否为活跃用户可以是基于一项或多项指定的数据项进行确定。例如，可以通过用户对上线次数、广告点击次数等数据项进行确定。

生成数据为用户与广告间产生关联的数据。需要说明的是，生成数据区别于广告行为数据，其可以包含广告行为数据，但并不仅限于只包含广告行为数据，即可以包括用户对广告产生的数据，如点赞数、评论数和转发数等，以及其包括其他与预测用户兴趣相关的数据，例如用户浏览的商品的类别、活跃时间等。具体的，可以是获取目标用户在各项生成数据项上的数据，如获取目标用户对每件产品在购买项上的数据，若购买则为1，若未购买过则为0。

其中，档案数据主要指用户在注册时所需要填写或者选择填写的数据内容，比如：性别、年龄、兴趣爱好等等。

S102、将目标用户的档案数据与生成数据拼接后进行降维处理，得到目标用户对应的特征向量。

具体的，分别将档案数据和生成数据处理为向量形式，即将各项数据用相应的数值进行表示，然后将档案数据和生成数据处理的向量表示进行拼接，得到拼接向量。然后，对拼接向量进行降维处理，避免维度过多，影响处理结果的准确性以及处理效率。可选地，可以采用PCA算法对拼接向量进行处理。

S103、将目标用户对应的特征向量输入预先训练好的推荐模型中，得到目标用户对应的分类结果。

其中，推荐模型预先利用种子用户作为正样本用户，属于活跃且对目标广告不感兴趣的用户作为负样本用户进行训练得到。种子用户至少包括活跃用户中，对目标广告感兴趣并已转化目标广告的用户。

需要说明的是，目标广告可以是一个广告也可以是多个广告。当目标广告为多个广告时，对目标广告感兴趣可以是对多个广告中不少于预设比例的广告感兴趣的用户，对目标广告已进行转化的用户也可以是对多个广告中不少于预设比例的广告进行了转化的用户。

可选地，用户对目标广告是否感兴趣可以是基于用户对目标用过的广告行为的次数或者频率等数据项确定。

可选地，本申请实施例提供了一种推荐模型的训练方法，如图2所示，包括以下步骤：

S201、从多个用户中筛选出正样本用户以及负样本用户。

其中，正样本用户为种子用户，即为活跃用户中，对目标广告感兴趣并已转化目标广告的用户。负样本用户为活跃且对目标广告不感兴趣的用户。

可选地，在本申请另一实施例中，步骤S201的一种具体实施方式，如图3所示，包括以下步骤：

S301、将多个用户划分为活跃用户集合和不活跃用户集合。

可选地，为了能使得训练的效果更佳，活跃用户集合和不活跃用户集合的比例可以为2比8。

S302、分别将活跃用户集合和不活跃用户集合中的用户，划分为感兴趣用户集合和不感兴趣用户集合。

其中，感兴趣用户集合包括对目标广告感兴趣的用户。不感兴趣用户集合包括对目标广告不感兴趣的用户。

也就是说，分别针对活跃用户集合和不活跃用户集合，基于用户对目标广告是否感兴趣，将该集合中的用户进一步划分为感兴趣用户集合和不感兴趣用户集合。

S303、分别将活跃用户集合中属于感兴趣用户集合和不感兴趣用户集合中的用户，划分为转化用户集合以及非转化用户集合。

S304、将活跃用户集合中的感兴趣用户集合中的转化用户集合中的各个用户确定为种子用户。

S305、将种子用户确定为正样本用户，以及将不活跃用户集合中的不感兴趣用户集合中的用户确定为负样本用户。

S202、获取每个样本用户的档案数据以及生成数据。

其中，样本用户包括正样本用户以及负样本用户。

需要说明的是，步骤S202的具体实施方式，可相应地参考步骤S101的说明，此处不再赘述。

S203、分别针对每个样本用户，将样本用户的档案数据与生成数据拼接后进行降维处理，得到样本用户对应的特征向量。

需要说明的是，步骤S203的具体实施方式可相应地参考步骤S102，此处不再赘述。

S204、利用正样本用户对应的特征向量以及负样本用户对应的特征向量，对待训练的推荐模型进行迭代训练，得到训练好的推荐模型。

其中，推荐模型基于回归的Look-Alike算法构建。可选地，在本申请实施例中，基于回归的Look-Alike算法构建推荐模型，并利用回归算法，如LR或MF等，对推荐模型进行训练。

可选地，具体训练过程可以是：分别将多个样本用户对应的特征向量输入待训练的推荐模型中，通过推荐模型对样本用户对应的特征向量进行计算，得到样本用户对应的预测值，并在预测值大于预设阈值时输出正向的分类结果，当预测值小于预设阈值时输出负向的分类结果。通过对比分类结果与用户的标签，计算推荐模型的输出结果的准确性。若准确性不大于预设准确性，则并基于准确性对推荐模型的参数进行调整，并返回将多个样本用户对应的特征向量输入推荐模型中，直至准确性大于预设准确性。

可选地，为了能进一步优化推荐模型，在步骤S201的具体实施方式为如图3所示的方式时，在该实施例中，在执行步骤S204之后还可以进一步包括：

分别将多个用户中的每个剩余用户对应的特征向量输入训练好的所述推荐模型中，得到每个剩余用户对应的预测值。然后，基于剩余用户对应的预测值，从剩余用户中选取出预设比例的多个剩余用户，并将选取出的剩余用户新增为种子用户。最后，利用当前的所有种子用户对应的特征向量对训练好的推荐模型进行优化训练，得到最终训练好的推荐模型。

其中，剩余用户指代所述多个用户中不属于正样本用户和负样本用户的其余用户。预测值用于表征与种子用户的相似程度。选取出的剩余用户对应的预测值大于任意一个未被选取的剩余用户对应的预测值。

所以在本申请实施例中，在初步得到训练好的推荐模型后，从不属于样本用户的用户中选取出与种子用户最相似的预设比例的用户，新增为种子用户，从而增大种子用户的数量，从而可以使得推荐模型的输出结果更准确，并且也能增强推荐模型的泛化性，有助于更好地发现潜在用户。

S104、判断目标用户对应的分类结果是否为正向。

可选地，可以是分类结果为1则表示分类结果为正向，分类结果为0则表示分类结果为正向。由于，分类结果为正向表目标用户与种子用户的相似程度满足预设条件，所以在判断出目标用户对应的分类结果为正向时，执行步骤S105。

S105、向目标用户推荐目标广告。

本申请实施例提供的一种广告推荐方法，获取属于不活跃用户的目标用户的档案数据以及生成数据，生成数据为表征用户与广告间产生关联的数据，不再是获取用户广告行为数据。将目标用户的档案数据与生成数据拼接后进行降维处理，得到目标用户对应的特征向量。然后，将目标用户对应的特征向量输入预先训练好的推荐模型中，得到所述目标用户对应的分类结果。由于，推荐模型预先利用种子用户作为正样本用户，属于活跃且对目标广告不感兴趣的用户作为负样本用户进行训练得到，而种子用户至少包括活跃用户中，对目标广告感兴趣并已转化所述目标广告的用户，因此若目标用户对应的分类结果为正向，表征目标用户与种子用户的相似程度较高，所以此时向目标用户推荐目标广告。从而在不使用用户的广告行为数据情况下，准确地得到对目标广告感兴趣会进行转化的用户，并推荐给用户，进而可以有效地提高广告的转化率。

本申请另一实施例提供了一种广告推荐装置，如图4所示，包括：接收单元401以及处理单元402。

接收单元401，用于获取目标用户的档案数据以及生成数据；其中，目标用户属于不活跃用户；生成数据为用户与广告间产生关联的数据；

处理单元402，用于将目标用户的档案数据与生成数据拼接后进行降维处理，得到目标用户对应的特征向量，以及将目标用户对应的特征向量输入预先训练好的推荐模型中，得到目标用户对应的分类结果；并在目标用户对应的分类结果为正向时，向目标用户推荐目标广告；

其中，推荐模型预先利用种子用户作为正样本用户，属于活跃且对目标广告不感兴趣的用户作为负样本用户进行训练得到。种子用户至少包括活跃用户中，对目标广告感兴趣并已转化目标广告的用户。分类结果为正向表征目标用户与种子用户的相似程度满足预设条件。

可选地，在本申请另一实施例提供的广告推荐装置的装置中，处理单元还用于执行如下功能：

从多个用户中筛选出正样本用户以及负样本用户。

获取每个样本用户的档案数据以及生成数据。其中，样本用户包括正样本用户以及负样本用户。

分别针对每个样本用户，将样本用户的档案数据与生成数据拼接后进行降维处理，得到样本用户对应的特征向量。

利用正样本用户对应的特征向量以及负样本用户对应的特征向量，对待训练的推荐模型进行迭代训练，得到训练好的推荐模型。

其中，推荐模型基于回归的Look-Alike算法构建。

可选地，在本申请另一实施例提供的广告推荐装置的装置中，处理单元从多个用户中筛选出所述正样本用户以及所述负样本用户时，用于：

将多个用户划分为活跃用户集合和不活跃用户集合。

分别将活跃用户集合和不活跃用户集合中的用户，划分为感兴趣用户集合和不感兴趣用户集合。

分别将活跃用户集合中属于感兴趣用户集合和不感兴趣用户集合中的用户，划分为转化用户集合以及非转化用户集合。

将活跃用户集合中的感兴趣用户集合中的转化用户集合中的各个用户确定为种子用户。

将种子用户确定为正样本用户，以及将不活跃用户集合中的不感兴趣用户集合中的用户确定为负样本用户。

可选地，在本申请另一实施例提供的广告推荐装置的装置中，处理单元还用于：

分别将所述多个用户中的每个剩余用户对应的特征向量输入训练好的所述推荐模型中，得到每个所述剩余用户对应的预测值。

其中，所述剩余用户指代所述多个用户中不属于所述正样本用户和所述负样本用户的其余用户；所述预测值用于表征与所述种子用户的相似程度。

基于所述剩余用户对应的预测值，从所述剩余用户中选取出预设比例的多个所述剩余用户，并将选取出的所述剩余用户新增为种子用户。

其中，选取出的所述剩余用户对应的预测值大于任意一个未被选取的所述剩余用户对应的预测值。

需要说明的是，本申请上述实施例提供的各个单元的具体工作过程可相应地参考上述方法实施例中的相应的步骤，此处不再赘述。

本申请另一实施例提供了一种电子设备，如图5所示，包括：

存储器501和处理器502。

其中，存储器501用于存储程序，处理器502用于执行存储器501存储的程序，并且该程序被执行时，具体用于实现如上述任意一个实施例提供的广告推荐方法。

本申请另一实施例提供了一种计算机存储介质，用于存储计算机程序，并且该计算机程序被执行时，用于实现如上述任意一个实施例提供的广告推荐方法。

计算机存储介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种广告推荐方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述推荐模型的训练方法，包括：

从多个用户中筛选出所述正样本用户以及所述负样本用户；

3.根据权利要求2所述的方法，其特征在于，所述从多个用户中筛选出正样本用户以及负样本用户，包括：

将多个用户划分为活跃用户集合和不活跃用户集合；

4.根据权利要3所述的方法，其特征在于，所述利用所述正样本用户对应的特征向量以及所述负样本用户对应的特征向量，对待训练的推荐模型进行迭代训练，得到训练好的所述推荐模型之后，还包括：

5.一种广告推荐装置，其特征在于，包括：接收单元以及处理单元；

6.根据权利要求5所述的装置，其特征在于，所述处理单元还用于：

从多个用户中筛选出所述正样本用户以及所述负样本用户；

7.根据权利要求6所述的装置，其特征在于，所述处理单元执行所述从多个用户中筛选出所述正样本用户以及所述负样本用户时，用于：

将多个用户划分为活跃用户集合和不活跃用户集合；

8.根据权利要7所述的装置，其特征在于，所述处理单元还用于：

9.一种电子设备，其特征在于，包括：

存储器和处理器；

其中，所述存储器用于存储程序；

所述处理器用于执行所述程序，所述程序被执行时，具体用于实现如权利要求1至4任意一项所述的广告推荐方法。

10.一种计算机存储介质，其特征在于，用于存储计算机程序，所述计算机程序被执行时，用于实现如权利要求1至4任意一项所述的广告推荐方法。