CN116911928B

CN116911928B - 一种基于创意特征的广告推荐模型的训练方法及装置

Info

Publication number: CN116911928B
Application number: CN202311168517.7A
Authority: CN
Inventors: 杜梦雪; 岳华东
Original assignee: Shenzhen Xumi Yuntu Space Technology Co Ltd
Current assignee: Shenzhen Xumi Yuntu Space Technology Co Ltd
Priority date: 2023-09-12
Filing date: 2023-09-12
Publication date: 2024-01-05
Anticipated expiration: 2043-09-12
Also published as: CN116911928A

Abstract

本申请提供了一种基于创意特征的广告推荐模型的训练方法及装置，充分结合广告方案中的内容创意来实现广告推荐；广告推荐模型包括，创意分析网络和广告排序网络，方法包括：利用创意分析网络，确定各待推荐方案的创意分值；根据各创意分值，确定各待推荐方案的第一推荐概率；利用广告排序网络，确定各个待推荐方案的点击分值；根据各点击分值，确定各待推荐方案的第二推荐概率；利用预设的损失函数，确定第一推荐概率和第二推荐概率的损失数值；并根据损失数值对广告推荐模型进行数据训练。

Description

一种基于创意特征的广告推荐模型的训练方法及装置

技术领域

本申请涉及人工智能技术领域，尤其涉及一种基于创意特征的广告推荐模型的训练方法及装置。

背景技术

在现实生活中，电子广告位和基于电子广告位的广告投放几乎无处不在。而广告的投放顺序，乃至确定其投放顺序的算法，很大程度上影像了广告的投放效果。在目前阶段，人工智能技术也已经越来越多的投入到了广告投放的运算当中。

例如在一个电子广告位上，可能存在诸多备选的广告实体；而每个广告实体还可以包括多个备选的广告方案。相对应的，浏览该电子广告位的用户具有其特定的用户特征。现有技术中，往往是结合用户特征和广告实体进行相关分析，从而确定应当向用户投放哪一个广告实体。然后再进一步的筛选出一个该广告实体的广告方案进行实际投放。

现有技术的缺点在于，在选择广告实体的过程中，并未考虑到具体广告方案的创意属性，因此也就无法兼顾到创意属性对于广告投放效果的影像。

发明内容

有鉴于此，本申请实施例提供了一种基于创意特征的广告推荐模型的训练方法及装置，充分结合广告方案中的内容创意来实现广告推荐。

本申请实施例的第一方面，提供了一种基于创意特征的广告推荐模型的训练方法，广告推荐模型包括，创意分析网络和广告排序网络，方法包括：

利用创意分析网络，确定各待推荐方案的创意分值；根据各创意分值，确定各待推荐方案的第一推荐概率；

利用广告排序网络，确定各个待推荐方案的点击分值；根据各点击分值，确定各待推荐方案的第二推荐概率；

利用预设的损失函数，确定第一推荐概率和第二推荐概率的损失数值；并根据损失数值对广告推荐模型进行数据训练。

本申请实施例的第二方面，提供了一种基于创意特征的广告推荐模型的训练装置，广告推荐模型包括，创意分析网络和广告排序网络，装置包括：

创意分值确定模块，用于利用创意分析网络，确定各待推荐方案的创意分值；

第一推荐模块，用于根据各创意分值，确定各待推荐方案的第一推荐概率；

点击分值确定模块，用于利用广告排序网络，确定各个待推荐方案的点击分值；

第二推荐模块，用于根据各点击分值，确定各待推荐方案的第二推荐概率；

损失确定模块，用于利用预设的损失函数，确定第一推荐概率和第二推荐概率的损失数值；

训练模块，用于根据损失数值对广告推荐模型进行数据训练。

本申请实施例的第三方面，提供了一种电子设备，包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序，该处理器执行计算机程序时实现上述方法的步骤。

本申请实施例的第四方面，提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序，该计算机程序被处理器执行时实现上述方法的步骤。

本申请实施例与现有技术相比存在的有益效果是：利用创意分析网络确定各待推荐方案的第一推荐概率，利用广告排序网络确定各待推荐方案的第二推荐概率，基于知识蒸馏方法结合第一推荐概率和第二推荐概率确定损失数值，并根据损失数值进行数据训练；在训练过程中以待推荐方案作为分析对象，可以更为直接的分析待推荐方案中的创意属性，更侧重创意属性的影像；提高了广告的整体投放效果。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1是本申请实施例的应用场景的场景示意图；

图2是本申请实施例提供的一种基于创意特征的广告推荐模型的训练方法的流程示意图；

图3为本申请实施例中广告推荐模型的结构示意图；

图4为本申请实施例中广告推荐模型的创意分析网络的结构示意图；

图5为本申请实施例中广告推荐模型的创意分析塔的结构示意图；

图6是本申请实施例提供的一种基于创意特征的广告推荐模型的训练装置的结构示意图；

图7是本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本申请实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本申请的描述。

在现实生活中，基于电子广告位的广告投放几乎无处不在。例如在一些APP的UI界面中便经常会出现电子广告位。对于一个电子广告位，可能存在诸多备选的广告实体。广告实体具体可以是某个商品、某间店铺或者某个品牌。备选的广告实体，也就是有可能投放到该电子广告位上的广告实体。每个广告实体之下，还可以存在多个备选的广告方案。例如广告实体为商品A；而商家可以预先为商品A制作方案a、方案b和方案c共3个广告方案。当需要在电子广告位投放商品A的广告时，即可从3个广告方案中择一进行投放。并且由于广告方案通常具有一定的创意属性，所以本申请中广告方案亦可称为广告创意。

相对应的，有机会浏览该电子广告位的用户也会具有其特定的用户特征；例如用户的年龄、性别、收入情况、兴趣爱好等。基于用户特征可以建立用户画像。具有不同用户特征的用户具有不同的需求。因此在广告推荐过程中，用户画像也是关键因素之一。

现有技术中，往往是结合用户特征和广告实体进行相关分析，从而确定应当向用户投放哪一个广告实体。然后再进一步的筛选出一个该广告实体的广告创意进行实际投放。然而实际上，同一广告实体的不同广告创意，对于用户来说也是具有显著差别的。

现有技术的缺点在于，在选择广告实体的过程中，并未考虑到具体广告创意的创意属性，因此也就无法兼顾到创意属性对于广告投放效果的影像，没有分析用户对于不同创意属性的接受程度的区别。这使得广告投放效果无法在整体上达到最优。有鉴于此，本申请希望建立一种可以基于创意特征进行推荐的广告推荐模型。本申请中将描述该广告推荐模型的训练方法。

下面将结合附图详细说明根据本申请实施例的一种基于创意特征的广告推荐模型的训练方法。

图1是本申请实施例的一种应用场景的场景示意图。该应用场景可以包括终端设备101、102和103、服务器104、网络105。

终端设备101、102和103可以是硬件，也可以是软件。当终端设备101、102和103为硬件时，其可以是具有显示屏且支持与服务器104通信的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等；当终端设备101、102和103为软件时，其可以安装在如上的电子设备中。终端设备101、102和103可以实现为多个软件或软件模块，也可以实现为单个软件或软件模块，本申请实施例对此不作限制。进一步地，终端设备101、102和103上可以安装有各种应用，例如数据处理应用、即时通信工具、社交平台软件、搜索类应用、购物类应用等。完成训练的广告推荐模型可运行于终端设备101、102和103上。

服务器104可以是提供各种服务的服务器，例如，对与其建立通信连接的终端设备发送的请求进行接收的后台服务器，该后台服务器可以对终端设备发送的请求进行接收和分析等处理，并生成处理结果。服务器104可以是一台服务器，也可以是由若干台服务器组成的服务器集群，或者还可以是一个云计算服务中心，本申请实施例对此不作限制。

需要说明的是，服务器104可以是硬件，也可以是软件。当服务器104为硬件时，其可以是为终端设备101、102和103提供各种服务的各种电子设备。当服务器104为软件时，其可以是为终端设备101、102和103提供各种服务的多个软件或软件模块，也可以是为终端设备101、102和103提供各种服务的单个软件或软件模块，本申请实施例对此不作限制。广告推荐模型的训练过程主要可由服务器104完成执行。

网络105可以是采用同轴电缆、双绞线和光纤连接的有线网络，也可以是无需布线就能实现各种通信设备互联的无线网络，例如，蓝牙（Bluetooth）、近场通信（Near FieldCommunication，NFC）、红外（Infrared）等，本申请实施例对此不作限制。

用户可以通过终端设备101、102和103经由网络105与服务器104建立通信连接，以接收或发送信息等。需要说明的是，终端设备101、102和103、服务器104以及网络105的具体类型、数量和组合可以根据应用场景的实际需求进行调整，本申请实施例对此不作限制。

图2是本申请实施例提供的一种基于创意特征的广告推荐模型的训练方法的流程示意图。本实施例中，广告推荐模型的具体结构如图3所示；广告推荐模型包括，创意分析网络和广告排序网络。如图2所示，该广告推荐模型的训练方法包括：

步骤S201、利用创意分析网络，确定各待推荐方案的创意分值；根据各创意分值，确定各待推荐方案的第一推荐概率。

步骤S202、利用广告排序网络，确定各个待推荐方案的点击分值；根据各点击分值，确定各待推荐方案的第二推荐概率。

步骤S203、利用预设的损失函数，确定第一推荐概率和第二推荐概率的损失数值；并根据损失数值对广告推荐模型进行数据训练。

待推荐方案，即为可能向用户进行推荐的备选广告方案。每个待推荐方案中均会存在一定的创意属性。待推荐方案的数量通常是多个，可以对应着多个不同的广告实体。本实施例中的广告推荐模型用于结合多个待推荐方案进行运算，并择一投放到电子广告位上，从而借助电子广告位为载体完成向用户的广告推荐。

需要说明的是，现有技术中的人工智能模型，往往是以广告实体为分析对象，即先确定出将要投放的广告实体，再选择该广告实体之下的广告方案，因此对于广告方案的创意属性分析不足。本实施例中广告推荐模型不同于现有技术在于，其不再以广告实体作为分析对象，而是以广告方案（即待推荐方案）作为分析对象；由此可以在分析运算中直接将待推荐方案中的创意属性结合其中，从而在推荐过程中更侧重创意属性的影像。

在本实施例中，创意分析网络主要用来分析待推荐方案中的创意属性，以及用户与创意属性之间的适配程度和接受程度。因为“创意属性”这一概念本身较为抽象且主观，不同的用户对于“创意”的感知和接受倾向也有所不同。所以创意分析网络可以以“评分”的形式将创意属性具象化的呈现。

为了计算创意分值，可以向创意分析网络输入关键词信息、用户信息和创意信息。其中，关键词信息可以是用户过往一段时间之内的搜索词（query）；用户信息可以是用户的年龄、性别、职业等各类基本信息，即所谓的用户画像。基于关键词信息、用户信息，可以确定对应的用户表征。而创意信息则来自于待推荐方案本身，具体可以包括待推荐方案中的标题信息、图片信息和ID信息。基于题信息、图片信息和ID信息，可以确定对应的创意表征。

标题信息和图片信息相当于待推荐方案的具体内容。在一个待推荐方案中，可以通过标题以及图片作为载体表达其中创意。但是因为创意属性较为抽象，所以仅仅通过传统的文字分析和图像分析，很难得到准确的创意表征。因此还需要进一步的结合待推荐方案的ID信息。通常ID信息可以唯一的代表某个待推荐方案，与创意属性并无直接的关系；但是过往的每次投放当中，不同用户在不同情境下对于待推荐方案的创意属性的评价，亦可以关联到该ID信息当中。因此携带此类评价的ID信息，可以在一定程度上反映出待推荐方案的创意属性。所以在本实施例中，可选择将标题信息、图片信息和ID信息共同作为待推荐方案的创意信息。

创意分析网络结合用户表征和创意表征可以输出各待推荐方案的创意分值。创意分值代表了相对于当前的用户，每个待推荐方案的“创意程度”。创意分值越高，意味着该用户对于该待推荐方案的创意接受程度越高。也就是说，向该用户投放创意分值更高的待推荐方案，理论上可以获得更优的效果。

基于这一原理，本实施例中可以进一步的结合各待推荐方案的创意分值，为每个待推荐方案确定第一推荐概率。第一推荐概率，代表了该待推荐方案基于创意分值而作为第一选择被选中的概率；换言之，也就是基于创意分值而决定投放该待推荐方案的概率。

广告推荐模型的另一个组成部分，即广告排序网络，同样可以对各个待推荐方案进行“评分”。在本实施例中，广告排序网络的功能和结构与现有技术类似，其具有更强的泛化能力，可以负责综合分析以预测各个待推荐方案的点击率，由此进一步的确定各个待推荐方案的点击分值。也就是说，预测某个待推荐方案的点击率越高，则其点击分值也就越高，说明其投放效果越好。同理，广告排序网络同上可以结合关键词信息、用户信息和创意信息进行运算，从而输出点击分值。并且需要说明的是，广告排序网络在计算点击分值时需要利用的创意表征是基于同样的创意信息，所以本实施例中可以选择创意分析网络和广告排序网络共享创意表征，由此节约模型整体的计算量。

结合各待推荐方案的点击分值，可以为每个待推荐方案确定第二推荐概率。第二推荐概率，代表了该待推荐方案基于点击分值而作为第一选择被选中的概率；换言之，也就是基于点击分值而决定投放该待推荐方案的概率。

基于上述可知的是，第一推荐概率和第二推荐概率是通过不同方式计算得到的推荐概率值。在广告推荐模型完成训练之前，其预测功能尚不完善，所以上述两个概率值可能会存在较大的差异，即相对损失。而本实施例中涉及的数据训练过程，目的便是减小这一损失，使二者尽可能趋异收敛。上述基于广告排序网络的第二推荐概率，反向确定损失的技术手段，属于本领域中涉及的知识蒸馏方法。

具体的，可以利用预设的损失函数，计算确定第一推荐概率和第二推荐概率的损失数值。例如，本实施例中损失函数可以采用交叉熵损失函数。根据该损失数值，可以对广告推荐模型进行数据训练。即，当损失数值大于预设标准时，可利用迭代算法调整广告推荐模型当中的超参数，并重复上述步骤；直到损失数值不大于预设标准，可认为训练过程完成。

通过以上技术方案可知，本实施例中方法存在的有益效果是：利用创意分析网络确定各待推荐方案的第一推荐概率，利用广告排序网络确定各待推荐方案的第二推荐概率，基于知识蒸馏方法结合第一推荐概率和第二推荐概率确定损失数值，并根据损失数值进行数据训练；在训练过程中以待推荐方案作为分析对象，可以更为直接的分析待推荐方案中的创意属性，更侧重创意属性的影像；提高了广告的整体投放效果。

在一些实施例中，创意分析网络包括用户分析塔和创意分析塔；则利用创意分析网络，确定各待推荐方案的创意分值包括：将关键词信息和用户信息输入用户分析塔，以使用户分析塔输出用户表征；将各待推荐方案的创意信息输入创意分析塔，以使创意分析塔输出创意表征；创意信息包括待推荐方案的标题信息、图片信息和ID信息；根据用户表征和创意表征确定创意分值。

具体的，创意分析网络的内部包括两个主要组成部分，分别为用户分析塔和创意分析塔，如图4所示。用户分析塔用于计算确定用户表征。上述的关键词信息和用户信息将输入至用户分析塔中，以使用户分析塔以此确定用户表征。而上述的创意信息将输入至创意分析塔中，以使创意分析塔确定创意表征。将用户特征和创意特征进行内积运算，即可得到创意分值。

在一些实施例中，创意分析塔还包括，淘汰子网络；则方法还包括：利用淘汰子网络按照预设的淘汰概率对ID信息进行淘汰处理。

具体的，在实践中发现当创意信息包括标题信息、图片信息和ID信息时，ID信息往往在训练中占主导地位，致使标题信息、图片信息无法有效的参与训练。为解决这一问题，本实施例中可以选择将ID信息按照一定比例进行淘汰，从而降低其对于训练的影响。也就是说，可以在确定创意表征前，将ID信息先输入淘汰子网络，使淘汰子网络按照预设的淘汰概率对ID信息进行淘汰处理。

在本实施例中，该淘汰概率可以表示为：

；

其中，pi代表第i个待推荐方案的淘汰概率，代表淘汰概率的最大值，ln为用于规范化展现量数值的预设函数，pv（i）代表第i个待推荐方案的展现量，/>均为淘汰子网络中的超参数。在上述计算淘汰概率的算法中，第i个待推荐方案的展现量增加，其淘汰概率pi也会随之增加，但淘汰概率pi不会超过最大值/>。

当然在其他一些情况下，还可利用其他方式计算得到该淘汰概率，本实施例中对此不限定，任何可以实现相同或类似效果的算法，均可结合在本申请整体技术方案中。

还需要说明的是，本实施例中创意分析塔的结构可以参考图5所示。其中，标题信息可以输入到创意分析塔中的bert模型，再经过MLP（多层感知机，MultilayerPerceptron），得到标题向量。图片信息可输入到创意分析塔中的CNN（卷积神经网络，Convolutional Neural Networks），再经过MLP得到图片向量。标题向量和图片向量可以通过注意力机制（attention）来学习得到动态权重。ID信息可以先经过嵌入层（embeddinglayer）和MLP的处理，再经过淘汰子网络进行淘汰处理，最终得到ID向量。根据标题向量、图片向量、ID向量可以共同确定创意表征。

在一些实施例中，利用广告排序网络，确定各个待推荐方案的点击分值包括：将关键词信息、用户信息和各待推荐方案的创意信息输入广告排序网络，以使广告排序网络确定各待推荐方案的预测点击率；根据预测点击率，确定各待推荐方案的点击分值。

具体的，广告排序网络的结构可以与现有技术类似，在此无需赘述，本实施例中亦不对此进行限定。任何可以实现相同或类似功能的网络模型均可结合在本申请整体技术方案中。需要说明的是，针对广告排序网络的输入信息，可以与创意分析网络相同，即同样输入上述的关键词信息、用户信息和创意信息。广告排序网络即可基于此预测各个待推荐方案投放后被用户进一步点击的预测点击率。通常，当一个投放的广告方案被用户点击，则可认为其达到了较好的投放效果。也就是说预测点击率越高，说明其越应当被优先的投放。按照这一原理，广告排序网络可以根据预测点击率进一步的计算输出各个待推荐方案的点击分值，也就是待投放方案在“点击率”这一评判维度上的“评分”。

还需要说明的是，在广告排序网络的计算过程中，一般也需要上述的创意表征。在本实施例中优选的，可以使广告排序网络和上述的创意分析塔共享创意表征，即可选择将如图5中计算得到创意表征直接输入到广告排序网络中。由此避免重复计算相同的创意表征，节约了运算资源。

在一些实施例中，假设待推荐方案的数量为m个。则各待推荐方案的创意分值表示为{s1，s2，…，sm}；各待推荐方案的点击分值表示为{y1，y2，…，ym}。根据各创意分值，确定各待推荐方案的第一推荐概率包括：

；

具体的，Pi代表第i个待推荐方案的第一推荐概率，si代表第i个待推荐方案的创意分值，sk代表第k个待推荐方案的创意分值，m为正整数，i和k为不大于m的正整数。第i个待推荐方案的第一推荐概率，代表了第i个待推荐方案基于创意分值被首选选中的概率。

在一些实施例中，根据各点击分值，确定各待推荐方案的第二推荐概率包括：

；

具体的，Pi’代表第i个待推荐方案的第二推荐概率，yi代表第i个待推荐方案的点击分值，yk代表第k个待推荐方案的点击分值，T为预设的调整参数。第i个待推荐方案的第二推荐概率，代表了第i个待推荐方案基于点击分值被首选选中的概率。还需要说明的是，由于预测点击率通常数值较小，所以为了在计算中突出该首选选中的概率，使概率分布趋向于尖锐，所以进一步的设置了调整参数T。调整参数T的具体数值可根据经验和实际需求进行设置，在此不赘述。

在一些实施例中，利用预设的损失函数，确定第一推荐概率和第二推荐概率的损失数值包括：

；

具体的，L代表损失数值。

该损失函数为交叉熵函数。通过该损失函数计算得到的损失数值，体现了第i个待推荐方案的第一推荐概率Pi和第二推荐概率Pi’之间的相对损失。在广告推荐模型训练之前，或者训练未完成之前，这一损失数值可能相对较大。而训练的目的则是使二者趋于收敛，由此可以使广告推荐模型充分的就“创意属性”进行深度学习，以实现重点基于创意属性的维度对待推荐方案进行排序和推荐，进而向用户推荐“创意程度”与之最为相符的广告方案，提高广告投放效果。

上述所有可选技术方案，可以采用任意结合形成本申请的可选实施例，在此不再一一赘述。

下述为本申请装置实施例，可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节，请参照本申请方法实施例。

图6是本申请实施例提供的一种基于创意特征的广告推荐模型的训练装置的示意图。广告推荐模型包括，创意分析网络和广告排序网络。如图6所示，装置包括：

创意分值确定模块601，用于利用创意分析网络，确定各待推荐方案的创意分值。

第一推荐模块602，用于根据各创意分值，确定各待推荐方案的第一推荐概率。

点击分值确定模块603，用于利用广告排序网络，确定各个待推荐方案的点击分值。

第二推荐模块604，用于根据各点击分值，确定各待推荐方案的第二推荐概率。

损失确定模块605，用于利用预设的损失函数，确定第一推荐概率和第二推荐概率的损失数值。

训练模块606，用于根据损失数值对广告推荐模型进行数据训练。

在一些实施例中，还包括：

创意分析网络包括用户分析塔和创意分析塔；创意分析塔还包括，淘汰子网络。

创意分值确定模块601包括：

用户表征确定单元611，用于将关键词信息和用户信息输入用户分析塔，以使用户分析塔输出用户表征。

创意表征确定单元612，用于将各待推荐方案的创意信息输入创意分析塔，以使创意分析塔输出创意表征；创意信息包括待推荐方案的标题信息、图片信息和ID信息。

创意分值确定单元613，用于根据用户表征和创意表征确定创意分值。

淘汰单元614，用于利用淘汰子网络按照预设的淘汰概率对ID信息进行淘汰处理。

点击分值确定模块603包括：

点击率预测单元631，用于将关键词信息、用户信息和各待推荐方案的创意信息输入广告排序网络，以使广告排序网络确定各待推荐方案的预测点击率。

点击分值确定单元632，用于根据预测点击率，确定各待推荐方案的点击分值。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

图7是本申请实施例提供的电子设备7的示意图。如图7所示，该实施例的电子设备7包括：处理器701、存储器702以及存储在该存储器702中并且可在处理器701上运行的计算机程序703。处理器701执行计算机程序703时实现上述各个方法实施例中的步骤。或者，处理器701执行计算机程序703时实现上述各装置实施例中各模块/单元的功能。

电子设备7可以是桌上型计算机、笔记本、掌上电脑及云端服务器等电子设备。电子设备7可以包括但不仅限于处理器701和存储器702。本领域技术人员可以理解，图7仅仅是电子设备7的示例，并不构成对电子设备7的限定，可以包括比图示更多或更少的部件，或者不同的部件。

处理器701可以是中央处理单元（Central Processing Unit，CPU），也可以是其它通用处理器、数字信号处理器（Digital Signal Processor，DSP）、专用集成电路（Application Specific Integrated Circuit，ASIC）、现场可编程门阵列（Field-Programmable Gate Array，FPGA）或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。

存储器702可以是电子设备7的内部存储单元，例如，电子设备7的硬盘或内存。存储器702也可以是电子设备7的外部存储设备，例如，电子设备7上配备的插接式硬盘，智能存储卡（Smart Media Card，SMC），安全数字（Secure Digital，SD）卡，闪存卡（Flash Card）等。存储器702还可以既包括电子设备7的内部存储单元也包括外部存储设备。存储器702用于存储计算机程序以及电子设备所需的其它程序和数据。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读存储介质中。基于这样的理解，本申请实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，计算机程序可以存储在计算机可读存储介质中，该计算机程序在被处理器执行时，可以实现上述各个方法实施例的步骤。计算机程序可以包括计算机程序代码，计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括：能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器（Read-Only Memory，ROM）、随机存取存储器（Random Access Memory，RAM）、电载波信号、电信信号以及软件分发介质等。需要说明的是，计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如，在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

Claims

1.一种基于创意特征的广告推荐模型的训练方法，其特征在于，所述广告推荐模型包括，创意分析网络和广告排序网络，所述方法包括：

利用所述创意分析网络，确定各待推荐方案的创意分值；根据各所述创意分值，确定各所述待推荐方案的第一推荐概率；

利用所述广告排序网络，确定各个待推荐方案的点击分值；根据各所述点击分值，确定各所述待推荐方案的第二推荐概率；

利用预设的损失函数，确定所述第一推荐概率和所述第二推荐概率的损失数值；并根据所述损失数值对所述广告推荐模型进行数据训练；所述损失函数为：

其中，L代表通过所述损失函数计算得到的损失数值，用于体现第i个待推荐方案的第一推荐概率和第二推荐概率/>之间的相对损失；

所述创意分析网络包括用户分析塔和创意分析塔；所述利用所述创意分析网络，确定各所述待推荐方案的创意分值包括：

将关键词信息和用户信息输入所述用户分析塔，以使所述用户分析塔输出用户表征；所述关键词信息包括用户预设历史时间段之内的搜索词；

将各所述待推荐方案的创意信息输入所述创意分析塔，以使所述创意分析塔输出创意表征；所述创意信息包括所述待推荐方案的标题信息、图片信息和ID信息；所述ID信息携带所述ID对应的待推荐方案的历史评价信息；

根据所述用户表征和所述创意表征确定所述创意分值；

所述创意分析塔还包括，淘汰子网络；则所述方法还包括：

利用所述淘汰子网络按照预设的淘汰概率对所述ID信息进行淘汰处理。

2.根据权利要求1所述方法，其特征在于，所述待推荐方案的数量为m，各所述待推荐方案的创意分值为{s1，s2，…，sm}；所述根据各所述创意分值，确定各所述待推荐方案的第一推荐概率包括：

其中，Pi代表第i个待推荐方案的第一推荐概率，si代表第i个待推荐方案的创意分值，sk代表第k个待推荐方案的创意分值，m为正整数，i和k为不大于m的正整数。

3.根据权利要求2所述方法，其特征在于，所述利用所述广告排序网络，确定各个待推荐方案的点击分值包括：

将关键词信息、用户信息和各所述待推荐方案的创意信息输入所述广告排序网络，以使所述广告排序网络确定各所述待推荐方案的预测点击率；

根据所述预测点击率，确定各所述待推荐方案的点击分值；所述点击分值为{y1，y2，…，ym}。

4.根据权利要求3所述方法，其特征在于，所述根据各所述点击分值，确定各所述待推荐方案的第二推荐概率包括：

其中，Pi’代表第i个待推荐方案的第二推荐概率，yi代表第i个待推荐方案的点击分值，yk代表第k个待推荐方案的点击分值，T为预设的调整参数。

5.一种基于创意特征的广告推荐模型的训练装置，用于实现权利要求1~4任一项所述的方法，其特征在于，所述广告推荐模型包括，创意分析网络和广告排序网络，所述装置包括：

创意分值确定模块，用于利用所述创意分析网络，确定各待推荐方案的创意分值；

第一推荐模块，用于根据各所述创意分值，确定各所述待推荐方案的第一推荐概率；

点击分值确定模块，用于利用所述广告排序网络，确定各个待推荐方案的点击分值；

第二推荐模块，用于根据各所述点击分值，确定各所述待推荐方案的第二推荐概率；

损失确定模块，用于利用预设的损失函数，确定所述第一推荐概率和所述第二推荐概率的损失数值；

训练模块，用于根据所述损失数值对所述广告推荐模型进行数据训练。

6.一种电子设备，包括存储器、处理器以及存储在所述存储器中并且可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至4中任一项所述方法的步骤。

7.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至4中任一项所述方法的步骤。