CN113919866A

CN113919866A - 模型训练方法、广告投放方法、装置、设备及存储介质

Info

Publication number: CN113919866A
Application number: CN202111136231.1A
Authority: CN
Inventors: 衣建中
Original assignee: Beijing ByteDance Network Technology Co Ltd
Current assignee: Beijing ByteDance Network Technology Co Ltd
Priority date: 2021-09-27
Filing date: 2021-09-27
Publication date: 2022-01-11
Anticipated expiration: 2041-09-27
Also published as: CN113919866B

Abstract

本申请提供了一种模型训练方法、广告投放方法、装置、设备及存储介质，包括：获取第一广告样本，第一广告样本包括：已投放广告的第一特征信息和已投放广告在多个投放位置上的实际点击率；将第一特征信息输入至第一模型中，得到已投放广告在多个投放位置上的第一预测点击率；根据第一预测点击率获取已投放广告的第二特征信息；将第一特征信息和第二特征信息输入至第二模型中，得到已投放广告在至少一个投放位置上的第二预测点击率；根据第一预测点击率、第二预测点击率和实际点击率训练第一模型和第二模型，以提高模型精度，进而提高广告投放精度。

Description

模型训练方法、广告投放方法、装置、设备及存储介质

技术领域

本申请实施例涉及互联网技术领域，尤其涉及一种模型训练方法、广告投放方法、装置、设备及存储介质。

背景技术

随着广告的宣传效果的不断提高，各大广告主对广告的投放力度也越来越大，基于此，执行设备确定各个广告的投放位置至关重要。

目前，执行设备可以将待投放广告的特征信息输入至一个模型，以得到该待投放广告在每个广告投放场景的每个投放位置上的点击率，根据该点击率确定各个投放位置上的待投放广告，然而这种模型精度较低，导致广告投放精度较低的问题，因此，训练一个精度较高的模型至关重要。

发明内容

本申请提供一种模型训练方法、广告投放方法、装置、设备及存储介质，以提高模型精度，进而提高广告投放精度。

第一方面，提供一种模型训练方法，包括：已投放广告的第一特征信息和已投放广告在多个投放位置上的实际点击率；将第一特征信息输入至第一模型中，得到已投放广告在多个投放位置上的第一预测点击率；根据第一预测点击率获取已投放广告的第二特征信息；将第一特征信息和第二特征信息输入至第二模型中，得到已投放广告在至少一个投放位置上的第二预测点击率；根据第一预测点击率、第二预测点击率和实际点击率训练第一模型和第二模型。

第二方面，提供一种广告投放方法，包括：获取待投放广告；将待投放广告的第一特征信息输入至根据上述模型训练方法所训练得到第一模型，以得到待投放广告在多个投放位置上的第一预测点击率；根据第一预测点击率获取待投放广告的第二特征信息；将第一特征信息和第二特征信息输入至根据上述模型训练方法所训练得到第二模型中，得到待投放广告在多个投放位置上的第二预测点击率；根据第二预测点击率确定待投放广告的投放位置；在投放位置投放待投放广告。

第三方面，提供一种模型训练装置，包括：第一获取模块、第一输入模块、第二获取模块、第三获取模块、第二输入模块和第一训练模块。第一获取模块用于获取第一广告样本，第一广告样本包括：已投放广告的第一特征信息和已投放广告在多个投放位置上的实际点击率；第一输入模块用于将第一特征信息输入至第一模型中，得到已投放广告在多个投放位置上的第一预测点击率；第二获取模块用于根据第一预测点击率获取已投放广告的第二特征信息；第二输入模块用于将第一特征信息和第二特征信息输入至第二模型中，得到已投放广告在至少一个投放位置上的第二预测点击率；第一训练模块用于根据第一预测点击率、第二预测点击率和实际点击率训练第一模型和第二模型。

第四方面，提供一种广告投放装置，包括：第一获取模块、第一输入模块、第二获取模块、第二输入模块、确定模块和投放模块，其中，第一获取模块用于获取待投放广告；第一输入模块用于将待投放广告的第一特征信息输入至根据上述模型训练方法所训练得到第一模型，以得到待投放广告在多个投放位置上的第一预测点击率；第二获取模块用于根据第一预测点击率获取待投放广告的第二特征信息；第二输入模块，用于将第一特征信息和第二特征信息输入至根据上述模型训练方法所训练得到第二模型中，得到待投放广告在多个投放位置上的第二预测点击率；确定模块用于根据第二预测点击率确定待投放广告的投放位置；投放模块用于在投放位置投放待投放广告。

第五方面，提供一种电子设备，包括：处理器和存储器，该存储器用于存储计算机程序，该处理器用于调用并运行该存储器中存储的计算机程序，执行如第一方面、第二方面或其各实现方式中的方法。

第六方面，提供一种计算机可读存储介质，用于存储计算机程序，计算机程序使得计算机执行如第一方面、第二方面或其各实现方式中的方法。

第七方面，提供一种计算机程序产品，包括计算机程序指令，该计算机程序指令使得计算机执行如第一方面、第二方面或其各实现方式中的方法。

第八方面，提供一种计算机程序，计算机程序使得计算机执行如第一方面、第二方面或其各实现方式中的方法。

综上，本申请采用的是二次预估模型，由于该二次预估模型利用了一次预估模型的预估结果，并且再次进行广告点击率的预估，因此，二次预估模型相对于依次预估模型的精度更高，从而可以提高广告投放精度。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种系统架构示意图；

图2为本申请实施例提供的一种模型训练方法的流程图；

图3为本申请实施例提供的一种第一模型的示意图；

图4为本申请实施例提供的一种第二模型的示意图；

图5为本申请实施例提供的一种广告投放方法的流程图；

图6为本申请实施例提供的一种模型训练装置600的示意图；

图7为本申请实施例提供的一种广告投放装置700的示意图；

图8是本申请实施例提供的电子设备800的示意性框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

应理解的是，某一广告的点击率是指在当前页面，如视频页面或者浏览器页面上该广告被点击的次数与被显示次数之比，即clicks/views，它是一个百分比。反映了当前页面上该广告的受关注程度，其可以用来衡量该广告的吸引程度。

应理解的是，本申请实施例中的广告也被称为信息流广告，它是嵌在内容中的广告，如在各个网页、应用(Application，APP)上，与新闻、文章、故事、短视频、电影混排在一起的广告。

信息流广告在当下已经成为了一种非常主流且有效的获取新用户的方式，它最大特点就是有大数据支持，依托用户的画像数据、行为数据及消费偏好，结合算法，在合适的场景给合适的用户推送合适的内容，整个过程即提升了用户的体验，又提高了广告主的投放效率。

如上所述，目前执行设备可以将待投放广告的特征信息输入至一个模型，以得到该待投放广告在每个广告投放场景的每个投放位置上的点击率，根据该点击率确定各个投放位置上的待投放广告，然而这种模型精度较低，导致广告投放精度较低的问题，因此，训练一个精度较高的模型至关重要。

为了解决上述技术问题，在本申请实施例中，训练设备可以训练二次预估的模型，即通过第一模型输出已投放广告在多个投放位置上的预测点击率，而第二模型的输入需要结合第一模型的输出结果，以再次确定已投放广告在多个投放位置上的预测点击率，基于第一模型输出的预测点击率、第二模型输出的预测点击率和已投放广告的实际点击率训练第一模型和第二模型。

在一些实施例中，本申请实施例的系统架构如图1所示。

图1为本申请实施例涉及的一种系统架构示意图，用户设备101、数据采集设备102、训练设备103、执行设备104、数据库105和内容库106。

其中，数据采集设备102用于从内容库106中读取训练数据，并将读取的训练数据存储至数据库105中，其中，本申请实施例涉及的训练数据包括：第一模型的训练数据，即下文中的第一广告样本，以及，第二模型的训练数据，即下文中的第二广告样本。而第一广告样本可以来自于至少一个广告投放平台。每个第一广告样本可以包括：一个已投放广告的第一特征信息以及该已投放广告在多个投放位置上的实际点击率，其中，该已投放广告在多个投放位置上的实际点击率也就是广告样本的标签。

其中，每个广告投放平台都可以存在至少一个广告投放场景，每个广告投放场景可以包括至少一个投放位置，例如：某广告投放平台包括：广告投放场景1、广告投放场景2和广告投放场景3，广告投放场景1包括：3个投放位置，分别是投放位置1、投放位置2和投放位置3，广告投放场景2包括：2个投放位置，分别是投放位置4、投放位置5，广告投放场景3包括：1个投放位置：投放位置6。

假设某已投放广告已在投放位置1投放，因此，该已投放广告在多个投放位置上的实际点击率构成一个向量(1,0,0,0,0,0)，这6个数字分别对应投放位置1、投放位置2……投放位置6，标签中元素1表示已投放广告在对应的投放位置被投放，元素0表示已投放广告未在对应的投放位置被投放。

第二广告样本中的第一特征信息和已投放广告在多个投放位置上的实际点击率可以来自于至少一个广告投放平台，而第二广告样本中的第二特征信息是根据第一模型的输出结果得到的，因此，其可以来自于训练设备103。

在一些实施例中，训练设备103基于数据库105中维护的训练数据，对第一模型和第二模型进行训练，使得训练后的第一模型和第二模型可以准确预测出待投放广告在各个投放位置上的点击率。

在附图1中，执行设备104配置有I/O接口107，与外部设备进行数据交互。比如通过I/O接口接收用户设备101发送的待投放广告的第一特征信息。执行设备104中的计算模块109使用训练好的第一模型对待投放广告的第一特征信息进行处理，输出待投放广告在多个投放位置上的第一预测点击率，接着执行设备104可以将根据第一预测点击率获取待投放广告的第二特征信息，并将第一特征信息和第二特征信息输入至第二模型中，得到待投放广告在多个投放位置上的第二预测点击率，根据第二预测点击率确定待投放广告的投放位置，在该投放位置投放待投放广告。并通过I/O接口将该投放位置发送至用户设备101。

用户设备101可以是广告主所持有的用户设备，用户设备101可以包括手机、平板电脑、笔记本电脑、掌上电脑、移动互联网设备(mobile internet device，MID)或其他具有安装浏览器功能的终端设备。

执行设备104可以为服务器。

示例性的，服务器可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器等计算设备。该服务器可以是独立的测试服务器，也可以是多个测试服务器所组成的测试服务器集群。

本实施例中，执行设备104通过网络与用户设备101连接。所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobilecommunication，GSM)、宽带码分多址(Wideband Code Division Multiple Access，WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi、通话网络等无线或有线网络。

需要说明的是，图1仅是本申请实施例提供的一种系统架构的示意图，图中所示设备、器件、模块等之间的位置关系不构成任何限制。在一些实施例中，上述数据采集设备102与用户设备101、训练设备103和执行设备104可以为同一个设备，或者，数据采集设备102与训练设备103和执行设备104可以为同一个设备。上述数据库105可以分布在一个服务器上也可以分布在多个服务器上，上述的内容库106可以分布在一个服务器上也可以分布在多个服务器上。

下面通过一些实施例对本申请实施例的技术方案进行详细说明。下面这几个实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例不再赘述。

图2为本申请实施例提供的一种模型训练方法的流程图，该方法可以由图1中的训练设备103执行，但不限于此，如图2所示，该方法包括如下步骤：

S210：获取第一广告样本，第一广告样本包括：已投放广告的第一特征信息和已投放广告在多个投放位置上的实际点击率；

S220：将第一特征信息输入至第一模型中，得到已投放广告在多个投放位置上的第一预测点击率；

S230：根据第一预测点击率获取已投放广告的第二特征信息；

S240：将第一特征信息和第二特征信息输入至第二模型中，得到已投放广告在至少一个投放位置上的第二预测点击率；

S250：根据第一预测点击率、第二预测点击率和实际点击率训练第一模型和第二模型。

应理解的是，训练设备可以获取至少一个第一广告样本以及至少一个第二广告样本，其中，第一广告样本和第二广告样本之间具有一一对应关系。

如上所述，上述已投放广告样本包括：已投放广告的第一特征信息以及已投放广告在多个投放位置上的实际点击率，即标签，该标签包括多个元素，每个元素表示在对应的投放位置上的点击率，其中，每个元素的取值范围是【0,1】，例如：如果已投放广告的某个元素大于0，表示该已投放广告在该元素对应的投放位置进行了投放。

在一些可实现方式中，已投放广告的第一特征信息包括以下至少一项，但不限于此：已投放广告的用户特征、广告特征、上下文特征。

在一些可实现方式中，已投放广告的用户特征包括以下至少一项，但不限于此：用户年龄、性别、职业、学历等。

在一些可实现方式中，已投放广告的广告特征包括以下至少一项，但不限于此：广告类型、广告时长。

在一些可实现方式中，已投放广告的上下文特征包括以下至少一项，但不限于此：广告的观看时间、观看位置等。

示例性的，图3为本申请实施例提供的一种第一模型的示意图，如图3所示，该第一模型包括：共享嵌入层和至少一个场景塔，其中，图3以包括多个场景塔为例，每个场景塔对应一个广告投放场景，广告投放场景包括至少一个投放位置。其中，图3中上面的箭头表示投放位置。

应理解的是，共享嵌入层实际是一个嵌入层(embedding)，之所以被称为共享嵌入层是因为该嵌入层可以被多个场景塔共享。目前该嵌入层可以采用one-hot编码方式，该one-hot编码又称为一位有效编码，主要是采用N位状态寄存器来对N个状态进行编码，每个状态都由它独立的寄存器位，并且在任意时候只有一位有效。这种编码方式可以将已投放广告的第一特征信息整合成一个稀疏矩阵，优点是有利于系数矩阵做矩阵计算，如矩阵相乘，而确定是稀疏矩阵较大，占用存储资源较大，因此，采用共享嵌入层可以对特征信息进行降维处理，而共享嵌入层的输出是第一特征信息经过共享嵌入层进行降维处理后得到的第一特征向量，也就是说，该第一特征向量是第一特征信息经过共享嵌入层降维处理后得到的结果，而关于第一特征向量具体包括哪些元素，本申请实施例对此不做限制。

在一些可实现方式中，多个已投放广告的第一特征信息可以通过批处理方式输入至共享嵌入层的。或者，多个已投放广告的第一特征信息是各自独立输入至共享嵌入层的，本申请实施例对此不做限制。

应理解的是，上述任一场景塔都是一网络，假设将第一模型理解为一个神经网络，那么该场景塔可以是该神经网络中的一个子网络。上述任一场景塔可以存在至少一个头，每个头对应一个投放位置，例如：广告投放场景1包括：3个投放位置，分别是投放位置1、投放位置2和投放位置3，广告投放场景2包括：2个投放位置，分别是投放位置4、投放位置5，广告投放场景3包括：1个投放位置：投放位置6。

如上所述，每个场景塔的输入是第一特征向量，输出是已投放广告在多个投放位置上的第一预测点击率。例如：假设所有的场景塔总共存在6个投放位置，某已投放广告在这6个投放位置上的点击率构成包括6个元素的向量，如(0.5,0.3,0.2,0,0,0)，0.5表示该已投放广告在投放位置1上的点击率是0.5，0.3表示该已投放广告在投放位置2上的点击率是0.3，0.2表示该已投放广告在投放位置3上的点击率是0.2，3个0依次表示该已投放广告在投放位置4、5、6上的点击率均是0。

应理解的是，训练设备可以通过如下可实现方式获取第二特征信息，但不限于此：

可实现方式一：训练设备根据第一预测点击率得到已投放广告的预测投放位置；根据预测投放位置确定已投放广告之前的M个广告和之后的N个广告，M、N均为整数；获取M个广告的标识信息和N个广告的标识信息；其中，第二特征信息包括以下至少一项：预测投放位置、M个广告的标识信息、N个广告的标识信息。

可实现方式二：训练设备根据第一预测点击率得到已投放广告的预测投放位置，其中，第二特征信息包括：预测投放位置。

应理解的是，训练设备可以通过如下可实现方式确定已投放广告的预测投放位置，但不限于此：

在一些可实现方式中，训练设备可以根据第一预测点击率确定已投放广告在上述多个投放位置上的最大预测点击率；将最大预测点击率对应的投放位置确定为已投放广告的预测投放位置。

示例性地，假设所有的场景塔总共存在6个投放位置，某已投放广告在这6个投放位置上的点击率构成包括6个元素的向量，即第一点击率是(0.5,0.3,0.2,0,0,0)，0.5表示该已投放广告在投放位置1上的点击率是0.5，0.3表示该已投放广告在投放位置2上的点击率是0.3，0.2表示该已投放广告在投放位置3上的点击率是0.2，3个0依次表示该已投放广告在投放位置4、5、6上的点击率均是0。这时训练设备可以选择0.5对应的投放位置1作为该已投放广告的预测投放位置。

可选地，如果规定每个投放位置上只能投放一个广告，且存在多个已投放广告，则训练设备可以对这些已投放广告进行排序，例如：可以按照已投放广告的重要度由高至低的顺序进行排序，先对第一个已投放广告按照该可实现方式确定其对应的预测投放位置。接着对第二个已投放广告按照该可实现方式确定其对应的预测投放位置，以此类推，直至所有的已投放广告都被确定了预测投放位置为止。其中，如果训练设备针对某已投放广告的投放位置已经被确定是其他已投放广告的投放位置，这时训练设备可以根据第一预测点击率确定该已投放广告在上述多个投放位置上的次大预测点击率；如果次大预测点击率对应的投放位置未被占用，则将该投放位置确定为该已投放广告的投放位置，否则，按照上述方式以此类推，直到确定完该已投放广告的投放位置为止。

在另一些可实现方式中，针对任一已投放广告，训练模块可以计算该已投放广告在每个投放位置的第一预测点击率与该已投放广告的出价的乘积，以得到该已投放广告在每个投放位置的乘积结果，确定每个投放位置上对应乘积结果最大的已投放广告为每个投放位置上的已投放广告。

信息流广告主要涉及到两个主体：广告投放平台和广告主，其中，广告投放平台提供广告位及流量，收取广告费；广告主提供广告素材并付费，收获曝光及用户，因此，信息流广告设计的广告模式中分别存在：竞价点、计费点、出价点、考核点四个关键节点。广告投放平台及广告主为了最大化自身利润，将投放过程中的计费节点放在整个过程中的不同位置，形成了千次展示费用(Cost Per Mile，CPM)、按点击数收费(Cost Per Click，CPC)、估计成本(Estimated Cost Per，eCPM)等不同模式。

应理解的是，CPM计费模式指的是按广告展现次数来收费，因为每次展现费用很小，约定乘以1000，即千次广告展现的费用。

应理解的是，CPC计费模式指的是按广告点击次数来收费，因为广告点击费用通常较大，故不用乘1000。

针对eCPM计费模式进行示例性说明：

示例性的，如果广告主A在某投放位置1的广告CPC出价为0.3元，B在该投放位置1的一条广告CPC为0.4元，这时候训练设备通常会用点击率预估模型，即通过如下公式确定已投放广告的价值，即已投放广告的乘积结果：

eCPM＝CTR x CPC x 1000 (1)

其中，eCPM表示已投放广告的乘积结果，CTR表示已投放广告的第一预测点击率，CPC表示已投放广告的CPC出价。

假设广告主A的已投放广告的第一预测点击率CTR_A预估为0.03，广告主B的已投放广告的第一预测点击率CTR_B预估为0.02，那么按照公式(1)可以得到：eCPM_A＝0.03x0.3x1000＝9元，eCPM_B＝0.02x0.4x1000＝8元。

其中，eCPM_A表示广告主A的已投放广告的乘积结果，eCPM_B表示广告主B的已投放广告的乘积结果。

进一步地，训练设备根据eCPM排序，最终确定投放位置1是广告主A的已投放广告的预测投放位置。

应理解的是，训练设备可以采用eCPM计费模式、CPM计费模式或者CPC计费模式中的任一项或者组合确定每个投放位置对应的已投放广告。

需要说明的是，如果规定每个投放位置上只能投放一个广告，且存在多个已投放广告，则训练设备可以对多个投放位置进行排序，例如：可以按照投放位置的重要度或者索引由高至低的顺序进行排序，先对第一个投放位置按照该可实现方式确定其对应的已投放广告。接着将在第一个投放位置对应的已投放广告排除在外，对第二个投放位置按照该可实现方式在其余的已投放广告中确定该位置对应的已投放广告，以此类推，直至所有的投放位置都被确定了已投放广告为止。

在再一些可实现方式中，训练设备可以确定每个投放位置上对应点击率最大的已投放广告，并确定每个投放位置上对应点击率最大的已投放广告为该投放位置对应的最终的已投放广告。

示例性的，假设广告主A在投放位置1的已投放广告的点击率CTR_A预估为0.03，广告主B在投放位置1的已投放广告的点击率CTR_B预估为0.02，那么训练设备根据已投放广告的点击率排序，最终确定投放位置1对应的广告主A的已投放广告。

在一些可实现方式中，实际上，训练设备可以确定每个已投放广告的预测投放位置；基于此，针对每个已投放广告，训练设备可以根据该已投放广告和其他已投放广告的预测投放位置确定该已投放广告之前的M个广告和之后的N个广告。

在另一些可实现方式中，训练设备在确定了每个已投放广告的预测投放位置之后，可以建立每个已投放广告的预测投放位置与其之前的M个广告和之后的N个广告之间的映射关系，基于此，训练设备可以直接根据已投放广告的预测投放位置确定其之前的M个广告和之后的N个广告。

在一些可实现方式中，上述M+N是固定值，例如：M+N＝5，假设某已投放广告的预测投放位置是2，那么训练设备可以确定其之前的1个广告和之后的3个广告。

在一些可实现方式中，M个广告和N个广告中任一个广告的标识信息可以是以下至少一项：广告的名称、广告的索引等，本申请对此不做限制。

示例性的，图4为本申请实施例提供的一种第二模型的示意图，如图4所示，该第二模型包括：共享嵌入层和至少一个场景塔，其中，图3以包括多个场景塔为例，每个场景塔对应一个广告投放场景，广告投放场景包括至少一个投放位置。其中，图4中上面的箭头表示投放位置。

在一些可实现方式中，共享嵌入层的输入是第一特征信息和第二特征信息，共享嵌入层用于生成第一特征信息对应的第一特征向量和第二特征信息对应的至少一个第二特征向量，并分别对第一特征向量和至少一个第二特征向量进行合并(concat)，得到至少一个第三特征向量。共享嵌入层的输出是至少一个第三特征向量。

应理解的是，第二特征信息与第二特征向量一一对应，例如：假设第二特征信息包括如下三项：预测投放位置、M个广告的标识信息、N个广告的标识信息，那么便存在三个第二特征向量，它们分别用于表征预测投放位置、M个广告的标识信息、N个广告的标识信息。如上所述，共享嵌入层可以对特征信息进行降维处理，那么这三个第二特征向量可以被理解为是共享嵌入层对上述三个第二特征信息进行降维处理后的特征向量，而关于第二特征向量具体包括哪些元素，本申请实施例对此不做限制。

在一些可实现方式中，假设将第一特征信息和第二特征信息统称为特征信息，那么多个已投放广告的特征向量可以通过批处理方式输入至共享嵌入层的。或者，多个已投放广告的特征信息是各自独立输入至共享嵌入层的，本申请实施例对此不做限制。

在一些可实现方式中，共享嵌入层分别对第一特征向量和至少一个第二特征向量进行合并，可以被理解为分别对第一特征向量和至少一个第二特征向量进行拼接。其中，拼接得到的第三特征向量和第二特征向量一一对应。

示例性地，假设第一特征向量是(1,1,1,1)，三个第二特征向量分别是(0.3,0.5,0.7,0.9)、(0.1,0.3,0.7,0.9)、(0.2,0.5,0.6,0.8)，那么得到的三个第三特征向量是(1,1,1,1,0.3,0.5,0.7,0.9)、(1,1,1,1,0.1,0.3,0.7,0.9)、(1,1,1,1,0.2,0.5,0.6,0.8)。

在一些可实现方式中，第二模型的第一场景塔的输入是至少一个第三特征向量，输出是已投放广告在第一场景塔对应的广告投放场景下的至少一个投放位置上的第二预测点击率，该第一场景塔是已投放广告的实际投放位置对应的场景塔或者是第二模型包括的任一个场景塔。如果第一场景塔是已投放广告的实际投放位置对应的场景塔，那么该场景塔对应的广告投放场景下的至少一个投放位置可以是实际投放位置。相应的，训练设备得到的是已投放广告在实际投放位置上的第二预测点击率。如果第一场景塔是第二模型包括的任一个场景塔，那么该场景塔对应的广告投放场景下的至少一个投放位置可以是该场景下的所有投放位置。相应的，训练设备得到的是已投放广告在该场景下的所有投放位置上的第二预测点击率。

关于场景塔的解释说明可以参考第一模型中场景塔的解释说明，本申请对此不再赘述。

在一些可实现方式中，训练设备可以根据已投放广告的标签，确定已投放广告的实际投放位置，例如：标签是(0.5,0,0,0,0)，而0.5对应的投放位置是1，说明已投放广告的实际投放位置是投放位置1。

在一些可实现方式中，训练设备在获取到每个已投放广告的第一预测点击率、第二预测点击率和实际点击率之后，可以通过每个已投放广告的第一预测点击率、第二预测点击率和实际点击率训练第一模型和第二模型，例如：针对每个已投放广告，训练设备根据第一预测点击率和实际点击率计算第一模型的损失；根据第二预测点击率和实际点击率计算第二模型的损失；计算第一模型的损失和第二模型的损失的加权平均值；根据加权平均值训练第一模型和第二模型。

在一些可实现方式中，第一模型的损失可以为第一预测点击率和实际点击率之差的范数，或者第一预测点击率和实际点击率中各个元素之差的平方和，本申请对如何计算第一模型的损失不做限制。

在一些可实现方式中，第二模型的损失可以为第二预测点击率和实际点击率之差的范数，或者第二预测点击率和实际点击率中各个元素之差的平方和，本申请对如何计算第二模型的损失不做限制。

在一些可实现方式中，第一模型的损失和第二模型的损失对应的权重系数可以是预设的，也可以是动态变化的，本申请对如何确定二者的权重系数不做限制。

示例性地，假设将第一模型的损失记为loss1，第二模型的记为loss2，训练设备可以计算最终的损失为loss，该loss＝0.5*loss1+0.5*loss2。

在一些可实现方式中，当训练设备得到的加权平均值小于或等于某预设阈值时，则训练设备可以停止训练目标模型。

在一些可实现方式中，当第一模型和第二模型的训练次数达到预设次数时，训练设备可以停止训练目标模型。总之，本申请实施例对第一模型和第二模型的训练方式不做限制。

在一些可实现方式中，训练设备在获取到每个已投放广告的第一预测点击率、第二预测点击率和实际点击率之后，可以将已投放广告的这些训练数据作为一个训练集，通过该训练集对第一模型和第二模型进行训练。例如：训练设备根据所有已投放广告的第一预测点击率和实际点击率计算第一模型的损失；根据所有已投放广告的第二预测点击率和实际点击率计算第二模型的损失；计算第一模型的损失和第二模型的损失的加权平均值；根据加权平均值训练第一模型和第二模型。

在一些可实现方式中，第一模型的损失可以通过如下方式计算：训练设备计算每个已投放广告的第一预测点击率和实际点击率之差的范数，对所有已投放广告的范数求和，或者训练设备计算每个已投放广告的第一预测点击率和实际点击率中各个元素之差的平方和，对所有已投放广告的平方和求和，本申请对如何计算第一模型的损失不做限制。

在一些可实现方式中，第二模型的损失可以通过如下方式计算：训练设备计算每个已投放广告的第二预测点击率和实际点击率之差的范数，对所有已投放广告的范数求和，或者训练设备计算每个已投放广告的第二预测点击率和实际点击率中各个元素之差的平方和，对所有已投放广告的平方和求和，本申请对如何计算第二模型的损失不做限制。

应理解的是，关于如何确定第一模型的损失和第二模型的损失的权重系数以及停止训练第一模型和第二模型的条件，可以参考上文，本申请对此不再赘述。

应理解的是，上述训练过程均包括对第二模型的训练，而为了提高训练效率，在有些情况下，训练设备可以不对第二模型进行训练，例如：当训练设备判断已投放广告的实际投放位置所对应的广告投放场景流量是否大于或等于预设流量；若实际投放位置所对应的广告投放场景流量大于或等于预设流量，则按照上述可实现方式训练第一模型和第二模型。若实际投放位置所对应的广告投放场景流量小于预设流量，则训练设备根据第一预测点击率和实际点击率训练第一模型即可。关于如何训练第一模型可参考上文的模型训练过程，本申请对此不再赘述。

综上，在本申请中，训练设备可以训练二次预估的模型，即通过第一模型输出已投放广告在多个投放位置上的预测点击率，而第二模型的输入需要结合第一模型的输出结果，以再次确定已投放广告在多个投放位置上的预测点击率，基于第一模型输出的预测点击率、第二模型输出的预测点击率和已投放广告的实际点击率训练第一模型和第二模型。其中，由于二次预估模型利用了一次预估模型的预估结果，并且再次进行广告点击率的预估，因此，二次预估模型相对于依次预估模型的精度更高，从而可以提高广告投放精度。

进一步地，在训练第二模型时，训练模型可以只计算已投放广告在实际投放位置上的损失，从而可以降低模型训练复杂度。

更进一步地，若已投放广告的实际投放位置所对应的广告投放场景流量小于预设流量，则训练设备根据第一预测点击率和实际点击率训练第一模型即可，而无需训练第二模型，从而可以提高模型训练效率。

图5为本申请实施例提供的一种广告投放方法的流程图，该方法可以由图1中的执行设备104执行，但不限于此，如图5所示，该方法包括如下步骤：

S510：获取待投放广告；

S520：将待投放广告的第一特征信息输入至第一模型，以得到待投放广告在多个投放位置上的第一预测点击率；

S530：根据第一预测点击率获取待投放广告的第二特征信息；

S540：将第一特征信息和第二特征信息输入至第二模型中，得到待投放广告在多个投放位置上的第二预测点击率；

S550：根据第二预测点击率确定待投放广告的投放位置；

S560：在投放位置投放待投放广告。

应理解的是，训练设备可以同时获取至少一个待投放广告。

在一些可实现方式中，待投放广告的第一特征信息包括以下至少一项，但不限于此：待投放广告的用户特征、广告特征、上下文特征。

在一些可实现方式中，待投放广告的用户特征包括以下至少一项，但不限于此：用户年龄、性别、职业、学历等。

在一些可实现方式中，待投放广告的广告特征包括以下至少一项，但不限于此：广告类型、广告时长。

在一些可实现方式中，待投放广告的上下文特征包括以下至少一项，但不限于此：广告的观看时间、观看位置等。

关于第一模型的解释说明可以参考上文，本申请对此不再赘述。

应理解的是，执行设备可以通过如下可实现方式获取第二特征信息，但不限于此：

可实现方式一：执行设备根据第一预测点击率得到待投放广告的预测投放位置；根据预测投放位置确定已投放广告之前的M个广告和之后的N个广告，M、N均为整数；获取M个广告的标识信息和N个广告的标识信息；其中，第二特征信息包括以下至少一项：预测投放位置、M个广告的标识信息、N个广告的标识信息。

可实现方式二：执行设备根据第一预测点击率得到待投放广告的预测投放位置，其中，第二特征信息包括：预测投放位置。

应理解的是，执行设备可以通过参考上文来确定待投放广告的预测投放位置，本申请对此不再赘述。

关于第二模型的解释说明可参考上文，本申请对此不再赘述。

需要说明的是，在执行过程中，第二模型的每个场景塔的输入是至少一个第三特征向量，输出是待投放广告在场景塔对应的广告投放场景下的至少一个投放位置上的第二预测点击率。

关于如何根据第二预测点击率确定待投放广告的投放位置，可参考训练设备根据第一预测点击率得到已投放广告的预测投放位置的方法，本申请对此不再赘述。

综上，在本申请中，由于第一模型和第二模型采用了上述训练方法进行训练，使得得到的模型精度更高，从而可以提高广告投放精度。

图6为本申请实施例提供的一种模型训练装置600的示意图，如图6所示，该装置600包括：第一获取模块610、第一输入模块620、第二获取模块630、第二输入模块640和第一训练模块650，其中，第一获取模块610用于获取第一广告样本，第一广告样本包括：已投放广告的第一特征信息和已投放广告在多个投放位置上的实际点击率；第一输入模块620用于将第一特征信息输入至第一模型中，得到已投放广告在多个投放位置上的第一预测点击率；第二获取模块630用于根据第一预测点击率获取已投放广告的第二特征信息；第二输入模块640用于将第一特征信息和第二特征信息输入至第二模型中，得到已投放广告在至少一个投放位置上的第二预测点击率；第一训练模块650用于根据第一预测点击率、第二预测点击率和实际点击率训练第一模型和第二模型。

在一些可实现方式中，第二获取模块630具体用于：根据第一预测点击率得到已投放广告的预测投放位置；根据预测投放位置确定已投放广告之前的M个广告和之后的N个广告，M、N均为整数；获取M个广告的标识信息和N个广告的标识信息；其中，第二特征信息包括以下至少一项：预测投放位置、M个广告的标识信息、N个广告的标识信息。

在一些可实现方式中，第二模型包括：共享嵌入层和至少一个场景塔，场景塔对应一个广告投放场景，广告投放场景包括至少一个投放位置；共享嵌入层是至少一个场景塔共享的嵌入层，共享嵌入层的输入是第一特征信息和第二特征信息，共享嵌入层用于生成第一特征信息对应的第一特征向量和第二特征信息对应的至少一个第二特征向量，并分别对第一特征向量和至少一个第二特征向量进行合并，得到至少一个第三特征向量；第一场景塔的输入是至少一个第三特征向量，输出是已投放广告在第一场景塔对应的广告投放场景下的至少一个投放位置上的第二预测点击率，第一场景塔是已投放广告的实际投放位置对应的场景塔或者是至少一个场景塔中的任一个场景塔。

在一些可实现方式中，第二获取模块630具体用于：根据第一预测点击率确定已投放广告在多个投放位置上的最大预测点击率；将最大预测点击率对应的投放位置确定为已投放广告的预测投放位置。

在一些可实现方式中，第二输入模块640具体用于：将第一特征信息和第二特征信息输入至第二模型中，得到已投放广告在实际投放位置上的第二预测点击率。

在一些可实现方式中，第二输入模块640具体用于：将第一特征信息和第二特征信息输入至第二模型中，得到已投放广告在多个投放位置上的第二预测点击率。

在一些可实现方式中，第一训练模块650具体用于：根据第一预测点击率和实际点击率计算第一模型的损失；根据第二预测点击率和实际点击率计算第二模型的损失；计算第一模型的损失和第二模型的损失的加权平均值；根据加权平均值训练第一模型和第二模型。

在一些可实现方式中，上述装置600还包括：判断模块660，用于判断已投放广告的实际投放位置所对应的广告投放场景流量是否大于或等于预设流量；相应的，第二输入模块640具体用于：若实际投放位置所对应的广告投放场景流量大于或等于预设流量，则将第一特征信息和第二特征信息输入至第二模型中，得到已投放广告在至少一个投放位置上的第二预测点击率。

在一些可实现方式中，上述装置600还包括：第二训练模块670，用于若实际投放位置所对应的广告投放场景流量小于预设流量，则根据第一预测点击率和实际点击率训练第一模型。

应理解的是，装置实施例与方法实施例可以相互对应，类似的描述可以参照方法实施例。为避免重复，此处不再赘述。具体地，图6所示的装置600可以执行图2对应的方法实施例，并且装置600中的各个模块的前述和其它操作和/或功能分别为了实现图2中的各个方法中的相应流程，为了简洁，在此不再赘述。

上文中结合附图从功能模块的角度描述了本申请实施例的装置600。应理解，该功能模块可以通过硬件形式实现，也可以通过软件形式的指令实现，还可以通过硬件和软件模块组合实现。具体地，本申请实施例中的方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路和/或软件形式的指令完成，结合本申请实施例公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。可选地，软件模块可以位于随机存储器，闪存、只读存储器、可编程只读存储器、电可擦写可编程存储器、寄存器等本领域的成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法实施例中的步骤。

图7为本申请实施例提供的一种广告投放装置700的示意图，如图7所示，该装置700包括：第一获取模块710、第一输入模块720、第二获取模块730、第二输入模块740、确定模块750和投放模块760，其中，第一获取模块710用于获取待投放广告；第一输入模块720用于将待投放广告的第一特征信息输入至根据上述模型训练方法所训练得到第一模型，以得到待投放广告在多个投放位置上的第一预测点击率；第二获取模块730用于根据第一预测点击率获取待投放广告的第二特征信息；第二输入模块740用于将第一特征信息和第二特征信息输入至根据上述模型训练方法所训练得到第二模型中，得到待投放广告在多个投放位置上的第二预测点击率；确定模块750用于根据第二预测点击率确定待投放广告的投放位置；投放模块760用于在投放位置投放待投放广告。

在一些可实现方式中，第二获取模块730具体用于：根据第一预测点击率得到待投放广告的预测投放位置；根据预测投放位置确定待投放广告之前的M个广告和之后的N个广告，M、N均为整数；获取M个广告的标识信息和N个广告的标识信息；其中，第二特征信息包括以下至少一项：预测投放位置、M个广告的标识信息、N个广告的标识信息。

在一些可实现方式中，第二模型包括：共享嵌入层和至少一个场景塔，场景塔对应一个广告投放场景，广告投放场景包括至少一个投放位置；共享嵌入层是至少一个场景塔共享的嵌入层，共享嵌入层的输入是第一特征信息和第二特征信息，共享嵌入层用于生成第一特征信息对应的第一特征向量和第二特征信息对应的至少一个第二特征向量，并分别对第一特征向量和至少一个第二特征向量进行合并，得到至少一个第三特征向量；场景塔的输入是至少一个第三特征向量，输出是待投放广告在场景塔对应的广告投放场景下的至少一个投放位置上的第二预测点击率。

在一些可实现方式中，第二获取模块730具体用于：根据第一预测点击率确定待投放广告在多个投放位置上的最大预测点击率；将最大预测点击率对应的投放位置确定为待投放广告的预测投放位置。

应理解的是，装置实施例与方法实施例可以相互对应，类似的描述可以参照方法实施例。为避免重复，此处不再赘述。具体地，图7所示的装置700可以执行图5对应的方法实施例，并且装置700中的各个模块的前述和其它操作和/或功能分别为了实现图5中的各个方法中的相应流程，为了简洁，在此不再赘述。

上文中结合附图从功能模块的角度描述了本申请实施例的装置700。应理解，该功能模块可以通过硬件形式实现，也可以通过软件形式的指令实现，还可以通过硬件和软件模块组合实现。具体地，本申请实施例中的方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路和/或软件形式的指令完成，结合本申请实施例公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。可选地，软件模块可以位于随机存储器，闪存、只读存储器、可编程只读存储器、电可擦写可编程存储器、寄存器等本领域的成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法实施例中的步骤。

图8是本申请实施例提供的电子设备800的示意性框图。

如图8所示，该电子设备800可包括：

存储器810和处理器820，该存储器810用于存储计算机程序，并将该程序代码传输给该处理器820。换言之，该处理器820可以从存储器810中调用并运行计算机程序，以实现本申请实施例中的模型训练方法或者广告投放方法。

例如，该处理器820可用于根据该计算机程序中的指令执行上述方法实施例。

在本申请的一些实施例中，该处理器820可以包括但不限于：

通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(FieldProgrammable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等等。

在本申请的一些实施例中，该存储器810包括但不限于：

易失性存储器和/或非易失性存储器。其中，非易失性存储器可以是只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(Static RAM，SRAM)、动态随机存取存储器(Dynamic RAM，DRAM)、同步动态随机存取存储器(Synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(Double DataRate SDRAM，DDR SDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(synch link DRAM，SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM，DR RAM)。

在本申请的一些实施例中，该计算机程序可以被分割成一个或多个模块，该一个或者多个模块被存储在该存储器810中，并由该处理器820执行，以完成本申请提供的方法。该一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述该计算机程序在该电子设备中的执行过程。

如图8所示，该电子设备还可包括：

收发器830，该收发器830可连接至该处理器820或存储器810。

其中，处理器820可以控制该收发器830与其他设备进行通信，具体地，可以向其他设备发送信息或数据，或接收其他设备发送的信息或数据。收发器830可以包括发射机和接收机。收发器830还可以进一步包括天线，天线的数量可以为一个或多个。

应当理解，该电子设备中的各个组件通过总线系统相连，其中，总线系统除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。

本申请还提供了一种计算机存储介质，其上存储有计算机程序，该计算机程序被计算机执行时使得该计算机能够执行上述方法实施例的方法。或者说，本申请实施例还提供一种包含指令的计算机程序产品，该指令被计算机执行时使得计算机执行上述方法实施例的方法。

当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时，全部或部分地产生按照本申请实施例该的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line，DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如，软盘、硬盘、磁带)、光介质(例如数字视频光盘(digital video disc，DVD))、或者半导体介质(例如固态硬盘(solid state disk，SSD))等。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的模块及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，该模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。

作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。例如，在本申请各个实施例中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。

以上该，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以该权利要求的保护范围为准。

Claims

1.一种模型训练方法，其特征在于，包括：

获取第一广告样本，所述第一广告样本包括：已投放广告的第一特征信息和所述已投放广告在多个投放位置上的实际点击率；

将所述第一特征信息输入至第一模型中，得到所述已投放广告在所述多个投放位置上的第一预测点击率；

根据所述第一预测点击率获取所述已投放广告的第二特征信息；

将所述第一特征信息和所述第二特征信息输入至第二模型中，得到所述已投放广告在至少一个投放位置上的第二预测点击率；

根据所述第一预测点击率、所述第二预测点击率和所述实际点击率训练所述第一模型和所述第二模型。

2.根据权利要求1所述的方法，其特征在于，所述根据所述第一预测点击率获取所述已投放广告的第二特征信息，包括：

根据所述第一预测点击率得到所述已投放广告的预测投放位置；

根据所述预测投放位置确定所述已投放广告之前的M个广告和之后的N个广告，M、N均为整数；

获取所述M个广告的标识信息和所述N个广告的标识信息；

其中，所述第二特征信息包括以下至少一项：所述预测投放位置、所述M个广告的标识信息、所述N个广告的标识信息。

3.根据权利要求2所述的方法，其特征在于，所述第二模型包括：共享嵌入层和至少一个场景塔，所述场景塔对应一个广告投放场景，所述广告投放场景包括至少一个投放位置；

所述共享嵌入层是所述至少一个场景塔共享的嵌入层，所述共享嵌入层的输入是所述第一特征信息和所述第二特征信息，所述共享嵌入层用于生成所述第一特征信息对应的第一特征向量和所述第二特征信息对应的至少一个第二特征向量，并分别对所述第一特征向量和所述至少一个第二特征向量进行合并，得到至少一个第三特征向量；

第一场景塔的输入是所述至少一个第三特征向量，输出是所述已投放广告在所述第一场景塔对应的广告投放场景下的至少一个投放位置上的所述第二预测点击率，所述第一场景塔是所述已投放广告的实际投放位置对应的场景塔或者是所述至少一个场景塔中的任一个场景塔。

4.根据权利要求2或3所述的方法，其特征在于，所述根据所述第一预测点击率得到所述已投放广告的预测投放位置，包括：

根据所述第一预测点击率确定所述已投放广告在所述多个投放位置上的最大预测点击率；

将所述最大预测点击率对应的投放位置确定为所述已投放广告的预测投放位置。

5.根据权利要求1-3任一项所述的方法，其特征在于，所述将所述第一特征信息和所述第二特征信息输入至第二模型中，得到所述已投放广告在至少一个投放位置上的第二预测点击率，包括：

将所述第一特征信息和所述第二特征信息输入至所述第二模型中，得到所述已投放广告在实际投放位置上的所述第二预测点击率。

6.根据权利要求1-3任一项所述的方法，其特征在于，所述将所述第一特征信息和所述第二特征信息输入至第二模型中，得到所述已投放广告在至少一个投放位置上的第二预测点击率，包括：

将所述第一特征信息和所述第二特征信息输入至所述第二模型中，得到所述已投放广告在所述多个投放位置上的所述第二预测点击率。

7.根据权利要求1-3任一项所述的方法，其特征在于，所述根据所述第一预测点击率、所述第二预测点击率和所述实际点击率训练所述第一模型和所述第二模型，包括：

根据所述第一预测点击率和所述实际点击率计算所述第一模型的损失；

根据所述第二预测点击率和所述实际点击率计算所述第二模型的损失；

计算所述第一模型的损失和所述第二模型的损失的加权平均值；

根据所述加权平均值训练所述第一模型和所述第二模型。

8.根据权利要求1-3任一项所述的方法，其特征在于，所述将所述第一特征信息和所述第二特征信息输入至第二模型中，得到所述已投放广告在至少一个投放位置上的第二预测点击率之前，还包括：

判断所述已投放广告的实际投放位置所对应的广告投放场景流量是否大于或等于预设流量；

所述将所述第一特征信息和所述第二特征信息输入至第二模型中，得到所述已投放广告在至少一个投放位置上的第二预测点击率，包括：

若所述实际投放位置所对应的广告投放场景流量大于或等于所述预设流量，则将所述第一特征信息和所述第二特征信息输入至第二模型中，得到所述已投放广告在至少一个投放位置上的第二预测点击率。

9.根据权利要求8所述的方法，其特征在于，还包括：

若所述实际投放位置所对应的广告投放场景流量小于所述预设流量，则根据所述第一预测点击率和所述实际点击率训练所述第一模型。

10.一种广告投放方法，其特征在于，包括：

获取待投放广告；

将所述待投放广告的第一特征信息输入至根据权利要求1-9任一项所述的模型训练方法所训练得到第一模型，以得到所述待投放广告在多个投放位置上的第一预测点击率；

根据所述第一预测点击率获取所述待投放广告的第二特征信息；

将所述第一特征信息和所述第二特征信息输入至根据权利要求1-9任一项所述的模型训练方法所训练得到第二模型中，得到所述待投放广告在所述多个投放位置上的第二预测点击率；

根据所述第二预测点击率确定所述待投放广告的投放位置；

在所述投放位置投放所述待投放广告。

11.根据权利要求10所述的方法，其特征在于，所述根据所述第一预测点击率获取所述待投放广告的第二特征信息，包括：

根据所述第一预测点击率得到所述待投放广告的预测投放位置；

根据所述预测投放位置确定所述待投放广告之前的M个广告和之后的N个广告，M、N均为整数；

获取所述M个广告的标识信息和所述N个广告的标识信息；

12.根据权利要求11所述的方法，其特征在于，所述第二模型包括：共享嵌入层和至少一个场景塔，所述场景塔对应一个广告投放场景，所述广告投放场景包括至少一个投放位置；

所述场景塔的输入是所述至少一个第三特征向量，输出是所述待投放广告在所述场景塔对应的广告投放场景下的至少一个投放位置上的所述第二预测点击率。

13.根据权利要求11或12所述的方法，其特征在于，根据所述第一预测点击率得到所述待投放广告的预测投放位置，包括：

根据所述第一预测点击率确定所述待投放广告在所述多个投放位置上的最大预测点击率；

将所述最大预测点击率对应的投放位置确定为所述待投放广告的预测投放位置。

14.一种模型训练装置，其特征在于，包括：

第一获取模块，用于获取第一广告样本，所述第一广告样本包括：已投放广告的第一特征信息和所述已投放广告在多个投放位置上的实际点击率；

第一输入模块，用于将所述第一特征信息输入至第一模型中，得到所述已投放广告在所述多个投放位置上的第一预测点击率；

第二获取模块，用于根据所述第一预测点击率获取所述已投放广告的第二特征信息；

第二输入模块，用于将所述第一特征信息和所述第二特征信息输入至第二模型中，得到所述已投放广告在至少一个投放位置上的第二预测点击率；

第一训练模块，用于根据所述第一预测点击率、所述第二预测点击率和所述实际点击率训练所述第一模型和所述第二模型。

15.一种广告投放装置，其特征在于，包括：

第一获取模块，用于获取待投放广告；

第一输入模块，用于将所述待投放广告的第一特征信息输入至根据权利要求1-9任一项所述的模型训练方法所训练得到第一模型，以得到所述待投放广告在多个投放位置上的第一预测点击率；

第二获取模块，用于根据所述第一预测点击率获取所述待投放广告的第二特征信息；

第二输入模块，用于将所述第一特征信息和所述第二特征信息输入至根据权利要求1-9任一项所述的模型训练方法所训练得到第二模型中，得到所述待投放广告在所述多个投放位置上的第二预测点击率；

确定模块，用于根据所述第二预测点击率确定所述待投放广告的投放位置；

投放模块，用于在所述投放位置投放所述待投放广告。

16.一种电子设备，其特征在于，包括：

处理器和存储器，所述存储器用于存储计算机程序，所述处理器用于调用并运行所述存储器中存储的计算机程序，以执行权利要求1至9中任一项所述的方法。

17.一种电子设备，其特征在于，包括：

处理器和存储器，所述存储器用于存储计算机程序，所述处理器用于调用并运行所述存储器中存储的计算机程序，以执行权利要求10至13中任一项所述的方法。

18.一种计算机可读存储介质，其特征在于，用于存储计算机程序，所述计算机程序使得计算机执行如权利要求1至9中任一项所述的方法。

19.一种计算机可读存储介质，其特征在于，用于存储计算机程序，所述计算机程序使得计算机执行如权利要求10至13中任一项所述的方法。

20.一种计算机程序产品，包括计算机程序/指令，其特征在于，该计算机程序/指令被处理器执行时实现如权利要求1至9任一项所述的方法。

21.一种计算机程序产品，包括计算机程序/指令，其特征在于，该计算机程序/指令被处理器执行时实现如权利要求10至13任一项所述的方法。