CN112446727B

CN112446727B - 广告触发的方法、装置、设备及计算机可读存储介质

Info

Publication number: CN112446727B
Application number: CN201910831950.1A
Authority: CN
Inventors: 魏存超; 刘林; 陈晓冬; 王鲁光; 王高垒; 刘迪; 王正; 黄晨
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2019-09-04
Filing date: 2019-09-04
Publication date: 2023-09-12
Anticipated expiration: 2039-09-04
Also published as: CN112446727A

Abstract

本申请公开了一种广告触发的方法、装置、设备及计算机可读存储介质，涉及互联网技术领域。具体实现方案为：通过双塔模型的广告侧子模型和用户侧子模型分别将待投放广告的特征数据和用户的特征数据映射为相同维度的第一向量和第二向量；根据待投放广告的第一向量和用户的第二向量确定用户的候选投放广告；无需用户搜索词，融合多维度的用户个性化特征数据以及多维度的广告特征数据，能更好地挖掘用户深层次需求，更精准地触发广告投放，在保证CTR的同时提高了广告填充率；另外利用双塔模型的方式对用户侧和广告侧分别建模，实现用户侧和广告侧的分离计算，在同等响应时长下能增加每一侧子模型的神经网络的深度，提高了广告召回准确率。

Description

广告触发的方法、装置、设备及计算机可读存储介质

技术领域

本申请涉及计算机技术领域，尤其涉及互联网技术。

背景技术

传统的广告触发方法都是基于Keyword-Targeting的方式，广告商通过在广告系统为待投放广告购买搜索关键词，广告系统线上通过计算网民搜索词与待投放广告的搜索关键词之间的文本相关性进行广告触发。

目前视频垂类广告流量均来自于视频垂类广告的搜索结果列表页和广告详情页。在用户点击搜索结果列表页中的某一个搜索结果项进入对应详情页时，对于详情页上呈现的其他广告信息，在触发广告投放时，由于不存在用户输入搜索词，通常需要根据该用户历史搜索行为挖掘该用户历史搜索过的搜索词、链接到同一详情页的搜索词等，并对挖掘到的搜索词进行语义扩展得到多个搜索词，根据扩展出的多个搜索词基于Keyword-Targeting的方式进行广告触发。

但是，视频垂类广告与传统广告的业务场景、流量特点、相关性标准等多个方面存储较大差异，根据用户历史搜索行为扩展出的搜索词不能准确表达用户的深层需求，扩展出的搜索词过少会导致广告召回数量、广告填充率低；扩展出的搜索词过多会因中间环节过多计算量大导致广告触发的响应时间过长，广告召回效率低。

发明内容

本申请提供一种广告触发的方法、装置、设备及计算机可读存储介质，用以解决现有技术中进行广告触发时根据用户历史搜索行为扩展出的搜索词不能准确表达用户的深层需求，扩展出的搜索词过少会导致广告召回数量、广告填充率低；扩展出的搜索词过多会因中间环节过多计算量大导致广告触发的响应时间过长，广告召回效率低的问题。

本申请的一个实施例提供一种广告触发的方法，包括：

通过双塔模型的广告侧子模型和用户侧子模型，分别将待投放广告的特征数据和用户的特征数据映射为相同维度的第一向量和第二向量；根据所述待投放广告的第一向量和所述用户的第二向量，确定所述用户的候选投放广告。

可选的，所述通过双塔模型的广告侧子模型和用户侧子模型，分别将待投放广告的特征数据和用户的特征数据映射为相同维度的第一向量和第二向量，包括：

预先通过所述双塔模型的广告侧子模型将所述待投放广告的特征数据映射为第一维度的第一向量，实现双塔模型的用户侧子模型和广告侧子模型进行分离计算，无需在线计算各待投放广告的第一向量，可以直接使用离线计算结果，提高了广告触发的效率，缩短了对用户请求的响应时长。

响应于所述用户的搜索请求，获取所述用户的特征数据；通过所述双塔模型的用户侧子模型，将所述用户的特征数据映射为第一维度的第二向量，实现双塔模型的用户侧子模型和广告侧子模型进行分离计算，在线仅计算用户的第二向量，提高了广告触发的效率，缩短了对用户请求的响应时长。

可选的，所述根据所述待投放广告的第一向量和所述用户的第二向量进行广告触发，确定所述用户的候选投放广告，包括：

根据所述待投放广告的第一向量和所述用户的第二向量，采用近似最近邻搜索算法，确定所述用户的候选投放广告，能够提高广告触发的精准度。

可选的，所述通过双塔模型的广告侧子模型和用户侧子模型，分别将待投放广告的特征数据和用户的特征数据映射为相同维度的第一向量和第二向量之前，还包括：

根据历史搜索请求数据，生成训练集；通过所述训练集对预设模型进行模型训练，得到所述双塔模型，实现预先训练得到双塔模型，无需在线进行模型训练，提高了广告触发的效率。

可选的，所述通过所述训练集对预设模型进行模型训练，得到所述双塔模型，包括：

将所述训练集拆分成多组训练数据，通过所述多组训练数据进行多轮模型训练，其中第i轮模型训练包括独立进行的第一阶段和第二阶段的训练，第i轮模型训练的处理过程如下：

第一阶段：获取最新保存的第一阶段的第一模型参数作为所述预设模型的初始模型参数，通过第i-1组训练数据对所述预设模型的第一模型参数进行训练，保存本轮第一阶段训练后的第一模型参数，所述第一模型参数包括离散输入层参数；第二阶段：获取最新保存的第二阶段的第二模型参数和第一阶段的离散输入层参数作为所述预设模型的初始模型参数，通过第i组训练数据对所述预设模型的第二模型参数进行训练，保存本轮第二阶段训练后的第二模型参数，所述第二模型参数不包括离散输入层参数；其中i为大于等于2的正整数；采用时分复用的数据组织形式以及分阶段训练的方式进行模型训练，有效地防止了大规模离散特征下的过拟合问题。

可选的，所述根据历史搜索请求数据，生成训练集，包括：

根据每一次搜索请求对应的数据生成一条训练数据，得到训练集，所述训练集包括多条训练数据，每条训练数据包括用户的特征数据，广告的特征数据，以及用户是否访问广告的标注信息，以为训练双塔模型提供数据基础。

可选的，所述双塔模型包括广告侧子模型和用户侧子模型，所述广告侧子模型和用户侧子模型结构一致，包括离散输入层、特征学习层、隐藏层和输出层；其中，所述离散输入层用于输入所述用户或广告的特征数据对应的特征向量；所述特征学习层用于将所述离散输入层输出的特征向量进行降维处理，将每一类特征降维成第二维度；所述隐藏层根据所述特征学习层输出的特征向量映射为第一维度的向量；所述输出层用于将所述隐藏层得到的所述第一维度的向量输出，以优化双塔模型的数据存储和计算。

可选的，所述特征学习层还用于：

将每一类特征对应的统计特征数据映射成第三维度的向量，将所述第三维度的向量插入到该类特征对应向量中，得到每一类特征对应的第四维度向量，所述第四维度等于所述第二维度和第三维度之和，以增加双塔模型中对统计特征的感知。

可选的，所述隐藏层还用于：

增加预设的广告排序特征，所述预设的广告排序特征用于表示广告排序在第一位，以防止对广告排序特征的过度建模。

可选的，所述用户的特征数据包括：用户的自然属性特征和用户的行为特征；所述广告的特征数据包括：广告原始标题、封面图、广告对应的搜索关键词、广告创意特征、以及广告客户的行业信息，以丰富用户特征数据和广告特征数据的维度，挖掘用户更深层次的需求。

本申请的另一个实施例提供一种广告触发的装置，包括：

双塔模型处理模块，用于通过双塔模型的广告侧子模型和用户侧子模型，分别将待投放广告的特征数据和用户的特征数据映射为相同维度的第一向量和第二向量；广告触发模块，用于根据所述待投放广告的第一向量和所述用户的第二向量，确定所述用户的候选投放广告。

本申请的另一个实施例提供一种电子设备，包括：

至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述所述的广告触发的方法。

本申请的另一个实施例提供一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行上述所述的广告触发的方法。

本申请的另一实施例提供了一种计算机程序产品，所述计算机程序产品包括：计算机程序，所述计算机程序存储在可读存储介质中，电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序，所述至少一个处理器执行所述计算机程序使得电子设备执行上述所述的广告触发的方法。

上述申请中的一个实施例具有如下优点或有益效果：

通过双塔模型的广告侧子模型和用户侧子模型，分别将待投放广告的特征数据和用户的特征数据映射为相同维度的第一向量和第二向量；根据所述待投放广告的第一向量和所述用户的第二向量，确定所述用户的候选投放广告；无需用户搜索词，通过端到端的广告触发方式，融合多维度的用户个性化特征数据以及多维度的广告特征数据，能够更好地挖掘用户深层次需求，能够更精准地触发广告投放，在保证CTR的同时提高了广告填充率；另外，利用双塔模型的方式对用户侧和广告侧分别建模，能够实现用户侧子模型和广告侧子模型的分离计算，从而可以在同等响应时长下增加每一侧子模型的神经网络的深度，能够提高广告召回的准确率。

上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1是根据本申请第一实施例的广告触发的方法流程图；

图2是根据本申请第一实施例的双塔模型的示意图；

图3是根据本申请第二实施例的广告触发的方法流程图；

图4是根据本申请第二实施例的双塔模型的示意图；

图5是根据本申请第三实施例的广告触发的装置的结构示意图；

图6是根据本申请第四实施例的广告触发的装置的结构示意图；

图7是用来实现本申请实施例的广告触发的方法的电子设备的框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

本申请所涉及的术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。在以下各实施例的描述中，“多个”的含义是两个以上，除非另有明确具体的限定。

本申请具体的应用场景为：基于视频垂类场景的广告触发。传统广告触发都是基于Keyword-Targeting的方式，广告商在广告系统购买搜索关键词，广告系统线上通过计算网民用户搜索词与待投放广告的搜索关键词之间的文本相关性进行广告触发，确定搜索关键词与网民用户搜索词相关度高的广告作为候选投放广告。在广告触发之后，后续对候选投放广告进行排序投放以及计费。在传统的广告系统中，广告触发绝大多数的优化工作集中于用户搜索词与广告搜索关键词的匹配关系，比如用户搜索词意图理解、搜索关键词触发、文本相关性等等。而基于视频垂类的广告多是富媒体广告，在广告的触发逻辑、广告上下文上均与传统广告有显著的区别，传统广告触发的方法在视频垂类场景下不适用。本实施例提供的广告触发方法应用于视频垂类场景，在用户侧和广告侧分别建模，预先建立并训练包括用户侧子模型和广告侧子模型的双塔模型，无需扩展用户搜索词，直接通过双塔模型的用户侧子模型融合用户多维度的特征数据生成用户的第二向量，通过双塔模型的广告侧子模型根据各待投放广告的特征数据生成各待投放广告的第一向量，然后通过计算用户的第二向量与各待投放广告的第一向量直接的相关度来确定用户的候选投放广告，能够融合多维用户特征数据，更好地挖掘用户深层次需求，无需用户搜索词，通过端到端广告触发方式，在保证点击通过率(Click Through Rate，简称CTR)的同时提高了广告填充率；另外，利用双塔模型的方式对用户侧和广告侧分别建模，用户侧和广告侧能够进行分离计算，从而可以在同等响应时长下增加每一侧子模型的神经网络的深度，能够提高广告召回的准确率。

下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图，对本申请的实施例进行描述。

本申请第一实施例提供了一种广告触发的方法。图1是根据本申请第一实施例的广告触发的方法流程图，如图1所示，该方法具体步骤如下：

步骤S101、通过双塔模型的广告侧子模型和用户侧子模型，分别将待投放广告的特征数据和用户的特征数据映射为相同维度的第一向量和第二向量。

其中，双塔模型的结构如图2所示，双塔模型包括广告侧子模型和用户侧子模型。广告侧子模型用于根据输入的广告的特征数据生成广告第一维度的第二向量，用户侧子模型用于根据输入的用户的特征数据生成用户第一维度的第一向量，第一向量和第二向量具有相同维度。第一维度可以由技术人员根据实际应用场景和需要进行设定，例如第一维度可以是32维，本实施例此处不做具体限定。

另外，用户侧子模型和广告侧子模型的结构一致，均可以采用深度神经网络(DeepNeural Networks，简称DNN)模型。双塔模型中用户侧子模型和广告侧子模型可以进行分离计算，以降低模型整体的运算时间，缩短广告触发的平均响应时长。

本实施例中，用户的特征数据包括：用户的自然属性特征和用户的行为特征。其中，用户的自然属性特征可以包括：用户的性别、年龄等信息。用户的行为特征可以包括：用户输入的搜索词(Query)、用户点击过的广告主题列表、用户历史搜索过的搜索词、IP地址、广告排序位置、使用浏览器的类型、浏览行为数据(例如浏览了哪些广告、浏览了哪些搜索结果)、用户浏览过的视频标题等等用户浏览和点击等行为的特征。

另外，可以获取用户侧的特征数据时获取访问量(Page View，简称PV)级的数据，针对用户的每一次访问请求获取历史访问数据，形成对应的用户特征数据。

广告的特征数据包括：广告原始标题、封面图、广告对应的搜索关键词、广告创意特征、以及广告客户的行业信息。

在获取用户侧和广告侧的特征数据时，获取尽可能多维度的、更细粒度的特征数据，以降低用户特征信息的损失，确保模型输入特征数据的准确性。

进一步的，用户的特征数据和广告的特征数据采用离散特征表示，将特征数据中的每一类特征均采用独热编码的方式进行编码，得到对应的特征向量。

步骤S102、据待投放广告的第一向量和用户的第二向量，确定用户的候选投放广告。

通过双塔模型的广告侧子模型和用户侧子模型分别将待投放广告的特征数据和用户的特征数据映射为相同维度的第一向量和第二向量之后，通过计算用户的第二向量与各待投放广告的第一向量之间的相关度，将相关度高的若干待投放广告作为用户的候选投放广告。

在确定用户的候选投放广告之后，就可以对后续投放广告进行排序并投放给用户，以及进行后续广告计费。

本实施例通过双塔模型的广告侧子模型和用户侧子模型，分别将待投放广告的特征数据和用户的特征数据映射为相同维度的第一向量和第二向量；根据待投放广告的第一向量和用户的第二向量，确定用户的候选投放广告；无需用户搜索词，通过端到端的广告触发方式，融合多维度的用户个性化特征数据以及多维度的广告特征数据，能够更好地挖掘用户深层次需求，能够更精准地触发广告投放，在保证CTR的同时提高了广告填充率；另外，利用双塔模型的方式对用户侧和广告侧分别建模，能够实现用户侧子模型和广告侧子模型的分离计算，从而可以在同等响应时长下增加每一侧子模型的神经网络的深度，能够提高广告召回的准确率。

图3是根据本申请第二实施例的广告触发的方法流程图。在本申请第一实施例的基础上，本申请的第二实施例中，预先训练双塔模型，并预先通过双塔模型的广告侧子模型将待投放广告的特征数据映射为第一维度的第一向量；响应于用户的搜索请求，获取用户的特征数据；通过双塔模型的用户侧子模型，将用户的特征数据映射为第一维度的第二向量。如图3所示，该方法具体步骤如下：

步骤S201、根据历史搜索请求数据，生成训练集。

本实施例中，首先获取预设时间段内的历史搜索请求数据，历史搜索请求数据包括在预设时间段内每一次用户的搜索请求对应的历史数据，包括用户的特征数据，以及为用户投放的广告的特征数据。其中，预设时间段可以由技术人员根据实际应用场景和经验进行设定，例如，预设时间段可以是最近2个月等，本实施例此处不做具体限定。

用户的特征数据包括：用户的自然属性特征和用户的行为特征。其中，用户的自然属性特征可以包括：用户的性别、年龄等信息。用户的行为特征可以包括：用户输入的搜索词(Query)、用户点击过的广告主题列表、用户历史搜索过的搜索词、IP地址、广告排序位置、使用浏览器的类型、浏览行为数据(例如浏览了哪些广告、浏览了哪些搜索结果)、用户浏览过的视频标题等等用户浏览和点击等行为的特征。

具体的，根据每一次搜索请求对应的数据生成一条训练数据，得到训练集。训练集包括多条训练数据，每条训练数据包括用户的特征数据，广告的特征数据，以及用户是否访问广告的标注信息。

本实施例中，用户的特征数据和广告的特征数据采用离散特征表示，将特征数据中的每一类特征均采用独热编码的方式进行编码，得到对应的特征向量。

步骤S202、通过训练集对预设模型进行模型训练，得到双塔模型。

本实施例中，双塔模型的结构如图2所示，双塔模型包括广告侧子模型和用户侧子模型，广告侧子模型和用户侧子模型结构一致。双塔模型中用户侧子模型和广告侧子模型可以进行分离计算，以降低模型整体的运算时间，缩短广告触发的平均响应时长。

其中广告侧子模型用于根据输入的广告的特征数据生成广告第一维度的第二向量，用户侧子模型用于根据输入的用户的特征数据生成用户第一维度的第一向量，第一向量和第二向量具有相同维度。第一维度可以由技术人员根据实际应用场景和需要进行设定，例如第一维度可以是32维(如图4中所示)，本实施例此处不做具体限定。

示例性的，广告侧子模型和用户侧子模型均可以采用DNN模型，如图4所示，广告侧和用户侧的DNN模型可以包括离散输入层、特征学习层、隐藏层和输出层。

其中，离散输入层用于输入用户或广告的特征数据对应的特征向量。如图4所示，图4中以特征m、特征n、特征k为例，示意出离散输入层中包括多维的特征数据。

特征学习层用于将离散输入层输出的特征向量进行降维处理，将每一类特征降维成第二维度，以防止因特征数据维度太大导致模型参数空间过大的问题。其中，第二维度可以为9，第二维度可以由技术人员根据实际应用场景和经验进行设定，本实施例此处不做具体限定。

隐藏层根据特征学习层输出的特征向量映射为第一维度的向量。

输出层用于将隐藏层得到的第一维度的向量输出。

进一步的，为了让模型及时感知特征对点击率影响，在特征学习层针对每一类特征增加统计特征数据的输入。其中，统计特征数据可以包括：在历史请求数据中特征出现的次数，特征出现时广告被点击的次数，点击率等。特征学习层还用于：

将每一类特征对应的统计特征数据映射成第三维度的向量，将第三维度的向量插入到该类特征对应向量中，得到每一类特征对应的第四维度向量，第四维度等于第二维度和第三维度之和。

其中第三维度可以由技术人员根据实际应用场景和经验进行设定，本实施例此处不做具体限定。例如，第三维度可以为2，特征学习层将离散输入层输出的特征向量进行降维处理，将每一类特征降维成9维，也就是每一类特征用9维向量表示，然后将每一类特征的统计特征数据映射成2维向量，并插入每一类特征对应向量中，得到每一类特征对应的11维向量。假设共有64类特征，那么特征学习层输出的向量为64×11维的向量，也就是704维的向量。

可选的，对于每一类特征，可以采用分解矩阵的方法来进行模型的优化，以优化数据的存储和计算，具体的可以采用现有技术中任意一种采用分解矩阵的方法进行模型数据存储和计算的优化的方式实现，本实施例此处不再赘述。

可选的，为了控制模型规模，对每一类特征采用动态的长度，将每一类特征降维成第二维度之后，对于某些低频特征，可以进一步降维为更低维度。例如，将某一类特征降维成9维之后，进一步压缩为1维，其余8维强制为0，仅存储不为0的一维数据，其余8维为0的数据不予存储。

进一步的，为了能够实现双塔模型的广告侧子模型的离线处理，以降低线上平均响应时长，达到模型复杂度和精度的平衡，由于无法预先获知待投放广告在投放时的排序位置，不同的广告排序位置对用户选择查看广告的行为影响很大，而在离散输入层输入的特征数据中包括广告历史排序位置特征。本实施例中，隐藏层还用于：增加预设的广告排序特征，预设的广告排序特征用于表示广告排序在第一位。通过在双塔模型的用户侧子模型和广告侧子模型的隐藏层增加预设的广告排序特征的输入节点(如图2所示的排序位置节点)，并设定每个广告在投放时的排序位置为排序在第一位，从而防止过度建模。

该步骤中，通过训练集对预设模型进行模型训练得到双塔模型，具体可以采用如下方式实现：

将训练集拆分成多组训练数据，通过多组训练数据进行多轮模型训练，其中第i轮模型训练包括独立进行的第一阶段和第二阶段的训练，i为大于等于2的正整数。

优选地，可以根据训练数据的产生时间，将训练集拆分成多组训练数据。例如，训练集中包括最近2个月的训练数据，可以按照训练数据的产生时间，按天进行拆分，将每一天内的训练数据作为一组训练数据。

另外，还可以根据其他方式对训练数据进行拆分，本实施例此处不做具体限定。

具体的，第i轮模型训练的处理过程如下两个阶段：

第一阶段：获取最新保存的第一阶段的第一模型参数，作为预设模型的初始模型参数，通过第i-1组训练数据对预设模型的第一模型参数进行训练，保存本轮第一阶段训练后的第一模型参数，第一模型参数包括离散输入层参数。

其中第一模型参数包括双塔模型的所有模型参数。在进行第一阶段的训练时，对包括离散输入层参数在内的所有模型参数进行训练，训练结束后，将本轮第一阶段训练得到的所有模型参数保存为最新的第一模型参数。

可选的，在完成第一阶段的训练之后，还可以将本轮第一阶段训练得到的离散输入层参数单独保存为最新的离散输入层参数。

第二阶段：获取最新保存的第二阶段的第二模型参数和第一阶段的离散输入层参数，作为预设模型的初始模型参数，通过第i组训练数据对预设模型的第二模型参数进行训练，保存本轮第二阶段训练后的第二模型参数，第二模型参数不包括离散输入层参数。

其中第二模型参数包括双塔模型的除离散输入层参数之外的所有模型参数。在进行第二阶段的训练时，固定离散输入层参数不变，只对除离散输入层参数之外的其他模型参数进行训练，训练结束后，将本轮第二阶段训练得到的第二模型参数保存为最新的第二模型参数。

另外，对于第1轮模型训练，只进行第二阶段的训练：获取预设的第二模型参数和离散输入层参数作为预设模型的初始模型参数，通过第1组训练数据对预设模型的第二模型参数进行训练，保存本轮第二阶段训练后的第二模型参数。

本实施例中，将训练集拆分成多组训练数据，通过多组训练数据进行上述多轮模型训练，每一组训练数据在先后参与两轮中的两个不同阶段的训练之后，便不再参与训练，采用时分复用的数据组织形式以及分阶段训练的方式进行模型训练，有效地防止了大规模离散特征下的过拟合问题。例如，可以将训练集按照训练数据的产生时间拆分为多组训练数据，用每组训练数据中产生时间的起始时刻标识该组数据，可以将拆分成的多组训练数据表示为：T+0时刻，T+1时刻，T+2时刻，……。首先第1轮模型训练，只进行第二阶段的训练：获取预设的第二模型参数和离散输入层参数作为预设模型的初始模型参数，通过T+0时刻的训练数据对预设模型的第二模型参数进行训练，并将本轮第二阶段训练后的第二模型参数保存为最新的第二模型参数。第2轮模型训练，同时进行第一阶段和第二阶段的模型训练：第一阶段，获取预设第一模型参数作为预设模型的初始模型参数，通过T+0时刻的训练数据对预设模型的第一模型参数进行训练，并将本轮第一阶段训练后的第一模型参数保存为最新的第一模型参数；第二阶段，获取最新保存的第二阶段的第二模型参数和最新保存的第一阶段的离散输入层参数，作为预设模型的初始模型参数，通过第T+1时刻的训练数据对预设模型的第二模型参数进行训练，保存本轮第二阶段训练后的第二模型参数，第二模型参数不包括离散输入层参数。后续每一轮的模型训练与第2轮的模型训练过程类似，此次不再赘述。

步骤S203、预先通过双塔模型的广告侧子模型将待投放广告的特征数据映射为第一维度的第一向量。

在训练得到双塔模型之后，可以通过双塔模型的用户侧子模型和广告侧子模型进行分离计算。

具体的，预先通过双塔模型的广告侧子模型，将所有的待投放广告的特征数据映射为第一维度的第一向量，这样，后续在接收到用户的搜索请求，进行广告触发的过程中，无需在线计算各待投放广告的第一向量，可以直接使用离线计算结果，可以提高广告触发的效率，缩短对用户请求的响应时长。

可选的，预先通过双塔模型的广告侧子模型将待投放广告的特征数据映射为第一维度的第一向量可以离线地完成。

其中，广告的特征数据包括：广告原始标题、封面图、广告对应的搜索关键词、广告创意特征、以及广告客户的行业信息。

步骤S204、响应于用户的搜索请求，获取用户的特征数据。

其中，用户的搜索请求可以包括用户输入搜索词，用于请求与搜索词相关的搜索结果列表页；或者，用户的搜索请求还可以不包括用户输入的搜索词，例如用户点击搜索结果列表页中的某一搜索结果项请求进入详情页。

在接收到用户的搜索请求之后，获取该用户的特征数据。用户的特征数据包括：用户的自然属性特征和用户的行为特征。其中，用户的自然属性特征可以包括：用户的性别、年龄等信息。用户的行为特征可以包括：用户输入的搜索词(Query)、用户点击过的广告主题列表、用户历史搜索过的搜索词、IP地址、广告排序位置、使用浏览器的类型、浏览行为数据(例如浏览了哪些广告、浏览了哪些搜索结果)、用户浏览过的视频标题等等用户浏览和点击等行为的特征。

步骤S205、通过双塔模型的用户侧子模型，将用户的特征数据映射为第一维度的第二向量。

本实施例中，用户的特征数据可以采用离散特征表示，将特征数据中的每一类特征均采用独热编码的方式进行编码，得到对应用户特征向量。

将用户特征向量通过离散输入层输入双塔模型的用户侧子模型，通过用户侧子模型将用户的特征数据映射为第一维度的第二向量，并将用户的第二向量通过输出层输出。

步骤S206、根据待投放广告的第一向量和用户的第二向量，采用近似最近邻搜索算法，确定用户的候选投放广告。

本实施例中，根据待投放广告的第一向量和用户的第二向量，采用近似最近邻搜索(Approximate Nearest Neighbor，简称Ann)算法计算用户的第二向量与各待投放广告的第一向量之间的相关度，将相关度高的若干待投放广告作为用户的候选投放广告，完成广告触发。

本实施例通过预先训练得到双塔模型，通过双塔模型的用户侧子模型和广告侧子模型进行分离计算，预先通过双塔模型的广告侧子模型将待投放广告的特征数据映射为第一维度的第一向量，后续在接收到用户的搜索请求，进行广告触发的过程中，无需在线计算各待投放广告的第一向量，可以直接使用离线计算结果，提高了广告触发的效率，缩短了对用户请求的响应时长；进一步的，响应于用户的搜索请求，获取用户的特征数据，通过双塔模型的用户侧子模型，将用户的特征数据映射为第一维度的第二向量，根据待投放广告的第一向量和用户的第二向量，采用近似最近邻搜索算法，确定用户的候选投放广告，无需用户搜索词，通过端到端的广告触发方式，融合多维度的用户个性化特征数据以及多维度的广告特征数据，能够更好地挖掘用户深层次需求，能够更精准地触发广告投放，在保证CTR的同时提高了广告填充率；另外，利用双塔模型的方式对用户侧和广告侧分别建模，能够实现用户侧子模型和广告侧子模型的分离计算，从而可以在同等响应时长下增加每一侧子模型的神经网络的深度，能够提高广告召回的准确率。

本申请第三实施例提供了一种广告触发的装置。图5是根据本申请第三实施例的广告触发的装置的结构示意图。如图5所示，该广告触发的装置30包括：双塔模型处理模块301和广告触发模块302。

双塔模型处理模块301用于通过双塔模型的广告侧子模型和用户侧子模型，分别将待投放广告的特征数据和用户的特征数据映射为相同维度的第一向量和第二向量。

广告触发模块302用于根据待投放广告的第一向量和用户的第二向量，确定用户的候选投放广告。

其中，用户的特征数据包括：用户的自然属性特征和用户的行为特征数据；

本申请实施例提供的装置可以具体用于执行上述第一实施例所提供的方法实施例，具体功能此处不再赘述。

本申请第四实施例提供了一种广告触发的装置。图6是根据本申请第四实施例的广告触发的装置的结构示意图。在上述第三实施例的基础上，本实施例中，双塔模型处理模块还用于：

预先通过双塔模型的广告侧子模型将待投放广告的特征数据映射为第一维度的第一向量。

可选的，双塔模型处理模块还用于：

响应于用户的搜索请求，获取用户的特征数据；通过双塔模型的用户侧子模型，将用户的特征数据映射为第一维度的第二向量。

可选的，广告触发模块还用于：

根据待投放广告的第一向量和用户的第二向量，采用近似最近邻搜索算法，确定用户的候选投放广告。

可选的，如图6所示，该广告触发的装置30还包括：模型训练模块303。模型训练模块303用于：

根据历史搜索请求数据，生成训练集；通过训练集对预设模型进行模型训练，得到双塔模型。

可选的，模型训练模块303具体还用于：

将训练集拆分成多组训练数据，通过多组训练数据进行多轮模型训练，其中第i轮模型训练包括独立进行的第一阶段和第二阶段的训练，第i轮模型训练的处理过程如下：

第一阶段：获取最新保存的第一阶段的第一模型参数作为预设模型的初始模型参数，通过第i-1组训练数据对预设模型的第一模型参数进行训练，保存本轮第一阶段训练后的第一模型参数，第一模型参数包括离散输入层参数；第二阶段：获取最新保存的第二阶段的第二模型参数和第一阶段的离散输入层参数作为预设模型的初始模型参数，通过第i组训练数据对预设模型的第二模型参数进行训练，保存本轮第二阶段训练后的第二模型参数，第二模型参数不包括离散输入层参数；其中i为大于等于2的正整数。

可选的，模型训练模块303具体还用于：

根据每一次搜索请求对应的数据生成一条训练数据，得到训练集，训练集包括多条训练数据，每条训练数据包括用户的特征数据，广告的特征数据，以及用户是否访问广告的标注信息。

可选的，双塔模型包括广告侧子模型和用户侧子模型，广告侧子模型和用户侧子模型结构一致，包括离散输入层、特征学习层、隐藏层和输出层。

其中，离散输入层用于输入用户或广告的特征数据对应的特征向量；特征学习层用于将离散输入层输出的特征向量进行降维处理，将每一类特征降维成第二维度；隐藏层根据特征学习层输出的特征向量映射为第一维度的向量；输出层用于将隐藏层得到的第一维度的向量输出。

可选的，特征学习层还用于：

可选的，隐藏层还用于：

增加预设的广告排序特征，预设的广告排序特征用于表示广告排序在第一位。

本实施例提供的装置可以具体用于执行上述第二实施例所提供的方法实施例，具体功能此处不再赘述。

根据本申请的实施例，本申请还提供了一种电子设备和一种可读存储介质。

根据本申请的实施例，本申请还提供了一种计算机程序产品，计算机程序产品包括：计算机程序，计算机程序存储在可读存储介质中，电子设备的至少一个处理器可以从可读存储介质读取计算机程序，至少一个处理器执行计算机程序使得电子设备执行上述任一实施例提供的方案。

如图7所示，是根据本申请实施例的广告触发的方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图7所示，该电子设备包括：一个或多个处理器Y01、存储器Y02，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图7中以一个处理器Y01为例。

存储器Y02即为本申请所提供的非瞬时计算机可读存储介质。其中，存储器存储有可由至少一个处理器执行的指令，以使至少一个处理器执行本申请所提供的广告触发的方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本申请所提供的广告触发的方法。

存储器Y02作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本申请实施例中的广告触发的方法对应的程序指令/模块(例如，附图5所示的双塔模型处理模块301和广告触发模块302)。处理器Y01通过运行存储在存储器Y02中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的广告触发的方法。

存储器Y02可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据广告触发的电子设备的使用所创建的数据等。此外，存储器Y02可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器Y02可选包括相对于处理器Y01远程设置的存储器，这些远程存储器可以通过网络连接至广告触发的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

广告触发的方法的电子设备还可以包括：输入装置Y03和输出装置Y04。处理器Y01、存储器Y02、输入装置Y03和输出装置Y04可以通过总线或者其他方式连接，图7中以通过总线连接为例。

输入装置Y03可接收输入的数字或字符信息，以及产生与广告触发的电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置Y04可以包括显示设备、辅助照明装置(例如，LED)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

根据本申请实施例的技术方案，通过双塔模型的广告侧子模型和用户侧子模型，分别将待投放广告的特征数据和用户的特征数据映射为相同维度的第一向量和第二向量；根据待投放广告的第一向量和用户的第二向量，确定用户的候选投放广告；无需用户搜索词，通过端到端的广告触发方式，融合多维度的用户个性化特征数据以及多维度的广告特征数据，能够更好地挖掘用户深层次需求，能够更精准地触发广告投放，在保证CTR的同时提高了广告填充率；另外，利用双塔模型的方式对用户侧和广告侧分别建模，能够实现用户侧子模型和广告侧子模型的分离计算，从而可以在同等响应时长下增加每一侧子模型的神经网络的深度，能够提高广告召回的准确率。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

Claims

1.一种广告触发的方法，其特征在于，包括：

通过双塔模型的广告侧子模型和用户侧子模型，分别将待投放广告的特征数据和用户的特征数据映射为相同维度的第一向量和第二向量；

根据所述待投放广告的第一向量和所述用户的第二向量，确定所述用户的候选投放广告；

所述双塔模型包括广告侧子模型和用户侧子模型，所述广告侧子模型和用户侧子模型结构一致，包括离散输入层、特征学习层、隐藏层和输出层；

其中，所述离散输入层用于输入所述用户或广告的特征数据对应的特征向量；

所述特征学习层用于将所述离散输入层输出的特征向量进行降维处理，将每一类特征降维成第二维度；

所述隐藏层根据所述特征学习层输出的特征向量映射为第一维度的向量；

所述输出层用于将所述隐藏层得到的所述第一维度的向量输出；

所述特征学习层还用于：

将每一类特征对应的统计特征数据映射成第三维度的向量，将所述第三维度的向量插入到该类特征对应向量中，得到每一类特征对应的第四维度向量，所述第四维度等于所述第二维度和第三维度之和；

所述隐藏层还用于：

增加预设的广告排序特征，所述预设的广告排序特征用于表示广告排序在第一位；

所述用户的特征数据包括：用户的自然属性特征和用户的行为特征。

2.根据权利要求1所述的方法，其特征在于，所述通过双塔模型的广告侧子模型和用户侧子模型，分别将待投放广告的特征数据和用户的特征数据映射为相同维度的第一向量和第二向量，包括：

预先通过所述双塔模型的广告侧子模型将所述待投放广告的特征数据映射为第一维度的第一向量。

3.根据权利要求1或2所述的方法，其特征在于，所述通过双塔模型的广告侧子模型和用户侧子模型，分别将待投放广告的特征数据和用户的特征数据映射为相同维度的第一向量和第二向量，包括：

响应于所述用户的搜索请求，获取所述用户的特征数据；

通过所述双塔模型的用户侧子模型，将所述用户的特征数据映射为第一维度的第二向量。

4.根据权利要求1所述的方法，其特征在于，所述根据所述待投放广告的第一向量和所述用户的第二向量进行广告触发，确定所述用户的候选投放广告，包括：

根据所述待投放广告的第一向量和所述用户的第二向量，采用近似最近邻搜索算法，确定所述用户的候选投放广告。

5.根据权利要求1所述的方法，其特征在于，所述通过双塔模型的广告侧子模型和用户侧子模型，分别将待投放广告的特征数据和用户的特征数据映射为相同维度的第一向量和第二向量之前，还包括：

根据历史搜索请求数据，生成训练集；

通过所述训练集对预设模型进行模型训练，得到所述双塔模型。

6.根据权利要求5所述的方法，其特征在于，所述通过所述训练集对预设模型进行模型训练，得到所述双塔模型，包括：

第一阶段：获取最新保存的第一阶段的第一模型参数作为所述预设模型的初始模型参数，通过第i-1组训练数据对所述预设模型的第一模型参数进行训练，保存本轮第一阶段训练后的第一模型参数，所述第一模型参数包括离散输入层参数；

第二阶段：获取最新保存的第二阶段的第二模型参数和第一阶段的离散输入层参数作为所述预设模型的初始模型参数，通过第i组训练数据对所述预设模型的第二模型参数进行训练，保存本轮第二阶段训练后的第二模型参数，所述第二模型参数不包括离散输入层参数；

其中i为大于等于2的正整数。

7.根据权利要求5所述的方法，其特征在于，所述根据历史搜索请求数据，生成训练集，包括：

根据每一次搜索请求对应的数据生成一条训练数据，得到训练集，所述训练集包括多条训练数据，每条训练数据包括用户的特征数据，广告的特征数据，以及用户是否访问广告的标注信息。

8.根据权利要求1所述的方法，其特征在于，所述广告的特征数据包括：广告原始标题、封面图、广告对应的搜索关键词、广告创意特征、以及广告客户的行业信息。

9. 一种广告触发的装置，其特征在于，包括：

双塔模型处理模块，用于通过双塔模型的广告侧子模型和用户侧子模型，分别将待投放广告的特征数据和用户的特征数据映射为相同维度的第一向量和第二向量；所述双塔模型包括广告侧子模型和用户侧子模型，所述广告侧子模型和用户侧子模型结构一致，包括离散输入层、特征学习层、隐藏层和输出层；其中，所述离散输入层用于输入所述用户或广告的特征数据对应的特征向量；所述特征学习层用于将所述离散输入层输出的特征向量进行降维处理，将每一类特征降维成第二维度；所述隐藏层根据所述特征学习层输出的特征向量映射为第一维度的向量；所述输出层用于将所述隐藏层得到的所述第一维度的向量输出；所述特征学习层还用于：将每一类特征对应的统计特征数据映射成第三维度的向量，将所述第三维度的向量插入到该类特征对应向量中，得到每一类特征对应的第四维度向量，所述第四维度等于所述第二维度和第三维度之和；所述隐藏层还用于：增加预设的广告排序特征，所述预设的广告排序特征用于表示广告排序在第一位；所述用户的特征数据包括：用户的自然属性特征和用户的行为特征

广告触发模块，用于根据所述待投放广告的第一向量和所述用户的第二向量，确定所述用户的候选投放广告。

10. 一种电子设备，其特征在于，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-8中任一项所述的方法。

11.一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行权利要求1-8中任一项所述的方法。