CN112200602A

CN112200602A - 用于广告推荐的神经网络模型训练方法及装置

Info

Publication number: CN112200602A
Application number: CN202010996587.1A
Authority: CN
Inventors: 刘旭东; 李中英; 张梦馨; 梅晓茸
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2020-09-21
Filing date: 2020-09-21
Publication date: 2021-01-08
Anticipated expiration: 2040-09-21
Also published as: CN112200602B

Abstract

本公开提供用于广告推荐的神经网络模型训练方法及装置。该方法包括：从广告推荐系统中获取指定数量的样本对象的广告推荐结果，所述广告推荐结果中包括为所述样本对象选择的多个待推荐广告、以及各个待推荐广告的广告推荐值；针对每个样本对象，基于所述样本对象的广告推荐结果筛选出满足指定条件的广告推荐值，其中，所述指定条件为最大值、最小值和平均值中的一种；基于各个样本对象的广告推荐值以及各个样本对象的指定相关数据构造训练样本；基于构造的所述训练样本训练神经网络模型，以使所述神经网络模型输出分类结果，所述分类结果用于指示是否向输入的样本对象进行广告推荐。由此减轻了广告推荐系统的计算压力。

Description

用于广告推荐的神经网络模型训练方法及装置

技术领域

本发明涉及信息处理技术领域，特别涉及一种用于广告推荐的神经网络模型训练方法及装置。

背景技术

随着互联网技术正在飞速发展。互联网广告作为互联网的主要盈利模式，是一个复杂并具有巨大商业价值的系统。以信息流广告为例，当获取一个目标对象的页面请求后，整个广告推荐系统要迅速做出响应，给该目标对象展示最合适的广告。

然而随着目标对象的不断增大，需要有很多资源来维护这个庞大的广告推荐系统。另一方面互联网广告不是每一个目标对象都适合投放广告，有的人天生对广告有很大的抵触情绪，有的用户由于自然作品等原因，也不适合出广告。

现有技术中，通过预设规则来判断是否需要向目标对象推送广告，例如，预设规则中规定某个时间段不进行推荐广告，则在该时间段内则不向目标对象推送广告。但是没有一个完全合适的时间段不进行推荐广告，总有一些广告是适合在某个时间段推荐的。因此，急需一种新的方法来减轻广告推荐系统的计算压力。

发明内容

本公开提供一种用于广告推荐的神经网络模型训练方法及装置，用于减轻广告推荐系统的计算压力。

第一方面，本公开提供一种用于广告推荐的神经网络模型训练方法，所述方法包括：

从广告推荐系统中获取指定数量的样本对象的广告推荐结果，所述广告推荐结果中包括为所述样本对象选择的多个待推荐广告、以及各个待推荐广告的广告推荐值；

针对每个样本对象，基于所述样本对象的广告推荐结果筛选出满足指定条件的广告推荐值，其中，所述指定条件为最大值、最小值和平均值中的一种；

基于各个样本对象的广告推荐值以及各个样本对象的指定相关数据构造训练样本；所述指定相关数据包括用户画像特征、当前访问操作的访问场景特征；

基于构造的所述训练样本训练神经网络模型，以使所述神经网络模型输出分类结果，所述分类结果用于指示是否向输入的样本对象进行广告推荐。

在一个实施例中，所述基于各个样本对象的广告推荐值以及各个样本对象的所述指定相关数据构造训练样本，包括：

对各样本对象，将所述样本对象的广告推荐值和推荐门限进行比较；

若所述样本对象的广告推荐值大于所述推荐门限，则将所述样本对象的样本类别标记为正样本；

若所述样本对象的广告推荐值小于或等于所述推荐门限，则将所述样本对象的样本类别标记为负样本；

采用所述样本对象的所述指定相关数据以及所述样本对象样本类别构成与所述样本对象对应的训练样本；

所述基于构造的所述训练样本训练神经网络模型，包括：

训练所述神经网络模型对各个样本对象的所述指定相关数据进行分类识别，以使所述神经网络模型学习各个样本对象的所述指定相关数据对应的类别。

对各样本对象，采用所述样本对象的广告推荐值作为所述样本对象的所述指定相关数据的标签得到与所述样本对象对应的训练样本；

所述基于构造的所述训练样本训练神经网络模型，包括：

训练所述神经网络模型提取各个样本对象的特征表达，并对所述特征表达进行评分；

确定各训练样本的评分与相应的训练样本的广告推荐值之间的差距作为损失值；

基于所损失值训练所述神经网络模型以使所述神经网络模型将评分大于所述推荐门限的训练样本分类到需要推荐广告的类别，将评分小于或等于所述推荐门限的训练样本分类到不需要推荐广告的类别。

在一个实施例中，所述指定相关数据包括用户画像特征和当前访问操作的访问场景特征；其中，

所述用户画像特征包括用户标识、用户年龄和用户性别中的至少一个；

所述当前访问操作的访问场景特征包括当前场景特征和上下文特征；其中，所述当前场景特征包括所述页面获取请求的请求时间和采用的设备参数中的至少一种；

所述上下文特征包括广告浏览记录和多媒体资源的类别信息中的至少一种。

第二方面，本公开提供一种广告推荐方法，所述方法包括：

获取目标对象的指定相关数据，所述指定相关数据为所述目标对象的指定维度的特征信息；所述指定相关数据包括用户画像特征、当前访问操作的访问场景特征；

将所述指定相关数据输入至预先训练的神经网络模型，得到所述目标对象的分类结果；

若所述目标对象的分类结果为需要推荐广告的类别，则将所述目标对象输入广告推荐系统中进行广告推荐。

在一个实施例中，训练所述神经网络模型，包括：

从所述广告推荐系统中获取指定数量的样本对象的广告推荐结果，所述广告推荐结果中包括为所述样本对象选择的多个待推荐广告、以及各个待推荐广告的广告推荐值；

基于各个样本对象的广告推荐值以及各个样本对象的所述指定相关数据构造训练样本；

基于构造的所述训练样本训练所述神经网络模型。

基于构造的所述训练样本训练所述神经网络模型，包括：

所述基于构造的所述训练样本训练所述神经网络模型，包括：

在一个实施例中，获取目标对象的指定相关数据之前，所述方法还包括：

接收所述目标对象的页面获取请求；

获取所述页面获取请求针对的多媒体资源的广告参数；

若基于所述广告参数和预设的广告推荐规则确定所述目标对象为待推荐对象，则执行所述获取目标对象的指定相关数据的步骤。

第三方面，本公开提供一种用于广告推荐的神经网络模型训练装置，所述装置包括：

第一广告推荐结果获取模块，被配置为执行从广告推荐系统中获取指定数量的样本对象的广告推荐结果，所述广告推荐结果中包括为所述样本对象选择的多个待推荐广告、以及各个待推荐广告的广告推荐值；

第一广告推荐值确定模块，被配置为执行针对每个样本对象，基于所述样本对象的广告推荐结果筛选出满足指定条件的广告推荐值，其中，所述指定条件为最大值、最小值和平均值中的一种；

第一训练样本构造模块，被配置为执行基于各个样本对象的广告推荐值以及各个样本对象的指定相关数据构造训练样本；所述指定相关数据包括用户画像特征、当前访问操作的访问场景特征；

第一神经网络模型训练模块，被配置为执行基于构造的所述训练样本训练神经网络模型，以使所述神经网络模型输出分类结果，所述分类结果用于指示是否向输入的样本对象进行广告推荐。

在一个实施例中，所述第一训练样本构造模块，具体被配置为执行：

所述第一神经网络模型训练模块，具体被配置为执行：

第四方面，本公开提供一种广告推荐装置，所述装置包括：

获取模块，被配置为执行获取目标对象的指定相关数据，所述指定相关数据为所述目标对象的指定维度的特征信息；所述指定相关数据包括用户画像特征、当前访问操作的访问场景特征；

分类结果确定模块，被配置为执行将所述指定相关数据输入至预先训练的神经网络模型，得到所述目标对象的分类结果；

广告推荐模块，被配置为执行若所述目标对象的分类结果为需要推荐广告的类别，则将所述目标对象输入广告推荐系统中进行广告推荐。

在一个实施例中，所述装置还包括：

第二广告推荐结果获取模块，被配置为执行从所述广告推荐系统中获取指定数量的样本对象的广告推荐结果，所述广告推荐结果中包括为所述样本对象选择的多个待推荐广告、以及各个待推荐广告的广告推荐值；

第二广告推荐值确定模块，被配置为执行针对每个样本对象，基于所述样本对象的广告推荐结果筛选出满足指定条件的广告推荐值，其中，所述指定条件为最大值、最小值和平均值中的一种；

第二训练样本构造模块，被配置为执行基于各个样本对象的广告推荐值以及各个样本对象的所述指定相关数据构造训练样本；

第二神经网络模型训练模块，被配置为执行基于构造的所述训练样本训练所述神经网络模型。

在一个实施例中，所述第二训练样本构造模块，具体被配置为执行：

所述第二神经网络模型训练模块，具体被配置为执行：

在一个实施例中，所述装置还包括：

接收模块，被配置为执行获取目标对象的指定相关数据之前，接收所述目标对象的页面获取请求；

广告参数获取模块，被配置为执行获取所述页面获取请求针对的多媒体资源的广告参数；

待推荐对象确定模块，被配置为执行基于所述广告参数和预设的广告推荐规则确定所述目标对象为待推荐对象，则执行所述获取目标对象的指定相关数据的步骤。

根据本公开实施例的第五方面，提供一种电子设备，包括：

至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令；所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如第一方面和/或第二方面所述的方法。

根据本公开实施例提供的第六方面，提供一种计算机存储介质，所述计算机存储介质存储有计算机程序，所述计算机程序用于执行如第一方面和/或第二方面所述的方法。

本公开的实施例提供的技术方案至少带来以下有益效果：

本公开提供一种用于广告推荐的神经网络模型训练方法及装置。该方法包括：从广告推荐系统中获取指定数量的样本对象的广告推荐结果，所述广告推荐结果中包括为所述样本对象选择的多个待推荐广告、以及各个待推荐广告的广告推荐值；针对每个样本对象，基于所述样本对象的广告推荐结果筛选出满足指定条件的广告推荐值，其中，所述指定条件为最大值、最小值和平均值中的一种；基于各个样本对象的广告推荐值以及各个样本对象的指定相关数据构造训练样本；所述指定相关数据包括用户画像特征、当前访问操作的访问场景特征；基于构造的所述训练样本训练神经网络模型，以使所述神经网络模型输出分类结果，所述分类结果用于指示是否向输入的样本对象进行广告推荐。故此，从广告推荐系统中获取各待推荐广告以及对应的广告推荐值来对神经网络模型进行训练，相当于复用了广告推荐系统中的广告推荐值。并基于广告推荐系统的广告推荐值完成通过神经网络对各目标对象的推荐价值的粗判定，实现了基于广告推荐系统中关键信息对目标对象进行筛选，故此，神经网络模型筛选出的目标对象与广告推荐系统所需的目标对象从一定程度上保持一致。由此广告推荐系统尽可能处理真正需要处理的目标对象，以减轻了广告推荐系统的计算压力。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1为根据本公开一个实施例的用于广告推荐的神经网络模型训练方法的适用场景示意图；

图2为根据本公开一个实施例的用于广告推荐的神经网络模型训练方法的流程示意图；

图3为根据本公开一个实施例的用于广告推荐的神经网络模型训练方法中的网络模型示意图；

图4为根据本公开一个实施例的广告推荐方法的适用场景示意图；

图5为根据本公开一个实施例的广告推荐的流程示意图之一；

图6A-图6B为根据本公开一个实施例的广告推荐的流程示意图之二；

图7为根据本公开一个实施例的广告推荐的流程示意图之三；

图8为根据本公开一个实施例的用于广告推荐的神经网络模型装置；

图9为根据本公开一个实施例的广告推荐装置；

图10为根据本公开一个实施例的电子设备的结构示意图。

具体实施方式

为进一步说明本公开实施例提供的技术方案，下面结合附图以及具体实施方式对此进行详细的说明。虽然本公开实施例提供了如下述实施例或附图所示的方法操作步骤，但基于常规或者无需创造性的劳动在方法中可以包括更多或者更少的操作步骤。在逻辑上不存在必要因果关系的步骤中，这些步骤的执行顺序不限于本公开实施例提供的执行顺序。方法在实际的处理过程中或者控制设备执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行。

本公开实施例中术语“多个”是指两个或两个以上，其它量词与之类似应当理解，此处所描述的优选实施例仅用于说明和解释本公开，并不用于限定本公开，并且在不冲突的情况下，本公开中的实施例及实施例中的特征可以相互组合。

发明人研究发现，广告推荐系统随着目标对象的不断增大，需要有很多资源来维护这个庞大的广告推荐系统。另一方面互联网广告不是每一个目标对象都适合投放广告，有的人天生对广告有很大的抵触情绪，有的用户由于自然作品等原因，也不适合出广告。现有技术中是通过预设规则来判断是够需要向目标对象推送广告的。例如，预设规则中规定某个时间段不进行推荐广告，则在该时间段内则不向目标对象推送广告。但是，发明人发现没有一个完全合适的时间段不进行推荐广告，总有一些广告是适合在某个时间段推荐的。所以，需要一种新的方法来减轻广告推荐系统的计算压力。由此，本公开提出一种用于广告推荐的神经网络模型训练方法及装置。下面结合附图，对本公开进行详细的说明。

如图1所示，为一种用于广告推荐神经网络模型训练的应用场景，该应用场景中包括多个终端设备110和服务器120，图1中是以一个终端设备110为例，实际上不限制终端设备110的数量。终端设备110和服务器120之间可以通过通信网络进行通信。终端设备110例如手机、平板电脑和个人计算机等。服务器120可以通过单个服务器实现，也可以通过多个服务器实现。服务器120可以通过实体服务器实现，也可以通过虚拟服务器实现。

在一种可能的应用场景中，服务器120从广告推荐系统中获取指定数量的样本对象的广告推荐结果，所述广告推荐结果中包括为所述样本对象选择的多个待推荐广告、以及各个待推荐广告的广告推荐值；针对每个样本对象，服务器120基于所述样本对象的广告推荐结果筛选出满足指定条件的广告推荐值，其中，所述指定条件为最大值、最小值和平均值中的一种；服务器120基于各个样本对象的广告推荐值以及各个样本对象的指定相关数据构造训练样本；所述指定相关数据包括用户画像特征、当前访问操作的访问场景特征；基于构造的所述训练样本训练神经网络模型，以使所述神经网络模型输出分类结果并在终端设备110中进行显示，所述分类结果用于指示是否向输入的样本对象进行广告推荐。以此来减轻广告推荐系统的计算压力。

如图2所示，图2为本公开广告推荐方法的流程示意图，可包括以下步骤：

步骤201:从广告推荐系统中获取指定数量的样本对象的广告推荐结果，所述广告推荐结果中包括为所述样本对象选择的多个待推荐广告、以及各个待推荐广告的广告推荐值；

其中，各待推荐广告的广告推荐值可根据不同广告商的计费方式来确定。可包括以下三种计费方式：

方式一：按照点击次数来进行计费。

例如，广告1被点击1次商家出价为5元。则广告1的广告推荐值＝点击出价*样本对象针对广告1的曝光率*样本对象针对广告1的点击率。若确定出样本对象针对广告1的曝光率和样本对象针对广告1的点击率分别为0.2和0.1，则确定出样本对象的广告1的广告推荐值为0.1。

方式二：按照转化次数来进行计费。

例如，广告2为推荐应用的广告，则该应用被下载才可以进行计费，如被下载一次商家的出价为10元。则广告2的广告推荐值＝转化出价*样本对象针对广告2的曝光率*样本对象针对广告2的点击率*样本对象的转化率。若确定出样本对象针对广告2的曝光率为0.25，点击率为0.2，转化率为1，则确定出广告2的广告推荐值为0.5。

方式三：按照曝光次数来进行计费。

例如，广告3的计费方式为按照曝光来进行计费的。如曝光一次商家出价为0.8元。则广告推荐值＝曝光出价*样本对象针对广告3的曝光率。若确定出样本对象针对广告3的曝光率为1，则确定出广告3的广告推荐值为0.8。

步骤202：针对每个样本对象，基于所述样本对象的广告推荐结果筛选出满足指定条件的广告推荐值，其中，所述指定条件为最大值、最小值和平均值中的一种；

步骤203：基于各个样本对象的广告推荐值以及各个样本对象的指定相关数据构造训练样本；所述指定相关数据包括用户画像特征、当前访问操作的访问场景特征；

其中，构造训练样本的方法可包括以下两种：

(一)：对各样本对象，将所述样本对象的广告推荐值和推荐门限进行比较；若所述样本对象的广告推荐值大于所述推荐门限，则将所述样本对象的样本类别标记为正样本；若所述样本对象的广告推荐值小于或等于所述推荐门限，则将所述样本对象的样本类别标记为负样本；采用所述样本对象的所述指定相关数据以及所述样本对象样本类别构成与所述样本对象对应的训练样本；

例如，指定数量的样本对象包括样本对象A、样本对象B、样本对象C、样本对象D和样本对象E。以样本对象A为例进行介绍样本类别的确定过程：

获取样本对象A的广告推荐结果，若确定出广告推荐结果包括广告1以及广告1的广告推荐值0.1，广告2以及广告2的广告推荐值为0.5。广告3以及广告3的广告推荐值0.8。若指定条件为最大值，则广告推荐结果中满足指定条件的广告推荐值为0.8，并将0.8作为样本对象A的广告推荐值。

根据上面的方法，确定出样本对象B的广告推荐值为0.5，样本对象C的广告推荐值为0.3，样本对象D的广告推荐值为0.2，样本对象E的广告推荐值为0.85。若推荐门限值为0.55。则确定出样本对象A和样本对象E的广告推荐值大于推荐门限。则将样本对象A和样本对象E各自的样本类别标记为正样本。确定出样本对象B、样本对象C和样本对象D的广告推荐值均不大于推荐门限，则将样本对象B、样本对象C和样本对象D的样本类别均标记为负样本。最后，采用所述样本对象的所述指定相关数据以及所述样本对象的样本类别构成训练样本。

(二)、对各样本对象，采用所述样本对象的广告推荐值作为所述样本对象的所述指定相关数据的标签得到与所述样本对象对应的训练样本；

例如，如前文所述，确定出样本对象A的广告推荐值为0.8，样本对象B的广告推荐值为0.5，样本对象C的广告推荐值为0.3，样本对象D的广告推荐值为0.2，样本对象E的广告推荐值为0.85。则采用各样本对象的广告推荐值分别作为各样本对象的指定相关数据的标签得到训练样本。

步骤204：基于构造的所述训练样本训练神经网络模型，以使所述神经网络模型输出分类结果，所述分类结果用于指示是否向输入的样本对象进行广告推荐。

其中，由于构成训练样本包括上述两种方式，所以基于构造的训练样本训练网络模型也包括以下两种方式：

(1)、基于方式(一)构造的训练样本，训练所述神经网络模型，可实施为：训练所述神经网络模型对各个样本对象的所述指定相关数据进行分类识别，以使所述神经网络模型学习各个样本对象的所述指定相关数据对应的类别。

例如，如图3所示，图3为深度学习的神经网络的结构示意图，神经网络模型包括输入层301、隐藏层302、输出层303。通过输入层301将训练样本输入至神经网络模型中，然后通过隐藏层302对各个样本对象的所述指定相关数据进行分类识别，得到各个样本对象的所述指定相关数据对应的类别。最后通过输出层303将所述目标对象的类别进行输出。

(2)、基于方式(二)构造的训练样本，训练所述神经网络模型，可实施为：训练所述神经网络模型提取各个样本对象的特征表达，并对所述特征表达进行评分；确定各训练样本的评分与相应的训练样本的广告推荐值之间的差距作为损失值；基于所损失值训练所述神经网络模型以使所述神经网络模型将评分大于所述推荐门限的训练样本分类到需要推荐广告的类别，将评分小于或等于所述推荐门限的训练样本分类到不需要推荐广告的类别。

例如，如图3所示，通过输入层301将训练样本输入至神经网络模型中，然后通过所述神经网络模型中的隐藏层302提取各个样本对象的特征表达，并对所述特征表达进行评分；确定各训练样本的评分与相应的训练样本的广告推荐值之间的差距作为损失值；基于所损失值进行训练以便于将评分大于所述推荐门限的训练样本分类到需要推荐广告的类别，将评分小于或等于所述推荐门限的训练样本分类到不需要推荐广告的类别。然后通过输出层303将所述训练样本的类别进行输出。

由此，从广告推荐系统中获取各待推荐广告以及对应的广告推荐值来对神经网络模型进行训练，相当于复用了广告推荐系统中的广告推荐值。并基于广告推荐系统的广告推荐值完成通过神经网络对各目标对象的推荐价值的粗判定，实现了基于广告推荐系统中关键信息对目标对象进行筛选，故此，神经网络模型筛选出的目标对象与广告推荐系统所需的目标对象从一定程度上保持一致。由此广告推荐系统尽可能处理真正需要处理的目标对象，以减轻了广告推荐系统的计算压力。

由此，可根据多维度的数据来确定出目标对象的分类结果，使得确定出分类结果更加准确。

基于相同的发明构思，本公开还提供一种广告推荐方法，如图4所示，为一种广告推荐的应用场景，该应用场景中包括多个终端设备410和服务器430，图1中是以三个终端设备410为例，实际上不限制终端设备410的数量。终端设备410中安装有用于展示网络资源信息的客户端420(例如用于制作和浏览网络资源信息的客户端)。客户端420和服务器430之间可以通过通信网络进行通信。终端设备410例如手机、平板电脑和个人计算机等。服务器430可以通过单个服务器实现，也可以通过多个服务器实现。服务器430可以通过实体服务器实现，也可以通过虚拟服务器实现。

在一种可能的应用场景中，目标对象A使用终端设备410中的客户端420发送网络资源信息的页面获取请求，客户端420将网络资源信息的页面获取请求发送给服务端430。服务端430接收目标对象A发送的网络资源信息的页面获取请求后，获取目标对象A的指定相关数据。然后将指定相关数据输入至预先训练的神经网络模型中，得到目标对象A的分类结果。若目标对象A的分类结果为需要推荐广告的类别。则将目标对象A输入广告推荐系统中进行广告推荐。服务器430将推荐的广告发送至目标对象A的终端设备410的客户端420上。由此，本公开通过将目标对象的指定相关数据输入至预训练的神经网络模型中以此来确定目标对象的分类结果，并根据该分类结果来确定出是否需要向该目标对象进行广告推荐。由此减轻了广告推荐系统的计算压力。

如图5所示，图5为本公开广告推荐方法的流程示意图，可包括以下步骤：

步骤501：获取目标对象的指定相关数据；所述指定相关数据为所述目标对象的指定维度的特征信息；所述指定相关数据包括用户画像特征、当前访问操作的访问场景特征；

为了节省计算资源，在一个实施例中，接收所述目标对象的页面获取请求；获取所述页面获取请求针对的多媒体资源的广告参数；若基于所述广告参数和预设的广告推荐规则确定所述目标对象为待推荐对象，则执行所述获取目标对象的指定相关数据的步骤。

例如，接收到目标对象M的页面获取请求，获取所述页面获取请求针对的多媒体资源1的，则基于多媒体资源1的广告参数和预设的广告推荐规则来确定出目标对象M是否为待推荐对象，其中广告推荐规则可如表1所示，若确定出多媒体资源1的广告参数为A,则根据表1可确定出目标对象是否为待推荐对象，以便于确定是否需要为目标对象推荐广告。其中，表1为：

广告参数	目标对象是否为待推荐对象
		A	否
B	否
		C	是

其中，广告参数可以表示该多媒体资源的类型、广告权限等。例如，广告参数A代表该多媒体资源的类型为正能量类型，则说明该多媒体资源不适合投放广告，则广告推荐规则中针对广告参数A则设置对应的该目标对象不是待推荐对象。若广告参数B表示该多媒体资源并未开通推荐广告的权限，则广告推荐规则中针对广告参数B则设置该目标对象不是待推荐对象。若广告参数C表示该多媒体资源为正常的多媒体资源，则广告推荐规则中针对广告参数C则可设置该目标对象为待推荐对象，则可继续执行所述获取目标对象的指定相关数据的步骤。以便于确定是否需要向该目标对象推荐广告。

由此，可根据页面获取请求针对的多媒体资源的广告参数来确定出目标对象是否为待推荐对象，以此可以进一步的节省计算资源。避免资源浪费。

为了使得到的目标对象的分类结果更加准确，在一个实施例中，所述指定相关数据包括用户画像特征和当前访问操作的访问场景特征；其中，

步骤502：将所述指定相关数据输入至预训练的神经网络模型，得到所述目标对象的分类结果；

需要说明的是：所述神经网络模型是基于样本对象的推荐价值训练的，所述推荐价值用于定量描述向所述样本对象推荐广告的必要性，且所述推荐价值正比于所述必要性。

推荐价值从一定程度上反映了向该目标对象推荐广告的必要性，该必要性可以从浪费的计算资源和收益之间的差别进行衡量，例如可以基于实验设定几个指标来衡量一个目标对象的推荐价值，该推荐价值可以正比于收益率，该收益率用于衡量从目标对象获得的收益与对该目标对象的资源支出之间的比例。由此，可以通过衡量每个目标对象的推荐价值可以考虑是否为该目标对象推荐广告。

下面，基于推荐价值来对神经网络的训练进行介绍，基于相同的发明构思，该神经网络的训练的效果与前述方法的效果相似，在此不再赘述。包括以下两种方法：

(一)：如图6A所示，可包括以下步骤：

步骤6A01：从所述广告推荐系统中获取指定数量的样本对象的广告推荐结果，所述广告推荐结果中包括为所述样本对象选择的多个待推荐广告、以及各个待推荐广告的广告推荐值；

步骤6A02：针对每个样本对象，基于所述样本对象的广告推荐结果筛选出满足指定条件的广告推荐值，其中，所述指定条件为最大值、最小值和平均值中的一种；

步骤6A03：对各样本对象，将所述样本对象的广告推荐值和推荐门限进行比较；

步骤6A04：采用所述样本对象的所述指定相关数据以及所述样本对象样本类别构成与所述样本对象对应的训练样本；

步骤6A05：训练所述神经网络模型对各个样本对象的所述指定相关数据进行分类识别，以使所述神经网络模型学习各个样本对象的所述指定相关数据对应的类别。

(二)、如图6B所示，可包括以下步骤：

步骤6B01：从所述广告推荐系统中获取指定数量的样本对象的广告推荐结果，所述广告推荐结果中包括为所述样本对象选择的多个待推荐广告、以及各个待推荐广告的广告推荐值；

步骤6B02：针对每个样本对象，基于所述样本对象的广告推荐结果筛选出满足指定条件的广告推荐值，其中，所述指定条件为最大值、最小值和平均值中的一种；

步骤6B03：对各样本对象，采用所述样本对象的广告推荐值作为所述样本对象的所述指定相关数据的标签得到与所述样本对象对应的训练样本；

步骤6B04：训练所述神经网络模型提取各个样本对象的特征表达，并对所述特征表达进行评分；

步骤6B05：确定各训练样本的评分与相应的训练样本的广告推荐值之间的差距作为损失值；

步骤6B06：基于所损失值训练所述神经网络模型以使所述神经网络模型将评分大于所述推荐门限的训练样本分类到需要推荐广告的类别，将评分小于或等于所述推荐门限的训练样本分类到不需要推荐广告的类别。

由此，上述两种训练神经网络模型的方法中均是从广告推荐系统中的广告推荐值来训练的，由此相当于复用了广告推荐系统中的广告推荐值。并基于广告推荐系统的广告推荐值完成通过神经网络对各目标对象的推荐价值的粗判定，实现了基于广告推荐系统中关键信息对目标对象进行筛选，故此，神经网络模型筛选出的目标对象与广告推荐系统所需的目标对象从一定程度上保持一致。由此广告推荐系统尽可能处理真正需要处理的目标对象，以节省广告推荐系统的计算资源。

步骤503：若所述目标对象的分类结果为需要推荐广告的类别，则将所述目标对象输入广告推荐系统中进行广告推荐。

由此，本公开通过将目标对象的指定相关数据输入至预训练的神经网络模型中以此来确定目标对象的分类结果，并根据该分类结果来确定出是否需要向该目标对象进行广告推荐。故此，本公开中通过神经网络模型来确定出目标对象是否需要进行广告推荐。将需要进行广告推荐的目标对象进行广告推荐。由此减轻了广告推荐系统的计算压力。

为了进一步了解本公开提供的技术方案，下面结合图7进行详细说明，可包括以下步骤：

步骤701：从所述广告推荐系统中获取指定数量的样本对象的广告推荐结果，所述广告推荐结果中包括为所述样本对象选择的多个待推荐广告、以及各个待推荐广告的广告推荐值；

步骤702：针对每个样本对象，基于所述样本对象的广告推荐结果筛选出满足指定条件的广告推荐值，其中，所述指定条件为最大值、最小值和平均值中的一种；

步骤703：对各样本对象，将所述样本对象的广告推荐值和推荐门限进行比较；若所述样本对象的广告推荐值大于所述推荐门限，则将所述样本对象的样本类别标记为正样本；若所述样本对象的广告推荐值小于或等于所述推荐门限，则将所述样本对象的样本类别标记为负样本；

步骤704：采用所述样本对象的所述指定相关数据以及所述样本对象样本类别构成与所述样本对象对应的训练样本；

步骤705：训练所述神经网络模型对各个样本对象的所述指定相关数据进行分类识别，以使所述神经网络模型学习各个样本对象的所述指定相关数据对应的类别；

步骤706：接收所述目标对象的页面获取请求；

步骤707：获取所述页面获取请求针对的多媒体资源的广告参数；

步骤708：若基于所述广告参数和预设的广告推荐规则确定所述目标对象为待推荐对象；

步骤709：获取目标对象的指定相关数据；

步骤710：将所述指定相关数据输入至预训练的神经网络模型，得到所述目标对象的分类结果；

步骤711：若所述目标对象的分类结果为需要推荐广告的类别，则将所述目标对象输入广告推荐系统中进行广告推荐。

基于相同的发明构思，本公开如上述所述用于广告推荐的神经网络模型训练方法还可以由一种广告推荐装置实现，该装置的效果与前述方法的效果相似，在此不再赘述。

图8为根据本公开一个实施例的广告推荐装置的结构示意图。

如图8所示，本公开的用于广告推荐的神经网络模型训练800可以包括第一广告推荐结果获取模块810、第一广告推荐值确定模块820、第一训练样本构造模块830和第一神经网络模型训练模块840。

第一广告推荐结果获取模块810，被配置为执行从广告推荐系统中获取指定数量的样本对象的广告推荐结果，所述广告推荐结果中包括为所述样本对象选择的多个待推荐广告、以及各个待推荐广告的广告推荐值；

第一广告推荐值确定模块820，被配置为执行针对每个样本对象，基于所述样本对象的广告推荐结果筛选出满足指定条件的广告推荐值，其中，所述指定条件为最大值、最小值和平均值中的一种；

第一训练样本构造模块830，被配置为执行基于各个样本对象的广告推荐值以及各个样本对象的指定相关数据构造训练样本；所述指定相关数据包括用户画像特征、当前访问操作的访问场景特征；

第一神经网络模型训练模块840，被配置为执行基于构造的所述训练样本训练神经网络模型，以使所述神经网络模型输出分类结果，所述分类结果用于指示是否向输入的样本对象进行广告推荐。

在一个实施例中，所述第一训练样本构造模块830，具体被配置为执行：

所述第一神经网络模型训练模块840，具体被配置为执行：

基于相同的发明构思，本公开如上所述的广告推荐方法还可以由一种广告推荐装置实现。该装置的效果与前述方法的效果相似，在此不再赘述。

图9为根据本公开一个实施例的广告推荐装置的结构示意图。

如图9所示，本公开的广告推荐装置900可以包括获取模块910和分类结果确定模块920和广告推荐模块930。

获取模块910，被配置为执行获取目标对象的指定相关数据；所述指定相关数据为所述目标对象的指定维度的特征信息；所述指定相关数据包括用户画像特征、当前访问操作的访问场景特征；

分类结果确定模块920，被配置为执行将所述指定相关数据输入至预训练的神经网络模型，得到所述目标对象的分类结果；

广告推荐模块930，被配置为执行若所述目标对象的分类结果为需要推荐广告的类别，则将所述目标对象输入广告推荐系统中进行广告推荐。

在一个实施例中，所述装置还包括：

第二广告推荐结果获取模块940，被配置为执行从所述广告推荐系统中获取指定数量的样本对象的广告推荐结果，所述广告推荐结果中包括为所述样本对象选择的多个待推荐广告、以及各个待推荐广告的广告推荐值；

第二广告推荐值确定模块950，被配置为执行针对每个样本对象，基于所述样本对象的广告推荐结果筛选出满足指定条件的广告推荐值，其中，所述指定条件为最大值、最小值和平均值中的一种；

第二训练样本构造模块960，被配置为执行基于各个样本对象的广告推荐值以及各个样本对象的所述指定相关数据构造训练样本；

第二神经网络模型训练模块970，被配置为执行基于构造的所述训练样本训练所述神经网络模型。

在一个实施例中，所述第二训练样本构造模块960，具体被配置为执行：

所述第二神经网络模型训练模块970，具体被配置为执行：

在一个实施例中，所述装置还包括：

接收模块980，被配置为执行获取目标对象的指定相关数据之前，接收所述目标对象的页面获取请求；

广告参数获取模块990，被配置为执行获取所述页面获取请求针对的多媒体资源的广告参数；

待推荐对象确定模块991，被配置为执行基于所述广告参数和预设的广告推荐规则确定所述目标对象为待推荐对象，则执行所述获取目标对象的指定相关数据的步骤。

在介绍了本申请示例性实施方式的一种用于广告推荐的神经网络模型训练方法和装置之后，接下来，介绍根据本申请的另一示例性实施方式的电子设备。

所属技术领域的技术人员能够理解，本申请的各个方面可以实现为系统、方法或程序产品。因此，本申请的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“系统”。

在一些可能的实施方式中，根据本申请的电子设备可以至少包括至少一个处理器、以及至少一个计算机存储介质。其中，计算机存储介质存储有程序代码，当程序代码被处理器执行时，使得处理器执行本说明书上述描述的根据本申请各种示例性实施方式的广告推荐方法中的步骤。例如，处理器可以执行如图2中所示的步骤201-204。

下面参照图10来描述根据本申请的这种实施方式的电子设备1000。图10显示的电子设备1000仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图10所示，电子设备1000以通用电子设备的形式表现。电子设备1000的组件可以包括但不限于：上述至少一个处理器1001、上述至少一个计算机存储介质1002、连接不同系统组件(包括计算机存储介质1002和处理器1001)的总线1003。

总线1003表示几类总线结构中的一种或多种，包括计算机存储介质总线或者计算机存储介质控制器、外围总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。

计算机存储介质1002可以包括易失性计算机存储介质形式的可读介质，例如随机存取计算机存储介质(RAM)1021和/或高速缓存存储介质1022，还可以进一步包括只读计算机存储介质(ROM)1023。

计算机存储介质1002还可以包括具有一组(至少一个)程序模块1024的程序/实用工具1025，这样的程序模块1024包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

电子设备1000也可以与一个或多个外部设备1004(例如键盘、指向设备等)通信，还可与一个或者多个使得用户能与电子设备1000交互的设备通信，和/或与使得该电子设备1000能与一个或多个其它电子设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1005进行。并且，电子设备1000还可以通过网络适配器1006与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器1006通过总线1003与用于电子设备1000的其它模块通信。应当理解，尽管图中未示出，可以结合电子设备1000使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

在一些可能的实施方式中，本申请提供的一种用于广告推荐的神经网络模型训练方法的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当程序产品在计算机设备上运行时，程序代码用于使计算机设备执行本说明书上述描述的根据本申请各种示例性实施方式的一种用于广告推荐的神经网络模型训练方法中的步骤。

程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取计算机存储介质(RAM)、只读计算机存储介质(ROM)、可擦式可编程只读计算机存储介质(EPROM或闪存)、光纤、便携式紧凑盘只读计算机存储介质(CD-ROM)、光计算机存储介质件、磁计算机存储介质件、或者上述的任意合适的组合。

本申请的实施方式的用于广告推荐的程序产品可以采用便携式紧凑盘只读计算机存储介质(CD-ROM)并包括程序代码，并可以在电子设备上运行。然而，本申请的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于——无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码，程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户电子设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户电子设备上部分在远程电子设备上执行、或者完全在远程电子设备或服务器上执行。在涉及远程电子设备的情形中，远程电子设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户电子设备，或者，可以连接到外部电子设备(例如利用因特网服务提供商来通过因特网连接)。

应当注意，尽管在上文详细描述中提及了装置的若干模块，但是这种划分仅仅是示例性的并非强制性的。实际上，根据本申请的实施方式，上文描述的两个或更多模块的特征和功能可以在一个模块中具体化。反之，上文描述的一个模块的特征和功能可以进一步划分为由多个模块来具体化。

此外，尽管在附图中以特定顺序描述了本申请方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘计算机存储介质、CD-ROM、光学计算机存储介质等)上实施的计算机程序产品的形式。

本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读计算机存储介质中，使得存储在该计算机可读计算机存储介质中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

1.一种用于广告推荐的神经网络模型训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述基于各个样本对象的广告推荐值以及各个样本对象的所述指定相关数据构造训练样本，包括：

所述基于构造的所述训练样本训练神经网络模型，包括：

3.根据权利要求1所述的方法，其特征在于，所述基于各个样本对象的广告推荐值以及各个样本对象的所述指定相关数据构造训练样本，包括：

所述基于构造的所述训练样本训练神经网络模型，包括：

4.根据权利要求1-3任一所述的方法，其特征在于，所述指定相关数据包括用户画像特征和当前访问操作的访问场景特征；其中，

5.一种广告推荐方法，其特征在于，所述方法包括：

6.根据权利要求5所述的方法，其特征在于，训练所述神经网络模型，包括：

基于构造的所述训练样本训练所述神经网络模型。

7.一种用于广告推荐的神经网络模型训练装置，其特征在于，所述装置包括：

8.一种广告推荐装置，其特征在于，所述装置包括：

9.一种电子设备，其特征在于，包括至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令；所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行根据权利要求1-4和/或5-6中任一项所述的方法。

10.一种计算机存储介质，其特征在于，所述计算机存储介质存储有计算机程序，所述计算机程序用于执行根据权利要求1-4和/或5-6中任一项所述的方法。