CN110866199A

CN110866199A - 位置确定方法、装置、电子设备和计算机可读介质

Info

Publication number: CN110866199A
Application number: CN201910990384.9A
Authority: CN
Inventors: 廖国钢; 吴晓旭; 王永康; 王兴星; 张硕
Original assignee: Beijing Sankuai Online Technology Co Ltd
Current assignee: Beijing Sankuai Online Technology Co Ltd
Priority date: 2019-10-17
Filing date: 2019-10-17
Publication date: 2020-03-06

Abstract

本申请实施例公开了位置确定方法、装置、电子设备和计算机可读介质。该方法的实施例包括：利用进化策略确定预设的排序模型的参数，进化策略所使用的评估值计算公式中包括正则项，评估值用于表征页面中待排序项的收益；提取目标页面中的各待排序项的特征信息，目标页面的待排序项包括待投放于目标页面的广告和自然结果；分别将各待排序项的特征信息输入至排序模型，得到各待排序项的排序得分；基于各待排序项的排序得分确定各待排序项在目标页面中的位置。该实施方式降低了寻找最优参数的耗时且减少了收益损失。

Description

位置确定方法、装置、电子设备和计算机可读介质

技术领域

本申请实施例涉及计算机技术领域，具体涉及位置确定方法、装置、电子设备和计算机可读介质。

背景技术

随着互联网的普及，在自然结果中投放网络广告，是一种越来越常见的网络广告投放方式。在网络广告投放前，通常需要将为各网络广告和各自然结果进行排序，从而确定各网络广告的投放位置和各自然结果的呈现位置。

现有的方式，通常是通过人工线上调参的方式调整排序模型的参数，基于各广告和各自然结果的特征和调整参数后的排序模型，计算各广告和各自然结果的排序得分。然而，这种方式寻找参数的耗时较长，且不易寻找出最优参数组合，导致存在较大的收益损失。

发明内容

本申请实施例提出了位置确定方法、装置、电子设备和计算机可读介质，以降低寻找最优参数的耗时并减少收益损失。

第一方面，本申请实施例提供了一种位置确定方法，该方法包括：利用进化策略确定预设的排序模型的参数，进化策略所使用的评估值计算公式中包括正则项，评估值用于表征页面中待排序项的收益；提取目标页面中的各待排序项的特征信息，目标页面的待排序项包括待投放于目标页面的广告和自然结果；分别将各待排序项的特征信息输入至排序模型，得到各待排序项的排序得分；基于各待排序项的排序得分确定各待排序项在目标页面中的位置。

第二方面，本申请实施例提供了一种位置确定装置，该装置包括：第一确定单元，被配置成利用进化策略确定预设的排序模型的参数，进化策略所使用的评估值计算公式中包括正则项，评估值用于表征页面中待排序项的收益；提取单元，被配置成提取目标页面中的各待排序项的特征信息，目标页面的待排序项包括待投放于目标页面的广告和自然结果；输入单元，被配置成分别将各待排序项的特征信息输入至排序模型，得到各待排序项的排序得分；第二确定单元，被配置成基于各待排序项的排序得分确定各待排序项在目标页面中的位置。

第三方面，本申请实施例提供了一种电子设备，包括：一个或多个处理器；存储装置，其上存储有一个或多个程序，当一个或多个程序被一个或多个处理器执行，使得一个或多个处理器实现如第一方面中所描述的方法。

第四方面，本申请实施例提供了一种计算机可读介质，其上存储有计算机程序，该程序被处理器执行时实现如第一方面中所描述的方法。

本申请实施例提供的位置确定方法、装置、电子设备和计算机可读介质，通过利用进化策略确定预设的排序模型的参数；之后提取待投放于目标页面中的各待排序项中的特征信息；而后分别将各待排序项的特征信息输入至排序模型，得到各待排序项的排序得分；最后基于排序得分确定各待排序项的位置。由于采用进化策略确定排序模型的参数，易于寻找出最优参数组合，因而降低了调参的耗时；此外，通过在进化策略所使用的评估值计算公式中设置正则项，提高了最优参数组合的泛化性。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1是根据本申请的位置确定方法的一个实施例的流程图；

图2是根据本申请的位置确定方法的又一个实施例的流程图；

图3是根据本申请的位置确定方法的评估值计算过程的流程图；

图4是根据本申请的位置确定装置的一个实施例的结构示意图；

图5是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

请参考图1，其示出了根据本申请的位置确定方法的一个实施例的流程100。该位置确定方法，包括以下步骤：

步骤101，利用进化策略确定预设的排序模型的参数。

在本实施例中，位置确定方法的执行主体(如服务器等电子设备)中可以存储有预先设置的排序模型。该排序模型可以用于表征广告或者自然结果的特征信息与排序得分的对应关系。实践中，自然结果可以是根据用户的搜索请求得到的搜索结果，也可以是根据用户的历史行为自动推荐的结果。需要说明的是，本实施例对自然结果的获取方式不作限定。通过将某广告或者自然结果的特征信息输入至排序模型，即可得到排序模型输出的该广告或者自然结果的排序得分。

其中，特征信息可以是用于表征待排序项(如广告、自然结果)的特征的信息。例如，可以包括但不限于待排序项的预估点击率、预估转化率、预估成单价格等。

实践中，排序模型可以是公式、函数或者采用现有模型结构而建立的能够计算排序得分的模型。

在本实施例中，可以利用进化策略(Evolutionary Strategies，ES)确定预设的排序模型的参数。其中，进化策略是一种求解参数优化问题的方法。进化策略的原理是：首先，将问题定义为寻求函数(即排序模型)的实数多维矢量(即排序模型的参数向量)，使得评估值(Reward)最大。而后，对各维参数在可行范围内随机取样。之后，将该实数多维矢量作为父矢量，通过加入一个零均方差的高斯随机变量预设的标准差，产生子矢量，并基于评估值选取部分子矢量作为新的父矢量。重复执行上述过程直至到找到符合条件的参数或者直至满足某个终止条件。

由此，通过进化策略可以自动查找排序模型的最优参数组合，相较于现有方式中通过人工调参的方式查找最优参数，更易于找到最优参数，且可以降低参数查找耗时。此外，通过进化策略查找排序模型的最优参数组合，不依赖于线上数据，避免了人工线上调参过程导致的收益损失。

在本实施例中，进化策略的评估值(Reward)可以表征页面中的广告的收益。评估值越大，则收益越大。可以理解的是，对于同一指定页面，若采用某一组参数组合(可称为参数组合A)的排序模型计算得到的该页面的收益较高(即评估值较大)，采用另一组参数组合(可称为参数组合B)的排序模型计算得到的该页面的收益较低(即评估值较小)，则参数组合A为更优的参数。由此，通过预先设定评估值计算公式，并基于该公式计算评估值，可以得到最优的参数组合。

在本实施例中，评估值计算公式即为用于计算页面的收益的公式。其中，页面收益可以包括广告收益、佣金收益等。此处，评估值计算公式中可以包括正则项。实践中，在训练数据不够多时，常常会导致过拟合(overfitting)。此时向目的函数(此处即为评估值计算公式)引入额外信息(即正则项)，能够防止过拟合和并提高模型泛化性能。在本实施例中，评估值计算公式可以是在现有的页面收益计算公式的基础上引入正则项后的公式。通过正则项对在页面的收益计算公式进行修正，可以提高最优参数组合的泛化性能。实践中，评估值计算公式中的正则项可以包括一个或多个，此处不作限定。

步骤102，提取目标页面中的各待排序项的特征信息。

在本实施例中，上述执行主体可以提取目标页面中的各待排序项的特征信息。其中，上述目标页面的待排序项包括待投放于上述目标页面的广告和自然结果。

步骤103，分别将各待排序项的特征信息输入至排序模型，得到各待排序项的排序得分。

在本实施例中，由于排序模型可以用于表征广告或者自然结果的特征信息与排序得分的对应关系，因而，上述执行主体可以分别将各待排序项的特征信息输入至排序模型，得到各待排序项的排序得分。

实践中，排序得分可以用于表征所排顺序。例如，排序得分越高，顺序可以越靠前。

步骤104，基于各待排序项的排序得分确定各待排序项在目标页面中的位置。

在本实施例中，由于排序得分可以用于表征所排顺序，因而，上述执行主体可以上述按照排序得分对各待排序项进行排序。目标页面中的不同的顺序可以对应目标页面的不同位置，因而，可以通过排序结果确定出各待排序项在目标页面的位置。

作为示例，目标页面中包括5个坑位(即为用于设置广告或者自然结果的区域)，分别为坑位A、坑位B、坑位C、坑位D和坑位E。其中，坑位A、坑位B、坑位C、坑位D、坑位E分别用于容纳排序次序1、排序次序2、排序次序3、排序次序4、排序结果5的待排序项。若各待排序项的排序结果分别为自然结果1、自然结果2、广告1、广告2、自然结果3，则自然结果1可设置于坑位A，自然结果2可设置于坑位B，广告1可设置于坑位C，广告2可设置于坑位D，自然结果3可设置于坑位E。

本申请的上述实施例提供的方法，通过利用进化策略确定预设的排序模型的参数；之后提取待投放于目标页面中的各待排序项中的特征信息；而后分别将各待排序项的特征信息输入至上述排序模型，得到各待排序项的排序得分；最后基于排序得分确定各待排序项的位置。由于采用进化策略确定排序模型的参数，易于寻找出最优参数组合，因而降低了调参的耗时；此外，通过在进化策略所使用的评估值计算公式中设置正则项，提高了最优参数组合的泛化性。

进一步参考图2，其示出了位置确定方法的又一个实施例的流程200。该位置确定方法的流程200，包括以下步骤：

步骤201，对排序模型的参数进行采样，得到多组参数。

在本实施例中，位置确定方法的执行主体(如服务器等电子设备)可以对排序模型的参数进行采样，得到多组参数。实践中，可以将参数分布视为高斯分布，使用随机采样方式进行参数的采样。实践中，每一组参数均可以以一个参数向量来表示。

步骤202，基于评估值计算公式确定各组参数的评估值。

在本实施例中，针对某一组参数，可以将该组参数作为排序模型的参数，利用排序模型确定出用于训练排序模型的样本中的各样本待排序项的位置。而后，基于各样本待排序项的位置，进行点击率(Click through rate，CTR)、转化率(Conversion Rate，CVR)等信息的预估。最后，基于预估结果和述评估值计算公式，计算该组参数的评估值。同理，针对其他组参数，也可以采用相同的方式进行评估值计算，此处不作限定。

在本实施例的一些可选的实现方式中，对于每一组参数，可以将使用该组参数的排序模型作为待评估排序模型，执行如图3所示的流程计算评估值。具体包含如下子步骤2021-2023：

步骤2021，基于待评估排序模型，确定样本页面中的各样本待排序项的位置。

此处，样本页面可以是样本集中页面。样本页面中的样本待排序项包括广告和自然结果。

上述执行主体可以首先提取样本页面的各样本待排序项的特征信息；而后，将各特征信息输入至待评估排序模型，得到样本页面的各样本待排序项的排序评分。最后，基于样本页面的各样本待排序项的排序评分确定出样本页面的各样本待排序项的位置。

步骤2022，确定各样本待排序项的点击率和转化率。

此处，可以利用各种现有的点击率确定方法、转化率确定方法来确定各样本待排序项的点击率和转化率。例如，可以采用各种预先训练的点击率预测模型、转化率预测模型进行点击率和转化率的预测。实践中，点击率预测模型、转化率预测模型可以是利用机器学习方法预先训练得到的。

可以理解的是，由于同一待排序项在不同位置的点击率和转化通常不同，而现有的确定点击率和转化率的方式未考虑位置的影响。因而，可选的，在利用常规方式得到点击率和转化率后，还可以通过位置对点击率和转化率进行修正，以提高点击率和转化率的准确性。此时，具体可参考如下步骤得到各样本待排序项的点击率和转化率：

第一步，提取各样本待排序项的特征信息。

第二步，分别将各样本待排序项的输入至预先训练的点击率预测模型和转化率预测模型，得到各样本待排序项的初始点击率和初始转化率。

第三步，获取各样本待排序项的位置对应的修正系数。

此处，不同的位置可以对应不同的修正系数。不同位置的修正系数通过多种方式确定。作为示例，可以通过大量数据统计而预先设定不同位置的修正系数。在需要计算点击率和转化率时，可直接获取预设的修正系数进行修正。

作为又一示例，可以通过预先训练的坑位偏置模型得到。具体地，可以首先提取上述样本页面对应的用户特征。其中，样本页面对应的用户特征可以从用户在对该样本页面进行浏览时所产生的用户行为数据中提取。用户特征可以包括但不限于对不同位置的点击次数、浏览时长、浏览次数等。而后，对于每一个样本待排序项，可以将该样本待排序项所在位置的位置特征和上述用户特征输入至预先训练的坑位偏置模型，得到各位置对应的修正系数。其中，上述坑位偏置模型用于基于用户特征和位置特征生成点击率和转化率的修正系数。需要说明的是，坑位偏置模型可以基于大量样本，利用机器学习算法预先训练得到。坑位偏置模型可具体采用树模型结构进行训练。

第四步，基于所获取的修正系数，对各样本待排序项的初始点击率和初始转化率进行修正，得到各样本待排序项的点击率和转化率。

例如，对于某一位置的样本待排序项，将该位置对应的修正系数与该样本待排序项的初始点击率的乘积作为该样本待排序项最终的点击率。同时，将该位置对应的修正系数与该样本待排序项的初始转化率的乘积作为该样本待排序项最终的转化率。

需要说明的是，基于修正系数对初始点击率和初始转化率进行修正不限于相乘的方式，还可以根据需要使用其他计算方式进行修正，此处不作限定。此外，针对点击率的修正系数与针对转化率可以相同或不同，此处不作限定。

通过位置对点击率和转化率进行修正，可以提高点击率和转化率的准确性。由于收益通常通过预估值(即点击率和转化率)计算，因而，在预估值更准确的情况下，通过进化策略所选取的排序模型的参数更优。

步骤2023，基于评估值计算公式、各样本待排序项的位置、点击率和转化率，确定该组参数对应的评估值。

此处，评估值计算公式即为用于计算页面中的待排序项的收益的公式，通过各样本待排序项的点击率、转化率、与位置相关的信息(如广告价格)等信息，即可计算得到该组参数对应的评估值。

可选的，可以按照如下步骤确定该组参数对应的评估值：

第一步，基于各样本待排序项的位置、点击率和转化率，确定上述样本页面对应的佣金增幅(可表示为Δfee)、广告收益增幅(可表示为Δcpm)和成交额增幅(可表示为Δgmv)。

其中，佣金增幅Δfee可通过如下步骤计算：首先，在当前排序结果下，(即步骤2021得到的排序结果)，计算各样本待排序项的当前佣金总额(佣金总额可以与点击率、转化率和成单价格等相关)。而后，在历史排序结果(即通过历史排序模型得到的各样本待排序项的位置结果)下，计算各样本待排序项的历史佣金总额。最后，将当前佣金总额与历史佣金总额的差值作为佣金增幅。

此外，广告收益增幅Δcpm可通过如下步骤计算：首先，在当前排序结果下，通过各样本待排序项的点击率计算当前广告收益；而后，在历史排序结果下计算历史广告收益；最后，将当前广告收益与历史广告收益的差值作为广告收益增幅。

此外，成交额增幅Δgmv可通过如下步骤计算：首先，在当前排序结果下，通过各样本待排序项的转化率计算当前成交额；而后，在历史排序结果下计算历史成交额；最后，将当前成交额与历史成交额的差值作为成交额增幅。

第二步，基于上述广告收益增幅，确定第一正则项的值。

此处，第一正则项可以是与成交额增幅Δgmv相关的正则项。

作为示例，第一正则项可以表示为:

((Δcpm-GMV_BIAS)·GMV_K)^GMVPOW

其中，GMV_BIAS为第一预设中心值。该第一预设中心值可以基于对历史数据统计而预先设定，例如可设定为10％。GMV_K为第一预设倍数，可以依据经验预先设定，例如可设定为5。GMVPOW为第一预设指数，可以依据经验预先设定。实践中，GMVPOW可以设置为较大的数，例如20。小于1的数20幂次方后接近0，大于1的数20幂次方后很大，因而，将GMVPOW设置为较大的数，可以便于过滤数据。

具体可通过如下步骤确定第一正则项的值：首先确定上述广告收益增幅与第一预设中心值的第一差值；而后确定上述第一差值与第一预设倍数的第一乘积；最后基于第一预设指数，对上述第一乘积进行幂运算，得到第一正则项的值。

第三步，基于上述成交额增幅，确定第二正则项的值。此处，第二正则项可以是与广告收益增幅Δcpm相关的正则项。

作为示例，第二正则项可以表示为:

((Δcpm-CPM_BIAS)·CPM_K)^CPMPOW

其中，CPM_BIAS为第二预设中心值。该第二预设中心值可以基于对历史数据统计而预先设定，例如可设定为10％。CPM_K为第二预设倍数，可以依据经验预先设定，例如可设定为5。CPMPOW为第二预设指数，可以依据经验预先设定。同理，CPMPOW也可以设置为较大的数，例如20。

具体可通过如下步骤确定第二正则项的值：首先确定上述成交额增幅与第二预设中心值的第一差值；而后确定上述第二差值与第二预设倍数的第二乘积；最后基于第二预设指数，对上述第二乘积进行幂运算，得到第二正则项的值。

需要说明的是，第二步、第三步可同时执行。

第四步，对上述佣金增幅、广告收益增幅、成交额增幅、上述第一正则项的值、第二正则项的值进行加权，得到该组参数的评估值。

继续上述示例，评估值可以通过如下评估值计算公式得到：

R＝k1·Δgmv+k2·Δfee+k3·Δcpm-k4((Δcpm-GMV_BIAS)·GMV_K)^GMVPOW

-k5((Δcpm-CPM_BIAS)·CPM_K)^CPMPOW

需要说明的是，上述各项的权重系数可以根据需要预先设定，本申请实施例对各权重的取值不作限定。

步骤203，按照评估值从大到小的顺序，从多组参数中选取预设组数的目标参数。

在本实施例中，上述执行主体可以从上述多组参数中，按照评估值从大到小的顺序选取预设组数(如10组)的参数作为目标参数。

步骤204，确定是否满足预设的结束调参条件。

在本实施例中，结束调参条件根据需要预先设置。例如，结束调参条件可以包括目标参数的分布的方差小于或等于一个指定阈值；还可以包括迭代次数大于预设次数。

需要说明的是，若确定未满足训练结束条件，则可以确定所选取的目标参数的分布。由于每一组参数可以表示为一个参数向量。因而在选取目标参数后，即可得到多个参数向量。此时，可以对上述多个参数向量求平均和方差，得到平均值向量、方差向量。然后根据平均值向量和方差向量，即可刻画出一组分布。而后，可以基于目标参数的分布，重新执行步骤201及步骤201之后的步骤。即，针对目标参数的分布，重新进行随机采样、计算评估值、选取目标参数等步骤。

若确定满足训练结束条件，则可以执行如下步骤206。

步骤205，响应于满足结束调参条件，将评估值最大的一组目标参数作为排序模型的参数。

步骤206，提取目标页面中的各待排序项的特征信息。

步骤207，分别将各待排序项的特征信息输入至排序模型，得到各待排序项的排序得分。

步骤208，基于各待排序项的排序得分确定各待排序项在目标页面中的位置。

本实施例中的步骤206-步骤208可参见图1对应实施例中的步骤102-步骤104，此处不再赘述。

从图2中可以看出，与图1对应的实施例相比，本实施例中的位置确定方法的流程200涉及了基于坑位偏置模型预测点击率、转化率的步骤。由此，本实施例描述的方案可提高排序模型输出的排序评分的准确性。

进一步参考图4，作为对上述各图所示方法的实现，本申请提供了一种位置确定装置的一个实施例，该装置实施例与图1所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图4所示，本实施例所述的位置确定装置400包括：第一确定单元401，被配置成利用进化策略确定预设的排序模型的参数，上述进化策略所使用的评估值计算公式中包括正则项，上述评估值用于表征页面中待排序项的收益；提取单元402，被配置成提取目标页面中的各待排序项的特征信息，上述目标页面的待排序项包括待投放于上述目标页面的广告和自然结果；输入单元403，被配置成分别将各待排序项的特征信息输入至上述排序模型，得到各待排序项的排序得分；第二确定单元404，被配置成基于各待排序项的排序得分确定各待排序项在上述目标页面中的位置。

在本实施例的一些可选的实现方式中，上述第一确定单元401进一步被配置成执行如下调参步骤：执行如下调参步骤：对排序模型的参数进行采样，得到多组参数；基于上述评估值计算公式确定各组参数的评估值；按照评估值从大到小的顺序，从上述多组参数中选取预设组数的目标参数；确定是否满足预设的结束调参条件；响应于满足上述结束调参条件，将评估值最大的一组目标参数作为上述排序模型的参数；响应于未满足结束调参条件，确定所选取的目标参数的分布，并基于上述分布，重新执行上述调参步骤。

在本实施例的一些可选的实现方式中，上述第一确定单元401进一步被配置成执行如下调参步骤：对于上述多组参数中的每一组参数，将使用该组参数的排序模型作为待评估排序模型，执行如下步骤：基于上述待评估排序模型确定样本页面中的各样本待排序项的位置；确定各样本待排序项的点击率和转化率；基于上述评估值计算公式、各样本待排序项的位置、点击率和转化率，确定该组参数对应的评估值。

在本实施例的一些可选的实现方式中，上述第一确定单元401进一步被配置成执行如下调参步骤：提取各样本待排序项的特征信息；分别将各样本待排序项的输入至预先训练的点击率预测模型和转化率预测模型，得到各样本待排序项的初始点击率和初始转化率；获取各样本待排序项的位置对应的修正系数；基于所获取的修正系数，对各样本待排序项的初始点击率和初始转化率进行修正，得到各样本待排序项的点击率和转化率。

在本实施例的一些可选的实现方式中，上述第一确定单元401进一步被配置成执行如下调参步骤：提取上述样本页面对应的用户特征；对于每一个样本待排序项，将该样本待排序项所在位置的位置特征和上述用户特征输入至预先训练的坑位偏置模型，得到各位置对应的修正系数，其中，上述坑位偏置模型用于基于用户特征和位置特征生成点击率和转化率的修正系数。

在本实施例的一些可选的实现方式中，上述第一确定单元401进一步被配置成执行如下调参步骤：基于各样本待排序项的位置、点击率和转化率，确定上述样本页面对应的佣金增幅、广告收益增幅和成交额增幅；基于上述广告收益增幅，确定第一正则项的值；基于上述成交额增幅，确定第二正则项的值；对上述佣金增幅、广告收益增幅、成交额增幅、上述第一正则项的值、第二正则项的值进行加权，得到该组参数的评估值。

在本实施例的一些可选的实现方式中，上述第一确定单元401进一步被配置成执行如下调参步骤：确定上述广告收益增幅与第一预设中心值的第一差值；确定上述第一差值与第一预设倍数的第一乘积；基于第一预设指数，对上述第一乘积进行幂运算，得到第一正则项的值。

在本实施例的一些可选的实现方式中，上述第一确定单元401进一步被配置成执行如下调参步骤：确定上述成交额增幅与第二预设中心值的第一差值；确定上述第二差值与第二预设倍数的第二乘积；基于第二预设指数，对上述第二乘积进行幂运算，得到第二正则项的值。

本申请的上述实施例提供的装置，通过利用进化策略确定预设的排序模型的参数；之后提取待投放于目标页面中的各待排序项中的特征信息；而后分别将各待排序项的特征信息输入至上述排序模型，得到各待排序项的排序得分；最后基于排序得分确定各待排序项的位置。由于采用进化策略确定排序模型的参数，易于寻找出最优参数组合，因而降低了调参的耗时；此外，通过在进化策略所使用的评估值计算公式中设置正则项，提高了最优参数组合的泛化性。

下面参考图5，其示出了适于用来实现本申请实施例的电子设备的计算机系统500的结构示意图。图5示出的电子设备仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图5所示，计算机系统500包括中央处理单元(CPU)501，其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中，还存储有系统500操作所需的各种程序和数据。CPU501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。

以下部件连接至I/O接口505：包括键盘、鼠标等的输入部分506；包括诸如液晶显示器(LCD)等以及扬声器等的输出部分507；包括硬盘等的存储部分508；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器510上，以便于从其上读出的计算机程序根据需要被安装入存储部分508。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分509从网络上被下载和安装，和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时，执行本申请的方法中限定的上述功能。需要说明的是，本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中，其中，这些单元的名称在某种情况下并不构成对该单元本身的限定。

作为另一方面，本申请还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的装置中所包含的；也可以是单独存在，而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该装置执行时，使得该装置：利用进化策略确定预设的排序模型的参数，进化策略所使用的评估值计算公式中包括正则项，评估值用于表征页面中待排序项的收益；提取目标页面中的各待排序项的特征信息，目标页面的待排序项包括待投放于目标页面的广告和自然结果；分别将各待排序项的特征信息输入至排序模型，得到各待排序项的排序得分；基于各待排序项的排序得分确定各待排序项在目标页面中的位置。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本申请中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims

1.一种位置确定方法，其特征在于，所述方法包括：

利用进化策略确定预设的排序模型的参数，所述进化策略所使用的评估值计算公式中包括正则项，所述评估值用于表征页面中待排序项的收益；

提取目标页面中的各待排序项的特征信息，所述目标页面的待排序项包括待投放于所述目标页面的广告和自然结果；

分别将各待排序项的特征信息输入至所述排序模型，得到各待排序项的排序得分；

基于各待排序项的排序得分确定各待排序项在所述目标页面中的位置。

2.根据权利要求1所述的方法，其特征在于，所述利用进化策略确定预设的排序模型的参数，包括：

执行如下调参步骤：对排序模型的参数进行采样，得到多组参数；基于所述评估值计算公式确定各组参数的评估值；按照评估值从大到小的顺序，从所述多组参数中选取预设组数的目标参数；确定是否满足预设的结束调参条件；响应于满足所述结束调参条件，将评估值最大的一组目标参数作为所述排序模型的参数；

响应于未满足结束调参条件，确定所选取的目标参数的分布，并基于所述分布，重新执行所述调参步骤。

3.根据权利要求2所述的方法，其特征在于，所述基于所述评估值计算公式确定各组参数的评估值，包括：

对于所述多组参数中的每一组参数，将使用该组参数的排序模型作为待评估排序模型，执行如下步骤：

基于所述待评估排序模型确定样本页面中的各样本待排序项的位置；

确定各样本待排序项的点击率和转化率；

基于所述评估值计算公式、各样本待排序项的位置、点击率和转化率，确定该组参数对应的评估值。

4.根据权利要求3所述的方法，其特征在于，所述确定各样本待排序项的点击率和转化率，包括：

提取各样本待排序项的特征信息；

分别将各样本待排序项的输入至预先训练的点击率预测模型和转化率预测模型，得到各样本待排序项的初始点击率和初始转化率；

获取各样本待排序项的位置对应的修正系数；

基于所获取的修正系数，对各样本待排序项的初始点击率和初始转化率进行修正，得到各样本待排序项的点击率和转化率。

5.根据权利要求4所述的方法，其特征在于，所述获取各样本待排序项的位置对应的修正系数，包括：

提取所述样本页面对应的用户特征；

对于每一个样本待排序项，将该样本待排序项所在位置的位置特征和所述用户特征输入至预先训练的坑位偏置模型，得到各位置对应的修正系数，其中，所述坑位偏置模型用于基于用户特征和位置特征生成点击率和转化率的修正系数。

6.根据权利要求4所述的方法，其特征在于，所述基于所述评估值计算公式、各样本待排序项的位置、点击率和转化率，确定该组参数对应的评估值，包括：

基于各样本待排序项的位置、点击率和转化率，确定所述样本页面对应的佣金增幅、广告收益增幅和成交额增幅；

基于所述广告收益增幅，确定第一正则项的值；

基于所述成交额增幅，确定第二正则项的值；

对所述佣金增幅、广告收益增幅、成交额增幅、所述第一正则项的值、第二正则项的值进行加权，得到该组参数的评估值。

7.根据权利要求6所述的方法，其特征在于，所述基于所述广告收益增幅，确定第一正则项的值，包括：

确定所述广告收益增幅与第一预设中心值的第一差值；

确定所述第一差值与第一预设倍数的第一乘积；

基于第一预设指数，对所述第一乘积进行幂运算，得到第一正则项的值。

8.根据权利要求6所述的方法，其特征在于，所述基于所述成交额增幅，确定第二正则项的值，包括：

确定所述成交额增幅与第二预设中心值的第一差值；

确定所述第二差值与第二预设倍数的第二乘积；

基于第二预设指数，对所述第二乘积进行幂运算，得到第二正则项的值。

9.一种位置确定装置，其特征在于，所述装置包括：

第一确定单元，被配置成利用进化策略确定预设的排序模型的参数，所述进化策略所使用的评估值计算公式中包括正则项，所述评估值用于表征页面中待排序项的收益；

提取单元，被配置成提取目标页面中的各待排序项的特征信息，所述目标页面的待排序项包括待投放于所述目标页面的广告和自然结果；

输入单元，被配置成分别将各待排序项的特征信息输入至所述排序模型，得到各待排序项的排序得分；

第二确定单元，被配置成基于各待排序项的排序得分确定各待排序项在所述目标页面中的位置。

10.一种电子设备，其特征在于，包括：

一个或多个处理器；

存储装置，其上存储有一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-8中任一所述的方法。

11.一种计算机可读介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-8中任一所述的方法。