CN111797312B

CN111797312B - 模型训练的方法及装置

Info

Publication number: CN111797312B
Application number: CN202010576255.8A
Authority: CN
Inventors: 郭圣昱; 杨一帆; 李悦
Original assignee: Beijing Sankuai Online Technology Co Ltd
Current assignee: Beijing Sankuai Online Technology Co Ltd
Priority date: 2020-06-22
Filing date: 2020-06-22
Publication date: 2024-03-01
Anticipated expiration: 2040-06-22
Also published as: CN111797312A

Abstract

本说明书公开了一种模型训练的方法及装置，由于在对排序模型进行训练的过程中，可以将各排序位置对应的位置影响参数加入到模型训练过程中，这使得训练后的排序模型所输出的排序结果不仅考虑了各搜索结果与用户需要搜索的搜索对象之间的相关性，还考虑了各排序位置对搜索结果所带来的影响，从而有效的提高了排序模型所输出的排序结果的准确性，同时还提高了用户的搜索体验。

Description

模型训练的方法及装置

技术领域

本说明书涉及搜索技术领域，尤其涉及一种模型训练的方法及装置。

背景技术

目前，用户可以根据实际需求，在终端或是安装于终端的应用(Application，App)中输入搜索关键词，以搜索出想要的搜索结果。而为了提高用户的体验，通常情况下，服务器需要将搜索出的搜索结果按照与该搜索关键词之间的相关度来进行排序，并将得到的排序结果返回给终端，以在用户的终端上以一定的排序样式予以显示。

然而在实际应用中，用户是否会对某一搜索结果进行查看，除了与该搜索结果的相关性有关以外，通常还会与该搜索结果在搜索结果页中所处的排序位置有关。排序位置所带来的影响在多列排序样式的排序结果中尤为显著。

所以，如何能够向用户提供更为准确、合理的排序结果，则是一个亟待解决的问题。

发明内容

本说明书提供一种模型训练的方法及装置，以部分的解决现有技术存在的上述问题。

本说明书采用下述技术方案：

本说明书提供了一种模型训练的方法，包括：

获取各用户发送的各搜索请求；

针对所述各搜索请求中包含的每个搜索对象，确定针对该搜索对象的搜索结果；

通过预设的排序模型，对该搜索对象的搜索结果按照多列排序样式进行排序，并将得到的排序结果作为基准排序结果；

将所述基准排序结果中搜索结果的排序位置进行调整，得到至少一个对照排序结果；

获取各用户针对所述基准排序结果中搜索结果的浏览情况，作为所述基准排序结果的浏览情况，以及获取各用户针对所述至少一个对照排序结果中搜索结果的浏览情况，作为所述至少一个对照排序结果的浏览情况；

根据所述基准排序结果的浏览情况以及所述至少一个对照排序结果的浏览情况，确定针对该搜索对象的排序结果中每个排序位置所对应的位置影响参数；

根据所述位置影响参数，对所述排序模型进行训练。

可选地，将所述基准排序结果中搜索结果的排序位置进行调整，得到至少一个对照排序结果，包括：

将发送针对该搜索对象的搜索请求的各用户，作为各目标用户；

将所述各目标用户进行分组，得到基准用户组以及至少一个用户对照组；

针对每个用户对照组，确定该用户对照组在针对该搜索对象的排序结果中所对应的排序位置对；

将所述基准排序结果中位于所述排序位置对的搜索结果进行位置交换，得到该用户对照组对应的对照排序结果。

可选地，获取各用户针对所述基准排序结果中搜索结果的浏览情况，作为所述基准排序结果的浏览情况，以及获取各用户针对所述至少一个对照排序结果中搜索结果的浏览情况，作为所述至少一个对照排序结果的浏览情况，包括：

从所述基准用户组中包含的各用户的浏览日志，获取所述基准用户组针对所述基准排序结果的浏览情况，以及从所述至少一个用户对照组中包含的各用户的浏览日志，获取所述至少一个用户对照组针对所述至少一个对照排序结果的浏览情况。

可选地，从所述基准用户组中包含的各用户的浏览日志，获取所述基准用户组针对所述基准排序结果的浏览情况，以及从所述至少一个用户对照组中包含的各用户的浏览日志，获取所述至少一个用户对照组针对所述至少一个对照排序结果的浏览情况，包括：

针对用户所使用的终端的每种屏幕规格，将所述基准用户组中使用该屏幕规格的终端的用户归为所述基准用户组在该屏幕规格下所对应的子基准用户组，以及针对每个用户对照组，将该用户对照组中使用该屏幕规格的终端的用户归为该用户对照组在该屏幕规格下所对应的子用户对照组；

从所述子基准用户组中包含的各用户的浏览日志，获取所述子基准用户组针对所述基准排序结果的浏览情况，以及从所述子用户对照组中包含的各用户的浏览日志，获取所述子用户对照组针对所述子用户对照组对应的对照排序结果的浏览情况。

可选地，根据所述基准排序结果对应的浏览情况以及所述至少一个对照排序结果对应的浏览情况，确定针对该搜索对象的排序结果中每个排序位置所对应的位置影响参数，包括：

根据获取到的所述子基准用户组针对所述基准排序结果的浏览情况，以及获取到的所述子用户对照组针对所述子用户对照组对应的对照排序结果的浏览情况，确定在该屏幕规格下针对该搜索对象的排序结果中每个排序位置所对应的位置影响参数。

可选地，根据所述位置影响参数，对所述排序模型进行训练，包括：

针对该搜索对象的排序结果中每个排序位置，根据该排序位置对应的位置影响参数，确定该排序位置对应的相关性评价参数；

针对该搜索对象的排序结果中每个排序位置对应的相关性评价参数，对所述排序模型进行训练。

可选地，所述相关性评价参数包括：归一化折损累计增益NDCG；

根据该排序位置对应的位置影响参数，确定该排序位置对应的相关性评价参数，包括：

根据该排序位置对应的位置影响参数，确定在该排序位置对应的位置影响参数下的折损累计增益DCG，以及确定在该排序位置对应的位置影响参数下的理想折损累计增益IDCG；

根据所述DCG以及所述IDCG，确定该排序位置对应的归一化折损累计增益NDCG。

本说明书提供了一种模型训练的装置，包括：

第一获取模块，用于获取各用户发送的各搜索请求；

确定模块，用于针对所述各搜索请求中包含的每个搜索对象，确定针对该搜索对象的搜索结果；

排序模块，用于通过预设的排序模型，对该搜索对象的各搜索结果按照多列排序样式进行排序，并将得到的排序结果作为基准排序结果；

调整模块，用于将所述基准排序结果中搜索结果的排序位置进行调整，得到至少一个对照排序结果；

第二获取模块，用于获取各用户针对所述基准排序结果中搜索结果的浏览情况，作为所述基准排序结果的浏览情况，以及获取各用户针对所述至少一个对照排序结果中搜索结果的浏览情况，作为所述至少一个对照排序结果的浏览情况；

参数确定模块，用于根据所述基准排序结果的浏览情况以及所述至少一个对照排序结果的浏览情况，确定针对该搜索对象的排序结果中每个排序位置所对应的位置影响参数；

训练模块，用于根据所述位置影响参数，对所述排序模型进行训练。

本说明书提供了一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述模型训练的方法。

本说明书提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述模型训练的方法。

本说明书采用的上述至少一个技术方案能够达到以下有益效果：

在本说明书提供的模型训练的方法中，可以获取各用户发送的各搜索请求，针对各搜索请求中包含的每个搜索对象，确定针对该搜索对象的搜索结果，通预设的排序模型，对该搜索对象的搜索结果进行排序，并将得到的排序结果作为基准排序结果，将该基准排序结果中搜索结果的排序位置进行调整，得到至少一个对照排序结果，获取各用户针对该基准排序结果中搜索结果的浏览情况，作为该基准排序结果的浏览情况，以及获取各用户针对至少一个对照排序结果中搜索结果的浏览情况，作为至少一个对照排序结构的浏览情况，根据该基准排序结构的浏览请求以及至少一个对照排序结果的浏览情况，确定针对该搜索对象的排序结果中每个排序位置所对应的位置影响参数，并根据确定出的位置影响参数，对该排序模型进行训练。

从上述方法可以看出，由于在对排序模型进行训练的过程中，可以将各排序位置对应的位置影响参数加入到模型训练过程中，这使得训练后的排序模型所输出的排序结果不仅考虑了各搜索结果与用户需要搜索的搜索对象之间的相关性，还考虑了各排序位置对搜索结果所带来的影响，从而有效的提高了排序模型所输出的排序结果的准确性，同时还提高了用户的搜索体验。

附图说明

此处所说明的附图用来提供对本说明书的进一步理解，构成本说明书的一部分，本说明书的示意性实施例及其说明用于解释本说明书，并不构成对本说明书的不当限定。在附图中：

图1为本说明书提供的一种模型训练的方法流程示意图；

图2为本说明书提供的不同用户在不同屏幕规格的终端上浏览同一搜索结果页时的情况；

图3为本说明书提供的一种模型训练的装置示意图；

图4为本说明书提供的对应于图1的电子设备示意图。

具体实施方式

为使本说明书的目的、技术方案和优点更加清楚，下面将结合本说明书具体实施例及相应的附图对本说明书中技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本说明书保护的范围。

以下结合附图，详细说明本说明书各实施例提供的技术方案。

图1为本说明书提供的一种模型训练的方法流程示意图，具体包括以下步骤：

S101：获取各用户发送的各搜索请求。

在本说明书中，服务器可以获取各用户发送的搜索请求，这里提到的搜索请求可以是指用户根据自身的实际搜索需求，通过所使用的终端或是终端中安装的应用App向服务器发送的。用户所使用的终端可以是指诸如智能手机、平板电脑、笔记本电脑、台式电脑等具有搜索功能的电子设备。

S102：针对所述各搜索请求中包含的每个搜索对象，确定针对该搜索对象的搜索结果。

在实际应用中，多个用户可能会针对同一搜索对象(即多个用户搜索的内容相同)向服务器发送搜索请求，基于此，服务器在获取到各搜索请求后，可以针对各搜索请求中包含的每个搜索对象，确定出针对该搜索对象的各搜索结果。

这里提到的搜索对象可以是指用户输入的搜索关键词、搜索短句等。例如，若是用户需要在购物平台上购买商品A，则可以将商品A的商品名称作为搜索关键词进行输入，而购物平台的服务器基于该用户输入的搜索关键词，将搜索出在该购物平台上各商户所出售的商品A的商品链接，以及与商品A相关的其他商品的商品链接作为该搜索关键词对应的搜索结果向该用户进行返回。

再例如，用户在外卖平台上订购外卖时将自己想要订购的食品的名称作为搜索关键词输入在了终端中并发送给外卖平台的服务器，外卖平台的服务器可以根据该搜索关键词，将外卖平台上能够提供该食品的商家的商家链接作为该搜索关键词对应的搜索结果返回给该用户进行查看。

S103：通过预设的排序模型，对该搜索对象的搜索结果按照多列排序样式进行排序，并将得到的排序结果作为基准排序结果。

服务器针对上述搜索对象，确定出该搜索对象对应的搜索结果后，可以通过预设的排序模型，对这些搜索结果进行排序，并将得到的排序结果进行返回。其中，这里提到的排序模型可以是指未经更新训练的模型，也就是说，本说明书提供的模型训练，意在结合排序结果中不同排序位置对用户是否会对搜索结果进行浏览的影响程度，对该排序模型进行训练，使之训练后的该排序模型，能够输出更为理想的排序结果。

所以，对于未经更新训练的排序模型所得到的排序结果，可以称之为是基准排序结果。换句话说，该基准排序结果可以理解为未经更新训练的排序模型对于服务器搜索出的搜索结果所给出的以多列排序样式所展示的默认排序结果，该默认排序结果主要取决于各搜索结果与上述搜索对象之间的相关性。

而这里之所以需要该基准排序结果，是为了在该基准排序结果的基础上，得到多个搜索结果位置变换后的排序结果，作为对照排序结果，以分析出不同排序位置对搜索结果的影响程度。

S104：将所述基准排序结果中搜索结果的排序位置进行调整，得到至少一个对照排序结果。

在得到上述基准排序结果后，服务器可以将该基准排序结果中各搜索结果的排序位置进行调整，得到各排序结果，并可以将调整排序位置后的排序结果称之为对照排序结果。由于该基准排序结果是以多列排序样式展示的，所以，得到的对照排序结果也是以多列排序样式展示的。这里提到的对照排序结果的主要用途在于，与基准排序结果形式对照试验，以分析出用户对于同一搜索结果在不同排序位置进行展示后的浏览情况，进而在后续过程中分析出各排序位置的影响程度。

而为了能够得到准确的分析结果，服务器需要以具备相同搜索需求的各用户对相同搜索结果在不同排序结果的情况下的浏览情况为分析基础，以确定出各排序位置的影响程度。基于此，在本说明书中，服务器可以将发送用于搜索同一搜索对象的搜索请求的各用户，作为各目标用户。而后，服务器可以将这些目标用户进行分组，得到基准用户组以及至少一个用户对照组。其中，对于基准用户组的用户来说，服务器会将上述基准排序结果返回给该基准用户组的用户进行查看，而对于划分出的每个用户对照组来说，服务器可以为每个用户对照组均确定出一个相应的对照排序结果，并返回给该用户对照组的各用户进行查看。

具体的，服务器可以对每个用户对照组进行编号，并针对每个用户对照组，可以根据该用户对照组对应的编号，来确定出需要将上述基准排序结果中哪些排序位置的搜索结果进行位置交换，以得到针对该用户对照组对应的对照排序结果。为了便于描述，下面仅以双列排序样式展示基准排序结果和对照排序结果的场景为例进行说明。对于双列排序样式来说，从上述基准排序结果中确定需要交换的排序位置，具体可以参照下面的公式。

其中，和/>分别用于表明第k组用户对照组在上述基准排序结果中需要将搜索结果进行调换的排序位置，为了便于说明，可以将这两个排序位置称之为第k组用户对照组在该基准排序结果中所对应的排序位置对。

例如，在确定第5组用户对照组所对应的排序位置对时，可以将k＝5分别代入到上述两个公式中，得到的结果为以及/>函数表示向上取整，mod表示求余数)。即，表明对于第5组用户对照组来说，需要将基准排序结果中第3行第0列(即S₃₀) 的搜索结果与第3行第1列(即S₃₁)的搜索结果进行位置调换，从而得到针对第5组用户对照组所对应的对照排序结果。其中，在该示例中默认将排序结果中最左侧的一列称之为0列(即从左数的第一列)。

需要说明的是，针对每个用户对照组，确定该用户对照组对应的排序位置对的方式并不唯一，除了上述的方式以外，还可以有其他的方式。例如，可以通过公式以及/>来确定出第k组用户对照组在上述基准排序结果中所对应的排序位置对；再例如，对于第k组用户对照组的用户来说，可以将基准排序结果中第k行第一个搜索结果，与该基准结果中第 k-1行第一个搜索结果进行调换，来确定出第k组用户对照组所对应的对照排序结果，其他方式在此就不详细说明了。

服务器可以将确定出的基准排序结果返回给基准用户组的各用户进行查看，同时可以将针对每个用户对照组所确定出的各对照排序结果分别返回给各用户对照组的用户进行查看，以在后续过程中，获取这些用户查看针对该搜索对象的各搜索结果的浏览情况。

S105：获取各用户针对所述基准排序结果中搜索结果的浏览情况，作为所述基准排序结果的浏览情况，以及获取各用户针对所述至少一个对照排序结果中搜索结果的浏览情况，作为所述至少一个对照排序结果的浏览情况。

在本说明书中，服务器可以获取基准用户组的各用户针对上述基准排序结果中各搜索结果的浏览情况，作为该基准排序结果的浏览情况。其中，服务器获取该基准排序结果的浏览情况所采用的具体方式可以有多种。例如，可以通过向用户返回的搜索结果页中进行埋点的方式，来获取到基准用户组中的各用户针对该基准排序结果的浏览情况；再例如，服务器可以获取基准用户组中的各用户针对该基准排序结果中各搜索结果的浏览日志，进而通过这些浏览日志，来获取到该基准用户组中各用户针对该基准排序结果的浏览情况，其他方式在此就不详细举例说明了。

同理，服务器针对每个用户对照组，也需要获取到该用户对照组中的各用户针对该用户对照组所对应的对照排序结果的浏览情况，所采用的方式与上述基本相同，如可以通过在搜索结果页中进行埋点，或是获取该用户对照组中各用户的浏览日志等方式，来获取到该用户对照组针对该用户对照组对应的对照排序结果的浏览情况。

服务器可以通过获取到的各用户的浏览情况，来确定出搜索结果的曝光率、点击率等数据，进而基于这些数据，来确定出不同排序位置的影响程度。其中，这里提到的曝光率是通过搜索结果的曝光次数以及服务器返回该搜索结果的次数进行计算得到的，曝光次数用于表征搜索结果被用户浏览到的情况，例如，若是一个用户通过诸如滑屏、拖动页面进度条等方式进行翻页时查看到了该搜索结果，则该搜索结果对应的曝光次数+1。

而需要说明的是，一个搜索结果的曝光，并不意味着该搜索结果一定会被用户点击进行详细浏览，也就是说，一个搜索结果可能因为用户所执行的翻页操作进入到了该用户的视线中，但是该用户可能并没有点击该搜索结果来浏览该搜索结果的详细信息。所以，上述提到的搜索结果的点击率和曝光率并不是同一概念。

在实际应用中，不同用户在查看同一搜索结果页时，因用户所使用的终端的屏幕规格不同，对该搜索结果页中各搜索结果的浏览情况也将会产生显著的差异，如图2所示。

图2为本说明书提供的不同用户在不同屏幕规格的终端上浏览同一搜索结果页时的情况。

用户A和用户B在各自持有的手机中输入相同的搜索关键词，得到如图2 所示的两个手机界面。图2中左侧的手机界面，为用户A输入搜索关键词后得到的搜索结果，图2中右侧的手机界面，为用户B输入搜索关键词后得到的搜索结果。从这两个手机界面上展示的搜索结果可以看出，由于右侧手机的屏幕分辨率(即屏幕规格)相较于左侧手机的屏幕分辨率较高，所以，右侧手机的屏幕一次所能展示的搜索结果的数量也比左侧手机的屏幕一次所能展示的搜索结果的数量多。

而由于各用户所使用的终端的屏幕规格有所不同，所以，不同用户使用不同屏幕规格的终端查看针对相同搜索对象的搜索结果时，也会因为屏幕规格的不同，对同一搜索结果产生不同的操作结果。例如，对于图2中左侧的手机屏幕来说，用户A会认为首页中展示的这6个商家是相对较优的，所以即使后续通过滑动屏幕进行翻页查看到了商家G以及商家H，可能也不会点击这两个商家的商家链接进行详细浏览。而对于图2中右侧的手机屏幕来说，用户B可能同样会认为首页中展示的这8个商家是相对较优的，所以与用户A相比，用户B点击商家G和商家H的商家链接的可能性要更高一些。从这一示例中可以看出，因为终端的屏幕规格的不同，用户A和用户B对相同的搜索结果(商家G和商家H)可能会产生不同的浏览操作。

所以，为了能够向用户提供更为准确的排序结果，服务器可以结合屏幕规格所带来的影响，来确定各排序位置的影响程度。具体的，在本说明书中，可以通过屏幕规格所带来的影响，搜索结果本身与搜索对象之间的相关性以及排序位置的影响程度，来衡量该排序位置所对应的浏览情况，具体可以参考如下公式：

C(i)＝P(i)*R(i)*S(d)

其中，C(i)用于反映第i个排序位置的浏览情况，P(i)用于表示第i个排序位置的影响程度，R(i)用于表示第i个排序位置上搜索结果与搜索对象的相关性， S(d)用于反映屏幕规格为d的终端对搜索结果被用户所浏览的影响程度。需要说明的是，这里提到的R(i)其实与排序位置本身无关，R(i)主要与排在第i个排序位置上搜索结果本身的相关性有直接关系。

从上述公式中可以看出，本说明书意在确定出每个排序位置的影响程度，即上述公式中的P(i)。而为了确定出P(i)，需要相应的确定出C(i)、R(i)以及S(d)。其中，R(i)可以通过预设的搜索模型确定各搜索结果与搜索对象相关性的方式来进行确定，这一过程为现有的常规技术，在此就不详细赘述了。C(i)可以通过上述获取到的用户的浏览日志来进行确定。具体的，由于C(i)意在反映第i个排序位置的浏览情况，所以，可以通过获取到的浏览日志所统计出的第i个排序位置的点击率、曝光率等数据来进行确定。具体的确定方式可以有很多，可以仅通过点击率来进行确定，也可以通过将第i个排序位置的点击率和曝光率进行加权求和的方式来进行确定，在此就不再详细举例说明了。只需保证C(i) 在数值上的大小与诸如第i个排序位置的点击率、曝光率等能够反映第i个排序位置浏览情况的数据成正相关的关系即可，如，若是通过第i个排序位置的点击率来确定C(i)，则第i个排序位置的点击率越高，C(i)的数值越高。

服务器在确定上述P(i)时，可以针对用户所使用的终端的每种屏幕规格，将上述基准用户组中使用该屏幕规格的终端的用户归为该基准用户组在该屏幕规格下所对应的子基准用户组，以及将一个用户对照组中使用该屏幕规格的终端的用户归为该用户对照组在该屏幕规格下所对应的子用户对照组。即，该子基准用户组和该子用户对照组的用户均使用该屏幕规格的终端。

而后，可以从该子基准用户组中包含的各用户的浏览日志，获取该子基准用户组针对上述基准排序结果的浏览情况，以及从该子用户对照组中包含的各用户的浏览日志，获取该子用户对照组针对该子用户对照组对应的对照排序结果的浏览情况，进而根据获取到的这些用户的浏览情况，来确定出上述P(i)。

S106：根据所述基准排序结果的浏览情况以及所述至少一个对照排序结果的浏览情况，确定针对该搜索对象的排序结果中每个排序位置所对应的位置影响参数。

服务器可以通过获取到的上述各用户的浏览情况，来确定出针对该搜索对象的排序结果中每个排序位置所对应的位置影响参数，还以双列排序样式为例，具体可以参考如下公式：

其中，用于反映使用终端屏幕规格为d的第k-1子用户对照组，对排序位置/>上搜索结果的浏览情况，S(d)用于反映屏幕规格为d的终端对搜索结果被第k-1子用户对照组中的用户所浏览的影响程度，/>为原本位于排序位置/>上的搜索结果与搜索对象之间的相关性。

从这里可以看出，如果不考虑终端的屏幕规格所带来的影响，则只需针对基准排序结果中每个排序位置对划分出相应的用户对照组即可。而若是考虑终端的屏幕规格所带来的影响，则需要进一步地按照每种屏幕规格，在各用户对照组的基础上划分出各子用户对照组。

需要说明的是，这里之所以用到的是排序位置上的搜索结果与搜索对象之间的相关性，主要是因为，对于第k-1子用户对照组来说，该子用户对照组所对应的对照排序结果是将上述基准排序结果中/>排序位置上的搜索结果与/>排序位置上的搜索结果进行了位置调换后得到的。基于此，在上述公式中，原本在基准排序结果中位于/>排序位置上的搜索结果，已经被调换到了/>排序位置上，并且，搜索结果与搜索对象之间的相关性本身也与该搜索结果具体位于的排序位置没有关系，所以，上述公式中关于相关性的一项，应使用该第k-1子用户对照组对应的对照排序结果中，位于第/>排序位置的搜索结果的相关性。

进一步地，服务器获取到的基准用户组中使用屏幕规格为d的子基准用户组的各用户的浏览日志，并通过获取到浏览日志，确定出该子基准用户组针对上述基准排序结果的浏览情况，具体参考如下公式：

其中，反映使用终端屏幕规格为d的第k子基准用户组，对排序位置上搜索结果的浏览情况，S(d)用于反映屏幕规格为d 的终端对搜索结果被第k子基准用户组中的用户所浏览的影响程度，/>用于表示基准排序结果中位于排序位置/>上的搜索结果与搜索对象之间的相关性。

需要说明的是，从上述两个公式中可以看出，一个使用的是关于第k-1子用户对照组的数据，另一个是使用的是第k子基准用户组的数据。这是因为，在实际应用中，S(d)只能抽象的表征出屏幕规格为d的终端对搜索结果被用户所浏览的影响程度，具体的数值确无法确定出来。而从上述两个公式中可以看出，均包含有相同项以及S(d)，所以可以通过这一相同项，对上述两个公式进行组合，以对需要确定出的/>(即/>排序位置的位置影响参数)进行表示，具体参考如下公式：

其中，可以通过上述公式进行表示，而后，可以将/>这两项的乘积用/>和/>进行表示，并得到如下公式：

并最终可以得到如下公式：

从上述公式中可以看出，除了P(S_1,0|d)以外，其他的都可以通过获取到的用户的浏览日志进行确定。而对于P(S_1,0|d)来说，由于S_1,0表示排序结果中的第一个排序位置(无论对于基准排序结果还是对照排序结果来说均是如此)，所以可以对P(S_1,0|d)设置一个默认值，如将其设置为1，而其余位置的均可以通过上述公式依次确定出来。

值得一提的是，从上述过程可以看出，S(d)实际上并没有确定出来，而是通过其他项进行了代替。相当于融合进了最终的公式中，所以，通过上述公式确定出的各排序位置的位置影响参数，实际上还是考虑了屏幕规格所带来的影响。另外，在本说明书中，屏幕规格可以是指用户使用的终端的屏幕分辨率，屏幕尺寸等。

S107：根据所述位置影响参数，对所述排序模型进行训练。

在确定出各排序位置对应的位置影响参数后，服务器可以进一步地针对该搜索对象的排序结果中每个排序位置，根据该排序位置对应的位置影响参数，确定出该排序位置对应的相关性评价参数，进而针对该搜索对象的排序结果中每个排序位置对应的相关性评价参数，对该排序模型进行训练。

在本说明书中，每个排序位置对应的相关性评价参数可以通过归一化折损累计增益(Normalized Discounted Cumulative Gain，NDCG)来进行表示。而需要说明的是，在单列排序样式展示搜索结果的场景下，服务器所使用的排序模型也可以通过参考位置影响因素的NDCG来对排序模型进行训练，具体参考如下公式：

在解释上述公式时，需要先明确一个概念，累计增益(Cumulative Gain， CG)，CG主要考虑的是搜索结果与搜索对象之间的相关性，不考虑排序位置所带来的影响，CG用于表示与针对该搜索对象搜索出的各搜索结果与该搜索对象之间相关性的总和。基于此，折损累计增益DCG其实就是在CG的基础上考虑了排序位置所带来的影响，所以，上述公式中，用于表示了相关性的总和，即CG，而log₂(i+1)即用于表示第i排序位置所带来的影响。

理想折损累计增益IDCG为理想情况下最大的DCG值，即，尽可能的将相关性高的搜索结果排在前面后所确定出的值。从上述公式中可以看出，现有的 NDCG中是考虑排序位置的影响的，但是，多列排序样式和单列排序样式有所不同，单列排序样式中各搜索结果可以理解成严格按照相关性的大小进行排序的，而多列排序样式则不然，用户对位于同一行的搜索结果的关注程度差不多，所以多列排序样式中各排序位置的位置影响参数不能直接套用单列排序样式的位置影响参数。

基于此，在本说明书中，可以用服务器确定出的各排序位置的位置影响参数来表示上述公式中各排序位置的影响程度。具体的，针对每个排序位置，服务器可以根据该排序位置对应的位置影响参数，确定在该排序位置对应的位置影响参数下的DCG，以及确定在该排序位置对应的位置影响参数下的IDCG，而后，根据该DCG以及IDCG，确定该排序位置对应的归一化折损累计增益NDCG。还以双列排序样式为例，具体可以参考如下公式：

通过该公式中可以看出，NDCG中关于排序位置的影响程度是通过服务器确定出的各排序位置的位置影响参数进行表示的，所以，通过得到的NDCG对预设的排序模型进行训练后得到的排序模型，能够结合各排序位置对搜索结果被用户浏览的影响程度，向用户提供更为准确的排序结果，从而有效地提高了用户的搜索体验。

当然，每个排序位置对应的相关性评价参数除了可以用上述提到的NDCG 进行表示外，还可以有其他的表示方式，如，平均精度均值(Mean Average Precision，MAP)，其中，可以将确定出的位置影响参数替换掉MAP中用于表征排序位置的参数，从而得到基于MAP的相关性评价参数。其他的表示方式在此就不详细举例说明了。

在本说明书中，预设的排序模型中所采用的算法可以有多种，如pairwise，listwise等。利用上述相关性评价参数对排序模型进行训练，为现有的常规技术，在此就不详细进行说明了。而服务器将得到的搜索结果返回给用户终端所采用的排序样式，可以双列排序样式、三列排序样式等多列排序样式，本说明书不对多列排序样式的具体形式进行限定。

对于除双列排序样式以外的其他多列排序样式，上述说明的公式应有所变化，以三列排序样式为例，排序位置对应的位置影响参数可以按照如下公式进行表示：

并约定当时，ceil(0)＝1。按照该公式，可以将上述涉及到的各公式进行相应的调整，以使得调整后的公式适用于三列排序样式。其他排序样式所对应的公式在此就不详细举例说明了。

从上述方法中可以看出，由于在对排序模型进行训练的过程中，可以将各排序位置对应的位置影响参数加入到模型训练过程中，这使得训练后的排序模型所输出的排序结果不仅考虑了各搜索结果与用户需要搜索的搜索对象之间的相关性，还考虑了各排序位置对搜索结果所带来的影响，从而有效的提高了排序模型所输出的排序结果的准确性，同时还提高了用户的搜索体验。

需要说明的是，在本说明书中，针对每个用户对照组，该用户对照组在基准排序结果中所对应的排序位置对可以不止一个。例如，对于双列排序样式来说，若是需要通过公式：以及/> 来确定第k组用户对照组在上述基准排序结果中所对应的排序位置对，则可以看出，/>和/>为第k组用户对照组在上述基准排序结果中所对应的一个排序位置对，而/>和第k组用户对照组在上述基准排序结果中所对应的另一个排序位置对。也就是说，第k组用户对照组在上述基准排序结果中对应有两个排序位置对。

以上为本说明书的一个或多个实施例提供的模型训练的方法，基于同样的思路，本说明书还提供了相应的模型训练的装置，如图3所示。

图3为本说明书提供的一种模型训练的装置示意图，具体包括：

第一获取模块301，用于获取各用户发送的各搜索请求；

确定模块302，用于针对所述各搜索请求中包含的每个搜索对象，确定针对该搜索对象的搜索结果；

排序模块303，用于通过预设的排序模型，对该搜索对象的搜索结果按照多列排序样式进行排序，并将得到的排序结果作为基准排序结果；

调整模块304，用于将所述基准排序结果中搜索结果的排序位置进行调整，得到至少一个对照排序结果；

第二获取模块305，用于获取各用户针对所述基准排序结果中搜索结果的浏览情况，作为所述基准排序结果的浏览情况，以及获取各用户针对所述至少一个对照排序结果中搜索结果的浏览情况，作为所述至少一个对照排序结果的浏览情况；

参数确定模块306，用于根据所述基准排序结果的浏览情况以及所述至少一个对照排序结果的浏览情况，确定针对该搜索对象的排序结果中每个排序位置所对应的位置影响参数；

训练模块307，用于根据所述位置影响参数，对所述排序模型进行训练。

可选地，所述调整模块304具体用于，将发送针对该搜索对象的搜索请求的各用户，作为各目标用户；将所述各目标用户进行分组，得到基准用户组以及至少一个用户对照组；针对每个用户对照组，确定该用户对照组在针对该搜索对象的排序结果中所对应的排序位置对；将所述基准排序结果中位于所述排序位置对的搜索结果进行位置交换，得到该用户对照组对应的对照排序结果。

可选地，所述第二获取模块305具体用于，从所述基准用户组中包含的各用户的浏览日志，获取所述基准用户组针对所述基准排序结果的浏览情况，以及从所述至少一个用户对照组中包含的各用户的浏览日志，获取所述至少一个用户对照组针对所述至少一个对照排序结果的浏览情况。

可选地，所述第二获取模块305具体用于，针对用户所使用的终端的每种屏幕规格，将所述基准用户组中使用该屏幕规格的终端的用户归为所述基准用户组在该屏幕规格下所对应的子基准用户组，以及针对每个用户对照组，将该用户对照组中使用该屏幕规格的终端的用户归为该用户对照组在该屏幕规格下所对应的子用户对照组；从所述子基准用户组中包含的各用户的浏览日志，获取所述子基准用户组针对所述基准排序结果的浏览情况，以及从所述子用户对照组中包含的各用户的浏览日志，获取所述子用户对照组针对所述子用户对照组对应的对照排序结果的浏览情况。

可选地，所述参数确定模块306具体用于，根据获取到的所述子基准用户组针对所述基准排序结果的浏览情况，以及获取到的所述子用户对照组针对所述子用户对照组对应的对照排序结果的浏览情况，确定在该屏幕规格下针对该搜索对象的排序结果中每个排序位置所对应的位置影响参数。

可选地，所述训练模块307具体用于，针对该搜索对象的排序结果中每个排序位置，根据该排序位置对应的位置影响参数，确定该排序位置对应的相关性评价参数；针对该搜索对象的排序结果中每个排序位置对应的相关性评价参数，对所述排序模型进行训练。

所述训练模块307具体用于，根据该排序位置对应的位置影响参数，确定在该排序位置对应的位置影响参数下的折损累计增益DCG，以及确定在该排序位置对应的位置影响参数下的理想折损累计增益IDCG；根据所述DCG以及所述IDCG，确定该排序位置对应的NDCG。

本说明书还提供了一种计算机可读存储介质，该存储介质存储有计算机程序，计算机程序可用于执行上述模型训练的方法。

本说明书还提供了图4所示的电子设备的示意结构图。如图4所述，在硬件层面，该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器，当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，以实现上述图1所示的模型训练的方法。当然，除了软件实现方式之外，本说明书并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray， FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、 Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL (RubyHardware Description Language)等，目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、 CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和 /或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/ 或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器 (RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存 (PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器 (CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本说明书的实施例可提供为方法、系统或计算机程序产品。因此，本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、 CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本说明书的实施例而已，并不用于限制本说明书。对于本领域技术人员来说，本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本说明书的权利要求范围之内。

Claims

1.一种模型训练的方法，其特征在于，包括：

获取各用户发送的各搜索请求；

根据所述位置影响参数，对所述排序模型进行训练；

其中，根据所述位置影响参数，对所述排序模型进行训练，包括：

针对该搜索对象的排序结果中每个排序位置对应的相关性评价参数，对所述排序模型进行训练；

其中，所述相关性评价参数包括：

归一化折损累计增益NDCG；

2.如权利要求1所述的方法，其特征在于，将所述基准排序结果中搜索结果的排序位置进行调整，得到至少一个对照排序结果，包括：

3.如权利要求2所述的方法，其特征在于，获取各用户针对所述基准排序结果中搜索结果的浏览情况，作为所述基准排序结果的浏览情况，以及获取各用户针对所述至少一个对照排序结果中搜索结果的浏览情况，作为所述至少一个对照排序结果的浏览情况，包括：

4.如权利要求3所述的方法，其特征在于，从所述基准用户组中包含的各用户的浏览日志，获取所述基准用户组针对所述基准排序结果的浏览情况，以及从所述至少一个用户对照组中包含的各用户的浏览日志，获取所述至少一个用户对照组针对所述至少一个对照排序结果的浏览情况，包括：

5.如权利要求4所述的方法，其特征在于，根据所述基准排序结果对应的浏览情况以及所述至少一个对照排序结果对应的浏览情况，确定针对该搜索对象的排序结果中每个排序位置所对应的位置影响参数，包括：

6.一种模型训练的装置，其特征在于，包括：

第一获取模块，用于获取各用户发送的各搜索请求；

排序模块，用于通过预设的排序模型，对该搜索对象的搜索结果按照多列排序样式进行排序，并将得到的排序结果作为基准排序结果；

训练模块，用于根据所述位置影响参数，对所述排序模型进行训练；

针对该搜索对象的排序结果中每个排序位置对应的相关性评价参数，对所述排序模型进行训练；其中，所述相关性评价参数包括：

归一化折损累计增益NDCG；

7.一种计算机可读存储介质，其特征在于，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述权利要求1-5任一项所述的方法。

8.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现上述权利要求1-5任一项所述的方法。