CN113343130B

CN113343130B - 一种模型训练的方法、信息展示的方法及装置

Info

Publication number: CN113343130B
Application number: CN202110659387.1A
Authority: CN
Inventors: 王步霖; 李悦; 杨一帆
Original assignee: Beijing Sankuai Online Technology Co Ltd
Current assignee: Beijing Sankuai Online Technology Co Ltd
Priority date: 2021-06-15
Filing date: 2021-06-15
Publication date: 2022-07-15
Anticipated expiration: 2041-06-15
Also published as: CN113343130A

Abstract

本说明书公开了一种模型训练的方法、信息展示的方法及装置，并具体公开了，在根据预测的点击率确定向用户展示搜索请求对应的搜索结果时，将针对每个搜索结果，确定在信息展示页面中该搜索结果的预设位置范围内，该搜索结果所归属的对象，与预设位置范围内其他搜索结果所归属的对象之间的区别程度，即，该搜索结果在信息展示页面中对应的多样度，并根据各搜索结果在信息展示页面中对应的多样度，预测各搜索结果对应的点击率，进而可以将更多具有不同特点的搜索结果在展示界面中展示给用户。这样，提高了展示区域的信息的多样性，提升了用户体验。

Description

一种模型训练的方法、信息展示的方法及装置

技术领域

本说明书涉及计算机技术领域，尤其涉及一种模型训练的方法、信息展示的方法及装置。

背景技术

目前，用户可以在诸如智能手机、平板电脑、台式电脑等终端设备，或是终端设备中安装的应用程序中进行信息搜索，服务器则会将与之匹配的搜索结果返回给用户，以供用户浏览。

在现有技术中，在接收到用户的搜索请求后，需要先确定出与该搜索请求相匹配的各搜索结果，而后，可以将这些搜索结果进行排序，并按照排序结果，将这些搜索结果返回给用户。

通常来说，需要将搜索出的这些搜索结果输入到预先训练的排序模型中，以通过排序模型对这些搜索结果进行点击率预测，进而将点击率预测较高的搜索结果在排序结果中进行优先展示。但是在实际应用中，可能会出现排序结果中出自同一处(如相同的商家)的搜索结果进行集中展示，这导致特点相同或相似的搜索结果集中占用了信息展示页面中的较大区域，从而导致这部分区域的信息多样性较差，给用户的信息浏览带来了不便。

发明内容

本说明书提供一种模型训练的方法、信息展示的方法及装置，以部分的解决现有技术存在的上述问题。

本说明书采用下述技术方案：

本说明书提供了一种模型训练的方法，包括：

获取训练样本，所述训练样本中包含有基于搜索请求搜索出的各搜索结果，所述各搜索结果对应的标签信息，所述标签信息用于表征所述各搜索结果对应的实际浏览情况；

针对每个搜索结果，将该搜索结果输入到预设的排序模型中，以使所述排序模型根据确定出的该搜索结果在信息展示页面中对应的多样度，预测该搜索结果对应的预测点击率，所述多样度用于表征在所述信息展示页面中该搜索结果的预设位置范围内，该搜索结果所归属的对象，与所述预设位置范围内其他搜索结果所归属的对象之间的区别程度；

根据所述排序模型所确定出的每个搜索结果对应的预测点击率，确定所述各搜索结果对应的排序结果；

根据所述排序结果与所述标签信息，对所述排序模型进行训练。

可选地，确定该搜索结果在信息展示页面中对应的多样度，具体包括：

确定所述信息展示页面中包含的所有搜索结果所归属的对象的对象数；

根据所述对象数，确定该搜索结果在信息展示页面中对应的多样度。

确定位于所述预设范围内所有搜索结果的排布位置；

根据所述排布位置，确定该搜索结果在信息展示页面中对应的多样度，其中，若是在所述排布位置中，归属相同对象的相邻搜索结果越多，所述多样度越低。

可选地，根据所述排布位置，确定该搜索结果在信息展示页面中对应的多样度，具体包括：

根据所述排布位置，确定归属不同对象的相邻搜索结果之间的公共边界数；

根据所述公共边界数，确定该搜索结果在信息展示页面中对应的多样度。

可选地，将该搜索结果输入到预设的排序模型中，以使所述排序模型根据确定出的该搜索结果在信息展示页面中对应的多样度，预测该搜索结果对应的预测点击率，具体包括：

将该搜索结果输入到预设的排序模型中，以使所述排序模型根据确定出的该搜索结果在信息展示页面中对应的多样度以及该搜索结果对应的相关信息，预测该搜索结果对应的预测点击率，所述相关信息包括该搜索结果对应的相关度、该搜索结果对应的信息优质度以及该搜索结果在所述信息展示页面中的位置中的至少一种，其中

该搜索结果对应的相关度用于表征该搜索结果与所述搜索请求之间的相关性；

该搜索结果对应的信息优质度用于表征该搜索结果对应的搜索内容的优劣程度。

将该搜索结果输入到预设的排序模型中，以使所述排序模型根据所述多样度以及该搜索结果在所述信息展示页面中的不同位置，预测该搜索结果在所述搜索界面中不同位置对应的预测点击率；

根据所述排序模型所确定出的每个搜索结果对应的预测点击率，确定所述各搜索结果对应的排序结果，具体包括：

根据所述排序模型所确定出的每个搜索结果在所述信息展示页面中不同位置上对应的预测点击率，确定针对每个搜索结果所对应的的若干排序结果；

根据所述排序结果与所述标签信息，对所述排序模型进行训练，具体包括：

针对每个搜索结果，确定该搜索结果对应的各排序结果的评价相关参数；

根据所述评价相关参数以及所述标签信息，对所述排序模型进行训练。

可选地，所述评价相关参数包括：第一评价相关参数以及第二评价相关参数中的至少一种，所述第一评价相关参数用于表征在该搜索结果对应的不同排序结果下，所述各搜索结果与所述搜索请求之间的总体相关性的差异，所述第二评价相关参数用于表征在该搜索结果对应的不同排序结果下，所述该搜索结果在所述信息展示页面中对应的多样度的差异；

根据所述评价相关参数、所述排序结果以及所述标签信息，对所述排序模型进行训练，具体包括：

根据所述第一评价相关参数和/或所述第二评价相关参数，确定针对所述排序模型的更新步长参数，其中，在该搜索结果对应的不同排序结果下，所述各搜索结果与所述搜索请求之间的总体相关性的差异越大，所述更新步长参数越大，在该搜索结果对应的不同排序结果下，所述该搜索结果在所述信息展示页面中对应的多样度的差异越大，所述更新步长参数越大；

根据所述更新步长参数以及所述标签信息，对所述排序模型进行训练。

本说明书提供了一种信息展示的方法，包括：

响应于搜索请求，确定所述搜索请求对应的各搜索结果；

将所述各搜索结果输入到预先训练的排序模型中，得到针对所述各搜索结果的排序结果，所述排序模型是通过上述的模型训练方法训练得到的；

根据所述排序结果，向用户进行信息展示。

本说明书提供了一种模型训练的装置，包括：

获取模块，用于获取训练样本，所述训练样本中包含有基于搜索请求搜索出的各搜索结果，所述各搜索结果对应的标签信息，所述标签信息用于表征所述各搜索结果对应的实际浏览情况；

预测模块，用于针对每个搜索结果，将该搜索结果输入到预设的排序模型中，以使所述排序模型根据确定出的该搜索结果在信息展示页面中对应的多样度，预测该搜索结果对应的预测点击率，所述多样度用于表征在所述信息展示页面中该搜索结果的预设位置范围内，该搜索结果所归属的对象，与所述预设位置范围内其他搜索结果所归属的对象之间的区别程度；

排序模块，用于根据所述排序模型所确定出的每个搜索结果对应的预测点击率，确定所述各搜索结果对应的排序结果；

训练模块，用于根据所述排序结果与所述标签信息，对所述排序模型进行训练。

本说明书提供了一种信息展示的装置，包括：

确定模块，用于响应于搜索请求，确定所述搜索请求对应的各搜索结果；

排序模块，用于将所述各搜索结果输入到预先训练的排序模型中，得到针对所述各搜索结果的排序结果，所述排序模型是通过上述的模型训练方法训练得到的；

展示模块，用于根据所述排序结果，向用户进行信息展示。

本说明书提供了一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述模型训练的方法以及信息展示的方法。

本说明书提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述模型训练的方法以及信息展示的方法。

本说明书采用的上述至少一个技术方案能够达到以下有益效果：

在本说明书提供的模型训练的方法以及信息展示的方法中，在基于搜索请求向用户进行信息展示时，将该搜索请求对应的每个搜索结果，输入到预先训练的排序模型中去，以使该排序模型根据该搜索结果在信息展示页面中对应的多样度，预测该搜索结果对应的预测点击率，进而根据各搜索结果对应的预测点击率将各搜索结果进行排序，并根据排序结果向用户进行信息展示。其中，该搜索结果在信息展示页面中对应的多样度，可以表征在信息展示页面中该搜索结果的预设位置范围内，该搜索结果所归属的对象，与预设位置范围内其他搜索结果所归属的对象之间的区别程度。

从上述方法中可以看出，在根据预测的点击率确定向用户展示搜索请求对应的搜索结果时，将针对每个搜索结果，确定在信息展示页面中该搜索结果的预设位置范围内，该搜索结果所归属的对象，与预设位置范围内其他搜索结果所归属的对象之间的区别程度，即，该搜索结果在信息展示页面中对应的多样度，并根据各搜索结果在信息展示页面中对应的多样度，预测各搜索结果对应的点击率，进而可以将更多具有不同特点的搜索结果在展示界面中展示给用户，提高了展示区域的信息的多样性，提升了用户体验。

附图说明

此处所说明的附图用来提供对本说明书的进一步理解，构成本说明书的一部分，本说明书的示意性实施例及其说明用于解释本说明书，并不构成对本说明书的不当限定。在附图中：

图1为本说明书中一种模型训练的方法的流程示意图；

图2为本说明书中在信息展示页面内展示搜索结果的展示界面示意图；

图3为本说明书提供的一种信息展示的方法的流程示意图；

图4为本说明书提供的一种模型训练的装置的示意图；

图5为本说明书提供的一种信息展示的装置的示意图；

图6为本说明书提供的一种对应于图1的电子设备的示意图。

具体实施方式

为使本说明书的目的、技术方案和优点更加清楚，下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本说明书保护的范围。

当前，根据搜索请求搜索并向用户展示的搜索结果存在多样性差的问题，为了解决这一问题，本说明书中提出一种模型训练的方法和信息展示的方法，在通过该信息展示的方法向用户展示搜索结果时，将利用预先训练的排序模型，来预测基于搜索请求所搜索出的各搜索结果对应的点击率，进而根据预测点击率进行排序，得到排序结果，而后基于排序结果，将搜索结果展示给用户。其中，通过该排序模型预测各搜索结果对应的预测点击率时，需要针对每个搜索结果，利用该排序模型，根据确定出的该搜索结果在信息展示页面中对应的多样度，确定该搜索结果对应的预测点击率，该多样度用于表征在信息展示页面中该搜索结果的预设位置范围内，该搜索结果所归属的对象，与预设位置范围内其他搜索结果所归属的对象之间的区别程度，这样，基于预测点击率排序后所展示的搜索结果，将具备更好的多样性，提升用户体验。

下面将先结合附图，详细说明本说明书中涉及到的排序模型的模型训练方案和基于训练后的排序模型进行信息展示的方案。

图1为本说明书中一种模型训练的方法的流程示意图，包括以下步骤：

步骤S100，获取训练样本，所述训练样本中包含有基于搜索请求搜索出的各搜索结果，所述各搜索结果对应的标签信息，所述标签信息用于表征所述各搜索结果对应的实际浏览情况。

本说明书中的模型训练的方法和信息展示的方法执行主体可以是电脑等终端设备，也可是信息展示的业务平台。为了便于描述，本说明书中将仅以执行主体为业务平台为例，进行举例说明。

其中，搜索请求是用户通过持有的终端设备(如手机、平板电脑等)或是终端设备上安装的如客户端、应用(Application，App)等软件，向业务平台发送的。各搜索结果是业务平台接收到用户发送的搜索请求并进行搜索后得到的搜索结果。各搜索结果对应的标签信息，可以用于表征各搜索结果对应的实际浏览情况，如用户是否对搜索结果进行了点击操作等。

实际场景中，搜索请求对应的搜索业务可以是多种多样的，例如，展示商品时，根据用户提供的商品名称，搜索商品名称相关的商品，并向用户展示。其中，搜索请求中携带有用户提供的商品名称，搜索结果为业务平台根据商品名称进行搜索后，确定出的与该商品名称相关的商品。

再例如，展示商品评论分享时，根据用户提供的商品名称，搜索商品名称对应的商品的相关评论，并向用户展示。其中，搜索请求中携带有用户提供的商品名称，搜索结果为业务平台根据商品名称进行搜索后，确定出与该商品名称匹配的商品的评论。

再例如，展示网页时，根据用户提供的关键词，搜索关键词对应的相关网页，并向用户展示。其中，搜索请求中携带有用户提供的关键词，搜索结果为业务平台根据关键词进行搜索后，确定出与关键词匹配的网页的链接。

其他的搜索业务再此就不一一举例说明了。

如此，上述训练样本可以是历史上，业务平台根据用户的搜索请求进行搜索后得到的搜索结果，各搜索结果对应的标签信息则可以是历史上，基于搜索请求，业务平台搜索到的各搜索结果对应的实际浏览情况。

步骤S102，针对每个搜索结果，将该搜索结果输入到预设的排序模型中，以使所述排序模型根据确定出的该搜索结果在信息展示页面中对应的多样度，预测该搜索结果对应的预测点击率，所述多样度用于表征在所述信息展示页面中该搜索结果的预设位置范围内，该搜索结果所归属的对象，与该预设位置范围内其他搜索结果所归属的对象之间的区别程度。

具体实施中，业务平台针对每个搜索结果，将该搜索结果输入到预设的排序模型中，以使该排序模型根据确定出的该搜索结果在信息展示页面中对应的多样度以及该搜索结果对应的相关信息，预测该搜索结果对应的预测点击率。

其中，该搜索结果对应的相关信息可以包括：该搜索结果对应的相关度、该搜索结果对应的信息优质度，以及该搜索结果在信息展示页面中的位置中的至少一种。

该搜索结果对应的相关度，用于表征该搜索结果与搜索请求之间的相关性，该搜索结果与搜索请求之间的相关性越高，该搜索结果对应的预测点击率越高。

该搜索结果对应的信息优质度，用于表征该搜索结果对应的搜索内容的优劣程度，通常情况下，该搜索结果对应的搜索内容的越优质，该搜索结果对应的预测点击率越高。对于每个搜索结果来说，该搜索结果对应的搜索内容的优劣程度，可以与该搜索内容包含的文字数目、图片数目、图像清晰度等参数有关。

例如，在展示商品评论分享时，若基于用户的搜索请求搜索到的搜索结果对应的搜索内容中包含的文字数目越多，则可以看作该搜索结果对应的信息优质度越高。搜索内容中包含的图片数目越多，也可以看作该搜索结果对应的信息优质度越高。同时，搜索内容中包含的图片的清晰度越高，则该搜索结果对应的信息优质度也越高。

该搜索结果在信息展示页面中对应的多样度，用于表征在信息展示页面中该搜索结果的预设位置范围内，该搜索结果所归属的对象，与该预设位置范围内其他搜索结果所归属的对象之间的区别程度。其中，该搜索结果所归属的对象，与该预设位置范围内其他搜索结果所归属的对象之间的区别程度越大，该搜索结果在信息展示页面中对应的多样度越高，该搜索结果对应的预测点击率越高。

其中，针对不同的搜索业务，该搜索结果所归属的对象不尽相同，下面进行举例说明。

沿用上例，在展示商品时，搜索结果所归属的对象，可以指售卖该商品的商家。在展示商品评论分享时，搜索结果所归属的对象，可以指提供该搜索结果中的搜索内容评价的商品的商家。展示网页时，搜索结果所归属的对象，可以指该搜索结果中的搜索内容对应的初始发布者，或者该搜索结果中的搜索内容对应的发布平台。

具体实施中，业务平台可以通过多种方式确定该搜索结果在信息展示页面中对应的多样度，下面将详细举例说明。

多样度确定方式一：

业务平台首先确定在信息展示页面中包含的所有搜索结果所归属的对象的对象数，而后，根据确定出的对象数，确定该搜索结果在信息展示页面中对应的多样度。

其中，该搜索结果在信息展示页面中对应的多样度，可以指在信息展示页面中包含的所有搜索结果所归属的对象的对象数，也可以指在信息展示页面中包含的所有搜索结果所归属的对象的对象数，占该信息展示页面中所能展现的所有搜索结果的数目的比值。

当该搜索结果在信息展示页面中对应的多样度，指在信息展示页面中包含的所有搜索结果所归属的对象的对象数时，可以通过下面的公式表示：

CateNum(q)＝Size(Set(Category))；

其中，q为搜索结果对应的搜索请求；

CateNum(q)表示在信息展示页面中，搜索请求q对应的搜索结果对应的多样度；

Set(Category)表示搜索请求q对应的搜索结果所归属的对象；

Size(Set(Category))表示在信息展示页面中包含的，搜索请求q对应的所有搜索结果所归属的对象的对象数。

例如，在图2所示的信息展示页面中包含有6个搜索结果，这六个搜索结果中有4个搜索结果所归属的对象为对象A，1个搜索结果所归属的对象为对象B，1个搜索结果所归属的对象为对象C，则，针对该信息展示页面内的任意一个搜索结果来说，该搜索结果在信息展示页面中对应的多样度为3。

需要说明的是，在信息展示页面中包含的所有搜索结果所归属的对象的对象数越多，说明该信息展示页面内展示的各搜索结果之间的差异越大，该信息展示页面内展示的各搜索结果对应的搜索内容越丰富，该搜索结果在信息展示页面中对应的多样度越高。信息展示页面中包含的所有搜索结果所归属的对象的对象数越少，该搜索结果在信息展示页面中对应的多样度越低。

多样度确定方式二：

业务平台首先确定位于预设范围内所有搜索结果的排布位置，而后，针对每个搜索结果，根据各搜索结果的排布位置，确定归属不同对象的相邻搜索结果之间的公共边界数，再根据确定出的公共边界数，确定该搜索结果在信息展示页面中对应的多样度。

该搜索结果在信息展示页面中对应的多样度，可以指在信息展示页面中，归属不同对象的相邻搜索结果之间的公共边界数，也可以指在信息展示页面中，归属不同对象的相邻搜索结果之间的公共边界数，与在信息展示页面内，归属不同对象的相邻搜索结果之间的公共边界数所能取得的最大值之间的比值。

当该搜索结果在信息展示页面中对应的多样度，指在信息展示页面中，归属不同对象的相邻搜索结果之间的公共边界数，在信息展示页面内，归属不同对象的相邻搜索结果之间的公共边界数所能取得的最大值之间的比值时，可以通过下面的公式表示：

其中，Entropy(q)表示在信息展示页面中，搜索请求q所对应的搜索结果对应的多样度；

E_chaos表示在信息展示页面中，搜索请求q所对应的搜索结果中归属不同对象的相邻搜索结果之间的公共边界数；

E表示在信息展示页面内，搜索请求q所对应的搜索结果中归属不同对象的相邻搜索结果之间的公共边界数所能取得的最大值。

需要说明的是，若是在该排布位置中，归属相同对象的相邻搜索结果越多，相应地，该搜索结果在信息展示页面中对应的多样度越低。也就是说，在该排布位置中，归属相同对象的相邻搜索结果越多，对于在该信息展示页面内展示的每个搜索结果来说，自身设定范围内其他搜索结果越可能是与自身归属于相同的对象，即自身与相邻的搜索结果之间的差异越小，该信息展示页面内展示的各搜索结果对应的搜索内容越单一，即多样性越低。

例如，在图2所示的两列的信息展示页面中，该信息展示页面内，归属不同对象的相邻搜索结果之间的公共边界数，满足以下公式：

其中，n为该信息展示页面内展示的搜索结果的行数；

E为该信息展示页面内，归属不同对象的相邻搜索结果之间的公共边界数的最大值。

当，业务平台根据搜索请求搜索出的各搜索结果在信息展示页面中的排列方式如图3所示时，该信息展示页面内，归属不同对象的相邻搜索结果之间的公共边界数的最大值为7。而这六个搜索结果中，归属不同对象的相邻搜索结果之间的公共边界数为4，因此，针对该信息展示页面内的任意一个搜索结果来说，该搜索结果在信息展示页面中对应的多样度为4/7。

当然，本说明书中，还可以将上述两种多样度确定方式结合起来使用。例如，业务平台针对每个搜索结果，根据确定出的信息展示页面中包含的所有搜索结果所归属的对象的对象数，确定该搜索结果在信息展示页面中对应的多样度，作为第一多样度，同时，根据位于预设范围内所有搜索结果的排布位置，确定该搜索结果在信息展示页面中对应的第二多样度，作为第二多样度，而后将该第一多样度以及对应设置的权重系数，和第二多样性以及对应设置的权重系数进行加权平均，得到该搜索结果在信息展示页面中对应的综合多样度。

实际应用中，该搜索结果在信息展示页面中对应的综合多样度可以通过如下公式表示：

D(q)＝a×CateNum(q)+(1-a)×Entropy(q)；

其中，D(q)表示搜索结果在信息展示页面中对应的综合多样度；

CateNum(q)表示搜索结果在信息展示页面中对应的第一多样度；

Entropy(q)表示搜索结果在信息展示页面中对应的第二多样度；

a为第一多样度对应设置的权重系数，(1-a)为第二多样度对应设置的权重系数。其中，a取值越大，则确定各搜索结果向用户展示排序结果时，越关注信息展示页面内各搜索结果整体上的多样性；反之，则越关注信息展示页面内任意一个搜索结果与自身相邻的搜索结果之间的差异性。

需要说明的是，上述第一多样度的确定方式与上述多样度确定方式一相似，第二多样度的确定方式与上述多样度确定方式二相似，故确定搜索结果对应的综合多样性时，可以参考上述多样度确定方式一和多样度确定方式二，此处不再详细说明。

综上，将搜索结果输入到预设的排序模型中，由排序模型根据确定出的各搜索结果在信息展示页面中对应的多样度以及各搜索结果对应的相关信息，对各搜索结果对应的点击率进行预测时，排序模型预测各搜索结果对应的预测点击率，可以通过下面的公式表示：

C(i)＝Q×R×P(i)×D(q)；

其中，C(i)为第i个位置的搜索请求q所对应的搜索结果对应的预测点击率；

Q为第i个位置的搜索请求q所对应的搜索结果对应的搜索内容本身的信息优质度；

R为第i个位置的搜索结果对应的搜索内容和搜索请求的相关性；

P(i)为第i个位置对搜索请求q对应的搜索结果的点击率的影响；

D(q)为第i个位置上的搜索请求q所对应的搜索结果在信息展示页面中对应的多样度。

如此，业务平台即可通过预设的排序模型，预测各搜索结果对应的预测点击率。

步骤S104，根据所述排序模型所确定出的每个搜索结果对应的预测点击率，确定所述各搜索结果对应的排序结果。

步骤S106，根据所述排序结果与所述标签信息，对所述排序模型进行训练。

具体实施中，业务平台得到排序模型所确定出的每个搜索结果对应的预测点击率后，将各搜索结果进行排序得到排序结果，再根据该排序结果与标签信息，对排序模型进行训练。

若标签信息为搜索结果对应的实际点击情况，业务平台以最小化排序模型输出的排序结果，与基于实际点击情况确定出的排序结果之间的偏差，对排序模型进行训练，以得到训练后的排序模型。

上述训练过程中，优化模型参数时所采用的更新步长参数是仅基于任意两个搜索结果交换位置后，归一化折损累计增益(Normalized Discounted Cumulative Gain，NDCG)的变化量确定的，该更新步长参数确定公式可以表示为：

其中，s_i表示第i个位置的搜索结果，s_j表示第j个位置的搜索结果，σ表示将第i个位置的搜索结果和第j个位置的搜索结果互换位置时更新步长参数对应的超参数；

|Δ_NDCG|表示将第i个位置的搜索结果和第j个位置的搜索结果互换位置后，各搜索结果与搜索请求之间的总体相关性的差异；

λ_ij为将第i个位置的搜索结果和第j个位置的搜索结果互换位置后，下一步需要针对该排序模型进行模型参数调整时所对应的更新步长参数。其中，NDCG是根据各搜索结果与搜索请求的相关性以及各搜索结果的排序确定的。

由于本说明书中，在确定各搜索结果对应的预测点击率时，还考虑了在信息展示界面各搜索结果对应的多样性，而将任意两个搜索结果交换位置后，在信息展示界面内搜索结果的多样性发生变化，因此，在确定排序模型的更新步长参数时，在考虑到NDCG的变化量的同时，还需要将信息展示界面内搜索结果的多样性考虑在内。

具体的，业务平台对排序模型进行训练时，针对每个搜索结果，将该搜索结果输入到预设的排序模型中，以使排序模型根据该搜索结果在信息展示页面中对应的多样度，该搜索结果对应的相关信息以及该搜索结果在信息展示页面中的不同位置，预测该搜索结果在信息展示页面中不同位置对应的预测点击率，而后，根据排序模型所确定出的每个搜索结果在信息展示页面中不同位置上对应的预测点击率，确定针对每个搜索结果所对应的若干排序结果，最后，针对每个搜索结果，确定该搜索结果对应的各排序结果的评价相关参数，并根据该评价相关参数以及标签信息，对排序模型进行训练。

其中，上述评价相关参数包括：第一评价相关参数和第二评价相关参数中的至少一种。第一评价相关参数，用于表征在该搜索结果对应的不同排序结果下，各搜索结果与搜索请求之间的总体相关性的差异。该第一评价相关参数，可以根据NDCG确定。

第二评价相关参数，用于表征在该搜索结果对应的不同排序结果下，该搜索结果在信息展示页面中对应的多样度的差异。该第二评价相关参数可以根据该搜索结果对应的排序结果发生变更前后，该搜索结果在信息展示页面中对应的多样度的变化量确定的。具体实施中，第二评价相关参数满足以下公式：

|Δ_D|＝|D(before)-D(after)|；

其中，|Δ_D|为该搜索结果对应的第二评价相关参数；

D(before)为该搜索结果对应的排序结果发生变更前，该搜索结果在信息展示页面中对应的多样度；

D(after)为该搜索结果对应的排序结果发生变更后，该搜索结果在信息展示页面中对应的多样度。

进一步地，业务平台确定出第一评价相关参数和第二评价相关参数之后，将根据第一评价相关参数、第二评价相关参数，或者第一评价相关参数和第二评价相关参数，确定针对该排序模型的更新步长参数，以根据该更新步长参数调整模型参数和标签信息，对排序模型进行训练。

其中，在该搜索结果对应的不同排序结果下，各搜索结果与搜索请求之间的总体相关性的差异越大，更新步长参数越大，在该搜索结果对应的不同排序结果下，该搜索结果在信息展示页面中对应的多样度的差异越大，更新步长参数越大。

本说明书中，记第一评价相关参数为|Δ_NDCG|，第二评价相关参数为|Δ_D|时，确定更新步长参数的表达式为：

其中，s_i表示第i个位置的搜索结果，s_j表示第j个位置的搜索结果，σ表示将第i个位置的搜索结果和第j个位置的搜索结果互换位置时更新步长参数时对应的超参数；

|Δ_D|表示将第i个位置的搜索结果和第j个位置的搜索结果互换位置后，排序结果变更前，在信息展示页面中对应的多样度；

λ_ij为将第i个位置的搜索结果和第j个位置的搜索结果互换位置后，下一步需要针对该排序模型进行调整的更新步长参数。

这样，就可以根据确定的更新步长参数，调整排序模型的模型参数，并以最小化排序模型输出的排序结果，与基于用户是否对搜索结果进行了点击操作确定出的排序结果之间的偏差，对排序模型进行训练，以得到训练后的排序模型。

从上述方式可以看出，在模型训练过程中，模型参数逐渐收敛，则意味着模型参数的更新步长也逐渐减小，而为了使得模型参数逐渐收敛，则需要保证|Δ_D|逐渐减小，而保证|Δ_D|逐渐减小的方式，则是需要保证信息展示页面中各搜索结果所归属的对象尽可能都不相同，因为一旦信息展示页面中各搜索结果所归属的对象都不相同，则搜索结果在信息展示页面中互换位置，更换位置前后的多样性也将不会发生变化，所以，通过这种方式所训练出的排序模型，能够尽可能保证信息展示页面中各搜索结果之间的多样性。

通过上述模型训练方法训练出的排序模型后，还可以将训练后的排序模型应用到实际的信息推荐中，本说明书实施例中还提供了该排序模型的使用方法。

如图3所示，本说明书还提供了一种信息展示的方法，具体的流程示意图包括以下步骤：

步骤S300，响应于搜索请求，确定所述搜索请求对应的各搜索结果。

步骤S302，将所述各搜索结果输入到预先训练的排序模型中，得到针对所述各搜索结果的排序结果。

其中，该排序模型是基于上述模型训练方法训练后得到的排序模型。

步骤S304，根据所述排序结果，向用户进行信息展示。

通过上述方案，在根据预测的点击率确定向用户展示搜索请求对应的搜索结果时，将针对每个搜索结果，确定在信息展示页面中该搜索结果的预设位置范围内，该搜索结果所归属的对象，与预设位置范围内其他搜索结果所归属的对象之间的区别程度，即，该搜索结果在信息展示页面中对应的多样度，并根据各搜索结果在信息展示页面中对应的多样度，预测各搜索结果对应的点击率，进而可以将更多具有不同特点的搜索结果在展示界面中展示给用户，提高了展示区域的信息的多样性，提升了用户体验。

需要说明的是，终端设备作为本说明书中模型训练的方法以及信息展示的方法的执行主体时，实现模型训练的方法以及信息展示的方法的业务逻辑与本说明书中业务平台实现模型训练的方法以及信息展示的方法的业务逻辑是基本相同的，故不再一一赘述。

以上为本说明书的一个或多个实施例提供的模型训练的方法以及信息展示的方法，基于同样的思路，本说明书还提供了相应的模型训练的装置以及信息展示的装置，如图4以及图5所示。

图4为本说明书提供的一种模型训练的装置示意图，包括：

获取模块400，用于获取训练样本，所述训练样本中包含有基于搜索请求搜索出的各搜索结果，所述各搜索结果对应的标签信息，所述标签信息用于表征所述各搜索结果对应的实际浏览情况；

预测模块401，用于针对每个搜索结果，将该搜索结果输入到预设的排序模型中，以使所述排序模型根据确定出的该搜索结果在信息展示页面中对应的多样度，预测该搜索结果对应的预测点击率，所述多样度用于表征在所述信息展示页面中该搜索结果的预设位置范围内，该搜索结果所归属的对象，与所述预设位置范围内其他搜索结果所归属的对象之间的区别程度；

排序模块402，用于根据所述排序模型所确定出的每个搜索结果对应的预测点击率，确定所述各搜索结果对应的排序结果；

训练模块403，用于根据所述排序结果与所述标签信息，对所述排序模型进行训练。

可选地，所述装置还包括：

确定模块404，用于确定该搜索结果在信息展示页面中对应的多样度，其中，所述确定模块404具体用于，确定所述信息展示页面中包含的所有搜索结果所归属的对象的对象数；根据所述对象数，确定该搜索结果在信息展示页面中对应的多样度。

可选地，所述确定模块404具体用于，确定位于所述预设范围内所有搜索结果的排布位置；根据所述排布位置，确定该搜索结果在信息展示页面中对应的多样度，其中，若是在所述排布位置中，归属相同对象的相邻搜索结果越多，所述多样度越低。

可选地，所述确定模块404具体用于，根据所述排布位置，确定归属不同对象的相邻搜索结果之间的公共边界数；根据所述公共边界数，确定该搜索结果在信息展示页面中对应的多样度。

可选地，所述预测模块401具体用于，将该搜索结果输入到预设的排序模型中，以使所述排序模型根据确定出的该搜索结果在信息展示页面中对应的多样度以及该搜索结果对应的相关信息，预测该搜索结果对应的预测点击率，所述相关信息包括该搜索结果对应的相关度、该搜索结果对应的信息优质度以及该搜索结果在所述信息展示页面中的位置中的至少一种，其中，该搜索结果对应的相关度用于表征该搜索结果与所述搜索请求之间的相关性；该搜索结果对应的信息优质度用于表征该搜索结果对应的搜索内容的优劣程度。

可选地，所述预测模块401具体用于，将该搜索结果输入到预设的排序模型中，以使所述排序模型根据所述多样度以及该搜索结果在所述信息展示页面中的不同位置，预测该搜索结果在所述搜索界面中不同位置对应的预测点击率；

所述排序模块402具体用于，根据所述排序模型所确定出的每个搜索结果在所述信息展示页面中不同位置上对应的预测点击率，确定针对每个搜索结果所对应的的若干排序结果；

所述训练模块403具体用于，针对每个搜索结果，确定该搜索结果对应的各排序结果的评价相关参数；根据所述评价相关参数以及所述标签信息，对所述排序模型进行训练。

所述训练模块403具体用于，根据所述第一评价相关参数和/或所述第二评价相关参数，确定针对所述排序模型的更新步长参数，其中，在该搜索结果对应的不同排序结果下，所述各搜索结果与所述搜索请求之间的总体相关性的差异越大，所述更新步长参数越大，在该搜索结果对应的不同排序结果下，所述该搜索结果在所述信息展示页面中对应的多样度的差异越大，所述更新步长参数越大；根据所述更新步长参数以及所述标签信息，对所述排序模型进行训练。

图5为本说明书提供的一种信息展示的装置示意图，包括：

确定模块501，用于响应于搜索请求，确定所述搜索请求对应的各搜索结果；

排序模块502，用于将所述各搜索结果输入到预先训练的排序模型中，得到针对所述各搜索结果的排序结果，所述排序模型是通过上述的模型训练方法训练得到的；

展示模块503，用于根据所述排序结果，向用户进行信息展示。

本说明书还提供了一种计算机可读存储介质，该存储介质存储有计算机程序，计算机程序可用于执行上述图1提供的一种模型训练的方法以及信息展示的方法。

本说明书还提供了图6所示的一种对应于图1的电子设备的示意结构图。如图6所述，在硬件层面，该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器，当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，以实现上述图1所述的模型训练的方法以及信息展示的方法。当然，除了软件实现方式之外，本说明书并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray，FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等，目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本说明书的实施例可提供为方法、系统、或计算机程序产品。因此，本说明书可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本说明书的实施例可提供为方法、系统或计算机程序产品。因此，本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本说明书的实施例而已，并不用于限制本说明书。对于本领域技术人员来说，本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本说明书的权利要求范围之内。

Claims

1.一种模型训练的方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，确定该搜索结果在信息展示页面中对应的多样度，具体包括：

3.如权利要求1或2所述的方法，其特征在于，确定该搜索结果在信息展示页面中对应的多样度，具体包括：

确定位于所述预设范围内所有搜索结果的排布位置；

4.如权利要求3所述的方法，其特征在于，根据所述排布位置，确定该搜索结果在信息展示页面中对应的多样度，具体包括：

5.如权利要求1所述的方法，其特征在于，将该搜索结果输入到预设的排序模型中，以使所述排序模型根据确定出的该搜索结果在信息展示页面中对应的多样度，预测该搜索结果对应的预测点击率，具体包括：

6.如权利要求1或5所述的方法，其特征在于，将该搜索结果输入到预设的排序模型中，以使所述排序模型根据确定出的该搜索结果在信息展示页面中对应的多样度，预测该搜索结果对应的预测点击率，具体包括：

将该搜索结果输入到预设的排序模型中，以使所述排序模型根据所述多样度以及该搜索结果在所述信息展示页面中的不同位置，预测该搜索结果在所述信息展示页面中不同位置对应的预测点击率；

根据所述排序模型所确定出的每个搜索结果在所述信息展示页面中不同位置上对应的预测点击率，确定针对每个搜索结果所对应的若干排序结果；

7.如权利要求6所述的方法，其特征在于，所述评价相关参数包括：第一评价相关参数以及第二评价相关参数中的至少一种，所述第一评价相关参数用于表征在该搜索结果对应的不同排序结果下，所述各搜索结果与所述搜索请求之间的总体相关性的差异，所述第二评价相关参数用于表征在该搜索结果对应的不同排序结果下，该搜索结果在所述信息展示页面中对应的多样度的差异；

根据所述第一评价相关参数和/或所述第二评价相关参数，确定针对所述排序模型的更新步长参数，其中，在该搜索结果对应的不同排序结果下，所述各搜索结果与所述搜索请求之间的总体相关性的差异越大，所述更新步长参数越大，在该搜索结果对应的不同排序结果下，该搜索结果在所述信息展示页面中对应的多样度的差异越大，所述更新步长参数越大；

8.一种信息展示的方法，其特征在于，包括：

响应于搜索请求，确定所述搜索请求对应的各搜索结果；

将所述各搜索结果输入到预先训练的排序模型中，得到针对所述各搜索结果的排序结果，所述排序模型是通过上述权利要求1～7任一项方法训练得到的；

根据所述排序结果，向用户进行信息展示。

9.一种模型训练的装置，其特征在于，包括：

10.一种信息展示的装置，其特征在于，包括：

排序模块，用于将所述各搜索结果输入到预先训练的排序模型中，得到针对所述各搜索结果的排序结果，所述排序模型是通过上述权利要求1～7任一项方法训练得到的；

展示模块，用于根据所述排序结果，向用户进行信息展示。

11.一种计算机可读存储介质，其特征在于，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述权利要求1～7或8任一项所述的方法。

12.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现上述权利要求1～7或8任一项所述的方法。