CN113688335B

CN113688335B - 排序理由生成方法、装置、电子设备及存储介质

Info

Publication number: CN113688335B
Application number: CN202110838625.5A
Authority: CN
Inventors: 易根良; 王洪雨; 温皓星; 李玉国; 石晓巍; 翟艺涛; 郑刚
Original assignee: Beijing Sankuai Online Technology Co Ltd
Current assignee: Beijing Sankuai Online Technology Co Ltd
Priority date: 2021-07-23
Filing date: 2021-07-23
Publication date: 2023-09-01
Anticipated expiration: 2041-07-23
Also published as: CN113688335A

Abstract

本公开实施例提供了一种排序理由生成方法、装置、电子设备及存储介质。排序理由生成方法包括：获取用户输入的搜索信息对应的候选对象；基于候选对象的特征生成候选对象的候选排序理由，并获取用户对候选对象的偏好信息；基于偏好信息，从所述候选排序理由中选取所述候选对象的待展示排序理由。本公开实施例能够基于候选对象自身的特征以及用户对候选对象的偏好信息确定候选对象的待展示排序理由，以使在向用户展示候选对象的同时展示该候选对象的待展示排序理由，待展示排序理由能够解释该候选对象的排序顺序产生的原因，以使用户能够更直观地理解排序原因，增加排序结果的可信度，提升搜索系统的透明度，提高用户对平台的信任度和接受程度。

Description

排序理由生成方法、装置、电子设备及存储介质

技术领域

本公开涉及计算机技术领域，特别是涉及一种排序理由生成方法、装置、电子设备及存储介质。

背景技术

随着互联网技术的迅猛发展，用户要在信息海洋里查找自己所需的信息，就像大海捞针一样，搜索引擎技术恰好解决了这一难题。搜索引擎是根据用户需求与一定算法，运用特定策略检索出指定信息并反馈给用户的一门检索技术。

在搜索过程中，通常是基于特定规则策略实现召回，然后对召回的对象进行排序，之后选择排序靠前的部分对象推荐给用户。在搜索排序环节，对象之间的排序顺序存在一定的未知性，即便考虑了个性化因素，但因为没有针对排序顺序的可解释性信息，因此用户仍然难以理解产生该排序顺序的原因，导致排序结果的可信度较低。

发明内容

鉴于上述问题，本公开实施例提出了克服上述问题或者至少部分地解决上述问题的一种排序理由生成方法、装置、电子设备及存储介质。

根据本公开的实施例的第一方面，提供了一种排序理由生成方法，包括：

获取用户输入的搜索信息对应的候选对象；

基于所述候选对象的特征生成所述候选对象的候选排序理由，并获取所述用户对所述候选对象的偏好信息；

基于所述偏好信息，从所述候选排序理由中选取所述候选对象的待展示排序理由。

可选地，所述基于所述候选对象的特征生成所述候选对象的候选排序理由，包括：针对所述候选对象的每个特征，判断是否满足预设的当前特征对应的排序理由的生成条件；在满足所述生成条件的情况下，将所述当前特征对应的排序理由作为所述候选对象的候选排序理由；其中，所述生成条件与所述当前特征的参数相关，或者与所述当前特征的参数和其余至少一个特征的参数相关，所述参数包括数值和/或排名。

可选地，所述获取所述用户对所述候选对象的偏好信息，包括：获取所述用户维度的第一信息和所述候选对象维度的第二信息；将所述第一信息和所述第二信息输入预先训练的偏好模型，得到所述偏好模型的输出结果，所述输出结果表征所述用户对所述候选对象在各特征上的偏好程度。

可选地，所述偏好模型通过如下方式训练：获取样本数据；所述样本数据包括样本用户维度的第一样本信息，样本对象维度的第二样本信息，以及样本标签，所述样本标签表征所述样本用户对所述样本对象在各特征上的实际偏好程度；利用所述样本数据对预设的待训练模型进行训练；其中，所述待训练模型的输入为所述第一样本信息和所述第二样本信息，输出为所述样本用户对所述样本对象在各特征上的预测偏好程度；基于所述实际偏好程度和所述预测偏好程度判断出训练完成后，将训练完成的模型作为所述偏好模型。

可选地，所述样本标签通过如下方式得到：针对所述样本对象的每个特征，判断是否满足预设的当前特征对应的排序理由的生成条件；在满足所述生成条件的情况下，将所述样本用户对所述样本对象在所述当前特征上的实际偏好程度标注为感兴趣。

可选地，所述候选排序理由包括至少一个特征对应的排序理由；所述偏好信息包括所述用户对所述候选对象在各特征上的偏好程度；所述基于所述偏好信息，从所述候选排序理由中选取所述候选对象的待展示排序理由，包括：按照所述偏好程度对所述候选排序理由进行降序排序；选取排序在前的至少一个候选排序理由作为所述待展示排序理由。

可选地，所述候选对象为排序后的候选对象；所述基于所述候选对象的特征生成所述候选对象的候选排序理由，并获取所述用户对所述候选对象的偏好信息，包括：针对排序在前的至少一个候选对象，基于所述候选对象的特征生成所述候选对象的候选排序理由，并获取所述用户对所述候选对象的偏好信息。

根据本公开的实施例的第二方面，提供了一种排序理由生成装置，包括：

对象获取模块，用于获取用户输入的搜索信息对应的候选对象；

理由生成模块，用于基于所述候选对象的特征生成所述候选对象的候选排序理由；

偏好获取模块，用于获取所述用户对所述候选对象的偏好信息；

理由选择模块，用于基于所述偏好信息，从所述候选排序理由中选取所述候选对象的待展示排序理由。

可选地，所述理由生成模块包括：条件判断单元，用于针对所述候选对象的每个特征，判断是否满足预设的当前特征对应的排序理由的生成条件；理由确定单元，用于在满足所述生成条件的情况下，将所述当前特征对应的排序理由作为所述候选对象的候选排序理由；其中，所述生成条件与所述当前特征的参数相关，或者与所述当前特征的参数和其余至少一个特征的参数相关，所述参数包括数值和/或排名。

可选地，所述偏好获取模块包括：信息获取单元，用于获取所述用户维度的第一信息和所述候选对象维度的第二信息；模型预测单元，用于将所述第一信息和所述第二信息输入预先训练的偏好模型，得到所述偏好模型的输出结果，所述输出结果表征所述用户对所述候选对象在各特征上的偏好程度。

可选地，所述偏好模型通过如下模块训练：样本获取模块，用于获取样本数据；所述样本数据包括样本用户维度的第一样本信息，样本对象维度的第二样本信息，以及样本标签，所述样本标签表征所述样本用户对所述样本对象在各特征上的实际偏好程度；模型训练模块，用于利用所述样本数据对预设的待训练模型进行训练；其中，所述待训练模型的输入为所述第一样本信息和所述第二样本信息，输出为所述样本用户对所述样本对象在各特征上的预测偏好程度；模型确定模块，用于基于所述实际偏好程度和所述预测偏好程度判断出训练完成后，将训练完成的模型作为所述偏好模型。

可选地，所述候选排序理由包括至少一个特征对应的排序理由；所述偏好信息包括所述用户对所述候选对象在各特征上的偏好程度；所述理由选择模块包括：理由排序单元，用于按照所述偏好程度对所述候选排序理由进行降序排序；理由选取单元，用于选取排序在前的至少一个候选排序理由作为所述待展示排序理由。

可选地，所述候选对象为排序后的候选对象；所述理由生成模块，具体用于针对排序在前的至少一个候选对象，基于所述候选对象的特征生成所述候选对象的候选排序理由；所述偏好获取模块，具体用于针对排序在前的至少一个候选对象，获取所述用户对所述候选对象的偏好信息。

根据本公开的实施例的第三方面，提供了一种电子设备，包括：一个或多个处理器；和其上存储有指令的一个或多个计算机可读存储介质；当所述指令由所述一个或多个处理器执行时，使得所述处理器执行如上任一项所述的排序理由生成方法。

根据本公开的实施例的第四方面，提供了一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序被处理器执行时，使得所述处理器执行如上任一项所述的排序理由生成方法。

本公开实施例提供了一种排序理由生成方法、装置、电子设备及存储介质。在搜索过程中，获取用户输入的搜索信息对应的候选对象；基于所述候选对象的特征生成所述候选对象的候选排序理由，并获取所述用户对所述候选对象的偏好信息；基于所述偏好信息，从所述候选排序理由中选取所述候选对象的待展示排序理由。由此可知，本公开实施例中，能够基于候选对象自身的特征以及用户对候选对象的偏好信息，确定候选对象的待展示排序理由，以使在向用户展示候选对象的同时展示该候选对象的待展示排序理由，待展示排序理由能够解释该候选对象的排序顺序产生的原因，以使用户能够更直观地理解排序原因，增加排序结果的可信度，提升搜索系统的透明度，提高用户对平台的信任度和接受程度。

附图说明

为了更清楚地说明本公开的实施例的技术方案，下面将对本公开的实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的实施例的一些附图，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本公开实施例的一种排序理由生成方法的步骤流程图。

图2是本公开实施例的一种排序理由生成过程的示意图。

图3是本公开实施例的一种排序理由生成装置的结构框图。

图4是本公开实施例的一种排序理由生成装置的结构框图。

具体实施方式

下面将结合本公开的实施例中的附图，对本公开的实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例只是本公开的一部分实施例，而不是本公开的全部实施例。基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

本公开实施例中的排序理由生成方法可以应用于搜索场景中。在搜索过程中，用户在客户端输入搜索信息(Query)，客户端将搜索信息发送至搜索服务器。搜索服务器基于搜索信息执行召回过程，在召回过程中从数据库存储的对象中召回多个候选对象。搜索服务器对召回的候选对象执行排序过程，然后从排序结果中提取排序靠前的多个对象推荐给用户。

可选地，在召回过程中，可以通过任何适用的方式执行召回，本公开实施例对此不做限制。例如，可以基于用户输入的搜索信息、用户画像等信息，通过任何适用方式(比如召回模型等)获取各个对象与搜索信息的匹配程度，进而将匹配程序超过预设阈值的对象作为召回结果，等等。

可选地，在排序过程中，可以通过任何适用的方式执行排序，本公开实施例对此不做限制。例如，可以利用预先基于用户日志进行机器学习或深度学习训练后得到的排序模型对召回结果进行排序，等等。其中，用户输入的搜索信息、推荐的对象、用户行为数据等均可以作为用户日志。

本公开实施例中的排序理由生成方法可以应用于搜索服务器在搜索过程中的排序环节。

参照图1，示出了本公开实施例的一种排序理由生成方法的步骤流程图。

如图1所示，排序理由生成方法可以包括以下步骤：

步骤101，获取用户输入的搜索信息对应的候选对象。

搜索服务器接收到用户输入的搜索信息后，基于搜索信息执行召回过程，召回搜索信息对应的候选对象，然后对搜索信息对应的候选对象执行排序过程。本步骤中，获取的搜索信息对应的候选对象可以为召回但还未进行排序的候选对象，也可以为召回并进行排序后的候选对象。

可选地，候选对象可以为POI(Point of Interest，兴趣点)。POI可以包括但不限于：酒店、商场、景点、饭店、超市、公园、车站、机场、写字楼、小区，等等。

步骤102，基于所述候选对象的特征生成所述候选对象的候选排序理由，并获取所述用户对所述候选对象的偏好信息。

可选地，候选对象的特征可以为能够影响候选对象的排序顺序的特征。候选对象的特征可以包括但不限于：CTR(Click Through Rate，点击率)、CVR(Click Value Rate，转化率)、评分、距离、价格、相似度，等等。其中，距离可以指候选对象与用户当前位置之间的距离，相似度可以指候选对象与用户历史选定的对象之间的相似度。相似度可以基于任意适用的相似度计算模型进行计算，也可以基于统计学的计算方式进行计算，本公开实施例对此不做限制。

可选地，排序理由可以解释候选对象的排序顺序产生的原因。排序理由可以包括但不限于：优质对象、好评对象、性价比对象、附近对象、猜你喜欢对象，等等。

基于候选对象的特征可以生成候选对象的候选排序理由，基于用户的信息和候选对象的信息可以获取用户对候选对象的偏好信息，对于具体的过程，将在下面的实施例中详细介绍。

步骤103，基于所述偏好信息，从所述候选排序理由中选取所述候选对象的待展示排序理由。

基于用户对候选对象的偏好信息，可以从候选对象的候选排序理由中选取候选对象的待展示排序理由。搜索服务器在将候选对象推荐给用户时，可以将候选对象的待展示排序理由一同推荐给用户，以便客户端在向用户展示候选对象的时，一同展示候选对象的待展示排序理由，以使用户能够更直观地理解该候选对象的排序原因。

本公开实施例中，能够基于候选对象自身的特征以及用户对候选对象的偏好信息，确定候选对象的待展示排序理由，以使在向用户展示候选对象的同时展示该候选对象的待展示排序理由，待展示排序理由能够解释该候选对象的排序顺序产生的原因，以使用户能够更直观地理解排序原因，增加排序结果的可信度，提升搜索系统的透明度，提高用户对平台的信任度和接受程度。

参照图2，示出了本公开实施例的一种排序理由生成过程的示意图。

如图2所示，排序理由生成过程可以包括以下几个部分：理由生成器、偏好模型、理由选择器。下面，分别对三个部分进行详细说明。

1、理由生成器

理由生成器用于针对用户输入的搜索信息对应的候选对象，基于所述候选对象的特征生成所述候选对象的候选排序理由。

可选地，基于所述候选对象的特征生成所述候选对象的候选排序理由的过程，可以包括：针对所述候选对象的每个特征，判断是否满足预设的当前特征对应的排序理由的生成条件；在满足当前特征对应的排序理由的生成条件的情况下，将所述当前特征对应的排序理由作为所述候选对象的候选排序理由。

针对候选对象的每个特征，可以预先设置该特征对应的排序理由，以及该排序理由的生成条件。其中，该特征对应的排序理由的生成条件与该特征的参数相关，或者与该特征的参数和除该特征之外的其他至少一个特征的参数相关。

可选地，所述参数包括数值和/或排名，“和/或”表示两者中的至少一个。其中，排名可以指该特征的数值在全部候选对象的该特征的数值中的排名。针对一个候选对象的某个特征，可以计算该特征的数值在需要生成候选排序理由的全部候选对象的该特征的数值中的排名，也就是list(序列)化计算。比如，需要生成候选排序理由的有200个候选对象，候选对象A与用户当前位置之间的距离最近，因此候选对象A的距离特征的排名为第1，候选对象B与用户当前位置之间的距离最远，因此候选对象B的距离特征的排名为第200，此时如果用户选定候选对象A很有可能是因为距离近这一原因。

为了保证排序理由的合理性，在设定排序理由的生成条件时，可以对特征的参数进行一些限定。可选地，某个特征的排序理由的生成条件可以为该特征的数值满足预设的阈值条件，并且该特征的排名满足预设的排名条件；再比如，某个特征的排序理由的生成条件可以为该特征的数值满足预设的第一阈值条件，并且该特征的排名满足预设的排名条件，并且除该特征之外的其他至少一个特征的数值满足预设的第二阈值条件，等等。

比如，针对特征排名在TOPK(K为正整数)的候选对象才有机会展示排序理由，同时还需要特征的数值满足一定阈值，比如距离都是10km，那所有候选对象都没必要生成距离对应的排序理由，所以距离对应的排序理由可以针对附近预设距离(比如1km、2km等)以内的候选对象有机会展示排序理由。同理，对不同的特征均可进行排名并根据特征数值选择是否生成对应的排序理由。

比如，在实际业务中，可以设置如下排序理由及排序理由的生成条件：

CTR/CVR特征对应的排序理由可以为优质对象，该排序理由的生成条件可以为：CTR/CVR>0.2&&评分>＝4&&CTR排名TOP10。

距离特征对应的排序理由可以为附近对象，该排序理由的生成条件可以为：距离<1km&&评分>＝4&&距离排名TOP10。

评分特征对应的排序理由可以为好评对象，该排序理由的生成条件可以为：评分>＝4&&评分排名TOP10。

价格特征对应的排序理由可以为性价比对象，该排序理由的生成条件可以为：价格排名TOP10&&评分>＝4。

相似度特征对应的排序理由可以为猜你喜欢对象，该排序理由的生成条件可以为：相似度排序TOP10&&评分>＝4。

在实际应用中，为了增加排序理由的多样性，可以结合业务构造不同描述方式的排序理由及生成条件，本公开实施例对此不做限制。

2、偏好模型

偏好模型用于针对用户输入的搜索信息对应的候选对象，获取所述用户对所述候选对象的偏好信息。

基于候选对象的特征对用户偏好进行分类，可以对应到用户对每个特征的偏好。比如，候选对象的特征包括：CTR/CVR、距离、评分、价格、相似度，相应地，可以偏好可以包括：偏好高CTR/CVR对象，偏好附近对象，偏好高评分对象，偏好高性价比对象，偏好与历史选定对象高相似度对象。这些维度的特征在偏好模型中权重比较高，结合业务理解进行选择，当候选对象排名靠前，并且这些特征比较强的时候，可以通过显示文案展示给用户，能够更有效的帮助用户决策。

预先训练偏好模型，偏好模型用于预测用户对候选对象在各特征上的偏好程度。

可选地，偏好模型可以通过如下步骤A1～A3训练：

步骤A1，获取样本数据。

获取历史用户数据，基于历史用户数据构建样本集。

样本数据可以包括样本用户维度的第一样本信息，样本对象维度的第二样本信息，以及样本标签。其中，样本对象可以指样本用户在搜索后选定的对象。

样本用户维度的第一样本信息可以包括但不限于以下至少一种：样本用户当次搜索输入的搜索信息、样本用户的实时偏好信息(比如当次搜索选定的特征，特征可以包括价格、位置、类型等)、样本用户的历史偏好信息(比如当次之前的历史搜索选定的对象信息，对象信息可以包括对象的类型、评分、价格、标识等)、样本用户的画像信息(比如用户的标识、性别、年龄、爱好等)、样本用户当次搜索的上下文信息(比如搜索时间、搜索时的用户位置等)，等等。

样本对象维度的第二样本信息包括但不限于以下至少一种：样本对象的标识、样本对象的特征(比如CTR、CVR、评分、类型)，等等。

样本标签表征所述样本用户对所述样本对象在各特征上的实际偏好程度。可选地，所述样本标签通过如下方式得到：针对所述样本对象的每个特征，判断是否满足预设的当前特征对应的排序理由的生成条件；在满足所述生成条件的情况下，将所述样本用户对所述样本对象在所述当前特征上的实际偏好程度标注为感兴趣(比如标注为1等)；在不满足所述生成条件的情况下，将所述样本用户对所述样本对象在所述当前特征上的实际偏好程度标注为不感兴趣(比如标注为0等)。对于具体的过程，可以参照上述理由生成器部分的相关描述，本公开实施例在此不再详细论述。

步骤A2，利用所述样本数据对预设的待训练模型进行训练；其中，所述待训练模型的输入为所述第一样本信息和所述第二样本信息，输出为所述样本用户对所述样本对象在各特征上的预测偏好程度。

待训练模型可以采用任意适用的具有分类功能的模型进行建模。待训练模型可以为多标签多分类模型，也可以为单标签多分类模型，等等。可选地，待训练模型可以包括但不限于：DNN(Deep Neural Networks，深度神经网络)、XGB(eXtreme Gradient Boosting，极端梯度提升)等机器学习模型结构。

将所述第一样本信息和所述第二样本信息输入待训练模型，在待训练模型的网络结构中对输入的信息进行处理，然后在softmax层可以预测得到样本用户对所述样本对象在各特征上的预测偏好程度，待训练模型输出这些预测偏好程度。可选地，偏好程度可以为偏好分数(score)。

步骤A3，基于所述实际偏好程度和所述预测偏好程度判断出训练完成后，将训练完成的模型作为所述偏好模型。

可选地，基于所述实际偏好程度和所述预测偏好程度，可以计算模型的损失函数。损失函数是用来估量模型的预测值与真实值的不一致程度。若损失函数很小，表明机器学习模型与数据真实分布很接近，则模型性能良好；若损失函数很大，表明机器学习模型与数据真实分布差别较大，则模型性能不佳。训练模型的主要任务就是使用优化方法来寻找损失函数最小化对应的模型参数。因此，在损失函数达到优化目标(比如损失函数小于一定阈值)的情况下，可以确定训练完成；在损失函数未达到优化目标的情况下，可以确定训练未完成。可选地，损失函数可以包括但不限于：交叉熵损失函数、指数损失函数、对数损失函数，等等。

在判断出训练完成后，将训练完成的模型作为所述偏好模型。在判断出训练未完成后，可以更新模型的参数，继续进行训练，直到训练完成。

获取到用户输入的搜索信息对应的候选对象后，可以基于偏好模型获取所述用户对所述候选对象的偏好信息。

可选地，获取所述用户对所述候选对象的偏好信息的过程，可以包括如下步骤B1～B2：

步骤B1，获取所述用户维度的第一信息和所述候选对象维度的第二信息。

与上述步骤A1的描述类似，用户维度的第一样本信息可以包括但不限于以下至少一种：用户当次搜索输入的搜索信息、用户的实时偏好信息(比如当次搜索选定的特征，特征可以包括价格、位置、类型等)、用户的历史偏好信息(比如当次之前的历史搜索选定的对象信息，对象信息可以包括对象的类型、评分、价格、标识等)、用户的画像(UPS)信息(比如用户的标识、性别、年龄、爱好等)、用户当次搜索的上下文(Context)信息(比如搜索时间、搜索时的用户位置等)，等等。候选对象维度的第二样本信息包括但不限于以下至少一种：候选对象的标识、候选对象的特征(比如CTR、CVR、评分、类型)，等等。

步骤B2，将所述第一信息和所述第二信息输入预先训练的偏好模型，得到所述偏好模型的输出结果，所述输出结果表征所述用户对所述候选对象在各特征上的偏好程度。

3、理由选择器

理由选择器用于针对用户输入的搜索信息对应的候选对象，基于所述用户对所述候选对象的偏好信息，从所述候选对象的候选排序理由中选取所述候选对象的待展示排序理由。

在实现中，可以针对不同的候选对象选择不同的待展示排序理由。比如，候选对象A和候选对象B排在TOP2，用户选定候选对象A可能是因为候选对象A与用户历史选定的候选对象相似度高，符合用户预期；而如果用户选定候选对象B，虽然候选对B与用户历史选定的候选对象相似度不高，但是有可能是因为候选对象B的价格更符合用户的期望。因此，在选择待展示排序理由时，可以结合用户对对候选对象的各特征的不同偏好程度以及候选对象拥有的候选排序理由进行选择。待展示排序理由选择的过程中，可以根据偏好程度的概率分布来选择，以不同概率展示不同待展示排序理由，增加可解释性理由的多样性。

经过上述描述可知，候选对象的候选排序理由包括至少一个特征对应的排序理由，用户对候选对象的偏好信息包括所述用户对所述候选对象在各特征上的偏好程度。可选地，基于所述偏好信息，从所述候选排序理由中选取所述候选对象的待展示排序理由的过程，可以包括：按照所述偏好程度对所述候选排序理由进行降序排序；选取排序在前的至少一个候选排序理由作为所述待展示排序理由。

如图2所示，候选对象的CTR/CVR特征对应理由1，距离特征对应理由2，评分特征对应理由3，价格特征对应理由4，相似度特征对应理由5。理由生成器经过判断后，针对候选对象的CTR/CVR特征可以确定不生成理由1(图2中的理由生成器部分未示出)，针对距离特征可以确定生成理由2，针对评分特征可以确定生成理由3，针对价格特征可以确定不生成理由4(图2中的理由生成器部分未示出)，针对相似度特征可以确定生成理由5。偏好模型经过预测后，可以得到用户对候选对象的CTR/CVR特征的偏好程度为score1(也即s1)，对距离特征的偏好程度为score2(也即s2)，对评分特征的偏好程度为score3(也即s3)，对价格特征的偏好程度为score4(也即s4)，对相似度特征的偏好程度为score5(也即s5)。理由选择器基于理由生成器得到的候选排序理由和偏好模型得到的偏好程度，可以确定理由2的展示概率为P(0.3)，理由3的展示概率为P(0.2)，理由5的展示概率为P(0.1)，因此可以选择展示概率高的至少一个候选排序理由作为待展示排序理由。其中，展示概率与对应的偏好程度相同。

在一种可选实施方式中，为了突出头部结果的可解释性，对于排序模型预测分数较低，排名靠后的候选对象可以不展示可解释性文案。因此，在候选对象为排序后的候选对象的情况下，针对排序在前的至少一个候选对象，基于所述候选对象的特征生成所述候选对象的候选排序理由，并获取所述用户对所述候选对象的偏好信息。比如，针对排序在前的20个候选对象展示排序理由，针对排序在后面的其他候选对象不展示排序理由。

本公开实施例中，通过结合用户偏好、排序模型的预测分数和排序模型核心特征显性化三大因素，能够让用户更直观的感受到个性化排序的排序逻辑，提高用户对个性化排序的接受程度，说服用户选定相关对象，甚至能够加强用户对平台的信任。通过结合排序核心特征与展示文案，有助解决排序黑盒问题，结合用户个性化信息，强化用户偏好类因素，能够更有效地向用户解释排序原因。

参照图3，示出了本公开实施例的一种排序理由生成装置的结构框图。

如图3所示，排序理由生成装置可以包括以下模块：

排序理由生成装置，其特征在于，包括：

对象获取模块301，用于获取用户输入的搜索信息对应的候选对象；

理由生成模块302，用于基于所述候选对象的特征生成所述候选对象的候选排序理由；

偏好获取模块303，用于获取所述用户对所述候选对象的偏好信息；

理由选择模块304，用于基于所述偏好信息，从所述候选排序理由中选取所述候选对象的待展示排序理由。

参照图4，示出了本公开实施例的一种排序理由生成装置的结构框图。

如图4所示，排序理由生成装置可以包括以下模块：

对象获取模块401，用于获取用户输入的搜索信息对应的候选对象；

理由生成模块402，用于基于所述候选对象的特征生成所述候选对象的候选排序理由；

偏好获取模块403，用于获取所述用户对所述候选对象的偏好信息；

理由选择模块404，用于基于所述偏好信息，从所述候选排序理由中选取所述候选对象的待展示排序理由。

可选地，所述理由生成模块402包括：条件判断单元4021，用于针对所述候选对象的每个特征，判断是否满足预设的当前特征对应的排序理由的生成条件；理由确定单元4022，用于在满足所述生成条件的情况下，将所述当前特征对应的排序理由作为所述候选对象的候选排序理由；其中，所述生成条件与所述当前特征的参数相关，或者与所述当前特征的参数和其余至少一个特征的参数相关，所述参数包括数值和/或排名。

可选地，所述偏好获取模块403包括：信息获取单元4031，用于获取所述用户维度的第一信息和所述候选对象维度的第二信息；模型预测单元4032，用于将所述第一信息和所述第二信息输入预先训练的偏好模型，得到所述偏好模型的输出结果，所述输出结果表征所述用户对所述候选对象在各特征上的偏好程度。

可选地，所述偏好模型通过如下模块训练：样本获取模块405，用于获取样本数据；所述样本数据包括样本用户维度的第一样本信息，样本对象维度的第二样本信息，以及样本标签，所述样本标签表征所述样本用户对所述样本对象在各特征上的实际偏好程度；模型训练模块406，用于利用所述样本数据对预设的待训练模型进行训练；其中，所述待训练模型的输入为所述第一样本信息和所述第二样本信息，输出为所述样本用户对所述样本对象在各特征上的预测偏好程度；模型确定模块407，用于基于所述实际偏好程度和所述预测偏好程度判断出训练完成后，将训练完成的模型作为所述偏好模型。

可选地，所述候选排序理由包括至少一个特征对应的排序理由；所述偏好信息包括所述用户对所述候选对象在各特征上的偏好程度；所述理由选择模块404包括：理由排序单元4041，用于按照所述偏好程度对所述候选排序理由进行降序排序；理由选取单元4042，用于选取排序在前的至少一个候选排序理由作为所述待展示排序理由。

可选地，所述候选对象为排序后的候选对象；所述理由生成模块402，具体用于针对排序在前的至少一个候选对象，基于所述候选对象的特征生成所述候选对象的候选排序理由；所述偏好获取模块403，具体用于针对排序在前的至少一个候选对象，获取所述用户对所述候选对象的偏好信息。

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

在本公开的实施例中，还提供了一种电子设备。该电子设备可以包括一个或多个处理器，以及其上存储有指令的一个或多个计算机可读存储介质，指令例如应用程序。当所述指令由所述一个或多个处理器执行时，使得所述处理器执行如上任一实施例的排序理由生成方法。

在本公开的实施例中，还提供了一种非临时性计算机可读存储介质，其上存储有计算机程序，该计算机程序可由电子设备的处理器执行，当所述计算机程序被处理器执行时，使得所述处理器执行如上任一实施例所述的排序理由生成方法。

上述提到的处理器可以是通用处理器，可以包括但不限于：中央处理器(CentralProcessing Unit，简称CPU)、网络处理器(Network Processor，简称NP)、数字信号处理器(Digital Signal Processing，简称DSP)、专用集成电路(Application SpecificIntegrated Circuit，简称ASIC)、现场可编程门阵列(Field－Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件，等等。

上述提到的计算机可读存储介质可以包括但不限于：只读存储器(Read OnlyMemory，简称ROM)、随机存取存储器(Random Access Memory，简称RAM)、光盘只读储存器(Compact Disc ReadOnly Memory，简称CD-ROM)、电可擦可编程只读存储器(ElectronicErasable Programmable ReadOnly Memory，简称EEPROM)、硬盘、软盘、闪存，等等。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本公开的实施例也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本公开的实施例的内容，并且上面对特定语言所做的描述是为了披露本公开的实施例的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本公开的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本公开的示例性实施例的描述中，本公开的实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本公开的实施例要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本公开的实施例的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的替代特征来代替。

本公开的实施例的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本公开的实施例的动态图片的生成设备中的一些或者全部部件的一些或者全部功能。本公开的实施例还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序。这样的实现本公开的实施例的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本公开的实施例进行说明而不是对本公开的实施例进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本公开的实施例可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

以上所述，仅为本公开的实施例的具体实施方式，但本公开的实施例的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本公开的实施例揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本公开的实施例的保护范围之内。

Claims

1.一种排序理由生成方法，其特征在于，包括：

获取用户输入的搜索信息对应的候选对象；所述候选对象为基于所述搜索信息进行召回并排序后的候选对象；

基于所述偏好信息，从所述候选排序理由中选取所述候选对象的待展示排序理由；

其中，所述基于所述候选对象的特征生成所述候选对象的候选排序理由，包括：

针对所述候选对象的每个特征，判断是否满足预设的当前特征对应的排序理由的生成条件；

在满足所述生成条件的情况下，将所述当前特征对应的排序理由作为所述候选对象的候选排序理由。

2.根据权利要求1所述的方法，其特征在于，所述生成条件与所述当前特征的参数相关，或者与所述当前特征的参数和其余至少一个特征的参数相关，所述参数包括数值和/或排名。

3.根据权利要求1所述的方法，其特征在于，所述获取所述用户对所述候选对象的偏好信息，包括：

获取用户维度的第一信息和候选对象维度的第二信息；

将所述第一信息和所述第二信息输入预先训练的偏好模型，得到所述偏好模型的输出结果，所述输出结果表征所述用户对所述候选对象在各特征上的偏好程度。

4.根据权利要求3所述的方法，其特征在于，所述偏好模型通过如下方式训练：

获取样本数据；所述样本数据包括样本用户维度的第一样本信息，样本对象维度的第二样本信息，以及样本标签，所述样本标签表征所述样本用户对所述样本对象在各特征上的实际偏好程度；

利用所述样本数据对预设的待训练模型进行训练；其中，所述待训练模型的输入为所述第一样本信息和所述第二样本信息，输出为所述样本用户对所述样本对象在各特征上的预测偏好程度；

基于所述实际偏好程度和所述预测偏好程度判断出训练完成后，将训练完成的模型作为所述偏好模型。

5.根据权利要求4所述的方法，其特征在于，所述样本标签通过如下方式得到：

针对所述样本对象的每个特征，判断是否满足预设的当前特征对应的排序理由的生成条件；

在满足所述生成条件的情况下，将所述样本用户对所述样本对象在所述当前特征上的实际偏好程度标注为感兴趣。

6.根据权利要求1所述的方法，其特征在于，所述候选排序理由包括至少一个特征对应的排序理由；所述偏好信息包括所述用户对所述候选对象在各特征上的偏好程度；

所述基于所述偏好信息，从所述候选排序理由中选取所述候选对象的待展示排序理由，包括：

按照所述偏好程度对所述候选排序理由进行降序排序；

选取排序在前的至少一个候选排序理由作为所述待展示排序理由。

7.根据权利要求1所述的方法，其特征在于，所述候选对象为排序后的候选对象；所述基于所述候选对象的特征生成所述候选对象的候选排序理由，并获取所述用户对所述候选对象的偏好信息，包括：

针对排序在前的至少一个候选对象，基于所述候选对象的特征生成所述候选对象的候选排序理由，并获取所述用户对所述候选对象的偏好信息。

8.一种排序理由生成装置，其特征在于，包括：

对象获取模块，用于获取用户输入的搜索信息对应的候选对象；所述候选对象为基于所述搜索信息进行召回并排序后的候选对象；

理由选择模块，用于基于所述偏好信息，从所述候选排序理由中选取所述候选对象的待展示排序理由；

其中，所述理由生成模块包括：

条件判断单元，用于针对所述候选对象的每个特征，判断是否满足预设的当前特征对应的排序理由的生成条件；

理由确定单元，用于在满足所述生成条件的情况下，将所述当前特征对应的排序理由作为所述候选对象的候选排序理由。

9.一种电子设备，其特征在于，包括：

一个或多个处理器；和

其上存储有指令的一个或多个计算机可读存储介质；

当所述指令由所述一个或多个处理器执行时，使得所述处理器执行如权利要求1至7任一项所述的排序理由生成方法。

10.一种计算机可读存储介质，其特征在于，其上存储有计算机程序，当所述计算机程序被处理器执行时，使得所述处理器执行如权利要求1至7任一项所述的排序理由生成方法。