CN115293848A

CN115293848A - 列表排序的方法、装置、电子设备及介质

Info

Publication number: CN115293848A
Application number: CN202210922438.XA
Authority: CN
Inventors: 王安琪
Original assignee: Shanghai Chengwei Information Technology Co ltd
Current assignee: Shanghai Chengwei Information Technology Co ltd
Priority date: 2022-08-02
Filing date: 2022-08-02
Publication date: 2022-11-04

Abstract

本发明提供了一种列表排序的方法、装置、电子设备及介质，包括：接收用户的搜索指令，并基于搜索指令确定多个目标产品；获取目标产品的产品属性以及搜索指令对应的场景特征；将产品属性和场景特征输入到预先训练好的预测模型中，得到每个目标产品在产品列表中预设位置的购买概率；基于购买概率将目标产品进行排序和展示。本发明能够改善产品列表中产品在出现位置上存在偏向性的问题，准确反映用户对产品购买偏好。

Description

列表排序的方法、装置、电子设备及介质

技术领域

本发明涉及计算机机器学习领域技术领域，尤其是涉及一种列表排序的方法、装置、电子设备及介质。

背景技术

随着互联网技术的不断发展，网络购物、购票等也越来越流行。用户通常会在购物或者购票平台通过相关搜索获取产品信息，通常曝光在用户面前的产品列表都是按照某种规则进行排序的结果。现有的个性化排序方法主要有两种：一是采用最小价或最多好评(依产品属性决定，在线旅游(Online Travel Agency，OTA)领域还有可能是最短耗时)等人工规则进行排序，但是该方法采用的业务规则具有较强的主观性，排序结果的真实性和可靠性较差。二是采用一般的机器学习方法对列表产品进行CVR预估，但是该方法在不同产品在列表中出现位置上存在偏向性，从而导致结果无法准确反映用户对产品的购买偏好。因此，现有技术中存在产品列表中产品在出现位置上存在偏向性，无法准确反映用户对产品购买偏好的问题。

发明内容

有鉴于此，本发明的目的在于提供一种列表排序的方法、装置、电子设备及介质，能够改善产品列表中产品在出现位置上存在偏向性的问题，准确反映用户对产品购买偏好。

为了实现上述目的，本发明实施例采用的技术方案如下：

第一方面，本发明实施例提供了一种列表排序的方法，包括：接收用户的搜索指令，并基于搜索指令确定多个目标产品；获取目标产品的产品属性以及搜索指令对应的场景特征；将产品属性和场景特征输入到预先训练好的预测模型中，得到每个目标产品在产品列表中预设位置的购买概率；基于购买概率将目标产品进行排序和展示。

在一种实施方式中，预测模型的训练过程，包括：获取训练数据；其中，训练数据包括每个曝光产品的场景特征、产品属性、位置信息以及购买信息；基于训练数据训练得到第一预测模型，并基于第一预测模型得到每个曝光产品在对应的场景特征下出现在产品列表中每个位置的概率；基于每个曝光产品在对应的场景特征下出现在产品列表中每个位置的概率对训练数据进行抽样，得到无偏的训练数据；基于无偏的训练数据训练得到预测模型。

在一种实施方式中，在基于训练数据训练得到第一预测模型之前，该方法还包括：基于预设指标判断训练数据是否存在偏差；如果存在偏差，则基于训练数据训练得到第一预测模型。

在一种实施方式中，基于预设指标判断训练数据是否存在偏差，包括：基于训练数据，计算每个曝光产品的标准化均数差SMD；如果SMD的绝对值大于预设值，则确定训练数据存在偏差。

在一种实施方式中，基于每个曝光产品在对应的场景特征下出现在产品列表中每个位置的概率对训练数据进行抽样，得到无偏的训练数据，包括：基于每个曝光产品在对应的场景特征下出现在产品列表中每个位置的概率，采用预设加权算法确定抽样权重；基于抽样权重对训练数据进行抽样，得到无偏的训练数据。

在一种实施方式中，在基于抽样权重对训练数据进行抽样，得到无偏的训练数据之后，该方法还包括：基于无偏的训练数据，计算每个曝光产品的SMD；基于SMD判断无偏的训练数据是否存在偏差；如果存在偏差，则继续对无偏的训练数据进行抽样，直至无偏的训练数据不存在偏差。

第二方面，本发明实施例提供了一种列表排序的装置，包括：接收模块，用于接收用户的搜索指令，并基于搜索指令确定多个目标产品；数据获取模块，用于获取目标产品的产品属性以及搜索指令对应的场景特征；预测模块，用于将产品属性和场景特征输入到预先训练好的预测模型中，得到每个目标产品在产品列表中预设位置的购买概率；排序模块，用于基于购买概率将目标产品进行排序和展示。

在一种实施方式中，该装置还包括：模型训练模块，用于：获取训练数据；其中，训练数据包括每个曝光产品的场景特征、产品属性、位置信息以及购买信息；基于训练数据训练得到第一预测模型，并基于第一预测模型得到每个曝光产品在对应的场景特征下出现在产品列表中每个位置的概率；基于每个曝光产品在对应的场景特征下出现在产品列表中每个位置的概率对训练数据进行抽样，得到无偏的训练数据；基于无偏的训练数据训练得到预测模型。

第三方面，本发明实施例提供了一种电子设备，包括处理器和存储器，存储器存储有能够被处理器执行的计算机可执行指令，处理器执行计算机可执行指令以实现上述第一方面提供的任一项的方法的步骤。

第四方面，本发明实施例提供了一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，计算机程序被处理器运行时执行上述第一方面提供的任一项的方法的步骤。

本发明实施例带来了以下有益效果：

本发明实施例提供的上述列表排序的方法、装置、电子设备及介质，首先，接收用户的搜索指令，并基于搜索指令确定多个目标产品；然后，获取目标产品的产品属性以及搜索指令对应的场景特征；接着，将产品属性和场景特征输入到预先训练好的预测模型中，得到每个目标产品在产品列表中预设位置的购买概率；最后，基于购买概率将目标产品进行排序和展示。上述方法考虑了在不同场景下、不同用户对目标产品购买意愿的区别，同时，引入了位置信息，通过预测模型能够得到每个目标产品在产品列表中预设位置的购买概率，从而消除了位置信息对购买概率的偏向性，改善了产品列表中产品在出现位置上存在偏向性的问题，准确反映了用户对产品购买偏好。

本发明的其他特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种列表排序的方法的流程图；

图2为本发明实施例提供的一种具体的列表排序的方法的流程图；

图3为本发明实施例提供的一种列表排序的装置的结构示意图；

图4为本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

目前，现有的个性化排序有两种方法：一是采用最小价或最多好评等人工规则，二是采用一般的机器学习方法预测产品的购买概率，收集在列表中的产品曝光、点击、购买数据，进行线上的CVR预估，对召回的列表按CVR预估值进行从大到小排列。然而，这两种方案均存在自身缺陷：1、采用人工规则排序的方法，没有考虑在不同场景下用户对产品购买意愿的区别。比如，在购买电器一类的产品时，好评比价格重要；在购买电影票一类的产品时，价格比好评重要。业务规则只是业务猜测，基于自身对产品和用户的理解做出的配置，这种理解不一定真实可靠。2、采用列表产品CVR预估的方法，产品展现在不同位置上用户有不同的购买偏向性，通过在特征中加入位置信息，能够一定程度的缓解购买概率在位置上的偏向性，但不能缓解不同产品在出现位置上的偏向性，因为一是产品排序往往基于已有逻辑规则，二是列表中的产品已经经过人工筛选，因此数据存在很大偏向性，使用这种数据训练得到的模型也存在偏向性，不能准确反映用户对产品的购买偏好，因而得出的结论也是存在偏向性的。比如说，排在首位的产品本身就会购买率偏高，添加位置信息进行训练可以去除这种偏向性；但是，首位可能多曝光低价产品，次位可能多曝光最多好评产品，这种偏向性靠单纯加上位置信息是无法去除的。

基于此，本发明实施例提供的一种列表排序的方法、装置、电子设备及介质，能够改善产品列表中产品在出现位置上存在偏向性的问题，准确反映用户对产品购买偏好。

为便于对本实施例进行理解，首先对本发明实施例所公开的一种列表排序的方法进行详细介绍，该方法可以应用于电商平台、OTA等领域，可以由电子设备执行，诸如智能手机、电脑、平板电脑等，参见图1所示的一种列表排序的方法的流程图，示意出该方法主要包括以下步骤S101至步骤S104：

步骤S101：接收用户的搜索指令，并基于搜索指令确定多个目标产品。

在一种实施方式中，用户在购物平台、购票平台或者其他平台进行购物或者购票时，通常会通过搜索的方式获取相关的产品列表，然后从中挑选想要购买的产品。具体的，用户的搜索指令中可以包括当前的时间信息、搜索的关键字、用户的属性信息等，平台在接收到用户的搜索指令后，可以根据其中的关键字确定多个目标产品。

步骤S102：获取目标产品的产品属性以及搜索指令对应的场景特征。

在一种实施方式中，目标产品的产品属性可以包括：产品价格、产品评价等，对于车票而言，产品属性还包括：起始站、终点站、中转站、消耗时长等信息；场景特征包括：当前的时间信息、关键字、用户的属性信息(性别、年龄、历史购买记录等)等信息。具体的，当基于搜索指令得到搜索结果，即多个目标产品后，还需要进一步获取每个目标产品的产品属性，并获取搜索指令对应的场景特征。

步骤S103：将产品属性和场景特征输入到预先训练好的预测模型中，得到每个目标产品在产品列表中预设位置的购买概率。

在一种实施方式中，预测模型可以是预先通过机器学习算法训练得到的，预测模型可以根据产品的场景特征、产品属性以及产品所在的位置信息，对该产品的购买概率进行预测。由于本发明实施例的目的是对搜索到的产品进行排序，也即每个目标产品的位置信息是不确定的，基于此，本发明实施例中可以将获取到的产品属性和场景特征输入到预测模型中，对每个目标产品出现在预设位置上的购买概率分别进行预测，得到每个目标产品在产品列表中预设位置的购买概率，其中，预设位置可以是列表的首位。诸如：假设产品列表中有10个位置：位置0至位置9，那么预设位置可以是位置0，本发明实施例中可以将每个目标产品的场景特征、产品属性以及位置信息(位置0)输入到预测模型中，从而得到每个目标产品在该场景特征下、在位置0出现的购买概率。

步骤S104：基于购买概率将目标产品进行排序和展示。

在一种实施方式中，可以将通过预测模型得到的每个目标产品在产品列表中预设位置的购买概率记为SCORE，然后按照SCORE从大到小的顺序对目标产品进行排序，并按照从上到下的顺序将目标产品在产品列表中进行展示，以供用户进行选择。

本发明实施例提供的上述列表排序的方法，考虑了在不同场景下、不同用户对目标产品购买意愿的区别，同时，引入了位置信息，通过预测模型能够得到每个目标产品在产品列表中每个位置的购买概率，从而消除了位置信息对购买概率的偏向性，改善了产品列表中产品在出现位置上存在偏向性的问题，准确反映了用户对产品购买偏好。

本发明实施例还提供了一种预测模型的训练方法，具体的，预测模型的训练过程，包括以下步骤1至步骤4：

步骤1：获取训练数据；其中，训练数据包括每个曝光产品的场景特征、产品属性、位置信息以及购买信息。

具体的，曝光产品即为展示给用户的产品，本发明实施例中获取到的训练数据为已经展示给用户的曝光产品的数据，包括：场景特征(X)、产品属性(I)、位置信息(T)以及购买信息(用户是否购买，Y)等。

本发明实施例中，在模型训练之前还需要检验训练数据是否有偏，具体的，可以采用包括但不限于以下方式：基于预设指标判断训练数据是否存在偏差；如果存在偏差，则基于训练数据训练得到第一预测模型。

在一种实施方式中，在基于预设指标判断训练数据是否存在偏差时，可以基于训练数据，计算每个曝光产品的标准化均数差SMD；如果SMD的绝对值大于预设值，则确定训练数据存在偏差。

具体的，标准化均数差(standardized mean difference，SMD)为两组估计值的均数差值除以平均标准差，用于度量衡单位或测量方法不一致的情况。由于消除了量纲(也就是度量衡单位)的影响，因而结果可以被合并。本发明实施例中可以通过SMD指标确定不同位置产品在不同属性上的偏差水平，SMD绝对值大于0.1则表明训练数据有偏，即存在偏差。

步骤2：基于训练数据训练得到第一预测模型，并基于第一预测模型得到每个曝光产品在对应的场景特征下出现在产品列表中每个位置的概率。

在一种实施方式中，为了去除数据偏差对结果准确性的影响，本发明实施例中可以通过训练第一预测模型对位置信息进行去偏，得到相对无偏的训练数据。具体的，可以通过训练数据中的场景特征、产品属性和位置信息训练得到第一预测模型，第一预测模型可以依据场景特征X预测该场景下产品I在产品列表中的位置。因此，可以利用第一预测模型计算每个曝光产品在对应的场景特征下出现在产品列表中每个位置的概率。

步骤3：基于每个曝光产品在对应的场景特征下出现在产品列表中每个位置的概率对训练数据进行抽样，得到无偏的训练数据。

在一种实施方式中，可以采用包括但不限于以下方式得到无偏的训练数据：首先，基于每个曝光产品在对应的场景特征下出现在产品列表中每个位置的概率，采用预设加权算法确定抽样权重；然后，基于抽样权重对训练数据进行抽样，得到无偏的训练数据。

具体的，可以基于每个曝光产品在对应的场景特征下出现在产品列表中每个位置的概率，采用逆概率加权(IPW)或者SMRW等手段，确定抽样权重，IPW算法对应的抽样权重为1/P，SMRW算法在多分类场景中对应的抽样权重为(1-P)/P，其中，P为曝光产品在对应的场景特征下出现在产品列表中某个位置的概率。

进一步，可以根据得到的抽样权重对训练数据进行抽样，对不同位置的特征数据进行去偏，得到相对无偏的训练数据。

在一种实施方式中，在基于抽样权重对训练数据进行抽样，得到无偏的训练数据之后，还需要对无偏的训练数据进行检验，判断训练数据的有偏是否得到改善，具体的，可以采用包括但不限于以下方式进行检验：首先，基于无偏的训练数据，计算每个曝光产品的SMD；然后，基于SMD判断无偏的训练数据是否存在偏差；如果存在偏差，则继续对无偏的训练数据进行抽样，直至无偏的训练数据不存在偏差。具体的，通过SMD指标判断训练数据的有偏状态是否得到改善，若没有改善到无偏状态，则可以继续进行抽样或者更换手段对训练数据进行处理，直到无偏(即在所有位置上，大部分产品属性的SMD绝对值均小于0.1)。

步骤4：基于无偏的训练数据训练得到预测模型。

在一种实施方式中，利用步骤4中得到的无偏的训练数据进行训练，得到预测模型，预测模型可以依据场景特征X预测该场景下该产品I在某位置时的购买概率。

使用预测模型计算产品列表中每个产品在位置0的CVR预估值(即购买概率)，将其记为SCORE，然后按SCORE从大到小排列列表产品，并将列表产品从上到下进行展示。相比于现有的没有对位置去偏的方法，本发明实施例中在离线测试数据上进行评估，多位置平均Qini指标与AUC指标均有所提升，线上表现为购买率提升。

为了便于理解，本发明实施例还提供了一种具体的列表排序的方法，参见图2所示，示意出该方法主要包括以下步骤S201至步骤S205：

步骤S201：训练数据、测试数据的收集与构造。

具体的，收集到的训练数据和测试数据为产品曝光留存位置信息。单条数据结构如下：[X，I，T，Y]，其中，X为场景特征，I为产品属性，T为位置信息，Y为是否购买(即购买信息)。例如：位置0曝光产品a，则产品a的位置信息T＝0，位置1曝光产品b，则产品b的位置信息T＝1，位置20后的产品的位置信息全部归于20，即T＝20。在具体应用中，可以通过SMD指标确定不同位置产品在不同产品属性上的偏差水平，如位置0与位置1关于产品价格的SMD为-0.34，则表明位置0与位置1在产品价格上有偏；位置0与位置2的关于产品价格的SMD为-0.42，则表明位置0与位置2在产品价格上也有偏(SMD绝对值大于0.1表明有偏)。

步骤S202：对训练数据进行训练得到预测模型M1。

预测模型M1(即第一预测模型)可以预测某场景下某产品在列表中的位置。具体的，在训练数据上训练得到[X，I]->T的预测模型M1，即可以依据X预测此场景下该产品I在列表中的位置。例如：在场景X时产品I在列表中的位置T为0的概率为P1，位置T为1的概率为P2，…，位置T为19的概率为P20(P1+P2+...+P20＝1)。

步骤S203：基于预测模型M1对位置信息进行去偏，得到相对无偏的训练数据，并检验无偏的训练数据是否有偏。

具体的，使用预测模型M1得到[X，I]在不同位置的概率，然后使用IPW(权重为(1/P)、SMRW(多分类场景中修改为权重为(1-P)/P)等手段，对不同位置的产品属性、场景特征等数据进行去偏(即根据权重对数据进行抽样)，得到相对无偏的训练数据；然后，通过SMD指标判断有偏是否得到改善，若没有改善到无偏状态，则更换手段进行处理直到数据无偏(在所有位置上，大部分特征的SMD绝对值均小于0.1)。

步骤S204：对无偏的训练数据进行训练，得到预测模型M2。

预测模型M2(即预测模型)可以预测某场景下某产品在某位置的购买概率。具体的，对新的无偏的训练数据进行训练，得到[X，I，T]->Y的预测模型M2，即可以依据X预测此场景下该产品I在某位置时的购买概率。

步骤S205：基于预测模型M2计算产品列表中每个产品在位置0的CVR预估值，并按照CVR预估值从大到小的顺序排列产品列表，将列表产品从上到下进行展示。

具体的，可以使用预测模型M2计算列表中每个产品在位置0的CVR预估值，将其记为SCORE，并按SCORE从大到小排列产品列表，将列表产品从上到下进行展示。本发明实施例中在离线测试数据上进行评估，多位置平均Qini指标与AUC指标均有所提升，线上表现为购买率提升。

本发明实施例提供的上述基于因果推断算法的列表排序方法，相比于人工规则方法，考虑了在不同场景下、不同用户对产品购买意愿的区别，并且基于收集到的数据应用机器学习算法，挖掘出用户的真实偏好，对产品列表进行排序，列表整体购买率提升5个百分点；相比于列表产品CVR预估的方法，一是为曝光产品加入位置信息，去除了位置对购买概率的偏向性，二是去除了产品在出现位置上的偏向性，更准确的反映了用户对产品的购买偏好。

对于前述列表排序的方法，本发明实施例还提供了一种列表排序的装置，参见图3所示的一种列表排序的装置的结构示意图，示意出该装置主要包括以下结构：

接收模块301，用于接收用户的搜索指令，并基于搜索指令确定多个目标产品；

数据获取模块302，用于获取目标产品的产品属性以及搜索指令对应的场景特征；

预测模块303，用于将产品属性和场景特征输入到预先训练好的预测模型中，得到每个目标产品在产品列表中预设位置的购买概率；

排序模块304，用于基于购买概率将目标产品进行排序和展示。

本发明实施例提供的上述列表排序的装置，考虑了在不同场景下、不同用户对目标产品购买意愿的区别，同时，引入了位置信息，通过预测模型能够得到每个目标产品在产品列表中预设位置的购买概率，从而消除了位置信息对购买概率的偏向性，改善了产品列表中产品在出现位置上存在偏向性的问题，准确反映了用户对产品购买偏好。

在一种实施方式中，上述装置还包括：模型训练模块，用于：获取训练数据；其中，训练数据包括每个曝光产品的场景特征、产品属性、位置信息以及购买信息；基于训练数据训练得到第一预测模型，并基于第一预测模型得到每个曝光产品在对应的场景特征下出现在产品列表中每个位置的概率；基于每个曝光产品在对应的场景特征下出现在产品列表中每个位置的概率对训练数据进行抽样，得到无偏的训练数据；基于无偏的训练数据训练得到预测模型。

在一种实施方式中，上述模型训练模块进一步还用于：基于预设指标判断训练数据是否存在偏差；如果存在偏差，则基于训练数据训练得到第一预测模型。

在一种实施方式中，上述模型训练模块进一步还用于：基于训练数据，计算每个曝光产品的标准化均数差SMD；如果SMD的绝对值大于预设值，则确定训练数据存在偏差。

在一种实施方式中，上述模型训练模块进一步还用于：基于每个曝光产品在对应的场景特征下出现在产品列表中每个位置的概率，采用预设加权算法确定抽样权重；基于抽样权重对训练数据进行抽样，得到无偏的训练数据。

在一种实施方式中，上述模型训练模块进一步还用于：基于无偏的训练数据，计算每个曝光产品的SMD；基于SMD判断无偏的训练数据是否存在偏差；如果存在偏差，则继续对无偏的训练数据进行抽样，直至无偏的训练数据不存在偏差。

本发明实施例所提供的装置，其实现原理及产生的技术效果和前述方法实施例相同，为简要描述，装置实施例部分未提及之处，可参考前述方法实施例中相应内容。

本发明实施例还提供了一种电子设备，具体的，该电子设备包括处理器和存储装置；存储装置上存储有计算机程序，计算机程序在被处理器运行时执行如上实施方式的任一项所述的方法。

图4为本发明实施例提供的一种电子设备的结构示意图，该电子设备100包括：处理器40，存储器41，总线42和通信接口43，所述处理器40、通信接口43和存储器41通过总线42连接；处理器40用于执行存储器41中存储的可执行模块，例如计算机程序。

其中，存储器41可能包含高速随机存取存储器(RAM，Random Access Memory)，也可能还包括非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器。通过至少一个通信接口43(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接，可以使用互联网，广域网，本地网，城域网等。

总线42可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图4中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

其中，存储器41用于存储程序，所述处理器40在接收到执行指令后，执行所述程序，前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器40中，或者由处理器40实现。

处理器40可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器40中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器40可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(Digital SignalProcessing，简称DSP)、专用集成电路(Application Specific Integrated Circuit，简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器41，处理器40读取存储器41中的信息，结合其硬件完成上述方法的步骤。

本发明实施例所提供的可读存储介质的计算机程序产品，包括存储了程序代码的计算机可读存储介质，所述程序代码包括的指令可用于执行前面方法实施例中所述的方法，具体实现可参见前述方法实施例，在此不再赘述。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上所述实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种列表排序的方法，其特征在于，包括：

接收用户的搜索指令，并基于所述搜索指令确定多个目标产品；

获取所述目标产品的产品属性以及所述搜索指令对应的场景特征；

将所述产品属性和所述场景特征输入到预先训练好的预测模型中，得到每个所述目标产品在产品列表中预设位置的购买概率；

基于所述购买概率将所述目标产品进行排序和展示。

2.根据权利要求1所述的方法，其特征在于，所述预测模型的训练过程，包括：

获取训练数据；其中，所述训练数据包括每个曝光产品的场景特征、产品属性、位置信息以及购买信息；

基于所述训练数据训练得到第一预测模型，并基于所述第一预测模型得到每个所述曝光产品在对应的场景特征下出现在产品列表中每个位置的概率；

基于每个所述曝光产品在对应的场景特征下出现在产品列表中每个位置的概率对所述训练数据进行抽样，得到无偏的训练数据；

基于所述无偏的训练数据训练得到所述预测模型。

3.根据权利要求2所述的方法，其特征在于，在基于所述训练数据训练得到第一预测模型之前，所述方法还包括：

基于预设指标判断所述训练数据是否存在偏差；

如果存在偏差，则基于所述训练数据训练得到第一预测模型。

4.根据权利要求3所述的方法，其特征在于，基于预设指标判断所述训练数据是否存在偏差，包括：

基于所述训练数据，计算每个所述曝光产品的标准化均数差SMD；

如果所述SMD的绝对值大于预设值，则确定所述训练数据存在偏差。

5.根据权利要求2所述的方法，其特征在于，基于每个所述曝光产品在对应的场景特征下出现在产品列表中每个位置的概率对所述训练数据进行抽样，得到无偏的训练数据，包括：

基于每个所述曝光产品在对应的场景特征下出现在产品列表中每个位置的概率，采用预设加权算法确定抽样权重；

基于所述抽样权重对训练数据进行抽样，得到无偏的训练数据。

6.根据权利要求5所述的方法，其特征在于，在基于所述抽样权重对训练数据进行抽样，得到无偏的训练数据之后，所述方法还包括：

基于所述无偏的训练数据，计算每个所述曝光产品的SMD；

基于所述SMD判断所述无偏的训练数据是否存在偏差；

如果存在偏差，则继续对所述无偏的训练数据进行抽样，直至所述无偏的训练数据不存在偏差。

7.一种列表排序的装置，其特征在于，包括：

接收模块，用于接收用户的搜索指令，并基于所述搜索指令确定多个目标产品；

数据获取模块，用于获取所述目标产品的产品属性以及所述搜索指令对应的场景特征；

预测模块，用于将所述产品属性和所述场景特征输入到预先训练好的预测模型中，得到每个所述目标产品在产品列表中预设位置的购买概率；

排序模块，用于基于所述购买概率将所述目标产品进行排序和展示。

8.根据权利要求7所述的装置，其特征在于，所述装置还包括：模型训练模块，用于：获取训练数据；其中，所述训练数据包括每个曝光产品的场景特征、产品属性、位置信息以及购买信息；

基于所述无偏的训练数据训练得到所述预测模型。

9.一种电子设备，其特征在于，包括处理器和存储器，所述存储器存储有能够被所述处理器执行的计算机可执行指令，所述处理器执行所述计算机可执行指令以实现权利要求1至6任一项所述的方法的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器运行时执行上述权利要求1至6任一项所述的方法的步骤。