CN113220983A

CN113220983A - 基于深度学习的选品方法和装置

Info

Publication number: CN113220983A
Application number: CN202010081827.5A
Authority: CN
Inventors: 张青青; 毛锐; 潘扬
Original assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Wodong Tianjun Information Technology Co Ltd
Current assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Wodong Tianjun Information Technology Co Ltd
Priority date: 2020-02-06
Filing date: 2020-02-06
Publication date: 2021-08-06

Abstract

本发明公开了基于深度学习的选品方法和装置，涉及计算机技术领域。该方法的一具体实施方式包括：采集用户行为数据，所述用户行为数据包括各个搜索词对应的物品列表；依据所述物品列表中的物品构建物品对，得到各个搜索词对应的物品对列表；根据各个搜索词对应的物品对列表，基于深度学习网络构建选品模型，依据所述选品模型进行选品。该实施方式通过构建物品对、基于构建的物品对和深度学习网络构建选品模型、依据所述选品模型进行选品，能够大大扩展模型训练数据，提高选品结果的覆盖率以及精确度。

Description

基于深度学习的选品方法和装置

技术领域

本发明涉及计算机技术领域，尤其涉及一种基于深度学习的选品方法和装置。

背景技术

CPS(Cost Per Sales，即按销售付费)体系往往涉及海量物品。CPS选品是对海量CPS物品进行选品打分并挑选出最富有竞争力的优质热销物品。目前CPS选品的方法主要有：基于活动报名、数据统计以及人工参与的方式选品，基于浅度学习的方式选品。但是这些选品方案的覆盖率以及精确度较低。

发明内容

有鉴于此，本发明实施例提供一种基于深度学习的选品方法和装置，能够大大提高选品结果的覆盖率以及精确度。

为实现上述目的，根据本发明实施例的一个方面，提供了一种基于深度学习的选品方法，包括：

采集用户行为数据，所述用户行为数据包括各个搜索词对应的物品列表；

依据所述物品列表中的物品构建物品对，得到各个搜索词对应的物品对列表；

根据各个搜索词对应的物品对列表，基于深度学习网络构建选品模型，依据所述选品模型进行选品。

可选地，依据所述物品列表中的物品构建物品对，得到各个搜索词对应的物品对列表，包括：

对于任一搜索词，以所述搜索词对应的物品列表作为目标物品列表，或者以将所述搜索词对应的物品列表中至少一部分物品删除后的列表作为目标物品列表；从所述目标物品列表中的第一个物品开始，将相邻两个未配对的物品作为一个物品对，得到所述任一搜索词对应的物品对列表。

可选地，将所述物品列表中至少一部分物品删除，包括：将所述物品列表中预设指标的指标值小于等于指标阈值的物品删除。

可选地，所述方法还包括确定所述物品对列表中每个物品的分级标签；依据所述物品列表中的物品构建物品对，得到各个搜索词对应的物品对列表之后还包括：将所述物品对列表中具有相同预设分级标签的物品对删除。

可选地，所述用户行为数据还包括：所述物品列表中每个物品的点击量和曝光量；

确定所述物品对列表中每个物品的分级标签，包括：根据所述点击量和曝光量确定所述物品对列表中每个物品的点击率，根据所述点击率确定所述物品对列表中每个物品的分级标签。

可选地，按照如下公式，根据所述点击量和曝光量确定所述物品对列表中每个物品的点击率：

式中，score表示物品的点击率，x标识物品的点击量，y表示物品的曝光量，n表示权重因子。

可选地，根据各个搜索词对应的物品对列表，基于深度学习网络构建选品模型，包括：

以各个搜索词对应的物品对列表中的所有物品对作为候选样本集，对所述候选样本集进行抽样得到训练样本集；根据所述训练样本集，基于深度学习网络构建选品模型。

可选地，对所述候选样本集进行抽样得到训练样本集，包括：

确定所述候选样本集中每个物品的抽样概率，根据每个物品的抽样概率确定所述候选样本集中每个物品对的抽样概率，根据每个物品对的抽样概率从所述候选样本集中抽样。

可选地，所述按照如下公式确定所述候选样本集中每个物品的抽样概率：

式中，P表示物品的抽样概率，y表示物品的曝光量。

可选地，对所述候选样本集进行抽样得到训练样本集之后，还包括：

对于所述候选样本集中的任一物品，判断预设指标的指标值是否存在异常；若是，则对所述指标值进行标准化处理。

可选地，判断预设指标的指标值是否存在异常，包括：

按照如下公式确定所述预设指标的指标得分，若所述指标得分小于等于得分阈值，判定所述预设指标的指标值不存在异常；否则，判定所述预设指标的指标值存在异常：

式中，a′表示预设指标的指标得分，a表示预设指标的指标值，mean表示预设指标的平均数，σ表示预设指标的标准差。

可选地，基于深度学习网络构建选品模型之前，还包括：

对于所述训练样本集中的任一物品对，判断所述任一物品对中前一个物品的点击率是否大于后一个物品的点击率；若是，则为所述任一物品对标记第一样本标签，否则为所述任一物品对标记第二样本标签。

可选地，所述深度学习网络采用单层隐藏层。

根据本发明实施例的第二方面，提供一种基于深度学习的选品装置，包括：

数据采集模块，采集用户行为数据，所述用户行为数据包括各个搜索词对应的物品列表；

物品组合模块，依据所述物品列表中的物品构建物品对，得到各个搜索词对应的物品对列表；

模型构建模块，根据各个搜索词对应的物品对列表，基于深度学习网络构建选品模型，依据所述选品模型进行选品。

可选地，所述物品组合模块依据所述物品列表中的物品构建物品对，得到各个搜索词对应的物品对列表，包括：

可选地，所述物品组合模块还用于按照如下步骤将所述物品列表中至少一部分物品删除：将所述物品列表中预设指标的指标值小于等于指标阈值的物品删除。

可选地，所述物品组合模块还用于：确定所述物品对列表中每个物品的分级标签，以及在依据所述物品列表中的物品构建物品对，得到各个搜索词对应的物品对列表之后，将所述物品对列表中具有相同预设分级标签的物品对删除。

所述物品组合模块确定所述物品对列表中每个物品的分级标签，包括：根据所述点击量和曝光量确定所述物品对列表中每个物品的点击率，根据所述点击率确定所述物品对列表中每个物品的分级标签。

可选地，所述物品分级模块按照如下公式，根据所述点击量和曝光量确定所述物品对列表中每个物品的点击率：

可选地，所述模型构建模块根据各个搜索词对应的物品对列表，基于深度学习网络构建选品模型，包括：

可选地，所述模型构建模块对所述候选样本集进行抽样得到训练样本集，包括：

可选地，所述模型构建模块按照如下公式确定所述候选样本集中每个物品的抽样概率：

式中，P表示物品的抽样概率，y表示物品的曝光量。

可选地，所述模型构建模块对所述候选样本集进行抽样得到训练样本集之后，还包括：

可选地，所述模型构建模块判断预设指标的指标值是否存在异常，包括：

可选地，所述模型构建模块基于深度学习网络构建选品模型之前，还用于：

可选地，所述深度学习网络采用单层隐藏层。

根据本发明实施例的第三方面，提供一种基于深度学习的选品电子设备，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行时，所述一个或多个处理器实现本发明实施例第一方面提供的方法。

根据本发明实施例的第四方面，提供一种计算机可读介质，其上存储有计算机程序，所述程序被处理器执行时实现本发明实施例第一方面提供的方法。

上述发明中的一个实施例具有如下优点或有益效果：通过构建物品对、基于构建的物品对和深度学习网络构建选品模型、依据所述选品模型进行选品，能够大大扩展模型训练数据，提高选品结果的覆盖率以及精确度。

上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。

附图说明

附图用于更好地理解本发明，不构成对本发明的不当限定。其中：

图1是本发明实施例中基于深度学习的选品方法的主要流程示意图；

图2是本发明可选实施例中基于深度学习的选品方法的流程示意图；

图3是根据本发明实施例的基于深度学习的选品装置的主要模块的示意图；

图4是本发明实施例可以应用于其中的示例性系统架构图；

图5是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。

具体实施方式

以下结合附图对本发明的示范性实施例做出说明，其中包括本发明实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本发明的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

根据本发明实施例的一个方面，提供了一种基于深度学习的选品方法。

图1是本发明实施例中基于深度学习的选品方法的主要流程示意图，如图1所示，基于深度学习的选品方法，包括：步骤S101、步骤S102、步骤S103。

步骤S101、采集用户行为数据。

用户行为数据是对用户行为检测得到的数据。用户行为数据可以包括搜索、浏览、点击、购买、下单等行为的数据。可选地，用户行为数据包括各个搜索词对应的物品列表。当然，用户行为数据还可以包括用于评价用户行为的各个指标的数据，例如物品列表中各个物品的曝光量、用户对物品列表中各个物品的点击量等。

用户行为数据的时间跨度可以根据实际情况进行选择性设定。例如采集较大时间跨度内的用户行为数据，比如用户所有的行为数据；再例如采集较小时间跨度内的用户行为数据，例如仅一个月内用户的行为数据。

实际应用过程中，可以设置一个时间跨度阈值，以使采集的用户行为数据的时间跨度不小于该时间跨度阈值，例如7天、30天等。示例性地，某些场景下用户行为数据对时间相对敏感，如周末和工作日的用户行为数据差异会比较大，可以将时间跨度阈值设置为7天，在采集数据时，采集至少最近7天的用户行为数据。通过设置时间跨度阈值，能够提高选品结果的精确度。

步骤S102、依据所述物品列表中的物品构建物品对，得到各个搜索词对应的物品对列表。

本发明基于Pairwise算法构建物品对，并最终通过深度学习的方法来构建选品模型来进行选品。这种方法不仅能大大的扩展训练数据，还能将浅度学习所不能覆盖的长尾物品进行清晰的识别，同时还能用深度学习的非线性特征以及高精度特性去满足复杂的业务场景需求。

可选地，依据所述物品列表中的物品构建物品对，得到各个搜索词对应的物品对列表，包括：对于任一搜索词，以所述搜索词对应的物品列表作为目标物品列表，或者以将所述搜索词对应的物品列表中至少一部分物品删除后的列表作为目标物品列表；从所述目标物品列表中的第一个物品开始，将相邻两个未配对的物品作为一个物品对，得到所述任一搜索词对应的物品对列表。

将相邻两个未配对的物品作为一个物品对进行深度学习，能够充分学习物品之间的显著性差异和非显著性差异，尤其是曝光相对较低的长尾物品，提高选品结果的覆盖率以及精确度。

可选地，将所述物品列表中至少一部分物品删除，包括：将所述物品列表中预设指标的指标值小于等于指标阈值的物品删除。预设指标是指预先设定的指标，可以根据实际情况进行选择性设定，例如设置为曝光量、点击率、销售量等。指标阈值可以根据实际情况进行选择性设定，例如设置为一个固定值，或者根据各个物品的预设指标的指标值确定。

在可选的实施例中，以各个搜索词对应的物品列表中所有物品的预设指标的指标值的四分位数作为指标阈值。在确定四分位数时，可以先将各个搜索词对应的物品列表中所有物品的预设指标的指标值按照降序排列并分成四等份，然后取第一个分割点的物品的指标值作为四分位数。在电商领域中，以曝光量作为预设指标时，四分位数一般为6左右。

将物品列表中预设指标的指标值小于等于指标阈值的物品删除，能够在降低计算量的同时提高选品结果的精确率。

分级标签用于区分各个不同的物品等级，分级标签的名称和数量可以根据实际情况进行选择性设定。例如设定“上等”、“中等”、“差等”三个分级标签，或者设置“一等”、“二等”、“三等”、“四等”四个分级标签。预设分级标签是指多个分级标签中的一个分级标签。示例性地，设定“上等”、“中等”、“差等”三个分级标签时，在得到各个搜索词对应的物品对列表之后，同一个物品对中两个物品的分级标签可能是“上等”和“上等”、“中等”和“中等”、“差等”和“差等”、“上等”和“差等”、“中等”和“差等”、“上等”和“中等”。假设将“差等”分级标签设置为预设分级标签，则在得到各个搜索词对应的物品对列表之后，将所述物品对列表中“差等”和“差等”分级标签的物品对删除。

本例中，确定所述物品对列表中每个物品的分级标签的步骤可以在构建物品对的步骤之前执行、或者与确定搜索词对应的物品对列表的步骤同时执行、或者在得到各个搜索词对应的物品对列表之后执行。将物品对列表中具有相同预设分级标签的物品对删除，能够在降低计算量的同时提高选品结果的精确率。

各个物品的分级标签可以人为根据经验确定，或者根据某一个或多个指标的指标值确定。可选地，所述用户行为数据还包括：所述物品列表中每个物品的点击量和曝光量。确定所述物品对列表中每个物品的分级标签，包括：根据所述点击量和曝光量确定所述物品对列表中每个物品的点击率，根据所述点击率确定所述物品对列表中每个物品的分级标签。

曝光量是指物品被用户看到的次数，不管在那个页面或者那个场景，只要物品被用户看到一次，物品的曝光量就会增加一次。点击量是指物品被用户点击的次数。通常情况下，点击率越大，在相同曝光量情况下该物品被点击的次数越多，因此点击率能够在一定程度上反映用户的偏好。根据点击率确定物品的分级标签，能够使得选品结果更符合用户偏好，提高选品结果的精确度。

在确定点击率时，可以利用物品的点击量除以物品的曝光量得到物品的点击率。可选地，按照如下公式一，根据所述点击量和曝光量确定所述物品对列表中每个物品的点击率：

式中，score表示物品的点击率，x标识物品的点击量，y表示物品的曝光量，n表示权重因子。权重因子的取值可以根据实际情况进行选择性设定，通常情况下可以将权重因子设置为1.1，本领域技术人员也可以根据实际情况设置为其他值，例如1.2、0.8等。不同物品的权重因子可以相同或不同。公式一种的求和是指对物品对中两个物品的对应数值求和。

与利用物品的点击量除以物品的曝光量得到物品的点击率的方式相比，采用上述公式确定出的点击率更接近搜索等应用技术的排序最优解。基于上述公式确定出的点击率进行后续构建选品模型进行进行选品的步骤，能够提高选品结果的精确度。

步骤S103、根据各个搜索词对应的物品对列表，基于深度学习网络构建选品模型，依据所述选品模型进行选品。

本步骤中，可以通过物品的静态属性(如价格、佣金等)、活动信息(如拼购、秒杀等)、店铺数据(如销量、DSR(Detail Seller Rating，卖家服务评级系统)、店铺等级等)、物品的统计属性(如销量、佣金变化等)，基于分类统计数据(如热度、销量排名等)、优惠券属性等相关属性提取特征并进行特征工程构建。然后通过深度学习的方法进行选品方法构建。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示。深度学习的具体方法可以根据实际情况进行选择，例如DBN(Deep beliefnetwork，深度信念网络)、CNN(Convolution Neural Networks，卷积神经网络)、RNN(Recurrent neural network，递归神经网络)等。

通过深度学习的非线性特性不断训练各个神经网络的参数，构建选品模型，最终通过深度学习得到的选品模型预测各个物品被点击的概率，进而进行选品。

基于深度学习网络构建选品模型时，可以采用批量训练的方式进行训练，例如通过相同搜索词下的所有物品对全部代入神经网络进行前向反馈，然后计算总差分(即物品对的被点击的真实概率与预测值的差值)并进行误差反向传播，这样将大大减少误差反向传播的次数。

深度学习的神经网络分为三层：输入层、隐藏层和输出层。损失函数可以为：

式中，S_i表示物品i和物品j构成的物品对被点击的真实概率；S_i表示物品i被点击的真实概率，S_j表示物品j被点击的真实概率，其计算方式参见公式五；S_i＞S_j时S_ij＝1，否则S_ij＝0；f()表示激活函数，括号中的内容表示激活函数的变量，a表示各层的输入，即物品对相关的工程化信息输入，θ表示激活阈值；K表示输入层个数，M表示隐藏层中隐藏单元的个数；f_m()表示第m个隐藏单元的激活函数，括号中的内容表示第m个隐藏单元的激活函数的变量，a_k表示第k个输入层的输入，w_mk表示第k个输入层的第m个隐藏单元的输入层到隐藏层的权重，b_m表示第k个输入层的第m个隐藏单元的输入层到隐藏层的偏倚，w_m表示第k个输入层的第m个隐藏单元的隐藏层到输出层的权重，b表示隐藏层到输出层的偏倚。

可选地，根据各个搜索词对应的物品对列表，基于深度学习网络构建选品模型，包括：以各个搜索词对应的物品对列表中的所有物品对作为候选样本集，对所述候选样本集进行抽样得到训练样本集；根据所述训练样本集，基于深度学习网络构建选品模型。对候选样本集进行抽样得到训练样本集，能够增加样本随机性和高指标值(例如曝光量)物品被选中的概率，提高选品结果的精确度。

可选地，对所述候选样本集进行抽样得到训练样本集，包括：确定所述候选样本集中每个物品的抽样概率，根据每个物品的抽样概率确定所述候选样本集中每个物品对的抽样概率，根据每个物品对的抽样概率从所述候选样本集中抽样。本例中，物品对的抽样概率为物品对中两个物品的抽样概率的乘积。通过分别确定每个物品对的抽样概率，能够进一步提高选品结果的精确度。

可选地，所述按照如下公式二确定所述候选样本集中每个物品的抽样概率：

式中，P表示物品的抽样概率，y表示物品的曝光量。采用本例中的公式确定物品的抽样概率能够显著提高选品结果的精确度。

可选地，对所述候选样本集进行抽样得到训练样本集之后，还包括：对于所述候选样本集中的任一物品，判断预设指标的指标值是否存在异常；若是，则对所述指标值进行标准化处理。标准化处理是指将异常值替换为非异常的值，例如替换为预设指标的平均值、中位数等。对异常的指标值进行标准化处理，能够避免异常值对选品结果的影响，提高选品结果的精确度。

异常值的判定依据可以根据实际情况进行选择性设定。例如，在其他情况不变的情况下某一物品的点击量突然剧增，则该物品很可能存在刷单行为，此时可以将该物品的点击量判定为异常值。可选地，判断预设指标的指标值是否存在异常，包括：

按照如下公式三确定所述预设指标的指标得分，若所述指标得分小于等于得分阈值，判定所述预设指标的指标值不存在异常；否则，判定所述预设指标的指标值存在异常：

式中，a′表示预设指标的指标得分，a表示预设指标的指标值，mean表示预设指标的平均数，σ表示预设指标的标准差。得分阈值可以根据实际情况进行选择性设定，例如设置为3.5、5等。通过上述公式能够大大提高对异常值的识别效果，提高最终选品结果的精确度。

可选地，基于深度学习网络构建选品模型之前，还包括：对于所述训练样本集中的任一物品对，判断所述任一物品对中前一个物品的点击率是否大于后一个物品的点击率；若是，则为所述任一物品对标记第一样本标签，否则为所述任一物品对标记第二样本标签。示例性地，第一样本标签为1，代表正样本，第二样本标签为0，代表负样本；或者，第一样本标签为0，代表负样本，第二样本标签为1，代表正样本。

本发明基于物品对得到训练样本，样本数据的分布整体较为广泛，因此单层隐藏层的神经网络可以满足相关的方法训练需求。因此，可选地，所述深度学习网络采用单层隐藏层。采用单层隐藏层，能够在满足精确度的基础上降低计算量。在另一些可选的实施例中，隐藏层中隐藏单元的数量为15个。隐藏单元个数高于或者低于15会出现过拟合或者准确率较低的现象，采用15个隐藏单元能够在满足精确度的基础上避免过拟合现象。

以下结合图2对本发明实施例的选品方法进行示例性说明。本实施例的场景是在CPS广告投放的相关应用中采集用户的行为数据，并最终从用户行为数据中构建选品的方法。选品的场景比较复杂，需要考虑的因素有各个方面，除了物品的佣金、价格、标签、风格、颜色、销量、分类等物品的自身因素外，还和物品近期报名参与的促销活动、商家或者店铺的综合评分、品牌知名度、当前流行元素等非物品自身的各方面因素相关。当然，除了算法之外还需要考虑实际的商业应用的因素，如电商刷单、禁投类目等因素，这些因素也会对常规的选品算法造成干扰，尤其是部分临时性的商业政策。

一般的做法是通过采集物品的点击率(Click-Through-Rate，CTR)数据进行正负样本判定，然后再根据CTR数据的高低进行正负样本的机器学习训练集构建算法。因为长尾现象(也称长尾效应，即大多数的需求会集中在头部)，大部分CPS物品的曝光量和点击量都非常低。从统计学上来说，因为流量较少而计算出的CTR并不是物品真实的CTR，所以这些物品属于正负边界比较模糊的物品。这种做法容易造成大部分的模糊正负边界的物品无法参与训练，同时这种方式受限于CTR数据条数(因为有着明显正负样本区分的物品往往集中于少数物品类目，单纯的扩大采样物品并不能丰富正负样本)而往往因为训练样本的减少不能真正的训练出准确的模型或者过于简单的模型，导致无法真正的满足CPS复杂的个性化广告投放需求。本实施例提出一种基于Pairwise算法的方法(通过CTR大小构建物品对的方法)去构建正负样本，并最终通过深度学习的方法来构建算法来进行选品。这种方法不仅能大大的扩展训练数据，还能将浅度学习所不能覆盖的长尾物品进行清晰的识别，同时还能用深度学习的非线性特征以及高精度特性去满足复杂的业务场景需求。参见图2，具体方法如下：

步骤S201、采集至少7天内的用户行为数据，所述用户行为数据包括：各个搜索词对应的物品列表；

步骤S202、根据所述点击数和曝光数确定所述物品对列表中每个物品的点击率，计算前文的公式参见公式一；

步骤S203、根据所述点击率确定所述物品对列表中每个物品的分级标签；CTR≤0.023的物品打上“差等”的分级标签，对CTR>0.023且CTR<0.06的物品打上“中等”分级标签，对CTR≥0.06的物品打上“上等”标签；

步骤S204、依据所述物品列表中的物品构建物品对，得到候选样本集；构建方法参见前文相关描述，此处不再赘述；

步骤S205、对所述候选样本集进行抽样得到训练样本集；抽样方法参见前文相关描述，此处不再赘述；

步骤S206、对预设指标的异常的指标值进行标准化处理；标准化处理方法参见前文相关描述，此处不再赘述；

步骤S207、基于深度学习网络构建选品模型；构建方法参见前文相关描述，此处不再赘述。

本发明能够排除实际场景对算法干扰来达到同时提高了算法对CPS选品的覆盖率和精确度。

传统基于活动报名、数据统计以及人工参与方式目前主要存在的问题包括：

1)对比庞大的物品候选集，通过活动物品以及人工检验的方式能够选出的物品少之又少；

2)人工的经验不一定正确(物品的特性会随着时间、地域、场景有着个性化的变化，这些都是人工经验所触及不到的领域)；

3)大部分有着热销潜力的长尾物品无法识别；

基于浅度学习进行选品的方法存在的问题包括：

1)无法覆盖到个性化的广告商业活动、多维度的物品属性、复杂的应用场景、个性化的媒体等诸多实际综合应用的因素；

2)提取的特征在特征空间中的分布相对稀疏；例如CPS的物品往往有上亿，但是单天有销量的物品往往不到百万，所以在销量这个特征上大部分的物品销量都是0，也就是数据上的稀疏分布；

3)分类器的性能受训练物品的静态属性(如价格变化、佣金提升等)的影响较大；

4)离线训练时的正负样本无法涵盖大部分真实应用场景的情况，大部分的样本分布在正负样本的模糊边界处；

5)部分物品存在特有的应用场景个性化和特殊知识属性，常规的数据挖掘算法无法识别这些特征；

6)CPS生态的特殊性，如CPS用户对佣金、优惠券、上新等属性的偏好与实际物品带来收益的偏差会造成对模型的干扰。

上述两种方法存在的问题导致其在进行选品时的覆盖率和精确度较低。本发明通过构建物品对、基于构建的物品对和深度学习网络构建选品模型、依据所述选品模型进行选品，能够大大扩展模型训练数据，提高选品结果的覆盖率以及精确度。

本发明实施例的选品方法可以用于搜索、推荐相关的默认物品召回，也可与搜索、推荐、广告推送等技术结合，应用于于CPS相关的广告投放、搜索推荐、社交电商、媒体合作等各个领域。

根据本发明实施例的第二方面，提供一种实现上述方法的装置。

图3是根据本发明实施例的基于深度学习的选品装置的主要模块的示意图，如图3所示，基于深度学习的选品装置300包括：

数据采集模块301，采集用户行为数据，所述用户行为数据包括各个搜索词对应的物品列表；

物品组合模块302，依据所述物品列表中的物品构建物品对，得到各个搜索词对应的物品对列表；

模型构建模块303，根据各个搜索词对应的物品对列表，基于深度学习网络构建选品模型，依据所述选品模型进行选品。

式中，P表示物品的抽样概率，y表示物品的曝光量。

可选地，所述深度学习网络采用单层隐藏层，所述隐藏层中隐藏单元的数量为15个

一个或多个处理器；

存储装置，用于存储一个或多个程序，

图4示出了可以应用本发明实施例的基于深度学习的选品方法或基于深度学习的选品装置的示例性系统架构400。

如图4所示，系统架构400可以包括终端设备401、402、403，网络404和服务器405。网络404用以在终端设备401、402、403和服务器405之间提供通信链路的介质。网络404可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备401、402、403通过网络404与服务器405交互，以接收或发送消息等。终端设备401、402、403上可以安装有各种通讯客户端应用，例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。

终端设备401、402、403可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器405可以是提供各种服务的服务器，例如对用户利用终端设备401、402、403所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理，并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。

需要说明的是，本发明实施例所提供的基于深度学习的选品方法一般由服务器405执行，相应地，基于深度学习的选品装置一般设置于服务器405中。

应该理解，图4中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

下面参考图5，其示出了适于用来实现本发明实施例的终端设备的计算机系统500的结构示意图。图5示出的终端设备仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图5所示，计算机系统500包括中央处理单元(CPU)501，其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中，还存储有系统500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。

以下部件连接至I/O接口505：包括键盘、鼠标等的输入部分506；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507；包括硬盘等的存储部分508；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器510上，以便于从其上读出的计算机程序根据需要被安装入存储部分508。

特别地，根据本发明公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本发明公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分509从网络上被下载和安装，和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时，执行本发明的系统中限定的上述功能。

需要说明的是，本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的模块可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中，例如，可以描述为：一种处理器包括：数据采集模块，采集用户行为数据，所述用户行为数据包括：各个搜索词对应的物品列表；物品组合模块，依据所述物品列表中的物品构建物品对，得到各个搜索词对应的物品对列表；模型构建模块，根据各个搜索词对应的物品对列表，基于深度学习网络构建选品模型，依据所述选品模型进行选品。其中，这些模块的名称在某种情况下并不构成对该模块本身的限定，例如，数据采集模块还可以被描述为“基于深度学习网络构建选品模型的模块”。

作为另一方面，本发明还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的设备中所包含的；也可以是单独存在，而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被一个该设备执行时，使得该设备包括：采集用户行为数据，所述用户行为数据包括：各个搜索词对应的物品列表；依据所述物品列表中的物品构建物品对，得到各个搜索词对应的物品对列表；根据各个搜索词对应的物品对列表，基于深度学习网络构建选品模型，依据所述选品模型进行选品。

根据本发明实施例的技术方案，通过构建物品对、基于构建的物品对和深度学习网络构建选品模型、依据所述选品模型进行选品，能够大大扩展模型训练数据，提高选品结果的覆盖率以及精确度。

上述具体实施方式，并不构成对本发明保护范围的限制。本领域技术人员应该明白的是，取决于设计要求和其他因素，可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明保护范围之内。

Claims

1.一种基于深度学习的选品方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，依据所述物品列表中的物品构建物品对，得到各个搜索词对应的物品对列表，包括：

3.如权利要求2所述的方法，其特征在于，将所述物品列表中至少一部分物品删除，包括：将所述物品列表中预设指标的指标值小于等于指标阈值的物品删除。

4.如权利要求1所述的方法，其特征在于，还包括：确定所述物品对列表中每个物品的分级标签；

依据所述物品列表中的物品构建物品对，得到各个搜索词对应的物品对列表之后，还包括：将所述物品对列表中具有相同预设分级标签的物品对删除。

5.如权利要求4所述的方法，其特征在于，所述用户行为数据还包括：所述物品列表中每个物品的点击量和曝光量；

6.如权利要求5所述的方法，其特征在于，根据各个搜索词对应的物品对列表，基于深度学习网络构建选品模型，包括：

7.如权利要求6所述的方法，其特征在于，对所述候选样本集进行抽样得到训练样本集，包括：

8.如权利要求6所述的方法，其特征在于，对所述候选样本集进行抽样得到训练样本集之后，还包括：

9.如权利要求6所述的方法，其特征在于，基于深度学习网络构建选品模型之前，还包括：

10.如权利要求1所述的方法，其特征在于，所述深度学习网络采用单层隐藏层。

11.一种基于深度学习的选品装置，其特征在于，包括：

数据采集模块，用于采集用户行为数据，所述用户行为数据包括各个搜索词对应的物品列表；

12.一种基于深度学习的选品电子设备，其特征在于，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行时，所述一个或多个处理器实现如权利要求1-10中任一所述的方法。

13.一种计算机可读介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1-10中任一所述的方法。