CN111177564B

CN111177564B - 一种产品推荐方法及装置

Info

Publication number: CN111177564B
Application number: CN201911424549.2A
Authority: CN
Inventors: 饶佳佳; 裴松年; 李佰洋; 周超; 徐明泉
Original assignee: Beijing SF Intra City Technology Co Ltd
Current assignee: Beijing SF Intra City Technology Co Ltd
Priority date: 2019-12-31
Filing date: 2019-12-31
Publication date: 2023-06-02
Anticipated expiration: 2039-12-31
Also published as: CN111177564A

Abstract

本申请提供一种产品推荐方法及装置，涉及信息处理技术领域，方法包括：获取所有产品的计划推荐等级及期望行为数据；将计划推荐等级输入至预先训练好的预测模型中，并获取预测模型输出的预测行为数据，其中，预先训练好的预测模型为根据均衡样本数据训练得到；根据预测行为数据以及期望行为数据调整计划推荐等级，并根据调整后的计划推荐等级进行产品推荐。根据预测模型获取的预测行为数据能够准确的反应出用户对根据计划推荐等级进行产品推荐的反映行为，因此可以根据期望行为数据和预测行为数据对计划推荐等级进行调整，最终根据调整后的计划推荐等级进行产品推荐，从而提高推荐命中率，同时提高用户体验，继而提高推荐效果。

Description

一种产品推荐方法及装置

技术领域

本申请涉及信息处理技术领域，具体而言，涉及一种产品推荐方法及装置。

背景技术

产品推荐场景日益渗透生活的各个领域，如新闻推荐、购物推荐等，采用合适的推荐方案能够产生良好的推荐效果，还能带来良好的用户体验。传统的推荐方法是采用随机采样的方法收集样本，然后对样本进行的样本进行简单分类，后根据分类结果将产品推荐给用户，由于用户购买产品存在差异性，导致采集到的样本存在不平衡的问题，从而导致采集的样本无法反映用户对产品真正的偏好，进而导致推荐效果不好的问题。

发明内容

本申请实施例的目的在于提供一种产品推荐方法及装置，用以改善现有技术中推荐效果不好的问题。

第一方面，本申请实施例提供了一种产品推荐方法，所述方法包括：获取所有产品的计划推荐等级及期望行为数据；将所述计划推荐等级输入至预先训练好的预测模型中，并获取所述预测模型输出的预测行为数据，其中，所述预先训练好的预测模型为根据均衡样本数据训练得到的，所述均衡样本数据为对所有产品的历史推荐等级以及与所述历史推荐等级对应的历史行为数据进行样本均衡处理得到的；根据所述预测行为数据以及所述期望行为数据调整所述计划推荐等级，并根据调整后的所述计划推荐等级进行产品推荐。

在上述实现过程中，将产品的计划推荐等级输入至预先根据均衡样本数据训练得到的预测模型中，获取预测行为数据，预测行为数据能够准确的反应出用户对根据计划推荐等级进行产品推荐的反映行为，因此可以根据期望行为数据和预测行为数据对计划推荐等级进行调整，最终根据调整后的计划推荐等级进行产品推荐，从而提高推荐命中率，同时提高用户体验，继而提高推荐效果。

可选地，所述将所述计划推荐等级输入至预先训练好的预测模型中之前，所述方法还包括：获取所有产品的历史推荐等级以及与所述历史推荐等级对应的历史行为数据；对所述历史推荐等级以及所述历史行为数据进行样本均衡处理，得到均衡样本数据；根据所述均衡样本数据训练待训练的预测模型，并获取训练好的预测模型。

在上述实现过程中，对历史推荐等级以及历史行为数据进行样本均衡处理，得到的均衡样本数据能够比较好的反映出用户的真实偏好情况，因此，根据均衡样本数据对待训练的预测模型进行训练，能够保证训练好的预测模型能够全面的反应出用户的真实偏好，从而能够得到准确的预测结果。

可选地，所述对所述历史推荐等级以及所述历史行为数据进行样本均衡处理，得到均衡样本数据，包括：按照类别均衡采样算法对所述历史推荐等级以及所述历史行为数据进行采样，得到均衡样本数据。由于类别均衡采样算法只需要根据类别生成样本列表，然后从每个类别中随机进行采样，因此可以用于处理数据量较多的样本数据，且易于实现。

可选地，所述对所述历史推荐等级以及所述历史行为数据进行样本均衡处理，得到均衡样本数据，包括：根据所述历史推荐等级以及所述历史行为数据将所有产品分为正样本以及负样本，其中，所述正样本为所述所有产品中所述历史推荐等级以及所述历史行为数据均符合预设条件的产品，所述负样本为所述所有产品中不是正样本的产品；根据所述历史推荐等级以及所述历史行为数据确定样本填充比例，其中，所述样本填充比例用于确定所述正样本以及所述负样本中分别需要填充的样本数量；根据所述正样本以及所述负样本中分别需要填充的样本数量对所述正样本以及所述负样本进行样本填充的均衡算法处理，得到均衡样本数据。

在上述实现过程中，将所有的产品分为正样本以及负样本能够有效的对产品实际的情况进行分类，然后根据确定的填充比例对正样本和负样本进行样本填充，以使填充后的正样本以及填充后的负样本全面的反映用户的偏好，从而能够得到满足自然分布的均衡样本数据。

可选地，所述根据所述均衡样本数据训练待训练的预测模型，并获取训练好的预测模型，包括：获取所有产品的当前推荐等级以及与所述当前推荐等级对应的当前行为数据；将所述当前推荐等级输入至所述训练好的预测模型中，并获取当前预测行为数据；根据所述当前预测行为数据以及所述当前行为数据调整所述样本填充比例，并获取调整后的样本填充比例；根据所述调整后的样本填充比例对所述正样本以及所述负样本进行样本填充的均衡算法处理，得到均衡样本数据；利用所述新的均衡样本数据对待训练的预测模型进行训练，并获取训练好的预测模型。

在上述实现过程中，通过对样本填充比例进行调整的方式使的样本能够更全面的反映用户的偏好，从而进行预测模型的训练并得到更准确的预测结果，进而提高推荐命中率。

第二方面，本申请实施例提供了一种产品推荐装置，所述装置包括：数据获取模块，用于获取所有产品的计划推荐等级及期望行为数据；预测模块，用于将所述计划推荐等级输入至预先训练好的预测模型中，并获取所述预测模型输出的预测行为数据，其中，所述预先训练好的预测模型为根据均衡样本数据训练得到的，所述均衡样本数据为对所有产品的历史推荐等级以及与所述历史推荐等级对应的历史行为数据进行样本均衡处理得到的；产品推荐模块，用于根据所述预测行为数据以及所述期望行为数据调整所述计划推荐等级，并根据调整后的所述计划推荐等级进行产品推荐。

可选地，所述装置还包括：历史数据获取模块，用于获取所有产品的历史推荐等级以及与所述历史推荐等级对应的历史行为数据；均衡样本数据获取模块，用于对所述历史推荐等级以及所述历史行为数据进行样本均衡处理，得到均衡样本数据；预测模型训练模块，用于根据所述均衡样本数据训练待训练的预测模型，并获取训练好的预测模型。

可选地，所述均衡样本数据获取模块包括：类别均衡采样单元，用于按照类别均衡对所述历史推荐等级以及所述历史行为数据进行采样，得到均衡样本数据。

可选地，所述均衡样本数据获取模块包括：样本划分单元，用于根据所述历史推荐等级以及所述历史行为数据将所有产品分为正样本以及负样本，其中，所述正样本为所述所有产品中所述历史推荐等级以及所述历史行为数据均符合预设条件的产品，所述负样本为所述所有产品中不是正样本的产品；样本填充比例确定单元，用于根据所述历史推荐等级以及所述历史行为数据确定样本填充比例，其中，所述样本填充比例用于确定所述正样本以及所述负样本中分别需要填充的样本数量；样本填充单元，用于根据所述正样本以及所述负样本中分别需要填充的样本数量对所述正样本以及所述负样本进行样本填充的均衡算法处理，得到均衡样本数据。

可选地，所述预测模型训练模块包括：当前数据获取单元，用于获取所有产品的当前推荐等级以及与所述当前推荐等级对应的当前行为数据；预测数据获取单元，用于将所述当前推荐等级输入至所述训练好的预测模型中，并获取当前预测行为数据；样本填充比例调整单元，用于根据所述当前预测行为数据以及所述当前行为数据调整所述样本填充比例，并获取调整后的样本填充比例；样本填充单元，用于根据所述调整后的样本填充比例对所述正样本以及所述负样本进行样本填充的均衡算法处理，得到均衡样本数据；预测模型训练单元，用于利用所述新的均衡样本数据对待训练的预测模型进行训练，并获取训练好的预测模型。

第三方面，本申请实施例提供一种电子设备，包括处理器以及存储器，所述存储器存储有计算机可读取指令，当所述计算机可读取指令由所述处理器执行时，运行如上述第一方面提供的方法。

第四方面，本申请实施例提供一种可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时运行如上述第一方面提供的方法。

本申请的其他特征和优点将在随后的说明书阐述，并且，部分地从说明书中变得显而易见，或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的一种产品推荐方法的流程图；

图2为本申请实施例提供的一种产品推荐装置的结构框图；

图3为本申请实施例提供的一种电子设备的结构框图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。同时，在本申请的描述中，术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

随着计算机的出现和逐步的普及，信息对整个社会的影响逐步提高到一种绝对重要的地位，信息量、信息传播的速度、信息处理的速度以及应用信息的程度等都以几何级数的方式在增长。用户可以自行在众多信息中寻找自己需要的信息，由于推荐的方式更容易使选择符合其需求的信息，因此，一般用户会选择推荐的方式获取符合用户需求的信息，减少挑选时间。但是目前的推荐方式一般是通过传统的随机采样的方法收集样本，然后对样本进行简单分类后，根据分类结果将产品推荐给用户，但是该方法不能考虑到用户购买产品种类存在差异性，从而采集到的样本不平衡，无法反映用户对产品的真正偏好。

为了解决上述问题，本申请实施例提供了一种产品推荐方法，请参看图1，该方法包括如下步骤：

步骤S110：获取所有产品的计划推荐等级及期望行为数据。

产品的计划推荐等级可以根据产品推荐计划方案获取，计划推荐等级可以表示在该推荐方案中，产品被推荐的情况，例如，在某类推荐方案中，计划推荐等级为推荐度，推荐度可以用1-10中的十个数字来表示，其中，对产品A的推荐度为5，对产品B的推荐度为9，对产品C的推荐度为3。行为数据表示用户对被推荐的产品进行点击查看或者点击下单的数据，而期望行为数据则表示推荐方预测用户根据被推荐的产品可能会产生的行为数据，例如，沿用前面的例子，用户对产品A的期望行为数据为点击以及点击并下单购买，用户对产品B的期望行为数据为点击并下单购买，用户对产品B的期望行为数据为点击。其中，产品推荐等级可以根据不同的推荐计划方案进行确定，例如，产品推荐等级除了可以为上述实施例中所说的推荐度还可以为推荐值。

此外，期望行为数据可以包括多个行为同时发生的行为或者包括多个行为中只发生一个的行为。例如，行为数据包括购买、加入购物车、加入收藏以及分享，则期望行为数据则可以有购买和加入收藏，也可以只有加入购物车。

步骤S120：将计划推荐等级输入至预先训练好的预测模型中，并获取预测模型输出的预测行为数据。

其中，预先训练好的预测模型为根据均衡样本数据训练得到的，均衡样本数据为对所有产品的历史推荐等级以及与历史推荐等级对应的历史行为数据进行样本均衡处理得到的。

具体地，将计划推荐等级输入至预先训练好的预测模型中之前，可以先获取所有产品的历史推荐等级以及与历史推荐等级对应的历史行为数据，然后对历史推荐等级以及历史行为数据进行样本均衡处理，得到均衡样本数据，最后根据均衡样本数据训练待训练的预测模型，并获取训练好的预测模型。

由于所有产品的历史推荐等级以及与历史推荐等级对应的历史行为数据可能会随用户购买数据被时间段的影响而受影响，从而存在无法全面反映整体推荐效果的问题，如若所有产品的历史推荐等级以及与历史推荐等级对应的历史行为数据反映出数据对应的购买用户偏好产品A，但是实际上所有的用户的购买意愿是更偏好产品B。因此可以对所有产品的历史推荐等级以及与历史推荐等级对应的历史行为数据进行样本均衡处理，使得到的均衡样本数据能够更好的反应出用户对产品的偏好。

预测模型可以根据数据特征等进行选择或者建立，例如，若数据特征量较少，则可以选择深度学习模型，也可以选择神经网络模型，若数据特征量较大，则可以选择线性学习模型。在训练预测模型时，可以根据所有产品的历史推荐等级以及与历史推荐等级对应的历史行为数据获取用于训练预测模型的训练数据。如，可以先对所有产品的历史推荐等级以及与历史推荐等级对应的历史行为数据进行特征抽取，例如，抽取的特征可以包括用户的行为特征、产品的热销特征、关联特征信息、反馈特征以及基础信息特征等。用户的行为特征可以表示用户偏好的产品的推荐占比，产品的热销特征可以表示新产品的推荐占比，关联特征信息可以表示关联产品的推荐特征，例如，可以是买了某件产品A的用户很大可能购买产品B，也可以是不喜欢产品C的用户很大可能也不喜欢产品D，也可以是购买了产品E的用户很大可能回购产品E。反馈特征可以反映特定场景下，特定用户对场景产品的偏好，例如，在中秋节期间，用户购物偏向月饼类的产品，又如，在夏季用户更偏向于降温类的产品，基础信息特征则主要包括用户的基本信息、产品基本信息，如产品上新的时序特征等。

根据对均衡样本数据训练待训练的预测模型，可以利用根据均衡样本数据提取的特征进行训练，不同预测模型采用的训练模型，如，若待训练的预测模型是线性模型，则可以通过确定特征的系数对待训练预测模型进行训练，此时越是重要的特征的系数就越大，跟输出越是无关的特征的系数就越接近0，在特征之间相对独立的情况下，采用该训练方法既简单有准确。但是往往不同特征之间都存在相互关联的特征，此时可以采用随机森林的训练模型或者神经网络的训练模型。

步骤S130：根据预测行为数据以及期望行为数据调整计划推荐等级，并根据调整后的计划推荐等级进行产品推荐。

由于在产品的推荐方案中的计划推荐等级以及期望行为数据只是一种计划，实际根据推荐方案中的计划推荐等级进行产品推荐后，可能由于高估了用户对该产品的偏好等因素的影响，最终的行为数据无法达到期望行为数据的期望。因此，根据预测行为数据以及期望行为数据可以调整计划推荐等级，使得按照调整后的计划推荐等级进行推荐得到的行为数据能够满足期望行为数据的期望。例如，推荐计划对产品A的推荐计划等级为5，期望行为数据为加入购物车人数占点击浏览人数的比例为60％，购买的人数占点击浏览人数的比例为百分之40％，对产品B的推荐计划等级为9，期望行为数据为加入购物车人数占点击浏览人数的比例为90％，购买的人数占点击浏览人数的比例为百分之65％，若预测模型输出的预测行为数据为产品A的预测行为数据为加入购物车人数占点击浏览人数的比例为80％，购买的人数占点击浏览人数的比例为百分之60％，产品B的预测行为数据为加入购物车人数占点击浏览人数的比例为80％，购买的人数占点击浏览人数的比例为百分之45％，可以看出预测结果，预测购买产品B的人数不多，大肆推荐产品B可能对用户造成不好的体验，但是浏览产品B并加入购物车的人数相对较多，这些用户属于潜在用户，因此，可以将产品B的推荐计划等级进行降低的调整，例如，可以调整为8或7。预测购买产品A的人数比期望多，因此可以适量的推荐产品A，以提高产品A的曝光率，浏览产品A并加入购物车的人数相对较少，这些潜在用户不算多，因此，可以将产品A的推荐计划等级进行适当的提升调整，例如，可以调整为7或者8。

在对历史推荐等级以及历史行为数据进行样本均衡处理时，可以采用不同的处理方式，下边对本申请提供的两种处理方式分别进行介绍。

第一种处理方式，可以按照类别均衡采样算法对所述历史推荐等级以及所述历史行为数据进行采样，得到均衡样本数据。

具体地，可以先把样本按类别分组，然后针对每个类别对应生成一个样本列表，然后从各个类别所对应的样本列表中选择随机的样本，这样可以保证均衡样本数据中每个类别被采样的机会均等。由于类别均衡采样算法只需要根据类别生成样本列表，然后从每个类别中随机进行采样，因此可以用于处理数据量较多的样本数据，且易于实现。

第二种处理方式，可以先根据历史推荐等级以及历史行为数据将所有产品分为正样本以及负样本，然后根据历史推荐等级以及历史行为数据确定样本填充比例，最后根据正样本以及负样本中分别需要填充的样本数量对正样本以及负样本进行样本填充的均衡算法处理，得到均衡样本数据。其中，正样本为所有产品中历史推荐等级以及历史行为数据均符合预设条件的产品，负样本为所有产品中不是正样本的产品，样本填充比例用于确定正样本以及负样本中分别需要填充的样本数量。

从历史推荐等级以及历史行为数据中找出历史推荐等级高且历史行为数据为用户发生了购买行为、点击行为、加入购物车的行为或者加入收藏的行为的产品为正样本，例如，可以选取一定时间限制内的历史推荐等级以及历史行为数据，其中，历史行为数据为用户点击次数大于一定阈值，或者表示用户加入购物车、用户加入收藏夹等用户行为的历史行为数据，设置相应不同权重，加入正样本集。从历史推荐等级以及历史行为数据中找出历史推荐等级高且历史行为数据为用户未发生购买行为、点击行为、加入购物车的行为或者加入收藏的行为的产品为负样本，例如，历史推荐等级可以用产品展位的位置、产品推荐的次数等表示，则可以将产品展位的位置较好但用户为发生购买行为、点击行为、加入购物车的行为或者加入收藏的行为的产品为负样本设置对应不同权重，加入负样本集。

接着，根据历史推荐等级以及历史行为数据确定样本填充比例，可以根据历史推荐等级以及历史行为数据确定产品的购买情况，例如，确定出用户实际下单购买的产品、用户多次点击的产品、用户加入收藏夹的产品、用户加入购物车未购买的产品等，根据其具体的数据设置权重，将该权重作为正样本的样本填充比例，将排序靠前未点击的产品、排序靠前未购买的产品、多次推荐未命中的产品等，作为负样本填充，根据其具体的数据设置权重，将该权重作为负样本的样本填充比例。

然后，根据样本填充比例分别对正样本和负样本进行填充，以使填充后的正样本以及填充后的负样本全面的反映用户的偏好，从而使得到均衡样本数据能够满足自然分布。

作为第二种处理方式中的一种实施方式，还可以通过对样本填充比例进行调整的方式使的样本能够更全面的反映用户的偏好，从而进行预测模型的训练并得到更准确的预测结果，进而提高推荐命中率。具体包括下述步骤：首先，获取所有产品的当前推荐等级以及与当前推荐等级对应的当前行为数据。其中，当前推荐等级以及当前推荐等级可以为根据产品最新的推荐以及销售情况获取的。然后，将当前推荐等级输入至训练好的预测模型中，并获取当前预测行为数据。由于当前推荐等级以及当前推荐等级可以为根据产品最新的推荐以及销售情况获取的，因此将当前推荐等级输入至预测模型中得到的预测行为数据能够较好的反应出预测模型是否存在不准确的问题。接着，根据当前预测行为数据以及当前行为数据调整样本填充比例，并获取调整后的样本填充比例。并根据调整后的样本填充比例对正样本以及负样本进行样本填充的均衡算法处理，得到均衡样本数据。根据调整后的样本填充比例得到的均衡样本数据能够更准确的反映出当前时间段用户对产品的偏好情况，因此，利用新的均衡样本数据对待训练的预测模型进行训练，并获取训练好的预测模型，能够实现更准确的预测，从而在对产品制定推荐计划时，可以预测预测行为数据是否与期望行为数据差距过大，从而进行推荐计划的调整，以提高命中率，并提高用户的体验，从而提高推荐效果。

基于同一发明构思，本申请实施例中还提供一种产品推荐装置100，请参看图2，图2为本申请实施例提供的一种产品推荐装置100的结构框图。该装置可以是电子设备上的模块、程序段或代码。应理解，该产品推荐装置100与上述图1方法实施例对应，能够执行图1方法实施例涉及的各个步骤，该产品推荐装置100具体的功能可以参见上文中的描述，为避免重复，此处适当省略详细描述。

可选地，该产品推荐装置100包括：

数据获取模块110，用于获取所有产品的计划推荐等级及期望行为数据；

预测模块120，用于将计划推荐等级输入至预先训练好的预测模型中，并获取预测模型输出的预测行为数据，其中，预先训练好的预测模型为根据均衡样本数据训练得到的，均衡样本数据为对所有产品的历史推荐等级以及与历史推荐等级对应的历史行为数据进行样本均衡处理得到的；

产品推荐模块130，用于根据预测行为数据以及期望行为数据调整计划推荐等级，并根据调整后的计划推荐等级进行产品推荐。

可选地，装置还包括：

历史数据获取模块，用于获取所有产品的历史推荐等级以及与历史推荐等级对应的历史行为数据；

均衡样本数据获取模块，用于对历史推荐等级以及历史行为数据进行样本均衡处理，得到均衡样本数据；

预测模型训练模块，用于根据均衡样本数据训练待训练的预测模型，并获取训练好的预测模型。

可选地，均衡样本数据获取模块包括：

类别均衡采样单元，用于按照类别均衡对所述历史推荐等级以及所述历史行为数据进行采样，得到均衡样本数据。

可选地，均衡样本数据获取模块包括：

样本划分单元，用于根据历史推荐等级以及历史行为数据将所有产品分为正样本以及负样本，其中，正样本为所有产品中历史推荐等级以及历史行为数据均符合预设条件的产品，负样本为所有产品中不是正样本的产品；

样本填充比例确定单元，用于根据历史推荐等级以及历史行为数据确定样本填充比例，其中，样本填充比例用于确定正样本以及负样本中分别需要填充的样本数量；

样本填充单元，用于根据正样本以及负样本中分别需要填充的样本数量对正样本以及负样本进行样本填充的均衡算法处理，得到均衡样本数据。

可选地，预测模型训练模块包括：

当前数据获取单元，用于获取所有产品的当前推荐等级以及与当前推荐等级对应的当前行为数据；

预测数据获取单元，用于将当前推荐等级输入至训练好的预测模型中，并获取当前预测行为数据；

样本填充比例调整单元，用于根据当前预测行为数据以及当前行为数据调整样本填充比例，并获取调整后的样本填充比例；

样本填充单元，用于根据调整后的样本填充比例对正样本以及负样本进行样本填充的均衡算法处理，得到均衡样本数据；

预测模型训练单元，用于利用新的均衡样本数据对待训练的预测模型进行训练，并获取训练好的预测模型。

请参照图3，图3为本申请实施例提供的一种电子设备的结构框图，该电子设备包括：至少一个处理器301，至少一个通信接口302，至少一个存储器303和至少一个通信总线304。其中，通信总线304用于实现这些组件直接的连接通信，通信接口302用于与其他节点设备进行信令或数据的通信，存储器303存储有处理器301可执行的机器可读指令。当电子设备运行时，处理器301与存储器303之间通过通信总线304通信，机器可读指令被处理器301调用时执行上述方法。

处理器301可以是一种集成电路芯片，具有信号处理能力。上述处理器301可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(NetworkProcessor，NP)等；还可以是数字信号处理器(Digital Signal Processing，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。其可以实现或者执行本申请实施例中公开的各种方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器303可以包括但不限于随机存取存储器(Random Access Memory，RAM)，只读存储器(Read Only Memory，ROM)，可编程只读存储器(Programmable Read-OnlyMemory，PROM)，可擦除只读存储器(Erasable Programmable Read-Only Memory，EPROM)，电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory，EEPROM)等。

可以理解，图3所示的结构仅为示意，电子设备还可包括比图3中所示更多或者更少的组件，或者具有与图3所示不同的配置。图3中所示的各组件可以采用硬件、软件或其组合实现。于本申请实施例中，电子设备可以是，但不限于专用检测设备、台式机、笔记本电脑、智能手机、智能穿戴设备、车载设备等实体设备，还可以是虚拟机等虚拟设备。另外，电子设备也不一定是单台设备，还可以是多台设备的组合，例如服务器集群，等等。

本申请实施例提供一种可读取存储介质，计算机程序被处理器执行时，执行如图1所示方法实施例中电子设备所执行的方法过程。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的装置的具体工作过程，可以参考前述方法中的对应过程，在此不再过多赘述。

综上所述，本申请提供了一种产品推荐方法及装置，方法包括：获取所有产品的计划推荐等级及期望行为数据；将计划推荐等级输入至预先训练好的预测模型中，并获取预测模型输出的预测行为数据，其中，预先训练好的预测模型为根据均衡样本数据训练得到的，均衡样本数据为对所有产品的历史推荐等级以及与历史推荐等级对应的历史行为数据进行样本均衡处理得到的；根据预测行为数据以及期望行为数据调整计划推荐等级，并根据调整后的计划推荐等级进行产品推荐。根据预测模型获取的预测行为数据能够准确的反应出用户对根据计划推荐等级进行产品推荐的反映行为，因此可以根据期望行为数据和预测行为数据对计划推荐等级进行调整，最终根据调整后的计划推荐等级进行产品推荐，从而提高推荐命中率，同时提高用户体验，继而提高推荐效果。

在本申请所提供的实施例中，应该理解到，所揭露装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

另外，作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

再者，在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。

以上所述仅为本申请的实施例而已，并不用于限制本申请的保护范围，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种产品推荐方法，其特征在于，所述方法包括：

获取所有产品的计划推荐等级及期望行为数据；

将所述计划推荐等级输入至预先训练好的预测模型中，并获取所述预测模型输出的预测行为数据，其中，所述预先训练好的预测模型为根据均衡样本数据训练得到的，所述均衡样本数据为对所有产品的历史推荐等级以及与所述历史推荐等级对应的历史行为数据进行样本均衡处理得到的；

根据所述预测行为数据以及所述期望行为数据调整所述计划推荐等级，并根据调整后的所述计划推荐等级进行产品推荐；

其中，所述将所述计划推荐等级输入至预先训练好的预测模型中之前，所述方法还包括：

获取所有产品的历史推荐等级以及与所述历史推荐等级对应的历史行为数据；

对所述历史推荐等级以及所述历史行为数据进行样本均衡处理，得到均衡样本数据；

根据所述均衡样本数据训练待训练的预测模型，并获取训练好的预测模型；

其中，所述对所述历史推荐等级以及所述历史行为数据进行样本均衡处理，得到均衡样本数据，包括：

根据所述历史推荐等级以及所述历史行为数据将所有产品分为正样本以及负样本，其中，所述正样本为所述所有产品中所述历史推荐等级以及所述历史行为数据均符合预设条件的产品，所述负样本为所述所有产品中不是正样本的产品；

根据所述历史推荐等级以及所述历史行为数据确定样本填充比例，其中，所述样本填充比例用于确定所述正样本以及所述负样本中分别需要填充的样本数量；

根据所述正样本以及所述负样本中分别需要填充的样本数量对所述正样本以及所述负样本进行样本填充的均衡算法处理，得到均衡样本数据；

所述根据所述均衡样本数据训练待训练的预测模型，并获取训练好的预测模型，包括：

获取所有产品的当前推荐等级以及与所述当前推荐等级对应的当前行为数据；

将所述当前推荐等级输入至所述训练好的预测模型中，并获取当前预测行为数据；

根据所述当前预测行为数据以及所述当前行为数据调整所述样本填充比例，并获取调整后的样本填充比例；

根据所述调整后的样本填充比例对所述正样本以及所述负样本进行样本填充的均衡算法处理，得到均衡样本数据；

利用新的均衡样本数据对待训练的预测模型进行训练，并获取训练好的预测模型。

2.根据权利要求1所述的方法，其特征在于，所述对所述历史推荐等级以及所述历史行为数据进行样本均衡处理，得到均衡样本数据，包括：

按照类别均衡采样算法对所述历史推荐等级以及所述历史行为数据进行采样，得到均衡样本数据。

3.一种产品推荐装置，其特征在于，所述装置包括：

数据获取模块，用于获取所有产品的计划推荐等级及期望行为数据；

预测模块，用于将所述计划推荐等级输入至预先训练好的预测模型中，并获取所述预测模型输出的预测行为数据，其中，所述预先训练好的预测模型为根据均衡样本数据训练得到的，所述均衡样本数据为对所有产品的历史推荐等级以及与所述历史推荐等级对应的历史行为数据进行样本均衡处理得到的；

产品推荐模块，用于根据所述预测行为数据以及所述期望行为数据调整所述计划推荐等级，并根据调整后的所述计划推荐等级进行产品推荐;

其中，在所述预测模块之前，所述装置还包括：

历史数据获取模块，用于获取所有产品的历史推荐等级以及与所述历史推荐等级对应的历史行为数据；

均衡样本数据获取模块，用于对所述历史推荐等级以及所述历史行为数据进行样本均衡处理，得到均衡样本数据；

预测模型训练模块，用于根据所述均衡样本数据训练待训练的预测模型，并获取训练好的预测模型;

4.根据权利要求3所述的装置，其特征在于，所述均衡样本数据获取模块包括：

5.一种电子设备，其特征在于，包括处理器以及存储器，所述存储器存储有计算机可读取指令，当所述计算机可读取指令由所述处理器执行时，运行如权利要求1至2中任一项所述的方法。

6.一种可读取存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，运行如权利要求1至2中任一项所述的方法。