CN114764732A

CN114764732A - 一种商品推荐方法、设备及计算机可读存储介质

Info

Publication number: CN114764732A
Application number: CN202011615677.8A
Authority: CN
Inventors: 彭水凤; 陈昕乐; 马群; 简翱
Original assignee: Midea Group Co Ltd; GD Midea Air Conditioning Equipment Co Ltd
Current assignee: Midea Group Co Ltd; GD Midea Air Conditioning Equipment Co Ltd
Priority date: 2020-12-30
Filing date: 2020-12-30
Publication date: 2022-07-19

Abstract

本发明公开了一种商品推荐方法、设备及计算机可读存储介质，该方法包括：利用商品的评分获取待推荐商品的推荐预测分，利用用户数据获取用户对商品品类的购买概率；结合待推荐商品的推荐预测分和商品品类的购买概率，得到推荐商品。通过上述方式，本发明能够准确地向用户推荐符合用户实际需求的商品。

Description

一种商品推荐方法、设备及计算机可读存储介质

技术领域

本发明涉及数据挖掘技术领域，特别是涉及一种商品推荐方法、设备及计算机可读存储介质。

背景技术

目前，随着电子商务的发展，越来越多的消费者选择线上购物平台进行购物。为了提高消费者的购买率，各电商平台通常在一些页面中显示消费者感兴趣的推荐商品，因此商品推荐的方法越能贴近消费者的兴趣，对促进购物越有效。

当前被广泛应用于推荐系统的是基于商品的协同过滤，但是该传统模型在构建用户-产品的评分矩阵时依赖用户对已购买商品的评分，而大部分情况下用户购买的产品量有限，造成用户-产品的评分矩阵较为稀疏，导致推荐效果存在偏颇的可能。此外基于物品相似度的推荐仅考虑了用户的偏好，但并未实际衡量用户的购买需求，向用户产生推荐的评判因素较为局限。

发明内容

本发明主要解决的技术问题是提供一种商品推荐方法，能够准确地向用户推荐符合用户实际需求的商品。

为解决上述技术问题，本发明采用的一个技术方案是：提供一种商品推荐方法，该商品推荐方法包括：利用商品的评分获取待推荐商品的推荐预测分，利用用户数据获取用户对商品品类的购买概率；结合待推荐商品的推荐预测分和商品品类的购买概率，得到推荐商品。

其中，利用商品的评分获取待推荐商品的推荐预测分包括：获取商品的评分，得到评分矩阵；利用商品的评分计算商品间的关联关系；利用评分矩阵和商品间的关联关系获取待推荐商品的推荐预测分。

其中，用户数据包括用户行为数据，获取商品的评分，得到评分矩阵包括：获取已评价商品的评分；结合已评价商品的评分和用户行为数据，预测未评价商品的评分；综合已评价商品的评分和未评价商品的评分得到评分矩阵。

其中，结合已评价商品的评分和所述用户行为数据，预测未评价商品的评分包括：获取未评价商品的特征数据；将未评价商品的特征数据输入商品评分预测模型，获取未评价商品的评分，商品评分预测模型是利用已评价商品的特征数据和已评价商品的评分训练出来的；其中，商品的特征包括衍生特征，衍生特征是利用商品的基础特征和用户行为数据衍生出来的。

其中，衍生特征包括用户对商品的偏爱程度，用户对商品的偏爱程度的呈现形式包括商品与用户已购商品的相似程度、商品与用户特征的匹配程度、用户对商品的关注程度中的一种或多种。

其中，获取用户对商品的偏爱程度包括：将至少两种呈现形式进行加权平均，得到用户对商品的偏爱分；计算每个商品的偏爱分超越同类商品的比例，得到用户对商品的偏爱程度。

其中，将至少两种呈现形式进行加权平均包括：每一呈现形式的权重为评测周期的倒数与影响值的乘积，影响值为呈现形式对商品评分的影响程度，呈现形式对商品评分的影响程度包括呈现形式下商品评分中的好评占比，评测周期为数据采集周期。

其中，商品与用户已购商品的相似程度包括商品特征与用户已购商品公共特征的相似比率、商品标签与用户已购买商品标签的重合次数中的一种或多种；商品与用户特征的匹配程度包括商品标签与用户标签的重合次数、商品价位段与用户购买能力的符合程度中的一种或多种；用户对商品的关注程度包括用户对该商品的搜索次数、浏览次数、加购次数、收藏次数、分享次数中的一种或多种。

其中，衍生特征包括用户对商品特性的敏感程度，用户对商品特性的敏感程度的呈现形式包括用户对商品的空间特征的敏感程度、用户对商品的时间特征的敏感程度中的一种或多种。

其中，计算用户对商品的空间/时间特征的敏感程度包括：获取商品在不同空间/时间内，用户对空间/时间特征的差评率；计算每个空间/时间的差评率超越其他空间/时间的比例，得到用户对商品的空间/时间特征的敏感程度。

其中，衍生特征包括商品特性与用户需求特征的匹配程度，商品特性与用户需求特征的匹配程度的呈现形式包括商品特性与用户需求特征反义的概率、商品特性与用户需求特征相近的概率中的一种或多种。

其中，计算所述商品特性与用户需求特征反义的概率包括：获取商品的反向差评率，反向差评率为用户对商品的反义特征的差评率，反义特征为与用户需求特征相反义的特征；计算每个商品的反向差评率超越同类商品的比例，得到商品特性与用户需求特征反义的概率；计算商品特性与用户需求特征相近的概率包括：获取商品的正向好评率，正向好评率为用户对商品的正向特征的好评率，正向特征为与用户需求特征相近的特征；计算每个商品的正向好评率超越同类商品的比例，得到商品特性与用户需求特征相近的概率。

其中，该商品推荐方法还包括：采用相似用户的与缺失特征相对应的特征的平均特征值代替缺失特征；和/或对价格/购买量/购买频率异常商品的特征的权重进行归一化处理；和/或对离散特征数据进行编码处理；和/或对部分特征数据进行多项式等非线性拓展。

其中，商品评分预测模型包括回归模型、Lasso模型、弹性网络模型、逐步回归模型、稳健回归模型、Xgboost模型、Adaboost模型、随机森林模型中的任意一种。

其中，利用用户数据获取用户对商品品类的购买概率包括：获取用户的特征数据；将用户的特征数据输入品类购买概率预测模型，得到商品品类的购买概率，商品品类购买概率预测模型是对用户特征数据进行有监督训练得到的。

其中，用户的特征数据包括用户对商品品类的需求程度，用户对商品品类的需求程度的呈现形式包括隐式需求和显式需求，用户对商品品类的需求程度为隐式需求程度与显式需求程度的加权平均，隐式需求包括商品品类与用户已购商品的关联程度、商品品类与用户家庭结构的关联程度中的一种或多种，显式需求包括用户对商品品类的关注程度。

其中，用户的特征数据包括：用户的家庭结构数据；和/或商品品类的价格段与用户购买能力的匹配程度；和/或用户对商品品类的关注程度；和/或用户对商品品类的购买周期，及当前时间是否处于购买周期范围内；和/或商品品类与用户已购商品的关联程度。

其中，对用户的特征数据进行有监督模型训练包括：对用户的特征数据进行标记，获取用户的特征数据对应的商品品类的购买概率。

其中，该商品推荐方法还包括：对价格/购买量/购买频率异常商品的特征的权重进行归一化处理；和/或对离散特征数据进行编码处理；和/或对部分特征数据进行多项式等非线性拓展。

其中，品类购买概率预测模型包括回归模型、Lasso模型、弹性网络模型、逐步回归模型、稳健回归模型、Xgboost模型、Adaboost模型、随机森林模型中的任意一种。

其中，用户数据包括用户行为数据和用户属性信息；用户行为数据包括用户基于通信网络条件进行操作活动所产生的数据，用户行为数据包括站内数据和站外数据，站内数据包括用户在购物网站内的活动行为数据，站外数据包括用户所使用物/互联网设备的使用行为数据。

为解决上述技术问题，本发明采用的另一个技术方案是：提供一种商品推荐设备，该商品推荐设备包括处理器，处理器用于执行指令以实现上述的商品推荐方法。

为解决上述技术问题，本发明采用的另一个技术方案是：提供一种计算机可读存储介质，该计算机可读存储介质用于存储指令/程序数据，指令/程序数据能够被执行以实现上述的商品推荐方法。

本发明的有益效果是：区别于现有技术的情况，本发明通过分别获取待推荐商品的推荐预测分和用户对商品品类的购买概率，综合用户商品偏好和购买需求，能够准确地向用户推荐有购买需求且符合其口味的商品。

附图说明

图1是本申请实施方式中第一商品推荐方法的流程示意图；

图2是本申请实施方式中第二商品推荐方法的流程示意图；

图3是本申请实施方式中一评分矩阵的示意图；

图4是本申请实施方式中一商品相似度矩阵的示意图；

图5是本申请实施方式中商品评分预测模型训练方法的流程示意图；

图6是本申请实施方式中第三商品推荐方法的流程示意图；

图7是本申请实施方式中第四商品推荐方法的流程示意图；

图8是本申请实施方式中品类购买概率预测模型训练方法的流程示意图；

图9是本申请实施方式中第五商品推荐方法的流程示意图；

图10是申请实施方式中第六商品推荐方法的流程示意图；

图11是本申请实施方式中商品推荐装置的结构示意图；

图12是本申请实施方式中商品推荐设备的结构示意图；

图13是本申请实施方式中计算机可读存储介质的结构示意图。

具体实施方式

为使本发明的目的、技术方案及效果更加清楚、明确，以下参照附图并举实施例对本发明进一步详细说明。

本申请提供一种商品推荐方法，通过分别获取待推荐商品的推荐预测分和用户对商品品类的购买概率，综合用户商品偏好和购买需求，能够准确地向用户推荐符合用户实际需求的商品。

请参阅图1，图1是本申请实施方式中第一商品推荐方法的流程示意图。需注意的是，若有实质上相同的结果，本实施例并不以图1所示的流程顺序为限。如图1所示，本实施方式包括：

S110：利用商品的评分获取待推荐商品的推荐预测分，利用用户数据获取用户对商品品类的购买概率。

S130：结合待推荐商品的推荐预测分和商品品类的购买概率，得到推荐商品。

线上购物平台所提供的商品纷杂繁多，为便于管理，可对商品进行分类，得到多种商品品类，如服装类、家电类、日常生活用品类等，进一步地，商品品类还可以有更细节的划分，如服装类包括上衣、裤子、鞋子、帽子等，家电类包括电视、冰箱、洗衣机、空调等，日常生活用品包括桌子、椅子、牙膏、牙刷、洗发露等。用户可根据自己的需求，在不同品类下选买商品。用户购买商品后，可根据自身满意程度对商品进行评分，不同人对同一商品的满意程度可能会不同，因此，同一商品可有多种评分。

因商品的评分可反映用户对商品的满意程度，因此，可根据用户对商品的评分，推算用户可能感兴趣的商品，以推荐给用户。如可以是基于用户对商品S的喜欢，给用户推荐与S相似/相关联的商品。待推荐商品可以有多个，可以给待推荐商品打分，赋予推荐预测分，以区分商品的推荐程度，选出最值得推荐的商品。如可以是推荐预测分越高，对应的推荐程度也越高，即推荐预测分越高，越有可能推荐给用户。当然，此处不限定推荐预测分的打分规则，可以根据需求设置。

基于商品的评分所推荐的商品，一定程度上是用户所感兴趣的，但不一定是用户所要想买的，即推荐的商品不一定满足用户的购买需求，不能更好的提高购买率。

本实施方式中，在基于商品评分的基础上，还考虑了用户的购买需求，并将两者结合，以推荐出用户想买的商品。其中，因商品纷杂繁多，分别计算每个商品的购买概率计算量将非常庞大，本申请中选用计算商品品类的购买概率，一定程度上可反映用户对某一品类内商品的购买概率，可以更多的推荐这一品类下的商品，如可以优选推荐这一品类下，用户所感兴趣的商品。即可结合待推荐商品的推荐预测分和商品品类的购买概率，选取购买概率高的商品品类下的推荐预测分高的商品作为推荐商品，向用户推荐该推荐商品。

该实施方式中，通过分别获取待推荐商品的推荐预测分和用户对商品品类的购买概率，综合用户商品偏好和购买需求，能够准确地向用户推荐有购买需求且符合其口味的商品。

请参阅图2，图2是本申请实施方式中第二商品推荐方法的流程示意图。需注意的是，若有实质上相同的结果，本实施例并不以图2所示的流程顺序为限。该实施方式中，可基于商品的协同过滤原理，根据商品的评分进行商品推荐。如图2所示，本实施方式包括：

S210：获取商品的评分，得到评分矩阵。

请参阅图3，图3是本申请实施方式中一评分矩阵的示意图。组合多个商品的评分，可得到用户-商品评分矩阵A。该矩阵中包括多个商品的多个评分，以及每个评分对应的用户，如果某个用户对某件商品未产生行为，即该用户未对该商品进行搜索、浏览、加购、收藏、分享、购买但未评分等行为活动，则将矩阵中对应元素值设为0。例如用户a对商品101的评分为5，对商品104未产生行为。

S230：利用商品的评分计算商品间的关联关系。

请参阅图4，图4是本申请实施方式中一商品相似度矩阵的示意图。利用用户-商品评分矩阵A计算各个商品之间的相似度，得到商品相似度矩阵B。其中，商品之间的相似度是商品之间关联程度的量化表示，不能简单的理解成商品表面特征/功能的相近。即该种方式可能会计算出洗衣机与冰箱相关联。例如商品103与商品104之间的相似度为3。

S250：利用评分矩阵和商品间的关联关系获取待推荐商品的推荐预测分。

将用户-商品评分矩阵A与商品相似度矩阵B相乘，得到用户-商品推荐预测分矩阵C。其中，矩阵中的元素代表待推荐商品的推荐预测分。对应不同的用户，同一商品可以有多个推荐预测分，可以根据推荐预测分给用户推荐商品。

该实施方式中，基于商品的协同过滤原理，根据商品的评分进行商品推荐，能够根据用户评分中的喜好，有效地利用其他用户的相似信息，发现用户潜在的但自己尚未发现的兴趣偏好，以向用户推荐符合用户喜好的商品。

但是，用户进行购物时，可能并不会对所有已购买商品进行评分，且用户已购买商品量有限，易造成用户-商品的评分矩阵较为稀疏，导致推荐效果存在偏颇的可能。

本申请中，可对未评价商品的评分进行预测，使未评价商品也具有评分，再结合已评价商品的评分，能够增加协同过滤原始评分矩阵的数据量，更利于计算商品相似度，增加了待推荐商品的数量以及待推荐商品推荐预测分的准确性。未评价商品包括用户进行搜索、浏览、加购、收藏、分享、购买但未评分等行为活动的商品。

在一实施方式中，可结合已评价商品的评分和用户行为数据预测未评价商品的评分。

用户数据包括用户行为数据和用户属性信息；用户行为数据包括用户基于通信网络条件进行操作活动所产生的数据。所谓基于通信网络条件是，用户借助通过网络所做的行为，如浏览网站，使用APP，使用蓝牙传输数据等，可以被电子记录存储的一些行为数据。

用户行为数据包括站内数据和站外数据，站内数据包括用户在购物网站内的活动行为数据，站外数据包括用户使用物/互联网设备的使用行为数据。

站内数据包括用户在商城内的活动数据和相关商品信息。获取用户在商城内的ID及该ID下对应的标签，对应的标签包括用户已购商品特征的标签和用户购买能力的标签；获取用户的属性特征，属性特征包括用户的年龄、性别、地理位置等；获取用户对商品的搜索、浏览、加购、收藏、分享、购买、评分等动作足迹。

站外数据包括用户在家庭中使用的商品数据和该商品的实际使用数据。获取用户家庭中已联网的商品的ID、商品ID的信息、商品ID下的标签等，商品ID的信息包括商品的重量、体积、能效等级等，商品ID下的标签包括商品价位、商品所属的品类、商品的主要标签和次要标签、商品的空间属性等；获取用户家庭中已联网的商品的使用的时间、使用的功能等。

站外数据还包括用户在购物网站以外其他网页上的阅读数据。阅读数据包括用户在网络内容推荐中浏览或收藏的包含未联网绑定品类的阅读内容、内容推荐中浏览或收藏的产品选购技巧等。

为实现对未评价商品的评分进行预测，本申请提供一种商品评分预测模型，该商品评分预测模型是利用已评价商品的特征和评分，进行有监督训练得到。可以将已评价商品的特征作为输入，已评价商品的评分作为输出，对模型进行训练，得到商品评分预测模型。

请参阅图5，图5是本申请实施方式中商品评分预测模型训练方法的流程示意图。需注意的是，若有实质上相同的结果，本实施例并不以图5所示的流程顺序为限。如图5所示，本实施方式包括：

S510：获取已评价商品的特征数据。

商品的特征包括商品的基础特征，如商品的体积、重量参数、性能指标等可以直接获取的商品特征。具体可包括商品的ID、商品ID的信息、商品ID下的标签等，商品ID的信息为商品的物理属性，包括商品的重量、体积、能效等级等，商品ID下的标签包括商品价位、商品所属的品类、商品的主要标签和次要标签、商品的空间属性等，例如一商品为洗碗机，商品价位为4000-6000，商品所述品类为碗筷洗烘一体，商品空间属性为厨房，商品电器属性为解放双手。

商品的特征还包括商品的衍生特征，衍生特征是利用商品的基础特征和用户行为数据衍生出来的，如用户对该商品的偏爱程度值、用户对该商品的性能特征的满意程度、商品与用户需求相匹配的概率等需要间接获取的商品特征。也或者说可衍生出带有用户因素的特征。衍生特征可以根据需求有多种。

在一实施方式中，衍生特征包括用户对商品的偏爱程度，特别是同类商品中用户对某件商品的偏爱程度。可以有多种呈现形式反映用户对某个商品的偏爱程度。如该商品与用户已购商品的相似程度、该商品与用户特征的匹配程度、用户对该商品的关注程度等。商品与用户已购商品的相似程度可以是商品特征与用户已购商品公共特征的相似比率、商品标签与用户已购买商品标签的重合次数等。商品与用户特征的匹配程度可以是商品标签与用户标签的重合次数、商品价位段与用户购买能力的符合程度等。用户对商品的关注程度可以是用户对该商品的搜索次数、浏览次数、加购次数、收藏次数、分享次数等。可以给这些呈现形式赋予一定的权重，将这些呈现形式中的一个或多个进行加权平均，计算用户对商品的偏爱程度。例如，可利用如下计算公式计算用户对商品的偏爱分：

偏爱分＝(w₁*商品标签与用户已购商品标签重合次数+w₂*商品标签与用户标签重合次数+w₃*搜索次数+w₄*浏览次数+w₅*加购次数+w₆*收藏次数+w₇*商品的价位段)/(w₁+w₂+w₃+w₄+w₅+w₆+w₇)。

其中，可以采集一定时间内的数据来计算偏爱分，每次评测可以称之为一个评测周期，每一呈现形式的权重(W)为评测周期的倒数与影响值的乘积，影响值为该呈现形式对商品评分的影响程度。呈现形式对商品评分的影响程度包括该呈现形式下商品评分中的好评占比，如已分析出用户收藏的商品中评分为好评的占比为k，则k作为收藏这种呈现形式的影响值。计算该商品的偏爱分超过同类商品的比重，将该比重作为用户对商品的偏爱程度。如空调挂机有20个型号的商品，某个商品的用户偏爱分超越了89％的商品，那么89％作为该商品的偏爱程度。

在一实施方式中，衍生特征包括用户对商品特性的敏感程度，用户对商品特性的敏感程度的呈现形式包括用户对商品的空间特征的敏感程度、用户对商品的时间特征的敏感程度等。因为用户在特定的空间或者特定的时间对商品一些特征的要求较高，如用户晚上十点在卧室比晚上七点在客厅对商品噪声控制的要求更高，即对噪声更敏感，差评的可能性更大。因此，获取属于特定空间/时间的与用户敏感因素相关的商品的差评率，将差评率作为用户对空间/时间特征的敏感程度值。具体地，获取同一商品在不同空间/时间内，用户对空间/时间特征的差评率；计算每个空间/时间的差评率超越其他空间/时间的比例，得到用户对商品特性的敏感程度。

在一实施方式中，衍生特征包括商品特性与用户需求特征的匹配程度，商品特性与用户需求特征的匹配程度的呈现形式包括商品特性与用户需求特征反义的概率、商品特性与用户需求特征相近的概率等。用户购买商品时会考虑该商品标签与自身需求的符合程度。获取商品的评论中与用户需求反义的特征的差评比例，计算所有反义特征的差评比例的平均值，得到商品与用户需求反义的概率；获取商品的评论中与用户需求相近的特征的好评比例，计算所有相近特征的好评比例的平均值，得到商品与用户需求相近的概率。其中，计算商品特性与用户需求特征反义的概率包括：获取商品的反向差评率，反向差评率为用户对商品的反义特征的差评率，反义特征为与用户需求特征相反义的特征；计算每个商品的反向差评率超越同类商品的比例，得到商品特性与用户需求特征反义的概率。计算商品特性与用户需求特征相近的概率包括：获取商品的正向好评率，正向好评率为用户对商品的正向特征的好评率，正向特征为与用户需求特征相近的特征；计算每个商品的正向好评率超越同类商品的比例，得到商品特性与用户需求特征相近的概率。

在一实施方式中，衍生特征包括商品与用户需求相匹配的概率。用户的家庭环境和人口结构会影响用户对商品的选择。获取商品的特征的物理属性与用户需求的匹配程度，得到商品与用户需求相匹配的概率。如当家庭空间大时，用户在选择同一款式的空调时，会更偏好体积大一些的空调。

在一实施方式中，衍生特征包括商品特征和其所属空间特征的平均评分。商品的特征分为主要特征和次要特征，所属空间特征分为主要特征和次要特征，分别获取商品和其所属空间的多个主要特征和多个次要特征下的平均评分。用户购买商品时不仅会考虑对商品本身的需求特征，还会考虑对该商品所使用环境的需求特征。如一商品为空调，该型号空调的主要特征有急速冷暖，次要特征由节能省电，分别获取该型号空调在急速冷暖和节能省电下的平均评分；空调所属空间为卧室，卧室的主要特征有静音，次要特征有无风，分别获取该型号空调在静音和无风下的平均评分。

在一实施方式中，衍生特征包括商品特征与用户浏览或收藏的阅读内容中该品类商品特征相匹配的概率。

S530：处理已评价商品的特征数据，得到样本特征值。

样本特征值为作为训练用的样本的特征值。上述获取的商品基础特征和衍生特征有连续特征数据，也有离散特征数据；一些衍生特征是用户进行操作才可得到，并非所有用户的所有商品都能得到上述所有衍生特征。因此，需要对商品的基础特征和衍生特征进行进一步的处理，使得更好地利用这些特征数据。

当某些用户的某些特征缺失时，可采用相似用户的平均特征值代替。获取用户自身的标签属性、已购买商品的标签属性等数据，采用聚类分析的方法进行用户间距离值计算，选取与目标用户距离最近的m个用户作为相似用户，使用m个相似用户该特征下的平均特征值代替目标用户该特征下的特征值。当目标用户为新用户，缺少行为数据，无法计算出相似用户时，使用目标用户所在地区用户该特征下的平均特征值代替目标用户该特征下的特征值。

当部分特征数据异常时，对数据权重归一化处理。如在促销节日时，用户对商品的行为数据较多，此时价格影响占主导作用，但是实际商品的评分并不会因为价格低而变高，此时，需对促销节日的商品数据和用户行为数据的权重做归一化处理。或者说同一用户多次大量购买同一商品等，都可称之为异常数据。

当部分特征为离散数据时，需要对数据进行量化处理。本实施方式中对离散特征数据进行编码处理。当部分特征之间存在关联时，考虑特征之间的交互作用，对部分特征数据进行多项式等非线性拓展。

上述商品的基础特征和衍生特征较多，且并不是都能很好地利用，需要对特征数据进行处理选择。如高位特征采用PCA降维方法，提取特征中的主要特征分量；或者采用Lasso模型对特征数据进行L1正则化，压缩数据结构；或采用递归消除法、集成模型等选出对模型组合效果较好的多个特征数据，得到样本特征值。本实施方式中，对特征数据进行处理选择的方式不进行限定。

S550：将已评价商品的特征值作为输入，已评价商品的评分作为输出，对模型进行训练，得到商品评分预测模型。

本实施方式中，可以使用广义回归模型、集成模型等多个模型进行综合评估，常用的广义回归模型包括回归模型、Lasso模型、弹性网络模型、逐步回归模型、稳健回归模型等，常用的集成模型包括Xgboost模型、Adaboost模型、随机森林模型等，将已评价商品的特征值以及评分输入到模型中，对模型进行有监督的训练，其中，选择预测准确率及预测偏差程度低的模型作为商品评分预测模型。

该实施方式中，通过对已评价商品的特征进行分析，结合用户行为数据提取对用户评分影响程度高的特征，用以训练商品评分预测模型，能够更好地利用现有的用户数据，采用用户真实的评分数据训练模型，增加模型预测结果的准确性。

请参阅图6，图6是本申请实施方式中第三商品推荐方法的流程示意图。需注意的是，若有实质上相同的结果，本实施例并不以图6所示的流程顺序为限。如图6所示，本实施方式包括：

S610：利用商品评分预测模型预测未评价商品的评分。

获取未评价商品的基础特征，利用未评价商品的基础特征和用户行为数据获取未评价商品的衍生特征。对未评价商品的基础特征和衍生特征进行处理选择，得到未评价商品的预测用特征值。获取未评价商品的基础特征和衍生特征的方法请参阅上文描述，在此不再赘述。将预测用特征值输入训练好的商品评分预测模型中，提取未评价商品的特征向量，预测得到用户对该未评价商品的评分。

S630：结合已评价商品的评分和未评价商品的评分，得到评分矩阵。

得到多个用户的已评价商品的评分矩阵，将未评价商品的评分加入到已评价商品的评分矩阵中，得到用户-商品评分矩阵A。

S650：利用商品的评分计算商品间的关联关系。

利用用户-商品评分矩阵A计算各个商品之间的相似度，得到商品相似度矩阵B。

S670：利用评分矩阵和商品间的关联关系获取待推荐商品的推荐预测分。

将用户-商品评分矩阵A与商品相似度矩阵B相乘，得到用户-商品推荐预测分矩阵C。其中，矩阵中的元素代表用户对待推荐商品的推荐预测分。可根据预测分对用户进行商品推荐。

该实施方式中，采用商品评分预测模型预测未评价商品的评分，使得未评价商品的评分更符合用户的真实评分，同时增加了协同过滤原始评分矩阵的数据量，提高了缺省值赋值的可能性，解决矩阵稀疏问题，更利于计算商品相似度，降低少数人的不合理偏好对模型造成影响的概率，增加了待推荐商品的数量以及待推荐商品推荐预测分的准确性。

请参阅图7，图7是本申请实施方式中第四商品推荐方法的流程示意图。需注意的是，若有实质上相同的结果，本实施例并不以图7所示的流程顺序为限。如图7所示，本实施方式包括：

S710：获取用户的特征数据。

用户的特征数据包括用户数据和用户衍生特征数据。用户衍生特征数据是利用用户数据衍生出来的，如用户的家庭结构、用户对品类商品的需求程度、用户对品类商品的购买周期等需要间接获取的用户的特征数据。

在一实施方式中，用户衍生特征数据包括用户的家庭结构。用户的家庭结构具体包括用户的家庭人口数、家庭人口结构、家居空间等。可以通过用户购买的家电的体积、尺寸等物理属性、功能属性或联网商品的功能使用情况判断用户家庭人口数，如利用煮饭使用的水位判断用餐人数等。可以通过联网绑定的商品品类属性及使用的功能属性判断家庭老人儿童等人口结构，如用户购买儿童空调并使用了儿童防踢被等功能，则判断用户家庭中有儿童，如用户联网适用的APP中创建并使用了老人相关的功能模式，则判断用户家庭中有老人。还可以通过客厅、厨房、卧室等家电综合评估家具空间大小，如利用客厅/卧室等空调匹数大小预测客厅/卧室的面积，利用客厅电视尺寸预测客厅的面积，利用冰箱体积判断厨房面积等。也可以是用户在注册时主动提供。

在一实施方式中，用户衍生特征数据包括用户对品类商品的需求程度。用户对品类商品的需求程度包括隐式需求和显式需求，综合隐式需求和显式需求得到该品类的需求程度。隐式需求包括根据家庭空间、关联设备、家庭结构等推论出的需求，如根据家庭空间判断家庭所需的品类，以及在家电联动中发现用户已有的家电品类及数量，综合判断用户对还需持续补充的商品品类有隐式需求；如根据联网商品判断用户对该商品的补充商品品类有隐式需求，如已联网的设备为空调，则判断用户对空调伴侣有隐式需求；如用户在网络内容推荐中浏览或收藏中包含未联网商品品类的选购或使用，则判断用户对该商品品类有隐式需求。显式需求包括根据用户关注程度得到的需求，获取用户对品类商品的搜索、浏览、加购、收藏、分享、购买等动作足迹，并对各动作进行加权平均，计算得到用户对该品类商品的关注程度。其中，根据动作发生距今的时间间隔确定该动作对应的权重，权重为时间间隔的指数函数的倒数。动作发生距今时间越近，对应的权重越大，并且，权重变大的成都越大，即动作发生距今时间越近，用户对对该品类商品的关注程度越大。对隐式需求和显式需求加权计算该品类的需求程度。该品类的需求程度计算公式如下：

需求程度＝(w₁*隐式需求+w₂显式需求)/(w₁+w₂)；

其中，计算不同分支品类下用户购买的频率作为隐式需求和显式需求的权重。

在一实施方式中，用户衍生特征数据包括用户对品类商品的购买周期。该品类商品的购买周期为判断当前时间是否处于该品类的购买周期范围内。对于一般商品，在用户一次购买之后，隔一段时间有消耗时会再次购买，根据用户先前购买数据规律判断当前是否处于该用户的购买周期内。

在一实施方式中，用户衍生特征数据包括用户对品类商品的再次购买的概率。如家电类产品除了与刚需相关，还会与装修需求有关。研究用户购买行为发现，若发现在一定的时间内，该用户有购买套系产品的可能性，部分用户有进行全屋需求购买的可能性，此时该全屋家装品类也应当提高再次该买的频率。由具备该特征的用户数/具备该行为的特征数计算用户对品类商品的再次购买的概率。

在一实施方式中，用户衍生特征数据包括用户已购买商品所在品类的价位段。不同价位的同一品类商品的需求频率不同。综合分析该商品在品类中的实际价格和企划预计的不同市场人群估计的价位，得到用户已购买商品所在品类的价位段。

在一实施方式中，用户衍生特征数据包括用户对已购买品类商品的行为数据。计算距今一段时间内，用户对已购买品类商品的搜索、浏览、加购、收藏、分享、购买等动作的次数和两次之间的时间间隔。

对上述用户数据和用户衍生特征数据进行进一步的处理，使得更好地利用这些特征数据。对异常数据进行权重归一化处理；对离散特征数据进行编码处理；对部分特征数据进行多项式等非线性拓展；采用PCA降维方法、Lasso模型、递归消除法、集成模型中等一个或多个模型对上述用户数据和用户衍生特征数据处理，得到模型输入特征值。具体数据处理方法与上述对商品的基础特征和衍生特征的数据处理方法相同，在此不再赘述。

S730：将用户的特征数据输入商品品类购买概率预测模型，得到商品品类的购买概率。

在一实施方式中，品类购买概率预测模型是利用先前的用户特征训练得到。

请参阅图8，图8是本申请实施方式中品类购买概率预测模型训练方法的流程示意图。需注意的是，若有实质上相同的结果，本实施例并不以图8所示的流程顺序为限。如图8所示，本实施方式包括：

S810：获取先前的用户特征数据。

先前用户特征数据为进行模型训练时的用户特征数据，用户的特征数据包括用户数据和用户衍生特征数据。

S830：处理先前的用户特征数据，得到用户输入特征值。

对上述用户数据和用户衍生特征数据进行进一步的处理，使得更好地利用这些特征数据。具体数据处理方法与上述商品的基础特征和衍生特征的数据处理方法相同，在此不再赘述。

S850：利用先前的用户特征的用户输入特征值训练品类购买概率预测模型。

本实施方式中，可以使用广义回归模型、集成模型等多个模型进行综合评估，常用的广义回归模型包括回归模型、Lasso模型、弹性网络模型、逐步回归模型、稳健回归模型等，常用的集成模型包括Xgboost模型、Adaboost模型、随机森林模型等，将先前的用户特征的用户输入特征值以及人为设定的概率标签输入到模型中，对模型进行有监督的训练，其中，选择预测准确率及预测偏差程度低的模型作为品类购买概率预测模型。

该实施方式中，考虑用户对不同品类商品的需求，使用用户先前的数据训练购买概率预测模型，增加模型预测的准确性，利用品类购买概率预测模型预测用户当前对各品类商品的购买概率，解决传统模型中仅能推荐偏好商品的不足。

请参阅图9，图9是本申请实施方式中第五商品推荐方法的流程示意图。需注意的是，若有实质上相同的结果，本实施例并不以图9所示的流程顺序为限。如图9所示，本实施方式包括：

S910：获取用户行为数据和已评价商品的评分。

S930：结合已评价商品的评分和用户行为数据，预测未评价商品的评分。

S950：综合已评价商品的评分和未评价商品的评分得到评分矩阵。

S970：利用商品的评分计算商品间的关联关系。

S990：利用评分矩阵和商品间的关联关系获取待推荐商品的推荐预测分。

该实施方式中，结合已评价商品的评分和用户行为数据预测未评价商品的评分，使得未评价商品的评分更符合用户的真实评分，同时增加了协同过滤原始评分矩阵的数据量，提高了缺省值赋值的可能性，解决矩阵稀疏问题，更利于计算商品相似度，降低少数人的不合理偏好对模型造成影响的概率，增加了待推荐商品的数量以及待推荐商品推荐预测分的准确性。

请参阅图10，图10是本申请实施方式中第六商品推荐方法的流程示意图。需注意的是，若有实质上相同的结果，本实施例并不以图10所示的流程顺序为限。如图10所示，本实施方式包括：

S1010：获取用户行为数据和已评价商品的评分。

S1020：结合已评价商品的评分和用户行为数据，预测未评价商品的评分。

S1030：综合已评价商品的评分和未评价商品的评分得到评分矩阵。

S1040：利用商品的评分计算商品间的关联关系。

S1050：利用评分矩阵和商品间的关联关系获取待推荐商品的推荐预测分。

S1060：利用用户数据获取用户对商品品类的购买概率。

S1070：结合待推荐商品的推荐预测分和商品品类的购买概率，得到推荐商品。

结合待推荐商品的推荐预测分和其所属商品品类的购买概率，向用户推荐商品品类的购买概率高，推荐预测分高的待推荐商品。

在一实施方式中，分别将待推荐商品的推荐预测分和商品品类的购买概率按从高到低的顺序排列，选取购买概率大于第一阈值的商品品类作为推荐商品品类，选取推荐预测分大于第二阈值且商品品类属于推荐商品品类的待推荐商品作为推荐商品。

在一实施方式中，分别将待推荐商品的推荐预测分和商品品类的购买概率按从高到低的顺序排列，选取购买概率大于第一阈值的商品品类作为推荐商品品类，选取商品品类属于推荐商品品类的排名靠前的N个待推荐商品作为推荐商品。

在一实施方式中，将商品品类的购买概率按从高到低的顺序排列，选取购买概率大于第一阈值的商品品类作为推荐商品品类，从待推荐商品中选取属于推荐商品品类的商品，并将该商品分品类按推荐预测分从高到低的顺序排列，在每种品类中选取推荐预测分大于第二阈值的待推荐商品作为推荐商品或者排名靠前的N个待推荐商品作为推荐商品。

该实施方式中，通过采用评分预测模型对用户未评价商品进行评分，提高了缺省值赋值的可能性，解决矩阵稀疏问题，降低少数人不合理偏好对模型造成影响的概率，增加了待推荐商品的数量以及待推荐商品推荐预测分的准确性；同时采用品类购买概率预测模型，解决了传统模型中仅能推荐偏好商品的不足；结合用户的商品偏好和购买需求，能够准确向用户推荐有购买需求且符合其品味的商品。

请参阅图11，图11是本申请实施方式中商品推荐装置的结构示意图。该实施方式中，商品推荐装置包括获取模块111、推荐模块112。

其中获取模块111用于获取待压缩神经网络中多个滤波器的多个滤波器参数；分析模块112用于利用商品的评分获取待推荐商品的推荐预测分，利用用户数据获取用户对商品品类的购买概率；推荐模块112用于结合待推荐商品的推荐预测分和商品品类的购买概率，得到推荐商品。该商品推荐装置用于通过分别获取待推荐商品的推荐预测分和用户对商品品类的购买概率，综合用户商品偏好和购买需求，能够准确地向用户推荐符合用户实际需求的商品。

请参阅图12，图12是本申请实施方式中商品推荐设备的结构示意图。该实施方式中，商品推荐设备121包括处理器122。

处理器122还可以称为CPU(Central Processing Unit，中央处理单元)。处理器122可能是一种集成电路芯片，具有信号的处理能力。处理器122还可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器122也可以是任何常规的处理器等。

商品推荐设备121可以进一步包括存储器(图中未示出)，用于存储处理器122运行所需的指令和数据。

处理器122用于执行指令以实现上述本申请商品推荐方法任一实施例及任意不冲突的组合所提供的方法。

请参阅图13，图13是本申请实施方式中计算机可读存储介质的结构示意图。本申请实施例的计算机可读存储介质11存储有指令/程序数据12，该指令/程序数据12被执行时实现本申请商品推荐方法任一实施例以及任意不冲突的组合所提供的方法。其中，该指令/程序数据12可以形成程序文件以软件产品的形式存储在上述存储介质11中，以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质11包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质，或者是计算机、服务器、手机、平板等终端设备。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

以上所述仅为本发明的实施方式，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种商品推荐方法，其特征在于，所述方法包括：

利用商品的评分获取待推荐商品的推荐预测分，利用用户数据获取用户对商品品类的购买概率；

结合所述待推荐商品的推荐预测分和所述商品品类的购买概率，得到推荐商品。

2.根据权利要求1所述的商品推荐方法，其特征在于，所述利用商品的评分获取待推荐商品的推荐预测分包括：

获取所述商品的评分，得到评分矩阵；

利用所述商品的评分计算商品间的关联关系；

利用所述评分矩阵和所述商品间的关联关系获取所述待推荐商品的推荐预测分。

3.根据权利要求2所述的商品推荐方法，其特征在于，所述用户数据包括用户行为数据，所述获取商品的评分，得到评分矩阵包括：

获取已评价商品的评分；

结合所述已评价商品的评分和所述用户行为数据，预测未评价商品的评分；

综合所述已评价商品的评分和所述未评价商品的评分得到所述评分矩阵。

4.根据权利要求3所述的商品推荐方法，其特征在于，所述结合已评价商品的评分和所述用户行为数据，预测未评价商品的评分包括：

获取所述未评价商品的特征数据；

将所述未评价商品的特征数据输入商品评分预测模型，获取所述未评价商品的评分，所述商品评分预测模型是利用已评价商品的特征数据和已评价商品的评分训练出来的；

其中，商品的特征包括衍生特征，所述衍生特征是利用商品的基础特征和所述用户行为数据衍生出来的。

5.根据权利要求4所述的商品推荐方法，其特征在于，

所述衍生特征包括用户对商品的偏爱程度，所述用户对商品的偏爱程度的呈现形式包括商品与用户已购商品的相似程度、商品与用户特征的匹配程度、用户对商品的关注程度中的一种或多种。

6.根据权利要求5所述的商品推荐方法，其特征在于，

获取所述用户对商品的偏爱程度包括：

将至少两种呈现形式进行加权平均，得到用户对商品的偏爱分；

计算每个商品的偏爱分超越同类商品的比例，得到所述用户对商品的偏爱程度。

7.根据权利要求6所述的商品推荐方法，其特征在于，

所述将至少两种呈现形式进行加权平均包括：

每一呈现形式的权重为评测周期的倒数与影响值的乘积，所述影响值为呈现形式对商品评分的影响程度，所述呈现形式对商品评分的影响程度包括呈现形式下商品评分中的好评占比，所述评测周期为数据采集周期。

8.根据权利要求5-7任一项所述的商品推荐方法，其特征在于，

所述商品与用户已购商品的相似程度包括商品特征与用户已购商品公共特征的相似比率、商品标签与用户已购买商品标签的重合次数中的一种或多种；

所述商品与用户特征的匹配程度包括商品标签与用户标签的重合次数、商品价位段与用户购买能力的符合程度中的一种或多种；

所述用户对商品的关注程度包括用户对该商品的搜索次数、浏览次数、加购次数、收藏次数、分享次数中的一种或多种。

9.根据权利要求4所述的商品推荐方法，其特征在于，

所述衍生特征包括用户对商品特性的敏感程度，所述用户对商品特性的敏感程度的呈现形式包括用户对商品的空间特征的敏感程度、用户对商品的时间特征的敏感程度中的一种或多种。

10.根据权利要求9所述的商品推荐方法，其特征在于，

计算所述用户对商品的空间/时间特征的敏感程度包括：

获取商品在不同空间/时间内，用户对空间/时间特征的差评率；

计算每个空间/时间的差评率超越其他空间/时间的比例，得到所述用户对商品的空间/时间特征的敏感程度。

11.根据权利要求4所述的商品推荐方法，其特征在于，

所述衍生特征包括商品特性与用户需求特征的匹配程度，所述商品特性与用户需求特征的匹配程度的呈现形式包括商品特性与用户需求特征反义的概率、商品特性与用户需求特征相近的概率中的一种或多种。

12.根据权利要求11所述的商品推荐方法，其特征在于，

计算所述商品特性与用户需求特征反义的概率包括：

获取商品的反向差评率，所述反向差评率为用户对商品的反义特征的差评率，所述反义特征为与用户需求特征相反义的特征；计算每个商品的所述反向差评率超越同类商品的比例，得到所述商品特性与用户需求特征反义的概率；

计算所述商品特性与用户需求特征相近的概率包括：

获取商品的正向好评率，所述正向好评率为用户对商品的正向特征的好评率，所述正向特征为与用户需求特征相近的特征；计算每个商品的所述正向好评率超越同类商品的比例，得到所述商品特性与用户需求特征相近的概率。

13.根据权利要求4所述的商品推荐方法，其特征在于，所述方法还包括：

采用相似用户的与缺失特征相对应的特征的平均特征值代替所述缺失特征；和/或

对价格/购买量/购买频率异常商品的特征的权重进行归一化处理；和/或

对离散特征数据进行编码处理；和/或

对部分特征数据进行多项式等非线性拓展。

14.根据权利要求4所述的商品推荐方法，其特征在于，

所述商品评分预测模型包括回归模型、Lasso模型、弹性网络模型、逐步回归模型、稳健回归模型、Xgboost模型、Adaboost模型、随机森林模型中的任意一种。

15.根据权利要求1所述的商品推荐方法，其特征在于，

所述利用用户数据获取用户对商品品类的购买概率包括：

获取用户的特征数据；

将所述用户的特征数据输入品类购买概率预测模型，得到所述商品品类的购买概率，所述商品品类购买概率预测模型是对用户特征数据进行有监督训练得到的。

16.根据权利要求15所述的商品推荐方法，其特征在于，

所述用户的特征数据包括用户对商品品类的需求程度，所述用户对商品品类的需求程度的呈现形式包括隐式需求和显式需求，所述用户对商品品类的需求程度为隐式需求程度与显式需求程度的加权平均，所述隐式需求包括商品品类与用户已购商品的关联程度、商品品类与用户家庭结构的关联程度中的一种或多种，所述显式需求包括用户对商品品类的关注程度。

17.根据权利要求15所述的商品推荐方法，其特征在于，所述用户的特征数据包括：

用户的家庭结构数据；和/或

商品品类的价格段与用户购买能力的匹配程度；和/或

用户对商品品类的关注程度；和/或

用户对商品品类的购买周期，及当前时间是否处于购买周期范围内；和/或

商品品类与用户已购商品的关联程度。

18.根据权利要求15所述的商品推荐方法，其特征在于，所述对用户的特征数据进行有监督模型训练包括：

对所述用户的特征数据进行标记，获取所述用户的特征数据对应的商品品类的购买概率。

19.根据权利要求15所述的商品推荐方法，其特征在于，所述方法还包括：

对离散特征数据进行编码处理；和/或

对部分特征数据进行多项式等非线性拓展。

20.根据权利要求15所述的商品推荐方法，其特征在于，

所述品类购买概率预测模型包括回归模型、Lasso模型、弹性网络模型、逐步回归模型、稳健回归模型、Xgboost模型、Adaboost模型、随机森林模型中的任意一种。

21.根据权利要求1所述的商品推荐方法，其特征在于，

所述用户数据包括用户行为数据和用户属性信息；所述用户行为数据包括用户基于通信网络条件进行操作活动所产生的数据，所述用户行为数据包括站内数据和站外数据，所述站内数据包括用户在购物网站内的活动行为数据，所述站外数据包括用户使用物/互联网设备的使用行为数据。

22.一种商品推荐设备，其特征在于，所述商品推荐设备包括处理器，所述处理器用于执行指令以实现如权利要求1-21任一项所述的商品推荐方法。

23.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储指令/程序数据，所述指令/程序数据能够被执行以实现如权利要求1-21任一项所述的商品推荐方法。