CN109509054B

CN109509054B - 海量数据下商品推荐方法、电子装置及存储介质

Info

Publication number: CN109509054B
Application number: CN201811157751.9A
Authority: CN
Inventors: 邓悦; 金戈; 徐亮; 肖京
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2018-09-30
Filing date: 2018-09-30
Publication date: 2023-04-07
Anticipated expiration: 2038-09-30
Also published as: CN109509054A

Abstract

本发明属于大数据分析技术领域，公开了一种海量数据下商品推荐方法包括：构建样本库；从样本库中选取样本，构建训练集，对样本进行预处理，包括注意力操作和池化操作；构建多层感知器神经网络模型；对多层感知器神经网络模型进行训练，输出概率向量；根据概率向量向用户推荐商品。本发明中，根据待推荐商品对当前用户兴趣的贡献度不同，向样本施加不同的注意力权重，并根据池化操作对用户的多重兴趣进行分类，经过多层感知器神经网络模型输出各待推荐商品的概率，根据概率大小向用户推荐商品。本发明可以提高模型性能和收敛速度，并提高向用户推荐商品的准确度，增加用户的体验感。本发明还公开了一种电子装置和计算机可读存储介质。

Description

海量数据下商品推荐方法、电子装置及存储介质

技术领域

本发明涉及大数据分析技术领域，尤其涉及一种海量数据下商品推荐方法、电子装置及存储介质。

背景技术

电子商务是以信息网络技术为手段，以商品交换为中心的商务活动。随着电子商务的不断发展，越来越多的用户选择在网上进行购物。用户通过浏览器访问电子商务网站，就可以方便地选择自己所需要的商品。但是，电商平台上的商品种类数目繁多，用户需要花费大量的时间才可以在琳琅满目的商品中挑选到自己需要的商品。在很多情况下，电子商务网站会向用户进行商品推荐，例如，用户购买了某一种商品之后，会向其推荐与该商品相似或者关联的商品。通过商品推荐，一方面可以提高电子商务网站的销量，另一方面，主动推荐可以避免用户因为频繁搜索查找而产生的不必要的搜索请求，减轻网站服务器的负担。

目前，电子商务网站是基于商品销售排行、用户对商品的评价评分或者对用户在电子商务网站的其他行为数据的分析来进行商品推荐。若仅依照少量的用户行为数据进行分析，无法保证分析出的用户行为的准确性，也就无法推荐与用户喜好相关度高的商品，因此，需要对大量的用户行为数据进行分析。在海量数据场景下，推荐系统会面临海量的训练规模，传统的推荐系统利用DNN模型(Deep Neural Network，深层神经网络模型)对海量数据进行训练，以减少人工的特征工程工作量，但是，模型性能与收敛速度始终不尽人意，导致训练速度较低，且DNN模型容易出现过拟合，而导致推荐商品的精准度较低。

发明内容

本发明提供一种海量数据下商品推荐方法、电子装置及存储介质，以解决现有推荐模型性能与收敛速度不尽人意，导致训练速度较低，且推荐商品的准确度较低的问题。

为了实现上述目的，本发明的一个方面是提供一种海量数据下商品推荐方法，应用于电子装置，包括以下步骤：

步骤S1、获取表征用户历史行为的第一特征向量以及表征待推荐商品的商品特征向量，构建样本库；

步骤S2、从所述样本库中选取样本，构建训练集，对训练集的样本进行预处理，用于多层感知神经网络模型的训练；

步骤S3、构建多层感知器神经网络模型；

步骤S4、利用经过预处理的样本对构建的多层感知器神经网络模型进行训练，得到训练后的多层感知器神经网络模型，输出概率向量；

步骤S5、根据所述概率向量向用户推荐商品；

其中，对训练集中的样本进行预处理包括：

步骤S21、输入训练集中的所述第一特征向量；

步骤S22、对所述第一特征向量施加注意力，得到注意力特征向量；

步骤S23、对所述注意力特征向量进行池化操作，得到池化向量；

步骤S24、将池化向量与商品特征向量融合，得到融合向量，作为多层感知器神经网络模型的输入。

优选地，所述步骤S1包括：

步骤S11、获取用户在设定时间段内产生的用户历史行为日志信息；

步骤S12、对用户历史行为日志信息进行处理，获取表征用户历史行为的第一特征向量；

步骤S13、获取表征待推荐商品的商品特征向量，与所述第一特征向量构建形成样本库。

优选地，所述步骤S22中，通过下式得到注意力特征向量：

其中，u表示用户兴趣的索引，V_u表示用户第u个兴趣的注意力特征向量，a表示第一特征向量的索引，V_a表示第a个第一特征向量，i表示待推荐商品的索引，V_i表示第i个待推荐商品的商品特征向量，g表示非线性激活函数，N表示待推荐商品的数量。

优选地，所述步骤S4包括：

S41、对所述多层感知器神经网络模型的参数进行初始赋值，所述参数包括输入层与隐藏层的连接权值、相邻隐藏层之间的连接权值、隐藏层与输出层的连接权值、输出层输出的预设阈值；

S42、根据训练集样本对所述多层感知器神经网络模型进行训练；

S43、判断多层感知器神经网络模型训练是否达到收敛条件，若达到收敛条件，则终止迭代，结束训练，得到训练后的多层感知器神经网络模型，输出概率向量，若未达到收敛条件，则返回步骤S42继续训练模型；其中，收敛条件为相邻两次迭代之后得到的损失函数值的差值小于设定值。

优选地，根据训练集样本对所述多层感知器神经网络模型进行训练包括：

S421、输入训练集中第一个训练样本对应的融合向量；

S422、根据输入的融合向量和所述参数确定所述多层感知器神经网络模型的输出；

S423、基于所述多层感知器神经网络模型的损失函数更新所述参数；

S424、根据更新后的参数训练下一个训练样本，循环步骤S422和S423，直至所有训练样本均经过所述多层感知器神经网络模型的训练，完成一次迭代，计算出所述多层感知器神经网络模型的损失函数值。

优选地，所述步骤S4中，对多层感知器神经网络模型的训练中加入正则化处理。

为了实现上述目的，本发明的另一个方面是提供一种电子装置，包括：

处理器；

存储器，用于存储商品推荐程序，

所述存储器中的商品推荐程序被所述处理器执行，所述处理器执行时实现如下步骤：

获取表征用户历史行为的第一特征向量以及表征待推荐商品的商品特征向量，构建样本库；

从所述样本库中选取样本，构建训练集，对训练集的样本进行预处理，用于多层感知神经网络模型的训练；

构建多层感知器神经网络模型；

利用经过预处理的样本对构建的多层感知器神经网络模型进行训练，得到训练后的多层感知器神经网络模型，输出概率向量；

根据所述概率向量向用户推荐商品；

其中，对训练集中的样本进行预处理包括：

输入训练集中的所述第一特征向量；

对所述第一特征向量施加注意力，得到注意力特征向量；

对所述注意力特征向量进行池化操作，得到池化向量；

将池化向量与商品特征向量融合，得到融合向量，作为多层感知器神经网络模型的输入。

优选地，所述处理器通过下式得到注意力特征向量：

优选地，所述处理器对多层感知器神经网络模型进行训练包括：

对所述多层感知器神经网络模型的参数进行初始赋值，所述参数包括输入层与隐藏层的连接权值、相邻隐藏层之间的连接权值、隐藏层与输出层的连接权值、输出层输出的预设阈值；

根据训练集样本对所述多层感知器神经网络模型进行训练；

判断多层感知器神经网络模型训练是否达到收敛条件，若达到收敛条件，则终止迭代，结束训练，得到训练后的多层感知器神经网络模型，输出概率向量，若未达到收敛条件，则继续训练模型；其中，收敛条件为相邻两次迭代之后得到的损失函数值的差值小于设定值。

本发明的再一个方面是提供一种计算机可读存储介质，包括商品推荐程序，所述商品推荐程序被处理器执行时，实现如上所述的海量数据下商品推荐方法的步骤。

相对于现有技术，本发明具有以下优点和有益效果：

本发明通过在多层感知神经网络模型中，使用注意力机制以反映每一个推荐商品对当前用户兴趣的贡献度，且进行池化操作以表征用户的多重喜好类别，选择与用户当前喜好类别相关性高的历史行为，向用户推荐商品，从而提高了模型的训练速度，并且提高了为用户推荐商品的精准度。本发明加入自适应正则以降低模型过拟合出现的概率。

附图说明

图1为本发明所述海量数据下商品推荐方法的流程示意图；

图2为图1中对训练集的样本进行预处理的流程示意图；

图3为本发明中商品推荐程序的模块示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

下面将参考附图来描述本发明所述的实施例。本领域的普通技术人员可以认识到，在不偏离本发明的精神和范围的情况下，可以用各种不同的方式或其组合对所描述的实施例进行修正。因此，附图和描述在本质上是说明性的，仅仅用以解释本发明，而不是用于限制权利要求的保护范围。此外，在本说明书中，附图未按比例画出，并且相同的附图标记表示相同的部分。

图1为本发明所述海量数据下商品推荐方法的流程示意图，如图1所示，本发明所述海量数据下商品推荐方法，包括以下步骤：

步骤S3、构建多层感知器神经网络模型；

步骤S5、根据所述概率向量向用户推荐商品；

图2为图1中对训练集的样本进行预处理的流程示意图，如图2所示，对训练集中的样本进行预处理包括：

步骤S21、输入训练集中的所述第一特征向量；

本发明中，通过对样本进行预处理，包括Attention操作(施加注意力操作)和池化操作，根据待推荐商品对当前用户兴趣的贡献度不同，向样本施加不同的注意力权重，并根据池化操作对用户的多重兴趣进行分类，经过多层感知器神经网络模型输出各待推荐商品的概率，根据概率大小向用户推荐商品。本发明可以提高模型性能和收敛速度，并提高向用户推荐商品的准确度，增加用户的体验感。

本发明的一个可选实施例中，所述步骤S1包括：

其中，用户历史行为日志信息是用户在商务网站或者APP上操作时，比如：用户进行的搜索内容、浏览页面、观看视频、购买商品、收藏、评论等操作，后台系统产生的记录有用户的操作行为数据的集合。设定时间段可以是一年或两年等较长时间段，也可以是一个月或两个月等较短时间段。用户的历史行为可以极大程度地反映出用户的喜好类别，以购买商品为例，用户在电商平台购买商品都会留下购买记录，通过购买记录可以确定用户的已购商品及相关信息，包括已购商品的商品id等，也可以从中判别用户购物的喜好类别和购物倾向，根据用户的喜好类别，向用户推荐商品，针对性更强，精准度更高，有利于提高用户体验，增加用户的满意度，其中，用户对商品的喜好程度可以根据用户对商品的浏览次数、购买次数、网页停留时间和是否收藏等确定。

需要说明的是，用户历史行为日志信息可以通过采用JavaScript标记收集数据的方式获取，但本发明并不限于此，也可以采用其他网络分析数据的收集方式收集用户历史行为数据。

由于用户的兴趣不唯一并且推荐的商品并非针对用户的所有兴趣，本发明中，对训练集中的样本进行预处理中，对第一特征向量施加注意力，即，进行Attention操作。Attention操作用于通过向样本施加不同的注意力权重，表征待推荐商品对用户兴趣的影响程度，有利于提高训练模型的精度。

优选地，根据下述公式对第一特征向量进行Attention操作，得到注意力特征向量：

其中，u表示用户兴趣的索引，V_u表示用户第u个兴趣的注意力特征向量，a表示第一特征向量的索引，V_a表示第a个第一特征向量，i表示待推荐商品的索引，V_i表示第i个待推荐商品的商品特征向量，w_i表示第i个待推荐商品对用户兴趣贡献的权重，N表示待推荐商品的数量。

权重w_i通过下式得到：

w_i＝g(V_i,V_a)

则：

其中，g表示非线性激活函数。

本发明中，非线性激活函数可以是任意形式的非线性激活函数，例如，Sigmoid函数、Tanh函数、ReLU函数等。

通过对第一特征向量施加注意力，对不同的待推荐商品分配不同的权重值，表征其对用户兴趣的贡献，以更加精准地根据用户兴趣向用户推荐商品，提高了模型的训练收敛速度，以及推荐商品的精准度。

本发明中，通过池化操作对用户的多重兴趣进行分类，以便于后续选择更用户兴趣较贴合的商品推荐给用户。

池化操作用于降低输出的特征向量的维度，且不易出现过拟合。池化操作包括最大池化、平均池化、随机池化等，确定池化窗口的大小之后，最大池化为选择每一池化窗口内的最大值作为该池化窗口池化后的值，平均池化为选择每一池化窗口内的平均值作为该池化窗口池化后的值，随机池化为根据池化窗口中元素的概率值大小随机选择其中的元素值作为池化窗口池化后的值。

本发明中，池化操作优选为最大池化。

本发明的一个实施例中，所述多层感知器神经网络模型包括输入层、多层隐藏层和输出层，其中，所述输入层输入融合向量，经过所述隐藏层传输，所述输出层输出概率向量，概率向量的向量元素个数与待推荐商品的数量相等，通过概率向量表征各个待推荐商品的推荐概率，选择概率较大的一个或多个概率相对应的待推荐商品向用户推荐。

优选地，对所述多层感知器神经网络模型进行训练，得到训练后的多层感知器神经网络模型包括以下步骤：

S42、根据训练集样本对所述多层感知器神经网络模型进行训练，包括：

S421、输入训练集中第一个训练样本对应的融合向量；

S424、根据更新后的参数训练下一个训练样本，循环步骤S422和S423，直至所有训练样本均经过所述多层感知器神经网络模型的训练，完成一次迭代，计算出所述多层感知器神经网络模型的损失函数值；

为了降低深度神经网络模型出现过拟合的可能性，优选地，步骤S4中，对多层感知器神经网络模型的训练中加入正则化处理。进一步地，本发明中，采用自适应正则，根据同一个商品特征向量出现的频率调整正则化的强度。具体地，对于出现频率较高的商品特征向量在训练更新参数时，加入较小的正则项，对于出现频率较低的商品特征向量在训练更新参数时，加入较大的正则项，其中，正则项的选择根据该商品特征向量出现的频率和训练集中的样本数量确定。

本发明中，步骤S6中，根据所述概率向量向用户推荐商品，其中，概率向量中的元素表征相对应的待推荐商品的推荐概率，根据各向量元素的大小，选择其中较大的一个或多个，将与其相对应的一个或多个待推荐商品推荐给用户。由于对第一特征向量进行了Attention操作，使得与用户当前兴趣更加切合的待推荐商品的推荐概率较高，输出的推荐结果更准确。

当用户实施当前行为后，当前行为包括搜索商品、在浏览页面浏览商品、观看商品的相关视频、购买商品、收藏或评论商品等行为，获取表征用户当前行为的第二特征向量，以及推荐系统中的已有的待推荐商品的第二商品特征向量；对第二特征向量和第二商品特征向量进行预处理，得到第二融合向量，将第二融合向量输入经过训练得到的多层感知器神经网络模型之后，输出与之相对应的概率向量，选择概率较高的一个或多个商品推荐给用户。

本发明所述海量数据下商品推荐方法用于电子装置，该电子装置可以是智能手机、平板电脑、计算机等具有运算功能的终端设备。

所述电子装置包括：网络接口、通讯总线、处理器和存储器。

所述存储器中包括商品推荐程序，所述处理器执行所述商品推荐程序，实现如下步骤：

构建多层感知器神经网络模型；

根据所述概率向量向用户推荐商品；

其中，对训练集中的样本进行预处理包括：

输入训练集中的所述第一特征向量；

对所述第一特征向量施加注意力，得到注意力特征向量；

对所述注意力特征向量进行池化操作，得到池化向量；

本发明中，处理器用于运行存储器中的存储程序，以实现商品推荐，例如，处理器可以中央处理器、微处理器或其他数据处理芯片。

本发明中，存储器用于存储处理器需要执行的程序，包括至少一种类型的可读存储介质，例如，闪存、硬盘等非易失性存储介质。存储器还可以用于暂时地存储已经输出或者将要输出的数据。存储器可以是电子装置的内部存储单元，也可以是外部存储装置，例如插接式硬盘、闪存卡或其他类型的存储卡等。本发明并不限于此，存储器可以是以非暂时性方式存储指令或软件以及任何相关联的数据文件并向处理器提供指令或软件程序以使该处理器能够执行指令或软件程序的任何装置。

网络接口可以包括标准的有线接口、无线接口(如WI-FI接口)，通常用于在该电子装置与其他电子设备之间建立通信连接。

通信总线用于实现这些组件之间的连接通信。

该电子装置还可以包括用户接口，用户接口可以包括输入单元比如键盘、语音输入装置比如麦克风等具有语音识别功能的设备、语音输出装置比如音响、耳机等，还可以包括标准的有线接口、无线接口。

可选地，该电子装置还可以包括显示器，例如，LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管触摸器等。显示器用于显示在电子装置中处理的信息以及用于显示可视化的用户界面。

本发明的一个可选实施例中，处理器构建样本库包括：

获取用户在设定时间段内产生的用户历史行为日志信息；

对用户历史行为日志信息进行处理，获取表征用户历史行为的第一特征向量；

获取表征待推荐商品的商品特征向量，与所述第一特征向量构建形成样本库。

优选地，处理器根据下述公式对第一特征向量进行Attention操作，得到注意力特征向量：

权重w_i通过下式得到：

w_i＝g(V_i,V_a)

则：

其中，g表示非线性激活函数。

本发明中，池化操作优选为最大池化。

优选地，处理器对所述多层感知器神经网络模型进行训练，得到训练后的多层感知器神经网络模型包括：

根据训练集样本对所述多层感知器神经网络模型进行训练，包括：输入训练集中第一个训练样本对应的融合向量；根据输入的融合向量和所述参数确定所述多层感知器神经网络模型的输出；基于所述多层感知器神经网络模型的损失函数更新所述参数；根据更新后的参数训练下一个训练样本，直至所有训练样本均经过所述多层感知器神经网络模型的训练，完成一次迭代，计算出所述多层感知器神经网络模型的损失函数值；

为了降低深度神经网络模型出现过拟合的可能性，优选地，对多层感知器神经网络模型的训练中加入正则化处理。进一步地，本发明中，采用自适应正则，根据同一个商品特征向量出现的频率调整正则化的强度。具体地，对于出现频率较高的商品特征向量在训练更新参数时，加入较小的正则项，对于出现频率较低的商品特征向量在训练更新参数时，加入较大的正则项，其中，正则项的选择根据该商品特征向量出现的频率和训练集中的样本数量确定。

本发明中，根据所述概率向量向用户推荐商品，其中，概率向量中的元素表征相对应的待推荐商品的推荐概率，根据各向量元素的大小，选择其中较大的一个或多个，将与其相对应的一个或多个待推荐商品推荐给用户。由于对第一特征向量进行了attention操作，使得与用户当前兴趣更加切合的待推荐商品的推荐概率较高，输出的推荐结果更准确。

在本发明的一个实施例中，商品推荐程序可以被分割成一个或多个模块，一个或多个模块被存储于存储器中，并由处理器执行，以实现商品推荐。本发明所述模块为能够完成特定功能的一系列计算机程序指令段。图3为本发明中商品推荐程序的模块示意图，如图3所示，样本库构建模块1、训练集构建模块2、预处理模块3、模型构建模块4、模型训练模块5、推荐模块6，各个模块所实现的功能或操作步骤均与上文类似，此处不再详述，示例性地，例如其中：

样本库构建模块1，获取表征用户历史行为的第一特征向量以及表征待推荐商品的商品特征向量，构建样本库；

训练集构建模块2，从所述样本库中选取样本，构建训练集；

预处理模块3，对训练集的样本进行预处理，用于多层感知神经网络模型的训练；

模型构建模块4，构建多层感知器神经网络模型；

模型训练模块5，利用经过预处理的样本训练多层感知器神经网络模型，输出概率向量；

推荐模块6，根据所述概率向量向用户推荐商品；

其中，所述预处理模块3包括：

输入单元31，输入所述第一特征向量；

注意力单元32，对所述第一特征向量施加注意力，得到注意力特征向量；

池化单元33，对所述注意力特征向量进行池化操作，得到池化向量；

融合单元34，将池化向量与商品特征向量融合，得到融合向量，作为多层感知器神经网络模型的输入。

本发明所述计算机可读存储介质中包括商品推荐程序，所述商品推荐程序被处理器执行时，实现如上所述的海量数据下商品推荐方法的步骤。

本发明之计算机可读存储介质的具体实施方式与上述海量数据下商品推荐方法、电子装置的具体实施方式大致相同，在此不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种海量数据下商品推荐方法，应用于电子装置，其特征在于，所述商品推荐方法包括以下步骤：

步骤S3、构建多层感知器神经网络模型；

步骤S5、根据所述概率向量向用户推荐商品；

其中，对训练集中的样本进行预处理包括：

步骤S21、输入训练集中的所述第一特征向量；

步骤S22、对所述第一特征向量施加注意力，通过下式得到注意力特征向量：

其中，u表示用户兴趣的索引，V_u表示用户第u个兴趣的注意力特征向量，a表示第一特征向量的索引，V_a表示第a个第一特征向量，i表示待推荐商品的索引，V_i表示第i个待推荐商品的商品特征向量，g表示非线性激活函数，N表示待推荐商品的数量；

步骤S24、将池化向量与商品特征向量融合，得到融合向量，作为多层感知器神经网络模型的输入；

其中，所述步骤S4包括：

2.根据权利要求1所述的海量数据下商品推荐方法，其特征在于，所述步骤S1包括：

3.根据权利要求1所述的海量数据下商品推荐方法，其特征在于，根据训练集样本对所述多层感知器神经网络模型进行训练包括：

S421、输入训练集中第一个训练样本对应的融合向量；

4.根据权利要求1所述的海量数据下商品推荐方法，其特征在于，所述步骤S4中，对多层感知器神经网络模型的训练中加入正则化处理。

5.一种电子装置，其特征在于，该电子装置包括：

处理器；

存储器，用于存储商品推荐程序，

构建多层感知器神经网络模型；

根据所述概率向量向用户推荐商品；

其中，对训练集中的样本进行预处理包括：

输入训练集中的所述第一特征向量；

对所述第一特征向量施加注意力，通过下式得到注意力特征向量：

对所述注意力特征向量进行池化操作，得到池化向量；

将池化向量与商品特征向量融合，得到融合向量，作为多层感知器神经网络模型的输入；

其中，所述处理器对多层感知器神经网络模型进行训练包括：

根据训练集样本对所述多层感知器神经网络模型进行训练；

判断多层感知器神经网络模型训练是否达到收敛条件，若达到收敛条件，则终止迭代，结束训练，得到训练后的多层感知器神经网络模型，输出概率向量，若未达到收敛条件，则返回步骤S42继续训练模型；其中，收敛条件为相邻两次迭代之后得到的损失函数值的差值小于设定值。

6.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中包括商品推荐程序，所述商品推荐程序被处理器执行时，实现如权利要求1至4中任一项所述的海量数据下商品推荐方法的步骤。