CN116362836A

CN116362836A - 基于用户行为序列的农产品推荐算法

Info

Publication number: CN116362836A
Application number: CN202310327360.1A
Authority: CN
Inventors: 黄英来; 冀宇超; 黄鹤林; 李宁; 牛达伟
Original assignee: Northeast Forestry University
Current assignee: Northeast Forestry University
Priority date: 2023-03-30
Filing date: 2023-03-30
Publication date: 2023-06-30

Abstract

本发明公开了一种基于用户行为序列的农产品推荐方法，包括：(1)用长短期记忆网络和注意力网络相结合组成深度兴趣网络，以此来捕获物品的潜在特征；(2)构建用户‑商品二部图；(3)利用图神经网络提取图数据的连接信息对每个节点的影响，并更新节点的嵌入式表示，以获取用户的潜在特征；(4)将两种潜在特征通过多层感知机得到待推荐农产品的购买概率。(5)进一步提取和利用了用户行为序列中的用户深度兴趣，并将其融合深度兴趣网络进行推荐。相比于从同类使用图神经网络提取节点嵌入式表达的算法，更适用于大规模稀疏网络；本发明提出的模型对农产品推荐任务更有效果。

Description

基于用户行为序列的农产品推荐算法

技术领域

本发明涉及推荐算法和图神经网络领域，特别涉及一种基于用户行为序列的农产品推荐算法

背景技术

现代电商平台普遍使用了推荐系统，推荐系统是为了解决信息过载而产生的一种信息过滤工具，通常包括收集用户信息和分析用户偏好、构建用户兴趣模型、确定推荐算法并推荐实施等部分。推荐系统能提高用户的忠诚度和黏着性,还能创造经济效益.早期的推荐系统，主要是为了预测用户的兴趣，由此来判断用户是否购买此农产品，缺点是，早期的农产品数目、种类较少，无法准确的为用户推荐合适的农产品。同时，由于农产品的季节性特点，销售的旺季淡季十分明显，在农产品淡季时，用户几乎不会搜索农产品，购买的可能性很小。

对于推荐系统，尽管前期已有很多人就此提出了多种算法和应用实现方案，不过依旧有许多问题尚未得到解决，譬如冷启动问题、数据稀疏问题等就是比较典型的问题，而且是普遍存在的问题。现有的传统推荐算法不能完全适用于农产品推荐，往往会造成推荐精度不高,不能很好地捕捉到用户兴趣。因此找出一种高效精准的农产品推荐方法，对于创造农产品的经济效益具有重要意义。

而现有的比较流行的模型大多为多层感知机通过池化不同分组的特征获得固定长度的兴趣表示向量，然而，并非所有的历史行为对于表征用户兴趣都起着同等重要的作用。长短期记忆网络与注意力网络相结合组成的深度兴趣模型，它的输入融合了用户画像特征和历史行为，利用用户历史行为序列信息，使用Attetion机制动态构建用户兴趣Embeeding，使模型能够捕获用户兴趣。。

发明内容

针对上述内容，本发明创造了一种基于户行为序列的农产品推荐算法，提高待推荐商品的购买概率

为了实现上述内容，本发明采用的技术方案如下：

一种基于户行为序列的农产品推荐算法，包括如下步骤：

步骤1：搜集农产品数据，制作农产品数据集，作为本实验的训练数据集，并进行预处理；

步骤2：获取深度兴趣模型作为实验的基础网络模型，对深度兴趣模型进行改进，搭建有效的农产品推荐网络DGNN-PR；

步骤3：将搜集到的农产品数据集，输入到深度兴趣模型在农产品数据集上进行充分地预训练，训练轮次设置为50，保存训练后的模型参数；

步骤4：再将处理好的数据集数据，输入到图神经网络中进行预训练，在制作的农产品数据集上训练深度兴趣模型，直到网络的测试损失趋于平稳的时候，停止训练，并保存测试精度最高的模型参数

步骤5：载入充分训练后的参数，并将图神经网络参数与深度兴趣模型的参数在嵌入层进和融合，得到待推荐商品的购买概率；

优选地，所述的步骤1具体为：

搜集获得农产品数据集，包括用户ID、商品类别、购买月份、用户行为(如购买次数、浏览、点赞、评论数、询价数)、购买数量、输入数据到Embedding层，将数据转换成嵌入式向量。

优选地，所述的步骤2包括：

首先，搭建深度兴趣网络，其主要包括：LSTM部分，Attention部分其中：

传统的多层感知机模型通过池化不同分组的特征获得固定长度的兴趣表示向量，然而，并非所有的历史行为对于表征用户兴趣都起着同等重要的作用。长短期记忆网络与注意力网络相结合组成的深度兴趣模型，它的输入融合了用户画像特征和历史行为，利用用户历史行为序列信息，使用Attetion机制动态构建用户兴趣embeeding，使模型能够捕获用户兴趣。

Local-attention使用用户兴趣的本地激活特征来搜索历史行为中对目标商品的软性驱动力。用户的兴趣表示矢量不再是统一的权重，而是在历史行为序列中通过自适应加权计算来获取用户兴趣表示向量的值，其公式为：

然后，对深度兴趣网络进行改进。

首先，将处理好的数据通过Embedding层输入到图神经网络中，具体如下：

推荐算法的输入数据由两部分组成，分别是用户集U＝{u₁,u₂,...,u_n}和项目集I＝{i₁,i₂,...,i_m}，其中n是用户数量，m是项目数量，每个样本中的属性数量不相同。将每个用户(农产品)的特征都通过Embedding映射为一个d维的嵌入向量。用户集U的嵌入向量表示为

f为用户的特征数量；项目集I的嵌入向量表示为

a为项目的特征数量在用户图中将特征作为节点，特征间的联系作为边，当两个特征同时出现在一个样本中时定义为这两个特征是有联系的。利用用户-商品的交互信息构建用户-商品二部图。比如一样农产品可以有多个分类，当两个属性同时出现在一个样本中，将定义为这两个属性是有联系的。以用户特征图为例，顶点集合为

将用户特征作为节点构成的图表示为G^U＝{V^U,E^U}，利用GNN的信息聚合和消息传递机制，学习每一个节点的向量。

将原始数据处理好之后输入到GNN层中。用户特征交互图包含了用户各个特征之间的联系，对用户特征进行交叉运算可以更好地学习用户的向量表示。在GNN消息传递机制中邻居节点信息的聚合方法有求和、取平均和取最大值，这里采用取平均的方法来聚合邻居节点的信息，以最大限度的保留各个邻居节点对当前节点的影响。GNN的消息传递机制表示如式

其中f表示一种可微的、且置换不变的函数，γ和φ均为可微分的函数，γ函数性质类似于常见的非线性激活函数。此机制相当于把一个节点的领域节点特征聚合到该节点。聚合的信息主要有两部分组成，第一部分主要是上一层中该节点自身的特征信息，第二部分是上一层中该节点和邻居节点相连边上所传递传递信息。当前节点表示如式

h_i＝δ(W·Aggregate{e_j,j∈N(i)}+b)

其中Aggregate可以为Mean、Sum、Max等函数，δ为激活函数，N_(i)为节点i在图中的邻居节点集合，e_j为节点i的邻居节点，W和b为权重和偏置，目的是利用GNN的消息传递机制学习特征之间的联系，也就是用户和产品之间的关联信息，得到用户(商品)的嵌入向量表示。

其次深度兴趣模型中对于不同的候选商品，通过目标注意力机制来进行用户兴趣的表示。模型中激活函数(Activation Function)计算候选物品和用户历史行为中物品的相关性权重，权重大小即代表用户历史行为对候选商品的相关程度。激活函数如下：

其中V_i表示用户u行为序列中第i次行为物品的嵌入向量，V_a表示候选商品的嵌入向量，V_u表示用户行为序列中所有行为物品的嵌入向量的加权和，以此表示用户兴趣。w_i表示V_i的权重，其含义为行为序列中的行为物品V_i与当前候选商品V_a，对用户表示V_u的贡献程度。权重w_i的计算通过使用激活函数计算得出，通过Dice激活函数输出，表示为g(V,V_ai)。通过这种计算方式，用户的兴趣向量V_u会随着候选商品V_a的变化而变化。同时，该模型能学习到点击次数、具体的购买频次，对某农产品的钟爱程度。

优选地，步骤3包括：

将搜集到的农产品数据集，输入到深度兴趣模型在农产品数据集上进行充分地预训练，训练轮次设置为50，保存每轮训练结束后的模型参数，选择50轮中测试精度最高的一轮的模型参数作为最终的实验网络参数。

优选地，步骤4包括：

由于用户和商品的交互只存在两种情况，用户决定购买和选择不购买，因此隐式反馈的方式可以定义用户的真实选择，即如果u_i选择参加c_j，则

为1，反之为0，/>

表示真实情况下u_i是否购买c_j。为了计算/>

和/>

的差距，使用二元交叉熵作为损失函数：如式

选择Adam作为实验网络的优化器，权重衰减系数设置为0.001。

优选地，步骤5包括：

将一对更新后的用户和活动的嵌入式表示进行衔接，再将其融合深度兴趣网络，最后输入到MLP层，利用sigmoid函数计算这对用户和待推荐商品的购买概率。

本发明相较现有技术具有以下有益效果：

本发明基于用户行为序列的农产品推荐算法解决了现阶段传统推荐算法不能完全适用于农产品推荐，往往会造成推荐精度不高,不能很好地捕捉到用户兴趣的问题。将LSTM模型，通过引入注意力机制，变成深度兴趣模型，通过使用图神经网络，学习用户-商品之间的关联信息，进一步与深度兴趣模型中学到的用户兴趣的动态进化性进行融合，提出的DGNN-PR模型提高了待推荐商品的购买概率。

经过实验验证，本发明所提出的农产品推荐方法在准确度上相比现阶段的农产品推荐方法有了较明显的提高。这验证了本发明创造的DGNN-PR网络模型在农产品电商平台任务中的优越性。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍。显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1是本发明提供的基于用户行为序列的农产品推荐网络结构图；

图2是本发明提供的深度兴趣模型中Attention单元结构图；

图3是本发明提供的在图神经网络层中构建的用户-商品二部图

图4是本发明提供的深度兴趣模型结构图

图5是本发明提供的各算法在数据集AUC对比结果；

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

附图中所示的流程图仅是示例性说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解，而有的操作/步骤可以合并或部分合并，因此实际执行的顺序有可能根据实际情况改变。

具体的，本发明实施例公开了一种基于用户行为序列的农产品推荐方法，首先本发明的整体实验步骤(详见图1)如下：

优选地，所述的步骤1具体为：

优选地，所述的步骤2包括：

传统的多层感知机模型通过池化不同分组的特征获得固定长度的兴趣表示向量，然而，并非所有的历史行为对于表征用户兴趣都起着同等重要的作用。长短期记忆网络与注意力网络相结合组成的深度兴趣模型，它的输入融合了用户画像特征和历史行为，利用用户历史行为序列信息，使用Attetion机制动态构建用户兴趣embeeding，使模型能够捕获用户兴趣。如图2

然后，对深度兴趣网络进行改进。

f为用户的特征数量；项目集I的嵌入向量表示为

a为项目的特征数量在用户图中将特征作为节点，特征间的联系作为边，当两个特征同时出现在一个样本中时定义为这两个特征是有联系的。利用用户-商品的交互信息构建用户-商品二部图如图3所示。比如一样农产品可以有多个分类，当两个属性同时出现在一个样本中，将定义为这两个属性是有联系的。以用户特征图为例，顶点集合为/>

h_i＝δ(W·Aggregate{e_j,j∈N(i)}+b)

其中V_i表示用户u行为序列中第i次行为物品的嵌入向量，V_a表示候选商品的嵌入向量，V_u表示用户行为序列中所有行为物品的嵌入向量的加权和，以此表示用户兴趣。w_i表示V_i的权重，其含义为行为序列中的行为物品V_i与当前候选商品V_a，对用户表示V_u的贡献程度。权重w_i的计算通过使用激活函数计算得出，通过Dice激活函数输出，表示为g(V,V_ai)。通过这种计算方式，用户的兴趣向量V_u会随着候选商品V_a的变化而变化。同时，该模型能学习到点击次数、具体的购买频次，对某农产品的钟爱程度。如图4