CN116362836A - 基于用户行为序列的农产品推荐算法 - Google Patents
基于用户行为序列的农产品推荐算法 Download PDFInfo
- Publication number
- CN116362836A CN116362836A CN202310327360.1A CN202310327360A CN116362836A CN 116362836 A CN116362836 A CN 116362836A CN 202310327360 A CN202310327360 A CN 202310327360A CN 116362836 A CN116362836 A CN 116362836A
- Authority
- CN
- China
- Prior art keywords
- user
- agricultural product
- interest
- network
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000006399 behavior Effects 0.000 claims abstract description 52
- 238000000034 method Methods 0.000 claims abstract description 27
- 238000013528 artificial neural network Methods 0.000 claims abstract description 15
- 230000007787 long-term memory Effects 0.000 claims abstract description 5
- 230000006870 function Effects 0.000 claims description 36
- 239000013598 vector Substances 0.000 claims description 36
- 230000004913 activation Effects 0.000 claims description 24
- 230000007246 mechanism Effects 0.000 claims description 24
- 238000012549 training Methods 0.000 claims description 24
- 238000012360 testing method Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 claims description 8
- 238000002474 experimental method Methods 0.000 claims description 8
- 230000003993 interaction Effects 0.000 claims description 8
- 239000013604 expression vector Substances 0.000 claims description 7
- 238000012935 Averaging Methods 0.000 claims description 6
- 230000002776 aggregation Effects 0.000 claims description 6
- 238000004220 aggregation Methods 0.000 claims description 6
- 230000005540 biological transmission Effects 0.000 claims description 6
- 238000011176 pooling Methods 0.000 claims description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 230000003044 adaptive effect Effects 0.000 claims description 3
- 230000004931 aggregating effect Effects 0.000 claims description 3
- 230000003542 behavioural effect Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 2
- 230000008901 benefit Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Business, Economics & Management (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于用户行为序列的农产品推荐方法,包括:(1)用长短期记忆网络和注意力网络相结合组成深度兴趣网络,以此来捕获物品的潜在特征;(2)构建用户‑商品二部图;(3)利用图神经网络提取图数据的连接信息对每个节点的影响,并更新节点的嵌入式表示,以获取用户的潜在特征;(4)将两种潜在特征通过多层感知机得到待推荐农产品的购买概率。(5)进一步提取和利用了用户行为序列中的用户深度兴趣,并将其融合深度兴趣网络进行推荐。相比于从同类使用图神经网络提取节点嵌入式表达的算法,更适用于大规模稀疏网络;本发明提出的模型对农产品推荐任务更有效果。
Description
技术领域
本发明涉及推荐算法和图神经网络领域,特别涉及一种基于用户行为序列的农产品推荐算法
背景技术
现代电商平台普遍使用了推荐系统,推荐系统是为了解决信息过载而产生的一种信息过滤工具,通常包括收集用户信息和分析用户偏好、构建用户兴趣模型、确定推荐算法并推荐实施等部分。推荐系统能提高用户的忠诚度和黏着性,还能创造经济效益.早期的推荐系统,主要是为了预测用户的兴趣,由此来判断用户是否购买此农产品,缺点是,早期的农产品数目、种类较少,无法准确的为用户推荐合适的农产品。同时,由于农产品的季节性特点,销售的旺季淡季十分明显,在农产品淡季时,用户几乎不会搜索农产品,购买的可能性很小。
对于推荐系统,尽管前期已有很多人就此提出了多种算法和应用实现方案,不过依旧有许多问题尚未得到解决,譬如冷启动问题、数据稀疏问题等就是比较典型的问题,而且是普遍存在的问题。现有的传统推荐算法不能完全适用于农产品推荐,往往会造成推荐精度不高,不能很好地捕捉到用户兴趣。因此找出一种高效精准的农产品推荐方法,对于创造农产品的经济效益具有重要意义。
而现有的比较流行的模型大多为多层感知机通过池化不同分组的特征获得固定长度的兴趣表示向量,然而,并非所有的历史行为对于表征用户兴趣都起着同等重要的作用。长短期记忆网络与注意力网络相结合组成的深度兴趣模型,它的输入融合了用户画像特征和历史行为,利用用户历史行为序列信息,使用Attetion机制动态构建用户兴趣Embeeding,使模型能够捕获用户兴趣。。
发明内容
针对上述内容,本发明创造了一种基于户行为序列的农产品推荐算法,提高待推荐商品的购买概率
为了实现上述内容,本发明采用的技术方案如下:
一种基于户行为序列的农产品推荐算法,包括如下步骤:
步骤1:搜集农产品数据,制作农产品数据集,作为本实验的训练数据集,并进行预处理;
步骤2:获取深度兴趣模型作为实验的基础网络模型,对深度兴趣模型进行改进,搭建有效的农产品推荐网络DGNN-PR;
步骤3:将搜集到的农产品数据集,输入到深度兴趣模型在农产品数据集上进行充分地预训练,训练轮次设置为50,保存训练后的模型参数;
步骤4:再将处理好的数据集数据,输入到图神经网络中进行预训练,在制作的农产品数据集上训练深度兴趣模型,直到网络的测试损失趋于平稳的时候,停止训练,并保存测试精度最高的模型参数
步骤5:载入充分训练后的参数,并将图神经网络参数与深度兴趣模型的参数在嵌入层进和融合,得到待推荐商品的购买概率;
优选地,所述的步骤1具体为:
搜集获得农产品数据集,包括用户ID、商品类别、购买月份、用户行为(如购买次数、浏览、点赞、评论数、询价数)、购买数量、输入数据到Embedding层,将数据转换成嵌入式向量。
优选地,所述的步骤2包括:
首先,搭建深度兴趣网络,其主要包括:LSTM部分,Attention部分其中:
传统的多层感知机模型通过池化不同分组的特征获得固定长度的兴趣表示向量,然而,并非所有的历史行为对于表征用户兴趣都起着同等重要的作用。长短期记忆网络与注意力网络相结合组成的深度兴趣模型,它的输入融合了用户画像特征和历史行为,利用用户历史行为序列信息,使用Attetion机制动态构建用户兴趣embeeding,使模型能够捕获用户兴趣。
Local-attention使用用户兴趣的本地激活特征来搜索历史行为中对目标商品的软性驱动力。用户的兴趣表示矢量不再是统一的权重,而是在历史行为序列中通过自适应加权计算来获取用户兴趣表示向量的值,其公式为:
然后,对深度兴趣网络进行改进。
首先,将处理好的数据通过Embedding层输入到图神经网络中,具体如下:
推荐算法的输入数据由两部分组成,分别是用户集U={u1,u2,...,un}和项目集I={i1,i2,...,im},其中n是用户数量,m是项目数量,每个样本中的属性数量不相同。将每个用户(农产品)的特征都通过Embedding映射为一个d维的嵌入向量。用户集U的嵌入向量表示为f为用户的特征数量;项目集I的嵌入向量表示为a为项目的特征数量在用户图中将特征作为节点,特征间的联系作为边,当两个特征同时出现在一个样本中时定义为这两个特征是有联系的。利用用户-商品的交互信息构建用户-商品二部图。比如一样农产品可以有多个分类,当两个属性同时出现在一个样本中,将定义为这两个属性是有联系的。以用户特征图为例,顶点集合为将用户特征作为节点构成的图表示为GU={VU,EU},利用GNN的信息聚合和消息传递机制,学习每一个节点的向量。
将原始数据处理好之后输入到GNN层中。用户特征交互图包含了用户各个特征之间的联系,对用户特征进行交叉运算可以更好地学习用户的向量表示。在GNN消息传递机制中邻居节点信息的聚合方法有求和、取平均和取最大值,这里采用取平均的方法来聚合邻居节点的信息,以最大限度的保留各个邻居节点对当前节点的影响。GNN的消息传递机制表示如式
其中f表示一种可微的、且置换不变的函数,γ和φ均为可微分的函数,γ函数性质类似于常见的非线性激活函数。此机制相当于把一个节点的领域节点特征聚合到该节点。聚合的信息主要有两部分组成,第一部分主要是上一层中该节点自身的特征信息,第二部分是上一层中该节点和邻居节点相连边上所传递传递信息。当前节点表示如式
hi=δ(W·Aggregate{ej,j∈N(i)}+b)
其中Aggregate可以为Mean、Sum、Max等函数,δ为激活函数,N(i)为节点i在图中的邻居节点集合,ej为节点i的邻居节点,W和b为权重和偏置,目的是利用GNN的消息传递机制学习特征之间的联系,也就是用户和产品之间的关联信息,得到用户(商品)的嵌入向量表示。
其次深度兴趣模型中对于不同的候选商品,通过目标注意力机制来进行用户兴趣的表示。模型中激活函数(Activation Function)计算候选物品和用户历史行为中物品的相关性权重,权重大小即代表用户历史行为对候选商品的相关程度。激活函数如下:
其中Vi表示用户u行为序列中第i次行为物品的嵌入向量,Va表示候选商品的嵌入向量,Vu表示用户行为序列中所有行为物品的嵌入向量的加权和,以此表示用户兴趣。wi表示Vi的权重,其含义为行为序列中的行为物品Vi与当前候选商品Va,对用户表示Vu的贡献程度。权重wi的计算通过使用激活函数计算得出,通过Dice激活函数输出,表示为g(V,Vai)。通过这种计算方式,用户的兴趣向量Vu会随着候选商品Va的变化而变化。同时,该模型能学习到点击次数、具体的购买频次,对某农产品的钟爱程度。
优选地,步骤3包括:
将搜集到的农产品数据集,输入到深度兴趣模型在农产品数据集上进行充分地预训练,训练轮次设置为50,保存每轮训练结束后的模型参数,选择50轮中测试精度最高的一轮的模型参数作为最终的实验网络参数。
优选地,步骤4包括:
由于用户和商品的交互只存在两种情况,用户决定购买和选择不购买,因此隐式反馈的方式可以定义用户的真实选择,即如果ui选择参加cj,则为1,反之为0,/>表示真实情况下ui是否购买cj。为了计算/>和/>的差距,使用二元交叉熵作为损失函数:如式
选择Adam作为实验网络的优化器,权重衰减系数设置为0.001。
优选地,步骤5包括:
将一对更新后的用户和活动的嵌入式表示进行衔接,再将其融合深度兴趣网络,最后输入到MLP层,利用sigmoid函数计算这对用户和待推荐商品的购买概率。
本发明相较现有技术具有以下有益效果:
本发明基于用户行为序列的农产品推荐算法解决了现阶段传统推荐算法不能完全适用于农产品推荐,往往会造成推荐精度不高,不能很好地捕捉到用户兴趣的问题。将LSTM模型,通过引入注意力机制,变成深度兴趣模型,通过使用图神经网络,学习用户-商品之间的关联信息,进一步与深度兴趣模型中学到的用户兴趣的动态进化性进行融合,提出的DGNN-PR模型提高了待推荐商品的购买概率。
经过实验验证,本发明所提出的农产品推荐方法在准确度上相比现阶段的农产品推荐方法有了较明显的提高。这验证了本发明创造的DGNN-PR网络模型在农产品电商平台任务中的优越性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本发明提供的基于用户行为序列的农产品推荐网络结构图;
图2是本发明提供的深度兴趣模型中Attention单元结构图;
图3是本发明提供的在图神经网络层中构建的用户-商品二部图
图4是本发明提供的深度兴趣模型结构图
图5是本发明提供的各算法在数据集AUC对比结果;
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
具体的,本发明实施例公开了一种基于用户行为序列的农产品推荐方法,首先本发明的整体实验步骤(详见图1)如下:
步骤1:搜集农产品数据,制作农产品数据集,作为本实验的训练数据集,并进行预处理;
步骤2:获取深度兴趣模型作为实验的基础网络模型,对深度兴趣模型进行改进,搭建有效的农产品推荐网络DGNN-PR;
步骤3:将搜集到的农产品数据集,输入到深度兴趣模型在农产品数据集上进行充分地预训练,训练轮次设置为50,保存训练后的模型参数;
步骤4:再将处理好的数据集数据,输入到图神经网络中进行预训练,在制作的农产品数据集上训练深度兴趣模型,直到网络的测试损失趋于平稳的时候,停止训练,并保存测试精度最高的模型参数
步骤5:载入充分训练后的参数,并将图神经网络参数与深度兴趣模型的参数在嵌入层进和融合,得到待推荐商品的购买概率;
优选地,所述的步骤1具体为:
搜集获得农产品数据集,包括用户ID、商品类别、购买月份、用户行为(如购买次数、浏览、点赞、评论数、询价数)、购买数量、输入数据到Embedding层,将数据转换成嵌入式向量。
优选地,所述的步骤2包括:
首先,搭建深度兴趣网络,其主要包括:LSTM部分,Attention部分其中:
传统的多层感知机模型通过池化不同分组的特征获得固定长度的兴趣表示向量,然而,并非所有的历史行为对于表征用户兴趣都起着同等重要的作用。长短期记忆网络与注意力网络相结合组成的深度兴趣模型,它的输入融合了用户画像特征和历史行为,利用用户历史行为序列信息,使用Attetion机制动态构建用户兴趣embeeding,使模型能够捕获用户兴趣。如图2
Local-attention使用用户兴趣的本地激活特征来搜索历史行为中对目标商品的软性驱动力。用户的兴趣表示矢量不再是统一的权重,而是在历史行为序列中通过自适应加权计算来获取用户兴趣表示向量的值,其公式为:
然后,对深度兴趣网络进行改进。
首先,将处理好的数据通过Embedding层输入到图神经网络中,具体如下:
推荐算法的输入数据由两部分组成,分别是用户集U={u1,u2,...,un}和项目集I={i1,i2,...,im},其中n是用户数量,m是项目数量,每个样本中的属性数量不相同。将每个用户(农产品)的特征都通过Embedding映射为一个d维的嵌入向量。用户集U的嵌入向量表示为f为用户的特征数量;项目集I的嵌入向量表示为a为项目的特征数量在用户图中将特征作为节点,特征间的联系作为边,当两个特征同时出现在一个样本中时定义为这两个特征是有联系的。利用用户-商品的交互信息构建用户-商品二部图如图3所示。比如一样农产品可以有多个分类,当两个属性同时出现在一个样本中,将定义为这两个属性是有联系的。以用户特征图为例,顶点集合为/>将用户特征作为节点构成的图表示为GU={VU,EU},利用GNN的信息聚合和消息传递机制,学习每一个节点的向量。
将原始数据处理好之后输入到GNN层中。用户特征交互图包含了用户各个特征之间的联系,对用户特征进行交叉运算可以更好地学习用户的向量表示。在GNN消息传递机制中邻居节点信息的聚合方法有求和、取平均和取最大值,这里采用取平均的方法来聚合邻居节点的信息,以最大限度的保留各个邻居节点对当前节点的影响。GNN的消息传递机制表示如式
其中f表示一种可微的、且置换不变的函数,γ和φ均为可微分的函数,γ函数性质类似于常见的非线性激活函数。此机制相当于把一个节点的领域节点特征聚合到该节点。聚合的信息主要有两部分组成,第一部分主要是上一层中该节点自身的特征信息,第二部分是上一层中该节点和邻居节点相连边上所传递传递信息。当前节点表示如式
hi=δ(W·Aggregate{ej,j∈N(i)}+b)
其中Aggregate可以为Mean、Sum、Max等函数,δ为激活函数,N(i)为节点i在图中的邻居节点集合,ej为节点i的邻居节点,W和b为权重和偏置,目的是利用GNN的消息传递机制学习特征之间的联系,也就是用户和产品之间的关联信息,得到用户(商品)的嵌入向量表示。
其次深度兴趣模型中对于不同的候选商品,通过目标注意力机制来进行用户兴趣的表示。模型中激活函数(Activation Function)计算候选物品和用户历史行为中物品的相关性权重,权重大小即代表用户历史行为对候选商品的相关程度。激活函数如下:
其中Vi表示用户u行为序列中第i次行为物品的嵌入向量,Va表示候选商品的嵌入向量,Vu表示用户行为序列中所有行为物品的嵌入向量的加权和,以此表示用户兴趣。wi表示Vi的权重,其含义为行为序列中的行为物品Vi与当前候选商品Va,对用户表示Vu的贡献程度。权重wi的计算通过使用激活函数计算得出,通过Dice激活函数输出,表示为g(V,Vai)。通过这种计算方式,用户的兴趣向量Vu会随着候选商品Va的变化而变化。同时,该模型能学习到点击次数、具体的购买频次,对某农产品的钟爱程度。如图4
优选地,步骤3包括:
将搜集到的农产品数据集,输入到深度兴趣模型在农产品数据集上进行充分地预训练,训练轮次设置为50,保存每轮训练结束后的模型参数,选择50轮中测试精度最高的一轮的模型参数作为最终的实验网络参数。
优选地,步骤4包括:
由于用户和商品的交互只存在两种情况,用户决定购买和选择不购买,因此隐式反馈的方式可以定义用户的真实选择,即如果ui选择参加cj,则为1,反之为0,/>表示真实情况下ui是否购买cj。为了计算/>和/>的差距,使用二元交叉熵作为损失函数:如式:
选择Adam作为实验网络的优化器,权重衰减系数设置为0.001。
优选地,步骤5包括:
将一对更新后的用户和活动的嵌入式表示进行衔接,再将其融合深度兴趣网络,最后输入到MLP层,利用sigmoid函数计算这对用户和待推荐商品的购买概率,将各个算法和DGNN-PR进行比对,实验结果如图5.
本发明相较现有技术具有以下有益效果:
本发明基于用户行为序列的农产品推荐算法解决了现阶段传统推荐算法不能完全适用于农产品推荐,往往会造成推荐精度不高,不能很好地捕捉到用户兴趣的问题。将LSTM模型,通过引入注意力机制,变成深度兴趣模型,通过使用图神经网络,学习用户-商品之间的关联信息,进一步与深度兴趣模型中学到的用户兴趣的动态进化性进行融合,提出的DGNN-PR模型提高了待推荐商品的购买概率。
经过实验验证,本发明所提出的农产品推荐方法在准确度上相比现阶段的农产品推荐方法有了较明显的提高。这验证了本发明创造的DGNN-PR网络模型在农产品电商平台任务中的优越性。
对上述所公开的发明的说明,使得本研究领域专家能够实现本发明。对上述发明的修改方法对本领域的学者来说是清晰明了的,本发明中所使用的一般原理方法可以在不脱离本发明的范围的情况下,在其它发明中使用。因此,本发明将不会被限制于本文所示的这些实施例,而是符合与本发明所公开的方法和创新点相一致的最大的范围。
Claims (6)
1.一种基于用户行为序列的农产品推荐方法,首先本发明的整体实验步骤如下:
步骤1:搜集农产品数据,制作农产品数据集,作为本实验的训练数据集,并进行预处理;
步骤2:获取深度兴趣模型作为实验的基础网络模型,对深度兴趣模型进行改进,搭建有效的农产品推荐网络DGNN-PR;
步骤3:将搜集到的农产品数据集,输入到深度兴趣模型在农产品数据集上进行充分地预训练,训练轮次设置为50,保存训练后的模型参数;
步骤4:再将处理好的数据集数据,输入到图神经网络中进行预训练,在制作的农产品数据集上训练深度兴趣模型,直到网络的测试损失趋于平稳的时候,停止训练,并保存测试精度最高的模型参数
步骤5:载入充分训练后的参数,并将图神经网络参数与深度兴趣模型的参数在嵌入层进和融合,得到待推荐商品的购买概率。
2.根据权利要求1所述的一种基于用户行为序列的农产品推荐方法其特征在于,步骤1包括:
搜集获得农产品数据集,包括用户ID、商品类别、购买月份、用户行为(如购买次数、浏览、点赞、评论数、询价数)、购买数量、输入数据到Embedding层,将数据转换成嵌入式向量。
3.根据权利要求1所述的一种基于用户行为序列的农产品推荐方法其特征在于,步骤2包括:
首先,搭建深度兴趣网络,其主要包括:LSTM部分,Attention部分其中:
传统的多层感知机模型通过池化不同分组的特征获得固定长度的兴趣表示向量,然而,并非所有的历史行为对于表征用户兴趣都起着同等重要的作用。长短期记忆网络与注意力网络相结合组成的深度兴趣模型,它的输入融合了用户画像特征和历史行为,利用用户历史行为序列信息,使用Attetion机制动态构建用户兴趣embeeding,使模型能够捕获用户兴趣。
Local-attention使用用户兴趣的本地激活特征来搜索历史行为中对目标商品的软性驱动力。用户的兴趣表示矢量不再是统一的权重,而是在历史行为序列中通过自适应加权计算来获取用户兴趣表示向量的值,其公式为:
然后,对深度兴趣网络进行改进。
首先,将处理好的数据通过Embedding层输入到图神经网络中,具体如下:
推荐算法的输入数据由两部分组成,分别是用户集U={u1,u2,...,un}和项目集I={i1,i2,...,im},其中n是用户数量,m是项目数量,每个样本中的属性数量不相同。将每个用户(农产品)的特征都通过Embedding映射为一个d维的嵌入向量。用户集U的嵌入向量表示为f为用户的特征数量;项目集I的嵌入向量表示为a为项目的特征数量在用户图中将特征作为节点,特征间的联系作为边,当两个特征同时出现在一个样本中时定义为这两个特征是有联系的。利用用户-商品的交互信息构建用户-商品二部图。比如一样农产品可以有多个分类,当两个属性同时出现在一个样本中,将定义为这两个属性是有联系的。以用户特征图为例,顶点集合为将用户特征作为节点构成的图表示为GU={VU,EU},利用GNN的信息聚合和消息传递机制,学习每一个节点的向量。
将原始数据处理好之后输入到GNN层中。用户特征交互图包含了用户各个特征之间的联系,对用户特征进行交叉运算可以更好地学习用户的向量表示。在GNN消息传递机制中邻居节点信息的聚合方法有求和、取平均和取最大值,这里采用取平均的方法来聚合邻居节点的信息,以最大限度的保留各个邻居节点对当前节点的影响。GNN的消息传递机制表示如式
其中f表示一种可微的、且置换不变的函数,γ和φ均为可微分的函数,γ函数性质类似于常见的非线性激活函数。此机制相当于把一个节点的领域节点特征聚合到该节点。聚合的信息主要有两部分组成,第一部分主要是上一层中该节点自身的特征信息,第二部分是上一层中该节点和邻居节点相连边上所传递传递信息。当前节点表示如式
hi=δ(W·Aggregate{ej,j∈N(i)}+b)
其中Aggregate可以为Mean、Sum、Max等函数,δ为激活函数,N(i)为节点i在图中的邻居节点集合,ej为节点i的邻居节点,W和b为权重和偏置,目的是利用GNN的消息传递机制学习特征之间的联系,也就是用户和产品之间的关联信息,得到用户(商品)的嵌入向量表示。
其次深度兴趣模型中对于不同的候选商品,通过目标注意力机制来进行用户兴趣的表示。模型中激活函数(Activation Function)计算候选物品和用户历史行为中物品的相关性权重,权重大小即代表用户历史行为对候选商品的相关程度。激活函数如下:
其中Vi表示用户u行为序列中第i次行为物品的嵌入向量,Va表示候选商品的嵌入向量,Vu表示用户行为序列中所有行为物品的嵌入向量的加权和,以此表示用户兴趣。wi表示Vi的权重,其含义为行为序列中的行为物品Vi与当前候选商品Va,对用户表示Vu的贡献程度。权重wi的计算通过使用激活函数计算得出,通过Dice激活函数输出,表示为g(V,Vai)。通过这种计算方式,用户的兴趣向量Vu会随着候选商品Va的变化而变化。同时,该模型能学习到点击次数、具体的购买频次,对某农产品的钟爱程度。
4.根据权利要求1所述的一种基于用户行为序列的农产品推荐方法其特征在于,步骤3包括:
将搜集到的农产品数据集,输入到深度兴趣模型在农产品数据集上进行充分地预训练,训练轮次设置为50,保存每轮训练结束后的模型参数,选择50轮中测试精度最高的一轮的模型参数作为最终的实验网络参数。
6.根据权利要求1所述的一种基于用户行为序列的农产品推荐方法其特征在于,步骤5包括:
将一对更新后的用户和活动的嵌入式表示进行衔接,再将其融合深度兴趣网络,最后输入到MLP层,利用sigmoid函数计算这对用户和待推荐商品的购买概率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310327360.1A CN116362836A (zh) | 2023-03-30 | 2023-03-30 | 基于用户行为序列的农产品推荐算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310327360.1A CN116362836A (zh) | 2023-03-30 | 2023-03-30 | 基于用户行为序列的农产品推荐算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116362836A true CN116362836A (zh) | 2023-06-30 |
Family
ID=86921380
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310327360.1A Pending CN116362836A (zh) | 2023-03-30 | 2023-03-30 | 基于用户行为序列的农产品推荐算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116362836A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116977035A (zh) * | 2023-09-25 | 2023-10-31 | 临沂大学 | 一种基于LightGBM和深度学习的农产品推荐方法 |
CN117994011A (zh) * | 2024-04-07 | 2024-05-07 | 山东科技大学 | 基于记忆更新与邻居传递的电商动态感知数据推荐方法 |
-
2023
- 2023-03-30 CN CN202310327360.1A patent/CN116362836A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116977035A (zh) * | 2023-09-25 | 2023-10-31 | 临沂大学 | 一种基于LightGBM和深度学习的农产品推荐方法 |
CN117994011A (zh) * | 2024-04-07 | 2024-05-07 | 山东科技大学 | 基于记忆更新与邻居传递的电商动态感知数据推荐方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112364976B (zh) | 基于会话推荐系统的用户偏好预测方法 | |
CN111681059B (zh) | 行为预测模型的训练方法及装置 | |
CN111523047A (zh) | 基于图神经网络的多关系协同过滤算法 | |
CN111932336A (zh) | 一种基于长短期兴趣偏好的商品列表推荐方法 | |
CN116362836A (zh) | 基于用户行为序列的农产品推荐算法 | |
CN113379494B (zh) | 基于异质社交关系的商品推荐方法、装置和电子设备 | |
CN109034960B (zh) | 一种基于用户节点嵌入的多属性推断的方法 | |
CN112700274B (zh) | 一种基于用户偏好的广告点击率预估方法 | |
CN110930219A (zh) | 一种基于多特征融合的个性化电商推荐方法 | |
CN115982463A (zh) | 资源推荐方法、装置、设备及存储介质 | |
CN115860880A (zh) | 基于多层异质图卷积模型的个性化商品推荐方法及系统 | |
CN116228368A (zh) | 一种基于深度多行为网络的广告点击率预测方法 | |
CN113298546A (zh) | 销量预测方法及装置、商品处理方法及装置 | |
Chen | An online retail prediction model based on AGA-LSTM neural network | |
Mallik et al. | A comprehensive survey on sales forecasting models using machine learning algorithms | |
El Youbi et al. | Machine Learning-driven Dynamic Pricing Strategies in E-Commerce | |
CN116204723A (zh) | 一种基于动态超图表示学习的社交推荐方法 | |
CN113610608B (zh) | 一种用户偏好推荐方法、装置、电子设备及存储介质 | |
CN114519600A (zh) | 一种融合相邻节点方差的图神经网络ctr预估算法 | |
KR20200142871A (ko) | 명시적 및 내연적 평가 정보를 이용한 아이템 추천 방법 및 장치 | |
CN118246939A (zh) | 一种基于注意力机制的DeepFM模型浏览数据处理的方法及系统 | |
CN115564532A (zh) | 序列推荐模型的训练方法及装置 | |
CN115293815A (zh) | 一种基于用户商品兴趣的跨平台电商用户对齐方法 | |
CN110956528B (zh) | 一种电商平台的推荐方法及系统 | |
Murthy et al. | Model for Predicting Prospective Big-Mart Sales Based on Grid Search Optimization (GSO) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20230630 |