CN116304289A

CN116304289A - 基于图神经网络的供应链的信息链推荐方法及装置

Info

Publication number: CN116304289A
Application number: CN202211453311.4A
Authority: CN
Inventors: 林荣恒; 瞿善宇; 吴步丹; 邹华
Original assignee: Beijing University of Posts and Telecommunications
Current assignee: Beijing University of Posts and Telecommunications
Priority date: 2022-11-21
Filing date: 2022-11-21
Publication date: 2023-06-23

Abstract

本发明公开了一种基于图神经网络的供应链中的信息链推荐方法和装置，包括：获取所述供应链中的信息链数据；预处理所述信息链数据；构建基于图神经网络的所述信息链的推荐模型；预测用户在所述信息链上对物品的喜爱程度。实践表明，本发明引入注意力机制，结合用户建模和物品建模，通过搭建深度学习模型实现了更优的信息推荐效果。

Description

基于图神经网络的供应链的信息链推荐方法及装置

【技术领域】

本发明属于信息挖掘推荐技术领域，尤其是一种基于图神经网络的供应链的信息链推荐方法及系统。

【背景技术】

近年来，随着互联网的迅速发展，大数据时代的数据规模爆炸式增长，海量数据充满着价值待用户进行数据挖掘。其中，供应链是生产流通中上下游组成的网链结构。网链结构中的上下游节点包含的大规模的海量数据，这些数据能动态整合形成多条信息链，如何在海量的节点数据组合中发现最优的节点信息链，缓解信息过载的问题，高效快速挖掘数据背后有价值的信息，成为研究的热点。

目前主要是利用推荐系统，根据用户的用户画像等数据，结合相关机器学习算法得到推荐分发列表，是目前解决信息过载的问题的有效方法。传统的推荐算法主要分为3类：基于内容的推荐算法，协同过滤的推荐算法和混合推荐算法。近年来，深度学习在计算机视觉、自然语言处理等领域取得了重大突破，也被广泛应用于推荐系统中。图神经网络算法作为一种深度学习算法，利用图数据节点的信息，节点和邻居节点之间的信息。尽管有众多的推荐算法存在，当前仍未有相关图神经网络算法应用在信息链推荐中。当前信息链链条推荐主要面临以下两个问题：(1)依赖背景理论知识丰富的综合型专家进行有效决策后推荐；(2)信息链链条推荐的准确度和实时性都有待提升。

【发明内容】

为解决上述问题，针对当前信息链链条推荐方法强依赖于支撑推荐决策的资深专家，对信息中的用户之间的合作与竞争关系变动感知不够实时，没有充分利用到信息链的全局信息，而且没有对信息链链条的推荐规则进行迭代更新的技术问题。本发明通过人工智能，深度学习的技术手段以图神经网络优化当前信息链链条推荐方式，提升了信息链链条推荐的准确性和实时性。

一方面，本发明提出一种基于图神经网络的供应链中的信息链推荐方法，包括：

步骤1：获取所述供应链中的信息链数据；

步骤2：预处理所述信息链数据；

步骤3：构建基于图神经网络的所述信息链的推荐模型；

步骤4：预测用户在所述信息链上对物品的喜爱程度。

进一步的，在上述技术方案的基础上，所述步骤1包括：

通过网络爬虫方式、网站提供的下载方式、或者主动向需求方申请相关数据使用权限的方式，获取对应场景的信息链数据，所述信息链数据包括该信息链链路各个节点的信息，每个节点上的有价值的活动信息以及所述活动产生的价值信息。

进一步的，在上述技术方案的基础上，所述步骤2包括：

对信息链数据进行数据清洗操作，所述清洗操作包括删除过期数据及重复数据；

根据信息链的已有链路进行图构建，对每个在链路的物品和用户分别生成对应的节点；

对产生过价值活动的用户与物品则建立连边，构成用户-物品二部图G1(V1,E1),其中，V1为所述产生过价值活动的用户与物品生成的节点的集合，E1为所述连边的集合；

对用户之间存在交互的行为建立相关的连边，构建用户-用户二部图G2(V2,E2)，其中V2为所述存在交互的行为的用户生成的节点的集合E2为所述连边的集合。

进一步的，在上述技术方案的基础上，所述步骤3包括：

统计用户与不同物品的交互行为，以及用户之间的关系网络，将相关数据整合在一起，搭建对应的用户-物品二部图和用户-用户二部图，其中，将用户嵌入化处理后转换为向量a_i存储用户信息，i表示所述用户的序号；将物品嵌入化处理得到包括物品信息的向量b_j，j表示所述物品的序号；单个用户对其购物物品的评价得分用独热码向量描述，记为评分向量V_r，r表示评价等级的级别；

构建用户建模，所述用户建模提供用户的表示能力的学习渠道，模型从所述用户-物品二部图中学习物品空间的用户特征隐层因子；

构建物品建模，所述物品建模依赖用户聚合，进而学习物品隐层因子辅助建模，其中，所述物品隐层因子的计算依赖于用户与物品的交互过程；

构建评分预测，所述评分预测综合所述用户建模和所述物品建模的结果得到推荐模型，利用推荐模型生成最终的预测评分。

进一步的，在上述技术方案的基础上，所述步骤4包括：

将预处理后的数据送入所述推荐模型，得到最终的预测评分，计算并排序用户对各个物品的偏好程度，得到根据偏好程度排序的相关推荐列表。

进一步的，在上述技术方案的基础上，所述构建用户建模还包括步骤：

连接所提取的物品向量b_j和评分向量V_r，过多层感知机输出物品序号为j的物品对用户序号为i的用户的感知交互向量x_ij，其中，

其中，/>

为向量之间的连接操作，g为信息聚合操作函数；

用双层神经注意网络来区分用户的重要度权重，将x_ij和用户a_i经过两层所述多层感知机组合的神经网络得到注意力系数α_ij，

其中，c₁,c₂是偏置项系数，W₁、W₂为神经网络权值，σ为非线性参数；

终态的注意力系数记作α_if，来自于softmax函数处理后的注意力系数α_ij，

终态注意力系数α_if加权处理x_ij向量，并且通过图神经网络累加聚合函数得到用户-物品特征y_i，其中，

y_i＝σ(w·{∑α_ifx_ij}+c)，c为偏置项。

进一步的，在上述技术方案的基础上，所述构建物品建模还包括步骤：

连接对用户向量a_i和评分向量V_r，获得物品对用户的感知交互z_ji向量，其中i为用户的序号，j为物品的序号；所述z_ji向量经过两层所述多层感知机组合的神经网络获取注意力系数β，对相关用户向量进行注意力系数加权处理，最终通过图神经网络累加聚合函数得到物品特征向量z_j。

进一步的，在上述技术方案的基础上，所述构建评分预测还包括步骤：

初始化步骤：连接用户特征向量y_i和物品特征向量z_j得到初始量为g₁，将g₁输入到多层感知机进行下述多层迭代步骤，其中，

其中下标1表示为第1层模型隐藏层，/>

为向量之间的连接操作；

多层迭代步骤：每一层的计算结果作为后一层的输入，即第m-1层的结果g_m-1作为由第m层的g_m的输入，即：g_m＝σ(w_m·g_m-1)+c_m，其中m＞1，c_m为第m层模型隐藏偏置项，w_m为对应层数神经网络权值，σ为非线性参数；

预测步骤：s`_ij为预测的评分，是用推荐模型计算得到的用户向量a_i对物品向量b_j预测结果，所述推荐模型为：s`_ij＝w^T·g_M，其中，M为多层感知机的最大层数，M≥3，w为神经网络权值；

为了确定推荐模型中的参数w，使用均方误差公式作为损失函数Loss进行模型训练，其中，

s_ij代表评分实际值，s`_ij代表评分期望值，N表示记录数量，

训练时，每完成所述多层迭代步骤得到推荐模型时，计算损失函数Loss，如果Loss的结果大于指定阈值时，则再次执行所述多层迭代步骤，直至Loss的结果不大于指定阈值时，则w的参数为所述推荐模型确定的参数，所得到的推荐模型用于预测。

另一方面，本发明还提出一种基于图神经网络的信息链链条推荐装置，其特征在于包括：

处理器和存储器，所述处理器与所述存储器通信连接，

其中，所述存储器存储有计算机指令，所述处理器运行所述计算机指令时执行上述技术方案中任一项所述的方法中的步骤。

本发明与现有技术相比，其显著优点为：

1.本发明通过图神经网络实现了针对供应链链条数据的推荐方法，引入注意力机制，结合用户建模和物品建模，通过搭建深度学习模型实现了供应链链条价值最大化的推荐。

2.本发明对信息链链条数据进行了预处理，实现了数据预处理模块，将供应链数据构建为用户-物品二部图和用户-用户二部图，并将其余相关数据作为特征一同进行嵌入处理。

3.本发明支持多种图嵌入方式和消息聚集函数，有较好地可拓展性，结合场景来选择对应的嵌入方式和消息聚集函数，在不同规模不同领域的数据集上均有优秀的推荐效果。

【附图说明】

图1是本发明提出的基于图神经网络的供应链中信息链推荐方法流程图。

图2是本发明提出的系统模型架构图。

图3是本发明提出的技术方案与其他方案的指标对比图。

【具体实施方式】

为了便于理解，本具体实施方式是本发明公开的基于图神经网络的供应链中的信息链推荐方法的优选实施例，以详细说明本发明的结构和发明点，但并不作为本发明权利要求的限定保护范围。

如图1所示的基于图神经网络的供应链中的信息链推荐方法的一个优选实施例，包括：

S1：获取供应链数据：通过网络爬虫，网站直接提供下载方式，或者需要主动向需求方申请相关数据使用权限，以获得对应场景的信息链数据。所述信息链数据主要涵盖该信息链链路各个节点的信息，每个节点的价值活动，价值活动产生的价值。

S2：预处理供应链数据，构建用户-物品二部图和用户-用户二部图：对信息链数据进行一定的数据清洗操作，废弃过期数据及重复数据，降低脏数据对模型结果的影响。根据信息链的已有链路进行图构建，对每个在链路的物品和用户生成对应的结点，对产生过价值活动的用户与物品则建立连边，构成用户-物品二部图G(V1,E1)，其中V1为所述用户与物品生成的节点的集合，E1为所述连边的集合。对用户之间存在交互的行为，同样的建立相关连边，构建用户-用户二部图G(V2,E2)，其中V2为所述存在交互的行为的用户生成的节点的集合，E2为所述连边的集合，通过这种方式有效融合供应链产业用户之间合作或者竞争的信息。

S3：结合注意力机制搭建基于图神经网络的供应链模型，将预处理后的数据送入基于图神经网络的供应链推荐模型：参见图2所示，通过用户建模User Modeling得到用户物品图，用户物品图提供用户的表示能力的学习渠道，模型从用户物品二部图中学习物品空间的用户特征隐层因子。大多数情况下，用户特征不仅依赖所购买或者出售的物品等，与用户所处的社交关系网络也密切相关。为了获取更精准的用户建模，需要结合存在异质信息的社交关系网络进行信息的聚集。当数据集存在社交关系图时，可以有效地增加社交信息辅助用户建模，用户特征的隐层因子可以结合社交视角的信息进行更好的学习。社会关系图中，不同类型的关系对用户特征的影响也不同，所以引入注意力机制聚合用户的社交信息，通过选择具有代表性的社交朋友来描述用户的社交信息，进一步地根据不同权重影响整体用户特征。

通过依赖用户聚合的物品建模ItemModeling，进而学习物品隐层因子辅助建模。物品隐层因子的计算也依赖于用户与物品的交互过程，多次交互的结果可能不同，每次交互的结果即供应链中的每条边最终对物品特征都有一定的影响。通过引入注意力机制做不同的权重计算，用多层注意力神经网络判定物品对用户的重要程度。

用户建模和物品建模都完成后，准备一个多层感知机MLP作为连接层，将它们的输出通过这个多层感知机，辅助评分预测时对得分的计算。

S4：模型输出结果，推荐预测得到的TopN相关评分，更新供应链条节点：将预处理后的数据送入基于图神经网络的供应链推荐模型，得到最终的预测评分，计算并排序用户对各个物品的偏好程度，得到根据偏好程度排序的相关TopN推荐列表，所述TopN为排名靠前的N个，N的数值可根据需求设定。

如图2所示本发明的一个系统模型架构图的优选实施例，其中，数据集包括：

Ciao数据集，作为一个DVD类别数据集，收集用户购物后的点评评分，以及用户之间的社交联系，常用于各大推荐系统场景。

Epinions数据集，由用户的社交关系和他们对电影的评价结果组成，数据来源于用户在网站上对各种产品的主观评价。

SupplyChain泛指各大供应链数据集，一般包括完整的上下游链路和每个节点涵盖的价值。

支持方法Embedding method包括：

DeepWalk：DeepWalk以随机游走的方式，适合图表示学习，能够最大化捕捉节点局部的结构信息。对应的两个向量之间的距离取决于两点在图中共有的邻近点数量，但无法处理边的权重，也缺乏基本游走策略的可选项。

Node2Vec：沿用DeepWalk随机游走的思路，具备两种游走策略宽度游走策略和深度游走策略。

GIN：图同构网络，使用和作为聚合函数，每个节点聚合邻居的特征向量，可以通过池化操作对图进行表示。

SDNE：使用深度自动编码器联合优化一阶和二阶网络邻近度，能够有效捕获高度非线性网络结构，并且兼容稀疏网络。

用户建模整体流程：

1.连接所提取的物品向量b_j和评分向量V_r，通过多层感知机输出物品j对用户i的感知交互向量x_ij

2.Attention Network：为了获取用户对物品的注意力系数α，需要将x_ij和用户a_i经过两层多层感知机组合的神经网络(其中，c₁,c₂是偏置项，W₁、W₂为神经网络权值，σ为非线性函数，如Relu函数)

3.终态的注意力系数来自于softmax后的注意力系数α，记作α_if

4.终态注意力参数α_if加权处理x_ij向量，并且通过图神经网络累加聚合函数得到用户-物品特征y_i,即User latent factor用户隐层因子，c为偏置项

物品建模：连接对用户向量a_i和评分向量V_r，学习物品隐层因子获得z_ji向量，i和j的含义与之前保持一致，分别指代用户和物品。与用户建模相似，z向量经过两层多层感知机组合的神经网络获取注意力系数，对相关用户向量进行注意力系数加权处理，最终通过图神经网络累加聚合函数得到物品特征向量z_j，即Item latent factor物品隐层因子。其中，α₁，α₂，α₃分别为用户建模时经过注意力网络得到的注意力系数示例，β₁，β₂，β₃分别为物品建模时经过注意力网络得到的注意力系数。

评分预测：使用评分预测作为评估推荐任务好坏，连接用户向量y_i和物品向量z_j，通过多层感知机得到相关预测评分。g_l为结合了社交信息的交互信息，l为模型隐藏层索引。

g_l-1＝σ(w_l·g_l-2)+c_l

s`_ij＝w^T·g_l-1

为了选择模型的参数，需要挑选目标函数辅助模型优化、损失函数使用均方误差公式进行计算，其中s代表评分实际值，s`代表评分期望值，N表示记录的总数量。

如图3所示，本模型在Ciao和Epinions，以及DataCo(一个智能供应链数据集)上表现优秀，具体表现于平均绝对误差MAE和均方根误差RMSE两项指标均较低，均优于基线模型的PMF，TrustMF和SoRec这三种矩阵分解模型，误差较低代表准确度较高，说明本优化方法推荐较为准确，不仅在传统数据集Ciao和Epinions上效果领先，在对应的供应链场景数据集DataCo上也优于其他模型，能够有效实现供应链推荐的效果，在供应链价值的信息链优化上有较大提升。

在本具体实施方案中，以我国某制造企业为例，对其供应链场景进行分析。供应链场景可以描述为：生产及流通过程中，涉及将产品或服务提供给最终用户活动的上下游企业所形成的网链结构,即将产品从商家送到消费者手中整个链条，如何通过供应链的相关信息链推荐得到价值最大化的生产链路，给上下游推荐合适的合作伙伴，进而辅助企业调整生产结构。首先根据制造企业提供相关供应链数据，构建信息链数据集R，包含企业之间的合作竞争关系，企业能够生产的物品，以及生产物品所能产生的价值；预处理信息链数据，对数据集R中的一些过期数据和重复数据进行剔除，降低模型的计算成本和运行时间。根据信息链的已有链路进行图构建，对每个在链路的物品和企业分别生成对应的节点；对产生过价值活动的企业与物品则建立连边，构成企业-物品二部图G1(V1,E1),其中，V为所述产生过价值活动的企业与物品生成的节点的集合，E1为所述连边的集合；对企业之间存在交互的行为建立相关的连边，构建企业-企业二部图G2(V2,E2)，其中V2为所述存在交互的行为的企业生成的节点的集合，E2为所述连边的集合。将数据集切割为测试集和验证集，依照上述方法构建相关图神经网络推荐模型，最终经过多轮训练得到合理的神经网络权值系数。最终将数据输入模型，为企业推荐出合适的合作伙伴，进而形成价值最大化的供应链的信息链链条，完成信息链推荐效果。

以上是本发明的一些具体实施方式，但本发明并不仅局限于上述方式，所有对本发明技术特征的简单变换，凡依本发明专利申请范围所述的构造、特征及原理所做的等效变化或修饰，都将落入本发明的保护范围之内。

Claims

1.一种基于图神经网络的供应链中的信息链推荐方法，其特征在于包括下述步骤：

步骤1：获取所述供应链中的信息链数据；

步骤2：预处理所述信息链数据；

步骤3：构建基于图神经网络的信息链的推荐模型；

步骤4：预测用户在所述信息链上对物品的喜爱程度；

其中，通过网络爬虫方式、网站提供的下载方式、或者主动向需求方申请相关数据使用权限的方式，获取对应场景的信息链数据，所述信息链数据包括该信息链链路各个节点的信息，每个节点上的有价值的活动信息以及所述活动产生的价值信息。

2.根据权利要求1所述的方法，其特征在于所述步骤2包括：

对用户之间存在交互的行为建立相关的连边，构建用户-用户二部图G2(V2,E2)，其中V2为所述存在交互的行为的用户生成的节点的集合，E2为所述连边的集合。

3.根据权利要求2所述的方法，其特征在于所述步骤3包括：

构建用户建模，所述用户建模依赖物品聚合，模型从所述用户-物品二部图中用户和物品之间的交互，学习用户特征隐层因子，为评分预测准备特征输入，所述用户-物品二部图包括用户和物品之间的相互作用,而且包含用户对物品的评价得分；

构建物品建模，所述物品建模依赖用户聚合，考虑用户有互动行为的相关物品及其用户对物品的评分来学习物品特征隐层因子辅助建模，其中，所述物品隐层因子的计算依赖于用户与物品的交互过程；

4.根据权利要求3所述的方法，其特征在于所述评价等级至少包括5个等级。

5.根据权利要求4所述的方法，其特征在于所述步骤4包括：

6.根据权利要求5所述的方法，其特征在于所述构建用户建模还包括步骤：

连接所提取的物品向量b_j和评分向量V_r，经过多层感知机输出物品序号为j的物品对用户序号为i的用户的感知交互向量x_ij，其中，

其中，/>

为向量之间的连接操作，g为多层感知机实现的信息聚合操作函数；

将x_ij和用户a_i经过两层所述多层感知机组合的神经网络得到注意力系数α_ij，其中，

c₁,c₂是偏置项系数，W₁、W₂为神经网络权值，σ为非线性激活函数，所述c₁,c₂，W₁、W₂，σ通过损失函数和神经网络的训练确定；

终态注意力系数α_if加权处理x_ij向量，并且通过图神经网络累加聚合函数得到用户-物品特征y_i，即用户特征隐层因子，其中，

y_i＝σ(w·{∑_j∈Dα_if·x_ij}+c)，σ为所述非线性激活函数，c为偏置项参数，D为用户关联的物品序号集合，j为所述物品集合中的序号元素，且所述w，c通过损失函数训练确定,所述c₁、c₂、W₁、W₂、σ1、w和c使得神经网络在训练时的损失函数的值小于设置的阈值。

7.根据权利要求6所述的方法，其特征在于：所述σ为Relu函数。

8.根据权利要求7所述的方法，其特征在于所述构建物品建模还包括步骤：

连接对用户向量a_i和评分向量V_r，获得物品对用户的感知交互向量z_ji，其中i为用户的序号，j为物品的序号；所述z_ji向量经过两层所述多层感知机组合的神经网络获取注意力系数β，对相关用户向量进行注意力系数加权处理，最终通过图神经网络累加聚合函数得到物品特征向量z_j，即物品特征隐层因子。

9.根据权利要求8所述的方法，其特征在于所述构建评分预测还包括步骤：

其中下标1表示为第1层模型隐藏层，/>

为向量之间的连接操作；

多层迭代步骤：每一层的计算结果作为后一层的输入，即第m-1层的结果g_m-1作为由第m层的g_m的输入，即：g_m＝σ(w_m·g_m-1)+c_m，其中m＞1，c_m为第m层模型隐藏偏置项，w_m为对应层数神经网络权值，σ为非线性函数；

预测步骤：s`_ij为预测的评分，是用推荐模型计算得到的用户向量a_i对物品向量b_j预测结果，所述推荐模型为：s`_ij＝w^T·g_M，其中，M为多层感知机的最大层数，且M≥3，w为神经网络权值；

s_ij代表评分实际值，s`_ij代表评分期望值，N表示评分记录的总数，

10.一种基于图神经网络的信息链链条推荐装置，其特征在于包括：

处理器和存储器，所述处理器与所述存储器通信连接，

其中，所述存储器存储有计算机指令，所述处理器运行所述计算机指令时执行权利要求1～9中任一项所述的方法中的步骤。