CN116304289A - 基于图神经网络的供应链的信息链推荐方法及装置 - Google Patents
基于图神经网络的供应链的信息链推荐方法及装置 Download PDFInfo
- Publication number
- CN116304289A CN116304289A CN202211453311.4A CN202211453311A CN116304289A CN 116304289 A CN116304289 A CN 116304289A CN 202211453311 A CN202211453311 A CN 202211453311A CN 116304289 A CN116304289 A CN 116304289A
- Authority
- CN
- China
- Prior art keywords
- user
- layer
- vector
- article
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 45
- 238000000034 method Methods 0.000 title claims abstract description 40
- 230000000694 effects Effects 0.000 claims abstract description 17
- 238000007781 pre-processing Methods 0.000 claims abstract description 6
- 239000013598 vector Substances 0.000 claims description 53
- 230000006870 function Effects 0.000 claims description 28
- 230000003993 interaction Effects 0.000 claims description 22
- 230000002776 aggregation Effects 0.000 claims description 14
- 238000004220 aggregation Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 7
- 238000012549 training Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 claims description 6
- 230000008447 perception Effects 0.000 claims description 6
- 238000004140 cleaning Methods 0.000 claims description 5
- 230000009471 action Effects 0.000 claims description 4
- 230000006399 behavior Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 238000009825 accumulation Methods 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims 2
- 230000002452 interceptive effect Effects 0.000 claims 2
- 230000007246 mechanism Effects 0.000 abstract description 4
- 238000013136 deep learning model Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 12
- 238000004422 calculation algorithm Methods 0.000 description 9
- 238000004519 manufacturing process Methods 0.000 description 6
- 238000011144 upstream manufacturing Methods 0.000 description 5
- 238000010276 construction Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000005295 random walk Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- General Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于图神经网络的供应链中的信息链推荐方法和装置,包括:获取所述供应链中的信息链数据;预处理所述信息链数据;构建基于图神经网络的所述信息链的推荐模型;预测用户在所述信息链上对物品的喜爱程度。实践表明,本发明引入注意力机制,结合用户建模和物品建模,通过搭建深度学习模型实现了更优的信息推荐效果。
Description
【技术领域】
本发明属于信息挖掘推荐技术领域,尤其是一种基于图神经网络的供应链的信息链推荐方法及系统。
【背景技术】
近年来,随着互联网的迅速发展,大数据时代的数据规模爆炸式增长,海量数据充满着价值待用户进行数据挖掘。其中,供应链是生产流通中上下游组成的网链结构。网链结构中的上下游节点包含的大规模的海量数据,这些数据能动态整合形成多条信息链,如何在海量的节点数据组合中发现最优的节点信息链,缓解信息过载的问题,高效快速挖掘数据背后有价值的信息,成为研究的热点。
目前主要是利用推荐系统,根据用户的用户画像等数据,结合相关机器学习算法得到推荐分发列表,是目前解决信息过载的问题的有效方法。传统的推荐算法主要分为3类:基于内容的推荐算法,协同过滤的推荐算法和混合推荐算法。近年来,深度学习在计算机视觉、自然语言处理等领域取得了重大突破,也被广泛应用于推荐系统中。图神经网络算法作为一种深度学习算法,利用图数据节点的信息,节点和邻居节点之间的信息。尽管有众多的推荐算法存在,当前仍未有相关图神经网络算法应用在信息链推荐中。当前信息链链条推荐主要面临以下两个问题:(1)依赖背景理论知识丰富的综合型专家进行有效决策后推荐;(2)信息链链条推荐的准确度和实时性都有待提升。
【发明内容】
为解决上述问题,针对当前信息链链条推荐方法强依赖于支撑推荐决策的资深专家,对信息中的用户之间的合作与竞争关系变动感知不够实时,没有充分利用到信息链的全局信息,而且没有对信息链链条的推荐规则进行迭代更新的技术问题。本发明通过人工智能,深度学习的技术手段以图神经网络优化当前信息链链条推荐方式,提升了信息链链条推荐的准确性和实时性。
一方面,本发明提出一种基于图神经网络的供应链中的信息链推荐方法,包括:
步骤1:获取所述供应链中的信息链数据;
步骤2:预处理所述信息链数据;
步骤3:构建基于图神经网络的所述信息链的推荐模型;
步骤4:预测用户在所述信息链上对物品的喜爱程度。
进一步的,在上述技术方案的基础上,所述步骤1包括:
通过网络爬虫方式、网站提供的下载方式、或者主动向需求方申请相关数据使用权限的方式,获取对应场景的信息链数据,所述信息链数据包括该信息链链路各个节点的信息,每个节点上的有价值的活动信息以及所述活动产生的价值信息。
进一步的,在上述技术方案的基础上,所述步骤2包括:
对信息链数据进行数据清洗操作,所述清洗操作包括删除过期数据及重复数据;
根据信息链的已有链路进行图构建,对每个在链路的物品和用户分别生成对应的节点;
对产生过价值活动的用户与物品则建立连边,构成用户-物品二部图G1(V1,E1),其中,V1为所述产生过价值活动的用户与物品生成的节点的集合,E1为所述连边的集合;
对用户之间存在交互的行为建立相关的连边,构建用户-用户二部图G2(V2,E2),其中V2为所述存在交互的行为的用户生成的节点的集合E2为所述连边的集合。
进一步的,在上述技术方案的基础上,所述步骤3包括:
统计用户与不同物品的交互行为,以及用户之间的关系网络,将相关数据整合在一起,搭建对应的用户-物品二部图和用户-用户二部图,其中,将用户嵌入化处理后转换为向量ai存储用户信息,i表示所述用户的序号;将物品嵌入化处理得到包括物品信息的向量bj,j表示所述物品的序号;单个用户对其购物物品的评价得分用独热码向量描述,记为评分向量Vr,r表示评价等级的级别;
构建用户建模,所述用户建模提供用户的表示能力的学习渠道,模型从所述用户-物品二部图中学习物品空间的用户特征隐层因子;
构建物品建模,所述物品建模依赖用户聚合,进而学习物品隐层因子辅助建模,其中,所述物品隐层因子的计算依赖于用户与物品的交互过程;
构建评分预测,所述评分预测综合所述用户建模和所述物品建模的结果得到推荐模型,利用推荐模型生成最终的预测评分。
进一步的,在上述技术方案的基础上,所述步骤4包括:
将预处理后的数据送入所述推荐模型,得到最终的预测评分,计算并排序用户对各个物品的偏好程度,得到根据偏好程度排序的相关推荐列表。
进一步的,在上述技术方案的基础上,所述构建用户建模还包括步骤:
终态的注意力系数记作αif,来自于softmax函数处理后的注意力系数αij,
终态注意力系数αif加权处理xij向量,并且通过图神经网络累加聚合函数得到用户-物品特征yi,其中,
yi=σ(w·{∑αifxij}+c),c为偏置项。
进一步的,在上述技术方案的基础上,所述构建物品建模还包括步骤:
连接对用户向量ai和评分向量Vr,获得物品对用户的感知交互zji向量,其中i为用户的序号,j为物品的序号;所述zji向量经过两层所述多层感知机组合的神经网络获取注意力系数β,对相关用户向量进行注意力系数加权处理,最终通过图神经网络累加聚合函数得到物品特征向量zj。
进一步的,在上述技术方案的基础上,所述构建评分预测还包括步骤:
多层迭代步骤:每一层的计算结果作为后一层的输入,即第m-1层的结果gm-1作为由第m层的gm的输入,即:gm=σ(wm·gm-1)+cm,其中m>1,cm为第m层模型隐藏偏置项,wm为对应层数神经网络权值,σ为非线性参数;
预测步骤:s`ij为预测的评分,是用推荐模型计算得到的用户向量ai对物品向量bj预测结果,所述推荐模型为:s`ij=wT·gM,其中,M为多层感知机的最大层数,M≥3,w为神经网络权值;
训练时,每完成所述多层迭代步骤得到推荐模型时,计算损失函数Loss,如果Loss的结果大于指定阈值时,则再次执行所述多层迭代步骤,直至Loss的结果不大于指定阈值时,则w的参数为所述推荐模型确定的参数,所得到的推荐模型用于预测。
另一方面,本发明还提出一种基于图神经网络的信息链链条推荐装置,其特征在于包括:
处理器和存储器,所述处理器与所述存储器通信连接,
其中,所述存储器存储有计算机指令,所述处理器运行所述计算机指令时执行上述技术方案中任一项所述的方法中的步骤。
本发明与现有技术相比,其显著优点为:
1.本发明通过图神经网络实现了针对供应链链条数据的推荐方法,引入注意力机制,结合用户建模和物品建模,通过搭建深度学习模型实现了供应链链条价值最大化的推荐。
2.本发明对信息链链条数据进行了预处理,实现了数据预处理模块,将供应链数据构建为用户-物品二部图和用户-用户二部图,并将其余相关数据作为特征一同进行嵌入处理。
3.本发明支持多种图嵌入方式和消息聚集函数,有较好地可拓展性,结合场景来选择对应的嵌入方式和消息聚集函数,在不同规模不同领域的数据集上均有优秀的推荐效果。
【附图说明】
图1是本发明提出的基于图神经网络的供应链中信息链推荐方法流程图。
图2是本发明提出的系统模型架构图。
图3是本发明提出的技术方案与其他方案的指标对比图。
【具体实施方式】
为了便于理解,本具体实施方式是本发明公开的基于图神经网络的供应链中的信息链推荐方法的优选实施例,以详细说明本发明的结构和发明点,但并不作为本发明权利要求的限定保护范围。
如图1所示的基于图神经网络的供应链中的信息链推荐方法的一个优选实施例,包括:
S1:获取供应链数据:通过网络爬虫,网站直接提供下载方式,或者需要主动向需求方申请相关数据使用权限,以获得对应场景的信息链数据。所述信息链数据主要涵盖该信息链链路各个节点的信息,每个节点的价值活动,价值活动产生的价值。
S2:预处理供应链数据,构建用户-物品二部图和用户-用户二部图:对信息链数据进行一定的数据清洗操作,废弃过期数据及重复数据,降低脏数据对模型结果的影响。根据信息链的已有链路进行图构建,对每个在链路的物品和用户生成对应的结点,对产生过价值活动的用户与物品则建立连边,构成用户-物品二部图G(V1,E1),其中V1为所述用户与物品生成的节点的集合,E1为所述连边的集合。对用户之间存在交互的行为,同样的建立相关连边,构建用户-用户二部图G(V2,E2),其中V2为所述存在交互的行为的用户生成的节点的集合,E2为所述连边的集合,通过这种方式有效融合供应链产业用户之间合作或者竞争的信息。
S3:结合注意力机制搭建基于图神经网络的供应链模型,将预处理后的数据送入基于图神经网络的供应链推荐模型:参见图2所示,通过用户建模User Modeling得到用户物品图,用户物品图提供用户的表示能力的学习渠道,模型从用户物品二部图中学习物品空间的用户特征隐层因子。大多数情况下,用户特征不仅依赖所购买或者出售的物品等,与用户所处的社交关系网络也密切相关。为了获取更精准的用户建模,需要结合存在异质信息的社交关系网络进行信息的聚集。当数据集存在社交关系图时,可以有效地增加社交信息辅助用户建模,用户特征的隐层因子可以结合社交视角的信息进行更好的学习。社会关系图中,不同类型的关系对用户特征的影响也不同,所以引入注意力机制聚合用户的社交信息,通过选择具有代表性的社交朋友来描述用户的社交信息,进一步地根据不同权重影响整体用户特征。
通过依赖用户聚合的物品建模ItemModeling,进而学习物品隐层因子辅助建模。物品隐层因子的计算也依赖于用户与物品的交互过程,多次交互的结果可能不同,每次交互的结果即供应链中的每条边最终对物品特征都有一定的影响。通过引入注意力机制做不同的权重计算,用多层注意力神经网络判定物品对用户的重要程度。
用户建模和物品建模都完成后,准备一个多层感知机MLP作为连接层,将它们的输出通过这个多层感知机,辅助评分预测时对得分的计算。
S4:模型输出结果,推荐预测得到的TopN相关评分,更新供应链条节点:将预处理后的数据送入基于图神经网络的供应链推荐模型,得到最终的预测评分,计算并排序用户对各个物品的偏好程度,得到根据偏好程度排序的相关TopN推荐列表,所述TopN为排名靠前的N个,N的数值可根据需求设定。
如图2所示本发明的一个系统模型架构图的优选实施例,其中,数据集包括:
Ciao数据集,作为一个DVD类别数据集,收集用户购物后的点评评分,以及用户之间的社交联系,常用于各大推荐系统场景。
Epinions数据集,由用户的社交关系和他们对电影的评价结果组成,数据来源于用户在网站上对各种产品的主观评价。
SupplyChain泛指各大供应链数据集,一般包括完整的上下游链路和每个节点涵盖的价值。
支持方法Embedding method包括:
DeepWalk:DeepWalk以随机游走的方式,适合图表示学习,能够最大化捕捉节点局部的结构信息。对应的两个向量之间的距离取决于两点在图中共有的邻近点数量,但无法处理边的权重,也缺乏基本游走策略的可选项。
Node2Vec:沿用DeepWalk随机游走的思路,具备两种游走策略宽度游走策略和深度游走策略。
GIN:图同构网络,使用和作为聚合函数,每个节点聚合邻居的特征向量,可以通过池化操作对图进行表示。
SDNE:使用深度自动编码器联合优化一阶和二阶网络邻近度,能够有效捕获高度非线性网络结构,并且兼容稀疏网络。
用户建模整体流程:
1.连接所提取的物品向量bj和评分向量Vr,通过多层感知机输出物品j对用户i的感知交互向量xij
2.Attention Network:为了获取用户对物品的注意力系数α,需要将xij和用户ai经过两层多层感知机组合的神经网络(其中,c1,c2是偏置项,W1、W2为神经网络权值,σ为非线性函数,如Relu函数)
3.终态的注意力系数来自于softmax后的注意力系数α,记作αif
4.终态注意力参数αif加权处理xij向量,并且通过图神经网络累加聚合函数得到用户-物品特征yi,即User latent factor用户隐层因子,c为偏置项
物品建模:连接对用户向量ai和评分向量Vr,学习物品隐层因子获得zji向量,i和j的含义与之前保持一致,分别指代用户和物品。与用户建模相似,z向量经过两层多层感知机组合的神经网络获取注意力系数,对相关用户向量进行注意力系数加权处理,最终通过图神经网络累加聚合函数得到物品特征向量zj,即Item latent factor物品隐层因子。其中,α1,α2,α3分别为用户建模时经过注意力网络得到的注意力系数示例,β1,β2,β3分别为物品建模时经过注意力网络得到的注意力系数。
评分预测:使用评分预测作为评估推荐任务好坏,连接用户向量yi和物品向量zj,通过多层感知机得到相关预测评分。gl为结合了社交信息的交互信息,l为模型隐藏层索引。
gl-1=σ(wl·gl-2)+cl
s`ij=wT·gl-1
为了选择模型的参数,需要挑选目标函数辅助模型优化、损失函数使用均方误差公式进行计算,其中s代表评分实际值,s`代表评分期望值,N表示记录的总数量。
如图3所示,本模型在Ciao和Epinions,以及DataCo(一个智能供应链数据集)上表现优秀,具体表现于平均绝对误差MAE和均方根误差RMSE两项指标均较低,均优于基线模型的PMF,TrustMF和SoRec这三种矩阵分解模型,误差较低代表准确度较高,说明本优化方法推荐较为准确,不仅在传统数据集Ciao和Epinions上效果领先,在对应的供应链场景数据集DataCo上也优于其他模型,能够有效实现供应链推荐的效果,在供应链价值的信息链优化上有较大提升。
在本具体实施方案中,以我国某制造企业为例,对其供应链场景进行分析。供应链场景可以描述为:生产及流通过程中,涉及将产品或服务提供给最终用户活动的上下游企业所形成的网链结构,即将产品从商家送到消费者手中整个链条,如何通过供应链的相关信息链推荐得到价值最大化的生产链路,给上下游推荐合适的合作伙伴,进而辅助企业调整生产结构。首先根据制造企业提供相关供应链数据,构建信息链数据集R,包含企业之间的合作竞争关系,企业能够生产的物品,以及生产物品所能产生的价值;预处理信息链数据,对数据集R中的一些过期数据和重复数据进行剔除,降低模型的计算成本和运行时间。根据信息链的已有链路进行图构建,对每个在链路的物品和企业分别生成对应的节点;对产生过价值活动的企业与物品则建立连边,构成企业-物品二部图G1(V1,E1),其中,V为所述产生过价值活动的企业与物品生成的节点的集合,E1为所述连边的集合;对企业之间存在交互的行为建立相关的连边,构建企业-企业二部图G2(V2,E2),其中V2为所述存在交互的行为的企业生成的节点的集合,E2为所述连边的集合。将数据集切割为测试集和验证集,依照上述方法构建相关图神经网络推荐模型,最终经过多轮训练得到合理的神经网络权值系数。最终将数据输入模型,为企业推荐出合适的合作伙伴,进而形成价值最大化的供应链的信息链链条,完成信息链推荐效果。
以上是本发明的一些具体实施方式,但本发明并不仅局限于上述方式,所有对本发明技术特征的简单变换,凡依本发明专利申请范围所述的构造、特征及原理所做的等效变化或修饰,都将落入本发明的保护范围之内。
Claims (10)
1.一种基于图神经网络的供应链中的信息链推荐方法,其特征在于包括下述步骤:
步骤1:获取所述供应链中的信息链数据;
步骤2:预处理所述信息链数据;
步骤3:构建基于图神经网络的信息链的推荐模型;
步骤4:预测用户在所述信息链上对物品的喜爱程度;
其中,通过网络爬虫方式、网站提供的下载方式、或者主动向需求方申请相关数据使用权限的方式,获取对应场景的信息链数据,所述信息链数据包括该信息链链路各个节点的信息,每个节点上的有价值的活动信息以及所述活动产生的价值信息。
2.根据权利要求1所述的方法,其特征在于所述步骤2包括:
对信息链数据进行数据清洗操作,所述清洗操作包括删除过期数据及重复数据;
根据信息链的已有链路进行图构建,对每个在链路的物品和用户分别生成对应的节点;
对产生过价值活动的用户与物品则建立连边,构成用户-物品二部图G1(V1,E1),其中,V1为所述产生过价值活动的用户与物品生成的节点的集合,E1为所述连边的集合;
对用户之间存在交互的行为建立相关的连边,构建用户-用户二部图G2(V2,E2),其中V2为所述存在交互的行为的用户生成的节点的集合,E2为所述连边的集合。
3.根据权利要求2所述的方法,其特征在于所述步骤3包括:
统计用户与不同物品的交互行为,以及用户之间的关系网络,将相关数据整合在一起,搭建对应的用户-物品二部图和用户-用户二部图,其中,将用户嵌入化处理后转换为向量ai存储用户信息,i表示所述用户的序号;将物品嵌入化处理得到包括物品信息的向量bj,j表示所述物品的序号;单个用户对其购物物品的评价得分用独热码向量描述,记为评分向量Vr,r表示评价等级的级别;
构建用户建模,所述用户建模依赖物品聚合,模型从所述用户-物品二部图中用户和物品之间的交互,学习用户特征隐层因子,为评分预测准备特征输入,所述用户-物品二部图包括用户和物品之间的相互作用,而且包含用户对物品的评价得分;
构建物品建模,所述物品建模依赖用户聚合,考虑用户有互动行为的相关物品及其用户对物品的评分来学习物品特征隐层因子辅助建模,其中,所述物品隐层因子的计算依赖于用户与物品的交互过程;
构建评分预测,所述评分预测综合所述用户建模和所述物品建模的结果得到推荐模型,利用推荐模型生成最终的预测评分。
4.根据权利要求3所述的方法,其特征在于所述评价等级至少包括5个等级。
5.根据权利要求4所述的方法,其特征在于所述步骤4包括:
将预处理后的数据送入所述推荐模型,得到最终的预测评分,计算并排序用户对各个物品的偏好程度,得到根据偏好程度排序的相关推荐列表。
6.根据权利要求5所述的方法,其特征在于所述构建用户建模还包括步骤:
将xij和用户ai经过两层所述多层感知机组合的神经网络得到注意力系数αij,其中,c1,c2是偏置项系数,W1、W2为神经网络权值,σ为非线性激活函数,所述c1,c2,W1、W2,σ通过损失函数和神经网络的训练确定;
终态的注意力系数记作αif,来自于softmax函数处理后的注意力系数αij,
终态注意力系数αif加权处理xij向量,并且通过图神经网络累加聚合函数得到用户-物品特征yi,即用户特征隐层因子,其中,
yi=σ(w·{∑j∈Dαif·xij}+c),σ为所述非线性激活函数,c为偏置项参数,D为用户关联的物品序号集合,j为所述物品集合中的序号元素,且所述w,c通过损失函数训练确定,所述c1、c2、W1、W2、σ1、w和c使得神经网络在训练时的损失函数的值小于设置的阈值。
7.根据权利要求6所述的方法,其特征在于:所述σ为Relu函数。
8.根据权利要求7所述的方法,其特征在于所述构建物品建模还包括步骤:
连接对用户向量ai和评分向量Vr,获得物品对用户的感知交互向量zji,其中i为用户的序号,j为物品的序号;所述zji向量经过两层所述多层感知机组合的神经网络获取注意力系数β,对相关用户向量进行注意力系数加权处理,最终通过图神经网络累加聚合函数得到物品特征向量zj,即物品特征隐层因子。
9.根据权利要求8所述的方法,其特征在于所述构建评分预测还包括步骤:
多层迭代步骤:每一层的计算结果作为后一层的输入,即第m-1层的结果gm-1作为由第m层的gm的输入,即:gm=σ(wm·gm-1)+cm,其中m>1,cm为第m层模型隐藏偏置项,wm为对应层数神经网络权值,σ为非线性函数;
预测步骤:s`ij为预测的评分,是用推荐模型计算得到的用户向量ai对物品向量bj预测结果,所述推荐模型为:s`ij=wT·gM,其中,M为多层感知机的最大层数,且M≥3,w为神经网络权值;
训练时,每完成所述多层迭代步骤得到推荐模型时,计算损失函数Loss,如果Loss的结果大于指定阈值时,则再次执行所述多层迭代步骤,直至Loss的结果不大于指定阈值时,则w的参数为所述推荐模型确定的参数,所得到的推荐模型用于预测。
10.一种基于图神经网络的信息链链条推荐装置,其特征在于包括:
处理器和存储器,所述处理器与所述存储器通信连接,
其中,所述存储器存储有计算机指令,所述处理器运行所述计算机指令时执行权利要求1~9中任一项所述的方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211453311.4A CN116304289A (zh) | 2022-11-21 | 2022-11-21 | 基于图神经网络的供应链的信息链推荐方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211453311.4A CN116304289A (zh) | 2022-11-21 | 2022-11-21 | 基于图神经网络的供应链的信息链推荐方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116304289A true CN116304289A (zh) | 2023-06-23 |
Family
ID=86789337
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211453311.4A Pending CN116304289A (zh) | 2022-11-21 | 2022-11-21 | 基于图神经网络的供应链的信息链推荐方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116304289A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117421459A (zh) * | 2023-12-14 | 2024-01-19 | 成都智慧锦城大数据有限公司 | 应用于数字城市的数据挖掘方法及系统 |
-
2022
- 2022-11-21 CN CN202211453311.4A patent/CN116304289A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117421459A (zh) * | 2023-12-14 | 2024-01-19 | 成都智慧锦城大数据有限公司 | 应用于数字城市的数据挖掘方法及系统 |
CN117421459B (zh) * | 2023-12-14 | 2024-02-23 | 成都智慧锦城大数据有限公司 | 应用于数字城市的数据挖掘方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111310063B (zh) | 基于神经网络的记忆感知门控因子分解机物品推荐方法 | |
CN112035746A (zh) | 一种基于时空序列图卷积网络的会话推荐方法 | |
Forouzandeh et al. | Presentation a Trust Walker for rating prediction in recommender system with Biased Random Walk: Effects of H-index centrality, similarity in items and friends | |
CN112905900A (zh) | 基于图卷积注意力机制的协同过滤推荐算法 | |
CN110910218B (zh) | 一种基于深度学习的多行为迁移推荐方法 | |
Wan et al. | Deep matrix factorization for trust-aware recommendation in social networks | |
CN109785062A (zh) | 一种基于协同过滤模型的混合神经网络推荐系统 | |
Lee et al. | Deep learning based recommender system using cross convolutional filters | |
CN113918832B (zh) | 基于社交关系的图卷积协同过滤推荐系统 | |
CN112950324B (zh) | 一种知识图谱辅助的成对排序个性化电商推荐方法及系统 | |
CN113918833B (zh) | 通过社交网络关系的图卷积协同过滤实现的产品推荐方法 | |
CN113918834B (zh) | 融合社交关系的图卷积协同过滤推荐方法 | |
CN112861006A (zh) | 融合元路径语义的推荐方法及系统 | |
CN114510653B (zh) | 社交群体推荐方法、系统、设备及存储介质 | |
Ahamed et al. | A recommender system based on deep neural network and matrix factorization for collaborative filtering | |
CN114595383A (zh) | 一种基于会话序列的海洋环境数据推荐方法及系统 | |
Yu et al. | Collaborative group embedding and decision aggregation based on attentive influence of individual members: A group recommendation perspective | |
CN116304289A (zh) | 基于图神经网络的供应链的信息链推荐方法及装置 | |
Zhang et al. | Inferring latent network from cascade data for dynamic social recommendation | |
Lin et al. | Non-compensatory psychological models for recommender systems | |
Baker et al. | Machine learning: factorization machines and normalized discounted cumulative gain for tourism recommender system optimisation | |
CN115470406A (zh) | 一种基于双通道信息融合的图神经网络会话推荐方法 | |
CN113688974B (zh) | 一种基于轻量化图卷积网络的移动应用推荐方法 | |
CN113849725B (zh) | 一种基于图注意力对抗网络的社会化推荐方法及系统 | |
CN115391555A (zh) | 一种用户感知的知识图谱推荐系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |