CN113127754A - 一种基于知识图谱的供应商推荐方法 - Google Patents
一种基于知识图谱的供应商推荐方法 Download PDFInfo
- Publication number
- CN113127754A CN113127754A CN202110413765.8A CN202110413765A CN113127754A CN 113127754 A CN113127754 A CN 113127754A CN 202110413765 A CN202110413765 A CN 202110413765A CN 113127754 A CN113127754 A CN 113127754A
- Authority
- CN
- China
- Prior art keywords
- purchase
- attribute
- vector
- user
- demand
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种基于知识图谱的供应商推荐方法,包括下列步骤:以每个采购需求向量为用户,采购记录为项目,首先构建用户‑项目供应知识图谱SKG,通过node2vec对知识图谱结构特征进行提取,对其知识进行向量化表示,将知识图谱中的实体和实体间的关系嵌入到稠密的低维向量中,然后通过计算用户项目之间的相似性得到用户与用户、项目与项目以及用户与项目之间的属性相关分数即不同特性的基本特征作为传播强度的权重值,基于计算出的针对每个属性的属性相关分数,构建采购需求向量与历史采购记录的全局关联度模型,得到与采购需求向量最相似的top‑K历史记录。
Description
技术领域
本发明属于信息搜索推荐领域,尤其涉及一种基于知识图谱的供应商推荐方法。
背景技术
随着全球供应链的发展,如何选择最优供应商成为一个关键问题。供应商选择的目的是从备选方案中选择满足不同采购标准的最佳供应商[1,2]。
在推荐策略中,协同过滤(CF)考虑用户的历史交汇并根据其潜在的共同偏好提出建议,它利用用户与包括电影、书籍等物品之间的历史交互数据来预测特定用户想要哪些物品,以基于预制件供应链中留下的供应商交互信息来推荐最优供应商[3]。此外,Netflix和Amazon提出了一种协同过滤(CF)算法并使用该算法向客户推荐电影和产品,以选择最佳供应商列表[4]。尽管协同过滤(CF)方法是有效的,但它仍然不能对项目属性、用户上下文进行建模,因此在用户与项目之间交互较少的稀疏情况下效果不佳。
此外,传统的推荐系统(RS)只使用用户和项目的历史交互信息(显式或隐式反馈)作为输入,还带来了两个问题:i)在实际场景中,用户和项目之间的交互信息往往是稀疏的。Ii)对于新用户或新项目,由于系统没有历史交互信息,无法准确建模和推荐。
由于推荐系统(RS)中存在着大量的相互交错的类似知识图谱结构,所以通过将知识图谱与推荐系统(RS)结合,对知识图谱中的每个节点(vertex或node)学习得到低维表示向量(low-dimensional representation vector),同时保持其原有的知识图谱结构信息,可以有效地避免稀疏问题和冷启动问题[5]。
目前,知识图谱引入推荐系统(RS)的工作主要分为基于特征的推荐方法(genericfeature methods)和基于路径的推荐方法(path-based methods)两类。基于特征的推荐方法通过依次学习[6,7]、联合学习[8,9]以及交替学习[10]得到知识图谱中的实体向量和关系向量特征,将低维向量引入推荐系统(RS),并将其与推荐算法的目标函数结合进行学习推荐。基于路径的推荐方法通过构造物品之间基于元路径(meta-path)或元图(metagraph)的特征,从而挖掘知识图谱中潜在的关系[11]。对知识图谱结构利用率比较高的方法是对知识图谱中的每一个实体,都进行宽度优先搜索来获取其在知识图谱中的多跳关联实体[12]。例如RippleNet[9]模型,与现有基于路径的方法(PER[13]、MetaGraph[11])相比,RippleNet模型最大的优势在于它不需要人工设计元路径或元图,把用户的历史偏好作为知识图谱中的种子集,然后通过知识图谱进行迭代链接传播。但该模型在进行传播时并没有控制传播强度,仅仅利用知识图谱的结构信息,并没有结合知识图谱中点和边的特征信息作进一步的挖掘,使得生成的用户项目对的最终表示缺少一些隐藏特征,进而使得到的推荐结果不够精准。
参考文献:
[1]W.Ho,X.Xu,P.K.Dey.Multi-criteria decision making approaches forsupplier evaluation and selection:a literature review.Eur.J.Oper.Res.,202(2010),pp.16-24
[2]Hosseini,Seyedmohsen,et al."Resilient supplier selection andoptimal order allocation under disruption risks."International Journal ofProduction Economics 213(2019):124-137.
[3]Du,Juan,and Hengqing Jing."Collaborative Filtering-Based Matchingand Recommendation of Suppliers in Prefabricated Component Supply Chain."International Conference on Applications and Techniques in Cyber Security andIntelligence.Edizioni della Normale,Cham,2017.
[4]Pouraghabagher,Reza,and Owais Sarfaraz."Supplier Selection UsingData Analytics:A Collaborative Filtering-Based Approach."Symposium onLogistics(ISL 2018)Big Data Enabled Supply Chain Innovations.2018.
[5]Amatriain X.The recommender problem revisited[C]//Proc of the 8thACM Conference on Recommender Systems.[S.l.]:Association for ComputingMachinery,2014:397-398.
[6]Wang Hongwei,Zhang Fuzheng,Wang Jialin,et al.RippleNet:propagatinguser preferences on the knowledge graph for recommender systems[C]//Proc ofthe 27th ACM International Conference on Information and KnowledgeManagement.New York:ACM Press,2018:417-426.
[7]Koren Y.Factorization meets the neighborhood:a multifacetedcollaborative filtering model[C]//Proc of the 14th ACM SIGKDD InternationalConference on Knowledge Discovery and Data Mining.New York:ACM Press,2008:426-434
[8]Zhang Fuzheng,Yuan N J,Lian D,et al.Collaborative knowledge baseembedding for recommender systems[C]//Proc of the 22nd ACM SIGKDDInternational Conference on Knowledge Discovery and Data Mining.New York:ACMPress,2016:353-362.
[9]Wang Hongwei,Zhang Fuzheng,Wang Jialin,et al.RippleNet:propagatinguser preferences on the knowledge graph for recommender systems[C]//Proc ofthe 27th ACM International Conference on Information and KnowledgeManagement.New York:ACM Press,2018:417-426.
[10]Catherine R,Cohen W.Personalized recommendations using knowledgegraphs:aprobabilistic logic programming approach[C]//Proc of the 10th ACMConference on Recommender Systems.New York:ACM Press,2016:325-332.
[11]Zhao Huan,Yao Quanming,Li Jianda,et al.Meta-graph basedrecommendation fusion over heterogeneous information networks[C]//Proc of the23rd ACM SIGKDD International Conference on Knowledge Discovery and DataMining.New York:ACM Press,2017:635-644.
[12]Mikolov T,Sutskever I,Chen K,et al.Distributed representations ofwords and phrases and their compositionality[C]//Proc of the 26thInternational Conference on Neural Information Processing Systems.2013:3111-3119.
[13]Yu Xiao,Ren Xiang,Sun Yizhou,et al.Personalized entityrecommendation:aheterogeneous information network approach[C]//Proc of the7th ACM International Conference on Web Search and Data Mining.New York:ACMPress,2014:283-292.
发明内容
本发明的目的是提供一种可以更有效地挖掘知识图谱中的潜在信息的供应商推荐方法。技术方案如下:
一种基于知识图谱的供应商推荐方法,包括下列步骤:
以每个采购需求向量为用户,采购记录为项目,首先构建用户-项目供应知识图谱SKG,通过node2vec对知识图谱结构特征进行提取,对其知识进行向量化表示,将知识图谱中的实体和实体间的关系嵌入到稠密的低维向量中,然后通过计算用户项目之间的相似性得到用户与用户、项目与项目以及用户与项目之间的属性相关分数即不同特性的基本特征作为传播强度的权重值,基于计算出的针对每个属性的属性相关分数,构建采购需求向量与历史采购记录的全局关联度模型,得到与采购需求向量最相似的top-K历史记录。
具体执行步骤如下:
第一部分,采购需求向量表示
(1)将包含供应商(Supplier)、产品类型(Procut_type)、价格级别(Price_level)、交货日期预期时间级别(Time_level)、采购策略(Purchase_policy)属性的采购需求映射到采购需求向量,使用深度神经网络方法来学习采购需求向量的表示;
(2)基于所构造的需求向量,用余弦相似度S来衡量采购需求向量之间的相似度,设e为预定阈值,当余弦相似度S小于预定阈值e时,将采购需求向量视为相同的采购需求向量并以同一采购需求向量表示;
第二部分,构建供应知识图谱SKG
作为用户的采购需求集合表示为U={u1,u2,...},其中u表示用户,ui表示用户u的采购需求;作为项目的采购记录集合表示为V={v1,v2,...}其中v表示项目,vj表示项目v的采购记录;
将供应知识图谱SKG定义为集合K=(E,R,O),E实体的集合,e表示单个实体, 具体包含用户采购需求集合U,项目采购记录集合V,产品类型(Procut_type)、时间级别(Time_level)、采购策略(Purchase_policy)、价格级别(Price_level)和供应商(Supplier);R表示实体间关系的集合;O表示关系类型属性集合,p在SKG中被定义为采购记录的属性,用p∈Γ表示;供应知识图谱SKG中的任意一条边对应一个三元组(i,r,j),其中i表示头实体,j表示尾实体,r表示实体之间的关系;在供应知识图谱SKG中,r表示同属于实体的用户采购需求集合U,等价于头实体i,到项目采购记录集合V,等价于头实体j,的反馈;如果头实体i∈U并且尾实体j∈V,则反馈指示用户u的采购需求ui对项目v的采购记录vj进行评级,并表示满足购买需求的程度;如果头实体且尾实体j∈V,则r表示为项目采购记录V的属性;采购记录作为供应知识图谱SKG中的物料,与两种实体相关联,一种是以低维向量表示的采购需求,另一种是采购记录的属性,如价格、交货期等;
第三部分、采用Entity2rec方法的Top-N项目推荐
(1)Node2Vec
供应知识图谱SKG包含了供应商反馈的协同信息,又包含了产品类型(Procut_type)、交货期(date)、质量(quality)和价格(price)内容信息,在Top-N项目推荐中,节点的向量值通过用户采购需求ui和项目采购记录vj的向量表示;通过随机游走算法对节点序列进行采样,并应用word2vec模型学习节点表示;
(2)基于特定属性的需求-产品相关性计算
在供应知识图谱SKG中,对于指定的采购需求,不同的属性具有不同的值;在判断u∈U、p∈Γ之间的相关性时,应考虑不同的权重;
考虑到用户采购需求u∈U一次只考虑节点的一个特定属性向量表示,因此每个属性构造供应知识图(SKG)的相应子图,表示为供应知识图谱子图(SKGp);构建了六个供应知识图谱子图(SKGp),包括产品类型属性(Procut_type)、时间级别属性(Time_level)、采购策略属性(Purchase_policy)、价格水平属性(Price_level)、供应商属性(Supplier)和从用户采购需求ui到采购记录属性p的反馈属性(Feedback);
对每个属性p,p∈O,只取知识图谱中通过属性p连接的实体得到一个供应知识图谱子图SKGp即三元组(i,p,j)的一个集合,其中这里考虑的属性p连接的实体至少要超过两个;对于每个供应知识图谱子图SKGp中的每个实体e,利用node2vec方法,学到一个高维映射向量xp,并将其投射到一个低维向量中,xp:e∈SKGp→Rd,其中e表示每个供应知识图谱子图SKGp中实体,e∈SKGp,xp表示实体e通过node2vec方法学习到的映射向量,将高维映射向量xp降维投射到R的低维向量空间,表示为xp:e∈SKGp→Rd;
在进行需求-产品相关性计算时,采用如下的方法:
第一步:对于每一个节点,希望把该节点表示为向量的情况下出现该节点邻近的点的概率最大,在此取对数形式如下:
其中节点e∈SKGp,Ns(e)∈SKGp表示通过node2vec方法得到的随机游走的实体节点u的邻域,xp(e)表示需要向量化表示的节点e的高维映射向量;Pr(Ns(e)|xp(e))表示在随机游走过程中,把节点u表示为向量的情况下出现与该节点e邻近点的概率;
第二步:对于每一个节点向量出现邻近点的概率等于邻近点中每个点出现的概率相乘:
其中ni表示实体节点e的各邻近点,且ni∈Ns(e)
第三步:该节点向量下对应其他每个节点的概率用softmax表示:
第四步:将上述三个公式整合,得到下面的目标函数:
其中:Ze是每个节点的分区函数,通过负抽样法近似;
第五步:最优化尝试最大化相同邻域之间的点积,得到实体u的映射向量xp(u),特定属性的相关度定义为:
其中:L(u)表示用户u过去采购的项目集;S表示向量的相似度测量方法,这里用cosine相似度;当p取为用户对项目的反馈属性时,供应知识图谱子图SKGp表示为一个用户交互图谱,相当于一个协同过滤模型,即当p=feedback,后ρfeedback(u,v)模拟协同过滤(CF),当向量空间中xfeedback(u)和xfeedback(v)更接近,ρfeedback(u,v)特定属性相关系数则更高;
若当项目v被选择相同项目的用户选择,则项目v会在SKGfeedback子图中被紧密连接;第四部分,供应商推荐
基于计算出的针对每个属性p∈Γ的属性相关分数ρp(u,i),以每个采购需求向量为用户,采购记录为项目,构建采购需求向量与历史采购记录的全局关联度模型,得到与采购需求向量最相似的top-K历史记录。
本专利提出的基于知识图谱的供应商推荐方法,将基于图谱的推荐系统(RS)方法应用于供应商推荐过程中。基于本专利方法,用户能够在供应链中更有效地挖掘知识图谱中的潜在信息,通过提取不同特定属性的基本特征,利用知识图谱中的邻居结构信息,有效发掘用户项目采购和供应商的关系,探索用户在项目采购的偏好,在动态的供应链环境下,考虑了历史采购需求和供应商信息的交互作用,此外,本专利还考虑了产品类型、交货期、质量和价格等对供应商选择有重要影响的因素。通过本专利方法可以帮助制造商根据自己的需求选择最优的供应商。
附图说明
图1 TopN供应商推荐图
图2供应知识图谱(SKG)图
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下结合说明书附图1对本发明做进一步的详细说明。
本发明的基于知识图谱的供应商推荐方法,其基本思想是:以每个采购需求向量为用户,采购记录为项目,首先构建用户-项目供应知识图谱(SKG),通过node2vec对知识图谱结构特征进行提取,对其知识进行向量化表示,将知识图谱中的实体和实体间的关系嵌入到稠密的低维向量中,然后通过计算用户项目之间的相似性得到用户与用户、项目与项目以及用户与项目之间的属性相关分数即不同特性的基本特征作为传播强度的权重值,基于计算出的针对每个属性的属性相关分数,构建采购需求向量与历史采购记录的全局关联度模型,得到与采购需求向量最相似的top-K历史记录。
我们制定了基于知识图谱的供应商推荐方法如下。
供应商推荐问题是在给定采购需求的情况下,如何学习一组参数来优化函数Puv=F(u,v;Θ),从而得到采购需求的概率将由一组采购记录来满足。采购记录将根据其概率进行排序。一种基于知识图谱的供应商推荐方法具体实现步骤如下:
1、采购需求向量表示
首先需要实现采购需求的矢量表示。具体步骤为:
1.1将包含供应商(Supplier)、产品类型(Procut_type)、价格级别(Price_level)、交货日期预期时间级别(Time_level)、采购策略(Purchase_policy)等属性的采购需求映射到采购需求向量。这里,使用深度神经网络方法来学习采购需求向量的表示,有多种方法可以进行采购需求向量的深度学习。
首先,将包含属性的采购需求信息作为输入,使用维基百科中文数据训练word2vec词向量模型,生成基于12GB的中文文本数据,并进行中文分词等数据预处理;其次,依据采购需求信息属性,剔除信息属性中的冗余信息,并传入word2vec中的Skipgram模型中进行模型训练;最后获得大小为300维采购需求词向量,并对词向量进行保存和加载。
1.2基于1.1构造的需求向量,用余弦相似度S来衡量采购需求向量之间的相似度,设e为预定阈值,当余弦相似度S小于预定阈值e时,将采购需求向量视为相同的采购需求向量并以同一采购需求向量表示。
2、构建供应知识图谱(SKG)
作为用户的采购需求集合表示为U={u1,u2,...},其中u表示用户,ui表示用户u的采购需求。作为项目的采购记录集合表示为V={v1,v2,...}其中v表示项目,vj表示项目v的采购记录。
将供应知识图谱(SKG)定义为集合K=(E,R,O),E实体的集合,e表示单个实体, 具体包含用户采购需求集合U,项目采购记录集合V,产品类型(Procut_type)、时间级别(Time_level)、采购策略(Purchase_policy)、价格级别(Price_level)和供应商(Supplier);R表示实体间关系的集合;O表示关系类型属性集合。p在SKG中被定义为采购记录的属性,用p∈Γ表示。供应知识图谱(SKG)中的任意一条边对应一个三元组(i,r,j),其中i表示头实体,j表示尾实体,r表示实体之间的关系。在供应知识图谱(SKG)中,r表示同属于实体的用户采购需求集合U(等价于头实体i)到项目采购记录集合V(等价于头实体j)的反馈;如果头实体i∈U并且尾实体j∈V,则反馈指示用户u的采购需求ui对项目v的采购记录vj进行评级,并表示满足购买需求的程度;如果头实体且尾实体j∈V,则r表示为项目采购记录V的属性。因此,采购记录作为供应知识图谱(SKG)中的物料,与两种实体相关联。一种是以低维向量表示的采购需求,另一种是采购记录的属性,如价格、交货期等。
3、Top-N项目推荐
Top-N项目推荐采用Entity2rec方法,既包含了供应商反馈的协同信息,又包含了产品类型(Procut_type)、交货期(date)、质量(quality)和价格(price)等内容信息。
a)Node2Vec
在Top-N项目推荐中,节点的向量值通过用户采购需求ui和项目采购记录vj的向量表示。Node2vec通过随机游走算法对节点序列进行采样,并应用word2vec模型学习节点表示。
b)基于特定属性的需求-产品相关性计算
矢量相似度可以很容易地从节点表示中计算出两个节点之间的关系。但是,在供应知识图谱(SKG)中,对于指定的采购需求,不同的属性具有不同的值。在判断u∈U、p∈Γ之间的相关性时,应考虑不同的权重。
考虑到用户采购需求ui和采购记录属性p的之间关系具有不同的属性相关性,比如购买需求对时间的要求较高,而下一次的需求可能对价格比较敏感。考虑到用户采购需求u∈U一次只考虑节点的一个特定属性向量表示,因此按每个属性构造供应知识图(SKG)的相应子图,表示为供应知识图谱子图(SKGp)。构建了六个供应知识图谱子图(SKGp),包括产品类型属性(Procut_type)、时间级别属性(Time_level)、采购策略属性(Purchase_policy)、价格水平属性(Price_level)、供应商属性(Supplier)和从用户采购需求ui到采购记录属性p的反馈属性(Feedback)。
对每个属性p,p∈O,只取知识图谱中通过属性p连接的实体得到一个供应知识图谱子图SKGp即三元组(i,p,j)的一个集合,其中这里考虑的属性p连接的实体至少要超过两个。对于每个供应知识图谱子图(SKGp)中的每个实体e,利用node2vec方法,可以学到一个高维映射向量xp,并将其投射到一个低维向量中,xp:e∈SKGp→Rd,其中e表示每个供应知识子图(SKGp)中实体,e∈SKGp,xp表示实体e通过node2vec方法学习到的映射向量,将高维映射向量xp降维投射到R的低维向量空间,表示为xp:e∈SKGp→Rd。
Node2vec是用来产生知识图谱网络中节点向量的模型,输入网络结构,输出每个节点的向量。主要思想是:直接导入word2vec的包,通过特定的游走方式进行采样,对于每个点都会生成对应的序列。再将这些序列视为文本导入word2vec中的skip-gram模型,即可得到每个节点的高维映射向量(对应word2vec中每个词的向量)
原理说明:
第一步:对于每一个节点,希望把该节点表示为向量的情况下出现该节点邻近的点的概率最大,在此取对数形式如下:
其中节点e∈SKGp,Ns(e)∈SKGp表示通过node2vec方法得到的随机游走的实体节点u的邻域,xp(e)表示需要向量化表示的节点e的高维映射向量。Pr(Ns(e)|xp(e))表示在随机游走过程中,把节点u表示为向量的情况下出现与该节点e邻近点的概率。
第二步:对于每一个节点向量出现邻近点的概率等于邻近点中每个点出现的概率相乘:
其中ni表示实体节点e的各邻近点,且ni∈Ns(e)
第三步:该节点向量下对应其他每个节点的概率用softmax表示:
第四步:将上述三个公式整合,得到下面的目标函数:
其中:Ze是每个节点的分区函数,通过负抽样法近似。公式为
其中v表示在知识子图谱(SKGp)中的其他实体节点,且v∈SKGp。
第五步:最优化尝试最大化相同邻域之间的点积,得到实体u的映射向量xp(u),特定属性的相关度定义为:
其中:L(u)表示用户u过去采购的项目集;S表示向量的相似度测量方法,这里用cosine相似度。当p取为用户对项目的反馈属性时,知识图谱子图(SKGp)表示为一个用户交互图谱,相当于一个协同过滤模型。即当p=feedback,后ρfeedback(u,v)模拟协同过滤(CF),当向量空间中xfeedback(u)和xfeedback(v)很接近时,ρfeedback(u,v)特定属性相关系数会比较高。
若当项目v被选择相同项目的用户选择,则项目v会在SKGfeedback子图中被紧密连接
4、供应商推荐
基于计算出的针对每个属性p∈Γ的属性相关分数ρp(u,i),以每个采购需求向量为用户,采购记录为项目,构建采购需求向量与历史采购记录的全局关联度模型,得到与采购需求向量最相似的top-K历史记录。其中,由于某些项目可以从同一供应商采购,我们可以根据采购的性质(N<M)获得TOP-N采购记录中的TOP-M个供应商。
5.、模拟场景API接口
根据一种基于知识图谱的供应商推荐方法,我们建立了针对本专利方法的模拟场景,下面是基于一种基于知识图谱的供应商推荐方法的场景API接口相关参数设置。
接口地址:http://X.X.X.X:25828/supplier_recommender请求方式:POST
返回值及格式:返回排序后的10位供应商,格式为JSON
调用请求示例:
在此过程中所输入的参数信息分别对应了
开发者在独立使用接口时,用POST请求访问接口,示例如下:
接口参数信息:如接口需要登录使用,请在输入参数中提供用于登录的相关参数,如处于Header位置的Cookie、Token等。
6、实验验证
数据集的统计特性见表一,实验结果见表二。
数据集
为了评估该方法的有效性,我们生成了包含166156条采购记录和4984条采购需求向量的模拟数据。在此基础上,构建了供应知识图谱(SKG)和属性专用知识图。知识图谱(KG)的统计数字如表一所示。
表一知识图谱的特性
属性 | 节点数量 | 边的数量 |
Feedback | 4721 | 164804 |
Procut_type | 23 | 165351 |
Price_level | 99 | 156582 |
Time_level | 99 | 153429 |
Purchase_policy | 37 | 148346 |
Supplier | 835 | 165877 |
实验参数设置
为了进行比较,对漫游次数(Num Walks)、漫游长度(Walk Length)、窗口大小(Window Size)、维度(Dimension)进行了不同的设置。在“默认超参”这一组设置中,使用其中p=1、q=1、Num Walks=10、Walk Length=80、Window Size=10、ITER=1、Dimension=128的超参数。为了提高推荐的质量,在优化的超段落中,Walk Length=100,Num Walks=80,Window Size=45,Dimension=256。而另一组参数设置“优化的超参数”是通过人工搜索范围得到的:Walk Length={10,20,30,50,100},Window Size={10,20,30,40},NumWalks={10,50,80},Dimension={128,256}。
实验结果
为了证明其有效性,我们将我们提出的方法与MostPop、SVD和ItemKNN进行了比较。如表二所示,我们观察到我们使用默认超参数的方法比SVD和Item KNN的性能更好,但MostPop方法的性能略好于默认的超参数。然而,使用优化的超参数,我们的方法在度量P@5和P@10上优于SVD、ItemKNN和MostPop。
表二实验结果
方法 | P@5 | P@10 |
默认的超参 | 0.1869 | 0.1783 |
优化的超参 | 0.2539 | 0.2364 |
MostPop | 0.2216 | 0.1865 |
SVD | 0.0536 | 0.0388 |
ItemKNN | 0.0482 | 0.0257 |
综上所述,本发明提出了一种特定于属性的知识图谱(KG)方法来推荐供应商方法。供应商推荐系统(RS)考虑了供方信息。通过构建特定于物业的子图知识图,得到特定于物业的关联度,进而得到采购需求与采购记录的全局关联度,以衡量最优的前N位供应商推荐。我们探索了一种初步的尝试,利用知识图谱进行附带信息的供应商推荐。基于一种特定于属性的知识图谱(KG)方法来推荐供应商方法,本发明在一个模拟的供应商推荐模型场景中进行了实验。实验结果表明,该方法在三条基线上具有明显的优越性。
本发明的基于知识图谱的供应商推荐方法是针对开放、动态环境下的供应商选择问题,基于积累的丰富的供应商、采购记录、采购价格、交期、质量评价等历史数据,在供应商和采购数据所构建的供应知识图谱(SKG)基础上,利用该知识图谱对指定的供应需求推荐供应商的方法,以此来指导供应商的选择,减少人工经验依赖,提高供应商选择效率。该模型采用基于采购相关属性知识嵌入的方法,来学习与采购需求U匹配的采购属性的相关度计算和排序,从而完成供应商的推荐。
对本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及形变,而所有的这些改变以及形变都应该属于本发明权利要求的保护范围之内。
Claims (2)
1.一种基于知识图谱的供应商推荐方法,包括下列步骤:以每个采购需求向量为用户,采购记录为项目,首先构建用户-项目供应知识图谱SKG,通过node2vec对知识图谱结构特征进行提取,对其知识进行向量化表示,将知识图谱中的实体和实体间的关系嵌入到稠密的低维向量中,然后通过计算用户项目之间的相似性得到用户与用户、项目与项目以及用户与项目之间的属性相关分数即不同特性的基本特征作为传播强度的权重值,基于计算出的针对每个属性的属性相关分数,构建采购需求向量与历史采购记录的全局关联度模型,得到与采购需求向量最相似的top-K历史记录。
2.根据权利要求1所述的供应商推荐方法,其特征在于,具体执行步骤如下:
第一部分,采购需求向量表示
(1)将包含供应商(Supplier)、产品类型(Procut_type)、价格级别(Price_level)、交货日期预期时间级别(Time_level)、采购策略(Purchase_policy)属性的采购需求映射到采购需求向量,使用深度神经网络方法来学习采购需求向量的表示;
(2)基于所构造的需求向量,用余弦相似度S来衡量采购需求向量之间的相似度,设e为预定阈值,当余弦相似度S小于预定阈值e时,将采购需求向量视为相同的采购需求向量并以同一采购需求向量表示;
第二部分,构建供应知识图谱SKG
作为用户的采购需求集合表示为U={u1,u2,...},其中u表示用户,ui表示用户u的采购需求;作为项目的采购记录集合表示为V={v1,v2,...}其中v表示项目,vj表示项目v的采购记录;
将供应知识图谱SKG定义为集合K=(E,R,O),E实体的集合,e表示单个实体, 具体包含用户采购需求集合U,项目采购记录集合V,产品类型(Procut_type)、时间级别(Time_level)、采购策略(Purchase_policy)、价格级别(Price_level)和供应商(Supplier);R表示实体间关系的集合;O表示关系类型属性集合,p在SKG中被定义为采购记录的属性,用p∈Γ表示;供应知识图谱SKG中的任意一条边对应一个三元组(i,r,j),其中i表示头实体,j表示尾实体,r表示实体之间的关系;在供应知识图谱SKG中,r表示同属于实体的用户采购需求集合U,等价于头实体i,到项目采购记录集合V,等价于头实体j,的反馈;如果头实体i∈U并且尾实体j∈V,则反馈指示用户u的采购需求ui对项目v的采购记录vj进行评级,并表示满足购买需求的程度;如果头实体且尾实体j∈V,则r表示为项目采购记录V的属性;采购记录作为供应知识图谱SKG中的物料,与两种实体相关联,一种是以低维向量表示的采购需求,另一种是采购记录的属性,如价格、交货期等;
第三部分、采用Entity2rec方法的Top-N项目推荐
(1)Node2Vec
供应知识图谱SKG包含了供应商反馈的协同信息,又包含了产品类型(Procut_type)、交货期(date)、质量(quality)和价格(price)内容信息,在Top-N项目推荐中,节点的向量值通过用户采购需求ui和项目采购记录vj的向量表示;通过随机游走算法对节点序列进行采样,并应用word2vec模型学习节点表示;
(2)基于特定属性的需求-产品相关性计算
在供应知识图谱SKG中,对于指定的采购需求,不同的属性具有不同的值;在判断u∈U、p∈Γ之间的相关性时,应考虑不同的权重;
考虑到用户采购需求u∈U一次只考虑节点的一个特定属性向量表示,因此每个属性构造供应知识图(SKG)的相应子图,表示为供应知识图谱子图(SKGp);构建了六个供应知识图谱子图(SKGp),包括产品类型属性(Procut_type)、时间级别属性(Time_level)、采购策略属性(Purchase_policy)、价格水平属性(Price_level)、供应商属性(Supplier)和从用户采购需求ui到采购记录属性p的反馈属性(Feedback);
对每个属性p,p∈O,只取知识图谱中通过属性p连接的实体得到一个供应知识图谱子图SKGp即三元组(i,p,j)的一个集合,其中这里考虑的属性p连接的实体至少要超过两个;对于每个供应知识图谱子图SKGp中的每个实体e,利用node2vec方法,学到一个高维映射向量xp,并将其投射到一个低维向量中,xp:e∈SKGp→Rd,其中e表示每个供应知识图谱子图SKGp中实体,e∈SKGp,xp表示实体e通过node2vec方法学习到的映射向量,将高维映射向量xp降维投射到R的低维向量空间,表示为xp:e∈SKGp→Rd;
在进行需求-产品相关性计算时,采用如下的方法:
第一步:对于每一个节点,希望把该节点表示为向量的情况下出现该节点邻近的点的概率最大,在此取对数形式如下:
其中节点e∈SKGp,Ns(e)∈SKGp表示通过node2vec方法得到的随机游走的实体节点u的邻域,xp(e)表示需要向量化表示的节点e的高维映射向量;Pr(Ns(e)|xp(e))表示在随机游走过程中,把节点u表示为向量的情况下出现与该节点e邻近点的概率;
第二步:对于每一个节点向量出现邻近点的概率等于邻近点中每个点出现的概率相乘:
其中ni表示实体节点e的各邻近点,且ni∈Ns(e)
第三步:该节点向量下对应其他每个节点的概率用softmax表示:
第四步:将上述三个公式整合,得到下面的目标函数:
其中:Ze是每个节点的分区函数,通过负抽样法近似;
第五步:最优化尝试最大化相同邻域之间的点积,得到实体u的映射向量xp(u),特定属性的相关度定义为:
其中:L(u)表示用户u过去采购的项目集;S表示向量的相似度测量方法,这里用cosine相似度;当p取为用户对项目的反馈属性时,供应知识图谱子图SKGp表示为一个用户交互图谱,相当于一个协同过滤模型,即当p=feedback,后ρfeedback(u,v)模拟协同过滤(CF),当向量空间中xfeedback(u)和xfeedback(v)更接近,ρfeedback(u,v)特定属性相关系数则更高;
若当项目v被选择相同项目的用户选择,则项目v会在SKGfeedback子图中被紧密连接;
第四部分,供应商推荐
基于计算出的针对每个属性p∈Γ的属性相关分数ρp(u,i),以每个采购需求向量为用户,采购记录为项目,构建采购需求向量与历史采购记录的全局关联度模型,得到与采购需求向量最相似的top-K历史记录。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110413765.8A CN113127754A (zh) | 2021-04-16 | 2021-04-16 | 一种基于知识图谱的供应商推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110413765.8A CN113127754A (zh) | 2021-04-16 | 2021-04-16 | 一种基于知识图谱的供应商推荐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113127754A true CN113127754A (zh) | 2021-07-16 |
Family
ID=76776996
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110413765.8A Pending CN113127754A (zh) | 2021-04-16 | 2021-04-16 | 一种基于知识图谱的供应商推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113127754A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112446629A (zh) * | 2020-12-02 | 2021-03-05 | 东莞理工学院 | 一种基于知识图谱的供应商选择方法 |
CN114265982A (zh) * | 2021-12-22 | 2022-04-01 | 北京中科闻歌科技股份有限公司 | 一种基于知识图谱的智能推荐方法 |
CN114491055A (zh) * | 2021-12-10 | 2022-05-13 | 浙江辰时科技集团有限公司 | 基于知识图谱的推荐算法 |
CN114565429A (zh) * | 2022-02-22 | 2022-05-31 | 哈尔滨工程大学 | 一种基于语义图模型的智能供应商匹配方法 |
CN114581204A (zh) * | 2022-04-28 | 2022-06-03 | 深圳市同征电子商务有限公司 | 一种基于电子商务平台的商品销售管理方法及系统 |
CN114648260A (zh) * | 2022-05-24 | 2022-06-21 | 深圳装速配科技有限公司 | 一种建材采购方法及建材采购平台 |
CN116561436A (zh) * | 2023-07-10 | 2023-08-08 | 江苏数兑科技有限公司 | 一种基于知识图谱的数据需求匹配方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112446629A (zh) * | 2020-12-02 | 2021-03-05 | 东莞理工学院 | 一种基于知识图谱的供应商选择方法 |
-
2021
- 2021-04-16 CN CN202110413765.8A patent/CN113127754A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112446629A (zh) * | 2020-12-02 | 2021-03-05 | 东莞理工学院 | 一种基于知识图谱的供应商选择方法 |
Non-Patent Citations (3)
Title |
---|
ADITYA GROVER: "node2vec: Scalable Feature Learning for Networks", 《IN PROCEEDINGS OF THE 22ND ACM SIGKDD INTERNATIONAL CONFERENCE ON KNOWLEDGE DISCOVERY AND DATA MINING (KDD "16)》 * |
ENRICO PALUMBO: "entity2rec: Learning User-Item Relatedness from Knowledge Graphs for Top-N Item Recommendation", 《RECSYS "17: PROCEEDINGS OF THE ELEVENTH ACM CONFERENCE ON RECOMMENDER SYSTEMS》 * |
吕赐兴: "Supplier recommendation based on knowledge graph embedding", 《2020 MANAGEMENT SCIENCE INFORMATIZATION AND ECONOMIC INNOVATION DEVELOPMENT CONFERENCE (MSIEID)》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112446629A (zh) * | 2020-12-02 | 2021-03-05 | 东莞理工学院 | 一种基于知识图谱的供应商选择方法 |
CN112446629B (zh) * | 2020-12-02 | 2024-03-29 | 东莞理工学院 | 一种基于知识图谱的供应商选择方法 |
CN114491055A (zh) * | 2021-12-10 | 2022-05-13 | 浙江辰时科技集团有限公司 | 基于知识图谱的推荐算法 |
CN114491055B (zh) * | 2021-12-10 | 2022-11-08 | 浙江辰时科技集团有限公司 | 基于知识图谱的推荐方法 |
CN114265982A (zh) * | 2021-12-22 | 2022-04-01 | 北京中科闻歌科技股份有限公司 | 一种基于知识图谱的智能推荐方法 |
CN114565429A (zh) * | 2022-02-22 | 2022-05-31 | 哈尔滨工程大学 | 一种基于语义图模型的智能供应商匹配方法 |
CN114581204A (zh) * | 2022-04-28 | 2022-06-03 | 深圳市同征电子商务有限公司 | 一种基于电子商务平台的商品销售管理方法及系统 |
CN114648260A (zh) * | 2022-05-24 | 2022-06-21 | 深圳装速配科技有限公司 | 一种建材采购方法及建材采购平台 |
CN114648260B (zh) * | 2022-05-24 | 2023-06-13 | 中交(厦门)电子商务有限公司 | 一种建材采购方法及建材采购平台 |
CN116561436A (zh) * | 2023-07-10 | 2023-08-08 | 江苏数兑科技有限公司 | 一种基于知识图谱的数据需求匹配方法 |
CN116561436B (zh) * | 2023-07-10 | 2023-09-29 | 江苏数兑科技有限公司 | 一种基于知识图谱的数据需求匹配方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113127754A (zh) | 一种基于知识图谱的供应商推荐方法 | |
Li et al. | Learning from history and present: Next-item recommendation via discriminatively exploiting user behaviors | |
Zhang et al. | Collaborative user network embedding for social recommender systems | |
Richardson et al. | Mining knowledge-sharing sites for viral marketing | |
CN111444395B (zh) | 获取实体间关系表达的方法、系统和设备、广告召回系统 | |
CN109190030B (zh) | 融合node2vec和深度神经网络的隐式反馈推荐方法 | |
Yu et al. | Joint user knowledge and matrix factorization for recommender systems | |
Dakhel et al. | A social recommender system using item asymmetric correlation | |
CN107545471B (zh) | 一种基于高斯混合的大数据智能推荐方法 | |
Hu et al. | Bayesian personalized ranking based on multiple-layer neighborhoods | |
Eliyas et al. | Recommendation systems: Content-based filtering vs collaborative filtering | |
Wu et al. | Optimization matrix factorization recommendation algorithm based on rating centrality | |
Ambulgekar et al. | A survey on collaborative filtering: tasks, approaches and applications | |
da Silva et al. | Content-based social recommendation with poisson matrix factorization | |
Wang et al. | BPF++: a unified factorization model for predicting retweet behaviors | |
Zhou et al. | Incorporating social network and user’s preference in matrix factorization for recommendation | |
Chen et al. | DPM-IEDA: dual probabilistic model assisted interactive estimation of distribution algorithm for personalized search | |
CN113342994B (zh) | 一种基于无采样协作知识图网络的推荐系统 | |
Amato et al. | Agents based multi-criteria decision-aid | |
Li et al. | Task recommendation with developer social network in software crowdsourcing | |
Hou et al. | A deep reinforcement learning real-time recommendation model based on long and short-term preference | |
CN110795640B (zh) | 一种弥补群组成员差异的自适应组推荐方法 | |
Jiang et al. | A fusion recommendation model based on mutual information and attention learning in heterogeneous social networks | |
CN115599990A (zh) | 一种知识感知结合深度强化学习的跨域推荐方法及系统 | |
Li et al. | A collaborative filtering recommendation method based on TagIEA expert degree model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210716 |