CN115391555A - 一种用户感知的知识图谱推荐系统及方法 - Google Patents
一种用户感知的知识图谱推荐系统及方法 Download PDFInfo
- Publication number
- CN115391555A CN115391555A CN202211031048.XA CN202211031048A CN115391555A CN 115391555 A CN115391555 A CN 115391555A CN 202211031048 A CN202211031048 A CN 202211031048A CN 115391555 A CN115391555 A CN 115391555A
- Authority
- CN
- China
- Prior art keywords
- user
- behavior
- article
- representation
- graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Accounting & Taxation (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Finance (AREA)
- Animal Behavior & Ethology (AREA)
- Biophysics (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Development Economics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明揭示了一种用户感知的知识图谱推荐系统及方法,包括用户与物品的交互数据、知识图谱数据、用户行为图数据、构建物品嵌入层、构建用户嵌入层、结果输出层,由数据集中提供的用户与文档的交互数据;知识图谱构建好之后,将其输入到图卷积网络层进行节点及其邻域信息的表示,之后,将图卷积网络层输出的邻域信息输入到多头自注意力网络层,最后形成节点的表示;对行为模型进行融合,再将交互信息融入,作为用户的最终表示;对于每一个用户,预测他/她会浏览某个商品的概率,就是结果预测层的内容。本发明提供的用户感知的知识图谱推荐系统及方法,在真实数据中验证了网络的合理性和有效性,整体实验效果良好,推荐符合一般认知。
Description
技术邻域
本发明涉及一种用户感知的知识图谱推荐系统及方法,属于计算机邻域。
背景技术
随着互联网时代的来临,互联网上的信息数量以指数级上升,因而产生了“信息过载”现象,怎么满足用户迅速而准确的获取信息已经是摆在人们面前的一大困难。常用的搜索引擎因为无法针对偏好为用户提供个性化的搜索服务,导致其推荐能力尚有不足。实际上,由于年龄段、教育水平和生活环境等因素的不同,不同的用户具有不同的特点,因此希望系统可以提供个性化搜索服务给用户提供其迫切需求的信息。因此,推荐系统的出现解决了这个问题。作为一种信息过滤系统,推荐系统具有以下两个最显著的特性:
·主动化。从用户角度考虑,门户网站和搜索引擎都是解决信息过载的有效方式,但它们都需要用户提供明确需求。而推荐系统不需要用户提供明确的需求,而是通过分析用户和物品的交互数据,对用户和物品进行建模,从而主动为用户推荐他们感兴趣的信息。
·个性化。推荐系统能够更好的发掘长尾信息,即将冷门物品推荐给用户。热门物品通常代表绝大多数用户的兴趣,而冷门物品往往代表一小部分用户的个性化需求。在电商平台火热的时代,由冷门物品带来的营业额甚至超过热门物品,发掘长尾信息是推荐系统的重要研究方向。
推荐系统旨在解决信息超载问题和根据用户的信息需求、兴趣等,将用户感兴趣的信息、产品等推荐给用户。最流行的推荐技术之一是协同过滤,它简单来说是利用某兴趣相投和拥有共同经验之群体的喜好来推荐用户感兴趣的信息。具体而言:通过合作的机制给予信息相当程度的回应(如评分等)并记录下来以达到过滤的目的,进而帮助用户筛选信息。
然而,基于协同过滤的方法通常受到用户和物品交互关系的稀疏性和冷启动等问题困扰。为了提供更准确、更多样和可解释更强的推荐,不能只考虑对用户和物品交互关系进行建模,研究人员建议使用用户和物品的辅助信息,包括用户的社交网络、用户的行为、物品的属性和多媒体等信息。知识图谱是推荐系统的一种辅助信息,它通常包含关于实体的属性和实体间的联系。由于其高维性和异构性,知识图谱通常通过知识图谱嵌入方法进行预处理,该方法将实体和关系嵌入到低维向量空间中,同时保持其固有结构。我们可以将物品的属性和关系处理成知识图谱的形式,再对知识图谱进行处理以便更好的表达出物品的特征。
同时,在许多真实的推荐场景中,用户和物品的交互行为通常存在多种关系。例如,在电商平台上,用户对不同物品的页面浏览和添加到收藏夹的行为,可以作为辅助知识来帮助预测用户的购买意向。因此,需要考虑这种类型间的行为影响以便更准确地推断用户的偏好。要利用多行为的信息进行推荐,有几个关键的技术难题有待解决:第一个问题在于如何从多类型的用户与物品交互行为中提炼出有效的信息;另一个问题在于如何将知识感知的物品语义关联性加入推荐模型。
发明内容
本发明要解决的技术问题是:如何从多类型的用户与物品交互行为中提炼出有效的信息;如何将知识感知的物品语义关联性加入推荐模型。
为了解决上述技术问题,本发明的一个技术方案是提供了一种用户感知的知识图谱推荐系统,其特征在于,包括数据预处理层、图构建层、物品嵌入层、用户嵌入层以及结果输出层,其中:
将原始的用户与物品的交互数据记录Y={(ui,vj,bk)|ui∈U,vj∈V,bk∈B}输入数据预处理层;由数据预处理层将数据处理成三元组(物品1,关系,物品2)或者(物品,属性,属性值)的形式进行存储,同时,将数据处理成含有时间戳的用户行为数据(用户,物品,行为,交互时间),其中,ui为第i个用户的用户交互表示,vj为第j个物品的物品交互表示,bk为第i个用户对第j个物品做出的第k个行为;
图构建层基于处理为(用户,物品,行为,交互时间)的数据为每个用户基于行为类型的数量l构建|B|个用户行为图,|B|=l+1,则为第i个用户构建的一组用户行为图表示为行为集合B中不同行为之间的顺序是基于语义空间中行为和行为购买之间的距离定义;并且,由图构建层基于三元组(物品1,关系,物品2)或者(物品,属性,属性值)为每个物品构建物品知识图谱,一个物品恰好对应知识图谱中一个实体的情况,即{(v,e)|v∈V,e∈E}},e表示知识图谱中的一个实体,v表示物品的节点嵌入表示;
将用户行为图输入用户嵌入层,用户嵌入层先对用户的不同用户行为图使用图形编码器对用户的行为进行编码后,将当前用户行为图与前一个用户行为图进行对比,基于对比学习获得表示用户不同行为模式的嵌入表示后,对所有嵌入表示进行融合,获得一个统一的嵌入表示来表示用户的行为;最后,用户嵌入层将表示用户行为的嵌入表示和当前用户交互表示以不同方式聚合,获得用户的最终用户嵌入表示;
将物品知识图谱输入物品嵌入层,物品嵌入层先利用图卷积网络层进行节点及其邻域信息的表示,图卷积网络层递归地传播来自节点的邻居的嵌入以更新某个节点的邻域信息,并采用用户与物品的交互数据来表示传播期间每个邻居的权重;随后,图卷积网络层输出的邻域信息输入到多头自注意力网络层,进行知识图谱节点信息的深度挖掘,挖掘节点与节点之间的深度关系,最后获得节点的表示,即为商品的最终物品嵌入表示;
用户的最终用户嵌入表示以及商品的最终物品嵌入表示输入结果输出层,由结果输出层利用预测函数获得预测分数。
优选地,所述用户与物品的交互数据以及知识图谱数据通过数据库的常规数据进行获取。
优选地,所述结果输出层输出的预测分数是预测每个用户会点击某个商品的概率,基于概率向用户推荐对应的商品作为展示结果。
本发明的另一个技术方案是提供了一种用户感知的知识图谱推荐方法,其特征在于,包括以下步骤:
S100、原始数据处理:
获取原始的用户与物品的交互数据记录Y={(ui,vj,bk)|ui∈U,vj∈V,bk∈B},按照构建知识图谱及用户行为图需要的格式处理数据,ui为第i个用户的用户交互表示,vj为第j个物品的物品交互表示,bk为第i个用户对第j个物品做出的第k个行为,其中,为构建物品知识图谱,将交互数据记录Y处理成三元组(物品1,关系,物品2)或者(物品,属性,属性值)的形式进行存储;为构建用户行为图,将交互数据记录Y处理成含有时间戳的用户行为数据(用户,物品,行为,交互时间);
S200、构建用户行为图:
在步骤S100处理好原始数据之后,根据不同的用户在不同时间的行为,基于行为类型的数量l为每一个用户构造|B|个用户行为图,|B|=l+1,其中,对于第i个用户而言,第t个行为图被定义为 其中,(b1,b2,…,bc)作为用户的行为序列是按照时间序列进行排序的,为第i个用户构建的一组用户行为图表示为
S300、构建物品知识图谱:
在步骤S100处理好原始数据之后,利用物品的信息三元组构建物品知识图谱,利用物品知识图谱对用户和物品的交互记录之外的物品的附加信息进行表达,一个物品对应物品知识图谱中一个实体的情况,即{(v,e)|v∈V,e∈E}},e表示物品知识图谱中的一个实体,v表示物品的节点嵌入表示;
S400、分别对用户的不同用户行为图使用图形编码器进行编码后,将当前用户行为图与前一个用户行为图进行对比,利用对比学习获取差异;在获得表示用户不同行为模式的嵌入表示后,对表示用户不同行为模式的嵌入表示进行融合,获得统一的嵌入表示来表示用户的行为;最后,将统一的嵌入表示和用户交互表示以不同方式聚合,形成用户的最终用户嵌入表示,具体包括以下步骤:
S401、对用户行为图进行编码:
S402、获取不同行为模式:
将当前用户行为图与前一个用户行为图进行对比获取差异,具体地,以InfoNCE作为学习目标,学习用户行为图之间的差异;对于第i个用户,取出两个相邻的用户行为图和分别指定gt-1(·)和gt(·)作为和的编码器,得到两个行为图嵌入分别表示为:
S403、行为融合:
在通过步骤S402获得表示用户不同行为模式的行为图嵌入后,对行为图嵌入进行融合,获得一个统一的嵌入bi来表示用户的行为;
S404、聚合用户交互表示ui及其行为表示bi作为用户的最终用户嵌入表示,用户行为图中一个节点的H阶表示u[H]就是该节点的初始表示及其相邻实体的H-1阶表示的聚合,所得到的u[H]为用户的最终用户嵌入表示;
S500、使用图卷积的方式对物品知识图谱中某个节点的邻居节点信息进行聚合表示,在计算邻居节点权重的方式上,利用用户u和某个关系r之间的分数来计算,以便更好的理解不同用户对不同关系的喜欢程度;之后,将节点的邻域信息输入到多头自注意力机制层,更深层次的提取节点之间的关联;最后,将节点的邻域信息和节点本身的嵌入结合形成物品的最终物品嵌入表示,包括如下步骤:
S501、改进计算物品知识图谱中邻居节点的权重:
其中,g函数能够使得Rd×Rd→R,d表示知识图谱中节点embedding的维度;
S502、利用GCN计算节点邻域信息:
S(v)表示所有和实体v直接相连的所有实体集合;
rv,e表示实体v与实体e之间的关系。
S503、输入多头自注意力网络层进行关系的深度挖掘:
通过self-attention计算输入各个节点邻域信息之间的关系,具体包括如下步骤:在计算出邻居信息的线性组合之后,将节点的邻域信息输入self-attention层,引入多头注意力机制,从多个角度去寻找节点邻域信息之间的关系,深度挖掘知识图谱中其他尚未被发现的关系;最终,节点得到的邻域信息表示不仅包含了用户u和某个关系r之间的分数,而且还包括邻域之间的关系信息,表示如下:
S504、聚合操作:
得到节点邻域信息的表示N(v)之后,将物品v的节点嵌入表示v与其邻域信息N(v)进行聚合,形成物品v的最终物品嵌入表示vfinal,其中,物品知识图谱中一个节点的H阶表示eu[H]就是该节点的初始表示及其相邻实体的H-1阶表示的聚合,所得到的eu[H]为物品的最终物品嵌入表示,聚合时,使用KGCN提出的aggsum聚合器获得节点的最终表示vfinal,则有:
vfinal=aggsum=σ(W·(v+N(v))+b)
式中,σ表示的是非线性函数ReLU;
S600、将最终用户嵌入表示以及最终物品嵌入一起输入到结果预测层,结果预测层采用预测函数获得预测分数,基于预测分数进行分析结果展示。
优选地,对于用户与物品的交互数据,记录用户和物品的基本信息以及记录用户和物品的交互行为;形成的物品知识图谱和用户行为图以txt的形式存储进行读取。
优选地,在第i个用户的用户交互表示ui中额外加入用户的辅助信息用于丰富表达。
优选地,步骤S200中,构建用户行为图时,使用超元路径,以整体的方式整合了多条用户与物品交互的路径,使得能够更快速的看出用户最终购买的原因。
优选地,步骤S200中,构建用户行为图时,用户行为包括浏览rpv、收藏rffav、加入购物车rcart以及购买rbuy,则定义一组排序的行为{rpv,rfav,rcart,rbuy},第i个用户的初始用户行为图包含四个用户行为图,第一个用户行为图仅包含购买行为,第二个用户行为图包含浏览和购买行为,第三个用户行为图包含除添加到购物车之外的所有行为,第四个用户行为图包含所有四种行为。
优选地,步骤S403中,进行融合的方法采用线性融合方法或者基于神经网络的融合方法。
优选地,步骤S404中,聚合使用GCN聚合器、GraphSage聚合器或Bi-Interaction聚合器实现,其中:
GCN聚合器:用户交互表示ui和行为表示bi相加,然后进行非线性转换,有:
fGCN=LeakyReLU(W(ui+bi))
其中,W∈Rd′×d是可训练的权重矩阵,d′是转换大小,d表示维度大小。
GraphSage聚合器:用户交互表示ui和行为表示bi连接,然后进行非线性转换:
fGraphSage=LeakyReLU(W(ui||bi))
Bi-Interaction聚合器:考虑了用户交互表示ui和行为表示bi之间的特征交互:
fBi-Interaction=LeakyReLU(Wi(ui+bi))+LeakyReLU(W2(ui⊙bi))
其中,W1,W2∈R是可训练的权重矩阵,⊙表示元素的乘积,让相似的特征传递更多的信息。
本发明提供了一种用户感知的知识图谱推荐系统及方法,实现提升模型推荐效果的目标,同时验证引入用户行为和物品属性的有效性。本发明结构设计合理,在这项工作中探索了UBAR推荐模型是一种利用用户行为信息及物品信息进行推荐的端到端模型。该模型分为两个主要模块——物品嵌入模块和用户嵌入模块,分别进行物品表示和用户表示:物品嵌入模块通过遍历知识图谱将节点的邻域信息加入物品的自身嵌入形成物品的最终表示;用户嵌入模块则是将用户行为的超元图提取的用户行为嵌入与用户和物品交互的历史信息嵌入结合起来形成最终的用户表示。UBAR是在KGCN基础上改进的模型,将知识图谱和用户行为有效的结合在推荐系统中,极大提高了推荐质量。
附图说明
图1为本发明用户感知的知识图谱推荐系统的流程框图;
图2为本发明用户感知的知识图谱推荐系统的核心算法网络框图。
图3为本发明用户感知的知识图谱推荐系统的用户嵌入细节图。
图4为本发明用户感知的知识图谱推荐系统的物品嵌入模块细节图。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本邻域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
如图1所示,本发明实施例提出了一种用户感知的知识图谱推荐系统系统,包括用户与物品的交互数据、知识图谱数据、用户行为图数据、构建物品嵌入层、构建用户嵌入层、结果输出层,其中:
用户与物品的交互数据:由数据集中提供的用户与文档的交互数据,交互行为包括点击查看,收藏,加入购物车,购买等;
知识图谱数据:数据集中有关物品属性的数据,一般有3-5个属性,将物品属性及它们之间的关系以三元组的形式进行存储,同时采用图数据库的形式存储;
用户行为图数据:数据集中与用户交互行为相关的数据,具体包含查看,收藏,加入购物车,购买等,将用户与物品的交互行为仿照知识图谱的构造流程,以三元组的形式(用户,行为,物品)存储在数据库里;
构建物品嵌入层:知识图谱构建好之后,需要将其(包括节点、关系、图结构)输入到图卷积网络层进行节点及其邻域信息的表示,这一层递归地传播来自节点的邻居的嵌入以更新某个节点的邻域信息,并采用用户与物品的交互数据来表示传播期间每个邻居的权重。之后,将图卷积网络层输出的邻域信息输入到多头自注意力网络层,进行知识图谱节点信息的深度挖掘,挖掘节点与节点之间的深度关系,最后形成节点的表示;
构建用户嵌入层:构建好的用户行为图数据输入到对比学习层,为了从这些超元图中提取不同的行为模式,参考对比学习的思想,学习不同的行为模型。对比学习层在获得表示用户不同行为模式的嵌入后,需要对这些行为模型进行融合,以获得一个统一的嵌入来表示用户的行为。因此,将对比学习层输入的结果输入到融合层,形成用户的行为嵌入。再将交互信息融入,作为用户的最终表示;
结果输出层:将上述得到的用户的最终表示以及物品的最终表示输入到该层,进行结果的预测。对于每一个用户,预测他/她会查看某个文档的概率,用一个匹配分数来表示。
在本实施方式中,所述用户与物品的交互数据以及知识图谱数据通过数据库的常规数据进行获取。对于用户与物品的交互数据,除了记录用户和物品的基本信息之外,还要记录下他们交互行为,因为不同的行为对推荐的影响比重不一样。对于知识图谱数据,除了将其存储在图数据库中之外,还以三元组的存在关系数据库中,方便后面的使用。
在本实施方式中,所述结果输出层是对于每一个用户,预测他/她会查看某个文档的概率,展示出来的结果就是对于每个用户都会推荐一些商品。
以下列举所述一种用户感知的知识图谱推荐系统的较优实施例,以清楚的说明本发明的内容,应当明确的是,本发明的内容并不限制于以下实施例,其他通过本邻域普通技术人员的常规技术手段的改进亦在本发明的思想范围之内。
如图1所示,本发明实施例提出了一种用户感知的知识图谱推荐系统,包括用户与物品的交互数据、知识图谱数据、用户行为图数据、构建物品嵌入层、构建用户嵌入层、结果输出层,其中:
用户与物品的交互数据:由数据集中提供的用户与文档的交互数据,交互行为包括点击查看、收藏、加入购物车、购买等;
知识图谱数据:数据集中有关物品属性的数据,一般有3-5个属性,将物品属性及它们之间的关系以三元组的形式进行存储,同时采用图数据库的形式存储;
用户行为图数据:数据集中与用户交互行为相关的数据,具体包含查看,收藏,加入购物车,购买等,将用户与物品的交互行为仿照知识图谱的构造流程,以三元组的形式(用户,行为,物品)存储在数据库里;
构建物品嵌入层:知识图谱构建好之后,需要将其(包括节点、关系、图结构)输入到图卷积网络层进行节点及其邻域信息的表示,这一层递归地传播来自节点的邻居的嵌入以更新某个节点的邻域信息,并采用用户与物品的交互数据来表示传播期间每个邻居的权重。之后,将图卷积网络层输出的邻域信息输入到多头自注意力网络层,进行知识图谱节点信息的深度挖掘,挖掘节点与节点之间的深度关系,最后形成节点的表示;
构建用户嵌入层:构建好的用户行为图数据输入到对比学习层,为了从这些超元图中提取不同的行为模式,参考对比学习的思想,学习不同的行为模型。对比学习层在获得表示用户不同行为模式的嵌入后,需要对这些行为模型进行融合,以获得一个统一的嵌入来表示用户的行为。因此,将对比学习层输入的结果输入到融合层,形成用户的行为嵌入。再将交互信息融入,作为用户的最终表示;
结果输出层:将上述得到的用户的最终表示以及物品的最终表示输入到该层,进行结果的预测。对于每一个用户,预测他/她会查看某个文档的概率,用一个匹配分数来表示。
在本实施方式中,所述用户与物品的交互数据以及知识图谱数据通过数据库的常规数据进行获取。对于用户与物品的交互数据,除了记录用户和物品的基本信息之外,还要记录下他们交互行为,因为不同的行为对推荐的影响比重不一样。对于知识图谱数据,除了将其存储在图数据库中之外,还以三元组的存在关系数据库中,方便后面的使用。
在本实施方式中,所述结果输出层是对于每一个用户,预测他/她会查看某个文档的概率,展示出来的结果就是对于每个用户都会推荐一些商品。
以下列举所述一种用户感知的知识图谱推荐系统的较优实施例,以清楚的说明本发明的内容,应当明确的是,本发明的内容并不限制于以下实施例,其他通过本邻域普通技术人员的常规技术手段的改进亦在本发明的思想范围之内。
如图2所示,本发明实施例提出了一种用户感知的知识图谱推荐系统的网络结构方法,包括如下步骤:
S100、原始数据处理:
获取原始的用户与物品的交互数据记录Y={(ui,vj,bk)|ui∈U,vj∈V,bk∈B}之后,按照构建知识图谱及用户行为图需要的格式处理数据。对于知识图谱的构建,将数据处理成三元组(物品1,关系,物品2)或者(物品,属性,属性值)的形式进行存储。对于用户行为图的构建,将数据处理成含有时间戳的用户行为数据(用户,物品,行为,交互时间)。
对于用户与物品的交互数据,除了记录用户和物品的基本信息之外,还要记录下他们交互行为,因为不同的行为对推荐的影响比重不一样。对于知识图谱数据,除了将其存储在图数据库中之外,还以三元组的存在关系数据库中。最后形成的知识图谱和用户行为图以txt的形式存储进行读取。
S200、构建用户行为图:
在步骤S100处理好原始数据之后,根据不同的用户在不同时间的行为,基于行为类型的数量为每一个用户构造|B|个行为图,|B|=l+1,l表示行为类型的数量。对于用户ui而言,第t个行为图被定义为其中,(b1,b2,…,bc)作为用户的行为序列是按照时间序列进行排序的,ui为第i个用户的用户交互表示,同时每一个行为b都是第i个用户对第j个物品做出的行为,vj为第j个物品的物品交互表示。利用用户行为数据构建用户行为图,作为算法模块的输入,便于后续更好地提取用户的特征。
用户的表达可以额外加入用户的辅助信息用于丰富表达。在构建用户行为图时,使用超元路径,它以一种整体的方式整合了多条用户与物品交互的路径,使得能够更快速的看出用户最终购买的原因。在获取交互数据记录Y={(ui,vj,bk)|ui∈U,vj∈V,bk∈B}之后,基于行为类型的数量为第i个用户构造|B|个行为图,将会有一组用户行为图来描述数据中用户ui与物品vj之间的交互。B中不同行为之间的顺序是基于语义空间中行为和行为购买之间的距离定义。比如四种常见的用户行为:浏览rpv、收藏rfav、加入购物车rcart、购买rbuy,定义一组排序的行为{rpv,rfav,rcart,rbuy}。在这种情况下,可以定义:用户的第一个用户行为图仅包含购买行为,第二个用户行为图包含浏览和购买行为,第三个用户行为图包含除添加到购物车之外的所有行为,最后一个用户行为图包含所有四种行为。
S300、构建知识图谱:
在步骤S100处理好原始数据之后,利用物品的信息三元组构建物品知识图谱Gv,由实体-关系-实体三元组(h,r,t|h∈E,r∈R,t∈E)组成,分别表示知识三元组的头部、关系和尾部,作为算法模块的输入,便于后续更好地提取物品的特征。
除了用户和物品的交互记录之外,物品还有一些附加信息,即物品的属性信息和其他额外扩展信息。例如,一件商品除了它唯一的标识ID之外,还可以用价格、类型、品牌等信息来描述。这些附加信息可以通过其他的渠道获取,并用知识图谱对这些信息进行表达。知识图谱是一种有向信息异构网络,通常由三元组(h,r,t|h∈E,r∈R,t∈E)组成,分别是头向量h、关系r和尾向量t,一个三元组描述了头向量h和尾向量t的一组关系。例如,三元组(鼠标,类别,电子产品)的实际含义是鼠标这件商品它是属于电子产品类别的。在许多推荐场景中,物品v∈V可以与Gv中一个或者许多个实体相关联。在本发明中,只考虑一个物品v恰好对应知识图谱Gv中一个实体的情况,即{(v,e)|v∈V,e∈E}},e表示知识图谱Gv中的一个实体。因此,在本发明的后续描述中,可以使用v或者e来表示某一项物品。
S400、构建用户嵌入层:
构造好用户的行为图之后,分别对用户的不同行为图使用图形编码器对用户的行为进行编码。由于行为图的复杂程度(包含不同类型的行为)是逐级增加。为了从这些行为图中提取不同的行为模式,本发明的做法是将当前行为图与前一个行为图进行对比,利用对比学习的思想获取差异。在获得表示用户不同行为模式的嵌入后,需要对这些行为模型进行融合,以获得一个统一的嵌入来表示用户的行为。最后,将用户行为和用户交互信息以不同方式聚合,形成最后的用户嵌入表示。
如图3所示,步骤S400具体包括以下步骤:
S401、对行为图进行编码:
构造好用户的行为图之后,分别对用户的不同行为图使用图形编码器对用户的行为进行编码,对于用户ui而言,第t个行为图被表示为:
S402、获取不同行为模式:对每个用户定义了四个行为图,行为图的复杂程度(包含不同类型的行为)是逐级增加。为了从这些行为图中提取不同的行为模式,本发明的做法是将当前行为图与前一个行为图进行对比获取差异。因此,可以参考对比学习的思想,以InfoNCE作为学习目标,学习行为图之间的差异。对于用户ui,取出两个相邻的行为图和分别指定gt-1(·)和gt(·)作为它们的编码器,因此得到两个行为图嵌入分别表示为:
S403、行为融合:
在获得表示用户不同行为模式的嵌入后,需要对这些行为模式进行融合,以获得一个统一的嵌入来表示用户的行为。融合的方法有很多种:一种是被广泛使用的线性融合方法,如总和和平均;还有一种基于神经网络的方法(如多层感知器(MLP)和个性化非线性融合(PNLF))。选定一个融合函数f(*)就可以为用户提供一个统一的行为模式嵌入:
S404、最终的表示:最后的操作是聚合用户交互表示ui及其行为表示bi作为用户的最终用户嵌入表示,本发明使用三种类型的聚合器f(·)实现:
(1)GCN聚合器:向量ui和bi相加,然后进行非线性转换:
fGCN=LeakyReLU(W(ui+bi))
其中,W∈Rd′×d是可训练的权重矩阵,d′是转换大小,d表示维度大小。
(2)GraphSage聚合器:向量ui和bi连接,然后进行非线性转换:
fGraphSage=LeakyReLU(W(ui||bi))
(3)Bi-Interaction聚合器:考虑了向量ui和bi之间的特征交互:
fBi-Interaction=LeakyReLU(W1(ui+bi))+LeakyReLU(W2(ui⊙bi))
其中,W1,W2∈R是可训练的权重矩阵,⊙表示元素的乘积,让相似的特征传递更多的信息。
S500、构建物品嵌入层:
在嵌入层,首先使用图卷积的方式对知识图谱中某个节点的邻居节点信息进行聚合表示,在计算邻居节点权重的方式上,利用用户u和某个关系r之间的分数来计算,以便更好的理解不同用户对不同关系的喜欢程度。例如用户u选择了商品v主要的原因是商品v是某个品牌下的东西,那么说明对于该用户而言,他选择商品的时候更在意品牌,对于这个品牌下的其他东西,用户也有更大的意愿选择。之后,将节点的邻域信息输入到多头自注意力机制层,更深层次的提取节点之间的关联。最后,将节点的邻域信息和节点本身的嵌入结合形成最终的物品嵌入表示。
如图4所示,步骤S500具体包括如下步骤:
S501、改进计算图中邻居节点的权重:
传统的GCN在做聚合操作时,将图的邻接矩阵A、度矩阵D作为输入,使用D·A·D进行计算,之后跟当前层的所有节点做一个加权和,得到下一层的节点表示。从计算权重的方式来看,GCN的权重系数不可学习,仅与节点的度相关。本发明对GCN的权重计算方式做了一个改进:从特定的用户u出发,使用函数g(u,r)来计算图中邻居节点的权重函数g计算用户u和某个关系r之间的分数,其现实含义可以理解为计算不同用户对不同关系的喜欢程度,计算公式如下:
其中,g函数可以使得Rd×Rd→R(比如内积),d表示知识图谱中节点embedding的维度。
S502、利用GCN计算节点邻域信息:
S(v)表示所有和实体v直接相连的所有实体集合;
rv,e表示实体v与实体e之间的关系。
S503、输入多头自注意力网络层进行关系的深度挖掘:
为了进一步计算每个节点邻域信息之间的关联程度,通过self-attention计算输入各个节点邻域信息之间的关系。具体的操作如下:在计算出邻居信息的线性组合之后,将节点的邻域信息输入self-attention层。此外,还引入了多头注意力机制,从多个角度去寻找节点邻域信息之间的关系,深度挖掘知识图谱中其他尚未被发现的关系。最终,节点得到的邻域信息表示不仅包含了用户u和某个关系r之间的分数,而且还包括邻域之间的关系信息,表示如下:
S504、聚合操作:
得到节点邻域信息的表示N(v)之后,最后一步的操作将商品v的节点嵌入表示v与其邻域信息N(v)进行聚合,形成商品v的最终物品嵌入表示vfinal。本发明使用KGCN提出的aggsum聚合器获得节点的最终表示vfinal,因为它的实验效果最好,则有:
vfinal=aggsum=σ(W·(v+N(v))+b)
式中,σ表示的是非线性函数ReLU。
S600、分析结果展示:在前面的物品嵌入层和用户嵌入层分别拿到商品的最终物品嵌入表示和用户的最终用户嵌入表示,将它一起输入到结果预测层最后进行预测。
商品的最终物品嵌入表示与它自身以及它的邻居节点有关,这被称为一阶表示,一般表示为eu[1]。将网络的层数由一层扩展到多层时,可以更广更深的挖掘出用户对物品的偏好,这个技术可以描述为:将知识图谱中每个节点的初始表示eu[0](0阶)传递给其邻居节点,得到一阶表示eu[1]。之后可以重复这个过程,即进一步传递和聚合一阶表示,以获得二阶表示eu[2]。以此类推,某一个节点的h阶表示eu[h]就是它本身eu[0]及其相邻实体的h-1表示eu[h-1]的聚合。同理,用户的表示也是经过h层聚合,得到u[h]。经过上述处理之后得到的eu[H]和u[H]分别表示最终的物品嵌入vfinal和用户嵌入ufinal。将vfinal和ufinal一起输入到预测函数f:R^d×R^d→R中,得到预测分数
Claims (10)
1.一种用户感知的知识图谱推荐系统,其特征在于,包括数据预处理层、图构建层、物品嵌入层、用户嵌入层以及结果输出层,其中:
将原始的用户与物品的交互数据记录Y={(ui,vj,bk)|ui∈U,vj∈V,bk∈B}输入数据预处理层;由数据预处理层将数据处理成三元组(物品1,关系,物品2)或者(物品,属性,属性值)的形式进行存储,同时,将数据处理成含有时间戳的用户行为数据(用户,物品,行为,交互时间),其中,ui为第i个用户的用户交互表示,vj为第j个物品的物品交互表示,bk为第i个用户对第j个物品做出的第k个行为;
图构建层基于处理为(用户,物品,行为,交互时间)的数据为每个用户基于行为类型的数量l构建|B|个用户行为图,|B|=l+1,则为第i个用户构建的一组用户行为图表示为行为集合B中不同行为之间的顺序是基于语义空间中行为和行为购买之间的距离定义;并且,由图构建层基于三元组(物品1,关系,物品2)或者(物品,属性,属性值)为每个物品构建物品知识图谱,一个物品恰好对应知识图谱中一个实体的情况,即{(v,e)|v∈V,e∈E}},e表示知识图谱中的一个实体,v表示物品的节点嵌入表示;
将用户行为图输入用户嵌入层,用户嵌入层先对用户的不同用户行为图使用图形编码器对用户的行为进行编码后,将当前用户行为图与前一个用户行为图进行对比,基于对比学习获得表示用户不同行为模式的嵌入表示后,对所有嵌入表示进行融合,获得一个统一的嵌入表示来表示用户的行为;最后,用户嵌入层将表示用户行为的嵌入表示和当前用户交互表示以不同方式聚合,获得用户的最终用户嵌入表示;
将物品知识图谱输入物品嵌入层,物品嵌入层先利用图卷积网络层进行节点及其邻域信息的表示,图卷积网络层递归地传播来自节点的邻居的嵌入以更新某个节点的邻域信息,并采用用户与物品的交互数据来表示传播期间每个邻居的权重;随后,图卷积网络层输出的邻域信息输入到多头自注意力网络层,进行知识图谱节点信息的深度挖掘,挖掘节点与节点之间的深度关系,最后获得节点的表示,即为商品的最终物品嵌入表示;
用户的最终用户嵌入表示以及商品的最终物品嵌入表示输入结果输出层,由结果输出层利用预测函数获得预测分数。
2.如权利要求1所述的一种用户感知的知识图谱推荐系统,其特征在于,所述用户与物品的交互数据以及知识图谱数据通过数据库的常规数据进行获取。
3.如权利要求1所述的一种用户感知的知识图谱推荐系统,其特征在于,所述结果输出层输出的预测分数是预测每个用户会点击某个商品的概率,基于概率向用户推荐对应的商品作为展示结果。
4.一种用户感知的知识图谱推荐方法,其特征在于,包括以下步骤:
S100、原始数据处理:
获取原始的用户与物品的交互数据记录Y={(ui,vj,bk)|ui∈U,vj∈V,bk∈B},按照构建知识图谱及用户行为图需要的格式处理数据,ui为第i个用户的用户交互表示,vj为第j个物品的物品交互表示,bk为第i个用户对第j个物品做出的第k个行为,其中,为构建物品知识图谱,将交互数据记录Y处理成三元组(物品1,关系,物品2)或者(物品,属性,属性值)的形式进行存储;为构建用户行为图,将交互数据记录Y处理成含有时间戳的用户行为数据(用户,物品,行为,交互时间);
S200、构建用户行为图:
在步骤S100处理好原始数据之后,根据不同的用户在不同时间的行为,基于行为类型的数量l为每一个用户构造|B|个用户行为图,|B|=l+1,其中,对于第i个用户而言,第t个行为图被定义为 其中,(b1,b2,…,bc)作为用户的行为序列是按照时间序列进行排序的,为第i个用户构建的一组用户行为图表示为
S300、构建物品知识图谱:
在步骤S100处理好原始数据之后,利用物品的信息三元组构建物品知识图谱,利用物品知识图谱对用户和物品的交互记录之外的物品的附加信息进行表达,一个物品对应物品知识图谱中一个实体的情况,即{(v,e)|v∈V,e∈E}},e表示物品知识图谱中的一个实体,v表示物品的节点嵌入表示;
S400、分别对用户的不同用户行为图使用图形编码器进行编码后,将当前用户行为图与前一个用户行为图进行对比,利用对比学习获取差异;在获得表示用户不同行为模式的嵌入表示后,对表示用户不同行为模式的嵌入表示进行融合,获得统一的嵌入表示来表示用户的行为;最后,将统一的嵌入表示和用户交互表示以不同方式聚合,形成用户的最终用户嵌入表示,具体包括以下步骤:
S401、对用户行为图进行编码:
S402、获取不同行为模式:
将当前用户行为图与前一个用户行为图进行对比获取差异,具体地,以InfoNCE作为学习目标,学习用户行为图之间的差异;对于第i个用户,取出两个相邻的用户行为图和分别指定gt-1(·)和gt(·)作为和的编码器,得到两个行为图嵌入分别表示为:
S403、行为融合:
在通过步骤S402获得表示用户不同行为模式的行为图嵌入后,对行为图嵌入进行融合,获得一个统一的嵌入bi来表示用户的行为;
S404、聚合用户交互表示ui及其行为表示bi作为用户的最终用户嵌入表示,用户行为图中一个节点的H阶表示u[H]就是该节点的初始表示及其相邻实体的H-1阶表示的聚合,所得到的u[H]为用户的最终用户嵌入表示;
S500、使用图卷积的方式对物品知识图谱中某个节点的邻居节点信息进行聚合表示,在计算邻居节点权重的方式上,利用用户u和某个关系r之间的分数来计算,以便更好的理解不同用户对不同关系的喜欢程度;之后,将节点的邻域信息输入到多头自注意力机制层,更深层次的提取节点之间的关联;最后,将节点的邻域信息和节点本身的嵌入结合形成物品的最终物品嵌入表示,包括如下步骤:
S501、改进计算物品知识图谱中邻居节点的权重:
其中,g函数能够使得Rd×Rd→R,d表示知识图谱中节点embedding的维度;
S502、利用GCN计算节点邻域信息:
S(v)表示所有和实体v直接相连的所有实体集合;
rv,e表示实体v与实体e之间的关系。
S503、输入多头自注意力网络层进行关系的深度挖掘:
通过self-attention计算输入各个节点邻域信息之间的关系,具体包括如下步骤:在计算出邻居信息的线性组合之后,将节点的邻域信息输入self-attention层,引入多头注意力机制,从多个角度去寻找节点邻域信息之间的关系,深度挖掘知识图谱中其他尚未被发现的关系;最终,节点得到的邻域信息表示不仅包含了用户u和某个关系r之间的分数,而且还包括邻域之间的关系信息,表示如下:
S504、聚合操作:
得到节点邻域信息的表示N(v)之后,将物品v的节点嵌入表示v与其邻域信息N(v)进行聚合,形成物品v的最终物品嵌入表示vfinal,其中,物品知识图谱中一个节点的H阶表示eu[H]就是该节点的初始表示及其相邻实体的H-1阶表示的聚合,所得到的eu[H]为物品的最终物品嵌入表示,聚合时,使用KGCN提出的aggsum聚合器获得节点的最终表示vfinal,则有:
vfinal=aggsum=σ(W·(v+N(v))+b)
式中,σ表示的是非线性函数ReLU;
S600、将最终用户嵌入表示以及最终物品嵌入一起输入到结果预测层,结果预测层采用预测函数获得预测分数,基于预测分数进行分析结果展示。
5.如权利要求4所述的一种用户感知的知识图谱推荐方法,其特征在于,对于用户与物品的交互数据,记录用户和物品的基本信息以及记录用户和物品的交互行为;形成的物品知识图谱和用户行为图以txt的形式存储进行读取。
6.如权利要求4所述的一种用户感知的知识图谱推荐方法,其特征在于,在第i个用户的用户交互表示ui中额外加入用户的辅助信息用于丰富表达。
7.如权利要求4所述的一种用户感知的知识图谱推荐方法,其特征在于,步骤S200中,构建用户行为图时,使用超元路径,以整体的方式整合了多条用户与物品交互的路径,使得能够更快速的看出用户最终购买的原因。
9.如权利要求4所述的一种用户感知的知识图谱推荐方法,其特征在于,步骤S403中,进行融合的方法采用线性融合方法或者基于神经网络的融合方法。
10.如权利要求4所述的一种用户感知的知识图谱推荐方法,其特征在于,步骤S404中,聚合使用GCN聚合器、GraphSage聚合器或Bi-Interaction聚合器实现,其中:
GCN聚合器:用户交互表示ui和行为表示bi相加,然后进行非线性转换,有:
fGCN=LeakyReLU(W(ui+bi))
其中,W∈Rd′×d是可训练的权重矩阵,d′是转换大小,d表示维度大小。
GraphSage聚合器:用户交互表示ui和行为表示bi连接,然后进行非线性转换:
fGraphSahe=LeakyReLU(W(ui||bi))
Bi-Interaction聚合器:考虑了用户交互表示ui和行为表示bi之间的特征交互:
fBi-Interaction=LeakyReLU(W1(ui+bi))+LeakyReLU(W2(ui⊙bi))
其中,W1,W2∈R是可训练的权重矩阵,⊙表示元素的乘积,让相似的特征传递更多的信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211031048.XA CN115391555A (zh) | 2022-08-26 | 2022-08-26 | 一种用户感知的知识图谱推荐系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211031048.XA CN115391555A (zh) | 2022-08-26 | 2022-08-26 | 一种用户感知的知识图谱推荐系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115391555A true CN115391555A (zh) | 2022-11-25 |
Family
ID=84123089
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211031048.XA Pending CN115391555A (zh) | 2022-08-26 | 2022-08-26 | 一种用户感知的知识图谱推荐系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115391555A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116992960A (zh) * | 2023-09-25 | 2023-11-03 | 成都市智慧蓉城研究院有限公司 | 一种知识图谱可视化交互方法及系统 |
-
2022
- 2022-08-26 CN CN202211031048.XA patent/CN115391555A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116992960A (zh) * | 2023-09-25 | 2023-11-03 | 成都市智慧蓉城研究院有限公司 | 一种知识图谱可视化交互方法及系统 |
CN116992960B (zh) * | 2023-09-25 | 2023-12-05 | 成都市智慧蓉城研究院有限公司 | 一种知识图谱可视化交互方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110717098B (zh) | 基于元路径的上下文感知用户建模方法、序列推荐方法 | |
CN110837598B (zh) | 信息推荐方法、装置、设备及存储介质 | |
CN110910218B (zh) | 一种基于深度学习的多行为迁移推荐方法 | |
CN111881350A (zh) | 一种基于混合图结构化建模的推荐方法与系统 | |
CN112364976A (zh) | 基于会话推荐系统的用户偏好预测方法 | |
CN110866145A (zh) | 一种共同偏好辅助的深度单类协同过滤推荐方法 | |
CN112948625A (zh) | 一种基于属性异质信息网络嵌入的电影推荐方法 | |
CN114971784B (zh) | 一种融合自注意力机制基于图神经网络的会话推荐方法与系统 | |
CN114386513A (zh) | 一种集成评论与评分的交互式评分预测方法及系统 | |
CN113342994B (zh) | 一种基于无采样协作知识图网络的推荐系统 | |
CN115391555A (zh) | 一种用户感知的知识图谱推荐系统及方法 | |
Nazari et al. | Scalable and data-independent multi-agent recommender system using social networks analysis | |
CN111310029B (zh) | 一种基于用户商品画像和潜在因子特征提取的混合推荐方法 | |
Jian et al. | Multimodal collaborative graph for image recommendation | |
Zhang et al. | Multi-view dynamic heterogeneous information network embedding | |
Hsieh et al. | Leveraging attribute latent features for addressing new item cold-start issue | |
Deng et al. | Similitude attentive relation network for click-through rate prediction | |
CN114491055B (zh) | 基于知识图谱的推荐方法 | |
CN115391558A (zh) | 一种基于图神经网络的双端推荐方法及系统 | |
CN116932887B (zh) | 一种基于多模态图卷积的影像推荐系统及方法 | |
Xu | A DeepFM model-based personalized Restaurant Recommendation System | |
Bougteb et al. | Deep Learning-Driven Multi-Criteria Decision-Making for Effective Recommender Systems. | |
Obaje | A Performant Predict Analytics Approach to Recommender Systems Using Deep Learning Methods | |
CN118071400A (zh) | 基于图计算技术在信息消费领域的应用方法及系统 | |
CN117194805A (zh) | 基于深度图神经网络的多特征空间融合推荐方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |