CN112836125B - 一种基于知识图谱和图卷积网络的推荐方法及其系统 - Google Patents

一种基于知识图谱和图卷积网络的推荐方法及其系统 Download PDF

Info

Publication number
CN112836125B
CN112836125B CN202110170855.9A CN202110170855A CN112836125B CN 112836125 B CN112836125 B CN 112836125B CN 202110170855 A CN202110170855 A CN 202110170855A CN 112836125 B CN112836125 B CN 112836125B
Authority
CN
China
Prior art keywords
user
representation
representing
graph
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110170855.9A
Other languages
English (en)
Other versions
CN112836125A (zh
Inventor
张邦佐
张利飒
蒲东兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeast Normal University
Original Assignee
Northeast Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeast Normal University filed Critical Northeast Normal University
Priority to CN202110170855.9A priority Critical patent/CN112836125B/zh
Publication of CN112836125A publication Critical patent/CN112836125A/zh
Application granted granted Critical
Publication of CN112836125B publication Critical patent/CN112836125B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • G06F16/24554Unary operations; Data partitioning operations
    • G06F16/24556Aggregation; Duplicate elimination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种基于知识图谱和图卷积网络的推荐方法及其系统,其中一种基于知识图谱和图卷积网络的推荐方法具体包括以下步骤:获取用户的高阶嵌入表示;根据用户的高阶嵌入表示,进行物品嵌入表示的获取;根据获取的用户的高阶嵌入表示和物品嵌入表示,对用户进行预测。本申请能够增强用户表示,并通过知识图谱中的不同关系权重聚合传播物品特征,从而探索用户的远程兴趣。

Description

一种基于知识图谱和图卷积网络的推荐方法及其系统
技术领域
本申请涉及大数据领域,具体地,涉及一种基于知识图谱和图卷积网络的推荐方法及其系统。
背景技术
现有技术中,推荐系统已经成为信息爆炸时代克服信息过载问题的最重要的方法,如何精准、快速地预测用户的爱好,推荐给用户最想要的物品,不仅是科学研究领域的重要研究课题,也逐渐成为现实生活中各种电子商务领域成败攸关的核心技术。在众多的推荐方法中,协同过滤方法从用户历史数据来预测用户偏好,具有有效性和普遍性,受到众多研究者的关注。但是,协同过滤方法无法建模辅助信息,例如物品属性、用户配置文件和上下文,因此在用户和物品交互很少的稀疏情况下表现不佳。基于协同过滤的方法同样遭遇到用户物品交互的稀疏性和冷启动的问题。
为了解决这些限制,研究人员通常在推荐系统中引入辅助信息,包括:社交网络,上下文信息,物品属性和图像信息。知识图谱是一个有向异构图,它由大量的实体和关系组成,包含了丰富的语义信息。具体的说,知识图谱的每条边和与其相连的两个结点,都可以使用三元组(头实体,关系,尾实体)的形式来表达,其中,与边相连的结点称为实体,这条边称为关系,它表示头实体和尾实体通过关系相连接,这个三元组也可以称为事实。由于知识图谱中天然包含了丰富的实体和事实,我们可以很自然地将知识图谱作为一种新型的辅助信息引入推荐系统,从而提高推荐系统的准确性、多样性、可解释性,当前已经成为了研究的热点。
将知识图谱与推荐系统相结合的方法通常有以下几种:(1)基于路径的推荐方法:这种方法是将知识图谱视为一个异构信息网络,然后构造用户和物品之间的元路径或元图特征,充分且直观地利用了知识图谱的网络结构,但是这类方法需要手动设计元路径或者元图,在实践中难以到达最优,同时,也无法在实体不属于同一个领域的场景(例如新闻推荐)中应用,因为我们无法为这样的场景预定义元路径或者元图。(2)基于嵌入的推荐方法:这种方法通常直接使用来自知识图谱的信息来丰富物品或用户的表示。大致可以将其分为两类:基于距离的翻译方法(例如:TransE,TrasR)和基于语义的匹配方法(例如:RECASL,DisMult),但是,这些方法在实体传播方面遭遇到了瓶颈。(3)混合的推荐方法:这种方法将基于路径的推荐方法和基于嵌入的推荐方法结合起来,通过整合实体和关系的语义表示和连接信息,充分利用知识图谱中的信息进行更好的推荐,它是基于嵌入传播的思想,在知识图谱中连接结构的指导下细化实体表示。尽管上述这些方法在推荐系统上取得了不错的成果,但是,由于知识图谱的异构性,充分发挥知识图谱内在的高阶语义信息,并探索与用户之间的关系特征仍然很有挑战性。
因此如何将现有的基于分层的方法和基于深度学习方法有效结合起来,得到准确有效的文本分类,依然是本领域技术人员急需要解决的关键问题。
发明内容
为达到上述目的,本申请提供了一种基于知识图谱和图卷积网络的推荐方法,具体包括以下步骤:获取用户的高阶嵌入表示;根据用户的高阶嵌入表示,进行物品嵌入表示的获取;根据获取的用户的高阶嵌入表示和物品嵌入表示,对用户进行预测。
如上的,其中,获取用户的高阶嵌入表示之前,获取用户与物品交互的行为;用户与物品交互的行为用矩阵Y∈Rm×n来表示,m代表用户集有m个用户,具体表示为u={u1,u2,…um};n代表物品集合中有n个物品,具体表示为v={v1,v2,…vn};通过用户行为矩阵得到用户物品交互矩阵,用户物品交互矩阵Y表示为Y={yuv|u∈U,v∈V},yuv表示用户u是否与物品v之间存在交互。
其中,
Figure BDA0002938872740000031
如上的,其中,以用户物品交互矩阵Y作为输入,获取用户的高阶嵌入表示,具体包括以下子步骤:获取用户邻接图;获取用户特征图;根据用户邻接图和用户特征图,获取全部用户特征表示图;在全部用户特征表示图中,获取用户u的高阶嵌入表示。
如上的,其中,用户u的高阶嵌入表示u具体表示为:
Figure BDA0002938872740000032
其中,Gu表示用户邻接图,
Figure BDA0002938872740000033
表示用激活函数重新定义后的fagg函数,
Figure BDA0002938872740000034
表示用户特征的第l层表示,u表示用户,v表示物品。
如上的,其中,根据用户的高阶嵌入表示,进行物品嵌入表示的获取,具体包括以下子步骤:确定物品表示输入层;构建知识图邻域传播层,根据物品表示输入层和知识图邻域传播层获取物品嵌入式表示。
如上的,其中,将用户u的嵌入表示和知识图谱的0层实体作为物品表示输入层。
如上的,其中,使用函数f来获取知识图谱的实体之间的不同关系r对用户的重要性,重要性fi(u,ri)具体表示为:
Figure BDA0002938872740000035
其中·表示按元素相乘,ri表示实体e与第i个邻域的关系,n代表选择邻域的数量,u表示用户,u为用户u的高阶嵌入表示,fi表示第i个关系对用户u的重要性,exp表示以自然常数e为底的指数函数。
如上的,其中,实体e的邻域聚合
Figure BDA0002938872740000036
表示为:
Figure BDA0002938872740000037
u表示用户u的高阶嵌入表示,·表示内积,fi(u,ri)表示实体e的不同关系r对用户的重要性,ri表示实体e与第i个邻域的关系,ε表示知识图谱中实体的集合;n代表选择邻域的数量。
如上的,其中,将实体表示e及其邻域聚合
Figure BDA0002938872740000041
聚合成实体聚合
Figure BDA0002938872740000042
具体表示为:
Figure BDA0002938872740000043
其中σ是sigmoid函数,Qh-1代表第h-1跳的权重矩阵,c表示偏置,h表示邻域传播的跳数,
Figure BDA0002938872740000044
表示h-1跳实体的邻域传播,
Figure BDA0002938872740000045
表示实体e的邻域聚合;
实体聚合
Figure BDA0002938872740000046
作为物品嵌入表示,物品嵌入表示v具体表示为
Figure BDA0002938872740000047
如上的,其中,在获得用户嵌入表示u和物品嵌入表示v之后,通过预测函数g来预测概率,概率预测具体表示为:
Figure BDA0002938872740000048
本申请具有以下有益效果:
(1)本申请提供的基于知识图谱和图卷积网络的推荐方法及其系统,能够增强用户表示,并通过知识图谱中的不同关系权重聚合传播物品特征,从而探索用户的远程兴趣。
(2)本申请提供的基于知识图谱和图卷积网络的推荐方法及其系统,其中推荐方法能够在一定程度上提高推荐系统的性能,在一定程度保证了用户兴趣的预测。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1是根据本申请实施例提供的一种基于知识图谱和图卷积网络的推荐方法流程图;
图2是根据本申请实施例提供的用户特征聚合过程示意图;
图3是根据本申请实施例提供的知识图谱邻域传播层示意图。
具体实施方式
下面结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
考虑到现有方法的局限性,本申请提出了基于知识图谱和图卷积网络的推荐方法及其系统,其中基于知识图谱和图卷积网络的推荐系统集合了知识图谱推荐算法和团卷积网络推荐算法,通过研究用户的兴趣偏好,进行个性化计算,由系统发现用户的兴趣点,从而引导用户发现自己的信息需求。
在本申请提供的推荐方法中,由于隐式反馈更能反映用户特点,因此利用隐式反馈来表示用户与物品交互的行为(例如点击,购买或评分)。具体用矩阵Y∈Rm×n来表示,m代表我们的用户集有m个用户,具体表示为u={u1,u2,…um};n代表物品集合中有n个物品,具体表示为v={v1,v2,…vn};用户物品交互矩阵Y表示为Y={yuv|u∈U,u∈V},yiv表示用户u是否与物品v之间存在交互。
其中,
Figure BDA0002938872740000051
如果在用户物品交互矩阵Y中已经观察到用户物品交互,表示为1,代表用户潜在的兴趣来源,同样,如果用户物品之间未观察到交互,表示为0。
用户物品交互矩阵为推荐系统提供了用户直接的兴趣表示,进一步地,知识图谱能够为推荐系统引入丰富的语义关系,有助于更深层次地发现用户兴趣,其中知识图谱用符号
Figure BDA0002938872740000052
来表示。知识图谱
Figure BDA0002938872740000053
由大量的实体关系实体三元组组成,表示为
Figure BDA0002938872740000054
其中,h,t分别表示头实体和尾实体,r表示关系,ε和R分别表示实体集合和关系集合。
实施例一
如图1是本申请基于知识图谱和图卷积网络的推荐系统提供的推荐方法,具体包括以下子步骤:
步骤S110:获取用户的高阶嵌入表示。
其中,假设两个用户对同一个物品有交互,则表明这两个用户的相关性较高,因此用户相关性所占的权重较大。将用户物品交互特征构建为图,使用图卷积网络不断聚合用户特征,最终获得用户的高阶表示。
具体地,如图2所示,以用户物品交互矩阵Y∈Rm×n作为输入;然后从用户物品交互矩阵中提取用户的第0层用户表示图,经过多层图卷积网络聚合,获得高阶用户表示图,生成全部用户的特征嵌入表示,从而获得用户u的高阶嵌入表示,其中步骤S110具体包括以下子步骤:
步骤S1101:获取用户邻接图。
其中,在获取用户邻接图之前,还包括计算用户之间的相似性,具体使用一个函数g来计算用户ui和uj之间的相似性,相似性g(ui,uj)具体表示为:
Figure BDA0002938872740000061
其中→表示交互符号,代表用户ui和uj对同一个物品vi存在交互,sim(·)表示用户ui和uj单次交互的相似性计算,形成用户交互表示图G0∈Rm×m,g(ui,uj)表示G0中的元素。其中,为了防止交互过程中G0中的元素值过大,使用g(ui,uj)=g(ui,uj)/max(g(ui,uj))对每个元素进行标准化处理,最终得到用户邻接图Gu
步骤S1102:获取用户特征图。
将用户和物品之间观察到的交互作为用户特征,构建用户特征图
Figure BDA0002938872740000065
具体表示为:
Figure BDA0002938872740000062
其中,
Figure BDA0002938872740000063
表示物品对用户的特征图,[·]表示用户特征图中内容代表元素,yij表示用户特征图中的元素,i表示第i个用户,j表示第j个物品。为了更好的表示用户图卷积聚合,将
Figure BDA0002938872740000064
作为用户特征的第0层表示。
步骤S1103:根据用户邻接图和用户特征图,获取全部用户特征表示图。
其中为了更好的增强用户表示,使用分层传播卷积聚合的方法,以用户邻接图Gu和用户特征图
Figure BDA0002938872740000071
为输入,经过图卷积聚合层得到用户特征的高阶表示图,接着使用Relu函数作非线性变换,为下一层聚合做准备,直至完成全部层数的聚合。
同时,为了更好的提取用户特征,使用权重矩阵W和偏置b来增强用户表示,使用函数fagg来表示图卷积聚合的过程,其中函数fagg具体表示为:
Figure BDA0002938872740000072
其中,l为图卷积聚合层数,*代表矩阵的相乘,Gu表示用户邻接图,
Figure BDA0002938872740000073
表示用户特征的第l层表示,b表示用户部分的偏置,Wl-1表示用户特征的第l-1层权重,
Figure BDA0002938872740000074
表示用户特征的第l-1层表示,u表示用户,v表示物品。
为了增强用户表示,使用激活函数sigmoid,fagg函数重新定义为:
Figure BDA0002938872740000075
其中,
Figure BDA0002938872740000076
为重新定义的图卷积聚合函数,
Figure BDA0002938872740000077
表示用户特征的第l层表示,Gu表示用户邻接图,σ是sigmoid函数,u表示用户,v表示物品。
步骤S1104:在全部用户特征表示图中,获取用户u的嵌入表示。
其中步骤S1103中得到了全部用户的特征表示图,为了获取用户u的特征,我们根据用户u的特定编号进行查找操作,得到用户u的高阶嵌入表示u具体表示为:
Figure BDA0002938872740000078
其中,Gu表示用户邻接图,
Figure BDA0002938872740000079
表示重新定义后的fagg函数,
Figure BDA00029388727400000710
表示用户特征的第l层表示,u表示用户。
进一步地,为了探索用户特征聚合的重要性,设置第一变体,具体为将图卷积网络部分去掉获取的用户特征表示作为第一变体,用户高阶嵌入表示
Figure BDA00029388727400000711
具体表示为:
Figure BDA00029388727400000712
其中,
Figure BDA00029388727400000713
表示重新定义后的fagg函数,u表示用户,Gu表示用户邻接图,
Figure BDA0002938872740000081
表示用户特征图,v表示物品。
步骤S120:根据用户的高阶嵌入表示,进行物品嵌入表示的获取。
其中,如图3所示,将每个物品v与知识图谱中的实体e相对应,并通过实体e对应的关系在知识图谱上传播用户偏好。因此,物品表示的生成需要同时输入用户嵌入表示和知识图谱。然后利用注意力机制得到知识图谱中实体的不同关系r对用户兴趣的影响权重,将关系作为传播因子在固定数量的邻居上传播,最终形成物品嵌入表示。
步骤S120具体包括以下子步骤:
步骤S1201:确定物品表示输入层。
将用户u交互的物品,在知识图谱中对应为头实体,表示为
Figure BDA0002938872740000082
将用户u的嵌入表示和知识图谱的0层实体为物品表示输入层。
步骤S1202:构建知识图邻域传播层,根据物品表示输入层和知识图邻域传播层获取物品嵌入式表示。
知识图谱中的关系多种多样,有的实体所连接的关系可能达到几十条,但是,大部分关系对于用户兴趣的影响不大,因此,需要确定知识图谱的邻域传播层。
通过选择固定数量的关系来计算实体e的邻域,表示为
Figure BDA0002938872740000083
其中n表示选择邻域的数量。
进一步地,在知识图谱中,实体ei和实体ej之间用关系rij来进行连接,在三元组中表示为(ei,rij,ej)。根据知识图谱中实体的不同关系r对用户u的重要性,使用函数f来获取不同关系对用户的重要性,重要性fi(u,ri)具体表示为:
Figure BDA0002938872740000084
其中·表示按元素相乘,ri表示实体e与第i个邻域的关系,n代表选择邻域的数量,u表示用户,u为用户u的高阶嵌入表示,fi表示第i个关系对用户u的重要性,exp表示以自然常数e为底的指数函数。得到的实体e的邻域聚合
Figure BDA0002938872740000091
获示为:
Figure BDA0002938872740000092
·表示内积,u表示用户u的高阶嵌入表示,fi(u,ri)表示实体e的不同关系r对用户的重要性,ε表示知识图谱中实体的集合,ri表示实体e与第i个邻域的关系,n代表选择邻域的数量。
进一步地,将实体表示e及其邻域聚合
Figure BDA0002938872740000093
聚合成一个向量,并经过sigmoid函数进行线性激活,实体聚合后作为实体e邻域传播形成
Figure BDA0002938872740000094
具体表示为:
Figure BDA0002938872740000095
其中σ是sigmoid函数,Qh-1代表第h-1跳的权重矩阵,c表示偏置,h表示邻域传播的跳数,
Figure BDA0002938872740000096
表示h-1跳实体的邻域传播,
Figure BDA0002938872740000097
表示实体e的邻域聚合。
最终得到的实体聚合
Figure BDA0002938872740000098
作为物品嵌入表示,物品嵌入表示v具体表示为
Figure BDA0002938872740000099
进一步地,为了探索知识图谱中不同关系对邻域聚合的重要性,设置第二变体,第二变体具体为去掉注意力机制获取的物品嵌入表示,物品嵌入表示
Figure BDA00029388727400000910
具体表示为:
Figure BDA00029388727400000911
其中,Qh-1代表第h-1跳权重矩阵,
Figure BDA00029388727400000912
表示h-1跳邻域传播的实体表示,h表示邻域传播的跳数,σ是sigmoid函数,e为实体表示,ε表示知识图谱中实体的集合,u表示用户u的高阶嵌入表示,c表示物品部分的偏置。
步骤S130:根据获取的用户的高阶嵌入表示和物品嵌入表示,对用户进行预测。
具体地,在获得用户嵌入表示u和物品嵌入表示v之后,通过预测函数g来预测概率,概率预测具体表示为:
Figure BDA00029388727400000913
为了证明用户聚合的高阶表示有助于增强推荐系统的性能,将去掉图卷积网络生成的用户特征图
Figure BDA0002938872740000101
作为用户嵌入表示,通过上述推荐算法得到的第一预测函数表示为:
Figure BDA0002938872740000102
为了探索知识图谱中不同关系的重要性,将注意力机制生成的
Figure BDA0002938872740000103
作为物品嵌入表示,通过上述推荐算法得到的第二预测函数具体表示为:
Figure BDA0002938872740000104
进一步地,根据用户嵌入表示u和物品嵌入表示v得到的第三预测函数表示为:
g=σ(u·v)
其中,在获取上述预测函数后,还包括,对推荐系统进行评估,以验证不同参数对推荐系统的影响,例如在设置第一变体和第二变体后,推荐系统的性能是否受到了影响。具体根据准确率、精确率和召回率和排序能力这几类指标进行推荐系统的点击率评估(简称CTR)。
具体地,在每获取一次预测函数后,调用CTR函数,获取上述几类指标的具体数值,具体数值越大,则说明推荐系统的性能越好。理论上来讲,根据知识图谱和图卷积网络推荐系统的性能是最好的。
其中准确率(Accuracy,简称Acc)表示分类正确的样本数占样本总数的比例,该指标在需要向用户展示预测评分的系统中尤为重要,准确率具体表示为:
Figure BDA0002938872740000105
其中,TP表示样本的真实类别为正(样本的真实值),最后预测得到的结果也为正;FP表示样本的真实类别为正,最后预测得到的结果却为负;FN表示样本的真实类别为负,最后预测得到的结果却为正;TN表示样本的真实类别为负,最后预测得到的结果也为负。
使用精确率(Precision)和召回率(Recall)来衡量推荐系统的预测能力,精确率具体表示为:
Figure BDA0002938872740000111
其中,TP表示样本的真实类别为正,最后预测得到的结果也为正;FP表示样本的真实类别为正,最后预测得到的结果却为负;FN表示样本的真实类别为负,最后预测得到的结果却为正。
召回率具体表示为:
Figure BDA0002938872740000112
其中,TP表示样本的真实类别为正,最后预测得到的结果也为正;FP表示样本的真实类别为正,最后预测得到的结果却为负;FN表示样本的真实类别为负,最后预测得到的结果却为正。
但是,这两个指标往往只是代表了问题的一个方面,为了折中精确率和召回率的结果,引入了F1分数(F1-score),具体表示为:
Figure BDA0002938872740000113
在根据函数CTR评估中,不仅希望推荐系统给出是否点击的分类信息,更需要推荐系统给出准确的概率值作为排序的依据,这样能够综合考虑正实例和负实例,应对样本不均衡的情况。而AUC(Area Under Curve,ROC曲线下面积)就直观地反映了CTR的准确性(也就是CTR的排序能力)
Figure BDA0002938872740000114
其中,M,N分别表示正样本数和负样本数,pos表示正实例样本,
Figure BDA0002938872740000115
是指第i条样本insi的序号,也就是说,将概率得分从小到大排序,排在第rank个位置。
在对用户进行预测之后,需要设置损失函数来增强推荐算法的学习能力。遍历了所有的用户物品交互,采用负抽样策略,将用户观察到的交互视为正实例,未观察到的交互视为负实例。此外,设置最小化的损失函数以保证预测的准确率,损失函数包括:交叉熵损失,用户聚合损失和物品传播损失,损失函数
Figure BDA0002938872740000116
具体表示为:
Figure BDA0002938872740000121
其中,σ是sigmoid函数,yuv表示用户u是否与物品v之间存在交互,
Figure BDA0002938872740000122
表示通过预测函数g得到的预测概率,Gu表示用户邻接图,
Figure BDA0002938872740000123
表示用户特征的第l-1层表示,c表示物品部分的偏置,b表示用户部分的偏置,
Figure BDA0002938872740000124
表示实体e的邻域聚合,
Figure BDA0002938872740000125
表示h-1跳实体的邻域传播,Qh-1代表第h-1跳的权重矩阵,Wl-1表示用户特征的第l-1层权重,n表示选择邻域的数量,λ是正则化参数,λG表示用户聚合部分的参数,λe表示物品邻域传播部分的参数,F表示正则化项。
其中,本申请通过不同的数据集,以验证本申请提供的知识图谱和图卷积网络推荐系统的性能优于现有技术中推荐系统的性能,以及验证用户特征聚合和知识图谱中不同关系的权重对传播用户兴趣有着重要的意义。具体请见表1和表2。
具体地,本申请中采用了图书数据集和音乐数据集,其中图书数据集中包含了图书社区的278858个用户对271379个图书的来自于1149780个明确的评级,其中每个评级的范围是从1到10。音乐数据集包含来自指定音乐平台的2000名用户的音乐家的收听信息。
表1
Figure BDA0002938872740000126
通过表1,能够得出本申请提供的推荐方法相比于其他的方法可以在一定程度上提高推荐系统的性能。
表2
Figure BDA0002938872740000131
通过表2,能够得出用户表示高阶建模和知识图谱中不同关系的权重对传播用户兴趣有着重要的意义。具体为,去掉图卷积聚合层或注意力机制下的推荐方法中,推荐系统的性能较差,而基于知识图谱和图卷积网络的推荐方法中,推荐系统的性能更好。
本申请具有以下有益效果:
(2)本申请提供的基于知识图谱和图卷积网络的推荐方法及其系统,能够增强用户表示,并通过知识图谱中的不同关系权重聚合传播物品特征,从而探索用户的远程兴趣。
(3)本申请提供的基于知识图谱和图卷积网络的推荐方法及其系统,其中推荐方法能够在一定程度上提高推荐系统的性能,在一定程度保证了用户兴趣的预测。
虽然当前申请参考的示例被描述,其只是为了解释的目的而不是对本申请的限制,对实施方式的改变,增加和/或删除可以被做出而不脱离本申请的范围。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (8)

1.一种基于知识图谱和图卷积网络的推荐方法,其特征在于,具体包括以下步骤:
获取用户的高阶嵌入表示;
根据用户的高阶嵌入表示,进行物品嵌入表示的获取;
根据获取的用户的高阶嵌入表示和物品嵌入表示,对用户进行预测;
获取用户的高阶嵌入表示具体包括以下子步骤:
获取用户邻接图和用户特征图;
用户特征图
Figure FDA0003293906480000011
其中,
Figure FDA0003293906480000012
表示物品对用户的特征图,m代表用户集有m个用户,n代表物品集合中有n个物品,[·]表示用户特征图中内容代表元素,yij表示用户特征图中的元素,i表示第i个用户,j表示第j个物品,为了更好的表示用户图卷积聚合,将
Figure FDA0003293906480000013
作为用户特征的第0层表示;
使用权重矩阵W和偏置b来增强用户表示,使用函数fagg来表示图卷积聚合的过程,其中函数fagg具体表示为:
Figure FDA0003293906480000014
其中,l为图卷积聚合层数,*代表矩阵的相乘,Gu表示用户邻接图,
Figure FDA0003293906480000015
表示用户特征的第l层表示,b表示用户部分的偏置,Wl-1表示用户特征的第l-1层权重,
Figure FDA0003293906480000016
表示用户特征的第l-1层表示,u表示用户,v表示物品;
根据用户邻接图和用户特征图,获取全部用户特征表示图;
在全部用户特征表示图中,获取用户u的嵌入表示;
根据用户u的特定编号进行查找操作,得到用户u的高阶嵌入表示u具体表示为:
Figure FDA0003293906480000017
其中,Gu表示用户邻接图,
Figure FDA0003293906480000018
表示重新定义后的fagg函数,
Figure FDA0003293906480000019
表示用户特征的第l层表示,u表示用户;
其中物品嵌入表示
Figure FDA0003293906480000021
具体表示为:
Figure FDA0003293906480000022
其中,Qh-1代表第h-1跳权重矩阵,
Figure FDA0003293906480000023
表示h-1跳邻域传播的实体表示,h表示邻域传播的跳数,σ是sigmoid函数,e为实体表示,ε表示知识图谱中实体的集合,u表示用户u的高阶嵌入表示,c表示物品部分的偏置,ri表示实体e与第i个邻域的关系。
2.如权利要求1所述的基于知识图谱和图卷积网络的推荐方法,其特征在于,获取用户的高阶嵌入表示之前,获取用户与物品交互的行为;
用户与物品交互的行为用矩阵Y∈Rm×n来表示,m代表用户集有m个用户,具体表示为u={u1,u2,…um};n代表物品集合中有n个物品,具体表示为v={v1,v2,…vn};
通过用户行为矩阵得到用户物品交互矩阵,用户物品交互矩阵Y表示为Y={yuv|u∈U,v∈V},yuv表示用户u是否与物品v之间存在交互;
其中,
Figure FDA0003293906480000024
3.如权利要求1所述的基于知识图谱和图卷积网络的推荐方法,其特征在于,根据用户的高阶嵌入表示,进行物品嵌入表示的获取,具体包括以下子步骤:
确定物品表示输入层;
构建知识图邻域传播层,根据物品表示输入层和知识图邻域传播层获取物品嵌入式表示。
4.如权利要求3所述的基于知识图谱和图卷积网络的推荐方法,其特征在于,将用户u的嵌入表示和知识图谱的0层实体作为物品表示输入层。
5.如权利要求4所述的基于知识图谱和图卷积网络的推荐方法,其特征在于,使用函数f来获取知识图谱的实体之间的不同关系r对用户的重要性,重要性fi(u,ri)具体表示为:
Figure FDA0003293906480000031
其中·表示按元素相乘,ri表示实体e与第i个邻域的关系,k代表选择邻域的数量,u表示用户,u为用户u的高阶嵌入表示,fi表示第i个关系对用户u的重要性,exp表示以自然常数e为底的指数函数。
6.如权利要求5所述的基于知识图谱和图卷积网络的推荐方法,其特征在于,实体e的邻域聚合
Figure FDA0003293906480000032
表示为:
Figure FDA0003293906480000033
u表示用户u的高阶嵌入表示,·表示内积,fi(u,ri)表示实体e的不同关系r对用户的重要性,ri表示实体e与第i个邻域的关系,ε表示知识图谱中实体的集合;k代表选择邻域的数量。
7.如权利要求6所述的基于知识图谱和图卷积网络的推荐方法,其特征在于,将实体表示e及其邻域聚合
Figure FDA0003293906480000032
聚合成实体聚合
Figure FDA0003293906480000035
具体表示为:
Figure FDA0003293906480000036
其中σ是sigmoid函数,Qh-1代表第h-1跳的权重矩阵,c表示偏置,h表示邻域传播的跳数,
Figure FDA0003293906480000037
表示h-1跳实体的邻域传播,
Figure FDA0003293906480000038
表示实体e的邻域聚合;
实体聚合
Figure FDA0003293906480000039
作为物品嵌入表示,物品嵌入表示v具体表示为
Figure FDA00032939064800000310
8.如权利要求1-7任一项所述的基于知识图谱和图卷积网络的推荐方法,其特征在于,在获得用户嵌入表示u和物品嵌入表示v之后,通过预测函数g来预测概率,概率预测具体表示为:
Figure FDA00032939064800000311
CN202110170855.9A 2021-02-08 2021-02-08 一种基于知识图谱和图卷积网络的推荐方法及其系统 Active CN112836125B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110170855.9A CN112836125B (zh) 2021-02-08 2021-02-08 一种基于知识图谱和图卷积网络的推荐方法及其系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110170855.9A CN112836125B (zh) 2021-02-08 2021-02-08 一种基于知识图谱和图卷积网络的推荐方法及其系统

Publications (2)

Publication Number Publication Date
CN112836125A CN112836125A (zh) 2021-05-25
CN112836125B true CN112836125B (zh) 2022-02-11

Family

ID=75930970

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110170855.9A Active CN112836125B (zh) 2021-02-08 2021-02-08 一种基于知识图谱和图卷积网络的推荐方法及其系统

Country Status (1)

Country Link
CN (1) CN112836125B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113590946B (zh) * 2021-07-26 2023-06-20 西安工程大学 一种基于知识图谱实体锚定的网络资源推荐方法和装置
CN113688974B (zh) * 2021-07-28 2023-10-24 湖南科技大学 一种基于轻量化图卷积网络的移动应用推荐方法
CN113918834B (zh) * 2021-10-22 2022-10-28 重庆理工大学 融合社交关系的图卷积协同过滤推荐方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110737778A (zh) * 2019-09-04 2020-01-31 北京邮电大学 基于知识图谱和Transformer的专利推荐方法
CN110991483A (zh) * 2019-11-01 2020-04-10 北京邮电大学 高阶邻域混合的网络表示学习方法及装置
CN111737592A (zh) * 2020-06-18 2020-10-02 北京航空航天大学 一种基于异构传播协同知识感知网络的推荐方法
CN111859166A (zh) * 2020-07-28 2020-10-30 重庆邮电大学 一种基于改进的图卷积神经网络的物品评分预测方法
CN111858972A (zh) * 2020-07-28 2020-10-30 山东大学 一种基于家庭知识图谱的电影推荐方法
CN111881342A (zh) * 2020-06-23 2020-11-03 北京工业大学 一种基于图孪生网络的推荐方法
CN112084383A (zh) * 2020-09-07 2020-12-15 中国平安财产保险股份有限公司 基于知识图谱的信息推荐方法、装置、设备及存储介质
CN112232925A (zh) * 2020-11-02 2021-01-15 哈尔滨工程大学 一种融合知识图谱对商品进行个性化推荐的方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110737778A (zh) * 2019-09-04 2020-01-31 北京邮电大学 基于知识图谱和Transformer的专利推荐方法
CN110991483A (zh) * 2019-11-01 2020-04-10 北京邮电大学 高阶邻域混合的网络表示学习方法及装置
CN111737592A (zh) * 2020-06-18 2020-10-02 北京航空航天大学 一种基于异构传播协同知识感知网络的推荐方法
CN111881342A (zh) * 2020-06-23 2020-11-03 北京工业大学 一种基于图孪生网络的推荐方法
CN111859166A (zh) * 2020-07-28 2020-10-30 重庆邮电大学 一种基于改进的图卷积神经网络的物品评分预测方法
CN111858972A (zh) * 2020-07-28 2020-10-30 山东大学 一种基于家庭知识图谱的电影推荐方法
CN112084383A (zh) * 2020-09-07 2020-12-15 中国平安财产保险股份有限公司 基于知识图谱的信息推荐方法、装置、设备及存储介质
CN112232925A (zh) * 2020-11-02 2021-01-15 哈尔滨工程大学 一种融合知识图谱对商品进行个性化推荐的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
融合用户和物品信息的个性化推荐算法研究;方晓梅;《中国优秀硕士学位论文全文数据库 信息科技辑》;20200715;11-62 *

Also Published As

Publication number Publication date
CN112836125A (zh) 2021-05-25

Similar Documents

Publication Publication Date Title
CN112836125B (zh) 一种基于知识图谱和图卷积网络的推荐方法及其系统
Parvin et al. TCFACO: Trust-aware collaborative filtering method based on ant colony optimization
CN109241412B (zh) 一种基于网络表示学习的推荐方法、系统及电子设备
Papadakis et al. Collaborative filtering recommender systems taxonomy
Choudhury et al. Time-aware link prediction to explore network effects on temporal knowledge evolution
Farnadi et al. Soft quantification in statistical relational learning
CN110321492A (zh) 一种基于社区信息的项目推荐方法及系统
WO2017119006A1 (en) Method and virtual data agent system for providing data insights with artificial intelligence
Chen et al. A probabilistic linguistic and dual trust network-based user collaborative filtering model
Ali et al. Dynamic context management in context-aware recommender systems
Chang et al. KGTN: Knowledge Graph Transformer Network for explainable multi-category item recommendation
Jalal Big data and intelligent software systems
CN107730306A (zh) 基于多维偏好模型的电影评分预测与偏好估计方法
Zhang et al. Multi-view dynamic heterogeneous information network embedding
CN116561443A (zh) 基于属性扩展的双消息传播图的项目推荐方法、装置
Zhu et al. Gtrm: A top-n recommendation model for smartphone applications
Eyjolfsdottir et al. Moviegen: A movie recommendation system
Yuan et al. Transaction prediction in blockchain: a negative link prediction algorithm based on the sentiment analysis and balance theory
Han et al. Attributed multiplex graph clustering: A heuristic clustering-aware network embedding approach
Ye et al. An interpretable mechanism for personalized recommendation based on cross feature
Bai et al. Meta-graph embedding in heterogeneous information network for top-n recommendation
CN114429384A (zh) 基于电商平台的产品智能推荐方法及系统
Chuanyan et al. Neural graph filtering for context-aware recommendation
Paleti et al. User opinions driven social recommendation system
Chakrabarti et al. Monitoring large scale production processes using a rule-based visualization recommendation system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant