CN112115378B - 基于图卷积协同过滤的推荐预测系统以及推荐预测方法 - Google Patents

基于图卷积协同过滤的推荐预测系统以及推荐预测方法 Download PDF

Info

Publication number
CN112115378B
CN112115378B CN202010974559.XA CN202010974559A CN112115378B CN 112115378 B CN112115378 B CN 112115378B CN 202010974559 A CN202010974559 A CN 202010974559A CN 112115378 B CN112115378 B CN 112115378B
Authority
CN
China
Prior art keywords
user
graph convolution
layer
model
project
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010974559.XA
Other languages
English (en)
Other versions
CN112115378A (zh
Inventor
李平
李飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changsha University of Science and Technology
Original Assignee
Changsha University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changsha University of Science and Technology filed Critical Changsha University of Science and Technology
Priority to CN202010974559.XA priority Critical patent/CN112115378B/zh
Publication of CN112115378A publication Critical patent/CN112115378A/zh
Application granted granted Critical
Publication of CN112115378B publication Critical patent/CN112115378B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于图卷积协同过滤的推荐预测系统以及推荐预测方法,系统包括输入层、图卷积模型层和特征交互层,图卷积模型层构建有图卷积模型,图卷积模型以用户输入向量集合和项目输入向量集合作为输入数据,输出经过L层传播后的用户多重嵌入向量组和项目多重嵌入向量组;特征交互层使用外积对用户多重嵌入向量组和项目多重嵌入向量组进行交叉建模,构建交互体,通过CNN网络模型对交互体进行学习,最终得到用户节点对项目节点的预测结果。本发明使用外积对用户多重嵌入向量组和项目多重嵌入向量组进行交叉建模,构建交互体,利用CNN网络提取交互体的多维度关系和深层次交互关联,从理论上提升预测结果的有效性,从而提升推荐精确度。

Description

基于图卷积协同过滤的推荐预测系统以及推荐预测方法
技术领域
本发明涉及信息推荐技术领域,特别涉及一种基于图卷积协同过滤的推荐预测系统以及推荐预测方法。
背景技术
近年来,随着云计算、海量数据存储等技术的快速发展,从大数据中提取有价值的信息对提高人类生活品质有很大的意义。协同过滤算法不断与最前沿的研究理论(基于社交、会话、图卷积网络)结合,从而在推荐系统领域被广泛研究,如何学习更有意义的用户与项目的低维嵌入向量表达,并充分提取嵌入向量每个维度特征的潜在交互联系,是提高个性化推荐效率的关键。
由于推荐任务在某些平台收集用户或者项目边缘信息的难度很大,在很多场景下,只有ID作为唯一的标识特征,以及获取它们之间的显性反馈(评分)或者隐式反馈(点击)。因此,引入图卷积网络的节点特征表示学习,让用户或项目节点学习图拓扑结构的局部特征引起了很大关注。基于图卷积模型的协同过滤将用户和项目交互表示为由用户节点与项目节点组成的二部图,节点间的显性关系用边连接。谱图卷积借助图的拉普拉斯矩阵去提取节点的局部关系,例如,NGCF模型提出了捕获具有协同信号的嵌入向量,迭代执行消息构造与聚合,提取多跳相关邻域信息;SMOG-CF模型通过定义信息构造公式能够快速在图上学习一个节点的任意阶邻域消息传播;LR-GCCF模型提出了一种简化的线性模型来平滑嵌入向量传播;GCMC模型结合双线性解码器,用自编码的方法试图解决图上链接预测的问题;LightGCN模型选择取消转换矩阵和非线性激活等等。上述模型都有效的在图结构上学习了节点表示,获得了显著的性能提升。从理论上来说,GCN(图卷积网络)可以聚合节点的任意阶邻域特征,加上自身信息,生成目标节点的多重表达。然而这些模型存在的局限是:推断偏好时简单的拼接多重嵌入向量,以内积作交互函数,只考虑对应维度上的关系,且嵌入向量每个维度的特征对推断结果的贡献权重完全一样,因此特征向量不同维度的潜在交互不能被充分提取。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种基于图卷积协同过滤的推荐预测系统以及推荐预测方法。
本发明的第一方面,提供了一种基于图卷积协同过滤的推荐预测系统,其特征在于,所述系统包括:
输入层,用于提供用户输入向量集合和项目输入向量集合;
图卷积模型层,构建有图卷积模型,所述图卷积模型以所述用户输入向量集合和所述项目输入向量集合作为输入数据,输出经过L层传播后的用户多重嵌入向量组和项目多重嵌入向量组;
特征交互层,使用外积对所述用户多重嵌入向量组和所述项目多重嵌入向量组进行交叉建模,构建交互体,通过CNN网络模型对所述交互体进行学习,依据所述CNN网络模型的学习结果,得到用户节点对项目节点的第一预测结果;
其中,令所述用户多重嵌入向量组为:
Figure BDA0002685310300000021
所述项目多重嵌入向量组为:
Figure BDA0002685310300000022
所述交叉建模的表达式为:
Figure BDA0002685310300000023
Figure BDA0002685310300000024
Figure BDA0002685310300000025
表示所述图卷积模型输出的第j层用户嵌入向量的转置,
Figure BDA0002685310300000026
表示所述图卷积模型输出的第i层项目嵌入向量,
Figure BDA0002685310300000027
表示
Figure BDA0002685310300000028
Figure BDA0002685310300000029
的外积,j,k∈{0,1,…,L};所述交互体的表达式为:
Figure BDA00026853103000000210
Stack(·)表示堆砌函数。
根据本发明的实施例,至少具有以下有益效果:
本系统提供的特征交互层,使用外积对用户多重嵌入向量组和项目多重嵌入向量组进行交叉建模,构建交互体,通过CNN网络模型对交互体进行学习,利用CNN网络提取交互体的多维度关系和深层次交互关联,从理论上提升预测结果的有效性,从而提升系统的推荐精确度,最终提升用户体验。
本发明的第二方面,提供了一种基于图卷积协同过滤的推荐预测方法,包括以下步骤:
构建图卷积模型;
将用户输入向量集合和项目输入向量集合输入至所述图卷积模型,得到所述图卷积模型输出的经过L层传播后的用户多重嵌入向量组和项目多重嵌入向量组;
使用外积对所述用户多重嵌入向量组和所述项目多重嵌入向量组进行交叉建模,构建交互体,通过CNN网络模型对所述交互体进行学习,依据所述CNN网络模型的学习结果,得到用户节点对项目节点的第一预测结果;其中,令所述用户多重嵌入向量组为:
Figure BDA0002685310300000031
所述项目多重嵌入向量组为:
Figure BDA0002685310300000032
所述交叉建模的表达式为:
Figure BDA0002685310300000033
Figure BDA0002685310300000034
表示所述图卷积模型输出的第j层用户嵌入向量的转置,
Figure BDA0002685310300000035
表示所述图卷积模型输出的第i层项目嵌入向量,
Figure BDA0002685310300000036
表示
Figure BDA0002685310300000037
Figure BDA0002685310300000038
的外积,j,k∈{0,1,…,L};所述交互体的表达式为:
Figure BDA0002685310300000039
Stack(·)表示堆砌函数。
根据本发明的实施例,至少具有以下有益效果:
本方法在特征交互层时,使用外积对用户多重嵌入向量组和项目多重嵌入向量组进行交叉建模,构建交互体,通过CNN网络模型对交互体进行学习,利用CNN网络提取交互体的多维度关系和深层次交互关联,从理论上提升预测结果的有效性,从而提升推荐精确度,最终提升用户体验。
本发明的第三方面,提供了一种基于图卷积协同过滤的推荐预测设备,包括:至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器;所述存储器存储有可被所述至少一个控制处理器执行的指令,所述指令被所述至少一个控制处理器执行,以使所述至少一个控制处理器能够执行如本发明第二方面所述的基于图卷积协同过滤的推荐预测方法。
本发明的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如本发明第二方面所述的基于图卷积协同过滤的推荐预测方法。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例提供的基于图卷积协同过滤的推荐预测系统的结构示意图;
图2为本发明实施例提供的ConvGCCF模型执行用户节点u1对项目节点i3的预测过程。
图3为本发明实施例提供的ConvGCCF模型生成多重嵌入向量的过程示意图。
图4为本发明实施例提供的基于图卷积协同过滤的推荐预测方法的流程示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
第一实施例;
参照图1,提供了一种基于图卷积协同过滤的推荐预测系统,系统包括:
输入层,用于提供用户输入向量集合和项目输入向量集合。需要注意的是,本实施例不细述原始用户和项目节点数据收集以及数据的向量化处理。
图卷积模型层,构建有图卷积模型,图卷积模型以用户输入向量集合和项目输入向量集合作为输入数据,输出经过L层传播后的用户多重嵌入向量组和项目多重嵌入向量组。
令图卷积模型经过L层传播后输出用户多重嵌入向量组为:
Figure BDA0002685310300000051
项目多重嵌入向量组为:
Figure BDA0002685310300000052
为了方便计算,除特别声明之外,全文设每层传播后生成的用户嵌入向量或者项目嵌入向量的尺寸均为d。
特征交互层,使用外积对用户多重嵌入向量组和项目多重嵌入向量组进行交叉建模,构建交互体,通过CNN网络模型对交互体进行学习,依据CNN网络模型的学习结果,得到用户节点对项目节点的第一预测结果。
交叉建模的表达式为:
Figure BDA0002685310300000053
式(1)中,
Figure BDA0002685310300000061
表示图卷积模型输出的第j层用户嵌入向量的转置,
Figure BDA0002685310300000062
表示图卷积模型输出的第i层项目嵌入向量,
Figure BDA0002685310300000063
表示
Figure BDA0002685310300000064
Figure BDA0002685310300000065
的外积,j,k∈{0,1,…,L};
交互体的表达式为:
Figure BDA0002685310300000066
式(2)中,Stack(·)表示堆砌函数,
Figure BDA0002685310300000067
作为CNN网络模型的输入数据。交互体融合了多重嵌入向量组所有维度交互的关联。
通过CNN网络模型的学习交互体的高阶关系可抽象表示为:
Figure BDA0002685310300000068
其中,
Figure BDA0002685310300000069
表示每一层卷积后生成的特征映射,表示CNN网络模型的隐藏层数,K(n)表示在第n个隐藏层的卷积核,b(n)表示第n个隐藏层的偏置项。
在本实施例中,使用外积得到多重嵌入向量所有维度之间的交互,结构化的交互信息可以利用卷积神经网络的学习能力去提取协同过滤交互的高阶关系,即利用CNN提取交互体的多维度关系和深层次交互关联。理论上,本实施例可以适用任何CNN网络模型的变体,例如可以使用常规的2D卷积网络模型,也可以使用3D卷积网络模型或者其它CNN网络模型的变体,除特别声明之外,本文所有实施例均以2D卷积网络模型学习交互体的高阶关系,如:
特征交互层进行外积计算之后,共计得到(L+1)2个二维交互结果,Stack为堆砌函数,将(L+1)2个交互映射组合成维度为(d×d×(L+1)2)的多通道交互体。
2D卷积网络模型的输入层定义为:
Figure BDA00026853103000000610
设置卷积核的尺寸为2×2,步长为2,卷积核滑动在边缘处不够一次运算的用0填充,其中,第n层特征映射的计算过程可在形式上表示为:
Figure BDA0002685310300000071
Figure BDA0002685310300000072
其中,K(n)表示在第n个隐藏层的卷积核,height,width表示特征映射平面的维度,depth表示是通道数,每层特征映射的通道数在数值上等于前一层卷积核的个数,b(n)表示第n个隐藏层的偏置项,表示ReLU激活函数。
在CNN网络模型对交互体进行学习之后,需要将CNN网络模型中经过n层卷积隐藏之后得到的中间向量v转换为标量值,CNN网络模型的学习过程结束,得到第一预测结果。需要说明的是,n层可以根据实际情况而设定。
Figure BDA0002685310300000073
其中,
Figure BDA0002685310300000074
表示第一预测结果,WMLP·v表示通过MLP将CNN网络模型输出的中间向量v转换为标量值,b表示偏置参数。
本系统能够得到用户节点对项目的第一预测结果,当在得到用户节点对每一个项目节点的预测值后,就对所有的预测值进行排序,由此生成的推荐列表,这里不细述推荐列表的构建。
本实施例的有益效果在于:
图卷积模型在经过传播之后,会得到用户多重嵌入向量组和项目多重嵌入向量组,每一层的嵌入向量来自路径不同的消息传播,代表待预测的用户节点和待预测的项目节点的不同潜在特征,不同层的潜在特征对节点偏好的贡献不同,层数越高,贡献程度可能会衰减。而根据现有方法推断偏好时,通常是采用内积和哈达玛积交互的做法来拼接多重嵌入向量,以内积作交互函数,只考虑对应维度上的关系,且嵌入向量每个维度的特征对推断结果的贡献权重完全一样,因此特征向量不同维度的潜在交互不能被充分提取。而本方法的特征交互层使用外积对用户多重嵌入向量组和项目多重嵌入向量组进行交叉建模,构建交互体,通过CNN网络模型对交互体进行学习,利用CNN网络提取交互体的多维度关系和深层次交互关联,从理论上提升预测结果的有效性,从而提升系统的推荐精确度,最终提升用户体验。
作为一种可选的实施例,特征交互层还用于:使用内积提取用户多重嵌入向量组与项目多重嵌入向量组之间的交互,得到用户节点对项目节点的第二预测结果;结合第一预测结果和第二预测结果,得到用户节点对项目节点的第三预测结果。
由于目前一直被沿用的轻量级内积交互在提取浅层次交互方面也有很好的表现,因此,在上述实施例的基础上,特征交互层还用于:使用内积提取用户多重嵌入向量组
Figure BDA0002685310300000081
与项目多重嵌入向量组
Figure BDA0002685310300000082
之间的浅层次的交互:
Figure BDA0002685310300000083
其中,
Figure BDA0002685310300000084
表示第二预测结果,<·,·>表示内积函数,||表示拼接。
结合第一预测结果和第二预测结果,得到用户节点对项目节点的第三预测结果:
Figure BDA0002685310300000085
需要说明的是,通过结合预测值
Figure BDA0002685310300000086
和预测值
Figure BDA0002685310300000087
得到的预测值
Figure BDA0002685310300000088
的预测效果会优于单独使用预测值
Figure BDA0002685310300000089
或预测值
Figure BDA00026853103000000810
中的任意一个的预测效果,此点为本领域技术人员的共同认知,此处不再细述。
在上述实施例的基础上,图卷积模型将每层传播生成的中间用户嵌入向量均与初始用户嵌入向量进行MLP特征提取得到图卷积模型输出的用户嵌入向量;图卷积模型将每层传播生成的中间项目嵌入向量均与初始项目嵌入向量进行MLP特征提取得到图卷积模型输出的项目嵌入向量。具体为:图卷积模型输出的第l层的用户嵌入向量表示为:
Figure BDA0002685310300000091
图卷积模型输出的第l层的项目嵌入向量表示为:
Figure BDA0002685310300000092
其中,
Figure BDA0002685310300000093
表示图卷积模型经过第l层传播后的中间用户嵌入向量,
Figure BDA0002685310300000094
表示初始用户嵌入向量,
Figure BDA0002685310300000095
为同一隐藏层共享的参数矩阵,
Figure BDA0002685310300000096
表示图卷积模型经过第l层传播后的中间项目嵌入向量,
Figure BDA0002685310300000097
表示初始项目嵌入向量,σ(·)表示ReLU激活函数,||表示拼接操作。
在本实施例中,图卷积模型的每层节点特征充分利用高阶嵌入向量与低阶嵌入向量的纵向交互,将每层传播后生成的中间嵌入向量均与图卷积模型的初始嵌入向量进行MLP操作,每一层的
Figure BDA0002685310300000098
不同,每层中间嵌入向量的MLP不同,不同层之间特征表示的差异性将会增大,能使高阶嵌入向量保持根节点的原始独特性,有利于增强节点的特征,缓解节点表示过于相似的问题。本设计也能够提升预测结果的有效性,提升系统的推荐精确度。
在前述实施例的基础上,中间用户嵌入向量
Figure BDA0002685310300000099
的表达式为:
Figure BDA00026853103000000910
中间项目嵌入向量
Figure BDA00026853103000000911
的表达式为:
Figure BDA00026853103000000912
其中,Nu表示用户节点的邻居数量,Ni表示项目节点的邻居数量。本实施例的生成的中间嵌入向量,相较于LightGCN模型加入了自身循环
Figure BDA0002685310300000101
Figure BDA0002685310300000102
相较于LR-GCCF模型去掉了转换矩阵,可以在后续图卷积计算和协同过滤计算中节省大量的存储和算力消耗。
第二实施例;
为了便于对第一实施例的理解,参照图2和图3,提供了一种基于图卷积协同过滤的推荐预测系统,这里称为ConvGCCF模型。图2演示了在ConvGCCF模型中,用户节点u1对项目节点i3的预测过程。
首先将用户-项目交互二部图定义为G=(V,A),V表示所有用户节点和项目节点的集合,A表示图的邻接矩阵。R={rui|u∈[0,M],i∈[0,N]}表示用户项目交互矩阵,将数据组做隐式反馈处理,即rui=1表示节点u和节点i之间有直接交互关系,否则rui=0。将二部图的低维特征矩阵定义为:
Figure BDA0002685310300000103
其中,E的尺寸为(M+N)×d,d是初始嵌入向量的维度,M,N分别代表用户和项目节点的数目,U代表用户嵌入向量矩阵,I代表项目嵌入向量矩阵。
ConvGCCF模型包括:
(1)输入层,提供用户嵌入向量和项目嵌入向量最原始的输入;
Figure BDA0002685310300000104
(2)图卷积模型层,用于生成经过L层传播后的融合局部特征的多重用户嵌入向量组
Figure BDA0002685310300000105
和多重项目嵌入向量组
Figure BDA0002685310300000106
在本实施例中,选择去掉中间用户嵌入向量和中间项目嵌入向量中的转换矩阵并加入自身循环,当在消息传播的第l步时,中间用户嵌入向量和中间项目嵌入向量分别为式(11)(12)所示。
图卷积模型将每层传播生成的中间嵌入向量均与初始嵌入向量进行MLP特征提取得到图卷积模型输出的嵌入向量,如:图卷积模型输出的第l层的用户嵌入向量和项目嵌入向量分别为式(9)(10)所示。将每层中间嵌入向量均与初始嵌入向量进行MLP操作,不同层之间特征表示的差异性将会增大,这样能使高阶嵌入向量保持根节点的原始独特性,有利于增强节点的特征,缓解节点表示过于相似的问题。
(3)特征交互层,对多重嵌入向量建模,分别使用CNN网络模型和内积提取深度与浅层次的特征交互关系,得到预测结果
Figure BDA0002685310300000111
Figure BDA0002685310300000112
结合
Figure BDA0002685310300000113
Figure BDA0002685310300000114
得到用户节点对项目节点的最终预测结果。其中,
Figure BDA0002685310300000115
Figure BDA0002685310300000116
的表达式分别为(6)、(7)和(8)所示。
通过ConvGCCF模型得到预测结果,然后可以对预测结果进行排序操作,最后根据排序结果进行推荐。这里,利用常见的梯度下降算法对ConvGCCF模型进行训练,用于更新ConvGCCF模型中的可变参数,使可变参数趋近收敛,以提高预测值的准确度。以下介绍梯度下降算法中的损失函数(目标函数)的构建:采用成对的BPR策略构建损失函数,以缓解数据稀疏的影响,模型损失函数的表示如下:
Figure BDA0002685310300000117
其中,
Figure BDA0002685310300000118
是指CNN网络模型输出结果的BPR损失函数,
Figure BDA0002685310300000119
是指内积结果的BPR损失函数,i+是指与用户u交互的正样本,i-是未与用户u交互的负样本,λ是L2正则化超参数,Θ={U,I,W1,W2,K,WMLP,b}表示可以学习的参数。
Figure BDA00026853103000001110
Figure BDA00026853103000001111
的计算表达式如下:
Figure BDA0002685310300000121
Figure BDA0002685310300000122
由于梯度下降算法为本领域技术人员的公知常识,此处不再细述。
本实施例的有益效果在于:
(1)用外积构建多重嵌入向量所有维度之间的交互,结构化的交互信息可以利用CNN神经网络的学习能力去提取协同过滤交互的高阶联系,即可利用CNN网络模型提取交互体的多维度关系和深层次交互关联,从理论上提升预测结果的有效性,提升模型的推荐精确度,最终提升用户体验。
(2)图卷积模型的每层的节点特征充分利用高阶嵌入向量与低阶嵌入向量的纵向交互,将每层传播后生成的中间嵌入向量均与图卷积模型的初始嵌入向量进行MLP操作,不同层之间特征表示的差异性将会增大。使高阶嵌入向量保持根节点的原始独特性,有利于增强节点的特征,缓解节点表示过于相似的问题,最终也能够提升预测结果的有效性,提升推荐模型的推荐精确度。
(3)图卷积模型的消息传播中,选择去掉中间用户嵌入向量或中间项目嵌入向量中的转换矩阵并加入自身循环,能够节省大量的存储和算力消耗。
以下提供ConvGCCF模型与现有推荐模型的实验数据对比:
(1)仿真数据设置;
为了统一仿真设置,便于程序的部署,将有相互交互的一组用户-项目对视为隐式反馈。
数据集为:Yelp和Movielens-1m真实数据集,Movielens-1m这个数据集包含了多个用户对多个电影项目的评分,这里选择包含6014个用户,3705个电影项目,在训练集中总共有179207个交互,稀疏度大约为1.0%。Yelp这个数据集涵盖了商户信息、用户信息、用户点评等等,这里选择包含25676个用户,25814个项目,训练集共有705113个交互,稀疏度大约为0.1%;
现有模型为:BPR、NeuMF、SECNCF、LR-GCCF以及LightGCN模型。其中,BPR模型对MF模型使用BPR优化准则,其优点是直接针对样本的排序进行优化,MF模型是协同过滤最经典的算法,MF模型是基于用户与项目的稀疏交互矩阵,低维用户矩阵与低维项目矩阵作矩阵乘法去拟合交互矩阵,做到矩阵补全;NeuMF模型提出了使用MLP去提取用户项目之间交互;SECNCF模型将用户和项目的嵌入向量堆叠起来,具有更好的扩展性。
(2)仿真参数设置;
使用tensorflow框架执行仿真。在初始设置中,Yelp的初始嵌入向量维度被设置为64,Movielens的初始嵌入向量维度被设置为24,图卷积模型的传播深度L设为3,卷积神经网络的层数为6,每层有32个卷积核,卷积核的尺寸为2×2,步长为2。卷积类型为“SAME”。对每个用户,从训练集中随机抽取一个当作验证集,用来调优超参数。保留1个正样本,来测试性能。L2正则化的系数在{0.0001,0.0005,0.001,0.005,0.01,0.05}范围内寻找,学习率设置为的选取范围在{0.0001,0.001,0.01}中,图卷积过程中的消息dropout和节点dropout在0.2附近寻找最优值,在测试集上被设为0。
(3)性能指标设置;
对测试集中的每个用户,取999个负样本,与1个正样本生成测试组,推断出该用户对1000个项目的评分,从高到低排序。评估top-K推荐性能采用常用的Hit Ratio(HR)和Normalized Discounted Cumulative Gain(NDCG)。HR@K是一种衡量召回率的指标。NDCG@K是衡量前K个序列中,正样本的排位状况,正样本排位越前,NDCG值越高,证明推荐效果越好。这里设定K=20。
Figure BDA0002685310300000141
表1
由表1可知,ConvGCCF模型在2个数据集上,HR和NDCG2个性能指标都能达到最优。证明了相较于现有推荐模型,ConvGCCF模型能够提升推荐精确度。
第三实施例;
参照图4,提供了一种基于图卷积协同过滤的推荐预测方法,包括以下步骤:
S100、构建图卷积模型;
S200、将用户输入向量集合和项目输入向量集合输入至图卷积模型,得到图卷积模型输出的经过L层传播后的用户多重嵌入向量组和项目多重嵌入向量组;
S300、使用外积对用户多重嵌入向量组和项目多重嵌入向量组进行交叉建模,构建交互体,通过CNN网络模型对交互体进行学习,依据CNN网络模型的学习结果,得到用户节点对项目节点的第一预测结果;
S400、使用内积提取用户多重嵌入向量组与项目多重嵌入向量组之间的交互,得到用户节点对项目节点的第二预测结果;
S500、结合第一预测结果和第二预测结果,得到用户节点对项目节点的第三预测结果。
需要说明的是,由于本方法实施例与上述的系统实施例是基于相同的发明构思,因此,系统实施例中的相应内容同样适用于本方法实施例,此处不再详述。
第四实施例;
提供了一种基于图卷积协同过滤的推荐预测设备,该设备可以是任意类型的智能终端,例如手机、平板电脑、个人计算机等。具体地,该设备包括:一个或多个控制处理器和存储器,这里以一个控制处理器为例。控制处理器和存储器可以通过总线或者其他方式连接,这里以通过总线连接为例。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态性计算机可执行程序以及模块,如本发明实施例中的基于图卷积协同过滤的推荐预测设备对应的程序指令/模块。控制处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行基于图卷积协同过滤的推荐预测系统的各种功能应用以及数据处理,即实现上述方法实施例的基于图卷积协同过滤的推荐预测方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据基于图卷积协同过滤的推荐预测系统的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于控制处理器远程设置的存储器,这些远程存储器可以通过网络连接至该基于图卷积协同过滤的推荐预测设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器中,当被所述一个或者多个控制处理器执行时,执行上述方法实施例中的基于图卷积协同过滤的推荐预测方法。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个控制处理器执行。
通过以上的实施方式的描述,本领域技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现。本领域技术人员可以理解实现上述实施例方法中的全部或部分流程是可以通过计算机程序来指令相关的硬件来完成的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

Claims (5)

1.一种基于图卷积协同过滤的推荐预测系统,其特征在于,所述系统包括:
输入层,用于提供用户输入向量集合和项目输入向量集合;
图卷积模型层,构建图卷积模型,所述图卷积模型以所述用户输入向量集合和所述项目输入向量集合作为输入数据,输出经过L层传播后的用户多重嵌入向量组和项目多重嵌入向量组;所述图卷积模型将每层传播生成的中间用户嵌入向量均与初始用户嵌入向量进行MLP特征提取得到所述图卷积模型输出的用户嵌入向量;所述图卷积模型将每层传播生成的中间项目嵌入向量均与初始项目嵌入向量进行MLP特征提取得到所述图卷积模型输出的项目嵌入向量;
特征交互层,使用外积对所述用户多重嵌入向量组和所述项目多重嵌入向量组进行交叉建模,构建交互体,通过CNN网络模型对所述交互体进行学习,依据所述CNN网络模型的学习结果,得到用户节点对项目节点的第一预测结果;其中,令所述用户多重嵌入向量组为:
Figure FDA0003477182060000011
所述项目多重嵌入向量组为:
Figure FDA0003477182060000012
所述交叉建模的表达式为:
Figure FDA0003477182060000013
Figure FDA0003477182060000014
表示所述图卷积模型输出的第j层用户嵌入向量的转置,
Figure FDA0003477182060000015
表示所述图卷积模型输出的第i层项目嵌入向量,
Figure FDA0003477182060000016
表示
Figure FDA0003477182060000017
Figure FDA0003477182060000018
的外积,j,k∈{0,1,…,L};所述交互体的表达式为:
Figure FDA0003477182060000019
Stack(·)表示堆砌函数;
所述特征交互层还用于:使用内积提取所述用户多重嵌入向量组与所述项目多重嵌入向量组之间的交互,得到所述用户节点对所述项目节点的第二预测结果,结合所述第一预测结果和所述第二预测结果,得到所述用户节点对所述项目节点的第三预测结果;所述第二预测结果表示为:
Figure FDA00034771820600000110
Figure FDA00034771820600000111
其中,
Figure FDA00034771820600000112
表示第二预测结果,<·,·>表示内积函数,||表示拼接;
所述图卷积模型输出的第l层的用户嵌入向量表示为:
Figure FDA0003477182060000021
Figure FDA0003477182060000022
所述图卷积模型输出的第l层的项目嵌入向量表示为:
Figure FDA0003477182060000023
其中,
Figure FDA0003477182060000024
表示所述图卷积模型经过第l层传播后的中间用户嵌入向量,
Figure FDA0003477182060000025
表示初始用户嵌入向量,W1 (l),2 (l)为同一隐藏层共享的参数矩阵,
Figure FDA0003477182060000026
表示所述图卷积模型经过第l层传播后的中间项目嵌入向量,
Figure FDA0003477182060000027
表示初始项目嵌入向量,σ(·)表示ReLU激活函数;所述
Figure FDA0003477182060000028
的表达式为:
Figure FDA0003477182060000029
所述
Figure FDA00034771820600000210
的表达式为:
Figure FDA00034771820600000211
Figure FDA00034771820600000212
其中,Nu表示所述用户节点的邻居数量,Ni表示所述项目节点的邻居数量。
2.根据权利要求1所述的基于图卷积协同过滤的推荐预测系统,其特征在于,所述通过CNN网络模型对所述交互体进行学习,具体为:通过2D卷积网络模型对所述交互体进行学习。
3.一种基于图卷积协同过滤的推荐预测方法,其特征在于,包括以下步骤:
构建图卷积模型;
将用户输入向量集合和项目输入向量集合输入至所述图卷积模型,得到所述图卷积模型输出的经过L层传播后的用户多重嵌入向量组和项目多重嵌入向量组;所述图卷积模型将每层传播生成的中间用户嵌入向量均与初始用户嵌入向量进行MLP特征提取得到所述图卷积模型输出的用户嵌入向量;所述图卷积模型将每层传播生成的中间项目嵌入向量均与初始项目嵌入向量进行MLP特征提取得到所述图卷积模型输出的项目嵌入向量;
使用外积对所述用户多重嵌入向量组和所述项目多重嵌入向量组进行交叉建模,构建交互体,通过CNN网络模型对所述交互体进行学习,依据所述CNN网络模型的学习结果,得到用户节点对项目节点的第一预测结果;其中,令所述用户多重嵌入向量组为:
Figure FDA0003477182060000031
所述项目多重嵌入向量组为:
Figure FDA0003477182060000032
所述交叉建模的表达式为:
Figure FDA0003477182060000033
Figure FDA0003477182060000034
表示所述图卷积模型输出的第j层用户嵌入向量的转置,
Figure FDA0003477182060000035
表示所述图卷积模型输出的第i层项目嵌入向量,
Figure FDA0003477182060000036
表示
Figure FDA0003477182060000037
Figure FDA0003477182060000038
的外积,j,k∈{0,1,…,L};所述交互体的表达式为:
Figure FDA0003477182060000039
Stack(·)表示堆砌函数;
使用内积提取所述用户多重嵌入向量组与所述项目多重嵌入向量组之间的交互,得到所述用户节点对所述项目节点的第二预测结果,结合所述第一预测结果和所述第二预测结果,得到所述用户节点对所述项目节点的第三预测结果;所述第二预测结果表示为:
Figure FDA00034771820600000310
其中,
Figure FDA00034771820600000311
表示第二预测结果,<·,·>表示内积函数,||表示拼接;
所述图卷积模型输出的第l层的用户嵌入向量表示为:
Figure FDA00034771820600000312
Figure FDA00034771820600000313
所述图卷积模型输出的第l层的项目嵌入向量表示为:
Figure FDA00034771820600000314
其中,
Figure FDA00034771820600000315
表示所述图卷积模型经过第l层传播后的中间用户嵌入向量,
Figure FDA00034771820600000316
表示初始用户嵌入向量,W1 (l),W2 (l)为同一隐藏层共享的参数矩阵,
Figure FDA00034771820600000317
表示所述图卷积模型经过第l层传播后的中间项目嵌入向量,
Figure FDA00034771820600000318
表示初始项目嵌入向量,σ(·)表示ReLU激活函数;所述
Figure FDA00034771820600000319
的表达式为:
Figure FDA00034771820600000320
所述
Figure FDA00034771820600000321
的表达式为:
Figure FDA00034771820600000322
Figure FDA00034771820600000323
其中,Nu表示所述用户节点的邻居数量,Ni表示所述项目节点的邻居数量。
4.一种基于图卷积协同过滤的推荐预测设备,其特征在于,包括:至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器;所述存储器存储有可被所述至少一个控制处理器执行的指令,所述指令被所述至少一个控制处理器执行,以使所述至少一个控制处理器能够执行如权利要求3所述的基于图卷积协同过滤的推荐预测方法。
5.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求3所述的基于图卷积协同过滤的推荐预测方法。
CN202010974559.XA 2020-09-16 2020-09-16 基于图卷积协同过滤的推荐预测系统以及推荐预测方法 Active CN112115378B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010974559.XA CN112115378B (zh) 2020-09-16 2020-09-16 基于图卷积协同过滤的推荐预测系统以及推荐预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010974559.XA CN112115378B (zh) 2020-09-16 2020-09-16 基于图卷积协同过滤的推荐预测系统以及推荐预测方法

Publications (2)

Publication Number Publication Date
CN112115378A CN112115378A (zh) 2020-12-22
CN112115378B true CN112115378B (zh) 2022-04-19

Family

ID=73803122

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010974559.XA Active CN112115378B (zh) 2020-09-16 2020-09-16 基于图卷积协同过滤的推荐预测系统以及推荐预测方法

Country Status (1)

Country Link
CN (1) CN112115378B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112905906B (zh) * 2021-01-25 2022-07-15 浙江大学 一种融合局部协同与特征交叉的推荐方法及系统
CN112884045B (zh) * 2021-02-25 2022-12-20 河北工业大学 基于多视角的随机删边嵌入模型的分类方法
CN112905900B (zh) * 2021-04-02 2023-11-17 辽宁工程技术大学 基于图卷积注意力机制的协同过滤推荐方法
CN113688974B (zh) * 2021-07-28 2023-10-24 湖南科技大学 一种基于轻量化图卷积网络的移动应用推荐方法
CN113744023B (zh) * 2021-08-20 2023-09-29 太原理工大学 一种基于图卷积网络的双通道协同过滤推荐方法
CN113918834B (zh) * 2021-10-22 2022-10-28 重庆理工大学 融合社交关系的图卷积协同过滤推荐方法
CN114662009B (zh) * 2021-12-13 2022-11-18 菏泽汇豪纺织有限公司 一种基于图卷积的工业互联网工厂协同推荐方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110362753A (zh) * 2019-04-10 2019-10-22 深思考人工智能机器人科技(北京)有限公司 一种基于用户隐式反馈的个性化神经网络推荐方法及系统
CN110648163A (zh) * 2019-08-08 2020-01-03 中山大学 一种基于用户评论的推荐算法
CN110765363A (zh) * 2019-09-27 2020-02-07 复旦大学 一种基于高斯分布表示的深度推荐模型
CN111143702A (zh) * 2019-12-16 2020-05-12 中国科学技术大学 基于图卷积神经网络的信息推荐方法、系统、设备和介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11100400B2 (en) * 2018-02-15 2021-08-24 Adobe Inc. Generating visually-aware item recommendations using a personalized preference ranking network
CN109635917B (zh) * 2018-10-17 2020-08-25 北京大学 一种多智能体合作决策及训练方法
US11373233B2 (en) * 2019-02-01 2022-06-28 Target Brands, Inc. Item recommendations using convolutions on weighted graphs
CN111523051A (zh) * 2020-04-24 2020-08-11 山东师范大学 基于图卷积矩阵分解的社交兴趣推荐方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110362753A (zh) * 2019-04-10 2019-10-22 深思考人工智能机器人科技(北京)有限公司 一种基于用户隐式反馈的个性化神经网络推荐方法及系统
CN110648163A (zh) * 2019-08-08 2020-01-03 中山大学 一种基于用户评论的推荐算法
CN110765363A (zh) * 2019-09-27 2020-02-07 复旦大学 一种基于高斯分布表示的深度推荐模型
CN111143702A (zh) * 2019-12-16 2020-05-12 中国科学技术大学 基于图卷积神经网络的信息推荐方法、系统、设备和介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"LightGCN: Simplifying and Powering Graph Convolution Network for Recommendation";Xiangnan He等;《Proceedings of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval》;20200725;第639-648页 *
"基于深度学习的协同过滤算法的研究";刘晶;《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》;20190815;第15-38页 *

Also Published As

Publication number Publication date
CN112115378A (zh) 2020-12-22

Similar Documents

Publication Publication Date Title
CN112115378B (zh) 基于图卷积协同过滤的推荐预测系统以及推荐预测方法
CN111428147B (zh) 结合社交和兴趣信息的异源图卷积网络的社交推荐方法
US11010658B2 (en) System and method for learning the structure of deep convolutional neural networks
CN107563841B (zh) 一种基于用户评分分解的推荐系统
CN112905900A (zh) 基于图卷积注意力机制的协同过滤推荐算法
JP2020523699A (ja) 関心点コピーの生成
WO2023065859A1 (zh) 物品推荐方法、装置及存储介质
CN108595533B (zh) 一种基于协同过滤的物品推荐方法、存储介质及服务器
CN112364242B (zh) 针对上下文感知型的图卷积推荐系统
Goswami et al. Filter-based feature selection methods using hill climbing approach
CN115905691A (zh) 一种基于深度强化学习的偏好感知推荐方法
CN115995293A (zh) 一种环状rna和疾病关联预测方法
CN115618098A (zh) 基于知识增强与空洞卷积的冷链物流推荐方法及装置
CN117216281A (zh) 一种基于知识图谱的用户兴趣扩散推荐方法及系统
Czajkowski et al. Steering the interpretability of decision trees using lasso regression-an evolutionary perspective
CN112364236A (zh) 目标对象推荐系统、方法、装置、数据处理方法及装置
CN113590976A (zh) 一种空间自适应图卷积网络的推荐方法
CN117390267A (zh) 基于知识图谱的个性化多任务增强推荐模型
Templier et al. A geometric encoding for neural network evolution
CN116226547A (zh) 基于流式数据的增量图推荐方法
CN108256077B (zh) 一种面向中国移动智能客服的动态扩展知识图推理方法
CN115545833A (zh) 一种基于用户社交信息的推荐方法及系统
Kupka et al. Regression analysis based on linguistic associations and perception-based logical deduction
CN113744023B (zh) 一种基于图卷积网络的双通道协同过滤推荐方法
CN115905704A (zh) 一种融合偏好传播的多任务推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant