CN113672811B - 一种基于拓扑信息嵌入的超图卷积协同过滤推荐方法、系统及计算机可读存储介质 - Google Patents

一种基于拓扑信息嵌入的超图卷积协同过滤推荐方法、系统及计算机可读存储介质 Download PDF

Info

Publication number
CN113672811B
CN113672811B CN202110973781.2A CN202110973781A CN113672811B CN 113672811 B CN113672811 B CN 113672811B CN 202110973781 A CN202110973781 A CN 202110973781A CN 113672811 B CN113672811 B CN 113672811B
Authority
CN
China
Prior art keywords
user
project
hypergraph
matrix
topological
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110973781.2A
Other languages
English (en)
Other versions
CN113672811A (zh
Inventor
林泽锐
罗玉
凌捷
柳毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN202110973781.2A priority Critical patent/CN113672811B/zh
Publication of CN113672811A publication Critical patent/CN113672811A/zh
Application granted granted Critical
Publication of CN113672811B publication Critical patent/CN113672811B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Abstract

本发明公开的一种基于拓扑信息嵌入的超图卷积协同过滤推荐方法、系统及计算机可读存储介质,方法包括:获取用户与项目交互数据,并构造用户‑项目交互二部图;构建用户与项目的初始嵌入查找表,利用聚类算法进行子图划分;对聚类子图进行编码,得到位置拓扑编码;定义关联规则表,利用关联规则表分别得到用户和项目超边组,整合所述超边组生成超图,并获得超图关联矩阵;通过超图卷积操作分别学习用户与项目的高阶邻域复杂相关性,将超图卷积的输出与位置拓扑编码进行结合,并通进行信息融合得到嵌入向量;将嵌入向量进行内积处理得到用户与项目之间的关联分数,并根据关联分数为用户推荐可能感兴趣的项目。本发明提高了推荐精度和模型的可行性。

Description

一种基于拓扑信息嵌入的超图卷积协同过滤推荐方法、系统及计算机可读存储介质
技术领域
本发明涉及人工智能技术领域,更具体的,涉及一种基于拓扑信息嵌入的超图卷积协同过滤推荐方法、系统及计算机可读存储介质。
背景技术
在信息爆炸的时代,用户每天都会产生大量的行为数据。面对如此巨量的信息时,用户很难分析和选择有用的信息,即信息过载已成为了信息量不断膨胀主要负面影响之一。
推荐系统作为处理信息过载的主要技术手段,能够过滤庞大的数据量,寻找有用的、高质量的信息,从而对用户行为做出合理预测。协同过滤是推荐系统中最常见的方法,它根据用户已有的交互行为,为每个用户寻找具有相似兴趣的用户来完成推荐任务。早期的推荐模型直接使用用户和项目的ID作为嵌入向量,导致所学习的嵌入表达具有局限性。
近年来,图卷积神经网络被证明了是一项在推荐领域非常强大的技术,用户的历史交互行为被用来构建成一个用户-项目二部图,图卷积神经网络协同过滤通过捕捉用户-项目关系非线性的高阶交互关系以学习有效的用户、项目嵌入,提升了模型的表达能力。然而,当前基于图卷积神经网络的协同过滤模型仍存在缺陷:首先,图神经网络模型的处理是将原始交互图进行树状展开,导致交互图的位置拓扑结构信息没有编码进嵌入表达中。其次,用户和项目建模不灵活,用户和物品不存在区别。此外,实体之间的高阶相关性建模也存在不足,用户-物品的高阶相关性对建模是很有帮助的。
现有技术中协同过滤模型嵌入表达不全面,用户与项目建模不灵活,没有考虑用户-物品的高阶相关性,因此亟需一种基于拓扑信息嵌入的超图卷积协同过滤推荐方法。
发明内容
鉴于上述问题,本发明的目的是提供一种基于拓扑信息嵌入的超图卷积协同过滤推荐方法、系统及计算机可读存储介质,提高推荐精度和模型的可行性。
本发明第一方面提供了一种基于拓扑信息嵌入的超图卷积协同过滤推荐方法,包括以下步骤:
获取用户与项目交互数据,并构造用户-项目交互二部图;
构建用户与项目的初始嵌入查找表,利用聚类算法将用户-项目交互二部图进行子图划分,得到c个不连通的聚类子图;
使用矩阵分解来对聚类子图进行编码,得到位置拓扑编码;
定义关联规则表,利用关联规则表分别得到用户的和项目的超边组,整合所述超边组生成超图,并获得超图关联矩阵;
通过超图卷积操作分别学习用户与项目的高阶邻域复杂相关性,将超图卷积的输出与位置拓扑编码进行结合,并通过可学习的前馈神经网络来进行信息融合,得到嵌入向量;
将嵌入向量进行内积处理得到用户与项目之间的关联分数,并根据关联分数为用户推荐可能感兴趣的项目。
本方案中,所述获取用户与项目交互数据,并构造用户-项目交互二部图,具体为:
从开源的数据集中获取用户与项目交互数据,所述用户与项目交互数据为欧氏空间数据,将欧氏空间数据构造为非欧氏空间数据即得到用户-项目交互二部图。
本方案中,对于开源数据集中每个可以观察到的用户项目交互视为正样本,对用户没有交互过的项目执行负采样策略,与正样本进行配对。
本方案中,构建用户与项目的初始嵌入查找表,利用聚类算法将用户-项目交互二部图进行子图划分,得到c个不连通的聚类子图具体过程为:
构建用户与项目的初始嵌入查找表分别为:
Figure GDA0004090691550000021
Figure GDA0004090691550000022
其中N,M分别为用户的数量和项目的数量,
Figure GDA0004090691550000023
表示第N个用户的向量表示,
Figure GDA0004090691550000024
表示第M个项目的向量表示,用户与项目之间的交互构成了交互矩阵,记为H∈{0,1}N×M
使用METIS聚类算法对用户-项目交互二部图进行划分,对划分结果随机采样并充足得到c个不连通的子图,分割结果表示为:
Figure GDA0004090691550000025
其中,Gc表示分割得到的第c个聚类子图。
本方案中,使用矩阵分解来对聚类子图进行编码,获取位置拓扑编码具体为:
使用矩阵分解对聚类子图中的节点进行编码,通过梯度下降来获得用户位置拓扑编码矩阵P∈RN×K和项目位置拓扑编码矩阵Q∈RM×K
本方案中,所述定义关联规则表,利用关联规则表分别得到用户和项目超边组,整合所述超边组生成超图,并获得超边关联矩阵,具体过程为:
定义关联规则表{r1,…,rk},rk表示第k种规则;
利用关联规则表得到k个用户超边组和k个项目超边组;
整合用户超边组和项目超边组生成超图,并获得超图关联矩阵。
本方案中,通过超图卷积操作分别学习用户与项目的高阶邻域复杂相关性,将超图卷积的输出与位置拓扑编码进行结合,并通过可学习的前馈神经网络来进行信息融合,得到嵌入向量,具体步骤为:
将超图关联矩阵和用户-项目嵌入通过超图卷积操作分别学习高阶邻域复杂相关性并得到超图卷积输出;
将超图卷积的输出与位置拓扑编码进行结合,并通过可学习的1层前馈神经网络来进行信息融合,得到嵌入向量。
本发明第二方面提供了一种基于拓扑信息嵌入的超图卷积协同过滤推荐系统,包括存储器和处理器,所述存储器中包括基于拓扑信息嵌入的超图卷积协同过滤推荐方法程序,所述基于拓扑信息嵌入的超图卷积协同过滤推荐方法程序被所述处理器执行时实现如下步骤:
获取用户与项目交互数据,并构造用户-项目交互二部图;
构建用户与项目的初始嵌入查找表,利用聚类算法将用户-项目交互二部图进行子图划分,得到c个不连通的聚类子图;
使用矩阵分解来对聚类子图进行编码,得到位置拓扑编码;
定义关联规则表,利用关联规则表分别得到用户的和项目的超边组,整合所述超边组生成超图,并获得超图关联矩阵;
通过超图卷积操作分别学习用户与项目的高阶邻域复杂相关性,将超图卷积的输出与位置拓扑编码进行结合,并通过可学习的前馈神经网络来进行信息融合,得到嵌入向量;
将嵌入向量进行内积处理得到用户与项目之间的关联分数,并根据关联分数为用户推荐可能感兴趣的项目。
本方案中,所述获取用户与项目交互数据,并构造用户-项目交互二部图,具体为:
从开源的数据集中获取用户与项目交互数据,所述用户与项目交互数据为欧氏空间数据,将欧氏空间数据构造为非欧氏空间数据即得到用户-项目交互二部图。
本发明第三方面公开了一种计算机可读存储介质,所述计算机可读存储介质中包括基于拓扑信息嵌入的超图卷积协同过滤推荐方法程序,所述基于拓扑信息嵌入的超图卷积协同过滤推荐方法程序被处理器执行时,实现如上所述的一种基于拓扑信息嵌入的超图卷积协同过滤推荐方法的步骤。
本发明公开的一种基于拓扑信息嵌入的超图卷积协同过滤推荐方法和系统及计算机可读存储介质,所述方法至少有以下有益效果:
(1)本发明考虑在用户-项目交互二部图中来学习嵌入表示,在模型嵌入层考虑到用户与项目之间的交互信息,通过嵌入传播在用户项目交互图上建模高阶连通性,使得模型学习到高维特征信息,获得更有效的嵌入。
(2)本发明采用分治的策略,使用超图卷积网络来分别学习用户、项目的嵌入表示,将用户和项目整合在一起,但又保持了各自的属性,有效挖掘用户-项目交互图的局部和全局特征信息。
(3)本发明将原始二部图的拓扑位置信息有效地编码进用户项目的嵌入中,提升了协同过滤嵌入表示的质量。
(4)本发明使用内积作为最后得到的用户嵌入和项目嵌入的交互函数,来得到用户项目间的关联分数,简化了模型的时间和空间复杂度,提高模型的推荐性能。
附图说明
图1示出了本申请一种基于拓扑信息嵌入的超图卷积协同过滤推荐方法流程图。
图2示出了本申请用户-项目交互二部图构造示意图。
图3示出了本申请嵌入层用户项目高阶连接性交互图。
图4示出了本申请一种基于共稀疏解析模型的多对比度MRI图像重建系统框图。
图5示出了本申请一种基于超图卷积的多阶段协同过滤推荐方法的模型架构图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
图1示出了本申请一种基于拓扑信息嵌入的超图卷积协同过滤推荐方法流程图。
如图1所示,本申请第一方面提供了一种基于拓扑信息嵌入的超图卷积协同过滤推荐方法,包括以下步骤:
S102,获取用户与项目交互数据,并构造用户-项目交互二部图;
根据本发明实施例,所述获取用户与项目交互数据,并构造用户-项目交互二部图,具体为:
从开源的数据集中获取用户与项目交互数据,所述用户与项目交互数据为欧氏空间数据,将欧氏空间数据构造为非欧氏空间数据即得到用户-项目交互二部图。
需要说明的是,在一个具体实施例中,所述数据集可以采用Amazon-book数据集,该数据集是一个被广泛使用的产品推荐数据集,本实施例从Amazon-book数据集中选择亚马逊图书销售数据,并使用10核设置确保每个用户核项目至少有10次交互。数据集统计结果如下表1所示:
表1数据集统计结果表
数据集 用户 项目 交互记录 稀疏性
Amazon-book 52643 91599 2984108 0.00062
如图2所示,将采集到的欧氏空间数据构造为非欧氏空间数据,即将获取的用户与项目交互数据构造为用户-项目交互二部图G。将处理好的数据集随机选取每个用户80%的历史交互作为训练集,其余作为测试集,用于评估模型的泛化能力。从训练集中,随机选择10%的交互作为验证集来调整超参数。对于数据集中每一个可以观察到的用户项目交互视为正样本,对用户没有交互过的项目执行负采样策略,与正样本进行配对。
S104,构建用户与项目的初始嵌入查找表,利用聚类算法将用户-项目交互二部图进行子图划分,得到c个不连通的聚类子图;
S104的具体过程为:
构建用户与项目的初始嵌入查找表分别为:
Figure GDA0004090691550000061
其中N,M分别为用户的数量和项目的数量,
Figure GDA0004090691550000062
表示第N个用户的向量表示,
Figure GDA0004090691550000063
表示第M个项目的向量表示,用户与项目之间的交互构成了交互矩阵,记为H∈{0,1}N×M
使用METIS聚类算法对用户-项目交互二部图进行划分,对划分结果随机采样并充足得到c个不连通的子图,分割结果表示为:
Figure GDA0004090691550000064
其中,Gc表示分割得到的第c个聚类子图。
需要说明的是,如图3所示,在获取了用户-项目交互二部图后需要利用用户-项目交互二部图的拓扑结构对用户-项目的高阶连接信息进行建模,其中模型的嵌入层包括用户ID嵌入和项目ID嵌入两部分,因此分别构建用户与项目的初始嵌入查找表
Figure GDA0004090691550000065
其中N,M分别为用户的数量和项目的数量,用户与项目之间的交互构成了交互矩阵,记为H∈{0,1}N×M
此外,在本发明中对用户-项目交互二部图的分割可以使用METIS聚类算法,METIS是由Karypis Lab开发的一个具有强大功能的图切分软件包,旨在图中的顶点上构建分区,使簇内连接远大于簇间连接,从而更好地捕获聚类和社区结构。使用METIS算法将原始二部图分成c个不连通的子图,使得丢失的边数最少。原始图G的分割结果为
Figure GDA0004090691550000066
同时节点集合V也被分成了c个部分:{V1,V2,…,Vc}。那么在第k个子图中的用户节点集合可表示为Vuk=Vu∩Vk,商品节点集合可示为Vik=Vi∩Vk。由于协同过滤标准数据集缺少节点的属性信息,使用METIS聚类算法,将图的结构信息也用来参与聚类,可以使具有相似性质的节点处于同一子图,捕捉到先前基于图卷积网络的协同过滤工作中所忽略的位置拓扑信息。
S106,使用矩阵分解来对聚类子图进行编码,得到位置拓扑编码;具体步骤为:
使用矩阵分解对聚类子图中的节点进行编码,通过梯度下降来获得用户位置拓扑编码矩阵P∈RN×K和项目位置拓扑编码矩阵Q∈RM×K
需要说明的是,通过聚类获得c个互不连通的聚类子图,节点的拓扑位置编码来自于聚类得到的分割结果。由于各个子图之间彼此不连通,在整图上进行训练时各个子图中不存在信息传递,故可以在c个聚类子图上进行并行训练,以此来提高训练效率。由于本发明对这张聚类图进行学习的目的是获取用户和商品所在的聚类簇中的购买偏向,故使用和原始图相同的初始化向量来进行训练。本发明选择使用矩阵分解获取聚类图中的节点表示。
更具体的,通过构建子图的邻接矩阵AN×M和预测评分矩阵
Figure GDA0004090691550000076
之间的误差函数来学习用户位置拓扑编码矩阵P和项目位置拓扑编码矩阵Q,因此用户i和商品j的拓扑位置编码pi和qj之间的误差被定义为:
Figure GDA0004090691550000071
公式中pik代表用户i的位置编码表示pi的第k位数字,同理qjk则代表项目j的位置编码qj的第k位数字。
下面使用梯度下降算法来求解上述平方差损失函数,首先求解损失函数的梯度:
Figure GDA0004090691550000072
Figure GDA0004090691550000073
接着沿梯度的负方向来更新变量:
Figure GDA0004090691550000074
Figure GDA0004090691550000075
其中,α为梯度下降法中的学习率,作用是控制参数的更新速率。
通过上述的两个步骤来进行迭代优化,直到算法收敛。至此,获得了用户和项目的拓扑位置编码矩阵P∈RN×K,Q∈RM×K。本发明中学习的位置编码是可以突出其聚类位置的特征信息,同时位置编码是为了修正在原始二部图的图卷积模型中所损失的位置信息,因此位置信息相对于交互结果信息来说,应处于一个次要位置,故在此将嵌入编码维度大小设置为原始图编码维度的一半。
S108,定义关联规则表,利用关联规则表分别得到用户和项目超边组,整合所述超边组生成超图,并获得超图关联矩阵;
步骤S108的具体过程为:
定义关联规则表{r1,…,rk},rk表示第k种规则;
利用关联规则表得到k个用户超边组和k个项目超边组;
整合用户超边组和项目超边组生成超图,并获得超图关联矩阵。
需要说明的是,根据高阶连通性,从自定义关联规则列表{r1,…,rk}可以分别得到k个超边组
Figure GDA0004090691550000085
。除了观察到的交互外,根据不同的关联规则,可以从不同的视角来描述原始数据,而通过构建超边组能使这种关联规则捕获到高阶信息。
更具体的,可以定义项目的k阶可达邻居,在用户-项目的交互矩阵中,如果存在一系列相邻节点在项目i和项目j中,并且路径上的用户数量小于k,那么就称项目i是项目j的k阶邻居。
项目的k阶可达用户则定义为在用户-项目中,如果用户j和项目k存在直接交互并且项目k是项目i的k阶可达邻居,则用户j是项目i的k阶可达邻居。
因此对于项目i,他的k阶可达矩阵可以表示为:
Figure GDA0004090691550000081
其中H是用户-项目二部图交互矩阵。
由用户间k阶可达规则构造而成的超边组关联矩阵则被定义为:
Figure GDA0004090691550000082
通过k阶可达规则得到一个超图,通过合并操作来生成在用户上的超图关联矩阵Hu
Figure GDA0004090691550000083
同理,还可以获得用户的k阶可达矩阵表示为:
Figure GDA0004090691550000084
由项目间的k阶可达规则构造成的超边组关联矩阵定义为:
Figure GDA0004090691550000091
在项目上的超图关联矩阵表示为:
Figure GDA0004090691550000092
在这里,对于每个用户和项目,可以使用到一阶邻居和二阶邻居,即依次令k=1和k=2,来让这两个高阶关联进行拼接,构造用户和项目超图,其关联矩阵分别表示为:
Figure GDA0004090691550000093
Figure GDA0004090691550000094
超图构造的超图关联矩阵表示为:
Hu=H||(H(HTH))
Hi=HT||(HT(HHT))
S110,通过超图卷积操作分别学习用户与项目的高阶邻域复杂相关性,将超图卷积的输出与位置拓扑编码进行结合,并通过可学习的前馈神经网络来进行信息融合,得到嵌入向量;
步骤S110的具体过程为:
将超图关联矩阵和用户-项目嵌入通过超图卷积操作分别学习高阶邻域复杂相关性并得到超图卷积输出;
将超图卷积的输出与位置拓扑编码进行结合,并通过可学习的1层前馈神经网络来进行信息融合,得到嵌入向量。
需要说明的是,如图4所示,将获得的两个超图关联矩阵Hu,Hi结合用户的嵌入表示Eu和项目的嵌入表示Ei,然后对高阶信息传递和联合信息更新进行详细定义:
对于高阶信息传递,受HGNN模型的启发,本发明采用超图卷积来学习高阶邻域的复杂相关性。HGNNConv表示为:
Figure GDA0004090691550000095
其中,
Figure GDA0004090691550000096
表示可训练矩阵,σ(·)表示激活函数
超图卷积操作可以看作是对超图结构进行顶点-超边-顶点特征变换的两阶段细化,超边关联矩阵H定义了从超边到顶点的消息传递路径,类似的,HT定义了从顶点到超边的信息传递路径,两个对角矩阵Dv∈N|V|×|V|,De∈N|ε|×|ε|分别代表节点对角度矩阵和超边对角度矩阵,在这里用于归一化。在本发明中,这个超图卷积仅仅是进行信息传播,而没有使用任何可以训练的参数θ(1)。分别将用户/项目超图关联矩阵和用户/项目嵌入通过超图卷积操作,获得。
Figure GDA0004090691550000101
Figure GDA0004090691550000102
其中,
Figure GDA0004090691550000103
高阶信息传递阶段的矩阵形式为:
Figure GDA0004090691550000104
Figure GDA0004090691550000105
对于联合信息传递,将
Figure GDA0004090691550000106
与步骤3获得用户与项目的位置拓扑编码矩阵进行结合,再通过一个层数为1的多层感知机进行信息融合,使用层数为1的多层感知机对两种嵌入表示进行融合不仅计算复杂度低,而且有着较强的可解释性。获得用户嵌入
Figure GDA0004090691550000107
和项目嵌入
Figure GDA0004090691550000108
用于进一步传播和链路预测。表示为:
Figure GDA0004090691550000109
Figure GDA00040906915500001010
联合信息更新阶段的矩阵形式为:
Figure GDA00040906915500001011
Figure GDA00040906915500001012
其中,
Figure GDA00040906915500001013
用户的嵌入向量,
Figure GDA00040906915500001014
项目的嵌入向量;
S112,将嵌入向量进行内积处理得到用户与项目之间的关联分数,并根据关联分数为用户推荐可能感兴趣的项目。
需要说明的是,将步骤S110得到的嵌入向量作为最终的嵌入,在本发明中将层数l设置为1,模型将获得的嵌入向量通过内积运算获得用户对目标项目之间的偏好:
Figure GDA0004090691550000111
为了学习模型的参数,本发明使用了贝叶斯个性化排名(Bayesian PersonalizedRanking,BPR)损失函数作为我们的损失函数进行模型训练。这是一个成对损失函数,它考虑到观测到的交互对用户偏好的影响更大。具体损失函数如下表示:
Figure GDA0004090691550000112
其中,O={(u,i,j)|(u,i)∈R+,(u,j)∈R-}被定义为数据集合,每一个数据都是三元组。R+表示观察到的用户-项目交互,R-表示未观察道德用户-项目交互,σ(·)表示非线性激活函数sigmoid。Θ表示所有可训练模型参数,超参数λ控制L2正则化参数的强度。
本发明分别计算测试集中的每个用户对所有项目的偏好分数,选择推荐系统中常见的两个评估指标来评价模型效果,分别是召回率Recall@K和归一化折损累计收益NDCG@K,K是按照评分的高低的排序选取前K个物品的评分。具体定义如下:
召回率计算的是所有被正确推荐的项目占所有应该被推荐的正确的项目的比例,即:
Figure GDA0004090691550000113
其中,R(u)是为项目推荐的项目集合,T(u)是测试集上用户感兴趣的项目的集合。
归一化折损累计收益是一种考虑排序顺序的因素的评价指标,该指标使得排名靠前的商品增益更高,对排名靠后的用户进行折损。NDCG需要对所有用户的推荐列表进行评价,由于用户真实列表长度不同,因此需要对不同用户的指标进行归一化。NDCG由DCG和IDCG共同表示,DCG表示某个用户对项目集喜爱程度的评分,IDCG表示某个用户对项目及喜爱程度由高到低的评分。
Figure GDA0004090691550000114
Figure GDA0004090691550000121
Figure GDA0004090691550000122
其中reli表示用户对第i个项目的评分,是按照评分高低的排序选取前K个物品的评分,log2(i+1)是一个位置递减权重。
图5示出了一种基于拓扑信息嵌入的超图卷积协同过滤推荐系统框图。
本发明第二方面提供了一种基于拓扑信息嵌入的超图卷积协同过滤推荐系统,包括存储器51和处理器52,所述存储器中包括基于拓扑信息嵌入的超图卷积协同过滤推荐方法程序,所述基于拓扑信息嵌入的超图卷积协同过滤推荐方法程序被所述处理器执行时实现如下步骤:
获取用户与项目交互数据,并构造用户-项目交互二部图;
构建用户与项目的初始嵌入查找表,利用聚类算法将用户-项目交互二部图进行子图划分,得到c个不连通的聚类子图;
使用矩阵分解来对聚类子图进行编码,得到位置拓扑编码;
定义关联规则表,利用关联规则表分别得到用户和项目超边组,整合所述超边组生成超图,并获得超图关联矩阵;
通过超图卷积操作分别学习用户与项目的高阶邻域复杂相关性,将超图卷积的输出与位置拓扑编码进行结合,并通过可学习的前馈神经网络来进行信息融合,得到嵌入向量;
将嵌入向量进行内积处理得到用户与项目之间的关联分数,并根据关联分数为用户推荐可能感兴趣的项目。
本方案中,所述获取用户与项目交互数据,并构造用户-项目交互二部图,具体为:
从开源的数据集中获取用户与项目交互数据,所述用户与项目交互数据为欧氏空间数据,将欧氏空间数据构造为非欧氏空间数据即得到用户-项目交互二部图。
本发明第三方面公开了一种计算机可读存储介质,所述计算机可读存储介质中包括基于拓扑信息嵌入的超图卷积协同过滤推荐方法程序,所述基于拓扑信息嵌入的超图卷积协同过滤推荐方法程序被处理器执行时,实现如上所述的一种基于拓扑信息嵌入的超图卷积协同过滤推荐方法的步骤。
本发明公开的一种基于拓扑信息嵌入的超图卷积协同过滤推荐方法和系统及计算机可读存储介质,所述方法至少有以下有益效果:
(1)本发明考虑在用户-项目交互二部图中来学习嵌入表示,在模型嵌入层考虑到用户与项目之间的交互信息,通过嵌入传播在用户项目交互图上建模高阶连通性,使得模型学习到高维特征信息,获得更有效的嵌入。
(2)本发明采用分治的策略,使用超图卷积网络来分别学习用户、项目的嵌入表示,将用户和项目整合在一起,但又保持了各自的属性,有效挖掘用户-项目交互图的局部和全局特征信息。
(3)本发明将原始二部图的拓扑位置信息有效地编码进用户项目的嵌入中,提升了协同过滤嵌入表示的质量。
(4)本发明使用内积作为最后得到的用户嵌入和项目嵌入的交互函数,来得到用户项目间的关联分数,简化了模型的时间和空间复杂度,提高模型的推荐性能。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (7)

1.一种基于拓扑信息嵌入的超图卷积协同过滤推荐方法,其特征在于,包括以下步骤:
获取用户与项目交互数据,并构造用户-项目交互二部图;
构建用户与项目的初始嵌入查找表,利用聚类算法将用户-项目交互二部图进行子图划分,得到c个不连通的聚类子图;
使用矩阵分解来对聚类子图进行编码,得到位置拓扑编码;
定义关联规则表,利用关联规则表分别得到用户的和项目的超边组,整合所述超边组生成超图,并获得超图关联矩阵;
通过超图卷积操作分别学习用户与项目的高阶邻域复杂相关性,将超图卷积的输出与位置拓扑编码进行结合,并通过可学习的前馈神经网络来进行信息融合得到嵌入向量;
将嵌入向量进行内积处理得到用户与项目之间的关联分数,并根据关联分数为用户推荐可能感兴趣的项目;
构建用户与项目的初始嵌入查找表,利用聚类算法将用户-项目交互二部图进行子图划分,得到c个不连通的聚类子图具体过程为:
构建用户与项目的初始嵌入查找表分别为:
Figure FDA0004090691540000011
Figure FDA0004090691540000012
其中N,M分别为用户的数量和项目的数量,
Figure FDA0004090691540000013
表示第N个用户的向量表示,
Figure FDA0004090691540000014
表示第M个项目的向量表示,用户与项目之间的交互构成了交互矩阵,记为H∈{0,1}N×M
使用METIS聚类算法对用户-项目交互二部图进行划分,对划分结果随机采样并充足得到c个不连通的子图,分割结果表示为:
Figure FDA0004090691540000015
其中,Gc表示分割得到的第c个聚类子图;
使用矩阵分解来对聚类子图进行编码,得到位置拓扑编码具体为:
使用矩阵分解对聚类子图中的节点进行编码,通过梯度下降来获得用户位置拓扑编码矩阵P∈RN×K和项目位置拓扑编码矩阵Q∈RM×K
通过超图卷积操作分别学习用户与项目的高阶邻域复杂相关性,将超图卷积的输出与位置拓扑编码进行结合,并通过可学习的前馈神经网络来进行信息融合得到嵌入向量,具体步骤为:
将超图关联矩阵和用户-项目嵌入通过超图卷积操作分别学习高阶邻域复杂相关性并得到超图卷积输出;
将超图卷积的输出与位置拓扑编码进行结合,并通过可学习的1层前馈神经网络来进行信息融合,得到嵌入向量;
其中,通过构建子图的邻接矩阵AN×M和预测评分矩阵
Figure FDA0004090691540000021
之间的误差函数来学习用户位置拓扑编码矩阵P和项目位置拓扑编码矩阵Q,因此用户i和商品j的拓扑位置编码pi和qj之间的误差被定义为:
Figure FDA0004090691540000022
公式中pik代表用户i的位置编码表示pi的第k位数字,同理qjk则代表项目j的位置编码qj的第k位数字;
使用梯度下降算法来求解上述拓扑位置编码pi和qj之间的误差,首先求解损失函数的梯度:
Figure FDA0004090691540000023
Figure FDA0004090691540000024
接着沿梯度的负方向来更新变量:
Figure FDA0004090691540000031
Figure FDA0004090691540000032
其中,α为梯度下降法中的学习率,作用是控制参数的更新速率;
通过上述的两个步骤来进行迭代优化,直到算法收敛,至此,获得了用户和项目的拓扑位置编码矩阵P∈RN×K,Q∈RM×K
2.根据权利要求1所述的一种基于拓扑信息嵌入的超图卷积协同过滤推荐方法,其特征在于,所述获取用户与项目交互数据,并构造用户-项目交互二部图,具体为:
从开源的数据集中获取用户与项目交互数据,所述用户与项目交互数据为欧氏空间数据,将欧氏空间数据构造为非欧氏空间数据即得到用户-项目交互二部图。
3.根据权利要求2所述的一种基于拓扑信息嵌入的超图卷积协同过滤推荐方法,其特征在于,对于开源数据集中每个可以观察到的用户项目交互视为正样本,对用户没有交互过的项目执行负采样策略,与正样本进行配对。
4.根据权利要求1所述的一种基于拓扑信息嵌入的超图卷积协同过滤推荐方法,其特征在于,所述定义关联规则表,利用关联规则表分别得到用户和项目超边组,整合所述超边组生成超图,并获得超边关联矩阵,具体过程为:
定义关联规则表{r1,…,rk},rk表示第k种规则;
利用关联规则表得到k个用户超边组和k个项目超边组;
整合用户超边组和项目超边组生成超图,并获得超图关联矩阵。
5.一种基于拓扑信息嵌入的超图卷积协同过滤推荐系统,其特征在于,包括存储器和处理器,所述存储器中包括基于拓扑信息嵌入的超图卷积协同过滤推荐方法程序,所述基于拓扑信息嵌入的超图卷积协同过滤推荐方法程序被所述处理器执行时实现如下步骤:
获取用户与项目交互数据,并构造用户-项目交互二部图;
构建用户与项目的初始嵌入查找表,利用聚类算法将用户-项目交互二部图进行子图划分,得到c个不连通的聚类子图;
使用矩阵分解来对聚类子图进行编码,得到位置拓扑编码;
定义关联规则表,利用关联规则表分别得到用户的和项目的超边组,整合所述超边组生成超图,并获得超图关联矩阵;
通过超图卷积操作分别学习用户与项目的高阶邻域复杂相关性,将超图卷积的输出与位置拓扑编码进行结合,并通过可学习的前馈神经网络来进行信息融合得到嵌入向量;
将嵌入向量进行内积处理得到用户与项目之间的关联分数,并根据关联分数为用户推荐可能感兴趣的项目;
构建用户与项目的初始嵌入查找表,利用聚类算法将用户-项目交互二部图进行子图划分,得到c个不连通的聚类子图具体过程为:
构建用户与项目的初始嵌入查找表分别为:
Figure FDA0004090691540000041
Figure FDA0004090691540000042
其中N,M分别为用户的数量和项目的数量,
Figure FDA0004090691540000043
表示第N个用户的向量表示,
Figure FDA0004090691540000044
表示第M个项目的向量表示,用户与项目之间的交互构成了交互矩阵,记为H∈{0,1}N×M
使用METIS聚类算法对用户-项目交互二部图进行划分,对划分结果随机采样并充足得到c个不连通的子图,分割结果表示为:
Figure FDA0004090691540000045
其中,Gc表示分割得到的第c个聚类子图;
使用矩阵分解来对聚类子图进行编码,得到位置拓扑编码具体为:
使用矩阵分解对聚类子图中的节点进行编码,通过梯度下降来获得用户位置拓扑编码矩阵P∈RN×K和项目位置拓扑编码矩阵Q∈RM×K
通过超图卷积操作分别学习用户与项目的高阶邻域复杂相关性,将超图卷积的输出与位置拓扑编码进行结合,并通过可学习的前馈神经网络来进行信息融合得到嵌入向量,具体步骤为:
将超图关联矩阵和用户-项目嵌入通过超图卷积操作分别学习高阶邻域复杂相关性并得到超图卷积输出;
将超图卷积的输出与位置拓扑编码进行结合,并通过可学习的1层前馈神经网络来进行信息融合,得到嵌入向量;
其中,通过构建子图的邻接矩阵AN×M和预测评分矩阵
Figure FDA0004090691540000051
之间的误差函数来学习用户位置拓扑编码矩阵P和项目位置拓扑编码矩阵Q,因此用户i和商品j的拓扑位置编码pi和qj之间的误差被定义为:
Figure FDA0004090691540000052
公式中pik代表用户i的位置编码表示pi的第k位数字,同理qjk则代表项目j的位置编码qj的第k位数字;
使用梯度下降算法来求解上述拓扑位置编码pi和qj之间的误差,首先求解损失函数的梯度:
Figure FDA0004090691540000053
Figure FDA0004090691540000054
接着沿梯度的负方向来更新变量:
Figure FDA0004090691540000061
Figure FDA0004090691540000062
其中,α为梯度下降法中的学习率,作用是控制参数的更新速率;
通过上述的两个步骤来进行迭代优化,直到算法收敛,至此,获得了用户和项目的拓扑位置编码矩阵P∈RN×K,Q∈RM×K
6.根据权利要求5所述的一种基于拓扑信息嵌入的超图卷积协同过滤推荐系统,其特征在于,所述获取用户与项目交互数据,并构造用户-项目交互二部图,具体为:
从开源的数据集中获取用户与项目交互数据,所述用户与项目交互数据为欧氏空间数据,将欧氏空间数据构造为非欧氏空间数据即得到用户-项目交互二部图。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包括基于拓扑信息嵌入的超图卷积协同过滤推荐方法程序,所述基于拓扑信息嵌入的超图卷积协同过滤推荐方法程序被处理器执行时,实现如权利要求1至4中任一项所述的一种基于拓扑信息嵌入的超图卷积协同过滤推荐方法的步骤。
CN202110973781.2A 2021-08-24 2021-08-24 一种基于拓扑信息嵌入的超图卷积协同过滤推荐方法、系统及计算机可读存储介质 Active CN113672811B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110973781.2A CN113672811B (zh) 2021-08-24 2021-08-24 一种基于拓扑信息嵌入的超图卷积协同过滤推荐方法、系统及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110973781.2A CN113672811B (zh) 2021-08-24 2021-08-24 一种基于拓扑信息嵌入的超图卷积协同过滤推荐方法、系统及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN113672811A CN113672811A (zh) 2021-11-19
CN113672811B true CN113672811B (zh) 2023-04-18

Family

ID=78545559

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110973781.2A Active CN113672811B (zh) 2021-08-24 2021-08-24 一种基于拓扑信息嵌入的超图卷积协同过滤推荐方法、系统及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN113672811B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114117142A (zh) * 2021-12-02 2022-03-01 南京邮电大学 一种基于注意力机制与超图卷积的标签感知推荐方法
CN114036400B (zh) * 2021-12-07 2022-04-08 中国计量大学 一种基于超图的协同会话推荐方法
CN114662009B (zh) * 2021-12-13 2022-11-18 菏泽汇豪纺织有限公司 一种基于图卷积的工业互联网工厂协同推荐方法
CN114372573B (zh) * 2022-01-07 2022-09-16 中国人民解放军国防科技大学 用户画像信息识别方法、装置、计算机设备和存储介质
CN115082147B (zh) * 2022-06-14 2024-04-19 华南理工大学 一种基于超图神经网络的序列推荐方法及装置
CN116186309B (zh) * 2023-04-21 2023-07-18 江西财经大学 基于融合用户意图的交互兴趣图的图卷积网络推荐方法
CN116894122B (zh) * 2023-07-06 2024-02-13 黑龙江大学 一种基于超图卷积网络的跨视图对比学习群组推荐方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112905900A (zh) * 2021-04-02 2021-06-04 辽宁工程技术大学 基于图卷积注意力机制的协同过滤推荐算法
CN113177159A (zh) * 2021-05-11 2021-07-27 清华大学 基于多通道超图神经网络的捆绑推荐方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112905900A (zh) * 2021-04-02 2021-06-04 辽宁工程技术大学 基于图卷积注意力机制的协同过滤推荐算法
CN113177159A (zh) * 2021-05-11 2021-07-27 清华大学 基于多通道超图神经网络的捆绑推荐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Shuyi Ji等.Dual channel hypergraph collaborative filtiering.《Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery&amp Data Mining:ACM》.2020,2020-2029. *
徐冰冰;岑科廷;黄俊杰;沈华伟;程学旗;.图卷积神经网络综述.计算机学报.2020,(第05期),3-28. *

Also Published As

Publication number Publication date
CN113672811A (zh) 2021-11-19

Similar Documents

Publication Publication Date Title
CN113672811B (zh) 一种基于拓扑信息嵌入的超图卷积协同过滤推荐方法、系统及计算机可读存储介质
CN111881342A (zh) 一种基于图孪生网络的推荐方法
CN112925989B (zh) 一种属性网络的群体发现方法及系统
CN109389151B (zh) 一种基于半监督嵌入表示模型的知识图谱处理方法和装置
CN111523047A (zh) 基于图神经网络的多关系协同过滤算法
Zhang et al. Spectral embedding network for attributed graph clustering
CN111310063A (zh) 基于神经网络的记忆感知门控因子分解机物品推荐方法
CN113918832B (zh) 基于社交关系的图卷积协同过滤推荐系统
CN110866145A (zh) 一种共同偏好辅助的深度单类协同过滤推荐方法
CN113918834B (zh) 融合社交关系的图卷积协同过滤推荐方法
CN113918833B (zh) 通过社交网络关系的图卷积协同过滤实现的产品推荐方法
Navgaran et al. Evolutionary based matrix factorization method for collaborative filtering systems
CN113505294A (zh) 一种融合元路径的异质网络表示推荐算法
CN112905894B (zh) 一种基于增强图学习的协同过滤推荐方法
Kepner et al. Mathematics of Big Data
Bourhim et al. A community-driven deep collaborative approach for recommender systems
Hao et al. Deep graph clustering with enhanced feature representations for community detection
CN116664253A (zh) 一种基于广义矩阵分解与遮蔽注意力的项目推荐方法
Lu et al. Social network alignment: a bi-layer graph attention neural networks based method
Zhang et al. Relational intelligence recognition in online social networks—A survey
CN113744023A (zh) 一种基于图卷积网络的双通道协同过滤推荐方法
Chen et al. Gaussian mixture embedding of multiple node roles in networks
Hekmatfar et al. Attention-based recommendation on graphs
CN113688974B (zh) 一种基于轻量化图卷积网络的移动应用推荐方法
Zhou et al. Multiple behaviors recommendation with graph learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant