CN115082142B - 一种基于异构关系图神经网络的推荐方法、装置及介质 - Google Patents

一种基于异构关系图神经网络的推荐方法、装置及介质 Download PDF

Info

Publication number
CN115082142B
CN115082142B CN202210504352.5A CN202210504352A CN115082142B CN 115082142 B CN115082142 B CN 115082142B CN 202210504352 A CN202210504352 A CN 202210504352A CN 115082142 B CN115082142 B CN 115082142B
Authority
CN
China
Prior art keywords
learning
user
commodity
recommendation
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210504352.5A
Other languages
English (en)
Other versions
CN115082142A (zh
Inventor
罗荣华
陈梦如
许勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN202210504352.5A priority Critical patent/CN115082142B/zh
Publication of CN115082142A publication Critical patent/CN115082142A/zh
Application granted granted Critical
Publication of CN115082142B publication Critical patent/CN115082142B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Development Economics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于异构关系图神经网络的推荐方法、装置及介质,其中方法包括:收集带有用户社交关系、商品属性关系及用户商品交互关系的数据集;采用图结构的方式对三种关系的数据进行存储,获得图结构数据;构建推荐模型,将推荐模型中的三个图卷积网络,分别学习图结构数据的节点特征向量;节点嵌入向量学习;无监督学习;结合节点嵌入向量学习和无监督学习对推荐模型进行训练学习;将推荐模型最终学习到的用户和商品嵌入向量进行打分预测,得到推荐商品顺序。本发明利用个性化对比学习方法学习社交关系或者商品属性关系在对用户购买商品时所产生的影响,能够提高推荐准确性,可广泛应用于推荐系统领域。

Description

一种基于异构关系图神经网络的推荐方法、装置及介质
技术领域
本发明涉及推荐系统和图卷积神经网络的机器学习技术领域,尤其涉及一种基于异构关系图神经网络的推荐方法、装置及介质。
背景技术
最近几年,随着互联网和大数据的产生,给人们生活带来重大变化的同时,也让人们面对海量数据不知所措,所以推荐系统应运而生,可以有效通过对用户的历史行为,属性特征和各种存在的隐性关系进行分析,给用户推荐可能喜欢的商品。其中各种推荐算法也被研究出来,最近随着图卷积神经网络的产生,推荐准确性进一步提升,可以处理存在多种关系的异构图网络。基于传统推荐算法确实可以实现准确推荐,但是在现实世界,有标签数据缺乏,具有稀疏性,可能会存在各种噪音和脏数据,干扰正确的预测,故目前很多学者研究自监督学习来增强数据,它来源于计算机视觉的研究领域,但现在被很多研究者引入推荐系统中,它可以实现两个增强后视角的正样本的拉近和负样本的拉远,利用两个增强视角的相关性,在没有引入额外参数情况下利用数据本身特性,互相自监督学习,可以缓解数据的稀疏性和噪声数据影响;但是目前自监督做法可能存在问题,首先,使得本来语义上很相似的两个样例被识别为负样本,其次不能实现个性化的距离学习。
发明内容
为至少一定程度上解决现有技术中存在的技术问题之一,本发明的目的在于提供一种基于异构关系图神经网络的推荐方法、装置及介质。
本发明所采用的技术方案是:
一种基于异构关系图神经网络的推荐方法,包括以下步骤:
收集带有用户社交关系、商品属性关系及用户商品交互关系的数据集;
采用图结构的方式对用户社交关系、商品属性关系以及用户商品交互关系三种关系的数据进行存储,获得图结构数据;
构建推荐模型,将推荐模型中的三个图卷积网络,分别学习图结构数据的节点特征向量;
节点嵌入向量学习:使用多层卷积网络层获取高阶语义信息,将每层的特征输出进行拼接得到节点特征,将同一节点的不同语义特征进行融合,得到用户商品的最终嵌入向量;
无监督学习:对同一节点在两个信息域的编码器输出的特征,进行个性化的软距离对比学习;辅助域特征经过元知识学习器产生的个性化转换参数进行转换,再与目标域特征进行一致性的对比学习;
结合节点嵌入向量学习和无监督学习对推荐模型进行训练学习;
将推荐模型最终学习到的用户和商品嵌入向量进行打分预测,得到推荐商品顺序。
进一步地,所述推荐方法还包括对数据集进行预处理的步骤:
根据预设条件过滤无效的用户,保留有效的用户和相应的商品节点;
将数据集进行划分,对每个用户的验证集和测试集分别随机选取一个交互,剩下的交互项为训练集;
对预测结果做评判,对验证集和测试集进行负采样。
进一步地,所述三个图卷积网络为用户商品交互图卷积网络GCNui、用户社交关系图卷积网络GCNuu、商品属性关系图卷积网络GCNii
所述分别学习图结构数据的节点特征向量,包括:
对用户特征和商品特征进行非线性过滤,作为辅助用户社交关系图卷积网络GCNuu的初始化特征,过滤过程表示如下:
其中,为社交关系网络的用户初始化特征,/>为基准用户初始化特征,/>为商品属性关系网络的商品初始化特征,/>为基准商品初始化特征,Wg,bg均为可学习的参数,⊙代表按元素相乘,σ是非线性激活函数。
进一步地,所述节点嵌入向量学习,包括:
将初始化的特征向量分别输入到对应的图卷积网络,进行结点特征聚合更新,用户商品交互图卷积网络GCNui输出交互场景下用户和商品的特征/>用户社交关系图卷积网络GCNuu输出社交场景下用户的特征/>商品属性关系图卷积网络GCNii输出商品类别场景下商品的特征/>分别将两个渠道输出的用户特征和商品特征进行注意力机制融合。
进一步地,用户特征的进行融合的表达式如下:
score=F.softmax(stack((w1,w2),dim=0))
其中,W,b为可学习的参数,a表示关系类型注意力向量,scorek为关系类型的语义信息对目标节点的重要性;σ是非线性激活函数;w1为社交关系学习的用户特征对融合特征的贡献系数,w2为交互关系学习的用户特征对融合特征的贡献系数,为社交关系学习的用户特征,/>为交互关系学习的用户特征,/>为融合两个学习视角的用户特征;mean(1)表示对向量矩阵的第一维求平均值,stack((w1,w2),dim=0)表示将两个向量按照新的第0维拼接,F.softmax()表示对输入张量进行归一化。
进一步地,所述节点嵌入向量学习,包括:
将三种关系对应的关系图,与初始化及经过过滤的节点特征,一起输入图卷积网络的编码器,输出各自关系图中的节点特征;
为了隐性捕捉到异构关系中潜在的软元路经,将每一层输出的两种关系类型的节点特征经过注意力机制融合后,输入到下一层卷积网络中,以学习更多语义信息;
将所有层输出与初始化特征向量进行加和平均,得到用户商品的最终嵌入向量;
其中,三个图卷积网络最终输出用户和商品的两种语义关系特征向量,作为对比学习的两个相关视角。
进一步地,所述无监督学习,包括:
通过自适应对比学习方法,将辅助域每个实例特征乘以一个经过元知识学习器产生的个性化转换参数矩阵进行个性化转换,再与目标域特征进行一致性的对比学习,得到模型对比学习的无监督损失;
其中,无监督损失函数的表达式如下:
Lcl=α*Lcl_u+γ*Lcl_i
式中,Lcl_u为用户侧对比学习infoNCE损失值,Lcl_i为商品侧对比学习infoNCE损失值,α、γ均为系数。
进一步地,所述结合节点嵌入向量学习和无监督学习对推荐模型进行训练学习,包括:
将有监督损失和无监督损失的和作为推荐模型的目标损失函数,其中,有监督损失为节点嵌入向量学习中的损失函数,无监督损失为无监督学习中的损失函数;
使用梯度下降法,更新推荐模型的参数,直到目标损失函数达到预设阈值。
本发明所采用的另一技术方案是:
一种基于异构关系图神经网络的推荐装置,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现上所述方法。
本发明所采用的另一技术方案是:
一种计算机可读存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由处理器执行时用于执行如上所述方法。
本发明的有益效果是:本发明利用个性化对比学习方法学习社交关系或者商品属性关系在对用户购买商品时所产生的影响,成功捕捉到每个用户在购买商品时所受朋友的影响不同,及每个商品在被用户购买时所受商品本质属性影响不同,提高推荐准确性。
附图说明
为了更清楚地说明本发明实施例或者现有技术中的技术方案,下面对本发明实施例或者现有技术中的相关技术方案附图作以下介绍,应当理解的是,下面介绍中的附图仅仅为了方便清晰表述本发明的技术方案中的部分实施例,对于本领域的技术人员而言,在无需付出创造性劳动的前提下,还可以根据这些附图获取到其他附图。
图1是本发明实施例中一种基于对比学习的异构图推荐方法的工作流程图;
图2是本发明实施例中推荐模型的框架图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
在本发明的描述中,需要理解的是,涉及到方位描述,例如上、下、前、后、左、右等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的描述中,若干的含义是一个或者多个,多个的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
本发明的描述中,除非另有明确的限定,设置、安装、连接等词语应做广义理解,所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。
实施例一
如图1所示,本实施例提供一种基于对比学习的异构图推荐方法,通过元网络学习为每个样本学习一个个性化的转换参数矩阵,使得在对比学习过程中实现自适应的距离拉近或者拉远,该方法包括以下步骤:
S101、数据集的获取和预处理:收集电商平台的包含用户商品交互关系、用户社交关系和项目属性关系的数据集,再进行一定的预处理得到所需要的数据集。
在获取带有异构关系的数据集后,还包括对数据集进行预处理的步骤,包括:
根据用户商品交互数大于3的条件过滤无效的用户,保留有效的用户和相应的商品节点。将数据集进行划分,对每个用户的验证集和测试集分别随机选取一个交互,剩下的交互项为训练集。最后需要对预测结果做评判,需要对验证集和测试集进行负采样。
S102、将获取到的数据集中的社交关系、商品属性关系及交互关系,以稀疏矩阵形式存储,构造为图卷积神经网络可以处理的图结构数据。
S103、使用三个图卷积子模块,分别学习用户-用户、用户-商品及商品-商品三种关系图上的节点特征向量。
构建好用户-商品、用户-用户及商品-商品的关系图,与初始化及经过自控们过滤的节点特征,一起输入图卷积神经网络编码器,输出各自关系图中的节点特征。为了隐性捕捉到异构关系中潜在的软元路经,将每一层输出的两种关系类型的节点特征经过注意力机制融合后再输入到下一层卷积网络中,可以学习更多语义信息。通过迭代多层卷积,不断获得高阶的语义信息,为防止过度平滑和过拟合,本发明使用二层卷积网络。最后将所有层输出与初始化特征向量进行加和平均后得到最终用户和商品特征向量。
S104、节点嵌入向量学习:使用多层卷积网络层获取高阶语义信息,将每层的特征输出进行拼接得到节点特征,将同一节点的不同语义特征进行融合得到用户商品的最终嵌入向量。
用户和商品特征的初始化,将构建的三个邻接矩阵和所需要用户商品特征送入图卷积神经网络进行特征的学习(邻居信息的聚合更新),最后分别输出社交关系(uu)视角和购买(iu)视角下的两种用户特征,商品类别(ii)视角和被购买(ui)视角下的两种商品特征。增加网络层数,捕获高阶信息。
所要学习的用户和项目特征的初始化包括:因为uu和ui视角下用户特征可能代表或者关注的维度不同,故将初始化的用户特征经过gating处理,即乘以一个经过线性变换后的特征,再作为uu视角的初始化用户特征,商品侧同理。
每个图卷积子模块在卷积层独立地更新特征,即在uu域,每个节点聚合其邻域朋友节点的特征,然后更新得到uu域下的用户特征。在ui域,分为两个部分,对于用户节点,聚合其邻居信息项目特征,然后更新得到ui域下的用户特征,对于项目节点,聚合其邻居信息用户特征,然后更新得到ui域下的项目特征。在ii域,项目节点聚合其邻居信息项目特征,然后更新得到ii域下的项目特征。
图卷积神经网络的中间层跨子模块信息融合包括:将uu,ui,ii,独立学习到的两种不同语义信息特征进行注意力机制融合,再输入到下一层的训练网络,可以自动隐式地捕捉更多的元路径,生成更多的隐藏语义信息。
三个图卷积子模块最终输出用户和商品的两种语义关系特征向量,作为对比学习的两个相关视角,在特征空间,最大化同一样本不同视角的一致性,最小化不同样本的距离。最后的输出包括:uu域所学到的用户特征,ui域所学到的用户和商品特征,ii域所学到的商品特征。
将模型最终得到的特征向量,利用BPRLoss损失函数得到模型推荐预测的有监督损失。
S105、无监督学习:对同一节点在两个信息域的编码器输出的特征进行个性化的软距离对比学习。辅助域特征经过元知识学习器产生的个性化转换参数进行转换,再与目标域特征进行一致性的对比学习。
本实施例提出自适应对比学习方法,将辅助域每个实例特征乘以一个经过元知识学习器产生的个性化转换参数矩阵进行个性化转换,再与目标域特征进行一致性的对比学习,得到模型对比学习的无监督损失。
设计元学习器根据两个相关视角下的相同用户不同特征和交互行为信息,生成每个用户和项目的个性化转换矩阵参数。将uu和ii视角下特征乘以个性化转换矩阵参数得到转换后的特征与不做变换的ui视角下的特征进行对比学习。
所述设计元学习器包括:
A1、元知识的提取:以用户侧来说明,元知识包括uu域用户特征,ui域的用户特征,用户交互的项目在ui域下表示的特征平均;三个元知识进行拼接后,再经过线性变换变换到原来的大小空间。
A2、元学习器学习个性化转换矩阵参数:将上述获取的元知识输入一个全连接网络,输出每个用户的转换矩阵参数。
A3、特征个性化变换:将uu域的用户特征乘以上述的个性化转换矩阵参数,得到变换后的用户特征,再加上变换前的特征得到最后uu域的特征。
所述对比学习包括:
B1、巧妙设计两个相关的对比学习视角:本发明涉及用户和商品侧的对比学习,对比的两个视角分别为:ui域商品特征和ii域个性化变换后的商品特征;iu域个性化变换后的用户特征和uu域用户特征。
B2、正负样本对:正样本对是两个视角下相同实例的特征,负样本对是除了同一个实例,一个batchsize大小内其他的实例特征。
B3、将上述正负样本对特征经过归一化,代入InfoNCE表达式计算一个样本的对比损失,将所有样本对比损失,相加除以样本数得到总的对比损失。
S106、将有监督损失函数与对比损失函数结合,使用Adam优化器进行反向传播,优化网络参数。对训练集数据迭代训练,直至模型收敛。
模型总损失函数优化模型包括:对于有监督损失,将模型中两个相关信息域得到的两种语义特征进行融合得到最后的用户商品特征,使用BPRLoss作为有监督损失函数,和上述无监督损失求和得出模型目标损失函数,然后将梯度反向传播到异构图神经网络中。具体地,使用梯度下降法,不断更新模型参数,直到目标损失达到最小,学到用户和商品的优质表达,实现精准推荐预测。
S107、推荐预测:将模型最终学习到的用户和商品嵌入向量进行打分预测,得到推荐商品顺序。
实施例二
如图1和图2所示,本实施例提供一种基于异构关系图神经网络的推荐方法,首先对获取到的数据集进行训练集、验证集及测试集的划分、预处理及构建商品交互、用户社交及商品属性的关系图,分别送入图卷积网络进行编码,跨渠道融合,引入个性化对比学习的无监督信号,最后联合训练有监督损失和无监督损失,进行最后推荐预测。该方法具体包括以下步骤:
S201、构建数据集,获取互联网平台下带有社交关系、交互记录以及商品类别信息的数据集,并进一步过滤、划分以及进行随机负采样。
目前现有的推荐算法,很多都是基于协同过滤方法,但在现实各种互联网平台上不仅有交互关系,还有在平台中搭建的社交关系,商品归属的类别关系等其他有用的辅助信息。所以本发明在设计推荐方法时倾向于考虑异构关系并存下的推荐预测,故专门收集这类数据集。
收集数据集,电商平台、视频网站及评论网站等场景下不仅有用户项目交互记录、还包括用户朋友关系、项目类别信息的数据集。现在公开的Ciao、Epinions、Yelp评论数据集都可以作为本发明的候选数据集,进行过滤预处理及数据集划分。
数据收集后,本发明没有研究冷启动问题,所以将交互数小于三个的用户剔除,保证数据高质量性。随后,将每个用户的交互项进行划分,分别随机选取一个交互记录作为验证和测试集,其余剩下的作为训练集。最后为了验证和测试模型推荐预测效果,对验证集和测试集按照正负样本1:99进行随机负采样。
S202、各种关系数据以图的结构方式进行存储,输入图卷积网络进行特征学习,本发明将特征编码网络分为,用户商品交互图卷积网络GCNui、用户社交关系图卷积网络GCNuu、商品属性关系图卷积网络GCNii。输入特征,输出对应渠道聚合更新后的节点特征。显然,ui和uu都包含用户节点,所以初始化的用户特征会输入到这两个渠道,但不同的渠道可能对最后的预测结果影响不同,故本发明对基础的用户特征进行非线性过滤(自控单元SUGs)作为辅助渠道社交关系图卷积神经网络GCNuu的初始化特征.商品侧同理,其过滤过程可以表示为:
其中:Wg,bg可学习的参数,⊙代表按元素相乘,σ是非线性激活函数。
S203、节点特征向量学习,将初始化的特征向量分别送入对应的卷积网络进行聚合更新,最后得到融合后全面的节点嵌入向量。
将初始化嵌入矩阵分别输入到对应的图卷积模块进行结点特征聚合更新,GCNui模块输出交互场景下用户和商品的特征/>GCNuu模块输出社交场景下用户的特征/>GCNii模块输出商品类别场景下商品的特征/>分别将两个渠道输出的用户和商品特征进行注意力机制融合,以用户为例,数学表达式如下:
score=F.softmax(stack((w1,w2),dim=0))
其中,W,b为可学习的参数,a表示关系类型注意力向量,scorek被解释为某关系类型的语义信息对目标节点的重要性。
经过多层卷积网络可以输出高阶的语义信息和丰富的隐藏软元路经。为了避免梯度消失和过拟合问题,本发明将每一网络层的输出累加起来作为最后的特征输出,低阶的特征包含了近邻居和结点本身的特征信息,同一类型的结点特征之间差异较大,而高阶特征包含了融合其他类型的信息,蕴含着结点一定阶领域内的共同特征,故属于同一类型的结点特征差异不大,有利于捕获到重要的隐藏信息和用户或者商品某一类的特征。最后将初始特征,低阶输出的特征及高阶输出的特征分别进行归一化累加起来,使累加的特征包含更多阶的语义信息。数学表达式如下:
S204、融合目标结点在多种关系中所学习的特征,引入对比学习来增强特征学习。现有的聚合方法虽然用注意力机制来学习每种类型关系的语义信息对目标结点特征表示的重要性大小,但是聚合操作可能会掩盖不同类型的高阶连接信息的固有特征,所以利用无监督的方式增强每个渠道特征的学习。首先本发明将社交关系视图的用户特征和交互关系视图的用户特征、商品属性关系视图学习到的商品特征和交互关系视图学习到的商品特征,分别作为两个具有相关性的对比视角,可以增强特征的学习,提供互补信息可以互相监督学习,并且可以消除高阶信息中存在的噪声和缓解数据稀疏性。利用InfoNCE来最大化正例的一致性,最小化负列的一致性。在推荐算法中,用户和商品的节点向量需要分开考虑,以用户侧两个相关视角下的对比学习损失函数为例,数学表达式如下:
其中,s为相似性函数,计算向量间的相似度,τ为温度系数,可以自动识别困难负样本。Euu′为包含锚点且除了锚点以外的负样本。
将两个视角下同一个结点的嵌入向量视为正样本对,其他不同的节点视为负样本对,正例辅助监督促进同一结点的不同视图之间的一致性,而负列监督则强化了不同结点之间的分歧。
S205、设计个性化的对比学习方法。现有方法的核心思想是在向量表征空间中将正样本与锚点样本之间的距离拉近,将负样本与锚点样本之间的距离拉远,而是以一种绝对同等的形式,每对正样本必须相近或每对正样本对拉的同等近,负样本对拉的很远或拉的同等远,这种做法忽略了样本的独特性,无论正样本对或者负样本对之间的距离应该是个性化学习的,比如社交信息聚合的特征,可能对有主见的用户来说影响很小;商品属性信息,对用户主要看重某个商品的品牌或者价格会影响很小,所以如果强制性拉近可能会影响最后的预测,但是如何学习或者建立两个相关语义信息域的个性化转换桥,本发明基于元学习的范式设计一个元知识学习器,通过输入提取的每个样本的元知识来为每个样本产生具有个性化且可动态学习的转换参数矩阵。本发明中提取的元知识是样本在两个相关视图的特征信息。元学习器是两层的非线性网络作为一个分辨器产生个性化的参数矩阵将产生的参数矩阵的每一列归一化,使得产生的参数矩阵种每一列元素值形式上相当于注意力机制产生的权重,加和为1。原始的辅助域样本特征,乘以这个参数矩阵相当于对其进行多种线性组合,最后与目标域特征进行对比学习,并且模型没有引入较多参数。故将辅助域特征进行个性化转换后,再进行对比学习得到损失函数,数学表达式如下:
最后,将用户对比损失函数Lcl_u和商品对比损失函数Lcl_i乘以各自系数得到总的无监督损失函数:
Lcl=α*Lcl_u+γ*cl_i
S206、推荐预测。模型最后输出全面的用户和商品嵌入向量,用BPRLoss损失函数得到推荐任务的有监督损失Lbpr,与上面的无监督损失相加得到最后的模型损失:
L=Lbpr+β*Lcl
训练目标为使得网络的损失最小化,利用梯度下降法,计算损失对各个参数的梯度,反向传播到网络中,不断更新模型参数。将每一轮训练更新的网络参数,用户和商品特征向量参数输入到网络,经过计算得到测试阶段用户和商品的嵌入向量,利用准备好的1:99的正例和负列,进行预测评分,由两个嵌入向量内积决定,值越高代表用户对商品偏好程度越高,反之亦然。然后得到得分顺序表按照降序排列,值最大的预测结果所对应的商品则为用户偏好最强的商品,可以用得分前10个商品是否有正例商品来表示命中率,如果命中则求出这个商品在前10的哪个位置来进一步表示预测的准确度,使用提前终止算法来决定是否进行下一轮训练。直至推荐预测效果最佳完成模型训练,接下来可以进行精准预测,推荐出用户可能喜欢的商品列表。
综上所述,本实施例方法相对于现有技术,具有如下优点及有益效果:
(1)本发明同时考虑到用户商品间的交互、用户社交及商品属性的异构关系,可以缓解只有单一交互数据的数据稀疏性,还能利用语义信息丰富的社交关系和商品属性知识关系的辅助信息域来增强特征的学习,达到更精准的推荐。与现有技术的相比,在处理多种关系的异构性和各个域分布存在的差异,本发明没有采用传统的基于手工设计的元路经去学习各种语义下的特征表示,而是利用强大的图卷积网络去构建各个域下关系图数据,通过多层卷积网络和跨域融合学习高阶特征表示。
(2)本实施例提到的利用图卷积网络来编码各个域下的关系图数据,其实用户既包含在交互关系图又在社交关系图中,所以这两个关系域因为相同的用户实例而建立起一定的联系,但是在初始化用户特征时,虽然同一个用户,但是用户在两个关系域所表征语义不同,故本发明在将用户的特征流入到社交域编码器前,经过一个自空门单元进行滤波,其学习一个非线性门去重新调整了基础的用户特征,其基于特征层面,得到社交关系渠道的用户特定输入特征。商品侧类似处理。
(3)虽然没有显示的元路经,但在隐藏卷积层将两个相关渠道下图卷积编码的特征输出进行注意力机制融合,即对于全面的用户商品表征是由两个域下学习的特征表示经过注意力机制得到的注意力系数线性组合得到的,这样由于跨渠道的融合,在学习过程中,本发明可以隐式自动地学习潜在的元路经,从而提取更重要的软元路经。
(4)融合方式可以聚合多个渠道下的特征向量得到全面表征,但是可能模糊不同渠道高阶连接性的内在特质,也有可能存在聚合噪声,故本发明为了解决上面的问题提出利用对比学习引入无监督信号来更深层次互相监督学习,更好学习出特征表示,监督跨渠道高阶语义信息的学习。
(5)对比学习主要思想是拉近两个视角下同一个样本的特征表示,拉远与锚点不同的样本距离。但是现有的对比学习方法在拉远拉近距离上相对绝对和同等,具有强制性,但本发明提出“软距离”的思想去自适应的学习相似性的程度,其根据样本的个性化特质,比如一个用户比较有个性,受朋友影响比较小,如果按照之前方式强制将两个渠道下特征向量拉的很近,可能会影响最后的预测,故本发明在使用经典对比学习的衡量方式前,对辅助域下的特征向量经过个性化转换。参考元学习范式,设计元知识学习器。首先提取重要的元知识,本发明借鉴跨域学习的思想,认为既然想把辅助域特征转换到关键域中,首先两个域的特征都需要考虑,除此以外,比如用户的特征从社交关系转换到目标交互域,与用户所购买的商品集有关系,故元知识的提取中包含用户所交互商品信息。将元知识送入设计的元知识学习器,对于每个实例生成个性化特制的转换参数矩阵。将辅助域特征进行个性化转换,然后与主目标域特征进行对比学习。
本实施例还提供一种基于异构关系图神经网络的推荐装置,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现图1所示方法。
本实施例的一种基于异构关系图神经网络的推荐装置,可执行本发明方法实施例所提供的一种基于异构关系图神经网络的推荐方法,可执行方法实施例的任意组合实施步骤,具备该方法相应的功能和有益效果。
本申请实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行图1所示的方法。
本实施例还提供了一种存储介质,存储有可执行本发明方法实施例所提供的一种基于异构关系图神经网络的推荐方法的指令或程序,当运行该指令或程序时,可执行方法实施例的任意组合实施步骤,具备该方法相应的功能和有益效果。
在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外,在本发明的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
此外,虽然在功能性模块的背景下描述了本发明,但应当理解的是,除非另有相反说明,所述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本发明的范围,本发明的范围由所附权利要求书及其等同方案的全部范围来决定。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的上述描述中,参考术语“一个实施方式/实施例”、“另一实施方式/实施例”或“某些实施方式/实施例”等的描述意指结合实施方式或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施方式或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施方式,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施方式进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于上述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (6)

1.一种基于异构关系图神经网络的推荐方法,其特征在于,包括以下步骤:
收集带有用户社交关系、商品属性关系及用户商品交互关系的数据集;
采用图结构的方式对用户社交关系、商品属性关系以及用户商品交互关系三种关系的数据进行存储,获得图结构数据;
构建推荐模型,将推荐模型中的三个图卷积网络,分别学习图结构数据的节点特征向量;节点嵌入向量学习:使用多层卷积网络层获取高阶语义信息,将每层的特征输出进行拼接得到节点特征,将同一节点的不同语义特征进行融合,得到用户商品的最终嵌入向量;
无监督学习:对同一节点在两个信息域的编码器输出的特征,进行个性化的软距离对比学习;辅助域特征经过元知识学习器产生的个性化转换参数进行转换,再与目标域特征进行一致性的对比学习;
结合节点嵌入向量学习和无监督学习对推荐模型进行训练学习;
将推荐模型最终学习到的用户和商品嵌入向量进行打分预测,得到推荐商品顺序;
所述三个图卷积网络为用户商品交互图卷积网络GCNui、用户社交关系图卷积网络GCNuu、商品属性关系图卷积网络GCNii
所述分别学习图结构数据的节点特征向量,包括:
对用户特征和商品特征进行非线性过滤,作为初始化特征,过滤过程表示如下:
其中,为社交关系网络的用户初始化特征,/>为基准用户初始化特征,/>为商品属性关系网络的商品初始化特征,/>为基准商品初始化特征,Wg,bg均为可学习的参数,⊙代表按元素相乘,σ是非线性激活函数;
所述节点嵌入向量学习,包括:
将特征向量分别输入到对应的图卷积网络,进行结点特征聚合更新,用户商品交互图卷积网络GCNui输出交互场景下用户和商品的特征/>用户社交关系图卷积网络GCNuu输出社交场景下用户的特征/>商品属性关系图卷积网络GCNii输出商品类别场景下商品的特征/>分别将两个渠道输出的用户特征和商品特征进行注意力机制融合;
用户特征的进行融合的表达式如下:
scorek=F.softmax(stack((w1,w2),dim=0))
其中,W,b为可学习的参数,a表示关系类型注意力向量,scorek为关系类型的语义信息对目标节点的重要性;σ是非线性激活函数;w1为社交关系学习的用户特征对融合特征的贡献系数,w2为交互关系学习的用户特征对融合特征的贡献系数,为交互关系学习的用户特征,/>为融合两个学习视角的用户特征;mean(1)表示对向量矩阵的第一维求平均值,stack((w1,w2),dim=0)表示将两个向量按照新的第0维拼接,F.softmax()表示对输入张量进行归一化;
所述节点嵌入向量学习,包括:
将三种关系对应的关系图,与初始化及经过过滤的节点特征,一起输入图卷积网络的编码器,输出各自关系图中的节点特征;
为了隐性捕捉到异构关系中潜在的软元路经,将每一层输出的两种关系类型的节点特征经过注意力机制融合后,输入到下一层卷积网络中,以学习更多语义信息;
将所有层输出与初始化特征向量进行加和平均,得到用户商品的最终嵌入向量;
其中,三个图卷积网络最终输出用户和商品的两种语义关系特征向量,作为对比学习的两个相关视角。
2.根据权利要求1所述的一种基于异构关系图神经网络的推荐方法,其特征在于,所述推荐方法还包括对数据集进行预处理的步骤:
根据预设条件过滤无效的用户,保留有效的用户和相应的商品节点;
将数据集进行划分,对每个用户的验证集和测试集分别随机选取一个交互,剩下的交互项为训练集。
3.根据权利要求1所述的一种基于异构关系图神经网络的推荐方法,其特征在于,所述无监督学习,包括:
通过自适应对比学习方法,将辅助域每个实例特征乘以一个经过元知识学习器产生的个性化转换参数矩阵进行个性化转换,再与目标域特征进行一致性的对比学习,得到模型对比学习的无监督损失;
其中,无监督损失函数的表达式如下:
Lcl=α*Lcl_u+γ*Lcl_i
式中,Lcl_u为用户侧对比学习infoNCE损失值,Lcl_i为商品侧对比学习infoNCE损失值,α、γ均为系数。
4.根据权利要求1所述的一种基于异构关系图神经网络的推荐方法,其特征在于,所述结合节点嵌入向量学习和无监督学习对推荐模型进行训练学习,包括:
将有监督损失和无监督损失的和作为推荐模型的目标损失函数,其中,有监督损失为节点嵌入向量学习中的损失函数,无监督损失为无监督学习中的损失函数;
使用梯度下降法,更新推荐模型的参数,直到目标损失函数达到预设阈值。
5.一种基于异构关系图神经网络的推荐装置,其特征在于,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现权利要求1-4任一项所述方法。
6.一种计算机可读存储介质,其中存储有处理器可执行的程序,其特征在于,所述处理器可执行的程序在由处理器执行时用于执行如权利要求1-4任一项所述方法。
CN202210504352.5A 2022-05-10 2022-05-10 一种基于异构关系图神经网络的推荐方法、装置及介质 Active CN115082142B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210504352.5A CN115082142B (zh) 2022-05-10 2022-05-10 一种基于异构关系图神经网络的推荐方法、装置及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210504352.5A CN115082142B (zh) 2022-05-10 2022-05-10 一种基于异构关系图神经网络的推荐方法、装置及介质

Publications (2)

Publication Number Publication Date
CN115082142A CN115082142A (zh) 2022-09-20
CN115082142B true CN115082142B (zh) 2024-04-30

Family

ID=83247746

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210504352.5A Active CN115082142B (zh) 2022-05-10 2022-05-10 一种基于异构关系图神经网络的推荐方法、装置及介质

Country Status (1)

Country Link
CN (1) CN115082142B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115309997B (zh) * 2022-10-10 2023-02-28 浙商银行股份有限公司 一种基于多视图自编码特征的商品推荐方法及装置
CN116109381B (zh) * 2023-01-10 2023-09-29 深圳峰涛科技有限公司 电商平台数据处理方法及系统
CN116320511A (zh) * 2023-02-03 2023-06-23 华南理工大学 一种基于图卷积网络的跨域融合推荐方法
CN116861923A (zh) * 2023-04-04 2023-10-10 大连理工大学 多视图无监督图对比学习模型构建方法、系统、计算机、存储介质及应用
CN116703498B (zh) * 2023-04-23 2024-03-26 北京元灵数智科技有限公司 商品推荐方法、装置、电子设备及存储介质
CN116167828B (zh) * 2023-04-25 2023-07-25 江苏亿友慧云软件股份有限公司 一种基于图协同和对比学习的物品推荐方法
CN116662676A (zh) * 2023-06-09 2023-08-29 北京华品博睿网络技术有限公司 一种基于多行为建模的在线招聘双向互惠推荐系统及方法
CN117520665B (zh) * 2024-01-05 2024-03-26 江西财经大学 一种基于生成对抗网络的社交推荐方法
CN117788122B (zh) * 2024-02-23 2024-05-10 山东科技大学 一种基于异质图神经网络商品推荐方法
CN117994007A (zh) * 2024-04-03 2024-05-07 山东科技大学 一种基于多视图融合异质图神经网络的社交推荐方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112990280A (zh) * 2021-03-01 2021-06-18 华南理工大学 面向图像大数据的类增量分类方法、系统、装置及介质
CN112990972A (zh) * 2021-03-19 2021-06-18 华南理工大学 一种基于异构图神经网络的推荐方法
CN113379494A (zh) * 2021-06-10 2021-09-10 清华大学 基于异质社交关系的商品推荐方法、装置和电子设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112990280A (zh) * 2021-03-01 2021-06-18 华南理工大学 面向图像大数据的类增量分类方法、系统、装置及介质
CN112990972A (zh) * 2021-03-19 2021-06-18 华南理工大学 一种基于异构图神经网络的推荐方法
CN113379494A (zh) * 2021-06-10 2021-09-10 清华大学 基于异质社交关系的商品推荐方法、装置和电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于注意力机制增强图卷积神经网络的个性化新闻推荐;杨宝生;;兰州文理学院学报(自然科学版);20200910(05);第57-62页 *

Also Published As

Publication number Publication date
CN115082142A (zh) 2022-09-20

Similar Documents

Publication Publication Date Title
CN115082142B (zh) 一种基于异构关系图神经网络的推荐方法、装置及介质
CN111382309B (zh) 一种基于图模型的短视频推荐方法、和智能终端和存储介质
CN111310063B (zh) 基于神经网络的记忆感知门控因子分解机物品推荐方法
Mongia et al. Deep latent factor model for collaborative filtering
CN112990972B (zh) 一种基于异构图神经网络的推荐方法
Li et al. Deep heterogeneous autoencoders for collaborative filtering
CN113256367B (zh) 用户行为历史数据的商品推荐方法、系统、设备及介质
CN111127142A (zh) 一种基于广义神经注意力的物品推荐方法
Chen et al. IR-Rec: An interpretive rules-guided recommendation over knowledge graph
CN110619081A (zh) 一种基于交互图神经网络的新闻推送方法
CN110532471A (zh) 基于门控循环单元神经网络的主动学习协同过滤方法
CN112950324A (zh) 一种知识图谱辅助的成对排序个性化电商推荐方法及系统
CN113918833B (zh) 通过社交网络关系的图卷积协同过滤实现的产品推荐方法
CN111931054B (zh) 一种基于改进残差结构的序列推荐方法和系统
CN114780831A (zh) 基于Transformer的序列推荐方法及系统
CN113918834B (zh) 融合社交关系的图卷积协同过滤推荐方法
CN115982467A (zh) 一种去偏化用户多兴趣推荐方法、装置及存储介质
CN110781401A (zh) 一种基于协同自回归流实现的Top-n项目推荐方法
CN112699310A (zh) 基于深度神经网络的冷启动跨域混合推荐的方法及系统
CN113326384A (zh) 一种基于知识图谱的可解释推荐模型的构建方法
CN111125428B (zh) 基于评分预测函数拟合结构的时间相关电影推荐方法
CN115760271A (zh) 基于图神经网络的机电商品个性化推荐方法和系统
CN114741599A (zh) 基于知识增强和注意力机制的新闻推荐方法及系统
Mu et al. Auxiliary stacked denoising autoencoder based collaborative filtering recommendation
CN115630188A (zh) 视频推荐方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant