CN116385077A - 一种基于行为感知融合图卷积网络的多行为推荐系统 - Google Patents

一种基于行为感知融合图卷积网络的多行为推荐系统 Download PDF

Info

Publication number
CN116385077A
CN116385077A CN202310346441.6A CN202310346441A CN116385077A CN 116385077 A CN116385077 A CN 116385077A CN 202310346441 A CN202310346441 A CN 202310346441A CN 116385077 A CN116385077 A CN 116385077A
Authority
CN
China
Prior art keywords
behavior
user
network
graph
fusion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310346441.6A
Other languages
English (en)
Inventor
王悦阳
陈方大
楼朝立
夏云霓
高旻
熊庆宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN202310346441.6A priority Critical patent/CN116385077A/zh
Publication of CN116385077A publication Critical patent/CN116385077A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Strategic Management (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Finance (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种基于行为感知融合图卷积网络的多行为推荐系统,包括采样模块、模型训练模块和生成推荐列表模块;采样模块获取用户历史交互的正样本和未交互的负样本,并输入至模型训练模块;模型训练模块存储有行为感知融合图卷积网络模型;模型训练模块计算、融合多行为互信息和行为自信息,并计算得到用户对不同物品的偏好分数;生成推荐列表模块根据偏好分数对物品进行降序排列,将前N个物品写入推荐列表。本发明在每个图卷积层中设计了行为感知融合模块,该模块融合了行为之间的互信息和行为内的自信息,可以更准确地建模用户偏好,更进一步可以缓解行为误差传播,提高推荐性能。

Description

一种基于行为感知融合图卷积网络的多行为推荐系统
技术领域
本发明涉及多行为推荐系统技术领域,具体是一种基于行为感知融合图卷积网络的多行为推荐系统。
背景技术
推荐系统已广泛应用于各种网络平台,如在线购物网站(如亚马逊、淘宝)、视频网站(如Netflix、Youtube)等,有效缓解信息过载,提升用户体验,提升平台收益。在过去的十年中,推荐系统引起了众多研究者的关注。
近年来,推荐系统的一个热门研究方向是多行为推荐,利用多种类型的行为交互来完成推荐任务。在现实场景中,单个目标行为交互(例如,购买)的数量远远少于其他行为交互(例如,查看、收藏、添加到购物车)。基于这一观察,研究人员发现利用各种行为交互可以更好地捕捉用户偏好。一个原因是,如果只处理目标行为交互,推荐系统可能会受到数据稀疏性的影响。利用其他行为交互可以提高推荐性能。另一个原因是不同类型的行为代表了不同的语义,反映了用户的偏好。区分不同行为的影响,可以得到更准确的推荐结果。
随着图神经网络技术的快速发展,一些研究人员尝试在推荐任务中基于图神经网络建模用户-物品之间的交互。尽管基于图神经网络的推荐系统是有效的,但仍存在两个挑战:第一、无行为误差传播的特征学习。图神经网络作为一种先进的技术,可以有效地聚合邻居节点信息。现有的多行为推荐方法大多基于多行为进行高跳图神经网络。然而,随着图神经网络层数的增加,基于辅助行为的图神经网络会导致偏好信号中噪声的累积,即行为误差传播。第二、个性化行为模式建模。每个用户都有独特的行为模式,基于用户个性化行为模式,利用辅助行为交互来帮助预测基于用户个性化行为模式的未来目标行为交互是很有帮助的。
发明内容
本发明的目的是提供一种基于行为感知融合图卷积网络的多行为推荐系统,包括采样模块、模型训练模块和生成推荐列表模块;
所述采样模块获取用户历史交互的正样本和未交互的负样本数据,并输入至模型训练模块;
所述模型训练模块存储有行为感知融合图卷积网络模型;
所述模型训练模块首先随机初始化用户与物品嵌入参数,输入至行为感知融合图卷积网络模型,然后利用采样模块的正样本、负样本数据对行为感知融合图卷积网络模型进行训练,计算、融合多行为互信息和行为自信息,并计算得到用户对不同物品的偏好分数,将偏好分数传输至生成推荐列表模块;
用户与物品嵌入是指特征向量,是模型权重参数的一部分。正负样本是指训练数据,用于模型训练。
所述生成推荐列表模块根据偏好分数对物品进行降序排列,将前N个物品写入推荐列表。
进一步,所述行为感知融合图卷积网络模型包括L层图卷积网络,每层图卷积网络均搭载有行为感知融合模块。
进一步,所述用户-物品正样本包括用户、用户历史交互与对应的交互物品;
所述用户-物品负样本包括用户与未观测到交互的物品。
进一步,计算、融合多行为互信息和行为自信息的步骤包括:
1)基于用户多种行为的交互历史,构建不同行为下的用户-物品交互矩阵;矩阵中的每个元素表示用户和对应物品在对应行为下是否存在交互;
2)初始化不同行为下用户和物品的嵌入表示,分别记为
Figure BDA0004159923180000021
r=1,2,3…R;下标u表示用户;下标i表示物品;R表示行为种类个数;
3)上下堆叠用户和物品的嵌入矩阵,得到图卷积网络中的节点嵌入,记为
Figure BDA0004159923180000022
4)基于节点嵌入
Figure BDA0004159923180000023
计算第l层图卷积网络节点信息传播输出
Figure BDA0004159923180000024
l初始值为1;/>
Figure BDA0004159923180000025
表示第r个行为下带有自环的用户-物品交互矩阵,其中/>
Figure BDA0004159923180000026
表示单位矩阵,/>
Figure BDA0004159923180000027
表示第r个行为下用户-物品交互矩阵;/>
Figure BDA0004159923180000028
表示/>
Figure BDA0004159923180000029
的度数矩阵,/>
Figure BDA00041599231800000210
是权重矩阵;
5)行为感知融合模块计算第l层图卷积网络的多行为互信息
Figure BDA00041599231800000211
和行为自信息
Figure BDA00041599231800000212
6)行为感知融合模块将多行为互信息
Figure BDA00041599231800000213
和行为自信息/>
Figure BDA00041599231800000214
进行融合,得到第l层图卷积网络的节点嵌入信息融合/>
Figure BDA00041599231800000215
Figure BDA00041599231800000216
f(·)为融合函数;
7)令l=l+1,并返回步骤4),直至得到第L层图卷积网络的节点嵌入信息融合;
8)将第L层图卷积网络不同行为下的节点嵌入信息进行融合,得到节点嵌入融合信息
Figure BDA0004159923180000031
g(·)为融合函数;L表示总的网络层数;
9)对节点嵌入融合信息ε*进行切分,得到用户嵌入矩阵
Figure BDA0004159923180000032
和物品嵌入矩阵/>
Figure BDA0004159923180000033
并计算用户u对物品的偏好分数;
10)基于正样本的偏好分数与负样本的偏好分数,利用损失函数Loss对行为感知融合图卷积网络模型的参数进行更新。
进一步,第l层图卷积网络的多行为互信息
Figure BDA0004159923180000034
如下所示:
Figure BDA0004159923180000035
式中,||(·)表示向量的切片拼接;
Figure BDA0004159923180000036
表示向量的第h个切片,每个切片大小为d/H;/>
Figure BDA0004159923180000037
表示值变量;r,r′=1,2,3…R;
其中,归一化的行为相似度
Figure BDA0004159923180000038
如下所示:
Figure BDA0004159923180000039
Figure BDA00041599231800000310
Figure BDA00041599231800000311
Figure BDA00041599231800000312
Figure BDA00041599231800000313
式中,
Figure BDA00041599231800000314
为中间参量;/>
Figure BDA00041599231800000315
表示权重参数矩阵;/>
Figure BDA00041599231800000316
Figure BDA00041599231800000317
为互信息计算中的查询变量、关键字变量和值变量;/>
Figure BDA00041599231800000318
表示/>
Figure BDA00041599231800000319
中每个行向量的第h个切片,每个切片大小为d/H;h=1,2,…,H。/>
Figure BDA00041599231800000320
表示关键字变量;
Figure BDA00041599231800000321
表示查询变量。
进一步,第l层图卷积网络的行为自信息
Figure BDA00041599231800000322
如下所示:
Figure BDA00041599231800000323
式中,
Figure BDA0004159923180000041
为权重参数矩阵。
进一步,所述损失函数Loss如下所示:
Figure BDA0004159923180000042
式中,
Figure BDA0004159923180000043
表示成对的训练数据;/>
Figure BDA0004159923180000044
表示观测到的交互;/>
Figure BDA0004159923180000045
表示没有观测到的交互;σ(·)表示sigmoid函数;Θ表示所有的可训练参数;λ表示L2正则化系数。/>
Figure BDA0004159923180000046
表示用户u对物品i、物品j的偏好分数。
进一步,所述可训练参数包括用户的初始嵌入
Figure BDA0004159923180000047
物品的初始嵌入/>
Figure BDA0004159923180000048
和各模块的权重参数/>
Figure BDA0004159923180000049
进一步,用户u对物品i的偏好分数如下所示:
Figure BDA00041599231800000410
式中,
Figure BDA00041599231800000411
和/>
Figure BDA00041599231800000412
分别表示用户u和物品i的最终嵌入。
本发明的技术效果是毋庸置疑的,本发明在每个图卷积层中创新性地设计了行为感知融合模块,该模块融合了行为之间的互信息和行为内的自信息,可以更准确地建模用户偏好,更进一步可以缓解行为误差传播,提高推荐性能。
本发明提供一种基于行为感知融合图卷积网络的新框架,该框架通过行为感知融合模块学习用户的个性化行为模式,并将其应用于每个图卷积层以缓解行为误差的传播。
本发明通过建模用户个性化行为模式,缓解图神经网络多行为推荐中行为误差传播问题,以最小化观测交互与未观测交互之间的误差为目标,最终实现提高推荐性能。
附图说明
图1为本发明整体模型框架图;
图2为本发明中每个图卷积层中不同行为下节点信息传播示意图(以“喜爱”行为为例);
图3为本发明中每个图卷积层中不同行为间互信息计算示意图。
具体实施方式
下面结合实施例对本发明作进一步说明,但不应该理解为本发明上述主题范围仅限于下述实施例。在不脱离本发明上述技术思想的情况下,根据本领域普通技术知识和惯用手段,做出各种替换和变更,均应包括在本发明的保护范围内。
实施例1:
参见图1至图3,一种基于行为感知融合图卷积网络的多行为推荐系统,包括采样模块、模型训练模块和生成推荐列表模块;
所述采样模块获取用户历史交互的正样本和未交互的负样本数据,并输入至模型训练模块;
所述模型训练模块存储有行为感知融合图卷积网络模型;
所述模型训练模块首先随机初始化用户与物品嵌入参数,输入至行为感知融合图卷积网络模型,然后利用采样模块的正样本、负样本数据对行为感知融合图卷积网络模型进行训练,计算、融合多行为互信息和行为自信息,并计算得到用户对不同物品的偏好分数,将偏好分数传输至生成推荐列表模块;
用户与物品嵌入是指特征向量,是模型权重参数的一部分。正负样本是指训练数据,用于模型训练。
所述生成推荐列表模块根据偏好分数对物品进行降序排列,将前N个物品写入推荐列表。
实施例2:
一种基于行为感知融合图卷积网络的多行为推荐系统,主要内容见实施例1,进一步的,所述行为感知融合图卷积网络模型包括L层图卷积网络,每层图卷积网络均搭载有行为感知融合模块。
实施例3:
一种基于行为感知融合图卷积网络的多行为推荐系统,主要内容见实施例1-2任一项,进一步的,所述用户-物品正样本包括用户、用户历史交互与对应的交互物品;
所述用户-物品负样本包括用户与未观测到交互的物品。
实施例4:
一种基于行为感知融合图卷积网络的多行为推荐系统,主要内容见实施例1-3任一项,进一步的,计算、融合多行为互信息和行为自信息的步骤包括:
1)基于用户多种行为的交互历史,构建不同行为下的用户-物品交互矩阵;矩阵中的每个元素表示用户和对应物品在对应行为下是否存在交互;
2)初始化不同行为下用户和物品的嵌入表示,分别记为
Figure BDA0004159923180000051
r=1,2,3…R;下标u表示用户;下标i表示物品;R表示行为种类个数;
3)上下堆叠用户和物品的嵌入矩阵,得到图卷积网络中的节点嵌入,记为
Figure BDA0004159923180000061
4)基于节点嵌入
Figure BDA0004159923180000062
计算第l层图卷积网络节点信息传播输出
Figure BDA0004159923180000063
l初始值为1;/>
Figure BDA0004159923180000064
表示第r个行为下带有自环的用户-物品交互矩阵,其中/>
Figure BDA0004159923180000065
表示单位矩阵,/>
Figure BDA0004159923180000066
表示第r个行为下用户-物品交互矩阵;/>
Figure BDA0004159923180000067
表示/>
Figure BDA0004159923180000068
的度数矩阵,/>
Figure BDA0004159923180000069
是权重矩阵;
5)行为感知融合模块计算第l层图卷积网络的多行为互信息
Figure BDA00041599231800000610
和行为自信息
Figure BDA00041599231800000611
6)行为感知融合模块将多行为互信息
Figure BDA00041599231800000612
和行为自信息/>
Figure BDA00041599231800000613
进行融合,得到第l层图卷积网络的节点嵌入信息融合/>
Figure BDA00041599231800000614
Figure BDA00041599231800000615
f(·)为融合函数;
7)令l=l+1,并返回步骤4),直至得到第L层图卷积网络的节点嵌入信息融合;
8)将第L层图卷积网络不同行为下的节点嵌入信息进行融合,得到节点嵌入融合信息
Figure BDA00041599231800000616
g(·)为融合函数;L表示总的网络层数;
9)对节点嵌入融合信息ε*进行切分,得到用户嵌入矩阵
Figure BDA00041599231800000617
和物品嵌入矩阵/>
Figure BDA00041599231800000618
并计算用户u对物品的偏好分数;
10)基于正样本的偏好分数与负样本的偏好分数,利用损失函数Loss对行为感知融合图卷积网络模型的参数进行更新。
实施例5:
一种基于行为感知融合图卷积网络的多行为推荐系统,主要内容见实施例4,进一步的,第l层图卷积网络的多行为互信息
Figure BDA00041599231800000619
如下所示:
Figure BDA00041599231800000620
式中,||(·)表示向量的切片拼接;
Figure BDA00041599231800000621
表示向量的第h个切片,每个切片大小为d/H;/>
Figure BDA00041599231800000622
表示值变量;r,r′=1,2,3…R;
其中,归一化的行为相似度
Figure BDA00041599231800000623
如下所示:
Figure BDA00041599231800000624
Figure BDA0004159923180000071
Figure BDA0004159923180000072
Figure BDA0004159923180000073
Figure BDA0004159923180000074
式中,
Figure BDA0004159923180000075
为中间参量;/>
Figure BDA0004159923180000076
表示权重参数矩阵;/>
Figure BDA0004159923180000077
Figure BDA00041599231800000723
为互信息计算中的查询变量、关键字变量和值变量;/>
Figure BDA0004159923180000078
表示/>
Figure BDA0004159923180000079
中每个行向量的第h个切片,每个切片大小为d/H;h=1,2,…,H。/>
Figure BDA00041599231800000710
表示关键字变量;
Figure BDA00041599231800000711
表示查询变量。
实施例6:
一种基于行为感知融合图卷积网络的多行为推荐系统,主要内容见实施例4-5任一项,进一步的,第l层图卷积网络的行为自信息
Figure BDA00041599231800000712
如下所示:
Figure BDA00041599231800000713
式中,
Figure BDA00041599231800000714
为权重参数矩阵。
实施例7:
一种基于行为感知融合图卷积网络的多行为推荐系统,主要内容见实施例4-6任一项,进一步的,所述损失函数Loss如下所示:
Figure BDA00041599231800000715
式中,
Figure BDA00041599231800000716
表示成对的训练数据;/>
Figure BDA00041599231800000717
表示观测到的交互;/>
Figure BDA00041599231800000718
表示没有观测到的交互;σ(·)表示sigmoid函数;Θ表示所有的可训练参数;λ表示L2正则化系数。/>
Figure BDA00041599231800000719
表示用户u对物品i、物品j的偏好分数。
实施例8:
一种基于行为感知融合图卷积网络的多行为推荐系统,主要内容见实施例7,进一步的,所述可训练参数包括用户的初始嵌入
Figure BDA00041599231800000720
物品的初始嵌入/>
Figure BDA00041599231800000721
和各模块的权重参数/>
Figure BDA00041599231800000722
实施例9:
一种基于行为感知融合图卷积网络的多行为推荐系统,主要内容见实施例4-8任一项,进一步的,用户u对物品i的偏好分数如下所示:
Figure BDA0004159923180000081
式中,
Figure BDA0004159923180000082
和/>
Figure BDA0004159923180000083
分别表示用户u和物品i的最终嵌入。
实施例10:
一种计算机可读存储介质,其上存储有实施例1-9任一项所述基于行为感知融合图卷积网络的多行为推荐系统的计算机程序。
当该计算机程序被调用时,执行的步骤包括:
1)所述采样模块获取用户历史交互的正样本和未交互的负样本数据,并输入至模型训练模块;
2)所述模型训练模块首先随机初始化用户与物品嵌入参数,输入至行为感知融合图卷积网络模型,然后利用采样模块的正样本、负样本数据对行为感知融合图卷积网络模型进行训练,计算、融合多行为互信息和行为自信息,并计算得到用户对不同物品的偏好分数,将偏好分数传输至生成推荐列表模块;
3)用户与物品嵌入是指特征向量,是模型权重参数的一部分。正负样本是指训练数据,用于模型训练。
4)所述生成推荐列表模块根据偏好分数对物品进行降序排列,将前N个物品写入推荐列表。
实施例11:
一种基于行为感知融合图卷积网络的多行为推荐系统,主要内容见实施例1-10任一项,进一步的,用户与物品嵌入是指特征向量,是模型权重参数的一部分。正负样本是指训练数据,用于模型训练。
实施例12:
一种基于行为感知融合图卷积网络的多行为推荐系统,包括采样模块、模型训练模块和生成推荐列表模块;
所述采样模块获取用户历史交互的正样本和未交互的负样本数据,并输入至模型训练模块;
所述模型训练模块存储有行为感知融合图卷积网络模型;
所述模型训练模块首先随机初始化用户与物品嵌入参数,输入至行为感知融合图卷积网络模型,计算、融合多行为互信息和行为自信息,并计算得到用户对不同物品的偏好分数,然后按照上述过程基于采样模块的正负样本数据进行模型训练,将训练拟合的模型输出的偏好分数传输至生成推荐列表模块;
用户与物品嵌入是指特征向量,是模型权重参数的一部分。正负样本是指训练数据,用于模型训练。
所述生成推荐列表模块根据偏好分数对物品进行降序排列,将前N个物品写入推荐列表。
所述行为感知融合图卷积网络模型包括L层图卷积网络,每层图卷积网络均搭载有行为感知融合模块。
所述用户-物品正样本包括用户、用户历史交互与对应的交互物品;
所述用户-物品负样本包括用户与未观测到交互的物品。
计算、融合多行为互信息和行为自信息的步骤包括:
1)基于用户多种行为的交互历史,构建不同行为下的用户-物品交互矩阵;矩阵中的每个元素表示用户和对应物品在对应行为下是否存在交互;
2)初始化不同行为下用户和物品的嵌入表示,分别记为
Figure BDA0004159923180000091
r=1,2,3…R;下标u表示用户;下标i表示物品;R表示行为种类个数;
3)上下堆叠用户和物品的嵌入矩阵,得到图卷积网络中的节点嵌入,记为
Figure BDA0004159923180000092
4)基于节点嵌入
Figure BDA0004159923180000093
计算第l层图卷积网络节点信息传播输出
Figure BDA0004159923180000094
l初始值为1;/>
Figure BDA0004159923180000095
表示第r个行为下带有自环的用户-物品交互矩阵,其中/>
Figure BDA0004159923180000096
表示单位矩阵,/>
Figure BDA0004159923180000097
表示第r个行为下用户-物品交互矩阵;/>
Figure BDA0004159923180000098
表示/>
Figure BDA0004159923180000099
的度数矩阵,/>
Figure BDA00041599231800000910
是权重矩阵;
5)行为感知融合模块计算第l层图卷积网络的多行为互信息
Figure BDA00041599231800000911
和行为自信息
Figure BDA00041599231800000912
6)行为感知融合模块将多行为互信息
Figure BDA00041599231800000913
和行为自信息/>
Figure BDA00041599231800000914
进行融合,得到第l层图卷积网络的节点嵌入信息融合/>
Figure BDA00041599231800000915
Figure BDA00041599231800000916
f(·)为融合函数;
7)令l=l+1,并返回步骤4),直至得到第L层图卷积网络的节点嵌入信息融合;
8)将第L层图卷积网络不同行为下的节点嵌入信息进行融合,得到节点嵌入融合信息
Figure BDA00041599231800000917
g(·)为融合函数;L表示总的网络层数;
9)对节点嵌入融合信息ε*进行切分,得到用户嵌入矩阵
Figure BDA0004159923180000101
和物品嵌入矩阵/>
Figure BDA0004159923180000102
并计算用户u对物品的偏好分数;
10)基于正样本的偏好分数与负样本的偏好分数,利用损失函数Loss对行为感知融合图卷积网络模型的参数进行更新。
第l层图卷积网络的多行为互信息
Figure BDA0004159923180000103
如下所示:
Figure BDA0004159923180000104
式中,||(·)表示向量的切片拼接;
Figure BDA0004159923180000105
表示向量的第h个切片,每个切片大小为d/H;/>
Figure BDA0004159923180000106
表示值变量;r,r′=1,2,3…R;
其中,归一化的行为相似度
Figure BDA0004159923180000107
如下所示:
Figure BDA0004159923180000108
Figure BDA0004159923180000109
Figure BDA00041599231800001010
Figure BDA00041599231800001011
Figure BDA00041599231800001012
式中,
Figure BDA00041599231800001013
为中间参量;/>
Figure BDA00041599231800001014
表示权重参数矩阵;/>
Figure BDA00041599231800001015
Figure BDA00041599231800001016
为互信息计算中的查询变量、关键字变量和值变量;/>
Figure BDA00041599231800001017
表示/>
Figure BDA00041599231800001018
中每个行向量的第h个切片,每个切片大小为d/H;h=1,2,…,H。/>
Figure BDA00041599231800001019
表示关键字变量;
Figure BDA00041599231800001020
表示查询变量。
第l层图卷积网络的行为自信息
Figure BDA00041599231800001021
如下所示:
Figure BDA00041599231800001022
式中,
Figure BDA00041599231800001023
为权重参数矩阵。
所述损失函数Loss如下所示:
Figure BDA0004159923180000111
式中,
Figure BDA0004159923180000112
表示成对的训练数据;/>
Figure BDA0004159923180000113
表示观测到的交互;/>
Figure BDA0004159923180000114
表示没有观测到的交互;σ(·)表示sigmoid函数;Θ表示所有的可训练参数;λ表示L2正则化系数。/>
Figure BDA0004159923180000115
表示用户u对物品i、物品j的偏好分数。
所述可训练参数包括用户的初始嵌入
Figure BDA0004159923180000116
物品的初始嵌入/>
Figure BDA0004159923180000117
和各模块的权重参数/>
Figure BDA0004159923180000118
用户u对物品i的偏好分数如下所示:
Figure BDA0004159923180000119
式中,
Figure BDA00041599231800001110
和/>
Figure BDA00041599231800001111
分别表示用户u和物品i的最终嵌入。
实施例13:
参见图1至图3,一种基于行为感知融合图卷积网络的多行为推荐系统,包括采样模块、模型训练、生成推荐列表。
模型训练模块采用BPR函数的成对损失作为目标函数,所以需要通过采样模块生成正样本与负样本。通过采样模块对用户与物品进行成对选取以构建模型训练数据,将观测到的用户历史交互与对应交互物品视为正样本,用户与未观测到交互的物品作为负样本。
基于上述采样得到的正负样本对输入模型进行训练。首先基于用户多种行为的交互历史,构建多种用户-物品交互矩阵,矩阵中的每个元素表示用户和对应物品在对应行为下是否存在交互。
接着初始化行为下用户和物品的嵌入表示,
Figure BDA00041599231800001112
Figure BDA00041599231800001113
其中R表示行为种类个数。上下堆叠用户和物品的嵌入矩阵可得到图卷积网络中的节点嵌入为
Figure BDA00041599231800001114
然后经过不同行为下的节点信息传播模块,可以表示为
Figure BDA00041599231800001115
其中/>
Figure BDA00041599231800001116
是第l层不同行为下节点信息传播的输出,
Figure BDA00041599231800001117
表示第r个行为下带有自环的用户-物品交互矩阵,/>
Figure BDA00041599231800001118
表示单位矩阵,/>
Figure BDA00041599231800001119
表示第r个行为下用户-物品交互矩阵,/>
Figure BDA00041599231800001120
表示/>
Figure BDA00041599231800001121
的度数矩阵,/>
Figure BDA00041599231800001122
是权重矩阵。
Figure BDA00041599231800001123
输入行为感知的融合模块,该模块结合不同行为之间的互信息与不同行为的自信息进一步学习用户和物品的特征。计算多行为互信息需要先计算不同行为之间的影响权重,表示如下,
Figure BDA00041599231800001124
Figure BDA0004159923180000121
Figure BDA0004159923180000122
Figure BDA0004159923180000123
Figure BDA0004159923180000124
其中
Figure BDA0004159923180000125
表示权重参数矩阵,/>
Figure BDA0004159923180000126
表示向量的第h个切片,每个切片大小为d/H。
按照对每个切片加权求和然后拼接的方式获得最终多行为互信息,表示为
Figure BDA0004159923180000127
其中||(·)表示向量的切片拼接。
计算不同行为里的自信息,通过全连接层提取不同行为潜在的用户偏好,表示为
Figure BDA0004159923180000128
其中/>
Figure BDA0004159923180000129
为权重参数矩阵。
通过一个融合函数f(·)将不同行为间的互信息与不同行为下的自信息进行融合,表示为
Figure BDA00041599231800001210
由此获得了基于行为感知融合图卷积网络的每一层输出。
然后基于模型最后一层输出的用户与物品嵌入,通过用户与物品嵌入的内积计算用户的偏好分数。先是通过一个融合函数g(·)将网络最后一层里不同行为下的节点嵌入信息融合,表示为
Figure BDA00041599231800001211
Figure BDA00041599231800001212
其中L表示总的网络层数。将节点嵌入切分成用户和物品分别的嵌入矩阵/>
Figure BDA00041599231800001213
对于用户u和物品i,通过简单的内积得到用户u对物品的偏好分数,表示为/>
Figure BDA00041599231800001214
其中/>
Figure BDA00041599231800001215
和/>
Figure BDA00041599231800001216
分别表示用户u和物品i的最终嵌入。将此偏好分数作为对用户交互预测的概率的衡量,作为多行为推荐系统的预测输出。
最后,根据BPR损失函数优化基于行为感知融合的图卷积网络模型,以正样本的预测分数与负样本的预测分数差值的对数值进行计算,可表示为如下公式:
Figure BDA00041599231800001217
其中,
Figure BDA0004159923180000131
表示成对的训练数据,/>
Figure BDA0004159923180000132
表示观测到的交互,/>
Figure BDA0004159923180000133
表示没有观测到的交互。σ(·)表示sigmoid函数,Θ表示所有的可训练参数,λ表示L2正则化系数,以防止过拟合。
在生成推荐列表模块,基于达到拟合的模型,对大量用户,基于所有的物品,按照偏好分数从高到低对所有物品进行排序生成推荐物品列表,排序靠前的N个物品即为对用户u生成的推荐物品列表。
实施例14:
一种基于行为感知融合图卷积网络的多行为推荐系统有效性的验证实验,内容如下:
本发明通过在公开数据集上进行对比实验来说明方法的有效性。本发明分别在Taobao和IJCAI两个公开数据集上进行实验。Taobao是中国最大的电子商务平台之一,该数据集包含用户和商品之间的四种行为交互,即查看、收藏、添加到购物车和购买。IJCAI数据集由国际人工智能联合会议组织竞赛公布。该数据集包括与淘宝相同的四种类型的行为交互,并且具有不均衡的多行为交互。
本发明所述基于行为感知融合图卷积网络的多行为推荐方法,采用Top-K推荐方法。采用了命中率(Hit Ratio,HR)和归一化折损累计增益(NormalizedDiscountedCumulative Gain,NDCG)两种评价指标来评估模型。HR@K衡量成功推荐项目的前k推荐列表的比例,强调成功推荐的正确性。NDCG@K的Top-K排名越靠前,
得分越高,强调推荐列表的准确性。
本发明用Adam优化器优化所有模型,训练批大小固定为2048。所有模型的嵌入大小都固定为32。对于基于采样的方法,本发明将负采样数设置为4,这是一个表现良好的经验值。采用Xavier初始化参数。在训练过程中,所有比较模型都采用了原论文中的最优设置,通过搜索来合理设置每个模型的学习率。学习率在{1e-5,5e-5,1e-4,5e-4,1e-3}范围内调整,L2正则化系数在{1e-5,1e-4,1e-3,1e-2}范围内选择。此外,本发明使用提前停止来检测过拟合,如果验证集上的HR@10在30次迭代内没有增加,则训练过程将停止。本发明在上述两个数据集上对9个模型进行了对比实验,实验结果如表1和表2所示。
表1 BFGCN与对比模型在Taobao数据集上的性能比较
Figure BDA0004159923180000141
注:H@K表示HR@K,N@K表示NDCG@K。
表2BFGCN与对比模型在IJCAI数据集上的性能比较
Figure BDA0004159923180000151
注:H@K表示HR@K,N@K表示NDCG@K。
本发明提出的方法优于所有对比模型。本发明方法在两个数据集所有HR@K和NDGC@K指标上都取得了最优的性能。其中,HR和NDCG在淘宝数据集上的平均提高率分别达到52.86%和51.86%。HR和NDCG在IJCAI数据集上的平均提高率分别为12.79%和14.26%。实验结果证明了本发明方法在提高推荐性能方面的有效性。
本发明提出的方法在Taobao数据集上比IJCAI数据集上性能提高更显著,即在Taobao数据集上的性能提升要高于IJCAI数据集上的性能提升。一个可能的原因是,Taobao数据集的目标行为交互较少,辅助行为的偏好信号比较嘈杂。因此,本发明的方法通过减少行为错误传播,更有效地提高了推荐性能。

Claims (9)

1.一种基于行为感知融合图卷积网络的多行为推荐系统,其特征在于:包括采样模块、模型训练模块和生成推荐列表模块。
所述采样模块获取用户历史交互的正样本和未交互的负样本数据,并输入至模型训练模块。
所述模型训练模块存储有行为感知融合图卷积网络模型;
所述模型训练模块首先随机初始化用户与物品嵌入参数,输入至行为感知融合图卷积网络模型,然后利用采样模块的正样本、负样本数据对行为感知融合图卷积网络模型进行训练,计算、融合多行为互信息和行为自信息,并计算得到用户对不同物品的偏好分数,将偏好分数传输至生成推荐列表模块;
所述生成推荐列表模块根据偏好分数对物品进行降序排列,将前N个物品写入推荐列表。
2.根据权利要求1所述的一种基于行为感知融合图卷积网络的多行为推荐系统,其特征在于:所述行为感知融合图卷积网络模型包括L层图卷积网络,每层图卷积网络均搭载有行为感知融合模块。
3.根据权利要求1所述的一种基于行为感知融合图卷积网络的多行为推荐系统,其特征在于:所述用户-物品正样本包括用户、用户历史交互与对应的交互物品;
所述用户-物品负样本包括用户与未观测到交互的物品。
4.根据权利要求1所述的一种基于行为感知融合图卷积网络的多行为推荐系统,其特征在于:计算、融合多行为互信息和行为自信息的步骤包括:
1)基于用户多种行为的交互历史,构建不同行为下的用户-物品交互矩阵;矩阵中的每个元素表示用户和对应物品在对应行为下是否存在交互;
2)初始化不同行为下用户和物品的嵌入表示,分别记为
Figure FDA0004159923170000011
r=1,2,3…R;下标u表示用户;下标i表示物品;R表示行为种类个数;
3)上下堆叠用户和物品的嵌入矩阵,得到图卷积网络中的节点嵌入,记为
Figure FDA0004159923170000012
4)基于节点嵌入
Figure FDA0004159923170000013
计算第l层图卷积网络节点信息传播输出
Figure FDA0004159923170000014
l初始值为1;/>
Figure FDA0004159923170000015
表示第r个行为下带有自环的用户-物品交互矩阵,其中/>
Figure FDA0004159923170000016
表示单位矩阵,/>
Figure FDA0004159923170000017
表示第r个行为下用户-物品交互矩阵;/>
Figure FDA0004159923170000018
表示/>
Figure FDA0004159923170000019
的度数矩阵,/>
Figure FDA00041599231700000110
是权重矩阵;
5)行为感知融合模块计算第l层图卷积网络的多行为互信息
Figure FDA0004159923170000021
和行为自信息/>
Figure FDA0004159923170000022
6)行为感知融合模块将多行为互信息
Figure FDA0004159923170000023
和行为自信息/>
Figure FDA0004159923170000024
进行融合,得到第l层图卷积网络的节点嵌入信息融合/>
Figure FDA0004159923170000025
Figure FDA0004159923170000026
f(·)为融合函数;
7)令l=l+1,并返回步骤4),直至得到第L层图卷积网络的节点嵌入信息融合;
8)将第L层图卷积网络不同行为下的节点嵌入信息进行融合,得到节点嵌入融合信息
Figure FDA0004159923170000027
g(·)为融合函数;L表示总的网络层数;
9)对节点嵌入融合信息ε*进行切分,得到用户嵌入矩阵
Figure FDA0004159923170000028
和物品嵌入矩阵/>
Figure FDA0004159923170000029
并计算用户u对物品的偏好分数;
10)基于正样本的偏好分数与负样本的偏好分数,利用损失函数Loss对行为感知融合图卷积网络模型的参数进行更新。
5.根据权利要求4所述的一种基于行为感知融合图卷积网络的多行为推荐系统,其特征在于,第l层图卷积网络的多行为互信息
Figure FDA00041599231700000210
如下所示:
Figure FDA00041599231700000211
式中,||(·)表示向量的切片拼接;
Figure FDA00041599231700000212
表示向量的第h个切片,每个切片大小为d/H;/>
Figure FDA00041599231700000213
表示值变量;r,r′=1,2,3…R;
其中,归一化的行为相似度
Figure FDA00041599231700000214
如下所示:
Figure FDA00041599231700000215
Figure FDA00041599231700000216
Figure FDA00041599231700000217
Figure FDA00041599231700000218
Figure FDA0004159923170000031
式中,
Figure FDA0004159923170000032
为中间参量;/>
Figure FDA0004159923170000033
表示权重参数矩阵;/>
Figure FDA0004159923170000034
Figure FDA0004159923170000035
为互信息计算中的查询变量、关键字变量和值变量;/>
Figure FDA0004159923170000036
表示/>
Figure FDA0004159923170000037
中每个行向量的第h个切片,每个切片大小为d/H;h=1,2,…,H。/>
Figure FDA0004159923170000038
表示关键字变量;
Figure FDA0004159923170000039
表示查询变量。
6.根据权利要求4所述的一种基于行为感知融合图卷积网络的多行为推荐系统,其特征在于,第l层图卷积网络的行为自信息
Figure FDA00041599231700000310
如下所示:
Figure FDA00041599231700000311
式中,
Figure FDA00041599231700000312
为权重参数矩阵。
7.根据权利要求4所述的一种基于行为感知融合图卷积网络的多行为推荐系统,其特征在于,所述损失函数Loss如下所示:
Figure FDA00041599231700000313
式中,
Figure FDA00041599231700000314
表示成对的训练数据;/>
Figure FDA00041599231700000315
表示观测到的交互;/>
Figure FDA00041599231700000316
表示没有观测到的交互;σ(·)表示sigmoid函数;Θ表示所有的可训练参数;λ表示L2正则化系数。/>
Figure FDA00041599231700000317
表示用户u对物品i、物品j的偏好分数。
8.根据权利要求7所述的一种基于行为感知融合图卷积网络的多行为推荐系统,其特征在于,所述可训练参数包括用户的初始嵌入
Figure FDA00041599231700000318
物品的初始嵌入/>
Figure FDA00041599231700000319
和各模块的权重参数/>
Figure FDA00041599231700000320
9.根据权利要求4所述的一种基于行为感知融合图卷积网络的多行为推荐系统,其特征在于,用户u对物品i的偏好分数如下所示:
Figure FDA00041599231700000321
式中,
Figure FDA00041599231700000322
和/>
Figure FDA00041599231700000323
分别表示用户u和物品i的最终嵌入。
CN202310346441.6A 2023-04-03 2023-04-03 一种基于行为感知融合图卷积网络的多行为推荐系统 Pending CN116385077A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310346441.6A CN116385077A (zh) 2023-04-03 2023-04-03 一种基于行为感知融合图卷积网络的多行为推荐系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310346441.6A CN116385077A (zh) 2023-04-03 2023-04-03 一种基于行为感知融合图卷积网络的多行为推荐系统

Publications (1)

Publication Number Publication Date
CN116385077A true CN116385077A (zh) 2023-07-04

Family

ID=86965128

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310346441.6A Pending CN116385077A (zh) 2023-04-03 2023-04-03 一种基于行为感知融合图卷积网络的多行为推荐系统

Country Status (1)

Country Link
CN (1) CN116385077A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116910371A (zh) * 2023-09-07 2023-10-20 南京大数据集团有限公司 一种基于深层关系的推荐方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116910371A (zh) * 2023-09-07 2023-10-20 南京大数据集团有限公司 一种基于深层关系的推荐方法及系统
CN116910371B (zh) * 2023-09-07 2024-01-23 南京大数据集团有限公司 一种基于深层关系的推荐方法及系统

Similar Documents

Publication Publication Date Title
CN111310063B (zh) 基于神经网络的记忆感知门控因子分解机物品推荐方法
CN110717098B (zh) 基于元路径的上下文感知用户建模方法、序列推荐方法
CN112184391B (zh) 一种推荐模型的训练方法、介质、电子设备和推荐模型
CN111428147A (zh) 结合社交和兴趣信息的异源图卷积网络的社交推荐方法
CN112950324B (zh) 一种知识图谱辅助的成对排序个性化电商推荐方法及系统
CN113672811B (zh) 一种基于拓扑信息嵌入的超图卷积协同过滤推荐方法、系统及计算机可读存储介质
CN110910218A (zh) 一种基于深度学习的多行为迁移推荐方法
CN112861967A (zh) 基于异构图神经网络的社交网络异常用户检测方法及设备
CN113918832B (zh) 基于社交关系的图卷积协同过滤推荐系统
CN113918833B (zh) 通过社交网络关系的图卷积协同过滤实现的产品推荐方法
CN113918834B (zh) 融合社交关系的图卷积协同过滤推荐方法
Navgaran et al. Evolutionary based matrix factorization method for collaborative filtering systems
CN113239264A (zh) 基于元路径网络表示学习的个性化推荐方法及系统
CN113761359B (zh) 数据包推荐方法、装置、电子设备和存储介质
CN116757763A (zh) 基于知识图谱深度学习的电子商务推荐方法及系统
Wang et al. Feature subspace transfer for collaborative filtering
CN116385077A (zh) 一种基于行为感知融合图卷积网络的多行为推荐系统
Gan et al. DeepInteract: Multi-view features interactive learning for sequential recommendation
CN116071128A (zh) 一种基于多行为特征提取与自监督学习的多任务推荐方法
US20240037133A1 (en) Method and apparatus for recommending cold start object, computer device, and storage medium
CN113342994A (zh) 一种基于无采样协作知识图网络的推荐系统
Liu et al. Collaborative social deep learning for celebrity recommendation
Liu et al. CFDA: collaborative filtering with dual autoencoder for recommender system
Peng et al. CA-NCF: a category Assisted neural collaborative filtering approach for personalized recommendation
CN113239265B (zh) 基于连接矩阵的个性化推荐方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination