CN116628347B - 基于引导式图结构增强的对比学习推荐方法 - Google Patents
基于引导式图结构增强的对比学习推荐方法 Download PDFInfo
- Publication number
- CN116628347B CN116628347B CN202310890503.XA CN202310890503A CN116628347B CN 116628347 B CN116628347 B CN 116628347B CN 202310890503 A CN202310890503 A CN 202310890503A CN 116628347 B CN116628347 B CN 116628347B
- Authority
- CN
- China
- Prior art keywords
- user
- item
- score
- representing
- formula
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 230000003993 interaction Effects 0.000 claims abstract description 75
- 230000006870 function Effects 0.000 claims abstract description 31
- 238000012549 training Methods 0.000 claims abstract description 21
- 239000013598 vector Substances 0.000 claims abstract description 8
- 238000004364 calculation method Methods 0.000 claims abstract description 5
- 238000012360 testing method Methods 0.000 claims abstract description 5
- 238000012795 verification Methods 0.000 claims abstract description 5
- 238000007781 pre-processing Methods 0.000 claims abstract description 4
- 239000011159 matrix material Substances 0.000 claims description 27
- 230000009467 reduction Effects 0.000 claims description 25
- 230000002452 interceptive effect Effects 0.000 claims description 17
- 238000010586 diagram Methods 0.000 claims description 14
- 238000005457 optimization Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 6
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims description 3
- 230000004931 aggregating effect Effects 0.000 claims description 3
- 239000000047 product Substances 0.000 claims description 3
- 230000000717 retained effect Effects 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- 239000013589 supplement Substances 0.000 claims description 2
- 230000017105 transposition Effects 0.000 claims 1
- 238000013135 deep learning Methods 0.000 abstract description 2
- 230000000694 effects Effects 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000013459 approach Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Accounting & Taxation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Finance (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Biomedical Technology (AREA)
- Development Economics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及推荐系统及深度学习技术领域,尤其涉及一种基于引导式图结构增强的对比学习推荐方法。其包括以下步骤:在电子商务数据集中通过预处理得到训练集、验证集和测试集;对用户节点和物品节点进行嵌入参数初始化,生成节点嵌入信息;对每个用户建立一个由相似用户交互物品所组成的候选物品池;通过余玄相似度函数衡量用户节点嵌入和物品节点嵌入之间的相似度值;建立基于引导式图结构增强的对比学习推荐方法模型;根据最终的用户和物品嵌入向量,计算用户对物品的计算得分,实现物品推荐。
Description
技术领域
本发明涉及推荐系统及深度学习技术领域,尤其涉及一种基于引导式图结构增强的对比学习推荐方法。
背景技术
推荐系统在现实应用中越来越受到重视,尤其是在电商、社交网络等领域,推荐系统已经成为了吸引用户、提高用户留存率和销售额的重要手段。虽然协同过滤在推荐系统中已经被广泛应用,但是在大多数推荐场景中,用户更常使用隐式反馈表达偏好,这使得从基于CF的隐式反馈中学习用户偏好成为学术界和工业界的重要课题。近年来,图神经网络为开发CF方法提供了一种新的技术途径。GNN是一种基于图结构的深度学习模型,通过利用用户-物品交互图,基于GNN的CF模型在推荐性能上取得了实质性的改进。近期,基于增强图的对比学习方法在推荐系统中取得了显著的性能提升。这类方法通过对用户-物品交互图施加不同的增强操作,生成多个视图,然后通过最大化相同交互序列在不同视图下的表示相似度,来学习更优的用户和物品嵌入向量,它们采用了不同的图结构增强策略和自监督学习技术,如随机进行节点扰动、边扰动、子图扰动,它们共同目标是通过学习一致性高的表示来提升推荐效果。同时,它们也可以通过自监督学习来辅助监督推荐任务。
尽管上述方法取得了成功,但在针对图结构增强的有效性方面存在明显问题。首先传统的图增强技术虽然有一定的进展,但是缺乏很好的解释性,图结构增强往往是基于随机性或者宏观计算得分和设置阈值来进行图结构加边减边的操作,缺乏对用户需求的深入理解,此外,随机性或者设置阈值的方式添加的边和删减的边往往缺乏合理性解释,难以满足每个用户的实际需求。这种方法往往导致图结构的变化难以解释,且不能反映用户的真实意图。
发明内容
本发明针对现有技术的不足,研制针对每个用户的多样性优化策略和精确降噪策略,可以从每个用户自身喜好出发,进行细粒度的增强,来捕获用户潜在需求和兴趣个性化推荐的一种能够基于引导式图结构增强的对比学习推荐方法,该发明可以通过深入理解用户的交互行为和兴趣偏好,对交互图进行有针对性的增强操作,能够更好地满足用户的实际需求,增强用户对推荐系统的信任感和满意度,从而提高推荐系统模型的泛化能力和准确度。
本发明解决技术问题的技术方案为:
一种基于引导式图结构增强的对比学习推荐方法,包括如下步骤:
(a)在电子商务数据集中通过预处理得到训练集、验证集和测试集;
(b)利用训练集构建用户和物品购买交互的邻接矩阵,对用户节点和物品节点进行嵌入参数初始化,生成节点嵌入信息;
(c)根据训练集中的用户购买记录,通过公共物品所占比得到目标用户与其对应的相似用户集合,对每个用户建立一个由相似用户交互物品所组成的候选物品池,用以后续对目标用户交互记录进行补充;
(d)通过余玄相似度函数衡量用户节点嵌入和物品节点嵌入之间的相似度值,作为后续的图结构多样性增强和图结构精确降噪的对应边处理的依据;
(e)通过计算每个用户与其对应的物品池中物品相似度得分,取得分较高的物品,作为当前用户潜在喜欢的物品添加到交互记录上;
(f)根据添加多样性的图结构交互记录,计算当前用户与其交互物品的相似度得分,取得分较低的物品,在当前的用户交互记录上删除;
(g)建立基于引导式图结构增强的对比学习推荐方法模型;
(h)基于BPR损失函数和InfoNCE对比损失函数迭代N次,得到训练后的基于引导式图结构增强的对比学习推荐方法模型;
(i)根据最终的用户和物品嵌入向量,计算用户对物品的计算得分,实现物品推荐;
步骤(g)具体如下:
(g-1)通过公式获得多样性增强图/>习到的用户物品嵌入表示,式中/>和/>分别表示多样性增强图的用户和物品的嵌入表示,/>和/>分别表示用户和物品的初始化嵌入表示,/> 通过公式在多样性增强图/>上传递消息,通过聚合邻域信息来学习嵌入表示,其中H和G分别表示节点的嵌入信息和相应图结构的邻接矩阵信息,式中是多样性的加权图/>的交互链接的边缘权重,Nu和Ni分别表示在多样性加权图/>中用户u和物品i的一跳邻居集,/>和/>表示用户u和物品i在k层传播后的嵌入表示,当k=0时,它们被初始化为/>
(g-2)通过公式组合每一层学习到的节点嵌入,GNN输出的为用户嵌入表示/>和物品嵌入表示/>式中αk≥0,αx统一设置为1/(k+1)是分配给第k层的超参数,表示每层节点嵌入的重要性,k是K的子层集合,用来表示图卷积层数;
(g-3)通过公式获得精确降噪图/>学习到的用户物品嵌入表示,式中/>和/>分别表示精确降噪图的用户和物品的嵌入表示,GNN(H,G)模块同上(g-1)和(g-2)步骤;
步骤(h)具体如下:
(h-1)通过公式
计算得到BPR损失,其中表示多样性增强图/>的交互集合,/>表示在图/>中观察到用户u和物品i存在交互,/>表示在图/>中未观察到用户u和物品j存在交互,/>表示用户u对正样本i的得分,式中T为转置,其中/>和/>分别表示多样性增强图的用户和物品的嵌入表示,同理表示用户u对负样本j的得分,φ(·)为Sigmoid激活函数;
(h-2)通过公式采用对比损失来优化互信息的下限,其中/>τ是温度超参数,f(·,·)是余弦相似度函数,通过最小化辅助损失LMIM;
(h-3)通过公式得到模型的总体损失优化函数,通过多任务学习策略集成图多样性模块和图降噪模块,式中LBPR由公式(h-1)得到,表示BPR损失函数,LMIM由公式(h-2)得到,表示InfoNCE对比损失函数,λ1和λ2是分别控制降噪图损失和L2正则化强度的超参数;并且Θ={EU,EI}是模型参数集,||·||2为L2范数;
(h-4)利用BPR损失和InfoNCE对比损失通过Adam优化基于引导式图结构增强的对比学习推荐方法模型中的参数。
所述基于引导式图结构增强的对比学习推荐方法优选方案,步骤(b)包括如下步骤:
(b-1)在训练集中对于一组用户集合U和一组物品集合I的交互矩阵RN×M,其中N和M分别是用户和物品的数量,其中如果用户u∈U和物品i∈I存在交互,则元素rui=1,否则rui=0;或者基于交互矩阵构造用户-物品二部图G=(W,ω),其中节点集W由用户节点和物品节点构成,ω表示边的集合,对于非零元素rui都存在一条链接边;
(b-2)对用户节点和物品节点进行嵌入参数初始化分别生成用户节点的嵌入信息和物品节点的嵌入信息/>嵌入参数使用Xavier方法初始化,嵌入大小设置为64。
所述基于引导式图结构增强的对比学习推荐方法优选方案,步骤(c)包括如下步骤:
(c-1)通过公式衡量用户交互集之间的相似性,式中和/>分别代表数据集中用户i和用户j交互的物品集合;
(c-2)通过公式得到目标用户i的相似用户集合,式中JC(ui,uj)是用户i和用户j的相似性得分,根据得分情况选取得分最高的M1用户组成用户集合作为目标用户i的相似用户集合;
(c-3)通过公式将目标用户i的相似用户集合所交互的物品构建物品池/>并且去除目标用户i已交互的物品集合,式中/>和/>分别表示相似用户s所交互的物品集合和目标用户i所交互的物品集合,/>表示目标用户i的相似用户集合。
所述基于引导式图结构增强的对比学习推荐方法优选方案,步骤(d)包括如下步骤:
(d-1)通过公式学习到用户和物品的结构特征矩阵,式中/>和/>表示用户和物品的初始嵌入矩阵,/>为特征矩阵,d为特征嵌入的维度,N和M分别表示用户和物品的个数;
(d-2)通过公式得到每一个用户与其所对应物品池中物品集合的得分情况,式中/>和/>分别表示用户节点u和对应物品池中物品节点i的结构特征,<·,·>表示向量内积运算,||·||2表示L2范数函数;
(d-3)通过公式将得分的范围转换(0,1),式中是每一个用户与其所对应物品池中物品集合的得分情况,Su,i是用户u和对应物品池中物品i之间的可靠性得分,并且得分范围在(0,1)。
所述基于引导式图结构增强的对比学习推荐方法优选方案,步骤(e)包括如下步骤:
(e-1)通过公式得到每一个用户在物品池中获得的M2个潜在交互物品,式中M2表示每个用户添加潜在交互物品的个数,Su,i表示用户u和对应物品池中物品i之间的可靠性得分,如果满足条件,将得分作为当前用户和物品的交互边缘的权重,即rui=su,i否则rui=0,即可靠性得分低,不作为潜在交互链接加入到用户的潜在交互中;
(e-2)通过公式在原始交互矩阵基础上添加潜在交互用户物品的边缘信息,将二者结合在一起,进一步形成多样性增强图/>式中/>表示保留的用户u潜与交互物品i的边缘得分,rui表示原始交互矩阵的用户物品交互得分,/>表示多样性增强图/>的用户物品边缘得分。
所述基于引导式图结构增强的对比学习推荐方法优选方案,步骤(f)包括如下步骤:
通过公式对多样性增强图/>进行精确降噪处理,对每个用户在图/>中交互过的所有物品可靠度得分较低的边进行删除,删除噪声和不可靠交互,生成降噪图/>得分的计算方法由(d)提供,式中M3表示每个用户要删除噪声边的个数,表示多样性增强图/>的用户物品边缘得分,/>表示精确降噪图/>的用户物品边缘得分。
所述基于引导式图结构增强的对比学习推荐方法优选方案,步骤(i)包括如下步骤:通过公式计算得到用户对物品的预测得分y,式中T为转置,/>和/>分别表示多样性增强图的用户和物品的嵌入表示,根据预测得分y由高到低排序,实现物品推荐。
发明内容中提供的效果仅仅是实施例的效果,而不是发明所有的全部效果,上述技术方案具有如下优点或有益效果:
通过深入理解用户的交互行为和兴趣偏好,对交互图进行有针对性的增强操作,能够更好地满足用户的实际需求,增强用户对推荐系统的信任感和满意度,从而提高推荐系统模型的泛化能力和准确度。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
图1为本发明的方法流程图;
图2本发明基于引导式图结构增强的对比学习推荐方法模型图;
图3本发明引导式边缘优化策略对比其他模型边缘优化策略的效果对比图;
图4本发明对比其他模型针对不同交互数的用户性能提升情况。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明的数据集包括:
Amazon公布的Movies-and-TV数据集,是包含亚马逊电影和电视节目评论的数据集。我们对数据集进行预处理,为了保证数据质量,我们只保留超过10条交互记录的用户和项目交互信息,清洗过后该数据集包含33327个用户和21902个项目,具体交互数包含958986条交互记录。
一种基于引导式图结构增强的对比学习推荐方法,包括如下步骤:
(a)在电子商务数据集中通过预处理,将用户所交互的物品按照8:1:1比例进行随机划分,分别生成训练集、验证集和测试集,训练集用于模型的训练,验证集用于检测模型的训练结果,如果发生5次指标不会提升,就终止训练,测试集用于验证模型的最终推荐效果;
(b)训练集中包括N个用户、M个物品,利用训练集构建用户和物品购买交互的邻接矩阵,对用户节点进行嵌入参数初始化,生成节点嵌入信息对物品节点进行嵌入参数初始化,生成节点嵌入信息/>
(c)根据训练集中的用户购买记录,通过公共物品所占比得到目标用户ui与其对应的相似用户集合对每个用户建立一个由相似用户交互物品所组成的候选物品池用以后续对目标用户交互记录进行补充;
(d)通过余玄相似度函数衡量用户节点嵌入和物品节点嵌入之间的相似度值,作为后续的图结构多样性增强和图结构精确降噪的对应边处理的依据;
(e)通过计算每个用户与其对应的物品池中物品相似度得分,取得分较高的M2个物品,作为当前用户潜在喜欢的物品添加到交互记录上,用以丰富图结构的多样性,提高模型的泛化能力;
(f)根据添加多样性的图结构交互记录,计算当前用户与其交互物品的相似度得分,取得分较低的M3个物品,在当前的用户交互记录上删除,用以减少图结构的噪声和干扰信息,提高模型的精确度;
(g)建立基于引导式图结构增强的对比学习推荐方法模型;
(h)基于BPR损失函数和InfoNCE对比损失函数迭代N次,得到训练后的基于引导式图结构增强的对比学习推荐方法模型,需要明白的是,BPR是一种常用的损失函数能够使得正样本和负样本的得分差距尽量最大化,InfoNCE是一种常用的对比损失函数,其原理在此不再赘述;
(i)根据最终的用户和物品嵌入向量,计算用户对物品的计算得分,实现物品推荐;
步骤(g)具体如下:
(g-1)通过公式获得多样性增强图/>习到的用户物品嵌入表示,式中/>和/>分别表示多样性增强图的用户和物品的嵌入表示,/>和分别表示用户和物品的初始化嵌入表示,/> 通过公式在多样性增强图/>上传递消息,通过聚合邻域信息来学习嵌入表示,其中H和G分别表示节点的嵌入信息和相应图结构的邻接矩阵信息,式中是多样性的加权图/>的交互链接的边缘权重,Nu和Ni分别表示在多样性加权图/>中用户u和物品i的一跳邻居集,/>和/>表示用户u和物品i在k层传播后的嵌入表示,当k=0时,它们被初始化为/>
(g-2)通过公式组合每一层学习到的节点嵌入,GNN输出的为用户嵌入表示/>和物品嵌入表示/>式中αk≥0,αk统一设置为1/(k+1)是分配给第k层的超参数,表示每层节点嵌入的重要性,k是K的子层集合,用来表示图卷积层数;
(g-3)通过公式获得精确降噪图/>学习到的用户物品嵌入表示,式中/>和/>分别表示精确降噪图的用户和物品的嵌入表示,GNN(H,G)模块同上(g-1)和(g-2)步骤;
步骤(h)具体如下:
(h-1)通过公式
计算得到BPR损失,其中表示多样性增强图/>的交互集合,/>表示在图/>中观察到用户u和物品i存在交互,/>表示在图/>中未观察到用户u和物品j存在交互,/>表示用户u对正样本i的得分,式中T为转置,其中/>和/>分别表示多样性增强图的用户和物品的嵌入表示,同理/>表示用户u对负样本j的得分,φ(·)为Sigmoid激活函数;
(h-2)通过公式采用对比损失来优化互信息的下限,其中/>τ是温度超参数,f(·,·)是余弦相似度函数,通过最小化辅助损失LMIN;
(h-3)通过公式得到模型的总体损失优化函数,通过多任务学习策略集成图多样性模块和图降噪模块,式中LBPR由公式(h-1)得到,表示BPR损失函数,LMIM由公式(h-2)得到,表示InfoNCE对比损失函数,λ1和λ2是分别控制降噪图损失和L2正则化强度的超参数;并且Θ={EU,EI}是模型参数集,||·||2为L2范数;
(h-4)利用BPR损失和InfoNCE对比损失通过Adam优化基于引导式图结构增强的对比学习推荐方法模型中的参数。
本实施例中,步骤(b)包括如下步骤:
(b-1)在训练集中对于一组用户集合U和一组物品集合I的交互矩阵RN×M,其中N和M分别是用户和物品的数量,其中如果用户u∈U和物品i∈I存在交互,则元素rui=1,否则rui=0;或者基于交互矩阵构造用户-物品二部图G=(W,ω),其中节点集W由用户节点和物品节点构成,ω表示边的集合,对于非零元素rui都存在一条链接边;
(b-2)对用户节点和物品节点进行嵌入参数初始化分别生成用户节点的嵌入信息和物品节点的嵌入信息/>嵌入参数使用Xavier方法初始化,嵌入大小设置为64。
本实施例中,步骤(c)包括如下步骤:
(c-1)通过公式衡量用户交互集之间的相似性,式中和/>分别代表数据集中用户i和用户j交互的物品集合;
(c-2)通过公式得到目标用户i的相似用户集合,式中JC(ui,uj)是用户i和用户j的相似性得分,根据得分情况选取得分最高的M1个用户组成用户集合作为目标用户i的相似用户集合;
(c-3)通过公式将目标用户i的相似用户集合所交互的物品构建物品池/>并且去除目标用户i所交互的物品集合,式中/>和/>分别表示相似用户s所交互的物品集合和目标用户i所交互的物品集合,/>表示目标用户i的相似用户集合。
本实施例中,步骤(d)包括如下步骤:
(d-1)通过公式学习到用户和物品的结构特征矩阵,式中/>和/>表示用户和物品的初始嵌入矩阵,/>为特征矩阵,d为特征嵌入的维度,N和M分别表示用户和物品的个数;
(d-2)通过公式得到每一个用户与其所对应物品池中物品集合的得分情况,式中/>和/>分别表示用户节点u和对应物品池中物品节点i的结构特征,<·,·>表示向量内积运算,||·||2表示L2范数函数;
(d-3)通过公式将得分的范围转换(0,1),式中是每一个用户与其所对应物品池中物品集合的得分情况,Su,i是用户u和对应物品池中物品i之间的可靠性得分,并且得分范围在(0,1)。
本实施例中,步骤(e)包括如下步骤:
(e-1)通过公式得到每一个用户在物品池中获得的M2个潜在交互物品,式中M2表示每个用户添加潜在交互物品的个数,Su,i表示用户u和对应物品池中物品i之间的可靠性得分,如果满足条件,将得分作为当前用户和物品的交互边缘的权重,即rui=su,i,否则rui=0,即可靠性得分低,不作为潜在交互链接加入到用户的潜在交互中;
(e-2)通过公式在原始交互矩阵基础上添加潜在交互用户物品的边缘信息,将二者结合在一起,进一步形成多样性增强图/>式中/>表示保留的用户u潜与交互物品i的边缘得分,rui表示原始交互矩阵的用户物品交互得分,/>表示多样性增强图/>的用户物品边缘得分。
本实施例中,步骤(f)包括如下步骤:
通过公式对多样性增强图/>进行精确降噪处理,对每个用户在图/>中交互过的所有物品可靠度得分较低的边进行删除,删除噪声和不可靠交互,生成降噪图/>得分的计算方法由(d)提供,式中M3表示每个用户要删除噪声边的个数,表示多样性增强图/>的用户物品边缘得分,/>表示精确降噪图/>的用户物品边缘得分。
本实施例中,步骤i)包括如下步骤:通过公式计算得到用户对物品的预测得分y,式中T为转置,/>和/>分别表示多样性增强图的用户和物品的嵌入表示,根据预测得分y由高到低排序,实现物品推荐。
经过步骤(a)至(i)完成模型训练及推荐,为了验证模型的有效性,我们针对结果具体阐述本发明的性能优势,我们对比了另外两个最优的图结构增强模型,具体结果如表1.
表1本发明与目前最优的图结增强模型在Movies-and-TV数据集上的性能比较。
从表1中可以看到我们的模型对比其他图结构增强的基线模型性能都有明显的提升,并且优于目前主流的协同过滤与图结构增强对比的推荐模型,我们选择对用户推荐的物品数量的为10,在三个评价指标Recall(召回率)、NDCG(归一化折损累计增益)、HR(命中率)上都有明显的提升,并且分别提升了4.50%、3.80%和3.12%,这个归功于我们对用户的细粒度增强更能满足用户的真实需求,这是其他模型所不具备的特点。
本发明在合理性的边缘优化选择策略上也优势明显,如图3所示,本发明在优化较少边缘数量时就已经取得了最好的结果,大幅减少冗余边的添加或删除,对于每个用户,我们从物品池中选取候选物品,使模型更具合理性,从而使模型更加精简高效。由于现实中的数据集是具有稀疏性的,推荐系统在许多交互较少的节点嵌入学习效果并不理想,我们对不同交互数的用户进行了分组,以便更好地探究本发明的优势,如图4所示,在不同的数据集上对用户分组测试不同稀疏度分布的性能比较。其中,背景直方图表示每组所涉及的用户数量,线条显示了性能与指标命中率的关系,我们可以看到,随着交互的增加,我们的模型比最佳基线的改进变得更大,这也验证了本发明方法在针对不同交互数的用户时比其他模型有更明显的优势,证明了本发明方法的通用有效性。我们的模型同时受益于对比学习和GCN技术,GCN技术利用优化后的图形结构来学习用户和物品的表征,可以进一步提升模型的准确度。
本发明提出了的基于增强图的对比学习方法,解决了现有方法无法为用户和物品节点提供冗余度少但有效信息的问题。我们通过对用户-物品交互进行细粒度的增强,来捕获用户的潜在需求和兴趣。这种方法可以通过深入理解用户的交互行为和兴趣偏好,对交互图进行有针对性的增强操作,能够更好地满足用户的实际需求。
上述虽然结合附图对发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
Claims (7)
1.一种基于引导式图结构增强的对比学习推荐方法,其特征在于,包括如下步骤:
(a)在电子商务数据集中通过预处理得到训练集、验证集和测试集;
(b)利用训练集构建用户和物品购买交互的邻接矩阵,对用户节点和物品节点进行嵌入参数初始化,生成节点嵌入信息;
(c)根据训练集中的用户购买记录,通过公共物品所占比得到目标用户与其对应的相似用户集合,对每个用户建立一个由相似用户交互物品所组成的候选物品池,用以后续对目标用户交互记录进行补充;
(d)通过余玄相似度函数衡量用户节点嵌入和物品节点嵌入之间的相似度值,作为后续的图结构多样性增强和图结构精确降噪的对应边处理的依据;
(e)通过计算每个用户与其对应的物品池中物品相似度得分,取得分较高的物品,作为当前用户潜在喜欢的物品添加到交互记录上;
(f)根据添加多样性的图结构交互记录,计算当前用户与其交互物品的相似度得分,取得分较低的物品,在当前的用户交互记录上删除;
(g)建立基于引导式图结构增强的对比学习推荐方法模型;
(h)基于BPR损失函数和InfoNCE对比损失函数迭代N次,得到训练后的基于引导式图结构增强的对比学习推荐方法模型;
(i)根据最终的用户和物品嵌入向量,计算用户对物品的计算得分,实现物品推荐;
步骤(g)具体如下:
(g-1)通过公式获得多样性增强图/>习到的用户物品嵌入表示,式中/>和/>分别表示多样性增强图的用户和物品的嵌入表示,/>和/>分别表示用户和物品的初始化嵌入表示,/> 通过公式在多样性增强图/>上传递消息,通过聚合邻域信息来学习嵌入表示,其中H和G分别表示节点的嵌入信息和相应图结构的邻接矩阵信息,式中是多样性的加权图/>的交互链接的边缘权重,Nu和Ni分别表示在多样性加权图/>中用户u和物品i的一跳邻居集,/>和/>表示用户u和物品i在k层传播后的嵌入表示,当k=0时,它们被初始化为/>
(g-2)通过公式组合每一层学习到的节点嵌入,GNN输出的为用户嵌入表示/>和物品嵌入表示/>式中αk≥0,αk统一设置为1/(k+1)是分配给第k层的超参数,表示每层节点嵌入的重要性,k是K的子层集合,用来表示图卷积层数;
(g-3)通过公式
获得精确降噪图学习到的用户物品嵌入表示,式中/>和/>分别表示精确降噪图的用户和物品的嵌入表示,GNN(H,G)模块同上(g-1)和(g-2)步骤;
步骤(h)具体如下:
(h-1)通过公式
计算得到BPR损失,其中
表示多样性增强图/>的交互集合,/>表示在图/>中观察到用户u和物品i存在交互,/>表示在图/>中未观察到用户u和物品j存在交互,/>表示用户u对正样本i的得分,式中T为转置,其中和/>分别表示多样性增强图的用户和物品的嵌入表示,同理/>表示用户u对负样本j的得分,φ(·)为Sigmoid激活函数;
(h-2)通过公式
采用对比损失来优化互信息的下限,其中/>τ是温度超参数,f(·,·)是余弦相似度函数,通过最小化辅助损失LMIM;
(h-3)通过公式得到模型的总体损失优化函数,通过多任务学习策略集成图多样性模块和图降噪模块,式中LBPR由公式(h-1)得到,表示BPR损失函数,LMIM由公式(h-2)得到,表示InfoNCE对比损失函数,λ1和λ2是分别控制降噪图损失和L2正则化强度的超参数;并且Θ={EU,EI}是模型参数集,||·||2为L2范数;
(h-4)利用BPR损失和InfoNCE对比损失通过Adam优化基于引导式图结构增强的对比学习推荐方法模型中的参数。
2.根据权利要求1所述基于引导式图结构增强的对比学习推荐方法,其特征在于,步骤(b)包括如下步骤:
(b-1)在训练集中对于一组用户集合U和一组物品集合I的交互矩阵RN×M,其中N和M分别是用户和物品的数量,其中如果用户u∈U和物品i∈I存在交互,则元素rui=1,否则rui=0;或者基于交互矩阵构造用户-物品二部图G=(W,ω),其中节点集W由用户节点和物品节点构成,ω表示边的集合,对于非零元素rui都存在一条链接边;
(b-2)对用户节点和物品节点井行嵌入参数初始化分别生成用户节点的嵌入信息和物品节点的嵌入信息/>嵌入参数使用Xavier方法初始化,嵌入大小设置为64。
3.根据权利要求1所述基于引导式图结构增强的对比学习推荐方法,其特征在于,步骤(c)包括如下步骤:
(c-1)通过公式衡量用户交互集之间的相似性,式中/>和分别代表数据集中用户i和用户j交互的物品集合;
(c-2)通过公式得到目标用户i的相似用户集合,式中JC(ui,uj)是用户i和用户j的相似性得分,根据得分情况选取得分最高的M1个用户组成用户集合作为目标用户i的相似用户集合;
(c-3)通过公式将目标用户i的相似用户集合所交互的物品构建物品池/>并且去除目标用户i已交互的物品集合,式中/>和/>分别表示相似用户S所交互的物品集合和目标用户i所交互的物品集合,/>表示目标用户i的相似用户集合。
4.根据权利要求1所述的基于引导式图结构增强的对比学习推荐方法,其特征在于,步骤(d)包括如下步骤:
(d-1)通过公式学习到用户和物品的结构特征矩阵,式中和/>表示用户和物品的初始嵌入矩阵,/>为特征矩阵,d为特征嵌入的维度,N和M分别表示用户和物品的个数;
(d-2)通过公式得到每一个用户与其所对应物品池中物品集合的得分情况,式中/>和/>分别表示用户节点u和对应物品池中物品节点l的结构特征,<·,·>表示向量内积运算,||·||2表示L2范数函数;
(d-3)通过公式将得分的范围转换(0,1),式中是每一个用户与其所对应物品池中物品集合的得分情况,Su,i是用户u和对应物品池中物品i之间的可靠性得分,并且得分范围在(0,1)。
5.根据权利要求1所述的基于引导式图结构增强的对比学习推荐方法,其特征在于,步骤(e)包括如下步骤:
(e-1)通过公式得到每一个用户在物品池中获得的M2个潜在交互物品,式中M2表示每个用户添加潜在交互物品的个数,Su,i表示用户u和对应物品池中物品i之间的可靠性得分,如果满足条件,将得分作为当前用户和物品的交互边缘的权重,即rui=su,i,否则rui=0,即可靠性得分低,不作为潜在交互链接加入到用户的潜在交互中;
(e-2)通过公式在原始交互矩阵基础上添加潜在交互用户物品的边缘信息,将二者结合在一起,进一步形成多样性增强图/>式中/>表示保留的用户u潜与交互物品i的边缘得分,rui表示原始交互矩阵的用户物品交互得分,/>表示多样性增强图/>的用户物品边缘得分。
6.根据权利要求1所述的基于引导式图结构增强的对比学习推荐方法,其特征在于,步骤(f)包括如下步骤:
通过公式对多样性增强图/>进行精确降噪处理,对每个用户在图/>中交互过的所有物品可靠度得分较低的边进行删除,删除噪声和不可靠交互,生成降噪图/>得分的计算方法由(d)提供,式中M3表示每个用户要删除噪声边的个数,/>表示多样性增强图/>的用户物品边缘得分,/>表示精确降噪图/>的用户物品边缘得分。
7.根据权利要求1所述的基于引导式图结构增强的对比学习推荐方法,其特征在于,步骤(i)包括如下步骤:通过公式计算得到用户对物品的预测得分y,式中T为转置,和/>分别表示多样性增强图的用户和物品的嵌入表示,根据预测得分y由高到低排序,实现物品推荐。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310890503.XA CN116628347B (zh) | 2023-07-20 | 2023-07-20 | 基于引导式图结构增强的对比学习推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310890503.XA CN116628347B (zh) | 2023-07-20 | 2023-07-20 | 基于引导式图结构增强的对比学习推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116628347A CN116628347A (zh) | 2023-08-22 |
CN116628347B true CN116628347B (zh) | 2023-09-29 |
Family
ID=87636830
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310890503.XA Active CN116628347B (zh) | 2023-07-20 | 2023-07-20 | 基于引导式图结构增强的对比学习推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116628347B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114036406A (zh) * | 2021-11-04 | 2022-02-11 | 南京大学 | 一种基于图对比学习和社交网络增强的推荐方法及系统 |
CN115358809A (zh) * | 2022-07-19 | 2022-11-18 | 华南理工大学 | 一种基于图对比学习的多意图推荐方法及装置 |
CN116010708A (zh) * | 2023-02-13 | 2023-04-25 | 重庆市知识产权保护中心(重庆摩托车(汽车)知识产权信息中心) | 一种基于知识图谱的多对比学习推荐方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111581520B (zh) * | 2020-05-25 | 2022-04-19 | 中国人民解放军国防科技大学 | 基于会话中物品重要性的物品推荐方法和系统 |
-
2023
- 2023-07-20 CN CN202310890503.XA patent/CN116628347B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114036406A (zh) * | 2021-11-04 | 2022-02-11 | 南京大学 | 一种基于图对比学习和社交网络增强的推荐方法及系统 |
CN115358809A (zh) * | 2022-07-19 | 2022-11-18 | 华南理工大学 | 一种基于图对比学习的多意图推荐方法及装置 |
CN116010708A (zh) * | 2023-02-13 | 2023-04-25 | 重庆市知识产权保护中心(重庆摩托车(汽车)知识产权信息中心) | 一种基于知识图谱的多对比学习推荐方法 |
Non-Patent Citations (1)
Title |
---|
深度协同过滤推荐模型研究;纪佳琪;姜学东;;计算机应用与软件(07);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116628347A (zh) | 2023-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wu et al. | Robust latent factor analysis for precise representation of high-dimensional and sparse data | |
Wang et al. | Session-based recommendation with hypergraph attention networks | |
CN111428147B (zh) | 结合社交和兴趣信息的异源图卷积网络的社交推荐方法 | |
Deng et al. | Personalized bundle recommendation in online games | |
CN112529168B (zh) | 一种基于gcn的属性多层网络表示学习方法 | |
WO2021169367A1 (zh) | 一种基于多层注意力的推荐方法 | |
CN112364976B (zh) | 基于会话推荐系统的用户偏好预测方法 | |
CN110347932B (zh) | 一种基于深度学习的跨网络用户对齐方法 | |
CN110879864A (zh) | 一种基于图神经网络和注意力机制的上下文推荐方法 | |
CN109740106A (zh) | 基于图卷积神经网络的大规模网络介数逼近方法、存储装置及存储介质 | |
CN115221413B (zh) | 一种基于交互式图注意力网络的序列推荐方法及系统 | |
Singhal et al. | Towards a unified framework for visual compatibility prediction | |
CN112784118A (zh) | 一种对三角形结构敏感的图中的社区发现方法和装置 | |
CN114997476A (zh) | 一种融合商品关联关系的商品预测方法 | |
CN113641811B (zh) | 促进购买行为的会话推荐方法、系统、设备及存储介质 | |
CN112836007B (zh) | 一种基于语境化注意力网络的关系元学习方法 | |
CN114925268A (zh) | 基于图神经网络的推荐方法、系统、电子设备及计算机可读介质 | |
CN116628347B (zh) | 基于引导式图结构增强的对比学习推荐方法 | |
Chen et al. | Non-recursive graph convolutional networks | |
Zhao et al. | A pipeline for fair comparison of graph neural networks in node classification tasks | |
CN113159976B (zh) | 一种微博网络重要用户的识别方法 | |
Zou et al. | Hybrid collaborative filtering with semi-stacked denoising autoencoders for recommendation | |
CN114840775A (zh) | 一种融合多空间特征的网络对齐模型及其应用 | |
Fu et al. | Preference-aware heterogeneous graph neural networks for recommendation | |
Guo et al. | Explainable recommendation systems by generalized additive models with manifest and latent interactions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |