CN114723522A - 一种面向评论文本的图神经网络推荐方法 - Google Patents

一种面向评论文本的图神经网络推荐方法 Download PDF

Info

Publication number
CN114723522A
CN114723522A CN202210345556.9A CN202210345556A CN114723522A CN 114723522 A CN114723522 A CN 114723522A CN 202210345556 A CN202210345556 A CN 202210345556A CN 114723522 A CN114723522 A CN 114723522A
Authority
CN
China
Prior art keywords
user
product
formula
vector
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210345556.9A
Other languages
English (en)
Inventor
张琨
帅杰
吴乐
洪日昌
汪萌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN202210345556.9A priority Critical patent/CN114723522A/zh
Publication of CN114723522A publication Critical patent/CN114723522A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Administration (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种面向评论文本的图神经网络推荐方法,包括:1.利用用户对产品的评论和评分构建用户与商品的二部图,包括:用户节点集、产品节点集、评分矩阵、评论特征张量。2.构建面向评论文本的图卷积方法,将评论和评分作为边的特征参与图卷积,编码用户与产品表征。3.利用图对比学习增强用户与产品的表征。4.构建交互层,从用户与产品的表征编码交互向量。5.通过对比学习拉近交互表征与评论向量的分布。6.根据交互表征预测评分,从而实现产品推荐。本发明将评论和评分作为用户与产品的交互特征,自适应学习二者之间的相互影响,学习更精准的节点表征和更细腻的用户偏好,从而能提高推荐性能。

Description

一种面向评论文本的图神经网络推荐方法
技术领域
本发明设计个性化推荐领域,具体来说是一种面向评论文本的图神经网络推荐方法。
背景技术
随着互联网技术的飞速发展,网络服务平台中涌现了大量的信息供用户选择,信息过载问题日益突出。个性化推荐系统通过分析用户历史行为,挖掘用户兴趣偏好,从而推荐用户感兴趣的产品。电子商务网站中大量的用户评论信息有助于进一步挖掘用户喜好,提高推荐效果。当前利用评论文本的主流方法将历史评论视作用户和产品的描述文本,从中提取语义特征增强用户和产品的表征。
现有基于评论的推荐方法虽然取得了比传统推荐模型更准确的推荐结果,然而这些方法忽略了用户与产品交互可以自然地用二部图进行建模:用户和产品为节点,评分和评论文本反应了节点之间连边特征。从二部图的角度,现有基于评论的推荐方法将边上评论文本直接作为节点属性,无可避免在节点表征学习引入了噪声,使得节点表征难以反应真实的用户偏好和产品特征,从而限制了推荐效果。
发明内容
本发明是为解决现有基于评论的推荐模型的不足,提出一种面向评论文本的图神经网络推荐方法,以期能更加充分挖掘评论,实现对用户和产品表征更精确的建模,从而提高推荐性能。
本发明为解决技术问题采用如下技术方案:
本发明一种面向评论文本的图神经网络推荐方法的特点在于,是按如下步骤进行:
步骤1、根据用户对产品的评分和评论构建用户与商品的二部图,包括:用户集合
Figure BDA0003576415240000011
产品集合
Figure BDA0003576415240000012
评分矩阵
Figure BDA0003576415240000013
和评论张量
Figure BDA0003576415240000014
其中,令
Figure BDA0003576415240000015
表示第i个用户,M表示用户集合
Figure BDA0003576415240000016
的用户总数,令
Figure BDA0003576415240000017
表示第j个产品,N表示产品总数;评分矩阵R中第i行第j列元素rij表示第i个用户ui对第j个产品vj的评分,
Figure BDA0003576415240000018
表示所有评分取值的集合;令
Figure BDA0003576415240000019
表示第i个用户ui对第j个产品vj的评论向量,从而由评分矩阵R和评论张量E共同组成用户与商品之间的交互集合ε={R,E},并用二部图
Figure BDA00035764152400000110
表示用户与商品的交互;
步骤2、通过面向评论文本的图卷积进行特征传播,获得用户与产品表征:
步骤2.1、通过独热编码获取用户的嵌入矩阵
Figure BDA0003576415240000021
和产品的嵌入矩阵
Figure BDA0003576415240000022
并分别作为相应节点的初始表征;其中,用户的嵌入矩阵
Figure BDA0003576415240000023
的第i行向量
Figure BDA0003576415240000024
表示第i个用户ui的表征向量;同理,产品的嵌入矩阵
Figure BDA0003576415240000025
的第j行向量
Figure BDA0003576415240000026
表示第j个产品vj的嵌入向量;
定义有L层图卷积;
步骤2.2、在第l层卷积层中利用式(1)计算从第j个产品vj到第i个用户ui的特征信息传播向量
Figure BDA0003576415240000027
Figure BDA0003576415240000028
式(1)中,
Figure BDA0003576415240000029
表示第l-1卷积层获得的第j个产品vj的表征向量;当l=1时,令
Figure BDA00035764152400000210
Figure BDA00035764152400000211
Figure BDA00035764152400000212
分别表示第j个产品vj和第i个用户ui的邻居节点集合;|·|表示计算集合元素的数量;
Figure BDA00035764152400000213
Figure BDA00035764152400000214
表示在第l卷积层中评分rij指定的两个参数向量,
Figure BDA00035764152400000215
Figure BDA00035764152400000216
表示在第l卷积层中评分rij指定的两个参数矩阵;σ(·)表示Sigmoid激活函数;
Figure BDA00035764152400000224
表示转置;
步骤2.3、在第l层卷积层中利用式(2)计算从第i个用户ui到第j个产品vj的特征信息传播向量
Figure BDA00035764152400000217
Figure BDA00035764152400000218
式(2)中,
Figure BDA00035764152400000219
表示第l-1卷积层获得的第i个用户ui表征向量;当l=1时,令
Figure BDA00035764152400000220
步骤2.4、利用式(3)聚合第l层卷积层的信息传播向量,从而相应获得第i个用户ui和第j个产品vj在第l层卷积层的表征向量
Figure BDA00035764152400000221
Figure BDA00035764152400000222
Figure BDA00035764152400000223
式(3)中,W(l)为第l层卷积层的参数矩阵;
步骤2.5、将l+1赋值给l后,返回步骤2.2执行,直到经过L层图卷积计算后,将最后一层的节点表征作为最终的用户表征
Figure BDA0003576415240000031
和产品表征
Figure BDA0003576415240000032
步骤3、利用图对比学习增强用户与产品的表征向量:
步骤3.1、通过对比学习增强用户表征:
对用户-商品二部图
Figure BDA0003576415240000033
按照概率ρ随机丢弃图中产品节点以进行二次扰动,从而得到两个用户子图
Figure BDA0003576415240000034
Figure BDA0003576415240000035
并按照步骤2.2-步骤2.5的过程进行处理,从而得到两组用户表征向量
Figure BDA0003576415240000036
Figure BDA0003576415240000037
Figure BDA0003576415240000038
表示从子图
Figure BDA0003576415240000039
获取第i个用户ui的表征向量,
Figure BDA00035764152400000310
表示从子图
Figure BDA00035764152400000311
获取第i个用户ui的表征向量;
根据式(4)建立用户的对比学习损失函数
Figure BDA00035764152400000312
Figure BDA00035764152400000313
式(4)中,
Figure BDA00035764152400000314
表示对用户集合
Figure BDA00035764152400000315
随机抽样用户ui求期望;
Figure BDA00035764152400000316
表示先从用户集合
Figure BDA00035764152400000317
先抽样用户ui,再从用户集合
Figure BDA00035764152400000318
抽样用户ui'后求两次采样的期望;
Figure BDA00035764152400000319
表示计算两个节点特征向量相似度;
步骤3.2、增强产品表征向量:
对用户-商品二部图
Figure BDA00035764152400000320
按照概率ρ随机丢弃图中用户节点以进行二次扰动,从而得到两个产品子图并按照步骤2.2-步骤2.5的过程进行处理,从而得到两组产品表征向量
Figure BDA00035764152400000321
Figure BDA00035764152400000322
Figure BDA00035764152400000335
表示从子图
Figure BDA00035764152400000323
获取第j个用户vj的表征向量,
Figure BDA00035764152400000324
表示从子图
Figure BDA00035764152400000325
获取第j个用户vj的表征向量。
利用式(4)建立产品的对比学习损失函数
Figure BDA00035764152400000326
Figure BDA00035764152400000327
式(4)中,
Figure BDA00035764152400000328
表示对产品集合
Figure BDA00035764152400000329
随机抽样用户vj求期望;
Figure BDA00035764152400000330
表示先从产品集合
Figure BDA00035764152400000331
先抽样用户vj,再从产品集合
Figure BDA00035764152400000332
抽样用户vj',求两次抽样的期望;
步骤3.3、利用式(6)得到节点增强的对比损失函数
Figure BDA00035764152400000333
Figure BDA00035764152400000334
步骤4、利用式(7)计算第i个用户ui和第j个产品vj的交互表征向量hij
Figure BDA0003576415240000041
式(7)中,MLP表示多层感知机,[,]表示向量拼接操作;
步骤5、根据式(8)计算交互对比损失
Figure BDA0003576415240000042
Figure BDA0003576415240000043
式(8)中,
Figure BDA0003576415240000044
表示从交互集合ε中抽样用户-产品对(ui,vj)计算期望,
Figure BDA0003576415240000045
表示先从交互集合ε中抽样用户-产品对(ui,vj),再从交互集合ε中抽样用户-产品对(ui',vj')中抽取负样本对(i',j')后求期望;ei′j′表示第i'个用户ui'对第j'个产品vj'的评论向量;
步骤6、根据式(9)得到第i个用户ui对第j个产品vj的预测评分
Figure BDA0003576415240000046
Figure BDA0003576415240000047
式(9)中;w为参数向量;
步骤6.1、根据式(10)计算评分预测的损失函数
Figure BDA0003576415240000048
Figure BDA0003576415240000049
式(10)中,
Figure BDA00035764152400000410
表示所有的用户-产品对的集合;
步骤6.2、根据式(11)构建总损失函数
Figure BDA00035764152400000411
Figure BDA00035764152400000412
式(11)中,α和β是用于平衡三个损失函数的超参数;
步骤6.3、利用梯度下降法优化所有参数,使得损失函数
Figure BDA00035764152400000413
收敛至最小,从而得到预测评分误差最小的最优推荐模型,用于实现对产品的推荐。
与现有技术相比,本发明有益效果体现在:
1、本发明针对现有推荐模型建模不符合评论作为交互特征的缺点,提出了一种面向评论文本的图神经网络推荐方法,通过步骤1构建用户-产品二部图,并将评论文本和评分作为边的特征。该建模方式更符合评论的属性,从而避免了在节点表征中引入不相关噪声。
2、本发明针对用户-产品二部图,通过步骤2在图卷积中引入边上的评分和评论特征计算节点和用户表征,该建模符合评分和评论作为用户与产品交互的实际情况,通过评论和评分自适应学习产品和用户之间相互影响,更准确捕获二者之间的协同信号,学习更准确的节点表征,从而提高了推荐性能。
3、本发明通过步骤3的图对比学习技术增强用户与产品的表征。约束节点表征在不同图扰动下的一致性,迫使模型从二部图中学习与节点最相关的信息,不仅缓解节点表征的噪声而且提高节点表征的鲁棒性,从而有效提升了评分预测的准确性。
4、本发明利用对比学习,将评论文本作为监督信号,在训练时不仅以目标评分作为训练目标而且学习更细腻丰富的评论信息。具体来说,本发明不仅学习用户的评分而且学习为什么给出对应的评分,从而获得更优的模型参数和更准确的推荐精度。
附图说明
图1为本发明一种面向评论文本的图神经网络推荐方法的流程图。
具体实施方式
本实施例中,一种面向评论文本的图神经网络推荐方法,考虑了现有基于评论推荐模型中对评论文本建模不切合评论作为交互特征的实际情况,通过在图卷积中将评论作为边特征对用户和产品建模,更准确地利用评论计算用户和产品表征。在此基础上,引入图对比学习增强节点表征的鲁棒性,并利用对比学习将评论作为监督信号引导模型学习用户更细腻的偏好,从而提高推荐性能。具体的说,如图1所示,该方法是按照以下步骤进行。
步骤1、根据用户对产品的评分和评论构建用户与商品的二部图,包括:用户集合
Figure BDA0003576415240000051
产品集合
Figure BDA0003576415240000052
评分矩阵
Figure BDA0003576415240000053
和评论张量
Figure BDA0003576415240000054
其中,令
Figure BDA0003576415240000055
表示第i个用户,M表示用户集合
Figure BDA0003576415240000056
的用户总数,令
Figure BDA0003576415240000057
表示第j个产品,N表示产品总数;评分矩阵R中第i行第j列元素rij表示第i个用户ui对第j个产品vj的评分,
Figure BDA0003576415240000058
表示所有评分取值的集合;令
Figure BDA0003576415240000059
表示第i个用户ui对第j个产品vj的评论向量,从而由评分矩阵R和评论张量E共同组成用户与商品之间的交互集合ε={R,E},并用二部图
Figure BDA00035764152400000510
表示用户与商品的交互;
步骤2、通过面向评论文本的图卷积进行特征传播,获得用户与产品表征:
步骤2.1、通过独热编码获取用户的嵌入矩阵
Figure BDA00035764152400000511
和产品的嵌入矩阵
Figure BDA00035764152400000512
并分别作为相应节点的初始表征;其中,用户的嵌入矩阵
Figure BDA00035764152400000513
的第i行向量
Figure BDA00035764152400000514
表示第i个用户ui的表征向量;同理,产品的嵌入矩阵
Figure BDA0003576415240000061
的第j行向量
Figure BDA0003576415240000062
表示第j个产品vj的嵌入向量;
定义有L层图卷积;
步骤2.2、在第l层卷积层中利用式(1)计算从第j个产品vj到第i个用户ui的特征信息传播向量
Figure BDA0003576415240000063
Figure BDA0003576415240000064
式(1)中,
Figure BDA0003576415240000065
表示第l-1卷积层获得的第j个产品vj的表征向量;当l=1时,令
Figure BDA0003576415240000066
Figure BDA0003576415240000067
Figure BDA0003576415240000068
分别表示第j个产品vj和第i个用户ui的邻居节点集合;|·|表示计算集合元素的数量;
Figure BDA0003576415240000069
Figure BDA00035764152400000610
表示在第l卷积层中评分rij指定的两个参数向量,
Figure BDA00035764152400000611
Figure BDA00035764152400000612
表示在第l卷积层中评分rij指定的两个参数矩阵;σ(·)表示Sigmoid激活函数;
Figure BDA00035764152400000620
表示转置;
该方法在信息传播中有效融合二部图结构和评论信息,提高模型表征。具体来说,传统方法用评分衡量信息转播向量的影响力,本发明用细腻的评论学习产品对用户的影响力大小。同样,对边上的评论,本发明采用相同的方法在传播中引入评论特征丰富信息特征。
步骤2.3、在第l层卷积层中利用式(2)计算从第i个用户ui到第j个产品vj的特征信息传播向量
Figure BDA00035764152400000613
Figure BDA00035764152400000614
式(2)中,
Figure BDA00035764152400000615
表示第l-1卷积层获得的第i个用户ui表征向量;当l=1时,令
Figure BDA00035764152400000616
步骤2.4、利用式(3)聚合第l层卷积层的信息传播向量,从而相应获得第i个用户ui和第j个产品vj在第l层卷积层的表征向量
Figure BDA00035764152400000617
Figure BDA00035764152400000618
Figure BDA00035764152400000619
式(3)中,W(l)为第l层卷积层的参数矩阵;
步骤2.5、将l+1赋值给l后,返回步骤2.2执行,直到经过L层图卷积计算后,将最后一层的节点表征作为最终的用户表征
Figure BDA0003576415240000071
和产品表征
Figure BDA0003576415240000072
步骤3、利用图对比学习增强用户与产品的表征向量:
步骤3.1、通过对比学习增强用户表征:
对用户-商品二部图
Figure BDA0003576415240000073
按照概率ρ随机丢弃图中产品节点以进行二次扰动,从而得到两个用户子图
Figure BDA0003576415240000074
Figure BDA0003576415240000075
并按照步骤2.2-步骤2.5的过程进行处理,从而得到两组用户表征向量
Figure BDA0003576415240000076
Figure BDA0003576415240000077
Figure BDA0003576415240000078
表示从子图
Figure BDA0003576415240000079
获取第i个用户ui的表征向量,
Figure BDA00035764152400000710
表示从子图
Figure BDA00035764152400000711
获取第i个用户ui的表征向量。
根据式(4)建立用户的对比学习损失函数
Figure BDA00035764152400000712
Figure BDA00035764152400000713
式(4)中,
Figure BDA00035764152400000714
表示对用户集合
Figure BDA00035764152400000715
随机抽样用户ui求期望;
Figure BDA00035764152400000716
表示先从用户集合
Figure BDA00035764152400000717
先抽样用户ui,再从用户集合
Figure BDA00035764152400000718
抽样用户ui',求两次采样的期望。
Figure BDA00035764152400000719
用于计算两个节点特征向量相似度。
该方法约束同一节点的表征在不同子图下趋于一致。具体来说,该方法迫使从不同邻居节点和评论提取的共有的信息特征,这些共有的信息特征更准确的反应了用户的偏好,例如某位用户喜欢看硬科幻的电影。因此,该步骤能有效提高节点特征的准确性和鲁棒性,从而提升推荐性能。
步骤3.2、增强产品表征向量:
对用户-商品二部图
Figure BDA00035764152400000720
按照概率ρ随机丢弃图中用户节点以进行二次扰动,从而得到两个产品子图并按照步骤2.2-步骤2.5的过程进行处理,从而得到两组产品表征向量
Figure BDA00035764152400000721
Figure BDA00035764152400000722
Figure BDA00035764152400000723
表示从子图
Figure BDA00035764152400000724
获取第j个用户vj的表征向量,
Figure BDA00035764152400000725
表示从子图
Figure BDA00035764152400000726
获取第j个用户vj的表征向量。
利用式(4)建立产品的对比学习损失函数
Figure BDA00035764152400000727
Figure BDA00035764152400000728
式(4)中,
Figure BDA00035764152400000729
表示对产品集合
Figure BDA00035764152400000730
随机抽样用户vj求期望;
Figure BDA00035764152400000731
表示先从产品集合
Figure BDA0003576415240000081
先抽样用户vj,再从产品集合
Figure BDA0003576415240000082
抽样用户vj',求两次抽样的期望。
步骤3.3、利用式(6)得到节点增强的对比损失函数
Figure BDA0003576415240000083
Figure BDA0003576415240000084
步骤4、利用式(7)计算第i个用户ui和第j个产品vj的交互表征向量hij
Figure BDA0003576415240000085
式(7)中,MLP表示多层感知机,[,]表示向量拼接操作;
步骤5、根据式(8)计算交互对比损失
Figure BDA0003576415240000086
Figure BDA0003576415240000087
式(8)中,
Figure BDA0003576415240000088
表示从交互集合ε中抽样用户-产品对(ui,vj)计算期望,
Figure BDA0003576415240000089
表示先从ε中抽样用户-产品对(ui,vj),再从ε中抽样用户-产品对(ui',vj')中抽取负样本对(i',j')求期望;ei′j′表示第i'个用户ui'对第j'个产品vj'的评论向量。
传统推荐模型以评分为目标训练模型参数。本发明通过对比学习引入评论作为目标,使模型在训练时不仅学习如何准确预测数值评分,而且学习用户给出评论中的详细原因。因为提供了额外有效的监督信号,模型的评分预测性能可以进一步提高。
步骤6、根据式(9)得到第i个用户ui对第j个产品vj的预测评分
Figure BDA00035764152400000810
Figure BDA00035764152400000811
式(9)中;w为参数向量;
步骤6.1、根据式(10)计算评分预测的损失函数
Figure BDA00035764152400000812
Figure BDA00035764152400000813
式(10)中,
Figure BDA00035764152400000814
表示所有的用户-产品对的集合;
步骤6.2、根据式(11)构建总损失函数
Figure BDA00035764152400000815
Figure BDA00035764152400000816
其中,α和β是用于平衡三个损失函数的超参数;
步骤6.3、利用梯度下降法优化所有参数,使得损失函数
Figure BDA00035764152400000817
收敛至最小,从而得到预测评分误差最小的最优推荐模型,用于实现对产品的推荐。
实验例:
为了验证本方法的有效性,本发明在五个推荐系统常用的公开数据集:DigitalMusic,Toys and Games,Clothing,CDs和Yelp上进行实验,比较本发明的方法(RGCL)与10种现有推荐方法:SVD,NCF,DeepCONN,NARRE,DAML,SDNet,TransNet,GC-MC,RMG和SSG的推荐性能,评价指标采用推荐系统种常用的MSE,越小的MSE表示评分预测的误差越小,推荐精度越高。
表1
推荐方法 Digital Music Toys and Games Clothing CDs Yelp
SVD 0.8523 0.8086 1.1167 0.8662 1.1939
NCF 0.8403 0.8078 1.1094 0.8781 1.1896
DeepCoNN 0.8378 0.8028 1.1184 0.8621 1.1877
NARRE 0.8172 0.7962 1.1064 0.8495 1.1862
DAML 0.8237 0.7936 1.1065 0.8483 1.1793
SDNet 0.8331 0.8006 1.108 0.8654 1.1837
TransNets 0.8273 0.798 1.1141 0.844 1.1855
GC-MC 0.809 0.7986 1.1088 0.8404 1.1737
RMG 0.8074 0.7901 1.1064 0.8425 1.1705
SSG 0.8218 0.8064 1.1228 0.8458 1.1807
RGCL 0.7735 0.7771 1.0858 0.818 1.1609
表1为本发明方法与对比方法的推荐效果比较。从实验结果可以看出,本发明提出的方法在MSE指标上都优于现有方法。
综上所述,本方法将评论和评分作为用户与产品的交互特征,自适应学习二者之间的相互影响,学习更精准的节点表征和更细腻的用户偏好,从而提高了推荐性能。

Claims (1)

1.一种面向评论文本的图神经网络推荐方法,其特征在于,是按如下步骤进行:
步骤1、根据用户对产品的评分和评论构建用户与商品的二部图,包括:用户集合
Figure FDA0003576415230000011
产品集合
Figure FDA0003576415230000012
评分矩阵
Figure FDA0003576415230000013
和评论张量
Figure FDA0003576415230000014
其中,令
Figure FDA0003576415230000015
表示第i个用户,M表示用户集合
Figure FDA0003576415230000016
的用户总数,令
Figure FDA0003576415230000017
表示第j个产品,N表示产品总数;评分矩阵R中第i行第j列元素rij表示第i个用户ui对第j个产品vj的评分,R表示所有评分取值的集合;令
Figure FDA0003576415230000018
表示第i个用户ui对第j个产品vj的评论向量,从而由评分矩阵R和评论张量E共同组成用户与商品之间的交互集合ε={R,E},并用二部图
Figure FDA0003576415230000019
表示用户与商品的交互;
步骤2、通过面向评论文本的图卷积进行特征传播,获得用户与产品表征:
步骤2.1、通过独热编码获取用户的嵌入矩阵
Figure FDA00035764152300000110
和产品的嵌入矩阵
Figure FDA00035764152300000111
并分别作为相应节点的初始表征;其中,用户的嵌入矩阵
Figure FDA00035764152300000112
的第i行向量
Figure FDA00035764152300000113
表示第i个用户ui的表征向量;同理,产品的嵌入矩阵
Figure FDA00035764152300000114
的第j行向量
Figure FDA00035764152300000115
表示第j个产品vj的嵌入向量;
定义有L层图卷积;
步骤2.2、在第l层卷积层中利用式(1)计算从第j个产品vj到第i个用户ui的特征信息传播向量
Figure FDA00035764152300000116
Figure FDA00035764152300000117
式(1)中,
Figure FDA00035764152300000118
表示第l-1卷积层获得的第j个产品vj的表征向量;当l=1时,令
Figure FDA00035764152300000119
Figure FDA00035764152300000120
Figure FDA00035764152300000121
分别表示第j个产品vj和第i个用户ui的邻居节点集合;|·|表示计算集合元素的数量;
Figure FDA00035764152300000122
Figure FDA00035764152300000123
表示在第l卷积层中评分rij指定的两个参数向量,
Figure FDA00035764152300000124
Figure FDA00035764152300000125
表示在第l卷积层中评分rij指定的两个参数矩阵;σ(·)表示Sigmoid激活函数;
Figure FDA00035764152300000127
表示转置;
步骤2.3、在第l层卷积层中利用式(2)计算从第i个用户ui到第j个产品vj的特征信息传播向量
Figure FDA00035764152300000126
Figure FDA0003576415230000021
式(2)中,
Figure FDA0003576415230000022
表示第l-1卷积层获得的第i个用户ui表征向量;当l=1时,令
Figure FDA0003576415230000023
步骤2.4、利用式(3)聚合第l层卷积层的信息传播向量,从而相应获得第i个用户ui和第j个产品vj在第l层卷积层的表征向量
Figure FDA0003576415230000024
Figure FDA0003576415230000025
Figure FDA0003576415230000026
式(3)中,W(l)为第l层卷积层的参数矩阵;
步骤2.5、将l+1赋值给l后,返回步骤2.2执行,直到经过L层图卷积计算后,将最后一层的节点表征作为最终的用户表征
Figure FDA0003576415230000027
和产品表征
Figure FDA0003576415230000028
步骤3、利用图对比学习增强用户与产品的表征向量:
步骤3.1、通过对比学习增强用户表征:
对用户-商品二部图
Figure FDA0003576415230000029
按照概率ρ随机丢弃图中产品节点以进行二次扰动,从而得到两个用户子图
Figure FDA00035764152300000210
Figure FDA00035764152300000211
并按照步骤2.2-步骤2.5的过程进行处理,从而得到两组用户表征向量
Figure FDA00035764152300000212
Figure FDA00035764152300000213
Figure FDA00035764152300000214
表示从子图
Figure FDA00035764152300000215
获取第i个用户ui的表征向量,
Figure FDA00035764152300000216
表示从子图
Figure FDA00035764152300000217
获取第i个用户ui的表征向量;
根据式(4)建立用户的对比学习损失函数
Figure FDA00035764152300000218
Figure FDA00035764152300000219
式(4)中,
Figure FDA00035764152300000220
表示对用户集合
Figure FDA00035764152300000221
随机抽样用户ui求期望;
Figure FDA00035764152300000222
表示先从用户集合
Figure FDA00035764152300000223
先抽样用户ui,再从用户集合
Figure FDA00035764152300000224
抽样用户ui'后求两次采样的期望;
Figure FDA00035764152300000225
表示计算两个节点特征向量相似度;
步骤3.2、增强产品表征向量:
对用户-商品二部图
Figure FDA00035764152300000226
按照概率ρ随机丢弃图中用户节点以进行二次扰动,从而得到两个产品子图并按照步骤2.2-步骤2.5的过程进行处理,从而得到两组产品表征向量
Figure FDA0003576415230000031
Figure FDA0003576415230000032
Figure FDA0003576415230000033
表示从子图
Figure FDA0003576415230000034
获取第j个用户vj的表征向量,
Figure FDA0003576415230000035
表示从子图
Figure FDA0003576415230000036
获取第j个用户vj的表征向量;
利用式(4)建立产品的对比学习损失函数
Figure FDA0003576415230000037
Figure FDA0003576415230000038
式(4)中,
Figure FDA0003576415230000039
表示对产品集合
Figure FDA00035764152300000310
随机抽样用户vj求期望;
Figure FDA00035764152300000311
表示先从产品集合
Figure FDA00035764152300000312
先抽样用户vj,再从产品集合
Figure FDA00035764152300000313
抽样用户vj',求两次抽样的期望;
步骤3.3、利用式(6)得到节点增强的对比损失函数
Figure FDA00035764152300000314
Figure FDA00035764152300000315
步骤4、利用式(7)计算第i个用户ui和第j个产品vj的交互表征向量hij
Figure FDA00035764152300000316
式(7)中,MLP表示多层感知机,[,]表示向量拼接操作;
步骤5、根据式(8)计算交互对比损失
Figure FDA00035764152300000317
Figure FDA00035764152300000318
式(8)中,
Figure FDA00035764152300000319
表示从交互集合ε中抽样用户-产品对(ui,vj)计算期望,
Figure FDA00035764152300000320
表示先从交互集合ε中抽样用户-产品对(ui,vj),再从交互集合ε中抽样用户-产品对(ui',vj')中抽取负样本对(i',j')后求期望;ei′j′表示第i'个用户ui'对第j'个产品vj'的评论向量;
步骤6、根据式(9)得到第i个用户ui对第j个产品vj的预测评分
Figure FDA00035764152300000321
Figure FDA00035764152300000322
式(9)中;w为参数向量;
步骤6.1、根据式(10)计算评分预测的损失函数
Figure FDA00035764152300000323
Figure FDA00035764152300000324
式(10)中,
Figure FDA00035764152300000325
表示所有的用户-产品对的集合;
步骤6.2、根据式(11)构建总损失函数
Figure FDA0003576415230000041
Figure FDA0003576415230000042
式(11)中,α和β是用于平衡三个损失函数的超参数;
步骤6.3、利用梯度下降法优化所有参数,使得损失函数L收敛至最小,从而得到预测评分误差最小的最优推荐模型,用于实现对产品的推荐。
CN202210345556.9A 2022-03-31 2022-03-31 一种面向评论文本的图神经网络推荐方法 Pending CN114723522A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210345556.9A CN114723522A (zh) 2022-03-31 2022-03-31 一种面向评论文本的图神经网络推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210345556.9A CN114723522A (zh) 2022-03-31 2022-03-31 一种面向评论文本的图神经网络推荐方法

Publications (1)

Publication Number Publication Date
CN114723522A true CN114723522A (zh) 2022-07-08

Family

ID=82241245

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210345556.9A Pending CN114723522A (zh) 2022-03-31 2022-03-31 一种面向评论文本的图神经网络推荐方法

Country Status (1)

Country Link
CN (1) CN114723522A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115829159A (zh) * 2022-12-29 2023-03-21 人民网股份有限公司 社交媒体粉丝新增预测方法、装置、设备及存储介质
CN116167828A (zh) * 2023-04-25 2023-05-26 江苏亿友慧云软件股份有限公司 一种基于图协同和对比学习的物品推荐方法
CN116737934A (zh) * 2023-06-20 2023-09-12 合肥工业大学 一种基于半监督图神经网络的水军虚假评论检测算法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115829159A (zh) * 2022-12-29 2023-03-21 人民网股份有限公司 社交媒体粉丝新增预测方法、装置、设备及存储介质
CN115829159B (zh) * 2022-12-29 2023-11-10 人民网股份有限公司 社交媒体粉丝新增预测方法、装置、设备及存储介质
CN116167828A (zh) * 2023-04-25 2023-05-26 江苏亿友慧云软件股份有限公司 一种基于图协同和对比学习的物品推荐方法
CN116737934A (zh) * 2023-06-20 2023-09-12 合肥工业大学 一种基于半监督图神经网络的水军虚假评论检测算法
CN116737934B (zh) * 2023-06-20 2024-03-22 合肥工业大学 一种基于半监督图神经网络的水军虚假评论检测算法

Similar Documents

Publication Publication Date Title
CN113254803B (zh) 一种基于多特征异质图神经网络的社交推荐方法
CN114723522A (zh) 一种面向评论文本的图神经网络推荐方法
CN109829057B (zh) 一种基于图二阶相似性的知识图谱实体语义空间嵌入方法
CN111275521B (zh) 一种基于用户评论与满意层面嵌入的商品推荐方法
CN108073568B (zh) 关键词提取方法和装置
CN109785062B (zh) 一种基于协同过滤模型的混合神经网络推荐系统
CN110874439B (zh) 一种基于评论信息的推荐方法
CN109740924B (zh) 融合属性信息网络和矩阵分解的物品评分预测方法
CN110288199A (zh) 产品质量预测的方法
CN110222838B (zh) 文档排序方法、装置、电子设备及存储介质
CN111797320B (zh) 数据处理方法、装置、设备及存储介质
CN111241394A (zh) 数据处理方法、装置、计算机可读存储介质及电子设备
CN114780831A (zh) 基于Transformer的序列推荐方法及系统
CN108304853A (zh) 游戏相关度的获取方法、装置、存储介质和电子装置
CN112668809A (zh) 建立自闭症儿童康复效果预测模型的方法、预测自闭症儿童康复效果的方法及系统
CN111447574A (zh) 短信分类方法、装置、系统和存储介质
CN115526093A (zh) Smt印刷参数优化模型的训练方法、设备和存储介质
CN113628059A (zh) 一种基于多层图注意力网络的关联用户识别方法及装置
CN113918834A (zh) 融合社交关系的图卷积协同过滤推荐方法
CN114742564A (zh) 一种融合复杂关系的虚假评论者群体检测方法
CN103281555B (zh) 基于半参考评估的视频流业务QoE客观评估方法
CN114564648A (zh) 基于大数据的个性化服务内容优化方法及人工智能云系统
Saha et al. The Corporeality of Infotainment on Fans Feedback Towards Sports Comment Employing Convolutional Long-Short Term Neural Network
CN115311001A (zh) 一种基于多重投票算法的预测用户换机倾向的方法及系统
CN114936890A (zh) 一种基于逆倾向加权方法的反事实公平的推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination