CN109299373A - 基于图卷积技术的推荐系统 - Google Patents

基于图卷积技术的推荐系统 Download PDF

Info

Publication number
CN109299373A
CN109299373A CN201811224995.4A CN201811224995A CN109299373A CN 109299373 A CN109299373 A CN 109299373A CN 201811224995 A CN201811224995 A CN 201811224995A CN 109299373 A CN109299373 A CN 109299373A
Authority
CN
China
Prior art keywords
user
article
isomery
node
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811224995.4A
Other languages
English (en)
Other versions
CN109299373B (zh
Inventor
徐亚南
朱燕民
沈艳艳
俞嘉地
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN201811224995.4A priority Critical patent/CN109299373B/zh
Publication of CN109299373A publication Critical patent/CN109299373A/zh
Application granted granted Critical
Publication of CN109299373B publication Critical patent/CN109299373B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于图卷积技术的推荐系统,包括:预处理模块、异构图生成模块、模型训练模块以及推荐结果生成模块,其中:预处理模块将用户与物品的交互记录进行数据清洗和格式的标准化操作,并对每个用户生成交互序列后输出至异构图生成模块;异构图生成模块根据用户的交互序列数据构建表征用户偏好、物品间依赖关系和用户间相似性的三个异构图并将生成的图结构数据输出至模型训练模块;模型训练模块基于图结构数据训练图卷积模型,并对每个用户和物品生成向量表达;推荐结果生成模块根据向量表达计算用户对所有物品的偏好情况,并生成最终推荐结果。本发明解决了每个节点邻居数目不等的问题,利用卷积操作挖掘了异构图中节点邻居的信息,提升了推荐的效果。

Description

基于图卷积技术的推荐系统
技术领域
本发明涉及的是一种信息处理领域的技术,具体是一种使用图卷积技术,对用户和物品的交互数据进行挖掘,实现对用户的个性化物品推荐的系统。
背景技术
推荐系统。根据使用的数据类型,推荐系统主要可以分类为基于内容的推荐和协同过滤推荐。前者是基于用户的个人信息和物品的内容信息,进行推荐系统的建模。协同过滤技术则是基于用户与物品交互的历史记录,建模用户对物品的偏好情况。一般来说,协同过滤技术,包括矩阵分解方法,得到的推荐效果要好于基于内容的推荐方法。协同过滤技术使用二维矩阵来表示用户和物品的交互情况。然而,这种简单的用户-物品矩阵只是记录用户和物品的交互情况,却丢失了原始交互序列记录中包含的物品的依赖关系和用户行为上的相似性信息。
为了利用交互序列数据中的物品依赖关系,研究人员提出对时间序列进行建模,提出了马尔科夫链、张量分解、循环神经网络等模型。但是还没有研究基于交互序列数据,同时包含用户对物品的偏好、物品间的依赖关系和用户的行为相似性这三种信息。
图卷积技术。受卷积神经网络在图像处理、自然语言处理和语音识别等领域成功应用的影响,许多研究人员开始探索卷积操作在更广泛的领域的应用,如图结构上使用卷积操作挖掘局部信息。然而,将卷积操作应用到图结构的数据上需要解决每个节点邻居数目不同的问题。现有的图卷积技术包括在频域和空间卷积两种技术。基于频域的技术是使用图的拉普拉斯矩阵的特征向量,构建频域,来完成卷积操作。这种方式比较依赖于图的结构,即图的结构不能随时间变化。空间卷积技术通过使用随机游走、选取最近的N个邻居的等方式解决不同节点邻居数目不同的问题。
发明内容
本发明针对现有的基于用户和物品交互数据的推荐系统,往往只使用了用户对物品的偏好或者物品之间依赖关系中的一种信息的不足,提出一种基于图卷积技术的推荐系统,能够挖掘用户对物品偏好、物品之间依赖关系和用户相似性三种信息;通过将用户和物品的交互序列数据转换成三种异构的图结构数据,解决了每个用户的交互序列长短不一致的问题,同时保留了交互数据中的三种信息;将卷积操作应用于异构图,挖掘了异构图中节点邻居的信息;通过设计池化操作和卷积操作解决了卷积神经网络应用于图结构数据面临的节点邻居数不同的问题。
本发明是通过以下技术方案实现的:
本发明涉及一种基于图卷积技术的推荐系统,包括:预处理模块、异构图生成模块、模型训练模块以及推荐结果生成模块,其中:预处理模块将用户与物品的交互记录进行数据清洗和格式的标准化操作,并对每个用户生成交互序列后输出至异构图生成模块;异构图生成模块根据用户的交互序列数据构建表征用户偏好、物品间依赖关系和用户间相似性的三个异构图并将生成的图结构数据输出至模型训练模块;模型训练模块基于图结构数据训练图卷积模型,并对每个用户和物品生成向量表达;推荐结果生成模块根据向量表达计算用户对所有物品的偏好情况,并生成最终推荐结果。
所述的交互序列是指用户和物品交互记录的时间序列。
本发明涉及上述系统的实现方法,具体包括以下步骤:
步骤1、数据预处理:对用户和物品交互的数据进行数据清洗以去除掉可能存在噪声数据,同时将交互的记录整理成相同的格式,并在数据清洗完成后根据记录的时间戳进行排序,从而为每个用户生成交互的序列。
步骤2、基于交互序列的异构图构建:将每个用户的序列数据转换成三个异构图,来分别保留用户对物品的偏好、物品间的依赖关系和用户的相似性信息。
步骤3、基于异构图的推荐模型训练:基于构建的三个异构图,本发明设计了图卷积推荐系统模型。该模型使用池化和卷积操作,来挖掘图中包含的信息,保留图中节点信息的局部性。在模型训练完成后,该模型为每一个节点(用户和物品)生成低维的向量表达,用于最后的推荐结果生成。
步骤4、推荐结果生成:根据图卷积推荐系统模型生成的低维向量表达,本发明可以针对每个用户,计算其对所有的物品的偏好程度。根据计算的偏好程度,将物品进行排序,就可以得到最终的推荐结果。
技术效果
与现有技术相比,本发明技术效果包括:
(1)表征三种信息的异构图结构:用户和物品之间的交互数据包含用户对物品的偏好、物品之间的相似性和用户之间行为习惯的相似性三种信息。本发明设计了三种异构的图结构,来表征这三种信息,同时解决了不同用户交互序列不等长的问题。
(2)图卷积操作建模邻居节点对目标节点的影响:相似的物品或用户,都可以看做图中目标节点的邻居,如何建模邻居对其产生的影响,是关乎推荐效果好坏的关键所在。本发明设计了基于图卷积的推荐系统模型,使用卷积操作,来建模邻居节点对目标节点的影响。
(3)池化操作解决每个节点邻居数目不同的情况:原始的卷积操作是面向图片等存储于张量中、结构比较规整的数据。该操作在应用于图结构的数据时,解决不了每个节点邻居数不同的情况。本发明针对图结构,设计了新的池化和卷积操作并解决了该问题。
(4)推荐效果的提升:本发明设计了三个异构的图,用于表征用户对物品偏好、物品之间相似性和用户之间行为的相似性三种信息,并提出了新的池化和卷积操作,根据异构图建模每个节点邻居的影响,实现了推荐效果的提升。
附图说明
图1为实施例中基于图卷积的推荐系统流程图;
图2为基于交互序列构建的异构图;
图3为图卷积推荐模型结构示意图;
图4为基于图的池化和卷积操作示意图;
图5为召回率指标对比图;
图6为NDCG指标对比图。
具体实施方式
本实施例针对用户和物品交互序列数据,设计了异构的图结构,提出了一个图卷积推荐模型,而且设计了池化和卷积操作来解决每个节点邻居数目不同的问题。
本实施例涉及一种基于图卷积技术的推荐系统,包括:预处理模块、异构图生成模块、模型训练模块以及推荐结果生成模块,其中:预处理模块将用户与物品的交互记录进行数据清洗和格式的标准化操作,并对每个用户生成交互序列后输出至异构图生成模块;异构图生成模块根据用户的交互序列数据构建表征用户偏好、物品间依赖关系和用户间相似性的三个异构图并将生成的图结构数据输出至模型训练模块;模型训练模块基于图结构数据训练图卷积模型,并对每个用户和物品生成向量表达;推荐结果生成模块根据向量表达计算用户对所有物品的偏好情况,并生成最终推荐结果。
上述推荐系统通过以下方式实现具体工作:
步骤1、数据预处理:将数据的格式进行统一,并对数据做简单的清洗,去除数据中可能存在的噪声。防止数据中的噪声降低推荐的效果。
步骤2、基于交互序列的异构图构建:用户和物品交互序列包含了三种重要的信息。但为原始的交互序列数据,存在序列长度不一致的问题,比较难用于推荐问题。本步骤根据用户和物品的交互序列数据,构建如图2所示的三个图,即用户-物品交互图,物品-物品图和用户-gram图,来分别为这三种信息。
步骤3、基于异构图的推荐模型训练:基于前一个步骤得到的图,可以设计如图3所示的图卷积神经网络推荐模型,为每个用户或物品学习到一个向量表达,将这三种信息应用于推荐。为了解决卷积操作无法应对不同数量邻居的缺陷,如图4所示,本实施例修改了池化和卷积操作。推荐问题在本实施例中被刻画为估计用户和物品节点之间边的存在概率模型。
步骤4、推荐结果的生成:在图卷积神经网络模型训练完成之后,可以利用该模型估计用户和所有物品之间边存在的概率,选择那些概率最大的物品,作为推荐结果推荐给该用户。
所述的数据清洗为指:用户与物品交互过程会产生相应的记录,即<user,item,time>,首先需要对这些交互记录进行清洗,去除一些可能存在的噪声,例如删除购物历史中在夜间凌晨的浏览记录,删除用户在常驻城市以外产生的购物记录等。
所述的时间戳为指:用户在和物品交互的过程中,如用户购买物品,会产生相应的交互记录,交互记录中会包含本次交互所发生的时间,即时间戳。
所述的交互序列为指包括:针对每个用户所产生的记录,根据时间戳进行排序,可以形成如图2所示的交互记录的序列数据。考虑交互序列中,物品在时间上的存在依赖关系,可以根据相邻交互记录间的时间间隔,对交互序列进行进一步处理。当相邻交互记录的时间间隔大于一个设定的阈值,可以认为前后的序列之间不存在依赖关系,可以将该交互序列在此处切分成2个子序列。
所述的异构图的构建,即构建用户-物品图、物品-物品图和用户-gram图后将三个异构的图合并成一个图,其中:
用户-物品图记录用户和物品之间的交互情况,用于为用户对物品的偏好情况。该图的数学形式为GR=(VU∪VI,ER},其中VU和VI分别为用户和物品节点的集合,为用户和物品节点之间的边的集合,当用户和物品之间有过交互的时候,对应的两个节点之间存在一条边eu,i,边的权重为用户和物品之间交互的次数;设定用户和物品的数量分别为M和N,即|VU|=M和|VI|=N。
物品-物品图记录两个物品在序列数据中相邻的次数,用于为物品和物品在序列数据中的依赖关系或相似关系。该图的数学形式为GI=(VI,EI),其中为物品和物品间边的集合,边的权重为两个物品在序列数据中相邻情况出现的次数。
用户-gram图:用户交互的物品序列,可以类比成自然语言处理领域的句子。序列中的物品可以类比成句子中的单词。相应的用户可以类比成一篇文章。在自然语言处理领域,可以将文本处理成n-gram的形式,通过比较两个文本的n-gram重叠的程度,来衡量两个文本的相似性。其中n-gram为句子中连续出现的n个单词,例如句子“I am a student”的2-gram包括“I am”,“am a”和“a student”。类似于自然语言处理,本实施例将序列数据转换成n-gram来衡量用户之间行为习惯上的相似性。基于这种想法,本实施例构建了用户-gram图,即GU=(VU∪VG,EU)。其中VG为n-gram节点的集合,|VG|=O。为用户和n-gram节点之间边的集合,边eu,j的权重为用户u的交互序列中出现n-gram j的次数。
所述的合并为指:G=GR∪GI∪GU。为了简单,也可以用邻接矩阵来表示,即使用矩阵分别为这三种图。矩阵的元素Aij为图中节点i和节点j的连边。
优选地,所述的构建,根据图中的路径定义距离和路径的类型,具体为:假设图中两个节点i和j存在一条路径相连,这条路径的距离D(i,j)就定义为路径上的边的数量,路径的类型T(i,j)就定义为路径首尾两个节点的类型,此外需要注意的为路径的类型还与它所在的图有关联。例如图2中的用户-物品图,对于u1→i1→u4这条路径,它的距离为2,类型为“用户-用户”。
优选地,所述的构建,在图的路径距离和类型定义的基础上对每个节点,定义其的一类邻居集合Nlt(i)={j|D(i,j)=l,T(i,j)=t}。即这些节点j和目标节点i的存在路径,路径的距离为l,类型为t。表1即为三个异构图中,各类节点的邻居情况。在考虑邻居信息的同时,节点本身包含的信息也为十分重要的。因此本实施例在图中添加节点到自己的边,同时定义距离为0的邻居为N0,T(i)(i)={i}。
表1基于路径的距离和类型得到的邻居
所述的基于异构图的推荐模型为指:如图3所示的图卷积神经网络,包括:输入层、嵌入层、池化层、卷积层、输出层,其中:
输入层以三个异构网络的所有节点作为输入数据。每个节点用一个one-hot向量(即只有一个元素为1,其他元素都为0)为这个节点的ID。可以将这些向量拼接成一个输入矩阵
其中每一行为一个节点,d0=M+N+O为节点的总数。其他的信息,如用户的个人信息、物品的特征等,都可以通过与one-hot向量拼接的形式,很容易地加入到该模型中。
嵌入层把高维的one-hot向量转换成每个节点的低维表达,即:H0=VE,其中: 为一个转换矩阵,d1<<d0。对于输出矩阵的每一行都为一个节点的低维表达。
池化层将数目不定的邻居,变换成数目固定的虚拟节点。每个节点的邻居为通过路径和图的类型所决定的。池化操作为指:其中:Nlt(i)为和i距离为l,路径类型为t的邻居集合。为节点j在神经网络第k-1层的向量表达,αij为两个节点之间的关联性强弱。为根据邻居集合Nlt(i)生成的虚拟节点的向量表达。
节点间的关联性强弱,可以使用转移概率来表达。以用户-物品图为例,距离为1的邻居可以用邻接矩阵AR获得。根据邻接矩阵可以构建对角矩阵D,其中对角元素
所述的转移概率矩阵S(1)=D-1AR,根据状态转移概率矩阵,可以计算得到节点距离为2的邻居,即A′=S(1)S(1),其中:节点到自己的概率为0,即A′ii=0。类似的,可以设计对角矩阵Eii=∑jA′ij,计算转移概率矩阵S(2)=E-1A′。
在池化操作过程中,根据邻居的类型,可以设置αij为S(1)和S(2)中的值。物品-物品图和用户-gram图中的邻居转移概率计算方法类似。此外,节点的关联关系其中:为节点i在第k层的向量表达,f(·)为节点关联性计算的一个函数,可以使用一个全连接神经网络来为。
卷积层综合邻居节点信息。根据池化层获得的虚拟节点的向量表达卷积操作为
其中:分别为第k层神经网络对于虚拟节点的卷积核的参数矩阵和偏置,g(·)为激活函数,为第k层输出的第i个节点的向量表达。
异构图中所有同类型的节点都共享参数
本实施例通过设置距离L来获得不同大小的卷积核:其中:L控制每次卷积操作能够考虑到的邻居数量。在同一层神经网络,通过设置多个卷积操作,可以给一个节点获得多个向量表达,最后通过连接操作,把这些向量拼接到一块:
输出层直接输出每个节点的向量表达
所述的模型训练为指:基于将推荐问题刻画成一个图中的边预测问题,用户u和物品i之间边存在的概率其中:G为异构图,hu和hi为用户和物品根据卷积神经网络得到向量表达,σ(·)为sigmoid函数,可以将输出的范围控制在0-1之间。对于(简写为)的真实值定义为:当用户和该物品有过交互,则他们之间的边存在,概率设置为1,否则设置为0,则训练该模型的交叉熵损失函数 其中:为已经用户-物品图存在的边,可以作为正样本。对于每个正样本,针对这个用户,需要采样出若干未交互过的物品,作为负样本,构成训练集合
所述的推荐结果的生成为指:在模型使用梯度下降的方式训练完成之后,对每个用户计算与所有物品之间存在边的概率然后根据估计得到的概率,对物品进行排序,排序最高的几个物品,就可以作为对该用户的个性化推荐的结果。
本系统及方法主要包括了三个组件结构上的创新和最终推荐效果上的提升。
首先,本系统及方法创新性地提出,用户和物品之间交互数据包含三种重要的信息,包括用户对物品的偏好情况、物品之间的相似性、以及用户在行为习惯上的相似性。针对这三种信息,本系统及方法设计了三种对应的异构图,在保留这些信息的同时,解决了不同用户交互序列长短不一致的问题。
其次,根据三种异构图,本系统及方法提出使用卷积操作来建模邻居对每个节点的影响情况。图中所有节点可以共享参数,这样可以减少训练所需的参数数量。
然后,原始的卷积操作是应用在图片等结构规整的数据上的。这些数据可以用张量来存储。在图结构中,每个节点的邻居数目是不相等的,无法直接使用卷积操作。本系统及方法提出了新的池化操作,根据邻居到节点的距离以及路径类型,对邻居进行分簇。每个簇内的邻居通过池化操作,形成一个虚拟的节点。再将卷积操作应用于这些虚拟节点上,从而解决了邻居数目不等的问题。
最后,根据在一个真实的数据集上的实验结果,本系统及方法提出的图卷积推荐系统,在推荐效果上要优于最新的推荐研究成果。实验使用的数据集是一个公开数据集,记录的是网站上零售记录。实验过程中,针对每个用户,推荐k个物品,然后计算召回率和NDCG两个指标。对比的方法包括经典的基于欢迎程度的推荐方法(POP)和BPR方法,以及三种新的推荐方法(FISM、sRMGCN和SMF)。图5和图6显示,本系统及方法提出的图卷积方法PGCN在召回率和NDCG两个指标上都优于其他方法。
上述具体实施可由本领域技术人员在不背离本发明原理和宗旨的前提下以不同的方式对其进行局部调整,本发明的保护范围以权利要求书为准且不由上述具体实施所限,在其范围内的各个实现方案均受本发明之约束。

Claims (11)

1.一种基于图卷积技术的推荐系统,其特征在于,包括:预处理模块、异构图生成模块、模型训练模块以及推荐结果生成模块,其中:预处理模块将用户与物品的交互记录进行数据清洗和格式的标准化操作,并对每个用户生成交互序列后输出至异构图生成模块;异构图生成模块根据用户的交互序列数据构建表征用户偏好、物品间依赖关系和用户间相似性的三个异构图并将生成的图结构数据输出至模型训练模块;模型训练模块基于图结构数据训练图卷积模型,并对每个用户和物品生成向量表达;推荐结果生成模块根据向量表达计算用户对所有物品的偏好情况,并生成最终推荐结果。
2.根据权利要求1所述系统的实现方法,其特征在于,包括以下步骤:
步骤1、数据预处理:对用户和物品交互的数据进行数据清洗以去除掉可能存在噪声数据,同时将交互的记录整理成相同的格式,并在数据清洗完成后根据记录的时间戳,从而为每个用户生成交互的序列;
步骤2、基于交互序列的异构图构建:将每个用户的序列数据转换成三个异构图,来分别保留用户对物品的偏好、物品间的依赖关系和用户的相似性信息;
步骤3、基于异构图的推荐模型训练:基于构建的三个异构图,本发明设计了图卷积推荐系统模型;该模型使用池化和卷积操作,来挖掘图中包含的信息,保留图中节点信息的局部性;在模型训练完成后,该模型为每一个节点生成低维的向量表达,用于最后的推荐结果生成;
步骤4、推荐结果生成:根据图卷积推荐系统模型生成的低维向量表达,本发明可以针对每个用户,计算其对所有的物品的偏好程度;根据计算的偏好程度,将物品进行排序,就可以得到最终的推荐结果。
3.根据权利要求2所述的方法,其特征是,所述的数据清洗为指:用户与物品交互过程会产生相应的记录,即<user,item,time>,首先需要对这些交互记录进行清洗,去除一些可能存在的噪声。
4.根据权利要求2所述的方法,其特征是,所述的时间戳为指:针对每个用户所产生的记录,根据时间戳进行排序,形成交互记录的序列数据;当相邻交互记录的时间间隔大于一个设定的阈值,认为前后的序列之间不存在依赖关系,将该交互序列在此处切分成2个子序列;
所述的交互序列是指用户和物品交互记录的时间序列。
5.根据权利要求2所述的方法,其特征是,所述的异构图的构建,即构建用户-物品图、物品-物品图和用户-gram图后将三个异构的图合并成一个图,其中:
用户-物品图记录用户和物品之间的交互情况,用于为用户对物品的偏好情况;该图的数学形式为GR=(VU∪VI,ER},其中VU和VI分别为用户和物品节点的集合,为用户和物品节点之间的边的集合,当用户和物品之间有过交互的时候,对应的两个节点之间存在一条边eu,i,边的权重为用户和物品之间交互的次数;设定用户和物品的数量分别为M和N,即|VU|=M和|VI|=N;
物品-物品图记录两个物品在序列数据中相邻的次数,用于为物品和物品在序列数据中的依赖关系或相似关系;该图的数学形式为GI=(VI,EI),其中为物品和物品间边的集合,边的权重为两个物品在序列数据中相邻情况出现的次数;
用户-gram图:用户交互的物品序列,类比成自然语言处理领域的句子;序列中的物品类比成句子中的单词;相应的用户类比成一篇文章;在自然语言处理领域,将文本处理成n-gram的形式,通过比较两个文本的n-gram重叠的程度,来衡量两个文本的相似性;其中n-gram为句子中连续出现的n个单词;该用户-gram图具体为GU=(VU∪VG,EU);其中VG为n-gram节点的集合,|VG|=O;为用户和n-gram节点之间边的集合,边eu,j的权重为用户u的交互序列中出现n-gram j的次数。
6.根据权利要求2所述的方法,其特征是,所述的合并为指:G=GR∪GI∪GU;为了为简单,也用邻接矩阵来为,即使用矩阵分别为这三种图;矩阵的元素Aij为图中节点i和节点j的连边。
7.根据权利要求2或5所述的方法,其特征是,所述的构建,根据图中的路径定义距离和路径的类型,具体为:假设图中两个节点i和j存在一条路径相连,这条路径的距离D(i,j)就定义为路径上的边的数量,路径的类型T(i,j)就定义为路径首尾两个节点的类型,此外需要注意的为路径的类型还与它所在的图有关联。
8.根据权利要求7所述的方法,其特征是,所述的构建,在图的路径距离和类型定义的基础上对每个节点,定义其的一类邻居集合Nlt(i)={j|D(i,j)=l,T(i,j)=t},即这些节点j和目标节点i的存在路径,路径的距离为l,类型为t;在图中添加节点到自己的边,同时定义距离为0的邻居为N0,T(i)(i)={i}。
9.根据权利要求2所述的方法,其特征是,所述的基于异构图的推荐模型为指:图卷积神经网络,包括:输入层、嵌入层、池化层、卷积层、输出层。
10.根据权利要求2所述的方法,其特征是,所述的模型训练为指:基于将推荐问题刻画成一个图中的边预测问题,用户u和物品i之间边存在的概率其中:G为异构图,hu和hi为用户和物品根据卷积神经网络得到向量表达,σ(·)为sigmoid函数,将输出的范围控制在0-1之间;对于(简写为)的真实值定义为:当用户和该物品有过交互,则他们之间的边存在,概率设置为1,否则设置为0,则训练该模型的交叉熵损失函数其中:y为已经用户-物品图存在的边,作为正样本;对于每个正样本,针对这个用户,需要采样出若干未交互过的物品,作为负样本,构成训练集合y-
11.根据权利要求2所述的方法,其特征是,所述的推荐结果的生成为指:在模型使用梯度下降的方式训练完成之后,对每个用户计算与所有物品之间存在边的概率然后根据估计得到的概率,对物品进行排序,排序最高的几个物品,就作为对该用户的个性化推荐的结果。
CN201811224995.4A 2018-10-20 2018-10-20 基于图卷积技术的推荐系统 Active CN109299373B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811224995.4A CN109299373B (zh) 2018-10-20 2018-10-20 基于图卷积技术的推荐系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811224995.4A CN109299373B (zh) 2018-10-20 2018-10-20 基于图卷积技术的推荐系统

Publications (2)

Publication Number Publication Date
CN109299373A true CN109299373A (zh) 2019-02-01
CN109299373B CN109299373B (zh) 2021-10-29

Family

ID=65157420

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811224995.4A Active CN109299373B (zh) 2018-10-20 2018-10-20 基于图卷积技术的推荐系统

Country Status (1)

Country Link
CN (1) CN109299373B (zh)

Cited By (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109829517A (zh) * 2019-03-07 2019-05-31 成都医云科技有限公司 目标检测去重方法及装置
CN110008999A (zh) * 2019-03-07 2019-07-12 腾讯科技(深圳)有限公司 目标帐号的确定方法、装置、存储介质及电子装置
CN110019253A (zh) * 2019-04-18 2019-07-16 北京邮电大学 一种分布式的图数据序列采样方法及装置
CN110163890A (zh) * 2019-04-24 2019-08-23 北京航空航天大学 一种面向空基监视的多目标跟踪方法
CN110543935A (zh) * 2019-08-15 2019-12-06 阿里巴巴集团控股有限公司 处理交互序列数据的方法及装置
CN110555469A (zh) * 2019-08-15 2019-12-10 阿里巴巴集团控股有限公司 处理交互序列数据的方法及装置
CN110569437A (zh) * 2019-09-05 2019-12-13 腾讯科技(深圳)有限公司 点击概率预测、页面内容推荐方法和装置
CN110580314A (zh) * 2019-07-16 2019-12-17 华南师范大学 基于图卷积神经网络和动态权重的课程推荐方法和系统
CN110598847A (zh) * 2019-08-15 2019-12-20 阿里巴巴集团控股有限公司 处理交互序列数据的方法及装置
CN110633422A (zh) * 2019-09-16 2019-12-31 安徽大学 一种基于异构信息网络的微博好友推荐方法
CN110674407A (zh) * 2019-09-30 2020-01-10 杭州电子科技大学 基于图卷积神经网络的混合推荐方法
CN110879864A (zh) * 2019-10-29 2020-03-13 南京大学 一种基于图神经网络和注意力机制的上下文推荐方法
CN110969516A (zh) * 2019-12-25 2020-04-07 清华大学 一种商品推荐方法及装置
CN111143705A (zh) * 2019-12-26 2020-05-12 北京工业大学 一种基于图卷积网络的推荐方法
CN111309983A (zh) * 2020-03-10 2020-06-19 支付宝(杭州)信息技术有限公司 基于异构图进行业务处理的方法及装置
CN111461299A (zh) * 2020-03-27 2020-07-28 支付宝(杭州)信息技术有限公司 用户分类模型的训练方法及信息推送方法
CN111523933A (zh) * 2020-04-21 2020-08-11 北京嘀嘀无限科技发展有限公司 一种下单概率预测方法、装置、电子设备及可读存储介质
CN111581488A (zh) * 2020-05-14 2020-08-25 上海商汤智能科技有限公司 一种数据处理方法及装置、电子设备和存储介质
CN111611472A (zh) * 2020-03-31 2020-09-01 清华大学 一种基于图卷积神经网络的捆绑推荐方法及系统
CN111626311A (zh) * 2019-02-27 2020-09-04 京东数字科技控股有限公司 一种异构图数据处理方法和装置
CN111815396A (zh) * 2020-06-04 2020-10-23 清华大学 基于元图的产品筛选方法、系统、设备及存储介质
CN111815403A (zh) * 2020-06-19 2020-10-23 北京石油化工学院 商品推荐方法、装置及终端设备
CN111860768A (zh) * 2020-06-16 2020-10-30 中山大学 一种增强图神经网络点边交互的方法
CN111881342A (zh) * 2020-06-23 2020-11-03 北京工业大学 一种基于图孪生网络的推荐方法
CN111931076A (zh) * 2020-09-22 2020-11-13 平安国际智慧城市科技股份有限公司 基于有权有向图进行关系推荐的方法、装置和计算机设备
CN111967972A (zh) * 2020-08-18 2020-11-20 中国银行股份有限公司 理财产品推荐方法及装置
CN112131471A (zh) * 2020-09-23 2020-12-25 平安国际智慧城市科技股份有限公司 基于无权无向图进行关系推荐的方法、装置、设备及介质
US10936950B1 (en) 2019-08-15 2021-03-02 Advanced New Technologies Co., Ltd. Processing sequential interaction data
US10970350B2 (en) 2019-08-15 2021-04-06 Advanced New Technologies Co., Ltd. Method and apparatus for processing user interaction sequence data
CN112862092A (zh) * 2021-01-26 2021-05-28 中山大学 一种异构图卷积网络的训练方法、装置、设备和介质
CN112905906A (zh) * 2021-01-25 2021-06-04 浙江大学 一种融合局部协同与特征交叉的推荐方法及系统
CN112925977A (zh) * 2021-02-26 2021-06-08 中国科学技术大学 一种基于自监督图表征学习的推荐方法
CN112989539A (zh) * 2021-04-07 2021-06-18 上海交通大学 一种基于交叉路口转移计算的交通预测方法
CN113065950A (zh) * 2021-04-22 2021-07-02 中国工商银行股份有限公司 信用卡额度评估方法及装置
CN113139834A (zh) * 2021-04-29 2021-07-20 北京沃东天骏信息技术有限公司 信息处理方法、装置、电子设备和存储介质
CN113255844A (zh) * 2021-07-06 2021-08-13 中国传媒大学 基于图卷积神经网络交互的推荐方法及系统
CN113486248A (zh) * 2021-07-27 2021-10-08 中国银行股份有限公司 一种应用程序中功能模块的推荐方法及装置
CN113704438A (zh) * 2021-09-06 2021-11-26 中国计量大学 一种基于分层注意力机制的异构图的会话推荐方法
CN113742561A (zh) * 2020-05-27 2021-12-03 北京达佳互联信息技术有限公司 视频推荐方法、装置、电子设备及存储介质
CN114417161A (zh) * 2022-01-21 2022-04-29 杭州碧游信息技术有限公司 基于异构图的虚拟物品时序推荐方法、装置、介质及设备
CN114896491A (zh) * 2022-04-18 2022-08-12 上海二三四五网络科技有限公司 基于聚类的用户个性化热门计算方法、装置、设备及介质
CN117150150A (zh) * 2023-10-31 2023-12-01 中国科学技术大学 一种基于图信号处理的群体推荐方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103955535A (zh) * 2014-05-14 2014-07-30 南京大学镇江高新技术研究院 一种基于元路径的个性化推荐方法及系统
US20160198005A1 (en) * 2015-01-05 2016-07-07 Facebook, Inc. Recommending objects to a social networking system user based in part on topics associated with the objects
CN105843799A (zh) * 2016-04-05 2016-08-10 电子科技大学 一种基于多源异构信息图模型的学术论文标签推荐方法
CN106528758A (zh) * 2016-10-28 2017-03-22 腾讯科技(深圳)有限公司 一种选取图片方法及装置
CN106980659A (zh) * 2017-03-20 2017-07-25 华中科技大学鄂州工业技术研究院 一种基于异构图模型的社交活动推荐方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103955535A (zh) * 2014-05-14 2014-07-30 南京大学镇江高新技术研究院 一种基于元路径的个性化推荐方法及系统
US20160198005A1 (en) * 2015-01-05 2016-07-07 Facebook, Inc. Recommending objects to a social networking system user based in part on topics associated with the objects
CN105843799A (zh) * 2016-04-05 2016-08-10 电子科技大学 一种基于多源异构信息图模型的学术论文标签推荐方法
CN106528758A (zh) * 2016-10-28 2017-03-22 腾讯科技(深圳)有限公司 一种选取图片方法及装置
CN106980659A (zh) * 2017-03-20 2017-07-25 华中科技大学鄂州工业技术研究院 一种基于异构图模型的社交活动推荐方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
董青青等: "基于卷积神经网络的皮肤癌良恶性预测", 《通信技术》 *

Cited By (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111626311B (zh) * 2019-02-27 2023-12-08 京东科技控股股份有限公司 一种异构图数据处理方法和装置
CN111626311A (zh) * 2019-02-27 2020-09-04 京东数字科技控股有限公司 一种异构图数据处理方法和装置
CN110008999A (zh) * 2019-03-07 2019-07-12 腾讯科技(深圳)有限公司 目标帐号的确定方法、装置、存储介质及电子装置
CN109829517A (zh) * 2019-03-07 2019-05-31 成都医云科技有限公司 目标检测去重方法及装置
CN110019253A (zh) * 2019-04-18 2019-07-16 北京邮电大学 一种分布式的图数据序列采样方法及装置
CN110163890A (zh) * 2019-04-24 2019-08-23 北京航空航天大学 一种面向空基监视的多目标跟踪方法
CN110580314A (zh) * 2019-07-16 2019-12-17 华南师范大学 基于图卷积神经网络和动态权重的课程推荐方法和系统
US11636341B2 (en) 2019-08-15 2023-04-25 Advanced New Technologies Co., Ltd. Processing sequential interaction data
US11250088B2 (en) 2019-08-15 2022-02-15 Advanced New Technologies Co., Ltd. Method and apparatus for processing user interaction sequence data
US10936950B1 (en) 2019-08-15 2021-03-02 Advanced New Technologies Co., Ltd. Processing sequential interaction data
US10970350B2 (en) 2019-08-15 2021-04-06 Advanced New Technologies Co., Ltd. Method and apparatus for processing user interaction sequence data
CN110555469A (zh) * 2019-08-15 2019-12-10 阿里巴巴集团控股有限公司 处理交互序列数据的方法及装置
WO2021027256A1 (zh) * 2019-08-15 2021-02-18 创新先进技术有限公司 处理交互序列数据的方法及装置
CN110543935B (zh) * 2019-08-15 2023-06-20 创新先进技术有限公司 处理交互序列数据的方法及装置
CN110598847A (zh) * 2019-08-15 2019-12-20 阿里巴巴集团控股有限公司 处理交互序列数据的方法及装置
CN110543935A (zh) * 2019-08-15 2019-12-06 阿里巴巴集团控股有限公司 处理交互序列数据的方法及装置
CN110598847B (zh) * 2019-08-15 2020-08-28 阿里巴巴集团控股有限公司 处理交互序列数据的方法及装置
CN110569437A (zh) * 2019-09-05 2019-12-13 腾讯科技(深圳)有限公司 点击概率预测、页面内容推荐方法和装置
CN110569437B (zh) * 2019-09-05 2022-03-04 腾讯科技(深圳)有限公司 点击概率预测、页面内容推荐方法和装置
CN110633422B (zh) * 2019-09-16 2022-04-05 安徽大学 一种基于异构信息网络的微博好友推荐方法
CN110633422A (zh) * 2019-09-16 2019-12-31 安徽大学 一种基于异构信息网络的微博好友推荐方法
CN110674407B (zh) * 2019-09-30 2021-10-15 杭州电子科技大学 基于图卷积神经网络的混合推荐方法
CN110674407A (zh) * 2019-09-30 2020-01-10 杭州电子科技大学 基于图卷积神经网络的混合推荐方法
CN110879864B (zh) * 2019-10-29 2022-06-07 南京大学 一种基于图神经网络和注意力机制的上下文推荐方法
CN110879864A (zh) * 2019-10-29 2020-03-13 南京大学 一种基于图神经网络和注意力机制的上下文推荐方法
CN110969516A (zh) * 2019-12-25 2020-04-07 清华大学 一种商品推荐方法及装置
CN110969516B (zh) * 2019-12-25 2024-04-26 清华大学 一种商品推荐方法及装置
CN111143705B (zh) * 2019-12-26 2021-05-28 北京工业大学 一种基于图卷积网络的推荐方法
CN111143705A (zh) * 2019-12-26 2020-05-12 北京工业大学 一种基于图卷积网络的推荐方法
CN111309983A (zh) * 2020-03-10 2020-06-19 支付宝(杭州)信息技术有限公司 基于异构图进行业务处理的方法及装置
CN111309983B (zh) * 2020-03-10 2021-09-21 支付宝(杭州)信息技术有限公司 基于异构图进行业务处理的方法及装置
CN111461299B (zh) * 2020-03-27 2022-08-12 支付宝(杭州)信息技术有限公司 用户分类模型的训练方法及信息推送方法
CN111461299A (zh) * 2020-03-27 2020-07-28 支付宝(杭州)信息技术有限公司 用户分类模型的训练方法及信息推送方法
CN111611472B (zh) * 2020-03-31 2024-02-27 清华大学 一种基于图卷积神经网络的捆绑推荐方法及系统
CN111611472A (zh) * 2020-03-31 2020-09-01 清华大学 一种基于图卷积神经网络的捆绑推荐方法及系统
CN111523933A (zh) * 2020-04-21 2020-08-11 北京嘀嘀无限科技发展有限公司 一种下单概率预测方法、装置、电子设备及可读存储介质
CN111581488A (zh) * 2020-05-14 2020-08-25 上海商汤智能科技有限公司 一种数据处理方法及装置、电子设备和存储介质
CN111581488B (zh) * 2020-05-14 2023-08-04 上海商汤智能科技有限公司 一种数据处理方法及装置、电子设备和存储介质
CN113742561B (zh) * 2020-05-27 2024-01-02 北京达佳互联信息技术有限公司 视频推荐方法、装置、电子设备及存储介质
CN113742561A (zh) * 2020-05-27 2021-12-03 北京达佳互联信息技术有限公司 视频推荐方法、装置、电子设备及存储介质
CN111815396A (zh) * 2020-06-04 2020-10-23 清华大学 基于元图的产品筛选方法、系统、设备及存储介质
CN111815396B (zh) * 2020-06-04 2024-05-31 清华大学 基于元图的产品筛选方法、系统、设备及存储介质
CN111860768A (zh) * 2020-06-16 2020-10-30 中山大学 一种增强图神经网络点边交互的方法
CN111860768B (zh) * 2020-06-16 2023-06-09 中山大学 一种增强图神经网络点边交互的方法
CN111815403B (zh) * 2020-06-19 2024-05-10 北京石油化工学院 商品推荐方法、装置及终端设备
CN111815403A (zh) * 2020-06-19 2020-10-23 北京石油化工学院 商品推荐方法、装置及终端设备
CN111881342A (zh) * 2020-06-23 2020-11-03 北京工业大学 一种基于图孪生网络的推荐方法
CN111967972A (zh) * 2020-08-18 2020-11-20 中国银行股份有限公司 理财产品推荐方法及装置
CN111967972B (zh) * 2020-08-18 2024-02-27 中国银行股份有限公司 理财产品推荐方法及装置
CN111931076A (zh) * 2020-09-22 2020-11-13 平安国际智慧城市科技股份有限公司 基于有权有向图进行关系推荐的方法、装置和计算机设备
CN111931076B (zh) * 2020-09-22 2021-02-09 平安国际智慧城市科技股份有限公司 基于有权有向图进行关系推荐的方法、装置和计算机设备
CN112131471B (zh) * 2020-09-23 2023-10-20 平安国际智慧城市科技股份有限公司 基于无权无向图进行关系推荐的方法、装置、设备及介质
CN112131471A (zh) * 2020-09-23 2020-12-25 平安国际智慧城市科技股份有限公司 基于无权无向图进行关系推荐的方法、装置、设备及介质
CN112905906A (zh) * 2021-01-25 2021-06-04 浙江大学 一种融合局部协同与特征交叉的推荐方法及系统
CN112905906B (zh) * 2021-01-25 2022-07-15 浙江大学 一种融合局部协同与特征交叉的推荐方法及系统
CN112862092A (zh) * 2021-01-26 2021-05-28 中山大学 一种异构图卷积网络的训练方法、装置、设备和介质
CN112862092B (zh) * 2021-01-26 2021-11-26 中山大学 一种异构图卷积网络的训练方法、装置、设备和介质
CN112925977A (zh) * 2021-02-26 2021-06-08 中国科学技术大学 一种基于自监督图表征学习的推荐方法
CN112989539A (zh) * 2021-04-07 2021-06-18 上海交通大学 一种基于交叉路口转移计算的交通预测方法
CN113065950A (zh) * 2021-04-22 2021-07-02 中国工商银行股份有限公司 信用卡额度评估方法及装置
CN113139834A (zh) * 2021-04-29 2021-07-20 北京沃东天骏信息技术有限公司 信息处理方法、装置、电子设备和存储介质
CN113255844A (zh) * 2021-07-06 2021-08-13 中国传媒大学 基于图卷积神经网络交互的推荐方法及系统
CN113486248A (zh) * 2021-07-27 2021-10-08 中国银行股份有限公司 一种应用程序中功能模块的推荐方法及装置
CN113704438B (zh) * 2021-09-06 2022-02-22 中国计量大学 一种基于分层注意力机制的异构图的会话推荐方法
CN113704438A (zh) * 2021-09-06 2021-11-26 中国计量大学 一种基于分层注意力机制的异构图的会话推荐方法
CN114417161A (zh) * 2022-01-21 2022-04-29 杭州碧游信息技术有限公司 基于异构图的虚拟物品时序推荐方法、装置、介质及设备
CN114896491A (zh) * 2022-04-18 2022-08-12 上海二三四五网络科技有限公司 基于聚类的用户个性化热门计算方法、装置、设备及介质
CN117150150A (zh) * 2023-10-31 2023-12-01 中国科学技术大学 一种基于图信号处理的群体推荐方法
CN117150150B (zh) * 2023-10-31 2024-02-09 中国科学技术大学 一种基于图信号处理的群体推荐方法

Also Published As

Publication number Publication date
CN109299373B (zh) 2021-10-29

Similar Documents

Publication Publication Date Title
CN109299373A (zh) 基于图卷积技术的推荐系统
JP6961727B2 (ja) 関心点コピーの生成
CN111914185B (zh) 一种基于图注意力网络的社交网络中文本情感分析方法
CN112529168A (zh) 一种基于gcn的属性多层网络表示学习方法
Li et al. Deep heterogeneous autoencoders for collaborative filtering
CN111460818B (zh) 一种基于增强胶囊网络的网页文本分类方法及存储介质
CN112487199B (zh) 一种基于用户购买行为的用户特征预测方法
CN102929906B (zh) 基于内容特征和主题特征的文本分组聚类方法
JPWO2006087854A1 (ja) 情報分類装置、情報分類方法、情報分類プログラム、情報分類システム
CN109447261B (zh) 一种基于多阶邻近相似度的网络表示学习的方法
CN109034960A (zh) 一种基于用户节点嵌入的多属性推断的方法
CN112632296B (zh) 基于知识图谱具有可解释性的论文推荐方法及系统、终端
CN113918834B (zh) 融合社交关系的图卷积协同过滤推荐方法
CN114298783A (zh) 基于矩阵分解融合用户社交信息的商品推荐方法及系统
CN114692605A (zh) 一种融合句法结构信息的关键词生成方法及装置
CN114528479B (zh) 一种基于多尺度异构图嵌入算法的事件检测方法
CN115687760A (zh) 一种基于图神经网络的用户学习兴趣标签预测方法
CN110910235A (zh) 一种基于用户关系网络的贷中异常行为检测方法
CN111666410B (zh) 商品用户评论文本的情感分类方法及系统
CN117574915A (zh) 基于多方数据源的公共数据平台及其数据分析方法
CN113496259A (zh) 一种融入标签信息的图神经网络推荐方法
CN114842247B (zh) 基于特征累加的图卷积网络半监督节点分类方法
CN114780841A (zh) 一种基于kphan的序列推荐方法
CN107861924A (zh) 一种基于局部重构模型的电子书内容表示方法
CN110852094B (zh) 检索目标的方法、装置及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant