CN110796313B - 一种基于带权图卷积和项目吸引力模型的会话推荐方法 - Google Patents

一种基于带权图卷积和项目吸引力模型的会话推荐方法 Download PDF

Info

Publication number
CN110796313B
CN110796313B CN201911058773.4A CN201911058773A CN110796313B CN 110796313 B CN110796313 B CN 110796313B CN 201911058773 A CN201911058773 A CN 201911058773A CN 110796313 B CN110796313 B CN 110796313B
Authority
CN
China
Prior art keywords
item
node
user session
local
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911058773.4A
Other languages
English (en)
Other versions
CN110796313A (zh
Inventor
施重阳
冯超群
姜欣雨
郝戍峰
张奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN201911058773.4A priority Critical patent/CN110796313B/zh
Publication of CN110796313A publication Critical patent/CN110796313A/zh
Application granted granted Critical
Publication of CN110796313B publication Critical patent/CN110796313B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24564Applying rules; Deductive queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Computational Linguistics (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Operations Research (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种带权图卷积和项目吸引力模型的会话推荐方法,属于推荐系统技术领域。将用户会话转换为与局部作用域和全局作用域对应的局部图和全局图;基于这两类图,从每个会话的个体结构和所有会话的整体结构中获取项目的信息分布;将这两类图用于观察项目之间的邻接关系,找到符合用户会话内部结构的项目邻域,得到邻域项目影响的不同程度;再基于获取项目的信息分布及领域项目影响的不同程度进行会话推荐。所述方法从结构上深层次地捕获会话内部和会话整体的信息分布,使捕获到的信息分布更加精确和有效,同时提高了邻域影响力计算的准确性,进而提高了对会话下一个项目预测的全面性和准确性。

Description

一种基于带权图卷积和项目吸引力模型的会话推荐方法
技术领域
本发明涉及一种带权图卷积和项目吸引力模型的会话推荐方法,属于推荐系统技术领域。
背景技术
会话推荐已经成为推荐领域的一个重要组成部分,并在现代商业系统中得到了广泛且成功地应用。会话推荐利用用户交互会话中的现有项目来预测用户的下一个交互项目。然而,无论是在单个会话中还是在所有会话构成的整体中,项目信息的分布通常是不均匀的,这将导致每个项目对同一会话或不同会话中的其他项目的影响是不平衡的,而且对当前会话的下一个用户交互项目的影响也是不平衡的。
基于模式/规则的方法通过挖掘频繁模式或关联规则来过滤项目信息。然而,这类方法很容易丢失不常见项目的信息。因此,一些研究者引入马尔可夫链来建模用户会话,并计算项目之间的转移概率。这些方法包含所有的项目信息,减少了信息丢失量。最近的研究将神经网络应用于用户会话推荐。这些方法主要通过增加注意力机制来捕捉用户会话内的项目信息分布,并根据会话的上下文信息选择对当前用户会话重要的项目。
现有方法虽然能一定程度上解决项目信息的非均匀分布问题,但仍存在一定的局限性。首先,单个会话内和所有会话所构成的整体中的项目信息分布是不同且互补的。为了明确这两种信息分布的作用域,将每个会话视为本地作用域,而将所有会话构成的整体视为全局作用域。大多数现有方法只考虑本地作用域内的项目信息分布,而忽略全局作用域内的项目信息分布,这是不够全面的。第二,每个项目经常受到其他项目的不同程度的影响,形成该项目的邻域,现有方法没有过多关注邻域项目的不同影响程度。然而,区分邻域项目的不同影响的程度可以提高邻域影响和信息聚合的有效性和准确性。
本发明针对上述存在的问题,致力于提高会话推荐的准确度。
发明内容
本发明的目的是针对会话推荐领域存在的项目信息分布不均匀且不同作用域内的项目信息分布不同的问题,提出一种基于带权图卷积和项目吸引力模型的会话推荐方法。
本发明的核心思想如下:将用户会话转换为与局部作用域和全局作用域对应的局部图和全局图;基于这两类图,从每个会话的个体结构和所有会话的整体结构中获取项目的信息分布;此外,将这两类图用于观察项目之间的邻接关系,找到符合用户会话内部结构的项目邻域,得到邻域项目影响的不同程度;再基于获取项目的信息分布及领域项目影响的不同程度进行会话推荐。
本发明是基于以下技术方案实现的。
所述基于带权图卷积和项目吸引力模型的会话推荐方法,包括如下步骤:
步骤1:计算项目的局部吸引力,具体包括如下子步骤:
步骤1.1:将每个用户会话转换为一个无向图,称为局部图;
其中,局部图中的顶点对应该用户会话中的项目;局部图中的每条边表示用户交互转移,即,若两个项目在该用户会话中相邻,则两个项目在局部图中对应的两个节点之间存在一条边,两个项目在该用户会话中相邻几次,对应的节点间就存在几条边;局部图的个数与用户会话数目相等;
步骤1.2:计算局部图中的每个节点的度,记为局部度;然后计算每个节点对应项目的局部吸引力,项目的局部吸引力为该项目对应节点的局部度除以局部图中所有节点的局部度的和;
步骤2:计算项目的全局吸引力,具体包括如下子步骤:
步骤2.1:将所有用户会话转换为一个无向图,称为全局图;
其中,全局图中的顶点对应所有的用户会话中的项目,每条边表示用户交互转移,即,若两个项目在某一个用户会话中相邻,则两个项目在全局图中对应的两个节点之间存在一条边,两个项目在所有的用户会话中相邻几次,对应的节点间就存在几条边;
步骤2.2:计算全局图中每个节点的度,记为全局度;然后计算每个节点对应项目的全局吸引力,项目的全局吸引力为该项目对应节点的全局度除以全局图中所有节点的全局度的和;
至此,步骤1和步骤2分别得到项目的局部吸引力和全局吸引力,即完成了分别从每个会话的个体结构和所有会话的整体结构中获取项目的信息分布;
步骤3:利用局部图获取项目邻域,计算邻域项目影响的不同程度:
步骤3.1:将所有会话中的项目构成一个项目集合,将该项目集合嵌入到一个向量空间中,得到所有项目的潜在向量表示;
将所有项目对应的类别构成一个类别集合,将该类别集合嵌入到另一个向量空间中得到每个类别的向量表示;
步骤3.2:局部图中每个节点的向量表示初始化为该节点对应的项目的向量表示,将节点向量与项目对应的类别向量相加,得到节点的类别化向量表示;
步骤3.3:对于局部图中的每个节点,把与该节点在局部图中直接相连的节点作为该节点的邻域;然后统计该节点与邻域中每个节点在局部图中的边数,将边数除以该节点的局部度,得到邻域中每个节点的权重,权重表示邻域节点对该节点的影响程度;
至此,步骤3得到了符合用户会话内部结构的项目邻域和邻域项目影响的不同程度;
步骤4:利用带权图卷积聚合邻域影响和信息,计算项目在用户会话中的向量表示,具体为:
步骤4.1:对于局部图中每个节点,将其邻域中的每个节点由步骤3.2得到的类别化节点向量输入到一个前馈神经网络中,得到邻域节点的向量表示;
步骤4.2:对于局部图中的每个节点,采用加权和作为聚合函数来得到其邻域的向量表示,具体为:将邻域中每个节点由步骤3.2得到的向量表示乘以步骤3.3得到的权重,然后将邻域中所有节点的向量表示和权重的相乘结果进行相加,得到邻域的向量表示;
步骤4.3:对于局部图中的每个节点,拼接其由步骤3.2得到的类别化向量表示和由步骤4.2得到的邻域向量表示,并把拼接结果传入一个前馈神经网络,得到该节点的最终向量表示;
步骤4.4:将由步骤4.3得到的节点向量作为该节点对应的项目在当前用户会话中的向量表示;
步骤5:计算项目吸引力模型对用户会话的综合影响,具体包括如下子步骤:
步骤5.1:将用户会话中的每个项目由步骤4得到的向量表示乘以该项目由步骤1得到的项目的局部吸引力,并把所有项目的乘法结果相加;将加和结果传入一个前馈神经网络来得到项目的局部吸引力对当前用户会话的影响;
步骤5.2:将用户会话中的每个项目由步骤4得到的向量表示乘以该项目由步骤2得到的项目的全局吸引力,并把所有项目的乘法结果相加;将加和结果传入一个前馈神经网络来得到项目的全局吸引力对当前用户会话的影响;
步骤5.3:将步骤5.1的结果和步骤5.2的结果进行拼接,并传入一个前馈神经网络来计算项目吸引力对用户会话的综合影响;
步骤6:计算用户长期和短期的兴趣偏好;
步骤6.1:使用GRU层来建模用户的序列行为;为了捕捉每个用户会话中用户的主要意图,在GRU层之前添加一个自注意力机制,计算每个用户会话中每个项目的注意力权重,即,将该用户会话中的每个项目的向量表示与自身进行点积操作,然后将该用户会话中所有项目的点积结果进行相加,得到点积和,再将每个项目的点积结果除以点积和得到每个项目在该用户会话中的注意力权重;
其中,GRU层是使用带有Gated Recurrent Unit的递归神经网络;
步骤6.2:对于每个用户会话,将该用户会话中的每个项目的向量表示乘以该项目的注意力权重,得到带有注意力的项目向量表示;
步骤6.3:对于每个用户会话,将由步骤6.2得到的带有注意力的项目向量表示输入GRU层进行用户偏好学习,选择GRU层的最终隐藏状态作为用户的长期兴趣;
步骤6.4:对于每个用户会话,将其中的最后一个项目作为用户的短期兴趣;
步骤7:对于每个用户会话,将用户的长期兴趣、用户的短期兴趣和项目吸引力模型对该用户会话的综合影响相加,得到该用户会话的向量表示;
步骤8:将步骤3.1得到的所有项目的潜在向量组成项目的潜在向量矩阵,将该矩阵与每个用户会话的向量表示相乘,再经过一个softmax函数,得到所有项目的预测概率分布;
其中,概率分布的每一项表示对应的项目成为当前用户会话的下一项的概率,取概率值最大的前K个项目作为当前用户会话的推荐项目,K可自行设定;
步骤9:使用真实的概率分布与步骤7得到的预测概率分布之间的交叉熵作为损失函数;
至此,经过步骤1至步骤9完成了基于带权图卷积和项目吸引力模型的会话推荐。
有益效果
一种基于带权图卷积和项目吸引力模型的会话推荐方法,与现有会话推荐方法相比,具有以下有益效果:
1.本方法分别挖掘局部作用域内和全局作用域内的信息分布,能够多角度地分析项目所包含的信息,提高了对会话的下一个项目的预测的全面性;
2.本方法将会话转换为局部图和全局图,使局部作用域和全局作用域具体化,并建立项目吸引力模型,通过对项目吸引力的计算,充分挖掘和利用了项目本身的特性,利用吸引力反映项目的重要性和影响力,从结构上深层次地捕获会话内部和会话整体的信息分布,使捕获到的信息分布更加精确和有效,提高了预测的准确性;
3.本方法利用建立的局部图和全局图,能够直观地观察到项目间的邻接关系和转换关系,从而找到符合会话内部结构的项目邻域和区分邻域影响的不同程度,并通过带权图卷积聚合邻域的影响,提高了邻域影响力计算的准确性。
附图说明
图1为本发明一种基于带权图卷积和项目吸引力模型的会话推荐方法的流程图;
整个结构图分为四部分,分别表示项目吸引力模型、带权图卷积计算、用户偏好挖掘和推荐项目预测;
图2为本发明一种基于带权图卷积和项目吸引力模型的会话推荐方法的局部图建立示例图;
图3为本发明一种基于带权图卷积和项目吸引力模型的会话推荐方法的全局图建立示例图。
具体实施方式
根据上述技术方案,下面通过具体实施例对本发明一种基于带权图卷积和项目吸引力模型的会话推荐方法进行详细说明。
实施例1
本实例将本发明提出的方法应用于会话推荐业务场景中,利用本发明提出的方法处理用户交互会话数据,根据本发明方法得到的结果,预测用户在会话中的下一个交互项,实现会话推荐。
以Yoochoose和MovieLens-10M两个数据集为例进行说明,两个数据集网址分别是http://2015.recsyschallenge.com/challege.html和http://files.grouplens.org/datasets/movielens/;其中,Yoochoose数据集为RecSys2015年挑战赛官方提供的数据集之一,该数据集包含某个电子商务网站的所有用户在6个月内的点击会话,每个会话由一个用户在一段时间内点击过的商品组成;MovieLens-10M数据集来自MovieLens网站,该数据集包含1000万条用户对电影的评分数据,每条数据由用户ID、电影ID、电影类别、评分和时间戳组成;
对于Yoochoose数据集,会话推荐的任务是根据会话中已知的商品信息,预测用户在该会话中要点击的下一个商品;对于MovieLens数据集,首先将每个用户的评分数据以十分钟为间隔切分成多个会话,然后根据会话中已知的电影信息,预测用户在该会话中要评分的下一个电影;
图1为本方法的流程图及本实施例的流程图;所述基于带权图卷积和项目吸引力模型的会话推荐方法,具体实施时,包括如下步骤:
步骤A:对两个数据集进行预处理。将MovieLens-10M数据集中每个用户在十分钟内的交互历史切分为一个用户会话。然后对于两个数据集,分别过滤掉其中出现次数小于5的项目和长度小于2的会话,再把两个数据集分别切分为训练集和测试集;
输入的会话数据中所有出现过的项目构成集合V={v1,v2,…,vN},N为项目总数;所有项目对应的类别构成类别集合C={c1,c2,…,cM},M为类别总数;s={vs,1,vs,2,…,vs,t}表示一个用户会话,其中,vs,i∈V表示用户在时间i交互的项目;
步骤B:将每条用户会话转换为局部图,如图2所示;Gl,s=(Vs,Es)表示由用户会话s构成的局部图,
Figure BDA0002257285050000083
表示构成局部图Gl,s的所有节点,每个节点对应用户会话s中的一个项目;Es表示构成局部图Gl,s的所有边,表示用户交互转移,例如边(vs,i-1,vs,i)∈Es表示用户交互从项目vs,i-1转移到项目vs,i或从项目vs,i转移到项目vs,i-1
然后计算局部图中每个节点的度,由公式(1)得到每个项目的局部吸引力:
Figure BDA0002257285050000081
其中,
Figure BDA0002257285050000082
表示项目vs,i的局部吸引力,local_degree(vs,i)为局部度,表示项目vs,i在局部图Gl,s中对应的节点的度;
以Yoochoose数据集中的一条用户会话举例,会话的ID为11446016,该会话中的项目ID依次为{214595855,214836819,214595855,214596435,214595855,214587952,214596435},该会话中项目对应的局部吸引力为{0.296714336,0.014772536,0.296714336,0.040155917,0.296714336,0.014772536,0.040155917};
步骤C:将所有的用户会话转换为全局图,如图3所示;用Gg=(V,Eg)表示全局图,其中,全局图Gg中每个节点对应的项目集合V中的项目,Eg表示构成全局图的所有边,每条边表示用户交互转移;
然后计算全局图中每个节点的度,由公式(2)得到每个项目的全局吸引力:
Figure BDA0002257285050000091
其中,
Figure BDA0002257285050000092
表示项目vs,i的全局吸引力,global_degree(vs,i)为全局度,表示项目vs,i在全局图Gg中对应的节点的度;
ID为11446016的会话中的项目对应的全局吸引力为{0.305716336,0.000102556,0.305716336,0.041374207,0.305716336,3.44038E-08,0.041374207};
步骤D:将项目集合V嵌入到一个向量空间
Figure BDA0002257285050000093
中,得到项目vi∈V的潜在向量表示
Figure BDA0002257285050000094
d表示向量维度,d=100;局部图Gl,s中每个节点的向量表示xs,i初始化为该节点对应的项目vi的向量表示xi
将类别集合C嵌入到另一个向量空间
Figure BDA0002257285050000095
中得到每个类别的向量表示,
Figure BDA0002257285050000096
Figure BDA0002257285050000097
表示项目vi对应类别ci的向量表示,d表示向量维度,d=100;
然后将节点向量与项目对应的类别向量相加,得到节点的类别化的向量表示
Figure BDA0002257285050000098
如公式(3)所示:
Figure BDA0002257285050000099
步骤E:对于局部图Gl,s中的每个节点vs,i,取与该节点在局部图中直接相连的节点作为该节点的邻域
Figure BDA00022572850500000910
然后根据公式(4)计算每个邻域节点
Figure BDA00022572850500000911
Figure BDA00022572850500000912
的权重
Figure BDA00022572850500000913
Figure BDA00022572850500000914
其中,|vs,i,vs,j|表示在局部图Gl,s中,vs,i和vs,j之间的边数;
在会话ID为11446016的会话中,以项目ID为214595855的项目举例,该项目的邻域
Figure BDA0002257285050000101
每个邻域项目对应的权重分别为0.4、0.4和0.2;
步骤F:把每个邻域项目
Figure BDA0002257285050000102
的类别化向量表示
Figure BDA0002257285050000103
都输入到一个前馈神经网络中,得到邻域节点vs,j的向量表示ns,j,如公式(5)所示:
Figure BDA0002257285050000104
其中,使用ReLU作为神经网络的激活函数,
Figure BDA0002257285050000105
为神经网络权重参数,
Figure BDA0002257285050000106
均为神经网络偏置参数;
步骤G:将步骤E得到的邻域项目权重
Figure BDA0002257285050000107
与步骤F得到的邻域项目最终的向量表示ns,j进行对应相乘,并把所有的邻域项目的相乘结果进行相加,即根据公式(6)得到整个邻域的综合向量表示ns,i
Figure BDA0002257285050000108
步骤H:把节点的类别化表示
Figure BDA0002257285050000109
和其邻域的综合向量表示ns,i进行拼接,再把拼接结果传入另一个前馈神经网络,即根据公式(7),得到最终的节点向量:
Figure BDA00022572850500001010
其中,
Figure BDA00022572850500001011
为神经网络权重参数,
Figure BDA00022572850500001012
为神经网络偏置参数;
将该节点的最终向量表示vs,i作为该节点对应的项目vs,i在用户会话s中的向量表示;
步骤I:把用户会话s中的每个项目由步骤H得到的向量表示vs,i表示乘以该项目由步骤B得到的局部吸引力
Figure BDA00022572850500001013
并把所有项目的乘法结果相加,再传入一个前馈神经网络,即根据公式(8)得到项目的局部吸引力对用户会话s的影响
Figure BDA00022572850500001014
Figure BDA00022572850500001015
其中,
Figure BDA0002257285050000111
为神经网络权重参数,
Figure BDA0002257285050000112
为神经网络偏置参数,神经网络的激活函数采用sigmoid函数,用σ表示;
步骤J:把用户会话s中的每个项目由步骤H得到的向量表示vs,i乘以该项目由步骤C得到的全局吸引力
Figure BDA0002257285050000113
并把所有项目的乘法结果相加,再传入一个前馈神经网络,即根据公式(9)得到项目的全局吸引力对用户会话s的影响
Figure BDA0002257285050000114
Figure BDA0002257285050000115
其中,
Figure BDA0002257285050000116
为神经网络权重参数,
Figure BDA0002257285050000117
为神经网络偏置参数,神经网络的激活函数采用sigmoid函数,用σ表示;
步骤K:将
Figure BDA0002257285050000118
Figure BDA0002257285050000119
进行拼接并传入一个前馈神经网络,即根据公式(10)得到项目吸引力模型对用户会话的综合影响:
Figure BDA00022572850500001110
其中,
Figure BDA00022572850500001111
为项目吸引力模型对用户会话的s的综合影响,
Figure BDA00022572850500001112
Figure BDA00022572850500001113
为神经网络权重参数,
Figure BDA00022572850500001114
为神经网络偏置参数,神经网络激活函数采用sigmoid函数,用σ表示;
步骤L:把用户会话s中的每个项目的向量表示vs,i代入自注意力机制公式,即公式(11),得到每个项目在该用户会话s中的自注意力权重βs,i
Figure BDA00022572850500001115
根据公式(12)更新GRU层i时刻的输入os,i,其中,GRU层的隐藏单元数设置为100:
os,i=βs,ivs,i (12)
通过Gated Recurrent Unit的更新公式(13)到(16),GRU层的输出被不断更新:
zt=σ(Wzos,t+Uzht-1), (13)
rt=σ(Wros,t+Urht-1), (14)
Figure BDA0002257285050000121
Figure BDA0002257285050000122
选择最终的隐藏状态
Figure BDA0002257285050000123
作为用户的长期兴趣,用户的长期兴趣由
Figure BDA0002257285050000124
表示,如公式(17)所示:
Figure BDA0002257285050000125
再根据公式(18)取用户会话s的最后一个项目作为用户的短期兴趣偏好
Figure BDA0002257285050000126
Figure BDA0002257285050000127
步骤M:由公式(19),将用户的长期兴趣
Figure BDA0002257285050000128
用户的短期兴趣
Figure BDA0002257285050000129
和项目吸引力模型对会话s的综合影响sa相加,得到会话s的向量表示s:
Figure BDA00022572850500001210
步骤N:将集合V中的所有项目由步骤D得到的向量表示组成一个N行100列的矩阵,将该矩阵与用户会话s的向量表示s相乘,再经过一个softmax函数,即根据公式(20)得到所有项目成为用户会话s的下一个项目的概率分布:
Figure BDA00022572850500001211
其中,
Figure BDA00022572850500001212
表示项目的潜在向量矩阵,xi表示由步骤D得到的项目vi的潜在向量表示,
Figure BDA00022572850500001213
为项目vi成为会话s的下一项的概率;
取概率值最大的前20个项目作为当前会话的候选推荐项目,即K=20;
步骤O:使用交叉熵作为损失函数,如公式(21)所示:
Figure BDA00022572850500001214
其中,y是真实的概率分布;
从均值为0、标准差为0.1的高斯分布中初始化所有参数,然后利用Adam优化器来最小化公式(21)定义的损失函数,其中初始学习率设置为0.001,学习率衰减率设置为0.1,学习率衰减步长设置为3。此外,为防止过拟合,加入L2正则化,正则化系数设置为10-5
根据以上步骤的操作过程,即可实现会话推荐,为每个用户会话预测其可能的下一个项目。
经过上述步骤的操作,采用本发明提出的方法(基于带权图卷积和项目吸引力模型的会话推荐方法)得到的推荐结果的准确率(Precision)和平均倒数排名(MRR)如表1中最后一行所示。
为说明本发明的推荐效果,在同等条件下,以相同的实验数据集分别采用POP、S-POP、Item-KNN、BPR-MF、FPMC、GRU4Rec、NARM、STAMP和SR-GNN方法进行比较,得到的分类结果的准确率和平均倒数排名在表1中的第3行到第11行显示。
通过表1能够得到以下结论:基于带权图卷积和项目吸引力模型的会话推荐方法实现了比现有会话推荐方法更高的准确率和平均倒数排名,验证了本发明的有效性。
表1:10种会话推荐方式效果比较
Figure BDA0002257285050000131
需要强调的是,对于本领域技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进,这些也应视为属于本发明的保护范围。

Claims (5)

1.一种基于带权图卷积和项目吸引力模型的会话推荐方法,其特征在于:包括如下步骤:
步骤1:计算项目的局部吸引力,具体包括如下子步骤:
步骤1.1:将每个用户会话转换为一个无向图,称为局部图;
其中,局部图中的顶点对应该用户会话中的项目;局部图中的每条边表示用户交互转移,即,若两个项目在该用户会话中相邻,则两个项目在局部图中对应的两个节点之间存在一条边,两个项目在该用户会话中相邻几次,对应的节点间就存在几条边;
步骤1.2:计算局部图中的每个节点的度,记为局部度;然后计算每个节点对应项目的局部吸引力,项目的局部吸引力为该项目对应节点的局部度除以局部图中所有节点的局部度的和;
步骤2:计算项目的全局吸引力,具体包括如下子步骤:
步骤2.1:将所有用户会话转换为一个无向图,称为全局图;
其中,全局图中的顶点对应所有的用户会话中的项目,每条边表示用户交互转移,即,若两个项目在某一个用户会话中相邻,则两个项目在全局图中对应的两个节点之间存在一条边,两个项目在所有的用户会话中相邻几次,对应的节点间就存在几条边;
步骤2.2:计算全局图中每个节点的度,记为全局度;然后计算每个节点对应项目的全局吸引力,项目的全局吸引力为该项目对应节点的全局度除以全局图中所有节点的全局度的和;
至此,步骤1和步骤2分别得到项目的局部吸引力和全局吸引力,即完成了分别从每个会话的个体结构和所有会话的整体结构中获取项目的信息分布;
步骤3:利用局部图获取项目邻域,计算邻域项目影响的不同程度:
步骤3.1:将所有会话中的项目构成一个项目集合,将该项目集合嵌入到一个向量空间中,得到所有项目的潜在向量表示;
将所有项目对应的类别构成一个类别集合,将该类别集合嵌入到另一个向量空间中得到每个类别的向量表示;
步骤3.2:局部图中每个节点的向量表示初始化为该节点对应的项目的向量表示,将节点向量与项目对应的类别向量相加,得到类别化节点向量;
步骤3.3:对于局部图中的每个节点,把与该节点在局部图中直接相连的节点作为该节点的邻域;然后统计该节点与邻域中每个节点在局部图中的边数,将边数除以该节点的局部度,得到邻域中每个节点的权重,权重表示邻域节点对该节点的影响程度;
至此,步骤3得到了符合用户会话内部结构的项目邻域和邻域项目影响的不同程度;
步骤4:利用带权图卷积聚合邻域影响和信息,计算项目在用户会话中的向量表示,具体为:
步骤4.1:对于局部图中每个节点,将其邻域中的每个节点由步骤3.2得到的类别化节点向量输入到一个前馈神经网络中,得到邻域节点的向量表示;
步骤4.2:对于局部图中的每个节点,采用加权和作为聚合函数来得到其邻域的向量表示;
步骤4.3:对于局部图中的每个节点,拼接其由步骤3.2得到的类别化节点向量表示和由步骤4.2得到的邻域的向量表示,并把拼接结果传入一个前馈神经网络,得到该节点的最终向量表示;
步骤4.4:将由步骤4.3得到的节点向量作为该节点对应的项目在当前用户会话中的向量表示;
步骤5:计算项目吸引力模型对用户会话的综合影响,具体包括如下子步骤:
步骤5.1:将用户会话中的每个项目由步骤4得到的向量表示乘以该项目由步骤1得到的项目的局部吸引力,并把所有项目的乘法结果相加;将加和结果传入一个前馈神经网络来得到项目的局部吸引力对当前用户会话的影响;
步骤5.2:将用户会话中的每个项目由步骤4得到的向量表示乘以该项目由步骤2得到的项目的全局吸引力,并把所有项目的乘法结果相加;将加和结果传入一个前馈神经网络来得到项目的全局吸引力对当前用户会话的影响;
步骤5.3:将步骤5.1的结果和步骤5.2的结果进行拼接,并传入一个前馈神经网络来计算项目吸引力对用户会话的综合影响;
步骤6:计算用户长期和短期的兴趣偏好;
步骤6.1:使用GRU层来建模用户的序列行为;为了捕捉每个用户会话中用户的主要意图,在GRU层之前添加一个自注意力机制,计算每个用户会话中每个项目的注意力权重,即,将该用户会话中的每个项目的向量表示与自身进行点积操作,然后将该用户会话中所有项目的点积结果进行相加,得到点积和,再将每个项目的点积结果除以点积和得到每个项目在该用户会话中的注意力权重;
步骤6.2:对于每个用户会话,将该用户会话中的每个项目的向量表示乘以该项目的注意力权重,得到带有注意力的项目向量表示;
步骤6.3:对于每个用户会话,将由步骤6.2得到的带有注意力的项目向量表示输入GRU层进行用户偏好学习,选择GRU层的最终隐藏状态作为用户的长期兴趣;
步骤6.4:对于每个用户会话,将其中的最后一个项目作为用户的短期兴趣;
步骤7:对于每个用户会话,将用户的长期兴趣、用户的短期兴趣和项目吸引力模型对该用户会话的综合影响相加,得到该用户会话的向量表示;
步骤8:将步骤3.1得到的所有项目的潜在向量组成项目的潜在向量矩阵,将该矩阵与每个用户会话的向量表示相乘,再经过一个softmax函数,得到所有项目的预测概率分布;
步骤9:使用真实的概率分布与步骤8得到的预测概率分布之间的交叉熵作为损失函数。
2.根据权利要求1所述的一种基于带权图卷积和项目吸引力模型的会话推荐方法,其特征在于:步骤1.1中,局部图的个数与用户会话数目相等。
3.根据权利要求1所述的一种基于带权图卷积和项目吸引力模型的会话推荐方法,其特征在于:步骤4.2,具体为:将邻域中每个节点由步骤3.2得到的向量表示乘以步骤3.3得到的权重,然后将邻域中所有节点的向量表示和权重的相乘结果进行相加,得到邻域的向量表示。
4.根据权利要求1所述的一种基于带权图卷积和项目吸引力模型的会话推荐方法,其特征在于:步骤6.1中,GRU层是使用带有Gated Recurrent Unit的递归神经网络。
5.根据权利要求1所述的一种基于带权图卷积和项目吸引力模型的会话推荐方法,其特征在于:步骤8中,概率分布的每一项表示对应的项目成为当前用户会话的下一项的概率,取概率值最大的前K个项目作为当前用户会话的推荐项目,K自行设定。
CN201911058773.4A 2019-11-01 2019-11-01 一种基于带权图卷积和项目吸引力模型的会话推荐方法 Active CN110796313B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911058773.4A CN110796313B (zh) 2019-11-01 2019-11-01 一种基于带权图卷积和项目吸引力模型的会话推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911058773.4A CN110796313B (zh) 2019-11-01 2019-11-01 一种基于带权图卷积和项目吸引力模型的会话推荐方法

Publications (2)

Publication Number Publication Date
CN110796313A CN110796313A (zh) 2020-02-14
CN110796313B true CN110796313B (zh) 2022-05-31

Family

ID=69440687

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911058773.4A Active CN110796313B (zh) 2019-11-01 2019-11-01 一种基于带权图卷积和项目吸引力模型的会话推荐方法

Country Status (1)

Country Link
CN (1) CN110796313B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111294619B (zh) * 2020-02-28 2021-09-10 电子科技大学 一种用于iptv领域的长短期兴趣建模方法
CN113449176A (zh) * 2020-03-24 2021-09-28 华为技术有限公司 基于知识图谱的推荐方法及装置
CN111460331B (zh) * 2020-04-07 2020-12-25 中国计量大学 一种基于时空图的会话推荐方法
CN111581519B (zh) * 2020-05-25 2022-10-18 中国人民解放军国防科技大学 基于会话中用户意图的物品推荐方法和系统
CN112559905B (zh) * 2020-12-24 2022-09-06 北京理工大学 一种基于双模式注意力机制和社交相似度的会话推荐方法
CN112650933B (zh) * 2021-01-06 2024-05-07 大连理工大学 一种基于高阶聚合的图卷积融合多头注意力机制的会话推荐方法
CN113239147A (zh) * 2021-05-12 2021-08-10 平安科技(深圳)有限公司 基于图神经网络的智能会话方法、系统及介质
CN113935811B (zh) * 2021-10-26 2024-05-14 重庆理工大学 基于主题指导和双全局注意力的会话推荐方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108476168A (zh) * 2016-05-18 2018-08-31 苹果公司 在图形消息传送用户界面中应用确认选项
CN109543112A (zh) * 2018-11-30 2019-03-29 苏州大学 一种基于循环卷积神经网络的序列推荐方法及装置
CN109816101A (zh) * 2019-01-31 2019-05-28 中科人工智能创新技术研究院(青岛)有限公司 一种基于图卷积神经网络的会话序列推荐方法及系统
CN110060097A (zh) * 2019-04-01 2019-07-26 苏州市职业大学 基于注意力机制和卷积神经网络的用户行为序列推荐方法
CN110119467A (zh) * 2019-05-14 2019-08-13 苏州大学 一种基于会话的项目推荐方法、装置、设备及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2329419A4 (en) * 2008-09-15 2016-01-13 James A Aman AUTOMATED SESSION RECORDING WITH RULE-BASED INDEXING, ANALYSIS AND EXPRESSION OF CONTENT

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108476168A (zh) * 2016-05-18 2018-08-31 苹果公司 在图形消息传送用户界面中应用确认选项
CN109543112A (zh) * 2018-11-30 2019-03-29 苏州大学 一种基于循环卷积神经网络的序列推荐方法及装置
CN109816101A (zh) * 2019-01-31 2019-05-28 中科人工智能创新技术研究院(青岛)有限公司 一种基于图卷积神经网络的会话序列推荐方法及系统
CN110060097A (zh) * 2019-04-01 2019-07-26 苏州市职业大学 基于注意力机制和卷积神经网络的用户行为序列推荐方法
CN110119467A (zh) * 2019-05-14 2019-08-13 苏州大学 一种基于会话的项目推荐方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN110796313A (zh) 2020-02-14

Similar Documents

Publication Publication Date Title
CN110796313B (zh) 一种基于带权图卷积和项目吸引力模型的会话推荐方法
CN111563164B (zh) 一种基于图神经网络的特定目标情感分类方法
CN108763362B (zh) 基于随机锚点对选择的局部模型加权融合Top-N电影推荐方法
CN111222332B (zh) 一种结合注意力网络和用户情感的商品推荐方法
CN111797321A (zh) 一种面向不同场景的个性化知识推荐方法及系统
CN112364976B (zh) 基于会话推荐系统的用户偏好预测方法
CN112733018B (zh) 一种基于图神经网络gnn和多任务学习的会话推荐方法
CN111753209B (zh) 一种基于改进时序卷积网络的序列推荐列表生成方法
CN109544197A (zh) 一种用户流失预测方法和装置
CN111737578A (zh) 一种推荐方法及系统
CN112819575B (zh) 一种考虑重复购买行为的会话推荐方法
CN113591971B (zh) 基于dpi时间序列词嵌入向量的用户个性行为预测方法
CN112650933B (zh) 一种基于高阶聚合的图卷积融合多头注意力机制的会话推荐方法
CN112765461A (zh) 一种基于多兴趣胶囊网络的会话推荐方法
CN114637911A (zh) 一种注意力融合感知网络的下一个兴趣点推荐方法
CN112862567A (zh) 一种在线展会的展品推荐方法与系统
CN112883268A (zh) 一种考虑用户多兴趣以及社交影响的会话推荐方法
CN113254795A (zh) 一种推荐模型的训练方法和装置
CN116228280A (zh) 基于大数据的用户需求预测方法
CN112559905B (zh) 一种基于双模式注意力机制和社交相似度的会话推荐方法
CN115293812A (zh) 一种基于长短期兴趣的电商平台会话感知推荐预测方法
CN114519600A (zh) 一种融合相邻节点方差的图神经网络ctr预估算法
CN114880490A (zh) 一种基于图注意力网络的知识图谱补全方法
CN114625969A (zh) 一种基于交互近邻会话的推荐方法
CN114329167A (zh) 超参数学习、智能推荐、关键词和多媒体推荐方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant