CN111581520B - 基于会话中物品重要性的物品推荐方法和系统 - Google Patents

基于会话中物品重要性的物品推荐方法和系统 Download PDF

Info

Publication number
CN111581520B
CN111581520B CN202010450422.4A CN202010450422A CN111581520B CN 111581520 B CN111581520 B CN 111581520B CN 202010450422 A CN202010450422 A CN 202010450422A CN 111581520 B CN111581520 B CN 111581520B
Authority
CN
China
Prior art keywords
item
importance
representation
user
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010450422.4A
Other languages
English (en)
Other versions
CN111581520A (zh
Inventor
蔡飞
陈皖玉
潘志强
宋城宇
王祎童
凌艳香
张鑫
陈洪辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN202010450422.4A priority Critical patent/CN111581520B/zh
Publication of CN111581520A publication Critical patent/CN111581520A/zh
Priority to US17/325,053 priority patent/US20210366024A1/en
Priority to US17/693,761 priority patent/US20220198546A1/en
Application granted granted Critical
Publication of CN111581520B publication Critical patent/CN111581520B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于会话中物品重要性的物品推荐方法和系统,通过重要性提取模块来提取会话中各个物品的重要性,再结合所述重要性和对应的物品获得用户的长期偏好,从而结合所述用户的当前兴趣和长期偏好准确的获得所述用户的偏好,最后再根据所述用户的偏好进行物品推荐,有效的提高了物品推荐的准确性,且降低了物品推荐模型的计算复杂度。

Description

基于会话中物品重要性的物品推荐方法和系统
技术领域
本发明属于内容推荐技术领域,具体是涉及到一种基于会话中物品重要性的物品推荐方法和系统。
背景技术
基于会话的物品推荐大都为基于匿名会话的物品预测,其主要目的就是从给定的物品集中预测用户在下个会话中可能感兴趣的物品,并将所述可能感兴趣的物品推荐给用户。目前大多数基于匿名会话的物品推荐模型大多都通过关注用户的交互历史来预测用户的偏好,从而根据用户的偏好来推荐物品。然而,对于一些历史的用户-物品交互不可用的情况,准确的捕捉用户的偏好是一个很大的挑战。
基于用户-物品交互不可用的情况,我们需要仅仅根据当前正在进行的会话来产生物品推荐。现有的一些做法如应用门控循环单元(GRU)来建模用户在会话中的时序行为捕捉用户的偏好来产生推荐,或者借助于注意力机制来捕捉用户主要意图来产生推荐,又或者采用门控图神经网络(GGNN)来产生准确的物品嵌入向量和建模物品之间复杂的传递关系从而进行预测。现有的这些做法均未能对一个重要信息的来源有足够的关注,因而不能够准确地定位到会话中重要物品来生成用户偏好。由于在产生物品的嵌入向量后,每个物品的重要性仅仅是简单地根据它与长期历史中物品的混合、最后一个物品或者二者的结合的相关度来确定。不可避免地,在会话中会存在有不相关的物品,特别是在长会话中,使得推荐模型很难去关注于重要的物品。因此,在提出关注会话中物品的重要性的物品推荐模型对提高物品推荐的准确性极为重要。
发明内容
有鉴于此,本发明提供了一种基于会话中物品的重要性的物品推荐方法和系统以避免现有技术中基于当前会话进行物品推荐的方法中由于会话中存在不相关的物品对推荐准确度的影响。
一种基于会话中物品重要性的物品推荐方法,用于从物品集中预测所述用户在下一个时刻可能交互的物品作为目标物品推荐给所述用户,基于训练好的推荐模型进行的步骤包括:
将当前会话中的各个物品嵌入到一个d维向量表示,以获得物品嵌入向量,并将所述当前会话中最后一个物品对应的物品嵌入向量作为所述用户的当前兴趣表示,
根据所述物品嵌入向量获取各个所述物品的重要性表示,并将所述重要性表示与所述物品嵌入向量相结合来获得所述用户的长期偏好表示,
将所述当前兴趣表示和所述长期偏好表示通过连接操作进连接,以获得所述用户的偏好表示,
根据所述偏好表示和所述物品嵌入向量获得所述目标物品并推荐给所述用户。
优选地,根据所述物品嵌入向量获取各个所述物品的重要性表示,包括:
将所述当前会话中的各个物品对应各个所述物品嵌入向量构成的物品嵌入向量集分别通过非线性转换函数转换到第一向量空间和第二向量空间,以分别获得第一转换向量和第二转换向量,所述非线性转换函数为是以非线性方式从所述物品嵌入向量中学习信息的转换函数,
获取所述第一转换向量和第二转换向量之间的关联矩阵,
根据所述关联矩阵获得所述重要性表示。
优选地,根据所述关联矩阵获得所述重要性表示包括:
根据所述关联矩阵获取所述当前会话中的一个物品与所述当前会话中的其它物品的平均相似度,以作为所述一个物品的重要性分数,
通过第一归一化层归一化所述重要性分数,以获得所述一个物品的重要性表示。
优选地,在根据所述关联矩阵获得所述重要性表示过程中,通过一个遮蔽操作来遮蔽所述关联矩阵的对角线。
优选地,根据所述偏好表示来计算所述物品集中所有物品被推荐的概率来获得所述目标物品并推荐给所述用户。
优选地,根据所述偏好表示和所述物品嵌入向量来计算所述物品集中所有物品被推荐的概率来获得所述目标物品并推荐给所述用户包括:
将各个所述物品嵌入向量与分别与所述偏好表示的转置矩阵相乘以对应的获得所述当前会话中个物品的各个偏好分数,
通过第二归一化层来归一化各个所述偏好分数,以获分别得各个所述物品被推荐的概率,
选择各个所述概率中的大小靠前的一组概率对应的所述物品作为所述目标物品推荐给所述用户。
优选地,应用反向传播算法来训练所述推荐模型。
优选地,采用交叉熵函数作为优化目标来学习所述推荐模型的参数。
优选地,用于从物品集中预测所述用户在下一个时刻可能交互的物品作为目标物品推荐给所述用户,包括:
嵌入层模块,用于将将当前会话中的各个物品嵌入到一个d维向量表示,以获得各个物品嵌入向量,
重要性提取模块,用于根据所述物品嵌入向量提取各个所述物品的重要性表示,
当前兴趣获取模块,用于获取所述当前会话中最后一个物品对应的物品嵌入向量作为所述用户的当前兴趣表示,
长期偏好获取模块,用于将所述重要性表示与所述物品嵌入向量相结合来获得所述用户的长期偏好表示,
用户偏好获取模块,用于连接所述当前兴趣表示和所述长期偏好表示,以获得所述用户的偏好表示,
推荐生成模块,用于根据所述偏好表示和所述物品嵌入向量获得所述目标物品并推荐给所述用户。
优选地,重要性提取模块包括:
第一非线性层和第二线性层,分别用于通过非线性转换函数将各个所述物品嵌入向量组成的嵌入向量集转换到第一向量空间和第二向量空间,以分别获得第一转换向量和第二转换向量,所述非线性转换函数为是以非线性方式从所述物品嵌入向量中学习信息的转换函数,
平均相似度计算层,用于根据所述第一转换向量和第二转换向量之间的关联矩阵计算所述当前会话中的一个物品与所述当前会话中的其它物品之间的平均相似度来表征所述一个物品的重要性分数,
第一归一化层,用于归一化所述重要性分数以获得所述一个物品的重要性表示。
由上可见,依据本发明提供的基于会话中物品的重要性的物品推荐方法和系统,通过重要性提取模块来提取会话中各个物品的重要性,再结合所述重要性和对应的物品获得用户的长期偏好,从而结合所述用户的当前兴趣和长期偏好准确的获得所述用户的偏好,最后再根据所述用户的偏好进行物品推荐,有效的提高了物品推荐的准确性,且降低了物品推荐模型的计算复杂度。
附图说明
图1为依据本发明提供的基于会话中物品重要性的物品推荐模型框图。
图2为SR-IEM模型、CSRM模型和SR-GNN模型在YOOCHOOSE数据集的Recall@20指标上的比较结果示意图;
图3为SR-IEM模型、CSRM模型和SR-GNN模型在YOOCHOOSE数据集的MRR@20指标上的比较结果示意图;
图4为SR-IEM模型、CSRM模型和SR-GNN模型在DIGINETICA数据集的Recall@20指标上的比较结果示意图;
图5为SR-IEM模型、CSRM模型和SR-GNN模型在DIGINETICA数据集的MRR@20指标上的比较结果示意图;
图6为SR-IEM模型、SR-STAMP模型和SR-SAT模型在Recall@20指标上的效果比较示意图;
图7为SR-IEM模型、SR-STAMP模型和SR-SAT模型在MRR@20指标上的效果比较示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所产生的所有其他实施例,都属于本发明保护的范围。此外需要说明的是,在具体实施方式这一项内容中“所述…”是仅指本发明的中的技术属于或特征。
基于会话内容的物品推荐主要目的是根据当前会话从物品集Vt={v1,v2,…,v|v|}中预测用户在下一个时刻可能感兴趣的物品来作为目标物品推荐给客户。例如,物品集Vt={v1,v2,…,v|v|},当前会话表示为St,当前会话St为在一个时间戳的由t个物品组成的会话St={s1,s2,…,st}从中预测下一个用户可能交互的物品(即下一个时间戳时用户感兴趣的物品)则为st+1
为了提高基于会话内容进行物品推荐的准确度,我们在构建推荐模型中考虑了当前会话中物品的重要性,以根据物品的重要性来更准确获取用户的偏好,以便根据用户偏好进行物品推荐。因此,我们提供了一种基于会话中物品的重要性的物品推荐方法,通过所述方法从物品集中预测下一个所述用户可能交互的物品作为目标物品推荐给所述用户。所述方法主要通过如图1所示的推荐模型来实现,但所述方法不局限于仅能通过图1所示的模型来实现。图1具体为一种基于会话中物品重要性的物品推荐模型,图1所示的物品推荐模型所运行的系统为基于会话中物品重要性的物品推荐系统。
依据本发明提供的基于会话中物品重要性的物品推荐方法主要包括基于训练好的推荐模型(如图1所示的推荐模型)进行以下步骤:
步骤1:将当前会话中的各个物品嵌入到一个d维向量表示,以获得物品嵌入向量,并将所述当前会话中最后一个物品对应的物品嵌入向量作为所述用户的当前兴趣表示。
我们首先通过一个嵌入层将当前会话St={x1,x2,…,xt}中的每个物品xi嵌入到一个d维的向量获得物品嵌入向量ei,ei∈R,其中xi(1≤i≤t)表示会话St中的的第i个物品。会话St为向量的表现形式,则si为会话向量的第i个分量。各个物品嵌入向量e1,e2,…,et依次由上至下分别构成了物品嵌入向量集E的第一列上的第1、2、…、t个分量。考虑到最后一个物品xt反映了用户最近期的交互,我们在嵌入向量集E后,直接选择最后一个分量et(当前会话中的最后一个物品对应的物品嵌入向量)来表示用户在当前会话中的当前兴趣Zs,因此所述当前兴趣的表示公式如公式(1)所示:
Zs=et (1)
步骤2:根据所述物品嵌入向量获取各个所述物品的重要性表示。
为了准确的定位到会话中重要的物品来建模用户偏好,我们提出的所述推荐模型中设置了,重要性提取模块(IEM),以此来根据所述物品嵌入向量ei来产生物品xi重要性表示。在所重要性提取模块中,我们使两个非线性层利用非线性函数sigmoid将物品的嵌入向量ei构成的向量集E转换到第一向量空间query Q和第二向量空间key K,以分别获得第一转换向量Q和第二转换向量K,二者的表示分别如公式(2)公式(3)所示:
Q=sigmoid(WqE) (2)
K=sigmoid(WkE) (3)
这里Wq∈Rd×l和Wk∈Rd×l分别是对应于query和key的可训练的参数;l是进行公式(2)和(3)过程中中所采用的注意力机制的维度。sigmoid是以非线性方式从物品嵌入向量中学习信息的转换函数。
在产生了Q和K的表示后,可以根据Q和K估计每个物品的重要性,具体步骤如下:
首先,我们通过引入Q和K之间的关联矩阵C来计算所述当前会话中每两个物品之间的相似度,如公式(4)所示:
Figure BDA0002507486320000051
这里
Figure BDA0002507486320000052
是用来按比例缩小注意力。在所述关联矩阵中,如果一个物品与其他的物品的相似度都相对比较低,我们认为该物品是不重要的,用户可能因为偶然或者出于好奇与这样的物品产生了交互。相反,如果一个物品与会话中多数的物品都相似,那么这个物品可能就表达了用户的主要偏好。也就是说,这个物品相对来说比较重要。基于上述论述的启发,我们将一个物品与会话中其它物品的平均相似度作为该物品的重要性表征参数。为了避免相同物品在Q和K的高相似度,我们应用一个遮蔽操作来遮蔽关联矩阵的对角线再做所述平均相似度的计算,从而我们可以为每个物品xi计算获得一个重要性分数αi,其表示公式如公式(5)所示:
Figure BDA0002507486320000053
这里Cij∈C。为了归一化重要性分数αi,使用softmax层对其进行操作,以来得到最终的物品的重要性表示βi,计算公式如公式(6)所示:
Figure BDA0002507486320000054
步骤3:将所述重要性表示与所述物品嵌入向量相结合来获得所述用户的长期偏好表示。
通过重要性提取模块,我们获得了会话中每个物品的重要性表示βi,所述重要性表示体现了每个物品与用户主要意图的相关程度。然后,我们按照会话中每个物品的重要性将物品结合起来作为用户的长期偏好zl,计算公式(7)所示:
Figure BDA0002507486320000061
步骤4:将所述当前兴趣表示和所述长期偏好表示通过连接操作进连接,以获得所述用户的偏好表示。
在获得了用户的长期偏好Zl和他的当前兴趣Zs后,我们将二者结合起来作为用户的最终的偏好表示Zh,其计算公式如公式(8)所示:
zh=W0[zl;zs] (8)
步骤5:根据所述偏好表示和所述物品嵌入向量获得所述目标物品并推荐给所述用户。
在会话中用户的偏好表示被产生之后,我们通过用它来计算候选物品集V中所有物品被推荐的概率来生成物品的推荐。我们首先通过乘法运算来计算用户对候选物品集V中每个物品的偏好分数
Figure BDA0002507486320000062
其表示为公式(9):
Figure BDA0002507486320000063
这里zh通过公式(8)得到,ei是每个物品的嵌入向量。在做所述乘法运算前,先将各个所述嵌入物品向量依次从左到右构成横向物品嵌入向量集I的第一行上的第1、2、…、t个分量。然后适应归一化层softmax层来对每个偏好分数进行归一化处理,以获得每个物品被推荐的归一化概率:
Figure BDA0002507486320000064
这里
Figure BDA0002507486320000065
在获得各个物品对应的归一化概率后,选择各个所述概率中的大小靠前的一组概率对应的所述物品作为所述目标物品推荐给所述用户。
为了训练模型,我们采用交叉熵函数作为优化目标来学习参数,如公式(11)所示:
Figure BDA0002507486320000066
这里yi∈y反映的是某个物品是否在真实购买的独热编码中出现,即如果第i个物品时给定会话的目标物品,那么yi=1;反之,yi=0。最后,我们使用反向传播算法来训练所述推荐模型。
本发明还提供了一种基于本发明提供的推荐方法实现的基于会话中物品重要性的物品推荐系统,结合图1所示,所述物品推荐系统主要包括嵌入层模块(图1中未具体示意)、重要性提取模块、当前兴趣获取模块(对应图1中的当前兴趣),长期偏好获取模块(对应图1中的长期偏见),推荐生成模块(图1中未具体示意),
嵌入层模块,用于将当前会话中的各个物品嵌入到一个d维向量表示,以获得各个物品嵌入向量,重要性提取模块,用于根据所述物品嵌入向量提取各个所述物品的重要性表示,当前兴趣获取模块,用于获取所述当前会话中最后一个物品对应的物品嵌入向量作为所述用户的当前兴趣表示,长期偏好获取模块,用于将所述重要性表示与所述物品嵌向量相结合来获得所述用户的长期偏好表示,用户偏好获取模块,用于连接所述当前兴趣表示和所述长期偏好表示,以获得所述用户的偏好表示,推荐生成模块,用于根据所述偏好表示和所述物品嵌入向量获得所述目标物品并推荐给所述用户。其中,重要性提取模块进一步包括:第一非线性层和第二线性层(图1中均显示为非线性层),分别用于通过非线性转换函数将各个所述物品嵌入向量组成的嵌入向量集转换到第一向量空间和第二向量空间,以分别获得第一转换向量Q和第二转换向量K,所述非线性转换函数为是以非线性方式从所述物品嵌入向量中学习信息的转换函数。还包括平均相似度计算层,用于根据所述第一转换向量和第二转换向量之间的关联矩阵计算所述当前会话中的一个物品与所述当前会话中的其它物品之间的平均相似度来表征所述一个物品的重要性分数。以及包括归一化层,用于归一化所述重要性分数以获得所述一个物品的重要性表示。
为了验证本发明提供的基于会话中物品重要性的推荐方法和系统的有效性和推荐准确性,我们在YOOCHOOSE和DIGINETICA这两个基准数据集上对本发明的物品推荐方法和系统进行评估,其中,数据集YOOCHOOSE和DIGINETICA的统计数据如表1所示:
Figure BDA0002507486320000071
表1
我们通过将本发明中提供的基于会话中物品重要性的物品推荐模型SR-IEM的表现与8个现有的基于会话推荐的基准模型的表现相比来验证我们的提供的所述物品推荐方法的效果。其中,8个所述基准模型包括3个传统方法(S-POP,Item-KNN和FPMC),5个神经模型(GRU4REC,NARM,STAMP,CSRM和SR-GNN)。我们用于评价的数据集是两个公开的基准电商数据集,即YOOCHOOSE和DIGINETICA。我们设定最大会话长度为10,即对于过长的会话,我们只考虑最近的10个物品。物品嵌入向量和所述注意力机制的维度分别设置为d=200和l=100。我们使用Adam作为优化器,初始的学习率被设定为10-3,每3个循环会衰减0.1。批量大小设为128。此外,我们使用Recall@20N指标和MRR@N指标来评价基于会话中物品重要性的物品推荐模型SR-IEM和各个所述基准模型的效果,在我们的实验中我们设N为20。表2为依据本发明提供的物品推荐模型SR-IEM的表现与8个现有的基于会话推荐的基准模型的表现对比结果,其中每一栏的最佳基准模型和最佳模型的结果分别用下划线和粗体标出▲表示t检验。由表2可以看出,对于8个现有的所述基准模型,神经网络模型普遍优于传统方法。例如SR-GNN在YOOCHOOSE数据集上的两个指标上都表现最好,而发明提供的物品推荐模型SR-IEM较最佳的基准模型仍有显著提升。但是,在DIGINETICA数据集的Recall@20指标上,CSRM模型的表现模型最佳。通过应用GGNN模型,SR-GNN模型能够建模物品间复杂的传递关系来产生准确的用户偏好,而CSRM模型在NARM模型的基础上引入了邻居会话,使得其表现优于其他基准模型。因此,在接下来的实验中我们选取CSRN和SR-GNN作为基准模型。
Figure BDA0002507486320000081
表2
接下来,我们关注于依据本发明提供的物品推荐模型SR-IEM的表现。总的来说,SR-IEM模型在两个数据集的两个指标上都优于所有的基准模型。例如在YOOCHOOSE集上,SR-IEM相比最好的基准模型SR-GNN在MRR@20上有2.49%的提升,比在Recall@20上对应的0.82%的提升要高。相反,在DIGINETICA上,Recall@20上的提升比MRR@20的提升相对要高。这可能归因于物品集的大小。在候选物品相对较少的情况下,SR-IEM更能够提高目标物品的排序,而在候选物品相对较多时,SR-IEM在命中目标物品上更有效。
另外,我们分析了SR-IEM模型和最好的两个基准模型(CSRM模型和SR-GNN模型)的计算复杂度。对于CSRM模型和SR-GNN模型,计算复杂度分别是O(td2+dM+d2)和O(s(td2+t3)+d2),t表示会话长度而d是物品嵌入向量的维度。这里M是CSRM模型中引入的邻居会话的数目,而s是GGNN中的训练步数。对于SR-IEM模型,计算复杂度是O(t2d+d2),主要来自于重要性提取模块O(t2d+d2)和其他模块O(d2)。因为t<d和d<<M,SR-IEM的计算复杂度明显低于SR-GNN和CSRM。为了从经验上证实这一点,我们比较了SR-IEM模型、CSRM模型、SR-GNN模型的训练时间和测试时间。我们发现SR-IEM模型的时间消耗明显低于CSRM模型和SR-GNN模型。这说明,与所述基准模型相比,SR-IEM模型在推荐准确率和计算复杂度上都表现最好,为其潜在的应用提供了可行性。
此外,本申请还分析了会话长度对依据本发明提供的物品推荐模型SR-IEM模型的效果的影响,具体如图2-图5所示。图2为SR-IEM模型、CSRM模型和SR-GNN模型在YOOCHOOSE数据集的Recall@20指标上的比较结果示意图,图3为SR-IEM模型、CSRM模型和SR-GNN模型在YOOCHOOSE数据集的MRR@20指标上的比较结果示意图,图4为SR-IEM模型、CSRM模型和SR-GNN模型在DIGINETICA数据集的Recall@20指标上的比较结果示意图,图5为SR-IEM模型、CSRM模型和SR-GNN模型在DIGINETICA数据集的MRR@20指标上的比较结果示意图。从图2-图5我们看到随着会话长度的增加,3个模型的表现首先增长然后显示了持续的下降。根据Recall@20指标的比较结结果可以看出,SR-IEM模型分别与CSRM模型和SR-GNN模型相比,在会话长度为4-7上的提高比在会话长度为1-3上的提高要多。这是因为当会话长度过短时,依据本发明提供的物品推荐模型SR-IEM模型中的重要性提取模块IEM不能够很好地区分开物品的重要性,但是随着长度的增加,重要性提取模块IEM的效果提升了。而对于MRR@20指标的比较结果可以看出,随着会话长度的增加,SR-IEM模型、CSRM模型和SR-GNN模型的表现都显示出持续的下降趋势。在YOOCHOOSE数据集上,SR-IEM模型在所有长度上都优于CSRM模型和SR-GNN模型。然而在DIGINETICA数据集上在一些长度上SR-GNN模型表现得更好,例如在长度4和5上。此外,SR-IEM模型在YOOCHOOSE数据集上,MRR@20持续下降而没有像Recall@20一样首先增加。另外,SR-IEM模型在DIGINETICA数据集上,MRR@20的分数下降地比Recall@20更快。SR-IEM模型在两个数据集上Recall@20和MRR@20的不同可能是由于短会话中无关的物品对于MRR@20的不利影响比Recall@20更大。
为了验证依据本发明提供的物品推荐模型SR-IEM模型中的重要性提取模块IEM对物品推荐的准确性提高的效果,我们用两个替代模块来替换SR-IEM中的IEM模块获得本发明的变体物品推荐模型。第一个是将图1中的重要性提取模块IEM用现有的一个注意力机制模块替换以获得本发明的第一变体物品推荐模型SR-STAMP模型,在SR-STAMP模型会话中所有物品的混合和最后一个物品被视为本发明中的“key”相关量。第二个是将图1中的重要性提取模块IEM替换为使用现有的另一个注意力机制来区分物品的重要性,然后使用平均池化策略将这个重要性聚合在一起获得本发明的第二变体物品推荐模型SR-SAT模型。然后我们比较了SR-IEM模型、SR-STAMP模型和SR-SAT模型在在Recall@20指标和MRR@20指标上的表现,比较的结果如图6和图7所示,图6为SR-IEM模型、SR-STAMP模型和SR-SAT模型在Recall@20指标上的效果比较示意图,图7为SR-IEM模型、SR-STAMP模型和SR-SAT模型在MRR@20指标上的效果比较示意图。总的来说,SR-IEM模型在两个数据集上的Recall@20指标和MRR@20指标上都表现得最好,而SR-SAT模型的效果又优于SR-STAMP。这可能是因为SR-SAT考虑了会话中上下文中的物品与物品之间的关系,能够帮助捕捉用户偏好从而产生正确的物品推荐,而SR-STAMP模型只使用所有物品的混合和最后一个物品来决定物品重要性,因此不能够准确地表示用户偏好。另外,SR-SAT模型和SR-STAMP模型都很难去除会话中的不相关物品,这些物品将会对推荐表现造成负面的效果。由此可见,我们提出的IEM模块能够有效地定位重要的物品,并且在建模用户偏好时为它们分配相对较高的权重,以避免会话中其它物品的干扰。
由上可见,依据本发明提供的基于会话中物品的重要性的物品推荐方法和系统,通过重要性提取模块来提取会话中各个物品的重要性,再结合所述重要性和对应的物品获得用户的长期偏好,从而结合所述用户的当前兴趣和长期偏好准确的获得所述用户的偏好,最后再根据所述用户的偏好进行物品推荐,有效的提高了物品推荐的准确性,且降低了物品推荐模型的计算复杂度。
依照本发明的实施例如上文所述,这些实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施例。根据以上描述,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地利用本发明以及在本发明基础上的修改使用。本发明仅受权利要求书及其全部范围和等效物的限制。

Claims (7)

1.一种基于会话中物品重要性的物品推荐方法,用于从物品集中预测用户在下一个时刻可能交互的物品作为目标物品推荐给所述用户,其特征在于,基于训练好的推荐模型进行的步骤包括:
将当前会话中的各个物品嵌入到一个d维向量表示,以获得物品嵌入向量,并将所述当前会话中最后一个物品对应的物品嵌入向量作为所述用户的当前兴趣表示,
根据所述物品嵌入向量获取各个所述物品的重要性表示,并将所述重要性表示与所述物品嵌入向量相结合来获得所述用户的长期偏好表示,
将所述当前兴趣表示和所述长期偏好表示通过连接操作进连接,以获得所述用户的偏好表示,
根据所述偏好表示和所述物品嵌入向量获得所述目标物品并推荐给所述用户;
其中,所述根据所述物品嵌入向量获取各个所述物品的重要性表示,包括:
将所述当前会话中的各个物品对应各个所述物品嵌入向量构成的物品嵌入向量集分别通过非线性转换函数转换到第一向量空间和第二向量空间,以分别获得第一转换向量和第二转换向量,所述非线性转换函数为是以非线性方式从所述物品嵌入向量中学习信息的转换函数,
获取所述第一转换向量和第二转换向量之间的关联矩阵,
根据所述关联矩阵获取所述当前会话中的一个物品与所述当前会话中的其它物品的平均相似度,以作为所述一个物品的重要性分数,
通过第一归一化层归一化所述重要性分数,以获得所述一个物品的重要性表示。
2.根据权利要求1所述的物品推荐方法,其特征在于,在根据所述关联矩阵获得所述重要性表示过程中,通过一个遮蔽操作来遮蔽所述关联矩阵的对角线。
3.根据权利要求1所述的物品推荐方法,其特征在于,根据所述偏好表示来计算所述物品集中所有物品被推荐的概率来获得所述目标物品并推荐给所述用户。
4.根据权利要求3所述的物品推荐方法,其特征在于,根据所述偏好表示和所述物品嵌入向量来计算所述物品集中所有物品被推荐的概率来获得所述目标物品并推荐给所述用户包括:
将各个所述物品嵌入向量与分别与所述偏好表示的转置矩阵相乘以对应的获得所述当前会话中个物品的各个偏好分数,
通过第二归一化层来归一化各个所述偏好分数,以获分别得各个所述物品被推荐的概率,
选择各个所述概率中的大小靠前的一组概率对应的所述物品作为所述目标物品推荐给所述用户。
5.根据权利要求1所述的物品推荐方法,其特征在于,应用反向传播算法来训练所述推荐模型。
6.根据权利要求1所述的物品推荐方法,其特征在于,采用交叉熵函数作为优化目标来学习所述推荐模型的参数。
7.一种基于会话中物品重要性的物品推荐系统,用于从物品集中预测用户在下一个时刻可能交互的物品作为目标物品推荐给所述用户,其特征在于,包括:
嵌入层模块,用于将当前会话中的各个物品嵌入到一个d维向量表示,以获得各个物品嵌入向量,
重要性提取模块,用于根据所述物品嵌入向量提取各个所述物品的重要性表示,
当前兴趣获取模块,用于获取所述当前会话中最后一个物品对应的物品嵌入向量作为所述用户的当前兴趣表示,
长期偏好获取模块,用于将所述重要性表示与所述物品嵌入向量相结合来获得所述用户的长期偏好表示,
用户偏好获取模块,用于连接所述当前兴趣表示和所述长期偏好表示,以获得所述用户的偏好表示,
推荐生成模块,用于根据所述偏好表示和所述物品嵌入向量获得所述目标物品并推荐给所述用户;
其中,所述重要性提取模块包括:
第一非线性层和第二线性层,分别用于通过非线性转换函数将各个所述物品嵌入向量组成的嵌入向量集转换到第一向量空间和第二向量空间,以分别获得第一转换向量和第二转换向量,所述非线性转换函数为是以非线性方式从所述物品嵌入向量中学习信息的转换函数,
平均相似度计算层,用于根据所述第一转换向量和第二转换向量之间的关联矩阵计算所述当前会话中的一个物品与所述当前会话中的其它物品之间的平均相似度来表征所述一个物品的重要性分数,
第一归一化层,用于归一化所述重要性分数以获得所述一个物品的重要性表示。
CN202010450422.4A 2020-05-25 2020-05-25 基于会话中物品重要性的物品推荐方法和系统 Active CN111581520B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202010450422.4A CN111581520B (zh) 2020-05-25 2020-05-25 基于会话中物品重要性的物品推荐方法和系统
US17/325,053 US20210366024A1 (en) 2020-05-25 2021-05-19 Item recommendation method based on importance of item in session and system thereof
US17/693,761 US20220198546A1 (en) 2020-05-25 2022-03-14 Item recommendation method based on importance of item in conversation session and system thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010450422.4A CN111581520B (zh) 2020-05-25 2020-05-25 基于会话中物品重要性的物品推荐方法和系统

Publications (2)

Publication Number Publication Date
CN111581520A CN111581520A (zh) 2020-08-25
CN111581520B true CN111581520B (zh) 2022-04-19

Family

ID=72119515

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010450422.4A Active CN111581520B (zh) 2020-05-25 2020-05-25 基于会话中物品重要性的物品推荐方法和系统

Country Status (2)

Country Link
US (1) US20210366024A1 (zh)
CN (1) CN111581520B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112148975A (zh) * 2020-09-21 2020-12-29 北京百度网讯科技有限公司 会话推荐方法、装置及设备
CN113222700B (zh) * 2021-05-17 2023-04-18 中国人民解放军国防科技大学 基于会话的推荐方法及装置
CN113704441B (zh) * 2021-09-06 2022-06-10 中国计量大学 一种考虑物品和物品属性特征级别重要性的会话推荐方法
CN114154080B (zh) * 2021-12-07 2024-08-16 西安邮电大学 一种基于图神经网络的动态社会化推荐方法
CN114238765B (zh) * 2021-12-16 2024-07-26 吉林大学 一种基于区块链的位置注意力推荐方法
CN114492763A (zh) * 2022-02-16 2022-05-13 辽宁工程技术大学 一种融合全局上下文信息注意力增强的图神经网络方法
CN114528490A (zh) * 2022-02-18 2022-05-24 哈尔滨工程大学 一种基于用户长短期兴趣的自监督序列推荐方法
CN114519145A (zh) * 2022-02-22 2022-05-20 哈尔滨工程大学 一种基于图神经网络挖掘用户长短期兴趣的序列推荐方法
CN114595383A (zh) * 2022-02-24 2022-06-07 中国海洋大学 一种基于会话序列的海洋环境数据推荐方法及系统
CN114357201B (zh) * 2022-03-10 2022-08-09 中国传媒大学 基于信息感知的视听推荐方法、系统
CN114896515A (zh) * 2022-04-02 2022-08-12 哈尔滨工程大学 基于时间间隔的自监督学习协同序列推荐方法、设备和介质
CN114969547B (zh) * 2022-06-24 2023-04-18 杭州电子科技大学 一种基于多视角增强图注意神经网络的音乐推荐方法
CN115187343B (zh) * 2022-07-20 2023-08-08 山东省人工智能研究院 基于注意图卷积神经网络的多行为推荐方法
CN115659063B (zh) * 2022-11-08 2023-07-25 黑龙江大学 针对用户兴趣漂移的关联性信息增强推荐方法、计算机设备、存储介质和程序产品
CN116628347B (zh) * 2023-07-20 2023-09-29 山东省人工智能研究院 基于引导式图结构增强的对比学习推荐方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108334638A (zh) * 2018-03-20 2018-07-27 桂林电子科技大学 基于长短期记忆神经网络与兴趣迁移的项目评分预测方法
CN110245299A (zh) * 2019-06-19 2019-09-17 中国人民解放军国防科技大学 一种基于动态交互注意力机制的序列推荐方法及其系统
CN110688565A (zh) * 2019-09-04 2020-01-14 杭州电子科技大学 基于多维霍克斯过程和注意力机制的下一个物品推荐方法
CN111125537A (zh) * 2019-12-31 2020-05-08 中国计量大学 一种基于图表征的会话推荐方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108334638A (zh) * 2018-03-20 2018-07-27 桂林电子科技大学 基于长短期记忆神经网络与兴趣迁移的项目评分预测方法
CN110245299A (zh) * 2019-06-19 2019-09-17 中国人民解放军国防科技大学 一种基于动态交互注意力机制的序列推荐方法及其系统
CN110688565A (zh) * 2019-09-04 2020-01-14 杭州电子科技大学 基于多维霍克斯过程和注意力机制的下一个物品推荐方法
CN111125537A (zh) * 2019-12-31 2020-05-08 中国计量大学 一种基于图表征的会话推荐方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种融合知识图谱与长短期偏好的下一项推荐算法;沈冬东等;《小型微型计算机系统》;20200409(第04期);全文 *

Also Published As

Publication number Publication date
US20210366024A1 (en) 2021-11-25
CN111581520A (zh) 2020-08-25

Similar Documents

Publication Publication Date Title
CN111581520B (zh) 基于会话中物品重要性的物品推荐方法和系统
Wu et al. Session-based recommendation with graph neural networks
CN109299396B (zh) 融合注意力模型的卷积神经网络协同过滤推荐方法及系统
CN111581519B (zh) 基于会话中用户意图的物品推荐方法和系统
CN110083770B (zh) 一种基于特征层面更深的自注意力网络的序列推荐方法
CN111737578B (zh) 一种推荐方法及系统
CN111414461B (zh) 一种融合知识库与用户建模的智能问答方法及系统
CN110781409B (zh) 一种基于协同过滤的物品推荐方法
CN108876044B (zh) 一种基于知识增强神经网络的线上内容流行度预测方法
CN110046353B (zh) 一种基于多语言层次机制的方面级情感分析方法
WO2022218139A1 (zh) 融合注意力机制的个性化搜索方法和搜索系统
CN113628059A (zh) 一种基于多层图注意力网络的关联用户识别方法及装置
CN113609388B (zh) 基于反事实用户行为序列生成的序列推荐方法
CN116051175A (zh) 基于深度多兴趣网络的点击率预测模型及预测方法
CN115408603A (zh) 一种基于多头自注意力机制的在线问答社区专家推荐方法
CN118245745A (zh) 任务处理、对象推荐、模型训练方法以及计算设备
CN116452241B (zh) 一种基于多模态融合神经网络的用户流失概率计算方法
CN113010774A (zh) 一种基于动态深度注意力模型的点击率预测方法
Cheng et al. Accurate multi-interest modeling for sequential recommendation with attention and distillation capsule network
Di Gangi Sparse convex combinations of forecasting models by meta learning
CN115659277A (zh) 一种基于多行为特征融合的电商会话推荐方法、系统、装置及介质
CN114912984B (zh) 基于自注意力的时间评分感知上下文的推荐方法及系统
Wang et al. Bayesian deep learning based exploration-exploitation for personalized recommendations
CN112115243B (zh) 通过对时序时间相关性建模的会话表示学习方法
CN114547276A (zh) 基于三通道图神经网络的会话推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant