CN116776004A - 一种多兴趣序列推荐方法、系统及设备 - Google Patents
一种多兴趣序列推荐方法、系统及设备 Download PDFInfo
- Publication number
- CN116776004A CN116776004A CN202310832230.3A CN202310832230A CN116776004A CN 116776004 A CN116776004 A CN 116776004A CN 202310832230 A CN202310832230 A CN 202310832230A CN 116776004 A CN116776004 A CN 116776004A
- Authority
- CN
- China
- Prior art keywords
- sequence
- user
- item
- interest
- representation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 230000003993 interaction Effects 0.000 claims abstract description 63
- 230000008447 perception Effects 0.000 claims abstract description 32
- 238000012549 training Methods 0.000 claims abstract description 15
- 238000010586 diagram Methods 0.000 claims description 19
- 239000011159 matrix material Substances 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 13
- 230000007246 mechanism Effects 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 11
- 230000004931 aggregating effect Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 8
- 230000004927 fusion Effects 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 3
- 239000012633 leachable Substances 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 2
- 230000002452 interceptive effect Effects 0.000 claims description 2
- 230000009466 transformation Effects 0.000 claims description 2
- 238000012163 sequencing technique Methods 0.000 abstract 1
- 230000008859 change Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000012466 permeate Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种多兴趣序列推荐方法、系统及设备,方法包括:构建基于全局项目关系和时间信息感知的多兴趣序列推荐模型;利用数据集中用户的历史交互序列和对应的时间戳序列,对基所述多兴趣序列推荐模型进行训练,得到训练好的多兴趣序列推荐模型;将待推荐用户的历史交互序列和对应的时间戳序列输入至训练好的多兴趣序列推荐模型中,获得待推荐用户的多个兴趣;计算所述多个兴趣与候选项目的关联并进行排序,得到相关性最高的top‑N个项目,并将得到的项目列表推荐给用户。本发明采用基于全局项目关系和时间信息感知的多兴趣序列推荐方法,捕获项目语义和时序下的依赖,从而从根源上解决了现有的多兴趣序列推荐方法准确性低,用户满意度低的问题。
Description
技术领域
本发明属于个性化推荐领域,具体涉及一种多兴趣序列推荐方法、系统及设备。
背景技术
随着信息技术和互联网的蓬勃发展,手机、电脑等电子设备逐渐普及,互联网渗透到人们生活的方方方面,网络上各式各样的资源海量增加。面对爆发式增长的数据资源,人们从众多的信息中找到自己所关心的内容变得困难。搜索引擎虽然能在一定程度上缓解数据爆发带来的“信息过载”问题,但其依赖于人们是否有较为明确的需求。而推荐系统能够根据人们的交互历史,分析并提取出用户的偏好,并主动地向用户推荐其可能感兴趣的内容,能有效的缓解信息过载问题的同时也能节省用户时间并提升用户体验。
序列推荐将用户历史交互按照时间顺序排列,并对项目之间的依赖关系进行建模,旨在预测用户在下一时刻可能感兴趣的项目。目前应用于序列推荐的主流方法有RNN,GNN,注意力机制等。
然而,现有的多兴趣序列推荐方法大多关注用户的多个兴趣是什么,并未对多个兴趣的重要性加以区分。而用户的兴趣往往随着时间衰减,序列推荐中天然的存有时间信息,现有的推荐方法并不符合用户兴趣变化的时间衰减,未对多个兴趣赋予不同的权重符合实际场景需求,推荐准确性。另外,为了获取项目间的依赖关系,现有的方法根据用户交互历史来对项目之间关系进行建模,通常只基于共现次数单个因素,而项目本身存在语义信息(属性等)且项目被交互存在时序上的先后关系,即现有的方法并未从语义和时序两个层面来对项目之间关系进行建模,不能完整地捕获信息,进一步导致推荐方法准确性。即目前存在有多兴趣序列推荐方法准确性不高、用户满意度低的问题。
因此,如何提高多兴趣序列推荐方法准确性,提升用户满意度,是本领域亟待解决的问题。
发明内容
本发明的目的是针对现有技术的缺陷,提供一种多兴趣序列推荐方法、系统及设备。本发明多兴趣序列推荐方法,采用基于全局项目关系和时间信息感知的多兴趣序列推荐方法,通过全局项目关系的建立、时间信息的处理以及时间感知注意力机制的设计,考虑了用户兴趣的变化,并利用多头图注意力网络和图卷积捕获项目语义和时序下的依赖,更为完整地捕获信息,从而从根源上解决了现有的多兴趣序列推荐准确性低、用户满意度低的问题。
为了实现以上目的,本发明采用以下技术方案:
本发明提出一种多兴趣序列推荐方法,其特征在于,包括步骤:
S1、构建基于全局项目关系和时间信息感知的多兴趣序列推荐模型;
S2、利用数据集中用户的历史交互序列和对应的时间戳序列,对所述基于全局项目关系和时间信息感知的多兴趣序列推荐模型进行训练,得到训练好的基于全局项目关系和时间信息感知的多兴趣序列推荐模型;步骤S2具体包括如下:
步骤(1)从数据集中获取用户的历史交互序列和对应的时间戳序列;
步骤(2)根据所述时间戳序列,计算每个项目与最后一个项目的时间间隔并进行截取操作,得到时间间隔序列;
步骤(3)将所述历史交互序列和所述时间间隔序列分别输入至嵌入层,得到用户交互嵌入表示X和时间间隔嵌入表示I;
步骤(4)对所述用户交互嵌入表示进行自注意力计算,得到在当前序列下的项目表示Z;
步骤(5)基于所述用户交互嵌入表示,构建全局项目共现图;
步骤(6)基于所述全局项目共现图,对于图中的任意节点i使用多头图注意力网络捕获与其邻居项目节点间语义条件下的关联,得到包含语义相关性的项目表示
步骤(7)根据设定的时间阈值对所述全局项目共现图进行筛选,并将项目被交互时间间隔进行处理,得到被交互时间间隔小于所述时间阈值的时间间隔嵌入矩阵;再利用图卷积操作聚合时序相关的邻居信息,得到包含时序相关性的项目表示
步骤(8)将所述包含语义相关性的项目表示和所述包含时序相关性的项目表示进行融合,构建全局项目关系图,并得到全局依赖嵌入表示/>
步骤(9)利用门控融合单元聚合所述在当前序列下的项目表示Z以及所述全局依赖嵌入表示得到用户表示C;
步骤(10)将所述时间间隔嵌入表示I作为注意力机制的query,所述用户表示C作为注意力机制的key和value,提取用户的K个兴趣;
步骤(11)对于目标项目,使用argmax操作从K个兴趣中筛选出与之最相关的兴趣,并基于该兴趣计算用户交互目标项目的可能性,并使用softmax采样来最小化损失函数对模型进行训练。
S3、获取待推荐用户的历史交互序列和对应的时间戳序列,并将所述待推荐用户的历史交互序列和对应的时间戳序列输入至所述训练好的基于全局项目关系和时间信息感知的多兴趣序列推荐模型中,获得所述待推荐用户的多个兴趣;
S4、计算所述多个兴趣与候选项目的关联并进行排序,得到相关性最高的top-N个项目,生成目标项目推荐列表,并将所述目标项目推荐列表推荐给用户。
进一步地,步骤(5)基于所述用户交互嵌入表示,构建全局项目共现图,具体为:
将用户的交互历史中距离不超过δ的两个项目作为共现项目对,即对任意项目xi∈X,其邻居项目集表示为其中,δ为一个超参数,用于限制共现项目对的建模范围;
基于所有用户的用户的历史交互构建全局项目共现图G=(V′,ε),其中其中V表示项目集合。
进一步地,步骤(6)基于所述全局项目共现图,对于图中的任意节点i使用多头图注意力网络捕获与其邻居项目节点间语义条件下的关联,得到包含语义相关性的项目表示具体为:
hi=Wheadei
其中,表示项目vi的嵌入表示,||表示拼接操作,head表示多头注意力的头,H表示多头注意力的头的个数,/>为可学习的转换矩阵,hi表示ei经过第head个头转换得到的项目表示;vi,vj为全局项目共现图的节点,/>表示vi的邻居项目节点集,π(vi,vj)表示不同邻居语义下的重要性权重,||表示拼接操作,σ和LeakyReLU均为激活函数;
进一步地,步骤(7)具体为:根据设定的时间阈值Tth对所述全局项目共现图进行筛选,并将项目被交互时间间隔进行截取操作,得到被交互时间间隔小于所述时间阈值Tth的时间间隔嵌入矩阵再利用图卷积操作聚合时序相关的邻居信息,得到包含时序相关性的项目表示/>
R=softmax(MW2)
其中,为可学习的参数,R为满足时间间隔阈值的项目之间的关联强度矩阵,rij为项目vi和项目vj的时序相关性分数,ej为项目vj的嵌入表示。
进一步地,步骤(9)利用门控融合单元聚合所述在当前序列下的项目表示Z以及所述全局依赖嵌入表示得到用户表示C,具体为:
其中,为可学习的转换矩阵,zi∈Z。
进一步地,步骤(10)将所述时间间隔嵌入表示I作为注意力机制的query,所述用户表示C作为注意力机制的key和value,提取用户的K个兴趣,具体为:
S=ATC
A=softmax(tanh(IW5)W6)
其中,W5、W6为可学习的参数,A表示序列中每个项目对多个兴趣的贡献程度,S代表用户的多个兴趣,K代表用户兴趣个数。
进一步地,步骤11中,所述用户交互目标项目的可能性的计算公式如下:
s=S[:,argmax(Sev)]
其中,s表示兴趣,ev为目标项目v的嵌入表示;
所述损失函数如下:
进一步地,步骤S4、计算所述多个兴趣与候选项目的关联并进行排序,得到相关性最高的top-N个项目,具体为:
其中,ec表示一个候选项目的表示,sk表示第用户的第k个兴趣。
本发明还提出一种多兴趣序列推荐系统,其特征在于,所述推荐系统执行所述的多兴趣序列推荐方法,包括:多兴趣序列推荐模型构建模块、多兴趣序列推荐模型训练模块、兴趣获取模块、项目推荐模块;
多兴趣序列推荐模型构建模块,构建基于全局项目关系和时间信息感知的多兴趣序列推荐模型;
多兴趣序列推荐模型训练模块,利用数据集中用户的历史交互序列和对应的时间戳序列,对所述基于全局项目关系和时间信息感知的多兴趣序列推荐模型进行训练,得到训练好的基于全局项目关系和时间信息感知的多兴趣序列推荐模型;
兴趣获取模块,获取待推荐用户的历史交互序列和对应的时间戳序列,并将所述待推荐用户的历史交互序列和对应的时间戳序列输入至所述训练好的基于全局项目关系和时间信息感知的多兴趣序列推荐模型中,获得所述待推荐用户的多个兴趣;
项目推荐模块,计算所述多个兴趣与候选项目的关联并进行排序,得到相关性最高的top-N个项目,生成目标项目推荐列表,并将所述目标项目推荐列表推荐给用户。
本发明还提出一种计算机设备,所述设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
与现有技术相比,具有如下有益效果:本发明采用基于全局项目关系和时间信息感知的多兴趣序列推荐方法,通过全局项目关系的建立、时间信息的处理以及时间感知注意力机制的设计,考虑了用户兴趣的变化,并利用多头图注意力网络和图卷积捕获项目语义和时序下的依赖,更为完整地捕获信息,提升了多兴趣序列推荐方法的准确性,进而提升了用户体验。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的多兴趣序列推荐方法示意图。
图2为本发明实施例提供的基于全局项目关系和时间信息感知的多兴趣序列推荐模型示意图。
图3为本发明实施例提供的从语义和时序角度聚合全局关系的示意图。
图4为本发明实施例提供的门控融合单元的示意图。
图5为本发明实施例提供的多兴趣序列推荐系统示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
本发明提供一种多兴趣序列推荐方法。如图1所示,多兴趣序列推荐方法包括以下步骤S1至S4。
S1、构建基于全局项目关系和时间信息感知的多兴趣序列推荐模型。所述基于全局项目关系和时间信息感知的多兴趣序列推荐模型如图2所示。
S2、利用数据集中用户的历史交互序列和对应的时间戳序列,对所述基于全局项目关系和时间信息感知的多兴趣序列推荐模型进行训练,得到训练好的基于全局项目关系和时间信息感知的多兴趣序列推荐模型;步骤S2具体包括如下:
步骤(1)从数据集中获取用户的历史交互序列和对应的时间戳序列。
具体地,令U和V分别表示用户和项目集合,一个用户u∈U的历史交互序列表示为对应的时间戳序列为/>每个训练样本使用前t个行为来预测用户第t+1个行为。即训练样本表示为/>对应的时间戳序列也进行同样对应的操作。将所有用户的历史交互序列都进行以上操作作为输入。
在一实施例中,将用户的历史交互序列进行数据扩展,即额外使用原序列的前t个连续子行为用作输入。如,对于历史交互序列[x1,x2,...,xn],将其扩展能够生成的连续子序列有[x1,x2],[x1,x2,x3],……,[x1,x2,...,xn-1]。对与用户历史交互序列对应的时间戳序列进行相同的操作。即对于时间戳序列[t1,t2,...,tn],将其扩展能够生成的连续子序列有[t1,t2],[t1,t2,t3],……,[t1,t2,...,tn-1]。
步骤(2)根据所述时间戳序列,计算每个项目与最后一个项目的时间间隔并进行截取操作,得到时间间隔序列。
具体地,根据时间戳序列,计算每个项目与最后一个项目的时间间隔并进行截取操作,使得时间间隔越长权重越小的同时还保证短时间内交互的项目有相同的时间间隔信息,最终得到时间间隔序列I=[i1,i2,..,i|T|]。
该序列作为相应输入序列中所包含对应的时间信息。
其中,it表示输入序列第t个元素与第n个元素(输入序列的最后一个元素)的时间戳间隔差;1/α表示时间的基本单位,tr表示目标项目的时间戳,m为阈值。不同应用场景下交互间隔时长区别较大,因此α的取值需要根据实际情况调整。
步骤(3)将所述历史交互序列和所述时间间隔序列分别输入至嵌入层,得到用户交互嵌入表示X和时间间隔嵌入表示I。
进一步地,将每条输入的历史交互序列X=[x1,x2,..,x|X|]转换成固定长度为L的序列,如果长度大于L则进行裁剪,否则在序列左侧进行padding操作对齐。对应的时间戳序列进行同样的操作。并经过嵌入层得到用户交互嵌入表示和时间间隔嵌入表示
具体地,通过look-up操作得到长度为L用户交互嵌入表示和时间间隔嵌入表示/>
步骤(4)对所述用户交互嵌入表示进行自注意力计算,得到在当前序列下的项目表示Z。
具体地计算方式如下:
首先,根据X计算Q、K和V三个向量:
Q=XWQ,K=XWK,V=XWV;
其次,将Q、K和V作为Attention网络的query、key和value,进自注意力计算,得到在当前序列下的项目表示Z:
其中,WQ,WK,WV∈Rd×d是可学习的参数。
步骤(5)基于所述用户交互嵌入表示,构建全局项目共现图。
为了模拟用户兴趣可能的演变趋势,基于所有用户的交互历史中距离不超过δ的两个项目作为共现项目对建立全局项目共现图G;具体为:将用户的交互历史中距离不超过δ的两个项目作为共现项目对,即对任意项目xi∈X,其邻居项目集表示为其中,δ为一个超参数,用于限制共现项目对的建模范围;
基于所有用户的用户的历史交互构建全局项目共现图G=(V′,ε),其中其中V表示项目集合。例如,基于交互历史来构建全局项目共现图,如对于用户A,她的历史交互中项目v1和v3同时出现,那么v1和v3组成一个共现对。
在获得全局项目共现图后,基于所述全局项目共现图,构建全局项目关系图;具体地,图2中“全局项目关系图”是基于所述全局项目共现图进行语义和时序两个角度进行提取项目之间的关系并进行融合得到的结果,具体包括步骤(6)-步骤(8)。
步骤(6)基于所述全局项目共现图,对于图中的任意节点i使用多头图注意力网络捕获与其邻居项目节点间语义条件下的关联,得到包含语义相关性的项目表示
基于图G,捕获项目在语义条件下的关联具体为:
其中,表示项目vi的嵌入表示,||表示拼接操作,head表示多头注意力的头,H表示多头注意力的头的个数,/>为可学习的转换矩阵,hi表示ei经过第head个头转换得到的项目表示;vi,vj为全局项目共现图的节点,/>表示vi的邻居项目节点集,π(vi,vj)表示不同邻居语义下的重要性权重,||表示拼接操作,σ和LeakyReLU均为激活函数。
步骤(7)根据设定的时间阈值对所述全局项目共现图进行筛选,并将项目被交互时间间隔进行处理,得到被交互时间间隔小于所述时间阈值的时间间隔嵌入矩阵;再利用图卷积操作聚合时序相关的邻居信息,得到包含时序相关性的项目表示
基于图G,捕获项目先后时序下的关联。具体地,根据设定的时间阈值Tth对所述全局项目共现图进行筛选,并将项目被交互时间间隔进行与步骤(2)相同的截取操作,得到被交互时间间隔小于所述时间阈值Tth的时间间隔嵌入矩阵再利用图卷积操作聚合时序相关的邻居信息,得到包含时序相关性的项目表示/>
R=softmax(MW2)
其中,为可学习的参数,R为满足时间间隔阈值的项目之间的关联强度矩阵,rij为项目vi和项目vj的时序相关性分数,ej为项目vj的嵌入表示。
步骤(8)将所述包含语义相关性的项目表示和所述包含时序相关性的项目表示进行融合,构建全局项目关系图,并得到全局依赖嵌入表示/>从语义和时序角度聚合全局关系的过程如图3所示;具体公式如下:
步骤(9)利用门控融合单元聚合所述在当前序列下的项目表示Z以及所述全局依赖嵌入表示得到用户表示C,门控融合单元具体如图4所示;
具体为:
其中,为可学习的转换矩阵,zi∈Z,/>为全局依赖嵌入表示;C=[c1,c2,..,cL]。
步骤(10)将所述时间间隔嵌入表示I作为注意力机制的query,所述用户表示C作为注意力机制的key和value,提取用户的K个兴趣
具体为:
S=ATC
A=softmax(tanh(IW5)W6)
其中,W5、W6为可学习的参数,A表示序列中每个项目对多个兴趣的贡献程度,S代表用户的多个兴趣,K代表用户兴趣个数。
步骤(11)对于目标项目,使用argmax操作从K个兴趣中筛选出与之最相关的兴趣,并基于该兴趣计算用户交互目标项目的可能性,并使用softmax采样来最小化损失函数对模型进行训练。
其中,所述用户交互目标项目的可能性的计算公式如下:
s=S[:,argmax(Sev)]
其中,s表示兴趣,ev为目标项目v的嵌入表示;
由于上式具有较高的时间复杂度,使用softmax采样来最小化如下损失函数对模型进行训练:
S3、获取待推荐用户的历史交互序列和对应的时间戳序列,并将所述待推荐用户的历史交互序列和对应的时间戳序列输入至所述训练好的基于全局项目关系和时间信息感知的多兴趣序列推荐模型中,获得所述待推荐用户的多个兴趣。
在具体实施例中,在电商平台,当前用户的交互历史为“戴尔笔记本电脑-小米笔记本电脑-苹果笔记本电脑-运动裤-书桌-运动卫衣-课桌”,那么依赖于商品之间的共现性和相对时间顺序(浏览运动裤和运动卫衣,那么可能还会购买运动鞋、运动袜等;浏览课桌可能会同时购买台灯、课桌椅等),可以提取当前的用户兴趣为“笔记本电脑”、“运动服饰”以及“家具课桌椅”等。
S4、计算所述多个兴趣与候选项目的关联并进行排序,得到相关性最高的top-N个项目,生成目标项目推荐列表,并将所述目标项目推荐列表推荐给用户。
具体方式如下:
其中,ec表示一个候选项目的表示,sk表示第用户的第k个兴趣。
具体地,所述候选项目从项目集V中获得。
图5是本发明实施例提供的一种多兴趣序列推荐系统。如图5所示,该多兴趣序列推荐系统包括:多兴趣序列推荐模型构建模块、多兴趣序列推荐模型训练模块、兴趣获取模块、项目推荐模块;
多兴趣序列推荐模型构建模块,构建基于全局项目关系和时间信息感知的多兴趣序列推荐模型;
多兴趣序列推荐模型训练模块,利用数据集中用户的历史交互序列和对应的时间戳序列,对所述基于全局项目关系和时间信息感知的多兴趣序列推荐模型进行训练,得到训练好的基于全局项目关系和时间信息感知的多兴趣序列推荐模型;
兴趣获取模块,获取待推荐用户的历史交互序列和对应的时间戳序列,并将所述待推荐用户的历史交互序列和对应的时间戳序列输入至所述训练好的基于全局项目关系和时间信息感知的多兴趣序列推荐模型中,获得所述待推荐用户的多个兴趣;
项目推荐模块,计算所述多个兴趣与候选项目的关联并进行排序,得到相关性最高的top-N个项目,生成目标项目推荐列表,并将所述目标项目推荐列表推荐给用户。
上述多兴趣序列推荐系统可以实现为一种计算机程序的形式,该计算机程序可以在计算机设备上运行。
该计算机设备可以是服务器,其中,服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
计算机设备包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括非易失性存储介质和内存储器。
该非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行一种多兴趣序列推荐方法。
该处理器用于提供计算和控制能力,以支撑整个计算机设备的运行。
该内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行一种多兴趣序列推荐方法。
该网络接口用于与其它设备进行网络通信。本领域技术人员可以理解,上述计算机设备结构仅仅是与本申请方案相关的部分结构,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器用于运行存储在存储器中的计算机程序,该程序实现实施例一所述的多兴趣序列推荐方法。
应当理解,在本申请实施例中,处理器可以是中央处理单元(Central ProcessingUnit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令,计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该程序指令被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序,其中该计算机程序被处理器执行时使处理器执行实施例一所述的一种多兴趣序列推荐方法。
所述存储介质可以是U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种多兴趣序列推荐方法,其特征在于,包括步骤:
S1、构建基于全局项目关系和时间信息感知的多兴趣序列推荐模型;
S2、利用数据集中用户的历史交互序列和对应的时间戳序列,对所述基于全局项目关系和时间信息感知的多兴趣序列推荐模型进行训练,得到训练好的基于全局项目关系和时间信息感知的多兴趣序列推荐模型;步骤S2具体包括如下:
步骤(1)从数据集中获取用户的历史交互序列和对应的时间戳序列;
步骤(2)根据所述时间戳序列,计算每个项目与最后一个项目的时间间隔并进行截取操作,得到时间间隔序列;
步骤(3)将所述历史交互序列和所述时间间隔序列分别输入至嵌入层,得到用户交互嵌入表示X和时间间隔嵌入表示I;
步骤(4)对所述用户交互嵌入表示进行自注意力计算,得到在当前序列下的项目表示Z;
步骤(5)基于所述用户交互嵌入表示,构建全局项目共现图;
步骤(6)基于所述全局项目共现图,对于图中的任意节点i使用多头图注意力网络捕获与其邻居项目节点间语义条件下的关联,得到包含语义相关性的项目表示
步骤(7)根据设定的时间阈值对所述全局项目共现图进行筛选,并将项目被交互时间间隔进行处理,得到被交互时间间隔小于所述时间阈值的时间间隔嵌入矩阵;再利用图卷积操作聚合时序相关的邻居信息,得到包含时序相关性的项目表示
步骤(8)将所述包含语义相关性的项目表示和所述包含时序相关性的项目表示/>进行融合,构建全局项目关系图,并得到全局依赖嵌入表示/>
步骤(9)利用门控融合单元聚合所述在当前序列下的项目表示Z以及所述全局依赖嵌入表示得到用户表示C;
步骤(10)将所述时间间隔嵌入表示I作为注意力机制的query,所述用户表示C作为注意力机制的key和value,提取用户的K个兴趣;
步骤(11)对于目标项目,使用argmax操作从K个兴趣中筛选出与之最相关的兴趣,并基于该兴趣计算用户交互目标项目的可能性,并使用softmax采样来最小化损失函数对模型进行训练;
S3、获取待推荐用户的历史交互序列和对应的时间戳序列,并将所述待推荐用户的历史交互序列和对应的时间戳序列输入至所述训练好的基于全局项目关系和时间信息感知的多兴趣序列推荐模型中,获得所述待推荐用户的多个兴趣;
S4、计算所述多个兴趣与候选项目的关联并进行排序,得到相关性最高的top-N个项目,生成目标项目推荐列表,并将所述目标项目推荐列表推荐给用户。
2.根据权利要求1所述的方法,其特征在于,步骤(5)基于所述用户交互嵌入表示,构建全局项目共现图,具体为:
将用户的交互历史中距离不超过δ的两个项目作为共现项目对,即对任意项目xi∈X,其邻居项目集表示为其中,δ为一个超参数,用于限制共现项目对的建模范围;
基于所有用户的用户的历史交互构建全局项目共现图G=(V′,ε),其中其中V表示项目集合。
3.根据权利要求1所述的方法,其特征在于,步骤(6)基于所述全局项目共现图,对于图中的任意节点i使用多头图注意力网络捕获与其邻居项目节点间语义条件下的关联,得到包含语义相关性的项目表示具体为:
hi=Wheadei
其中,表示项目vi的嵌入表示,||表示拼接操作,head表示多头注意力的头,H表示多头注意力的头的个数,/>为可学习的转换矩阵,hi表示ei经过第head个头转换得到的项目表示;vi,vj为全局项目共现图的节点,/>表示vi的邻居项目节点集,π(vi,vj)表示不同邻居语义下的重要性权重,||表示拼接操作,σ和LeakyReLU均为激活函数。
4.根据权利要求1所述的方法,其特征在于,步骤(7)具体为:根据设定的时间阈值Tth对所述全局项目共现图进行筛选,并将项目被交互时间间隔进行截取操作,得到被交互时间间隔小于所述时间阈值Tth的时间间隔嵌入矩阵再利用图卷积操作聚合时序相关的邻居信息,得到包含时序相关性的项目表示/>
R=softmax(MW2)
其中,为可学习的参数,R为满足时间间隔阈值的项目之间的关联强度矩阵,rij为项目vi和项目vj的时序相关性分数,ej为项目vj的嵌入表示。
5.根据权利要求1所述的方法,其特征在于,步骤(9)利用门控融合单元聚合所述在当前序列下的项目表示Z以及所述全局依赖嵌入表示得到用户表示C,具体为:
其中,为可学习的转换矩阵,zi∈Z,/>为全局依赖嵌入表示。
6.根据权利要求1所述的方法,其特征在于,步骤(10)将所述时间间隔嵌入表示I作为注意力机制的query,所述用户表示C作为注意力机制的key和value,提取用户的K个兴趣S,具体为:
S=ATC
A=softmax(tanh(IW5)W6)
其中,W5、W6为可学习的参数,A表示序列中每个项目对多个兴趣的贡献程度,S代表用户的多个兴趣,K代表用户兴趣个数。
7.根据权利要求1所述的方法,其特征在于,步骤11中,所述用户交互目标项目的可能性的计算公式如下:
s=S[:,argmax(Sev)]
其中,s表示兴趣,ev为目标项目v的嵌入表示;
所述损失函数如下:
8.根据权利要求1所述的方法,其特征在于,步骤S4、计算所述多个兴趣与候选项目的关联并进行排序,得到相关性最高的top-N个项目,具体为:
其中,ec表示一个候选项目的表示,sk表示第用户的第k个兴趣。
9.一种多兴趣序列推荐系统,其特征在于,所述推荐系统执行如权利要求1所述的多兴趣序列推荐方法,包括:多兴趣序列推荐模型构建模块、多兴趣序列推荐模型训练模块、兴趣获取模块、项目推荐模块;
多兴趣序列推荐模型构建模块,构建基于全局项目关系和时间信息感知的多兴趣序列推荐模型;
多兴趣序列推荐模型训练模块,利用数据集中用户的历史交互序列和对应的时间戳序列,对所述基于全局项目关系和时间信息感知的多兴趣序列推荐模型进行训练,得到训练好的基于全局项目关系和时间信息感知的多兴趣序列推荐模型;
兴趣获取模块,获取待推荐用户的历史交互序列和对应的时间戳序列,并将所述待推荐用户的历史交互序列和对应的时间戳序列输入至所述训练好的基于全局项目关系和时间信息感知的多兴趣序列推荐模型中,获得所述待推荐用户的多个兴趣;
项目推荐模块,计算所述多个兴趣与候选项目的关联并进行排序,得到相关性最高的top-N个项目,生成目标项目推荐列表,并将所述目标项目推荐列表推荐给用户。
10.一种计算机设备,其特征在于,所述设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310832230.3A CN116776004A (zh) | 2023-07-07 | 2023-07-07 | 一种多兴趣序列推荐方法、系统及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310832230.3A CN116776004A (zh) | 2023-07-07 | 2023-07-07 | 一种多兴趣序列推荐方法、系统及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116776004A true CN116776004A (zh) | 2023-09-19 |
Family
ID=88006332
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310832230.3A Pending CN116776004A (zh) | 2023-07-07 | 2023-07-07 | 一种多兴趣序列推荐方法、系统及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116776004A (zh) |
-
2023
- 2023-07-07 CN CN202310832230.3A patent/CN116776004A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111931062B (zh) | 一种信息推荐模型的训练方法和相关装置 | |
WO2015188699A1 (zh) | 推荐项目的方法和装置 | |
CN110162698B (zh) | 一种用户画像数据处理方法、装置及存储介质 | |
US9355095B2 (en) | Click noise characterization model | |
CN110263243A (zh) | 媒体信息推荐方法、装置、存储介质和计算机设备 | |
CN105512180B (zh) | 一种搜索推荐方法及装置 | |
CN109960761A (zh) | 信息推荐方法、装置、设备及计算机可读存储介质 | |
CN112100504B (zh) | 内容推荐方法、装置、电子设备及存储介质 | |
CN109062962A (zh) | 一种融合天气信息的门控循环神经网络兴趣点推荐方法 | |
CN117836765A (zh) | 基于多模态超图的点击预测 | |
US10474926B1 (en) | Generating artificial intelligence image processing services | |
CN112733018A (zh) | 一种基于图神经网络gnn和多任务学习的会话推荐方法 | |
CN112100221B (zh) | 一种资讯推荐方法、装置、推荐服务器及存储介质 | |
CN114637911B (zh) | 一种注意力融合感知网络的下一个兴趣点推荐方法 | |
CN113742580B (zh) | 目标类型数据的召回方法、装置、电子设备及存储介质 | |
CN114281976A (zh) | 一种模型训练方法、装置、电子设备及存储介质 | |
CN117216362A (zh) | 内容推荐方法、装置、设备、介质和程序产品 | |
CN111159242B (zh) | 一种基于边缘计算的客户端重排序方法及系统 | |
CN112989179B (zh) | 模型训练、多媒体内容推荐方法和装置 | |
Gopalakrishnan et al. | An approach to webpage prediction method using variable order Markov model in recommendation systems | |
CN112269943B (zh) | 一种信息推荐系统及方法 | |
CN116956183A (zh) | 多媒体资源推荐方法、模型训练方法、装置及存储介质 | |
CN116975359A (zh) | 资源处理方法、资源推荐方法、装置和计算机设备 | |
CN116776004A (zh) | 一种多兴趣序列推荐方法、系统及设备 | |
Ramya et al. | Building web personalization system with time-driven web usage mining |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |