CN116258551A - 用户表征学习及推荐方法及系统 - Google Patents
用户表征学习及推荐方法及系统 Download PDFInfo
- Publication number
- CN116258551A CN116258551A CN202310135479.9A CN202310135479A CN116258551A CN 116258551 A CN116258551 A CN 116258551A CN 202310135479 A CN202310135479 A CN 202310135479A CN 116258551 A CN116258551 A CN 116258551A
- Authority
- CN
- China
- Prior art keywords
- user
- session
- characterization
- term
- representing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012512 characterization method Methods 0.000 title claims abstract description 133
- 238000000034 method Methods 0.000 title claims abstract description 34
- 230000007774 longterm Effects 0.000 claims abstract description 89
- 238000009826 distribution Methods 0.000 claims abstract description 35
- 238000013528 artificial neural network Methods 0.000 claims abstract description 11
- 230000003068 static effect Effects 0.000 claims description 47
- 230000006870 function Effects 0.000 claims description 35
- 239000011159 matrix material Substances 0.000 claims description 26
- 238000004364 calculation method Methods 0.000 claims description 23
- 238000011176 pooling Methods 0.000 claims description 19
- 238000006116 polymerization reaction Methods 0.000 claims description 10
- 230000002776 aggregation Effects 0.000 claims description 5
- 238000004220 aggregation Methods 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 230000004931 aggregating effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- General Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种用户表征学习及推荐方法及系统,包括如下步骤:使用全连接神经网络将用户和项目的one‑hot编码转换为embedding表征;将用户会话分为长期会话和短期会话,抽取关键信息,分别形成长期会话表征和短期会话表征;计算用户可能属于的用户组的概率分布;根据概率分布,聚合不同用户组的特征,捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异,得到群体影响表征;用户的长期会话表征和短期会话表征以及群体影响表征构建混合用户表征;估计一个项目成为下一个访问项目的概率。本发明解决了大多数现有的基于会话的推荐系统中,独立地基于用户自身的会话总结用户的表征,而忽视了用户模型之间信息共享的问题。
Description
技术领域
本发明涉及推荐系统技术领域,具体地,涉及一种用户表征学习及推荐方法及系统,尤其是一种基于长短期用户分组建模的用户表征学习及推荐方法及系统。
背景技术
基于会话的推荐系统(SBRSs,Session-based Recommender Systems)已经成为目前的研究热点,并且越来越多地应用于下一个项目的推荐。在一个会话中指定了项目的封装范围,例如购物车中的一组产品,一定时间范围内的一组已浏览的网站等。不同的会话反映了用户不同的偏好和需求,因为用户的兴趣在不同的时间段是不断变化的。因此,基于会话的推荐不仅能模拟用户的长期偏好,同时也能捕捉用户的短期偏好。
大多数现有的SBRS假设用户当前的偏好与长期和短期的会话有不同的关联,他们采用不同的网络来区分长短期会话对描述用户当前兴趣的不同贡献。与传统方法相比,这些系统显著的提高了推荐的性能。但在这些方法中,用户的表征都是独立地基于其自身的会话进行总结的,因此学习到的模型是基于每个用户构建的,在用户的模型之间没有明确的信息共享。
然而,在实际的应用中,志同道合的用户组成的动态群体存在于不同的上下文中,并且同一群体中的用户通常具有相似的偏好。因此,如果有效地利用这些群体信息,将更多的重点放在一些相关的项目或用户上,来构建一个更具有针对性的局部推荐模型,将能够更好地捕捉到用户的动态偏好和不断演变的潜在群体信息,从而提高推荐的性能。
公开号为CN115204967A的专利文献公开了一种融入用户长短期兴趣表征隐式反馈的推荐方法,属于机器学习领域中的推荐系统研究领域,该专利文献的方法对基于矩阵分解的协同过滤方法的隐式反馈部分进行了改进,不仅考虑了用户商品二部图中用户浏览或评分商品的隐式反馈,还考虑兴趣相似用户的隐式反馈。但是该专利文献仍然存在用户的模型之间没有明确的信息共享的缺陷。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种用户表征学习及推荐方法及系统。
根据本发明提供的一种用户表征学习及推荐方法,,包括如下步骤:
步骤1:使用全连接神经网络将用户和项目的one-hot编码转换为embedding表征;
步骤2:将用户会话分为长期会话和短期会话,基于步骤1中得到的会话中项目的表征,抽取关键信息,通过池化层分别形成长期会话表征和短期会话表征;
步骤3:基于步骤2得到的长期和短期会话表征,计算用户可能属于的用户组的概率分布;
步骤4:根据步骤3得到的概率分布,聚合不同用户组的特征,捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异,得到群体影响表征;
步骤5:利用步骤2得到的用户的长期会话表征和短期会话表征以及步骤4得到的群体影响表征构建混合用户表征;
步骤6:利用步骤5得到的混合用户表征代替成对模型中的用户潜在向量,估计一个项目成为下一个访问项目的概率。
优选的,所述步骤1具体为:使用全连接神经网络将用户和物品的one-hot编码转换为低维的embedding表征,得到用户矩阵U∈RN×K和物品矩阵V∈RM×K,其中N=|U|,M=|V|,分别表示用户的数量和物品的数量,K表示隐式向量维度,u∈RK和v∈RK分别表示用户u的静态表征和物品v的静态表征,R代表矩阵。
优选的,所述步骤2具体为:将一个用户u的会话划分为两部分,其中,当前会话为短期会话,用于描述用户的短期需求,其余会话为为长期会话,用于表示用户的长期偏好,其中,vi表示第i个物品的静态表征,/>表示短期会话中的物品数量,/>表示长期会话中的物品数量;
根据每个会话中的物品表征,为该会话生成一个物品表征矩阵,并通过池化操作来聚合这些物品特征,形成两个上下文感知的输入表征xs和xl,反映用户在不用时间戳的状态。
优选的,具体计算公式如下:
其中,xs和xl分别是短期会话表征和长期会话表征,表示由短期会话中的物品静态表征拼接得到的矩阵,/>表示由长期会话中的物品静态表征拼接得到的矩阵。pooling表示加权平均池化操作,根据目标用户u的静态表征与物品v的静态表征计算权重,具体计算公式如下:
其中,wu,v表示基于目标用户u生成的对于物品v的权重,u表示用户u的静态表征,v表示物品v的静态表征,表示长期用户会话,vi表示长期会话中第i个物品的静态表征,T表示转置操作,exp()表示以e为底的指数函数。
优选的,所述步骤3具体为:基于步骤2生成的长短期会话表征xs和xl,计算它们与潜在用户组Gk的键表征之间的相似性,评估用户当前可能属于的用户组的概率分布bs u和bl u,具体计算公式如下:
其中,bs u,bl u∈RL,分别表示用户当前可能属于的短期用户组和长期用户组的概率分布,xs和xl分别表示短期会话表征和长期会话表征,softmax函数将向量Gkxs u转换为伪概率分布向量。
优选的,所述步骤4具体为:根据步骤3得到的概率分布bs u和bl u,聚合不同用户组的特征,捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异,聚合用户组特征的计算公式如下:
其中,gl u∈RK,gs u∈RK,分别表征用户u的长期和短期潜在群体的影响,Gv表示潜在的用户组,bs u和bl u分别表示用户当前可能属于的短期用户组和长期用户组的概率分布。
优选的,所述步骤5具体为:利用步骤2得到的用户长短期会话表征以及步骤4得到的当前群体和历史群体的影响表征,构建混合的用户表征,将{xs u,xl u,gs u,gl u}表示为F。
优选的,以动态的方式组合xs u、xl u、gs u、gl u,具体方法为使用MLP聚合或使用注意力聚合;
使用MLP聚合:使用多层感知机将每个特征向量映射为一个标量,然后使用softmax层将标量转换为每个组件的权重,具体计算如下所示:
其中,F表示混合的用户表征,f表示F中的某个特征向量,wf表示为特征向量f生成的权重,hu表示得到的混合用户表征,MLP表示多层感知机,T表示转置操作,exp()表示以e为底的指数函数;
使用注意力聚合:根据组件与目标用户u的表征之间的关系计算权重,具体计算如下所示:
其中,F表示混合的用户表征,f表示F中的某个特征向量,u表示用户u的静态表征,wf表示为特征向量f生成的权重,hu表示得到的混合用户表征,T表示转置操作,exp()表示以e为底的指数函数。
优选的,所述步骤6具体为:计算步骤5得到混合用户表征hu与物品v的表征向量的内积,将其作为预测的用户u对物品v的偏好分数,计算公式如下:
利用排序和成对损失函数来训练模型,对于正采样v+,从用户的当前会话中随机选择一个项目,对于负采样v-,选择一个用户以前从未购买或访问过的商品,最终的损失函数如下:
利用得到的训练好的模型,选择预测分数最高的项目,作为预测用户u下一个最有可能访问的物品。
本发明还提供一种用户表征学习及推荐系统,包括如下步骤::
模块M1:使用全连接神经网络将用户和项目的one-hot编码转换为embedding表征;
模块M2:将用户会话分为长期会话和短期会话,基于模块M1中得到的会话中项目的表征,抽取关键信息,通过池化层分别形成长期会话表征和短期会话表征;
模块M3:基于模块M2得到的长期和短期会话表征,计算用户可能属于的用户组的概率分布;
模块M4:根据模块M3得到的概率分布,聚合不同用户组的特征,捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异,得到群体影响表征;
模块M5:利用模块M2得到的用户的长期会话表征和短期会话表征以及模块M4得到的群体影响表征构建混合用户表征;
模块M6:利用模块M5得到的混合用户表征代替成对模型中的用户潜在向量,估计一个项目成为下一个访问项目的概率。
与现有技术相比,本发明具有如下的有益效果:
1、本发明解决了大多数现有的基于会话的推荐系统中,独立地基于用户自身的会话总结用户的表征,而忽视了用户模型之间信息共享的问题;
2、本发明在为用户推荐物品时,综合考虑用户自身的动态兴趣信息与潜在群体的影响,可以帮助商家捕捉到蕴含信息更丰富更准确的用户偏好,从而提高推荐的准确性和用户的黏着度,不仅更好地满足了用户的需求,也会为商家带来更高的经济收益;
3、本发明不仅能捕捉到用户潜在的群体信息,还能感知到用户群体信息随时间的变化情况。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明的用户表征学习及推荐方法的步骤流程图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
实施例1:
如图1所示,本实施例提供一种用户表征学习及推荐方法,包括如下步骤:
步骤1:使用全连接神经网络将用户和项目的one-hot编码转换为embedding表征;步骤1具体为:使用全连接神经网络将用户和物品的one-hot编码转换为embedding表征,得到用户矩阵U∈RN×K和物品矩阵V∈RM×K,其中N=|U|,M=|V|,分别表示用户的数量和物品的数量,K表示隐式向量维度,u∈RK和v∈RK分别表示用户u的静态表征和物品v的静态表征,R表示矩阵。
步骤2:将用户会话分为长期会话和短期会话,基于步骤1中得到的会话中项目的表征,抽取关键信息,通过池化层分别形成长期会话表征和短期会话表征;将一个用户u的会话划分为两部分,其中,当前会话为短期会话,用于描述用户的短期需求,其余会话为/>为长期会话,用于表示用户的长期偏好,其中,vi表示第i个物品的静态表征,/>表示短期会话中的物品数量,/>表示长期会话中的物品数量;
根据每个会话中的物品表征,为该会话生成一个物品表征矩阵,并通过池化操作来聚合这些物品特征,形成两个上下文感知的输入表征xs和xl,反映用户在不用时间戳的状态;
具体计算公式如下:
其中,xs和xl分别是短期会话表征和长期会话表征,表示由短期会话中的物品静态表征拼接得到的矩阵,/>表示由长期会话中的物品静态表征拼接得到的矩阵。pooling表示加权平均池化操作。根据目标用户u的静态表征与物品v的静态表征计算权重,具体计算公式如下:
其中,wu,v表示基于目标用户u生成的对于物品v的权重,u表示用户u的静态表征,v表示物品v的静态表征,表示长期用户会话,vi表示长期会话中第i个物品的静态表征。T表示转置操作,exp()表示以e为底的指数函数。
步骤3:基于步骤2得到的基于长短期会话表征,计算用户可能属于的用户组的概率分布;步骤3具体为:基于步骤2生成的长短期会话表征xs和xl,计算它们与潜在用户组Gk的键表征之间的相似性,评估用户当前可能属于的用户组的概率分布bs u和bs u,具体计算公式如下:
其中,bs u,bl u∈RL,分别表示用户当前可能属于的短期用户组和长期用户组的概率分布,xs和xl分别表示短期会话表征和长期会话表征。softmax函数将向量Gkxs u转换为伪概率分布向量。
步骤4:根据步骤3得到的概率分布,聚合不同用户组的特征,捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异,得到群体影响表征;步骤4具体为:根据步骤3得到的概率分布bs u和bs u,聚合不同用户组的特征,捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异,聚合用户组特征的计算公式如下:
其中,gl u∈RK,gs u∈RK,分别表征用户u的长期和短期潜在群体的影响。Gv表示潜在的用户组。bs u和bl u分别表示用户当前可能属于的短期用户组和长期用户组的概率分布。
步骤5:利用步骤2得到的用户的长期会话表征和短期会话表征以及步骤4得到的群体影响表征构建混合用户表征;所述步骤5具体为:利用步骤2得到的用户长短期会话表征以及步骤4得到的当前群体和历史群体的影响表征,构建混合的用户表征,将{xs u,xl u,gs u,gl u}表示为F;
以动态的方式组合xs u、xl u、gs u、gl u,具体方法为使用MLP聚合或使用注意力聚合;
使用MLP聚合:使用多层感知机将每个特征向量映射为一个标量,然后使用softmax层将标量转换为每个组件的权重,具体计算如下所示:
其中F表示混合的用户表征,f表示F中的某个特征向量,wf表示为特征向量f生成的权重,hu表示得到的混合用户表征。MLP表示多层感知机,T表示转置操作,exp()表示以e为底的指数函数。
使用注意力聚合:根据组件与目标用户u的表征之间的关系计算权重,具体计算如下所示:
其中F表示混合的用户表征,f表示F中的某个特征向量,u表示用户u的静态表征,wf表示为特征向量f生成的权重,hu表示得到的混合用户表征。T表示转置操作,exp()表示以e为底的指数函数。
步骤6:利用步骤5得到的的混合用户表征代替成对模型中的用户潜在向量,估计一个项目成为下一个访问项目的概率;步骤6具体为:计算步骤5得到混合用户表征hu与物品v的表征向量的内积,将其作为预测的用户u对物品v的偏好分数,计算公式如下:
利用排序和成对损失函数来训练模型,对于正采样v+,从用户的当前会话中随机选择一个项目,对于负采样v-,选择一个用户以前从未购买或访问过的商品,最终的损失函数如下:
利用得到的训练好的模型,选择预测分数最高的项目,作为预测用户u下一个最有可能访问的物品。
本实施例的方法是基于长期和短期潜在用户群建模的推荐方法,通过考虑用户的长期和短期会话,以及潜在用户群体对建模用户当前偏好的不同影响,来学习得到信息量更丰富的用户表征,进而更准确地预测出下一个应该推荐给用户的项目。
本实施例的方法在考虑用户群体兴趣信息演变,建模用户的动态偏好方面,具有现实意义和良好的应用前景。
由于用户的行为模式比较复杂,为了捕捉每个潜在用户组的动态和不断发展的分组,本实施例的方法要解决的问题体现在以下几点:
a、在实际场景中,一个用户可能属于多个用户组,而不是像传统的局部方法那样被分配一个静态组;
b、每个潜在用户群体的兴趣将会随时间更新;
c、由于用户偏好和需求的演变等多种原因,用户可能会切换其潜在群体。
实施例2:
本实施例提供一种用户表征学习及推荐系统,包括如下步骤::
模块M1:使用全连接神经网络将用户和项目的one-hot编码转换为embedding表征;
模块M2:将用户会话分为长期会话和短期会话,基于模块M1中得到的会话中项目的表征,抽取关键信息,通过池化层分别形成长期会话表征和短期会话表征;
模块M3:基于模块M2得到的长期和短期会话表征,计算用户可能属于的用户组的概率分布;
模块M4:根据模块M3得到的概率分布,聚合不同用户组的特征,捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异,得到群体影响表征;
模块M5:利用模块M2得到的用户的长期会话表征和短期会话表征以及模块M4得到的群体影响表征构建混合用户表征;
模块M6:利用模块M5得到的混合用户表征代替成对模型中的用户潜在向量,估计一个项目成为下一个访问项目的概率。
实施例3:
本领域技术人员可以将本实施例理解为实施例1、实施例2的更为具体的说明。
本实施例提供一种基于长期和短期潜在用户群建模的推荐方法,方法包括以下步骤:
步骤1:使用全连接神经网络将用户和物品的one-hot编码转换为embedding表征;
步骤2:将用户会话分为长期会话和短期会话,基于会话中项目的表征,抽取关键信息,通过池化层分别形成长期和短期会话表征:
步骤3:基于长短期会话表征,计算用户可能属于的用户组的概率分布;
步骤4:聚合不同用户组的特征,以捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异;
步骤5:利用用户的长期和短期会话表征以及群体影响构建混合用户表征;
步骤6:用得到的混合用户表征代替成对模型中的用户潜在向量,来估计一个项目成为下一个访问项目的概率。
为了考虑潜在用户群体的影响,来更好地了解用户的偏好,本实施例提出通过建模长期和短期的动态潜在用户群来学习用户的表征,该模型利用两个网络分别学习用户的长期和短期会话表征,再使用另外两个单元来检测用户属于哪些潜在的用户组,并对这些潜在组的表征进行加权聚合,然后,基于注意力机制来综合考虑这四个方面,形成用户最终的偏好表征,最后,使用这些表征替代成对模型中的用户潜在向量,来估计一个项目成为下一个访问项目的概率,该模型不仅能捕捉到用户潜在的群体信息,还能感知到用户群体信息随时间的变化情况。
实施例4:
本领域技术人员可以将本实施例理解为实施例1、实施例2的更为具体的说明。
如表1和表2所示,假设用户集合和物品集合分别为和对于用户集合中的一个用户u,设/>是它在一个会话中(例如Δt时间内)点击的物品序列。通过分析用户u的整个行为历史,可以得到他的会话序列/>其中t表示对应时间戳的会话索引。
表1数据集统计信息表
表2问题定义符号描述表
假设存在L个潜在的用户组,矩阵Gv∈RL×K描述了这些用户组的偏好,同时矩阵Gk∈RL×K决定了用户和潜在用户组的关系。由此可以将一个用户分配到多个组中,并且可以得到用户组对该用户的累积影响。
本实施例提供一种基于长期和短期潜在用户群建模的推荐方法,具体步骤如下:
步骤1:使用全连接神经网络将用户和物品的one-hot编码转换为embedding表征,得到用户矩阵U∈RN×K和物品矩阵V∈RM×K,其中N=|U|,M=|V|,分别表示用户和物品的数量,K表示隐式向量维度,u∈RK和v∈RK分别表示用户u和物品v的静态表征;
步骤2:将一个用户u的会话划分为两部分,其中当前会话为短期会话,用于描述用户的短期需求,其余会话为长期会话,用于表示用户的长期偏好,根据每个会话中的物品表征,为该会话生成一个物品表征矩阵,并通过池化操作来聚合这些物品特征,形成两个上下文感知的输入表征xs和xl,反映用户在不用时间戳的状态,具体计算公式如下所示:
其中,xs和xl分别是短期会话表征和长期会话表征,表示由短期会话中的物品静态表征拼接得到的矩阵,/>表示由长期会话中的物品静态表征拼接得到的矩阵。pooling表示加权平均池化操作。根据目标用户u的静态表征与物品v的静态表征计算权重,具体计算公式如下:
其中,wu,v表示基于目标用户u生成的对于物品v的权重,u表示用户u的静态表征,v表示物品v的静态表征,表示长期用户会话,vi表示长期会话中第i个物品的静态表征。T表示转置操作,exp()表示以e为底的指数函数。
步骤3:基于步骤2生成的长短期会话表征xs和xl(输入表征),计算它们与潜在用户组Gk的键表征之间的相似性,从而评估用户当前可能属于的用户组的概率分布bs u和bs u,计算公式如下:
其中,bs u,bl u∈RL,分别表示用户当前可能属于的短期用户组和长期用户组的概率分布,xs和xl分别表示短期会话表征和长期会话表征。softmax函数将向量Gkxs u转换为伪概率分布向量。
步骤4:根据步骤3得到的概率分布bs u和bs u,聚合不同用户组的特征,以捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异。聚合用户组特征的计算公式如下:
其中,gl u∈RK,gs u∈RK,分别表征用户u的长期和短期潜在群体的影响。Gv表示潜在的用户组。bs u和bl u分别表示用户当前可能属于的短期用户组和长期用户组的概率分布。
步骤5:利用步骤2得到的用户长短期会话表征(个人偏好表征以及步骤4得到的当前群体和历史群体的影响表征(群体影响表征),构建混合的用户表征,将{xs u,xl u,gs u,gl u}表示为F,为了以动态的方式组合这四个组件,本实施例提供了两种方法来融合它们:
1)使用MLP聚合:使用多层感知机(MLP)将每个特征向量映射为一个标量,然后使用softmax层将标量转换为每个组件的权重,具体计算如下所示:
其中F表示混合的用户表征,f表示F中的某个特征向量,wf表示为特征向量f生成的权重,hu表示得到的混合用户表征。MLP表示多层感知机,T表示转置操作,exp()表示以e为底的指数函数。
2)使用注意力聚合:根据组件与目标用户u的表征之间的关系计算权重,具体计算如下所示:
其中F表示混合的用户表征,f表示F中的某个特征向量,u表示用户u的静态表征,wf表示为特征向量f生成的权重,hu表示得到的混合用户表征。T表示转置操作,exp()表示以e为底的指数函数。
步骤6:在步骤5得到混合用户表征hu后,计算它与物品v的表征向量的内积,作为预测的用户u对物品v的偏好分数,计算公式如下所示:
步骤7:利用排序和成对损失函数来训练模型,对于正采样v+,从用户的当前会话中随机选择一个项目,对于负采样v-,选择一个用户以前从未购买或访问过的商品,最终的损失函数如下所示:
步骤8:利用步骤7得到的训练好的模型,选择预测分数最高的项目,作为预测用户u下一个最有可能访问的物品。
本发明解决了大多数现有的基于会话的推荐系统中,独立地基于用户自身的会话总结用户的表征,而忽视了用户模型之间信息共享的问题。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统及其各个装置、模块、单元以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统及其各个装置、模块、单元以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同功能。所以,本发明提供的系统及其各项装置、模块、单元可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置、模块、单元也可以视为硬件部件内的结构;也可以将用于实现各种功能的装置、模块、单元视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。
Claims (10)
1.一种用户表征学习及推荐方法,其特征在于,包括如下步骤:
步骤1:使用全连接神经网络将用户和项目的one-hot编码转换为embedding表征;
步骤2:将用户会话分为长期会话和短期会话,基于步骤1中得到的会话中项目的表征,抽取关键信息,通过池化层分别形成长期会话表征和短期会话表征;
步骤3:基于步骤2得到的长期和短期会话表征,计算用户可能属于的用户组的概率分布;
步骤4:根据步骤3得到的概率分布,聚合不同用户组的特征,捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异,得到群体影响表征;
步骤5:利用步骤2得到的用户的长期会话表征和短期会话表征以及步骤4得到的群体影响表征构建混合用户表征;
步骤6:利用步骤5得到的混合用户表征代替成对模型中的用户潜在向量,估计一个项目成为下一个访问项目的概率。
2.根据权利要求1所述的用户表征学习及推荐方法,其特征在于,所述步骤1具体为:使用全连接神经网络将用户和物品的one-hot编码转换为低维的embedding表征,得到用户矩阵U∈RN×K和物品矩阵V∈RM×K,其中N=|U|,M=|V|,分别表示用户的数量和物品的数量,K表示隐式向量维度,u∈RK和v∈RK分别表示用户u的静态表征和物品v的静态表征,R代表矩阵。
7.根据权利要求6所述的用户表征学习及推荐方法,其特征在于,所述步骤5具体为:利用步骤2得到的用户长短期会话表征以及步骤4得到的当前群体和历史群体的影响表征,构建混合的用户表征,将{xs u,xl u,gs u,gl u}表示为F。
8.根据权利要求7所述的用户表征学习及推荐方法,其特征在于,以动态的方式组合xs u、xl u、gs u、gl u,具体方法为使用MLP聚合或使用注意力聚合;
使用MLP聚合:使用多层感知机将每个特征向量映射为一个标量,然后使用softmax层将标量转换为每个组件的权重,具体计算如下所示:
其中,F表示混合的用户表征,f表示F中的某个特征向量,wf表示为特征向量f生成的权重,hu表示得到的混合用户表征,MLP表示多层感知机,T表示转置操作,exp()表示以e为底的指数函数;
使用注意力聚合:根据组件与目标用户u的表征之间的关系计算权重,具体计算如下所示:
其中,F表示混合的用户表征,f表示F中的某个特征向量,u表示用户u的静态表征,wf表示为特征向量f生成的权重,hu表示得到的混合用户表征,T表示转置操作,exp()表示以e为底的指数函数。
9.根据权利要求8所述的用户表征学习及推荐方法,其特征在于,所述步骤6具体为:计算步骤5得到混合用户表征hu与物品v的表征向量的内积,将其作为预测的用户u对物品v的偏好分数,计算公式如下:
利用排序和成对损失函数来训练模型,对于正采样v+,从用户的当前会话中随机选择一个项目,对于负采样v-,选择一个用户以前从未购买或访问过的商品,最终的损失函数如下:
利用得到的训练好的模型,选择预测分数最高的项目,作为预测用户u下一个最有可能访问的物品。
10.一种用户表征学习及推荐系统,其特征在于,包括如下步骤:
模块M1:使用全连接神经网络将用户和项目的one-hot编码转换为embedding表征;
模块M2:将用户会话分为长期会话和短期会话,基于模块M1中得到的会话中项目的表征,抽取关键信息,通过池化层分别形成长期会话表征和短期会话表征;
模块M3:基于模块M2得到的长期和短期会话表征,计算用户可能属于的用户组的概率分布;
模块M4:根据模块M3得到的概率分布,聚合不同用户组的特征,捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异,得到群体影响表征;
模块M5:利用模块M2得到的用户的长期会话表征和短期会话表征以及模块M4得到的群体影响表征构建混合用户表征;
模块M6:利用模块M5得到的混合用户表征代替成对模型中的用户潜在向量,估计一个项目成为下一个访问项目的概率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310135479.9A CN116258551A (zh) | 2023-02-17 | 2023-02-17 | 用户表征学习及推荐方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310135479.9A CN116258551A (zh) | 2023-02-17 | 2023-02-17 | 用户表征学习及推荐方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116258551A true CN116258551A (zh) | 2023-06-13 |
Family
ID=86683902
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310135479.9A Pending CN116258551A (zh) | 2023-02-17 | 2023-02-17 | 用户表征学习及推荐方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116258551A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117094360A (zh) * | 2023-10-18 | 2023-11-21 | 杭州同花顺数据开发有限公司 | 一种用户表征提取方法、装置、设备及存储介质 |
-
2023
- 2023-02-17 CN CN202310135479.9A patent/CN116258551A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117094360A (zh) * | 2023-10-18 | 2023-11-21 | 杭州同花顺数据开发有限公司 | 一种用户表征提取方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111177575B (zh) | 一种内容推荐方法、装置、电子设备和存储介质 | |
Chen et al. | Sequence-aware factorization machines for temporal predictive analytics | |
CN111797321B (zh) | 一种面向不同场景的个性化知识推荐方法及系统 | |
CN110503531B (zh) | 时序感知的动态社交场景推荐方法 | |
Lee et al. | Scalable deep learning-based recommendation systems | |
Yassine et al. | Intelligent recommender system based on unsupervised machine learning and demographic attributes | |
CN109885756B (zh) | 基于cnn和rnn的序列化推荐方法 | |
Lin et al. | A survey on reinforcement learning for recommender systems | |
Wen et al. | Neural attention model for recommendation based on factorization machines | |
CN112381581A (zh) | 一种基于改进Transformer的广告点击率预估方法 | |
CN111950593A (zh) | 一种推荐模型训练的方法及装置 | |
Navgaran et al. | Evolutionary based matrix factorization method for collaborative filtering systems | |
CN111222039A (zh) | 一种基于长短期兴趣组合的会话推荐方法及系统 | |
Zhao et al. | Usersim: User simulation via supervised generativeadversarial network | |
WO2024041483A1 (zh) | 一种推荐方法及相关装置 | |
CN116258551A (zh) | 用户表征学习及推荐方法及系统 | |
Hassan et al. | Performance analysis of neural networks-based multi-criteria recommender systems | |
Luo et al. | BGNN: Behavior-aware graph neural network for heterogeneous session-based recommendation | |
Wang et al. | The application of factorization machines in user behavior prediction | |
Nazari et al. | Scalable and data-independent multi-agent recommender system using social networks analysis | |
CN116910357A (zh) | 一种数据处理方法及相关装置 | |
Chen et al. | Attention-enhanced graph neural networks with global context for session-based recommendation | |
Long et al. | Hierarchical attention factorization machine for CTR prediction | |
Kumar et al. | Session-based recommendations with sequential context using attention-driven LSTM | |
Yang et al. | Collaborative meta-path modeling for explainable recommendation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |