CN116258551A - 用户表征学习及推荐方法及系统 - Google Patents

用户表征学习及推荐方法及系统 Download PDF

Info

Publication number
CN116258551A
CN116258551A CN202310135479.9A CN202310135479A CN116258551A CN 116258551 A CN116258551 A CN 116258551A CN 202310135479 A CN202310135479 A CN 202310135479A CN 116258551 A CN116258551 A CN 116258551A
Authority
CN
China
Prior art keywords
user
session
characterization
term
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310135479.9A
Other languages
English (en)
Inventor
朱能军
孙凌丹
刘俊
薛青云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Linshu Health Technology Co ltd
University of Shanghai for Science and Technology
Original Assignee
Shanghai Linshu Health Technology Co ltd
University of Shanghai for Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Linshu Health Technology Co ltd, University of Shanghai for Science and Technology filed Critical Shanghai Linshu Health Technology Co ltd
Priority to CN202310135479.9A priority Critical patent/CN116258551A/zh
Publication of CN116258551A publication Critical patent/CN116258551A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种用户表征学习及推荐方法及系统,包括如下步骤:使用全连接神经网络将用户和项目的one‑hot编码转换为embedding表征;将用户会话分为长期会话和短期会话,抽取关键信息,分别形成长期会话表征和短期会话表征;计算用户可能属于的用户组的概率分布;根据概率分布,聚合不同用户组的特征,捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异,得到群体影响表征;用户的长期会话表征和短期会话表征以及群体影响表征构建混合用户表征;估计一个项目成为下一个访问项目的概率。本发明解决了大多数现有的基于会话的推荐系统中,独立地基于用户自身的会话总结用户的表征,而忽视了用户模型之间信息共享的问题。

Description

用户表征学习及推荐方法及系统
技术领域
本发明涉及推荐系统技术领域,具体地,涉及一种用户表征学习及推荐方法及系统,尤其是一种基于长短期用户分组建模的用户表征学习及推荐方法及系统。
背景技术
基于会话的推荐系统(SBRSs,Session-based Recommender Systems)已经成为目前的研究热点,并且越来越多地应用于下一个项目的推荐。在一个会话中指定了项目的封装范围,例如购物车中的一组产品,一定时间范围内的一组已浏览的网站等。不同的会话反映了用户不同的偏好和需求,因为用户的兴趣在不同的时间段是不断变化的。因此,基于会话的推荐不仅能模拟用户的长期偏好,同时也能捕捉用户的短期偏好。
大多数现有的SBRS假设用户当前的偏好与长期和短期的会话有不同的关联,他们采用不同的网络来区分长短期会话对描述用户当前兴趣的不同贡献。与传统方法相比,这些系统显著的提高了推荐的性能。但在这些方法中,用户的表征都是独立地基于其自身的会话进行总结的,因此学习到的模型是基于每个用户构建的,在用户的模型之间没有明确的信息共享。
然而,在实际的应用中,志同道合的用户组成的动态群体存在于不同的上下文中,并且同一群体中的用户通常具有相似的偏好。因此,如果有效地利用这些群体信息,将更多的重点放在一些相关的项目或用户上,来构建一个更具有针对性的局部推荐模型,将能够更好地捕捉到用户的动态偏好和不断演变的潜在群体信息,从而提高推荐的性能。
公开号为CN115204967A的专利文献公开了一种融入用户长短期兴趣表征隐式反馈的推荐方法,属于机器学习领域中的推荐系统研究领域,该专利文献的方法对基于矩阵分解的协同过滤方法的隐式反馈部分进行了改进,不仅考虑了用户商品二部图中用户浏览或评分商品的隐式反馈,还考虑兴趣相似用户的隐式反馈。但是该专利文献仍然存在用户的模型之间没有明确的信息共享的缺陷。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种用户表征学习及推荐方法及系统。
根据本发明提供的一种用户表征学习及推荐方法,,包括如下步骤:
步骤1:使用全连接神经网络将用户和项目的one-hot编码转换为embedding表征;
步骤2:将用户会话分为长期会话和短期会话,基于步骤1中得到的会话中项目的表征,抽取关键信息,通过池化层分别形成长期会话表征和短期会话表征;
步骤3:基于步骤2得到的长期和短期会话表征,计算用户可能属于的用户组的概率分布;
步骤4:根据步骤3得到的概率分布,聚合不同用户组的特征,捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异,得到群体影响表征;
步骤5:利用步骤2得到的用户的长期会话表征和短期会话表征以及步骤4得到的群体影响表征构建混合用户表征;
步骤6:利用步骤5得到的混合用户表征代替成对模型中的用户潜在向量,估计一个项目成为下一个访问项目的概率。
优选的,所述步骤1具体为:使用全连接神经网络将用户和物品的one-hot编码转换为低维的embedding表征,得到用户矩阵U∈RN×K和物品矩阵V∈RM×K,其中N=|U|,M=|V|,分别表示用户的数量和物品的数量,K表示隐式向量维度,u∈RK和v∈RK分别表示用户u的静态表征和物品v的静态表征,R代表矩阵。
优选的,所述步骤2具体为:将一个用户u的会话划分为两部分,其中,当前会话
Figure BDA0004085320950000021
为短期会话,用于描述用户的短期需求,其余会话为
Figure BDA0004085320950000022
为长期会话,用于表示用户的长期偏好,其中,vi表示第i个物品的静态表征,/>
Figure BDA0004085320950000023
表示短期会话中的物品数量,/>
Figure BDA0004085320950000024
表示长期会话中的物品数量;
根据每个会话中的物品表征,为该会话生成一个物品表征矩阵,并通过池化操作来聚合这些物品特征,形成两个上下文感知的输入表征xs和xl,反映用户在不用时间戳的状态。
优选的,具体计算公式如下:
Figure BDA0004085320950000025
Figure BDA0004085320950000026
其中,xs和xl分别是短期会话表征和长期会话表征,
Figure BDA0004085320950000031
表示由短期会话中的物品静态表征拼接得到的矩阵,/>
Figure BDA0004085320950000032
表示由长期会话中的物品静态表征拼接得到的矩阵。pooling表示加权平均池化操作,根据目标用户u的静态表征与物品v的静态表征计算权重,具体计算公式如下:
Figure BDA0004085320950000033
Figure BDA0004085320950000034
其中,wu,v表示基于目标用户u生成的对于物品v的权重,u表示用户u的静态表征,v表示物品v的静态表征,
Figure BDA0004085320950000035
表示长期用户会话,vi表示长期会话中第i个物品的静态表征,T表示转置操作,exp()表示以e为底的指数函数。
优选的,所述步骤3具体为:基于步骤2生成的长短期会话表征xs和xl,计算它们与潜在用户组Gk的键表征之间的相似性,评估用户当前可能属于的用户组的概率分布bs u和bl u,具体计算公式如下:
Figure BDA0004085320950000036
Figure BDA0004085320950000037
其中,bs u,bl u∈RL,分别表示用户当前可能属于的短期用户组和长期用户组的概率分布,xs和xl分别表示短期会话表征和长期会话表征,softmax函数将向量Gkxs u转换为伪概率分布向量。
优选的,所述步骤4具体为:根据步骤3得到的概率分布bs u和bl u,聚合不同用户组的特征,捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异,聚合用户组特征的计算公式如下:
Figure BDA0004085320950000038
Figure BDA0004085320950000039
其中,gl u∈RK,gs u∈RK,分别表征用户u的长期和短期潜在群体的影响,Gv表示潜在的用户组,bs u和bl u分别表示用户当前可能属于的短期用户组和长期用户组的概率分布。
优选的,所述步骤5具体为:利用步骤2得到的用户长短期会话表征以及步骤4得到的当前群体和历史群体的影响表征,构建混合的用户表征,将{xs u,xl u,gs u,gl u}表示为F。
优选的,以动态的方式组合xs u、xl u、gs u、gl u,具体方法为使用MLP聚合或使用注意力聚合;
使用MLP聚合:使用多层感知机将每个特征向量映射为一个标量,然后使用softmax层将标量转换为每个组件的权重,具体计算如下所示:
Figure BDA0004085320950000041
Figure BDA0004085320950000042
其中,F表示混合的用户表征,f表示F中的某个特征向量,wf表示为特征向量f生成的权重,hu表示得到的混合用户表征,MLP表示多层感知机,T表示转置操作,exp()表示以e为底的指数函数;
使用注意力聚合:根据组件与目标用户u的表征之间的关系计算权重,具体计算如下所示:
Figure BDA0004085320950000043
Figure BDA0004085320950000044
其中,F表示混合的用户表征,f表示F中的某个特征向量,u表示用户u的静态表征,wf表示为特征向量f生成的权重,hu表示得到的混合用户表征,T表示转置操作,exp()表示以e为底的指数函数。
优选的,所述步骤6具体为:计算步骤5得到混合用户表征hu与物品v的表征向量的内积,将其作为预测的用户u对物品v的偏好分数,计算公式如下:
Figure BDA0004085320950000045
其中,
Figure BDA0004085320950000046
表示预测的用户u对物品v的偏好分数,hu表示混合用户表征,v表示物品v的静态表征,T表示转置操作;
利用排序和成对损失函数来训练模型,对于正采样v+,从用户的当前会话中随机选择一个项目,对于负采样v-,选择一个用户以前从未购买或访问过的商品,最终的损失函数如下:
Figure BDA0004085320950000051
其中,
Figure BDA0004085320950000052
和/>
Figure BDA0004085320950000053
分别表示预测的用户u对正采样物品v+和负采样物品v-的偏好分数,/>
Figure BDA0004085320950000054
表示长期用户会话,σ表示s igmoid函数,θ表示模型的参数,argmin表示最小化函数;
利用得到的训练好的模型,选择预测分数最高的项目,作为预测用户u下一个最有可能访问的物品。
本发明还提供一种用户表征学习及推荐系统,包括如下步骤::
模块M1:使用全连接神经网络将用户和项目的one-hot编码转换为embedding表征;
模块M2:将用户会话分为长期会话和短期会话,基于模块M1中得到的会话中项目的表征,抽取关键信息,通过池化层分别形成长期会话表征和短期会话表征;
模块M3:基于模块M2得到的长期和短期会话表征,计算用户可能属于的用户组的概率分布;
模块M4:根据模块M3得到的概率分布,聚合不同用户组的特征,捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异,得到群体影响表征;
模块M5:利用模块M2得到的用户的长期会话表征和短期会话表征以及模块M4得到的群体影响表征构建混合用户表征;
模块M6:利用模块M5得到的混合用户表征代替成对模型中的用户潜在向量,估计一个项目成为下一个访问项目的概率。
与现有技术相比,本发明具有如下的有益效果:
1、本发明解决了大多数现有的基于会话的推荐系统中,独立地基于用户自身的会话总结用户的表征,而忽视了用户模型之间信息共享的问题;
2、本发明在为用户推荐物品时,综合考虑用户自身的动态兴趣信息与潜在群体的影响,可以帮助商家捕捉到蕴含信息更丰富更准确的用户偏好,从而提高推荐的准确性和用户的黏着度,不仅更好地满足了用户的需求,也会为商家带来更高的经济收益;
3、本发明不仅能捕捉到用户潜在的群体信息,还能感知到用户群体信息随时间的变化情况。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明的用户表征学习及推荐方法的步骤流程图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
实施例1:
如图1所示,本实施例提供一种用户表征学习及推荐方法,包括如下步骤:
步骤1:使用全连接神经网络将用户和项目的one-hot编码转换为embedding表征;步骤1具体为:使用全连接神经网络将用户和物品的one-hot编码转换为embedding表征,得到用户矩阵U∈RN×K和物品矩阵V∈RM×K,其中N=|U|,M=|V|,分别表示用户的数量和物品的数量,K表示隐式向量维度,u∈RK和v∈RK分别表示用户u的静态表征和物品v的静态表征,R表示矩阵。
步骤2:将用户会话分为长期会话和短期会话,基于步骤1中得到的会话中项目的表征,抽取关键信息,通过池化层分别形成长期会话表征和短期会话表征;将一个用户u的会话划分为两部分,其中,当前会话
Figure BDA0004085320950000061
为短期会话,用于描述用户的短期需求,其余会话为/>
Figure BDA0004085320950000062
为长期会话,用于表示用户的长期偏好,其中,vi表示第i个物品的静态表征,/>
Figure BDA0004085320950000063
表示短期会话中的物品数量,/>
Figure BDA0004085320950000064
表示长期会话中的物品数量;
根据每个会话中的物品表征,为该会话生成一个物品表征矩阵,并通过池化操作来聚合这些物品特征,形成两个上下文感知的输入表征xs和xl,反映用户在不用时间戳的状态;
具体计算公式如下:
Figure BDA0004085320950000065
Figure BDA0004085320950000066
其中,xs和xl分别是短期会话表征和长期会话表征,
Figure BDA0004085320950000067
表示由短期会话中的物品静态表征拼接得到的矩阵,/>
Figure BDA0004085320950000068
表示由长期会话中的物品静态表征拼接得到的矩阵。pooling表示加权平均池化操作。根据目标用户u的静态表征与物品v的静态表征计算权重,具体计算公式如下:
Figure BDA0004085320950000071
Figure BDA0004085320950000072
其中,wu,v表示基于目标用户u生成的对于物品v的权重,u表示用户u的静态表征,v表示物品v的静态表征,
Figure BDA0004085320950000073
表示长期用户会话,vi表示长期会话中第i个物品的静态表征。T表示转置操作,exp()表示以e为底的指数函数。
步骤3:基于步骤2得到的基于长短期会话表征,计算用户可能属于的用户组的概率分布;步骤3具体为:基于步骤2生成的长短期会话表征xs和xl,计算它们与潜在用户组Gk的键表征之间的相似性,评估用户当前可能属于的用户组的概率分布bs u和bs u,具体计算公式如下:
Figure BDA0004085320950000074
Figure BDA0004085320950000075
其中,bs u,bl u∈RL,分别表示用户当前可能属于的短期用户组和长期用户组的概率分布,xs和xl分别表示短期会话表征和长期会话表征。softmax函数将向量Gkxs u转换为伪概率分布向量。
步骤4:根据步骤3得到的概率分布,聚合不同用户组的特征,捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异,得到群体影响表征;步骤4具体为:根据步骤3得到的概率分布bs u和bs u,聚合不同用户组的特征,捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异,聚合用户组特征的计算公式如下:
Figure BDA0004085320950000076
Figure BDA0004085320950000077
其中,gl u∈RK,gs u∈RK,分别表征用户u的长期和短期潜在群体的影响。Gv表示潜在的用户组。bs u和bl u分别表示用户当前可能属于的短期用户组和长期用户组的概率分布。
步骤5:利用步骤2得到的用户的长期会话表征和短期会话表征以及步骤4得到的群体影响表征构建混合用户表征;所述步骤5具体为:利用步骤2得到的用户长短期会话表征以及步骤4得到的当前群体和历史群体的影响表征,构建混合的用户表征,将{xs u,xl u,gs u,gl u}表示为F;
以动态的方式组合xs u、xl u、gs u、gl u,具体方法为使用MLP聚合或使用注意力聚合;
使用MLP聚合:使用多层感知机将每个特征向量映射为一个标量,然后使用softmax层将标量转换为每个组件的权重,具体计算如下所示:
Figure BDA0004085320950000081
Figure BDA0004085320950000082
其中F表示混合的用户表征,f表示F中的某个特征向量,wf表示为特征向量f生成的权重,hu表示得到的混合用户表征。MLP表示多层感知机,T表示转置操作,exp()表示以e为底的指数函数。
使用注意力聚合:根据组件与目标用户u的表征之间的关系计算权重,具体计算如下所示:
Figure BDA0004085320950000083
/>
Figure BDA0004085320950000084
其中F表示混合的用户表征,f表示F中的某个特征向量,u表示用户u的静态表征,wf表示为特征向量f生成的权重,hu表示得到的混合用户表征。T表示转置操作,exp()表示以e为底的指数函数。
步骤6:利用步骤5得到的的混合用户表征代替成对模型中的用户潜在向量,估计一个项目成为下一个访问项目的概率;步骤6具体为:计算步骤5得到混合用户表征hu与物品v的表征向量的内积,将其作为预测的用户u对物品v的偏好分数,计算公式如下:
Figure BDA0004085320950000085
其中
Figure BDA0004085320950000086
表示预测的用户u对物品v的偏好分数,hu表示混合用户表征,v表示物品v的静态表征,T表示转置操作。
利用排序和成对损失函数来训练模型,对于正采样v+,从用户的当前会话中随机选择一个项目,对于负采样v-,选择一个用户以前从未购买或访问过的商品,最终的损失函数如下:
Figure BDA0004085320950000091
其中
Figure BDA0004085320950000092
和/>
Figure BDA0004085320950000093
分别表示预测的用户u对正采样物品v+和负采样物品v-的偏好分数,/>
Figure BDA0004085320950000094
表示长期用户会话。σ表示s igmoid函数,θ表示模型的参数,argmin表示最小化函数。
利用得到的训练好的模型,选择预测分数最高的项目,作为预测用户u下一个最有可能访问的物品。
本实施例的方法是基于长期和短期潜在用户群建模的推荐方法,通过考虑用户的长期和短期会话,以及潜在用户群体对建模用户当前偏好的不同影响,来学习得到信息量更丰富的用户表征,进而更准确地预测出下一个应该推荐给用户的项目。
本实施例的方法在考虑用户群体兴趣信息演变,建模用户的动态偏好方面,具有现实意义和良好的应用前景。
由于用户的行为模式比较复杂,为了捕捉每个潜在用户组的动态和不断发展的分组,本实施例的方法要解决的问题体现在以下几点:
a、在实际场景中,一个用户可能属于多个用户组,而不是像传统的局部方法那样被分配一个静态组;
b、每个潜在用户群体的兴趣将会随时间更新;
c、由于用户偏好和需求的演变等多种原因,用户可能会切换其潜在群体。
实施例2:
本实施例提供一种用户表征学习及推荐系统,包括如下步骤::
模块M1:使用全连接神经网络将用户和项目的one-hot编码转换为embedding表征;
模块M2:将用户会话分为长期会话和短期会话,基于模块M1中得到的会话中项目的表征,抽取关键信息,通过池化层分别形成长期会话表征和短期会话表征;
模块M3:基于模块M2得到的长期和短期会话表征,计算用户可能属于的用户组的概率分布;
模块M4:根据模块M3得到的概率分布,聚合不同用户组的特征,捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异,得到群体影响表征;
模块M5:利用模块M2得到的用户的长期会话表征和短期会话表征以及模块M4得到的群体影响表征构建混合用户表征;
模块M6:利用模块M5得到的混合用户表征代替成对模型中的用户潜在向量,估计一个项目成为下一个访问项目的概率。
实施例3:
本领域技术人员可以将本实施例理解为实施例1、实施例2的更为具体的说明。
本实施例提供一种基于长期和短期潜在用户群建模的推荐方法,方法包括以下步骤:
步骤1:使用全连接神经网络将用户和物品的one-hot编码转换为embedding表征;
步骤2:将用户会话分为长期会话和短期会话,基于会话中项目的表征,抽取关键信息,通过池化层分别形成长期和短期会话表征:
步骤3:基于长短期会话表征,计算用户可能属于的用户组的概率分布;
步骤4:聚合不同用户组的特征,以捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异;
步骤5:利用用户的长期和短期会话表征以及群体影响构建混合用户表征;
步骤6:用得到的混合用户表征代替成对模型中的用户潜在向量,来估计一个项目成为下一个访问项目的概率。
为了考虑潜在用户群体的影响,来更好地了解用户的偏好,本实施例提出通过建模长期和短期的动态潜在用户群来学习用户的表征,该模型利用两个网络分别学习用户的长期和短期会话表征,再使用另外两个单元来检测用户属于哪些潜在的用户组,并对这些潜在组的表征进行加权聚合,然后,基于注意力机制来综合考虑这四个方面,形成用户最终的偏好表征,最后,使用这些表征替代成对模型中的用户潜在向量,来估计一个项目成为下一个访问项目的概率,该模型不仅能捕捉到用户潜在的群体信息,还能感知到用户群体信息随时间的变化情况。
实施例4:
本领域技术人员可以将本实施例理解为实施例1、实施例2的更为具体的说明。
如表1和表2所示,假设用户集合和物品集合分别为
Figure BDA0004085320950000101
Figure BDA0004085320950000102
对于用户集合中的一个用户u,设/>
Figure BDA0004085320950000103
是它在一个会话中(例如Δt时间内)点击的物品序列。通过分析用户u的整个行为历史,可以得到他的会话序列/>
Figure BDA0004085320950000104
其中t表示对应时间戳的会话索引。
表1数据集统计信息表
Figure BDA0004085320950000105
Figure BDA0004085320950000111
表2问题定义符号描述表
Figure BDA0004085320950000112
假设存在L个潜在的用户组,矩阵Gv∈RL×K描述了这些用户组的偏好,同时矩阵Gk∈RL×K决定了用户和潜在用户组的关系。由此可以将一个用户分配到多个组中,并且可以得到用户组对该用户的累积影响。
因此,给定一个用户u和他的会话序列
Figure BDA0004085320950000113
通过考虑用户u的长期和短期会话,以及与他关联的长期和短期潜在群体的影响,进而预测出下一个最有可能属于当前会话st的项目。
本实施例提供一种基于长期和短期潜在用户群建模的推荐方法,具体步骤如下:
步骤1:使用全连接神经网络将用户和物品的one-hot编码转换为embedding表征,得到用户矩阵U∈RN×K和物品矩阵V∈RM×K,其中N=|U|,M=|V|,分别表示用户和物品的数量,K表示隐式向量维度,u∈RK和v∈RK分别表示用户u和物品v的静态表征;
步骤2:将一个用户u的会话划分为两部分,其中当前会话
Figure BDA0004085320950000121
为短期会话,用于描述用户的短期需求,其余会话
Figure BDA0004085320950000122
为长期会话,用于表示用户的长期偏好,根据每个会话中的物品表征,为该会话生成一个物品表征矩阵,并通过池化操作来聚合这些物品特征,形成两个上下文感知的输入表征xs和xl,反映用户在不用时间戳的状态,具体计算公式如下所示:
Figure BDA0004085320950000123
Figure BDA0004085320950000124
其中,xs和xl分别是短期会话表征和长期会话表征,
Figure BDA0004085320950000125
表示由短期会话中的物品静态表征拼接得到的矩阵,/>
Figure BDA0004085320950000126
表示由长期会话中的物品静态表征拼接得到的矩阵。pooling表示加权平均池化操作。根据目标用户u的静态表征与物品v的静态表征计算权重,具体计算公式如下:
Figure BDA0004085320950000127
Figure BDA0004085320950000128
其中,wu,v表示基于目标用户u生成的对于物品v的权重,u表示用户u的静态表征,v表示物品v的静态表征,
Figure BDA0004085320950000129
表示长期用户会话,vi表示长期会话中第i个物品的静态表征。T表示转置操作,exp()表示以e为底的指数函数。
步骤3:基于步骤2生成的长短期会话表征xs和xl(输入表征),计算它们与潜在用户组Gk的键表征之间的相似性,从而评估用户当前可能属于的用户组的概率分布bs u和bs u,计算公式如下:
Figure BDA00040853209500001210
Figure BDA00040853209500001211
其中,bs u,bl u∈RL,分别表示用户当前可能属于的短期用户组和长期用户组的概率分布,xs和xl分别表示短期会话表征和长期会话表征。softmax函数将向量Gkxs u转换为伪概率分布向量。
步骤4:根据步骤3得到的概率分布bs u和bs u,聚合不同用户组的特征,以捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异。聚合用户组特征的计算公式如下:
Figure BDA0004085320950000131
Figure BDA0004085320950000132
其中,gl u∈RK,gs u∈RK,分别表征用户u的长期和短期潜在群体的影响。Gv表示潜在的用户组。bs u和bl u分别表示用户当前可能属于的短期用户组和长期用户组的概率分布。
步骤5:利用步骤2得到的用户长短期会话表征(个人偏好表征以及步骤4得到的当前群体和历史群体的影响表征(群体影响表征),构建混合的用户表征,将{xs u,xl u,gs u,gl u}表示为F,为了以动态的方式组合这四个组件,本实施例提供了两种方法来融合它们:
1)使用MLP聚合:使用多层感知机(MLP)将每个特征向量映射为一个标量,然后使用softmax层将标量转换为每个组件的权重,具体计算如下所示:
Figure BDA0004085320950000133
Figure BDA0004085320950000134
其中F表示混合的用户表征,f表示F中的某个特征向量,wf表示为特征向量f生成的权重,hu表示得到的混合用户表征。MLP表示多层感知机,T表示转置操作,exp()表示以e为底的指数函数。
2)使用注意力聚合:根据组件与目标用户u的表征之间的关系计算权重,具体计算如下所示:
Figure BDA0004085320950000135
Figure BDA0004085320950000136
其中F表示混合的用户表征,f表示F中的某个特征向量,u表示用户u的静态表征,wf表示为特征向量f生成的权重,hu表示得到的混合用户表征。T表示转置操作,exp()表示以e为底的指数函数。
步骤6:在步骤5得到混合用户表征hu后,计算它与物品v的表征向量的内积,作为预测的用户u对物品v的偏好分数,计算公式如下所示:
Figure BDA0004085320950000137
其中
Figure BDA0004085320950000141
表示预测的用户u对物品v的偏好分数,hu表示混合用户表征,v表示物品v的静态表征,T表示转置操作。
步骤7:利用排序和成对损失函数来训练模型,对于正采样v+,从用户的当前会话中随机选择一个项目,对于负采样v-,选择一个用户以前从未购买或访问过的商品,最终的损失函数如下所示:
Figure BDA0004085320950000142
其中
Figure BDA0004085320950000143
和/>
Figure BDA0004085320950000144
分别表示预测的用户u对正采样物品v+和负采样物品v-的偏好分数,/>
Figure BDA0004085320950000145
表示长期用户会话。σ表示s igmoid函数,θ表示模型的参数,argmin表示最小化函数。
步骤8:利用步骤7得到的训练好的模型,选择预测分数最高的项目,作为预测用户u下一个最有可能访问的物品。
本发明解决了大多数现有的基于会话的推荐系统中,独立地基于用户自身的会话总结用户的表征,而忽视了用户模型之间信息共享的问题。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统及其各个装置、模块、单元以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统及其各个装置、模块、单元以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同功能。所以,本发明提供的系统及其各项装置、模块、单元可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置、模块、单元也可以视为硬件部件内的结构;也可以将用于实现各种功能的装置、模块、单元视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。

Claims (10)

1.一种用户表征学习及推荐方法,其特征在于,包括如下步骤:
步骤1:使用全连接神经网络将用户和项目的one-hot编码转换为embedding表征;
步骤2:将用户会话分为长期会话和短期会话,基于步骤1中得到的会话中项目的表征,抽取关键信息,通过池化层分别形成长期会话表征和短期会话表征;
步骤3:基于步骤2得到的长期和短期会话表征,计算用户可能属于的用户组的概率分布;
步骤4:根据步骤3得到的概率分布,聚合不同用户组的特征,捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异,得到群体影响表征;
步骤5:利用步骤2得到的用户的长期会话表征和短期会话表征以及步骤4得到的群体影响表征构建混合用户表征;
步骤6:利用步骤5得到的混合用户表征代替成对模型中的用户潜在向量,估计一个项目成为下一个访问项目的概率。
2.根据权利要求1所述的用户表征学习及推荐方法,其特征在于,所述步骤1具体为:使用全连接神经网络将用户和物品的one-hot编码转换为低维的embedding表征,得到用户矩阵U∈RN×K和物品矩阵V∈RM×K,其中N=|U|,M=|V|,分别表示用户的数量和物品的数量,K表示隐式向量维度,u∈RK和v∈RK分别表示用户u的静态表征和物品v的静态表征,R代表矩阵。
3.根据权利要求2所述的用户表征学习及推荐方法,其特征在于,所述步骤2具体为:将一个用户u的会话划分为两部分,其中,当前会话
Figure FDA0004085320930000011
为短期会话,用于描述用户的短期需求,其余会话为/>
Figure FDA0004085320930000012
为长期会话,用于表示用户的长期偏好,其中,vi表示第i个物品的静态表征,/>
Figure FDA0004085320930000013
表示短期会话中的物品数量,/>
Figure FDA0004085320930000014
表示长期会话中的物品数量;
根据每个会话中的物品表征,为该会话生成一个物品表征矩阵,并通过池化操作来聚合这些物品特征,形成两个上下文感知的输入表征xs和xl,反映用户在不用时间戳的状态。
4.根据权利要求3所述的用户表征学习及推荐方法,其特征在于,具体计算公式如下:
Figure FDA0004085320930000021
Figure FDA0004085320930000022
其中,xs和xl分别是短期会话表征和长期会话表征,
Figure FDA0004085320930000023
表示由短期会话中的物品静态表征拼接得到的矩阵,/>
Figure FDA0004085320930000024
表示由长期会话中的物品静态表征拼接得到的矩阵。pooling表示加权平均池化操作,根据目标用户u的静态表征与物品v的静态表征计算权重,具体计算公式如下:
Figure FDA0004085320930000025
Figure FDA0004085320930000026
/>
其中,wu,v表示基于目标用户u生成的对于物品v的权重,u表示用户u的静态表征,v表示物品v的静态表征,
Figure FDA0004085320930000027
表示长期用户会话,vi表示长期会话中第i个物品的静态表征,T表示转置操作,exp()表示以e为底的指数函数。
5.根据权利要求4所述的用户表征学习及推荐方法,其特征在于,所述步骤3具体为:基于步骤2生成的长短期会话表征xs和xl,计算它们与潜在用户组Gk的键表征之间的相似性,评估用户当前可能属于的用户组的概率分布bs u和bl u,,具体计算公式如下:
Figure FDA0004085320930000028
Figure FDA0004085320930000029
其中,bs u,bl u∈RL,分别表示用户当前可能属于的短期用户组和长期用户组的概率分布,xs和xl分别表示短期会话表征和长期会话表征,softmax函数将向量Gkxs u转换为伪概率分布向量。
6.根据权利要求5所述的用户表征学习及推荐方法,其特征在于,所述步骤4具体为:根据步骤3得到的概率分布bs u和bl u,聚合不同用户组的特征,捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异,聚合用户组特征的计算公式如下:
Figure FDA00040853209300000210
Figure FDA00040853209300000211
其中,gl u∈RK,gs u∈RK,分别表征用户u的长期和短期潜在群体的影响,Gv表示潜在的用户组,bs u和bl u分别表示用户当前可能属于的短期用户组和长期用户组的概率分布。
7.根据权利要求6所述的用户表征学习及推荐方法,其特征在于,所述步骤5具体为:利用步骤2得到的用户长短期会话表征以及步骤4得到的当前群体和历史群体的影响表征,构建混合的用户表征,将{xs u,xl u,gs u,gl u}表示为F。
8.根据权利要求7所述的用户表征学习及推荐方法,其特征在于,以动态的方式组合xs u、xl u、gs u、gl u,具体方法为使用MLP聚合或使用注意力聚合;
使用MLP聚合:使用多层感知机将每个特征向量映射为一个标量,然后使用softmax层将标量转换为每个组件的权重,具体计算如下所示:
Figure FDA0004085320930000031
Figure FDA0004085320930000032
其中,F表示混合的用户表征,f表示F中的某个特征向量,wf表示为特征向量f生成的权重,hu表示得到的混合用户表征,MLP表示多层感知机,T表示转置操作,exp()表示以e为底的指数函数;
使用注意力聚合:根据组件与目标用户u的表征之间的关系计算权重,具体计算如下所示:
Figure FDA0004085320930000033
/>
Figure FDA0004085320930000034
其中,F表示混合的用户表征,f表示F中的某个特征向量,u表示用户u的静态表征,wf表示为特征向量f生成的权重,hu表示得到的混合用户表征,T表示转置操作,exp()表示以e为底的指数函数。
9.根据权利要求8所述的用户表征学习及推荐方法,其特征在于,所述步骤6具体为:计算步骤5得到混合用户表征hu与物品v的表征向量的内积,将其作为预测的用户u对物品v的偏好分数,计算公式如下:
Figure FDA0004085320930000035
其中,
Figure FDA0004085320930000036
表示预测的用户u对物品v的偏好分数,hu表示混合用户表征,v表示物品v的静态表征,T表示转置操作;
利用排序和成对损失函数来训练模型,对于正采样v+,从用户的当前会话中随机选择一个项目,对于负采样v-,选择一个用户以前从未购买或访问过的商品,最终的损失函数如下:
Figure FDA0004085320930000041
其中,
Figure FDA0004085320930000042
和/>
Figure FDA0004085320930000043
分别表示预测的用户u对正采样物品v+和负采样物品v-的偏好分数,
Figure FDA0004085320930000044
表示长期用户会话,σ表示sigmoid函数,θ表示模型的参数,argmin表示最小化函数;
利用得到的训练好的模型,选择预测分数最高的项目,作为预测用户u下一个最有可能访问的物品。
10.一种用户表征学习及推荐系统,其特征在于,包括如下步骤:
模块M1:使用全连接神经网络将用户和项目的one-hot编码转换为embedding表征;
模块M2:将用户会话分为长期会话和短期会话,基于模块M1中得到的会话中项目的表征,抽取关键信息,通过池化层分别形成长期会话表征和短期会话表征;
模块M3:基于模块M2得到的长期和短期会话表征,计算用户可能属于的用户组的概率分布;
模块M4:根据模块M3得到的概率分布,聚合不同用户组的特征,捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异,得到群体影响表征;
模块M5:利用模块M2得到的用户的长期会话表征和短期会话表征以及模块M4得到的群体影响表征构建混合用户表征;
模块M6:利用模块M5得到的混合用户表征代替成对模型中的用户潜在向量,估计一个项目成为下一个访问项目的概率。
CN202310135479.9A 2023-02-17 2023-02-17 用户表征学习及推荐方法及系统 Pending CN116258551A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310135479.9A CN116258551A (zh) 2023-02-17 2023-02-17 用户表征学习及推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310135479.9A CN116258551A (zh) 2023-02-17 2023-02-17 用户表征学习及推荐方法及系统

Publications (1)

Publication Number Publication Date
CN116258551A true CN116258551A (zh) 2023-06-13

Family

ID=86683902

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310135479.9A Pending CN116258551A (zh) 2023-02-17 2023-02-17 用户表征学习及推荐方法及系统

Country Status (1)

Country Link
CN (1) CN116258551A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117094360A (zh) * 2023-10-18 2023-11-21 杭州同花顺数据开发有限公司 一种用户表征提取方法、装置、设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117094360A (zh) * 2023-10-18 2023-11-21 杭州同花顺数据开发有限公司 一种用户表征提取方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN111177575B (zh) 一种内容推荐方法、装置、电子设备和存储介质
Chen et al. Sequence-aware factorization machines for temporal predictive analytics
CN111797321B (zh) 一种面向不同场景的个性化知识推荐方法及系统
CN110503531B (zh) 时序感知的动态社交场景推荐方法
Lee et al. Scalable deep learning-based recommendation systems
Yassine et al. Intelligent recommender system based on unsupervised machine learning and demographic attributes
CN109885756B (zh) 基于cnn和rnn的序列化推荐方法
Lin et al. A survey on reinforcement learning for recommender systems
Wen et al. Neural attention model for recommendation based on factorization machines
CN112381581A (zh) 一种基于改进Transformer的广告点击率预估方法
CN111950593A (zh) 一种推荐模型训练的方法及装置
Navgaran et al. Evolutionary based matrix factorization method for collaborative filtering systems
CN111222039A (zh) 一种基于长短期兴趣组合的会话推荐方法及系统
Zhao et al. Usersim: User simulation via supervised generativeadversarial network
WO2024041483A1 (zh) 一种推荐方法及相关装置
CN116258551A (zh) 用户表征学习及推荐方法及系统
Hassan et al. Performance analysis of neural networks-based multi-criteria recommender systems
Luo et al. BGNN: Behavior-aware graph neural network for heterogeneous session-based recommendation
Wang et al. The application of factorization machines in user behavior prediction
Nazari et al. Scalable and data-independent multi-agent recommender system using social networks analysis
CN116910357A (zh) 一种数据处理方法及相关装置
Chen et al. Attention-enhanced graph neural networks with global context for session-based recommendation
Long et al. Hierarchical attention factorization machine for CTR prediction
Kumar et al. Session-based recommendations with sequential context using attention-driven LSTM
Yang et al. Collaborative meta-path modeling for explainable recommendation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination