CN112819575A - 一种考虑重复购买行为的会话推荐方法 - Google Patents

一种考虑重复购买行为的会话推荐方法 Download PDF

Info

Publication number
CN112819575A
CN112819575A CN202110102234.7A CN202110102234A CN112819575A CN 112819575 A CN112819575 A CN 112819575A CN 202110102234 A CN202110102234 A CN 202110102234A CN 112819575 A CN112819575 A CN 112819575A
Authority
CN
China
Prior art keywords
user
sequence
item
term
long
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110102234.7A
Other languages
English (en)
Other versions
CN112819575B (zh
Inventor
顾盼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Zhiduo Network Technology Co ltd
Original Assignee
China Jiliang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Jiliang University filed Critical China Jiliang University
Priority to CN202110102234.7A priority Critical patent/CN112819575B/zh
Publication of CN112819575A publication Critical patent/CN112819575A/zh
Application granted granted Critical
Publication of CN112819575B publication Critical patent/CN112819575B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Finance (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Biology (AREA)
  • Fuzzy Systems (AREA)
  • Human Computer Interaction (AREA)
  • Bioinformatics & Computational Biology (AREA)

Abstract

本发明公开了一种考虑重复购买行为的会话推荐方法。该方法建立一个模型对当前会话和用户长期兴趣进行建模,并预测用户点下一个点击的物品。用户在在线平台上往往会有固定的行为习惯,因此本方法提出一种考虑重复购买行为的推荐方法,主要由四个部分组成:第一部分是根据用户当前交互会话序列,得到用户短期、长期兴趣表征和辅助行为(购买)表征。第二部分是根据用户短期和长期兴趣表征,选择重复模式或探索模式。第三部分是在重复模式下,根据用户的短期、长期兴趣表征和辅助行为(购买)表征,在用户历史购买的物品序列中进行推荐。第四部分是在探索模式下,根据用户的短期和长期兴趣表征,对不在用户历史购买的物品序列中的物品进行推荐。

Description

一种考虑重复购买行为的会话推荐方法
技术领域
本发明属于互联网服务技术领域,尤其是涉及一种考虑重复购买行为的会话推荐方法。
背景技术
随着在线服务的发展和流行,在线平台记录着大量的用户行为数据。从海量数据中找出用户最感兴趣的物品并推荐给用户,可以极大地提升用户的满意度和公司的收益。此时,推荐系统显得非常重要。推荐系统可以从海量物品中挖掘出用户最喜欢的物品。
传统的推荐方法主要包括三种。一种是一般的推荐系统,从用户和物品之间的历史交互数据中挖掘出用户和物品的静态关联,包括,协同过滤和矩阵分解等方法。这类方法将用户-物品的交互关系输入到网络中,忽略了用户兴趣的动态变化。第二种是基于物品序列,推荐用户下一个交互的物品,叫做序列推荐方法。会话推荐方法就属于一种序列推荐方法,会话是指一段时间内的用户交互序列。最后一种方法是将前两种方法结合起来,同时对用户的静态的长期兴趣和动态的当前兴趣进行建模,然后再推荐用户下一个交互的物品。本方法在对用户兴趣建模时,同样是采取第三种方法。但是本方法最大的不同点是考虑到用户的重复消费行为。用户在在线平台上会有固定的行为习惯。比如,在电商平台上,用户经常会重复购买固定的商品;在音乐平台上,用户会经常重复听同一首歌曲。Ren等人在论文中提出了重复网络(RepeatNet)来解决重复消费推荐问题,但是该论文提出的解法和问题定义不符。重复网络在介绍(introduction)中提出用户存在重复消费行为,所以在推荐物品时应考虑到用户这一消费规律。但是在方法(method)中,推荐重复的物品是在当前会话中的物品序列中推荐,而用户在短时间内,也就是在一个会话内部重复购买相同的物品的可能性很低。并且该方法没有考虑到用户的长期兴趣,用户长期兴趣是偏向于静态的。如果用户在当前会话中的短期兴趣和用户的长期兴趣重复度很高,那么发生重复购买行为的概率较大。所以在模型中,判断推荐模式是重复模式还是探索模式时,应该同时考虑用户的长期兴趣和用户的短期兴趣。其中,重复模式是指推荐用户历史购买过的物品,探索模式是指推荐用户从未购买过的商品。关于重复行为这个场景的论文或者方法不多,但是工业界已经有相关的应用。如,“淘宝”APP在订单页面会有“常购好货”的功能展示,从该用户历史购买商品中推荐用户当下还有可能购买的商品。
发明内容
本方法是一种基于会话的物品点击率预测方法。会话(session)指一段时间内的用户交互的物品序列,会话推荐任务是指基于当前会话中的物品序列,预测用户在当前会话中下一个感兴趣的物品。用户的当前会话可以表示为ST={x1,x2,…,xτ,…,xt},其中,xτ代表第τ个物品。预测用户在当前会话中下一个感兴趣的物品用数学语言可以表示为P(xt+1|ST),其中,P(xt+1|ST)表示基于用户的当前会话ST,用户下一个交互物品xt+1的概率。将用户行为序列划分成会话更符合用户行为规律,一般来讲,用户在一个会话中会有特定的目的。会话和会话之间会有一个较长时间间隔(time gap),如,淘宝将时间间隔设置为三十分钟。现在越来越多的方法,在基于会话推荐时,会同时将用户过去一段时间内的交互行为作为信息补充考虑进来,用于捕捉用户的长期兴趣,来提升推荐的准确度。此时,推荐物品的概率变成P(xt+1|ST,pl),其中pl表示用户的长期兴趣。
对于用户的重复消费行为的研究工作较少。而用户在在线平台上会有固定的行为习惯。Ren等人提出了重复网络(RepeatNet)来解决重复消费推荐问题,但是该论文提出的解法和问题定义不符。重复网络在介绍(introduction)中提出用户存在重复消费行为,所以在推荐物品时应考虑到用户这一消费规律。但是在方法(method)中,推荐重复的物品是在当前会话中的物品序列中推荐,而用户在短时间内,也就是在一个会话内部重复购买相同的物品的可能性很低。并且该方法没有考虑到用户的长期兴趣,用户长期兴趣是偏向于静态的。如果用户在当前会话中的短期兴趣和用户的长期兴趣重复度很高,那么发生重复购买行为的概率较大。所以在模型中,判断推荐模式是重复模式还是探索模式时,应该同时考虑用户的长期兴趣和用户的短期兴趣。其中,重复模式是指推荐用户历史购买过的物品,探索模式是指推荐用户从未购买过的商品。为此,本发明采用以下技术方案:
一种考虑重复购买行为的会话推荐方法,包括以下步骤:
根据用户当前交互会话序列中的辅助行为(auxiliary behavior)序列,得到用户辅助行为(购买)表征。用户当前交互的会话可以表示为ST={x1,x2,…,xτ,…,xt},其中,xτ代表第τ个物品,T表示当前会话的时间段下标,且ST的向量表征为{x1,x2,…,xτ,…,xt},其中
Figure BDA0002916401080000021
d是物品向量表征的长度。ST表示当前会话中所有交互的物品序列,其中,购买行为序列为
Figure BDA0002916401080000022
Figure BDA0002916401080000023
AT的向量表征为
Figure BDA0002916401080000024
购买行为序列的表征对于重复模式下的物品推荐至关重要,因为用户在短时间内,也就是在一个会话内,进行重复消费的可能性较低。通常,在推荐系统中,把交互序列中的交互类型叫做目标类型(target type),把购买行为类型叫做辅助类型(auxiliary type)。采用平均池(mean-pooling)对购买行为序列进行表征,如下:
Figure BDA0002916401080000025
其中,AT是当前会话中的购买行为序列,
Figure BDA0002916401080000026
是购买行为序列AT中购买的物品,
Figure BDA0002916401080000027
是物品
Figure BDA0002916401080000028
的向量表示,|AT|表示序列AT的个数,pa是购买行为序列表征。
根据用户当前交互会话序列,得到用户短期兴趣表征ps。本方法采用门控循环单元网络(GRU)对用户当前交互序列进行表征:
zτ=σ(Wxz·xτ+Whz·hτ-1)
rτ=σ(Wxr·xτ+Whr·hτ-1)
Figure BDA0002916401080000029
Figure BDA00029164010800000210
其中,rτ是重置门(reset gate),zτ为更新门(update gate),这两个门控向量决定了哪些信息能作为门控循环单元的输出。
Figure BDA00029164010800000211
是当前记忆内容。xτ是当前层的节点输入。
Figure BDA00029164010800000212
Figure BDA00029164010800000213
Figure BDA00029164010800000214
分别是控制更新门zτ和重置门rτ的参数。
Figure BDA00029164010800000215
Figure BDA00029164010800000216
是控制前记忆内容
Figure BDA00029164010800000217
的参数。⊙是元素级别的矩阵相乘,σ是sigmoid函数。GRU的输入序列为ST={x1,x2,…,xτ,…,xt}。最后,当前会话序列表征为
Figure BDA00029164010800000223
用户短期兴趣(short-term interest)表征为前会话序列表征
Figure BDA00029164010800000218
更新用户长期兴趣(long-term interest)表征pl。用户当前会话所在时间为T,用户历史所有会话表征仍然采用门控循环单元网络(GRU)结构得到,此时用户历史会话表征序列为
Figure BDA00029164010800000219
用户长期兴趣的序列性不强,因此采用平均池(mean-pooling)获得用户较为稳定的长期兴趣表征pl
Figure BDA00029164010800000220
其中,ZT-1为时间T之前的用户历史会话表征列表,zτ为第τ个用户历史会话表征,|ZT-1|表示序列ZT-1的个数。pl是用户的长期兴趣表征。
根据用户的短期和长期兴趣表征,在重复推荐模式和探索推荐模式中选择。在本方法中,基于用户的当前会话ST和用户长期兴趣pl,用户下一个交互物品xt+1的概率P(xt+1|ST,pl)可以进一步分解为:
P(xt+1|ST,pl)=P(r|ST,pl)P(xt+1|r,ST,pl)+P(e|ST,pl)P(xt+1|e,ST,pl)
其中,r和e分别代表重复模式(repeat mode)和探索模式(explore mode)。P(r|ST,pl)和P(e|ST,pl)代表基于当前序列ST和用户长期兴趣pl,计算重复模式和探索模式的概率。P(xt+1|r,ST,pl)和P(xt+1|e,ST,pl)分别代表在重复模式和探索模式下,推荐物品xt+1的概率。该方法常见于自然语言处理(NLP)中的复制机制(copy mechanism)。判断推荐模式采用重复模式还是探索模式也就是计算概率P(r|ST,pl)和P(e|ST,pl):
Figure BDA00029164010800000221
其中,
Figure BDA00029164010800000222
是模型权重参数,ps和pl分别是用户动态的短期兴趣表征和静态的长期兴趣表征。
Figure BDA0002916401080000031
表示向量连接操作,softmax是softmax函数,在本方法是一个二分类方法。从公式中可以看出,选择重复模式(repeat mode)和探索模式(explore mode)是一个二分类问题,且是一个软分类(soft classification)问题。
在重复模式下,根据用户的短期、长期兴趣表征和辅助行为(购买)表征,在用户历史购买的物品序列中进行推荐。令用户历史消费序列为BT-1={x1,x2,…,xl},用户历史消费序列BT-1的向量表征为
Figure BDA0002916401080000032
其中上标a表示购买行为(auxiliary behavior)。那么,在重复模式下,用户历史购买的物品的推荐概率P(xτ|r,ST,pl)是:
Figure BDA0002916401080000033
Figure BDA0002916401080000034
Figure BDA0002916401080000035
其中,
Figure BDA0002916401080000036
是用户历史消费序列中第τ个物品xτ的向量表征,且Wrs,Wrl
Figure BDA0002916401080000037
Figure BDA0002916401080000038
是模型参数,共同决定了第τ个物品xτ的重要程度,V代表物品集合。ps、pl和pa分别为用户短期、长期兴趣表征以及当前会话中的辅助(消费)行为表征。从公式中可以看出,历史购买的物品和当前购买物品越相似,推荐该物品的概率越低。
在探索模式下,根据用户的短期兴趣表征和用户长期兴趣,对不在用户历史购买的物品序列中的物品进行推荐,物品推荐概率计算公式P(xτ|e,ST,pl)为:
Figure BDA0002916401080000039
Figure BDA00029164010800000310
其中,xτ为物品集合V-BT-1中的物品xτ的向量表征。ps和pl分别为用户短期和长期兴趣表征。对于xτ∈BT-1的物品,
Figure BDA00029164010800000311
也就是推荐概率P(xτ|e,ST,pl)=0。
构建损失函数,训练模型参数。采用对数似然损失函数:
Figure BDA00029164010800000312
其中,
Figure BDA00029164010800000313
是训练集中所有的会话序列。P(xτ|ST,pl)是上文中提到的概率,表示基于用户的当前会话ST和用户长期兴趣pl,预测用户下一个交互物品xτ的概率,xτ是会话序列中真实交互的物品。我们采用Adam优化器更新模型参数。
本发明的有益技术效果如下:
(1)本发明是一种同时对用户长期兴趣和短期兴趣进行建模的方法。同时考虑到用户短期兴趣的动态变化性和用户长期兴趣的稳定性。
(2)本发明考虑到用户的重复消费行为,并在判断推荐模式是重复模式还是探索模式时,同时考虑用户的长期兴趣和用户的短期兴趣,更符合用户决策规律。
(3)本发明考虑到用户的重复消费行为,并在重复模式下推荐历史购买过的物品时,对用户当前会话中的购买行为进行表征,因为在一个会话内重复购买相同物品的可能性很低。
附图说明
图1为本发明一种考虑重复购买行为的会话推荐方法的流程示意图;
图2为本发明一种考虑重复购买行为的会话推荐方法的模型框架图。
具体实施方式
为了进一步理解本发明,下面结合具体实施方式对本发明提供的一种考虑重复购买行为的会话推荐方法进行具体描述,但本发明并不限于此,该领域技术人员在本发明核心指导思想下做出的非本质改进和调整,仍然属于本发明的保护范围。
会话(session)指一段时间内的用户交互的物品序列,会话推荐任务是指基于当前会话中的物品序列,预测用户在当前会话中下一个感兴趣的物品。用户的当前会话可以表示为ST={x1,x2,…,xτ,…,xt},其中,xτ代表第τ个物品。预测用户在当前会话中下一个感兴趣的物品用数学语言可以表示为P(xt+1|ST),其中,P(xt+1|ST)表示基于用户的当前会话ST,用户下一个交互物品xt+1的概率。将用户行为序列划分成会话更符合用户行为规律,一般来讲,用户在一个会话中会有特定的目的。会话和会话之间会有一个较长时间间隔(timegap),如,淘宝将时间间隔设置为三十分钟。现在越来越多的方法,在基于会话推荐时,会同时将用户过去一段时间内的交互行为作为信息补充考虑进来,用于捕捉用户的长期兴趣,来提升推荐的准确度。此时,推荐物品的概率变成P(xt+1|ST,pl),其中pl表示用户的长期兴趣。
传统的推荐方法主要包括三种。一种是一般的推荐系统,从用户和物品之间的历史交互数据中挖掘出用户和物品的静态关联,包括,协同过滤和矩阵分解等方法。这类方法将用户-物品的交互关系输入到网络中,忽略了用户兴趣的动态变化。第二种是基于物品序列,推荐用户下一个交互的物品,叫做序列推荐方法。会话推荐方法就属于一种序列推荐方法,会话是指一段时间内的用户交互序列。最后一种方法是将前两种方法结合起来,同时对用户的静态的长期兴趣和动态的当前兴趣进行建模,然后再推荐用户下一个交互的物品。本方法在对用户兴趣建模时,同样是采取第三种方法。但是本方法最大的不同点是考虑到用户的重复消费行为。用户在在线平台上会有固定的习惯。比如,在电商平台上,用户经常会重复购买固定的商品;在音乐平台上,用户会经常重复听同一首歌曲。Ren等人提出了重复网络(RepeatNet)来解决重复消费推荐问题,但是该论文提出的解法和问题定义不符。重复网络在介绍(introduction)中提出用户存在重复消费行为,所以在推荐物品时应考虑到用户这一消费规律。但是在方法(method)中,推荐重复的物品是在当前会话中的物品序列中推荐,而用户在短时间内,也就是在一个会话内部重复购买相同的物品的可能性很低。并且该方法没有考虑到用户的长期兴趣,用户长期兴趣是偏向于静态的。如果用户在当前会话中的短期兴趣和用户的长期兴趣重复度很高,那么发生重复购买行为的概率较大。所以在模型中,判断推荐模式是重复模式还是探索模式,应该同时考虑用户的长期兴趣和用户的短期兴趣。其中,重复模式是指推荐用户历史购买过的物品,探索模式是指推荐用户从未购买过的商品。关于重复行为这个场景的论文或者方法不多,但是工业界已经有相关的应用。如,“淘宝”APP在订单页面会有“常购好货”的功能展示,从该用户历史购买商品中推荐用户当下还有可能购买的商品。
一种考虑重复购买行为的会话推荐方法的向前传播(forward propagation)部分主要由四个部分组成,如图2所示。第一部分是根据用户当前交互会话序列,得到用户短期、长期兴趣表征和辅助行为(购买)表征。第二部分是根据用户短期和长期兴趣表征,选择重复模式或探索模式。第三部分是在重复模式下,根据用户的短期、长期兴趣表征和辅助行为(购买)表征,在用户历史购买的物品序列中进行推荐。第四部分是在探索模式下,根据用户的短期和长期兴趣表征,对不在用户历史购买的物品序列中的物品进行推荐。
如图1所示,按照本发明的一个实施例,本方法包括如下步骤:
S100,根据用户当前交互会话序列中的辅助行为(auxiliary behavior)序列,得到用户辅助行为(购买)表征。用户当前交互的会话可以表示为ST={x1,x2,…,xτ,…,xt},其中,xτ代表第τ个物品,T表示当前会话的时间段下标,且ST的向量表征为{x1,x2,…,xτ,…,xt},其中
Figure BDA0002916401080000041
d是物品向量表征的长度。ST表示当前会话中所有交互的物品序列,其中,购买行为序列为
Figure BDA0002916401080000042
Figure BDA0002916401080000043
AT的向量表征为
Figure BDA0002916401080000044
购买行为序列的表征对于重复模式下的物品推荐至关重要,因为用户在短时间内,也就是在一个会话内,进行重复消费的可能性较低。通常,在推荐系统中,把交互序列中的交互类型叫做目标类型(target type),把购买行为类型叫做辅助类型(auxiliary type)。采用平均池(mean-pooling)对购买行为序列进行表征,如下:
Figure BDA0002916401080000045
其中,AT是当前会话中的购买行为序列,
Figure BDA0002916401080000046
是购买行为序列AT中购买的物品,
Figure BDA0002916401080000047
是物品
Figure BDA0002916401080000048
的向量表示,|AT|表示序列AT的个数,pa是购买行为序列表征。
S200,根据用户当前交互会话序列,得到用户短期兴趣表征。本方法采用门控循环单元网络(GRU)对用户当前交互序列进行表征:
zτ=σ(Wxz·xτ+Whz·hτ-1)
rτ=σ(Wxr·xτ+Whr·hτ-1)
Figure BDA0002916401080000051
Figure BDA0002916401080000052
其中,rτ是重置门(reset gate),zτ为更新门(update gate),这两个门控向量决定了哪些信息能作为门控循环单元的输出。
Figure BDA0002916401080000053
是当前记忆内容。xτ是当前层的节点输入。
Figure BDA0002916401080000054
Figure BDA0002916401080000055
Figure BDA0002916401080000056
分别是控制更新门zτ和重置门rτ的参数。
Figure BDA0002916401080000057
Figure BDA0002916401080000058
是控制前记忆内容
Figure BDA0002916401080000059
的参数。⊙是元素级别的矩阵相乘,σ是sigmoid函数。GRU的输入序列为ST={x1,x2,…,xτ,…,xt}。最后,当前会话序列表征为
Figure BDA00029164010800000510
用户短期兴趣(short-term interest)表征为前会话序列表征
Figure BDA00029164010800000511
S300,更新用户长期兴趣(long-term interest)表征pl。用户当前会话所在时间为T,用户历史所有会话表征仍然采用门控循环单元网络(GRU)结构得到,此时用户历史会话表征序列为
Figure BDA00029164010800000512
用户长期兴趣的序列性不强,因此采用平均池(mean-pooling)获得用户较为稳定的长期兴趣表征pl
Figure BDA00029164010800000513
其中,ZT-1为时间T之前的用户历史会话表征列表,zτ为第τ个用户历史会话表征,|ZT-1|表示序列ZT-1的个数。pl是用户的长期兴趣表征。
S400,根据用户的短期和长期兴趣表征,在重复推荐模式和探索推荐模式中选择。在本方法中,基于用户的当前会话ST和用户长期兴趣pl,用户下一个交互物品xt+1的概率P(xt+1|ST,pl)可以进一步分解为:P(xt+1|ST,pl)=P(r|ST,pl)P(xt+1|r,ST,pl)+P(e|ST,pl)P(xt+1|e,ST,pl)
其中,r和e分别代表重复模式(repeat mode)和探索模式(explore mode)。P(r|ST,pl)和P(e|ST,pl)代表基于当前序列ST和用户长期兴趣pl,计算重复模式和探索模式的概率。P(xt11|r,ST,pl)和P(xt+1|e,ST,pl)分别代表在重复模式和探索模式下,推荐物品xt11的概率。该方法常见于自然语言处理(NLP)中的复制机制(copy mechanism)。判断推荐模式采用重复模式还是探索模式也就是计算概率P(r|ST,pl)和P(e|ST,pl):
Figure BDA00029164010800000514
其中,
Figure BDA00029164010800000515
是模型权重参数,ps和pl分别是用户动态的短期兴趣表征和静态的长期兴趣表征。
Figure BDA00029164010800000516
表示向量连接操作,softmax是softmax函数,在本方法是一个二分类方法。从公式中可以看出,选择重复模式(repeat mode)和探索模式(explore mode)是一个二分类问题,且是一个软分类(soft classification)问题。
S500,在重复模式下,根据用户的短期、长期兴趣表征和辅助行为(购买)表征,在用户历史购买的物品序列中进行推荐。令用户历史消费序列为BT-1={x1,x2,…,xl},用户历史消费序列BT-1的向量表征为
Figure BDA00029164010800000517
其中上标a表示购买行为(auxiliarybehavior)。那么,在重复模式下,用户历史购买的物品的推荐概率P(xτ|r,ST,pl)是:
Figure BDA00029164010800000518
Figure BDA00029164010800000519
Figure BDA00029164010800000520
其中,
Figure BDA00029164010800000521
是用户历史消费序列中第τ个物品xτ的向量表征,且Wrs,Wrl
Figure BDA00029164010800000522
Figure BDA00029164010800000523
是模型参数,共同决定了第τ个物品xτ的重要程度,V代表物品集合。ps、pl和pa分别为用户短期、长期兴趣表征以及当前会话中的辅助(消费)行为表征。从公式中可以看出,历史购买的物品和当前购买物品越相似,推荐该物品的概率越低。
S600,在探索模式下,根据用户的短期兴趣表征和用户长期兴趣,对不在用户历史购买的物品序列中的物品进行推荐,物品推荐概率计算公式P(xτ|e,ST,pl)为:
Figure BDA0002916401080000061
Figure BDA0002916401080000062
其中,xτ为物品集合V-BT-1中的物品xτ的向量表征。ps和pl分别为用户短期和长期兴趣表征。对于xτ∈BT-1的物品,
Figure BDA0002916401080000063
也就是推荐概率P(xτ|e,ST,pl)=0。
S700,构建损失函数,训练模型参数。采用对数似然损失函数:
Figure BDA0002916401080000064
其中,
Figure BDA0002916401080000065
是训练集中所有的会话序列。P(xτ|ST,pl)是上文中提到的概率,表示基于用户的当前会话ST和用户长期兴趣pl,预测用户下一个交互物品xτ的概率,xτ是会话序列中真实交互的物品。我们采用Adam优化器更新模型参数。
上述对实施例的描述是为方便于本技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于上述实施例,本领域技术人员根据本发明的揭示,对于本发明做出的改进和修改都应该在本发明的保护范围之内。

Claims (3)

1.一种考虑重复购买行为的会话推荐方法,其特征在于:
根据用户当前交互会话序列中的辅助行为(auxiliary behavior)序列,得到用户辅助行为(购买)表征;用户当前交互的会话可以表示为ST={x1,x2,…,xτ,…,xt},其中,xτ代表第τ个物品,T表示当前会话的时间段下标,且ST的向量表征为{x1,x2,…,xτ,…,xt},其中
Figure FDA0002916401070000011
d是物品向量表征的长度;ST表示当前会话中所有交互的物品序列,其中,购买行为序列为
Figure FDA0002916401070000012
Figure FDA0002916401070000013
AT的向量表征为
Figure FDA0002916401070000014
通常,在推荐系统中,把交互序列中的交互类型叫做目标类型(target type),把购买行为类型叫做辅助类型(auxiliary type);采用平均池(mean-pooling)对购买行为序列进行表征,如下:是
Figure FDA0002916401070000015
其中,AT是当前会话中的购买行为序列,
Figure FDA0002916401070000016
是购买行为序列AT中购买的物品,
Figure FDA0002916401070000017
是物品
Figure FDA0002916401070000018
的向量表示,|AT|表示序列AT的个数,pa是购买行为序列表征;
根据用户当前交互会话序列,得到用户短期兴趣表征ps;本方法采用门控循环单元网络(GRU)对用户当前交互序列进行表征;GRU的输入序列为ST={x1,x2,…,xτ,…,xt};最后得到当前会话序列表征为
Figure FDA0002916401070000019
用户短期兴趣(short-terminterest)表征为前会话序列表征
Figure FDA00029164010700000110
更新用户长期兴趣(long-term interest)表征pl;用户当前会话所在时间为T,用户历史所有会话表征仍然采用门控循环单元网络(GRU)结构得到,此时用户历史会话表征序列为
Figure FDA00029164010700000111
用户长期兴趣的序列性不强,因此采用平均池(mean-pooling)获得用户较为稳定的长期兴趣表征pl
Figure FDA00029164010700000112
其中,ZT-1为时间T之前的用户历史会话表征列表,zτ为第τ个用户历史会话表征,|ZT-1|表示序列ZT-1的个数;pl是用户的长期兴趣表征;
根据用户的短期和长期兴趣表征,在重复推荐模式和探索推荐模式中选择;在本方法中,基于用户的当前会话ST和用户长期兴趣pl,用户下一个交互物品xt+1的概率P(xt+1|ST,pl)可以进一步分解为:P(xt+1|ST,pl)=P(r|ST,pl)P(xt+1|r,ST,pl)+P(e|ST,pl)P(xt+1|e,ST,pl)
其中,r和e分别代表重复模式(repeat mode)和探索模式(explore mode);P(r|ST,pl)和P(e|ST,pl)代表基于当前序列ST和用户长期兴趣pl,计算重复模式和探索模式的概率;P(xt+1|r,ST,pl)和P(xt+1|e,ST,pl)分别代表在重复模式和探索模式下,推荐物品xt+1的概率;判断推荐模式采用重复模式还是探索模式也就是计算概率P(r|ST,pl)和P(e|ST,pl);
在重复模式下,根据用户的短期、长期兴趣表征和辅助行为(购买)表征,在用户历史购买的物品序列中进行推荐;令用户历史消费序列为BT-1={x1,x2,…,xl},用户历史消费序列BT-1的向量表征为
Figure FDA00029164010700000113
其中上标a表示购买行为(auxiliary behavior);那么,在重复模式下,用户历史购买的物品的推荐概率P(xτ|r,ST,pl)是:
Figure FDA00029164010700000114
Figure FDA00029164010700000115
Figure FDA00029164010700000116
其中,
Figure FDA00029164010700000117
是用户历史消费序列中第τ个物品xτ的向量表征,且Wrs,Wrl
Figure FDA00029164010700000118
Figure FDA00029164010700000119
是模型参数,共同决定了第τ个物品xτ的重要程度,V代表物品集合;ps、pl和pa分别为用户短期、长期兴趣表征以及当前会话中的辅助(消费)行为表征;从公式中可以看出,历史购买的物品和当前购买物品越相似,推荐该物品的概率越低;
在探索模式下,根据用户的短期兴趣表征和用户长期兴趣,对不在用户历史购买的物品序列中的物品进行推荐,物品推荐概率计算公式P(xτ|e,ST,pl)为:
Figure FDA00029164010700000120
Figure FDA0002916401070000021
其中,xτ为物品集合V-BT-1中的物品xτ的向量表征;ps和pl分别为用户短期和长期兴趣表征;对于xτ∈BT-1的物品,
Figure FDA0002916401070000022
也就是推荐概率P(xτ|e,ST,pl)=0;
构建损失函数,训练模型参数;采用对数似然损失函数:
Figure FDA0002916401070000023
其中,
Figure FDA0002916401070000024
是训练集中所有的会话序列;P(xτ|ST,pl)是上文中提到的概率,表示基于用户的当前会话ST和用户长期兴趣pl,预测用户下一个交互物品xτ的概率,xτ是会话序列中真实交互的物品;我们采用Adam优化器更新模型参数。
2.根据权利要求1所述的一种考虑重复购买行为的会话推荐方法,其中,所述对用户当前交互序列进行表征的门控循环单元网络(GRU)具体公式为:
zτ=σ(Wxz·xτ+Whz·hτ-1)
rτ=σ(Wxr·xτ+Whr·hτ-1)
Figure FDA0002916401070000025
Figure FDA0002916401070000026
其中,rτ是重置门(reset gate),zτ为更新门(update gate),这两个门控向量决定了哪些信息能作为门控循环单元的输出;
Figure FDA0002916401070000027
是当前记忆内容;xτ是当前层的节点输入;
Figure FDA0002916401070000028
Figure FDA0002916401070000029
Figure FDA00029164010700000210
分别是控制更新门zτ和重置门rτ的参数;
Figure FDA00029164010700000211
Figure FDA00029164010700000212
是控制前记忆内容
Figure FDA00029164010700000213
的参数;⊙是元素级别的矩阵相乘,σ是sigmoid函数;当前会话序列表征为
Figure FDA00029164010700000217
3.根据权利要求1所述的一种考虑重复购买行为的会话推荐方法,其中,所述用于判断推荐模式采用重复模式还是探索模式的概率P(r|ST,pl)和P(e|ST,pl)具体为:
Figure FDA00029164010700000214
其中,
Figure FDA00029164010700000215
是模型权重参数,ps和pl分别是用户动态的短期兴趣表征和静态的长期兴趣表征;
Figure FDA00029164010700000216
表示向量连接操作,softmax是softmax函数,在本方法是一个二分类方法;从公式中可以看出,选择重复模式(repeat mode)和探索模式(explore mode)是一个二分类问题,且是一个软分类(soft classification)问题。
CN202110102234.7A 2021-01-26 2021-01-26 一种考虑重复购买行为的会话推荐方法 Active CN112819575B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110102234.7A CN112819575B (zh) 2021-01-26 2021-01-26 一种考虑重复购买行为的会话推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110102234.7A CN112819575B (zh) 2021-01-26 2021-01-26 一种考虑重复购买行为的会话推荐方法

Publications (2)

Publication Number Publication Date
CN112819575A true CN112819575A (zh) 2021-05-18
CN112819575B CN112819575B (zh) 2022-02-18

Family

ID=75859849

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110102234.7A Active CN112819575B (zh) 2021-01-26 2021-01-26 一种考虑重复购买行为的会话推荐方法

Country Status (1)

Country Link
CN (1) CN112819575B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113704627A (zh) * 2021-09-06 2021-11-26 中国计量大学 一种基于时间间隔图的会话推荐方法
CN113722599A (zh) * 2021-09-06 2021-11-30 中国计量大学 一种基于用户长期兴趣和短期兴趣建模的会话推荐方法
CN117828193A (zh) * 2024-03-04 2024-04-05 山东省计算中心(国家超级计算济南中心) 基于多兴趣半联合学习兴趣推荐方法、系统、设备及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110956514A (zh) * 2018-09-26 2020-04-03 北京京东尚科信息技术有限公司 一种生成订单信息的方法和装置
CN111242729A (zh) * 2020-01-07 2020-06-05 西北工业大学 一种基于长短期兴趣的序列化推荐方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110956514A (zh) * 2018-09-26 2020-04-03 北京京东尚科信息技术有限公司 一种生成订单信息的方法和装置
CN111242729A (zh) * 2020-01-07 2020-06-05 西北工业大学 一种基于长短期兴趣的序列化推荐方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
邓金: "基于用户网购行为的个性化推荐算法研究", 《中国优秀博硕士学位论文全文数据库(硕士)》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113704627A (zh) * 2021-09-06 2021-11-26 中国计量大学 一种基于时间间隔图的会话推荐方法
CN113722599A (zh) * 2021-09-06 2021-11-30 中国计量大学 一种基于用户长期兴趣和短期兴趣建模的会话推荐方法
CN113704627B (zh) * 2021-09-06 2022-05-17 中国计量大学 一种基于时间间隔图的会话推荐方法
CN117828193A (zh) * 2024-03-04 2024-04-05 山东省计算中心(国家超级计算济南中心) 基于多兴趣半联合学习兴趣推荐方法、系统、设备及介质
CN117828193B (zh) * 2024-03-04 2024-05-17 山东省计算中心(国家超级计算济南中心) 基于多兴趣半联合学习兴趣推荐方法、系统、设备及介质

Also Published As

Publication number Publication date
CN112819575B (zh) 2022-02-18

Similar Documents

Publication Publication Date Title
CN108648049B (zh) 一种基于用户行为区别建模的序列推荐方法
Zhao et al. Dear: Deep reinforcement learning for online advertising impression in recommender systems
CN112819575B (zh) 一种考虑重复购买行为的会话推荐方法
CN108460619B (zh) 一种提供融合显隐式反馈的协同推荐模型的方法
CN108431833A (zh) 端到端深度协作过滤
CN109087178A (zh) 商品推荐方法和装置
CN111797321A (zh) 一种面向不同场景的个性化知识推荐方法及系统
CN112733018A (zh) 一种基于图神经网络gnn和多任务学习的会话推荐方法
Yu et al. Multi-linear interactive matrix factorization
CN114595383A (zh) 一种基于会话序列的海洋环境数据推荐方法及系统
CN115147192A (zh) 基于双视角纠偏的推荐方法及推荐系统
CN113610610B (zh) 基于图神经网络和评论相似度的会话推荐方法和系统
CN115439187A (zh) 一种基于用户短期偏好的服务推荐方法
CN113704438B (zh) 一种基于分层注意力机制的异构图的会话推荐方法
CN114282077A (zh) 一种基于会话数据的会话推荐方法及系统
CN114529077A (zh) 一种基于会话内异构行为的点击率预测方法
CN112883268B (zh) 一种考虑用户多兴趣以及社交影响的会话推荐方法
CN112559904B (zh) 一种基于门机制和多模态图网络的会话社交推荐方法
CN114169968A (zh) 一种融合用户兴趣状态的多粒度会话推荐方法
CN112905886B (zh) 一种基于多兴趣重复网络的会话推荐方法
Sharma et al. Suggestive approaches to create a recommender system for GitHub
CN113704439B (zh) 一种基于多来源信息异构图的会话推荐方法
CN115600009A (zh) 一种考虑用户未来偏好的基于深度强化学习的推荐方法
CN113722599B (zh) 一种基于用户长期兴趣和短期兴趣建模的会话推荐方法
CN112559905B (zh) 一种基于双模式注意力机制和社交相似度的会话推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230920

Address after: Room 407-10, floor 4, building 2, Haichuang science and technology center, Cangqian street, Yuhang District, Hangzhou City, Zhejiang Province, 311100

Patentee after: Zhejiang Zhiduo Network Technology Co.,Ltd.

Address before: 310018, No. 258, source street, Xiasha Higher Education Park, Hangzhou, Zhejiang

Patentee before: China Jiliang University