CN112819575B - 一种考虑重复购买行为的会话推荐方法 - Google Patents

一种考虑重复购买行为的会话推荐方法 Download PDF

Info

Publication number
CN112819575B
CN112819575B CN202110102234.7A CN202110102234A CN112819575B CN 112819575 B CN112819575 B CN 112819575B CN 202110102234 A CN202110102234 A CN 202110102234A CN 112819575 B CN112819575 B CN 112819575B
Authority
CN
China
Prior art keywords
user
sequence
term
long
mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110102234.7A
Other languages
English (en)
Other versions
CN112819575A (zh
Inventor
顾盼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Zhiduo Network Technology Co ltd
Original Assignee
China Jiliang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Jiliang University filed Critical China Jiliang University
Priority to CN202110102234.7A priority Critical patent/CN112819575B/zh
Publication of CN112819575A publication Critical patent/CN112819575A/zh
Application granted granted Critical
Publication of CN112819575B publication Critical patent/CN112819575B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Human Computer Interaction (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Fuzzy Systems (AREA)

Abstract

本发明公开了一种考虑重复购买行为的会话推荐方法。该方法建立一个模型对当前会话和用户长期兴趣进行建模,并预测用户点下一个点击的物品。用户在在线平台上往往会有固定的行为习惯,因此本方法提出一种考虑重复购买行为的推荐方法,主要由四个部分组成:第一部分是根据用户当前交互会话序列,得到用户短期、长期兴趣表征和辅助行为(购买)表征。第二部分是根据用户短期和长期兴趣表征,选择重复模式或探索模式。第三部分是在重复模式下,根据用户的短期、长期兴趣表征和辅助行为(购买)表征,在用户历史购买的物品序列中进行推荐。第四部分是在探索模式下,根据用户的短期和长期兴趣表征,对不在用户历史购买的物品序列中的物品进行推荐。

Description

一种考虑重复购买行为的会话推荐方法
技术领域
本发明属于互联网服务技术领域,尤其是涉及一种考虑重复购买行为的会话推荐方法。
背景技术
随着在线服务的发展和流行,在线平台记录着大量的用户行为数据。从海量数据中找出用户最感兴趣的物品并推荐给用户,可以极大地提升用户的满意度和公司的收益。此时,推荐系统显得非常重要。推荐系统可以从海量物品中挖掘出用户最喜欢的物品。
传统的推荐方法主要包括三种。一种是一般的推荐系统,从用户和物品之间的历史交互数据中挖掘出用户和物品的静态关联,包括,协同过滤和矩阵分解等方法。这类方法将用户-物品的交互关系输入到网络中,忽略了用户兴趣的动态变化。第二种是基于物品序列,推荐用户下一个交互的物品,叫做序列推荐方法。会话推荐方法就属于一种序列推荐方法,会话是指一段时间内的用户交互序列。最后一种方法是将前两种方法结合起来,同时对用户的静态的长期兴趣和动态的当前兴趣进行建模,然后再推荐用户下一个交互的物品。本方法在对用户兴趣建模时,同样是采取第三种方法。但是本方法最大的不同点是考虑到用户的重复消费行为。用户在在线平台上会有固定的行为习惯。比如,在电商平台上,用户经常会重复购买固定的商品;在音乐平台上,用户会经常重复听同一首歌曲。Ren等人在论文中提出了重复网络(RepeatNet)来解决重复消费推荐问题,但是该论文提出的解法和问题定义不符。重复网络在介绍(introduction)中提出用户存在重复消费行为,所以在推荐物品时应考虑到用户这一消费规律。但是在方法(method)中,推荐重复的物品是在当前会话中的物品序列中推荐,而用户在短时间内,也就是在一个会话内部重复购买相同的物品的可能性很低。并且该方法没有考虑到用户的长期兴趣,用户长期兴趣是偏向于静态的。如果用户在当前会话中的短期兴趣和用户的长期兴趣重复度很高,那么发生重复购买行为的概率较大。所以在模型中,判断推荐模式是重复模式还是探索模式时,应该同时考虑用户的长期兴趣和用户的短期兴趣。其中,重复模式是指推荐用户历史购买过的物品,探索模式是指推荐用户从未购买过的商品。关于重复行为这个场景的论文或者方法不多,但是工业界已经有相关的应用。如,“淘宝”APP在订单页面会有“常购好货”的功能展示,从该用户历史购买商品中推荐用户当下还有可能购买的商品。
发明内容
本方法是一种基于会话的物品点击率预测方法。会话(session)指一段时间内的用户交互的物品序列,会话推荐任务是指基于当前会话中的物品序列,预测用户在当前会话中下一个感兴趣的物品。用户的当前会话可以表示为ST={x1,x2,…,xτ,…,xt},其中,xτ代表第τ个物品。预测用户在当前会话中下一个感兴趣的物品用数学语言可以表示为P(xt+1|ST),其中,P(xt+1|ST)表示基于用户的当前会话ST,用户下一个交互物品xt+1的概率。将用户行为序列划分成会话更符合用户行为规律,一般来讲,用户在一个会话中会有特定的目的。会话和会话之间会有一个较长时间间隔(time gap),如,淘宝将时间间隔设置为三十分钟。现在越来越多的方法,在基于会话推荐时,会同时将用户过去一段时间内的交互行为作为信息补充考虑进来,用于捕捉用户的长期兴趣,来提升推荐的准确度。此时,推荐物品的概率变成P(xt+1|ST,pl),其中pl表示用户的长期兴趣。
对于用户的重复消费行为的研究工作较少。而用户在在线平台上会有固定的行为习惯。Ren等人提出了重复网络(RepeatNet)来解决重复消费推荐问题,但是该论文提出的解法和问题定义不符。重复网络在介绍(introduction)中提出用户存在重复消费行为,所以在推荐物品时应考虑到用户这一消费规律。但是在方法(method)中,推荐重复的物品是在当前会话中的物品序列中推荐,而用户在短时间内,也就是在一个会话内部重复购买相同的物品的可能性很低。并且该方法没有考虑到用户的长期兴趣,用户长期兴趣是偏向于静态的。如果用户在当前会话中的短期兴趣和用户的长期兴趣重复度很高,那么发生重复购买行为的概率较大。所以在模型中,判断推荐模式是重复模式还是探索模式时,应该同时考虑用户的长期兴趣和用户的短期兴趣。其中,重复模式是指推荐用户历史购买过的物品,探索模式是指推荐用户从未购买过的商品。为此,本发明采用以下技术方案:
一种考虑重复购买行为的会话推荐方法,包括以下步骤:
根据用户当前交互会话序列中的辅助行为(auxiliary behavior)序列,得到用户辅助行为(购买)表征。用户当前交互的会话可以表示为ST={x1,x2,…,xτ,…,xt},其中,xτ代表第τ个物品,T表示当前会话的时间段下标,且ST的向量表征为{x1,x2,…,xτ,…,xt},其中
Figure BDA0002916401080000021
d是物品向量表征的长度。ST表示当前会话中所有交互的物品序列,其中,购买行为序列为
Figure BDA0002916401080000022
Figure BDA0002916401080000023
AT的向量表征为
Figure BDA0002916401080000024
购买行为序列的表征对于重复模式下的物品推荐至关重要,因为用户在短时间内,也就是在一个会话内,进行重复消费的可能性较低。通常,在推荐系统中,把交互序列中的交互类型叫做目标类型(target type),把购买行为类型叫做辅助类型(auxiliary type)。采用平均池(mean-pooling)对购买行为序列进行表征,如下:
Figure BDA0002916401080000025
其中,AT是当前会话中的购买行为序列,
Figure BDA0002916401080000026
是购买行为序列AT中购买的物品,
Figure BDA0002916401080000027
是物品
Figure BDA0002916401080000028
的向量表示,|AT|表示序列AT的个数,pa是购买行为序列表征。
根据用户当前交互会话序列,得到用户短期兴趣表征ps。本方法采用门控循环单元网络(GRU)对用户当前交互序列进行表征:
zτ=σ(Wxz·xτ+Whz·hτ-1)
rτ=σ(Wxr·xτ+Whr·hτ-1)
Figure BDA0002916401080000029
Figure BDA00029164010800000210
其中,rτ是重置门(reset gate),zτ为更新门(update gate),这两个门控向量决定了哪些信息能作为门控循环单元的输出。
Figure BDA00029164010800000211
是当前记忆内容。xτ是当前层的节点输入。
Figure BDA00029164010800000212
Figure BDA00029164010800000213
Figure BDA00029164010800000214
分别是控制更新门zτ和重置门rτ的参数。
Figure BDA00029164010800000215
Figure BDA00029164010800000216
是控制前记忆内容
Figure BDA00029164010800000217
的参数。⊙是元素级别的矩阵相乘,σ是sigmoid函数。GRU的输入序列为ST={x1,x2,…,xτ,…,xt}。最后,当前会话序列表征为
Figure BDA00029164010800000223
用户短期兴趣(short-term interest)表征为前会话序列表征
Figure BDA00029164010800000218
更新用户长期兴趣(long-term interest)表征pl。用户当前会话所在时间为T,用户历史所有会话表征仍然采用门控循环单元网络(GRU)结构得到,此时用户历史会话表征序列为
Figure BDA00029164010800000219
用户长期兴趣的序列性不强,因此采用平均池(mean-pooling)获得用户较为稳定的长期兴趣表征pl
Figure BDA00029164010800000220
其中,ZT-1为时间T之前的用户历史会话表征列表,zτ为第τ个用户历史会话表征,|ZT-1|表示序列ZT-1的个数。pl是用户的长期兴趣表征。
根据用户的短期和长期兴趣表征,在重复推荐模式和探索推荐模式中选择。在本方法中,基于用户的当前会话ST和用户长期兴趣pl,用户下一个交互物品xt+1的概率P(xt+1|ST,pl)可以进一步分解为:
P(xt+1|ST,pl)=P(r|ST,pl)P(xt+1|r,ST,pl)+P(e|ST,pl)P(xt+1|e,ST,pl)
其中,r和e分别代表重复模式(repeat mode)和探索模式(explore mode)。P(r|ST,pl)和P(e|ST,pl)代表基于当前序列ST和用户长期兴趣pl,计算重复模式和探索模式的概率。P(xt+1|r,ST,pl)和P(xt+1|e,ST,pl)分别代表在重复模式和探索模式下,推荐物品xt+1的概率。该方法常见于自然语言处理(NLP)中的复制机制(copy mechanism)。判断推荐模式采用重复模式还是探索模式也就是计算概率P(r|ST,pl)和P(e|ST,pl):
Figure BDA00029164010800000221
其中,
Figure BDA00029164010800000222
是模型权重参数,ps和pl分别是用户动态的短期兴趣表征和静态的长期兴趣表征。
Figure BDA0002916401080000031
表示向量连接操作,softmax是softmax函数,在本方法是一个二分类方法。从公式中可以看出,选择重复模式(repeat mode)和探索模式(explore mode)是一个二分类问题,且是一个软分类(soft classification)问题。
在重复模式下,根据用户的短期、长期兴趣表征和辅助行为(购买)表征,在用户历史购买的物品序列中进行推荐。令用户历史消费序列为BT-1={x1,x2,…,xl},用户历史消费序列BT-1的向量表征为
Figure BDA0002916401080000032
其中上标a表示购买行为(auxiliary behavior)。那么,在重复模式下,用户历史购买的物品的推荐概率P(xτ|r,ST,pl)是:
Figure BDA0002916401080000033
Figure BDA0002916401080000034
Figure BDA0002916401080000035
其中,
Figure BDA0002916401080000036
是用户历史消费序列中第τ个物品xτ的向量表征,且Wrs,Wrl
Figure BDA0002916401080000037
Figure BDA0002916401080000038
是模型参数,共同决定了第τ个物品xτ的重要程度,V代表物品集合。ps、pl和pa分别为用户短期、长期兴趣表征以及当前会话中的辅助(消费)行为表征。从公式中可以看出,历史购买的物品和当前购买物品越相似,推荐该物品的概率越低。
在探索模式下,根据用户的短期兴趣表征和用户长期兴趣,对不在用户历史购买的物品序列中的物品进行推荐,物品推荐概率计算公式P(xτ|e,ST,pl)为:
Figure BDA0002916401080000039
Figure BDA00029164010800000310
其中,xτ为物品集合V-BT-1中的物品xτ的向量表征。ps和pl分别为用户短期和长期兴趣表征。对于xτ∈BT-1的物品,
Figure BDA00029164010800000311
也就是推荐概率P(xτ|e,ST,pl)=0。
构建损失函数,训练模型参数。采用对数似然损失函数:
Figure BDA00029164010800000312
其中,
Figure BDA00029164010800000313
是训练集中所有的会话序列。P(xτ|ST,pl)是上文中提到的概率,表示基于用户的当前会话ST和用户长期兴趣pl,预测用户下一个交互物品xτ的概率,xτ是会话序列中真实交互的物品。我们采用Adam优化器更新模型参数。
本发明的有益技术效果如下:
(1)本发明是一种同时对用户长期兴趣和短期兴趣进行建模的方法。同时考虑到用户短期兴趣的动态变化性和用户长期兴趣的稳定性。
(2)本发明考虑到用户的重复消费行为,并在判断推荐模式是重复模式还是探索模式时,同时考虑用户的长期兴趣和用户的短期兴趣,更符合用户决策规律。
(3)本发明考虑到用户的重复消费行为,并在重复模式下推荐历史购买过的物品时,对用户当前会话中的购买行为进行表征,因为在一个会话内重复购买相同物品的可能性很低。
附图说明
图1为本发明一种考虑重复购买行为的会话推荐方法的流程示意图;
图2为本发明一种考虑重复购买行为的会话推荐方法的模型框架图。
具体实施方式
为了进一步理解本发明,下面结合具体实施方式对本发明提供的一种考虑重复购买行为的会话推荐方法进行具体描述,但本发明并不限于此,该领域技术人员在本发明核心指导思想下做出的非本质改进和调整,仍然属于本发明的保护范围。
会话(session)指一段时间内的用户交互的物品序列,会话推荐任务是指基于当前会话中的物品序列,预测用户在当前会话中下一个感兴趣的物品。用户的当前会话可以表示为ST={x1,x2,…,xτ,…,xt},其中,xτ代表第τ个物品。预测用户在当前会话中下一个感兴趣的物品用数学语言可以表示为P(xt+1|ST),其中,P(xt+1|ST)表示基于用户的当前会话ST,用户下一个交互物品xt+1的概率。将用户行为序列划分成会话更符合用户行为规律,一般来讲,用户在一个会话中会有特定的目的。会话和会话之间会有一个较长时间间隔(timegap),如,淘宝将时间间隔设置为三十分钟。现在越来越多的方法,在基于会话推荐时,会同时将用户过去一段时间内的交互行为作为信息补充考虑进来,用于捕捉用户的长期兴趣,来提升推荐的准确度。此时,推荐物品的概率变成P(xt+1|ST,pl),其中pl表示用户的长期兴趣。
传统的推荐方法主要包括三种。一种是一般的推荐系统,从用户和物品之间的历史交互数据中挖掘出用户和物品的静态关联,包括,协同过滤和矩阵分解等方法。这类方法将用户-物品的交互关系输入到网络中,忽略了用户兴趣的动态变化。第二种是基于物品序列,推荐用户下一个交互的物品,叫做序列推荐方法。会话推荐方法就属于一种序列推荐方法,会话是指一段时间内的用户交互序列。最后一种方法是将前两种方法结合起来,同时对用户的静态的长期兴趣和动态的当前兴趣进行建模,然后再推荐用户下一个交互的物品。本方法在对用户兴趣建模时,同样是采取第三种方法。但是本方法最大的不同点是考虑到用户的重复消费行为。用户在在线平台上会有固定的习惯。比如,在电商平台上,用户经常会重复购买固定的商品;在音乐平台上,用户会经常重复听同一首歌曲。Ren等人提出了重复网络(RepeatNet)来解决重复消费推荐问题,但是该论文提出的解法和问题定义不符。重复网络在介绍(introduction)中提出用户存在重复消费行为,所以在推荐物品时应考虑到用户这一消费规律。但是在方法(method)中,推荐重复的物品是在当前会话中的物品序列中推荐,而用户在短时间内,也就是在一个会话内部重复购买相同的物品的可能性很低。并且该方法没有考虑到用户的长期兴趣,用户长期兴趣是偏向于静态的。如果用户在当前会话中的短期兴趣和用户的长期兴趣重复度很高,那么发生重复购买行为的概率较大。所以在模型中,判断推荐模式是重复模式还是探索模式,应该同时考虑用户的长期兴趣和用户的短期兴趣。其中,重复模式是指推荐用户历史购买过的物品,探索模式是指推荐用户从未购买过的商品。关于重复行为这个场景的论文或者方法不多,但是工业界已经有相关的应用。如,“淘宝”APP在订单页面会有“常购好货”的功能展示,从该用户历史购买商品中推荐用户当下还有可能购买的商品。
一种考虑重复购买行为的会话推荐方法的向前传播(forward propagation)部分主要由四个部分组成,如图2所示。第一部分是根据用户当前交互会话序列,得到用户短期、长期兴趣表征和辅助行为(购买)表征。第二部分是根据用户短期和长期兴趣表征,选择重复模式或探索模式。第三部分是在重复模式下,根据用户的短期、长期兴趣表征和辅助行为(购买)表征,在用户历史购买的物品序列中进行推荐。第四部分是在探索模式下,根据用户的短期和长期兴趣表征,对不在用户历史购买的物品序列中的物品进行推荐。
如图1所示,按照本发明的一个实施例,本方法包括如下步骤:
S100,根据用户当前交互会话序列中的辅助行为(auxiliary behavior)序列,得到用户辅助行为(购买)表征。用户当前交互的会话可以表示为ST={x1,x2,…,xτ,…,xt},其中,xτ代表第τ个物品,T表示当前会话的时间段下标,且ST的向量表征为{x1,x2,…,xτ,…,xt},其中
Figure BDA0002916401080000041
d是物品向量表征的长度。ST表示当前会话中所有交互的物品序列,其中,购买行为序列为
Figure BDA0002916401080000042
Figure BDA0002916401080000043
AT的向量表征为
Figure BDA0002916401080000044
购买行为序列的表征对于重复模式下的物品推荐至关重要,因为用户在短时间内,也就是在一个会话内,进行重复消费的可能性较低。通常,在推荐系统中,把交互序列中的交互类型叫做目标类型(target type),把购买行为类型叫做辅助类型(auxiliary type)。采用平均池(mean-pooling)对购买行为序列进行表征,如下:
Figure BDA0002916401080000045
其中,AT是当前会话中的购买行为序列,
Figure BDA0002916401080000046
是购买行为序列AT中购买的物品,
Figure BDA0002916401080000047
是物品
Figure BDA0002916401080000048
的向量表示,|AT|表示序列AT的个数,pa是购买行为序列表征。
S200,根据用户当前交互会话序列,得到用户短期兴趣表征。本方法采用门控循环单元网络(GRU)对用户当前交互序列进行表征:
zτ=σ(Wxz·xτ+Whz·hτ-1)
rτ=σ(Wxr·xτ+Whr·hτ-1)
Figure BDA0002916401080000051
Figure BDA0002916401080000052
其中,rτ是重置门(reset gate),zτ为更新门(update gate),这两个门控向量决定了哪些信息能作为门控循环单元的输出。
Figure BDA0002916401080000053
是当前记忆内容。xτ是当前层的节点输入。
Figure BDA0002916401080000054
Figure BDA0002916401080000055
Figure BDA0002916401080000056
分别是控制更新门zτ和重置门rτ的参数。
Figure BDA0002916401080000057
Figure BDA0002916401080000058
是控制前记忆内容
Figure BDA0002916401080000059
的参数。⊙是元素级别的矩阵相乘,σ是sigmoid函数。GRU的输入序列为ST={x1,x2,…,xτ,…,xt}。最后,当前会话序列表征为
Figure BDA00029164010800000510
用户短期兴趣(short-term interest)表征为前会话序列表征
Figure BDA00029164010800000511
S300,更新用户长期兴趣(long-term interest)表征pl。用户当前会话所在时间为T,用户历史所有会话表征仍然采用门控循环单元网络(GRU)结构得到,此时用户历史会话表征序列为
Figure BDA00029164010800000512
用户长期兴趣的序列性不强,因此采用平均池(mean-pooling)获得用户较为稳定的长期兴趣表征pl
Figure BDA00029164010800000513
其中,ZT-1为时间T之前的用户历史会话表征列表,zτ为第τ个用户历史会话表征,|ZT-1|表示序列ZT-1的个数。pl是用户的长期兴趣表征。
S400,根据用户的短期和长期兴趣表征,在重复推荐模式和探索推荐模式中选择。在本方法中,基于用户的当前会话ST和用户长期兴趣pl,用户下一个交互物品xt+1的概率P(xt+1|ST,pl)可以进一步分解为:P(xt+1|ST,pl)=P(r|ST,pl)P(xt+1|r,ST,pl)+P(e|ST,pl)P(xt+1|e,ST,pl)
其中,r和e分别代表重复模式(repeat mode)和探索模式(explore mode)。P(r|ST,pl)和P(e|ST,pl)代表基于当前序列ST和用户长期兴趣pl,计算重复模式和探索模式的概率。P(xt11|r,ST,pl)和P(xt+1|e,ST,pl)分别代表在重复模式和探索模式下,推荐物品xt11的概率。该方法常见于自然语言处理(NLP)中的复制机制(copy mechanism)。判断推荐模式采用重复模式还是探索模式也就是计算概率P(r|ST,pl)和P(e|ST,pl):
Figure BDA00029164010800000514
其中,
Figure BDA00029164010800000515
是模型权重参数,ps和pl分别是用户动态的短期兴趣表征和静态的长期兴趣表征。
Figure BDA00029164010800000516
表示向量连接操作,softmax是softmax函数,在本方法是一个二分类方法。从公式中可以看出,选择重复模式(repeat mode)和探索模式(explore mode)是一个二分类问题,且是一个软分类(soft classification)问题。
S500,在重复模式下,根据用户的短期、长期兴趣表征和辅助行为(购买)表征,在用户历史购买的物品序列中进行推荐。令用户历史消费序列为BT-1={x1,x2,…,xl},用户历史消费序列BT-1的向量表征为
Figure BDA00029164010800000517
其中上标a表示购买行为(auxiliarybehavior)。那么,在重复模式下,用户历史购买的物品的推荐概率P(xτ|r,ST,pl)是:
Figure BDA00029164010800000518
Figure BDA00029164010800000519
Figure BDA00029164010800000520
其中,
Figure BDA00029164010800000521
是用户历史消费序列中第τ个物品xτ的向量表征,且Wrs,Wrl
Figure BDA00029164010800000522
Figure BDA00029164010800000523
是模型参数,共同决定了第τ个物品xτ的重要程度,V代表物品集合。ps、pl和pa分别为用户短期、长期兴趣表征以及当前会话中的辅助(消费)行为表征。从公式中可以看出,历史购买的物品和当前购买物品越相似,推荐该物品的概率越低。
S600,在探索模式下,根据用户的短期兴趣表征和用户长期兴趣,对不在用户历史购买的物品序列中的物品进行推荐,物品推荐概率计算公式P(xτ|e,ST,pl)为:
Figure BDA0002916401080000061
Figure BDA0002916401080000062
其中,xτ为物品集合V-BT-1中的物品xτ的向量表征。ps和pl分别为用户短期和长期兴趣表征。对于xτ∈BT-1的物品,
Figure BDA0002916401080000063
也就是推荐概率P(xτ|e,ST,pl)=0。
S700,构建损失函数,训练模型参数。采用对数似然损失函数:
Figure BDA0002916401080000064
其中,
Figure BDA0002916401080000065
是训练集中所有的会话序列。P(xτ|ST,pl)是上文中提到的概率,表示基于用户的当前会话ST和用户长期兴趣pl,预测用户下一个交互物品xτ的概率,xτ是会话序列中真实交互的物品。我们采用Adam优化器更新模型参数。
上述对实施例的描述是为方便于本技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于上述实施例,本领域技术人员根据本发明的揭示,对于本发明做出的改进和修改都应该在本发明的保护范围之内。

Claims (3)

1.一种考虑重复购买行为的会话推荐方法,其特征在于:
根据用户当前会话中的购买行为序列,得到用户购买行为表征;用户当前会话为ST={v1,v2,…,vτ,…,vt},其中,vτ代表第τ个物品,T表示当前会话的时间段下标,且ST的向量表征为{x1,x2,…,xτ,…,xt},其中
Figure FDA0003462232600000011
用户当前会话ST中包含了用户购买行为序列
Figure FDA0003462232600000012
Figure FDA0003462232600000013
|AT|表示序列AT的个数,AT的向量表征为
Figure FDA0003462232600000014
采用平均池对购买行为序列进行表征,如下:
Figure FDA0003462232600000015
其中,AT是当前会话中的购买行为序列,
Figure FDA0003462232600000016
是购买行为序列AT中购买的物品,
Figure FDA0003462232600000017
是物品
Figure FDA0003462232600000018
的向量表示,|AT|表示序列AT的个数,pa是购买行为序列表征;
根据用户当前会话,得到用户短期兴趣表征ps;本方法采用门控循环单元网络GRU对用户当前会话进行表征;GRU的输入序列为当前会话ST={v1,v2,…,vτ,…,vt};最后得到当前会话表征为
Figure FDA0003462232600000019
用户短期兴趣表征为当前会话表征
Figure FDA00034622326000000110
更新用户长期兴趣表征pl;用户当前会话所在时间为T,用户历史所有会话表征仍然采用门控循环单元网络GRU结构得到,此时用户历史会话表征序列为
Figure FDA00034622326000000111
用户长期兴趣的序列性不强,因此采用平均池获得用户较为稳定的长期兴趣表征pl
Figure FDA00034622326000000112
其中,ZT-1为时间T之前的用户历史会话表征列表,
Figure FDA00034622326000000113
为用户第τ个历史会话表征,|ZT-1|表示序列ZT-1的个数;pl是用户的长期兴趣表征;
根据用户的短期和长期兴趣表征,在重复推荐模式和探索推荐模式中选择;在本方法中,基于用户的当前会话ST和用户长期兴趣pl,用户下一个交互物品vt+1的概率P(vt+1|ST,pl)进一步分解为:
P(vt+1|ST,pl)=P(r|ST,pl)P(vt+1|r,ST,pl)+P(e|ST,pl)P(vt+1|e,ST,pl)
其中,r和e分别代表重复模式和探索模式;P(r|ST,pl)和P(e|ST,pl)代表基于当前会话ST和用户长期兴趣pl,计算重复模式和探索模式的概率;P(vt+1|r,ST,pl)和P(vt+1|e,ST,pl)分别代表在重复模式和探索模式下,推荐物品vt+1的概率;判断推荐模式采用重复模式还是探索模式也就是计算概率P(r|ST,pl)和P(e|ST,pl);
在重复模式下,根据用户的短期、长期兴趣表征和购买行为表征,在用户历史购买的物品序列中进行推荐;令用户历史购买序列为BT-1={v1,v2,…,vl},用户历史购买序列BT-1的向量表征为
Figure FDA00034622326000000114
其中上标a表示购买行为;那么,在重复模式下,用户历史购买的物品的推荐概率P(vτ|r,ST,pl)是:
Figure FDA00034622326000000115
Figure FDA00034622326000000116
Figure FDA00034622326000000117
其中,
Figure FDA00034622326000000118
是用户历史购买序列中第τ个物品vτ的向量表征;
Figure FDA00034622326000000119
Figure FDA00034622326000000120
是模型参数,在模型训练时更新,共同决定了第τ个物品vτ的重要程度;V代表物品集合;ps、pl和pa分别为用户短期、长期兴趣表征以及当前会话中的购买行为表征;从P(vτ|r,ST,pl)计算公式中看出,历史购买的物品和当前购买物品越相似,推荐该物品的概率越低;
在探索模式下,根据用户的短期兴趣表征和用户长期兴趣,对不在用户历史购买的物品序列中的物品进行推荐,物品推荐概率计算公式P(vτ|e,ST,pl)为:
Figure FDA00034622326000000121
Figure FDA00034622326000000122
其中,xτ为物品集合V-BT-1中的物品vτ的向量表征;ps和pl分别为用户短期和长期兴趣表征;对于vτ∈BT-1的物品,
Figure FDA00034622326000000123
也就是推荐概率P(vτ|e,ST,pl)=0;
构建损失函数,训练模型参数;采用对数似然损失函数:
Figure FDA0003462232600000021
其中,OT是训练集中所有的会话集合;P(vτ|ST,pl)表示基于用户的当前会话ST和用户长期兴趣pl,预测用户下一个交互物品vτ的概率,vτ是会话序列中真实交互的物品;我们采用Adam优化器更新模型参数。
2.根据权利要求1所述的一种考虑重复购买行为的会话推荐方法,其中,所述对用户当前交互序列进行表征的门控循环单元网络GRU具体公式为:
zτ=σ(Wxz·xτ+Whz·hτ-1)
rτ=σ(Wxr·xτ+Whr·hτ-1)
Figure FDA0003462232600000022
Figure FDA0003462232600000023
其中,rτ是重置门,zτ为更新门,这两个门控向量决定了哪些信息能作为门控循环单元的输出;
Figure FDA0003462232600000024
是当前记忆内容;xτ是当前层的节点输入;
Figure FDA0003462232600000025
Figure FDA0003462232600000026
分别是控制更新门zτ和重置门rτ的参数;
Figure FDA0003462232600000027
Figure FDA0003462232600000028
是控制当前记忆内容
Figure FDA0003462232600000029
的参数;⊙是元素级别的矩阵相乘,σ是sigmoid函数;当前会话表征为
Figure FDA00034622326000000210
3.根据权利要求1所述的一种考虑重复购买行为的会话推荐方法,其中,用于判断推荐模式采用重复模式还是探索模式的概率P(r|ST,pl)和P(e|ST,pl)具体为:
Figure FDA00034622326000000211
其中,
Figure FDA00034622326000000212
是模型权重参数,ps和pl分别是用户动态的短期兴趣表征和静态的长期兴趣表征;
Figure FDA00034622326000000213
表示向量连接操作,softmax是softmax函数;从公式中看出,选择重复模式和探索模式是一个二分类问题,且是一个软分类问题。
CN202110102234.7A 2021-01-26 2021-01-26 一种考虑重复购买行为的会话推荐方法 Active CN112819575B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110102234.7A CN112819575B (zh) 2021-01-26 2021-01-26 一种考虑重复购买行为的会话推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110102234.7A CN112819575B (zh) 2021-01-26 2021-01-26 一种考虑重复购买行为的会话推荐方法

Publications (2)

Publication Number Publication Date
CN112819575A CN112819575A (zh) 2021-05-18
CN112819575B true CN112819575B (zh) 2022-02-18

Family

ID=75859849

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110102234.7A Active CN112819575B (zh) 2021-01-26 2021-01-26 一种考虑重复购买行为的会话推荐方法

Country Status (1)

Country Link
CN (1) CN112819575B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113722599B (zh) * 2021-09-06 2022-05-17 中国计量大学 一种基于用户长期兴趣和短期兴趣建模的会话推荐方法
CN113704627B (zh) * 2021-09-06 2022-05-17 中国计量大学 一种基于时间间隔图的会话推荐方法
CN117828193B (zh) * 2024-03-04 2024-05-17 山东省计算中心(国家超级计算济南中心) 基于多兴趣半联合学习兴趣推荐方法、系统、设备及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110956514A (zh) * 2018-09-26 2020-04-03 北京京东尚科信息技术有限公司 一种生成订单信息的方法和装置
CN111242729A (zh) * 2020-01-07 2020-06-05 西北工业大学 一种基于长短期兴趣的序列化推荐方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110956514A (zh) * 2018-09-26 2020-04-03 北京京东尚科信息技术有限公司 一种生成订单信息的方法和装置
CN111242729A (zh) * 2020-01-07 2020-06-05 西北工业大学 一种基于长短期兴趣的序列化推荐方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于用户网购行为的个性化推荐算法研究;邓金;《中国优秀博硕士学位论文全文数据库(硕士)》;20200115(第1期);第1-66页 *

Also Published As

Publication number Publication date
CN112819575A (zh) 2021-05-18

Similar Documents

Publication Publication Date Title
CN108648049B (zh) 一种基于用户行为区别建模的序列推荐方法
Zhao et al. Dear: Deep reinforcement learning for online advertising impression in recommender systems
CN112819575B (zh) 一种考虑重复购买行为的会话推荐方法
Chen et al. A group recommendation system with consideration of interactions among group members
CN108431833A (zh) 端到端深度协作过滤
CN109087178A (zh) 商品推荐方法和装置
Yu et al. Multi-linear interactive matrix factorization
CN112733018A (zh) 一种基于图神经网络gnn和多任务学习的会话推荐方法
CN115270001B (zh) 基于云端协同学习的隐私保护推荐方法及系统
CN112685657A (zh) 一种基于多模态交叉融合图网络的会话社交推荐方法
Ahamed et al. A recommender system based on deep neural network and matrix factorization for collaborative filtering
CN113610610B (zh) 基于图神经网络和评论相似度的会话推荐方法和系统
CN115147192A (zh) 基于双视角纠偏的推荐方法及推荐系统
CN114529077A (zh) 一种基于会话内异构行为的点击率预测方法
CN114282077A (zh) 一种基于会话数据的会话推荐方法及系统
CN112883268B (zh) 一种考虑用户多兴趣以及社交影响的会话推荐方法
CN112559904B (zh) 一种基于门机制和多模态图网络的会话社交推荐方法
WO2021139513A1 (zh) 处理交互序列数据的方法及装置
CN116843371A (zh) 营销推广方法、装置、设备和计算机可读存储介质
CN112905886B (zh) 一种基于多兴趣重复网络的会话推荐方法
CN115600009A (zh) 一种考虑用户未来偏好的基于深度强化学习的推荐方法
CN108133407B (zh) 一种基于软集决策规则分析的电子商务推荐技术及系统
CN112559905B (zh) 一种基于双模式注意力机制和社交相似度的会话推荐方法
CN113722599B (zh) 一种基于用户长期兴趣和短期兴趣建模的会话推荐方法
CN113704439A (zh) 一种基于多来源信息异构图的会话推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230920

Address after: Room 407-10, floor 4, building 2, Haichuang science and technology center, Cangqian street, Yuhang District, Hangzhou City, Zhejiang Province, 311100

Patentee after: Zhejiang Zhiduo Network Technology Co.,Ltd.

Address before: 310018, No. 258, source street, Xiasha Higher Education Park, Hangzhou, Zhejiang

Patentee before: China Jiliang University

TR01 Transfer of patent right