CN112819575A - 一种考虑重复购买行为的会话推荐方法 - Google Patents
一种考虑重复购买行为的会话推荐方法 Download PDFInfo
- Publication number
- CN112819575A CN112819575A CN202110102234.7A CN202110102234A CN112819575A CN 112819575 A CN112819575 A CN 112819575A CN 202110102234 A CN202110102234 A CN 202110102234A CN 112819575 A CN112819575 A CN 112819575A
- Authority
- CN
- China
- Prior art keywords
- user
- sequence
- item
- term
- long
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Business, Economics & Management (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Accounting & Taxation (AREA)
- Probability & Statistics with Applications (AREA)
- Finance (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Evolutionary Biology (AREA)
- Fuzzy Systems (AREA)
- Human Computer Interaction (AREA)
- Bioinformatics & Computational Biology (AREA)
Abstract
本发明公开了一种考虑重复购买行为的会话推荐方法。该方法建立一个模型对当前会话和用户长期兴趣进行建模,并预测用户点下一个点击的物品。用户在在线平台上往往会有固定的行为习惯,因此本方法提出一种考虑重复购买行为的推荐方法,主要由四个部分组成:第一部分是根据用户当前交互会话序列,得到用户短期、长期兴趣表征和辅助行为(购买)表征。第二部分是根据用户短期和长期兴趣表征,选择重复模式或探索模式。第三部分是在重复模式下,根据用户的短期、长期兴趣表征和辅助行为(购买)表征,在用户历史购买的物品序列中进行推荐。第四部分是在探索模式下,根据用户的短期和长期兴趣表征,对不在用户历史购买的物品序列中的物品进行推荐。
Description
技术领域
本发明属于互联网服务技术领域,尤其是涉及一种考虑重复购买行为的会话推荐方法。
背景技术
随着在线服务的发展和流行,在线平台记录着大量的用户行为数据。从海量数据中找出用户最感兴趣的物品并推荐给用户,可以极大地提升用户的满意度和公司的收益。此时,推荐系统显得非常重要。推荐系统可以从海量物品中挖掘出用户最喜欢的物品。
传统的推荐方法主要包括三种。一种是一般的推荐系统,从用户和物品之间的历史交互数据中挖掘出用户和物品的静态关联,包括,协同过滤和矩阵分解等方法。这类方法将用户-物品的交互关系输入到网络中,忽略了用户兴趣的动态变化。第二种是基于物品序列,推荐用户下一个交互的物品,叫做序列推荐方法。会话推荐方法就属于一种序列推荐方法,会话是指一段时间内的用户交互序列。最后一种方法是将前两种方法结合起来,同时对用户的静态的长期兴趣和动态的当前兴趣进行建模,然后再推荐用户下一个交互的物品。本方法在对用户兴趣建模时,同样是采取第三种方法。但是本方法最大的不同点是考虑到用户的重复消费行为。用户在在线平台上会有固定的行为习惯。比如,在电商平台上,用户经常会重复购买固定的商品;在音乐平台上,用户会经常重复听同一首歌曲。Ren等人在论文中提出了重复网络(RepeatNet)来解决重复消费推荐问题,但是该论文提出的解法和问题定义不符。重复网络在介绍(introduction)中提出用户存在重复消费行为,所以在推荐物品时应考虑到用户这一消费规律。但是在方法(method)中,推荐重复的物品是在当前会话中的物品序列中推荐,而用户在短时间内,也就是在一个会话内部重复购买相同的物品的可能性很低。并且该方法没有考虑到用户的长期兴趣,用户长期兴趣是偏向于静态的。如果用户在当前会话中的短期兴趣和用户的长期兴趣重复度很高,那么发生重复购买行为的概率较大。所以在模型中,判断推荐模式是重复模式还是探索模式时,应该同时考虑用户的长期兴趣和用户的短期兴趣。其中,重复模式是指推荐用户历史购买过的物品,探索模式是指推荐用户从未购买过的商品。关于重复行为这个场景的论文或者方法不多,但是工业界已经有相关的应用。如,“淘宝”APP在订单页面会有“常购好货”的功能展示,从该用户历史购买商品中推荐用户当下还有可能购买的商品。
发明内容
本方法是一种基于会话的物品点击率预测方法。会话(session)指一段时间内的用户交互的物品序列,会话推荐任务是指基于当前会话中的物品序列,预测用户在当前会话中下一个感兴趣的物品。用户的当前会话可以表示为ST={x1,x2,…,xτ,…,xt},其中,xτ代表第τ个物品。预测用户在当前会话中下一个感兴趣的物品用数学语言可以表示为P(xt+1|ST),其中,P(xt+1|ST)表示基于用户的当前会话ST,用户下一个交互物品xt+1的概率。将用户行为序列划分成会话更符合用户行为规律,一般来讲,用户在一个会话中会有特定的目的。会话和会话之间会有一个较长时间间隔(time gap),如,淘宝将时间间隔设置为三十分钟。现在越来越多的方法,在基于会话推荐时,会同时将用户过去一段时间内的交互行为作为信息补充考虑进来,用于捕捉用户的长期兴趣,来提升推荐的准确度。此时,推荐物品的概率变成P(xt+1|ST,pl),其中pl表示用户的长期兴趣。
对于用户的重复消费行为的研究工作较少。而用户在在线平台上会有固定的行为习惯。Ren等人提出了重复网络(RepeatNet)来解决重复消费推荐问题,但是该论文提出的解法和问题定义不符。重复网络在介绍(introduction)中提出用户存在重复消费行为,所以在推荐物品时应考虑到用户这一消费规律。但是在方法(method)中,推荐重复的物品是在当前会话中的物品序列中推荐,而用户在短时间内,也就是在一个会话内部重复购买相同的物品的可能性很低。并且该方法没有考虑到用户的长期兴趣,用户长期兴趣是偏向于静态的。如果用户在当前会话中的短期兴趣和用户的长期兴趣重复度很高,那么发生重复购买行为的概率较大。所以在模型中,判断推荐模式是重复模式还是探索模式时,应该同时考虑用户的长期兴趣和用户的短期兴趣。其中,重复模式是指推荐用户历史购买过的物品,探索模式是指推荐用户从未购买过的商品。为此,本发明采用以下技术方案:
一种考虑重复购买行为的会话推荐方法,包括以下步骤:
根据用户当前交互会话序列中的辅助行为(auxiliary behavior)序列,得到用户辅助行为(购买)表征。用户当前交互的会话可以表示为ST={x1,x2,…,xτ,…,xt},其中,xτ代表第τ个物品,T表示当前会话的时间段下标,且ST的向量表征为{x1,x2,…,xτ,…,xt},其中d是物品向量表征的长度。ST表示当前会话中所有交互的物品序列,其中,购买行为序列为且AT的向量表征为购买行为序列的表征对于重复模式下的物品推荐至关重要,因为用户在短时间内,也就是在一个会话内,进行重复消费的可能性较低。通常,在推荐系统中,把交互序列中的交互类型叫做目标类型(target type),把购买行为类型叫做辅助类型(auxiliary type)。采用平均池(mean-pooling)对购买行为序列进行表征,如下:
根据用户当前交互会话序列,得到用户短期兴趣表征ps。本方法采用门控循环单元网络(GRU)对用户当前交互序列进行表征:
zτ=σ(Wxz·xτ+Whz·hτ-1)
rτ=σ(Wxr·xτ+Whr·hτ-1)
其中,rτ是重置门(reset gate),zτ为更新门(update gate),这两个门控向量决定了哪些信息能作为门控循环单元的输出。是当前记忆内容。xτ是当前层的节点输入。 和分别是控制更新门zτ和重置门rτ的参数。和是控制前记忆内容的参数。⊙是元素级别的矩阵相乘,σ是sigmoid函数。GRU的输入序列为ST={x1,x2,…,xτ,…,xt}。最后,当前会话序列表征为用户短期兴趣(short-term interest)表征为前会话序列表征
更新用户长期兴趣(long-term interest)表征pl。用户当前会话所在时间为T,用户历史所有会话表征仍然采用门控循环单元网络(GRU)结构得到,此时用户历史会话表征序列为用户长期兴趣的序列性不强,因此采用平均池(mean-pooling)获得用户较为稳定的长期兴趣表征pl:
其中,ZT-1为时间T之前的用户历史会话表征列表,zτ为第τ个用户历史会话表征,|ZT-1|表示序列ZT-1的个数。pl是用户的长期兴趣表征。
根据用户的短期和长期兴趣表征,在重复推荐模式和探索推荐模式中选择。在本方法中,基于用户的当前会话ST和用户长期兴趣pl,用户下一个交互物品xt+1的概率P(xt+1|ST,pl)可以进一步分解为:
P(xt+1|ST,pl)=P(r|ST,pl)P(xt+1|r,ST,pl)+P(e|ST,pl)P(xt+1|e,ST,pl)
其中,r和e分别代表重复模式(repeat mode)和探索模式(explore mode)。P(r|ST,pl)和P(e|ST,pl)代表基于当前序列ST和用户长期兴趣pl,计算重复模式和探索模式的概率。P(xt+1|r,ST,pl)和P(xt+1|e,ST,pl)分别代表在重复模式和探索模式下,推荐物品xt+1的概率。该方法常见于自然语言处理(NLP)中的复制机制(copy mechanism)。判断推荐模式采用重复模式还是探索模式也就是计算概率P(r|ST,pl)和P(e|ST,pl):
其中,是模型权重参数,ps和pl分别是用户动态的短期兴趣表征和静态的长期兴趣表征。表示向量连接操作,softmax是softmax函数,在本方法是一个二分类方法。从公式中可以看出,选择重复模式(repeat mode)和探索模式(explore mode)是一个二分类问题,且是一个软分类(soft classification)问题。
在重复模式下,根据用户的短期、长期兴趣表征和辅助行为(购买)表征,在用户历史购买的物品序列中进行推荐。令用户历史消费序列为BT-1={x1,x2,…,xl},用户历史消费序列BT-1的向量表征为其中上标a表示购买行为(auxiliary behavior)。那么,在重复模式下,用户历史购买的物品的推荐概率P(xτ|r,ST,pl)是:
其中,是用户历史消费序列中第τ个物品xτ的向量表征,且Wrs,Wrl,和是模型参数,共同决定了第τ个物品xτ的重要程度,V代表物品集合。ps、pl和pa分别为用户短期、长期兴趣表征以及当前会话中的辅助(消费)行为表征。从公式中可以看出,历史购买的物品和当前购买物品越相似,推荐该物品的概率越低。
在探索模式下,根据用户的短期兴趣表征和用户长期兴趣,对不在用户历史购买的物品序列中的物品进行推荐,物品推荐概率计算公式P(xτ|e,ST,pl)为:
构建损失函数,训练模型参数。采用对数似然损失函数:
其中,是训练集中所有的会话序列。P(xτ|ST,pl)是上文中提到的概率,表示基于用户的当前会话ST和用户长期兴趣pl,预测用户下一个交互物品xτ的概率,xτ是会话序列中真实交互的物品。我们采用Adam优化器更新模型参数。
本发明的有益技术效果如下:
(1)本发明是一种同时对用户长期兴趣和短期兴趣进行建模的方法。同时考虑到用户短期兴趣的动态变化性和用户长期兴趣的稳定性。
(2)本发明考虑到用户的重复消费行为,并在判断推荐模式是重复模式还是探索模式时,同时考虑用户的长期兴趣和用户的短期兴趣,更符合用户决策规律。
(3)本发明考虑到用户的重复消费行为,并在重复模式下推荐历史购买过的物品时,对用户当前会话中的购买行为进行表征,因为在一个会话内重复购买相同物品的可能性很低。
附图说明
图1为本发明一种考虑重复购买行为的会话推荐方法的流程示意图;
图2为本发明一种考虑重复购买行为的会话推荐方法的模型框架图。
具体实施方式
为了进一步理解本发明,下面结合具体实施方式对本发明提供的一种考虑重复购买行为的会话推荐方法进行具体描述,但本发明并不限于此,该领域技术人员在本发明核心指导思想下做出的非本质改进和调整,仍然属于本发明的保护范围。
会话(session)指一段时间内的用户交互的物品序列,会话推荐任务是指基于当前会话中的物品序列,预测用户在当前会话中下一个感兴趣的物品。用户的当前会话可以表示为ST={x1,x2,…,xτ,…,xt},其中,xτ代表第τ个物品。预测用户在当前会话中下一个感兴趣的物品用数学语言可以表示为P(xt+1|ST),其中,P(xt+1|ST)表示基于用户的当前会话ST,用户下一个交互物品xt+1的概率。将用户行为序列划分成会话更符合用户行为规律,一般来讲,用户在一个会话中会有特定的目的。会话和会话之间会有一个较长时间间隔(timegap),如,淘宝将时间间隔设置为三十分钟。现在越来越多的方法,在基于会话推荐时,会同时将用户过去一段时间内的交互行为作为信息补充考虑进来,用于捕捉用户的长期兴趣,来提升推荐的准确度。此时,推荐物品的概率变成P(xt+1|ST,pl),其中pl表示用户的长期兴趣。
传统的推荐方法主要包括三种。一种是一般的推荐系统,从用户和物品之间的历史交互数据中挖掘出用户和物品的静态关联,包括,协同过滤和矩阵分解等方法。这类方法将用户-物品的交互关系输入到网络中,忽略了用户兴趣的动态变化。第二种是基于物品序列,推荐用户下一个交互的物品,叫做序列推荐方法。会话推荐方法就属于一种序列推荐方法,会话是指一段时间内的用户交互序列。最后一种方法是将前两种方法结合起来,同时对用户的静态的长期兴趣和动态的当前兴趣进行建模,然后再推荐用户下一个交互的物品。本方法在对用户兴趣建模时,同样是采取第三种方法。但是本方法最大的不同点是考虑到用户的重复消费行为。用户在在线平台上会有固定的习惯。比如,在电商平台上,用户经常会重复购买固定的商品;在音乐平台上,用户会经常重复听同一首歌曲。Ren等人提出了重复网络(RepeatNet)来解决重复消费推荐问题,但是该论文提出的解法和问题定义不符。重复网络在介绍(introduction)中提出用户存在重复消费行为,所以在推荐物品时应考虑到用户这一消费规律。但是在方法(method)中,推荐重复的物品是在当前会话中的物品序列中推荐,而用户在短时间内,也就是在一个会话内部重复购买相同的物品的可能性很低。并且该方法没有考虑到用户的长期兴趣,用户长期兴趣是偏向于静态的。如果用户在当前会话中的短期兴趣和用户的长期兴趣重复度很高,那么发生重复购买行为的概率较大。所以在模型中,判断推荐模式是重复模式还是探索模式,应该同时考虑用户的长期兴趣和用户的短期兴趣。其中,重复模式是指推荐用户历史购买过的物品,探索模式是指推荐用户从未购买过的商品。关于重复行为这个场景的论文或者方法不多,但是工业界已经有相关的应用。如,“淘宝”APP在订单页面会有“常购好货”的功能展示,从该用户历史购买商品中推荐用户当下还有可能购买的商品。
一种考虑重复购买行为的会话推荐方法的向前传播(forward propagation)部分主要由四个部分组成,如图2所示。第一部分是根据用户当前交互会话序列,得到用户短期、长期兴趣表征和辅助行为(购买)表征。第二部分是根据用户短期和长期兴趣表征,选择重复模式或探索模式。第三部分是在重复模式下,根据用户的短期、长期兴趣表征和辅助行为(购买)表征,在用户历史购买的物品序列中进行推荐。第四部分是在探索模式下,根据用户的短期和长期兴趣表征,对不在用户历史购买的物品序列中的物品进行推荐。
如图1所示,按照本发明的一个实施例,本方法包括如下步骤:
S100,根据用户当前交互会话序列中的辅助行为(auxiliary behavior)序列,得到用户辅助行为(购买)表征。用户当前交互的会话可以表示为ST={x1,x2,…,xτ,…,xt},其中,xτ代表第τ个物品,T表示当前会话的时间段下标,且ST的向量表征为{x1,x2,…,xτ,…,xt},其中d是物品向量表征的长度。ST表示当前会话中所有交互的物品序列,其中,购买行为序列为且AT的向量表征为购买行为序列的表征对于重复模式下的物品推荐至关重要,因为用户在短时间内,也就是在一个会话内,进行重复消费的可能性较低。通常,在推荐系统中,把交互序列中的交互类型叫做目标类型(target type),把购买行为类型叫做辅助类型(auxiliary type)。采用平均池(mean-pooling)对购买行为序列进行表征,如下:
S200,根据用户当前交互会话序列,得到用户短期兴趣表征。本方法采用门控循环单元网络(GRU)对用户当前交互序列进行表征:
zτ=σ(Wxz·xτ+Whz·hτ-1)
rτ=σ(Wxr·xτ+Whr·hτ-1)
其中,rτ是重置门(reset gate),zτ为更新门(update gate),这两个门控向量决定了哪些信息能作为门控循环单元的输出。是当前记忆内容。xτ是当前层的节点输入。 和分别是控制更新门zτ和重置门rτ的参数。和是控制前记忆内容的参数。⊙是元素级别的矩阵相乘,σ是sigmoid函数。GRU的输入序列为ST={x1,x2,…,xτ,…,xt}。最后,当前会话序列表征为用户短期兴趣(short-term interest)表征为前会话序列表征
S300,更新用户长期兴趣(long-term interest)表征pl。用户当前会话所在时间为T,用户历史所有会话表征仍然采用门控循环单元网络(GRU)结构得到,此时用户历史会话表征序列为用户长期兴趣的序列性不强,因此采用平均池(mean-pooling)获得用户较为稳定的长期兴趣表征pl:
其中,ZT-1为时间T之前的用户历史会话表征列表,zτ为第τ个用户历史会话表征,|ZT-1|表示序列ZT-1的个数。pl是用户的长期兴趣表征。
S400,根据用户的短期和长期兴趣表征,在重复推荐模式和探索推荐模式中选择。在本方法中,基于用户的当前会话ST和用户长期兴趣pl,用户下一个交互物品xt+1的概率P(xt+1|ST,pl)可以进一步分解为:P(xt+1|ST,pl)=P(r|ST,pl)P(xt+1|r,ST,pl)+P(e|ST,pl)P(xt+1|e,ST,pl)
其中,r和e分别代表重复模式(repeat mode)和探索模式(explore mode)。P(r|ST,pl)和P(e|ST,pl)代表基于当前序列ST和用户长期兴趣pl,计算重复模式和探索模式的概率。P(xt11|r,ST,pl)和P(xt+1|e,ST,pl)分别代表在重复模式和探索模式下,推荐物品xt11的概率。该方法常见于自然语言处理(NLP)中的复制机制(copy mechanism)。判断推荐模式采用重复模式还是探索模式也就是计算概率P(r|ST,pl)和P(e|ST,pl):
其中,是模型权重参数,ps和pl分别是用户动态的短期兴趣表征和静态的长期兴趣表征。表示向量连接操作,softmax是softmax函数,在本方法是一个二分类方法。从公式中可以看出,选择重复模式(repeat mode)和探索模式(explore mode)是一个二分类问题,且是一个软分类(soft classification)问题。
S500,在重复模式下,根据用户的短期、长期兴趣表征和辅助行为(购买)表征,在用户历史购买的物品序列中进行推荐。令用户历史消费序列为BT-1={x1,x2,…,xl},用户历史消费序列BT-1的向量表征为其中上标a表示购买行为(auxiliarybehavior)。那么,在重复模式下,用户历史购买的物品的推荐概率P(xτ|r,ST,pl)是:
其中,是用户历史消费序列中第τ个物品xτ的向量表征,且Wrs,Wrl,和是模型参数,共同决定了第τ个物品xτ的重要程度,V代表物品集合。ps、pl和pa分别为用户短期、长期兴趣表征以及当前会话中的辅助(消费)行为表征。从公式中可以看出,历史购买的物品和当前购买物品越相似,推荐该物品的概率越低。
S600,在探索模式下,根据用户的短期兴趣表征和用户长期兴趣,对不在用户历史购买的物品序列中的物品进行推荐,物品推荐概率计算公式P(xτ|e,ST,pl)为:
S700,构建损失函数,训练模型参数。采用对数似然损失函数:
其中,是训练集中所有的会话序列。P(xτ|ST,pl)是上文中提到的概率,表示基于用户的当前会话ST和用户长期兴趣pl,预测用户下一个交互物品xτ的概率,xτ是会话序列中真实交互的物品。我们采用Adam优化器更新模型参数。
上述对实施例的描述是为方便于本技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于上述实施例,本领域技术人员根据本发明的揭示,对于本发明做出的改进和修改都应该在本发明的保护范围之内。
Claims (3)
1.一种考虑重复购买行为的会话推荐方法,其特征在于:
根据用户当前交互会话序列中的辅助行为(auxiliary behavior)序列,得到用户辅助行为(购买)表征;用户当前交互的会话可以表示为ST={x1,x2,…,xτ,…,xt},其中,xτ代表第τ个物品,T表示当前会话的时间段下标,且ST的向量表征为{x1,x2,…,xτ,…,xt},其中d是物品向量表征的长度;ST表示当前会话中所有交互的物品序列,其中,购买行为序列为且AT的向量表征为通常,在推荐系统中,把交互序列中的交互类型叫做目标类型(target type),把购买行为类型叫做辅助类型(auxiliary type);采用平均池(mean-pooling)对购买行为序列进行表征,如下:是
根据用户当前交互会话序列,得到用户短期兴趣表征ps;本方法采用门控循环单元网络(GRU)对用户当前交互序列进行表征;GRU的输入序列为ST={x1,x2,…,xτ,…,xt};最后得到当前会话序列表征为用户短期兴趣(short-terminterest)表征为前会话序列表征
更新用户长期兴趣(long-term interest)表征pl;用户当前会话所在时间为T,用户历史所有会话表征仍然采用门控循环单元网络(GRU)结构得到,此时用户历史会话表征序列为用户长期兴趣的序列性不强,因此采用平均池(mean-pooling)获得用户较为稳定的长期兴趣表征pl:
其中,ZT-1为时间T之前的用户历史会话表征列表,zτ为第τ个用户历史会话表征,|ZT-1|表示序列ZT-1的个数;pl是用户的长期兴趣表征;
根据用户的短期和长期兴趣表征,在重复推荐模式和探索推荐模式中选择;在本方法中,基于用户的当前会话ST和用户长期兴趣pl,用户下一个交互物品xt+1的概率P(xt+1|ST,pl)可以进一步分解为:P(xt+1|ST,pl)=P(r|ST,pl)P(xt+1|r,ST,pl)+P(e|ST,pl)P(xt+1|e,ST,pl)
其中,r和e分别代表重复模式(repeat mode)和探索模式(explore mode);P(r|ST,pl)和P(e|ST,pl)代表基于当前序列ST和用户长期兴趣pl,计算重复模式和探索模式的概率;P(xt+1|r,ST,pl)和P(xt+1|e,ST,pl)分别代表在重复模式和探索模式下,推荐物品xt+1的概率;判断推荐模式采用重复模式还是探索模式也就是计算概率P(r|ST,pl)和P(e|ST,pl);
在重复模式下,根据用户的短期、长期兴趣表征和辅助行为(购买)表征,在用户历史购买的物品序列中进行推荐;令用户历史消费序列为BT-1={x1,x2,…,xl},用户历史消费序列BT-1的向量表征为其中上标a表示购买行为(auxiliary behavior);那么,在重复模式下,用户历史购买的物品的推荐概率P(xτ|r,ST,pl)是:
其中,是用户历史消费序列中第τ个物品xτ的向量表征,且Wrs,Wrl,和是模型参数,共同决定了第τ个物品xτ的重要程度,V代表物品集合;ps、pl和pa分别为用户短期、长期兴趣表征以及当前会话中的辅助(消费)行为表征;从公式中可以看出,历史购买的物品和当前购买物品越相似,推荐该物品的概率越低;
在探索模式下,根据用户的短期兴趣表征和用户长期兴趣,对不在用户历史购买的物品序列中的物品进行推荐,物品推荐概率计算公式P(xτ|e,ST,pl)为:
构建损失函数,训练模型参数;采用对数似然损失函数:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110102234.7A CN112819575B (zh) | 2021-01-26 | 2021-01-26 | 一种考虑重复购买行为的会话推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110102234.7A CN112819575B (zh) | 2021-01-26 | 2021-01-26 | 一种考虑重复购买行为的会话推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112819575A true CN112819575A (zh) | 2021-05-18 |
CN112819575B CN112819575B (zh) | 2022-02-18 |
Family
ID=75859849
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110102234.7A Active CN112819575B (zh) | 2021-01-26 | 2021-01-26 | 一种考虑重复购买行为的会话推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112819575B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113704627A (zh) * | 2021-09-06 | 2021-11-26 | 中国计量大学 | 一种基于时间间隔图的会话推荐方法 |
CN113722599A (zh) * | 2021-09-06 | 2021-11-30 | 中国计量大学 | 一种基于用户长期兴趣和短期兴趣建模的会话推荐方法 |
CN117828193A (zh) * | 2024-03-04 | 2024-04-05 | 山东省计算中心(国家超级计算济南中心) | 基于多兴趣半联合学习兴趣推荐方法、系统、设备及介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110956514A (zh) * | 2018-09-26 | 2020-04-03 | 北京京东尚科信息技术有限公司 | 一种生成订单信息的方法和装置 |
CN111242729A (zh) * | 2020-01-07 | 2020-06-05 | 西北工业大学 | 一种基于长短期兴趣的序列化推荐方法 |
-
2021
- 2021-01-26 CN CN202110102234.7A patent/CN112819575B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110956514A (zh) * | 2018-09-26 | 2020-04-03 | 北京京东尚科信息技术有限公司 | 一种生成订单信息的方法和装置 |
CN111242729A (zh) * | 2020-01-07 | 2020-06-05 | 西北工业大学 | 一种基于长短期兴趣的序列化推荐方法 |
Non-Patent Citations (1)
Title |
---|
邓金: "基于用户网购行为的个性化推荐算法研究", 《中国优秀博硕士学位论文全文数据库(硕士)》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113704627A (zh) * | 2021-09-06 | 2021-11-26 | 中国计量大学 | 一种基于时间间隔图的会话推荐方法 |
CN113722599A (zh) * | 2021-09-06 | 2021-11-30 | 中国计量大学 | 一种基于用户长期兴趣和短期兴趣建模的会话推荐方法 |
CN113704627B (zh) * | 2021-09-06 | 2022-05-17 | 中国计量大学 | 一种基于时间间隔图的会话推荐方法 |
CN117828193A (zh) * | 2024-03-04 | 2024-04-05 | 山东省计算中心(国家超级计算济南中心) | 基于多兴趣半联合学习兴趣推荐方法、系统、设备及介质 |
CN117828193B (zh) * | 2024-03-04 | 2024-05-17 | 山东省计算中心(国家超级计算济南中心) | 基于多兴趣半联合学习兴趣推荐方法、系统、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112819575B (zh) | 2022-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108648049B (zh) | 一种基于用户行为区别建模的序列推荐方法 | |
Zhao et al. | Dear: Deep reinforcement learning for online advertising impression in recommender systems | |
CN112819575B (zh) | 一种考虑重复购买行为的会话推荐方法 | |
CN108460619B (zh) | 一种提供融合显隐式反馈的协同推荐模型的方法 | |
CN108431833A (zh) | 端到端深度协作过滤 | |
CN109087178A (zh) | 商品推荐方法和装置 | |
CN111797321A (zh) | 一种面向不同场景的个性化知识推荐方法及系统 | |
CN112733018A (zh) | 一种基于图神经网络gnn和多任务学习的会话推荐方法 | |
Yu et al. | Multi-linear interactive matrix factorization | |
CN114595383A (zh) | 一种基于会话序列的海洋环境数据推荐方法及系统 | |
CN115147192A (zh) | 基于双视角纠偏的推荐方法及推荐系统 | |
CN113610610B (zh) | 基于图神经网络和评论相似度的会话推荐方法和系统 | |
CN115439187A (zh) | 一种基于用户短期偏好的服务推荐方法 | |
CN113704438B (zh) | 一种基于分层注意力机制的异构图的会话推荐方法 | |
CN114282077A (zh) | 一种基于会话数据的会话推荐方法及系统 | |
CN114529077A (zh) | 一种基于会话内异构行为的点击率预测方法 | |
CN112883268B (zh) | 一种考虑用户多兴趣以及社交影响的会话推荐方法 | |
CN112559904B (zh) | 一种基于门机制和多模态图网络的会话社交推荐方法 | |
CN114169968A (zh) | 一种融合用户兴趣状态的多粒度会话推荐方法 | |
CN112905886B (zh) | 一种基于多兴趣重复网络的会话推荐方法 | |
Sharma et al. | Suggestive approaches to create a recommender system for GitHub | |
CN113704439B (zh) | 一种基于多来源信息异构图的会话推荐方法 | |
CN115600009A (zh) | 一种考虑用户未来偏好的基于深度强化学习的推荐方法 | |
CN113722599B (zh) | 一种基于用户长期兴趣和短期兴趣建模的会话推荐方法 | |
CN112559905B (zh) | 一种基于双模式注意力机制和社交相似度的会话推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230920 Address after: Room 407-10, floor 4, building 2, Haichuang science and technology center, Cangqian street, Yuhang District, Hangzhou City, Zhejiang Province, 311100 Patentee after: Zhejiang Zhiduo Network Technology Co.,Ltd. Address before: 310018, No. 258, source street, Xiasha Higher Education Park, Hangzhou, Zhejiang Patentee before: China Jiliang University |