CN113761383B

CN113761383B - 一种基于统一用户行为建模的搜索和推荐融合系统

Info

Publication number: CN113761383B
Application number: CN202111191029.9A
Authority: CN
Inventors: 窦志成; 姚菁; 文继荣
Original assignee: Renmin University of China
Current assignee: Renmin University of China
Priority date: 2021-10-13
Filing date: 2021-10-13
Publication date: 2023-06-20
Anticipated expiration: 2041-10-13
Also published as: CN113761383A

Abstract

本发明通过人工智能处理领域的方法，实现了一种基于统一用户行为建模的搜索和推荐融合系统。通过四个组成模块构成的统一的搜索推荐模型，解决搜索和推荐两个独立的任务；所述四个组成模块包括：文本编码器，用于学习文档和查询的表示向量；会话编码器，用于建模当前会话中的用户行为序列来明确用户的信息需求；历史编码器，从长期历史中挖掘信息来增强用户意图的表示；统一任务框架，以统一的方式完成个性化搜索和推荐任务，最终得到对于候选文档的个性化得分。本发明同时关注了个性化搜索和推荐两个任务，合并了用户的搜索行为和推荐中的浏览行为，并设计了一个统一的搜索和推荐模型基于合并的数据来同时解决这两个问题，从而提升两个任务的效果。

Description

一种基于统一用户行为建模的搜索和推荐融合系统

技术领域

本发明涉及人工智能领域，尤其涉及一种基于统一用户行为建模的搜索和推荐融合系统。

背景技术

搜索和推荐是用户获取信息的两种主要途径，为了提升用户对搜索结果和推荐列表的满意度，很多个性化搜索模型和推荐模型陆续被提出。这些模型旨在于从用户的历史行为中挖掘用户兴趣从而推断用户当前的个性化意图。

根据是否使用深度学习，现有的个性化搜索模型可以分为两大类：传统的个性化搜索模型和基于深度学习的个性化搜索模型。传统的个性化搜索模型主要依靠特征或启发式算法来分析用户兴趣。一部分工作认为用户的点击行为充分体现了用户兴趣，使用点击特征来帮助个性化排序；一部分工作则利用话题模型(Topic Model)从用户历史点击过的文档中抽取话题，并根据这些话题在话题空间中建立用户的兴趣画像；还有一部分工作采用特征工程，从用户的查询历史中抽取一系列与用户兴趣相关的特征来构成用户兴趣的表示。然而，这些传统方法基于经验对用户兴趣进行分析建模，对特征合理性和有效性的要求极高，而且得到的兴趣向量涵盖范围也很有限。为了解决这些问题以更好地挖掘用户兴趣，一系列基于深度学习的个性化搜索模型被提出。其中一部分模型不显式地设计特征来表示用户兴趣，而是直接从用户的查询日志中学习得到用户兴趣的分布式表示向量；另一部分模型则是直接利用单个用户的查询日志作为训练数据来训练满足个性化搜索的个人排序模型；还有一部分模型从直接消除查询歧义的角度出发来提升个性化效果。

传统的推荐模型主要依赖于协同过滤CF(Collaborative Filtering)和分解机FM(Factorization Machine)。随着深度学习的兴起，很多模型还融入了低阶和高阶的特征交互。对于新闻文章的推荐，由于其包含丰富的文本信息，很多基于表示的模型被提出。这些模型主要由两个模块构成：文本编码器和用户编码器。文本编码器用于获得新闻文章的表示向量，用户编码器则基于用户的浏览历史来建模用户表示。然后，我们依据新闻和用户的相关性来对待推荐的新闻文章进行排序。很多网络结构被用于学习文本和用户的表示向量，包括RNN，自编码器，多头自注意力机制等。新闻的各个部分，包括标题、正文、话题类别都被使用了。此外，为了丰富新闻的语义表示向量，实体信息和知识图谱也被使用。图神经网络也被用于捕捉新闻文章和用户之间更高阶的关联。

有少量方法简单地结合了推荐和搜索两个任务。在电商领域，一个早期的搜索&推荐联合系统合并了两者的特征；Zamani等人提出了一个联合训练框架——通过优化两个任务的联合损失来同时训练两个任务模型；搜索历史也被用于增强推荐任务的效果。

现有的个性化搜索模型或推荐模型都只是针对其中一个单独的任务设计的，忽略了另一个任务。实际上，搜索和推荐任务是非常相似的，他们都有一个共同的目标——在特定时刻帮助用户获得想要的信息。因此，挖掘两个任务之间的关联应该有助于同时促进两者。当前，越来越多的移动应用和网站平台都同时为用户提供了搜索和推荐服务。在这些平台上，用户既会主动地输入查询来查找信息，也会浏览系统推荐的内容，而且用户在从互联网上获取信息的过程中也经常交替使用这两种服务。比如，当一个用户在浏览推荐文章时，点击阅读了一篇文章“下一个社交浪潮即将到来，TikTok和Discord会成为引领者吗？”这篇文章提到了很多社交媒体，包括Facebook,Snapchat,Twitter等。由于用户对Snapchat不了解，她会在搜索引擎中输入相关查询查找更多关于Snapchat的信息。这样混合了搜索和浏览的信息获取方式在我们日常上网的过程中是非常常见的。从上面的例子中，我们发现用户的搜索行为和浏览行为都反映了他的兴趣爱好和信息需求，浏览行为可能会刺激搜索行为，同样搜索行为也可能会影响浏览行为。这也为同时研究搜索和推荐两个任务提供了机会。而目前已有的联合模型只是简单地考虑将两个任务结合起来，并没有深入探索两者之间的联系。在本文中，我们希望充分挖掘两个任务之间的关联，来帮助提升两个任务的效果。

发明内容

为此，本发明提出一种基于统一用户行为建模的搜索和推荐融合系统，通过四个组成模块构成的统一的搜索推荐模型，同时解决搜索和推荐两个独立的任务；所述四个组成模块包括：文本编码器，用于学习文档和查询的表示向量；会话编码器，用于建模当前会话中的用户行为序列来明确用户的信息需求；历史编码器，从长期历史中挖掘信息来增强用户意图的表示；统一任务框架，以统一的方式完成个性化搜索和推荐任务。即以相同的方式计算候选文档的个性化得分，并基于个性化得分的高低排序得到最终的文档排序结果。。

所述文本编码器分为三层，第一层是词向量层，对于一个浏览文档B＝[w₁，w₂，...，w_M]，将词序列转换为词向量矩阵Emb^B＝[v₁，v₂，...，v_M]，其中v_i对应词w_i的低维词向量，第二层为词层面的transformer，通过捕捉单词之间的交互来获得融入上下文的词向量C^B：C^B＝Transformer_w(Emb^B)，第三层是词层面的注意力层；

所述词层面的注意力层运用词级别的注意力机制赋予词权重，设置一个可训练的向量q_w作为注意力机制中的query，所有词的权重α：

所有词向量的加权和r^B表示为：/>

作为浏览文档B对应的表示向量。查询Q和对应的若干个点击文档D＝[D₁，D₂，...，D_i]的向量计算也同上。对于查询Q，/>

对于点击文档D₁，/>

所述会话编码器首先对搜索或推荐的意图进行初始化，并采用co-attention结构融合历史查询Q和对应的若干点击文档D_i的交互信息，然后用transformer结构来处理在整个会话中的行为，计算各个行为的融入了会话上下文之后的意图表示；

所述初始化方法为：在当前时刻t，对于用户主动输入的查询Q_t，用该查询的文本表示向量

来初始化意图I_t，用户未主动输入查询时用可训练的用户向量Emb^u进行初始化

得到初始化意图I_t；

所述用于融合历史查询Q和对应的若干点击文档D_i的交互信息的co-attention结构的计算方法为：第一步，通过所述文本编码器中的词向量层和transformer层，得到查询和每个文档的上下文表示向量矩阵C^Q，

所有点击文档的向量拼接在一起，即/>

第二步，计算查询和文档之间的交互矩阵A：A＝tanh((C^Q)^TW_lC^D)，其中W_l是待训练的参数，查询和文档的注意力权重基于交互矩阵的特征计算如下：H^Q＝tanh(W_qC^Q+(W_dC^D)A)，

H^Q＝tanh(W_dC^D+(W_qC^Q)A^T)，/>

W_q，W_d，W_hq，W_hd是参数，α^Q和α^D是查询和文档的注意力权重；第三步，计算查询和文档的表示向为上下文向量的加权和：/>

将向量/>

拼接到一起再通过一个全连接层得到一个历史搜索行为的表示向量即为由所述文本编码器计算的该文章的表示向量r^s；

在此基础上，计算得到当前会话中所有短期历史行为的表示。当前会话的历史行为为

将短期历史H^s和用户的目标意图I^t拼接在一起经过一个会话层面的transformer进行交互，为每个行为加上位置和搜索、浏览两类类别信息，最后一个位置的输出/>

即表示融入了会话上下文之后的意图表示：

[H^s，I^t]_P，[H^s，I^t]_T是位置向量和类别向量，

表示取最后一个位置的输出。

所述历史编码器通过建模长期历史来明确用户意图

首先，用所述会话编码器处理每个历史会话，捕捉异质性行为之间的关联，得到所有历史行为的上下文表示

(注：l表示长期历史，s表示短期历史)，带有下脚标s表示通过会话编码器融入了短期历史之后的表示，上角标表示对应的是历史浏览行为还是搜索行为的表示，将所有会话的子序列连接起来并拼接上目标行为得到/>

然后用一个历史层面的transformer模块处理长期的异质序列将历史信息融入到当前意图中并加入每个行为的位置，最后，取最后一个位置的输出作为由长期历史增强得到的意图表示向量/>

对于候选文档，我们首先用所述文本编码器计算文档的向量

然后，我们用长期历史来增强其表示，得到/>

计算如下：/>

所述统一任务框架用余弦相似度计算所述文档的向量

所述融入了会话上下文之后的意图表示/>

所述由长期历史增强得到的意图表示向量/>

所述增强表示的文档的向量/>

两两之间的相似性，利用基于交互的模型KNRM来计算交互得分为/>

并采用一些额外的相关性特征F_q，d(包括文档的点击次数、点击交叉熵等)用于计算个性化得分，得到

最后，候选文档的得分通过一个全连接层聚合所有以上的得分得到所述个性化得分p^unified(D_t|I_t，Q_t，H)：p^unified(D_t|I_t，Q_t，H)＝MLP(f^unified)。

所述系统的训练方法为：对于搜索和推荐任务，每个训练样本是一组文档，包括在一个列表中返回的一个正例文档和K个负例文档，表示为

对每一组文档，最大化整理文档的得分并最小化负例文档的得分，损失L计算如下：

p^unified(·)是p^unified(·|I_t，Q_t，H)的缩写；用Adam优化器来最小化模型损失；并在训练过程中，首先用两个任务的数据训练一个统一的搜索推荐模型，然后为每个任务复制一份模型参数并且用对应的任务数据对其进行调整以适应该任务的数据分布情况。

本发明所要实现的技术效果在于：

本发明同时关注了个性化搜索和推荐两个任务，合并了用户的搜索行为和推荐中的浏览行为，并设计了一个统一的搜索和推荐模型基于合并的数据来同时解决这两个问题。这样有以下几个好处：(1)合并了用户的搜索和浏览日志可以缓解数据稀疏性问题；(2)基于合并的用户行为，可以建模更准确的用户兴趣画像；(3)我们可以挖掘搜索和浏览行为之间的关联来共同促进两个任务。

附图说明

图1整合的行为序列示意图；

图2统一搜索推荐模型；

具体实施方式

以下是本发明的优选实施例并结合附图，对本发明的技术方案作进一步的描述，但本发明并不限于此实施例。

本发明提出了一种基于统一用户行为建模的搜索和推荐融合系统。

系统整合了搜索和推荐两这个独立的任务并设计了一个统一的搜索推荐模型以统一的方式来解决这两个任务。

整合行为的定义：

在一个同时有搜索引擎和推荐系统的网络平台上，用户u会浏览推荐系统中的文章，在搜索引擎中输入查询来查找信息并点击相关的文档。所有行为是序列化的，我们按照时间顺序将其整合为一个异质性的行为序列。参考现有的搜索会话切分方式，我们以30分钟不活动时间为间隔将用户完整的行为序列划分成若干个会话。当前会话的历史行为作为短期历史，之前的会话构成长期历史。具体地，我们将用户的历史序列表示为H＝{H^l，H^s}＝{{S₁，...，S_N-1}，S_N}，N是会话总数。每个会话S对应一个行为子序列，比如

B表示在推荐系统中浏览的文章，Q指代在搜索引擎中用户输入的查询，D则是在查询下点击的文档。完整的行为序列如图1所示，水平的边指示两个连续行为之间的序列化关系，倾斜的边指向查询下的点击文档，蓝色的垂直线用于划分会话。比如，在当前会话Session N中，用户首先在推荐系统中浏览了两篇文章；然后，她在搜索引擎中输入了一个查询并点击了一个文档。在当前时刻t，用户可能会进行搜索或浏览推荐的文章。在本文中，我们将推荐任务看做查询为空的个性化搜索任务，并以统一的个性化排序方法来解决两个任务——面对当前查询Q_t或者空查询，模型需要根据查询和历史行为所反映的用户兴趣为用户返回个性化的排序结果。

图1为整合的行为序列示意图。若目标是搜索，则用户输入查询Q_t；推荐则认为查询为空。

搜索和推荐融合系统的整体架构：

统一搜索和推荐融合系统的整体架构如图2所示，一共包括四个组成模块：(1)文本编码器，用于学习文档和查询的表示向量；(2)会话编码器，用于建模当前会话中的用户行为序列来明确用户的信息需求；(3)历史编码器，从长期历史中挖掘信息来增强用户意图的表示；(4)统一任务框架，以统一的方式完成个性化搜索和推荐任务。

文本编码器

对于每个查询、点击文档和浏览文档，用文本编码器来学习它们的语义表示。以一个浏览文档B＝[w₁，w₂，...，w_M]的计算为例，整个文本编码器可以分为三个子层。第一层是词向量层，将词序列转换为词向量矩阵Emb^B＝[v₁，v₂，...，v_M]，其中v_i对应词w_i的低维词向量。此外，文本中的上下文也有助于帮助用户明确某个词的具体含义。比如，同一个词“Apple”在“Apple fruit”和“Apple company”的不同含义可以根据不同的上下文来进行区分。因此，设置一个词层面的transformer作为第二层，通过捕捉单词之间的交互来获得融入上下文的词向量C^B。

C^B＝Transformer_w(Emb^B).

第三层是词层面的注意力层。在一段文本中，不同的词对于表示这段文本的语义具有不同的重要程度。比如，在句子“symptoms of novel coronavirus pneumonia”中，单词“symptoms”传达了丰富的信息，而“of”则几乎不含有效信息。为了突出一段文本中重要的词，运用词级别的注意力机制赋予这些词更大的权重。设置一个可训练的向量q_w作为注意力机制中的query，所有词的权重α计算如下：

最后，浏览文档的上下文表示r^B是所有词向量的加权和。

查询Q和点击文档D的向量计算也同上。

会话编码器

在当前时刻t，用户会有一个目标行为——搜索或推荐用向量I_t来表示她的意图。如果用户主动输入了查询Q_t进行搜索，用该查询的文本表示向量

来初始化意图I_t；否则，用可训练的用户向量Emb^u来进行初始化。这个步骤通过一个选择门来实现，如下：

然后从用户的历史行为中挖掘信息来明确她的个性化意图。

根据现有工作，同一个会话中的行为通常在用户信息需求上表现出一致性。因此，用户在当前会话中的历史行为能够对推断她当前的意图提供丰富的上下文信息。在搜索和推荐同一场景下，用户在同一个会话中既有搜索行为也有浏览行为。分析这个异质性行为序列中的行为可能会有如下几种关联：(1)对于一个查询下的点击文档，这个文档满足了用户通过这个查询所表达的信息需求，这个查询和文档之间具有很强的相关性。(2)在用户浏览了一系列推荐文章后，他可能会被触发去主动搜索更多的相关信息；(3)查询是用户主动输入的，显式地表达了用户的兴趣偏好。基于查询和对应的点击文档，我们可以反过来明确用户在浏览文档是所关注的兴趣点。设计一个会话编码器来捕捉一个会话中行为之间存在的以上几种关联，并用这个会话上下文来增强意图表示。

首先，对于一个历史查询和对应的点击文档，捕捉他们之间的强相关性。点击文档反映了查询关键词中包含的用户意图，查询也突出了文档中的重要词汇。因此，采用co-attention结构来融合两者的交互信息从而计算他们的表示向量。以一个查询Q和若干对应的点击文档D₁，D₂，...为例，详细的计算过程如下。第一步，通过文本编码器中的词向量层和transformer层，得到查询和每个文档的上下文表示向量矩阵C^Q，

所有点击文档的向量拼接在一起，即/>

然后，计算查询和文档之间的交互矩阵A如下。

A＝tanh((C^Q)^TW_lC^D)

W_l是待训练的参数。查询和文档的注意力权重基于交互矩阵的特征计算如下：

W_q，W_d，W_hq，W_hd是参数，α^Q和α^D是查询和文档的注意力权重。计算查询和文档的表示向为上下文向量的加权和。

这两个向量被拼接到一起再通过一个全连接层得到一个历史搜索行为的表示向量r^S。对于一个在推荐系统中的浏览行为，它只对应一个浏览文档B。因此，浏览行为的表示就是由文本编码器计算的该文章的表示向量r^B。

计算得到当前会话中所有历史行为的表示，

捕捉搜索和浏览行为之间的关联，并将当前会话的上下文融入到用户的当前意图表示中。将短期历史H^s和用户的目标意图I^t拼接在一起经过一个会话层面的transformer进行交互。考虑到这些行为是序列化且异质的，为每个行为加上了位置和类别信息，行为类别包括搜索和浏览。最后一个位置的输出/>

表示融入了会话上下文之后的意图表示。

[H^s，I^t]_P，[H^s，I^t]_T是位置向量和类别向量。

表示取最后一个位置的输出。

历史编码器

通过会话编码器，利用短期历史澄清了用户当前的信息需求。但是对于没有短期历史的场景，仍然没有办法进行澄清。用户的长期行为历史反映了相对稳定的兴趣，也可以提供一些辅助信息。因此，进一步建模长期历史来明确用户意图

首先，用会话编码器来处理每个历史会话，捕捉异质性行为之间的关联，得到所有历史行为的上下文表示

将所有会话的子序列连接起来并拼接上目标行为得到/>

然后用一个历史层面的transformer模块处理长期的异质序列将历史信息融入到当前意图中。为了保留行为之间的序列信息，加入了每个行为的位置。最后，取最后一个位置的输出作为由长期历史增强得到的意图表示向量/>

参考一些新闻推荐模型，发现用户对文档的注意也会被其兴趣所影响。而且用户有时可能特意希望查找某个历史中出现过的文档。为了获得更好的候选文档表示，首先用文本编码器计算文档的向量

然后，按照上面相同的方式用长期历史来增强其表示，得到/>

和/>

也用于计算候选文档的个性化得分。

1.2.4统一任务框架

搜索和推荐任务有共同的目标——在特定时刻帮助用户获取需要的信息，两者主要的区别在于是否有一个明确的查询。将用户当前的意图表示为I^t，用输入的查询Q_t或者用户向量Emb^u进行初始化。统一的任务是基于个性化相关性得分来对候选文档进行排序，个性化相关性得分基于用户当前的意图I^t，查询Q_t和用户历史H计算得到，表示为p^unified(D_t|I_t，Q_t，H)。

通过文本编码器、会话编码器和历史编码器，得到用户当前意图和候选文档的表示，即

用余弦相似度计算他们两两之间的相似性。对于个性化搜索任务而言，候选文档和查询之间的相关性也非常重要。因此，考虑查询和文档之间的交互特征，利用基于交互的模型KNRM来计算交互得分为/>

此外，参考现有的个性化搜索模型抽取了一些额外的相关性特征F_q，d用于计算个性化得分。在推荐任务中计算候选文档得分时，查询和文档的交互的分以及相关性特征都为空。最后，候选文档的得分通过一个全连接层(MLP)聚合所有以上的得分得到：

p^unified(D_t|I_t，Q_t，H)＝MLP(f^unified)

对于搜索和推荐任务，我们都用这个方法来计算候选文档的个性化得分。

训练和优化

采用文档对的方式来训练模型。对于搜索和推荐任务，每个训练样本是一组文档，包括在一个列表中返回的一个正例文档和K个负例文档，表示为

对每一组文档，需要最大化整理文档的得分并最小化那些负例文档的得分。损失L计算如下：

p^unified(·)是p^unified(·|I_t，Q_t，H)的缩写。我们用Adam优化器来最小化模型损失。

然而，搜索任务和推荐任务的数据之间可能会存在一些差异，共同训练的一个模型很难在两个任务上都取得最好的表现。因此，本发明使用另一种训练算法。首先用两个任务的数据训练一个统一的搜索&推荐模型，然后为每个任务复制一份模型参数并且用对应的任务数据对其进行调整以适应该任务的数据分布情况。这样的话，得到的模型不仅能够受益于更多的训练数据，也能够更好地适应于特定的任务。

Claims

1.一种基于统一用户行为建模的搜索和推荐融合系统，其特征在于：通过四个组成模块构成的统一的搜索推荐模型，同时解决搜索和推荐两个独立的任务；所述四个组成模块包括：文本编码器，用于学习文档和查询的表示向量；会话编码器，用于建模当前会话中的用户行为序列来明确用户的信息需求；历史编码器，从长期历史中挖掘信息来增强用户意图的表示；统一任务框架，以统一的方式完成个性化搜索和推荐任务，即以相同的方式计算候选文档的个性化得分，并基于个性化得分的高低排序得到最终的文档排序结果；

所述文本编码器分为三层，第一层是词向量层，对于一个浏览文档B＝[w₁,w₂,…,w_M]，将词序列转换为词向量矩阵Emb^B＝[v₁,v₂,…,v_M]，其中v_M对应词w_M的低维词向量，第二层为词层面的transformer，通过捕捉单词之间的交互来获得融入上下文的词向量C^B：C^B＝Transformer_w(Emb^B)，第三层是词层面的注意力层；

所述会话编码器首先对搜索或推荐的意图进行初始化，并采用co-attention结构融合历史查询Q和对应的若干点击文档D_i的交互信息，然后用transformer结构来处理整个会话中的行为，计算各个行为融入了会话上下文之后的意图表示；

所述统一任务框架用余弦相似度计算所述文档的向量