CN113672793A

CN113672793A - 一种信息召回方法、装置、电子设备及存储介质

Info

Publication number: CN113672793A
Application number: CN202110982078.8A
Authority: CN
Inventors: 黄腾玉
Original assignee: Beijing IQIYI Science and Technology Co Ltd
Current assignee: Beijing IQIYI Science and Technology Co Ltd
Priority date: 2021-08-25
Filing date: 2021-08-25
Publication date: 2021-11-19

Abstract

本发明实施例提供了一种信息召回方法、装置、电子设备及存储介质，所述方法包括：获取目标用户的搜索行为序列，其中，所述搜索行为序列用于描述所述目标用户在目标时间区间内输入的搜索行为信息；获取所述搜索行为序列对应的聚类特征向量；将所述聚类特征向量作为索引，在预先建立的向量字典中确定所述聚类特征向量对应的目标行为信息，其中，所述向量字典用于对应存储搜索行为信息与聚类特征向量。由于采用目标用户的搜索行为序列作为召回依据，感受野广泛，由于聚类特征向量是对搜索行为信息对应的特征向量进行聚类得到的，能够标识向量类别相同的多个搜索行为信息所表示的用户的兴趣点，所以目标行为信息可以命中用户的多个兴趣点，多样性强。

Description

一种信息召回方法、装置、电子设备及存储介质

技术领域

本发明涉及信息搜索技术领域，特别是涉及一种信息召回方法、装置、电子设备及存储介质。

背景技术

对于具有搜索功能的网站来说，针对不同的用户进行精准的搜索信息推荐，吸引用户点击推荐的搜索信息进行搜索，可以有效地达到引流的目的。相关技术中的搜索信息的推荐方法可分为两个阶段：召回和排序。其中，排序阶段是对召回信息进行排序，最终根据排序结果确定出所要推荐给用户的搜索信息。

目前的召回方式主要分为搜索行为粒度的i2i(item to item，搜索行为信息-搜索行为信息)方式，和用户层次的u2i(user to item，用户-搜索行为信息)方式。在i2i方式中，获取用户的当前搜索行为信息，然后根据预先建立的搜索行为信息与召回信息之间的对应关系，确定召回信息。由于采用用户的当前搜索行为信息作为召回依据，感受野狭窄，召回的整体质量低，噪音多，通常会召回一些用户不感兴趣的内容。在u2i方式中，获取用户的搜索行为序列，然后基于搜索行为序列对应的一个特征向量以及预先建立的特征向量与召回信息之间的对应关系，确定召回信息。由于仅采用一个特征向量进行召回，所以召回信息通常只命中用户的一个兴趣点，多样性差，召回的整体质量也不高。

因此，需要一种可以实现高质量信息召回的方法。

发明内容

本发明实施例的目的在于提供一种信息召回方法、装置、电子设备及存储介质，以提高信息召回质量。具体技术方案如下：

第一方面，本发明实施例提供了一种信息召回方法，所述方法包括：

获取目标用户的搜索行为序列，其中，所述搜索行为序列用于描述所述目标用户在目标时间区间内输入的搜索行为信息；

获取所述搜索行为序列对应的聚类特征向量；

将所述聚类特征向量作为索引，在预先建立的向量字典中确定所述聚类特征向量对应的目标行为信息，其中，所述向量字典用于对应存储搜索行为信息与聚类特征向量。

第二方面，本发明实施例提供了一种信息召回装置，所述装置包括：

行为序列获取模块，用于获取目标用户的搜索行为序列，其中，所述搜索行为序列用于描述所述目标用户在目标时间区间内输入的搜索行为信息；

特征向量确定模块，用于获取所述搜索行为序列对应的聚类特征向量；

行为信息召回模块，用于将所述聚类特征向量作为索引，在预先建立的向量字典中确定所述聚类特征向量对应的目标行为信息，其中，所述向量字典用于对应存储搜索行为信息与聚类特征向量。

第三方面，本发明实施例提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现上述第一方面任一所述的信息召回方法步骤。

第四方面，本发明实施例提供了一种计算机可读缓存介质，所述计算机可读缓存介质内缓存有计算机程序，所述计算机程序被处理器执行时实现上述第一方面任一所述的信息召回方法步骤。

本发明实施例提供的方案中，电子设备可以获取目标用户的搜索行为序列，其中，搜索行为序列用于描述目标用户在目标时间区间内输入的搜索行为信息；获取搜索行为序列对应的聚类特征向量；将聚类特征向量作为索引，在预先建立的向量字典中确定聚类特征向量对应的目标行为信息，其中，向量字典用于对应存储行为信息与聚类特征向量。

由于采用目标用户的搜索行为序列作为召回依据，搜索行为序列包括目标用户在目标时间区间内输入的搜索行为信息，即不仅包括目标用户当前输入的搜索行为信息，还包括目标用户在当前时刻之前预设时间段内输入的搜索行为信息，所以与目前的i2i方式中仅根据用户的当前搜索行为信息作为召回依据相比，感受野广泛。同时，由于聚类特征向量是对搜索行为信息对应的特征向量进行聚类得到的，能够标识向量类别相同的多个搜索行为信息所表示的用户的兴趣点，进而，根据每个聚类特征向量确定目标用户对应的目标行为信息，而不是像目前的u2i方式中仅采用一个特征向量确定目标行为信息，所以目标行为信息所表示的兴趣点不会只命中目标用户的一个兴趣点，而可以命中目标用户的多个兴趣点，多样性强，准确率高，因此召回的整体质量得到提高。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为本发明实施例所提供的一种信息召回方法的流程图；

图2为基于图1所示实施例的聚类特征向量确定方式的一种具体流程图；

图3为图1所示实施例中步骤S103的一种具体流程图；

图4为基于图1所示实施例的搜索结果展示方式的一种流程图；

图5为本发明实施例所提供的信息召回方法的一种流程示意图；

图6为本发明实施例所提供的一种信息召回装置的结构示意图；

图7为图6所示实施例中特征向量确定模块620的一种具体结构示意图；

图8为本发明实施例所提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行描述。

为了能够提高信息召回质量，本发明实施例提供了一种信息召回方法、装置、电子设备、计算机可读存储介质以及计算机程序产品。下面对本发明实施例所提供的一种信息召回方法进行介绍。

本发明实施例所提供的一种信息召回方法可以应用于任意需要进行信息召回的电子设备，例如可以为服务器、电脑、处理器等电子设备，在此不做具体限定。

如图1所示，一种信息召回方法，所述方法包括：

S101，获取目标用户的搜索行为序列；

其中，所述搜索行为序列用于描述所述目标用户在目标时间区间内输入的搜索行为信息。

S102，获取所述搜索行为序列对应的聚类特征向量；

S103，将所述聚类特征向量作为索引，在预先建立的向量字典中确定所述聚类特征向量对应的目标行为信息。

其中，所述向量字典用于对应存储搜索行为信息与聚类特征向量。

可见，本发明实施例提供的方案中，电子设备可以获取目标用户的搜索行为序列，其中，搜索行为序列用于描述目标用户在目标时间区间内输入的搜索行为信息；获取搜索行为序列对应的聚类特征向量；将聚类特征向量作为索引，在预先建立的向量字典中确定聚类特征向量对应的目标行为信息，其中，向量字典用于对应存储行为信息与聚类特征向量。由于采用目标用户的搜索行为序列作为召回依据，搜索行为序列包括目标用户在目标时间区间内输入的搜索行为信息，即不仅包括目标用户当前输入的搜索行为信息，还包括目标用户在当前时刻之前预设时间段内输入的搜索行为信息，所以与目前的i2i方式中仅根据用户的当前搜索行为信息作为召回依据相比，感受野广泛。同时，由于聚类特征向量是对搜索行为信息对应的特征向量进行聚类得到的，能够标识向量类别相同的多个搜索行为信息所表示的用户的兴趣点，进而，根据每个聚类特征向量确定目标用户对应的目标行为信息，而不是像目前的u2i方式中仅采用一个特征向量确定目标行为信息，所以目标行为信息所表示的兴趣点不会只命中目标用户的一个兴趣点，而可以命中目标用户的多个兴趣点，多样性强，准确率高，因此召回的整体质量得到提高。

用户在使用网站所提供的搜索功能进行信息搜索时，网站服务器可以在搜索页面向用户推荐相关的行为信息，吸引用户基于推荐的行为信息进行搜索，进而向用户展示搜索结果，这样可以满足用户的搜索需求，同时可以有效地达到引流的目的。

电子设备将行为信息推荐给用户时，一般是基于用户输入的搜索行为信息，推荐与用户输入的搜索行为信息相关的行为信息，那么，在上述步骤S101中，电子设备可以获取目标用户的搜索行为序列。其中，搜索行为序列用于描述目标用户在目标时间区间内输入的搜索行为信息，搜索行为信息即为用户输入的能够表示其所想要搜索的内容的信息，包括但不限于词语、短语、语句等，可以为视频搜索信息、商品搜索信息或新闻搜索信息等中的至少一种。

具体来说，搜索行为序列可以为目标用户在目标时间区间内输入的搜索行为信息所组成的序列，其可以标识用户在目标时间区间内的喜好倾向。搜索行为信息具体可以为词语、短语或者语句中的任意一种，在此不做具体限定。目标时间区间可以根据实际情况进行设置，例如，可以为当前时刻之前的一个小时、一天、一周等，在此不做具体限定。

例如，目标用户在使用网站提供的搜索功能进行信息搜索时，在最近两天内输入的想要搜索的搜索行为信息为“电视剧A”、“演员B”、“综艺节目C”、“明星D”，电子设备便可以获取到该目标用户的搜索行为序列：“电视剧A”-演员B”-“综艺节目C”-“明星D”。

电子设备获取到目标用户的搜索行为序列后，便可以执行上述步骤S102，即获取所述搜索行为序列对应的聚类特征向量。其中，聚类特征向量可以为对搜索行为序列包括的搜索行为信息的特征向量进行聚类得到的。

作为一种实施方式，电子设备可以确定搜索行为序列中各搜索行为信息对应的特征向量，进而对特征向量进行聚类，得到各向量类别对应的聚类特征向量。

在一种实施方式中，电子设备可以采用item2vec模型等确定每个搜索行为信息对应的特征向量，当然也可以采用其他能够确定搜索行为信息对应的特征向量的方式，在此不做具体限定。搜索行为信息对应的特征向量可以标识该搜索行为信息的特点，也就可以表示该搜索行为信息所表示的用户的兴趣点。

为了能够充分考虑目标用户的搜索行为序列所能反映出的目标用户各个方面的喜好，即兴趣点，确定了每个搜索行为信息对应的特征向量后，电子设备可以对特征向量进行聚类，确定每个聚类中心对应的特征向量，作为聚类特征向量。

电子设备可以采用kmeans聚类算法或启发式聚类算法等，对特征向量进行聚类，进而确定每个聚类中心对应的聚类特征向量。经过聚类处理后，可以将较为相似的特征向量划分为一个向量类别，从而得到能够体现用户的不同的喜好的聚类特征向量。每个聚类特征向量即为目标用户所喜好的该向量类别的搜索行为信息所对应的特征向量。也就是说，聚类特征向量可以标识向量类别相同的多个搜索行为信息所表示的用户的兴趣点。

例如，如果上述各个特征向量对应的搜索行为信息分别为体育、娱乐、影视相关的搜索行为信息，电子设备对上述各个特征向量进行聚类，便可以得到三个向量类别，该三个向量类别分别对应体育、娱乐、影视，聚类中心对应的聚类特征向量分别为特征向量a、特征向量b和特征向量c。那么特征向量a即为用户所喜好的体育类别的搜索行为信息所对应的特征向量，特征向量b即为用户所喜好的娱乐类别的搜索行为信息所对应的特征向量，特征向量c即为用户所喜好的影视类别的搜索行为信息所对应的特征向量。

得到上述聚类特征向量后，电子设备可以执行上述步骤S103，即将聚类特征向量作为索引，在预先建立的向量字典中确定聚类特征向量对应的目标行为信息。其中，向量字典用于对应存储搜索行为信息与聚类特征向量。也就是说，向量字典中预先存储有聚类特征向量与搜索行为信息之间的对应关系。

为了方便确定目标行为信息，电子设备可以预先建立向量字典，其中，向量字典中存储的搜索行为信息可以为预先获取的各个用户的历史行为序列中的搜索行为信息，在此不做具体限定。对于聚类特征向量与搜索行为信息之间的对应关系的建立方式，可以采用任何能够得到二者之间的对应关系的方式，为了方案清晰和逻辑清楚，后续将会进行举例介绍。

在一种实施方式中，针对每个聚类特征向量，电子设备可以从预先建立向量字典中，查找与该聚类特征向量相同的聚类特征向量，进而将该相同的聚类特征向量所对应的搜索行为信息，确定为该聚类特征向量对应的目标行为信息。

在另一种实施方式中，针对每个聚类特征向量，电子设备可以从预先建立向量字典中，查找与该聚类特征向量的相似度达到预设相似度的聚类特征向量，进而将该相似度达到预设相似度的聚类特征向量所对应的搜索行为信息，确定为该聚类特征向量对应的目标行为信息。

其中，相似度可以采用特征向量之间的距离来表示，例如，可以为余弦距离、欧氏距离、曼哈顿距离、切比雪夫距离等中的一种或多种，在此不做具体限定。上述预设相似度可以根据实际召回需求而自定义设置，例如，可以为80％、85％、95％等，在此不做具体限定。

举例来说，假设电子设备在上述步骤S103中，确定分别对应体育、娱乐、影视向量类别的聚类特征向量分别为特征向量a、特征向量b和特征向量c，那么电子设备可以基于预先建立的向量字典，确定特征向量a对应的搜索行为信息、特征向量b对应的搜索行为信息以及特征向量c对应的搜索行为信息，将所有搜索行为信息作为目标行为信息。这样，得到的目标行为信息中便包括了体育、娱乐以及影视三个方面的行为信息，多样性强，准确率高。

本发明实施例提供了一种介于i2i方式和u2i方式之间的对item聚类后召回的信息召回方式，可以称为c2i(cluster to item，类别-搜索行为信息)方式，本发明实施例所提供的c2i方式中，由于采用目标用户的搜索行为序列作为召回依据，搜索行为序列包括目标用户在目标时间区间内输入的搜索行为信息，即不仅包括目标用户当前输入的搜索行为信息，还包括目标用户在当前时刻之前预设时间段内输入的搜索行为信息，所以与目前的i2i方式中仅根据用户的当前搜索行为信息作为召回依据相比，感受野广泛。

同时，由于聚类特征向量是对搜索行为信息对应的特征向量进行聚类得到的，能够标识向量类别相同的多个搜索行为信息所表示的用户的兴趣点，进而，根据每个聚类特征向量确定目标用户对应的目标行为信息，而不是像目前的u2i方式中仅采用一个特征向量确定目标行为信息，所以目标行为信息所表示的兴趣点不会只命中目标用户的一个兴趣点，而可以命中目标用户的多个兴趣点，多样性强，准确率高，因此召回的整体质量得到提高。本发明实施例提供的c2i方式吸取了i2i方式的覆盖面广的优点，也融合了u2i方式的感受野宽广的优点，因此准确率和覆盖率皆佳。将本发明实施例提供的c2i方式应用于推荐系统或广告系统中，可以改善推荐系统和广告系统的效果，提升推荐系统和广告系统的用户体验，可以实现收益和体验的提升。

作为本发明实施例的一种实施方式，如图2所示，上述对所述特征向量进行聚类，得到各向量类别对应的聚类特征向量的步骤，可以包括：

S201，基于所述特征向量之间的距离，将所述特征向量划分为多个向量类别；

由于向量之间的距离可以表示向量的相似程度，而相似程度较高的向量可以划分为一个向量类别，所以电子设备可以基于特征向量之间的距离，将特征向量划分为多个向量类别。

在一种实施方式中，电子设备可以从所有特征向量中随机选择N个作为初始聚类中心，然后计算剩余特征向量与每个初始聚类中心之间的距离，将剩余特征向量划分至距离最近的初始聚类中心所属的向量类别。其中，N为正整数，具体数值可以根据特征向量的数量等因素确定，例如，可以为5、10、17等，在此不做具体限定。

划分完成后计算每个向量类别所包括的特征向量的均值，作为该向量类别的新的聚类中心，再计算每个特征向量与每个聚类中心之间的距离，将特征向量划分至距离最近的聚类中心所属的向量类别。划分完成后再计算每个向量类别所包括的特征向量的均值作为该向量类别的新的聚类中心，重复执行上述过程，直到每个特征向量与所属向量类别的聚类中心之间的距离均是最小的，得到多个向量类别。

S202，计算每个向量类别所包括的特征向量的均值，作为该向量类别对应的聚类特征向量。

将特征向量划分得到的每个向量类别一般包括多个特征向量，该多个特征向量之间的相似度较高，那么每个向量类别所包括的特征向量的均值便可以表征该向量类别所包括的特征向量的平均水平，所以电子设备可以计算每个向量类别所包括的特征向量的均值，作为该向量类别的聚类特征向量。该聚类特征向量便可以准确标识该向量类别的特征向量的均值，进而根据该聚类特征向量召回的目标行为信息便可以准确地命中用户的该向量类别对应的兴趣点。

例如，电子设备确定的聚类特征向量如下表所示：

其中，聚类特征向量1即为特征向量t1、特征向量t3、特征向量t4、特征向量t9以及特征向量t13的均值。同理的，聚类特征向量2即为特征向量t5、特征向量t6、特征向量t15以及特征向量t8的均值；聚类特征向量3即为特征向量t2、特征向量t7、特征向量t11、特征向量t14以及特征向量t10的均值；聚类特征向量n即为特征向量tn、特征向量t17、特征向量t18、特征向量t20以及特征向量t12的均值。得到聚类特征向量1-聚类特征向量n后，电子设备便可以将该聚类特征向量作为索引，在预先建立的向量字典中确定聚类特征向量对应的目标行为信息1-目标行为信息n，作为召回结果。其中，n为正整数。

可见，在本实施例中，电子设备可以基于特征向量之间的距离，将特征向量划分为多个向量类别，进而计算每个向量类别所包括的特征向量的均值，作为该向量类别对应的聚类特征向量。这样，可以获得准确聚类特征向量，每个聚类特征向量均能准确地代表对应的向量类别所包括的特征向量的平均水平，因此后续基于聚类特征向量可以得到准确的目标行为信息，提高信息召回质量。

作为本发明实施例的一种实施方式，上述对所述特征向量进行聚类，得到各向量类别对应的聚类特征向量的步骤，可以包括：

将所述特征向量输入预先训练完成的聚类模型，得到所述聚类模型输出的各向量类别对应的聚类特征向量。

为了实现对特征向量进行聚类，可以预先训练用于对特征向量进行聚类的聚类模型，该聚类模型可以为卷积神经网络、循环神经网络等深度学习模型，在此不做具体限定。

在对该聚类模型进行训练时，可以获取特征向量样本并标记其对应的聚类特征向量，将特征向量样本输入初始聚类模型中，初始聚类模型可以根据特征向量样本之间的相似度确定各个特征向量样本所属的向量类别，进而将每个向量类别所包括的特征向量的均值作为预测聚类特征向量，并输出该预测聚类特征向量。

针对每个特征向量样本，可以根据其对应的标记的聚类特征向量与预测聚类特征向量之间的差异调整初始聚类模型的参数，直到初始聚类模型收敛，便可以得到上述聚类模型。这样，聚类模型也就学习到了特征向量与聚类特征向量之间的对应关系，进而在将上述特征向量输入该聚类模型后，聚类模型便可以输出的各向量类别对应的聚类特征向量。

可见，在本实施例中，电子设备可以将特征向量输入预先训练完成的聚类模型，得到聚类模型输出的各向量类别对应的聚类特征向量。通过该方式也可以获得准确聚类特征向量。

作为本发明实施例的一种实施方式，在上述任一实施例所述的方法的基础上，还可以包括：

获取多个样本用户的历史行为序列；利用预先训练的预设模型，确定所述向量字典。

在一种实施方式中，电子设备可以离线收集多个样本用户的历史行为序列，进而利用预先训练的预设模型确定向量字典。例如，可以利用fasttext等工具训练得到行为item-embding字典(向量字典)。其中，对于利用fasttext等工具训练得到行为item-embding字典的方式在此不做具体限定和说明，只要可以得到item-embding字典即可。

样本用户的历史行为序列包括多个历史搜索行为信息，其中，任意一个历史行为序列用于描述样本用户在历史时间区间内输入的搜索行为信息。也就是说，任意一个历史行为序列包括样本用户在历史时间区间内输入的多个历史搜索行为信息。其中，历史时间区间可以实际需求设置，例如，可以为过去的一天、一周、一个月等。电子设备建立的向量字典可以包括每个搜索行为信息与聚类特征向量之间的一一对应关系。例如，可以如下表所示：

在一种实施方式中，上述预设模型可以包括第一模型或第二模型。相应的，上述利用预先训练的预设模型，确定所述向量字典的步骤，可以包括一下两种方式中的任一种：

第一种方式：利用所述第一模型处理各历史行为序列，得到各搜索行为信息对应的聚类特征向量；建立所述搜索行为信息与所述聚类特征向量之间的对应关系，得到所述向量字典。

电子设备可以利用第一模型对各历史行为序列进行处理，进而得到历史行为序列中的各搜索行为信息对应的聚类特征向量。其中，第一模型用于基于输入的搜索行为信息的特征确定输出的聚类特征向量。

具体来说，电子设备可以将历史行为序列中的各搜索行为信息输入第一模型，第一模型便可以提取各搜索行为信息的特征，进而确定能够标识该特征的特征向量，并将该特征向量作为该搜索行为信息对应的聚类特征向量进行输出。

电子设备便可以获取到各搜索行为信息对应的聚类特征向量，进而，便可以建立搜索行为信息与聚类特征向量之间的对应关系，也就可以得到向量字典。

第二种方式：利用所述第二模型处理各历史行为序列，得到所述向量字典。

电子设备可以利用第二模型对各历史行为序列进行处理，进而得到向量字典，其中，第二模型可以基于输入的搜索行为信息的特征确定向量字典。具体来说，电子设备可以将历史行为序列中的各搜索行为信息输入第二模型，第二模型便可以提取各搜索行为信息的特征，进而确定能够标识该特征的特征向量。

第二模型可以将该特征向量作为该搜索行为信息对应的聚类特征向量，进而建立搜索行为信息与聚类特征向量之间的对应关系，得到向量字典，并将该向量字典进行输出。电子设备也就可以获取到该向量字典。

可见，在本实施例中，电子设备可以利用第一模型或第二模型得到上述向量字典，无论采用第一模型还是第二模型，均可以确定准确的向量字典，进而保证后续可以得到准确的目标行为信息，保证行为信息召回结果的准确性。

作为本发明实施例的一种实施方式，在上述通过预设模型实现本方案的实施例基础上，还可以包括：

基于所述搜索行为信息更新预设模型。

其中，预设模型可以包括上述第一模型和/或上述第二模型。为了保证向量字典的准确，电子设备可以基于上述搜索行为信息更新第一模型和/或第二模型。电子设备可以定时更新预设模型，也可以在获取到更新指令时更新预设模型，这都是合理的。

在对第一模型进行训练的过程中，可以将搜索行为信息样本输入第一初始模型中，第一初始模型可以提取搜索行为信息样本的特征，确定搜索行为信息样本对应的预测聚类特征向量，进而基于搜索行为信息样本对应的实际聚类特征向量与该预测聚类特征向量之间的差异调整第一初始模型的参数，直到第一初始模型收敛，得到上述第一模型。更新第一模型的方式与训练第一模型的方式相同，即基于上述搜索行为信息更新搜索行为信息样本，进而基于更新后的搜索行为信息样本更新第一模型。

在对第二模型进行训练的过程中，可以将搜索行为信息样本输入第二初始模型中，第二初始模型可以提取搜索行为信息样本的特征，确定搜索行为信息样本对应的预测聚类特征向量，进而基于搜索行为信息样本对应的预测聚类特征向量建立向量字典。再根据向量字典与基于实际聚类特征向量建立的向量字典之间的差异调整第二初始模型的参数，直到第二初始模型收敛，得到上述第二模型。更新第二模型的方式与训练第二模型的方式相同，即基于上述搜索行为信息更新搜索行为信息样本，进而基于更新后的搜索行为信息样本更新第二模型。

可见，在本实施例中，电子设备可以基于搜索行为信息更新预设模型，可以保证向量字典的准确，进而保证目标行为信息的准确性。

作为本发明实施例的一种实施方式，如图3所示，上述将所述聚类特征向量作为索引，在预先建立的向量字典中确定所述聚类特征向量对应的目标行为信息的步骤，可以包括：

S301，针对任意一个所述聚类特征向量，确定该聚类特征向量与所述向量字典中各特征向量之间的距离。

为了准确地确定向量字典中与聚类特征向量最为相似的特征向量，针对任意一个聚类特征向量，电子设备可以计算该聚类特征向量与向量字典中每个特征向量之间的距离。

其中，聚类特征向量与向量字典中每个特征向量之间的距离可以为余弦距离、欧氏距离、曼哈顿距离、切比雪夫距离等中的一种或多种，在此不做具体限定。

S302，将对应的距离不小于预设阈值的特征向量所对应的行为信息，确定为所述目标用户对应的目标行为信息。

与聚类特征向量之间的距离越近的特征向量，说明该特征向量与聚类特征向量之间的相似度越高，所以电子设备可以将对应的距离不大于预设阈值的特征向量所对应的行为信息，确定为目标行为信息。其中，预设阈值可以根据目标行为信息的数量、精确度等要求而自定义确定，在此不做具体限定。

与聚类特征向量之间的距离不大于预设阈值的特征向量，其与聚类特征向量之间的相似度较高，那么其所对应的行为信息即为与用户输入的搜索行为信息较为相似的信息，可以准确命中用户的兴趣点。

例如，聚类特征向量共有3个，分别为聚类特征向量P1、聚类特征向量P2以及聚类特征向量P3，那么电子设备可以计算聚类特征向量P1-聚类特征向量P3与向量字典所包括的特征向量p1-特征向量p10之间的距离，进而将对应的距离不大于预设阈值的特征向量所对应的行为信息，确定为目标用户对应的目标行为信息。如果特征向量p1、特征向量p2以及特征向量p7对应的距离不大于预设阈值，那么特征向量p1、特征向量p2以及特征向量p7对应的行为信息即为目标行为信息。

可见，在本实施例中，针对任意一个聚类特征向量，电子设备可以确定该聚类特征向量与向量字典中各特征向量之间的距离，进而将对应的距离不大于预设阈值的特征向量所对应的行为信息，确定为目标用户对应的目标行为信息。这样，电子设备可以确定准确的目标行为信息，提高信息召回的准确性。

作为本发明实施例的一种实施方式，上述搜索行为信息可以包括但不限于：视频搜索信息、商品搜索信息、新闻搜索信息中的至少一种。相应的，上述目标行为信息可以包括但不限于：视频搜索信息、商品搜索信息或新闻搜索信息中的至少一种。

本发明实施例所提供的信息召回方法可以应用于视频信息、商品信息、新闻信息的搜索场景，目标用户可以输入的搜索行为信息可以为视频搜索信息、商品搜索信息、新闻搜索信息中的至少一种，用于进行某视频的搜索、某商品的搜索或某新闻的搜索。

那么电子设备执行本发明实施例所提供的信息召回方法便可以确定目标行为信息，目标行为信息的具体类型与目标用户输入的搜索行为信息相对应，也就是说，如果目标用户输入的搜索行为信息为视频搜索信息，那么目标行为信息即为视频搜索信息；如果目标用户输入的搜索行为信息为商品搜索信息，那么目标行为信息即为商品搜索信息；如果目标用户输入的搜索行为信息为新闻搜索信息，那么目标行为信息即为新闻搜索信息。

作为本发明实施例的一种实施方式，如图4所示，在上述任一实施例所述的方法基础上，确定目标行为信息之后，还可以包括：

S401，基于所述目标行为信息进行搜索，得到目标搜索结果。

作为一种实施方式，确定了目标行为信息后，电子设备便可以基于目标行为信息进行搜索，得到目标搜索结果。例如，目标行为信息为视频搜索信息，那么电子设备便可以基于该视频搜索信息进行搜索，进而搜索到相关的视频，作为目标搜索结果。

作为另一种实施方式，在确定了目标行为信息后，由于目标行为信息的数量一般较多，所以为了从目标行为信息中确定最为适合向用户推荐进行搜索的目标行为信息，电子设备可以对上述目标行为信息进行排序，从而得到排序结果。

在一种实施方式中，电子设备可以计算每个目标行为信息对应的特征向量与目标用户当前输入的搜索行为信息所对应的特征向量之间的相似度，进而根据相似度从高到低的顺序，或者从低到高的顺序对目标行为信息进行排序，得到排序结果。

在另一种实施方式中，电子设备可以将目标行为信息输入预先训练完成的排序模型，获得排序模型输出的排序结果。其中，排序模型可以为预先训练得到的能够对目标行为信息进行排序的深度学习模型，可以为卷积神经网络、循环神经网络等，只要可以基于一定规则对目标行为信息进行排序即可，在此不做具体限定。

由于目标行为信息可能包括多个类别的行为信息，所以为了满足用户的多个兴趣点，保证推荐信息的多样性，电子设备可以分别对每种类别的目标行为信息进行排序，得到对应的排序结果。

得到上述排序结果后，电子设备便可以基于该排序结果向用户展示搜索信息。作为一种实施方式，电子设备可以根据排序结果，选择与目标用户当前输入的搜索行为信息的相似度较高的预设数量个目标行为信息，作为向用户展示的搜索信息。其中，预设数量可以根据实际推荐需求设定，例如，可以为2、3、5等，在此不做具体限定。

针对电子设备分别对每种类别的目标行为信息进行排序，得到对应的排序结果的情况，电子设备可以根据每种类别的目标行为信息对应的排序结果，从每种类别的目标行为信息中选择一定数量的目标行为信息作为向用户展示的搜索信息。目标用户可以选择其中一个目标行为信息作为所要搜索的信息，电子设备便可以基于该所要搜索的信息进行搜索，得到目标搜索结果。

S402，向所述目标用户展示所述目标搜索结果。

得到上述目标搜索结果后，电子设备便可以向目标用户展示该目标搜索结果，以供目标用户查看目标搜索结果。由于目标行为信息包括目标用户感兴趣的多个类别的行为信息，因此，基于目标行为信息得到目标搜索结果可以命中目标用户的多个兴趣点。

可见，在本实施例中，电子设备可以基于目标行为信息进行搜索，得到目标搜索结果，进而向目标用户展示目标搜索结果。由于目标行为信息可以准确命中用户的兴趣点，多样性强，所以基于目标行为信息得到的目标搜索结果也可以命中用户的兴趣点，保证多样性。

下面结合图5对本发明实施例所提供的信息召回方法进行举例介绍。为了在目标用户在线搜索信息时能够为目标用户提供准确多样性的搜索结果，电子设备可以离线收集样本用户的历史行为序列510，历史行为序列510包括多个搜索行为信息item。离线训练得到item-embding字典520，可以采用fasttext训练得到item-embding字典520。其中，item-embding字典520包括行为信息与聚类特征向量之间的对应关系，具体为item1-embding1、item2-embding2等。进而电子设备可以基于item-embding字典520构建向量索引530，向量索引530包括各embding与item之间的对应关系，具体可以采用faiss等向量索引构建工具来构建向量索引530，在此不做具体限定。

在线召回过程中，电子设备可以实时获取目标用户的搜索行为序列540，其中，搜索行为序列540包括多个搜索行为信息item。接下来电子设备可以查询item-embding字典520，确定每个搜索行为信息对应的特征向量550，进而，可以采用Kmesns等算法对特征向量550进行聚类，得到聚类特征向量，图5中所示的类1的embd即为向量类别为类别1的类别中心对应的聚类特征向量，类2的embd即为向量类别为类别2的类别中心对应的聚类特征向量。图5中仅示出了2个向量类别作为示例，并不代表本发明实施例提供的信息召回方法中仅存在2个向量类别，并不能构成对本发明实施例所提供的信息召回方法中对特征向量进行聚类得到的向量类别的数量的限定。

得到每个聚类中心对应的聚类特征向量后，电子设备便可以查询上述向量索引530，从而得到目标行为信息，即召回的item 560，从而实现行为信息的召回。由于基于向量字典确定目标行为信息的具体实现方式已在上述实施例中进行介绍，所以在此不再赘述。

相应于上述信息召回方法，本发明实施例还提供了一种信息召回装置。下面对本发明实施例所提供的一种信息召回装置进行介绍。

如图6所示，一种信息召回装置，所述装置包括：

行为序列获取模块610，用于获取目标用户的搜索行为序列；

特征向量确定模块620，用于获取所述搜索行为序列对应的聚类特征向量；

行为信息召回模块630，用于将所述聚类特征向量作为索引，在预先建立的向量字典中确定所述聚类特征向量对应的目标行为信息。

作为本发明实施例的一种实施方式，如图7所示，上述特征向量确定模块620，可以包括：

特征向量确定单元621，用于确定所述搜索行为序列中各搜索行为信息对应的特征向量；

其中，所述特征向量用于表示对应的搜索行为信息所表示的用户的兴趣点。

特征向量聚类单元622，用于对所述特征向量进行聚类，得到各向量类别对应的聚类特征向量。

其中，所述聚类特征向量用于标识向量类别相同的多个搜索行为信息所表示的用户的兴趣点。

作为本发明实施例的一种实施方式，上述装置还可以包括：

历史行为序列获取模块，用于获取多个样本用户的历史行为序列；

其中，任意一个所述历史行为序列用于描述所述样本用户在历史时间区间内输入的搜索行为信息。

向量字典构建模块，用于利用预先训练的预设模型，确定所述向量字典。

作为本发明实施例的一种实施方式，上述预设模型可以包括第一模型或第二模型；

上述向量字典构建模块可以包括：

第一构建单元，用于利用所述第一模型处理各历史行为序列，得到各搜索行为信息对应的聚类特征向量；建立所述搜索行为信息与所述聚类特征向量之间的对应关系，得到所述向量字典；或，

第二构建单元，用于利用所述第二模型处理各历史行为序列，得到所述向量字典。

作为本发明实施例的一种实施方式，上述装置还可以包括：

模型更新模块，用于基于所述搜索行为信息更新预设模型，所述预设模型包括：第一模型和/或第二模型。

其中，所述第一模型用于基于输入的搜索行为信息的特征确定输出的聚类特征向量，所述第二模型用于基于输入的搜索行为信息的特征确定向量字典。

作为本发明实施例的一种实施方式，上述行为信息召回模块可以包括：

距离计算单元，用于针对任意一个所述聚类特征向量，确定该聚类特征向量与所述向量字典中各特征向量之间的距离；

信息召回单元，用于将对应的距离不大于预设阈值的特征向量所对应的行为信息，确定为所述目标用户对应的目标行为信息。

作为本发明实施例的一种实施方式，上述搜索行为信息可以包括：视频搜索信息、商品搜索信息、新闻搜索信息中的至少一种；

上述目标行为信息可以包括：视频搜索信息、商品搜索信息或新闻搜索信息中的至少一种。

作为本发明实施例的一种实施方式，上述装置还可以包括：

信息搜索模块，用于基于所述目标行为信息进行搜索，得到目标搜索结果；

结果展示模块，用于向所述目标用户展示所述目标搜索结果。

本发明实施例还提供了一种电子设备，如图8所示，包括处理器801、通信接口802、存储器803和通信总线804，其中，处理器801，通信接口802，存储器803通过通信总线804完成相互间的通信，

存储器803，用于存放计算机程序；

处理器801，用于执行存储器803上所存放的程序时，实现上述任一实施例所述的信息召回方法步骤。

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，简称RAM)，也可以包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的缓存装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(Digital Signal Processing，简称DSP)、专用集成电路(Application SpecificIntegrated Circuit，简称ASIC)、现场可编程门阵列(Field－Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中，还提供了一种计算机可读缓存介质，该计算机可读缓存介质中缓存有指令，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的信息召回方法步骤。

可见，本发明实施例提供的方案中，计算机可读缓存介质中缓存的指令在计算机上运行时可以获取目标用户的搜索行为序列，其中，搜索行为序列用于描述目标用户在目标时间区间内输入的搜索行为信息；获取搜索行为序列对应的聚类特征向量；将聚类特征向量作为索引，在预先建立的向量字典中确定聚类特征向量对应的目标行为信息，其中，向量字典用于对应存储行为信息与聚类特征向量。由于采用目标用户的搜索行为序列作为召回依据，搜索行为序列包括目标用户在目标时间区间内输入的搜索行为信息，即不仅包括目标用户当前输入的搜索行为信息，还包括目标用户在当前时刻之前预设时间段内输入的搜索行为信息，所以与目前的i2i方式中仅根据用户的当前搜索行为信息作为召回依据相比，感受野广泛。同时，由于聚类特征向量是对搜索行为信息对应的特征向量进行聚类得到的，能够标识向量类别相同的多个搜索行为信息所表示的用户的兴趣点，进而，根据每个聚类特征向量确定目标用户对应的目标行为信息，而不是像目前的u2i方式中仅采用一个特征向量确定目标行为信息，所以目标行为信息所表示的兴趣点不会只命中目标用户的一个兴趣点，而可以命中目标用户的多个兴趣点，多样性强，准确率高，因此召回的整体质量得到提高。

在本发明提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的信息召回方法步骤。

可见，本发明实施例提供的方案中，计算机程序产品在计算机上运行时可以获取目标用户的搜索行为序列，其中，搜索行为序列用于描述目标用户在目标时间区间内输入的搜索行为信息；获取搜索行为序列对应的聚类特征向量；将聚类特征向量作为索引，在预先建立的向量字典中确定聚类特征向量对应的目标行为信息，其中，向量字典用于对应存储行为信息与聚类特征向量。由于采用目标用户的搜索行为序列作为召回依据，搜索行为序列包括目标用户在目标时间区间内输入的搜索行为信息，即不仅包括目标用户当前输入的搜索行为信息，还包括目标用户在当前时刻之前预设时间段内输入的搜索行为信息，所以与目前的i2i方式中仅根据用户的当前搜索行为信息作为召回依据相比，感受野广泛。同时，由于聚类特征向量是对搜索行为信息对应的特征向量进行聚类得到的，能够标识向量类别相同的多个搜索行为信息所表示的用户的兴趣点，进而，根据每个聚类特征向量确定目标用户对应的目标行为信息，而不是像目前的u2i方式中仅采用一个特征向量确定目标行为信息，所以目标行为信息所表示的兴趣点不会只命中目标用户的一个兴趣点，而可以命中目标用户的多个兴趣点，多样性强，准确率高，因此召回的整体质量得到提高。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以缓存在计算机可读缓存介质中，或者从一个计算机可读缓存介质向另一个计算机可读缓存介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读缓存介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据缓存设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置、电子设备、计算机可读存储介质以及计算机程序产品实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种信息召回方法，其特征在于，所述方法包括：

获取所述搜索行为序列对应的聚类特征向量；

2.如权利要求1所述的方法，其特征在于，所述获取所述搜索行为序列对应的聚类特征向量的步骤，包括：

确定所述搜索行为序列中各搜索行为信息对应的特征向量，其中，所述特征向量用于表示对应的搜索行为信息所表示的用户的兴趣点；

对所述特征向量进行聚类，得到各向量类别对应的聚类特征向量，其中，所述聚类特征向量用于标识向量类别相同的多个搜索行为信息所表示的用户的兴趣点。

3.如权利要求1所述的方法，其特征在于，所述方法还包括：

获取多个样本用户的历史行为序列，其中，任意一个所述历史行为序列用于描述所述样本用户在历史时间区间内输入的搜索行为信息；

利用预先训练的预设模型，确定所述向量字典。

4.如权利要求3所述的方法，其特征在于，所述预设模型包括第一模型或第二模型；

所述利用预先训练的预设模型，确定所述向量字典的步骤，包括：

利用所述第一模型处理各历史行为序列，得到各搜索行为信息对应的聚类特征向量；建立所述搜索行为信息与所述聚类特征向量之间的对应关系，得到所述向量字典；或，

利用所述第二模型处理各历史行为序列，得到所述向量字典。

5.如权利要求1所述的方法，其特征在于，所述方法还包括：

基于所述搜索行为信息更新预设模型，所述预设模型包括：第一模型和/或第二模型，其中，所述第一模型用于基于输入的搜索行为信息的特征确定输出的聚类特征向量，所述第二模型用于基于输入的搜索行为信息的特征确定向量字典。

6.如权利要求1-5任一项所述的方法，其特征在于，所述将所述聚类特征向量作为索引，在预先建立的向量字典中确定所述聚类特征向量对应的目标行为信息的步骤，包括：

针对任意一个所述聚类特征向量，确定该聚类特征向量与所述向量字典中各特征向量之间的距离；

将对应的距离不大于预设阈值的特征向量所对应的行为信息，确定为所述目标用户对应的目标行为信息。

7.如权利要求1-5任一项所述的方法，其特征在于，所述搜索行为信息包括：视频搜索信息、商品搜索信息、新闻搜索信息中的至少一种；

所述目标行为信息包括：视频搜索信息、商品搜索信息或新闻搜索信息中的至少一种。

8.如权利要求1-5任一项所述的方法，其特征在于，所述方法还包括：

基于所述目标行为信息进行搜索，得到目标搜索结果；

向所述目标用户展示所述目标搜索结果。

9.一种信息召回装置，其特征在于，所述装置包括：

10.一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现权利要求1-7任一所述的方法步骤。

11.一种计算机可读缓存介质，其特征在于，所述计算机可读缓存介质内缓存有计算机程序，所述计算机程序被处理器执行时实现权利要求1-7任一所述的方法步骤。