CN116010681A

CN116010681A - 一种召回模型的训练及检索方法、装置及电子设备

Info

Publication number: CN116010681A
Application number: CN202211723783.7A
Authority: CN
Inventors: 彭振
Original assignee: Rajax Network Technology Co Ltd
Current assignee: Rajax Network Technology Co Ltd
Priority date: 2022-12-30
Filing date: 2022-12-30
Publication date: 2023-04-25

Abstract

本申请公开了一种召回模型的训练及检索方法、装置及电子设备。所述方法包括：将训练样本的搜索侧信息作为待训练的召回模型的第一输入信息，输入所述召回模型的第一子网络得到第一输出信息，根据所述第一输出信息确定所述训练样本的搜索词特征；将训练样本的对象侧信息作为所述召回模型的第二输入信息，输入所述召回模型的第二子网络得到第二输出信息，根据所述第二输出信息确定所述训练样本的召回对象特征；基于第一损失函数训练所述召回模型，训练后得到目标召回模型；所述第一损失函数，基于训练样本的搜索词特征与对应的召回对象特征之间的相似度构建，用于作为训练所述召回模型的目标函数。采用所述方法，解决了搜索召回的精准度较低的问题。

Description

一种召回模型的训练及检索方法、装置及电子设备

技术领域

本申请涉及搜索技术领域，具体涉及一种召回模型的训练方法、装置、电子设备及存储介质。本申请同时还涉及一种搜索召回方法、装置、电子设备及存储介质。本申请同时还涉及一种检索方法、装置、电子设备及存储介质。

背景技术

随着越来越多的人利用网络进行搜索，一些提供搜索功能的综合性平台往往提供多种行业产品和/或信息并且对接来自多端的搜索请求，使得搜索需求越来越多元化，这对搜索的精准度提出了更高的要求。搜索召回是搜索的基础，根据用户输入的搜索词从海量数据中召回与搜索词相关的信息，搜索召回的深度与质量是决定搜索精准度的关键因素，因此，如何保证搜索召回的深度与质量尤其重要。

现有技术中，可以通过关键词匹配、知识/标签匹配进行搜索召回，也可以通过机器学习模型确定搜索词和候选信息的相似度进行搜索召回。然而，实际上搜索需求的多元化使得现有搜索召回深度与质量难以保证，尤其是，一些搜索场景下的搜索召回的召回候选集受到制约因素(如时空属性的制约)的强制约，在该类搜索场景中，搜索召回得到的召回候选集随制约因素如随用户搜索地点、时间等呈动态变化，现有的搜索召回处理未融入合制约因素对搜索结果的影响，难以保证召回的深度与质量，因而搜索召回的精准度不够高。

因此，如何提高搜索召回的精准度是需要解决的问题。

在所述背景技术部分公开的上述信息仅用于加强对本申请的背景的理解，因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本申请实施例提供的召回模型的训练方法，解决了搜索召回的精准度较低的问题。

本申请实施例提供一种召回模型的训练方法，包括：将训练样本的搜索侧信息作为待训练的召回模型的第一输入信息，输入所述召回模型的第一子网络得到第一输出信息，根据所述第一输出信息确定所述训练样本的搜索词特征；将训练样本的对象侧信息作为所述召回模型的第二输入信息，输入所述召回模型的第二子网络得到第二输出信息，根据所述第二输出信息确定所述训练样本的召回对象特征；基于第一损失函数训练所述召回模型，训练后得到目标召回模型；其中，所述第一损失函数，基于训练样本的搜索词特征与对应的召回对象特征之间的相似度构建，用于作为训练所述召回模型的目标函数。

可选的，还包括：获取训练样本的搜索词的邻居信息，根据所述邻居信息获取所述搜索词的搜索词邻居特征；基于所述搜索词邻居特征和所述第一输出信息确定所述搜索词与所述邻居信息相关的图注意力特征；根据所述图注意力特征与所述搜索词特征确定第二损失函数，将所述第二损失函数用于训练所述召回模型。

可选的，所述召回模型还包括第三子网络，所述第三子网络为搜索侧用于根据训练样本的搜索词的邻居信息获取搜索词邻居特征的子网络；所述根据所述邻居信息获取所述搜索词的搜索词邻居特征，包括：将所述邻居信息输入所述第三子网络，得到所述搜索词邻居特征。

可选的，所述第三子网络与所述第一子网络具有相同的网络结构和/或共享参数。

可选的，所述基于第一损失函数训练所述召回模型，包括：将所述第一损失函数以及所述第二损失函数作为用于训练所述召回模型的目标函数，训练所述召回模型。

可选的，所述获取训练样本的搜索词的邻居信息，包括：获取搜索日志，根据所述搜索日志生成用于表征搜索词与该搜索词的召回对象之间的点击关系图，所述点击关系图的各节点为对应于搜索词信息的搜索词节点，以及对应于各搜索词的发生了用户点击的点击对象节点；基于对所述点击关系图中各搜索词节点进行邻居聚合生成二部图，将生成的二部图作为搜索点击图；根据所述搜索词对所述搜索点击图中与所述搜索词相关的邻居节点采样，将采样数据作为所述邻居信息。

可选的，所述根据所述第一输出信息确定所述训练样本的搜索词特征，包括：将所述第一输出信息输入第一多层感知器，得到所述搜索词特征，所述搜索词特征包含搜索词语义信息。

可选的，还包括：获取训练样本的搜索词对应的召回对象的点击数据；其中，其中，所述点击数据，包括针对所述召回对象的点击率满足点击率阈值或点击数量满足点击数量阈值的一个或多个搜索词；根据所述点击数据与所述召回对象的对象信息，生成所述第二输入信息。

可选的，所述根据所述第二输出信息确定所述训练样本的召回对象特征，包括：将所述第二输出信息输入第二多层感知器，得到所述召回对象特征，所述召回对象特征包含与搜索词对应的召回对象的语义信息。

可选的，所述第一子网络与所述第二子网络具有相同的网络结构和/或共享参数。

可选的，还包括：基于训练样本的搜索词特征与对应的召回对象特征之间的相似度构建所述第一损失函数；所述第一损失函数采用以下损失函数之一：infoNCE损失函数、Hinge损失函数、Triplet损失函数、Circle损失函数。

可选的，还包括：从搜索日志中获取搜索侧用户输入的搜索词以及与所述搜索词对应的召回对象，确定所述召回对象中曝光且点击的召回对象；根据所述搜索词以及所述曝光且点击的召回对象构造正样本；基于所述正样本生成负样本，将所述正样本和/或所述负样本作为所述训练样本。

本申请实施例还提供一种搜索召回方法，包括：获取用户输入的搜索词，将所述搜索词输入目标召回模型的第一子网络，得到与所述搜索词对应的搜索词表示向量；其中，所述目标召回模型为应用所述召回模型的训练方法训练的召回模型；获取待召回对象的对象信息，将所述对象信息输入所述目标召回模型的第二子网络，得到与所述对象信息对应的对象表示向量；根据所述搜索词表示向量与所述对象表示向量的相似度，确定与所述搜索词对应的召回对象。

可选的，所述将所述搜索词输入目标召回模型的第一子网络，得到与所述搜索词对应的搜索词表示向量，包括：将所述搜索词输入所述第一子网络，得到第一预测输出；将所述第一预测输出输入所述目标召回模型的第一多层感知器，将第一多层感知器的输出作为所述搜索词表示向量。

可选的，所述将所述对象信息输入所述目标召回模型的第二子网络，得到与所述对象信息对应的对象表示向量，包括：将所述对象信息输入所述第二子网络，得到第二预测输出；将所述第二预测输出输入所述目标召回模型的第二多层感知器，将第二多层感知器的输出作为所述对象表示向量。

本申请实施例还提供一种检索方法，包括：获取用户输入的搜索词，基于目标召回模型的第一子网络得到与所述搜索词对应的搜索词表示向量；其中，所述目标召回模型为应用所述召回模型的训练方法训练的召回模型；根据所述用户的用户位置确定配送范围覆盖所述用户位置的商户，获取所述商户的配送范围覆盖的地址编码；获取所述地址编码所关联的对象表示向量集，确定所述对象表示向量集中所述搜索词表示向量的若干个近邻向量；根据所述近邻向量确定针对所述搜索词表示向量检索到的对象表示向量，将所述检索到的对象表示向量对应的对象作为针对所述搜索词检索到的召回对象；所述近邻向量与所述搜索词表示向量之间的距离满足向量相似度条件。

可选的，还包括：基于所述目标召回模型的第二子网络，确定对象候选集内的待召回对象对应的对象表示向量；根据所述对象表示向量相关的配送信息生成所述待召回对象的地址编码；基于所述地址编码对各对象表示向量进行数据聚合；构建用于基于搜索词检索对应的召回对象的倒排索引。

可选的，所述倒排索引为两级索引，包括用于基于商户索引到其对应的地址编码集的第一级倒排索引，以及，用于基于地址编码索引到其对应的对象表示向量集的第二级倒排索引。

可选的，所述获取所述商户的配送范围覆盖的地址编码，包括：基于所述第一级倒排索引检索到所述商户的配送范围覆盖的至少一个地址编码。

可选的，所述获取所述地址编码所关联的对象表示向量集，包括：基于所述第二级倒排索引检索到所述地址编码对应的对象表示向量集。

可选的，所述根据所述对象表示向量相关的配送信息生成所述待召回对象的地址编码，包括：获取所述对象表示向量对应的对象标识、商户标识以及配送范围标识；展开所述配送范围标识对应的多边形，获取所述多边形覆盖的地址编码，作为所述待召回对象的地址编码。

可选的，所述基于所述地址编码对各对象表示向量进行数据聚合，包括：当同一地址编码对应的对象表示向量的数量少于对象数量阈值，基于线性索引聚合所述对象表示向量；否则基于层次聚类对所述对象表示向量进行聚合。

可选的，确定所述对象表示向量集中所述搜索词表示向量的若干个近邻向量，包括：如果所述对象表示向量集为基于层次聚类生成，则逐层确定中心点，遍历每层中心点包含的下一级节点，直至线性比较各节点对应的向量与所述搜索词表示向量的相似度，筛选出与所述搜索词表示向量的相似度满足向量相似度条件的节点，将筛选出的节点对应的向量作为所述近邻向量。

可选的，所述逐层确定中心点，遍历每层中心点包含的下一级节点，直至线性比较各节点对应的向量与所述搜索词表示向量的相似度，包括：确定至少一个一级中心点，针对其一一级中心点，遍历该一级中心点包含的二级中心点；确定每个二级中心点包含的节点，遍历二级中心点包含的节点，线性比较各节点对应的向量与所述搜索词表示向量的相似度。

可选的，所述根据所述近邻向量确定针对所述搜索词表示向量检索到的对象表示向量，包括：确定所述近邻向量的配送范围；所述配送范围为一多边形；以所述用户位置为起始点作水平射线；若判断该射线与所述多边形的每条边的交点数量为奇数，则所述配送范围覆盖所述用户位置；否则所述配送范围未覆盖所述用户位置；剔除所述近邻向量中配送范围未覆盖所述用户位置的向量，剔除之后的其他近邻向量作为所述检索到的对象表示向量。

可选的，所述搜索词表示向量以及所述对象表示向量为同一高维空间的向量；所述对象表示向量为使用所述召回模型的对象侧网络结构离线生成的向量。

本申请实施例还提供一种召回模型的训练装置，包括：搜索侧网络单元，用于将训练样本的搜索侧信息作为待训练的召回模型的第一输入信息，输入所述召回模型的第一子网络得到第一输出信息，根据所述第一输出信息确定所述训练样本的搜索词特征；对象侧网络单元，用于将训练样本的对象侧信息作为所述召回模型的第二输入信息，输入所述召回模型的第二子网络得到第二输出信息，根据所述第二输出信息确定所述训练样本的召回对象特征；训练单元，用于基于第一损失函数训练所述召回模型，训练后得到目标召回模型；其中，所述第一损失函数，基于训练样本的搜索词特征与对应的召回对象特征之间的相似度构建，用于作为训练所述召回模型的目标函数。

本申请实施例还提供一种搜索召回装置，包括：搜索词表达单元，用于获取用户输入的搜索词，将所述搜索词输入目标召回模型的第一子网络，得到与所述搜索词对应的搜索词表示向量；其中，所述目标召回模型为应用所述召回模型的训练方法训练的召回模型；对象表达单元，用于获取待召回对象的对象信息，将所述对象信息输入所述目标召回模型的第二子网络，得到与所述对象信息对应的对象表示向量；召回单元，用于根据所述搜索词表示向量与所述对象表示向量的相似度，确定与所述搜索词对应的召回对象。

本申请实施例还提供一种检索装置，包括：搜索词表达单元，用于获取用户输入的搜索词，基于目标召回模型的第一子网络得到与所述搜索词对应的搜索词表示向量；其中，所述目标召回模型为应用所述召回模型的训练方法训练的召回模型；检索地址编码单元，用于根据所述用户的用户位置确定配送范围覆盖所述用户位置的商户，获取所述商户的配送范围覆盖的地址编码；检索近邻向量单元，用于获取所述地址编码所关联的对象表示向量集，确定所述对象表示向量集中所述搜索词表示向量的若干个近邻向量；召回单元，用于根据所述近邻向量确定针对所述搜索词表示向量检索到的对象表示向量，将所述检索到的对象表示向量对应的对象作为针对所述搜索词检索到的召回对象；所述近邻向量与所述搜索词表示向量之间的距离满足向量相似度条件。

本申请实施例还提供一种电子设备，包括：存储器，以及处理器；所述存储器用于存储计算机程序，所述计算机程序被所述处理器运行后，执行本申请实施例提供的所述方法。

本申请实施例还提供一种计算机存储介质，存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现本申请实施例提供的所述方法。

与现有技术相比，本申请具有以下优点：

本申请实施例提供的一种召回模型的训练方法、装置、电子设备及存储介质，通过将训练样本的搜索侧信息作为待训练的召回模型的第一输入信息，输入所述召回模型的第一子网络得到第一输出信息，根据所述第一输出信息确定所述训练样本的搜索词特征；将训练样本的对象侧信息作为所述召回模型的第二输入信息，输入所述召回模型的第二子网络得到第二输出信息，根据所述第二输出信息确定所述训练样本的召回对象特征；基于第一损失函数训练所述召回模型，训练后得到目标召回模型；其中，所述第一损失函数，基于训练样本的搜索词特征与对应的召回对象特征之间的相似度构建，用于作为训练所述召回模型的目标函数。所述目标召回模型及召回模型，将搜索词及待召回对象各自的文本分别表征为同一高维空间的语义向量，根据语义向量的相似性召回对象。该目标召回模型及召回模型适用性较强，即使在商户履约能力受时间和/或空间强制约的场景下的召回率及精确率都比较高。

本申请实施例提供的一种搜索召回方法、装置、电子设备及存储介质，通过应用本申请提供的所述方法训练的召回模型或目标召回模型，通过所训练后的模型的第一、第二子网络分别得到搜索词表示向量以及对象表示向量，基于搜索词向量与对象表示向量的相似度确定针对搜索词召回的召回对象。能够提高对象召回率及召回的精确率。

本申请实施例提供的一种检索方法、装置、电子设备及存储介质，通过获取用户输入的搜索词，基于目标召回模型的第一子网络得到与所述搜索词对应的搜索词表示向量；其中，所述目标召回模型为应用所述召回模型的训练方法训练的召回模型；根据所述用户的用户位置确定配送范围覆盖所述用户位置的商户，获取所述商户的配送范围覆盖的地址编码；获取所述地址编码所关联的对象表示向量集，确定所述对象表示向量集中所述搜索词表示向量的若干个近邻向量；根据所述近邻向量确定针对所述搜索词表示向量检索到的对象表示向量，将所述检索到的对象表示向量对应的对象作为针对所述搜索词检索到的召回对象；所述近邻向量与所述搜索词表示向量之间的距离满足向量相似度条件。提供了基于位置服务的检索方案，并且提高了检索效率。

附图说明

图1是本申请第一实施例提供的一种召回模型的训练方法的处理流程图；

图2是本申请第一实施例提供的一种召回模型的结构示意图；

图3是本申请第一实施例提供的另一种召回模型的结构示意图；

图4是本申请第一实施例提供的一种生成搜索点击图的示意图；

图5是本申请第一实施例提供的另一种召回模型的结构示意图；

图6是本申请第二实施例提供的一种搜索召回方法的处理流程图；

图7是本申请第三实施例提供的一种检索方法的处理流程图；

图8是本申请第三实施例提供的一种基于层次聚类的检索的示意图；

图9是本申请第四实施例提供的一种召回模型的训练装置示意图；

图10是本申请第五实施例提供的一种搜索召回装置示意图；

图11是本申请第六实施例提供的一种检索装置示意图；

图12是本申请提供的电子设备示意图。

具体实施方式

在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本申请内涵的情况下做类似推广，因此本申请不受下面公开的具体实施的限制。

本申请实施例提供一种召回模型的训练方法、装置、电子设备及存储介质。本申请还提供一种搜索召回方法、装置、电子设备及存储介质。本申请还提供一种检索方法、装置、电子设备及存储介质。在下面的实施例中逐一进行说明。

为便于理解，首先给出一种召回模型的应用场景。若提供搜索功能的平台或系统(统称为搜索系统)向搜索用户提供多种行业产品和/或服务信息、且对接来自多端的搜索请求，这对搜索召回的深度与质量提出了更高要求。一个提供搜索功能的场景中，平台A提供线上到线下服务，该平台搜索功能的产品形态是提供多端、多行业领域的搜索服务，多端包括但不限于对接该平台的客户端APP、小程序主页、频道搜索页、与该平台相关联的APP中关联到该平台的搜索标签页或搜索卡片页等；多行业领域包括但不限于餐饮、百货零售、医药等业态。该场景仅仅是召回模型所使用场景的一个实施例，提供此场景实施例的目的是便于理解本申请中提供的召回模型的应用，而并非用于限定本申请的召回模型的应用或训练方法。

本申请提供的召回模型的训练方法所得到的召回模型应用于搜索功能的召回阶段，使用该召回模型根据用户输入的搜索词从海量数据中召回与搜索词相关的信息，所召回的信息进一步处理提供给用户。召回的与搜索词相关的信息，可以理解为搜索系统根据接收到的搜索词召回的与搜索词相关的对象。所谓对象，为召回结果所包含的一个或多个召回项(Item)，具体可以是店铺，可以是产品或服务，还可以是评价或与搜索词相关的文档等，不做特殊限定。召回的对象，可以是挂载于所属类目之下，对象所挂载的类目为对象所属类目，对象所属类目可以是具有层级结构的一级或多级类目，对象所属类目为对象上下文(context)。同一对象也可以属于多种类目。例如，如店铺A蛋糕店可同时挂载在美食/用餐时段/下午茶、美食/面包甜点/面包蛋糕、美食/热卖品类/蛋糕等多种类目。本申请中，用户输入搜索词可以理解为搜索召回的搜索侧，召回与搜索词相关的信息可以理解搜索召回的对象侧(或文档侧)。

需要说明的是，以上所公开的信息仅用于帮助对本申请进行理解，并不意味着构成对本领域普通技术人员已知的现有技术。

以下结合图1至图5对本申请第一实施例提供的召回模型的训练方法进行说明。图1所示的召回模型的训练方法，包括：

步骤S101，将训练样本的搜索侧信息作为待训练的召回模型的第一输入信息，输入所述召回模型的第一子网络得到第一输出信息，根据所述第一输出信息确定所述训练样本的搜索词特征；

步骤S102，将训练样本的对象侧信息作为所述召回模型的第二输入信息，输入所述召回模型的第二子网络得到第二输出信息，根据所述第二输出信息确定所述训练样本的召回对象特征；

步骤S103，基于第一损失函数训练所述召回模型，训练后得到目标召回模型；其中，所述第一损失函数，基于训练样本的搜索词特征与对应的召回对象特征之间的相似度构建，用于作为训练所述召回模型的目标函数。

本实施例提供的方法用于训练召回模型，所述召回模型或训练所述召回模型得到的目标召回模型应用于搜索功能的召回阶段。召回模型为搜索召回的深度与质量提供数据基础，需要均衡召回对象与搜索词的相关程度以及召回效率。本申请提供的召回模型的训练方法所得到的召回模型应用基于深度学习的语义模型作为基础构建，逻辑上包括第一子网络以及第二子网络；所述第一子网络是在搜索侧包括用于学习搜索侧信息的子网络；所述第二子网络是在对象侧包括用于学习对象侧信息的子网络。第一子网络的输入信息为第一输入信息，第一输入信息可以是搜索侧用户输入的搜索词和/或搜索词相关信息，也可以是对搜索词或搜索词相关信息格式化处理后的数据。第二子网络的输入信息为第二输入信息，第二输入信息可以是对象侧对应搜索词的召回对象和/或召回对象相关信息，也可以是对召回对象或召回对象相关信息格式化处理后的数据。进一步，所述搜索词特征，可以并不局限于用户输入的搜索词(即搜索文本)自身的特征信息，也可为融入与搜索词相关的其他特征信息的扩展特征，与搜索词相关的其他特征信息为搜索词扩展信息，例如，搜索词特征为基于搜索词并融合了搜索词分词序列、搜索词对应的特征词、拼接搜索词及对应的用户行为特征所得到的内容等搜索词扩展信息的特征信息。

如步骤S101所述，将训练样本的搜索侧信息作为待训练的召回模型的第一输入信息，输入所述召回模型的第一子网络得到第一输出信息，根据所述第一输出信息确定所述训练样本的搜索词特征。本步骤为通过第一子网络确定所述训练样本的搜索词特征。其中，所述将训练样本的搜索侧信息作为待训练的召回模型的第一输入信息，包括：获取所述训练样本包含的搜索词和/或搜索词扩展信息作为所述搜索侧信息，根据所述搜索词构造所述第一输入信息。其中，所述根据所述第一输出信息确定所述训练样本的搜索词特征，包括：将所述第一输出信息输入第一多层感知器，得到所述搜索词特征，所述搜索词特征包含搜索词语义信息。所谓多层感知器，是指MLP(Multilayer Perceptron)。

请参考图2，图中所示出的一种模型结构由召回模型的搜索侧网络结构及召回模型的对象侧网络结构将搜索侧的信息以及对象侧的信息分开表征，为逻辑意义上的双塔结构，具体包括：第一子网络201、第二子网络202、第一输入信息203、第二输入信息204、第一多层感知器205、第二多层感知器206、第一损失函数207。其中，第一子网络及第二子网络可以采用基于深度学习的语义模型。将第一输入信息输入第一子网络得到第一输出信息，将所述第一输出信息输入(即传递到)第一多层感知器，经过第一多层感知器激活，得到包含搜索词语义信息的搜索词特征，搜索词特征可以理解为以向量形式所表征的搜索侧的嵌入特征向量(Query Embedding)。将第二输入信息输入第二子网络得到第二输出信息，将所述第二输出信息输入(即传递到)第二多层感知器，经过第二多层感知器激活得到包含与搜索词对应的召回对象的语义信息的召回对象特征，召回对象特征可以理解为以向量形式所表征的对象侧的嵌入特征向量(Item Embedding)。图中，第一损失函数为召回模型训练阶段的目标函数，其根据搜索词特征和召回对象特征构造，在召回模型的训练阶段，训练样本的搜索词特征和召回对象特征映射到同一高维空间，逐步训练网络参数，以使得相似的搜索词特征和召回对象特征更接近，不相似的特征远离。图中，PE表示处理单元(ProcessElement)，具体的例子可以是对应的神经元。

本实施例中，所述第一子网络与所述第二子网络具有相同的网络结构和/或共享参数，其中，共享参数是指两个子网络共享相同的参数。进一步，所述第一子网络与所述第二子网络也可以是逻辑意义上的两个网络，而实际上采用同一个网络分别对第一输入信息及第二输入信息进行处理。优选的，所述第一子网络以及第二子网络采用Bert模型。进一步，所述第一子网络以及第二子网络采用使用搜索系统应用领域的领域语料预训练过的特定Bert模型。所述领域语料为针对搜索系统所应用的领域采集数据，对采集后的数据经过数据提取、清洗等处理步骤得到的语料。例如，当搜索系统应用于O2O(线上到线下)领域，则使用具体的O2O领域语料预训练通用Bert模型，得到作为第一子网络和/或第二子网络的特定Bert(Bidirectional Encoder Representation from Transformers，Bert)模型。所述Bert模型和/或所述特定Bert模型，为语言表征模型，其最后一层为池化层(pool)。第一子网络和/或第二子网络之前接收各自输入信息的网络节点为嵌入层，即子网络的输入由召回模型的其一隐藏层引入。实施时，从第一子网络和/或第二子网络各自最后一层池化层分别引出输出传递到对应的多层感知器，经过多层感知器激活，分别得到搜索词特征及对应的召回对象特征。Bert模型结合多层感知器的学习方式，能提升训练性能和预测精准度。优选的，通过第一多层感知器以及第二多层感知器分别将各自对应的第一输出信息和第二输出信息映射到同一个高维空间，得到的所述搜索词特征以及对应的召回对象特征，为同一个高维空间内分别表征搜索词语义信息的嵌入特征向量和表征召回对象语义信息的嵌入特征向量。

搜索侧信息(或特征)与用户行为相关，为在召回模型的训练过程中丰富搜索侧信息的语义表达，充分学习搜索侧特征，以使得召回模型应用于线上召回时能够充分提取用户输入的搜索词的语义，本实施例中在搜索侧信息的学习过程中加入了与用户行为相关的搜索点击数据以扩充搜索词特征，从而充分挖掘搜索侧的语义表达。其中，搜索侧特征可以理解为融入了训练样本的搜索词特征以及其他相关搜索侧相关信息的特征。优选的，在召回模型的每轮训练中在搜索侧加入的搜索点击数据，包括本轮训练的当前训练样本的搜索词的邻居信息，所述搜索词的邻居信息为基于针对召回对象的点击行为确定出的与所述搜索词具有邻居关系的邻居搜索词的信息。即，所述搜索词的邻居搜索词为与所述搜索词具有邻居关系的搜索词。其中，发生了点击行为的同一召回对象所对应的搜索词互为邻居，这些搜索词相互之间具有邻居关系。例如，第一搜索词与第二搜索词具有直接邻居关系，互为邻居；同时，第一搜索词与第三搜索词无直接邻居关系，第二搜索词与第三搜索词具有直接邻居关系，则第一搜索词与第三搜索词之间为间接邻居关系。具体的，所述方法包括：获取训练样本的搜索词的搜索点击数据，所述搜索点击数据包括所述搜索词的邻居信息；根据所述邻居信息获取所述搜索词的搜索词邻居特征，所述搜索词邻居特征，用于确定与所述搜索词的邻居信息相关的图注意力特征；基于所述搜索词邻居特征和所述第一输出信息确定所述搜索词与所述邻居信息相关的图注意力特征；根据所述图注意力特征与所述搜索词特征确定第二损失函数，将所述第二损失函数用于训练所述召回模型，具体的，将所述第一损失函数以及所述第二损失函数作为用于训练所述召回模型的目标函数，训练所述召回模型。

一个优选实施方式中，所述召回模型还包括第三子网络，即所述召回模型包括：第一、第二以及第三子网络。其中，所述第三子网络为搜索侧用于根据训练样本的搜索词的邻居信息获取所述搜索词邻居特征的子网络。所述搜索词的邻居信息优选为所述搜索词对应的搜索点击图数据。即，在所述召回模型的训练过程中在搜索侧引入搜索点击图数据，使用第三子网络处理所述搜索点击图数据得到所述搜索邻居特征。所谓搜索点击图，是指将搜索词以及其对应的召回对象分别作为搜索词节点以及对象节点，确立各节点之间的点击关系，并对点击关系中的具有邻居关系的搜索词节点进行聚合所生成的二部图，所述具有邻居关系参见上文描述。与仅使用搜索词本身的点击信息相比，通过学习所述搜索点击图数据可以扩充与所述搜索词相关的搜索点击信息，使得搜索侧语义表达更丰富。在召回模型的训练过程中，对每个训练样本，利用其包含的搜索词的一个或多个邻居节点的信息，根据搜索词的邻居节点的表达恢复当前计算的训练样本中的搜索词节点的表达，以学习网络参数。进一步，还可以根据第三子网络在召回模型中引入注意力机制，以区分出不同邻居节点的贡献，从而充分挖掘搜索侧的语义表达，扩充了搜索侧的搜索词特征，学习得到的网络参数使得训练后的召回模型能够提供更好的召回质量。

优选的，所述第三子网络为与所述第一子网络具有相同的网络结构和/或共享参数。进一步，所述第三子网络可以与第一子网络为相同的网络模型，而仅是逻辑上的子网络。所述第三子网络优选为Bert网络，尤其是使用所述搜索系统对应的领域的领域语料预训练过的Bert网络。

优选的，所述第二损失函数为基于所述搜索词特征与所述图注意力特征构造重构损失函数。

请参考图3，图中所示的召回模型结构为在图2所示的网络结构基础上在召回模型的搜索侧网络结构中引入搜索点击图数据，包括：第一Bert编码器301、第二Bert编码器302、第一Bert编码器输入信息303、第二Bert编码器输入信息304、第一多层感知器305、第二多层感知器306、第一损失函数307、搜索侧点击图308、第三Bert编码器309、图注意力310、第二损失函数311。其中，第一Bert编码器为第一子网络，第一Bert编码器输入信息为第一子网络输入信息；第二Bert编码器为第二子网络，第二Bert编码器输入信息为第二子网络输入信息。第三Bert编码器为处理搜索点击图数据的第三子网络，其与第一、第二子网络为同一网络模型，且共享参数。图中，使用训练样本进行每轮训练过程中，当前节点为本轮计算中当前训练样本包含的当前搜索词对应的搜索词节点；搜索侧点击图所包含的信息为搜索点击图数据，其为第三Bert编码器的输入信息。实施时，具体根据搜索侧点击图中当前节点的各邻居节点的相邻情况，分别将搜索侧点击图中的邻居节点信息经过PE处理后输入第三Bert编码器，即逻辑意义上的第三子网络(即第三Bert编码器)可以有多个，比如，将当前节点的邻居Q1输入一个第三子网络，将当前节点的邻居Q2输入一个第三子网络，实施时可以从不同隐藏层引出输入到各自逻辑意义上的第三子网络。图中，根据第三Bert编码器的输出计算当前节点及各邻居节点之间的图注意力，实施时，将第三Bert编码器得到的每个邻居节点的表征向量，分别和当前节点的表征向量计算注意力(attention)，得到每个邻居节点对应当前节点的注意力系数，再按照注意力系数将对应的邻居节点的表征向量相加，得到图注意力特征(即搜索点击图的表示向量)；根据图注意力特征、当前节点在第一Bert编码器处理并经过第一多层感知器处理后得到的搜索词特征，构建重构损失函数(reconstruction loss)，该重构损失函数为第二损失函数；根据第二损失函数以及第一损失函数，训练所述召回模型。该召回模型中融合了训练样本的搜索词与各邻居之间的注意力信息，可以理解为融合邻居注意力的召回模型。图中，将当前训练样本的搜索词对应的当前节点及其邻居节点的信息输入到召回模型的BERT层(分别是第一Bert编码器及第三Bert编码器)，则得到所述当前节点和邻居节点对应的表示向量如下：

h_q＝bert(q)；

其中，邻居节点对应的表示向量可以理解为所述搜索词的搜索词邻居特征。然后，将每个邻居节点分别和当前节点的表示向量计算注意力，得到每个邻居节点对应于当前节点的注意力系数，再按照所述注意力系数将对于的邻居节点的表示向量相加，得到当前节点对应的搜索点击图的图表示向量，该图表示向量可以理解为所述当前训练样本的搜索词的与其邻居信息相关的图注意力特征，如下：

e_qn＝a(Wh_q·Wh_n)；

其中，e_qn为每个邻居节点对当前节点的注意力系数；a_qn为归一化后的注意力系数；h_graph(q)为本轮训练的当前训练样本的搜索词对应的与邻居信息相关的图注意力特征。

进一步，图中的第一损失函数为基于图注意力特征与该本轮训练的搜索词在第一Bert编码器编码后经过MLP得到的表示向量(即搜索词特征)构建的重构损失函数，具体如下：

其中，

所述第二损失函数，逐轮训练过程中使得当前训练样本的搜索词(query)与其邻居搜索词的相似度越大越好，距离越小越好，通过该第二损失函数反向传播以在召回模型的搜索侧更新网络参数，如在第一子网络更新网络参数。

本实施例中，如图3所示的融合邻居注意力的召回模型的训练目标为第一损失函数以及第二损失函数满足收敛条件。

本实施例中，还包括生成所述搜索点击图，所述生成所述搜索点击图，包括：获取搜索日志，根据所述搜索日志生成用于表征搜索词与该搜索词的召回对象之间的点击关系图，所述点击关系图的各节点为对应于搜索词信息的搜索词节点，以及对应于各搜索词的发生了用户点击的点击对象节点，所述点击对象节点表示对应于搜索词的召回对象中任意被用户点击的对象；基于所述点击关系图生成二部图，将生成的二部图作为搜索点击图(click-graph，点击图)。其中，所述基于所述点击关系图生成二部图，包括：基于对所述点击关系图中各搜索词节点进行邻居聚合，生成所述二部图，其中，二部图中具有邻居关系的搜索词节点互为邻居节点，邻居节点之间的边可以具有权重，通过邻居间的权重体现邻居节点之间的相互影响程度。所述具有邻居关系与上文描述一致，具有相同召回对象、且该召回对象在相应搜索词发生了用户点击的各搜索词节点之间具有邻居关系。请参考图4，图中示出了搜索点击图的示意图，包括：基于搜索日志得到的点击关系图401、聚合邻居得到的搜索点击图402。点击关系图中各节点：搜索词(query)节点和召回对象(product)节点，如图中示例q1，q2，q3，q4，q5，以及p1，p2，p3，p4；节点间连线表示进行了点击；聚合所的搜索点击图为二部图，从中可以看出，q1与q2及q3为邻居，与q4及q5不具有邻居关系。图中各节点仅为示例性的，节点数量及名称不构成对所述方法的限定。所述搜索点击图的数据作为搜索侧引入的搜索点击图数据参与召回模型的训练。具体的，在生成所述搜索点击图之后，利用该搜索点击图数据训练所述召回模型，包括：根据所述搜索词对所述搜索点击图中与所述搜索词相关的邻居节点采样，将采样数据作为所述搜索词的邻居信息，由第三子网络根据所述邻居信息获取所述搜索词的搜索词邻居特征；所述搜索词邻居特征用于和所述第一输出信息确定所述搜索词与所述邻居信息相关的图注意力特征；所述图注意力特征用于与所述搜索词特征确定第二损失函数。其中，所述根据所述搜索词对所述搜索点击图中与所述搜索词相关的邻居节点采样，包括：根据各搜索词的采样权重进行采样，和/或，根据召回对象的点击数量进行采样。其中，搜索日志可以是指为提供搜索功能的主搜索系统生成的搜索记录信息。

如步骤S202所述，将训练样本的对象侧信息作为所述召回模型的第二输入信息，输入所述召回模型的第二子网络得到第二输出信息，根据所述第二输出信息确定所述训练样本的召回对象特征。本步骤为通过第二子网络学习对象侧信息，即从召回模型的对象侧学习网络参数。本实施例中的第一及第二子网络的网络参数为共享参数，即共享相同的网络参数。所述第二输入信息。其中，所述根据所述第二输出信息确定所述训练样本的召回对象特征，包括：将所述第二输出信息输入第二多层感知器，得到所述召回对象特征，所述召回对象特征包含与搜索词对应的召回对象的语义信息。

其中，所述第二输入信息可以是对象侧对应搜索词的召回对象和/或召回对象相关信息，例如，第二输入信息包含对象名称，进一步可以包含对象上下文。对象上下文，可以是对象所属类目。

本实施例中，为了在所述召回模型训练阶段在搜索侧与对象侧之间引入交互，以提升训练后模型的召回率以及召回精确率，其中，召回率能体现召回的深度与广度，召回精确率能体现召回对象与搜索词的相关程度，相关程度越高，使用搜索功能的潜在用户转化为实际用户的转化率越高。实施时，在训练样本中增加对应于该样本包含的召回对象(商品或店铺)的点击数据，其中，所述点击数据，包括针对所述召回对象的点击率满足点击率阈值或点击数量满足点击数量阈值的一个或多个搜索词。具体的，包括：获取训练样本的搜索词对应的召回对象的点击数据；根据所述点击数据与所述召回对象的对象信息，生成所述第二输入信息(或图3中的第二bert编码器输入信息)，所述对象信息包括对象名称以及对象上下文，在所述点击数据(如一个或多个满足点击率阈值或满足点击数量阈值的搜索词)与所述对象名称及对象上下文之间以[SEP]分隔。可以理解的是，该样本包含的每个召回对象所对应的一个或多个搜索词为该样本的搜索词的邻居。

本实施例中，还包括在图2或图3所示的模型基础上在召回模型的对象侧网络结构中(如第二子网络)引入所述点击数据。请参考图5，图中所示的召回模型结构为在图3所示的模型基础上在对象侧引入所述点击数据而得到的模型结构，包括：对象侧对应搜索词的召回对象501，其相比于图3的对象侧对应搜索词的召回对象304，增加了“召回对象点击量或点击率排序中前N的搜索词”，N为示意性数量，不用于限定所述方法。

如步骤S103所述，基于第一损失函数训练所述召回模型，训练后得到目标召回模型；其中，所述第一损失函数，基于训练样本的搜索词特征与对应的召回对象特征之间的相似度构建，用于作为训练所述召回模型的目标函数。

所谓相似度，是指搜索词与召回对象或召回对象所属类目之间的匹配程度，能反映搜索词与召回对象主体之间的相关程度。相似度越高，则召回对象或其所属类目与搜索词的预期符合程度越高，相关性越好；相似度越低，则召回对象或其所属类目与搜索词的预期符合程度越低，相关性越差。

召回模型的训练阶段，当目标函数满足收敛条件则停止训练，得到目标召回模型。基于训练样本的搜索词特征与对应的召回对象特征之间的相似度构建模型训练的目标函数，所训练出的目标召回模型，其应用于搜索系统所得到的召回对象与用户输入的搜索词的匹配程度较高，更符合用户的搜索意图，提升召回对象的点击率较高，从而提升潜在用户转化为实际用户的转化率。由图2、图3以及图5中可以看出，第一损失函数具体可以由第一多层感知器的输出与第二层感知器的输出确定。

本实施例中提供多种方式构造第一损失函数。其一较优实施方式中，采用基于对比度的infoNCE损失函数，如下：

其中，q为搜索词的表示向量；k⁺为正样本的召回对象的表示向量；k^-为负样本的召回对象的表示向量；τ为热度超参数。所谓正样本，是指一定历史时段内曝光且有点击的召回对象对应的训练样本，具体可以由<搜索词,点击对象>二元组构成，点击对象是指与所述搜索词对应且被点击的召回对象；正样本表示用户对该召回对象感兴趣。所谓负样本，是指基于一个搜索词未被召回的对象，和/或，对应于一个搜索词召回的召回对象中未曝光或曝光未点击的召回对象，所构造的训练样本。实施时，针对一个搜索词，可以从全体待召回对象或者未召回对象中随机抽样，将抽样结果与该搜索词构造负样本。

当然，也可以采用其他实施方式构造第一损失函数。例如，一实施方式中，采用基于分类的Hinge损失函数，如下：

L_hinge＝max(0,e_q·e_p-e_q·e_n+m)；

其中，e_q·e_p为正样本的余弦相似度；e_q·e_n为负样本的余弦相似度；正样本选择充分曝光且较高点击率的<搜索词，召回对象>二元组；负样本，可以根据正样本构造，例如，可以从与正样本的召回对象属于同一级类目且不同二级类目的对象中随机采样，将采样对象与该正样本的搜索词构成负样本。

再如，一实施方式中，还可以采用Triplet损失函数，反馈数据包括锚样本(Anchor)、正样本(Positive)、负样本(Negative)，训练过程为优化锚样本与正样本的距离小于锚样本与负样本的距离，如下：

其中，d(q,p)表示向量q和p的距离；d(q,n)表示向量q和n的距离；(q,p)表示搜索词和曝光且点击的召回对象构成的正样本；(q,n)表示搜索词和其他召回对象构成的负样本，或者，修改点击的召回对象所属类目而生成的负样本。

再如，一实施方式中，采用Circle损失函数，在Triplet损失函数的基础上对负样本加入权重，从而控制正、负样本各自的梯度贡献，如下：

其中，s_p是类内相似度，s_n是类间相似度，γ是尺度因子(即缩放因子)，α_p和α_n是自适应步调加权因子。

本实施例中，还包括在训练之前根据搜索日志构造用于训练所述召回模型的所述训练样本；其中，所述训练样本包括所述搜索侧信息以及与所述搜索侧信息对应的召回对象的对象侧信息。具体的，从搜索日志中获取搜索侧用户输入的搜索词以及与所述搜索词对应的召回对象，根据所述搜索词以及所述召回对象构造所述训练样本。构造得到的训练样本包括正样本和/或负样本。其中，本申请不限定正、负样本的生成方式。可以根据搜索日志生成正样本或将人工标注的搜索词及点击对象构成的样本对作为正样本。负样本可以在正样本的基础上生成，例如，修改正样本的召回对象所属的类目信息，修改后再与该正样本的搜索词构成负样本；再如，对正样本的召回对象之外的其他对象进行采样，采样的对象与正样本的搜索词构成负样本。当然也可以基于人工标注信息构成负样本。

实际实施时，可以采用无标注的领域语料预训练Bert模型，预训练后的Bert模型用作逻辑上的第一子网络及第二子网络，构建初始的待训练的召回模型。再使用基于搜索日志生成的或人工标注的正样本和/或负样本训练所述召回模型。进一步，在搜索侧引入搜索点击图和/或在对象侧引入搜索侧与对象侧的信息交互信息，训练得到目标召回模型，目标召回模型将搜索词及待召回对象各自的文本分别表征为同一高维空间的语义向量，根据语义向量的相似性召回对象。该目标召回模型领域适用性较强，即使在商户履约能力受时间和/或空间强制约的场景下的召回率及精确率都比较高，召回率能达到0.95，召回平均深度也得到了提升，训练得到的目标召回模型的F1分数(F1 Score)也较优，F1分数为衡量模型精确度的指标。

需要说明的是，在不冲突的情况下，在本实施例和本申请的其他实施例中给出的特征可以相互组合，并且步骤S101和S102或类似用语不限定步骤必须先后执行。

至此，对本实施例提供的方法进行了说明，所述方法将训练样本的搜索侧信息作为待训练的召回模型的第一输入信息，输入所述召回模型的第一子网络得到第一输出信息，根据所述第一输出信息确定所述训练样本的搜索词特征；将训练样本的对象侧信息作为所述召回模型的第二输入信息，输入所述召回模型的第二子网络得到第二输出信息，根据所述第二输出信息确定所述训练样本的召回对象特征；基于第一损失函数训练所述召回模型，训练后得到目标召回模型；其中，所述第一损失函数，基于训练样本的搜索词特征与对应的召回对象特征之间的相似度构建，用于作为训练所述召回模型的目标函数。所述目标召回模型及召回模型，将搜索词及待召回对象各自的文本分别表征为同一高维空间的语义向量，根据语义向量的相似性召回对象。该目标召回模型及召回模型适用性较强，即使在商户履约能力受时间和/或空间强制约的场景下的召回率及精确率都比较高。

以上述实施例为基础，本申请第二实施例提供一种搜索召回方法。以下结合图6对所述方法进行说明，相同部分请参见上述实施例对应部分的描述，不再赘述。图6所示的搜索召回方法，包括：

步骤S601，获取用户输入的搜索词，将所述搜索词输入目标召回模型的第一子网络，得到与所述搜索词对应的搜索词表示向量；其中，所述目标召回模型为应用本申请提供的所述方法训练的召回模型；

步骤S602，获取待召回对象的对象信息，将所述对象信息输入所述目标召回模型的第二子网络，得到与所述对象信息对应的对象表示向量；

步骤S603，根据所述搜索词表示向量与所述对象表示向量的相似度，确定与所述搜索词对应的召回对象。

将本申请提供的所述目标召回模型作为应用于搜索召回的召回模型，所述目标召回模型指训练后的召回模型。将用户输入的搜索词输入到所述目标召回模型，通过所述目标召回模型，根据用户输入的搜索词从待召回对象中召回与所述搜索词对应的对象，作为所述召回对象。所述待召回对象可以理解为召回范围内的对象，往往是海量数据，其一个例子为部署搜索召回功能的平台或系统的全量商品或服务，可以理解为召回范围内的对象。

如上述提供召回模型的训练方法的实施例中所述，所述第一子网络位于所述目标召回模型的搜索侧网络结构中，所述第二子网络位于所述目标召回模型的对象侧网络结构中。实际应用时，可以将所述目标召回模型的搜索侧网络结构如第一子网络及与其相连的其他PE和/或感知器等，部署于在线数据侧，用于线上处理用户输入的搜索词，针对用户输入的搜索词实时预测对应的搜索词表示向量。具体的可以将搜索侧网络结构部署到RTP(Real-time Predict，实时预测打分)系统，该RTP系统接收用户输入的搜索词，由所述目标召回模型的搜索侧网络针对搜索词实时预测得到满足评分阈值的向量作为该搜索词表示向量。可以将所述目标召回模型的对象侧网络结构如第二子网络及预其向量的其他PE和/或感知器等，以任务形式部署于离线数据侧，离线预测召回对象的对象表示向量，优选将得到的对象表示向量形成检索库，对该检索库进行增量离线预测。再根据搜索词表示向量在离线预测得到的对象表示向量中查询到相似度满足预设条件的一个或多个对象，作为与所述搜索词对应的召回对象，从而用于实现基于向量相似度来尽可能找到用户感兴趣的召回对象。

本实施例，将所述第一子网络的输出传递到第一多层感知器，激活得到对应于搜索词所预测的搜索词表示向量。其中，所述将所述搜索词输入目标召回模型的第一子网络，得到与所述搜索词对应的搜索词表示向量，包括：将所述搜索词输入所述第一子网络，得到第一预测输出；将所述第一预测输出输入所述目标召回模型的第一多层感知器，将第一多层感知器的输出作为所述搜索词表示向量。将所述第二子网络的输出传递到第二多层感知器，激活得到对应于召回范围内对象的对象表示向量。其中，所述将所述对象信息输入所述目标召回模型的第二子网络，得到与所述对象信息对应的对象表示向量，包括：将所述对象信息输入所述第二子网络，得到第二预测输出；将所述第二预测输出输入所述目标召回模型的第二多层感知器，将第二多层感知器的输出作为所述对象表示向量。

至此，对本实施例提供的方法进行了说明，所述方法应用本申请提供的所述方法训练得到的目标召回模型，通过所训练后的模型的第一、第二子网络分别得到搜索词表示向量以及对象表示向量，基于搜索词向量与对象表示向量的相似度确定针对搜索词召回的召回对象。能够提高对象召回率及召回的精确率。

以上述实施例为基础，本申请第三实施例提供一种检索方法。以下结合图7至图8对所述方法进行说明，相同部分请参见上述实施例对应部分的描述，不再赘述。图7所示的检索方法，包括：步骤S701至步骤S704。

步骤S701，获取用户输入的搜索词，基于目标召回模型的第一子网络得到与所述搜索词对应的搜索词表示向量；其中，所述目标召回模型为本申请提供的所述召回模型的训练方法训练的召回模型。

本实施例提供的检索方法，基于向量相似度进行检索，具体根据用户输入的搜索词的搜索词表示向量，检索召回范围内与该搜索词表示向量相似度满足向量相似度条件的对象表示向量，对象表示向量代表的对象为召回对象，该方法能尽量召回与用户输入的搜索词所表示的搜索意图相关的对象。目标召回模型逻辑上包括搜索侧网络结构及对象侧网络结构，第一子网络位于搜索侧网络结构，第二子网络位于对象侧网络结构。实施时，搜索侧网络结构部分线上部署，在线预测搜索词表示向量；对象侧网络结构部分离线部署，以离线任务离线预测对象表示向量，将对象池新增对象以增量形式添加至包含对象表示向量的向量检索库。对象池可以理解为搜索系统的召回范围内的全量对象；向量检索库为针对线上预测得到的搜索表示向量进行线上向量相似度检索所查找的对象表示向量的范围，离线预测对象表示向量且增量更新向量检索库能够提供更高性能的检索。

本步骤为使用目标召回模型预测搜索侧用户输入的搜索词对应的搜索词表示向量，该搜索词表示向量包含该搜索侧搜索词的语义信息，其蕴含了所述用户的搜索意图。后续步骤中该搜索词表示向量用于确定与其相似的对象表示向量，从而召回与搜索词对应的召回对象。本实施例中，所述第一子网络与所述第二子网络具有相同的网络结构以及共享相同的网络参数，各自预测的搜索词表示向量和对象表示向量为同一高维空间的向量；所述对象表示向量为使用所述召回模型的对象侧网络结构离线生成的向量。

本实施例中，还包括构建用于检索与搜索表示向量相似的对象表示向量的索引。具体的，构建所述索引，包括：基于所述目标召回模型的第二子网络，确定对象候选集内的待召回对象对应的对象表示向量；根据所述对象表示向量相关的配送信息生成所述待召回对象的地址编码；基于所述地址编码对各对象表示向量进行数据聚合；构建用于基于搜索词检索对应的召回对象的倒排索引。

其中，所述根据所述对象表示向量相关的配送信息生成所述待召回对象的地址编码，包括：获取所述对象表示向量对应的对象标识、商户标识以及配送范围标识；展开所述配送范围标识对应的多边形，获取所述多边形覆盖的地址编码，作为所述待召回对象的地址编码；所生成的地址编码可以理解为基于配送范围的地址编码。实施时，可以采用地图划分算法的Geohash编码方法生成的编码。所谓Geohash编码方法，将二维的空间经纬度数据如地图或对其分割所得的某个区域编码成字符串来表示，如采用Base32编码方式。优选的，基于配送范围生成地址编码为：基于生成待召回对象(item)的配送信息生成Geohash编码，包括：根据商品标识获取对应的商户标识，取得商户的配送圈标识，根据商户配送圈标识对应的配送范围展开为多边形，枚举该多边形所覆盖的地址编码，作为该待召回对象的基于配送范围生成的所述地址编码。

其中，所述基于所述地址编码对各对象表示向量进行数据聚合，是将地址编码为key(键)组织各对象表示向量，具体包括：当同一地址编码对应的对象表示向量的数量少于对象数量阈值，基于线性索引聚合所述对象表示向量；否则基于层次聚类对所述对象表示向量进行聚合。所谓线性索引是将索引项集合组织为线性结构。所述层次聚类，是针对索引项数据的相似性和差异性将一组数据分为几个类别，属于同一类别的数据间的相似性很大，不同类别之间数据的相似性很小，跨类的数据关联性很低。实施时，可以预设对象数量阈值，如设为10000，商品数量(即对象向量数量)低于10000则线性索引，否则进行层次聚类。层次聚类的处理过程，包括：初始将每个对象表示向量归为一个第一类，计算每两个第一类之间的距离，所述距离表示两个向量之间的相似度；寻找各第一类之间最近的两个第一类，将其归为一各第二类，使得类的总数减少一；重新计算新归类得到的第二类与各个第一类之间的相似度；依次类推，实现对一个地址编码关联的所有对象表示向量的归类。

其中，所述构建用于基于搜索词检索对应的召回对象的倒排索引，包括：根据所述商品标识、商户标识以及商户的配送范围标识形成第一索引项(一级key)组织各对象表示向量的基于配送范围生成的Geohash；将Geohash作为第二索引项(二级key)组织各对象表示向量，构建的两层索引为所述倒排索引，配送范围->Geohash->对象表示向量(即商户商品)层次聚类这样两层索引结构为本申请构建的倒排索引的例子，以减少索引冗余量。优选的，所述倒排索引为两级索引，包括用于基于商户索引到其对应的地址编码集的第一级倒排索引(如上所述配送范围->Geohash)，以及，用于基于地址编码索引到其对应的对象表示向量集的第二级倒排索引(如上所述Geohash->对象表示向量)。

步骤S702，根据所述用户的用户位置确定配送范围覆盖所述用户位置的商户，获取所述商户的配送范围覆盖的地址编码。

本步骤为基于用户位置确定提供对象的一个或多个商户(如对象池对应的所有商户)，从而获取到各商户所覆盖的地址编码。所述用户位置，为用户选定的位置或用户允许情况下的定位。其中，所述获取所述商户的配送范围覆盖的地址编码，包括：基于所述第一级倒排索引检索到所述商户的配送范围覆盖的至少一个地址编码。

步骤S703，获取所述地址编码所关联的对象表示向量集，确定所述对象表示向量集中所述搜索词表示向量的若干个近邻向量。

本实施例采用ANN(Approximate Nearest Neighbor，近似近邻检索)检索，以加快搜索速度。本步骤为确定搜索词表示向量的若干个近邻向量。其中，所述获取所述地址编码所关联的对象表示向量集，包括：基于所述第二级倒排索引检索到所述地址编码对应的对象表示向量集。其中，确定所述对象表示向量集中所述搜索词表示向量的若干个近邻向量，包括：如果所述对象表示向量集为基于层次聚类生成，则逐层确定中心点，遍历每层中心点包含的下一级节点，直至线性比较各节点对应的向量与所述搜索词表示向量的相似度，筛选出与所述搜索词表示向量的相似度满足向量相似度条件的节点，将筛选出的节点对应的向量作为所述近邻向量。其中，所述逐层确定中心点，遍历每层中心点包含的下一级节点，直至线性比较各节点对应的向量与所述搜索词表示向量的相似度，包括：确定至少一个一级中心点，针对其一一级中心点，遍历该一级中心点包含的二级中心点；确定每个二级中心点包含的节点，遍历二级中心点包含的节点，线性比较各节点对应的向量与所述搜索词表示向量的相似度。实施时，针对每个Geohash对应的对象表示向量集，采用BBF(Best BinFirst)搜索策略，优先找到最近的若干个一级中心点，再依次遍历考察其二级中心点，最终线性比较这些二级中心点下的所有节点(即所有向量)，完成top-k近邻向量的选取。请参考图8，其示出了一种基于层次聚类的检索示意图，图中示例性的示出了两层中心点，实际上不限于两层，一级中心点C0、C1等，以C0为例，其中包含二级中心点，每个二级中心点包含聚合为该类别的一个或多个节点，直到每个节点为一个对象表示向量，选取查询点的top-K个近邻；查询点表示需要召回对应对象表示向量的搜索表示向量。

步骤S704，根据所述近邻向量确定针对所述搜索词表示向量检索到的对象表示向量，将所述检索到的对象表示向量对应的对象作为针对所述搜索词检索到的召回对象；所述近邻向量与所述搜索词表示向量之间的距离满足向量相似度条件。

本步骤为确定所述检索到的对象表示向量，其中可以将上述步骤确定的若干个近邻向量作为检索到的对象表示向量。当然，也可以进一步对上述步骤确定的若干个近邻向量进行筛选，其中，所述根据所述近邻向量确定针对所述搜索词表示向量检索到的对象表示向量，包括：确定所述近邻向量的配送范围；所述配送范围为一多边形；以所述用户位置为起始点作水平射线；若判断该射线与所述多边形的每条边的交点数量为奇数，则所述配送范围覆盖所述用户位置；否则所述配送范围未覆盖所述用户位置；剔除所述近邻向量中配送范围未覆盖所述用户位置的向量，剔除之后的其他近邻向量作为所述检索到的对象表示向量。从而，过滤掉所述若干个近邻向量中配送范围不包含所述用户位置的商户，去除空间制约因素对检索到的召回对象集的影响，从搜索全局角度实现召回的精准性。

本实施例中，还包括：将所述检索到的对象表示向量对应的对象作为针对所述搜索词检索到的第一召回对象；基于文本匹配获取与所述搜索词匹配的第二召回对象；针对所述第一召回对象以及所述第二召回对象，进行召回结果重排，重排后作为提供给用户的搜索结果的候选集。

本实施例提供的检索方法，对象表示向量召回平均深度得到了提升，同时场景RT99线(响应时间百分位)显著下降，召回率及检索效率较高。

本实施例提供的检索方法，所实现的产品形态，能够满足多元化精准查找需求，可应用于多端、多行业领域的搜索服务。并且，其所采用的目标召回模型对语义进行了充分挖掘，且学习了搜索词邻居之间的影响以及引入了搜索侧与对象侧的信息交互，因而泛化能力较强，在时空属性的强制约场景也能达到较好的召回率及精确率。此外，基于配送范围的两级索引结构便于实现基于用户位置剔除配送范围覆盖不到的商户对应的信息，从而提供高效而精准的检索服务，克服了空间制约因素对召回精准度的影响。

至此，对本实施例提供的方法进行了说明，所述方法应用本申请提供的所述召回模型的训练方法训练得到目标召回模型，通过所述目标召回模型的第一、第二子网络分别得到搜索词表示向量以及对象表示向量，基于搜索词向量与对象表示向量的相似度召回针对搜索词的召回对象，能够尽可能找到用户输入的搜索词体现的搜索意图所对应的召回对象，从而提高对象召回率及召回精确率。

与第一实施例对应，本申请第四实施例提供一种召回模型的训练装置，相关的部分请参见对应方法实施例的说明即可。请参考图9，图中所示的召回模型的训练装置，包括：

搜索侧网络单元901，用于将训练样本的搜索侧信息作为待训练的召回模型的第一输入信息，输入所述召回模型的第一子网络得到第一输出信息，根据所述第一输出信息确定所述训练样本的搜索词特征；

对象侧网络单元902，用于将训练样本的对象侧信息作为所述召回模型的第二输入信息，输入所述召回模型的第二子网络得到第二输出信息，根据所述第二输出信息确定所述训练样本的召回对象特征；

训练单元903，用于基于第一损失函数训练所述召回模型，训练后得到目标召回模型；其中，所述第一损失函数，基于训练样本的搜索词特征与对应的召回对象特征之间的相似度构建，用于作为训练所述召回模型的目标函数。

可选的，所述搜索侧网络单元901，具体用于：获取训练样本的搜索词的邻居信息，根据所述邻居信息获取所述搜索词的搜索词邻居特征；基于所述搜索词邻居特征和所述第一输出信息确定所述搜索词与所述邻居信息相关的图注意力特征；根据所述图注意力特征与所述搜索词特征确定第二损失函数，将所述第二损失函数用于训练所述召回模型。

可选的，所述召回模型还包括第三子网络，所述第三子网络为搜索侧用于根据训练样本的搜索词的邻居信息获取搜索词邻居特征的子网络；所述搜索侧网络单元901，具体用于：将所述邻居信息输入所述第三子网络，得到所述搜索词邻居特征。

可选的，所述训练单元903，具体用于：将所述第一损失函数以及所述第二损失函数作为用于训练所述召回模型的目标函数，训练所述召回模型。

可选的，所述搜索侧网络单元901，具体用于：获取搜索日志，根据所述搜索日志生成用于表征搜索词与该搜索词的召回对象之间的点击关系图，所述点击关系图的各节点为对应于搜索词信息的搜索词节点，以及对应于各搜索词的发生了用户点击的点击对象节点；基于对所述点击关系图中各搜索词节点进行邻居聚合生成二部图，将生成的二部图作为搜索点击图；根据所述搜索词对所述搜索点击图中与所述搜索词相关的邻居节点采样，将采样数据作为所述邻居信息。

可选的，所述搜索侧网络单元901，具体用于：将所述第一输出信息输入第一多层感知器，得到所述搜索词特征，所述搜索词特征包含搜索词语义信息。

可选的，所述对象侧网络单元902，具体用于：获取训练样本的搜索词对应的召回对象的点击数据；其中，其中，所述点击数据，包括针对所述召回对象的点击率满足点击率阈值或点击数量满足点击数量阈值的一个或多个搜索词；根据所述点击数据与所述召回对象的对象信息，生成所述第二输入信息。

可选的，所述对象侧网络单元902，具体用于：将所述第二输出信息输入第二多层感知器，得到所述召回对象特征，所述召回对象特征包含与搜索词对应的召回对象的语义信息。

可选的，所述训练单元903，具体用于：基于训练样本的搜索词特征与对应的召回对象特征之间的相似度构建所述第一损失函数；所述第一损失函数采用以下损失函数之一：infoNCE损失函数、Hinge损失函数、Triplet损失函数、Circle损失函数。

可选的，所述装置还包括样本构造单元，所述样本构造单元用于：从搜索日志中获取搜索侧用户输入的搜索词以及与所述搜索词对应的召回对象，确定所述召回对象中曝光且点击的召回对象；根据所述搜索词以及所述曝光且点击的召回对象构造正样本；基于所述正样本生成负样本，将所述正样本和/或所述负样本作为所述训练样本。

与第二实施例对应，本申请第五实施例提供一种搜索召回装置，相关的部分请参见对应方法实施例的说明即可。请参考图10，图中所示的搜索召回装置，包括：

搜索词表达单元1001，用于获取用户输入的搜索词，将所述搜索词输入目标召回模型的第一子网络，得到与所述搜索词对应的搜索词表示向量；其中，所述目标召回模型为应用所述召回模型的训练方法训练的召回模型；

对象表达单元1002，用于获取待召回对象的对象信息，将所述对象信息输入所述目标召回模型的第二子网络，得到与所述对象信息对应的对象表示向量；

召回单元1003，用于根据所述搜索词表示向量与所述对象表示向量的相似度，确定与所述搜索词对应的召回对象。

可选的，所述搜索词表达单元1001，具体用于：将所述搜索词输入所述第一子网络，得到第一预测输出；将所述第一预测输出输入所述目标召回模型的第一多层感知器，将第一多层感知器的输出作为所述搜索词表示向量。

可选的，所述对象表达单元1002，具体用于：将所述对象信息输入所述第二子网络，得到第二预测输出；将所述第二预测输出输入所述目标召回模型的第二多层感知器，将第二多层感知器的输出作为所述对象表示向量。

与第三实施例对应，本申请第六实施例提供一种检索装置，相关的部分请参见对应方法实施例的说明即可。请参考图11，图中所示的检索装置，包括：

搜索词表达单元1101，用于获取用户输入的搜索词，基于目标召回模型的第一子网络得到与所述搜索词对应的搜索词表示向量；其中，所述目标召回模型为应用所述召回模型的训练方法训练的召回模型；

检索地址编码单元1102，用于根据所述用户的用户位置确定配送范围覆盖所述用户位置的商户，获取所述商户的配送范围覆盖的地址编码；

检索近邻向量单元1103，用于获取所述地址编码所关联的对象表示向量集，确定所述对象表示向量集中所述搜索词表示向量的若干个近邻向量；

召回单元1104，用于根据所述近邻向量确定针对所述搜索词表示向量检索到的对象表示向量，将所述检索到的对象表示向量对应的对象作为针对所述搜索词检索到的召回对象；所述近邻向量与所述搜索词表示向量之间的距离满足向量相似度条件。

可选的，所述装置还包括索引构建单元，所述索引构建单元用于：基于所述目标召回模型的第二子网络，确定对象候选集内的待召回对象对应的对象表示向量；根据所述对象表示向量相关的配送信息生成所述待召回对象的地址编码；基于所述地址编码对各对象表示向量进行数据聚合；构建用于基于搜索词检索对应的召回对象的倒排索引。

可选的，所述检索地址编码单元1102，具体用于：基于所述第一级倒排索引检索到所述商户的配送范围覆盖的至少一个地址编码。

可选的，所述检索近邻向量单元1103，具体用于：基于所述第二级倒排索引检索到所述地址编码对应的对象表示向量集。

可选的，所述索引构建单元，具体用于：获取所述对象表示向量对应的对象标识、商户标识以及配送范围标识；展开所述配送范围标识对应的多边形，获取所述多边形覆盖的地址编码，作为所述待召回对象的地址编码。

可选的，所述索引构建单元，具体用于：当同一地址编码对应的对象表示向量的数量少于对象数量阈值，基于线性索引聚合所述对象表示向量；否则基于层次聚类对所述对象表示向量进行聚合。

可选的，所述检索近邻向量单元1103，具体用于：如果所述对象表示向量集为基于层次聚类生成，则逐层确定中心点，遍历每层中心点包含的下一级节点，直至线性比较各节点对应的向量与所述搜索词表示向量的相似度，筛选出与所述搜索词表示向量的相似度满足向量相似度条件的节点，将筛选出的节点对应的向量作为所述近邻向量。

可选的，所述检索近邻向量单元1103，具体用于确定至少一个一级中心点，针对其一一级中心点，遍历该一级中心点包含的二级中心点；确定每个二级中心点包含的节点，遍历二级中心点包含的节点，线性比较各节点对应的向量与所述搜索词表示向量的相似度。

可选的，所述召回单元1104，具体用于：确定所述近邻向量的配送范围；所述配送范围为一多边形；以所述用户位置为起始点作水平射线；若判断该射线与所述多边形的每条边的交点数量为奇数，则所述配送范围覆盖所述用户位置；否则所述配送范围未覆盖所述用户位置；

剔除所述近邻向量中配送范围未覆盖所述用户位置的向量，剔除之后的其他近邻向量作为所述检索到的对象表示向量。

以上述实施例为基础，本申请第七实施例提供一种电子设备，相关的部分请参见上述实施例的对应说明即可。请参考图12，图中所示的电子设备包括：存储器1201，以及处理器1202；所述存储器用于存储计算机程序，所述计算机程序被处理器运行后，执行本申请实施例提供的所述方法。

以上述实施例为基础，本申请第八实施例提供一种计算机存储介质，相关的部分请参见上述实施例的对应说明即可。所述计算机存储介质的示意图类似图12，图中的存储器可以理解为所述存储介质。所述计算机存储介质存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现本申请实施例提供的所述方法。

在一个典型的配置中，电子设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请虽然以较佳实施例公开如上，但其并不是用来限定本申请，任何本领域技术人员在不脱离本申请的精神和范围内，都可以做出可能的变动和修改，因此本申请的保护范围应当以本申请权利要求所界定的范围为准。

Claims

1.一种召回模型的训练方法，其特征在于，包括：

将训练样本的搜索侧信息作为待训练的召回模型的第一输入信息，输入所述召回模型的第一子网络得到第一输出信息，根据所述第一输出信息确定所述训练样本的搜索词特征；

将训练样本的对象侧信息作为所述召回模型的第二输入信息，输入所述召回模型的第二子网络得到第二输出信息，根据所述第二输出信息确定所述训练样本的召回对象特征；

基于第一损失函数训练所述召回模型，训练后得到目标召回模型；其中，所述第一损失函数，基于训练样本的搜索词特征与对应的召回对象特征之间的相似度构建，用于作为训练所述召回模型的目标函数。

2.根据权利要求1所述的方法，其特征在于，还包括：

获取训练样本的搜索词的邻居信息，根据所述邻居信息获取所述搜索词的搜索词邻居特征；

基于所述搜索词邻居特征和所述第一输出信息确定所述搜索词与所述邻居信息相关的图注意力特征；

根据所述图注意力特征与所述搜索词特征确定第二损失函数，将所述第二损失函数用于训练所述召回模型。

3.根据权利要求2所述的方法，其特征在于，所述召回模型还包括第三子网络，所述第三子网络为搜索侧用于根据训练样本的搜索词的邻居信息获取搜索词邻居特征的子网络；

所述根据所述邻居信息获取所述搜索词的搜索词邻居特征，包括：

将所述邻居信息输入所述第三子网络，得到所述搜索词邻居特征。

4.根据权利要求3所述的方法，其特征在于，所述第三子网络与所述第一子网络具有相同的网络结构和/或共享参数。

5.根据权利要求2所述的方法，其特征在于，所述基于第一损失函数训练所述召回模型，包括：

将所述第一损失函数以及所述第二损失函数作为用于训练所述召回模型的目标函数，训练所述召回模型。

6.根据权利要求2所述的方法，其特征在于，所述获取训练样本的搜索词的邻居信息，包括：

获取搜索日志，根据所述搜索日志生成用于表征搜索词与该搜索词的召回对象之间的点击关系图，所述点击关系图的各节点为对应于搜索词信息的搜索词节点，以及对应于各搜索词的发生了用户点击的点击对象节点；

基于对所述点击关系图中各搜索词节点进行邻居聚合生成二部图，将生成的二部图作为搜索点击图；

根据所述搜索词对所述搜索点击图中与所述搜索词相关的邻居节点采样，将采样数据作为所述邻居信息。

7.根据权利要求1所述的方法，其特征在于，所述根据所述第一输出信息确定所述训练样本的搜索词特征，包括：

将所述第一输出信息输入第一多层感知器，得到所述搜索词特征，所述搜索词特征包含搜索词语义信息。

8.根据权利要求1所述的方法，其特征在于，还包括：

获取训练样本的搜索词对应的召回对象的点击数据；其中，其中，所述点击数据，包括针对所述召回对象的点击率满足点击率阈值或点击数量满足点击数量阈值的一个或多个搜索词；

根据所述点击数据与所述召回对象的对象信息，生成所述第二输入信息。

9.一种搜索召回方法，其特征在于，包括：

获取用户输入的搜索词，将所述搜索词输入目标召回模型的第一子网络，得到与所述搜索词对应的搜索词表示向量；其中，所述目标召回模型为权利要求1至8任一项所述方法训练的召回模型；

获取待召回对象的对象信息，将所述对象信息输入所述目标召回模型的第二子网络，得到与所述对象信息对应的对象表示向量；

根据所述搜索词表示向量与所述对象表示向量的相似度，确定与所述搜索词对应的召回对象。

10.一种检索方法，其特征在于，包括：

获取用户输入的搜索词，基于目标召回模型的第一子网络得到与所述搜索词对应的搜索词表示向量；其中，所述目标召回模型为权利要求1至8任一项所述方法训练的召回模型；

根据所述用户的用户位置确定配送范围覆盖所述用户位置的商户，获取所述商户的配送范围覆盖的地址编码；

获取所述地址编码所关联的对象表示向量集，确定所述对象表示向量集中所述搜索词表示向量的若干个近邻向量；

根据所述近邻向量确定针对所述搜索词表示向量检索到的对象表示向量，将所述检索到的对象表示向量对应的对象作为针对所述搜索词检索到的召回对象；所述近邻向量与所述搜索词表示向量之间的距离满足向量相似度条件。