CN114492313B

CN114492313B - 编码器的训练方法、资源推荐方法及装置

Info

Publication number: CN114492313B
Application number: CN202111628281.1A
Authority: CN
Inventors: 李帆; 林英乔
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2021-12-28
Filing date: 2021-12-28
Publication date: 2024-07-16
Anticipated expiration: 2041-12-28
Also published as: CN114492313A

Abstract

本公开关于一种编码器的训练方法、资源推荐方法及装置，属于计算机技术领域。其中，方法包括：获取样本集；利用初始编码器对每个样本进行编码处理，以获取每个样本对应的第一特征向量；利用每个第一特征向量，对初始编码器和第一标注信息对应的第一识别模型进行训练，以获取候选编码器；利用候选编码器对每个样本进行编码处理，以获取每个样本对应的第二特征向量；利用每个第二特征向量，对候选编码器和第二标注信息对应的第二识别模型进行训练，得到目标编码器。由此，通过训练多个识别模型得到共同的编码器，可以利用编码器对不同资源类型的资源进行表征，实现不同资源类型的资源的同空间表征，便于进行跨域兴趣的电商推荐。

Description

编码器的训练方法、资源推荐方法及装置

技术领域

本公开涉及计算机技术领域，尤其涉及一种编码器的训练方法、资源推荐方法及装置。

背景技术

在电商领域，消费者在多种类型的资源(比如短视频、直播、商品、广告等)上通常会有电商兴趣。相关技术中的电商领域内容理解方法，主要是针对不同类型的资源，以及不同的识别任务分开建模，之后利用每种模型对相应的内容进行识别。

由于是针对不同类型的资源以及不同的识别任务分开去建模，这样在跨域兴趣的电商推荐中会有一定的局限。

发明内容

本公开提供一种编码器的训练方法、资源推荐方法及装置。本公开的技术方案如下：

根据本公开实施例的第一方面，提供一种编码器的训练方法，包括：

获取样本集；其中，所述样本集包括不同资源类型的多个样本及每个样本对应的第一标注信息和第二标注信息，所述第一标注信息与所述第二标注信息对应不同的识别模型；

利用初始编码器对每个所述样本进行编码处理，以获取每个所述样本对应的第一特征向量；

利用每个所述第一特征向量，对所述初始编码器和所述第一标注信息对应的第一识别模型进行训练，以获取候选编码器；

利用所述候选编码器对每个所述样本进行编码处理，以获取每个所述样本对应的第二特征向量；

利用每个所述第二特征向量，对所述候选编码器和所述第二标注信息对应的第二识别模型进行训练，得到目标编码器；其中，所述第二识别模型与所述第一识别模型的识别内容不同。

根据本公开实施例的第二方面，提供一种资源推荐方法，包括：

获取目标资源；

利用目标编码器对所述目标资源进行表征，以获取所述目标资源对应的特征向量；其中，所述目标编码器是采用上述第一方面实施例所述的训练方法获取的；

根据所述目标资源对应的特征向量，获取待推荐资源；

向所述目标资源对应的用户推荐所述待推荐资源。

根据本公开实施例的第三方面，提供一种编码器的训练装置，包括：

第一获取模块，被配置为获取样本集；其中，所述样本集包括不同资源类型的多个样本及每个样本对应的第一标注信息和第二标注信息，所述第一标注信息与所述第二标注信息对应不同的识别模型；

特征提取模块，被配置为利用初始编码器对每个所述样本进行编码处理，以获取每个所述样本对应的第一特征向量；

训练模块，被配置为利用每个所述第一特征向量，对所述初始编码器和所述第一标注信息对应的第一识别模型进行训练，以获取候选编码器；

所述特征提取模块，被配置为利用所述候选编码器对每个所述样本进行编码处理，以获取每个所述样本对应的第二特征向量；

所述训练模块，还被配置为利用每个所述第二特征向量，对所述候选编码器和所述第二标注信息对应的第二识别模型进行训练，得到目标编码器；其中，所述第二识别模型与所述第一识别模型的识别内容不同。

根据本公开实施例的第四方面，提供一种资源推荐装置，包括：

第一获取模块，被配置为获取目标资源；

第二获取模块，被配置为利用目标编码器对所述目标资源进行表征，以获取所述目标资源对应的特征向量；其中，所述目标编码器是采用上述第一方面实施例所述的训练方法获取的；

第三获取模块，被配置为根据所述目标资源对应的特征向量，获取待推荐资源；

推荐模块，被配置为向所述目标资源对应的用户推荐所述待推荐资源。

根据本公开实施例的第五方面，提供一种计算机设备，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如上述实施例所述的编码器的训练方法，或者资源推荐方法。

根据本公开实施例的第六方面，提供一种存储介质，当所述存储介质中的指令由计算机设备的处理器执行时，使得计算机设备能够执行如前所述的编码器的训练方法，或者资源推荐方法。

根据本公开实施例的第七方面，提供一种计算机程序产品，该计算机程序由计算机设备的处理器执行时，使得计算机设备能够执行如前所述的编码器的训练方法，或者资源推荐方法。

本公开的实施例提供的技术方案至少带来以下有益效果：通过训练多个识别模型，得到共同的编码器，利用共用的编码器对各资源类型的资源进行表征，从而可以实现各资源类型的资源的同空间表征，将消费兴趣由隐式关联变为显示关联，便于进行电商推荐，实现了跨域兴趣推荐。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1是根据一示例性实施例示出的一种编码器的训练方法的流程示意图。

图2是根据一示例性实施例示出的另一种编码器的训练方法的流程示意图。

图3是根据一示例性实施例示出的一种资源推荐方法的流程示意图。

图4是根据一示例性实施例示出的另一种资源推荐方法的流程示意图。

图5是根据一示例性实施例示出的一种兴趣推荐示意图。

图6是根据一示例性实施例示出的一种基于同空间特征向量的不同资源类型兴趣检索示意图。

图7是根据一示例性实施例示出的一种基于多任务模型的同空间构建示意图。

图8是根据一示例性实施例示出的一种编码器的训练装置的框图。

图9是根据一示例性实施例示出的一种资源推荐装置的框图。

图10是根据一示例性实施例示出的一种用于编码器的训练或资源推荐的计算机设备的框图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种编码器的训练方法的流程示意图，如图1所示，该编码器的训练方法包括以下步骤。

在步骤101中，获取样本集。

本公开中，样本集中可以包括不同资源类型的多个样本以及每个样本对应的第一标注信息和第二标注信息。其中，第一标注信息与第二标注信息对应不同的识别模型，也就是说，第一标注信息和第二标注信息可以用于不同识别模型的训练。

本公开中，资源类型可以包括短视频、电商直播、商品的图片及描述信息、广告等。比如，样本集中可以包括多个电商短视频、多个电商直播、多个商品的图片及描述信息等，第一标注信息可以为商品实体标识，第二标注信息可以为商品类别。

需要说明的是，本公开中，第二标注信息可以是一个，也可以是多个，本公开对此不作限定。

在步骤102中，利用初始编码器对每个样本进行编码处理，以获取每个样本对应的第一特征向量。

本公开中，可以根据样本的资源类型，利用初始编码器对样本进行相应的编码处理，获取样本的第一特征向量。比如，资源类型为商品的图像及文本描述，可以利用编码器分别对图像和文本描述分别进行编码处理，获取图像对应的向量和文本对应的向量，并将两种向量进行融合，得到该资源类型的特征向量。比如，资源类型为短视频，可以对短视频中的图像进行编码处理，获取特征向量。比如，资源类型为商品的图片，可以对商品的图片进行光学字符识别(Optical Character Recognition，OCR)，以获取文本数据，之后分别对商品图片和文本数据进行编码处理，并将两种向量进行融合，得到该资源类型的特征向量。

在步骤103中，利用每个第一特征向量，对初始编码器和第一标注信息对应的第一识别模型进行训练，以获取候选编码器。

其中，第一识别模型与第一标注信息对应。比如，第一标注信息为商品实体标识，那么第一识别模型可以为商品实体识别模型，又如第一标注信息为商品类别，那么第一识别模型可以为商品类别识别模型。

本公开中，可以将每个样本对应的第一特征向量输入至第一识别模型中，以获取预测结果，并根据预测结果与第一标注信息之间的差异，对初始编码器和第一识别模型的参数进行调整，由此，通过训练可以得到候选编码器和满足条件的第一识别模型。

在步骤104中，利用候选编码器对每个样本进行编码处理，以获取每个样本对应的第二特征向量。

本公开中，利用候选编码器对每个样本进行编码处理的方式，与上述利用初始编码器对每个样本进行编码处理的方式类似，故在此不再赘述。

步骤105中，利用每个第二特征向量，对候选编码器和第二标注信息对应的第二识别模型进行训练，得到目标编码器。

本公开，第二标注信息可以是一个，也可以是多个。若第二标注信息有多个，可以依次根据样本及每个第二标注信息，对相应的第二识别模型进行训练，训练每个第二识别模型所用的编码器是在之前的第二识别模型训练结束时得到的编码器，直到所有第二识别模型训练结束，得到目标编码器。其中，第二识别模型与第一识别模型识别的内容不同。

比如，第二标注信息有两个，商品类别和商品属性。在训练时，可以先利用每个样本及对应的商品类别，对候选编码器和商品类别识别模型进行训练，在训练结束时，得到相应的编码器。其中，商品类别识别模型可以用于识别视频所属的商品类别。之后，可以利用样本及对应的商品属性，对商品类别识别模型训练结束时得到的编码器和商品属性识别模型进行训练，在训练结束时，得到目标编码器。

本公开中，通过训练多个识别模型得到目标编码器，该目标编码器是多个识别模型共用的编码器。

在获取目标编码器之后，可以利用目标编码器对不同资源类型的资源进行表征，得到不同资源类型的资源对应的特征向量，从而利用通过训练多任务模型得到编码器，可以将不同资源类型的资源在同空间中进行表征，进而可以把消费兴趣的隐式关联变为显示关联，便于进行跨域兴趣的电商推荐。比如，可以将短视频、电商直播、商品的图片及文本描述信息等分别用目标编码器进行编码处理，从而可以将短视频、电商直播、商品的图片及文本描述信息等在同一表征空间进行表征。

本公开实施例中，通过获取样本集，并利用初始编码器对每个样本进行编码处理，以获取每个样本对应的第一特征向量；利用每个第一特征向量，对初始编码器和第一标注信息对应的第一识别模型进行训练，以获取候选编码器；利用候选编码器对每个样本进行编码处理，以获取每个样本对应的第二特征向量；利用每个第二特征向量，对候选编码器和第二标注信息对应的第二识别模型进行训练，得到目标编码器。由此，通过训练多个识别模型，得到共同的编码器，利用共用的编码器对各资源类型的资源进行表征，从而可以实现各资源类型的资源的同空间表征，将消费兴趣由隐式关联变为显示关联，便于进行电商推荐，实现了跨域兴趣推荐。

由于资源类型是多样的，为了提高准确性，在本公开的一个实施例中，在上述获取样本集之后，可以根据样本的类型对样本进行处理，以将样本转换为图文数据，便于模型训练。

本公开中，在任一样本的资源类型为视频，比如短视频、电商直播等的情况下，可以对任一样本进行采样，获取多帧图像及音频数据，之后可以对音频数据进识别，获取任一样本对应的文本数据，那么根据多帧图像及文本数据，可以获取任一样本对应的图文数据。从而，可以将各资源类型的样本统一转换为图文数据，从而便于训练，实现利用不同资源类型的样本训练得到将各资源类型的资源，在同一空间进行表征的目的。

进一步地，还可以对文本数据进行处理，以文本数据中筛选出包含商品信息的文本数据，进而根据多帧图像和筛选出的文本数据，得到图文数据，那么基于该图文数据进行训练，可以提高编码器的准确性。

如图2所示，上述利用初始编码器对每个样本进行编码处理，以获取每个样本对应的第一特征向量，包括：

在步骤201中，利用初始编码器对每帧图像进行编码处理，获取每帧图像对应的图像特征向量。

在对资源类型为视频的样本进行处理，得到样本对应的图文数据之后，可以利用初始编码器对该样本的图文数据进行编码处理。其中，初始编码器可以包括初始图像编码器和初始文本编码器。

本公开中，若任一样本对应的图文数据中包括多帧图像和文本数据，可以利用初始图像编码器对每帧图像进行编码处理，得到每帧图像对应的图像特征向量。

在步骤202中，对多帧图像分别对应的图像特征向量进行池化处理，以获取多帧图像的池化向量。

本公开中，在获取每帧图像对应的图像特征向量后，可以利用池化层对多帧图像分别对应的图像特征向量进行池化处理，以获取多帧图像的池化向量，从而得到任一样本的视觉表征。

在步骤203中，利用初始编码器对文本数据进行编码处理，以获取文本向量。

本公开中，可以利用初始编码器中的初始文本编码器对文本数据进行编码处理，以获取相应的文本向量，即得到任一样本的文本表征。其中，文本数据可以包括标题、商品的描述信息等。

在步骤204中，将池化向量与文本向量进行融合，以得到任一样本对应的第一特征向量。

在获取多帧图像的池化向量和文本数据的文本向量后，可以将池化向量与文本向量进行融合，得到任一样本对应的第一特征向量。

低秩矩阵分解(Low Rank Matrix Factorization，LMF)是一种高效的多模态表征融合方式。本公开中，在对池化向量和文本向量进行融合时，可以采用LMF进行融合，得到样本对应的第一特征向量。

若样本为多张图像和文本数据，比如在电商领域，样本为某商品的多张图片和相应的描述信息时，可以直接利用初始编码器对样本进行编码处理。

若样本为单张图像和文本数据，比如样本为某商品的图片对应的描述信息，那么可以利用初始编码器分别对单张图像和文本数据分别进行编码处理，得到图像特征向量和文本向量，之后可以将单张图像对应的图像特征向量，与文本数据对应的文本向量进行融合，得到该样本的第一特征向量。

可以理解的是，在对单帧图像对应的图像特征向量和文本数据对应的文本向量进行融合时，也可以采用LMF进行融合。

本公开实施例中，对于资源类型为视频的样本，在利用初始编码器进行编码处理，获取第一特征向量时，可以通过利用初始编码器对每帧图像进行编码处理，获取每帧图像对应的图像特征向量；对多帧图像分别对应的图像特征向量进行池化处理，以获取多帧图像的池化向量；利用初始编码器对文本数据进行编码处理，以获取文本向量；将池化向量与文本向量进行融合，以得到任一样本对应的第一特征向量。由此，通过将多帧图像的图像特征向量进行融合，得到最终的视觉特征向量，并与文本向量进行融合，得到样本的特征向量，实现了对视频类样本的编码处理。

可以理解的是，在利用候选编码器对每个样本进行编码处理，以获取每个样本对应的第二特征向量时，对于资源类型为视频的样本，可以先将样本转换为图文数据，之后利用候选编码器对图文数据中的多帧图像进行编码处理，获取多帧图像分别对应的图像特征向量，对多帧图像分别对应的图像特征向量进行池化处理，获取池化向量，并利用候选编码器对文本数据进行编码处理，获取文本向量，之后将池化向量和文本向量进行融合，得到样本的第二特征向量，也就是即可以采用与上述图2实施例类似的方式，获取第二特征向量。

若样本为单帧图像和文本数据，比如样本为某商品的图片对应的描述信息，那么可以利用候选编码器分别对单帧图像和文本数据分别进行编码处理，得到图像特征向量和文本向量，之后可以将单帧图像对应的图像特征向量，与文本数据对应的文本向量进行融合，得到该样本的第二特征向量。

图3是根据一示例性实施例示出的一种资源推荐方法的流程示意图。如图3所示，该资源推荐方法包括以下步骤。

在步骤301中，获取目标资源。

本公开中，目标资源可以是基于用户在搜索引擎中的输入获取，也可以是根据用户的历史行为数据确定的。比如，用户在搜索引擎中输入了某商品的名称、商品标识等，根据用户输入确定商品的图片、文本描述信息等，又如，根据用户历史行为数据，确定用户观看的某电商直播等，那么可以将该电商直播作为目标资源。

在步骤302中，利用目标编码器对目标资源进行表征，以获取目标资源对应的特征向量。

其中，目标编码是基于上述实施例的方式获取的，该目标编码器可以对各资源类型的资源进行编码，从而将不同资源的类型在同一空间进行表征。

本公开中，可以根据目标资源的资源类型，利用初始编码器对样本进行相应的编码处理，获取目标资源对应的征向量。比如，目标资源为商品的图像及文本描述，可以利用编码器分别对图像和文本描述分别进行编码处理，获取图像对应的向量和文本对应的向量，并将两种向量进行融合，得到该目标资源的特征向量。

在步骤303中，根据目标资源对应的特征向量，获取待推荐资源。

本公开中，可以从资源库中获取某资源，并利用目标编码器对该资源进行编码处理，获取该资源对应的特征向量，将目标资源对应的特征向量与该资源对应的特征向量进行匹配。若匹配度大于阈值，可以将该资源作为待推荐资源，并获取下一资源，利用目标编码器获取该下一资源对应的特征向量，将目标资源对应的特征向量与该下一资源对应的特征向量进行匹配，如果匹配大于阈值，也可以将该下一资源作为待推荐资源，由此可以获取待推荐资源，直至获取预设数量或者满足要求的所有待推荐资源。

其中，资源库中包括多种资源类型的资源，待推荐资源的类型与目标资源的类型可能相同，也可能不同。比如，目标资源为某商品的图片，待推荐资源可以是类似商品、短视频、电商直播等。

需要说明的是，本公开中，利用目标编码器对资源库中的资源进行编码处理的方法，与上述对目标编码器对目标资源进行编码处理的方法类似，故在此不再赘述。

在步骤304中，向目标资源对应的用户推荐待推荐资源。

在确定待推荐资源，可以将待推荐资源推荐给目标资源对应的用户。这里目标资源对应的用户，可以是指浏览过目标资源、购买过目标资源等的用户。

比如，用户A浏览过某商品m，那么可以将有关商品m的短视频、直播等推荐给用户A。

又如，用户B购买过商品n，可以利用目标编码器对应商品n的图片和文本描述信息进行编码处理，得到商品n的特征向量。之后，将商品n的特征向量与资源库中各短视频的特征向量进行比对，筛选出匹配度最高的前10个短视频，可以将这10个短视频推荐给该用户。

可以理解的是，也可以根据用户浏览过的视频，召回同空间的商品。在实现时，可以根据视频对应的特征向量与各商品对应的特征向量之间的匹配度，筛选出匹配度较高的前预设数量的商品，并向用户推荐这些商品。

本公开实施例中，通过获取目标资源；利用目标编码器对目标资源进行表征，以获取目标资源对应的特征向量；根据目标资源对应的特征向量，获取待推荐资源；向目标资源对应的用户推荐待推荐资源。由于目标编码器可以对不同资源类型的资源进行编码处理，由此通过利用目标编码器对目标资源进行编码处理得到的特征向量，确定待推荐资源，可以实现跨域兴趣的推荐。

图4是根据一示例性实施例示出的另一种资源推荐方法的流程示意图。如图4所示，该资源推荐方法包括以下步骤。

在步骤401中，获取目标资源。

在步骤402中，利用目标编码器对目标资源进行表征，以获取目标资源对应的特征向量。

本公开中，步骤401-步骤402与上述实施例中记载的获取目标资源对应的特征向量方式类似，故在此补再赘述。

在步骤403中，利用目标编码器，获取多种资源类型的各候选资源对应的特征向量。

本公开中，可以获取多种资源类型的各候选资源，比如获取多个商品的图片或者图片和文本描述、多个短视频、多个电商直播等，之后可以利用目标编码器，对每个候选资源进行编码处理，以获取每个候选资源对应的特征向量。

其中，利用目标编码器对候选资源进行编码处理的方法，与上述实施例中记载的利用初始编码器对不同资源类型的样本进行编码处理的方式类似，故在此不再赘述。

在步骤404中，根据目标资源对应的特征向量与各候选资源对应的特征向量之间的匹配度，从各候选资源中确定出待推荐资源。

在获取各候选资源对应的特征向量之后，可以计算目标资源对应的特征向量与每个候选资源对应的特征向量之间的匹配度，可以将匹配度大于阈值的候选资源，确定为待推荐资源，或者也可以将匹配度最高的前预设数量的候选资源作为待推荐资源。

比如，目标资源为某商品的图片，从各候选资源中筛选出该商品的20个短视频、5个直播，可将这20个短视频和5个直播，作为待推荐资源。

需要说明的是，本公开中，阈值、预设数量等均可以根据实际需要确定的，本公开对此不作限定。

在步骤405中，向目标资源对应的用户推荐待推荐资源。

本公开中，步骤405与上述实施例中记载的向目标资源对应的用户推荐待推荐资源的方式类似，故在此不再赘述。

本公开中，在根据目标资源对应的特征向量，获取待推荐资源时，可以利用目标编码器，获取多种资源类型的各候选资源对应的特征向量；根据目标资源对应的特征向量与各候选资源对应的特征向量之间的匹配度，从各候选资源中确定出待推荐资源。由此，基于目标编码器对目标资源及多种资源类型的各候选资源进行编码处理，可以将不同资源类型的候选资源在同一空间进行表征，从而可以实现相同资源类型兴趣的推荐、跨域兴趣的推荐，适用范围广。

在本公开的一个实施例中，在向目标资源对应的用户推荐待推荐资源的同时，也可以向待推荐资源的用户推荐目标资源。比如，将用户A浏览过的某商品t的短视频作为目标资源，待推荐资源为商品t的直播，那么可以将观看过商品t直播的用户推荐商品t的短视频。从而，进一步进行跨域兴趣推荐。

在本公开的一个实施例中，还可以对同空间特征向量的商品进行聚类，基于聚类结果进行定向推荐。

在实现时，可以根据各待聚类资源的类型，对各待聚类资源进行处理，得到每个待聚类资源对应的图文数据，利用目标编码器对每个待聚类资源对应的图文数据进行编码处理，获取各待聚类资源对应的特征向量。之后，根据各待聚类资源对应的特征向量之间的匹配度进行聚类，对各待聚类资源进行聚类，以获取至少一个聚类簇，由此，可以将同一商品或类似商品对应的资源聚类到一起。

在获取至少一个聚类簇之后，可以根据每个聚类簇中各资源对应的用户，获取每个聚类簇对应的待推荐人群，并向每个聚类簇对应的待推荐人群，推荐每个聚类簇中的资源。

本公开中，各资源对应的用户，比如，某用户购买了商品，即为该商品对应的用户，某用户浏览短视频，即为该短视频对应的用户。

在推荐时，如果聚类簇对应的待推荐人群中某些用户未使用过该聚类簇中的某些资源，则可以将这些资源推荐给该用户。

为了便于说明，下面以图5为例进行说明，图5是根据一示例性实施例示出的一种兴趣推荐示意图。如图5所示，某聚类簇中包括某商品的图片和该商品的电商短视频，观看短视频的用户和购买商品的用户，构成了待推荐人群。在进行推荐时，可以将短视频分发给即推荐给待推荐人群中的商品购买用户，将商品推荐给待推荐人群中短视频观看用户，从而实现定向推荐。

本公开实施例中，可以通过利用目标编码器获取各待聚类资源对应的特征向量；根据各待聚类资源对应的特征向量，对各待聚类资源进行聚类，以获取至少一个聚类簇；根据每个聚类簇中各资源对应的用户，获取每个聚类簇对应的待推荐人群；向每个聚类簇对应的待推荐人群，推荐每个聚类簇中的资源。由此，通过相关的资源聚类到一起，从而构建待推荐人群，实现资源的定向推荐。

在本公开的一个实施例中，还可以根据同空间资源的特征向量，对用户感兴趣的资源进行检索，以将检索到的资源与其他用户特征结合，并利用推荐排序模型进行推荐。下面结合图6进行说明，图6是根据一示例性实施例示出的一种基于同空间特征向量的不同资源类型的兴趣检索示意图。

如图6所示，以检索信息为直播片段为例，可以用上述目标编码器得到该直播片段对应的特征向量，利用直播片段的特征向量，在用户长期行为序列中进行检索，比如在用户短视频兴趣、直播兴趣、商品兴趣中进行检索，得到该直播片段相关的多个短视频、直播、商品等。之后，将该直播片段相关的多个短视频、直播、商品等，结合该直播片段、用户短期行为序列、用户属性特征、其他用户特征，通过特征提取层进行特征提取，之后将特征向量输入得到推荐排序模型，得到检索到的资源的得分。之后可以根据得分，对检索到的资源进行排序，根据排序结果进行推荐。

为了进一步说明上述实施例，下面结合图7进行说明，图7是根据一示例性实施例示出的一种基于多任务模型的同空间构建示意图。

如图7所示，多任务模型包括一个编码器和5个识别模型，其中，5个识别模型分别对应的学习任务是电商短视频/广告分类、电商意图分类、电商直播库存量单位(StockKeeping Unit，SKU)识别、商品实体识别和商品属性识别。

资源可以是电商短视频、电商直播、商品等，其中，商品是指商品的图片和文本描述信息。在同空间构建中，可以对这些资源进行处理，将各模型都抽象成图文多模态融合识别任务，这些输入信息可以是封面图、视频帧、标题、描述等，其中，对于视频中音频数据可以采用自动语音识别技术转换为文本，还可以采用OCR技术识别图片中的文字，从而将资源转换为图文数据，并输入至编码器中。编码器可以包括图像编码器和文本编码器，利用图像编码器和文本编码器对输入信息进行特征提取，之后得到的向量进行融合，得到特征向量，将特征向量输入至分类器中。

由于考虑到实体识别任务的颗粒度在5个任务中是最适中，向上可以到分类的泛化，向下可以到属性的细化。因此，在多任务的学习中，可以先选择商品实体识别任务，预训练整个模型。然后，再利用商品实体识别任务结束时得到的编码器，细调其他的多任务学习，得到最终的编码器。也就是说，可以将商品实体识别作为第一训练任务，将其余4个任务作为第二训练任务。

另外，考虑到各资源的信息关注点可能存在不同，可以使用不同的类型标签来区分各资源，也将其作为模型特征的输入，可以让模型对于该关注哪些内容也有一个区分的判断依据。

由于本公开中是利用多任务识别构建的特征向量，所以这个特征向量内含了分类、实体、属性等信息。并且，不同资源类型的多任务训练方式还可以实现内容识别能力的迁移，比如任务中学习了视频的分类和商品的实体，但是对应的视频实体和商品分类结果，也能做一定的输出。也就是说，最后特征向量内含了极为丰富的信息，作为用户行为特征的辅助信息会提供更为丰富的用户兴趣。

为了实现上述实施例，本公开实施例还提供一种编码器的训练装置。图8是根据一示例性实施例示出的一种编码器的训练装置的框图。

参照图8，该装置800包括第一获取模块810、特征提取模块820及训练模块830。

该第一获取模块810，被配置为获取样本集；其中，所述样本集包括不同资源类型的多个样本及每个样本对应的第一标注信息和第二标注信息，所述第一标注信息与所述第二标注信息对应不同的识别模型；

该特征提取模块820，被配置为利用初始编码器对每个所述样本进行编码处理，以获取每个所述样本对应的第一特征向量；

该训练模块830，被配置为利用每个所述第一特征向量，对所述初始编码器和所述第一标注信息对应的第一识别模型进行训练，以获取候选编码器；

该特征提取模块820，被配置为利用所述候选编码器对每个所述样本进行编码处理，以获取每个所述样本对应的第二特征向量；

该训练模块830，还被配置为利用每个所述第二特征向量，对所述候选编码器和所述第二标注信息对应的第二识别模型进行训练，得到目标编码器；其中，所述第二识别模型与所述第一识别模型的识别内容不同。

在本公开实施例一种可能的实现方式中，该装置还可以包括：

第二获取模块，被配置为在任一样本的资源类型为视频的情况下，对所述任一样本进行采样，获取多帧图像及音频数据；

识别模块，被配置为对所述音频数据进行识别，获取所述任一样本对应的文本数据；

第三获取模块，被配置为根据所述多帧图像和所述文本数据，获得所述任一样本对应的图文数据。

在本公开实施例一种可能的实现方式中，该特征提取模块820，被配置为：

利用所述初始编码器对每帧图像进行编码处理，获取每帧图像对应的图像特征向量；

对所述多帧图像分别对应的图像特征向量进行池化处理，以获取所述多帧图像的池化向量；

利用所述初始编码器对所述文本数据进行编码处理，以获取文本向量；

将所述池化向量与所述文本向量进行融合，以得到所述任一样本对应的第一特征向量。

在实际使用时，本公开实施例提供的编码器的训练装置，可以被配置在任意计算机设备中，以执行前述的编码器的训练方法。

为了实现上述实施例，本公开实施例还提供一种资源推荐装置。图9是根据一示例性实施例示出的一种资源推荐装置的框图。

如图9所示，该资源推荐装置900包括：第一获取模块910、第二获取模块920、第三获取模块930和推荐模块940。

该第一获取模块910，被配置为获取目标资源；

该第二获取模块920，被配置为利用目标编码器对所述目标资源进行表征，以获取所述目标资源对应的特征向量；其中，所述目标编码器是采用上述实施例所述的训练方法获取的；

该第三获取模块930，被配置为根据所述目标资源对应的特征向量，获取待推荐资源；

该推荐模块940，被配置为向所述目标资源对应的用户推荐所述待推荐资源。

在本公开实施例一种可能的实现方式中，该第二获取模块920，还被配置为：

确定所述目标资源的资源类型；

根据所述目标资源的资源类型，对所述目标资源进行处理，以获取所述目标资源对应的图文数据；

利用所述目标编码器，对所述目标资源对应的图文数据进行编码处理，以获取每个所述目标资源对应的特征向量。

在本公开实施例一种可能的实现方式中，该第三获取模块930，还被配置为：

利用所述目标编码器，获取多种资源类型的各候选资源对应的特征向量；

根据所述目标资源对应的特征向量与各候选资源对应的特征向量之间的匹配度，从所述各候选资源中确定出待推荐资源。

第四获取模块，被配置为利用所述目标编码器获取各待聚类资源对应的特征向量；

聚类模块，被配置为根据各待聚类资源对应的特征向量，对所述各待聚类资源进行聚类，以获取至少一个聚类簇；

第五获取模块，被配置为根据每个所述聚类簇中各资源对应的用户，获取每个所述聚类簇对应的待推荐人群；

该推荐模块940，还被配置为向每个所述聚类簇对应的待推荐人群，推荐每个所述聚类簇中的资源。

在实际使用时，本公开实施例提供的资源推荐表征装置，可以被配置在任意计算机设备中，以执行前述资源推荐方法。

本公开的实施例提供的资源推荐装置，通过获取目标资源；利用目标编码器对目标资源进行表征，以获取目标资源对应的特征向量；根据目标资源对应的特征向量，获取待推荐资源；向目标资源对应的用户推荐待推荐资源。由于目标编码器可以对不同资源类型的资源进行编码处理，由此通过利用目标编码器对目标资源进行编码处理得到的特征向量，确定待推荐资源，可以实现跨域兴趣的推荐。

图10是根据一示例性实施例示出的一种用于编码器的训练或资源推荐的计算机设备1000的框图。

如图10所示，上述计算机设备1000包括：

存储器1010及处理器1020，连接不同组件(包括存储器1010和处理器1020)的总线1030，存储器1010存储有计算机程序，当处理器1020执行所述程序时实现本公开实施例所述的编码器的训练方法，或者资源推荐方法。

总线1030表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(ISA)总线，微通道体系结构(MAC)总线，增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。

计算机设备1000典型地包括多种计算机设备可读介质。这些介质可以是任何能够被计算机设备1000访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

存储器1010还可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(RAM)1040和/或高速缓存存储器1050。计算机设备1000可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储系统1060可以用于读写不可移动的、非易失性磁介质(图10未显示，通常称为“硬盘驱动器”)。尽管图10中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线1030相连。存储器1010可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本公开各实施例的功能。

具有一组(至少一个)程序模块1070的程序/实用工具1080，可以存储在例如存储器1010中，这样的程序模块1070包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块1070通常执行本公开所描述的实施例中的功能和/或方法。

计算机设备1000也可以与一个或多个外部设备1090(例如键盘、指向设备、显示器991等)通信，还可与一个或者多个使得用户能与该计算机设备1000交互的设备通信，和/或与使得该计算机设备1000能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1092进行。并且，计算机设备1000还可以通过网络适配器1093与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器1093通过总线1030与计算机设备1000的其它模块通信。应当明白，尽管图中未示出，可以结合计算机设备1000使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

处理器1020通过运行存储在存储器1010中的程序，从而执行各种功能应用以及数据处理。

需要说明的是，本实施例的服务器的实施过程和技术原理参见前述对本公开实施例的编码器的训练方法，或者资源推荐方法的解释说明，此处不再赘述。

本公开实施例提供的计算机设备，可以执行如前所述的编码器的训练方法，或者资源推荐方法。

为了实现上述实施例，本公开还提出一种存储介质。

其中，该存储介质中的指令由计算机设备的处理器执行时，使得计算机设备能够执行如前所述的编码器的训练方法，或者资源推荐方法。

为了实现上述实施例，本公开还提供一种计算机程序产品，该计算机程序由计算机设备的处理器执行时，使得计算机设备能够执行如前所述的编码器的训练方法，或者资源推荐方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种编码器的训练方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，在所述获取样本集之后，还包括：

在任一样本的资源类型为视频的情况下，对所述任一样本进行采样，获取多帧图像及音频数据；

对所述音频数据进行识别，获取所述任一样本对应的文本数据；

根据所述多帧图像和所述文本数据，获得所述任一样本对应的图文数据。

3.如权利要求2所述的方法，其特征在于，所述利用初始编码器对每个所述样本进行编码处理，以获取每个所述样本对应的第一特征向量，包括：

4.一种资源推荐方法，其特征在于，包括：

获取目标资源；

利用目标编码器对所述目标资源进行表征，以获取所述目标资源对应的特征向量；其中，所述目标编码器是采用权利要求1-3任一项所述的训练方法获取的；

根据所述目标资源对应的特征向量，获取待推荐资源；

向所述目标资源对应的用户推荐所述待推荐资源。

5.如权利要求4所述的方法，其特征在于，所述利用目标编码器对所述目标资源进行表征，以获取所述目标资源对应的特征向量，包括：

确定所述目标资源的资源类型；

6.如权利要求4所述的方法，其特征在于，所述根据所述目标资源对应的特征向量，获取待推荐资源，包括：

7.如权利要求4所述的方法，其特征在于，还包括：

利用所述目标编码器获取各待聚类资源对应的特征向量；

根据各待聚类资源对应的特征向量，对所述各待聚类资源进行聚类，以获取至少一个聚类簇；

根据每个所述聚类簇中各资源对应的用户，确定每个所述聚类簇对应的待推荐人群；

向每个所述聚类簇对应的待推荐人群，推荐每个所述聚类簇中的资源。

8.一种编码器的训练装置，其特征在于，包括：

9.如权利要求8所述的装置，其特征在于，所述装置还包括：

10.如权利要求9所述的装置，其特征在于，所述特征提取模块，被配置为：

11.一种资源推荐装置，其特征在于，包括：

第一获取模块，被配置为获取目标资源；

第二获取模块，被配置为利用目标编码器对所述目标资源进行表征，以获取所述目标资源对应的特征向量；其中，所述目标编码器是采用权利要求1-3任一项所述的训练方法获取的；

12.如权利要求11所述的装置，其特征在于，所述第二获取模块，被配置为：

确定所述目标资源的资源类型；

13.如权利要求11所述的装置，其特征在于，所述第三获取模块，被配置为：

14.如权利要求11所述的装置，其特征在于，所述装置还包括：

所述推荐模块，还被配置为向每个所述聚类簇对应的待推荐人群，推荐每个所述聚类簇中的资源。

15.一种计算机设备，其特征在于，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如权利要求1至3中任一项所述的编码器的训练方法，或者实现如权利要求4至7中任一项所述的资源推荐方法。

16.一种存储介质，当所述存储介质中的指令由计算机设备的处理器执行时，使得所述计算机设备能够执行如权利要求1至3中任一项所述的编码器的训练方法，或者执行如权利要求4至7中任一项所述的资源推荐方法。

17.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至3任一项所述的编码器的训练方法，或者实现如权利要求4至7中任一项所述的资源推荐方法。