CN115278374B

CN115278374B - 视频召回方法及装置

Info

Publication number: CN115278374B
Application number: CN202110473364.1A
Authority: CN
Inventors: 李展鹏
Original assignee: China Mobile Communications Group Co Ltd; China Mobile Financial Technology Co Ltd; China Mobile Group Electronic Commerce Co Ltd
Current assignee: China Mobile Communications Group Co Ltd; China Mobile Financial Technology Co Ltd; China Mobile Group Electronic Commerce Co Ltd
Priority date: 2021-04-29
Filing date: 2021-04-29
Publication date: 2024-05-07
Anticipated expiration: 2041-04-29
Also published as: CN115278374A

Abstract

本发明提供一种视频召回方法及装置，方法包括：根据目标用户的视频播放记录中的视频ID和视频ID与视频Embedding向量之间的关系，确定目标用户的视频Embedding向量；获取目标用户的用户Embedding向量；根据目标用户的用户Embedding向量和构建的annoy树，确定目标用户的待召回视频。本发明通过引入annoy树，以构建二叉树的方式来完成对视频Embedding向量间相似度的计算，并结合获取的用户Embedding向量，最终实现用户向量及视频向量间相似度的高效查询，提高了对视频实时推荐召回的速度。

Description

视频召回方法及装置

技术领域

本发明涉及视频推荐召回技术领域，尤其涉及一种视频召回方法及装置。

背景技术

随着互联网和通信技术的蓬勃发展，视频业务也出现爆发性的增长，如何提高视频推荐的精准度，提升用户的使用体验成为视频推荐所关心的核心问题。当前主流的的视频推荐算法从功能可以分为召回层、粗排层和精排层，召回层的视频数量及视频关联度决定了推荐算法的效果，召回视频量太少，会使得推荐效果不佳，召回数量太大，则会大大加重后续排序层的计算量。

当前主流的召回方法主要分为4类：一、基于内容的召回，主要是将用户画像与内容画像进行匹配，又分为基于内容标签的匹配和基于知识的匹配；核心是根据内容间的相似度进行召回，这类召回方法较为简单，召回率较高；二、基于协同过滤的召回，主要分为基于用户、基于物品和基于模型的协同过滤，基于协同过滤的召回的核心思想建立用户和内容间的行为矩阵，依据“相似性”进行分发，这种方式准确率较高，而且可以提升用户推荐的扩展性；三、基于FM模型的召回，主要通过特征间的二阶组合来提升推荐的精准度，通过对用户特征和视频特征隐向量的学习，达到更加准确的刻画用户兴趣的效果；四、基于深度学习算法的召回，主要利用深层神经网络的方法对用户兴趣特征进行学习，通过大量的训练帮助捕获用户的特定兴趣并提高推荐的相关性。

现有技术存在以下缺点：

1、通过判断内容彼此间的相似度来进行相似内容的召回，这种方法较为刻板，内容较为局限，无法实现用户兴趣的扩展；

2、协同过滤召回只能利用userid与itemid类的特征，无法利用用户及视频的标签，画像等附加特征，同时在冷启动场景下无法发挥推荐效果；

3、基于FM的召回主要通过计算用户兴趣向量与视频特征向量的内积来返回得分较高的TOPN视频，这种方法要维护大量的用户及视频向量，需要大量的存储资源，同时在计算内积时需要占用大量的计算资源，无法满足短视频推荐场景下灵活、快速的要求；

4、基于深度学习算法的召回需要大量的线下训练和多轮的模型迭代后才能产生一定的效果。

发明内容

本发明提供的视频召回方法及装置，用于解决现有技术存在的至少一个问题，通过引入annoy树，以构建二叉树的方式来完成对视频Embedding向量间相似度的计算，并结合获取的用户Embedding向量，最终实现用户向量及视频向量间相似度的高效查询，提高了对视频实时推荐召回的速度。

本发明提供的一种视频召回方法，包括：

根据目标用户的视频播放记录中的视频ID和视频ID与视频Embedding向量之间的关系，确定所述目标用户的视频Embedding向量；

获取目标用户的用户Embedding向量；

根据所述目标用户的用户Embedding向量和所述目标用户的视频Embedding向量，确定所述目标用户的待召回视频；

其中，所述视频ID与视频Embedding向量之间的关系是根据构建的annoy树确定的；

所述annoy树是根据标准化后的视频Embedding向量文件构建的。

根据本发明提供的一种视频召回方法，所述视频ID与视频Embedding向量之间的关系通过如下方式确定：

基于LRU缓存算法缓存所述annoy树和树索引与视频ID之间的映射关系；

根据所述树索引与视频ID之间的映射关系和所述annoy树中树索引与视频Embedding向量之间的关系，确定所述视频ID与视频Embedding向量之间的关系。

根据本发明提供的一种视频召回方法，所述标准化后的视频Embedding向量文件通过如下方式确定：

根据用户的视频播放记录中的视频ID对应的视频的基本信息，构建数据库；

根据所述数据库中用户与视频的交互信息，确定所述视频Embedding向量文件；

对所述视频Embedding向量文件进行归一化处理，获取所述标准化后的视频Embedding向量文件；

其中，所述视频的基本信息包括视频的标题、标签、分发标题和简介信息。

根据本发明提供的一种视频召回方法，所述根据用户的视频播放记录中的视频ID对应的视频的基本信息，构建数据库，包括：

基于结巴分词包对所述用户的视频播放记录中的视频ID的视频的基本信息进行分词，以过滤包括停用词、数字和符号的无用信息；

根据分词后的每个词出现的频率，获取每个词的idf值和tf_idf值；

按照所述tf_idf值将所有词进行排序，以构建所述数据库。

根据本发明提供的一种视频召回方法，所述根据所述数据库中用户与视频的交互信息，确定所述视频Embedding向量文件，包括：

从所述数据库中获取用户和视频的交互信息，去除满足第一预设条件的用户，以确定用户-视频交互矩阵；

从所述数据库中获取满足第二预设条件的视频的基本信息，并基于结巴分词包对所述视频的基本信息进行分词，以获取满足所述第二预设条件的视频的所有词；

对所述所有词进行one-hot编码和视频ID编码，以确定视频特征矩阵；

将所述用户-视频交互矩阵和所述视频特征矩阵输入至预设LightFM模型，获取所述视频Embedding向量文件；

其中，所述第一预设条件为播放次数小于第一预设次数的视频和观看过少于预设个播放次数大于第二预设次数的视频；

所述第二预设条件为播放次数大于第三预设次数。

根据本发明提供的一种视频召回方法，若确定所述目标用户的视频播放记录中的日期和所述annoy树的构建日期之间的时间间隔大于预设更新周期，则对所述annoy树进行更新。

根据本发明提供的一种视频召回方法，所述获取目标用户的用户Embedding向量，包括：

根据目标用户的行为权重和所述视频Embedding向量，获取所述目标用户的用户Embedding向量；或

将所述目标用户的用户-视频交互矩阵和视频特征矩阵输入至预设LightFM模型，获取所述目标用户的用户Embedding向量；

其中，所述目标用户的行为权重是根据所述目标用户面向不同视频ID对应的视频时所表现出的不同操作行为确定的。

本发明还提供一种视频召回装置，包括：视频向量获取模块、用户向量获取模块以及视频召回模块；

所述视频向量获取模块，用于根据目标用户的视频播放记录中的视频ID和视频ID与视频Embedding之间的关系，确定所述目标用户的视频Embedding向量；

所述用户向量获取模块，用于获取目标用户的用户Embedding向量；

所述视频召回模块，用于根据所述目标用户的用户Embedding向量和所述目标用户的视频Embedding向量，确定所述目标用户的待召回视频；

所述annoy树是根据标准化后的视频Embedding向量文件构建的。

本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述视频召回方法的步骤。

本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述视频召回方法的步骤。

本发明提供的视频召回方法及装置，通过引入annoy树，以构建二叉树的方式来完成对视频Embedding向量间相似度的计算，并结合获取的用户Embedding向量，最终实现用户向量及视频向量间相似度的高效查询，提高了对视频实时推荐召回的速度。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的视频召回方法的流程示意图；

图2是本发明提供的视频召回装置的结构示意图；

图3是本发明提供的电子设备的实体结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

考虑到当前视频应用中视频数量多，若由用户自己搜索感兴趣的视频，需要花费时间太多，故一些视频应用采用推荐引擎个性化地为用户推荐视频，目前有基于用户画像召回视频，进而为用户推荐视频的方法，然而该方法非常依赖视频的标注信息，当视频的标注信息不准确时，视频召回结果也会相应出现偏差，从而导致视频推荐的准确性低。基于此，本发明提出了一种视频召回方法和装置，基于LightFM模型和annoy树的召回方法，结合了FM方法和协同过滤方法优势，以较低的代价完成召回任务，方法简单、召回效率高，同时在冷启动场景下可以实现良好的推荐效果。

本发明通过LightFM模型+annoy树实现对视频的召回，主要利用开源的算法包LightFM以及annoy树方法，其中，LightFM算法主要用来生成用户及视频的Embedding向量，annoy树方法主要用来构建视频向量间相似程度描述的树结构。

本发明通过结合LightFM算法+annoy树来完成视频推荐在冷启动场景下的召回，具体包括了视频词白名单生成、视频向量生成、用户向量生成、annoy树构建等方面，可以在保障召回效果的同时大大降低视频召回的计算代价，提升实时响应速度。具体实现如下：

图1是本发明提供的视频召回方法的流程示意图，如图1所示，方法包括：

S1、根据目标用户的视频播放记录中的视频ID和视频ID与视频Embedding向量之间的关系，确定目标用户的视频Embedding向量；

S2、获取目标用户的用户Embedding向量；

S3、根据目标用户的用户Embedding向量和目标用户的视频Embedding向量，确定目标用户的待召回视频；

其中，视频ID与视频Embedding向量之间的关系是根据构建的annoy树确定的；

annoy树是根据标准化后的视频Embedding向量文件构建的。

需要说明的是，上述方法的执行主体可以是计算机设备。

在具体实施中，为了提高召回视频的相关度，使视频推荐的准确性更高，本发明提供的视频召回方法，通过根据目标用户的视频播放记录中用户观看过的视频中确定待召回视频，具体地，根据用户视频播放记录中的视频ID和视频ID与视频Embedding向量之间的关系，确定目标用户的视频Embedding向量，以得到视频播放记录中各个视频之间的相似度，其中，视频ID与视频Embedding向量之间的关系是根据构建的annoy树确定的，annoy树是根据标准化后的视频Embedding向量文件构建的，具体地：

读取标准化的视频Embedding向量文件，存储为json格式，依据标准化后的视频Embedding向量建立预设数量颗例如30棵annoy树，生成annoy树文件，其中，annoy数的数量可以自由设置，需要注意的是，树的数量越多，相似度的刻画就更为准确，但会降低查询速度，因此在30-50棵之间更为合适。然后建立视频ID与树索引的映射关系文件。

此外，为了安全性考虑，常常为以上三个文件添加MD5校验，生成配置文件，并提交到线上环境，以供实时对目标用户进行视频召回。

在为目标用户召回视频时，首先从目标用户的视频播放记录中，确定目标用户的待召回视频，其中，待召回视频可以是被其他用户点播过的历史视频，即待召回视频可以是目标用户播放记录中的其中一个视频。然后根据视频播放记录中各个视频的Embedding向量与目标用户的用户Embedding向量之间的相似度，从视频播放记录中各个视频中确定与目标用户的用户Embedding向量相似的视频Embedding向量。之后根据视频ID与视频Embedding向量之间的关系，找到与目标用户的与用户Embedding向量相似的视频Embedding向量对应的视频ID，并将其作为目标用户的召回视频。

需要说明的是，annoy是高维空间求近似最近邻的一个开源库，通过构建二叉树的方式，在精度允许的条件下通过牺牲准确率来换取比暴力搜索要快的多的搜索速度。

需要说明的是，本发明提供的视频召回方法可以应用于短视频推荐冷启动场景下的视频召回，可以作为多路召回中的一路召回方法，同时在非冷启动场景下的召回效果也优于常规的矩阵分解方式。在此基础上，还可以用于电商领域的推荐场景中，实现用户及物品的匹配。

本发明提供的视频召回方法，通过引入annoy树，以构建二叉树的方式来完成对视频Embedding向量间相似度的计算，并结合获取的用户Embedding向量，最终实现用户向量及视频向量间相似度的高效查询，提高了对视频实时推荐召回的速度。

进一步地，在一个实施例中，步骤S1中视频ID与视频Embedding向量之间的关系通过如下方式确定：

S11、基于LRU缓存算法缓存annoy树和树索引与视频ID之间的映射关系；

S12、根据树索引与视频ID之间的映射关系和annoy树中树索引与视频Embedding向量之间的关系，确定视频ID与视频Embedding向量之间的关系。

可选地，在具体实施中，可以通过异步加载构建的annoy树相关信息，其中annoy树相关信息可以具体包括annoy树的构建日期、树索引以及视频Embedding向量，具体地，可以使用LRU缓存算法缓存annoy树和树索引与视频ID之间的映射关系，其中，树索引与视频ID之间的映射关系可以是按照树索引的编号将视频ID一一对应得到的，例如，树索引为0～N-1，则视频ID，video1～vedioN分别与树索引0～N-1进行对应，N为正整数。

然后根据annoy树中的树索引与视频播放记录中各个视频的视频Embedding向量之间的关系以及树索引与视频ID之间的映射关系，将各个视频ID与各个视频Embedding向量进行关联。

本发明提供的视频召回方法，通过引入annoy树，将视频ID与各个视频Embedding向量进行关联，完成对视频Embedding向量间相似度的计算，在精度允许的条件下通过牺牲准确率来换取比暴力搜索要快的多的搜索速度。

进一步地，在一个实施例中，标准化后的视频Embedding向量文件通过如下方式确定：

步骤A、根据用户的视频播放记录中的视频ID对应的视频的基本信息，构建数据库；

步骤B、根据数据库中用户与视频的交互信息，确定视频Embedding向量文件；

步骤C、对视频Embedding向量文件进行归一化处理，获取标准化后的视频Embedding向量文件；

其中，视频的基本信息包括视频的标题、标签、分发标题和简介信息。

可选地，根据用户的视频播放记录中的视频ID对应的视频的基本信息，构建数据库，其中，视频的基本信息可以具体包括视频的标题、标签、分发标题和简介信息。并根据数据库中用户与视频的交互信息，确定视频Embedding向量文件，其中，用户与视频的交互信息可以为：用户的点击、收藏和分享等信息。之后，对视频Embedding向量文件进行归一化处理，获取标准化后的视频Embedding向量文件。

数据的标准化或者归一化是将数据按比例缩放，将其转化为无量纲的纯数值，使得不同单位或量级的特征之间具有可比性。

需要说明的是，本发明提供的视频召回方法，可以采用0-1标准化，对视频Embedding向量文件进行线性变换，使结果落到[0,1]区间；

或者，使用z-score标准化，使得经过处理后的视频Embedding向量文件的数据符合标准正态分布，即均值为0，标准差为1。这种标准化方式要求原始数据的分布可以近似为高斯分布；或者

采用非线性标准化，通过一些数学函数，比如对数、指数、正切等，将视频Embedding向量文件中的数值差异较大的数据做映射变换。实际使用中，需要根据不同业务的数据分布来选择，比如对数缩放。

本发明提供的视频召回方法，通过对视频向量文件进行标准化处理，可以提高视频向量的表征力度，避免了在冷启动场景下的性能不稳定问题。

进一步地，在一个实施例中，步骤A可以具体包括：

步骤A1、基于结巴分词包对所述用户的视频播放记录中的视频ID的视频的基本信息进行分词，以过滤包括停用词、数字和符号的无用信息；

步骤A2、根据分词后的每个词出现的频率，获取每个词的idf值和tf_idf值；

步骤A3、按照tf_idf值将所有词进行排序，以构建数据库。

可选地，获取所有视频的标题、标签、分发标题和简介信息等视频的基本信息，并调用结巴分词包对上述视频基本信息进行分词，然后过滤停用词、数字、符号等无用信息，然后根据分词后每个词出现的频率计算每个词的idf值和tf_idf值。最后将所有词按照其tf_idf值排序构建数据库。

本发明提供的视频召回方法，通过调用结巴分词包对视频的基本信息进行分词处理，以最终构建数据库，能够较快的把视频的基本信息中的句子中所有的可以成词的词语都扫描出来，且能够实现对长词再次切分，提高召回视频的召回率。

进一步地，在一个实施例中，步骤B，可以具体包括：

步骤B1、从数据库中获取用户和视频的交互信息，去除满足第一预设条件的用户，以确定用户-视频交互矩阵；

步骤B2、从数据库中获取满足第二预设条件的视频的基本信息，并基于结巴分词包对视频的基本信息进行分词，以获取满足第二预设条件的视频的所有词；

步骤B3、对所有词进行one-hot编码和视频ID编码，以确定视频特征矩阵；

步骤B4、将用户-视频交互矩阵和视频特征矩阵输入至预设LightFM模型，获取视频Embedding向量文件；

其中，第一预设条件为播放次数小于第一预设次数的视频和观看过少于预设个播放次数大于第二预设次数的视频；

第二预设条件为播放次数大于第三预设次数。

可选地，从数据库中获取所有用户和视频的交互信息，过滤掉播放次数小于第一预设次数的视频和观看过少于预设个播放次数大于第二预设次数的视频，例如过滤掉播放次数小于50的视频和观看过少于两个播放次数大于50次的视频的用户，建立剩余用户和剩余视频的交互矩阵的稀疏表示，以得到用户-视频交互矩阵；

从数据库获取播放次数大于第三预设次数，例如播放次数大于50次的视频的基本信息，调用结巴分词对视频的基本信息进行分词，生成视频关键词白名单，作为词过滤的依据，然后过滤视频关键词白名单，得到视频的所有词特征；

对所有词进行one-hot编码和视频ID编码后共同作为视频特征信息(即每个视频的特征为视频ID+词标签)，以稀疏矩阵的形式存储，以得到视频特征矩阵；

将用户-视频交互矩阵和视频特征矩阵导入预设LightFM模型，得到用户的视频的Embedding向量和词的Embedding向量。

其中，LightFM模型是基于LightFM算法构建的一种混合矩阵分解模型，以用户和项目作为其内容功能的潜在因素的线性组合。在冷启动或在交互数据场景中稀疏的情况下(使用用户元数据和项目元数据)，该模型均优于基于协作和基于内容的模型，并且至少具有与纯矩阵分解相同的性能。该模型最终可以为每个用户和每个物品(视频)生成一个Embedding向量(可以表述用户和物品的所有信息)，用户和视频的Embedding向量的内积表明该用户对该物品的点击的可能性。

本发明提供的视频召回方法，通过引入LightFM算法库来实现短视频推荐冷启动场景下的视频召回，结合矩阵分解和FM方法的优势，实现对特征的充分利用，发挥矩阵分解方法的优势，同时在避免冷启动场景下矩阵分解无法发挥效果的问题，采用FM算法的思想，通过形成视频Embedding向量的形式来计算视频间的相似度，能够实现在冷启动或在交互数据场景中稀疏的情况下表现出良好的召回效果。

进一步地，在一个实施例中，本发明提供的视频召回方法还可以具体包括：

S4、若确定目标用户的视频播放记录中的日期和annoy树的构建日期之间的时间间隔大于预设更新周期，则对所述annoy树进行更新。

可选地，可以将本发明提供的视频召回方法，部署到线上环境中进行运行，如部署到Redis内存中，对目标用户进行视频召回，首先，从Redis内存中拿到元数据信息，其中，元数据信息包括annoy数的构建日期，并根据目标用户观看视频播放记录日期，若确定目标用户的视频播放记录中的日期和annoy树的构建日期之间的时间间隔大于预设更新周期，则采用上述生成annoy树的方法对老annoy树进行更新。更新树时可以只让一个线程进行操作，其他线程等待更新，使用老annoy树，等该线程更新完成后，再进行同步，将其他线程的老annoy树进行更新。其中，更新周期可以根据实际需要进行设置，如设置为2天，1周等。

本发明提供的视频召回方法，实时对annoy树进行更新，对用户短时间内的兴趣变化具有极强的灵敏性，可随时根据用户行为变化调整召回结果，召回的结果与用户兴趣匹配度高。

进一步地，在一个实施例中，步骤S2可以具体包括：

S21、根据目标用户的行为权重和视频Embedding向量，获取目标用户的用户Embedding向量；或

S22、将目标用户的用户-视频交互矩阵和视频特征矩阵输入至预设LightFM模型，获取目标用户的用户Embedding向量；

其中，目标用户的行为权重是根据目标用户面向不同视频ID对应的视频时所表现出的不同操作行为确定的。

可选地，根据目标用户的行为权重和视频Embedding向量，获取目标用户的用户Embedding向量，例如，通过用户看过的100个视频找到对应的100个视频Embedding向量，然后经过加权算法得到目标用户的用户Embedding，其中，加权算法需要同时考虑向量权重的增加与衰减，对于目标用户面向不同视频ID对应的视频时所表现出的不同操作行为给予不同的权重，比如：用户的点击、收藏、分享给予不同的权重，同时对于曝光但是没有点击过的视频进行相应的权重衰减。

或者，将目标用户的用户-视频交互矩阵和视频特征矩阵输入至预设LightFM模型，获取目标用户的用户Embedding向量。

通过最终计算出的目标用户的用户Embedding向量从annoy树中取出一定数量的索引，再通过索引与视频ID对应的关系找到对应的视频ID，并过滤掉用户已曝光的视频，然后返回获得最终的召回视频。

本发明提供的视频召回方法，通过用户浏览视频行为的加权平均来计算用户的Embedding向量，相比于传统的方法，节省了存储所有用户Embedding向量信息，极大节约了存储资源。

下面对本发明提供的视频召回装置进行描述，下文描述的视频召回装置与上文描述的视频召回方法可相互对应参照。

图2是本发明提供的视频召回装置的结构示意图，如图2所示，

包括：视频向量获取模块210、用户向量获取模块211以及视频召回模块212；

视频向量获取模块210，用于根据目标用户的视频播放记录中的视频ID和视频ID与视频Embedding之间的关系，确定目标用户的视频Embedding向量；

用户向量获取模块211，用于获取目标用户的用户Embedding向量；

视频召回模块212，用于根据目标用户的用户Embedding向量和目标用户的视频Embedding向量，确定目标用户的待召回视频；

annoy树是根据标准化后的视频Embedding向量文件构建的。

本发明提供的视频召回装置，通过引入annoy树，以构建二叉树的方式来完成对视频Embedding向量间相似度的计算，并结合获取的用户Embedding向量，最终实现用户向量及视频向量间相似度的高效查询，提高了对视频实时推荐召回的速度。

进一步地，在一个实施例中，视频向量获取模块210，还用于基于LRU缓存算法缓存annoy树和树索引与视频ID之间的映射关系；

根据树索引与视频ID之间的映射关系和annoy树中树索引与视频Embedding向量之间的关系，确定视频ID与视频Embedding向量之间的关系。本发明提供的视频召回装置，通过引入annoy树，将视频ID与各个视频Embedding向量进行关联，完成对视频Embedding向量间相似度的计算，在精度允许的条件下通过牺牲准确率来换取比暴力搜索要快的多的搜索速度。

进一步地，在一个实施例中，视频召回装置还包括：标准化视频向量获取模块，用于根据用户的视频播放记录中的视频ID对应的视频的基本信息，构建数据库；

根据数据库中用户与视频的交互信息，确定视频Embedding向量文件；

对视频Embedding向量文件进行归一化处理，获取标准化后的视频Embedding向量文件；

本发明提供的视频召回装置，通过对视频向量文件进行标准化处理，可以提高视频向量的表征力度，避免了在冷启动场景下的性能不稳定问题。

进一步地，在一个实施例中，标准化视频向量获取模块，还可以具体包括：分词子模块、词频计算模块和数据库构建子模块；，

分词子模块，用于基于结巴分词包对所述用户的视频播放记录中的视频ID的视频的基本信息进行分词，以过滤包括停用词、数字和符号的无用信息；

词频计算模块，用于根据分词后的每个词出现的频率，获取每个词的idf值和tf_idf值；

数据库构建子模块，用于按照tf_idf值将所有词进行排序，以构建数据库。

本发明提供的视频召回装置，通过调用结巴分词包对视频的基本信息进行分词处理，以最终构建数据库，能够较快的把视频的基本信息中的句子中所有的可以成词的词语都扫描出来，且能够实现对长词再次切分，提高召回视频的召回率。

进一步地，在一个实施例中，标准化视频向量获取模块，还可以用于，从数据库中获取用户和视频的交互信息，去除满足第一预设条件的用户，以确定用户-视频交互矩阵；

从数据库中获取满足第二预设条件的视频的基本信息，并基于结巴分词包对视频的基本信息进行分词，以获取满足第二预设条件的视频的所有词；

对所有词进行one-hot编码和视频ID编码，以确定视频特征矩阵；

将用户-视频交互矩阵和所述视频特征矩阵输入至预设LightFM模型，获取视频Embedding向量文件；

第二预设条件为播放次数大于第三预设次数。

本发明提供的视频召回装置，通过引入LightFM算法库来实现短视频推荐冷启动场景下的视频召回，结合矩阵分解和FM方法的优势，实现对特征的充分利用，发挥矩阵分解方法的优势，同时在避免冷启动场景下矩阵分解无法发挥效果的问题，采用FM算法的思想，通过形成视频Embedding向量的形式来计算视频间的相似度，能够实现在冷启动或在交互数据场景中稀疏的情况下表现出良好的召回效果。

进一步地，在一个实施例中，视频召回装置，还可以具体包括：annoy树更新模块，用于若确定目标用户的视频播放记录中的日期和annoy树的构建日期之间的时间间隔大于预设更新周期，则对所述annoy树进行更新。

本发明提供的视频召回装置，实时对annoy树进行更新，对用户短时间内的兴趣变化具有极强的灵敏性，可随时根据用户行为变化调整召回结果，召回的结果与用户兴趣匹配度高。

进一步地，在一个实施例中，用户向量获取模块211，还可以具体用于：根据目标用户的行为权重和视频Embedding向量，获取目标用户的用户Embedding向量；或

将目标用户的用户-视频交互矩阵和视频特征矩阵输入至预设LightFM模型，获取目标用户的用户Embedding向量；

本发明提供的视频召回装置，通过用户浏览视频行为的加权平均来计算用户的Embedding向量，相比于传统的方法，节省了存储所有用户Embedding向量信息，极大节约了存储资源。

图3是本发明提供的一种电子设备的实体结构示意图，如图3所示，该电子设备可以包括：处理器(processor)310、通信接口(communication interface)311、存储器(memory)312和总线(bus)313，其中，处理器310，通信接口311，存储器312通过总线313完成相互间的通信。处理器310可以调用存储器312中的逻辑指令，以执行如下方法：

根据目标用户的视频播放记录中的视频ID和视频ID与视频Embedding向量之间的关系，确定目标用户的视频Embedding向量；

获取目标用户的用户Embedding向量；

根据目标用户的用户Embedding向量和目标用户的视频Embedding向量，确定目标用户的待召回视频；

annoy树是根据标准化后的视频Embedding向量文件构建的。

此外，上述的存储器中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机电源屏(可以是个人计算机，服务器，或者网络电源屏等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

进一步地，本发明公开一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，计算机能够执行上述各方法实施例所提供的视频召回方法，例如包括：

获取目标用户的用户Embedding向量；

annoy树是根据标准化后的视频Embedding向量文件构建的。

另一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各实施例提供的视频召回方法，例如包括：

获取目标用户的用户Embedding向量；

annoy树是根据标准化后的视频Embedding向量文件构建的。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机电源屏(可以是个人计算机，服务器，或者网络电源屏等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种视频召回方法，其特征在于，包括：

获取目标用户的用户Embedding向量；

所述annoy树是根据标准化后的视频Embedding向量文件构建的；

所述标准化后的视频Embedding向量文件通过如下方式确定：

其中，所述视频的基本信息包括视频的标题、标签、分发标题和简介信息；

所述根据所述数据库中用户与视频的交互信息，确定所述视频Embedding向量文件，包括：

从所述数据库中获取满足第二预设条件的视频的基本信息，并基于结巴分词包对所述视频的基本信息进行分词，生成视频关键词白名单，然后过滤所述视频关键词白名单，以获取满足所述第二预设条件的视频的所有词；

所述第二预设条件为播放次数大于第三预设次数。

2.根据权利要求1所述的视频召回方法，其特征在于，所述视频ID与视频Embedding向量之间的关系通过如下方式确定：

3.根据权利要求1所述的视频召回方法，其特征在于，所述根据用户的视频播放记录中的视频ID对应的视频的基本信息，构建数据库，包括：

按照所述tf_idf值将所有词进行排序，以构建所述数据库。

4.根据权利要求1所述的视频召回方法，其特征在于，还包括：

若确定所述目标用户的视频播放记录中的日期和所述annoy树的构建日期之间的时间间隔大于预设更新周期，则对所述annoy树进行更新。

5.根据权利要求1-4任一项所述的视频召回方法，其特征在于，所述获取目标用户的用户Embedding向量，包括：

6.一种视频召回装置，其特征在于，包括：视频向量获取模块、用户向量获取模块以及视频召回模块；

所述annoy树是根据标准化后的视频Embedding向量文件构建的；

所述视频召回装置，还用于，通过如下方式确定所述标准化后的视频Embedding向量文件：

所述第二预设条件为播放次数大于第三预设次数。

7.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述视频召回方法的步骤。

8.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至5任一项所述视频召回方法的步骤。