CN117194709A

CN117194709A - 视频作者的识别方法、视频资源的推荐方法及装置

Info

Publication number: CN117194709A
Application number: CN202311100629.9A
Authority: CN
Inventors: 李林冲
Original assignee: Baidu China Co Ltd
Current assignee: Baidu China Co Ltd
Priority date: 2023-08-29
Filing date: 2023-08-29
Publication date: 2023-12-08

Abstract

本公开提供了视频作者的识别方法、视频资源的推荐方法及装置，涉及计算机技术领域，尤其涉及视频技术、智能推荐技术领域。视频作者的识别方法包括：根据视频作者的多个视频作品的封面图像的分类结果，确定多个视频作品的第一图像特征；根据多个视频作品的文本特征和第一图像特征，从多个视频作品中确定目标类型的第一视频作品；其中，文本特征根据视频作品的标签信息得到；根据第一视频作品在多个视频作品中的占比，确定视频作者的第一作品特征；根据多个视频作品中包含目标属性的第二视频作品的占比，确定视频作者的第二作品特征；以及根据第一作品特征和第二作品特征，确定视频作者的作者类型标签。本公开有助于视频作者、视频资源的挖掘。

Description

视频作者的识别方法、视频资源的推荐方法及装置

技术领域

本公开涉及计算机技术领域，尤其涉及视频技术、智能推荐技术领域。

背景技术

视频平台在用户浏览视频时，可以从海量的视频资源中选取与用户兴趣相关的视频资源进行推荐。为了提高推荐效果，需要提前对视频资源进行挖掘，形成各种类型的视频资源池。

发明内容

本公开提供了一种视频作者的识别方法、视频资源的推荐方法、装置、设备以及存储介质。

根据本公开的一方面，提供了一种视频作者的识别方法，包括：

根据视频作者的多个视频作品的封面图像的分类结果，确定多个视频作品的第一图像特征；

根据多个视频作品的文本特征和第一图像特征，从多个视频作品中确定目标类型的第一视频作品；其中，文本特征根据视频作品的标签信息得到；

根据第一视频作品在多个视频作品中的占比，确定视频作者的第一作品特征；

根据多个视频作品中包含目标属性的第二视频作品的占比，确定视频作者的第二作品特征；以及

根据第一作品特征和第二作品特征，确定视频作者的作者类型标签。

根据本公开的另一方面，提供了一种视频资源的推荐方法，包括：

根据视频作者的作者类型标签，确定目标视频作者；其中，视频作者的作者类型标签根据上述视频作者的识别方法得到；

从目标视频作者的多个视频作品中，筛选得到第三视频作品，以形成视频资源池；

响应于用户请求，从视频资源池中进行资源召回，以得到召回结果；以及

根据召回结果，得到待推荐的视频资源。

根据本公开的另一方面，提供了一种视频作者的识别装置，包括：

第一确定模块，用于根据视频作者的多个视频作品的封面图像的分类结果，确定多个视频作品的第一图像特征；

第一分类模块，用于根据多个视频作品的文本特征和第一图像特征，从多个视频作品中确定目标类型的第一视频作品；其中，文本特征根据视频作品的标签信息得到；

第二确定模块，用于根据第一视频作品在多个视频作品中的占比，确定视频作者的第一作品特征；

第三确定模块，用于根据多个视频作品中包含目标属性的第二视频作品的占比，确定视频作者的第二作品特征；以及

第二分类模块，用于根据第一作品特征和第二作品特征，确定视频作者的作者类型标签。

根据本公开的另一方面，提供了一种视频资源的推荐装置，包括：

作者确定模块，用于根据视频作者的作者类型标签，确定目标视频作者；其中，视频作者的作者类型标签上述视频作者的识别装置得到；

筛选模块，用于从目标视频作者的多个视频作品中，筛选得到第三视频作品，以形成视频资源池；

召回模块，用于响应于用户请求，从视频资源池中进行资源召回，以得到召回结果；以及

推荐模块，用于根据召回结果，得到待推荐的视频资源。

根据本公开的另一方面，提供了一种电子设备，包括：

至少一个处理器；以及

与该至少一个处理器通信连接的存储器；其中，

该存储器存储有可被该至少一个处理器执行的指令，该指令被该至少一个处理器执行，以使该至少一个处理器能够执行本公开实施例中任一的方法。

根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，该计算机指令用于使该计算机执行根据本公开实施例中任一的方法。

根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，该计算机程序在被处理器执行时实现根据本公开实施例中任一的方法。

本公开通过对视频作者准确识别，从而对视频资源进行挖掘，提升视频资源的推荐效果。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是根据本公开一实施例的视频作者的识别方法的流程示意图；

图2是根据本公开另一实施例的颜值类作者的挖掘流程示意图；

图3是根据本公开一实施例的视频资源的推荐方法的流程示意图；

图4是根据本公开另一实施例的颜值类视频的推荐方法的流程示意图；

图5是根据本公开一实施例的视频作者的识别装置的流程示意图；

图6是根据本公开一实施例的视频资源的推荐装置的流程示意图；

图7是用来实现本公开实施例的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

相关技术中，对视频内容可以划分为影视、美食、科技、汽车、游戏、亲子、户外等类目(也称为垂类)。每个类目下又可以继续划分更多子类目。而分类方式还可以有其它维度。例如，知识类视频，可以理解为以视频的形式对任意的知识进行科普和讲解，可能涵盖科技、汽车、亲子等垂类。可以是对科技领域的相关知识进行科普，也可以是对动植物领域的相关知识进行科普，还可以是对亲子教育领域的相关知识进行科普。又例如，颜值类视频，颜值类视频可以理解为令人赏心悦目、美好人设出镜的视频。通常集合"高颜值"、"美好"等元素，可能涵盖情感、生活、美食、汽车、搞笑、拍人等垂类。基于常规类目的分类难以筛选出此类视频。

目前，此类资源的挖掘技术主要有如下两种方案：一是基于人工标注，通过人工标注识别目标资源。二是基于标签匹配，人工筛选与目标类型相关的若干标签，通过标签圈定目标类型的资源。上述方式难以解决消耗资源过多、错误率过高的问题。

为了至少部分地解决上述问题以及其他潜在问题中的一个或者多个问题，本公开的实施方式提供一种视频作者的识别方法和视频资源的推荐方法，利用本公开的实施方式的技术方案，可以提高视频作者识别的准确性、以便于从视频作者的角度对目标类型的视频资源进行挖掘，提升视频资源的推荐效果。

图1为本公开一实施例提供的视频作者的识别方法的流程示意图。如图1所示，该方法包括以下步骤：

S101、根据视频作者的多个视频作品的封面图像的分类结果，确定多个视频作品的第一图像特征。

本公开实施例中，视频作品的封面图像可以是该视频作品的第一帧画面，也可以是视频制作通过剪辑软件指定的图像，还可以是该视频作品的缩略图。

对封面图像进行分类，分类结果可以是类型标签，例如知识类、颜值类或是其它类型。知识类视频的封面图像通常会包含较为显目的文字标题和图形元素，文字内容可能会包含公式、原理的名称等。颜值类视频的封面图像通常会包含精美的服饰、精致的妆容、美丽的人物等元素。通过人工或是分类模型，可以基于封面图像中的特征元素，实现对封面图像的分类。

第一图像特征可以是根据封面图像的分类结果进行编码得到的。

S102、根据多个视频作品的文本特征和第一图像特征，从多个视频作品中确定目标类型的第一视频作品。其中，文本特征根据视频作品的标签信息得到。

视频作品通常会包含标题、简介、类目及标签等文本信息。类目可以是指基于某种分类方式得到的类型，例如影视、财经、科技、汽车、数码等。对于短视频类的视频作品，可以包括热点、游戏、娱乐、体育、美食、时尚、二次元等垂类。每个视频作品通常属于其中一种垂类。而描述或定义一个视频作品的类型可以有多种维度，在此不作具体限定。

标签，可以理解为描述一个视频作品所涉及的内容的关键词，包括但不限于描述视频内容、文案内容、主题、视频内容中出现的人物、场合、拍摄者、拍摄地、拍摄形式、相关话题等任意方面的词语。视频作品的标题、画面分辨率、视频作者、视频时长、文件大小、文件格式也可以理解为是一种描述视频作品的标签。标签可以是视频作者自行选取或输入的，也可以是对视频内容进行识别后生成的。通过对视频作者的各类文本信息进行编码，可以得到视频作品的文本特征。

以视频作品的垂类、标签作为文本特征，以封面图像的分类结果作为第一图像特征，可以利用预先训练的分类模型或其它现有的分类模型，根据文本特征和第一图像特征，对视频作品进行分类。

目标类型可以是知识类、颜值类或其它预设类型。在一种示例中，可以以人工标注的目标类型的视频作为正样本，随机采样非目标类型的其它视频作为负样本，训练逻辑回归(Logistic Regression，LR)的二分类模型。训练得到的二分类模型可以用于识别目标视频是否为目标类型的视频。训练模型时，可以按视频作品的垂类划分为多个样本数据集，例如，影视垂类下的颜值类视频与该垂类下的非颜值类视频作为同一样本数据集，美食垂类下的颜值类视频与该垂类下的非颜值类视频作为同一样本数据集。

S103、根据第一视频作品在多个视频作品中的占比，确定视频作者的第一作品特征。

在一种示例中，某一视频作者的所有视频作品中有60％的视频作品为目标类型的第一视频作品，则以该占比数值，确定视频作者的第一作品特征。

S104、根据多个视频作品中包含目标属性的第二视频作品的占比，确定视频作者的第二作品特征。

目标属性可以为垂类、标签中的一种或多种。具体而言，可以是选取与目标类型的视频作品具有较高关联度的垂类或标签，并统计属于该垂类或包含该标签的第二视频作品的数量，从而得到此类作品的占比。举例而言，对于知识类视频，可以在多种标签中预先筛选出与知识相关的标签(知识标签)作为目标标签，例如：包含“原理”、“公式”、“解密”、“揭秘”、“百科”、“讲解”等词语的标签作为目标标签，即目标属性。对于颜值类视频，可以在多种标签中预先筛选出与颜值相关的标签(颜值标签)作为目标标签，例如：包含“漂亮”、“靓丽”、“高颜值”、“美人”、“窈窕淑女”、“倾国倾城”等词语的标签。知识标签或颜值标签可以通过人工标注视频样本时，根据被标注为目标类型的视频样本所包含的标签进行统计分析得到，在此不作穷举。统计包含该目标标签的第二视频作品在多个视频作品中的占比，将该占比作为视频作者的第二作品特征。

S105、根据第一作品特征和第二作品特征，确定视频作者的作者类型标签。

根据视频作者的第一作品特征和第二作品特征，利用预先训练的分类模型，可以对视频作者的作者类型进行分类，得到作者类型标签。与上述训练LR模型的训练方法类似，可以使用以人工标注的目标类型的作者作为正样本，分垂类随机采样的视频作者作为负样本，训练另一LR模型，训练得到的LR模型可以用于识别视频作者是否为目标类型。需要说明的是，本公开实施例中使用的分类模型及模型训练方法仅为示例，也可以使用本领域技术人员所掌握的其他模型通过常规的训练方法实现分类目的，所采用的模型类型和模型结构在此不作限定。

作者类型标签用于表征视频作者是否为目标类型视频的高垂直度作者。高垂直度意味着该视频作者专注于制作目标类型视频。低垂直度的视频作者由于不专注于制作同一类型的视频，其视频质量通常偏低。另一方面，低垂直度也可能意味着搬运、翻拍作品居多。

根据本公开实施例的方案，通过对视频作者的视频作品进行分类，可以更为准确地统计视频作品的类型及内容分布情况，判断视频作者是否专注于制作同一类型的视频，准确挖掘出专注于制作同一类型视频的高垂直度的视频作者。

在一种可能的实现方式中，步骤S101根据视频作者的多个视频作品的封面图像的分类结果，确定多个视频作品的第一图像特征，进一步包括步骤：

获取视频作者的多个视频作品的封面图像。

利用预先训练的第一分类模型，确定封面图像的分类结果。

根据封面图像的分类结果，确定多个视频作品的第一图像特征。

本公开实施例中，第一分类模型可以使用基于50层的残差网络(ResidualNetwork，RestNet50)模型。使用RestNet50分类模型可以对封面图像进行分类，得到对应的分类标签。在一种示例中，分类结果可以为是否属于目标类型的二分类标签，例如，通过两个标签分别代表属于知识类封面或不属于知识类封面，或者是，属于颜值类封面或不属于颜值类封面。

通常而言，视频作品的封面图像能在很大程度上体现视频内容及视频类型，因此，封面图像的分类结果与视频作品的类型具有很大地关联性，也就是说，封面图像的分类标签作为视频作品的特征，可以提高对视频作品进行分类的准确性。

根据本公开实施例的方案，使用分类模型对视频作品的封面图像进行识别和分类，将分类结果作为视频作品的第一图像特征，有助于对视频作品进行分类。

在一种可能的实现方式中，步骤S104根据多个视频作品中包含目标属性的第二视频作品的占比，确定视频作者的第二作品特征，进一步包括步骤：

S1041、针对至少一种维度的属性信息，确定包含目标属性的第二视频作品的数量。其中，目标属性为属性信息的其中一种属性。

S1042、根据第二视频作品的数量与多个视频作品的数量，确定第二视频作品的占比。

S1043、根据至少一种维度的属性信息对应的占比，确定视频作者的第二作品特征。

本公开实施例中，目标属性可以为垂类、标签中的一种或多种，即，可以将垂类和多种标签作为不同的维度。统计含有目标数量的第二视频作品在所有视频作品中的占比，将由此得到的统计特征作为第二作品特征。

根据本公开实施例的方案，将视频作品的部分属性信息作为统计对象，确定含有目标属性的视频作品在所有视频作品中的占比，作为第二作品特征，有助于确定视频作者对某一类型视频的垂直度。

在一种可能的实现方式中，步骤S1041针对至少一种维度的属性信息，确定包含目标属性的第二视频作品的数量，包括以下至少一种方式：

针对视频类目维度的属性信息，确定包含目标视频类目的第二视频作品的数量。

针对描述标签维度的属性信息，确定包含目标标签的第二视频作品的数量。

针对封面图像类型维度的属性信息，根据封面图像的分类结果，确定封面图像为目标类型的第二视频作品的数量。

本公开实施例中，在一种示例中，针对视频类目维度的属性信息，目标属性为影视垂类时，第二视频作品则是该视频作者发布的所有影视垂类下的视频作品。在另一种示例中，如图2所示，针对描述标签维度的属性信息，目标属性为颜值标签时，第二视频作品则是该视频作者发布的所有含有颜值标签的视频作品，从而可以得到含颜值标签发文占比。封面图像的分类结果也可以作为统计对象，针对封面图像类型维度的属性信息，可以统计含有目标类型的封面图像的第二视频作品的数量，从而可以得到颜值封面图发文占比。

根据本公开实施例的方案，对视频作品的多种属性信息进行筛选，确定含有目标属性的第二视频作品的数量，从而确定视频作者的垂直度。

在一种可能的实现方式中，针对视频类目维度的属性信息，确定包含目标视频类目的第二视频作品的数量，具体包括：

针对视频类目维度的属性信息，根据每种视频类目包含的视频作品的数量，得到视频类目的排序结果。

对排序结果为前N位的目标视频类目，确定对应的第二视频作品的数量，其中，N为正整数。

本公开实施例中，先确定视频作品所涉及的所有视频类目，然后统计每种视频类目的视频作品的数量。在一种示例中，如图2所示，数量最多的视频类目(即，N为1)可以作为该视频作品的主垂类，主垂类的视频作品的占比可以在很大程度上体现视频作者的垂直度。同时，也可以将视频类目的排序结果中前3位(即，N为3)的视频类目作为统计对象，得到TOP3垂类的第二视频作品的占比，也可以在一定程度上体现视频作品的垂直度。

根据本公开实施例的方案，对视频作品所属的垂类进行精细统计，从垂类的维度衡量视频作者的垂直度。

在一种可能的实现方式中，本公开实施例的视频作者的识别方法，还包括步骤：

从多个视频作品中采集多个关键帧图像。

根据多个关键帧图像，确定第二图像特征。

根据第二图像特征，确定多个视频作品的格调分类标签。

根据多个视频作品的格调分类标签，确定视频作者的第三作品特征。

根据第一作品特征和第二作品特征，确定视频作者的作者类型标签，包括：

根据第一作品特征、第二作品特征以及第三作品特征，确定视频作者的作者类型标签。

本公开实施例中，通过跨步采样获取多个关键帧图像，然后将多个关键帧图像输入基于时序移动模型(Temporal Shift Module，TSM)预先训练得到的分类模型，从而得到格调分类标签。TSM模型是将Temporal Shift Module插入到ResNet网络中构建的视频分类模型。该模型通过在特征图中引入temporal维度上的上下文交互，以提高时间维度上的视频理解能力。通过提取关键帧的方式可以对视频内容进行识别分类，从而确定视频内容的格调。确定格调的目的在于：知识类视频不是对未解之谜进行的成因随意猜测、胡编乱造。颜值类视频也不是狭义的拍人、秀身材，更不是涉及性暗示、裸露等低俗内容。因此，对于视频内容属于低格调的视频作品需要进行识别，从而确定视频作者的所有视频作品中，涉及低格调内容的视频作品的数量，以此作为第三作品特征，以便于减少相关内容和视频作者的推荐。

需要说明的是，通过分类模型识别视频内容的格调高低可能存在一定地错判、漏判，对高播放量的视频可以进行人工复审，保证准确性。

根据本公开实施例的方案，可以对视频作品中涉及低格调的内容进行识别，以便于更加准确地确定视频作者的创作方向。

在一种可能的实现方式中，确定多个目标类型的视频作者后，可以通过GCF(Global Chess Federation，全局比较框架)图模型进行扩散，发现更多同类型作者。

在一种可能的实现方式中，可以定期执行上述视频作者的识别方法，从而对视频作者发文进行监控，防止视频作者的视频作品发生变质，通过黑名单快速释出变质作者。

图3为本公开一实施例提供的视频资源的推荐方法的流程示意图。如图3所示，该方法至少包括以下步骤：

S301、根据视频作者的作者类型标签，确定目标视频作者。其中，视频作者的作者类型标签根据上述任一实施例的视频作者的识别方法得到。

S302、从目标视频作者的多个视频作品中，筛选得到第三视频作品，以形成视频资源池。

S303、响应于用户请求，从视频资源池中进行资源召回，以得到召回结果。

S304、根据召回结果，得到待推荐的视频资源。

本公开实施例中，在挖掘用于推荐的目标类型的视频时，以颜值类视频为例，可以根据作者类型标签，选取高直垂度的颜值类作者。然后从颜值类作者的新发布的视频作品中筛选其中部分，得到第三视频作品，从而通过众多高直垂度的颜值类作者的新视频作品，形成优质的视频资源池。

当用户在视频网站、平台或软件上观看视频时，可以采用各种召回方式从视频资源池中进行资源召回，以得到与该用户的用户画像匹配的个性化召回结果。用户画像可以根据用户反馈形成的行为日志得到。召回通路(召回方式)包括但不限于：

冷启：召回核心用户群爱看但分发量较少长尾资源。

热门：召回核心用户群爱看的热门资源。

CB(Content-Based Filtering，基于内容的过滤)：基于用户兴趣点召回相关视频资源。

ICF(Item-Item Collaborative Filtering，物品-物品协同过滤)：基于用于的满意点击，召回相关视频资源。

UCF(User-User Collaborative Filtering，用户-用户协同过滤)：召回关注作者的相似作者发布的视频资源。

LookLike(Look-Alike相似人群召回)：通过UCF用户向量召回相似视频向量。

关注作者：召回用户关注的视频作者发布的视频资源。

根据本公开实施例的方案，基于现有视频作品的文本语义、封面图像、关键帧等多模态信号，挖掘出目标类型作者。将视频作者确定为某一类型的高直垂度作者后，可以将其新发布的视频作品进行简单的筛选后作为该类型视频，而无需对每个视频作品进行准确识别和分类后才确定视频类型，减少了计算量，同时也具备发现新鲜、优质的视频的能力。

在一种可能的实现方式中，步骤S304根据召回结果，得到待推荐的视频资源，进一步包括步骤：

S3041、对召回结果进行排序。

S3042、根据排序的结果，得到待推荐的视频资源。

本公开实施例中，如图4所示，在召回阶段之后，对不同召回通路得到的多个召回结果，可以进行排序，排序可以包含粗排阶段、精排阶段。粗排阶段可以进行分组保送，分组保送是指将后验转化效果好的资源排在前面的过程。

根据本公开实施例的方案，通过排序，可以优先向用户推荐其最可能感兴趣的视频资源。

在一种可能的实现方式中，S3041对召回结果进行排序，进一步包括：

确定召回结果中的多个视频资源的预估点击率、预估完成率以及视频时长。

根据预估点击率、预估完成率以及视频时长，确定多个视频资源的预估分。

按预估分由高到低，对召回结果中的多个视频资源进行排序。

本公开实施例中，可以使用以下计算公式作为精排阶段的排序策略：

Q＝ctr^CP*fr^FP*duration^DP

其中，Q为预估分，ctr是预估点击率，fr是预估完成率，duration是视频资源的物理时长，CP、FP、DP为对应的融合超参，也可以理解为是权重值。

根据本公开实施例的方案，通过预估点击率、完成率以及视频时长可以确定预估得分，优先推荐预估得分高的视频资源，可以提高用户的观看时长。

在一种可能的实现方式中，根据排序的结果，得到待推荐的视频资源，包括：

根据业务探索策略，对排序的结果进行重新排序。

根据重新排序的结果，得到待推荐的视频资源。

本公开实施例中，业务探索策略包括：按预估分排名分桶,结合用户中重度兴趣、关注作者卡控预估分，挑选探索资源，做带进退场约束的探索。业务探索策略用于将确定的视频资源优先进行推荐，也称为探索强插，如图4所示的重排阶段(颜值探索强插)。

按预估分排名分桶：首先，根据每个视频资源的预估分数进行排名，然后将不同垂类排名靠前的视频资源分到一个桶中。这个桶可以看作是一个预排名的集合。

结合用户中重度兴趣：接下来，考虑到用户的兴趣因素，将用户画像包含的历史行为(如消费历史)、用户特征、兴趣偏好等与视频资源的信息结合，进一步优化排序。例如，如果用户在过去的一段时间内对某个领域或主题表现出浓厚的兴趣，那么与该领域相关的视频资源可以优先考虑。

关注作者卡控预估分：同时，还需要关注视频资源的来源和作者信息，以确保高质量的视频资源被优先展示。这可以通过卡控预估分来实现，即只选择预估分数达到一定阈值的视频资源进行展示。

挑选探索资源：在维持现有排名的同时，需要引入探索机制，以发现新的高质量视频资源。可以按照一定的比例从排名靠后的视频资源中挑选一些进行探索，从而增加系统的发现能力。

在进行探索时，需要考虑进场和退场约束。进场约束是指只有在特定条件下才能将新的视频资源引入展示列表，例如当现有视频资源的预估分数低于一定阈值时。退场约束是指在满足一定条件时需要将现有的视频资源退出展示列表，例如当其预估分数超过一定阈值时。

结合退场信号强弱：退场信号强弱是指视频在展示过程中获得的反馈信息，例如点击率、观看时长等。根据退场信号的强弱，可以判断视频资源的质量和用户对该视频的兴趣程度。如果退场信号较弱，说明视频资源的质量不高或者用户对该视频的兴趣较低，此时可以考虑进行退场操作。

根据退场信号的强弱和不同的退场约束条件，可以采取不同的退场策略。例如，可以根据用户的兴趣点进行兴趣点退场，即当用户的兴趣点发生变化时，将与该兴趣点相关的视频资源退出展示列表。可以根据用户的会话(Session)进行Session退场，即当用户的会话结束时，将该会话期间展示的视频资源退出展示列表。可以根据时间进行24H退场，即当超过24小时未对某视频资源进行浏览时，将其退出展示列表。还可以根据其他条件进行永久退场，例如当视频资源违反了相关规定或者质量严重不达标时。

根据本公开实施例的方案，基于业务探索策略和预估分，可以探索用户兴趣，有助于提高用户的留存率。

图5为本公开一实施例提供的视频作者的识别装置的结构示意图。如图5所示，该装置包括：

第一确定模块501，用于根据视频作者的多个视频作品的封面图像的分类结果，确定多个视频作品的第一图像特征。

第一分类模块502，用于根据多个视频作品的文本特征和第一图像特征，从多个视频作品中确定目标类型的第一视频作品。其中，文本特征根据视频作品的标签信息得到。

第二确定模块503，用于根据第一视频作品在多个视频作品中的占比，确定视频作者的第一作品特征。

第三确定模块504，用于根据多个视频作品中包含目标属性的第二视频作品的占比，确定视频作者的第二作品特征。以及

第二分类模块505，用于根据第一作品特征和第二作品特征，确定视频作者的作者类型标签。

在一种可能的实现方式中，第一确定模块501用于：

获取视频作者的多个视频作品的封面图像。

利用预先训练的第一分类模型，确定封面图像的分类结果。

在一种可能的实现方式中，第三确定模块504，包括：

数量确定子模块，用于针对至少一种维度的属性信息，确定包含目标属性的第二视频作品的数量。其中，目标属性为属性信息的其中一种属性。

占比确定子模块，用于根据第二视频作品的数量与多个视频作品的数量，确定第二视频作品的占比。

特征确定子模块，用于根据至少一种维度的属性信息对应的占比，确定视频作者的第二作品特征。

在一种可能的实现方式中，数量确定子模块用于：

在一种可能的实现方式中，还包括第四确定模块，用于：

从多个视频作品中采集多个关键帧图像。

根据多个关键帧图像，确定第二图像特征。

根据第二图像特征，确定多个视频作品的格调分类标签。

第二分类模块还用于：

本公开实施例的装置的各模块、子模块的具体功能和示例的描述，可以参见上述方法实施例中对应步骤的相关描述，在此不再赘述。

图6为本公开一实施例提供的视频资源的推荐装置的结构示意图。如图6所示，该装置包括：

作者确定模块601，用于根据视频作者的作者类型标签，确定目标视频作者。其中，视频作者的作者类型标签根据权利要求11至16中任一项的装置得到。

筛选模块602，用于从目标视频作者的多个视频作品中，筛选得到第三视频作品，以形成视频资源池。

召回模块603，用于响应于用户请求，从视频资源池中进行资源召回，以得到召回结果。以及

推荐模块604，用于根据召回结果，得到待推荐的视频资源。

在一种可能的实现方式中，推荐模块604包括：

排序子模块，用于对召回结果进行排序。

资源确定子模块，用于根据排序的结果，得到待推荐的视频资源。

在一种可能的实现方式中，排序子模块用于：

在一种可能的实现方式中，排序子模块还用于：

根据业务探索策略，对排序的结果进行重新排序。

根据重新排序的结果，得到待推荐的视频资源。

本公开的技术方案中，所涉及的用户个人信息的获取，存储和应用等，均符合相关法律法规的规定，且不违背公序良俗。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图7示出了可以用来实施本公开的实施例的示例电子设备700的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字助理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图7所示，设备700包括计算单元701，其可以根据存储在只读存储器(ROM)702中的计算机程序或者从存储单元708加载到随机访问存储器(RAM)703中的计算机程序，来执行各种适当的动作和处理。在RAM 703中，还可存储设备700操作所需的各种程序和数据。计算单元701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。

设备700中的多个部件连接至I/O接口705，包括：输入单元706，例如键盘、鼠标等；输出单元707，例如各种类型的显示器、扬声器等；存储单元708，例如磁盘、光盘等；以及通信单元709，例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理，例如视频作者的识别方法和视频资源的推荐方法。例如，在一些实施例中，视频作者的识别方法和视频资源的推荐方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元708。在一些实施例中，计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到RAM 703并由计算单元701执行时，可以执行上文描述的视频作者的识别方法和视频资源的推荐方法的一个或多个步骤。备选地，在其他实施例中，计算单元701可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行视频作者的识别方法和视频资源的推荐方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入、或者触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种视频作者的识别方法，包括：

根据视频作者的多个视频作品的封面图像的分类结果，确定所述多个视频作品的第一图像特征；

根据所述多个视频作品的文本特征和所述第一图像特征，从所述多个视频作品中确定目标类型的第一视频作品；其中，所述文本特征根据视频作品的标签信息得到；

根据所述第一视频作品在所述多个视频作品中的占比，确定所述视频作者的第一作品特征；

根据所述多个视频作品中包含目标属性的第二视频作品的占比，确定所述视频作者的第二作品特征；以及

根据所述第一作品特征和所述第二作品特征，确定所述视频作者的作者类型标签。

2.根据权利要求1所述的方法，其中，根据视频作者的多个视频作品的封面图像的分类结果，确定所述多个视频作品的第一图像特征，包括：

获取视频作者的多个视频作品的封面图像；

利用预先训练的第一分类模型，确定所述封面图像的分类结果；

根据所述封面图像的分类结果，确定所述多个视频作品的第一图像特征。

3.根据权利要求1所述的方法，其中，根据所述多个视频作品中包含目标属性的第二视频作品的占比，确定所述视频作者的第二作品特征，包括：

针对至少一种维度的属性信息，确定包含目标属性的第二视频作品的数量；其中，所述目标属性为所述属性信息的其中一种属性；

根据所述第二视频作品的数量与所述多个视频作品的数量，确定所述第二视频作品的占比；

根据所述至少一种维度的属性信息对应的占比，确定所述视频作者的第二作品特征。

4.根据权利要求3所述的方法，其中，针对至少一种维度的属性信息，确定包含目标属性的第二视频作品的数量，包括以下至少一种方式：

针对视频类目维度的属性信息，确定包含所述目标视频类目的第二视频作品的数量；

针对描述标签维度的属性信息，确定包含所述目标标签的第二视频作品的数量；

针对封面图像类型维度的属性信息，根据所述封面图像的分类结果，确定所述封面图像为目标类型的第二视频作品的数量。

5.根据权利要求4所述的方法，其中，针对视频类目维度的属性信息，确定包含目标视频类目的第二视频作品的数量，包括：

针对视频类目维度的属性信息，根据每种视频类目包含的视频作品的数量，得到视频类目的排序结果；

对所述排序结果为前N位的目标视频类目，确定对应的第二视频作品的数量，其中，所述N为正整数。

6.根据权利要求1至5任一项所述的方法，还包括：

从所述多个视频作品中采集多个关键帧图像；

根据所述多个关键帧图像，确定第二图像特征；

根据所述第二图像特征，确定所述多个视频作品的格调分类标签；

根据所述多个视频作品的格调分类标签，确定所述视频作者的第三作品特征；

所述根据所述第一作品特征和所述第二作品特征，确定所述视频作者的作者类型标签，包括：

根据所述第一作品特征、所述第二作品特征以及所述第三作品特征，确定所述视频作者的作者类型标签。

7.一种视频资源的推荐方法，包括：

根据视频作者的作者类型标签，确定目标视频作者；其中，所述视频作者的作者类型标签根据权利要求1至6中任一项的识别方法得到；

从所述目标视频作者的多个视频作品中，筛选得到第三视频作品，以形成视频资源池；

响应于用户请求，从所述视频资源池中进行资源召回，以得到召回结果；以及

根据所述召回结果，得到待推荐的视频资源。

8.根据权利要求7所述的方法，其中，根据所述召回结果，得到待推荐的视频资源，包括：

对所述召回结果进行排序；

根据排序的结果，得到待推荐的视频资源。

9.根据权利要求8所述的方法，其中，对所述召回结果进行排序，包括：

确定所述召回结果中的多个视频资源的预估点击率、预估完成率以及视频时长；

根据所述预估点击率、所述预估完成率以及所述视频时长，确定所述多个视频资源的预估分；

按所述预估分由高到低，对所述召回结果中的多个视频资源进行排序。

10.根据权利要求8或9所述的方法，其中，根据排序的结果，得到待推荐的视频资源，包括：

根据业务探索策略，对排序的结果进行重新排序；

根据所述重新排序的结果，得到待推荐的视频资源。

11.一种视频作者的识别装置，包括：

第一确定模块，用于根据视频作者的多个视频作品的封面图像的分类结果，确定所述多个视频作品的第一图像特征；

第一分类模块，用于根据所述多个视频作品的文本特征和所述第一图像特征，从所述多个视频作品中确定目标类型的第一视频作品；其中，所述文本特征根据视频作品的标签信息得到；

第二确定模块，用于根据所述第一视频作品在所述多个视频作品中的占比，确定所述视频作者的第一作品特征；

第三确定模块，用于根据所述多个视频作品中包含目标属性的第二视频作品的占比，确定所述视频作者的第二作品特征；以及

第二分类模块，用于根据所述第一作品特征和所述第二作品特征，确定所述视频作者的作者类型标签。

12.根据权利要求11所述的装置，其中，所述第一确定模块用于：

获取视频作者的多个视频作品的封面图像；

13.根据权利要求11所述的装置，其中，所述第三确定模块，包括：

数量确定子模块，用于针对至少一种维度的属性信息，确定包含目标属性的第二视频作品的数量；其中，所述目标属性为所述属性信息的其中一种属性；

占比确定子模块，用于根据所述第二视频作品的数量与所述多个视频作品的数量，确定所述第二视频作品的占比；

特征确定子模块，用于根据所述至少一种维度的属性信息对应的占比，确定所述视频作者的第二作品特征。

14.根据权利要求13所述的装置，其中，所述数量确定子模块用于：

15.根据权利要求14所述的装置，其中，所述数量确定子模块用于：

16.根据权利要求11至15任一项所述的装置，还包括第四确定模块，用于：

从所述多个视频作品中采集多个关键帧图像；

根据所述多个关键帧图像，确定第二图像特征；

所述第二分类模块还用于：

17.一种视频资源的推荐装置，包括：

作者确定模块，用于根据视频作者的作者类型标签，确定目标视频作者；其中，所述视频作者的作者类型标签根据权利要求11至16中任一项的装置得到；

筛选模块，用于从所述目标视频作者的多个视频作品中，筛选得到第三视频作品，以形成视频资源池；

召回模块，用于响应于用户请求，从所述视频资源池中进行资源召回，以得到召回结果；以及

推荐模块，用于根据所述召回结果，得到待推荐的视频资源。

18.根据权利要求17所述的装置，其中，所述推荐模块包括：

排序子模块，用于对所述召回结果进行排序；

19.根据权利要求18所述的装置，其中，所述排序子模块用于：

20.根据权利要求18或19所述的装置，其中，所述排序子模块还用于：

根据业务探索策略，对排序的结果进行重新排序；

根据所述重新排序的结果，得到待推荐的视频资源。

21.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-10中任一项所述的方法。

22.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-10中任一项所述的方法。

23.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-10中任一项所述的方法。