CN111274442A

CN111274442A - 确定视频标签的方法、服务器及存储介质

Info

Publication number: CN111274442A
Application number: CN202010198284.5A
Authority: CN
Inventors: 陈艳君; 王宝云; 韩洁
Original assignee: Qingdao Hisense Media Network Technology Co Ltd
Current assignee: Qingdao Hisense Media Network Technology Co Ltd
Priority date: 2020-03-19
Filing date: 2020-03-19
Publication date: 2020-06-12
Anticipated expiration: 2040-03-19
Also published as: CN111274442B

Abstract

本申请公开了一种确定视频标签的方法、服务器及存储介质，属于计算机技术领域。所述方法包括：通过先确定目标视频的关键信息，再确定出与目标视频的类型对应的目标标签集合，该目标标签集合包括多个标签以及该多个标签中各个标签的权重，再根据确定出的关键信息、多个标签、以及该多个标签中每个标签的权重，确定目标视频的标签。由于各个标签的权重用于指示用户对类型与目标视频的类型一致的一类视频中的标签的关注程度，因此基于该多个标签中每个标签的权重以及目标视频的关键信息确定出的目标视频的标签，在保证了标签准确性的基础上，还可以使得确定出的标签更加符合用户的关注点。

Description

确定视频标签的方法、服务器及存储介质

技术领域

本申请涉及计算机技术领域，特别涉及一种确定视频标签的方法、装置及计算机存储介质。

背景技术

随着互联网技术的快速发展，用户通过智能电视等终端可以观看自己感兴趣的视频。针对视频库中的众多视频，往往需要进行视频检索以获取符合用户喜好的视频。而通常视频检索过程中依赖于视频库中各个视频的视频标签，通过搜索词和视频标签之间的吻合度的高低，确定出与搜索词相关联的视频。因此，如何确定视频的视频标签，是当前本领域的技术人员关注的主要问题之一。

相关技术中，针对某一视频，获取该视频的内容简介，该内容简介为以自然语言编辑的文本。提取该内容简介包括的多个分词。根据分词的出现频率确定出该多个分词中的关键词，并保留权重较高的几个关键词作为该视频的视频标签。

相关技术中直接基于视频的内容简介来确定视频标签，导致确定的视频标签可能并不是用户关注的标签，从而影响基于搜索词搜索出的视频的用户粘度。

发明内容

本申请实施例提供了一种确定视频标签的方法，可以使得确定出的标签更符合用户的关注点。所述技术方案如下：

一方面，提供了一种方法，所述方法包括：

确定目标视频中的关键信息，所述关键信息包括所述目标视频中出现的实体的信息和/或文本信息；

确定与所述目标视频的类型对应的目标标签集合，所述目标标签集合包括多个标签和所述多个标签中各个标签的权重，所述各个标签的权重用于指示用户对类型与所述目标视频的类型一致的一类视频中的标签的关注程度；

根据所述多个标签和所述多个标签中各个标签的权重和所述关键信息，确定所述目标视频的标签。

另一方面，提供了一种服务器，所述服务器包括：

处理模块，用于确定目标视频中的关键信息，所述关键信息包括所述目标视频中出现的实体的信息和/或文本信息；

所述处理模块，还用于确定与所述目标视频的类型对应的目标标签集合，所述目标标签集合包括多个标签和所述多个标签中各个标签的权重，所述各个标签的权重用于指示用户对类型与所述目标视频的类型一致的一类视频中的标签的关注程度；

所述处理模块，还用于根据所述多个标签和所述多个标签中各个标签的权重和所述关键信息，确定所述目标视频的标签。

另一方面，提供了一种服务器，所述服务器包括处理器、通信接口、存储器和通信总线；

其中，所述处理器、所述通信接口和所述存储器通过所述通信总线完成相互间的通信；

所述存储器用于存放计算机程序；

所述处理器用于执行所述存储器上所存放的程序，以实现前述提供确定视频标签的方法。

另一方面，提供了一种计算机可读存储介质，所述存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现前述提供的确定视频标签的方法的步骤。

本申请实施例提供的技术方案带来的有益效果至少包括：

通过先确定目标视频的关键信息，再确定出与目标视频的类型对应的目标标签集合，该目标标签集合包括多个标签以及该多个标签中各个标签的权重，再根据确定出的关键信息、多个标签、以及该多个标签中每个标签的权重，确定目标视频的标签。由于各个标签的权重用于指示用户对类型与目标视频的类型一致的一类视频中的标签的关注程度，因此基于该多个标签中每个标签的权重以及目标视频的关键信息确定出的目标视频的标签，在保证了标签准确性的基础上，还可以使得确定出的标签更加符合用户的关注点。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种确定视频标签系统的架构图；

图2是本申请实施例提供的一种确定视频标签的方法流程图；

图3是本身实施例提供的另一种确定视频标签的方法流程图；

图4是本申请实施例提供的一种服务器的结构示意图；

图5是本申请实施例提供的另一种服务器的结构示意图。

具体实施方式

为使本申请示例性实施例的目的、技术方案和优点更加清楚，下面将结合本申请示例性实施例中的附图，对本申请示例性实施例中的技术方案进行清楚、完整地描述，显然，所描述的示例性实施例仅是本申请一部分实施例，而不是全部的实施例。

基于本申请中示出的示例性实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。此外，虽然本申请中公开内容按照示范性一个或几个实例来介绍，但应理解，可以就这些公开内容的各个方面也可以单独构成一个完整技术方案。

应当理解，本申请中说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，例如能够根据本申请实施例图示或描述中给出那些以外的顺序实施。

此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖但不排他的包含，例如，包含了一系列组件的产品或设备不必限于清楚地列出的那些组件，而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。

本申请中使用的术语“模块”，是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合，能够执行与该元件相关的功能。

在对本申请实施例进行详细的解释说明之前，先对本申请实施例涉及的应用场景予以介绍。

随着互联网技术的快速发展，电视剧、电影等视频的数量越来越大。在一些可能的场景下，往往需要快速了解视频的基本内容。这些可能的场景比如可以为，服务器响应于终端发送的搜索请求，向终端推送相关视频内容的视频搜索场景。或者，还可以为终端的显示界面对视频库中的视频进行分类展示的视频分类场景。为了便于快速确定视频的基本内容，可以预先为视频库中的各个视频设置视频标签，以便于后续基于视频库中各个视频的视频标签对视频进行搜索或分类，可以大大增加视频搜索或者视频分类的效率。

而相关技术中，可以通过人工设置视频标签的方法来确定视频标签。但是该方法不仅需要耗费大量的人力物力，而且常常受人员主观因素的影响，视频标签的可信度和准确度都很低。

相关技术中还可以基于深度学习模型输出视频标签的方法，通过输入目标视频的基本内容，自动输出目标视频的视频标签。但是由于该深度学习模型可识别的标签的范围有限，因此，常常输出的视频标签的由于覆盖度受限而导致确定出的标签可能不属于用户重点关注的标签，从而无法实现利用视频标签快速筛选及搜索视频的目的。

本申请实施例提供的确定视频标签的方法便应用于上述场景中，使得确定出的标签更符合用户关注点。

图1是本申请实施例提供的一种确定视频标签系统的架构图。如图1所示，该系统100中包括终端101以及服务器102。其中，终端101可以与服务器102之间通过无线或有线方式连接以进行通信。

该终端101可以从服务器102处获取视频，并基于用户界面向用户展示视频。该服务器102用于获取视频库以及视频库中每个视频的相关信息，如视频数据、音频数据等，并根据任一视频的相关信息为该任一视频设置视频标签。以便于后续服务器102基于视频标签向终端101提供视频。其中，视频库中存储有每个视频的相关信息，该相关信息包括但不限于视频的标识、视频的音视频数据、以及视频的类型等。

图1中仅仅以一个终端，和一个服务器为例进行说明，并不构成对本申请实施例提供的确定视频标签系统中的终端的数量的限制。另外，终端101可以是电视、手机或者电脑等设备，服务器可以是手机或电脑上安装的任一视频播放应用对应的服务器，也可以是电视终端对应的服务器，在此并不做限定。

接下来对本申请实施例提供的确定视频标签的方法进行详细的解释说明。

图2是本申请实施例提供的一种确定视频标签的方法流程图，该方法应用于服务器。请参考图2，该方法包括如下步骤：

步骤201：服务器确定目标视频中的关键信息。

为了确保目标视频的标签可以准确概括目标视频的基本内容，通常需要先根据目标视频的相关信息提取出目标视频的关键信息，并基于该关键信息进一步确定目标视频的标签。其中，该关键信息包括目标视频中出现的实体的信息和/或文本信息。

在一种可能的实现方式中，步骤201可能的实现过程为：根据目标视频的图像数据和/或音频数据，确定目标视频中的文本信息；确定该文本信息中的关键分词；根据该目标视频中的图像数据获取目标视频中的实体信息；将该实体信息和该关键分词确定为目标视频的关键信息。

在一种可能的实现方式中，根据目标视频的图像数据，确定目标视频中的文本信息，可能的实现过程为：获取目标视频的图像数据，基于图像输入模型，将目标视频的图像数据输入到该图像模型中，得到目标视频的文本信息。

需要说明的是，针对任一视频，图像输入模型用于根据该视频的图像数据，直接输出该视频的文本信息，该图像数据可以是该视频包括的所有视频帧，也可以是该视频包括的所有关键帧，在此并不做具体限定。此外，本申请实施例并不限定该图像输入模型的训练过程，在此不做详细阐述。

在另一种可能的实现方式中，根据目标视频的图像数据，确定目标视频中的文本信息，可能的实现过程为：直接采用OCR(Optical Character Recognition，光学字符识别)技术，基于目标视频的图像数据，获取目标视频中的文本信息。

上述文本信息可以是目标视频的弹幕信息，也可以是目标视频的字幕信息，也可以是其他类型的信息，在此并不做具体限定。

此外，在一种可能的实现方式中，根据目标视频的音频数据，确定目标视频中的文本信息，可能的实现过程为：获取目标视频的音频数据，对目标视频的音频数据按照停顿时间划分为短语音数据，将该短语音数据输入到已经训练好的语音识别模型中，得到目标视频的文本信息。

其中，该音频数据可以是从数据库中直接获取的，也可以是借助第三方应用程序进行间接获取的，在此并不做具体限定。

需要说明的是，针对任一视频，上述语音输入模型用于根据该视频的音频数据，直接输出该视频的文本信息。此外，本申请实施例并不限定该语音输入模型的的训练过程，在此不做详细阐述。

此外，在一种可能的实现过程中，根据该目标视频中的图像数据获取目标视频中的实体信息的可能的实现过程为：基于已经训练好的实体识别模型，将目标视频的关键帧作为图像数据，输入到该图像模型中，得到多种实体信息，比如、视频场景信息、明星名人信息等。

需要说明的是，针对任一视频，上述实体识别模型用于根据该视频的图像数据，直接输出该视频的多种实体信息。此外，本申请实施例并不限定该实体识别模型的的训练过程，在此不做详细阐述。

其中，上述多种实体信息包括视频场景信息、明星名人信息等，在此并不限定该实体信息包括的实体的类型和数量。

此外，在一种可能的实现过程中，确定该文本信息中的关键分词，可能的实现过程为：确定该文本信息中的多个分词；根据该多个分词在该文本信息中的出现频率，确定该多个分词的权重；如果该多个分词中存在类型为常见分词的分词，则降低该类型为常见分词的分词的权重，该类型为常见分词的分词是指在不同类型的视频中出现频率均大于参考频率的分词；基于调整后的各个分词的权重，从该多个分词中确定该文本信息中的关键分词。通过上述降权处理过程，可以过滤掉一些常见的分词，或者没有特殊意义的分词，如语气词“呢”、“啊”等，并将可用的分词筛选出来。这样通过过滤掉在语料库中常见的分词，可以确保最终确定出的关键分词与该目标视频之间的强相关性。

比如：通过借助根据现有技术中已创建好的分词词典，将目标视频的文本信息中与分词词典中包括的分词一致的词汇筛选出来，将筛选出的分词作为文本信息中包括的多个分词。假设该多个分词为：“校园”、“女生”、“搞笑”、“青春”、“偶像”。统计出各个分词出现的频率，并基于频率越高权重越大的原则，确定出各个分词的权重。比如，根据出现频率统计出的权重由高到低的几个分词分别为：“校园”的权重为0.8、“女生”的权重为0.6、“搞笑”的权重为0.6、“青春”的权重为0.4、“偶像”的权重为0.3。再根据预先创建的常见分词词典，确定出该各个分词中属于常见词的分词，对属于常见词的分词做降权处理。根据调整后的各个分词的权重，确定出该文本信息中的关键分词。假设“搞笑”属于常见词，则将常见词的权重设置为0。则对各个分词中的常见词做降权处理后的各个分词的权重为：“校园”的权重为0.8、“女生”的权重为0.6、“青春”的权重为0.4、“偶像”的权重为0.3。将权重大于参考权重0.5的分词“校园”、“女生”确定为该文本信息的关键分词。

在另一种可能的实现方式中，确定该文本信息中的关键分词，可能的实现过程为：确定该文本信息中的多个分词；根据该多个分词在该文本信息中的出现频率，确定该多个分词的权重；基于该多个分词的权重，从该多个分词中确定该文本信息中的关键分词。

比如：通过借助现有技术中已创建好的分词词典，将目标视频的文本信息中与分词词典中包括的分词一致的词汇筛选出来，将筛选出的分词作为文本信息中包括的多个分词。假设该多个分词为：“校园”、“女生”、“搞笑”、“青春”、“偶像”。统计出各个分词的出现频率，并基于频率越高权重越大的原则，确定出各个分词的权重。比如，根据各个分词的出现频率统计出的权重由高到低的几个分词分别为：“校园”的权重为0.8、“女生”的权重为0.6、“搞笑”的权重为0.6、“青春”的权重为0.4、“偶像”的权重为0.3。将权重大于参考权重0.5的分词“校园”“女生”“搞笑”确定为文本信息的关键分词。

这种确定文本信息中的关键分词的实现方式，虽然相对于上一种添加有降权处理的实现方式，最终确定出的关键分词的准确性较低，但是由于过程简洁，可以很大程度上降低服务器的处理负载。

在根据上述任一实现方式确定出目标视频的实体信息和关键分词之后，可以将该实体信息和关键分词进行合并，将合并后的信息确定为目标视频的关键信息。

步骤202：服务器确定与目标视频的类型对应的目标标签集合，目标标签集合包括多个标签和该多个标签中各个标签的权重，该各个标签的权重用于指示用户对类型与目标视频的类型一致的一类视频中的标签的关注程度。

为了确保最终确定出的目标视频的标签更符合用户的关注点，针对与目标视频同一类型的视频，可以基于绝大部分用户的对该类型的视频的关注点，设置标签的权重。具体的，可以将用户重点关注的几种类型的标签设置较高的权重，将用户容易忽略的几种类型的标签设置较低的权重。从而可以实现基于目标视频的类型，筛选出符合用户关注点的标签的目的。其中，上述标签集合也可以称为标签体系。

比如，在新闻视频中，可以将用户的重点关注的几种类型的标签，比如场景、地点、人物等均设置较高的权重，将用户容易忽略的几种类型的标签，比年代、类型、明星等设置较低的权重；电影视频中可以将用户的重点关注的几种类型的标签，比如年代、类型、主题、明星等均设置较高的权重，将用户容易忽略的几种类型的标签，比如场景、地点、人物等设置较低的权重；在纪录片视频中可以将用户重点关注的几种类型的标签，比如主题、风格等均设置较高的权重，将用户容易忽略的几种类型的标签，如明星、地点、年代等设置较低的权重。

为了便于根据目标视频的类型确定出目标视频的标签，可以预先创建标签库。该标签库中包括多个视频类型和与该多个视频类型一一对应的多个标签集合。因此，在一种可能的实现方式中，步骤202可能的实现过程为：根据目标视频的类型，从标签库中确定目标标签集合。

值得注意的是，针对同一标签集合，存在多个不同权重的标签，而针对视频库中的不同的标签集合，多个标签集合中包括的第一标签集合和第二标签集合，第一标签集合和第二标签集合中存在一个或多个同一标签的权重不同，第一标签集合和第二标签集合为多个标签集合中任意两个。

比如，该标签库可以如表1所示：

表1

其中，同一类型的视频对应的标签集合中包括的各种标签，以及各种标签对应的权重。其中，针对同一标签集合中的任一标签，该标签对应的权重仅仅指示用户对该标签的关注程度，权重越高表示用户的关注度越高，而不是指示该任一标签的用户使用频率相对于该任一标签所属的标签集合中所有标签的总的使用频率的占比情况。

当创建好该标签库后，便可以根据目标视频的类型，从标签库中与目标视频类型一致的视频对应的标签集合作为目标视频对应的目标标签集合。

比如：目标视频的类型为新闻时，则根据上述视频库，确定出对应的目标标签集合为{地点、人物、事件信息、场景}。

值得注意的是，上述目标标签集合可以从预先设置的视频库中获取的，也可以是临时进行梳理构建的，在此并不限定获取该目标标签集合的获取方式。

步骤203：服务器根据该多个标签和该多个标签中各个标签的权重和该关键信息，确定该目标视频的标签。

在根据上述步骤202确定出目标视频的目标标签集合后，进一步地，可以基于该目标标签集合中各个标签的权重，确定出目标视频的标签，由于该各个标签的权重用于指示用户的关注程度，因此可以保证确定出的目标视频的标签可以更加符合用户的关注点。

其中，根据该多个标签和该多个标签中各个标签的权重和该关键信息，确定该视频的标签的过程，也可以称为将关键信息映射到根据标签体系的过程。通过该标签映射过程可以实现最终确定出的标签的准确性和均衡性的目的，从而提升在视频搜索场景和视频推荐场景中标签的实际使用价值。

在一种可能的实现方式中，步骤203可能的实现过程为：根据目标标签集合中各个标签的权重，确定目标标签集合中的重要标签，该重要标签是指目标标签集合中按照权重从大到小排序后排名靠前的参考数量个标签；根据该重要标签对该关键信息进行筛选，得到匹配的关键信息；根据该匹配的关键信息，确定目标视频的标签。

为了便于确定出与目标视频匹配的关键信息，可以预先设置分词分类词典，该分词分类词典包括多个分词，以及与该多个分词中每个分词对应的分词类型，其中，该分词类型包括一级类型、二级类型。针对该分词分类词典的任一分词，该分词的二级类型，为该分词的上位概念，而一级类型为二级类型的上位概念，也即是该分词的相对于二级类型的更上位概念。比如分词“郑晓龙”对应的一级类型是人物，二级类型是导演，其中，分词“郑晓龙”的上位概念是导演，导演的上位概念是人物。

值得注意的是，本申请实施例提供的分词分类词典中各个分词的类型以一级类型和二级类型两种分词类型进行举例说明，但并不限定在该分词分类词典中，各个分词对应的分词类型的种类或数量。

因此，在一种可能的实现方式中，跟据该重要标签对该关键信息进行筛选，得到匹配的关键信息可能的实现过程为：对于该目标视频的关键信息，该关键信息包括多个关键分词，针对任一关键分词，可以基于该分词分类词典查找该关键分词的类型，该类型可以是一级类型，也可以是二级类型，如果重要标签中存在和该类型一致的标签，则将该分词作为匹配的关键信息。

比如，该目标视频的类型为新闻短视频时，根据上述过程，确定出的匹配的关键信息包括多个关键分词“西安高新区”“火灾”“3月17日”“世纪金花”“损失惨重”，通过分词分类词典，确定出“西安高新区”“世纪金花”对应的类型为“地点”，“火灾”对应的类型为“事件信息”，“3月17日”对应的类型为“时间”。由于“地点”、“事件”和“时间”均为视频库中，重要标签为目标标签集合中按照权重从大到小排序后排名靠前的参考数量个标签，比如该目标视频的重要标签“地点”“事件信息”时，则将“地点”和“事件信息”对应的关键分词“西安高新区”“世纪金花”“火灾”作为匹配的关键信息。

在得到上述关键信息之后，在一种可能的实现方式中，根据该匹配的关键信息，确定目标视频的标签，可能的实现过程为：将匹配的关键信息，直接作为目标视频的标签。

比如：该目标视频的类型为新闻短视频时，根据上述过程，确定出的匹配的关键信息包括“西安高新区”“世纪金花”“火灾”，将该匹配的关键信息直接作为目标视频的标签。

为了进一步确保视频的标签的丰富性，本申请实施例在根据上述匹配的关键信息得到目标视频的标签的基础上，还可以基于该匹配信息之外的关键信息，进一步拓展目标视频的标签。因此，在一种可能的实现方式中，根据该匹配的关键信息，确定目标视频的标签，可能的实现过程为：确定该关键信息中除该匹配的关键信息之外的关键信息，得到非匹配关键信息；确定出该非匹配关键信息中各个信息的权重，该各个信息的权重用于指示信息在目标视频中的出现频率；根据该非匹配关键信息中权重大于权重阈值的信息、以及该匹配的关键信息，确定目标视频的标签。

比如：上述关键信息中，除匹配的关键信息之外的关键信息，得到非匹配的关键信息，比如。该非匹配的关键信息为“3月17号”、“损失惨重”，根据该非匹配的关键信息中各个信息的出现频率，确定出各个非匹配的关键信息的权重。根据分词“损失惨重”的出现频率为5次，确定出分词“损失惨重”对应的权重为0.6，根据“3月17号”的出现频率为1次，确定出分词“3月17号”对应的权重为0.3。则将权重大于权重阈值0.5的信息“损失惨重”以及匹配的关键信息“西安高新区”“世纪金花”“火灾”，作为目标视频的标签。

此外，步骤201～步骤203的实现过程还可以参见图3：首先，获取目标视频的图像数据，该图像数据可以是目标视频的关键帧数据。将该图像数据输入到实体识别模型中，确定出该目标视频中的实体信息，该实体信息包括视频场景、明星人脸、物体目标等。同时，将该视频数据输入到图像输入模型中，确定出该目标视频包括的OCR文本信息。其次，获取目标视频的音频数据，将该音频数据输入到语音识别模型，确定出该目标视频的语音文本信息，上述OCR文本信息和语音文本信息均可以是广告信息，弹幕信息或者字幕信息中的一种或多种等。然后，将该文本信息和实体信息进行合并，将合并后的信息确定为目标视频的关键信息。最后，将该关键信息映射到已创建的目标视频对应的目标标签集合后，将与该标签体系匹配的关键信息，确定为目标视频的标签。

在本申请实施例中，通过先确定目标视频的关键信息，再确定出与目标视频的类型对应的目标标签集合，该目标标签集合包括多个标签以及该多个标签中各个标签的权重，再根据确定出的关键信息、多个标签、以及该多个标签中每个标签的权重，确定目标视频的标签。由于各个标签的权重用于指示用户对类型与目标视频的类型一致的一类视频中的标签的关注程度，因此基于该多个标签中每个标签的权重以及目标视频的关键信息确定出的目标视频的标签，在保证了标签准确性的基础上，还可以使得确定出的标签更加符合用户的关注点。

上述所有可选技术方案，均可按照任意结合形成本申请的可选实施例，本申请实施例对此不再一一赘述。

图4是本申请实施例提供的一种服务器的结构示意图，该服务器可以由软件、硬件或者两者的结合实现。该服务器可以包括：

处理模块401，用于确定目标视频中的关键信息，该关键信息包括目标视频中出现的实体的信息和/或文本信息；

该处理模块，还用于确定与目标视频的类型对应的目标标签集合，目标标签集合包括多个标签和该多个标签中各个标签的权重，该各个标签的权重用于指示用户对类型与该目标视频的类型一致的一类视频中的标签的关注程度；

该处理模块，还用于根据该多个标签和该多个标签中各个标签的权重和该关键信息，确定该目标视频的标签。

可选地，该处理模块用于：

根据该目标视频的类型，从标签库中确定目标标签集合；

其中，该标签库中包括多个视频类型和与该多个视频类型一一对应的多个标签集合，不同标签集合中存在一个或多个同一标签的权重不同。

可选地，该处理模块用于：

根据该目标标签集合中各个标签的权重，确定目标标签集合中的重要标签，该重要标签是指该目标标签集合中按照权重从大到小排序后排名靠前的参考数量个标签；

根据该重要标签对该关键信息进行筛选，得到匹配的关键信息；

根据该匹配的关键信息，确定目标视频的标签。

可选地，该处理模块用于：

确定该关键信息中除该匹配的关键信息之外的关键信息，得到非匹配关键信息；

确定出该非匹配关键信息中各个信息的权重，该各个信息的权重用于指示信息在该目标视频中的出现频率；

根据该非匹配关键信息中权重大于权重阈值的信息、以及该匹配的关键信息，确定该目标视频的标签。

可选地，该处理模块用于：

根据该目标视频的图像数据和/或音频数据，确定该目标视频中的文本信息；

确定该文本信息中的关键分词；

根据该目标视频中的图像数据获取该目标视频中的实体信息；

将该实体信息和该关键分词确定为该目标视频的关键信息。

可选地，该处理模块用于：

确定该文本信息中的多个分词；

根据该多个分词在该文本信息中的出现频率，确定该多个分词的权重；

如果该多个分词中存在类型为常见分词的分词，则降低该类型为常见分词的分词的权重，该类型为常见分词的分词是指在不同类型的视频中出现频率均大于参考频率的分词；

基于调整后的各个分词的权重，从该多个分词中确定该文本信息中的关键分词。

可选地，该多个视频类型包括电影、电视剧、纪录片、新闻。

需要说明的是：上述实施例提供的服务器在确定视频标签时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的服务器与确定视频标签的方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图5是本申请实施例提供的一种服务器的结构示意图。该服务器可以是后台服务器集群中的服务器。具体来讲：

服务器500包括中央处理单元(CPU)501、包括随机存取存储器(RAM)502和只读存储器(ROM)503的系统存储器504，以及连接系统存储器504和中央处理单元501的系统总线505。服务器500还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(I/O系统)506，和用于存储操作系统513、应用程序514和其他程序模块515的大容量存储设备507。

基本输入/输出系统506包括有用于显示信息的显示器508和用于用户输入信息的诸如鼠标、键盘之类的输入设备509。其中显示器508和输入设备509都通过连接到系统总线505的输入输出控制器510连接到中央处理单元501。基本输入/输出系统506还可以包括输入输出控制器510以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地，输入输出控制器510还提供输出到显示屏、打印机或其他类型的输出设备。

大容量存储设备507通过连接到系统总线505的大容量存储控制器(未示出)连接到中央处理单元501。大容量存储设备507及其相关联的计算机可读介质为服务器500提供非易失性存储。也就是说，大容量存储设备507可以包括诸如硬盘或者CD-ROM驱动器之类的计算机可读介质(未示出)。

不失一般性，计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM、EEPROM、闪存或其他固态存储其技术，CD-ROM、DVD或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然，本领域技术人员可知计算机存储介质不局限于上述几种。上述的系统存储器504和大容量存储设备507可以统称为存储器。

根据本申请的各种实施例，服务器500还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器500可以通过连接在系统总线505上的网络接口单元511连接到网络512，或者说，也可以使用网络接口单元511来连接到其他类型的网络或远程计算机系统(未示出)。

上述存储器还包括一个或者一个以上的程序，一个或者一个以上程序存储于存储器中，被配置由CPU执行。所述一个或者一个以上程序包含用于进行本申请实施例提供的如下所述的确定视频标签的方法的指令。

本申请实施例还提供了一种非临时性计算机可读存储介质，当所述存储介质中的指令由服务器的处理器执行时，使得服务器能够执行上述实施例提供的确定视频标签的方法。

本申请实施例还提供了一种包含指令的计算机程序产品，当其在服务器上运行时，使得服务器执行上述实施例提供的确定视频标签方法。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的较佳实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种确定视频标签的方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，所述确定与所述目标视频的类型对应的目标标签集合，包括：

根据所述目标视频的类型，从标签库中确定所述目标标签集合；

其中，所述标签库中包括多个视频类型和与所述多个视频类型一一对应的多个标签集合，所述多个标签集合中第一标签集合和第二标签集合中存在一个或多个同一标签的权重不同，所述第一标签集合和所述第二标签集合为所述多个标签集合中任意两个。

3.如权利要求1所述的方法，其特征在于，所述根据所述多个标签和所述多个标签中各个标签的权重和所述关键信息，确定所述目标视频的标签，包括：

根据所述目标标签集合中各个标签的权重，确定所述目标标签集合中的重要标签，所述重要标签是指所述目标标签集合中按照权重从大到小排序后排名靠前的参考数量个标签；

根据所述重要标签对所述关键信息进行筛选，得到匹配的关键信息；

根据所述匹配的关键信息，确定所述目标视频的标签。

4.如权利要求3所述的方法，其特征在于，所述根据所述匹配的关键信息，确定所述目标视频的标签，包括：

确定所述关键信息中除所述匹配的关键信息之外的关键信息，得到非匹配关键信息；

确定出所述非匹配关键信息中各个信息的权重，所述各个信息的权重用于指示信息在所述目标视频中的出现频率；

根据所述非匹配关键信息中权重大于权重阈值的信息、以及所述匹配的关键信息，确定所述目标视频的标签。

5.如权利要求1所述的方法，其特征在于，所述确定目标视频中的关键信息，包括：

根据所述目标视频的图像数据和/或音频数据，确定所述目标视频中的文本信息；

确定所述文本信息中的关键分词；

根据所述目标视频中的图像数据获取所述目标视频中的实体信息；

将所述实体信息和所述关键分词确定为所述目标视频的关键信息。

6.如权利要求5所述的方法，其特征在于，所述确定所述文本信息中的关键分词，包括：

确定所述文本信息中的多个分词；

根据所述多个分词在所述文本信息中的出现频率，确定所述多个分词的权重；

如果所述多个分词中存在类型为常见分词的分词，则降低所述类型为常见分词的分词的权重，所述类型为常见分词的分词是指在不同类型的视频中出现频率均大于参考频率的分词；

基于调整后的各个分词的权重，从所述多个分词中确定所述文本信息中的关键分词。

7.如权利要求2所述的方法，其特征在于，所述多个视频类型包括电影、电视剧、纪录片、新闻。

8.一种服务器，其特征在于，所述服务器包括：

9.一种确定视频标签的装置，其特征在于，所述装置包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为执行上述权利要求1至权利要求7中的任一项权利要求所述的方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有指令，所述指令被处理器执行时实现上述权利要求1至权利要求7中的任一项权利要求所述的方法的步骤。