CN111368141A

CN111368141A - 视频标签的扩展方法、装置、计算机设备和存储介质

Info

Publication number: CN111368141A
Application number: CN202010189806.5A
Authority: CN
Inventors: 刘刚
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-03-18
Filing date: 2020-03-18
Publication date: 2020-07-03
Anticipated expiration: 2040-03-18
Also published as: CN111368141B

Abstract

本申请涉及一种视频标签的扩展方法、装置、计算机设备和存储介质。所述方法包括：获取目标视频的视频文本信息；根据视频文本信息，获取目标视频的种子标签；根据目标视频的种子标签以及与目标视频相关的历史图文信息的图文标签，从历史图文信息中筛选出目标视频的关联图文信息；将关联图文信息的图文标签，确定为目标视频的扩展标签。采用本方法能够实现利用与目标视频具有关联关系的图文信息的图文标签，对目标视频的标签进行扩展，可有效完善目标视频的标签体系，丰富目标视频的标签的描述信息的维度，使得目标视频的标签有效提升后续推荐的精准度。

Description

视频标签的扩展方法、装置、计算机设备和存储介质

技术领域

本申请涉及互联网应用技术领域，特别是涉及一种视频标签的扩展方法、装置、计算机设备和存储介质。

背景技术

在互联网快速发展的时代，随着内容生产的门槛降低，视频内容上传量以指数级的速度增长，特别是短视频类视频内容。而使用标签对视频内容进行描述，将视频内容标签化，是实现将不同的视频内容个性化推荐至不同的用户的重要一环。其中，标签越丰富，其包含更多的关键词信息，使得视频内容识别、推荐更明晰，有效提高推荐目标用户的精准度，以获得更多的播放量。

现有视频内容标签化过程一般是通过机器辅助从视频内容对应的视频标题等文本信息中抽取标签，但是视频所包含的文本信息内容较少，文本信息有限，最终获得的标签也有限，难以达到视频内容个性化推荐的要求。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提高视频内容对于的视频标签数量的视频标签的扩展方法、装置、计算机设备和存储介质。

一种视频标签的扩展方法，所述方法包括：

获取目标视频的视频文本信息；

根据所述视频文本信息，获取所述目标视频的种子标签；

根据所述目标视频的种子标签以及与所述目标视频相关的历史图文信息的图文标签，从所述历史图文信息中筛选出所述目标视频的关联图文信息；

将所述关联图文信息的图文标签，确定为所述目标视频的扩展标签。

一种视频标签的扩展装置，所述装置包括：

视频文本获取模块，用于获取目标视频的视频文本信息；

种子标签获取模块，用于根据所述视频文本信息，获取所述目标视频的种子标签；

关联图文获取模块，用于根据所述目标视频的种子标签以及与所述目标视频相关的历史图文信息的图文标签，从所述历史图文信息中筛选出所述目标视频的关联图文信息；

标签扩展模块，用于将所述关联图文信息的图文标签，确定为所述目标视频的扩展标签。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

获取目标视频的视频文本信息；

根据所述视频文本信息，获取所述目标视频的种子标签；

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

获取目标视频的视频文本信息；

根据所述视频文本信息，获取所述目标视频的种子标签；

上述视频标签的扩展方法、装置、计算机设备和存储介质，，通过获取目标视频的视频文本信息，从而根据视频文本信息抽取目标视频的种子标签，然后根据目标视频的种子标签以及与所述目标视频相关的历史图文信息的图文标签，从历史图文信息中筛选出目标视频的关联图文信息，并将关联图文信息的图文标签，确定为目标视频的扩展标签，实现利用与目标视频具有关联关系的图文信息的图文标签，对目标视频的标签进行扩展，由于图文信息的文本内容信息丰富，且基于自然语言处理抽取图文标签技术成熟，图文信息的图文标签包括丰富的文本信息，利用与目标视频具有关联关系的图文信息的图文标签对目标视频的标签进行扩展，能够极大丰富视频标签的扩展范围，有效完善目标视频的标签，丰富目标视频的标签的描述信息的维度，使得目标视频的标签有效提升后续推荐的精准度。

附图说明

图1为一个实施例中视频标签的扩展方法的应用环境图；

图2为一个实施例中视频标签的扩展方法的流程示意图；

图3为一个实施例中步骤根据目标视频的种子标签以及历史图文信息的图文标签，从历史图文信息中筛选目标视频的关联图文信息的流程示意图；

图4为一个实施例中步骤根据预选关联图文信息的图文标签以及目标视频的种子标签，计算预选关联图文信息与目标视频间的关联度的流程示意图；

图5为另一个实施例中步骤根据目标视频的种子标签以及历史图文信息的图文标签，从历史图文信息中筛选目标视频的关联图文信息的流程示意图；

图6a为一个实施例中视频标签扩展系统的系统框架图；

图6b为一个实施例中视频标签的扩展方法的过程示意图；

图7为一个实施例中视频标签的扩展方法装置的结构框图；

图8为另一个实施例中视频标签的扩展方法装置的结构框图；

图9为又一个实施例中视频标签的扩展方法装置的结构框图；

图10为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

为了便于对本发明实施例的理解，下面先对几个概念进行简单介绍：

图文信息，是指图文内容，也可以理解为文章，可以包含文字、视频或图片，例如QQ看点推荐给用户阅读的文章、微信公众号的号主所发布的文章等。

视频，是指视频内容，可以包括竖版的小视频和横版的短视频，通常以信息流(Feeds流)的形式提供，例如QQ看点、微视等应用程序推荐给用户阅读的视频。

短视频，即短片视频，属于视频的一种形式。短视频是一种互联网内容传播方式，一般是在互联网新媒体上传播的时长在5分钟以内的视频传播内容；随着移动终端普及和网络的提速，短平快的大流量传播内容逐渐获得各大平台、粉丝和资本的青睐。

多频道网络(Multi-Channel Network，MCN)，是一种多频道网络的产品形态，将专业生产内容联合起来，在资本的有力支持下，保障内容的持续输出，从而最终实现商业的稳定变现。

专业生产内容(Professional Generated Content，PGC)，互联网术语，是指专业生产内容，例如视频网站、专家生产内容的内容，例如微博等。

用户原创内容(User Generated Content，UGC)，是伴随着以提倡个性化为主要特点的Web2.0概念而兴起的，它并不是某一种具体的业务，而是一种用户使用互联网的新方式，即由原来的以下载为主变成下载和上传并重。

专业用户原创内容(Professional User Generated Content，PUGC)，是以UGC形式，产出的相对接近PGC的专业音视频内容。

终端，是指用户随身携带的、可以接收消息的终端设备，包括IOS、Android等智能操作系统。

终端程序，是指运行在终端上，类似QQ，微信等各种可接受即时消息及Feeds流信息的应用。

服务端，部署在多组服务器上、专门为终端程序提供远程网络服务的服务器程序。

用户，是指使用终端的人，具体可以是指使用终端程序的人。用户可以是内容生产者，也可以是内容消费者。

Feeds，消息来源，是指一种资料格式，网站透过它将最新资讯传播给用户，通常以时间轴(Timeline)方式排列。用户能够订阅网站的先决条件是，网站提供了消息来源，将feed汇流于一处称为聚合(aggregation)，而用于聚合的软体称为聚合器(aggregator)。对最终用户而言，聚合器是专门用来订阅网站的软件，一般亦称为RSS阅读器、feed阅读器、新闻阅读器等。

机器学习(Machine Learning，ML)，是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。

关联关系，反映一个事物与其他事物之间的相互依存性和关联性。如果两个或者多个事物之间存在一定的关联关系，那么其中一个事物就能够通过其他事物预测得到。

自然语言处理(NLP)，是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。

命名实体识别(Named Entity Recognition，NER)，是信息提取、问答系统、句法分析、机器翻译等应用领域的重要基础工具，在自然语言处理技术走向实用化的过程中占有重要地位。一般来说，命名实体识别的任务就是识别出待处理文本中三大类(实体类、时间类和数字类)、七小类(人名、机构名、地名、时间、日期、货币和百分比)命名实体。

随着互联网的快速发展，很多网站都支持并允许用户自行上传视频并展示给公众，随着内容生产的门槛降低，视频上传量以指数级的速度迅速增长，例如自媒体和机构的PGC、UGC内容等，并且随着网络发展，用户接受信息的需求也逐步趋向于视频化时代，尤其是短视频，这些内容通常以Feeds流形式展示出来供用户快速刷新，目前短视频从一开始的UGC、PGC、用户上传，到专门制造短视频的机构，到MCN，再到专业的短视频应用程序等众多流量平台不断出现，短视频已经成为重要的传播方式之一。目前短视频的分发流程主要包括从开始上传、到上传成功、再到成功进入用户消费的过程，例如，用户通过终端程序例如微视、微信等，拍摄短视频，在短视频录制完成后，通过终端或者B侧比如微信、微信公众号平台等方式进行短视频上传。在短视频上传的过程中，短视频会进行重转码并对短视频对应的视频元信息进行保存，实现将短视频对应的视频文件进行规范化，提升视频在不同平台播放兼容性。然后，短视频需要经过人工审核内容，并通过机器算法对视频内容进行标签抽取，在人工审核通过后，短视频会保存至视频平台的内容存储服务器中，至此，短视频上传成功。最后，服务端可基于短视频的标签，通过内容分发算法或者推荐算法，将短视频推荐分发至精准垂直的目标用户，例如可以根据用户历史阅读的视频内容或图文内容计算用户的画像标签，然后基于用户的画像标签，将向用户推送响应具有与画像标签对应标签的视频。但是，对短视频打标签难度大，短视频所包含的文本信息通常只有一个标题，字数一般小于20，文本信息有限，最终获得的标签也有限，难以概括整个视频的所有关键信息，难以达到视频内容个性化推荐的要求。

本申请提供的视频标签的扩展方法，可以应用于如图1所示的应用环境中。其中，终端102通过网络与服务器104通过网络进行通信。用户通过终端102拍摄视频后，将视频上传至服务器104中，服务器104在获取到终端102上传的视频后，获取视频的视频文本信息，根据视频文本信息，获取目标视频的种子标签，然后根据目标视频的种子标签以及各历史图文信息的图文标签，获取目标视频的关联图文信息，最后将关联图文信息的图文标签，确定为目标视频的扩展标签；后续服务器104可以基于目标视频的种子标签以及扩展标签，将视频推荐给其他用户，以供其他用户进行视频阅读。其中，终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中，如图2所示，提供了一种视频标签的扩展方法，以该方法应用于图1中的服务器为例进行说明，包括以下步骤：

步骤S202，获取目标视频的视频文本信息。

其中，目标视频是指视频内容，包括但不限于短视频、影片等。具体可以是通过相机拍摄的视频，或者是通过可上传视频的应用程序上传得到的视频等等。视频文本信息是指视频的文本描述信息或视频所包含的文本内容信息，例如可以是视频标题、字幕、视频画面内的文字或者视频对应音频的文本信息等。

步骤S204，根据视频文本信息，获取目标视频的种子标签。

其中，种子标签是指基于视频文本信息获取到的标签，即是基于目标视频本身的数据信息提取得到的标签。

其中，服务器在获取到目标视频的视频文本信息后，从视频文本信息中提取目标视频的种子标签。由于视频文本信息通常是一段较短的文本，因此，从视频文本信息中提取目标视频的种子标签，具体可以是基于自然语言处理技术，从视频文本信息中抽取出关键词汇作为目标视频的种子标签。例如，可以是对视频文本信息进行命名实体识别，获取视频文本信息中的实体词语，比如人名、地名等词语，作为目标视频的标签；也可是对视频文本信息进行分词处理，得到视频文本信息中的分词，通过外部校验信息例如词汇的搜索热度，从所有分词中获取种子标签。

以视频文本信息为视频标题为例，假设目标视频的视频标题为“黄子韬唱《爱转角》，张杰问‘谁的歌’罗志祥好尴尬”，通过该视频标题进行命名实体识别，获取视频标题中的实体词汇“罗志祥”、“爱转角”以及“张杰”等词汇作为目标视频的种子标签。

步骤S206，根据目标视频的种子标签以及与目标视频相关的历史图文信息的图文标签，从历史图文信息中筛选目标视频的关联图文信息。

其中，图文信息是指包括长文本信息的主题内容，可以包括图片以及文字，甚至还可以嵌入音频数据或视频数据，例如图文信息可以是微信公众号所发布的文章、新闻网站上发布分新闻文稿等，历史图文信息可以是服务器预先从网络上爬虫获取、并进行图文标签抽取的图文信息。

其中，图文标签是指用于描述图文信息的标签，可以包括但不限于图文信息所属类别的类别标签、图文信息所描述对象的实体标签或图文信息的文本关键词标签等，例如，一篇讲解华为手机的图文信息，其一级分类是科技，二级分类是智能手机，三级分类是国产手机，描述对象是是华为手机mate30，则该历史图文信息的图文标签可以包括但“科技”、“智能手机”、“国产手机”、“华为”、“mate30”等。

由于图文信息中包括长文本信息，文本信丰富，其通过基于自然语言处理技术获取图文标签技术成熟，得到图文标签往往包括图文信息中各类的信息，可准确用于描述图文信息。因此，服务器在获取到目标视频的种子标签后，根据目标视频的种子标签以及与目标视频相关的历史图文信息的图文标签，从历史图文信息中筛选出目标视频的关联图文信息。具体地，可以是将目标视频的种子标签与历史图文信息的图文标签进行匹配，当历史图文信息的图文标签中包含有种子标签，即可以将该历史图文信息确定与目标视频相关联的关联图文信息；也可以是计算目标视频的种子标签与历史图文信息的图文标签间的相似度性，当目标视频的种子标签与历史图文信息的图文标签间相似度大于相似阈值，则可将历史图文信息确定为目标视频的关联图文信息。

步骤S208，将关联图文信息的图文标签，确定为目标视频的扩展标签。

其中，服务器在历史图文信息中确定到关联图文信息后，可以将关联图文信息的图文标签确定为目标视频的扩展标签，使得目标视频得到扩展。由于图文信息的文本内容信息丰富，利用与目标视频具有关联关系的图文信息的图文标签对目标视频的标签进行扩展，可有效完善目标视频的标签体系。

上述视频标签的扩展方法中，通过获取目标视频的视频文本信息，从而根据视频文本信息抽取目标视频的种子标签，然后根据目标视频的种子标签以及历史图文信息的图文标签，从历史图文信息中筛选出与目标视频相关的关联图文信息，并将关联图文信息的图文标签，确定为目标视频的扩展标签，实现利用与目标视频具有关联关系的图文信息的图文标签，对目标视频的标签进行扩展，由于图文信息的文本内容信息丰富，且基于自然语言处理抽取图文标签技术成熟，图文信息的图文标签包括丰富的文本信息，利用关联图文信息的图文标签对目标视频的标签进行扩展，能够极大丰富视频标签的扩展范围，有效完善目标视频的标签，丰富目标视频的标签的描述信息的维度，使得目标视频的标签有效提升后续推荐的精准度，且能有效提高视频标签标注的效率，很大程度上降低视频标签标注的人力成本。

在一个实施例中，如图3所示，步骤S206，根据目标视频的种子标签以及与目标视频相关的历史图文信息的图文标签，从历史图文信息中筛选目标视频的关联图文信息的步骤，包括：

步骤S302，当历史图文信息的图文标签与种子标签相匹配，将历史图文信息确定为与目标视频相关的预选关联图文信息。

其中，服务器在获取到目标视频的种子标签后，可以将历史图文信息的图文标签与任意种子标签进行匹配，当匹配成功时，将该匹配成功的历史图文信息确定为目标视频相关的预选关联图文信息。其中，预选关联图文信息是指至少有一个图文标签与种子标签相匹配的历史图文信息，可以理解的是，预选关联图文信息是对历史图文信息进行首次筛选得到的、与目标视频相关的图文信息。通过将历史图文信息的图文标签与任意种子标签进行匹配，筛选出历史图文信息的图文标签与种子标签相匹配的预选关联图文信息，可实现从海量的历史图文信息中获取有可能与目标视频具有关联关系的图文信息，有效降低后续的数据处理量。

具体地，服务器在获取到目标视频的种子标签后，对于任意一个种子标签，将该种子标签与历史图文信息的图文标签进行逐一对比匹配，当种子标签与历史图文信息的任意一个图文标签匹配成功，则将该历史图文信息确定为预选关联图文信息，如此类推，直至该种子标签与所有的历史图文信息的图文标签进行一一匹配。

步骤S304，根据预选关联图文信息的图文标签以及目标视频的种子标签，计算预选关联图文信息与目标视频间的关联度。

其中，在筛选出预选关联图文信息后，服务器可以根据预选关联图文信息的图文标签以及目标视频的种子标签，计算预选关联图文信息以及目标视频的关联度。具体地，预选关联图文信息以及目标视频的关联度，可以是根据预选关联图文信息的图文标签与目标视频的种子标签间的距离值计算的，例如可以建立标签向量，通过计算标签向量间的距离值确定，当预选关联图文信息的图文标签与目标视频的种子标签间的距离越大，其关联度越小，当预选关联图文信息的图文标签与目标视频的种子标签间的距离越小，其关联度越大。

步骤S306，当预选关联图文信息与目标视频间的关联度大于关联阈值，将预选关联图文信息确定为关联图文信息。

其中，在获得预选关联图文信息与目标视频间的关联度后，通过将该关联度与预设的关联阈值进行对比，当该关联度大于预设的关联阈值，则可认为预选关联图文信息与目标视频相关联，为关联图文信息。

以视频文本信息为视频标题为例，假设目标视频的视频标题为“黄子韬唱《爱转角》，张杰问‘谁的歌’罗志祥好尴尬”，目标视频的种子标签分别为“黄子韬”、“罗志祥”、“爱转角”以及“张杰”等。此时，服务器将种子标签“黄子韬”与历史图文信息的图文标签进行逐一对比匹配，获取图文标签含有“黄子韬”这一标签的所有历史图文信息，同样的，对于“罗志祥”、“爱转角”以及“张杰”等种子标签，分别将种子标签与历史图文信息的图文标签进行逐一对比匹配，以获取图文标签含有“罗志祥”这一标签的所有历史图文信息、图文标签含有“爱转角”这一标签的所有历史图文信息以及图文标签含有“张杰”这一标签的所有历史图文信息，得到预选关联图文信息。然后，对于任意一个预选关联图文信息，根据预选关联图文信息的图文标签以及目标视频的种子标签，计算预选关联图文信息与目标视频间的关联度，并将与目标视频间的关联度大于关联阈值的预选关联图文信息确定为关联图文信息。

本实施例中，通过将目标视频与关联图文信息间的关联度，以标签作为桥梁，转化为计算目标视频的种子标签与预选关联图文信息的图文标签间的关联度，有效提高关联图文信息挖掘的准确性以及便捷性。

在一个实施例中，如图4所示，步骤S304，根据预选关联图文信息的图文标签以及目标视频的种子标签，计算预选关联图文信息与目标视频间的关联度的步骤，包括：

步骤S402，获取目标视频的种子标签的第一标签向量，根据第一标签向量获取目标视频的标识向量。

其中，第一标签向量是用于标识种子标签的向量，使得用自然语言表示的标签可用于后续数学运算。具体地，可以利用word2vec的方式将种子标签转换为第一标签向量。在获取到目标视频的种子标签的第一标签向量后，服务器可根据第一标签向量获取目标视频的标识向量。具体可以是计算目标视频的所有种子标签的第一标签向量间的加权平均值，作为目标视频的标识向量。

步骤S404，获取预选关联图文信息的图文标签的第二标签向量，根据第二标签向量获取预选关联图文信息的标识向量。

其中，第二标签向量是用于标识预选关联图文信息的图文标签的向量，使得用自然语言表示的标签可用于后续数学运算。具体地，可以利用word2vec的方式将图文标签转换为第二标签向量。在获取到预选关联图文信息的图文标签的第二标签向量后，服务器可根据第二标签向量获取预选关联图文信息的标识向量。具体可以是计算预选关联图文信息所有种子标签的第二标签向量间的加权平均值，作为预选关联图文信息的标识向量。

步骤S406，根据目标视频的标识向量以及预选关联图文信息的标识向量，计算目标视频与关联图文信息间的距离值，根据距离值获取关联度。

其中，在计算得到目标视频的标识向量以及预选关联图文信息的标识向量，可以根据两者的标识向量，计算目标视频与关联图文信息间的距离值，从而根据距离值确定目标视频与关联图文信息间的关联度。

仍然以视频文本信息为视频标题为例，假设目标视频的视频标题为“黄子韬唱《爱转角》，张杰问‘谁的歌’罗志祥好尴尬”，目标视频的种子标签分别为“黄子韬”、“罗志祥”、“爱转角”以及“张杰”等。在根据种子标签“黄子韬”、“罗志祥”、“爱转角”以及“张杰”，匹配到图文标签含有“黄子韬”、“罗志祥”、“爱转角”或“张杰”任意一个标签的预选关联图文信息后，服务器将种子标签“黄子韬”、“罗志祥”、“爱转角”以及“张杰”分别转换为第一标签向量，并根据这些第一标签向量的加权平均值确定目标视频的embedding向量；同时，对于任意一个预选关联图文信息，将预选关联图文信息的图文标签转换成第二标签向量，并根据这些第二标签向量的加权平均值确定该预选关联图文信息的embedding向量；然后，根据目标视频的embedding向量以及与预选关联图文信息的embedding向量间的距离值，计算目标视频与关联图文信息间的关联度。

本实施例中，通过将标签转换为标签向量，进而将预选关联图文信息以及目标视频转换为向量标识，实现将预选关联图文信息以及目标视频的关联度转化为以数学计算为基础的向量距离值的计算，大大简便了数据处理的复杂度。

在一个实施例中，如图5所示，步骤S206，根据目标视频的种子标签以及与所述目标视频相关的历史图文信息的图文标签，获取目标视频的关联图文信息的步骤，包括：

步骤S502，获取不同用户所点击的历史图文信息以及各用户的画像标签。

具体地，服务器获取多个用户所点击的历史图文信息，并获取用户对应的画像标签。其中，用户是指进行内容消费的对象，例如阅读图文信息、视频的对象等。假设视频标签的扩展方法应用在应用程序中，对上传到该应用程序的视频进行标签扩展，用户是登录该应用程序并进行内容消费行为的对象。其中，当用户进行内容消费，所消费的内容的标签或者内容文本关键词通过用户消费行为映射到用户，给用户打上标签，该标签即为用户的画像标签；例如，用户阅读了图文信息，图文信息的文本关键词通过用户阅读行为映射到用户上，给用户打上画像标签。

步骤S504，根据各用户的画像标签以及目标视频的种子标签，计算各用户点击目标视频的概率值。

其中，在获取到各个用户的画像标签后，通过用户的画像标签以及目标视频的种子标签，预测各个用户点击该目标视频的概率值。具体地，预测各个用户点击该目标视频的概率值，可以是根据用户的画像标签与标视频的种子标签间的距离值计算的，例如可以建立标签向量，通过计算标签向量间的距离值确定，当预选关联图文信息的图文标签与目标视频的种子标签间的距离越大，该用户点击目标视频的概率值越小，当预选关联图文信息的图文标签与目标视频的种子标签间的距离越小，该用户点击目标视频的概率值越大。

进一步地，在一个实施例中，根据各用户的画像标签以及目标视频的种子标签，计算各用户点击目标视频的概率值，具体可以是获取目标视频的种子标签的第一标签向量，根据第一标签向量获取目标视频的标识向量；获取用户的画像标签的第三标签向量，根据第三标签向量获取用户的画像标识向量；计算目标视频的标识向量以及用户的画像标识向量间的距离值，从而根据该距离值确定用户点击目标视频的概率值。

步骤S506，当用户点击所述目标视频的概率值大于概率阈值，将用户所点击的历史图文信息确定为目标视频的关联图文信息。

其中，在用户点击目标视频的概率值后，通过将该概率值与预设的概率阈值进行对比，当该关联度大于预设的关联阈值，则可认为目标视频也是用户感兴趣的内容，与用户所点击的历史图文信息相关联，并将用户所点击的历史图文信息确定为关联图文信息。

本实施例中，以用户为桥梁，获取与目标视频具有关联关系的历史图文信息与目标视频进行关联，实现利用与目标视频具有关联关系的图文信息的图文标签，对目标视频的标签进行扩展。

在一个实施例中，将关联图文信息的图文标签，确定为目标视频的扩展标签的步骤，包括：对关联图文信息的图文标签进行去重操作，得到目标视频的候选标签；对目标视频的候选标签进行相关性排序，并根据排序结果从候选标签中筛选出扩展标签。

其中，在获取到与目标视频具有关联关系的关联图文信息后，将所有关联图文信息的图文标签进行去重操作，以获得目标视频的候选标签，然后对目标视频的候选标签进行相关性排序，并根据排序结果从候选标签中筛选出扩展标签。

具体地，可以依据候选标签在关联图文信息中的出现频次对候选标签进行相关性排序；也可以依据候选标签的权重值对候选标签进行相关性排序。在一个实施例中，对目标视频的候选标签进行相关性排序的步骤，包括：统计各候选标签在关联图文信息中的出现频次；根据各候选标签的出现频次对各候选标签进行相关性排序，得到候选标签的排序结果。

具体地，根据排序结果从候选标签中筛选扩展标签，可以是获取相关性排序靠前的预设数目的候选标签作为扩展标签，例如可以选择出现频次最高的5个候选标签作为扩展标签；也可以选择出现相关性排序在前预设百分比的候选标签作为扩展标签，例如可以选择相关性在前10％候选标签作为扩展标签。

在一个实施例中，视频文本信息包括视频标题信息、图像文本信息和/或视频语音文本信息；获取目标视频的视频文本信息，包括：获取目标视频的视频标题信息；和/或识别目标视频中各帧图像中的文字，得到图像文本信息；和/或获取目标视频的音频数据，对音频信息进行语音识别，得到视频语音文本信息。

其中，视频文本信息是指视频的文本描述信息或视频所包含的文本内容信息，包括但不限于视频标题信息、视频语音文本信息和/或图像文本信息。

其中，视频语音文本信息是指视频对应音频中的文本信息。当视频文本信息为视频语音文本信息时，获取目标视频的视频文本信息具体可以是获取目标视频的影片数据，对音频数据进行语言识别，以获取音频中的文本信息，得到视频语音文本信息。

其中，图像文本信息是指视频画面内的文字信息，例如字幕或者画面中的其他文字。当视频文本信息为图像文本信息时，获取目标视频的视频文本信息具体可以是截取视频中每一帧的帧图像，通过识别目标视频中每一帧的帧图像中的文字，以获取图像文本信息。

基于上述实施例，下面采用具体的应用场景对本发明实施例中视频标签的扩展方法进行进一步说明。参阅图6a所示，提供了一套完成的视频生产、分发、消费的系统框架，包括视频上传过程，上传成功后视频标签扩展过程、人工审核过程以及视频分发等过程，下面先介绍系统框架中各个服务模块的主要功能，具体如下：

1、内容生产端和内容消费端

(1)内容生产端，可以为例如PGC、UGC、MCN等内容生产者，主要是通过移动端或者后端应用程序接口(Application Programming Interface，API)系统，提供图文或者视频等内容，这些都是推荐分发内容的主要内容来源，也是视频标签扩展过程中重要的数据信息基础。具体地，内容生产端可以通过和上下行内容接口服务进行通讯，实现上传图文内容或视频内容等。

进一步地，图文内容的内容生产端可以是轻量级发布端和编辑内容入口，视频内容的内容生产端可以是一个拍摄摄影端，拍摄过程当中可以选择视频内容中搭配的音乐，滤镜模板和视频的美化功能等等。

(2)内容消费端，用于和上下行内容接口服务器通讯，获取所访问内容的索引信息，然后根据所访问内容的索引信息与内容存储服务通讯，实现获取索引信息对应的内容，例如推荐得到内容、专题订阅的内容。内容消费端通常通过Feeds流方式浏览内容数据。

其中，内容生产端以及内容消费端还可以将上传和下载过程中用户播放的行为数据，卡顿，加载时间，播放点击等信息上报至后端，用于统计分析。

2、上下行内容接口服务器

上下行内容接口服务器，主要用于和内容生产端直接通讯，从前端提交的图文内容或视频内容等内容存入至内容存储服务。其中，前端提交的内容通常包括内容的标题、发布者、摘要、封面图、发布时间等。此外，上下行内容接口服务器，还用于将内容的元信息，比如文件大小，封面图链接，标题，发布时间，作者等信息写入内容数据库；将发布的内容同步发送至调度中心服务器，进行后续的内容处理和流转，

3、内容数据库

内容数据库为核心数据库，用于存储所有内容生产端所发布的内容的元信息，以及存储人工抽取标签或抽取标签服务对内容的打的标签。其中，在进行抽取标签的时候也可以从内容数据库读取内容的元信息，进行标签抽取。

其中，内容的元信息包括文件大小、封面图链接、码率、文件格式、标题、发布时间、作者、格式、是否原创的标识、是否为首发的标识等。

其中，内容对应的标签包括对内容对象进行分类的属性信息标签和内容描述对象的实体信息标签。比如一篇讲解华为手机的图文内容，其一级分类是科技，二级分类是智能手机，三级分类是国产手机，内容描述对象是华为手机mate30等，则该内容的标签可以包括但不限于“科技”、“智能手机”、“国产手机”、“华为”、“mate30”等。

4、调度中心服务

调度中心服务主要用于负责内容流转的整个调度过程，通过调度上下行内容接口服务器接收内容生产端所生产的内容，并从内容数据库中获取内容的元信息；调度人工审核系统对内容进行审核；调度内容出口分发服务直接将通过人工审核系统审核的内容提供给内容消费端的内容消费者，也就是内容消费端获得的内容的索引信息。

调度中心服务还可以用于调度标签扩展服务，使用与视频内容相关的关联图文内容的标签，丰富和扩展视频内容的标签，提升视频内容冷启动和运营的效率。

5、人工审核系统

人工审核系统是人工服务能力的载体，主要用于审核过滤政治敏感、色情、法律不允许等机器无法确定判断的内容，同时还可以对进行视频的标签标注和二次确认；

6、内容存储服务

内容存储服务存储的是内容的内容实体，比如视频源数据、图片源数据等。此外，内容存储服务可以为标签服务提供视频源文件包括源文件中间的抽帧内容。

7、抽取标签服务

抽取标签服务，主要是通过NLP相关的技术从图文信息的文本信息中抽取图文标签，以及从视频的视频文本信息中抽取种子标签。

8、关联召回服务

关联召回服务主要用于根据视频内容的种子标签以及各图文信息的图文标签，从图文信息筛选出与视频内容相关的关联图文内容，将视频内容和关联图文信息的图文标签进行关联，得到视频内容的候选标签。

9、标签排序服务

标签排序服务，主要用于对视频的候选标签进行排名，并根据排名结果确定视频的扩展标签，最后将扩展标签写入标签扩展数据库。

10、标签扩展数据库

标签扩展数据库，主要用于保存视频的扩展标签，为标签扩展服务提供数据源。

11、标签扩展服务

标签扩展服务，主要用于在接收到调度中心的调度指令后，对于视频内容，通过标签扩展服务得到更多更丰富的标签；此外，还用于根据标签扩展的效果和不同类型置信度的不同，可以调用人工审核系统对标签的准确性和丰富信息进行人工的确认。

12、内容分发出口服务

内容分发出口服务和内容消费端直接通讯，主要用于将内容分发到内容消费端；还用于基于用户的特征信息以及内容的标签，通过推荐算法主动推送内容至内容消费端。其中，推荐算法可以是协同推荐、矩阵分解、监督学习算法模型等推荐模型。例如，在对视频内容进行标签扩展后，根据视频内容的扩展标签以及种子标签，通过推荐算法主动将视频内容推送至内容消费端。

基于上述实施例中提供了一种视频标签扩展系统，以内容为视频内容为例，内容生产端拍摄视频，并将通过上下行内容接口服务将所拍摄的视频作为视频内容进行上传发布。上下行内容接口服务上传发布视频内容过程中，将视频内容的元信息存储在内容数据库并上报至调度中心服务，将视频内容本身的视频数据上传至内容存储服务中。调度中心服务获取到视频内容的元信息后，调度人工审核系统对视频内容进行审核，审核通过后，才得以调用内容分发出口服务将视频内容分发至不同的内容消费端。同时，抽取标签服务根据视频内容的视频文本数据进行标签抽取，抽取到的视频内容的种子标签，一方面存储值内容数据库中，另一方面被关联召回服务调用。关联召回服务调用视频内容的种子标签，召回与视频内容关联的关联图文内容，并将关联图文内容的图文标签扩展为视频内容的标签，并将关联图文内容的图文标签发送到标签排序服务中。标签排序服务在获取到关联图文内容的图文标签后，对图文标签进行去重得到视频内容的候选标签，并对视频内容的候选标签进行相关性排序，从中筛选目标视频的扩展标签，并将扩展标签存储到标签扩展数据库中。调度中心在调用内容分发出口服务分发视频内容时，可通过调度标签扩展服务对视频内容的标签进行扩展，实现使用与视频内容相关的关联图文内容的标签作为视频内容的扩展标签，丰富和扩展视频内容的标签，提升视频内容冷启动和运营的效率。

例如，以目标视频的视频标题为“《远大前程》梦竹经历磨难，重新开始新生活，加入革命为父报仇”为例，从视频标题中可以抽取到“远大前程”、“梦竹”以及“革命”这三个种子标签。关联召回服务调用这三个种子标签，根据这三个种子标签以及历史图文信息的图文标签，获取目标视频的关联图文信息，如图6b所示，得到的关联图文内容包括文章“《远大前程》集结了半个娱乐圈的老戏骨，直达演技巅峰”、文章“《远大前程》，大家都在问，这部戏好看在什么地方”等，其中每个关联图文信息都有对应的图文标签，例如，文章“《远大前程》集结了半个娱乐圈的老戏骨，直达演技巅峰”的标签为：老戏骨、远大前程、演技、林依依、刘奕欢、陈思诚、佟丽娅。标签排序服务在获取到关联图文内容的图文标签后，对图文标签进行去重得到候选标签，并对候选标签进行相关性排序，从中筛选目标视频的扩展标签，并将扩展标签存储到标签扩展数据库中。

其中，由于关联图文信息的内容丰富，自然语言抽取标签分类信息成熟，关联图文信息对应的图文标签包括对目标视频涉及到的剧名、角色、演员、类型、地区等标签，将关联图文信息的图文标签扩展为目标视频的扩展标签，可有效完善目标视频的标题体系，提升了目标视频的冷启动效果和提升目标视频的推荐精准度，有效改善用户体验，同时对运营筛选和追踪内容构成及分发情况也很有帮助，提升运营的效率。

应该理解的是，虽然上述流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，上述流程图中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图7所示，提供了一种视频标签的扩展装置，该装置可以采用软件模块或硬件模块，或者是二者的结合成为计算机设备的一部分，该装置具体包括：视频文本获取模块702、种子标签获取模块704、关联图文获取模块706和标签扩展模块708，其中：

视频文本获取模块702，用于获取目标视频的视频文本信息；

种子标签获取模块704，用于根据视频文本信息，获取目标视频的种子标签；

关联图文获取模块706，用于根据目标视频的种子标签以及与所述目标视频相关的历史图文信息的图文标签，从历史图文信息中筛选出目标视频的关联图文信息；

标签扩展模块708，用于将关联图文信息的图文标签，确定为目标视频的扩展标签。

在一个实施例中，如图8所示，关联图文获取模块706，包括：

标签匹配单元802，用于当历史图文信息的图文标签与种子标签相匹配，将历史图文信息确定为与目标视频相关的预选关联图文信息；

关联度计算单元804，用于根据预选关联图文信息的图文标签以及目标视频的种子标签，计算预选关联图文信息与目标视频间的关联度；

第一关联图文确定单元806，用于当预选关联图文信息与目标视频间的关联度大于关联阈值，将预选关联图文信息确定为关联图文信息。

在一个实施例中，关联度计算单元，具体用于：获取目标视频的种子标签的第一标签向量，根据第一标签向量获取目标视频的标识向量；获取预选关联图文信息的图文标签的第二标签向量，根据第二标签向量获取预选关联图文信息的标识向量；根据目标视频的标识向量以及预选关联图文信息的标识向量，计算目标视频与关联图文信息间的距离值，根据距离值获取关联度。

在一个实施例中，如图9所示，关联图文获取模块706，包括：

用户信息获取单元902，用于获取不同用户所点击的历史图文信息以及各用户的画像标签；

标签关联计算单元904，用于根据各用户的画像标签以及目标视频的种子标签，计算各用户点击目标视频的概率值；

第二关联图文确定单元906，用于当用户点击所述目标视频的概率值大于概率阈值，将用户所点击的历史图文信息确定为目标视频的关联图文信息。

在一个实施例中，标签扩展模块，包括：

标签去重模块，用于对关联图文信息的图文标签进行去重操作，得到目标视频的候选标签；

标签排序模块，用于对目标视频的候选标签进行相关性排序，并根据排序结果从候选标签中筛选出扩展标签。

在一个实施例中，标签排序模块，用于：统计各候选标签在关联图文信息中的出现频次；根据各候选标签的出现频次对各候选标签进行相关性排序，得到候选标签的排序结果。

在一个实施例中，视频文本信息包括视频标题信息、图像文本信息和/或视频语音文本信息；视频文本获取模块，用于：获取目标视频的视频标题信息；和/或识别目标视频中各帧图像中的文字，得到图像文本信息；和/或获取目标视频的音频数据，对音频信息进行语音识别，得到视频语音文本信息。

关于视频标签的扩展装置的具体限定可以参见上文中对于视频标签的扩展方法的限定，在此不再赘述。上述视频标签的扩展装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储历史图文信息、图文标签等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种视频标签的扩展方法。

本领域技术人员可以理解，图10中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，还提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现上述各方法实施例中的步骤。

在一个实施例中，提供了一种计算机可读存储介质，存储有计算机程序，该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory，ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic Random Access Memory，DRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种视频标签的扩展方法，所述方法包括：

获取目标视频的视频文本信息；

根据所述视频文本信息，获取所述目标视频的种子标签；

2.根据权利要求1所述的方法，其特征在于，所述根据所述目标视频的种子标签以及与所述目标视频相关的历史图文信息的图文标签，从所述历史图文信息中筛选出所述目标视频的关联图文信息的步骤，包括：

当历史图文信息的图文标签与所述种子标签相匹配，将所述历史图文信息确定为与所述目标视频相关的预选关联图文信息；

根据所述预选关联图文信息的图文标签以及所述目标视频的种子标签，计算所述预选关联图文信息与所述目标视频间的关联度；

当所述预选关联图文信息与所述目标视频间的关联度大于关联阈值，将所述预选关联图文信息确定为关联图文信息。

3.根据权利要求2所述的方法，其特征在于，所述根据所述预选关联图文信息的图文标签以及所述目标视频的种子标签，计算所述预选关联图文信息与所述目标视频间的关联度的步骤，包括：

获取所述目标视频的种子标签的第一标签向量，根据所述第一标签向量获取所述目标视频的标识向量；

获取所述预选关联图文信息的图文标签的第二标签向量，根据所述第二标签向量获取所述预选关联图文信息的标识向量；

根据所述目标视频的标识向量以及所述预选关联图文信息的标识向量，计算所述目标视频与所述关联图文信息间的距离值，根据所述距离值获取关联度。

4.根据权利要求1所述的方法，其特征在于，所述根据所述目标视频的种子标签以及与所述目标视频相关的历史图文信息的图文标签，从所述历史图文信息中筛选出所述目标视频的关联图文信息的步骤，包括：

获取不同用户所点击的历史图文信息以及各所述用户的画像标签；

根据各所述用户的画像标签以及所述目标视频的种子标签，计算各所述用户点击所述目标视频的概率值；

当所述用户点击所述目标视频的概率值大于概率阈值，将所述用户所点击的历史图文信息确定为所述目标视频的关联图文信息。

5.根据权利要求1至4任意一项权利要求的所述的方法，其特征在于，所述将所述关联图文信息的图文标签，确定为所述目标视频的扩展标签的步骤，包括：

对所述关联图文信息的图文标签进行去重操作，得到所述目标视频的候选标签；

对所述目标视频的候选标签进行相关性排序，并根据所述排序结果从所述候选标签中筛选出扩展标签。

6.根据权利要求5所述的方法，其特征在于，所述对所述目标视频的候选标签进行相关性排序的步骤，包括：

统计各所述候选标签在所述关联图文信息中的出现频次；

根据各所述候选标签的出现频次对各所述候选标签进行相关性排序，得到所述候选标签的排序结果。

7.根据权利要求1所述的方法，其特征在于，所述视频文本信息包括视频标题信息、图像文本信息和/或视频语音文本信息；所述获取目标视频的视频文本信息，包括：

获取所述目标视频的视频标题信息；和/或

识别所述目标视频中各帧图像中的文字，得到图像文本信息；和/或

获取所述目标视频的音频数据，对所述音频信息进行语音识别，得到视频语音文本信息。

8.一种视频标签的扩展装置，其特征在于，所述装置包括：

视频文本获取模块，用于获取目标视频的视频文本信息；

9.根据权利要求8所述的装置，其特征在于，所述关联图文获取模块，包括：

标签匹配单元，用于当历史图文信息的图文标签与所述种子标签相匹配，将所述历史图文信息确定为与所述目标视频相关的预选关联图文信息；

关联度计算单元，用于根据所述预选关联图文信息的图文标签以及所述目标视频的种子标签，计算所述预选关联图文信息与所述目标视频间的关联度；

第一关联图文确定单元，用于当所述预选关联图文信息与所述目标视频间的关联度大于关联阈值，将所述预选关联图文信息确定为关联图文信息。

10.根据权利要求9所述的装置，其特征在于，所述关联度计算单元，具体用于：

11.根据权利要求8所述的装置，其特征在于，所述关联图文获取模块，还用于：

用户信息获取单元，用于获取不同用户所点击的历史图文信息以及各所述用户的画像标签；

标签关联计算单元，用于根据各所述用户的画像标签以及所述目标视频的种子标签，计算各所述用户点击所述目标视频的概率值；

第二关联图文确定单元，用于当所述用户点击所述目标视频的概率值大于概率阈值，将所述用户所点击的历史图文信息确定为所述目标视频的关联图文信息。

12.根据权利要求8至11任意一项权利要求的所述的方法，其特征在于，标签扩展模块，包括：

标签去重模块，用于对所述关联图文信息的图文标签进行去重操作，得到所述目标视频的候选标签；

标签排序模块，用于对所述目标视频的候选标签进行相关性排序，并根据所述排序结果从所述候选标签中筛选出扩展标签。

13.根据权利要求12所述的方法，其特征在于，所述标签排序模块，用于：

统计各所述候选标签在所述关联图文信息中的出现频次；

14.根据权利要求8所述的方法，其特征在于，所述视频文本信息包括视频标题信息、图像文本信息和/或视频语音文本信息；所述视频文本获取模块，用于：

获取所述目标视频的视频标题信息；和/或

15.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

16.一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。