CN110019955A

CN110019955A - 一种视频标签标注方法及装置

Info

Publication number: CN110019955A
Application number: CN201711346862.XA
Authority: CN
Inventors: 黄山山; 徐钊; 隋雪芹
Original assignee: Qingdao Poly Cloud Technology Co Ltd
Current assignee: Qingdao Poly Cloud Technology Co Ltd
Priority date: 2017-12-15
Filing date: 2017-12-15
Publication date: 2019-07-16

Abstract

本发明提供一种视频标签标注方法及装置，该方法包括：根据从视频网站的视频信息中提取的视频特征，确定所述视频特征与待标注视频的视频特征相似的目标视频信息；基于所述目标视频信息和所述待标注视频的原标签生成用于拓展所述原标签的标签候选集；从所述标签候选集中选择目标标签且以所述目标标签更新所述原标签。本发明可提升视频标签的标注粒度。

Description

一种视频标签标注方法及装置

技术领域

本发明涉及数据处理技术领域，尤其涉及一种视频标签标注方法及装置。

背景技术

视频标签是视频内容的一种高度概括，是视频管理的重要依据。在视频推荐系统中，视频标签可用于计算视频相似度，进而基于用户喜好向用户推荐相似视频。目前，视频标签的标注方式主要为人工标注，标注成本高、效率低，且标注粒度较粗。

发明内容

本发明为了解决现有技术中存在的标注成本较高、效率较低且标注粒度较粗的问题，提供一种视频标签标注方法及装置，用以节约标注成本，提高标注效率，并获得较细的标注粒度。

为实现上述发明目的，本发明提供了如下技术方案：

一方面，本发明提供一种视频标签标注方法，所述方法包括：

根据从视频网站的视频信息中提取的视频特征，确定所述视频特征与待标注视频的视频特征相似的目标视频信息；

基于所述目标视频信息和所述待标注视频的原标签生成用于拓展所述原标签的标签候选集；

从所述标签候选集中选择目标标签且以所述目标标签更新所述原标签。

另一方面，本发明提供一种视频标签标注装置，所述装置包括：

确定单元，用于根据从视频网站的视频信息中提取的视频特征，确定所述视频特征与待标注视频的视频特征相似的目标视频信息；

生成单元，用于基于所述目标视频信息和所述待标注视频的原标签生成用于拓展所述原标签的标签候选集；

选择单元，用于从所述标签候选集中选择目标标签且以所述目标标签更新所述原标签。

由以上描述可以看出，本发明提供了一种自动标注视频标签的方法及装置，成本低、效率高，且由于本发明是基于视频网站上信息量较大的目标视频信息生成标签候选集，因此，标签候选集中的标签数量较多，基于该包含较多标签的标签候选集为待标注视频选择视频标签，可获得较细的标注粒度。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例示出的一种视频标签标注方法流程图；

图2是本发明实施例示出的视频网站上的视频信息示例；

图3为本发明实施例示出的在同一视频网站上搜索到多个匹配视频的示例；

图4为本发明实施例示出的一种目标标签选择方法流程图；

图5为本发明实施例示出的另一种目标标签选择方法流程图；

图6是本发明实施例示出的一种视频标签标注终端的结构示意图；

图7是本发明实施例示出的一种视频标签标注装置的结构示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

在本发明使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本发明。在本发明和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本发明可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本发明范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

参见图1，为本发明提供的一种视频标签标注方法的实施例流程图，该实施例对视频标签标注过程进行描述。

步骤101，根据从视频网站的视频信息中提取的视频特征，确定所述视频特征与待标注视频的视频特征相似的目标视频信息。

具体为，从视频网站(例如，豆瓣网、时光网、1905电影网等)上获取与本地媒资库中待标注视频匹配的视频的视频信息，在一种可选的实施方式中，可利用爬虫程序从视频网站上爬取与待标注视频匹配的视频的视频信息，例如，导演、主演、国家、语言、视频标签、视频简介、视频评论等信息，参见图2，为本发明实施例示出的视频网站的视频信息示例。

由于从同一视频网站上可能获取到与待标注视频匹配的多个视频的视频信息，参见图3，为本发明实施例示出的从同一视频网站上搜索到的与待标注视频匹配的多个视频的示例，因此，需要从获取的多个视频的视频信息中确定待标注视频的目标视频信息。具体为，从视频网站的视频信息中提取视频特征，例如，视频名称、导演、演员、国家、语言、上映日期等特征，计算从视频网站的视频信息中提取的视频特征与待标注视频中对应视频特征之间的相似度，例如，视频名称的相似度、导演的相似度、演员的相似度等，再根据计算得到的多个维度的视频特征的相似度及对应视频特征的预设权重值，确定视频网站中视频信息的视频特征与待标注视频的视频特征的综合相似度，例如，预设视频名称的权重值大于导演的权重值，导演的权重值大于演员的权重值，以此类推，具体可根据实际需求预设每一个视频特征的权重值，在一种可选的实施方式中，可将视频特征的相似度与对应权重值的乘积的累加和作为视频网站中视频信息与待标注视频对应的综合相似度。若该综合相似度大于预设相似度，则确定该视频网站中的当前视频信息为目标视频信息。

步骤102，基于所述目标视频信息和所述待标注视频的原标签生成用于拓展所述原标签的标签候选集。

首先，从待标注视频的音频信息，以及目标视频信息的视频简介、视频评论中提取关键词。具体为，将待标注视频的音频信息转换为文本信息，基于视频领域的常用词典和停用词对转换后的文本信息，以及视频简介、视频评论进行分词，基于对分词后得到的词语之间的位置关系和词频确定词语的权重，按照词语的权重从高到低的顺序提取与预设个数相等的词语作为关键词。可见，本发明通过从待标注视频的音频信息、目标视频信息的视频简介、视频评论中提取关键词，可以获得更加准确、且满足一定数量要求的关键词。

然后，基于待标注视频的原标签(媒资库中该待标注视频已有的视频标签)、目标视频信息的已有标签以及上述提取的关键词生成待标注视频的标签候选集。参见表1，为电影《生命之树》的标签候选集示例。

表1

从表1中可以看出，由于综合了各大视频网站上目标视频信息的已有标签，以及从待标注视频的音频信息、视频简介、视频评论中提取的关键词，该标签候选集中包含了大量的标签。

步骤103，从所述标签候选集中选择目标标签且以所述目标标签更新所述原标签。

由于标签候选集中包含大量标签，因此，从标签候选集中选择目标标签更新待标注视频的原标签，可提升视频标签的标注粒度。

但是，若从标签候选集中任意选取目标标签，无法保证标签的准确度，为此，本发明预设标签体系，该标签体系涵盖视频领域中的所有通用标签。参见表2，为本发明示出的电影类型相关的标签体系。

表2

基于预设的标签体系，对标签候选集中的标签与标签体系中的标签进行匹配，根据匹配结果选择目标标签。

参见图4，为本发明实施例示出的一种目标标签选择方法流程图。

步骤401，判断标签候选集中的标签是否成功匹配标签体系中的标签，若是，转步骤402；若否，转步骤403；

步骤402，将标签候选集中的标签作为目标标签；

步骤403，从目标视频信息中查找与标签候选集中的标签语义相似的标签；

步骤404，判断语义相似的标签是否成功匹配标签体系中的标签，若是，转步骤405；若否，转步骤406；

步骤405，将语义相似的标签作为目标标签；

步骤406，丢弃标签候选集中的标签及其对应的语义相似的标签，即禁止将标签候选集中的标签及其对应的语义相似的标签作为目标标签。

参见图5，为本发明实施例示出的另一种目标标签选择方法流程图。

步骤501，从目标视频信息中查找与标签候选集中的标签语义相似的标签；

步骤502，判断标签候选集中的标签是否成功匹配标签体系中的标签，若是，转步骤503；若否，转步骤504；

步骤503，将标签候选集中的标签作为目标标签；

步骤504，判断语义相似的标签是否成功匹配标签体系中的标签，若是，转步骤505；若否，转步骤506；

步骤505，将语义相似的标签作为目标标签；

步骤506，丢弃标签候选集中的标签及其对应的语义相似的标签，即禁止将标签候选集中的标签及其对应的语义相似的标签作为目标标签。

利用上述与标签体系中的标签匹配后确定的目标标签更新待标注视频的原标签，可提升视频标签标注的准确度和规范性。

从上述描述可以看出，由于本发明是基于各视频网站上信息量较大的目标视频信息生成的标签候选集，因此，标签候选集中的标签数量较多，基于该包含较多标签的标签候选集为待标注视频选择视频标签，可获得较细的标注粒度；此外，通过与预设的标签体系进行比对，可保证视频标签标注的规范性和准确性。

现仍以电影《生命之树》为例，介绍标注《生命之树》的视频标签的过程。

首先，利用爬虫程序从豆瓣网、时光网、1905电影网分别爬取与本地媒资库中电影《生命之树》相关的视频的视频信息。以豆瓣网为例，参见图3，为从豆瓣网搜索到的与《生命之树》相关的多个视频，其中，图2所示为图3中第一条视频《生命之树The Tree of Life(2011)》的视频信息，包括：导演、主演、国家、语言、视频标签、视频简介、视频评论等信息，其中，视频简介(剧情简介)、视频评论(图2中未示出)以文本形式保存。同理，可获取时光网、1905电影网上与本地媒资库中《生命之树》相关的视频的视频信息。

以豆瓣网上的视频《生命之树The Tree of Life(2011)》为例，从该视频的视频信息中提取视频特征，包括视频名称、导演、演员、国家、语言、上映日期等，从媒资库的《生命之树》中同样提取上述视频特征，计算《生命之树The Tree of Life(2011)》与《生命之树》之间相应视频特征的相似度，例如，视频名称的相似度、导演的相似度、演员的相似度等，再基于预设的每一个视频特征的相似度权重值，计算《生命之树The Tree of Life(2011)》与《生命之树》之间视频特征相似度与对应权重值的乘积的累加和，得到《生命之树The Treeof Life(2011)》对应于《生命之树》的综合相似度。同理，可得到豆瓣网上搜索到的其它相关视频对应于《生命之树》的综合相似度。若《生命之树The Tree of Life(2011)》对应于《生命之树》的综合相似度大于预设相似度，则确定《生命之树The Tree of Life(2011)》的视频信息为豆瓣网上与《生命之树》相似的目标视频信息。同理，可确定时光网、1905电影网上与《生命之树》相似的目标视频信息。

将本地媒资库中《生命之树》的音频(例如，台词)转换为文本信息，基于视频领域的常用词典和停用词，对转换后的文本信息以及从豆瓣网、时光网、1905电影网获取到的视频简介、视频评论进行文本分词，基于分词后得到的词语之间的位置关系和词频确定词语的权重，按照词语的权重从高到低的顺序提取与预设个数相等的词语作为关键词。

基于本地媒资库中《生命之树》的原标签、各大视频网站上目标视频信息的已有标签、以及上述提取的关键词，生成表1所示的电影《生命之树》的标签候选集。

对表1所示标签候选集中的标签去重后，得到表3所示标签候选集。

表3

将表3中每一个标签与表2所示标签体系中的标签进行比对：

其中，“奇幻”、“剧情”、“科幻”、“家庭”、“文艺”、“20世纪”、“人性”、“独立”、“苦难”、“超现实”、“生命”、“父亲”、“宇宙”、“宗教”、“母亲”、“信仰”、“人生”可以成功匹配标签体系中的标签(即在标签体系中)，因此，将上述标签作为目标标签。

表3中的标签“荒诞”不在标签体系中，可利用word2vec工具从各大视频网站的目标视频信息中查找与“荒诞”语义相似的标签，例如，“离奇”，“离奇”在表2所示标签体系中，因此，将“离奇”作为目标标签；同理，表3中的标签“温情”不在标签体系中，利用word2vec工具从各大视频网站的目标视频信息中查找与“温情”语义相似的标签为“感动”，“感动”在表2所示标签体系中，因此，将“感动”作为目标标签。

表3中的其它标签及对应的语义相似的标签均不在标签体系中，因此，丢弃其它标签及对应的语义相似的标签。

利用上述目标标签更新本地媒资库中《生命之树》的原标签，得到《生命之树》的最终标签为：“奇幻”、“剧情”、“科幻”、“家庭”、“文艺”、“20世纪”、“人性”、“独立”、“苦难”、“超现实”、“生命”、“父亲”、“宇宙”、“宗教”、“母亲”、“信仰”、“人生”、“离奇”、“感动”。

与前述视频标签标注方法的实施例相对应，本发明还提供了视频标签标注装置的实施例。

本发明视频标签标注装置的实施例可以应用在视频标签标注终端上。装置实施例可以通过软件实现，也可以通过硬件或者软硬件结合的方式实现。以软件实现为例，作为一个逻辑意义上的装置，是通过其所在终端的处理器运行存储器中对应的计算机程序指令形成的。从硬件层面而言，如图6所示，为本发明视频标签标注终端的一种硬件结构图，除了图6所示的处理器以及非易失性存储器之外，实施例中视频标签标注终端通常根据该终端的实际功能，还可以包括其他硬件，对此不再赘述。

请参考图7，为本发明一个实施例中的视频标签标注装置的结构示意图。该视频标签标注装置包括确定单元701、生成单元702以及选择单元703，其中：

确定单元701，用于根据从视频网站的视频信息中提取的视频特征，确定所述视频特征与待标注视频的视频特征相似的目标视频信息；

生成单元702，用于基于所述目标视频信息和所述待标注视频的原标签生成用于拓展所述原标签的标签候选集；

选择单元703，用于从所述标签候选集中选择目标标签且以所述目标标签更新所述原标签。

进一步地，

所述确定单元701，具体用于计算从所述视频网站的视频信息中提取的视频特征与所述待标注视频的视频特征之间的相似度；根据计算得到的所述相似度以及视频特征的预设权重值，确定与所述待标注视频对应的综合相似度；根据所述综合相似度和预设相似度之间的大小关系，确定所述综合相似度大于所述预设相似度的视频特征，并确定与其对应的所述视频网站上的视频信息为目标视频信息。

进一步地，

所述生成单元702，具体用于从所述待标注视频的音频信息，以及所述目标视频信息的视频简介、视频评论中提取关键词；基于所述原标签、所述目标视频信息的已有标签以及所述关键词生成用所述标签候选集。

进一步地，所述生成单元702从所述待标注视频的音频信息，以及所述目标视频信息的视频简介、视频评论中提取关键词，包括：

将所述待标注视频的音频信息转换为文本信息；对转换后的文本信息，以及所述视频简介、视频评论进行分词；基于对分词后得到的词语之间的位置关系和词频确定所述词语的权重；按照所述词语的权重从高到低的顺序提取与预设个数相等的词语作为所述关键词。

进一步地，

所述选择单元703，具体用于对所述标签候选集中的标签与预设的标签体系中的标签进行匹配，根据匹配结果选择目标标签。

进一步地，

所述选择单元703，具体用于若所述标签候选集中的标签成功匹配所述标签体系中的标签，则将所述标签候选集中的标签作为所述目标标签；若所述标签候选集中的标签未成功匹配所述标签体系中的标签，则从所述目标视频信息中查找与所述标签候选集中的标签语义相似的标签；若所述语义相似的标签成功匹配所述标签体系中的标签，则将所述语义相似的标签作为所述目标标签；若所述语义相似的标签未成功匹配所述标签体系中的标签，则禁止将所述标签候选集中的标签及其对应的所述语义相似的标签作为所述目标标签。

进一步地，

所述选择单元703，具体用于从所述目标视频信息中查找与所述标签候选集中的标签语义相似的标签；若所述标签候选集中的标签成功匹配所述标签体系中的标签，则将所述标签候选集中的标签作为所述目标标签；若所述标签候选集中的标签未成功匹配所述标签体系中的标签，且查找到的与所述标签候选集中的标签语义相似的标签成功匹配所述标签体系中的标签，则将所述语义相似的标签作为所述目标标签；若所述标签候选集中的标签未成功匹配所述标签体系中的标签，且所述语义相似的标签未成功匹配所述标签体系中的标签，则禁止将所述标签候选集中的标签及对应的语义相似的标签作为所述目标标签。

上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程，在此不再赘述。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。

Claims

1.一种视频标签标注方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，所述根据从视频网站的视频信息中提取的视频特征，确定所述视频特征与待标注视频的视频特征相似的目标视频信息，包括：

计算从所述视频网站的视频信息中提取的视频特征与所述待标注视频的视频特征之间的相似度；

根据计算得到的所述相似度以及视频特征的预设权重值，确定与所述待标注视频对应的综合相似度；

根据所述综合相似度和预设相似度之间的大小关系，确定所述综合相似度大于所述预设相似度的视频特征，并确定与其对应的所述视频网站上的视频信息为目标视频信息。

3.如权利要求1或2所述的方法，其特征在于，所述基于所述目标视频信息和所述待标注视频的原标签生成用于拓展所述原标签的标签候选集，包括：

从所述待标注视频的音频信息，以及所述目标视频信息的视频简介、视频评论中提取关键词；

基于所述原标签、所述目标视频信息的已有标签以及所述关键词生成用所述标签候选集。

4.如权利要求3所述的方法，其特征在于，所述从所述待标注视频的音频信息，以及所述目标视频信息的视频简介、视频评论中提取关键词，包括：

将所述待标注视频的音频信息转换为文本信息；

对转换后的文本信息，以及所述视频简介、视频评论进行分词；

基于对分词后得到的词语之间的位置关系和词频确定所述词语的权重；

按照所述词语的权重从高到低的顺序提取与预设个数相等的词语作为所述关键词。

5.如权利要求1或2所述的方法，其特征在于，所述从所述标签候选集中选择目标标签，包括：

对所述标签候选集中的标签与预设的标签体系中的标签进行匹配，根据匹配结果选择目标标签。

6.如权利要求5所述的方法，其特征在于，所述对所述标签候选集中的标签与预设的标签体系中的标签进行匹配，根据匹配结果选择目标标签，包括：

若所述标签候选集中的标签成功匹配所述标签体系中的标签，则将所述标签候选集中的标签作为所述目标标签；

若所述标签候选集中的标签未成功匹配所述标签体系中的标签，则从所述目标视频信息中查找与所述标签候选集中的标签语义相似的标签；若所述语义相似的标签成功匹配所述标签体系中的标签，则将所述语义相似的标签作为所述目标标签；

若所述语义相似的标签未成功匹配所述标签体系中的标签，则禁止将所述标签候选集中的标签及其对应的所述语义相似的标签作为所述目标标签。

7.如权利要求5所述的方法，其特征在于，所述对所述标签候选集中的标签与预设的标签体系中的标签进行匹配，根据匹配结果选择目标标签，包括：

从所述目标视频信息中查找与所述标签候选集中的标签语义相似的标签；

若所述标签候选集中的标签未成功匹配所述标签体系中的标签，且查找到的与所述标签候选集中的标签语义相似的标签成功匹配所述标签体系中的标签，则将所述语义相似的标签作为所述目标标签；

若所述标签候选集中的标签未成功匹配所述标签体系中的标签，且所述语义相似的标签未成功匹配所述标签体系中的标签，则禁止将所述标签候选集中的标签及对应的语义相似的标签作为所述目标标签。

8.一种视频标签标注装置，其特征在于，所述装置包括：

9.如权利要求8所述的装置，其特征在于：

所述选择单元，具体用于对所述标签候选集中的标签与预设的标签体系中的标签进行匹配，根据匹配结果选择目标标签。

10.如权利要求9所述的装置，其特征在于：

所述选择单元，具体用于若所述标签候选集中的标签成功匹配所述标签体系中的标签，则将所述标签候选集中的标签作为所述目标标签；若所述标签候选集中的标签未成功匹配所述标签体系中的标签，则从所述目标视频信息中查找与所述标签候选集中的标签语义相似的标签；若所述语义相似的标签成功匹配所述标签体系中的标签，则将所述语义相似的标签作为所述目标标签；若所述语义相似的标签未成功匹配所述标签体系中的标签，则禁止将所述标签候选集中的标签及其对应的所述语义相似的标签作为所述目标标签。