CN110019955A - 一种视频标签标注方法及装置 - Google Patents

一种视频标签标注方法及装置 Download PDF

Info

Publication number
CN110019955A
CN110019955A CN201711346862.XA CN201711346862A CN110019955A CN 110019955 A CN110019955 A CN 110019955A CN 201711346862 A CN201711346862 A CN 201711346862A CN 110019955 A CN110019955 A CN 110019955A
Authority
CN
China
Prior art keywords
label
video
candidate set
target
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711346862.XA
Other languages
English (en)
Inventor
黄山山
徐钊
隋雪芹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Poly Cloud Technology Co Ltd
Original Assignee
Qingdao Poly Cloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Poly Cloud Technology Co Ltd filed Critical Qingdao Poly Cloud Technology Co Ltd
Priority to CN201711346862.XA priority Critical patent/CN110019955A/zh
Publication of CN110019955A publication Critical patent/CN110019955A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Abstract

本发明提供一种视频标签标注方法及装置,该方法包括:根据从视频网站的视频信息中提取的视频特征,确定所述视频特征与待标注视频的视频特征相似的目标视频信息;基于所述目标视频信息和所述待标注视频的原标签生成用于拓展所述原标签的标签候选集;从所述标签候选集中选择目标标签且以所述目标标签更新所述原标签。本发明可提升视频标签的标注粒度。

Description

一种视频标签标注方法及装置
技术领域
本发明涉及数据处理技术领域,尤其涉及一种视频标签标注方法及装置。
背景技术
视频标签是视频内容的一种高度概括,是视频管理的重要依据。在视频推荐系统中,视频标签可用于计算视频相似度,进而基于用户喜好向用户推荐相似视频。目前,视频标签的标注方式主要为人工标注,标注成本高、效率低,且标注粒度较粗。
发明内容
本发明为了解决现有技术中存在的标注成本较高、效率较低且标注粒度较粗的问题,提供一种视频标签标注方法及装置,用以节约标注成本,提高标注效率,并获得较细的标注粒度。
为实现上述发明目的,本发明提供了如下技术方案:
一方面,本发明提供一种视频标签标注方法,所述方法包括:
根据从视频网站的视频信息中提取的视频特征,确定所述视频特征与待标注视频的视频特征相似的目标视频信息;
基于所述目标视频信息和所述待标注视频的原标签生成用于拓展所述原标签的标签候选集;
从所述标签候选集中选择目标标签且以所述目标标签更新所述原标签。
另一方面,本发明提供一种视频标签标注装置,所述装置包括:
确定单元,用于根据从视频网站的视频信息中提取的视频特征,确定所述视频特征与待标注视频的视频特征相似的目标视频信息;
生成单元,用于基于所述目标视频信息和所述待标注视频的原标签生成用于拓展所述原标签的标签候选集;
选择单元,用于从所述标签候选集中选择目标标签且以所述目标标签更新所述原标签。
由以上描述可以看出,本发明提供了一种自动标注视频标签的方法及装置,成本低、效率高,且由于本发明是基于视频网站上信息量较大的目标视频信息生成标签候选集,因此,标签候选集中的标签数量较多,基于该包含较多标签的标签候选集为待标注视频选择视频标签,可获得较细的标注粒度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例示出的一种视频标签标注方法流程图;
图2是本发明实施例示出的视频网站上的视频信息示例;
图3为本发明实施例示出的在同一视频网站上搜索到多个匹配视频的示例;
图4为本发明实施例示出的一种目标标签选择方法流程图;
图5为本发明实施例示出的另一种目标标签选择方法流程图;
图6是本发明实施例示出的一种视频标签标注终端的结构示意图;
图7是本发明实施例示出的一种视频标签标注装置的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
在本发明使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本发明可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本发明范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
参见图1,为本发明提供的一种视频标签标注方法的实施例流程图,该实施例对视频标签标注过程进行描述。
步骤101,根据从视频网站的视频信息中提取的视频特征,确定所述视频特征与待标注视频的视频特征相似的目标视频信息。
具体为,从视频网站(例如,豆瓣网、时光网、1905电影网等)上获取与本地媒资库中待标注视频匹配的视频的视频信息,在一种可选的实施方式中,可利用爬虫程序从视频网站上爬取与待标注视频匹配的视频的视频信息,例如,导演、主演、国家、语言、视频标签、视频简介、视频评论等信息,参见图2,为本发明实施例示出的视频网站的视频信息示例。
由于从同一视频网站上可能获取到与待标注视频匹配的多个视频的视频信息,参见图3,为本发明实施例示出的从同一视频网站上搜索到的与待标注视频匹配的多个视频的示例,因此,需要从获取的多个视频的视频信息中确定待标注视频的目标视频信息。具体为,从视频网站的视频信息中提取视频特征,例如,视频名称、导演、演员、国家、语言、上映日期等特征,计算从视频网站的视频信息中提取的视频特征与待标注视频中对应视频特征之间的相似度,例如,视频名称的相似度、导演的相似度、演员的相似度等,再根据计算得到的多个维度的视频特征的相似度及对应视频特征的预设权重值,确定视频网站中视频信息的视频特征与待标注视频的视频特征的综合相似度,例如,预设视频名称的权重值大于导演的权重值,导演的权重值大于演员的权重值,以此类推,具体可根据实际需求预设每一个视频特征的权重值,在一种可选的实施方式中,可将视频特征的相似度与对应权重值的乘积的累加和作为视频网站中视频信息与待标注视频对应的综合相似度。若该综合相似度大于预设相似度,则确定该视频网站中的当前视频信息为目标视频信息。
步骤102,基于所述目标视频信息和所述待标注视频的原标签生成用于拓展所述原标签的标签候选集。
首先,从待标注视频的音频信息,以及目标视频信息的视频简介、视频评论中提取关键词。具体为,将待标注视频的音频信息转换为文本信息,基于视频领域的常用词典和停用词对转换后的文本信息,以及视频简介、视频评论进行分词,基于对分词后得到的词语之间的位置关系和词频确定词语的权重,按照词语的权重从高到低的顺序提取与预设个数相等的词语作为关键词。可见,本发明通过从待标注视频的音频信息、目标视频信息的视频简介、视频评论中提取关键词,可以获得更加准确、且满足一定数量要求的关键词。
然后,基于待标注视频的原标签(媒资库中该待标注视频已有的视频标签)、目标视频信息的已有标签以及上述提取的关键词生成待标注视频的标签候选集。参见表1,为电影《生命之树》的标签候选集示例。
表1
从表1中可以看出,由于综合了各大视频网站上目标视频信息的已有标签,以及从待标注视频的音频信息、视频简介、视频评论中提取的关键词,该标签候选集中包含了大量的标签。
步骤103,从所述标签候选集中选择目标标签且以所述目标标签更新所述原标签。
由于标签候选集中包含大量标签,因此,从标签候选集中选择目标标签更新待标注视频的原标签,可提升视频标签的标注粒度。
但是,若从标签候选集中任意选取目标标签,无法保证标签的准确度,为此,本发明预设标签体系,该标签体系涵盖视频领域中的所有通用标签。参见表2,为本发明示出的电影类型相关的标签体系。
表2
基于预设的标签体系,对标签候选集中的标签与标签体系中的标签进行匹配,根据匹配结果选择目标标签。
参见图4,为本发明实施例示出的一种目标标签选择方法流程图。
步骤401,判断标签候选集中的标签是否成功匹配标签体系中的标签,若是,转步骤402;若否,转步骤403;
步骤402,将标签候选集中的标签作为目标标签;
步骤403,从目标视频信息中查找与标签候选集中的标签语义相似的标签;
步骤404,判断语义相似的标签是否成功匹配标签体系中的标签,若是,转步骤405;若否,转步骤406;
步骤405,将语义相似的标签作为目标标签;
步骤406,丢弃标签候选集中的标签及其对应的语义相似的标签,即禁止将标签候选集中的标签及其对应的语义相似的标签作为目标标签。
参见图5,为本发明实施例示出的另一种目标标签选择方法流程图。
步骤501,从目标视频信息中查找与标签候选集中的标签语义相似的标签;
步骤502,判断标签候选集中的标签是否成功匹配标签体系中的标签,若是,转步骤503;若否,转步骤504;
步骤503,将标签候选集中的标签作为目标标签;
步骤504,判断语义相似的标签是否成功匹配标签体系中的标签,若是,转步骤505;若否,转步骤506;
步骤505,将语义相似的标签作为目标标签;
步骤506,丢弃标签候选集中的标签及其对应的语义相似的标签,即禁止将标签候选集中的标签及其对应的语义相似的标签作为目标标签。
利用上述与标签体系中的标签匹配后确定的目标标签更新待标注视频的原标签,可提升视频标签标注的准确度和规范性。
从上述描述可以看出,由于本发明是基于各视频网站上信息量较大的目标视频信息生成的标签候选集,因此,标签候选集中的标签数量较多,基于该包含较多标签的标签候选集为待标注视频选择视频标签,可获得较细的标注粒度;此外,通过与预设的标签体系进行比对,可保证视频标签标注的规范性和准确性。
现仍以电影《生命之树》为例,介绍标注《生命之树》的视频标签的过程。
首先,利用爬虫程序从豆瓣网、时光网、1905电影网分别爬取与本地媒资库中电影《生命之树》相关的视频的视频信息。以豆瓣网为例,参见图3,为从豆瓣网搜索到的与《生命之树》相关的多个视频,其中,图2所示为图3中第一条视频《生命之树The Tree of Life(2011)》的视频信息,包括:导演、主演、国家、语言、视频标签、视频简介、视频评论等信息,其中,视频简介(剧情简介)、视频评论(图2中未示出)以文本形式保存。同理,可获取时光网、1905电影网上与本地媒资库中《生命之树》相关的视频的视频信息。
以豆瓣网上的视频《生命之树The Tree of Life(2011)》为例,从该视频的视频信息中提取视频特征,包括视频名称、导演、演员、国家、语言、上映日期等,从媒资库的《生命之树》中同样提取上述视频特征,计算《生命之树The Tree of Life(2011)》与《生命之树》之间相应视频特征的相似度,例如,视频名称的相似度、导演的相似度、演员的相似度等,再基于预设的每一个视频特征的相似度权重值,计算《生命之树The Tree of Life(2011)》与《生命之树》之间视频特征相似度与对应权重值的乘积的累加和,得到《生命之树The Treeof Life(2011)》对应于《生命之树》的综合相似度。同理,可得到豆瓣网上搜索到的其它相关视频对应于《生命之树》的综合相似度。若《生命之树The Tree of Life(2011)》对应于《生命之树》的综合相似度大于预设相似度,则确定《生命之树The Tree of Life(2011)》的视频信息为豆瓣网上与《生命之树》相似的目标视频信息。同理,可确定时光网、1905电影网上与《生命之树》相似的目标视频信息。
将本地媒资库中《生命之树》的音频(例如,台词)转换为文本信息,基于视频领域的常用词典和停用词,对转换后的文本信息以及从豆瓣网、时光网、1905电影网获取到的视频简介、视频评论进行文本分词,基于分词后得到的词语之间的位置关系和词频确定词语的权重,按照词语的权重从高到低的顺序提取与预设个数相等的词语作为关键词。
基于本地媒资库中《生命之树》的原标签、各大视频网站上目标视频信息的已有标签、以及上述提取的关键词,生成表1所示的电影《生命之树》的标签候选集。
对表1所示标签候选集中的标签去重后,得到表3所示标签候选集。
表3
将表3中每一个标签与表2所示标签体系中的标签进行比对:
其中,“奇幻”、“剧情”、“科幻”、“家庭”、“文艺”、“20世纪”、“人性”、“独立”、“苦难”、“超现实”、“生命”、“父亲”、“宇宙”、“宗教”、“母亲”、“信仰”、“人生”可以成功匹配标签体系中的标签(即在标签体系中),因此,将上述标签作为目标标签。
表3中的标签“荒诞”不在标签体系中,可利用word2vec工具从各大视频网站的目标视频信息中查找与“荒诞”语义相似的标签,例如,“离奇”,“离奇”在表2所示标签体系中,因此,将“离奇”作为目标标签;同理,表3中的标签“温情”不在标签体系中,利用word2vec工具从各大视频网站的目标视频信息中查找与“温情”语义相似的标签为“感动”,“感动”在表2所示标签体系中,因此,将“感动”作为目标标签。
表3中的其它标签及对应的语义相似的标签均不在标签体系中,因此,丢弃其它标签及对应的语义相似的标签。
利用上述目标标签更新本地媒资库中《生命之树》的原标签,得到《生命之树》的最终标签为:“奇幻”、“剧情”、“科幻”、“家庭”、“文艺”、“20世纪”、“人性”、“独立”、“苦难”、“超现实”、“生命”、“父亲”、“宇宙”、“宗教”、“母亲”、“信仰”、“人生”、“离奇”、“感动”。
与前述视频标签标注方法的实施例相对应,本发明还提供了视频标签标注装置的实施例。
本发明视频标签标注装置的实施例可以应用在视频标签标注终端上。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在终端的处理器运行存储器中对应的计算机程序指令形成的。从硬件层面而言,如图6所示,为本发明视频标签标注终端的一种硬件结构图,除了图6所示的处理器以及非易失性存储器之外,实施例中视频标签标注终端通常根据该终端的实际功能,还可以包括其他硬件,对此不再赘述。
请参考图7,为本发明一个实施例中的视频标签标注装置的结构示意图。该视频标签标注装置包括确定单元701、生成单元702以及选择单元703,其中:
确定单元701,用于根据从视频网站的视频信息中提取的视频特征,确定所述视频特征与待标注视频的视频特征相似的目标视频信息;
生成单元702,用于基于所述目标视频信息和所述待标注视频的原标签生成用于拓展所述原标签的标签候选集;
选择单元703,用于从所述标签候选集中选择目标标签且以所述目标标签更新所述原标签。
进一步地,
所述确定单元701,具体用于计算从所述视频网站的视频信息中提取的视频特征与所述待标注视频的视频特征之间的相似度;根据计算得到的所述相似度以及视频特征的预设权重值,确定与所述待标注视频对应的综合相似度;根据所述综合相似度和预设相似度之间的大小关系,确定所述综合相似度大于所述预设相似度的视频特征,并确定与其对应的所述视频网站上的视频信息为目标视频信息。
进一步地,
所述生成单元702,具体用于从所述待标注视频的音频信息,以及所述目标视频信息的视频简介、视频评论中提取关键词;基于所述原标签、所述目标视频信息的已有标签以及所述关键词生成用所述标签候选集。
进一步地,所述生成单元702从所述待标注视频的音频信息,以及所述目标视频信息的视频简介、视频评论中提取关键词,包括:
将所述待标注视频的音频信息转换为文本信息;对转换后的文本信息,以及所述视频简介、视频评论进行分词;基于对分词后得到的词语之间的位置关系和词频确定所述词语的权重;按照所述词语的权重从高到低的顺序提取与预设个数相等的词语作为所述关键词。
进一步地,
所述选择单元703,具体用于对所述标签候选集中的标签与预设的标签体系中的标签进行匹配,根据匹配结果选择目标标签。
进一步地,
所述选择单元703,具体用于若所述标签候选集中的标签成功匹配所述标签体系中的标签,则将所述标签候选集中的标签作为所述目标标签;若所述标签候选集中的标签未成功匹配所述标签体系中的标签,则从所述目标视频信息中查找与所述标签候选集中的标签语义相似的标签;若所述语义相似的标签成功匹配所述标签体系中的标签,则将所述语义相似的标签作为所述目标标签;若所述语义相似的标签未成功匹配所述标签体系中的标签,则禁止将所述标签候选集中的标签及其对应的所述语义相似的标签作为所述目标标签。
进一步地,
所述选择单元703,具体用于从所述目标视频信息中查找与所述标签候选集中的标签语义相似的标签;若所述标签候选集中的标签成功匹配所述标签体系中的标签,则将所述标签候选集中的标签作为所述目标标签;若所述标签候选集中的标签未成功匹配所述标签体系中的标签,且查找到的与所述标签候选集中的标签语义相似的标签成功匹配所述标签体系中的标签,则将所述语义相似的标签作为所述目标标签;若所述标签候选集中的标签未成功匹配所述标签体系中的标签,且所述语义相似的标签未成功匹配所述标签体系中的标签,则禁止将所述标签候选集中的标签及对应的语义相似的标签作为所述目标标签。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (10)

1.一种视频标签标注方法,其特征在于,所述方法包括:
根据从视频网站的视频信息中提取的视频特征,确定所述视频特征与待标注视频的视频特征相似的目标视频信息;
基于所述目标视频信息和所述待标注视频的原标签生成用于拓展所述原标签的标签候选集;
从所述标签候选集中选择目标标签且以所述目标标签更新所述原标签。
2.如权利要求1所述的方法,其特征在于,所述根据从视频网站的视频信息中提取的视频特征,确定所述视频特征与待标注视频的视频特征相似的目标视频信息,包括:
计算从所述视频网站的视频信息中提取的视频特征与所述待标注视频的视频特征之间的相似度;
根据计算得到的所述相似度以及视频特征的预设权重值,确定与所述待标注视频对应的综合相似度;
根据所述综合相似度和预设相似度之间的大小关系,确定所述综合相似度大于所述预设相似度的视频特征,并确定与其对应的所述视频网站上的视频信息为目标视频信息。
3.如权利要求1或2所述的方法,其特征在于,所述基于所述目标视频信息和所述待标注视频的原标签生成用于拓展所述原标签的标签候选集,包括:
从所述待标注视频的音频信息,以及所述目标视频信息的视频简介、视频评论中提取关键词;
基于所述原标签、所述目标视频信息的已有标签以及所述关键词生成用所述标签候选集。
4.如权利要求3所述的方法,其特征在于,所述从所述待标注视频的音频信息,以及所述目标视频信息的视频简介、视频评论中提取关键词,包括:
将所述待标注视频的音频信息转换为文本信息;
对转换后的文本信息,以及所述视频简介、视频评论进行分词;
基于对分词后得到的词语之间的位置关系和词频确定所述词语的权重;
按照所述词语的权重从高到低的顺序提取与预设个数相等的词语作为所述关键词。
5.如权利要求1或2所述的方法,其特征在于,所述从所述标签候选集中选择目标标签,包括:
对所述标签候选集中的标签与预设的标签体系中的标签进行匹配,根据匹配结果选择目标标签。
6.如权利要求5所述的方法,其特征在于,所述对所述标签候选集中的标签与预设的标签体系中的标签进行匹配,根据匹配结果选择目标标签,包括:
若所述标签候选集中的标签成功匹配所述标签体系中的标签,则将所述标签候选集中的标签作为所述目标标签;
若所述标签候选集中的标签未成功匹配所述标签体系中的标签,则从所述目标视频信息中查找与所述标签候选集中的标签语义相似的标签;若所述语义相似的标签成功匹配所述标签体系中的标签,则将所述语义相似的标签作为所述目标标签;
若所述语义相似的标签未成功匹配所述标签体系中的标签,则禁止将所述标签候选集中的标签及其对应的所述语义相似的标签作为所述目标标签。
7.如权利要求5所述的方法,其特征在于,所述对所述标签候选集中的标签与预设的标签体系中的标签进行匹配,根据匹配结果选择目标标签,包括:
从所述目标视频信息中查找与所述标签候选集中的标签语义相似的标签;
若所述标签候选集中的标签成功匹配所述标签体系中的标签,则将所述标签候选集中的标签作为所述目标标签;
若所述标签候选集中的标签未成功匹配所述标签体系中的标签,且查找到的与所述标签候选集中的标签语义相似的标签成功匹配所述标签体系中的标签,则将所述语义相似的标签作为所述目标标签;
若所述标签候选集中的标签未成功匹配所述标签体系中的标签,且所述语义相似的标签未成功匹配所述标签体系中的标签,则禁止将所述标签候选集中的标签及对应的语义相似的标签作为所述目标标签。
8.一种视频标签标注装置,其特征在于,所述装置包括:
确定单元,用于根据从视频网站的视频信息中提取的视频特征,确定所述视频特征与待标注视频的视频特征相似的目标视频信息;
生成单元,用于基于所述目标视频信息和所述待标注视频的原标签生成用于拓展所述原标签的标签候选集;
选择单元,用于从所述标签候选集中选择目标标签且以所述目标标签更新所述原标签。
9.如权利要求8所述的装置,其特征在于:
所述选择单元,具体用于对所述标签候选集中的标签与预设的标签体系中的标签进行匹配,根据匹配结果选择目标标签。
10.如权利要求9所述的装置,其特征在于:
所述选择单元,具体用于若所述标签候选集中的标签成功匹配所述标签体系中的标签,则将所述标签候选集中的标签作为所述目标标签;若所述标签候选集中的标签未成功匹配所述标签体系中的标签,则从所述目标视频信息中查找与所述标签候选集中的标签语义相似的标签;若所述语义相似的标签成功匹配所述标签体系中的标签,则将所述语义相似的标签作为所述目标标签;若所述语义相似的标签未成功匹配所述标签体系中的标签,则禁止将所述标签候选集中的标签及其对应的所述语义相似的标签作为所述目标标签。
CN201711346862.XA 2017-12-15 2017-12-15 一种视频标签标注方法及装置 Pending CN110019955A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711346862.XA CN110019955A (zh) 2017-12-15 2017-12-15 一种视频标签标注方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711346862.XA CN110019955A (zh) 2017-12-15 2017-12-15 一种视频标签标注方法及装置

Publications (1)

Publication Number Publication Date
CN110019955A true CN110019955A (zh) 2019-07-16

Family

ID=67186961

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711346862.XA Pending CN110019955A (zh) 2017-12-15 2017-12-15 一种视频标签标注方法及装置

Country Status (1)

Country Link
CN (1) CN110019955A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110446063A (zh) * 2019-07-26 2019-11-12 腾讯科技(深圳)有限公司 视频封面的生成方法、装置及电子设备
CN110519654A (zh) * 2019-09-11 2019-11-29 广州荔支网络技术有限公司 一种标签确定方法及装置
CN110650364A (zh) * 2019-09-27 2020-01-03 北京达佳互联信息技术有限公司 视频态度标签提取方法及基于视频的交互方法
CN111314732A (zh) * 2020-03-19 2020-06-19 青岛聚看云科技有限公司 确定视频标签的方法、服务器及存储介质
CN111611436A (zh) * 2020-06-24 2020-09-01 腾讯科技(深圳)有限公司 一种标签数据处理方法、装置以及计算机可读存储介质
CN112312205A (zh) * 2020-10-21 2021-02-02 腾讯科技(深圳)有限公司 一种视频处理方法、装置、电子设备和计算机存储介质
CN112487248A (zh) * 2020-12-01 2021-03-12 深圳市易平方网络科技有限公司 视频文件的标签生成方法、装置、智能终端及存储介质
CN112699237A (zh) * 2020-12-24 2021-04-23 百度在线网络技术(北京)有限公司 标签确定方法、设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006157688A (ja) * 2004-11-30 2006-06-15 Nippon Telegr & Teleph Corp <Ntt> 映像シーンに対する意味ラベル付与方法及び装置及びプログラム
CN102622451A (zh) * 2012-04-16 2012-08-01 上海交通大学 电视节目标签自动生成系统
CN103686452A (zh) * 2013-12-06 2014-03-26 北京普瑞众合国际科技有限公司 一种视频关联信息的添加处理方法
CN106446135A (zh) * 2016-09-19 2017-02-22 北京搜狐新动力信息技术有限公司 一种多媒体数据标签生成方法和装置
CN106649274A (zh) * 2016-12-27 2017-05-10 东华互联宜家数据服务有限公司 文本内容标签标记方法以及装置
CN107463552A (zh) * 2017-07-20 2017-12-12 北京奇艺世纪科技有限公司 一种生成视频主题名称的方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006157688A (ja) * 2004-11-30 2006-06-15 Nippon Telegr & Teleph Corp <Ntt> 映像シーンに対する意味ラベル付与方法及び装置及びプログラム
CN102622451A (zh) * 2012-04-16 2012-08-01 上海交通大学 电视节目标签自动生成系统
CN103686452A (zh) * 2013-12-06 2014-03-26 北京普瑞众合国际科技有限公司 一种视频关联信息的添加处理方法
CN106446135A (zh) * 2016-09-19 2017-02-22 北京搜狐新动力信息技术有限公司 一种多媒体数据标签生成方法和装置
CN106649274A (zh) * 2016-12-27 2017-05-10 东华互联宜家数据服务有限公司 文本内容标签标记方法以及装置
CN107463552A (zh) * 2017-07-20 2017-12-12 北京奇艺世纪科技有限公司 一种生成视频主题名称的方法和装置

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110446063A (zh) * 2019-07-26 2019-11-12 腾讯科技(深圳)有限公司 视频封面的生成方法、装置及电子设备
CN110519654A (zh) * 2019-09-11 2019-11-29 广州荔支网络技术有限公司 一种标签确定方法及装置
CN110519654B (zh) * 2019-09-11 2021-07-27 广州荔支网络技术有限公司 一种标签确定方法、装置、电子设备及存储介质
CN110650364A (zh) * 2019-09-27 2020-01-03 北京达佳互联信息技术有限公司 视频态度标签提取方法及基于视频的交互方法
CN110650364B (zh) * 2019-09-27 2022-04-01 北京达佳互联信息技术有限公司 视频态度标签提取方法及基于视频的交互方法
CN111314732A (zh) * 2020-03-19 2020-06-19 青岛聚看云科技有限公司 确定视频标签的方法、服务器及存储介质
CN111611436A (zh) * 2020-06-24 2020-09-01 腾讯科技(深圳)有限公司 一种标签数据处理方法、装置以及计算机可读存储介质
CN111611436B (zh) * 2020-06-24 2023-07-11 深圳市雅阅科技有限公司 一种标签数据处理方法、装置以及计算机可读存储介质
CN112312205A (zh) * 2020-10-21 2021-02-02 腾讯科技(深圳)有限公司 一种视频处理方法、装置、电子设备和计算机存储介质
CN112312205B (zh) * 2020-10-21 2024-03-22 腾讯科技(深圳)有限公司 一种视频处理方法、装置、电子设备和计算机存储介质
CN112487248A (zh) * 2020-12-01 2021-03-12 深圳市易平方网络科技有限公司 视频文件的标签生成方法、装置、智能终端及存储介质
CN112699237A (zh) * 2020-12-24 2021-04-23 百度在线网络技术(北京)有限公司 标签确定方法、设备和存储介质

Similar Documents

Publication Publication Date Title
CN110019955A (zh) 一种视频标签标注方法及装置
CN108829893B (zh) 确定视频标签的方法、装置、存储介质和终端设备
CN108009228B (zh) 一种内容标签的设置方法、装置及存储介质
US20210182333A1 (en) Correlating image annotations with foreground features
CN106649818B (zh) 应用搜索意图的识别方法、装置、应用搜索方法和服务器
US8577882B2 (en) Method and system for searching multilingual documents
CN106570180B (zh) 基于人工智能的语音搜索方法及装置
US8341112B2 (en) Annotation by search
US8892554B2 (en) Automatic word-cloud generation
CN109800414A (zh) 语病修正推荐方法及系统
Kaur et al. A survey of named entity recognition in English and other Indian languages
CN109522397B (zh) 信息处理方法及装置
CN111310440A (zh) 文本的纠错方法、装置和系统
CN109635157A (zh) 模型生成方法、视频搜索方法、装置、终端及存储介质
US20230206661A1 (en) Device and method for automatically generating domain-specific image caption by using semantic ontology
CN111488468A (zh) 地理信息知识点抽取方法、装置、存储介质及计算机设备
CN107844531B (zh) 答案输出方法、装置和计算机设备
CN109348262B (zh) 一种主播相似度的计算方法、装置、设备和存储介质
CN110309355B (zh) 内容标签的生成方法、装置、设备及存储介质
WO2019163642A1 (ja) 要約評価装置、方法、プログラム、及び記憶媒体
CN101213539A (zh) 交叉描述符学习系统、方法及其程序产品
CN106844512B (zh) 智能问答方法及系统
CN106570116B (zh) 基于人工智能的搜索结果的聚合方法及装置
CN112364169B (zh) 基于nlp的wifi识别方法、电子设备和介质
CN111858860B (zh) 搜索信息处理方法及系统、服务器、计算机可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination