CN112612921B - 视频的标签确定方法及装置 - Google Patents

视频的标签确定方法及装置 Download PDF

Info

Publication number
CN112612921B
CN112612921B CN202011622231.8A CN202011622231A CN112612921B CN 112612921 B CN112612921 B CN 112612921B CN 202011622231 A CN202011622231 A CN 202011622231A CN 112612921 B CN112612921 B CN 112612921B
Authority
CN
China
Prior art keywords
label
video
tag
vocabulary
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011622231.8A
Other languages
English (en)
Other versions
CN112612921A (zh
Inventor
吴红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Happly Sunshine Interactive Entertainment Media Co Ltd
Original Assignee
Hunan Happly Sunshine Interactive Entertainment Media Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Happly Sunshine Interactive Entertainment Media Co Ltd filed Critical Hunan Happly Sunshine Interactive Entertainment Media Co Ltd
Priority to CN202011622231.8A priority Critical patent/CN112612921B/zh
Publication of CN112612921A publication Critical patent/CN112612921A/zh
Application granted granted Critical
Publication of CN112612921B publication Critical patent/CN112612921B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种视频的标签确定方法及装置,该方法包括:当接收到用户发送的待处理视频时,对待处理视频进行分析,得到图片集合;将图片集合中满足筛选条件的视频图片确定为目标图片;将每张目标图片中的每个物体的标签词汇进行排序,得到每张目标图片的标签数据;将每个目标图片的标签数据进行排序,得到待处理视频的标签文件;确定标签文件中每个标签词汇的权重值,将权重值大于权重阈值的标签词汇确定为关键标签词汇;基于待处理视频所属的标签类型以及标签维度确定标签数据库;将关键标签词汇在标签数据库中对应的标准标签确定为目标标签;基于各个目标标签生成标签树。应用发明可快速确定视频的标签,并且减少人工参与度,有效提高工作效率。

Description

视频的标签确定方法及装置
技术领域
本发明涉及视频处理技术领域,特别涉及一种视频的标签确定方法及装置。
背景技术
随着网络技术的发展,各大主流的社交平台、视频网站、短视频应用程序App等,都以视频作为主要的内容载体。视频在上传至视频管理后台后,需要根据视频的内容确定视频的标签,通过确定视频的标签,可以实现对视频的分类或是根据标签为用户推荐对应的视频,这对管理视频以及视频的推广有着重大的意义。
在确定视频的标签时,视频管理后台的工作人员通常是根据视频的内容在标签数据库中为视频选择标签。标签数据库中存有大量的标签,工作人员在为视频选取标签时,需要从大量的标签中进行筛选,由此需要花费较长的时间和需要投入大量的人力。
发明内容
有鉴于此,本发明提供一种视频的标签确定方法及装置,该方法用于确定视频的标签,应用本发明可以快速的确定视频的标签,较少人工的参与度,提高工作效率和确定标签的准确率。
为实现上述目的,本发明提供如下技术方案:
一种视频的标签确定方法,包括:
当接收到用户发送的待处理视频时,对所述待处理视频进行分析,得到所述待处理视频的图片集合,所述图片集合中包含所述待处理视频的所有视频图片;
确定所述图片集合中满足预设的筛选条件的视频图片,并将所述图片集合中满足所述筛选条件的视频图片确定为目标图片;
对于每张所述目标图片,获取该目标图片中每个物体的标签词汇,并将每个所述物体的标签词汇进行排序,得到该目标图片的标签数据;
确定每张所述目标图片的时间节点,并基于每张所述目标图片的时间节点的先后顺序,将每个所述目标图片的标签数据进行排序,得到所述待处理视频的标签文件;
确定所述标签文件中每个所述标签词汇的权重值,并将大于预设的权重阈值的权重值所对应的标签词汇确定为关键标签词汇;
确定所述待处理视频所属的标签类型以及标签维度,并基于所述标签类型和所述标签维度确定标签数据库;
对于每个所述关键标签词汇,确定所述标签数据库中是否存在与该关键标签词汇对应的标准标签,若所述标签数据库中存在与该关键标签词汇对应的标准标签,则将与该关键标签词汇对应的标准标签确定为目标标签;
基于各个所述目标标签生成所述待处理视频的标签树。
上述的方法,可选的,所述确定所述图片集合中满足预设的筛选条件的视频图片,包括:
调用预设的清晰度检测算法计算所述图片集合中每张所述视频图片的清晰度;
将每张所述视频图片的清晰度与预设的清晰阈值进行比对,将大于或等于所述清晰阈值的清晰度所对应的视频图片确定为满足所述筛选条件的视频图片。
上述的方法,可选的,所述对于每张所述目标图片,获取该目标图片中每个物体的标签词汇,包括:
对于每张所述目标图片,提取所述目标图片中的每个物体的各个物体特征;
对于每个所述物体,基于该物体的各个所述物体特征,在预设的标签词汇库中确定与该物体对应的标签词汇。
上述的方法,可选的,所述确定所述标签文件中每个所述标签词汇的权重值,包括:
确定所述待处理视频的各个视频标签因子;
对于所述标签文件中的每个所述标签词汇,确定该标签词汇在所述标签文件中出现的频率,并调用预设的权重算法对所述频率和各个所述频率标签因子进行运算,得到该标签词汇的权重值。
上述的方法,可选的,还包括:
若所述标签数据库中不存在与所述关键标签词汇对应的标准标签,则将所述关键标签词汇作为待审核词汇添加至与所述待处理视频对应的临时审核列表中;
对所述临时审核列表中的每个所述待审核词汇进行审核,并将审核通过的待审核词汇确定为目标词汇,并基于预设的标签模板生成每个所述目标词汇的标准标签;
将每个所述目标词汇的标准标签添加至所述标签数据库中,并将每个所述标准标签的标签信息添加至所述待处理视频的标签树中。
一种视频的标签确定装置,包括:
分析单元,用于当接收到用户发送的待处理视频时,对所述待处理视频进行分析,得到所述待处理视频的图片集合,所述图片集合中包含所述待处理视频的所有视频图片;
第一确定单元,用于确定所述图片集合中满足预设的筛选条件的视频图片,并将所述图片集合中满足所述筛选条件的视频图片确定为目标图片;
获取单元,用于对于每张所述目标图片,获取该目标图片中每个物体的标签词汇,并将每个所述物体的标签词汇进行排序,得到该目标图片的标签数据;
排序单元,用于确定每张所述目标图片的时间节点,并基于每张所述目标图片的时间节点的先后顺序,将每个所述目标图片的标签数据进行排序,得到所述待处理视频的标签文件;
第二确定单元,用于确定所述标签文件中每个所述标签词汇的权重值,并将大于预设的权重阈值的权重值所对应的标签词汇确定为关键标签词汇;
第三确定单元,用于确定所述待处理视频所属的标签类型以及标签维度,并基于所述标签类型和所述标签维度确定标签数据库;
第四确定单元,用于对于每个所述关键标签词汇,确定所述标签数据库中是否存在与该关键标签词汇对应的标准标签,若所述标签数据库中存在与该关键标签词汇对应的标准标签,则将与该关键标签词汇对应的标准标签确定为目标标签;
生成单元,用于基于各个所述目标标签生成所述待处理视频的标签树。
上述的装置,可选的,所述第一确定单元,包括:
调用子单元,用于调用预设的清晰度检测算法计算所述图片集合中每张所述视频图片的清晰度;
比对子单元,用于将每张所述视频图片的清晰度与预设的清晰阈值进行比对,将大于或等于所述清晰阈值的清晰度所对应的视频图片确定为满足所述筛选条件的视频图片。
上述的装置,可选的,所述获取单元,包括:
提取子单元,用于对于每张所述目标图片,提取所述目标图片中的每个物体的各个物体特征;
第一确定子单元,用于对于每个所述物体,基于该物体的各个所述物体特征,在预设的标签词汇库中确定与该物体对应的标签词汇。
上述的装置,可选的,所述第二确定单元,包括:
第二确定子单元,用于确定所述待处理视频的各个视频标签因子;
运算子单元,用于对于所述标签文件中的每个所述标签词汇,确定该标签词汇在所述标签文件中出现的频率,并调用预设的权重算法对所述频率和各个所述频率标签因子进行运算,得到该标签词汇的权重值。
上述的装置,可选的,还包括:
第一添加单元,用于若所述标签数据库中不存在与所述关键标签词汇对应的标准标签,则将所述关键标签词汇作为待审核词汇添加至与所述待处理视频对应的临时审核列表中;
审核单元,用于对所述临时审核列表中的每个所述待审核词汇进行审核,并将审核通过的待审核词汇确定为目标词汇,并基于预设的标签模板生成每个所述目标词汇的标准标签;
第二添加单元,用于将每个所述目标词汇的标准标签添加至所述标签数据库中,并将每个所述标准标签的标签信息添加至所述待处理视频的标签树中。
与现有技术相比,本发明具有以下有益效果
本发明提供一种视频的标签确定方法及装置,该方法包括:当接收到用户发送的待处理视频时,对待处理视频进行分析,得到待处理视频的图片集合;确定所述图片集合中满足预设的筛选条件的视频图片,并将所述图片集合中满足所述筛选条件的视频图片确定为目标图片;对于每张所述目标图片,获取该目标图片中每个物体的标签词汇,并将每个所述物体的标签词汇进行排序,得到该目标图片的标签数据;确定每张所述目标图片的时间节点,并基于每张所述目标图片的时间节点的先后顺序,将每个所述目标图片的标签数据进行排序,得到所述待处理视频的标签文件;确定所述标签文件中每个所述标签词汇的权重值,并将大于预设的权重阈值的权重值所对应的标签词汇确定为关键标签词汇;确定所述待处理视频所属的标签类型以及标签维度,并基于所述标签类型和所述标签维度确定标签数据库;对于每个所述关键标签词汇,确定所述标签数据库中是否存在与该关键标签词汇对应的标准标签,若所述标签数据库中存在与该关键标签词汇对应的标准标签,则将与该关键标签词汇对应的标准标签确定为目标标签,并基于各个所述目标标签生成所述待处理视频的标签树。应用本发明,通过对视频图片进行筛选,以及对各个标签词汇进行筛选,可以有效的提高确定待处理视频的标签的准确性,使得所确定的标签更加贴近待处理视频的内容,并且整个过程人工参与程度少,有效提高确定待处理视频的标签的效率,减少投入的人力和物力。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种视频的标签确定方法的方法流程图;
图2为本发明实施例提供的一种视频的标签确定方法的又一方法流程图;
图3为本发明实施例提供的一种视频的标签确定方法的再一方法流程图;
图4为本发明实施例提供的一种视频的标签确定装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本发明可用于众多通用或专用的计算装置环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器装置、包括以上任何装置或设备的分布式计算环境等等。
本发明实施例提供了一种视频的标签确定方法,该方法可以应用在多种系统平台,其执行主体可以为计算机终端或各种移动设备的处理器,所述方法的方法流程图如图1所示,具体包括:
S101、当接收到用户发送的待处理视频时,对所述待处理视频进行分析,得到所述待处理视频的图片集合,所述图片集合中包含所述待处理视频的所有视频图片。
本发明实施例提供的方法中,当媒资管理系统接收到用户发送的待处理视频时,媒资管理系统需要确定待处理视频的标签。所述待处理视频为需要确定标签的视频;对所述待处理视频进行视频编解码处理,得到视频流,使用OPENCV对视频流进行图片转化处理,将视频流转化为多张视频图片,多张视频图片组成图片集合;图片集合为与待处理视频对应的图片集合;图片集合中包含多张视频图片。进一步的,图片集合中的每张视频图片可以为构成待处理视频的每帧图片。
S102、确定所述图片集合中满足预设的筛选条件的视频图片,并将所述图片集合中满足所述筛选条件的视频图片确定为目标图片。
本发明实施例提供的方法中,对图片集合中的每张视频图片进行审核,以确定图片集合中满足预设的筛选条件的视频图片,并将所述图片集合中满足所述筛选条件的视频图片确定为目标图片,将图片集合中不满足所述筛选条件的视频图片确定为不合格图片,并将所述不合格图片删除。
具体的,确定图片集合中满足预设的筛选条件的视频图片的具体方法流程如图2所示,具体说明如下所述:
S201、调用预设的清晰度检测算法计算所述图片集合中每张所述视频图片的清晰度。
S202、对于每张所述视频图片,将该视频图片的清晰度与预设的清晰度阈值进行比对,以确定该视频图片的清晰度是否大于或等于所述清晰阈值;若该视频图片的清晰度大于或等于所述清晰阈值,则执行S203;若该视频图片的清晰度小于所述清晰阈值,则执行S204;
S203、将该视频图片确定为目标图片。
S204、将该视频图片删除。
本发明实施例提供的方法中,清晰度检测算法包括但不限于Brenner梯度函数、Tenengrad梯度函数以及Laplacian梯度函数等;使用清晰度检测算法对每张视频图片进行处理,得到每张视频图片的清晰度,并将每张视频图片的清晰度和预设的清晰阈值进行比对,将大于或等于清晰阈值的清晰度所对应的视频图片确定为满足所述筛选条件的视频图片;将小于清晰阈值的清晰度所对应的视频图片确定为不满足所述筛选条件的视频图片,并将不满足筛选条件的视频图片删除。
本发明实施例提供的方法中,不满足筛选条件的视频图片还可以具体为存在模糊的图片、全黑或全白的图片以及无法读取数据的图片。应用清晰度检测算法,可以将图片集合中不满足筛选条件的视频图片筛除,由此对图片集合中的视频图片进行筛选,进一步减少了后期的工作量,提高了确定视频的标签的效率,并且还提高了确定视频的标签的准确性。
S103、对于每张所述目标图片,获取该目标图片中每个物体的标签词汇,并将每个所述物体的标签词汇进行排序,得到该目标图片的标签数据。
本发明实施例提供的方法中,使用识别算法,识别目标图片中的每个物体,以获取每个物体的标签词汇中包含该物体的名称以及物体类别等信息;所述标签数据中包含目标图片中每个物体的标签词汇,其中,所述标签数据具体可为文本数据;例如,目标图片A中包含物体1、物体2以及物体3;其中物体1具体为“杯子”,则物体1的标签词汇为“杯子”;物体2具体为“自行车”,则物体2的标签词汇为“自行车”;物体3具体为“犬-哈士奇”,则物体3的标签词汇为“犬-哈士奇”;在将物体1、2以及3的标签词汇进行排序时,可以任意进行排序,也可以根据预设的排序规则进行排序,例如按照类型进行排序,其中一种方式如:“服饰;日用品;人物;植物;动物”。按照“服饰;日用品;人物;植物;动物”的排列规则对物品1、2和3的标签词汇进行排序,可以得到:“杯子;自行车;犬-哈士奇”。
参照图3,为本发明实施例提供的一种获取目标图片中每个物体的标签词汇的方法流程图,具体说明如下所述:
S301、对于每张所述目标图片,提取所述目标图片中的每个物体的各个物体特征。
本发明实施例提供的方法中,对于每张目标图片,使用预设的识别算法,识别该目标图片中的每个物体,并使用识别算法提取该目标图片中的每个物体的物体特征;其中,识别算法具体为AI识别算法,具体可以包含人脸识别和物体识别算法。
S302、对于每个所述物体,基于该物体的各个所述物体特征,在预设的标签词汇库中确定与该物体对应的标签词汇。
本发明实施例提供的方法中,对于每个物体,将该物体的各个物体特征遍历标签词汇库中的每个标准标签词汇,并确定与该物体的每个物体特征均匹配的标准标签词汇,将该标准标签词汇确定为与该物体对应的标签词汇。进一步的,标签词汇库中包含多个标准标签词汇,每个标准标签词汇均为通过审核的词汇。
本发明实施例提供的方法中,通过使用识别算法提取目标图片中每个物体的各个物体特征,可以基于每个物体的各个物体特征,在标签词汇库中确定每个物体的标签词汇,进而可以得知每张目标图片中每个物体的标签词汇,由此可以完成对目标图片的处理。
S104、确定每张所述目标图片的时间节点,并基于每张所述目标图片的时间节点的先后顺序,将每个所述目标图片的标签数据进行排序,得到所述待处理视频的标签文件。
本发明实施例提供的方法中,目标图片的时间节点为目标图片在待处理视频中的时间节点,例如目标图片A为待处理视频在一分二十秒处的视频帧,目标图片A的时间节点为1:20;目标图片B为待处理视频在一分三十秒处的视频帧,目标图片B的时间节点为1:30;目标图片C为待处理视频在一分三十六秒处的视频帧,目标图片C的时间节点为1:36。
将每张目标图片的标签数据按照时间的先后顺序进行排列,即可得到待处理视频的标签文件,其中,所述标签文件可为文本文件;延续上述的说明,目标图片A的标签数据为A1,目标图片B的标签数据为B1,目标图片C的标签数据为C1,将各张目标图片的标签数据进行排序,可得到:“A1,B1,C1”。
S105、确定所述标签文件中每个所述标签词汇的权重值,并将大于预设的权重阈值的权重值所对应的标签词汇确定为关键标签词汇。
本发明实施例提供的方法中,使用预设的权重算法对标签文件进行处理,由此可得到标签文件中每个标签词汇的权重值,权重值可表示标签词汇在该待处理视频中权重,即权重值可以表示标签词汇与待处理视频之间相关联的强度,权重值越大,则表示标签词汇与待处理视频之间相关联性的强度越大。
将每个标签词汇的权重值与预设的权重阈值进行比对,并将权重值大于所述权重阈值的标签词汇确定为关键标签词汇,将权重值不大于所述权重阈值的标签词汇确定为非关键标签词汇。
本发明实施例提供的方法中,确定每个标签词汇的权重值,并将每个标签词汇的权重值与预设的权重阈值进行比对,由此可以将权重值大于权重阈值的标签词汇确定为关键标签词汇。通过使用标签词汇的权重值,可以从多个标签词汇中筛选出关键标签词汇,由此可得出与待处理视频相关联很强的标签词汇,从而得到与待处理视频更加贴切的标签。
本发明实施例提供的方法中,对确定标签文件中每个标签词汇的权重值的过程进行说明,具体如下所述:
确定所述待处理视频的各个视频标签因子;
对于所述标签文件中的每个所述标签词汇,确定该标签词汇在所述标签文件中出现的频率,并调用预设的权重算法对所述频率和各个所述频率标签因子进行运算,得到该标签词汇的权重值。
本发明实施例提供的方法中,所述视频标签因子用于对标签词汇进行筛选,视频标签因子用于计算每个标签词汇的权重值;视频标签因子为待处理视频在某个方面的影响因子,不同方面有不同的视频标签因子,视频标签因子的数值越大,则表示这个方面对待处理视频的影响越大;例如动物方面和植物方面,对待处理视频的影响小,则动物方面和植物方面的视频标签因子的数值就小,由此,可以有效的降低与动物和植物有关的标签词汇的权重值,进而将动物与植物有关的标签词汇筛选出去。
本发明实施例提供的方法中,该标签词汇在标签文件中出现的频率表示该标签词汇在标签文件中出现次数在标签文件中占据的比值。本发明提供的权重算法具体可为TF/IDF算法,对于每个标签词汇,将该标签词汇的频率和各个视频标签因子带入TF/IDF算法中进行计算,由此可得到与该标签词汇对应的权重值。
S106、确定所述待处理视频所属的标签类型以及标签维度,并基于所述标签类型和所述标签维度确定标签数据库。
本发明实施例提供的方法中,所述标签类型可分为长视频标签类型、短视频标签类型、内容标签类型以及用户标签类型等;所述标签维度表示标签的维度,包括但不限于场景维度、情感维度以及地区维度等,不同的标签类型有不同的标签维度;例如长视频标签类型对应的标签维度有场景维度以及情感维度等。根据标签类型和标签维度确定标签数据库,该标签数据库中保存的标准标签均与该标签类型和标签维度有关。
本发明中的标准标签根据标签类型和标签维度进行管理,由此可对各个标准标签进行分类管理,得到与不同的标签类型和标签维度对应的标签数据库,并且,这样使得每个标准标签都能存在与其对应的标签路径,可以快速找到需要的标准标签,并且可以找到更加贴近的标签,使得所确定的待处理视频的标签更加准确。
S107、对于每个所述关键标签词汇,确定所述标签数据库中是否存在与该关键标签词汇对应的标准标签,若所述标签数据库中存在与该关键标签词汇对应的标准标签,则将与该关键标签词汇对应的标准标签确定为目标标签;
S108、基于各个所述目标标签生成所述待处理视频的标签树。
本发明实施例提供的方法中,当关键标签词汇在标签数据库中存在对应的标准标签时,表明该关键标签词汇已经进行标签化,此时可将与关键标签词汇对应的标准标签确定为与待处理视频对应的标签。进一步的,标准标签为通过审核的标签,即标准标签满足各种设定的标签定义和标签结构。
其中,所述待处理视频的标签树中包含每个目标标签的标签信息,以及与该目标标签对应的关键标签词汇的词汇信息;所述标签信息包含但不限于目标标签的标签编号、对应的标签维度、对应的标签类型、标签状态、标签名称等等;词汇信息包含但不限于关键标签词汇的权重值、词汇的具体内容等。
本发明实施例提供的方法中,当接收到用户发送的待处理视频时,对待处理视频进行分析,得到待处理视频的图片集合;确定所述图片集合中满足预设的筛选条件的视频图片,并将所述图片集合中满足所述筛选条件的视频图片确定为目标图片;对于每张所述目标图片,获取该目标图片中每个物体的标签词汇,并将每个所述物体的标签词汇进行排序,得到该目标图片的标签数据;确定每张所述目标图片的时间节点,并基于每张所述目标图片的时间节点的先后顺序,将每个所述目标图片的标签数据进行排序,得到所述待处理视频的标签文件;确定所述标签文件中每个所述标签词汇的权重值,并将大于预设的权重阈值的权重值所对应的标签词汇确定为关键标签词汇;确定所述待处理视频所属的标签类型以及标签维度,并基于所述标签类型和所述标签维度确定标签数据库;对于每个所述关键标签词汇,确定所述标签数据库中是否存在与该关键标签词汇对应的标准标签,若所述标签数据库中存在与该关键标签词汇对应的标准标签,则将与该关键标签词汇对应的标准标签确定为目标标签,并基于各个所述目标标签生成所述待处理视频的标签树。应用本发明,通过将待处理视频的各张视频图片进行筛选,得到多张目标图片,获取每张目标图片上的每个物体的标签词汇,并对各个标签词汇进行筛选,得到各个关键标签词汇;对于每个关键标签词汇,若所述标签数据库中存在与该关键标签词汇对应的标准标签,则将与该关键标签词汇对应的标准标签确定为目标标签;根据各个目标标签生成待处理视频的标签树。应用本发明,通过对视频图片进行筛选,以及对各个标签词汇进行筛选,可以有效的提高确定待处理视频的标签的准确性,使得所确定的标签更加贴近待处理视频的内容,并且整个过程人工参与程度少,有效提高确定待处理视频的标签的效率,减少投入的人力和物力。
本发明实施例提供的方法中,对于每个关键标签词汇,在判断标签数据库中是否存在与该关键标签词汇对应的标准标签的过程中,若标签数据库中不存在与该关键标签词汇对应的标准标签,则将该关键标签词汇作为待审核词汇添加至与该待处理视频对应的临时审核列表中;对所述临时审核列表中的每个所述待审核词汇进行审核,并将审核通过的待审核词汇确定为目标词汇,并基于预设的标签模板生成每个所述目标词汇的标准标签;将每个所述目标词汇的标准标签添加至所述标签数据库中,并将每个所述标准标签的标签信息添加至所述待处理视频的标签树中。
进一步的,当临时审核列表中的待审核词汇未通过审核时,则不生成与该待审核词汇对应的标准词汇,可将该待审核词汇丢弃。
本发明实施例提供的方法中,标签模板具体包括以下内容:
1)标签名:标签的名称;
2)编码:标签的身份标识码,该编码具有唯一性;
3)说明:对于该标签名称的简介;
4)状态:标签的是否处理可用;
5)有效期:对于该标签存在的生命周期时长定义;
6)更新频率:该标签在对应的视频中的进行更新的频率;
7)归属标签:该标签所属的标签类型和标签维度;
进一步的,标签模板中的更新频率通常定义为不更新;标签模板中的编码为该标准标签的身份标识码,该编码具有唯一性,可使用编码生成器生成编码,如,编码可为:“001001001”。
本发明实施例提供的方法中,临时审核列表用于存放标签数据库中未存在对应的标准标签的关键标签词汇;在对临时审核列表中的各个关键标签词汇进行审核时,可通知审核人员进行审核,审核人员审核通过的关键标签词汇,可按照上述的标签模板生成该关键标签词汇的标准标签,并将生成的标准标签保存在标签数据库中。
本发明实施例提供的方法中,生成的标准标签均满足以下的标准:
1)标签命名采用纯汉字命名;
2)单个标签及的命名长度(一个汉字记为1个长度)不超过12字符不小于1个字符;
3)标签命名需要使用常用词、网络词等,不可使用无意义的字进行组合;
4)一个标签名称在同等层次定义明确,不可出现一个标签表达多种意义的情况,做到沟通对于标签的明确性,以防止产生信息偏差;
5)一个标签对应一个标签编码,标签编码作为标签的唯一值;
6)一个标签名称可以出现不同归属标签或维度中,但是标签编码必须不一样,保障标签编码的唯一性;
7)对于标签的完整描述需要明确作为范围及层次路径;
其中,标签的层次路径包含标签所属的标签类型以及标签维度;以一标准标签为例进行说明,标准标签由三部分组成,分别是标签类型、标签维度以及标签,其中,标签的层次最多为3层;本发明中的标准标签通过类型+维度的方式进行划分管理,同时规定了标签层级不超过3层,即解决数据偏移问题,也解决标签数据的管理问题。以一例子说明,如标准标签为:综艺-真人秀-老年真人秀;其中,该标准标签的标签类型为综艺,标签维度为真人秀,标签为老年真人秀。
本发明实施例提供的方法中,当标签数据库中不存在与关键标签词汇对应的标准标签时,可将关键标签词汇添加至临时审核列表中,以便对关键标签词汇进行审核,当审核通过时,可生成该关键标签词汇的标准标签;当审核不通过时,可将该关键标签词汇丢弃。其中,在对关键标签词汇进行审核时,通常是该关键标签词汇与待处理视频的内容非常贴近时,对该关键标签词汇的审核才通过。由此,可以更加精细的确认的与待处理视频对应的标签,并且,通过一系列的筛选,待审核列表中需要审核人员进行审核的关键标签词汇的数量已经大量的减少,由此可以极大程度的减少审核人员的工作量,提高审核人员的工作效率。
与图1所述的方法相对应,本发明实施例还提供了一种视频的标签确定装置,用于对图1中方法的具体实现,本发明实施例提供的视频的标签确定装置可以应用在计算机终端或各种移动设备中,其结构示意图如图4所示,具体包括:
分析单元401,用于当接收到用户发送的待处理视频时,对所述待处理视频进行分析,得到所述待处理视频的图片集合,所述图片集合中包含所述待处理视频的所有视频图片;
第一确定单元402,用于确定所述图片集合中满足预设的筛选条件的视频图片,并将所述图片集合中满足所述筛选条件的视频图片确定为目标图片;
获取单元403,用于对于每张所述目标图片,获取该目标图片中每个物体的标签词汇,并将每个所述物体的标签词汇进行排序,得到该目标图片的标签数据;
排序单元404,用于确定每张所述目标图片的时间节点,并基于每张所述目标图片的时间节点的先后顺序,将每个所述目标图片的标签数据进行排序,得到所述待处理视频的标签文件;
第二确定单元405,用于确定所述标签文件中每个所述标签词汇的权重值,并将大于预设的权重阈值的权重值所对应的标签词汇确定为关键标签词汇;
第三确定单元406,用于确定所述待处理视频所属的标签类型以及标签维度,并基于所述标签类型和所述标签维度确定标签数据库;
第四确定单元407,用于对于每个所述关键标签词汇,确定所述标签数据库中是否存在与该关键标签词汇对应的标准标签,若所述标签数据库中存在与该关键标签词汇对应的标准标签,则将与该关键标签词汇对应的标准标签确定为目标标签;
生成单元408,用于基于各个所述目标标签生成所述待处理视频的标签树。
本发明实施例提供的方法中,当接收到用户发送的待处理视频时,对待处理视频进行分析,得到待处理视频的图片集合;确定所述图片集合中满足预设的筛选条件的视频图片,并将所述图片集合中满足所述筛选条件的视频图片确定为目标图片;对于每张所述目标图片,获取该目标图片中每个物体的标签词汇,并将每个所述物体的标签词汇进行排序,得到该目标图片的标签数据;确定每张所述目标图片的时间节点,并基于每张所述目标图片的时间节点的先后顺序,将每个所述目标图片的标签数据进行排序,得到所述待处理视频的标签文件;确定所述标签文件中每个所述标签词汇的权重值,并将大于预设的权重阈值的权重值所对应的标签词汇确定为关键标签词汇;确定所述待处理视频所属的标签类型以及标签维度,并基于所述标签类型和所述标签维度确定标签数据库;对于每个所述关键标签词汇,确定所述标签数据库中是否存在与该关键标签词汇对应的标准标签,若所述标签数据库中存在与该关键标签词汇对应的标准标签,则将与该关键标签词汇对应的标准标签确定为目标标签,并基于各个所述目标标签生成所述待处理视频的标签树。应用本发明,通过对视频图片进行筛选,以及对各个标签词汇进行筛选,可以有效的提高确定待处理视频的标签的准确性,使得所确定的标签更加贴近待处理视频的内容,并且整个过程人工参与程度少,有效提高确定待处理视频的标签的效率,减少投入的人力和物力。
基于上述的案例,本发明实施例提供的装置中,所述第一确定单元402,可配置为:
调用子单元,用于调用预设的清晰度检测算法计算所述图片集合中每张所述视频图片的清晰度;
比对子单元,用于将每张所述视频图片的清晰度与预设的清晰阈值进行比对,将大于或等于所述清晰阈值的清晰度所对应的视频图片确定为满足所述筛选条件的视频图片。
基于上述的案例,本发明实施例提供的装置中,所述获取单元403,可配置为:
提取子单元,用于对于每张所述目标图片,提取所述目标图片中的每个物体的各个物体特征;
第一确定子单元,用于对于每个所述物体,基于该物体的各个所述物体特征,在预设的标签词汇库中确定与该物体对应的标签词汇。
基于上述的案例,本发明实施例提供的装置中,所述第二确定单元405,可配置为:
第二确定子单元,用于确定所述待处理视频的各个视频标签因子;
运算子单元,用于对于所述标签文件中的每个所述标签词汇,确定该标签词汇在所述标签文件中出现的频率,并调用预设的权重算法对所述频率和各个所述频率标签因子进行运算,得到该标签词汇的权重值。
基于上述的案例,本发明实施例提供的装置中,还可以配置为:
第一添加单元,用于若所述标签数据库中不存在与所述关键标签词汇对应的标准标签,则将所述关键标签词汇作为待审核词汇添加至与该待处理视频对应的临时审核列表中;
审核单元,用于对所述临时审核列表中的每个所述待审核词汇进行审核,并将审核通过的待审核词汇确定为目标词汇,并基于预设的标签模板生成每个所述目标词汇的标准标签;
第二添加单元,用于将每个所述目标词汇的标准标签添加至所述标签数据库中,并将每个所述标准标签的标签信息添加至所述待处理视频的标签树中。
上述各个实施例的具体实施过程及其衍生方式,均在本发明的保护范围之内。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种视频的标签确定方法,其特征在于,包括:
当接收到用户发送的待处理视频时,对所述待处理视频进行分析,得到所述待处理视频的图片集合,所述图片集合中包含所述待处理视频的所有视频图片;
确定所述图片集合中满足预设的筛选条件的视频图片,并将所述图片集合中满足所述筛选条件的视频图片确定为目标图片;
对于每张所述目标图片,获取该目标图片中每个物体的标签词汇,并将每个所述物体的标签词汇进行排序,得到该目标图片的标签数据;
确定每张所述目标图片的时间节点,并基于每张所述目标图片的时间节点的先后顺序,将每个所述目标图片的标签数据进行排序,得到所述待处理视频的标签文件;
确定所述标签文件中每个所述标签词汇的权重值,并将大于预设的权重阈值的权重值所对应的标签词汇确定为关键标签词汇;
确定所述待处理视频所属的标签类型以及标签维度,并基于所述标签类型和所述标签维度确定标签数据库;
对于每个所述关键标签词汇,确定所述标签数据库中是否存在与该关键标签词汇对应的标准标签,若所述标签数据库中存在与该关键标签词汇对应的标准标签,则将与该关键标签词汇对应的标准标签确定为目标标签;
基于各个所述目标标签生成所述待处理视频的标签树。
2.根据权利要求1所述的方法,其特征在于,所述确定所述图片集合中满足预设的筛选条件的视频图片,包括:
调用预设的清晰度检测算法计算所述图片集合中每张所述视频图片的清晰度;
将每张所述视频图片的清晰度与预设的清晰阈值进行比对,将大于或等于所述清晰阈值的清晰度所对应的视频图片确定为满足所述筛选条件的视频图片。
3.根据权利要求1所述的方法,其特征在于,所述对于每张所述目标图片,获取该目标图片中每个物体的标签词汇,包括:
对于每张所述目标图片,提取所述目标图片中的每个物体的各个物体特征;
对于每个所述物体,基于该物体的各个所述物体特征,在预设的标签词汇库中确定与该物体对应的标签词汇。
4.根据权利要求1所述的方法,其特征在于,所述确定所述标签文件中每个所述标签词汇的权重值,包括:
确定所述待处理视频的各个视频标签因子;
对于所述标签文件中的每个所述标签词汇,确定该标签词汇在所述标签文件中出现的频率,并调用预设的权重算法对所述频率和各个所述频率标签因子进行运算,得到该标签词汇的权重值。
5.根据权利要求1所述的方法,其特征在于,还包括:
若所述标签数据库中不存在与所述关键标签词汇对应的标准标签,则将所述关键标签词汇作为待审核词汇添加至与所述待处理视频对应的临时审核列表中;
对所述临时审核列表中的每个所述待审核词汇进行审核,并将审核通过的待审核词汇确定为目标词汇,并基于预设的标签模板生成每个所述目标词汇的标准标签;
将每个所述目标词汇的标准标签添加至所述标签数据库中,并将每个所述标准标签的标签信息添加至所述待处理视频的标签树中。
6.一种视频的标签确定装置,其特征在于,包括:
分析单元,用于当接收到用户发送的待处理视频时,对所述待处理视频进行分析,得到所述待处理视频的图片集合,所述图片集合中包含所述待处理视频的所有视频图片;
第一确定单元,用于确定所述图片集合中满足预设的筛选条件的视频图片,并将所述图片集合中满足所述筛选条件的视频图片确定为目标图片;
获取单元,用于对于每张所述目标图片,获取该目标图片中每个物体的标签词汇,并将每个所述物体的标签词汇进行排序,得到该目标图片的标签数据;
排序单元,用于确定每张所述目标图片的时间节点,并基于每张所述目标图片的时间节点的先后顺序,将每个所述目标图片的标签数据进行排序,得到所述待处理视频的标签文件;
第二确定单元,用于确定所述标签文件中每个所述标签词汇的权重值,并将大于预设的权重阈值的权重值所对应的标签词汇确定为关键标签词汇;
第三确定单元,用于确定所述待处理视频所属的标签类型以及标签维度,并基于所述标签类型和所述标签维度确定标签数据库;
第四确定单元,用于对于每个所述关键标签词汇,确定所述标签数据库中是否存在与该关键标签词汇对应的标准标签,若所述标签数据库中存在与该关键标签词汇对应的标准标签,则将与该关键标签词汇对应的标准标签确定为目标标签;
生成单元,用于基于各个所述目标标签生成所述待处理视频的标签树。
7.根据权利要求6所述的装置,其特征在于,所述第一确定单元,包括:
调用子单元,用于调用预设的清晰度检测算法计算所述图片集合中每张所述视频图片的清晰度;
比对子单元,用于将每张所述视频图片的清晰度与预设的清晰阈值进行比对,将大于或等于所述清晰阈值的清晰度所对应的视频图片确定为满足所述筛选条件的视频图片。
8.根据权利要求6所述的装置,其特征在于,所述获取单元,包括:
提取子单元,用于对于每张所述目标图片,提取所述目标图片中的每个物体的各个物体特征;
第一确定子单元,用于对于每个所述物体,基于该物体的各个所述物体特征,在预设的标签词汇库中确定与该物体对应的标签词汇。
9.根据权利要求6所述的装置,其特征在于,所述第二确定单元,包括:
第二确定子单元,用于确定所述待处理视频的各个视频标签因子;
运算子单元,用于对于所述标签文件中的每个所述标签词汇,确定该标签词汇在所述标签文件中出现的频率,并调用预设的权重算法对所述频率和各个所述频率标签因子进行运算,得到该标签词汇的权重值。
10.根据权利要求6所述的装置,其特征在于,还包括:
第一添加单元,用于若所述标签数据库中不存在与所述关键标签词汇对应的标准标签,则将所述关键标签词汇作为待审核词汇添加至与所述待处理视频对应的临时审核列表中;
审核单元,用于对所述临时审核列表中的每个所述待审核词汇进行审核,并将审核通过的待审核词汇确定为目标词汇,并基于预设的标签模板生成每个所述目标词汇的标准标签;
第二添加单元,用于将每个所述目标词汇的标准标签添加至所述标签数据库中,并将每个所述标准标签的标签信息添加至所述待处理视频的标签树中。
CN202011622231.8A 2020-12-31 2020-12-31 视频的标签确定方法及装置 Active CN112612921B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011622231.8A CN112612921B (zh) 2020-12-31 2020-12-31 视频的标签确定方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011622231.8A CN112612921B (zh) 2020-12-31 2020-12-31 视频的标签确定方法及装置

Publications (2)

Publication Number Publication Date
CN112612921A CN112612921A (zh) 2021-04-06
CN112612921B true CN112612921B (zh) 2022-02-22

Family

ID=75249608

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011622231.8A Active CN112612921B (zh) 2020-12-31 2020-12-31 视频的标签确定方法及装置

Country Status (1)

Country Link
CN (1) CN112612921B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114157882B (zh) * 2021-12-27 2024-04-30 未来电视有限公司 视频编目方法、装置、电子设备及计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105915956A (zh) * 2015-12-15 2016-08-31 乐视网信息技术(北京)股份有限公司 视频内容的推荐方法、装置、服务器及系统
CN110555136A (zh) * 2018-03-29 2019-12-10 优酷网络技术(北京)有限公司 一种视频标签的生成方法、装置及计算机存储介质
CN111274442A (zh) * 2020-03-19 2020-06-12 聚好看科技股份有限公司 确定视频标签的方法、服务器及存储介质
CN111651981A (zh) * 2019-02-19 2020-09-11 阿里巴巴集团控股有限公司 数据的审核方法、装置及设备
CN112135193A (zh) * 2020-09-24 2020-12-25 湖南快乐阳光互动娱乐传媒有限公司 视频推荐方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105915956A (zh) * 2015-12-15 2016-08-31 乐视网信息技术(北京)股份有限公司 视频内容的推荐方法、装置、服务器及系统
CN110555136A (zh) * 2018-03-29 2019-12-10 优酷网络技术(北京)有限公司 一种视频标签的生成方法、装置及计算机存储介质
CN111651981A (zh) * 2019-02-19 2020-09-11 阿里巴巴集团控股有限公司 数据的审核方法、装置及设备
CN111274442A (zh) * 2020-03-19 2020-06-12 聚好看科技股份有限公司 确定视频标签的方法、服务器及存储介质
CN112135193A (zh) * 2020-09-24 2020-12-25 湖南快乐阳光互动娱乐传媒有限公司 视频推荐方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
细粒度视频标签机制及其应用研究;曲鑫;《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》;20130715;全文 *

Also Published As

Publication number Publication date
CN112612921A (zh) 2021-04-06

Similar Documents

Publication Publication Date Title
US20230237328A1 (en) Information processing method and terminal, and computer storage medium
CN106651057B (zh) 一种基于安装包序列表的移动端用户年龄预测方法
CN111190939A (zh) 一种用户画像构建方法及装置
CN111144723A (zh) 人岗匹配推荐方法及系统、存储介质
CN111125343A (zh) 适用于人岗匹配推荐系统的文本解析方法及装置
CN107291840B (zh) 一种用户属性预测模型构建方法和装置
CN111105209A (zh) 适用于人岗匹配推荐系统的职位简历匹配方法及装置
CN109872162A (zh) 一种处理用户投诉信息的风控分类识别方法及系统
CN112116168B (zh) 一种用户行为的预测方法、装置及电子设备
CN110941702A (zh) 一种法律法规和法条的检索方法及装置、可读存储介质
CN110837568A (zh) 实体对齐方法及装置、电子设备、存储介质
CN112612921B (zh) 视频的标签确定方法及装置
CN116049379A (zh) 知识推荐方法、装置、电子设备和存储介质
CN111639700A (zh) 目标相似度识别方法、装置、计算机设备及可读存储介质
CN112199395A (zh) 一种人工智能分析方法及系统
CN111666298A (zh) 基于flink的用户服务类别检测方法、装置、计算机设备
CN111325562A (zh) 粮食安全追溯系统及方法
CN112328779B (zh) 训练样本构建方法、装置、终端设备及存储介质
US11457192B2 (en) Digital evidence management method and digital evidence management system
CN104376021A (zh) 文件推荐系统及方法
CN114282119A (zh) 一种基于异构信息网络的科技信息资源检索方法及系统
CN113065892A (zh) 一种信息推送方法、装置、设备及存储介质
CN111767959A (zh) 毛绒纤维分类方法及装置
CN111382343A (zh) 一种标签体系生成方法及装置
CN111460268A (zh) 数据库查询请求的确定方法、装置和计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant