CN112261440B

CN112261440B - 基于镜头识别及场景识别的分布式超高清视频识别方法和系统

Info

Publication number: CN112261440B
Application number: CN202011175296.2A
Authority: CN
Inventors: 代林东; 沈余银; 余军; 宋升�; 刘盾; 唐学怡; 黄信云; 朱俊杰
Original assignee: Chengdu Chinamcloud Technology Co ltd
Current assignee: Chengdu Chinamcloud Technology Co ltd
Priority date: 2020-10-28
Filing date: 2020-10-28
Publication date: 2022-11-25
Anticipated expiration: 2040-10-28
Also published as: CN112261440A

Abstract

本发明涉及基于镜头识别及场景识别的分布式超高清视频识别方法和系统，采用镜头/场景识别技术拆分视频以实现并发超高清识别。识别每个镜头之前先经抽样算法抽样，极大减小需要识别的视频帧数量。从而显著提高超高清视频识别效率。另外，对每个镜头进行简化的场景识别，针对不同的场景设置不同的阈值，从而显著提高超高清视频识别准确率。

Description

基于镜头识别及场景识别的分布式超高清视频识别方法和系统

技术领域

本发明涉及超高清视频识别技术，具体涉及一种基于镜头识别及场景识别的分布式超高清视频识别方法和系统。

背景技术

目前正处于超高清视频产业发展的初期，市面上已经出现了少量超高清视频，但也有不少伪超高清视频。如何分辨真伪超高清视频呢。有学校或科研单位研发了一些识别真伪超高清视频的软件或者设备。但这些软件或设备大多采用单机逐帧识别，耗时极长，而且准确率不高，没有实用价值。

发明内容

本发明的目的在于克服现有技术的不足，提供一种基于镜头识别及场景识别的分布式超高清视频识别方法和系统，采用镜头/场景识别技术拆分视频以实现并发超高清识别。识别每个镜头之前先经抽样算法抽样，极大减小需要识别的视频帧数量。从而显著提高超高清视频识别效率。另外，对每个镜头进行简化的场景识别，针对不同的场景设置不同的阈值，从而显著提高超高清视频识别准确率。

本发明的目的是通过以下技术方案来实现的：

一种基于镜头识别及场景识别的分布式超高清视频识别方法，包括：

1）将视频文件放在共享的文件服务器中，通过智能任务管理器添加任务；

2）智能任务管理器将任务拆分成镜头识别、场景识别及超高清视频识别三个一级子任务；

3）智能任务管理器自动将镜头识别任务分配到空闲的镜头识别服务器，识别视频文件中的镜头数量N和每一个镜头的位置，并将信息返回至智能任务管理器；

4）智能任务管理器调用N个场景识别服务器分别对视频文件中的单个镜头分别进行场景识别，并打上场景标签然后反馈给智能任务管理器；

5）智能任务管理器调用N个超高清视频识服务器进行超高清识别，并将所有单个镜头下的视频的识别结果返回至智能任务管理器；

6）智能任务管理器根据识别结果与一个总体的阈值做比较得到最终识别结果。

进一步的，所述场景标签包括白天场景、夜晚场景、快速运动场景和慢速运动场景及其组合。

进一步的，所述超高清识别是从镜头的起始、中间、结束3个位置处分别抽取连续的3帧以上的图像进行分析。

进一步的，所述分析的内容包括：亮度分析、色域分析、对比度分析、有效量化比特数分析、重复帧分析；各维度分析结果分别与各个维度的阈值作比较，得到该镜头的识别结果并反馈给智能任务管理器。

进一步的，不同场景下，所述阈值取值不同。

进一步的，所述夜晚场景下亮度的阈值范围相较于白天场景需要调低；慢速运动场景相较于快速运动场景，重复帧识别的容忍度阈值需要调小。

进一步的，同一个镜头里的视频帧要么都是要么都不是超高清图像。

一种基于镜头识别及场景识别的分布式超高清视频识别系统，该系统包括：

数据共享服务器，用于录入或加入待分析的视频文件；

与数据共享服务器连接的智能任务管理器，用于调取相应的视频文件进行镜头识别、场景识别及超高清视频识别；

与智能任务管理器连接的至少一个镜头识别服务器，用于实现视频文件的镜头识别，并将识别结果返回至智能任务管理器；

与智能任务管理器连接的多个场景识别服务器，用于实现各单个镜头视频文件的场景识别，并将识别结果返回至智能任务管理器；

与智能任务管理器连接的多个超高清视频识服务器，用于实现各单个镜头下的视频的超高清识别，并将识别结果返回至智能任务管理器。

进一步的，系统设置有镜头识别服务器的扩展接口，可增加相应的镜头识别服务器。

本发明的有益效果是：本方案采用多线程并行运行的方式对视频文件进行镜头识别、场景识别及超高清视频识别，同时在得到多个单个镜头下的视频后，利用多个服务器同时进行，例如10个分片采用10个服务器识别，则相较于传统的单个视频识别速度提升了10倍。对单个分片（一个完整镜头）进行抽样识别，减少需要识别的帧数，也极大提升了识别速度。例如，按每个镜头100帧计算，每个镜头只识别9帧，速度是全部识别的11倍。综上，提升速度可达100倍以上，扣除流程上的消耗，也至少能提升数十倍的速度。另外，结合场景识别还能提升识别的准确率。

具体实施方式

下面结合具体实施例进一步详细描述本发明的技术方案，但本发明的保护范围不局限于以下。

6）智能任务管理器根据识别结果一个总体的阈值做比较得到最终识别结果。

可选的，一种基于镜头识别及场景识别的分布式超高清视频识别方法，场景标签包括白天场景、夜晚场景、快速运动场景和慢速运动场景，最后得到的标签包括白天快速运动场景，白天慢速运动场景，夜晚快速运动场景和夜晚慢速运动场景四种情况。

可选的，一种基于镜头识别及场景识别的分布式超高清视频识别方法，超高清识别是从镜头的起始、中间、结束3个位置处分别抽取连续的3帧以上的图像进行分析。

可选的，一种基于镜头识别及场景识别的分布式超高清视频识别方法，分析的内容包括：亮度分析、色域分析、对比度分析、有效量化比特数分析、重复帧分析；各维度分析结果分别与各个维度的阈值作比较，得到该镜头的识别结果并反馈给智能任务管理器。

可选的，一种基于镜头识别及场景识别的分布式超高清视频识别方法，不同场景下，阈值取值不同。夜晚场景下亮度的阈值范围相较于白天场景需要调低；慢速运动场景相较于快速运动场景，重复帧识别的容忍度阈值需要调小。

可选的，一种基于镜头识别及场景识别的分布式超高清视频识别方法，同一个镜头里的视频帧要么都是要么都不是超高清图像，例如超过2/3的抽样帧被识别为超高清图像，则认定该镜头为超高清视频。

本发明还提供一种基于镜头识别及场景识别的分布式超高清视频识别系统，该系统包括：

数据共享服务器，用于录入或加入待分析的视频文件；

与智能任务管理器连接的视频拆条模块，根据场景识别结构对单个镜头视频文件进行拆条得到相应的单个镜头下的视频；

本系统识别过程如下：

1）将视频文件放在共享的文件服务器中，通过智能任务管理器添加任务。

2）智能任务管理器将任务拆分成“镜头识别”、“场景识别”及“超高清视频识别”三个一级子任务。

3）智能任务管理器自动将一级子任务“镜头识别”分配到空闲的镜头识别服务（镜头识别服务可动态扩展）。

4）镜头识别服务识别出所有N个镜头并将镜头的位置信息返回给智能任务管理器。

5）智能任务管理器利用镜头位置信息，将一级子任务“场景识别”拆分成N个二级子任务“单个镜头下的视频场景识别”，并分配给场景识别服务（场景识别服务可动态扩展）。

6）场景识别服务识别出镜头中的场景并打上场景标签然后反馈给智能任务管理器。由于夜晚场景与白天场景互斥，快速运动场景与慢速运动场景互斥，所以每个镜头有且只有两个场景标签，例如：可以是白天场景与快速运动场景，不可能是白天场景与夜晚场景。

7）智能任务管理器利用镜头位置信息及场景标签信息将一级子任务“超高清视频识别”拆分成N个二级子任务“单个镜头下的视频超高清视频识别”，并分配各个超高清视频识别服务（超高清视频识别服务可动态扩展）。

8）超高清视频识别服务从镜头的起始、中间、结束3个位置处分别抽取连续的3帧图像（抽3帧连续图像的目的是为了识别重复帧），对这3x3帧图像（若该镜头视频总帧数小于9帧则选择所有视频帧）做以下分析：

亮度分析；

色域分析；

对比度分析；

有效量化比特数分析；

重复帧分析；

9）把以上5个维度的分析结果分别与各个维度的阈值（不同的场景有不同的阈值）作比较，得到该镜头的识别结果并反馈给智能任务管理器。

智能任务管理器综合所有镜头的识别结果，与一个总体的阈值做比较得到最终识别结果。

以上仅是本发明的优选实施方式，应当理解本发明并非局限于本文所披露的形式，不应看作是对其他实施例的排除，而可用于各种其他组合、修改和环境，并能够在本文所述构想范围内，通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围，则都应在本发明所附权利要求的保护范围内。

Claims

1.一种基于镜头识别及场景识别的分布式超高清视频识别方法，其特征在于，包括：

1)将视频文件放在共享的文件服务器中，通过智能任务管理器添加任务；

2)智能任务管理器将任务拆分成镜头识别、场景识别及超高清视频识别三个一级子任务；

3)智能任务管理器自动将镜头识别任务分配到空闲的镜头识别服务器，识别视频文件中的镜头数量N和每一个镜头的位置，并将信息返回至智能任务管理器；

4)智能任务管理器调用N个场景识别服务器分别对视频文件中的单个镜头分别进行场景识别，并打上场景标签然后反馈给智能任务管理器；

5)智能任务管理器调用N个超高清视频识服务器进行超高清识别，并将所有单个镜头下的视频的识别结果返回至智能任务管理器；

6)智能任务管理器根据识别结果与一个总体的阈值做比较得到最终识别结果。

2.根据权利要求1所述的基于镜头识别及场景识别的分布式超高清视频识别方法，其特征在于，所述场景标签包括白天场景、夜晚场景、快速运动场景和慢速运动场景及其组合。

3.根据权利要求2所述的基于镜头识别及场景识别的分布式超高清视频识别方法，其特征在于，所述超高清识别是从镜头的起始、中间、结束3个位置处分别抽取连续的3帧以上的图像进行分析。

4.根据权利要求3所述的基于镜头识别及场景识别的分布式超高清视频识别方法，其特征在于，所述分析的内容包括：亮度分析、色域分析、对比度分析、有效量化比特数分析、重复帧分析；各维度分析结果分别与各个维度的阈值作比较，得到该镜头的识别结果并反馈给智能任务管理器。

5.根据权利要求4所述的基于镜头识别及场景识别的分布式超高清视频识别方法，其特征在于，不同场景下，所述阈值取值不同。

6.根据权利要求5所述的基于镜头识别及场景识别的分布式超高清视频识别方法，其特征在于，所述夜晚场景下亮度的阈值范围相较于白天场景需要调低；慢速运动场景相较于快速运动场景，重复帧识别的容忍度阈值需要调小。

7.根据权利要求1所述的基于镜头识别及场景识别的分布式超高清视频识别方法，其特征在于，同一个镜头里的视频帧要么都是要么都不是超高清图像。

8.一种基于镜头识别及场景识别的分布式超高清视频识别系统，用于实现权利要求1-7任一项所述的方法，其特征在于，该系统包括：

数据共享服务器，用于录入或加入待分析的视频文件；

9.根据权利要求8所述的基于镜头识别及场景识别的分布式超高清视频识别系统，其特征在于，系统设置有镜头识别服务器的扩展接口，可增加相应的镜头识别服务器。