CN112261440B - 基于镜头识别及场景识别的分布式超高清视频识别方法和系统 - Google Patents

基于镜头识别及场景识别的分布式超高清视频识别方法和系统 Download PDF

Info

Publication number
CN112261440B
CN112261440B CN202011175296.2A CN202011175296A CN112261440B CN 112261440 B CN112261440 B CN 112261440B CN 202011175296 A CN202011175296 A CN 202011175296A CN 112261440 B CN112261440 B CN 112261440B
Authority
CN
China
Prior art keywords
identification
scene
recognition
lens
task manager
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011175296.2A
Other languages
English (en)
Other versions
CN112261440A (zh
Inventor
代林东
沈余银
余军
宋升�
刘盾
唐学怡
黄信云
朱俊杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Chinamcloud Technology Co ltd
Original Assignee
Chengdu Chinamcloud Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Chinamcloud Technology Co ltd filed Critical Chengdu Chinamcloud Technology Co ltd
Priority to CN202011175296.2A priority Critical patent/CN112261440B/zh
Publication of CN112261440A publication Critical patent/CN112261440A/zh
Application granted granted Critical
Publication of CN112261440B publication Critical patent/CN112261440B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

本发明涉及基于镜头识别及场景识别的分布式超高清视频识别方法和系统,采用镜头/场景识别技术拆分视频以实现并发超高清识别。识别每个镜头之前先经抽样算法抽样,极大减小需要识别的视频帧数量。从而显著提高超高清视频识别效率。另外,对每个镜头进行简化的场景识别,针对不同的场景设置不同的阈值,从而显著提高超高清视频识别准确率。

Description

基于镜头识别及场景识别的分布式超高清视频识别方法和 系统
技术领域
本发明涉及超高清视频识别技术,具体涉及一种基于镜头识别及场景识别的分布式超高清视频识别方法和系统。
背景技术
目前正处于超高清视频产业发展的初期,市面上已经出现了少量超高清视频,但也有不少伪超高清视频。如何分辨真伪超高清视频呢。有学校或科研单位研发了一些识别真伪超高清视频的软件或者设备。但这些软件或设备大多采用单机逐帧识别,耗时极长,而且准确率不高,没有实用价值。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于镜头识别及场景识别的分布式超高清视频识别方法和系统,采用镜头/场景识别技术拆分视频以实现并发超高清识别。识别每个镜头之前先经抽样算法抽样,极大减小需要识别的视频帧数量。从而显著提高超高清视频识别效率。另外,对每个镜头进行简化的场景识别,针对不同的场景设置不同的阈值,从而显著提高超高清视频识别准确率。
本发明的目的是通过以下技术方案来实现的:
一种基于镜头识别及场景识别的分布式超高清视频识别方法,包括:
1)将视频文件放在共享的文件服务器中,通过智能任务管理器添加任务;
2)智能任务管理器将任务拆分成镜头识别、场景识别及超高清视频识别三个一级子任务;
3)智能任务管理器自动将镜头识别任务分配到空闲的镜头识别服务器,识别视频文件中的镜头数量N和每一个镜头的位置,并将信息返回至智能任务管理器;
4)智能任务管理器调用N个场景识别服务器分别对视频文件中的单个镜头分别进行场景识别,并打上场景标签然后反馈给智能任务管理器;
5)智能任务管理器调用N个超高清视频识服务器进行超高清识别,并将所有单个镜头下的视频的识别结果返回至智能任务管理器;
6)智能任务管理器根据识别结果与一个总体的阈值做比较得到最终识别结果。
进一步的,所述场景标签包括白天场景、夜晚场景、快速运动场景和慢速运动场景及其组合。
进一步的,所述超高清识别是从镜头的起始、中间、结束3个位置处分别抽取连续的3帧以上的图像进行分析。
进一步的,所述分析的内容包括:亮度分析、色域分析、对比度分析、有效量化比特数分析、重复帧分析;各维度分析结果分别与各个维度的阈值作比较,得到该镜头的识别结果并反馈给智能任务管理器。
进一步的,不同场景下,所述阈值取值不同。
进一步的,所述夜晚场景下亮度的阈值范围相较于白天场景需要调低;慢速运动场景相较于快速运动场景,重复帧识别的容忍度阈值需要调小。
进一步的,同一个镜头里的视频帧要么都是要么都不是超高清图像。
一种基于镜头识别及场景识别的分布式超高清视频识别系统,该系统包括:
数据共享服务器,用于录入或加入待分析的视频文件;
与数据共享服务器连接的智能任务管理器,用于调取相应的视频文件进行镜头识别、场景识别及超高清视频识别;
与智能任务管理器连接的至少一个镜头识别服务器,用于实现视频文件的镜头识别,并将识别结果返回至智能任务管理器;
与智能任务管理器连接的多个场景识别服务器,用于实现各单个镜头视频文件的场景识别,并将识别结果返回至智能任务管理器;
与智能任务管理器连接的多个超高清视频识服务器,用于实现各单个镜头下的视频的超高清识别,并将识别结果返回至智能任务管理器。
进一步的,系统设置有镜头识别服务器的扩展接口,可增加相应的镜头识别服务器。
本发明的有益效果是:本方案采用多线程并行运行的方式对视频文件进行镜头识别、场景识别及超高清视频识别,同时在得到多个单个镜头下的视频后,利用多个服务器同时进行,例如10个分片采用10个服务器识别,则相较于传统的单个视频识别速度提升了10倍。对单个分片(一个完整镜头)进行抽样识别,减少需要识别的帧数,也极大提升了识别速度。例如,按每个镜头100帧计算,每个镜头只识别9帧,速度是全部识别的11倍。综上,提升速度可达100倍以上,扣除流程上的消耗,也至少能提升数十倍的速度。另外,结合场景识别还能提升识别的准确率。
具体实施方式
下面结合具体实施例进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下。
一种基于镜头识别及场景识别的分布式超高清视频识别方法,包括:
1)将视频文件放在共享的文件服务器中,通过智能任务管理器添加任务;
2)智能任务管理器将任务拆分成镜头识别、场景识别及超高清视频识别三个一级子任务;
3)智能任务管理器自动将镜头识别任务分配到空闲的镜头识别服务器,识别视频文件中的镜头数量N和每一个镜头的位置,并将信息返回至智能任务管理器;
4)智能任务管理器调用N个场景识别服务器分别对视频文件中的单个镜头分别进行场景识别,并打上场景标签然后反馈给智能任务管理器;
5)智能任务管理器调用N个超高清视频识服务器进行超高清识别,并将所有单个镜头下的视频的识别结果返回至智能任务管理器;
6)智能任务管理器根据识别结果一个总体的阈值做比较得到最终识别结果。
可选的,一种基于镜头识别及场景识别的分布式超高清视频识别方法,场景标签包括白天场景、夜晚场景、快速运动场景和慢速运动场景,最后得到的标签包括白天快速运动场景,白天慢速运动场景,夜晚快速运动场景和夜晚慢速运动场景四种情况。
可选的,一种基于镜头识别及场景识别的分布式超高清视频识别方法,超高清识别是从镜头的起始、中间、结束3个位置处分别抽取连续的3帧以上的图像进行分析。
可选的,一种基于镜头识别及场景识别的分布式超高清视频识别方法,分析的内容包括:亮度分析、色域分析、对比度分析、有效量化比特数分析、重复帧分析;各维度分析结果分别与各个维度的阈值作比较,得到该镜头的识别结果并反馈给智能任务管理器。
可选的,一种基于镜头识别及场景识别的分布式超高清视频识别方法,不同场景下,阈值取值不同。夜晚场景下亮度的阈值范围相较于白天场景需要调低;慢速运动场景相较于快速运动场景,重复帧识别的容忍度阈值需要调小。
可选的,一种基于镜头识别及场景识别的分布式超高清视频识别方法,同一个镜头里的视频帧要么都是要么都不是超高清图像,例如超过2/3的抽样帧被识别为超高清图像,则认定该镜头为超高清视频。
本发明还提供一种基于镜头识别及场景识别的分布式超高清视频识别系统,该系统包括:
数据共享服务器,用于录入或加入待分析的视频文件;
与数据共享服务器连接的智能任务管理器,用于调取相应的视频文件进行镜头识别、场景识别及超高清视频识别;
与智能任务管理器连接的至少一个镜头识别服务器,用于实现视频文件的镜头识别,并将识别结果返回至智能任务管理器;
与智能任务管理器连接的多个场景识别服务器,用于实现各单个镜头视频文件的场景识别,并将识别结果返回至智能任务管理器;
与智能任务管理器连接的视频拆条模块,根据场景识别结构对单个镜头视频文件进行拆条得到相应的单个镜头下的视频;
与智能任务管理器连接的多个超高清视频识服务器,用于实现各单个镜头下的视频的超高清识别,并将识别结果返回至智能任务管理器。
本系统识别过程如下:
1)将视频文件放在共享的文件服务器中,通过智能任务管理器添加任务。
2)智能任务管理器将任务拆分成“镜头识别”、“场景识别”及“超高清视频识别”三个一级子任务。
3)智能任务管理器自动将一级子任务“镜头识别”分配到空闲的镜头识别服务(镜头识别服务可动态扩展)。
4)镜头识别服务识别出所有N个镜头并将镜头的位置信息返回给智能任务管理器。
5)智能任务管理器利用镜头位置信息,将一级子任务“场景识别”拆分成N个二级子任务“单个镜头下的视频场景识别”,并分配给场景识别服务(场景识别服务可动态扩展)。
6)场景识别服务识别出镜头中的场景并打上场景标签然后反馈给智能任务管理器。由于夜晚场景与白天场景互斥,快速运动场景与慢速运动场景互斥,所以每个镜头有且只有两个场景标签,例如:可以是白天场景与快速运动场景,不可能是白天场景与夜晚场景。
7)智能任务管理器利用镜头位置信息及场景标签信息将一级子任务“超高清视频识别”拆分成N个二级子任务“单个镜头下的视频超高清视频识别”,并分配各个超高清视频识别服务(超高清视频识别服务可动态扩展)。
8)超高清视频识别服务从镜头的起始、中间、结束3个位置处分别抽取连续的3帧图像(抽3帧连续图像的目的是为了识别重复帧),对这3x3帧图像(若该镜头视频总帧数小于9帧则选择所有视频帧)做以下分析:
亮度分析;
色域分析;
对比度分析;
有效量化比特数分析;
重复帧分析;
9)把以上5个维度的分析结果分别与各个维度的阈值(不同的场景有不同的阈值)作比较,得到该镜头的识别结果并反馈给智能任务管理器。
智能任务管理器综合所有镜头的识别结果,与一个总体的阈值做比较得到最终识别结果。
以上仅是本发明的优选实施方式,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

Claims (9)

1.一种基于镜头识别及场景识别的分布式超高清视频识别方法,其特征在于,包括:
1)将视频文件放在共享的文件服务器中,通过智能任务管理器添加任务;
2)智能任务管理器将任务拆分成镜头识别、场景识别及超高清视频识别三个一级子任务;
3)智能任务管理器自动将镜头识别任务分配到空闲的镜头识别服务器,识别视频文件中的镜头数量N和每一个镜头的位置,并将信息返回至智能任务管理器;
4)智能任务管理器调用N个场景识别服务器分别对视频文件中的单个镜头分别进行场景识别,并打上场景标签然后反馈给智能任务管理器;
5)智能任务管理器调用N个超高清视频识服务器进行超高清识别,并将所有单个镜头下的视频的识别结果返回至智能任务管理器;
6)智能任务管理器根据识别结果与一个总体的阈值做比较得到最终识别结果。
2.根据权利要求1所述的基于镜头识别及场景识别的分布式超高清视频识别方法,其特征在于,所述场景标签包括白天场景、夜晚场景、快速运动场景和慢速运动场景及其组合。
3.根据权利要求2所述的基于镜头识别及场景识别的分布式超高清视频识别方法,其特征在于,所述超高清识别是从镜头的起始、中间、结束3个位置处分别抽取连续的3帧以上的图像进行分析。
4.根据权利要求3所述的基于镜头识别及场景识别的分布式超高清视频识别方法,其特征在于,所述分析的内容包括:亮度分析、色域分析、对比度分析、有效量化比特数分析、重复帧分析;各维度分析结果分别与各个维度的阈值作比较,得到该镜头的识别结果并反馈给智能任务管理器。
5.根据权利要求4所述的基于镜头识别及场景识别的分布式超高清视频识别方法,其特征在于,不同场景下,所述阈值取值不同。
6.根据权利要求5所述的基于镜头识别及场景识别的分布式超高清视频识别方法,其特征在于,所述夜晚场景下亮度的阈值范围相较于白天场景需要调低;慢速运动场景相较于快速运动场景,重复帧识别的容忍度阈值需要调小。
7.根据权利要求1所述的基于镜头识别及场景识别的分布式超高清视频识别方法,其特征在于,同一个镜头里的视频帧要么都是要么都不是超高清图像。
8.一种基于镜头识别及场景识别的分布式超高清视频识别系统,用于实现权利要求1-7任一项所述的方法,其特征在于,该系统包括:
数据共享服务器,用于录入或加入待分析的视频文件;
与数据共享服务器连接的智能任务管理器,用于调取相应的视频文件进行镜头识别、场景识别及超高清视频识别;
与智能任务管理器连接的至少一个镜头识别服务器,用于实现视频文件的镜头识别,并将识别结果返回至智能任务管理器;
与智能任务管理器连接的多个场景识别服务器,用于实现各单个镜头视频文件的场景识别,并将识别结果返回至智能任务管理器;
与智能任务管理器连接的多个超高清视频识服务器,用于实现各单个镜头下的视频的超高清识别,并将识别结果返回至智能任务管理器。
9.根据权利要求8所述的基于镜头识别及场景识别的分布式超高清视频识别系统,其特征在于,系统设置有镜头识别服务器的扩展接口,可增加相应的镜头识别服务器。
CN202011175296.2A 2020-10-28 2020-10-28 基于镜头识别及场景识别的分布式超高清视频识别方法和系统 Active CN112261440B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011175296.2A CN112261440B (zh) 2020-10-28 2020-10-28 基于镜头识别及场景识别的分布式超高清视频识别方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011175296.2A CN112261440B (zh) 2020-10-28 2020-10-28 基于镜头识别及场景识别的分布式超高清视频识别方法和系统

Publications (2)

Publication Number Publication Date
CN112261440A CN112261440A (zh) 2021-01-22
CN112261440B true CN112261440B (zh) 2022-11-25

Family

ID=74262221

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011175296.2A Active CN112261440B (zh) 2020-10-28 2020-10-28 基于镜头识别及场景识别的分布式超高清视频识别方法和系统

Country Status (1)

Country Link
CN (1) CN112261440B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN204498254U (zh) * 2015-02-08 2015-07-22 天津艾思科尔科技有限公司 监控场景下基于双目视觉的人脸识别装置
CN107590150A (zh) * 2016-07-07 2018-01-16 北京新岸线网络技术有限公司 基于关键帧的视频分析实现方法及装置
WO2018112722A1 (zh) * 2016-12-20 2018-06-28 深圳中兴力维技术有限公司 一种视频巡检方法及其系统
CN110807389A (zh) * 2019-10-25 2020-02-18 深圳亿络科技有限公司 基于5g传输的大场景视频监控方法、装置以及服务器

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN204498254U (zh) * 2015-02-08 2015-07-22 天津艾思科尔科技有限公司 监控场景下基于双目视觉的人脸识别装置
CN107590150A (zh) * 2016-07-07 2018-01-16 北京新岸线网络技术有限公司 基于关键帧的视频分析实现方法及装置
WO2018112722A1 (zh) * 2016-12-20 2018-06-28 深圳中兴力维技术有限公司 一种视频巡检方法及其系统
CN110807389A (zh) * 2019-10-25 2020-02-18 深圳亿络科技有限公司 基于5g传输的大场景视频监控方法、装置以及服务器

Also Published As

Publication number Publication date
CN112261440A (zh) 2021-01-22

Similar Documents

Publication Publication Date Title
US11080331B2 (en) Systems and methods for addressing a media database using distance associative hashing
CA2906199C (en) Systems and methods for addressing a media database using distance associative hashing
JP2702647B2 (ja) 放送セグメントの連続パターン認識装置の使用方法
CN109769115B (zh) 一种优化智能视频分析性能的方法、装置和设备
CN111669612B (zh) 基于直播的信息投放方法、装置和计算机可读存储介质
US10057644B1 (en) Video asset classification
CN110087042B (zh) 一种实时同步视频流和元数据的人脸抓拍方法及系统
CN111585684B (zh) 面向联网监控视频分析的多路摄像头时间对齐方法与系统
CN107527045A (zh) 一种面向多路视频的人体行为事件实时分析方法
US20140099023A1 (en) Search method for video clip
CN106488257A (zh) 一种视频文件索引信息的生成方法和设备
CN112261440B (zh) 基于镜头识别及场景识别的分布式超高清视频识别方法和系统
KR101296318B1 (ko) 적응적 블록 분할에 의한 객체 추적 장치 및 방법
US10321160B2 (en) Compressing multiple video files using localized camera meta data
EP2345978B1 (en) Detection of flash illuminated scenes in video clips and related ranking of video clips
Qi et al. Gpu-accelerated key frame analysis for face detection in video
Ouyang et al. The comparison and analysis of extracting video key frame
Tang et al. Fast background subtraction using improved GMM and graph cut
Song et al. Aberrance-aware gradient-sensitive attentions for scene recognition with RGB-D videos
GB2612707A (en) Reducing resources costs in visual recognition
CN116863408B (zh) 基于监控摄像头ai算法的并行加速和动态调度实现方法
CN111914625B (zh) 基于检测器与跟踪器数据关联的多目标车辆跟踪装置
Lu et al. Two-step pedestrian searching method based on Lab color space
Kovačev et al. Parallelization of the mixture of gaussians model for motion detection on the GPU
CN107480617B (zh) 一种肤色检测自适应单位分析方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant