CN101382998A - 视频场景切换检测装置及方法 - Google Patents

视频场景切换检测装置及方法 Download PDF

Info

Publication number
CN101382998A
CN101382998A CNA2008101185349A CN200810118534A CN101382998A CN 101382998 A CN101382998 A CN 101382998A CN A2008101185349 A CNA2008101185349 A CN A2008101185349A CN 200810118534 A CN200810118534 A CN 200810118534A CN 101382998 A CN101382998 A CN 101382998A
Authority
CN
China
Prior art keywords
scene
frame
gradual
wavelet transformation
video scene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008101185349A
Other languages
English (en)
Other versions
CN101382998B (zh
Inventor
李智
刘贵忠
钱学明
杨锦春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Huawei Cloud Computing Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd, Xian Jiaotong University filed Critical Huawei Technologies Co Ltd
Priority to CN200810118534A priority Critical patent/CN101382998B/zh
Publication of CN101382998A publication Critical patent/CN101382998A/zh
Application granted granted Critical
Publication of CN101382998B publication Critical patent/CN101382998B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种视频场景切换检测装置及方法,装置包括:特征提取单元及场景切换检测单元;方法包括:通过三维小波变换提取视频场景中各帧的高频子带系数的变化程度特征VH;根据所述VH检测场景切换。通过利用视频场景中各帧的高频子带系数的变化程度特征VH检测场景切换,消除了亮度变化对场景切换检测的影响,大大提高了检测场景切换的准确率。

Description

视频场景切换检测装置及方法
技术领域
本发明涉及视频序列分析技术,尤其涉及一种视频场景切换检测装置及方法。
背景技术
随着通信技术的迅速发展以及多媒体视频数量的快速增多,产生了视频摘要、视频检索、视频管理等技术。这些技术主要通过对视频序列进行视频场景切换检测等有效分析来实现。
视频序列中的场景是表示一个摄像机拍摄的一系列连续帧,描述了一个事件或者连续的物体动作。场景切换是指两个场景之间发生了变化,视频中一段连续帧图象产生中断。场景切换通常由影片摄像机的切换或者是影片编辑方法引起,分为突变和缓变两种。
场景突变(Cut)是指从一个场景到另一个场景发生突然变化,在这两个场景之间存在明显的过渡边界。在视频编辑中,通常用这种剪辑方式来表达视频内容转变以及注意力的转移。
场景缓变一般由视频编辑方法引起,是指从一个场景缓慢地变成另一个场景,其切换相对平滑而且过渡也相对较为缓慢。在视频编辑中通常用这种手法来刻画人物的内心世界等。例如渐变黑是电影制作方法中常用于表达一个场景或者某个特殊故事情节的结束。场景缓变主要包括淡入淡出(Fadein/out)和消溶(Dissolve)。淡入是从一个单色帧开始慢慢的过渡到一个画面,淡出是从一个画面慢慢地过渡到一个单色帧;消融是连接两个场景,其中一个场景淡入的同时另一个场景淡出,是两个场景的叠加。
场景切换检测可以是对场景突变的检测,也可以是对场景缓变的检测。
目前,场景突变检测主要根据同一场景内的相邻帧相似度较高,而在发生场景突变时,相邻帧的相似性较低来检测场景突变。检测方法包括像素差分检测方法和像素直方图检测方法。其中,像素差分检测方法对相邻帧之间的像素与像素的差值求和,如果此值大于一个阈值,则说明在这两个帧之间发生了镜头切换。如中国第99813804号专利申请《一种高清晰度电视编码器中检测场景改变与调节画面编码类型的方法与装置》,就是利用相同位置的像素变化的统计量来进行场景突变的检测的。像素直方图检测方法通过测量相邻帧之间的颜色直方图距离检测场景是否发生缓变。检测依据是拍摄对象运动时几乎不引起直方图差别。如中国第200610061437号专利申请《一种场景切换的检测方法及其检测系统》,首先对当前帧和前一帧进行运动估计,筛选场景切换候选帧,然后对当前帧和前一帧进行直方图比较,筛选出真正的场景切换帧。
场景缓变由于相邻帧之间的特征差值很小,很难用单个的阈值来检测,并且,逐渐改变的场景缓变很难从时间上或空间上分离开,很难区分场景缓变和运动场景。因此,场景缓变检测比场景突变检测更困难。
场景缓变检测方法有Zabih方法和RA方法。Zabih方法主要基于边缘特征(R.Zabih,J.Miller,and K.Mai,“A feature-based algorithm fordetecting and classifying scene breaks,”in Proc.ACM Multimedia,SanFrancisco,pp.189-200,Nov.1995),即,首先将每帧进行Canny算子的边缘检测;其次将边缘检测的结果进行膨胀处理;然后统计边缘的变换率,主要包括新出现边缘和消失边缘;最后利用它们改变的程度来达到场景缓变检测的目的。
RA方法即一种基于变换帧差(DFD)的方法(R.A.Joyce,and B.Liu,“Temporal segmentation of video using frame and histogram space”,IEEETrans.Multimedia,vol.8,pp.130-140,Feb.2006)。首先求第K-L帧和第K帧的像素值差;其次求第K帧和第K+L帧的像素值差;然后利用两个帧差求相关性,最后根据相关性进行场景缓变中淡入淡出和消融的检测。
发明人在实现本发明的过程中,发现现有技术至少存在以下缺陷:场景突变检测方法只能检测场景突变,并且受亮度的突然变化影响,无法区分闪光与场景突变,需要消除闪光(Flashlight)的影响才能对场景突变进行准确检测。但是对新闻视频进行场景突变检测,由于新闻中的闪光本身对新闻视频中故事的分类和浏览也提供着重要的提示信息,例如闪光总是与采访镜头或者重要的国际国内新闻报道相关,因此,对闪光进行检测和确认有助于新闻视频内容的理解和故事单元的分类,而场景突变检测方法由于无法区分闪光与场景突变,而无法实现闪光检测。并且,像素差分检测方法对镜头移动十分敏感;像素差分检测方法和像素直方图检测方法不能检测场景缓变。场景缓变检测方法受运动帧的影响较大,由于运动帧容易引起一些新出现边缘和消失边缘的误判断,因而检测效果较差;并且,RA方法无法区分淡入淡出和消融。如分别使用Zabih方法、RA方法对两个业界公知的缓变场景比较多的视频序列culture序列(共44145帧)、eyeexam序列(共40735帧)进行检测,检测结果如表1、表2所示。
表1 Zabih方法的实验结果
Figure A200810118534D00111
表2 RA方法的实验结果
其中,Nc为正确检测数目,Nm为漏检测数目,Nf为错误检测数目,Pre为查全率,Ppre为准确率。由表1、表2可知,场景缓变检测方法不能精确的检测出场景缓变。
发明内容
本发明实施例提出一种视频场景切换检测装置及方法,以提高场景切换检测的准确率。
本发明实施例提供了一种视频场景切换检测装置,包括:
特征提取单元,用于通过三维小波变换提取视频场景中各帧的高频子带系数的变化程度特征VH
场景切换检测单元,用于根据所述VH检测场景切换。
本发明实施例还提供了一种视频场景切换检测方法,包括:
通过三维小波变换提取视频场景中各帧的高频子带系数的变化程度特征VH
根据所述VH检测场景切换。
上述实施例通过利用视频场景中各帧的高频子带系数的变化程度特征VH检测场景切换,消除了亮度变化对场景切换检测的影响,大大提高了检测场景切换的准确率。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为本发明视频场景切换检测装置实施例的结构示意图;
图2本发明视频场景切换检测装置实施例中特征提取单元的结构示意图;
图3为本发明视频场景切换检测方法实施例的流程图;
图4为本发明视频场景切换检测方法实施例中提取特征的流程图;
图5为本发明视频场景切换检测方法实施例中对8帧进行小波变换后的结构示意图;
图6为本发明视频场景切换检测方法实施例中获取最优SVM分类器的流程图。
具体实施方式
本发明实施例视频场景切换检测装置包括:特征提取单元和场景切换检测单元;其中,特征提取单元用于通过三维小波变换提取视频场景中各帧的高频子带系数的变化程度特征VH;场景切换检测单元用于根据所述VH检测场景切换。场景切换检测单元可仅检测场景突变,也可仅检测场景缓变,还可既检测场景突变又检测场景缓变。当场景切换检测单元可检测场景缓变时,特征提取单元还需要提取视频场景中各帧的另外两个特征:高频子带系数的总能量EH和低频子带系数的变化程度DL。特征提取单元提取取视频场景中各帧的特征时,假设获取当前帧的特征,则可通过对当前帧及其前2N-1帧共2N帧三维小波变换获取当前帧的特征,并依次通过2N帧三维小波变换获取当前帧的下一帧特征。其中,N=2,3,4...。
本实施例中,当仅实现场景突变检测时,视频场景切换检测装置通过场景切换检测单元利用视频场景中各帧的高频子带系数的变化程度特征VH检测场景突变,消除了亮度变化对场景突变检测的影响,大大提高了视频场景切换检测装置检测场景突变的准确率。当仅实现场景缓变检测时,视频场景切换检测装置利用小波变换获得的低频子带系数的变化程度VL检测场景缓变,消除了运动帧对于场景缓变检测的影响,大大提高了视频场景切换检测装置检测场景缓变的准确率。
图1为本发明视频场景切换检测装置实施例的结构示意图,本实施例中,视频场景切换检测装置包括:特征提取单元11、场景突变检测单元12及场景缓变检测单元13,既可检测场景突变又可检测场景缓变。假设N=3,特征提取单元11通过对当前输入第i帧及其之前的帧共连续8帧,进行三维小波变换,统计变换后的低频和高频系数得到三个特征VH(i)、EH(i)、DL(i)作为当前第i帧的三个特征。场景突变检测单元12利用其中的一个高频特征VH(i)进行场景突变的检测,包括场景突变和闪光的检测。场景缓变检测单元13利用VH(i)、EH(i)、DL(i)在支持向量机(SupportVector Machines,SVM)分类器中对第i帧进行分类,将视频场景中的各帧分为场景缓变帧和非场景缓变帧。SVM分类器将视频帧划分成场景缓变和非场景缓变帧,其中SVM分类器(Christopher J.C.Burges.“ATutorial on Support Vector Machines for Pattern Recognition”.DataMining and Knowledge Discovery,vol.2,pp:121-167,1998)的训练和分类原理是公知的。并且,场景缓变检测单元13还可利用一个低频特征DL(i)将场景缓变中的淡入淡出和消融加以区分。
本实施例中,场景突变检测单元12与场景缓变检测单元13可分离执行。基于三维小波变换的特征提取单元11和场景突变检测单元12可单独组成场景突变和闪光检测系统,这种情况下,特征提取单元11可只提取特征VH;基于三维小波变换的特征提取单元11和场景缓变检测单元13可单独组成场景缓变检测系统。
本实施例中,视频场景切换检测装置不仅通过利用小波变换获得的高频子带系数的变化程度VH检测场景突变,能够提高检测场景突变的准确率。并且,视频场景切换检测装置还利用小波变换获得的低频子带系数的变化程度VL检测场景缓变,能够提高检测场景缓变的准确率。
图2本发明视频场景切换检测装置实施例中特征提取单元的结构示意图,特征提取单元11包括缓存子单元21、小波变换构造子单元22、小波变换子单元23、提取子单元24及遍历子单元25。本实施例中,仍然假设N=3,其中,缓存子单元21用于缓存所述视频场景中当前帧的前2N-1帧即7帧图像。小波变换构造子单元22用于构造23帧三维3级小波变换结构,以保证三维小波变换固定对当前输入第i帧及其前面连续7帧,也就是说固定对从第i-7帧到第i帧的共8帧图象进行三维小波变换。小波变换子单元23用于对当前第i帧及前23-1帧进行三维3级小波变换,得到高频子带的空间系数值;即:首先,小波变换子单元23对每一帧图象进行二维“9/7”小波变换,变换级数为N级即3级;再对已进行二维空间小波变换后的8帧图象,在同一个位置上的点在时间轴上进行一维的“Haar”小波变换,级数同二维“9/7”小波变换,也为3级。提取子单元24用于对所述高频子带的空间系数值进行统计,得到所述当前帧的VH(i);也就是说,对三维小波变换后的系数进行统计,得到三个特征,分别为VH(i)、EH(i)及DL(i)。这三个特征表示当前输入第i帧的三个特征,是当前第i帧与其相邻帧之间的相似性的度量。遍历子单元25用于判断所述视频场景中各帧是否均通过小波变换得到VH。在所述视频场景中还存在帧未提取VH的情况下,则小波变换子单元23接着对当前第i帧的下一帧i+1及其前7帧共8个连续帧进行小波变换,提取子单元24提取第i+1帧的高频子带系数的变化程度特征VH(i+1)。从而获得了将所述视频场景中各帧的高频子带系数的变化程度特征VH。其中,小波变换子单元23可包括:两维变换模块及一维变换模块,两维变换模块对8帧图像进行两维9/7基3级小波变换;一维变换模块对经过两维变换模块变换的8帧进行一维Haar基3级小波变换。
上述实施例中,场景突变检测单元12可包括:差分处理子单元及突变检测子单元。其中,差分处理子单元对所述VH进行一阶差分处理,得到diff(i)=|VH(i)-VH(i-1)|;突变检测子单元用于通过公式
diff(i+k)>T,(k=0,1,2,...,n)
MeanD MaxD > 0.7
及公式
cut ; if n = 2 N - 1 flashlights ; if n > 2 N - 1
判断所述视频场景中是否存在场景突变或多帧闪光;其中,所述T为门限值,可为800~1200; MeanD = Σ k = 0 n diff ( i + k ) n + 1 ; MaxD为diff(i+k)中的最大值;cut表示场景突变;flashlights表示2N帧内存在多帧闪光。
场景突变检测单元还可包括:一帧闪光子单元,用于判断diff(i+k)是否满足公式
diff(i+k)>T,(k=0,2N)(1)
diff(i+k)<T,(k=1~2N—1)(2)
及公式
MeanD MaxD < 0.5 - - - ( 3 )
检测所述视频场景中是否存在一帧闪光。即,在满足公式(1)、公式(2)及公式(3)的情况下,第i帧为闪光。
本实施例中,视频场景切换检测装置通过场景突变检测单元不仅能够准确地检测场景突变,还能够检测到多帧闪光、一帧闪光,进一步提高了视频场景切换检测装置的性能。
上述可进行场景缓变检测的视频场景切换检测装置实施例中,场景缓变检测单元可包括SVM分类器训练子单元及检测子单元。SVM分类器训练子单元用于利用所述VH、EH及DL获得最优的SVM分类器。检测子单元利用SVM分类器训练子单元获取的最优SVM分类器对所述视频场景中的各帧进行场景缓变检测,得到检测结果:
f ( i ) = 1 , yes - 1 , no
其中,f(i)代表第i帧进行场景缓变检测的结果,yes表示第i帧为场景缓变,no表示第i帧不是场景缓变。
场景缓变检测单元13还可进一步包括滤波子单元及种类检测子单元,判断场景缓变属于淡入淡出还是消融。滤波子单元对所述检测结果进行半径为N的中值滤波,滤除误检帧,得到从时刻t1到时刻t2的一段场景缓变的持续帧;种类检测子单元通过公式
S ( t 1 ~ t 2 ) = dissolve , min ( D L ( i ) ) > T fd fade , min ( D L ( i ) ) < T fd (t1<i<t2)
判断对得到的所述持续帧的场景缓变种类;其中,S(t1~t2)表示从所述持续帧为场景缓变,dissolve表示消融,fade表示淡入淡出,Tfd为门限值,可取0.8~0.95。
上述实施例中,视频场景切换检测装置通过场景缓变检测单元不仅准确地检测场景缓变,还能够区分场景缓变中的淡入淡出和消融,更进一步的提高了视频场景切换检测装置的检测性能。
本发明视频场景切换检测方法实施例可通过上述装置实施例实现,包括:通过三维小波变换提取视频场景中各帧的高频子带系数的变化程度特征Vli;根据所述VH检测场景切换。其中,检测场景切换可仅检测场景突变,也可仅检测场景缓变,还可既检测场景突变又检测场景缓变。检测场景缓变的情况下,还需要提取各帧的EH、DL
图3为本发明视频场景切换检测方法实施例的流程图。本实施例既检测场景突变又检测场景缓变,包括:
步骤31、特征提取单元11提取待检测的视频场景中各帧的三个特征:VH、EH、DL。如图4所示,具体可包括:
步骤41、缓存与第i帧连续的前2N-1帧,当N=3时,缓存前7帧;
步骤42、构造2N帧三维小波变换结构,
步骤43、执行三维小波变换得到高、低频子带的系数值,以8帧三维小波变换为例,变换后的结构示意图如图5所示。其中,ck,l(x,y)代表小波变换后在时间方向上第k个、空间方向第l个子带在位置(x,y)的系数值。c5,l(x,y)、c6,l(x,y)、c7,l(x,y)、c8,l(x,y)为高频子带系数图象。
步骤44、提取子单元24分别对图4中高频和低频的子带进行统计,得到特征VH(i)、EH(i)、DL(i)。这三个代表当前输入第i帧的三个特征(其中i≥8),是当前第i帧与其相邻帧之间的相似性的度量。
其中,高频子带系数的变化程度VH(i)的计算方法为:
V H ( i ) = &Sigma; x &Sigma; y &Sigma; l = 1 10 ( c 5 , l ( x , y ) - c 6 , l ( x , y ) ) 2
+ &Sigma; x &Sigma; y &Sigma; l = 1 10 ( c 6 , l ( x , y ) - c 7 , l ( x , y ) ) 2 + &Sigma; x &Sigma; y &Sigma; l = 1 10 ( c 7 , l ( x , y ) - c 8 , l ( x , y ) ) 2
高频子带系数的总能量EH(i)的计算方法为:
E H ( i ) = &Sigma; x &Sigma; y ( &Sigma; k = 5 8 &Sigma; l = 8 10 | c k , 1 ( x , y ) | )
低频子带系数的变化程度DL(i)的计算方法为:
D L ( i ) = &Sigma; x &Sigma; y | c 1,1 ( x , y ) | - &Sigma; x &Sigma; y | c 2,1 ( x , y ) | &Sigma; x &Sigma; y | c 1,1 ( x , y ) |
步骤45、遍历子单元25判断整个视频序列是否都完成了三维小波特征提取,若否,则输入下一帧,执行步骤43;若是,则结束特征提取。
步骤32、场景突变检测单元12根据高频子带系数的变化程度VH(i)来检测场景突变和闪光。首先,对相邻帧的特征VH按照如下公式得到一阶差分处理得到:
diff(i)=|VH(i)-VH(i-1)|
然后,判断“场景突变”或“短时间内有多帧闪光”,如满足以下两个条件:
1)diff(i+k)>T,(k=0,1,2...n)
2) MeanD MaxD > 0.8
本实施例中,T取1000;
如果n=2N-1,则第i帧为“场景突变”;
如果n>2N-1,则第i帧到第i+n帧之内发生了“多帧闪光”。
还可进一步判断“短时间内只有一帧闪光”,即判断diff(i+k)是否满足以下三个条件:
1)diff(i+k)>T,(k=0,2N)
2)diff(i+k)<T,(k=1,2,3...2N-1)
3) MeanD MaxD < 0.4
若同时满足,则第i帧为闪光。
步骤33、场景缓变检测单元13检测场景缓变。首先获得最优SVM分类器,如图6所示,获取过程包括:
步骤61、创建初始训练数据,选取一定数目的场景缓变视频片段中的帧,分别作为正面样本(+1类数据)和非场景缓变帧作为负面样本(-1类数据)。
步骤62、训练SVM分类器的参数,分别对上述所有的预选训练帧提取三维小波变换后的三个特征VH、EH及DL,用来训练SVM分类器。
步骤63、利用SVM分类器分类其它数据,如选取其它负面样本(只含有-1类数据),利用已经训练好的SVM分类器对其进行分类;
步骤64、判断分类结果是否有+1类数据,若判断的结果有+1类数据,则判断错误,执行步骤65;若判断的结果都是-1类数据,则判断正确,执行步骤66。
步骤65、如果判断错误,将被判断错误的帧作为负面样本(-1类数据)填充到原来的负面样本中,作为新的负面样本,执行步骤62,即,再执行步骤63,对SVM分类器的参数进行重新分类。再选取其他样本进行如此循环,直到没有错误分类的情况发生。
步骤66、如判断正确,则得到了最优的场景缓变检测的SVM分类器。
然后,用获取的最优SVM分类器检测各待检测的帧是否为场景缓变,得到检测结果。
若进一步判断检测结果为场景缓变的帧是淡入淡出还是消融,场景缓变检测还可进一步包括:
对整个视频序列中场景缓变帧的判断结果f(i)序列进行半径为N的中值滤波,通过中值滤波可以将误检帧等噪声滤除,得到场景缓变的一段持续帧。
利用低频子带系数特征DL(i)来分辨此段场景缓变是淡入淡出(Fade)或者消融(Dissolve)。判断任何一段场景缓变持续帧从t1到t2时刻是Fade或者Dissolve的方法如下:
S ( t 1 ~ t 2 ) = dissolve , min ( D L ( i ) ) > T fd fade , min ( D L ( i ) ) < T fd (t1<i<t2)
由上式可以看出,若在一段场景缓变的持续帧中所有的DL(i)>Tfd,则此场景缓变是由消融引起的;若在一段场景缓变持续帧中有一个DL(i)<Tfd,则此场景缓变是由淡入淡出引起的。其中Tfd可为0.93。
上述装置及方法实施例,通过基于小波变换对场景切换进行检测,大大提高了检测场景切换的准确率。为了详细说明上述装置及方法实施例检测视频场景突变和闪光检测的优越性,发明人用上述装置及方法实施例中的技术方案对两个业界公知的视频序列news1序列和culture序列作了检测试验。其中,news1序列共57461帧,包含了大量的突变和闪光;culture序列共44145帧。试验结果如表3所示。
表3 基于三维小波变换的视频突变和和闪光检测的实验结果
Figure A200810118534D00211
Figure A200810118534D00212
由表3可以看出,上述可进行场景突变检测的装置及方法实施例消除了闪光给场景突变检测带来的误检,对突变和闪光的检测都达到了比较好的效果。其中,Nc是正确检测数目,Nm是漏检测数目,Nf是错误检测数目,查全率Pre和准确率Ppre的定义如下:
Pre=Nc/(Nc+Nm)
Ppre=Nc/(Nc+Nf)
为了详细说明上述装置及方法实施例检测视频场景缓变检测的优越性,发明人用上述装置及方法实施例中的技术方案对culture序列以及另一个业界公知的缓变场景比较多的视频序列即eyeexam序列做了检测试验。其中,eyeexam序列共40735帧。试验结果如表4所示。
表4 基于三维小波变换的缓变检测的实验结果
Figure A200810118534D00221
Figure A200810118534D00222
由表3可以看出,上述可进行场景缓变检测的装置及方法实施例消除了运动帧给场景突变检测带来的误检,检测的准确率达到了80%以上,大大提高了场景缓变检测的精确性。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (23)

1、一种视频场景切换检测装置,其特征在于,包括:
特征提取单元,用于通过三维小波变换提取视频场景中各帧的高频子带系数的变化程度特征VH
场景切换检测单元,用于根据所述VH检测场景切换。
2、根据权利要求1所述的视频场景切换检测装置,其特征在于,所述特征提取单元包括:
缓存子单元,用于缓存所述视频场景中当前第i帧的前2N-1帧图像;
小波变换构造子单元,用于构造2N帧三维N级小波变换结构;
小波变换子单元,用于对所述当前帧及前2N-1帧进行三维N级小波变换,得到高频子带的空间系数值;
提取子单元,用于对所述高频子带的空间系数值进行统计,得到所述当前第i帧的高频子带系数的变化程度特征VH(i);
遍历子单元,用于判断所述视频场景中各帧是否均通过小波变换得到VH
所述小波变换子单元及提取子单元还用于在所述视频场景中还存在帧未提取VH的情况下,提取所述当前第i帧的下一帧第i+1帧的高频子带系数的变化程度特征VH(i+1)。
3、根据权利要求2所述的视频场景切换检测装置,其特征在于,所述小波变换子单元包括:
两维变换模块,用于对所述当前帧及前2N-1帧分别进行两维9/7基N级小波变换;
一维变换模块,用于对所述两维变换模块变换后的帧在同空间位置的点进行时间轴上的一维Haar基N级小波变换,得到所述高频子带的空间系数值。
4、根据权利要求1-3中任一项所述的视频场景切换检测装置,其特征在于,所述场景切换检测单元为场景突变检测单元和/或场景缓变检测单元;
所述场景突变检测单元用于根据所述VH检测场景突变或闪光;
所述场景缓变检测单元用于根据所述VH检测场景缓变。
5、根据权利要求4所述的视频场景切换检测装置,其特征在于,所述场景突变检测单元包括:
差分处理子单元,用于对所述VH进行一阶差分处理,得到diff(i)=|VH(i)-VH(i-1)|;
突变检测子单元,用于通过公式
diff(i+k)>T,(k=0,1,2,...,n)
MeanD MaxD > 0.7
及公式
cut ; if n = 2 N - 1 flashlights ; if n > 2 N - 1
判断所述视频场景中是否存在场景突变或多帧闪光;其中,所述T为门限值; MeanD = &Sigma; k = 0 n diff ( i + k ) n + 1 ; MaxD为diff(i+k)中的最大值;cut表示场景突变;flashlights表示2N帧内存在多帧闪光。
6、根据权利要求5所述的视频场景切换检测装置,其特征在于,所述T的取值范围为800~1200。
7、根据权利要求5所述的视频场景切换检测装置,其特征在于,所述场景突变检测单元还包括:
一帧闪光子单元,用于判断diff(i+k)是否满足公式
diff(i+k)>T,(k=0,2N)
diff(i+k)<T,(k=1~2N—1)
及公式
MeanD MaxD < 0.5
检测所述视频场景中2N帧内是否存在一帧闪光。
8、根据权利要求4所述的视频场景切换检测装置,其特征在于,所述场景切换检测单元包括所述场景缓变检测单元;
所述特征提取单元还用于通过三维小波变换提取所述视频场景中各帧的高频子带系数总能量EH和低频子带系数的变化程度DL
所述场景缓变检测单元包括:
支持向量机SVM分类器训练子单元,用于通过更新样本库得到最优的SVM分类器;
检测子单元,用于通过利用所述最优的SVM分类器对所述VH、EH、DL分类,检测场景缓变,得到检测结果。
9、根据权利要求8所述的视频场景切换检测装置,其特征在于,所述特征提取单元还用于通过构造8帧三维小波变换结构获取所述EH、DL
10、根据权利要求8所述的视频场景切换检测装置,其特征在于,所述场景缓变检测单元还包括:
滤波子单元,用于对所述检测结果进行半径为N的中值滤波,得到从时刻t1到时刻t2的一段场景缓变的持续帧;
种类检测子单元,用于通过公式
S ( t 1 ~ t 2 ) = dissolve , min ( D L ( i ) ) > T fd fade , min ( D L ( i ) ) < T fd ( t 1 < i < t 2 )
判断对得到的所述持续帧的场景缓变种类;其中,S(t1~t2)表示从所述持续帧为场景缓变,dissolve表示消融,fade表示淡入淡出,Tfd为门限值。
11、根据权利要求10所述的视频场景切换检测装置,其特征在于,所述Tfd的取值范围为0.8~0.95。
12、一种视频场景切换检测方法,其特征在于,包括:
通过三维小波变换提取视频场景中各帧的高频子带系数的变化程度特征VH
根据所述VH检测场景切换。
13、根据权利要求12所述的视频场景切换检测方法,其特征在于,通过三维小波变换提取视频场景中各帧的高频子带系数的变化程度特征VH包括:
缓存所述视频场景中当前第i帧的前2N-1帧图像;
构造2N帧三维N级小波变换结构;
对所述当前帧及前2N-1帧进行三维N级小波变换,得到高频子带的空间系数值;
对所述高频子带的空间系数值进行统计,得到所述当前帧的VH(i);
判断所述视频场景中各帧是否均通过小波变换得到VH
在所述视频场景中还存在帧未提取VH的情况下,继续对第i+1帧进行三维N级小波变换,并提取所述第i+1帧的VH(i+1),直至所述视频场景中的所有帧均通过小波变换得到各自的VH
14、根据权利要求13所述的视频场景切换检测方法,其特征在于,对所述当前帧及前2N-1帧进行三维N级小波变换,得到高频子带的空间系数值包括:
对所述当前帧及前2N-1帧分别进行两维9/7基N级小波变换;
对变换后的帧在同空间位置的点进行时间轴上的一维Haar基N级小波变换,得到所述高频子带的空间系数值。
15、根据权利要求12-14中任一项所述的视频场景切换检测方法,其特征在于,根据所述VH检测场景切换包括:场景突变检测和/或场景缓变检测;
所述场景突变检测包括根据所述VH检测场景突变或闪光;
所述场景缓变检测包括根据所述VH检测场景缓变。
16、根据权利要求15所述的视频场景切换检测方法,其特征在于,根据所述VH检测场景突变或闪光包括:
对所述VH进行一阶差分处理,得到diff(i)=|VH(i)-VH(i-1)|;
通过公式
diff(i+k)>T,(k=0,1,2,...,n)
MeanD MaxD > 0.7
及公式
cut ; if n = 2 N - 1 flashlights ; if n > 2 N - 1
判断所述视频场景中是否存在场景突变或多帧闪光;其中,所述T为门限值; MeanD = &Sigma; k = 0 n diff ( i + k ) n + 1 ; MaxD为diff(i+k)中的最大值;cut表示场景突变;flashlights表示2N帧内存在多帧闪光。
17、根据权利要求16所述的视频场景切换检测方法,其特征在于,所述T的取值范围为800~1200。
18、根据权利要求16所述的视频场景切换检测方法,其特征在于,根据所述VH检测场景突变或闪光还包括:
判断diff(i+k)是否满足公式
diff(i+k)>T,(k=0,2N)
diff(i+k)<T,(k=1~2N—1)
及公式
MeanD MaxD < 0.5
检测所述视频场景中2N帧内是否存在一帧闪光。
19、根据权利要求15所述的视频场景切换检测方法,其特征在于,根据所述VH检测场景切换包括所述场景缓变检测;
通过三维小波变换提取视频场景中各帧的高频子带系数的变化程度特征VH还包括:通过三维小波变换提取所述视频场景中各帧的高频子带系数总能量EH和低频子带系数的变化程度DL
根据所述VH检测场景缓变包括:
通过更新样本库得到最优的SVM分类器;
通过利用所述最优的SVM分类器对所述VH、EH及DL分类,检测场景缓变,得到检测结果。
20、根据权利要求19所述的视频场景切换检测方法,其特征在于,通过更新样本库得到最优的SVM分类器包括:
步骤1、通过三维小波变换提取选取样本的VH、EH及DL,用所述选取样本的VH、EH及DL训练SVM分类器;
步骤2、用经过训练的SVM分类器判断选取的样本;
步骤3、判断错误的情况下,将所述选取的样本填充到SVM分类器的样本库中;
步骤4、利用经过填充的样本库对SVM分类器的参数进行重新分类;
步骤5、用经过重新分类的SVM分类器判断再次选取的样本;
循环执行所述步骤3、步骤4、步骤5,直至SVM分类器判断正确,得到所述最优的SVM分类器。
21、根据权利要求19所述的视频场景切换检测方法,其特征在于,通过三维小波变换提取所述视频场景中各帧的高频子带系数总能量EH和低频子带系数的变化程度DL还包括:通过构造8帧三维小波变换结构获取所述VH、EH、DL
22、根据权利要求19所述的视频场景切换检测方法,其特征在于,根据所述VH检测场景缓变还包括:
对所述检测结果进行半径为N的中值滤波,得到从时刻t1到时刻t2的一段场景缓变的持续帧;
通过公式
S ( t 1 ~ t 2 ) = dissolve , min ( D L ( i ) ) > T fd fade , min ( D L ( i ) ) < T fd ( t 1 < i < t 2 )
判断对得到的所述持续帧的场景缓变种类;其中,S(t1~t2)表示从所述持续帧为场景缓变;dissolve表示消融,fade表示淡入淡出,Tfd为门限值。
23、根据权利要求22所述的视频场景切换检测方法,其特征在于,所述Tfd的取值范围为0.8~0.95。
CN200810118534A 2008-08-18 2008-08-18 视频场景切换检测装置及方法 Active CN101382998B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200810118534A CN101382998B (zh) 2008-08-18 2008-08-18 视频场景切换检测装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200810118534A CN101382998B (zh) 2008-08-18 2008-08-18 视频场景切换检测装置及方法

Publications (2)

Publication Number Publication Date
CN101382998A true CN101382998A (zh) 2009-03-11
CN101382998B CN101382998B (zh) 2012-09-05

Family

ID=40462832

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200810118534A Active CN101382998B (zh) 2008-08-18 2008-08-18 视频场景切换检测装置及方法

Country Status (1)

Country Link
CN (1) CN101382998B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102045556B (zh) * 2009-10-22 2012-10-31 杭州华三通信技术有限公司 一种在低带宽中场景切换视频图像的编码方法和装置
CN102769714A (zh) * 2012-03-26 2012-11-07 新奥特(北京)视频技术有限公司 一种消除闪光引起转场误报的方法
CN104811745A (zh) * 2015-04-28 2015-07-29 无锡天脉聚源传媒科技有限公司 一种视频内容的展示方法及装置
CN104822009A (zh) * 2015-04-14 2015-08-05 无锡天脉聚源传媒科技有限公司 一种视频场景变换识别的方法及装置
CN107222780A (zh) * 2017-06-23 2017-09-29 中国地质大学(武汉) 一种直播平台综合状态感知和内容实时监管方法及系统
CN108804980A (zh) * 2017-04-28 2018-11-13 合信息技术(北京)有限公司 视频场景切换检测方法及装置
CN109141365A (zh) * 2018-08-02 2019-01-04 孙仲碧 土壤修复状态监控方法
CN109977738A (zh) * 2017-12-28 2019-07-05 深圳Tcl新技术有限公司 一种视频场景分割判断方法、智能终端及存储介质
CN111488899A (zh) * 2019-01-29 2020-08-04 杭州海康威视数字技术股份有限公司 特征提取方法、装置、设备及可读存储介质
CN112291634A (zh) * 2019-07-25 2021-01-29 腾讯科技(深圳)有限公司 视频处理方法及装置

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102045556B (zh) * 2009-10-22 2012-10-31 杭州华三通信技术有限公司 一种在低带宽中场景切换视频图像的编码方法和装置
CN102769714A (zh) * 2012-03-26 2012-11-07 新奥特(北京)视频技术有限公司 一种消除闪光引起转场误报的方法
CN102769714B (zh) * 2012-03-26 2018-12-11 新奥特(北京)视频技术有限公司 一种消除闪光引起转场误报的方法
CN104822009A (zh) * 2015-04-14 2015-08-05 无锡天脉聚源传媒科技有限公司 一种视频场景变换识别的方法及装置
CN104822009B (zh) * 2015-04-14 2017-11-28 无锡天脉聚源传媒科技有限公司 一种视频场景变换识别的方法及装置
CN104811745A (zh) * 2015-04-28 2015-07-29 无锡天脉聚源传媒科技有限公司 一种视频内容的展示方法及装置
CN108804980A (zh) * 2017-04-28 2018-11-13 合信息技术(北京)有限公司 视频场景切换检测方法及装置
CN107222780A (zh) * 2017-06-23 2017-09-29 中国地质大学(武汉) 一种直播平台综合状态感知和内容实时监管方法及系统
CN107222780B (zh) * 2017-06-23 2020-11-27 中国地质大学(武汉) 一种直播平台综合状态感知和内容实时监管方法
CN109977738A (zh) * 2017-12-28 2019-07-05 深圳Tcl新技术有限公司 一种视频场景分割判断方法、智能终端及存储介质
CN109141365A (zh) * 2018-08-02 2019-01-04 孙仲碧 土壤修复状态监控方法
CN111488899A (zh) * 2019-01-29 2020-08-04 杭州海康威视数字技术股份有限公司 特征提取方法、装置、设备及可读存储介质
CN111488899B (zh) * 2019-01-29 2024-02-23 杭州海康威视数字技术股份有限公司 特征提取方法、装置、设备及可读存储介质
CN112291634A (zh) * 2019-07-25 2021-01-29 腾讯科技(深圳)有限公司 视频处理方法及装置

Also Published As

Publication number Publication date
CN101382998B (zh) 2012-09-05

Similar Documents

Publication Publication Date Title
CN101382998B (zh) 视频场景切换检测装置及方法
US8316301B2 (en) Apparatus, medium, and method segmenting video sequences based on topic
JP5420199B2 (ja) 映像解析装置、映像解析方法、ダイジェスト自動作成システム及びハイライト自動抽出システム
US20050228849A1 (en) Intelligent key-frame extraction from a video
US20120148149A1 (en) Video key frame extraction using sparse representation
KR101709085B1 (ko) 컨볼루션 신경망을 이용한 샷 경계 검출 방법 및 장치
CN103440640A (zh) 一种视频场景聚类及浏览方法
CN110795595A (zh) 基于边缘计算的视频结构化存储方法、装置、设备及介质
Oh et al. Content-based scene change detection and classification technique using background tracking
Chasanis et al. Simultaneous detection of abrupt cuts and dissolves in videos using support vector machines
Truong et al. Improved fade and dissolve detection for reliable video segmentation
Baber et al. Video segmentation into scenes using entropy and SURF
Bhargav et al. Deep learning as a tool for early cinema analysis
Maćkowiak et al. A complex system for football player detection in broadcasted video
CN111914682A (zh) 一种包含演示文稿的教学视频分割方法、装置及设备
KR101362768B1 (ko) 객체 검출 방법 및 장치
KR101822443B1 (ko) 샷 경계 및 자막을 이용한 동영상 축약 방법 및 처리 장치
Volkmer et al. Gradual transition detection using average frame similarity
Paliwal et al. A survey on various text detection and extraction techniques from videos and images
Zhu et al. Two-dimensional entropy model for video shot partitioning
Rozsa et al. TV News Database Indexing System with Video Structure Analysis, Representative Images Extractions and OCR for News Titles
Tapu et al. Video segmentation and structuring for indexing applications
Mitrović et al. Scene segmentation in artistic archive documentaries
Thomas et al. An energy minimization approach for automatic video shot and scene boundary detection
Li et al. A novel scene change detection algorithm based on the 3D wavelet transform

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220622

Address after: 550025 Huawei cloud data center, jiaoxinggong Road, Qianzhong Avenue, Gui'an New District, Guiyang City, Guizhou Province

Patentee after: Huawei Cloud Computing Technologies Co.,Ltd.

Patentee after: XI'AN JIAOTONG University

Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd.

Patentee before: XI'AN JIAOTONG University

TR01 Transfer of patent right