具体实施方式
本发明实施例视频场景切换检测装置包括:特征提取单元和场景切换检测单元;其中,特征提取单元用于通过三维小波变换提取视频场景中各帧的高频子带系数的变化程度特征VH;场景切换检测单元用于根据所述VH检测场景切换。场景切换检测单元可仅检测场景突变,也可仅检测场景缓变,还可既检测场景突变又检测场景缓变。当场景切换检测单元可检测场景缓变时,特征提取单元还需要提取视频场景中各帧的另外两个特征:高频子带系数的总能量EH和低频子带系数的变化程度DL。特征提取单元提取取视频场景中各帧的特征时,假设获取当前帧的特征,则可通过对当前帧及其前2N-1帧共2N帧三维小波变换获取当前帧的特征,并依次通过2N帧三维小波变换获取当前帧的下一帧特征。其中,N=2,3,4...。
本实施例中,当仅实现场景突变检测时,视频场景切换检测装置通过场景切换检测单元利用视频场景中各帧的高频子带系数的变化程度特征VH检测场景突变,消除了亮度变化对场景突变检测的影响,大大提高了视频场景切换检测装置检测场景突变的准确率。当仅实现场景缓变检测时,视频场景切换检测装置利用小波变换获得的低频子带系数的变化程度VL检测场景缓变,消除了运动帧对于场景缓变检测的影响,大大提高了视频场景切换检测装置检测场景缓变的准确率。
图1为本发明视频场景切换检测装置实施例的结构示意图,本实施例中,视频场景切换检测装置包括:特征提取单元11、场景突变检测单元12及场景缓变检测单元13,既可检测场景突变又可检测场景缓变。假设N=3,特征提取单元11通过对当前输入第i帧及其之前的帧共连续8帧,进行三维小波变换,统计变换后的低频和高频系数得到三个特征VH(i)、EH(i)、DL(i)作为当前第i帧的三个特征。场景突变检测单元12利用其中的一个高频特征VH(i)进行场景突变的检测,包括场景突变和闪光的检测。场景缓变检测单元13利用VH(i)、EH(i)、DL(i)在支持向量机(SupportVector Machines,SVM)分类器中对第i帧进行分类,将视频场景中的各帧分为场景缓变帧和非场景缓变帧。SVM分类器将视频帧划分成场景缓变和非场景缓变帧,其中SVM分类器(Christopher J.C.Burges.“ATutorial on Support Vector Machines for Pattern Recognition”.DataMining and Knowledge Discovery,vol.2,pp:121-167,1998)的训练和分类原理是公知的。并且,场景缓变检测单元13还可利用一个低频特征DL(i)将场景缓变中的淡入淡出和消融加以区分。
本实施例中,场景突变检测单元12与场景缓变检测单元13可分离执行。基于三维小波变换的特征提取单元11和场景突变检测单元12可单独组成场景突变和闪光检测系统,这种情况下,特征提取单元11可只提取特征VH;基于三维小波变换的特征提取单元11和场景缓变检测单元13可单独组成场景缓变检测系统。
本实施例中,视频场景切换检测装置不仅通过利用小波变换获得的高频子带系数的变化程度VH检测场景突变,能够提高检测场景突变的准确率。并且,视频场景切换检测装置还利用小波变换获得的低频子带系数的变化程度VL检测场景缓变,能够提高检测场景缓变的准确率。
图2本发明视频场景切换检测装置实施例中特征提取单元的结构示意图,特征提取单元11包括缓存子单元21、小波变换构造子单元22、小波变换子单元23、提取子单元24及遍历子单元25。本实施例中,仍然假设N=3,其中,缓存子单元21用于缓存所述视频场景中当前帧的前2N-1帧即7帧图像。小波变换构造子单元22用于构造23帧三维3级小波变换结构,以保证三维小波变换固定对当前输入第i帧及其前面连续7帧,也就是说固定对从第i-7帧到第i帧的共8帧图象进行三维小波变换。小波变换子单元23用于对当前第i帧及前23-1帧进行三维3级小波变换,得到高频子带的空间系数值;即:首先,小波变换子单元23对每一帧图象进行二维“9/7”小波变换,变换级数为N级即3级;再对已进行二维空间小波变换后的8帧图象,在同一个位置上的点在时间轴上进行一维的“Haar”小波变换,级数同二维“9/7”小波变换,也为3级。提取子单元24用于对所述高频子带的空间系数值进行统计,得到所述当前帧的VH(i);也就是说,对三维小波变换后的系数进行统计,得到三个特征,分别为VH(i)、EH(i)及DL(i)。这三个特征表示当前输入第i帧的三个特征,是当前第i帧与其相邻帧之间的相似性的度量。遍历子单元25用于判断所述视频场景中各帧是否均通过小波变换得到VH。在所述视频场景中还存在帧未提取VH的情况下,则小波变换子单元23接着对当前第i帧的下一帧i+1及其前7帧共8个连续帧进行小波变换,提取子单元24提取第i+1帧的高频子带系数的变化程度特征VH(i+1)。从而获得了将所述视频场景中各帧的高频子带系数的变化程度特征VH。其中,小波变换子单元23可包括:两维变换模块及一维变换模块,两维变换模块对8帧图像进行两维9/7基3级小波变换;一维变换模块对经过两维变换模块变换的8帧进行一维Haar基3级小波变换。
上述实施例中,场景突变检测单元12可包括:差分处理子单元及突变检测子单元。其中,差分处理子单元对所述VH进行一阶差分处理,得到diff(i)=|VH(i)-VH(i-1)|;突变检测子单元用于通过公式
diff(i+k)>T,(k=0,1,2,...,n)
及公式
判断所述视频场景中是否存在场景突变或多帧闪光;其中,所述T为门限值,可为800~1200; MaxD为diff(i+k)中的最大值;cut表示场景突变;flashlights表示2N帧内存在多帧闪光。
场景突变检测单元还可包括:一帧闪光子单元,用于判断diff(i+k)是否满足公式
diff(i+k)>T,(k=0,2N)(1)
diff(i+k)<T,(k=1~2N—1)(2)
及公式
检测所述视频场景中是否存在一帧闪光。即,在满足公式(1)、公式(2)及公式(3)的情况下,第i帧为闪光。
本实施例中,视频场景切换检测装置通过场景突变检测单元不仅能够准确地检测场景突变,还能够检测到多帧闪光、一帧闪光,进一步提高了视频场景切换检测装置的性能。
上述可进行场景缓变检测的视频场景切换检测装置实施例中,场景缓变检测单元可包括SVM分类器训练子单元及检测子单元。SVM分类器训练子单元用于利用所述VH、EH及DL获得最优的SVM分类器。检测子单元利用SVM分类器训练子单元获取的最优SVM分类器对所述视频场景中的各帧进行场景缓变检测,得到检测结果:
其中,f(i)代表第i帧进行场景缓变检测的结果,yes表示第i帧为场景缓变,no表示第i帧不是场景缓变。
场景缓变检测单元13还可进一步包括滤波子单元及种类检测子单元,判断场景缓变属于淡入淡出还是消融。滤波子单元对所述检测结果进行半径为N的中值滤波,滤除误检帧,得到从时刻t1到时刻t2的一段场景缓变的持续帧;种类检测子单元通过公式
(t1<i<t2)
判断对得到的所述持续帧的场景缓变种类;其中,S(t1~t2)表示从所述持续帧为场景缓变,dissolve表示消融,fade表示淡入淡出,Tfd为门限值,可取0.8~0.95。
上述实施例中,视频场景切换检测装置通过场景缓变检测单元不仅准确地检测场景缓变,还能够区分场景缓变中的淡入淡出和消融,更进一步的提高了视频场景切换检测装置的检测性能。
本发明视频场景切换检测方法实施例可通过上述装置实施例实现,包括:通过三维小波变换提取视频场景中各帧的高频子带系数的变化程度特征Vli;根据所述VH检测场景切换。其中,检测场景切换可仅检测场景突变,也可仅检测场景缓变,还可既检测场景突变又检测场景缓变。检测场景缓变的情况下,还需要提取各帧的EH、DL。
图3为本发明视频场景切换检测方法实施例的流程图。本实施例既检测场景突变又检测场景缓变,包括:
步骤31、特征提取单元11提取待检测的视频场景中各帧的三个特征:VH、EH、DL。如图4所示,具体可包括:
步骤41、缓存与第i帧连续的前2N-1帧,当N=3时,缓存前7帧;
步骤42、构造2N帧三维小波变换结构,
步骤43、执行三维小波变换得到高、低频子带的系数值,以8帧三维小波变换为例,变换后的结构示意图如图5所示。其中,ck,l(x,y)代表小波变换后在时间方向上第k个、空间方向第l个子带在位置(x,y)的系数值。c5,l(x,y)、c6,l(x,y)、c7,l(x,y)、c8,l(x,y)为高频子带系数图象。
步骤44、提取子单元24分别对图4中高频和低频的子带进行统计,得到特征VH(i)、EH(i)、DL(i)。这三个代表当前输入第i帧的三个特征(其中i≥8),是当前第i帧与其相邻帧之间的相似性的度量。
其中,高频子带系数的变化程度VH(i)的计算方法为:
高频子带系数的总能量EH(i)的计算方法为:
低频子带系数的变化程度DL(i)的计算方法为:
步骤45、遍历子单元25判断整个视频序列是否都完成了三维小波特征提取,若否,则输入下一帧,执行步骤43;若是,则结束特征提取。
步骤32、场景突变检测单元12根据高频子带系数的变化程度VH(i)来检测场景突变和闪光。首先,对相邻帧的特征VH按照如下公式得到一阶差分处理得到:
diff(i)=|VH(i)-VH(i-1)|
然后,判断“场景突变”或“短时间内有多帧闪光”,如满足以下两个条件:
1)diff(i+k)>T,(k=0,1,2...n)
2)
本实施例中,T取1000;
如果n=2N-1,则第i帧为“场景突变”;
如果n>2N-1,则第i帧到第i+n帧之内发生了“多帧闪光”。
还可进一步判断“短时间内只有一帧闪光”,即判断diff(i+k)是否满足以下三个条件:
1)diff(i+k)>T,(k=0,2N)
2)diff(i+k)<T,(k=1,2,3...2N-1)
3)
若同时满足,则第i帧为闪光。
步骤33、场景缓变检测单元13检测场景缓变。首先获得最优SVM分类器,如图6所示,获取过程包括:
步骤61、创建初始训练数据,选取一定数目的场景缓变视频片段中的帧,分别作为正面样本(+1类数据)和非场景缓变帧作为负面样本(-1类数据)。
步骤62、训练SVM分类器的参数,分别对上述所有的预选训练帧提取三维小波变换后的三个特征VH、EH及DL,用来训练SVM分类器。
步骤63、利用SVM分类器分类其它数据,如选取其它负面样本(只含有-1类数据),利用已经训练好的SVM分类器对其进行分类;
步骤64、判断分类结果是否有+1类数据,若判断的结果有+1类数据,则判断错误,执行步骤65;若判断的结果都是-1类数据,则判断正确,执行步骤66。
步骤65、如果判断错误,将被判断错误的帧作为负面样本(-1类数据)填充到原来的负面样本中,作为新的负面样本,执行步骤62,即,再执行步骤63,对SVM分类器的参数进行重新分类。再选取其他样本进行如此循环,直到没有错误分类的情况发生。
步骤66、如判断正确,则得到了最优的场景缓变检测的SVM分类器。
然后,用获取的最优SVM分类器检测各待检测的帧是否为场景缓变,得到检测结果。
若进一步判断检测结果为场景缓变的帧是淡入淡出还是消融,场景缓变检测还可进一步包括:
对整个视频序列中场景缓变帧的判断结果f(i)序列进行半径为N的中值滤波,通过中值滤波可以将误检帧等噪声滤除,得到场景缓变的一段持续帧。
利用低频子带系数特征DL(i)来分辨此段场景缓变是淡入淡出(Fade)或者消融(Dissolve)。判断任何一段场景缓变持续帧从t1到t2时刻是Fade或者Dissolve的方法如下:
(t1<i<t2)
由上式可以看出,若在一段场景缓变的持续帧中所有的DL(i)>Tfd,则此场景缓变是由消融引起的;若在一段场景缓变持续帧中有一个DL(i)<Tfd,则此场景缓变是由淡入淡出引起的。其中Tfd可为0.93。
上述装置及方法实施例,通过基于小波变换对场景切换进行检测,大大提高了检测场景切换的准确率。为了详细说明上述装置及方法实施例检测视频场景突变和闪光检测的优越性,发明人用上述装置及方法实施例中的技术方案对两个业界公知的视频序列news1序列和culture序列作了检测试验。其中,news1序列共57461帧,包含了大量的突变和闪光;culture序列共44145帧。试验结果如表3所示。
表3 基于三维小波变换的视频突变和和闪光检测的实验结果
由表3可以看出,上述可进行场景突变检测的装置及方法实施例消除了闪光给场景突变检测带来的误检,对突变和闪光的检测都达到了比较好的效果。其中,Nc是正确检测数目,Nm是漏检测数目,Nf是错误检测数目,查全率Pre和准确率Ppre的定义如下:
Pre=Nc/(Nc+Nm)
Ppre=Nc/(Nc+Nf)
为了详细说明上述装置及方法实施例检测视频场景缓变检测的优越性,发明人用上述装置及方法实施例中的技术方案对culture序列以及另一个业界公知的缓变场景比较多的视频序列即eyeexam序列做了检测试验。其中,eyeexam序列共40735帧。试验结果如表4所示。
表4 基于三维小波变换的缓变检测的实验结果
由表3可以看出,上述可进行场景缓变检测的装置及方法实施例消除了运动帧给场景突变检测带来的误检,检测的准确率达到了80%以上,大大提高了场景缓变检测的精确性。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。