CN103065153A - 一种基于色彩量化和聚类的视频关键帧提取方法 - Google Patents

一种基于色彩量化和聚类的视频关键帧提取方法 Download PDF

Info

Publication number
CN103065153A
CN103065153A CN2012105445854A CN201210544585A CN103065153A CN 103065153 A CN103065153 A CN 103065153A CN 2012105445854 A CN2012105445854 A CN 2012105445854A CN 201210544585 A CN201210544585 A CN 201210544585A CN 103065153 A CN103065153 A CN 103065153A
Authority
CN
China
Prior art keywords
color
frame
similarity
camera lens
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012105445854A
Other languages
English (en)
Other versions
CN103065153B (zh
Inventor
吴亚东
王松
韩永国
陈永辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest University of Science and Technology
Original Assignee
Southwest University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest University of Science and Technology filed Critical Southwest University of Science and Technology
Priority to CN201210544585.4A priority Critical patent/CN103065153B/zh
Publication of CN103065153A publication Critical patent/CN103065153A/zh
Application granted granted Critical
Publication of CN103065153B publication Critical patent/CN103065153B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于色彩量化和聚类的视频关键帧提取方法,包括以下流程:加载视频数据流→对视频流进行单帧扫描→对得到的帧图像进行色彩量化,提取量化后的帧图像的主色彩特征→计算相邻帧间相似度,得到相邻帧差→根据相邻帧差进行镜头边界检测→对分割的镜头进行镜头分类,提取每个镜头的代表帧→对代表帧序列进行压缩聚类,得到关键帧序列。本发明先对单帧图像进行色彩量化提取图像主色彩,采用基于聚类颜色特征的相似度计算方法进行帧差计算,从而实现镜头边界检测,最后对提取出的代表性帧序列按压缩比进行聚类,整个过程对视频格式、类型依赖性低,具有良好的通用性和适应性,计算简单、空间耗费低,同时能有效避免关键帧选取冗余的现象并可以控制关键帧的数量、质量,并实现对视频压缩比的控制。

Description

一种基于色彩量化和聚类的视频关键帧提取方法
技术领域
本发明涉及一种视频关键帧提取方法,尤其涉及一种能够从不同类型不同分辨率的视频中提取出关键帧序列的基于色彩量化和聚类的视频关键帧提取方法。属于视频关键帧提取领域。 
背景技术
随着多媒体信息在娱乐、商业、生产、医学、安全、国防、军事等领域的大量应用,传统的基于关键词描述的视频检索方案因其手工添加注释工作量大、人工文字标签描述主观性强、效率低下等诸多缺陷,已经不能适应海量视频检索的需求了,如何有效得存储、组织、管理、浏览和检索视频信息成为一个关键问题。基于内容的视频检索为解决这个难题提供了一条可行途径,视频检索和摘要技术是近年来的两大热点,而视频关键帧的提取技术在视频检索研究中占据着核心地位。 
视频关键帧是一段视频中包含重要视频内容的一组离散的帧序列,视频关键帧提取就是依据镜头内容的复杂程度,从镜头中提取一个或多个关键帧,从而用少量的帧来代替镜头的内容,它是视频检索和摘要的基本步骤。 
目前常用的视频关键帧提取方法归纳起来主要有以下四类:基于镜头边界法、基于运动分析法、基于视觉内容法、基于聚类分析法。 
镜头边界法是最直接最简单的关键帧提取方法,一段视频流被分割成若干镜头后,选取每个镜头的首帧、中间帧或者尾帧作为镜头的关键帧。这种方法设计简单,运算量小,适合内容简单或固定场景的镜头。但对于较为复杂的场景,这样提取的镜头代表帧往往并非真正的关键帧,不能精确得代表镜头的信息。同时该方法受前期镜头分割工作的影响很大,分割效果不好,此方法选择 的关键帧更加杂乱。 
运动分析法可以根据镜头的结构选择相应数目的关键帧,一般都是基于光流运算的,通过光流分析来计算镜头中的运动量,在运动量取局部最小值处选取关键帧。但这种方法计算量较大,实时性较差,而且基于光流算法的局部最小值也不一定准确。 
视觉内容法基于每一帧的颜色、纹理等视觉信息的改变来提取关键帧,当这些信息有显著变化时,当前帧即可作为关键帧。此方法可以根据镜头内容的变化程度选择相应数目的关键帧,但选取的帧不一定能放映镜头的内容,而且容易获取过多的关键帧。 
聚类分析法综合考虑镜头内和镜头间的相关性,通过聚类那些在时间、内容上相关度很高的帧图像,将视频序列划分为不同的聚类,然后选取其中最不相关的离散帧作为镜头关键帧。聚类方法计算效率高,能有效获取视频镜头变化显著的视觉内容,但不能有效地保存原镜头内图像帧的图像顺序和动态信息。 
发明内容
本发明的目的就在于为了解决上述问题而提供的一种基于色彩量化和聚类的视频关键帧提取方法,这种视频关键帧提取方法能够从大量的、不同类型的、不同分辨率的视频内容中快速、准确的提取出关键帧序列,同时有效避免冗余并可以控制关键帧的数量。 
为了达到上述目的,本发明采用了以下技术方案: 
本发明所述一种基于色彩量化和聚类的视频关键帧提取方法包括以下流程:加载视频数据流→对视频流进行单帧扫描→对得到的帧图像进行色彩量化,提取量化后的帧图像的主色彩特征→计算相邻帧间相似度,得到相邻帧差→根据相邻帧差进行镜头边界检测→对分割的镜头进行镜头分类,提取每个镜头的 代表帧→对代表帧序列进行压缩聚类,得到关键帧序列。 
所述流程中,对帧图像进行色彩量化,提取帧图像主色彩特征的方法为:设ci是颜色空间中的一个三维向量,可以是RGB、HSV等颜色空间),Cinput={ci,i=1,2,...,N}表示单帧扫描后得到的帧图像颜色的集合,其中N表示颜色的数目,Coutput={c′j,j=1,2,...,K}(K<<N)表示色彩量化后得到的索引图像的颜色集合,即为单帧图像的主色彩特征。色彩量化是一个映射过程: 
q:Cinput→Coutput           (式I)
本发明中采用基于八叉树结构的色彩量化算法,遵循距离最近准则:单帧扫描后得到的帧图像中的任一颜色c将被映射到索引图像颜色集合Coutput中距离最近的颜色c′,即 
c′=q(c):||c-c′||=minj=1,2,...,k||c-c′j||    (式II) 
同时,在颜色集合Cinput中得到K个聚类Sk,k=1,2,...,K 
Sk={c∈Cinput|q(c)=c′k}                            (式III) 
式III中,c′k为K个聚类的聚类中心,它们组成索引图像的颜色集合,即提取出的主色彩特征。 
本发明中对单帧图像的色彩量化,提取主色彩特征主要分为以下3个步骤: 
1)色彩八叉树的建立。从根结点开始,取R、G、B分量二进制值的第7位,组合在一起形成一个3位的索引值,索引值范围为0-7,分别对应于8个子结点;寻找到下一层结点后,取下R、G、B值的下一位进行组合,得到索引值;以此类推,就可查找到每种颜色对应的叶子结点,从而建立八叉树,在每个结点上记录所有经过的结点的RGB值的总和以及RGB颜色个数。 
2)八叉树的归并。插入的过程中,如果叶子结点数超过了总颜色数(本发明中叶子结点总数设为K),就需要归并一些叶子结点。本发明中从最底层叶 结点开始合并,按结点计数值小的优先合并策略,将其子结点的所有RGB分量以及结点计数全部记录到该结点中,并删除其所有子结点,依此进行,直到合并后的叶子数符合要求为止。此时,取出叶子结点中的RGB分量的平均值(分量总和、结点个数),得到的调色板颜色值。 
3)图像色彩量化。重新扫描单帧图像,由每个像素的颜色值查找到色彩八叉树中的对应的叶子结点,用叶子结点中记录的调色板索引值表示该像素,从而提取出该单帧图像的主色彩特征,并用主色彩特征重新表示图像,得到色彩量化后的新图像。 
所述流程中,计算相邻帧间相似度,得到相邻帧差的方法为:采用基于聚类颜色特征的相似度计算方法,具体步骤为: 
(1)对任意两帧图像IA和IB通过基于八叉树的颜色量化算法分别将图像所有颜色相似的象素归为一类,假设图像IA和IB分别得到ωA和ωBA=NA,ωB=NB)种不同颜色的归类。 
(2)在RGB颜色空间中计算两个象素pi和pj的颜色欧式距离dij为: 
d ij = ( r i - r j ) 2 + ( g i - g j ) 2 + ( b i - b j ) 2 (式IV) 
(3)对图像IA中的每一种颜色 
Figure BSA00000823910900042
在图像IB中寻找未配对而且其欧式距离最小的颜色 
Figure BSA00000823910900043
从而得到一个配对(i,ni),不断重复此过程得到一个集合T。 
那么相邻帧图像的颜色相似度可定义为: 
sim ( I A , I B ) = Σ ( i , n i ) ∈ T min ( P ( ω i A ) , p ( ω n i B ) ) × s ( ω i A , ω n i B ) (式V)
得到任意两帧的相似度后,也就可以计算得到它们之间的差异值diff: 
diff(fi,fj)=1-sim(fi,fj)    (式VI) 
式VI中, 
Figure BSA00000823910900045
Figure BSA00000823910900046
分别表示图像IA和IB中归类到颜色 
Figure BSA00000823910900047
的象素数所 占比重, 
Figure BSA00000823910900051
为像素点间相似度,本发明采用高斯函数对两个像素点颜色相似度与其颜色欧式距离之间的关系进行拟合: 
s ( p i , p j ) = a e - ( d ij - b ) 2 c 2 d ij < L 0 d ij &GreaterEqual; L (式VII) 
式VII中,dij为象素pi和pj的颜色欧式距离,a,b,c,L为常数,显然两个相同颜色的两个象素的颜色相似度s(pi,pj)=1,颜色的相似度随着欧式距离的增大而单调递减。 
所述流程中,根据相邻帧差进行镜头边界检测的方法为:在本发明中先通过镜头边界系数CSB初步确定镜头的边界,再根据相邻帧差diff对初步定位的镜头进一步扫描,精确定位镜头的边界,从而提高镜头边界检测的查全率和查准率。 
定义第i帧的镜头边界相似系数(CSBS)为: 
C SBS = &Sigma; j = - N N - 1 ( D sw ( i + j ) * O sw ( N + j ) ) &Sigma; j = - N N - 1 ( D sw ( i + j ) ) 2 * &Sigma; j = - N N - 1 ( O sw ( N + j ) ) 2 (式VIII) 
D sw ( i ) = &Sigma; j = 1 N N - j + 1 K diff ( i - j , i + j ) (式IX) 
式VIII、式IX中,Dsw(i)为领域窗帧差序列,Osw(j)为镜头边界检测算子,在本发明中N为整数,Osw算子定义为一个一维向量。 
定义第i帧的镜头边界系数(CSB)为: 
CSB=exp(-α(1-CSBS(i)))           (式X)
式X中,α为常数。 
所述流程中,对分割的镜头进行镜头分类,提取每个镜头的代表帧的方法 为:当相邻帧差diff发生突变时,默认分割的镜头为普通镜头,提取该镜头最中间的一帧作为镜头的代表帧,对于渐变镜头,由于视频创作手法的多样性导致镜头存在多种复杂的渐变方式,在本发明中,为了减少时间复杂度,对于非普通镜头都默认是渐变镜头,不对镜头的渐变方式进行过多深入的分析,只提取与该镜头起始帧距离最大即图像内容变化程度最高的帧作为该镜头的代表帧。 
所述流程中,对代表帧序列进行压缩聚类,得到最终关键帧序列的方法为:通过K-均值聚类法将代表帧序列压缩至要求的数量以达到一定的压缩比,同时消除冗余选取现象。设要提取关键帧的镜头的代表帧集合为F={f1,f2,...,fn},根据基于聚类颜色特征的相似度计算方法定义代表帧集合F中代表帧fi和fj间的距离d(fi,fj)=diff(fi,fj),设簇类中心为M个:p1,p2,...,pM。 
目标函数定义为: 
J=d(fi,pj)=diff(fi,pj)=1-sim(fi,pj)        (式XI) 
算法流程如下: 
(1)从集合F中随机取M个代表帧,作为初始簇类“中心”; 
(2)repeat; 
(3)分别计算剩下的帧与M个簇中心的帧的差异度d(fi,pj),寻找与各个对象最为相近的簇类“中心”,将其分配到各个相应的类中; 
(4)根据聚类结果,针对每一个簇类,重新计算M个簇各自新的“中心”; 
(5)until目标函数值或者簇类“中心”没有变化为止。 
通过上面的步骤,最终我们得到给定数量为M的帧图像组成的关键帧序列。这种方法一方面消除了单纯的合并镜头代表帧存在冗余帧、帧数量过多的问题,另一方面相比于一般的聚类方法计算效率更高,同时有效地保存原镜头内图像 帧的时间顺序和动态信息。 
本发明的有益效果在于: 
由于本发明中先对单帧图像进行色彩量化提取图像主色彩,采用基于聚类颜色特征的相似度计算方法进行帧差计算,从而实现镜头边界检测,最后对提取出的代表性帧序列按压缩比进行聚类,整个过程对视频格式、类型依赖性低,具有良好的通用性和适应性,计算简单、空间耗费低,同时能有效避免关键帧选取冗余的现象并可以控制关键帧的数量、质量,并实现对视频压缩比的控制。 
附图说明
图1是本发明的整体流程图; 
图2是本发明中图像色彩量化,提取主色彩特征流程图 
图3是本发明中利用高斯函数拟合象素点颜色相似度的函数曲线图; 
图4是本发明中帧差计算流程图; 
图5是本发明中关键帧序列提取流程图; 
具体实施方式
下面结合附图对本发明作进一步具体描述: 
如图1所示,本发明所述一种基于色彩量化和聚类的视频关键帧提取方法包括以下流程:
加载视频数据流→对视频流进行单帧扫描→对得到的帧图像进行色彩量化,提取量化后的帧图像的主色彩特征→计算相邻帧间相似度,得到相邻帧差→根据相邻帧差进行镜头边界检测→对分割的镜头序列进行镜头分类,提取每个镜头的代表帧→对代表帧序列进行压缩聚类,得到关键帧序列。 
1、对于加载的视频流数据,先进行单帧扫描101; 
2、对扫描的帧图像进行色彩量化102得到量化后的图像,同时提取量化后 图像的主色彩特征103; 
在图像色彩量化102阶段主要是对单帧彩色图像进行有损压缩,减少后期相似度计算复杂度和空间耗费率。 
传统的关键帧提取方法直接对帧图像进行帧差计算,时间和空间复杂度较高。研究表明使用主色一般不会降低颜色匹配效果,本发明中先对扫描后得到的帧图像进行色彩量化,提取图像主色彩特征,减少空间耗费,执行速度高。设ci是颜色空间中的一个三维向量,可以是RGB、HSV等颜色空间),Cinput={ci,i=1,2,...,N}表示单帧扫描后得到的帧图像颜色的集合,其中N表示颜色的数目,Coutput={c′j,j=1,2,...,K}(K<<N)表示色彩量化后得到的索引图像的颜色集合,即为单帧图像的主色彩特征。色彩量化是一个映射过程: 
q:Cinput→Couput    (式1) 
本发明中采用基于八叉树结构的色彩量化算法,遵循距离最近准则:单帧扫描后得到的帧图像中的任一颜色c将被映射到索引图像颜色集合Coutput中距离最近的颜色c′,即 
c′=q(c):||c-c′||=minj=1,2,...,k||c-c′j||     (式2)
同时,在颜色集合Cinput中得到K个聚类Sk,k=1,2,...,K 
Sk={c ∈Cinput|q(c)=c′k}                            (式3)
c′k为K个聚类的聚类中心,它们组成索引图像的颜色集合,即提取出的主色彩特征。 
本发明中对单帧图像的色彩量化,提取主色彩特征主要具体步骤如图2所示: 
(1)色彩八叉树的建立201。从根结点开始,取R、G、B分量二进制值的第7位,组合在一起形成一个3位的索引值,索引值范围0-7,分别对应于8个 子结点;寻找到下一层结点后,取下R、G、B值的下一位进行组合,得到索引值;以此类推,就可查找到每种颜色对应的叶子结点,从而建立八叉树,在每个结点上记录所有经过的结点的RGB值的总和以及RGB颜色个数。 
(2)八叉树的归并202。插入的过程中,如果叶子结点数超过了总颜色数(本发明中叶子结点总数设为K),就需要归并一些叶子结点。本发明中从最底层叶结点开始合并,按结点计数值小的优先合并策略,将其子结点的所有RGB分量以及结点计数全部记录到该结点中,并删除其所有子结点,从最底层叶子结点开始合并的归并过程,依此进行,直到合并后的叶子数符合要求为止。 
(3)图像色彩量化204。重新扫描单帧图像,由每个像素的颜色值查找到色彩八叉树中的对应的叶子结点,用叶子结点中记录的调色板索引值表示该像素,从而提取出该单帧图像的主色彩特征203,并用主色彩特征重新表示图像,得到色彩量化后的新图像。 
3、计算量化后的图像的相邻帧间相似度,并进行帧差计算104; 
进行帧差计算时,依据使用主色一般不会降低颜色匹配效果,采用基于聚类颜色特征的相似度计算方法来计算帧间相似度,从而得到帧差值,详细步骤如图4所示。 
(1)对任意两帧图像IA和IB通过基于八叉树的颜色量化算法分别将图像所有颜色相似的象素归为一类,假设图像IA和IB分别得到ωA和ωBA=NA,ωB=NB)种不同颜色的归类(如图4-401~403); 
(2)在RGB颜色空间中计算两个象素pi和pj的颜色欧式距离dij为(如图4-404); 
d ij = ( r i - r j ) 2 + ( g i - g j ) 2 + ( b i - b j ) 2 (式4)
(3)采用高斯函数对两个像素点颜色相似度与其颜色欧式距离之间的关系 进行拟合(如图4-405~406);如图3所示为高斯函数拟合象素点颜色相似度函数曲线图; 
s ( p i , p j ) = a e - ( d ij - b ) 2 c 2 d ij < L 0 d ij &GreaterEqual; L (式5)
式5中,dij为象素pi和pj的颜色欧式距离,a,b,c,L为常数,显然两个相同颜色的两个象素的颜色相似度s(pi,pj)=1,颜色的相似度随着欧式距离的增大而单调递减。 
(4)对图像IA中的每一种颜色 
Figure BSA00000823910900102
在图像IB中寻找未配对而且其欧式距离最小的颜色 
Figure BSA00000823910900103
从而得到一个配对(i,ni),不断重复此过程得到一个集合T(如图4-407); 
(5)相邻帧图像的颜色相似度可定义为(如图4-408); 
sim ( I A , I B ) = &Sigma; ( i , n i ) &Element; T min ( P ( &omega; i A ) , p ( &omega; n i B ) ) &times; s ( &omega; i A , &omega; n i B ) (式6)
得到任意两帧的相似度后,也就可以计算得到它们之间的差异值diff(如图4-409); 
diff(fi,fj)=1-sim(fi,fj)                 (式7)
4、根据相邻帧差完成镜头边界检测105; 
根据相邻帧差进行镜头边界检测的具体方法为:在本发明中先通过镜头边界系数CSB初步确定镜头的边界,再根据相邻帧差diff对初步定位的镜头进一步扫描,精确定位镜头的边界,从而提高镜头边界检测的查全率和查准率。 
定义第i帧的镜头边界相似系数(CSBS)为: 
C SBS = &Sigma; j = - N N - 1 ( D sw ( i + j ) * O sw ( N + j ) ) &Sigma; j = - N N - 1 ( D sw ( i + j ) ) 2 * &Sigma; j = - N N - 1 ( O sw ( N + j ) ) 2 (式8) 
D sw ( i ) = &Sigma; j = 1 N N - j + 1 K diff ( i - j , i + j ) (式9)
式8、式9中,Dsw(i)为领域窗帧差序列,Osw(j)为镜头边界检测算子,在本发明中N为整数,Osw算子定义为一个一维向量。 
定义第i帧的镜头边界系数(CSB)为: 
CSB=exp(-α(1-CSBS(i)))          (式10) 
式10中,α为常数。 
5、通过分析镜头边界检测的结果,对分割的镜头序列进行镜头分类106,同时对每个镜头进行代表帧提取107; 
6、最后对代表帧进行聚类压缩108,最后提取到的关键帧序列。提取关键帧序列过程中具体包括如图5所示流程: 
(1)对通过镜头边界检测得到的镜头序列501进行镜头分类502,当相邻帧差diff发生突变时,默认分割的镜头为普通镜头503,对于渐变镜头,由于视频创作手法的多样性导致镜头存在多种复杂的渐变方式,在本发明中,为了减少时间复杂度,对于非普通镜头都默认是渐变镜头505; 
(2)对于普通镜头503,提取该镜头最中间的一帧作为镜头的代表帧504,对于渐变镜头505,不对镜头的渐变方式进行过多深入的分析,只提取与该镜头起始帧距离最大即图像内容变化程度最高的帧作为该镜头的代表506; 
(3)对代表帧序列进行压缩聚类507,通过K-均值聚类法将代表帧序列压缩至要求的数量以达到一定的压缩比,最终得到关键帧序列508。 
所述流程中,对代表帧序列进行压缩聚类,得到最终关键帧序列的方法为:通过K-均值聚类法将代表帧序列压缩至要求的数量以达到一定的压缩比,同时消除冗余选取现象。设要提取关键帧的镜头的代表帧集合为F={f1,f2,...,fn},根据基于聚类颜色特征的相似度计算方法定义代表帧集合F中代表帧fi和fj间的距离d(fi,fj)=diff(fi,fj),设簇类中心为M个:p1,p2,...,pM。 
目标函数定义为: 
j=d(fi,pj)=diff(fi,pj)=1-sim(fi,pj)         (式11) 
算法流程如下: 
A、从集合F中随机取M个代表帧,作为初始簇类“中心”; 
B、repeat; 
C、分别计算剩下的帧与M个簇中心的帧的差异度d(fi,pj),寻找与各个对象最为相近的簇类“中心”,将其分配到各个相应的类中; 
D、根据聚类结果,针对每一个簇类,重新计算M个簇各自新的“中心”; 
E、until目标函数值或者簇类“中心”没有变化为止。 
通过上面的步骤,最终我们得到给定数量为M的帧图像组成的关键帧序列。这种方法一方面消除了单纯的合并镜头代表帧存在冗余帧、帧数量过多的问题,另一方面相比于一般的聚类方法计算效率更高,同时有效地保存原镜头内图像帧的时间顺序和动态信息。 

Claims (8)

1.一种基于色彩量化和聚类的视频关键帧提取方法,其特征在于:包括以下流程:加载视频数据流→对视频流进行单帧扫描→对得到的帧图像进行色彩量化,提取量化后的帧图像的主色彩特征→计算相邻帧间相似度,得到相邻帧差→根据相邻帧差进行镜头边界检测→对分割的镜头进行镜头分类,提取每个镜头的代表帧→对代表帧序列进行压缩聚类,得到关键帧序列。
2.根据权利要求1所述的所述的一种基于色彩量化和聚类的视频关键帧提取方法,其特征在于:所述流程——对得到的帧图像进行色彩量化,提取量化后的帧图像的主色彩特征的方法为:
设ci是颜色空间中的一个三维向量,可以是RGB、HSV等颜色空间),Cinput={ci,i=1,2,...,N}表示单帧扫描后得到的帧图像颜色的集合,其中N表示颜色的数目,Coutput={c′j,j=1,2,...,K}(K<<N)表示色彩量化后得到的索引图像的颜色集合,即为单帧图像的主色彩特征。色彩量化是一个映射过程:
q:Cinput→Coutput
本发明中采用基于八叉树结构的色彩量化算法,遵循距离最近准则:单帧扫描后得到的帧图像中的任一颜色c将被映射到索引图像颜色集合Coutput中距离最近的颜色c′,即
c′=q(c):||c-c′||=minj=1,2,...,k||c-c′j||
同时,在颜色集合Cinput中得到K个聚类Sk,k=1,2,...,K
Sk={c∈Cinput|q(c)=c′k}
c′k为K个聚类的聚类中心,它们组成索引图像的颜色集合,即提取出的主色彩特征。
3.根据权利要求1所述的所述的一种基于色彩量化和聚类的视频关键帧提取方法,其特征在于:所述流程——对得到的帧图像进行色彩量化,提取量化后的帧图像的主色彩特征主要采用基于八叉树结构的色彩量化算法,分为以下3个步骤:
(1)色彩八叉树的建立。从根结点开始,取R、G、B分量二进制值的第7位,组合在一起形成一个3位的索引值,索引值范围为0-7,分别对应于8个子结点;寻找到下一层结点后,取下R、G、B值的下一位进行组合,得到索引值;以此类推,就可查找到每种颜色对应的叶子结点,从而建立八叉树,在每个结点上记录所有经过的结点的RGB值的总和以及RGB颜色个数。
(2)八叉树的归并。插入的过程中,如果叶子结点数超过了总颜色数(本发明中叶子结点总数设为K),就需要归并一些叶子结点。本发明中从最底层叶结点开始合并,按结点计数值小的优先合并策略,将其子结点的所有RGB分量以及结点计数全部记录到该结点中,并删除其所有子结点,依此进行,直到合并后的叶子数符合要求为止。此时,取出叶子结点中的RGB分量的平均值(分量总和、结点个数),得到的调色板颜色值。
(3)图像色彩量化。重新扫描单帧图像,由每个像素的颜色值查找到色彩八叉树中的对应的叶子结点,用叶子结点中记录的调色板索引值表示该像素,从而提取出该单帧图像的主色彩特征,并用主色彩特征重新表示图像,得到色彩量化后的新图像。
4.根据权利要求1所述的所述的一种基于色彩量化和聚类的视频关键帧提取方法,其特征在于:所述流程——计算相邻帧间相似度,得到相邻帧差的方法为:采用基于聚类颜色特征的相似度计算方法,具体步骤如下
(1)对任意两帧图像IA和IB通过基于八叉树的颜色量化算法分别将图像所有颜色相似的象素归为一类,假设图像IA和IB分别得到ωA和ωBA=NA,ωB=NB)种不同颜色的归类。
(2)在RGB颜色空间中计算两个象素pi和pj的颜色欧式距离dij为:
d ij = ( r i - r j ) 2 + ( g i - g j ) 2 + ( b i - b j ) 2
(3)对图像IA中的每一种颜色
Figure FSA00000823910800032
在图像IB中寻找未配对而且其欧式距离最小的颜色
Figure FSA00000823910800033
从而得到一个配对(i,ni),不断重复此过程得到一个集合T。
那么相邻帧图像的颜色相似度可定义为:
sim ( I A , I B ) = &Sigma; ( i , n i ) &Element; T min ( P ( &omega; i A ) , p ( &omega; n i B ) ) &times; s ( &omega; i A , &omega; n i B )
得到任意两帧的相似度后,也就可以计算得到它们之间的差异值diff:
diff(fi,fj)=1-sim(fi,fj)
式中,
Figure FSA00000823910800035
分别表示图像IA和IB中归类到颜色
Figure FSA00000823910800038
的象素数所占比重,
Figure FSA00000823910800039
为像素点间相似度,本发明采用高斯函数对两个像素点颜色相似度与其颜色欧式距离之间的关系进行拟合:
s ( p i , p j ) = a e - ( d ij - b ) 2 c 2 d ij < L 0 d ij &GreaterEqual; L
式中dij为象素pi和pj的颜色欧式距离,a,b,c,L为常数,显然两个相同颜色的两个象素的颜色相似度s(pi,pj)=1,颜色的相似度随着欧式距离的增大而单调递减。
5.根据权利要求1所述的所述的一种基于色彩量化和聚类的视频关键帧提取方法,其特征在于:所述流程——根据相邻帧差进行镜头边界检测的方法为:
在本发明中先通过镜头边界系数CSB初步确定镜头的边界,再根据相邻帧差diff对初步定位的镜头进一步扫描,精确定位镜头的边界,从而提高镜头边界检测的查全率和查准率。
定义第i帧的镜头边界相似系数(CSBS)为:
C SBS = &Sigma; j = - N N - 1 ( D sw ( i + j ) * O sw ( N + j ) ) &Sigma; j = - N N - 1 ( D sw ( i + j ) ) 2 * &Sigma; j = - N N - 1 ( O sw ( N + j ) ) 2
D sw ( i ) = &Sigma; j = 1 N N - j + 1 K diff ( i - j , i + j )
式中Dsw(i)为领域窗帧差序列,Osw(j)为镜头边界检测算子,在本发明中N为整数,Osw算子定义为一个一维向量。
定义第i帧的镜头边界系数(CSB)为:
CSB=exp(-α(1-CSBS(i)))
式中,α为常数。
6.根据权利要求1所述的所述的一种基于色彩量化和聚类的视频关键帧提取方法,其特征在于:所述流程——对分割的镜头进行镜头分类,提取每个镜头的代表帧的方法为:当相邻帧差diff发生突变时,默认分割的镜头为普通镜头,提取该镜头最中间的一帧作为镜头的代表帧,只提取与该镜头起始帧距离最大即图像内容变化程度最高的帧作为该镜头的代表帧。
7.根据权利要求1所述的所述的一种基于色彩量化和聚类的视频关键帧提取方法,其特征在于:所述流程——对代表帧序列进行压缩聚类,得到关键帧序列的方法为:
通过K-均值聚类法将代表帧序列压缩至要求的数量以达到一定的压缩比,同时消除冗余选取现象。设要提取关键帧的镜头的代表帧集合为F={f1,f2,...,fn},根据基于聚类颜色特征的相似度计算方法定义代表帧集合F中代表帧fi和fj间的距离d(fi,fj)=diff(fi,fj),设簇类中心为M个:p1,p2,...,pM
目标函数定义为:
J=d(fi,pj)=diff(fi,pj)=1-sim(fi,pj)
算法流程如下:
(1)从集合F中随机取M个代表帧,作为初始簇类“中心”;
(2)repeat;
(3)分别计算剩下的帧与M个簇中心的帧的差异度d(fi,pj),寻找与各个对象最为相近的簇类“中心”,将其分配到各个相应的类中;
(4)根据聚类结果,针对每一个簇类,重新计算M个簇各自新的“中心”;
(5)until目标函数值或者簇类“中心”没有变化为止。
通过上面的步骤,最终我们得到给定数量为M的帧图像组成的关键帧序列。
8.根据权利要求4所述在计算相邻帧间相似度,得到相邻帧差的步骤(3)中,其特征在于:RGB颜色空间中两个象素pi和pj的颜色相似度与其颜色欧式距离之间关系采用高斯函数进行拟合:
高斯函数拟合象素点颜色相似度函数曲线图;
s ( p i , p j ) = a e - ( d ij - b ) 2 c 2 d ij < L 0 d ij &GreaterEqual; L
式中dij为象素pi和pj的颜色欧式距离,a,b,c,L为常数,显然两个相同颜色的两个象素的颜色相似度s(pi,pj)=1,颜色的相似度随着欧式距离的增大而单调递减。
CN201210544585.4A 2012-12-17 2012-12-17 一种基于色彩量化和聚类的视频关键帧提取方法 Expired - Fee Related CN103065153B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210544585.4A CN103065153B (zh) 2012-12-17 2012-12-17 一种基于色彩量化和聚类的视频关键帧提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210544585.4A CN103065153B (zh) 2012-12-17 2012-12-17 一种基于色彩量化和聚类的视频关键帧提取方法

Publications (2)

Publication Number Publication Date
CN103065153A true CN103065153A (zh) 2013-04-24
CN103065153B CN103065153B (zh) 2016-06-15

Family

ID=48107776

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210544585.4A Expired - Fee Related CN103065153B (zh) 2012-12-17 2012-12-17 一种基于色彩量化和聚类的视频关键帧提取方法

Country Status (1)

Country Link
CN (1) CN103065153B (zh)

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104063871A (zh) * 2014-07-04 2014-09-24 西安电子科技大学 可穿戴设备的图像序列场景分割方法
CN104284241A (zh) * 2014-09-22 2015-01-14 北京奇艺世纪科技有限公司 一种视频剪辑方法和装置
CN104408429A (zh) * 2014-11-28 2015-03-11 北京奇艺世纪科技有限公司 一种视频代表帧提取方法及装置
CN104679818A (zh) * 2014-12-25 2015-06-03 安科智慧城市技术(中国)有限公司 一种视频关键帧提取方法及系统
CN105205054A (zh) * 2014-06-04 2015-12-30 阿里巴巴集团控股有限公司 用于展示图片的方法和获取图片色相特征值的方法及装置
CN105761263A (zh) * 2016-02-19 2016-07-13 浙江大学 一种基于镜头边界检测和聚类的视频关键帧提取方法
WO2016197705A1 (zh) * 2015-06-09 2016-12-15 中兴通讯股份有限公司 一种图像处理方法和装置
CN106296631A (zh) * 2015-05-20 2017-01-04 中国科学院沈阳自动化研究所 一种基于注意力先验的胃镜视频摘要方法
CN106504242A (zh) * 2016-10-25 2017-03-15 Tcl集团股份有限公司 目标检测方法及系统
CN106559714A (zh) * 2016-11-14 2017-04-05 上海工程技术大学 一种面向数字视频版权保护的关键帧提取方法
CN106682639A (zh) * 2017-01-03 2017-05-17 安徽农业大学 一种基于视频监测的作物叶部异常图像提取方法
CN107135401A (zh) * 2017-03-31 2017-09-05 北京奇艺世纪科技有限公司 关键帧选取方法及系统
CN108600865A (zh) * 2018-05-14 2018-09-28 西安理工大学 一种基于超像素分割的视频摘要生成方法
CN108710918A (zh) * 2018-05-23 2018-10-26 北京奇艺世纪科技有限公司 一种直播视频的多模态信息的融合方法和装置
CN109902189A (zh) * 2018-11-30 2019-06-18 华为技术有限公司 一种图片选择方法及相关设备
CN110188625A (zh) * 2019-05-13 2019-08-30 浙江大学 一种基于多特征融合的视频精细结构化方法
CN110472484A (zh) * 2019-07-02 2019-11-19 山东师范大学 基于多视图特征的视频关键帧提取方法、系统及设备
CN110765314A (zh) * 2019-10-21 2020-02-07 长沙品先信息技术有限公司 一种视频语义结构化提取与标注的方法
CN110856048A (zh) * 2019-11-21 2020-02-28 北京达佳互联信息技术有限公司 视频修复方法、装置、设备及存储介质
CN111314613A (zh) * 2020-02-28 2020-06-19 重庆金山医疗技术研究院有限公司 图像传感器、图像处理设备、图像处理方法及存储介质
CN111400528A (zh) * 2020-03-16 2020-07-10 南方科技大学 一种图像压缩方法、装置、服务器及存储介质
CN111768469A (zh) * 2019-11-13 2020-10-13 中国传媒大学 一种基于图像聚类的数据可视化配色的提取方法
CN111798526A (zh) * 2020-01-10 2020-10-20 中国人民解放军国防科技大学 基于聚类空间映射的彩色图像主色快速提取方法及系统
CN111901600A (zh) * 2020-08-06 2020-11-06 中标慧安信息技术股份有限公司 一种损失较低的视频压缩方法
CN112804558A (zh) * 2021-04-14 2021-05-14 腾讯科技(深圳)有限公司 视频拆分方法、装置及设备
CN113255423A (zh) * 2020-02-11 2021-08-13 韩国高等科学技术学院 从视频提取配色方案的方法及装置
CN113873278A (zh) * 2021-09-26 2021-12-31 北京奇艺世纪科技有限公司 播放内容审核方法、装置及电子设备
CN114998340A (zh) * 2022-08-03 2022-09-02 东莞先知大数据有限公司 一种瓷砖加工规范检测方法、电子设备和存储介质
CN115022675A (zh) * 2022-07-01 2022-09-06 天翼数字生活科技有限公司 一种视频播放检测的方法和系统
CN116030396A (zh) * 2023-02-27 2023-04-28 温州众成科技有限公司 一种用于视频结构化提取的精确分割方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040085339A1 (en) * 2002-11-01 2004-05-06 Ajay Divakaran Blind summarization of video content
CN101013444A (zh) * 2007-02-13 2007-08-08 华为技术有限公司 一种自适应生成足球视频摘要的方法和装置
CN101577824A (zh) * 2009-06-12 2009-11-11 西安理工大学 基于邻近i帧dc图像相似度的压缩域关键帧提取方法
CN101833791A (zh) * 2010-05-11 2010-09-15 成都索贝数码科技股份有限公司 一种单摄像机下的场景建模方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040085339A1 (en) * 2002-11-01 2004-05-06 Ajay Divakaran Blind summarization of video content
CN101013444A (zh) * 2007-02-13 2007-08-08 华为技术有限公司 一种自适应生成足球视频摘要的方法和装置
CN101577824A (zh) * 2009-06-12 2009-11-11 西安理工大学 基于邻近i帧dc图像相似度的压缩域关键帧提取方法
CN101833791A (zh) * 2010-05-11 2010-09-15 成都索贝数码科技股份有限公司 一种单摄像机下的场景建模方法及系统

Cited By (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105205054A (zh) * 2014-06-04 2015-12-30 阿里巴巴集团控股有限公司 用于展示图片的方法和获取图片色相特征值的方法及装置
CN104063871A (zh) * 2014-07-04 2014-09-24 西安电子科技大学 可穿戴设备的图像序列场景分割方法
CN104284241A (zh) * 2014-09-22 2015-01-14 北京奇艺世纪科技有限公司 一种视频剪辑方法和装置
CN104284241B (zh) * 2014-09-22 2019-01-22 北京奇艺世纪科技有限公司 一种视频剪辑方法和装置
CN104408429B (zh) * 2014-11-28 2017-10-27 北京奇艺世纪科技有限公司 一种视频代表帧提取方法及装置
CN104408429A (zh) * 2014-11-28 2015-03-11 北京奇艺世纪科技有限公司 一种视频代表帧提取方法及装置
CN104679818A (zh) * 2014-12-25 2015-06-03 安科智慧城市技术(中国)有限公司 一种视频关键帧提取方法及系统
CN104679818B (zh) * 2014-12-25 2019-03-26 上海云赛智联信息科技有限公司 一种视频关键帧提取方法及系统
CN106296631A (zh) * 2015-05-20 2017-01-04 中国科学院沈阳自动化研究所 一种基于注意力先验的胃镜视频摘要方法
CN106296757A (zh) * 2015-06-09 2017-01-04 中兴通讯股份有限公司 一种图像处理方法和装置
WO2016197705A1 (zh) * 2015-06-09 2016-12-15 中兴通讯股份有限公司 一种图像处理方法和装置
CN105761263A (zh) * 2016-02-19 2016-07-13 浙江大学 一种基于镜头边界检测和聚类的视频关键帧提取方法
CN106504242A (zh) * 2016-10-25 2017-03-15 Tcl集团股份有限公司 目标检测方法及系统
CN106559714A (zh) * 2016-11-14 2017-04-05 上海工程技术大学 一种面向数字视频版权保护的关键帧提取方法
CN106682639A (zh) * 2017-01-03 2017-05-17 安徽农业大学 一种基于视频监测的作物叶部异常图像提取方法
CN106682639B (zh) * 2017-01-03 2019-05-14 安徽农业大学 一种基于视频监测的作物叶部异常图像提取方法
CN107135401A (zh) * 2017-03-31 2017-09-05 北京奇艺世纪科技有限公司 关键帧选取方法及系统
CN107135401B (zh) * 2017-03-31 2020-03-27 北京奇艺世纪科技有限公司 关键帧选取方法及系统
CN108600865A (zh) * 2018-05-14 2018-09-28 西安理工大学 一种基于超像素分割的视频摘要生成方法
CN108600865B (zh) * 2018-05-14 2019-07-23 西安理工大学 一种基于超像素分割的视频摘要生成方法
CN108710918A (zh) * 2018-05-23 2018-10-26 北京奇艺世纪科技有限公司 一种直播视频的多模态信息的融合方法和装置
CN108710918B (zh) * 2018-05-23 2021-05-25 北京奇艺世纪科技有限公司 一种直播视频的多模态信息的融合方法和装置
CN109902189A (zh) * 2018-11-30 2019-06-18 华为技术有限公司 一种图片选择方法及相关设备
US11758285B2 (en) 2018-11-30 2023-09-12 Huawei Technologies Co., Ltd. Picture selection method and related device
CN110188625A (zh) * 2019-05-13 2019-08-30 浙江大学 一种基于多特征融合的视频精细结构化方法
CN110188625B (zh) * 2019-05-13 2021-07-02 浙江大学 一种基于多特征融合的视频精细结构化方法
CN110472484A (zh) * 2019-07-02 2019-11-19 山东师范大学 基于多视图特征的视频关键帧提取方法、系统及设备
CN110472484B (zh) * 2019-07-02 2021-11-09 山东师范大学 基于多视图特征的视频关键帧提取方法、系统及设备
CN110765314A (zh) * 2019-10-21 2020-02-07 长沙品先信息技术有限公司 一种视频语义结构化提取与标注的方法
CN111768469B (zh) * 2019-11-13 2024-05-28 中国传媒大学 一种基于图像聚类的数据可视化配色的提取方法
CN111768469A (zh) * 2019-11-13 2020-10-13 中国传媒大学 一种基于图像聚类的数据可视化配色的提取方法
CN110856048B (zh) * 2019-11-21 2021-10-08 北京达佳互联信息技术有限公司 视频修复方法、装置、设备及存储介质
CN110856048A (zh) * 2019-11-21 2020-02-28 北京达佳互联信息技术有限公司 视频修复方法、装置、设备及存储介质
CN111798526A (zh) * 2020-01-10 2020-10-20 中国人民解放军国防科技大学 基于聚类空间映射的彩色图像主色快速提取方法及系统
CN111798526B (zh) * 2020-01-10 2022-04-19 中国人民解放军国防科技大学 基于聚类空间映射的彩色图像主色快速提取方法及系统
CN113255423A (zh) * 2020-02-11 2021-08-13 韩国高等科学技术学院 从视频提取配色方案的方法及装置
CN111314613A (zh) * 2020-02-28 2020-06-19 重庆金山医疗技术研究院有限公司 图像传感器、图像处理设备、图像处理方法及存储介质
CN111400528B (zh) * 2020-03-16 2023-09-01 南方科技大学 一种图像压缩方法、装置、服务器及存储介质
CN111400528A (zh) * 2020-03-16 2020-07-10 南方科技大学 一种图像压缩方法、装置、服务器及存储介质
CN111901600A (zh) * 2020-08-06 2020-11-06 中标慧安信息技术股份有限公司 一种损失较低的视频压缩方法
CN111901600B (zh) * 2020-08-06 2021-06-11 中标慧安信息技术股份有限公司 一种损失较低的视频压缩方法
CN112804558B (zh) * 2021-04-14 2021-06-25 腾讯科技(深圳)有限公司 视频拆分方法、装置及设备
CN112804558A (zh) * 2021-04-14 2021-05-14 腾讯科技(深圳)有限公司 视频拆分方法、装置及设备
CN113873278A (zh) * 2021-09-26 2021-12-31 北京奇艺世纪科技有限公司 播放内容审核方法、装置及电子设备
CN113873278B (zh) * 2021-09-26 2024-01-23 北京奇艺世纪科技有限公司 播放内容审核方法、装置及电子设备
CN115022675A (zh) * 2022-07-01 2022-09-06 天翼数字生活科技有限公司 一种视频播放检测的方法和系统
CN115022675B (zh) * 2022-07-01 2023-12-15 天翼数字生活科技有限公司 一种视频播放检测的方法和系统
WO2024001000A1 (zh) * 2022-07-01 2024-01-04 天翼数字生活科技有限公司 一种视频播放检测的方法和系统
CN114998340A (zh) * 2022-08-03 2022-09-02 东莞先知大数据有限公司 一种瓷砖加工规范检测方法、电子设备和存储介质
CN116030396A (zh) * 2023-02-27 2023-04-28 温州众成科技有限公司 一种用于视频结构化提取的精确分割方法

Also Published As

Publication number Publication date
CN103065153B (zh) 2016-06-15

Similar Documents

Publication Publication Date Title
CN103065153A (zh) 一种基于色彩量化和聚类的视频关键帧提取方法
Bhunia et al. A novel feature descriptor for image retrieval by combining modified color histogram and diagonally symmetric co-occurrence texture pattern
Cetinic et al. A deep learning perspective on beauty, sentiment, and remembrance of art
Diem et al. cBAD: ICDAR2017 competition on baseline detection
CN102819582B (zh) 一种海量图片快速检索方法
RU2628192C2 (ru) Устройство для семантической классификации и поиска в архивах оцифрованных киноматериалов
US7715621B2 (en) Method and apparatus for representing a group of images
CN102207966B (zh) 基于对象标签的视频内容快速检索方法
Chary et al. Feature extraction methods for color image similarity
CN106126581A (zh) 基于深度学习的手绘草图图像检索方法
CN100589532C (zh) 字幕区域提取装置和方法
CN103714181B (zh) 一种层级化的特定人物检索方法
CN106446015A (zh) 一种基于用户行为偏好的视频内容访问预测与推荐方法
CN106649663B (zh) 一种基于紧凑视频表征的视频拷贝检测方法
CN106250431B (zh) 一种基于分类服装的颜色特征提取方法及服装检索系统
CN103186538A (zh) 一种图像分类方法和装置、图像检索方法和装置
CN104239420A (zh) 一种基于视频指纹的视频相似度匹配方法
CN101369281A (zh) 基于视频摘要元数据的检索方法
CN102890700A (zh) 一种基于体育比赛视频的相似视频片段检索方法
Thepade et al. Assessment of similarity measurement criteria in Thepade's Sorted Ternary Block Truncation Coding (TSTBTC) for content based video retrieval
Saad et al. Image retrieval based on integration between YCbCr color histogram and texture feature
Liu et al. Novel features for art movement classification of portrait paintings
CN110188625B (zh) 一种基于多特征融合的视频精细结构化方法
CN105374010A (zh) 全景图像的生成方法
Bhunia et al. A novel feature descriptor for image retrieval by combining modified color histogram and diagonally symmetric co-occurrence texture pattern

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160615

Termination date: 20211217