CN103118220B - 一种基于多维特征向量的关键帧提取算法 - Google Patents

一种基于多维特征向量的关键帧提取算法 Download PDF

Info

Publication number
CN103118220B
CN103118220B CN201210488270.2A CN201210488270A CN103118220B CN 103118220 B CN103118220 B CN 103118220B CN 201210488270 A CN201210488270 A CN 201210488270A CN 103118220 B CN103118220 B CN 103118220B
Authority
CN
China
Prior art keywords
algorithm
frame
key frame
key
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210488270.2A
Other languages
English (en)
Other versions
CN103118220A (zh
Inventor
赵刚
冯琰一
蒋天耀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PCI Technology Group Co Ltd
Original Assignee
PCI Suntek Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PCI Suntek Technology Co Ltd filed Critical PCI Suntek Technology Co Ltd
Priority to CN201210488270.2A priority Critical patent/CN103118220B/zh
Publication of CN103118220A publication Critical patent/CN103118220A/zh
Application granted granted Critical
Publication of CN103118220B publication Critical patent/CN103118220B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明提供了一种基于多维特征向量的关键帧提取算法及其在智能安防中的应用,该方法可以有效的解决球机等运动场景的基于内容的视频理解,并能够根据分析视频内容的结果构建出视频的概要关键帧序列,使监控人员可以快速的了解运动场景视频中的主要内容。

Description

一种基于多维特征向量的关键帧提取算法
技术领域
本发明属于计算机视觉领域,特别涉及一种基于多维特征向量的关键帧提取算法,及该方法在智能安防中的应用。
技术背景
随着计算机网络、数字化视频技术迅速发展,基于数字网络的视频监控得到广范的应用,但随之而来的是,随着监控部防的范围日益扩大,监控设备的数量也以惊人的数量增加,面对数以万计的监控设备,如何快速的了解海量监控点的视频主要内容成为平安城市等项目进一步发展的最大制约。
目前面对这一制约的一般解决方案为视频摘要系统、视频差异化快速播放系统等。但由于这些解决方案一般只能处理监控点固定不变的场景,对于广范部署球机的场景,这些解决方案也无能为力。因此业界亟待一种能够实现对变化场景的海量视频数据进行快速理解的算法工具,本发明提出了一种基于多维特征向量的关键帧提取算法,可以较好的针对运动球机的场景的摘要处理算法。
发明内容
本发明的目的是针对现有可变监控场景的视频监视系统,存在无法生成视频摘要,从而使监控人员无法快速了解海量视频数据基本内容的问题,提出一种基于多维特征向量的关键帧提取算法。
为了实现发明目的,采用的技术方案如下:
基于多维特征向量的关键帧提取算法的基本流程如图1所示。首先对输入的视频数据进行基于灰度直方图滑动窗口的关键帧初检并输出检测后的备选关键帧序列,然后对该序列进行基于高频信息检测的光照干扰检测,排除光照干扰帧,并输出过滤后的备选干扰帧,最后对备选干扰帧进行基于颜色特征的伪聚类关键帧提取并最终输出关键帧结果。以下分别具体说明。
1、基于灰度直方图滑动窗口的关键帧初检:首先,对本专利中用到的灰度图进行定,RGB彩色帧图像按如下方式转换成灰度图,令Ik为视频序列的第k帧图像,Pr(x,y)、Pg(x,y)、Pb(x,y)分别表示Ik在(x,y)像素点处的RGB像素值,Pgray(x,y)为Ik按下式转换后的灰度图。
Pgray=(Pr×30+Pg×59+Pb×11+50)/100
将图像转换为灰度图后,再对本专利中用到的灰度统计直方图做如下定义:
若Pgray(x,y)表示灰度图像中的像素集,则灰度统计直方图H(b)表示为:
H(b)=nbb=0,1,…255
得到帧图像对应的灰度统计直方图后,在基于灰度直方图滑动窗口的关键帧初检算法中,按下式利用相关法对得到的帧间灰度直方图进行对比。
d ( H k , H k + 1 ) = Σ i min ( H k ( i ) , H k + 1 ( i ) ) i = 0,1 , . . . , bin
其中Hk(i)视频帧序列Ik中第k帧的灰度统计直方图,则第k帧和第k+1帧的相关差表示为:d(Hk,Hk+1)。
根据以上假设条件,本专利中所描述的滑动窗口算法可以描述如下:滑动窗口法是以一定的概率统计理论为基础,通过对历史信息的分布统计计算,从而对当前分布的未来发展进行预测的一种算法。现以关键帧初检测中的灰度直方图相关差的分布为例进行说明。本专利中认为灰度直方图的相关差在一定程度上反应了图像内容的变化趋势,图像内容的变化被分割为图像镜头内的变化和图像镜头外的变化,图像镜头通过语义的概念进行定义:令一个视频镜头所反应的图像内容为其视频内容不发生变化的图像帧序列;当图像所描述的状态内容发生了变化时,称之为镜头迁变。一般情况下可认为视频镜头内的图像帧内容变化服从高斯分布,即镜头内帧图像间的直方图相关差的变化服从高斯分布,而且镜头迁变时的灰度直方图相关差违背高斯分布。若假设滑动窗口在大小为L,向滑动窗口输入相关差,对于任意d(Hk,Hk+1)有:将此值输入滑动窗口,若此值依然服务滑动窗口中的高斯分布,则更新滑动窗口的高斯分布,并将此帧列为备选关键帧;若此值打破了滑动窗口的高斯分布,更新滑动窗口,直至内容稳定,则继续输出备选关键帧序列。
2、基于高频信息检测的光照干扰检测,通过关键帧初检,得到的备选关键帧中有很多球机运动时的过渡帧和光照干扰帧,这些帧的特征都是图像模糊不清,无法表达图像的基本信息,因此本单元利用光照使得图像中高频信息丢失的原则来实现对备选关键帧的过滤检测,为了降低算法的运算复杂度,专利中利用图像的一阶梯度图来间接的反应图像的高低频信息,具体描述如下:
算法中利用Sobel算子与图像做卷积的方法来求图像的一阶梯度图。由于Sobel算子结合了高斯平滑和微分,因此它对图像的噪声有一定的鲁棒性。Sobel算子有两种,分别利用水平方向的Sobel算子h1和垂直方向的Sobel算子h2所为卷积核对图像进行卷积运算,从而求得图像的梯度图。
h 1 = 1 2 1 0 0 0 - 1 - 2 - 1 h 2 = 1 0 - 1 2 0 - 2 1 0 - 1
在算法中首先对图像做水平方向的卷积运算,之后再做垂直方向的卷积运算,最后可以得到梯度图像。在求得图像的梯度图后,对梯度图进行直方图的统计,算法中对于梯度统计直方图的处理包括两个部分,去除低频分量;累计高频分量。设高低频分量间的区分线为Tfrequency,P(i,j)代表着梯度图中(i,j)位置的像素值,则利用下式对梯度图进行二值化。
P ( i , j ) = 0 , P ( i , j ) = < T frequency 255 , P ( i , j ) &GreaterEqual; T frequuency
之后统计二值图非零元的个数C即为图像的高频量。若对于阈值T满足C<T,则认为当前图像为受干扰图,将它从备选帧序列中删除。
3、基于颜色特征的伪聚类关键帧提取,通过对备选关键帧的过滤,剩下的待选帧序列基本能够反应待处理视频的所有有意义内容,但在第一步中尽管通过灰度直方图的信息对视频内容进行了大致归类,尽管灰度直方图能够较好的将小运动图像归为一类,但由于灰度直方图对图像颜色信息变化较为迟钝,因此这些精分类极有可能把事实上的几类归为了一类。在本专利中,利用图像的颜色信息对备选关键帧序列进行最后的伪聚类划分,并提取伪聚类的聚类中心作为关键帧输出。
为了更好的反应出图像的颜色信息,本专利中将备选关键帧图像按下式规则从RGB颜色空间转换到HSV颜色空间。
V=Max(R,G,B)
S = Max ( R , G , B ) - Min ( R , G , B ) Max ( R , G , B )
H = H &prime; &times; 60 H &prime; &GreaterEqual; 0 H &prime; &times; 60 + 360 H &prime; < 0
其中 H &prime; = G - B Max ( R , G , B ) - Min ( R , G , B ) R = Max ( R , G , B ) 2 + B - R Max ( R , G , B ) - Min ( R , G , B ) G = Max ( R , G , B ) 4 + R - G Max ( R , G , B ) - Min ( R , G , B ) B = Max ( R , G , B )
本专利中将色度H分量均分为16个区间,在每个区间下将饱和度S分量均分为8个区间,进行二维直方图的统计。设Hi(h,s)为第i帧图像的H分量S分量的颜色统计直方图,则有:
Hi(h,s)=nh,sh∈[0,180],s∈[0,255]
为了计算方便,将H分量标定在0到180之间,将S分量标定在0到255之间。
为了突出色彩间的差异,算法使用二维卡方的方法进行直方图间的匹配和对比[40],则第k帧和第1帧间的卡方差值表示如下:
d ( H k , H l ) = &Sigma; i &Sigma; j H k &prime; ( i , j ) H l &prime; ( i , j ) &Sigma; i &Sigma; j ( H k &prime; ( i , j ) 2 ( H l &prime; ( i , j ) 2 ) ) - - - ( 3 - 6 )
其中代表了直方图元素偏离直方图均值的程度。当相关度d越大,则表明直方图越匹配,否则表示不匹配。
利用颜色特征的伪聚类算法的具体流程如附图书4所示。图中k是备选帧序列的索引位置,聚类是以备选帧序列为基础,而不是帧图像在视频中的帧号,设startFrm为聚类起始帧,endFrm为聚类结束帧,keyFrm为关键帧,它同样是指在备选帧序列中的位置,最后关键帧在原视频中的帧号保存在备选帧序列结构体中。
附图说明
图1是本发明的算法流程图;
图2是本发明的滑动窗口算法流程图;
图3是本发明的关键帧初检流程图;
图4是本发明的关键帧复检流程图。
具体实施方式
1、基于灰度直方图滑动窗口的关键帧初检
滑动窗口自适应阈值计算流程见流程图2,结合附图,具体流程解释如下:
设滑动窗口的长度为1en,第k帧和第k+1间的灰度直方图差值为d(k,k+1),则滑动窗口内差值的均值为:
avg i , i + len = &Sigma; i = 0 len d ( i , i + 1 ) len
标准差为:
dev i , i + len = &Sigma; i = 0 len ( d ( i , i + 1 ) - avg ) 2 len
所以特征差若要服从滑动窗口的向斯分布,则滑动窗口的下一帧差必须满足式下式,否则认为该帧所包含的内容已经与滑动窗口所描述的内容不相符。
d(k-1,k)<avgk-len,k+devk-len,k
以上分析均为理想状态的情况,对于普遍情况在基于滑动窗口的自适应阈值方法上加入了波动幅度的微调因子T,改动后的判别式如下。
d(k-1,k)<avgk-len,k+T×devk-len,k
关键帧初检的算法流程图如附图3,结合附图,具体流程说明如下:
获取第k帧图像,提取其灰度统计直方图;
若k帧为初始帧,则k++,返回第一步,否则继续;
计算k-1与k帧间的灰度直方图相关差d;
利用滑动窗口法获取自适应阈值Td,
若Td>d,则将此帧归为当前视频镜头序列,以备选关键帧输出;
检查是否到达视频结尾,若是则结束算法;
更新滑动窗口,k++,跳入第一步。
2、基于高频信息检测的光照干扰检测。
算法基本流程为:
第一,求得图像的梯度图;
第二,利用梯度图求得图像的高频量C;
第三,若C大于阈值T则认为图像是受干扰图,否则结束。
3、基于颜色特征的伪聚类关键帧提取。
关键帧复检的流程图见附图4,结合附图具体流程解释如下:
第一,默认k=1帧为startFrm。
第二,查找在颜色特征上与它相似的所有帧序列,直到发现第n帧与滑动窗口计算出的阈值不符,关于滑动窗口自适应阈值计算见上,令endFrm=n。
第三,令起自startFrm,止于endFrm为一个聚类,并取聚类中心元素作为此聚类的关键帧。
第四,检查k是否指向备选帧序列的末尾,如果不是,则令startFrm=endFrm,让k加1后转向第二步;否则结束算法输出关键帧的结果。
利用伪聚类的算法,可以有效的过滤备选帧序列中残余的运动干扰分量,镜头间的编辑帧。

Claims (4)

1.一种基于多维特征向量的关键帧提取算法,其特征在于首先利用基于图像灰度统计直方图特征的快速关键帧提取算法提取备选关键帧;其次,通过基于图像频域的方法对备选关键帧进行光照和模糊化过滤;最后,通过基于HS彩色统计直方图的伪聚类算法的关键帧复检,用以对运动场景或大运动画面的安防视频进行关键帧索引的建立。
2.根据权利要求1所述的算法,其特征在于利用一种基于图像灰度统计直方图的关键帧初检算法进行视频的关键帧快速筛选,首先,将前后两帧图像转换成灰度图并提取其统计直方图;其次,利用卡方分布得出两个灰度统计的相似值,结合整个历史帧之间的相似值,以高斯分布为统计理论基础,建立基于滑动窗口的视频帧序列差异分布;最后利用基于滑动窗口的判定算法,得出视频序列的备选关键帧序列。
3.根据权利要求2所述的算法,其特征在于利用基于滑动窗口的算法进行帧间差异性预计和归类,其特点为,第一,待处理的数据集为一维数据集;第二,滑动窗口算法基于一定的概率统计理论基础根据已经获取到的数据对数据的发展趋势进行预测;第三,根据已有数据的发展趋势来判定当前获取数据是否满足既定趋势。
4.根据权利要求1所述的算法,其特征在于利用基于伪聚类的算法进行对备选关键帧的复检处理,其特点在于,首先,对备选关键帧序列进行伪聚类运算,最终选取每个聚类的聚类中心为最终关键帧;其次,伪聚类算法的特征选取对帧间图像HS颜色空间的统计直方图的卡方分布对比;最后,伪聚类算法的相似性测度选取基于滑动窗口的预测统计方法来规定聚类是否收敛,从而得到最终的一个聚类结果。
CN201210488270.2A 2012-11-16 2012-11-16 一种基于多维特征向量的关键帧提取算法 Active CN103118220B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210488270.2A CN103118220B (zh) 2012-11-16 2012-11-16 一种基于多维特征向量的关键帧提取算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210488270.2A CN103118220B (zh) 2012-11-16 2012-11-16 一种基于多维特征向量的关键帧提取算法

Publications (2)

Publication Number Publication Date
CN103118220A CN103118220A (zh) 2013-05-22
CN103118220B true CN103118220B (zh) 2016-05-11

Family

ID=48416484

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210488270.2A Active CN103118220B (zh) 2012-11-16 2012-11-16 一种基于多维特征向量的关键帧提取算法

Country Status (1)

Country Link
CN (1) CN103118220B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104113789B (zh) * 2014-07-10 2017-04-12 杭州电子科技大学 一种基于深度学习的视频摘要在线生成方法
CN104899861B (zh) * 2015-04-01 2017-10-27 华北电力大学(保定) 一种血管内超声视频中关键帧的自动检索方法
CN104954791B (zh) * 2015-07-01 2018-01-30 中国矿业大学 矿井无线分布式视频编码中的关键帧实时选取方法
CN105100748B (zh) * 2015-08-31 2019-04-19 深圳市茁壮网络股份有限公司 一种视频监控系统及方法
CN106714007A (zh) * 2016-12-15 2017-05-24 重庆凯泽科技股份有限公司 一种视频摘要方法及装置
CN109214253B (zh) * 2017-07-07 2022-11-11 阿里巴巴集团控股有限公司 一种视频帧检测方法及装置
CN110491502B (zh) 2019-03-08 2021-03-16 腾讯科技(深圳)有限公司 显微镜视频流处理方法、系统、计算机设备和存储介质
CN110020093A (zh) * 2019-04-08 2019-07-16 深圳市网心科技有限公司 视频检索方法、边缘设备、视频检索装置及存储介质
CN110110646B (zh) * 2019-04-30 2021-05-04 浙江理工大学 一种基于深度学习的手势图像关键帧提取方法
CN111639601B (zh) * 2020-05-31 2022-05-13 石家庄铁道大学 基于频域特征的视频关键帧提取方法
CN115618155B (zh) * 2022-12-20 2023-03-10 成都泰盟软件有限公司 一种生成动画的方法、装置、计算机设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1851710A (zh) * 2006-05-25 2006-10-25 浙江大学 嵌入式多媒体基于关键帧的视频检索的实现方法
CN101425069A (zh) * 2008-11-12 2009-05-06 哈尔滨工业大学 视频场景关联值的获取方法及应用该方法的视频快速浏览和检索方法
CN101620629A (zh) * 2009-06-09 2010-01-06 中兴通讯股份有限公司 一种提取视频索引的方法、装置及视频下载系统
CN101778257A (zh) * 2010-03-05 2010-07-14 北京邮电大学 用于数字视频点播中的视频摘要片断的生成方法
CN101833650A (zh) * 2009-03-13 2010-09-15 清华大学 一种基于内容的视频复制检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1851710A (zh) * 2006-05-25 2006-10-25 浙江大学 嵌入式多媒体基于关键帧的视频检索的实现方法
CN101425069A (zh) * 2008-11-12 2009-05-06 哈尔滨工业大学 视频场景关联值的获取方法及应用该方法的视频快速浏览和检索方法
CN101833650A (zh) * 2009-03-13 2010-09-15 清华大学 一种基于内容的视频复制检测方法
CN101620629A (zh) * 2009-06-09 2010-01-06 中兴通讯股份有限公司 一种提取视频索引的方法、装置及视频下载系统
CN101778257A (zh) * 2010-03-05 2010-07-14 北京邮电大学 用于数字视频点播中的视频摘要片断的生成方法

Also Published As

Publication number Publication date
CN103118220A (zh) 2013-05-22

Similar Documents

Publication Publication Date Title
CN103118220B (zh) 一种基于多维特征向量的关键帧提取算法
Mandellos et al. A background subtraction algorithm for detecting and tracking vehicles
CN111797653B (zh) 基于高维图像的图像标注方法和装置
US9672434B2 (en) Video-based system and method for parking occupancy detection
CN109918971B (zh) 监控视频中人数检测方法及装置
CN103714181B (zh) 一种层级化的特定人物检索方法
US8630454B1 (en) Method and system for motion detection in an image
DE102015206178A1 (de) Ein Videoverfolgungsbasiertes Verfahren zur automatischen Reihung von Fahrzeugen in Drivethrough-Anwendungen
CN103996046A (zh) 基于多视觉特征融合的人员识别方法
CN102892007A (zh) 促进多个摄像机间颜色平衡同步和获得跟踪的方法和系统
CN101582163B (zh) 视频监控图像中最清晰人脸的捕捉方法
CN109977251A (zh) 一种构建基于rgb直方图特征识别商品的方法
Shakeel et al. Automated multimodal background detection and shadow removal process using robust principal fuzzy gradient partial equation methods in intelligent transportation systems
DE112019007947T5 (de) Verbesserte Erkennung der Face-Liveness mit Hilfe der Analyse von Hintergrund-/Vordergrundbewegungen
CN103927519A (zh) 一种实时人脸检测与过滤方法
Zhu et al. A hybrid algorithm for automatic segmentation of slowly moving objects
CN102625028A (zh) 对视频中存在的静态徽标进行检测的方法和设备
Li et al. Two-layer average-to-peak ratio based saliency detection
US20210117686A1 (en) Methods and systems for customized image and video analysis
Islam et al. Real-time detection of children’s skin on social networking sites using Markov random field modelling
Garg et al. Color based segmentation using K-mean clustering and watershed segmentation
CN113253890A (zh) 视频人像抠图方法、系统和介质
e Souza et al. Survey on visual rhythms: A spatio-temporal representation for video sequences
Abdulghafoor et al. Real-time object detection with simultaneous denoising using low-rank and total variation models
Singh et al. An efficient hybrid scheme for key frame extraction and text localization in video

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 510665, Guangdong, Panyu District province Guangzhou east ring Street Yingbin Road No. 832, Panyu energy saving technology park, Hill Pioneering Center, building 2, district 306, room 1

Applicant after: PCI-Suntektech Co., Ltd.

Address before: 510665 No. 4 construction road, Tianhe Software Park, Guangdong, Guangzhou

Applicant before: PCI-Suntektech Co., Ltd.

COR Change of bibliographic data
C14 Grant of patent or utility model
GR01 Patent grant
DD01 Delivery of document by public notice
DD01 Delivery of document by public notice

Addressee: PCI-Suntektech Co., Ltd.

Document name: Notification of Passing Examination on Formalities

CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: Room 306, area 2, building 1, Fanshan Venture Center, Panyu energy saving science and Technology Park, 832 Yingbin Road, Donghuan street, Panyu District, Guangzhou, Guangdong 510000

Patentee after: Jiadu Technology Group Co.,Ltd.

Address before: 510665 room 306, area 2, building 1, Fanshan Pioneering Center, Panyu energy saving science and Technology Park, 832 Yingbin Road, Donghuan street, Panyu District, Guangzhou City, Guangdong Province

Patentee before: PCI-SUNTEKTECH Co.,Ltd.