CN107844779A

CN107844779A - 一种视频关键帧提取方法

Info

Publication number: CN107844779A
Application number: CN201711165320.2A
Authority: CN
Inventors: 罗元; 周寒兴; 张毅
Original assignee: Chongqing University of Post and Telecommunications
Current assignee: Chongqing University of Post and Telecommunications
Priority date: 2017-11-21
Filing date: 2017-11-21
Publication date: 2018-03-27
Anticipated expiration: 2037-11-21
Also published as: CN107844779B

Abstract

本发明请求保护一种视频关键帧提取方法，包括以下步骤：使用ViBe算法融合帧间差分法对所获取的原视频序列进行运动目标检测，得到含有运动目标的关键视频序列；使用全局特征峰值信噪比对关键视频序列进行关键帧粗提取得到候选关键帧序列；使用峰值信噪比建立候选关键帧序列的全局相似度，使用SURF特征点建立候选关键帧序列的局部相似度，加权融合两者获取全局相似度，并利用综合相似度对候选关键帧序列进行自适应关键帧提取，最终得到目标关键帧序列。本发明提供的视频关键帧提取方法能有效提取视频关键帧，明显减少视频数据的冗余信息，简洁表达视频的主要内容，而且该算法复杂度不高，适用于监控视频关键帧的实时提取。

Description

一种视频关键帧提取方法

技术领域

本发明属于视频图像处理领域，特别是一种视频关键帧提取方法。

背景技术

随着多媒体通信技术的发展，视频监控作为安全防范的有效手段被广泛应用于诸多领域。由于全天候的视频监控，其产生了大量的视频数据，但对于用户来说，感兴趣的仅仅是视频中有显著变化的那一小部分。为了从海量视频数据中快速访问有用视频信息，研究人员提出了关键帧提取技术。关键帧是一个代表视频序列中主要内容的有限视频帧集合，而关键帧提取技术能够从原始视频中筛选出用户感兴趣的关键帧序列。

近年来，关键帧的提取已经有了一定的研究。Zhong Qu等人在镜头分割的基础上，提出了一种改进的基于HSV颜色空间的关键帧提取方法。但是，监控视频采用固定场景的监控设备，并没有镜头的切换，所以此法用于监控视频效果不佳。SBTT De等人利用SIFT算法提取图像的局部特征获取关键帧，但是此法的计算速度慢，不利于实时监控。NS Kumar等人利用背景差分检测运动目标提取关键帧，并且不断更新背景模型以适应复杂的环境变化。但是此法针对于水下特殊环境，局限性大。

相比于一般的电影动画视频，监控视频中含有大量纯背景的冗余视频帧，将关键帧提取技术应用于监控视频中可以有效地去除冗余信息，便于用户后续的传送、存储和浏览。但是传统方法提取监控视频关键帧，存在冗余信息多，其内容不具代表性等问题。

发明内容

本发明旨在针对传统的视频关键帧提取方法，存在冗余信息多，其内容不具代表性等问题。本发明提出了一种视频关键帧提取方法，即基于运动目标检测及图像相似度的关键帧提取方法，该方法不仅能有效提取视频关键帧，明显减少视频数据的冗余信息，简洁表达视频的主要内容，而且该算法复杂度不高，适用于实时提取。本发明的技术方案如下：

一种视频关键帧提取方法，其包括以下步骤：

1)、获取待处理原视频数据，对所述待处理原视频数据提取原视频帧序列；

2)、使用视频序列背景减除算法ViBe算法融合帧间差分法对所获取的原视频序列进行运动目标检测，得到含有运动目标的关键视频序列；

3)、对步骤2)所述的关键视频序列利用全局特征峰值信噪比进行关键帧粗提取，获取候选关键帧序列；

4)、对步骤3)所述候选关键帧序列建立视频帧综合相似度，利用视频帧综合相似度对所述候选关键帧序列进行自适应关键帧提取，获取目标关键帧序列。

进一步的，所述步骤2)对待处理视频数据进行运动目标检测，得到含有运动目标的关键视频序列，包括步骤：

对所述视频帧序列中当前两两相邻的视频帧，分别用ViBe算法和帧差法进行处理，并将两种方法处理后的结果进行与运算，作为当前帧运动目标检测结果；

对当前帧运动目标检测结果，判断与设定阈值的大小，若大于设定阈值则将当前帧存入所述关键视频序列，否则舍去当前帧，依次循环，得到含有所述运动目标的关键视频序列。

进一步的，所述步骤3)对关键视频序列利用全局特征峰值信噪比进行关键帧粗提取，得到候选关键帧序列，包括步骤：

从首帧开始，对所述关键视频序列将当前帧依次与后续帧计算其峰值信噪比值；

对所述峰值信噪比值与设定阈值进行比较，直到峰值信噪比值比设定阈值小，将当前的后续帧存入所述候选关键帧序列，当前帧与当前后续帧之间的所有视频帧全部舍去，依次循环，得到所述候选关键帧序列。

进一步的，所述步骤4)对候选关键帧序列建立视频帧综合相似度，利用其对所述候选关键帧序列进行自适应关键帧提取，获取目标关键帧序列，包括步骤：

对候选关键帧序列使用峰值信噪比建立相邻视频帧的全局相似度；

对候选关键帧序列使用SURF特征点建立相邻视频的局部相似度；

对全局相似度与局部相似度进行加权融合得到相邻视频帧的综合相似度；

对候选关键帧序列利用综合相似度计算划分关键帧与冗余帧的自适应阈值；

对候选关键帧序列的相邻视频帧综合相似度，判断与自适应阈值的大小，若小于自适应阈值则加入所述关键帧序列，否则舍去，依次循环得到所述目标关键帧序列。

进一步的，所述相邻视频帧的全局相似度包括：

其中，k_i,k_j为所述候选关键帧序列中的相邻视频帧，P(k_i,k_j)表示两视频帧间的峰值信噪比，i，j均表示候选关键帧序列中的视频帧号，α表示全局相似度的归一化因子，这里设置为视频帧间峰值信噪比的最大值。

进一步的，所述建立视频帧的局部相似度，首先采用SURF特征点描述图像的局部特征，包括：

计算积分图像；使用积分图像完成卷积运算度；

检测特征点；构建Hessian矩阵，然后构建尺度空间，确定特征点；

生成描述子；分配基准方向，生成描述子特征向量；

特征点匹配；通过两个特征点之间的欧氏距离以及Hessian矩阵的迹来确定匹配度。

进一步的，所述相邻视频的局部相似度包括：

其中，k_i，k_j为所述候选关键帧序列中的相邻视频帧，m和n分别为视频帧k_i,k_j的SURF特征点个数，l它们能够匹配的特征点个数。

进一步的，所述相邻视频帧的综合相似度包括：

S(k_i,k_j)＝(1-θ)S_g(k_i,k_j)+θS_l(k_i,k_j)，(i≠j)

其中，k_i，k_j为所述候选关键帧序列中的相邻视频帧，θ为权值，θ＝0.35。

进一步的，所述关键帧与冗余帧的自适应阈值包括：

其中，S_lw、S_gw分别代表所述候选关键帧序列中任意相邻视频帧的局部相似度与全局相似度，M代表候选关键帧序列的总帧数。

本发明的优点及有益效果如下：

本发明提供一种视频关键帧提取方法，该方法能有效地提取视频关键帧，明显减少视频数据的冗余信息，简洁表达视频的主要内容，而且该算法复杂度不高，适用于监控视频的关键帧提取。其中：

选取Vibe算法融合帧差法检测原视频中的运动目标，更合理地划分了视频结构，为后续提取工作缩小了提取范围，节省了计算量。

选取全局特征峰值信噪比对关键帧进行粗提取，其计算简单，进一步缩小提取范围，减少计算量。

选取全局特征峰值信噪比描述候选关键帧序列的全局相似度，局部特征SURF特征点描述候选关键帧序列的局部相似度，并加权融合得到综合相似度，更精确地描述了视频帧的相似度，保证了提取的准确率。

选取候选关键帧序列综合相似度的均值作为划分关键帧与冗余帧的阈值，自适应地选取关键帧数目，保证了提取的查全率。

附图说明

图1是本发明提供优选实施例提供的一种视频关键帧提取方法流程图；

图2表示视频帧，左图为视频帧k_a，右图为视频帧k_b

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅仅是本发明的一部分实施例。

本发明解决上述技术问题的技术方案是：

参见附图一，本发明提供一种视频关键帧提取方法，该方法包括：

获取待处理视频数据。

对所述待处理视频数据进行运动目标检测，得到含有运动目标的关键视频序列H＝{H₁,H₂,···,H_n}。

在本实施例中，上述运动目标检测可以理解为：

对原始视频提取视频帧序列F＝{f₁,f₂,···,f_p}；

将视频序列中的f₁作为关键视频序列H中的首帧h₁，输入视频序列中的f_i(i＝2)，用ViBe算法和帧差法分别处理后的结果进行与运算，作为当前帧的运动目标检测结果Ri；

若运动目标检测结果Ri大于设定阈值，则将当前帧存入关键视频序列H_j(j＝1)，i＝i+1，若i≤p，返回第二步；

若运动目标检测结果Ri小于等于设定的阈值，则舍去当前帧，并令j＝j+1，i＝i+1，若i≤p，返回第二步；

若i＞p，结束循环，得到关键视频序列H＝{H₁,H₂,···,H_n}。

对所述关键视频序列利用全局特征峰值信噪比进行关键帧粗提取，得到候选关键帧序列K＝{k₁,k₂,···,k_m}。

在本实施例中，上述关键帧粗提取可以理解为：

首先提取关键视频帧的全局特征。由于图像的峰值信噪比原理简单，计算速度快，其值越高表示两帧图像相似度越高，反之差异性越大。因此，这里选取峰值信噪比描述视频帧的全局特征。对于任意两个m×n维视频帧k_a和k_b，其示意图如图2所示：图2左图为视频帧k_a，右图为视频帧k_b；

计算它们的均方差为：

其中，矩阵元素代表图像中对应位置的像素值，视频帧k_a中表示为k_a(i,j)，视频帧k_b中表示k_b(i,j)，(i,j)为各像素点的位置坐标。视频帧k_b中标出的加粗数字表示的是相对于视频帧k_a中像素值发生变化的像素点。基于均方差(MSE)可以得到全局特征峰值信噪比(PSNR)如下式表示：

其中，b是每个像素点编码位数，MAX表示图像中像素点可能出现的最大像素值。

经过反复实验得到，当关键视频序列中视频帧间的峰值信噪比P(k_a,k_b)低于24dB时，两帧图像有明显的差异性。

根据上述计算的视频帧间的峰值信噪比，再与阈值作比较，对关键视频序列进行粗提取，简洁有效地去除序列中很大一部分的冗余帧，其主要步骤包括：

依次令关键视频序列H_j＝{h₁,h₂,···,h_q}，(j＝1)的第一帧为候选帧，k_f＝h₁，f＝1，i＝2；

计算峰值信噪比P(k_f,h_i)；

若f＜q且P(k_f,h_i)≤24dB，则令f＝f+1，k_f＝h_i，i＝i+1，返回步骤2，若P(k_f,h_i)＞24dB，并令i＝i+1，返回第二步；

若f＝q，则结束循环，依次得到候选关键帧序列K_j＝{k₁,k₂,···,k_x}，合得候选关键帧序列K＝{K₁,K₂,···,K_y}，即K＝{k₁,k₂,···,k_m}。

对所获得的候选关键帧序列建立视频帧综合相似度，利用其对候选关键帧序列进行自适应关键帧提取，获取目标关键帧序列K'＝{k'₁,k'₂,···,k'_r}。

在本实施例中，上述关键帧提取可以理解为：为了进一步去除候选关键帧序列中的冗余信息，在上述所获取的视频帧间峰值信噪比的基础上自定义了全局相似度，并选取SURF特征点描述图像的局部相似度，加权融合它们获取视频图像的综合相似度，自适应选取阈值从候选关键帧序列中提取关键帧。

首先利用上文所述的全局特征峰值信噪比(PSNR)建立关键视频序列间的全局相似度为：

其中，k_i,k_j∈K，P(k_i,k_j)表示两视频帧间的峰值信噪比，α表示全局相似度的归一化因子，这里设置为视频帧间峰值信噪比的最大值，此时S_g(k_i,k_j)∈(0，1)。

然后建立视频帧的局部相似度，首先采用SURF特征点描述图像的局部特征，包括：

计算积分图像。使用积分图像完成卷积运算可以提高计算速度。

检测特征点。构建Hessian矩阵，然后构建尺度空间，确定特征点。

生成描述子。分配基准方向，生成描述子特征向量。

特征点匹配。通过两个特征点之间的欧氏距离以及Hessian矩阵的迹来确定匹配度。

对上述所获得的候选关键帧序列K中任意相邻的视频帧k_i和k_j，定义关键视频序列的局部相似度为：

其中，k_i，k_j为候选关键帧序列中的相邻视频帧，m和n分别为视频帧k_i,k_j的SURF特征点个数，l它们能够匹配的特征点个数，此时S_l(k_i,k_j)∈(0，1)

对上述所获得的视频帧的全局相似度S_g(k_i,k_j)，局部相似度S_l(k_i,k_j)，加权融合它们得到视频图像的综合相似度，如下式表示：

S(k_i,k_j)＝(1-θ)S_g(k_i,k_j)+θS_l(k_i,k_j)，(i≠j)

其中，k_i，k_j为候选关键帧序列中的相邻视频帧，θ为权值，θ＝0.35。

对上述所获得的视频帧的综合相似度进行自适应阈值选取，保证了对监控视频关键帧提取结果的准确性和有效性，定义的自适应阈值T为：

其中，S_lw、S_gw分别代表候选关键帧序列中相邻视频帧的局部相似度与全局相似度，M代表候选关键帧序列的总帧数。据此选取视频图像综合相似度的均值作为划分冗余帧与关键帧的自适应阈值。

最后对上述所获得的候选关键帧序列进行关键帧提取，主要包括：

令候选关键帧序列中的第一帧视频帧作为关键帧，即：k'_r＝k₁，r＝1，i＝1，j＝2。

计算峰值信噪比P_i(k'_r,k_j)，以及局部相似度S_li(k'_r,k_j)，并令r＝r+1，j＝j+1，k'_r＝k_j，i＝i+1；

若j≤m，则返回上一步。否则，计算全局相似度以及综合相似度S_i(k'_r,k_j)＝(1-θ)S_gi(k'_r,k_j)+θS_li(k'_r,k_j)；

计算自适应阈值

若S_wi(k'_r,k_j)≤T，r＝r+1，k'_r＝k_j。否则，j＝j+1；

如果j≤m，返回步骤(6)上一步。否则，结束循环，输出最终的关键帧序列K'＝{k'₁,k'₂,···,k'_r}。

本发明提供的监控视频关键帧提取方法能有效地提取视频关键帧，明显减少视频数据的冗余信息，简洁表达视频的主要内容，而且该算法复杂度不高，适用于监控视频的关键帧提取，具有很好的使用价值和推广前景。

以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后，技术人员可以对本发明作各种改动或修改，这些等效变化和修饰同样落入本发明权利要求所限定的范围。

Claims

1.一种视频关键帧提取方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的视频关键帧提取方法，其特征在于，所述步骤2)对待处理视频数据进行运动目标检测，得到含有运动目标的关键视频序列，包括步骤：

3.根据权利要求2所述的视频关键帧提取方法，其特征在于，

所述步骤3)对关键视频序列利用全局特征峰值信噪比进行关键帧粗提取，得到候选关键帧序列，包括步骤：

4.根据权利要求3所述的视频关键帧提取方法，其特征在于，所述步骤4)对候选关键帧序列建立视频帧综合相似度，利用其对所述候选关键帧序列进行自适应关键帧提取，获取目标关键帧序列，包括步骤：

5.根据权利要求4所述的视频关键帧提取方法，其特征在于，所述相邻视频帧的全局相似度包括：

<mrow> <msub> <mi>S</mi> <mi>g</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>k</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>k</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mi>&alpha;</mi> </mfrac> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>k</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>k</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>,</mo> <mrow> <mo>(</mo> <mi>i</mi> <mo>&NotEqual;</mo> <mi>j</mi> <mo>)</mo> </mrow> </mrow>

6.根据权利要求5所述的视频关键帧提取方法，其特征在于，所述建立视频帧的局部相似度，首先采用SURF特征点描述图像的局部特征，包括：

计算积分图像；使用积分图像完成卷积运算度；

生成描述子；分配基准方向，生成描述子特征向量；

7.根据权利要求6所述的视频关键帧提取方法，其特征在于，所述相邻视频的局部相似度包括：

<mrow> <msub> <mi>S</mi> <mi>l</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>k</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>k</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mn>2</mn> <mi>l</mi> </mrow> <mrow> <mi>m</mi> <mo>+</mo> <mi>n</mi> </mrow> </mfrac> <mo>,</mo> <mrow> <mo>(</mo> <mi>i</mi> <mo>&NotEqual;</mo> <mi>j</mi> <mo>)</mo> </mrow> </mrow>

8.根据权利要求6所述的视频关键帧提取方法，其特征在于，所述相邻视频帧的综合相似度包括：

S(k_i,k_j)＝(1-θ)S_g(k_i,k_j)+θS_l(k_i,k_j)，(i≠j)

9.根据权利要求8所述的视频关键帧提取方法，其特征在于，所述关键帧与冗余帧的自适应阈值包括：

<mrow> <mi>T</mi> <mo>=</mo> <mfrac> <mn>1</mn> <mi>M</mi> </mfrac> <munderover> <mo>&Sigma;</mo> <mrow> <mi>w</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mi>M</mi> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <mo>&lsqb;</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>-</mo> <mi>&theta;</mi> <mo>)</mo> </mrow> <msub> <mi>S</mi> <mrow> <mi>l</mi> <mi>w</mi> </mrow> </msub> <mo>+</mo> <msub> <mi>&theta;S</mi> <mrow> <mi>g</mi> <mi>w</mi> </mrow> </msub> <mo>&rsqb;</mo> </mrow>