WO2017000465A1

WO2017000465A1 - 矿井无线分布式视频编码中的关键帧实时选取方法

Info

Publication number: WO2017000465A1
Application number: PCT/CN2015/094145
Authority: WO
Inventors: 程德强; 李雷达; 刘海; 张国鹏; 陈伟; 郭星歌
Original assignee: 中国矿业大学
Priority date: 2015-07-01
Filing date: 2015-11-09
Publication date: 2017-01-05
Also published as: CN104954791A; CN104954791B

Abstract

本发明涉及一种矿井无线分布式视频编码中的关键帧实时选取方法，其步骤：构建帧间特性的增量变化曲线：获取视频序列，并提取图像的全局特征和局部特征；采用图像的颜色特征作为衡量图像全局特征的指标；采用特征点作为图像局部特征；根据图像的全局特征和局部特征计算图像综合特征相似度；根据图像综合特征相似度构建帧间特征差增量变化曲线：以帧号为横坐标，以图像帧间的综合特征相似度的累加值为纵坐标，绘制图像帧间特征差增量变化曲线；得到帧间特征差增量变化曲线后，利用关键帧实时选取算法，实现关键帧快速的自适应选取。本发明能实现快速、低复杂度的反映监控图像内容动态变化，有效解决了矿井无线分布式视频编码中的关键帧实时选取问题。

Description

矿井无线分布式视频编码中的关键帧实时选取方法

技术领域

本发明涉及一种关键帧实时选取方法，特别是关于一种矿井无线分布式视频编码中的关键帧实时选取方法。

背景技术

随着矿井采深增加，煤矿灾害日趋严重，对煤矿安全保障水平和应急处置能力提出新的要求。无线视频传感网络利用大量能量受限的微型节点，采集、传输与处理矿井环境实时图像信息，使地面专家和决策人员实时了解救援现场情况，进行科学决策和指挥。在无线视频传感网络中，分布式视频编码采用“帧内编码+帧间解码”技术，通过在解码端发掘视频信号的相关性进行“帧间预测解码”，从而去掉了编码端复杂的帧间预测，具有低复杂度编码的特性，能较好地满足终端视频编码与通信的需求。尤其，针对矿井下充满噪声和电磁干扰的无线传输环境，分布式视频编码与传统的视频编码相比，具有与生俱来的抗信道误码的特性。

解码端边信息的预测精度是影响分布式视频编码的率失真性能的重要因素，在Wyner-Ziv编码框架下，分布式视频编码中解码关键帧的选取，会极大影响边信息生成质量，从而影响分布式视频编码的解码效果。现有的关键帧选取方法在在矿井巷道高噪声、丢包信道下的应用受到挑战，表现为：在矿井分布式视频编码中，关键帧的选取不仅要反映监控区域视频的主要信息内容变化，也要避免提取过多的冗余关键帧在编码传输过程中对矿井带宽受限无线网络带来额外的网络负荷；此外，考虑到矿井爆炸性的工矿环境，还必须具有较低的计算复杂度，满足矿井低功耗硬件在易燃易爆环境中的实时处理。

关键帧选取主要应用视频内容检索和分布式视频编码中，主要方法有：基于镜头分割的方法、基于图像内容分析的方法、基于运动分析的方法、基于聚类的方法。其中，基于镜头分割的方法对于内容变化大，运动较剧烈的视频内容，单一的图像帧不能全面有效的描述镜头的内容，会丢失视频中一些重要的内容；基于图像内容分析的方法会选择过多的关键帧，造成冗余，此外，关键帧的筛选阈值的选择以及底层特征的选择也对关键帧的选择性能有影响；基于运动分析的方法需要计算视频中运动量时需要非常大的计算量，此外，依据局部信息来选取关键帧，鲁棒性不强；基于聚类的方法，将图像帧按照某一相似度分到不同的类中，使得选择的关键帧没有保留在时间上的先后顺序，导致通过观察关键帧无法了解视频的动态信息，并在分布式视频编码中的应用受到限制。由此可知，在当前分布式视频编码中，为提高编码的实时性，在关键帧选取中主要通过周期选取关键帧的方法，没有考虑帧间的相关性，不利于在矿井带宽受限、高噪声环境中的高效视频编码，主要表现为：对于视频序列中运动相对平缓的部分，选取过多的关键帧，消耗了大量的矿井无线网络资源，并对传输节点带来极大的处理负担；而对于运动剧烈或者画面突变的情况，周期选取关键帧又不足以生成高质量的边信息帧，降低了解码端的图像重建质量。

发明内容

针对上述问题，本发明的目的是提供一种矿井无线分布式视频编码中的关键帧实时选取方法，该方法能实现快速、低复杂度的反映监控图像内容动态变化，有效解决了矿井无线分布式视频编码中的关键帧实时选取问题。

为实现上述目的，本发明采取以下技术方案：一种矿井无线分布式视频编码中的关键帧实时选取方法，其特征在于，所述方法包括以下步骤：1)构建帧间特性的增量变化曲线：1.1)获取视频序列，并提取图像的全局特征和局部特征；其中，采用图像的颜色特征作为衡量图像全局特征的指标；采用特征点作为图像局部特征；1.2)根据图像的全局特征和局部特征计算图像综合特征相似度；1.3)根据图像综合特征相似度构建帧间特征差增量变化曲线：以帧号I为横坐标，以图像帧间的综合特征相似度的累加值D为纵坐标，绘制图像帧间特征差增量变化曲线；2)得到帧间特征差增量变化曲线后，利用矿井无线分布式视频编码中的关键帧实时选取算法，实现关键帧快速的自适应选取。

所述步骤1.1)中，优选采用颜色直方图描述图像的全局特征，简化的SURF特征描述图像的局部特征。

所述步骤1.2)中，全局特征相识度计算方法如下：(ⅰ)采用面向视觉感知的HSV颜色模型，在分布式视频编码中，图像经过HSV颜色空间变换后，将色调H、饱和度S和亮度V非等间隔量化；(ⅱ)将非等间隔量化后的色调H、饱和度S和亮度V，再将HSV三个颜色分量合成一维特征矢量G：G＝Q_sQ_vH+Q_vS+V，式中，Q_s表示饱和度S的量化级数；Q_v表示亮度V的量化级数；(ⅲ)利用归一化直方图相交法，求解两帧图像的HSV颜色空间的相似度，来描述两幅图像的全局特征相似度：

其中，L表示一维直方图矢量的位数，

和

分别表示序列中第k帧和第k-1帧图像的HSV直方图中某等级出现的个数，

表示两个直方图在同等级共有的个数，d'为归一化的颜色特征相似度。

所述步骤1.2)中，局部特征相识度计算方法如下：(ⅰ)通过原来图像中每个像素的Hessian矩阵行列式的近似值确定对应的变换图像，并在这个变换图像上寻找特征点，将找到的特征点的位置反映射到原来的图像中；(ⅱ)利用非极大值抑制方法初步确定特征点；(ⅲ)利用三维线性插值法对已知的离散空间点进行插值得到连续空间的极值点，并利用Harr小波特性来选取特征点的主方向；(ⅳ)构造特征点描述算子，以特征点为中心，把大小为20σ的区域划分为4*4个子区域，统计每个子区域中的25个像素的水平和垂直方向的Haar小波响应dx、dy，从而得到一个4维向量(∑d_x,∑d_y,∑|d_x|,∑|d_y|)，由于一共16个子区域，所以最终形成16*4＝64维向量，用此向量作为特征点特征描述；其中σ是特征点所在的尺度；(ⅴ)利用简化的SURF特征点及其特征描述，计算当前帧图像与前一帧图像能匹配的特征点数目占当前帧图像特征点总数的比例d”，进而度量两帧图像局部特征相似度。

所述步骤1.2)中，所述图像综合特征相似度d求解如下：将全局特征与局部特征融合，将图像的全局相似度和局部相似度加权求取图像综合特征相似度d＝0.6d'+0.4d”；式中，0.6为全局特征相似度权重，0.4为局部特征相似度权重。

所述步骤2)中，所述关键帧实时选取算法包括以下步骤：2.1)在编码起始阶段，初始化第一帧作为关键帧，并根据初始的关键帧选择滑动窗口宽度，即所能容纳的最大视频帧数N_max；2.2)依次把随后视频帧送入滑动窗口，计算其图像帧间特征累积平均变化增量，根据该增量与相邻两帧的帧间综合相似度关系选取关键帧并输出。

所述帧间特征累积平均变化增量d_ave(k)为：

其中，d_i,i-1为第i帧和其前一帧的帧间综合相似度，d_ave(k)为当前关键帧到随后的第k帧，所有帧的帧间特征累积平均变化增量。

进一步，若d_k,k-1<d_ave(k)，则说明第k帧和其前一帧的帧间综合相似度较高，需要继续向后进行关键帧判断，滑动窗口宽度增加1，并返回步骤2.2)；如果达到滑动窗口宽度最大值N_max，d_k,k-1<d_ave(k)依然成立，则说明视频图像内容缓慢变化或者静止的画面，根据帧间综合相似度得其帧间特征差增量变化曲线的变化规律。

进一步，若d_k,k-1>d_ave(k)，则说明在当前图像内容发送较大变化，其帧间特征差增量变化曲线的变化规律；选择当前处理的第k帧为关键帧，并初始化滑动窗口宽度N＝1，返回步骤2.2)。

本发明由于采取以上技术方案，其具有以下优点：1、本发明利用图像的全局特征和局部特征共同描述视频帧序列中相邻帧之间相似度，从而在反映监控区域视频的主要信息内容变化的同时，避免提取过多的冗余关键帧在编码传输过程中对矿井带宽受限无线网络带来额外的网络负荷。2、本发明基于相邻帧的综合特征相似度差值，构建帧间特征差增量变化曲线，满足矿井实时处理要求的关键帧选取策略，一方面可自适应调节关键帧选择窗口，满足图像内容变化，避免图像内容变化剧烈时的关键帧漏选和变化平缓时的关键帧冗余问题；另一方面，根据视频内容自适应调整关键帧选择阈值，提高了关键帧的选择质量。3、本发明克服现有关键帧选取方法在矿井巷道高噪声、丢包信道下的应用限制，为矿井无线分布式视频编码中的关键帧实时选取提供解决方案。4、本发明利用综合特征相似度，构建帧间特征差增量变化曲线，不仅能够反映帧间的图像内容变化剧烈程度，具有传统帧间特征差变化曲线的功能，还能够反映帧间特征的累积变化。

附图说明

图1是本发明的整体流程示意图；

图2是本发明的帧间特征差增量变化曲线示意图；

图3是本发明视频图像内容缓慢变化时的帧间特征差增量变化曲线的变化规律示意图；

图4是本发明视频图像内容发送较大变化时的帧间特征差增量变化曲线的变化规律示意图。

具体实施方式

下面结合附图和实施例对本发明进行详细的描述。

如图1所示，针对矿井低照度、电磁干扰严重、易燃易爆的物理环境，本发明提供一种矿井无线分布式视频编码中的关键帧实时选取方法，其包括以下步骤：

1)构建帧间特性的增量变化曲线，描述视频图像帧之间的差异程度，为关键帧的选取提供计算模型：计算视频序列中相邻帧的综合特性相似度量，进而构建帧间特性增量变化曲线。

2)得到帧间特征差增量变化曲线后，利用矿井无线分布式视频编码中的关键帧实时选取算法，实现关键帧快速的自适应选取：根据图像变化内容，调节关键帧提取滑动窗口大小和关键帧选择阈值，实现关键帧快速的自适应选取。

上述步骤1)中，帧间特性的增量变化曲线构建方法如下：

1.1)获取视频序列，并提取图像的全局特征和局部特征；

常用的图像特征有：颜色特征、纹理特征、形状特征和空间关系特征。由于图像的颜色特征对图像本身的尺寸大小、旋转、平移等都不敏感，其鲁棒性高，本发明采用图像的颜色特征作为衡量图像全局特征的指标，来实现快速有效的描述井下视频图像内容；其中，颜色特征有：灰度特征、颜色直方图特征、颜色矩特征、颜色集和颜色空间矢量。

但是，考虑到矿井图像在光照、噪声干扰的图像降质引起的图像颜色特征误差问题，为精确描述图像内容，也需要考虑图像局部特征，本发明采用特征点作为图像局部特征。局部特征代表了图像中一些重要的位置，可以很好的反映图像的局部信息。其中，图像特征点提取算子有Moravec算子、SUSAN算子和Harris算子、SIFT特征点和SURF特征点等。

经仿真实验，本发明利用颜色直方图和简化的SURF特征分别描述图像的全局特征和局部特征，通过随后的综合特性相似度计算，为帧间特性的增量变化曲线提供实时快速的数据支持。

1.2)根据图像的全局特征和局部特征计算图像综合特征相似度：

1.2.1)计算全局特征相识度：

(ⅰ)采用面向视觉感知的HSV颜色模型，在分布式视频编码中，图像经过HSV颜色空间变换后，将色调H、饱和度S和亮度V非等间隔量化；

对图像颜色的空间模型，由于RGB颜色空间数学模型不能够直观的反映人的视觉感知，而面向视觉感知的颜色空间模型对颜色的解释更直观，符合人的视觉感知特性，因此，本发明选用面向视觉感知的HSV颜色模型。

在一个优选的实施例中，为使量化的标准符合人眼的颜色感知，将色调H空间分成8份，饱和度S和亮度V空间分别分成3份，如下式所示。

(ⅱ)将非等间隔量化后的色调H、饱和度S和亮度V，再将HSV三个颜色分量合成一维特征矢量G：

G＝Q_sQ_vH+Q_vS+V， (4)

式中，Q_s表示饱和度S的量化级数；Q_v表示亮度V的量化级数。

(ⅲ)利用归一化直方图相交法，求解两帧图像的HSV颜色空间的相似度，来描述两幅图像的全局特征相似度：

其中，L表示一维直方图矢量的位数，

和

1.2.2)计算局部特征相识度：

(ⅰ)通过原来图像中每个像素的Hessian矩阵行列式的近似值确定对应的变换图像，并在这个变换图像上寻找特征点，将找到的特征点的位置反映射到原来的图像中；

其中，Hessian矩阵用于SIFT特征点和SURF特征点提取。

(ⅱ)利用非极大值抑制方法初步确定特征点：为了找到感兴趣的特征点，在3*3*3的邻域内，将经过每个像素点与其立体邻域的26个(包括和中间检测点同尺度的8个相邻点以及和中间检测点上下相邻尺度的18个点)点进行比较。判断待检测点与这些相邻点的大小，如果待检测点是这些点中的最大值或者最小值，就将它作为初步的特征点保留下来。

(ⅲ)利用三维线性插值法对已知的离散空间点进行插值得到连续空间的极值点，从而使定位的特征点更加准确、稳定，具有代表性，并利用Harr小波特性来选取特征点的主方向。

(ⅳ)构造特征点描述算子，以特征点为中心，把大小为20σ(σ是该特征点所在的尺度)的区域划分为4*4个子区域，统计每个子区域中的25个像素的水平和垂直方向的Haar小波响应dx、dy(水平方向和垂直方向都是相对于步骤(ⅲ)中确定的特征点的主方向)，从而得到一个4维向量(∑d_x,∑d_y,∑|d_x|_,∑|d_y|)，由于一共16个子区域，所以最终形成16*4＝64维向量，用此向量作为特征点特征描述。

(ⅴ)利用简化的SURF特征点及其特征描述，计算当前帧图像与前一帧图像能匹配的特征点数目占当前帧图像特征点总数的比例d”，进而度量两帧图像局部特征相似度。

1.2.3)将全局特征与局部特征融合，将图像的全局相似度和局部相似度加权求取图像综合特征相似度d：

d＝0.6d'+0.4d”， (6)

式中，0.6为全局特征相似度权重，0.4为局部特征相似度权重。全局特征相似度和局部特征相似度权重可根据图像色彩情况选择，如果图像色彩丰富，可提高其全局特征相似度权重d'，反之减低。

1.3)根据图像综合特征相似度构建帧间特征差增量变化曲线：

以帧号I为横坐标，以图像帧间的综合特征相似度的累加值D为纵坐标，绘制图像帧间特征差增量变化曲线，如图2所示。其中，累加值D为：

与传统的帧间特征差变化曲线相比，帧间特征差增量变化曲线具有以下有优点：

1)不仅能够反映帧间的图像内容变化剧烈程度，具有传统帧间特征差变化曲线的功能；还能够反映帧间特征的累积变化。因为图像综合特征相似度d仅能相邻两帧之间的相似度变化，而反应不出来多帧之间的累积变化，因此，对于缓慢变化的图像内容，虽然相邻两帧之间的相似度很大，但是，在多帧之后的图像内容也可能有很大的变化。

2)传统的帧间特征差变化曲线呈现的是不规则变化特点，而帧间特征差增量变化曲线呈现的是正增长规律，便于使用简单方法进行快速的曲线分析。

上述步骤2)中，关键帧实时选取算法包括以下步骤：

2.1)在编码起始阶段，初始化第一帧作为关键帧，并根据初始的关键帧选择滑动窗口宽度，即所能容纳的最大视频帧数N_max；本实施例中优选最大视频帧数N_max＝50。

2.2)依次把随后视频帧送入滑动窗口，计算其图像帧间特征累积平均变化增量，根据该增量与相邻两帧的帧间综合相似度关系选取关键帧并输出。帧间特征累积平均变化增量d_ave(k)为：

其中，d_i,i-1为第i帧和其前一帧(即i-1帧)的帧间综合相似度；d_ave(k)为当前关键帧到随后的第k帧，所有帧的帧间特征累积平均变化增量。

2.2.1)若d_k,k-1<d_ave(k)，则说明第k帧和其前一帧(即k-1帧)的帧间综合相似度较高，需要继续向后进行关键帧判断，滑动窗口宽度增加1，并返回步骤2.2)。如果达到滑动窗口宽度最大值N_max，d_k,k-1<d_ave(k)依然成立，则说明视频图像内容缓慢变化或者静止的画面，根据帧间综合相似度可得其帧间特征差增量变化曲线的变化规律，如图3所示。

但考虑到图像缓慢变化时的累积效应，达到最大滑动窗口宽度时，选择下一帧为关键帧进行分布式编码，并初始化滑动窗口宽度N＝1，返回步骤2.2)。

2.2.2)若d_k,k-1>d_ave(k)，则说明在当前图像内容发送较大变化，其帧间特征差增量变化曲线的变化规律，如图4所示。为提高编码质量，最大限度反映图像内容变化，选择当前处理的第k帧为关键帧，并初始化滑动窗口宽度N＝1，返回步骤2.2)。

上述各实施例仅用于说明本发明，各个步骤都是可以有所变化的，在本发明技术方案的基础上，凡根据本发明原理对个别步骤进行的改进和等同变换，均不应排除在本发明的保护范围之外。

Claims

一种矿井无线分布式视频编码中的关键帧实时选取方法，其特征在于，所述方法包括以下步骤：

1)构建帧间特性的增量变化曲线：

1.1)获取视频序列，并提取图像的全局特征和局部特征；其中，采用图像的颜色特征作为衡量图像全局特征的指标；采用特征点作为图像局部特征；

1.2)根据图像的全局特征和局部特征计算图像综合特征相似度；

1.3)根据图像综合特征相似度构建帧间特征差增量变化曲线：以帧号I为横坐标，以图像帧间的综合特征相似度的累加值D为纵坐标，绘制图像帧间特征差增量变化曲线；

2)得到帧间特征差增量变化曲线后，利用矿井无线分布式视频编码中的关键帧实时选取算法，实现关键帧快速的自适应选取。
如权利要求1所述的矿井无线分布式视频编码中的关键帧实时选取方法，其特征在于：所述步骤1.1)中，优选采用颜色直方图描述图像的全局特征，简化的SURF特征描述图像的局部特征。
如权利要求1或2所述的矿井无线分布式视频编码中的关键帧实时选取方法，其特征在于：所述步骤1.2)中，全局特征相识度计算方法如下：

(ⅰ)采用面向视觉感知的HSV颜色模型，在分布式视频编码中，图像经过HSV颜色空间变换后，将色调H、饱和度S和亮度V非等间隔量化；

(ⅱ)将非等间隔量化后的色调H、饱和度S和亮度V，再将HSV三个颜色分量合成一维特征矢量G：

G＝Q_sQ_vH+Q_vS+V，

式中，Q_s表示饱和度S的量化级数；Q_v表示亮度V的量化级数；

(ⅲ)利用归一化直方图相交法，求解两帧图像的HSV颜色空间的相似度，来描述两幅图像的全局特征相似度：

其中，L表示一维直方图矢量的位数，
和分别表示序列中第k帧和第k-1帧图像的HSV直方图中某等级出现的个数，
表示两个直方图在同等级共有的个数，d'为归一化的颜色特征相似度。
如权利要求1或2所述的矿井无线分布式视频编码中的关键帧实时选取方法，其特征在于：所述步骤1.2)中，局部特征相识度计算方法如下：

(ⅰ)通过原来图像中每个像素的Hessian矩阵行列式的近似值确定对应的变换图像，并在这个变换图像上寻找特征点，将找到的特征点的位置反映射到原来的图像中；

(ⅱ)利用非极大值抑制方法初步确定特征点；

(ⅲ)利用三维线性插值法对已知的离散空间点进行插值得到连续空间的极值点，并利用Harr小波特性来选取特征点的主方向；

(ⅳ)构造特征点描述算子，以特征点为中心，把大小为20σ的区域划分为4*4个子区域，统计每个子区域中的25个像素的水平和垂直方向的Haar小波响应dx、dy，从而得到一个4维向量(∑d_x,∑d_y,∑|d_x|,∑|d_y|)，由于一共16个子区域，所以最终形成16*4＝64维向量，用此向量作为特征点特征描述；其中σ是特征点所在的尺度；

(ⅴ)利用简化的SURF特征点及其特征描述，计算当前帧图像与前一帧图像能匹配的特征点数目占当前帧图像特征点总数的比例d”，进而度量两帧图像局部特征相似度。
如权利要求1或2所述的矿井无线分布式视频编码中的关键帧实时选取方法，其特征在于：所述步骤1.2)中，所述图像综合特征相似度d求解如下：将全局特征与局部特征融合，将图像的全局相似度和局部相似度加权求取图像综合特征相似度d＝0.6d'+0.4d”；式中，0.6为全局特征相似度权重，0.4为局部特征相似度权重。
如权利要求1或2所述的矿井无线分布式视频编码中的关键帧实时选取方法，其特征在于：所述步骤2)中，所述关键帧实时选取算法包括以下步骤：

2.1)在编码起始阶段，初始化第一帧作为关键帧，并根据初始的关键帧选择滑动窗口宽度，即所能容纳的最大视频帧数N_max；

2.2)依次把随后视频帧送入滑动窗口，计算其图像帧间特征累积平均变化增量，根据该增量与相邻两帧的帧间综合相似度关系选取关键帧并输出。
如权利要求6所述的矿井无线分布式视频编码中的关键帧实时选取方法，其特征在于：所述帧间特征累积平均变化增量d_ave(k)为：

其中，d_i,i-1为第i帧和其前一帧的帧间综合相似度，d_ave(k)为当前关键帧到随后的第k帧，所有帧的帧间特征累积平均变化增量。
如权利要求7所述的矿井无线分布式视频编码中的关键帧实时选取方法，其特征在于：若d_k,k-1<d_ave(k)，则说明第k帧和其前一帧的帧间综合相似度较高，需要继续向后进行关键帧判断，滑动窗口宽度增加1，并返回步骤2.2)；如果达到滑动窗口宽度最大值N_max，d_k,k-1<d_ave(k)依然成立，则说明视频图像内容缓慢变化或者静止的画面，根据帧间综合相似度得其帧间特征差增量变化曲线的变化规律。
如权利要求7所述的矿井无线分布式视频编码中的关键帧实时选取方法，其特征在于：若d_k,k-1>d_ave(k)，则说明在当前图像内容发送较大变化，其帧间特征差增量变化曲线的变化规律；选择当前处理的第k帧为关键帧，并初始化滑动窗口宽度N＝1，返回步骤2.2)。