CN101360235B

CN101360235B - 视频图像预处理方法

Info

Publication number: CN101360235B
Application number: CN 200710044588
Authority: CN
Inventors: 刘东华; 杨志伟; 张晓亮; 孔华威; 杨立志
Original assignee: SHANGHAI INSTITUTE OF ZHONGKE COMPUTING TECHNOLOGY
Current assignee: Shanghai Institute of Zhongke Computing Technology
Priority date: 2007-08-03
Filing date: 2007-08-03
Publication date: 2011-09-14
Anticipated expiration: 2027-08-03
Also published as: CN101360235A

Abstract

本发明公开了一种视频图像预处理方法，包括如下步骤：初始化噪声点数和噪声阈值；计算当前编码块原始象素与零运动矢量参考块象素差的绝对值集合；所述集合中去掉与噪声点数对应数量的最大值，然后在剩下的点中选出最大值；判断该最大值是否大于噪声阈值；若该最大值大于噪声阈值，则用普通的快速搜索算法搜索各种块模式的最优运动矢量并选择最优块模式编码；若该最大值小于等于噪声阈值，则调整量化步长，按零运动矢量的模式编码。采用上述预处理方法，软件执行时间大大降低，降低幅度可以达到50％左右；在主观质量上，基本不变；码长更是下降了30％以上。总体上，在网络视频监控的应用方面，编码效率以及效果有很大的提高。

Description

视频图像预处理方法

技术领域

本发明涉及一种视频图像预处理方法，具体地说，涉及基于视频监控的AVS视频图像预处理方法。

背景技术

在视频监控的应用中，不同的场合，现场所采集的监视图像存在着不同类型、不同程度的噪声影响。相应地，在后续的视频压缩处理过程中，会增加编码复杂度，从而会对视频压缩效果产生很大影响。所以，在视频监控中，视频预处理的方法的研究与应用倍受关注。

传统的图像预处理方法主要包括噪声滤波、图像增强、图像恢复(复原)以及几何畸变校正等，以达到改善图像质量或有利于计算机后续处理的目的。但是由于图像信息本身的复杂性以及算法本身的复杂性，传统的图像预处理方法难以用较小的代价换取较好的图像质量，在嵌入式开发中难以实现，因为其本身资源有限，很难发挥最佳效果。

在很多现行的视频压缩标准中，如AVS、H.261、H.263、H.264和MPEG-1、MPEG-2、MPEG-4，都使用块匹配算法来获得每一个块的运动矢量。其中使用最广泛的是基于差的绝对值和(SAD，sum of absolute differences)的快速搜索算法，相应的判决准则记为SAD准则。在一个参考帧的搜索窗内，评估所有搜索块的SAD。因为快速搜索算法提前结束的条件是当前最优搜索块的SAD小于预先定义的阈值，如果监视图像不经过任何预处理，前后两帧中主观上看似完全相同的两宏块，由于噪声的影响，SAD值往往很大，不符合提前结束搜索的条件，将继续进行许多不必要的搜索，因此快速算法的效果很差，并且由于噪声这些无用信息编入码流中，使得码长大大增长，而过长的码流往往是实时网络视频监控的一大制肘。

在网络视频监控的应用中，怎样有效的利用图像预处理方法，加快图像编码的速度，获得较好的编码效果，是一项值得深入研究的课题。

发明内容

本发明要解决的技术问题是提供一种视频图像预处理方法，能在确保图像主观质量基本不变的前提下，加快图像编码速度，获得较好的编码效果。

为了达到上述目的，本发明的技术方案如下：

一种视频图像预处理方法，包括如下步骤：初始化噪声点数和噪声阈值；计算当前编码块原始数据与零运动矢量参考块的差的绝对值集合；所述集合中去掉与噪声点数对应数量的最大的值，然后在剩下的点中选出最大值；判断该最大值是否大于噪声阈值；若该最大值大于噪声阈值，则用普通的快速搜索算法搜索各种块模式的最优运动矢量并选择最优块模式编码；若该最大值小于等于噪声阈值，则调整量化步长，按零运动矢量的模式编码。

采用上述预处理方法，相对于普通的基于SAD准则的快速搜索方法以及模式选择方法，软件执行时间大大降低，降低幅度可以达到50％左右；在主观质量上，基本不变；码长更是下降了30％以上。总体上，在网络视频监控的应用方面，编码效率以及效果有很大的提高。

附图说明

图1是本发明的视频图像预处理流程图。

具体实施方式

下面根据图1，给出本发明一个较好实施例，并予以详细描述，使能更好地理解本发明的功能、特点。

AVS的帧间编码是按宏块(16×16)为单位进行编码，每个宏块可分为四种块模式：16×16、16×8、8×16和8×8。每个子块的运动矢量可不同。根据计算SAD代价和率失真(RDO)代价的比较，在以上四种宏块模式以及跳过模式(skip模式)和帧内预测模式中选择最优模式进行编码。首先根据原始块与参考帧中搜索块之间的SAD代价，SAD代价较小者认为较优，分别选择每种块模式的每个子块的最优运动矢量，得出每个子块最优搜索位置，获得每种宏块模式的最优预测值；然后分别计算这四种块模式的RDO代价以及skip模式和帧内预测模式的RDO代价，取RDO代价最小的模式作为最优模式进行编码。

利用图像预处理技术以及视频监控图像的特点(大量的背景图像不动，图像中噪点很多等)，采用排除噪点，以较小的代价，预判断宏块最优编码模式，降低编码复杂度，并采用调整量化步长(QP)的方法，有效的大幅度降低码长。

图1是本发明的视频图像预处理流程图。如图所示，本发明包括如下步骤：

步骤101：初始化噪声点数N，噪声阈值TH；取N＝8，TH＝8。

步骤102：在每个16×16宏块编码之前，计算宏块原始数据与参考帧中零运动矢量的对应宏块的数据的差的绝对值AD[i，j]，其中i，j＝0...15，构成集合AD[n]。

步骤103：在集合AD[n]的256个点中，剔除掉其中值最大的8个点，这8个点对应了初始化噪声点数N，并在剩下的点中取最大值AD[N+1]与噪声阈值TH进行比较。

步骤104：比较最大值AD[N+1]与噪声阈值TH的大小；若最大值AD[N+1]小于等于噪声阈值TH，则进入步骤105；若最大值AD[N+1]大于噪声阈值TH，则跳转至步骤106。

步骤105：认定当前编码块是带有噪点的静止块，或者是极个别的像素有实际的运动变化，采用零运动的16×16块模式编码，增大量化QP，即设定当前宏块编码的量化QP为40进行编码，其他宏块还是按原量化QP进行编码，然后进入步骤107。

步骤106：认定当前编码块不是静止块，需要进行块搜索，寻找最优匹配块以及最优模式编码，然后进入步骤107。

步骤107：判断是否所有宏块均已编码；若否，则回到步骤102；若是，则进入步骤108。

步骤108：准备下一帧的编码。

上述方法虽然对峰值信噪比PSNR的影响稍大，但是，针对网络视频监控而言，客观质量的评价不是主要的，主观质量的评估以及编码码长的大小才是该应用中视频编码的重点关注。另外还可以采用码率控制的方法，在网络带宽资源允许的条件下，自适应的编码，调整编码参数，获得较好解码恢复图像。认定当前编码块是带有噪点的静止块时，设定当前宏块编码的量化QP为40进行编码，其他宏块还是按原量化QP进行编码，有利于保留必要的信息，在主观上不会导致图像的失真，而对那些噪点进行弱化，很大限度的降低了码长，从而降低了对网络传输带宽的要求，更有利于网络视频监控的应用。而认定当前编码块不是静止块时，进行块搜索，寻找最优匹配块以及最优模式编码，针对视频监控视频中有大量静止的背景的特点，只有少量的块属于这种情况，可以在很大程度上降低编码的复杂度，加快编码速度。

将本方法应用于AVS(数字音视频移动多媒体国家标准)标准代码中块模式选择以及编码并与基于普通快速搜索算法以及模式选择编码实验测试，测试针对一种视频格式CIF的视频监控图像序列进行，结果如附页的表1和表2所示，其中表2中A是应用本发明的预处理方法的编码结果，B是原始编码结果。

表1客观性能比较结果

(a)CIF

表2主观性能比较结果

根据上面两个表格中的数据可以看出，采用上述预处理方法，相对于普通的基于SAD准则的快速搜索方法以及模式选择方法，软件执行时间大大降低，降低幅度可以达到50％左右；在主观质量上，基本不变；码长更是下降了30％以上。总体上，在网络视频监控的应用方面，编码效率以及效果有很大的提高。

以上所述的，仅为本发明的较佳实施例，并非用以限定本发明的范围，即凡是依据本发明申请的权利要求书及说明书内容所作的简单、等效变化与修饰，皆落入本发明专利的权利要求保护范围。

Claims

1.一种视频图像预处理方法，包括如下步骤：

初始化噪声点数和噪声阈值；

计算当前编码块原始数据与零运动矢量参考块的差的绝对值集合；

所述集合中去掉与噪声点数对应数量的最大的值的点，然后在剩下的点中选出最大值；

判断该最大值是否大于噪声阈值；

若该最大值大于噪声阈值，则用普通的快速搜索算法搜索各种块模式的最优运动矢量并选择最优块模式编码；若该最大值小于等于噪声阈值，则增大量化步长，按零运动矢量的模式编码。

2.如权利要求1所述的视频图像预处理方法，其特征在于，所述编码块是按16×16的宏块为单位进行编码的。

3.如权利要求2所述的视频图像预处理方法，其特征在于，所述增大量化步长的步骤为设定当前宏块编码的量化步长为40。

4.如权利要求3所述的视频图像预处理方法，其特征在于，初始化噪声点数为8。

5.如权利要求4所述的视频图像预处理方法，其特征在于，初始化噪声阈值为8。

6.如权利要求2至5中任一权利要求所述的视频图像预处理方法，其特征在于，所述宏块可分为16×16、16×8、8×16、8×8四种块模式。

7.如权利要求6所述的视频图像预处理方法，其特征在于，根据计算代价的比较，在所述四种宏块模式以及跳过模式和帧内预测模式中选择最优模式进行编码，具体包括如下步骤：

根据原始块与参考帧中搜索块之间的差的绝对值之和代价，差的绝对值之和代价较小者认为较优，分别选择每种块模式的每个子块的最优运动矢量，得出每个子块最优搜索位置，获得每种宏块模式的最优预测值；

分别计算这四种块模式的率失真代价以及跳过模式和帧内预测模式的率失真代价，取率失真代价最小的模式作为最优模式进行编码。