CN101360235A - 视频图像预处理方法 - Google Patents

视频图像预处理方法 Download PDF

Info

Publication number
CN101360235A
CN101360235A CN 200710044588 CN200710044588A CN101360235A CN 101360235 A CN101360235 A CN 101360235A CN 200710044588 CN200710044588 CN 200710044588 CN 200710044588 A CN200710044588 A CN 200710044588A CN 101360235 A CN101360235 A CN 101360235A
Authority
CN
China
Prior art keywords
block
video image
processing method
noise
noise threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200710044588
Other languages
English (en)
Other versions
CN101360235B (zh
Inventor
刘东华
杨志伟
张晓亮
孔华威
杨立志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Institute of Zhongke Computing Technology
Original Assignee
SHANGHAI INSTITUTE OF ZHONGKE COMPUTING TECHNOLOGY
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI INSTITUTE OF ZHONGKE COMPUTING TECHNOLOGY filed Critical SHANGHAI INSTITUTE OF ZHONGKE COMPUTING TECHNOLOGY
Priority to CN 200710044588 priority Critical patent/CN101360235B/zh
Publication of CN101360235A publication Critical patent/CN101360235A/zh
Application granted granted Critical
Publication of CN101360235B publication Critical patent/CN101360235B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种视频图像预处理方法,包括如下步骤:初始化噪声点数和噪声阈值;计算当前编码块原始像素与零运动矢量参考块像素差的绝对值集合;所述集合中去掉与噪声点数对应数量的最大值,然后在剩下的点中选出最大值;判断该最大值是否大于噪声阈值;若该最大值大于噪声阈值,则用普通的快速搜索算法搜索各种块模式的最优运动矢量并选择最优块模式编码;若该最大值小于等于噪声阈值,则调整量化步长,按零运动矢量的模式编码。采用上述预处理方法,软件执行时间大大降低,降低幅度可以达到50%左右;在主观质量上,基本不变;码长更是下降了30%以上。总体上,在网络视频监控的应用方面,编码效率以及效果有很大的提高。

Description

视频图像预处理方法
技术领域
本发明涉及一种视频图像预处理方法,具体地说,涉及基于视频监控的AVS视频图像预处理方法。
背景技术
在视频监控的应用中,不同的场合,现场所采集的监视图像存在着不同类型、不同程度的噪声影响。相应地,在后续的视频压缩处理过程中,会增加编码复杂度,从而会对视频压缩效果产生很大影响。所以,在视频监控中,视频预处理的方法的研究与应用倍受关注。
传统的图像预处理方法主要包括噪声滤波、图像增强、图像恢复(复原)以及几何畸变校正等,以达到改善图像质量或有利于计算机后续处理的目的。但是由于图像信息本身的复杂性以及算法本身的复杂性,传统的图像预处理方法难以用较小的代价换取较好的图像质量,在嵌入式开发中难以实现,因为其本身资源有限,很难发挥最佳效果。
在很多现行的视频压缩标准中,如AVS、H.261、H.263、H.264和MPEG-1、MPEG-2、MPEG-4,都使用块匹配算法来获得每一个块的运动矢量。其中使用最广泛的是基于差的绝对值和(SAD,sum of absolute differences)的快速搜索算法,相应的判决准则记为SAD准则。在一个参考帧的搜索窗内,评估所有搜索块的SAD。因为快速搜索算法提前结束的条件是当前最优搜索块的SAD小于预先定义的阈值,如果监视图像不经过任何预处理,前后两帧中主观上看似完全相同的两宏块,由于噪声的影响,SAD值往往很大,不符合提前结束搜索的条件,将继续进行许多不必要的搜索,因此快速算法的效果很差,并且由于噪声这些无用信息编入码流中,使得码长大大增长,而过长的码流往往是实时网络视频监控的一大制肘。
在网络视频监控的应用中,怎样有效的利用图像预处理方法,加快图像编码的速度,获得较好的编码效果,是一项值得深入研究的课题。
发明内容
本发明要解决的技术问题是提供一种视频图像预处理方法,能在确保图像主观质量基本不变的前提下,加快图像编码速度,获得较好的编码效果。
为了达到上述目的,本发明的技术方案如下:
一种视频图像预处理方法,包括如下步骤:初始化噪声点数和噪声阈值;计算当前编码块原始数据与零运动矢量参考块的差的绝对值集合;所述集合中去掉与噪声点数对应数量的最大的值,然后在剩下的点中选出最大值;判断该最大值是否大于噪声阈值;若该最大值大于噪声阈值,则用普通的快速搜索算法搜索各种块模式的最优运动矢量并选择最优块模式编码;若该最大值小于等于噪声阈值,则调整量化步长,按零运动矢量的模式编码。
采用上述预处理方法,相对于普通的基于SAD准则的快速搜索方法以及模式选择方法,软件执行时间大大降低,降低幅度可以达到50%左右;在主观质量上,基本不变;码长更是下降了30%以上。总体上,在网络视频监控的应用方面,编码效率以及效果有很大的提高。
附图说明
图1是本发明的视频图像预处理流程图。
具体实施方式
下面根据图1,给出本发明一个较好实施例,并予以详细描述,使能更好地理解本发明的功能、特点。
AVS的帧间编码是按宏块(16×16)为单位进行编码,每个宏块可分为四种块模式:16×16、16×8、8×16和8×8。每个子块的运动矢量可不同。根据计算SAD代价和率失真(RDO)代价的比较,在以上四种宏块模式以及跳过模式(skip模式)和帧内预测模式中选择最优模式进行编码。首先根据原始块与参考帧中搜索块之间的SAD代价,SAD代价较小者认为较优,分别选择每种块模式的每个子块的最优运动矢量,得出每个子块最优搜索位置,获得每种宏块模式的最优预测值;然后分别计算这四种块模式的RDO代价以及skip模式和帧内预测模式的RDO代价,取RDO代价最小的模式作为最优模式进行编码。
利用图像预处理技术以及视频监控图像的特点(大量的背景图像不动,图像中噪点很多等),采用排除噪点,以较小的代价,预判断宏块最优编码模式,降低编码复杂度,并采用调整量化步长(QP)的方法,有效的大幅度降低码长。
图1是本发明的视频图像预处理流程图。如图所示,本发明包括如下步骤:
步骤101:初始化噪声点数N,噪声阈值TH;取N=8,TH=8。
步骤102:在每个16×16宏块编码之前,计算宏块原始数据与参考帧中零运动矢量的对应宏块的数据的差的绝对值AD[i,j],其中i,j=0…15,构成集合AD[n]。
步骤103:在集合AD[n]的256个点中,剔除掉其中值最大的8个点,这8个点对应了初始化噪声点数N,并在剩下的点中取最大值AD[N+1]与噪声阈值TH进行比较。
步骤104:比较最大值AD[N+1]与噪声阈值TH的大小;若最大值AD[N+1]小于等于噪声阈值TH,则进入步骤105;若最大值AD[N+1]大于噪声阈值TH,则跳转至步骤106。
步骤105:认定当前编码块是带有噪点的静止块,或者是极个别的像素有实际的运动变化,采用零运动的16×16块模式编码,增大量化QP,即设定当前宏块编码的量化QP为40进行编码,其他宏块还是按原量化QP进行编码,然后进入步骤107。
步骤106:认定当前编码块不是静止块,需要进行块搜索,寻找最优匹配块以及最优模式编码,然后进入步骤107。
步骤107:判断是否所有宏块均已编码;若否,则回到步骤102;若是,则进入步骤108。
步骤108:准备下一帧的编码。
上述方法虽然对峰值信噪比PSNR的影响稍大,但是,针对网络视频监控而言,客观质量的评价不是主要的,主观质量的评估以及编码码长的大小才是该应用中视频编码的重点关注。另外还可以采用码率控制的方法,在网络带宽资源允许的条件下,自适应的编码,调整编码参数,获得较好解码恢复图像。认定当前编码块是带有噪点的静止块时,设定当前宏块编码的量化QP为40进行编码,其他宏块还是按原量化QP进行编码,有利于保留必要的信息,在主观上不会导致图像的失真,而对那些噪点进行弱化,很大限度的降低了码长,从而降低了对网络传输带宽的要求,更有利于网络视频监控的应用。而认定当前编码块不是静止块时,进行块搜索,寻找最优匹配块以及最优模式编码,针对视频监控视频中有大量静止的背景的特点,只有少量的块属于这种情况,可以在很大程度上降低编码的复杂度,加快编码速度。
将本方法应用于AVS(数字音视频移动多媒体国家标准)标准代码中块模式选择以及编码并与基于普通快速搜索算法以及模式选择编码实验测试,测试针对一种视频格式CIF的视频监控图像序列进行,结果如附页的表1和表2所示,其中表2中A是应用本发明的预处理方法的编码结果,B是原始编码结果。
表1  客观性能比较结果
(a)CIF
Figure A20071004458800061
表2  主观性能比较结果
Figure A20071004458800062
根据上面两个表格中的数据可以看出,采用上述预处理方法,相对于普通的基于SAD准则的快速搜索方法以及模式选择方法,软件执行时间大大降低,降低幅度可以达到50%左右;在主观质量上,基本不变;码长更是下降了30%以上。总体上,在网络视频监控的应用方面,编码效率以及效果有很大的提高。
以上所述的,仅为本发明的较佳实施例,并非用以限定本发明的范围,即凡是依据本发明申请的权利要求书及说明书内容所作的简单、等效变化与修饰,皆落入本发明专利的权利要求保护范围。

Claims (7)

1、一种视频图像预处理方法,包括如下步骤:
初始化化噪声点数和噪声阈值;
计算当前编码块原始数据与零运动矢量参考块的差的绝对值集合;
所述集合中去掉与噪声点数对应数量的最大的值,然后在剩下的点中选出最大值;
判断该最大值是否大于噪声阈值;
若该最大值大于噪声阈值,则用普通的快速搜索算法搜索各种块模式的最优运动矢量并选择最优块模式编码;若该最大值小于等于噪声阈值,则增大量化步长,按零运动矢量的模式编码。
2、如权利要求1所述的视频图像预处理方法,其特征在于,所述编码块是按16×16的宏块为单位进行编码的。
3、如权利要求2所述的视频图像预处理方法,其特征在于,所述增大量化步长的步骤为设定当前宏块编码的量化步长为40。
4、如权利要求3所述的视频图像预处理方法,其特征在于,初始化噪声点数为8。
5、如权利要求4所述的视频图像预处理方法,其特征在于,初始化噪声阈值为8。
6、如权利要求2至5中任一权利要求所述的视频图像预处理方法,其特征在于,所述宏块可分为16×16、16×8、8×16、8×8四种块模式。
7、如权利要求6所述的视频图像预处理方法,其特征在于,根据计算代价的比较,在所述四种宏块模式以及跳过模式和帧内预测模式中选择最优模式进行编码,具体包括如下步骤:
根据原始块与参考帧中搜索块之间的差的绝对值之和代价,差的绝对值之和代价较小者认为较优,分别选择每种块模式的每个子块的最优运动矢量,得出每个子块最优搜索位置,获得每种宏块模式的最优预测值;
分别计算这四种块模式的率失真代价以及跳过模式和帧内预测模式的率失真代价,取率失真代价最小的模式作为最优模式进行编码。
CN 200710044588 2007-08-03 2007-08-03 视频图像预处理方法 Expired - Fee Related CN101360235B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200710044588 CN101360235B (zh) 2007-08-03 2007-08-03 视频图像预处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200710044588 CN101360235B (zh) 2007-08-03 2007-08-03 视频图像预处理方法

Publications (2)

Publication Number Publication Date
CN101360235A true CN101360235A (zh) 2009-02-04
CN101360235B CN101360235B (zh) 2011-09-14

Family

ID=40332558

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200710044588 Expired - Fee Related CN101360235B (zh) 2007-08-03 2007-08-03 视频图像预处理方法

Country Status (1)

Country Link
CN (1) CN101360235B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102118546A (zh) * 2011-03-22 2011-07-06 上海富瀚微电子有限公司 一种视频图像噪声估计算法的快速实现方法
CN110536134A (zh) * 2019-09-27 2019-12-03 腾讯科技(深圳)有限公司 视频编码、解码方法和装置、存储介质及电子装置
WO2020147226A1 (zh) * 2019-01-16 2020-07-23 Oppo广东移动通信有限公司 信息处理方法及装置、设备、存储介质
CN114302139A (zh) * 2021-12-10 2022-04-08 阿里巴巴(中国)有限公司 视频编码方法、视频解码方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100586186C (zh) * 2006-01-26 2010-01-27 天津大学 一种快速帧间预测模式选择方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102118546A (zh) * 2011-03-22 2011-07-06 上海富瀚微电子有限公司 一种视频图像噪声估计算法的快速实现方法
CN102118546B (zh) * 2011-03-22 2012-07-25 上海富瀚微电子有限公司 一种视频图像噪声估计算法的快速实现方法
WO2020147226A1 (zh) * 2019-01-16 2020-07-23 Oppo广东移动通信有限公司 信息处理方法及装置、设备、存储介质
CN110536134A (zh) * 2019-09-27 2019-12-03 腾讯科技(深圳)有限公司 视频编码、解码方法和装置、存储介质及电子装置
CN114302139A (zh) * 2021-12-10 2022-04-08 阿里巴巴(中国)有限公司 视频编码方法、视频解码方法及装置

Also Published As

Publication number Publication date
CN101360235B (zh) 2011-09-14

Similar Documents

Publication Publication Date Title
CN101321287B (zh) 基于运动目标检测的视频编码方法
RU2377737C2 (ru) Способ и устройство для преобразования с повышением частоты кадров с помощью кодера (ea-fruc) для сжатия видеоизображения
CN101919249B (zh) 资源自适应视频的内插或外推
CN1267817C (zh) 用于衰落补偿的信号指示
US11375186B2 (en) Encoder, decoder, encoding method, and decoding method
CN109862356B (zh) 一种基于感兴趣区域的视频编码方法及系统
CN110650349B (zh) 一种图像编码方法、解码方法、编码器、解码器及存储介质
CN1848956A (zh) 用于改良视频编码中的错误隐藏的错误隐藏方法和编码器
CN105578181B (zh) 一种hevc中屏幕内容压缩的快速帧内模式决策和块匹配方法
CN102986211A (zh) 视频编码中的速率控制
CN101098473A (zh) 一种图像编码方法及装置
JP2015508954A (ja) オブジェクト検出情報に基づく符号化
JP2015136172A (ja) 映像復号化装置
CN106303521B (zh) 一种基于感知敏感度的hevc率失真优化方法
US11233993B2 (en) Encoder, decoder, encoding method, and decoding method
CN112543328B (zh) 辅助编码方法、装置、计算机设备及存储介质
US20220264090A1 (en) Encoder, decoder, encoding method, and decoding method
CN110351552B (zh) 视频编码中一种快速编码方法
CN101360235B (zh) 视频图像预处理方法
JP2007110568A (ja) 画像符号化装置
CN1266947C (zh) 活动图象压缩编码装置及运动矢量检测方法
CN101540900A (zh) 降低视频流中的区块效应的方法
CN113422959A (zh) 视频编解码的方法、装置、电子设备及存储介质
Zhu et al. Information hiding algorithm for H. 264 based on the motion estimation of quarter-pixel
KR101220097B1 (ko) 분산비디오 코덱 장치 및 이를 이용한 전경 영역 분할 보조정보 생성 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: KONG HUAWEI

Free format text: FORMER OWNER: LIU DONGHUA

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20110819

Address after: 13, No. 116, Lane 572, Lane 201203, blue wave road, Shanghai, Pudong New Area

Applicant after: Shanghai Institute of Zhongke Computing Technology

Co-applicant after: Kong Huawei

Address before: 13, No. 116, Lane 572, Lane 201203, blue wave road, Shanghai, Pudong New Area

Applicant before: Shanghai Institute of Zhongke Computing Technology

Co-applicant before: Liu Donghua

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110914

Termination date: 20150803

EXPY Termination of patent right or utility model