CN101783954B - 一种视频图像编解码方法 - Google Patents

一种视频图像编解码方法 Download PDF

Info

Publication number
CN101783954B
CN101783954B CN 201010126747 CN201010126747A CN101783954B CN 101783954 B CN101783954 B CN 101783954B CN 201010126747 CN201010126747 CN 201010126747 CN 201010126747 A CN201010126747 A CN 201010126747A CN 101783954 B CN101783954 B CN 101783954B
Authority
CN
China
Prior art keywords
rearrangement
transforming
function
encoding
transformation function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 201010126747
Other languages
English (en)
Other versions
CN101783954A (zh
Inventor
张贻雄
石江宏
柳素华
汤碧玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen University
Original Assignee
Xiamen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen University filed Critical Xiamen University
Priority to CN 201010126747 priority Critical patent/CN101783954B/zh
Publication of CN101783954A publication Critical patent/CN101783954A/zh
Application granted granted Critical
Publication of CN101783954B publication Critical patent/CN101783954B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开一种视频图像编解码方法,其中编码包括以下步骤:(1)对视频图像进行编码块分割,输入视频图像是经过帧内/帧间预测的残差图像或原始图像数据;(2)对编码块中的像素点坐标进行坐标变换,使编码块的方向尽可能与水平或垂直一致;(3)对前述编码块进行二维正交变换,使信号的变换系数尽可能集中在低频部分,消除信号的空间冗余;(4)对频域变换后的系数进行量化以及熵编码,同时把像素重排的方向等信息编入码流;解码为对前述编码块进行逆运算。这种方法在编码时对视频图像进行像素重排,通过改变像素分布来减少正交变换后的高频非零系数,提高变换的压缩效率。

Description

一种视频图像编解码方法
技术领域
本发明涉及数字视频图像的编解码方法,尤其是一种基于像素重排的用于压缩视频图像的变换方法。
背景技术
为实时高效地传输视频图像,需对图像进行压缩编码。传统的MPEGx和H.26x等基于运动补偿和频域变换相结合的视频编码方案中,如图2所示,运动补偿用来消除图像序列的时间轴冗余度,频域正交变换则用来消除图像信号的空间冗余度。对于原始图像而言,其信号相关性强,变换系数主要集中于直流和低频系数,量化后高频分量大多数为0,压缩效率较高。而对于运动补偿预测残差信号,正交变换的压缩效率并不理想,原因在于经过运动补偿的残差信号的相关性大大降低,残差信号的协方差矩阵与Toepl itz矩阵形式差别较大,残差信号经过变换后,其变换系数集中性较差,仍存在大量的冗余信息。
针对传统DCT变换的缺陷,Zeng(参见B.Zeng and J.-J.Fu,“Directional discrete cosine transforms forimage coding,”IEEE International Conference on Multimedia and Expo.(ICME’06),pp.721-724,July 2006,Toronto,Canada.)等人提出采用形状DCT变换对图像进行编码,获得比JPEG更好的压缩性能。该方法的缺点是形状DCT主要针对原始图像块内包含两种不同特征的内容,并不适于残差信号。
在基于分块的视频图像压缩编码方案中,无论是原始图像块,还是经过运动补偿的残差图像块,均表现出与物体边缘或图像纹理相一致的方向性。具有非水平/垂直方向的图像块,经过传统二维DCT后,易产生较多高频系数,导致压缩效率难以继续提高。本发明针对这一缺陷,提出一种新型的视频图像压缩方法。
发明内容
本发明的主要目的,在于提供一种视频图像编解码方法,其在编码时对视频图像进行像素重排,而不需对视频图像进行旋转、变形、插值等操作,通过改变像素分布来尽可能减少正交变换后的高频非零系数,提高压缩效率。
为了达成上述目的,本发明的解决方案是:
一种视频图像编解码方法,其中编码包括以下步骤:
(1)对输入视频图像进行编码块分割,每个编码块的大小为M×N,输入视频图像可以是经过帧内/帧间预测的残差图像,也可以是原始图像数据;
(2)对前述大小为M×N的编码块中的像素点坐标(i,j)进行坐标变换R(i,j)=(k,l),其中0≤i<M,0≤j<N,0≤k<M,0≤l<N,其中重排变换函数R(·)为可逆变换,经过重排变换,使编码块的方向尽可能与水平或垂直一致;若R(i,j)=(i,j)则为一致变换;
(3)对前述编码块进行二维正交变换,使信号的变换系数尽可能集中在低频部分,消除信号的空间冗余;
(4)对频域变换后的系数进行量化以及熵编码,同时把像素重排的方向等信息编入码流;
解码为对前述编码块进行逆运算。
上述编码步骤(2)中,获取重排变换函数的步骤为:
(21)通过遍历搜索方法预测该编码块的重排方案,按照一定步长取一系列离散的重排角度值;
(22)按照选定的一系列重排角度值对编码块进行像素重排,并计算该方案的率失真代价;
(23)综合分析各种重排方案,选择率失真代价最小的角度所对应的重排变换函数作为最优的重排变换函数。
上述编码步骤(2)中,获取重排变换函数的步骤为:
(21)通过边缘检测来预测该编码块的重排方案,以检测出来的边缘方向及邻近方向作为候选重排角度;
(22)按照候选的重排角度对编码块进行像素重排,并计算该方案的率失真代价;
(23)综合分析各种重排方案,选择率失真代价最小的角度所对应的重排变换函数作为最优的重排变换函数。
上述编码步骤(2)中,获取重排变换函数的步骤为:
(21)任意选定一系列的重排变换函数R1(·)、R2(·)、......Rs(·),这些函数均为可逆变换;
(22)对编码步骤(1)中的大小为M×N的编码块的像素点坐标(i,j)通过上述变换函数一一映射到坐标(k,l),其中0≤i<M,0≤j<N,0≤k<M,0≤l<N,并计算各种重排变换函数的率失真代价;
(23)综合分析各种重排变换函数,选择率失真代价最小的角度所对应的重排变换函数Rt(·)(1≤t≤s)为最优的重排变换函数。
采用上述方案后,本发明针对传统二维正交变换对视频图像残差信号的非水平/非垂直方向性敏感的特点,通过对待编码视频图像信号的像素位置进行重新排列,将图像/残差信号的边界方向尽可能调整到水平/垂直方向,再进行二维正交变换,从而尽可能减少变换后的高频非零系数,提高变换的压缩效率。
附图说明
图1是H.264编码的运动补偿残差图;
图2是为现有视频图像的编解码流程示意图;
图3是本发明所提供的编解码的流程示意图;
图4是本发明应用列循环移位的示意图;
图5是本发明应用行循环移位的示意图;
图6是本发明以foreman_qcif为例的测试结果波形图。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步的详细说明。
参考图3所示,本发明揭示一种视频图像的编码方法,包括如下步骤:
步骤1、对输入视频图像进行编码块分割,使每个编码块的大小为M×N,该输入视频图像可以是经过帧内/帧间预测的残差图像,也可以是原始图像数据;
此处可将图像分成16×16,16×8,8×16,8×8等各种大小的块,编码块的大小可以是自适应的,当然,此处编码块不一定是矩形,也可以是三角形或梯形等其它非矩形,但在后述的步骤2中,进行像素重排的输入块必须是矩形形态,因此,若编码块为非矩形,还需对图像重新组织;
步骤2、对前述大小为M×N的编码块中的像素点坐标(i,j)进行坐标变换R(i,j)=(k,l),其中0≤i<M,0≤j<N,0≤k<M,0≤l<N,前述R(·)为可逆变换,称为重排变换函数(或过程),经过重排变换,使编码块的方向尽可能与水平或垂直一致;若R(i,j)=(i,j)则为一致变换;
同时参照图4和图5,为本发明的第一实施例,图1中所示为foreman的一个运动补偿残差帧,通过对运动补偿残差图像的观察,对16×16,16×8和8×16三种模式的编码块进行像素重排,具体实现步骤如下:
步骤21、采用遍历搜索方法获取编码块的重排方案,按照一定步长Δθ取一系列离散的重排角度值
Θ∈{θ0,θ0+Δθ,θ0+2Δθ,...}。
步骤22、按照步骤21选定的一系列重排角度值对残差图像或原始图像进行像素重排,并计算每种重排方案的率失真代价。当重排角度与x轴的夹角满足|θ|≤π/4,采用列循环移位,如图4中的箭头方向所示;当重排角度与x轴的夹角满足π/4<|θ|≤π/2时,采用行循环移位,如图5中的箭头方向。
假设原始像素位置为n=(i,j)T,像素重排后的像素位置为m=R(n)=(k,l)T,m与n的关系可以用下式表示:
Figure GSA00000035291600051
R ( &theta; ) = R V ( &theta; ) | &theta; | &le; &pi; / 4 R H ( &theta; ) &pi; / 4 < | &theta; | &le; &pi; / 2
其中N为像素块的大小,如本例N=8,mod为取模操作,以实现循环移位,而
R V ( &theta; ) = 1 0 tan &theta; 1
R H ( &theta; ) = 1 1 / tan &theta; 0 1
步骤23、综合分析各种重排方案,选择率失真代价最小的角度,如图4中的θ′所对应的重排变换函数,作为最优的重排变换函数。
其中率失真代价由一个率失真代价函数J(θ)=D(θ)+λR(θ)求得,D(θ)表示重建图与原始图之间的误差(如平方差和SSD),λ是拉格朗日乘子,R(θ)表示编码宏块头、运动信息和DCT系数所需的比特数。对于R(θ)又从不考虑重排信息的比特开销(RDCT without info)和考虑重排信息的比特开销(RDCT with info)两种情况评测其综合性能。
本发明还提供另一较佳实施例,与前述遍历搜索的方法不同,本实施例采用边缘检测来预测编码块的重排方案,以检测出来的边缘方向(见图4及图5中的θ′)及邻近方向作为候选重排角度,然后综合分析各种候选重排方案,选择率失真代价最小的角度,此处与前述实施例相同,故不再赘述。
本发明还提供第三种实施例具体实现步骤如下:
步骤21、任意选定一系列的重排变换函数R1(·)、R2(·)、......Rs(·),这些函数均为可逆变换;
步骤22、对编码步骤1中的大小为M×N的编码块的像素点坐标(i,j)通过上述变换函数一一映射到坐标(k,l),其中0≤i<M,0≤j<N,0≤k<M,0≤l<N,并计算各种重排变换函数的率失真代价;
步骤23、综合分析各种重排方案,选择率失真代价最小的角度所对应的重排变换函数Rt(·)(1≤t≤s)。
步骤3、对所得编码块进行二维正交变换,使信号的变换系数尽可能集中在低频部分,消除信号的空间冗余;
步骤4、对频域变换后的系数进行量化、特定ZIG-ZAG扫描或其它扫描以及熵编码,同时把像素重排的方向等信息编入码流。
而在解码端,只需对前述编码块进行逆运算,具体可参考图3所示,首先进行熵解码、反量化及反频域变换,然后对编码块进行坐标反变换,重建输入块,也即前述编码过程是对像素的坐标(i,j)进行R(·)变换,而此处解码时,需对像素进行坐标反变换R-1(·),从而重建输入块。
最后在H.264的测试模型jm8.6平台上对重排DCT进行验证测试,仅针对帧间预测的残差数据进行重排DCT编码。
通过对视频片段的测试我们可以得出在不考虑重排信息时,平均码率节省分别为5.78%和4.26%。而在考虑重排信息以后,高码率的性能增益明显高于低码率的性能增益,高码率平均性能增益为2.46%,而低码率只为1.51%。在Foreman等具有较明显的边界信息的视频中,重排DCT的增益较为显著。图6是在jm8.6平台上对foreman的一个测试结果。
以上所述实施例仅表达了本发明中几种较佳的实施方式,其仅用于说明而非限制本发明的技术方案,本领域的普通技术人员应当理解:在不脱离本发明的构思的前提下,还可以做出适当的修改和局部的替换,其均应涵盖在本发明的权利要求范围当中。

Claims (4)

1.一种视频图像编解码方法,其特征在于编码包括以下步骤:
(1)对输入视频图像进行编码块分割,每个编码块的大小为M×N,该输入视频图像为经过帧内/帧间预测的残差图像或原始图像数据;
(2)确定该编码块像素点的重排变换函数R(·),对前述大小为M×N的编码块中的像素点坐标(i,j)进行坐标变换,完成对编码块像素点的重排变换,使重排后的编码块中沿物体边缘或图像纹理方向的像素点的排列方向尽可能与水平方向或垂直方向一致,该坐标变换公式为R(i,j)=(k,l),其中0≤i<M,0≤j<N,0≤k<M,0≤1<N,R(·)为可逆变换的重排变换函数;若R(i,j)=(i,j),则为一致变换;
(3)对前述重排后的编码块进行二维正交变换,得到M×N个变换系数组成的变换块,该变换系数尽可能地集中在低频部分,消除像素点的空间冗余;
(4)对前述变换块的变换系数进行量化以及熵编码,连同表达重排变换函数R(·)的信息一起编入码流;
解码为对前述编码块进行逆运算。
2.如权利要求1所述的一种视频图像编解码方法,其特征在于:
所述编码步骤(2)中,确定重排变换函数R(·)的步骤为:
(21)通过遍历搜索方法,按照一定步长取一系列离散的重排角度值,获得该编码块的候选重排变换函数;
(22)按照选定的一系列候选重排角度值对编码块进行像素重排,并分别计算各候选重排变换函数的率失真代价;
(23)选择其中率失真代价最小的重排变换函数作为最优的重排变换函数R(·)。
3.如权利要求1所述的一种视频图像编解码方法,其特征在于:所述编码步骤(2)中,确定重排变换函数R(·)的步骤为:
(21)通过边缘检测出来的物体边缘方向及其若干个邻近方向与X轴的夹角作为候选重排角度值,获得该编码块的候选重排变换函数;
(22)按照候选的重排变换函数对编码块进行像素重排,并分别计算各候选重排变换函数的率失真代价;
(23)选择其中率失真代价最小的重排变换函数作为最优的重排变换函数R(·)。
4.如权利要求1所述的一种视频图像编解码方法,其特征在于:所述编码步骤(2)中,确定重排变换函数R(·)的步骤为:
(21)任意选定一系列的重排变换函数R1(·)、R2(·)、......Rs(·)作为候选重排变换函数,这些函数均为可逆变换函数;
(22)按照候选的重排变换函数对编码块进行像素重排,并分别计算各候选重排变换函数的率失真代价;
(23)选择其中率失真代价最小的重排变换函数Rt(·)(1≤t≤s)为最优的重排变换函数R(·)。
CN 201010126747 2010-03-12 2010-03-12 一种视频图像编解码方法 Expired - Fee Related CN101783954B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010126747 CN101783954B (zh) 2010-03-12 2010-03-12 一种视频图像编解码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010126747 CN101783954B (zh) 2010-03-12 2010-03-12 一种视频图像编解码方法

Publications (2)

Publication Number Publication Date
CN101783954A CN101783954A (zh) 2010-07-21
CN101783954B true CN101783954B (zh) 2012-08-08

Family

ID=42523740

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010126747 Expired - Fee Related CN101783954B (zh) 2010-03-12 2010-03-12 一种视频图像编解码方法

Country Status (1)

Country Link
CN (1) CN101783954B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103379340B (zh) 2012-04-19 2017-09-01 乐金电子(中国)研究开发中心有限公司 一种残差预测方法及装置
KR102250088B1 (ko) 2013-10-24 2021-05-10 삼성전자주식회사 비디오 스트림을 복호화하는 방법 및 장치
CN104168085B (zh) * 2014-08-01 2017-11-24 山东科技大学 一种基于冗余熵变换的数据压缩方法
CN104602025B (zh) * 2015-01-09 2018-11-20 华为技术有限公司 处理图像的方法和装置
CN107360419B (zh) * 2017-07-18 2019-09-24 成都图必优科技有限公司 一种基于透视模型的运动前视视频帧间预测编码方法
CN112702598B (zh) * 2020-12-03 2024-06-04 浙江智慧视频安防创新中心有限公司 基于位移操作进行编解码的方法、装置、电子设备及介质
CN112807694B (zh) * 2021-02-23 2023-06-23 腾讯科技(深圳)有限公司 针对特效的检测方法、装置、设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101415119A (zh) * 2007-10-15 2009-04-22 奇景光电股份有限公司 用以压缩图像数据的装置及方法
CN101656889A (zh) * 2009-06-22 2010-02-24 南京大学 一种高清视频实时压缩和编解码方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPR192700A0 (en) * 2000-12-06 2001-01-04 Canon Kabushiki Kaisha Storing coding image data in storage of fixed memory size

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101415119A (zh) * 2007-10-15 2009-04-22 奇景光电股份有限公司 用以压缩图像数据的装置及方法
CN101656889A (zh) * 2009-06-22 2010-02-24 南京大学 一种高清视频实时压缩和编解码方法

Also Published As

Publication number Publication date
CN101783954A (zh) 2010-07-21

Similar Documents

Publication Publication Date Title
Guo et al. Causal contextual prediction for learned image compression
US11902575B2 (en) Image encoding method using a skip mode, and a device using the method
CN101783954B (zh) 一种视频图像编解码方法
CN103329522B (zh) 用于使用字典编码视频的方法
CN103299620B (zh) 在视频译码中使用最可能扫描次序对用于视频块的扫描次序信息进行有效译码
KR101838320B1 (ko) 예시-기반 데이터 프루닝을 이용한 비디오 디코딩
CN111819853A (zh) 变换域中预测的信令残差符号
WO2019062544A1 (zh) 视频图像的帧间预测方法、装置及编解码器
US20140133559A1 (en) Method for encoding image information and method for decoding same
KR102011491B1 (ko) 템플릿 매칭을 이용한 영상 부호화 방법 및 장치, 그리고 복호화 방법 및 장치
WO2010082463A1 (ja) 画像符号化装置および画像符号化方法、画像復号化装置および画像復号化方法
CN102547290B (zh) 一种基于几何分割的视频图像解编码方法
WO2019114721A1 (zh) 视频数据的帧间预测方法和装置
CN103929652B (zh) 视频标准中基于自回归模型的帧内预测快速模式选择方法
JP2014519215A (ja) データをロッシー圧縮符号化する方法および装置、および、データを再構築する対応する方法および装置
CN103636223A (zh) 用于视频译码的多区扫描次序
CN107864380A (zh) 基于dct的3d‑hevc快速帧内预测决策方法
KR20120084168A (ko) 비디오 인코딩 모드 선택 방법 및 이를 수행하는 비디오 인코딩 장치
CN105611301A (zh) 基于小波域残差的分布式视频编解码方法
CN107770527B (zh) 使用邻近编码参数和最近编码参数的数据压缩方法和装置
CN102196270A (zh) 帧内预测方法及装置、编解码方法及装置
CN104506860A (zh) 视频编码的参考图像选择方法及系统
CN109889831A (zh) 基于cu尺寸的360度视频帧内模式选择
JP2008017304A (ja) 画像符号化装置、画像復号装置、画像符号化方法、及び画像符号化するプログラム
WO2019227297A1 (zh) 一种视频图像的帧间预测方法、装置及编解码器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120808

CF01 Termination of patent right due to non-payment of annual fee