CN101783954A - 一种视频图像编解码方法 - Google Patents
一种视频图像编解码方法 Download PDFInfo
- Publication number
- CN101783954A CN101783954A CN 201010126747 CN201010126747A CN101783954A CN 101783954 A CN101783954 A CN 101783954A CN 201010126747 CN201010126747 CN 201010126747 CN 201010126747 A CN201010126747 A CN 201010126747A CN 101783954 A CN101783954 A CN 101783954A
- Authority
- CN
- China
- Prior art keywords
- rearrangement
- encoding
- video image
- encoding block
- transforming function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开一种视频图像编解码方法,其中编码包括以下步骤:(1)对视频图像进行编码块分割,输入视频图像是经过帧内/帧间预测的残差图像或原始图像数据;(2)对编码块中的像素点坐标进行坐标变换,使编码块的方向尽可能与水平或垂直一致;(3)对前述编码块进行二维正交变换,使信号的变换系数尽可能集中在低频部分,消除信号的空间冗余;(4)对频域变换后的系数进行量化以及熵编码,同时把像素重排的方向等信息编入码流;解码为对前述编码块进行逆运算。这种方法在编码时对视频图像进行像素重排,通过改变像素分布来减少正交变换后的高频非零系数,提高变换的压缩效率。
Description
技术领域
本发明涉及数字视频图像的编解码方法,尤其是一种基于像素重排的用于压缩视频图像的变换方法。
背景技术
为实时高效地传输视频图像,需对图像进行压缩编码。传统的MPEGx和H.26x等基于运动补偿和频域变换相结合的视频编码方案中,如图2所示,运动补偿用来消除图像序列的时间轴冗余度,频域正交变换则用来消除图像信号的空间冗余度。对于原始图像而言,其信号相关性强,变换系数主要集中于直流和低频系数,量化后高频分量大多数为0,压缩效率较高。而对于运动补偿预测残差信号,正交变换的压缩效率并不理想,原因在于经过运动补偿的残差信号的相关性大大降低,残差信号的协方差矩阵与Toepl itz矩阵形式差别较大,残差信号经过变换后,其变换系数集中性较差,仍存在大量的冗余信息。
针对传统DCT变换的缺陷,Zeng(参见B.Zeng and J.-J.Fu,“Directional discrete cosine transforms forimage coding,”IEEE International Conference on Multimedia and Expo.(ICME’06),pp.721-724,July 2006,Toronto,Canada.)等人提出采用形状DCT变换对图像进行编码,获得比JPEG更好的压缩性能。该方法的缺点是形状DCT主要针对原始图像块内包含两种不同特征的内容,并不适于残差信号。
在基于分块的视频图像压缩编码方案中,无论是原始图像块,还是经过运动补偿的残差图像块,均表现出与物体边缘或图像纹理相一致的方向性。具有非水平/垂直方向的图像块,经过传统二维DCT后,易产生较多高频系数,导致压缩效率难以继续提高。本发明针对这一缺陷,提出一种新型的视频图像压缩方法。
发明内容
本发明的主要目的,在于提供一种视频图像编解码方法,其在编码时对视频图像进行像素重排,而不需对视频图像进行旋转、变形、插值等操作,通过改变像素分布来尽可能减少正交变换后的高频非零系数,提高压缩效率。
为了达成上述目的,本发明的解决方案是:
一种视频图像编解码方法,其中编码包括以下步骤:
(1)对输入视频图像进行编码块分割,每个编码块的大小为M×N,输入视频图像可以是经过帧内/帧间预测的残差图像,也可以是原始图像数据;
(2)对前述大小为M×N的编码块中的像素点坐标(i,j)进行坐标变换R(i,j)=(k,l),其中0≤i<M,0≤j<N,0≤k<M,0≤l<N,其中重排变换函数R(·)为可逆变换,经过重排变换,使编码块的方向尽可能与水平或垂直一致;若R(i,j)=(i,j)则为一致变换;
(3)对前述编码块进行二维正交变换,使信号的变换系数尽可能集中在低频部分,消除信号的空间冗余;
(4)对频域变换后的系数进行量化以及熵编码,同时把像素重排的方向等信息编入码流;
解码为对前述编码块进行逆运算。
上述编码步骤(2)中,获取重排变换函数的步骤为:
(21)通过遍历搜索方法预测该编码块的重排方案,按照一定步长取一系列离散的重排角度值;
(22)按照选定的一系列重排角度值对编码块进行像素重排,并计算该方案的率失真代价;
(23)综合分析各种重排方案,选择率失真代价最小的角度所对应的重排变换函数作为最优的重排变换函数。
上述编码步骤(2)中,获取重排变换函数的步骤为:
(21)通过边缘检测来预测该编码块的重排方案,以检测出来的边缘方向及邻近方向作为候选重排角度;
(22)按照候选的重排角度对编码块进行像素重排,并计算该方案的率失真代价;
(23)综合分析各种重排方案,选择率失真代价最小的角度所对应的重排变换函数作为最优的重排变换函数。
上述编码步骤(2)中,获取重排变换函数的步骤为:
(21)任意选定一系列的重排变换函数R1(·)、R2(·)、......Rs(·),这些函数均为可逆变换;
(22)对编码步骤(1)中的大小为M×N的编码块的像素点坐标(i,j)通过上述变换函数一一映射到坐标(k,l),其中0≤i<M,0≤j<N,0≤k<M,0≤l<N,并计算各种重排变换函数的率失真代价;
(23)综合分析各种重排变换函数,选择率失真代价最小的角度所对应的重排变换函数Rt(·)(1≤t≤s)为最优的重排变换函数。
采用上述方案后,本发明针对传统二维正交变换对视频图像残差信号的非水平/非垂直方向性敏感的特点,通过对待编码视频图像信号的像素位置进行重新排列,将图像/残差信号的边界方向尽可能调整到水平/垂直方向,再进行二维正交变换,从而尽可能减少变换后的高频非零系数,提高变换的压缩效率。
附图说明
图1是H.264编码的运动补偿残差图;
图2是为现有视频图像的编解码流程示意图;
图3是本发明所提供的编解码的流程示意图;
图4是本发明应用列循环移位的示意图;
图5是本发明应用行循环移位的示意图;
图6是本发明以foreman_qcif为例的测试结果波形图。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步的详细说明。
参考图3所示,本发明揭示一种视频图像的编码方法,包括如下步骤:
步骤1、对输入视频图像进行编码块分割,使每个编码块的大小为M×N,该输入视频图像可以是经过帧内/帧间预测的残差图像,也可以是原始图像数据;
此处可将图像分成16×16,16×8,8×16,8×8等各种大小的块,编码块的大小可以是自适应的,当然,此处编码块不一定是矩形,也可以是三角形或梯形等其它非矩形,但在后述的步骤2中,进行像素重排的输入块必须是矩形形态,因此,若编码块为非矩形,还需对图像重新组织;
步骤2、对前述大小为M×N的编码块中的像素点坐标(i,j)进行坐标变换R(i,j)=(k,l),其中0≤i<M,0≤j<N,0≤k<M,0≤l<N,前述R(·)为可逆变换,称为重排变换函数(或过程),经过重排变换,使编码块的方向尽可能与水平或垂直一致;若R(i,j)=(i,j)则为一致变换;
同时参照图4和图5,为本发明的第一实施例,图1中所示为foreman的一个运动补偿残差帧,通过对运动补偿残差图像的观察,对16×16,16×8和8×16三种模式的编码块进行像素重排,具体实现步骤如下:
步骤21、采用遍历搜索方法获取编码块的重排方案,按照一定步长Δθ取一系列离散的重排角度值
Θ∈{θ0,θ0+Δθ,θ0+2Δθ,...}。
步骤22、按照步骤21选定的一系列重排角度值对残差图像或原始图像进行像素重排,并计算每种重排方案的率失真代价。当重排角度与x轴的夹角满足|θ|≤π/4,采用列循环移位,如图4中的箭头方向所示;当重排角度与x轴的夹角满足π/4<|θ|≤π/2时,采用行循环移位,如图5中的箭头方向。
假设原始像素位置为n=(i,j)T,像素重排后的像素位置为m=R(n)=(k,l)T,m与n的关系可以用下式表示:
其中N为像素块的大小,如本例N=8,mod为取模操作,以实现循环移位,而
步骤23、综合分析各种重排方案,选择率失真代价最小的角度,如图4中的θ′所对应的重排变换函数,作为最优的重排变换函数。
其中率失真代价由一个率失真代价函数J(θ)=D(θ)+λR(θ)求得,D(θ)表示重建图与原始图之间的误差(如平方差和SSD),λ是拉格朗日乘子,R(θ)表示编码宏块头、运动信息和DCT系数所需的比特数。对于R(θ)又从不考虑重排信息的比特开销(RDCT without info)和考虑重排信息的比特开销(RDCT with info)两种情况评测其综合性能。
本发明还提供另一较佳实施例,与前述遍历搜索的方法不同,本实施例采用边缘检测来预测编码块的重排方案,以检测出来的边缘方向(见图4及图5中的θ′)及邻近方向作为候选重排角度,然后综合分析各种候选重排方案,选择率失真代价最小的角度,此处与前述实施例相同,故不再赘述。
本发明还提供第三种实施例具体实现步骤如下:
步骤21、任意选定一系列的重排变换函数R1(·)、R2(·)、......Rs(·),这些函数均为可逆变换;
步骤22、对编码步骤1中的大小为M×N的编码块的像素点坐标(i,j)通过上述变换函数一一映射到坐标(k,l),其中0≤i<M,0≤j<N,0≤k<M,0≤l<N,并计算各种重排变换函数的率失真代价;
步骤23、综合分析各种重排方案,选择率失真代价最小的角度所对应的重排变换函数Rt(·)(1≤t≤s)。
步骤3、对所得编码块进行二维正交变换,使信号的变换系数尽可能集中在低频部分,消除信号的空间冗余;
步骤4、对频域变换后的系数进行量化、特定ZIG-ZAG扫描或其它扫描以及熵编码,同时把像素重排的方向等信息编入码流。
而在解码端,只需对前述编码块进行逆运算,具体可参考图3所示,首先进行熵解码、反量化及反频域变换,然后对编码块进行坐标反变换,重建输入块,也即前述编码过程是对像素的坐标(i,j)进行R(·)变换,而此处解码时,需对像素进行坐标反变换R-1(·),从而重建输入块。
最后在H.264的测试模型jm8.6平台上对重排DCT进行验证测试,仅针对帧间预测的残差数据进行重排DCT编码。
通过对视频片段的测试我们可以得出在不考虑重排信息时,平均码率节省分别为5.78%和4.26%。而在考虑重排信息以后,高码率的性能增益明显高于低码率的性能增益,高码率平均性能增益为2.46%,而低码率只为1.51%。在Foreman等具有较明显的边界信息的视频中,重排DCT的增益较为显著。图6是在jm8.6平台上对foreman的一个测试结果。
以上所述实施例仅表达了本发明中几种较佳的实施方式,其仅用于说明而非限制本发明的技术方案,本领域的普通技术人员应当理解:在不脱离本发明的构思的前提下,还可以做出适当的修改和局部的替换,其均应涵盖在本发明的权利要求范围当中。
Claims (4)
1.一种视频图像编解码方法,其特征在于编码包括以下步骤:
(1)对输入视频图像进行编码块分割,每个编码块的大小为M×N,输入视频图像可以是经过帧内/帧间预测的残差图像,也可以是原始图像数据;
(2)对前述大小为M×N的编码块中的像素点坐标(i,j)进行坐标变换R(i,j)=(k,l),其中0≤i<M,0≤j<N,0≤k<M,0≤l<N,前述重排变换函数R(·)为可逆变换,经过重排变换,使编码块的方向尽可能与水平或垂直一致;若R(i,j)=(i,j)则为一致变换;
(3)对前述编码块进行二维正交变换,使信号的变换系数尽可能集中在低频部分,消除信号的空间冗余;
(4)对频域变换后的系数进行量化以及熵编码,同时把像素重排的方向等信息编入码流;
解码为对前述编码块进行逆运算。
2.如权利要求1所述的一种视频图像编解码方法,其特征在于:所述编码步骤(2)中,获取重排变换函数的步骤为:
(21)通过遍历搜索方法预测该编码块的重排方案,按照一定步长取一系列离散的重排角度值;
(22)按照选定的一系列重排角度值对编码块进行像素重排,并计算该方案的率失真代价;
(23)综合分析各种重排方案,选择率失真代价最小的角度所对应的重排变换函数作为最优的重排变换函数。
3.如权利要求1所述的一种视频图像编解码方法,其特征在于:所述编码步骤(2)中,获取重排变换函数的步骤为:
(21)通过边缘检测来预测该编码块的重排方案,以检测出来的边缘方向及邻近方向作为候选重排角度;
(22)按照候选的重排角度对编码块进行像素重排,并计算该方案的率失真代价;
(23)综合分析各种重排方案,选择率失真代价最小的角度所对应的重排变换函数作为最优的重排变换函数。
4.如权利要求1所述的一种视频图像编解码方法,其特征在于:所述编码步骤(2)中,获取重排变换函数的步骤为:
(21)任意选定一系列的重排变换函数R1(·)、R2(·)、……Rs(·),这些函数均为可逆变换;
(22)对编码步骤(1)中的大小为M×N的编码块的像素点坐标(i,j)通过上述变换函数一一映射到坐标(k,l),其中0≤i<M,0≤j<N,0≤k<M,0≤l<N,并计算各种重排变换函数的率失真代价;
(23)综合分析各种重排函数,选择率失真代价最小的角度所对应的重排变换函数Rt(·)(1≤t≤s)为最优的重排变换函数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010126747 CN101783954B (zh) | 2010-03-12 | 2010-03-12 | 一种视频图像编解码方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010126747 CN101783954B (zh) | 2010-03-12 | 2010-03-12 | 一种视频图像编解码方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101783954A true CN101783954A (zh) | 2010-07-21 |
CN101783954B CN101783954B (zh) | 2012-08-08 |
Family
ID=42523740
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201010126747 Expired - Fee Related CN101783954B (zh) | 2010-03-12 | 2010-03-12 | 一种视频图像编解码方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101783954B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013155795A1 (en) * | 2012-04-19 | 2013-10-24 | Lg Electronics(China) R&D Center Co., Ltd | Method and apparatus for predicting residual |
CN104168085A (zh) * | 2014-08-01 | 2014-11-26 | 山东科技大学 | 一种基于冗余熵变换的数据压缩方法 |
CN104602025A (zh) * | 2015-01-09 | 2015-05-06 | 华为技术有限公司 | 处理图像的方法和装置 |
CN105745929A (zh) * | 2013-10-24 | 2016-07-06 | 三星电子株式会社 | 加速逆变换的方法和装置以及解码视频流的方法和装置 |
CN107360419A (zh) * | 2017-07-18 | 2017-11-17 | 成都图必优科技有限公司 | 一种基于透视模型的运动前视视频帧间预测编码方法 |
CN112702598A (zh) * | 2020-12-03 | 2021-04-23 | 浙江智慧视频安防创新中心有限公司 | 基于位移操作进行编解码的方法、装置、电子设备及介质 |
CN112807694A (zh) * | 2021-02-23 | 2021-05-18 | 腾讯科技(深圳)有限公司 | 针对特效的检测方法、装置、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020131084A1 (en) * | 2000-12-06 | 2002-09-19 | Andrew James Philip | Storing coding image data in storage of fixed memory size |
CN101415119A (zh) * | 2007-10-15 | 2009-04-22 | 奇景光电股份有限公司 | 用以压缩图像数据的装置及方法 |
CN101656889A (zh) * | 2009-06-22 | 2010-02-24 | 南京大学 | 一种高清视频实时压缩和编解码方法 |
-
2010
- 2010-03-12 CN CN 201010126747 patent/CN101783954B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020131084A1 (en) * | 2000-12-06 | 2002-09-19 | Andrew James Philip | Storing coding image data in storage of fixed memory size |
CN101415119A (zh) * | 2007-10-15 | 2009-04-22 | 奇景光电股份有限公司 | 用以压缩图像数据的装置及方法 |
CN101656889A (zh) * | 2009-06-22 | 2010-02-24 | 南京大学 | 一种高清视频实时压缩和编解码方法 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10397609B2 (en) | 2012-04-19 | 2019-08-27 | Lg Electronics (China) R & D Center Co., Ltd | Method and apparatus for predicting residual |
WO2013155795A1 (en) * | 2012-04-19 | 2013-10-24 | Lg Electronics(China) R&D Center Co., Ltd | Method and apparatus for predicting residual |
US10743011B2 (en) | 2013-10-24 | 2020-08-11 | Samsung Electronics Co., Ltd. | Method and apparatus for accelerating inverse transform, and method and apparatus for decoding video stream |
CN105745929A (zh) * | 2013-10-24 | 2016-07-06 | 三星电子株式会社 | 加速逆变换的方法和装置以及解码视频流的方法和装置 |
CN105745929B (zh) * | 2013-10-24 | 2020-07-28 | 三星电子株式会社 | 加速逆变换的方法和装置以及解码视频流的方法和装置 |
CN104168085B (zh) * | 2014-08-01 | 2017-11-24 | 山东科技大学 | 一种基于冗余熵变换的数据压缩方法 |
CN104168085A (zh) * | 2014-08-01 | 2014-11-26 | 山东科技大学 | 一种基于冗余熵变换的数据压缩方法 |
US10291935B2 (en) | 2015-01-09 | 2019-05-14 | Huawei Technologies Co., Ltd. | Image processing method and apparatus |
CN104602025A (zh) * | 2015-01-09 | 2015-05-06 | 华为技术有限公司 | 处理图像的方法和装置 |
CN107360419A (zh) * | 2017-07-18 | 2017-11-17 | 成都图必优科技有限公司 | 一种基于透视模型的运动前视视频帧间预测编码方法 |
CN112702598A (zh) * | 2020-12-03 | 2021-04-23 | 浙江智慧视频安防创新中心有限公司 | 基于位移操作进行编解码的方法、装置、电子设备及介质 |
CN112702598B (zh) * | 2020-12-03 | 2024-06-04 | 浙江智慧视频安防创新中心有限公司 | 基于位移操作进行编解码的方法、装置、电子设备及介质 |
CN112807694A (zh) * | 2021-02-23 | 2021-05-18 | 腾讯科技(深圳)有限公司 | 针对特效的检测方法、装置、设备及存储介质 |
CN112807694B (zh) * | 2021-02-23 | 2023-06-23 | 腾讯科技(深圳)有限公司 | 针对特效的检测方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN101783954B (zh) | 2012-08-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Guo et al. | Causal contextual prediction for learned image compression | |
Han et al. | A technical overview of AV1 | |
US11902575B2 (en) | Image encoding method using a skip mode, and a device using the method | |
CN101783954B (zh) | 一种视频图像编解码方法 | |
CN103329522B (zh) | 用于使用字典编码视频的方法 | |
CN103299620B (zh) | 在视频译码中使用最可能扫描次序对用于视频块的扫描次序信息进行有效译码 | |
KR101838320B1 (ko) | 예시-기반 데이터 프루닝을 이용한 비디오 디코딩 | |
JP5409909B2 (ja) | ビットストリームを復号する方法 | |
CN111819853A (zh) | 变换域中预测的信令残差符号 | |
JP2021516493A (ja) | マルチ符号ビット隠蔽及び残差符号予測を和合する方法及び装置 | |
JP2005513883A (ja) | スキップマクロブロックコード化 | |
CN103609121A (zh) | 统一合并模式和自适应运动向量预测模式候选者选择 | |
WO2019114721A1 (zh) | 视频数据的帧间预测方法和装置 | |
CN103929652B (zh) | 视频标准中基于自回归模型的帧内预测快速模式选择方法 | |
CN103636223A (zh) | 用于视频译码的多区扫描次序 | |
JP2014519215A (ja) | データをロッシー圧縮符号化する方法および装置、および、データを再構築する対応する方法および装置 | |
WO2010082463A1 (ja) | 画像符号化装置および画像符号化方法、画像復号化装置および画像復号化方法 | |
CN103918263A (zh) | 用于扫描视频编译中的矩形变换的设备和方法 | |
CN107864380A (zh) | 基于dct的3d‑hevc快速帧内预测决策方法 | |
TW202234883A (zh) | 塊內複製暫用視框緩衝器 | |
JP2012231505A (ja) | H.264および他の変換符号化情報の高能率部分復号化を可能にする映像符号化法 | |
CN105611301A (zh) | 基于小波域残差的分布式视频编解码方法 | |
CN1972449B (zh) | 用于在单一描述和多描述之间切换的设备和方法 | |
CN105791868A (zh) | 视频编码的方法和设备 | |
US10015484B2 (en) | Adaptive scan device and method for scanning thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120808 |