CN101931817A - 一种变换基自适应的变换编码方法 - Google Patents
一种变换基自适应的变换编码方法 Download PDFInfo
- Publication number
- CN101931817A CN101931817A CN 201010144549 CN201010144549A CN101931817A CN 101931817 A CN101931817 A CN 101931817A CN 201010144549 CN201010144549 CN 201010144549 CN 201010144549 A CN201010144549 A CN 201010144549A CN 101931817 A CN101931817 A CN 101931817A
- Authority
- CN
- China
- Prior art keywords
- transform
- adaption
- coding method
- base self
- limited
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
一种变换基自适应的变换编码方法,属于计算机领域,涉及的技术领域包括各种标准图像和视频压缩编码技术,涉及一种变换基自适应的整数余弦变换(ICT)方法。在图像和视频压缩编码A端,由通道(10)确定有限个变换基N,由通道(20)在有限个变换基N中自适应命中一个变换性能最优的变换基进行ICT。在解码器B端,可以通过通道(30)或(31)来获得这有限个变换基N,被命中的变换基由通道(40)或(41)传输给解码器作反变换使用。由于根据实际的视频序列特性和编码参数自适应选择了变换效率最好的变换基,因而能大大提高整体编码器的性能。
Description
技术领域
本发明属于计算机领域,涉及一种变换基自适应的变换编码方法。涉及的技术领域包括各种标准图像和视频压缩编码技术。本发明是通过变换基自适应来提高图像和视频压缩编码领域中变换编码的效率,从而提高编码器的整体性能。
背景技术
在此处键入技术领域描述段落。
背景技术
变换编码在图像和视频压缩编码中得到了非常广泛的应用,其功能是将图像/视频数据通过变换到频域达到把分散冗余信息集中起来,大大有利于量化数据从而获得高效压缩编码的目的。在图像/视频编码中经常使用的变换是离散余弦变换(DCT),DCT使用的实数变换矩阵存在缺点。整数余弦变换(ICT)用整数数值的矩阵来近似DCT的实数矩阵,解决了两个问题:一是正反变换都是整数,不存在运算精度误差问题;二是整数矩阵乘法可以用加法和移位运算实现,极大地降低了计算复杂度。
视频压缩编码标准H.264、AVS等使用ICT作为编码器的变换方法,将时域的残差数据变换到频域,使得只剩很少的非零数据。ICT是从离散余弦变换(DCT)演化而来,用整数近似替代DCT中的实数,将其变为适于计算机处理的矩阵操作。对一个M×M的ICT矩阵可由M/2个整数组成的基来生成。分析ICT的原理,整数变换矩阵应满足以下几个特性:(a)能归一化成正交矩阵;(b)变换运算可全部用移位运算实现;(c)归一化后的正交矩阵同原始的DCT矩阵系数相近;(d)整数变换矩阵系数不是很大,变换运算能用16位精度表示。在这4个约束条件和正交性约束条件下我们可以通过一些搜索算法寻找到很多符合条件的变换基。例如:H.264中8×8和4×4的整数变换矩阵分别由=[12,10,6,3]和 =[2, 1]变换基生成,而AVS中8×8和4×4的整数变换矩阵分别由=[10,9,6,2]和=[3, 1]变换基生成。同理,我们可以用相同的方法搜索一组生成16×16 ICT的变换基,并在能量集中效率,去相关性能和计算的简单性等约束条件的指导下选择变换性能最优的变换基。由于所有的整数变换矩阵都是离散余弦变换中实数矩阵的一种近似。所以不可能在任意的条件下对所有内容的图像或视频应用都表现出最优的性能,往往会受视频序列的特性和量化步长等影响。
作为生成整数变换矩阵的变换基往往通过计算机搜索得到,迄今为止有大量搜索得到的变换基。由于变换基繁多和视频序列测试工作的繁琐,它们中的大多数并未被系统测试过或只经过在理想情况下的数学模拟,所以它们的真实性能未明。例如最初为了获得较高的变换效率,选用了取值较大的变换基,而很大时导到过高的变换复杂度,之后又选用了其它变换基。但由于视频序列特性和实际编码参数的不同,对固定变换基生成的变换矩阵不能取得最优的编码性能。
不同的变换基会产生不同的变换性能,在判断这些变换编码最优的变换基时,需要一个衡量变换基变换性能的准则,本发明采用H.264 和AVS中已有的Lagrangian率失真优化技术(RDO)来评估变换基的性能。其定义如下:
式中和分别表示在一个编码参数集O上某一确定参数编码的宏块产生的失真和码率,称为Lagrangian权值因子,在参数和量化参数Q选定后,编码器通过最小化Lagrangian代价函数实现对每一个宏块的编码模式的选择。
能量集中能力概念评估变换在于去除元素之间相关性的性能,使得变换后的能量能集中在较少的几个系数上,就是将元素由空域变换到频域,且变换后只有较少的几个非零系数。本发明采用式(2)作为能量集中能力的评估指标。
(2)
式中是变换后系数的协方差的乘积,由数学均值不等式的性质可知,能量分布越平均,元素能量的乘积越大,值越大;能量分布越集中,能量的乘积越小,值越小。因此计算变换基的值能反应其对各种视频图像的能量集中能力。另外,本发明还采用去相关能力评估指标来搜索性能优异的变换基,如式(3)。
变换基的计算复杂度的高低直接关系到编码器速度,在硬件条件不变的情况下,总希望降低变换复杂度以换得更快的编码速度,在ICT中只存在加法和移位运算,本发明采用变换基的加法次数和移位次数的总和M来评估变换基的计算复杂度性能。
变换基的动态范围同样关系到占用硬件资源的高低,更小的动态范围有助于节省存储空间,本发明采用多少比特K的数据结构能够进行该部分的全部运算来衡量变换基生成数据动态范围性能指标。
发明内容
本发明的目的是提供一种变换基自适应的变换编码方法,对比于固定变换基方法,它可以大大提高编码器的整体性能,同时不增加编码器的复杂度,可以实现实时应用。
为达到上述目的,本发明采用下述技术方案:
一种变换基自适应的变换编码方法,在H.264、AVS等视频压缩编码标准中,用来变换编码的变换矩阵采用自适应选择的方法,其特征在于对预测的残差数据分别用所有的有限个变换基生成的变换矩阵进行变换后量化,利用(1)式选择一个变换基作为命中的最优变换基进行变换编码。
变换基自适应选择步骤如下:
b) 从编码器端传送有限个变换基到解码器端,可通过事先约定的方式确定或者随码流传送,用于解码器端作整数余弦反变换使用。
c) 对于每一个宏块的残差数据用全部候选的变换基进行ICT后,编码器根据RDO选定一组最优的编码参数,确定了最优的变换基。
d)对每个宏块所命中的最优变换基随码流传送给解码器端,可选择直接传送变换基本身,或者选择传送变换基索引号。
e)解码器解码一个宏块时,根据选定的该宏块变换效率最优的变换基作反变换,解码出原始视频序列。
本发明综合利用上述方法进行自适应变换基的选择。测试结果显示,可以大大提高编码器的整体性能,且保证编码器的整体复杂度基本不变,可以应用于实时编解码场合。
附图说明
图1是本发明的一个实施例的视频压缩编码框图;
图2是本发明有限个变换基的选择流程图;
图3是本发明自适应选择变换基的流程图;
图4是本发明有限个变换基的流通示意图;
图5是本发明被选中的最优变换基的传输示意图;
图6是本发明评估8×8 ICT的各种变换基的平均能量集中能力;
图7是本发明评估8×8 ICT的各种变换基的平均去相关效率。
具体实施方式
表1 编码参数的设置和测试序列
软件版本(Software) | JM12.1 |
熵编码方法(Entropy coding) | CABAC |
搜索范围(Search Range) | +/-16 |
率失真优化(RDOpt) | On |
哈德曼德编码(Hardamard) | On(整像素点不用哈达玛变换,以防陷入局部最优点) |
量化参数(QP Settings) | 20,24,28,32,36,40 (QPI=QPP=QP) |
B帧数目(NumberBFrames) | 0 |
帧编码(Frame Coding) | YES |
环路滤波器(Loop Filter) | Off (LoopFilterParameters=LoopFilterDisable=1) |
帧结构(Frame Structure) | IPPP… as indicated |
编码帧数(Frames Coded) | 30 |
跳帧数目(Frames Skipped) | 0 |
测试序列(CIF) | bus、foreman、akiyo、mobile、hall、daughter、news、football和paris |
参见图2、图6和图7,首先,对8×8和4×4的ICT具有较高变换性能的有限个变换基通过计算机搜索得到,即8×8 ICT的可选变换基为[25,21,14,5]、[24,21,15,4]、[19,15,9,3] 、[15,15,10,3]、[15,12,8,3]、[14,12,9,2]、[12,10,6,3]、[10,9,6,2]、[9,8,4,3]、[7,4,3,1]、[6,6,3,2]、[5,3,2,1]、[3,2,1,1]、[9,10,5,3]、[8,9,7,1]、[7,9,5,2]、 [6,7,5,1]、[5,6,4,1]和[4,5,3,1], 4×4的ICT可选变换基为 [3, 1]、 [7, 3]、 [2, 1]、 [5, 2]、 [1, 2]、 [9, 4]、 [3, 2]和[8, 3]。
参见图1,对原始视频序列进行帧间(包括运动估计1和运动补偿4)和帧内(5)预测编码,帧间预测需要参考存放在缓存(2)中的前一帧或若干帧,用所有有限个变换基(7)对每一个宏块的残差数据进行ICT和量化(6),量化后的数据经过反量化和逆ICT(9)后用于本地解码,环路滤波(3)用于消除块效应和虚假的边缘,最终残差数据和运动矢量(MVs)经过熵编码(8)生成压缩的比特流。通过最小化Lagrangian代价函数实现对每一个宏块的变换基的选定,参见图3。由于变换和量化在基于预测的视频编码方案中,计算量很少,因此这部分不会占太大计算时间。
如图4所示。有限个变换基N从编码器端(A)到达解码器端(B)有两种可选方式,可以通过随压缩码流传送通道(30)传送给解码器,也可以通过事先约定的方式让解码器在候选的变换基中进行定位。
参见图5,被命中的宏块级整体性能最优的变换基从A端到达B端有两种可选方式,可以通过随压缩码流直接传输变换基本身,也可以传输变换基的索引号的方式实现。
测试表1中运动及纹理复杂程度不同的标准视频序列表明,自适应变换基方法比固定变换基方法的重建视频的主观质量有很大提高,客观质量PSNR也大大提高,而码率下降。
本发明的第二个实施例是:在参考模型RM5.2上,同样采用上述的变换基自适应选择方法,仍然测试表1中的序列。测试结果表明本发明的变换基自适应选择方法相比固定变换基方法,重建视频的主观质量大大提高,在相同的PSNR时压缩后码率降低,在相同码率的情况PSNR也得到了提高,同时总体编码速度基本保持不变。
Claims (9)
1.一种变换基自适应的变换编码方法,在H.264或AVS编码器中,变换编码时采用变换基自适应的选择方法,其特征在于对预测的残差数据用全部有限个参数进行ICT后,再对量化的数据进行编码性能的评估,选择一个整体性能最优的变换基进行实际的变换编码。
2.根据权利要求1所述的变换基自适应的变换编码方法,其特征在于,ICT的整数变换矩阵由有限个整数唯一决定,这有限个整数称为变换基,通过计算机搜索等方式可以得到许多变换基。
3.根据权利要求1所述的变换基自适应的变换编码方法,其特征在于,ICT由有限个变换基来决定,即变换基Ni,i=1,2,…,N, N是个有限值。
4.根据权利要求1所述的变换基自适应的变换编码方法,其特征在于,这有限个变换基的选择由通道(10)决定,(10)的输入参数为能量集中能力(100)、计算复杂度(200)和变换结果的动态范围(300),输出参数为变换基为有限个变换基N。
5.根据权利要求1所述的变换基自适应的变换编码方法,其特征在于,有限个变换基N为27,分别是[25,21,14,5]、[24,21,15,4] [19,15,9,3]、[15,15,10,3]、[15,12,8,3]、[14,12,9,2]、[12,10,6,3]、[10,9,6,2]、[9,8,4,3]、[7,4,3,1]、[6,6,3,2]、[5,3,2,1]、[3,2,1,1]、[9,10,5,3]、 [8,9,7,1]、[7,9,5,2]、[6,7,5,1]、[5,6,4,1]、[4,5,3,1]、[3, 1]、[7, 3]、[2, 1]、[5, 2]、[1, 2]、[9, 4]、[3, 2]和[8, 3], 用于8×8和4×4的ICT矩阵的生成。
6.根据权利要求1所述的变换基自适应的变换编码方法,其特征在于,自适应变换基的选择是基于宏块的,一个宏块是由16×16个像素组成的矩形空间,对每一个宏块的编码都通过自适应选择一个性能最优的变换基进行编码。
7.根据权利要求1所述的变换基自适应的变换编码方法,其特征在于,根据通道(20)在有限个变换基N中命中一个整体性能最优的变换基进行ICT。
8.根据权利要求1所述的变换基自适应的变换编码方法,其特征在于,有限个变换基从编码器端(A)到达解码器端(B)可以通过随码流传送通道(30)或事先约定的方式传送通道(31)来决定。
9.根据权利要求1所述的变换基自适应的变换编码方法,其特征在于,被命中的整体性能最优的变换基从A端到达B端,可以通过直接传输变换基通道(40)或传输变换基的索引号通道(41)的方式实现。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010144549 CN101931817A (zh) | 2010-04-12 | 2010-04-12 | 一种变换基自适应的变换编码方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010144549 CN101931817A (zh) | 2010-04-12 | 2010-04-12 | 一种变换基自适应的变换编码方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101931817A true CN101931817A (zh) | 2010-12-29 |
Family
ID=43370691
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201010144549 Pending CN101931817A (zh) | 2010-04-12 | 2010-04-12 | 一种变换基自适应的变换编码方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101931817A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102281445A (zh) * | 2011-04-20 | 2011-12-14 | 深圳市融创天下科技股份有限公司 | 一种视频编码8x8整数变换方法 |
CN102333216A (zh) * | 2011-04-20 | 2012-01-25 | 深圳市融创天下科技股份有限公司 | 一种视频编码16x16整数变换方法 |
CN102333217A (zh) * | 2011-04-20 | 2012-01-25 | 深圳市融创天下科技股份有限公司 | 一种视频编码4x4整数变换方法 |
CN102333216B (zh) * | 2011-04-20 | 2016-12-14 | 深圳市云宙多媒体技术有限公司 | 一种视频编码16x16整数变换方法 |
CN108702517A (zh) * | 2016-02-15 | 2018-10-23 | 高通股份有限公司 | 使用优化的紧凑多遍变换的高效变换编码 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1564602A (zh) * | 2004-03-18 | 2005-01-12 | 华中科技大学 | 视频编码的整数变换矩阵选择方法及相关的整数变换方法 |
CN101198059A (zh) * | 2007-12-27 | 2008-06-11 | 武汉大学 | 一种视频编码标准中的整数变换基优选方法 |
CN101682787A (zh) * | 2007-04-12 | 2010-03-24 | 诺基亚公司 | 空间增强的变换编码 |
-
2010
- 2010-04-12 CN CN 201010144549 patent/CN101931817A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1564602A (zh) * | 2004-03-18 | 2005-01-12 | 华中科技大学 | 视频编码的整数变换矩阵选择方法及相关的整数变换方法 |
CN101682787A (zh) * | 2007-04-12 | 2010-03-24 | 诺基亚公司 | 空间增强的变换编码 |
CN101198059A (zh) * | 2007-12-27 | 2008-06-11 | 武汉大学 | 一种视频编码标准中的整数变换基优选方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102281445A (zh) * | 2011-04-20 | 2011-12-14 | 深圳市融创天下科技股份有限公司 | 一种视频编码8x8整数变换方法 |
CN102333216A (zh) * | 2011-04-20 | 2012-01-25 | 深圳市融创天下科技股份有限公司 | 一种视频编码16x16整数变换方法 |
CN102333217A (zh) * | 2011-04-20 | 2012-01-25 | 深圳市融创天下科技股份有限公司 | 一种视频编码4x4整数变换方法 |
WO2012142776A1 (zh) * | 2011-04-20 | 2012-10-26 | 深圳市融创天下科技股份有限公司 | 一种视频编码4x4整数变换方法 |
WO2012142777A1 (zh) * | 2011-04-20 | 2012-10-26 | 深圳市融创天下科技股份有限公司 | 一种视频编码8x8整数变换方法 |
CN102333216B (zh) * | 2011-04-20 | 2016-12-14 | 深圳市云宙多媒体技术有限公司 | 一种视频编码16x16整数变换方法 |
CN102333217B (zh) * | 2011-04-20 | 2017-04-12 | 深圳市云宙多媒体技术有限公司 | 一种视频编码4x4整数变换方法 |
CN108702517A (zh) * | 2016-02-15 | 2018-10-23 | 高通股份有限公司 | 使用优化的紧凑多遍变换的高效变换编码 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101911702B (zh) | 针对支持cabac的视频编码过程而量化视频块的系数的方法和装置 | |
CN102017633B (zh) | 用于上下文自适应可变长度译码(cavlc)的速率-失真量化 | |
CN101946515B (zh) | Cabac译码器的二回合量化 | |
CN101743751B (zh) | 视帧内预测模式而定的残差块的自适应变换 | |
CN102595131B (zh) | 用于对图像块的视频信号数据进行编码的编码器 | |
CN1949877B (zh) | 自适应量化控制器及其方法 | |
JP2006140758A (ja) | 動画像符号化方法、動画像符号化装置および動画像符号化プログラム | |
CN108574841B (zh) | 一种基于自适应量化参数的编码方法及装置 | |
CN105306939A (zh) | 用于对视频进行解码的方法和装置 | |
Su et al. | Efficient MPEG-2 to H. 264/AVC intra transcoding in transform-domain | |
CN101534436A (zh) | 一种视频图像宏块级自适应码率分配方法 | |
KR20100079037A (ko) | 비디오 영상 부호화 방법 및 장치 | |
CN103347185B (zh) | 基于选择性块变换的无人机侦察图像综合压缩编码方法 | |
CN104320657A (zh) | Hevc无损视频编码的预测模式选择方法及相应的编码方法 | |
CN100542287C (zh) | 用于手持设备的编码的方法 | |
CN103581670A (zh) | H264自适应帧内模式选择码率估计的率失真优化方法及其装置 | |
US20180249160A1 (en) | Vector quantization for video coding using codebook generated by selected training signals | |
CN101931817A (zh) | 一种变换基自适应的变换编码方法 | |
CN103154970A (zh) | 视觉优化量化 | |
CN101854534B (zh) | 一种h.264快速帧间模式选择方法 | |
US8265141B2 (en) | System and method for open loop spatial prediction in a video encoder | |
CN102625109A (zh) | 一种基于多核处理器实现的mpeg-2至h.264的转码方法 | |
Letaief et al. | Real time HEVC video compression using Hybrid DWT-DCT algorithm on an FPGA | |
Wang et al. | Low complexity RDO mode decision based on a fast coding-bits estimation model for H. 264/AVC | |
Bernatin et al. | FPGA implementation of modified intra-frame prediction for H. 264 video codec |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20101229 |