CN107249130B - 一种用于数字视频编解码的3乘3整数dct变换量化器 - Google Patents

一种用于数字视频编解码的3乘3整数dct变换量化器 Download PDF

Info

Publication number
CN107249130B
CN107249130B CN201710604580.9A CN201710604580A CN107249130B CN 107249130 B CN107249130 B CN 107249130B CN 201710604580 A CN201710604580 A CN 201710604580A CN 107249130 B CN107249130 B CN 107249130B
Authority
CN
China
Prior art keywords
matrix
transformation
dimensional column
transform
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710604580.9A
Other languages
English (en)
Other versions
CN107249130A (zh
Inventor
陈朝阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan Institute of Engineering
Original Assignee
Henan Institute of Engineering
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan Institute of Engineering filed Critical Henan Institute of Engineering
Priority to CN201710604580.9A priority Critical patent/CN107249130B/zh
Publication of CN107249130A publication Critical patent/CN107249130A/zh
Application granted granted Critical
Publication of CN107249130B publication Critical patent/CN107249130B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Image Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明提出了一种用于数字视频编解码的3乘3整数DCT变换量化器,同时给出了与之对应的3乘3整数IDCT逆变换反量化器,用以解决现有数字视频编解码中4×4整数DCT核心变换的运算次数多、计算时间长的问题,包括当前帧3×3分块器、3×3整数DCT核心变换器、后缩放量化器和3×3图像变换块发送器,当前帧3×3分块器与3×3整数DCT核心变换器相连接,3×3整数DCT核心变换器与后缩放量化器相连接,后缩放量化器与3×3图像变换块发送器相连接。与采用4×4整数DCT变换相比,对于一个1920×1080的彩色高清视频帧,本发明乘法运算次数减少了33.3%;加减法运算次数减少了33.3%,同时解码视频帧PSNR提高。

Description

一种用于数字视频编解码的3乘3整数DCT变换量化器
技术领域
本发明涉及数字视频压缩编解码的技术领域,具体涉及一种用于数字视频编解码的3 乘3整数DCT变换量化器,同时给出了其相匹配的3乘3整数IDCT逆变换反量化器。
背景技术
H.264和H.265视频编解码标准都采用了4×4整数DCT变换,编解码端都需要归一化,量化与变换归一化相结合,通过乘法、移位实现。我国具有自主知识产权的AVS标准采用8×8整数DCT变换,编码端进行变换归一化,量化与变换归一化相结合,通过乘法和移位实现。整数DCT变换的产生解决了计算精度误差大和编码效率低的问题,其特点是用整数变换矩阵代替DCT的浮点数变换矩阵,这样变换过程完全是整数运算,不存在精度误差,保证了编码的可逆性,同时整数乘法可用加减法和移位运算代替,运算量大幅度减少。
4×4整数DCT变换可以表示为:
式(1)中,X代表原始图像块,Y代表得到的DCT系数。是4×4整型变换中的核心2D变换。E4f是缩放因数矩阵,表示的每个元素都要乘以矩阵E4f中相同位置的对应缩放因子,且
4×4整数IDCT逆变换表示为:
式(2)中,Y代表图像块的DCT变换系数,X′表示经过IDCT逆变换得到的图像块。
4×4整数DCT变换是正交变换。对于一个4×4整数DCT变换,其核心2D变换的运算量为:乘法(乘2运算)32次,加减法96次。对于一个1920×1080的彩色高清视频帧,采用4:2:0的子采样格式则需要194400个4×4整数DCT变换,其核心2D变换需要的乘法(乘2运算)次数为6220800,加减法次数为18662400。
为了进一步减少运算量,4×4整数DCT核心变换可以分两步完成:先对图像块的每一列做一维变换,再对变换结果的每一行做一维变换。行变换的运算量和列变换相同,可利用如下的蝶形运算实现4×4整数DCT核心变换:
首先,对式(1)中原始图像块X采用蝶形运算进行一维列变换:
进行运算,其中xn,n=0,1,2,3为X中任一列的元素,一维列变换结果为pn,n=0,1,2,3,一维列变换需要做四次,分别对X的4列进行一维列变换,即:
第一次蝶形运算输入为x0=x00,x1=x10,x2=x20,x3=x30,输出为p0=p00,p1=p10,p2=p20,p3=p30
第二次蝶形运算输入为x0=x01,x1=x11,x2=x21,x3=x31,输出为p0=p01,p1=p11,p2=p21,p3=p31
第三次蝶形运算输入为x0=x02,x1=x12,x2=x22,x3=x32,输出为p0=p02,p1=p12,p2=p22,p3=p32
第四次蝶形运算输入为x0=x03,x1=x13,x2=x23,x3=x33,输出为p0=p03,p1=p13,p2=p23,p3=p33;四次一维列变换的结果为4乘4矩阵
然后对4乘4矩阵P进行转置,生成4乘4矩阵Q,即Q=PT
最后对Q采用蝶形运算:
进行运算,其中qn,n=0,1,2,3为Q中任一列的元素,一维列变换结果为en,n=0,1,2,3,一维列变换需要做四次,分别对Q的4列进行一维列变换,4次一维列变换的结果为4乘4矩阵E。
同样,4×4整数IDCT变换核心2D变换也相应地可采用蝶形运算。
4×4整数DCT变换核心2D变换的运算量为:乘法(乘2运算)16次,加减法64次。对于一个1920×1080的彩色高清视频帧,采用4:2:0的子采样格式,则需要现有4×4 整数DCT变换的核心2D变换的乘法(乘2运算)次数为3110400,加减法次数为12441600。
发明内容
针对4×4整数DCT变换的核心变换的运算次数多、计算时间长的技术问题,本发明提出一种用于数字视频编解码的3乘3整数DCT变换量化器,通过3乘3整数DCT变换实现数字视频的压缩编码,比采用4乘4整数DCT变换计算量小。
为了解决上述技术问题,本发明的技术方案是:
3×3整数DCT变换可以表示为:
在式(3)中,Y代表变换得到的DCT系数,X表示要进行变换的3×3的像素块, xij,i,j=0,1,2表示X中i行j列的元素,C3XC3 T是整型变换中的核心2D变换。E3是缩放因数矩阵,表示(C3XC3 T)的每个元素都要乘以矩阵E3中相同位置的对应缩放因子,并且
相应地,3×3整数IDCT逆变换可以表示为:
式(4)中,Y代表图像块的DCT变换系数,X′表示经过IDCT逆变换得到的图像块。
一种用于数字视频编解码的3乘3整数DCT变换量化器,包括当前帧3×3分块器、3×3整数DCT核心变换器、后缩放量化器和3×3图像变换块发送器,当前帧3×3分块器与3×3整数DCT核心变换器相连接,3×3整数DCT核心变换器与后缩放量化器相连接,后缩放量化器与3×3图像变换块发送器相连接;当前帧3×3分块器把视频编码器中的当前帧图像划分成块大小为3×3的图像块,并把大小为3×3的图像块依次送到3×3整数 DCT核心变换器;3×3整数DCT核心变换器对图像块进行整数DCT核心变换,后缩放量化器对整数DCT核心变换后的图像块进行缩放和量化,3×3图像变换块发送器将后缩放量化器发送来的大小为3×3的图像块转换成串行数据,通过传输信道发送给接收方的视频解码器。
所述3×3整数DCT核心变换器包括第一一维列变换器、第一存储转置器和第二一维列变换器;所述第一一维列变换器与第一存储转置器相连接,第一存储转置器与第二一维列变换器相连接;第一一维列变换器分别对3×3图像块X的每列进行一维列变换生成变换矩阵S,第一存储转置器对变换矩阵S进行转置生成矩阵T,第二一维列变换器对矩阵T中的每列依次进行一维列变换生成矩阵Wf
所述3×3整数DCT核心变换器对大小为3×3的图像块X进行3×3整数DCT核心变换的方法是:
其中,Wf表示3×3图像块的整数DCT核心变换结果,C3是3×3整数列变换矩阵,是3×3整数行变换矩阵,X表示待变换的3×3图像块,xij表示待变换的图像块X中i行j 列的像素值,wfij表示3×3整数DCT核心变换域i行j列的系数值,i,j=0,1,2;
所述后缩放量化器将整数DCT核心变换结果矩阵Wf中的每个元素wfij进行量化和缩放,其输出结果为矩阵
其中,zfij是量化后的矩阵Zf中i行j列系数,round()为下取整操作,Qstep是选择的量化步长;PFij的取值如下表所示:
所述第一一维列变换器采用蝶形运算:
进行运算,其中xn,n=0,1,2为图像块X中任一列的元素,一维列变换结果为sn,n=0,1,2,一维列变换需要做三次,分别对X的3列进行一维列变换,三次一维列变换的结果为3乘3 的变换矩阵S,具体地:
第一次蝶形运算输入为x0=x00,x1=x10,x2=x20,输出为s0=s00,s1=s10,s2=s20
第二次蝶形运算输入为x0=x01,x1=x11,x2=x21,输出为s0=s01,s1=s11,s2=s21
第三次蝶形运算输入为x0=x02,x1=x12,x2=x22,输出为s0=s02,s1=s12,s2=s22
三次一维列变换的结果为3乘3矩阵
所述第一存储转置器对3乘3的变换矩阵S进行转置,生成3乘3矩阵即T=ST
所述第二一维列变换器采用蝶形运算:
进行运算,其中tn,n=0,1,2为矩阵T中任一列的元素,一维列变换结果为wfn,n=0,1,2,一维列变换需要做三次,分别对T的3列进行一维列变换,三次一维列变换的结果为3乘3 的矩阵Wf,具体地,
第一次蝶形运算输入为t0=t00,t1=t10,t2=t20,输出为wf0=wf00,w1=wf01,wf2=wf02
第二次蝶形运算输入为t0=t01,t1=t11,t2=t21,输出为wf0=wf10,wf1=wf11,wf2=wf12
第三次蝶形运算输入为t0=t02,t1=t12,t2=t22,输出为wf0=wf20,wf1=wf21, wf2=wf22
三次一维列变换的结果为3乘3矩阵Wf
与3乘3整数DCT变换量化器相对应的3乘3整数IDCT逆变换反量化器包括3×3图像变换块生成器、反量化预缩放器、3×3整数IDCT核心变换器、3×3图像块输出器,3 ×3图像变换块生成器与反量化预缩放器相连接,反量化预缩放器与3×3整数IDCT核心变换器相连接,3×3整数IDCT核心变换器与3×3图像块输出器相连接;3×3图像变换块生成器将解码器接收到的图像编码信息生成3×3图像变换块,反量化预缩放器对3×3 图像变换块生成器生成的3×3图像变换块进行反量化和预缩放,3×3整数IDCT核心变换器对反量化预缩放器处理后的图像块进行3×3整数IDCT核心变换,3×3图像块输出器对 3×3整数IDCT核心变换后的结果进行后处理,输出3×3像素的图像块。
所述3×3整数IDCT核心变换器包括第三一维列变换器、第二存储转置器和第四一维列变换器,所述第三一维列变换器和第二存储转置器相连接,第二存储转置器和第四一维列变换器相连接;所述第三一维列变换器分别对待处理的图像块WI的每列进行一维列变换生成变换矩阵R,第二存储转置器对变换矩阵R进行转置生成矩阵H,第四一维列变换器对矩阵H的每列进行一维列变换,生成整数IDCT核心变换后的图像块G。
所述反量化预缩放器对3×3图像变换块生成器生成的3×3图像变换块进行反量化和预缩放处理得到图像块矩阵且zij是图像变换块ZI中第i行第j列的元素,wij是图像块矩阵WI中第i行第j列的元素, wij=zij·Qstep·PFij·64,i,j=0,1,2,Qstep是选择的量化步长;PFij的取值如下表所示:
所述3×3整数IDCT核心变换器对图像矩阵WI进行3×3整数IDCT核心变换得到图像块矩阵所述3×3图像块输出器通过进行系数修正,得到输出图像块X′,其中,round()为下取整操作。
所述第三一维列变换器利用蝶形运算:
进行运算,其中wn,n=0,1,2为图像块矩阵WI中任一列的元素,一维列变换结果为rn,n=0,1,2,一维列变换需要做三次,分别对像块矩阵WI的3列进行一维列变换,三次一维列变换的结果为3乘3变换矩阵R,具体地,
第一次蝶形运算输入为w0=w00,w1=w10,w2=w20,输出为r0=r00,r1=r10,r2=r20
第二次蝶形运算输入为w0=w01,w1=w11,w2=w21,输出为r0=r01,r1=r11,r2=r21
第三次蝶形运算输入为w0=w02,w1=w12,w2=w22,输出为r0=r02,r1=r12,r2=r22
三次一维列变换的结果为3乘3的生成矩阵
所述第二存储转置器对3乘3的生成矩阵R进行转置,生成3乘3的矩阵即H=RT
所述第四一维列变换器采用蝶形运算:
进行运算,其中hn,n=0,1,2为矩阵H中任一列的元素,一维列变换结果为gn,n=0,1,2,一维列变换需要做三次,分别对矩阵H的3列进行一维列变换,三次一维列变换的结果为3 乘3矩阵G,具体地,
第一次蝶形运算输入为h0=h00,h1=h10,h2=h20,输出为g0=g00,g1=g01,g2=g02
第二次蝶形运算输入为h0=h01,h1=h11,h2=h21,输出为g0=g10,g1=g11,g2=g12
第三次蝶形运算输入为h0=h02,h1=h12,h2=h22,输出为g0=g20,g1=g21,g2=g22
三次一维列变换的结果为3乘3矩阵G。
本发明的量化及反量化、缩放的计算量和4×4整数DCT变换及逆变换的计算量相同,都取决于帧内像素数,核心2D变换的运算次数比4×4整数DCT变换及逆变换的计算量少,解码后的重建视频帧PSNR质量也比4×4整数DCT变换及逆变换的质量高。对于一个3×3整数DCT变换,其核心2D变换的运算量为:乘法(乘2运算)6次,加减法30次。对于一个1920×1080的彩色高清视频帧,采用4:2:0的子采样格式,则需要345600个3×3 整数DCT变换,其核心2D变换需要的乘法(乘2运算)次数2073600为,加减法次数为 10368000。为了进一步减少运算量,3×3整数DCT核心变换可以分两步完成:先对图像块 X的每一列做一维变换,再对变换结果的每一行做一维变换,也可以利用里面的重复计算进行蝶形运算。利用蝶形运算3×3整数DCT变换核心2D变换的运算量为:乘法(乘2运算)6次,加减法24次。对于一个1920×1080的彩色高清视频帧,采用4:2:0的子采样格式,则需要345600个3×3整数DCT变换,在采用蝶形运算时,其核心2D变换需要的乘法(乘2运算)次数为2073600,加减法次数为8294400。比采用4×4整数DCT变换的蝶形运算,本发明乘法运算(乘2运算)次数减少了1036800次,减少了33.3%;加减法运算次数减少了4147200次,减少了33.3%。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的3×3整数DCT变换量化器结构框图。
图2为本发明的3×3整数IDCT逆变换量化器结构框图。
图3为本发明的3×3整数DCT核心变换器结构框图。
图4为本发明的3×3整数IDCT核心变换器结构框图。
图5为本发明的3×3整数DCT变换量化器和3×3整数IDCT逆变换量化器应用于数字视频编解码器的效果图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种用于数字视频编解码的3乘3整数DCT变换量化器,包括当前帧3×3分块器11、3×3整数DCT核心变换器12、后缩放量化器13和3×3图像变换块发送器14,当前帧3×3分块器11与3×3整数DCT核心变换器12相连接,3×3整数DCT核心变换器12与后缩放量化器13相连接,后缩放量化器13与3×3图像变换块发送器14相连接。当前帧3×3分块器11把视频编码器中的当前帧图像划分成块大小为3×3的图像块,并把大小为3×3的图像块依次送到3×3整数DCT核心变换器12;3×3整数DCT核心变换器12对图像块进行整数DCT核心变换,后缩放量化器13对整数DCT核心变换后的图像块进行缩放和量化,3×3图像变换块发送器14将后缩放量化器13发送来的大小为3×3 的图像块转换成串行数据,通过传输信道发送给接收方的视频解码器。
所述3×3整数DCT核心变换器12对大小为3×3的图像块X进行3×3整数DCT核心变换的方法是:
式(5)中,Wf表示3×3图像块的整数DCT核心变换结果、C3是3×3整数列变换矩阵、是3×3整数行变换矩阵、X表示待变换的3×3图像块像素值,xij表示待变换的图像块X中i行j列的像素值,wfij表示3×3整数DCT核心变换域i行j列的系数值,i,j=0,1,2。
后缩放量化器13将核心变换结果矩阵Wf中的每个元素wfij进行量化和缩放,输出3×3 图像变换量化块
式(6)中,zfij是量化后的矩阵Zf中i行j列的系数,round()为下取整操作,Qstep是选择的量化步长,可使用H.264/AVC的量化表,在H.264/AVC中,共有52种量化步长可选。
PFij的取值如下表所示:i,j=0,1,2
表1 PFij的取值结果
如图2所示,与3乘3整数DCT变换量化器相对应的3×3反量化及整数IDCT逆变换器结构框图,包括3×3图像变换块生成器21、反量化预缩放器22、3×3整数IDCT核心变换器23、3×3图像块输出器24。其中,3×3图像变换块生成器21与反量化预缩放器22相连接,反量化预缩放器22与3×3整数IDCT核心变换器23相连接,3×3整数IDCT核心变换器23与3×3图像块输出器24相连接。3×3图像变换块生成器21将解码器接收到的图像编码信息生成3×3图像变换块,反量化预缩放器22对3×3图像变换块生成器21生成的3×3图像变换块进行反量化和预缩放,3×3整数IDCT核心变换器23对反量化预缩放器22处理后的图像块进行3×3整数IDCT核心变换,3×3图像块输出器24对3×3整数 IDCT核心变换后的图像块进行后处理,输出处理后的3×3像素图像块。
3×3图像变换块生成器21存储解码器接收到的3×3图像变换块ZI,它是3×3图像变换量化块Zf附加了信道噪声的结果,且
反量化预缩放器22对图像变换块ZI进行反量化和预缩放,反量化和预缩放操作结合进行,并乘以因数64,操作如下:
为反量化与预缩放器22的输出,且
wij=zij·Qstep·PFij·64,i,j=0,1,2,
zij是ZI中第i行第j列的元素、wij是矩阵WI中第i行第j列的元素;Qstep是选择的量化步长,可使用H.264/AVC的量化表,在H.264/AVC中,共有52种量化步长可选;
PFij的取值如表1所示。
所述3×3整数IDCT核心变换器23对图像矩阵WI进行3×3整数IDCT核心变换得到图像块矩阵
所述3×3图像块输出器24通过进行系数修正,得到输出图像块X′,其中,round()为下取整操作。
3×3整数DCT核心变换器12分两步完成3×3整数DCT核心变换:先对图像块X的每一列做一维列变换,再对一维列变换的结果做一维行变换,为了重复利用所设计的一维列变换电路,一维行变换可以先对一维列变换的结果做转置,再对转置结果做一维列变换。如图3所示,3×3整数DCT核心变换器12包括第一一维列变换器1201、第一存储转置器 1202、第二一维列变换器1203。其中,第一一维列变换器1201与第一存储转置器1202相连接,第一存储转置器1202与第二一维列变换器1203相连接。第一一维列变换器1201分别对图像块X的每列进行一维列变换生成变换矩阵S,第一存储转置器1202对变换矩阵S 进行转置生成转置矩阵T,第二一维列变换器1203对转置矩阵T中的每列依次进行一维列变换生成矩阵Wf
所述第一一维列变换器1201采用蝶形运算:
进行运算,其中xn,n=0,1,2为式(5)图像块X中任一列的元素,一维列变换结果为sn,n=0,1,2,一维列变换需要做三次,分别对图像块X的3列进行一维列变换,三次一维列变换的结果为3乘3变换矩阵S。具体地,
第一次蝶形运算输入为x0=x00,x1=x10,x2=x20,输出为s0=s00,s1=s10,s2=s20
第二次蝶形运算输入为x0=x01,x1=x11,x2=x21,输出为s0=s01,s1=s11,s2=s21
第三次蝶形运算输入为x0=x02,x1=x12,x2=x22,输出为s0=s02,s1=s12,s2=s22
三次一维列变换的结果为3乘3矩阵
所述第一存储转置器1202对3乘3矩阵S进行转置,生成3乘3矩阵即T=ST
所述第二一维列变换器1203采用蝶形运算:
进行运算,其中tn,n=0,1,2为矩阵T中任一列的元素,一维列变换结果为wfn,n=0,1,2,一维列变换需要做三次,分别对矩阵T的3列进行一维列变换,三次一维列变换的结果为3 乘3矩阵Wf
具体地,
第一次蝶形运算输入为t0=t00,t1=t10,t2=t20,输出为wf0=wf00,w1=wf01,wf2=wf02
第二次蝶形运算输入为t0=t01,t1=t11,t2=t21,输出为wf0=wf10,wf1=wf11,wf2=wf12
第三次蝶形运算输入为t0=t02,t1=t12,t2=t22,输出为wf0=wf20,wf1=wf21, wf2=wf22;三次一维列变换的结果为3乘3矩阵Wf
利用蝶形运算,3×3整数DCT变换核心2D变换的运算量为:乘法(乘2运算)6次,加减法24次。对于一个1920×1080的彩色高清视频帧,采用4:2:0的子采样格式,则需要345600个3×3整数DCT变换,其核心2D变换需要的乘法(乘2运算)次数为2073600,加减法次数为8294400。比采用蝶形运算的4×4整数DCT变换,乘法运算(乘2运算) 次数减少了1036800次,减少了33.3%;加减法运算次数减少了4147200,减少了33.3%。
3×3整数IDCT核心变换器分两步完成3×3整数IDCT核心变换:先对待处理的图像块 WI的每一列做一维列变换,再对一维列变换的结果做一维行变换,为了重复利用所设计的一维列变换电路,一维行变换可以先对一维列变换的结果做转置,再对转置结果做一维列变换。如图4所示,3×3整数IDCT核心变换器包括第三一维列变换器2301、第二存储转置器2302、第四一维列变换器2303,第三一维列变换器2301和第二存储转置器2302相连接,第二存储转置器2302和第四一维列变换器2303相连接。
所述第三一维列变换器2301利用蝶形运算:
进行运算,其中wn,n=0,1,2为式(7)中矩阵WI任一列的元素,一维列变换结果为rn,n=0,1,2,一维列变换需要做三次,分别对矩阵WI的3列进行一维列变换,三次一维列变换的结果为 3乘3矩阵R,具体地:
第一次蝶形运算输入为w0=w00,w1=w10,w2=w20,输出为r0=r00,r1=r10,r2=r20
第二次蝶形运算输入为w0=w01,w1=w11,w2=w21,输出为r0=r01,r1=r11,r2=r21
第三次蝶形运算输入为w0=w02,w1=w12,w2=w22,输出为r0=r02,r1=r12,r2=r22
三次一维列变换的结果为3乘3矩阵
所述第二存储转置器2302对3乘3矩阵R进行转置,生成3乘3矩阵即H=RT
所述第四一维列变换器2303采用蝶形运算:
进行运算,其中hn,n=0,1,2为H中任一列的元素,一维列变换结果为gn,n=0,1,2,一维列变换需要做三次,分别对H的3列进行一维列变换,三次一维列变换的结果为3乘3矩阵G。
具体地,
第一次蝶形运算输入为h0=h00,h1=h10,h2=h20,输出为g0=g00,g1=g01,g2=g02
第二次蝶形运算输入为h0=h01,h1=h11,h2=h21,输出为g0=g10,g1=g11,g2=g12
第三次蝶形运算输入为h0=h02,h1=h12,h2=h22,输出为g0=g20,g1=g21,g2=g22
三次一维列变换的结果为3乘3矩阵G。
如图5所示,采用FOOTBALL的CIF格式测试视频,分块大小分别为4×4和3×3,穷尽搜索窗口为16×16,分别使用了4×4整数DCT变换和3×3整数DCT变换时,90帧解码视频的PSNR性能对比。由图5可以看到,相比4×4整数DCT变换方法,采用本发明的3×3 整数DCT变换的编解码器所解码帧的PSNR性能稳定提高。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种用于数字视频编解码的3乘3整数DCT变换量化器,其特征在于:包括当前帧3×3分块器(11)、3×3整数DCT核心变换器(12)、后缩放量化器(13)和3×3图像变换块发送器(14),当前帧3×3分块器(11)与3×3整数DCT核心变换器(12)相连接,3×3整数DCT核心变换器(12)与后缩放量化器(13)相连接,后缩放量化器(13)与3×3图像变换块发送器(14)相连接;当前帧3×3分块器(11)把视频编码器中的当前帧图像划分成块大小为3×3的图像块,并把大小为3×3的图像块依次送到3×3整数DCT核心变换器(12);3×3整数DCT核心变换器(12)对图像块进行整数DCT核心变换,后缩放量化器(13)对整数DCT核心变换后的图像块进行缩放和量化,3×3图像变换块发送器(14)将后缩放量化器(13)发送来的大小为3×3的图像块转换成串行数据,通过传输信道发送给接收方的视频解码器;
所述3×3整数DCT核心变换器(12)对大小为3×3的图像块X进行3×3整数DCT核心变换的方法是:
Figure FDA0004083222560000011
其中,Wf表示3×3图像块的整数DCT核心变换结果,C3是3×3整数列变换矩阵,
Figure FDA0004083222560000012
是3×3整数行变换矩阵,X表示待变换的3×3图像块,xij表示待变换的图像块X中i行j列的像素值,wfij表示3×3整数DCT核心变换域i行j列的系数值,i,j=0,1,2;
所述后缩放量化器(13)将整数DCT核心变换结果矩阵Wf中的每个元素wfij进行量化和缩放,其输出结果为矩阵
Figure FDA0004083222560000013
Figure FDA0004083222560000014
其中,zfij是量化后的矩阵Zf中i行j列系数,round()为下取整操作,Qstep是选择的量化步长;PFij的取值如下表所示:
Figure FDA0004083222560000015
Figure FDA0004083222560000021
2.根据权利要求1所述的用于数字视频编解码的3乘3整数DCT变换量化器,其特征在于,所述3×3整数DCT核心变换器(12)包括第一一维列变换器(1201)、第一存储转置器(1202)和第二一维列变换器(1203);所述第一一维列变换器(1201)与第一存储转置器(1202)相连接,第一存储转置器(1202)与第二一维列变换器(1203)相连接;第一一维列变换器(1201)分别对3×3图像块X的每列进行一维列变换生成变换矩阵S,第一存储转置器(1202)对变换矩阵S进行转置生成矩阵T,第二一维列变换器(1203)对矩阵T中的每列依次进行一维列变换生成矩阵Wf
3.根据权利要求2所述的用于数字视频编解码的3乘3整数DCT变换量化器,其特征在于,所述第一一维列变换器(1201)采用蝶形运算:
Figure FDA0004083222560000022
进行运算,其中xn,n=0,1,2为图像块X中任一列的元素,一维列变换结果为sn,n=0,1,2,一维列变换需要做三次,分别对X的3列进行一维列变换,三次一维列变换的结果为3乘3的变换矩阵S,具体地:
第一次蝶形运算输入为x0=x00,x1=x10,x2=x20,输出为s0=s00,s1=s10,s2=s20
第二次蝶形运算输入为x0=x01,x1=x11,x2=x21,输出为s0=s01,s1=s11,s2=s21
第三次蝶形运算输入为x0=x02,x1=x12,x2=x22,输出为s0=s02,s1=s12,s2=s22
三次一维列变换的结果为3乘3矩阵
Figure FDA0004083222560000023
所述第一存储转置器(1202)对3乘3的变换矩阵S进行转置,生成3乘3矩阵
Figure FDA0004083222560000024
即T=ST
所述第二一维列变换器(1203)采用蝶形运算:
Figure FDA0004083222560000031
进行运算,其中tn,n=0,1,2为矩阵T中任一列的元素,一维列变换结果为wfn,n=0,1,2,一维列变换需要做三次,分别对T的3列进行一维列变换,三次一维列变换的结果为3乘3的矩阵Wf,具体地,
第一次蝶形运算输入为t0=t00,t1=t10,t2=t20,输出为wf0=wf00,w1=wf01,wf2=wf02
第二次蝶形运算输入为t0=t01,t1=t11,t2=t21,输出为wf0=wf10,wf1=wf11,wf2=wf12
第三次蝶形运算输入为t0=t02,t1=t12,t2=t22,输出为wf0=wf20,wf1=wf21,wf2=wf22
三次一维列变换的结果为3乘3矩阵Wf
4.根据权利要求1所述的用于数字视频编解码的3乘3整数DCT变换量化器,其特征在于,与3乘3整数DCT变换量化器相对应的3乘3整数IDCT逆变换反量化器包括3×3图像变换块生成器(21)、反量化预缩放器(22)、3×3整数IDCT核心变换器(23)、3×3图像块输出器(24),3×3图像变换块生成器(21)与反量化预缩放器(22)相连接,反量化预缩放器(22)与3×3整数IDCT核心变换器(23)相连接,3×3整数IDCT核心变换器(23)与3×3图像块输出器(24)相连接;3×3图像变换块生成器(21)将解码器接收到的图像编码信息生成3×3图像变换块,反量化预缩放器(22)对3×3图像变换块生成器(21)生成的3×3图像变换块进行反量化和预缩放,3×3整数IDCT核心变换器(23)对反量化预缩放器(22)处理后的图像块进行3×3整数IDCT核心变换,3×3图像块输出器(24)对3×3整数IDCT核心变换后的结果进行后处理,输出3×3像素的图像块。
5.根据权利要求4所述的用于数字视频编解码的3乘3整数DCT变换量化器,其特征在于,所述3×3整数IDCT核心变换器(23)包括第三一维列变换器(2301)、第二存储转置器(2302)和第四一维列变换器(2303),所述第三一维列变换器(2301)和第二存储转置器(2302)相连接,第二存储转置器(2302)和第四一维列变换器(2303)相连接;所述第三一维列变换器(2301)分别对待处理的图像块WI的每列进行一维列变换生成变换矩阵R,第二存储转置器(2302)对变换矩阵R进行转置生成矩阵H,第四一维列变换器(2303)对矩阵H的每列进行一维列变换,生成整数IDCT核心变换后的图像块G。
6.根据权利要求4所述的用于数字视频编解码的3乘3整数DCT变换量化器,其特征在于,所述反量化预缩放器(22)对3×3图像变换块生成器(21)生成的3×3图像变换块
Figure FDA0004083222560000041
进行反量化和预缩放处理得到图像块矩阵
Figure FDA0004083222560000042
且zij是图像变换块ZI中第i行第j列的元素,wij是图像块矩阵WI中第i行第j列的元素,wij=zij·Qstep·PFij·64,i,j=0,1,2,Qstep是选择的量化步长;PFij的取值如下表所示:
Figure FDA0004083222560000043
所述3×3整数IDCT核心变换器(23)对图像矩阵WI进行3×3整数IDCT核心变换得到图像块矩阵
Figure FDA0004083222560000044
所述3×3图像块输出器(24)通过
Figure FDA0004083222560000045
进行系数修正,得到输出图像块X′,其中,round()为下取整操作。
7.根据权利要求5所述的用于数字视频编解码的3乘3整数DCT变换量化器,其特征在于,所述第三一维列变换器(2301)利用蝶形运算:
Figure FDA0004083222560000051
进行运算,其中wn,n=0,1,2为图像块矩阵WI中任一列的元素,一维列变换结果为rn,n=0,1,2,一维列变换需要做三次,分别对像块矩阵WI的3列进行一维列变换,三次一维列变换的结果为3乘3变换矩阵R,具体地,
第一次蝶形运算输入为w0=w00,w1=w10,w2=w20,输出为r0=r00,r1=r10,r2=r20
第二次蝶形运算输入为w0=w01,w1=w11,w2=w21,输出为r0=r01,r1=r11,r2=r21
第三次蝶形运算输入为w0=w02,w1=w12,w2=w22,输出为r0=r02,r1=r12,r2=r22
三次一维列变换的结果为3乘3的生成矩阵
Figure FDA0004083222560000052
所述第二存储转置器(2302)对3乘3的生成矩阵R进行转置,生成3乘3的矩阵
Figure FDA0004083222560000053
即H=RT
所述第四一维列变换器(2303)采用蝶形运算:
Figure FDA0004083222560000054
进行运算,其中hn,n=0,1,2为矩阵H中任一列的元素,一维列变换结果为gn,n=0,1,2,一维列变换需要做三次,分别对矩阵H的3列进行一维列变换,三次一维列变换的结果为3乘3矩阵G,具体地,
第一次蝶形运算输入为h0=h00,h1=h10,h2=h20,输出为g0=g00,g1=g01,g2=g02
第二次蝶形运算输入为h0=h01,h1=h11,h2=h21,输出为g0=g10,g1=g11,g2=g12
第三次蝶形运算输入为h0=h02,h1=h12,h2=h22,输出为g0=g20,g1=g21,g2=g22
三次一维列变换的结果为3乘3矩阵G。
CN201710604580.9A 2017-07-24 2017-07-24 一种用于数字视频编解码的3乘3整数dct变换量化器 Active CN107249130B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710604580.9A CN107249130B (zh) 2017-07-24 2017-07-24 一种用于数字视频编解码的3乘3整数dct变换量化器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710604580.9A CN107249130B (zh) 2017-07-24 2017-07-24 一种用于数字视频编解码的3乘3整数dct变换量化器

Publications (2)

Publication Number Publication Date
CN107249130A CN107249130A (zh) 2017-10-13
CN107249130B true CN107249130B (zh) 2023-04-07

Family

ID=60014190

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710604580.9A Active CN107249130B (zh) 2017-07-24 2017-07-24 一种用于数字视频编解码的3乘3整数dct变换量化器

Country Status (1)

Country Link
CN (1) CN107249130B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111787320B (zh) * 2020-07-03 2022-02-08 北京博雅慧视智能技术研究院有限公司 一种变换编码系统和方法
CN112449199B (zh) * 2020-11-19 2022-07-29 河南工程学院 一种并行位矢量变换部分积相加的一维dct/idct变换器
CN114531600B (zh) * 2022-02-18 2023-10-03 阿里巴巴(中国)有限公司 变换单元、现场可编程门阵列、芯片、电子设备、片上系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1589017A (zh) * 2004-08-06 2005-03-02 联合信源数字音视频技术(北京)有限公司 一种低复杂度整数4×4离散余弦变换量化装置及其实现方法
WO2006034603A1 (en) * 2004-09-28 2006-04-06 Huawei Technologies Co., Ltd Video image encoding method
CN102147788A (zh) * 2010-02-04 2011-08-10 成都市世嘉电子实业有限公司 一种无乘法器的快速无损整数dct算法
CN106954070A (zh) * 2017-04-28 2017-07-14 河南工程学院 一种滑动像素块整数dct核心矩阵变换运动补偿器及方法
CN206962992U (zh) * 2017-07-24 2018-02-02 河南工程学院 用于数字视频编解码的3乘3整数dct变换量化器

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1589017A (zh) * 2004-08-06 2005-03-02 联合信源数字音视频技术(北京)有限公司 一种低复杂度整数4×4离散余弦变换量化装置及其实现方法
WO2006034603A1 (en) * 2004-09-28 2006-04-06 Huawei Technologies Co., Ltd Video image encoding method
CN102147788A (zh) * 2010-02-04 2011-08-10 成都市世嘉电子实业有限公司 一种无乘法器的快速无损整数dct算法
CN106954070A (zh) * 2017-04-28 2017-07-14 河南工程学院 一种滑动像素块整数dct核心矩阵变换运动补偿器及方法
CN206962992U (zh) * 2017-07-24 2018-02-02 河南工程学院 用于数字视频编解码的3乘3整数dct变换量化器

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
徐林玲、林嘉宇.H. 26L中整数变换的研究及改进.通信技术.2003,全文. *

Also Published As

Publication number Publication date
CN107249130A (zh) 2017-10-13

Similar Documents

Publication Publication Date Title
US10412393B2 (en) Intra-frame encoding method, intra-frame decoding method, encoder, and decoder
EP1359546B1 (en) 2-D transforms for image and video coding
Talukder et al. Haar wavelet based approach for image compression and quality assessment of compressed image
RU2460129C2 (ru) Структура преобразования с масштабированными и немасштабированными интерфейсами
KR101013344B1 (ko) 이산 코사인 변환의 계산 중의 에러 감소
KR101315562B1 (ko) 미디어 코딩을 위한 4×4 변환
KR101315600B1 (ko) 미디어 코딩을 위한 4×4 변환
EP1596309A2 (en) Fast video codec transform implementations
US20140010284A1 (en) Image transform and inverse transform method, and image encoding and decoding device using same
US8170334B2 (en) Image processing systems employing image compression and accelerated image decompression
US8416861B2 (en) Fixed-point implementation of an adaptive image filter with high coding efficiency
JP2008501250A (ja) 第1の変換カーネルに基づく入力ビデオを第2の変換カーネルに基づく出力ビデオにトランスコードする方法、及び入力形式を有する入力ビデオを出力形式を有する出力ビデオに変換するトランスコーダ
CN107249130B (zh) 一种用于数字视频编解码的3乘3整数dct变换量化器
US20090097545A1 (en) Fixed-Point Implementation of an Adaptive Image Filter with High Coding Efficiency
US20180192056A1 (en) Video decoder with reduced dynamic range transform with inverse transform shifting memory
US8170333B2 (en) Image processing systems employing image compression
Brahimi et al. A novel and efficient 8-point DCT approximation for image compression
CN108200439B (zh) 提高数字信号变换性能的方法及数字信号变换方法和装置
CN102036075A (zh) 一种图像及数字视频编码及解码方法
Brahimi et al. An efficient fast integer DCT transform for images compression with 16 additions only
US8170335B2 (en) Image processing systems employing image compression and accelerated decompression
WO2020060832A1 (en) Fast implementation of odd one dimensional transforms
CN100440978C (zh) 一种视频图像编码方法
EP2208352A2 (en) Fixed-point implementation of an adaptive image filter with high coding efficiency
CN206962992U (zh) 用于数字视频编解码的3乘3整数dct变换量化器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant