CN1801947A - 编码和解码运动图像的设备、方法及其记录介质 - Google Patents

编码和解码运动图像的设备、方法及其记录介质 Download PDF

Info

Publication number
CN1801947A
CN1801947A CNA2006100005053A CN200610000505A CN1801947A CN 1801947 A CN1801947 A CN 1801947A CN A2006100005053 A CNA2006100005053 A CN A2006100005053A CN 200610000505 A CN200610000505 A CN 200610000505A CN 1801947 A CN1801947 A CN 1801947A
Authority
CN
China
Prior art keywords
input picture
product factor
improved product
factor table
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006100005053A
Other languages
English (en)
Inventor
宋秉哲
千畺旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN1801947A publication Critical patent/CN1801947A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63BAPPARATUS FOR PHYSICAL TRAINING, GYMNASTICS, SWIMMING, CLIMBING, OR FENCING; BALL GAMES; TRAINING EQUIPMENT
    • A63B5/00Apparatus for jumping
    • A63B5/20Skipping-ropes or similar devices rotating in a vertical plane
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63BAPPARATUS FOR PHYSICAL TRAINING, GYMNASTICS, SWIMMING, CLIMBING, OR FENCING; BALL GAMES; TRAINING EQUIPMENT
    • A63B2225/00Miscellaneous features of sport apparatus, devices or equipment
    • A63B2225/09Adjustable dimensions
    • A63B2225/093Height

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Physical Education & Sports Medicine (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

提供了一种编码和解码运动图像的方法,在所述的方法中,来自输入图像的噪声被同时编码和去除。所述的编码运动图像的方法包括:考虑输入图像的噪声信息选择块单元中的改进的乘积因子表;对所述输入图像进行整数变换;使用所述选择的改进的乘积因子表对所述输入图像执行量化。因此,可提高压缩运动图像的效率和性能。

Description

编码和解码运动图像的设备、方法及其记录介质
本申请要求于2005年1月7日在韩国知识产权局提交的第10-2005-0001801号韩国专利申请的优先权,该申请的公开通过引用全部包含于此。
                       技术领域
本发明的设备和方法涉及一种用于编码和解码运动图像的方法和设备,更具体地讲,涉及考虑输入到运动图像编码器的图像的噪声信息,通过自适应地选择在量化处理中使用的乘法表,来增强编码运动图像的效率。
再更详细地说,本发明涉及一种当图像输入到采用H.264的运动图像编码器时从由于噪声而失真的图像中有效地去除噪声的方法和设备。
                       背景技术
近来,已经开发了数字多功能盘(DVD)记录机和机顶盒,它们接收模拟地面广播节目然后使用如运动图像专家组2(MPEG2)或运动图像专家组4(MPEG4)的数据压缩方法解码并存储接收的节目。此外,还开发了用于存储通过使用H.264方法以及MPEG2方法而被解码的数据的蓝光盘(BD)记录机。
然而,在地面广播的情况下,到达接收端的图像可能由于信道噪声而失真。例如,高斯白噪声可能包含在整个图像中。如果使用MPEG2或H.264方法压缩图像,则压缩该图像的效率可能会由于高斯白噪声的影响而很低。
因此,对从运动图像去除噪声已经进行了很多研究。传统的噪声消除方法包括减少二维空间中包含的噪声的空间噪声减少方法,以及减少时间轴方向上的噪声的时间噪声减少方法。传统的噪声消除方法还包括作为空间噪声减少方法和时间噪声减少方法的结合的空间-时间噪声减少方法。
图1是示出使用传统的噪声消除方法编码运动图像的设备的框图。该设备包括普通运动图像编码器120和预处理处理器110。预处理处理器110使用传统的噪声消除方法之一从输入图像中消除噪声,并将没有噪声的输入图像提供到运动图像编码器120。
通常,预处理处理器110通过使用空间噪声减少方法、时间噪声减少方法或空间-时间噪声减少方法来从图像中去除噪声。
图2和图3是示出空间噪声减少方法的示图。当使用具有滤波系数[121]的简单低通滤波器执行空间噪声减少方法时,会发生边缘模糊。为了减少噪声而不引起边缘模糊,可使用保留细节的空间噪声减少方法,在该方法中,通过检测块单元例如3行×3像素的单元中的方向来执行低通滤波。图2示出了保留细节的空间噪声减少方法的例子。
参照图2,边缘选择器210对图3中所示的8个空间噪声减少滤波掩模执行高通滤波以获得滤波输出,并对每个掩模选择用于获得最小滤波输出的滤波方向。系数控制器220通过调整选择的滤波方向上的低通滤波系数来在选择的方向上执行低通滤波。边缘选择器210使用的掩模的数量越大,方向检测的精度越高,但噪声减少效果越差。相反,使用的掩模的数量越小,噪声较少效果越好,但是边缘模糊的频率越高。
图4是示出时间噪声减少方法的框图。参照图4,运动检测器410基于输入图像和存储在帧存储器430中的前一图像,估计当前图像中的运动和噪声幅度。如果运动检测器410确定少量运动和大量噪声包含在当前图像中,则时间递归滤波器(temporal recursive filter)420在时间轴的方向上对当前图像执行低通滤波。相反,如果运动检测器410确定大量运动和少量噪声包含在当前图像中,则时间递归滤波器420输出当前图像而不进行低通滤波。时间噪声减少方法在处理静止图像时是有效的。在美国专利第5969777号中公开了该时间噪声减少方法。
然而,即使当使用使图像的边缘锐化的传统的空间噪声减少滤波器来滤波图像时,模糊效应仍然发生。此外,由于传统的时间噪声减少滤波器不适合于对运动图像滤波,所以多余的噪声仍然留在图像中。
                       发明内容
本发明提供一种用于编码和解码运动图像的方法和设备,所述方法和设备能够在编码运动图像时通过对运动图像滤波来去除噪声,从而提高压缩运动图像的效率和性能。
本发明还提供了一种记录介质,在所述记录介质上记录有用于执行编码和解码运动图像的方法的程序。
根据本发明的一方面,提供了一种使用多个改进的乘积因子表来编码运动图像的方法。所述的方法包括:考虑输入图像的特征选择预定块单元中的改进的乘积因子表中的一个;对所述输入图像进行整数变换;使用所述选择的改进的乘积因子表对被整数变换的输入图像执行量化。
根据本发明的另一方面,提供了一种使用多个改进的乘积因子表来解码运动图像的方法。所述的方法包括:对编码的图像数据执行可变长解码;从可变长解码的预定块单元中的图像数据提取指示所述多个改进的乘积因子表之一的索引信息;基于提取的索引信息选择所述改进的乘积因子表之一;使用选择的改进的乘积因子表对可变长解码的预定块单元中的图像进行反量化。
根据本发明的另一方面,提供了一种用于使用多个改进的乘积因子表编码运动图像的设备。所述的设备包括:改进的乘积因子表确定单元,用于考虑输入图像的特征选择块单元中的改进的乘积因子表中的一个;整数变换单元,用于对所述输入图像进行整数变换;量化单元,用于使用所选择的改进的乘积因子表对整数变换的输入图像进行量化。
根据本发明的另一方面,提供了一种用于使用多个改进的乘积因子表解码运动图像的设备。所述的设备包括:可变长解码单元,用于对编码的图像数据执行可变长解码,并从可变长解码的预定块单元中的图像数据中提取指示改进的乘积因子表之一的索引信息;改进的乘积因子表存储单元,用于存储改进的乘积因子表,并基于提取的索引信息选择所述改进的乘积因子表中的一个;反量化单元,使用选择的改进的乘积因子表来对可变长解码的预定块单元中的图像数据执行反量化。
根据本发明的另一方面,提供了一种计算机可读记录介质,其上记录有用于执行使用多个改进的乘积因子表来编码运动图像的方法的程序,所述方法包括:考虑输入图像的特征选择预定块单元中的改进的乘积因子表中的一个;对所述输入图像进行整数变换;使用所述选择的改进的乘积因子表对被整数变换的输入图像执行量化。
根据本发明的另一方面,提供了一种计算机可读记录介质,其上记录有用于执行使用多个改进的乘积因子表来编码运动图像的方法的程序,所述方法包括:对编码的图像数据执行可变长解码;从可变长解码的预定块单元中的图像数据提取指示所述改进的乘积因子表之一的索引信息;基于提取的索引信息选择所述改进的乘积因子表之一;使用选择的改进的乘积因子表对可变长解码的预定块单元中的图像进行反量化。
                        附图说明
通过下面参照附图对本发明示例性实施例的详细描述,本发明的上述和其他方面将会变得更加清楚,其中:
图1是示出使用传统的噪声消除方法编码运动图像的设备的框图;
图2示出了空间噪声滤波器;
图3示出了用于图2的空间噪声滤波器的掩模;
图4是示出了时间噪声减少方法的框图;
图5是其平均值不为0的图像数据的近似广义的维纳滤波(Weiner filer)器处理框图;
图6是处理其平均值不为0的图像数据的近似广义的维纳滤波器在整数变换域中框图;
图7A至图7C示出了用于处理帧内块的编码设备的结构;
图8示出了用于解码帧间块的普通视频解码设备;
图9是根据本发明示例性实施例的用于编码运动图像的设备的框图;
图10是示出根据本发明示例性实施例的编码运动图像的方法的流程图;
图11示出了根据本发明示例性实施例的用于解码运动图像的设备;
图12是示出根据本发明示例性实施例的解码运动图像的方法的流程图。
                       具体实施方式
现在,将参照附图更全面地描述本发明,在附图中示出了本发明的示例性实施例。然而,本发明可以以各种不同的形式实现,而应该理解的是,本发明不限于这里阐述的示例性实施例;相反,提供这些示例性实施例是为了使本发明的公开彻底和完全,并且全面地向本领域的技术人员传达本发明的构思。
将参照图5至图9描述根据本发明的编码运动图像的方法。
当编码运动图像时,由于预处理滤波能够通过从图像中去除噪声来提高编码运动图像的效率,因此,预处理滤波是有优势的。当通常在空间像素块中执行用于从图像中去除噪声的传统的预处理滤波技术时,在用于编码运动图像的设备中在整数变换域中执行本发明中的噪声去除技术。
在本发明中,使用近似广义的(approximated generalized)维纳滤波方法来从图像中去除噪声。在近似广义的维纳滤波方法中,利用快速酉变换(unitary transformation)如整数变换来实现维纳滤波。然而,也可以使用除了近似广义的维纳滤波方法之外的其他滤波方法来以整数变换执行滤波。
图5是处理其平均值不为0的图像数据的近似广义的维纳滤波器框图。在图5中,ν表示包含噪声的图像块, 表示滤波后的图像块的行阶的列矢量。由于图像块ν的平均值不为0,所以平均值估计单元510估计图像块ν的平均值,减法单元520从图像块ν中减去估计的平均值。
作为相减的结果而从减法单元520中输出的值z被滤波单元530滤波,滤波单元530输出滤波的数据作为滤波的结果。加法单元540将图像块的估计的平均值 加到滤波的数据
Figure A20061000050500113
上,然后输出被期望地滤波的数据作为相加的结果。
下面,将更详细地描述用于处理其平均值为0的图像模型的近似广义的维纳滤波方法。
当不存在模糊时,可通过下面的等式(1)来表示用于处理其平均值为0的图像模型的广义的维纳滤波方法:
Figure A20061000050500114
其中, L ~ = AL A * T , L = [ I + σ n 2 R - 1 ] - 1 , R=E[y yT],Z=Az,σn 2表示噪声方差,A表示酉变换。如果运动图像编码器是H.264运动图像编码器,则使用整数变换来对图像滤波。因此,A可以被理解为整数变换。此外,A=(C4C4),其中,C4表示4×4整数变换矩阵,表示克罗内克(Kronecker)乘积运算符。
总之,由于在酉变换中
Figure A20061000050500116
被近似地对角化,所以等式(1)可以重新整理为下面的等式(2):
其中,
Figure A20061000050500118
当等式(2)被应用到4×4图像块中时,可得到下面的等式:
y ~ ( k , l ) ≈ p ~ ( k , l ) Z ( k , l ) - - - ( 3 )
可被表示为如下:
p ~ ( k , l ) ≅ 1 1 + σ n 2 σ 2 ψ ( k , l ) - 1 - - - ( 4 )
其中,Ψ(k,l)表示沿着AR A*T的对角线放置的正规化元素值,σ2表示当噪声不存在时原始图像y的方差。总之,由于σ2是未知值,所以它可以用通过从方差z减去噪声方差来获得的值代替。
如等式(3)中所示,通过将二维整数变换系数乘以
Figure A20061000050500121
来对其平均值为0的图像块执行近似广义的维纳滤波。一旦
Figure A20061000050500122
被确定,则通过将 加到 上获得最终滤波的图像。
下面,将更详细地描述用于处理其平均值不为0的图像模型的近似广义的维纳滤波方法。
假设通过将包含噪声的输入的离散余弦变换(DCT)块乘以S(k,l)来获得平均块,即,平均块满足下面的等式(5)。然后,在整数变换域中执行相加和相减的图5中的近似广义的维纳滤波器可被重构为图6的近似广义的维纳滤波器。
M ^ ( k , l ) = S ( k , l ) · V ( k , l ) - - - ( 5 )
通过使用等式(3)和(5),可由下面的等式(6)来表示在整数变换域中滤波的图像块。
等式(6)中的F(k,l)可由如下的等式(7)表示。
F ( k , l ) = p ~ ( k , l ) · ( 1 - S ( k , l ) ) + S ( k , l ) = 1 + S ( k , l ) · σ n 2 σ 2 · 1 ψ ( k , l ) 1 + σ n 2 σ 2 · 1 ψ ( k , l ) - - - ( 7 )
如等式(6)中所示,整个滤波过程可以被简化为F(k,l)的乘积。等式(7)示出F(k,l)是由信噪比(SNR)、协方差矩阵Ψ(k,l)和平均矩阵S(k,l)确定的。
为了确定本实施例中的平均矩阵S(k,l),在平均矩阵S(k,l)的可能的候选中,选择了满足等式(5)的一个。平均矩阵S(k,l)可以被表示为如下的等式(8)。
S ( k , l ) = 1000 0000 0000 0000 - - - ( 8 )
等式(8)示出在整数变换块中采用的平均矩阵S(k,l)的最简单的形式之一。
下面,将参照图7A至图7C以及图8更详细地描述在用于编码运动图像的设备中执行的预处理过程。
如上所述,可通过缩放整数变换系数来对其平均值不为0的图像块执行近似广义的维纳滤波处理。
图7A至7C是用于编码运动图像的设备中的不同类型的近似广义的维纳滤波器的框图。更详细地,图7A至图7C示出处理帧内块的编码装置的结构。图7A和7C表示通过在整数变换域中对帧内块执行滤波并对滤波的帧内块执行量化(Q)和可变长编码(VLC)但不对滤波的帧内块执行反整数变换来编码帧内块。
换句话说,图7B和7C示出通过将整数变换系数乘以F(k,l)来完成滤波。同时,通过参照量化表将整数变换系数乘以或除以特定值来执行量化。如图7C所示,通过将整数变换系数乘以F(k,l)来执行的滤波以及通过将整数变换系数乘以特定值来执行的量化可以被合并成一个操作。
如图8中所示,图7A至图7C中所示的本发明的构思可以被直接应用到用于编码运动图像的设备处理帧间块时的场合,只要已经从运动补偿的块信息p(m,n)中去除了噪声。
根据输入图像块是帧间块还是帧内块来确定协方差值Ψ(k,l)。因此,图7的F(k,l)可以根据输入图像块是帧间块还是帧内块而改变。
下面,将参照下面的等式(9)更详细地描述获得从其中减去其平均值的帧内块或帧间块的估计的协方差值的方法。假定S表示已经从其中减去了相应块的平均值的N×N(其中N=4)块,可使用等式(9)获得N×N块的协方差矩阵。
W.Niehsen和M.Brunig已经在“Covariance Analysis ofMotion-compensated Frame Differences”,IEEE Trans.Circ.Syst.for VideoTechnol.,June 1999中公开了等式(9)。
可通过将等式(9)应用到各种实验图像中来获得估计的方差值。在原始图像块是帧内块的情况下,原始图像被分为4×4块,然后每个4×4块的方差值被计算。另一方面,在原始图像块是帧间块的情况下,通过将上述等式(9)应用到通过全搜索(full search)被确定为帧间块的每个图像块来计算估计的方差值。
通过使用估计的协方差值,获得下面的等式:R=E[y yT]。然后,通过对R执行整数变换,获得下述的等式:Ψ=ARA*T
下面,将描述计算等式(7)的 的方法。
在等式(7)中,可通过使用噪声估计器来获得噪声方差值σn 2。假定噪声和原始图像像素是随机独立的变量,可使用下面的等式(10)来计算原始图像的方差σ2的估计值
σ ^ 2 = max ( σ ^ z 2 - σ ^ n 2 , 0 ) - - - ( 10 )
在等式(10)中,
Figure A20061000050500144
表示每个宏块(MB)的估计的方差值。在典型类型的用于编码运动图像的设备中,在逐宏块的基础上计算
Figure A20061000050500145
在本示例性实施例中,相同宏块中的4×4块被假设为具有相同的方差值。因此,不必执行额外的计算来获得每个4×4块的方差值。
图9是根据本发明示例性实施例的用于编码运动图像的设备的框图,所述设备考虑输入图像的特性而对输入图像执行编码。
在本示例性实施例中,在输入图像的特性中,包含在输入图像中的噪声的级别被自适应地反映到改进的乘积因子(MF)表中。
下面,将参照图9来更详细描述根据本发明实施例的用于编码运动图像的设备的结构和操作。
除了传统的运动图像编码器之外,图9的设备还包括噪声估计单元980、MF表(或乘法表)确定单元990、MF表存储单元992、以及改进的量化单元920。MF是用于JM参考软件编码器(Reference Software Encoder)的系数,所述参考软件编码器使用基于H.264的整数变换来执行量化操作。MF以表的形式被使用,将在下面描述MF。
由于整数变换单元910、反整数变换单元940、去块滤波器950、运动估计(ME)单元960、运动补偿(MC)单元962和帧内估计单元964具有和图1中的它们的各个相应部件相同的功能,因此这里将省略对它们的描述。
噪声估计单元980使用差分图像和从ME单元960输入的数据来计算
Figure A20061000050500146
并将 发送到MF表确定单元990。
MF表确定单元990基于从噪声估计单元980接收的 来确定与预定宏块相应的MF表,并将与确定的MF表相应的索引信息发送到MF表存储单元992。作为选择,索引信息被发送到VLC 970。
下面将详细地描述使用噪声估计单元980计算
Figure A20061000050500151
以及通过使用MF表确定单元990基于从噪声估计单元980接收到的 来确定与每个宏块相应的MF表的方法。
如上面参照等式(8)和图7以及图8所描述的,通过等式(7)来确定F(k,l)。一旦F(k,l)被确定,则将4×4块的整数变换系数V(k,l)乘以F(k,l),并量化乘积的结果
Figure A20061000050500153
不像MPEG2,在H.264中,只有4×4整数变换被用在主要档次(mainprofile)中。在高档次中,使用4×4整数变换或8×8整数变换。在本示例性实施例中,将只描述H.264中的主要档次,即4×4整数变换。然而,相同的方法可被应用到高档次中的8×8整数变换。
在编码运动图像的基于H.264的方法中,如下面的等式(11)所示,在整数变换和量化之间存在紧密的相关性。
W ^ q ( k , l ) = round ( V ( k , l ) × PF Qstep ) - - - ( 11 )
其中,V(k,l)是通过对(k,l)执行4×4整数变换而获得的位置变换系数。此外,后比例(post-scaling)因子(PF)是与从整数变换导出的系数的位置相应的值,以显示DCT的性能。PF表示从整数变换到量化的转变的系数,PF的值根据所述系数的位置而改变。下面的表1示出根据系数的位置的PF的值。
                   [表1]
  位置   PF
  (0,0),(2,0),(0,2),或(2,2)   A
  (1,1),(1,3),(3,1),或(3,3)   b/4
  其他   ab/2
在表1中,a=1/2, b = 2 5 .
Qstep是根据如表2所示的QP的量化因子。
                           [表2]
  QP   0   1   2   3   4   5   6   7   8   9   10   11   12   …
  Qstep   0.625   0.6875   0.8125   0.875   1   1.125   1.25   1.375   1.625   1.75   2   2.25   2.5
  QP   …   18   …   24   …   30   …   36   …   42   …   48   …   51
  Qstep   5   10   20   40   80   160   224
如等式(11)所示,在量化处理中,整数变换系数被乘以PF,作为相乘结果获得的值被除以Qstep
为了从等式(11)中去除相除操作,PF/Qstep可以被转换为MF/2qbits,使可通过仅使用相乘和移位操作来执行量化处理。事实上,H.264JM参考软件编码器使用如等式(12)中所示的MF执行量化。
W ^ q ( k , l ) = round ( V ( k , l ) × MF 2 qbits ) - - - ( 12 )
其中,qbits=15+floor(QP/6)。MF是乘积因子的缩写,并定义为如表3所示。
                                  [表3]
  QP   位置{0,0}.{2,0}.{2,2}.{0,2}   位置{1,1}.{1,3}.{3,1}.{3,3}   其他位置
  0   13107   5243   8066
  1   11916   4660   7490
  2   10082   4194   6554
  3   9362   3647   5825
  4   8192   3355   5243
  5   7282   2893   4559
表3示出第一六个QP的值,并且这些值以六个QP为单元重复。等式(12)被实现为等式(13)。
W ^ q ( k , l ) = ( | V ( k , l ) | × MF + f ) > > qbits
sign ( W ^ q ( k , l ) ) = sign ( V ( k , l ) ) - - - ( 13 )
其中,f表示2qbits-1
如上所述,噪声消除处理和量化处理可以被合并成单一处理。换句话说,通过将用于噪声减少的滤波系数F(k,l)乘以与滤波系数F(k,l)相应的位置处的MF表可同时执行噪声消除和量化处理。
例如,预先计算通过使用σn 2和σz 2获得的多个滤波系数F,然后计算的滤波系数F被乘以MF表,以生成改进的MF表。这样产生的改进的MF表被存储在MF存储单元992中。
如等式(7)所示,通过S(k,l)、Ψ(k,l)和
Figure A20061000050500171
来确定F(k,l)。使用等式(8)计算S(k,l),Ψ(k,l)根据输入图像是帧间块还是帧内块而被可变地设置。因此,只剩下一个用于确定F(k,l)的变量,即,
Figure A20061000050500172
换句话说,如果σn 2和σz 2被确定,则可通过等式(10)来计算 并且可通过将
Figure A20061000050500174
带入等式(7)来获得改进的MF表。
在本示例性实施例中,以例如表3的形式来提供
Figure A20061000050500175
的五个不同的估计以及它们各自的改进的MF表。
MF表确定单元990量化从噪声估计单元980获得的
Figure A20061000050500176
量化的结果被发送到MF表存储单元992,作为与预定宏块相应的量化矩阵的索引信息。在与H.264标准相似的标准中,所述索引信息也被发送到VLC 970。
例如,如果根据 将存储在MF表存储单元992中的量化权矩阵分为五种情况,则以五种级别执行
Figure A20061000050500178
的量化,并且五种量化权矩阵的每个的索引信息被设置为0、1、2、3、或4。
同时,在具有很多噪声的图像中,尤其是具有小方差值的块的 很大。当 很大时,F(k,l)接近于0,导致严重的块现象。为了防止块现象,使用了Tcutoff,如下面的等式(14)所示。
σ n 2 / σ 2 = min ( T cutoff , σ n 2 / σ 2 ) - - - ( 14 )
通常,Tcutoff的值在1和2之间。
MF表存储单元992将与从MF表确定单元990接收的索引信息相应的MF表值发送到改进的量化单元920。在与H.264相似的编解码器的情况下,MF表存储单元992也将MF表值发送到反量化单元930。
改进的量化单元920通过使用从MF表存储单元992接收到的MF表值来量化被整数变换单元910整数变换的输入图像的预定宏块。
在与H.264相似的编解码器的情况下,反量化单元930也通过使用MF表值对输入图像的预定宏块执行反量化,并且反整数变换单元940对反量化的宏块执行反整数变换。
VLC 970对被改进的量化单元920量化的输入图像数据执行可变长编码。在与H.264相似的编解码器的情况下,从MF表确定单元990输入的与宏块相应的MF表的索引信息被插入宏块层句法中。
在本示例性实施例中,MF表的索引被插入宏块层句法中,然后被发送。如果在MF表存储单元992中存储有10个MF表,则对每个宏块额外需要4比特数据。
相邻的宏块一般具有相似的图像特征,并且在它们的索引值之间通常具有相关性。因此,一个宏块的索引值和相邻宏块的索引值之间的差可以被用作索引信息。在单个MF表被应用到整个序列的情况下,将被发送的索引信息的量可以显著地减少。
在本示例性实施例中,MF表存储单元992中存储的多个MF表也被存储在解码单元中。然而,也可使用通过使用画面扩展头在逐画面的基础上使用被发送到解码单元的多个MF表,或者通过使用序列扩展头在逐序列的基础上被发送到解码单元的多个MF表。
如上所述,考虑输入图像中包含的噪声的级别,通过自适应地将量化矩阵应用到每个宏块,可从输入图像中去除噪声,并提高编码输入图像的效率。
此外,对于用户可随意地确定新的MF表。在本示例性实施例中,噪声去除已经再上面被描述为在整数域中对输入图像块的Y分量执行噪声去除。然而,噪声去除也可应用到输入图像块的U或V分量。
根据输入图像是帧间块还是帧内块来确定Ψ(k,l)。通过对多个序列的训练处理来获Ψ(k,l)。与MPEG4不同,在H.264中,即使当输入图像是帧内块时,帧内预测后的差分图像也必须经过训练处理。执行这种训练处理以提取公共的Ψ(k,l)。
图10是示出根据本发明实施例的编码运动图像的方法的流程图。现在,将另外参照图9来描述该方法。
在操作1010中,通过使用MF表确定单元990和MF表存储单元992,在从噪声估计单元980发送的输入图像的噪声信息的基础上,在预定块单元中选择MF表之一。
在操作1020中,输入图像被整数变换,并且使用在操作1010中选择的改进的MF表来量化整数变换的输入图像数据。
在操作1030中,对量化的输入图像数据执行VLC,并且指示在操作1010中选择的MF表的索引信息被插入宏块头中。在本示例性实施例中,指示选择的MF表的索引信息被插入宏块头中。然而,选择的MF表也可被插入除了宏块头之外的部分中。
图11示出了根据本发明实施例的用于解码运动图像的设备。在假定所述设备不采用当前的H.264标准而采用与H.264相似的标准的情况下,来描述所述设备,所述的设备采用整数变换。
除了传统的运动图像解码器的元件之外,所述设备还包括MF表存储单元1160和改进的反量化单元1120。
由于反整数变换单元1130、帧存储器1140和运动补偿单元1150起与传统的解码器的各个相应的部件相同的功能,因此这里不再重复它们的描述。
可变长解码(VLD)单元1110对输入流执行VLD,从宏块层句法提取与预定宏块相应的MF表的索引信息,并将提取的索引信息输出到MF表存储单元1160。
MF表存储单元1160将与接收到的索引信息相应的MF表输出到改进的反量化单元1120。这里,MF表存储单元1160存储多个MF表,所述的MF表根据由编码单元处理的输入图像的特征被分类,所述的输入图像特征例如为作为输入图像方差值和输入图像边缘特征之间的比率的噪声方差值。
存储在MF表存储单元1160中的MF表可通过使用画面扩展头在逐画面的基础上被发送,或者通过使用序列扩展头在逐序列的基础上被发送。如图11中的虚线所标识的,MF表被从VLD单元1110发送到MF表存储单元1160。
图12是根据本发明实施例的解码运动图像的方法的流程图。
在操作1210中,对编码的输入图像数据执行可变长解码。在操作1220中,指示MF表之一的索引信息被从可变长解码的预定块单元中的图像数据中提取。
在操作1230中,使用提取的索引信息来选择MF表之一。在操作1240中,通过使用选择的MF表在预定块单元中反量化可变长解码的图像数据。
在本示例性实施例中,假定多个MF表预先存储在解码器中。作为选择,可通过使用画面扩展头在逐画面的基础上发送MF表,或者使用序列扩展头在逐序列的基础上发送MF表。
如上所述,在根据本发明的示例性实施例中编码和解码运动图像的方法中,在考虑了输入图像的噪声信息的情况下,MF表被自适应地应用到输入图像的每个宏块。因此,可提高从输入图像中去除噪声以及对输入图像编码的效率与性能,而不需要额外的存储器或计算。
虽然已经参照本发明的示例性实施例详细地示出和描述了本发明,但是本领域的普通技术人员应该理解,在不脱离由权利要求限定的本发明的精神和范围的情况下,可在其中作出各种形式和细节的改变。详细地,本发明可被应用到不同类型的用于编码和解码运动图像的方法和设备中,如MPEG-1、MPEG-2、MPEG-4、H.26x或本领域中其他的公知的相似的编码和解码方法和设备。
本发明也可被实施为计算机可读记录介质上的计算机可读代码。计算机可读记录介质是能够存储可随后由计算机系统读取的数据的任何数据存储装置。计算机可读记录介质的例子包括只读存储器(ROM)、随机访问存储器(RAM)、CD-ROM、磁带、软盘、光学数据存储装置、载波(如通过互联网的数据传输)和本领域中的其他公知的计算机可读记录媒体。
计算机可读记录介质也可以被分布在网络连接的计算机系统,从而计算机可读代码以分布的方式被存储和执行。

Claims (49)

1、一种使用多个改进的乘积因子表编码运动图像的方法,所述方法包括:
根据输入图像的特征选择块单元中的多个改进的乘积因子表中的一个;
对所述输入图像进行整数变换;
使用所述选择的改进的乘积因子表对被整数变换的输入图像执行量化。
2、如权利要求1所述的方法,其中,根据输入图像的特征,通过将乘积因子表乘以滤波系数来生成所述多个改进的乘积因子表。
3、如权利要求1所述的方法,其中,所述输入图像的特征包括输入图像的噪声或空间复杂性。
4、如权利要求2所述的方法,其中,通过将在从离散余弦变换到整数变换的处理中转变的系数和量化系数相结合来生成所述的乘积因子表的乘积因子。
5、如权利要求1所述的方法,其中,所述输入图像的特征是噪声信息,所述噪声信息是所述噪声方差值和输入图像的方差值之间的比率。
6、如权利要求2所述的方法,其中,通过信噪比、协方差矩阵和平均矩阵来确定所述滤波系数。
7、如权利要求2所述的方法,其中,根据所述块是帧内块还是帧间块来确定所述滤波系数。
8、如权利要求1所述的方法,其中,所述编码遵守H.264标准。
9、如权利要求1所述的方法,其中,所述多个乘积因子表根据所述输入图像的特征而被分类。
10、如权利要求1所述的方法,其中,所述选择包括:
根据所述输入图像的噪声信息选择块单元中的多个改进的乘积因子表中的一个,并产生指示选择的块单元中的改进的乘积因子表的索引信息;
根据产生的索引信息输出选择的块单元中的改进的乘积因子表。
11、如权利要求10所述的方法,还包括对被量化的输入图像执行可变长编码,
其中,所述的块是宏块,所述可变长编码包括将选择的改进的乘积因子表的索引信息插入宏块层句法中。
12、如权利要求11所述的方法,其中,在执行可变长编码中,索引信息被插入序列扩展头或画面扩展头中。
13、一种使用多个改进的乘积因子表解码运动图像的方法,所述方法包括:
对编码的图像数据执行可变长解码;
从可变长解码的块单元中的图像数据提取指示所述多个改进的乘积因子表之一的索引信息;
基于提取的索引信息选择所述多个改进的乘积因子表之一;
使用选择的改进的乘积因子表对可变长解码的块单元中的图像数据进行反量化。
14、如权利要求13所述的方法,其中,根据所述输入图像的特征,通过将乘积因子表乘以滤波系数来生成所述多个改进的乘积因子表。
15、如权利要求13所述的方法,其中,所述的输入图像的特征包括所述输入图像的噪声和空间复杂性。
16、如权利要求14所述的方法,其中,通过将在从离散余弦变换到整数变换的处理中转变的系数和量化系数结合来生成所述的乘积因子表的乘积因子。
17、如权利要求14所述的方法,其中,通过信噪比、协方差矩阵和平均矩阵来确定所述的滤波系数。
18、如权利要求14所述的方法,其中,根据所述块是帧内块还是帧间块来确定所述的滤波系数。
19、如权利要求14所述的方法,其中,所述编码的图像数据是使用遵守H.264标准的编码方法而被编码的。
20、如权利要求13所述的方法,其中,从宏块层句法中提取所述索引信息。
21、一种使用多个改进的乘积因子表编码运动图像的设备,所述设备包括:
改进的乘积因子表确定单元,用于根据输入图像的特征选择块单元中的所述多个改进的乘积因子表中的一个;
整数变换单元,用于对所述输入图像进行整数变换;
量化单元,用于使用所选择的改进的乘积因子表对整数变换后的输入图像进行量化。
22、如权利要求21所述的设备,其中,根据所述输入图像的特征,通过将乘积因子表乘以滤波系数来生成所述多个改进的乘积因子表。
23、如权利要求21所述的设备,其中,所述的输入图像的特征包括所述输入图像的噪声和空间复杂性。
24、如权利要求22所述的设备,其中,通过将在从离散余弦变换到整数变换的处理中转变的系数和量化系数结合来生成所述的乘积因子表的乘积因子。
25、如权利要求22所述的设备,其中,通过信噪比、协方差矩阵和平均矩阵来确定所述的滤波系数。
26、如权利要求22所述的设备,其中,根据所述块是帧内块还是帧间块来确定所述滤波系数。
27、如权利要求21所述的设备,所述设备遵守H.264标准。
28、如权利要求21所述的设备,还包括可变长编码单元,所述的可变长编码单元对量化的输入图像执行可变长编码,并将所选择的改进的乘积因子表的索引信息插入到宏块层句法中。
29、一种使用多个改进的乘积因子表解码运动图像的设备,所述设备包括:
可变长解码单元,用于对编码的图像数据执行可变长解码,并从可变长解码的块单元中的图像数据中提取指示所述多个改进的乘积因子表之一的索引信息;
改进的乘积因子表存储单元,用于存储所述多个改进的乘积因子表,并基于提取的索引信息选择所述多个改进的乘积因子表中的一个;
反量化单元,使用选择的改进的乘积因子表来对可变长解码的预定块单元中的图像数据执行反量化。
30、如权利要求29所述的设备,其中,根据输入图像的特征,通过将乘积因子表乘以滤波系数来生成所述多个改进的乘积因子表。
31、如权利要求29所述的设备,其中,所述输入图像的特征包括所述输入图像的噪声和空间复杂性。
32、如权利要求30所述的设备,其中,通过将在从离散余弦变换到整数变换的处理中转变的系数和量化系数结合来生成所述的乘积因子表的乘积因子。
33、如权利要求29所述的设备,其中,所述编码的图像数据是使用根据H.264标准的编码方法而被编码的。
34、一种计算机可读记录介质,其上记录有用于执行使用多个改进的乘积因子表来编码运动图像的方法的程序,所述方法包括:
根据输入图像的特征选择块单元中的所述多个改进的乘积因子表中的一个;
对所述输入图像进行整数变换;
使用所选择的改进的乘积因子表对被整数变换的输入图像执行量化。
35、如权利要求34所述的介质,其中,根据输入图像的特征,通过将乘积因子表乘以滤波系数来生成所述多个改进的乘积因子表。
36、如权利要求34所述的介质,其中,所述输入图像的特征包括输入图像的噪声或空间复杂性。
37、如权利要求35所述的介质,其中,通过将在从离散余弦变换到整数变换的处理中转变的系数和量化系数相结合来生成所述的乘积因子表的乘积因子。
38、如权利要求34所述的介质,其中,所述输入图像的特征是噪声信息,所述噪声信息是所述噪声方差值和输入图像的方差值之间的比率。
39、如权利要求35所述的介质,其中,通过信噪比、协方差矩阵和平均矩阵来确定所述滤波系数。
40、如权利要求35所述的介质,其中,根据所述块是帧内块还是帧间块来确定所述滤波系数。
41、如权利要求34所述的介质,其中,所述方法根据H.264标准的编码方法。
42、如权利要求34所述的介质,其中,所述选择操作包括:
根据所述输入图像的噪声信息选择块单元中的所述多个改进的乘积因子表中的一个,并产生指示所选的块单元中的改进的乘积因子表的索引信息;
根据产生的索引信息输出选择的块单元中的改进的乘积因子表。
43、一种计算机可读记录介质,其上记录有用于执行使用多个改进的乘积因子表来解码运动图像的方法的程序,所述方法包括:
对编码的图像数据执行可变长解码;
从可变长解码的块单元中的图像数据提取指示所述多个改进的乘积因子表之一的索引信息;
基于提取的索引信息选择所述多个改进的乘积因子表之一;
使用选择的改进的乘积因子表对可变长解码的块单元中的图像数据进行反量化。
44、如权利要求43所述的介质,其中,根据所述输入图像的特征,通过将乘积因子表乘以滤波系数来生成所述多个改进的乘积因子表。
45、如权利要求43所述的介质,其中,所述的输入图像的特征包括所述输入图像的噪声或空间复杂性。
46、如权利要求44所述的介质,其中,通过将在从离散余弦变换到整数变换的处理中转变的系数和量化系数结合来生成所述的乘积因子表的乘积因子。
47、如权利要求44所述的介质,其中,通过信噪比、协方差矩阵和平均矩阵来确定所述的滤波系数。
48、如权利要求44所述的介质,其中,根据所述块是帧内块还是帧间块来确定所述的滤波系数。
49、如权利要求44所述的介质,其中,所述编码遵守H.264标准。
CNA2006100005053A 2005-01-07 2006-01-09 编码和解码运动图像的设备、方法及其记录介质 Pending CN1801947A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020050001801 2005-01-07
KR1020050001801A KR100708118B1 (ko) 2005-01-07 2005-01-07 복수개의 변형 곱셈 테이블을 이용한 동영상 부호화 및복호화 장치와 그 방법, 및 이를 구현하기 위한프로그램이 기록된 기록 매체

Publications (1)

Publication Number Publication Date
CN1801947A true CN1801947A (zh) 2006-07-12

Family

ID=36218449

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006100005053A Pending CN1801947A (zh) 2005-01-07 2006-01-09 编码和解码运动图像的设备、方法及其记录介质

Country Status (4)

Country Link
US (1) US20060153464A1 (zh)
EP (1) EP1679901A2 (zh)
KR (1) KR100708118B1 (zh)
CN (1) CN1801947A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112840650A (zh) * 2018-10-19 2021-05-25 三星电子株式会社 人工智能(ai)编码装置及其操作方法和ai解码装置及其操作方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5026092B2 (ja) 2007-01-12 2012-09-12 三菱電機株式会社 動画像復号装置および動画像復号方法
KR101385956B1 (ko) 2007-08-31 2014-04-17 삼성전자주식회사 미디어 신호 인코딩/디코딩 방법 및 장치
KR100946925B1 (ko) * 2008-02-20 2010-03-09 한국전자통신연구원 다수의 기본 블록들을 이용한 다차원 변환 및 양자화 방법,그리고 그 장치
CN110858900B (zh) * 2018-08-24 2022-08-05 上海天荷电子信息有限公司 复用精简反量化乘法因子和位移表的数据压缩方法和装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5654760A (en) * 1994-03-30 1997-08-05 Sony Corporation Selection of quantization step size in accordance with predicted quantization noise
US6067118A (en) * 1997-12-16 2000-05-23 Philips Electronics North America Corp. Method of frame-by-frame calculation of quantization matrices
US6535647B1 (en) * 1999-03-25 2003-03-18 General Dynamics Decision Systems, Inc. Image encoder method
JP2001169281A (ja) * 1999-12-13 2001-06-22 Matsushita Electric Ind Co Ltd 動画像符号化装置、および動画像符号化方法
US7286715B2 (en) 2001-03-28 2007-10-23 Sony Corporation Quantization apparatus, quantization method, quantization program, and recording medium
JP3854472B2 (ja) 2001-04-24 2006-12-06 日本電信電話株式会社 繰り返し画像信号符号化方法とその装置および繰り返し画像信号符号化プログラムとこのプログラムを記録した記録媒体
US7042941B1 (en) * 2001-07-17 2006-05-09 Vixs, Inc. Method and apparatus for controlling amount of quantization processing in an encoder
KR20040062257A (ko) * 2003-01-02 2004-07-07 삼성전자주식회사 움직임 보상에 기반한 개선된 노이즈 예측 방법 및 그장치와 이를 사용한 동영상 부호화 방법 및 그 장치
KR100584552B1 (ko) * 2003-01-14 2006-05-30 삼성전자주식회사 동영상 부호화 및 복호화 방법과 그 장치
JP4127818B2 (ja) * 2003-12-24 2008-07-30 株式会社東芝 動画像符号化方法及びその装置
KR100627329B1 (ko) * 2004-08-19 2006-09-25 전자부품연구원 H.264 비디오 코덱을 위한 적응형 움직임 예측 및 모드결정 장치 및 그 방법
JP2006080925A (ja) * 2004-09-09 2006-03-23 Toshiba Corp 動画符号化装置、動画符号化方法および動画符号化プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112840650A (zh) * 2018-10-19 2021-05-25 三星电子株式会社 人工智能(ai)编码装置及其操作方法和ai解码装置及其操作方法
CN112840650B (zh) * 2018-10-19 2024-04-30 三星电子株式会社 人工智能(ai)编码装置及其操作方法和ai解码装置及其操作方法

Also Published As

Publication number Publication date
KR20060081726A (ko) 2006-07-13
EP1679901A2 (en) 2006-07-12
US20060153464A1 (en) 2006-07-13
KR100708118B1 (ko) 2007-04-16

Similar Documents

Publication Publication Date Title
CN1232122C (zh) 用于编码和/或解码运动图像的方法和装置
CN1232124C (zh) 基于离散余弦变换的高级视频编码方法和设备
EP2165543B1 (en) Adaptive coding of video block prediction mode
CN1794815A (zh) 产生对图像或图像序列进行编码的量化矩阵的方法和设备
CN1214645C (zh) 用于减少量化效应的图像数据后处理方法和装置
CN1713730A (zh) 估计图像噪声的方法和设备和消除噪声的方法和记录介质
CN1968419A (zh) 利用人类视觉特性对图像进行编码及解码的方法和设备
US20080199090A1 (en) Coding method conversion apparatus
CN1625902A (zh) 运动图片编码和解码方法以及使用该方法的设备和程序
CN1947426A (zh) 用于实现运动可伸缩性的方法和设备
CN1267817C (zh) 用于衰落补偿的信号指示
CN1933601A (zh) 用于无损视频编码和解码的方法及设备
CN1347620A (zh) 转换mpeg-2 4:2:2-轮廓位流为主轮廓位流的方法及架构
CN1627824A (zh) 位流控制的后处理过滤
CN101080014A (zh) 视频解码方法和装置
KR20110001990A (ko) 영상 데이터의 인 루프 필터링 장치 및 방법과 이를 이용한 영상 부호화/복호화 장치
CN105812804B (zh) 一种确定rdoq过程中最优量化值的方法及装置
CN1723711A (zh) 用于数字视频处理的一元化量度(umdvp)
CN1751522A (zh) 利用对选定宏块的跳过移动估计进行的视频编码
CN1882083A (zh) 一种降低图像方块效应的方法
CN1248486C (zh) 用于峰化信号的方法和设备
CN1122247C (zh) 运动补偿预测方法及使用该方法的编码器和解码器
CN1801947A (zh) 编码和解码运动图像的设备、方法及其记录介质
CN1225919C (zh) 编码图像信息的方法和设备及解码图像信息的方法和设备
CN1320830C (zh) 噪声估计方法和设备、以及利用其编码视频的方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication