CN101836430A - 用于压缩图像信号的方法和设备 - Google Patents

用于压缩图像信号的方法和设备 Download PDF

Info

Publication number
CN101836430A
CN101836430A CN200880112658A CN200880112658A CN101836430A CN 101836430 A CN101836430 A CN 101836430A CN 200880112658 A CN200880112658 A CN 200880112658A CN 200880112658 A CN200880112658 A CN 200880112658A CN 101836430 A CN101836430 A CN 101836430A
Authority
CN
China
Prior art keywords
row
angle parameter
picture signal
random sequence
maximal pressure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200880112658A
Other languages
English (en)
Other versions
CN101836430B (zh
Inventor
埃琳娜·阿尔辛娜
亚历山大·阿尔辛
伊卡特利娜·内斯特罗瓦
马克西姆·高罗替夫
范迪姆·谢廖金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN101836430A publication Critical patent/CN101836430A/zh
Application granted granted Critical
Publication of CN101836430B publication Critical patent/CN101836430B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • Algebra (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computing Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

提供一种压缩图像信号的方法,以在具有最小量的开销信息的同时提供比离散余弦(DCT)更有效的压缩。通过将几个值应用到表示DCT矩阵的行和列之间的部分互换的程度的参数,执行DCT矩阵的行和列之间的部分互换。当使用的角度参数的值按该值原样被存储或发送时,开销增加。对产生角度参数的随机序列、针对产生的随机序列的每个角度参数产生压缩系数矩阵以及计算压缩率的处理进行重复,以获取具有最高压缩率的角度参数。不存储或发送具有最高压缩率的角度参数,而是获取相应的角度参数的随机序列中的编号,并进行存储或发送。

Description

用于压缩图像信号的方法和设备
技术领域
本申请要求于2007年10月24日提交到韩国知识产权局的第10-2007-0107442号韩国专利申请的优先权,该申请的公开通过引用全部包含于此。
本发明涉及压缩图像信号,更具体地讲,涉及一种用于压缩图像信号的方法和设备,以通过修改变换矩阵来提高压缩率。
背景技术
离散余弦变换(DCT)是用于视频、图像或音频压缩的公知技术。近年来,进行了多种尝试以开发更有效的编码方法,为此,在音频编码中,参数编码已经显示出比DCT更好的结果。对于二维(2D)数据,Karhunen Loeve变换(KLT)系数具有最小比特间隔,然而开销信息(overhead information)量显著增加。
发明的公开
技术方案
本发明的示例性实施例克服上面的缺点以及上面没有描述的其他缺点。此外,本发明不需要克服上述缺点,本发明的示例性实施例可不克服上述任何问题。
本发明提供一种压缩图像信号的方法,从而在具有最小量的开销信息的同时提供比离散余弦(DCT)更有效的压缩。
关于本发明的表示DCT矩阵的行和列之间的部分互换的程度(extend)的参数,通过使用几个值来执行DCT矩阵的行和列之间的部分互换。在本发明中所述参数被称为角度参数。通过DCT矩阵的这种修改,可产生更有效的压缩系数矩阵。
当使用的角度参数的值按该值原样被存储或发送时,显著增加开销。然而,在本发明中,对产生角度参数的随机序列、针对产生的随机序列的每个角度参数产生压缩系数矩阵以及计算压缩率的处理进行重复,以获取具有最高压缩率的角度参数。此外,不存储或发送具有最高压缩率的角度参数,而是获取相应的角度参数的随机序列中的编号,并进行存储或发送。
有益效果
根据用于压缩图像信号的方法和设备,在提高图像信号的压缩率的同时,可通过使用用于修改变换矩阵的压缩参数的方法来减小开销。因此,减少需要存储或发送到解码器的数据量。
附图说明
通过下面结合附图对本发明的示例性实施例进行的详细描述,本发明的上述和其它特点和优点将会变得更加清楚,其中:
图1和图2是用于描述离散余弦变换(DCT)矩阵的行和列之间的互换的示图;
图3是示出欧拉角的示图;
图4示出用于在蒙特卡罗方法中比较均匀的网格点和伪随机点的示图;
图5是示出根据本发明的示例性实施例的用于压缩图像信号的设备的框图;
图6是示出根据本发明的示例性实施例的压缩图像信号的方法的流程图;
图7和图8是示出根据本发明的示例性实施例的压缩率的增加的曲线图。
最佳实施方式
根据本发明的一方面,提供一种压缩图像信号的方法,所述方法包括:执行变换矩阵的行和列之间的部分互换;通过使用已经执行部分互换的变换矩阵来变换将被压缩的图像信号;压缩变换的图像信号;通过将多个值应用到表示变换矩阵的行和列之间的部分互换的程度的角度参数,通过重复执行部分互换、图像信息的变换和变换的图像信号的压缩来选择与最高压缩率相应的角度参数。
所述变换可以是离散余弦变换(DCT)。
角度参数可以是欧拉角。
执行部分互换的步骤可包括:将与行之间的部分互换相应的矩阵左乘变换矩阵,将与列之间的部分互换相应的矩阵右乘变换矩阵。
与行之间的部分互换相应的矩阵可以为:
A B C 0 D E F 0 G H I 0 0 0 0 1
其中,
A=cosαcosγ-sinαcosβsinγ,
B=-sinαcosγ-cosαcosβsinγ,
C=sinβsinγ,
D=cosαsinγ+sinαcosβcosγ,
E=-sinαsinγ+cosαcosβcosγ,
F=-sinβcosγ,
G=sinαsinβ,
H=cosαsinβ,
I=cosβ,
α、β和γ是欧拉角。
选择与最高压缩率相应的角度参数的步骤可包括:针对角度参数产生随机序列;通过针对随机序列的每个值执行行和列之间部分互换、图像信号的变换和变换的图像信号的压缩,来获取图像信号的压缩率;从获取的随机序列的每个值的压缩率中获取最高压缩率;选择与最高压缩率相应的角度参数的值。
所述方法还包括:获取随机序列中的与最高压缩率相应的角度参数的值的编号;存储以最高压缩率压缩的图像信号和随机序列中相应的编号,或者将以最高压缩率压缩的图像信号和随机序列中相应的编号发送到解码器。
产生的随机序列可以是Lemer伪随机数。
选择与最高压缩率相应的角度参数的步骤可包括:通过使用蒙特卡罗方法重复执行部分互换、变换图像信号和压缩变换的图像信号。
欧拉角可具有接近0°或接近180°的值。
根据本发明的另一面,提供一种压缩图像信号的设备,所述设备包括:行和列互换器,执行变换矩阵的行和列之间的部分互换;变换器,通过使用已经执行部分互换的变换矩阵来变换将被压缩的图像信号;图像压缩器,压缩变换的图像信号;控制器,通过将多个值应用到表示变换矩阵的行和列之间的部分互换的程度的角度参数,通过重复执行行和列互换器、变换器和图像压缩器的操作来选择与最高压缩率相应的角度参数。
所述变换可以是离散余弦变换(DCT)。
角度参数可以是欧拉角。
行和列互换器可将与行之间的部分互换相应的矩阵左乘变换矩阵,将与列之间的部分互换相应的矩阵右乘变换矩阵。
控制器可针对角度参数产生随机序列;通过针对随机序列的每个值操作行和列互换器、变换器和图像压缩器,来获取图像信号的压缩率;从获取的随机序列的每个值的压缩率中获取最高压缩率;选择与最高压缩率相应的角度参数的值。
控制器可获取随机序列中的与最高压缩率相应的角度参数的值的编号;存储以最高压缩率压缩的图像信号和随机序列中相应的编号,或者将以最高压缩率压缩的图像信号和随机序列中相应的编号发送到解码器。
可通过使用蒙特卡罗方法重复行和列互换器、变换器和图像压缩器的操作,来选择与最高压缩率相应的角度参数。
发明的实施方式
以下,将参照附图更充分地描述本发明,其中,本发明的示例性实施例在附图中示出。
<矩阵的行和列之间的互换(exchange)>
在本发明的示例性实施例中,执行离散余弦变换(DCT)矩阵的行和列之间的部分互换。通过DCT矩阵的这种修改,可产生更有效的压缩系数矩阵。
图1和图2是描述DCT矩阵的行和列之间的互换的示图。
在本发明的示例性实施例中,行之间的部分互换是指根据参数的值对行进行部分地互换,而非对全部行进行互换。
根据参数的值对行A和行B进行互换,如下面的等式1所示。
[等式1]
row A(新值)=cos(α)*row A(原来的值)+sin(α)*row B(原来的值)
row B(新值)=sin(α)*row A(原来的值)+cos(α)*row B(原来的值)
参照等式1,参数“α”作为角度。因此,示出DCT矩阵的行和列之间的部分互换的程度(extend)的参数被称为角度参数。
当参数“α”的值为0°时,不执行互换。此外,当参数“α”的值为90°时,对全部行进行互换。
此外,当参数“α”的值大于90°并小于180°时,对行进行互换并改变元素的符号。当参数“α”的值为180°时,不对行进行互换,但是包括在每行中的元素的符号改变。
以与行之间的部分互换相同的方式来定义列之间的部分互换。
图1示出4×4DCT矩阵的情况。参照图1,在互换行时使用3个参数α1、α2和α3。在互换列时使用3个参数α4、α5和α6
此外,图2示出8×8DCT矩阵的情况。参照图2,在互换行时使用6个参数α1、α2、α3、α4、α5和α6。在互换列时使用6个参数α7、α8、α9、α10、α11和α12
在图1中,互换行的结果基于应用参数α1、α2和α3的顺序是不同的。换句话说,参数α1、α2和α3彼此之间不是独立的。当首先应用参数α1然后应用参数α2时的矩阵值与首先应用参数α2然后应用参数α1时的矩阵值是不同的。
可见,行和列的互换类似于以三维(3D)的方式旋转坐标轴。换句话说,三个列分别对应于3D坐标中的X、Y和Z轴。
即使在3D的坐标轴的旋转中,结果也是基于哪个轴首先被旋转而不同。因此,已经开发了示出3D的坐标轴的旋转的几种方法,典型的方法是欧拉角。
图3是示出欧拉角的示图。参照图3,三个角α、β和γ是欧拉角。
在图3中,X轴、Y轴和Z轴表示旋转前的坐标轴,X’轴、Y’轴和Z’轴表示旋转后的坐标轴。N轴是XY面和X’Y’面的交线。N轴被称为节点的线。
角α是以Z轴为旋转轴的X轴和N轴之间的角。角β是以N轴为旋转轴的Z轴和Z’轴之间的角。角γ是以Z’轴为旋转轴的N轴和X’轴之间的角。
当以矩阵形式示出应用欧拉角的坐标轴的旋转时,如下面的等式2所示。
[等式2]
cos &gamma; sin &gamma; 0 - sin &gamma; cos &gamma; 0 0 0 1 1 0 0 0 cos &beta; sin &beta; 0 - sin &beta; cons&beta; cos &alpha; sin &alpha; 0 - sin &alpha; cos &alpha; 0 0 0 1
第一矩阵表示围绕Z’轴的旋转,第二矩阵表示围绕N轴的旋转,第三矩阵表示围绕Z轴的旋转。
在本发明的示例性实施例中,可以以使用欧拉角的坐标轴的旋转来示出行和列之间的互换。
对有效执行压缩的最优变换矩阵的查找存在对参数具有强的不平滑的依赖性的典型多参数问题。蒙特卡罗(Monte Carlo)方法用于解决该问题。在蒙特卡罗方法中,Lemer序列号可用于产生随机点。通过使用Lemer序列号,仅一个整数被存储或发送,而不存储或发送用作参数的角度参数。因此,可减少用于通知解码器关于使用的参数的值所需的开销。
换句话说,在示例性实施例中使用下面的项。
1.DCT矩阵的可逆变换
2.更有效编码的能量的重新配置
3.通过使用Lemer数最小化添加的信息的数量
返回参照图1和图2,通过旋转修改的部分为黑色块,没有修改的部分是空白的。在图1中,通过重新配置行和列之间的能量6个角度参数修改了15个元素。在图2中,12个角度参数修改了60个元素。
参照图1,需要3个角度参数来互换行,需要3个角度参数来互换列。因此,在4×4块中需要6个角度参数。
参照图2,需要6个角度参数来互换行,需要6个角度参数来互换列。因此,在8×8块中需要12个角度参数。
现在将描述本发明的示例性实施例的步骤。
步骤1:正交变换家族(family)参数化
步骤2:蒙特卡罗方法
步骤3:Lemer伪随机数
步骤4:最优角度参数的范围(diapason)的定位
步骤5:拟最优基底(basis)
当被添加用于提高视频信号的压缩率的参数的数量太多时,最好不压缩地发送视频信号。例如,当需要16个额外的参数时,即使图像信号以4×4块被压缩从而大小接近0,也不需要压缩视频数据,因为这与将16个像素值作为参数发送到解码器相同。
因此,在最小化添加的开销时优选地压缩图像信号。
在本发明的示例性实施例中,通过使用最少量的信息来优化用于压缩视频序列的变换。
<步骤1:正交变换家族参数化>
为了最优化当前的数据变换,需要确定本质地描述基底的参数组。基底通过变换矩阵表示,因此,通过修改变换矩阵来修改基底。
主要通过旋转基底来修改基底。在本发明的示例性实施例中,通过使用角度参数来旋转基底。在最优化图像变换中使用角度参数来旋转基底是一种新的技术。角度参数可以是欧拉角。然而,角度参数不限于欧拉角,角度参数可以是任何参数,只要该参数表示矩阵的行和列之间的部分互换的程度。以下的示例性实施例使用欧拉角。
在变换最优化的情况下,通过使用DCT矩阵D的左乘(Rhorizontal)和右乘(Rvertical)将欧拉角的旋转定义为下面的等式3。
[等式3]
D’=Rhorizontal×D×Rvertical
这里,D’表示通过旋转修改的DCT矩阵。
矩阵Rhorizontal执行DCT矩阵D的行之间的互换。矩阵Rvertical执行DCT矩阵D的列之间的互换。
在4×4块中,矩阵Rhorizontal的示例是下面的等式4。
[等式4]
R horizontal = A B C 0 D E F 0 G H I 0 0 0 0 1
A=cosαcosγ-sinαcosβsinγ
B=-sinαcosγ-cosαcosβsinγ
C=sinβsinγ
D=cosαsinγ+sinαcosβcosγ
E=-sinαsinγ+cosαcosβcosγ
F=-sinβcosγ
G=sinαsinβ
H=cosαsinβ
I=cosβ
这里,α、β和γ是欧拉角。
因此,在4×4块的情况下,根据6个参数α1、α2、α3、α4、α5和α6的组,欧拉角修改15个DCT系数。在8×8块的情况下,12个欧拉角α1、α2、....、α12修改60个DCT系数。这样,减少了用于修改DCT矩阵的参数的数量。
<步骤2:蒙特卡罗方法>
在自由度被减少到6个角度参数(在8×8块的情况下,12个角度参数)之后,应在节省字节方面来最优化数据变换。换句话说,应最优化对角度参数的组进行选择的方法。
此时,使用参数的高维域(6或12个角度参数),图像的压缩不平滑地取决于使用的参数。通过使用蒙特卡罗方法来解决这些问题。
蒙特卡罗方法的核心是执行多个尝试。换句话说,通过使用几个点来测量函数值(本发明的示例性实施例中的压缩率),并选择最优点。在蒙特卡罗方法中,高维域中的随机点的质量很重要,该重要性随着维数的增加而特别地增加。作为公知的,此时,伪随机点比均匀的网格点更好。现在将参照图4来描述在2D中使用蒙特卡罗方法的情况。
图4示出根据本发明的示例性实施例的在蒙特卡罗方法中均匀的网格点和伪随机点的比较。图4的左侧图示出均匀的网格点,图4的右侧图示出根据伪随机序列的第一16个点。
当使用均匀的网格点时,不考虑蒙特卡罗方法的16个尝试,对于第一参数(和第二参数)仅检查4个其他的值。然而,当使用伪随机序列时,通过16个尝试来对第一参数(和第二参数)检查16个不同的值。换句话说,当使用伪随机点时,可关于16个值来充分地检查第一参数和第二参数的不同值。特别是随着参数的数量的增加,在蒙特卡罗方法中使用伪随机序列比均匀的网格点更有利。
使用蒙特卡罗方法以有效地解决最优化数据变换时出现的问题。
<步骤3:Lemer伪随机数>
存在多种产生伪随机序列的方法,最有效的方法之一通过使用Lemer数来执行。Lemer伪随机序列是人为产生的序列,具有最接近不均匀分布的真随机数的特性。产生Lemer序列的算法是公知的,因此这里将省略对其的详细描述。在本发明的示例性实施例中,需要提供至少1013个不重复点。由于Lemer序列是人为的序列,并且其产生算法是公知的,因此解码器可容易地重新计算Lemer序列。
通过使用Lemer序列,可通过使用一条信息(即,随机序列中的编号)来对参数(即,角度参数)的组进行编码。
从每个6维(6D)或12维(12D)参数域产生一个随机点,并在通过使用产生的随机点执行压缩来测量压缩率之后,选择最优点。可存储或发送与Lemer序列中产生最优点的位置对应的编号,而不存储或发送最优参数的组。
如果在蒙特卡罗方法中检查2p个点,则p比特的信息被认为是开销。
<步骤4:最优角度参数的范围的定位>
已经发现最优旋转角具有接近0°或180°(弧度π)的值。这表明DCT基底已经差不多被最优化。
因此,本发明的示例性实施例的角度参数仅执行行和列之间的部分互换(在欧拉角的情况下,接近0°的角),或执行部分互换和基底元素的符号的修改(在欧拉角的情况下,接近180°的角)。
换句话说,使用的参数的范围被限制为域的特定区域,这被称为定位。
通过执行对参数的范围的定位,可减少开销比特的数量。假设将被检查的点被限制在图4中的特定区域,可以看到将被检查的区域减小。当每单位区域将被检查的点的数量增加时,压缩率增加。然而,当应用所述定位时,可以看到将被检查的点的数量减少,从而提高了相同的压缩率。
此外,当固定将被检查的点的数量时(即,当作为开销使用的比特的数量固定时),由于通过应用所述定位每单位区域更多的点被检查,因此压缩率增加得更多。
<步骤5:拟最优基底>
通过执行步骤1至步骤4,可为所有的块(4×4块或8×8块)选择最优基底。在高比特率时,每个块可添加8字节或10字节的开销。在低比特率时,可选择拟最优基底。
拟最优基底表示相同的旋转被应用到包括在一个宏块(macroblock)或一帧中的全部块或部分块。
当最优旋转被应用到每个块时,图像的压缩率可增加,但是开销也增加。
通过各种实验可以确定相同的旋转是否被应用到至少一个块、块的组、一个宏块或一帧。
在低比特率时,在旋转之后的大部分块中,量化系数的值为0。因此,不需要发送关于这些块的旋转角度值的额外信息。
图5是示出根据本发明的示例性实施例的用于压缩图像信号的设备100的框图。参照图5,设备100包括:行和列互换器110、DCT变换器120、图像压缩器130和控制器140。
行和列互换器110执行DCT矩阵的行和列之间的部分互换。如等式3所示,行和列互换器110将与行之间的部分互换相应的矩阵Rhorizontal左乘DCT矩阵,并将与列之间的部分互换相应的矩阵Rvertical右乘DCT矩阵,然而,行和列互换器110的操作不限于此,因此,行和列互换器110可通过其他方式执行部分互换。
DCT变换器120通过使用已经执行部分互换的DCT矩阵来对将被压缩的图像信号进行DCT变换。该操作被定义为下面的等式5。
[等式5]
Y=D’×S’×D’T
在等式5中,D’表示修改的DCT矩阵,S表示将被压缩的图像信号的矩阵,Y表示DCT变换的图像信号。
图像压缩器130压缩DCT变换的图像信号。
控制器140通过将多个值应用到角度参数重复行和列互换器110、DCT变换器120和图像压缩器130的操作(以下,称为“重复操作”),来选择与最高压缩率相应的角度参数。
控制器140通过使用蒙特卡罗方法来针对多个角度参数执行所述重复操作,并选择与最高压缩率相应的角度参数。
因此,控制器140针对角度参数产生随机序列,通过对随机序列的每个值执行所述重复操作来获取图像信号的压缩率,并选择具有最高压缩率的角度参数的值。
此外,为了减小开销,控制器140获得与最高压缩率相应的角度参数的值的随机序列中的编号(即,位置),并存储相应的压缩图像信号和随机序列中的编号或将相应的压缩图像信号和随机序列中的编号发送到解码器,而不直接存储或发送角度参数的值。
如上所述,随机序列可以是Lemer伪随机数。
图6是示出根据本发明的示例性实施例的压缩图像信号的方法的流程图。
首先,在操作S200,产生Lemer伪随机数。假设将被检查的点的数量为n,其中,n为自然数。
通过将1至n代入变量i来重复下面的操作。
首先,在操作S205,将1代入i。
在操作S210,从Lemer伪随机序列选择第i角度参数。在操作S220,如参照上面的等式3所述,通过使用选择的第i角度参数执行DCT矩阵的行和列之间的部分互换。
在操作S230,参照上面的等式5所述,通过使用修改的DCT矩阵D’,对图像信号S进行DCT变换。
在操作S240,压缩DCT变换的图像Y,以产生压缩图像CIi,在操作S250,获取压缩率xi
然后,在操作S260,确定第i角度参数是否是第n点。在操作S260,如果没有检查全部的n个点,则在操作S270,通过将i加1来制定Lemer随机序列中的下一位置,然后重复操作S210至S260。
否则,在操作S260,如果获得全部n个点的压缩率,则在操作S280,获取具有最高压缩率xp的p,在操作S290,存储CIp和p,或者将CIp和p发送到解码器。
<示例性实施例可提供下面的优点中的一个或多个>
1.本发明的示例性实施例基于强的数学基础。
2.根据本发明的当前示例性实施例的方法,平均增加6%的增益,并且在低比特率时,增益最大增加16%。参照图7和图8,针对不同的QP和测试视频序列,在8×8块的情况下,压缩率平均增加6%,在4×4块的情况下,压缩率平均增加5.25%。
3.当应用本发明时,峰值信噪比(PSNR)的值非常高,其可能达到100dbs。因此,可实现无损视频编码。
4.可显著减小量化误差。
<可选择的示例性实施例>
在本发明上面的示例性实施例中,在正交变换中使用欧拉角作为参数。然而,如上所述,该参数不限于欧拉角。
此外,通过一个整数来表示参数的组的技术不仅被应用到基底的旋转,而且可以被应用到需要转换额外信息的其他方法。
排除开销,可通过旋转基底获得的压缩率的最高增加为大约20%。然而,由于开销的增加,压缩率增加大约6%。因此,通过减小开销,可将压缩率增加大约20%。
本发明还可被实施为计算机(包括具有信息处理功能的所有设备)可读记录介质上的计算机可读代码。所述计算机可读记录介质可以是任何可存储其后可以被计算机系统读取的数据的数据存储设备。所述计算机可读记录介质的示例包括:只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘、光学数据存储设备。
尽管已经参照其示例性实施例具体显示和描述了本发明,但是本领域的技术人员应该理解,在不脱离权利要求所限定的本发明的精神和范围的情况下,可以对其进行形式和细节上的各种改变。示例性实施例应仅被理解为描述性的而非限制性目的。因此,本发明的范围不是由本发明的详细描述限定,而是由权利要求限定,该范围内的所有不同应被解释为包括在本发明中。

Claims (19)

1.一种压缩图像信号的方法,所述方法包括:
执行变换矩阵的行和列之间的部分互换;
通过使用已经执行部分互换的变换矩阵来变换将被压缩的图像信号;
压缩变换的图像信号;
通过将多个值应用到表示变换矩阵的行和列之间的部分互换的程度的角度参数,通过重复执行所述部分互换、对图像信息进行变换和压缩变换的图像信号来选择与最高压缩率相应的角度参数。
2.如权利要求1所述的方法,其中,角度参数是欧拉角。
3.如权利要求1所述的方法,其中,执行部分互换的步骤包括:将与行之间的部分互换相应的矩阵左乘变换矩阵,将与列之间的部分互换相应的矩阵右乘变换矩阵。
4.如权利要求3所述的方法,其中,与行之间的部分互换相应的矩阵为:
A B C 0 D E F 0 G H I 0 0 0 0 1
其中,
A=cosαcosγ-sinαcosβsinγ,
B=-sinαcosγ-cosαcosβsinγ,
C=sinβsinγ,
D=cosαsinγ+sinαcosβcosγ,
E=-sinαsinγ+cosαcosβcosγ,
F=-sinβcosγ,
G=sinαsinβ,
H=cosαsinβ,
I=cosβ,
α、β和γ是欧拉角。
5.如权利要求1所述的方法,其中,选择与最高压缩率相应的角度参数的步骤包括:
针对角度参数产生随机序列;
通过针对随机序列的每个值执行行和列之间部分互换、图像信号的变换和变换的图像信号的压缩,来获取图像信号的压缩率;
从获取的随机序列的每个值的压缩率中获取最高压缩率;
选择与最高压缩率相应的角度参数的值。
6.如权利要求5所述的方法,还包括:
获取随机序列中的与最高压缩率相应的角度参数的值的编号;
存储以最高压缩率压缩的图像信号和随机序列中相应的编号,或者将以最高压缩率压缩的图像信号和随机序列中相应的编号发送到解码器。
7.如权利要求5所述的方法,其中,产生的随机序列是Lemer伪随机数。
8.如权利要求1所述的方法,其中,选择与最高压缩率相应的角度参数的步骤包括:通过使用蒙特卡罗方法重复执行所述部分互换、变换图像信号和压缩变换的图像信号。
9.如权利要求2所述的方法,其中,欧拉角具有接近0°或接近180°的值。
10.一种压缩图像信号的设备,所述设备包括:
行和列互换器,执行变换矩阵的行和列之间的部分互换;
变换器,通过使用已经执行部分互换的变换矩阵来变换将被压缩的图像信号;
图像压缩器,压缩变换的图像信号;
控制器,通过将多个值应用到表示变换矩阵的行和列之间的部分互换的程度的角度参数,通过重复执行行和列互换器、变换器和图像压缩器的操作来选择与最高压缩率相应的角度参数。
11.如权利要求10所述的设备,其中,角度参数是欧拉角。
12.如权利要求10所述的设备,其中,行和列互换器将与行之间的部分互换相应的矩阵左乘变换矩阵,将与列之间的部分互换相应的矩阵右乘变换矩阵。
13.如权利要求12所述的设备,其中,与行之间的部分互换相应的矩阵为:
A B C 0 D E F 0 G H I 0 0 0 0 1
其中,
A=cosαcosγ-sinαcosβsinγ,
B=-sinαcosγ-cosαcosβsinγ,
C=sinβsinγ,
D=cosαsinγ+sinαcosβcosγ,
E=-sinαsinγ+cosαcosβcosγ,
F=-sinβcosγ,
G=sinαsinβ,
H=cosαsinβ,
I=cosβ,
α、β和γ是欧拉角。
14.如权利要求10所述的设备,其中,控制器针对角度参数产生随机序列;通过针对随机序列的每个值操作行和列互换器、变换器和图像压缩器,来获取图像信号的压缩率;从获取的随机序列的每个值的压缩率中获取最高压缩率;选择与最高压缩率相应的角度参数的值。
15.如权利要求14所述的设备,其中,控制器获取随机序列中的与最高压缩率相应的角度参数的值的编号;存储以最高压缩率压缩的图像信号和随机序列中相应的编号,或者将以最高压缩率压缩的图像信号和随机序列中相应的编号发送到解码器。
16.如权利要求14所述的设备,其中,产生的随机序列是Lemer伪随机数。
17.如权利要求10所述的设备,其中,通过使用蒙特卡罗方法重复行和列互换器、变换器和图像压缩器的操作,来选择与最高压缩率相应的角度参数。
18.如权利要求11所述的设备,其中,欧拉角具有接近0°或接近180°的值。
19.一种记录有用于执行压缩图像信号的方法的程序的计算机可读记录介质,所述方法包括:
执行变换矩阵的行和列之间的部分互换;
通过使用已经执行部分互换的变换矩阵来变换将被压缩的图像信号;
压缩变换的图像信号;
通过将多个值应用到表示变换矩阵的行和列之间的部分互换的程度的角度参数,通过重复执行所述部分互换、对图像信息进行变换和压缩变换的图像信号来选择与最高压缩率相应的角度参数。
CN2008801126584A 2007-10-24 2008-06-30 用于压缩图像信号的方法和设备 Expired - Fee Related CN101836430B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR10-2007-0107442 2007-10-24
KR20070107442A KR101370288B1 (ko) 2007-10-24 2007-10-24 이미지 신호의 압축 방법 및 장치
PCT/KR2008/003857 WO2009054594A1 (en) 2007-10-24 2008-06-30 Method and apparatus for compressing image signal

Publications (2)

Publication Number Publication Date
CN101836430A true CN101836430A (zh) 2010-09-15
CN101836430B CN101836430B (zh) 2012-05-30

Family

ID=40579679

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008801126584A Expired - Fee Related CN101836430B (zh) 2007-10-24 2008-06-30 用于压缩图像信号的方法和设备

Country Status (7)

Country Link
US (1) US8064711B2 (zh)
EP (1) EP2204041B1 (zh)
JP (1) JP5221666B2 (zh)
KR (1) KR101370288B1 (zh)
CN (1) CN101836430B (zh)
MY (1) MY152560A (zh)
WO (1) WO2009054594A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110017303A (ko) * 2009-08-13 2011-02-21 삼성전자주식회사 회전변환을 이용한 영상 부호화, 복호화 방법 및 장치
KR20110045949A (ko) * 2009-10-28 2011-05-04 삼성전자주식회사 회전 변환을 이용한 영상 부호화, 복호화 방법 및 장치
GB2475721B (en) * 2009-11-27 2015-03-11 British Broadcasting Corp Picture encoding and decoding
KR20110065092A (ko) * 2009-12-09 2011-06-15 삼성전자주식회사 회전 변환을 이용한 영상 부호화, 복호화 방법 및 장치
CN102186025B (zh) * 2011-03-09 2012-10-03 天津大学 基于压缩感知的cmos成像测量值获取系统及其方法
CA3007186C (en) 2011-06-30 2019-10-15 Samsung Electronics Co., Ltd. Video encoding method with bit depth adjustment for fixed-point conversion and apparatus therefor, and video decoding method and aparatus therefor
US9996234B2 (en) * 2015-02-03 2018-06-12 Verizon Patent And Licensing Inc. One click photo rotation
ITUB20155295A1 (it) * 2015-10-16 2017-04-16 Torino Politecnico Apparatuses and methods for encoding and decoding images
KR102264680B1 (ko) * 2017-04-18 2021-06-14 삼성전자주식회사 영상을 부호화/복호화 하는 방법 및 그 장치

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7142720B1 (en) * 1990-07-31 2006-11-28 Fujitsu Limited Image data processing method and apparatus
WO1992022166A1 (en) 1991-06-04 1992-12-10 Qualcomm Incorporated Adaptive block size image compression method and system
US6873734B1 (en) * 1994-09-21 2005-03-29 Ricoh Company Ltd Method and apparatus for compression using reversible wavelet transforms and an embedded codestream
US6865291B1 (en) * 1996-06-24 2005-03-08 Andrew Michael Zador Method apparatus and system for compressing data that wavelet decomposes by color plane and then divides by magnitude range non-dc terms between a scalar quantizer and a vector quantizer
JP2934204B2 (ja) * 1997-02-28 1999-08-16 株式会社グラフィックス・コミュニケーション・ラボラトリーズ 画像の符号化および復号方法と装置
US6178269B1 (en) * 1998-08-06 2001-01-23 Intel Corporation Architecture for computing a two-dimensional discrete wavelet transform
US6505299B1 (en) * 1999-03-01 2003-01-07 Sharp Laboratories Of America, Inc. Digital image scrambling for image coding systems
EP1783597A3 (en) * 1999-11-02 2007-10-03 Canon Kabushiki Kaisha Image processing apparatus and system and control method therefor, image data processing method, image forming apparatus and control method therefor, controller, and storage medium
CN101448162B (zh) * 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
JP4352214B2 (ja) 2003-04-23 2009-10-28 清水建設株式会社 3次元位置姿勢の画像推定方法
JP4366250B2 (ja) * 2003-06-23 2009-11-18 キヤノン株式会社 データ変換処理装置及びプログラム
TWI224931B (en) * 2003-07-04 2004-12-01 Mediatek Inc Scalable system for inverse discrete cosine transform and method thereof
US7609766B2 (en) 2005-02-08 2009-10-27 Vixs Systems, Inc. System of intra-picture complexity preprocessing
KR20070000744A (ko) 2005-06-28 2007-01-03 주식회사 케이티 화자 영역의 매스크 이미지를 이용한 배경 변조 기능을가지는 영상 전화기 및 그 방법
KR100785855B1 (ko) * 2005-07-19 2007-12-14 한국전자통신연구원 향상된 snr 스케일러빌리티 제공을 위한 양자화 장치 및방법
US7689052B2 (en) * 2005-10-07 2010-03-30 Microsoft Corporation Multimedia signal processing using fixed-point approximations of linear transforms
KR20110017303A (ko) * 2009-08-13 2011-02-21 삼성전자주식회사 회전변환을 이용한 영상 부호화, 복호화 방법 및 장치

Also Published As

Publication number Publication date
WO2009054594A1 (en) 2009-04-30
US8064711B2 (en) 2011-11-22
EP2204041B1 (en) 2018-02-21
JP5221666B2 (ja) 2013-06-26
KR20090041773A (ko) 2009-04-29
CN101836430B (zh) 2012-05-30
EP2204041A4 (en) 2012-08-08
KR101370288B1 (ko) 2014-03-05
EP2204041A1 (en) 2010-07-07
JP2011502390A (ja) 2011-01-20
US20090110317A1 (en) 2009-04-30
MY152560A (en) 2014-10-31

Similar Documents

Publication Publication Date Title
CN101836430B (zh) 用于压缩图像信号的方法和设备
US11216985B2 (en) Point cloud attribute compression method based on deleting 0 elements in quantisation matrix
JP6676193B2 (ja) シーンを表す点群を符号化する方法、符号化器システム、及びプログラムを記憶した非一時的コンピューター可読記録媒体
EP1924970B1 (en) Texture compression based on two hues with modified brightness
CN104702962A (zh) 帧内编解码方法、编码器和解码器
CN103067715B (zh) 深度图像的编解码方法和编解码装置
CN103237216A (zh) 深度图像的编解码方法和编解码装置
CN104247422A (zh) 用于改进帧内预测的新的角度表
CN108028945A (zh) 通过使用单例系数更新执行变换的设备和方法
CN103927746B (zh) 一种三维网格序列的配准及压缩方法
CN105306956B (zh) 一种提高hevc编码器离散余弦变换处理速度的方法
CN106412579A (zh) 一种图像的编码、解码方法和装置
CN101843101A (zh) 用于获取16阶整数变换的方法和装置
CN104244010B (zh) 提高数字信号变换性能的方法及数字信号变换方法和装置
CN103096076B (zh) 视频编码方法
CN107155364B (zh) 使用几何图元处理基于图的信号的方法和装置
CN107105245A (zh) 基于tms320c6678芯片的高速jpeg图像压缩方法
CN112995758B (zh) 点云数据的编码方法、解码方法、存储介质及设备
CN102484702A (zh) 用于通过使用旋转变换对图像编码和解码的方法和设备
JP4000157B2 (ja) 画像圧縮方法および画像伸張方法
CN115102934B (zh) 点云数据的解码方法、编码方法、装置、设备及存储介质
CN102843560B (zh) 图像变换处理方法、设备和系统
KR101502144B1 (ko) 계수 정보를 변환하는 방법 및 장치
CN114092631A (zh) 基于加权三维哈尔变换的点云属性编码方法及解码方法
CN112165617B (zh) 一种视频编码方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120530

Termination date: 20200630

CF01 Termination of patent right due to non-payment of annual fee