CN102301691B - 图像编码装置、方法和程序以及图像解码装置、方法和程序 - Google Patents

图像编码装置、方法和程序以及图像解码装置、方法和程序 Download PDF

Info

Publication number
CN102301691B
CN102301691B CN200980155740.XA CN200980155740A CN102301691B CN 102301691 B CN102301691 B CN 102301691B CN 200980155740 A CN200980155740 A CN 200980155740A CN 102301691 B CN102301691 B CN 102301691B
Authority
CN
China
Prior art keywords
dividing method
zonule
subject area
conversion coefficient
leaf
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200980155740.XA
Other languages
English (en)
Other versions
CN102301691A (zh
Inventor
铃木芳典
文仲丞
陈朝庆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Publication of CN102301691A publication Critical patent/CN102301691A/zh
Application granted granted Critical
Publication of CN102301691B publication Critical patent/CN102301691B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • H04N19/647Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission using significance based coding, e.g. Embedded Zerotrees of Wavelets [EZW] or Set Partitioning in Hierarchical Trees [SPIHT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

图像编码装置(100)具有:从多个分割方法中选择对象区域的分割方法的单元(110);单元(104),其利用该分割方法将对象区域分割成多个小区域,针对小区域的像素信号生成预测信号,生成小区域的预测信号与像素信号之间的残差信号,对残差信号实施频率转换和量化,生成量化转换系数,从用于将小区域的量化转换系数映射到多个分割方法所通用的树结构的叶的多个映射图中,根据小区域的属性信息选择映射图,根据该映射图,将小区域的量化转换系数映射到树结构的叶,根据各叶的系数值更新树结构的节和叶的状态;利用多个分割方法所通用的概率模型对该节和叶的状态进行编码的单元(105);以及对小区域的非零的量化转换系数进行编码的单元(106)。

Description

图像编码装置、方法和程序以及图像解码装置、方法和程序
技术领域
本发明涉及图像编码装置、方法和程序以及图像解码装置、方法和程序。
背景技术
为了高效地进行图像数据(静态图像数据和动态图像数据)的传送和蓄积,以往通过压缩编码技术对图像数据进行压缩。作为这种压缩编码技术,例如在动态图像的情况下,广泛使用MPEG1~4或H.261~H.264等的方式。
在这些编码方式中,在将作为编码对象的图像数据分割成多个块之后进行编码处理。然后,针对作为编码对象的对象块内的像素信号生成预测信号。这里,在用于生成预测信号的预测方法中,存在根据画面内的已编码区域的解码信号进行预测的画面内预测、以及根据过去编码的画面的解码信号进行预测的画面间预测。
其中,作为画面内预测,存在有在规定方向上对与编码的对象块邻接的已再现的像素值进行插值而生成预测信号的方法(例如参照下述专利文献1)。
另一方面,在通常的画面间预测中,针对编码的对象块,利用从已经再现的画面中检索与该像素信号类似的信号的方法来生成预测信号。然后,对检索到的信号构成的区域与对象块之间的空间位移量即运动矢量进行编码。
在H.264中,为了对应于图像局部特征的变化,存在如下方法:将对象块(例如16×16)分割成不同块尺寸(除了16×16以外,例如8×8、8×16、16×8、8×4、4×8、4×4等)的小块,按照每个小块生成预测信号。H.264中的预测块尺寸例如记载于专利文献2中。
接着,生成从对象块的预测信号中减去对象块的像素信号而得到的残差信号,通过离散余弦转换等进行频率转换。一般地,如果在转换块内的残差信号中没有起伏,则频率转换的块尺寸越大,转换效率越高。但是,在预测块边界,信号不连续,所以,当对集中了跨越预测块边界的残差信号而得到的大残差块实施频率转换时,高频成分增加,由此,编码效率降低。因此,以与预测信号生成时相同的块单位或比预测信号生成时小的块单位来实施频率转换。
然后,对频率转换后的转换系数进行量化,作为量化转换系数进行熵编码。具有在各块的量化转换系数中包含大量0值的倾向,预测效率越高,该倾向越强。在高效地对0值系数进行编码的方法中存在零树编码。在该方法中,将块内的量化转换系数映射到树结构的叶(树结构的下端),根据叶的系数值,更新树结构的节(树结构的中途的分支点)和叶的状态(0或1)。然后,对树结构的状态和非零的量化转换系数的值进行编码。因此,以使树结构的某个节的下方的节和叶为0值的方式,将块内的量化转换系数映射到树结构的叶,由此,能够以减少了值0的量化转换系数的编码量集中进行编码。零树编码例如记载于下述专利文献3中。
现有技术文献
专利文献
专利文献1:美国专利公报第6765964号
专利文献2:美国专利公报第7003035号
专利文献3:美国专利公开公报第2006-133680号
发明内容
发明要解决的课题
如背景技术所示,通过利用块形状或块尺寸不同的多种预测方法实施预测处理,预测效率提高。另一方面,关于残差信号的熵编码,集中统计性质类似的数据以相同的概率模型进行处理,能够以较少的编码要素或较小的编码表实施编码处理。
但是,在利用多种方法(多种块尺寸)生成预测信号的情况下,当以较少的编码要素进行熵编码时,各编码要素的统计自由度变大,所以,难以得到适于残差信号的熵编码的相同的概率模型,其结果,难以高效地实施残差信号的熵编码。
本发明是为了解决上述课题而完成的,其目的在于,以适当的预测块的尺寸和形状进行预测处理,且能够高效地实施残差信号的熵编码。
用于解决课题的手段
在本发明中,为了解决上述课题,将为了以不同的块尺寸或不同的块形状生成预测信号而具有不同的统计性质的量化转换系数转换为通用的树结构的节和叶的状态,利用上述不同的块尺寸或不同的块形状通用的概率模型进行零树编码。并且,在本发明中,针对尺寸或形状不同的块,单独准备用于将块内的量化转换系数映射到树结构的叶的映射图,由此,抑制了树结构的各节和叶的状态的统计偏差。
本发明的图像编码装置的特征在于,该图像编码装置具有:区域分割单元,其将输入图像分割成多个区域;分割方法选择单元,其从多个分割方法中选择所述多个区域中作为处理对象的对象区域的分割方法;分割方法编码单元,其对识别所述选择出的分割方法的信息进行编码;小区域分割单元,其利用所述选择出的分割方法将所述对象区域分割成多个小区域;预测单元,其生成针对所述小区域所包含的像素信号的预测信号;残差信号生成单元,其生成所述小区域的预测信号与像素信号之间的残差信号;转换单元,其对所述小区域的残差信号进行频率转换,生成转换系数;量化单元,其对所述小区域的转换系数进行量化,生成量化转换系数;零树映射单元,其准备所述多个分割方法所通用的树结构,从用于将所述小区域的量化转换系数映射到所述树结构的叶的多个映射图中,选择根据所述小区域的属性信息确定的一个映射图,根据所述选择出的映射图,将所述小区域的量化转换系数映射到所述树结构的叶,根据各叶的系数值更新所述树结构的节和叶的状态;零树编码单元,其利用所述多个分割方法所通用的概率模型对所述树结构的节和叶的状态进行熵编码;非零系数编码单元,其对所述小区域的非零的量化转换系数进行熵编码;以及输出单元,其输出识别所述选择出的分割方法的信息的编码数据、所述树结构的节和叶的状态的编码数据以及所述小区域的非零的量化转换系数的编码数据。另外,优选所述小区域的属性信息是所述对象区域的所述选择出的分割方法。
本发明的图像解码装置的特征在于,该图像解码装置具有:数据分析单元,其从压缩数据中提取指示作为处理对象的对象区域的分割方法的编码数据和对所述对象区域进行分割得到的小区域的残差信号的编码数据;分割方法解码单元,其根据指示对象区域的分割方法的编码数据,对从多个分割方法中识别所述对象区域的分割方法的信息进行熵解码;零树解码单元,其准备所述分割方法所通用的树结构,根据所述小区域的残差信号的编码数据,利用所述多个分割方法所通用的概率模型对所述树结构的节和叶的状态进行熵解码;非零系数解码单元,其根据所述小区域的残差信号的编码数据,对所述解码后的树结构的叶的状态为1的量化转换系数的解码值进行熵解码;零树量化转换系数映射单元,其从用于将所述小区域的量化转换系数映射到所述树结构的叶的多个映射图中,选择根据所述小区域的已解码属性信息确定的一个映射图,根据所述选择出的映射图,将所述解码后的树结构的节和叶的状态以及所述解码后的小区域的量化转换系数的解码值复原成所述小区域的再现量化转换系数;逆量化单元,其对所述小区域的再现量化转换系数进行逆量化,生成再现频率转换系数;逆转换单元,其对所述小区域的再现频率转换系数进行逆转换,复原再现残差信号;预测单元,其生成针对所述小区域所包含的像素信号的预测信号;以及图像复原单元,其通过对所述小区域的所述预测信号和所述再现残差信号进行相加,复原所述小区域的像素信号。另外,优选所述小区域的已解码属性信息是解码后的所述对象区域的分割方法。
本发明的图像编码装置除了上述的图像编码装置外,还可以采用以下方式。本发明的图像编码装置的特征在于,该图像编码装置具有:区域分割单元,其将输入图像分割成多个区域;分割方法选择单元,其从多个分割方法中选择所述多个区域中作为处理对象的对象区域的分割方法;分割方法编码单元,其对识别所述选择出的分割方法的信息进行编码;小区域分割单元,其利用所述选择出的分割方法将所述对象区域分割成多个小区域;预测单元,其生成针对所述对象区域的各小区域所包含的像素信号的预测信号;残差信号生成单元,其生成所述对象区域的各小区域的预测信号与像素信号之间的残差信号;转换单元,其对所述对象区域的各小区域的残差信号进行频率转换,生成转换系数;量化单元,其对所述对象区域的各小区域的转换系数进行量化,生成量化转换系数;零树映射单元,其准备所述多个分割方法所通用的树结构,从用于将所述对象区域内的量化转换系数映射到所述树结构的叶的多个映射图中,选择根据所述对象区域的属性信息确定的一个映射图,根据所述选择出的映射图,将所述对象区域内的量化转换系数映射到所述树结构的叶,根据各叶的系数值更新所述树结构的节和叶的状态;零树编码单元,其利用所述多个分割方法所通用的概率模型对所述树结构的节和叶的状态进行熵编码;非零系数编码单元,其对所述对象区域的各小区域的非零的量化转换系数进行熵编码;以及输出单元,其输出识别所述选择出的分割方法的信息的编码数据、所述树结构的节和叶的状态的编码数据以及所述对象区域的各小区域的非零的量化转换系数的编码数据。另外,优选所述对象区域的属性信息是所述对象区域的所述选择出的分割方法。
本发明的图像解码装置除了上述的图像解码装置外,还可以采用以下方式。本发明的图像解码装置的特征在于,该图像解码装置具有:数据分析单元,其从压缩数据中提取指示作为处理对象的对象区域的分割方法的编码数据和所述对象区域的残差信号的编码数据;分割方法解码单元,其根据指示对象区域的分割方法的编码数据,对从多个分割方法中识别所述对象区域的分割方法的信息进行熵解码;零树解码单元,其准备所述分割方法所通用的树结构,根据所述对象区域的残差信号的编码数据,利用所述多个分割方法所通用的概率模型对所述树结构的节和叶的状态进行熵解码;非零系数解码单元,其根据所述对象区域的残差信号的编码数据,对所述解码后的树结构的叶的状态为1的量化转换系数的解码值进行熵解码;零树量化转换系数映射单元,其从用于将所述对象区域的量化转换系数映射到所述树结构的叶的多个映射图中,选择根据所述对象区域的已解码属性信息确定的一个映射图,根据所述选择出的映射图,将所述解码后的树结构的节和叶的状态以及所述解码后的对象区域的量化转换系数的解码值转换成所述对象区域的各小区域的再现量化转换系数;逆量化单元,其对所述对象区域的各小区域的再现量化转换系数进行逆量化,生成再现频率转换系数;逆转换单元,其对所述对象区域的各小区域的再现频率转换系数进行逆转换,复原再现残差信号;预测单元,其生成针对所述对象区域的小区域所包含的像素信号的预测信号;图像复原单元,其通过对所述对象区域的各小区域的所述预测信号和所述再现残差信号进行相加,复原所述对象区域的各小区域的像素信号,生成再现图像信号;以及区域合并单元,其通过对所述对象区域的各小区域的再现图像信号进行合并,生成所述对象区域的再现图像信号。另外,优选所述对象区域的已解码属性信息是解码后的所述对象区域的分割方法。
上述图像编码装置的发明能够作为图像编码方法的发明和图像编码程序的发明来记载,能够如下记述。
本发明的图像编码方法由图像编码装置执行,其特征在于,该图像编码方法具有以下步骤:区域分割步骤,将输入图像分割成多个区域;分割方法选择步骤,从多个分割方法中选择所述多个区域中作为处理对象的对象区域的分割方法;分割方法编码步骤,对识别所述选择出的分割方法的信息进行编码;小区域分割步骤,利用所述选择出的分割方法将所述对象区域分割成多个小区域;预测步骤,生成针对所述小区域所包含的像素信号的预测信号;残差信号生成步骤,生成所述小区域的预测信号与像素信号之间的残差信号;转换步骤,对所述小区域的残差信号进行频率转换,生成转换系数;量化步骤,对所述小区域的转换系数进行量化,生成量化转换系数;零树映射步骤,准备所述多个分割方法所通用的树结构,从用于将所述小区域的量化转换系数映射到所述树结构的叶的多个映射图中,选择根据所述对象区域的所述选择出的分割方法确定的一个映射图,根据所述选择出的映射图,将所述小区域的量化转换系数映射到所述树结构的叶,根据各叶的系数值更新所述树结构的节和叶的状态;零树编码步骤,利用所述多个分割方法所通用的概率模型对所述树结构的节和叶的状态进行熵编码;非零系数编码步骤,对所述小区域的非零的量化转换系数进行熵编码;以及输出步骤,输出识别所述选择出的分割方法的信息的编码数据、所述树结构的节和叶的状态的编码数据以及所述小区域的非零的量化转换系数的编码数据。
本发明的图像编码程序的特征在于,该图像编码程序使计算机作为以下单元进行工作:区域分割单元,其将输入图像分割成多个区域;分割方法选择单元,其从多个分割方法中选择所述多个区域中作为处理对象的对象区域的分割方法;分割方法编码单元,其对识别所述选择出的分割方法的信息进行编码;小区域分割单元,其利用所述选择出的分割方法将所述对象区域分割成多个小区域;预测单元,其生成针对所述小区域所包含的像素信号的预测信号;残差信号生成单元,其生成所述小区域的预测信号与像素信号之间的残差信号;转换单元,其对所述小区域的残差信号进行频率转换,生成转换系数;量化单元,其对所述小区域的转换系数进行量化,生成量化转换系数;零树映射单元,其准备所述多个分割方法所通用的树结构,从用于将所述小区域的量化转换系数映射到所述树结构的叶的多个映射图中,选择根据所述对象区域的所述选择出的分割方法确定的一个映射图,根据所述选择出的映射图,将所述小区域的量化转换系数映射到所述树结构的叶,根据各叶的系数值更新所述树结构的节和叶的状态;零树编码单元,其利用所述多个分割方法所通用的概率模型对所述树结构的节和叶的状态进行熵编码;非零系数编码单元,其对所述小区域的非零的量化转换系数进行熵编码;以及输出单元,其输出识别所述选择出的分割方法的信息的编码数据、所述树结构的节和叶的状态的编码数据以及所述小区域的非零的量化转换系数的编码数据。
本发明的图像编码方法除了上述的图像编码方法外,还可以采用以下方式。本发明的图像编码方法由图像编码装置执行,其特征在于,该图像编码方法具有以下步骤:区域分割步骤,将输入图像分割成多个区域;分割方法选择步骤,从多个分割方法中选择所述多个区域中作为处理对象的对象区域的分割方法;分割方法编码步骤,对识别所述选择出的分割方法的信息进行编码;小区域分割步骤,利用所述选择出的分割方法将所述对象区域分割成多个小区域;预测步骤,生成针对所述对象区域的各小区域所包含的像素信号的预测信号;残差信号生成步骤,生成所述对象区域的各小区域的预测信号与像素信号之间的残差信号;转换步骤,对所述对象区域的各小区域的残差信号进行频率转换,生成转换系数;量化步骤,对所述对象区域的各小区域的转换系数进行量化,生成量化转换系数;零树映射步骤,准备所述多个分割方法所通用的树结构,从用于将所述对象区域内的量化转换系数映射到所述树结构的叶的多个映射图中,选择根据所述对象区域的所述选择出的分割方法确定的一个映射图,根据所述选择出的映射图,将所述对象区域内的量化转换系数映射到所述树结构的叶,根据各叶的系数值更新所述树结构的节和叶的状态;零树编码步骤,利用所述多个分割方法所通用的概率模型对所述树结构的节和叶的状态进行熵编码;非零系数编码步骤,对所述对象区域的各小区域的非零的量化转换系数进行熵编码;以及输出步骤,输出识别所述选择出的分割方法的信息的编码数据、所述树结构的节和叶的状态的编码数据以及所述对象区域的各小区域的非零的量化转换系数的编码数据。
本发明的图像编码程序的特征在于,该图像编码程序使计算机作为以下单元进行工作:区域分割单元,其将输入图像分割成多个区域;分割方法选择单元,其从多个分割方法中选择所述多个区域中作为处理对象的对象区域的分割方法;分割方法编码单元,其对识别所述选择出的分割方法的信息进行编码;小区域分割单元,其利用所述选择出的分割方法将所述对象区域分割成多个小区域;预测单元,其生成针对所述对象区域的各小区域所包含的像素信号的预测信号;残差信号生成单元,其生成所述对象区域的各小区域的预测信号与像素信号之间的残差信号;转换单元,其对所述对象区域的各小区域的残差信号进行频率转换,生成转换系数;量化单元,其对所述对象区域的各小区域的转换系数进行量化,生成量化转换系数;零树映射单元,其准备所述多个分割方法所通用的树结构,从用于将所述对象区域内的量化转换系数映射到所述树结构的叶的多个映射图中,选择根据所述对象区域的所述选择出的分割方法确定的一个映射图,根据所述选择出的映射图,将所述对象区域内的量化转换系数映射到所述树结构的叶,根据各叶的系数值更新所述树结构的节和叶的状态;零树编码单元,其利用所述多个分割方法所通用的概率模型对所述树结构的节和叶的状态进行熵编码;非零系数编码单元,其对所述对象区域的各小区域的非零的量化转换系数进行熵编码;以及输出单元,其输出识别所述选择出的分割方法的信息的编码数据、所述树结构的节和叶的状态的编码数据以及所述对象区域的各小区域的非零的量化转换系数的编码数据。
上述图像解码装置的发明能够作为图像解码方法的发明和图像解码程序的发明来记载,能够如下记述。
本发明的图像解码方法由图像解码装置执行,其特征在于,该图像解码方法具有以下步骤:数据分析步骤,从压缩数据中提取指示作为处理对象的对象区域的分割方法的编码数据和对所述对象区域进行分割后的小区域的残差信号的编码数据;分割方法解码步骤,根据指示对象区域的分割方法的编码数据,对从多个分割方法中识别所述对象区域的分割方法的信息进行熵解码;零树解码步骤,准备所述分割方法所通用的树结构,根据所述小区域的残差信号的编码数据,利用所述多个分割方法所通用的概率模型对所述树结构的节和叶的状态进行熵解码;非零系数解码步骤,根据所述小区域的残差信号的编码数据,对所述解码后的树结构的叶的状态为1的量化转换系数的解码值进行熵解码;零树量化转换系数映射步骤,从用于将所述小区域的量化转换系数映射到所述树结构的叶的多个映射图中,选择根据所述解码后的所述对象区域的分割方法确定的一个映射图,根据所述选择出的映射图,将所述解码后的树结构的节和叶的状态以及所述解码后的小区域的量化转换系数的解码值复原成所述小区域的再现量化转换系数;逆量化步骤,对所述小区域的再现量化转换系数进行逆量化,生成再现频率转换系数;逆转换步骤,对所述小区域的再现频率转换系数进行逆转换,复原再现残差信号;预测步骤,生成针对所述小区域所包含的像素信号的预测信号;以及图像复原步骤,通过对所述小区域的所述预测信号和所述再现残差信号进行相加,复原所述小区域的像素信号。
本发明的图像解码程序的特征在于,该图像解码程序使计算机作为以下单元进行工作:数据分析单元,其从压缩数据中提取指示作为处理对象的对象区域的分割方法的编码数据和对所述对象区域进行分割后的小区域的残差信号的编码数据;分割方法解码单元,其根据指示对象区域的分割方法的编码数据,对从多个分割方法中识别所述对象区域的分割方法的信息进行熵解码;零树解码单元,其准备所述分割方法所通用的树结构,根据所述小区域的残差信号的编码数据,利用所述多个分割方法所通用的概率模型对所述树结构的节和叶的状态进行熵解码;非零系数解码单元,其根据所述小区域的残差信号的编码数据,对所述解码后的树结构的叶的状态为1的量化转换系数的解码值进行熵解码;零树量化转换系数映射单元,其从用于将所述小区域的量化转换系数映射到所述树结构的叶的多个映射图中,选择根据所述解码后的所述对象区域的分割方法确定的一个映射图,根据所述选择出的映射图,将所述解码后的树结构的节和叶的状态以及所述解码后的小区域的量化转换系数的解码值复原成所述小区域的再现量化转换系数;逆量化单元,其对所述小区域的再现量化转换系数进行逆量化,生成再现频率转换系数;逆转换单元,其对所述小区域的再现频率转换系数进行逆转换,复原再现残差信号;预测单元,其生成针对所述小区域所包含的像素信号的预测信号;以及图像复原单元,其通过对所述小区域的所述预测信号和所述再现残差信号进行相加,复原所述小区域的像素信号。
本发明的图像解码方法除了上述的图像解码方法外,还可以采用以下方式。本发明的图像解码方法由图像解码装置执行,其特征在于,该图像解码方法具有以下步骤:数据分析步骤,从压缩数据中提取指示作为处理对象的对象区域的分割方法的编码数据和所述对象区域的残差信号的编码数据;分割方法解码步骤,根据指示对象区域的分割方法的编码数据,对从多个分割方法中识别所述对象区域的分割方法的信息进行熵解码;零树解码步骤,准备所述分割方法所通用的树结构,根据所述对象区域的残差信号的编码数据,利用所述多个分割方法所通用的概率模型对所述树结构的节和叶的状态进行熵解码;非零系数解码步骤,根据所述对象区域的残差信号的编码数据,对所述解码后的树结构的叶的状态为1的量化转换系数的解码值进行熵解码;零树量化转换系数映射步骤,从用于将所述对象区域的量化转换系数映射到所述树结构的叶的多个映射图中,选择根据所述解码后的所述对象区域的分割方法确定的一个映射图,根据所述选择出的映射图,将所述解码后的树结构的节和叶的状态以及所述解码后的对象区域的量化转换系数的解码值转换成所述对象区域的各小区域的再现量化转换系数;逆量化步骤,对所述对象区域的各小区域的再现量化转换系数进行逆量化,生成再现频率转换系数;逆转换步骤,对所述对象区域的各小区域的再现频率转换系数进行逆转换,复原再现残差信号;预测步骤,生成针对所述对象区域的小区域所包含的像素信号的预测信号;图像复原步骤,通过对所述对象区域的各小区域的所述预测信号和所述再现残差信号进行相加,复原所述对象区域的各小区域的像素信号,生成再现图像信号;以及区域合并步骤,通过对所述对象区域的各小区域的再现图像信号进行合并,生成所述对象区域的再现图像信号。
本发明的图像解码程序除了上述的图像解码程序外,还可以采用以下方式。本发明的图像解码程序的特征在于,该图像解码程序使计算机作为以下单元进行工作:数据分析单元,其从压缩数据中提取指示作为处理对象的对象区域的分割方法的编码数据和所述对象区域的残差信号的编码数据;分割方法解码单元,其根据指示对象区域的分割方法的编码数据,对从多个分割方法中识别所述对象区域的分割方法的信息进行熵解码;零树解码单元,其准备所述分割方法所通用的树结构,根据所述对象区域的残差信号的编码数据,利用所述多个分割方法所通用的概率模型对所述树结构的节和叶的状态进行熵解码;非零系数解码单元,其根据所述对象区域的残差信号的编码数据,对所述解码后的树结构的叶的状态为1的量化转换系数的解码值进行熵解码;零树量化转换系数映射单元,其从用于将所述对象区域的量化转换系数映射到所述树结构的叶的多个映射图中,选择根据所述解码后的所述对象区域的分割方法确定的一个映射图,根据所述选择出的映射图,将所述解码后的树结构的节和叶的状态以及所述解码后的对象区域的量化转换系数的解码值转换成所述对象区域的各小区域的再现量化转换系数;逆量化单元,其对所述对象区域的各小区域的再现量化转换系数进行逆量化,生成再现频率转换系数;逆转换单元,其对所述对象区域的各小区域的再现频率转换系数进行逆转换,复原再现残差信号;预测单元,其生成针对所述对象区域的小区域所包含的像素信号的预测信号;图像复原单元,其通过对所述对象区域的各小区域的所述预测信号和所述再现残差信号进行相加,复原所述对象区域的各小区域的像素信号,生成再现图像信号;以及区域合并单元,其通过对所述对象区域的各小区域的再现图像信号进行合并,生成所述对象区域的再现图像信号。
发明效果
根据本发明,针对利用多个分割方法生成的预测信号,能够以通用的树结构实施零树编码,所以,以适当的预测块的尺寸和形状进行预测处理,且能够高效地实施残差信号的熵编码。
附图说明
图1是本实施方式的图像编码装置的框图。
图2是按照每个分割方法设置的预测编码器的框图。
图3是示出从量化转换系数映射到零树的映射处理的第1流程图。
图4是按照每个分割方法设置的预测解码器的框图。
图5是示出从零树映射到量化转换系数的映射处理的第1流程图。
图6是示出从量化转换系数映射到零树的映射处理的第1示意图。
图7是示出从量化转换系数映射到零树的映射处理的第2示意图。
图8是示出从量化转换系数映射到零树的映射处理的第3示意图。
图9是本实施方式的图像解码装置的框图。
图10是用于说明本实施方式的图像编码方法的流程图。
图11是用于说明本实施方式的图像解码方法的流程图。
图12是示出从量化转换系数映射到零树的映射处理的第2流程图。
图13是示出从零树映射到量化转换系数的映射处理的第2流程图。
图14是示出从量化转换系数映射到零树的映射处理的第4示意图。
图15是示出从量化转换系数映射到零树的映射处理的第5示意图。
图16是示出从量化转换系数映射到零树的映射处理的第6示意图。
图17是用于执行在记录介质中记录的程序的计算机的硬件结构图。
图18是图17的计算机的立体图。
图19是示出图像编码程序的模块结构例的框图。
图20是示出预测编码模块的结构例的框图。
图21是示出图像解码程序的模块结构例的框图。
图22是示出预测解码模块的结构例的框图。
具体实施方式
下面,使用图1~图22对本发明的实施方式进行说明。
(关于图像编码装置)
图1示出本发明的图像编码装置100的框图。图像编码装置100具有:输入端子101、块分割器102、分割方法切换器103、分割方法1预测编码器104a、分割方法2预测编码器104b、分割方法3预测编码器104c、零树熵编码器105、非零系数熵编码器106、输出端子107、帧存储器108、分割方法1预测解码器109a、分割方法2预测解码器109b、分割方法3预测解码器109c、分割方法选择器110、以及分割方法熵编码器111。另外,分割方法1预测编码器104a、分割方法2预测编码器104b和分割方法3预测编码器104c以下总称为“分割方法p预测编码器104”。分割方法1预测解码器109a、分割方法2预测解码器109b和分割方法3预测解码器109c以下总称为“分割方法p预测解码器109”。
下面,叙述如上所述构成的图像编码装置100的动作。由多张图像构成的动态图像的信号被输入到输入端子101。利用块分割器102将作为编码对象的图像分割成多个区域。在本实施方式中,作为一例,分割成由8×8的像素构成的块,但是,也可以分割成除此之外的块的大小或形状。
接着,作为编码处理对象的区域(以下称为“对象块”)被输入到分割方法切换器103。
与此同时,分割方法选择器110从多个分割方法中决定对象块的分割方法,向分割方法切换器103输出已决定的分割方法的识别信息。分割方法的选择方法在后面叙述(利用图10的流程图进行说明)。进而,分割方法选择器110向分割方法熵编码器111输出选择出的分割方法的识别信息。分割方法熵编码器111对所输入的分割方法的识别信息进行编码,将其输出到输出端子107。另外,以下将分割方法设为3种进行说明,但是,在本发明中,对象块的分割方法的数量没有限定。
另一方面,在由分割方法选择器110从3种分割方法中选择出的分割方法为分割方法1的情况下,分割方法切换器103向分割方法1预测编码器104a输出对象块的像素信号,在由分割方法选择器110从3种分割方法中选择出的分割方法为分割方法2的情况下,分割方法切换器103向分割方法2预测编码器104b输出对象块的像素信号,在由分割方法选择器110从3种分割方法中选择出的分割方法为分割方法3的情况下,分割方法切换器103向分割方法3预测编码器104c输出对象块的像素信号。
这里,以选择了分割方法1的情况为例进行说明。分割方法1预测编码器104a将所输入的对象块分割成小区域(以下称为“子块”),按照每个子块生成预测信号,对子块的像素信号与预测信号之间的残差信号进行频率转换并进行量化。然后,分割方法1预测编码器104a将各子块的量化转换系数映射到预先确定的树结构的叶,根据各叶的系数更新树结构的状态,将其输出到零树熵编码器105(详细后述)。此时,在本发明中,作为树结构,使用不依赖于对象块的分割方法的通用的树结构。同时,为了进行局部解码处理,向分割方法1预测解码器109a输出树结构的节和叶的状态以及各子块的非零的量化转换系数。
以上的分割方法1预测编码器104a的动作在分割方法2预测编码器104b、分割方法3预测编码器104c中也同样。使用图2在后面叙述这些分割方法p预测编码器104的详细情况。
另外,在本发明中,各子块的块尺寸和块形状不限于特定的块尺寸和块形状。
(树结构和零树编码的说明)
这里,对树结构、子块分割和零树编码进行说明。本发明的通用的树结构大致分为2种。第1树结构是包含对象块内的所有量化转换系数的树结构。第2树结构是仅包含一定像素数的子块的量化转换系数的树结构。
第1树结构不依赖于对象块的分割方法,所以,能够应用于任意的子块。该例子在后面叙述,这里说明第2树结构的例子。
在使用第2树结构的情况下,与分割方法无关地将对象块分割成相同像素数的子块,使用基于该像素数的树结构。在本实施方式中,以对象块为8×8像素并将对象块分割成由16像素构成的4个子块的方法为例进行说明。分割方法为4×4像素(图6的子块61)、2×8像素(图7的子块71)、8×2像素(图8的子块81)这3种,使用图6的树62(图7的树72和图8的树82也为相同构造)所示的树结构。
为了说明树结构的生成方法,关注图6。在树结构中,将x记号所示的分支点称为“节”,将数字所示的树的下端称为“叶”。节和叶的状态用0或1的值表示,各节的状态由2个节头的节或叶的状态决定。关于x所示的某个节(对象节),在节头的2个节(或叶)的状态均为0时,对象节的状态为0,在2个节头的节(或叶)的状态的任意一方或双方为1时,对象节的状态为1。
子块61的数字表示各量化转换系数的子块内的位置,对应于树结构的树62的数字。将子块61的各量化转换系数映射到树62的相同数字的叶。在被映射的量化转换系数非零的情况下,各叶的状态为1,在被映射的量化转换系数为零的情况下,各叶的状态为0。确定叶的状态后,从树结构的右下方朝向左上方按顺序确定x记号的节的状态。由此可知,在x的状态为0的情况下,与属于以该节为起点的树的叶对应的量化转换系数的值全部为0。
在零树编码中,按照预先确定的顺序(例如从左上方朝向右下方按顺序搜索x记号)对树结构的节和叶的状态进行编码。此时,如果某个节的状态为0,则属于以该节为起点的树的节和叶的状态全部为0,所以,不需要对这些节和叶的状态进行编码。因此,决定了表示树结构的节与各量化转换系数之间的对应的映射图,以便以量化转换系数的零系数较少的编码量高效地进行编码。
在本发明中,树结构针对各分割方法是通用的。而且,根据子块内的各量化转换系数为零值的概率,针对各分割方法单独确定向各叶映射量化转换系数的映射规则。这里,将图6、图7、图8中的对树结构的叶分配子块内的量化转换系数的规则称为“映射图”,将对树结构的叶分配子块内的量化转换系数的处理称为“映射”。
(继续图1的说明)
零树熵编码器105使用不依赖于对象块的分割方法的通用的概率模型,对所输入的节和叶的状态进行熵编码。然后,零树熵编码器105向非零系数熵编码器106输出对象块中的节和叶的状态的编码数据以及非零的量化转换系数的值。
这里,概率模型针对各节和叶设定1个节为0的概率(或者为1的概率),概率模型确定在对节或叶的状态进行编码时输出的码。另外,如果预先确定,则可以在多个节和叶的状态的编码中使用相同的概率模型。并且,在算术码的情况下,也可以根据产生的码对各节或叶的概率模型进行更新。
非零系数熵编码器106按照规定的顺序(例如光栅扫描顺序)对所输入的对象块中的子块内的非零量化转换系数进行编码,将所得到的编码数据与节和叶的状态的编码数据一起输出到输出端子107。熵编码的方法可以是算术编码,也可以是可变长度编码。
分割方法1预测解码器109a根据所输入的树结构的节和叶的状态以及各子块的非零的量化转换系数的解码值,复原各子块的量化转换系数。对各子块的量化转换系数进行逆量化和逆转换,生成再现残差信号。同时,分割方法1预测解码器109a利用与分割方法1预测编码器104a相同的手段生成各子块的预测信号。最后,对各子块的再现残差信号和预测信号进行相加,复原再现信号。以上的分割方法1预测解码器109a的动作在分割方法2预测解码器109b、分割方法3预测解码器109c中也同样。使用图4在后面叙述这些分割方法p预测解码器109的详细情况。
复原后的再现信号被输出到帧存储器108,保存为在预测处理中使用的参照图像。
另外,在分割方法p预测编码器104中的预测方法不参照保存在帧存储器108中的图像信号的情况下,不需要分割方法p预测解码器109。
(关于分割方法p预测编码器104)
分割方法p预测编码器104(分割方法1预测编码器104a、分割方法2预测编码器104b和分割方法3预测编码器104c)具有图2所示的通用的结构。下面,对分割方法p预测编码器104的结构进行说明。如图2所示,分割方法p预测编码器104具有:小区域分割器201、预测器202、差分器203、转换器204、量化器205以及量化转换系数零树映射器206。
小区域分割器201按照分割方法p将所输入的对象块分割成子块,将其输出到差分器203。
预测器202针对各子块的像素信号生成预测信号,将其输出到差分器203。预测方法具有画面间预测和画面内预测。在画面间预测中,将过去编码后并复原的再现图像作为参照图像,根据该参照图像,求出赋予相对于子块的误差最小的预测信号的运动信息。另一方面,在画面内预测中,通过基于使用在空间上与子块邻接的已再现的像素值的规定方法的复制处理(针对子块内的各像素的位置的复制处理),生成画面内预测信号。在本发明中,没有限定具体的预测信号的生成方法。可以针对各分割方法准备多个预测方法,按照每个对象块或按照每个子块从该多个预测方法中选择预测方法,对选择出的预测方法的信息进行编码,也可以针对各分割方法预先确定预测方法,还可以针对对象块内的各子块的位置预先确定预测方法。
差分器203通过计算所输入的各子块的图像信号与预测信号之间的差分,生成各子块的残差信号,将其输出到转换器204。
利用转换器204对各子块的残差信号进行离散余弦转换,向量化器205输出转换后的各子块的转换系数。
量化器205通过对各子块的转换系数进行量化,生成量化转换系数,将其输出到量化转换系数零树映射器206。
量化转换系数零树映射器206针对各子块,将子块的量化转换系数映射到不依赖于对象块的分割方法的通用的树结构的叶,根据各叶的系数值更新树结构的节和叶的状态(详细后述)。然后,量化转换系数零树映射器206针对各子块,向零树熵编码器105输出树结构的节和叶的状态、以及与状态为1的叶对应的量化转换系数。
另外,在图1中,针对分割方法1、2、3分别准备分割方法p预测编码器104,但是,在图2所示的小区域分割器201、预测器202、差分器203、转换器204、量化器205和量化转换系数零树映射器206分别包含分割方法1~3的功能、且具有通过分割方法来切换处理的功能的情况下,图1的分割方法1预测编码器104a、分割方法2预测编码器104b和分割方法3预测编码器104c能够置换为一个分割方法p预测编码器104。例如,一个分割方法1预测编码器104a发挥3个分割方法p预测编码器104的功能,从分割方法选择器110向分割方法1预测编码器104a输入分割方法的识别信息。不需要分割方法2预测编码器104b和分割方法3预测编码器104c。
接着,使用图3说明由图2的量化转换系数零树映射器206执行的零和非零系数的生成处理。
最初,在S302中,量化转换系数零树映射器206将k的值(子块的识别编号)初始设定为0,将KK的值(对象块内的子块的数量)初始设定为4,在接着的S303中,按照光栅扫描顺序取得第k个(最初为第0个)子块内的量化转换系数。然后,在S304中,量化转换系数零树映射器206选择与对象块的分割方法p(p为1~3的值,分割方法1表示图6的4×4,分割方法2表示图7的2×8,分割方法3表示图8的8×2)对应的映射图。在接着的S305中,量化转换系数零树映射器206根据选择出的映射图(图6~图8的树62或72或82),将量化转换系数映射到多个分割方法所通用的树结构的叶,根据各叶的系数值决定各叶的状态是0(系数值为0的情况)还是1(系数值为0以外的情况),然后,根据所决定的各叶的状态更新各节的状态。
接着,在S306中,量化转换系数零树映射器206使k的值增加1个,对第k个(这里为第1个)子块实施上述S303~S305的处理。以后,反复进行S303~S306的处理,直到针对4个子块的处理结束(S307)。
这样,根据本发明,即使在利用多个不同的分割方法对对象块进行分割并生成预测信号的情况下,也能够将量化转换系数映射到通用的树结构的叶,所以,不需要准备多个树结构。并且,能够利用不依赖于对象块的分割方法的通用的概率模型来进行零树的编码。
另外,在该实施方式中,对象块的分割方法为4×4、2×8、8×2这3种,但是,除了子块内的像素数固定以外,分割方法的种类和数量没有限定。
(关于分割方法p预测解码器109)
分割方法p预测解码器109(分割方法1预测解码器109a、分割方法2预测解码器109b和分割方法3预测解码器109c)具有图4所示的通用的结构。下面,对分割方法p预测解码器109的结构进行说明。如图4所示,分割方法p预测解码器109具有:零树量化转换系数映射器401、逆量化器402、逆转换器403、预测器202、加法器404以及块合并器405。另外,图4的预测器202与所述图2相同。
针对各子块,对零树量化转换系数映射器401输入不依赖于对象块的分割方法的通用的树结构的节和叶的状态、以及状态为1的叶(即量化转换系数非零)的量化转换系数的解码值。零树量化转换系数映射器401根据所输入的树结构的节和叶的状态、以及非零的量化系数的解码值,复原各子块的量化转换系数(详细后述),将其输出到逆量化器402。
逆量化器402对各子块的量化转换系数进行逆量化,复原转换系数,将其输出到逆转换器403。
逆转换器403对各子块的转换系数进行逆转换,复原残差信号,将其输出到加法器404。
预测器202与所述图2的预测编码器104中的预测器202相同,针对各子块的像素信号生成预测信号,将其输出到加法器404。
加法器404对各子块的复原后的残差信号和预测信号进行相加,复原各子块的再现信号,将其输出到块合并器405。
块合并器405根据分割方法p,对各子块的再现信号进行合并,生成对象块的再现信号。
另外,在图1中,针对分割方法1、2、3分别准备分割方法p预测解码器109,但是,在图4所示的零树量化转换系数映射器401、逆量化器402、逆转换器403、预测器202、加法器404和块合并器405分别包含分割方法1~3的功能、且具有通过分割方法来切换处理的功能的情况下,图1的分割方法1预测解码器109a、分割方法2预测解码器109b和分割方法3预测解码器109c能够置换为一个分割方法p预测解码器109。例如,一个分割方法1预测解码器109a发挥3个分割方法p预测解码器109的功能,从分割方法选择器110向分割方法1预测解码器109a输入分割方法的识别信息。不需要分割方法2预测解码器109b和分割方法3预测解码器109c。
接着,使用图5说明由图4的零树量化转换系数映射器401执行的量化转换系数的复原处理。
最初,在S502中,零树量化转换系数映射器401将k的值(子块的识别编号)初始设定为0,将KK的值(对象块内的子块的数量)初始设定为4,在接着的S503中,针对第k个(最初为第0个)子块,取得解码后的树结构的节和叶的状态,并且,取得与状态为1的叶(非零的量化转换系数)对应的量化转换系数的解码值。
然后,在S504中,零树量化转换系数映射器401选择与对象块的分割方法p(p为1~3的值,分割方法1表示图6的4×4,分割方法2表示图7的2×8,分割方法3表示图8的8×2)对应的映射图。在接着的S505中,零树量化转换系数映射器401根据选择出的映射图(图6~图8的树62或72或82),根据树结构的节和叶的状态、以及与状态为1的叶对应的量化转换系数的解码值,复原第k个(最初为第0个)子块的量化转换系数。
接着,在S506中,零树量化转换系数映射器401使k的值增加1个,对第k个(这里为第1个)子块实施上述S503~S505的处理。以后,反复进行S503~S506的处理,直到针对4个子块的处理结束(S507)。
(关于图像解码装置)
图9示出本发明的图像解码装置900的框图。图像解码装置900具有:输入端子901、数据分析器902、零树熵解码器903、非零系数熵解码器904、分割方法熵解码器905、分割方法切换器906以及输出端子907。图9的帧存储器108与所述图1的帧存储器108相同,图9的分割方法p预测解码器109与所述图1的分割方法p预测解码器109相同。
下面,叙述如上所述构成的图像解码装置900的动作。当编码后的比特流被输入到输入端子901后,数据分析器902从比特流中切出对处理对象的对象块进行解码所需要的编码数据。然后,数据分析器902将取得的编码数据分离成残差信号的编码数据(即,对树结构的节和叶的状态进行熵编码而得到的编码数据、以及非零的量化转换系数的编码数据)、以及用于识别分割方法的信息的编码数据,将残差信号的编码数据输出到零树熵解码器903,并且,将分割方法的识别信息的编码数据输出到分割方法熵解码器905。
分割方法熵解码器905对所输入的分割方法的识别信息的编码数据进行解码,复原对象块中的子块分割方法的识别信息。复原后的识别信息被输出到分割方法切换器906。
另一方面,零树熵解码器903使用不依赖于对象块的分割方法的通用的概率模型,对对象块中的各子块的树结构的节和叶的状态进行熵解码。然后,零树熵解码器903向非零系数熵解码器904输出解码后的树结构的节和叶的状态、以及与解码后的叶的状态表示1的量化转换系数(非零的量化转换系数)对应的解码值的编码数据。
非零系数熵解码器904对所输入的非零的量化转换系数的编码数据进行熵解码,复原量化转换系数的值。向分割方法切换器906输出复原后的非零的量化转换系数的解码值、以及所输入的树结构的节和叶的状态。
分割方法切换器906根据分割方法的识别信息,向3个分割方法p预测解码器109中的任意一方输出树结构的节和叶的状态以及各子块的非零的量化转换系数的解码值。
例如,作为分割方法的识别信息,在对分割方法1进行了解码的情况下,树结构的节和叶的状态以及各子块的非零的量化转换系数的解码值被输出到分割方法1预测解码器109a,分割方法1预测解码器109a根据所输入的树结构的节和叶的状态以及各子块的非零的量化转换系数的解码值,复原各子块的量化转换系数。然后,分割方法1预测解码器109a对各子块的量化转换系数进行逆量化,然后进行逆转换,由此,生成再现残差信号。同时,分割方法1预测解码器109a与图1的分割方法1预测编码器104a同样,生成各子块的预测信号。最后,分割方法1预测解码器109a对各子块的再现残差信号和预测信号进行相加,复原再现信号。复原后的再现信号被输出到帧存储器108,保存为在预测处理中使用的参照图像。
在图4和图5中已经说明了图9的分割方法p预测解码器109的动作,所以省略说明。另外,在图9中,针对分割方法1、2、3分别准备分割方法p预测解码器109,但是,在图4所示的零树量化转换系数映射器401、逆量化器402、逆转换器403、预测器202、加法器404和块合并器405分别包含分割方法1~3的功能、且具有通过分割方法来切换处理的功能的情况下,图9的分割方法1预测解码器109a、分割方法2预测解码器109b和分割方法3预测解码器109c能够置换为一个分割方法p预测解码器109。例如,一个分割方法1预测解码器109a发挥3个分割方法p预测解码器109的功能,从分割方法熵解码器905向分割方法1预测解码器109a输入分割方法的识别信息。不需要分割方法2预测解码器109b和分割方法3预测解码器109c。
(关于图像编码方法)
下面,使用图10说明由图像编码装置100执行的图像编码方法的处理。这里,设对象块为8×8像素的块。
首先,在图像编码装置100中,分割方法选择器110将用于识别对象块的分割方法的计数器p初始设定为1(这里,例如设1为4×4像素、2为2×8像素、3为8×2像素),将分割方法的数量PP初始设定为3(S102)。由此,从分割方法选择器110向分割方法切换器103输入分割方法1的选择信号,从分割方法切换器103向分割方法1预测编码器104a输出由块分割器102分割后的对象块。
接着,分割方法1预测编码器104a利用分割方法1将对象块分割成4×4像素的子块(小区域)(S103)。接着,分割方法1预测编码器104a生成各子块的预测信号,对生成预测信号所需要的附加信息进行编码(S104)。接着,分割方法1预测编码器104a针对各子块,生成预测信号与图像信号之间的残差信号,对该残差信号实施转换和量化,生成各子块的量化转换系数(S105)。进而,分割方法1预测编码器104a通过图3所说明的S300的处理,将对象块的量化转换系数映射到树结构的叶,根据各叶的系数值更新树结构的节和叶的状态(S300)。
接着,零树熵编码器105使用不依赖于对象块的分割方法的通用的概率模型,对上述生成的树结构的节和叶的状态进行零树编码,并且,关于状态为1的叶(非零的量化转换系数),对量化转换系数的值进行编码(S106)。
接着,分割方法1预测解码器109a通过图5所说明的S500的处理,关于对象块的各子块,根据树结构的节和叶的状态以及非零的量化转换系数的值,复原各子块的量化转换系数,对各子块的复原后的量化转换系数实施逆量化和逆转换,生成各子块的残差信号。同时,分割方法1预测解码器109a利用与分割方法1预测编码器104a相同的方法生成各子块的预测信号,对该预测信号和上述残差信号进行相加,从而复原各子块的再现信号。这里,图像编码装置100根据规定的计算式(例如,在对编码数据的比特数乘以由量化精度确定的系数而得到的值上,加上从对象块的再现信号中减去图像信号而得到的差分信号的平方和)计算复原后的对象块的再现信号和编码后的编码数据的率失真成本(S107)。
接着,图像编码装置100在计数器p的值中加上1,接着,针对分割方法p(即分割方法2)实施上述S103~S107的处理。
然后,当针对3种分割方法(分割方法1、2、3)完成实施上述S103~S107的处理后,在S108中,计数器p的值成为“4”,在S109中,计数器p的值大于分割方法的数量PP(这里为“3”),进入S110。在该时点,得到各个分割方法1、2、3中的率失真成本。
然后,在S110中,分割方法选择器110从3个分割方法中选择率失真成本最小的分割方法,将关于选择出的分割方法而生成的对象块的再现信号临时存储在帧存储器108中。并且,分割方法熵编码器111对选择出的分割方法的识别信息进行熵编码(S111)。
最后,图像编码装置100从输出端子107输出编码后的分割方法的识别信息、与选择出的分割方法有关的树结构的零树编码数据和非零的量化转换系数的编码数据、以及在预测信号的生成中使用的附加信息的编码数据(S112)。
(关于图像解码方法)
下面,使用图11说明由图像解码装置900执行的图像解码方法的处理。这里,设对象块为8×8像素的块。
首先,在图像解码装置900中,输入压缩数据,数据分析器902提取对象块的编码数据(S902),通过零树熵解码器903、非零系数熵解码器904和分割方法熵解码器905进行上述提取出的数据的熵解码,由此,对对象块的分割方法、与对象块的各子块有关的树结构的节和叶的状态、与对象块的非零的量化转换系数(与在树结构中状态为1的叶对应的系数)对应的解码值、以及预测信号的生成所需要的附加信息(图9中没有示出附加信息)进行解码(S903)。此时,在树结构的节和叶的状态的零树解码中使用不依赖于对象块的分割方法的通用的概率模型。
分割方法p预测解码器109根据复原后的分割方法和附加信息,生成对象块的预测信号(S904)。
接着,分割方法p预测解码器109根据上述解码得到的树结构的节和叶的状态以及与叶的状态表示1的量化转换系数(非零的量化转换系数)对应的解码值,通过图5所示的S500的处理,转换为各子块的量化转换系数。
进而,分割方法p预测解码器109对各子块的量化转换系数实施逆量化和逆转换,复原残差信号(S905)。
最后,分割方法p预测解码器109在复原后的残差信号中加上预测信号,生成各子块的再现信号,对所生成的各子块的再现信号进行合并,复原对象块的再现信号。复原后的再现信号临时存储在帧存储器108中(S906)。
(映射图的变形例)
在图3的S304和图5的S504中,根据对象块的子块分割的方法,从多个映射图中选择在将量化转换系数映射到树结构的叶时使用的映射图,但是,在本发明中,不限于该选择方法。只要是图像解码装置能够识别的信息,则在映射图的选择中还能够利用与对象块或子块有关的附带的属性信息或邻接块的解码信息等。
例如,可以准备根据对象块中的子块的位置、子块的量化系数中的非零系数的数量或非零系数的值、邻接的对象块的分割方法、子块的块形状或像素数等进行分类后的映射图。并且,也可以将它们与分割方法进行组合。进而,也可以在图像编码装置中选择要使用哪个映射图,以帧单位或块单位对该选择信息进行编码。
在图6~图8中,关于3种分割方法,子块内的像素数固定,但是,在子块的数量和子块内的像素数任意的情况下,也能够应用本发明。
在图14~图16中,图14的对象块1401被分割为4个子块,与此相对,图15的对象块1501和图16的对象块1601被分割为3个子块。并且,还包含有子块内的像素数为16个的情况和32个的情况。
在这种情况下,通过使用将对象块内的量化转换系数映射到叶的通用的树结构(图14的树1402、图15的树1502和图16的树1602),能够利用不依赖于对象块的分割方法的1个概率模型来实施零树的编码。
图12是示出在使用对象块单位的树结构的情况下、在图2的量化转换系数零树映射器206中更新树结构的节和叶的状态的处理的流程图S300-2。下面,说明该图12的处理。
最初,在S1201中,量化转换系数零树映射器206将k的值(子块的识别编号)初始设定为0,将KK的值(对象块内的子块的数量)初始设定为4(图14的分割方法1)或3(图15的分割方法4和图16的分割方法5),在S303中,按照光栅扫描顺序取得第0个子块内的量化转换系数。
接着,在S306中,量化转换系数零树映射器206使k的值增加1个,对第k个(这里为第1个)子块实施S303的处理。以后,反复进行S303、S306的处理,直到针对全部子块的S303的处理完成(S307)。
然后,当针对全部子块的S303的处理完成后,在S1202中,量化转换系数零树映射器206选择与对象块的分割方法p(p为1或4或5,参照图14~图16)对应的映射图,在接着的S1203中,根据选择出的映射图(图6~图8的树62或72或82),将对象块内的量化转换系数映射到树结构的叶,然后,根据各叶的系数值更新树结构的节和叶的状态。
这样,根据本发明,即使在对象块内的子块的数量或子块内的像素数不同的情况下,也能够将量化转换系数映射到不依赖于对象块的分割方法的通用的树结构的叶,所以,能够利用相同的树结构和相同的概率模型来进行零树的编码。
另外,在上述映射图的变形例中,对象块的分割方法的种类和数量没有限定。
图13是示出在使用对象块单位的树结构的情况下的图4的零树量化转换系数映射器401中的量化转换系数复原处理的流程图S500-2。下面,说明该图13的处理。
最初,在S1301中,零树量化转换系数映射器401关于对象块内的量化转换系数,取得多个分割方法所通用的树结构的节和叶的状态,在S1302中,选择与对象块的分割方法p(p为1或4或5,参照图14~图16)对应的映射图。
接着,在S1303中,零树量化转换系数映射器401将k的值(子块的识别编号)初始设定为0,将KK的值(对象块内的子块的数量)初始设定为4(图14的分割方法1)或3(图15的分割方法4和图16的分割方法5)。接着,在S1304中,零树量化转换系数映射器401关于与状态为1的树结构的叶对应且第0个子块内的系数,取得解码值,在S1305中,根据在S1302中选择出的映射图,根据树结构中的叶的状态和非零的量化转换系数的解码值,复原子块内的量化系数。
然后,在S506中,零树量化转换系数映射器401使k的值增加1个,对第k个(这里为第1个)子块实施S1304~S1305的处理。以后,反复进行S1304、S1305和S506的处理,直到针对全部子块的S1304~S1305的处理结束(S507)。
另外,在图12~图16的例子中,将对象块内的64个量化转换系数映射到树结构的叶,但是,也可以使用该树结构的一部分,以生成各子块的树结构的方式生成映射图。关于各子块,如果根据块尺寸和形状预先确定要利用的节和叶,则能够使图像编码装置和图像解码装置同样进行动作。
进而,能够一并使用图6~图8所示的子块单位的树结构和图14~图16所示的对象块单位的树结构。例如,可以在画面内预测块中使用子块单位的树结构,在画面间预测块中使用对象块单位的树结构。并且,也可以按照每个对象块决定使用子i位的树结构和对象块单位的树结构中的哪一种,从图像编码装置向图像解码装置发送所使用的树结构的识别信息。
在上述实施方式中,使树结构、以及用于对该树结构的各节和叶的状态进行编码的概率模型不依赖于对象块的分割方法而是通用的,但是,也可以仅使其中一方是通用的。例如可以是,树结构使用不依赖于对象块的分割方法的通用的树结构,但是,用于对树结构的各节和叶的状态进行编码的概率模型定义为按照对象块的每个分割方法而不同。相反,也可以是,所准备的用于对各节和叶的状态进行编码的概率模型不依赖于对象块的分割方法而是通用的,但是,使用按照对象块的每个分割方法而不同的树结构。此时,也可以关于各树结构的节和叶,预先从所准备的一个以上的概率模型中选择要使用的概率模型,以帧级别或块级别对该选择信息进行编码,并从图像编码装置向图像解码装置发送。
(关于图像编码程序、图像解码程序)
图像编码装置的发明能够记载为用于使计算机作为图像编码装置发挥功能的图像编码程序的发明。或者,能够将本实施方式的图像编码方法作为程序存储在记录介质中来提供。并且,图像解码装置的发明能够记载为用于使计算机作为图像解码装置发挥功能的图像解码程序的发明。或者,能够将本实施方式的图像解码方法作为程序存储在记录介质中来提供。
图像编码程序和图像解码程序例如存储在记录介质中来提供。作为记录介质,例示有软盘、CD-ROM、DVD等记录介质、或者ROM等记录介质、或者半导体存储器等。
图19示出用于使计算机作为图像编码装置发挥功能的图像编码程序的模块。如图19所示,图像编码程序P100具有:块分割模块P101、预测编码模块P102、预测解码模块P103、分割方法选择模块P104、存储模块P105、切换模块P106、零树编码模块P107、非零系数编码模块P108、分割方法编码模块P109以及输出模块P110。其中,预测编码模块P102能够记载为一个程序,如图20所示,包含子块分割模块P201、预测模块P202、差分模块P203、转换模块P204、量化模块P205、量化转换系数零树映射模块P206。
通过执行上述各模块而实现的功能与上述图1的图像编码装置100的功能相同。即,在功能方面,图19的块分割模块P101相当于图1的块分割器102,预测编码模块P102相当于分割方法p预测编码器104,预测解码模块P103相当于分割方法p预测解码器109,分割方法选择模块P104相当于分割方法选择器110,存储模块P105相当于帧存储器108,切换模块P106相当于分割方法切换器103,零树编码模块P107相当于零树熵编码器105,非零系数编码模块P108相当于非零系数熵编码器106,分割方法编码模块P109相当于分割方法熵编码器111,输出模块P110相当于输出端子107。并且,图20的子块分割模块P201相当于图2的小区域分割器201,预测模块P202相当于预测器202,差分模块P203相当于差分器203、转换模块P204相当于转换器204,量化模块P205相当于量化器205,量化转换系数零树映射模块P206相当于量化转换系数零树映射器206。
图21示出用于使计算机作为图像解码装置发挥功能的图像解码程序的模块。如图21所示,图像解码程序P900具有:数据分析模块P901、零树解码模块P902、非零系数解码模块P903、切换模块P904、分割方法解码模块P905、预测解码模块P103以及存储模块P105。其中,预测解码模块P103能够记载为一个程序,如图22所示,包含零树量化转换系数映射模块P401、逆量化模块P402、逆转换模块P403、预测模块P202、加法模块P404以及块合并模块P405。
通过执行上述各模块而实现的功能与上述图9的图像解码装置900的功能相同。即,在功能方面,图21的数据分析模块P901相当于图9的数据分析器902,零树解码模块P902相当于零树熵解码器903,非零系数解码模块P903相当于非零系数熵解码器904,切换模块P904相当于分割方法切换器906,分割方法解码模块P905相当于分割方法熵解码器905,预测解码模块P103相当于分割方法p预测解码器109,存储模块P105相当于帧存储器108。并且,图22的零树量化转换系数映射模块P401相当于图4的零树量化转换系数映射器401,逆量化模块P402相当于逆量化器402,逆转换模块P403相当于逆转换器403,预测模块P202相当于预测器202,加法模块P404相当于加法器404,块合并模块P405相当于块合并器405。
如上所述构成的图像编码程序P100和图像解码程序P900存储在图17所示的记录介质10中,由后述的计算机30来执行。
图17是示出用于执行记录在记录介质中的程序的计算机的硬件结构的图,图18是用于执行存储在记录介质中的程序的计算机的立体图。作为计算机,包含具有CPU并进行基于软件的处理和控制的DVD播放器、机顶盒、便携电话等。
如图17所示,计算机30具有:软盘驱动装置、CD-ROM驱动装置、DVD驱动装置等读取装置12;使操作系统常驻的作业用存储器(RAM)14;存储记录介质10所存储的程序的存储器16;被称为显示器的显示装置18;作为输入装置的鼠标20和键盘22;用于进行数据等的收发的通信装置24;以及控制程序的执行的CPU 26。在将记录介质10插入到读取装置12中时,计算机30能够从读取装置12访问存储在记录介质10中的图像编码程序P100和图像解码程序P900,通过该图像编码程序P100和图像解码程序P900,能够作为本发明的图像编码装置或图像解码装置来动作。
如图18所示,图像编码程序或图像解码程序也可以作为叠加在载波中的计算机数据信号40而经由网络提供。在该情况下,计算机30将通过通信装置24接收到的图像编码程序或图像解码程序存储在存储器16中,能够执行该图像编码程序或图像解码程序。
根据以上说明的本实施方式,能够利用通用的树结构对通过多个分割方法生成的预测信号实施零树编码,所以,能够以适当的预测块的尺寸和形状进行预测处理,且能够高效地实施残差信号的熵编码。
标号说明
101、901:输入端子;102:块分割器;103:分割方法切换器;104a:分割方法1预测编码器;104b:分割方法2预测编码器;104c:分割方法3预测编码器;105:零树熵编码器;106:非零系数熵编码器;107、907:输出端子;108:帧存储器;109a:分割方法1预测解码器;109b:分割方法2预测解码器;109c:分割方法3预测解码器;110:分割方法选择器;111:分割方法熵编码器;201:小区域分割器;202:预测器;203:差分器;204:转换器;205:量化器;206:量化转换系数零树映射器;401:零树量化转换系数映射器;402:逆量化器;403:逆转换器;404:加法器;405:块合并器;902:数据分析器;903:零树熵解码器;904:非零系数熵解码器;905:分割方法熵解码器;906:分割方法切换器。

Claims (12)

1.一种图像编码装置,其特征在于具有:
区域分割单元,其将输入图像分割成多个区域;
分割方法选择单元,其从多个分割方法中选择所述多个区域中作为处理对象的对象区域的分割方法;
分割方法编码单元,其对识别所述选择出的分割方法的信息进行编码;
小区域分割单元,其利用所述选择出的分割方法将所述对象区域分割成多个小区域;
预测单元,其生成针对所述小区域所包含的像素信号的预测信号;
残差信号生成单元,其生成所述小区域的预测信号与像素信号之间的残差信号;
转换单元,其对所述小区域的残差信号进行频率转换,生成转换系数;
量化单元,其对所述小区域的转换系数进行量化,生成量化转换系数;
零树映射单元,其准备所述多个分割方法所通用的树结构,从用于将所述小区域的量化转换系数映射到所述树结构的叶的多个映射图中,选择根据所述小区域的属性信息确定的一个映射图,根据所述选择出的映射图,将所述小区域的量化转换系数映射到所述树结构的叶,根据各叶的系数值更新所述树结构的节和叶的状态;
零树编码单元,其利用所述多个分割方法所通用的概率模型对所述树结构的节和叶的状态进行熵编码;
非零系数编码单元,其对所述小区域的非零的量化转换系数进行熵编码;以及
输出单元,其输出识别所述选择出的分割方法的信息的编码数据、所述树结构的节和叶的状态的编码数据以及所述小区域的非零的量化转换系数的编码数据。
2.根据权利要求1所述的图像编码装置,其特征在于,
所述小区域的属性信息是所述对象区域的所述选择出的分割方法。
3.一种图像解码装置,其特征在于具有:
数据分析单元,其从压缩数据中提取指示作为处理对象的对象区域的分割方法的编码数据和对所述对象区域进行分割得到的小区域的残差信号的编码数据;
分割方法解码单元,其根据指示对象区域的分割方法的编码数据,对从多个分割方法中识别所述对象区域的分割方法的信息进行熵解码;
零树解码单元,其准备所述分割方法所通用的树结构,根据所述小区域的残差信号的编码数据,利用所述多个分割方法所通用的概率模型对所述树结构的节和叶的状态进行熵解码;
非零系数解码单元,其根据所述小区域的残差信号的编码数据,对所述解码后的树结构的叶的状态为1的量化转换系数的解码值进行熵解码;
零树量化转换系数映射单元,其从用于将所述小区域的量化转换系数映射到所述树结构的叶的多个映射图中,选择根据所述小区域的已解码属性信息确定的一个映射图,根据所述选择出的映射图,将所述解码后的树结构的节和叶的状态以及所述解码后的小区域的量化转换系数的解码值复原成所述小区域的再现量化转换系数;
逆量化单元,其对所述小区域的再现量化转换系数进行逆量化,生成再现频率转换系数;
逆转换单元,其对所述小区域的再现频率转换系数进行逆转换,复原再现残差信号;
预测单元,其生成针对所述小区域所包含的像素信号的预测信号;以及
图像复原单元,其通过对所述小区域的所述预测信号和所述再现残差信号进行相加,复原所述小区域的像素信号。
4.根据权利要求3所述的图像解码装置,其特征在于,
所述小区域的已解码属性信息是解码后的所述对象区域的分割方法。
5.一种图像编码装置,其特征在于具有:
区域分割单元,其将输入图像分割成多个区域;
分割方法选择单元,其从多个分割方法中选择所述多个区域中作为处理对象的对象区域的分割方法;
分割方法编码单元,其对识别所述选择出的分割方法的信息进行编码;
小区域分割单元,其利用所述选择出的分割方法将所述对象区域分割成多个小区域;
预测单元,其生成针对所述对象区域的各小区域所包含的像素信号的预测信号;
残差信号生成单元,其生成所述对象区域的各小区域的预测信号与像素信号之间的残差信号;
转换单元,其对所述对象区域的各小区域的残差信号进行频率转换,生成转换系数;
量化单元,其对所述对象区域的各小区域的转换系数进行量化,生成量化转换系数;
零树映射单元,其准备所述多个分割方法所通用的树结构,从用于将所述对象区域内的量化转换系数映射到所述树结构的叶的多个映射图中,选择根据所述对象区域的属性信息确定的一个映射图,根据所述选择出的映射图,将所述对象区域内的量化转换系数映射到所述树结构的叶,根据各叶的系数值更新所述树结构的节和叶的状态;
零树编码单元,其利用所述多个分割方法所通用的概率模型对所述树结构的节和叶的状态进行熵编码;
非零系数编码单元,其对所述对象区域的各小区域的非零的量化转换系数进行熵编码;以及
输出单元,其输出识别所述选择出的分割方法的信息的编码数据、所述树结构的节和叶的状态的编码数据以及所述对象区域的各小区域的非零的量化转换系数的编码数据。
6.根据权利要求5所述的图像编码装置,其特征在于,
所述对象区域的属性信息是所述对象区域的所述选择出的分割方法。
7.一种图像解码装置,其特征在于具有:
数据分析单元,其从压缩数据中提取指示作为处理对象的对象区域的分割方法的编码数据和所述对象区域的残差信号的编码数据;
分割方法解码单元,其根据指示对象区域的分割方法的编码数据,对从多个分割方法中识别所述对象区域的分割方法的信息进行熵解码;
零树解码单元,其准备所述分割方法所通用的树结构,根据所述对象区域的残差信号的编码数据,利用所述多个分割方法所通用的概率模型对所述树结构的节和叶的状态进行熵解码;
非零系数解码单元,其根据所述对象区域的残差信号的编码数据,对所述解码后的树结构的叶的状态为1的量化转换系数的解码值进行熵解码;
零树量化转换系数映射单元,其从用于将所述对象区域的量化转换系数映射到所述树结构的叶的多个映射图中,选择根据所述对象区域的已解码属性信息确定的一个映射图,根据所述选择出的映射图,将所述解码后的树结构的节和叶的状态以及所述解码后的对象区域的量化转换系数的解码值转换成所述对象区域的各小区域的再现量化转换系数;
逆量化单元,其对所述对象区域的各小区域的再现量化转换系数进行逆量化,生成再现频率转换系数;
逆转换单元,其对所述对象区域的各小区域的再现频率转换系数进行逆转换,复原再现残差信号;
预测单元,其生成针对所述对象区域的小区域所包含的像素信号的预测信号;
图像复原单元,其通过对所述对象区域的各小区域的所述预测信号和所述再现残差信号进行相加,复原所述对象区域的各小区域的像素信号,生成再现图像信号;以及
区域合并单元,其通过对所述对象区域的各小区域的再现图像信号进行合并,生成所述对象区域的再现图像信号。
8.根据权利要求7所述的图像解码装置,其特征在于,
所述对象区域的已解码属性信息是解码后的所述对象区域的分割方法。
9.一种由图像编码装置执行的图像编码方法,其特征在于具有以下步骤:
区域分割步骤,将输入图像分割成多个区域;
分割方法选择步骤,从多个分割方法中选择所述多个区域中作为处理对象的对象区域的分割方法;
分割方法编码步骤,对识别所述选择出的分割方法的信息进行编码;
小区域分割步骤,利用所述选择出的分割方法将所述对象区域分割成多个小区域;
预测步骤,生成针对所述小区域所包含的像素信号的预测信号;
残差信号生成步骤,生成所述小区域的预测信号与像素信号之间的残差信号;
转换步骤,对所述小区域的残差信号进行频率转换,生成转换系数;
量化步骤,对所述小区域的转换系数进行量化,生成量化转换系数;
零树映射步骤,准备所述多个分割方法所通用的树结构,从用于将所述小区域的量化转换系数映射到所述树结构的叶的多个映射图中,选择根据所述对象区域的所述选择出的分割方法确定的一个映射图,根据所述选择出的映射图,将所述小区域的量化转换系数映射到所述树结构的叶,根据各叶的系数值更新所述树结构的节和叶的状态;
零树编码步骤,利用所述多个分割方法所通用的概率模型对所述树结构的节和叶的状态进行熵编码;
非零系数编码步骤,对所述小区域的非零的量化转换系数进行熵编码;以及
输出步骤,输出识别所述选择出的分割方法的信息的编码数据、所述树结构的节和叶的状态的编码数据以及所述小区域的非零的量化转换系数的编码数据。
10.一种由图像解码装置执行的图像解码方法,其特征在于具有以下步骤:
数据分析步骤,从压缩数据中提取指示作为处理对象的对象区域的分割方法的编码数据和对所述对象区域进行分割得到的小区域的残差信号的编码数据;
分割方法解码步骤,根据指示对象区域的分割方法的编码数据,对从多个分割方法中识别所述对象区域的分割方法的信息进行熵解码;
零树解码步骤,准备所述分割方法所通用的树结构,根据所述小区域的残差信号的编码数据,利用所述多个分割方法所通用的概率模型对所述树结构的节和叶的状态进行熵解码;
非零系数解码步骤,根据所述小区域的残差信号的编码数据,对所述解码后的树结构的叶的状态为1的量化转换系数的解码值进行熵解码;
零树量化转换系数映射步骤,从用于将所述小区域的量化转换系数映射到所述树结构的叶的多个映射图中,选择根据所述解码后的所述对象区域的分割方法确定的一个映射图,根据所述选择出的映射图,将所述解码后的树结构的节和叶的状态以及所述解码后的小区域的量化转换系数的解码值复原成所述小区域的再现量化转换系数;
逆量化步骤,对所述小区域的再现量化转换系数进行逆量化,生成再现频率转换系数;
逆转换步骤,对所述小区域的再现频率转换系数进行逆转换,复原再现残差信号;
预测步骤,生成针对所述小区域所包含的像素信号的预测信号;以及
图像复原步骤,通过对所述小区域的所述预测信号和所述再现残差信号进行相加,复原所述小区域的像素信号。
11.一种由图像编码装置执行的图像编码方法,其特征在于具有以下步骤:
区域分割步骤,将输入图像分割成多个区域;
分割方法选择步骤,从多个分割方法中选择所述多个区域中作为处理对象的对象区域的分割方法;
分割方法编码步骤,对识别所述选择出的分割方法的信息进行编码;
小区域分割步骤,利用所述选择出的分割方法将所述对象区域分割成多个小区域;
预测步骤,生成针对所述对象区域的各小区域所包含的像素信号的预测信号;
残差信号生成步骤,生成所述对象区域的各小区域的预测信号与像素信号之间的残差信号;
转换步骤,对所述对象区域的各小区域的残差信号进行频率转换,生成转换系数;
量化步骤,对所述对象区域的各小区域的转换系数进行量化,生成量化转换系数;
零树映射步骤,准备所述多个分割方法所通用的树结构,从用于将所述对象区域内的量化转换系数映射到所述树结构的叶的多个映射图中,选择根据所述对象区域的所述选择出的分割方法确定的一个映射图,根据所述选择出的映射图,将所述对象区域内的量化转换系数映射到所述树结构的叶,根据各叶的系数值更新所述树结构的节和叶的状态;
零树编码步骤,利用所述多个分割方法所通用的概率模型对所述树结构的节和叶的状态进行熵编码;
非零系数编码步骤,对所述对象区域的各小区域的非零的量化转换系数进行熵编码;以及
输出步骤,输出识别所述选择出的分割方法的信息的编码数据、所述树结构的节和叶的状态的编码数据以及所述对象区域的各小区域的非零的量化转换系数的编码数据。
12.一种由图像解码装置执行的图像解码方法,其特征在于具有以下步骤:
数据分析步骤,从压缩数据中提取指示作为处理对象的对象区域的分割方法的编码数据和所述对象区域的残差信号的编码数据;
分割方法解码步骤,根据指示对象区域的分割方法的编码数据,对从多个分割方法中识别所述对象区域的分割方法的信息进行熵解码;
零树解码步骤,准备所述分割方法所通用的树结构,根据所述对象区域的残差信号的编码数据,利用所述多个分割方法所通用的概率模型对所述树结构的节和叶的状态进行熵解码;
非零系数解码步骤,根据所述对象区域的残差信号的编码数据,对所述解码后的树结构的叶的状态为1的量化转换系数的解码值进行熵解码;
零树量化转换系数映射步骤,从用于将所述对象区域的量化转换系数映射到所述树结构的叶的多个映射图中,选择根据所述解码后的所述对象区域的分割方法确定的一个映射图,根据所述选择出的映射图,将所述解码后的树结构的节和叶的状态以及所述解码后的对象区域的量化转换系数的解码值转换成所述对象区域的各小区域的再现量化转换系数;
逆量化步骤,对所述对象区域的各小区域的再现量化转换系数进行逆量化,生成再现频率转换系数;
逆转换步骤,对所述对象区域的各小区域的再现频率转换系数进行逆转换,复原再现残差信号;
预测步骤,生成针对所述对象区域的小区域所包含的像素信号的预测信号;
图像复原步骤,通过对所述对象区域的各小区域的所述预测信号和所述再现残差信号进行相加,复原所述对象区域的各小区域的像素信号,生成再现图像信号;以及
区域合并步骤,通过对所述对象区域的各小区域的再现图像信号进行合并,生成所述对象区域的再现图像信号。
CN200980155740.XA 2009-02-18 2009-12-25 图像编码装置、方法和程序以及图像解码装置、方法和程序 Active CN102301691B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2009035339A JP5001964B2 (ja) 2009-02-18 2009-02-18 画像符号化装置、方法およびプログラム、並びに、画像復号装置、方法およびプログラム
JP2009-035339 2009-02-18
PCT/JP2009/071671 WO2010095341A1 (ja) 2009-02-18 2009-12-25 画像符号化装置、方法およびプログラム、並びに、画像復号装置、方法およびプログラム

Publications (2)

Publication Number Publication Date
CN102301691A CN102301691A (zh) 2011-12-28
CN102301691B true CN102301691B (zh) 2014-04-02

Family

ID=42633633

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200980155740.XA Active CN102301691B (zh) 2009-02-18 2009-12-25 图像编码装置、方法和程序以及图像解码装置、方法和程序

Country Status (7)

Country Link
US (1) US8542936B2 (zh)
EP (2) EP2400738A4 (zh)
JP (1) JP5001964B2 (zh)
CN (1) CN102301691B (zh)
ES (1) ES2563743T3 (zh)
TW (1) TWI496438B (zh)
WO (1) WO2010095341A1 (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5001964B2 (ja) 2009-02-18 2012-08-15 株式会社エヌ・ティ・ティ・ドコモ 画像符号化装置、方法およびプログラム、並びに、画像復号装置、方法およびプログラム
DK3958573T3 (da) 2010-04-13 2023-08-28 Ge Video Compression Llc Videokodning ved anvendelse af multitræsunderinddeling af billeder
BR122020007921B1 (pt) 2010-04-13 2021-08-03 Ge Video Compression, Llc Predição interplano
KR102360005B1 (ko) 2010-04-13 2022-02-08 지이 비디오 컴프레션, 엘엘씨 샘플 영역 병합
SI3697089T1 (sl) 2010-04-13 2022-01-31 Ge Video Compression, Llc Dedovanje v večdrevesni razčlenitvi niza vzorcev
CN103348383B (zh) * 2010-11-26 2016-02-24 皇家飞利浦电子股份有限公司 图像处理装置
JP6056122B2 (ja) 2011-01-24 2017-01-11 ソニー株式会社 画像符号化装置と画像復号装置およびその方法とプログラム
CN102176750B (zh) * 2011-03-10 2012-12-26 西安电子科技大学 高性能自适应二进制算术编码器
EP3598754B1 (en) 2011-12-15 2021-03-17 Tagivan Ii Llc Signaling of luminance-chrominance coded block flags (cbf) in video coding
CN103209323A (zh) * 2012-12-26 2013-07-17 辽宁师范大学 基于k阶零树间向量的图像压缩方法
CN104104958B (zh) * 2013-04-08 2017-08-25 联发科技(新加坡)私人有限公司 图像解码方法及其图像解码装置
JP6528765B2 (ja) * 2014-03-28 2019-06-12 ソニー株式会社 画像復号装置および方法
KR20180040514A (ko) * 2015-09-10 2018-04-20 삼성전자주식회사 부호화 장치, 복호화 장치 및 그 부호화 방법 및 복호화 방법
WO2017043763A1 (ko) * 2015-09-10 2017-03-16 삼성전자 주식회사 부호화 장치, 복호화 장치, 그 부호화 및 복호화 방법
CN106888380B (zh) * 2017-01-04 2019-05-03 西安万像电子科技有限公司 图像中文字块的编码方法及装置
JP7285789B2 (ja) * 2018-01-19 2023-06-02 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
CN109660803A (zh) * 2019-01-22 2019-04-19 西安电子科技大学 一种编码块的量化方法及用于hevc编码的量化方法
CN111191386B (zh) * 2020-01-20 2023-04-14 浙江省森林资源监测中心 一种多尺度相容的林木年生长模型组建模方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19503571A1 (de) * 1994-09-27 1996-03-28 Samsung Electronics Co Ltd Bildkompressionsverfahren und -vorrichtung unter Verwendung eines bedingten Viergruppenbaumunterteilungssystems
WO1998036632A2 (en) * 1997-02-12 1998-08-27 Sarnoff Corporation Apparatus and method for encoding wavelet trees generated by a wavelet-based coding method
WO2003094529A3 (de) * 2002-05-02 2004-04-08 Fraunhofer Ges Forschung Verfahren von transformations-koeffizienten in bild-oder videokodierern

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6084908A (en) * 1995-10-25 2000-07-04 Sarnoff Corporation Apparatus and method for quadtree based variable block size motion estimation
DE10022331A1 (de) * 2000-05-10 2001-11-15 Bosch Gmbh Robert Verfahren zur Transformationscodierung von Bewegtbildsequenzen
US6765964B1 (en) 2000-12-06 2004-07-20 Realnetworks, Inc. System and method for intracoding video data
US7003035B2 (en) 2002-01-25 2006-02-21 Microsoft Corporation Video coding methods and apparatuses
US7660475B2 (en) 2004-12-22 2010-02-09 Ntt Docomo, Inc. Method and apparatus for coding positions of coefficients
TWI300311B (en) * 2005-11-22 2008-08-21 Aspeed Technology Inc Progressive differential motion jpeg codec
TWI304303B (en) * 2006-01-04 2008-12-11 Sunplus Technology Co Ltd Apparatus for image encoding and the method thereof
JP5001964B2 (ja) 2009-02-18 2012-08-15 株式会社エヌ・ティ・ティ・ドコモ 画像符号化装置、方法およびプログラム、並びに、画像復号装置、方法およびプログラム
US8406546B2 (en) * 2009-06-09 2013-03-26 Sony Corporation Adaptive entropy coding for images and videos using set partitioning in generalized hierarchical trees
US8620098B2 (en) * 2009-06-09 2013-12-31 Sony Corporation Trees for adaptive coding of images and videos using set partitioning in generalized hierarchical trees having directionality
KR20210063483A (ko) * 2009-07-02 2021-06-01 인터디지털 브이씨 홀딩스 인코포레이티드 적응적 트리 선택을 사용한 이진 집합의 비디오 인코딩 및 디코딩을 위한 방법 및 장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19503571A1 (de) * 1994-09-27 1996-03-28 Samsung Electronics Co Ltd Bildkompressionsverfahren und -vorrichtung unter Verwendung eines bedingten Viergruppenbaumunterteilungssystems
WO1998036632A2 (en) * 1997-02-12 1998-08-27 Sarnoff Corporation Apparatus and method for encoding wavelet trees generated by a wavelet-based coding method
WO2003094529A3 (de) * 2002-05-02 2004-04-08 Fraunhofer Ges Forschung Verfahren von transformations-koeffizienten in bild-oder videokodierern

Also Published As

Publication number Publication date
EP2400738A4 (en) 2012-09-05
US8542936B2 (en) 2013-09-24
US20110299788A1 (en) 2011-12-08
TWI496438B (zh) 2015-08-11
EP2615820A1 (en) 2013-07-17
CN102301691A (zh) 2011-12-28
JP2010193162A (ja) 2010-09-02
WO2010095341A1 (ja) 2010-08-26
TW201032596A (en) 2010-09-01
ES2563743T3 (es) 2016-03-16
JP5001964B2 (ja) 2012-08-15
EP2400738A1 (en) 2011-12-28
EP2615820B1 (en) 2015-11-25

Similar Documents

Publication Publication Date Title
CN102301691B (zh) 图像编码装置、方法和程序以及图像解码装置、方法和程序
CN102396229B (zh) 图像编码装置、方法以及图像解码装置、方法
CN102227911B (zh) 图像预测编码装置和方法、图像预测解码装置和方法、以及编码/解码系统和方法
CN102017637B (zh) 图像预测编码装置、图像预测编码方法、图像预测编码程序、图像预测解码装置、图像预测解码方法以及图像预测解码程序
CN107105239B (zh) 图像预测解码装置、图像预测解码方法
CN102027746B (zh) 动态图像编码装置、动态图像解码装置、动态图像编码方法、动态图像解码方法
CN103339940B (zh) 运动图像编码方法以及运动图像解码方法
CN102172029A (zh) 动态图像编码装置、动态图像解码装置、动态图像编码方法、动态图像解码方法、动态图像编码程序、动态图像解码程序、以及动态图像编码解码系统
RU2509439C2 (ru) Способ и устройство кодирования и декодирования, сигнал, носитель данных и продукты компьютерной программы
CN1843039B (zh) 用于使用描述性模型参数来编码并解码增强层数据的系统和方法
CN103747263A (zh) 图像预测编码装置和方法以及图像预测解码装置和方法
CN101433094A (zh) 图像预测编码装置、图像预测编码方法、图像预测编码程序、图像预测解码装置、图像预测解码方法以及图像预测解码程序
CN106131558A (zh) 动态图像的预测编码装置和方法、预测解码装置和方法
CN103416063B (zh) 运动图像解码装置及运动图像解码方法
CN105681811A (zh) 解码装置、编码装置
US10469874B2 (en) Method for encoding and decoding a media signal and apparatus using the same
Li et al. Progressive compression of 3d graphic models
CN106851301A (zh) 动态图像预测解码方法、动态图像预测解码装置
KR20220079996A (ko) 비디오 인코딩 및 비디오 디코딩
CN100544438C (zh) 信号变换、逆变换方法和图象编码、译码装置及方法
Li Progressive compression of 3 D graphics
TW202431856A (zh) 編解碼方法、碼流、編碼器、解碼器以及儲存媒介
CN105933709A (zh) 运动图像编码方法以及运动图像解码方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant