CN113411579A - 图像解码装置及其方法、图像编码装置及其方法 - Google Patents

图像解码装置及其方法、图像编码装置及其方法 Download PDF

Info

Publication number
CN113411579A
CN113411579A CN202110687870.0A CN202110687870A CN113411579A CN 113411579 A CN113411579 A CN 113411579A CN 202110687870 A CN202110687870 A CN 202110687870A CN 113411579 A CN113411579 A CN 113411579A
Authority
CN
China
Prior art keywords
transform
unit
flag
amt
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110687870.0A
Other languages
English (en)
Other versions
CN113411579B (zh
Inventor
猪饲知宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
FG Innovation Co Ltd
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by FG Innovation Co Ltd, Sharp Corp filed Critical FG Innovation Co Ltd
Priority to CN202110687870.0A priority Critical patent/CN113411579B/zh
Publication of CN113411579A publication Critical patent/CN113411579A/zh
Application granted granted Critical
Publication of CN113411579B publication Critical patent/CN113411579B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • H04N19/45Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder performing compensation of the inverse transform mismatch, e.g. Inverse Discrete Cosine Transform [IDCT] mismatch
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明避免伴随进行二次变换以及自适应核变换双方而带来的浪费的产生。具备:核变换部(1521),对编码树单元进行自适应核变换;以及二次变换部(1522),在自适应核变换之前对编码树单元所包含的子块中至少任一个子块进行二次变换,根据与自适应核变换有关的标志以及与二次变换有关的标志中的至少任一个或编码树单元的尺寸,省略自适应核变换或二次变换中的任一个。

Description

图像解码装置及其方法、图像编码装置及其方法
技术领域
本发明涉及一种对表示图像的编码数据进行解码的图像解码装置、通过对图像进行编码而生成编码数据的图像编码装置。
背景技术
为了高效地传输或记录运动图像,使用通过对运动图像进行编码而生成编码数据的运动图像编码装置、以及通过对该编码数据进行解码而生成解码图像的运动图像解码装置。
作为具体的运动图像编码方式,例如可列举出在H.264/MPEG-4.AVC、作为其后继编解码器的HEVC(High-Efficiency Video Coding:高效视频编码)中提出的方式(非专利文献1)等。
在这种运动图像编码方式中,构成运动图像的图像(图片)被由通过对图像进行分割而获得的切片(slice)、通过对切片进行分割而获得的编码单元(Coding Unit)、以及构成编码单元的预测单元(PU)、变换单元(TU)形成的分层结构管理,通常按块进行编码/解码。
此外,在这种运动图像编码方式中,通常,基于通过对输入图像进行编码/解码而获得的局部解码图像而生成预测图像,对从输入图像(原图像)中减去该预测图像而获得的预测残差(有时也称为“差分图像”或“残差图像”)进行编码。此外,作为预测图像的生成方法,可列举出画面间预测(帧间预测)以及画面内预测(帧内预测)。
在非专利文献1中,已知有通过使用四叉树分割实现上述编码单元以及变换单元,来选择自由度高的块尺寸,取得代码量与精度的平衡的技术。
现有技术文献
非专利文献
非专利文献1:ITU-T Rec.H.265(V2),2014年10月29日公开
发明内容
发明要解决的问题
然而,上述这样的现有技术中存在如下问题:有更高效地进行针对TU的预测残差的复原的余地。
本发明是鉴于所述的问题点而完成的,其目的在于,实现能更高效地进行针对TU的预测残差的复原的图像解码装置以及图像编码装置。
技术方案
为了解决上述问题,本发明的一方案的图像解码装置将图片分割为编码树单元而进行解码,所述图像解码装置具备:第一变换部,构成为能对上述编码树单元应用第一变换;以及第二变换部,构成为能在上述第一变换之前对上述编码树单元所包含的子块中至少任一个子块应用第二变换,根据与上述第一变换有关的第一标志以及与上述第二变换有关的第二标志中的至少任一个或上述编码树单元的尺寸,省略由上述第一变换部或上述第二变换部中的任一个进行的变换。
此外,本发明的一方案的图像解码装置将图片分割为编码树单元而进行解码,所述图像解码装置具备:第一变换部,对上述编码树单元应用第一变换;以及第二变换部,在上述第一变换之前对上述编码树单元所包含的子块中至少任一个子块应用第二变换,上述第二变换部对第一区域和第二区域应用上述第二变换,所述第一区域由上述编码树单元内的低频侧的子块构成,所述第二区域构成为包含与该第一区域邻接且与上述编码树单元的边界邻接的边界邻接子块,不包含从所述边界的相反侧与该边界邻接子块邻接的子块。
此外,本发明的一方案的图像编码装置将图片分割为编码树单元而进行编码,所述图像编码装置具备:第一变换部,构成为能对上述编码树单元应用第一变换;以及第二变换部,构成为能在上述第一变换之后对上述编码树单元所包含的子块中至少任一个子块应用第二变换,根据与上述第一变换有关的第一标志以及与上述第二变换有关的第二标志中的至少任一个或上述编码树单元的尺寸,省略由上述第一变换部或上述第二变换部中的任一个进行的变换。
有益效果
根据本发明的一方案,起到能更高效且有效地进行针对TU的预测残差的复原的效果。
附图说明
图1是表示本发明的一实施方式的运动图像解码装置所具备的CU信息解码部以及解码模块的构成例的功能框图。
图2是表示上述运动图像解码装置的概略构成的功能框图。
图3是表示由本发明的一实施方式的运动图像编码装置生成、由上述运动图像解码装置解码的编码数据的数据构成的图,图3(a)~图3(d)是分别表示图片层、切片层、树单元层、编码树层以及编码单元层(CU层)的图。
图4是表示PU分割类型的模式的图。图4(a)~图4(h)分别表示PU分割类型为2N×2N、2N×N、2N×nU、2N×nD、N×2N、nL×2N、nR×2N、以及N×N的情况的分区形状。
图5是对发明的一实施方式的CT信息解码部(CTU信息解码S1300、CT信息解码S1400)的概略动作进行说明的流程图。
图6是对发明的一实施方式的CU解码部(CU解码S1500)、CU信息解码部21(CU信息解码S1510)、PU信息解码部(PU信息解码S1600)、TT信息解码部(TT信息解码S1700)的概略动作进行说明的流程图。
图7是对发明的一实施方式的TT信息解码部(TT信息解码S1700)的概略动作进行说明的流程图。
图8是对发明的一实施方式的TU信息解码部(TU信息解码S1760)的概略动作进行说明的流程图。
图9是表示本发明的一实施方式的CT信息的语法表的构成例的图。
图10是表示本发明的一实施方式的CU信息、PT信息PTI、TT信息TTI的语法表的构成例的图。
图11是表示本发明的一实施方式的PU信息PUI的语法表的构成例的图。
图12是表示本发明的一实施方式的TT信息TTI的语法表的构成例的图。
图13是表示本发明的一实施方式的TU信息TUI的语法表的构成例的图。
图14是表示本发明的一实施方式的逆量化/逆变换部的构成例的功能框图。
图15是表示本发明的一实施方式的变换集表的构成例的图。
图16是表示规定基于帧内预测模式选择的变换子集的表的构成例的图。
图17是表示本发明的一实施方式的逆变换部的构成例的功能框图。
图18是表示发明的一实施方式的逆变换部的构成例的功能框图。
图19是表示图17的二次变换部进行非分离型变换的情况的构成例的图。
图20是表示图17的二次变换部进行分离型变换的情况的构成例的图。
图21是表示本发明的一实施方式的CU信息、PT信息PTI、TT信息TTI的语法表的构成例的图。
图22是对发明的一实施方式的TT信息解码部(TT信息解码S1700)的概略动作进行说明的流程图。
图23是对发明的另一实施方式的TT信息解码部(TT信息解码S1700)的概略动作进行说明的流程图。
图24是表示本发明的一实施方式的TT信息TTI的语法表的构成例的图。
图25是对发明的一实施方式的TU信息解码部(TU信息解码S1760)的概略动作进行说明的流程图。
图26(a)是表示本发明的一实施方式的TU信息TUI的语法表的构成例的图,图26(b)是amt_idx、sec_idx的解码部分的伪代码描述。
图27是表示发明的一实施方式的TT信息解码部以及逆变换部的构成的一个例子的功能框图。
图28是表示本发明的一实施方式的TT信息解码部以及逆变换部的构成的一个例子的功能框图。
图29是表示以TU级别对amt_idx进行解码的本发明的一实施方式的TT信息TTI的语法表的构成例的图。
图30(a)是表示本发明的一实施方式的TU信息TUI的语法表的构成例的图,图30(b)是amt_idx解码部分的伪代码描述。
图31是表示发明的另一实施方式的TT信息解码部以及逆变换部的构成的一个例子的功能框图。
图32(a)是表示本发明的一实施方式的TT信息TTI的语法表的构成例的图,图32(b)是amt_flag解码部分的伪代码描述。
图33(a)是表示本发明的一实施方式的TT信息TTI的语法表的构成例的图,图33(b)是amt_flag解码部分的伪代码描述。
图34(a)是表示本发明的一实施方式的TU信息TUI的语法表的构成例的图,图34(b)是amt_idx解码部分的伪代码描述。
图35是表示本发明的一实施方式的TT信息解码部以及逆变换部的构成的一个例子的功能框图。
图36是表示本发明的一实施方式的TT信息解码部以及逆变换部的构成的一个例子的功能框图。
图37是表示本发明的一实施方式的TT信息解码部以及逆变换部的构成的一个例子的功能框图。
图38(a)是表示本发明的一实施方式的TU信息TUI的语法表的构成例的图,图38(b)是sec_idx和amt_idx的解码部分的伪代码描述。
图39是表示本发明的一实施方式的TT信息解码部以及逆变换部的构成的一个例子的功能框图。
图40(a)是表示本发明的一实施方式的TU信息TUI的语法表的构成例的图,图40(b)是amt_idx和sec_idx的伪代码描述。
图41是表示本发明的一实施方式的TT信息解码部以及逆变换部的构成的一个例子的功能框图。
图42(a)是表示本发明的一实施方式的TT信息TTI的语法表的构成例的图,图42(b)是sec_idx解码部分的伪代码描述。
图43(a)是表示本发明的一实施方式的TU信息TUI的语法表的构成例的图,图43(b)是sec_idx解码部分的伪代码描述。
图44是对本发明的一实施方式的二次变换部应用二次变换的子块进行说明的图。
图45是对本发明的一实施方式的二次变换部应用二次变换的子块进行说明的图。
图46是对本发明的一实施方式的二次变换部应用二次变换的子块进行说明的图。
图47是对本发明的一实施方式的二次变换部应用二次变换的子块进行说明的图。
图48是表示本发明的一实施方式的运动图像编码装置的概略构成的功能框图。
图49是表示搭载有上述运动图像编码装置的发送装置、以及搭载有上述运动图像解码装置的接收装置的构成的图。图49(a)表示搭载有运动图像编码装置的发送装置,图49(b)表示搭载有运动图像解码装置的接收装置。
图50是表示搭载有上述运动图像编码装置的记录装置、以及搭载有上述运动图像解码装置的再现装置的构成的图。图50(a)表示搭载有运动图像编码装置的记录装置,图50(b)表示搭载有运动图像解码装置的再现装置。
图51是表示按TU导出AMT索引amt_idx的例子的图。
图52是表示按CU导出与二次变换有关的索引sec_idx的例子的图。
图53是表示按TU导出与二次变换有关的索引sec_idx的例子的图。
图54(a)是二次变换集索引secTrSetIdx,图54(b)是二次变换集表SecTrSet。
具体实施方式
〔实施方式1〕
参照图1~图43,对本发明的一实施方式进行说明。首先,参照图2,对运动图像解码装置(图像解码装置)1以及运动图像编码装置(图像编码装置)2的概要进行说明。图2是表示运动图像解码装置1的概略构成的功能框图。
图2所示的运动图像解码装置1以及运动图像编码装置2安装在HEVC(High-Efficiency Video Coding:高效视频编码)中采用的技术。在这些运动图像编码方式中,运动图像编码装置2对规定从编码器传输到解码器的语法(syntax)的值进行熵编码而生成编码数据#1。
作为熵编码方式,已知有基于上下文的自适应二进制算术编码(CABAC:Context-based Adaptive Binary Arithmetic Coding)。
在利用CABAC进行的编码/解码中,进行自适应于上下文的处理。上下文是指编码/解码的状况(前后关系),用于记录关连语法的发生概率。在CABAC中,对能取得多值的语法实施二值化处理,并根据发生概率对通过该二值化处理获得的二值数据自适应地进行算术编码。具体而言,准备多个保持二进制值(0或1)的发生概率的缓冲器,根据上下文选择一个缓冲器,并基于记录于该缓冲器的发生概率来进行算术编码。此外,通过基于进行解码/编码的二进制值来更新该缓冲器的发生概率,能根据上下文维持适当的发生概率。
运动图像解码装置1中输入运动图像编码装置2对运动图像进行编码后的编码数据#1。运动图像解码装置1对所输入的编码数据#1进行解码并将运动图像#2输出至外部。在运动图像解码装置1的详细说明之前,以下对编码数据#1的构成进行说明。
(编码数据的构成)
使用图3,对由运动图像编码装置2生成、由运动图像解码装置1解码的编码数据#1的构成例进行说明。编码数据#1示例性地包含序列以及构成序列的多个图片。
将编码数据#1中的图片层以下的层的结构示于图3。图3(a)~图3(e)是分别表示规定图片PICT的图片层、规定切片S的切片层、规定编码树单元(Coding Tree Unit)CTU的树单元层、规定编码树(Coding Tree、CT)的编码树层、规定编码树CT所包含的编码单元(Coding Unit;CU)的CU层的图。
<图片层>
在图片层中,规定有运动图像解码装置1为了对处理对象的图片PICT进行解码而参照的数据的集合。如图3(a)所示,图片PICT包含图片报头PH、以及切片S1~SNS(NS为图片PICT所包含的切片的总数)。
需要说明的是,以下,在无需对切片S1~SNS的每一个进行区别的情况下,有时会省略代码的下标来描述。此外,以下说明的包含于编码数据#1且标有下标的其它数据也是同样的。
图片报头PH中包含运动图像解码装置1为了确定对象图片的解码方法而参照的编码参数组。图片报头PH也称为图像参数集(PPS:Picture Parameter Set)。
<切片层>
在切片层中,规定有运动图像解码装置1为了对处理对象的切片S进行解码而参照的数据的集合。如图3(b)所示,切片S包含切片报头SH、以及树单元CTU1~CTUNC(NC为切片S所包含的树单元的总数)。
切片报头SH中包含运动图像解码装置1为了确定对象切片的解码方法而参照的编码参数组。指定切片类型的切片类型指定信息(slice_type)是切片报头SH所包含的编码参数的一个例子。
作为能由切片类型指定信息指定的切片类型,可列举出:(1)在进行编码时仅使用帧内预测的I切片、(2)在进行编码时使用单预测或帧内预测的P切片、(3)在进行编码时使用单预测、双预测或帧内预测的B切片等。
此外,切片报头SH中也可以包含被运动图像解码装置1所具备的环路滤波器(参照图2)参照的滤波参数。
<树单元层>
在树单元层中,规定有运动图像解码装置1为了对处理对象的树单元CTU进行解码而参照的数据的集合。树单元CTU是将切片(图片)分割为固定尺寸的单元。需要说明的是,分割后的单元中的图像数据(像素)称为树块(Coding Tree Block:编码树块)CTB,在不仅包含图像数据而且也包含用于对图像数据进行解码的信息(例如分割信息等)的情况下,称为树单元CTU。在进一步以亮度和色差对图像数据进行区别的情况下,CTB进一步称为亮度的CTB、色差的CTB。以下,编码树、编码单元等也是不仅包含并处理对应的单元的图像数据,而且也包含并处理用于对图像数据进行解码的信息(例如分割信息等)。
树单元CTU包含树单元报头CTUH、编码树CT、树单元脚注CTUF。若对树单元CTU与编码树CT的关系进行说明,则如下所述。
树单元CTU被编码树(CT)通过递归的四叉树分割进行分割。以下,将通过递归的四叉树分割获得的树结构及其节点称为编码树(coding tree)。
以下,参照与作为末端的编码树的树叶(leaf)对应的单元作为编码节点(codingnode)。此外,编码节点为编码处理的基本单位,因此,以下将编码节点称为编码单元(CU)。就是说,最上层的编码树CT为CTU,末端的编码树CT为CU。
需要说明的是,各编码树的尺寸的横竖均是该编码树的上一层的编码树的尺寸的横竖的一半。
此外,各编码树能取得的尺寸取决于编码数据#1的序列参数集SPS所包含的、编码树的尺寸指定信息以及最大层深度(maximum hierarchical depth)。例如,在树单元CTU的尺寸为64×64像素、最大层深度为3的情况下,该树单元CTU以下的层中的编码树能取得四种尺寸,即64×64像素、32×32像素、16×16像素、以及8×8像素中的任一种。
<树单元报头、树单元脚注>
树单元报头CTUH、树单元脚注CTUF中包含运动图像解码装置1为了确定对象树单元的解码方法而参照的编码参数。具体而言,如图3(c)所示,CTUH中包含指定对象树单元的滤波方法的SAO信息。将CTUH、CTUF等包含于CTU的信息称为树单元信息(CTU信息)。需要说明的是,储存于树单元报头CTUH的信息(例如SAO信息)可以储存于脚注(CTUF)的位置而不是报头。
<编码树>
编码树CT具有作为用于对树单元CTU进行分割的信息的树分割信息SP。例如,具体而言,如图3(d)所示,树分割信息SP可以是表示是否将整个对象树单元或树单元的部分区域分割为四个的标志即CU分割标志(split_cu_flag)。在CU分割标志split_cu_flag为1的情况下,将编码树CT进一步分割为四个编码树CT。在split_cu_flag为0的情况下,意味着编码树是不进行分割的编码单元CU。将编码树所具有的CU分割标志split_cu_flag等信息称为编码树信息(CT信息)。CT信息除了包含表示是否进一步对该编码树进行分割的CU分割标志split_cu_flag以外,还可以包含在该编码树和其以下的编码单元中应用的参数。
<CU层>
在CU层中,规定有运动图像解码装置1为了对处理对象的CU进行解码而参照的数据的集合(CU信息、预测单元PU、变换树TT)。
在此,对CU所包含的数据的树结构进行说明。编码单元为预测单元(predictionunit;PU)以及变换树(transform tree;TT)的根。若对预测单元以及变换树进行说明,则如下所述。
预测单元是构成编码单元的一个或多个不重复的区域,预测处理按该预测单元来进行。预测单元中的分割的种类粗略地说有帧内预测和帧间预测这两种情况。
在帧内预测的情况下,分割方法有2N×2N(与编码单元相同尺寸)和N×N。
此外,在帧间预测的情况下,分割方法有2N×2N(与编码单元相同尺寸)、2N×N、N×2N、以及N×N等。
此外,在变换树中,编码单元被分割为一个或多个变换单元(transform unit;TU),各变换单元的位置和尺寸被规定。如果以另一种表达来说,则变换单元是构成编码单元的一个或多个不重复的区域。变换树包含通过上述分割获得的一个或多个变换单元。变换处理按该变换单元来进行。
<编码单元信息的数据结构>
接着,参照图3(e),对编码单元CU所包含的数据的具体内容进行说明。如图3(e)所示,编码单元CU具体包含CU信息(跳过标志SKIP(cu_skip_flag)、CU预测类型信息Pred_type等)、PU信息PUI、以及TT信息TTI。
[跳过标志]
跳过标志SKIP是表示是否对对象CU应用跳过模式的标志(cu_skip_flag),在跳过标志SKIP的值为1的情况下,即,在对对象CU应用跳过模式的情况下,省略此编码单元CU中的PU信息PUI、TT信息TTI。需要说明的是,跳过标志SKIP在I切片中被省略。
[CU预测类型信息]
CU预测类型信息Pred_type包含CU预测方式信息(PredMode)以及PU分割类型信息(PartMode)。
CU预测方式信息(PredMode)指定使用跳过模式、帧内预测(帧内CU)、以及帧间预测(帧间CU)中的哪一个来做为针对对象CU所包含的各PU的预测图像生成方法。需要说明的是,以下,将对象CU中的跳过、帧内预测、以及帧间预测的类别称为CU预测模式。
PU分割类型信息(PartMode)指定对象编码单元CU分割为各PU的模式即PU分割类型。以下,将这样按照PU分割类型将对象编码单元CU分割为各PU称为PU分割。
PU分割类型信息(PartMode)示例性地可以是表示PU分割模式的种类的索引,也可以指定各PU的形状、尺寸以及在CU内的位置。
需要说明的是,可选择的PU分割类型根据CU预测方式和CU尺寸而不同。此外,进一步而言,可选择的PU分割类型在帧间预测以及帧内预测的各个情况下不同。此外,关于PU分割类型的详细内容将在后文叙述。
[PU信息]
PU信息PUI是与对象CU所包含的PU有关的信息。换言之,PU信息PUI是与PU所包含的一个或多个PU的每一个有关的信息的集合。如上所述,预测图像Pred的生成以PU为单位进行,因此,PU信息PUI在由运动图像解码装置1生成预测图像时被参照。如图3(e)所示,PU信息PUI包含PU信息PUI1~PUINP(NP为对象CU所包含的PU的总数),所述PU信息PUI1~PUINP包含各PU中的预测信息等。
PUI根据CU预测方式信息(PredMode)指定哪一种预测方法而包含帧内预测信息或帧间预测信息。以下,也将应用帧内预测的PU称为帧内PU,也将应用帧间预测的PU称为帧间PU。
帧间预测信息包含运动图像解码装置1在通过帧间预测生成帧间预测图像时参照的编码参数。
作为帧间预测参数,例如可列举出:合并标志(merge_flag)、合并索引(merge_idx)、估计运动矢量索引(mvp_idx)、参照图像索引(ref_idx)、帧间预测标识符inter_pred_idc、以及运动矢量残差(mvd)。
帧内预测信息包含运动图像解码装置1在通过帧内预测生成帧内预测图像时参照的编码参数。
作为帧内预测参数,例如可列举出:估计预测模式标志、估计预测模式索引、以及剩余预测模式索引。
需要说明的是,在帧内预测信息中也可以编码有表示是否使用PCM模式的PCM模式标志。在编码有PCM模式标志的情况下且PCM模式标志表示使用PCM模式时,省略预测处理(帧内)、变换处理、以及熵编码的各处理。
[TT信息]
TT信息TTI是与CU所包含的TT有关的信息。换言之,TT信息TTI是与TT所包含的一个或多个TU的每一个有关的信息的集合,在通过运动图像解码装置1对残差数据进行解码时被参照。需要说明的是,以下有时也将TU称为变换单元。
如图3(e)所示,TT信息TTI包含表示对象CU是否包含残差数据的CU残差标志CBP_TU、指定对象CU向各变换单元的分割模式的TT分割信息SP_TU、以及变换单元TUI1~TUINT(NT为对象CU所包含的变换单元的总数)。
在CU残差标志CBP_TU为0的情况下,对象CU不包含变换单元TU。在CU残差标志CBP_TU为1的情况下,对象CU包含变换单元TU。CU残差标志CBP_TU例如可以是表示在将对象TT以下分割后的全部中不存在残差的残差根标志rqt_root_cbf(Residual Quad Tree RootCoded Block Flag:残差四叉树根编码块标志)。具体而言,TT分割信息SP_TU是用于确定对象CU所包含的各TU的形状、尺寸、以及在对象CU内的位置的信息。例如,TT分割信息SP_TU可以由表示是否进行对象TT的分割的TU分割标志(split_transform_flag)和表示其分割的深度的TU层(trafoDepth)来实现。TU分割标志split_transform_flag是表示是否对进行变换(逆变换)的变换单元进行分割的标志,在进行分割的情况下对更小的变换单元进行变换(量化、逆变换、逆量化)。
此外,例如在CU的尺寸为64×64的情况下,通过分割获得的各TU能取得32×32像素至4×4像素的尺寸。
TU信息TUI1~TUINT是与TT所包含的一个或多个TU的每一个有关的单独的信息。例如,TU信息TUI包含量化预测残差(residual_coding)。
各量化预测残差是通过运动图像编码装置2对对象TU实施以下的处理1~2而生成的编码数据。
处理1:对从编码对象图像中减去预测图像而得的预测残差进行DCT变换(Discrete Cosine Transform:离散余弦变换);
处理2:对通过处理1获得的变换系数进行量化;
需要说明的是,上述的量化参数qp表示运动图像编码装置2对变换系数进行量化时使用的量化步长QP的大小(QP=2qp/6)。
<PU分割类型>
当将对象CU的尺寸设为2N×2N像素时,PU分割类型(PartMode)有如下共计八种模式。即,2N×2N像素、2N×N像素、N×2N像素、以及N×N像素这四个对称分割(symmetricsplittings);以及2N×nU像素、2N×nD像素、nL×2N像素、以及nR×2N像素这四个非对称分割(asymmetric splittings)。需要说明的是,N=2m(m为1以上的任意的整数)。以下,也将分割对称CU而获得的区域称为分区。
在图4(a)~图4(h)中,针对各个分割类型,具体地图示出CU中的PU分割的边界的位置。
需要说明的是,图4(a)表示不进行CU的分割的2N×2N的PU分割类型。
此外,图4(b)、图4(c)以及图4(d)分别表示PU分割类型分别为2N×N、2N×nU、以及2N×nD的情况的分区的形状。以下,将PU分割类型为2N×N、2N×nU、以及2N×nD的情况的分区统称为横长分区。
此外,图4(e)、图4(f)、以及图4(g)分别表示PU分割类型为N×2N、nL×2N、以及nR×2N的情况的分区的形状。以下,将PU分割类型为N×2N、nL×2N、以及nR×2N的情况的分区统称为纵长分区。
此外,将横长分区以及纵长分区统称为长方形分区。
此外,图4(h)表示PU分割类型为N×N的情况的分区的形状。基于其分区的形状,也将图4(a)以及图4(h)的PU分割类型称为正方形分割。此外,也将图4(b)~图4(g)的PU分割类型称为非正方形分割。
此外,在图4(a)~图4(h)中,标注于各分区的编号表示识别编号,按照该识别编号的顺序对分区进行处理。即,该识别编号表示分区的扫描顺序。
此外,在图4(a)~图4(h)中,设为左上为CU的基准点(原点)。[帧间预测的情况下的分割类型]
在帧间PU中,定义有上述八种分割类型中N×N(图4(h))以外的七种。需要说明的是,上述四个非对称分割有时也被称为AMP(Asymmetric Motion Partition、非对称分区)。一般而言,通过非对称分区分割的CU中包含形状或尺寸不同的分区。此外,对称分割有时也被称为对称分区。一般而言,通过对称分区分割的CU中包含形状以及尺寸一致的分区。
需要说明的是,上述的N的具体值由该PU所属的CU的尺寸规定,nU、nD、nL、以及nR的具体值根据N的值确定。例如,128×128像素的帧间CU能分割为128×128像素、128×64像素、64×128像素、64×64像素、128×32像素、128×96像素、32×128像素、以及96×128像素的帧间PU。
[帧内预测的情况下的分割类型]
在帧内PU中,定义有如下两种分割模式。即,不分割对象CU、即对象CU本身作为一个PU来处理的分割模式2N×2N和将对象CU对称地分割为四个PU的模式N×N。
因此,在帧内PU中,以图4所示的例子来说,能取得图4(a)以及图4(h)的分割模式。
例如,128×128像素的帧内CU能分割为128×128像素以及64×64像素的帧内PU。
需要说明的是,在I切片的情况下,编码单元CU中可以包含用于确定PU分割类型信息(PartMode)的帧内分割模式(intra_part_mode)。
(运动图像解码装置)
以下,参照图1~图47以及图51~图53,对本实施方式的运动图像解码装置1的构成进行说明。
<运动图像解码装置的概要>
运动图像解码装置1按PU生成预测图像Pred,通过将所生成的预测图像Pred与从编码数据#1解码的预测残差D(以下有时将预测残差标记为r[][])相加,生成解码图像#2,并将所生成的解码图像#2输出至外部。
在此,预测图像Pred的生成参照通过对编码数据#1进行解码而获得的编码参数来进行。编码参数是指为了生成预测图像Pred而参照的参数。编码参数中除了包含在画面间预测中参照的运动矢量、在画面内预测中参照的预测模式等预测参数以外,还包含PU的尺寸和形状、TU的尺寸和形状、以及原图像与预测图像Pred的残差数据等。以下,将编码参数所包含的信息中除了上述残差数据以外的全部信息的集合称为边信息。
此外,以下将作为解码的对象的图片(帧)、切片、CTU、CT、CU、以及PU、TT、TU分别称为对象图片、对象切片、对象CTU、对象CT、对象CU、对象PU、对象TT、以及对象TU。
需要说明的是,树单元的尺寸例如为64×64像素,PU、TU的尺寸例如为64×64像素、32×32像素、16×16像素、8×8像素、4×4像素等。然而,这些尺寸仅为示例,树单元以及PU、TU的尺寸也可以是以上所示的尺寸以外的尺寸。
<运动图像解码装置的构成>
若再次参照图2对运动图像解码装置1的概略构成进行说明,则如下所述。图2是表示运动图像解码装置1的概略构成的功能框图。
如图2所示,运动图像解码装置1具备:解码模块10、CT信息解码部11、PU信息解码部12、TT信息解码部13、预测图像生成部14、逆量化/逆变换部15、帧存储器16以及加法器17、环路滤波器18、报头解码部19、CU解码部20、CU信息解码部21。TT信息解码部13进一步具备TU解码部22。
[基本流程]
图1是对运动图像解码装置1的概略动作进行说明的流程图。
(S1100:参数集信息解码)报头解码部19从编码数据#1对VPS、SPS、PPS等参数集信息进行解码。
(S1200:切片信息解码)报头解码部19从编码数据#1对切片报头(切片信息)进行解码。
以下,运动图像解码装置1通过针对对象图片所包含的各CTU重复进行S1300到S5000的处理来导出各CTU的解码图像。
(S1300:CTU信息解码)CT信息解码部11从编码数据#1对树单元(CTU)进行解码。
(S1400:CT信息解码)CT信息解码部11从编码数据#1对编码树(CT)进行解码。
(S1500:CU解码)CU解码部20实施S1510、S1600、S1700,从编码数据#1对编码单元(CU)进行解码。
(S1510:CU信息解码)CU信息解码部21从编码数据#1对CU信息进行解码。
(S1600:PU信息解码)PU信息解码部12从编码数据#1对预测单元信息(PU信息PTI)进行解码。
(S1700:TT信息解码)TT信息解码部13从编码数据#1对变换树TT进行解码。
(S2000:预测图像生成)预测图像生成部14针对对象CU所包含的各PU,基于PU信息PUI生成预测图像Pred。
(S3000:逆量化/逆变换)逆量化/逆变换部15针对对象CU所包含的各TU,基于TT信息TTI执行逆量化/逆变换处理。
(S4000:解码图像生成)加法器17通过将由预测图像生成部14供给的预测图像Pred与由逆量化/逆变换部15供给的预测残差D相加来生成针对对象CU的解码图像P0。
(S5000:环路滤波)环路滤波器18对解码图像P0施加去块滤波、取样自适应滤波(SAO)等环路滤波,生成解码图像P。
[解码模块]
以下,对各模块的概略动作进行说明。解码模块10进行从二进制对语法值进行解码的解码处理。更具体而言,解码模块10基于从供给源供给的编码数据以及语法类别对通过CABAC等熵编码方式编码的语法值进行解码,并将解码后的语法值返回给供给源。
在以下所示的例子中,编码数据以及语法类别的供给源是CT信息解码部11、CU解码部20(CU信息解码部21、PU信息解码部12、以及TT信息解码部13)。
[报头解码部]
报头解码部19对从运动图像编码装置2输入的编码数据#1的VPS(videoparameter set:视频参数集)、SPS、PPS、切片报头进行解码。
[CT信息解码部]
CT信息解码部11使用解码模块10对从运动图像编码装置2输入的编码数据#1进行树单元层以及编码树层中的解码处理。具体而言,CT信息解码部11按照以下的步骤从编码数据#1对CTU信息、CT信息进行解码。
首先,CT信息解码部11使用解码模块10对CTU信息的树单元报头CTUH进行解码。接着,转移至CT的解码,对CT信息的CU分割标志SP进行解码,递归地对对象CT进行分割并解码,直至SP不再通知进一步的分割。最后,对CTU信息的树单元脚注CTUF进行解码。
[CU解码部]
CU解码部20由CU信息解码部21、PU信息解码部12、TT信息解码部13构成,对最下层的编码树CT(即CU)的CU信息、PUI信息、TTI信息进行解码。
[CU信息解码部]
在CU信息解码部21中,使用解码模块10对各CU的CU信息(跳过标志SKIP、CU预测方式信息PredMode、PU分割类型信息PartMode等)进行解码。
[PU信息解码部]
在PU信息解码部12中,使用解码模块10对各PU的PU信息(合并标志(merge_flag)、合并索引(merge_idx)、估计运动矢量索引(mvp_idx)、参照图像索引(ref_idx)、帧间预测标识符(inter_pred_flag)、以及运动矢量残差(mvd)等)进行解码。
[TT信息解码部]
TT信息解码部13使用解码模块10对各TTI(TU分割标志SP_TU(split_transform_flag)、CU残差标志CBP_TU(cbf_cb、cbf_cr、cbf_luma)等、以及TU)进行解码。
此外,TT信息解码部13具备TU解码部22。TU解码部22在TU中包含残差的情况下,对QP更新信息(量化校正值)进行解码。需要说明的是,QP更新信息是表示与量化参数QP的预测值即量化参数预测值qPpred的差分值的值。此外,TU解码部22对量化预测残差(residual_coding)进行解码。
更详细而言,如图5所示,CT信息解码部11进行以下的动作。图5是对发明的一实施方式的CT信息解码部11(CTU信息解码S1300、CT信息解码S1400)的概略动作进行说明的流程图。
图9是表示本发明的一实施方式的CTU信息以及CT信息的语法表的构成例的图。
(S1311)CT信息解码部11从编码数据#1对CTU信息进行解码,并对用于管理递归地分割的编码树CT的变量进行初始化。具体而言,如下式所述,将表示编码树的层的CT层(CT深度)cqtDepth设定为0,将编码树的尺寸即CT尺寸(在此为对数CT尺寸log2CbSize)设定为树单元的对数尺寸CtbLog2SizeY作为初始值。
cqtDepth=0
log2CbSize=CtbLog2SizeY
需要说明的是,CT层cqtDepth在最上层设为0,并设为随着下层变深而逐一变大,但并不限于此。在上述中,通过将CT尺寸以及CTU尺寸限定为2的指数幂(4,8,16,32,64,128,256,……等),而用以2为底的对数对这些尺寸进行处理,但并不限于此。需要说明的是,在尺寸为4,8,16,32,64,128,256的情况下,各个2,3,4,5,6,7,8为对数值。
以下,CT信息解码部11递归地对编码树CT(coding_quadtree)进行解码(S1400)。
CT信息解码部11对最上层(根)的编码树coding_quadtree(xCtb,yCtb,CtbLog2SizeY,0)进行解码(SYN1400)。需要说明的是,xCtb,yCtb为CTU的左上坐标,CtbLog2SizeY为CTU的对数尺寸(例如,如果尺寸为64,128,256,则为6,7,8)。
(S1411)CT信息解码部11判定对数CT尺寸log2CbSize是否大于规定的最小CT尺寸的对数值MinCbLog2SizeY(SYN1411)。在对数CT尺寸log2CbSize大于MinCbLog2SizeY的情况下,转移到S1421,除此以外的情况下转移到S1422。
(S1421)CT信息解码部11在判定为对数CT尺寸log2CbSize大于MinCbLog2SizeY的情况下,对SYN1421所示的语法元素即CU分割标志(split_cu_flag)进行解码。
(S1422)CT信息解码部11在除此以外的情况下(对数CT尺寸log2CbSize为MinCbLog2SizeY以下),就是说,在编码数据#1中未出现CU分割标志split_cu_flag的情况下,省略从编码数据#1对CU分割标志split_cu_flag进行解码,而将CU分割标志split_cu_flag导出为0。
(S1431)CT信息解码部11在CU分割标志split_cu_flag为0以外(=1)的情况下(SYN1431),实施后述的(S1441),转移到下一层并重复进行(S1411)之后的处理。就是说,在CT层cqtDepth+1的位置(x0,y0)、(x1,y0)、(x0,y1)、(x1,y1),对对数CT尺寸log2CbSize-1的四个编码树CT进行解码。CT信息解码部11在下层的编码树CT中也继续进行从S1411开始的CT信息解码S1400。
coding_quadtree(x0,y0,log2CbSize-1,cqtDepth+1)(SYN1441A)
coding_quadtree(x1,y0,log2CbSize-1,cqtDepth+1)(SYN1441B)
coding_quadtree(x0,y1,log2CbSize-1,cqtDepth+1)(SYN1441C)
coding_quadtree(x1,y1,log2CbSize-1,cqtDepth+1)(SYN1441D)
在此,x0,y0是对象编码树的左上坐标,x1,y1是如下式所述将(x0,y0)加上对数CT尺寸(1<<log2CbSize)的1/2而导出的。
x1=x0+(1<<(log2CbSize-1))
y1=y0+(1<<(log2CbSize-1))
需要说明的是,<<表示左移位。1<<N是与2的N次幂相同的值(以下同样)。同样地,以下>>表示右移位。
在除此以外的情况(CU分割标志split_cu_flag为0的情况)下,为了对编码单元CU进行解码而转移至S1500。
(S1441)将表示编码树的层的CT层cqtDepth加1,并将编码单元尺寸的对数值即对数CT尺寸log2CbSize减1(将CT尺寸设为1/2)而进行更新。
cqtDepth=cqtDepth+1
log2CbSize=log2CbSize-1
图6是对发明的一实施方式的CU解码部20(CU解码S1500)、CU信息解码部21(CU信息解码S1510)、PU信息解码部12(PU信息解码S1600)、TT信息解码部13(TT信息解码S1700)的概略动作进行说明的流程图。图10是表示本发明的一实施方式的CU信息、PT信息PTI、TT信息TTI的语法表的构成例的图。
[CU解码部]
(S1500)CU解码部20对编码单元CU(coding_unit(x0,y0,log2CbSize))进行解码(SYN1500)。在此,x0,y0是编码单元的左上坐标。编码单元的对数尺寸即log2CbSize从CT信息解码部11通知。CU解码部20的具体处理通过以下的CU信息解码部21、PU信息解码部12、TT信息解码部13来进行。
[CU信息解码部]
CU信息解码部21使用解码模块10对CU信息(跳过标志、CU预测方式信息PartMode、PU分割类型信息、残差根标志)进行解码。
(S1511)CU信息解码部21使用解码模块10从编码数据#1对跳过标志cu_skip_flag(图3(e)的SKIP)进行解码。
(S1512)CU信息解码部21判定跳过标志cu_skip_flag是否为0以外(=1)。在跳过标志cu_skip_flag为0以外的情况下,CU信息解码部21通知给PU信息解码部12。此外,在跳过标志cu_skip_flag为0的情况下,(S1513)CU信息解码部21对CU预测方式信息pred_mode_flag进行解码,进而(S1514)对PU分割类型信息PartMode(part_mode)进行解码,并通知给PU信息解码部12。进而,(S1515)CU信息解码部21对残差根标志rqt_root_flag进行解码,(S1516)判定残差根标志是否为0以外,在残差根标志为0的情况下结束处理,在0以外的情况下通知给TT信息解码部13。
[PU信息解码部]
PU信息解码部12使用解码模块10进行PU信息PUI的解码处理。具体而言,PU信息解码部12按照以下的步骤对PU信息PUI进行解码。
PU信息解码部12参照预先设定的或者从CU信息解码部21通知的PU分割类型信息PartMode来确定对象CU中的PU分割类型。接着,PU信息解码部12将对象CU所包含的各PU按顺序作为对象PU,执行与对象PU对应的PU信息的解码处理。
即,PU信息解码部12根据与对象PU对应的PU信息,进行用于生成预测图像Pred的各参数的解码处理。
PU信息解码部12将对对象PU进行解码后的PU信息PUI供给至预测图像生成部14。
更详细而言,如图6所示,PU信息解码部12进行以下的动作。图6是对S1600所示的PU信息解码的概略动作进行说明的流程图。
图11是表示本发明的一实施方式的PU信息PUI的语法表的构成例的图。
(S1631)PU信息解码部12根据PU分割类型信息PartMode所示的PU分割数,从编码数据#1对对象CU所包含的各PU信息进行解码。
例如,在PU分割类型为2N×2N的情况下,PU信息解码部12对将CU设为一个PU的下述一个PU信息PUI进行解码。
prediction_unit(x0,y0,nCbS,nCbS)(SYN1631A)
PU信息解码部12在PU分割类型为2N×N的情况下,对将CU上下分割的下述两个PU信息PUI进行解码。
prediction_unit(x0,y0,nCbS,nCbS/2)(SYN1631B)
prediction_unit(x0,y0+(nCbS/2),nCbS,nCbS/2)(SYN1631C)
PU信息解码部12在PU分割类型为N×2N的情况下,对将CU左右分割的下述两个PU信息PUI进行解码。
prediction_unit(x0,y0,nCbS/2,nCbS)(SYN1631D)
prediction_unit(x0+(nCbS/2),y0,nCbS/2,nCbS)(SYN1631E)
在PU分割类型为N×N的情况下,对将CU四等分的下述四个PU信息PUI进行解码。
prediction_unit(x0,y0,nCbS/2,nCbS/2)(SYN1631F)
prediction_unit(x0+(nCbS/2),y0,nCbS/2,nCbS/2)(SYN1631G)
prediction_unit(x0,y0+(nCbS/2),nCbS/2,nCbS/2)(SYN1631H)
prediction_unit(x0+(nCbS/2),y0+(nCbS/2),nCbS/2,nCbS/2)(SYN1631I)
(S1632)在跳过标志为1的情况下,PU信息解码部12将PU分割类型设为2N×2N,对一个PU信息PUI进行解码。
prediction_unit(x0,y0,nCbS,nCbS)(SYN1632S)
[TT信息解码部]
在CU信息解码部21中解码后的残差根标志rqt_root_cbf为0以外(=1)的情况下,为了对TT信息TTI进行解码而转移至S1700,实施由TT信息解码部13进行的处理。在残差根标志rqt_root_cbf为0的情况下,省略从编码数据#1对对象CU的TT信息TTI进行解码的处理,将TT信息TTI作为对象CU未进行TU分割且对象CU的量化预测残差为0而导出。
TT信息解码部13使用解码模块10进行TT信息TTI(TU分割信息、CU残差标志、AMT标志、以及TU)的解码处理。
[预测图像生成部]
预测图像生成部14针对对象CU所包含的各PU,基于PU信息PUI生成预测图像Pred。具体而言,预测图像生成部14通过按照与对象PU对应的PU信息PUI所包含的参数进行帧内预测或帧间预测,从作为已解码图像的局部解码图像P’生成预测图像Pred。预测图像生成部14将所生成的预测图像Pred供给至加法器17。
需要说明的是,若对预测图像生成部14基于运动补偿预测参数(运动矢量、参照图像索引、帧间预测标识符)生成对象CU所包含的PU的预测图像Pred的方法进行说明,则如下所述。
在帧间预测标识符表示单预测的情况下,预测图像生成部14在参照图像索引所示的参照图像中,使用运动矢量所示的位置的解码图像来生成预测图像Pred。
另一方面,在帧间预测标识符表示双预测的情况下,预测图像生成部14针对两组参照图像索引与运动矢量的组合的每一个通过运动补偿生成预测图像并计算出平均值,或者基于对象图片与各参照图像的显示时间间隔对各预测图像进行加权相加,由此,生成最终的预测图像Pred。
[逆量化/逆变换部]
逆量化/逆变换部15针对对象CU所包含的各TU,基于TT信息TTI执行逆量化/逆变换处理。具体而言,逆量化/逆变换部15通过对对象TU所包含的量化变换系数qd[][]进行逆量化以及逆正交变换来复原每个像素的预测残差D。即,逆量化/逆变换部15进行复原(逆运算)的变换是指以能量(分散的总和)集中(即,偏向)于少数成分的方式对由多个成分构成的信息进行映射的处理,变换的性能取决于如何使该能量集中于较少的成分。
需要说明的是,在此,变换是指例如从像素区域向频域的正交变换。因此,逆变换是从频域向像素区域的变换。此外,作为逆变换的例子,可列举出逆DCT变换(InverseDiscrete Cosine Transform:逆离散余弦变换)以及逆DST变换(Inverse Discrete SineTransform:逆离散正弦变换)等。逆量化/逆变换部15将复原后的预测残差D供给至加法器17。
逆量化/逆变换部15除了上述逆变换以外还可以使用自适应核变换(AdaptiveMultiple Core Transform:AMT、自适应多核变换)(第一变换)和/或二次变换(SecondaryTransform)(第二变换)来复原预测残差D,自适应核变换是根据帧内/帧间的预测方法以及块尺寸、亮度/色度的信号的区别自适应地选择的变换,二次变换是在帧内预测模式中选择的变换。该自适应核变换以及二次变换将在下文进行说明。
[加法器]
加法器17通过将由预测图像生成部14供给的预测图像Pred与由逆量化/逆变换部15供给的预测残差D相加来生成对象CU的解码图像P0。
[环路滤波器]
环路滤波器18对对象CU的解码图像P0施加去块滤波、取样自适应偏移滤波SAO、自适应环路滤波ALF等滤波,生成解码图像P。
[帧存储器]
在帧存储器16中,施加了环路滤波的解码图像P与用于该解码图像P的解码的参数一起被依次记录。在帧存储器16中,在对对象树单元进行解码的时间点,与比该对象树单元更先被解码的所有树单元(例如,按照光栅扫描的顺序排列在先的所有树单元)对应的解码图像被记录。作为记录于帧存储器16的解码参数的例子,可列举出CU预测方式信息(PredMode)等。
需要说明的是,在运动图像解码装置1中,针对图像内的所有树单元,在各树单元的解码图像生成处理结束的时间点,与输入至运动图像解码装置1的一帧量的编码数据#1对应的解码图像#2被输出至外部。
(自适应核变换以及二次变换)
图14是表示逆量化/逆变换部15的构成例的功能框图。如图14所示,量化/逆变换部15具备逆量化部151以及逆变换部152。逆量化部151对通过TT信息解码部13内的TU解码部22解码的量化变换系数qd[][]进行逆量化,导出变换系数d[][]。逆量化部151将所导出的变换系数d[][]发送至逆变换部152。
逆变换部152对接收到的变换系数d[][]进行逆变换,复原预测残差r[][](在图2中也表达为D)。复原后的预测残差r[][]从逆变换部152传送至加法器17。
逆变换部152能使用自适应核变换和二次变换。
需要说明的是,变换与逆变换在作为变换基底的系数的值以外的处理上没有差别。在以后的说明中,关于逆变换部152中的变换处理,将使用“变换”这一术语而不是“逆变换”。
<自适应核变换>
在逆变换部152中,能自适应地切换变换的方法,在本说明书中,将通过明确示出的标志、索引以及预测模式等进行切换的变换称为自适应核变换。在自适应核变换中使用的变换(核变换)是由垂直变换和水平变换构成的分离型变换。核变换的变换基底为DCT2、DST7、DCT8、DST1、以及DCT5。在自适应核变换中,对垂直变换以及水平变换分别独立地切换变换基底。需要说明的是,可选择的变换并不限于上述,也可以使用其它变换(变换基底)。需要说明的是,有时将DCT2、DST7、DCT8、DST1、以及DCT5分别表示为DCT-II、DST-VII、DCT-VIII、DST-I、以及DCT-V。
自适应核变换参照从编码数据解码的AMT标志(amt_flag),切换不进行基于索引的切换的固定变换和进行基于索引的切换的选择性变换。在amt_flag=0时,使用固定变换,在amt_flag=1时,使用选择性变换。在固定变换(amt_flag=0)中,不参照AMT索引amt_idx,而使用固定变换、在此为DCT2和DST7来进行变换。在选择性变换(amt_flag=1)中,进一步从编码数据对用于选择的AMT索引amt_idx进行解码,并根据预测模式和AMT索引amt_idx来对变换进行切换。需要说明的是,在本实施例中,记载了以CU单位或TU单位对AMT标志进行解码、以TU单位对AMT索引amt_idx进行解码的例子,但解码(切换)的单位并不限于此。
AMT索引amt_idx是用于选择自适应核变换的变换基底的切换索引。AMT索引amt_idx的上位比特被分配为垂直变换的变换选择标志,amt_idx的下位比特被分配为水平变换的变换选择,垂直变换的变换选择标志amt_trans_idx即amt_trans_idx_ver和水平变换的变换选择标志amt_trans_idx即amt_trans_idx_hor通过下式导出。
amt_trans_idx_ver=amt_idx>>1
amt_trans_idx_hor=amt_idx&1
将amt_trans_idx_ver和ramt_trans_idx_hor合称为amt_trans_idx。
需要说明的是,当使用表示是垂直变换还是水平变换的标志vertTrFlag(垂直为1,水平为0)时,amt_trans_idx也可以根据下式导出。amt_trans_idx=(vertTrFlag)?amt_trans_idx_ver:amt_trans_idx_hor
需要说明的是,amt_trans_idx的比特中,垂直变换、水平变换的分配并不限于上述,例如也可以是下述。
amt_trans_idx_ver=amt_idx&1
amt_trans_idx_hor=amt_idx>>1
在自适应核变换中使用的变换使用预测模式(帧内、帧间)以及变换选择标志(amt_trans_idx),从上述多个变换基底中选择。图15(a)是对变换集coreTrSet的表进行说明的图,使用该图对选择方法进行说明。
在帧内预测模式的情况下,从名称(Name)为TrSetIntraO、TrSetIntra1、TrSetIntra2的三个变换集中选择使用的变换。各变换集具有两个变换基底。例如TrSetIntraO具有DST7和DCT8作为集。然后,使用变换选择标志(amt_trans_idx)来对使用这两个变换基底中的哪一个进行切换。例如在TrSetIntraO的情况下,如果是amt_trans_idx=0,则选择DST7,如果是amt_trans_idx=1,则选择DCT8。
在帧间预测模式的情况下,变换集是TrSetInter的一种。TrSetInter所具有的两个变换基底与帧内预测模式的情况同样地,使用变换选择标志(amt_trans_idx)来对使用哪一个进行切换。
使用帧内预测模式的三个变换集(TrSetIntraO、TrSetIntra1、TrSetIntra2)中的哪一个变换集参照帧内预测模式IntraPredMode来确定。将其示于图16。图16示出了三十五种帧内预测模式IntraPredMode的各自的水平变换以及垂直变换选择哪一个变换集。图中的0、1、2分别表示变换集TrSetIntraO、TrSetIntra1、TrSetIntra2。例如在IntraPredMode=10的情况下,由于图中的水平变换(Horizontal)的值为0,因此,水平变换中使用TrSetIntraO(=0)的变换集,由于图中的垂直变换(Vertical)的值为2,因此,垂直变换中使用TrSetIntra2(=2)的变换集。
使用图17对上述说明的自适应核变换具体地进行说明。图17的逆变换部152是图14的逆变换部152的一个例子。图17的核变换部1521(第一变换部)由下述构成:核变换处理导出部15211,从多个变换基底中导出使用的核变换;以及核变换处理部15212,使用所导出的核变换来根据(修正)变换系数d[][]计算出预测残差r[][]。在未实施二次变换的情况下,修正变换系数等于变换系数。在实施了二次变换的情况下,修正变换系数取与变换系数不同的值。核变换处理导出部15211由下述构成:核变换集导出部152111,导出使用的变换集的索引coreTrSetIdx;以及核变换处理设定部152112,使用coreTrSetIdx来导出使用的核变换的索引coreTrIdx。
对核变换集导出部152111进行说明。
首先,将归纳了四种变换集(TrSetIntraO、TrSetIntra1、TrSetIntra2、TrSetInter)的表coreTrSet示于下述。
Figure BDA0003125435300000271
核变换集导出部152111通过下式导出下面要使用的变换集的索引coreTrSetIdx。
coreTrSetIdx=(PredMode==PRED_INTER)?TrSetInter:coreTrSetTbl[IntraPredMode][vertTrFlag]
在此,PredMode是帧内或者帧间预测模式,coreTrSetTbl以及vertTrFlag是表示在图16中说明的表以及是水平变换还是垂直变换的标志。例如,在帧间预测(PredMode=PRED_INTER)的情况下,为coreTrSetIdx=TrSetInter。在帧内预测(PredMode=PRED_INTRA)且帧内预测模式IntraPredMode=10的情况下,如果是水平变换(vertTrFlag=0),则为coreTrSetIdx=TrSetIntra0,如果是垂直变换(vertTrFlag=1),则为coreTrSetIdx=TrSetIntra2。
对核变换处理设定部152112进行说明。核变换处理设定部152112通过下式导出使用的核变换的索引coreTrIdx。
coreTrIdx=(amt_flag==0)?fixedTr:coreTrSet[coreTrSetIdx][amt_trans_idx]在此fixedTr表示固定变换。此外,用下述对coreTrIdx进行定义(图15(b))。
coreTrIdx={DCT2,DCT5,DCT8,DST1,DST7}
需要说明的是,coreTrIdx可以用数值进行处理。即,DCT2、DCT5、DCT8、DST1、DST7可以使用0、1、2、3、4等。
需要说明的是,在amt_flag==0且选择了固定变换fixedTr的情况下,变换基底的水平变换、垂直变换均为DCT2或DST7,因此,可以选择DCT2或DST7作为coreTrIdx并通过核变换处理部15212进行处理,也可以设置未图示的固定变换专用的处理部来进行处理。在amt_flag=1且选择了自适应变换的情况下,例如,如果coreTrStIdx=TrSetIntra0、amt_trans_idx=0,则coreTrIdx=DST7,如果coreTrStIdx=TrSetIntra0、amt_trans_idx=1,则coreTrIdx=DCT8。
核变换处理部15212由下述构成:核变换矩阵导出部152121,导出核变换的索引coreTrIdx所示的变换矩阵;垂直变换部152122,对修正变换系数d[][]实施垂直变换;以及水平变换部152123,对修正变换系数d[][]实施水平变换。核变换处理部15212首先通过核变换矩阵导出部152121导出核变换的索引coreTrIdx所示的变换矩阵transMatrix[][]。
transMatrix[][]=coreTransMatrixTbl[coreTrIdx][][]
在此,coreTransMatrixIdx是储存了图15(b)所示的变换基底的表。
需要说明的是,也可以将垂直变换的变换矩阵transMatrix与transMatrixV、将水平变换的变换矩阵与transMatrixH进行区别。
接着,核变换处理部15212将用于垂直/水平变换而分别导出的变换矩阵通知给垂直变换部152122和水平变换部152123,将修正变换系数d[][]变换为预测残差r[][]。垂直变换部152122通过垂直方向一维变换将修正变换系数d[][]变换为中间值e[][],并将中间值e[][]传送至中间值剪辑部152124。中间剪辑部152124通过对中间值e[][]进行剪辑来导出中间值g[][],并传送至水平变换部152123。水平变换部152123将中间值g[][]变换为预测残差r[][]。预测残差r[][]从水平变换部152123传送至加法器17。
垂直变换部152121(核变换处理部15212)导出第一中间值e[x][y]。e[x][y]=Σ(transMatrix[y][j]×d[x][j])(j=0..nTbS-1)
在此,transMatrix[][](=transMatrixV[][])是以在垂直变换(vertTrFlag=1)的情况下通过上式导出的nTbS×nTbS的矩阵表示的变换基底。nTbS是TU尺寸。在coreTrIdx为DCT2的4×4变换(nTbS=4)的情况下,例如使用transMatrix={{29 55 7484}{74 74 0-74}{84-29-74 55}{55-84 74-29}}。符号Σ是指,对直至j=0..nTbS-1的下标j加上矩阵transMatrix[y][j]与变换系数d[x][j]的积的处理。就是说,e[x][y]是对从由d[x][y]的各列(column)即d[x][j](j=0..nTbS-1)构成的矢量x[j](j=0..nTbS-1)与矩阵的元素transMatrix[y][j]的积获得的列进行排列而获得的。
中间剪辑部152124(核变换处理部15212)对第一中间值e[x][y]进行剪辑,导出第二中间值g[x][y]。
g[x][y]=Clip3(coeffMin,coeffMax,(e[x][y]+64)>>7)
上式的64、7是根据变换基底的比特深度确定的数值,在上式中将变换基底假定为7bit。此外,coeffMin、coeffMax是剪辑的最小值和最大值。
水平变换部152123(核变换处理部15212)使用以在垂直变换(vertTrFlag=1)的情况下通过上式导出的nTbS×nTbS的矩阵表示的变换基底transMatrix[][](=transMatrixH[][]),通过水平方向一维变换将中间值g[x][y]变换为预测残差r[x][y]。
r[x][y]=ΣtransMatrix[x][j]×g[j][y](j=0..nTbS-1)
上述符号Σ是指,对直至j=0..nTbS-1的下标j加上矩阵transMatrix[x][j]与g[j][y]的积的处理。就是说,r[x][y]是对从g[x][y]的各行(row)即g[j][y](j=0..nTbS-1)与矩阵transMatrix的积获得的行进行排列而获得的。
需要说明的是,作为变换的实施例,也可以使用下述所示的将一维信号x[j]变换为一维信号y[i]的方法来进行垂直变换和水平变换。在垂直变换中,将x列的变换系数d[x][j]设置为一维变换系数x[j]来进行变换。在水平变换中,将y行的中间系数g[j][y]设置为x[j]来进行变换。
y[i]=Σ(transMatrix[i][j]×x[j])(j=0..nTbS-1)
[AMT标志amt_flag的解码]
以下,使用图7以及图12,对TT信息解码部13对用于自适应核变换的AMT标志amt_flag进行解码的处理进行说明。图7是对发明的一实施方式的TT信息解码部13(TT信息解码S1700)的概略动作进行说明的流程图。图12是表示本发明的一实施方式的TT信息TTI的语法表的构成例的图。
(S1731)TT信息解码部13在对象TU尺寸(例如,对数TU尺寸log2TrafoSize)为规定的变换尺寸的范围(在此为最大对数TU尺寸MaxTbLog2SizeY以下且大于最小对数TU尺寸MinTbLog2SizeY)、且对象TU的TU层trafoDepth小于规定的层(在此为小于最大TU层MaxTrafoDepth)的情况下,对TU分割标志(split_transform_flag)进行解码。更具体而言,如SYN1721所示,TT信息解码部13在对数TU尺寸log2TrafoSize≤最大对数TU尺寸MaxTbLog2SizeY、且对数TU尺寸log2TrafoSize>最小对数TU尺寸MinTbLog2SizeY、且TU层trafoDepth<最大TU层MaxTrafoDepth的情况下(在S1721中为是),进入至S1731,对TU分割标志(split_transform_flag)进行解码(SYN1731)。
(S1732)另一方面,在编码数据#1中未出现split_transform_flag的情况下,即,在对数TU尺寸log2TrafoSize>最大对数TU尺寸MaxTbLog2SizeY、或对数TU尺寸log2TrafoSize≤最小对数TU尺寸MinTbLog2SizeY、或TU层trafoDepth≥最大TU层MaxTrafoDepth的情况下(在S1721中为否),TT信息解码部13导出来自导出TU分割标志(split_transform_flag)的编码数据#1的TU分割标志split_transform_flag。更具体而言,在对数TU尺寸log2TrafoSize大于最大对数TU尺寸MaxTbLog2SizeY的情况下,TT信息解码部13在未满足如SYN1721所示的条件的情况下,将TU分割标志split_transform_flag导出为表示进行分割的值(=1),在除此以外的情况下(对数TU尺寸log2TrafoSize等于最小对数TU尺寸MaxTbLog2SizeY、或TU层trafoDepth等于最大TU层MaxTrafoDepth),将TU分割标志split_transform_flag导出为表示不进行分割的值(=0)。
(S1755)TT信息解码部13在TU分割标志split_transform_flag是表示进行分割的值(例如1)(在S1733中为是)、且TU层trafoDepth为0的情况下(在S1754中为是),对AMT标志amt_flag进行解码(SYN1755)。需要说明的是,即使TU分割标志split_transform_flag是表示进行分割的值(在S1733中为是),在TU层trafoDepth不为0的情况下(S1754中为否),TT信息解码部13也不从编码数据对AMT标志amt_flag进行解码,而是转移至S1756。在该情况下,直接使用通过上层的变换树TT中的AMT标志解码(S1755)解码的amt_flag。
(1756)TT信息解码部13通过下式在表示变换树的层的TU层trafoDepth+1中,在四个位置(x0,y0)、(x1,y0)、(x0,y1)、(x1,y1)递归地对对象TU尺寸即对数CT尺寸log2CbSize-1的变换树TT进行解码。
transform_tree(x0,y0,x0,y0,log2TrafoSize-1,trafoDepth+1,0)
transform_tree(x1,y0,x0,y0,log2TrafoSize-1,trafoDepth+1,1)
transform_tree(x0,y1,x0,y0,log2TrafoSize-1,trafoDepth+1,2)
transform_tree(x1,y1,x0,y0,log2TrafoSize-1,trafoDepth+1,3)
在此,x0,y0为对象变换树的左上坐标,x1,y1是如下式所述将变换树坐标(x0,y0)加上对象TU尺寸(1<<log2TrafoSize)的1/2而导出的坐标(SYN1756)。
x1=x0+(1<<(log2TrafoSize-1))
y1=y0+(1<<(log2TrafoSize-1))
如上所述,TT信息解码部13在递归地对变换树transform_tree进行解码之前,通过下式将表示变换树TT的层的TU层trafoDepth加1,并将对象TU尺寸即对数CT尺寸log2TrafoSize减1而进行更新。
trafoDepth=trafoDepth+1
log2TrafoSize=log2TrafoSize-1
(S1751)另一方面,在TU分割标志split_transform_flag为0的情况下(在S1733中为否),TT信息解码部13对表示对象TU中是否包含残差的TU残差标志(例如,cbf_luma)进行解码。在此,作为TU残差标志,使用表示对象TU的亮度成分中是否包含残差的亮度残差标志cbf_luma,但并不限于此。
(S1753)TT信息解码部13在TU层trafoDepth为0且TU残差标志(例如,cbf_luma)为0的情况下(在S1752中为是),对AMT标志amt_flag进行解码(SYN1753)。在不是这样的情况下(在S1752中为否),不对amt_flag进行解码,而设为amt_flag=0。需要说明的是,在TU分割标志split_transform_flag是表示进行分割的值(在此为0以外)(在S1733中为是)、且TU层trafoDepth不为0的情况下(在S1754中为否),TT信息解码部13不从编码数据对AMT标志amt_flag进行解码,而是转移至S1756。此外,在不是这样的情况下(在S1757中为是),对amt_flag进行解码。
(S1760)TT信息解码部13在TU分割标志split_transform_flag为0的情况下(在S1733中为否),对SYN1760所示的变换单元进行解码。
TU transform_unit(x0,y0,xBase,yBase,log2TrafoSize,trafoDepth,blkIdx)
接着,使用图8以及图13对TT信息解码部13对TU信息进行解码的处理进行说明。图8是对发明的一实施方式的TT信息解码部13(TU信息解码S1760)的概略动作进行说明的流程图。此外,图13是表示本发明的一实施方式的TU信息的语法表的构成例的图。
(S1781)TT信息解码部13判定TU中是否包含残差(TU残差标志是否为0以外)。需要说明的是,在SYN1781中,根据通过下式导出的cbfLuma||cbfChroma来判定TU中是否包含残差,但并不限于此。就是说,作为TU残差标志,也可以使用表示对象TU的亮度成分中是否包含残差的亮度残差标志cbf_luma。
cbfLuma=cbf_luma[x0][y0][trafoDepth]
cbfChroma=cbf_cb[xC][yC][cbfDepthC]||cbf_cr[xC][yC][cbfDepthC])
需要说明的是,cbf_cb、cbf_cr是从编码数据#1解码的标志,表示对象TU的色差成分Cb、Cr中是否包含残差。||表示逻辑或。在此,从TU的亮度位置(x0、y0)、色差位置(xC、yC)、TU深度trafoDepth、cfbDepthC的语法元素cbf_luma、cbf_cb、cbf_cr中导出亮度的TU残差标志cbfLuma、色差的TU残差标志cbfChroma,将其和(逻辑或)导出为对象TU的TU残差标志。
(S1771)TT信息解码部13在TU中包含残差的情况(TU残差标志为0以外的情况)下,在TU解码部22中对QP更新信息(量化校正值)进行解码。在此,QP更新信息是表示与量化参数QP的预测值即量化参数预测值qPpred的差分值的值。在此,差分值从绝对值cu_qp_delta_abs和代码cu_qp_delta_sign_flag解码而作为编码数据的语法元素,但并不限于此。
(S1800)TT信息解码部13在TU残差标志(在此为cbfLuma)为0以外的情况下,在TU解码部22中对量化预测残差(residual_coding)进行解码。需要说明的是,TT信息解码部13以及TU解码部22也可以按顺序对多个颜色成分进行解码而作为量化预测残差。在图示的例子中,TT信息解码部13在TU残差标志(在此为cbfLuma)为0以外的情况下,对亮度量化预测残差(第一颜色成分)residual_coding(x0,y0,log2TrafoSize,0)进行解码,在第二颜色成分残差标志cbf_cb为0以外的情况下,对residual_coding(x0,y0,log2TrafoSize,0)进行解码,在第二颜色成分残差标志cbf_cr为0以外的情况下,对第三颜色成分量化预测残差residual_coding(x0,y0,log2TrafoSizeC,2)进行解码。
(S1811)在AMT标志amt_flag为0以外且非零系数的数numCoeff大于coreSIGNUM的情况下(在S1810中为是),TT信息解码部13对AMT索引amt_idx进行解码。
(S1812)在除此以外(AMT标志amt_flag为0或非零系数的数numCoeff为coreSIGNUM以下)的情况下(在S1810中为否),TT信息解码部13不从编码数据对AMT索引amt_idx进行解码,而是输出为amt_idx=0。
<二次变换>
在逆变换部152中,除了上述说明的自适应核变换以外,还可以使用二次变换。
就二次变换而言,在运动图像解码装置1中,在接着逆量化而进行的逆变换中按照二次变换、自适应核变换的顺序来进行(需要说明的是,在运动图像编码装置2中,在变换中按照自适应核变换、二次变换的顺序来进行,并对其结果进行量化)。
在此,使用图18对除了核变换以外还能进行二次变换的逆变换部152的构成进行说明。图18是表示逆变换部152的构成例的功能框图。如图所示,逆变换部152具备核变换部1521(第一变换部)以及二次变换部1522(第二变换部)。二次变换部1522从TT信息解码部13接收表示进行二次变换的信息,并通过对从逆量化部151接收到的变换系数d[][]进行二次变换来复原修正变换系数d[][]。复原后的修正变换系数d[][]从二次变换部1522发送至核变换部1521。如果在未进行二次变换的情况下,则二次变换部1522所接收到的变换系数d[][]被直接从二次变换部1522发送至核变换部1521。
此外,表示二次变换的开关、二次变换的种类的信息可以是sec_idx等索引。此外,也可以不以一个索引sec_idx来表达表示二次变换的开关、二次变换的种类的信息,而是分为两个语法。例如,当分割为表示二次变换的有无的语法sec_flag和表示二次变换的种类的语法sec_trans_idx时,彼此具有以下关系。
sec_flag=sec_idx!=0
sec_trans_idx=sec_idx-1
sec_idx=(sec_flag)?sec_trans_idx+1:0
例如,作为二次变换处理,在不使用二次变换(二次变换关闭)的情况下和选择名称(Name)为二次变换1~3的三个二次变换的变换的情况下,关于二次变换的索引即sec_idx能取得0~3的共计四个值。即,
在sec_idx=0(即,sec_flag=0)的情况下,二次变换部1522不进行二次变换处理,
在sec_idx=1(即,sec_flag=1、sec_trans_idx=0)的情况下,二次变换部1522进行二次变换1(例如,用于水平方向的变换),
在sec_idx=2(即,sec_flag=1、sec_trans_idx=1)的情况下,二次变换部1522进行二次变换2(例如,用于垂直方向的变换),
在sec_idx=3(即,sec_flag=1、sec_trans_idx=2)的情况下,二次变换部1522进行二次变换3(例如,用于水平且垂直方向的变换)。
需要说明的是,sec_idx的值的范围并不限定于上述。例如,代替在上述中0~3的四个阶段,也可以设为0至M-1的M个阶段,M可以是1、2、3、4等值。
核变换部1521接收由二次变换部1522复原的变换系数d[][],进行自适应核变换,导出预测误差r[][]。预测残差r[][]从核变换部1521传送至加法器17。
二次变换针对nTbS×nTbS尺寸的TU(变换系数d[][])按4×4子块执行。二次变换仅在帧内CU中应用,变换基底参照帧内预测模式来确定。变换基底的选择将在后文叙述。
二次变换具有:分离型变换(Rotational Transform:ROT、旋转变换),将子块的变换分为1×4垂直变换和4×1水平变换这两个阶段来进行;以及非分离型二次变换(Non-separable secondary transform:NSST、不可分二次变换),将子块的变换作为一维的16×1矢量变换而一次性进行。
[分离型变换(ROT)]
接着,使用图20对分离型变换(ROT)进行说明。图20是表示图18的二次变换部1522进行分离型变换的情况的二次变换部1522的构成例的图。
二次变换部1522具备二次变换处理导出部15221以及二次变换处理部15222。二次变换处理导出部15221进一步具备二次变换处理设定部152211。另一方面,二次变换处理部15222具备二次变换矩阵导出部152221、子集导出部152222、子集变换处理部152223、以及子集储存部152224。
二次变换处理设定部152211从TT信息解码部13接收索引(sec_idx)。此外,二次变换处理设定部152211基于标志verTrFlag从sec_iex导出表示是否进行垂直变换以及水平变换的变换处理的索引secTrIdx,并将索引secTrIdx(垂直方向二次变换处理索引secTrIdxV,水平方向二次变换处理索引secTrIdxH)传送至二次变换矩阵导出部152221。
secTrIdxH=secTrSet[sec_trans_idx_hor]
secTrIdxV=secTrSet[sec_trans_idx_ver]
在此,sec_trans_idx_ver=sec_idx>>1,sec_trans_idx_hor=sec_idx&1。
二次变换矩阵导出部152221从接收到的表示二次变换处理的参数secTrIdxV,secTrIdxH导出实际的变换(子集变换处理)所需的用于垂直变换的矩阵transMatrixV[][]以及用于水平变换的矩阵transMatrixH[][]。
transMatrixV[][]=secTransMatrix[secTrIdxV][][]
transMatrixH[][]=secTransMatrix[secTrIdxH][][]
二次变换矩阵导出部152221将所导出的矩阵传送至子集变换处理部152223。
二次变换处理部15222按顺序抽出从逆量化部151接收的nTbS×nTbS的变换系数d[][]的一部分,导出子块(4×4的矩阵)(子集导出部152222),以所导出的单位对子块进行变换(子集变换处理部152223),将变换后的子块再次重构为nTbS×nTbS的修正变换系数d[][](子集储存部152224),并输出至核变换部1521。
以下,按顺序设定子块坐标(xS,yS),通过环路处理对各子块进行处理。子块环路为xS=0..nTbS/4-1,yS=0..nTbS/4-1。
子集导出部152222从nTbS×nTbS的变换系数d[][]抽出坐标(xS<<2,yS<<<2)的位置的4×4子块e[][]。
e[i][j]=d[xx][yy],xx=(xS<<2)+i,yy=(yS<<2)+j(i=0..3,j=0..3)
在此,i,j为子块上的位置,xx,yy为nTbS×nTbS的变换系数d[][]上的位置。
子集变换处理部152223对子块e[][]进行参数secTrIdxV,secTrIdxH所示的二次变换处理。子集变换处理部152223在垂直子集变换(垂直的二次变换)中,将子集e[][]变换为临时变量x[][],另一方面,在水平子集变换(水平的二次变换)中,将临时变量x[j][y]变换为g[i][y]。
x[x][i]=Σ(transMatrixV[i][j]×e[x][j])(j=0..3)
g[i][y]=Σ(transMatrixH[i][j]×x[j][y])(j=0..3)
子集储存部152224将g[i][j]储存为修正变换系数d[xx][yy],并将该变换系数(修正变换系数d[][])传送至核变换部1521。
d[xx][yy]=g[i][j],xx=xS+i,yy=yS+j(i=0..3,j=0..3)[非分离型变换(NSST)]
接着,使用图19对非分离型二次变换(NSST)进行说明。图19是表示图18的二次变换部1522进行非分离型变换的情况的二次变换部1522的构成例的图。
二次变换部1522具备二次变换处理导出部15221以及二次变换处理部15222。二次变换处理导出部15221进一步具备二次变换集导出部152212以及二次变换处理设定部152211。另一方面,二次变换处理部15222具备二次变换矩阵导出部152221、子集导出部152222、子集变换处理部152223、以及子集储存部152224。
二次变换集导出部152212参照二次变换集表secTrSetIdxTbl导出与图54(a)所示的帧内预测模式IntraPredMode对应的二次变换集索引secTrSetIdx,并传送至二次变换处理设定部152211。
secTrSetIdx=secTrSetIdxTbl[IntraPredMode]
二次变换处理设定部152211基于sec_idx从图54(a)所示的二次变换集索引secTrSetIdx和图54(b)所示的二次变换集表SecTrSet导出表示二次变换的方法的索引secTrIdx。
secTrIdx=secTrSet[secTrSetIdx][sec_idx]
在此,sec_idx=0表示二次变换关闭。二次变换处理设定部152211将所导出的secTrIdx传送至二次变换矩阵导出部152221。
二次变换矩阵导出部152221从接收到的表示二次变换处理的参数secTrIdx导出实际的变换(子集变换处理)所需的矩阵transMatrix[][]。
transMatrix[][]=secTransMatrixTbl[secTrIdx][][]
二次变换矩阵导出部152221将所导出的变换矩阵传送至子集变换处理部152223。
二次变换处理以构成TU的4×4子块单位进行子集变换。具体而言,由从块导出子块的处理(子集导出部152222)、对子块进行变换的处理(子集变换处理部152223)、将子块储存于块的处理(子集储存部152224)这三个处理构成。
以下,按顺序设定子块坐标(xS,yS),通过环路处理对各子集进行处理。子块环路为xS=0..nTbS/4-1,yS=0..nTbS/4-1。
子集导出部152222从自逆量化部151接收的nTbS×nTbS的变换系数d[][]导出将坐标(xS<<2,yS<<2)的位置的4×4块重排为一维阵列的子块e[j]。
e[j]=d[xx][yy],xx=(xS<<2)+j%4,yy=(yS<<2)+j/4(j=0..15)
子集变换处理部152223在此为非分离型,因此,对16×1矢量e[j]的子块进行变换(子集变换),导出g[i](i=0..15)。
g[i]=Σ(transMatrix[i][j]×x[j])(j=0..15)
子集储存部152224将g[i]储存为变换系数d[xx][yy],并将该修正变换系数d[][]传送至核变换部1521。
d[xx][yy]=y[i],xx=(xS<<2)+i%4,yy=(yS<<2)+i/4(i=0..15)[与二次变换有关的标志sec_idx的解码]
图21是表示本发明的一实施方式的CU信息、PT信息PTI、TT信息TTI的语法表的构成例的图。首先,如图21所示,CU信息解码部21使用解码模块10对CU信息(跳过标志cu_skip_flag、CU预测方式信息PredMode、PU分割类型信息part_mode、残差根标志rqt_root_cbf)进行解码。接着,PU信息解码部12使用解码模块10进行PU信息PUI的解码处理。
在残差根标志rqt_root_cbf为0以外(=1)的情况下,TT信息解码部13对变换树transform_tree进行解码(SYN1700)。
transform_tree(x0,y0,x0,y0,log2CbSize,0,0)
此时,TT信息解码部13可以通过下式导出用于变换树transform_tree的解码的最大TU层MaxTrafoDepth。
MaxTrafoDepth=CuPredMode[x0][y0]==MODE_INTRA?
(max_transform_hierarchy_depth_intra+intraSplitFlag):max_transform_hierarchy_depth_inter)
接着,TT信息解码部13在标志cbf_cu为0以外且预测模式为帧内预测模式的情况下,对索引sec_idx进行解码。
if(cbf_cu&&PredMode==PRED_INTRA)
sec_idx[x0][y0][trafoDepth]
接着,TT信息解码部13在残差根标志rqt_root_cbf为0以外(=1)的情况下,TT信息解码部13对变换树transform_tree进行解码之后,在标志cbf_cu为0以外且预测模式为帧内预测模式的情况下,对索引sec_idx进行解码,使用图22对在此之前的处理进行说明。图22是对发明的一实施方式的TT信息解码部13(TT信息解码S1700)的概略动作进行说明的流程图。需要说明的是,为了便于说明,对进行与已经说明的处理同样的处理的工序以及表示同样的处理的语法标注相同的符号,并省略其说明。
(S1731)TT信息解码部13在对象TU尺寸(例如,对数TU尺寸log2TrafoSize)为规定的变换尺寸的范围(在此为最大对数TU尺寸MaxTbLog2SizeY以下且大于最小对数TU尺寸MinTbLog2SizeY)、且对象TU的TU层trafoDepth小于规定的层(在此为小于最大TU层MaxTrafoDepth)的情况下,对TU分割标志(split_transform_flag)进行解码。更具体而言,在图22的S1721中为是的情况下,进入至S1731,对TU分割标志(split_transform_flag)进行解码(SYN1731)。需要说明的是,TT信息解码部13在IntraSplitFlag==1(N×N)且TU层trafoDepth为0的情况下,也可以不对TU分割标志split_transform_flag进行解码。
(S1732)另一方面,在编码数据#1中未出现split_transform_flag的情况下,即,在S1721中为否的情况)下,TT信息解码部13导出TU分割标志split_transform_flag。更具体而言,在对数TU尺寸log2TrafoSize大于最大对数TU尺寸MaxTbLog2SizeY的情况下,TT信息解码部13将TU分割标志split_transform_flag导出为表示进行分割的值(=1),在除此以外的情况下(对数TU尺寸log2TrafoSize为最小对数TU尺寸MaxTbLog2SizeY以下、或TU层trafoDepth为最大TU层MaxTrafoDepth以上),将TU分割标志split_transform_flag导出为表示不进行分割的值(=0)。
(S1755)TT信息解码部13在TU分割标志split_transform_flag是表示进行分割的值(例如1)的情况下(在S1733中为是),对对数CT尺寸log2CbSize-1、TU层trafoDepth+1的位置(x0,y0)、(x1,y0)、(x0,y1)、(x1,y1)这四个下层的变换树TT进行解码,并返回至S1721。
transform_tree(x0,y0,x0,y0,log2TrafoSize-1,trafoDepth+1,0)
transform_tree(x1,y0,x0,y0,log2TrafoSize-1,trafoDepth+1,1)
transform_tree(x0,y1,x0,y0,log2TrafoSize-1,trafoDepth+1,2)
transform_tree(x1,y1,x0,y0,log2TrafoSize-1,trafoDepth+1,3)
在此,x0,y0为对象变换树的左上坐标,x1,y1是如下式所述将变换树坐标(x0,y0)加上对象TU尺寸(1<<log2TrafoSize)的1/2而导出的坐标(SYN1756)。
x1=x0+(1<<(log2TrafoSize-1))
y1=y0+(1<<(log2TrafoSize-1))
进而,在TU层trafoDepth=0且对象的变换树为帧内预测模式时,对sec_idx进行解码。在不是这样的情况下,不对sec_idx进行解码,而是设置为0。
如上所述,TT信息解码部13在递归地对变换树transform_tree进行解码之前,通过下式将表示变换树TT的层的TU层trafoDepth加1,并将对象TU尺寸即对数CT尺寸log2TrafoSize减1而进行更新。
trafoDepth=trafoDepth+1
log2TrafoSize=log2TrafoSize-1
(S1751)另一方面,在TU分割标志split_transform_flag不为0的情况下(在S1733中为否),TT信息解码部13对表示对象TU中是否包含残差的TU残差标志(例如,cbf_luma)进行解码。在此,作为TU残差标志,使用表示对象TU的亮度成分中是否包含残差的亮度残差标志cbf_luma,但并不限于此。
(S1760)接着,TT信息解码部13在TU分割标志split_transform_flag为0的情况下,对SYN1760所示的变换单元TUtransform_unit(x0,y0,xBase,yBase,log2TrafoSize,trafoDepth,blkIdx)进行解码。
(S1761)TT信息解码部13在TU残差标志cbf_luma的和为0且预测模式为帧内预测模式的情况下,对与二次变换有关的索引sec_idx进行解码。
需要说明的是,在上述的例子中,对以CU级别对与二次变换有关的索引sec_idx进行解码的情况进行了说明,但并不限定于此。例如,也可以以TT级别对sec_idx进行解码。对于这种变形例,以下使用图23以及图24进行说明。
如图23所示,也可以以TT级别对TT信息解码部13对与二次变换有关的索引sec_idx进行解码的处理(图21的最后两行)进行处理。图23是对发明的一实施方式的TT信息解码部13(TT信息解码S1700)的概略动作进行说明的流程图。此外,图24是表示本发明的一实施方式的TT信息TTI的语法表的构成例的图。
(S1755a)TT信息解码部13在TU分割标志split_transform_flag是表示进行分割的值(例如1)(在S1733中为是)、且TU层trafoDepth为0、且预测模式为帧内预测模式的情况下(在S1754a中为是),对与二次变换有关的索引sec_idx进行解码(SYN1755a)。即使在除此以外的情况下(在S1754a中为否),也导出为sec_idx=0,并转移至S1756。
(1756)TT信息解码部13对对数CT尺寸log2CbSize-1、TU层trafoDepth+1的位置(x0,y0)、(x1,y0)、(x0,y1)、(x1,y1)这四个下层的变换树TT进行解码。
(S1751)另一方面,在TU分割标志split_transform_flag为0的情况下(在S1733中为否),TT信息解码部13对TU残差标志(例如,cbf_luma)进行解码。在此,作为TU残差标志,使用表示对象TU的亮度成分中是否包含残差的亮度残差标志cbf_luma,但并不限于此。
(S1753a)TT信息解码部13在TU层trafoDepth为0、且TU残差标志(例如,cbf_luma)不为0、且预测模式为帧内预测模式的情况下(在S1752a中为是),对与二次变换有关的索引sec_idx进行解码(SYN1753a)。在除此以外的情况下(在S1752a中为否),TT信息解码部13不从编码数据对与二次变换有关的索引sec_idx进行解码,而是导出为sec_idx=0,并转移至S1760。
(S1760)TT信息解码部13在TU分割标志split_transform_flag为0的情况下,对SYN1760所示的变换单元TU进行解码。
transform_unit(x0,y0,xBase,yBase,log2TrafoSize,trafoDepth,blkIdx)
接着,使用图25以及图26对以TU级别对sec_idx进行解码的变形例进行说明。图25是对发明的一实施方式的TU解码部22(TU信息解码S1760)的概略动作进行说明的流程图。此外,图26(a)是表示本发明的一实施方式的TU信息的语法表的构成例的图,图26(b)是与amt_idx、sec_idx的解码部分有关的伪代码描述。
(S1781)TU解码部22判定TU中是否包含残差(TU残差标志是否为0以外)。需要说明的是,作为TU残差标志,也可以使用表示对象TU的亮度成分中是否包含残差的亮度残差标志cbf_luma。
(S1771)TU解码部22在TU中包含残差的情况(TU残差标志为0以外的情况)下,对QP更新信息(量化校正值)进行解码。在此,QP更新信息是表示与量化参数QP的预测值即量化参数预测值qPpred的差分值的值。在此,差分值从绝对值cu_qp_delta_abs和代码cu_qp_delta_sign_flag解码而作为编码数据的语法元素,但并不限于此。
(S1800)TU解码部22在TU残差标志(在此为cbfLuma)为0以外的情况下,对量化预测残差(residual_coding)进行解码。需要说明的是,TT信息解码部13也可以按顺序对多个颜色成分进行解码而作为量化预测残差。
(S1811a)在预测模式为帧内预测模式且非零系数的数numCoeff大于secSIGNUM的情况下(在S1810a中为是),TT信息解码部13对与二次变换有关的索引sec_idx进行解码(SYN1811a)。
(S1812a)除此以外(在预测模式不为帧内预测模式、或者非零系数的数numCoeff为secSIGNUM以下的情况下)(在S1810中为否),TT信息解码部13不从编码数据对用于二次变换的索引sec_idx进行解码,而是导出为sec_idx=0。
TU解码部22在AMT索引amt_flag为0以外且非零系数的数numCoeff大于coreSIGNUM的情况下,对AMT索引amt_idx进行解码(SYN1812a)。在除此以外的情况下(AMT索引amt_flag为0、或者非零系数的数numCoeff为coreSIGNUM以下),不从编码数据对AMT索引amt_idx进行解码,而是导出为amt_idx=0。
<AMT标志amt_flag以及用于二次变换的索引sec_idx>
接着,使用图51对导出在自适应核变换中使用的AMT索引amt_idx的例子进行说明。
如图51(a)所示,AMT索引amt_idx可以对8×8CU(trafoDepth=0)分配一个(例如,AMT索引amt_idx=3)。或者,如图51(b)所示,也可以对8×8CU所包含的各4×4TU分配AMT索引amt_idx。或者,如图51(c)所示,也可以对16×16CU所包含的四个8×8TU中的若干个(在图示中为三个)逐一分配AMT索引amt_idx,也可以对剩余的8×8TU(在图示中为右上的一个)所包含的各4×4TU逐一分配索引amt_idx。如此,可以按CU逐一分配AMT索引amt_idx(例如,AMT索引amt_idx=0~3),也可以按TU逐一分配。
接着,使用图52以及图53对导出与二次变换有关的索引sec_idx的例子进行说明。图52是表示按CU导出与二次变换有关的索引sec_idx的例子的图,图53是表示按TU导出与二次变换有关的索引sec_idx的例子的图。
图52的CU级别中的sec_idx可以对(a)8×8CU(trafoDepth=0)、(b)4×4TU(即,trafoDepth=1)、(c)16×16CU所包含的8×8TU以及4×4TU分配1个(例如,与二次变换有关的索引sec_idx=0~1)。
此外,如图53所示,TU级别中的与二次变换有关的索引sec_idx可以对8×8TU(trafoDepth=0)、4×4TU(trafoDepth=1)、16×16CU所包含的8×8TU(trafoDepth=1)以及4×4TU(trafoDepth=2)分别逐一分配(例如,与二次变换有关的索引sec_idx=0~3)。
(可执行二次变换以及核变换的运动图像解码装置中的TT信息解码部以及逆变换部的构成)
使用图27对TT信息解码部13以及逆变换部152的构成进行说明。图27是表示TT信息解码部13以及逆变换部152的构成的一个例子的功能框图。TT信息解码部13具备sec_idx解码部131、amt_flag解码部132、以及amt_idx解码部133,并进行TT信息解码和TU信息解码。逆变换部152具备二次变换部1522以及核变换部1521。
当TT信息解码部13从CU信息解码部21接收编码数据时,sec_idx解码部131对sec_idx进行解码,并将解码后的sec_idx传送至二次变换部1522。
amt_flag解码部132对AMT标志amt_flag进行解码,并将解码后的AMT标志amt_flag传送至AMT索引amt_idx解码部133以及核变换部1521。
amt_idx解码部133根据接收到的AMT标志amt_flag对AMT索引amt_idx进行解码,并将解码后的AMT索引amt_idx传送至核变换部1521。
二次变换部1522根据sec_idx的值,选择并执行是否对变换系数d[][]进行二次变换、以及在进行二次变换的情况下进行哪一个二次变换。另一方面,核变换部1521从二次变换部1522接收变换系数d[][],并进行与AMT标志amt_flag以及AMT索引amt_idx的值对应的变换处理。
在此,sec_idx解码部131可以以TU级别对sec_idx进行解码,或者也可以以TT级别对sec_idx进行解码。因此,可以具有如下构成:(1)sec idx解码部131和amt_flag解码部132以TT级别进行解码、amt_idx解码部133以TU级别进行解码;以及(2)amt_flag解码部132以TT级别进行解码、sec_idx解码部131和amt_idx解码部133以TU级别进行解码。TT信息解码部13可以是该(1)以及(2)中的任一个构成。
具备二次变换部1522和核变换部1521的逆变换部152能进行二次变换和核变换双方,进行预测残差的复原。然而,例如在对4×4TU级别等小TU尺寸的预测残差进行复原的情况下,进行二次变换和核变换双方会造成处理量以及所使用的标志的浪费。其原因在于,在以4×4TU级别等小TU为对象的变换处理的情况下,只要进行二次变换和核变换中的任一方,就能充分地使能量充分集中。
以下,对为了避免进行二次变换和核变换双方的浪费的产生而有效的构成进行说明。
〔实施方式2〕
(根据TU的尺寸而不进行自适应核变换以及二次变换中的任一方的构成)
逆量化/逆变换部15(即,运动图像解码装置1)具备:核变换部1521,构成为能对TU应用自适应核变换(第一变换);以及二次变换部1522,构成为能在自适应核变换之前对TU所包含的子块中至少任一个子块应用二次变换(第二变换),可以根据与自适应核变换有关的AMT标志amt_flag(第一标志)以及与二次变换有关的标志sec_idx(第二标志)中的至少任一个或CTU的尺寸,省略由核变换部1521或二次变换部中的任一个进行的变换。
逆量化/逆变换部15应用自适应核变换以及二次变换中的至少任一方来对预测残差D进行复原。逆量化/逆变换部15可以构成为:在TU的尺寸大于规定尺寸(例如,8×8、16×16、32×32、64×64、……)的情况下进行自适应核变换和二次变换双方,但在TU的尺寸为规定尺寸以下(例如,4×4)的情况下,仅进行自适应核变换以及二次变换中的任一方。
(根据二次变换处理的有无来确定执行/不执行自适应核变换的构成1)
逆量化/逆变换部15可以构成为如下。在二次变换处理部15222中,在对TU进行二次变换的情况下(sec_idx!=0)、且TU的尺寸为规定尺寸以下(例如,4×4)的情况下,不进行核变换。反之,在条件XS=与二次变换有关的索引sec_idx为0(即,不进行二次变换,sec_flag=0)、或TU的对数TU尺寸大于规定尺寸(log2TrafoSize!=2)的情况下,进行核变换。当以伪代码表示时,则如下所述。
if((sec_idx==0||log2TrafoSize!=2))
自适应核变换(核变换处理部15212的处理)
需要说明的是,在变换尺寸的最小尺寸为4×4的情况下,对数变换尺寸的最小值为2,因此,log2TrafoSize!=2的算式表示TU尺寸(变换尺寸)为最小尺寸以外(就是说,大于最小尺寸)。
以下,大于规定尺寸的条件Z不取决于log2TrafoSize!=2。例如,可以使用
log2TrafoSize>TH。例如TH=2,3。
此外,大于规定尺寸的条件Z进一步可以在TU的宽度和高度的2的对数分别为log2TrafoW、log2TrafoH的情况下,使用以下的条件Z1、条件Z2、条件Z3中的任一个。
Z1:log2TrafoW+log2TrafoH!=TH
Z2:log2TrafoW+log2TrafoH>TH
Z3:max(log2TrafoW,log2TrafoH)>TH
在此,例如TH=3,4。
在TU的宽度和高度为TbW,TbH的情况下,可以以使用与上述条件Z1、Z2、Z3同等的以下条件Z1'、Z2'、Z3'的方式来表达。
Z1':TbW+TbH!=TH
Z2':TbW+TbH>TH
Z3':max(TbW,TbH)>TH
在此,例如TH=8,12,16。
或者,TT信息解码部13也可以构成为如下。也可以是如下构成:在逆量化/逆变换部15中,在对TU进行二次变换的情况下,省略TT信息解码部13中的AMT索引amt_idx的解码,以便不进行TU尺寸为规定尺寸以下(例如,4×4)的情况下的自适应核变换。
使用图28对这样构成的TT信息解码部13以及逆变换部152的构成进行说明。图28是表示TT信息解码部13以及逆变换部152的构成的一个例子的功能框图。与图27同样地,TT信息解码部13具备sec_idx解码部131、amt_flag解码部132、以及amt_idx解码部133,逆变换部152具备二次变换部1522以及核变换部1521。
当TT信息解码部13从CU信息解码部21接收编码数据时,sec_idx解码部131对sec_idx进行解码,并将解码后的sec_idx传送至amt_idx解码部133、二次变换部1522、以及核变换部1521。amt_flag解码部132对AMT标志amt_flag进行解码,并将解码后的AMT标志amt_flag传送至amt_idx解码部133以及核变换部1521。amt_idx解码部133根据接收到的sec_idx和AMT标志amt_flag来确定是否对AMT索引amt_idx进行解码。
例如,amt_idx解码部133在接收到的sec_idx表示在二次变换部1522中进行二次变换、且TU尺寸小于规定尺寸TH的情况下,或者在amt_flag=0的情况下,不从编码数据对AMT索引amt_idx进行解码,而是导出为amt_idx=0,并传送至核变换部1521。在该情况下,核变换部1521接收amt_idx=0,据此不进行核变换处理。
另一方面,在上述以外的情况下,对AMT索引amt_idx进行解码,并传送至核变换部1521。需要说明的是,由sec_idx解码部131进行的sec_idx的解码和由amt_flag解码部132进行的AMT标志amt_flag的解码也可以以TT级别来进行。或者,由sec_idx解码部131进行的sec_idx的解码也可以以TU级别来进行。
图29是表示以TT级别进行本发明的一实施方式的sec_idx以及amt_flag的解码时的TT信息TTI的语法表的构成例的图,图30是表示以TU级别对amt_idx进行解码的本发明的一实施方式的TU信息TUI的语法表的构成例的图。需要说明的是,为了便于说明,对表示与已经说明的语法(例如,图12以及图13)相同的处理的语法标注相同的符号,并省略其说明。
TT信息解码部13在TU分割标志split_transform_flag是表示进行分割的值(例如1)(相当于在图23的S1733中为是)、且TU层trafoDepth为0、且预测模式为帧内预测模式的情况下(相当于在图23的S1754a中为是),可以对与二次变换有关的索引sec_idx进行解码(SYN1755c)。if(trafoDepth==0&&PredMode==PRED_INTRA)
sec_idx[x0][y0][trafoDepth]
而且,如果TU层trafoDepth为0,则也可以对AMT标志amt_flag进行解码(SYN1753b)。
if(trafoDepth==0)
amt_flag[x0][y0][trafoDepth]
另一方面,在TU分割标志split_transform_flag为0的情况下,TT信息解码部13对TU残差标志(例如,cbf_luma)进行解码。此外,TT信息解码部13在TU标志(在此为cbfLuma)不为0、TU层trafoDepth为0、且预测模式为帧内预测模式的情况下,也可以对与二次变换有关的索引sec_idx进行解码(SYN1753b)。
if(cbf_luma[x0][y0][trafoDepth]&&trafoDepth==0&&PredMode==PRED_INTRA)
sec_idx[x0][y0][trafoDepth]
而且,如果TU残差标志(在此为cbfLuma)不为0且TU层trafoDepth为0,则TT信息解码部13对AMT标志amt_flag进行解码(SYN1753c),并对SYN1760所示的变换单元TU进行解码。
if(cbf_luma[x0][y0][trafoDepth]&&trafoDepth==0)
amt_flag[x0][y0][trafoDepth]
transform_unit(x0,y0,xBase,yBase,log2TrafoSize,trafoDepth,blkIdx)
接着,使用图30对TT信息解码部13对TU信息进行解码的处理(图29的S1760)进行说明。图30(a)是表示本发明的一实施方式的TU信息的语法表的构成例的图,图30(b)是amt_idx解码部分的伪代码描述。
TU解码部22判定TU中是否包含残差,在TU中包含残差的情况(TU残差标志为0以外的情况下,对QP更新信息(量化校正值)进行解码(SYN1781)。
TU解码部22在TU残差标志(在此为cbfLuma)为0以外的情况下,对量化预测残差(residual_coding)进行解码。需要说明的是,TT信息解码部13也可以按顺序对多个颜色成分进行解码而作为量化预测残差。
TT信息解码部13在TU的尺寸为规定尺寸(在此为log2TrafoSize=2)、且二次变换索引sec_idx为0以外(即,进行二次变换的情况)时,也可以省略与自适应核变换有关的信息、在此为AMT索引amt_idx的解码。
更具体而言,进一步增加条件,在条件A(=AMT标志amt_flag为0以外)、且条件B(=非零系数的数numCoeff大于coreSIGNUM)、且条件XS(=与二次变换有关的索引sec_idx为0(不进行二次变换)、或TU的对数TU尺寸大于log2TrafoSize=2))的情况下,amt_idx解码部133也可以对AMT索引amt_idx进行解码(SYN1811)。
除此以外(不满足条件A(=AMT标志amt_flag为0)、或条件B(=非零系数的数numCoeff为coreSIGNUM以下、或不满足条件XS(=变换块的对数TU尺寸log2TrafoSize为2)、且不满足条件XS(=与二次变换有关的索引sec_idx不为0(即,进行二次变换))的情况下),amt_idx解码部133不对AMT索引amt_idx进行解码(SYN1812)。
如果这样构成,则逆量化/逆变换部15能对4×4TU等小变换块应用自适应核变换以及二次变换中的至少任一方,而无浪费且有效地对预测残差r[][]进行复原。此外,在TU的尺寸为规定尺寸(在此为log2TrafoSize=2)且进行二次变换时,不对用于核变换的信息amt_idx进行解码,因此,不会白白地对语法进行编码。
此外,TT信息解码部13也可以是如下构成:在不满足条件XS(=sec_idx为0以外(进行二次变换))、或变换块的对数TU尺寸为规定尺寸以下(log2TrafoSize==2)的情况下,不进行自适应核变换中的选择性自适应核变换。就是说,虽然不进行自适应核变换,但进行固定变换。具体而言,可以设为以下。
if((sec_idx!=0&&log2TrafoSize==2))
amt_flag=0(进行固定变换)
(根据二次变换处理的有无来确定执行/不执行自适应核变换的构成2)
也可以是如下构成:在逆量化/逆变换部15中,省略TT信息解码部13中的AMT标志amt_flag的解码,并设为amt_flag=0,以便二次变换部1522对变换块进行二次变换,且不进行TU的尺寸为规定尺寸以下(例如,4×4)的情况下的自适应核变换。
使用图31对这样构成的TT信息解码部13以及逆变换部152的构成进行说明。图31是表示TT信息解码部13以及逆变换部152的构成的一个例子的功能框图。TT信息解码部13具备sec_idx解码部131、amt_flag解码部132、以及amt_idx解码部133,逆变换部152具备二次变换部1522以及核变换部1521。
当TT信息解码部13从CU信息解码部21接收编码数据时,sec_idx解码部131对sec_idx进行解码,并将解码后的sec_idx传送至amt_idx解码部133、二次变换部1522、amt_flag解码部132、以及核变换部1521。amt_flag解码部132参照接收到的sec_idx来确定是否对AMT标志amt_flag进行解码,并将解码后的AMT标志amt_flag传送至amt_idx解码部133以及核变换部1521。amt_idx解码部133根据接收到的sec_idx和AMT标志amt_flag来对AMT索引amt_idx进行解码。
amt_flag解码部132在接收到的sec_idx表示条件XS(=进行二次变换(sec_idx!=0)的情况下,且在变换尺寸不为规定尺寸以下(例如,log2TrafoSize==3))的情况下,不从编码数据对用于核变换的语法(AMT标志amt_flag)进行解码,而是设为amt_flag=0并传送至核变换部1521。在该情况下,核变换部1521接收amt_flag=0,据此不进行选择性核变换处理。
反之,amt_flag解码部132在接收到的sec_idx表示条件XS(=不进行二次变换(sec_idx=0)、或者变换尺寸大于规定尺寸(例如,log2TrafoSize!=2、或者log2TrafoSize>3))的情况下,对用于核变换的语法(AMT标志amt_flag)进行解码,并传送至amt_idx解码部133以及核变换部1521。
图32是表示本发明的一实施方式的TT信息TTI的语法表的构成例的图。
在TU分割标志split_transform_flag是表示进行分割的值(例如1)的情况下,也可以通过以下处理来对sec_idx和amt_flag进行解码。在TU层trafoDepth为0且预测模式为帧内预测模式的情况下,sec_idx解码部131也可以对与二次变换有关的索引sec_idx进行解码(SYN1755d)。
if(trafoDepth==0&&PredMode==PRED_INTRA)
sec_idx[x0][y0][trafoDepth]
而且,在条件T(=TU层trafoDepth为0)、且条件XS(=变换块的对数TU尺寸log2TrafoSize大于3或sec_idx为0)的情况下,amt_flag解码部132也可以对AMT标志amt_flag进行解码(SYN1755e)。
if(trafoDepth==0&&(sec_idx==0||log2TrafoSize>3))
amt_flag[x0][y0][trafoDepth]
在除此以外的(不满足条件T(=TU层trafoDepth为0)、或者不满足条件XS(=sec_idx为0,或者TU的尺寸为规定尺寸(log2TrafoSize==3)以下)的情况下,省略AMT标志amt_flag从编码数据的解码。在amt_flag未被解码的情况下,导出为0。在TU分割标志split_transform_flag为1的情况下,CU被分割为多个TU,因此尺寸为log2TrafoSize==2。
另一方面,在TU分割标志split_transform_flag是表示不进行分割的0的情况下,也可以通过以下处理来对sec_idx以及amt_flag进行解码。
在TU残差标志(例如,cbf_luma)为0以外、且TU层trafoDepth为0、且预测模式为帧内预测模式的情况下,sec_idx解码部131也可以对与二次变换有关的索引sec_idx进行解码(SYN1753d)。
if(cbf_luma[x0][y0][trafoDepth]&&trafoDepth==0&&PredMode==PRED_INTRA)
sec_idx[x0][y0][trafoDepth]
而且,amt_flag解码部132在TU残差标志(在此为cbfLuma)为0以外、且条件T=TU层trafoDepth为0、且条件XS(=变换块的对数TU尺寸log2TrafoSize为2以外或者sec_idx为0)的情况下,amt_flag解码部132也可以对AMT标志amt_flag进行解码(SYN1753e)。
if(cbf_luma[x0][y0][trafoDepth]&&trafoDepth==0&&(sec_idx==0||log2TrafoSize!=2))
amt_flag[x0][y0][trafoDepth]
即,在不满足条件XS(=不进行二次变换(sec_idx=0))、且TU的尺寸为规定尺寸(log2TrafoSize==2)的情况下,省略AMT标志amt_flag的解码。
如果这样构成,而且TU的尺寸为规定尺寸(在此为log2TrafoSize=2)、且进行二次变换时,不对用于核变换的信息amt_flag进行解码,因此,不会白白地对语法进行编码。
(根据二次变换处理的有无来确定执行/不执行自适应核变换的构成3)
在上述中,使用图29以及图30所示的语法表对以TU级别进行由sec_idx解码部131进行的sec_idx的解码和由amt_flag解码部132进行的AMT标志amt_flag的解码的情况进行了说明,但并不限定于此。在此,使用图33以及图34对如下处理进行说明:在具备图28所示的构成的TT信息解码部13中,在以TU级别进行由sec_idx解码部131进行的sec_idx的解码和由amt_idx解码部133进行的AMT索引amt_idx的解码的情况下,对sec_idx、AMT标志amt_flag、以及AMT索引amt_idx进行解码。图33(a)是表示本发明的一实施方式的TT信息TTI的语法表的构成例的图,图33(b)是amt_flag解码部分的伪代码描述。
如图33所示,amt_flag解码部132在TT级别下,在split_transform_flag不为0(进行分割)的情况下,如果TU层trafoDepth为0,则对AMT标志amt_flag进行解码(SYN1755f)。
if(trafoDepth==0)
amt_flag[x0][y0][trafoDepth]
此外,在split_transform_flag为0(不进行分割)的情况下,amt_flag解码部132在TU残差标志(在此为cbfLuma)和TU层trafoDepth为0的情况下,amt_flag解码部132也可以对AMT标志amt_flag进行解码(SYN1753f)。
if(cbf_luma[x0][y0][trafoDepth]&&trafoDepth==0)
amt_flag[x0][y0][trafoDepth]
并且,TT信息解码部13在TU分割标志split_transform_flag为0的情况下,对SYN1760所示的变换单元TU进行解码。
transform_unit(x0,y0,xBase,yBase,log2TrafoSize,trafoDepth,blkIdx)
接着,使用图34对TT信息解码部13对TU信息进行解码的处理进行说明。图34(a)是表示本发明的一实施方式的TU信息TUI的语法表的构成例的图,图34(b)是amt_idx解码部分的伪代码描述。
在预测模式为帧内预测模式、且非零系数的数numCoeff大于coreSIGNUM的情况下,TU解码部22也可以对与二次变换有关的索引sec_idx进行解码(SYN1811c)。
if(predMode==PRED_INTRA&&numCoeff>coreSIGNUM)
sec_idx[x0][y0][trafoDepth]
在除此以外的情况下,设置为sec_idx=0。
在条件A(=AMT标志amt_flag为0以外)、且条件B(=非零系数的数numCoeff大于coreSIGNUM)、且条件XS(=与二次变换有关的索引sec_idx为0或者对数TU尺寸log2TrafoSize为2以外)的情况下,TT信息解码部13也可以对用于自适应核变换的AMT索引amt_idx进行解码(SYN1812c)。
if(amt_flag!==0&&numCoeff>coreSIGNUM&&(sec_idx==0||(log2TrafoSize!=2))
amt_idx[x0][y0][trafoDepth]
(根据二次变换处理的有无来确定执行/不执行自适应核变换的构成4)
在上述中,列举若干个例子对根据二次变换处理的有无来确定执行/不执行自适应核变换的构成进行了说明,但并不限定于此。即,运动图像解码装置1也可以是如下构成:在根据二次变换的有无来确定执行/不执行自适应核变换处理的构成中,也关于语法的解码先对自适应核变换处理的参数(amt_flag、amt_idx)进行解码,再参照其对二次变换的参数(索引sec_idx)进行解码。使用图35、图40对具备这种构成的TT信息解码部13以及逆变换部152的其它构成例进行说明。
逆量化/逆变换部15可以构成为如下。在TU的尺寸为规定尺寸以下(例如,4×4)的情况下,在对TU进行二次变换的情况下,不进行核变换。
即,在sec_idx=1且对数TU尺寸大于规定尺寸的(log2TrafoSize!=2))情况下,不进行核变换。在除此以外的情况下,根据amt_flag的值,如果是0则实施固定变换,如果是1则实施选择性核变换。
if((sec_idx==1&&log2TrafoSize=2))
nothing;//仅进行二次变换
else if(amt_flag==0)
固定变换
else
选择性核变换(核变换处理部15212的处理)
接着,对语法的解码进行说明。TT信息解码部13具备sec_idx解码部131、amt_flag解码部132、以及amt_idx解码部133,逆变换部152具备二次变换部1522以及核变换部1521。
当TT信息解码部13从CU信息解码部21接收编码数据时,amt_flag解码部132对AMT标志amt_flag进行解码,并将解码后的AMT标志amt_flag传送至sec_idx解码部131、amt_idx解码部133、以及核变换部1521。sec_idx解码部131参照amt_flag对与二次变换有关的索引sec_idx进行解码,并将解码后的与二次变换有关的索引sec_idx传送至二次变换部1522以及核变换部1521。amt_idx解码部133参照接收到的AMT标志amt_flag对AMT索引amt_idx进行解码。
例如,sec_idx解码部131在接收到的AMT标志amt_flag表示在核变换部1521中进行自适应核变换的情况下(amt_flag!=0),且在变换尺寸为规定尺寸的情况下(log2TrafoSize==2),不从编码数据对与二次变换有关的索引sec_idx进行解码,而是设为sec_idx=0并传送至二次变换部1522以及核变换部1521。在该情况下,二次变换部1522接收sec_idx=0,据此不进行二次变换处理。
另一方面,sec_idx解码部131在接收到的AMT标志amt_flag表示在核变换部1521中不进行自适应核变换的情况下(例如,amt_flag=0),对与二次变换有关的索引sec_idx进行解码。需要说明的是,由sec_idx解码部131进行的sec_idx的解码和由amt_flag解码部132进行的AMT标志amt_flag的解码也可以以TT级别来进行。
在该情况下,二次变换部1522导出为sec_idx=0,不进行二次变换处理。在TU的尺寸为规定尺寸以下(例如,4×4)的情况下,仅进行二次变换而不进行核变换的构成的情况下,反之,在进行核变换的情况下不进行二次变换。因此,在自适应核变换中进行选择性变换的情况(amt_flag!=0)下,省略与二次变换有关的语法sec_idx的解码,由此能避免无用的编码。
此外,也可以是图40所示的构成。即,在预测模式为帧内预测模式、且非零系数的数numCoeff大于coreSIGNUM的情况下,TU解码部22也可以对与核变换有关的参数(在此为amt_idx)进行解码(SYN1811e)。
if(predMode==PRED_INTRA&&numCoeff>coreSIGNUM)
amt_idx[x0][y0][trafoDepth]
在变换尺寸为规定尺寸(例如,log2TrafoSize==2)或者自适应核变换的标志amt_flag是表示使用选择性核变换的1的情况下,也可以省略用于二次变换的语法(在此为索引sec_idx)的解码。反过来说,在条件XC(=变换尺寸为规定尺寸以外(log2TrafoSize!=2)或者AMT标志amt_flag为0)的情况下,也可以对用于二次变换的语法(索引sec_idx)进行解码。
更具体而言,进一步增加条件,在条件I(=预测模式为帧内)、且条件B(=非零系数的数numCoeff大于secSIGNUM)、且条件XC(=AMT标志amt_flag为0或者对数TU尺寸log2TrafoSize为2以外)的情况下,TU解码部22也可以对用于二次变换的索引sec_idx进行解码(SYN1811e)。
if(predMode==PRED_INTRA&&numCoeff>secSIGNUM&&(amt_flag==0||(log2TrafoSize!=2))
sec_idx[x0][y0][trafoDepth]
在除此以外(不满足条件I(=预测模式为帧内)、或者不满足条件B(=非零系数的数numCoeff大于secSIGNUM)、或者不满足条件XC(=AMT标志amt_flag为0或对数TU尺寸log2TrafoSize为2以外)的情况)的情况下,TU解码部22也可以省略用于二次变换的索引sec_idx的解码。
需要说明的是,在amt_idx的解码时,参照sec_idx,在sec_idx=1(不进行核变换)的情况下,也可以省略amt_idx的解码。
(根据TU尺寸来确定执行/不执行自适应核变换处理的构成)
在上述例子中,对根据二次变换处理或自适应核变换中的任一方的变换处理的有无来确定执行/不执行另一方的变换处理的构成进行了说明,但并不限定于此。即,运动图像解码装置1也可以是如下构成:在作为进行变换处理的对象的TU的尺寸(例如,对数TU尺寸log2TrafoSize)为规定尺寸以下的情况下,仅进行二次变换(省略自适应核变换)。使用图36对具备这种构成的TT信息解码部13以及逆变换部152的其它构成例进行说明。
当TT信息解码部13从CU信息解码部21接收编码数据以及对应TU尺寸(在图示的例子中为对数TU尺寸log2TrafoSize)时,如果由对数TU尺寸log2TrafoSize表示的TU为规定尺寸(例如4×4,即对数TU尺寸log2TrafoSize=2)以下,则amt_flag解码部132不对AMT标志amt_flag进行解码,而是设定为amt_flag=0,并传送至amt_idx解码部133以及核变换部1521。另一方面,在由对数TU尺寸log2TrafoSize表示的TU大于规定尺寸(例如,4×4)的情况下,amt_flag解码部132对AMT标志amt_flag进行解码。需要说明的是,由sec_idx解码部131进行的sec_idx的解码和由amt_flag解码部132进行的AMT标志amt_flag的解码也可以以TT级别来进行。或者,由sec_idx解码部131进行的sec_idx的解码和由amt_idx解码部133进行的AMT索引amt_idx的解码也可以以TU级别来进行。
并且,amt_idx解码部133参照接收到的AMT标志amt_flag对AMT索引amt_idx进行解码。在此,不管AMT标志的值如何,sec_idx解码部131均对与二次变换有关的索引sec_idx进行解码,并将解码后的与二次变换有关的索引sec_idx传送至二次变换部1522。
与这种构成对应的伪代码描述例如如以下的(1)~(4)中的任一个所示。
(1)
if(sec_idx)
二次变换处理
if(log2TrafoSize!=2)
自适应核变换
在该情况下,在log2TrafoSize=2时,仅实施二次变换。
(2)
if(sec_idx)
二次变换处理
if(amt_flag&&log2TrafoSize!=2)
自适应核变换
else
固定变换
在此,固定变换是指逆变换部152对TU使用预先规定的变换规定的变换处理,并不是根据amd_idx确定的选择性变换,而是固定性变换(例如DCT2、DST1)。
(3)
Figure BDA0003125435300000581
(4)
Figure BDA0003125435300000582
(在进行自适应核变换处理的情况下省略二次变换处理的构成1)
运动图像解码装置1也可以是如下构成:在核变换部1521中进行自适应核变换处理的情况下,省略二次变换部1522中的二次变换。使用图37对具备这种构成的TT信息解码部13以及逆变换部152的其它构成例进行说明。
逆量化/逆变换部15可以构成为如下。在核变换处理部15212中,在对TU进行核变换的情况下,在TU的尺寸为规定尺寸以下(例如,4×4)的情况下不进行二次变换。反之,在条件XC(=AMT标志amt_flag为0、或TU的对数TU尺寸大于规定尺寸(log2TrafoSize!=2))的情况下进行核变换。
if((amt_flag==0||log2TrafoSize!=2))
二次变换(二次变换处理部15222的处理)
或者,TT信息解码部13也可以构成为如下。也可以是如下构成:在逆量化/逆变换部15中,在对TU进行选择性自适应核变换的情况下(amt_flag!=0)、且TU的尺寸为规定尺寸以下(例如,4×4)的情况下,省略TT信息解码部13中的二次变换的语法(sec_idx)的解码而设为sec_idx=0,以便不进行二次。
当TT信息解码部13从CU信息解码部21接收编码数据时,amt_flag解码部132对AMT标志amt_flag进行解码,并将解码后的AMT标志amt_flag传送至amt_idx解码部133、二次变换部1522、以及核变换部1521。不管AMT标志的值如何,sec_idx解码部131均对与二次变换有关的索引sec_idx进行解码,并将解码后的与二次变换有关的索引sec_idx传送至二次变换部1522以及amt_idx解码部133。并且,amt_idx解码部133参照接收到的AMT标志amt_flag以及与二次变换有关的索引sec_idx和AMT标志amt_flag对AMT索引amt_idx进行解码,并传送至核变换部1521。需要说明的是,由sec_idx解码部131进行的sec_idx的解码和由amt_flag解码部132进行的AMT标志amt_flag的解码也可以以TT级别来进行。或者,由sec_idx解码部131进行的sec_idx的解码也可以以TU级别来进行。
二次变换部1522参照接收到的AMT标志amt_flag以及与二次变换有关的索引sec_idx来确定是否进行二次变换。需要说明的是,在未进行二次变换的情况下,就图18的修正变换系数d[][]而言,变换系数d[][]被直接发送至核变换部1521。
接着,使用图38对TU解码部22对TU信息进行解码的处理进行说明。图38(a)是表示本发明的一实施方式的TU信息TUI的语法表的构成例的图,图38(b)是sec_idx和amt_idx的解码部分的伪代码描述。
在预测模式为帧内预测模式、且非零系数的数numCoeff大于coreSIGNUM的情况下,TU解码部22也可以对与二次变换有关的索引sec_idx进行解码(SYN1811d)。
if(predMode==PRED_INTRA&&numCoeff>coreSIGNUM)
sec_idx[x0][y0][trafoDepth]
在条件A(=AMT标志amt_flag为0以外)、且条件B(=非零系数的数numCoeff大于coreSIGNUM)、且条件XS(=与二次变换有关的索引sec_idx为0或者对数TU尺寸log2TrafoSize为2以外)的情况下,TU解码部22也可以对用于自适应核变换的AMT索引amt_idx进行解码(SYN1812d)。
if(amt_flag!==0&&numCoeff>coreSIGNUM&&(sec_idx==0||(log2TrafoSize!=2))
amt_flag[x0][y0][trafoDepth]
在除此以外(不满足条件A(=AMT标志amt_flag为0以外)、或者不满足条件B(=非零系数的数numCoeff大于coreSIGNUM)、或者不满足条件XS(=与二次变换有关的索引sec_idx为0或对数TU尺寸log2TrafoSize为2以外)的情况下),TU解码部22也可以省略用于自适应核变换的索引sec_idx的解码。
(在进行自适应核变换处理的情况下省略二次变换处理的构成2)
或者,运动图像解码装置1也可以是如图39所示的构成。
当TT信息解码部13从CU信息解码部21接收编码数据时,amt_flag解码部132对AMT标志amt_flag进行解码,并将解码后的AMT标志amt_flag传送至sec_idx解码部131、amt_idx解码部133、二次变换部1522、以及核变换部1521。sec_idx解码部131根据AMT标志的值对与二次变换有关的索引sec_idx进行解码,并将解码后的与二次变换有关的索引sec_idx传送至二次变换部1522。并且,amt_idx解码部133参照接收到的AMT标志amt_flag对AMT索引amt_idx进行解码,并传送至核变换部1521。需要说明的是,由sec_idx解码部131进行的sec_idx的解码和由amt_flag解码部132进行的AMT标志amt_flag的解码也可以以TT级别来进行。或者,由sec_idx解码部131进行的sec_idx的解码也可以以TU级别来进行。
二次变换部1522参照接收到的AMT标志amt_flag以及与二次变换有关的索引sec_idx来确定是否进行二次变换。需要说明的是,在未进行二次变换的情况下,就图18的修正变换系数d[][]而言,变换系数d[][]被直接发送至核变换部1521。
核变换部1521参照接收到的AMT标志amt_flag以及AMT索引amt_idx来确定是否进行自适应核变换。
接着,使用图40对TU解码部22对TU信息进行解码的处理进行说明。图40(a)是表示本发明的一实施方式的TU信息TUI的语法表的构成例的图,图40(b)是amt_idx和sec_idx的解码部分的伪代码描述。
在amt_flag不为0、且非零系数的数numCoeff大于coreSIGNUM的情况下,TU解码部22也可以对与核变换有关的参数(在此为amt_idx)进行解码(SYN1812e)。
if(amt_flag!=0&&numCoeff>coreSIGNUM)
amt_idx[x0][y0][trafoDepth]
在条件I(-=预测模式为帧内)、且条件B(=非零系数的数numCoeff大于secSIGNUM)、且条件XC(=自适应核变换的标志amt_flag为0或者对数TU尺寸log2TrafoSize为2以外)的情况下,TU解码部22也可以对用于二次变换的索引sec_idx进行解码(SYN1811e)。
if(predMode==PRED_INTRA&&numCoeff>secSIGNUM&&(amt_flag==0||(log2TrafoSize!=2))
sec_idx[x0][y0][trafoDepth]
在除此以外(不满足条件I(=预测模式为帧内)、或者不满足条件B(=非零系数的数numCoeff大于secSIGNUM)、或者不满足条件XC(=AMT标志amt_flag为0或对数TU尺寸log2TrafoSize为2以外))的情况下,TU解码部22也可以省略用于二次变换的索引sec_idx的解码。(根据块尺寸来确定执行/不执行二次变换处理的构成)
运动图像解码装置1也可以是如下构成:根据TU的尺寸来确定执行/不执行二次变换处理。使用图41对具备这种构成的TU解码部22以及逆变换部152的其它构成例进行说明。
逆量化/逆变换部15可以构成为如下。在核变换处理部15212中,在TU的尺寸为规定尺寸以下(例如,4×4)的情况下不进行二次变换。反之,在条件Z(=TU的尺寸为规定尺寸以上)的情况(在此为log2TrafoSize!=2)下进行二次变换。
if(log2TrafoSize!=2))
二次变换(二次变换处理部15222的处理)
或者,当TU解码部22从CU信息解码部21接收编码数据以及对应TU尺寸(在图示的例子中为对数TU尺寸log2TrafoSize)时,如果TU尺寸为规定尺寸(例如4×4,即,对数TU尺寸log2TrafoSize=2)以下,则不管AMT标志的值如何,sec_idx解码部131均不对与二次变换有关的索引sec_idx进行解码,而是设为sec_idx=0,并传送至二次变换部1522。
另一方面,在TU尺寸大于规定尺寸(例如,4×4)的情况下,sec_idxg解码部131对与二次变换有关的索引sec_idx进行解码。
amt_flag解码部132对AMT标志amt_flag进行解码,并将解码后的AMT标志amt_flag传送至amt_idx解码部133以及核变换部1521。并且,amt_idx解码部133参照接收到的AMT标志amt_flag对AMT索引amt_idx进行解码,并传送至核变换部1521。
图42(a)是表示本发明的一实施方式的TT信息TTI的语法表的构成例的图,图42(b)是sec_idx解码部分的伪代码描述。如图42所示,amt_flag解码部132在TU残差标志(在此为cbfLuma)不为0且TU层trafoDepth为0的情况下,也可以对AMT标志amt_flag进行解码(SYN1753g)。
if(cbf_luma[x0][y0][trafoDepth]&&trafoDepth==0)
amt_flag[x0][y0][trafoDepth]
并且,TT信息解码部13在TU分割标志split_transform_flag为0的情况下,对变换单元TU进行解码。
transform_unit(x0,y0,xBase,yBase,log2TrafoSize,trafoDepth,blkIdx)
接着,使用图43对TU解码部22对TU信息进行解码的处理进行说明。图43(a)是表示本发明的一实施方式的TU信息TUI的语法表的构成例的图,图43(b)是sec_idx的解码部分的伪代码描述。
在TU尺寸为规定尺寸(例如,log2TrafoSize==2)的情况下,也可以省略用于二次变换的索引sec_idx的解码。反过来说,在TU尺寸为规定尺寸以外(log2TrafoSize!=2)的情况下,也可以对用于二次变换的索引sec_idx进行解码。
更具体而言,在预测模式为帧内预测模式、且非零系数的数numCoeff大于coreSIGNUM、且对数TU尺寸log2TrafoSize为2以外的情况下,TU解码部22也可以对与二次变换有关的索引sec_idx进行解码(SYN1811f)。
if(predMode==PRED_INTRA&&numCoeff>coreSIGNUM&&log2TrafoSize!=2)
sec_idx[x0][y0][trafoDepth]
在除此以外(预测模式不为帧内预测模式、或者非零系数的数numCoeff为coreSIGNUM以下、或者对数TU尺寸log2TrafoSize为2中的任一个)的情况下,TU解码部22也可以省略用于二次变换的索引sec_idx的解码。
[变形例]
需要说明的是,如在上述中说明那样,在TU尺寸为规定尺寸以下(例如,4×4)的情况下,在仅进行核变换而不进行二次变换的构成的情况下,在自适应核变换中,也可以使用非分离型变换(非分离型核变换)。如以下说明那样,非分离型核变换也可以使用与在图19中说明的非分离型二次变换基本相同的构成。
本构成的核变换部1521(记载为核变换部1521')具备核变换处理导出部15211'以及核变换处理部15212'。核变换处理导出部15211'进一步具备核变换集导出部152112'以及核变换处理设定部152112'。另一方面,核变换处理部15212'具备核变换矩阵导出部152121'、子集导出部152122'、子集变换处理部152123'、以及子集储存部152124'。
根据与在图19中说明的非分离型二次变换的关系,核变换处理导出部15211'、核变换集导出部152111'、核变换处理设定部152112'、核变换矩阵导出部152121'、子集导出部152122'、子集变换处理部152123'、以及子集储存部152124'分别与二次变换处理导出部15221、二次变换集导出部152212、二次变换处理设定部152211、二次变换矩阵导出部152221、子集导出部152222、子集变换处理部152223、以及子集储存部152224对应。
核变换集导出部152111'参照核变换集表导出与从TT信息解码部13接收到的预测模式PredMode对应的核变换集coreTrSetIdx。
coreTrSetIdx=(PredMode==PRED_INTER)?TrSetInter:coreTrSetIdxTbl[IntraPredMode]
核变换集导出部152111'将所导出的核变换集索引coreTrSetIdx传送至核变换处理设定部152112'。
核变换处理设定部152112'从TT信息解码部13接收标志(amt_idx)。此外,核变换处理设定部152112'基于核变换集coreTrSet将表示核变换的方法的索引coreTrIdx传送至核变换矩阵导出部152121。
coreTrIdx=(amt_flag==0)?fixedTr:coreTrSet[coreTrSetIdx][amt_trans_idx]
在此,fixedTr表示固定变换。
核变换矩阵导出部152121'从接收到的表示核变换处理的参数coreTrIdx导出实际的变换(子集变换处理)所需的矩阵transMatrix[][]。
transMatrix[][]=coreTransMatrixTbl[coreTrIdx][][]
核变换矩阵导出部152121'将所导出的矩阵传送至子集变换处理部152123。
子集变换处理部152123'以构成TU的4×4子块单位进行子集变换。具体而言,由从TU导出子块的处理、对子块进行变换的处理、将子块储存于TU的处理的这三个处理构成。
与子块坐标(xS,yS)有关的环路设为以下。xS=0..nTbs/4-1,yS=0..nTbs/4-1
子集导出部152122'从自逆变换部151接收到的变换系数d[][]导出子块e[j]。
根据e[j]=d[xx][yy],xx=(xS<<2)+j%4,yy=(yS<<2)+j/4(j=0..15)进行设定。
在此为非分离型,因此,对16×1矢量e[j]进行子集变换,导出g[i]。
g[i]=Σ(transMatrix[i][j]×x[j])(j=0..15)
子集储存部152124'将g[i]作为预测误差r[xx][yy]进行储存。
r[xx][yy]=y[i],xx=(xS<<2)+i%4,yy=(yS<<2)+i/4(i=0..15)〔实施方式3〕
也可以仅对Tbs×Tbs的变换系数d[][]中TU的左上M×M的子块进行二次变换。例如,在将子块坐标(子块的左上的坐标)设为(xS,yS)的情况下,也可以仅在子块坐标(xS,yS)满足以下的子块坐标的X坐标和Y坐标的最大值max(xS,yS)小于规定值TH的条件的情况下,对该子块进行由二次变换部1522进行的二次变换。
if(max(xS,yS)<TH)
(xS,yS)子块的二次变换处理
在此,TH=log2(M)等是适当的。例如在M=8的情况下,TH=2。
需要说明的是,在将变换系数坐标设为(xC,yC)的情况下,子块坐标可以通过以下导出。
xS=(xC>>TH)
yS=(yC>>TH)
满足上述条件的子块在4×4TU(块)的情况下为图44(a)的灰色的区域,在8×8TU(块)的情况下为图44(b)的灰色的区域,在16×16块的情况下为图44(c)的灰色的区域。需要说明的是,由核变换部1521进行的自适应核变换不是按子块而是按TU单位进行。
再者,二次变换根据帧内预测的方向也可以对TU的左上的子块以外的子块进行,由此,预计会有使能量集中于更少数的成分的效果。因此,也可以根据帧内预测的方向来变更作为进行二次变换的对象的子块。
即,运动图像解码装置1具备:核变换部1521,对TU应用自适应核变换;以及二次变换部1522,在自适应核变换之前对TU所包含的子块中至少任一个子块应用二次变换,二次变换部1522可以是如下构成:对第一区域和第二区域应用二次变换,所述第一区域由TU的低频侧的子块构成,所述第二区域构成为包含与该第一区域邻接且与TU的边界邻接的边界邻接子块,不包含从所述边界的相反侧与该边界邻接子块邻接的子块。
(根据帧内预测的方向来变更作为进行二次变换的对象的子块的构成1)
例如,如图45所示,在子块坐标(xS,yS)满足以下条件的情况下,可以对该子块进行由二次变换部1322进行的二次变换。
if(xS+yS<=TH)
(xS,yS)子块的二次变换处理
满足上述条件的子块在4×4TU(块)的情况下用图45(a)的灰色的区域来表示,在8×8TU(块)的情况下用图45(b)的灰色的区域来表示,在16×16TU(块)的情况下用图45(c)的灰色的区域来表示。例如在M=4的情况下,TH=3是适当的。
(根据帧内预测的方向来变更作为进行二次变换的对象的子块的构成2)
例如,如图46所示,在子块坐标(xS,yS)满足以下的子块坐标的X坐标和Y坐标的最大值max(xS,yS)小于规定值TH、或者X坐标为0、或者Y坐标为0的条件的情况下,可以对该子块进行由二次变换部1322进行的二次变换。
if(max(xS,yS)<TH||xS==0||yS==0)
(xS,yS)子块的二次变换处理
在此,TH=2等是适当的。
满足上述条件的子块在4×4TU(块)的情况下用图46(a)的灰色的区域来表示,在8×8TU(块)的情况下用图46(b)的灰色的区域来表示,在16×16TU(块)的情况下用图46(c)的灰色的区域来表示。
(根据帧内预测的方向来变更作为进行二次变换的对象的子块的构成3)
例如,如图47所示,在子块坐标(xS,yS)满足以下的(1)至(3)的条件的情况下,可以对该子块进行由二次变换部1322进行的二次变换。
(1)在帧内预测的方向为水平预测周围的范围的情况下(secSubBlockMode=1),
在子块坐标(xS,yS)满足子块坐标的X坐标和Y坐标的最大值max(xS,yS)小于规定值TH、或者Y坐标为0的条件的情况下,可以对该子块进行由二次变换部1322进行的二次变换。
if(max(xS,yS)<TH||yS==0)
(xS,yS)子块的二次变换处理
(2)在帧内预测的方向为垂直预测周围的范围的情况下(secSubBlockMode=2),
在子块坐标(xS,yS)满足子块坐标的X坐标和Y坐标的最大值max(xS,yS)小于规定值TH、或者X坐标为0的条件的情况下,可以对该子块进行由二次变换部1322进行的二次变换。
if(max(xS,yS)<TH||xS==0)
(xS,yS)子块的二次变换处理
(3)在帧内预测的方向为上述以外的情况下(secSubBlockMode=0),
在子块坐标(xS,yS)满足子块坐标的X坐标与Y坐标的和小于规定值TH的条件的情况下,可以对该子块进行由二次变换部1322进行的二次变换。
if(xS+yS<TH)
(xS,yS)子块的二次变换处理
在此,TH=2等是适当的。
需要说明的是,在将帧内预测的方向为水平预测周围的情况设为secSubBlockMode=1、将帧内预测的方向为垂直预测周围的情况设为secSubBlockMode=2、将帧内预测的方向为除此以外设为secSubBlockMode=0的情况下,如下所述,可以根据帧内预测模式IntraPredMode的范围是否为规定范围来进行判定。
if(IntraPredMode为6至14)
secSubBlockMode=2(垂直预测周围)
else if(IntraPredMode为22至30)
secSubBlockMode=1(水平预测周围)
else
secSubBlockMode=0(除此以外)
更一般而言,当垂直预测的模式编号为predModeVer、水平预测的模式编号为predModeHor、且用predModeTH来表达范围时,可以通过下式导出。
if(abs(IntraPredMode-predModeVer)<predModeTH)
secSubBlockMode=2(垂直预测周围)
else(abs(IntraPredMode-predModeHor)<predModeTH)
secSubBlockMode=1(水平预测周围)
else
secSubBlockMode=0(除此以外)
在此,设为predModeVer=10,predModeHor=26,predModeTH=4。
而且,也可以根据变换系数的扫描顺序scanIdx来判定secSubBlockMode。
例如,
if(scanIdx为垂直扫描)
secSubBlockMode=2(垂直预测周围)
else if(scanIdx为水平扫描)
secSubBlockMode=1(水平预测周围)
else
secSubBlockMode=0(除此以外)
满足上述条件的子块用图47的灰色的区域来表示。
〔运动图像编码装置〕
以下,参照图48,对本实施方式的运动图像编码装置2(图像编码装置)进行说明。
(运动图像编码装置的概要)
概略性而言,运动图像编码装置2是通过对输入图像#10进行编码来生成编码数据#1,并对运动图像解码装置1输出编码数据#1的装置。
(运动图像编码装置的构成)
首先,使用图48对运动图像编码装置2的构成例进行说明。图48是表示运动图像编码装置2的构成的功能框图。如图48所示,运动图像编码装置2具备编码设定部30、逆量化/逆变换部35、预测图像生成部23、加法器24、帧存储器25、减法器26、变换/量化部27、以及编码数据生成部(自适应处理部)29。
编码设定部30基于输入图像#10而生成与编码有关的图像数据以及各种设定信息。
具体而言,编码设定部30生成下一图像数据以及设定信息。
首先,编码设定部30通过将输入图像#10依次分割为切片单位、树单元单位来生成针对对象CU的CU图像#100。
此外,编码设定部30基于分割处理的结果来生成报头信息H’。报头信息H’包含:(1)有关属于对象切片的树单元的尺寸、形状以及在对象切片内的位置的信息;以及(2)有关属于各树单元的CU的尺寸、形状以及在对象树单元内的位置的CU信息CU’。
进而,编码设定部30参照CU图像#100以及CU信息CU’来生成PT设定信息PTI’。PT设定信息PTI’中包含:(1)对象CU向各PU的可分割模式;以及(2)与可分配至各PU的预测模式的所有组合有关信息。
编码设定部30将CU图像#100供给至减法器26。此外,编码设定部30将报头信息H’供给至编码数据生成部29。此外,编码设定部30将PT设定信息PTI’供给至预测图像生成部23。
逆量化/逆变换部35通过对由变换/量化部27供给的每个TU的量化预测残差进行逆量化以及逆正交变换来复原每个TU的预测残差D。对于逆正交变换,如已经对图2以及图14所示的逆量化/逆变换部15进行说明那样,因此,在此省略其说明。
此外,逆量化/逆变换部35按照由TT分割信息(后述)指定的分割模式对每个块的预测残差进行合并,生成针对对象CU的预测残差D。逆量化/逆变换部35将所生成的针对对象CU的预测残差D供给至加法器24。
预测图像生成部23参照记录于帧存储器25的局部解码图像P’以及PT设定信息PTI’来生成针对对象CU的预测图像Pred。预测图像生成部23将通过预测图像生成处理获得的预测参数设定为PT设定信息PTI’,并将设定后的PT设定信息PTI’传输至编码数据生成部29。需要说明的是,由预测图像生成部23进行的预测图像生成处理与运动图像解码装置1所具备的预测图像生成部14相同,因此,在此省略说明。
加法器24通过将由预测图像生成部23供给的预测图像Pred与由逆量化/逆变换部35供给的预测残差D相加来生成针对对象CU的解码图像P。
在帧存储器25中,解码后的解码图像P被依次记录。在帧存储器25中,在对对象树单元进行解码的时间点,与比该对象树单元更先被解码的所有树单元(例如,按照光栅扫描的顺序排列在先的所有树单元)对应的解码图像与用于该解码图像P的解码的参数一起被记录。
减法器26通过从CU图像#100中减去预测图像Pred来生成针对对象CU的预测残差D。减法器26将所生成的预测残差D供给至变换/量化部27。
变换/量化部27通过对预测残差D进行正交变换以及量化来生成量化预测残差。需要说明的是,在此,正交变换是指从像素区域向频域的正交变换。此外,作为逆正交变换的例子,可列举出DCT变换(Discrete Cosine Transform)以及DST变换(Discrete SineTransform)等。
具体而言,变换/量化部27参照CU图像#100以及CU信息CU’来确定对象CU向一个或多个块的分割模式。此外,按照已确定的分割模式将预测残差D分割为针对各块的预测残差。
此外,变换/量化部27通过对针对各块的预测残差进行正交变换来生成频域中的预测残差之后,通过对该频域中的预测残差进行量化来生成每个块的量化预测残差。
此外,变换/量化部27生成包含所生成的每个块的量化预测残差、指定对象CU的分割模式的TT分割信息、以及与对象CU向各块的可能的所有分割模式有关的信息的TT设定信息TTI’。变换/量化部27将所生成的TT设定信息TTI’供给至逆量化/逆变换部35以及编码数据生成部29。
编码数据生成部29对报头信息H’、TT设定信息TTI’、以及PT设定信息PTI’进行编码,并对编码后的报头信息H、TT设定信息TTI、以及PT设定信息PTI进行复用而生成编码数据#1且进行输出。
〔应用例〕
上述的运动图像编码装置2以及运动图像解码装置1能搭载于进行运动图像的发送、接收、记录、再现的各种装置而利用。需要说明的是,运动图像可以是通过摄像机等拍摄的自然运动图像,也可以是通过计算机等生成的人工运动图像(包含CG以及GUI)。
首先,参照图49,对能将上述的运动图像编码装置2以及运动图像解码装置1利用于运动图像的发送以及接收的情况进行说明。
图49(a)是表示搭载有运动图像编码装置2的发送装置PROD_A的构成的框图。如图49(a)所示,发送装置PROD_A具备:通过对运动图像进行编码而获得编码数据的编码部PROD_A1、通过利用编码部PROD_A1所获得的编码数据对载波进行调制而获得调制信号的调制部PROD_A2、以及发送调制部PROD_A2所获得的调制信号的发送部PROD_A3。上述的运动图像编码装置2用作该编码部PROD_A1。
发送装置PROD_A也可以进一步具备:拍摄运动图像的摄像机PROD_A4、记录有运动图像的记录介质PROD_A5、用于从外部输入运动图像的输入端子PROD_A6、以及生成或加工图像的图像处理部A7来做为向编码部PROD_A1输入的运动图像的供给源。在图49(a)中举例示出了发送装置PROD_A具备这些全部的构成,但也可以省略一部分。
需要说明的是,记录介质PROD_A5可以是记录有未被编码的运动图像的介质,也可以是记录有以与传输用的编码方式不同的记录用的编码方式编码后的运动图像的介质。在后者的情况下,使按照记录用的编码方式对从记录介质PROD_A5读出的编码数据进行解码的解码部(未图示)介于记录介质PROD_A5与编码部PROD_A1之间为好。
图49(b)是表示搭载有运动图像解码装置1的接收装置PROD_B的构成的框图。如图49(b)所示,接收装置PROD_B具备:接收调制信号的接收部PROD_B1、通过对接收部PROD_B1所接收的调制信号进行解调而获得编码数据的解调部PROD_B2、以及通过对解调部PROD_B2所获得的编码数据进行解码而获得运动图像的解码部PROD_B3。上述的运动图像解码装置1用作该解码部PROD_B3。
接收装置PROD_B也可以进一步具备显示运动图像的显示器PROD_B4、用于记录运动图像的记录介质PROD_B5、以及用于将运动图像输出至外部的输出端子PROD_B6来做为解码部PROD_B3所输出的运动图像的供给目的地。在图49(b)中举例示出了接收装置PROD_B具备这些全部的构成,但也可以省略一部分。
需要说明的是,记录介质PROD_B5可以是用于记录未被编码的运动图像的介质,也可以是以与传输用的编码方式不同的记录用的编码方式编码后的介质。在后者的情况下,使按照记录用的编码方式对从解码部PROD_B3获取的运动图像进行编码的编码部(未图示)介于解码部PROD_B3与记录介质PROD_B5之间为好。
需要说明的是,传输调制信号的传输介质可以是无线的,也可以是有线的。此外,传输调制信号的传输方案可以是广播(在此,指发送目的地未预先确定的发送方案),也可以是通信(在此,指发送目的地已预先确定的发送方案)。即,调制信号的传输可以通过无线广播、有线广播、无线通信、以及有线通信中的任一个来实现。
例如,地面数字广播的广播站(广播设备等)/接收站(电视接收机等)是通过无线广播收发调制信号的发送装置PROD_A/接收装置PROD_B的一个例子。此外,有线电视广播的广播站(广播设备等)/接收站(电视接收机等)是通过有线广播收发调制信号的发送装置PROD_A/接收装置PROD_B的一个例子。
此外,使用互联网的VOD(Video On Demand:视频点播)服务、运动图像共享服务等服务器(工作站等)/客户端(电视接收机、个人计算机、智能手机等)是通过通信收发调制信号的发送装置PROD_A/接收装置PROD_B的一个例子(通常,在LAN中使用无线或有线中的任一个作为传输介质,在WAN中使用有线作为传输介质)。在此,个人计算机中包含台式型PC、膝上型PC、以及平板型PC。此外,智能手机中也包含多功能移动电话终端。
需要说明的是,运动图像共享服务的客户端除了对从服务器下载的编码数据进行解码并显示于显示器的功能以外,还具有对通过摄像机拍摄的运动图像进行编码并上传至服务器的功能。即,运动图像共享服务的客户端作为发送装置PROD_A以及接收装置PROD_B双方来发挥功能。
接着,参照图50,对能将上述的运动图像编码装置2以及运动图像解码装置1利用于运动图像的记录以及再现的情况进行说明。
图50(a)是表示搭载有上述的运动图像编码装置2的记录装置PROD_C的构成的框图。如图50(a)所示,记录装置PROD_C具备:通过对运动图像进行编码而获得编码数据的编码部PROD_C1、以及将编码部PROD_C1所获得的编码数据写入记录介质PROD_M的写入部PROD_C2。上述的运动图像编码装置2用作该编码部PROD_C1。
需要说明的是,记录介质PROD_M可以是(1)如HDD(Hard Disk Drive:硬盘驱动器)、SSD(Solid State Drive:固态硬盘)等那样内置于记录装置PROD_C的类型的记录介质,也可以是(2)如SD存储卡、USB(Universal Serial Bus:通用串行总线)闪存等那样连接于记录装置PROD_C的类型的记录介质,还可以是(3)如DVD(Digital Versatile Disc:数字多功能光盘)、BD(Blu-ray Disc:蓝光光盘、注册商标)等那样装填至内置于记录装置PROD_C的驱动装置(未图示)的记录介质。
此外,记录装置PROD_C也可以进一步具备:拍摄运动图像的摄像机PROD_C3、用于从外部输入运动图像的输入端子PROD_C4、用于接收运动图像的接收部PROD_C5、以及生成或加工图像的图像处理部C6来做为输入至编码部PROD_C1的运动图像的供给源。在图50(a)中举例示出了记录装置PROD_C具备这些全部的构成,但也可以省略一部分。
需要说明的是,接收部PROD_C5可以接收未被编码的运动图像,也可以接收以与记录用的编码方式不同的传输用的编码方式编码后的编码数据。在后者的情况下,使对以传输用的编码方式编码后的编码数据进行解码的传输用解码部(未图示)介于接收部PROD_C5与编码部PROD_C1之间为好。
作为这种记录装置PROD_C,例如可列举出:DVD记录器、BD记录器、HDD(Hard DiskDrive)记录器等(在该情况下,输入端子PROD_C4或接收部PROD_C5为运动图像的主要供给源)。此外,便携式摄像机(在该情况下,摄像机PROD_C3为运动图像的主要供给源)、个人计算机(在该情况下,接收部PROD_C5或图像处理部C6为运动图像的主要供给源)、智能手机(在该情况下,摄像机PROD_C3或接收部PROD_C5为运动图像的主要供给源)等也是这种记录装置PROD_C的一个例子。
图50(b)是表示搭载有上述的运动图像解码装置1的再现装置PROD_D的构成的框。如图50(b)所示,再现装置PROD_D具备:读出已写入记录介质PROD_M的编码数据的读出部PROD_D1、以及通过对读出部PROD_D1所读出的编码数据进行解码而获得运动图像的解码部PROD_D2。上述的运动图像解码装置1用作该解码部PROD_D2。
需要说明的是,记录介质PROD_M可以是(1)如HDD、SSD等那样内置于再现装置PROD_D的类型的记录介质,也可以是(2)如SD存储卡、USB闪存等那样连接于再现装置PROD_D的类型的记录介质,也可以是(3)如DVD、BD等那样装填至内置于再现装置PROD_D的驱动装置(未图示)的记录介质。
此外,再现装置PROD_D也可以进一步具备显示运动图像的显示器PROD_D3、用于将运动图像输出至外部的输出端子PROD_D4、以及发送运动图像的发送部PROD_D5来做为解码部PROD_D2所输出的运动图像的供给目的地。在图50(b)中举例示出了再现装置PROD_D具备这些全部的构成,但也可以省略一部分。
需要说明的是,发送部PROD_D5可以发送未被编码的运动图像,也可以发送以与记录用的编码方式不同的传输用的编码方式编码后的编码数据。在后者的情况下,使以传输用的编码方式对运动图像进行编码的编码部(未图示)介于解码部PROD_D2与发送部PROD_D5之间为好。
作为这种再现装置PROD_D,例如可列举出DVD播放器、BD播放器、HDD播放器等(在该情况下,连接有电视接收机等的输出端子PROD_D4为运动图像的主要供给目的地)。此外,电视接收机(在该情况下,显示器PROD_D3为运动图像的主要供给目的地)、数字标牌(也称为电子看板、电子公告板等,显示器PROD_D3或发送部PROD_D5为运动图像的主要供给目的地)、台式型PC(在该情况下,输出端子PROD_D4或发送部PROD_D5为运动图像的主要供给目的地)、膝上型或平板型PC(在该情况下,显示器PROD_D3或发送部PROD_D5为运动图像的主要供给目的地)、智能手机(在该情况下,显示器PROD_D3或发送部PROD_D5为运动图像的主要供给目的地)等也是这种再现装置PROD_D的一个例子。
〔基于软件的实现例以及基于软件的实现例〕
此外,上述的运动图像解码装置1以及运动图像编码装置2的各块既可以通过形成于集成电路(IC芯片)上的逻辑电路而硬件地实现,也可以利用CPU(Central ProcessingUnit:中央处理器)而软件地实现。
在后者的情况下,上述各装置具备:执行实现各功能的程序的命令的CPU、储存上述程序的ROM(Read Only Memory:只读存储器)、展开上述程序的RAM(Random AccessMemory:随机存取存储器)、以及储存上述程序和各种数据的存储器等存储装置(记录介质)等。然后,本发明的目的通过以下方式也能达成:将实现上述的功能的软件、即计算机可读取地记录有上述各装置的控制程序的程序代码(执行形式程序、中间代码程序、源程序)的记录介质供给至上述各装置,该计算机(或CPU、MPU)读出记录于记录介质的程序代码并执行。
作为上述记录介质,例如可以使用:磁带、盒式磁带等带类;包含软盘(注册商标)/硬盘等磁盘、CD-ROM(Compact Disc Read-Only Memory:光盘只读存储器)/MO盘(Magneto-Optical disc:磁光盘)/MD(Mini Disc:迷你磁光盘)/DVD(Digital Versatile Disc:数字多功能光盘)/CD-R(CD Recordable:光盘刻录片)/蓝光光盘(Blu-ray Disc:注册商标)等光盘的盘类;IC卡(包含存储卡)/光卡等卡类;掩膜ROM/EPROM(Erasable ProgrammableRead-Only Memory:可擦可编程只读存储器)/EEPROM(ElectricallyErasableandProgrammableRead-OnlyMemory:电可擦可编程只读存储器)/闪速ROM等半导体存储器类;或者PLD(Programmable logic device:可编程逻辑器件)、FPGA(Field Programmable GateArray:现场可编程门阵列)等逻辑电路类等。
此外,也可以将上述各装置构成为能与通信网络连接,并经由通信网络供给上述程序代码。该通信网络能传输程序代码即可,并无特别限定。例如,可利用互联网、内联网(intranet)、外联网(extranet)、LAN(Local Area Network:局域网)、ISDN(IntegratedServices Digital Network:综合业务数字网)、VAN(Value-Added Network:增值网络)、CATV(Community Antenna television/Cable Television:社区天线电视/有线电视)通信网、虚拟专用网(Virtual Private Network)、电话线路网、移动通信网、卫星通信网等。此外,构成该通信网络的传输介质也是为能传输程序代码的介质即可,不限定于特定的构成或种类。例如,无论是在IEEE(Institute of Electrical and Electronic Engineers:电气和电子工程师协会)1394、USB、电力线输送、有线TV线路、电话线、ADSL(AsymmetricDigital Subscriber Line:非对称数字用户线路)线路等有线中,还是在如IrDA(InfraredData Association:红外线数据协会)、遥控器那样的红外线、Bluetooth(注册商标)、IEEE802.11无线、HDR(High Data Rate:高数据速率)、NFC(Near Field Communication:近场通讯)、DLNA(Digital Living Network Alliance:数字生活网络联盟)(注册商标)、移动电话网、卫星线路、地面波数字网等无线中都可利用。需要说明的是,本发明即使以通过电子传输将上述程序代码具体化的嵌入载波的计算机数据信号的形态也能实现。
本发明并不限定于上述的实施方式,在权利要求所示的范围内可进行各种变更。即,将在权利要求所示的范围内经过适当变更的技术方案组合而获得的实施方式也包含在本发明的技术范围内。
本发明并不限定于上述的各实施方式,在权利要求所示的范围内可进行各种变更,将分别在不同的实施方式中公开的技术手段适当组合而获得的实施方式也包含在本发明的技术范围内。而且,通过将分别在各实施方式中公开的技术手段组合,能形成新的技术特征。
符号说明
1 运动图像解码装置(图像解码装置)
10 解码模块
11 CT信息解码部(解码部)
12 PU信息解码部(解码部)
13 TT信息解码部(解码部)
15、35 逆量化/逆变换部
16、25 帧存储器
2 运动图像编码装置(图像编码装置)
131 sec_idx解码部
132 amt_flag解码部
133 amt_idx解码部
21 CU信息解码部
25 帧存储器
27 变换/量化部

Claims (4)

1.一种图像解码装置,将图片分割为编码单元进行解码,其特征在于,具备:
第一解码部,对第二索引进行解码,所述第二索引表示是否使用二次变换;
第二解码部,对第一标志进行解码,所述第一标志表示是否存在第一索引;
第三解码部,对所述第一索引进行解码;
第一变换部,基于所述第二索引进行所述二次变换;
第二变换部,基于所述第一索引进行核变换;以及
加法部,将预测残差与预测图像相加并生成解码图像,
所述第三解码部基于所述第一标志表示所述第一索引存在且非零系数的个数大于规定值并所述第二索引表示没有使用所述二次变换的情况来对所述第一索引进行解码,
所述第二变换部基于所述第一索引导出垂直变换用的第一变换矩阵和水平变换用的第一变换矩阵,基于所述垂直变换用的第一变换矩阵应用垂直方向的核变换来导出中间值,基于所述水平变换用的第一变换矩阵应用水平方向的核变换,从所述中间值导出所述预测残差。
2.一种图像解码方法,将图片分割为编码单元进行解码,其特征在于,
对第二索引进行解码,所述第二索引表示是否使用二次变换;
对第一标志进行解码,所述第一标志表示是否存在第一索引;
基于所述第一标志表示所述第一索引存在且非零系数的个数大于规定值并所述第二索引表示没有使用所述二次变换的情况来对所述第一索引进行解码;
基于所述第二索引应用所述二次变换;
基于所述第一索引导出垂直变换用的第一变换矩阵和水平变换用的第一变换矩阵;
基于所述垂直变换用的第一变换矩阵应用垂直方向的核变换来导出中间值;
基于所述水平变换用的第一变换矩阵应用水平方向的核变换,从所述中间值导出预测残差;
将所述预测残差与预测图像相加并生成解码图像。
3.一种图像编码装置,将图片分割为编码单元进行编码,其特征在于,具备:
第一编码部,对第二索引进行编码,所述第二索引表示是否使用二次变换;
第二编码部,对第一标志进行编码,所述第一标志表示是否存在第一索引;
第三编码部,对所述第一索引进行编码;
第一变换部,基于所述第二索引进行二次变换;
第二变换部,基于所述第一索引进行核变换;
加法部,将预测残差与预测图像相加并生成解码图像;
预测图像生成部,基于所述解码图像生成预测图像,
所述第三编码部基于所述第一标志表示所述第一索引存在且非零系数的个数大于规定值并所述第二索引表示没有使用所述二次变换的情况来对所述第一索引进行编码,
所述第二变换部基于所述第一索引导出垂直变换用的第一变换矩阵和水平变换用的第一变换矩阵,基于所述垂直变换用的第一变换矩阵应用垂直方向的核变换来导出中间值,基于所述水平变换用的第一变换矩阵应用水平方向的核变换,从所述中间值导出所述预测残差。
4.一种图像编码方法,将图片分割为编码单元进行编码,其特征在于,
对第二索引进行编码,所述第二索引表示是否使用二次变换;
对第一标志进行编码,所述第一标志表示是否存在第一索引;
基于所述第一标志表示所述第一索引存在且非零系数的个数大于规定值并所述第二索引表示没有使用所述二次变换的情况来对所述第一索引进行编码;
基于所述第二索引应用所述二次变换;
基于所述第一索引导出垂直变换用的第一变换矩阵和水平变换用的第一变换矩阵;
基于所述垂直变换用的第一变换矩阵应用垂直方向的核变换来导出中间值;
基于所述水平变换用的第一变换矩阵应用水平方向的核变换,从所述中间值导出预测残差;
将所述预测残差与预测图像相加并生成解码图像;
基于所述解码图像生成预测图像。
CN202110687870.0A 2016-05-13 2017-04-19 图像解码装置及其方法、图像编码装置及其方法 Active CN113411579B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110687870.0A CN113411579B (zh) 2016-05-13 2017-04-19 图像解码装置及其方法、图像编码装置及其方法

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2016097497 2016-05-13
JP2016-097497 2016-05-13
CN202110687870.0A CN113411579B (zh) 2016-05-13 2017-04-19 图像解码装置及其方法、图像编码装置及其方法
PCT/JP2017/015786 WO2017195555A1 (ja) 2016-05-13 2017-04-19 画像復号装置および画像符号化装置
CN201780029344.7A CN109076223B (zh) 2016-05-13 2017-04-19 图像解码装置以及图像编码装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201780029344.7A Division CN109076223B (zh) 2016-05-13 2017-04-19 图像解码装置以及图像编码装置

Publications (2)

Publication Number Publication Date
CN113411579A true CN113411579A (zh) 2021-09-17
CN113411579B CN113411579B (zh) 2024-01-23

Family

ID=60266453

Family Applications (4)

Application Number Title Priority Date Filing Date
CN202110687870.0A Active CN113411579B (zh) 2016-05-13 2017-04-19 图像解码装置及其方法、图像编码装置及其方法
CN202110686462.3A Active CN113411578B (zh) 2016-05-13 2017-04-19 图像解码装置及其方法、图像编码装置及其方法
CN202110687873.4A Active CN113411580B (zh) 2016-05-13 2017-04-19 图像解码装置及其方法、图像编码装置及其方法
CN201780029344.7A Active CN109076223B (zh) 2016-05-13 2017-04-19 图像解码装置以及图像编码装置

Family Applications After (3)

Application Number Title Priority Date Filing Date
CN202110686462.3A Active CN113411578B (zh) 2016-05-13 2017-04-19 图像解码装置及其方法、图像编码装置及其方法
CN202110687873.4A Active CN113411580B (zh) 2016-05-13 2017-04-19 图像解码装置及其方法、图像编码装置及其方法
CN201780029344.7A Active CN109076223B (zh) 2016-05-13 2017-04-19 图像解码装置以及图像编码装置

Country Status (4)

Country Link
US (4) US10887626B2 (zh)
EP (1) EP3457691A4 (zh)
CN (4) CN113411579B (zh)
WO (1) WO2017195555A1 (zh)

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113411579B (zh) 2016-05-13 2024-01-23 夏普株式会社 图像解码装置及其方法、图像编码装置及其方法
US11095893B2 (en) * 2016-10-12 2021-08-17 Qualcomm Incorporated Primary transform and secondary transform in video coding
US10554974B2 (en) * 2017-01-13 2020-02-04 Mediatek Inc. Method and apparatus enabling adaptive multiple transform for chroma transport blocks using control flags
US10979736B2 (en) * 2017-06-08 2021-04-13 Lg Electronics Inc. Method and apparatus for performing low-complexity computation of transform kernel for video compression
WO2019009129A1 (ja) * 2017-07-03 2019-01-10 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
TWI794129B (zh) * 2017-07-13 2023-02-21 美商松下電器(美國)知識產權公司 編碼裝置、編碼方法、解碼裝置、解碼方法及電腦可讀取之非暫時性媒體
EP3661214B1 (en) * 2017-08-04 2022-07-20 LG Electronics Inc. Method and apparatus for configuring transform for video compression
WO2019065488A1 (ja) * 2017-09-28 2019-04-04 シャープ株式会社 画像復号装置および画像符号化装置
US20200374516A1 (en) * 2017-12-04 2020-11-26 Lg Electronics Inc. Image decoding method and apparatus based on efficient transformation of chroma component in image coding system
WO2019117634A1 (ko) * 2017-12-15 2019-06-20 엘지전자 주식회사 2차 변환에 기반한 영상 코딩 방법 및 그 장치
CN115834876A (zh) * 2017-12-21 2023-03-21 Lg电子株式会社 解码和编码设备、存储比特流的介质和数据发送设备
CN115190296A (zh) * 2017-12-28 2022-10-14 松下电器(美国)知识产权公司 编码装置、解码装置和存储介质
JP7334730B2 (ja) * 2018-03-30 2023-08-29 ソニーグループ株式会社 画像処理装置および方法
EP4283989A1 (en) * 2018-04-01 2023-11-29 LG Electronics Inc. An image coding apparatus and method thereof based on a quantization parameter derivation
HRP20231341T1 (hr) * 2018-04-01 2024-02-16 Lg Electronics Inc. Obrada video signala korištenjem smanjene sekundarne transformacije
KR102571996B1 (ko) * 2018-04-01 2023-08-28 엘지전자 주식회사 분할된 블록에 2차 변환을 적용하여 비디오 신호를 처리하는 방법 및 장치
WO2019235491A1 (ja) * 2018-06-08 2019-12-12 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
CN112292857A (zh) * 2018-06-11 2021-01-29 松下电器(美国)知识产权公司 编码装置、解码装置、编码方法和解码方法
WO2020009434A1 (ko) * 2018-07-02 2020-01-09 엘지전자 주식회사 이차 변환을 기반으로 비디오 신호를 처리하는 방법 및 장치
CN110839158B (zh) 2018-08-16 2023-03-10 北京字节跳动网络技术有限公司 变换矩阵选择的系数相关的编解码
AU2018217336A1 (en) * 2018-08-17 2020-03-05 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding a transformed block of video samples
EP3723372A4 (en) * 2018-09-05 2021-03-31 LG Electronics Inc. VIDEO SIGNAL CODING / DECODING PROCESS AND ASSOCIATED EQUIPMENT
CN112740684A (zh) * 2018-09-19 2021-04-30 韩国电子通信研究院 用于对图像进行编码/解码的方法和装置以及用于存储比特流的记录介质
US11218694B2 (en) 2018-09-24 2022-01-04 Qualcomm Incorporated Adaptive multiple transform coding
US11284112B2 (en) * 2018-12-06 2022-03-22 Tencent America LLC Method and apparatus for a primary transform using an 8-bit transform core
CN113411612B (zh) * 2019-01-11 2022-06-24 华为技术有限公司 对图像块进行视频译码的方法、解码设备和编/解码器
CN116760982A (zh) * 2019-01-12 2023-09-15 Lg电子株式会社 解码设备、编码设备、存储介质和图像数据发送设备
CN117812271A (zh) 2019-02-01 2024-04-02 Lg电子株式会社 图像解码方法、图像编码方法、存储介质和发送方法
KR20210102462A (ko) * 2019-02-24 2021-08-19 엘지전자 주식회사 이차 변환에 기반한 영상 코딩 방법 및 그 장치
KR20240052873A (ko) * 2019-03-03 2024-04-23 후아웨이 테크놀러지 컴퍼니 리미티드 변환 프로세스를 위해 사용되는 인코더, 디코더 및 대응하는 방법
CN111669579B (zh) * 2019-03-09 2022-09-16 杭州海康威视数字技术股份有限公司 进行编码和解码的方法、编码端、解码端和系统
CN114223207B (zh) * 2019-04-16 2023-09-22 寰发股份有限公司 用次要变换编解码视讯数据的方法以及装置
US11943476B2 (en) 2019-04-16 2024-03-26 Hfi Innovation Inc. Methods and apparatuses for coding video data with adaptive secondary transform signaling
WO2020216303A1 (en) 2019-04-23 2020-10-29 Beijing Bytedance Network Technology Co., Ltd. Selective use of secondary transform in coded video
CN113841409B (zh) 2019-05-10 2023-12-19 北京字节跳动网络技术有限公司 用于视频处理的简化二次变换的有条件使用
US11973984B2 (en) * 2019-05-15 2024-04-30 Xris Corporation Method for encoding/decoding image signal and apparatus therefor
US20220232255A1 (en) * 2019-05-30 2022-07-21 Sharp Kabushiki Kaisha Image decoding apparatus
US11218728B2 (en) * 2019-06-04 2022-01-04 Tencent America LLC Method and apparatus for video coding
CN117354521A (zh) 2019-06-07 2024-01-05 北京字节跳动网络技术有限公司 视频比特流中的简化二次变换的有条件信令
US11212545B2 (en) 2019-06-07 2021-12-28 Tencent America LLC Method and apparatus for improved implicit transform selection
WO2020251254A1 (ko) * 2019-06-10 2020-12-17 주식회사 엑스리스 영상 신호 부호화/복호화 방법 및 이를 위한 장치
EP3994887A4 (en) 2019-08-03 2022-09-28 Beijing Bytedance Network Technology Co., Ltd. MATRIX SELECTION FOR A REDUCED SECONDARY TRANSFORM IN VIDEO CODING
CN114223208B (zh) 2019-08-17 2023-12-29 北京字节跳动网络技术有限公司 为视频中的缩减二次变换的边信息的上下文建模
AU2020375518B2 (en) * 2019-11-01 2024-02-29 Lg Electronics Inc. Image coding method based on transform, and device therefor
US11375220B2 (en) * 2019-11-27 2022-06-28 Tencent America LLC Method and apparatus for video decoding using a nominal directional mode and an angular offset
JP7360984B2 (ja) * 2020-03-31 2023-10-13 Kddi株式会社 画像復号装置、画像復号方法及びプログラム
WO2023129744A1 (en) * 2021-12-30 2023-07-06 Beijing Dajia Internet Information Technology Co., Ltd. Methods and devices for decoder-side intra mode derivation

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120008682A1 (en) * 2010-07-09 2012-01-12 Qualcomm Incorporated Video coding using directional transforms
JP2013192118A (ja) * 2012-03-14 2013-09-26 Sharp Corp 算術復号装置、画像復号装置、算術符号化装置、および画像符号化装置
CN104067614A (zh) * 2011-12-28 2014-09-24 夏普株式会社 算术解码装置、图像解码装置以及算术编码装置
CN104380737A (zh) * 2012-06-22 2015-02-25 夏普株式会社 算术解码装置、算术编码装置、图像解码装置以及图像编码装置

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5714950A (en) * 1992-07-23 1998-02-03 Samsung Electronics Co., Ltd. System for variable-length-coding and variable-length-decoding digitaldata
KR0139164B1 (ko) * 1994-12-19 1998-06-01 김광호 적응적 직교변환부호화 장치
CN1662069A (zh) * 2005-01-12 2005-08-31 华中科技大学 图像、视频信号的编码/解码方法
CN101453643B (zh) * 2007-12-04 2011-05-18 华为技术有限公司 量化模式、图像编码、解码方法、编码器、解码器及系统
US10992958B2 (en) * 2010-12-29 2021-04-27 Qualcomm Incorporated Video coding using mapped transforms and scanning modes
WO2012172667A1 (ja) * 2011-06-15 2012-12-20 株式会社 東芝 動画像符号化方法、動画像復号化方法及び装置
GB2492333B (en) * 2011-06-27 2018-12-12 British Broadcasting Corp Video encoding and decoding using transforms
US20130003858A1 (en) * 2011-06-30 2013-01-03 Vivienne Sze Simplified Context Selection For Entropy Coding of Transform Coefficient Syntax Elements
US20130003856A1 (en) * 2011-07-01 2013-01-03 Samsung Electronics Co. Ltd. Mode-dependent transforms for residual coding with low latency
IN2014CN03598A (zh) * 2011-11-04 2015-07-31 Sharp Kk
TWI613908B (zh) * 2012-04-13 2018-02-01 Jvc Kenwood Corp 影像解碼裝置、影像解碼方法、影像解碼程式
WO2014078068A1 (en) * 2012-11-13 2014-05-22 Intel Corporation Content adaptive transform coding for next generation video
BR112015026899B1 (pt) * 2013-04-23 2023-03-28 Qualcomm Incorporated Reposicionamento dos blocos residuais de previsão na codificação de vídeo
US9948933B2 (en) * 2014-03-14 2018-04-17 Qualcomm Incorporated Block adaptive color-space conversion coding
US20170048552A1 (en) * 2014-05-05 2017-02-16 Jicheng An Method and apparatus for determining residue transform tree representation
WO2015194187A1 (en) * 2014-06-20 2015-12-23 Sharp Kabushiki Kaisha Harmonized palette coding
CN105516730B (zh) * 2014-09-24 2018-04-24 晨星半导体股份有限公司 视讯编码装置及视讯解码装置以及其编码与解码方法
KR101644967B1 (ko) * 2015-01-21 2016-08-03 한국과학기술원 비디오 복호화에서의 분할 블록 복호화 방법 및 이를 구현하는 기록매체
US10306229B2 (en) * 2015-01-26 2019-05-28 Qualcomm Incorporated Enhanced multiple transforms for prediction residual
US10574993B2 (en) * 2015-05-29 2020-02-25 Qualcomm Incorporated Coding data using an enhanced context-adaptive binary arithmetic coding (CABAC) design
US10616604B2 (en) * 2015-09-01 2020-04-07 Qualcomm Incorporated Coefficient level coding in video coding
JP2018530211A (ja) * 2015-09-08 2018-10-11 サムスン エレクトロニクス カンパニー リミテッド エントロピー符号化及び復号化のための装置及び方法
US10491922B2 (en) * 2015-09-29 2019-11-26 Qualcomm Incorporated Non-separable secondary transform for video coding
US20170134732A1 (en) * 2015-11-05 2017-05-11 Broadcom Corporation Systems and methods for digital media communication using syntax planes in hierarchical trees
US20170150176A1 (en) * 2015-11-25 2017-05-25 Qualcomm Incorporated Linear-model prediction with non-square prediction units in video coding
CN105578181B (zh) * 2016-01-19 2019-01-01 南京大学 一种hevc中屏幕内容压缩的快速帧内模式决策和块匹配方法
ES2710807B1 (es) * 2016-03-28 2020-03-27 Kt Corp Metodo y aparato para procesar senales de video
CN113411579B (zh) * 2016-05-13 2024-01-23 夏普株式会社 图像解码装置及其方法、图像编码装置及其方法
WO2018101288A1 (ja) * 2016-12-01 2018-06-07 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、符号化方法、復号装置および復号方法
US10750181B2 (en) * 2017-05-11 2020-08-18 Mediatek Inc. Method and apparatus of adaptive multiple transforms for video coding
US10812797B2 (en) * 2018-02-05 2020-10-20 Tencent America LLC Method, apparatus and medium for decoding or encoding using a low-complexity transform
US11647214B2 (en) * 2018-03-30 2023-05-09 Qualcomm Incorporated Multiple transforms adjustment stages for video coding

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120008682A1 (en) * 2010-07-09 2012-01-12 Qualcomm Incorporated Video coding using directional transforms
CN102986215A (zh) * 2010-07-09 2013-03-20 高通股份有限公司 使用帧内预测模式的子集及对应定向变换的视频译码
CN104067614A (zh) * 2011-12-28 2014-09-24 夏普株式会社 算术解码装置、图像解码装置以及算术编码装置
JP2013192118A (ja) * 2012-03-14 2013-09-26 Sharp Corp 算術復号装置、画像復号装置、算術符号化装置、および画像符号化装置
CN104380737A (zh) * 2012-06-22 2015-02-25 夏普株式会社 算术解码装置、算术编码装置、图像解码装置以及图像编码装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A.SAXENA等: "On secondary transforms for Intra_BL residue", JOINT VIDEO EXPLORATION TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 13TH MEETING: INCHEON, KR, 18–26 APRIL 2013, JVET-M0033 *
J.CHEN等: "Algorithm description of Joint Exploration Test Model 2", JOINT VIDEO EXPLORATION TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 2ND MEETING: SAN DIEGO, USA, 20–26 FEBRUARY 2016, JVET-B1001_V3 *

Also Published As

Publication number Publication date
CN113411579B (zh) 2024-01-23
EP3457691A1 (en) 2019-03-20
US20210076076A1 (en) 2021-03-11
US20200213626A1 (en) 2020-07-02
US11405655B2 (en) 2022-08-02
EP3457691A4 (en) 2019-03-20
CN113411578B (zh) 2024-04-12
CN109076223B (zh) 2021-07-09
CN113411580A (zh) 2021-09-17
CN113411580B (zh) 2024-01-30
CN109076223A (zh) 2018-12-21
US20230379508A1 (en) 2023-11-23
US11743510B2 (en) 2023-08-29
US20220377387A1 (en) 2022-11-24
CN113411578A (zh) 2021-09-17
WO2017195555A1 (ja) 2017-11-16
US10887626B2 (en) 2021-01-05

Similar Documents

Publication Publication Date Title
CN109076223B (zh) 图像解码装置以及图像编码装置
JP7001768B2 (ja) 算術復号装置
WO2016203981A1 (ja) 画像復号装置及び画像符号化装置
WO2016203881A1 (ja) 算術復号装置及び算術符号化装置
AU2013268588B2 (en) Arithmetic decoding device, image decoding device, arithmetic encoding device, and image encoding device
CN107087178B (zh) 图像解码装置及方法、以及记录介质
CN111133758B (zh) 图像解码装置以及图像编码装置
JP7402016B2 (ja) 画像復号装置及び画像符号化装置
KR20220062539A (ko) 비디오 코딩에서의 조인트 크로마 잔차 모드를 위한 양자화 파라미터 시그널링
JP2024079826A (ja) 画像復号装置、画像符号化装置、画像復号方法及び画像符号化方法
WO2020197751A1 (en) Fixed filters with non-linear adaptive loop filter in video coding
JP2013192118A (ja) 算術復号装置、画像復号装置、算術符号化装置、および画像符号化装置
JP2013118424A (ja) 画像復号装置、画像符号化装置、および符号化データのデータ構造
JP2023046435A (ja) 動画像復号装置および動画像符号化装置
JP2024016304A (ja) 画像復号装置及び画像符号化装置
JP2022178335A (ja) 画像復号装置及び画像符号化装置
JP2021061470A (ja) 画像復号装置及び画像符号化装置
JP2020195012A (ja) 画像復号装置及び画像符号化装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20231201

Address after: Japan's Osaka City. Sakai Sakai district town 1 times

Applicant after: Sharp Corp.

Address before: Japan's Osaka City. Sakai Sakai district town 1 times

Applicant before: Sharp Corp.

Applicant before: FG Innovation Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant