CN107087179A - 图像解码装置及方法、图像编码装置及方法以及记录介质 - Google Patents

图像解码装置及方法、图像编码装置及方法以及记录介质 Download PDF

Info

Publication number
CN107087179A
CN107087179A CN201611227733.4A CN201611227733A CN107087179A CN 107087179 A CN107087179 A CN 107087179A CN 201611227733 A CN201611227733 A CN 201611227733A CN 107087179 A CN107087179 A CN 107087179A
Authority
CN
China
Prior art keywords
information
mentioned
coefficient
decoding
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611227733.4A
Other languages
English (en)
Other versions
CN107087179B (zh
Inventor
山本智幸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of CN107087179A publication Critical patent/CN107087179A/zh
Application granted granted Critical
Publication of CN107087179B publication Critical patent/CN107087179B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Abstract

一种图像解码装置及方法、图像编码装置及方法以及记录介质。通过按每个解码单位对包括编码量化变换系数的编码数据进行解码而解码图像,编码量化变换系数是对将从原图像减去预测图像的预测残差按每个变换单位进行变换并量化的量化变换系数进行了编码的系数,变换单位通过层次性地分割编码单位而形成,图像解码装置包括:解码单元,对将变换单位进行分割而获得的尺寸为变换单位的尺寸以下的部分单位,估计表示在部分单位中是否包含非零变换系数的非零变换系数存否信息,或者从编码数据解码非零变换系数存否信息,在非零变换系数存否信息表示在部分单位内存在非零变换系数的情况下,从编码数据解码部分单位内的变换系数。

Description

图像解码装置及方法、图像编码装置及方法以及记录介质
本申请是国际申请日为2012年3月7日、国际申请号为PCT/JP2012/055805、国家申请号为201280012467.7、发明名称为“图像解码装置、图像编码装置以及编码数据的数据构造”的发明专利申请的分案申请。
技术领域
本发明涉及对编码数据进行解码的图像解码装置以及生成编码数据的图像编码装置。此外,涉及由图像编码装置生成且由图像解码装置参照的编码数据的数据构造。
背景技术
为了高效地传输或者记录动态图像,使用通过对动态图像进行编码而生成编码数据的动态图像编码装置(图像编码装置)以及通过对该编码数据进行解码而生成解码图像的动态图像解码装置(图像解码装置)。作为具体的动态图像编码方式,例如可举出如下方式等:在作为H.264/MPEG-4.AVC(非专利文献1)、VCEG(Video Coding Expert Group,视频编码专家组)中的共同开发用编码解码器(CODEC)的KTA软件中采用的方式;在TMuC(TestModel under Consideration,考虑中的测试模型)软件中采用的方式;以及在作为其后续编码解码器(CODEC)的高效率视频编码工作草案1(Working Draft 1 of High-EfficiencyVideo Coding)(非专利文献2,以下,也称为HEVC WD1)中采用的方式。
在这样的编码方式中,构成动态图像的图像(picture)由层次构造管理,通常按每个块进行编码,该层次构造由通过分割图像而获得的片段、通过分割片段而获得的编码单位(有时也被称为宏块或者编码单元(CU:Coding Unit))以及通过分割编码单位而获得的块及分区构成。
此外,在这样的编码方式中,通常基于通过对输入图像进行编码/解码而获得的局部解码图像而生成预测图像,从输入图像(原图像)减去该预测图像而获得的预测残差(有时也称为“差分图像”或者“残差图像”)被进行编码。此外,作为预测图像的生成方法,可举出画面间预测(帧间预测(inter prediction))以及画面内预测(帧内预测(Intraprediction))。
在帧间预测中,将已解码的帧作为参照帧,应用使用了运动矢量的运动补偿,从而解码中的帧内的预测图像按每个预测单位生成。
另一方面,在帧内预测中,基于解码中的帧的已解码区域,解码中的帧内的预测图像按每个预测单位生成。作为在H.264/MPEG-4.AVC中使用的帧内预测的一例,可举出如下方法:按每个预测单位(例如分区),(1)从预先确定的预测模式组中选择任一个预测模式,(2)将已解码区域的像素值沿着与选择的预测模式对应的外插方向(预测方向)进行外插,从而生成该预测单位上的像素值的方法(有时也称为“基本预测”)。
并且,在非专利文献2中,记载了如下技术:通过将在解码中使用的信息的一部分进行省略(跳过(SKIP))或者估计(合并(MERGE)),从而削减编码数据的码量的技术。更具体而言,在构成在对CU进行解码时使用的编码数据的各种信息中,将表示在CU中包含的变换树(TT:transform tree)的信息、表示帧间预测中的预测单位(PU:prediction unit)的分割方法的信息作为跳过的对象。在变换树TT中包含与在CU内的各部分区域中应用的变换单位(TU:transform unit)有关的信息。此外,将表示在帧间预测中的预测单位PU的分割方法的信息作为合并的对象。
此外,在构成在对上述预测单位(PU:prediction unit)进行解码时使用的编码数据的各种信息中,将表示帧间预测的类型的信息、表示进行帧间预测时的参照图像的信息以及表示运动矢量的信息作为跳过或者合并的对象。
此外,在非专利文献3中,公开了将合并的对象从在对CU进行解码时使用的编码数据中包含的各种信息变更为在对PU进行解码时使用的编码数据中包含的各种信息的技术。
现有技术文献
非专利文献
非专利文献1:“Recommendation ITU-T H.264”,TelecommunicationStandardization Sector of ITU,03/2009
非专利文献2:“JCTVC-C403”,Joint Collaborative Team on Video Coding(JCT-VC)of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,3rd Meeting:Guangzhou,CN,7-15October,2010
非专利文献3:“JCTVC-D441”,Joint Collaborative Team on Video Coding(JCT-VC)of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,4th Meeting:Daegu,KR,20-28January,2011
发明内容
发明要解决的课题
但是,在上述现有的构成中,在编码数据中包含的各种信息中,只有一部分成为跳过或者合并的对象。此外,包含成为跳过或者合并的对象的各种信息的编码数据被限定于在对CU进行解码时使用的编码数据以及在对PU进行解码时使用的编码数据。
因此,在上述现有的构成中,不能充分地削减编码数据的编码量。
本发明是鉴于上述问题点而完成的,其目的在于,实现一种能够进一步削减编码数据的编码量的图像编码装置等。
为了解决课题的手段
为了解决上述课题,本发明的图像解码装置,通过对包括编码量化变换系数的编码数据进行解码而解码图像,上述编码量化变换系数是对将从原图像减去预测图像的预测残差按每个变换单位进行变换并量化的量化变换系数进行了编码的系数,其特征在于,上述图像解码装置包括:解码单元,对将上述变换单位进行分割而获得的部分单位,估计表示在该部分单位中是否包含非零变换系数的非零变换系数存否信息,或者从上述编码数据解码该非零变换系数存否信息,且在该非零变换系数存否信息表示在该部分单位内存在非零变换系数的情况下,从上述编码数据解码包含该部分单位的解码单位内的各变换系数。
根据上述结构,对将变换单位分割的部分单位,估计或者解码非零变换系数存否信息,且在非零变换系数存否信息表示存在非零变换系数的情况下,对包含该部分单位的解码单位内的变换系数进行解码,所以能够以部分单位进行是否存在非零变换系数的判断。
为了解决上述课题,本发明的图像解码装置,通过对包括编码量化变换系数的编码数据进行解码而解码图像,上述编码量化变换系数是对将从原图像减去预测图像的预测残差按每个变换单位进行变换并量化的量化变换系数进行了编码的系数,其特征在于,上述图像解码装置包括:解码单元,在上述编码数据中包含将存否信息进行合并(merge)或者跳过(skip)的合并/跳过信息的情况下,不解码上述存否信息,上述存否信息表示在上述量化变换系数中是否包含频域的变换系数;以及估计单元,在上述编码数据中包含将上述存否信息进行合并或者跳过的合并/跳过信息的情况下,估计该存否信息,上述解码单元使用上述估计单元所估计的存否信息,解码上述编码量化变换系数。
这里,合并是指,省略解码所需的预定的信息,基于处于既定或者指定的位置的信息而估计。此外,跳过是指,省略解码所需的预定的信息,代替地使用估计值或者既定值。
根据上述结构,不传输表示频域的变换系数的存在的有无的信息,仅传输合并/跳过信息,就能够进行解码。
因此,不需要传输以往需要传输的表示频域的变换系数的存在的有无的信息,所以比以往还能够削减编码数据的码量。
为了解决上述课题,本发明的图像解码装置,通过对包括编码量化变换系数的编码数据进行解码而解码图像,上述编码量化变换系数是对将从原图像减去预测图像的预测残差按每个变换单位进行变换并量化的量化变换系数进行了编码的系数,其特征在于,在上述编码数据中,包含按每个上述变换单位将在上述变换中使用的变换信息进行了编码的编码变换信息,所述图像解码装置包括:估计单元,在上述编码数据中,包含有按每个上述变换单位将上述变换信息以及上述量化变换系数进行合并或者跳过的合并/跳过信息的情况下,通过上述合并/跳过信息所表示的方法,估计该变换单位的上述变换信息以及上述量化变换系数。
根据上述结构,由于能够以变换单位进行合并/或者跳过,所以能够进一步削减编码数据的码量。
为了解决上述课题,本发明的图像编码装置,输出包含编码量化变换系数的编码数据,上述编码量化变换系数是对将从原图像减去预测图像的预测残差按每个变换单位进行变换并量化的量化变换系数进行了编码的系数,其特征在于,所述图像编码装置包括:编码单元,在上述编码数据中包含将存否信息进行合并或者跳过的合并/跳过信息,上述存否信息表示在上述量化变换系数中是否包含频域的变换系数。
根据上述结构,输出不包含表示频域的变换系数的存在的有无的信息而仅包含合并/跳过信息的编码数据。
因此,不需要将以往需要输出的表示频域的变换系数的存在的有无的信息包含在编码数据中,所以比以往还能够削减编码数据的码量。
为了解决上述课题,在本发明的编码数据的数据构造中,上述编码数据包含对将从原图像减去预测图像的预测残差按每个变换单位进行变换并量化的量化变换系数进行了编码的编码量化变换系数,其特征在于,包含将存否信息进行合并或者跳过的合并/跳过信息,上述存否信息表示在上述量化变换系数中是否包含频域的变换系数。
根据上述结构,成为不包含表示频域的变换系数的存在的有无的信息而仅包含合并/跳过信息的编码数据。
因此,不需要将以往需要的表示频域的变换系数的存在的有无的信息包含在编码数据中,所以比以往还能够削减编码数据的码量。
发明效果
如以上所述,本发明的图像解码装置为如下结构,其包括:解码单元,在编码数据中包含将存否信息进行合并或者跳过的合并/跳过信息的情况下,不解码上述存否信息,上述存否信息表示在上述量化变换系数中是否包含频域的变换系数;以及估计单元,在上述编码数据中包含将上述存否信息进行合并或者跳过的合并/跳过信息的情况下,估计该存否信息,上述解码单元使用上述估计单元所估计的存否信息,解码上述编码量化变换系数。
因此,由于不需要传输以往需要传输的表示频域的变换系数的存在的有无的信息,所以起到比以往还能够削减编码数据的码量的效果。
附图说明
图1是表示本发明的一个实施方式的动态图像解码装置的主要部分结构的框图。
图2是表示由动态图像编码装置生成且由上述动态图像解码装置参照的编码数据的数据构造的图,(a)是表示编码数据的图像层的结构的图,(b)是表示在图像层中包含的片段层的结构的图,(c)是表示在片段层中包含的TBLK层的结构的图,(d)是表示在TBLK层中包含的CU的结构的图,(e)是表示关于CU的帧间预测信息的结构的图,(f)是表示关于CU的帧内预测信息的结构的图,(g)是表示关于CU的变换树的结构的图。
图3是表示由动态图像编码装置生成且由上述动态图像解码装置参照的图像的结构的图,(a)是表示从图像分割片段以及TBLK的状态的图,(b)、(c)是表示从TBLK分割CU的状态的图。
图4是表示由动态图像编码装置生成且由上述动态图像解码装置参照的图像的结构的图,(a)是表示从CU分割帧内预测单位的状态的图,(b)是表示从CU分割帧间预测单位的状态的图,(c)是表示从CU分割变换单位的状态的图。
图5是表示上述动态图像解码装置的CU信息解码部的处理的内容的语法表(syntax table)。
图6是表示上述CU信息解码部的处理内容的图,(a)、(b)是表示合并标记、合并等级和合并对象的关系的图。
图7是表示上述动态图像解码装置的PT信息解码部的处理内容的语法表。
图8是表示上述PT信息解码部的处理内容的图,(a)、(b)、(c)是表示合并标记、合并等级和合并对象的关系的图。
图9是表示上述动态图像解码装置的TT信息解码部的处理的内容的语法表。
图10是表示上述TT信息解码部的处理的内容的图,(a)是表示处理内容的语法表,(b)是用于说明语法表的内容的图。
图11是表示上述TT信息解码部的处理的内容的语法表。
图12是表示上述TT信息解码部的处理内容的图,(a)、(b)是表示合并标记、合并等级和合并对象的关系的图。
图13是用于说明合并的例子的图。
图14是用于说明合并的例子的图。
图15是表示本实施方式的动态图像编码装置的主要部分结构的框图。
图16是用于表现频域的变换系数的存在有无CTC的说明图,(a)是表示分割为非正方区域而表现CTC的情况下的图,(b)是表示使用参数而表现CTC的情况下的图,(c)是表示使用扫描顺序而表现CTC的情况下的图。
图17是用于说明动态图像解码装置以及动态图像编码装置能够用于动态图像的发送接收的图,(a)是表示搭载了动态图像编码装置的发送装置的结构的框图,(b)是表示搭载了动态图像解码装置的接收装置的结构的框图。
图18是用于说明动态图像解码装置以及动态图像编码装置能够用于动态图像的记录以及再现的图,(a)是表示搭载了动态图像编码装置的记录装置的结构的框图,(b)是表示搭载了动态图像解码装置的再现装置的结构的框图。
具体实施方式
若基于附图说明本发明的图像解码装置以及图像编码装置的实施方式,则如下。另外,本实施方式的图像解码装置是从编码数据解码动态图像的装置。因此,以下,将其称为“动态图像解码装置”。此外,本实施方式的图像编码装置是通过对动态图像进行编码而生成编码数据的装置。因此,以下,将其称为“动态图像编码装置”。
另外,在本实施方式中,记载各信息主要成为合并的对象的情况,但关于跳过也是相同的。合并是指,省略解码所需的预定的信息,基于处于既定或者指定的位置的信息而估计。此外,跳过是指,省略解码所需的预定的信息,作为代替使用估计值或者既定值。
(编码数据#1的结构)
在本实施方式的动态图像解码装置(图像解码装置)1的说明之前,使用图2~4说明由本实施方式的动态图像编码装置2生成且由动态图像解码装置1解码的编码数据#1的结构。编码数据#1包括片段以及构成片段的多个图像。
图2表示编码数据#1中的图像层以下的层次的构造。图2的(a)是表示规定图像PICT的图像层的构造的图。图2的(b)是表示规定片段S的片段层的构造的图。图2的(c)是表示规定树块(Tree block)TBLK的树块层的构造的图。图2的(d)是表示规定在树块TBLK中包含的编码单位(CU:Coding Unit)的CU层的构造的图。
此外,图2的(e)是表示关于预测树(PT:prediction tree)的信息并且是作为关于帧间预测(画面间预测)分区的预测信息PTI的帧间预测信息PTI_Inter的构造的图。图2的(f)是表示关于预测树PT的信息并且是作为关于帧内预测(画面内预测)分区的预测信息PTI的帧内预测信息PTI_Intra的构造的图。图2的(g)是表示作为关于在编码单位CU中包含的变换树(TT:transform tree)的信息的变换单位信息TTI的构造的图。
此外,图3、4是表示从图像PICT分割片段S、树块TBLK、预测单位PU、变换单位TU的状态的图。
(图像层)
在图像层中,规定动态图像解码装置1为了解码处理对象的图像PICT(以下,也称为对象图像)而参照的数据的集合。如图2的(a)所示,图像PICT包括图像头PH以及片段S1~SNS(NS为在图像PICT中包含的片段的总数)。
另外,以下,在不需要区分各个片段S1~SNS的情况下,有时省略符号的下标而记述。此外,关于在以下说明的编码数据#1中包含的数据并且是标注下标的其他数据,也是相同的。
在图像头PH中,包含为了决定对象图像的解码方法而动态图像解码装置1参照的编码参数组。例如表示动态图像编码装置2在编码时使用的可变长编码的模式的编码模式信息(entropy_coding_mode_flag)为在图像头PH中包含的编码参数的一例。
在entropy_coding_mode_flag为0的情况下,该图像PICT通过LCEC(LowComplexity Entropy Coding,低复杂度熵编码)或者CAVLC(Context-based AdaptiveVariable Length Coding,基于上下文的自适应可变长编码)进行编码。此外,在entropy_coding_mode_flag为1的情况下,该图像PICT通过CABAC(Context-based Adaptive BinaryArithmetic Coding,基于上下文的自适应二进制算术编码)进行编码。
另外,图像头PH也被称为图像参数集(PPS:Picture Parameter Set)。
(片段层)
在片段层中,规定动态图像解码装置1为了解码处理对象的片段S(也称为对象片段)而参照的数据的集合。如图2的(b)所示,片段S包含片段头SH以及树块TBLK1~TBLKNC(NC为在片段S中包含的树块的总数)的片段。
在片段头SH中,包含为了决定对象片段的解码方法而动态图像解码装置1参照的编码参数组。指定片段类型的片段类型指定信息(slice_type)为在片段头SH中包含的编码参数的一例。
作为可由片段类型指定信息指定的片段类型,可举出(1)在编码时仅使用帧内预测的I片段、(2)在编码时使用单方向预测或者帧内预测的P片段、(3)在编码时使用单方向预测、双方向预测或者帧内预测的B片段等。
此外,在片段头SH中,也可以包含由动态图像解码装置1具备的环路滤波器(未图示)参照的滤波器(filter)参数。
此外,如图3的(a)所示,片段S通过图像PICT被分割而形成。在图3的(a)中,图像PICT301被分割而形成片段S302。
(树块层)
在树块层中,规定动态图像解码装置1为了解码处理对象的树块TBLK(以下,也称为对象树块)而参照的数据的集合。
树块TBLK包括树块头TBLKH和编码单位信息CU1~CUNL(NL为在树块TBLK中包含的编码单位信息的总数)。这里,首先,若说明树块TBLK和编码单位信息CU的关系,则如下。
树块TBLK被分割为用于确定帧内预测或者帧间预测以及用于变换的各处理的块尺寸的单元。
树块TBLK的上述单元通过递归的4叉树分割而被分割。以下,将该通过递归的4叉树分割而获得的树构造称为编码树(coding tree)。
以下,将与作为编码树的末端的节点的叶(leaf)对应的单元,作为编码节点(coding node)而参照。此外,由于编码节点成为编码处理的基本的单位,所以以下,也将编码节点称为编码单位(CU)。
即,编码单位信息(以下,称为CU信息)CU1~CUNL为与将树块TBLK递归性地进行四叉树分割而获得的各编码节点(编码单位)对应的信息。
此外,编码树的根(root)与树块TBLK相对应。换言之,树块TBLK与将多个编码节点递归性地包含的四叉树分割的树构造的最上位节点相对应。
另外,各编码节点的尺寸都为该编码节点直接所属的编码节点(即,该编码节点的1层次上位的节点的单元)的尺寸的纵横的一半。
此外,各编码节点可取的尺寸依赖于在编码数据#1的片段参数集SPS中包含的、编码节点的尺寸指定信息以及最大层次深度(maximum hierarchical depth)。例如在树块TBLK的尺寸为64×64像素且最大层次深度为3的情况下,该树块TBLK以下的层次中的编码节点可取4种尺寸、即64×64像素、32×32像素、16×16像素以及8×8像素中的任一个。
此外,作为块构造,如图3的(a)所示,片段S被分割而形成树块TBLK303。并且,如图3的(b)所示,树块TBLK303被分割而形成CU311。
此外,图3的(c)表示在最大层次深度为“2”的情况下,树块TBLK303进行四叉树分割的情况。如图3的(c)所示,在最大层次深度为“2”且后述的CU分割标记(split_coding_unit_flag)的值在层次0中为“1”且在层次1中也为“1”的情况下,CU311b成为编码节点。另外,在最大层次深度为“1”且CU分割标记的值在层次0中为“1”的情况下,CU311a成为编码节点。
(树块头)
在树块头TBLKH中,包含动态图像解码装置1为了决定对象树块的解码方法而参照的编码参数。具体而言,如图2的(c)所示,包含指定对象树块向各CU的分割模式的树块分割信息SP_TBLK以及指定量化步骤的大小的量化参数差分Δqp(qp_delta)。
树块分割信息SP_TBLK为表示用于分割树块的编码树的信息,具体而言,在对象树块中包含的各CU的形状、尺寸以及指定在对象树块内的位置的信息。
另外,树块分割信息SP_TBLK也可以不明示性地包含CU的形状或尺寸。例如,树块分割信息SP_TBLK也可以是表示是否将对象树块整体或者树块的部分区域进行四分割的标记(split_coding_unit_flag)的集合。此时,通过将树块的形状或尺寸并用,能够确定各CU的形状或尺寸。
此外,量化参数差分Δqp为,对象树块中的量化参数qp与就在该对象树块之前编码的树块中的量化参数qp’的差分qp-qp’。
(CU层)
在CU层中,规定动态图像解码装置1为了解码处理对象的CU(以下,也称为对象CU)而参照的数据的集合。
这里,在CU信息CU中包含的数据的具体的内容的说明之前,说明在CU中包含的数据的树构造。编码节点成为预测树PT以及变换树TT的根。若说明预测树以及变换树,则如下。
在预测树中,编码节点被分割为一个或者多个预测块,且规定各预测块的位置和尺寸。若用其他表现表示,预测块是构成编码节点的一个或者多个不重复的区域。此外,预测树包含通过上述分割而获得的一个或者多个预测块。
预测处理按该每个预测块进行。以下,将作为预测的单位的预测块也称为预测单位(PU:prediction unit)。
此外,在变换树中,编码节点被分割为一个或者多个变换块,且规定各变换块的位置和尺寸。若用其他表现表示,变换块是构成编码节点的一个或者多个不重复的区域。此外,变换树包含通过上述分割而获得的一个或者多个变换块。
变换处理按该每个变换块进行。以下,将作为变换的单位的变换块也称为变换单位(TU:transform unit)。
(CU信息CU的数据构造)
接着,参照图2的(d)说明在CU信息CU中包含的数据的具体的内容。如图2的(d)所示,CU信息CU包含跳过标记SKIP、合并标记MRG_CU、指定对象CU向各预测单位的分割模式的PU分割信息SP_PU、预测类型信息PType、PT信息PTI以及TT信息TTI。
跳过标记SKIP是表示是否对对象的CU应用跳过模式的标记,在跳过标记SKIP的值为1的情况下,即在对对象CU应用跳过模式的情况下,成为跳过的对象的各种信息被省略,在解码时使用既定值或者估计值。另外,关于成为对象的各种信息,在后面叙述。此外,跳过标记SKIP在I片段中被省略。
合并标记MRG_CU是表示是否对对象的CU应用合并模式的标记,在合并标记MRG_CU的值为1的情况下,即在对对象CU应用合并模式的情况下,成为合并的对象的各种信息被省略,在解码时使用估计值。另外,关于成为对象的各种信息,在后面叙述。
PU分割信息SP_PU为在对象CU中包含的各PU的形状、尺寸以及用于决定在对象CU内的位置的信息。例如PU分割信息SP_PU能够通过从对象CU指定帧内(Intra)分割的帧内分割标记(intra_split_flag)以及从对象CU指定帧间分割的帧间分割标记(inter_partitining_idc)中的至少任一个实现。
帧内分割标记为在对象CU中包含的各帧内PU(使用帧内预测的PU)的形状、尺寸以及指定在对象CU内的位置的信息。
帧间(Inter)分割标记为在对象CU中包含的各帧间PU(使用帧间预测的PU)的形状、尺寸以及指定在对象CU内的位置的信息。
预测类型信息PType是指定作为对于对象PU的预测图像生成方法而使用帧内预测还是使用帧间预测的信息。
PT信息PTI为与在对象CU中包含的PT有关的信息。换言之,PT信息PTI为与在PT中包含的一个或者多个PU分别有关的信息的集合,且在由动态图像解码装置1生成预测图像时参照。如图2的(e)、(f)所示,PT信息PTI根据预测类型信息PType指定哪种预测方法而由帧间预测信息(PTI_Inter)或者帧内预测信息(PTI_Intra)构成。以下,也将应用帧内预测的PU称为帧内PU,也将应用帧间预测的PU称为帧间PU。
TT信息TTI为与在对象CU中包含的TT有关的信息。换言之,TT信息TTI为与在TT中包含的一个或者多个TU分别有关的信息的集合,且在由动态图像解码装置1解码残差数据时参照。
(帧间预测信息PTI_Inter)
在帧间预测信息PTI_Inter中,包含在动态图像解码装置1通过帧间预测而生成帧间预测图像时参照的编码参数。如图2的(e)所示,在帧间预测信息PTI_Inter中,包含关于各PU的帧间预测参数PP_Inter1~PP_InterNe(Ne为在对象CU中包含的帧间预测PU的总数)。
通过2N×2N像素(与对象CU相同的尺寸)、2N×N像素、N×2N像素以及N×N像素的四个对称的分割(symmetric splittings)对对象CU进行分割而生成帧间PU。
具体而言,使用图4的(b)进行说明。如图4的(b)所示,若从CU311被分割为2N×2N像素则成为PU412a,被分割为2N×N像素则成为PU412b以及PU412c,被分割为N×2N像素则成为PU412d以及PU412e,被分割为N×N像素则成为PU412f~PU412i。
(帧间预测参数)
如图2的(e)所示,帧间预测参数PP_Inter包括合并标记MRG_PU、帧间预测类型IPT、参照图像索引RI、估计运动矢量索引PMVI、运动矢量残差MVD。
(帧内预测信息PTI_Intra)
在帧内预测信息PTI_Intra中,包含在动态图像解码装置1通过帧内预测而生成帧内预测图像时参照的编码参数。如图2的(f)所示,在帧内预测信息PTI_Intra中,包含关于各PU的帧内预测参数PP_Intra1~PP_IntraNa(Na为在对象CU中包含的帧内预测PU的总数)。
若帧内分割标记为1,则通过将对象CU对称地分割为四个PU而生成帧内PU,若帧内分割标记为0,则不分割对象CU,对象CU本身作为PU而被处理。因此,若将对象CU的尺寸设为2N×2N像素,则帧内PU可取2N×2N像素(不分割)以及N×N像素(4分割)中的任一个尺寸(这里,N=2n,n为1以上的任意的整数)。例如若128×128像素,则对象CU能够分割为128×128像素以及64×64像素的帧内PU。
具体而言,使用图4的(a)进行说明。如图4的(a)所示,若从CU311被分割为2N×2N像素则成为PU411a,被分割为N×N像素则成为PU412b~PU412e。
(帧内预测参数PP_Intra)
如图2的(f)所示,帧内预测参数PP_Intra包括合并标记MRG_PU、帧内预测模式IPM。
(TT信息TTI)
如图2的(g)所示,TT信息TTI包含在对象CU中包含的TU的总数个的合并标记MRG_TU、变换尺寸TTS、变换类型TTType、变换系数TTC、空间区域的变换系数的存在的有无CBP、频域的变换系数的存在的有无CTC、量化预测残差QD。
这里,频域的变换系数的存在的有无CTC是包含表示在对象频域(对象变换单位)中包含的各变换系数是否为0的信息、表示在将对象频域分割而获得的各部分单位中是否包含非零变换系数的信息(非零变换系数存否信息)的概念。
另外,表示在对象频域中包含的各变换系数是否为0的信息有时也被称为significant_coeff_flag[xC][yC](这里,[xC][yC]表示对象频域中的各变换系数的位置),表示在将对象频域分割而获得的各部分单位中是否包含非零变换系数的信息有时也被称为significant_coeff_group_flag[xCG][yCG](这里,[xCG][yCG]表示对象频域中的各部分单位的位置)。
TU通过将对象CU层次性地进行四叉树分割而形成,通过表示是否进行对象CU或者对象CU的部分区域的分割的信息(split_transform_flag)而决定尺寸。split_transform_flag基本上对四叉树的各节点进行编码,但也存在根据与变换尺寸有关的条件(最大变换尺寸、最小变换尺寸、四叉树的最大层次深度)被省略而估计的情况。
图4的(c)表示CU311被进行四叉树分割而形成TU的情况。如图4的(c)所示,表示在层次0以及层次1中进行节点的分割的情况下,PU413b成为TU。此外,在表示在层次0中进行节点的分割而在层次1中不进行节点的分割的情况下,PU413a成为TU。
例如在最大层次深度为“2”且对象CU的尺寸为64×64的情况下,在对象CU中包含的TU可取64×64像素、32×32像素或者16×16像素的尺寸。
量化预测残差QD为动态图像编码装置2对作为处理对象的块的对象块实施以下的处理1~3而生成的编码数据。
处理1:将从编码对象图像减去预测图像的预测残差进行DCT变换(DiscreteCosine Transform,离散余弦变换);
处理2:将在处理1中获得的变换系数进行量化;
处理3:将在处理2中量化的变换系数进行可变长编码;
另外,上述量化参数qp表示在动态图像编码装置2对变换系数进行量化时使用的量化步骤QP的大小(QP=2qp/6)。
(动态图像解码装置1)
接着,参照图1、5~12说明动态图像解码装置1的构成。图1是表示动态图像解码装置1的主要部分结构的框图。如图1所示,动态图像解码装置1是包括TBLK解码部(解码单元)10和帧存储器21的结构,在TBLK解码部10中,包括TBLK信息解码部11、CU信息解码部12、PT信息解码部13、TT信息解码部(解码单元)14以及CU图像生成部15。此外,在CU信息解码部12中包括CU信息估计部31,在PT信息解码部13中包括PT信息估计部32,在TT信息解码部14中包括TT信息估计部(估计单元)33。
若大致地说,动态图像解码装置1是通过对编码数据#1进行解码而生成解码图像#2并进行输出的装置。此外,动态图像解码装置1是在其一部分中使用在H.264/MPEG-4AVC标准中采用的技术、在作为VCEG(Video Coding Expert Group,视频编码专家组)中的共同开发用编码解码器(CODEC)的KTA软件中采用的技术、在TMuC(Test Model underConsideration,考虑中的测试模型)软件中采用的技术以及在作为其后续编码解码器(CODEC)的高效率视频编码工作草案1(Working Draft 1 of High-Efficiency VideoCoding(HEVC WD1))中采用的方式的动态图像解码装置。
动态图像解码装置1是按每个预测单位生成预测图像,并通过将生成的预测图像和从编码数据#1解码的预测残差进行相加而生成解码图像#2并输出的装置。
输入到动态图像解码装置1的编码数据#1输入到TBLK解码部10的TBLK信息解码部11。
(TBLK信息解码部11)
TBLK信息解码部11从输入的编码数据#1解码在树块头TBLKH中包含的树块分割信息SP_TBLK以及量化参数差分Δqp(TBLKH信息)。
在树块分割信息中,包含在对象树块中包含的各CU的形状、尺寸以及指定对象树块内的位置的信息。并且,将包含所解码的TBLKH信息以及编码单位信息CU的分割信息#11输出到CU信息解码部12。
(CU信息解码部12)
CU信息解码部12从TBLK信息解码部11输入的分割信息#11解码CU信息CU而生成CU解码信息#21、CU解码信息#22、CU解码信息#23。并且,将CU解码信息#21输入到PT信息解码部13,将CU解码信息#22输入到TT信息解码部14,将CU解码信息#23输入到CU图像生成部15。
若更具体地说明,则CU信息解码部12解码在CU信息CU中包含的跳过标记SKIP(skip_flag)以及合并标记MRG_CU(cu_merge_flag)。并且,在合并标记MRG_CU的值为“1”的情况下,进一步解码CU合并估计标记(cu_merge_left_flag)和CU合并等级标记(cu_merge_level)。
这里,CU合并估计标记是表示用于估计值的参照目标的标记,CU合并等级标记是用于决定成为合并的对象的信息的标记。
并且,CU信息解码部12的CU信息估计部31基于跳过标记SKIP、合并标记MRG_CU、CU合并估计标记、CU合并等级标记,解码或者估计PU分割信息SP_PU的值以及预测类型信息PType的值。
更详细而言,CU信息估计部31根据CU合并估计标记(cu_merge_left_flag)的值而决定成为参照对象的CU(参照CU)。并且,在参照CU为帧内预测CU的情况下(即,PredMode为MODE_INTRA),将参照CU的帧内分割标记(intra_split_flag)的值估计为对象CU的帧内分割标记的值。
此外,在参照CU为帧间预测CU的情况下(即,PredMode为MODE_INTER),设定对象CU的帧内分割的值,使得成为最接近参照CU内的PU并且是与和对象CU相邻的参照CU的边界的边相邻的PU中尺寸最小的PU的尺寸。
并且,CU信息解码部12将包含所解码的跳过标记SKIP的值、合并标记MRG_CU的值(以及,在合并标记MRG_CU的值为“1”的情况下,所解码的CU合并估计标记、CU合并等级标记的值)、解码或者估计的PU分割信息SP_PU的值、同样地解码或者估计的预测类型信息PType的值的CU解码信息#21输出到PT信息解码部13。
此外,CU信息解码部12将包含所解码的跳过标记SKIP的值、合并标记MRG_CU的值(以及,在合并标记MRG_CU的值为“1”的情况下,所解码的CU合并估计标记、CU合并等级标记的值)的CU解码信息#22输出到TT信息解码部14。
此外,CU信息解码部12将包含所解码或者估计的PU分割信息SP_PU的值以及预测类型信息PType的值的CU解码信息#23输出到CU图像生成部15。
接着,参照图5、6说明CU信息解码部12中的处理。图5是表示CU信息解码部12中的处理的内容的语法表。此外,图6是用于说明CU信息解码部12中合并的对象的图,图6的(a)是表示合并标记以及CU合并等级标记和解码对象的关系的图,图6的(b)是表示合并标记以及CU合并等级标记和合并对象的关系的图。
如图5所示,首先,CU信息解码部12解码在编码单位信息CU中包含的跳过标记SKIP(skip_flag)(st501)。并且,若跳过标记SKIP的值为“1”(st502),则进入预测单位PU中的处理(st503)。
另一方面,若跳过标记SKIP的值不是“1”,则解码合并标记MRG_CU(cu_merge_flag)(st504)。并且,若合并标记MRG_CU的值为“1”,则进一步解码CU合并估计标记(cu_merge_left_flag)、CU合并等级标记(cu_merge_level)(st505)。
接着,CU信息估计部31解码或者估计预测类型信息PType(pred_mode)(st506)。并且,在解码或者估计的预测类型信息PType表示帧内预测的情况下,解码或者估计帧内分割标记(intra_split_flag)(st507)。
另一方面,在解码或者估计的预测类型信息PType表示帧间预测的情况下,解码或者估计帧间分割标记(inter_partitining_idc)(st508)。
然后,进入预测单位PU中的处理(prediction_unit、st509)、变换单位TU中的处理(transform_tree、st510)。
接着,参照图6的(a),说明成为解码以及估计的对象的标记。在图6的(a)中,“○”表示成为解码的对象,“inf.”表示使用估计值,“─”表示不需要。
如图6的(a)所示,在合并标记MRG_CU的值为“0”的情况下,以CU单位解码成为解码或者估计的对象的全部标记。此外,在合并标记MRG_CU的值为“1”且合并等级标记的值为“0”的情况下,解码pred_mode、prediction_unit、transform_tree这三个,估计intra_split_flag、inter_partitining_idc这两个。
此外,在合并标记MRG_CU的值为“1”且合并等级标记的值也为“1”的情况下,解码prediction_unit、transform_tree这两个,估计pred_mode、intra_split_flag、inter_partitining_idc这三个。
此外,合并标记MRG_CU以及CU合并等级标记和合并对象的关系也可以成为如图6的(b)所示。即,也可以在合并标记MRG_CU的值为“1”且CU合并等级标记的值也为“1”的情况下,预测单位(prediction_unit)以及变换单位(transform_unit(tree))这两个成为合并对象。此外,也可以在合并标记MRG_CU的值为“1”且CU合并等级标记的值为“0”的情况下,仅预测单位(prediction_unit)成为合并的对象。
(PT信息解码部13)
PT信息解码部13解码从CU信息解码部12输入的CU解码信息#21而生成PT解码信息#31。并且,将生成的PT解码信息#31输入到CU图像生成部15。
若更具体说明,则PT信息解码部13解码在PT信息PTI中包含的合并标记MRG_PU(pu_merge_flag)。并且,若合并标记MRG_PU的值为“1”,则解码PU合并估计标记(pu_merge_left_flag)和PU合并等级标记(pu_merge_level)。
这里,PU合并估计标记是表示用于估计值的参照目标的标记,PU合并等级标记是用于决定成为合并的对象的信息的标记。
并且,PT信息解码部13的PT信息估计部32基于合并标记MRG_CU、CU合并估计标记、CU合并等级标记、合并标记MRG_PU、PU合并估计标记、PU合并等级标记,解码或者估计帧内预测模式IPM(prev_intra_luma_pred_flag、rem_intra_luma_pred_mode)的值、帧间预测类型IPT(inter_pred_idc)的值、运动矢量估计方法MVP(mvp_idx_lX)的值、运动矢量残差MVD(mvd_lX)的值、参照图像RI(ref_idx_lX)的值、加权预测系数(weighted_pred_param)的值。
更详细而言,PT信息估计部32根据PU合并估计标记(pu_merge_left_flag)的值而决定成为参照对象的PU(参照PU)。并且,在参照PU属于帧内预测CU的情况下,将参照PU的帧内预测模式(intra_mode)的值估计为对象PU的帧内预测模式的值。
此外,在参照PU属于帧间预测CU的情况下,将表示既定的帧内预测模式(例如DC预测模式)的值设定为对象PU的帧内预测模式的值。
这里,帧内预测模式在编码数据中由表示帧内预测模式和估计值的一致的标记(prev_intra_luma_pred_flag)以及帧内预测模式的残差(rem_intra_luma_pred_mode)的组合而表现。在上述帧内预测模式的估计中,帧内预测模式既可以被直接估计,也可以通过估计prev_intra_luma_pred_flag和rem_intra_luma_pred_mode而被间接估计。
并且,PT信息解码部13基于运动矢量估计方法MVP和运动矢量残差MVD而生成运动矢量MV。并且,PT信息解码部13将包含帧内预测模式IPM、帧间预测类型IPT、运动矢量MV、参照图像RI、加权预测系数的PT解码信息#32输出到CU图像生成部15。
接着,参照图7、8说明PT信息解码部13中的处理。图7是表示PT信息解码部13中的处理的内容的语法表。此外,图8是用于说明在PT信息解码部13中合并的对象的图,图8的(a)是表示合并标记以及PU合并等级标记和解码对象的关系的图,图8的(b)、(c)是表示合并标记以及PU合并等级标记和合并对象的关系的图。
如图7所示,PT信息解码部13若跳过标记SKIP的值为“1”(st701),则解码运动矢量估计方法MVP(mv_preditor())(st702)。另外,mv_preditor()为将mvp_idc_lX进行上位概念化的参数。
另一方面,若跳过标记SKIP的值不是“1”,则PT信息解码部13确认合并标记MRG_CU,若合并标记MRG_CU的值为“1”,则将合并标记MRG_PU、PU合并估计标记的值设为与合并标记MRG_CU、CU合并估计标记的值相同。此外,若预测类型信息PType为帧间预测,则将PU合并等级标记的值设为与CU合并等级标记的值相同(st703)。
此外,若合并标记MRG_CU的值不是“1”,则解码合并标记MRG_PU(pu_merge_flag)。并且,若合并标记MRG_PU的值为“1”,则解码PU合并估计标记(pu_merge_left_flag)、PU合并等级标记(pu_merge_level)(st704)。
接着,若预测类型信息PType为帧内预测,则PT信息解码部13解码或者估计帧内预测模式(intra_mode)(st705)。
此外,若预测类型信息PType为帧间预测,则解码或者估计帧间预测类型IPT(inter_pred_idc)、运动矢量估计方法MVP(mv_predictor())、加权预测系数(weighted_pred_param())(st706)。
并且,PT信息解码部13解码或者估计运动矢量残差MVD(mv_defference())、参照图像RI(ref_pictre())之后(st707),结束处理。
另外,mv_difference()是mvd_lX的上位概念,reg_picture()是ref_idx_lX的上位概念。
接着,参照图8的(a)说明成为解码以及估计的对象的标记。在图8的(a)中,“○”表示成为解码的对象,“inf.”表示使用估计值,“def.”表示使用既定值,“─”表示不需要。
如图8的(a)所示,在合并标记MRG_PU的值为“0”的情况下,以PU单位解码成为解码或者估计的对象的全部标记。
此外,在帧内预测的情况下,在合并标记MRG_PU的值为“1”时,解码merge_left_flag,估计prev_intra_luma_pred_flag、rem_intra_luma_pred_mode这两个。
此外,在帧间预测的情况下,在合并标记MRG_PU的值为“1”且PU合并等级标记的值为“0”时,解码merge_left_flag、inter_pred_idc、mvd_idx_lX这三个,mvd_lX被提供既定值,估计ref_idx_lX、weighted_pred_param这两个。
此外,在合并标记MRG_PU的值为“1”且PU合并等级标记的值也为“1”时,解码merge_left_flag,mvd_lX被提供既定值,估计inter_pred_idc、mvd_idx_lX、ref_idx_lX、weighted_pred_param这四个。
此外,合并标记MRG_PU以及PU合并等级标记和合并对象的关系也可以成为如图8的(b)所示。即,也可以在合并标记MRG_PU的值为“1”且PU合并等级标记的值也为“1”的情况下,将运动信息(运动矢量估计方法(mvd_idx_lX)、运动矢量残差(mvd_lX))、变换类型(transform_type)、变换系数(transform_coeff)这三个作为合并对象。此外,也可以在合并标记MRG_PU的值为“1”且PU合并等级标记的值为“0”的情况下,仅将运动信息作为合并的对象。
另外,如图8的(a)或图8的(b)所示,在将各合并等级中的合并的对象在不同的合并等级间作为包含关系的情况下,具有容易安装的优点。但是,这样的包含关系并非是必须的。也存在不使用包含关系而各等级的合并对象的组合的自由度提高、能够进一步削减码量的情况。
例如,也可以如图8的(c)所示那样构成为,在合并等级为“2”的情况下,“运动信息”和“变换系数”成为合并的对象,在合并等级为“1”的情况下,“运动信息”成为合并的对象,在合并等级为“0”的情况下,“变换系数”成为合并的对象。
根据如上所述的结构,能够应对存在强的边缘的区域的情况。在存在强的边缘的区域中,存在在预测残差中也残留边缘的情况,此时最好不合并变换系数。此外,在平坦的区域中,使用与实际的物体的运动不同的运动矢量,更能够应对予想残差减小的情况。在这样的情况下,即使合并变换系数,也最好不合并运动信息。
(TT信息解码部14)
TT信息解码部14解码从CU信息解码部12输入的CU解码信息#22而生成TT解码信息#41。并且,将生成的TT解码信息#41输入到CU图像生成部15。
更具体说明,TT信息解码部14解码在TT信息TTI中包含的合并标记MRG_TU(tu_merge_flag)。并且,若合并标记MRG_TU的值为“1”,则解码TU合并估计标记(tu_merge_left_flag)和TU合并等级标记(tu_merge_level)。
这里,TU合并估计标记是表示用于估计值的参照目标的标记,TU合并等级标记是用于决定成为合并的对象的信息的标记。
并且,TT信息解码部14的TT信息估计部33基于合并标记MRG_CU、CU合并估计标记、CU合并等级标记、合并标记MRG_TU、TU合并估计标记、TU合并等级标记,解码或者估计变换尺寸TTS(split_transform_flag)、空间区域的变换系数的存在有无CBP(cbp_luma/cb/cr、coded_block_flag_luma/cb/cr)、频域的变换系数的存在有无CTC(coded_trans_coeff_pattern)。
更详细而言,TT信息估计部33根据TU合并估计标记(tu_merge_left_flag)的值而设定参照方向。并且,设定对象TT的变换尺寸TTS(split_transform_flag)的值,使得沿着参照方向相邻的两个TU具有相同的变换尺寸。
此外,关于空间区域中的变换系数的存在有无CBP,TT信息解码部14根据TU合并估计标记(tu_merge_left_flag)的值而设定参照方向,并设定cbp_luma/cb/cr以及coded_block_flag_luma/cb/cr的值,使得在沿着参照方向相邻的两个TU中变换系数的存在有无成为一致。
另外,coded_block_flag_luma/cb/cr是在不应用分割的节点、即各TU中进行编码且表示亮度或者色差的变换系数在TU内的存在有无的标记。另一方面,cbp_luma/cb/cr是在应用分割的各节点、即除了TU的节点中进行编码且将表示在分割后的各区域中亮度或者色差的变换系数的存在有无的标记汇集的信息。coded_block_flag_luma/cb/cr能够通过对每个TU估计的空间区域的变换系数的存在有无CBP而直接导出。cbp_luma/cb/cr能够基于对每个TU估计的空间区域的变换系数的存在有无CBP而间接导出。
此外,关于频域中的变换系数的存在有无CTC,首先,TT信息解码部14根据TU合并估计标记(tu_merge_left_flag)的值而设定参照TU。并且,在参照TU和对象TU的尺寸不同的情况下,对对象TU设定表示解码与全部频率分量对应的变换系数的信息。
此外,也可以进行如下的处理。将频域分割为既定的单位(例如田的字型的4等分),对每个单位应用如下的的处理。(1)在参照TU的频域中的该单位内存在变换系数的情况下,对对象TU设定表示解码位于对象TU的频域中的该单位内的变换系数的信息。(2)在除此之外的情况下,对对象TU设定表示不解码位于对象TU的频域中的该单位内的变换系数的信息。
另外,能够参照CTC而进行在参照TU的频域中的该单位内是否存在变换系数的判定。
此外,更具体而言,也可以进行以下的处理。
(1)在对象频域的尺寸为16x16以上的情况下,即
max(log2TrafoWidth,log2TrafoHeight)>3
的情况下,按将该对象频域分割而获得的每个部分单位CG(Coeff Group)解码或者估计变换系数的存在有无。
(2)估计和解码按照以下的条件进行选择。
(a)在对象部分单位中包含DC的情况下,或者(b)在对象部分单位为对象频域的处理顺序中最后的部分单位的情况下,或者(c)在对象部分单位的右侧相邻的部分单位以及对象部分单位的下侧相邻的部分单位的双方中包含非零变换系数的情况下,即满足
(i==numLastSubset)||(rightCGFlag+bottomCGFlag==2)||(i==0)的情况下,在CTC中,对对象部分单位估计为存在非零变换系数,在除此之外的情况下,在CTC中,解码关于对象部分单位的非零变换系数存否信息。
并且,TT信息解码部14将包含变换尺寸TTS、基于变换系数的存在有无的信息(TTC、CBP)而解码或者估计的变换系数的TT解码信息#41输出到CU图像生成部15。
接着,参照图9~图12说明TT信息解码部14中的处理。
图9~11是表示TT信息解码部14中的处理的内容的语法表。此外,图12是用于说明在TT信息解码部14中合并或者跳过的对象的图,图12的(a)是表示合并标记以及PU合并等级标记和解码对象的关系的图,图12的(b)是表示跳过标记(TU_skip_flag)以及跳过等级标记(TU_skip_level)和跳过对象的关系的图。
如图9所示,TT信息解码部14在合并标记MRG_CU的值为“1”的情况下,将合并标记MRG_TU以及TU合并估计标记的值设为合并标记MRG_CU以及CU合并估计标记的值。此外,若预测类型信息PType为帧间预测,则将TU合并等级标记的值设为与CU合并等级标记的值相同(st901)。
此外,若合并标记MRG_CU的值不是“1”,则解码合并标记MRG_TU(tu_merge_flag)。并且,若合并标记MRG_TU的值为“1”,则解码TU合并估计标记(tu_merge_left_flag)、TU合并等级标记(tu_merge_level)(st902)。
接着,TT信息解码部14解码变换类型TTType(transform_type)(st903),且根据编码模式信息而分为CABAC的情况(st904)和LCEC的情况(st905)。
图10的(a)表示编码模式信息为CABAC的情况下的语法表。如图10的(a)所示,TT信息解码部14在帧内预测的情况下,解码表示是否具有每个空间区域的变换系数的变换系数存否信息CV(no_resudual_data_flag)(st1001)。并且,解码或者估计变换尺寸TTS(st1002),此外,解码或者估计空间区域的变换系数的存在有无CBP、频域的变换系数的存在有无CTC(st1003)。
另外,在有如图10的(b)所示的块且各块的变换系数的存在有无由f0~f3表现的情况下,频域的变换系数的存在有无CTC(coded_trans_coeff_pattern)成为coded_trans_coeff_pattern=f0+(f1<<1)+(f2<<2)+(f3<<3)。
图11表示编码模式信息为LCEC的情况下的语法表。如图11所示,在编码模式信息为LCEC的情况下,TT信息解码部14解码表示是否具有每个亮度、色差成本(component)的变换系数的变换系数存否信息LC(cbp_yuv_root)(st1101)。并且,解码或者估计空间区域的变换系数的存在有无CBP(st1102),解码或者估计频域的变换系数的存在有无CTC(st1103)。
接着,参照图12的(a)说明成为解码以及估计的对象的标记。另外,在图12的(a)中,“○”表示成为解码的对象,“inf.”表示使用估计值,“def.”表示使用既定值,“─”表示不需要。
如图12的(a)所示,在合并标记MRG_TU的值为“0”的情况下,解码split_transform_flag、transform_type、cbp_luma、coded_block_flag_luma、cbp_cb/cr、coded_block_flag_cb/cr、transform_coeff这七个。此外,在合并标记MRG_TU的值为“1”且TU合并等级标记的值为“0”时,解码split_transform_flag、tu_merge_left_flag、cbp_luma、coded_block_flag_luma、transform_coeff这五个,估计transform_type、cbp_cb/cr、coded_block_flag_cb/cr这三个。
此外,在合并标记MRG_TU的值为“1”且TU合并等级标记的值也为“1”时,解码split_transform_flag、tu_merge_left_flag、cbp_luma、coded_block_flag_luma这四个,解码transform_coeff的一部分,估计transform_type、cbp_cb/cr、coded_block_flag_cb/cr、coded_trans_coeff_pattern这四个。
此外,在合并标记MRG_TU的值为“1”且TU合并等级标记的值为“2”时,解码tu_merge_left_flag这一个,估计split_transform_flag、transform_type、cbp_luma、coded_block_flag_luma、cbp_cb/cr、coded_block_flag_cb/cr这六个,transform_coeff成为既定值。
此外,也可以如图12的(b)所示那样决定跳过标记、跳过等级和跳过的对象。即,也可以在跳过标记为“1”且跳过等级为“2”的情况下,设为跳过的对象为变换系数(全部系数),在跳过标记为“1”且跳过等级为“1”的情况下,设为跳过的对象为变换系数(非DC分量),在跳过标记为“1”且跳过等级为“0”的情况下,设为跳过的对象为变换系数(高频分量)。
如以上所述,在本实施方式中,能够合并频域的变换系数的存在有无(coded_trans_coeff_pattern)。由于频域的变换系数具有空间相关,所以通过上述结构,能够削减编码数据#1的码量的同时解码质量高的解码图像#2。
(CU图像生成部15)
CU图像生成部15使用从CU信息解码部12输入的CU解码信息#23、从PT信息解码部13输入的PT解码信息#31、从TT信息解码部14输入的TT解码信息#41,生成CU图像。并且,将所生成的CU解码图像#51输出到TBLK图像生成部16。
更详细而言,CU图像生成部15基于在PT解码信息#31中包含的PU分割SP_PU和预测类型信息PType表示的预测模式,生成预测图像。具体而言,在预测模式为帧内预测的情况下,基于帧内预测模式IPM以及从帧存储器21输入的解码图像P′而生成预测图像,在预测模式为帧间预测的情况下,基于帧间预测类型IPT、运动矢量MV、参照图像RI、加权预测系数以及解码图像P′而生成预测图像。
并且,基于在TT解码信息#41中包含的变换尺寸TTS、变换系数,生成预测残差。最后,将生成的预测图像和预测残差相加而生成CU解码图像#51。
(TBLK图像生成部16)
TBLK图像生成部16使用从CU图像生成部15输入的CU解码图像#51而生成解码图像#2并输出。
(帧存储器21)
在帧存储器21中,记录解码图像#2。在帧存储器21中,在解码对象TBLK的时刻,记录与比该对象TBLK先解码的全部TBLK(例如在光栅扫描顺序上先行的全部TBLK)对应的解码图像。
(合并的例)
接着,参照图13、图14说明合并的例子。图13是用于说明在CU单位(CU信息CU、PT信息PTI)中合并的情况的图。此外,图14是用于说明在TU单位(TTI信息TTI)中合并的情况的图。
在图13中表示CU1301、CU1302、CU1301′、CU1302′这四个CU。并且,假设在CU1301中,合并标记MRG_CU(cu_merge_flag)为“0”、PU分割信息SP_PU(intra_split_flag)为“0”、帧内预测模式IPM为“DC预测”。此外,假设在CU1302中,合并标记MRG_CU(cu_merge_flag)为“0”、PU分割信息SP_PU(intra_split_flag)为“1”、帧内预测模式IPM为“水平预测”。
在CU1301中,由于PU分割信息SP_PU(intra_split_flag)为“0”,所以PU没有从CU分割而成为相同的大小。另一方面,在CU1302中,由于PU分割信息SP_PU(intra_split_flag)为“1”,所以PU成为从CU进行了四叉树分割的状态。
并且,若在CU1301′中,合并标记MRG_CU(cu_merge_flag)为“1”、CU合并估计标记(cu_merge_left_gflag)为“1”,则在CU1301′中,将PU分割信息SP_PU(intra_split_flag)的值从在左方向上接触的CU进行估计并设为“0”。此外,帧内预测模式IPM也从在左方向上接触的CU进行估计并设为“DC预测”。因此,在CU1301′中,与CU1301同样地PU被分割。
此外,若在CU1302′中,合并标记MRG_CU(cu_merge_flag)为“1”、CU合并估计标记(cu_merge_left_gflag)为“1”,则在CU1301′中,将PU分割信息SP_PU(intra_split_flag)的值从在左方向上接触的CU进行估计并设为“1”。此外,帧内预测模式IPM也从在左方向上接触的CU进行估计并设为“水平预测”。因此,在CU1302′中,与CU1302同样地,PU从CU进行四叉树分割。
另外,合并的对象并不限定于选择方向预测/DC预测的信息(prev_intra_luma_pred_flag、rem_intra_luma_pred_flag),也可以是表示有无应用基于边缘的预测的信息、表示有无应用planar预测的信息、表示有无应用其他的帧内预测方法的信息、在预测图像生成中使用的参数等。这里,基于边缘的预测是利用基于相邻区域的解码图像的像素值或帧内预测模式而估计的边缘方向的预测,planar预测是利用基于PU内的右下像素值的估计值和PU相邻区域的解码图像的像素值的内插的预测。
此外,并不限定于PU分割信息SP_PU,树块分割信息SP_TBLK(split_coding_unit_flag)也可成为合并的对象。
接着,说明以TU单位进行合并的情况。在图14中,表示CU1401、CU1401′的两个CU。并且,假设在CU1401中,合并标记MRG_TU(tu_merge_flag)成为“0”、变换尺寸TTS成为“有”、空间区域的变换系数的存在有无CBP成为“有”、变换系数TTC成为“全频率分量”。
并且,在CU1401′中,当合并标记MRG_TU(tu_merge_flag)的值为“1”、TU合并估计标记(tu_merge_left_flag)的值为“1”的情况下,关于CU1401的TT信息TTI,从在左方向上接触的CU而估计值。因此,在CU1401′中,将变换尺寸TTS、空间区域的变换系数的存在有无CBP从CU1401复制而成为相同的值。
此外,关于变换系数TTC,既可以复制全部,也可以仅复制一部分。例如,在属于CU1401的PU1411中,仅在像素1420a~d中存在非零的变换系数的情况下,在属于复制该变换系数的CU1401′的PU1411′中,也可以仅包含非零变换系数的区域1421复制变换系数。
另外,除了变换尺寸TTS(split_transform_flag)、每个空间区域的变换系数的存在有无(no_residual_data_flag、cbp_luma/cb/cr、coded_block_flag_luma/cb/cr)之外,合并的对象也可以是每个亮度/色差成分的变换系数的存在有无(cbp_yuv_root)、特定频率分量的变换系数存在有无。
如以上所述,在本实施方式中,能够合并与帧内预测有关的信息(预测模式PType(pred_mode)、帧内预测模式IPT(prev_intra_luma_pred_flag、rem_intra_luma_pred_mode))。由于与帧内预测有关的信息具有空间相关,所以通过上述结构,能够削减编码数据#1的码量的同时解码质量高的解码图像#2。
此外,在本实施方式中,能够合并加权预测系数(weighted_prede_param)。由于加权预测系数具有空间相关,所以通过上述结构,能够削减编码数据#1的码量的同时解码质量高的解码图像#2。
此外,在本实施方式中,能够合并变换尺寸TTS(split_transform_type)、变换类型TTType(transform_type)这样的变换信息。由于变换信息具有空间相关,所以通过上述结构,能够削减编码数据#1的码量的同时解码质量高的解码图像#2。
此外,在本实施方式中,能够合并空间区域的变换系数的存在的有无(no_residual_data_flag、cbp_luma/cb/cr、coded_block_flag_luma/cb/cr)。由于空间区域的变换信息具有空间相关,所以通过上述结构,能够削减编码数据#1的码量的同时解码质量高的解码图像#2。
(动态图像编码装置2)
接着,参照图15说明动态图像编码装置(图像解码装置)2。另外,对已经说明的部分赋予相同的符号,并省略其说明。若大致地说,动态图像编码装置2是通过编码输入图像#100而生成编码数据#1并输出的装置。此外,动态图像编码装置2是在其一部分中使用在H.264/MPEG-4AVC标准中采用的技术、在作为VCEG(Video Coding Expert Group,视频编码专家组)中的共同开发用编码解码器(CODEC)的KTA软件中采用的技术、在TMuC(TestModel under Consideration,考虑中的测试模型)软件中采用的技术以及在作为其后续编码解码器(CODEC)的HEVC WD1中采用的方式的动态图像编码装置。
图15是表示动态图像编码装置2的主要部分结构的框图。如图15所示,动态图像编码装置2是包括TBLK设定部51、TBLK编码部(编码单元)52、TBLK解码部10、帧存储器54的结构。
TBLK设定部51基于输入图像#100,设定TBLK的构成。具体而言,设定属于对象片段的TBLK的尺寸、形状以及对象片段内的位置、属于各TBLK的CU的尺寸、形状以及对象TBLK内的位置等。并且,将作为所设定的信息的设定信息#61输出到TBLK编码部52。
TBLK编码部52基于从TBLK设定部51输入的设定信息#61,进行输入图像#100的编码。更详细而言,TBLK编码部52基于设定信息#61,按每个树块TBLK分割为编码单位CU、预测单位PU、变换单位TU。并且,使用在帧存储器54中存储的解码图像#63对每个预测单位PU生成预测图像,并生成编码数据#1并输出,该编码数据#1将作为源图像与预测图像的差分的预测残差按每个变换单位TU进行了变换的变换系数以及变换系数以外的边(side)信息进行了编码。
由于TBLK解码部10与动态图像解码装置1的TBLK解码部10相同,所以在这里省略说明。
在帧存储器54中,记录所输入的解码图像#62。在对对象TBLK进行编码的时刻,与比该对象TBLK在光栅扫描顺序上先行的全部TBLK对应的解码图像记录在帧存储器54中。
(备注事项1)
另外,在上述实施方式中,将在合并时参照的CU设为在对象CU的左边接触的CU,但并不限定于此。例如既可以是在对象CU的上边接触的CU,也可以是虽然没有与对象CU接触但存在于附近的CU。此外,也可以属于前帧的CU。
(备注事项2)
此外,在上述实施方式中,记载了合并标记和合并等级标记以相同的信息单位传输的情况,但并不限定于此。例如,也可以将合并标记MRG_PU(pu_merge_flag)在CU信息CU内传输,将PU合并等级标记(pu_merge_level_flag)在PT信息PTI内传输。此外,也可以将PU合并等级标记(pu_merge_level_flag)在片段S内传输,将合并标记MRG_PU(pu_merge_flag)在PT信息PTI内传输。
由此,由于能够改变层次而进行编码,所以能够削减作为排除预测残差的信息的边信息。
(备注事项3)
此外,也可以是活用解码历史而进行合并的结构。即,设置活用解码历史的自适应合并模式,一边进行解码一边计算与相邻区域的标记(syntax)之间的关联性。并且,也可以将关联性超过阈值的标记作为合并的对象。
具体而言,首先,作为可成为自适应合并模式的PU单位的合并对象的标记(syntax)而定义syntax1~syntaxM。
并且,对syntaxk(1≤k≤M),将relV(k)设定为0。relV(k)表示上下相邻块之间的syntax的关联性的强度。此外,将relH(k)设定为0。relH(k)表示左右相邻块之间的syntax的关联性的强度。此外,将cnt(k)设定为0。
并且,在PT信息PTI解码时选择自适应合并模式的情况下,通过合并而估计满足以下的条件的标记。
merge_k_flag=(relV(k)/cnt(k)>Th(k)||relH(k)/cnt(k)>Th(k))?1:0
在合并时,若relV(k)>relH(k),则将参照的PU的位置设为上侧,若不是,则设为左侧(不解码表示合并对象的位置的信息)。此外,在不满足条件的情况下,解码对应的标记。
最后,对PU解码、k(1≤k≤M)执行以下的处理。
(1)syntaxk在对象PU和上侧相邻PU中一致的情况下:relV(k)+=1
(2)syntaxk在对象PU和左侧相邻PU中一致的情况下:relH(k)+=1
(3)cnt(k)+=1
(备注事项4)
此外,也可以使用头发送要合并的对象。这既可以例如将对象明示性地传输,也可以从既定的组合中选择,也可以仅传输对于特定的等级的对象。
(备注事项5)
合并等级也可以在对象CU、PU、TU的尺寸大于既定的尺寸的情况下传输。
(备注事项6)
此外,在上述实施方式中,将频域的变换系数的存在有无(以下,记载为CTC)设为如图10的(b)所示的表示在分割了频域的各部分频域中变换系数存在有无的标记的集合,但也可以是以下的表现。参照图16进行说明。图16是用于表现频域的变换系数的存在有无CTC的说明图,图16的(a)是表示分割为非正方区域而表现CTC的情况的图,图16的(b)是表示使用参数而表现CTC的情况的图,图16的(c)是表示使用扫描顺序而表现CTC的情况的图。
(A)非正方形区域的频域的分割的表现
也可以将频域分割为非正方形的部分频域并对每个区域设定表示变换系数的存在有无的标记,并将汇集了该标记的信息设为CTC。例如,如图16的(a)所示,按DC部、水平边缘部(水平频率分量大、垂直频率分量小的区域)、垂直边缘部(垂直频率分量大、水平频率分量小的区域)、高频分量(垂直/水平频率分量都大的区域)分割频域,并将各个区域中的变换系数的存在有无与标记fDC、fH、fV、fHF相关联,并设为CTC。在应用了这样的CTC的表现的情况下,合并处理中的估计能够通过复制表示所参照的TU中的对应的部分频域中的变换系数有无的标记而实现。此外,通过将被分割的频域不限制于正方形,能够更加灵活地设定变换系数的存在有无的标记。
(B)参数表现
也能够通过有关频率的参数来表现在频域内变换系数可存在的区域。如图16的(b)所示,定义参数k,并对CTC设定在水平频率分量为0以上且k以下、垂直频率分量为0以上且k以下的部分频域内包含变换系数这样的k的值。例如,在块尺寸为8×8像素的情况下,k=0意味着变换系数仅可存在于DC分量中,在k=7的情况下,意味着变换系数可存在于全部频率分量中。在应用了这样的CTC的表现的情况下,在将参照TU中的CTC的值设为k′、将参照TU相对于对象TU的尺寸的比设为r的情况下,能够通过k=Int(k′÷r)来导出合并处理中的对象TU中的CTC的值k的估计。这里,Int()为取自变量的整数部分的函数。通过参数的表现,与单纯地分割频域的情况相比,能够以更细的精度来表现变换系数的存在有无。
(C)利用了扫描顺序的表现
能够由在变换系数的扫描顺序中变换系数最后产生的位置(last_coeff)的可取范围来表现在频域内变换系数可存在的区域。如图16的(c)所示,last_coeff被定义为,在频域中,变换系数按照箭头表示的顺序进行扫描时,最后产生了变换系数的位置。在TU的尺寸为8×8像素的情况下,取0~63的值。由于变换系数在扫描顺序中只可能存在于0~last_coeff的位置,所以通过决定last_coeff的范围,能够确定变换系数可存在的区域。若将参照TU中的last_coeff的值设为m′,则合并处理中的对象TU中的last_coeff的可取范围能够估计为0~min(m′+α,b-1)。这里,α是表示last_coeff的位置的变化的值,例如设定TU的宽度。此外,b是在TU中包含的像素数。通过该方法,由于不变更扫描顺序就进行考虑了频域内的变换系数的存在有无的变换系数的编码,所以容易安装。
本发明并不限定于上述实施方式,在权利要求所示的范围内可进行各种变形。即,将权利要求所示的范围适当地变形的技术手段组合而获得的实施方式也包含在本发明的技术的范围中。
(应用例)
上述动态图像解码装置1以及动态图像编码装置2能够搭载到进行动态图像的发送、接收、记录、再现的各种装置中利用。另外,动态图像既可以是通过摄像机等拍摄的自然动态图像,也可以是通过计算机等生成的人工动态图像(包括CG以及GUI)。
首先,参照图17说明能够将上述动态图像解码装置1以及动态图像编码装置2利用于动态图像的发送以及接收的例子。
图17(a)是表示搭载了动态图像编码装置2的发送装置A的结构的框图。如图17(a)所示,发送装置A包括通过对动态图像进行编码而获得编码数据的编码部A1、使用编码部A1获得的编码数据对载波进行调制而获得调制信号的调制部A2、发送调制部A2获得的调制信号的发送部A3。上述动态图像编码装置2用作该编码部A1。
发送装置A也可以作为对编码部A1输入的动态图像的供给源,还包括拍摄动态图像的摄像机A4、记录了动态图像的记录介质A5、用于从外部输入动态图像的输入端子A6以及生成或者加工图像的图像处理部A7。在图17(a)中,例示了发送装置A具备这些全部的结构,但也可以省略一部分。
另外,记录介质A5既可以是记录了未被编码的动态图像的记录介质,也可以是记录了以与传输用的编码方式不同的记录用的编码方式编码的动态图像的记录介质。在后者的情况下,在记录介质A5和编码部A1之间介入将从记录介质A5读出的编码数据根据记录用的编码方式进行解码的解码部(未图示)即可。
图17(b)是表示搭载了动态图像解码装置1的接收装置B的结构的框图。如图17(b)所示,接收装置B包括接收调制信号的接收部B1、通过对接收部B1接收到的调制信号进行解调而获得编码数据的解调部B2、通过对解调部B2获得的编码数据进行解码而获得动态图像的解码部B3。上述动态图像解码装置1用作该解码部B3。
接收装置B也可以作为解码部B3输出的动态图像的供给目标,进一步包括显示动态图像的显示器B4、用于记录动态图像的记录介质B5以及用于将动态图像输出到外部的输出端子B6。在图17(b)中,例示了接收装置B具备这些全部的结构,但也可以省略一部分。
另外,记录介质B5既可以是记录了未被编码的动态图像的记录介质,也可以是记录了以与传输用的编码方式不同的记录用的编码方式编码的记录介质。在后者的情况下,在解码部B3和记录介质B5之间介入将从解码部B3取得的动态图像根据记录用的编码方式进行编码的编码部(未图示)即可。
另外,传输调制信号的传输介质既可以是无线,也可以是有线。此外,传输调制信号的传输方式,既可以是广播(这里是指没有预先确定发送目标的发送方式),也可以是通信(这里是指预先确定发送目标的发送方式)。即,调制信号的传输也可以通过无线广播、有线广播、无线通信以及有线通信中的任一个实现。
例如,地上数字广播的广播站(广播设备等)/接收站(电视接收机等)为通过无线广播发送接收调制信号的发送装置A/接收装置B的一例。此外,电缆电视广播的广播站(广播设备等)/接收站(电视接收机等)为通过有线广播发送接收调制信号的发送装置A/接收装置B的一例。
此外,使用了因特网的VOD(Video On Demand,视频点播)服务或动态图像共享服务等的服务器(工作站等)/客户机(电视接收机、个人计算机、智能手机等)为通过通信发送接收调制信号的发送装置A/接收装置B的一例(通常,在LAN中作为传输介质而使用无线或者有线中的任一个,在WAN中作为传输介质而使用有线)。这里,在个人计算机中,包含台式PC、便携式PC以及平板式PC。此外,在智能手机中,也包含多功能便携电话终端。
另外,动态图像共享服务的客户机除了具有对从服务器下载的编码数据进行解码并显示在显示器中的功能之外,还具有对摄像机拍摄的动态图像进行编码并上载到服务器的功能。即,动态图像共享服务的客户机作为发送装置A以及接收装置B的双方起作用。
接着,参照图18说明能够将上述动态图像解码装置1以及动态图像编码装置2利用于动态图像的记录以及再现的例子。
图18(a)是表示搭载了上述动态图像解码装置1的记录装置C的结构的框图。如图18(a)所示,记录装置C包括通过对动态图像进行编码而获得编码数据的编码部C1、将编码部C1获得的编码数据写入记录介质M的写入部C2。上述动态图像编码装置2用作该编码部C1。
另外,记录介质M(1)既可以是如HDD(Hard Disk Drive,硬盘驱动器)或SSD(SolidState Drive,固态驱动器)等那样,在记录装置C中内置的类型的记录介质,(2)也可以是如SD存储卡或USB(Universal Serial Bus,通用串行总线)闪速存储器等那样,连接到记录装置C的类型的记录介质,(3)也可以是如DVD(Digital Versatile Disc,数字视频盘)或BD(Blu-ray Disc(注册商标),蓝光盘)等那样,在内置于记录装置C的驱动器装置(未图示)中装填的记录介质。
此外,记录装置C也可以作为对编码部C1输入的动态图像的供给源,进一步包括拍摄动态图像的摄像机C3、用于从外部输入动态图像的输入端子C4、用于接收动态图像的接收部C5以及生成或者加工图像的图像处理部C6。在图18(a)中,例示了记录装置C具备这些全部的结构,但也可以省略一部分。
另外,接收部C5既可以是接收未被编码的动态图像的接收部,也可以是接收以与记录用的编码方式不同的传输用的编码方式编码的编码数据的接收部。在后者的情况下,在接收部C5和编码部C1之间介入对以传输用的编码方式编码的编码数据进行解码的传输用解码部(未图示)即可。
作为这样的记录装置C,例如可举出DVD播放器、BD播放器、HD(Hard Disk,硬盘)播放器等(此时,输入端子C4或者接收部C5成为动态图像的主要的供给源)。此外,手提摄像机(此时,摄像机C3成为动态图像的主要的供给源)、个人计算机(此时,接收部C5或者图像处理部C6成为动态图像的主要的供给源)、智能手机(此时,摄像机C3或者接收部C5成为动态图像的主要的供给源)等也为这样的记录装置C的一例。
图18(b)是表示搭载了上述动态图像解码装置1的再现装置D的结构的框图。如图18(b)所示,再现装置D包括读出在记录介质M中写入的编码数据的读出部D1、通过对读出部D1读出的编码数据进行解码而获得动态图像的解码部D2。上述动态图像解码装置1用作该解码部D2。
另外,记录介质M(1)既可以是如HDD或SSD等那样,在再现装置D中内置的类型的记录介质,(2)也可以是如SD存储卡或USB闪速存储器等那样,连接到再现装置D的类型的记录介质,(3)也可以是如DVD或BD等那样,在内置于再现装置D的驱动器装置(未图示)中装填的记录介质。
此外,再现装置D也可以作为解码部D2输出的动态图像的供给目标,进一步包括显示动态图像的显示器D3、用于将动态图像输出到外部的输出端子D4以及发送动态图像的发送部D5。在图18(b)中,例示了再现装置D具备这些全部的结构,但也可以省略一部分。
另外,发送部D5既可以是发送未被编码的动态图像的发送部,也可以是发送以与记录用的编码方式不同的传输用的编码方式编码的编码数据的发送部。在后者的情况下,在解码部D2和发送部D5之间介入以传输用的编码方式对动态图像进行编码的编码部(未图示)即可。
作为这样的再现装置D,例如可举出DVD播放器、BD播放器、HDD播放器等(此时,电视接收机等所连接的输出端子D4成为动态图像的主要的供给目标)。此外,在电视接收机(此时,显示器D3成为动态图像的主要的供给目标)、台式PC(此时,输出端子D4或者发送部D5成为动态图像的主要的供给目标)、便携式或者平板式PC(此时,显示器D3或者发送部D5成为动态图像的主要的供给目标)、智能手机(此时,显示器D3或者发送部D5成为动态图像的主要的供给目标)、数字标识(也被称为电子广告牌或电子公告牌等,显示器D3或者发送部D5成为动态图像的主要的供给目标)等也为这样的再现装置D的一例。
(基于软件的构成)
最后,动态图像解码装置1以及动态图像编码装置2的各模块既可以通过在集成电路(IC芯片)上形成的逻辑电路以硬件方式实现,也可以使用CPU(central processingunit,中央处理单元)以软件方式实现。
在后者的情况下,动态图像解码装置1以及动态图像编码装置2包括执行用于实现各功能的控制程序的命令的CPU、存储了上述程序的ROM(read only memory,只读存储器)、展开上述程序的RAM(random access memory,随机存取存储器)、存储上述程序以及各种数据的存储器等存储装置(记录介质)等。并且,通过将作为实现上述功能的软件的动态图像解码装置1以及动态图像编码装置2的控制程序的程序代码(执行形式程序、中间代码程序、源程序)以计算机可读取地记录的记录介质提供给上述动态图像解码装置1以及动态图像编码装置2,且该计算机(或者CPU或MPU(microprocessor unit,微处理单元))读出在记录介质中记录的程序代码而执行,也能够实现本发明的目的。
作为上述记录介质,例如能够使用磁带或卡带等带类、包括软盘(注册商标)/硬盘等磁盘或CD-ROM(compact disc read-only memory,只读光盘)/MO(magneto-optical,磁光盘)/MD(Mini Disc,小型磁盘)/DVD(digital versatile disk,数字视频光盘)/CD-R(CD Recordable,可记录式CD)等光盘的盘类、IC卡(包括存储卡)/光卡等卡类、掩模ROM/EPROM(erasable programmable read-only memory,可擦除可编程只读存储器)/EEPROM(electrically erasable and programmable read-only memory,电可擦除可编程只读存储器)/闪速ROM等半导体存储器类、或者PLD(Programmable logic device,可编程逻辑器件)或FPGA(Field Programmable Gate Array,现场可编程门阵列)等逻辑电路类等。
此外,也可以以能够与通信网络连接地构成动态图像解码装置1以及动态图像编码装置2,并经由通信网络提供上述程序代码。作为该通信网络,能够传输程序代码即可,并没有特别限定。例如能够利用因特网、内部网、外联网、LAN(local area network,局域网)、ISDN(integrated services digital network,综合业务数字网)、VAN(value-addednetwork,增值网络)、CATV(community antenna television,有线电视网)通信网、虚拟专用网(virtual private network)、电话线路网、移动通信网、卫星通信网等。此外,作为构成该通信网络的传输介质,也可以是能够传输程序代码的介质即可,并不限定于特定的构成或者种类。例如在IEEE(institute of electrical and electronic engineers,美国电气和电子工程师协会)1394、USB、电力线传输、电缆TV线路、电话线、ADSL(asynchronousdigital subscriber loop,异步数字用户线)线路等的有线中也能够利用,在IrDA(infrared data association,红外数据协会)或遥控器那样的红外线、Bluetooth(注册商标)、IEEE802.11无线、HDR(high data rate,高数据速率)、NFC(Near FieldCommunication,近距离无线通信)、DLNA(Digital Living Network Alliance,数码生活网络联盟)、便携电话网、卫星线路、地上波数字网等无线中也能够利用。另外,本发明通过上述程序代码以电子传输而具体化的、埋入载波中的计算机数据信号的形式也能够实现。
(备注事项7)
本发明也可以如下记载。
本发明的图像解码装置,通过对包括编码量化变换系数的编码数据进行解码而解码图像,上述编码量化变换系数是对将从原图像减去预测图像的预测残差按每个变换单位进行变换并量化的量化变换系数进行了编码的系数,上述图像解码装置包括:解码单元,在上述编码数据中包含将存否信息进行合并或者跳过的合并/跳过信息的情况下,不解码上述存否信息,上述存否信息表示在上述量化变换系数中是否包含频域的变换系数;以及估计单元,在上述编码数据中包含将上述存否信息进行合并或者跳过的合并/跳过信息的情况下,估计该存否信息,上述解码单元使用上述估计单元所估计的存否信息,解码上述编码量化变换系数。
这里,合并是指,省略解码所需的预定的信息,基于处于既定或者指定的位置的信息而估计。此外,跳过是指,省略解码所需的预定的信息,以代替的方式使用估计值或者既定值。
根据上述结构,不传输表示频域的变换系数的存在的有无的信息,仅传输合并/跳过信息,就能够进行解码。
因此,不需要传输以往需要传输的表示频域的变换系数的存在的有无的信息,所以比以往还能够削减编码数据的码量。
在本发明的图像解码装置中,上述存否信息也可以是表示在上述量化变换系数中除了频率分量的直流分量之外的分量中是否包含非零变换系数的信息。
根据上述结构,不传输表示在量化变换系数中除了频率分量的直流分量之外的分量中是否包含非零变换系数的信息,仅传输合并/跳过信息,就能够进行解码。
除了直流分量之外的分量中是否包含非零变换系数具有非常高的空间相关,能够准确地估计的可能性高。因此,能够削减编码数据的码量,且能够生成质量高的解码图像。
在本发明的图像解码装置中,上述存否信息也可以是表示在上述量化变换系数中的频率分量的高频分量中是否包含非零变换系数的信息。
根据上述结构,不传输表示在量化变换系数中的频率分量的高频分量中是否包含非零变换系数的信息,仅传输合并/跳过信息,就能够进行解码。
频率分量的高频分量中是否包含非零变换系数具有非常高的空间相关,能够准确地估计的可能性高。因此,能够削减编码数据的码量,且能够生成质量高的解码图像。
在本发明的图像解码装置中,也可以在上述编码数据中,包含用于选择成为合并或者跳过的对象的信息的合并/跳过等级信息。
根据上述结构,能够根据合并/跳过等级而决定成为合并或者跳过的对象的信息。因此,由于对每个信息决定是否进行合并或者跳过,所以能够根据局部特性而决定合并或者跳过的对象。
在本发明的图像解码装置中,上述合并/跳过等级信息也可以根据等级,成为合并或者跳过的对象的信息成为包含关系。
根据上述结构,由于根据等级,成为合并或者跳过的对象的信息成为包含关系,所以能够容易安装。此外,能够将在编码装置中生成编码数据时的处理共通化。
在本发明的图像解码装置中,也可以在上述合并/跳过等级信息中,成为合并或者跳过的对象的信息的数目越多的等级则被分配越短的码。
根据上述结构,由于成为对象的信息越多的等级则被分配越短的码,所以能够进一步削减编码数据的码量。
也可以在本发明的图像解码装置中,进行上述预测图像的生成、变换、编码的单位分别不同,在上述编码数据中,按每个上述单位包含数据,上述合并/跳过信息和上述合并/跳过等级信息在上述单位中包含在不同的单位中。
根据上述结构,由于合并/跳过信息和上述合并/跳过等级信息在不同的单位中传输,所以能够削减边信息的码量。
这里,边信息是指排除预测残差的全部信息。
在本发明的图像解码装置中,上述估计单元也可以基于上述解码单元过去解码的解码结果,设定为了估计合并/跳过的对象的信息而参照的参照变换单位。
根据上述结构,估计单元使用过去的解码结果,设定参照变换单位。并且,过去的解码结果与当前相同的可能性高。因此,能够适当地设定参照变换单位。
在本发明的图像解码装置中,也可以通过上述合并/跳过信息,将表示成为合并或者跳过的对象的信息的对象信息存储在上述编码数据的头部分。
根据上述结构,能够适当地设定合并或者跳过的对象。
在本发明的图像解码装置中,上述合并/跳过等级信息也可以只有在成为对象的信息所包含的上述单位的尺寸大于阈值的情况下,包含在上述编码数据中。
根据上述结构,由于在单位的尺寸小的情况下,不传输合并/跳过等级信息,所以能够防止单位的尺寸小的情况下的边尺寸增大的情况。
本发明的图像解码装置,通过对包括编码量化变换系数的编码数据进行解码而解码图像,上述编码量化变换系数是对将从原图像减去预测图像的预测残差按每个变换单位进行变换并量化的量化变换系数进行了编码的系数,其特征在于,在上述编码数据中,包含按每个上述变换单位将在上述变换中使用的变换信息进行了编码的编码变换信息,所述图像解码装置包括:估计单元,在上述编码数据中,包含有按每个上述变换单位将上述变换信息以及上述量化变换系数进行合并或者跳过的合并/跳过信息的情况下,通过上述合并/跳过信息所表示的方法,估计该变换单位的上述变换信息以及上述量化变换系数。
根据上述结构,由于能够以变换单位进行合并/或者跳过,所以能够进一步削减编码数据的码量。
为了解决上述课题,本发明的图像编码装置,输出包含编码量化变换系数的编码数据,上述编码量化变换系数是对将从原图像减去预测图像的预测残差按每个变换单位进行变换并量化的量化变换系数进行了编码的系数,其特征在于,所述图像编码装置包括:编码单元,在上述编码数据中包含将存否信息进行合并或者跳过的合并/跳过信息,上述存否信息表示在上述量化变换系数中是否包含频域的变换系数。
根据上述结构,输出不包含表示频域的变换系数的存在的有无的信息而仅包含合并/跳过信息的编码数据。
因此,不需要将以往需要输出的表示频域的变换系数的存在的有无的信息包含在编码数据中,所以比以往还能够削减编码数据的码量。
在本发明的编码数据的数据构造中,上述编码数据包含对将从原图像减去预测图像的预测残差按每个变换单位进行变换并量化的量化变换系数进行了编码的编码量化变换系数,其特征在于,包含将存否信息进行合并或者跳过的合并/跳过信息,上述存否信息表示在上述量化变换系数中是否包含频域的变换系数。
根据上述结构,成为不包含表示频域的变换系数的存在的有无的信息而仅包含合并/跳过信息的编码数据。
因此,不需要将以往需要的表示频域的变换系数的存在的有无的信息包含在编码数据中,所以比以往还能够削减编码数据的码量。
产业上的可利用性
本发明能够适当地应用于对编码数据进行解码的解码装置以及生成编码数据的编码装置。此外,也能够适当地应用于由编码装置生成且由解码装置参照的编码数据的数据构造。
符号说明
1 动态图像解码装置(图像解码装置)
2 动态图像编码装置(图像编码装置)
10 TBLK解码部(解码单元)
11 TBLK信息解码部
12 CU信息解码部
13 PT信息解码部
14 TT信息解码部(解码单元)
15 CU图像生成部
16 TBLK图像生成部
31 CU信息估计部
32 PT信息估计部
33 TT信息估计部(估计单元)
52 TBLK编码部(编码单元)

Claims (6)

1.一种图像解码装置,通过按每个解码单位对包括编码量化变换系数的编码数据进行解码而解码图像,上述编码量化变换系数是对将从原图像减去预测图像的预测残差按每个变换单位进行变换并量化的量化变换系数进行了编码的系数,其特征在于,
上述变换单位通过层次性地分割编码单位而形成,
上述图像解码装置包括:
解码单元,对将上述变换单位进行分割而获得的尺寸为该变换单位的尺寸以下的部分单位,估计表示在该部分单位中是否包含非零变换系数的非零变换系数存否信息,或者从上述编码数据解码该非零变换系数存否信息,在该非零变换系数存否信息表示在该部分单位内存在非零变换系数的情况下,从上述编码数据解码该部分单位内的变换系数。
2.一种图像解码方法,通过按每个解码单位对包括编码量化变换系数的编码数据进行解码而解码图像,上述编码量化变换系数是对将从原图像减去预测图像的预测残差按每个变换单位进行变换并量化的量化变换系数进行了编码的系数,其特征在于,
上述变换单位通过层次性地分割编码单位而形成,
上述图像解码方法包括:
解码步骤,对将上述变换单位进行分割而获得的尺寸为该变换单位的尺寸以下的部分单位,估计表示在该部分单位中是否包含非零变换系数的非零变换系数存否信息,或者从上述编码数据解码该非零变换系数存否信息,在该非零变换系数存否信息表示在该部分单位内存在非零变换系数的情况下,从上述编码数据解码该部分单位内的变换系数。
3.一种图像编码装置,输出包含编码量化变换系数的编码数据,上述编码量化变换系数是对将从原图像减去预测图像的预测残差按每个变换单位进行变换并量化的量化变换系数进行了编码的系数,其特征在于,
上述变换单位通过层次性地分割编码单位而形成,
所述图像编码装置包括:
编码单元,在上述编码数据中,包含对于将上述变换单位进行分割而获得的尺寸为该变换单位的尺寸以下的部分单位将非零变换系数存否信息进行合并或者跳过的合并/跳过信息,上述非零变换系数存否信息表示在该部分单位中是否包含非零变换系数。
4.一种图像编码方法,输出包含编码量化变换系数的编码数据,上述编码量化变换系数是对将从原图像减去预测图像的预测残差按每个变换单位进行变换并量化的量化变换系数进行了编码的系数,其特征在于,
上述变换单位通过层次性地分割编码单位而形成,
所述图像编码方法包括:
编码步骤,在上述编码数据中,包含对于将上述变换单位进行分割而获得的尺寸为该变换单位的尺寸以下的部分单位将非零变换系数存否信息进行合并或者跳过的合并/跳过信息,上述非零变换系数存否信息表示在该部分单位中是否包含非零变换系数。
5.一种记录介质,计算机能够读取,并记录有控制程序,其特征在于,
所述控制程序是用于使计算机作为权利要求1所述的图像解码装置而发挥功能的控制程序,并且是用于使计算机作为上述解码单元而发挥功能的控制程序。
6.一种记录介质,计算机能够读取,并记录有控制程序,其特征在于,
所述控制程序是用于使计算机作为权利要求3所述的图像编码装置而发挥功能的控制程序,并且是用于使计算机作为上述解码单元而发挥功能的控制程序。
CN201611227733.4A 2011-03-10 2012-03-07 图像解码装置及方法、以及记录介质 Active CN107087179B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2011-053611 2011-03-10
JP2011053611 2011-03-10
CN201280012467.7A CN103460694B (zh) 2011-03-10 2012-03-07 图像解码装置、图像编码装置以及编码数据的数据构造

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201280012467.7A Division CN103460694B (zh) 2011-03-10 2012-03-07 图像解码装置、图像编码装置以及编码数据的数据构造

Publications (2)

Publication Number Publication Date
CN107087179A true CN107087179A (zh) 2017-08-22
CN107087179B CN107087179B (zh) 2021-04-27

Family

ID=46798240

Family Applications (5)

Application Number Title Priority Date Filing Date
CN201611227733.4A Active CN107087179B (zh) 2011-03-10 2012-03-07 图像解码装置及方法、以及记录介质
CN201611226198.0A Active CN107071439B (zh) 2011-03-10 2012-03-07 图像解码装置及方法、以及记录介质
CN201280012467.7A Active CN103460694B (zh) 2011-03-10 2012-03-07 图像解码装置、图像编码装置以及编码数据的数据构造
CN201611225881.2A Active CN107087178B (zh) 2011-03-10 2012-03-07 图像解码装置及方法、以及记录介质
CN201611226083.1A Active CN107105259B (zh) 2011-03-10 2012-03-07 图像解码装置及方法、以及记录介质

Family Applications After (4)

Application Number Title Priority Date Filing Date
CN201611226198.0A Active CN107071439B (zh) 2011-03-10 2012-03-07 图像解码装置及方法、以及记录介质
CN201280012467.7A Active CN103460694B (zh) 2011-03-10 2012-03-07 图像解码装置、图像编码装置以及编码数据的数据构造
CN201611225881.2A Active CN107087178B (zh) 2011-03-10 2012-03-07 图像解码装置及方法、以及记录介质
CN201611226083.1A Active CN107105259B (zh) 2011-03-10 2012-03-07 图像解码装置及方法、以及记录介质

Country Status (6)

Country Link
US (2) US10148974B2 (zh)
EP (2) EP2685718B1 (zh)
JP (2) JPWO2012121284A1 (zh)
CN (5) CN107087179B (zh)
HK (1) HK1191484A1 (zh)
WO (1) WO2012121284A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112425167A (zh) * 2018-07-13 2021-02-26 韩国电子通信研究院 用于图像编码/解码的方法和装置以及其上存储有比特流的记录介质
CN113039794A (zh) * 2018-11-16 2021-06-25 索尼集团公司 图像处理装置和方法

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107087179B (zh) 2011-03-10 2021-04-27 夏普株式会社 图像解码装置及方法、以及记录介质
PL3614670T3 (pl) * 2011-12-15 2021-08-23 Tagivan Ii Llc Sygnalizowanie znaczników zakodowanych bloków (CBF) jasności-barwy w kodowaniu wideo
AU2012200319B2 (en) 2012-01-19 2015-11-26 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding the significance map for residual coefficients of a transform unit
WO2013145021A1 (ja) * 2012-03-30 2013-10-03 株式会社日立製作所 画像復号方法及び画像復号装置
US9432390B2 (en) * 2013-12-31 2016-08-30 Prometheus Security Group Global, Inc. Scene identification system and methods
US10721467B2 (en) * 2015-05-05 2020-07-21 Lg Electronics Inc. Method and device for processing coding unit in image coding system
US9942548B2 (en) * 2016-02-16 2018-04-10 Google Llc Entropy coding transform partitioning information
US20190327476A1 (en) * 2016-06-24 2019-10-24 Industry Academy Cooperation Foundation Of Sejong University Video signal processing method and device
US20190238888A1 (en) * 2017-07-17 2019-08-01 Ki Baek Kim Image data encoding/decoding method and apparatus
KR20190052129A (ko) 2016-10-04 2019-05-15 김기백 영상 데이터 부호화/복호화 방법 및 장치
WO2018174617A1 (ko) 2017-03-22 2018-09-27 한국전자통신연구원 블록 형태에 기반한 예측 방법 및 장치
CN114430486A (zh) * 2017-04-28 2022-05-03 夏普株式会社 图像解码装置以及图像编码装置
KR102524628B1 (ko) 2018-01-05 2023-04-21 에스케이텔레콤 주식회사 영상을 부호화 또는 복호화하는 방법 및 장치
WO2019135628A1 (ko) 2018-01-05 2019-07-11 에스케이텔레콤 주식회사 영상을 부호화 또는 복호화하는 방법 및 장치
US11445187B2 (en) * 2018-02-28 2022-09-13 Sharp Kabushiki Kaisha Systems and methods for partitioning regions of a picture for video coding using different coding unit sizes
US10645396B2 (en) * 2018-06-04 2020-05-05 Tencent America LLC Method and apparatus for implicit transform splitting
CN117156130A (zh) * 2018-10-23 2023-12-01 韦勒斯标准与技术协会公司 通过使用基于子块的运动补偿处理视频信号的方法和设备
EP3881546A4 (en) * 2018-12-04 2022-01-26 Huawei Technologies Co., Ltd. VIDEO ENCODER, VIDEO DECODER, AND CORRESPONDING METHOD
US11234007B2 (en) 2019-01-05 2022-01-25 Tencent America LLC Method and apparatus for video coding
CN113632493A (zh) * 2019-03-13 2021-11-09 北京字节跳动网络技术有限公司 变换跳过模式中的子块变换
JP7189854B2 (ja) * 2019-09-19 2022-12-14 Kddi株式会社 画像復号装置、画像復号方法及びプログラム
CN111160348A (zh) * 2019-11-20 2020-05-15 中国科学院深圳先进技术研究院 自然场景的文本识别方法、存储装置和计算机设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040268329A1 (en) * 2003-05-28 2004-12-30 Broadcom Corporation Context adaptive binary arithmetic code decoding engine
WO2010143853A2 (ko) * 2009-06-07 2010-12-16 엘지전자 주식회사 비디오 신호의 디코딩 방법 및 장치

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4025570B2 (ja) 2002-04-03 2007-12-19 日本電信電話株式会社 動画像符号化方法、動画像復号方法、動画像符号化装置、動画像復号装置、動画像符号化プログラム、動画像復号プログラム、動画像符号化プログラムを記録した記録媒体、動画像復号プログラムを記録した記録媒体
CN100344163C (zh) * 2004-06-16 2007-10-17 华为技术有限公司 视频编解码处理方法
EP1829223B1 (en) * 2004-12-22 2013-02-13 LG Electronics Inc. Parallel, layered decoding for Low-Density Parity-Check (LDPC) codes
JPWO2006118288A1 (ja) * 2005-05-03 2008-12-18 松下電器産業株式会社 動画像符号化方法、動画像復号化方法およびその装置
KR100809298B1 (ko) * 2006-06-22 2008-03-04 삼성전자주식회사 플래그 인코딩 방법, 플래그 디코딩 방법, 및 상기 방법을이용한 장치
PT2123052E (pt) * 2007-01-18 2011-03-02 Fraunhofer Ges Forschung Corrente de dados de vídeo de qualidade escalonável
EP2140684B1 (en) * 2007-04-12 2018-08-15 Thomson Licensing DTV Method and apparatus for context dependent merging for skip-direct modes for video encoding and decoding
KR101431545B1 (ko) * 2008-03-17 2014-08-20 삼성전자주식회사 영상의 부호화, 복호화 방법 및 장치
US8897359B2 (en) * 2008-06-03 2014-11-25 Microsoft Corporation Adaptive quantization for enhancement layer video coding
KR20090129926A (ko) * 2008-06-13 2009-12-17 삼성전자주식회사 영상 부호화 방법 및 그 장치, 영상 복호화 방법 및 그 장치
KR20100020441A (ko) 2008-08-12 2010-02-22 엘지전자 주식회사 비디오 신호 처리 방법
US8634456B2 (en) * 2008-10-03 2014-01-21 Qualcomm Incorporated Video coding with large macroblocks
US8934548B2 (en) * 2009-05-29 2015-01-13 Mitsubishi Electric Corporation Image encoding device, image decoding device, image encoding method, and image decoding method
US9635368B2 (en) 2009-06-07 2017-04-25 Lg Electronics Inc. Method and apparatus for decoding a video signal
US8588296B2 (en) * 2009-07-02 2013-11-19 Dialogic Corporation Bitrate control algorithm for video transcoding systems
CN101959064B (zh) * 2009-07-14 2012-05-30 炬力集成电路设计有限公司 一种视频解码方法及装置
KR101483750B1 (ko) * 2009-07-24 2015-01-19 삼성전자주식회사 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치
KR20110014000A (ko) * 2009-08-04 2011-02-10 광운대학교 산학협력단 영상 데이터의 디블록킹 필터링 장치 및 방법과 이를 이용한 영상 복호화 장치 및 방법
KR101456498B1 (ko) * 2009-08-14 2014-10-31 삼성전자주식회사 계층적 부호화 단위의 스캔 순서를 고려한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
KR101457894B1 (ko) * 2009-10-28 2014-11-05 삼성전자주식회사 영상 부호화 방법 및 장치, 복호화 방법 및 장치
US8780978B2 (en) * 2009-11-04 2014-07-15 Qualcomm Incorporated Controlling video encoding using audio information
US20110292997A1 (en) * 2009-11-06 2011-12-01 Qualcomm Incorporated Control of video encoding based on image capture parameters
US10178406B2 (en) * 2009-11-06 2019-01-08 Qualcomm Incorporated Control of video encoding based on one or more video capture parameters
WO2011121715A1 (ja) 2010-03-30 2011-10-06 株式会社 東芝 画像復号化方法
US20110249742A1 (en) * 2010-04-07 2011-10-13 Apple Inc. Coupled video pre-processor and codec including reference picture filter that minimizes coding expense during pre-processing mode transitions
US8665959B2 (en) * 2010-04-12 2014-03-04 Qualcomm Incorporated Block and partition signaling techniques for video coding
CN102986227B (zh) * 2010-07-15 2016-04-20 夏普株式会社 解码装置、编码装置
US20120189052A1 (en) * 2011-01-24 2012-07-26 Qualcomm Incorporated Signaling quantization parameter changes for coded units in high efficiency video coding (hevc)
CN107087179B (zh) 2011-03-10 2021-04-27 夏普株式会社 图像解码装置及方法、以及记录介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040268329A1 (en) * 2003-05-28 2004-12-30 Broadcom Corporation Context adaptive binary arithmetic code decoding engine
WO2010143853A2 (ko) * 2009-06-07 2010-12-16 엘지전자 주식회사 비디오 신호의 디코딩 방법 및 장치
KR20100131934A (ko) * 2009-06-07 2010-12-16 엘지전자 주식회사 비디오 신호의 디코딩 방법 및 장치

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ANONYMOUS: "Test Model under Consideration", 《2ND JCT-VC MEETING》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112425167A (zh) * 2018-07-13 2021-02-26 韩国电子通信研究院 用于图像编码/解码的方法和装置以及其上存储有比特流的记录介质
CN113039794A (zh) * 2018-11-16 2021-06-25 索尼集团公司 图像处理装置和方法

Also Published As

Publication number Publication date
CN107087179B (zh) 2021-04-27
CN103460694B (zh) 2017-02-15
CN107105259A (zh) 2017-08-29
CN103460694A (zh) 2013-12-18
EP2685718A1 (en) 2014-01-15
EP2685718A4 (en) 2015-03-11
JPWO2012121284A1 (ja) 2014-07-17
CN107087178A (zh) 2017-08-22
EP2685718B1 (en) 2018-08-29
HK1191484A1 (zh) 2014-07-25
EP3413564A1 (en) 2018-12-12
US20180295360A1 (en) 2018-10-11
US10148974B2 (en) 2018-12-04
JP2017147750A (ja) 2017-08-24
CN107105259B (zh) 2021-12-28
WO2012121284A1 (ja) 2012-09-13
US20130343455A1 (en) 2013-12-26
CN107071439A (zh) 2017-08-18
CN107087178B (zh) 2021-12-28
JP6483183B2 (ja) 2019-03-13
US10547861B2 (en) 2020-01-28
CN107071439B (zh) 2021-12-28

Similar Documents

Publication Publication Date Title
CN103460694B (zh) 图像解码装置、图像编码装置以及编码数据的数据构造
US10142653B2 (en) Image decoding apparatus, image coding apparatus, and coded data transformation apparatus
US9813713B2 (en) Arithmetic decoding device, arithmetic decoding method, arithmetic coding device, arithmetic coding method, and storage medium
CN104054343B (zh) 图像解码装置、图像编码装置
CN104604233B (zh) 图像解码装置
CN105532000A (zh) 用于对视频数据进行编码和解码的方法、设备和系统
WO2012147947A1 (ja) 画像復号装置、および画像符号化装置
CN117939168A (zh) 图像编码方法、编码流提取方法以及图像解码方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant