CN105637872A - 图像解码装置、图像编码装置 - Google Patents
图像解码装置、图像编码装置 Download PDFInfo
- Publication number
- CN105637872A CN105637872A CN201480056593.1A CN201480056593A CN105637872A CN 105637872 A CN105637872 A CN 105637872A CN 201480056593 A CN201480056593 A CN 201480056593A CN 105637872 A CN105637872 A CN 105637872A
- Authority
- CN
- China
- Prior art keywords
- prediction
- block
- picture
- sub
- view synthesis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/57—Motion estimation characterised by a search window with variable size or shape
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
在视点合成预测(VSP:View?Synthesis?Prediction)中存在如下课题:在称为非矩形分割(AMP)的编码单元(CU)的分割模式中选择了12×16、16×12的块的情况下,会产生需要比HEVC的最小PU尺寸小的4×4单位的处理的运动补偿块。根据本发明,提高了视点合成预测中的编码效率并降低了计算量。本发明提供一种生成对象预测块的预测图像并进行解码的图像解码装置,具备生成用于视点合成预测的位移的视点合成预测部,所述视点合成预测部根据所述预测块的高度或者宽度是否为8的倍数来设定子块尺寸,所述视点合成预测部使用所述子块尺寸并参考深度,导出来源于深度的位移。
Description
技术领域
本发明涉及图像解码装置、图像编码装置。
背景技术
在多视点的图像编码技术中,提出了有对多个视点的图像进行编码时通过预测图像间的视差来降低信息量的视差预测编码、和与该编码方法对应的解码方法。将表示视点图像间的视差的向量称为位移向量。位移向量是具有水平方向的元素(x分量)和垂直方向的元素(y分量)的二维向量,并按照作为分割一个图像的区域的每块进行计算。另外,为了获取多视点的图像,一般使用配置在各个视点的照相机。在多视点的编码中,各视点图像在多个层分别作为不同的层被编码。由多个层构成的动态图像的编码方法一般称为可扩缩编码或分层编码。在可扩缩编码中,通过在各层之间进行预测,实现较高的编码效率。不进行各层之间的预测而成为基准的层称为基底层,除此以外的层称为扩展层。将层由视点图像构成时的可扩缩编码称为视图可扩缩编码。此时,基底层也称为基底视图,扩展层也称为非基底视图。进而,在视图可扩缩的基础上,在层由纹理层(图像层)和深度层(距离图像层)构成时的可扩缩编码称为三维可扩缩编码。
另外,可扩缩编码除视图可扩缩编码外,还有:空间可扩缩编码(处理分辨率较低的图片作为基底层,处理分辨率较高的图片作为扩展层)、和SNR可扩缩编码(处理图像质量较低的图片作为基底层,处理分辨率较高的图片作为扩展层)等。在可扩缩编码中,例如有时将基底层的图片在扩展层的图片的编码中用作参考图片。
另外,在非专利文献1中已知一种称为视点合成预测的技术,其将预测对象块分割成小的子块,按每一子块使用位移向量进行预测,由此,获得更高精度的预测图像。
现有技术文献
非专利文献
非专利文献1:3D-HEVCDraftText1,JCT3V-E1001-v3,JCT-3V5thMeeting:Vienna,KR,2Aug-27July.2013
发明内容
发明要解决的课题
在非专利文献1的视点合成预测中,基本上是分割成HEVC的最小PU尺寸即8×4、4×8的子块(运动补偿块)进行处理。但是,在非专利文献1中存在如下课题:在称为非矩形分割(AMP)的编码单元(CU)的分割模式中,在选择了12×16、16×12的块的情况下,会产生需要比HEVC的最小PU尺寸小的4×4单位的处理的运动补偿块。
用于解决课题的手段
该发明为了解决上述课题而研发,本发明的一方面是一种生成对象预测块的预测图像并进行解码的图像解码装置,其具备生成用于视点合成预测的位移的视点合成预测部,所述视点合成预测部根据所述预测块的高度或者宽度是否为8的倍数设定子块尺寸,所述视点合成预测部使用所述子块尺寸并参考深度导出来源于深度的位移。
另外,本发明的另一方面是一种生成对象预测块的预测图像并进行解码的图像编码装置,其具备生成用于视点合成预测的位移的视点合成预测部,所述视点合成预测部根据预测块的高度或者宽度是否为8的倍数设定子块尺寸,所述视点合成预测部使用所述子块尺寸并参考深度导出来源于深度的位移。
发明效果
根据本发明,提高了视点合成预测中的编码效率,并减少了计算量。
附图说明
图1是表示本发明的实施方式的图像传输系统的结构的概略图。
图2是表示本实施方式的编码流的数据的层次结构的图。
图3是表示参考图片列表的一例的概念图。
图4是表示参考图片的示例的概念图。
图5是表示本实施方式的图像解码装置的结构的概略图。
图6是表示本实施方式的帧间预测参数解码部的结构的概略图。
图7是表示本实施方式的合并模式参数导出部的结构的概略图。
图8是表示本实施方式的AMVP预测参数导出部的结构的概略图。
图9是表示向量候补的一例的概念图。
图10是表示本实施方式的帧间预测参数解码控制部的结构的概略图。
图11是表示本实施方式的帧间预测图像生成部的结构的概略图。
图12是表示比较例中的视点合成部的处理的图。
图13是表示本实施方式的视点合成预测部3094、视点合成预测部3094′的处理的图。
图14是表示本实施方式的残差预测部的结构的概略图。
图15是表示本实施方式的残差预测的概念图(其1)。
图16是表示本实施方式的残差预测的概念图(其2)。
图17是表示本实施方式的视点合成预测部的结构的概略图。
图18是表示合并候补列表的一例的图。
图19是表示本实施方式的视点合成预测部3094、视点合成预测部3094B的处理的图。
图20是表示本实施方式的图像编码装置的结构的方框图。
图21是表示本实施方式的帧间预测参数编码部的结构的概略图。
图22是表示本实施方式的视点合成预测部3094′的处理的图。
图23是表示本实施方式的视点合成预测部3094B、视点合成预测部3094B′的处理的图。
图24是表示本实施方式的视点合成预测部3094B′的处理的图。
图25是表示PU分割类型的图案的图,(a)~(h)分别表示PU分割类型为2N×N、2N×N、2N×nU、2N×nD、2N×N、2N×nU、2N×nD、以及N×N的情况下的分区形状。
具体实施方式
(第一实施方式)
以下,参考附图对本发明的实施方式进行说明。
图1是表示本实施方式的图像传输系统1的结构的概略图。
图像传输系统1是传输编码了多个层图像的代码,并对解码了传输的代码的图像进行显示的系统。图像传输系统1包含图像编码装置11、网络21、图像解码装置31和图像显示装置41构造而成。
在图像编码装置11中输入表示多个层图像(也称为纹理图像)的信号T。层图像是指以某分辨率和某视点观看或者拍摄的图像。在进行使用多个层图像编码三维图像的视图可扩缩编码的情况下,多个层图像的每一个分别称为视点图像。在此,视点相当于拍摄装置的位置或观测点。例如,多个视点图像为由左右两个拍摄装置分别朝向被摄体拍摄的图像。图像编码装置11对该信号的每一个进行编码生成编码流Te(编码数据)。对于编码流Te的详细说明如后所述。视点图像是指在某视点观测到的二维图像(平面图像)。视点图像例如以配置在二维平面内的每一像素的亮度值、或色度信号值表示。以下,将一个视点图像或表示该视点图像的信号称为图片(picture)。另外,在使用多个层图像进行空间可扩缩编码的情况下,该多个层图像由:分辨率较低的基底层图像、和分辨率较高的扩展层图像构成。在使用多个层图像进行SNR可扩缩编码的情况下,该多个层图像由图像质量较低的基底层图像、和图像质量较高的扩展层图像构成。此外,也可以任意组合视图可扩缩编码、空间可扩缩编码、SNR可扩缩编码进行。本实施方式中,作为多层图像,至少处理包含基底层图像、和基底层图像以外的图像(扩展层图像)的图像的编码和解码。在多个层中,对于在图像或者编码参数中处于参考关系(依赖关系)的两个层,将被参考侧的图像称为第一层图像,将参考侧的图像称为第二层图像。例如,在有参考基底层编码的(基底层以外的)增强层图像的情况下,将基底层图像作为第一层图像,将增强层图像作为第二层图像处理。此外,作为增强层图像的示例,有基底视图以外的视点的图像、深度图像等。
深度图像(depthmap,也称为“进深图像”、“距离图像”)是由被摄空间中包含的被摄体和背景的、与距视点(拍摄装置等)的距离对应的信号值(称为“深度值”、“进深值”、“深度”等),即配置在二维平面内的每一像素的信号值(像素值)构成的图像信号。构成深度图像的像素与构成视点图像的像素对应。因此,深度图成为用于使用作为将被摄空间投影到二维平面上的基准的图像信号即视点图像来表示三维被摄空间的线索。
网络21将图像编码装置11生成的编码流Te传输到图像解码装置31。网络21是因特网(internet)、广域网络(WAN:WideAreaNetwork)、小型网络(LAN:LocalAreaNetwork)或这些网络的组合。网络21不一定限于双向通信网,也可以是传输地面数字广播、卫星广播等的广播波的单向或双向通信网。另外,网络21也可以用DVD(DigitalVersatileDisc)、BD(Blue-rayDisc)等记录编码流Te的存储介质代替。
图像解码装置31对网络21传输的编码流Te的每一个进行解码,生成分别解码的多个解码层图像Td(解码视点图像Td)。
图像显示装置41对图像解码装置31生成的多个解码层图像Td的全部或一部分进行显示。例如,在视图可扩缩编码中,在显示全部的情况下,显示三维图像(立体图像)或自由视点图像,在显示一部分的情况下,显示二维图像。图像显示装置41例如具备液晶显示器、有机EL(Electro-luminescence)显示器等显示设备。另外,在空间可扩缩编码、SNR可扩缩编码中,在图像解码装置31、图像显示装置41具有较高的处理能力的情况下,显示图像质量较高的扩展层图像,在仅具有更低的处理能力的情况下,显示无需如扩展层那样高的处理能力、显示能力的基底层图像。
<编码流Te的结构>
在对本实施方式的图像编码装置11和图像解码装置31详细地进行说明之前,对由图像编码装置11生成并由图像解码装置31解码的编码流Te的数据结构进行说明。
图2是表示编码流Te中的数据的层次结构的图。编码流Te示例性地包含序列、和构成序列的多个图片。图2的(a)~(f)分别是表示预定序列SEQ的序列层、规定图片PICT的图片层、规定片断S的片断层、规定片断数据的片断数据层、规定片断数据中包含的编码树单元的编码树层、规定编码树中包含的编码单位(CodingUnit;CU)的编码单元层的图。
(序列层)
在序列层中,为了解码处理对象的序列SEQ(以下,也称为对象序列),规定了图像解码装置31参考的数据的集合。如图2的(a)所示,序列SEQ包含:视频参数集(VideoParameterSet)、序列参数集SPS(SequenceParameterSet)、图片参数集PPS(PictureParameterSet)、图片PICT、以及附加扩展信息SEI(SupplementalEnhancementInformation)。在此,#之后所示的值表示层ID。在图2中表示了存在#0和#1即层ID为0和层ID为1的编码数据的例,层的种类和层的数不依赖于此。
视频参数集VPS在由多个层构成的动态图像中规定有通用于多个动态图像的编码参数的集合、和动态图像中包含的多个层及与各个层相关联的编码参数的集合。
在序列参数集SPS中,为了解码对象序列,规定有图像解码装置31参考的编码参数的集合。例如,规定了图片的宽度和高度。
在图片参数集PPS中,为了解码对象序列内的各图片,规定有图像解码装置31参考的编码参数的集合。例如,含有:用于图片的解码的量化宽度的标准值(pic_init_qp_minus26)、表示使用加权预测的标志(weighted_pred_flag)。此外,PPS也可以存在多个。在该情况下,从对象序列内的各图片选择多个PPS中的一个。
(图片层)
在图片层中,为了解码处理对象的图片PICT(以下,也称为对象图片),规定有图像解码装置31参考的数据的集合。如图2的(b)所示,图片PICT含有片断S0~SNS-1(NS是图片PICT中包含的片断的总数)。
此外,以下,在无需分别区分片断S0~SNS-1的情况下,存在省略代码的角标进行记述的情况。另外,以下说明的编码流Te中包含的数据、即附有角标的其它数据也同样。
(片断层)
在片断层中,为了解码处理对象的片断S(也称为对象片断),规定有图像解码装置31参考的数据的集合。片断S如图2的(c)所示,含有片断头SH、以及片断数据SDATA。
为了决定对象片断的解码方法,在片断头SH中含有图像解码装置31参考的编码参数组。指定片断类型的片断类型指定信息(slice_type)是片断头SH中包含的编码参数的一例。
作为可通过片断类型指定信息指定的片断类型,可以列举出:(1)在编码时仅使用帧内预测的I片断、(2)在编码时使用单向预测、或者,使用帧内预测的P片断、(3)在编码时使用单向预测、双向预测、或者,使用帧内预测的B片断等。
此外,在片断头SH中也可以含有包含在上述序列层中的、对图片参数集PPS的参考(pic_parameter_set_id)。
(片断数据层)
在片断数据层中,为了解码处理对象的片断数据SDATA,规定有图像解码装置31参考的数据的集合。如图2的(d)所示,片断数据SDATA含有:编码树块(CTB:CodedTreeBlock)。CTB是构成片断的固定尺寸(例如64×64)的块,有时也称为最大编码单位(LCU:LargestCordingUnit)。
(编码树层)
如图2的(e)所示,编码树层为了解码处理对象的编码树块,规定有图像解码装置31参考的数据的集合。编码树单元通过递归四叉树分割被分割。将通过递归四叉树分割获得的树结构的节点称为编码树(codingtree)。四叉树的中间节点是编码树单元(CTU:CodedTreeUnit),编码树块本身也规定为最上位的CTU。CTU含有分割标志(split_flag),在split_flag为1的情况下,分割为四个编码树单元CTU。在split_flag为0的情况下,编码树单元CTU分割为四个编码单元(CU:CodedUnit),编码单元CU是编码树层的末端节点,在此层中,不再继续分割。编码单元CU成为编码处理的基本单位。
另外,在编码树块CTB的尺寸为64×64像素的情况下,编码单元的尺寸能够得到64×64像素、32×32像素、16×16像素、以及8×8像素中的一个。
(编码单元层)
如图2的(f)所示,编码单元层为了解码处理对象的编码单元规定有图像解码装置31参考的数据的集合。具体来说,编码单元由CU头CUH、预测树、转换树、CU头CUF构成。在CU头CUH中,编码单元被规定为使用帧内预测的单元,或者使用帧间预测的单元等。另外,CU头CUH包含:表示编码单元是否为使用残差预测的单元的残差预测权重索引iv_res_pred_weight_idx、表示是否为使用照度补偿预测的单元的照度补偿标志ic_flag。编码单元成为预测树(predictiontree;PT)和转换树(transformtree;TT)的根。CU头CUF包含在预测树和转换树之间、或者,转换树之后。
预测树中,编码单元分割为1个或多个预测块,并规定了各预测块的位置和尺寸。说到另一个不同的表现,预测块为构成编码单元的一个或多个不重复的区域。另外,预测树包含通过上述的分割获得的一个或多个预测块。
预测处理对每一个该预测块进行。以下,还将作为预测的单位的预测块称为预测单位(predictionunit;PU、预测单元)。
预测树中的分割的种类大体上来说,有帧内预测的情况、和帧间预测的情况两种情况。帧内预测是在同一图片内的预测,帧间预测是指在相互不同的图片间(例如,显示时刻间、层图像间)进行的预测处理。
在帧内预测的情况下,分割方法有2N×2N(与编码单元相同的尺寸)、和N×N。
另外,在帧间预测的情况下,分割方法通过编码数据的分割模式part_mode编码。在由分割模式part_mode指定的PU分割类型中,如将对象CU的尺寸设为2N×2N像素,则有下面合计8种的图案。即,2N×2N像素、2N×N像素、N×2N像素、和N×N像素四个对称性分割(symmetricsplittings)、以及2N×nU像素、2N×nD像素、nL×2N像素、和nR×2N像素四个非对称性分割(AMP:asymmetricmotionpartitions)。此外,意味着N=2m(m为1以上的任意整数)。以下,也将PU分割类型为非对称性分割的预测块称为AMP块。由于分割数为1、2、4中的任一个,因此,CU中包含的PU为一个至四个。将这些PU依次表现为PU0、PU1、PU2、PU3。
图4(a)~(h)中,对于各个分割类型具体地图示了CU中PU分割的边界的位置。
图4(a)表示未进行CU的分割的2N×2N的PU分割类型。另外,图4(b)和(e)分别对PU分割类型为2N×N、以及N×2N时的分区的形状进行了表示。另外,图4(h)表示PU分割类型为N×N时的分区的形状。
另外,图4(c)、(d)、(f)和(g)分别对作为非对称性分割(AMP)的、为2N×nU、2N×nD、nL×2N、以及nR×2N时的分区的形状进行了表示。
另外,图4(a)~(h)中,对各区域所附的编号表示区域的识别编号,按照该识别编号的顺序,对区域进行处理。即,该识别编号表示区域的扫描顺序。
在帧间预测的情况下的预测块中,在上述8种分割类型中,定义了N×N(图4(h))以外的7种。
另外,N的具体值根据该PU所属的CU的尺寸规定,nU、nD、nL、以及nR的具体值根据N的值决定。例如,32×32像素的CU能够分割为32×32像素、32×16像素、16×32像素、32×16像素、32×8像素、32×24像素、8×32像素、以及24×32像素的帧间预测的预测块。
另外,在转换树中,编码单元被分割为一个或多个转换块,并规定了各转换块的位置和尺寸。说到另一个不同的表现,转换块为构成编码单元的一个或多个不重复的区域。另外,转换树包含由上述的分割获得的一个或多个转换块。
转换树中的分割有:将与编码单元相同尺寸的区域切割为转换块的分割;和与上述的树块的分割相同,由递归四叉树分割进行的分割。
转换处理对每一个该转换块进行。以下,也将作为转换的单位的转换块称为转换单位(transformunit;TU)。
(预测参数)
预测单元的预测图像通过预测单元附带的预测参数导出。预测参数有帧内预测的预测参数或者帧间预测的预测参数。以下,对帧间预测的预测参数(帧间预测参数)进行说明。帧间预测参数由预测列表利用标志predFlagL0、predFlagL1、参考图片索引refIdxL0、refIdxL1、向量mvL0、mvL1构成。预测列表利用标志predFlagL0、predFlagL1是表示是否使用了分别称为L0列表、L1列表的参考图片列表的标志,使用有与值为1的情况对应的参考图片列表。此外,在本说明书中记述为“表示是否为XX的标志”的情况下,将1设为是XX的情况,将0设为不是XX的情况,在逻辑非、逻辑积等中,将1处理为真,将0处理为假(以下同样)。但是,在实际的装置、方法中,也可以使用其它值作为真值、假值。在使用两个参考图片列表的情况,即,(predFlagL0,predFlagL1)=(1,1)的情况与双预测对应,使用一个参考图片列表的情况,即(predFlagL0,predFlagL1)=(1,0)或者(predFlagL0,predFlagL1)=(0,1)的情况与单一预测对应。此外,预测列表利用标志的信息也可以用后述的帧间预测标志inter_pred_idc表现。通常,在后述的预测图像生成部、预测参数存储器中,使用预测列表利用标志,在从编码数据解码是否使用哪种参考图片列表的信息时使用帧间预测标志inter_pred_idc。
用于导出编码数据中包含的帧间预测参数的语法元素例如有:分割模式part_mode、合并标志merge_flag、合并索引merge_idx、帧间预测标志inter_pred_idx、参考图片索引refIdxLX、预测向量索引mvp_LX_idx、差分向量mvdLX。
(参考图片列表的一例)
接下来,对参考图片列表的一例进行说明。参考图片列表是由存储在参考图片存储器306(图5)中的参考图片构成的列。图3是表示参考图片列表的一例的概念图。在参考图片列表601中,左右排列成一列的五个长方形分别表示参考图片。从左端向右依次表示的代码、P1、P2、Q0、P3、P4是表示各个参考图片的代码。P1等P表示视点P,而且,Q0的Q表示与视点P不同的视点Q。P和Q的角标表示图片顺序编号POC。refIdxLX正下方的向下的箭头表示参考图片索引refIdxLX是在参考图片存储器306中参考参考图片Q0的索引。
(参考图片的示例)
接下来,对导出向量时使用的参考图片的示例进行说明。图4是表示参考图片的示例的概念图。在图4中,横轴表示显示时刻,纵轴表示视点。图4所示的、纵2行、横3列(共计6个)的长方形分别表示图片。在6个长方形中,下行的从左数第二列的长方形表示解码对象的图片(对象图片),剩余的五个长方形分别表示参考图片。由从对象图片朝向上方的箭头表示的参考图片Q0是在与对象图片相同的显示时刻视点不同的图片。在以对象图片为标准的位移预测中,使用参考图片Q0。由从对象图片朝向左侧的箭头表示的参考图片P1在与对象图片相同的视点为过去的图片。由从对象图片朝向右侧的箭头表示的参考图片P2在与对象图片相同的视点为未来的图片。在以对象图片为标准的运动预测中,使用参考图片P1或P2。
(帧间预测标志和预测列表利用标志)
帧间预测标志inter_pred_idc和预测列表利用标志predFlagL0、predFlagL1的关系能够使用
inter_pred_idc=(predFlagL1<<1)+predFlagL0
predFlagL0=inter_pred_idc&1
predFlagL1=inter_pred_idc>>1
的数式相互转换。在此,>>为右移,<<为左移。因此,作为帧间预测参数,可以使用预测列表利用标志predFlagL0、predFlagL1,也可以使用帧间预测标志inter_pred_idc。另外,以下,使用预测列表利用标志predFlagL0、predFlagL1的判断也可以置换为帧间预测标志inter_pred_idc。相反,使用帧间预测标志inter_pred_idc的判断也可以置换为预测列表利用标志predFlagL0、predFlagL1
(合并模式和AMVP预测)
在预测参数的解码(编码)方法中,有合并预测(merge)模式和AMVP(AdaptiveMotionVectorPrediction、自适应运动向量预测)模式这两种模式的合并标志merge_flag是用于识别这些模式的标志。无论是合并预测模式,还是AMVP模式,都使用已经完成处理的块的预测参数,导出对象PU的预测参数。合并预测模式是编码数据中不包含预测列表利用标志predFlagLX(帧间预测标志inter_pred_idc)、参考图片索引refIdxLX、向量mvLX,并直接使用已经导出的预测参数的模式,AMVP模式是在编码数据中包含帧间预测标志inter_pred_idc、参考图片索引refIdxLX、向量mvLX的模式。此外,向量mvLX作为表示预测向量的预测向量索引mvp_LX_idx和差分向量(mvdLX)编码。
帧间预测标志inter_pred_idc是表示参考图片的种类和数量的数据,并获取Pred_L0、Pred_L1、Pred_Bi中的一个值。Pred_L0、Pred_L1表示使用分别存储在称为L0列表、L1列表的参考图片列表中的参考图片,并表示共使用一个参考图片(单一预测)。将使用了L0列表、L1列表的预测分别称为L0预测、L1预测。Pred_Bi表示使用两个参考图片(双预测),并表示使用存储在L0列表和L1列表中的两个参考图片。预测向量索引mvp_LX_idx是表示预测向量的索引,参考图片索引refIdxLX是表示存储在参考图片列表中的参考图片的索引。此外,LX是在不区分L0预测和L1预测时使用的记述方法,通过将LX置换为L0、L1区分对L0列表的参数和对L1列表的参数。例如,refIdxL0是用于L0预测的参考图片索引的标记,refIdxL1是用于L1预测的参考图片索引的标记,refIdx(refIdxLX)是不区分refIdxL0和refIdxL1时使用的标记。
合并索引merge_idx是表示是否将从完成了处理的块导出的预测参数候补(合并候补)中任一预测参数作为解码对象块的预测参数使用的索引。
(运动向量和位移向量)
向量mvLX有运动向量和位移向量(disparityvector、视差向量)。运动向量是表示某层的某显示时刻的图片中块的位置、和不同的显示时刻(例如,邻接的离散时刻)的相同层的图片中对应的块的位置之间的位置的偏离的向量。位移向量是表示某层的某显示时刻的图片中块的位置、和相同的显示时刻的不同的层的图片中对应的块的位置之间的位置的偏离的向量。作为不同的层的图片,有为不同的视点的图片的情况、或者,为不同的分辨率的图片的情况等。特别是,将与不同的视点的图片对应的位移向量称为视差向量。在以下的说明中,在不区分运动向量和位移向量的情况下,仅称为向量mvLX。将与向量mvLX相关的预测向量、差分向量分别称为预测向量mvpLX、差分向量mvdLX。向量mvLX和差分向量mvdLX是运动向量还是位移向量使用向量附带的参考图片索引refIdxLX进行。
(图像解码装置的结构)
接下来,对本实施方式的图像解码装置31的结构进行说明。图5是表示本实施方式的图像解码装置31的结构的概略图。图像解码装置31包含:熵解码部301、预测参数解码部302、参考图片存储器(参考图像存储部、帧存储器)306、预测参数存储器(预测参数存储部、帧存储器)307、预测图像生成部308、逆量化/逆DCT部311、加法部312、残差收纳部313(残差记录部)及未图示的深度DV导出部351构造而成。
另外,预测参数解码部302包含帧间预测参数解码部303及帧内预测参数解码部304构造而成。预测图像生成部308包含帧间预测图像生成部309及帧内预测图像生成部310构造而成。
熵解码部301对从外部输入的编码流Te进行熵解码,并分离各个代码(语法元素)进行解码。分离的代码有用于生成预测图像的预测信息和用于生成差分图像的残差信息等。
熵解码部301将分离的代码的一部分输出到预测参数解码部302。分离的代码的一部分例如是:预测模式PredMode、分割模式part_mode、合并标志merge_flag、合并索引merge_idx、帧间预测标志inter_pred_idc、参考图片索引refIdxLX、预测向量索引mvp_LX_idx、差分向量mvdLX、残差预测权重索引iv_res_pred_weight_idx、照度补偿标志ic_flag。是否解码哪种代码的控制基于预测参数解码部302的指示进行。熵解码部301将量化系数输出到逆量化/逆DCT部311。该量化系数是在编码处理中对残差信号进行DCT(DiscreteCosineTransform、离散余弦转换),量化得到的系数。熵解码部301将深度DV转换表DepthToDisparityB输出到深度DV导出部351。该深度DV转换表DepthToDisparityB是将深度图像的像素值转换为表示视点图像间的位移的视差的表,深度DV转换表DepthToDisparityB的元素DepthToDisparityB[d]能够使用斜度cp_scale、偏移量cp_off、斜度的精度cp_precision,通过
log2Div=BitDepthY-1+cp_precision
offset=(cp_off<<BitDepthY)+((1<<log2Div)>>1)
scale=cp_scale
DepthToDisparityB[d]=(scale*d+offset)>>log2Div
的数式求出。参数cp_scale、cp_off、cp_precision对每一参考的视点从编码数据中的参数集解码。此外,BitDepthY表示与亮度信号对应的像素值的位深度,例如,值取8。
预测参数解码部302从熵解码部301收取代码的一部分作为输入。预测参数解码部302对代码的一部分即与预测模式PredMode所示的预测模式对应的预测参数进行解码。预测参数解码部302将解码为预测模式PredMode的预测参数输出到预测参数存储器307和预测图像生成部308。
帧间预测参数解码部303基于从熵解码部301输入的代码,参考存储在预测参数存储器307中的预测参数,对帧间预测参数进行解码。帧间预测参数解码部303将解码的帧间预测参数输出到预测图像生成部308,并存储在预测参数存储器307中。关于帧间预测参数解码部303的详细说明如后所述。
帧内预测参数解码部304基于从熵解码部301输入的代码,参考存储在预测参数存储器307中的预测参数,解码帧内预测参数。帧内预测参数是在在一个图片内预测图片块的处理中使用的参数、例如,帧内预测模式IntraPredMode。帧内预测参数解码部304将解码的帧内预测参数输出到预测图像生成部308,并存储在预测参数存储器307中。
帧内预测参数解码部304也可以导出亮度和色差上不同的帧内预测模式。在该情况下,帧内预测参数解码部304解码亮度预测模式IntraPredModeY作为亮度的预测参数,解码色差预测模式IntraPredModeC作为色差的预测参数。亮度预测模式IntraPredModeY是35模式,平面预测(0)、DC预测(1)、方向预测(2~34)对应。色差预测模式IntraPredModeC使用平面预测(0)、DC预测(1)、方向预测(2、3、4)、LM模式(5)中的一个。
参考图片存储器306将加法部312生成的参考图片的块(参考图片块)存储在解码对象的图片及每块中预先确定的位置。
预测参数存储器307将预测参数存储在解码对象的图片及每块中预先确定的位置。具体来说,预测参数存储器307存储:帧间预测参数解码部303解码的帧间预测参数、帧内预测参数解码部304解码的帧内预测参数及熵解码部301分离的预测模式predMode。存储的帧间预测参数例如有:预测列表利用标志predFlagLX(帧间预测标志inter_pred_idc)、参考图片索引refIdxLX、向量mvLX。
预测图像生成部308中,从预测参数解码部302输入预测模式predMode和预测参数。另外,预测图像生成部308从参考图片存储器306读出参考图片。预测图像生成部308以预测模式predMode所示的预测模式,使用输入的预测参数和读出的参考图片生成预测图片块predSmaples(预测图像)。
在此,在预测模式predMode表示帧间预测模式的情况下,帧间预测图像生成部309使用读出为从帧间预测参数解码部303输入的帧间预测参数的参考图片,通过帧间预测生成预测图片块predSmaples。预测图片块predSmaples与预测单位PU对应。如上所述,PU相当于由成进行预测处理的单位的多个像素构成的图片的一部分、即一次进行预测处理的解码对象块。
帧间预测图像生成部309对预测列表利用标志predFlagLX为1的参考图片列表(L0参考列表、或者L1参考列表),从参考图片索引refIdxLX表示的参考图片,将以解码对象块为墓准而处于向量mvLX所示的位置的参考图片块从参考图片存储器306读出。帧间预测图像生成部309对读出的参考图片块进行预测,生成预测图片块predSmaples。帧间预测图像生成部309将生成的预测图片块predSmaples输出到加法部312。
在预测模式predMode表示帧内预测模式的情况下,帧内预测图像生成部310使用从帧内预测参数解码部304输入的帧内预测参数和读出的参考图片进行帧内预测。具体来说,帧内预测图像生成部310将解码对象的图片、即处于由已经解码的块中的解码对象块预先确定的范围内的参考图片块从参考图片存储器306读出。预先确定的范围是指,在解码对象块按照所谓的光栅扫描的顺序依次移动的情况下,例如,左、左上、上、右上方的邻接块中的任一个,并因帧内预测模式的不同而不同。光栅扫描的顺序是在各图片中对从上端到下端的各行,依次从左端移动至右端的顺序。
帧内预测图像生成部310对读出的参考图片块以帧内预测模式IntraPredMode所示的预测模式进行预测,生成预测图片块。帧内预测图像生成部310将生成的预测图片块predSmaples输出到加法部312。
在帧内预测参数解码部304中,在导出亮度和色差上不同的帧内预测模式的情况下,帧内预测图像生成部310按照亮度预测模式IntraPredModeY,通过平面预测(0)、DC预测(1)、方向预测(2~34)中的一个生成亮度的预测图片块,按照色差预测模式IntraPredModeC,通过平面预测(0)、DC预测(1)、方向预测(2、3、4)、LM模式(5)中的一个生成色差的预测图片块。
逆量化/逆DCT部311将从熵解码部301输入的量化系数逆量化求出DCT系数。逆量化/逆DCT部311对求出的DCT系数进行逆DCT(InverseDiscreteCosineTransform、逆离散余弦转换),计算出解码残差信号。逆量化/逆DCT部311将计算出的解码残差信号输出到加法部312和残差收纳部313。
对每一像素,加法部312使从中帧间预测图像生成部309和帧内预测图像生成部310输入的预测图片块predSmaples和从逆量化/逆DCT部311输入的解码残差信号的信号值相加,生成参考图片块。加法部312将生成的参考图片块存储在参考图片存储器306内,并将对每一图片整合了生成的参考图片块的解码层图像Td输出到外部。
(帧间预测参数解码部的结构)
接下来,对帧间预测参数解码部303的结构进行说明。
图6是表示本实施方式的帧间预测参数解码部303的结构的概略图。帧间预测参数解码部303包含:帧间预测参数解码控制部3031、AMVP预测参数导出部3032、加法部3035及合并模式参数导出部3036构造而成。
帧间预测参数解码控制部3031对熵解码部301指示与帧间预测相关联的代码(语法元素)的解码,由编码数据中包含的代码(语法元素)提取出例如分割模式part_mode、合并标志merge_flag、合并索引merge_idx、帧间预测标志inter_pred_idc、参考图片索引refIdxLX、预测向量索引mvp_LX_idx、差分向量mvdLX、残差预测权重索引iv_res_pred_weight_idx、照度补偿标志ic_flag。
帧间预测参数解码控制部3031首先从编码数据提取出残差预测权重索引iv_res_pred_weight_idx和照度补偿标志ic_flag。帧间预测参数解码控制部3031在表现为提取某语法元素的情况下,对熵解码部301指示某语法元素的解码,这意味着从编码数据读出该语法元素。
接下来,帧间预测参数解码控制部3031从编码数据提取合并标志。在此,在合并标志merge_flag所示的值为1、即,表示合并模式的情况下,帧间预测参数解码控制部3031提取出合并索引merge_idx作为合并模式的预测参数。帧间预测参数解码控制部3031将提取的残差预测权重索引iv_res_pred_weight_idx、照度补偿标志ic_flag及合并索引merge_idx输出到合并模式参数导出部3036。
在合并标志merge_flag所示的值为0,即表示AMVP预测模式的情况下,帧间预测参数解码控制部3031使用熵解码部301从编码数据提取AMVP预测参数。作为AMVP预测参数,例如有:帧间预测标志inter_pred_idc、参考图片索引refIdxLX、向量索引mvp_LX_idx、差分向量mvdLX。帧间预测参数解码控制部3031将从提取的帧间预测标志inter_pred_idc导出的预测列表利用标志predFlagLX、和参考图片索引refIdxLX输出到AMVP预测参数导出部3032和预测图像生成部308(图5),并存储在预测参数存储器307(图5)内。帧间预测参数解码控制部3031将提取的向量索引mvp_LX_idx输出到AMVP预测参数导出部3032。帧间预测参数解码控制部3031将提取的差分向量mvdLX输出到加法部3035。
另外,帧间预测参数解码控制部3031将帧间预测参数导出时导出的位移向量(NBDV)、和表示是否进行视点合成预测的标志即VSP模式标志VSPModeFlag输出到帧间预测图像生成部309。
图7是表示本实施方式的合并模式参数导出部3036的结构的概略图。合并模式参数导出部3036具备合并候补导出部30361和合并候补选择部30362。合并候补导出部30361包含:合并候补收纳部303611、扩展合并候补导出部303612、基本合并候补导出部303613构造而成。
合并候补收纳部303611将从扩展合并候补导出部303612和基本合并候补导出部303613输入的合并候补收纳到合并候补列表mergeCandList内。此外,合并候补包含:预测列表利用标志predFlagLX、向量mvLX、参考图片索引refIdxLX、VSP模式标志VspModeFlag、位移向量MvDisp、层IDRefViewIdx构造而成。在合并候补收纳部303611中,按照规定的规则,对存储在合并候补列表mergeCandList中的合并候补分配索引。例如,对从扩展合并候补导出部303612输入的合并候补分配“0”作为索引。此外,在合并候补的VSP模式标志VspModeFlag为0的情况下,位移向量MvDisp的X,Y分量设定为0,层IDRefViewIdx设定为-1。
图18表示了合并候补收纳部303611导出的合并候补列表mergeCandList的示例。如在两个合并候补为相同的预测参数的情况下除去填写编号处理,则按照合并索引顺序,成为层间合并候补、空间合并候补(左下)、空间合并候补(右上)、空间合并候补(右上)、位移合并候补、视差合成预测合并(VSP合并候补)、空间合并候补(左下)、空间合并候补(左上)、时间合并候补的顺序。另外,其后虽有结合合并候补、零合并候补,但在图18中省略了对其的图示。
扩展合并候补导出部303612包含:位移向量获取部3036122、层间合并候补导出部3036121、位移合并候补导出部3036123、视差合成预测合并候补导出部3036124(VSP合并候补导出部3036124)构造而成。
位移向量获取部3036122首先从与解码对象块邻接的多个候补块(例如,与左、上、右上邻接的块)依次获取位移向量。具体来说,选择一个候补块,使用候补块的参考图片索引refIdxLX通过参考层判断部303111(后述)判断选择的候补块的向量是位移向量还是运动向量,在有位移向量的情况下,将其设为位移向量。在候补块没有位移向量的情况下,按顺序扫描下一个候补块。在邻接的块上没有位移向量的情况下,位移向量获取部3036122尝试获取与时间上其它显示顺序的参考图片中包含的块的对象块对应的位置的块的位移向量。在无法获取位移向量的情况下,位移向量获取部3036122将零向量设定为位移向量。得到的位移向量称为NBDV(NeighbourBaseDisparityVector)。位移向量获取部3036122将得到的NBDV输出到深度DV导出部351,收取深度DV导出部351导出的深度基底DV的水平分量作为输入。位移向量获取部3036122通过将NBDV的水平分量置换为从深度DV导出部351输入的深度基底DV的水平分量,得到更新后的位移向量(NBDV的垂直分量也是这样)。更新后的位移向量称为DoNBDV(DepthOrientatedNeighbourBaseDisparityVector)。位移向量获取部3036122将位移向量(DoNBDV)输出到层间合并候补导出部3036121、位移合并候补导出部3036123及视点合成预测合并候补导出部(VSP合并候补导出部)3036124。进而,将得到的位移向量(NBDV)输出到帧间预测图像生成部309。
层间合并候补导出部3036121从位移向量获取部3036122输入位移向量。层间合并候补导出部3036121从具有与其它层(例如基底层、基底视图)的解码对象图片相同的POC的图片内,选择从位移向量获取部3036122输入的位移向量所示的块,从预测参数存储器307读出作为该块具有的运动向量的预测参数。更具体来说,在以对象块的中心点为起点时,层间合并候补导出部3036121读出的预测参数为包含使起点的坐标和位移向量相加的坐标的块的预测参数。
参考块的坐标(xRef、yRef),在对象块的坐标为(xP、yP),位移向量为(mvDisp[0]、mvDisp[1]),对象块的宽度和高度为nPSW、nPSH的情况下,通过
xRef=Clip3(0,PicWidthInSamplesL-1,xP+((nPSW-1)>>1)+((mvDisp[0]+2)>>2))
yRef=Clip3(0,PicHeightInSamplesL-1,yP+((nPSH-1)>>1)+((mvDisp[1]+2)>>2))
的数式导出。此外,PicWidthInSamplesL和PicHeightInSamplesL分别表示图像的宽度和高度,函数Clip3(x,y,z)是将z限制(clip)在x以上、y以下,并返回该限制的结果的函数。
此外,层间合并候补导出部3036121通过帧间预测参数解码控制部3031中包含的所述的参考层判断部303111的判断方法中判断为假(不是位移向量)的方法判断预测参数是否为运动向量。层间合并候补导出部3036121将读出的预测参数作为合并候补输出到合并候补收纳部303611。另外,层间合并候补导出部3036121在无法导出预测参数时,将该信息输出到位移合并候补导出部3036123。本合并候补为运动预测的层间候补(视图间候补),也记载为层间合并候补(运动预测)。
位移合并候补导出部3036123从位移向量获取部3036122输入位移向量。位移合并候补导出部3036123生成水平分量为输入的位移向量的水平分量,垂直分量为0的向量。位移合并候补导出部3036123将生成的向量、位移向量指向的层图像的参考图片索引refIdxLX(例如,具有与解码对象图片相同的POC的基底层图像的索引)作为合并候补输出到合并候补收纳部303611。本合并候补为位移预测的层间候补(视图间候补)并也记载为层间合并候补(位移预测)。
VSP合并候补导出部3036124导出VSP(视点合成预测:ViewSynthesisPrediction)合并候补。VSP合并候补为由帧间预测图像生成部309进行的视点合成预测的预测图像生成处理时使用的合并候补。VSP合并候补导出部3036124从位移向量获取部3036122输入位移向量。VSP合并候补导出部3036124将输入的位移向量mvDisp设定为向量mvLX和位移向量MvDisp,将表示位移向量指向的层图像的参考图片的参考图片索引设定为参考图片索引refIdxLX,将位移向量指向的层的层IdrefViewIdx设定为层IDRefViewIdx,通过对VSP模式标志VspModeFlag设定1,导出VSP合并候补。VSP合并候补导出部3036124将导出的VSP合并候补输出到合并候补收纳部303611。
本实施方式的VSP合并候补导出部3036124从帧间预测参数解码控制部收取残差预测权重索引iv_res_pred_weight_idx及照度补偿标志ic_flag作为输入。VSP合并候补导出部3036124仅在残差预测权重索引iv_res_pred_weight_idx为0且照度补偿标志ic_flag为0的情况下,进行VSP合并候补的导出处理。即,仅在残差预测权重索引iv_res_pred_weight_idx为0且照度补偿标志ic_flag为0的情况下,对合并候补列表mergeCandList的元素追加VSP合并候补。相反,VSP合并候补导出部3036124在残差预测权重索引iv_res_pred_weight_idx为0以外或照度补偿标志ic_flag为0以外的情况下,不对合并候补列表mergeCandList的元素追加VSP合并候补。由此,在实施了残差预测或照度补偿预测的情况下,即没有实施视点合成预测的情况下,跳过没有利用的VSP合并候补的导出处理,由此,减少计算量并防止合并候补的増大,由此抑制了合并索引merge_idx的变动,因此,实现了改善编码效率的效果。
此外,也可以是仅进行残差预测而不进行照度补偿预测的结构。在该结构中,VSP合并候补导出部3036124仅在残差预测权重索引iv_res_pred_weight_idx为0的情况下进行VSP合并候补的导出处理。即,仅在残差预测权重索引iv_res_pred_weight_idx为0的情况下,对合并候补列表mergeCandList的元素追加VSP合并候补。相反,在残差预测权重索引iv_res_pred_weight_idx为0以外的情况下,不对合并候补列表mergeCandList的元素追加VSP合并候补。
此外,也可以是仅进行照度补偿预测而不进行残差预测的结构。在该结构中,VSP合并候补导出部3036124仅在照度补偿标志ic_flag为0的情况下,进行VSP合并候补的导出处理。即,仅在照度补偿标志ic_flag为0的情况下,对合并候补列表mergeCandList的元素追加VSP合并候补。相反,在照度补偿标志ic_flag为0以外的情况下,不对合并候补列表mergeCandList的元素追加VSP合并候补。
基本合并候补导出部303613包含:空间合并候补导出部3036131、时间合并候补导出部3036132、结合合并候补导出部3036133和零合并候补导出部3036134构造而成。
按照规定的规则,空间合并候补导出部3036131读出预测参数存储器307存储的预测参数(预测列表利用标志predFlagLX、向量mvLX、参考图片索引refIdxLX),将读出的预测参数作为合并候补导出。读出的预测参数是每一个处于由解码对象块预先确定的范围内的块(例如,分别与解码对象块的左下端、左上端、右上端相接的块的全部或一部分)即邻接块的预测参数。导出的空间合并候补收纳在合并候补收纳部303611内。
空间合并候补导出部3036131中,作为空间合并候补的VSP模式标志VspModeFlag,继承邻接块的VSP模式标志VspModeFlag。即,在邻接块的VSP模式标志VspModeFlag为1的情况下,对应的空间合并候补的VSP模式标志VspModeFlag设为1,在除此以外的情况下,VSP模式标志VspModeFlag设为0。
进而,空间合并候补导出部3036131在邻接块的VSP模式标志VspModeFlag为1的情况下,也继承邻接块的位移向量和位移向量所示的层的层ID。即,空间合并候补导出部3036131分别设定邻接块的位移向量mvDisp、和邻接块的位移向量所示的层的层IdrefViewIdx作为空间合并候补的位移向量MvDisp和层IDRefViewIdx。
以下,在时间合并候补导出部3036132、结合合并候补导出部3036133、零合并候补导出部3036134中,VSP模式标志VspModeFlag设定为0。
时间合并候补导出部3036132从预测参数存储器307读出包含解码对象块的右下方的坐标的参考图像中的块的预测参数,作为合并候补。参考图像的指定方法例如,可以是片断头中指定的参考图片索引refIdxLX,也可以使用与解码对象块邻接的块的参考图片索引refIdxLX中最小的一个指定。导出的合并候补收纳在合并候补收纳部303611内。
结合合并候补导出部3036133通过将已经导出并存储在合并候补收纳部303611内的两个不同的完成导出的合并候补的向量和参考图片索引分别作为L0、L1的向量组合,导出结合合并候补。导出的合并候补收纳在合并候补收纳部303611内。
零合并候补导出部3036134中,参考图片索引refIdxLX为0,导出向量mvLX的x分量、Y分量均为0的合并候补。导出的合并候补收纳在合并候补收纳部303611内。
合并候补选择部30362选择合并候补收纳部303611中收纳的合并候补中、与从帧间预测参数解码控制部3031输入的合并索引merge_idx对应的索引分配的合并候补作为对象PU的帧间预测参数。即,如将合并候补列表设为mergeCandList,则选择mergeCandList[merge_idx]表示的预测参数。合并候补选择部30362将选择的合并候补存储在预测参数存储器307(图5)中,同时输出到预测图像生成部308(图5)。
图8是表示本实施方式的AMVP预测参数导出部3032的结构的概略图。AMVP预测参数导出部3032具备向量候补导出部3033和预测向量选择部3034。向量候补导出部3033基于参考图片索引refIdx读出预测参数存储器307(图5)存储的向量(运动向量或位移向量)作为向量候补mvpLX。读出的向量是与每一处于由解码对象块预先确定的范围内的块(例如,与解码对象块的左下端、左上端、右上端分别相接的块的全部或一部分)相关的向量。
预测向量选择部3034选择向量候补导出部3033读出的向量候补中、从帧间预测参数解码控制部3031输入的向量索引mvp_LX_idx所示的向量候补作为预测向量mvpLX。预测向量选择部3034将选择的预测向量mvpLX输出到加法部3035。
图9是表示向量候补的一例的概念图。图9所示的预测向量列表602为由在向量候补导出部3033中导出的多个向量候补构成的列表。在预测向量列表602中,左右排列成一列的五个长方形分别表示表示预测向量的区域。自左端第二个mvp_LX_idx正下方的向下的箭头和其下的mvpLX表示向量索引mvp_LX_idx在预测参数存储器307中为参考向量mvpLX的索引。
候补向量参考完成了解码处理的块、即由解码对象块预先确定的范围的块(例如,邻接块),基于参考的块的向量生成。此外,邻接块中除包含空间上与对象块邻接的块、例如,左块、上块外,还包含时间上与对象块邻接的块、例如,在与对象块相同的位置从显示时刻不同的块获得的块。
加法部3035使从预测向量选择部3034输入的预测向量mvpLX和从帧间预测参数解码控制部输入的差分向量mvdLX相加,计算出向量mvLX。加法部3035将计算出的向量mvLX输出到预测图像生成部308(图5)。
图10是表示第一实施方式的帧间预测参数解码控制部3031的结构的方框图。如图10所示,帧间预测参数解码控制部3031包含:残差预测索引解码部30311、照度补偿标志解码部30312、及未图示的、分割模式解码部、合并标志解码部、合并索引解码部、帧间预测标志解码部、参考图片索引解码部、向量候补索引解码部、向量差分解码部构造而成。分割模式解码部、合并标志解码部、合并索引解码部、帧间预测标志解码部、参考图片索引解码部、向量候补索引解码部、向量差分解码部分别解码分割模式part_mode、合并标志merge_flag、合并索引merge_idx、帧间预测标志inter_pred_idc、参考图片索引refIdxLX、预测向量索引mvp_LX_idx、差分向量mvdLX。
残差预测索引解码部30311使用熵解码部301解码残差预测权重索引iv_res_pred_weight_idx。残差预测权重索引解码部30311将解码的残差预测权重索引iv_res_pred_weight_idx输出到合并模式参数导出部3036和帧间预测图像生成部309。
照度补偿标志解码部30312使用熵解码部301解码照度补偿标志ic_flag。照度补偿标志解码部30312将解码的照度补偿标志ic_flag输出到合并模式参数导出部3036和帧间预测图像生成部309。
位移向量获取部在与对象PU邻接的块具有位移向量的情况下,从预测参数存储器307提取该位移向量,参考预测参数存储器307,读出与对象PU邻接的块的预测标志predFlagLX、参考图片索引refIdxLX和向量mvLX。位移向量获取部在内部具备参考层判断部303111。位移向量获取部按顺序读出与对象PU邻接的块的预测参数,并使用参考层判断部303111,从邻接块的参考图片索引判断邻接块是否具备位移向量。在邻接块具备位移向量的情况下,输出该位移向量。在邻接块的预测参数中没有位移向量的情况下,输出零向量作为位移向量。
(参考层判断部303111)
参考层判断部303111基于输入的参考图片索引refIdxLX,决定参考图片索引refIdxLX所指的参考图片、和表示对象图片的关系的参考层信息reference_layer_info。参考层信息reference_layer_info是表示指向参考图片的向量mvLX是位移向量还是运动向量的信息。
将对象图片的层和参考图片的层是相同的层时的预测称为同一层预测,该情况下获得的向量为运动向量。将对象图片的层、和参考图片的层为不同的层时的预测称为层间预测,该情况下得到的向量为位移向量。
(帧间预测图像生成部309)
图11是表示本实施方式的帧间预测图像生成部309的结构的概略图。帧间预测图像生成部309包含:运动位移补偿部3091、残差预测部3092、照度补偿部3093、视点合成预测部3094、帧间预测图像生成控制部3096构造而成。
帧间预测图像生成控制部3096从帧间预测参数解码部303收取VSP模式标志VspModeFlag和预测参数。帧间预测图像生成控制部3096在VSP模式标志VspModeFlag为1的情况下,将预测参数输出到视点合成预测部3094。另外,帧间预测图像生成控制部3096在VSP模式标志VspModeFlag为0的情况下,将预测参数输出到运动位移补偿部3091、残差预测部3092、照度补偿部3093。另外,帧间预测图像生成控制部3096在残差预测标志iv_res_pred_weight_idx不为0且对象块为运动补偿的情况下,设定表示对运动位移补偿部3091和残差预测实施标志resPredFlag执行残差预测的1,并输出到残差预测部3092。另一方面,在残差预测标志iv_res_pred_weight_idx为0或对象块不是运动补偿的情况下(为视差补偿的情况下),对残差预测实施标志resPredFlag设定0,并输出到运动位移补偿部3091和残差预测部3092。
(运动位移补偿)
运动位移补偿部3091基于从帧间预测图像生成控制部3096输入的预测参数、即预测列表利用标志predFlagLX、参考图片索引refIdxLX、向量mvLX(运动向量或位移向量),生成预测图像。运动位移补偿部3091从参考图片存储器306读出处于以由参考图片索引refIdxLX指定的参考图片的对象块的位置为起点偏离向量mvLX的位置的块并进行内插,由此,生成预测图像。在此,在向量mvLX不是整数向量的情况下,实施称为运动补偿滤波(或者位移补偿滤波)的、用于生成小数位置的像素的滤波,生成预测图像。一般,在向量mvLX为运动向量的情况下,将上述处理称为运动补偿,在位移向量的情况下,称为位移补偿。此处,总称表现为运动位移补偿。以下,将L0预测的预测图像称为predSamplesL0,将L1预测的预测图像称为predSamplesL1。在不区分两者的情况下,称为predSamplesLX。以下,说明对由运动位移补偿部3091得到的预测图像predSamplesLX进而进行残差预测和照度补偿的例,这些输出图像也称为预测图像predSamplesLX。此外,在以下的残差预测和照度补偿中,在区分输入图像和输出图像的情况下,将输入图像表现为predSamplesLX,将输出图像表现为predSamplesLX′。
(残差预测)
残差预测部3092在残差预测实施标志resPredFlag为1的情况下,使用从帧间预测图像生成控制部3096输入的预测参数进行残差预测。残差预测部3092在残差预测实施标志resPredFlag为0的情况下,不进行处理。refResSamples残差预测通过将与作为预测图像生成的对象的对象层(第二层图像)不同的参考层(第一层图像)的残差添加到对象层的预测的图像即预测图像predSamplesLX进行。即,假定与参考层相同的残差也在对象层上产生,将已经导出的参考层的残差作为对象层的残差的估计值使用。在基底层(基底视图)中,仅相同层的图像成为参考图像。因此,在参考层(第一层图像)为基底层(基底视图)的情况下,由于参考层的预测图像是运动补偿的预测图像,即使在对象层(第二层图像)的预测中,在为运动补偿的预测图像的情况下,残差预测也是有效的。即,残差预测具有对象块在运动补偿的情况下有效这一特性。
图14是表示残差预测部3092的结构的方框图。残差预测部3092由参考图像获取部30922、和残差合成部30923构成。
参考图像获取部30922在残差预测实施标志resPredFlag为1的情况下,读出从帧间预测参数解码部303输入的运动向量mvLX和残差预测位移向量mvDisp、及存储在参考图片存储器306中的对应块currIvSamplesLX和对应块的参考块refIvSamplesLX。
图15是用于说明对应块currIvSamplesLX的图。如图15所示,与对象层上的对象块对应的对应块位于成为以参考层上的图像的对象块的位置为起点偏离位移向量mvDisp的位置的块,位移向量mvDisp是表示参考层和对象层的位置关系的向量。
具体来说,参考图像获取部30922导出使对象块的像素的坐标(x,y)偏离对象块的位移向量mvDisp的位置的像素。考虑位移向量mvDisp为1/4像素的小数精度,残差生成部30922通过
xInt=xPb+(mvLX[0]>>2)
yInt=yPb+(mvLX[1]>>2)
xFrac=mvLX[0]&3
yFrac=mvLX[1]&3
的数式,导出与对象块的像素的坐标为(xP、yP)时对应的整数精度的像素R0的X坐标xInt和Y坐标yInt、及位移向量mvDisp的X分量的小数部分xFrac和Y分量的小数部分yFrac。在此,X&3是仅取出X的下位2比特的数式。
接下来,参考图像获取部30922考虑位移向量mvDisp为1/4像素的小数精度,生成内插像素predPartLX[x][y]。首先,通过
xA=Clip3(0,picWidthInSamples-1,xInt)
xB=Clip3(0,picWidthInSamples-1,xInt+1)
xC=Clip3(0,picWidthInSamples-1,xInt)
xD=Clip3(0,picWidthInSamples-1,xInt+1)
yA=Clip3(0,picHeightInSamples-1,yInt)
yB=Clip3(0,picHeightInSamples-1,yInt)
yC=Clip3(0,picHeightInSamples-1,yInt+1)
yD=Clip3(0,picHeightInSamples-1,yInt+1)
的数式导出整数像素A(xA,yB)、B(xB,yB)、C(xC,yC)及D(xD,yD)的坐标。在此,整数像素A是与像素R0对应的像素,整数像素B,C,D分别是与整数像素A的右、下、右下方邻接的整数精度的像素。参考图像获取部30922从参考图片存储器306读出与各整数像素A、B、C、及D对应的参考像素refPicLX[xA][yA]、refPicLX[xB][yB]、refPicLX[xC][yC]、及refPicLX[xD][yD]。
而且,参考图像获取部30922使用参考像素refPicLX[xA][yA]、refPicLX[xB][yB]、refPicLX[xC][yC]、refPicLX[xD][yD]、位移向量mvDisp的X分量的小数部分xFrac和Y分量的小数部分yFrac,导出内插像素predPartLX[x][y],所述内插像素predPartLX[x][y]是从像素R0偏离了位移向量mvDisp的小数部分的位置的像素。具体来说,通过
predPartLX[x][y]=(refPicLX[xA][yA]*(8-xFrac)*(8-yFrac)+refPicLX[xB][yB]*(8-yFrac)*xFrac
+refPicLX[xC][yC]*(8-xFrac)*yFrac
+refPicLX[xD][yD]*xFrac*yFrac)>>6
的数式导出。
参考图像获取部30922对对象块内的各像素进行上述的内插像素导出处理,将内插像素的集合设为内插块predPartLX。参考图像获取部30922将导出的内插块predPartLX作为对应块currIvSamplesLX输出到残差合成部30923。
图16是用于说明参考块refIvSamplesLX的图。如图16所示,与参考层上的对应块对应的参考块位于成为以参考层上的参考图像的对应块的位置为起点偏离对象块的运动向量mvLX的位置的块。
除导出了对应块currIvSamplesLX的处理、和将位移向量mvDisp置换为向量(mvDisp[0]+mvLX[0]、mvDisp[1]+mvLX[1])这一点外,参考图像获取部30922通过进行同样的处理,导出对应块refIvSamplesLX。参考图像获取部30922将对应块refIvSamplesLX输出到残差合成部30923。
残差合成部30923在残差预测实施标志resPredFlag为1的情况下,从预测图像predSamplesLX、对应块currIvSamplesLX、参考块refIvSamplesLX及残差预测标志iv_res_pred_weight_idx导出修正预测图像predSamplesLX′。修正预测图像predSamplesLX′使用
predSamplesLX′=predSamplesLX+
((currIvSamplesLX-refIvSamplesLX)>>(iv_res_pred_weight_idx-1))
的数式求出。残差合成部30923在残差预测实施标志resPredFlag为0的情况下,将预测图像predSamplesLX直接输出。
(照度补偿)
照度补偿部3093在照度补偿标志ic_flag为1的情况下,对输入的预测图像predSamplesLX进行照度补偿。在照度补偿标志ic_flag为0的情况下,将输入的预测图像predSamplesLX直接输出。输入照度补偿部3093的预测图像predSamplesLX在残差预测实施标志resPredFlag为0的情况下,为运动位移补偿部3091的输出图像,在残差预测实施标志resPredFlag为1的情况下,为残差预测部3092的输出图像。
(视点合成预测)
视点合成预测部3094在VSP模式标志VspModeFlag为1的情况下,使用从帧间预测图像生成控制部3096输入的预测参数,进行视点合成预测。视点合成预测部3094在VSP模式标志VspModeFlag为0的情况下,不进行处理。视点合成预测是如下这样一种处理:将对象块分割为子块,以子块单位从参考图片存储器306读出偏离了视差阵列disparitySampleArray的位置的块,并进行内插,由此生成预测图像predSamples。
图17是表示视点合成预测部3094的结构的方框图。视点合成预测部3094由视差阵列导出部30941、和参考图像获取部30942构成。
视差阵列导出部30941在VSP模式标志VspModeFlag为1的情况下,以子块单位导出视差阵列disparitySampleArray。
具体来说,首先,视差阵列导出部30941从参考图片存储器306读出深度图像refDepPels,所述深度图像refDepPels是具有与解码对象图片相同的POC且与位移向量所示的层图像的层IDRefViewIdx相同的层ID。此外,读出的深度图像refDepPels的层可以是与参考图片索引refIdxLX所示的参考图片相同的层,也可以是与解码对象的图像相同的层。
接下来,视差阵列导出部30941通过
xTL=xP+((mvDisp[0]+2)>>2)
yTL=yP+((mvDisp[1]+2)>>2)
的数式导出使对象块的左上方的坐标(xP、yP)偏离位移向量MvDisp的坐标(xTL、yTL)。此外,mvDisp[0]、mvDisp[1]分别是位移向量MvDisp的x分量和Y分量。导出的坐标(xTL、yTL)表示与深度图像refDepPels上的对象块对应的块的坐标。
视点合成预测部3094根据对象块(预测单元)的尺寸(宽度nPSW×高度nPSH)进行子块分割。
图12是在比较例的情况下说明预测单元的子块分割的图。在比较例的情况下,在预测单元的宽度nPSW和高度nPSH两方均大于4的情况下,将分割标志splitFlag设为1,否则设为0。在分割标志splitFlag为0的情况下,不对预测块进行分割,而直接将预测块作为子块。在分割标志splitFlag为1的情况下,以构成预测单元的8×8块单位,决定是将子块的尺寸设为8×4,还是设为4×8。
图12表示在非矩形分割(AMP)块中,对16×4、16×12的预测块进行视差合成预测时的示例。如图12所示,在16×4的情况下,由于纵值不比4大,因此,不进行分割,子块尺寸为16×4。在16×12的情况下,以8×8单位分割成子块。在附图中表示选择了4×8的子块的情况。在该情况下,在将16×4分割成8×8时,在下面的8×8中,导出位移的单位的子块(4×8)、和预测单元(16×12)的通用部分成为4×4块。因此,有可能使用以子块导出的位移进行4×4单位的运动位移预测(运动预测)。在4×4的小块的运动位移预测中,与以大块进行运动位移预测时相比,需要更多的运算量。
本实施方式的视点合成预测部3094在预测单元的高度或者宽度为8的倍数以外的情况下,将分割标志splitFlag设为0,否则将其设为1。
具体来说,首先,视点合成预测部3094通过
splitFlag=((nPSW%8)==0&&(nPSH%8)==0)?1:0
的数式导出分割标志splitFlag。在此,nPSW%8是预测单元的宽度8的剩余,在预测单元的宽度为8的倍数以外的情况下为真(1)。nPSH%8为预测单元的高度8的剩余,在预测单元的高度为8的倍数以外的情况下为真(1)。
接下来,视差阵列导出部30941通过
nSubBlkW=splitFlag?8:nPSW
nSubBlkH=splitFlag?8:nPSH
的数式导出子块的宽度nSubBlkW和高度nSubBlkH。即,在分割标志为0的情况下(预测单元的纵值或者横值为8的倍数以外的情况下),对子块的宽度nSubBlkW和高度nSubBlkH分别设定预测单元的宽度nPSW和高度nPSH。在分割标志为1的情况下(预测单元的纵值和横值为8的倍数的情况下),将子块的宽度和高度设定为8。
接下来,视差阵列导出部30941通过对对象块内的全部子块的每一个,将以块的左上方像素为原点时的子块的宽度nSubBlkW和高度nSubBlkH、分割标志splitFlag、深度图像refDepPels、对应块的坐标(xTL、yTL)、参考图片索引refIdxLX所示的参考图片所属层的层IDrefViewIdx、输出到深度DV导出部351,从深度DV导出部351获取视差阵列disparitySampleArray。视差阵列导出部30941将导出的视差阵列disparitySampleArray输出到参考图像获取部30942。
(深度DV导出部351)
深度DV导出部351使用:熵解码部301中从编码数据解码的深度DV转换表DepthToDisparityB、从帧间预测参数解码部303得到的、子块的宽度nSubBlkW和高度nSubBlkH、分割标志splitFlag、深度图像refDepPels、深度图像refDepPels上的对应块的坐标(xTL、yTL)、层IdrefViewIdx,通过以下的处理,导出视差阵列disparitySamples,所述视差阵列disparitySamples是来源于深度的位移向量的水平分量。
深度DV导出部351对将构成块(预测单元)的子块进一步分割的子子块,使用多个子子块的角部和其附近的点,导出深度的代表值maxDep。此外,预测单元和子子块也可以具有相同的尺寸。具体来说,首先,深度DV导出部351对子子块的宽度nSubSubBlkW和高度nSubSubBlkH进行决定。在分割标志splitFlag为1的情况下(在此,预测单元的纵值和横值为8的倍数的情况下),在将子块的左上端的坐标的深度图像的像素值设定为refDepPelsP0,将右上端的像素值设定为refDepPelsP1,将左下端的像素值设定为refDepPelsP2,将右下端的像素值设定为refDepPelsP3的情况下,判断
horSplitFlag=(refDepPelsP0>refDepPelsP3)==(refDepPelsP1>refDepPelsP2)
的条件式(horSplitFlag)是否成立。
接下来,深度DV导出部351使用
nSubSubBlkW=horSplitFlag?nSubBlkW:(nSubBlkW>>1)
nSubSubBlkH=horSplitFlag?(nSubBlkH>>1):nSubBlkH
的数式设定子子块的宽度nSubSubBlkW和高度nSubSubBlkH。即,在条件式(horSplitFlag)成立的情况下,将子子块的宽度nSubSubBlkW设定为子块的宽度nSubBlkW,将子子块的高度nSubSubBlkH设定为子块的高度nSubBlkH的一半。在条件式(horSplitFlag)不成立的情况下,将子子块的宽度nSubSubBlkW设定为子块的宽度nSubBlkW的一半,将子子块的高度nSubSubBlkH设定为子块的高度nSubBlkH。
在分割标志splitFlag为1的情况下,由于子块的宽度和高度为8,因此,子子块成为4×8或者8×4。
另外,深度DV导出部351在分割标志splitFlag为0的情况下(此处为预测单元的纵值或者横值为8的倍数以外的情况下),使用
nSubSubBlkW=nSubBlkW(=nPSW)
nSubSubBlkH=nSubBlkH(=nPSH)
的数式设定子子块的宽度nSubSubBlkW和高度nSubSubBlkH。即,子子块的宽度nSubSubBlkW和高度nSubSubBlkH设定为与子块相同的宽度nSubBlkW和高度nSubBlkH。在该情况下,如上所述,预测块成为保持此状态的子子块。
接下来,深度DV导出部351在将子子块的左上方的相对坐标设为(xSubB、ySubB)的情况下,使用
xP0=Clip3(0,pic_width_in_luma_samples-1,xTL+xSubB)
yP0=Clip3(0,pic_height_in_luma_samples-1,yTL+ySubB)
xP1=Clip3(0,pic_width_in_luma_samples-1,xTL+xSubB+nSubSubBlkW-1)
yP1=Clip3(0,pic_height_in_luma_samples-1,yTL+ySubB+nSubSubBlkH-1)
的数式设定子子块的左端的X坐标xP0、右端的X坐标xP1、上端的Y坐标yP0、下端的Y坐标yP1。此外,pic_width_in_luma_samples和pic_height_in_luma_samples分别表示图像的宽度和高度。
接下来,深度DV导出部351导出子子块的深度的代表值。具体来说,通过
maxDep=0
maxDep=Max(maxDep,refDepPels[xP0][yP0])
maxDep=Max(maxDep,refDepPels[xP0][yP1])
maxDep=Max(maxDep,refDepPels[xP1][yP0])
maxDep=Max(maxDep,refDepPels[xP1][yP1])
的数式导出代表深度值maxDep,所述代表深度值maxDep是子子块的角部和其附近4点的深度图像的像素值refDepPels[xP0][yP0]、refDepPels[xP0][yP1]、refDepPels[xP1][yP0]、refDepPels[xP1][yP1]的最大值。另外,函数Max(x,y)是如第1引数x在第2引数y以上则返回x,否则返回y的函数。
深度DV导出部351使用代表深度值maxDep、深度DV转换表DepthToDisparityB和位移向量(NBDV)MvDisp所示的层的层IdrefViewIdx,对子子块内的像素(x、y)(x取从0到nSubSubBlkW-1的值、y取从0到nSubSubBlkH-1的值),通过
disparitySamples[x][y]=DepthToDisparityB[refViewIdx][maxDep]…(式A)
的数式A导出视差阵列disparitySamples,所述视差阵列disparitySamples是来源于深度的位移向量的水平分量。
深度DV导出部351对子块内的全部子子块实施上述的处理。深度DV导出部351将导出的视差阵列disparitySamples输出到位移向量获取部3036122和视点合成预测部3094。
参考图像获取部30942在VSP模式标志VspModeFlag为1的情况下,从由视差阵列导出部30941输入的视差阵列disparitySampleArray和由帧间预测参数解码部303输入的参考图片索引refIdxLX导出预测块predSamples。
对于对象块中的每一像素,参考图像获取部30942从参考图片索引refIdxLX指定的参考图片refPic提取出使x坐标从该像素的坐标偏离了对应的视差阵列disparitySampleArray的值的位置的像素。考虑视差阵列disparitySampleArray为1/4像素的小数精度,参考图像获取部30942在对象块的左上端的像素的坐标为(xP,yP)且对象块中的各像素的坐标为(xL、yL)(xL取从0到nPbW-1的值,yL取从0到nPbH-1的值)的情况下,通过
xIntL=xP+xL+disparitySamples[xL][yL]
yIntL=yP+yL
xFracL=disparitySamples[xL][yL]&3
xFracL=0
的数式导出从参考图片refPic提取的像素的整数精度的坐标(xInt、yInt)、和与像素(xL、yL)对应的视差阵列disparitySampleArray[xL][yL]的小数部分xFrac、和yFrac。
接下来,参考图像获取部30942对对象块内的各像素进行与参考图像获取部30922相同的内插像素导出处理,将内插像素的集合设为内插块predPartLX。参考图像获取部30942将导出的内插块predPartLX作为预测块predSamples输出到加法部312。
如上所述,本实施方式的图像解码装置31是一种生成对象预测块的预测图像并进行解码的图像解码装置,其具备使用视点合成预测生成预测图像的视点合成预测部,视点合成预测部根据预测块的高度或者宽度是否为8的倍数以外,将预测块分割成子子块,视点合成预测部以子子块单位导出来源于深度的位移。具体来说,视点合成预测部在预测块的高度或者宽度为8的倍数以外的情况下,不分割预测块,而将预测块作为子子块,所述预测块的高度和宽度为8的倍数的情况下,将预测块分割成不足预测块的子子块。
图13是表示本实施方式的视点合成预测部3094的处理的图。在AMP的情况下,在预测块为16×4、16×12时,由于预测块的高度不是8的倍数,因此分割标志成为0。即,子块和子子块成为与预测块相同的大小。结果,位移向量以预测单元单位(此处为16×4、16×12)单位导出。在预测块为4×16、12×16的情况下,由于预测块的宽度不是8的倍数,因此,分割标志成为0。在该情况下,位移向量以预测单元单位(此处为4×16、12×16)单位导出。
图19是表示本实施方式的视点合成预测部3094的处理的图。在AMP的情况下,在预测块的宽度和高度为8的倍数时(图中,为8×32、24×32时),预测块被分割成8×8的子块,进而,以8×8的子块单位分割成8×4或者4×8的子子块。在本实施方式中,由于子子块的边界不会跨过预测单元的边界,因此,不会产生4×4的块。在本实施方式的视点合成预测部3094中,由于与图12的比较例不同,不会出现4×4的块中的处理,因此,能够实现减少处理量的效果。
此外,视点合成预测部在预测块的高度且宽度是8的倍数的情况下,在分割成8×8的子块后,以子块单位分割成8×4或者4×8的子子块。
(视点合成预测部3094的另一结构)
以下,作为本发明的第二实施方式,对作为视点合成预测部的另一结构的视点合成预测部3094′进行说明。
本实施方式的视点合成预测部3094′在AMP分割包含预测块的编码单元的情况下,将分割标志splitFlag设定为1。
splitFlag=(nPSW>2×min(nPSH,nPSW-nPSH))||(nPSH>2×min(nPSW,nPSH-nPSW))?1:0
在分割标志splitFlag为1的情况下,如视点合成预测部3094中说明的那样,以子块的单位分割成4×8或者8×4的子子块。
另一方面,在分割标志splitFlag为0的情况下(此处为AMP的情况下),使用
nSubSubBlkW=nSubBlkW(=nPSW)
nSubSubBlkH=nSubBlkH(=nPSH)
的数式,将子子块的宽度nSubSubBlkW和高度nSubSubBlkH设定为与子块相同的宽度nSubBlkW和高度nSubBlkH。
此外,子子块尺寸也可以获得与以下的处理相同的结果。
视差阵列导出部30941在预测块的宽度比高度的2倍长的情况下(nPSW>nPSH×2)或者预测块的高度比宽度的2倍长的情况(nPSH>nPSW×2)下,使用
nSubSubBlkW=nSubBlkW(=nPSW)
nSubSubBlkH=nSubBlkH(=nPSH)
的数式,子子块的宽度nSubSubBlkW和高度nSubSubBlkH设定为与子块相同的宽度nSubBlkW和高度nSubBlkH。
以上的结构的视点合成预测部根据所述预测块是否为AMP块,将预测块分割为子块。具体来说,视点合成预测部在所述预测块为AMP块的情况下,将子子块作为预测块。
图13是表示本实施方式的视点合成预测部3094′的处理图。在包含预测块的编码单元(CU)的尺寸为16的情况下、即,预测块的尺寸为16×4、16×12、4×16、12×16的情况下,与视点合成预测部3094的处理相同。
图22是表示包含预测块的编码单元(CU)的尺寸比16大时的本实施方式的视点合成预测部3094′的处理的图。在AMP的情况下,在预测块的宽度和高度为8的倍数的情况下(图中,为8×32、24×32的情况下),在视点合成预测部3094′中也不分割预测块。即,子子块的尺寸与预测块相同(图中,为8×32、24×32)。
视点合成预测部3094′中,在AMP的情况下,由于子子块与预测块的尺寸相同,因此,子子块的边界不会跨过预测单元的边界,不会产生4×4的块。在本实施方式的视点合成预测部3094中,由于与图12的比较例不同,不会产生4×4的块中的处理,因此,能够起到降低处理量的效果。
(视点合成预测部3094的另一结构)
以下,作为本发明的第三实施方式,对作为视点合成预测部的另一结构的视点合成预测部3094B进行说明。
本实施方式的视点合成预测部3094B在视点合成预测的情况下,将分割标志splitFlag设定为1。
splitFlag=1
虽然无论是预测单元与子块和子子块具有相同的尺寸的情况下(不分割的情况下)还是与预测单元不具有相同的尺寸的情况下(分割的情况下),为了将来源于深度的位移向量的导出作为通用处理,均将分割标志splitFlag设为了1,但在分离处理的情况下,也可以通过如下方式导出分割标志splitFlag。
splitFlag=(!(nPSW%8)&&!(nPSH%8))?1:0
接下来,视差阵列导出部30941使用
nSubBlkW=(!(nPSW%8)&&!(nPSH%8))?8:nPSW
nSubBlkH=(!(nPSW%8)&&!(nPSH%8))?8:nPSH
的数式,导出子块的宽度nSubBlkW和高度nSubBlkH。
即,在预测单元的高度或者宽度为8的倍数以外的情况下,对子块的宽度nSubBlkW和高度nSubBlkH分别设定预测单元的宽度nPSW和高度nPSH。在预测单元的高度和宽度为8的倍数的情况下,将子块的宽度和高度设定为8。
视差阵列导出部30941首先,使用
nSubSubBlkW=nSubBlkW
nSubSubBlkH=nSubBlkH
的数式,将子子块的宽度nSubSubBlkW和高度nSubSubBlkH设定为与子块相同的宽度nSubBlkW和高度nSubBlkH。
视差阵列导出部30941在预测单元的高度为8的倍数以外的情况下(nPSH%8为真的情况下),按照
nSubSubBlkW=8
nSubSubBlkH=4
的数式,将子子块的宽度nSubSubBlkW设定为8,将子子块的高度nSubSubBlkH设定为4。
除此之外,视差阵列导出部30941在预测单元的宽度为8的倍数以外的情况下(nPSW%8为真的情况下),按照
nSubSubBlkW=4
nSubSubBlkH=8
的数式,将子子块的宽度nSubSubBlkW设定为4,将子子块的高度nSubSubBlkH设定为8。
除此以外的情况下,在预测单元的高度和宽度为8的倍数的情况下,视差阵列导出部30941在将子块的左上端的坐标的深度图像的像素值设定为refDepPelsP0,右上端的像素值设定为refDepPelsP1,左下端的像素值设定为refDepPelsP2,右下端的像素值设定为refDepPelsP3的情况下,判断
horSplitFlag=(refDepPelsP0>refDepPelsP3)==(refDepPelsP1>refDepPelsP2)
的条件式(horSplitFlag)是否成立。
接下来,视差阵列导出部30941使用
nSubSubBlkW=horSplitFlag?nSubSubBlkW:(nSubSubBlkW>>1)
nSubSubBlkH=horSplitFlag?(nSubSubBlkH>>1):nSubSubBlkH
的数式,设定子子块的宽度nSubSubBlkW和高度nSubSubBlkH。即,在条件式(horSplitFlag)成立的情况下,将子子块的宽度nSubSubBlkW设定为子块的宽度nSubBlkW,将子子块的高度nSubSubBlkH设定为子块的高度nSubBlkH的一半。在条件式(horSplitFlag)不成立的情况下,将子子块的宽度nSubSubBlkW设定为子块的宽度nSubBlkW的一半,将子子块的高度nSubSubBlkH设定为子块的高度nSubBlkH。
由于子块的宽度和高度为8,因此,子子块成为4×8或者8×4。
图23是表示包含预测块的编码单元(CU)的尺寸为16的情况下的本实施方式的视点合成预测部3094B的处理的图。在AMP的情况下,在预测块为16×4、16×12时,由于预测块的高度不是8的倍数,因此,预测块被分割成8×4的子子块,以该单位进行来源于深度的位移向量的导出。在预测块为4×16、12×16的情况下,由于预测块的宽度不是8的倍数,因此,预测块被分割成4×8的子子块,以该单位进行来源于深度的位移向量的导出。
图19是表示包含预测块的编码单元(CU)的尺寸比16大时的本实施方式的视点合成预测部3094B的处理的图。在视点合成预测部3094B的结构中,也由于与图12的比较例不同,不会产生4×4的块中的处理,因此,能够起到降低处理量的效果。
在以上的结构中,视点合成预测部在预测块的纵值为8的倍数以外的情况下,将所述预测块分割成8×4的子块,在预测块的横值为8的倍数以外的情况下,将预测块分割成4×8的子块。
(视点合成预测部3094的另一结构)
以下,作为本发明的第四实施方式,对作为视点合成预测部的另一结构的视点合成预测部3094B′进行说明。
视差阵列导出部30941在AMP的情况下(例如nPSW>2×min(nPSH,nPSW-nPSH)的情况下)且预测块的宽度比高度长的情况(nPSW>nPSH)下,按照
nSubSubBlkW=8
nSubSubBlkH=4
的数式,将子子块的宽度nSubSubBlkW设定为8,将子子块的高度nSubSubBlkH设定为4。
除此之外,视差阵列导出部30941在AMP的情况下(例如nPSH>2×min(nPSW,nPSH-nPSW)的情况下)且预测块的高度比宽度长的情况(nPSH>nPSW)下,按照
nSubSubBlkW=4
nSubSubBlkH=8
的数式,将子子块的宽度nSubSubBlkW设定为4,将子子块的高度nSubSubBlkH设定为8。
的数式,将子子块的宽度nSubSubBlkW设定为4,将子子块的高度nSubSubBlkH设定为8。
图23是表示包含预测块的编码单元(CU)的尺寸为16时的本实施方式的视点合成预测部3094B′的处理的图。在预测块为16×4、16×12时,在AMP的情况下,由于宽度比高度大,因此,预测块被分割成8×4的子子块,以该单位进行来源于深度的位移向量的导出。在预测块为4×16、12×16时,在AMP的情况下,由于高度比宽度大,因此,预测块被分割成4×8的子子块,以该单位进行来源于深度的位移向量的导出。该处理与视点合成预测部3094B时相同。
图24是表示包含预测块的编码单元(CU)的尺寸比16大时的本实施方式的视点合成预测部3094B′的处理的图。在视点合成预测部3094B′中,在编码单元(CU)的尺寸比16大时,在AMP的情况下,也根据预测单元的尺寸固定地进行分割。图中,在预测块为8×32、24×32时,在AMP的情况下,由于高度比宽度大,预测块被分割成4×8的子子块,以该单位,进行来源于深度的位移向量的导出。
在视点合成预测部3094B′中,在AMP的情况下,根据预测块的尺寸分割成子子块。具体来说,视点合成预测部在所述预测块为AMP块且所述预测块的宽度比高度长的情况下,将所述预测块分割成8×4的子块,在所述预测块为AMP块且所述预测块的高度比宽度长情况下,将所述预测块分割成4×8的子块。因此,子子块的边界不会跨过预测单元的边界,不会产生4×4的块。本实施方式的视点合成预测部3094B′中,由于图12的比较例不同,不会产生4×4的块中的处理,因此,能够起到降低处理量的效果。
(图像编码装置的结构)
接下来,对本实施方式的图像编码装置11的结构进行说明。图20是表示本实施方式的图像编码装置11的结构的方框图。图像编码装置11包含预测图像生成部101、减法部102、DCT/量化部103、熵编码部104、逆量化/逆DCT部105、加法部106、预测参数存储器(预测参数存储部、帧存储器)108、参考图片存储器(参考图像存储部、帧存储器)109、编码参数决定部110、预测参数编码部111、残差收纳部313(残差记录部)构造而成。预测参数编码部111包含帧间预测参数编码部112及帧内预测参数编码部113构造而成。
预测图像生成部101对从外部输入的层图像T的每一视点的各图片,对作为分割该图片的区域的每块,生成预测图片块predSmaples。在此,预测图像生成部101基于从预测参数编码部111输入的预测参数,从参考图片存储器109读出参考图片块。从预测参数编码部111输入的预测参数例如是运动向量或位移向量。预测图像生成部101读出:处于以编码对象块为起点预测的运动向量或位移向量所示的位置的块的参考图片块。预测图像生成部101对于读出的参考图片块使用多个预测方式中的一种预测方式生成预测图片块predSmaples。预测图像生成部101将生成的预测图片块predSmaples输出到减法部102和加法部106。此外,预测图像生成部101由于为与已经说明的预测图像生成部308相同的动作,因此,省略对预测图片块predSmaples的生成的详细说明。
预测图像生成部101为了选择预测方式,例如选择如下的预测方式,将基于层图像中包含的块的每一像素的信号值和预测图片块predSmaples的对应的每一像素的信号值的差分的误差值设为最小。此外,选择预测方式的方法不限于此。
在编码对象的图片为基底视图的图片的情况下,多个预测方式为帧内预测、运动预测及合并模式。运动预测为上述的帧间预测中、显示时刻间的预测。合并模式是与使用处于由已经编码的块即编码对象块预先确定的范围内的块相同的参考图片块及预测参数的预测。在编码对象的图片为基底视图以外的图片的情况下,多个预测方式是帧内预测、运动预测、合并模式(包含视点合成预测)、及位移预测。位移预测(视差预测)是上述的帧间预测中,其它层图像(其它视点图像)间的预测。有对位移预测(视差预测)进行追加预测(残差预测和照度补偿)时和不进行追加预测时的预测。
预测图像生成部101在选择了帧内预测的情况下,将表示生成预测图片块predSmaples时使用的帧内预测模式的预测模式predMode输出到预测参数编码部111。
预测图像生成部101在选择了运动预测的情况下,将生成预测图片块predSmaples时使用的运动向量mvLX存储在预测参数存储器108内,并输出到帧间预测参数编码部112。运动向量mvLX表示从编码对象块的位置至生成预测图片块predSmaples时的参考图片块的位置的向量。在表示运动向量mvLX的信息中含有表示参考图片的信息(例如,参考图片索引refIdxLX、图片顺序编号POC),也可以是表示预测参数的信息。另外,预测图像生成部101将表示帧间预测模式的预测模式predMode输出到预测参数编码部111。
预测图像生成部101在选择了位移预测的情况下,将生成预测图片块predSmaples时使用的位移向量存储在预测参数存储器108中,并输出到帧间预测参数编码部112。位移向量dvLX表示从编码对象块的位置至生成预测图片块predSmaples时的参考图片块的位置的向量。在表示位移向量dvLX的信息中,包含表示参考图片的信息(例如,参考图片索引refIdxLX、视图IDview_id),也可以是表示预测参数的信息。另外,预测图像生成部101将表示帧间预测模式的预测模式predMode输出到预测参数编码部111。
预测图像生成部101在选择了合并模式的情况下,将表示选择的参考图片块的合并索引merge_idx输出到帧间预测参数编码部112。另外,预测图像生成部101将表示合并模式的预测模式predMode输出到预测参数编码部111。
在上述的合并模式中,预测图像生成部101在表示VSP模式标志VspModeFlag进行视点合成预测的情况下,如已经说明的那样,在预测图像生成部101中包含的视点合成预测部3094中进行视点合成预测。另外,在运动预测、位移预测、合并模式中,预测图像生成部101在表示残差预测实施标志resPredFlag进行残差预测的情况下,如已经说明的那样,在预测图像生成部101中包含的残差预测部3092中进行残差预测。
对每一像素,减法部102从由外部输入的层图像T的对应的块的信号值减去由预测图像生成部101输入的预测图片块predSmaples的信号值,生成残差信号。减法部102将生成的残差信号输出到DCT/量化部103和编码参数决定部110。
DCT/量化部103对由减法部102输入的残差信号进行DCT,计算出DCT系数。DCT/量化部103对计算出的DCT系数进行量化,求出量化系数。DCT/量化部103将求出的量化系数输出到熵编码部104和逆量化/逆DCT部105。
在熵编码部104,从DCT/量化部103输入量化系数,从编码参数决定部110输入编码参数。输入的编码参数例如有:参考图片索引refIdxLX、向量索引mvp_LX_idx、差分向量mvdLX、预测模式predMode、合并索引merge_idx、残差预测权重索引iv_res_pred_weight_idx、及照度补偿标志ic_flag等代码。
熵编码部104将输入的量化系数和编码参数进行熵编码,生成编码流Te,并将生成的编码流Te输出到外部。
逆量化/逆DCT部105对从DCT/量化部103输入的量化系数进行逆量化,求出DCT系数。逆量化/逆DCT部105对求出的DCT系数进行逆DCT,计算出编码残差信号。逆量化/逆DCT部105将计算出的解码残差信号输出到加法部106、残差收纳部313、及编码参数决定部110。
对每一像素,加法部106将从预测图像生成部101输入的预测图片块predSmaples的信号值和从逆量化/逆DCT部105输入的编码残差信号的信号值相加,生成参考图片块。加法部106将生成的参考图片块存储到参考图片存储器109中。
预测参数存储器108将预测参数编码部11l生成的预测参数存储到编码对象的图片及每块中预先确定的位置。
参考图片存储器109将加法部106生成的参考图片块存储到编码对象的图片及每块中预先确定的位置。
编码参数决定部110选择编码参数多个集合中的一个集合。编码参数是成为上述的预测参数和与该预测参数关联生成的编码的对象的参数。预测图像生成部101分别使用这些编码参数的集合生成预测图片块predSmaples。
编码参数决定部110对多个集合中的每一个计算出表示信息量的大小和编码误差的成本值。成本值例如是代码量和平方误差与系数λ相乘的值的和。代码量是对量化误差和编码参数进行熵编码而得到的编码流Te的信息量。平方误差是关于减法部102中计算出的残差信号的残差值的平方值的像素间的总和。系数λ是预先设定的比零大的实数。编码参数决定部110选择计算出的成本值成为最小的编码参数的集合。由此,熵编码部104将选择的编码参数的集合作为编码流Te输出到外部,不输出未选择的编码参数的集合。
预测参数编码部111导出基于由预测图像生成部101输入的参数生成预测图片时使用的预测参数,对导出的预测参数进行编码,生成编码参数的集合。预测参数编码部111将生成的编码参数的集合输出到熵编码部104。
预测参数编码部111将生成的编码参数的集合中与编码参数决定部110选择的集合对应的预测参数存储在预测参数存储器108中。
预测参数编码部111在由预测图像生成部101输入的预测模式predMode表示帧间预测模式的情况下,使帧间预测参数编码部112动作。预测参数编码部111在预测模式predMode表示帧内预测模式的情况下,使帧内预测参数编码部113动作。
帧间预测参数编码部112基于从编码参数决定部110输入的预测参数导出帧间预测参数。帧间预测参数编码部112作为导出帧间预测参数的结构,包含与帧间预测参数解码部303(参考图5等)导出帧间预测参数的结构相同的结构。关于帧间预测参数编码部112的结构,如后所述。
帧内预测参数编码部113决定由编码参数决定部110输入的预测模式predMode所示的帧内预测模式IntraPredMode作为帧间预测参数的集合。
(帧间预测参数编码部的结构)
接下来,对帧间预测参数编码部112的结构进行说明。帧间预测参数编码部112是与帧间预测参数解码部303对应的机构。
图21是表示本实施方式的帧间预测参数编码部112的结构的概略图。
帧间预测参数编码部112包含:合并模式参数导出部1121、AMVP预测参数导出部1122、减法部1123、及帧间预测参数编码控制部1126构造而成。
合并模式参数导出部1121具有与上述的合并模式参数导出部3036(参考图7)相同的结构。
AMVP预测参数导出部1122具有与上述的AMVP预测参数导出部3032(参考图7)相同的结构。
减法部1123从由编码参数决定部110输入的向量mvLX减去由AMVP预测参数导出部1122输入的预测向量mvpLX,生成差分向量mvdLX。差分向量mvdLX输出到帧间预测参数编码控制部1126。
帧间预测参数编码控制部1126对熵编码部104指示与帧间预测相关联的代码(语法元素)的解码,使编码数据中包含的代码(语法元素)编码例如分割模式part_mode、合并标志merge_flag、合并索引merge_idx、帧间预测标志inter_pred_idc、参考图片索引refIdxLX、预测向量索引mvp_LX_idx、差分向量mvdLX。
帧间预测参数编码控制部1126包含:追加预测标志编码部10311、合并索引编码部10312、向量候补索引编码部10313、以及分割模式编码部、合并标志编码部、帧间预测标志编码部、参考图片索引编码部、向量差分编码部构造而成。分割模式编码部、合并标志编码部、合并索引编码部、帧间预测标志编码部、参考图片索引编码部、向量候补索引编码部10313、向量差分编码部分别编码分割模式part_mode、合并标志merge_flag、合并索引merge_idx、帧间预测标志inter_pred_idx、参考图片索引refIdxLX、预测向量索引mvp_LX_idx、差分向量mvdLX。
追加预测标志编码部10311为了表示是否进行追加预测,编码照度补偿标志ic_flag、残差预测权重索引iv_res_pred_weight_idx。
帧间预测参数编码控制部1126在从预测图像生成部101输入的预测模式predMode表示合并模式的情况下,将从编码参数决定部110输入的合并索引merge_idx输入熵编码部104并使其编码。
另外,帧间预测参数编码控制部1126在从预测图像生成部101输入的预测模式predMode表示帧间预测模式的情况下,进行如下的处理。
帧间预测参数编码控制部1126对从编码参数决定部110输入的参考图片索引refIdxLX和向量索引mvp_LX_idx、从减法部1123输入的差分向量mvdLX进行整合。帧间预测参数编码控制部1126将整合的代码输入熵编码部104并使其编码。在以上的图像编码装置中,作为视点合成预测部,具备视点合成预测部3094。在视点合成预测部3094中,在预测块的高度为8的倍数以外的情况下,将预测块分割成8×4的子子块,在预测块的宽度为8的倍数以外的情况下,将预测块分割成4×8的子子块。在视点合成预测部3094中,子子块的边界不会跨过预测单元的边界,不会产生4×4的块。在本实施方式的视点合成预测部3094中,由于与图12的比较例不同,不会产生4×4的块中的处理,因此,能够起到降低处理量的效果。
(图像编码装置的另一结构)
在图像编码装置的另一结构中,作为视点合成预测部,具备视点合成预测部3094′。如已经说明的那样,在视点合成预测部3094′中,子子块的边界不会跨过预测单元的边界,不会产生4×4的块。在本实施方式的视点合成预测部3094中,由于图12的比较例不同,不会产生4×4的块中的处理,因此,能够起到降低处理量的效果。
(图像编码装置的再一结构)
在图像编码装置的另一结构中,作为视点合成预测部,具备视点合成预测部3094B。如已经说明的那样,在视点合成预测部3094B中,子子块的边界不会跨过预测单元的边界,不会产生4×4的块。在本实施方式的视点合成预测部3094中,由于与图12的比较例不同,不会产生4×4的块中的处理,因此,能够起到降低处理量的效果。
(图像编码装置的再一结构)
在图像编码装置的另一结构中,作为视点合成预测部,具备视点合成预测部3094B′。如已经说明的那样,在视点合成预测部3094B′中,子子块的边界不会跨过预测单元的边界,不会产生4×4的块。在本实施方式的视点合成预测部3094中,由于与图12的比较例不同,不会产生4×4的块中的处理,因此,能够起到降低处理量的效果。
此外,上述实施方式中的图像编码装置11、图像解码装置31的一部分,例如,熵解码部301、预测参数解码部302、预测图像生成部101、DCT/量化部103、熵编码部104、逆量化/逆DCT部105、编码参数决定部110、预测参数编码部111、熵解码部301、预测参数解码部302、预测图像生成部308、逆量化/逆DCT部311也可以用计算机实现。在该情况下,也可以通过将用于实现该控制功能的程序记录在计算机可读取的记录介质内,将该记录介质中记录的程序读入计算机系统并执行来实现。此外,此处所说的“计算机系统”是内置于图像编码装置11、图像解码装置31中的任一个的计算机系统,其包含OS、外围设备等硬件。另外,“计算机可读取的记录介质”是指:软盘、磁光盘、ROM、CD-ROM等便携式介质、内置在计算机系统内的硬盘等存储装置。进而,“计算机可读取的记录介质”也可以包含:如经由因特网等网络、电话线等通信线路发送程序时的通讯线那样,短时间、动态地保持程序的记录介质;如成为该情况下的服务器、客户端的计算机系统内部的易失性存储器那样,保持程序一定时间的记录介质。另外,上述程序也可以是用于实现上述一部分功能的程序,也可以是通过与已经记录在计算机系统中的程序的组合能够实现上述功能的程序。
另外,也可以将上述实施方式中的图像编码装置11、图像解码装置31的一部分或全部作为LSI(LargeScaleIntegration)等集成电路实现。图像编码装置11、图像解码装置31的各功能块可以单独进行处理器化,也可以集成一部分或全部进行处理器化。另外,集成电路化的方法不限于LSI,也可以由专用电路、或通用处理器实现。另外,在通过半导体技术的进步出现了代替LSI的集成电路化的技术的情况下,也可以使用利用该技术的集成电路。
以上,参考附图对该发明的一实施方式详细地进行了说明,但具体结构不限于上述说明,在不脱离该发明的主旨的范围内能够进行各种各样的设计变更等。
本发明不限于上述各实施方式,在权利要求书所示的范围内,能够进行各种变更,适当组合不同的实施方式中分别公开的技术手段而得到的实施方式也包含在本发明的技术范围内。进而,通过组合各实施方式中分别公开的技术手段,能够形成新的技术特征。
〔附注事项〕
(1)该发明为了解决上述课题而研发,本发明的一方面是一种生成对象预测块的预测图像并进行解码的图像解码装置,具备使用视点合成预测生成预测图像的视点合成预测部,所述视点合成预测部根据所述预测块的高度或者宽度是否为8的倍数以外的情况,将所述预测块分割成子块,所述视点合成预测部以所述子块单位导出来源于深度的位移。
(2)另外,本发明的另一方面,根据(1)所述的图像解码装置,所述视点合成预测部在所述预测块的高度或者宽度为8的倍数以外的情况下,不分割所述预测块,将所述预测块作为子块,在所述预测块的高度和宽度为8的倍数的情况下,将所述预测块分割成不足所述预测块的子块。
(3)另外,本发明的另一方面,根据(1)所述的图像解码装置,所述视点合成预测部在所述预测块的高度为8的倍数以外的情况下,将所述预测块分割成8×4的子块,在所述预测块的宽度为8的倍数以外的情况下,将所述预测块分割成4×8的子块。
(4)另外,本发明的另一方面,根据(1)所述的图像解码装置,所述视点合成预测部根据所述预测块是否为AMP块,将所述预测块分割成子块。
(5)另外,本发明的另一方面,根据(4)所述的图像解码装置,所述视点合成预测部在所述预测块为AMP块且所述预测块的宽度比高度长的情况下,将所述预测块分割成8×4的子块,在所述预测块为AMP块且所述预测块的高度比宽度长情况下,将所述预测块分割成4×8的子块。
(6)另外,本发明的另一方面,根据(1)~(5)所述的图像解码装置,所述视点合成预测部在预测块的高度和宽度为8的倍数的情况下,分割成8×4或者4×8的子块。
(7)另外,本发明的另一方面是一种生成对象预测块的预测图像并进行解码的图像编码装置,其具备使用视点合成预测生成预测图像的视点合成预测部,所述视点合成预测部根据预测块的高度或者宽度是否为8的倍数以外的情况,将所述预测块分割成子块,所述视点合成预测部以所述子块单位导出来源于深度的位移。
产业上的可利用性
本发明能够合适地应用到对编码了图像数据的编码数据进行解码的图像解码装置、以及生成编码了图像数据的编码数据的图像编码装置。另外,能够合适地应用到由图像编码装置生成并由图像解码装置参考的编码数据的数据结构。
符号说明
1…图像传输系统
11…图像编码装置
101…预测图像生成部
102…减法部
103…DCT/量化部
10311…追加预测标志编码部
10312…合并索引编码部
10313…向量候补索引编码部
104…熵编码部
105…逆量化/逆DCT部
106…加法部
108…预测参数存储器(帧存储器)
109…参考图片存储器(帧存储器)
110…编码参数决定部
111…预测参数编码部
112…帧间预测参数编码部
1121…合并模式参数导出部
1122…AMVP预测参数导出部
1123…减法部
1126…帧间预测参数编码控制部
113…帧内预测参数编码部
21…网络
31…图像解码装置
301…熵解码部
302…预测参数解码部
303…帧间预测参数解码部
3031…帧间预测参数解码控制部
30311…残差预测索引解码部
303111…参考层判断部
30312…合并索引解码部
30313…向量候补索引解码部
3032…AMVP预测参数导出部
3035…加法部
3036…合并模式参数导出部
30361…合并候补导出部
303611…合并候补收纳部
303612…扩展合并候补导出部
3036121…层间合并候补导出部
3036122…位移向量获取部
3036123…位移合并候补导出部
303613…基本合并候补导出部
3036131…空间合并候补导出部
3036132…时间合并候补导出部
3036133…结合合并候补导出部
3036134…零合并候补导出部
30362…合并候补选择部
304…帧内预测参数解码部
306…参考图片存储器(帧存储器)
307…预测参数存储器(帧存储器)
308…预测图像生成部
309…帧间预测图像生成部
3091…运动位移补偿部
3092…残差预测部
30921…残差预测实施标志导出部
30922…参考图像获取部
30923…残差合成部
3093…照度补偿部
3094…视点合成预测部
310…帧内预测图像生成部
311…逆量化/逆DCT部
312…加法部
313…残差收纳部
41…图像显示装置
Claims (4)
1.一种图像解码装置,其生成预测块的预测图像并进行解码,其特征在于,
具备生成用于视点合成预测的位移的视点合成预测部,
所述视点合成预测部根据所述预测块的高度或者宽度是否为8的倍数来设定子块尺寸,使用所述子块尺寸并参考深度,导出来源于深度的位移。
2.根据权利要求1所述的图像解码装置,其特征在于,
所述视点合成预测部在所述预测块的高度为8的倍数以外的情况下,将所述子块尺寸设定为8×4,在所述预测块的宽度为8的倍数以外的情况下,将所述子块尺寸设定为4×8。
3.根据权利要求1所述的图像解码装置,其特征在于,
所述视点合成预测部在所述预测块的高度和宽度为8的倍数的情况下,根据左上端、右上端、左下端、右下端的深度像素,将所述子块尺寸设定为8×4或者4×8。
4.一种图像编码装置,其生成预测块的预测图像并进行解码,其特征在于,
具备生成用于视点合成预测的位移的视点合成预测部,
所述视点合成预测部根据预测块的高度或者宽度是否为8的倍数的情况来设定子块尺寸,使用所述子块尺寸并参考深度,导出来源于深度的位移。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013215160 | 2013-10-16 | ||
JP2013-215160 | 2013-10-16 | ||
PCT/JP2014/077454 WO2015056719A1 (ja) | 2013-10-16 | 2014-10-15 | 画像復号装置、画像符号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105637872A true CN105637872A (zh) | 2016-06-01 |
CN105637872B CN105637872B (zh) | 2019-01-01 |
Family
ID=52828162
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480056593.1A Expired - Fee Related CN105637872B (zh) | 2013-10-16 | 2014-10-15 | 图像解码装置、图像编码装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20160277758A1 (zh) |
JP (1) | JPWO2015056719A1 (zh) |
CN (1) | CN105637872B (zh) |
WO (1) | WO2015056719A1 (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019047763A1 (en) * | 2017-09-08 | 2019-03-14 | Mediatek Inc. | METHODS AND APPARATUSES FOR PROCESSING IMAGES IN AN IMAGE OR VIDEO ENCODING SYSTEM |
CN113545038A (zh) * | 2019-03-06 | 2021-10-22 | 北京字节跳动网络技术有限公司 | 依赖于尺寸的帧间编解码 |
US11843725B2 (en) | 2018-11-12 | 2023-12-12 | Beijing Bytedance Network Technology Co., Ltd | Using combined inter intra prediction in video processing |
US11889108B2 (en) | 2018-10-22 | 2024-01-30 | Beijing Bytedance Network Technology Co., Ltd | Gradient computation in bi-directional optical flow |
US11930165B2 (en) | 2019-03-06 | 2024-03-12 | Beijing Bytedance Network Technology Co., Ltd | Size dependent inter coding |
US11956465B2 (en) | 2018-11-20 | 2024-04-09 | Beijing Bytedance Network Technology Co., Ltd | Difference calculation based on partial position |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017520994A (ja) * | 2014-06-20 | 2017-07-27 | 寰發股▲ふん▼有限公司HFI Innovation Inc. | 3dおよびマルチビュービデオコーディングのサブpu構文シグナリングおよび照明補償方法 |
EP3270593A4 (en) * | 2015-03-13 | 2018-11-07 | LG Electronics Inc. | Method of processing video signal and device for same |
WO2018070661A1 (ko) * | 2016-10-11 | 2018-04-19 | 엘지전자 주식회사 | 영상 코딩 시스템에서 인트라 예측에 따른 영상 디코딩 방법 및 장치 |
KR102446445B1 (ko) * | 2017-07-06 | 2022-09-22 | 삼성전자주식회사 | 영상 부호화 방법 및 장치, 영상 복호화 방법 및 장치 |
US11252315B2 (en) * | 2017-08-04 | 2022-02-15 | Sony Interactive Entertainment Inc. | Imaging apparatus and information processing method |
CN118301325A (zh) * | 2018-07-04 | 2024-07-05 | 松下电器(美国)知识产权公司 | 编码方法、解码方法、和非暂时性的计算机可读介质 |
WO2021054720A1 (ko) * | 2019-09-16 | 2021-03-25 | 엘지전자 주식회사 | 가중 예측을 이용한 영상 부호화/복호화 방법, 장치 및 비트스트림을 전송하는 방법 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101170702A (zh) * | 2007-11-23 | 2008-04-30 | 四川虹微技术有限公司 | 多视角视频编码方法 |
WO2013103541A1 (en) * | 2012-01-05 | 2013-07-11 | Qualcomm Incorporated | Signaling view synthesis prediction support in 3d video coding |
WO2013115606A1 (ko) * | 2012-02-04 | 2013-08-08 | 엘지전자 주식회사 | 비디오 인코딩 방법, 비디오 디코딩 방법 및 이를 이용하는 장치 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10244253B2 (en) * | 2013-09-13 | 2019-03-26 | Qualcomm Incorporated | Video coding techniques using asymmetric motion partitioning |
-
2014
- 2014-10-15 WO PCT/JP2014/077454 patent/WO2015056719A1/ja active Application Filing
- 2014-10-15 CN CN201480056593.1A patent/CN105637872B/zh not_active Expired - Fee Related
- 2014-10-15 US US15/029,389 patent/US20160277758A1/en not_active Abandoned
- 2014-10-15 JP JP2015542639A patent/JPWO2015056719A1/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101170702A (zh) * | 2007-11-23 | 2008-04-30 | 四川虹微技术有限公司 | 多视角视频编码方法 |
WO2013103541A1 (en) * | 2012-01-05 | 2013-07-11 | Qualcomm Incorporated | Signaling view synthesis prediction support in 3d video coding |
WO2013115606A1 (ko) * | 2012-02-04 | 2013-08-08 | 엘지전자 주식회사 | 비디오 인코딩 방법, 비디오 디코딩 방법 및 이를 이용하는 장치 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019047763A1 (en) * | 2017-09-08 | 2019-03-14 | Mediatek Inc. | METHODS AND APPARATUSES FOR PROCESSING IMAGES IN AN IMAGE OR VIDEO ENCODING SYSTEM |
US10911757B2 (en) | 2017-09-08 | 2021-02-02 | Mediatek Inc. | Methods and apparatuses of processing pictures in an image or video coding system |
US11889108B2 (en) | 2018-10-22 | 2024-01-30 | Beijing Bytedance Network Technology Co., Ltd | Gradient computation in bi-directional optical flow |
US12041267B2 (en) | 2018-10-22 | 2024-07-16 | Beijing Bytedance Network Technology Co., Ltd. | Multi-iteration motion vector refinement |
US11843725B2 (en) | 2018-11-12 | 2023-12-12 | Beijing Bytedance Network Technology Co., Ltd | Using combined inter intra prediction in video processing |
US11956449B2 (en) | 2018-11-12 | 2024-04-09 | Beijing Bytedance Network Technology Co., Ltd. | Simplification of combined inter-intra prediction |
US11956465B2 (en) | 2018-11-20 | 2024-04-09 | Beijing Bytedance Network Technology Co., Ltd | Difference calculation based on partial position |
CN113545038A (zh) * | 2019-03-06 | 2021-10-22 | 北京字节跳动网络技术有限公司 | 依赖于尺寸的帧间编解码 |
CN113545038B (zh) * | 2019-03-06 | 2023-10-24 | 北京字节跳动网络技术有限公司 | 依赖于尺寸的帧间编解码 |
US11930165B2 (en) | 2019-03-06 | 2024-03-12 | Beijing Bytedance Network Technology Co., Ltd | Size dependent inter coding |
Also Published As
Publication number | Publication date |
---|---|
US20160277758A1 (en) | 2016-09-22 |
WO2015056719A1 (ja) | 2015-04-23 |
JPWO2015056719A1 (ja) | 2017-03-09 |
CN105637872B (zh) | 2019-01-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105637872B (zh) | 图像解码装置、图像编码装置 | |
CN104685881B (zh) | 图像解码装置、图像编码装置以及图像解码方法 | |
US10306235B2 (en) | Image decoding apparatus, image coding apparatus, and prediction-vector deriving device | |
JP6469588B2 (ja) | 残差予測装置、画像復号装置、画像符号化装置、残差予測方法、画像復号方法、および画像符号化方法 | |
CN104170389B (zh) | 运动向量预测器的产生方法和装置及视点间运动向量预测器候选的产生方法 | |
JP6360053B2 (ja) | 照度補償装置、画像復号装置、画像符号化装置 | |
JP6441236B2 (ja) | 画像復号装置及び画像符号化装置 | |
CN105379282B (zh) | 用于纹理译码的先进残余预测(arp)的方法和设备 | |
CN109891890A (zh) | 视频译码中基于子pu的双向运动补偿 | |
CN109691106A (zh) | 时间运动向量预测符的偏移向量识别 | |
CN109644272A (zh) | 用于建构候选列表的几何型优先级 | |
CN104904213A (zh) | 可缩放及多视角视频译码中的高级残差预测 | |
CN104412597A (zh) | 用于3d视频编码的统一视差矢量推导的方法及装置 | |
WO2015056620A1 (ja) | 画像復号装置、画像符号化装置 | |
JP6118199B2 (ja) | 画像復号装置、画像符号化装置、画像復号方法、画像符号化方法及びコンピュータ読み取り可能な記録媒体。 | |
WO2015141696A1 (ja) | 画像復号装置、画像符号化装置および予測装置 | |
CN113678455B (zh) | 用于导出双预测的权重索引信息的视频或图像编码 | |
JP2016066864A (ja) | 画像復号装置、画像符号化装置およびマージモードパラメータ導出装置 | |
JP2017135432A (ja) | 視点合成予測装置、画像復号装置及び画像符号化装置 | |
WO2015190510A1 (ja) | 視点合成予測装置、画像復号装置及び画像符号化装置 | |
WO2016056587A1 (ja) | 変位配列導出装置、変位ベクトル導出装置、デフォルト参照ビューインデックス導出装置及びデプスルックアップテーブル導出装置 | |
JP2014204327A (ja) | 画像復号装置および画像符号化装置 | |
JP2015080053A (ja) | 画像復号装置、及び画像符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190101 Termination date: 20211015 |