CN105580361A - 用于深度帧内预测模式的残余译码 - Google Patents

用于深度帧内预测模式的残余译码 Download PDF

Info

Publication number
CN105580361A
CN105580361A CN201480052484.2A CN201480052484A CN105580361A CN 105580361 A CN105580361 A CN 105580361A CN 201480052484 A CN201480052484 A CN 201480052484A CN 105580361 A CN105580361 A CN 105580361A
Authority
CN
China
Prior art keywords
depth
decoding
residual value
block
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201480052484.2A
Other languages
English (en)
Inventor
刘鸿彬
陈颖
张莉
赵欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from PCT/CN2013/001176 external-priority patent/WO2015042751A1/en
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Priority to CN201480052484.2A priority Critical patent/CN105580361A/zh
Priority claimed from PCT/CN2014/087511 external-priority patent/WO2015043501A1/en
Publication of CN105580361A publication Critical patent/CN105580361A/zh
Pending legal-status Critical Current

Links

Abstract

一种视频译码器可执行简化深度译码SDC模式,包含简化残余译码,以根据多种(例如,至少三个)深度帧内预测模式中的任一者对深度块进行译码。举例来说,所述视频译码器可执行所述SDC模式以用于根据深度模型化模式DMM?3、DMM?4或区边界链译码模式对深度块进行译码。在此些实例中,所述视频译码器可分割所述深度块,且对每一分区的相应DC残余值进行译码。在一些实例中,所述视频译码器可执行所述SDC模式以用于根据帧内预测模式(例如,HEVC基础规范帧内预测模式,例如DC帧内预测模式或方向性帧内预测模式中的一者)对深度块进行译码。在此些实例中,所述视频译码器可对所述深度块的单个DC残余值进行译码。

Description

用于深度帧内预测模式的残余译码
技术领域
本发明涉及视频译码和压缩,且更具体地说涉及用于对用于深度帧内预测模式的残余值进行译码的技术。
背景技术
数字视频能力可并入到广泛范围的装置中,包含数字电视机、数字直播系统、无线广播系统、平板计算机、智能电话、个人数字助理(PDA)、膝上型计算机或桌上型计算机、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、视频电话会议装置、机顶盒装置及类似物。数字视频装置实施视频压缩技术,例如描述于以下各者中的那些技术:由MPEG-2、MPEG-4、ITU-TH.263、ITU-TH.264/MPEG-4第10部分高级视频译码(AVC)定义的标准、高效率视频译码(HEVC)标准,及此些标准的扩展。视频装置可更高效地发射、接收和存储数字视频信息。
编码器-解码器(编解码器)应用视频压缩技术以执行空间(图片内)预测和/或时间(图片间)预测以减少或移除视频序列中固有的冗余。对于基于块的视频译码,可将视频切片分割成视频块,视频块还可被称作树块、译码单元(CU)及/或译码节点。使用关于同一图片中的相邻块中的参考样本的空间预测编码图片的经帧内译码(I)切片中的视频块。图片的经帧间编码(P或B)切片中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测或相对于其它参考图片中的参考样本的时间预测。图片替代地可被称为帧。
空间或时间预测导致待译码块的预测性块。残余数据表示待译码原始块与预测性块的间的像素差。经帧间译码块是根据指向形成预测块的参考样本块的运动向量和指示经译码块与预测块之间的差的残余数据编码的。根据帧内译码模式和残余数据来编码经帧内译码块。为了进一步压缩,可将残余数据从空间域变换到变换域,从而产生残余变换系数,接着可对残余变换系数进行量化。可扫描一开始按二维阵列排列的经量化变换系数,以便产生变换系数的一维向量,且可应用熵译码以实现更多压缩。
可(例如)从多个视角编码视图来产生多视图译码位流。多视图译码可允许解码器在不同视图之间选择,或可能再现多个视图。此外,已开发或正在开发的一些三维(3D)视频技术和标准,例如作为HEVC的多视图扩展的3D-HEVC,利用了多视图译码方面。举例来说,不同视图可传输左眼及右眼视图以支持3D视频。一些3D视频译码过程可应用所谓的多视图加深度译码。在多视图加深度译码中,3D视频位流可含有不仅包含纹理视图分量而且包含深度视图分量的多个视图。举例来说,每一视图可包括纹理视图分量和深度视图分量。
发明内容
一般来说,本发明描述用于帧内预测译码3D视频位流的深度数据的技术。更确切地说,根据本发明的一些技术配置的视频译码器可当深度块是根据多种(例如,至少三个)深度帧内预测模式中的任一者经帧内预测译码时执行简化深度译码(SDC)模式以对深度块的一或多个DC残余值进行译码。所述SDC模式包含简化残余译码,其中视频译码器在位流中译码(例如,编码或解码)一或多个DC残余值。所述一或多个DC残余值中的每一者表示(即,可由视频解码器使用以重构)多个深度样本值,例如深度块的深度像素值。对于根据SDC模式的简化残余译码,视频编码器可在一些实例中不变换和/或量化(且视频解码器可不逆量化和/或逆变换)位流中经译码的DC残余值。在一些实例中,为了确定经编码到当前经帧内译码深度块的位流中的DC残余值,视频编码器应用视图合成优化过程以从范围内的DC残余值的候选集合选择DC残余值,所述范围包含根据SDC模式针对经帧内译码深度块所确定的DC残余值。
根据本发明的一些实例技术配置的视频译码器可在经编码视频位流中对语法元素(例如,hevc_intra_flag)进行译码,其指示HEVC帧内预测模式或额外深度帧内预测模式是否用以对当前经帧内译码深度块进行译码。HEVC帧内预测模式可包含平面帧内预测模式、DC帧内预测模式或方向性帧内预测模式。额外深度帧内预测模式可包含多个深度模型化模式(DMM)或区边界链译码模式。在一些实例中,根据本发明的技术配置的视频译码器可在经编码视频位流中对另一语法元素(例如,sdc_flag)进行译码,其指示所述SDC模式是否执行以对当前经帧内译码深度块进行译码。
在一些实例中,根据本发明的技术配置的视频译码器可使用上下文自适应二进制算术译码(CABAC)过程对这些语法元素(例如,hevc_intra_flag和sdc_flag)进行译码。在一些实例中,视频译码器使用非相等概率状态作为用于CABAC过程的这些语法元素(例如,hevc_intra_flag和sdc_flag)中的一者或两者的初始化概率状态。在一些实例中,视频译码器基于包含当前深度块的切片的切片类型选择用于这些语法元素(例如,hevc_intra_flag和sdc_flag)中的一者或两者的初始化概率状态。在一些实例中,对于这些语法元素中的一者或两者,视频译码器基于一或多个相邻经帧内译码深度块的这些语法元素的值选择当前经帧内译码深度块的初始化概率状态,而在其它实例中,视频译码器视频译码器选择当前深度块的初始化概率状态而无需参考一或多个相邻块的这些语法元素的值。
在一个实例中,一种对视频数据进行解码的方法包括从位流解码信息,所述信息指示至少三个深度帧内预测模式中的哪一者用以解码深度块。所述方法进一步包括针对所述至少三个深度帧内预测模式中的任一者,执行简化深度译码(SDC)模式用于解码所述深度块,所述SDC模式包括从所述位流解码至少一个DC残余值,其中所述DC残余值表示所述深度块的多个像素的残余值。所述方法进一步包括基于所指示深度帧内预测模式和所述至少一个DC残余值重构所述深度块。
在另一实例中,一种对视频数据进行编码的方法包括将信息编码到位流中,所述信息指示至少三个深度帧内预测模式中的哪一者用以对深度块进行编码。所述方法进一步包括针对所述至少三个深度帧内预测模式中的任一者执行简化深度译码(SDC)模式以用于编码所述深度块。所述SDC模式包括基于所述深度帧内预测模式中的指示的一者确定所述深度块的至少一个DC残余值,其中所述DC残余值表示所述深度块的多个像素的残余值,且将所述DC残余值编码到所述位流中。
在另一实例中,一种装置包括视频解码器,其经配置以从位流解码信息,所述信息指示至少三个深度帧内预测模式中的哪一者用以解码深度块,且针对所述至少三个深度帧内预测模式中的任一者,执行简化深度译码(SDC)模式以用于解码所述深度块,所述SDC模式包括从所述位流解码至少一个DC残余值,其中所述DC残余值表示所述深度块的多个像素的残余值。所述视频解码器进一步经配置以基于所指示深度帧内预测模式和所述至少一个DC残余值重构所述深度块。
在另一实例中,一种装置包括视频编码器,其经配置以将信息编码到位流中,所述信息指示至少三个深度帧内预测模式中的哪一者用以对深度块进行编码,且针对所述至少三个深度帧内预测模式中的任一者,执行简化深度译码(SDC)模式以用于编码所述深度块。根据SDC模式,视频编码器经配置以基于深度帧内预测模式中的所指示一者确定深度块的至少一个DC残余值,其中所述DC残余值表示深度块的多个像素的残余值,且将所述DC残余值编码到位流中。
在另一实例中,一种用于对视频数据进行译码的装置包括用于在位流中对信息进行译码的装置,所述信息指示至少三个深度帧内预测模式中的哪一者用以对深度块进行译码,以及针对所述至少三个深度帧内预测模式中的任一者,用于执行简化深度译码(SDC)模式以用于对所述深度块进行译码的装置。所述用于执行所述SDC模式的装置包括用于在位流中对至少一个DC残余值进行译码的装置,其中所述DC残余值表示所述深度块的多个像素的残余值。
在另一实例中,一种计算机可读存储媒体具有存储于其上的指令,所述指令在由视频译码器的一或多个处理器执行时致使所述视频译码器在位流中对信息进行译码,所述信息指示至少三个深度帧内预测模式中的哪一者用以对深度块进行译码,且针对所述至少三个深度帧内预测模式中的任一者,执行简化深度译码(SDC)模式以用于对所述深度块进行译码。所述SDC模式包括在位流中对至少一个DC残余值进行译码,其中所述DC残余值表示所述深度块的多个像素的残余值。
在另一实例中,一种对视频数据进行译码的方法包括在位流中对信息进行译码,所述信息指示深度模型化模式3或深度模型化模式4中的一者用以对深度块进行译码,且基于位于同一地点的纹理块和所指示深度模型化模式确定用于所述深度块的分割模式。所述方法进一步包括基于所述分割模式将所述深度块分割为两个分区,且执行简化深度译码(SDC)模式用于对所述深度块进行译码,所述SDC模式包括针对所述深度块的分区中的每一者在位流中对相应DC残余值进行译码,其中所述DC残余值表示分区的像素的残余值。
在另一实例中,一种对视频数据进行译码的方法包括在位流中对信息进行译码,所述信息指示区边界链译码模式使用对深度块进行译码,在位流中对信息进行译码界定多个链,所述多个链基于区边界链译码模式界定所述深度块的两个分区之间的边界,且基于所述边界将所述深度块分割为两个分区。所述方法进一步包括执行简化深度译码(SDC)模式以用于对所述深度块进行译码,所述SDC模式包括针对所述深度块的分区中的每一者在位流中对相应DC残余值进行译码,其中所述DC残余值表示所述分区的像素的残余值。
在另一实例中,一种对视频数据进行译码的方法包括在位流中对信息进行译码,所述信息指示DC帧内预测模式使用对深度块进行译码,且基于所述DC帧内预测模式确定所述深度块中的像素中的每一者的相应预测符值。所述方法进一步包括执行简化深度译码(SDC)模式用于对所述深度块进行译码,所述SDC模式包括在位流中对单个DC残余值进行译码,其中所述DC残余值是基于所述预测符值而确定且表示所述深度块的像素的残余值。
在另一实例中,一种对视频数据进行译码的方法包括在位流中对信息进行译码,所述信息指示方向性帧内预测模式用以对深度块进行译码,且基于所述方向性帧内预测模式确定所述深度块中的像素中的每一者的相应预测符值。所述方法进一步包括执行简化深度译码(SDC)模式用于对所述深度块进行译码,所述SDC模式包括在位流中对单个DC残余值进行译码,其中所述DC残余值是基于所述预测符值而确定且表示所述深度块的像素的残余值。
在另一实例中,一种对视频数据进行译码的方法包括在经编码视频位流中对第一语法元素进行译码,其中第一语法元素的第一值指示从多个深度帧内预测模式为深度块选择的深度帧内预测模式是平面帧内预测模式、DC帧内预测模式或方向性帧内预测模式中的一者,且第一语法元素的第二值指示为深度块选择的深度帧内预测模式是多个深度模型化模式或区边界链译码模式中的一者。所述方法进一步包括从所述经编码视频位流对第二语法元素进行译码,其中所述第二语法元素指示是否执行简化深度译码(SDC)模式以重构所述深度块,所述SDC模式包括从所述位流解码至少一个DC残余值,其中所述DC残余值表示所述深度块的多个样本的残余值。所述方法进一步包括根据所述第一和第二语法元素对所述深度块进行译码。
在另一实例中,一种装置包括视频译码器。视频译码器包括:存储器,其经配置以存储对视频数据进行编码的经编码视频位流;及一或多个处理器。所述一或多个处理器经配置以从经编码视频位流对第一语法元素进行译码,其中第一语法元素的第一值指示从多个深度帧内预测模式为深度块选择的深度帧内预测模式是平面帧内预测模式、DC帧内预测模式或方向性帧内预测模式中的一者,且第一语法元素的第二值指示为深度块选择的深度帧内预测模式是多个深度模型化模式或区边界链译码模式中的一者。所述一或多个处理器经配置以从经编码视频位流对第二语法元素进行译码,其中所述第二语法元素指示是否执行简化深度译码(SDC)模式以重构深度块,所述SDC模式包括从位流解码至少一个DC残余值,其中所述DC残余值表示深度块的多个样本的残余值。所述一或多个处理器经配置以根据所述第一和第二语法元素对所述深度块进行译码。
在另一实例中,一种对视频数据进行编码的方法包括根据深度帧内预测模式对深度块进行编码,其中对所述深度块进行编码包括执行简化深度译码(SDC)模式以基于所述深度帧内预测模式中的所述指示的一者确定所述深度块的至少一个DC残余值,其中所述DC残余值表示所述深度块的多个样本的残余值。所述方法进一步包括识别包含所确定DC残余值的DC残余值的范围内的候选DC残余值的集合,将视图合成优化过程应用于候选DC残余值集合中的每一者,且基于视图合成优化过程从候选DC残余值集合选择一个DC残余值。所述方法进一步包括将所述选定DC残余值编码到经编码视频位流中。
在另一实例中,一种装置包括视频编码器,其包括经配置以存储对视频数据进行编码的经编码视频位流的存储器,和一或多个处理器。所述一或多个处理器经配置以根据深度帧内预测模式对深度块进行编码,其中编码所述深度块包括执行简化深度译码(SDC)模式以基于深度帧内预测模式中的所指示一者确定深度块的至少一个DC残余值,其中所述DC残余值表示深度块的多个样本的残余值。所述一或多个处理器进一步经配置以识别包含所确定DC残余值的DC残余值的范围内的候选DC残余值的集合,将视图合成优化过程应用于候选DC残余值集合中的每一者,且基于视图合成优化过程从候选DC残余值集合选择一个DC残余值。所述一或多个处理器进一步经配置以将所述选定DC残余值编码到经编码视频位流中。
在附图和以下描述中阐述本发明的一或多个方面的细节。本发明中所描述的技术的其它特征、目标及优点将从描述及图式且从权利要求书而显而易见。
附图说明
图1是说明可利用本发明的技术的实例视频译码系统的框图。
图2是说明在高效率视频译码(HEVC)中使用的帧内预测模式的图。
图3是说明用于对像素样本的8x8块进行译码的一个楔形波分区模式的实例的图。
图4是说明用于对像素样本的8x8块进行译码的一个轮廓分区模式的实例的图。
图5是说明区边界链译码过程中界定的链的八个可能类型的图。
图6是说明具有一个深度预测单元(PU)分区模式的区边界链译码模式和链译码中的经译码链的图。
图7是说明可以实施本发明的技术的实例视频编码器的框图。
图8是说明可实施本发明的技术的实例视频解码器的框图。
图9是说明执行用于深度帧内预测编码深度块的简化深度译码(SDC)模式的实例方法的流程图。
图10是说明执行用于深度帧内预测解码深度块的SDC模式的实例方法的流程图。
图11是说明用于根据HEVC帧内预测模式或3D-HEVC深度帧内预测模式执行用于深度帧内预测编码深度块的SDC模式的实例方法的流程图。
图12是说明用于根据HEVC帧内预测模式或3D-HEVC深度帧内预测模式执行用于深度帧内预测解码深度块的SDC模式的实例方法的流程图。
图13是说明用于在位流中译码指示哪一深度帧内预测模式用以对深度块进行译码和SDC模式是否用以对深度块进行译码的语法元素的实例方法的流程图。
图14是说明用于在位流中译码DC残余值的实例方法的流程图。
图15是说明用于在位流中编码DC残余值的实例方法的流程图。
具体实施方式
本发明描述用于视频数据的图片内或空间预测(也被称作“帧内预测”)的技术。更确切地说,本发明描述用于例如根据简化深度译码(SDC)模式对在3D视频数据的深度分量的帧内预测译码期间导出的残余值进行译码的技术。当根据用于深度数据的多种帧内预测模式(在本文中被称作深度帧内预测模式)中的任一者对视频数据的深度分量进行译码时可自适应地应用本文所描述的残余译码技术。在一些实例中,提供非相等概率状态作为在与帧内深度译码模式和SDC模式相关联的信令中使用的语法元素(例如,旗标)的上下文自适应二进制算术译码(CABAC)的初始化状态。
本发明描述用于基于高级编解码器的3D视频译码的技术,例如高效率视频译码(HEVC)编解码器。本发明中描述的3D译码技术包含与多视图加深度视频译码过程中的深度视图的高级帧间译码相关的深度译码技术,例如当前在开发的对HEVC的3D-HEVC扩展。
在HEVC中,假定译码单元(CU)的大小是2Nx2N,视频编码器和视频解码器可支持用于帧内预测的2Nx2N或NxN的各种预测单元(PU)大小,以及用于帧间预测的2Nx2N、2NxN、Nx2N、NxN或类似的对称PU大小。视频编码器及视频解码器还可支持用于帧间预测的2NxnU、2NxnD、nLx2N及nRx2N的PU大小的不对称分割。
对于如3D-HEVC中提供的深度译码,视频编码器和视频解码器可经配置以支持用于帧内预测的多种不同深度译码分割模式,包含使用非矩形分区的模式。具有非矩形分区的深度译码的实例包含基于楔形波分区的深度译码、基于轮廓分区的深度译码以及基于区边界链分区的译码。作为实例,用于例如楔形波分区或轮廓分区等非矩形分区的基于分区的帧内译码的技术可与用于从深度数据的帧内预测译码产生的残余信息的译码的SDC模式结合执行。
使用3D视频译码技术译码的视频数据可经再现且显示以产生三维效应。作为一个实例,不同视图的两个图像(也就是说,对应于具有稍微不同水平位置的两个相机视角)可大体上同时显示以使得一个图像由观察者的左眼看见,且另一图像由观察者的右眼看见。
3D效果可使用(例如)立体显示器或自动立体显示器实现。立体显示器可结合相应地对所述两个图像进行过滤的护目镜而使用。举例来说,无源眼镜可使用偏光镜片或不同有色镜片对图像进行过滤以确保恰当眼睛观看恰当图像。作为另一实例,有源眼镜可与立体显示器协调地快速遮挡交替的镜片,所述立体显示器可在显示左眼图像与右眼图像之间交替。自动立体显示器以不需要眼镜的方式显示所述两个图像。举例来说,自动立体显示器可包含经配置以致使每一图像投影到观察者的适当眼睛中的镜或棱镜。
本发明的技术涉及用于通过对深度数据进行译码以支持3D视频来对3D视频数据进行译码的技术。一般来说,术语“纹理”用于描述图像的明度(即,亮度或“明度”)值和图像的色度(即,色彩或“色度”)值。在一些实例中,纹理图像可包含一组明度数据(Y)和用于蓝色调(Cb)和红色调(Cr)的两组色度数据。在例如4:2:2或4:2:0的某些色度格式中,相对于明度数据对色度数据下取样。即,色度像素的空间分辨率可低于对应明度像素的空间分辨率,例如为明度分辨率的二分之一或四分之一。
深度数据一般描述对应纹理数据的深度值。举例来说,深度图像可包含一组深度像素(也被称作深度样本或深度值),其各自描述例如视图的纹理分量中的对应纹理数据的例如视图的深度分量中的深度。每一样本(例如,像素)可具有一或多个纹理值(例如,明度和色度),且还可具有一或多个深度值。纹理图片和深度图可以(但不需要)具有相同空间分辨率。举例来说,深度图可包含比对应纹理图片多或少的像素。深度数据可用以确定对应纹理数据的水平视差,且在一些情况下,也可以使用垂直视差。
接收纹理和深度数据的装置可显示一个视图(例如,左眼视图)的第一纹理图像,且通过使第一图像的像素值偏移基于深度值所确定的水平视差值而使用深度数据修改第一纹理图像以产生另一视图(例如,右眼视图)的第二纹理图像。一般来说,水平视差(或简称“视差”)描述第一视图中的像素与右视图中的对应像素的水平空间偏移,其中两个像素对应于如在两个视图中所表示的相同对象的相同部分。
在又其它实例中,可针对垂直于图像平面的z维度中的像素定义深度数据,使得与给定像素相关联的深度是相对于针对所述图像所定义的零视差平面而定义。此深度可用以产生用于显示像素的水平视差,使得所述像素取决于所述像素相对于零视差平面的z维度深度值而对于左眼与右眼以不同方式显示。零视差平面可针对视频序列的不同部分改变,且也可改变相对于零视差平面的深度量。
可针对左眼与右眼类似地定义位于零视差平面上的像素。位于零视差平面之前的像素可对于左眼与右眼显示于不同位置中(例如,具有水平视差),以便产生像素似乎是从垂直于图像平面的z方向上的图像出现的感觉。位于零视差平面之后的像素可显示为具有轻微模糊以轻微地感觉到深度,或可对于左眼与右眼显示于不同位置中(例如,具有与位于零视差平面之前的像素相反的水平视差)。许多其它技术也可用于传达或定义图像的深度数据。
二维视频数据大体上经译码为离散图片的序列,所述离散图片中的每一者对应于特定时间实例。也就是说,每一图片具有相对于所述序列中的其它图像的重放时间的相关联重放时间。这些图片可视为纹理图片或纹理图像。在基于深度的3D视频译码中,序列中的每一纹理图片还可对应于深度图。也就是说,对应于纹理图片的深度图描述对应纹理图片的深度数据。多视图视频数据可包含各种不同视图的数据,其中每一视图可包含纹理分量和对应深度分量的相应序列。
图片大体上对应于特定时间实例。视频数据可使用存取单元序列来表示,其中每一存取单元包含对应于特定时间例项的所有数据。因此,举例来说,对于多视图视频数据加深度译码,来自用于共同时间例项的每一视图的纹理图像加所述纹理图像中的每一者的深度图可全部包含在特定存取单元内。因此,存取单元可包含多个视图,其中每一视图可包含对应于纹理图像的纹理分量的数据以及对应于深度图的深度分量的数据。
每一存取单元可含有多个视图分量或图片。特定视图的视图分量与唯一视图id或视图次序索引相关联,以使得不同视图的视图分量与不同视图id或视图次序索引相关联。视图分量可包含纹理视图分量以及深度视图分量。同一视图中的纹理和深度视图分量可具有不同层id。纹理视图分量可经译码为一或多个纹理切片,而深度视图分量可经译码为一或多个深度切片。多视图加深度产生多种译码可能性,例如图片内、图片间、视图内、视图间、运动预测及类似物。
以此方式,3D视频数据可使用多视图视频加深度格式来表示,其中俘获或产生的视图包含与对应深度图相关联的纹理分量。此外,在3D视频译码中,纹理和深度图可经译码且多路复用到3D视频位流中。深度图可经译码为灰度级图像,其中深度图的“明度”样本(即,像素)表示深度值。
一般来说,深度数据的块(例如对应于像素的深度图的样本的块)可被称为深度块。深度值可被称为与深度样本相关联的明度值。即,深度图可大体上被视为单色纹理图片,换句话说,包含明度值且不包含色度值的纹理图片。在任何情况下,常规帧内和帧间译码方法可应用于深度图译码。
深度图通常特征在于尖锐边缘和恒定区域,且深度图中的边缘通常呈现与对应纹理数据的强相关。归因于纹理及对应深度之间的不同统计及相关性,因此已经基于2D视频编解码器设计用于深度图的不同译码方案。
下文回顾与本发明相关的HEVC技术。视频译码标准的实例包含ITU-TH.261、ISO/IECMPEG-1Visual、ITU-TH.262或ISO/IECMPEG-2Visual、ITU-TH.263、ISO/IECMPEG-4Visual及ITU-TH.264(也称为ISO/IECMPEG-4AVC),包含其可缩放视频译码(SVC)及多视图视频译码(MVC)扩展。MVC的最新联合草案描述于2010年3月的“用于通用视听服务的高级视频译码”(ITU-T建议H.264)中。
此外,存在一种新的且即将到来的视频译码标准,即上文所提及的高效率视频译码(HEVC),其由ITU-T视频译码专家组(VCEG)和ISO/IEC运动图片专家组(MPEG)的视频译码联合合作小组(JCT-VC)进行开发。HEVC标准的最近草案JCTVC-L1003(本杰明·布洛斯、韩吴京、基恩斯·拉尼尔·欧姆、加里·沙利文、王叶奎、托马斯·韦甘德)“高效率视频译码(HEVC)文本规范草案10(用于FDIS和最后呼叫)”(文献:JCTVC-L1003_v34,ITU-TSG16WP3和ISO/IECJTC1/SC29/WG11的视频译码联合合作小组(JCT-VC),瑞士日内瓦第12次会议,2013年1月14-23日(“HEVC文本规范”))从以下链接可用:
http://phenix.it-sudparis.eu/jct/doc_end_user/documents/12_Geneva/ wg11/JCTVC-L1003-v34.zip
在JCT-3V中,正开发两个HEVC扩展:多视图扩展(MV-HEVC)和3D视频扩展(3D-HEVC)。用于3D-HEVC的参考软件的最近版本“3D-HTM版本9.0”可从以下链接下载:
https://hevc.hhi.fraunhofer.de/svn/svn_3DVCSoftware/tags/HTM-9.0/
用于3D-HEVC的软件描述的最近草案(格哈德技术公司、克里斯托弗·韦格纳、陈英、叶希洪)“3D-HEVC测试模型5”(JCT3V-E1005,ITU-TSG16WP3和ISO/IECJTC1/SC29/WG11的3D视频译码扩展开发联合合作小组,奥地利维也纳第5次会议,2013年7月27日-8月2日)从以下链接可用:
http://phenix.it-sudparis.eu/jct2/doc_end_user/documents/5_Vienna/ wg11/JCT3V-E1005-v1.zip
3D-HEVC规范的最近工作草案(格哈德技术公司、克里斯托弗·韦格纳、陈英、叶希洪)“3D-HEVC草案文本1”(文献:JCT3V-E1001-v3,ITU-TSG16WP3和ISO/IECJTC1/SC29/WG11的3D视频译码扩展开发联合合作小组,奥地利维也纳第5次会议,2013年7月27日-8月2日(“3D-HEVC草案文本1”))从以下链接可用:
http://phenix.it-sudparis.eu/jct2/doc_end_user/documents/5_Vienna/ wg11/JCT3V-E1001-v3.zip
3D-HEVC规范的另一最近工作草案(格哈德技术公司、克里斯托弗·韦格纳、陈英、叶希洪)“3D-HEVC草案文本2”(文献:JCT3V-F1001-v1,ITU-TSG16WP3和ISO/IECJTC1/SC29/WG11的3D视频译码扩展开发联合合作小组,瑞士日内瓦第6次会议,2013年10月25日-11月1日(“3D-HEVC草案文本2”))从以下链接可用:
http://phenix.it-sudparis.eu/jct2/doc_end_user/documents/6_Geneva/ wg11/JCT3V-F1001-v1.zip
一般来说,例如根据HEVC帧内预测模式(例如平面、DC和方向性帧内预测模式)的深度块的帧内预测译码表示具有相应残余值的深度块的每一像素。另一方面,根据SDC模式的简化残余译码表示具有一或多个DC残余值的像素特定残余值。所述一或多个DC残余值中的每一者表示多个像素特定残余值,且可由视频解码器使用以重构深度块的多个深度像素值。对于根据SDC模式的简化残余译码,视频编码器可在一些实例中不变换和/或量化(且视频解码器可不逆量化和/或逆变换)在位流中经译码的DC残余值,或与深度块相关联的任何其它残余数据。
举例来说,视频编码器可使用帧内预测模式产生深度块的经预测块。视频编码器可随后计算深度块的残余块,以使得所述残余块包含经预测块与深度块或分区的实际值之间的逐像素差。随后,视频编码器可根据残余块的残余值的平均而计算DC残余值。为了重构深度块,视频解码器可形成包含各自等于DC残余值的像素值的残余块,使用帧内预测模式产生经预测块,且逐像素地组合经预测块与残余块以形成经重构深度块。
在其它实例中,视频编码器可使用帧内预测模式产生深度块的经预测块。视频编码器可随后基于经预测块的值的子集计算深度块的DC预测符值。视频编码器还可确定深度块的DC深度值,例如平均值。视频编码器可确定深度块的单个DC残余值作为深度块的DC深度值与DC预测符值之间的差。为了重构深度块,视频解码器可形成包含各自等于DC残余值的像素值的残余块,使用帧内预测模式产生经预测块,且逐像素地组合经预测块与残余块以形成经重构深度块。
根据本发明的技术配置的视频译码器(例如,视频编码器或视频解码器)可执行SDC模式以根据多种(例如,至少三个)深度帧内预测模式中的任一者对深度块进行译码。所述至少三个深度帧内预测模式可包含非基于分区(例如,HEVC)帧内预测模式,例如DC模式、平面模式或所述多个方向性帧内预测模式中的任一者。在此些实例中,视频译码器可对深度块的单个DC残余值进行译码。
所述至少三个深度帧内预测模式可另外或替代地包含基于分区(例如,3D-HEVC)的帧内预测模式。举例来说,所述至少三个深度帧内预测模式可包含深度模型化模式(DMM)1、DMM3、DMM4或区边界链译码模式。在此些实例中,视频译码器可根据基于分区的深度帧内预测模式分割深度块,且对每一分区的相应DC残余值进行译码。
根据本发明的技术配置的视频译码器还可执行多种技术以用于促进SDC模式到多种深度帧内预测模式的宽广应用。举例来说,根据本发明的技术配置的视频译码器可执行用于对位流中指示是否使用非基于分区的帧内预测模式(例如HEVC帧内预测模式)或基于分区的帧内预测模式对深度块进行译码的信息以及指示使用哪一深度帧内预测模式(例如DC、平面、方向性、DMM或区边界链译码模式)对深度块进行译码的信息进行译码(例如,编码或解码)的技术。作为另一实例,根据本发明的技术配置的视频译码器可执行用于对位流中指示根据本发明的技术的SDC模式和简化残余译码是否与所指示深度帧内预测译码模式一起使用或残余值是否将以不同方式经译码的信息进行译码(例如,编码或解码)的技术。
根据本发明的一些实例技术配置的视频译码器可对经编码视频位流中的语法元素(例如,hevc_intra_flag)进行译码,所述语法元素指示是否将使用非基于分区(例如HEVC)帧内预测模式或基于分区的深度帧内预测模式对当前经帧内译码深度块进行解码。在一些实例中,根据本发明的技术配置的视频译码器可对经编码视频位流中的另一语法元素(例如,sdc_flag)进行译码,所述语法元素指示是否将执行SDC模式以对当前经帧内译码深度块进行解码。在一些实例中,根据本发明的技术配置的视频译码器可使用上下文自适应二进制算术译码(CABAC)过程对这些语法元素进行译码。在一些实例中,视频译码器使用非相等概率状态作为用于CABAC过程的这些语法元素中的一者或两者的初始化概率状态。在一些实例中,视频译码器基于包含当前深度块的切片的切片类型而选择这些语法元素中的一者或两者的初始化概率状态。在一些实例中,对于这些语法元素中的一者或两者,视频译码器基于一或多个相邻块的这些语法元素的值而选择当前深度块的初始化概率状态,而在其它实例中,视频译码器视频译码器在不参考一或多个相邻块的这些语法元素的值的情况下选择当前深度块的初始化概率状态。
如上文所指出,根据本发明的一些实例技术,视频译码器根据SDC模式对表示当前经帧内译码深度块的一或多个DC残余值进行译码。在一些实例中,为了确定经编码到当前经帧内译码深度块的位流中的DC残余值,视频编码器应用视图合成优化过程以从范围内的DC残余值的候选集合选择DC残余值,所述范围包含根据SDC模式针对当前经帧内译码深度块所确定的DC残余值。在一些实例中,视频编码器通过将一或多个整数偏移应用于根据SDC模式针对当前经帧内译码深度块所确定的DC残余值而确定DC残余值的范围。
图1是说明可利用本发明的各种技术以用于深度帧内预测模式的简化残余译码的实例视频编码和解码系统10的框图。在一些实例中,视频编码器20及视频解码器30可经配置以通过用于3D视频译码的残余信息的简化深度译码而执行用于深度数据的基于分区(例如,3D-HEVC)或非基于分区(例如,HEVC)的帧内译码的各种功能。
如图1中所展示,系统10包含源装置12,其提供待在稍后时间由目的地装置14解码的经编码视频数据。具体地说,源装置12经由计算机可读媒体16将视频数据提供到目的地装置14。源装置12及目的地装置14可包括广泛范围的装置中的任一者,包含桌上型计算机、笔记型(即,膝上型)计算机、平板计算机、机顶盒、例如所谓的“智能”电话的电话手持机、所谓的“智能”板、电视、相机、显示装置、数字媒体播放器、视频游戏控制台、视频流式传输装置或类似者。在一些情况下,可装备源装置12和目的地装置14以用于无线通信。
目的地装置14可经由计算机可读媒体16接收待解码的经编码视频数据。计算机可读媒体16可包括能够将经编码的视频数据从源装置12移动到目的地装置14的任一类型的媒体或装置。在一个实例中,计算机可读媒体16可包括通信媒体以使源装置12能够实时地将经编码的视频数据直接发射到目的地装置14。
可根据通信标准(例如,无线通信协议)调制经编码的视频数据,并将其发射到目的地装置14。通信媒体可包括任何无线或有线通信媒体,例如射频(RF)频谱或一或多个物理传输线。通信媒体可形成分组网络(例如,局域网、广域网或全球网络,例如因特网)的部分。通信媒体可包含路由器、交换器、基站或任何其它可用于促进从源装置12到目的地装置14的通信的设备。
在一些实例中,经编码数据可从输出接口22输出到计算机可读存储媒体,即,存储装置。类似地,经编码数据可由输入接口从存储装置存取。存储装置可包含多种分布式或本地存取的数据存储媒体中的任一者,例如硬盘驱动器、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器或任何其它用于存储经编码的视频数据的合适的数字存储媒体。在另一实例中,存储装置可对应于文件服务器或另一可存储源装置12产生的经编码视频的中间存储装置。
目的地装置14可经由流式传输或下载从存储装置存取所存储的视频数据。文件服务器可以是任何类型的能够存储经编码的视频数据并且将经编码的视频数据发射到目的地装置14的服务器。实例文件服务器包含网络服务器(例如,用于网站)、FTP服务器、网络附接存储(NAS)装置或本地磁盘驱动器。目的地装置14可以通过任何标准数据连接(包含因特网连接)来存取经编码视频数据。此可包含无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、电缆调制解调器等),或适合于存取存储在文件服务器上的经编码视频数据的两者的组合。经编码视频数据从存储装置的发射可能是流式传输发射、下载发射或其组合。
本发明的技术未必限于无线应用或设定。所述技术可以应用于视频译码以支持多种多媒体应用中的任一者,例如空中协议电视广播、有线电视发射、卫星电视发射、因特网流式视频发射(例如,经由HTTP的动态自适应流式传输(DASH))、经编码到数据存储媒体上的数字视频、存储在数据存储媒体上的数字视频的解码或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频传输,以支持例如视频流式传输、视频重放、视频广播和/或视频电话等应用。
在图1的实例中,源装置12包含视频源18、视频编码器20及输出接口22。目的地装置14包含输入接口28、视频解码器30及显示装置32。根据本发明,源装置12的视频编码器20可经配置以关于非矩形分区应用基于分区的深度译码的技术。在其它实例中,源装置和目的地装置可包括其它组件或布置。举例来说,源装置12可从外部视频源18(例如外部相机)接收视频数据。同样,目的地装置14可与外部显示装置介接,而非包含集成式显示装置。
图1的说明的系统10只是一个实例。用于深度帧内预测模式的简化残余译码的技术可由任何数字视频编码和/或解码装置执行。尽管本发明的技术一般通过视频编码器20和/或视频解码器30来执行,但是所述技术还可通过视频编码器/解码器(通常被称作“编解码器”)来执行。此外,本发明的技术还可由视频预处理器执行。源装置12及目的地装置14仅为源装置12产生经译码视频数据用于发射至目的地装置14的所述译码装置的实例。在一些实例中,装置12、14可以实质上对称的方式操作,使得装置12、14中的每一者包含视频编码及解码组件。因此,系统10可支持视频装置12、14之间的单向或双向视频发射以例如用于视频流式发射、视频重放、视频广播或视频电话。
源装置12的视频源18可以包含视频俘获装置,例如摄像机、含有先前所俘获视频的视频存档和/或用于从视频内容提供者接收视频的视频馈送接口。作为另一替代方案,视频源18可产生基于计算机图形的数据作为源视频,或直播视频、存档视频与计算机产生的视频的组合。在一些情况下,如果视频源18是摄像机,那么源装置12和目的地装置14可形成所谓的智能电话、平板计算机或视频电话。然而,如上文所提及,本发明中所描述的技术可大体上适用于视频译码,且可应用于无线和/或有线应用。在每一情况下,俘获、预先俘获或计算机产生的视频可由视频编码器20编码。经编码视频信息可接着由输出接口22输出到计算机可读媒体16上。
计算机可读媒体16可包含瞬时媒体,例如无线广播或有线网络发射,或数据存储媒体(即,非暂时性存储媒体)。在一些实例中,网络服务器(未图示)可从源装置12接收经编码视频数据,且例如经由网络传输将经编码视频数据提供到目的地装置14。类似地,媒体生产设施(例如,光盘冲压设施)的计算装置可从源装置12接收经编码的视频数据且生产含有经编码的视频数据的光盘。因此,在各种实例中,计算机可读媒体16可以理解为包含各种形式的一或多个计算机可读媒体。
本发明可总体上参考视频编码器20向另一装置(例如,视频解码器30)“用信号表示”某些信息。然而,应理解,视频编码器20可通过使某些语法元素与视频数据的各种经编码部分相关联来用信号表示信息。即,视频编码器20可通过将某些语法元素存储到视频数据的各种经编码部分的标头或有效负载中而“用信号表示”数据。在一些情况下,此些语法元素可在被视频解码器30接收和解码之前被编码和存储(例如,存储到计算机可读媒体16)。因而,术语“用信号表示”可能总体上指代用于解码经压缩的视频数据的语法或其它数据的通信,不论所述通信是实时或准实时发生还是在一段时间中发生,例如可能在编码时将语法元素存储到媒体上的时候发生,接着可以在存储到这个媒体上之后的任何时间由解码装置检索。
目的地装置14的输入接口28从计算机可读媒体16接收信息。计算机可读媒体16的信息可包含由视频编码器20定义的语法信息,所述语法信息还供视频解码器30使用,所述语法信息包含描述块及其它经译码单元(例如,GOP)的特性及/或处理的语法元素。显示装置32向用户显示经解码视频数据,且可包括多种显示装置中的任一者,例如阴极射线管(CRT)、液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器、投影装置或另一类型的显示装置。
尽管图1中未图示,在一些方面中,视频编码器20和视频解码器30可各自与音频编码器及解码器集成,且可包含适当多路复用器-多路分用器单元或其它硬件和软件以处置共同数据流或单独数据流中的音频和视频两者的编码。如果适用的话,作为一个实例,多路复用器-多路分用器单元可符合ITUH.223多路复用器协议,或例如用户数据报协议(UDP)等其它协议。
视频编码器20和视频解码器30各自可实施为合适的多种合适的编码器或解码器电路中的任一者,例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑电路、软件、硬件、固件或其任何组合。视频编码器20和视频解码器30中的每一者可包含在一或多个编码器或解码器中,所述编码器或解码器中的任一者可集成为组合视频编码器/解码器(CODEC)的部分。包含视频编码器20和/或视频解码器30的装置可包括集成电路、微处理器和/或无线通信装置(例如,蜂窝式电话)。
视频编码器20及视频解码器30可根据视频译码标准操作,例如HEVC标准且更确切地说HEVC标准的3D-HEVC扩展,如本发明中参考。HEVC假定视频译码装置相对于经配置以根据其它过程(例如ITU-TH.264/AVC)执行译码的装置的若干额外能力。举例来说,虽然H.264提供了九个帧内预测编码模式,但是HM可以提供多达三十五个帧内预测编码模式。
一般来说,HEVC指定视频图片(或“帧”)可划分成包含明度和色度样本两者的树块或最大译码单元(LCU)的序列。位流内的语法数据可以界定最大译码单元(LCU,其是就像素数目来说的最大译码单元)的大小。切片包含按译码次序的若干连续树块。图片可以分割成一或多个切片。每一树块可以根据四叉树分裂成译码单元(CU)。一般来说,四叉树数据结构包含每个CU一个节点,其中一个根节点对应于所述树块。如果一个CU分裂成四个子CU,那么对应于CU的节点包含四个叶节点,其中的每一者对应于所述子CU中的一者。
四叉树数据结构的每一节点可提供用于对应CU的语法数据。举例来说,四叉树中的节点可包含分裂旗标,其表明对应于所述节点的所述CU是否分裂成子CU。用于CU的语法元素可以递归地来定义,且可以取决于CU是否分裂成数个子CU。如果CU不进一步分裂,那么将其称为叶CU。叶CU的四个子CU也可被称为叶CU,即使不存在原始叶CU的显式分裂时也是如此。举例来说,如果16x16大小的CU不进一步分裂,那么这四个8x8子CU将也被称作叶CU,虽然16x16CU从未分裂。
HEVC中的CU具有与H.264标准的宏块类似的目的,除了CU不具有大小区别。举例来说,树块可分裂成四个子节点(也称为子CU),且每一子节点又可为父节点且可分裂成另外四个子节点。最终的未经分裂子节点(被称作四叉树的叶节点)包括译码节点,还被称作叶CU。与经译码位流相关联的语法数据可定义树块可分裂的最大次数,被称作最大CU深度,且还可定义译码节点的最小大小。因此,位流还可界定最小译码单元(SCU)。本发明使用术语“块”指代HEVC的上下文中的CU、PU或TU中的任一者,或其它标准的上下文中的类似数据结构(例如,在H.264/AVC中的宏块及其子块)。
CU包含译码节点和与所述译码节点相关联的预测单元(PU)和变换单元(TU)。CU的大小对应于译码节点的大小并且形状必须是正方形。CU的大小可介于8×8个像素至多达具有最大64×64个像素或更大的树块大小的范围内。每一CU可以含有一或多个PU和一或多个TU。举例来说,与CU相关联的语法数据可描述CU分割成一或多个PU。分割模式可在CU被跳过或经直接模式编码、经帧内预测模式编码或经帧间预测模式编码之间有所不同。在如本发明中所描述的深度译码的情况下,PU可分割为非正方形形状,或包含非矩形形状的分区。举例来说,与CU相关联的语法数据还可描述CU根据四叉树到一或多个TU的分割。TU可为正方形或非正方形(例如,矩形)形状。
HEVC标准允许根据TU变换,TU可针对不同CU而有所不同。TU的大小通常是基于针对经分割LCU定义的给定CU内的PU的大小而确定,但是情况可能并不总是如此。TU通常与PU大小相同或小于PU。在一些实例中,可以使用被称为“残余四叉树”(RQT)的四叉树结构将对应于CU的残余样本细分成较小单元。RQT的叶节点可被称为变换单元(TU)。可以变换与TU相关联的像素差值以产生变换系数,所述变换系数可经量化。
叶CU可包含一或多个预测单元(PU)。一般来说,PU表示对应于对应的CU的全部或一部分的空间区,且可包含用于检索PU的参考样本的数据。参考样本可为来自参考块的像素。在一些实例中,参考样本可从参考块获得或例如通过内插或其它技术而产生。PU还包含与预测有关的数据。举例来说,当PU经帧内模式编码时,用于PU的数据可以包含在残余四叉树(RQT)中,残余四叉树可以包含描述用于对应于PU的TU的帧内预测模式的数据。作为另一实例,当PU经帧间模式编码时,PU可以包含定义PU的一或多个运动向量的数据。举例来说,定义PU的运动向量的数据可以描述运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量指向的参考图片及/或运动向量的参考图片列表(例如,列表0、列表1或列表C)。
具有一或多个PU的叶CU还可包含一或多个变换单元(TU)。变换单元可使用RQT(也称为TU四叉树结构)来指定,如上文所论述。举例来说,分裂旗标可以指示叶CU是否分裂成四个变换单元。接着,每一变换单元可进一步分裂成更多个子TU。当TU未进一步分裂时,其可被称作叶TU。总体上,对于帧内译码,所有属于一叶CU的叶TU共享相同的帧内预测模式。也就是说,一般应用相同的帧内预测模式来计算叶CU的所有TU的预测值。对于帧内译码,视频编码器20可以使用帧内预测模式将每一叶TU的残余值计算为CU的对应于TU的部分与原始块之间的差。TU不一定限于PU的大小。因此,TU可大于或小于PU。对于帧内译码,PU可以与相同CU的对应叶TU并置。在一些实例中,叶TU的最大大小可以对应于对应的叶CU的大小。
此外,叶CU的TU还可与相应的四叉树数据结构(被称作残余四叉树(RQT))相关联。即,叶CU可包含指示叶CU如何分割成TU的四叉树。TU四叉树的根节点一般对应于叶CU,而CU四叉树的根节点一般对应于树块(或LCU)。未经分裂的RQT的TU被称作叶TU。一般来说,除非以其它方式提及,否则本发明分别使用术语CU及TU来指叶CU及叶TU。
视频序列通常包含一系列视频帧或图片。如本文所描述,术语“图片”与“帧”可以互换地使用。即,含有视频数据的图片可被称为视频帧或简称为“帧”。图片群组(GOP)一般包括一系列一或多个视频图片。GOP可包含GOP的标头、图片中的一或多者的标头或其它处的语法数据,其描述GOP中所包含的图片的数目。图片的每一切片可包含描述用于相应的切片的编码模式的切片语法数据。视频编码器20通常对个别视频切片内的视频块进行操作以便对视频数据进行编码。视频块可与CU内的译码节点相对应。视频块可具有固定或变化的大小,并且根据指定译码标准可在大小上有所不同。
作为一实例,HEVC支持各种PU大小的预测。假设特定CU的大小是2Nx2N,那么HEVC支持2Nx2N或NxN的PU大小的帧内预测,及2Nx2N、2NxN、Nx2N或NxN的对称PU大小的帧间预测。具有2Nx2N的大小的PU表示未划分CU,因为其与其驻留的CU为相同大小。换句话说,2Nx2NPU与其CU大小相同。HM还支持用于2NxnU、2NxnD、nLx2N及nRx2N的PU大小的帧间预测的不对称分割。在不对称分割中,不分割CU的一个方向,但是将另一方向分割成25%和75%。CU的对应于25%分割区的部分由“n”后面接着“上方”、“下方”、“左侧”或“右侧”的指示来指示。因而,举例来说,“2NxnU”指水平地分割的2Nx2NCU,其中顶部为2Nx0.5NPU,且底部为2Nx1.5NPU。
在本发明中,“NxN”与“N乘N”可互换使用来指在垂直和水平尺寸方面的视频块的像素尺寸,例如,16x16像素或16乘16像素。大体来说,16x16块将在垂直方向上具有16个像素(y=16),且在水平方向上具有16个像素(x=16)。同样,NxN块总体上在垂直方向上具有N个像素,并且在水平方向上具有N个像素,其中N表示非负整数值。块中的像素可布置成行和列。此外,块未必需要在水平方向上与在竖直方向上具有相同数目个像素。举例来说,块可包括NxM个像素,其中M未必等于N。
在使用CU的PU的帧内预测性或帧间预测性译码之后,视频编码器20可以计算CU的TU的残余数据。PU可包括描述在空间域(还被称作像素域)中产生预测性像素数据的方法或模式的语法数据,并且TU可包括在对残余视频数据应用变换(例如,离散余弦变换(DCT)、整数变换、小波变换或概念上类似的变换)之后在变换域中的系数。残余数据可对应于未经编码图片的像素与对应于PU的预测值之间的像素差。视频编码器20可以形成包含用于CU的残余数据的TU,并且接着变换TU以产生用于CU的变换系数。
在用以产生变换系数的任何变换后,视频编码器20可执行变换系数的量化。量化大体上指代对变换系数进行量化以可能减少用以表示变换系数的数据的量从而提供进一步压缩的过程。量化过程可以减少与系数中的一些或全部相关联的位深度。例如,n位值可在量化期间被下舍入到m位值,其中n大于m。
在量化之后,视频编码器20可扫描变换系数,从包含经量化变换系数的二维矩阵产生一维向量。扫描可以经设计以将较高能量(并且因此较低频率)的系数放置在阵列的前面,并且将较低能量(并且因此较高频率)的系数放置在阵列的背面。
在一些实例中,视频编码器20可利用预定义扫描次序来扫描经量化的变换系数以产生可被熵编码的串行化向量。在其它实例中,视频编码器20可以执行自适应扫描。在扫描经量化的变换系数以形成一维向量之后,视频编码器20可以例如根据上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法编码一维向量。视频编码器还20也可熵编码与经编码视频数据相关联的语法元素以供视频解码器30在解码视频数据时使用。
视频编码器20可例如在图片标头、块标头、切片标头或GOP标头中进一步将例如基于块的语法数据、基于图片的语法数据和基于GOP的语法数据等语法数据发送到视频解码器30。GOP语法数据可以描述相应GOP中的多个图片,并且图片语法数据可以指示用于对对应图片进行编码的编码/预测模式。
视频编码器20和/或视频解码器30可对深度数据进行图片内预测译码。另外,根据本发明的实例,视频编码器20和/或视频解码器30可根据多种模式中的任一者执行从视频数据的深度帧内预测译码产生的残余数据的简化译码,如将描述。更具体来说,根据本发明的技术配置的视频编码器20和/或视频解码器30可利用例如根据现存3D-HEVC的提议用于某些深度帧内预测模式的简化残余译码,以用于额外基于分区的深度帧内预测模式。另外,根据本发明的技术配置的视频编码器20和/或视频解码器30可利用简化残余译码用于根据多种非基于分区的帧内预测模式,例如根据基础HEVC规范中提供的帧内预测模式对从深度数据的帧内预测产生的残余数据进行译码。
图2是说明在HEVC中使用的帧内预测模式的图。图2大体上说明与可用于HEVC中的帧内译码的各种方向性帧内预测模式相关联的预测方向。在当前HEVC标准中,对于每一预测单元(PU)的明度分量的帧内预测,以33个角度预测模式(从2到34编索引)、DC模式(以1编索引)和平面模式(以0编索引)中的选定一者利用帧内预测方法,如图2中所示。
根据平面模式(以0编索引),使用所谓的“平面”功能执行预测以确定视频数据块(例如,PU)内的像素中的每一者的预测符值。根据DC模式(以1编索引),使用所述块内的像素值的平均化执行预测以确定所述块内的像素中的每一者的预测符值。根据方向性预测模式,基于相邻块的沿着特定方向(如由模式指示)的经重构像素而执行预测。一般来说,图2中所示的箭头的尾端表示从其检索值的相邻像素中的相对一者,而所述箭头的头部表示所检索值沿着其传播以形成预测性块的方向。
对于HEVC帧内预测模式,视频编码器20和/或视频解码器30例如通过使用用于模式2到34的PU的相邻样本,使用上文所论述的各种模式产生PU中的每一像素的像素特定预测符值。视频编码器20基于块的像素的实际深度值与预测符值之间的差确定视频块的残余值,且将残余值提供到视频解码器30。根据HEVCWD10,视频编码器20变换残余值且量化变换系数,且还可对经量化变换系数进行熵编码。视频解码器30(例如,在熵解码、逆量化和逆变换之后)通过将残余值添加到预测符值而确定块的像素的经重构值。HEVCWD10的子条款8.4.2中指定关于HEVC帧内预测模式的进一步细节。
现将进一步详细描述3D-HEVC。VCEG及MPEG的3D视频译码联合合作小组(JCT-3C)正在开发基于HEVC的3D视频(3DV)标准,其标准化努力的部分包含上文所提及的基于HEVC的多视图视频编解码器(MV-HEVC)的标准化及用于基于HEVC的3D视频译码(3D-HEVC)的另一部分。对于3D-HEVC,可包含且支持用于纹理及深度视图两者的新译码工具,包含在译码单元(CU)/预测单元(PU)层级中的那些工具。当前,MPEG中的基于HEVC的3D视频译码(3D-HEVC)编解码器是基于文献m22570和m22571中所提议的解决方案。m22570的完整引用文件是:施瓦茨等人的FraunhoferHHI3D视频译码技术建议书描述(HEVC兼容配置A),MPEG会议ISO/IECJTC1/SC29/WG11,文献MPEG11/M22570,瑞士日内瓦,2011年11月/12月。m22571的完整引用文件是:施瓦茨等人的FraunhoferHHI3D视频技术建议书描述(HEVC兼容;配置B),MPEG会议-ISO/IECJTC1/SC29/WG11,文献MPEG11/M22571,瑞士日内瓦,2011年11月/12月。
在3D-HEVC中,每一存取单元含有多个视图分量,其中的每一者含有唯一视图id或视图次序索引或层id。视图分量含有纹理视图分量以及深度视图分量,如上文所描述。纹理视图分量经译码为一或多个纹理切片,而深度视图分量经译码为一或多个深度切片。
当使用多视图视频加深度格式表示3D视频数据时,纹理视图分量与由视频编码器20在3D视频位流中经译码且多路复用的对应深度视图分量相关联。视频编码器20和/或视频解码器30将深度视图分量中的深度图译码为灰度级明度样本以表示深度值,且可使用常规帧内和帧间译码方法用于深度图译码。深度图由锐缘和恒定区域表征。因此,由于深度图样本的不同统计数据,已经基于2D视频编解码器设计不同译码方案用于视频编码器20和/或视频解码器30的深度图译码。
在3D-HEVC中,可利用与HEVC中相同的帧内预测模式的定义用于深度分量的帧内预测译码,例如用于深度帧内预测。另外,在3D-HEVC中,与HEVC帧内预测模式一起引入深度模型化模式(DMM),例如如上文参考图2所描述,以对深度分量进行帧内预测译码。作为HEVC中所指定的帧内预测模式的替代方案,集成DMM方法。可针对每一深度块(例如,PU)用信号表示一位旗标(例如,hevc_intra_flag)以指定是否应用DMM或通用(HEVC)帧内预测。
为了深度图中的锐缘的较好表示,用于3D-HEVC的当前参考软件(HTM9.0)启用用于深度图的帧内译码的DMM的应用。因此,在3D-HEVC中,视频编码器20和/或视频解码器30可使用DMM对深度切片的PU进行译码。在一些情况下,四个DMM可用于帧内译码深度数据。在所有四个模式中,视频编码器20和/或视频解码器30将深度块(例如PU)分割为一个以上区(例如两个区),如由DMM模式指定。视频编码器20和/或视频解码器30随后产生每一区的预测深度值,其可被称为恒定或“DC”预测深度值,其基于相邻深度样本的值。
DMM模式可显式地用信号表示,从空间相邻深度块预测,和/或从位于同一地点的纹理块预测。举例来说,第一DMM(例如,DMM模式1)可包含用信号表示深度块的分区边界的开始和/或结束点。第二DMM(例如,DMM模式2)可包含基于空间相邻深度块预测深度块的分区边界。第三和第四DMM(例如,DMM模式3和DMM模式4)可包含基于深度块的位于同一地点的纹理块预测深度块的分区边界。
在四个DMM可用的情况下,可存在与四个DMM(例如,DMM模式1-4)中的每一者相关联的信令。举例来说,视频编码器20可基于速率失真优化选择DMM以对深度PU进行译码。视频编码器20可提供具有经编码深度数据的经编码位流中的选定DMM的指示。视频解码器30可从位流剖析所述指示以确定适当DMM以用于解码深度数据。在一些情况下,可使用固定长度码来指示选定DMM。另外,所述固定长度码还可指示是否应用预测偏移(与预测DC值相关联)。
存在在DMM中定义的两种类型的分割模型,包含楔形波分割和轮廓分割。图3是说明用于对像素样本的8x8块进行译码的楔形波分区模式的实例的图。图4是说明用于对像素样本的8x8块进行译码的轮廓分区模式的实例的图。
因此,作为一个实例,图3提供用于8x8块的楔形波模式的说明。对于楔形波分区,通过直线将深度块(例如,PU)分割成两个区,其中开始点位于(Xs,Ys)且结束点位于(Xe,Ye),如图3中所说明,其中所述两个区标记有P0和P1。每一模式由大小uB×vB二进制数位的阵列组成,所述数位标记对应样本是否属于区P0或P1,其中uB和vB分别表示当前PU的水平和垂直大小。区P0和P1在图3中分别由白色和阴影样本表示。在编码和解码两者的开始初始化楔形波模式。
图4展示用于8x8块的轮廓模式。对于轮廓分割,可将深度块分割成两个不规则区,如图4中所示。轮廓分割比楔形波分割更灵活,但难以显式地用信号表示。在DMM模式4中,使用位于同一地点的纹理块的经重构的明度样本隐式地导出轮廓分割模式。
参考图3和4,深度块40和60内的每一个别正方形分别表示深度块40和60的相应个别像素。正方形内的数字值表示对应像素是否属于区42(图3的实例中的值“0”)或区44(图3的实例中的值“1”)。图3中还使用阴影来指示像素属于区42(白色正方形)还是区44(灰色阴影正方形)。
如上文所论述,每一模式(即,楔形波和轮廓)可由大小uBXvB二进制数位的阵列界定,所述数位标记对应样本(即,像素)是否属于区P0或P1(其中P0对应于图3中的区42和图4中的区62,且P1对应于图3中的区44和图4中的区64A、64B),其中uB和vB分别表示当前PU的水平和垂直大小。在图3和图4的实例中,PU分别对应于块40和60。例如视频编码器20和视频解码器30等视频译码器可在译码的开始、例如编码的开始或解码的开始初始化楔形波样式。
如图3的实例中所示,对于楔形波分区,通过直线46将深度块40分割成两个区,区42和区44,其中开始点48位于(Xs,Ys)且结束点50位于(Xe,Ye)。在图3的实例中,开始点48可经界定为点(8,0)且结束点50可经界定为点(0,8)。
如图4的实例中示出,对于轮廓分割,例如深度块60的深度块可分割成两个不规则形状的区。在图4的实例中,使用轮廓分割将深度块60分割成区62和区64A、64B。虽然区64A中的像素不紧邻于区64B中的像素,但区64A和64B可经界定以形成一单个区,以用于预测深度块60的PU的目的。轮廓分割可比楔形波分割更灵活,但可相对更难以用信号表示。在DMM模式4中,在3D-HEVC的情况下,轮廓分割模式是使用位于同一地点的纹理块的经重构明度样本隐式地导出。
以此方式,例如图1以及下文描述的图7和8的视频编码器20及视频解码器30等视频译码器可使用如由开始点48和结束点50界定的线46以确定深度块40的像素是否属于区42(其也可被称作区“P0”)或区44(其也可被称作区“P1”),如图3中所示。同样,在一些实例中,视频译码器可使用图4的线66、68以确定深度块60的像素是否属于区64A(其也可被称作区“P0”)或区64B(其也可被称作区“P1”)。区“P0”和“P1”是根据DMM分割的不同区的默认命名规范,且因此,深度块40的区P0将不被视为与深度块60的区P0相同的区。
区边界链译码是3D-HEVC中用于对深度块(例如,深度PU)进行译码的另一基于分区的深度帧内预测模式。连同HEVC帧内预测模式及DMM模式一起引入区边界链译码模式以译码深度切片的帧内预测单元。为简洁起见,在下文描述的文字、表和图式中为简单起见,“区边界链译码模式”由“链译码”表示。
PU的链译码是以链的开始位置、链码的数目以及针对每一链代的方向索引来用信号表示。链是样本与其八个连接性样本中的一者之间的连接。图5说明链译码过程中界定的八个可能类型的链。图6说明具有一个深度预测单元(PU)分区模式的区边界链译码模式以及链译码中的经译码链。图5和6中说明链译码过程的一个实例。如图5中所展示,存在八个不同类型链,每一者被指派范围从0到7的方向索引。链是样本与其八个连接性样本中的一者之间的连接。
为了用信号表示图6中所示的任意分区模式,视频编码器识别分区模式且在位流中编码以下信息:
1.编码一位“0”以用信号表示:链从顶部边界开始
2.编码三位“011”以用信号表示顶部边界处的开始位置“3”
3.编码四位“0110”以将链的总数目用信号表示为7
4.编码一系列已连接链索引“3、3、3、7、1、1、1”,其中使用查找表将每一链索引转换成码字。
如图5的块70中所示,存在8个不同类型的链,每一者被指派范围从0到7的方向索引。链方向类型可辅助视频译码器确定深度块的分割。应注意,可应用差分译码以用于用信号表示方向索引,而不是直接译码方向索引(0…7)。
图6的实例包含通过链76分隔开的第一分区72和第二分区74,所述链指示分割结构和分区之间的边界。视频编码器(例如,视频编码器20)可确定和用信号表示经编码位流中的PU的链76,而视频解码器(例如,视频解码器30)可剖析表示来自经编码位流的链76的数据。
大体来说,链76包含开始位置,其是链中的链路的数目(例如,链码的数目)以及对于每一链码的方向索引的指示。为了用信号表示图6的实例中所示的任意分区模式,视频编码器20可对一个位(例如,0)进行编码以指示链76从顶部边界开始。视频编码器20可对三个位(例如,011)进行编码以指示链76在顶部边界的第三深度样本之后开始。视频编码器20可对四个位(例如,0110)进行编码以指示链76中存在总共7个链路。视频编码器20还可对一系列连接的链索引(例如,3、3、3、7、1、1、1)进行编码以指示每一链链路的方向(例如,根据块70)。在一些实例中,视频编码器20可使用查找表将每一索引转换为码字。例如视频解码器30的视频解码器可剖析上述信令以确定块的分割型式。视频解码器30可随后解码每一分区的深度值。
对于将HEVC帧内预测模式应用于深度块(例如,PU),通过例如如HEVCWD10中的子条款8.4.2中指定,使用块的相邻样本针对块中的每一像素产生像素特定预测符值。对于上文所论述的各种3D-HEVC深度帧内模式,例如DMM和链译码,视频编码器20和/或视频解码器30通过使用深度块的多达两个相邻样本(例如,左边或上部相邻深度块的经重构样本)计算深度块(例如,PU)内的每一分区的分区特定DC预测符。视频译码器可采用的用于计算深度PU的每一分区的分区特定DC预测符的一个实例技术如下。
假设bPattern[x][y]为PU的分区模式,其中x=0..N-1,y=0..N-1且N是PU的宽度。bPattern[x][y]指示特定像素(x,y)属于哪一分区且bPattern[x][y]可等于0或1。假设BitDepth为深度样本的位深度且假设RecSample[x][y]为PU的经重构相邻样本,其中x=-1且y=0..N-1(对应于PU的左边相邻像素)或y=-1,x=0..N-1(对应于PU的上方相邻像素)。随后,可如下导出分区X的DC预测符,即DCPred[X],其中X=0或1:
●设定bT=(bPattern[0][0]!=bPattern[N-1][0])?1:0
●设定bL=(bPattern[0][0]!=bPattern[0][N-1])?1:0
●如果bT等于bL
-DCPred[X]=(RecSample[-1][0]+RecSample[0][-1])>>1
-DCPred[1-X]=bL?(RecSample[-1][N-1]+RecSample[N-1][-1])>>1:2BitDepth-1
●否则
-DCPred[X]=bL?RecSample[(N-1)>>1][-1]:RecSample[-1][(N-1)>>1]
-DCPred[1-X]=bL?RecSample[-1][N-1]:RecSample[N-1][-1]
根据3D-HEVC,视频编码器20和/或视频解码器30还可应用在3D-HEVC中与HEVC帧内预测模式、DMM模式和链译码模式一起介绍的简化深度译码(SDC)模式,来对深度切片的帧内PU进行译码。更确切地说,视频编码器20和/或视频解码器30可应用SDC模式以对深度块的残余数据进行译码。对于3D-HEVC,视频编码器20用信号表示用于每一帧内深度PU的额外旗标以指定当前PU是否是使用SDC模式经译码。在针对3D-HEVC的现存提议中,SDC仅应用于2Nx2NPU分区大小,且未应用于小于2Nx2N的PU分区大小。另外,在3D-HEVC的现存提议中,SDC仅应用于深度PU的两个类型的分割,即,DMM模式1(2分区)和平面(1分区,即不分割)。
当使用SDC时,视频编码器20不包含深度块中的全部样本的个别残余值,且不产生经量化变换系数。替代于译码经量化变换系数,在SDC模式中,视频编码器20以如下类型的信息表示深度块:
1.当前深度块的分区类型,包含:
a.DMM模式1(2分区),以及
b.平面(1分区);且
2.对于每一分区,在位流中用信号表示单个残余值(像素域中)。
因此,在SDC中,视频编码器20对于每一PU或经帧内译码深度CU的PU的每一分区编码仅一个残余。对于每一PU或PU的分区,替代于编码每一像素的差,视频编码器20确定原始信号的DC或代表值(例如,PU或分区中的像素的平均值,表示为Aver)与基于来自当前PU的一或多个相邻样本(例如,相邻样本的平均值)产生的预测信号或预测符(表示为Pred)之间的差,且使用此差作为PU或分区中的全部像素的DC残余。视频编码器20可随后用信号表示或编码PU或分区的此DC残余值以供视频解码器30接收或解码。
对于3D-HEVC,SDC中界定两个子模式,包含SDC模式1和SDC模式2,其对应于平面和DMM模式1的分区类型。在SDC中,如上所提到,视频编码器20不应用变换或量化。同样,在SDC中,视频解码器30不应用逆量化或逆变换操作。
深度值可使用深度查找表(DLT)任选地映射到索引,视频编码器20可通过在编码全视频序列之前分析第一帧内周期内的帧而构造所述DLT。在3D-HEVC的现存提议中,全部有效的深度值按升序分类且以增加的索引插入到DLT中。根据3D-HEVC的现存提议,如果使用DLT,那么整个DLT由视频编码器20在例如序列参数集(SPS)或视频参数集(VPS)等参数集中发射到视频解码器30,且经解码索引差值由视频解码器30基于DLT而映射回到深度值。通过使用DLT,观察到进一步译码增益。
DLT是任选的译码工具。根据HTM9.0,如果在分析步骤从0到MAX_DEPTH_VALUE(例如,用于8位深度样本的255)的超过二分之一的值在原始深度图中出现,那么视频编码器20将不使用DLT。否则,视频译码器将对SPS或VPS中的DLT进行译码。为了对DLT进行译码,视频译码器以指数-哥伦布码对有效深度值的数目进行译码。随后,视频译码器以指数-哥伦布码对每一有效深度值进行译码。
为了产生DLT,视频编码器20可从待编码的输入视频序列读取预定义数目的帧,且扫描全部样本以获得可用深度图值。在此过程期间,视频编码器20基于原始未经压缩深度图产生将深度值映射到有效深度值的映射表。
深度查找表Idx2Depth(.)、索引查找表Depth2Idx(.)、深度映射表M(.)和有效深度值的数目dvalid是通过以下算法导出,其分析深度图Dt
1.初始化
●布尔型向量B(d)=FALSE对于全部深度值d
●索引计数器i=0
2.针对多个时间实例t处理Dt中的每一像素位置p:
●设定B(Dt(p))=TRUE以标记有效深度值
3.对B(d)→dvalid中的TRUE值的数目进行计数
4.对于具有B(d)==TRUE的每一d:
●设定Idx2Depth(i)=d
●设定M(d)=d
●设定Depth2Idx(d)=i
●i=i+1
5.对于具有B(d)==FALSE的每一d:
●找出
●设定
●设定
从索引Idx返回到深度值d的映射如下:d=Idx2Depth[Idx]。从深度值d到索引Idx的映射如下:Idx=Depth2Idx[d]。
对于SDC模式中的DC残余值的信令,如上文所描述,对于每一分区或在不分割的情况下对于整个深度块,视频编码器20用信号表示经编码位流中的DC残余值而无需变换和量化。DC残余值可为深度块或其分区内的深度像素值的DC(代表)值(例如,用于平均值的Aver)与DC预测符值(Pred)之间的差。应注意,视频编码器20可取决于DLT的使用而使用两个不同方法用信号表示残余:
1.当未使用DLT时,视频编码器20直接发射或编码DC残余值进入位流,例如当前PU形式中的当前深度块或其分区的代表值或DC值(Aver)与其DC预测符值(Pred)之间的差量。
2.当使用DLT时,替代于直接用信号表示或译码残余值,即深度值的差,视频编码器20用信号表示或译码索引的差到DLT,即DLT中当前分区的代表值(例如,Aver)的索引与预测符(Pred)的索引之间的差。视频解码器30基于所述DLT将经解码索引差和Pred的索引的总和映射回到深度值。
在一些实例中,当当前分区的代表值(例如,Aver)的值或预测符(Pred)的值未包含在DLT中时,视频译码器可将值映射到索引I,其中(Pred/Aver-DLT中的第i条目的值)的绝对值是最小的一者。
SDC的现存提议存在问题。举例来说,根据3D-HEVC的现存提议,SDC仅应用于某些深度帧内预测模式并且更确切地说应用于DMM模式1和平面模式。因此,作为SDC的部分的简化残余译码的益处无法在其它深度帧内模式中实现,例如DMM模式3、DMM模式4、链译码模式或其它HEVC帧内模式(平面模式除外)。此些益处可包含增加的译码效率。
本发明描述可解决SDC的现存提议的问题的技术。举例来说,本发明描述可应用于比3D-HEVC中对于SDC已提议的模式宽的可能深度帧内预测模式集合的用于简化残余译码的技术。以此方式,例如较大译码效率等简化残余译码的益处可针对根据更广泛多种深度帧内译码模式译码的深度块实现。
根据本发明的一些实例技术,当根据至少三个深度帧内预测模式中的任一者帧内预测译码深度块时,视频译码器可执行SDC模式,且应用简化残余译码。视频译码器可因此对深度块的单个DC残余值或深度块的分区的相应DC残余值进行译码,例如编码或解码。所述三个或三个以上深度帧内预测模式包含除DMM1和平面外的一或多个深度帧内预测模式。在一些实例中,视频译码器跳过残余值的变换和量化(或逆量化和逆变换)。在一些实例中,不产生额外残余,即,变换树不存在于基于HEVC的3D编解码器中。
举例来说,根据本发明的技术配置的视频译码器可根据DMM3、DMM4或链译码模式分割深度块,且执行SDC模式以确定深度块的所述两个分区中的每一者的两个DC残余值。对于在此些实例中的简化残余译码,视频编码器20编码且视频解码器30解码PU的每一分区的一个DC残余值。
在一些实例中,根据本发明的技术配置的视频译码器可根据例如DC模式和方向性模式2到34等非基于分割的HEVC帧内预测模式中的一者确定深度块的每一像素的像素特定预测符值。以此些HEVC帧内预测模式译码的深度块(例如,PU)具有一个分区,即,PU内的全部像素在同一分区中。对于在此些实例中的简化残余译码,视频编码器20编码且视频解码器30解码深度块的一个DC残余值。视频编码器20可基于表示深度块的深度像素值的DC深度值(例如,深度块的深度像素值的平均)和表示像素特定预测符值的DC值而确定DC残余值。视频解码器30可通过针对每一像素以像素特定预测符值求和DC残余值而重构深度块。
对于用于DMM模式和链译码模式的简化残余译码,视频编码器20可仅需要用信号表示用于视频块(例如,PU)的两个DC残余值(用于每一分区的一个DC残余值)。对于用于原始HEVC帧内预测模式(例如,DC、平面和方向性模式)的简化残余译码,视频编码器可仅需要用信号表示用于整个PU的一个DC残余值。在一些实例中,甚至当应用简化残余译码时,量化仍可应用于DC残余值。
在一些实例中,视频编码器20及视频解码器30可当深度帧内预测译码给定深度块时选择性应用SDC模式。在此些实例中,视频编码器20可将指示SDC模式是否针对深度块执行的信息、一或多个语法元素(例如,旗标)编码到位流中且视频解码器30可从位流解码所述信息。视频编码器20可确定且用信号表示SDC模式是否针对深度块逐块地、逐切片地、逐图片地、逐序列地或以其它基础执行。视频编码器20可编码且视频解码器30可解码(作为实例)切片标头、例如图片参数集(PPS)、SPS或VPS等参数集或补充增强信息(SEI)消息中的语法元素或其它信息。在其中SDC模式是逐块地选择性应用的实例中,语法元素(例如,旗标)或其它信息可包含在映射或其它数据结构中,例如切片标头中,其使深度块相关到SDC模式是否针对深度块执行的相应指示。
在一些实例中,视频译码器可推断SDC模式是否针对特定深度块执行。举例来说,视频译码器可当深度块是一或多个特定深度帧内预测模式(例如,基于分区的3D-HEVC帧内预测模式中的任何一或多者)经帧内译码时始终执行SDC模式,或可针对某些深度帧内预测模式从不执行SDC模式。在一些实例中,视频译码器可基于块的特性(例如大小)推断SDC模式是否针对特定深度块执行。举例来说,视频译码器可仅当块(例如,PU)小于32x32时和/或仅当块(例如,PU)分区大小是2Nx2N时执行SDC模式。
在3D-HEVC的现存提议中,DMM1、DMM3、DMM4和链译码模式可具有分别对应于模式数目36、38、40和42的用信号表示的差量DC。根据本发明的技术的简化残余译码可不适用于这些模式。在此些情况下,用以指示简化残余译码的语法可不需要针对那些模式存在。替代地或另外,此些模式可从标准移除,以使得它们不由根据标准配置的视频译码器执行。
虽然深度块或其分区的每一像素的预测符值可根据深度帧内预测模式中的至少一些不同,但当视频译码器执行SDC模式且使用简化残余译码用于当前深度块(例如,深度PU)时,所述块或分区中的每一像素的残余可相同,如DC残余值指定。对于根据非基于分区(例如,HEVC)帧内预测模式译码的深度块,视频译码器可根据如基础标准(例如,HEVC)中指定而产生的帧内预测符产生像素特定预测符值,即PredSample[x][y]。对于根据DMM模式或链译码模式中的一者译码的深度块,视频译码器可产生分区特定DC预测符,DCPred[i],如3D-HEVC中指定。
当未使用DLT时,对于每一像素(x,y),视频编码器20及视频解码器30可使用三个变量以确定DC残余值(视频编码器20)或根据本发明根据简化残余预测模式基于DC残余值重构深度块(视频解码器30)。确切地说,视频编码器20及视频解码器30可利用:(1)PredSample[x][y],(2)分区特定DC预测符,即DCPred[i],其中i是到像素属于的分区的索引;以及(3)分区特定DC残余,即DCResi[i]。举例来说,视频解码器30可如下计算深度块的经重构像素值,即RecSample[x][y]:
●RecSample[x][y]=PredSample[x][y]+DCResi[i]+DCPred[i]。在基于分区的3D-HEVC深度帧内译码模式中,PredSample[x][y]可设定成0。在非基于分区的HEVC深度帧内预测模式中,DCPred[i]可设定成0。
一般来说,视频编码器20基于用以对深度块进行编码的深度帧内预测模式确定深度块或其分区的DC预测符值。举例来说,对于基于分区的帧内预测模式,视频解码器20基于一或多个经重构相邻深度块的一或多个样本确定每一分区的相应DC预测符值。对于非基于分区的帧内预测模式,视频编码器20基于深度块的像素特定预测符值的子集(例如,深度块的四个拐角和/或中心预测符值)确定深度块的DC预测符值。视频编码器20还确定深度块或分区的DC深度值(例如,深度像素值的平均),且将深度块或分区的DC残余值确定为当前块或分区的DC深度值与所述块或分区的DC预测符值之间的差。视频编码器20确定深度块或分区的DC残余值为当前块或分区的DC深度值与所述块或分区的DC预测符值之间的差。
视频解码器30可确定以非基于分区的帧内预测模式译码的深度块的像素特定预测符值,或以基于分区的帧内预测模式译码的深度块的分区特定预测符值。在任一情况下,视频解码器30将预测符值与DC残余值求和以重构深度块。
当使用DLT时,视频解码器30可如下计算RecSample[x][y],其中Index2Depth和Depth2Idx分别是索引查找表和深度查找表:
●对于非基于分区(例如,HEVC)深度帧内预测模式:
○RecSample[x][y]=PredSample[x][y]+Idx2Depth[Depth2Idx[DCPred[i]]+DCResi[i]]-DCPred[i]
●在基于分区(例如,3D-HEVC)深度帧内预测模式中:
○RecSample[x][y]=Idx2Depth[Depth2Idx[DCPred[i]]+DCResi[i]]。
因此,视频编码器20可将深度块或分区的DC深度值的DLT中的索引与深度块或分区的DC预测符值的DLT中的索引之间的差编码为深度块或其分区的DC残余值。视频解码器30对所述差进行解码。视频解码器30还确定深度块的DC预测符值。对于根据基于分区的深度帧内预测译码模式解码的深度块,视频解码器30根据模式,例如基于深度块的一或多个相邻样本确定分区的相应DC预测符,如上文所描述。对于根据非基于分区的深度帧内预测译码模式解码的深度块,视频解码器30基于根据帧内预测模式确定的像素特定预测符值的子集确定深度块的单个DC预测符。
在一些实例中,对于每一非基于分区的HEVC帧内预测模式,可例如如下产生深度块(例如,PU)的DC预测符DCPred[0]作为深度块的预测块的四个拐角像素的平均:假设w和h分别为PU的宽度和高度,DCPred[0]=(PredSample[0][0]+PredSample[0][w-1]+PredSample[h-1][0]+PredSample[h-1][w-1]+2)>>2。在一些实例中,对于每一非基于分区的HEVC帧内预测模式,甚至可利用当前PU的预测块的较少像素(例如,1或2个像素)来计算DC值的预测符。在一些实例中,可利用PU的预测块的中心像素作为DCPred[0]。另外,虽然本文论述如HEVC中指定的帧内预测,但当前PU的预测块可以除HEVC中指定的那些方式外的任何多种方式产生。
在一些实例中,对于其中使用DLT的基于分区或非基于分区的帧内预测,视频解码器30确定DLT中的DC预测符值的索引,且确定DC预测符值的索引与从位流解码的差的总和。视频解码器30进一步将与DC预测符值和深度查找表中的差的总和相关联的深度值识别为深度块或其分区的DC深度值。在非基于分区的帧内预测的情况下,视频解码器30可进一步将经识别深度值与DC预测符值之间的差确定为深度块的DC残余值,并且为了重构深度块的深度值,将像素的相应预测值与所确定的差求和。
在根据本发明的一些实例中,用于DMM模式1、DMM模式3、DMM模式4、链译码模式和HEVC帧内预测模式的简化残余译码的信令可统一。一般来说,如上文所论述,视频编码器20可编码且视频解码器30可解码指示深度帧内预测模式中的哪一者用以对深度块进行译码且在一些情况下SDC模式是否针对深度块执行的信息。在一些实例中,视频译码器可对指示基于分区或非基于分区的深度帧内预测模式是否用以对深度块进行译码的信息(例如,旗标或其它语法元素)进行译码。
在一些实例中,视频译码器可译码(例如,视频编码器可编码或视频解码器可解码)第一语法元素(例如,一位旗标),其指示非基于分区的HEVC帧内预测模式是否用于深度块(例如,PU)。替代地或另外,当PU大小大于32x32时可不需要此第一语法元素。在此些实例中,视频解码器30可推断非基于分区的帧内预测模式用以对深度块进行编码。在一些实例中,第一语法元素的第一值指示从多个深度帧内预测模式为深度块选择的深度帧内预测模式是非基于分区的HEVC帧内预测模式,例如平面帧内预测模式、DC帧内预测模式或方向性帧内预测模式中的一者,且第一语法元素的第二值指示为深度块选择的深度帧内预测模式是基于分区的帧内预测模式,例如多个深度模型化模式或区边界链译码模式中的一者。在一些实例中,第一语法元素是hevc_intra_flag。在一些实例中,等于1的hevc_intra_flag意味着HEVC帧内预测模式用于译码单元,且等于0的hevc_intra_flag意味着额外深度帧内预测模式用于译码单元。在一些实例中,第一语法元素包含在帧内模式扩展结构中。在一些实例中,第一语法元素包含在depth_mode_parameters语法结构中。
在一些实例中,视频译码器可对第二语法元素(例如,一位旗标)进行译码,其指示SDC模式和简化残余译码是否用于深度块(例如,深度PU)。在一些实例中,第二语法元素是sdc_flag。在一些实例中,等于1的sdc_flag意味着SDC模式用于译码单元,且等于0的sdc_flag意味着SDC模式未用于译码单元或预测单元。在一些实例中,第二语法元素包含在帧内模式扩展结构中。在一些实例中,第二语法元素包含在depth_mode_parameters语法结构中。
替代地或另外,仅当PU分区大小是2Nx2N时需要此第二语法元素。如果PU分区大小不是2Nx2N,那么视频解码器30可推断SDC模式未执行。在一些实例中,如果第一语法元素指示(或推断)未使用非基于分区的帧内预测模式对深度块进行编码,那么视频译码器对第三语法元素进行译码,其指示DMM模式1、DMM模式3、DMM模式4或链译码模式中的哪一者用于译码深度块。在一些实例中,区边界链译码模式未使用或不可用于译码深度块。在此些实例中,视频译码器可不需要对第三语法元素进行译码,且等于0的第一语法元素(例如,hevc_intra_flag)的第一值指示DMM模式用以对当前深度块进行帧内译码。在一些实例中,当区边界链译码模式未使用或不可用于译码深度块时,第一语法元素(例如,hevc_intra_flag)的第二值未经译码,且第一语法元素的第一值指示DMM模式用以对当前深度块进行帧内译码。
在根据本发明的技术的一些实例中,视频译码器以与3D-HEVC的现存提议中针对SDC指定的方式相同的方式用信号表示和/或译码深度块或其分区的DC残余值。更具体来说,对于每一分区,为了用信号表示或译码DC残余值,可用信号表示或译码以下语法元素:
●指示DC残余值是否等于0的语法元素。
●指示DC残余值是否是正整数或负整数的语法元素。
○仅当DC残余值不等于0时需要此语法。
●指示“DC残余值的绝对值”减1的语法元素。
○仅当DC残余值不等于0时需要此语法。
在一些实例中,根据本发明的技术的简化残余译码仅应用于具有2Nx2N分区大小的CU。在一些实例中,简化残余译码仅应用于某些深度帧内模式。
上文根据一或多个实例描述的本发明的技术的实施方案可如下。语法和语义说明为相对于3D-HEVC草案文本1的改变,其中对3D-HEVC草案文本1的添加以带下划线的文字表示,且从3D-HEVC草案文本1的删除以删除线文字表示。
深度模式参数语法
一般译码单元语法
深度模式参数帧内语义
等于1的hevc_intra_flag[x0][y0]指定具有在0到34的范围内的 intraPredMode的帧内模式用于当前预测单元。等于0的hevc_intra_flag[x0][y0]指定另 一帧内模式用于当前预测单元。当不存在时,hevc_intra_flag[x0][y0]推断为等于1。
等于1的sdc_flag[x0][y0]指定当前预测单元的每一分区的残余仅由sdc_ residual_flag[x0][y0][i]、sdc_residual_sign_flag[x0][y0][i]和sdc_residual_abs_ minus1[x0][y0][i]表示。等于0的sdc_flag[x0][y0]指定更多残余可存在于变换树中。当 不存在时,sdc_flag[x0][y0]推断为等于0。
●depth_intra_mode[x0][y0]指定当前预测单元的深度帧内模式。表H-2指定 变量depthIntraModeMaxLen的值和变量DepthIntraMode的值以及取决于depth_intra_mode相关联名称。当depth_intra_ mode[x0][y0]不存在时,DepthIntraMode推断为等于4。
SdcFlag[x0][y0]设定成等于sdc_flag[x0][y0]。[编者(CY):可手动地进行从SdcFlag到sdc_flag的代替以避免此设定。]
●变量DmmFlag[x0][y0]如下文指定导出:
DmmFlag[x0][y0]=
(DepthIntraMode[x0][y0]==INTRA_DEP_DMM_WFULL)||(H-18)
(DepthIntraMode[x0][y0]==INTRA_DEP_DMM_CPREDTEX)||
(DepthIntraMode[x0][y0]==INTRA_DEP_DMM_WPREDTEX)
表H-2-取决于depth_intra_mode的DepthIntraMode和相关联名称的规范以及depthIntraModeMaxLen的规范
depthIntraModeMaxLen 3
DepthIntraMode 相关联名称 depth_intra_mode
0 INTRA_DEP_DMM_WFULL 0
1 INTRA_DEP_DMM_CPREDTEX 2
2 INTRA_DEP_DMM_WPREDTEX 6
3 INTRA_DEP_CHAIN 7
替代地,也可取决于CU大小和分割模式而二进制化depth_intra_mode,而不是 独立于其它语法元素而二进制化depth_intra_mode。替代地可如下界定depth_intra_mode [x0][y0]的语法和语义:
●depth_intra_mode[x0][y0]指定当前预测单元的深度帧内模式。表H-2指定取决于depthDmmRbcModeSet 的变量depthIntraModeMaxLen的值和变量DepthIntraMode的值以及取决于depth_intra_mode和depthDmmRbcModeSetdepthIntraModeSet的相关联名称。当depth_intra_mode[x0][y0]不存在时, DepthIntraMode推断为等于4。
变量depthDmmRbcModeSet如下文中指定导出:
如果cLog2CbSize等于3且PartMode[xC][yC]等于PART_NxN,那么将 depthDmmRbcModeSet设定成等于1。
否则(cLog2CbSize不等于3或PartMode[xC][yC]不等于PART_NxN),那么将 depthDmmRbcModeSet设定成等于0。
表H-2-取决于depthDmmRbcModeSet和depth_intra_mode的DepthIntraMode和相 关联名称的规范以及取决于depthDmmRbcModeSet的depthIntraModeMaxLen的规范
替代地,将其中应用简化残余译码的模式视为新的深度帧内模式且以当前语法 元素(例如,depth_intra_mode)用信号表示。以此方式,不需要引入额外语法元素,例如 hevc_intra_flag和sdc_flag。
解码过程
●用于明度帧内预测模式的H.8.4.2导出过程
○对此过程的输入是:
■指定当前块的左上方明度样本相对于当前图片的左上方明度样本的明度位置(xB,yB),
■指定当前明度预测块的大小的变量log2PbSize。
○表H-4指定用于帧内预测模式的值和相关联名称。
表H-4-帧内预测模式和相关联名称的规范
帧内预测模式 相关联名称
0 Intra_Planar
1 Intra_DC
2..34 Intra_Angular
35...40 Intra_DepthPartition(仅用于深度)
其它(41,42) Intra_Chain(仅用于深度)
○标记0..34的IntraPredMode[xB][yB]表示预测的方向,如图8-1中说明。
如果DepthIntraMode[xB][yB]等于INTRA_DEP_DMM_WFULL,那么将IntraPredMode[xB][yB]设定成等于Intra_DepthPartition(35+dmm_dc_flag[xB][yB])。
■否则,如果DepthIntraMode[xB][yB]等于INTRA_DEP_DMM_WPREDTEX,那么将IntraPredMode[xB][yB]设定成等于Intra_DepthPartition(37+dmm_dc_flag[xB][yB])。
■否则,如果DepthIntraMode[xB][yB]等于INTRA_DEP_DMM_CPREDTEX,那么将IntraPredMode[xB][yB]设定成等于Intra_DepthPartition(39+dmm_dc_flag[xB][yB])。
■否则,如果DepthIntraMode[xB][yB]等于INTRA_DEP_CHAIN,那么将IntraPredMode[xB][yB]设定成等于Intra_Chain(41+edge_dc_flag[xB][yB])。
■否则(DepthIntraMode[xB][yB]等于4 ),按以下有序步骤导出IntraPredMode[xB][yB]。
●H.8.4.4.2.1一般帧内样本预测
○子条款8.4.4.2.1中的规范适用,其中以下段落添加到子条款的末尾:
将变量bSamplePredFlag设定为1。
■如果intraPredMode等于Intra_DepthPartition(35,36),那么以位置(xB0,yB0)、帧内预测模式intraPredMode、样本阵列p和变换块大小nT作为输入调用子条款H.8.4.4.2.7中指定的对应帧内预测模式,且输出是预测样本阵列predSamples。
■否则,如果intraPredMode等于Intra_DepthPartition(37,38),那么以位置(xB0,yB0)、帧内预测模式intraPredMode、样本阵列p和变换块大小nT和bSamplePredFlag作为输入调用子条款H.8.4.4.2.8中指定的对应帧内预测模式,且输出是预测样本阵列predSamples。
■否则,如果intraPredMode等于Intra_DepthPartition(39,40),那么以位置(xB0,yB0)、帧内预测模式intraPredMode、样本阵列p和变换块大小nT和bSamplePredFlag作为输入调用子条款H.8.4.4.2.9中指定的对应帧内预测模式,且输出是预测样本阵列predSamples。
■否则,如果intraPredMode等于Intra_Chain(41,42),那么以位置(xB0,yB0)、帧内预测模式intraPredMode、样本阵列p和变换块大小nT和bSamplePredFlag作为输入调用子条款H.8.4.4.2.10中指定的对应帧内预测模式,且输出是预测样本阵列predSamples。
●H.8.4.4.3深度值重构过程
○对此过程的输入是:
■指定当前块的左上方明度样本相对于当前图片的左上方明度样本的明度位置(xB,yB),
■指定预测大小的变量nT
■预测样本predSamples[x][y],其中x,y=0..nT-1
■指定当前预测块的预测模式的变量intraPredMode
○此过程的输出是:
■经重构深度值样本resSamples[x][y],其中x,y=-1..2*nT-1。
将变量bSamplePredFlag设定为0。
○取决于intraPredMode,如下导出指定二进制分段模式的阵列wedgePattern[x][y],其中x,y=0..nT-1。
■如果intraPredMode等于Intra_DepthPartition(35),那么以下适用。
●wedgePattern=
WedgePatternTable[Log2(nT)][wedge_full_tab_idx[xB][yB]]
否则,如果intraPredMode等于Intra_DepthPartition(37),那么以位置(xB, yB)、帧内预测模式intraPredMode、变换块大小nT和bSamplePredFlag作为输入调用子条款 H.8.4.4.2.8,且输出是楔形波模式wedgePattern。
否则,如果intraPredMode等于Intra_DepthPartition(39),那么以位置(xB, yB)、帧内预测模式intraPredMode、变换块大小nT和bSamplePredFlag作为输入调用子条款 H.8.4.4.2.9,且输出是楔形波模式wedgePattern。
否则,如果intraPredMode等于Intra_Chain(41),那么以位置(xB,yB)、帧内预 测模式intraPredMode、变换块大小nT和bSamplePredFlag作为输入调用子条款 H.8.4.4.2.10,且输出是边缘模式wedgePattern。
■否则(intraPredMode小于 ),那么以下适用。
●对于x,y=0..nT-1,将wedgePattern[x][y]设定成等于0。
○取决于dlt_flag[nuh_layer_id],如下文指定导出经重构深度值样本resSamples[x][y]:
■如果dlt_flag[nuh_layer_id]等于0,那么以下适用:
●对于x,y=0..nT-1,如下文指定导出经重构深度值样本resSamples[x][y]:
●resSamples[x][y]=predSamples[x][y]+SdcResidual[xB][yB][wedgePattern[x][y]](H-54)
■否则(dlt_flag[nuh_layer_id]等于1),以下适用:
●对于在0到1的范围内的p,如下文指定导出变量dcPred[0]和dcPred[1]:
○否则,如果intraPredMode小于35 ,那么以下适用:
dcPred[0]=(predSamples[0][0]+predSamples[0][nT-1]+predSamples[nT- 1][0]predSamples[nT-1][nT-1]+2)>>2(H-56)
○否则,如果 intraPredMode等于Intra_DepthPartition(35)或intraPredMode 等于Intra_DepthPartition(37) ,那么以下适用。
■dcPred[wedgePattern[0][0]]=predSamples[0][0](H-57)
■dcPred[wedgePattern[nT-1][0]]=predSamples[nT-1][0](H-58)
■dcPred[wedgePattern[0][nT-1]]=predSamples[0][nT-1](H-59)
■dcPred[wedgePattern[nT-1][nT-1]]=predSamples[nT-1][nT-1](H-60)
否则,(intraPredMode等于Intra_DepthPartition(39)或intraPredMode等于 Intra_Chain(41)),以下适用。
dcPred[wedgePattern[0][0]]=predSamples[0][0]
dcPred1Found=0;
●对于x,y=0..nT-1,如下文指定导出经重构深度值样本resSamples[x][y]:
dltIdxPred=DepthValue2Idx[dcPred[wedgePattern[x][y]]](H-61)
dltIdxResi=SdcResidual[xB][yB][wedgePattern[x][y]](H-62)
resSamples[x][y]=predSamples[x][y]+
Idx2DepthValue[dltIdxPred+dltIdxResi]
-dcPred[wedgePattern[x][y]](H-63)
●Intra_DepthPartition(37,38)预测模式的H.8.4.4.2.8规范
○对此过程的输入是:
■指定当前块的左上方样本相对于当前图片的左上方样本的样本位置(xB,yB),
■指定帧内预测模式的变量intraPredMode,
■相邻样本p[x][y],其中x,y=-1..2*nT-1,
■指定变换大小的变量nT,
指定是否产生预测样本的变量bSamplePredFlag
○此过程的输出是:
■预测样本predSamples[x][y],其中x,y=0..nT-1。
楔形波模式wedgePattern[x][y],其中x,y=0..nT-1。
○当intraPredMode等于37或38时调用此帧内预测模式。
○假设textureComp为具有等于ViewIdx的视图次序索引和等于0的DepthFlag的纹理视图分量。将变量texturePredMode设定成等于textureComp的PredMode[xB][yB]。将变量textureIntraPredMode设定成等于textureComp的IntraPredMode[xB][yB]。[编者(GT)考虑显式地存储texturePredMode和textureIntraPredMode。]
○通过以下有序步骤导出预测样本predSamples[x][y]的值,其中x,y=0..nT-1:
1.取决于texturePredMode和textureIntraPredMode,如下文指定导出指定候选者wedgelets的索引的列表candWedgeIndList:
a.如果texturePredMode等于MODE_INTRA且textureIntraPredMode在2到34的范围中,那么以下适用。
candWedgeIndList=TextModePredWedgeIndTable[Log2(nT)][texturePredMode](H-34)
b.否则(texturePredMode不等于MODE_INTRA或textureIntraPredMode不在2到34的范围中),那么以下适用。
candWedgeIndList=CoarseWedgeIndTable[Log2(nT)](H-35)
2.变量wedgeIdx导出为:
wedgeIdx=
candWedgeIndList[wedge_predtex_tab_idx[xB][yB]](H-36)
3.指定二进制分区模式的变量wedgePattern[x][y](其中x,y=0..nT-1)导出为:
wedgePattern=WedgePatternTable[Log2(nT)][wedgeIdx](H-37)
4.当bSamplePredFlagis等于1时,以相邻样本p[x][y]、二进制模式wedgePattern[x][y]、变换大小nT、设定成等于(intraPredMode==Intra_DepthPartition(38))的dcOffsetAvailFlag、设定成等于0的intraChainFlag以及DC偏移DcOffset[xB][yB][0]和DcOffset[xB][yB][1]作为输入调用如子条款H.8.4.4.2.11中指定的深度分区值导出和指派过程,且输出指派给predSamples[x][y]。
●H.8.4.4.2.9Intra_DepthPartition(39,40)预测模式的规范
○对此过程的输入是:
■指定当前块的左上方样本相对于当前图片的左上方样本的样本位置(xB,yB),
■指定帧内预测模式的变量intraPredMode,
■相邻样本p[x][y],其中x,y=-1..2*nT-1,
■指定变换大小的变量nT,
指定是否产生预测样本的变量bSamplePredFlag
○此过程的输出是:
■预测样本predSamples[x][y],其中x,y=0..nT-1
楔形波模式wedgeletPattern[x][y],其中x,y=0..nT-1。
○当intraPredMode等于39或40时调用此帧内预测模式。
○通过以下有序步骤指定导出预测样本predSamples[x][y]的值,其中x,y=0..nT-1:
1.将变量recTextPic设定成等于具有等于ViewIdx的视图次序索引和等于0的DepthFlag的视图分量的经重构明度图片样本的阵列。
2.如下文指定导出指定用于recTextPic的分段的阈值的变量textThresh。
a.将变量sumTextPicVals设定成等于0。
b.对于x=0..nT-1,以下适用
i.对于y=0..nT-1,以下适用
sumTextPicVals+=recTextPic[xB+x][yB+y](H-38)
c.将变量textThresh设定成等于(sumTextPicVals>>(2*log2(nT)))
3.如下文指定导出指定二进制分区模式的变量wedgeletPattern[x][y],其中x,y=0..nT-1。
a.对于x=0..nT-1,以下适用
i.对于y=0..nT-1,以下适用
wedgeletPattern[x][y]=(recTextPic[xB+x][yB+y]>textThresh)(H-39)
4.当bSamplePredFlag等于1时,以相邻样本p[x][y]、二进制模式wedgeletPattern[x][y]、变换大小nT、设定成等于(intraPredMode==Intra_DepthPartition(40))的dcOffsetAvailFlag、设定成等于0的intraChainFlag以及DC偏移DcOffset[xB][yB][0]和DcOffset[xB][yB][1]作为输入调用如子条款H.8.4.4.2.11中指定的深度分区值导出和指派过程,且输出指派给predSamples[x][y]。
●Intra_Chain(41,42)预测模式的H.8.4.4.2.10规范
○对此过程的输入是:
■指定当前块的左上方样本相对于当前图片的左上方样本的样本位置(xB,yB),
■指定帧内预测模式的变量intraPredMode,
■相邻样本p[x][y],其中x,y=-1..2*nT-1,
■指定变换大小的变量nT,
指定是否产生预测样本的变量bSamplePredFlag
○此过程的输出是:
■预测样本predSamples[x][y],其中x,y=0..nT-1。
边缘模式edgePattern[x][y],其中x,y=0..nT-1。
○当intraPredMode等于43或44时调用此帧内预测模式。
○如以下有序步骤指定导出预测样本predSamples[x][y]的值,其中x,y=0..nT-1。
1.当前预测单元中的链的开始点是从edge_start_left_flag[xB][yB]和edge_start_position[xB][yB]导出。
a.如果edge_start_left_flag[xB][yB]等于1,那么将开始点设定为s[0][yS],其中yS等于edge_start_position[xB][yB]。
b.否则,将开始点设定为s[xS][0],其中xS等于edge_start_position[xB][yB]。
2.边缘的数目和每一边缘的方向是从num_edge_codes_minus1[xB][yB]和edge_code[xB][yB][k]导出,其中k=0..num_edge_codes_minus1[xB][yB]。边缘的方向是从edge_code导出,如表H-3中所示。
3.通过连接每一边缘产生的区边界将预测样本predSamples[x][y](其中x,y=0..nT-1)分离为两个区:覆盖左上方像素(x0,y0)的区rA和覆盖剩余区的区rB。
a.对于x,y=0..nT-1,如下导出二进制模式edgePattern[x][y]:
i.如果(x,y)由rA覆盖,edgePattern[x][y]=0。
ii.否则,edgePattern[x][y]=1。
4.如果bSamplePredFlag等于1,那么以相邻样本p[x][y]、二进制模式edgePattern[x][y]、变换大小nT、设定成等于(intraPredMode==Intra_DepthPartition(44))的dcOffsetAvailFlag、设定成等于1的intraChainFlag以及DC偏移DcOffset[xB][yB][0]和DcOffset[xB][yB][1]作为输入调用如子条款H.8.4.4.2.11中指定的深度分区值导出和指派过程,且输出指派给predSamples[x][y]。
在一些实例中,视频译码器可使用CABAC熵译码过程对根据本发明的技术用信号表示的语法元素进行译码。举例来说,视频译码器可使用CABAC过程对第一语法元素(例如,hevc_intra_flag)进行译码,所述第一语法元素指示是否非基于分区(HEVC)深度帧内预测模式或基于分区的深度帧内预测模式用以对深度块进行译码。视频译码器还可使用CABAC过程对第二语法元素(例如,sdc_flag)进行译码,所述第二语法元素指示SDC模式是否用以对深度块进行译码。
在一些实例中,视频译码器如下确定在用于当前深度块(例如,深度CU/PU)的第一和第二语法元素(例如,hevc_intra_flag和sdc_flag)的CABAC译码中使用的上下文索引,其中nbLeft和nbAbove分别是当前CU/PU的左边和上方相邻块:
●将hevc_intra_flag的上下文索引计算为:
○nbLeft的hevc_intra_flag+nbAbove的hevc_intra_flag
●将sdc_flag的上下文索引计算为:
●nbLeft的sdc_flag+nbAbove的sdc_flag
上下文索引值可为0、1或2。因此,在一些实例中,三个上下文分别用于hevc_intra_flag和sdc_flag两者。在一些实例中,对于每一上下文,视频译码器将0和1的概率初始化为等于0.5,其是相等概率状态。相等概率状态对应于由HEVC规范中的变量initValue表示的初始化值,用于等于154的上下文变量的初始化。然而,对于两个旗标,1的值可以比0的值高得多的概率发生。因此,对于hevc_intra_flag或sdc_flag,等概率分布可不良好地与真实概率分布匹配,并且因此将增加视频译码器对旗标进行译码所花费的位。
因此,在根据本发明的技术的一些实例中,视频译码器(例如,视频编码器20和/或视频解码器30)经配置以将在帧内SDC信令中使用的语法元素(例如,hevc_intra_flag和/或sdc_flag)的CABAC译码的概率状态初始化为非相等概率状态。举例来说,视频译码器可经配置以将用于CABAC译码hevc_intra_flag的概率状态初始化为非相等概率状态。在一些实例中,针对hevc_intra_flag和sdc_flag两者提出不同的初始概率。在下文描述的实例技术中,以与HEVC标准中所公开的方式相同的方式在上下文变量的初始化过程中使用变量initValue,且以与HEVC标准中所公开的方式相同的方式更新经初始化概率状态。
在一些实例中,视频译码器通过参考当前深度块的相邻块的相应旗标的值而确定用于译码当前深度块(例如,PU)的语法元素(例如hevc_intra_flag和/或sdc_flag)的初始概率状态。在一些实例中,为用于当前块的旗标(例如,hevc_intra_flag和/或sdc_flag)提供三个初始化概率状态,所述初始化概率状态中的每一者与以下条件中的一者相关联:(1)用于左边相邻块和上方相邻块两者的旗标的值是0;(2)用于一个相邻块(左边相邻块或上方相邻块)的旗标的值是0;以及(3)用于左边相邻块和上方相邻块两者的旗标的值是1。视频译码器可针对上文所列的三个情况中的每一者相应地更新初始化概率状态。
另外,对于hevc_intra_flag和/或sdc_flag,视频译码器可选择用于不同切片类型(例如,B切片、P切片或I切片)的initValue变量的不同值。换句话说,视频译码器可确定包含当前深度块的切片的切片类型,例如与当前PU相关联的切片类型,且基于所确定的切片类型从多个概率状态选择用于解码hevc_intra_flag和/或sdc_flag中的至少一者的初始概率状态。在一些实例中,视频译码器选择用于不同切片类型的hevc_intra_flag的initValue变量的不同值。
用于对不同上下文索引和切片类型的hevc_intra_flag进行译码的initValue变量的实例值在下文表1中展示。视频译码器可基于相邻块的hevc_intra_flag的值确定用于对当前深度块的hevc_intra_flag进行译码的上下文索引值(0、1或2),如上文所论述。类似地,用于对不同上下文索引和切片类型的sdc_flag进行译码的initValue变量的实例值在下文表2中展示。视频译码器可基于相邻块的sdc_flag的值确定用于对当前深度块的sdc_flag进行译码的上下文索引值(0、1或2),如上文所论述。
表1.hevc_intra_flag的ctxIdx的initValue的值。
ctxIdx(上下文索引) 0 1 2
B切片 154 155 156
P切片 141 185 214
I切片 155 170 157
表2.sdc_flag的ctxIdx的initValue的值。
ctxIdx(上下文索引) 0 1 2
B切片 214 229 230
P切片 215 202 174
I切片 213 201 246
在一些实例中,视频译码器仅使用且更新用于hevc_intra_flag的CABAC译码的一个初始化概率状态,无论当前预测单元的左边相邻块或上方相邻块的hevc_intra_flag的值如何。换句话说,视频译码器可设定用于译码当前深度块的hevc_intra_flag的初始概率状态而无需参考当前深度块的任何相邻深度块的hevc_intra_flag的值。在此些实例中,视频译码器可仍确定包含当前深度块的切片的切片类型,且基于所确定的切片类型从多个概率状态选择用于译码hevc_intra_flag的初始概率状态。用于译码不同切片类型的hevc_intra_flag的initValue变量的实例值在下文表3和4中展示。
表3.hevc_intra_flag的initValue的值。
B切片 169
P切片 127
I切片 142
表4.hevc_intra_flag的initValue的值。
B切片 154
P切片 141
I切片 155
在一些实例中,视频译码器仅使用且更新用于sdc_flag的CABAC译码的一个初始化概率状态,无论当前预测单元的左边相邻块或上方相邻块的sdc_flag的值如何。换句话说,视频译码器可设定用于译码当前深度块的sdc_flag的初始概率状态而无需参考当前深度块的任何相邻深度块的sdc_flag的值。在此些实例中,视频译码器可仍确定包含当前深度块的切片的切片类型,且基于所确定的切片类型从多个概率状态选择用于译码sdc_flag的初始概率状态。用于译码不同切片类型的sdc_flag的initValue变量的实例值在表5中展示。
表5.sdc_flag的initValue的值。
B切片 200
P切片 202
I切片 288
在一些实例中,视频译码器仅使用且更新用于hevc_intra_flag和sdc_flag中的每一者的CABAC译码的一个初始化概率状态,无论当前预测单元的左边相邻块或上方相邻块的hevc_intra_flag或sdc_flag的值如何。换句话说,视频译码器可设定用于译码当前深度块的hevc_intra_flag和sdc_flag两者的初始概率状态而无需参考当前深度块的任何相邻深度块的hevc_intra_flag和sdc_flag的值。
下文描述本发明的技术到解码过程的一或多个实例实施方案,例如视频解码器30根据本发明可实施。本发明的某些方面改变视频解码器30可实施的解码过程的CABAC剖析过程。由本发明的各方面添加的CABAC剖析过程的新部分由加下划线区分,且由本发明的各方面删除的CABAC剖析过程的部分由文字标记。本文所描述的改变是相对于3D-HEVC草案文本2。
如上文所论述,在一些实例中,视频译码器(例如视频解码器)选择不同初始概率状态以使用用于不同切片类型的CABAC过程并且还基于相邻块的上下文对hevc_intra_flag和sdc_flag进行译码。在一个实例CABAC剖析过程中,分别为用于每一切片类型(包含B切片、P切片和I切片)的hevc_intra_flag/sdc_flag提供三个初始化值(用以导出初始化概率状态)。根据实例,为hevc_intra_flag/sdc_flag提供总共九个初始化值,如下文表H-24和H-25中指定。另外,表H-10是视频解码器使用表H-24/H-25中的哪些初始化值用于每一切片类型的描述,其中等于0、1和2的initType分别对应于B切片、P切片和I切片。举例来说,视频解码器使用表H-24/H-25中具有等于3到5的ctxIdx的初始化值用于P切片。应注意ctxIdx是到用于给定语法元素/变量的某一上下文模型的索引。此外,当一起考虑时,下文的表H-22和H-23指定视频解码器在不同情况(对于全部切片类型)中使用表H-10中描述的哪一初始化值。在例如P切片的情况下,表H-10指定等于3到5的ctxIdx用于P切片。在此实例中,等于i的ctxInc意味着表H-24/H-25中等于3+i的ctxIdx用以对P切片中的深度块进行译码。
在典型CABAC译码中,可在具有或不具有对相邻块的相依性的情况下(例如,由视频解码器30和/或视频编码器20)译码语法元素。如果上下文变量的ctxIdx独立于相邻块,那么在下文表H-22中描述此变量的二进制化。否则(即,如果上下文变量的ctxIdx取决于相邻块),在下文表H-23中描述上下文变量的ctxInc。因此,针对给定语法元素,作为来自每一上下文变量的上下文模型的不同索引的ctxInc应在表H-22或表H-23中描述,但将不在两个表中都描述。在一些实例中,如上文所描述,hevc_intra_flag和/或sdc_flag的ctxIdx取决于相邻块。在此些实例中,hevc_intra_flag和/或sdc_flag的ctxInc在表H-23中描述。
H.9.3用于切片片段数据的CABAC剖析过程
H.9.3.2.2用于上下文变量的初始化过程
表H-10-用于初始化过程中的每一initializationType的ctxIdx和语法元素的关联
表H-24-sdc_flagctxIdx的变量initValue的值
表H-25-hevc_intra_flagctxIdx的变量initValue的值
H.9.3.4.2.1总则
子条款9.3.4.2.1中的规范适用于以下修改:表H-22附加到表9-37的末尾。
表H-22-对具有经上下文译码二进位的语法元素的ctxInc的指派
H.9.3.4.2.2使用左边和上方语法元素的ctxInc的导出过程
子条款9.3.4.2.2中的规范适用于以下修改:表H-23附加到表9-38的末尾。
表H-23-使用左侧及上方语法元素的ctxInc的规范
如上文所论述,在一些实例中,视频译码器(例如视频解码器)选择不同初始概率状态以使用用于不同切片类型的CABAC过程对hevc_intra_flag进行译码,但无需考虑相邻块的上下文。此些实例可提供用于不同切片类型但不取决于相邻块的上下文的非相等概率对hevc_intra_flag进行译码。在此些实例中,仅提供且更新一个初始化值(用以导出初始化概率状态)以用于每一切片类型的hevc_intra_flag的CABAC译码。因此,在表H-25中提供三个初始化值(包含B切片、P切片和I切片的每一切片类型一个),且因此也修改表H-10。同时,hevc_intra_flag的ctxIdx始终是0,且独立于相邻块。因此,根据此些实例实施方案,hevc_intra_flag的ctxInc从表H-23移除,且添加到表H-22中。
将对此实例实施方案的3D-HEVC草案文本2的改变说明为相对于先前实例实施方案的改变,其中基于相邻块的上下文确定hevc_intra_flag和sdc_flag两者的初始概率状态。通过加下划线来区分添加,且下文将删除部分标记为文字。
H.9.3用于切片片段数据的CABAC剖析过程
H.9.3.2.2用于上下文变量的初始化过程
表H-10-用于初始化过程中的每一initializationType的ctxIdx和语法元素的关联
表H-25-hevc_intra_flagctxIdx的变量initValue的值
替代地,相等可能状态可用作hevc_intra_flag的初始化概率状态,且表H-25如下设计:
表H-25-hevc_intra_flagctxIdx的变量initValue的值
H.9.3.4.2.1总则
子条款9.3.4.2.1中的规范适用于以下修改:
表H-22附加到表9-37的末尾。
表H-22-对具有经上下文译码二进位的语法元素的ctxInc的指派
H.9.3.4.2.2使用左边和上方语法元素的ctxInc的导出过程
子条款9.3.4.2.2中的规范适用于以下修改:
-表H-23附加到表9-38的末尾。
表H-23-使用左侧及上方语法元素的ctxInc的规范
如上文所论述,在一些实例中,视频译码器(例如视频解码器)选择不同初始概率状态以使用用于不同切片类型的CABAC过程对sdc_flag进行译码,但无需考虑相邻块的上下文。此些实例可提供用于不同切片类型但不取决于相邻块的上下文的非相等概率对sdc_flag进行译码。在此些实例中,提供且更新仅一个初始化值(用以导出初始化概率状态)以用于每一切片类型的sdc_flag的CABAC译码。因此,根据此实例实施方案,在表H-24中提供三个初始化值(包含B切片、P切片和I切片的每一切片类型一个),且也相应地修改表H-10。同时,sdc_flag的ctxIdx始终是0,且独立于相邻块。因此,根据此些实例实施方案,sdc_flag的ctxInc从表H-23移除,且添加到表H-22中。
将对此实例实施方案的3D-HEVC草案文本2的改变说明为相对于第一实例实施方案的改变,其中基于相邻块的上下文确定hevc_intra_flag和sdc_flag两者的初始概率状态。通过加下划线来区分添加,且下文将删除部分标记为文字。
H.9.3用于切片片段数据的CABAC剖析过程
H.9.3.2.2用于上下文变量的初始化过程
表H-10-用于初始化过程中的每一initializationType的ctxIdx和语法元素的关联
表H-24-sdc_flagctxIdx的变量initValue的值
在一些实例中,相等可能状态用作sdc_flag的初始化概率状态,且表H-24如下设 计。
表H-24-sdc_flagctxIdx的变量initValue的值
H.9.3.4.2.1总则
子条款9.3.4.2.1中的规范适用于以下修改:
表H-22附加到表9-37的末尾。
表H-22-对具有经上下文译码二进位的语法元素的ctxInc的指派
H.9.3.4.2.2使用左边和上方语法元素的ctxInc的导出过程
子条款9.3.4.2.2中的规范适用于以下修改:
-表H-23附加到表9-38的末尾。
表H-23-使用左侧及上方语法元素的ctxInc的规范
在本发明的技术的一些实例中,视频编码器(例如,视频编码器20)可经配置以使用视图合成优化(VSO)过程来识别出DC残余值以编码在经编码视频位流中。在此些实例中,视频编码器可经配置以针对以SDC模式编码的PU内的每一分区通过VSO过程从候选值的集合进行搜索而确定分区的DC残余。相对于VSO,虽然深度数据的有损译码造成合成中间视图中的失真,但由深度数据给出的几何形状信息仅间接用于再现过程中,且深度图自身对观看者不可见。通过考虑这些性质可使用VSO过程改善深度译码的效率。根据VSO过程,用于深度图的模式决策过程的失真度量可经修改以使得可获得合成视图失真和深度图失真的加权平均。为了获得合成视图失真的度量,在速率失真优化(RDO)中应用两个不同度量。
第一度量是合成视图失真改变(SVDC)。SVDC的计算需要在编码过程中使用再现功能性。由于计算复杂性是失真计算中的关键因素,因此已利用也被称作再现器模型的方法,其允许对合成视图的受深度失真影响的部分进行最小重新再现。对此,视频编码器(例如,视频编码器20)中包含特殊再现器,其支持基本功能性,由大多数再现方法共享,例如子样本准确扭曲、孔填充和视图掺合。第二度量是无需再现的基于模型的合成视图失真估计,其可为通过以从在水平方向中纹理视图的导出的绝对值导出的因数将深度失真加权而针对合成视图失真导出的估计。视图合成优化的更多细节可在3D-HEVC测试模型5中找到。
如本文中所描述,视频编码器(例如,视频编码器20)可经配置以应用SDC模式以确定深度块的至少一个DC残余值,例如块的单个DC残余值或深度块的多个分割区中的每一者的DC残余值。在一些实例中,视频编码器可进一步经配置以识别包含所确定的DC残余值的DC残余值的范围内的候选DC残余值的集合。在此些实例中,视频编码器将VSO过程应用于候选DC残余值的集合中的每一者,且基于VSO过程从候选者DC残余值集合选择一个DC残余值。视频编码器进一步经配置以将选定DC残余值编码到经编码视频位流中。即,视频编码器可针对译码单元(CU)的全部或一部分而非变换单元为所述选定DC残余值编码一值,所述变换单元包含表示CU(或CU的一部分)的残余块的经量化变换系数。视频译码器可经配置以针对属于DMM模式、用于高达32x32的CU大小的HEVC帧内预测模式和用于高达64x64的CU大小的HEVC方式帧内预测模式中的一者的任何帧内模式应用此实例技术。
举例来说,假设DCPred[i]为分区i的分区特定DC预测符,且DCOrig[i]为分区i的原始DC。在此实例中,当未使用DLT表时,假设DCResi[i]=DCOrig[i]-DCPred[i],i=0,1。例如由视频编码器20通过VSO过程搜索[DCResi[i]-Offset1,DCResi[i]+Offset2]中的多个(例如全部)候选值而确定分区i的DC残余。视频编码器可选择具有根据VSO过程计算的最小成本的候选值作为DC残余。Offset1和Offset2可为非负整数值,且可经选择以调整DC残余的搜索范围。在一个实例中,Offset1和Offset2均设定成2。
当视频编码器使用DLT表时,Depth2Idx,DCResi[i]=Depth2Idx[DCOrig[i]]-Depth2Idx[DCPred[i]],i=0,1。在此实例中,例如由视频编码器20通过VSO过程搜索[DCResi[i]-Offset1,DCResi[i]+Offset2]中的多个(例如,全部)候选值而确定分区i的DC残余。视频编码器可选择具有VSO过程中计算的最小成本的候选值作为深度块的DC残余。Offset1和Offset2可为非负整数值,其可经选择以调整DC残余值的搜索范围。在一个实例中,Offset1和Offset2均设定成2。
图7是说明可经配置以实施本发明的技术的实例视频编码器20的框图。图7是出于解释的目的而提供,并且不应被视为将技术限制为本发明中所大致例示及描述者。出于解释的目的,本发明在HEVC译码且更确切地说3D-HEVC的上下文中描述视频编码器20。然而,本发明的技术可以适用于其它译码标准或方法。
在图7的实例中,视频编码器20包含预测处理单元100、残余产生单元102、变换处理单元104、量化处理单元106、逆量化处理单元108、逆变换处理单元110、重构单元112、滤波器单元114、参考图片存储器116、熵编码单元118、视频数据存储器128和分割单元130。预测处理单元100包含帧间预测处理单元120及帧内预测处理单元126。帧间预测处理单元120包含运动估计(ME)单元122及运动补偿(MC)单元124。在其它实例中,视频编码器20可包含更多、更少或不同功能组件。
视频编码器20可以接收视频数据。视频数据存储器128可存储待由视频编码器20的组件编码的视频数据。可(例如)从视频源18获得存储在视频数据存储器128中的视频数据。参考图片存储器116可为存储参考视频数据以用于由视频编码器20编码视频数据(例如,在帧内或帧间译码模式中)的参考图片存储器。视频数据存储器128和参考图片存储器116可由多种存储器装置中的任一者形成,例如动态随机存取存储器(DRAM),包含同步DRAM(SDRAM)、磁阻式RAM(MRAM)、电阻式RAM(RRAM)或其它类型的存储器装置。视频数据存储器128和参考图片存储器116可由相同的存储器装置或单独存储器装置来提供。在各种实例中,视频数据存储器128可与视频编码器20的其它组件一起在芯片上,或相对于所述组件在芯片外。
分割单元130可从视频数据存储器128接收视频数据,且将视频数据内的图片分割为子单元,例如分割为切片、瓦片和视频块,包含译码树块(CTB),也被称作最大译码单元(LCU),其可进一步分割成译码树单元(CTU),也被称作译码单元(CU)。视频编码器20可对视频数据的图片的切片中每一CTU进行编码。CTU中的每一者可以与图片的大小相等的明度译码树块(CTB)以及对应的CTB相关联。作为对CTU进行编码的一部分,分割单元130可以执行四叉树分割以将CTU的CTB划分为逐渐更小的块。这些更小的块可以是CU的译码块。举例来说,分割单元124可将与CTU相关联的CTB分割为四个大小相等的子块,将子块中的一或多者分割为四个大小相等的子子块等。
视频编码器20可对CTU的CU进行编码以产生CU的经编码表示(即,经译码的CU)。作为对CU进行编码的部分,预测处理单元100可在CU的一或多个PU当中分割与CU相关联的译码块。因此,每一PU可与明度预测块和对应的色度预测块相关联。
视频编码器20和视频解码器30可支持具有各种大小的PU。如上文所指示,CU的大小可指CU的明度译码块的大小并且PU的大小可指PU的明度预测块的大小。假定特定CU的大小是2Nx2N,那么视频编码器20和视频解码器30可支持用于帧内预测的2Nx2N或NxN的PU大小,以及用于帧间预测的2Nx2N、2NxN、Nx2N、NxN或类似大小的对称PU大小。视频编码器20以及视频解码器30还可以支持用于帧间预测的2NxnU、2NxnD、nLx2N以及nRx2N的PU大小的非对称分割。根据本发明的方面,视频编码器20及视频解码器30还支持用于深度帧间译码的PU的非矩形分区。
帧间预测处理单元120可通过对CU的每个PU执行帧间预测来产生用于PU的预测性数据。用于PU的预测性数据可以包含PU的预测性样本块以及用于PU的运动信息。帧间预测处理单元120可根据PU是否在I切片、P切片或B切片中而对CU的PU执行不同操作。在I切片中,所有PU都是经帧内预测。因此,如果PU是在I切片中,则帧间预测处理单元120并不对PU执行帧间预测。因此,对于这I模式中编码的块,经预测的块使用来自经先前编码的同一帧内的相邻块的空间预测而形成。
如果PU是在P切片中,则运动估计单元122可以对用于PU的参考区域搜索参考图片列表(例如,“RefPicList0”)中的参考图片。参考图片可存储在参考图片存储器116中。用于PU的参考区域可以是在参考图片内含有最紧密地对应于PU的样本块的样本块的区域。运动估计单元122可产生指示含有PU的参考区域的参考图片的RefPicList0中的位置的参考索引。另外,运动估计单元122可以产生指示PU的译码块与相关联于参考区域的参考位置之间的空间移位的MV。举例来说,MV可为用以提供从当前经解码的片中的坐标到参考图片中的坐标的偏移的二维向量。运动估计单元122可以将参考索引以及MV输出为PU的运动信息。基于由PU的运动向量指示的参考位置处的实际样本或经内插样本,运动补偿单元124可以产生PU的预测性样本块。
如果PU是在B切片中,则运动估计单元122可以对PU执行单向预测或双向预测。为了对PU执行单向预测,运动估计单元122可以搜索RefPicList0的参考图片,或用于PU的参考区域的第二参考图片列表(RefPicList1)。运动估计单元122可以将指示含有参考区域的参考图片的RefPicList0或RefPicList1中的位置的参考索引、指示PU的样本块与相关联于参考区域的参考位置之间的空间移位的MV、以及指示参考图片是在RefPicList0中或在RefPicList1中的一或多个预测方向指示符输出为PU的运动信息。运动补偿单元124可以至少部分基于由PU的运动向量指示的参考区域处的实际样本或经内插样本来产生PU的预测性样本块。
为了对PU执行双向帧间预测,运动估计单元122可以在RefPicList0中的参考图片内搜索用于PU的参考区域,并且还可以在RefPicList1中的参考图片内搜索用于PU的另一参考区域。运动估计单元122可以产生指示含有参考区域的参考图片的RefPicList0以及RefPicList1中的位置的参考索引。另外,运动估计单元122可产生指示与参考区相关联的参考位置与PU的样本块之间的空间移位的MV。PU的运动信息可包含PU的参考索引及MV。运动补偿单元124可以至少部分基于由PU的运动向量指示的参考区域处的实际样本或经内插样本来产生PU的预测性样本块。
帧内预测处理单元126可通过对PU执行帧内预测而产生PU的预测性数据。用于PU的预测性数据可以包含用于PU的预测性样本块以及各种语法元素。帧内预测处理单元126可对I切片、P切片及B切片中的PU执行帧内预测。
为了对PU执行帧内预测,帧内预测处理单元126可使用多个帧内预测模式以产生PU的多个预测性数据集合,且随后例如使用速率失真优化技术选择帧内预测模式中产生可接受或最佳译码性能的一者。为了使用帧内预测模式以产生用于PU的一组预测性数据,帧内预测处理单元126可以在与帧内预测模式相关联的方向上将样本从相邻PU的样本块延伸跨越PU的样本块。假定对于PU、CU和CTU采用从左到右、从上到下的编码次序,相邻PU可在所述PU的上方、右上方、左上方或左方。帧内预测处理单元126可以使用各种数目的帧内预测模式,例如,33个定向帧内预测模式。在一些实例中,帧内预测模式的数目可以取决于与PU相关联的区域的大小。在一些实例中,帧内预测处理单元126可使用本文针对当前块(例如,PU)所描述的非基于分区或基于分区的帧内预测模式中的任一者。
预测处理单元100可从PU的由帧间预测处理单元120产生的预测性数据或PU的由帧内预测处理单元126产生的预测性数据当中选择CU的PU的预测性数据。在一些实例中,预测处理单元100基于预测性数据集合的速率/失真度量选择CU的PU的预测性数据。所选预测性数据的预测性样本块在本文中可被称为所选预测性样本块。
残余产生单元102可基于CU的明度、Cb及Cr译码块以及CU的PU的所选预测性明度、Cb及Cr块产生CU的明度、Cb及Cr残余块。举例来说,残余产生单元102可产生CU的残余块以使得残余块中的每一样本具有等于CU的译码块中的样本与CU的PU的对应选定预测性样本块中的对应样本之间的差的值。
变换处理单元104可以执行四叉树分割以将与CU相关联的残余块分割成与CU的TU相关联的变换块。因此,TU可以与明度变换块以及两个色度变换块相关联。CU的TU的明度变换块以及色度变换块的大小和位置可以或可不基于CU的PU的预测块的大小和位置。被称为“残余四叉树”(RQT)的四叉树结构可以包含与区域中的每一者相关联的节点。CU的TU可以对应于RQT的叶节点。
变换处理单元104可以通过将一或多个变换应用到TU的变换块而产生用于CU的每一TU的变换系数块。变换处理单元104可将各种变换应用到与TU相关联的变换块。例如,变换处理单元104可以将离散余弦变换(DCT)、定向变换或概念上类似的变换应用于变换块。在一些实例中,变换处理单元104并不将变换应用于变换块。在此类实例中,变换块可以处理为变换系数块。
量化处理单元106可以量化系数块中的变换系数。量化过程可减少与变换系数中的一些或全部相关联的位深度。例如,可在量化期间将n位变换系数向下舍入到m位变换系数,其中n大于m。量化处理单元106可基于与CU相关联的量化参数(QP)值而量化与CU的TU相关联的系数块。视频编码器20可以通过调整与CU相关联的QP值来调整应用于与CU相关联的系数块的量化的程度。量化可能使得信息丢失,因此经量化的变换系数可以具有比原始变换系数更低的精度。
逆量化处理单元108及逆变换处理单元110可分别将逆量化及逆变换应用至系数块,以利用系数块重构残余块。重构单元112可以将经重构的残余块添加到来自由预测处理单元100产生的一或多个预测性样本块的对应样本,以产生与TU相关联的经重构变换块。通过以此方式重构CU的每一TU的变换块,视频编码器20可重构CU的译码块。
滤波器单元114可执行一或多个解块操作以减小与CU相关联的译码块中的成块假象。参考图片存储器116可在滤波器单元114对经重构的译码块执行一或多个解块操作之后存储经重构的译码块。帧间预测处理单元120可使用含有经重构译码块的参考图片来对其它图片的PU执行帧间预测。另外,帧内预测处理单元126可使用参考图片存储器116中的经重构译码块对与CU在同一图片中的其它PU执行帧内预测。
熵编码单元118可以从视频编码器20的其它功能组件接收数据。例如,熵编码单元118可以从量化单元106接收系数块,并且可以从预测处理单元100接收语法元素。熵编码单元118可以对数据执行一或多个熵编码操作以产生经熵编码的数据。例如,熵编码单元118可以对数据执行上下文自适应可变长度译码(CAVLC)操作、CABAC操作、可变到可变(V2V)长度译码操作、基于语法的上下文自适应二进制算术译码(SBAC)操作、概率区间分割熵(PIPE)译码操作、指数哥伦布编码操作或另一类型的熵编码操作。视频编码器20可以输出包含由熵编码单元118产生的经熵编码的数据的位流。例如,位流可以包含表示用于CU的RQT的数据。
视频编码器20是经配置以执行用于本文所描述的深度帧内预测的简化残余译码的技术中的任一者的视频编码器的实例。根据本发明的一或多种技术,视频编码器20内的一或多个单元可执行本文中描述的一或多种技术作为视频编码过程的部分。类似地,视频编码器20可使用本发明的技术中的任一者执行视频解码过程以再生用作用于随后经译码视频数据的参考的视频数据。如上文所论述,视频解码过程中可利用逆量化处理单元108、逆变换处理单元110和重构单元112,以及视频编码器20的其它元件。视频编码器20内也可以包含额外3D组件。
举例来说,预测处理单元100且更确切地说帧内预测处理单元126可执行SDC模式以用于深度帧内预测编码深度块,如本文中所描述。帧内预测处理单元126可确定深度块(例如,PU)或其每一分区的DC残余值。在一些实例中,帧内预测处理单元126可将VSO过程应用于包含所确定DC残余值的范围内的候选DC残余值的集合,且从所述集合选择DC残余值中的一者,如本文中所描述。
帧内预测处理单元126可连同其它语法信息一起将深度块的DC残余值提供到熵编码单元118,例如如图7中的虚线所说明。帧内预测处理单元126可将DC残余值提供到熵编码单元118而无需变换处理单元104和量化单元106处理所述值。在其它实例中,量化单元106可在熵编码单元118的熵译码之前量化DC残余值。所述语法信息可包含本文与本发明的技术结合针对信令所描述的各种信息、旗标或其它语法元素。举例来说,语法信息可指示(作为实例)SDC模式是否针对深度块执行(例如,sdc_flag)、基于分区(例如,3D-HEVC)或非基于分区(HEVC)的模式是否用以确定DC残余值(例如,hevc_intra_flag)以及哪一深度帧内预测模式用以确定DC残余值。在一些实例中,熵编码单元118经配置以根据CABAC过程将用于编码语法元素(例如,hevc_intra_flag和/或sdc_flag)的概率状态初始化到非相等概率状态。在一些实例中,熵编码单元118经配置以根据CABAC过程将用于编码这些语法元素的概率状态初始化为基于与当前块相关联的切片类型确定的值。
因此,视频编码器20是经配置以将信息编码到位流中的视频编码器的实例,所述信息指示至少三个深度帧内预测模式中的哪一者用以对深度块进行编码且针对所述至少三个深度帧内预测模式中的任一者执行用于编码深度块的简化深度译码(SDC)模式。根据SDC模式,视频编码器20经配置以基于深度帧内预测模式中的所指示一者确定深度块的至少一个DC残余值,其中所述DC残余值表示深度块的多个像素的残余值,且将所述DC残余值编码到位流中。
视频编码器20也是经配置以在位流中编码信息的视频编码器的实例,所述信息指示深度模型化模式3或深度模型化模式4中的一者用以对深度块进行译码,基于位于同一地点的纹理块和所指示深度模型化模式确定深度块的分割模式,且基于所述分割模式将深度块分割为两个分区。视频编码器20是进一步经配置以执行用于编码深度块的简化深度译码(SDC)模式的视频编码器的实例,所述SDC模式针对深度块的分区中的每一者包括在位流中编码相应DC残余值,其中所述DC残余值表示分区的像素的残余值。
视频编码器20也是经配置以在位流中编码信息的视频编码器的实例,所述信息指示区边界链译码模式用以对深度块进行译码,且在位流中编码界定多个链的信息,所述多个链基于区边界链译码模式界定深度块的两个分区之间的边界。视频编码器20是进一步经配置以基于所述边界将深度块分割为两个分区且执行用于编码深度块的简化深度译码(SDC)模式的视频编码器的实例,所述SDC模式针对深度块的分区中的每一者包括在位流中编码相应DC残余值,其中所述DC残余值表示分区的像素的残余值。
视频编码器20也是经配置以在位流中编码信息的视频编码器的实例,所述信息指示DC帧内预测模式用以对深度块进行译码,基于所述DC帧内预测模式确定深度块中的像素中的每一者的相应预测符值,且执行用于编码深度块的简化深度译码(SDC)模式,所述SDC模式包括在位流中编码单个DC残余值,其中所述DC残余值是基于所述预测符值而确定且表示深度块的像素的残余值。
视频编码器20也是经配置以在位流中编码信息的视频编码器的实例,所述信息指示方向性帧内预测模式用以对深度块进行译码,基于所述方向性帧内预测模式确定深度块中的像素中的每一者的相应预测符值,且执行用于编码深度块的简化深度译码(SDC)模式,所述SDC模式包括在位流中编码单个DC残余值,其中所述DC残余值是基于所述预测符值而确定且表示深度块的像素的残余值。
一种装置可包括视频编码器20,其包括经配置以存储编码视频数据的经编码视频位流的存储器以及一或多个处理器。所述一或多个处理器经配置以从多个深度帧内预测模式选择用于在经编码视频位流中编码深度块的深度帧内预测模式,确定是否执行用于在经编码视频位流中编码深度块的简化深度译码(SDC)模式,所述SDC模式包括在位流中编码至少一个DC残余值,其中所述DC残余值表示深度块的多个样本的残余值,且根据所述选定深度帧内预测模式和是否执行SDC模式的确定而在经编码视频位流中编码所述深度块。所述一或多个处理器经配置以在经编码视频位流中编码第一语法元素,其中所述第一语法元素的第一值指示所述选定深度帧内预测模式是平面帧内预测模式、DC帧内预测模式或方向性帧内预测模式中的一者,且所述第一语法元素的第二值指示用于深度块的所述选定深度帧内预测模式是多个深度模型化模式或区边界链译码模式中的一者。所述一或多个处理器经配置以在经编码视频位流中编码第二语法元素,其中所述第二语法元素指示SDC模式是否执行以在经编码视频位流中编码深度块。
一种装置可包括视频编码器20,其包括经配置以存储编码视频数据的经编码视频位流的存储器以及一或多个处理器。所述一或多个处理器经配置以根据深度帧内预测模式对深度块进行编码,其中编码所述深度块包括执行简化深度译码(SDC)模式以基于深度帧内预测模式中的所指示一者确定深度块的至少一个DC残余值,其中所述DC残余值表示深度块的多个样本的残余值。所述一或多个处理器进一步经配置以识别包含所确定DC残余值的DC残余值的范围内的候选DC残余值的集合,将视图合成优化过程应用于候选DC残余值集合中的每一者,且基于视图合成优化过程从候选DC残余值集合选择一个DC残余值。所述一或多个处理器进一步经配置以将所述选定DC残余值编码到经编码视频位流中。
图8是说明经配置以执行本发明的技术的实例视频解码器30的框图。图8是出于解释的目的而提供,并且不将技术限制为本发明中所大致例示和描述者。出于解释的目的,本发明描述在HEVC译码的背景下的视频解码器30。然而,本发明的技术可以适用于其它译码标准或方法。
在图8的实例中,视频解码器30包含视频数据存储器148、熵解码单元150、预测处理单元152、逆量化处理单元154、逆变换处理单元156、重构单元158、滤波器单元160和参考图片存储器162。预测处理单元152包含运动补偿单元164及帧内预测处理单元166。在其它实例中,视频解码器30可包含较多、较少或不同的功能组件。
视频数据存储器148可存储待由视频解码器30的组件解码的视频数据,例如经编码视频位流。存储在视频数据存储器148中的视频数据可例如从计算机可读媒体16获得,例如经由视频数据的有线或无线网络通信从本地视频源(例如相机)或通过存取物理数据存储媒体而获得。视频数据存储器148可形成存储来自经编码视频位流的经编码视频数据的经译码图片缓冲器(CPB)。参考图片存储器162可存储参考视频数据以供视频解码器30例如在帧内或帧间译码模式中对视频数据进行解码之用。视频数据存储器148和参考图片存储器162可由多种存储器装置中的任一者形成,例如动态随机存取存储器(DRAM),包含同步DRAM(SDRAM)、磁阻式RAM(MRAM)、电阻式RAM(RRAM)或其它类型的存储器装置。视频数据存储器148和参考图片存储器296可由相同的存储器装置或单独存储器装置来提供。在各种实例中,视频数据存储器148可与视频解码器30的其它组件一起在芯片上,或相对于那些组件在芯片外。
视频解码器30可从视频编码器20接收表示视频块的经编码视频位流和相关联语法元素。熵解码单元150可以剖析位流以对来自位流的语法元素进行解码。熵解码单元150可以对位流中的经熵编码的语法元素进行熵解码。预测处理单元152、逆量化处理单元154、逆变换处理单元156、重构单元158以及滤波器单元160可以基于从位流提取的语法元素来产生经解码的视频数据。
位流可包括一系列NAL单元。位流的NAL单元可包含经译码切片的NAL单元。作为对位流进行解码的部分,熵解码单元150可从经译码切片的NAL单元提取语法元素且对所述语法元素进行熵解码。经译码切片中的每一者可包含切片标头以及切片数据。切片标头可以含有关于切片的语法元素。切片标头中的语法元素可包含识别与含有切片的图片相关联的PPS的语法元素。PPS可指代SPS,其又可指代VPS。熵解码单元150还可对可包含语法信息的其它元素(例如SEI消息)进行熵解码。切片标头、参数集或SEI消息中的任一者中哦经解码语法元素可包含本文中描述为用信号表示以执行本文所描述的SDC模式和简化残余译码技术的信息。举例来说,所述经解码语法元素可指示SDC模式是否针对深度块执行(例如,sdc_flag)、基于分区(例如,3D-HEVC)或非基于分区(HEVC)的模式是否用以确定DC残余值(例如,hevc_intra_flag)以及哪一深度帧内预测模式用以确定DC残余值。此语法信息可提供到预测处理单元152用于根据本文所描述的技术重构深度块。在一些实例中,熵解码单元150经配置以根据CABAC过程将用于解码语法元素(例如,hevc_intra_flag和/或sdc_flag)的概率状态初始化到非相等概率状态。在一些实例中,熵解码单元150经配置以根据CABAC过程将用于解码这些语法元素的概率状态初始化为基于与当前块相关联的切片类型确定的值。
一般来说,除了对来自位流的语法元素进行解码之外,视频解码器30可以对未分割CU执行重构操作。为对未经分割CU执行重构操作,视频解码器30可对CU的每一TU执行重构操作。通过对CU的每一TU执行重构操作,视频解码器30可重构CU的块。
作为对CU的TU执行重构操作的部分,逆量化处理单元154可逆量化(即,解量化)与TU相关联的系数块。逆量化处理单元154可使用与TU的CU相关联的QP值以确定逆量化单元处理154将应用的量化的程度且同样确定逆量化的程度。也就是说,可以通过调整当量化变换系数时所使用的QP的值来控制压缩比,即用以表示原始序列以及经压缩的序列的位的数目的比率。压缩比还可取决于所采用的熵译码的方法。
在逆量化处理单元154逆量化系数块之后,逆变换处理单元156可将一或多个逆变换应用于系数块以便产生与TU相关联的残余块。例如,逆变换处理单元156可以将逆DCT、逆整数变换、逆卡忽南-拉维(Karhunen-Loeve)变换(KLT)、逆旋转变换、逆定向变换或另一逆变换应用于系数块。
如果使用帧内预测对PU进行编码,那么帧内预测处理单元166可执行帧内预测以产生PU的预测性块。帧内预测处理单元166可以使用帧内预测模式,以基于空间上相邻的PU的预测块产生用于PU的预测性明度块、Cb块以及Cr块。帧内预测处理单元166可基于从位流解码的一或多个语法元素确定用于PU的帧内预测模式。
预测处理单元152可基于从位流提取的语法元素来构造第一参考图片列表(RefPicList0)及第二参考图片列表(RefPicList1)。此外,如果使用帧间预测对PU进行编码,则熵解码单元150可以提取用于PU的运动信息。运动补偿单元164可基于PU的运动信息来确定用于PU的一或多个参考区域。运动补偿单元164可以基于在PU的一或多个参考块处的样本块产生PU的预测性明度块、Cb块以及Cr块。
现在继续参考图8。重构单元158可使用与CU的TU相关联的明度、Cb及Cr变换块以及CU的PU的预测性明度、Cb及Cr块(即,帧内预测数据或帧间预测数据,如果适用)来重构CU的明度、Cb及Cr译码块。举例来说,重构单元158可将明度、Cb及Cr变换块的样本添加至预测性明度、Cb及Cr块的对应样本以重构CU的明度、Cb及Cr译码块。
滤波器单元160可以执行解块操作以减少与CU的明度译码块、Cb译码块以及Cr译码块相关联的成块假象。视频解码器30可以在经解码的图片缓冲器162中存储CU的明度译码块、Cb译码块以及Cr译码块。经解码图片缓冲器162可提供参考图片以用于后续运动补偿、帧内预测及显示装置(例如,图1的显示装置32)上的显示。举例来说,视频解码器30可基于参考图片存储器162中的明度、Cb和Cr块对其它CU的PU执行帧内预测或帧间预测操作。以此方式,视频解码器30可以从位流提取大量明度系数块的变换系数层级,逆量化变换系数层级,对变换系数层级应用变换以产生变换块,至少部分基于变换块产生译码块并且输出译码块用于显示。
视频解码器30是经配置以执行用于深度帧内预测模式的简化残余译码的技术中的任一者的视频解码器的实例,如本文中所描述。根据本发明的一或多种技术,视频解码器30内的一或多个单元可执行本文中描述的一或多种技术作为视频解码过程的部分。视频解码器30内也可以包含额外3D组件。
举例来说,预测处理单元152且更确切地说帧内预测处理单元166可执行SDC模式以用于深度帧内预测编码深度块,如本文中所描述。熵解码单元150可熵解码深度块的一或多个DC残余值,以及本文所描述的语法信息,例如哪一深度帧内预测模式用以对块进行编码,以及SDC模式是否经执行以对块进行编码。
熵解码单元150可将DC残余值和块的语法信息提供到预测处理单元152,如由图8中的虚线指示。以此方式,DC残余值无需首先提供到用于逆量化和逆变换的逆量化单元154和逆变换处理单元156。在其它实例中,逆量化单元154可逆量化DC残余值,且将经解量化DC残余值提供到预测处理单元152。
帧内预测处理单元166可例如根据本文所描述的技术中的任一者基于由语法信息指示的深度帧内预测模式确定深度块的预测符值。帧内预测处理单元166可利用存储在经解码图片缓冲器162中的经重构深度块确定预测符值。帧内预测处理单元166可通过将DC残余值和预测符值求和而重构深度块,如本文中所描述。在一些实例中,帧内预测处理单元166可利用重构单元158用于深度块的残余和预测符值的求和。举例来说,熵解码单元150可将DC残余值提供到重构单元,且帧内预测处理单元166可将预测符值提供到重构单元。
因此,视频解码器30是经配置以从位流解码信息的视频解码器的实例,所述信息指示至少三个深度帧内预测模式中的哪一者用以解码深度块,针对至少三个深度帧内预测模式中的任一者,执行用于解码深度块的简化深度译码(SDC)模式,所述SDC模式包括从位流解码至少一个DC残余值,其中所述DC残余值表示深度块的多个像素的残余值,且基于所指示深度帧内预测模式和所述至少一个DC残余值重构深度块。
视频解码器30也是经配置以解码位流中的信息的视频解码器的实例,所述信息指示深度模型化模式3或深度模型化模式4中的一者用以解码深度块,基于位于同一地点的纹理块和所指示深度模型化模式确定深度块的分割模式,且基于所述分割模式将深度块分割为两个分区。视频解码器30是进一步经配置以执行用于解码深度块的简化深度译码(SDC)模式的视频解码器的实例,所述SDC模式包括针对深度块的分区中的每一者解码位流中的相应DC残余值,其中所述DC残余值表示分区的像素的残余值。
视频解码器30也是经配置以解码位流中的信息的视频解码器的实例,所述信息指示区边界链译码模式用以对深度块进行解码,且在位流中解码界定多个链的信息,所述多个链基于区边界链译码模式界定深度块的两个分区之间的边界。视频解码器30是进一步经配置以基于所述边界将深度块分割为两个分区且执行用于解码深度块的简化深度译码(SDC)模式的视频解码器的实例,所述SDC模式针对深度块的分区中的每一者包括在位流中解码相应DC残余值,其中所述DC残余值表示分区的像素的残余值。
视频解码器30也是经配置以在位流中解码信息的视频解码器的实例,所述信息指示DC帧内预测模式用以对深度块进行解码,基于所述DC帧内预测模式确定深度块中的像素中的每一者的相应预测符值,且执行用于解码深度块的简化深度译码(SDC)模式,所述SDC模式包括在位流中解码单个DC残余值,其中所述DC残余值是基于所述预测符值而确定且表示深度块的像素的残余值。
视频解码器30也是经配置以在位流中解码信息的视频解码器的实例,所述信息指示方向性帧内预测模式用以对深度块进行解码,基于所述方向性帧内预测模式确定深度块中的像素中的每一者的相应预测符值,且执行用于解码深度块的简化深度译码(SDC)模式,所述SDC模式包括在位流中解码单个DC残余值,其中所述DC残余值是基于所述预测符值而确定且表示深度块的像素的残余值。
在一些实例中,一种装置可包括视频解码器30,其包括经配置以存储编码视频数据的经编码视频位流的存储器以及一或多个处理器。所述一或多个处理器经配置以从经编码视频位流解码第一语法元素,其中第一语法元素的第一值指示从多个深度帧内预测模式为深度块选择的深度帧内预测模式是平面帧内预测模式、DC帧内预测模式或方向性帧内预测模式中的一者,且第一语法元素的第二值指示为深度块选择的深度帧内预测模式是多个深度模型化模式或区边界链译码模式中的一者。所述一或多个处理器经配置以从经编码视频位流解码第二语法元素,其中所述第二语法元素指示是否执行简化深度译码(SDC)模式以重构深度块,所述SDC模式包括从位流解码至少一个DC残余值,其中所述DC残余值表示深度块的多个样本的残余值。所述一或多个处理器经配置以根据为深度块选择的深度帧内预测模式和是否执行SDC模式的指示而重构深度块。
图9是说明执行用于深度帧内预测编码深度块的简化深度译码(SDC)模式的实例方法的流程图。图9的实例方法可由如本文中所描述的视频编码器20或任何视频编码器执行。
根据图9的实例,视频编码器20将信息编码到位流中(例如,如本文中所描述的语法元素),所述信息指示至少三个深度帧内预测模式中的哪一者用以对深度块进行编码(200)。所述至少三个深度帧内预测模式包含DMM3、DMM4、链译码模式、DC模式和方向性帧内预测模式中的至少一者,且可包含本文所描述的任何深度帧内预测模式。视频编码器20进一步基于所指示深度帧内预测模式确定深度块的一或多个DC残余值(202)。举例来说,视频编码器20可当深度块是使用非基于分割(例如,HEVC)的帧内预测模式经编码时确定深度块的单个DC残余值,或可当深度块是使用基于分割(例如,3D-HEVC)的深度帧内预测模式经编码时确定深度块的两个分区中的每一者的相应DC残余值。视频编码器20将DC残余值编码到位流中(204)。
图10是说明执行用于深度帧内预测解码深度块的SDC模式的实例方法的流程图。图10的实例方法可由如本文中所描述的视频解码器30或任何视频解码器执行。类似地,图10的方法可由例如视频编码器20的视频编码器执行以从经编码视频数据产生经重构视频数据,其中经重构视频数据可用以随后预测视频数据用于编码。
根据图10的实例,视频解码器20从位流解码信息(例如,如本文中所描述的语法元素),所述信息指示至少三个深度帧内预测模式中的哪一者用以解码深度块(210)。所述至少三个深度帧内预测模式包含DMM3、DMM4、链译码模式、DC模式和方向性帧内预测模式中的至少一者,且可包含本文所描述的任何深度帧内预测模式。视频解码器30还可使用深度帧内预测模式产生经预测块。视频解码器30进一步从位流解码深度块的一或多个DC残余值(212)。举例来说,视频解码器30可当深度块是使用非基于分割(例如,HEVC)的帧内预测模式经编码时解码深度块的单个DC残余值,或可当深度块是使用基于分割(例如,3D-HEVC)的深度帧内预测模式经编码时解码深度块的两个分区中的每一者的相应DC残余值。视频解码器30例如使用本文所描述的技术中的任一者基于DC残余值重构深度块(214)。深度块的重构可包含例如逐像素地组合经预测块与从DC残余值产生的残余块。
图11是说明用于根据非基于分区(例如,HEVC)的帧内预测模式或基于分区(例如,3D-HEVC)的深度帧内预测模式执行用于深度帧内预测编码深度块的SDC模式的实例方法的流程图。图11的实例方法可由如本文中所描述的视频编码器20或另一视频编码器执行。
根据图11的实例方法,视频编码器20确定深度块是否是使用非基于分区(例如,HEVC)帧内预测模式或基于分区(例如,3D-HEVC)帧内预测模式经编码(220)。视频编码器20可在位流中编码语法元素或其它信息,其向视频解码器指示哪一类型的深度帧内预测模式用以对深度块进行编码,如本文中所描述。
如果深度块是使用非基于分区(例如,HEVC)帧内预测模式经编码,那么视频编码器20根据特定非基于分区(例如,HEVC)帧内预测模式确定深度块的像素特定预测符值(222)。视频编码器20随后例如使用本文所描述的技术中的任一者确定深度块的单个DC残余值(224)。举例来说,视频编码器20可基于像素特定DC预测符值的子集确定深度块的DC深度值(例如,平均深度值)和DC预测符值。视频编码器20可将DC残余值确定为DC深度值与DC预测符值之间的差。视频编码器20接着可将单个DC残余值编码到位流中(226)。
如果深度块是使用基于分区(例如,3D-HEVC)深度帧内预测模式经编码,那么视频编码器20例如如上文针对DMM模式和链译码模式所描述根据特定基于分区的深度帧内预测模式分割深度块(228)。视频编码器20还例如基于深度块的一或多个相邻样本根据特定模式确定分区的相应DC预测符值(230)。视频编码器20随后基于DC预测符值确定分区的相应DC残余值(232)。举例来说,视频编码器20可确定每一分区的相应DC深度值(例如,平均深度值),且将每一分区的DC残余值确定为分区的DC深度值与DC预测符值之间的差。视频编码器20将相应DC残余值编码到位流中(234)。
图12是说明用于根据HEVC帧内预测模式或3D-HEVC深度帧内预测模式执行用于深度帧内预测解码深度块的SDC模式的实例方法的流程图。图12的实例方法可由如本文中所描述的视频解码器30或另一视频编码器执行。
根据图12的实例方法,视频解码器30确定深度块是否是使用非基于分区(例如,HEVC)帧内预测模式或基于分区(例如,3D-HEVC)帧内预测模式经编码(240)。视频解码器30可从位流解码指示哪一类型的深度帧内预测模式用以对深度块进行编码的语法元素或其它信息,如本文中所描述。
如果深度块是使用非基于分区(例如,HEVC)帧内预测模式经编码,那么视频解码器30根据特定非基于分区(例如,HEVC)帧内预测模式确定深度块的像素特定预测符值(242)。视频解码器30还解码深度块的单个DC残余值(244)。视频解码器30接着可基于像素特定预测符值和DC残余值重构深度块(246)。举例来说,为了重构每一深度像素值,视频解码器30可将相应像素特定预测符值与单个DC残余值求和。
如果深度块是使用基于分区(例如,3D-HEVC)深度帧内预测模式经编码,那么视频解码器30例如如上文针对DMM模式和链译码模式所描述根据特定基于分区的深度帧内预测模式分割深度块(248)。视频解码器30还例如基于深度块的一或多个相邻样本根据特定模式确定分区的相应DC预测符值(250)。视频解码器30还从位流解码分区的相应DC残余值(252)。视频解码器30接着可例如通过将预测符和残余值求和而基于分区的DC预测符值和DC残余值重构深度块(254)。
图13是说明用于在位流中译码指示哪一深度帧内预测模式用以对深度块进行译码和SDC模式是否用以对深度块进行译码的语法元素的实例方法的流程图。图13中说明的方法表示可由视频编码器20和/或解码器30根据上述技术执行的技术的实例。对于图13,将联合地参考由视频编码器20及视频解码器30执行的相似或互逆操作描述实例方法。
根据图13的实例方法,视频译码器译码(例如,视频编码器20编码或视频解码器30解码)第一语法元素(例如,hevc_intra_flag),其指示深度块是否使用非基于分区(例如,HEVC)帧内预测模式中的任一者经译码(例如,经编码或解码)(260)。在一些实例中,第一语法元素的第一值指示从多个深度帧内预测模式为深度块选择的深度帧内预测模式是平面帧内预测模式、DC帧内预测模式或方向性帧内预测模式中的一者,且第一语法元素的第二值指示为深度块选择的深度帧内预测模式是多个深度模型化模式或区边界链译码模式中的一者。
视频译码器译码第二语法元素(例如,sdc_flag),其指示SDC模式是否用以对深度块或深度块的每一分区的一或多个DC残余值进行译码(262)。视频译码器还可译码指示非基于分区(例如,HEVC)帧内预测模式中的哪一者用以对深度块进行译码的一或多个语法元素。如果第一语法元素指示深度块未使用非基于分区(例如,HEVC)帧内预测模式中的任一者经译码(264的否),那么视频译码器译码第三语法元素,其指示基于分区(3D-HEVC)深度帧内预测模式中的哪一者用以对深度块进行译码(266)。在一些实例中,区边界链译码模式未使用或不可用于译码深度块。在此些实例中,视频译码器可不需要对第三语法元素进行译码,且等于0的第一语法元素(例如,hevc_intra_flag)的第一值指示DMM模式用以对当前深度块进行帧内译码。
在一些实例中,视频译码器根据CABAC过程译码(例如,视频编码器20编码和/或视频解码器30解码)第一语法元素和/或第二语法元素,且根据CABAC过程将用于译码第一和第二语法元素中的至少一者(例如,hevc_intra_flag)的初始概率状态设定为非相等概率状态。在一些实例中,视频译码器确定包含深度块的切片的切片类型,且基于所述切片类型从多个概率状态选择用于根据CABAC过程译码第一和第二语法元素中的至少一者的初始概率状态,如本文中所描述。在各种实例中,视频译码器参考或无需参考深度块的任何相邻深度块的的值而设定第一和第二语法元素中的一者或两者的初始概率状态。
图14是说明用于在位流中译码DC残余值的实例方法的流程图。图14中说明的方法表示可由视频编码器20和/或解码器30根据上述技术执行的技术的实例。对于图14,将联合地参考由视频编码器20及视频解码器30执行的相似或互逆操作描述实例方法。
根据图14的实例方法,视频译码器对指示DC残余值是否等于0的第一语法元素进行译码(270)。如果DC残余值等于0(272的是),那么用于译码DC残余值的方法结束。如果DC残余值不等于0(272的否),那么视频译码器进一步对指示DC残余值是否为正或负的第二语法元素进行译码,(274),且对指示“DC残余值的绝对值”减1的第三语法值进行译码(276)。
图15是说明用于在位流中编码DC残余值的实例方法的流程图。图15中说明的方法表示可由视频编码器20根据上述技术执行的技术的实例。
根据图15的实例方法,视频编码器(例如,视频编码器20)执行SDC模式以确定块或块的分区的DC残余值,如本文中所描述(280)。视频编码器识别包含根据SDC模式确定的DC残余值的范围内的候选DC残余值的集合(282)。举例来说,视频编码器可将一或多个偏移应用于所确定的DC残余值以界定包含候选DC残余值集合的DC残余值的范围。
视频编码器将VSO过程应用于候选DC残余值的集合(286)。视频编码器基于VSO过程的结果从候选DC残余值集合选择DC残余值中的一者(288)。举例来说,视频编码器可从候选DC残余值集合根据VSO过程选择具有最低成本的DC残余值。视频编码器在经编码视频位流中编码所述选定DC残余值,例如而不是根据SDC过程确定的DC残余值。以此方式,视频解码器无需经修改以利用从VSO过程选择的DC残余值。
上文所描述的技术可由视频编码器20(图1及7)及/或视频解码器30(图1及8)执行,其两者可大体上被称作视频译码器。另外,视频译码在适用时可大体上涉及视频编码和/或视频解码。
虽然大体上相对于3D-HEVC描述本发明的技术,但不以此方式限制所述技术。上文描述的技术也可适用于其它当前标准或尚未开发的未来标准。举例来说,用于深度译码的技术也可以适用于需要深度分量的译码的其它当前或未来标准。
在一或多个实例中,本文所述的功能可以用硬件、软件、固件或其任何组合来实施。如果用软件实施,则所述功能可作为一或多个指令或代码在计算机可读媒体上存储或传输,且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体,其对应于有形媒体,例如数据存储媒体,或包括任何促进将计算机程序从一处传送到另一处的任何媒体(例如,根据通信协议)的通信媒体。以此方式,计算机可读媒体一般可以对应于(1)有形计算机可读存储媒体,其为非暂时性的,或(2)通信媒体,例如信号或载波。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索用于实施本发明中描述的技术的指令、代码及/或数据结构的任何可用媒体。计算机程序产品可以包含计算机可读媒体。
借助于实例而非限制,此类计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器或可以用来存储指令或数据结构的形式的期望程序代码并且可以由计算机存取的任何其它媒体。并且,可恰当地将任何连接称作计算机可读媒体。举例来说,如果使用同轴缆线、光纤缆线、双绞线、数字订户线(DSL)或例如红外线、无线电和微波等无线技术从网站、服务器或其它远程源传输指令,那么同轴缆线、光纤缆线、双绞线、DSL或例如红外线、无线电和微波等无线技术包含在媒体的定义中。但是,应理解,所述计算机可读存储媒体和数据存储媒体并不包括连接、载波、信号或其它暂时媒体,而是实际上针对于非暂时性有形存储媒体。如本文中所使用,磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软性磁盘和蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘利用激光以光学方式再现数据。以上各项的组合也应包含在计算机可读媒体的范围内。
可由例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路等一或多个处理器来执行指令。因此,如本文中所使用的术语“处理器”可指代上述结构或适合于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,本文中所描述的功能性可以在经配置用于编码和解码的专用硬件和/或软件模块内提供,或者并入在组合编解码器中。另外,可以将所述技术完全实施于一或多个电路或逻辑元件中。
本发明的技术可实施于广泛多种装置或设备中,所述装置或设备包含无线手持机、集成电路(IC)或一组IC(例如,芯片组)。本发明中描述各种组件、模块或单元是为了强调经配置以执行所揭示的技术的装置的功能方面,但未必需要通过不同硬件单元实现。实际上,如上文所描述,各种单元可以结合合适的软件及/或固件组合在编解码器硬件单元中,或者通过互操作硬件单元的集合来提供,所述硬件单元包含如上文所描述的一或多个处理器。
已经描述根据本发明的技术的各种实例。下文描述若干特定实例。本文所描述的实例和其它实例在所附权利要求书的范围内。
实例1。一种对视频数据进行解码的方法,所述方法包括:从经编码视频位流解码第一语法元素,其中所述第一语法元素的第一值指示从多个深度帧内预测模式为深度块选择的深度帧内预测模式是平面帧内预测模式、DC帧内预测模式或方向性帧内预测模式中的一者,且所述第一语法元素的第二值指示为所述深度块选择的所述深度帧内预测模式是多个深度模型化模式或区边界链译码模式中的一者;从所述经编码视频位流解码第二语法元素,其中所述第二语法元素指示是否执行简化深度译码(SDC)模式以重构所述深度块,所述SDC模式包括从所述位流解码至少一个DC残余值,其中所述DC残余值表示所述深度块的多个样本的残余值;以及根据为所述深度块选择的所述深度帧内预测模式和是否执行所述SDC模式的所述指示重构所述深度块。
实例2。实例1的方法,其中所述第一语法元素包括hevc_intra_flag语法元素且所述第二语法元素包括sdc_flag语法元素。
实例3。实例1的方法,其中对所述第一和第二语法元素进行解码包括根据上下文自适应二进制算术译码(CABAC)过程对所述第一和第二语法元素进行解码。
实例4。实例3的方法,其进一步包括将用于根据所述CABAC过程对所述第一和第二语法元素中的至少一者进行解码的初始概率状态设定为非相等概率状态。
实例5。实例4的方法,其中将用于根据所述CABAC过程对所述第一和第二语法元素中的至少一者进行解码的初始概率状态设定为非相等概率状态包括将用于根据所述CABAC过程对所述第一语法元素进行解码的初始概率状态设定为非相等概率状态。
实例6。实例3的方法,其进一步包括:确定包含所述深度块的切片的切片类型;以及基于所述切片类型从多个概率状态选择用于根据所述CABAC过程对所述第一和第二语法元素中的至少一者进行解码的初始概率状态。
实例7。实例6的方法,其中确定所述切片的切片类型包括确定所述切片是否是B切片、P切片或I切片,且其中选择所述初始概率状态包括:当所述切片是B切片时选择第一初始概率状态;当所述切片是P切片时选择第二初始概率状态;以及当所述切片是I切片时选择第三初始概率状态。
实例8。实例3的方法,其进一步包括设定用于根据所述CABAC过程对所述深度块的所述第一和第二语法元素中的至少一者进行解码的初始概率状态而无需参考所述深度块的任何相邻深度块的所述语法元素的值。
实例9。实例1的方法,其中至少一个所述第一和第二语法元素包括depth_mode_parameters语法结构的语法元素。
实例10。一种对视频数据进行编码的方法,所述方法包括:从多个深度帧内预测模式选择用于在经编码视频位流中对深度块进行编码的深度帧内预测模式;确定是否执行简化深度译码(SDC)模式以用于在所述经编码视频位流中对所述深度块进行编码,所述SDC模式包括在位流中对至少一个DC残余值进行编码,其中所述DC残余值表示所述深度块的多个样本的残余值;根据所述选定深度帧内预测模式和是否执行所述SDC模式的所述确定在所述经编码视频位流中对所述深度块进行编码;在所述经编码视频位流中对第一语法元素进行编码,其中所述第一语法元素的第一值指示所述选定深度帧内预测模式是平面帧内预测模式、DC帧内预测模式或方向性帧内预测模式中的一者,且所述第一语法元素的第二值指示用于所述深度块的所述选定深度帧内预测模式是多个深度模型化模式或区边界链译码模式中的一者;以及在所述经编码视频位流中对第二语法元素进行编码,其中所述第二语法元素指示所述SDC模式是否执行以在所述经编码视频位流中对所述深度块进行编码。
实例11。实例10的方法,其中所述第一语法元素包括hevc_intra_flag语法元素且所述第二语法元素包括sdc_flag语法元素。
实例12。实例10的方法,其中对所述第一和第二语法元素进行编码包括根据上下文自适应二进制算术译码(CABAC)过程对所述第一和第二语法元素进行编码。
实例13。实例12的方法,其进一步包括将用于根据所述CABAC过程对所述第一和第二语法元素中的至少一者进行编码的初始概率状态设定为非相等概率状态。
实例14。实例13的方法,其中将用于根据所述CABAC过程对所述第一和第二语法元素中的至少一者进行编码的初始概率状态设定为非相等概率状态包括将用于根据所述CABAC过程对所述第一语法元素进行编码的初始概率状态设定为非相等概率状态。
实例15。实例12的方法,其进一步包括:确定包含所述深度块的切片的切片类型;以及基于所述切片类型从多个概率状态选择用于根据所述CABAC过程对所述第一和第二语法元素中的至少一者进行编码的初始概率状态。
实例16。实例15的方法,其中确定所述切片的切片类型包括确定所述切片是否是B切片、P切片或I切片,且其中选择所述初始概率状态包括:当所述切片是B切片时选择第一初始概率状态;当所述切片是P切片时选择第二初始概率状态;以及当所述切片是I切片时选择第三初始概率状态。
实例17。实例12的方法,其进一步包括设定用于根据所述CABAC过程对所述深度块的所述第一和第二语法元素中的至少一者进行编码的初始概率状态而无需参考所述深度块的任何相邻深度块的所述语法元素的值。
实例18。实例10的方法,其中至少一个所述第一和第二语法元素包括depth_mode_parameters语法结构的语法元素。
实例19。一种装置包括视频解码器,所述视频解码器包括:存储器,其经配置以存储对视频数据进行编码的经编码视频位流;以及一或多个处理器,其经配置以:从所述经编码视频位流解码第一语法元素,其中所述第一语法元素的第一值指示从多个深度帧内预测模式为深度块选择的深度帧内预测模式是平面帧内预测模式、DC帧内预测模式或方向性帧内预测模式中的一者,且所述第一语法元素的第二值指示为所述深度块选择的所述深度帧内预测模式是多个深度模型化模式或区边界链译码模式中的一者;从所述经编码视频位流解码第二语法元素,其中所述第二语法元素指示是否执行简化深度译码(SDC)模式以重构所述深度块,所述SDC模式包括从所述位流解码至少一个DC残余值,其中所述DC残余值表示所述深度块的多个样本的残余值;以及根据为所述深度块选择的所述深度帧内预测模式和是否执行所述SDC模式的所述指示重构所述深度块。
实例20。实例19的装置,其中所述第一语法元素包括hevc_intra_flag语法元素且所述第二语法元素包括sdc_flag语法元素。
实例21。实例19的装置,其中所述一或多个处理器经配置以根据上下文自适应二进制算术译码(CABAC)过程对所述第一和第二语法元素进行解码。
实例22。实例21的装置,其中所述一或多个处理器进一步经配置以将用于根据所述CABAC过程对所述第一和第二语法元素中的至少一者进行解码的初始概率状态设定为非相等概率状态。
实例23。实例22的装置,其中所述一或多个处理器经配置以将用于根据所述CABAC过程对所述第一语法元素进行解码的初始概率状态设定为非相等概率状态。
实例24。实例21的装置,其中所述一或多个处理器进一步经配置以:确定包含所述深度块的切片的切片类型;以及基于所述切片类型从多个概率状态选择用于根据所述CABAC过程对所述第一和第二语法元素中的至少一者进行解码的初始概率状态。
实例25。实例24的装置,其中所述一或多个处理器经配置以:确定所述切片是否是B切片、P切片或I切片;当所述切片是B切片时选择第一初始概率状态;当所述切片是P切片时选择第二初始概率状态;以及当所述切片是I切片时选择第三初始概率状态。
实例26。实例21的装置,其中所述一或多个处理器进一步经配置以设定用于根据所述CABAC过程对所述深度块的所述第一和第二语法元素中的至少一者进行解码的初始概率状态而无需参考所述深度块的任何相邻深度块的所述语法元素的值。
实例27。实例19的装置,其中至少一个所述第一和第二语法元素包括depth_mode_parameters语法结构的语法元素。
实例28。实例19的装置,其中所述装置包括以下各项中的至少一者:集成电路,其实施所述视频解码器;微处理器,其实施所述视频解码器;以及无线通信装置,其包含所述视频解码器。
实例29。一种装置,其包括视频编码器,所述视频编码器包括:存储器,其经配置以存储对视频数据进行编码的经编码视频位流;以及一或多个处理器,其经配置以:从多个深度帧内预测模式选择用于在经编码视频位流中对深度块进行编码的深度帧内预测模式;确定是否执行简化深度译码(SDC)模式以用于在所述经编码视频位流中对所述深度块进行编码,所述SDC模式包括在位流中对至少一个DC残余值进行编码,其中所述DC残余值表示所述深度块的多个样本的残余值;根据所述选定深度帧内预测模式和是否执行所述SDC模式的所述确定在所述经编码视频位流中对所述深度块进行编码;在所述经编码视频位流中对第一语法元素进行编码,其中所述第一语法元素的第一值指示所述选定深度帧内预测模式是平面帧内预测模式、DC帧内预测模式或方向性帧内预测模式中的一者,且所述第一语法元素的第二值指示用于所述深度块的所述选定深度帧内预测模式是多个深度模型化模式或区边界链译码模式中的一者;以及在所述经编码视频位流中对第二语法元素进行编码,其中所述第二语法元素指示所述SDC模式是否执行以在所述经编码视频位流中对所述深度块进行编码。
实例30。实例29的装置,其中所述第一语法元素包括hevc_intra_flag语法元素且所述第二语法元素包括sdc_flag语法元素。
实例31。实例29的装置,其中所述一或多个处理器经配置以根据上下文自适应二进制算术译码(CABAC)过程对所述第一和第二语法元素进行编码。
实例32。实例31的装置,其中所述一或多个处理器进一步经配置以将用于根据所述CABAC过程对所述第一和第二语法元素中的至少一者进行编码的初始概率状态设定为非相等概率状态。
实例33。实例32的装置,其中所述一或多个处理器经配置以将用于根据所述CABAC过程对所述第一语法元素进行编码的初始概率状态设定为非相等概率状态。
实例34。实例31的装置,其中所述一或多个处理器进一步经配置以:确定包含所述深度块的切片的切片类型;以及基于所述切片类型从多个概率状态选择用于根据所述CABAC过程对所述第一和第二语法元素中的至少一者进行编码的初始概率状态。
实例35。实例34的装置,其中所述一或多个处理器经配置以:确定所述切片是否是B切片、P切片或I切片;当所述切片是B切片时选择第一初始概率状态;当所述切片是P切片时选择第二初始概率状态;以及当所述切片是I切片时选择第三初始概率状态。
实例36。实例31的装置,其中所述一或多个处理器进一步经配置以设定用于根据所述CABAC过程对所述深度块的所述第一和第二语法元素中的至少一者进行编码的初始概率状态而无需参考所述深度块的任何相邻深度块的所述语法元素的值。
实例37。实例29的装置,其中至少一个所述第一和第二语法元素包括depth_mode_parameters语法结构的语法元素。
实例38。实例29的装置,其中所述装置包括以下各项中的至少一者:集成电路,其实施所述视频编码器;微处理器,其实施所述视频编码器;以及无线通信装置,其包含所述视频编码器。
实例39。一种装置,其包括视频译码器,其中所述视频译码器包括:用于在经编码视频位流中对第一语法元素进行译码的装置,其中所述第一语法元素的第一值指示从多个深度帧内预测模式为深度块选择的深度帧内预测模式是平面帧内预测模式、DC帧内预测模式或方向性帧内预测模式中的一者,且所述第一语法元素的第二值指示为所述深度块选择的所述深度帧内预测模式是多个深度模型化模式或区边界链译码模式中的一者;用于在所述经编码视频位流中对第二语法元素进行译码的装置,其中所述第二语法元素指示是否执行简化深度译码(SDC)模式以重构所述深度块,所述SDC模式包括从所述位流解码至少一个DC残余值,其中所述DC残余值表示所述深度块的多个样本的残余值;以及用于根据所述第一和第二语法元素在所述经编码视频位流中对所述深度块进行译码的装置。
实例40。实例39的装置,其中所述第一语法元素包括hevc_intra_flag语法元素且所述第二语法元素包括sdc_flag语法元素。
实例41。实例39的装置,其中所述用于对所述第一和第二语法元素进行译码的装置包括用于根据上下文自适应二进制算术译码(CABAC)过程对所述第一和第二语法元素进行译码的装置。
实例42。实例41的装置,其进一步包括用于将用于根据所述CABAC过程对所述第一和第二语法元素中的至少一者进行译码的初始概率状态设定为非相等概率状态的装置。
实例43。实例42的装置,其中所述用于将用于根据所述CABAC过程对所述第一和第二语法元素中的至少一者进行译码的初始概率状态设定为非相等概率状态的装置包括用于将用于根据所述CABAC过程对所述第一语法元素进行译码的初始概率状态设定为非相等概率状态的装置。
实例44。实例41的装置,其进一步包括:用于确定包含所述深度块的切片的切片类型的装置;以及用于基于所述切片类型从多个概率状态选择用于根据所述CABAC过程对所述第一和第二语法元素中的至少一者进行解码的初始概率状态的装置。
实例45。实例44的装置,其中所述用于确定所述切片的切片类型的装置包括用于确定所述切片是否是B切片、P切片或I切片的装置,且其中所述用于选择所述初始概率状态的装置包括:用于当所述切片是B切片时选择第一初始概率状态的装置;用于当所述切片是P切片时选择第二初始概率状态的装置;以及用于当所述切片是I切片时选择第三初始概率状态的装置。
实例46。实例41的装置,其进一步包括用于设定用于根据所述CABAC过程对所述深度块的所述第一和第二语法元素中的至少一者进行译码的初始概率状态而无需参考所述深度块的任何相邻深度块的所述语法元素的值的装置。
实例47。实例39的装置,其中至少一个所述第一和第二语法元素包括depth_mode_parameters语法结构的语法元素。
实例48。一种计算机可读存储媒体,其上存储有指令,所述指令在由视频译码器的一或多个处理器执行时致使所述视频译码器:在经编码视频位流中对第一语法元素进行译码,其中所述第一语法元素的第一值指示从多个深度帧内预测模式为深度块选择的深度帧内预测模式是平面帧内预测模式、DC帧内预测模式或方向性帧内预测模式中的一者,且所述第一语法元素的第二值指示为所述深度块选择的所述深度帧内预测模式是多个深度模型化模式或区边界链译码模式中的一者;以及在所述经编码视频位流中对第二语法元素进行译码,其中所述第二语法元素指示是否执行简化深度译码(SDC)模式以重构所述深度块,所述SDC模式包括从所述位流解码至少一个DC残余值,其中所述DC残余值表示所述深度块的多个样本的残余值;以及根据所述第一和第二语法元素在所述经编码视频位流中对所述深度块进行译码。
实例49。实例48的计算机可读存储媒体,其中所述第一语法元素包括hevc_intra_flag语法元素且所述第二语法元素包括sdc_flag语法元素。
实例50。实例48的计算机可读存储媒体,其中所述致使所述视频译码器对所述第一和第二语法元素进行译码的指令包括致使所述视频译码器根据上下文自适应二进制算术译码(CABAC)过程对所述第一和第二语法元素进行译码的指令。
实例51。实例50的计算机可读存储媒体,其进一步包括致使所述视频译码器将用于根据所述CABAC过程对所述第一和第二语法元素中的至少一者进行译码的初始概率状态设定为非相等概率状态的指令。
实例52。实例51的计算机可读存储媒体,其中所述致使所述视频译码器将用于根据所述CABAC过程对所述第一和第二语法元素中的至少一者进行译码的初始概率状态设定为非相等概率状态的指令包括致使所述视频译码器将用于根据所述CABAC过程对所述第一语法元素进行译码的初始概率状态设定为非相等概率状态的指令。
实例53。实例50的计算机可读存储媒体,其进一步包括致使所述视频译码器进行以下操作的指令:确定包含所述深度块的切片的切片类型;以及基于所述切片类型从多个概率状态选择用于根据所述CABAC过程对所述第一和第二语法元素中的至少一者进行解码的初始概率状态。
实例54。实例53的计算机可读存储媒体,其中所述致使所述视频译码器确定所述切片的切片类型的指令包括致使所述视频译码器确定所述切片是否是B切片、P切片或I切片的指令,且其中所述致使所述视频译码器选择所述初始概率状态的指令包括致使所述视频译码器进行以下操作的指令:当所述切片是B切片时选择第一初始概率状态;当所述切片是P切片时选择第二初始概率状态;以及当所述切片是I切片时选择第三初始概率状态。
实例55。实例50的计算机可读存储媒体,其进一步包括致使所述视频译码器设定用于根据所述CABAC过程对所述深度块的所述第一和第二语法元素中的至少一者进行译码的初始概率状态而无需参考所述深度块的任何相邻深度块的所述语法元素的值的指令。
实例56。实例48的计算机可读存储媒体,其中至少一个所述第一和第二语法元素包括depth_mode_parameters语法结构的语法元素。
实例57。一种对视频数据进行编码的方法,所述方法包括:根据深度帧内预测模式对深度块进行编码,其中对所述深度块进行编码包括执行简化深度译码(SDC)模式以基于所述深度帧内预测模式中的指示的一者确定所述深度块的至少一个DC残余值,其中所述DC残余值表示所述深度块的多个样本的残余值;识别包含所确定DC残余值的DC残余值的范围内的候选DC残余值的集合;将视图合成优化过程应用于所述候选DC残余值集合中的每一者;基于所述视图合成优化过程从所述候选DC残余值集合选择一个DC残余值;以及将所述选定DC残余值编码到经编码视频位流中。
实例58。实例57的方法,其中将视图合成优化过程应用于所述候选DC残余值集合中的每一者包括根据所述视图合成优化过程确定所述候选DC残余值集合中的每一者的成本,且其中基于所述视图合成优化过程从所述候选DC残余值集合选择一个DC残余值包括从所述候选DC残余值集合选择具有最低成本的所述一个DC残余值。
实例59。实例57的方法,其中识别包含所确定DC残余值的DC残余值的范围内的候选DC残余值的集合包括识别从作为小于所确定DC残余值的第一偏移值的第一DC残余值到作为大于所确定DC残余值的第二偏移值的第二DC残余值的DC残余值的范围内的候选DC残余值的集合。
实例60。实例59的方法,其中所述第一和第二偏移值是相同值。
实例61。实例60的方法,其中所述第一和第二偏移值是2。
实例62。实例59的方法,其中识别从作为小于所确定DC残余值的第一偏移值的第一DC残余值到作为大于所确定DC残余值的第二偏移值的第二DC残余值的DC残余值的范围内的候选DC残余值的集合包括识别由[DCResi[i]-Offset1,DCResi[i]+Offset2]界定的范围内的候选DC残余值的集合,其中DCResi[i]表示所确定的DC残余值,其中Offset1是所述第一偏移值且Offset2是所述第二偏移值,且其中Offset1和Offset2中的每一者包括非负整数值。
实例63。一种装置,其包括视频编码器,所述视频编码器包括:存储器,其经配置以存储对视频数据进行编码的经编码视频位流;以及一或多个处理器,其经配置以:根据深度帧内预测模式对深度块进行编码,其中对所述深度块进行编码包括执行简化深度译码(SDC)模式以基于所述深度帧内预测模式中的指示的一者确定所述深度块的至少一个DC残余值,其中所述DC残余值表示所述深度块的多个样本的残余值;识别包含所确定DC残余值的DC残余值的范围内的候选DC残余值的集合;将视图合成优化过程应用于所述候选DC残余值集合中的每一者;基于所述视图合成优化过程从所述候选DC残余值集合选择一个DC残余值;以及将所述选定DC残余值编码到经编码视频位流中。
实例64。实例63的装置,其中所述一或多个处理器经配置以根据所述视图合成优化过程确定所述候选DC残余值集合中的每一者的成本,且从所述候选DC残余值集合选择具有最低成本的所述一个DC残余值。
实例65。实例63的装置,其中所述一或多个处理器经配置以识别从作为小于所确定DC残余值的第一偏移值的第一DC残余值到作为大于所确定DC残余值的第二偏移值的第二DC残余值的DC残余值的范围内的候选DC残余值的集合。
实例66。实例65的装置,其中所述第一和第二偏移值是相同值。
实例67。实例66的装置,其中所述第一和第二偏移值是2。
实例68。实例65的装置,其中所述一或多个处理器经配置以识别由[DCResi[i]-Offset1,DCResi[i]+Offset2]界定的范围内的候选DC残余值的集合,其中DCResi[i]表示所确定的DC残余值,其中Offset1是所述第一偏移值且Offset2是所述第二偏移值,且其中Offset1和Offset2中的每一者包括非负整数值。
实例69。一种装置,其包括视频编码器,其中所述视频编码器包括:用于根据深度帧内预测模式对深度块进行编码的装置,其中对所述深度块进行编码包括执行简化深度译码(SDC)模式以基于所述深度帧内预测模式中的指示的一者确定所述深度块的至少一个DC残余值,其中所述DC残余值表示所述深度块的多个样本的残余值;用于识别包含所确定DC残余值的DC残余值的范围内的候选DC残余值的集合的装置;用于将视图合成优化过程应用于所述候选DC残余值集合中的每一者的装置;用于基于所述视图合成优化过程从所述候选DC残余值集合选择一个DC残余值的装置;以及用于将所述选定DC残余值编码到经编码视频位流中的装置。
实例70。实例69的装置,其中所述用于将视图合成优化过程应用于所述候选DC残余值集合中的每一者的装置包括用于根据所述视图合成优化过程确定所述候选DC残余值集合中的每一者的成本的装置,且其中所述用于基于所述视图合成优化过程从所述候选DC残余值集合选择一个DC残余值的装置包括用于从所述候选DC残余值集合选择具有最低成本的所述一个DC残余值的装置。
实例71。根据权利要求69所述的装置,其中所述用于识别包含所确定DC残余值的DC残余值的范围内的候选DC残余值的集合的装置包括用于识别从作为小于所确定DC残余值的第一偏移值的第一DC残余值到作为大于所确定DC残余值的第二偏移值的第二DC残余值的DC残余值的范围内的候选DC残余值的集合的装置。
实例72。实例71的装置,其中所述第一和第二偏移值是相同值。
实例73。实例72的装置,其中所述第一和第二偏移值是2。
实例74。实例71的装置,其中所述用于识别从作为小于所确定DC残余值的第一偏移值的第一DC残余值到作为大于所确定DC残余值的第二偏移值的第二DC残余值的DC残余值的范围内的候选DC残余值的集合的装置包括用于识别由[DCResi[i]-Offset1,DCResi[i]+Offset2]界定的范围内的候选DC残余值的集合的装置,其中DCResi[i]表示所确定的DC残余值,其中Offset1是所述第一偏移值且Offset2是所述第二偏移值,且其中Offset1和Offset2中的每一者包括非负整数值。
实例75。一种计算机可读存储媒体,其上存储有指令,所述指令在由视频编码器的一或多个处理器执行时致使所述视频编码器:根据深度帧内预测模式对深度块进行编码,其中对所述深度块进行编码包括执行简化深度译码(SDC)模式以基于所述深度帧内预测模式中的指示的一者确定所述深度块的至少一个DC残余值,其中所述DC残余值表示所述深度块的多个样本的残余值;识别包含所确定DC残余值的DC残余值的范围内的候选DC残余值的集合;将视图合成优化过程应用于所述候选DC残余值集合中的每一者;基于所述视图合成优化过程从所述候选DC残余值集合选择一个DC残余值;以及将所述选定DC残余值编码到经编码视频位流中。
实例76。实例75的计算机可读存储媒体,其中所述致使所述视频编码器将视图合成优化过程应用于所述候选DC残余值集合中的每一者的指令包括致使所述视频编码器根据所述视图合成优化过程确定所述候选DC残余值集合中的每一者的成本的指令,且其中所述致使所述视频编码器基于所述视图合成优化过程从所述候选DC残余值集合选择一个DC残余值的指令包括致使所述视频编码器从所述候选DC残余值集合选择具有最低成本的所述一个DC残余值的指令。
实例77。实例75的计算机可读存储媒体,其中所述致使所述视频编码器识别包含所确定DC残余值的DC残余值的范围内的候选DC残余值的集合的指令包括致使所述视频编码器识别从作为小于所确定DC残余值的第一偏移值的第一DC残余值到作为大于所确定DC残余值的第二偏移值的第二DC残余值的DC残余值的范围内的候选DC残余值的集合的指令。
实例78。实例77的计算机可读存储媒体,其中所述第一和第二偏移值是相同值。
实例79。实例78的计算机可读存储媒体,其中所述第一和第二偏移值是2。
实例80。根据权利要求77所述的计算机可读存储媒体,其中所述致使所述视频编码器识别从作为小于所确定DC残余值的第一偏移值的第一DC残余值到作为大于所确定DC残余值的第二偏移值的第二DC残余值的DC残余值的范围内的候选DC残余值的集合的指令包括致使所述视频编码器识别由[DCResi[i]-Offset1,DCResi[i]+Offset2]界定的范围内的候选DC残余值的集合的指令,其中DCResi[i]表示所确定的DC残余值,其中Offset1是所述第一偏移值且Offset2是所述第二偏移值,且其中Offset1和Offset2中的每一者包括非负整数值。

Claims (30)

1.一种对视频数据进行译码的方法,所述方法包括:
在经编码视频位流中对第一语法元素进行译码,其中所述第一语法元素的第一值指示从多个深度帧内预测模式为深度块选择的深度帧内预测模式是平面帧内预测模式、DC帧内预测模式或方向性帧内预测模式中的一者,且所述第一语法元素的第二值指示为所述深度块选择的所述深度帧内预测模式是多个深度模型化模式或区边界链译码模式中的一者;
在所述经编码视频位流中对第二语法元素进行译码,其中所述第二语法元素指示是否执行简化深度译码SDC模式以重构所述深度块,所述SDC模式包括从所述位流解码至少一个DC残余值,其中所述DC残余值表示所述深度块的多个样本的残余值;以及
根据所述第一和第二语法元素对所述深度块进行译码。
2.根据权利要求1所述的方法,其中所述第一语法元素包括hevc_intra_flag语法元素且所述第二语法元素包括sdc_flag语法元素。
3.根据权利要求1所述的方法,其中对所述第一和第二语法元素进行译码包括根据上下文自适应二进制算术译码CABAC过程对所述第一和第二语法元素进行译码。
4.根据权利要求3所述的方法,其进一步包括将用于根据所述CABAC过程对所述第一和第二语法元素中的至少一者进行译码的初始概率状态设定为非相等概率状态。
5.根据权利要求4所述的方法,其中将用于根据所述CABAC过程对所述第一和第二语法元素中的至少一者进行译码的所述初始概率状态设定为非相等概率状态包括将用于根据所述CABAC过程对所述第一语法元素进行译码的所述初始概率状态设定为非相等概率状态。
6.根据权利要求3所述的方法,其进一步包括:
确定包含所述深度块的切片的切片类型;以及
基于所述切片类型从多个概率状态选择用于根据所述CABAC过程对所述第一和第二语法元素中的至少一者进行译码的初始概率状态。
7.根据权利要求3所述的方法,其进一步包括设定用于根据所述CABAC过程对所述深度块的所述第一和第二语法元素中的至少一者进行译码的初始概率状态而无需参考所述深度块的任何相邻深度块的所述语法元素的值。
8.根据权利要求1所述的方法,其中对所述第一和第二语法元素进行译码包括对所述第一和第二语法元素进行解码,且其中根据所述第一和第二语法元素对所述深度块进行译码包括根据为所述深度块选择的所述深度帧内预测模式和是否执行所述SDC模式的所述指示而重构所述深度块。
9.根据权利要求1所述的方法,其中对所述第一和第二语法元素进行译码包括对所述第一和第二语法元素进行编码,所述方法进一步包括:
从所述多个深度帧内预测模式选择用于在所述经编码视频位流中对所述深度块进行编码的所述深度帧内预测模式;以及
确定是否执行所述SDC模式以用于在所述经编码视频位流中对所述深度块进行编码,且
其中根据所述第一和第二语法元素对所述深度块进行译码包括根据所述选定深度帧内预测模式和是否执行所述SDC模式的所述确定而在所述经编码视频位流中对所述深度块进行编码。
10.一种装置,其包括视频译码器,所述视频译码器包括:
存储器,其经配置以存储对视频数据进行编码的经编码视频位流;以及
一或多个处理器,其经配置以:
从所述经编码视频位流对第一语法元素进行译码,其中所述第一语法元素的第一值指示从多个深度帧内预测模式为深度块选择的深度帧内预测模式是平面帧内预测模式、DC帧内预测模式或方向性帧内预测模式中的一者,且所述第一语法元素的第二值指示为所述深度块选择的所述深度帧内预测模式是多个深度模型化模式或区边界链译码模式中的一者;
从所述经编码视频位流对第二语法元素进行译码,其中所述第二语法元素指示是否执行简化深度译码SDC模式以重构所述深度块,所述SDC模式包括从所述位流解码至少一个DC残余值,其中所述DC残余值表示所述深度块的多个样本的残余值;以及
根据所述第一和第二语法元素对所述深度块进行译码。
11.根据权利要求10所述的装置,其中所述第一语法元素包括hevc_intra_flag语法元素且所述第二语法元素包括sdc_flag语法元素。
12.根据权利要求10所述的装置,其中所述一或多个处理器经配置以根据上下文自适应二进制算术译码CABAC过程对所述第一和第二语法元素进行译码。
13.根据权利要求12所述的装置,其中所述一或多个处理器进一步经配置以将用于根据所述CABAC过程对所述第一和第二语法元素中的至少一者进行译码的初始概率状态设定为非相等概率状态。
14.根据权利要求13所述的装置,其中所述一或多个处理器经配置以将用于根据所述CABAC过程对所述第一语法元素进行译码的所述初始概率状态设定为非相等概率状态。
15.根据权利要求12所述的装置,其中所述一或多个处理器进一步经配置以:
确定包含所述深度块的切片的切片类型;以及
基于所述切片类型从多个概率状态选择用于根据所述CABAC过程对所述第一和第二语法元素中的至少一者进行译码的初始概率状态。
16.根据权利要求12所述的装置,其中所述一或多个处理器经配置以设定用于根据所述CABAC过程对所述深度块的所述第一和第二语法元素中的至少一者进行译码的初始概率状态而无需参考所述深度块的任何相邻深度块的所述语法元素的值。
17.根据权利要求10所述的装置,其中所述视频译码器包括视频解码器,且所述一或多个处理器经配置以对所述第一和第二语法元素进行解码,且根据为所述深度块选择的所述深度帧内预测模式和是否执行所述SDC模式的所述指示而重构所述深度块。
18.根据权利要求10所述的装置,其中所述视频译码器包括视频编码器,且所述一或多个处理器经配置以:
从所述多个深度帧内预测模式选择用于在所述经编码视频位流中对所述深度块进行编码的所述深度帧内预测模式;
确定是否执行所述SDC模式以用于在所述经编码视频位流中对所述深度块进行编码;
根据所述选定深度帧内预测模式和是否执行所述SDC模式的所述确定在所述经编码视频位流中对所述深度块进行编码;以及
在所述经编码视频位流中对所述第一和第二语法元素进行编码。
19.一种对视频数据进行编码的方法,所述方法包括:
根据从多个深度帧内预测模式选择的深度帧内预测模式对深度块进行编码,其中对所述深度块进行编码包括执行简化深度译码SDC模式以基于所述深度帧内预测模式中的所述指示的一者确定所述深度块的至少一个DC残余值,其中所述DC残余值表示所述深度块的多个样本的残余值;
识别包含所述所确定DC残余值的DC残余值的范围内的候选DC残余值的集合;
将视图合成优化过程应用于所述候选DC残余值集合中的每一者;
基于所述视图合成优化过程从所述候选DC残余值集合选择一个DC残余值;以及
将所述选定DC残余值编码到经编码视频位流中。
20.根据权利要求19所述的方法,其中将视图合成优化过程应用于所述候选DC残余值集合中的每一者包括根据所述视图合成优化过程确定所述候选DC残余值集合中的每一者的成本,且其中基于所述视图合成优化过程从所述候选DC残余值集合选择一个DC残余值包括从所述候选DC残余值集合选择具有最低成本的所述一个DC残余值。
21.根据权利要求19所述的方法,其中识别包含所述所确定DC残余值的DC残余值的范围内的候选DC残余值的集合包括识别从作为小于所述所确定DC残余值的第一偏移值的第一DC残余值到作为大于所述所确定DC残余值的第二偏移值的第二DC残余值的DC残余值的范围内的候选DC残余值的集合。
22.根据权利要求21所述的方法,其中所述第一和第二偏移值是相同值。
23.根据权利要求22所述的方法,其中所述第一和第二偏移值是2。
24.根据权利要求21所述的方法,
其中识别从作为小于所述所确定DC残余值的第一偏移值的第一DC残余值到作为大于所述所确定DC残余值的第二偏移值的第二DC残余值的DC残余值的范围内的候选DC残余值的集合包括识别由[DCResi[i]-Offset1,DCResi[i]+Offset2]界定的范围内的候选DC残余值的集合,
其中DCResi[i]表示所述所确定DC残余值,
其中Offset1是所述第一偏移值且Offset2是所述第二偏移值,且
其中Offset1和Offset2中的每一者包括非负整数值。
25.一种装置,其包括视频编码器,所述视频编码器包括:
存储器,其经配置以存储对视频数据进行编码的经编码视频位流;以及
一或多个处理器,其经配置以:
根据从多个深度帧内预测模式选择的深度帧内预测模式对深度块进行编码,其中对所述深度块进行编码包括执行简化深度译码SDC模式以基于所述深度帧内预测模式中的所述指示的一者确定所述深度块的至少一个DC残余值,其中所述DC残余值表示所述深度块的多个样本的残余值;
识别包含所述所确定DC残余值的DC残余值的范围内的候选DC残余值的集合;
将视图合成优化过程应用于所述候选DC残余值集合中的每一者;
基于所述视图合成优化过程从所述候选DC残余值集合选择一个DC残余值;以及
将所述选定DC残余值编码到经编码视频位流中。
26.根据权利要求25所述的装置,其中所述一或多个处理器经配置以根据所述视图合成优化过程确定所述候选DC残余值集合中的每一者的成本,且从所述候选DC残余值集合选择具有最低成本的所述一个DC残余值。
27.根据权利要求25所述的装置,其中所述一或多个处理器经配置以识别从作为小于所述所确定DC残余值的第一偏移值的第一DC残余值到作为大于所述所确定DC残余值的第二偏移值的第二DC残余值的DC残余值的范围内的候选DC残余值的集合。
28.根据权利要求27所述的装置,其中所述第一和第二偏移值是相同值。
29.根据权利要求28所述的装置,其中所述第一和第二偏移值是2。
30.根据权利要求27所述的装置,
其中所述一或多个处理器经配置以识别由[DCResi[i]-Offset1,DCResi[i]+Offset2]界定的范围内的候选DC残余值的集合,
其中DCResi[i]表示所述所确定DC残余值,
其中Offset1是所述第一偏移值且Offset2是所述第二偏移值,且
其中Offset1和Offset2中的每一者包括非负整数值。
CN201480052484.2A 2013-09-27 2014-09-26 用于深度帧内预测模式的残余译码 Pending CN105580361A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201480052484.2A CN105580361A (zh) 2013-09-27 2014-09-26 用于深度帧内预测模式的残余译码

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
CNPCT/CN2013/001176 2013-09-27
PCT/CN2013/001176 WO2015042751A1 (en) 2013-09-27 2013-09-27 Residual coding for depth intra prediction modes
US201361916041P 2013-12-13 2013-12-13
US61/916,041 2013-12-13
PCT/CN2014/087511 WO2015043501A1 (en) 2013-09-27 2014-09-26 Residual coding for depth intra prediction modes
CN201480052484.2A CN105580361A (zh) 2013-09-27 2014-09-26 用于深度帧内预测模式的残余译码

Publications (1)

Publication Number Publication Date
CN105580361A true CN105580361A (zh) 2016-05-11

Family

ID=55888364

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480052484.2A Pending CN105580361A (zh) 2013-09-27 2014-09-26 用于深度帧内预测模式的残余译码

Country Status (1)

Country Link
CN (1) CN105580361A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109120942A (zh) * 2018-09-27 2019-01-01 合肥工业大学 基于流水线架构的深度图像帧内预测的编码电路及其编码方法
CN109996066A (zh) * 2017-12-29 2019-07-09 富士通株式会社 图像编码装置,图像解码装置和电子设备
CN110024410A (zh) * 2016-11-25 2019-07-16 株式会社Kt 视频信号处理方法和设备
CN111052741A (zh) * 2017-09-06 2020-04-21 佳稳电子有限公司 基于有效传送的差分量化参数的影像编码/解码方法及装置
CN113330748A (zh) * 2019-02-07 2021-08-31 华为技术有限公司 帧内预测模式信令的方法和装置
WO2023193724A1 (en) * 2022-04-05 2023-10-12 Beijing Bytedance Network Technology Co., Ltd. Method, apparatus, and medium for video processing

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100086034A1 (en) * 2008-10-06 2010-04-08 Lg Electronics Inc. method and an apparatus for processing a video signal
CN102685532A (zh) * 2012-06-04 2012-09-19 山东大学 自由视点四维空间视频编码系统的编码方法
CN103067715A (zh) * 2013-01-10 2013-04-24 华为技术有限公司 深度图像的编解码方法和编解码装置
CN103237216A (zh) * 2013-04-12 2013-08-07 华为技术有限公司 深度图像的编解码方法和编解码装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100086034A1 (en) * 2008-10-06 2010-04-08 Lg Electronics Inc. method and an apparatus for processing a video signal
CN102685532A (zh) * 2012-06-04 2012-09-19 山东大学 自由视点四维空间视频编码系统的编码方法
CN103067715A (zh) * 2013-01-10 2013-04-24 华为技术有限公司 深度图像的编解码方法和编解码装置
CN103237216A (zh) * 2013-04-12 2013-08-07 华为技术有限公司 深度图像的编解码方法和编解码装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
JIN YOUNG LEE, MIN WOO PARK: "《3D-CE5 related: Simplified depth inter mode coding》", 《JOINT COLLABORATIVE TEAM ON 3D VIDEO CODING EXTENSIONS》 *
KARSTEN MULLER,PHILIPP MERKLE,ETC: "《3D Video Coding with Depth Modeling Modes and View Synthesis Optimization》", 《SIGNAL & INFORMATION PROCESSING ASSOCIATION ANNUAL SUMMIT AND CONFERENCE》 *
TECH G ET AL: "《3D-HEVC Draft Text 1》", 《JCT-3V MEETING; 27-7-2013~2-8-2013;VIENNA;(THE JOINT COLLABORATIVE TEAM ON 3D VIDEO CODING EXTENSION DEVELOPMENT OF ISO/IEC JTC1/SC29/WG11 AND ITU-T SG.16);URL:HTTP://PHENIX.INT一EU RY.FR/JCT2/,NO .JCT3V-E1001-V3,XP030131378》 *
张秋闻,安平,张艳,张兆杨: "《基于虚拟视点绘制失真估计的深度图帧内编码》", 《电子与信息学报》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110024410A (zh) * 2016-11-25 2019-07-16 株式会社Kt 视频信号处理方法和设备
CN110024410B (zh) * 2016-11-25 2023-07-28 株式会社Kt 用于对视频进行编码和解码的方法
US11968364B2 (en) 2016-11-25 2024-04-23 Kt Corporation Method and apparatus for processing video signal
CN111052741A (zh) * 2017-09-06 2020-04-21 佳稳电子有限公司 基于有效传送的差分量化参数的影像编码/解码方法及装置
CN109996066A (zh) * 2017-12-29 2019-07-09 富士通株式会社 图像编码装置,图像解码装置和电子设备
CN109120942A (zh) * 2018-09-27 2019-01-01 合肥工业大学 基于流水线架构的深度图像帧内预测的编码电路及其编码方法
CN109120942B (zh) * 2018-09-27 2020-08-07 合肥工业大学 基于流水线架构的深度图像帧内预测的编码电路及其编码方法
CN113330748A (zh) * 2019-02-07 2021-08-31 华为技术有限公司 帧内预测模式信令的方法和装置
WO2023193724A1 (en) * 2022-04-05 2023-10-12 Beijing Bytedance Network Technology Co., Ltd. Method, apparatus, and medium for video processing

Similar Documents

Publication Publication Date Title
CN105934948B (zh) 解码和编码视频数据的方法和装置及计算机可读存储介质
US10404999B2 (en) Residual coding for depth intra prediction modes
JP6312854B2 (ja) 3dビデオコーディングにおけるデルタdc残差コーディングの簡易化
CN105379282B (zh) 用于纹理译码的先进残余预测(arp)的方法和设备
CN105191317B (zh) 视图内以及跨越视图的深度查找表的预测性译码
CN105103559B (zh) 三维(3d)视频译码方法及装置
CN105052147A (zh) 用于3d-hevc的深度数据的深度译码模式信令
CN105874788B (zh) 对3d视频译码中较大预测块的逐段dc译码的简化
CN106105216A (zh) 用于3d视频译码的受约束深度帧内模式译码
CN104396250A (zh) 用于3d视频译码的深度图的帧内译码
CN104769949A (zh) 用于视差向量导出的图片的选择
CN105379286A (zh) 跨层的图片分割的位流限制
CN105052145A (zh) 剖析三维视频译码中的语法元素
CN105580372A (zh) 用于3d视频译码的组合式双向预测合并候选者
CN104471942A (zh) 重新使用参数集用于视频译码
CN105814896A (zh) 3d视频译码中的大型块和深度建模模式(dmm)
CN104685883A (zh) 用于3d视频的经视图间预测运动向量
CN105580365A (zh) Hevc中的基于子预测单元(pu)的时间运动向量预测和3d-hevc中的子pu设计
CN104365105A (zh) 视频译码中的外部图片
CN105122812A (zh) 用于三维(3d)视频译码的高级合并模式
CN105580364A (zh) Hevc中的基于子预测单元(pu)的时间运动向量预测和3d-hevc中的子pu设计
CN104025602A (zh) 三维视频译码中用信号通知视图合成预测支持
CN104335589A (zh) 用于视频译码的视图间预测的视差向量产生
CN106105212A (zh) 简化的子预测单元(sub‑pu)运动参数继承(mpi)
CN104272741A (zh) 多视图译码和3d译码中的视图相依性

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160511

RJ01 Rejection of invention patent application after publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1218820

Country of ref document: HK