CN105874788A - 对3d视频译码中较大预测块的逐段dc译码的简化 - Google Patents

对3d视频译码中较大预测块的逐段dc译码的简化 Download PDF

Info

Publication number
CN105874788A
CN105874788A CN201380081914.9A CN201380081914A CN105874788A CN 105874788 A CN105874788 A CN 105874788A CN 201380081914 A CN201380081914 A CN 201380081914A CN 105874788 A CN105874788 A CN 105874788A
Authority
CN
China
Prior art keywords
piece
sample
infra
frame
frame prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201380081914.9A
Other languages
English (en)
Other versions
CN105874788B (zh
Inventor
刘宏斌
陈颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN105874788A publication Critical patent/CN105874788A/zh
Application granted granted Critical
Publication of CN105874788B publication Critical patent/CN105874788B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/161Encoding, multiplexing or demultiplexing different image signal components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

大体来说,本发明描述用于简化在例如3D‑HEVC等3D视频译码过程中对例如64×64块等较大帧内预测块进行SDC译码的技术。在一些实例中,所述技术可包含在帧内SDC中将64×64帧内预测块处理为四个32×32帧内预测块。在帧内SDC中将较大帧内预测块处理为多个较小帧内预测块可降低所述帧内SDC过程中的最大缓冲器大小要求。

Description

对3D视频译码中较大预测块的逐段DC译码的简化
技术领域
本发明涉及视频译码,且更明确地说,涉及三维(3D)视频译码过程中的逐段DC译码(SDC)。
背景技术
数字视频能力可并入到广泛范围的装置中,包含数字电视机、数字直播系统、无线广播系统、平板计算机、智能电话、个人数字助理(PDA)、膝上型计算机或桌上型计算机、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、视频电话会议装置、机顶盒装置及类似物。数字视频装置实施视频压缩技术,例如,由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分高级视频译码(AVC)定义的标准、高效率视频译码(HEVC)标准和此些标准的扩展中所描述的技术。视频装置可更高效地发射、接收和存储数字视频信息。
编码器-解码器(编解码器)应用视频压缩技术以执行空间(图片内)预测和/或时间(图片间)预测以减少或移除视频序列中固有的冗余。对于基于块的视频译码,可将视频切片分割成视频块,视频块还可被称作经译码树块(CTB)、译码单元(CU)和/或译码节点。使用相对于同一图片中的相邻块中的参考样本的空间预测对图片的经帧内译码(I)切片中的视频块进行编码。图片的经帧间译码(P或B)切片中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测或相对于其它参考图片中的参考样本的时间预测。图片替代地可被称为帧。
空间或时间预测产生待译码块的预测性块。残余数据表示待译码的原始块与预测性块之间的像素差。经帧间译码块是根据指向形成预测性块的参考样本的块的运动向量和指示经译码块与预测性块之间的差的残余数据来编码。经帧内译码块是根据帧内译码模式和残余数据来编码。为了进一步压缩,可将残余数据从空间域变换到变换域,从而产生残余变换系数,接着可对残余变换系数进行量化。可扫描最初布置为二维阵列的经量化变换系数,以便产生变换系数的一维向量,且可应用熵译码以实现甚至更多压缩。
可通过(例如)从多个视角编码视图来产生多视图译码位流。多视图译码可允许解码器选择不同视图,或可能显现多个视图。另外,已经开发或正在开发的一些三维(3D)视频技术和标准利用多视图译码方面。举例来说,在一些3D视频译码过程中,不同视图可用以发射左眼和右眼视图以支持3D视频。其它3D视频译码过程可使用多视图加深度译码。在多视图加深度译码过程中,例如由HEVC的3D-HEVC扩展定义的过程,3D视频位流可含有不仅包含纹理视图分量而且包含深度视图分量的多个视图。举例来说,给定视图可包括纹理视图分量和深度视图分量。纹理视图和深度视图分量可用于建构3D视频数据。
发明内容
总的来说,本发明描述用于简化3D视频译码过程(例如,符合HEVC的3D-HEVC扩展的过程)中的较大帧内预测块(例如64×64块)的SDC译码的技术。在一些实例中,所述技术可包含在帧内SDC中将64×64帧内预测块处理为四个32×32帧内预测块。在帧内SDC中将较大帧内预测块处理为多个较小帧内预测块可降低帧内SDC过程中的最大缓冲器大小要求。
在一个实例中,本发明描述一种解码用于视频译码的深度数据的方法,所述方法包括:对于用于深度数据的第一块的帧内预测模式,帧内预测用于第二块的深度数据的样本,其中第二块包括各自具有为深度数据的第一块的大小的四分之一的相同大小的四个块,且对应于深度数据的第一块的左上方、右上方、左下方和右下方块;接收用于第一块的指示第一块的像素值与第二块的经帧内预测样本之间的差的深度数据的残余数据;和基于用于第二块的经帧内预测样本以及所述残余数据重建构深度数据的第一块。
在另一实例中,本发明描述一种编码用于视频译码的深度数据的方法,所述方法包括:对于用于深度数据的第一块的帧内预测模式,帧内预测用于第二块的深度数据的样本,其中第二块包括各自具有为深度数据的第一块的大小的四分之一的相同大小的四个块,且对应于深度数据的第一块的左上方、右上方、左下方和右下方块;基于第一块的像素值与第二块的经帧内预测样本之间的差产生用于第一块的残余数据;和基于所述帧内预测模式以及所述残余数据编码深度数据的第一块。
在另一实例中,本发明描述一种用于译码用于视频译码的深度数据的装置,所述装置包括:存储用于视频译码的深度数据的存储器;和一或多个处理器,其经配置以:对于用于深度数据的第一块的帧内预测模式,帧内预测用于第二块的深度数据的样本,其中第二块包括各自具有为深度数据的第一块的大小的四分之一的相同大小的四个块,且对应于深度数据的第一块的左上方、右上方、左下方和右下方块;且基于所述帧内预测模式和用于第一块的指示第一块的像素值与第二块的经帧内预测样本之间的差的残余数据来译码深度数据的第一块。
在随附图式和以下描述中阐述本发明的一或多个方面的细节。本发明中所描述的技术的其它特征、目标和优点将从描述和图式且从权利要求书而显而易见。
附图说明
图1是说明用于HEVC的帧内预测模式的图式。
图2是说明用于HEVC中的帧内预测模式的相邻样本的图式。
图3是说明可利用本发明的技术的实例视频译码系统的框图。
图4是说明适用于对像素样本的8×8块进行译码的一个楔波分区样式的实例的图式。
图5是说明适用于对像素样本的8×8块进行译码的一个轮廓分区样式的实例的图式。
图6是说明可实施本发明的技术的实例视频编码器的框图。
图7是说明可实施本发明的技术的实例视频解码器的框图。
图8是说明将64×64帧内预测块处理为四个较小32×32帧内预测块的图式。
图9是说明根据本发明的一实例的用于编码64×64帧内深度块的方法的流程图。
图10是说明根据本发明的一实例的用于解码64×64帧内深度块的方法的流程图。
具体实施方式
本发明描述用于简化3D视频译码过程(例如3D-HEVC)中的较大帧内预测块(例如64×64块)的逐段DC译码(SDC)的技术。在HEVC主规范中,最大帧内预测大小为32×32。然而,在3D-HEVC的帧内SDC模式中,平面模式(Planar mode)的最大帧内预测大小为64×64。另外,在Liu等人的JCT3V-F0126“CE5相关:3D-HEVC中用于全部帧内模式的通用SDC(CE5related:Generic SDC for all Intra modes in 3D-HEVC)”(ITU-T SG 16WP 3和ISO/IEC JTC 1/SC 29/WG 11的3D视频译码扩展联合合作小组第6次会议:瑞士日内瓦,2013年10月25日至11月1日)中已提出,在深度译码中,SDC可应用于额外深度帧内预测模式和原始HEVC帧内预测模式。
在本发明中,当用于像素、参考样本或预测样本的上下文中时,32×32、64×64或其它N×N表达可指与视频数据块相关联的多个像素、参考样本或预测样本。像素、参考样本或预测样本可与视频数据的明度、色度或深度分量相关联。一般来说,N×N像素或样本在块中产生N2个总像素或样本,其中所述块包含一个维度(例如,水平维度)中的N个像素或样本和另一维度(例如,垂直维度)中的N个像素或样本。
就JCT3V-F0126中的方案来说,所有HEVC帧内预测模式的最大帧内预测大小为64×64。因此,在与HEVC比较时,3D-HEVC和JCT3V-F0126中的方案二者都增加了用于帧内预测的最大缓冲器大小。在一些实例中,本发明描述用于简化3D-HEVC中的64×64SDC译码的技术。为了简化3D视频译码过程(例如,3D-HEVC)中的较大帧内预测块(例如,64×64块)的SDC译码,本发明描述可包含在帧内SDC中将较大帧内预测块(例如,64×64帧内预测块)处理为四个较小帧内预测块(例如,四个32×32帧内预测块)的技术。以此方式,在帧内SDC中,使用HEVC帧内预测模式将64×64帧内预测块处理为四个32×32帧内预测子块。在帧内SDC中将较大帧内预测块处理为多个较小帧内预测块可降低帧内SDC过程中的最大缓冲器大小要求。
在SDC中,视频编码器产生增量DC残余值以表示深度译码单元(CU)的经译码预测单元(PU)或PU分区的像素与经预测PU或PU分区的经预测样本之间的差值。PU可具有根据例如深度图建模(DMM)模式的分割模式定义的单一分区或两个或两个以上分区。在SDC中,增量DC值是表示PU或分区的像素的平均值与经预测PU或分区的预测样本的平均值之间的差值的单一值。为了重建构PU或PU分区,将单一增量DC值与经预测PU或PU分区的预测样本中的每一者的值进行求和。
在此部分中,回顾与本发明有关的视频译码标准和HEVC技术。视频译码标准的实例包含ITU-T H.261、ISO/IEC MPEG-1Visual、ITU-T H.262或ISO/IEC MPEG-2Visual、ITU-T H.263、ISO/IEC MPEG-4Visual和ITU-T H.264(也称为ISO/IEC MPEG-4AVC),包含其可缩放视频译码(SVC)和多视图视频译码(MVC)扩展。MVC的最新联合草案描述于2010年3月的“用于通用视听服务的高级视频译码(Advanced video coding forgeneric audiovisual services)”(ITU-T建议H.264)中。
此外,存在一种新的即将来临的视频译码标准,即高效率视频译码(HEVC),其由ITU-T视频译码专家组(VCEG)和ISO/IEC运动图片专家组(MPEG)的视频译码联合合作小组(JCT-VC)进行开发。HEVC标准的最近草案JCTVC-L1003(Benjamin Bross、Woo-JinHan、Jens-Ranier Ohm、Gary Sullivan、Ye-Kui Wang、Thomas Wiegand)“高效视频译码(HEVC)文本规范草案10(用于FDIS和最后呼叫)(High Efficiency VideoCoding(HEVC)text specification draft 10(for FDIS&Last Call))”(ITU-T SG 16WP 3和ISO/IEC JTC 1/SC 29/WG 11的视频译码联合合作小组(JCT-VC),第12次会议:瑞士日内瓦,2013年1月14日至23日(“HEVC WD 10”))以全文引用的方式并入本文中,且可从以下链接获得:
http://phenix.it-sudparis.eu/jct/doc_end_user/documents/12_Geneva/wg11/JCTVC-L1003 -v34.zip
图1是说明用于HEVC的帧内预测模式的图式。图1大体上说明与可用于HEVC中的帧内译码的各种方向性帧内预测模式相关联的预测方向。在当前HEVC中,(例如)如HEVC WD 10中所描述,对于每一预测单元(PU)的明度分量,结合33种方向性(角度)预测模式(从2到34编索引)、DC模式(以1编索引)和平面模式(以0编索引)利用帧内预测方法,如图1中所示。
在平面模式(以0编索引)中,使用所谓的“平面”功能执行预测以确定视频数据块(例如,PU)内的像素中的每一者的预测符值。根据DC模式(以1编索引),使用所述块内的像素值的平均化执行预测以确定所述块内的像素中的每一者的预测符值。根据方向性预测模式,基于相邻块的沿着特定方向(如由模式指示)的经重建构像素来执行预测。一般来说,图1中所示的箭头的尾端表示从其检索值的相邻像素中的相对一者,而所述箭头的头端表示所检索值沿着其传播以形成预测性块的方向。
对于HEVC帧内预测模式,视频编码器和/或视频解码器例如通过使用用于模式2到34的PU的相邻样本,使用上文所论述的各种模式来产生PU中的每一像素的像素特定预测符值。视频编码器基于块的像素的实际深度值与预测符值之间的差来确定视频块的残余值,且将所述残余值提供到视频解码器。根据HEVC WD 10,视频编码器变换所述残余值且量化变换系数,且还可对经量化变换系数进行熵编码。视频解码器(例如,在熵解码、逆量化和逆变换之后)通过将残余值添加到预测符值来确定块的像素的经重建构值。HEVC WD 10中指定关于HEVC帧内预测模式的其他细节。在SDC中,针对每一经预测PU或分区译码单一增量DC残余值。另外,并未对所述增量DC残余值进行变换或量化。
图2是说明用于HEVC中的帧内预测模式的相邻样本的图式。如图2中所展示,用于当前预测块的像素的各种方向性帧内预测模式可依赖于在空间上相邻的样本或此些相邻样本的组合。确切地说,在帧内预测过程中,使用左下方相邻样本、左方相邻样本、左上方相邻样本、上方相邻样本和右上方相邻经重建构样本(如果所述样本可用),如图2中所展示。相邻样本可从(例如)同一图片或视图内的在空间上邻近待帧内译码的当前块的相邻块获得。
在JCT-3V中,正开发两个HEVC扩展:多视图扩展(MV-HEVC)和3D视频扩展(3D-HEVC)。用于3D-HEVC的参考软件“3D-HTM版本9.0”的最近版本以全文引用的方式并入本文中,且可从以下链接下载:
[3D-HTM版本9.0]:
https://hevc.hhi.fraunhofer.de/svn/svn_3DVCSoftware/tags/HTM-9.0/
3D-HEVC的最近草案在JCTVC-F1001-v2(Gerhard Tech、Krzysztof Wegner、YingChen和Sehoon Yea,“3D-HEVC草案文本2(3D-HEVC Draft Text 2)”,ITU-T SG 16 WP3和ISO/IEC JTC 1/SC 29/WG 11的3D视频译码扩展开发联合合作小组,第6次会议:瑞士日内瓦,2013年10月25日到11月1日(下文称为“F1001”或“3D-HEVC WD”))中呈现,其以全文引用的方式并入本文中,且可从以下链接获得:
http://phenix.it-sudparis.eu/jct2/doc_end_user/documents/6_Geneva/wg11/JCT3V-F1001- v2.zip
在3D-HEVC中,如上文提到的3D-HEVC WD中所定义,每一存取单元含有多个图片,且每一视图中的图片中的每一者具有唯一视图识别(id)或视图次序索引。然而,同一视图的深度图片和纹理图片可具有不同层id。
现将描述3D视频译码中的深度译码。3D视频数据是使用多视图视频加深度格式来表示,其中俘获的视图(纹理)与对应深度图相关联。在3D视频译码中,纹理和深度图经译码且多路复用到3D视频位流中。将深度图译码为灰度视频,其中明度样本表示深度值,且可将常规的帧内和帧间译码方法应用于深度图译码。
深度图可由锐边缘和恒定区域表征。由于深度图样本的不同统计,基于2D视频编解码器针对深度图设计不同译码方案。在多视图加深度译码过程中,视图可包含纹理分量和深度分量。可对深度分量中的深度译码单元(CU)进行帧间译码或帧内译码。可将深度CU划分成一或多个PU,且可将PU划分成一或多个分区。
可对分区进行帧内预测或帧间预测,且在一些实例中,可使用逐段DC残余译码(SDC)来译码深度残余。在SDC中,可对表示经译码PU分区与经帧内或帧间译码PU分区之间的差的增量DC残余值进行译码。明确地说,增量DC值可为用于整个PU或PU分区的单一值。所述单一值可表示经译码PU分区的像素值的平均值与经帧间或帧内预测的PU或分区的预测样本的平均值之间的差值。
图3是说明可经配置以利用本发明的各种技术的实例视频编码和解码系统10的框图,所述技术例如用于简化3D视频译码过程(例如3D-HEVC)中的较大帧内预测块(例如64×64块)的逐段DC译码(SDC)的技术。在一些实例中,系统10的视频编码器20和/或视频解码器30可经配置以在帧内SDC中将较大64×64帧内预测块(例如,64×64帧内预测块)处理为四个较小帧内预测块(例如,四个32×32帧内预测块)。以此方式,在帧内SDC中,将HEVC帧内预测模式的64×64帧内预测处理为四个32×32帧内预测。在一些情况下,在帧内SDC中将较大帧内预测块处理为多个较小帧内预测块可降低编码器20和/或解码器30的帧内SDC过程中的最大缓冲器大小要求。
如图3中所展示,系统10包含源装置12,其提供在稍后时间将由目的地装置14解码的经编码视频数据。确切地说,源装置12经由计算机可读媒体16将视频数据提供到目的地装置14。源装置12和目的地装置14可包括广泛范围的装置中的任一者,包含桌上型计算机、笔记型(即,膝上型)计算机、平板计算机、机顶盒、电话手持机(例如所谓的“智能”电话)、所谓的“智能”平板机、电视机、相机、显示装置、数字媒体播放器、视频游戏控制台、视频流式传输装置或类似物。在一些情况下,源装置12和目的地装置14可经装备以用于无线通信。
目的地装置14可经由计算机可读媒体16接收待解码的经编码视频数据。计算机可读媒体16可包括能够将经编码视频数据从源装置12移动到目的地装置14的任何类型的媒体或装置。在一个实例中,计算机可读媒体16可包括通信媒体(例如发射信道)以使源装置12能够实时地将经编码视频数据直接发射到目的地装置14。
可根据通信标准(例如,无线通信协议)调制经编码视频数据,且将其发射到目的地装置14。通信媒体可包括任何无线或有线通信媒体,例如射频(RF)频谱或一或多个物理发射线。通信媒体可形成分组网络(例如局域网、广域网或全球网络,例如因特网)的部分。通信媒体可包含路由器、交换器、基站或可用于促进从源装置12到目的地装置14的通信的任何其它设备。
在一些实例中,经编码数据可从输出接口22输出到计算机可读存储媒体,例如非暂时性计算机可读存储媒体,即数据存储装置。类似地,可通过输入接口从存储装置存取经编码数据。存储装置可包含各种分布式或本地存取的非暂时性数据存储媒体中的任一者,例如硬盘驱动器、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器或用于存储经编码视频数据的任何其它合适的数字存储媒体。在另一实例中,存储装置可对应于文件服务器或可存储源装置12产生的经编码视频的另一中间存储装置。
目的地装置14可经由流式传输或下载从存储装置存取经存储的视频数据。文件服务器可为能够存储经编码视频数据且将所述经编码视频数据发射到目的地装置14的任何类型的服务器。实例文件服务器包含万维网服务器(例如,用于网站)、FTP服务器、网络连接存储(NAS)装置或本地磁盘驱动器。目的地装置14可经由任何标准数据连接(包含因特网连接)来存取经编码视频数据。此连接可包含适合于存取存储于文件服务器上的经编码视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、电缆调制解调器等)或两者的组合。经编码视频数据从存储装置的发射可为流式传输发射、下载发射或其组合。
本发明的技术可应用于视频译码以支持多种有线或无线多媒体应用中的任一者,例如空中电视广播、有线电视发射、卫星电视发射、因特网流式传输视频发射(例如经由HTTP的动态自适应流式传输(DASH))、编码到数据存储媒体上的数字视频、存储于数据存储媒体上的数字视频的解码,或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频发射,以支持例如视频流式传输、视频重放、视频广播和/或视频电话的应用。
在图3的实例中,源装置12包含视频源18、视频编码器20和输出接口22。目的地装置14包含输入接口28、视频解码器30和显示装置32。根据本发明,源装置12的视频编码器20可经配置以应用用于简化的增量DC译码的技术以用于3D视频译码过程(例如3D-HEVC)中的深度译码。在其它实例中,源装置和目的地装置可包含其它组件或布置。举例来说,源装置12可从例如外部相机的外部视频源18接收视频数据。同样,目的地装置14可与外部显示装置介接,而非包含集成式显示装置。
图3的所说明系统10仅为一个实例。本发明中描述的技术可由数字视频编码和/或解码装置执行。尽管本发明的技术一般由视频编码器20和/或视频解码器30来执行,但是所述技术也可由视频编码器/解码器(通常被称作“编解码器”)来执行。此外,本发明的技术还可由视频预处理器来执行。源装置12和目的地装置14仅为源装置12在其中产生经译码视频数据以供发射到目的地装置14的此些译码装置的实例。在一些实例中,装置12、14可以实质上对称的方式操作,使得装置12、14中的每一者包含视频编码和解码组件。因此,系统10可支持视频装置12、14之间的单向或双向视频发射,以(例如)用于视频流式传输、视频重放、视频广播或视频电话。
源装置12的视频源18可包含视频俘获装置,例如摄像机、含有先前所俘获视频的视频存档和/或用于从视频内容提供者接收视频的视频馈送接口。作为另一替代方案,视频源18可产生基于计算机图形的数据作为源视频,或直播视频、存档视频与计算机产生的视频的组合。在一些情况下,如果视频源18是摄像机,那么源装置12和目的地装置14可形成所谓的智能电话、平板计算机或视频电话。然而,如上文所提及,本发明中所描述的技术一般可适用于视频译码,且可应用于无线和/或有线应用。在每一情况下,可由视频编码器20编码所捕获、预先捕获或计算机产生的视频。经编码视频信息可接着通过输出接口22输出到计算机可读媒体16上。
计算机可读媒体16可包含暂时性媒体(例如无线广播或有线网络发射),或数据存储媒体(即,非暂时性存储媒体)。在一些实例中,网络服务器(未图示)可从源装置12接收经编码视频数据,并且例如经由网络发射将经编码视频数据提供到目的地装置14。类似地,媒体生产设施(例如光盘冲压设施)的计算装置可从源装置12接收经编码视频数据,且生产含有经编码视频数据的光盘。因此,在各种实例中,计算机可读媒体16可以理解为包含各种形式的一或多个计算机可读媒体。
本发明通常可指视频编码器20将某些信息“用信号发送”到另一装置,例如视频解码器30。然而,应理解,视频编码器20可通过使某些语法元素与视频数据的各种经编码部分相关联来用信号发送信息。也就是说,视频编码器20可通过将某些语法元素存储到视频数据的各种经编码部分的标头或有效负载中而“用信号发送”数据。在一些情况下,此些语法元素可在被视频解码器30接收和解码之前被编码和存储(例如,存储到计算机可读媒体16)。因此,术语“用信号发送”可大体上指代用于解码经压缩的视频数据的语法或其它数据的通信,不论此类通信是实时或近乎实时发生还是在一段时间中发生,例如可能在编码时将语法元素存储到媒体上的时候发生,接着可以在存储到这个媒体之后的任何时间由解码装置检索。
目的地装置14的输入接口28从计算机可读媒体16接收信息。计算机可读媒体16的信息可包含由视频编码器20定义的语法信息,所述语法信息也被视频解码器30使用,所述语法信息包含描述块和其它经译码单元(例如,GOP)的特性和/或处理的语法元素。显示装置32向用户显示经解码视频数据,且可包括多种显示装置中的任一者,例如阴极射线管(CRT)、液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器、投影装置或另一类型的显示装置。
尽管图3中未展示,但在一些方面中,视频编码器20和视频解码器30可各自与音频编码器和解码器集成,且可包含适当MUX-DEMUX单元或其它硬件和软件,以处置对共同数据流或单独数据流中的音频和视频两者的编码。如果适用的话,作为一个实例,MUX-DEMUX单元可符合ITU H.223多路复用器协议,或例如用户数据报协议(UDP)的其它协议。
视频编码器20和视频解码器30各自可以经实施为可适用的多种合适的编码器或解码器电路中的任一者,例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑电路、软件、硬件、固件或其任何组合。视频编码器20和视频解码器30中的每一者可包含在一或多个编码器或解码器中,所述编码器或解码器中的任一者可集成为组合式视频编码器/解码器(编解码器)的部分。包含视频编码器20和/或视频解码器30的装置可包括集成电路、微处理器和/或无线通信装置,例如蜂窝式电话。
视频编码器20和视频解码器30可根据视频译码标准来操作,所述视频译码标准例如HEVC标准,且更确切地说,HEVC标准的3D-HEVC扩展,如在本发明中例如通过文件F1001或3D-HEVC WD所提及。HEVC假设视频译码装置相对于经配置以根据其它过程(例如ITU-T H.264/AVC)执行译码的装置的若干额外能力。举例来说,虽然H.264提供了九种帧内预测编码模式,但是HM可提供多达三十五种帧内预测编码模式。
现将论述HEVC的一些基础方面。一般来说,HEVC指定视频图片(或“帧”)可被划分成被称作译码树单元(CTU)的一连串最大译码单元。CTU包含分别包含明度和色度样本的对应明度和色度分量,所述明度和色度分量被称作经译码树块(CTB),例如明度CTB和色度CTB。位流内的语法数据可定义CTU(就像素数目来说的最大译码单元)的大小。切片包含呈译码次序的多个连续CTB。图片可分割成一或多个切片。每一CTB可根据四叉树分割结构分裂成若干译码单元(CU)。一般来说,四叉树数据结构包含每个CU一个节点,其中根节点对应于CTB。如果CU分裂成四个子CU,那么对应于CU的节点包含四个叶节点,所述叶节点中的每一者对应于所述子CU中的一者。
四叉树数据结构的每一节点可提供用于对应CU的语法数据。举例来说,四叉树中的节点可包含分裂旗标,其指示对应于所述节点的CU是否分裂成子CU。用于CU的语法元素可以递归方式定义,并且可取决于CU是否分裂成子CU。如果CU不进一步分裂,那么将其称为叶CU。叶CU的四个子CU也可被称为叶CU,即使不存在原始叶CU的显式分裂时也是如此。举例来说,如果16×16大小的CU不进一步分裂,那么四个8×8子CU也将被称作叶CU,尽管16×16CU从未分裂。
HEVC中的CU具有与H.264标准的宏块类似的目的,除了CU不具有大小区别。举例来说,CTB可分裂成四个子节点(还被称作子CU),且每一子节点又可为父节点且分裂成另外四个子节点。最后的未经分裂子节点(被称作四叉树的叶节点)包括译码节点,也称为叶CU。与经译码位流相关联的语法数据可定义CTB可分裂的最大次数(被称作最大CU深度),且还可定义译码节点的最小大小。因此,在一些实例中,位流还可定义最小译码单元。
CU包含译码节点和与所述译码节点相关联的预测单元(PU)和变换单元(TU)。本发明可使用术语“块”来指代HEVC的上下文中的CU、预测单元(PU)、变换单元(TU)或其分区或其它标准的上下文中的类似数据结构中的任一者。CU的大小对应于译码节点的大小。CU的大小范围可从8×8像素至多达具有最大64×64像素或更大的CTB的大小。每一CU可含有一或多个PU和一或多个TU。举例来说,与CU相关联的语法数据可描述将CU分割成一或多个PU。分割模式可在CU被跳过还是经直接模式编码、帧内预测模式编码或帧间预测模式编码之间不同。在如本发明中所描述的深度译码的情况下,PU可分割为非正方形形状,或包含非矩形形状的分区。举例来说,与CU相关联的语法数据还可描述根据四叉树将CU分割成一或多个TU。TU可为正方形或非正方形(例如,矩形)形状。
HEVC标准允许根据TU的变换,所述变换可针对不同CU而有所不同。TU的大小通常是基于针对经分割的CTB定义的给定CU内的PU的大小来设定,但是情况可能并不总是如此。TU通常与PU大小相同或小于PU。在一些实例中,可使用被称为“残余四叉树”(RQT)的四叉树结构将对应于CU的残余样本细分成较小单元。RQT的叶节点可被称为变换单元(TU)。可变换与TU相关联的像素差值以产生变换系数,所述变换系数可经量化。然而,在SDC中,增量DC残余值通常未经变换或量化。
叶CU可包含一或多个预测单元(PU)。一般来说,PU表示对应于对应CU的全部或一部分的空间区域,且可包含用于检索PU的参考样本的数据。参考样本可为来自参考块的像素。在一些实例中,参考样本可从参考块获得或例如通过内插或其它技术而产生。PU还包含与预测有关的数据。举例来说,当PU经帧内模式编码时,PU的数据可包含在残余四叉树(RQT)中,所述残余四叉树可包含描述用于对应于PU的TU的帧内预测模式的数据。
作为另一实例,当PU经帧间模式编码时,PU可包含定义用于PU的一或多个运动向量的数据。定义用于PU的运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精确度或八分之一像素精确度)、运动向量指向的参考图片和/或用于运动向量的参考图片列表(例如,RefPicList 0或RefPicList 1)。
具有一或多个PU的叶CU还可包含一或多个变换单位(TU)。可使用RQT(也称为TU四叉树结构)来指定变换单元,如上文所论述。举例来说,分裂旗标可指示叶CU是否分裂成四个变换单元。接着,每一变换单元可进一步分裂成更多个子TU。当TU未进一步分裂时,其可被称作叶TU。一般来说,对于帧内译码,属于一叶CU的所有叶TU共享相同的帧内预测模式。也就是说,通常应用相同的帧内预测模式来计算一叶CU的所有TU的预测值。对于帧内译码,视频编码器20可使用帧内预测模式针对每一叶TU计算残余值,作为CU的对应于TU的部分与原始块之间的差。TU未必限于PU的大小。因此,TU可比PU大或小。对于帧内译码,PU可与相同CU的对应叶TU处于相同位置。在一些实例中,叶TU的最大大小可对应于对应叶CU的大小。
此外,叶CU的TU还可与相应四叉树数据结构(被称作残余四叉树(RQT))相关联。也就是说,叶CU可包含指示叶CU如何分割成TU的四叉树。TU四叉树的根节点通常对应于叶CU,而CU四叉树的根节点通常对应于CTB。未经分裂的RQT的TU被称作叶TU。一般来说,除非以其它方式提及,否则本发明分别使用术语CU和TU来指代叶CU和叶TU。
视频序列通常包含一系列图片。如本文中所描述,“图片”与“帧”可互换使用。也就是说,含有视频数据的图片可被称为视频帧或简称为“帧”。图片群组(GOP)通常包括一系列的视频图片中的一或多者。GOP可包含GOP的标头、图片中的一或多者的标头或其它地方中的语法数据,所述语法数据描述GOP中所包含的图片的数目。图片的每一切片可包含切片语法数据,其描述用于相应切片的编码模式。视频编码器20通常对各个视频切片内的视频块进行操作以便对视频数据进行编码。视频块可对应于CU内的译码节点。视频块可具有固定或变化的大小,且根据所指定的译码标准可具有不同大小。
作为一实例,HEVC支持各种PU大小的预测。假设特定CU的大小是2N×2N,那么HEVC支持2N×2N或N×N的PU大小的帧内预测,和2N×2N、2N×N、N×2N或N×N的对称PU大小的帧间预测。具有2N×2N大小的PU表示未划分的CU,因为其与其驻留的CU为相同大小。换句话说,2N×2N PU与其CU大小相同。HEVC支持用于2N×nU、2N×nD、nL×2N和nR×2N的PU大小的帧间预测的不对称分割。在不对称分割中,不分割CU的一个方向,而将另一方向分割成25%和75%。CU的对应于25%分区的部分由“n”后接“上”、“下”、“左”或“右”的指示来指示。因此,举例来说,“2N×nU”是指水平地分割的2N×2N CU,其中顶部为2N×0.5N PU,且底部为2N×1.5N PU。对于深度译码,3D-HEVC WD进一步支持根据深度建模模式(DMM)对PU进行分割,包含非矩形分区,如将描述。
在本发明中,“N×N”与“N乘N”可互换地使用以依据垂直和水平尺寸来指代视频块的像素尺寸,例如,16×16像素或16乘16像素。一般来说,16×16块将在垂直方向上具有16个像素(y=16),且在水平方向上具有16个像素(x=16)。同样地,N×N块通常在垂直方向上具有N个像素,且在水平方向上具有N个像素,其中N表示非负整数值。块中的像素可布置成行和列。此外,块未必需要在水平方向与垂直方向上具有相同数目个像素。举例来说,块可包括N×M像素,其中M未必等于N。
在使用CU的PU进行常规的帧内预测性或帧间预测性译码之后,视频编码器20可计算用于CU的TU的残余数据。PU可包括描述在空间域(也称为像素域)中产生预测性像素数据的方法或模式的语法数据,且用于常规残余译码的TU可包括在对残余视频数据应用变换(例如,离散余弦变换(DCT)、整数变换、小波变换或概念上类似的变换)之后变换域中的系数。残余数据可对应于未经编码图片的像素与对应于PU的预测值之间的像素差。视频编码器20可形成包含用于CU的残余数据的TU,且接着变换所述TU以产生用于CU的变换系数。
在用于产生变换系数的任何变换之后,视频编码器20可执行变换系数的量化。量化一般是指变换系数经量化以可能地减少用于表示系数的数据量从而提供进一步压缩的过程。量化过程可减小与系数中的一些或全部相关联的位深度。举例来说,n位值可在量化期间被舍入到m位值,其中n大于m。对于深度译码,3D-HEVC WD进一步支持用于残余数据的SDC,其中增量DC值表示用于PU分区的残余值。不同于常规HEVC残余值,增量DC残余值通常不经变换或量化。
在量化之后,视频编码器20可扫描经量化变换系数,从包含经量化变换系数的二维矩阵产生一维向量。扫描可经设计以将较高能量(且因此较低频率)系数放置在阵列的前面,且将较低能量(且因此较高频率)系数放置在阵列的后面。
在一些实例中,视频编码器20可利用预定义扫描次序来扫描经量化变换系数以产生可被熵编码的串行化向量。在其它实例中,视频编码器20可执行自适应扫描。在扫描经量化变换系数以形成一维向量之后,视频编码器20可例如根据上下文自适应二进制算术译码(CABAC)对所述一维向量进行熵编码,如HEVC中所使用。其它熵译码过程的实例包含上下文自适应可变长度译码(CAVLC)、基于语法的上下文自适应二进制算术译码(SBAC)和概率间隔分割熵(PIPE)译码。同样,在HEVC中使用CABAC。视频编码器20还可对与经编码视频数据相关联的语法元素进行熵编码以供视频解码器30在解码视频数据时使用。
视频编码器20可例如在图片标头、块标头、切片标头或GOP标头中进一步将例如基于块的语法数据、基于图片的语法数据和基于GOP的语法数据的语法数据发送到视频解码器30。GOP语法数据可描述相应GOP中的图片的数目,且图片语法数据可指示用于编码对应图片的编码/预测模式。
视频编码器20和/或视频解码器30可执行深度数据的图片内预测译码和深度数据的帧间预测译码。另外,根据本发明的实例,视频编码器20和/或视频解码器30可例如根据多种实例中的任一者使用SDC对由视频数据的深度帧内预测译码和/或视频数据的深度帧间预测译码产生的DC残余数据进行译码,如将描述。
在HEVC中,假设译码单元(CU)的大小是2N×2N,视频编码器20和视频解码器30可支持用于帧内预测的2N×2N或N×N的各种预测单元(PU)大小,以及用于帧间预测的2N×2N、2N×N、N×2N、N×N或类似大小的对称PU大小。视频编码器和视频解码器还可支持用于帧间预测的2N×nU、2N×nD、nL×2N和nR×2N的PU大小的不对称分割。对于如3D-HEVC中提供的深度译码,视频编码器和视频解码器可经配置以支持用于帧内预测和/或帧间预测的多种不同深度译码模式,包含各种深度建模模式(DMM),如本发明中所描述。
使用3D视频译码技术译码的视频数据可经再现且显示以产生三维效应。作为一个实例,不同视图的两个图像(即,对应于具有稍微不同水平位置的两个相机视角)可大体上同时显示以使得一个图像由观察者的左眼看见,且另一图像由观察者的右眼看见。
3D效果可使用(例如)立体显示器或自动立体显示器实现。立体显示器可结合相应地对所述两个图像进行滤波的护目镜而使用。举例来说,无源眼镜可使用偏光镜片或不同有色镜片或其它光学滤波技术对图像进行滤波,以确保恰当的眼睛看见恰当的图像。作为另一实例,有源眼镜可与立体显示器协调地快速遮挡交替的镜片,所述立体显示器可在显示左眼图像与右眼图像之间交替。自动立体显示器以不需要眼镜的方式显示所述两个图像。举例来说,自动立体显示器可包含经配置以使得每一图像投影到观察者的适当眼睛中的镜或棱镜。
本发明的技术涉及用于通过对深度数据进行译码以支持3D视频来对3D视频数据进行译码的技术。一般来说,术语“纹理”用以描述图像的明度(即,亮度或“明度(luma)”)值和图像的色度(即,色彩或“色度(chroma)”)值。在一些实例中,纹理图像可包含一组明度数据(Y)和用于蓝色调(Cb)和红色调(Cr)的两组色度数据。在例如4:2:2或4:2:0的某些色度格式中,色度数据相对于明度数据经下取样。也就是说,色度像素的空间分辨率可低于对应明度像素的空间分辨率,例如为明度分辨率的二分之一或四分之一。
深度数据通常描述对应纹理数据的深度值。举例来说,深度图像可包含一组深度像素(或深度值),所述深度像素各自描述(例如)视图的纹理分量中的对应纹理数据(例如)在所述视图的深度分量中的深度。每一像素可具有一或多个纹理值(例如,明度和色度),且还可具有一或多个深度值。纹理图片和深度图可(但不需要)具有相同空间分辨率。举例来说,深度图可包含比对应纹理图片更多或更少的像素。深度数据可用以确定对应纹理数据的水平视差,且在一些情况下,也可使用垂直视差。
接收纹理和深度数据的装置可显示一个视图(例如,左眼视图)的第一纹理图像,且通过使第一图像的像素值偏移基于深度值所确定的水平视差值而使用深度数据修改第一纹理图像以产生另一视图(例如,右眼视图)的第二纹理图像。一般来说,水平视差(或简称“视差”)描述第一视图中的像素与右视图中的对应像素的水平空间偏移,其中两个像素对应于如于两个视图中所表示的相同对象的相同部分。
在又其它实例中,可针对垂直于图像平面的z维度中的像素定义深度数据,使得与给定像素相关联的深度是相对于针对所述图像定义的零视差平面而定义。此深度可用以产生用于显示像素的水平视差,使得所述像素取决于所述像素相对于零视差平面的z维度深度值而对于左眼和右眼以不同方式显示。零视差平面可针对视频序列的不同部分改变,且也可改变相对于零视差平面的深度量。
可针对左眼和右眼类似地定义位于零视差平面上的像素。位于零视差平面之前的像素可对于左眼与右眼显示于不同位置中(例如,具有水平视差),以便产生像素似乎是从垂直于图像平面的z方向上的图像出现的感觉。位于零视差平面后的像素可显示为具有轻微模糊以轻微地感觉到深度,或可对于左眼与右眼显示于不同位置中(例如,具有与位于零视差平面前的像素相反的水平视差)。许多其它技术也可用以传达或定义图像的深度数据。
二维视频数据通常经译码为离散图片的序列,所述离散图片中的每一者对应于特定时间例项。也就是说,每一图片具有相对于所述序列中的其它图像的重放时间的相关联重放时间。这些图片可被视为纹理图片或纹理图像。在基于深度的3D视频译码中,序列中的每一纹理图片还可对应于深度图。即,对应于纹理图片的深度图描述对应纹理图片的深度数据。多视图视频数据可包含各种不同视图的数据,其中每一视图可包含纹理分量和对应深度分量的相应序列。
图片通常对应于特定时间例项。视频数据可使用存取单元序列来表示,其中每一存取单元包含对应于特定时间例项的所有数据。因此,举例来说,对于多视图视频数据加深度译码,来自用于共同时间例项的每一视图的纹理图像加所述纹理图像中的每一者的深度图可全部包含在特定存取单元内。因此,存取单元可包含多个视图,其中每一视图可包含对应于纹理图像的纹理分量的数据以及对应于深度图的深度分量的数据。
每一存取单元可含有多个视图分量或图片。特定视图的视图分量与唯一视图id或视图次序索引相关联,以使得不同视图的视图分量与不同视图id或视图次序索引相关联。视图分量可包含纹理视图分量以及深度视图分量。同一视图中的纹理和深度视图分量可具有不同层id。纹理视图分量可经译码为一或多个纹理切片,而深度视图分量可经译码为一或多个深度切片。多视图加深度产生多种译码可能性,例如图片内、图片间、视图内、视图间、运动预测及类似物。
以此方式,3D视频数据可使用多视图视频加深度格式来表示,其中所俘获或产生的视图包含与对应深度图相关联的纹理分量。此外,在3D视频译码中,纹理和深度图可经译码且多路复用到3D视频位流中。深度图可经译码为灰度图像,其中深度图的“明度”样本(即,像素)表示深度值。
一般来说,深度数据的块(深度图的例如对应于像素的样本的块)可被称为深度块。深度值可被称为与深度样本相关联的明度值。也就是说,深度图通常可被视为单色纹理图片,即,包含明度值且不包含色度值的纹理图片。在任何情况下,常规帧内和帧间译码方法可应用于深度图译码。替代地或另外,例如帧内SDC或帧间SDC的其它译码方法可应用于3D视频译码过程(例如3D-HEVC)中的深度图译码。
在3D-HEVC中,利用与HEVC中相同的帧内预测模式的定义。也就是说,在3D-HEVC中使用的帧内模式包含HEVC的帧内模式。并且,在3D-HEVC中,连同HEVC帧内预测模式一起引入深度建模模式(DMM)以译码深度切片的帧内预测单元。
为了更好地表示深度图中的锐边缘,当前HTM(3D-HTM版本9.0)应用DMM方法来进行深度图的帧内译码。将深度块分割成通过DMM样式指定的两个区域,其中每一区域由恒定值表示。DMM样式可明确地用信号来发送(DMM模式1),或通过相同位置的纹理块预测(DMM模式4)。
存在在DMM中定义的两种类型的分割模型,包含楔波分割和轮廓分割。图4是说明适用于对像素样本的块进行译码的楔波分区样式的实例的图式。图5是说明适用于对像素样本的块进行译码的轮廓分区样式的实例的图式。对于如图4中所展示的楔波分区,例如PU的深度块由直线分割成两个区域,其中所述两个区域标记有P0和P1。对于如图5中所展示的轮廓分割,例如PU的深度块可分割成两个不规则区域。因此,PU可包含单一分区,或在楔波分割或轮廓分割的情况下可包含两个分区。
轮廓分割比楔波分割更灵活,但难以明确地用信号发送。在DMM模式4中,使用相同位置的纹理块的经重建构明度样本隐式地导出轮廓分割样式。
作为一个实例,图4提供用于8×8块40的楔波样式的说明。对于楔波分区,例如PU的深度块由直线46分割成两个区域42、44,其中开始点48位于(Xs,Ys)处且结束点50位于(Xe,Ye)处,如图4中所说明,其中两个区域42、44也分别标记有P0和P1。块40中的每一样式由大小uB×vB二进制数字的阵列组成,所述数字标记对应样本属于区域P0还是P1,其中uB和vB分别表示当前PU的水平和垂直大小。区域P0和P1在图4中分别由白色和阴影样本表示。
如图5的实例中所展示,例如深度块60的深度块可使用轮廓分割分割成三个不规则形状的区域62、64A和64B,其中分别将区域62标记为P0且将两个区域64A和64B共同标记为P1。尽管区域64A中的像素不紧邻区域64B中的像素,但区域64A和64B可经定义从而形成一个单一区域,以用于预测深度块60的PU的目的。在DMM模式4中,在3D-HEVC的情况下,轮廓分割样式是使用相同位置的纹理块的经重建构明度样本隐式地导出。
参考图4和5,N×N深度块40和60内的每一个别正方形分别表示深度块40和60的相应个别像素。在图4中,正方形内的数值表示对应像素属于区域42(图4的实例中的值“0”)还是区域44(图4的实例中的值“1”)。图4中还使用阴影来指示像素属于区域42(白色正方形)还是区域44(灰色阴影正方形)。
如上文所论述,每一样式(即,楔波和轮廓两者)可由大小uB×vB二进制数字的阵列定义,所述数字标记对应样本(即,像素)属于区域P0还是P1(其中P0对应于图4中的区域42和图5中的区域62,且P1对应于图4中的区域44和图5中的区域64A、64B),其中uB和vB分别表示当前PU的水平和垂直大小。在图4和图5的实例中,PU分别对应于块40和60。例如视频编码器20和视频解码器30的视频译码器可在译码的开始(例如编码的开始或解码的开始)初始化楔波样式。
对于HEVC帧内预测模式,通过使用PU的相邻样本针对PU中的每一像素产生像素特定帧内预测符值,如HEVC WD 10中的子条款8.4.2中所指定。
对于其它深度帧内模式,通过使用PU的至多两个相邻样本针对所述PU内的每一分区计算分区特定的DC预测符。令bPattern[x][y]为PU的分区样式,其中x=0..N-1,y=0..N-1,且N是PU的宽度。bPattern[x][y]指示像素(x,y)属于哪一分区,且bPattern[x][y]可等于0或1。令BitDepth为深度样本的位深度且令RecSample[x][y]为PU的经重建构相邻样本,其中x=-1且y=0..N-1(对应于PU的左方相邻像素)或y=-1,x=0..N-1(对应于PU的上方相邻像素)。随后,如下导出分区X的DC预测符,即DCPred[X],其中X=0或1:
●设定bT=(bPattern[0][0]!=bPattern[N-1][0])?1:0
●设定bL=(bPattern[0][0]!=bPattern[0][N-1])?1:0
●如果bT等于bL
-DCPred[X]=(RecSample[-1][0]+RecSample[0][-1])>>1
-DCPred[1-X]=bL?(RecSample[-1][N-1]+RecSample[N-1][-1])>>1:2BitDepth-1
●否则
-DCPred[X]=bL?RecSample[(N-1)>>1][-1]:RecSample[-1][(N-1)>>1]
-DCPred[1-X]=bL?RecSample[-1][N-1]:RecSample[N-1][-1]
深度查找表(DLT)将深度索引映射到深度值。可通过在对全视频序列进行编码之前分析第一帧内周期内的帧来建构DLT。在3D-HEVC的当前设计中,按升序排序所有的有效深度值,且以递增的索引插入到DLT。
DLT是任选的译码工具。在当前HTM(3D-HTM版本9.0)中,如果在分析步骤从0到MAX_DEPTH_VALUE(例如,对于8位深度样本,为255)的超过二分之一的值在原始深度图中出现,那么视频编码器20将不使用DLT。否则,将在序列参数集(SPS)和/或视频参数集(VPS)中对DLT进行译码。为了使编码器20对DLT进行译码,首先用指数-哥伦布码对有效深度值的数目进行译码。接着,也用指数-哥伦布码对每一有效深度值进行译码。
视频编码器20从待译码的输入视频序列读取预定义数目的帧,且针对可用深度图值扫描所有样本。在此过程期间,视频编码器20基于原始未经压缩深度图产生将深度值映射到有效深度值的映射表。
编码器20和/或解码器30使用分析深度图Dt的以下算法导出深度查找表Idx2Depth(.)、索引查找表Depth2Idx(.)、深度映射表M(.)和有效深度值dvalid的数目:
1.初始化
●布尔型向量B(d)=FALSE,对于所有深度值d
●索引计数i=0
2.针对多个时间例项t处理Dt中的每一像素位置p:
●设定(B(Dt(p))=TRUE以标记有效的深度值
3.B(d)中的TRUE值的计数数目→dvalid
4.对于B(d)==TRUE的每一d:
●设定Idx2Depth(i)=d
●设定M(d)=d
●设定Depth2Idx(d)=i
●i=i+1
5.对于B(d)==FALSE的每一d:
●找到d'=arg min|d–d'|和B(d')==TRUE
●设定M(d)=d'
●设定Depth2Idx(d)=Depth2Idx(d')。
从索引Idx映射回到深度值d如下:d=Idx2Depth[Idx]。从深度值d到索引Idx的映射如下:Idx=Depth2Idx[d]。
在3D-HEVC中已与HEVC帧内预测模式、DMM模式和链译码模式一起引入了帧内SDC模式(即,帧内逐段DC译码,其还可被称为帧内简化深度译码),以译码深度切片的帧内PU。在当前3D-HEVC中,SDC可仅应用于2N×2N PU分区大小。替代对经量化变换系数进行译码,SDC模式用以下两个类型的信息表示深度块:
1.当前深度块的分区类型,包含:
a.DMM模式1(2个分区)
b.平面(1个分区)
2.对于每一分区,在位流中用信号发送残余值(在像素域中)。
在SDC中定义两个子模式,包含SDC模式1和SDC模式2,其分别对应于平面和DMM模式1的分区类型。可将DC残余值表示为增量DC值,其指示深度PU分区的DC值与深度PU分区的经预测分区的DC值的差。同样,DC值可为深度PU分区中的深度像素样本的平均像素值。
在帧内SDC中使用简化的残余译码。在简化的残余译码中,如上文所描述,针对PU的每一分区用信号发送一个DC残余值,且不应用变换或量化。如上文所论述,为了用信号发送表示每一分区的DC残余值的信息,可应用两种方法:
1.直接对通过从当前PU中的当前分区的DC值(即,平均值,由Aver表示)减去由相邻样本产生的预测符(由Pred表示)而计算的每一分区的DC残余值进行译码。
2.当发射DLT时,并非对DC残余值进行译码,而是对从索引查找表映射的Aver和Pred的索引差进行译码。通过从Aver的索引减去Pred的索引而计算所述索引差。在解码器侧,基于DLT将经解码的索引差和Pred的索引的总和映射回到深度值。
JCT3V-F0126中提出在深度译码中,帧内SDC可应用于所有额外深度帧内预测模式和原始HEVC帧内预测模式。确切地说,SDC的基础想法扩展到用于视频编码器20和视频解码器30的各种帧内预测模式。在SDC中,视频编码器20或视频解码器30仅针对以帧内预测模式译码的深度PU或PU分区译码一个DC残余值,即增量DC值。跳过变换和量化,且深度译码单元(CU)不需要额外残余变换树。因此SDC提供一种替代的残余译码方法,借此编码器20在帧内模式下仅编码和/或视频解码器30仅解码深度PU的一个DC残余值。
图6是说明可经配置以实施本发明的技术的实例视频编码器20的框图,所述技术例如用于简化3D视频译码过程(例如3D-HEVC)中的较大帧内预测块(例如64×64块)的逐段DC译码(SDC)的技术。在一些实例中,视频编码器20可经配置以在帧内SDC中将例如64×64帧内预测块的较大64×64帧内预测块处理为四个较小帧内预测块,例如四个32×32帧内预测块。以此方式,在帧内SDC中,将HEVC帧内预测模式的64×64帧内预测块处理为四个32×32帧内预测块。在一些情况下,在帧内中将较大帧内预测块处理为多个较小帧内预测块可降低编码器20的帧内SDC过程中的最大缓冲器大小要求。
本发明在HEVC译码,且更明确地说在3D-HEVC译码(例如如3D-HEVC中所描述,且如本发明所描述经进一步修改)的上下文中描述视频编码器20。然而,本发明的技术可适用于帧内SDC模式在其中用于深度译码的其它译码标准或方法。因此,出于解释的目的而提供图6,且不应将其视为对如本发明中所广泛例示和描述的技术的限制。
在图6的实例中,视频编码器20包含预测处理单元100、残余产生单元102、变换处理单元104、量化单元106、逆量化单元108、逆变换处理单元110、重建构单元112、滤波器单元114、经解码图片缓冲器116和熵编码单元118。预测处理单元100包含帧间预测处理单元120和帧内预测处理单元126。帧间预测处理单元120包含运动估计(ME)单元122和运动补偿(MC)单元124。
将预测处理单元100的组件描述为执行纹理编码和深度编码两者。在一些实例中,纹理和深度编码可由预测处理单元100的相同组件或预测处理单元100内的不同组件执行。举例来说,在一些实施方案中可提供单独的纹理和深度编码器。并且,可提供多个纹理和深度编码器以对多个视图进行编码,例如用于多视图加深度译码。视频编码器20可包含比图6中所展示的功能组件更多、更少或不同的功能组件。
在任一情况下,预测处理单元100可经配置以对纹理数据和深度数据进行帧内或帧间编码,作为例如3D-HEVC过程的3D译码过程的部分。确切地说,在一些模式中,预测处理单元100可使用常规的非SDC残余译码或SDC译码。在SDC译码的情况下,预测处理单元100可产生经帧内或经帧间译码的深度PU的增量DC残余值,其中增量DC残余值表示PU或经译码PU的分区中的像素的平均值与经帧内或帧间预测的PU分区中的经预测样本的平均值之间的差。取决于译码模式,PU可具有单一分区或多个分区。可使用HEVC帧内、HEVC帧间模式、DMM或其它模式来译码深度PU。
在一些实例中,预测处理单元100可大体上根据(例如)3D-HEVC WD中所描述的3D-HEVC操作,所述3D-HEVC经受本发明中所描述的修改和/或添加,例如关于(例如)通过在帧内SDC模式中将64×64帧内预测块处理为四个较小帧内预测块而简化较大帧内预测块的逐段DC译码(SDC)的那些修改和/或添加。以此方式,在帧内SDC中,将HEVC帧内预测模式的64×64帧内预测处理为四个32×32帧内预测。预测处理单元100可将语法信息提供到熵编码单元118。语法信息可指示(例如)使用哪些预测模式和关于此些模式的信息。
视频编码器20接收待编码的视频数据。视频编码器20可编码所述视频数据的图片的切片中的多个译码树单元(CTU)中的每一者。CTU中的每一者可与图片的大小相等的明度译码树块(CTB)和对应色度CTB相关联。作为对CTU进行编码的部分,预测处理单元100可执行四叉树分割以将CTU的CTB划分为逐渐更小的块。所述更小的块可为CU的译码块。举例来说,预测处理单元100可将与CTU相关联的CTB分割成四个大小相等的子块,将子块中的一或多者分割为四个大小相等的子子块,等等。
视频编码器20可编码CTB的CU,以产生CU(即,经译码CU)的经编码表示。作为对CU进行编码的部分,预测处理单元100可在CU的一或多个PU当中分割与CU相关联的译码块。因此,每一PU可与明度预测块和对应色度预测块相关联。
视频编码器20和视频解码器30可支持具有各种大小的PU。如上文所指示,CU的大小可指CU的明度译码块的大小,且PU的大小可指PU的明度预测块的大小。假设特定CU的大小为2N×2N,视频编码器20及视频解码器30可支持用于帧内预测的2N×2N或N×N的PU大小,和用于帧间预测的2N×2N、2N×N、N×2N、N×N或类似大小的对称PU大小。视频编码器20和视频解码器30还可支持用于帧间预测的2N×nU、2N×nD、nL×2N和nR×2N的PU大小的不对称分割。根据本发明的方面,视频编码器20和视频解码器30还支持用于深度帧间译码的PU的非矩形分区。
帧间预测处理单元120可通过对CU的每一PU执行帧间预测来产生用于PU的预测性数据。用于PU的预测性数据可包含PU的预测性样本块和用于PU的运动信息。帧间预测处理单元120可取决于PU是在I切片、P切片还是B切片中而对CU的PU执行不同操作。在I切片中,所有PU经帧内预测。因此,如果PU是在I切片中,那么帧间预测处理单元120并不对PU执行帧间预测。因此,对于在I模式中编码的块,使用来自同一帧内的经先前编码的相邻块的空间预测而形成经预测块。
如果PU在P切片中,那么运动估计(ME)单元122可针对PU的参考区域搜索参考图片列表(例如,“RefPicList0”)中的参考图片。参考图片可存储在经解码图片缓冲器116中。用于PU的参考区域可以是在参考图片内含有最紧密地对应于PU的样本块的样本块的区域。运动估计(ME)单元122可产生指示含有PU的参考区域的参考图片在RefPicList0中的位置的参考索引。
另外,对于帧间译码,运动估计(ME)单元122可产生运动向量(MV),其指示PU的译码块与同参考区域相关联的参考位置之间的空间位移。举例来说,MV可为提供从当前经解码图片中的坐标到参考图片中的坐标的偏移的二维向量。运动估计(ME)单元122可输出参考索引和MV作为PU的运动信息。运动补偿(MC)单元124可基于由PU的运动向量指示的参考位置处的实际样本或经内插样本而产生PU的预测性样本块。
如果PU是在B切片中,那么运动估计单元122可对PU执行单向预测或双向预测。为了对PU执行单向预测,运动估计单元122可搜索RefPicList0的参考图片,或PU的参考区域的第二参考图片列表(“RefPicList1”)。Motion est运动估计(ME)单元122可输出以下各项作为PU的运动信息:指示含有参考区域的参考图片在RefPicList0或RefPicList1中的位置的参考索引、指示PU的样本块与同参考区域相关联的参考位置之间的空间位移的MV,以及指示参考图片在RefPicList0还是RefPicList1中的一或多个预测方向指示符。运动补偿(MC)单元124可至少部分基于由PU的运动向量指示的参考区域处的实际样本或经内插样本来产生PU的预测性样本块。
为了对PU执行双向帧间预测,运动估计单元122可针对PU的一参考区域搜索RefPicList0中的参考图片,且还可针对PU的另一参考区域搜索RefPicList1中的参考图片。运动估计(ME)单元122可产生指示含有参考区域的参考图片在RefPicList0和RefPicList1中的位置的参考图片索引。另外,运动估计(ME)单元122可产生指示同参考区域相关联的参考位置与PU的样本块之间的空间位移的MV。PU的运动信息可包含PU的参考索引和MV。运动补偿(MC)单元124可至少部分基于由PU的运动向量指示的参考区域处的实际样本或经内插样本来产生PU的预测性样本块。
帧内预测处理单元126可通过对PU执行帧内预测来产生PU的预测性数据。PU的帧内预测性数据可包含PU的预测性样本块和各种语法元素。帧内预测处理单元126可对I切片、P切片以及B切片中的PU执行帧内预测。为了对PU执行帧内预测,帧内预测处理单元126可使用多个帧内预测模式以产生PU的多个预测性数据集合,且随后例如使用速率失真优化技术选择帧内预测模式中产生可接受或最佳译码性能的一者。
为了使用帧内预测模式来产生PU的预测性数据集合,帧内预测处理单元126可在与帧内预测模式相关联的方向上将样本从空间上相邻PU的样本块延伸跨越PU的样本块。假设对于PU、CU和CTU采用从左到右、从上到下的编码次序,相邻PU可在所述PU的上方、右上方、左上方或左方。帧内预测处理单元126可使用各种数目的帧内预测模式,例如,33个方向性帧内预测模式。在一些实例中,帧内预测模式的数目可取决于与PU相关联的区域的大小。
预测处理单元100可从PU的由帧间预测处理单元120产生的预测性数据或PU的由帧内预测处理单元126产生的预测性数据当中选择CU的PU的预测性数据。在一些实例中,预测处理单元100基于预测性数据集合的速率/失真量度选择CU的PU的预测性数据。所选预测性数据的预测性样本块在本文中可被称作所选预测性样本块。
残余产生单元102可基于CU的明度、Cb和Cr译码块以及CU的PU的所选帧间或帧内预测性明度块、Cb块和Cr块而产生CU的明度、Cb和Cr残余块。举例来说,残余产生单元102可产生CU的残余块,使得残余块中的每一样本具有等于CU的译码块中的样本与CU的PU的对应所选预测性样本块中的对应样本(即,在明度或色度像素值中,如果适用)之间的差的值。残余产生单元102也可产生增量DC残余值以用于SDC模式。
变换处理单元104可执行四叉树分割以将与CU相关联的残余块分割成与CU的TU相关联的变换块。因此,TU可与明度变换块和两个色度变换块相关联。CU的TU的明度和色度变换块的大小和位置可或可不基于CU的PU的预测块的大小和位置。被称为“残余四叉树”(RQT)的四叉树结构可包含与区域中的每一者相关联的节点。CU的TU可对应于RQT的叶节点。
对于常规的残余译码,变换处理单元104可通过将一或多个变换应用于与TU相关联的变换块而产生CU的每一TU的变换系数块。变换处理单元104可将各种变换应用于与TU相关联的变换块。举例来说,变换处理单元104可将离散余弦变换(DCT)、定向变换或概念上类似的变换应用于变换块。在一些实例中,变换处理单元104不将变换应用于变换块。在此类实例中,可将变换块处理为变换系数块。此外,对于SDC译码,通常不将变换和量化应用于针对经预测PU或分区产生的增量DC残余值。
对于常规的残余译码,量化单元106可量化系数块中的残余变换系数。量化过程可减少与变换系数中的一些或全部相关联的位深度。举例来说,可在量化期间将n位变换系数向下舍入到m位变换系数,其中n大于m。量化单元106可基于与CU相关联的量化参数(QP)值量化与CU的TU相关联的系数块。视频编码器20可通过调整与CU相关联的QP值来调整应用于与CU相关联的系数块的量化的程度。量化可使得信息丢失,因此经量化变换系数可具有比原始变换系数更低的精确度。
逆量化单元108和逆变换处理单元110可分别将逆量化和逆变换应用于系数块,以从所述系数块重建构残余块。重建构单元112可将经重建构残余块添加到来自由预测处理单元100产生的一或多个预测性样本块的对应样本,以产生与TU相关联的经重建构变换块。通过以此方式重建构用于CU的每一TU的变换块,视频编码器20可重建构CU的译码块。
对于HEVC帧内模式、HEVC帧间模式和例如DMM模式的其它模式,用于深度CU的SDC残余译码可用于产生经预测PU或PU分区的增量DC残余值,也被称作DC残余值。对于SDC,残余产生单元102可产生每一深度PU或PU分区的单一增量DC值,其中所述单一增量DC值表示PU或PU分区中的像素的平均值与经帧内或帧间预测的PU或PU分区中的经预测样本的平均值之间的差。增量DC残余值不经变换或量化,且可由残余产生单元102提供到熵译码单元118,如由图6中的线115所指示。
重建构单元112可基于CU的PU的分区的DC残余值和CU的PU的对应经预测分区重建构深度CU。举例来说,可将每一深度PU分区的增量DC残余值添加到对应经预测分区中的像素值以重建构深度PU分区,其中所述DC残余值可表示深度PU分区的像素的平均值与经预测分区的经预测样本的平均值之间的差。在一些实例中,表示DC残余值的信息(例如,表示增量DC值的一或多个语法元素)可由预测处理单元100产生,由熵编码单元118接收,且在不进行逆量化或逆变换处理的情况下由重建构单元112使用,(例如)如由线115所指示。
滤波器单元114可执行一或多个滤波操作以减少与经重建构CU相关联的译码块中的假象,例如块假象。滤波操作可包含以下各项中的一或多者:去除块边界处的成块效应的去块、使像素转换平滑的环路滤波、使像素转换平滑的样本自适应偏移滤波或可能的其它类型的滤波操作或技术。在滤波器单元114对经重建构译码块执行一或多个去块操作之后,经解码图片缓冲器116可存储经重建构译码块。帧间预测单元120可使用含有经重建构译码块的参考图片以对其它图片的PU执行帧间预测。另外,帧内预测处理单元126可使用经解码图片缓冲器116中的经重建构译码块以对与CU处于相同图片中的其它PU执行帧内预测。
熵编码单元118可从视频编码器20的各种功能组件接收数据。举例来说,熵编码单元118可从量化单元106接收系数块且可从预测处理单元100接收语法元素。另外,熵编码单元118可从残余产生单元102接收增量DC残余值。熵编码单元118可对数据执行一或多个熵编码操作以产生经熵编码数据。举例来说,熵编码单元118可执行CABAC操作。其它熵译码过程的实例包含上下文自适应可变长度译码(CAVLC)、基于语法的上下文自适应二进制算术译码(SBAC)和概率间隔分割熵(PIPE)译码。在HEVC中,使用CABAC。视频编码器20可输出包含由熵编码单元118产生的经熵编码数据的位流。举例来说,位流可包含表示二进制语法元素或二进制化的语法元素的二进制数的位。
视频编码器20是经配置以执行本发明中描述的技术中的任一者的视频编码器的实例,所述技术包含用于较大预测块的经简化逐段DC译码的技术。视频编码器20内也可包含额外3D处理组件。根据本发明的一或多种技术,视频编码器20内的一或多个单元可执行本文中描述为视频编码过程的部分的技术。类似地,视频编码器20可使用本发明的技术中的任一者来执行视频解码过程,以重建构用作参考数据的视频数据以用于随后经译码的视频数据的预测。
图7是说明经配置以执行本发明的技术的实例视频解码器30的框图。出于说明的目的而提供图7,且不应将其视为对如本发明中所广泛例示和描述的技术的限制。本发明在HEVC译码且明确地说在3D-HEVC译码的上下文中描述视频解码器30。然而,本发明的技术可适用于其它3D视频译码标准或方法。视频解码器30可经配置以执行用于简化3D视频译码过程(例如3D-HEVC)中的较大帧内预测块(例如64×64块)的逐段DC译码(SDC)的技术。在一些实例中,视频解码器30可经配置以在帧内SDC中将例如64×64帧内预测块的较大64×64帧内预测块处理为四个较小帧内预测块,例如四个32×32帧内预测块。以此方式,在帧内SDC深度译码中,将HEVC帧内预测模式的64×64帧内预测处理为四个32×32帧内预测。在一些情况下,在帧内中将较大帧内预测块处理为多个较小帧内预测块可降低编码器30的帧内SDC过程中的最大缓冲器大小要求。
在图7的实例中,视频解码器30包含熵解码单元150、预测处理单元152、逆量化单元154、逆变换处理单元156、重建构单元158、滤波器单元160和经解码图片缓冲器162。预测处理单元152包含用于帧间预测的运动补偿(MC)单元164,以及帧内预测处理单元166。为了便于说明,将预测处理单元152的组件描述为执行纹理解码和深度解码两者。在一些实例中,纹理和深度解码可由预测处理单元152的相同组件或预测处理单元152内的不同组件执行。举例来说,在一些实施方案中可提供单独的纹理和深度解码器。并且,可提供多个纹理和深度解码器以对多个视图进行解码,例如用于多视图加深度译码。在任一情况下,预测处理单元152可经配置以对纹理数据和深度数据进行帧内或帧间解码,作为例如3D-HEVC过程的3D译码过程的部分。
因此,预测处理单元152可大体上根据3D-HEVC操作,所述3D-HEVC经受本发明中所描述的修改和/或添加,例如关于用于简化较大帧内预测块的逐段DC译码(SDC)的技术的那些修改和/或添加,所述技术例如在帧内SDC中将较大64×64帧内预测块(例如,64×64帧内预测块)处理为四个较小帧内预测块(例如,四个32×32帧内预测块)的技术。预测处理单元152可经由熵解码单元150,使用SDC或常规的非SDC残余译码技术从经帧内解码或经帧间解码的深度数据的经编码视频位流获得残余数据,且使用经帧内预测或经帧间预测的深度数据和所述残余数据来重建构CU。在使用SDC时,残余数据可为增量DC残余值。在一些实例中,视频解码器30可包含比图7中所展示的功能组件更多、更少或不同的功能组件。
视频解码器30接收经编码视频位流。熵解码单元150剖析所述位流以从所述位流解码经熵编码的语法元素。在一些实例中,对于SDC,熵解码单元118可经配置以使用CABAC译码器以从位流中的位解码表示增量DC残余值的语法元素的二进制数。熵解码单元118可使用CABAC译码器以解码用于不同译码模式的各种其它语法元素,所述译码模式包含使用常规残余译码的帧内或帧间译码模式和使用增量DC残余译码的帧内或帧间SDC模式。
预测处理单元152、逆量化单元154、逆变换处理单元156、重建构单元158和滤波器单元160可基于从位流提取的语法元素而产生经解码视频数据。位流可包括NAL单元序列。位流的NAL单元可包含经译码切片NAL单元。作为对位流进行解码的部分,熵解码单元150可从经译码切片NAL单元提取语法元素且对所述语法元素进行熵解码。
经译码切片中的每一者可包含切片标头和切片数据。切片标头可含有关于切片的语法元素。切片标头中的语法元素可包含识别与含有切片的图片相关联的PPS的语法元素。PPS可指代SPS,其又可指代VPS。熵解码单元150还可对可包含语法信息的其它元素(例如SEI消息)进行熵解码。切片标头、参数集或SEI消息的任一者中的经解码语法元素可包含本文中描述为根据本发明中所描述的实例技术用信号发送的信息。可将此类语法信息提供到预测处理单元152,以用于解码和重建构纹理或深度块。
视频解码器30可对未分割的CU和PU执行重建构操作。为了执行重建构操作,对于非SDC译码,视频解码器30可对CU的每一TU执行重建构操作。通过对CU的每一TU执行重建构操作,视频解码器30可重建构CU的块。作为对CU的TU执行重建构操作的部分,逆量化单元154可逆量化(即,去量化)与TU相关联的系数块。逆量化单元154可使用与TU的CU相关联的QP值来确定量化的程度,且同样地确定逆量化单元154将应用的逆量化的程度。也就是说,可通过调整在量化变换系数时所使用的QP的值来控制压缩比,即用以表示原始序列与经压缩序列的位的数目的比率。压缩比还可取决于所采用的熵译码的方法。
在逆量化单元154逆量化系数块之后,逆变换处理单元156可将一或多个逆变换应用于系数块以产生与TU相关联的残余块。举例来说,逆变换处理单元156可将逆DCT、逆整数变换、逆卡忽南-拉维(Karhunen-Loeve)变换(KLT)、逆旋转变换、逆定向变换或另一逆变换应用于系数块。
如果使用帧内预测对PU进行编码,那么帧内预测处理单元166可执行帧内预测以产生PU的预测性块。帧内预测处理单元166可使用帧内预测模式,以基于空间上相邻的PU的预测块产生PU的预测性明度块、Cb块和Cr块。帧内预测处理单元166可基于从位流解码的一或多个语法元素来确定用于PU的帧内预测模式。
如果使用帧间预测来编码PU,那么MC单元164可执行帧内预测,以产生PU的帧间预测性块。MC单元164可使用帧间预测模式,以基于其它图片或视图中的PU的预测块产生PU的预测性明度块、Cb块和Cr块。MC单元164可基于从位流解码的一或多个语法元素确定用于PU的帧间预测模式,且可接收运动信息,例如运动向量、预测方向和参考图片索引。
对于帧间预测,MC单元164可基于从位流提取的语法元素来建构第一参考图片列表(RefPicList0)和第二参考图片列表(RefPicList1)。如果使用帧间预测对PU进行编码,那么熵解码单元150可提取PU的运动信息。MC单元164可基于PU的运动信息来确定所述PU的一或多个参考块。运动补偿(MC)单元164可基于PU的一或多个参考块处的块中的样本来产生PU的预测性明度块、Cb块和Cr块。
重建构单元158可在适当时使用与CU的TU相关联的明度、Cb和Cr变换块以及CU的PU的预测性明度块、Cb块和Cr块(即,帧内预测数据或帧间预测数据)来重建构CU的明度、Cb和Cr译码块。举例来说,重建构单元158可将明度、Cb和Cr变换块的残余样本添加到预测性明度块、Cb块和Cr块的对应样本以重建构CU的明度、Cb和Cr译码块。
滤波器单元160可执行去块操作以减少与CU的明度、Cb和Cr译码块相关联的块假象。视频解码器30可将CU的明度、Cb和Cr译码块存储在经解码图片缓冲器162中。经解码图片缓冲器162可提供参考图片以用于后续运动补偿、帧内预测以及在显示装置(例如图3的显示装置32)上的呈现。举例来说,视频解码器30可基于经解码图片缓冲器162中的明度、Cb和Cr块对其它CU的PU执行帧内预测或帧间预测操作。
视频解码器30是经配置以执行本发明中描述的技术中的任一者的视频解码器的实例,所述技术包含用于较大预测块的经简化逐段DC译码的技术。根据本发明的一或多种技术,视频解码器30内的一或多个单元可执行本文中描述为视频解码过程的部分的一或多种技术。视频解码器30内也可包含额外3D译码组件。
预测处理单元152且更确切地说帧内预测处理单元166和运动补偿(MC)单元164可确定在适用时是否在例如3D-HEVC的3D视频译码过程的深度帧内预测模式和深度帧间预测模式中执行SDC。在使用SDC时,熵解码单元150可对深度CU的PU或PU分区的一或多个增量DC残余值以及相关联语法信息进行熵解码。
对于SDC,熵解码单元150可将块的SDC语法信息提供到预测处理单元152,如图7中所指示。熵解码单元150可将增量DC残余值提供到重建构单元158。视频解码器30接收的增量DC残余值可未经变换和量化。明确地说,增量DC残余值无需首先提供到用于逆量化和逆变换的逆量化单元154和逆变换处理单元156。替代地,熵解码单元150可从位流中的位解码表示增量DC残余值的一或多个语法元素的二进制数,且将表示所述增量DC残余值的信息提供到重建构单元158,以用于重建构经SDC译码的PU或分区。重建构单元158可从预测处理单元152接收深度CU的经帧内或帧间预测PU或PU分区,并将增量DC残余值添加到经预测PU或PU分区的样本中的每一者,以重建构经译码PU或PU分区。
以此方式,当使用SDC时,重建构单元158可基于CU的PU的分区的增量DC残余值和所述CU的对应经预测PU或PU分区来重建构深度CU。同样,增量DC残余值可表示深度PU或PU分区的像素的平均值与经预测PU或PU分区的样本的平均值之间的差。如将描述,当语法信息指示帧内SDC 64×64模式时,解码器30将64×64模式处理为四个32×32模式。
在HEVC主规范中,最大帧内预测大小为32×32。然而,在3D-HEVC的帧内SDC模式中,平面模式的最大帧内预测大小为64×64。就JCT3V-F0126中的方案来说,SDC可应用于额外深度帧内预测模式和原始HEVC帧内预测模式。因此,就这个方案来说,所有HEVC帧内预测模式的最大帧内预测大小为64×64。在与HEVC比较时,3D-HEVC和JCT3V-F0126中的方案二者都增加了用于帧内预测的最大缓冲器大小。
根据本发明的实例,为了简化较大帧内预测块的SDC译码,视频编码器20和视频解码器30可经配置以将较大帧内预测块处理为四个较小帧内块。举例来说,在64×64帧内预测块的情况下,视频编码器20和视频解码器30可经配置以将64×64帧内预测块处理为四个32×32帧内预测块。以此方式,在SDC中,将HEVC帧内预测模式的64×64帧内预测处理为四个32×32帧内预测。64×64和32×32的指示是指待使用SDC帧内译码的深度PU或分区中的像素的数目,或经帧内预测的深度PU或分区中的预测样本的对应数目。出于实例的目的在下文描述用于将64×64帧内预测块处理为四个32×32帧内预测块的技术的各种方面。
图8是说明将64×64SDC帧内预测块处理为四个较小32×32帧内预测块的图式。如图8中所展示,64×64深度块170分裂成四个32×32子块172、174、176和178。子块172、174、176、178中的每一者可具有相同帧内模式。举例来说,帧内模式可应用于块170,且用于四个32×32子块172、174、176、178中的每一者。块172是64×64块的左上方32×32帧内块,块174是64×64块的右上方32×32帧内块,块176是64×64块的左下方32×32帧内块,且块178是深度数据的64×64块的右下方32×32帧内块。在此实例中,64×64块170从x=0水平地延伸到x=63,且从y=0垂直地延伸到y=63。左上方32×32帧内块172从x=0水平地延伸到x=31且从y=0垂直地延伸到y=31,右上方左方32×32帧内块172从x=32水平地延伸到x=63且从y=0垂直地延伸到y=31,左下方32×32帧内块172从x=0水平地延伸到x=31且从y=32垂直地延伸到y=63,且右下方32×32帧内块172从x=32水平地延伸到x=63且从y=32垂直地延伸到y=63。
如图8中进一步所展示,64×64块的空间上相邻的经重建构样本RecSample[x][y]可用于预测32×32块的一些帧内模式,其中x和y分别是经重建构样本相对于64×64块170的x=0、y=0处的左上方样本的垂直位置和水平位置。举例来说,图8展示例如i=-1且j=0到63处的经重建构左方相邻样本182,例如i=-1、j=-1处的左上方相邻样本184,例如i=0到63、j=-1处的上方相邻样本186,和例如i=64到127、j=-1处的右上方相邻样本188(图8中仅展示所述右上方相邻样本的一部分)。如果64×64是用于HEVC和3D-HEVC两者的最大译码单元大小,那么i=-1、j=64到127处的左下方相邻样本通常不可用,因为译码单元通常是以光栅扫描次序来译码。因此,在对译码单元进行译码时,其下方的译码单元还未经编码,且因此尚未产生任何可用的经重建构样本。
经重建构相邻样本182至188驻留在在空间上邻近64×64块170的邻近块中。假设相邻样本182至188就相邻样本182、184、186、188所驻留的块在当前经编码或解码的64×64块170之前已经被编码或解码且重建构的意义来说经重建构。
本发明的实例中提出,在帧内SDC译码中,用如在当前3D-HEVC中的且潜在地如JCT3V-F0126中所提出的HEVC帧内预测模式译码的64×64帧内预测块可通过使64×64帧内预测分裂成四个32×32帧内预测块来加以简化,(例如)如图8中所展示。这四个32×32帧内预测块可具有相同帧内预测模式,且可由视频编码器20和视频解码器30以光栅扫描或解码顺序进行帧内预测。
在第一实例中,可使用每一32×32块的经预测样本代替至少一些相邻经重建构样本来预测64×64块内的随后的32×32块,如下文所解释。因此,对于64×64块的一些32×32块的帧内预测,可用参考样本可仅经重建构、取决于模式经重建构或预测,或仅经预测。一般来说,经重建构参考样本已经例如通过求和经预测参考样本与残余值来重建构,而经预测参考样本通常尚未与残余值求和。在每一情况下,用于帧内预测32×32块的经重建构或经预测样本通常可邻近所述32×32块。在第二实例中,仅经重建构样本用于帧内预测64×64块的32×32块,包含用于经重建构样本由于其邻近于64×64块的界线而邻近64×64块但由于其不紧邻相应32×32块而不邻近所述32×32块的一些32×32块。
在第一实例或第二实例中,第一32×32块(即,64×64块的左上方32×32子块)可以与由HEVC指定的方式相同的方式经帧内预测。确切地说,64×64块外部的空间相邻块的相邻样本通常将经重建构且可用于左上方32×32块的帧内预测。然而,经预测样本或经重建构样本可用于第一实例中的一些32×32块,而仅经重建构样本用于第二实例。
现将描述经重建构或经预测样本可用于帧内预测64×64块的一些32×32块的第一实例。参考图8,64×64块170的(例如)左方相邻样本182、左上方相邻样本184和上方相邻样本186通常将经重建构且可供由视频编码器20和视频解码器30用于帧内预测左上方32×32帧内块172。
可取决于帧内预测模式使用以下经重建构样本RecSample[i][j]中的任一者来帧内预测左上方块172:RecSample[i]j]在i=-1、j=32到63处作为左下方经重建构样本的经重建构左方相邻样本182;RecSample[i]j]在i=-1、j=0到31处作为左方经重建构样本的左方相邻样本182;RecSample[i]j]在i=-1、j=-1处作为左上方经重建构样本的经重建构左上方相邻样本184;RecSample[i]j]在i=0到31、j=-1处作为上方经重建构样本的经重建构上方相邻样本186;和RecSample[i]j]在i=32到63、j=-1处作为右上方经重建构样本的上方相邻样本186。此外,四个子块172、174、176、178分别具有相同的帧内模式,且来自可用经重建构和/或经预测样本中的用以预测子块的特定样本将取决于所选择的帧内模式。
一般来说,为了定义视频编码器20和视频解码器30可使用的经预测参考样本(即,可用于帧内预测特定32×32块的经预测样本),令PredSample[x][y]为64×64块的经预测样本,其中x=0至x=63,y=0至y=63,其中x和y分别是样本相对于64×64块170的x=0、y=0处的左上方样本的垂直位置和水平位置。
对于其它三个32×32块(即,块174、176和178)中的每一者,除任何可用的相邻经重建构样本以外,64×64块的先前32×32块(即,经先前预测的32×32块)的经预测样本PredSample[i][j]也可用作帧内预测过程中的相邻样本。在32×32块驻留的64×64块正被译码时,经预测样本可经预测但还未经重建构。
为了帧内预测右上方32×32帧内块174,可供视频编码器20和视频解码器30用于帧内预测的参考样本可包含经重建构上方相邻样本186驻留在右上方32×32帧内块174上方的部分和经重建构右上方相邻样本188的一部分(在图8中部分地展示),加上左上方32×32帧内块172的左方相邻经帧内预测样本190。如果左下方32×32帧内块176的预测样本198在右上方32×32帧内块174正经预测时尚未经预测,那么其可能不可用作左下方样本。
因此,在一些实例中,可在不使用左下方样本的情况下帧内预测右上方32×32块内174。在此情况下,对于一些帧内模式,视频编码器20和视频解码器30可使用相邻经重建构样本、左方相邻经帧内预测样本190代替经重建构参考样本或左方相邻经帧内预测样本190结合经重建构相邻参考样本来帧内预测右上方32×32帧内块174。因此,可用于帧内预测右上方32×32帧内块174的相邻经预测样本来自在译码次序中在右上方32×32帧内块前面的左上方32×32帧内块172。在每一情况下,经重建构或经预测样本可用于帧内预测相邻右上方32×32帧内块174。
在预测第二右上方32×32块174时,以类似于如在HEVC中用经重建构样本对相同的相对位置中的32×32块执行帧内预测的简单方式,i=31、j=0到31的PredSample[i][j]用作左方相邻样本。在此情况下,已经针对左上方块172预测的PredSample[i][j]在i=31、j=0到31处的经预测样本190充当用于帧内预测右上方块174的左方相邻样本。对于右上方32×32块174,左上方样本可为RecSample[i][j]在i=31、j=-1处的经重建构样本,上方样本为RecSample[i][j]在i=32到63、j=-1处的样本,且右上方样本为RecSample[i][j]在i=64到95、j=-1处的样本,所有所述样本可从64×64块170上方的经先前译码(例如,以光栅次序经先前译码)的相邻块获得。
为了帧内预测左下方32×32帧内块176,可供视频编码器20和视频解码器30用于帧内预测的参考样本可包含:驻留在左下方32×32帧内块176左方作为左方样本的经重建构左方相邻样本182的部分、驻留在左下方32×32帧内块176左上方作为左上方样本的经重建构左方相邻样本182的部分、加上左上方32×32帧内块172的作为上方样本的上方相邻经帧内预测样本192,以及右上方32×32帧内块174的作为右上方样本的右上方经帧内预测样本196。在此情况下,对于一些帧内模式,视频编码器20和视频解码器30可取决于帧内模式而使用相邻经重建构样本、上方相邻经帧内预测样本192、196代替经重建构参考样本,或相邻经帧内预测样本192、196结合相邻经重建构样本来帧内预测左下方32×32帧内块176。可供用于帧内预测左下方32×32帧内块176的相邻经帧内预测样本来自在译码次序中先于左下方32×32帧内块的左上方32×32帧内块172和右上方32×32帧内块174。
在预测第三左下方32×32块176时,以类似于如在HEVC中用经重建构样本对相同的相对位置中的32×32块执行帧内预测的简单方式,i=0到31、j=31的PredSample[i][j]用作上方相邻样本,i=32到63、j=31的PredSample[i][j]用作右上方相邻样本。在此情况下,已经针对左上方块172预测且邻近左下方块176的i=0到31、j=31的经预测样本192充当用于帧内预测左下方块176的上方相邻样本,且已经针对右上方块174预测且邻近左下方块716的i=32到63、j=31的经预测样本196充当用于帧内预测左下方块176的右上方相邻样本。对于左下方32×32块176,左上方样本可为RecSample[i][j]在i=-1、j=31处的经重建构样本,且左方样本为RecSample[i][j]在i=-1、j=32到63处的样本,所有所述样本可从64×64块170左方的经先前译码(例如,以光栅次序经先前译码)块获得。
为了帧内预测右下方32×32帧内块178,可供视频编码器20和视频解码器30用于帧内预测的参考样本可仅包含相邻32×32块的相邻经预测样本。举例来说,可供视频编码器20和视频解码器30用于帧内预测右下方32×32帧内块178的参考样本可不包含经重建构样本,且替代地可包含左上方32×32帧内块172的左上方相邻经预测样本194、右上方32×32帧内块174的上方相邻经预测样本196和左下方32×32帧内块176的左方相邻经预测样本198。
在预测第四右下方32×32块时,分别以类似于如在HEVC中用经重建构样本对相同的相对位置中的32×32块执行帧内预测的简单方式,PredSample[31][31]用作左上方相邻样本,PredSample[i][j]在i=31、j=32..63处的预测样本用作左方相邻样本,且PredSample[i][j]在i=32..63、j=31处的预测样本用作上方相邻样本。在此实例中,对于右下方32×32帧内块178,使用块172、174、176的经预测相邻样本。因此,在一个实例中,没有经重建构相邻样本用于帧内预测右下方32×32帧内块178,且仅使用经预测相邻样本。并且,可在不使用左下方或右上方参考样本的情况下预测右下方32×32帧内块178。
在此情况下,视频编码器20和视频解码器30仅使用64×64块的相邻32×32块的相邻经帧内预测样本而非经重建构参考样本来帧内预测右下方32×32帧内块178。因此,在此实例中,视频编码器20和视频解码器30不使用经重建构参考样本来帧内预测右下方32×32帧内块178。替代地,仅使用在译码次序中先于右下方32×32帧内块178的32×32帧内块172、174、176的相邻经预测样本。
对于64×64帧内块170的32×32块172、174、176、178中的每一者,通过视频编码器20和视频解码器30从可用经预测和/或经重建构参考样本选择的特定参考样本将取决于经选择用于译码32×32帧内块的特定帧内模式。通过使64×64块分裂成四个32×32块,可简化帧内预测过程。在一些实例中,处理较小块可降低视频编码器20或视频解码器30中的存储缓冲器要求。
在第二实例中,作为使用经预测相邻样本的替代方案,仅邻近当前64×64块170的相邻经重建构样本RecSample[i][j]用于预测所有四个32×32块172、174、176、178。在此实例中,块172、174、176的经预测样本不用于帧内预测块174、176和178。替代地,邻近64×64块170的经重建构样本用于帧内预测所述块174、176、178,即使邻近较大64×64块170的经重建构样本中的一些不邻近给定32×32子块174、176、178。
一般来说,为了定义视频编码器20和视频解码器30可使用的经重建构参考样本(即,可供用于帧内预测特定32×32块的经重建构参考样本),同样令RecSample[x][y]为64×64块的经重建构相邻样本,其中x=-1、y=-1..63或x=0..63、y=-1,其中x和y分别是经重建构样本相对于64×64块170的x=0、y=0处的左上方样本的垂直位置和水平位置。
在此第二实例中,以与HEVC或上方第一实例中的方式相同的方式预测第一左上方32×32块。也就是说,仍可使用通常用于HEVC中以用于帧内预测(例如)32×32块的相同过程来预测第一左上方32×32块。确切地说,在帧内预测第一左上方32×32帧内块172时,视频编码器20和视频解码器30可使用以下经重建构相邻样本RecSample[i][j]中的任一者:RecSample[i][j]在i=-1、j=32到63处作为左下方经重建构样本的经重建构左方样本182、RecSample[i][j]在i=-1、j=0到31处作为左方经重建构样本的经重建构左方样本182、RecSample[i][j]在i=-1、j=-1处作为左上方经重建构样本的经重建构左上方样本184、RecSample[i][j]在i=0到31、j=-1处作为上方经重建构样本的经重建构上方样本186,和RecSample[i][j]在i=32到63、j=-1处作为右上方经重建构样本的经重建构上方样本186。
对于其它三个32×32块(右上方块174、左下方块176和右下方块178)中的每一者,除实际上邻近这些块的经重建构样本(例如,邻近右上方块174的左上方、上方和右上方经重建构样本,以及邻近左下方块176的左方和左上方经重建构样本,但没有邻近右下方块178的经重建构样本)以外,额外经重建构样本RecSample[i][j]也用作帧内预测过程中的参考样本,如下文所描述。
在预测第二右上方32×32块174时,i=-1、j=0到31的经重建构样本RecSample[i][j]由视频编码器20和视频解码器30用作用于帧内预测右上方32×32帧内块174的左方样本,即使这些经重建构样本不邻近(即,不紧邻)右上方32×32帧内块174。视频编码器20和视频解码器30也可使用RecSample[i][j]在i=-1、j=32到63处的经重建构左方样本182作为用于右上方32×32帧内块174的左下方经重建构样本。同样,类似左方经重建构样本,这些左下方经重建构样本不邻近(即,不紧邻)右上方32×32帧内预测块174。
除非相邻(即,非邻接)经重建构样本之外,视频编码器20和视频解码器30还可使用实际上邻近(即,邻接于)64×64块170的右上方32×32帧内块174的经重建构样本。举例来说,可用于帧内预测右上方32×32帧内块174的其它经重建构样本包含:RecSample[i][j]在i=31、j=-1处作为左上方经重建构样本的经重建构样本186的部分、RecSample[i][j]在i=32到63、j=-1处作为上方经重建构样本的经重建构样本186,和RecSample[i][j]在i=64到95、j=-1处作为右上方经重建构样本的经重建构样本188的部分。因此,为了帧内预测64×64帧内块170的右上方32×32帧内块174,视频编码器20和视频解码器30可使用邻近(即,邻接于)32×32块174的顶部的经重建构样本和邻近64×64块的左方但不邻近32×32块174的左方的经重建构样本。
在预测64×64块170的第三左下方32×32块176时,RecSample[i][j]在i=-1、j=32到63处的相邻经重建构样本182由视频编码器20和视频解码器30用作左方相邻样本。在此实例中,RecSample[i][j]在i=-1且j=31处的相邻重建构样本182可用作用于帧内预测左下方32×32帧内块176的左上方相邻经重建构样本。因此,用于帧内预测的经重建构样本中的一些可邻近64×64块170和左下方32×32帧内块两者。
另外,视频编码器20和视频解码器30可使用邻近64×64块170但不邻近(即,不紧邻)用于帧内预测所述块的左下方32×32帧内块176的经重建构样本。举例来说,在帧内预测64×64块170的第三左下方32×32块176时,RecSample[i][j]在i=0到31、j=-1处的经重建构样本186可由视频编码器20和视频解码器30用作用于帧内预测的上方经重建构样本。另外,RecSample[i][j]在i=32到63、j=-1处的经重建构样本186可由视频编码器20和视频解码器30用作用于左下方32×32帧内块176的右上方经重建构样本。因此,为了帧内预测64×64帧内块170的左下方32×32帧内块176,视频编码器20和视频解码器30可取决于特定帧内模式而使用邻近(即,邻接于)32×32块176的左方的经重建构样本和邻近64×64块170的顶部但不邻近左下方32×32块176的顶部的相邻经重建构样本。
在预测第四右下方32×32块178时,视频编码器20和视频解码器30可使用不邻近(即,不紧邻)32×32块的重建构样本。举例来说,视频编码器20和视频解码器30可使用邻近64×64块170但不邻近32×32块178的右下方32×32帧内块178的相邻经重建构样本,如下:RecSample[i][j]在i=-1且j=31处的经重建构样本182可用作左上方样本,RecSample[i][j]在i=-1、j=32到63处的经重建构样本182可用作左方样本,且RecSample[i][j]在i=32到63、j=-1处的经重建构样本186可用作上方样本。在一些实例中,对于右下方32×32帧内块178,视频编码器20和视频解码器30还可使用RecSample[i][j]在i=64到95、j=-1处作为右上方样本的经重建构样本188的部分。
对于上方第一和第二实例中的每一者,视频编码器20可产生指示经译码64×64块的像素与帧内预测性样本的对应四个预测性32×32块之间的差的残余数据。在常规残余译码的情况下,残余数据可包含指示原始64×64块的像素与四个32×32经预测块的对应预测性样本之间的逐样本基础的差的多个残余值。替代地,在SDC的情况下,残余数据可为表示原始64×64块中的像素的平均值与四个32×32经预测块的预测性样本的平均值之间的差的单一增量DC值,或替代地为表示原始64×64块中的像素的平均值与包含左上方经预测块172的左上方像素、右上方经预测块174的右上方像素、左下方经预测块176的左下方像素和右下方经预测块178的右下方像素的四个预测性样本的平均值之间的差的单一增量DC值。在任一情况中,视频编码器20可编码指示用于64×64块的帧内译码模式以及用于64×64块的残余数据的语法信息。视频解码器30可使用语法信息预测64×64块,且通过求和残余与所述经预测块而重建构所述块。在指示帧内SDC64×64模式时,视频解码器30可将深度数据的帧内SDC 64×64块处理为四个32×32经帧内预测子块。以此方式,基本上将64×64块的预测处理在四个32×32子块中;然而,针对64×64块计算残余,且同样针对64×64块而非32×32子块用信号发送帧内预测模式。举例来说,编码器20可编码且解码器30可解码指示64×64帧内SDC模式的语法信息和指示64×64块的像素值与32×32块的经帧内预测样本之间的差的残余数据。
在上方第一和第二实例中的每一者中,当应用SDC时,不需要变换。因此,更一般地说,如果此些方法也应用于具有常规残余译码的非SDC帧内预测,那么所述方法将仅应用于在应用变换时,最大变换大小不大于帧内预测块大小(例如,32×32)的情况。举例来说,另外,可使用以上方法以使得3D-HEVC中的正常64×64帧内预测能够用于深度译码,但可能受限于变换大小小于或等于32×32的译码。
图9是说明根据本发明的一实例的用于编码64×64帧内深度块的方法的流程图。在图9的实例中,视频编码器20(例如)在3D-HEVC过程中选择用于编码深度块的帧内SDC64×64模式(200)。在选定帧内64×64模式时,视频编码器20使用64×64帧内块的四个32×32块(即,子块)帧内预测64×64块(202),如本发明中所描述。视频编码器20接着产生指示原始64×64块的像素与四个32×32经预测子块的帧内预测性样本之间的差的残余数据(204),且基于用于64×64块的帧内预测模式以及所述残余数据编码帧内64×64块(206)。举例来说,视频编码器20可用信号发送指示用于64×64深度块的64×64帧内模式的语法信息,且因此用信号发送用以预测32×32子块中的每一者的样本的帧内模式和用于64×64块的残余数据。在帧内SDC的情况下,在一些实例中,残余数据可包括用于64×64块或其分区的增量DC值。增量DC值无需经变换或量化以用于在位流中的编码。在常规残余译码的情况下,位流可包含表示残余数据的经量化变换系数。
图10是说明根据本发明的一实例的用于解码64×64帧内深度块的方法的流程图。在图10的实例中,例如在3D-HEVC过程中,视频解码器210在经编码视频位流中接收指示用于待解码的64×64深度块的SDC 64×64帧内模式的语法信息。响应于指示SDC帧内64×64模式的语法信息,视频解码器30例如针对子块中的每一者使用相同帧内模式来对64×64深度块的四个32×32深度子块进行帧内预测(212),且接收用于64×64块的残余数据(214)。举例来说,视频解码器30可从位流解码残余数据。此外,残余数据可由SDC在无变换或量化的情况下产生,或由常规残余译码产生,在常规残余译码的情况下,视频解码器30可应用逆量化和逆变换以获得残余数据。视频解码器30基于四个32×32块的帧内预测样本和所接收的用于64×64块的残余数据重建构64×64经帧内译码块的深度数据(216)。
尽管出于实例和说明的目的描述64×64和32×32块,但在其它实例中,本发明中描述的技术可应用于更大块。举例来说,可将帧内128×128块处理为四个64×64块,或可将256×256块处理为四个128×128块。因此,应用于64×64和32×32块的概念可被视为适用于更大块。
在一些实例中,可供视频编码器20和/或视频解码器30用于帧内预测32×32块中的至少一些的样本的参考样本包含其它32×32块中的一或多者的经帧内预测参考样本。作为另一实例,可供用于帧内预测32×32块中的至少一些的样本的参考样本包含邻近相应32×32块的其它32×32块中的一或多者的经帧内预测参考样本。作为另一实例,可供用于帧内预测32×32块中的至少一些的样本的参考样本包含邻近相应32×32块的其它32×32块中的一或多者的经帧内预测参考样本和邻近64×64块和所述相应32×32块的经重建构样本。
在另一实例中,可供视频编码器20和/或视频解码器30用于帧内预测32×32块中的至少一些的样本的参考样本包含邻近64×64块的经重建构样本。作为另一实例,可供用于帧内预测32×32块中的至少一些的样本的参考样本包含邻近64×64块但不邻近相应32×32块的经重建构样本。
因此,在各种实例中,视频编码器20或视频解码器30可经配置以:使用其它32×32块中的一或多者的经帧内预测参考样本来帧内预测所述32×32块的样本;使用邻近相应32×32块的一或多个其它32×32块的经帧内预测参考样本来帧内预测所述32×32块的样本;使用邻近相应32×32块的其它32×32块中的一或多者的参考样本以及邻近64×64块和所述相应32×32块的经重建构样本来帧内预测所述32×32块的样本;使用邻近64×64块的经重建构样本来帧内预测所述32×32块的样本;或使用邻近64×64块但不邻近相应32×32块的经重建构样本来帧内预测所述32×32块的样本。
视频解码器30可执行解码用于视频译码的深度数据的方法,所述方法包括:对于用于深度数据的第一块的帧内预测模式,帧内预测用于第二块的深度数据的样本,其中第二块包括各自具有为深度数据的第一块的大小的四分之一的相同大小的四个块,且对应于深度数据的第一块的左上方、右上方、左下方和右下方块;接收用于深度数据的第一块的指示第一块的像素值与第二块的经帧内预测样本之间的差的残余数据;及基于第二块的经帧内预测样本和所述残余数据重建构深度数据的第一块。在一些实例中,所述残余数据可包括指示第一块的像素值的平均值与第二块的经帧内预测样本的平均值之间的差的DC残余数据。
视频编码器20可执行编码用于视频译码的深度数据的方法,所述方法包括:对于用于深度数据的第一块的帧内预测模式,帧内预测用于第二块的深度数据的样本,其中第二块包括各自具有为深度数据的第一块的大小的四分之一的相同大小的四个块,且对应于深度数据的第一块的左上方、右上方、左下方和右下方块;基于第一块的像素值与第二块的经帧内预测样本之间的差产生用于深度数据的第一块的残余数据;及基于所述帧内预测模式和所述残余数据编码深度数据的第一块。在一些实例中,所述残余数据可包括指示第一块的像素值的平均值与第二块的经帧内预测样本的平均值之间的差的DC残余数据。
本发明中描述的各种帧内译码技术可由视频编码器20(图3和5)和/或视频解码器30(图3和7)执行,所诉视频编码器和/或视频解码器二者通常可被称作视频译码器。另外,视频译码在适用时可通常指视频编码和/或视频解码。
虽然大体上相对于3D-HEVC描述本发明的技术,但不一定以此方式限制所述技术。上文所描述的技术也可适用于针对3D视频译码的其它当前标准或未来标准。
在一或多个实例中,本文中所描述的功能可以用硬件、软件、固件或其任何组合来实施。如果以软件实施,那么所述功能可作为一或多个指令或代码存储在计算机可读媒体上或在计算机可读媒体上予以发射,并且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体,其对应于有形媒体(例如,数据存储媒体)或通信媒体,所述通信媒体包含促进将计算机程序从一处传送到另一处(例如,根据通信协议)的任何媒体。以此方式,计算机可读媒体通常可对应于(1)非暂时形的有形计算机可读存储媒体,或(2)通信媒体,例如信号或载波。数据存储媒体可以是可由一或多个计算机或一个或多个处理器存取以检索用于实施本发明中描述的技术的指令、代码和/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。
以实例说明且非限制,此类计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器或可用来存储呈指令或数据结构形式的所要程序代码并且可由计算机存取的任何其它媒体。而且,任何连接可适当地称为计算机可读媒体。举例来说,如果使用同轴电缆、光纤缆线、双绞线、数字订户线(DSL)或例如红外线、无线电和微波的无线技术从网站、服务器或其它远程源发射指令,那么同轴电缆、光纤缆线、双绞线、DSL或例如红外线、无线电和微波的无线技术包含在媒体的定义中。然而,应理解,计算机可读存储媒体和数据存储媒体并不包含连接、载波、信号或其它暂时性媒体,而是实际上针对于非暂时性有形存储媒体。如本文所使用的磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软盘和蓝光光盘,其中磁盘通常是以磁性方式再现数据,而光盘是用激光以光学方式再现数据。以上的组合也应包含在计算机可读媒体的范围内。
指令可由一或多个处理器执行,例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)、或其它等效的集成或离散逻辑电路。因此,如本文中所使用的术语“处理器”可指前述结构或适合于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,本文所述的功能性可在经配置用于编码及解码的专用硬件及/或软件模块内提供,或并入在组合式编解码器中。并且,所述技术可完全实施于一或多个电路或逻辑元件中。
本发明的技术可在广泛多种的装置或设备中实施,包含无线手持机、集成电路(IC)或IC集合(例如,芯片组)。本发明中描述各种组件、模块或单元是为了强调经配置以执行所公开的技术的装置的功能方面,但未必需要由不同硬件单元实现。实际上,如上文所描述,各种单元可结合合适的软件和/或固件组合在编解码器硬件单元中,或者由可交互操作的硬件单元的集合来提供,所述可交互操作的硬件单元包含如上文所描述的一或多个处理器。
已描述各种实例。这些和其它实例属于所附权利要求书的范围内。

Claims (51)

1.一种解码用于视频译码的深度数据的方法,所述方法包括:
对于用于深度数据的第一块的帧内预测模式,帧内预测用于第二块的深度数据的样本,其中所述第二块包括各自具有为深度数据的所述第一块的大小的四分之一的相同大小的四个块,且对应于深度数据的所述第一块的左上方、右上方、左下方和右下方块;
接收用于深度数据的所述第一块的指示所述第一块的像素值与所述第二块的经帧内预测样本之间的差的残余数据;及
基于所述第二块的所述经帧内预测样本以及所述残余数据重建构深度数据的所述第一块。
2.根据权利要求1所述的方法,其中所述帧内预测模式为帧内64×64模式,所述第一块具有64×64像素大小,且所述第二块各自具有32×32像素大小。
3.根据权利要求1或2所述的方法,其中所述帧内预测模式为3D-HEVC中的帧内逐段DC译码SDC模式。
4.根据权利要求1或2所述的方法,其中所述帧内预测模式并非帧内逐段DC译码SDC模式。
5.根据权利要求1至4中任一权利要求所述的方法,其中所述残余数据包括指示所述第一块的所述像素值的平均值与所述第二块的所述经帧内预测样本的平均值之间的差的DC残余数据。
6.根据权利要求1至5中任一权利要求所述的方法,其中可供用于帧内预测所述第二块中的至少一些的样本的参考样本包含其它第二块中的一或多者的经帧内预测参考样本。
7.根据权利要求1至5中任一权利要求所述的方法,其中可供用于帧内预测所述第二块中的至少一些的所述样本的参考样本包含邻近相应第二块的其它第二块中的一或多者的经帧内预测参考样本。
8.根据权利要求1至5中任一权利要求所述的方法,其中可供用于帧内预测所述第二块中的至少一些的所述样本的参考样本包含邻近所述相应第二块的其它第二块中的一或多者的经帧内预测参考样本以及邻近所述第一块和所述相应第二块的经重建构样本。
9.根据权利要求1至5中任一权利要求所述的方法,其中可供用于帧内预测所述第二块中的至少一些的所述样本的参考样本包含邻近所述第一块的经重建构样本。
10.根据权利要求1至5中任一权利要求所述的方法,其中可供用于帧内预测所述第二块中的至少一些的所述样本的参考样本包含邻近所述第一块但不邻近所述相应第二块的经重建构样本。
11.根据权利要求1至5中任一权利要求所述的方法,其中帧内预测用于所述第二块的深度数据的样本包括使用其它第二块中的一或多者的经帧内预测参考样本来帧内预测所述样本。
12.根据权利要求1至5中任一权利要求所述的方法,其中帧内预测用于所述第二块的深度数据的样本包括使用邻近所述相应第二块的其它第二块中的一或多者的经帧内预测参考样本来帧内预测所述样本。
13.根据权利要求1至5中任一权利要求所述的方法,其中帧内预测用于所述第二块的深度数据的样本包括使用邻近所述相应第二块的其它第二块中的一或多者的参考样本以及邻近所述第一块和所述相应第二块的经重建构样本来帧内预测所述样本。
14.根据权利要求1至5中任一权利要求所述的方法,其中帧内预测用于所述第二块的深度数据的样本包括使用邻近所述第一块的经重建构样本来帧内预测所述样本。
15.根据权利要求1至5中任一权利要求所述的方法,其中帧内预测用于所述第二块的深度数据的样本包括使用邻近所述第一块但不邻近所述相应第二块的经重建构样本来帧内预测所述样本。
16.一种编码用于视频译码的深度数据的方法,所述方法包括:
对于用于深度数据的第一块的帧内预测模式,帧内预测用于第二块的深度数据的样本,其中所述第二块包括各自具有为深度数据的所述第一块的大小的四分之一的相同大小的四个块,且对应于深度数据的所述第一块的左上方、右上方、左下方和右下方块;
基于所述第一块的像素值与所述第二块的经帧内预测样本之间的差产生用于深度数据的所述第一块的残余数据;及
基于所述帧内预测模式和所述残余数据编码深度数据的所述第一块。
17.根据权利要求16所述的方法,其中所述帧内预测模式为帧内64×64模式,所述第一块具有64×64像素大小,且所述第二块各自具有32×32像素大小。
18.根据权利要求16或17所述的方法,其中所述帧内预测模式为3D-HEVC中的帧内逐段DC译码SDC模式。
19.根据权利要求16或17所述的方法,其中所述帧内预测模式并非帧内逐段DC译码SDC模式。
20.根据权利要求16至19中任一权利要求所述的方法,其中所述残余数据包括指示所述第一块的所述像素值的平均值与所述第二块的所述经帧内预测样本的平均值之间的差的DC残余数据。
21.根据权利要求16至20中任一权利要求所述的方法,其中可供用于帧内预测所述第二块中的至少一些的样本的参考样本包含其它第二块中的一或多者的经帧内预测参考样本。
22.根据权利要求16至20中任一权利要求所述的方法,其中可供用于帧内预测所述第二块中的至少一些的所述样本的参考样本包含邻近相应第二块的其它第二块中的一或多者的经帧内预测参考样本。
23.根据权利要求16至20中任一权利要求所述的方法,其中可供用于帧内预测所述第二块中的至少一些的所述样本的参考样本包含邻近所述相应第二块的其它第二块中的一或多者的经帧内预测参考样本以及邻近所述第一块和所述相应第二块的经重建构样本。
24.根据权利要求16至20中任一权利要求所述的方法,其中可供用于帧内预测所述第二块中的至少一些的所述样本的参考样本包含邻近所述第一块的经重建构样本。
25.根据权利要求16至20中任一权利要求所述的方法,其中可供用于帧内预测所述第二块中的至少一些的所述样本的参考样本包含邻近所述第一块但不邻近所述相应第二块的经重建构样本。
26.根据权利要求16至20中任一权利要求所述的方法,其中帧内预测用于所述第二块的深度数据的样本包括使用其它第二块中的一或多者的经帧内预测参考样本来帧内预测所述样本。
27.根据权利要求16至20中任一权利要求所述的方法,其中帧内预测用于所述第二块的深度数据的样本包括使用邻近所述相应第二块的其它第二块中的一或多者的经帧内预测参考样本来帧内预测所述样本。
28.根据权利要求16至20中任一权利要求所述的方法,其中帧内预测用于所述第二块的深度数据的样本包括使用邻近所述相应第二块的其它第二块中的一或多者的参考样本以及邻近所述第一块和所述相应第二块的经重建构样本来帧内预测所述样本。
29.根据权利要求16至20中任一权利要求所述的方法,其中帧内预测用于所述第二块的深度数据的样本包括使用邻近所述第一块的经重建构样本来帧内预测所述样本。
30.根据权利要求16至20中任一权利要求所述的方法,其中帧内预测用于所述第二块的深度数据的样本包括使用邻近所述第一块但不邻近所述相应第二块的经重建构样本来帧内预测所述样本。
31.一种用于译码用于视频译码的深度数据的装置,所述装置包括:
存储器,其存储用于视频译码的深度数据;及
一或多个处理器,其经配置以:
对于用于深度数据的第一块的帧内预测模式,帧内预测用于第二块的深度数据的样本,其中所述第二块包括各自具有为深度数据的所述第一块的大小的四分之一的相同大小的四个块,且对应于深度数据的所述第一块的左上方、右上方、左下方和右下方块;
基于所述帧内预测模式和用于所述第一块的指示所述第一块的像素值与所述第二块的经帧内预测样本之间的差的残余数据来译码深度数据的所述第一块。
32.根据权利要求31所述的装置,其中所述装置包括视频解码器,且所述一或多个处理器进一步经配置以:
接收指示所述帧内预测模式的语法信息;
接收所述残余数据;及
基于所述第二块的所述经帧内预测样本和用以译码深度数据的所述第一块的所述残余数据来重建构深度数据的所述第一块。
33.根据权利要求31所述的装置,其中所述装置包括视频编码器,且所述一或多个处理器进一步经配置以:
选择所述帧内预测模式;
产生所述残余数据;及
基于所述帧内预测模式和用以译码深度数据的所述第一块的所述残余数据来编码深度数据的所述第一块。
34.根据权利要求31至33中任一权利要求所述的装置,其中所述帧内预测模式为帧内64×64模式,所述第一块具有64×64像素大小,且所述第二块各自具有32×32像素大小。
35.根据权利要求31至34中任一权利要求所述的装置,其中所述帧内预测模式为3D-HEVC中的帧内逐段DC译码SDC模式。
36.根据权利要求31至34中任一权利要求所述的装置,其中所述帧内预测模式并非帧内逐段DC译码SDC模式。
37.根据权利要求31至36中任一权利要求所述的装置,其中所述残余数据包括指示所述第一块的所述像素值的平均值与所述第二块的所述经帧内预测样本的平均值之间的差的DC残余数据。
38.根据权利要求31至37中任一权利要求所述的装置,其中可供用于帧内预测所述第二块中的至少一些的样本的参考样本包含其它第二块中的一或多者的经帧内预测参考样本。
39.根据权利要求31至37中任一权利要求所述的装置,其中可供用于帧内预测所述第二块中的至少一些的所述样本的参考样本包含邻近相应第二块的其它第二块中的一或多者的经帧内预测参考样本。
40.根据权利要求31至37中任一权利要求所述的装置,其中可供用于帧内预测所述第二块中的至少一些的所述样本的参考样本包含邻近所述相应第二块的其它第二块中的一或多者的经帧内预测参考样本以及邻近所述第一块和所述相应第二块的经重建构样本。
41.根据权利要求31至37中任一权利要求所述的装置,其中可供用于帧内预测所述第二块中的至少一些的所述样本的参考样本包含邻近所述第一块的经重建构样本。
42.根据权利要求31至37中任一权利要求所述的装置,其中可供用于帧内预测所述第二块中的至少一些的所述样本的参考样本包含邻近所述第一块但不邻近所述相应第二块的经重建构样本。
43.根据权利要求31至37中任一权利要求所述的装置,其中所述一或多个处理器经配置以使用其它第二块中的一或多者的经帧内预测参考样本来帧内预测所述样本。
44.根据权利要求31至37中任一权利要求所述的装置,其中所述一或多个处理器经配置以使用邻近所述相应第二块的其它第二块中的一或多者的经帧内预测参考样本来帧内预测所述样本。
45.根据权利要求31至37中任一权利要求所述的装置,其中所述一或多个处理器经配置以使用邻近所述相应第二块的其它第二块中的一或多者的参考样本以及邻近所述第一块和所述相应第二块的经重建构样本来帧内预测所述样本。
46.根据权利要求31至37中任一权利要求所述的装置,其中所述一或多个处理器经配置以使用邻近所述第一块的经重建构样本来帧内预测所述样本。
47.根据权利要求31至37中任一权利要求所述的装置,其中所述一或多个处理器经配置以使用邻近所述第一块但不邻近所述相应第二块的经重建构样本来帧内预测所述样本。
48.一种用于译码用于视频译码的深度数据的装置,所述装置包括:
用于存储用于3D-HEVC视频译码的深度数据的装置;
用于针对用于深度数据的第一块的帧内预测模式,帧内预测用于第二块的深度数据的样本的装置,其中所述第二块包括各自具有为深度数据的所述第一块的大小的四分之一的相同大小的四个块,且对应于深度数据的所述第一块的左上方、右上方、左下方和右下方块;及
用于基于所述帧内预测模式和用于所述第一块的指示所述第一块的像素值与所述第二块的经帧内预测样本之间的差的残余数据来译码深度数据的所述第一块的装置。
49.一种用于译码用于视频译码的深度数据的装置,所述装置包括用于执行根据权利要求1至30中任一权利要求所述的方法的装置。
50.一种非暂时性计算机可读存储媒体,其包括引起视频译码器的一或多个处理器进行以下操作的指令:
存储用于3D-HEVC视频译码的深度数据;
对于用于深度数据的第一块的帧内预测模式,帧内预测用于第二块的深度数据的样本,其中所述第二块包括各自具有为深度数据的所述第一块的大小的四分之一的相同大小的四个块,且对应于深度数据的所述第一块的左上方、右上方、左下方和右下方块;及
基于所述帧内预测模式和用于所述第一块的指示所述第一块的像素值与所述第二块的经帧内预测样本之间的差的残余数据来译码深度数据的所述第一块。
51.一种非暂时性计算机可读存储媒体,其包括引起视频译码器的一或多个处理器执行根据权利要求1至30中任一权利要求所述的方法的指令。
CN201380081914.9A 2013-12-30 2013-12-30 对3d视频译码中较大预测块的逐段dc译码的简化 Active CN105874788B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2013/001663 WO2015100515A1 (en) 2013-12-30 2013-12-30 Simplification of segment-wise dc coding of large prediction blocks in 3d video coding

Publications (2)

Publication Number Publication Date
CN105874788A true CN105874788A (zh) 2016-08-17
CN105874788B CN105874788B (zh) 2017-11-14

Family

ID=53492877

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380081914.9A Active CN105874788B (zh) 2013-12-30 2013-12-30 对3d视频译码中较大预测块的逐段dc译码的简化

Country Status (7)

Country Link
US (1) US10306265B2 (zh)
EP (1) EP3090541A4 (zh)
JP (1) JP6396493B2 (zh)
KR (1) KR20160102073A (zh)
CN (1) CN105874788B (zh)
BR (1) BR112016015120A2 (zh)
WO (1) WO2015100515A1 (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6208885B2 (ja) * 2014-01-03 2017-10-04 ジーイー ビデオ コンプレッション エルエルシー ウェッジレットに基づいた符号化概念
WO2015139203A1 (en) * 2014-03-18 2015-09-24 Mediatek Singapore Pte. Ltd. Dlt signaling in 3d video coding
JP6308449B2 (ja) * 2014-06-26 2018-04-11 ホアウェイ・テクノロジーズ・カンパニー・リミテッド 高効率ビデオ符号化における演算負荷を低減するための方法および装置
KR102465914B1 (ko) * 2016-03-04 2022-11-14 한국전자통신연구원 영상 부호화 장치의 부호화 방법
WO2018068259A1 (zh) * 2016-10-13 2018-04-19 富士通株式会社 图像编码/解码方法、装置以及图像处理设备
PE20211404A1 (es) * 2018-04-01 2021-08-02 B1 Institute Image Technology Inc Metodo y aparato para codificar/decodificar imagen
CN112119632A (zh) * 2018-05-17 2020-12-22 瑞典爱立信有限公司 对隐式变换单元边界的去块
BR112021006547A2 (pt) * 2018-12-25 2021-07-06 Guangdong Oppo Mobile Telecommunications Corp Ltd método de previsão para decodificação, dispositivo de previsão para decodificação e mídia de armazenamento de computador que armazena um programa de previsão para decodificação
US11474948B2 (en) 2019-02-22 2022-10-18 Netflix, Inc. Adaptive retrieval of objects from remote storage
US11159795B2 (en) * 2019-03-04 2021-10-26 Tencent America LLC Max transform size control
EP3989547A4 (en) * 2019-06-21 2023-04-19 Samsung Electronics Co., Ltd. VIDEO ENCODING METHOD AND DEVICE, AND VIDEO DECODER METHOD AND DEVICE
CN114375574A (zh) * 2019-08-06 2022-04-19 Lg 电子株式会社 基于根据颜色格式确定的预测模式类型确定划分模式的图像编码/解码方法和设备,以及用于发送比特流的方法
US12120290B2 (en) * 2021-09-17 2024-10-15 Tencent America LLC Method and apparatus for intra block copy mode coding with search range switching

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102263952A (zh) * 2011-07-06 2011-11-30 北京航空航天大学 一种基于对象的快速双目立体视频分形压缩与解压缩方法
WO2012147740A1 (ja) * 2011-04-25 2012-11-01 シャープ株式会社 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム
US20130034170A1 (en) * 2011-08-01 2013-02-07 Qualcomm Incorporated Coding parameter sets for various dimensions in video coding
CN103039073A (zh) * 2010-06-07 2013-04-10 数码士有限公司 编码/解码高分辨率图像的方法和执行该方法的装置
KR20130078320A (ko) * 2011-12-30 2013-07-10 광주과학기술원 깊이 영상 부호화 방법 및 장치

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101377736B1 (ko) * 2006-10-11 2014-03-24 코닌클리케 필립스 엔.브이. 3차원 그래픽 데이터의 생성
EP2499829B1 (en) 2009-10-14 2019-04-17 Dolby International AB Methods and devices for depth map processing
US9100649B2 (en) * 2010-02-10 2015-08-04 Lg Electronics Inc. Method and apparatus for processing a video signal
US9544612B2 (en) * 2012-10-04 2017-01-10 Intel Corporation Prediction parameter inheritance for 3D video coding
US9497485B2 (en) * 2013-04-12 2016-11-15 Intel Corporation Coding unit size dependent simplified depth coding for 3D video coding
US9571858B2 (en) * 2013-07-19 2017-02-14 Futurewei Technologies, Inc. Method and apparatus of derivation for a binary partition pattern
EP3050294A4 (en) 2013-09-27 2017-08-09 Qualcomm Incorporated Residual coding for depth intra prediction modes

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103039073A (zh) * 2010-06-07 2013-04-10 数码士有限公司 编码/解码高分辨率图像的方法和执行该方法的装置
WO2012147740A1 (ja) * 2011-04-25 2012-11-01 シャープ株式会社 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム
CN102263952A (zh) * 2011-07-06 2011-11-30 北京航空航天大学 一种基于对象的快速双目立体视频分形压缩与解压缩方法
US20130034170A1 (en) * 2011-08-01 2013-02-07 Qualcomm Incorporated Coding parameter sets for various dimensions in video coding
KR20130078320A (ko) * 2011-12-30 2013-07-10 광주과학기술원 깊이 영상 부호화 방법 및 장치

Also Published As

Publication number Publication date
JP6396493B2 (ja) 2018-09-26
WO2015100515A1 (en) 2015-07-09
EP3090541A1 (en) 2016-11-09
JP2017507618A (ja) 2017-03-16
US10306265B2 (en) 2019-05-28
BR112016015120A2 (pt) 2017-08-08
CN105874788B (zh) 2017-11-14
EP3090541A4 (en) 2017-08-23
US20160330480A1 (en) 2016-11-10
KR20160102073A (ko) 2016-08-26

Similar Documents

Publication Publication Date Title
CN105934948B (zh) 解码和编码视频数据的方法和装置及计算机可读存储介质
KR102135997B1 (ko) 심도 인트라 예측 모드들에 대한 잔차 코딩
CN105379282B (zh) 用于纹理译码的先进残余预测(arp)的方法和设备
CN105874788B (zh) 对3d视频译码中较大预测块的逐段dc译码的简化
CN105393536B (zh) 使用位移向量从预测性块的帧内预测
JP6312854B2 (ja) 3dビデオコーディングにおけるデルタdc残差コーディングの簡易化
CN105191317B (zh) 视图内以及跨越视图的深度查找表的预测性译码
CN105103559B (zh) 三维(3d)视频译码方法及装置
CN104025602B (zh) 三维视频译码中用信号通知视图合成预测支持
CN105027571B (zh) 三维视频译码中导出的视差向量
CN110100436A (zh) 使用导出色度模式译码视频数据
CN105052147A (zh) 用于3d-hevc的深度数据的深度译码模式信令
CN106105216A (zh) 用于3d视频译码的受约束深度帧内模式译码
CN105814896A (zh) 3d视频译码中的大型块和深度建模模式(dmm)
CN104396250A (zh) 用于3d视频译码的深度图的帧内译码
CN105580365A (zh) Hevc中的基于子预测单元(pu)的时间运动向量预测和3d-hevc中的子pu设计
CN105580364A (zh) Hevc中的基于子预测单元(pu)的时间运动向量预测和3d-hevc中的子pu设计
CN104838651A (zh) 可缩放及多视角视频译码中的高级残差预测
CN105308956A (zh) 用于深度图帧内译码的预测子
CN104041047A (zh) 在使用深度的3d视频译码中的多重假设差异向量构建
CN104272741A (zh) 多视图译码和3d译码中的视图相依性
WO2015006884A1 (en) 3d video coding with partition-based depth inter coding
CN104584557A (zh) 构造用于多视图或3dv视频译码的参考图片列表
CN105308969A (zh) 三维视频中的视图合成
CN105580361A (zh) 用于深度帧内预测模式的残余译码

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1225881

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1225881

Country of ref document: HK