CN104350749A - 深度图估计的推导 - Google Patents

深度图估计的推导 Download PDF

Info

Publication number
CN104350749A
CN104350749A CN201380030528.7A CN201380030528A CN104350749A CN 104350749 A CN104350749 A CN 104350749A CN 201380030528 A CN201380030528 A CN 201380030528A CN 104350749 A CN104350749 A CN 104350749A
Authority
CN
China
Prior art keywords
interdependent
view
depth map
access unit
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201380030528.7A
Other languages
English (en)
Other versions
CN104350749B (zh
Inventor
张莉
陈颖
马尔塔·卡切维奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN104350749A publication Critical patent/CN104350749A/zh
Application granted granted Critical
Publication of CN104350749B publication Critical patent/CN104350749B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

在用于产生和更新用于对多视图视频数据进行译码的视图间运动预测和/或视图间残余预测的深度图估计的一些实例性技术中,多个相依视图中的每一者与相依深度视图估计相关联,所述相依深度视图估计可基于相对于基本视图对所述相依视图的纹理数据的译码而产生或更新。在此些实例中,相依深度图估计中的每一者可经变形到基本视图以产生多个基本深度图估计中的相应一者。用于深度图估计对的每一相依深度图估计和相应基本深度图估计与多个相依视图中的相应一者相关联。

Description

深度图估计的推导
本申请案主张2012年6月13日申请的第61/659,290号美国临时申请案的权益,所述申请案的整个内容以引用方式并入本文。
技术领域
本发明涉及视频译码,且更特定来说涉及用于多视图视频译码的深度图的推导。
背景技术
数字视频能力可并入到广泛范围的装置中,包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、视频电话会议装置,及其类似物。数字视频装置实施视频压缩技术,例如在由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分高级视频译码(AVC)、当前在开发的高效视频译码(HEVC)标准所定义的标准和这些标准的扩展中所描述的技术。视频装置可通过实施此类视频译码技术来更有效地发射、接收、编码、解码和/或存储数字视频信息。
视频译码技术包含空间(图片内)预测和/或时间或视图(图片间)预测以减少或移除视频序列中固有的冗余。针对基于块的视频译码,视频切片(例如,图片或图片的一部分)可分割为若干视频块,所述视频块也可被称为树块、译码单元(CU)和/或译码节点。图片的经帧内译码(I)切片中的视频块是相对于同一图片中的相邻块中的参考样本使用空间预测来编码。图片的经帧间译码(P或B)切片中的视频块可相对于同一图片中的相邻块中的参考样本使用空间预测,或相对于其它参考图片中的参考样本使用时间预测。图片可称为帧,且参考图片可称为参考帧。
空间或时间预测针对待译码的块产生预测性块。残余数据表示在待译码的原始块与预测性块之间的像素差。经帧间译码块是根据指向形成预测性块的参考样本的块的运动向量及指示在经译码块与预测性块之间的差的残余数据来编码。经帧内译码块是根据帧内译码模式及残余数据来编码。为进行进一步压缩,可将残余数据从像素域变换到变换域,从而产生接着可被量化的残余变换系数。最初以二维阵列布置的经量化变换系数可经扫描,以便产生变换系数的一维向量,且可应用熵译码以实现甚至更多的压缩。
发明内容
大体上,本发明描述用于多视图视频译码的视图间运动预测和/或视图间残余预测的技术。更特定来说,本发明描述用于产生和更新用于视图间运动预测和/或视图间残余预测的深度图估计的技术。在一些实例中,多个相依视图中的每一者与相依深度视图估计相关联,所述相依深度视图估计可基于相对于基本视图的相依视图的纹理数据的译码而产生或更新。在此些实例中,相依深度图估计中的每一者可经变形到基本视图以产生多个基本深度图估计中的相应一者。每一相依深度图估计和相应基本深度图估计用于与多个相依视图中的相应一者相关联的深度图估计对。
在一些实例中,在对共同视图中的非锚点图片的解码之后更新深度图估计对的基本深度图估计中的每一者。可将经更新基本深度图估计变形到相应相依视图以产生经更新相依深度图估计。在一些实例中,对于相依视图中的锚点图片,可停用视图间运动预测,而对于相依视图中的非锚点图片,启用视图间运动预测。
相依视图的视图间运动预测和/或视图间残余预测可基于其经更新相依深度图估计。本文描述的技术可通过避免不同相依视图的深度图估计之间的相依性来促进相依视图的独立解码。举例来说,用于一个相依视图的视图间运动预测和/或视图间残余预测的深度图估计将不取决于变形另一相依视图的深度图估计。因此,在经译码多视图视频数据中可用的各种视图的位流提取功能性可改善。
在一个实例中,一种对视频数据进行译码的方法,所述视频数据包括至少一个基本视图和多个相依视图,其中所述多个相依视图取决于所述基本视图,所述方法包括:对于所述相依视图中的每一者,相对于存取单元的所述基本视图的纹理数据使用所述相依视图的视差运动信息对所述存取单元的所述相依视图的纹理数据进行译码。所述方法进一步包括对于所述相依视图中的每一者,基于所述相依视图的所述视差运动信息产生所述存取单元的相依深度图估计;以及将所述相依深度图估计中的每一者变形到所述基本视图以产生所述存取单元的多个基本深度图估计中的相应一者。所述相依深度图估计中的每一者和所述相应基本深度图估计形成所述存取单元的多个深度图估计对中的相应一者且与所述多个相依视图中的相应一者相关联。
在另一实例中,一种装置包括用于对视频数据进行译码的视频译码器,所述视频数据包括至少一个基本视图和多个相依视图,其中所述多个相依视图取决于所述基本视图。所述视频译码器经配置以对于所述相依视图中的每一者,相对于存取单元的所述基本视图的纹理数据使用所述相依视图的视差运动信息对所述存取单元的所述相依视图的纹理数据进行译码,且对于所述相依视图中的每一者,基于所述相依视图的所述视差运动信息产生所述存取单元的相依深度图估计。所述视频译码器进一步经配置以将所述相依深度图估计中的每一者变形到所述基本视图以产生所述存取单元的多个基本深度图估计中的相应一者。所述相依深度图估计中的每一者和所述相应基本深度图估计形成所述存取单元的多个深度图估计对中的相应一者且与所述多个相依视图中的相应一者相关联。
在另一实例中,一种用于对视频数据进行译码的装置,所述视频数据包括至少一个基本视图和多个相依视图,其中所述多个相依视图取决于所述基本视图,所述装置包括:用于对于所述相依视图中的每一者相对于存取单元的所述基本视图的纹理数据使用所述相依视图的视差运动信息对所述存取单元的所述相依视图的纹理数据进行译码的装置。所述装置进一步包括用于对于所述相依视图中的每一者基于所述相依视图的所述视差运动信息产生所述存取单元的相依深度图估计的装置,以及用于将所述相依深度图估计中的每一者变形到所述基本视图以产生所述存取单元的多个基本深度图估计中的相应一者的装置。所述相依深度图估计中的每一者和所述相应基本深度图估计形成所述存取单元的多个深度图估计对中的相应一者且与所述多个相依视图中的相应一者相关联。
在另一实例中,一种计算机可读存储媒体具有存储于其上的指令,所述指令当由经配置以对包括至少一个基本视图和多个相依视图的视频数据进行译码的视频译码器的一或多个处理器执行时致使所述视频译码器进行以下操作,其中所述多个相依视图取决于所述基本视图:对于所述相依视图中的每一者,相对于存取单元的所述基本视图的纹理数据使用所述相依视图的视差运动信息对所述存取单元的所述相依视图的纹理数据进行译码。所述指令进一步致使所述视频译码器对于所述相依视图中的每一者,基于所述相依视图的所述视差运动信息产生所述存取单元的相依深度图估计;以及将所述相依深度图估计中的每一者变形到所述基本视图以产生所述存取单元的多个基本深度图估计中的相应一者。所述相依深度图估计中的每一者和所述相应基本深度图估计形成所述存取单元的多个深度图估计对中的相应一者且与所述多个相依视图中的相应一者相关联。
在附图和以下描述中陈述一或多个实例的细节。从描述和附图以及从权利要求书将明了其它特征、目标和优点。
附图说明
图1是说明实例性视频编码和解码系统的框图,所述系统可经配置以利用本发明中描述的技术来产生深度图估计以用于多视图视频译码中的视图间运动预测和/或视图间残余预测。
图2是说明相对于多个空间相邻块的实例性当前视频块的概念图,用于当前块的空间运动向量预测符可从所述空间相邻块推导。
图3是说明包含当前视频块的实例性图片和包含可从其推导时间运动向量预测符(TMVP)的参考块的时间参考图片的概念图。
图4是说明各自包含多个视图的多个存取单元的实例性图片以及基于估计深度图的视图间运动向量预测符(IVMP)的推导的概念图。
图5是说明如当前界定且根据本发明的技术用于视图间运动预测和/或视图间残余预测的深度图估计的产生之间的实例性差异的概念图。
图6是说明根据本发明的技术用于视图间运动预测和/或视图间残余预测的深度图估计的产生的实例的概念图。
图7是说明根据本发明的用于深度图估计的产生的实例性技术的流程图。
图8是说明根据本发明的用于对纹理数据进行译码且产生锚点图片的深度图估计的实例性技术的流程图。
图9是说明根据本发明的用于对纹理数据进行译码且产生非锚点图片的深度图估计的实例性技术的流程图。
图10是说明视频编码器的实例的框图,所述视频编码器可实施本发明中描述的技术来产生深度图估计以用于多视图视频译码中的视图间运动预测和/或视图间残余预测。
图11是说明视频解码器的实例的框图,所述视频编码器可实施本发明中描述的技术来产生深度图估计以用于多视图视频译码中的视图间运动预测和/或视图间残余预测。
具体实施方式
本发明中描述的技术大体上涉及多视图视频译码,例如两个或两个以上视图的译码。更特定来说,所述技术涉及使用多视图译码(MVC)过程的视频译码,所述过程例如MVC加深度过程。举例来说,所述技术可应用于3D-HEVC编码器-解码器(编解码器),其中使用MVC或MVC加深度译码过程。用于3D-HEVC译码过程的HEVC扩展当前在开发中,且如当前建议,利用了MVC或MVC加深度译码过程。另外,本发明中描述的技术涉及在例如根据3D-HEVC的视频译码等多视图视频译码的上下文中的运动向量预测和/或残余预测。本文描述的技术可由根据包含本发明中描述的标准的多种视频译码标准中的任一者配置的视频编解码器实施。
作为一个实例,本发明中描述的技术可由经配置以执行如上文论述的3D-HEVC译码过程的高效视频译码(HEVC)编解码器实施。然而,可能可经扩展或修改以与本发明的技术一起使用的其它实例性视频译码标准包含ITU-T H.261、ISO/IEC MPEG-1视觉、ITU-T H.262或ISO/IEC MPEG-2视觉、ITU-T H.263、ISO/IEC MPEG-4视觉和ITU-T H.264(也称为ISO/IEC MPEG-4AVC),包含其可缩放视频译码(SVC)和多视图视频译码(MVC)扩展。MVC的联合草案在“用于一般视听服务的高级视频译码”(ITU-T推荐H.264,2010年3月)中描述,其在2012年6月6日可从http://www.itu.int/ITU-T/ recommendations/rec.aspx?id=10635下载。
高效视频译码(HEVC)当前正由ITU-T视频译码专家组(VCEG)和ISO/IEC动画专家组(MPEG)的视频译码联合合作组(JCT-VC)开发。HEVC的新近草案可得自:
http://wg11.sc29.org/jct/doc_end_user/current_document.php?id=5885/JCTVC-I1003-v2。称为“HEVC工作草案7”的HEVC标准的另一新近草案在2012年6月6日可从以下地址下载:http://phenix.it-sudparis.eu/jct/doc_end_user/documents/9_Geneva/wg11/ JCTVC-I1003-v3.zip。HEVC工作草案7的完整引用是布罗斯(Bross)等人文献HCTVC-I1003,“高效视频译码(HEVC)文字规范草案7”(ITU-T SG16 WP3和ISO/IECJTC1/SC29/WG11的视频译码联合合作组(JCT-VC),瑞士日内瓦第9次会议,2012年4月27日到2012年5月7日)。HEVC标准的AVC兼容视频加深度扩展的新近草案可从http://phenix.it-sudparis.eu/jct2/doc_end_user/current_document.php?id=456下载。此文献的完整引用是哈努克色拉(Hannuksela)等人的JCT3V-B1002,“3D-AVC草案文本4”(ITU-T SG 16和ISO/IEC/JDTC 1/SC 29/WG 11的3D视频译码扩展开发联合合作组(JCT3V),第2次会议,中国上海,2012年10月13日到2012年10月19日)。3D-HEVC的最新参考软件HM版本3.0可从以下链接下载:https://hevc.hhi.fraunhofer.de/ svn/svn_3DVCSoftware/tags/HTM-3.0/。用于3D-HEVC的软件HM版本3.0的软件描述在w12559号文献中描述。w12559的完整引用是舒瓦茨(Schwarz)等人的“基于HEVC的3D视频译码的考虑下的测试模型”(MPEG会议ISO/IEC JTC1/SC29/WG11MPEG2011/N12559,加利福尼亚州圣何塞,2012年2月)。
当前由动画专家组(MPEG)开发的基于HEVC的3D视频译码(3D-HEVC)编解码器的实例在MPEG文献m22570、m22571和m23698中描述。m22570的完整引用为:舒瓦茨等人的“夫琅和费HHI的3D视频译码技术建议的说明(HEVC兼容配置A)”(MPEG会议ISO/IEC JTC1/SC29/WG11文献MPEG11/M22570,瑞士日内瓦,2011年11月/12月)。m22571的完整引用为:舒瓦茨等人的“夫琅和费HHI的3D视频技术建议的说明(HEVC兼容配置B)”(MPEG会议ISO/IEC JTC1/SC29/WG11文献MPEG11/M22571,瑞士日内瓦,2011年11月/12月)。m23698的完整引用为:舒瓦茨等人的“HHI的视图间运动参数预测的3D-HEVC-CE3结果”(MPEG会议ISO/IECJTC1/SC29/WG11文献MPEG12/M23698,美国圣何塞,2012年2月)。
先前参考中的每一者以其相应全文引用的方式并入本文。本发明中描述的技术不限于这些标准,且可扩展到其它标准,包含依赖于运动向量预测和/或残余预测来视频译码的技术。
图1是说明实例性视频编码和解码系统10的框图,所述系统可经配置以利用本发明中描述的技术来产生深度图估计以用于多视图视频译码中的视图间运动预测和/或视图间残余预测。如图1的实例中所示,系统10包含源装置12,其产生经编码视频以用于由目的地装置14解码。源装置12可将经编码视频经由通信信道16发射到目的地装置14,或可将经编码视频存储在存储装置36(例如存储媒体或文件服务器)上,使得经编码视频可在需要时由目的地装置14存取。源装置12和目的地装置14可包括广泛多种的装置中的任一者,包含桌上型计算机、笔记本(即,膝上型)计算机、平板计算机、机顶盒、电话手持机(包含蜂窝式电话或手持机和所谓的智能电话)、电视机、相机、显示装置、数字媒体播放器、视频游戏控制台或类似物。
在许多情况下,此些装置可经配备以用于无线通信。因此,通信信道16可包括无线信道。或者,通信信道16可包括有线信道、无线与有线信道的组合,或适合于经编码视频数据的发射的任一其它类型的通信信道或通信信道组合,例如射频(RF)频谱或者一或多个物理传输线。在一些实例中,通信信道16可形成例如局域网(LAN)、广域网(WAN)或全球网(例如,因特网)的基于包的网络的部分。通信信道16因此通常表示用于将视频数据从源装置12发射到目的地装置14的任何合适通信媒体或不同通信媒体的集合,包含有线或无线媒体的任一合适组合。通信信道16可包含路由器、交换器、基站,或可用以促进从源装置12到目的地装置14的通信的任何其它设备。
如图1的实例中进一步展示,源装置12包含视频源18、视频编码器20和输出接口22。视频源18可包含视频俘获装置。视频俘获装置例如可包含以下各项中的一或多者:摄像机,含有先前俘获视频的视频存档,用以从视频内容提供者接收视频的视频馈送接口,和/或用于产生计算机图形数据作为源视频的计算机图形系统。作为一个实例,如果视频源18为摄像机,那么源装置12和目的地装置14可形成所谓的像机电话或视频电话,例如,如智能电话或平板计算机或其它移动计算装置中那样。然而本发明中描述的技术不限于无线应用或设定,且可应用于包含视频编码和/或解码能力的非无线装置。源装置12和目的地装置14因此仅为可支持本文描述的技术的译码装置的实例。
视频编码器20可对所俘获、预俘获或计算机产生的视频进行编码,如下文将更详细描述。视频编码器20可将经编码视频输出到输出接口22,所述输出接口可经由通信信道16将经编码视频提供到目的地装置14。输出接口22在一些实例中可包含调制器/解调器(“调制解调器”)和/或发射器。
输出接口22可另外或替代地将由视频编码器20编码的所俘获、预俘获或计算机产生的视频提供到存储装置36以用于稍后检索、解码和消耗。存储装置36可包含蓝光光盘、DVD、CD-ROM、快闪存储器或用于存储经编码视频的任一其它合适的数字存储媒体。目的地装置14可存取存储在存储装置上的经编码视频,对此经编码视频进行解码以产生经解码视频且重放此经解码视频。
存储装置36可另外或替代地包含能够存储经编码视频且将所述经编码视频发射到目的地装置14的任一类型的服务器。实例文件服务器、网络服务器(例如,用于网站)、FTP服务器、网络附接存储(NAS)装置、本地磁盘驱动器,或能够存储经编码视频数据且将其发射到目的地装置的任一其它类型的装置。经编码视频数据从存储装置36的发射可为流式传输发射、下载发射或两者的组合。目的地装置14可根据任一标准数据连接(包含因特网连接)存取存储装置36。此连接可包含无线信道(例如,Wi-Fi连接或无线蜂窝式数据连接)、有线连接(例如,DSL、电缆调制解调器等等)、有线与无线信道的组合,或适合于存取存储在文件服务器上的经编码视频数据的任一其它类型的通信信道。
在图1的实例中,目的地装置14包含用于接收信息(包含经译码视频数据)的输入接口28、视频解码器30和显示装置32。由输入接口28接收的信息可包含多种语法信息,其由视频编码器20产生以供视频解码器30用于对相关联经编码视频数据进行解码。视频编码器20和视频解码器30中的每一者可形成能够对视频数据进行编码或解码的相应编码器-解码器(编解码器)的部分。
目的地装置14的显示装置32表示能够呈现视频数据供观看者消耗的任一类型的显示器。虽然展示为与目的地装置14集成,但显示装置32可与目的地装置14集成或在目的地装置14外部。在一些实例中,目的地装置14可包含集成显示装置且还经配置以与外部显示装置介接。在其它实例中,目的地装置14可为显示装置。大体上,显示装置32向用户显示经解码视频数据,且可包括多种显示装置中的任一者,例如液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器,或另一类型的显示装置。
如上文论述,本发明中描述的技术大体上涉及多视图或3D视频译码,例如涉及两个或两个以上纹理视图和/或包含纹理和深度分量的视图的译码。在一些实例中,3D视频译码技术可使用多视图译码(MVC)或MVC加深度过程,例如当前在开发的3D-HEVC标准中那样。在一些实例中,由视频编码器20编码且由视频解码器30解码的视频数据在任一给定时间实例处(即,“存取单元”内)包含两个或两个以上图片,或在任一给定时间实例处两个或两个以上图片可从中推导的数据。
在一些实例中,例如视频源18的装置可例如通过使用两个或两个以上空间偏移相机或其它视频俘获装置来俘获共同场景而产生所述两个或两个以上图片。从稍微不同的水平位置同时或近似同时俘获的同一场景的两个图片可用以产生三维效果。在一些实例中,视频源18(或源装置12的另一组件)可使用深度信息或视差信息来从在给定时间实例处的第一视图的第一图片产生在所述给定时间实例处的第二(或其它额外)视图的第二(或其它额外)图片。在此情况下,存取单元内的视图可包含对应于第一视图的纹理分量,和可与所述纹理分量一起用以产生第二视图的深度分量。深度或视差信息可由俘获第一视图的视频俘获装置例如基于相机参数或关于视频俘获装置的配置和第一视图的视频数据的俘获的其它已知信息而确定。深度或视差信息可另外或替代地例如由视频源18或源装置12的另一组件根据相机参数和/或第一视图中的视频数据来计算。
为了呈现3D视频,显示装置32可同时或近似同时显示与共同场景的不同视图相关联的两个图片,所述不同视图是同时或近似同时俘获的。在一些实例中,目的地装置14的用户可佩戴有源眼镜来快速且交替地关闭左镜片和右镜片,且显示装置32可与有源眼镜同步地在左视图与右视图之间快速切换。在其它实例中,显示装置32可同时显示所述两个视图,且用户可佩戴例如具有极化镜片的无源眼镜,其对视图进行过滤以致使适当视图通过到用户的眼睛。在其它实例中,显示装置32可包括自动立体显示器,其不需要用户佩戴眼镜来感知3D效果。
视频编码器20和视频解码器30可根据本文提到的视频译码标准中的任一者来操作,例如HEVC标准和当前在开发的3D-HEVC扩展。当根据HEVC标准操作时,视频编码器20和视频解码器30可符合HEVC测试模型(HM)。然而本发明的技术不限于任一特定译码标准。
HM将视频数据块称为译码单元(CU)。大体上,CU具有与根据H.264译码的宏块类似的目的,不同的是CU不具有与H.264的宏块相关联的大小区别。因此,CU可经分裂为若干子CU。大体上,本发明中对CU的参考可指代图片的最大译码单元(LCU)或LCU的子CU。举例来说,位流内的语法数据可界定LCU,其为在像素数目方面的最大译码单元。LCU可经分裂为若干子CU,且每一子CU可经分裂为若干子CU。位流内的语法数据可界定LCU可经分裂的最大次数,称为最大CU深度。因此,位流也可界定最小译码单元(SCU)。
LCU可与阶层式四叉树数据结构相关联。大体上,四叉树数据结构包含每CU一个节点,其中根节点对应于LCU。如果CU经分裂为四个子CU,那么对应于CU的节点包含用于对应于所述子CU的四个节点中的每一者的参考。四叉树数据结构的每一节点可提供用于对应CU的语法数据。举例来说,四叉树中的节点可包含分裂旗标,其指示对应于所述节点的CU是否经分裂为若干子CU。用于CU的语法元素可以递归方式界定,且可取决于CU是否经分裂为若干子CU。
未经分裂的CU可包含一或多个预测单元(PU)。大体上,PU表示对应CU的全部或一部分,且包含用于对与PU相关联的视频数据块进行译码的数据。举例来说,PU可包含指示用于对相关联视频数据块进行译码的预测模式的数据,例如所述块是经帧内译码还是帧间译码。经帧内译码块是基于同一图片中的已经译码块来译码。经帧间译码块是基于不同图片的已经译码块来译码。所述不同图片可为时间上不同的图片,即在视频序列中在当前图片之前或之后的图片。
在多视图译码的情况下,例如在3D-HEVC中,所述不同图片可为来自与当前图片相同的存取单元但与不同于当前图片的视图相关联的图片。在此情况下,帧间预测可称为视图间译码。当对非基本视图(例如,相依视图)的图片进行译码时,可将来自同一存取单元但不同视图(例如,来自参考视图)的图片添加到参考图片列表中。可将视图间参考图片放到参考图片列表的任一位置,如任一帧间预测(例如,时间或视图间)参考图片的情况那样。
所述不同图片的用于预测当前图片的块的块由预测向量识别。在多视图译码中,存在两种预测向量。一种是指向时间参考图片中的块的运动向量,且对应帧间预测称为运动补偿预测(MCP)。另一类型的预测向量是视差向量,其指向在同一存取单元当前图片中的图片中但不同视图的块。关于视差向量,对应帧间预测称为视差补偿预测(DCP)。
界定运动向量或视差向量的数据可描述例如预测向量的水平分量、预测向量的垂直分量以及预测向量的分辨率(例如,整数精度、四分之一像素精度或八分之一像素精度)。PU的数据也可包含指示预测方向的数据,例如用以识别应使用参考图片列表L0和L1中的哪一者。PU的数据还可包含指示运动向量或视差运动向量指向的参考图片的数据,例如到参考图片列表中的参考图片索引。界定PU的用于CU的数据也可描述例如CU分割为一或多个PU。分割模式可在CU是否未经译码、经帧内预测模式编码或经帧间预测模式编码之间不同。
除了具有一或多个PU之外,CU还可包含一或多个变换单元(TU)。在使用PU的预测之后,视频编码器可针对CU的对应于PU的部分计算残余值,其中这些残余值也可称为残余数据。残余值可包括像素差值,例如经译码像素与预测性像素之间的差,其中经译码像素可与待译码像素块相关联,且预测性像素可与用以预测经译码块的一或多个像素块相关联。TU不一定限于PU的大小。因此,TU可大于或小于同一CU的对应PU。在一些实例中,TU的最大大小可为对应CU的大小。本发明使用术语“块”或“视频块”来指代CU、PU和/或TU中的任一者或组合。
为了进一步压缩块的残余值,可将残余值变换为将数据(也称为“能量”)尽可能压缩到系数中的变换系数的集合。变换技术可包括离散余弦变换(DCT)过程或概念上类似的过程、整数变换、小波变换或其它类型的变换。所述变换将像素的残余值从空间域转换到变换域。变换系数对应于通常与原始块大小相同的二维系数矩阵。换句话说,存在恰好与原始块中的像素一样多的变换系数。然而,由于变换,许多变换系数可具有等于零的值。
视频编码器20可随后量化变换系数的值以进一步压缩视频数据。量化通常涉及将相对大范围内的值映射到相对小范围中的值,因此减少表示经量化变换系数所需的数据量。量化过程可减少与系数中的一些或全部相关联的位深度。
在量化之后,视频编码器20可扫描变换系数,从而从包含经量化变换系数的二维矩阵产生一维向量。视频编码器20可随后对一维向量进行熵编码以更进一步压缩数据。大体上,熵译码包括共同地压缩经量化变换系数序列和/或其它语法信息的一或多个过程。熵译码可包含例如内容自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码,或另一熵编码方法。
如上文论述,界定视频数据块的运动向量或视差向量的数据可包含预测向量的水平和垂直分量以及预测向量的分辨率。在其它实例中,界定运动向量或视差向量的数据可在称为运动向量预测符(MVP)的方面描述向量。用于当前PU的MVP可为空间相邻PU、即邻近于当前正译码PU的PU的运动向量。替代地,用于当前PU的MVP可为另一图片中的位于同一地点的块或此位于同一地点的块的相邻块的运动向量。作为又一替代,用于当前PU的MVP可为从视图间参考图片(即,与当前图片在同一存取单元中但来自不同视图的参考图片)中的参考块推导的运动向量或视差向量。
通常,MVP的候选列表以经界定方式形成,例如通过以具有最小振幅的MVP到具有最大振幅的MVP(即,待译码当前PU与参考PU之间的最小到最大位移)列出MVP,或基于参考块的位置(例如,空间左边、空间上方、视图间参考图片或时间参考图片)列出MVP。
在形成MVP的列表之后,视频编码器20可评估MVP中的每一者以确定哪一者提供最佳地匹配于为对视频进行编码而选择的给定速率与失真简档的最佳速率与失真特性。视频编码器20可相对于MVP中的每一者执行速率-失真优化(RDO)程序,选择MVP中具有最佳RDO结果的一者。替代地,视频编码器20可选择存储到列表的MVP中最佳地近似为当前PU确定的运动向量的一者。在任一情况下,视频编码器20可使用索引来指定选定MVP,所述索引识别MVP中在MVP候选列表中的选定一者。视频编码器20可在经编码位流中用信号发送此索引以由视频解码器30使用。
根据用于使用MVP的一个技术,视频编码器20和视频解码器30可实施称为“合并模式”的模式。大体上,根据合并模式,当前块(例如,PU)从另一先前经译码块(例如,相邻块)或者时间或视图间参考图片中的块继承预测向量。当实施合并模式时,视频编码器20以经界定方式构造候选MVP列表(参考图片和运动向量),选择候选MVP中的一者,且在位流中将识别选定MVP的候选列表索引用信号发送到视频解码器30。视频解码器30在实施合并模式中接收此候选列表索引,根据经界定方式重构MVP候选列表,且在候选列表中选择由所述索引指示的MVP中的所述一者。视频解码器30随后例示MVP中的所述选定一者作为在与MVP中的所述选定一者相同分辨率下且指向MVP中的所述选定一者所指向的同一参考图片的用于当前PU的预测向量。在解码器侧,一旦候选列表索引经解码,便继承选定候选的对应块的所有运动参数,例如运动向量、预测方向和参考图片索引。合并模式通过允许视频编码器20用信号发送到候选MVP列表中的索引而不是界定预测向量的所有信息,来促进位流效率。
视频编码器20和视频解码器30利用MVP的另一技术称为“高级运动向量预测”(AMVP)。类似于合并模式,当实施AMVP时,视频编码器20以经界定方式构造候选MVP列表,选择候选MVP中的一者,且在位流中将识别选定MVP的候选列表索引用信号发送到视频解码器30。类似于合并模式,当实施AMVP时,视频解码器30以经界定方式重构候选MVP列表,对来自编码器的候选列表索引进行解码,且基于候选列表索引选择且例示MVP中的一者。
然而,与合并模式相反,当实施AMVP时,视频编码器20还用信号发送参考图片列表和到参考图片列表中的参考图片索引,因此指定由候选列表索引指定的MVP所指向的参考图片。另外,对于AMVP,视频编码器20和视频解码器30两者基于选定参考图片列表和到选定列表中的参考图片索引来构造候选列表。特定来说,选择哪些候选以包含在列表中是基于选定参考图片列表和到选定列表中的参考图片索引来确定。此外,视频编码器20确定当前块的运动向量差(MVD),其中MVD是MVP与原本将用于当前块的实际运动向量或视差运动向量之间的差。
对于AMVP,除了参考图片索引和候选列表索引之外,视频编码器20在位流中用信号发送用于当前块的MVD。由于给定块的参考图片索引和预测向量差的信令,AMVP可能不如合并模式那样高效,但可提供经译码视频数据的改善保真度。大体上,将本文描述的技术描述为在使用AMVP的视频译码器中实施。然而,技术在一些实例中可由使用合并模式、跳过模式或使用MVP来表示图片间预测向量的任一其它模式的视频译码器应用。
最有效译码工具中的一者是例如使用视图间运动向量预测符(IVMP)用于合并模式或AVMP的视图间运动预测,其中相依视图中的块的运动参数是基于同一存取单元中的另一视图中的已经译码运动参数来预测或推断。为了推导相依视图中的当前块的候选运动参数,例如视频编码器20或视频解码器30将与当前块相关联的深度值转换为视差向量。视频译码器使用视差向量来识别参考(例如,基本)视图的参考图片中的参考(即,预测)块。视频译码器可使用参考块的运动参数或视差向量作为当前块的运动参数,例如用于当前块的IVMP。
另一译码工具是视图间残余预测,其为当前HEVC 3D视频译码扩展的部分。在视图间残余预测中,基本上存在两种预测:正从参考块译码的当前块的预测;以及从残余参考块的残余值对当前块的残余值的预测。残余参考块是来自同一存取单元中的参考视图中的参考图片的块,且可以类似于识别用于视图间运动预测的参考块的方式基于当前块的视差向量来识别。在视图间残余预测中,从参考块对当前块的第一预测可为(但不一定为)基于通过当前块的视差向量识别的参考块的视图间运动预测。换句话说,视图间运动预测和视图间残余预测中的一者或两者可用以对特定块进行译码。视图间运动预测和视图间残余预测两者分别利用当前块的视差向量来识别参考块或残余参考块。
3D-HEVC支持两种方法来构造用于视图间运动预测和视图间残余预测的视差向量。根据所述方法中的一者,视频译码器直接从经译码深度视图分量推导视差向量。根据由3D-HEVC支持的另一方法,视频译码器仅从视差向量和运动向量产生每一像素的视差向量。这后一种方法在上文参考的m23698中简化。
由3D-HEVC支持的后一种方法的一个问题在于,一或多个相依视图的视图间运动预测译码取决于一或多个其它相依视图的译码。更特定来说,根据3D-HEVC的当前实施方案,视频译码器基于用于相依视图的纹理数据的译码来推导用于第一相依视图的相依深度图估计。视频译码器随后将相依深度图估计变形到基本(或参考)视图以产生由所有相依视图共享的共同基本深度图估计。视频译码器随后将基本深度图估计变形到第二相依视图以产生用于第二视图的相依深度图估计,且基于用于第二视图的相依深度图估计来实现第二相依视图的纹理数据的视图间运动预测译码。
以此方式,根据3D-HEVC的当前实施方案,第二相依视图的纹理数据的译码不独立于第一相依视图的纹理数据的译码。第二相依视图的译码取决于第二相依深度图估计,所述第二相依深度图估计是通过将第一相依深度图估计经由基本视图变形到第二相依视图来推导。第一相依深度图又取决于第一相依视图的纹理数据的解码。3D-HEVC的当前实施方案中的相依视图之间的此相依性即使当假设相依视图由于停用视图之间的纹理预测而经独立译码时也存在。相依视图之间的此相依性导致缺乏位流提取功能性,例如共享同一基本视图的两个立体操作点。举例来说,每当例如在第一相依视图中以DCP或其它方式对特定CU或其它块进行译码之后推导相依深度图估计时,使用相依深度图估计来更新基本深度图估计,其可用以推导较晚存取单元中的另一相依视图的深度图估计。
本文描述的技术可通过避免不同视图的深度图估计之间的相依性来促进相依视图的独立解码。举例来说,用于一个相依视图的视图间运动预测或视图间残余预测的深度图估计将不取决于变形另一相依视图的深度图估计。因此,在经译码多视图视频数据中可用的各种视图的位流提取功能性可改善。
在根据本文描述的技术的一些实例中,多个相依视图中的每一者与相依深度视图估计相关联,所述相依深度视图估计可基于相对于基本视图的相依视图的纹理数据的译码而产生或更新。在此些实例中,相依深度图估计中的每一者可经变形到基本视图以产生多个基本深度图估计中的相应一者。每一相依深度图估计和相应基本深度图估计用于与多个相依视图中的相应一者相关联的深度图估计对。因此,与3D-HEVC的当前实施方案相反,共同基本深度图估计未由相依视图中的每一者共享。而是,根据本发明的技术,每一相依视图与包含相依深度图估计和基本深度图估计的相应深度图估计对相关联。
在根据本发明的一些实例中,视频译码器(例如,视频编码器20或视频解码器30)在基本视图中的非锚点图片的解码之后更新深度图估计对的基本深度图估计中的每一者。视频译码器可将经更新基本深度图估计变形到相应相依视图以产生经更新相依深度图估计。视频译码器可基于其经更新相依深度图估计来对相依视图的纹理数据进行视图间运动预测译码。在一些实例中,对于相依视图中的锚点图片,可停用视图间运动预测,而对于相依视图中的非锚点图片,启用视图间运动预测。
虽然图1中未图示,但在一些方面中,视频编码器20和视频解码器30可各自与音频编码器和解码器集成,且可包含适当的MUX-DEMUX单元或其它硬件和软件,以处置共同数据流或单独数据流中的音频和视频两者的编码。如果适用,那么在一些实例中,MUX-DEMUX单元可符合ITU H.223多路复用器协议,或例如用户数据报协议(UDP)等其它协议。
可将视频编码器20和视频解码器30各自实施为多种合适的编码器电路中的任一者,例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件,或其任何组合。当所述技术部分地以软件实施时,装置可将用于所述软件的指令存储在合适的非暂时性计算机可读媒体中,且使用一或多个处理器以硬件执行所述指令以执行本发明的技术。可将视频编码器20和视频解码器30中的每一者包含于一或多个编码器或解码器中,其中任一者可集成为相应装置中的组合式编码器/解码器(CODEC)的部分。
图2是说明相对于多个空间相邻(例如,邻近)块102A到102B和104A到104C块的实例性当前视频块100的概念图,用于当前块的空间运动向量预测符可从所述空间相邻块推导。空间相邻块102A到102B在当前块100的左边,且空间相邻块104A到104C在当前块100上方。在一些实例中,视频块100以及视频块102A到102B和104A到104C可为PU,如当前在开发的HEVC标准中一般界定。
空间相邻块102A到102B和104A到104C中的每一者与当前块100的空间关系可如下描述。使用亮度位置(xP,yP)来相对于当前图片的左上方样本指定当前块的左上方亮度样本。变量nPSW和nPSH表示亮度的当前块的宽度和高度。空间相邻块102A的左上方亮度样本为xP-1,yP+nPSH。空间相邻块102B的左上方亮度样本为xP-1,yP+nPSH-1。空间相邻块104A的左上方亮度样本为xP+nPSW,yP-1。空间相邻块104B的左上方亮度样本为xP+nPSW-1,yP-1。空间相邻块104C的左上方亮度样本为xP-1,yP-1。虽然相对于亮度位置来描述,但当前和参考块可包含色度分量。
空间相邻块102A到102B和104A到104C中的每一者可提供候选空间运动向量预测符(MVP),例如空间候选运动向量,以用于块100的例如根据合并模式或AVMP的运动向量预测译码。通常,视频译码器选择当前块100左边的空间相邻块102A到102B中的一者来提供第一空间MVP,称为块100的“mvA”。视频译码器随后选择当前块100上方的空间相邻块104A到104C中的一者来提供第二空间MVP,称为块100的“mvB”。
为了从空间相邻块102A到102B和104A到104C当中选择mvA和mvB,视频译码器可确定空间相邻块102A到102B和104A到104C中的哪一者可用。再次,视频译码器可为视频编码器(例如视频编码器20)或视频解码器(例如视频解码器30)。视频编码器和视频解码器均可以相同预定方式构造用于合并模式或AVMP的MVP候选列表,使得例如编码器可仅需要用信号发送到候选列表中的索引以用信号发送选定MVP。块102A到102B和104A到104C中的一些例如在所述块经帧内译码的情况下或在当前块100接近图片或切片边界而定位的情况下可能不可用于提供候选MVP。视频译码器可基于预定偏好、速率-失真优化(RDO)或其它因素从可用的空间相邻块102A到102B和104A到104C当中选择mvA和mvB。
在说明的实例中,空间相邻块102A到102B和104A到104C分别在块100的左边和上方。此布置是典型的,因为大多数视频译码器从图片的左上方以光栅扫描次序对视频块进行译码。因此,在此些实例中,空间相邻块102A到102B和104A到104C将通常在当前块100之前译码。然而在其它实例中,例如当视频译码器以不同次序对视频块进行译码时,空间相邻块102A到102B和104A到104C可位于当前块100的右边或下方。
图3是说明视频序列内的包含当前视频块100的实例性图片200A和时间参考图片200B的概念图。时间参考图片200B是在图片200A之前译码的图片。而且,假定时间参考图片200B和图片200A在同一视图内。时间参考图片200B不一定是在译码次序中紧邻于图片200A之前的图片,且可在显示次序中在图片200A之后。视频译码器可从多个可能的时间参考图片当中选择时间参考图片200B,且参考图片列表和参考图片索引值可指示将选择时间参考图片中的哪一者。举例来说,如果当前切片是B切片,那么视频译码器可对切片标头中的collocated_from_l0_flag进行译码以指示参考图片图片是来自RefPicList0还是RefPicList1。视频译码器还可对切片标头中的collocated_ref_idx进行译码以识别列表中的图片中的图片。
时间参考图片200B包含位于同一地点的块110,其相对于图片200A中当前块100的位置在图片200B中位于同一地点。时间参考图片200B还包含用于图片200A中的当前块100的时间参考块112。视频译码器可基于参考块112的预测参数来推导用于当前块100的TMVP。替代地,视频译码器可基于位于同一地点的块110的右下角分区中的PU的预测参数来推导用于当前块100的TMVP。大体上,在HEVC的命名中,视频译码器可使用右下方PU到含有与当前块100位于同一地点的PU的CU的运动信息或含有与当前块100位于同一地点的PU的CU的PU内的右下方PU的运动信息来预测当前块100的运动信息。
时间参考块112是位于同一地点的块110的空间相邻块。在说明的实例中,参考块112在位于同一地点的块110的右边和下方。在一些实例中,参考块可为含有位于同一地点的PU(例如,位于同一地点的块110)的CU的右下方PU,或含有位于同一地点的PU的CU的中心PU内的右下方PU。在其它实例中,参考块112可为位于同一地点的块110的任一空间相邻(例如,邻近)块。在一些实例中,视频译码器可替代于或除了位于同一地点的块的相邻块之外,从位于同一地点的块110推导用于当前块100的TMVP。
为了从时间参考图片200B中的多个候选当中选择用于当前块100的TMVP,视频译码器可确定哪些候选时间参考块可用。候选时间参考块中的一些例如在所述块经帧内译码的情况下或在位于同一地点的块110接近图片或切片边界而定位的情况下可能不可用于提供候选TMVP。如果一个以上TMVP候选可用,那么视频译码器可基于预定偏好、速率-失真优化(RDO)或其它因素来选择候选中的一者。对于合并模式或AMVP经识别为用于当前块的TMVP候选的运动向量可能需要基于时间位置按比例缩放,例如由当前图片和参考图片的图片次序计数(POC)值所反映。
图4是说明多个存取单元的图片的概念图,每一存取单元包含多个视图。特定来说,图4包含存取单元400A和400B,其各自可表示视频序列中的不同时间点(即,显示时间或输出时间)。虽然说明两个存取单元400A和400B,但视频数据可包含在序列中相对于存取单元400A向前和向后的许多额外存取单元,且存取单元400A和400B不需要为邻近或连续的存取单元。
包含存取单元400A和400B的视频数据为MVC视频数据,即包含共同场景的多个视图。图4说明两个视图V0和V1的图片。视频数据可包含图4中未图示的额外视图。
存取单元400A包含V1的图片200A。图片200A包含当前块100。存取单元400A可称为当前存取单元,V1可称为当前视图,且图片200A可称为当前图片。存取单元400A还包含V0的图片202A。V0可称为相对于V1的参考视图,且图片202A可称为相对于图片200A的视图间参考图片。存取单元400B包含V1的图片200B和V0的图片202B。V1的图片200B可称为用于图片200A的时间参考图片。
3D-HEVC中的最有效译码工具中的一者是视图间运动预测(IMP),其中相依视图中的块的运动参数是基于同一存取单元中的另一视图(即,参考视图)中的已经译码运动参数来预测或推断。为了包含视图间运动预测,用于3D-HEVC的AMVP模式以及合并模式已经以将IVMP(视图间运动向量预测符)候选添加到用于待译码块的MVP的候选列表的方式扩展。
为了在AVMP中推导用于当前块100的IVMP,视频译码器识别块100中的样本120A,以及视图间参考图片202A中的位于同一地点的样本120B。基于相对于视图间参考图片202A的图片200A的视差信息,视频译码器确定视差向量122。视差信息可从图片200A的深度图或其它深度信息推导。在图4说明的实例中,视频译码器从当前图片200A的深度图估计300A(例如,深度图估计图片(DMEP))推导视差信息。更特定来说,视频译码器基于深度图估计300A的对应于当前图片200A的块100中的样本120A的位置130A处的估计深度值来确定视差向量122。如本文例如相对于图5到9更详细描述,视频译码器可基于使另一图片(例如,参考(或基本)视图V0的参考图片202A)的深度图估计变形来推导相依视图V1的纹理图片200A的深度图估计300A。
基于视差向量122,视频译码器识别参考视图(V0)的视图间参考图片202A中的参考块124。如果用于当前块100的参考图片索引参考视图间参考图片202A,那么视频译码器将用于当前块100的IVMP设定为等于视差向量122,所述视差向量随后变为块100的所谓的视差运动向量。特定来说,视差运动向量指向图片202A中作为用于图片200A中的块100A的预测的参考块的块124。视差向量也可称为用于视图间运动预测的视差向量(DVIVMP),其为经构造且用于视图间运动预测的视差向量。
如果用于当前块100的当前参考图片索引参考存取单元400B中的时间参考图片200B,那么视频译码器确定参考块124是否是基于参考与当前参考索引相同的存取单元400B的运动向量而译码。在图4说明的实例中,参考块124是基于指向存取单元400B中的图片202B中的块128B的运动向量126B而译码。在此些情况下,视频译码器将用于当前块100的IVMP设定为等于指向V1的时间参考图片200B中的时间参考块128A的运动向量126A。运动向量126A对应于运动向量126B,例如所述运动向量的X、Y和其它值是相同的,但运动向量126A和126B参考与同一存取单元中的不同视图相关联的不同图片。在一些实例中,如果参考块124的运动向量指向与用于当前块100的参考图片索引不同的存取单元,那么视频译码器可将IVMP视为不可用于当前块100。
对于合并模式(和跳过模式)中的视图间运动向量预测,以给定次序调查参考图片列表的前两个参考索引。以与AMVP模式相同的方式推导针对参考索引0的运动向量候选。如果所推导运动向量有效,那么参考索引0和所推导运动向量用于所考虑的假设。否则,以相同方式测试参考索引1。如果其还导致无效运动向量,那么将运动假设标记为不可用。为了偏好时间预测,在第一索引参考视图间参考图片的情况下可反转测试参考索引的次序。如果所有潜在的运动假设均经标记为不可用,那么可不选择且在一些实例中无法选择视图间候选,即IVMP。
3D-HEVC中的另一译码工具是视图间残余预测。对于当前块100的视图间残余预测,可基于视差向量122识别残余参考块。视差向量122识别参考视图V0中的图片202A的块124,其在视图间残余预测的情况下充当残余参考块124。如上文论述,视频译码器可基于深度图估计300A的对应于当前图片200A的块100中的样本120A的位置130A处的估计深度值来确定视差向量122。如本文例如相对于图5到9更详细描述,视频译码器可基于使另一图片(例如,参考(或基本)视图V0的参考图片202A)的深度图估计变形来推导相依视图V1的纹理图片200A的深度图估计300A。
对于当前块100的视图间残余预测,基本上存在两种预测。当前块100的第一预测是相对于参考块,其可根据本文描述的技术中的任一者,例如时间或视图间运动预测。举例来说,当前块的第一预测可基于根据如上所述的视图间运动预测的参考块124的预测。当前块100的第二预测是基于参考块124的残余值(基于视差向量122而识别)的残余值的预测。对于视图间残余预测,从视频编码器用信号发送到视频解码器的残余值是在参考块和来自残余参考块的残余均从当前块减去之后的余数,例如在参考块124和对参考块124进行译码之后的残余均从当前块100减去之后。以此方式,当前块100的残余通过视图间残余预测可相对于当前块与参考块之间的差而减少,且因此,经变换、逆变换、量化、熵译码和用信号发送以用于块100的译码的信息量可减少。
图5是说明如3D-HEVC中当前界定且根据本发明的技术用于视图间运动预测和/或视图间残余预测的深度图估计(例如,深度图估计300A)的产生之间的实例性差异的概念图。更特定来说,图5说明其中视频数据包含三个视图的实例:由V0表示的基本(参考)视图,第一相依(非基本)视图V1和第二相依(非基本)视图V2。在图5的实例中,三个视图的译码次序是:基本视图V0,相依视图V1,和相依视图V2。虽然图5的实例包含三个视图,但本发明的技术可应用于包含任一数目的视图的视频数据,包含任一数目的基本和参考视图。
图5说明视频流中在表示为T0和TN的两个不同时间点处的两个存取单元。存取单元中的每一者包含用于视图中的每一者的相应纹理图片。T0处的存取单元包含基本视图V0的图片202B、相依视图V1的图片200B和相依视图V2的图片204B。TN处的存取单元包含基本视图V0的图片202A、相依视图V1的图片200A和相依视图V2的图片204A。T0处的存取单元可为锚点存取单元或随机存取单元,且T0处的存取单元的纹理图片200B、202B和204B可称为锚点图片或随机存取图片。TN处的存取单元的纹理图片200A、202A和204A可称为非锚点图片或非随机存取图片,且TN处的存取单元可称为非锚点存取单元或非随机存取单元。
在图5的实例中,纹理图片中的每一者与一个估计深度图相关联。举例来说,T0处的基本视图V0的图片202B与基本深度图估计302B相关联,T0处的相依视图V1的图片200B与相依深度图估计300B相关联,且T0处的相依视图V2的图片204B与相依深度图估计304B相关联。类似地,TN处的基本视图V0的图片202A与基本深度图估计302A相关联,TN处的相依视图V1的图片200A与相依深度图估计300A相关联,且TN处的相依视图V2的图片204A与相依深度图估计304A相关联。
在随机存取单元中,例如根据3D-HEVC,锚点基本视图纹理图片(例如,图片202B)的所有块经帧内译码。通常,相依视图的锚点纹理图片(例如,图片200B和204B)的大多数块是使用DCP译码的,且剩余块经帧内译码。因此,如图5中说明,视频译码器(例如,视频编码器20或视频解码器30)使用DCP相对于基本视图V0的锚点图片202B的块对相依视图V1的锚点图片200B的块中的至少一些进行译码(402),且使用DCP相对于基本视图V0的锚点图片202B的块对相依视图V2的锚点图片204B的块中的至少一些进行译码(404)。
当对相依视图V1中的锚点图片200B进行译码时,其经帧内译码或在视图间运动预测和视图间残余预测经停用的情况下以DCP帧间译码,因为不存在深度信息(例如,相依深度图估计300B)可用。在对相依视图V1中的锚点图片200B进行译码之后,视频译码器可例如通过将相依深度图估计300B中对应于纹理图片200B的经视差补偿块的块的所有深度样本设定为等于所推导深度值,来将用于DCP的经译码视差向量转换为深度值(406)。也就是说,视频译码器可从对应视差向量计算深度值以产生深度图估计300B的块。通常,相对小视差向量对应于在与屏幕(有时称为汇聚平面)相同的深度处显示的对象,而相对大视差向量对应于在相对远离屏幕的位置(例如,在屏幕前方远处或在屏幕后方远处,或汇聚平面)显示的对象。以此方式,视频译码器可基于V1中的锚点图片200B的经译码运动信息来产生或更新相依深度图估计300B。
根据当前3D-HEVC实施方案,视频译码器可利用深度图估计300B用于对相依视图V1中的随后纹理图片(例如,非锚点纹理图片300A)进行译码且对V2中的纹理图片(例如,纹理图片204B和204A)进行译码。举例来说,视频译码器可将相依深度图估计300B变形到基本视图V0以产生基本深度图估计302B(408),且随后将基本深度图估计302B变形到相依视图V2以产生相依深度图估计304B(410)。将单个共同基本深度图估计302B变形到第二相依视图V2以产生相依深度图估计304B(410)在图5中以虚线箭头说明,以指示共同基本深度图估计到额外相依视图的此变形不是根据本发明的技术来执行。
深度图估计的变形可包含基于相机参数或指示视图之间的空间关系的其它信息,例如通过应用变换来修改深度图估计的深度值。变形可另外包含已知的技术,例如应用孔填充算法。用于变形的实例性技术在本文参考的w12559中描述,例如w12559的章节3.2.1内。
在一个实例中,3D变形过程涉及将来自第一视图的点投影到第二视图的图像平面中。为此,需要内在相机参数A和外在相机参数E=[R|t]。内在矩阵A将3D相机坐标变换为其2D图像坐标。外在矩阵E=[R|t]将世界坐标变换为相机坐标,其由旋转矩阵R和平移向量t组成。两步骤变形可以两个等式公式化,例如以下等式(1)和(3)。
使用第一视图的深度将第一视图中的第一像素(ur,vr)变形到世界坐标(Xw,Yw,Zw):
X w Y w Z w = R 3 × 3 , r - 1 z r A 3 × 3 , r - 1 u r v r 1 - t 3 × 1 , r - - - ( 1 )
其中下标r指示第一视图,且zr是第一视图中在位置(ur,vr)处的深度值,如下计算
z = 1 v 255 · ( 1 Z near - 1 Z far ) + 1 Z far - - - ( 2 )
其中v是深度图值的8位强度。
应注意,假定值z、Znear和Zfar为全正或全负值。
随后将3D点映射到第二视图:
z v u v v v 1 = A 3 × 3 , v R 3 × 3 , v X w Y w Z w + t 3 × 1 , v - - - ( 3 )
其中下标v指代虚拟视图。
如果多个像素变形到第二视图中的同一位置,那么最靠近相机的像素获胜,因此前景像素将遮挡背景像素。
视频译码器可使用视图间运动预测和/或视图间残余预测以及例如上文相对于图4描述的相依深度图估计304B,相对于基本视图V0的锚点纹理图片202B对相依视图V2的锚点纹理图片204B进行译码(412)。例如使用视图间运动预测和/或视图间残余预测与相依深度图估计304B相对于基本纹理图片202B对相依纹理图片204B的译码在图5中以虚线箭头说明,以指示相依视图中的锚点图片的此视图间运动预测和/或视图间残余预测不是根据本发明的实例性技术来执行。在根据本发明的技术的一些实例中,视图间运动预测和视图间残余预测针对对相依视图中的锚点图片进行译码而停用,且针对对相依视图中的非锚点图片进行译码而启用。
在相依视图V2中的锚点纹理图片204B经完全译码之后,视频译码器可使用经译码运动信息来更新相依深度图估计304B(414)。视频译码器可根据用以对纹理图片204B的空间对应块进行译码的预测类型基于逐块基础来更新相依深度图估计304B。举例来说,对于使用DCP译码的纹理图片204B的块,视频译码器可通过将用于DCP的视差向量转换为深度值来获得深度图样本。总之,如上所述,图5中说明的在三个视图的情况下用于锚点图片的当前3D-HEVC深度图估计过程要求深度图估计更新两次(406,414),且变形两次(408,410)。虽然图5中未说明,但在其中视频数据包含额外相依视图的实例中,视频译码器可将相依深度图估计304B变形回到基本视图V0以更新基本深度图估计302B,且随后将基本深度图估计302B变形到下一相依视图以产生另一相依深度图估计以用于额外相依视图的锚点纹理图片的视图间运动预测和/或视图间残余预测。
时间TN处的存取单元包含非锚点纹理图片200A、202A和204A,其可为(但不一定为)每一视图中的第一非锚点图片。第一非锚点图片可能不在邻近于T0的存取单元中,且可改为例如在T16处的存取单元中。视频译码器(例如,视频编码器20或视频解码器30)可使用帧内预测或时间帧间预测(例如,MCP)对基本视图V0的非锚点纹理图片202A的块进行译码(例如,编码或解码)。视频译码器可随后基于对基本视图V0的纹理图片202A的译码而更新基本深度图估计302B以产生基本深度图估计302A(416)。
举例来说,对于使用MCP译码的纹理图片202A的每一块,视频译码器可应用相关联运动向量以确定深度图估计302A的空间对应块的深度值。特定来说,视频译码器可应用运动向量来识别先前基本深度图估计(例如,基本深度图估计302B)中的参考块,且基于先前基本深度图估计的参考块中的深度值来推导深度图估计302A的块的深度值。用于对纹理图片进行译码的运动向量可在用以更新深度图估计之前舍入到样本精度。对于经帧内译码的纹理图片202A的块,视频译码器可例如根据用以对纹理图片202A的空间对应块进行译码的帧内预测模式,通过从基本深度图估计302A的相邻块的空间预测来确定基本深度图估计302A的空间对应块的深度值。
视频译码器可随后将与基本视图V0中的非锚点纹理图片202A相关联的经更新基本深度图估计302A变形到相依视图V1以产生相依深度图估计300A(418)。视频译码器可随后例如以上文相对于图4描述的方式,使用相依深度图估计300A用于相对于基本视图V0的纹理图片202A对相依视图V1的纹理图片200A的视图间运动预测和/或视图间残余预测译码(420)。在对相依视图V1的纹理图片200A的译码之后,视频译码器可基于纹理图片200A的译码来更新相依深度图估计300A(422)。
视频译码器可根据用以对纹理图片200A的空间对应块进行译码的预测类型基于逐块基础来更新相依深度图估计300A。举例来说,对于使用DCP译码的纹理图片200B的块,视频译码器可通过将用于DCP的视差向量转换为深度值来获得深度图样本。对于使用MCP译码的纹理图片200A的每一块,视频译码器可应用相关联运动向量以确定深度图估计300A的空间对应块的深度值。特定来说,视频译码器可应用运动向量来识别用于相依视图V1的先前相依深度图估计(例如,相依深度图估计300B)中的参考块,且基于先前基本深度图估计的参考块中的深度值来推导深度图估计300A的块的深度值。用于对纹理图片进行译码的运动向量可在用以更新深度图估计之前舍入到样本精度。对于经帧内译码的纹理图片200A的块,视频译码器可例如根据用以对纹理图片200A的空间对应块进行译码的帧内预测模式,通过从基本深度图估计300A的相邻块的空间预测来确定基本深度图估计300A的空间对应块的深度值。
视频译码器可随后存储经更新相依深度图估计300A与经重构非锚点纹理图片200A,以及将相依视图V1的经更新相依深度图估计300A变形到基本视图V0以更新基本视图V0的基本深度图估计302A(424)。视频译码器可随后将基本视图V0的经更新基本深度图估计302A变形到相依视图V2以产生相依深度图估计304A(426)。视频译码器可以上文相对于图4描述的方式,使用相依深度图估计304A用于相对于基本视图V0的非锚点纹理图片202A对相依视图V2的非锚点纹理图片204A的视图间运动预测和/或视图间残余预测译码(428)。视频译码器可随后以上文相对于相依深度图估计300A和纹理图片200A描述的方式,根据用以对纹理图片204A的空间对应块进行译码的预测类型例如基于逐块基础来更新相依深度图估计304A(430)。虽然图5中未说明,但在其中视频数据包含额外相依视图的实例中,视频译码器可将相依深度图估计304A变形回到基本视图V0以更新基本深度图估计302A,且随后将基本深度图估计302A变形到下一相依视图以产生另一相依深度图估计以用于额外相依视图的非锚点纹理图片的视图间运动预测和/或视图间残余预测。
对于所有随后的非锚点存取单元,重复相对于图5描述的实例性过程。在下一随机存取单元处,视图间运动参数预测和视图间残余预测可针对经译码的第一相依视图停用,且随后在对第一相依视图进行译码且再初始化用于第一相依视图的相依深度图估计之后启用,例如上文相对于相依视图V1和T0处的存取单元所述。
例如上文相对于图5描述的3D-HEVC中的深度图估计推导过程的当前设计可能存在问题。举例来说,甚至当例如通过停用从彼此的纹理预测来假设两个相依视图独立地解码时,以一个相依视图依赖于另一相依视图来进行正确译码的方式设计深度图估计。这导致缺乏位流提取功能性,例如共享同一基本视图的两个立体操作点。举例来说,每当例如在第一非基本视图中例如以DCP对特定CU进行译码之后推导深度图信息时,使用所述信息来更新基本视图深度,其可用以推导较晚存取单元中的另一非基本视图的深度信息。
根据本发明中描述的实例,在本发明中建议涉及基于HEVC(作为非限制性实例)的多视图视频译码中的深度图估计的技术。本发明的技术可适用于包含至少一个共同视图(可为基本视图)和各自取决于共同视图的N(其中N>1)个相依视图的视频数据。
在本发明中描述的一些实例性技术中,相依视图可能不取决于任何其它相依视图。当多个(N)相依视图存在时,对于存取单元的每一相依视图,针对所述相依视图产生一个相依深度图估计,且产生与基本视图相关联且对应于特定相依深度图估计的一个基本深度图估计。相依视图中的相依深度图估计和所述多个基本深度图估计中与相依视图相关联的所述一者形成与相依视图相关联的深度图估计对。每一深度图估计对是独立于任何其它深度图估计对而产生和更新。根据本发明当在视频数据中存在多个相依视图时深度图估计对的深度图估计的产生和更新可类似于当仅一个基本视图和一个相依视图经译码时根据当前设计3D-HEVC设计的深度图估计的产生和更新。
根据本发明的技术,对于相依视图中的锚点图片,可停用视图间运动预测和视图间残余预测。在对第i(i从1到N)相依视图中的锚点图片进行解码之后,基于经译码信息,更新与第i相依视图相关联的相依深度图估计。随后将经更新相依深度图估计变形到共同视图以产生深度图估计对中的基本深度图估计。
对于基本视图中的非锚点图片,在对基本视图中的非锚点图片进行解码之后更新N个深度图估计对的所有基本深度图估计。对于相依视图中的非锚点图片,启用视图间运动预测。为了对第i相依视图中的非锚点图片进行解码,首先将同一存取单元中的第i深度图估计对的基本深度图估计变形到当前相依视图以产生第i相依视图的相依深度图估计。在对第i相依视图中的非锚点图片进行解码之后,更新相依深度图估计且将其变形回到共同视图以更新相关联基本深度图估计。深度图估计的分辨率可与纹理图片相同,或可不同于纹理视图的分辨率。在一些实例中,相依深度图估计的分辨率可不同于基本深度图估计的分辨率。
图6是说明根据本发明的技术用于视图间运动预测和/或视图间残余预测的深度图估计的产生的实例的概念图。更特定来说,图6说明其中如同图5的实例的情况视频数据包含三个视图的实例:由V0表示的基本(参考)视图,第一相依(非基本)视图V1和第二相依(非基本)视图V2。在图6的实例中,如同图5的实例的情况,三个视图的译码次序是:基本视图V0,相依视图V1,和相依视图V2。虽然图6的实例包含三个视图,但本发明的技术可应用于包含任一数目的视图的视频数据,包含任一数目的基本和参考视图。
类似于图5的实例,图6说明视频流中在表示为T0和TN的两个不同时间点处的两个存取单元,其各自包含视图中的每一者的相应纹理图片。T0处的存取单元包含基本视图V0的图片202B、相依视图V1的图片200B和相依视图V2的图片204B。TN处的存取单元包含基本视图V0的图片202A、相依视图V1的图片200A和相依视图V2的图片204A。T0处的存取单元可为随机存取单元,且随机存取单元的纹理图片200B、202B和204B可称为锚点图片。T0处的存取单元的纹理图片200A、202A和204A可称为非锚点图片。
在图6的实例中,类似于图5的实例,相依视图的纹理图片中的每一者与一个深度图估计相关联。然而,不同于图5的实例,在图6的实例中,存在针对相依视图中的每一者的相应基本深度视图估计。因此,T0处基本视图V0的图片202B与从相依视图V1的基本深度图估计300B推导的基本深度图估计302B以及从相依视图V2的基本深度图估计304B推导的基本深度图估计303B相关联。类似地,TN处基本视图V0的图片202A与和相依视图V1的基本深度图估计300A配对的基本深度图估计302A以及和相依视图V2的基本深度图估计304A配对的基本深度图估计303A相关联。在图6的实例中,视频译码器针对每一相依视图产生和更新包含基本深度图估计和相依深度图估计的深度图估计对。
作为根据本发明的技术对锚点纹理图片进行译码的实例,如同图5的实例中的情况,视频译码器在图6的实例中对基本视图V0的锚点纹理图片202B的块进行帧内预测译码,例如视频编码器20进行编码或视频解码器30进行解码。视频译码器可使用DCP相对于基本视图的图片202B对相依视图V1和V2的锚点纹理图片200B和204B的块进行译码(402,404),或可对所述块中的一些进行帧内译码。不同于当前HEVC实施方案,针对对所有相依视图的锚点纹理图片(例如,相依视图V1和V2的锚点纹理图片200B和204B两者)进行译码停用视图间运动预测和/或视图间残余预测。
在对相依视图V1中的锚点图片200B进行译码之后,视频译码器可例如通过将相依深度图估计300B中对应于纹理图片200B的经视差补偿块的块的所有深度样本设定为等于所推导深度值,来将用于DCP的经译码视差向量转换为深度值(406),且将相依深度图估计300B变形到基本视图V0以产生基本深度图估计302B(408),如图5的实例中的情况。然而,视频译码器不会随后将基本深度图估计302B变形到相依视图V2以产生相依深度图估计304B(图5的410)。
而是,视频译码器例如以基于纹理图片200B的译码针对相依视图V1的相依深度图300B所完成的方式,基于用以对纹理图片204B进行DCP译码的视差信息来产生相依视图V2的相依深度图估计304B(414)。视频译码器可随后将相依深度图估计300B变形到基本视图V0以产生基本深度图估计303B(500)。因此,根据本发明的技术,视频译码器可针对每一相依视图产生深度图估计对,且避免相依视图之间的译码相依性。与锚点图片202B相关联的基本深度图估计302B和303B可用以更新与基本视图中的非锚点纹理图片相关联的对应基本深度图估计。
作为根据本发明的技术对锚点纹理图片进行译码的实例,如同图5的实例中的情况,视频译码器对基本视图V0的非锚点纹理图片202进行帧内预测或MCP译码。视频译码器可随后基于基本视图V0的纹理图片202A的译码而更新基本深度图估计302B和303B以产生基本深度图估计302A和303A(416,502)。举例来说,对于使用MCP译码的纹理图片202A的每一块,视频译码器可应用相关联运动向量以确定深度图估计302A和303A中的每一者的空间对应块的深度值。特定来说,视频译码器可应用运动向量来识别先前基本深度图估计(例如,基本深度图估计302B)中的参考块,且基于先前基本深度图估计的参考块中的深度值来推导深度图估计302A和303A的块的深度值。用于对纹理图片进行译码的运动向量可在用以更新深度图估计之前舍入到样本精度。对于经帧内译码的纹理图片202A的块,视频译码器可例如根据用以对纹理图片202A的空间对应块进行译码的帧内预测模式,通过从基本深度图估计302A的相邻块的空间预测来确定基本深度图估计302A的空间对应块的深度值。视频译码器可随后将基本深度图估计302A变形到相依视图V1以产生相依深度图估计300A(418),且将基本深度图估计303A变形到相依视图V2以产生相依深度图估计304A(504)。根据本发明的技术,用于第二相依视图V2的相依深度图估计304A的产生不取决于第一相依视图V1的深度图估计300A或纹理图片200A的译码。以此方式,本发明的技术可避免相依视图之间的相依性。
根据本发明的技术,可针对对相依视图的非锚点纹理图片进行译码启用视图间运动预测和/或视图间残余预测。因此,在图6的实例中,视频译码器可使用相依深度图估计300A用于相对于基本视图V0的纹理图片202A对相依视图V1的纹理图片200A的视图间运动预测和/或视图间残余预测译码(420)。视频译码器可类似地使用相依深度图估计304A用于相对于基本视图V0的纹理图片202A对相依视图V2的纹理图片204A的视图间运动预测和/或视图间残余预测译码(506)。当相依视图纹理图片经译码时,视频译码器可基于相依视图纹理图片的译码更新相依深度图估计300A和304A(422,508)。
视频译码器可根据用以对纹理图片200A和204A的空间对应块进行译码的预测类型基于逐块基础来更新相依深度图估计300A和304A。举例来说,对于使用DCP译码的相依纹理图片的块,视频译码器可通过将用于DCP的视差向量转换为深度值来获得深度图样本。对于使用MCP译码的纹理图片的每一块,视频译码器可应用相关联运动向量以确定深度图估计的空间对应块的深度值。特定来说,视频译码器可应用运动向量来识别相依视图的先前相依深度图估计中的参考块,且基于相依视图的先前基本深度图估计的参考块中的深度值来推导相依视图的深度图估计的块的深度值。用于对纹理图片进行译码的运动向量可在用以更新深度图估计之前舍入到样本精度。对于经帧内译码的相依视图纹理图片200A和204A的块,视频译码器可例如根据用以对纹理图片的空间对应块进行译码的帧内预测模式,通过从基本深度图估计300A和304A的相邻块的空间预测来确定基本深度图估计300A和304A的空间对应块的深度值。
视频译码器可随后存储经更新相依深度图估计300A和304A与经重构非锚点纹理图片200A和204A。视频译码器还可将相依视图V1的经更新相依深度图估计300A变形到基本视图V0以更新基本视图V0的基本深度图估计302A(424),且将相依视图V2的经更新相依深度图估计304A变形到基本视图V0以更新基本视图V0的基本深度图估计303A(510)。因此,根据本发明的技术,视频译码器基于相应的相依深度图估计独立地更新每一深度图估计对的基本深度图估计。
对于所有随后的存取点,可重复图6的实例说明的技术。在对基本视图纹理图片进行译码之后,使用所发射的运动参数通过MCP确定针对基本视图图片的N个基本深度图估计。将第i基本深度图估计变形到Vi且用于视图间运动预测和/或视图间残余预测。在对Vi的图片进行解码之后,使用实际使用的译码参数更新深度图估计,且将其变形回到基本视图。在下一随机存取单元处,可停用针对相依视图的视图间运动参数预测和/或视图间残余预测,且在对所述随机存取单元的第i非基本视图进行解码之后,如上所述再初始化深度图。
图7是说明根据本发明的用于深度图估计的产生的实例性技术的流程图。图7的实例性技术可由视频译码器采用,所述视频译码器可为视频编码器(例如视频编码器20)或视频解码器(例如视频解码器30)。
根据图7的实例性技术,视频译码器对基本视图中的图片的数据进行译码(例如,编码或解码)(600)。视频译码器可确定图片是锚点图片还是非锚点图片(602)。如果图片是锚点图片,那么视频译码器可停用相依视图锚点图片的视图间运动预测和/或视图间残余预测(604)。视频译码器可随后例如使用DCP对相依视图的锚点纹理图片进行译码(606)。也就是说,视频译码器可停用相依视图锚点图片的运动和/或残余信息的预测,但仍可使用视图间预测(本文也称为DCP)来预测相依视图锚点图片。视频译码器还可基于例如通过将用于DCP的视差向量转换为深度值的译码而产生相依视图中的每一者的相依深度图估计(608)。视频译码器可随后将相依深度图估计中的每一者变形到基本视图以产生多个基本深度图估计中的相应一者(610)。相依深度图估计和相应基本深度图估计可视为与相应相依视图相关联的深度图估计对。
对于非锚点图片(602的否),视频译码器可启用基本视图中的非锚点图片的视图间运动预测和/或视图间残余预测(612)。为了推导相依视图图片的视图间运动预测和/或视图间残余预测的相依深度图估计,视频译码器可基于基本视图的非锚点纹理图片的译码来更新基本深度图估计(614)。举例来说,视频译码器可将用以对纹理图片进行译码的预测信息应用于基本深度图估计以更新基本深度图估计。视频译码器可随后将基本深度图估计中的每一者变形到相应相依视图以产生相依视图中的每一者的相应相依深度图估计(616)。
视频译码器可随后对相依视图中的非锚点纹理图片进行译码(618)。因为根据本发明中描述的技术针对相依视图中的非锚点图片启用视图间运动预测和/或视图间残余预测,所以译码可包含相对于非锚点纹理图片基本视图的块对相依视图纹理图片的块的视图间运动预测和/或视图间残余预测。基于用以对相依视图中的纹理图片进行译码的预测参数,视频译码器可更新相应相依深度图估计(620)。视频译码器可随后将相依深度图估计变形回到基本视图以更新所述多个基本深度图估计中的相应者(622)。
图8是说明根据本发明的对纹理数据进行译码且产生锚点图片的深度图估计的实例性技术的流程图。图8的实例性技术可由视频译码器采用,所述视频译码器可为视频编码器(例如视频编码器20)或视频解码器(例如视频解码器30)。
根据图8的实例,视频译码器可对基本视图的纹理数据(例如,纹理图片)进行图片内译码(700)。视频译码器可随后参考基本视图中的纹理数据块对相依视图的纹理数据块进行DCP译码(702)。视频译码器可基于相依视图的纹理数据的译码产生相依视图中的每一者的多个相依深度图估计中的相应一者(704)。举例来说,视频译码器可基于用以对相依视图的纹理数据进行译码的视差向量推导相依深度图估计的深度值。视频译码器可随后将相依深度图估计中的每一者变形到基本视图以产生多个基本深度图估计中的相应一者(706)。
图9是说明根据本发明的对纹理数据进行译码且产生非锚点图片的深度图估计的实例性技术的流程图。图9的实例性技术可由视频译码器采用,所述视频译码器可为视频编码器(例如视频编码器20)或视频解码器(例如视频解码器30)。
根据图9的实例,视频译码器可应用图片内或MCP译码以对基本视图的纹理数据(例如,非锚点图片)的块进行译码(800)。如本文描述,视频译码器可基于用以对基本视图的纹理数据进行译码的预测参数来更新所述多个基本深度图估计中的每一者(802)。视频译码器可随后将基本深度图估计变形到其相应相依视图以产生相依视图的相依深度图估计(804)。
视频译码器可随后应用视图间运动预测和/或视图间残余预测以基于其相应相依深度图估计相对于基本视图的纹理数据对相依视图的例如非锚点图片的纹理数据进行译码(806)。视频译码器可随后使用本文例如相对于图6描述的技术基于用以对相依视图的纹理数据进行译码的预测参数来更新相依深度图估计(808)。视频译码器可随后将相依深度图估计中的每一者变形回到基本视图以产生多个经更新基本深度图估计中的相应一者(810)。
本文描述的用于产生和更新用于视图间运动预测和/或视图间残余预测译码的深度图估计的技术可由例如视频编码器20或视频解码器30等视频译码器执行。编码器和解码器均可产生深度图估计作为互逆的编码和解码过程的部分。举例来说,编码器和解码器均可利用视图间运动预测,其可包含运动向量预测符候选列表的IVMP候选的识别。编码器和解码器均可识别IVMP候选且以相同方式产生候选。编码器可用信号发送经由到列表中的索引从列表选择的候选。
图10是说明视频编码器20的实例的框图,所述视频编码器可实施本发明中描述的技术来产生和更新深度图估计以用于视图间运动预测和/或视图间残余预测译码。视频编码器20可经配置以执行本发明的技术中的任一者或全部,例如执行图6到9中说明的实例性技术中的任一者。
视频编码器20可执行视频切片内的视频块的帧内和帧间译码。帧内译码依赖于空间预测来减少或移除给定视频帧或图片内的视频中的空间冗余。帧间译码依赖于时间预测来减少或移除视频序列的邻近帧或图片内的视频中的时间冗余。帧内模式(I模式)可涉及若干基于空间的译码模式中的任一者。例如单向预测(P模式)或双向预测(B模式)等帧间模式可涉及若干基于时间的译码模式中的任一者。
如图10中所示,视频编码器20接收视频数据。在图10的实例中,视频编码器20预测处理单元1000、求和器1010、变换处理单元1012、量化单元1014、熵编码单元1016和参考图片存储器1024。预测处理单元1000包含运动估计单元1002、运动补偿单元1004和帧内预测单元1006。
针对视频块重构,视频编码器20还包含逆量化单元1018、逆变换单元1020以及求和器1022。还可包含解块滤波器(图10中未图示)以对块边界进行滤波以从经重构视频移除成块假象。如果需要,解块滤波器将通常对求和器1022的输出进行滤波。除了解块滤波器之外还可使用额外滤波器(环路内或环路后)。为了简明而未图示此些滤波器,但如果需要,则可对求和器1010的输出进行滤波(作为环路内滤波器)。
在编码过程期间,视频编码器20接收待译码的视频图片或切片。预测处理单元1000将图片或切片划分为多个视频块。运动估计单元1002和运动补偿单元1004相对于存储在参考图片存储器1024中的一或多个参考图片中的一或多个块执行对所接收视频块的帧间预测性译码,以提供时间或视图间预测。帧内预测单元1006或者可相对于与待译码的块相同的图片或切片中的一或多个相邻块执行对所接收视频块的帧内预测性译码,以提供空间预测。视频编码器20可执行多个译码遍次,(例如)以选择用于每一视频数据块的适当译码模式。
而且,预测处理单元1000可基于先前译码遍次中的先前分割方案的评估而将视频数据块分割为若干子块。举例来说,预测处理单元1000可最初将图片或切片分割为若干LCU,且基于速率-失真分析(例如,速率-失真优化)根据不同预测模式将所述LCU中的每一者分割为若干子CU。预测处理单元1000可产生指示LCU到子CU的分割的四叉树数据结构。四叉树的叶节点CU可包含一或多个PU和一或多个TU。
预测处理单元1000可(例如)基于错误结果而选择译码模式(帧内译码或帧间译码)中的一者,且将所得的经帧内译码或帧间译码的块提供到求和器1010以产生残余块数据,且提供到求和器1022以重构经编码块以用作存储在参考图片存储器1024中的参考图片的部分。预测处理单元1000还将例如运动向量、帧内模式指示符、分区信息、参考图片索引值、MVP候选列表索引值和其它此类语法信息等语法元素提供到熵编码单元1016以供视频解码器30用于对视频块进行解码,例如用于如本文描述的视图间运动预测。
预测处理单元1000(例如,运动估计单元1002和/或运动补偿单元1004)可执行本发明中描述的技术来产生和更新深度图估计以用于视图间运动预测和/或视图间残余预测译码。举例来说,预测处理单元1000(例如,运动估计单元1002和/或运动补偿单元1004)可执行图6到9的实例性技术中的任一者。运动估计单元1002与运动补偿单元1004可为高度集成的,但为了概念性目的而单独说明。
由运动估计单元1002执行的运动估计是产生运动向量或视差运动向量的过程,所述向量估计视频块的运动。运动向量或视差运动向量可指示当前图片内的当前视频块的当前PU相对于参考图片(例如,时间参考图片或视图间参考图片)内的预测性块的位移。预测性块为就像素差来说被发现紧密匹配待译码的块的块,所述像素差可通过绝对差和(SAD)、平方差和(SSD)或其它差量度来确定。在一些实例中,视频编码器20可计算存储在参考图片存储器1024中的参考图片的子整数像素位置的值。
举例来说,视频编码器20可内插参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此,运动估计单元1002可执行相对于全像素位置和分数像素位置的运动搜索,且输出具有分数像素精度的运动向量。运动估计单元1002可从参考图片列表(例如,列表0或列表1)选择参考图片,其识别存储在参考帧存储器1024中的一或多个参考图片。运动估计单元1002将所计算的运动向量或视差运动向量发送到熵编码单元1016和运动补偿单元1004。在本文描述的其中采用AVMP或合并模式的一些实例中,并非将所计算预测向量发送到熵编码单元,运动估计单元1002将到运动向量预测符候选列表中的索引和参考图片索引发送到熵编码单元。解码器可使用与编码器20相同的技术来构造候选运动向量预测符候选列表,且可基于由运动估计单元1002用信号发送的索引来选择运动向量预测符,所述运动向量预测符可为用于视图间运动预测的IVMP。
由运动补偿单元1004执行的运动补偿可涉及基于由运动估计单元1002确定的预测向量而取得或产生预测性块。再次,在一些实例中,运动估计单元1002与运动补偿单元1004可在功能上集成。在接收到当前视频块的PU的预测向量后,运动补偿单元1004可即刻在参考图片列表中的一者中定位预测向量指向的预测性块。求和器1010通过从正经译码的当前视频块的像素值减去预测性块的像素值从而形成像素差值,来形成残余视频块。大体上,运动估计单元1002执行相对于亮度分量的运动估计,且运动补偿单元1004使用基于亮度分量计算的预测向量用于色度分量和亮度分量两者。
作为对由运动估计单元1002和运动补偿单元1004执行的帧间预测的替代,帧内预测单元1006可帧内预测当前块。特定来说,帧内预测单元1006可确定使用帧内预测模式来编码当前块。在一些实例中,帧内预测单元1006可(例如)在单独的编码遍次期间使用各种帧内预测模式来编码当前块,且帧内预测单元1006可从所测试的模式选择将使用的适当的帧内预测模式。
举例来说,帧内预测单元1006可使用针对各种经测试的帧内预测模式的速率-失真分析计算速率-失真值,且在经测试模式当中选择具有最好的速率-失真特性的帧内预测模式。速率-失真分析一般确定经编码块与经编码以产生所述经编码块的原始未经编码块之间的失真(或错误)的量以及用以产生经编码块的位率(即,位的数目)。帧内预测单元1006可从失真和速率计算各种经编码块的比率,以确定哪一帧内预测模式展现块的最好的速率-失真值。
在为块选择帧内预测模式之后,帧内预测单元1006可将指示块的所选择帧内预测模式的信息提供到熵编码单元1016。熵编码单元1016可对指示选定帧内预测模式的信息进行编码以供视频解码器30用于对视频块进行解码。视频编码器20可在所发射位流中包含配置数据,其可包含多个帧内预测模式索引表和多个经修改帧内预测模式索引表(也称为码字映射表)、各种块的编码上下文的定义,以及将用于所述上下文中的每一者的最可能帧内预测模式、帧内预测模式索引表和经修改帧内预测模式索引表的指示。
视频编码器20通过从正译码的原始视频块减去来自预测模块1001的预测数据而形成残余视频块。求和器1010表示执行此减法运算的一或多个组件。变换处理单元1012将变换(例如,离散余弦变换(DCT)或概念上类似的变换)应用于残余块,从而产生包括残余变换系数值的视频块。变换处理单元1012可执行概念上类似于DCT的其它变换。也可使用小波变换、整数变换、子带变换或其它类型的变换。在任何状况下,变换处理单元1012将变换应用于残余块,从而产生残余变换系数的块。变换可将残余信息从像素值域转换到变换域,例如频域。变换处理单元1012可将所得变换系数发送到量化单元1014。
量化单元1014量化变换系数的值以进一步减小位率。量化过程可减少与系数中的一些或全部相关联的位深度。可通过调整量化参数来修改量化程度。在一些实例中,量化单元1014可随后执行对包含经量化变换系数的矩阵的扫描。替代地,熵编码单元1016可执行扫描。
在量化之后,熵编码单元1016对经量化变换系数进行熵译码。举例来说,熵编码单元1016可执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码,或另一熵译码技术。在基于上下文的熵译码的情况下,上下文可基于相邻块。在通过熵编码单元1016熵译码之后,可将经编码位流发射到另一装置(例如,视频解码器30)或加以存档以供稍后发射或检索。
逆量化单元1018和逆变换单元1020分别应用逆量化和逆变换,以在像素域中重构残余块,且随后将残余添加到对应预测性块以重构经译码块,例如以供稍后用作参考块。运动补偿单元1004可通过将残余块加到参考图片存储器1024的参考图片中的一者的预测性块而计算参考块。运动补偿单元1004也可将一或多个内插滤波器应用于经重构的残余块,以计算用于运动估计中的子整数像素值。求和器1022将经重构的残余块加到由运动补偿单元1004产生的经运动补偿预测块,以产生经重构的视频块以用于存储在参考图片存储器1024中。经重构视频块可由运动估计单元1012和运动补偿单元1014用作参考块,以例如使用本文描述的运动向量预测和视图间译码技术对后续图片中的块进行帧间译码。
图11是说明视频解码器30的实例的框图,所述视频编码器可实施本发明中描述的技术来产生和更新深度图估计以用于视图间运动预测和/或视图间残余预测译码。视频解码器30可经配置以执行本发明的技术中的任一者或全部,例如执行图6到9中说明的实例性技术中的任一者。
在图11的实例中,视频解码器30包含熵解码单元1040、预测处理单元1041、逆量化单元1046、逆变换单元1048、参考图片存储器1052以及求和器1050。预测处理单元1041包含运动补偿单元1042和帧内预测单元1044。在一些实例中,视频解码器30可执行与相对于视频编码器20(图10)所述的编码遍次大体上互逆的解码遍次。运动补偿单元1042可基于预测向量或基于从熵解码单元1040接收的参考图片和运动向量预测符候选列表索引来产生预测数据。帧内预测单元1044可基于从熵解码单元1040接收的帧内预测模式指示符来产生预测数据。
在解码过程期间,视频解码器30从视频编码器20接收表示经编码视频切片的视频块和相关联语法元素的经编码视频位流。视频解码器30的熵解码单元1000对位流进行熵解码以产生经量化系数、预测向量、参考图片和运动向量预测符候选列表索引、帧内预测模式指示符和其它语法元素,其经转发到预测处理单元1041。视频解码器30可在视频切片层级和/或视频块层级处接收语法元素。
当视频切片经译码为经帧内译码(I)切片时,帧内预测单元1044可基于用信号发送的帧内预测模式和来自当前图片的先前经解码块的数据而产生当前视频切片的视频块的预测数据。当视频切片经译码为经帧间译码(即,B、P或GPB)切片时,运动补偿单元1042基于预测向量或参考图片和MVP候选列表索引以及从熵解码单元1040接收的其它语法元素而产生当前视频切片的视频块的参考块。参考块可从参考图片存储器1052内的时间或视图间参考图片中的一者产生。参考图片可在由视频解码器30使用默认构造技术构造的参考图片列表(例如,列表0和列表1)中的一者中列出。
预测处理单元1041(例如,运动补偿单元1042)可执行所述技术中的任一者来产生和更新深度图估计以用于本文描述的视图间运动预测和/或视图间残余预测译码。举例来说,预测处理单元1041(例如,运动补偿单元1042)可执行图6到9说明的实例性技术中的任一者。
运动补偿单元1042也可执行基于内插滤波器的内插。运动补偿单元1042可使用在视频块的编码期间由视频编码器20使用的内插滤波器来计算参考块的子整数像素的经内插值。在此情况下,运动补偿单元1042可根据所接收语法元素确定由视频编码器20使用的内插滤波器且使用内插滤波器来产生预测性块。
逆量化单元1046逆量化(即,解量化)在位流中提供且由熵解码单元1040解码的经量化变换系数。逆量化过程可包含针对视频切片中的每一视频块使用由视频解码器30计算出的量化参数QPY来确定量化程度和(同样)应应用的逆量化的程度。逆变换单元1048将逆变换(例如,逆DCT、逆整数变换或概念上类似的逆变换过程)应用于变换系数,以便在像素域中产生残余块。
在运动补偿单元1042产生当前视频块的预测性块之后,视频解码器30通过将来自逆变换单元1048的残余块与由运动补偿单元1042产生的对应预测性块进行求和而形成经解码视频块。求和器1050表示执行此求和运算的一或多个组件。如果需要,那么还可应用解块滤波器以对经解码块进行滤波以便移除成块假象。也可使用其它环路滤波器(译码环路中或在译码环路之后)来平滑像素转变或另外改善视频质量。随后将给定图片中的经解码视频块存储在参考图片存储器1052中,所述参考图片存储器存储用于后续运动补偿的参考图片。参考图片存储器1052还可存储经解码视频以用于稍后呈现在显示装置(例如图1的显示装置32)上。
应认识到,取决于实例,本文描述的技术中的任一者的某些动作或事件可以不同顺序执行,可相加、合并或完全省去(例如,并非所有描述的动作或事件对于所述技术的实践都是必要的)。而且,在某些实例中,动作或事件可例如通过多线程处理、中断处理或多个处理器同时执行,而不是循序地执行。
在一或多个实例中,所描述功能可以硬件、软件、固件或其任一组合实施。如果以软件来实施,那么功能可作为一或多个指令或代码存储于计算机可读媒体上或经由计算机可读媒体传输。计算机可读媒体可包含计算机数据存储媒体或通信媒体两者,所述通信媒体包含促进计算机程序从一处转移到另一处的任何媒体。数据存储媒体可为可由一或多个计算机或者一或多个处理器存取以检索指令、代码和/或数据结构以用于实施本发明中描述的技术的任何可用媒体。举例来说且并非限制,计算机可读媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器,或可用以载运或存储呈指令或数据结构的形式的所要程序代码且可由计算机存取的任何其它媒体。而且,将任何连接恰当地称为计算机可读媒体。举例来说,如果使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)或例如红外线、无线电和微波等无线技术从网站、服务器或其它远程源发射软件,那么同轴电缆、光纤电缆、双绞线、DSL或例如红外线、无线电和微波等无线技术包含于媒体的定义中。如本文所使用,磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软磁盘和蓝光光盘,其中磁盘通常以磁性方式再生数据,而光盘用激光以光学方式再生数据。以上各项的组合也应包含在计算机可读媒体的范围内。
可通过例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路等一或多个处理器来执行代码。因此,如本文使用的术语“处理器”可指代前述结构或适于实施本文所述的技术的任何其它结构中的任一者。另外,在一些方面中,可将本文描述的功能性提供于经配置以用于编码和解码的专用硬件和/或软件模块内,或并入于组合式编解码器中。而且,可将所述技术完全实施于一或多个电路或逻辑元件中。
本发明的技术可在广泛多种装置或设备中实施,包含无线手持机、集成电路(IC)或一组IC(例如,芯片组)。本发明中描述各种组件、模块或单元以强调经配置以执行所揭示技术的装置的功能方面,但未必需要通过不同硬件单元来实现。而是如上文所述,各种单元可组合于编解码器硬件单元中,或通过互操作性硬件单元(包含如上文所述的一或多个处理器)的集合结合合适的软件和/或固件来提供。
已描述各种实例。这些和其它实例在所附权利要求书的范围内。

Claims (53)

1.一种对视频数据进行译码的方法,所述视频数据包括至少一个基本视图和多个相依视图,其中所述多个相依视图取决于所述基本视图,所述方法包括:
对于所述相依视图中的每一者,相对于存取单元的所述基本视图的纹理数据使用所述相依视图的视差运动信息对所述存取单元的所述相依视图的纹理数据进行译码;
对于所述相依视图中的每一者,基于所述相依视图的所述视差运动信息产生所述存取单元的相依深度图估计;以及
将所述相依深度图估计中的每一者变形到所述基本视图以产生所述存取单元的多个基本深度图估计中的相应一者,其中所述相依深度图估计中的每一者和所述相应基本深度图估计形成所述存取单元的多个深度图估计对中的相应一者且与所述多个相依视图中的相应一者相关联。
2.根据权利要求1所述的方法,其中所述深度图估计中的每一者包括深度图估计图片DMEP。
3.根据权利要求1所述的方法,其中所述相依视图中的每一者不取决于所述相依视图中的任一其它者。
4.根据权利要求1所述的方法,其中所述视差运动信息包括用于视差补偿预测DCP的视差向量,且产生相依深度图估计包括将所述视差向量转换为深度值。
5.根据权利要求1所述的方法,其中所述存取单元包括第一存取单元,所述方法进一步包括:
对第二存取单元的所述基本视图的纹理数据进行译码;以及
基于所述第二存取单元的所述基本视图的所述纹理数据的所述译码来更新所述多个基本深度图估计中的每一者。
6.根据权利要求5所述的方法,
其中对所述第二存取单元的所述基本视图的纹理数据进行译码包括使用图片内预测或运动补偿预测MCP中的至少一者对所述纹理数据进行译码,且
其中基于所述译码更新所述第二存取单元的所述多个基本深度图估计中的每一者针对所述基本深度图估计中的每一者包括:
对于所述基本深度图估计的对应于所述第二存取单元的所述基本视图的所述纹理数据的使用图片内预测译码的块的块,应用所述图片内预测来从所述基本深度图估计的一或多个其它块推导所述基本深度图估计的所述块;以及
对于所述基本深度图估计的对应于所述第二存取单元的所述基本视图的所述纹理数据的使用MCP译码的块的块,应用所述MCP来从先前存取单元的所述基本深度图估计的先前版本的一或多个块推导所述基本深度图估计的所述块。
7.根据权利要求5所述的方法,其针对所述相依视图中的每一者进一步包括:
将所述多个基本深度图估计中的相应一者变形到所述相依视图以产生相应相依深度图估计;以及
基于所述相应相依深度图估计相对于所述第二存取单元的所述基本视图的所述纹理数据对所述第二存取单元的所述相依视图的纹理数据进行译码。
8.根据权利要求7所述的方法,其中基于所述相应相依深度图估计相对于所述第二存取单元的所述基本视图的所述纹理数据对所述第二存取单元的所述相依视图的所述纹理数据进行译码包括在视图间运动预测或视图间残余预测中的至少一者经启用的情况下相对于所述第二存取单元的所述基本视图的所述纹理数据对所述第二存取单元的所述相依视图的所述纹理数据进行译码。
9.根据权利要求7所述的方法,其针对所述相依视图中的每一者进一步包括:
基于所述第二存取单元的所述相依视图的所述纹理数据的所述经译码信息来更新所述相应相依深度图估计;以及
将所述相应相依深度图估计变形回到所述基本视图以更新所述多个基本深度图估计中的所述相应一者。
10.根据权利要求9所述的方法,
其中对所述第二存取单元的所述相依视图的纹理数据进行译码包括使用图片内预测、运动补偿预测MCP或视差补偿预测DCP中的至少一者对所述纹理数据进行译码,且
其中更新所述相应相依深度图估计包括:
对于所述相依深度图估计的对应于所述第二存取单元的所述相依视图的所述纹理数据的使用图片内预测译码的块的块,应用所述图片内预测来从所述相依深度图估计的一或多个其它块推导所述相依深度图估计的所述块;
对于所述相依深度图估计的对应于所述第二存取单元的所述相依视图的所述纹理数据的使用MCP译码的块的块,应用所述MCP来从先前存取单元的所述相依深度图估计的先前版本的一或多个块推导所述相依深度图估计的所述块;以及
对于所述相依深度图估计的对应于所述第二存取单元的所述相依视图的所述纹理数据的使用DCP译码的块的块,将用于所述DCP的视差向量转换为深度值。
11.根据权利要求9所述的方法,其中将所述基本深度图估计变形到所述相依视图以产生相依深度图估计、对所述相依视图的纹理数据进行译码、更新所述相依深度图估计以及将所述相依深度图估计变形回到所述基本视图以更新所述基本深度图估计包括:
针对所述多个相依视图中的每一者,独立地将所述基本深度图估计变形到所述相依视图以产生相依深度图估计、对所述相依视图的纹理数据进行译码、更新所述相依深度图估计以及将所述相依深度图估计变形回到所述基本视图以更新所述基本深度图估计。
12.根据权利要求5所述的方法,其中第一存取单元包括所述视图中的每一者的相应锚点图片,且所述第二存取单元包括所述视图中的每一者的相应非锚点图片。
13.根据权利要求12所述的方法,其中所述第一存取单元包括随机存取单元,所述锚点图片包括随机存取图片,所述第二存取单元包括非随机存取单元,且所述非锚点图片包括非随机存取图片。
14.根据权利要求1所述的方法,其中:
当所述存取单元包括所述视图中的每一者的相应锚点图片时,对所述相依视图的所述纹理数据进行译码包括停用所述存取单元的所述相依视图的所述纹理数据的视图间运动预测译码或视图间残余预测译码中的至少一者;且
当所述存取单元包括所述视图中的每一者的相应非锚点图片时,对所述相依视图的所述纹理数据进行译码包括启用所述存取单元的所述相依视图的所述纹理数据的视图间运动预测译码或视图间残余预测译码中的至少一者。
15.根据权利要求1所述的方法,其中所述深度图估计的分辨率与所述纹理数据的分辨率相同。
16.根据权利要求1所述的方法,其中所述深度图估计的分辨率与所述纹理数据的分辨率不同。
17.根据权利要求1所述的方法,其中所述相依深度图估计的分辨率与所述基本深度图估计的分辨率不同。
18.根据权利要求1所述的方法,其中对纹理数据进行译码包括以解码器对纹理数据进行解码,且产生和变形所述相依深度图估计包括以所述解码器产生和变形所述相依深度图估计。
19.根据权利要求1所述的方法,其中对纹理数据进行译码包括以编码器对纹理数据进行编码,且产生和变形所述相依深度图估计包括以所述编码器产生和变形所述相依深度图估计。
20.一种包括用于对视频数据进行译码的视频译码器的装置,所述视频数据包括至少一个基本视图和多个相依视图,其中所述多个相依视图取决于所述基本视图,所述视频译码器经配置以:
对于所述相依视图中的每一者,相对于存取单元的所述基本视图的纹理数据使用所述相依视图的视差运动信息对所述存取单元的所述相依视图的纹理数据进行译码;
对于所述相依视图中的每一者,基于所述相依视图的所述视差运动信息产生所述存取单元的相依深度图估计;以及
将所述相依深度图估计中的每一者变形到所述基本视图以产生所述存取单元的多个基本深度图估计中的相应一者,其中所述相依深度图估计中的每一者和所述相应基本深度图估计形成所述存取单元的多个深度图估计对中的相应一者且与所述多个相依视图中的相应一者相关联。
21.根据权利要求20所述的装置,其中所述深度图估计中的每一者包括深度图估计图六DMEP。
22.根据权利要求20所述的装置,其中所述相依视图中的每一者不取决于所述相依视图中的任一其它者。
23.根据权利要求20所述的装置,其中所述视差运动信息包括用于视差补偿预测DCP的视差向量,且所述视频译码器经配置以将所述视差向量转换为深度值以产生所述相依深度图估计。
24.根据权利要求20所述的装置,其中所述存取单元包括第一存取单元,且所述视频译码器进一步经配置以:
对第二存取单元的所述基本视图的纹理数据进行译码;以及
基于所述第二存取单元的所述基本视图的所述纹理数据的所述译码来更新所述多个基本深度图估计中的每一者。
25.根据权利要求24所述的装置,
其中所述视频译码器经配置以使用图片内预测或运动补偿预测MCP中的至少一者对所述第二存取单元的所述基本视图的所述纹理数据进行译码,且
其中对于所述基本深度图估计中的每一者,所述视频译码器经配置以通过至少经配置以进行以下操作而基于所述译码更新所述第二存取单元的所述基本深度图估计:
对于所述基本深度图估计的对应于所述第二存取单元的所述基本视图的所述纹理数据的使用图片内预测译码的块的块,应用所述图片内预测来从所述基本深度图估计的一或多个其它块推导所述基本深度图估计的所述块;以及
对于所述基本深度图估计的对应于所述第二存取单元的所述基本视图的所述纹理数据的使用MCP译码的块的块,应用所述MCP来从先前存取单元的所述基本深度图估计的先前版本的一或多个块推导所述基本深度图估计的所述块。
26.根据权利要求24所述的装置,其中对于所述相依视图中的每一者,所述视频译码器进一步经配置以:
将所述多个基本深度图估计中的相应一者变形到所述相依视图以产生相应相依深度图估计;以及
基于所述相应相依深度图估计相对于所述第二存取单元的所述基本视图的所述纹理数据对所述第二存取单元的所述相依视图的纹理数据进行译码。
27.根据权利要求26所述的装置,其中所述视频译码器经配置以在视图间运动预测或视图间残余预测中的至少一者经启用的情况下基于所述相应相依深度图估计相对于所述第二存取单元的所述基本视图的所述纹理数据对所述第二存取单元的所述相依视图的所述纹理数据进行译码。
28.根据权利要求26所述的装置,其中对于所述相依视图中的每一者,所述视频译码器进一步经配置以:
基于所述第二存取单元的所述相依视图的所述纹理数据的所述经译码信息来更新所述相应相依深度图估计;以及
将所述相应相依深度图估计变形回到所述基本视图以更新所述多个基本深度图估计中的所述相应一者。
29.根据权利要求28所述的装置,
其中对于所述相依视图中的每一者,所述视频译码器经配置以使用图片内预测、运动补偿预测MCP或视差补偿预测DCP中的至少一者对所述第二存取单元的所述相依视图的所述纹理数据进行译码,且
其中对于所述相依深度图估计中的每一者,所述视频译码器经配置以通过至少经配置以进行以下操作而更新所述相依深度图估计:
对于所述相依深度图估计的对应于所述第二存取单元的所述相依视图的所述纹理数据的使用图片内预测译码的块的块,应用所述图片内预测来从所述相依深度图估计的一或多个其它块推导所述相依深度图估计的所述块;
对于所述相依深度图估计的对应于所述第二存取单元的所述相依视图的所述纹理数据的使用MCP译码的块的块,应用所述MCP来从先前存取单元的所述相依深度图估计的先前版本的一或多个块推导所述相依深度图估计的所述块;以及
对于所述相依深度图估计的对应于所述第二存取单元的所述相依视图的所述纹理数据的使用DCP译码的块的块,将用于所述DCP的视差向量转换为深度值。
30.根据权利要求28所述的装置,其中所述视频译码器经配置以:
针对所述多个相依视图中的每一者,独立地将所述基本深度图估计变形到所述相依视图以产生相依深度图估计、对所述相依视图的纹理数据进行译码、更新所述相依深度图估计以及将所述相依深度图估计变形回到所述基本视图以更新所述基本深度图估计。
31.根据权利要求24所述的装置,其中第一存取单元包括所述视图中的每一者的相应锚点图片,且所述第二存取单元包括所述视图中的每一者的相应非锚点图片。
32.根据权利要求31所述的装置,其中所述第一存取单元包括随机存取单元,所述锚点图片包括随机存取图片,所述第二存取单元包括非随机存取单元,且所述非锚点图片包括非随机存取图片。
33.根据权利要求20所述的装置,其中所述视频译码器进一步经配置以:
当所述存取单元包括所述视图中的每一者的相应锚点图片时,停用所述存取单元的所述相依视图的所述纹理数据的视图间运动预测译码或视图间残余预测译码中的至少一者;且
当所述存取单元包括所述视图中的每一者的相应非锚点图片时,启用所述存取单元的所述相依视图的所述纹理数据的视图间运动预测译码或视图间残余预测译码中的至少一者。
34.根据权利要求20所述的装置,其中所述深度图估计的分辨率与所述纹理数据的分辨率相同。
35.根据权利要求20所述的装置,其中所述深度图估计的分辨率与所述纹理数据的分辨率不同。
36.根据权利要求20所述的装置,其中所述相依深度图估计的分辨率与所述基本深度图估计的分辨率不同。
37.根据权利要求20所述的装置,其中视频译码器包括视频解码器,所述视频解码器经配置以对纹理数据进行解码且产生和变形所述相依深度图估计。
38.根据权利要求20所述的装置,其中视频译码器包括视频编码器,所述视频编码器经配置以对纹理数据进行编码且产生和变形所述相依深度图估计。
39.根据权利要求20所述的装置,其中所述装置包括以下各项中的至少一者:
集成电路,其实施所述视频译码器;
微处理器,其实施所述视频译码器;以及
无线通信装置,其包含所述视频译码器。
40.一种用于对视频数据进行译码的装置,所述视频数据包括至少一个基本视图和多个相依视图,其中所述多个相依视图取决于所述基本视图,所述装置包括:
用于对于所述相依视图中的每一者相对于存取单元的所述基本视图的纹理数据使用所述相依视图的视差运动信息对所述存取单元的所述相依视图的纹理数据进行译码的装置;
用于对于所述相依视图中的每一者基于所述相依视图的所述视差运动信息产生所述存取单元的相依深度图估计的装置;以及
用于将所述相依深度图估计中的每一者变形到所述基本视图以产生所述存取单元的多个基本深度图估计中的相应一者的装置,其中所述相依深度图估计中的每一者和所述相应基本深度图估计形成所述存取单元的多个深度图估计对中的相应一者且与所述多个相依视图中的相应一者相关联。
41.根据权利要求40所述的装置,其中所述存取单元包括第一存取单元,所述装置进一步包括:
用于对第二存取单元的所述基本视图的纹理数据进行译码的装置;以及
用于基于所述第二存取单元的所述基本视图的所述纹理数据的所述译码来更新所述多个基本深度图估计中的每一者的装置。
42.根据权利要求41所述的装置,其进一步包括:
用于对于所述相依视图中的每一者将所述多个基本深度图估计中的相应一者变形到所述相依视图以产生相应相依深度图估计的装置;以及
用于对于所述相依视图中的每一者基于所述相应相依深度图估计相对于所述第二存取单元的所述基本视图的所述纹理数据对所述第二存取单元的所述相依视图的纹理数据进行译码的装置。
43.根据权利要求42所述的装置,其中所述用于基于所述相应相依深度图估计相对于所述第二存取单元的所述基本视图的所述纹理数据对所述第二存取单元的所述相依视图的纹理数据进行译码的装置包括用于在视图间运动预测或视图间残余预测中的至少一者经启用的情况下基于所述相应相依深度图估计相对于所述第二存取单元的所述基本视图的所述纹理数据对所述第二存取单元的所述相依视图的纹理数据进行译码的装置。
44.根据权利要求42所述的装置,其进一步包括:
用于对于所述相依视图中的每一者基于所述第二存取单元的所述相依视图的所述纹理数据的所述经译码信息来更新所述相应相依深度图估计的装置;以及
用于对于所述相依视图中的每一者将所述相应相依深度图估计变形回到所述基本视图以更新所述多个基本深度图估计中的所述相应一者的装置。
45.根据权利要求41所述的装置,其中第一存取单元包括所述视图中的每一者的相应锚点图片,且所述第二存取单元包括所述视图中的每一者的相应非锚点图片。
46.根据权利要求40所述的装置,其进一步包括:
用于当所述存取单元包括所述视图中的每一者的相应锚点图片时对所述相依视图的所述纹理数据进行译码的装置包括停用所述存取单元的所述相依视图的所述纹理数据的视图间运动预测译码或视图间残余译码中的至少一者;且
用于当所述存取单元包括所述视图中的每一者的相应非锚点图片时对所述相依视图的所述纹理数据进行译码的装置包括启用所述存取单元的所述相依视图的所述纹理数据的视图间运动预测译码或视图间残余译码中的至少一者。
47.一种具有存储于其上的指令的计算机可读存储媒体,所述指令当由经配置以对包括至少一个基本视图和多个相依视图的视频数据进行译码的视频译码器的一或多个处理器执行时致使所述视频译码器进行以下操作,其中所述多个相依视图取决于所述基本视图:
对于所述相依视图中的每一者,相对于存取单元的所述基本视图的纹理数据使用所述相依视图的视差运动信息对所述存取单元的所述相依视图的纹理数据进行译码;
对于所述相依视图中的每一者,基于所述相依视图的所述视差运动信息产生所述存取单元的相依深度图估计;以及
将所述相依深度图估计中的每一者变形到所述基本视图以产生所述存取单元的多个基本深度图估计中的相应一者,其中所述相依深度图估计中的每一者和所述相应基本深度图估计形成所述存取单元的多个深度图估计对中的相应一者且与所述多个相依视图中的相应一者相关联。
48.根据权利要求47所述的计算机可读存储媒体,其中所述存取单元包括第一存取单元,且所述指令进一步致使所述视频译码器:
对第二存取单元的所述基本视图的纹理数据进行译码;以及
基于所述第二存取单元的所述基本视图的所述纹理数据的所述译码来更新所述多个基本深度图估计中的每一者。
49.根据权利要求48所述的计算机可读存储媒体,其中所述指令进一步致使所述视频译码器对于所述相依视图中的每一者:
将所述多个基本深度图估计中的相应一者变形到所述相依视图以产生相应相依深度图估计;以及
基于所述相应相依深度图估计相对于所述第二存取单元的所述基本视图的所述纹理数据对所述第二存取单元的所述相依视图的纹理数据进行译码。
50.根据权利要求49所述的计算机可读存储媒体,其中所述致使所述视频译码器基于所述相应相依深度图估计相对于所述第二存取单元的所述基本视图的所述纹理数据对所述第二存取单元的所述相依视图的纹理数据进行译码的指令包括致使所述视频译码器在视图间运动预测或视图间残余预测中的至少一者经启用的情况下基于所述相应相依深度图估计相对于所述第二存取单元的所述基本视图的所述纹理数据对所述第二存取单元的所述相依视图的所述纹理数据进行译码的指令。
51.根据权利要求49所述的计算机可读存储媒体,其中所述指令进一步致使所述视频译码器对于所述相依视图中的每一者:
基于所述第二存取单元的所述相依视图的所述纹理数据的所述经译码信息来更新所述相应相依深度图估计;以及
将所述相应相依深度图估计变形回到所述基本视图以更新所述多个基本深度图估计中的所述相应一者。
52.根据权利要求48所述的计算机可读存储媒体,其中第一存取单元包括所述视图中的每一者的相应锚点图片,且所述第二存取单元包括所述视图中的每一者的相应非锚点图片。
53.根据权利要求47所述的计算机可读存储媒体,其中所述指令进一步致使所述视频译码器:
当所述存取单元包括所述视图中的每一者的相应锚点图片时,停用所述存取单元的所述相依视图的所述纹理数据的视图间运动预测译码或视图间残余预测译码中的至少一者;且
当所述存取单元包括所述视图中的每一者的相应非锚点图片时,启用所述存取单元的所述相依视图的所述纹理数据的视图间运动预测译码或视图间残余预测译码中的至少一者。
CN201380030528.7A 2012-06-13 2013-05-10 深度图估计的推导 Expired - Fee Related CN104350749B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201261659290P 2012-06-13 2012-06-13
US61/659,290 2012-06-13
US13/772,917 US9258562B2 (en) 2012-06-13 2013-02-21 Derivation of depth map estimate
US13/772,917 2013-02-21
PCT/US2013/040582 WO2013188028A1 (en) 2012-06-13 2013-05-10 Derivation of depth map estimate

Publications (2)

Publication Number Publication Date
CN104350749A true CN104350749A (zh) 2015-02-11
CN104350749B CN104350749B (zh) 2017-10-24

Family

ID=49755517

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380030528.7A Expired - Fee Related CN104350749B (zh) 2012-06-13 2013-05-10 深度图估计的推导

Country Status (3)

Country Link
US (1) US9258562B2 (zh)
CN (1) CN104350749B (zh)
WO (1) WO2013188028A1 (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108027877A (zh) * 2015-09-18 2018-05-11 高通股份有限公司 用于非障碍区检测的系统和方法
WO2018205914A1 (en) * 2017-05-10 2018-11-15 Mediatek Inc. Method and apparatus of reordering motion vector prediction candidate set for video coding
CN110677666A (zh) * 2018-07-02 2020-01-10 北京字节跳动网络技术有限公司 Lamvr中取整和修剪的顺序
US20200413044A1 (en) 2018-09-12 2020-12-31 Beijing Bytedance Network Technology Co., Ltd. Conditions for starting checking hmvp candidates depend on total number minus k
US11134267B2 (en) 2018-06-29 2021-09-28 Beijing Bytedance Network Technology Co., Ltd. Update of look up table: FIFO, constrained FIFO
US11140383B2 (en) 2019-01-13 2021-10-05 Beijing Bytedance Network Technology Co., Ltd. Interaction between look up table and shared merge list
US11140385B2 (en) 2018-06-29 2021-10-05 Beijing Bytedance Network Technology Co., Ltd. Checking order of motion candidates in LUT
US11146785B2 (en) 2018-06-29 2021-10-12 Beijing Bytedance Network Technology Co., Ltd. Selection of coded motion information for LUT updating
US11159807B2 (en) 2018-06-29 2021-10-26 Beijing Bytedance Network Technology Co., Ltd. Number of motion candidates in a look up table to be checked according to mode
US11159817B2 (en) 2018-06-29 2021-10-26 Beijing Bytedance Network Technology Co., Ltd. Conditions for updating LUTS
US11528501B2 (en) 2018-06-29 2022-12-13 Beijing Bytedance Network Technology Co., Ltd. Interaction between LUT and AMVP
US11528500B2 (en) 2018-06-29 2022-12-13 Beijing Bytedance Network Technology Co., Ltd. Partial/full pruning when adding a HMVP candidate to merge/AMVP
US11589071B2 (en) 2019-01-10 2023-02-21 Beijing Bytedance Network Technology Co., Ltd. Invoke of LUT updating
US11641483B2 (en) 2019-03-22 2023-05-02 Beijing Bytedance Network Technology Co., Ltd. Interaction between merge list construction and other tools
US11895318B2 (en) 2018-06-29 2024-02-06 Beijing Bytedance Network Technology Co., Ltd Concept of using one or multiple look up tables to store motion information of previously coded in order and use them to code following blocks
US11956464B2 (en) 2019-01-16 2024-04-09 Beijing Bytedance Network Technology Co., Ltd Inserting order of motion candidates in LUT

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3739886A1 (en) * 2011-11-18 2020-11-18 GE Video Compression, LLC Multi-view coding with efficient residual handling
WO2014000664A1 (en) * 2012-06-28 2014-01-03 Mediatek Inc. Method and apparatus of disparity vector derivation in 3d video coding
US9843820B2 (en) * 2012-07-05 2017-12-12 Mediatek Inc Method and apparatus of unified disparity vector derivation for 3D video coding
JP6000463B2 (ja) * 2012-09-21 2016-09-28 聯發科技股▲ふん▼有限公司Mediatek Inc. 3d映像符号化の仮想深度値の方法および装置
EP2932472B1 (en) * 2012-12-14 2018-07-18 Qualcomm Incorporated Inside view motion prediction among texture and depth view components with asymmetric spatial resolution
WO2014166063A1 (en) * 2013-04-09 2014-10-16 Mediatek Inc. Default vector for disparity vector derivation for 3d video coding
CN105324996B (zh) * 2013-04-10 2018-12-21 寰发股份有限公司 三维视频编码的视图间候选推导的方法及其装置
US10045014B2 (en) * 2013-07-15 2018-08-07 Mediatek Singapore Pte. Ltd. Method of disparity derived depth coding in 3D video coding
US9749642B2 (en) 2014-01-08 2017-08-29 Microsoft Technology Licensing, Llc Selection of motion vector precision
US9774881B2 (en) * 2014-01-08 2017-09-26 Microsoft Technology Licensing, Llc Representing motion vectors in an encoded bitstream
US9942560B2 (en) * 2014-01-08 2018-04-10 Microsoft Technology Licensing, Llc Encoding screen capture data
BR112016017201B1 (pt) * 2014-01-29 2023-09-26 Hfi Innovation Inc Método de codificação e decodificação para precisão adaptativa de vetor de movimento de um bloco de dados de vídeo
US20170026662A1 (en) * 2014-03-11 2017-01-26 Samsung Electronics Co., Ltd. Disparity vector predicting method and apparatus for encoding inter-layer video, and disparity vector predicting method and apparatus for decoding inter-layer video
EP3111642B1 (en) * 2014-03-11 2021-05-12 HFI Innovation Inc. Method and apparatus of single sample mode for video coding
CN111741312B (zh) * 2014-10-31 2024-03-19 三星电子株式会社 用于对运动矢量进行编码/解码的方法和装置
JPWO2018056181A1 (ja) * 2016-09-26 2019-07-04 ソニー株式会社 符号化装置、符号化方法、復号化装置、復号化方法、送信装置および受信装置
US10715812B2 (en) * 2018-07-13 2020-07-14 Tencent America LLC Method and apparatus for video coding
US10818083B1 (en) * 2019-04-30 2020-10-27 International Business Machines Corporation Pyramid generation via depth-first walk
US11831909B2 (en) * 2021-03-11 2023-11-28 Qualcomm Incorporated Learned B-frame coding using P-frame coding system

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011141710A (ja) * 2010-01-07 2011-07-21 National Institute Of Information & Communication Technology 奥行推定装置、奥行推定方法および奥行推定プログラム
CN102272778A (zh) * 2009-01-07 2011-12-07 汤姆森特许公司 联合深度估计
US20120056887A1 (en) * 2010-09-02 2012-03-08 Samsung Electronics Co., Ltd. Depth estimation system for two-dimensional images and method of operation thereof

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7085409B2 (en) 2000-10-18 2006-08-01 Sarnoff Corporation Method and apparatus for synthesizing new video and/or still imagery from a collection of real video and/or still imagery
US7489342B2 (en) 2004-12-17 2009-02-10 Mitsubishi Electric Research Laboratories, Inc. Method and system for managing reference pictures in multiview videos
US8395642B2 (en) 2009-03-17 2013-03-12 Mitsubishi Electric Research Laboratories, Inc. Method for virtual image synthesis
WO2010126612A2 (en) 2009-05-01 2010-11-04 Thomson Licensing Reference picture lists for 3dv
US9565449B2 (en) 2011-03-10 2017-02-07 Qualcomm Incorporated Coding multiview video plus depth content
EP3739886A1 (en) * 2011-11-18 2020-11-18 GE Video Compression, LLC Multi-view coding with efficient residual handling
WO2013107931A1 (en) * 2012-01-19 2013-07-25 Nokia Corporation An apparatus, a method and a computer program for video coding and decoding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102272778A (zh) * 2009-01-07 2011-12-07 汤姆森特许公司 联合深度估计
JP2011141710A (ja) * 2010-01-07 2011-07-21 National Institute Of Information & Communication Technology 奥行推定装置、奥行推定方法および奥行推定プログラム
US20120056887A1 (en) * 2010-09-02 2012-03-08 Samsung Electronics Co., Ltd. Depth estimation system for two-dimensional images and method of operation thereof

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
CHRISTIAN BARTNIK ET.AL: "HEVC Extension for Multiview Video Coding and Multiview Video plus Depth Coding", 《ITU - TELECOMMUNICATIONS STANDARDIZATION SECTOR STUDY GROUP 16 QUESTION 6 VIDEO CODING EXPERTS GROUP (VCEG) 44ND MEETING: SAN JOSE, CA, USA》 *

Cited By (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108027877A (zh) * 2015-09-18 2018-05-11 高通股份有限公司 用于非障碍区检测的系统和方法
WO2018205914A1 (en) * 2017-05-10 2018-11-15 Mediatek Inc. Method and apparatus of reordering motion vector prediction candidate set for video coding
US10701393B2 (en) 2017-05-10 2020-06-30 Mediatek Inc. Method and apparatus of reordering motion vector prediction candidate set for video coding
US11146786B2 (en) 2018-06-20 2021-10-12 Beijing Bytedance Network Technology Co., Ltd. Checking order of motion candidates in LUT
US11706406B2 (en) 2018-06-29 2023-07-18 Beijing Bytedance Network Technology Co., Ltd Selection of coded motion information for LUT updating
US11695921B2 (en) 2018-06-29 2023-07-04 Beijing Bytedance Network Technology Co., Ltd Selection of coded motion information for LUT updating
US11973971B2 (en) 2018-06-29 2024-04-30 Beijing Bytedance Network Technology Co., Ltd Conditions for updating LUTs
US11909989B2 (en) 2018-06-29 2024-02-20 Beijing Bytedance Network Technology Co., Ltd Number of motion candidates in a look up table to be checked according to mode
US11134267B2 (en) 2018-06-29 2021-09-28 Beijing Bytedance Network Technology Co., Ltd. Update of look up table: FIFO, constrained FIFO
US11895318B2 (en) 2018-06-29 2024-02-06 Beijing Bytedance Network Technology Co., Ltd Concept of using one or multiple look up tables to store motion information of previously coded in order and use them to code following blocks
US11140385B2 (en) 2018-06-29 2021-10-05 Beijing Bytedance Network Technology Co., Ltd. Checking order of motion candidates in LUT
US11146785B2 (en) 2018-06-29 2021-10-12 Beijing Bytedance Network Technology Co., Ltd. Selection of coded motion information for LUT updating
US11877002B2 (en) 2018-06-29 2024-01-16 Beijing Bytedance Network Technology Co., Ltd Update of look up table: FIFO, constrained FIFO
US11528500B2 (en) 2018-06-29 2022-12-13 Beijing Bytedance Network Technology Co., Ltd. Partial/full pruning when adding a HMVP candidate to merge/AMVP
US11153557B2 (en) 2018-06-29 2021-10-19 Beijing Bytedance Network Technology Co., Ltd. Which LUT to be updated or no updating
US11528501B2 (en) 2018-06-29 2022-12-13 Beijing Bytedance Network Technology Co., Ltd. Interaction between LUT and AMVP
US11159807B2 (en) 2018-06-29 2021-10-26 Beijing Bytedance Network Technology Co., Ltd. Number of motion candidates in a look up table to be checked according to mode
US11245892B2 (en) 2018-06-29 2022-02-08 Beijing Bytedance Network Technology Co., Ltd. Checking order of motion candidates in LUT
US11159817B2 (en) 2018-06-29 2021-10-26 Beijing Bytedance Network Technology Co., Ltd. Conditions for updating LUTS
CN110677666A (zh) * 2018-07-02 2020-01-10 北京字节跳动网络技术有限公司 Lamvr中取整和修剪的顺序
US11134244B2 (en) 2018-07-02 2021-09-28 Beijing Bytedance Network Technology Co., Ltd. Order of rounding and pruning in LAMVR
US11153559B2 (en) 2018-07-02 2021-10-19 Beijing Bytedance Network Technology Co., Ltd. Usage of LUTs
CN110677666B (zh) * 2018-07-02 2022-06-14 北京字节跳动网络技术有限公司 Lamvr中取整和修剪的顺序
US11134243B2 (en) 2018-07-02 2021-09-28 Beijing Bytedance Network Technology Co., Ltd. Rules on updating luts
US11463685B2 (en) 2018-07-02 2022-10-04 Beijing Bytedance Network Technology Co., Ltd. LUTS with intra prediction modes and intra mode prediction from non-adjacent blocks
US11153558B2 (en) 2018-07-02 2021-10-19 Beijing Bytedance Network Technology Co., Ltd. Update of look-up tables
US11159787B2 (en) 2018-09-12 2021-10-26 Beijing Bytedance Network Technology Co., Ltd. Conditions for starting checking HMVP candidates depend on total number minus K
US20200413044A1 (en) 2018-09-12 2020-12-31 Beijing Bytedance Network Technology Co., Ltd. Conditions for starting checking hmvp candidates depend on total number minus k
US11997253B2 (en) 2018-09-12 2024-05-28 Beijing Bytedance Network Technology Co., Ltd Conditions for starting checking HMVP candidates depend on total number minus K
US20210297659A1 (en) 2018-09-12 2021-09-23 Beijing Bytedance Network Technology Co., Ltd. Conditions for starting checking hmvp candidates depend on total number minus k
US11589071B2 (en) 2019-01-10 2023-02-21 Beijing Bytedance Network Technology Co., Ltd. Invoke of LUT updating
US11909951B2 (en) 2019-01-13 2024-02-20 Beijing Bytedance Network Technology Co., Ltd Interaction between lut and shared merge list
US11140383B2 (en) 2019-01-13 2021-10-05 Beijing Bytedance Network Technology Co., Ltd. Interaction between look up table and shared merge list
US11956464B2 (en) 2019-01-16 2024-04-09 Beijing Bytedance Network Technology Co., Ltd Inserting order of motion candidates in LUT
US11962799B2 (en) 2019-01-16 2024-04-16 Beijing Bytedance Network Technology Co., Ltd Motion candidates derivation
US11641483B2 (en) 2019-03-22 2023-05-02 Beijing Bytedance Network Technology Co., Ltd. Interaction between merge list construction and other tools

Also Published As

Publication number Publication date
WO2013188028A1 (en) 2013-12-19
US9258562B2 (en) 2016-02-09
CN104350749B (zh) 2017-10-24
US20130335522A1 (en) 2013-12-19

Similar Documents

Publication Publication Date Title
CN104350749A (zh) 深度图估计的推导
CN105379282B (zh) 用于纹理译码的先进残余预测(arp)的方法和设备
CN105556969B (zh) 视频译码中使用视差向量的块识别
CN105580372B (zh) 用于3d视频译码的组合式双向预测合并候选者
CN105874799B (zh) 用于3d视频译码的基于块的高级残差预测
CN104904218B (zh) 视差矢量推导
CN105637870B (zh) 使用不对称运动分割的视频译码技术
CN105379288B (zh) 处理对视频译码的照明补偿
CN104662909B (zh) 用于3d视频的视图间运动预测
CN105009586B (zh) 多视图或3维视频译码中的视图间残余预测
TWI526027B (zh) 視訊寫碼中之運動向量預測
CN109691106A (zh) 时间运动向量预测符的偏移向量识别
CN104685883A (zh) 用于3d视频的经视图间预测运动向量
CN104769949A (zh) 用于视差向量导出的图片的选择
CN105052145A (zh) 剖析三维视频译码中的语法元素
CN105794209B (zh) 用于译码深度块的方法和装置
CN104303502A (zh) 用于3d-hevc的视差向量建构方法
CN105359530A (zh) 面向深度的视图间运动向量预测
CN104322070A (zh) 用于高效率视频译码的高级别语法扩展
CN105122812A (zh) 用于三维(3d)视频译码的高级合并模式
CN110351567A (zh) 3d-hevc中的简化移位合并候选者及合并列表导出
US10009621B2 (en) Advanced depth inter coding based on disparity of depth blocks
CN105075265A (zh) 3d视频译码中针对跳过和直接模式的视差向量导出
CN104335589A (zh) 用于视频译码的视图间预测的视差向量产生
CN104170380A (zh) 视频译码中的视差矢量预测

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20171024

Termination date: 20190510