CN105122811A

CN105122811A - 3d视频译码中的相邻块视差向量导出

Info

Publication number: CN105122811A
Application number: CN201480009816.9A
Authority: CN
Inventors: 张莉; 陈颖; 康杰万
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2013-02-26
Filing date: 2014-02-26
Publication date: 2015-12-02
Anticipated expiration: 2034-02-26
Also published as: JP6337025B2; WO2014134174A2; CN105122811B; US9635357B2; KR20150122709A; BR112015020534A2; US20140241430A1; WO2014134181A3; CN105075263B; WO2014134174A3; JP6382233B2; CN105075263A; ES2704885T3; KR20150122708A; EP2962466A2; BR112015020535A2; US9781416B2; KR101917917B1; EP2962465A2; JP2016511604A

Abstract

在本发明的一个实例中，一种对视频数据进行译码的方法包括使用纹理优先译码对视频数据进行译码，以及使用多个相邻块执行用于所述视频数据的块的NBDV导出过程。所述NBDV导出过程包括将与以基于块的视图合成预测BVSP模式译码的所述多个相邻块中的相邻块相关联的运动向量指定为可用视差运动。

Description

3D视频译码中的相邻块视差向量导出

本申请案主张以下各者的权益：

2013年2月26日申请的第61/769,716号美国临时申请案，

2013年2月27日申请的第61/770,263号美国临时申请案，

2013年2月27日申请的第61/770,268号美国临时申请案，

2013年3月4日申请的第61/772,321号美国临时申请案，

2013年3月19日申请的第61/803,384号美国临时申请案，以及

2013年4月24日申请的第61/815,656号美国临时申请案，以上申请案中的每一者的内容以全文引用方式并入本文。

技术领域

本发明涉及视频编码和解码。

背景技术

数字视频能力可并入到广泛范围的装置中，包括数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、视频电话会议装置及其类似者。数字视频装置实施视频压缩技术，例如在通过MPEG-2、MPEG-4、ITU-TH.263、ITU-TH.264/MPEG-4第10部分、高级视频译码(AVC)、目前正在开发的高效率视频译码(HEVC)标准及此类标准的扩展部分定义的标准中描述的技术，以便更有效地发射、接收及存储数字视频信息。

前述标准中的一些的扩展(包含H.264/AVC)提供用于进行多视图视频译码以便产生立体或三维(“3D”)视频的技术。确切地说，已经提议用于多视图译码的技术以在AVC中使用，与可缩放视频译码(SVC)标准(为对H.264/AVC的可缩放扩展)一起使用，以及与多视图视频译码(MVC)标准(已变为对H.264/AVC的多视图扩展)一起使用。

通常，使用两个视图(例如，左视图及右视图)实现立体视频。左视图的图片实质上可与右视图的图片同时显示以实现三维视频效果。举例来说，用户可佩戴偏光无源眼镜，其将左视图从右视图过滤掉。替代性地，可快速连续展示所述两个视图的图片，且用户可佩戴有源眼镜，其以相同频率但具有90度的相位移位快速地对左眼及右眼进行遮光。

发明内容

一般来说，本发明描述用于3D视频译码的技术。确切地说，本发明与3D视频译码中的相邻块视差向量(NBDV)导出和基于块的视图合成预测(BVSP)有关。

在本发明的一个实例中，一种对视频数据进行译码的方法包括：使用纹理优先译码对视频数据进行译码；以及使用多个相邻块执行用于所述视频数据的块的NBDV导出过程，其中所述NBDV导出过程导出视差向量，且其中执行所述NBDV过程包括：将与以基于块的视图合成预测(BVSP)模式译码的所述多个相邻块中的相邻块相关联的运动向量指定为一或多个可用视差运动向量中的可用视差运动向量；以及将与使用视图间预测模式译码的所述多个相邻块中的相邻块相关联的运动向量指定为所述一或多个可用视差运动向量中的可用视差运动向量。

在本发明的另一实例中，一种经配置以对视频数据进行译码的设备包括：存储器，其经配置以存储所述视频数据的块；以及视频译码器，其经配置以：使用纹理优先译码对视频数据进行译码；以及使用多个相邻块执行用于所述视频数据的所述块的基于相邻块的视差向量(NBDV)导出过程，其中所述NBDV导出过程导出视差向量，且其中执行所述NBDV导出过程包括：将与以基于块的视图合成预测(BVSP)模式译码的所述多个相邻块中的相邻块相关联的运动向量指定为一或多个可用视差运动向量中的可用视差运动向量；以及将与使用视图间预测模式译码的所述多个相邻块中的相邻块相关联的运动向量指定为所述一或多个可用视差运动向量中的可用视差运动向量。

在本发明的另一实例中，一种经配置以对视频数据进行译码的设备包括：用于使用纹理优先译码对视频数据进行译码的装置；以及用于使用多个相邻块执行用于所述视频数据的块的基于相邻块的视差向量(NBDV)导出过程的装置，其中所述NBDV导出过程导出视差向量，且其中所述用于执行所述NBDV过程的装置包括：用于将与以基于块的视图合成预测(BVSP)模式译码的所述多个相邻块中的相邻块相关联的运动向量指定为一或多个可用视差运动向量中的可用视差运动向量的装置；以及用于将与使用视图间预测模式译码的所述多个相邻块中的相邻块相关联的运动向量指定为所述一或多个可用视差运动向量中的可用视差运动向量的装置。

在另一个实例中，本发明描述一种存储指令的计算机可读存储媒体，所述指令在执行时致使经配置以对视频数据进行译码的一或多个处理器：使用纹理优先译码对视频数据进行译码；以及使用多个相邻块执行用于所述视频数据的所述块的基于相邻块的视差向量(NBDV)导出过程，其中所述NBDV导出过程导出视差向量，且其中执行所述NBDV过程包括：将与以基于块的视图合成预测(BVSP)模式译码的所述多个相邻块中的相邻块相关联的运动向量指定为一或多个可用视差运动向量中的可用视差运动向量；以及将与使用视图间预测模式译码的所述多个相邻块中的相邻块相关联的运动向量指定为所述一或多个可用视差运动向量中的可用视差运动向量。

在本发明的另一实例中，一种对视频数据进行译码的方法包括对视频数据块执行基于块的视图合成预测(BVSP)过程，所述BVSP过程包括执行NBDV导出过程以导出视差向量，且精炼所述视频数据块的子区的导出视差向量，以及使用BVSP对所述视频数据块进行译码，其中执行NBDV导出过程包括将与以基于块的视图合成预测(BVSP)模式译码的所述多个相邻块中的相邻块相关联的运动向量指定为一或多个可用视差运动向量中的可用视差运动向量，将与使用视图间预测模式译码的所述多个相邻块中的相邻块相关联的运动向量指定为所述一或多个可用视差运动向量中的可用视差运动向量，以及从所述一或多个可用视差运动向量导出所述视差向量。

在本发明的另一实例中，一种经配置以对视频数据进行译码的设备包括：存储器，其经配置以存储视频数据块；以及视频译码器，其经配置以：对视频数据块执行基于块的视图合成预测(BVSP)过程，所述BVSP过程包括执行NBDV导出过程以导出视差向量，且精炼所述视频数据块的子区的导出视差向量，以及使用BVSP对所述视频数据块进行译码，其中执行NBDV导出过程包括将与以基于块的视图合成预测(BVSP)模式译码的所述多个相邻块中的相邻块相关联的运动向量指定为一或多个可用视差运动向量中的可用视差运动向量，将与使用视图间预测模式译码的所述多个相邻块中的相邻块相关联的运动向量指定为所述一或多个可用视差运动向量中的可用视差运动向量，以及从所述一或多个可用视差运动向量导出所述视差向量。

在本发明的另一实例中，一种经配置以对视频数据进行译码的设备包括：用于对视频数据块执行基于块的视图合成预测(BVSP)过程的装置，所述用于执行BVSP过程的装置包括用于执行NBDV导出过程以导出视差向量的装置，以及用于精炼所述视频数据块的子区的导出视差向量的装置，以及用于使用BVSP对所述视频数据块进行译码的装置，其中所述用于执行NBDV导出过程的装置包括用于将与以基于块的视图合成预测(BVSP)模式译码的所述多个相邻块中的相邻块相关联的运动向量指定为一或多个可用视差运动向量中的可用视差运动向量的装置，用于将与使用视图间预测模式译码的所述多个相邻块中的相邻块相关联的运动向量指定为所述一或多个可用视差运动向量中的可用视差运动向量的装置，以及用于从所述一或多个可用视差运动向量导出所述视差向量的装置。

在另一个实例中，本发明描述一种存储指令的计算机可读存储媒体，所述指令当执行时致使经配置以对视频数据进行译码的一或多个处理器：对视频数据块执行基于块的视图合成预测(BVSP)过程，所述BVSP过程包括执行NBDV导出过程以导出视差向量，且精炼所述视频数据块的子区的导出视差向量，以及使用BVSP对所述视频数据块进行译码，其中执行NBDV导出过程包括将与以基于块的视图合成预测(BVSP)模式译码的所述多个相邻块中的相邻块相关联的运动向量指定为一或多个可用视差运动向量中的可用视差运动向量，将与使用视图间预测模式译码的所述多个相邻块中的相邻块相关联的运动向量指定为所述一或多个可用视差运动向量中的可用视差运动向量，以及从所述一或多个可用视差运动向量导出所述视差向量。

随附图式及以下描述中陈述一或多个实例的细节。其它特征、目标和优势将从所述描述和图式以及从权利要求书显而易见。

附图说明

图1是图解说明可利用本发明中描述的技术的实例视频编码和解码系统的实例的框图。

图2为说明实例多视图解码次序的概念图。

图3为说明用于多视图译码的实例预测结构的概念图。

图4是基于后向扭曲的基于块的视图合成预测的概念可视化。

图5是展示用于相邻块视差向量导出的空间相邻块的概念图。

图6是说明可实施本发明中描述的技术的实例视频编码器的框图。

图7为说明可实施本发明中描述的技术的实例视频解码器的框图。

图8是展示用于基于深度的运动向量预测的相邻块的概念图。

图9是说明本发明的实例方法的流程图。

图10是说明本发明的另一实例方法的流程图。

具体实施方式

一般来说，本发明描述基于高级编解码器的多视图加深度(例如，3D)视频译码的技术，包含以H.264/高级视频译码(AVC)编解码器(例如，有时称为3D-AVC的H.264/AVC的3D扩展中)对两个或两个以上视图的译码。在一些实例中，提出涉及基于3DAVC的多视图视频译码中的视图合成预测和视差向量导出的技术。然而，本发明的技术可一般适用于其它多视图和/或3D视频译码技术，包含多视图和高效率视频译码(HEVC)标准的新兴的3D扩展。

当采用纹理优先解码时，针对3D-AVC的当前提议缺乏用于导出准确视差向量的技术。确切地说，从针对相邻块视差向量(NBDV)导出过程的当前提议导出的视差向量可产生不准确的视差向量。此外，当前不存在当采用纹理优先译码时使用导出的视差向量用于基于块的视图合成预测(BVSP)译码的技术。

鉴于这些缺点，本发明提出当在对应非基础深度视图分量之前对非基础纹理视图分量进行译码时针对3D-AVC顺应视频编码器和视频解码器实现BVSP的技术。另外，由于如本发明的技术所提供的精细视差向量的导出，也改善了其它帧间译码模式的译码增益。

图1是说明可经配置以执行本发明中描述的用于视图合成预测和视差向量导出的技术的实例性视频编码和解码系统10的框图。如图1中所展示，系统10包含源装置12，其产生稍后时间待由目的地装置14解码的经编码视频数据。源装置12和目的地装置14可包括广泛范围装置中的任一者，包含桌上型计算机、笔记型(即，膝上型)计算机、平板计算机、机顶盒、电话手持机(例如，所谓的“智能”手机)、所谓的“智能”平板计算机、电视机、摄像机、显示装置、数字媒体播放器、视频游戏控制台、视频串流装置或其类似者。在一些情况下，源装置12和目的地装置14可能经装备以用于无线通信。

系统10可根据不同视频译码标准、专属标准或多视图译码的任何其它方式操作。以下描述视频译码标准的几个实例，且不应被视为具限制性。视频译码标准包含ITU-TH.261、ISO/IECMPEG-1Visual、ITU-TH.262或ISO/IECMPEG-2Visual、ITU-TH.263、ISO/IECMPEG-4Visual及ITU-TH.264(也被称为ISO/IECMPEG-4AVC)，包含其可缩放视频译码(SVC)及多视图视频译码(MVC)扩展。MVC的最新联合草案在“用于通用视听服务的高级视频译码”(2010年3月的ITU-T建议H.264)中描述，其全部内容以引用的方式并入本文中。MVC的另一联合草案在“用于通用视听服务的高级视频译码”(2011年6月的ITU-T推荐H.264)中描述，其全部内容以引用的方式并入本文中。一些额外视频译码标准包含基于AVC的MVC+D和3D-AVC。另外，已由ITU-T视频译码专家组(VCEG)和ISO/IEC动画专家组(MPEG)的视频译码联合合作小组(JCT-VC)开发新视频译码标准，即，高效率视频译码(HEVC)。

仅出于说明的目的，以根据例如3D-AVC的H.264标准的实例来描述本发明中描述的技术。然而，本发明中描述的技术不应被视为限于这些实例性标准，且可扩展到用于多视图译码或3D视频译码(例如，3D-HEVC)的其它视频译码标准，或可扩展到与不一定基于特定视频译码标准的多视图译码或3D视频译码相关的技术。举例来说，本发明中描述的技术由用于多视图译码的视频编码器/解码器(编解码器)实施，其中多视图译码包含两个或两个以上视图的译码。

目的地装置14可经由链路16接收待解码的经编码视频数据。链路16可包括能够将经编码视频数据从源装置12移动到目的地装置14的任何类型的媒体或装置。在一个实例中，链路16可包括使得源装置12能够实时地将经编码视频数据直接发射到目的地装置14的通信媒体。经编码视频数据可根据通信标准(例如，无线通信协议)来调制，且被发射到目的地装置14。通信媒体可包括任何无线或有线通信媒体，例如射频(RF)频谱或一或多个物理发射线路。通信媒体可能形成分组网络(例如局域网、广域网或全球网络，例如因特网)的一部分。通信媒体可包含路由器、交换器、基站或任何其它可以用于促进从源装置12到目的地装置14的通信的设备。

替代地，可将经编码数据从输出接口22输出到存储装置34。类似地，可通过输入接口从存储装置34存取经编码数据。存储装置34可包含多种分布式或本地存取的数据存储媒体中的任一者，例如硬盘驱动器、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器或用于存储经编码视频数据的任何其它合适的数字存储媒体。在另一实例中，存储装置34可对应于可保持由源装置12产生的经编码视频的文件服务器或另一中间存储装置。目的地装置14可从存储装置34经由流式传输或下载来存取所存储的视频数据。文件服务器可为能够存储经编码视频数据且将经编码视频数据发射到目的地装置14的任何类型的服务器。实例文件服务器包含网络服务器(例如，用于网站)、FTP服务器、网络附接存储(NAS)装置或本地磁盘驱动器。目的地装置14可以通过任何标准数据连接(包含因特网连接)来存取经编码的视频数据。此可包含适合于存取存储于文件服务器上的经编码的视频数据的无线信道(例如，Wi-Fi连接)、有线连接(例如，DSL、电缆调制解调器等)或两者的组合。经编码的视频数据从存储装置34的发射可为流式传输发射、下载发射或两者的组合。

用于视图合成预测和视差向量导出的本发明的技术不一定限于无线应用或设定。所述技术可应用于视频译码以支持多种多媒体应用中的任一者，例如空中电视广播、有线电视发射、卫星电视发射、串流视频发射(例如，经由因特网)、编码数字视频以存储于数据存储媒体上、解码存储于数据存储媒体上的数字视频，或其它应用。在一些实例中，系统10可经配置以支持单向或双向视频发射，以支持例如视频流式传输、视频回放、视频广播和/或视频电话等应用。

在图1的实例中，源装置12包含视频源18、视频编码器20及输出接口22。在一些情况下，输出接口22可包含调制器/解调器(调制解调器)及/或发射器。在源装置12中，视频源18可包含例如视频俘获装置(例如，摄像机)、含有先前俘获的视频的视频存档、用于从视频内容提供者接收视频的视频馈入接口及/或用于产生计算机图形数据作为源视频的计算机图形系统，或此类源的组合等源。作为一个实例，如果视频源18是摄像机，则源装置12与目的地装置14可形成所谓的相机电话或视频电话。然而，本发明中描述的技术一般可适用于视频译码，且可应用于无线和/或有线应用。

可由视频编码器20编码所俘获视频、预俘获的视频或计算机产生的视频。经编码视频数据可经由源装置12的输出接口22直接发射到目的地装置14。还可(或替代地)将经编码视频数据存储到存储装置34上以供稍后由目的地装置14或其它装置存取以用于解码及/或回放。

目的地装置14包含输入接口28、视频解码器30及显示装置32。在一些情况下，输入接口28可包含接收器及/或调制解调器。目的地装置14的输入接口28经由链路16接收经编码视频数据。经由链路16传送或在存储装置34上提供的经编码视频数据可包含由视频编码器20产生的多种语法元素以供由例如视频解码器30等视频解码器用于解码视频数据。此类语法元素可与在通信媒体上发射、存储在存储媒体上或存储在文件服务器中的经编码视频数据包含在一起。

显示装置32可与目的地装置14集成或在目的地装置14外部。在一些实例中，目的地装置14可包含集成式显示装置，且还经配置以与外部显示装置介接。在其它实例中，目的地装置14可为显示装置。一般来说，显示装置32将经解码视频数据显示给用户，且可包括多种显示装置中的任一者，例如液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。

尽管图1中未展示，但在一些方面中，视频编码器20及视频解码器30可各自与音频编码器及解码器集成，且可包含适当多路复用器-多路分用器单元或其它硬件及软件以处置对共同数据流或单独数据流中的音频或视频两者的编码。在一些实例中，如果适用的话，多路复用器-多路分用器单元可以符合ITUH.223多路复用器协议，或例如用户数据报协议(UDP)等其它协议。

视频编码器20及视频解码器30各自可实施为多种合适的编码器电路中的任一者，例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。举例来说，可从设备或装置的角度描述本发明中描述的技术。作为一个实例，所述设备或装置可包含视频解码器30(例如，作为无线通信装置的部分的目的地装置14)，且视频解码器30可包含经配置以实施本发明中描述的技术(例如，根据本发明中描述的技术解码视频数据)的一或多个处理器。作为另一实例，所述设备或装置可包含包含视频解码器30的微处理器或集成电路(IC)，且所述微处理器或IC可为目的地装置14或另一种类型的装置的部分。相同情况可适用于视频编码器20(即，类似于源装置12和/或微控制器或IC的设备或装置包含视频编码器20，其中视频编码器20经配置以根据本发明中描述的技术编码视频数据)。

当部分地用软件实施所述技术时，装置可将用于所述软件的指令存储于合适的非暂时计算机可读媒体中且使用一或多个处理器用硬件执行所述指令以执行本发明的技术。视频编码器20和视频解码器30中的每一者可以包含在一或多个编码器或解码器中，所述编码器或解码器中的任一者可以集成为相应装置中的组合编码器/解码器(编解码器)的一部分。

视频序列通常包含来自视图的一系列视频图片。图片群组(GOP)通常包括一系列一或多个视频图片。GOP可包含GOP的标头、GOP的一或多个图片的标头或其它地方中的语法数据，其描述GOP中包含的图片的数目。每一图片可包含图片语法数据，其描述用于相应图片的编码模式。视频编码器20通常对个别视频图片内的视频块进行操作以便编码视频数据。视频块可对应于如H.264标准中界定的宏块、宏块的分区和可能的分区的子块，或对应于如HEVC标准中界定的译码单元(CU)、预测单元(PU)或变换单元(TU)；然而，本发明中描述的技术不限于这些块的实例。所述视频块可具有固定的或变化的大小，且可根据指定的译码标准而大小不同。每一视频图片可包含多个切片。每一切片可包含多个块。

作为实例，ITU-TH.264标准支持各种块大小的帧内预测(例如用于明度分量的16乘16、8乘8或4乘4及用于色度分量的8x8)，以及各种块大小的帧间预测，例如用于明度分量的16x16、16x8、8x16、8x8、8x4、4x8及4x4及用于色度分量的对应缩放大小。在本发明中，“NxN”及“N乘N”可互换地使用以指代块在垂直及水平尺寸方面的像素尺寸(例如，16x16像素或16乘16像素)。一般来说，16x16块将在垂直方向上具有16个像素(y＝16)，且在水平方向上具有16个像素(x＝16)。同样，NxN块一般在垂直方向上具有N个像素，并且在水平方向上具有N个像素，其中N表示非负整数值。块中的像素可布置成行及列。此外，块未必需要在水平方向与垂直方向上具有相同数目的像素。举例来说，块可包括NxM个像素，其中M未必等于N。

在对块进行帧内模式编码(例如，帧内预测)时，块可包含描述块的帧内预测模式的数据。作为另一实例，在对块进行帧间模式编码(例如，帧间预测)时，块可包含定义块的运动向量的信息。此运动向量参考同一视图中的参考图片(例如，时间运动向量)，或参考另一视图中的参考图片(例如，视差运动向量)。定义块的运动向量的数据描述例如运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如，四分之一像素精度或八分之一像素精度)。另外，在进行帧间预测时，块可包含参考索引信息，例如运动向量所指向的参考图片及/或运动向量的参考图片列表(例如，RefPicList0或RefPicList1)。

在H.264标准中，在帧内预测性或帧间预测性译码后，视频编码器20计算宏块的残余数据。残余数据可对应于未经编码图片的像素与H.264中的宏块的预测值之间的像素差。

在一些实例中，在进行任何变换以产生变换系数之后，视频编码器20执行变换系数的量化。量化大体上是指变换系数经量化以可能减少用于表示系数的数据量从而提供进一步压缩的过程。量化过程减少与系数中的一些或全部相关联的位深度。举例来说，n位值在量化期间被下舍入到m位值，其中n大于m。

在一些实例中，视频编码器20利用预定义扫描次序扫描经量化变换系数以产生可经熵编码的串行化向量。在其它实例中，视频编码器20执行自适应扫描。在扫描经量化变换系数以形成一维向量之后，在一些实例中，视频编码器20根据上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法(作为几个实例)对所述一维向量进行熵编码。视频编码器20还对与经编码视频数据相关联的语法元素进行熵编码以供视频解码器30在对视频数据解码时使用。

为了执行CABAC，视频编码器20可以向待发射的符号指派上下文模型内的一个上下文。举例来说，所述上下文可与符号的相邻值是否为非零有关。为了执行CAVLC，视频编码器20可以选择用于待发射的符号的可变长度码。VLC中的码字可经构造而使得相对较短的码对应于更有可能的符号，而较长的码对应于不太可能的符号。举例来说，与对待发射的每一符号使用等长度码字的情形相比较，以此方式，使用VLC可实现位节省。概率确定可基于指派给符号的上下文。

视频解码器30实施视频编码器20的技术的逆技术。举例来说，视频解码器30对经编码视频位流进行解码且通过逆量化和逆变换确定残余块。视频解码器30将残余块与先前经解码图片的块进行求和以确定图片内的块的像素值。

如上文所描述，本发明中描述的技术是针对3D-AVC。为了更好地理解所述技术，以下描述一些H.264/AVC译码技术、从H.264/MVC扩展和高效率视频译码(HEVC)标准的角度的多视图视频译码以及3D-AVC技术。

对于H.264/高级视频译码(AVC)，对宏块实施视频编码或解码(例如，译码)，其中宏块表示经帧间预测或经帧内预测(即，经帧间预测编码或解码或者经帧内预测编码或解码)的帧的一部分。举例来说，在H.264/AVC中，可以四个不同方式分割每一帧间宏块(MB)(例如，经帧间预测宏块)：一个16x16MB分区，两个16x8MB分区，两个8x16MB分区，或四个8x8MB分区。一个MB中的不同MB分区可具有用于每一方向的不同参考索引值(即，RefPicList0或RefPicList1)。当MB未分割成多个(1个以上)MB分区时，其在每一方向中针对整个MB分区具有仅一个运动向量。

作为视频译码(编码或解码)的部分，视频编码器20和视频解码器30经配置以构造一个或两个参考图片列表，称为RefPicList0和RefPicList1。参考图片列表识别可用以对帧或切片的宏块进行帧间预测的参考图片。举例来说，视频编码器20可用信号表示参考索引和参考图片列表识别符。视频解码器30可接收参考索引和参考图片列表识别符，且根据参考索引和参考图片列表识别符确定将用于对当前宏块进行帧间预测解码的参考图片。

当MB分割成四个8x8MB分区时，每一8x8MB分区可进一步分割成子块。存在四个不同方式来从8x8MB分区得到子块：一个8x8子块，两个8x4子块，两个4x8子块，或四个4x4子块。每一子块可具有每一方向中的不同运动向量，但针对每一方向共享同一参考图片索引。8x8MB分区分割成子块的方式称为子块分区。

对于多视图视频译码，存在多个不同视频译码标准。为了避免混淆，当本发明一般地描述多视图视频译码时，本发明使用短语“多视图视频译码”。一般来说，在多视图视频译码中，存在基础视图和一或多个增强或相依视图。基础视图可在不参考相依视图中的任一者的情况下完全解码(即，基础视图仅以时间运动向量进行帧间预测)。这允许未经配置以用于多视图视频译码的编解码器仍接收完全可解码的至少一个视图(即，可提取出基础视图且丢弃其它视图，从而允许未经配置以用于多视图视频译码的解码器仍对视频内容进行解码，但无3D体验)。所述一或多个增强或相依视图可相对于基础视图或相对于其它增强视图或相依视图进行帧间预测(即，视差补偿预测)，或相对于同一视图中的其它图片进行帧间预测(即，运动补偿预测)。

鉴于一般使用“多视图视频译码”，首字母缩写MVC与H.264/AVC的扩展相关联。因此，当本发明使用首字母缩写MVC时，本发明具体地参考对H.264/AVC视频译码标准的扩展。H.264/AVC的MVC扩展除时间运动向量之外还依赖于视差运动向量作为另一种类型的运动向量。JCT-3V和MPEG还已经开发称为MVC加深度(MVC+D)的另一视频译码标准。MVC+D应用与用于纹理和深度两者的MVC的那些工具相同的低层级译码工具，且深度的解码独立于纹理的解码且反之亦然。举例来说，在MVC中，帧仅由一个视图分量表示，所述视图分量称为纹理视图分量或简称为纹理。在MVC+D中，存在两个视图分量：纹理视图分量和深度视图分量，或简称为纹理和深度。举例来说，在MVC+D中，每一视图包含纹理视图和深度视图，其中视图包含多个视图分量，纹理视图包含多个纹理视图分量，且深度视图包含多个深度视图分量。

每一纹理视图分量与深度视图分量相关联以形成视图的视图分量。深度视图分量表示纹理视图分量中的对象的相对深度。在MVC+D中，深度视图分量和纹理视图分量是单独可解码的。举例来说，视频解码器30可实施MVC编解码器的两个实例，其中第一编解码器解码纹理视图分量且第二编解码器解码深度视图分量。这两个编解码器可独立于彼此而执行，因为纹理视图分量和深度视图分量是单独地经编码。

在MVC+D中，深度视图分量始终紧接着跟随相关联(例如，对应)的纹理视图分量。以此方式，MVC+D支持纹理优先译码，其中纹理视图分量是在深度视图分量之前经解码。

纹理视图分量及其相关联(例如，对应)深度视图分量可包含相同的图片次序计数(POC)值和view_id(即，纹理视图分量及其相关联深度视图分量的POC值和view_id是相同的)。POC值指示纹理视图分量的显示次序且view_id指示纹理视图分量和深度视图分量属于的视图。

图2中展示了典型MVC解码次序(即，位流次序)。解码次序布置被称作时间优先译码。应注意，存取单元的解码次序可能并不等同于输出或显示次序。在图2中，S0到S7各自是指多视图视频的不同视图。T0到T8各自表示一个输出时间实例。存取单元可包含针对一个输出时间实例的所有视图的经译码图片。举例来说，第一存取单元可包含针对时间实例T0的所有视图S0到S7，第二存取单元可包含针对时间实例T1的所有视图S0到S7，等。

出于简洁目的，本发明可使用以下定义：

视图分量：单个存取单元中的视图的经译码表示。当视图包含经译码纹理和深度表示两者时，视图分量可包含纹理视图分量和深度视图分量。

纹理视图分量：单个存取单元中的视图的纹理的经译码表示。

深度视图分量：单个存取单元中的视图的深度的经译码表示。

如上文所论述，在本发明的上下文中，视图分量、纹理视图分量和深度视图分量可总体上被称作层。在图2中，视图中的每一者包含若干图片集合。举例来说，视图S0包含图片集合0、8、16、24、32、40、48、56及64，视图S1包含图片集合1、9、17、25、33、41、49、57及65，等等。每一集合包含两个图片：一个图片称为纹理视图分量，且另一图片称为深度视图分量。视图的图片集合内的纹理视图分量及深度视图分量可被视为对应于彼此。举例来说，视图的图片集合内的纹理视图分量被视为对应于视图的图片集合内的深度视图分量，且反过来也一样(即，深度视图分量对应于其集合中的纹理视图分量，且反过来也一样)。如本发明中所使用，对应于深度视图分量的纹理视图分量可认为是为单个存取单元的相同视图的部分的纹理视图分量及深度视图分量。

纹理视图分量包含所显示的实际图像内容。举例来说，纹理视图分量可包含明度(Y)和色度(Cb和Cr)分量。深度视图分量可指示其对应纹理视图分量中的像素的相对深度。作为一个实例，深度视图分量为仅包含明度值的灰阶图像。换句话说，深度视图分量可并不传达任何图像内容，而是提供纹理视图分量中的像素的相对深度的量度。

举例来说，深度视图分量中的纯白色像素指示对应纹理视图分量中的其对应像素较接近于观察者的视角，且深度视图分量中的纯黑色像素指示对应纹理视图分量中的其对应像素距观察者的视角较远。黑色与白色之间的各种灰度梯度指示不同深度等级。举例来说，深度视图分量中的深灰色像素指示纹理视图分量中的其对应像素比深度视图分量中的浅灰色像素更远。因为仅需要灰阶来识别像素的深度，所以深度视图分量不需要包含色度分量，这是因为深度视图分量的颜色值可能并不用于任何目的。

出于说明的目的而提供深度视图分量仅使用明度值(例如，强度值)来识别深度，且不应被视为限制性的。在其它实例中，可利用任何技术来指示纹理视图分量中的像素的相对深度。

图3中展示了用于多视图视频译码的典型MVC预测结构(包含每一视图内的图片间预测及视图之间的视图间预测两者)。预测方向由箭头指示，箭头指向的对象使用箭头出发的对象作为预测参考。在MVC中，由视差运动补偿支持视图间预测，所述视差运动补偿使用H.264/AVC运动补偿的语法但允许将不同视图中的图片用作参考图片。

在图3的实例中，说明八个视图(具有视图ID“S0”到“S7”)，且对于每一视图说明十二个时间位置(“T0”到“T11”)。即，图3中的每一行对应于视图，而每一列指示时间位置。

尽管MVC具有可由H.264/AVC解码器解码的所谓的基础视图，且MVC还可支持立体视图对，但MVC的优点在于其可支持使用两个以上视图作为3D视频输入且解码通过多个视图表示的此3D视频的实例。具有MVC解码器的客户端的再现器可预期具有多个视图的3D视频内容。

在每一行及每一列的交叉点处指示图3中的图片。H.264/AVC标准可使用术语帧来表示视频的一部分。本发明可互换地使用术语图片与帧。

使用包含字母的块来说明图3中的图片，字母指明对应图片是经帧内译码(即，I图片)，还是在一个方向上经帧间译码(即，作为P图片)，还是在多个方向上经帧间译码(即，作为B图片)。大体来说，预测由箭头指示，其中箭头指向的图片使用箭头出发的图片用于预测参考。举例来说，时间位置T0处的视图S2的P图片是从时间位置T0处的视图S0的I图片预测的。

如同单视图视频编码，多视图视频译码视频序列的图片可相对于不同时间位置处的图片预测性地编码。举例来说，时间位置T1处的视图S0的b图片具有从时间位置T0处的视图S0的I图片指向其的箭头，从而指示所述b图片是从所述I图片预测的。然而，此外，在多视图视频编码的上下文中，图片可经视图间预测。也就是说，视图分量可使用其它视图中的视图分量用于参考。举例来说，在MVC中，如同另一视图中的视图分量为帧间预测参考而实现视图间预测。潜在视图间参考在序列参数集(SPS)MVC扩展中用信号通知且可通过参考图片列表构造过程加以修改，所述参考图片列表构造过程实现帧间预测或视图间预测参考的灵活排序。视图间预测也是包含3D-HEVC(多视图加深度)的HEVC的所提出的多视图扩展的特征。

图3提供视图间预测的各种实例。在图3的实例中，视图S1的图片说明为是从视图S1的不同时间位置处的图片预测，且是从相同时间位置处的视图S0及S2的图片经视图间预测。举例来说，时间位置Tl处的视图S1的b图片是从时间位置T0及T2处的视图S1的B图片中的每一者以及时间位置T1处的视图S0及S2的b图片预测。

在一些实例中，图3可被视为说明纹理视图分量。举例来说，图2中所说明的I、P、B及b图片可被视为视图中的每一者的纹理视图分量。根据本发明中描述的技术，对于图3中说明的纹理视图分量中的每一者，存在对应深度视图分量。在一些实例中，可以类似于图3中针对对应纹理视图分量所说明的方式预测深度视图分量。

也可由MVC支持两个视图的译码。MVC的优势中的一者为MVC编码器可将两个以上视图当作3D视频输入且解码器可解码此多视图表示。因而，具有MVC解码器的任何再现器可解码具有两个以上视图的3D视频内容。

如上文所论述，在MVC中，允许在相同存取单元中(在一些情况下意味着具有相同时间实例)的图片当中进行视图间预测。当对非基础视图中的一者中的图片进行译码时，如果图片处于不同视图中但在相同时间实例内，那么可将所述图片添加到参考图片列表中。可将视图间预测参考图片放置在参考图片列表的任何位置中，正如任何帧间预测参考图片一般。如图3中所示，视图分量可出于参考目的使用其它视图中的视图分量。在MVC中，如同另一视图中的视图分量为帧间预测参考般实现视图间预测。

在MVC中，允许在相同存取单元(即，具有相同时间实例)中的图片当中的视图间预测。当对非基础视图中的一者中的图片进行译码时，如果图片处于不同视图中但具有相同时间实例，那么可将所述图片添加到参考图片列表中。可将视图间预测参考图片放置在参考图片列表的任何位置中，正如任何帧间预测参考图片一般。

如图3中所示，视图分量可出于参考目的使用其它视图中的视图分量。此情况被称为视图间预测。在MVC中，如同另一视图中的视图分量为帧间预测参考般实现视图间预测。

在多视图视频译码的上下文中，存在两个种类的运动向量。一个是指向时间参考图片的正常运动向量。对应的时间帧间预测是运动补偿预测(MCP)。另一类型的运动向量是指向不同视图中的图片(即，视图间参考图片)的视差运动向量。对应的帧间预测是视差补偿预测(DCP)。

当前，VCEG和MPEG的3D视频译码联合合作小组(JCT-3V)正在开发基于H.264/AVC的3DV标准，即，3D-AVC。对于3D-AVC，已经包含且支持除MVC中的视图间预测以外的新译码工具。用于3D-AVC的最新软件3D-ATM可从以下链接下载：[3D-ATM版本6.2]：http://mpeg3dv.research.nokia.com/svn/mpeg3dv/tags/3DV-ATMv6.2/

基于AVC的3D视频(3D-AVC)译码标准当前在由JCT-3V开发，且3D-AVC的最新版本现在公开可用：M·M·汉努克塞拉、Y·陈、T·铃木、J.-R.欧姆、G·J·萨利文，“3D-AVC草案文本5”，JCT3V-C1002，瑞士日内瓦，2013年1月。其从以下链接可用且以引用的方式并入本文：http://phenix.it-sudparis.eu/jct2/doc_end_user/documents/3_Geneva/wg11/JCT3V-C1002-v3.zip。

3D-AVC以基础视图的纹理部分对于H.264/AVC解码器完全可解码的方式兼容于H.264/AVC。举例来说，基础视图的视图分量中的纹理视图分量可仅以同一基础视图中的其它纹理视图分量进行帧间预测。基础视图中的纹理视图分量不可进行视图间预测。并且，基础视图中的纹理视图分量可不需要对应深度视图分量用于解码目的。

对于3D-AVC中的增强视图分量，在一些其它实例技术中，深度可在纹理之前经译码，且纹理视图分量可基于来自深度视图分量的信息而经译码，其也被称作深度优先译码。然而，例如在上述MVC+D中，每一纹理视图分量在纹理优先译码次序中在相应深度视图分量之前经译码。换句话说，在一些其它实例技术中，在3D-AVC中，首先对基础视图的纹理视图分量进行译码，接着是基础视图的相关联深度视图分量，接着是第一增强或相依视图的深度视图分量，接着是第一增强或相依视图的相关联纹理视图分量，接着是第二增强或相依视图的深度视图分量，接着是第二增强或相依视图的相关联纹理视图分量，等。

举例来说，如下例示3D-AVC中的纹理和深度视图分量的译码次序。在以下实例中，T0和D0分别指代基础视图的纹理和深度视图分量，且Ti和Di分别指代第i相依视图的纹理和深度视图分量。在以下实例中，考虑三个视图。

在第一实例中，考虑的视图是T0、D0、D1、D2、T1和T2。在此实例中，基础视图(T0和D0)是以纹理优先译码次序译码，而相依视图是以深度优先译码次序译码。当前在3D-AVC的共同测试条件中使用混合译码次序。在另一实例中，译码的次序是T0、D0、T1、D1、T2和D2。也就是说，所有视图分量是以纹理优先译码次序译码。如果针对Ti启用视图间预测，那么将参考纹理视图界定为包含视图间参考图片的视图且将对应深度视图界定为具有与参考纹理视图的视图次序索引相同的视图次序索引的参考深度视图。

一些其它3D-AVC技术需要深度优先译码，因为导出纹理视图分量的块的视差向量需要对应的深度视图分量。以下描述经由深度图的此视差向量导出。用于导出视差向量的技术可随着每一低层级译码工具而变化，但通常，相依视图的深度数据用于视差向量导出以用于纹理视图分量译码。这是因为由于深度优先译码次序，相依视图的深度视图是可用的。在3D-AVC中使用的低层级译码工具是环路内基于块的视图合成视图间预测(BVSP)和基于深度的运动向量预测(D-MVP)。视频译码器(例如视频解码器30)可使用从相依视图(有时称为相依性帧)中的深度视图(有时称为深度图)的深度值转换的视差向量。在3D-AVC参考软件中，通常，从实际深度图值到特定视图的视差的转换过程的结果与相机参数一起存储在查找表中。

图4是基于后向扭曲的BVSP的概念图。BVSP最初在W·苏等人的“3DV-CE1.a：用于3DV-ATM的基于块的视图合成预测”(JCT3V-A0107)中提出，以上文献可从以下链接下载且以引用的方式并入本文：http://phenix.it-sudparis.eu/jct2/doc_end_user/documents/1_Stockholm/wg11/JCT3V-A0107-v1.zip。参见图4，假定利用以下译码次序：(T0,D0,D1,T1)。纹理分量T0是基础视图，且T1是以VSP(视图合成预测)译码的相依视图。深度图分量D0和D1是与T0和T1相关联的相应深度图。

在相依视图T1中，当前经译码块Cb的样本值是从由基础视图T0的样本值组成的参考区域R(Cb)预测(VSP预测)。将待译码当前样本与参考样本之间的位移向量(Disp_vec)标示为从与当前经译码纹理样本相关联的深度图值导出的T1与T0之间的视差向量。

从深度值到视差向量的转换的过程可例如用以下等式执行：

D (C b (j, i)) = \frac{f \cdot b}{Z (C b (j, i))}; - - - (2)

其中j和i是Cb内的局部空间坐标，d^Cb(j,i)是视图1的深度图图像中的深度图值，Z是实际对应深度值，且D是到特定视图0的所导出视差向量的水平分量。参数f、b、Z近和Z远是指定相机设置的参数；即，使用的焦距(f)、视图#1与视图#0之间的相机分离(b)，以及表示深度图转换的参数的深度范围(Z近,Z远)。

应注意，在一些实例中，将所导出的视差向量的垂直分量设定成0。并且，在一些3DV-ATM实施方案中，等式(1)和(2)已经针对每个深度图值(0...255)预先计算且存储为查找表。

下一部分将论述BVSP的若干实施方案问题。一个问题涉及BVSP块的指示。如下指示BVSP块：

-使用MB层级的一个旗标来用信号表示当前MB是否以常规跳过/直接模式译码或其是否以跳过/直接模式译码但从合成参考分量预测。

-对于每一MB分区(从16x16到8x8)，使用每一参考图片列表中的参考索引(或旗标，如用于3D-AVC的一些提议中)来用信号表示参考图片。当在BVSP模式中对分区进行译码时，不用信号表示运动向量差，因为不存在BVSP经译码块的运动向量。

当旗标或参考索引指示合成参考分量时，调用如随后的项目中描述的一个分区的预测。对于其大小由NxM指示(其中N或M将为8或16)的每一MB分区，如果MB分区以BVSP模式译码，那么将当前MB分区进一步分割成具有等于KxK的大小的若干子区(其中K可为8x8(如3D-AVC的一些提议中)、4x4、2x2或1x1)。对于每一子区，导出单独的视差向量，且从视图间参考图片中通过所导出的视差向量定位的一个块(即，图4中的R(cb))预测每一子区。在一些实例性共同测试条件中，K经界定为4。应注意，针对BVSP经译码块不存储导出的视差向量，因为不存在使用此些向量的译码工具。

另一实施方案问题涉及视差向量导出过程。当应用深度优先译码次序时，通过转换对应非基础深度视图中的对应深度块的深度值可获得所导出的视差向量，如图4中示出。可应用若干技术以选择一个深度块的深度值，例如深度块的中心位置的深度值、一个深度块内的所有深度值中的最大值、一个深度块内的四个拐角像素的最大值，以及深度块/深度MB的右下像素的深度值。当应用纹理优先译码次序时，将停用BVSP模式，因为当解码非基础纹理视图时对应非基础深度视图不可用。

现将论述用于正常帧间模式的3D-AVC中的基于深度的运动向量预测(D-MVP)。D-MVP指代并入了当前视图中的相关联深度图数据的运动向量预测方法，所述深度图数据由于深度优先译码次序而可用。所述方法是以相依视图中的纹理视图分量而应用。

在3D-AVC中，D-MVP方法并入到H.264/AVC的基于常规中值函数的运动向量预测中。具体来说，首先从相邻块中的运动向量的参考索引识别待预测运动向量的类型(即，时间运动向量还是视差运动向量)，且因此确定运动预测的类型。如图8中示出，当前分区的相邻块可按次序包含相对于当前块的左边块(标示为‘A’)、上方块(标示为‘B’)、右上方块(标示为‘C’)以及左上方块(标示为‘D’)。左上方块中的运动向量可当其它三个相邻块中的一者并不含有运动向量且因此视为不可用时使用。

假定三个相邻块的运动向量是可用的，那么采用所述三个相邻块中的运动向量用于当前块的运动向量预测。在时间预测中，如果其运动向量全部具有相同类型且具有相同参考索引，那么如H.264/AVC中那样直接使用中值滤波器。否则，如果运动向量属于不同类型且具有不同参考索引，那么进一步导出当前块的运动向量。在当前参考图片是视图间参考图片时，检查相邻块位置中的运动向量类型及其参考索引。如果相邻块全部具有相同类型和相同参考索引，那么应用中值滤波器。在两个情况中，如果少于三个相邻块可用，那么进一步导出不可用的块的运动向量以使得三个相邻块变为可用的。

针对相邻块导出的运动向量称为导出的运动向量，且如下产生。如果当前运动向量是视差运动向量，且相邻块的运动向量具有与当前运动向量的类型不同的类型(或不可用)，那么将相邻块的导出的运动向量设定成视差运动向量，其是从对应深度视图分量转换的。使用同一视图的深度视图分量的对应块，且将此对应块的四个拐角的深度值中的最大值转换成视差值，其变成导出的运动向量的水平分量。将导出的运动向量的垂直分量设定成零。

如果当前运动向量是时间运动向量，那么使用视差值(如上文所论述导出)确定参考(基础)视图中的参考块的时间运动向量，且将导出的运动向量设定成时间运动向量。如果时间运动向量被视为不可用(例如，在帧内块的情况下，或如果运动向量并不指向与当前参考图片对准的参考视图中的参考图片)，那么将导出的运动向量设定成零。

现将论述用于跳过和直接模式的3D-AVC中的视图间运动预测。3D-AVC中的视图间运动预测是在P-跳过、B-跳过、B-16x16直接模式和B-8x8直接模式中执行。视差向量可初始地从相邻块导出，以及导出从同一视图的深度视图分量的深度值转换的视差向量。

如果一个可用的空间相邻块含有视差运动向量，那么此视差运动向量变成当前块的视差向量。否则，对于并不含有视差运动向量的相邻块，将用于当前块的视差运动向量是从对应于同一视图的深度值转换的(类似于D-MVP中的转换)。在一些实例中，将中值滤波器应用于三个相邻块以获得视差向量。

导出的向量可用以获得相对于参考(基础)视图中的参考块的时间运动向量。如果时间运动向量不可用，那么可首先导出参考索引，且应用上文所论述的D-MVP过程以产生运动向量预测符。

现将论述基于相邻块的视差向量(NBDV)导出。当纹理优先译码次序用于所有视图时NBDV用作3D-HEVC中的视差向量导出方法。在当前3D-HEVC设计中，NBDV导出也用以从参考视图的深度图检索深度数据。

参考软件描述的一个版本以及3D-HEVC的工作草案将如下可用且以引用的方式并入本文：格哈德技术公司(GerhardTech)，克雷兹托夫·韦格纳(KrzysztofWegner)，陈英(YingChen)，叶思宏(SehoonYea)，“3D-HEVC测试模型描述草案2”(JCT3V-B1005，ITU-TSG16WP3和ISO/IECJTC1/SC29/WG11的3D视频译码扩展开发联合合作小组第2次会议：中国上海，2012年10月)。

视差向量(DV)用作两个视图之间的视差的估计器。也就是说，视差向量是相对于当前图片中的块的指针，其指向同一时间实例中的已经译码图片中的对应块。因为相邻块在视频译码中几乎共享相同运动/视差信息，所以当前块可使用相邻块中的运动向量信息作为良好预测符。依照此想法，NBDV导出过程使用相邻块的视差信息用于估计不同视图中的视差向量。

为了执行NDBD导出，初始地界定候选相邻块。利用相邻候选块的两个集合。一个集合是来自空间相邻块且另一集合是来自时间相邻块。随后以通过当前块与候选块之间的相关的优先级所确定的预定义次序来检查空间和时间相邻候选块中的每一者。一旦在候选者中找到视差运动向量(即，运动向量指向视图间参考图片)，便将所述视差运动向量转换成视差向量。

现将论述3D-HEVC中的NBDV导出的具体实例。3D-HEVC首先采用JCT3V-A0097中所提议的(基于)相邻块视差向量(NBDV)方法。JCTVC-A0126中的简化NBDV导出过程包含隐式视差向量。基于此，在JCT3V-B0047中，通过移除存储在经解码图片缓冲器中的隐式视差向量而进一步简化NBDV导出，并且以随机存取点(RAP)图片选择改善译码增益。

JCT3V-A0097:3D-CE5.h:视差向量产生结果(L·张，Y·陈，M·卡塞维茨(高通))以引用的方式并入本文。

JCT3V-A0126:3D-CE5.h:基于HEVC的3D视频译码的视差向量导出的简化(J·孙，M·古，S·叶(LG))以引用的方式并入本文。

JCT3V-B0047:3D-CE5.h相关：视差向量导出的改进(J·康，Y·陈，L·张，M·卡塞维茨(高通))以引用的方式并入本文。

在NBDV导出的一些提议中，五个空间相邻块用于视差向量导出。如图5中示出，所述五个空间相邻块是当前PU500的左下方、左边、右上方、上方和左上方块，如由A0、A1、B0、B1或B2指示。应注意它们与在HEVC中的合并模式中使用的那些相同。因此，不需要额外存储器存取。

在检查时间相邻块之前，首先执行候选图片列表的构造过程。来自当前视图的所有参考图片可视为候选图片。首先将位于同一地点的参考图片插入到候选图片列表，接着是按参考索引的升序的候选图片的其余部分。当两个参考图片列表中具有相同参考索引的参考图片可用时，在与所述位于同一地点的图片相同的参考图片列表中的参考图片位于具有匹配参考索引的另一参考图片之前。对于候选图片列表中的每一候选图片，确定三个候选区以用于导出时间相邻块。

当以视图间运动预测对块进行译码时，导出视差向量以用于选择不同视图中的对应块。视图间运动预测中导出的视差向量可被称为隐式视差向量(IDV)。即使以运动预测对块进行译码，出于对随后块进行译码的目的也不会丢弃IDV。

通常，NBDV导出过程涉及检查时间相邻块中的视差运动向量、空间相邻块中的视差运动向量以及随后检查IDV(以此次序)。一旦找到视差向量，便终止所述过程。+

现将论述3D-HEVC中的后向VSP。在3D-HEVC中，当应用纹理优先译码次序时，对于每一预测单元(PU)，可在考虑或不考虑参考深度视图中的深度值的情况下从NBDV导出过程导出视差向量。在获得视差向量之后，如果其是用BVSP模式译码的，那么将针对一个PU的每一MxN(其中M/N可等于例如8或4)子区进一步对其进行精炼。

所述精炼过程包含两个步骤:1)从由所导出的视差向量定位的参考深度视图中的MxN深度块选择一个最大深度值；2)将所述深度值转换到经精炼视差向量的水平分量，同时保持经精炼视差向量的垂直分量为0。在针对一个PU的一个MxN子区精炼视差向量之后，使用经精炼视差向量来定位参考纹理视图中的一个块用于运动补偿。

现将论述3D-AVC中的NBDV导出过程。如通过引用方式并入本文的在2014年2月25日申请的第14/189,177号共同待决美国专利申请案中描述，MB层级NBDV导出可用以导出当前MB的视差向量。所导出的视差向量可进一步用于运动向量预测。一旦识别出视差运动向量，即，时间或空间相邻块中的一者使用视图间参考图片，那么返回其作为当前MB的视差向量。

以下更详细描述第14/189,177号美国专利申请案的技术。一些先前的3D-AVC技术要求纹理视图分量的深度视图分量可用于视差向量导出(即，要求用于相依性或增强视图的深度优先译码)，其导致例如解码等待时间、实施方案复杂性、缺乏到其它视频译码标准的可缩放性、在不需要深度视图分量的情况下的带宽低效率等问题，以及其它潜在缺点。

在第14/189,177号美国专利申请案中描述的技术允许并不需要依赖于对应深度视图分量的视差向量导出。以此方式，所述技术允许具有视差向量导出的用于相依视图的3D-AVC中的纹理优先译码。为了实现视差向量导出，第14/189,177号美国专利申请案中描述的技术依赖于相邻块的运动向量信息。作为一个实例，如果相邻块的运动向量是视差运动向量，那么所述技术利用相邻块的视差运动向量作为当前块的视差向量。以此方式，视频编码器20和视频解码器30可确定纹理视图分量的当前宏块的视差向量而不需要依赖于对应深度视图分量。

视频编码器20和视频解码器30可经配置以实施第14/189,177号美国专利申请案中描述的技术。举例来说，视频编码器20和视频解码器30可经配置以通过允许针对每一视图分量首先译码纹理视图而实施实现3D-AVC的高效译码的技术。视频编码器20和视频解码器30可使用NBDV的概念导出视差向量，其当3D-AVC中对应深度数据由于纹理优先译码次序而不可用(或尚未可用)时考虑来自当前块的空间/时间相邻块的一个以上可用的视差运动向量。

作为一个实例，视频解码器30可接收在3D-AVC顺应视频译码过程中以相依视图的纹理优先译码产生的经译码位流。在此实例中，3D-AVC顺应视频译码过程指代使用3D-AVC视频译码标准中界定的视频译码工具的视频译码过程。相依视图的纹理优先译码指代其中在对应深度视图分量(即，T0、D0、T1、D1等)之前对纹理视图分量进行译码的情况。

视频解码器30可在3D-AVC顺应视频译码过程中对相依视图中的相依视图的纹理视图分量进行解码。在此实例中，为了对纹理视图分量进行解码，视频解码器30可经配置以评估纹理视图分量中的当前块的一或多个相邻块的运动信息以确定至少一个相邻块是否是以参考除相依视图外的视图中的视图间参考图片的视差运动向量进行视图间预测。并且，为了解码纹理视图分量，视频解码器30可经配置以基于相邻块中的一者的视差运动向量导出当前块的视差向量。视频解码器30可在解码纹理视图分量之后解码对应于纹理视图分量的深度视图分量。

作为另一实例，视频编码器20可在3D-AVC顺应视频译码过程中对相依视图的纹理视图分量进行编码。在此实例中，为了对纹理视图分量进行编码，视频编码器20可经配置以评估纹理视图分量中的当前块的一或多个相邻块的运动信息以确定至少一个相邻块是否是以参考除相依视图外的视图中的视图间参考图片的视差运动向量进行视图间预测。并且，为了编码纹理视图分量，视频编码器20可经配置以基于相邻块中的一者的视差运动向量导出当前块的视差向量。

视频编码器20可在编码纹理视图分量之后编码对应于纹理视图分量的深度视图分量。视频编码器20还可以包含经编码纹理视图分量和经编码深度视图分量的相依视图的纹理优先译码产生经译码位流以用于输出。

3D-AVC的当前提议展现以下问题。当利用第14/189,177号美国专利申请案中描述的NBDV方法时，BVSP主要由于视差向量始终不够准确的原因而变得较低效。并且，BVSP块的导出的视差向量(例如，从NBDV)可提供待译码块的更准确视差向量。然而，BVSP中此些导出的视差向量的使用尚未先前用于NBDV导出。

鉴于这些缺点，本发明提供当在对应非基础深度视图分量之前对非基础纹理视图分量进行译码时针对3D-AVC顺应视频编码器和视频解码器实现BVSP的解决方案。另外，由于如本发明的技术所提供的精细视差向量的导出，也改善了其它帧间译码模式的译码增益。

初始地，本发明中提议经改善的NBDV导出过程。本发明的NBDV导出过程经修改以并入BVSP，但本发明的某些方面不一定需要BVSP。将参考视频解码器30描述以下描述，但应理解下文技术中的每一者也可由视频编码器20实施。视频解码器30和视频编码器20两者可以经配置以执行本发明的技术的一或多个处理器实施。在一些实例中，视频解码器30和视频编码器20的所述一或多个处理器可经配置以执行存储在一或多个非暂时性计算机可读存储媒体上的软件。还应理解，在本发明的上下文中，“视频译码器”是应用于视频编码器和视频解码器两者的一般术语。同样，术语“视频译码”可指代视频编码或视频解码。

作为本发明的第一实例性NBDV导出过程，视频解码器30经配置以确定空间或时间相邻块是否是用BVSP模式译码的。对于针对NBDV导出过程界定的每一空间或时间相邻块执行此检查。如果相邻块是用BVSP模式译码的，那么视频解码器30将属于用BVSP模式译码的相邻块的运动向量表示为视差运动向量，不管相邻块是否位于当前图片或不同图片中。换句话说，视频解码器30在NBDV导出过程期间将用BVSP译码的相邻块中的运动向量以及用视图间预测译码的相邻块中的运动向量两者表示为可用的视差运动向量。

在本发明的第二实例性NBDV导出过程中，通过检查相邻块中的BVSP模式的使用可改善使用第14/189,177号美国专利申请案的技术的用于一个MB分区的MB层级NBDV导出过程。

在第二实例的第一方面中，视频解码器30可经配置以当下文两个以下条件中的任一者为真时使用每一时间和/或空间相邻块使用NBDV导出而导出视差向量：(1)如果相邻块是使用视图间预测译码的，或(2)如果相邻块是使用BVSP模式译码的。在相邻块是使用视图间预测译码的情况下，视频解码器30将与相邻块相关联的视差运动向量表示为当前块的视差向量。如果相邻块是使用BVSP模式译码的，那么视频解码器30将在相邻块的解码期间产生的视差向量表示为当前块的视差向量。

在本发明的第二实例的第二方面中，视频解码器30可采用二步法检查程序。首先，视频解码器30经配置以检查空间和/或时间相邻块中的至少一者是否是使用视图间预测译码的。如果不是，那么视频解码器30随后检查空间和/或时间相邻块中的至少一者是否是使用BVSP模式译码的。

在本发明的第二实例的第三方面中，上述二步法检查过程倒转。也就是说，视频解码器30经配置以首先检查相邻块中的至少一者是否是使用BVSP模式译码的。如果不是，那么视频解码器30经配置以随后检查所有空间(和/或)时间相邻块中的至少一者是否是使用视图间预测译码的。

第二实例的上述方面中的每一者可应用于分区层级NBDV导出算法以及MB层级NBDV导出算法。

在本发明的第三实例性NBDV导出过程中，通过将包含存取参考深度视图的额外步骤添加到过程的末端可进一步精炼MB层级NBDV导出过程。在一些实例中，视频解码器30可经配置以对使用BVSP模式译码的块、对未使用BVSP模式译码的帧间预测块或对所有帧间预测块采用此额外步骤。

在第三实例的第一方面中，视频解码器30可经配置以从深度参考视图中的一个深度块选择一个深度值，且将所述深度值转换为经更新的视差向量。随后将此经更新的视差向量应用于当前MB内的所有MB分区。在一些实例中，视频解码器30可进一步经配置以存储此经更新/精炼的视差向量作为当前MB或MB分区的最终视差运动向量。

在本发明的第四实例性NBDV导出过程中，视频解码器30可经配置以在当前MB经解码之后将MB的所导出的视差向量(即，使用NBDV导出而导出)存储为当前MB的运动向量。

在本发明的第五实例性NBDV导出过程中，视频解码器30可经配置以为包含使用BVSP模式译码的至少一个MB分区的MB分配额外存储器。在此情况下，MB的视差向量可经存储且不需要覆写MB分区的任何经解码运动向量。

在第五实例的第一方面中，分配每MB一个额外运动向量以在至少一个MB分区是使用BVSP模式译码的情况下存储从NBDV导出过程导出的MB的视差向量。

在第五实例的第二方面中，当采用NBDV导出过程时，视频解码器30可进一步经配置以当相邻块是使用BVSP模式译码的时使用与含有此相邻块的MB相关联的视差向量作为当前MB的视差向量。

在本发明的NBDV导出过程的第六实例中，视频解码器30可经配置以将上文实例技术的任何组合用于取决于视差向量的译码工具，例如正常帧间模式中的D-MVP以及跳过和直接模式中的视图间运动向量预测。在此实例中，经改善的NBDV导出过程的结果用于译码工具。举例来说，在D-MVP过程期间，从本发明的经改善的NBDV导出过程产生的所得视差向量可用以替换其它NBDV导出过程的结果(例如，来自第14/189,177号美国专利申请案中描述的NBDV导出过程的结果)。

应理解以上实例以及实例的方面中的任一者可以任一组合来一起执行。

本发明中还提出使用如上文所描述的经改善的NBDV导出过程的经改善的BVSP过程。然而，由于经改善的BVSP过程产生更准确视差向量的原因，同样也可能改善NBDV导出结果(即，可改善导出的视差向量的准确性)。

在本发明的第一实例性BVSP过程中，在BVSP过程期间，将MB层级NBDV导出过程和子区层级视差向量精炼过程组合。首先，视频解码器30可经配置以导出每一MB的视差向量。视频解码器30可经配置以使用上述经改善的NBDV导出过程或如第14/189,177号美国专利申请案中描述的NBDV过程导出视差向量。

接着，视频解码器30可经配置以精炼当前MB或MB分区的每一8x8子区的视差向量。视频解码器30可使用经精炼视差向量用于以BVSP模式译码的当前MB或MB分区的每一子区的运动补偿。MB或MB分区的每一子区的视差向量的精炼取决于参考视图的深度视图分量。在一个实例中，对于每一子区，通过来自NBDV导出过程的视差向量识别参考视图的深度分量中的对应深度块。将对应深度块中的四个拐角像素的最大值转换成经精炼视差向量的水平分量。将经精炼视差向量的垂直分量设定成0。应注意，此处经精炼视差向量与用BVSP模式译码的子区的所导出的视差向量相同，如上文所论述。

在第一BVSP实例的第一方面中，子区的大小可为KxK，其中K不同于8，例如16x16、4x4、2x2或1x1。在第一BVSP实例的第二方面中，视频解码器30经配置以针对一个MB分区精炼视差向量一次，或针对一个MB分区内的每一8x8区精炼视差向量，甚至当K小于8时也是如此。

在第一BVSP实例的第三方面中，视频解码器30可经配置以从通过参考视图的深度视图分量中的视差向量(由NBDV导出过程产生)识别的参考块的一或多个深度像素中选择深度值。在一些实例中，视频解码器30可经配置以不选择参考深度视图中的所识别深度块(通过来自NBDV导出过程的所导出的视差向量定位)的中心内或附近的全深度像素。实际上在一个实例中，视频解码器30可经配置以选择位于所识别深度块的拐角位置的深度像素。

在第一BVSP实例的第四方面中，视频解码器30可经配置以针对经精炼视差向量的垂直分量继承从NBDV导出过程导出的视差向量的垂直分量。在第一BVSP实例的第五方面中，视频解码器30可经配置以将经精炼视差向量的垂直分量设定为等于0。

在本发明的第二实例性BVSP过程中，视频解码器30经配置以针对使用BVSP模式译码的MB分区在当前MB经译码之后将每一子区的经精炼视差向量存储为MB分区的运动向量。在一个实例中，在MB子区的大小大于或等于4x4的情况下执行此过程。所存储的视差向量可以用于上述本发明的NBDV导出过程中。

在第二BVSP实例的第一方面中，当子区的经界定大小是8x8时(即，当K等于8时)，视频解码器30可经配置以仅当MB分区大小等于8x8时将经精炼视差向量存储为MB分区的运动向量。对于其它MB分区，视频解码器30经配置以在当前MB经译码之后将来自NBDV导出过程的MB的所导出的视差向量存储为视差运动向量。

在第二BVSP实例的第二方面中，视频解码器30可进一步经配置以通过指示视图间参考图片的索引替换参考图片索引。

在第二BVSP实例的第三方面中，一旦用BVSP模式译码的MB分区经译码，便可直接应用上述BVSP技术中的每一者。也就是说，举例来说，视频解码器30不必等待直到整个MB完全经解码。

在本发明的第三实例性BVSP过程中，视频解码器30可经配置以为包含使用BVSP模式译码的至少一个MB分区的MB分配额外存储器。在此情况下，用于BVSP分区的运动补偿的每一子区的经精炼视差向量可经存储且并不需要覆写。

在第三BVSP实例的第一方面中，视频解码器30可经配置以在分区是使用BVSP模式译码的情况下针对一个MB分区分配每MB多达(16/K)*(16/K)个额外运动向量以存储经精炼视差向量。

在第三BVSP实例的第二方面中，在NBDV导出过程中，当一个相邻块是使用BVSP模式译码的时，与含有此相邻块的子区相关联的经精炼视差向量将用作当前MB的视差向量。

上文方法中的每一者也可以应用于3D-HEVC，其中MB被译码单元(CU)代替且MB分区被预测单元(PU)代替。

1实例实施方案

本发明的下一部分将论述实例实施方案。当以纹理优先译码次序经启用的方式配置3D-AVC时，BVSP的解码过程可包含以下步骤。或者，以下部分1.2中描述的方法可应用于需要视差向量的其它译码工具，例如3D-AVC中的D-MVP。

部分1.1BVSP模式的实例指示

在一个实例中，如使用深度优先译码次序的3D-AVC的先前提议中所使用，一或多个MB分区是使用BVSP模式译码的指示可再使用。在另一个实例中，可在每一MB分区中用信号表示一个旗标而不是参考索引，以指示是否使用了BVSP或常规帧间预测(时间预测或视图间预测)。

部分1.2实例性视差向量导出过程

下文的子部分1.2.1和1.2.2中描述NBDV导出过程。下文的子部分1.2.3中描述用于经BVSP译码的分区中的每一子区的运动补偿的经精炼视差向量的产生过程。

可在解码一个宏块之前调用从NBDV导出过程导出视差向量的过程。此外在另一个实例中，可针对以BVSP模式译码的MB分区调用精炼视差向量的过程。在另一个实例中，当一个MB分区是以BVSP模式和/或其它帧间模式译码的时可调用从NBDV导出视差向量的过程。

在另一个实例中，下文的子部分1.2.1和1.2.3的技术按次序执行，且随后从子部分1.2.3的技术产生的子区的经精炼视差向量用于经BVSP译码的MB分区的运动补偿。此外，在D-MVP中可应用从下文的子部分1.2.1的技术产生的视差向量。

在另一个实例中，按次序调用子部分1.2.1、1.2.2和1.2.3的技术。从下文的部分1.2.2的技术产生的经更新视差向量随后用于以BVSP或其它帧间模式译码的所有MB分区。对于以BVSP模式译码的MB分区，经更新视差向量随后用以获得用于经BVSP译码MB分区的运动补偿的子区的经精炼视差向量。

子部分1.2.1从用于不具有深度信息的一个宏块的NBDV导出过程导出的视差向量

如第14/189,177号美国专利申请案中描述，可应用MB层级NBDV导出过程而无需考虑任何深度信息。初始地，视频解码器30可经配置以选择某一数目的时间图片候选者，且在候选图片中检查若干预定义时间相邻块，随后是预定义空间相邻块。对于每一相邻块，如果其是从RefPicList0中的不同视图或合成参考分量预测(即，使用BVSP模式译码)，那么在所导出的视差向量/经精炼视差向量的水平分量不等于0的情况下返回相邻块的视差运动向量或相关联所导出的视差向量/经精炼视差向量作为当前MB的视差向量。

在另一个实例中，视频解码器30可经配置以按任何次序检查参考图片列表0(RefPicList0)和参考图片列表1(RefPicList1)两者。

在另一个实例中，视频解码器30可经配置以检查所有空间(和/或)时间相邻块，无论它们是否使用视图间预测。如果不是，那么视频解码器30在检查相邻块的不同轮次中检查相邻块是否是使用BVSP模式译码的。

在另一个实例中，视频解码器30经配置以在检查所有相邻块的第一轮次中首先检查相邻块是否是使用BVSP模式译码的。如果没有块是使用BVSP模式译码的，那么视频解码器30随后检查所有空间(和/或)时间相邻块以确定它们是否是使用视图间预测译码的。

在另一个实例中，当一个相邻块不是以视图间预测或BVSP模式译码的时，视频解码器30返回含有相邻块的MB的视差向量(如果可用)作为视差向量。MB的视差向量仅当MB分区中的至少一者是使用BVSP模式译码的时可用。

子部分1.2.1.1时间/空间相邻块的选择

如第14/189,177号美国专利申请案中和上文描述的相似方法可用于哪些时间/空间相邻块将用于NBDV导出的选择。应注意时间图片中的时间相邻块也可以BVSP预测，且经BVSP译码的MB或MB分区的视差向量也视为可用的。

子部分1.2.2具有深度信息的MB层级视差向量更新过程

视频解码器30可经配置以使用以下技术更新使用上述NBDV导出过程导出的视差向量。首先，将MB的大小表示为KxK(其中K可为16)，将当前MB分区相对于当前图片的左上位置表示为(x,y)，且将当前MB的来自子部分1.2.1中的NBDV的所导出视差向量表示为(DV[0],DV[1])，其中DV[0]和DV[1]表示视差向量的水平和垂直分量。一个深度值(D)是选自参考深度视图中的四个拐角像素：

D＝max(D0,D1,D2,D3)

函数max(.)返回Di(i为0到3)的最大值且Di表示位于以下处的第i像素值：

i＝0:((x+(DV[0]>>P))>>reduced_resolution_flag,(y+(DV[1]>>P))>>reduced_resolution_flag)

i＝1:((x+(DV[0]>>P)+K-1)>>reduced_resolution_flag,(y+(DV[1]>>P))>>reduced_resolution_flag)

i＝2:((x+(DV[0]>>P))>>reduced_resolution_flag,(y+(DV[1]>>P)+K-1)>>reduced_resolution_flag)

i＝3:((x+(DV[0]>>P)+K-1)>>reduced_resolution_flag,(y+(DV[1]>>P)+K-1)>>reduced_resolution_flag)

等于1的语法元素reduced_resolution_flag指定视图分量对的深度视图分量具有比同一视图分量对的纹理视图分量的明度分量低的空间分辨率，且深度视图分量的宽度和高度均为所有纹理视图分量的宽度和高度的二分之一。等于0的语法元素reduced_resolution_flag指定当深度视图分量和纹理视图分量两者存在时它们具有相同空间分辨率。P表示当视差向量为四分之一像素精度时等于2、对于二分之一像素精度等于1且对于整数像素精度等于0的视差向量的精度。

在另一个实例中，max(D0,D3)可用以选择深度值。

在另一个实例中，可使用参考深度视图中的位于同一地点的MB内的其它像素。

视频解码器30可随后经配置以从当前MB区内的子区的选定深度值转换经更新视差向量的水平分量。将经更新视差向量的垂直分量设定成0。

在另一个实例中，可将经更新视差向量的垂直分量设定成来自NBDV的所导出的视差向量的垂直分量。

在另一个实例中，K可等于8、4或2。

经更新视差向量可用于当前MB内的所有分区。

部分1.2.3以BVSP模式译码的每一MB分区的视差向量精炼

视频解码器30还可经配置以在MB分区是以BVSP模式译码(即，从合成参考分量预测)的情况下导出每一MB分区的每一子区的一个经精炼视差向量。

视频解码器30可经配置以使用以下技术精炼使用上述NBDV导出过程导出的视差向量。首先，将子区的大小表示为KxK(其中K可为8)，将相对于当前图片的当前MB分区内的一个子区的左上位置表示为(x,y)，且将来自当前MB的NBDV导出过程的所导出的视差向量(或在执行子部分1.2.2的技术之后产生的经更新视差向量)表示为(DV[0],DV[1])，其中DV[0]和DV[1]表示视差向量的水平和垂直分量。一个深度值(D)是选自参考深度视图中的四个拐角像素：

D＝max(D0,D1,D2,D3)

函数max(·)返回Di(i为0到3)的最大值且Di表示位于以下处的第i像素值：

对于此子部分，语法元素reduced_resolution_flag和P如部分1.2.2中所界定。

在另一个实例中，max(D0,D3)可用以选择深度值。

视频解码器30可进一步经配置以从当前MB区内的子区的选定深度值转换经精炼视差向量的水平分量。将经精炼视差向量的垂直分量设定成0。在另一个实例中，可将经精炼视差向量的垂直分量设定成来自NBDV的所导出的视差向量的垂直分量。

在另一个实例中，K可等于4、2或1。

部分1.3以BVSP模式译码的一个MB分区的预测

对于以BVSP模式译码的当前MB分区内的每一子区，视频解码器30可经配置以使用经精炼视差向量来获得参考纹理视图中的预测块。在另一个实例中，对于以BVSP模式译码的每一MB分区，视频解码器30可经配置以使用来自NBDV导出过程的所导出的视差向量以获得参考纹理视图中的预测块。当前MB分区的残余块和所述预测块一起用以重构MB分区。

1.4以BVSP模式译码的MB分区的运动向量指派

在非基础纹理视图中的一个MB完全经解码之后，视频解码器30可存储经精炼视差向量，如子部分1.2.3中描述，其经存储为使用BVSP模式译码的MB分区的每一子区的运动向量。

在另一个实例中，在非基础纹理视图中的一个MB完全经解码之后，视频解码器30可将如子部分1.2.1中描述的从NBDV导出过程导出的视差向量或如子部分1.2.2中描述已考虑深度信息的经更新视差向量存储为使用BVSP模式译码的所有MB分区的运动向量。

在另一个实例中，在非基础纹理视图中以BVSP模式译码的一个MB分区经解码之后，视频解码器30可将如子部分1.2.1所描述来自MB层级NBDV导出过程的所导出的视差向量或如子部分1.2.2中所描述已考虑深度信息的经更新视差向量直接存储为此MB分区的运动向量。

在另一个实例中，在非基础纹理视图中以BVSP模式译码的一个MB分区经解码之后，视频解码器30可将如子部分1.2.3中所描述的每一子区的经精炼视差向量直接存储为此子区的运动向量。

在另一个实例中，替代于存储如子部分1.2.2中描述的来自NBDV导出过程的所导出的视差向量(具有可能的精炼)，或将经精炼视差向量存储为BVSP经译码分区的运动向量，视频解码器30可分配额外存储器来存储此信息。

在另一个实例中，视频解码器30在当前MB具有至少一个以BVSP模式译码的分区的情况下分配每MB一个运动向量以存储如子部分1.2.2中描述的来自NBDV导出过程的所导出的视差向量(具有可能的精炼)。在NBDV导出过程期间，当一个相邻块使用BVSP模式时，与含有此相邻块的MB相关联的视差向量将用作当前MB的视差向量。

在另一个实例中，当子区的大小等于8x8时每MB分配四个运动向量以存储每一子区的经精炼视差向量。在NBDV导出过程期间，当一个相邻块使用BVSP模式时，视频解码器30使用与含有此相邻块的子区相关联的视差向量作为当前MB的视差向量。

图6是说明可实施本发明中描述的技术的视频编码器的实例的框图。举例来说，图6说明可执行视频切片内的视频块的帧内和帧间译码的视频编码器20。举例来说，视频编码器20可执行帧间预测编码或帧内预测编码。帧内译码依赖于空间预测来减少或去除给定视频帧或图片内的视频中的空间冗余。帧间译码依赖于时间预测或视图间预测来减少或移除视频序列的邻近帧或图片内的时间冗余或不同视图中的图片之间的冗余。帧内模式(I模式)可指若干基于空间压缩模式中的任一者。例如单向预测(P模式)或双向预测(B模式)等帧间模式可指代若干基于时间的压缩模式中的任一者。

在图6的实例中，视频编码器20包含视频数据存储器40、预测处理单元42、参考图片存储器64、求和器50、变换处理单元52、量化处理单元54和熵编码单元56。预测处理单元42包含运动估计单元44、运动补偿单元46和帧内预测单元48。为了视频块重构，视频编码器20还包含逆量化处理单元58、逆变换处理单元60，及求和器62。还可包含解块滤波器(图6中未图示)以便对块边界进行滤波，以从经重构视频移除成块效应假象。在需要时，解块滤波器通常对求和器62的输出进行滤波。除解块滤波器之外，还可使用额外环路滤波器(环路内或环路后)。

视频数据存储器40可存储待由视频编码器20的组件编码的视频数据。可(例如)从视频源18获得存储在视频数据存储器40中的视频数据。参考图片存储器64是解码图片缓冲器(DPB的一个实例，其存储参考视频数据供视频编码器20用于编码视频数据(例如，在帧内或帧间译码模式中，也被称作帧内或帧间预测译码模式)。视频数据存储器40和参考图片存储器64可由多种存储器装置中的任一者形成，例如包含同步DRAM(SDRAM)的动态随机存取存储器(DRAM)、磁阻式RAM(MRAM)、电阻式RAM(RRAM)或其它类型的存储器装置。视频数据存储器40和参考图片存储器64可由同一存储器装置或单独的存储器装置提供。在各种实例中，视频数据存储器40可与视频编码器20的其它组件一起在芯片上，或相对于那些组件在芯片外。

视频编码器20接收视频数据，且分割单元(未图示)将所述数据分割为视频块。此分割还可包含分割为切片、瓦片或其它较大单元，以及视频块分割(例如，宏块分区和分区的子块)。视频编码器20大体说明编码待编码视频切片内的视频块的组件。所述切片可划分成多个视频块(且可能划分成被称作瓦片的视频块集合)。预测处理单元42可基于错误结果(例如，译码速率和失真层级)选择用于当前视频块的多个可能的译码模式中的一者，例如多个帧内译码模式(帧内预测译码模式)中的一者或多个帧间译码模式(帧间预测译码模式)中的一者。预测处理单元42可将所得经帧内或帧间译码块提供到求和器50以产生残余块数据，且提供到求和器62以重构经编码块以用作参考图片。

预测处理单元42内的帧内预测单元48可相对于与待译码当前块在相同的帧或切片中的一或多个相邻块执行当前视频块的帧内预测性译码，以提供空间压缩。预测处理单元42内的运动估计单元44及运动补偿单元46相对于一或多个参考图片中的一或多个预测性块执行当前视频块的帧间预测性译码以提供时间压缩。

运动估计单元44可经配置以根据用于视频序列的预定模式确定用于视频切片的帧间预测模式。预定模式可将序列中的视频切片指定为P切片或B切片。运动估计单元44与运动补偿单元46可高度集成，但出于概念目的而分别加以说明。由运动估计单元44执行的运动估计是产生运动向量的过程，所述过程估计视频块的运动。举例来说，运动向量可指示当前视频帧或图片内的视频块相对于参考图片内的预测性块的位移。

预测性块是被发现在像素差方面与待译码视频块密切匹配的块，像素差可通过绝对差总和(SAD)、平方差总和(SSD)或其它差异度量来确定。在一些实例中，视频编码器20可以计算存储在参考图片存储器64中的参考图片的子整数像素位置的值。举例来说，视频编码器20可以内插参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此，运动估计单元44可相对于全像素位置和分数像素位置执行运动搜索并且输出具有分数像素精度的运动向量。

运动估计单元44通过将视频块的位置与参考图片的预测性块的位置进行比较来计算经帧间译码(经帧间预测译码)切片中的视频块的运动向量。参考图片可以选自第一参考图片列表(RefPicList0)或第二参考图片列表(RefPicList1)，其中的每一者识别存储于参考图片存储器64中的一或多个参考图片。运动估计单元44向熵编码单元56和运动补偿单元46发送计算出的运动向量。

通过运动补偿单元46执行的运动补偿可以涉及基于通过运动估计(可能执行对子像素精度的内插)确定的运动向量提取或产生预测性块。在接收到当前视频块的运动向量后，运动补偿单元46即刻可以在参考图片列表中的一者中定位所述运动向量指向的预测性块。视频编码器20通过从正被译码的当前视频块的像素值减去预测性块的像素值从而形成像素差值来形成残余视频块。像素差值形成用于所述块的残余数据，并且可包含明度及色度差分量两者。求和器50表示可执行此减法运算的一或多个组件。运动补偿单元46还可产生与视频块及视频切片相关联的供视频解码器30在解码视频切片的视频块时使用的语法元素。

作为如上文所描述由运动估计单元44和运动补偿单元46执行的帧间预测的替代方案，帧内预测单元48可以对当前块进行帧内预测。明确地说，帧内预测单元48可以确定用来对当前块进行编码的帧内预测模式。在一些实例中，帧内预测单元48可以(例如)在单独的编码编次期间使用各种帧内预测模式来编码当前块，并且帧内预测单元48(或在一些实例中为模式选择单元)可以从测试模式中选择适当帧内预测模式来使用。举例来说，帧内预测单元48可以使用速率失真分析计算针对各种经测试帧内预测模式的速率失真值，并且从所述经测试模式当中选择具有最佳速率失真特性的帧内预测模式。速率失真分析大体上确定经编码块与经编码以产生所述经编码块的原始未编码块之间的失真(或误差)的量，以及用于产生经编码块的位速率(即，位数目)。帧内预测单元48可以根据用于各种经编码块的失真和速率计算比率，以确定哪个帧内预测模式对于所述块展现最佳速率失真值。

在任何情况下，在选择用于块的帧内预测模式之后，帧内预测单元48可将指示用于块的所选帧内预测模式的信息提供到熵编码单元56。熵编码单元56可根据本发明的技术编码指示所选帧内预测模式的信息。视频编码器20在发射的位流中可包含配置数据，其可包含多个帧内预测模式索引表和多个修改的帧内预测模式索引表(也称为码字映射表)，对用于各种块的上下文进行编码的定义，和对最可能帧内预测模式、帧内预测模式索引表和修改的帧内预测模式索引表的指示以用于所述上下文中的每一者。

在预测处理单元42经由帧间预测或帧内预测产生当前视频块的预测块之后，视频编码器20通过从当前视频块减去预测块而形成残余视频块。残余块中的残余视频数据可应用于变换处理单元52。变换处理单元52使用例如离散余弦变换(DCT)或概念上类似的变换等变换将残余视频数据变换成残余变换系数。变换处理单元52可将残余视频数据从像素值域转换到变换域，例如频域。

变换处理单元52可将所得变换系数发送到量化处理单元54。量化处理单元54可量化所述变换系数以进一步减小位率。量化过程可减少与变换系数中的一些或全部相关联的位深度。可通过调整量化参数来修改量化程度。在一些实例中，量化处理单元54可接着执行对包含经量化变换系数的矩阵的扫描。或者，熵编码单元56可执行所述扫描。

在量化之后，熵编码单元56对经量化变换系数进行熵编码。举例来说，熵编码单元56可执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵译码方法或技术。在由熵编码单元56进行熵编码之后，可将经编码位流发射到视频解码器30，或将经编码位流存档以供稍后发射或由视频解码器30检索。熵编码单元56还可对正被编码的当前视频切片的运动向量及其它语法元素进行熵编码。

逆量化处理单元58和逆变换处理单元60分别应用逆量化和逆变换以在像素域中重构残余块，例如以供稍后用作参考图片的参考块。运动补偿单元46可以通过将残余块加到参考图片列表中的一者内的参考图片中的一者的预测性块来计算参考块。运动补偿单元46还可将一或多个内插滤波器应用于经重构的残余块以计算子整数像素值用于运动估计。求和器62将经重构的残余块加到由运动补偿单元46产生的经运动补偿的预测块以产生参考块以用于存储在参考图片存储器64中。参考块可由运动估计单元44和运动补偿单元46用作参考块以对后续视频帧或图片中的块进行帧间预测。

以此方式，视频编码器20是经配置以本发明中描述的一或多个实例技术的视频编码器的实例。举例来说，视频数据存储器40存储视频数据。所述视频数据可包含相依视图的纹理视频分量和对应于纹理视图分量的深度视图分量，视频编码器20将在3D-AVC顺应视频译码过程中对其中的每一者进行编码。

在本发明中描述的技术中，视频编码器20可包含经配置以在3D-AVC顺应视频译码过程中对视频数据的相依视图的纹理视图分量进行编码的一或多个处理器。如上文所描述，3D-AVC中的每一视图包含纹理视图分量和深度视图分量。3D-AVC中存在一个基础视图以及一或多个增强或相依视图，其中一或多个增强或相依视图的纹理视图分量可进行视图间预测。

为了对纹理视图分量进行编码，视频编码器20可经配置以评估纹理视图分量中的当前块的一或多个相邻块的运动信息以确定至少一个相邻块是否是以参考除相依视图外的视图中的视图间参考图片的视差运动向量进行视图间预测。视频编码器20可基于相邻块中的一者的视差运动向量导出当前块的视差向量。对于纹理优先译码，视频编码器20可在编码纹理视图分量之后编码对应于纹理视图分量的视频数据的深度视图分量。

在一些实例中，视频编码器20的预测处理单元42可为经配置以实施本发明中针对NBDV导出和BVSP译码描述的实例的处理器的一个实例。在一些实例中，除预测处理单元42外的单元(例如，一或多个处理器)可实施上述实例。在一些实例中，预测处理单元42与视频编码器20的一或多个其它单元结合可实施上述实例。在一些实例中，视频编码器20的处理器(图6中未图示)可单独或与视频编码器20的其它处理器结合实施上述实例。

图7是说明可实施本发明中描述的技术的视频解码器的实例的框图。举例来说，视频解码器30可执行帧间预测解码或帧内预测解码。图7说明视频解码器30。在图7的实例中，视频解码器30包含视频数据存储器69、熵解码单元70、预测处理单元71、逆量化处理单元76、逆变换处理单元78、求和器80和参考图片存储器82。预测处理单元71包含运动补偿单元72和帧内预测单元74。在一些实例中，视频解码器30可执行一般与关于图6的视频编码器20描述的编码遍次互逆的解码遍次。

视频数据存储器69可存储待由视频解码器30的组件解码的视频数据，例如经编码视频位流。存储在视频数据存储器69中的视频数据可(例如)从存储装置34、从例如相机等本地视频源、经由视频数据的有线或无线网络通信或者通过存取物理数据存储媒体而获得。视频数据存储器69可形成存储来自经编码视频位流的经编码视频数据的经译码图片缓冲器(CPB)。

参考图片存储器82是存储参考视频数据供视频解码器30解码视频数据(例如，在帧内或帧间译码模式中)的经解码图片缓冲器(DPB)的一个实例。视频数据存储器69和参考图片存储器82可由多种存储器装置中的任一者形成，例如包含同步DRAM(SDRAM)的动态随机存取存储器(DRAM)、磁阻式RAM(MRAM)、电阻式RAM(RRAM)或其它类型的存储器装置。视频数据存储器69和参考图片存储器82可由同一存储器装置或单独的存储器装置提供。在各种实例中，视频数据存储器69可与视频解码器30的其它组件一起在芯片上，或相对于那些组件在芯片外。

在解码过程期间，视频解码器30从视频编码器20接收表示经编码视频切片的视频块及相关联语法元素的经编码视频位流。视频解码器30的熵解码单元70对位流进行熵解码以产生经量化系数、运动向量和其它语法元素。熵解码单元70将运动向量及其它语法元素转发到预测处理单元71。视频解码器30可在视频切片层级和/或视频块层级接收语法元素。

当视频切片经译码为经帧内译码(I)切片时，预测处理单元71的帧内预测单元74可以基于用信号表示的帧内预测模式和来自当前帧或图片的先前经解码块的数据产生用于当前视频切片的视频块的预测数据。当视频帧经译码为经帧间译码(即，B或P)切片时，预测处理单元71的运动补偿单元72基于从熵解码单元70接收到的运动向量和其它语法元素产生用于当前视频切片的视频块的预测性块。预测性块可以从参考图片列表中的一者内的参考图片中的一者产生。视频解码器30可基于存储在参考图片存储器82中的参考图片使用默认构造技术构造参考图片列表(RefPicList0和RefPicList1)。

运动补偿单元72通过剖析运动向量和其它语法元素确定用于当前视频切片的视频块的预测信息，并且使用所述预测信息产生用于正被解码的当前视频块的预测性块。举例来说，运动补偿单元72使用所接收语法元素中的一些语法元素确定用于译码视频切片的视频块的预测模式(例如，帧内预测或帧间预测)、帧间预测切片类型(例如，B切片或P切片)、切片的参考图片列表中的一或多者的构造信息、切片的每一经帧间编码的视频块的运动向量、切片的每一经帧间译码的视频块的帧间预测状态，及用以解码当前视频切片中的视频块的其它信息。

运动补偿单元72还可基于内插滤波器执行内插。运动补偿单元72可使用由视频编码器20在视频块的编码期间使用的内插滤波器来计算参考块的子整数像素的内插值。在此情况下，运动补偿单元72可根据所接收语法元素确定由视频编码器20使用的内插滤波器且使用所述内插滤波器来产生预测性块。

逆量化处理单元76将在位流中提供且由熵解码单元70解码的经量化变换系数逆量化(即，解量化)。逆量化过程可包含使用视频编码器20针对视频切片中的每一视频块计算以确定应应用的量化程度和同样逆量化程度的量化参数。逆变换处理单元78将逆变换应用于变换系数(例如，逆DCT、逆整数变换或概念上类似的逆变换过程)，以便产生像素域中的残余块。

在运动补偿单元72基于运动向量及其它语法元素产生当前视频块的预测性块后，视频解码器30通过对来自逆变换处理单元78的残余块与由运动补偿单元72产生的对应预测性块求和而形成经解码的视频块。求和器80表示执行此求和运算的一或多个组件。必要时，解块滤波器还可应用于对经解码块进行滤波以便移除成块效应假象。其它环路滤波器(在译码环路中或在译码环路之后)也可用于使像素转变平滑或者以其它方式改善视频质量。给定图片中的经解码视频块接着存储于参考图片存储器82中，所述参考图片存储器存储用于后续运动补偿的参考图片。参考图片存储器82还存储经解码视频以用于稍后呈现在显示装置(例如，图1的显示装置32)上。

以此方式，视频解码器30是经配置以本发明中描述的一或多个实例技术的视频解码器的实例。举例来说，视频数据存储器69存储视频数据。所述视频数据可包含视频解码器30可从其解码相依视图的纹理视频分量和对应于纹理视图分量的深度视图分量的信息，视频编码器20在3D-AVC顺应视频译码过程中对其中的每一者进行编码。

在本发明中描述的技术中，视频解码器30可包含经配置以在3D-AVC顺应视频译码过程中对视频数据的相依视图的纹理视图分量进行解码的一或多个处理器。为了对纹理视图分量进行解码，视频解码器30可经配置以评估纹理视图分量中的当前块的一或多个相邻块的运动信息以确定至少一个相邻块是否是以参考除相依视图外的视图中的视图间参考图片的视差运动向量进行视图间预测。视频解码器30可基于相邻块中的一者的视差运动向量导出当前块的视差向量。对于纹理优先译码，视频解码器30可在解码纹理视图分量之后解码对应于纹理视图分量的视频数据的深度视图分量。

在一些实例中，视频解码器30的预测处理单元71可为经配置以实施本发明中针对NBDV导出和BVSP译码描述的实例的处理器的一个实例。在一些实例中，除预测处理单元71外的单元(例如，一或多个处理器)可实施上述实例。在一些实例中，预测处理单元71与视频解码器30的一或多个其它单元结合可实施上述实例。在又一些其它实例中，视频解码器30的处理器(图7中未图示)可单独或与视频解码器30的其它处理器结合实施上述实例。

图9是说明本发明的实例方法的流程图。参看图9描述的技术可由视频编码器20和视频解码器30的任何结构或功能元件执行，包含预测处理单元42和预测处理单元71。将参考“视频译码器”描述以下实例，视频译码器如上文所描述是用于视频解码器的视频编码器(例如，视频编码器20和视频解码器30)的一般术语。

作为一个实例，视频译码器可经配置以使用纹理优先译码对视频数据进行译码(900)。另外，视频译码器可经配置以使用多个相邻块执行视频数据的块的NBDV导出过程，其中所述NBDV导出过程导出视差向量。视频解码器可经配置以通过将与以基于块的视图合成预测(BVSP)模式译码的所述多个相邻块中的相邻块相关联的运动向量指定为一或多个可用视差运动向量中的可用视差运动向量(910)且将与使用视图间预测模式译码的所述多个相邻块中的相邻块相关联的运动向量指定为所述一或多个可用视差运动向量中的可用视差运动向量(920)而执行NBDV导出过程。视频译码器将从所述一或多个可用视差运动向量导出视差向量(930)。

在本发明的另一实例中，视频译码器经配置以通过以一次序检查所述多个相邻块且在特定相邻块是以BVSP模式译码的情况下或在特定相邻块是使用视图间预测译码的情况下导出视差向量而执行NBDV导出过程。

在本发明的另一实例中，视频译码器经配置以通过以下方式执行NBDV导出过程：检查所述多个相邻块以确定所述多个相邻块中的任一者是否是使用视图间预测译码的，基于所述检查在所述多个相邻块中的所述一者是使用视图间预测译码的情况下从使用视图间预测译码的相邻块导出视差向量，在所述多个相邻块中没有相邻块是使用视图间预测译码的情况下检查所述多个相邻块以确定所述多个相邻块中的任一者是否是使用BVSP模式译码的，以及基于所述检查在所述多个相邻块中的一者是使用BVSP模式译码且所述多个相邻块中没有相邻块是使用视图间预测译码的情况下从使用BVSP模式译码的相邻块导出视差向量。

在本发明的另一实例中，视频译码器经配置以通过以下方式执行NBDV导出过程：检查所述多个相邻块以确定所述多个相邻块中的任一者是否是使用BVSP模式译码的，基于所述检查在所述多个相邻块中的所述一者是使用BVSP模式译码的情况下从使用BVSP模式译码的相邻块导出视差向量，在所述多个相邻块中没有相邻块是使用BVSP模式译码的情况下检查所述多个相邻块以确定所述多个相邻块中的任一者是否是使用视图间预测译码的，以及基于所述检查在所述多个相邻块中的所述一者是使用视图间预测译码且所述多个相邻块中没有相邻块是使用BVSP模式译码的情况下从使用视图间预测译码的相邻块导出视差向量。

在本发明的另一实例中，视频译码器经配置以通过以下方式执行NBDV导出过程：从深度参考视图中的深度块选择一个深度值且将所述深度值转换为经更新视差向量，以及将所述经更新视差向量应用于视频数据的块。

在本发明的另一实例中，视频译码器经配置以在视频数据的块经译码之后将经更新视差向量存储为视频数据块的运动向量。在本发明的另一实例中，视频译码器经配置以分配额外存储器以存储所导出的视差向量。

在本发明的另一实例中，视频数据的块是宏块。在本发明的另一实例中，视频数据的块是宏块的子分区或分区。在本发明的另一实例中，视频数据的块是译码单元或预测单元。

在本发明的另一实例中，视频译码器经配置以使用BVSP模式和所导出的视差向量对视频数据的块进行译码。在本发明的另一实例中，视频译码器经配置以使用基于深度的运动向量预测(D-MVP)和所导出的视差向量对视频数据的块进行译码。

图10是说明本发明的另一实例方法的流程图。参看图10描述的技术可由视频编码器20和视频解码器30的任何结构或功能元件执行，包含预测处理单元42和预测处理单元71。将参考“视频译码器”描述以下实例，视频译码器如上文所描述是用于视频解码器的视频编码器(例如，视频编码器20和视频解码器30)的一般术语。

在一个实例中视频译码器经配置以对视频数据块执行BVSP过程，BVSP过程包括执行NBDV导出过程以导出视差向量。在此方面，视频译码器经配置以通过以下方式执行NBDV导出过程：将与以基于块的视图合成预测(BVSP)模式译码的所述多个相邻块中的相邻块相关联的运动向量指定为一或多个可用视差运动向量中的可用视差运动向量(1010)，将与使用视图间预测模式译码的所述多个相邻块中的相邻块相关联的运动向量指定为所述一或多个可用视差运动向量中的可用视差运动向量(1020)，从所述一或多个可用视差运动向量导出视差向量(1030)。视频译码器进一步经配置以精炼视频数据块的子区的所导出的视差向量(1040)，且使用经精炼视差向量使用BVSP对所述视频数据块进行译码(1050)。

在本发明的另一实例中，至少所述多个相邻块是当前图片内的空间相邻块或不同图片中的时间相邻块。

在本发明的另一实例中，所述子区是8x8子区。在本发明的另一实例中，所述子区是16x16、4x4、2x2和1x1子区中的一者。

在本发明的另一实例中，视频译码器进一步经配置以从通过由用于视频数据块的子区的NBDV导出过程产生的视差向量识别的参考块的一或多个深度像素选择深度值，所述一或多个深度像素在参考块的深度视图分量中，但在到通过所述视差向量定位的参考深度视图中的深度块的中心的某一接近度内不是满像素。

在本发明的另一实例中，视频译码器进一步经配置以从由NBDV导出过程产生的视差向量的垂直分量继承经精炼视差向量的垂直分量。在本发明的另一实例中，视频译码器进一步经配置以将经精炼视差向量的垂直分量设定为零。

在本发明的另一实例中，视频译码器进一步经配置以存储视频数据块的每一子区的经精炼视差向量，其中所存储的经精炼视差向量用于另一块的NBDV导出过程。在本发明的另一实例中，视频译码器进一步经配置以在视频数据块大于某个预定大小且所存储的经精炼视差向量将在NBDV导出过程中使用的情况下将经精炼视差向量存储为视频数据块的运动向量。

在本发明的另一实例中，视频数据块是宏块。在本发明的另一实例中，视频数据块是宏块的子分区或分区。在本发明的另一实例中，视频数据块是译码单元或预测单元。

在一或多个实例中，所描述的功能可以用硬件、软件、固件或其任何组合来实施。如果用软件实施，则所述功能可作为一或多个指令或代码在计算机可读媒体上存储或传输，且由基于硬件的处理单元执行。计算机可读媒体可以包含计算机可读存储媒体，其对应于有形媒体，例如数据存储媒体，或包含促进将计算机程序从一处传送到另一处(例如，根据通信协议)的任何媒体的通信媒体。以此方式，计算机可读媒体大体上可对应于(1)有形计算机可读存储媒体，其是非暂时的，或(2)通信媒体，例如信号或载波。数据存储媒体可为可由一或多个计算机或一或多个处理器接入以检索用于实施本发明中描述的技术的指令、代码和/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。

借助于实例而非限制，此类计算机可读存储媒体可以包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器或可以用来存储指令或数据结构的形式的期望程序代码并且可以由计算机存取的任何其它媒体。而且，将任何连接适当地称为计算机可读媒体。举例来说，如果使用同轴电缆、光纤缆线、双绞线、数字订户线(DSL)或例如红外线、无线电和微波等无线技术从网站、服务器或其它远程源传输指令，那么同轴电缆、光纤缆线、双绞线、DSL或例如红外线、无线电和微波等无线技术包括在媒体的定义中。然而，应理解，所述计算机可读存储媒体及数据存储媒体并不包含连接、载波、信号或其它暂时媒体，而是实际上针对于非暂时性有形存储媒体。如本文所使用，磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软性磁盘和蓝光光盘，其中磁盘通常以磁性方式再现数据，而光盘用激光以光学方式再现数据。上文各者的组合也应包含在计算机可读媒体的范围内。

指令可以由一或多个处理器执行，所述一或多个处理器例如是一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效的集成或离散逻辑电路。因此，如本文中所使用的术语“处理器”可指上述结构或适合于实施本文中所描述的技术的任一其它结构中的任一者。另外，在一些方面中，本文中所描述的功能性可在经配置用于编码及解码的专用硬件和/或软件模块内提供，或者并入于组合编解码器中。而且，可将所述技术完全实施于一或多个电路或逻辑元件中。

本发明的技术可以在广泛多种装置或设备中实施，包含无线手持机、集成电路(IC)或一组IC(例如，芯片组)。本发明中描述各种组件、模块或单元是为了强调经配置以执行所公开的技术的装置的功能方面，但未必需要通过不同硬件单元实现。确切地说，如上文所描述，各种单元可结合合适的软件和/或固件组合在一个编解码器硬件单元中，或由互操作硬件单元的集合来提供，所述硬件单元包括如上文所描述的一或多个处理器。

已描述各种实例。这些及其它实例在所附权利要求书的范围内。

Claims

1.一种对视频数据进行译码的方法，所述方法包括：

对视频数据块执行基于块的视图合成预测BVSP过程，所述BVSP过程包括：

执行基于相邻块的视差向量NBDV导出过程以导出视差向量；以及

针对所述视频数据块的子区精炼所述所导出的视差向量；以及

使用BVSP对所述视频数据块进行译码，其中执行所述NBDV导出过程包括：

将与以BVSP模式译码的所述多个相邻块中的相邻块相关联的运动向量指定为一或多个可用视差运动向量中的可用视差运动向量；

将与使用视图间预测模式译码的所述多个相邻块中的相邻块相关联的运动向量指定为所述一或多个可用视差运动向量中的可用视差运动向量；以及

从所述一或多个可用视差运动向量导出所述视差向量。

2.根据权利要求1所述的方法，其中至少所述多个相邻块是当前图片内的空间相邻块或不同图片中的时间相邻块。

3.根据权利要求1所述的方法，其中所述子区是8x8子区。

4.根据权利要求1所述的方法，其中所述子区是16x16、4x4、2x2和1x1子区中的一者。

5.根据权利要求1所述的方法，其进一步包括：

从通过由用于所述视频数据块的子区的所述NBDV导出过程产生的视差向量识别的参考块的一或多个深度像素选择深度值，所述一或多个深度像素在所述参考块的深度视图分量中，但在到通过所述视差向量定位的参考深度视图中的深度块的中心的某一接近度内不是满像素。

6.根据权利要求1所述的方法，其进一步包括：

从由所述NBDV导出过程产生的视差向量的垂直分量继承所述经精炼视差向量的垂直分量。

7.根据权利要求1所述的方法，其进一步包括：

将所述经精炼视差向量的垂直分量设定为零。

8.根据权利要求1所述的方法，其进一步包括：

存储所述视频数据块的每一子区的经精炼视差向量，其中所述所存储的经精炼视差向量用于另一块的所述NBDV导出过程。

9.根据权利要求1所述的方法，其进一步包括：

在所述视频数据块大于预定大小且所述所存储的经精炼视差向量将在NBDV导出过程中使用的情况下将所述经精炼视差向量存储为所述视频数据块的运动向量。

10.根据权利要求1所述的方法，其中所述视频数据块是宏块。

11.根据权利要求1所述的方法，其中所述视频数据块是宏块的子分区或分区。

12.根据权利要求1所述的方法，其中所述视频数据块是译码单元或预测单元。

13.一种经配置以对视频数据进行译码的设备，所述设备包括：

存储器，其经配置以存储视频数据块；以及

视频译码器，其经配置以：

对所述视频数据块执行基于块的视图合成预测BVSP过程，所述BVSP过程包括：

执行NBDV导出过程以导出视差向量；以及

将与以基于块的视图合成预测BVSP模式译码的所述多个相邻块中的相邻块相关联的运动向量指定为一或多个可用视差运动向量中的可用视差运动向量；

从所述一或多个可用视差运动向量导出所述视差向量。

14.根据权利要求13所述的设备，其中至少所述多个相邻块是当前图片内的空间相邻块或不同图片中的时间相邻块。

15.根据权利要求13所述的设备，其中所述子区是8x8子区。

16.根据权利要求13所述的设备，其中所述子区是16x16、4x4、2x2和1x1子区中的一者。

17.根据权利要求13所述的设备，其中所述视频译码器进一步经配置以：

18.根据权利要求13所述的设备，其中所述视频译码器进一步经配置以：

19.根据权利要求13所述的设备，其中所述视频译码器进一步经配置以：

将所述经精炼视差向量的垂直分量设定为零。

20.根据权利要求13所述的设备，其中所述视频译码器进一步经配置以：

在所述存储器中存储所述视频数据块的每一子区的经精炼视差向量，其中所述所存储的经精炼视差向量用于另一块的所述NBDV导出过程。

21.根据权利要求13所述的设备，其中所述视频译码器进一步经配置以：

在所述视频数据块大于预定大小且所述所存储的经精炼视差向量将在NBDV导出过程中使用的情况下在所述存储器中将所述经精炼视差向量存储为所述视频数据块的运动向量。

22.根据权利要求13所述的设备，其中所述视频数据块是宏块。

23.根据权利要求13所述的设备，其中所述视频数据块是宏块的子分区或分区。

24.根据权利要求13所述的设备，其中所述视频数据块是译码单元或预测单元。

25.一种经配置以对视频数据进行译码的设备，所述设备包括：

用于对视频数据块执行基于块的视图合成预测BVSP过程的装置，所述用于执行所述BVSP过程的装置包括：

用于执行NBDV导出过程以导出视差向量的装置；以及

用于针对所述视频数据块的子区精炼所述所导出的视差向量的装置；以及

用于使用BVSP对所述视频数据块进行译码的装置，其中所述用于执行所述NBDV导出过程的装置包括：

用于将与以基于块的视图合成预测BVSP模式译码的所述多个相邻块中的相邻块相关联的运动向量指定为一或多个可用视差运动向量中的可用视差运动向量的装置；

用于将与使用视图间预测模式译码的所述多个相邻块中的相邻块相关联的运动向量指定为所述一或多个可用视差运动向量中的可用视差运动向量的装置；以及

用于从所述一或多个可用视差运动向量导出所述视差向量的装置。

26.根据权利要求25所述的设备，其中至少所述多个相邻块是当前图片内的空间相邻块或不同图片中的时间相邻块。

27.根据权利要求25所述的设备，其进一步包括：

用于从通过由用于所述视频数据块的子区的所述NBDV导出过程产生的视差向量识别的参考块的一或多个深度像素选择深度值的装置，所述一或多个深度像素在所述参考块的深度视图分量中，但在到通过所述视差向量定位的参考深度视图中的深度块的中心的某一接近度内不是满像素。

28.一种存储指令的计算机可读存储媒体，所述指令在执行时致使经配置以对视频数据进行译码的一或多个处理器：

执行NBDV导出过程以导出视差向量；以及

从所述一或多个可用视差运动向量导出所述视差向量。

29.根据权利要求28所述的计算机可读存储媒体，其中至少所述多个相邻块是当前图片内的空间相邻块或不同图片中的时间相邻块。

30.根据权利要求28所述的计算机可读存储媒体，其中所述指令进一步致使所述一或多个处理器：