CN105637869B

CN105637869B - 用于确定视频译码块的分区的角落视频部分的方法

Info

Publication number: CN105637869B
Application number: CN201380080324.4A
Authority: CN
Inventors: 亚采克·科涅奇
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2013-10-16
Filing date: 2013-10-16
Publication date: 2020-09-04
Anticipated expiration: 2033-10-16
Also published as: JP2016533667A; EP3058726A1; WO2015055245A1; US20160234503A1; CN105637869A; JP6229053B2; KR20160070815A

Abstract

本发明涉及一种用于确定视频译码块的分区的角落视频部分的方法(100)，所述视频译码块包括多个视频部分，所述方法(100)包括：根据预定扫描模式选择(101)所述视频译码块的视频部分以获得选定视频部分，其中所述预定扫描模式指示所述视频译码块中的所述视频部分的扫描顺序；确定(103)所述选定视频部分是否布置在所述分区内；以及若所述选定视频部分布置在所述分区内，则确定(105)所述选定视频部分为所述角落视频部分。

Description

用于确定视频译码块的分区的角落视频部分的方法

技术领域

本发明涉及视频译码的领域。

背景技术

在现代视频编解码器中，视频信号的视频帧可以被划分为视频译码块，视频译码块也表示为宏块或译码单元。在译码过程中，视频译码器可以决定是否将每个视频译码块划分为更小的分区，所述分区通常被称为块分区。因此，每个视频译码块可以包括多个分区。

当采用预测性视频译码方案对视频信号进行译码时，可以选择参考视频译码块。参考视频译码块可以是先前已进行译码并且使得能够确定视频译码块的预测偏差的视频译码块。接着可以在译码后的视频信号的位流中用信号表示预测偏差。

类似地，可将预测性视频译码方案应用于视频译码块的分区，其中可以选择先前已进行译码的参考分区。在此情况下，可以确定分区的预测偏差并且可以在译码后的视频信号的位流中用信号表示所述预测偏差。

为有效地确定参考分区，可以使用分区的角落视频部分。接着可以相对于分区的角落视频部分的地点确定参考分区。为了确定视频译码块的分区的角落视频部分，可以采用角落检测方案。

在于波(Bo Yu)等人于2010年6月在计算机设计与应用国际会议(InternationalConference On Computer Design And Applications，ICCDA)发表的“基于FCC差异的角落检测算法(A Corner Detection Algorithm Based on the Difference of FCC)”中描述了一种使用链式码和匹配模式的角落检测方案。

在C.哈里斯(C.Harris)等人于1988年在阿尔维视觉会议(Alvey VisionConference)第4期发表的“组合的角落和边缘检测器(A combined corner and edgedetector)”中描述了一种使用两个正交方向上的梯度的角落检测方案。

然而，这些角落检测方案使用比如过滤视频部分和/或处理分区的所有视频部分的复杂计算。这样会导致计算复杂度的显著提高，限制现代视频编解码器的性能。

发明内容

本发明的目的是提供一种用于确定视频译码块的分区的角落视频部分的有效方法。

此目的通过独立权利要求的特征得以实现。进一步的实施形式通过从属权利要求、说明书和附图清楚可见。

本发明是基于以下发现：可以通过根据预定扫描模式连续地扫描视频译码块的视频部分来确定分区的角落视频部分。当首先到达布置在分区内的视频部分时检测到角落视频部分。因此，并不需要处理分区的所有视频部分。此外，可以有效地实施视频部分的扫描。

根据第一方面，本发明涉及一种用于确定视频译码块的分区的角落视频部分的方法，视频译码块包括多个视频部分，所述方法包括：根据预定扫描模式选择视频译码块的视频部分以获得选定视频部分，其中预定扫描模式指示视频译码块中的视频部分的扫描顺序；确定选定视频部分是否布置在分区内；以及若选定视频部分布置在分区内则确定选定视频部分为角落视频部分。

视频译码块可以是指宏块或译码单元。视频译码块的分区可以为任意形状。分区的形状可以是例如规则的形状，即矩形，或不规则的形状，即非矩形。

视频部分可以包括像素或像素群组。像素群组可以例如包括2×2像素、4×4像素或8×8像素。像素可以表示为采样值。

角落视频部分可以是例如左上角视频部分、右上角视频部分、左下角视频部分或右下角视频部分。角落视频部分可以是指位于分区的边缘处的视频部分。

角落视频部分可以是单个像素或像素群组。可以依据角落视频部分在视频译码块内的地址、行和/或列来确定角落视频部分的地点。

在HEVC编解码器的情况下，可以确定4×4像素群组的地址。接着可基于4×4像素群组的所确定地址来确定相邻参考块或相邻参考分区。

预定扫描模式可以是水平扫描模式、垂直扫描模式或Z形扫描模式。视频译码块的左上视频部分、右上视频部分、左下视频部分或右下视频部分可以用作预定扫描模式的开始。预定扫描模式可以界定角落视频部分是形成视频译码块的分区的左上角视频部分、右上角视频部分、左下角视频部分还是右下角视频部分。

选定视频部分在分区内的布置可以与选定视频部分到分区上的逻辑映射有关。还可以通过确定选定视频部分是否属于分区或与分区相关联来执行选定视频部分是否布置在分区内的确定。

根据按照第一方面本身的方法的第一实施形式，所述方法进一步包括：若选定视频部分并非布置在分区内则基于预定扫描模式确定另一视频部分，所述另一视频部分形成选定视频部分；确定选定视频部分是否布置在分区内；以及若选定视频部分布置在分区内则确定选定视频部分为角落视频部分。因此，可以根据预定扫描模式扫描视频译码块的另一视频部分。

根据按照第一方面本身或第一方面的第一实施形式的方法的第二实施形式，视频部分包括像素或像素群组，特别是4×4像素群组。因此，可以调整译码性能。

根据按照第一方面本身或第一方面的任一前述实施形式的方法的第三实施形式，视频译码块的分区具有不规则的形状，特别是非矩形形状。因此，相对于规则形状的分区，特别是矩形形状的分区，可以提高译码性能。

根据按照第一方面本身或第一方面的任一前述实施形式的方法的第四实施形式，通过分区掩码确定视频译码块的分区，所述分区掩码以预定数值指示分区的视频部分，并且其中所述方法包括基于分区掩码确定选定视频部分是否布置在分区内。因此，可以有效地确定选定视频部分在分区内的布置。

分区掩码可以是像素的分区掩码。分区掩码也可以是为像素群组、特别是2×2、4×4或8×8像素群组提供分区掩码的下采样分区掩码。

分区的预定数值可以是自然数，例如128。

根据按照第一方面的第四实施形式的方法的第五实施形式，通过比较分区掩码内的选定视频部分的数值与分区掩码内的分区的预定数值来执行选定视频部分是否布置在分区内的确定。因此，可以有效地确定选定视频部分在分区内的布置。

选定视频部分的数值可以是自然数，例如112。

在选定视频部分的数值与分区的预定数值相同的情况下，可以确定选定视频部分布置在分区内。

根据按照第一方面的第四实施形式或第五实施形式的方法的第六实施形式，所述方法进一步包括以预定下采样系数对分区掩码进行下采样。因此，可以确定视频部分的像素群组的地址而不是视频部分的单个像素的地址。

分区掩码的下采样可以包括分区掩码的低通滤波。可以对像素群组、特别是对2×2、4×4或8×8像素群组执行下采样。

预定下采样系数可以指示沿着视频译码块的横轴和/或竖轴的下采样比率。预定下采样系数可以是自然数，例如，2、4或8。

根据按照第一方面本身或第一方面的任一前述实施形式的方法的第七实施形式，使用水平的左-右-上-下(Horizontal Left-Right-Top-Bottom，HLRTB)扫描模式、垂直的上-下-左-右(Vertical Top-Bottom-Left-Right，VTBLR)扫描模式、水平的Z形左-上(Horizontal Zig-Zag Left-Top，HZZLT)扫描模式或垂直的Z形左-上(Vertical Zig-ZagLeft-Top，VZZLT)扫描模式确定分区的左上角视频部分。因此，可以有效地确定左上角视频部分。

根据按照第一方面本身或第一方面的任一前述实施形式的方法的第八实施形式，使用水平的右-左-上-下(Horizontal Right-Left-Top-Bottom，HRLTB)扫描模式、垂直的上-下-右-左(Vertical Top-Bottom-Right-Left，VTBRL)扫描模式、水平的Z形右-上(Horizontal Zig-Zag Right-Top，HZZRT)扫描模式或垂直的Z形右-上(Vertical Zig-ZagRight-Top，VZZRT)扫描模式确定分区的右上角视频部分。因此，可以有效地确定右上角视频部分。

根据按照第一方面本身或第一方面的任一前述实施形式的方法的第九实施形式，使用水平的左-右-下-上(Horizontal Left-Right-Bottom-Top，HLRBT)扫描模式、垂直的下-上-左-右(Vertical Bottom-Top-Left-Right，VBTLR)扫描模式、水平的Z形左-下(Horizontal Zig-Zag Left-Bottom，HZZLB)扫描模式或垂直的Z形左-下(Vertical Zig-Zag Left-Bottom，VZZLB)扫描模式确定分区的左下角视频部分。因此，可以有效地确定左下角视频部分。

根据按照第一方面本身或第一方面的任一前述实施形式的方法的第十实施形式，使用水平的右-左-下-上(Horizontal Right-Left-Bottom-Top，HRLBT)扫描模式、垂直的下-上-右-左(Vertical Bottom-Top-Right-Left，VBTRL)扫描模式、水平的Z形右-下(Horizontal Zig-Zag Right-Bottom，HZZRB)扫描模式或垂直的Z形右-下(Vertical Zig-Zag Right-Bottom，VZZRB)扫描模式确定分区的右下角视频部分。因此，可以有效地确定右下角视频部分。

根据按照第一方面本身或第一方面的任一前述实施形式的方法的第十一实施形式，在视频译码块的分区的先前确定的角落视频部分的行或列处选择选定视频部分。因此，可以减少待扫描的视频部分的数目。

行可以界定多个水平布置的视频部分。列可以界定多个垂直布置的视频部分。

若使用HLRTB和HRLTB扫描模式两者，则通过一次扫描选定的行可以用作另一次扫描的开始点。

若使用HLRBT和HRLBT扫描模式两者，则通过一次扫描选定的行可以用作另一次扫描的开始点。

若使用VTBLR和VBTLR扫描模式两者，则通过一次扫描选定的列可以用作另一次扫描的开始点。

若使用VRLTB和VBTRL扫描模式两者，则通过一次扫描选定的列可以用作另一次扫描的开始点。

因此，可以基于先前确定的角落视频部分的地点确定预定扫描模式的开始点。接着，预定扫描模式的开始点可以位于先前确定的角落视频部分的行和/或列处。

根据第二方面，本发明涉及一种用于对视频信号进行译码的视频译码器，视频信号包括多个视频译码块，视频译码器包括处理器，所述处理器用于确定视频译码块的分区的角落视频部分，视频译码块包括多个视频部分，所述处理器进一步用于：根据预定扫描模式选择视频译码块的视频部分以获得选定视频部分，其中预定扫描模式指示视频译码块中的视频部分的扫描顺序；确定选定视频部分是否布置在分区内；以及若选定视频部分布置在分区内则确定选定视频部分为角落视频部分。

视频译码器可以是用于对视频信号进行编码的视频编码器。视频译码器可以是用于对视频信号进行解码的视频解码器。译码可以是编码或解码。处理器可以用于执行计算机程序。

视频译码器可以用于执行根据第一方面本身或第一方面的任何实施形式的用于确定视频译码块的分区的角落视频部分的方法。

可由根据第一方面本身或第一方面的任何实施形式的用于确定视频译码块的分区的角落视频部分的方法的功能性直接获得视频译码器的其它特征。

根据按照第二方面本身的视频译码器的第一实施形式，处理器进一步用于：若选定视频部分并非布置在分区内则基于预定扫描模式确定另一视频部分，所述另一视频部分形成选定视频部分；确定选定视频部分是否布置在分区内；以及若选定视频部分布置在分区内则确定选定视频部分为角落视频部分。因此，可以根据预定扫描模式扫描视频译码块的另一视频部分。

根据第三方面，本发明涉及一种计算机程序，所述计算机程序当在计算机上执行时用于实行根据第一方面本身或第一方面的任何实施形式的方法。因此，可以自动且可重复的方式应用所述方法。

可以机器可读代码的形式提供计算机程序。计算机程序可以包括用于计算机的处理器的一系列命令。计算机的处理器可以用于执行计算机程序。

计算机可以包括处理器、存储器和/或输入/输出构件。

可以通过根据第二方面本身或第二方面的任何实施形式的视频译码器的处理器执行计算机程序。

本发明可以在硬件和/或软件中实施。

附图说明

本发明的其它实施例将结合以下附图进行描述，其中：

图1示出根据实施形式的用于确定视频译码块的分区的角落视频部分的方法的示意图；

图2示出根据实施形式的用于对视频信号进行译码的视频译码器的示意图；

图3示出根据实施形式的被视为用于预测性视频译码的潜在参考视频译码块的相邻视频译码块的示意图；

图4示出根据实施形式的基于深度的块分区(depth-based block partitioning，DBBP)方案的示意图；

图5示出根据实施形式的常规分区模式和基于深度的块分区的叠加的示意图；

图6示出根据实施形式的用于确定不规则形状分区的角落的光栅扫描顺序的示意图；

图7示出根据实施形式的用于确定不规则形状分区的角落的Z形扫描顺序的示意图；

图8示出根据实施形式的不规则形状分区的所确定角落的示意图；以及

图9示出根据实施形式的使用DBBP分区的纹理块的编码的示意图。

具体实施方式

图1示出根据实施形式的用于确定视频译码块的分区的角落视频部分的方法100的示意图。视频译码块包括多个视频部分。

方法100包括：根据预定扫描模式选择101视频译码块的视频部分以获得选定视频部分，其中预定扫描模式指示视频译码块中的视频部分的扫描顺序；确定103选定视频部分是否布置在分区内；以及若选定视频部分布置在分区内则确定105选定视频部分为角落视频部分。

图2示出根据实施形式的用于对视频信号进行译码的视频译码器200的示意图。视频信号包括多个视频译码块。

视频译码器200包括处理器201，所述处理器用于确定视频译码块的分区的角落视频部分，视频译码块包括多个视频部分，处理器201进一步用于：根据预定扫描模式选择视频译码块的视频部分以获得选定视频部分，其中预定扫描模式指示视频译码块中的视频部分的扫描顺序；确定选定视频部分是否布置在分区内；以及若选定视频部分布置在分区内则确定选定视频部分为角落视频部分。

视频译码器200可以是用于对视频信号进行编码的视频编码器或用于对视频信号进行解码的视频解码器。译码可以是编码或解码。处理器201可以用于执行计算机程序。

视频译码器200可以用于执行用于确定视频译码块的分区的角落视频部分的方法。

可由用于确定视频译码块的分区的角落视频部分的方法的功能性直接获得视频译码器200的其它特征。

图3示出根据实施形式的被视为用于预测性视频译码的潜在参考视频译码块的相邻视频译码块的示意图300。

在3D视频译码中，深度数据可以表示为可对应于纹理视频的每个视频帧的一组深度图。深度图的每个像素或点的强度可以描述与由此像素或点表示的视觉场景的相机的距离。替代地，可以使用视差图。视差图的值可以与深度图的值成反比。

在3D视频译码中，可以除常规视频数据之外对每个视图的深度图进行编码。为了保持非3D编解码器的向后兼容性，在3D视频编解码器中可以首先对基础视图的纹理进行编码。可以调整对其余分量进行译码的顺序。存在可采用的两种主要译码顺序：纹理优先和深度优先，其可提供利用分量间相关性的机会，即提供利用纹理-深度相关性的机会，从而提高3D视频编解码器的整体译码性能。

纹理优先译码顺序可以使得先进的纹理相关的译码工具能够用于对深度进行译码。另一方面，深度优先译码顺序可以使得先进的深度相关的译码工具能够用于纹理译码。在针对例如3D-HEVC等3D视频译码的未来标准中，纹理优先译码顺序可用于公共测试条件(common test condition，CTC)。然而，即使在纹理优先译码的情况下，仍然可存在可用的译码后视图的近似深度图，其可以是从其它视图或参考视图合成的虚拟深度图。

在视频编解码器中，编码后的帧或图片可以被划分为小部分，其称为视频译码块、宏块或译码单元。在译码过程中，编码器可以决定针对每个部分的译码模式，包含将每个部分划分为更小的子部分的可能性。此过程可以被称为块分区。因此，每个视频译码块可以包括一个或多个分区。在视频编解码器中，可以允许分区的矩形形状。然而，可以存在多种解决方案，其中可以根据编码后的内容任意调整分区的形状。在特定方案中，可以使用不规则形状的分区，称为基于深度的块分区(depth-based block partitioning，DBBP)。可基于与译码后的纹理块相关联的可用深度信息确定分区的任意形状。

另外，对于每个部分或子部分，可以选择预测模式。由于预测性译码可以是用于对视频内容进行编码的高效方案，因此对于译码后的视频译码块的每个分区，可以选择在译码后的视频译码块之前已进行编码的参考块或视频译码块的分区(若视频译码块进行进一步划分)。此种视频译码块可以设置为用于译码后的视频译码块的参考，并且仅相对于此参考块的预测误差可在编码后的视频的位流中用信号表示。参考块可以选自与译码后的视频译码块具有相同帧或图片的视频译码块，或选自具有可用的先前译码的帧或图片中的一个的视频译码块。在第一种情况下，可以采用帧内预测，即图片内预测。在后一种情况下，可以使用帧间预测，即图片间预测。在帧内预测中，可以使用选定方向的预测器来预测译码后的视频译码块的每个分区。

在帧间预测中，可以应用运动估计，其可以使用运动向量来指定相对于译码后的视频译码块在当前帧或图片中的特定位置而言参考块在参考帧或图片中的空间地点。同样，可以指定参考帧或图片，其可以通过参考帧指数或图片指数来指示。对于译码后的视频译码块的每个分区，可以通过编码器选择独立的一组运动向量和参考帧指数或图片指数。因此，每个分区的帧间预测可以不同。最后，可以在位流中对预测误差或预测残余进行编码并传输，即对译码后的视频译码块的预测与原始译码后的视频译码块之间的差进行编码并传输。

然而，即使帧间预测用于译码后的视频译码块，但是可以基于相邻参考块预测描述视频译码块的编码的一些元素。这可以包含例如运动向量。在此情况下，对相邻参考块的明智预测会对译码性能产生影响。

在视频编解码器中，后续相邻块可以被视为待选择的潜在参考块。将被视为用于当前译码后的视频译码块的参考的相邻可以是：左(left，L)、上(top，T)、左-上(left-top,LT)、左-下(left-bottom，LB)、右-上(right-top，RT)和处于相同位置的块或在视频译码块已进行进一步划分的情况下的视频译码块的分区。此处，处于相同位置的块可以是这样的视频译码块：其与译码后的视频译码块在帧或图片中具有相同的特定位置，但是位于在当前帧或图片之前已进行译码且可用于预测的其它帧或图片中。

为了确定相邻块的位置，即，为了确定将用作用于预测的参考的候选者的位置，可以使用译码后的视频译码块的角落。以此方式，可以采用译码后的视频译码块的左-上(left-top，LT)角、左-下(left-bottom，LB)角、右-上(right-top，RT)角和右-下(right-bottom，RB)角的位置或译码后的视频译码块的分区。基于角落的地点，可以相对于参考块的可用性、例如参考帧指数或图片指数等特定元素的译码模式和分配值或运动向量来选择参考块。每个角落位置的使用与相邻块之间的关系可以如以下：LT角涉及L或/和LT相邻块的选择、LB角涉及L或/和LB相邻块的选择、RT角涉及T或/和LT相邻块的选择、或RB角涉及处于相同位置的块的选择。

术语“当前视频译码块的角落”可以用作：译码后的视频译码块或译码后的视频译码块的分区可以具有矩形形状。这可以是针对特定视频编解码器的情况。然而，在不规则形状的分区的情况下，也可以确定可适合于定位相邻参考块的此分区的部分。为了与此术语一致，这些不规则形状的分区的部分也可以称为角落。

图4示出根据实施形式的基于深度的块分区(depth-based block partitioning，DBBP)方案的示意图400。图400从左侧示出译码后的纹理块、相关联深度信息或视差图以及呈包括两个分区m_D1(x,y)和三个分区m_D2(x,y)的掩码形式的所得分区。

3D视频的组合的译码可以具有利用分量间相关性以提高整体译码性能的目标。可以使用两个方向，即，纹理到深度和深度到纹理的方向，并且可以引起通过利用分量间相关性改进整体译码效率。

另外，分量间相关性可以用来确定视频译码块的分区的任意形状，从而通过根据视觉场景中的对象的实际形状更好地调整译码后的分区或单元的形状来进一步改进压缩效率。为此目的，可以考虑利用深度分量来确定分区的形状，因为可以很好地保持深度图中的边缘。

可以采用用于确定和利用被称为基于深度的块分区(depth-based blockpartitioning，DBBP)的块分区的不规则形状的方案。DBBP可以引入可基于与译码后的块相关联的深度而确定的分区的不规则形状以改进纹理译码。DBBP模式中的每个视频译码块可以被划分为预定义数目个不规则形状的分区或分段，例如，2个不规则形状的分区或分段。

图5示出根据实施形式的常规分区模式和基于深度的块分区的叠加的示意图500。常规分区模式以灰色示出。基于深度的块分区以黑色/白色示出。可以选择最佳匹配分区模式，即，iopt模式，以表示DBBP的不规则形状的分区。

在DBBP中，可以表示任意形状分区的像素的掩码可以被映射到可用的例如矩形等规则分区上以用于存储译码后的视频译码块的译码信息，包含分区的译码信息，所述译码信息将被简单地参考或用于后面编码后/解码后的视频译码块的预测。可以通过以下方法来执行映射：将原始分区掩码，即像素的分区掩码，下采样到2×2、4×4、8×8、16×16、32×32、64×64等像素栅格上，或以用于编解码器所使用的块结构树中的当前等级的最相似的规则块分区模式表示掩码，即，使用所谓的虚拟分区。

虚拟分区会减小具有反射视觉场景中的对象的边界的不规则分区的益处。然而，它能够使DBBP的实施方案及其与比如HEVC等现有编解码器的整合容易得多。具体来说，确定将用于选择相邻参考块的虚拟分区的角落可为简单任务，并且可以应用编解码器所使用的方案。由于虚拟分区可以是矩形的，因此了解开始位置和分区大小可以足以定位所有其它角落，开始位置即矩形分区的左上角地点。通过参考整个视频译码块在图片中的位置以及了解分区指数可以确定左上角的位置。

另一方面，当采用将原始分区掩码，即像素的分区掩码，下采样到例如2×2、4×4、8×8、16×16、32×32、64×64等像素的更小分辨率栅格上的方法时，在DBBP块的不规则形状分区的情况下，相邻参考块的确定可成为重大的任务。由于所得分区的形状可以不再由视频译码块的左上角的位置界定，因此可以应用视频译码块内的分区大小和分区指数或其它方案以用于确定译码后的DBBP视频译码块的角落。

可以应用来自计算机图形和图像处理的多种方案以用于确定角落类形状。这些方案可以直接应用在通过下采样DBBP的原始分区掩码，即下采样像素的分区掩码而产生的更小分辨率的栅格上。尤其可以应用基于具有角落检测的图像滤波的方案。

特定方案涉及使用链式码和角落类模式匹配的角落检测。另一特定方案涉及用于通过两个正交方向上的高梯度检测图像区域的角落检测器。

另外，可以应用比如棋盘形布置等方案，包括对象的形状与例如三角形或矩形等更小的规则形状模式近似。在此方法中，可以分析每个规则模式以检测其角落。最后，可以在所有所识别角落之中选择满足用于确定相邻块的指定特性的角落。

用于选择相邻参考块的用于确定译码后的视频译码块的不规则形状分区的角落的解决方案可以基于将分区掩码表示为最相似的矩形分区模式。这会减小使用不规则形状的分区的益处并且会影响译码性能。

另外，在用于检测不规则形状中的角落类模式的方案之中，所述方案可以基于比如掩码的像素的滤波或接入或搜索掩码的所有像素或点等复杂计算。归因于导致的不可忽略的计算复杂度增加，此类方案在用于出于视频译码目的而选择相邻参考块的任务的情况下会具有挑战性。

图6示出根据实施形式的用于确定不规则形状分区的角落的光栅扫描顺序的示意图600。

图7示出根据实施形式的用于确定不规则形状分区的角落的Z形扫描顺序的示意图700。

图8示出根据实施形式的不规则形状分区的所确定角落的示意图800。

可以应用确定译码后的视频译码块的不规则形状分区的左上(left top，LT)角、右上(right top，RT)角、左下(left bottom，LB)角以及右下(right bottom，RB)角的方法，所述角落用以选择用于视频译码预测的相邻参考块。

可以使用扫描顺序搜索描述分区的不规则形状的信息，具体来说，搜索分区掩码或下采样后的分区掩码，以便确定每个角落，即在不规则形状分区中的位置，根据所述位置可以定位相邻参考块。可以应用专用于确定不同相邻参考块的多种扫描顺序。最后，可以应用用于降低确定不规则形状分区的角落的复杂度的方案。

可以如下执行确定译码后的视频译码块的不规则形状分区的左上(left top，LT)角、右上(right top，RT)角、左下(left bottom，LB)角以及右下(right bottom，RB)角的方法，出于视频译码预测的目的而基于所述方法选择相邻参考块。

可以使用指定扫描顺序确定不规则形状分区的角落中的每一个，所述指定扫描顺序可以选为就相邻参考块的选择而言最适当的扫描顺序。使用选定扫描顺序，可以扫描描述不规则形状分区的分区掩码。角落可以确定为属于当使用给定扫描顺序扫描时已最先接近的选定分区的分区掩码的元素。

可以应用不同扫描顺序来选择不规则形状分区的左上(left top，LT)角、右上(right top，RT)角、左下(left bottom，LB)角以及右下(right bottom，RB)角。扫描顺序列出如下。

为了确定LT角，可以使用水平的左-右-上-下扫描(Horizontal Left-Right-Top-Bottom，HLRTB扫描)、或垂直的上-下-左-右扫描(Vertical Top-Bottom-Left-Right，VTBLR扫描)、或水平的Z形左-上扫描(Horizontal Zig-Zag Left-Top，HZZLT扫描)或垂直的Z形左-上扫描(Vertical Zig-Zag Left-Top，VZZLT扫描)。

为了确定RT角，可以使用水平的右-左-上-下扫描(Horizontal Right-Left-Top-Bottom，HRLTB扫描)、或垂直的上-下-右-左扫描(Vertical Top-Bottom-Right-Left，VTBRL扫描)、或水平的Z形右-上扫描(Horizontal Zig-Zag Right-Top，HZZRT扫描)或垂直的Z形右-上扫描(Vertical Zig-Zag Right-Top，VZZRT扫描)。

为了确定LB角，可以使用水平的左-右-下-上扫描(Horizontal Left-Right-Bottom-Top，HLRBT扫描)、或垂直的下-上-左-右扫描(Vertical Bottom-Top-Left-Right，VBTLR扫描)、或水平的Z形左-下扫描(Horizontal Zig-Zag Left-Bottom，HZZLB扫描)或垂直的Z形左-下扫描(Vertical Zig-Zag Left-Bottom，VZZLB扫描)。

为了确定RB角，可以使用水平的右-左-下-上扫描(Horizontal Right-Left-Bottom-Top，HRLBT扫描)、或垂直的下-上-右-左扫描(Vertical Bottom-Top-Right-Left，VBTRL扫描)、或水平的Z形右-下扫描(Horizontal Zig-Zag Right-Bottom，HZZRB扫描)或垂直的Z形右-下扫描(Vertical Zig-Zag Right-Bottom，VZZRB扫描)。

在附图中详细示出用于确定不规则形状分区的角落以便选择相邻参考块的上述扫描顺序。也可以应用基于光栅或Z形扫描的其它扫描顺序。

可以由于使用例如JCT-3V群组的公共测试条件(common test condition，CTC)的评估形成方案的选择。可以与其它解决方案比较扫描顺序的性能。

可以使用的其它扫描顺序包含全搜索，包括详尽扫描分区掩码中的所有元素并且选择属于所述分区且最接近于译码后的矩形块的选定角落的地点或位置。

这些方案可以提供略微更好的译码性能但是在计算上可能会更复杂。

可以预先选择、适应性地选择或用信号明确表示扫描顺序用于确定指定角落的方式。在预先选择或适应性选择编码器扫描顺序的情况下，不能向解码器用信号表示额外信息。另一方面，若编码器使用选定扫描顺序的显式信令，则可以向解码器用信号表示此信息。可以每序列、每GOP、每周期内、每图片、每片段、每译码单元和/或每分区切换此信息。

可以使用以下两者应用用于确定不规则形状分区的角落的方案：像素的分区掩码，例如DBBP的像素的分段掩码；或其下采样后的版本，即2×2、4×4、8×8、16×16、32×32、64×64等像素栅格，例如DBBP的部分的分段掩码，其中部分可以意味着4×4像素群组或单元。

可以如下应用用于将确定不规则形状分区的角落的复杂度降到最低的方案。

若使用HLRTB和HRLTB扫描顺序两者，则通过一次扫描选定的行可以用作用于另一次扫描的搜索的开始点。

若使用HLRBT和HRLBT扫描顺序两者，则通过一次扫描选定的行可以用作用于另一次扫描的搜索的开始点。

若使用VTBLR和VBTLR扫描顺序两者，则通过一次扫描选定的列可以用作用于另一次扫描的搜索的开始点。

若使用VTBRL和VBTRL扫描顺序两者，则通过一次扫描选定的列可以用作用于另一次扫描的搜索的开始点。

所述方案的优点可以概括如下。相较于用于矩形形状分区的方案，所述方案可以提供译码后的视频译码块中的DBBP分段的更准确角落检测。所述方案可以提供用于不规则形状分区的角落检测的低复杂度解决方案，其中可以省略对视频译码块中的所有像素或点的扫描或滤波。所述方案可以简单地用于例如未来3D-HEVC或3D-AVC标准的特定算法。

具体来说，确定不规则形状分区的角落的方案可以用于运动预测和AVC或HEVC视频编解码器中的译码及其多视图或3D变型。在此情况下，可以使用确定不规则形状分区的角落的方案执行确定用于创建高级运动预测(advanced motion prediction，AMVP)候选者列表、合并候选者列表的预测候选者或确定用于运动向量的中间预测的相邻块。

图9示出根据实施形式的使用DBBP分区的纹理块的编码的示意图900。

确定用于不规则形状分区的译码情境的方案在框901中示出。在框903中，可以确定译码后的分区或分段的选定角落的位置，选定角落即LT、RT、LB或RB。在框905中，可以选择用作用于分区或分段的译码的情境的一个或多个相邻块。

根据实施形式，本发明涉及计算机视觉的领域，具体来说涉及被称为3D视频处理和3D视频译码的领域。

根据实施形式，本发明涉及一种用于确定译码后的视频译码块的不规则形状分区的角落的地点或位置的方法，出于视频译码预测的目的而基于所述方法选择相邻参考块，所述方法包括以预定扫描顺序扫描分区掩码，并且选择属于所述分区的分区或分段掩码的第一元素作为角落。

根据实施形式，本发明涉及一种使用像素的分区掩码确定不规则形状分区的角落的方法。

根据实施形式，本发明涉及一种使用下采样后的分区掩码确定不规则形状分区的角落的方法，下采样后的分区掩码例如2×2、4×4、8×8、16×16、32×32、64×64等像素栅格。

根据实施形式，本发明涉及一种用于使用水平的左-右-上-下扫描(HorizontalLeft-Right-Top-Bottom，HLRTB扫描)确定LT角的方法。

根据实施形式，本发明涉及一种用于使用垂直的上-下-左-右扫描(VerticalTop-Bottom-Left-Right，VTBLR扫描)确定LT角的方法。

根据实施形式，本发明涉及一种用于使用水平的Z形左-上扫描(Horizontal Zig-Zag Left-Top，HZZLT扫描)确定LT角的方法。

根据实施形式，本发明涉及一种用于使用垂直的Z形左-上扫描(Vertical Zig-Zag Left-Top，VZZLT扫描)确定LT角的方法。

根据实施形式，本发明涉及一种用于使用水平的右-左-上-下扫描(HorizontalRight-Left-Top-Bottom，HRLTB扫描)确定RT角的方法。

根据实施形式，本发明涉及一种用于使用垂直的上-下-右-左扫描(VerticalTop-Bottom-Right-Left，VTBRL扫描)确定RT角的方法。

根据实施形式，本发明涉及一种用于使用水平的Z形右-上扫描(Horizontal Zig-Zag Right-Top，HZZRT扫描)确定RT角的方法。

根据实施形式，本发明涉及一种用于使用垂直的Z形右-上扫描(Vertical Zig-Zag Right-Top，VZZRT扫描)确定RT角的方法。

根据实施形式，本发明涉及一种用于使用水平的左-右-下-上扫描(HorizontalLeft-Right-Bottom-Top，HLRBT扫描)确定LB角的方法。

根据实施形式，本发明涉及一种用于使用垂直的下-上-左-右扫描(VerticalBottom-Top-Left-Right，VBTLR扫描)确定LB角的方法。

根据实施形式，本发明涉及一种用于使用水平的Z形左-下扫描(Horizontal Zig-Zag Left-Bottom，HZZLB扫描)确定LB角的方法。

根据实施形式，本发明涉及一种用于使用垂直的Z形左-下扫描(Vertical Zig-Zag Left-Bottom，VZZLB扫描)确定LB角的方法。

根据实施形式，本发明涉及一种用于使用水平的右-左-下-上扫描(HorizontalRight-Left-Bottom-Top，HRLBT扫描)确定RB角的方法。

根据实施形式，本发明涉及一种用于使用垂直的下-上-右-左扫描(VerticalBottom-Top-Right-Left，VBTRL扫描)确定RB角的方法。

根据实施形式，本发明涉及一种用于使用水平的Z形右-下扫描(Horizontal Zig-Zag Right-Bottom，HZZRB扫描)确定RB角的方法。

根据实施形式，本发明涉及一种用于使用垂直的Z形右-下扫描(Vertical Zig-Zag Right-Bottom，VZZRB扫描)确定RB角的方法。

根据实施形式，本发明涉及用于将确定不规则形状分区的角落的复杂度降到最低的方法。

根据实施形式，若使用HLRTB和HRLTB扫描顺序两者，则使用通过一次扫描选定的行作为用于另一次扫描的搜索的开始点。

根据实施形式，若使用HLRBT和HRLBT扫描顺序两者，则使用通过一次扫描选定的行作为用于另一次扫描的搜索的开始点。

根据实施形式，若使用VTBLR和VBTLR扫描顺序两者，则使用通过一次扫描选定的列作为用于另一次扫描的搜索的开始点。

根据实施形式，若使用VTBRL和VBTRL扫描顺序两者，则使用通过一次扫描选定的列作为用于另一次扫描的搜索的开始点。

使用以下缩写：AVC是指高级视频译码，HEVC是指高效率视频译码，CU是指译码单元，DBBP是指基于深度的块分区，DLT是指深度查询表，GOP是指图片群组，RAP是指随机存取点，SEI是指辅助增强信息，SH是指片段标头，SPS是指序列参数集，PPS是指图片参数集。

使用以下定义：视频序列是指呈现动作图片的一组后续帧。3D视频是指包括两个纹理视图及其对应深度图或视差图的信号。视觉场景是指以3D视频展现的现实世界或合成场景。深度图是指灰阶图片，其中图片的每个点的值确定与由此点表示的视觉场景的相机的距离。替代地，可以使用视差图，视差图的值可以与深度图的值成反比。纹理视图是指以指定视角获取的视频，包括通常以RGB或YUV格式展现的关于视觉场景的颜色和纹理的信息。随机存取点是指视频序列的结构中的限定的点，解码器能够从所述点开始对序列进行解码而无需了解视频流的先前部分。SPS是指呈包括用于对视频流进行适当解码的基本信息的组织消息形式发送的参数集，其可以在每个随机存取点的开始处用信号表示。PPS是指呈包括用于对视频序列中的图片进行适当解码的基本信息的组织消息形式发送的参数集。GOP是指视频序列的基本数据结构中的一种，包括不必定以显示顺序排序的预定义数目个后续图片。图片是指视频序列的结构，包括视频序列的整张图片，也称为帧。片段是指视频序列的结构，包括视频序列的整张图片的一部分。片段标头是指描述片段的参数集，并且可以在片段的开始处发送。CU是指预定义大小的视频序列的基本译码结构，包括图片的一部分，例如64×64像素。I-片段是指其中所有译码单元经帧内预测因此不可允许参考其它图片的片段。SEI是指可以在一连串视频序列中用信号表示的消息，包括关于视频序列、译码工具等的额外或任选的信息。译码后的块是指例如规则的矩形形状的译码单元，使用针对选定用于块的译码模式指定的语法描述图片的编码后区域。译码模式描述用于对图片的译码后的块进行编码的一组构件和/或方案。参考块是指在当前处理块之前已进行解码并且用作用于当前块的预测性译码的参考的图片的块。部分是指允许由编解码器使用的最小大小的规则块分区，例如在HEVC情况下的4×4像素。

根据实施形式，本发明涉及一种用于定位使用基于深度的块分区(depth-basedblock partitioning，DBBP)编码的纹理块中的角落分区的地点或位置的方法。

根据实施形式，所述方法呈现用于检测不规则形状DBBP块中的角落分区的非复杂算法。

在3D视频中，可以存在纹理和深度两者。为了保持非3D编解码器的向后兼容性，可以首先对基础视图的纹理进行编码。可以调整对其余分量进行译码的顺序，例如在3D-HEVC中使用灵活译码顺序(flexible coding order，FCO)。纹理优先译码顺序可以实现先进的纹理相关深度译码工具。深度优先译码顺序可以实现先进的深度相关纹理译码工具。这两种译码顺序均可为适用的。

在例如MPEG-2、AVC或HEVC等现代视频译码方法中，可以使用预测机构对当前处理的视频译码块进行译码以提高译码性能。具体来说，定位于当前块上方以及左侧的已进行译码的相邻块可以用于预测，构成用于对例如运动向量等语法元素进行译码的情境。

可以基于当前视频译码块的左上(left top，LT)角、右上(right top，RT)角、左下(left bottom，LB)角以及右下(right bottom，RB)角的地点或位置确定相邻块的地点。

在用于纹理译码的编解码器中使用的块分区可以基于矩形形状，即，块被划分为矩形形状的分区。可以解决发现已知大小的矩形分区的LT角、RT角、LB角和RB角的挑战。

角落与相邻块之间的关系可以定义如下。LT角涉及L/LT相邻块的选择，LB角涉及L/LB相邻块的选择，RT角涉及T/LT相邻块的选择，并且RB角涉及处于相同位置的块的选择。

可以应用用于有效地用信号表示被称为基于深度的块分区(depth-based blockpartitioning，DBBP)的块分区的不规则形状的方案。DBBP可以引入可基于与译码后的视频译码块相关联的深度而确定的分区的不规则形状以改进纹理译码。DBBP模式中的每个视频译码块可以被划分为预定义数目个不规则形状的分区或分段，例如，2个不规则形状的分区或分段。

DBBP可以应用虚拟分区作为用于将不规则形状分区表示为用于预测和数据存储目的的现有矩形分区方案之一的简化方法。

DBBP的实施方案可以引入更准确的表示。代替虚拟分区，分区掩码或分段掩码可以表示为4×4像素或部分掩码，即当前视频译码块的每个4×4像素部分可以表示描述分配给此部分的分区或分段的数据。在不规则形状分区的情况下，确定角落以定位用于预测的相邻块的挑战会更加复杂。

可以通过以下执行不规则形状中的角落检测作为具有更小大小的形状、规则模式以及每个模式的角落分析的近似值：例如，通过使用链式码和角落类模式匹配的角落检测器的图像滤波、或角落检测器、或棋盘形布置。

然而，可能需要解决发现基于深度确定的不规则形状分区的角落这一问题，以改进可以用来定位用于预测当前视频译码块的相邻块的纹理译码。所述方案可以是非复杂的并且可以不基于搜索分区掩码或分段掩码或4×4部分掩码的所有像素或点。

可以应用基于深度的块分区扫描(depth-based block partitioning，DBBP扫描)。可以通过以下步骤确定使用DBBP模式译码的当前视频译码块的每个分区或分段的左上(left top，LT)角、右上(right top，RT)角、左下(left bottom，LB)角以及右下(rightbottom，RB)角的位置：使用例如预先选择的扫描顺序等扫描顺序之一扫描当前视频译码块的DBBP分区掩码或分段掩码，并且根据扫描顺序作为停止标准而选择DBBP分区掩码或分段掩码中属于分区或分段的第一元素作为角落。可以应用不同的扫描顺序以用于选择左上(left top，LT)角、右上(right top，RT)角、左下(left bottom，LB)角以及右下(rightbottom，RB)角。

可以如下执行基于深度的块分区扫描(depth-based block partitioning，DBBP扫描)。

对于LT角，可以使用水平的左-右-上-下扫描(Horizontal Left-Right-Top-Bottom，HLRTB扫描)或垂直的上-下-左-右扫描(Vertical Top-Bottom-Left-Right，VTBLR扫描)。

对于RT角，可以使用水平的右-左-上-下扫描(Horizontal Right-Left-Top-Bottom，HRLTB扫描)或垂直的上-下-右-左扫描(Vertical Top-Bottom-Right-Left，VTBRL扫描)。

对于LB角，可以使用水平的左-右-下-上扫描(Horizontal Left-Right-Bottom-Top，HLRBT扫描)或垂直的下-上-左-右扫描(Vertical Bottom-Top-Left-Right，VBTLR扫描)。

对于RB角，可以使用水平的右-左-下-上扫描(Horizontal Right-Left-Bottom-Top，HRLBT扫描)或垂直的下-上-右-左扫描(Vertical Bottom-Top-Right-Left，VBTRL扫描)。

可以如下实现额外的加速。

若使用HLRTB和HRLTB扫描两者，则通过一次扫描选定的行可以用作用于另一次扫描的搜索的开始点。

若使用HLRBT和HRLBT扫描两者，则通过一次扫描选定的行可以用作用于另一次扫描的搜索的开始点。

若使用VTBLR和VBTLR扫描两者，则通过一次扫描选定的列可以用作用于另一次扫描的搜索的开始点。

若使用VTBRL和VBTRL扫描两者，则通过一次扫描选定的列可以用作用于另一次扫描的搜索的开始点。

用于确定用于不规则形状的分区或分段的译码情境的方案可以包括：确定译码后的分区或分段的选定角落的位置，即LT、RT、LB或RB的位置，并且选择用作用于分区或分段的译码的情境的一个或多个相邻块。

所述方案可以用于运动信息的改进的预测并且也可以应用于其它元素的预测。

分区掩码或分段掩码可以包括逐像素分区掩码或分段掩码，和/或具有更小分辨率的分区掩码或分段掩码，例如，逐部分或4×4像素的分区掩码或分段掩码。

根据实施形式，本发明涉及一种用于确定不规则形状的块分区或分段中的角落的位置的方法，不规则形状的块分区或分段用于定位用于译码后的块的预测的相邻块，所述方法包括以预定扫描顺序扫描分区掩码或分段掩码，并且选择分区掩码或分段掩码中属于分区或分段的第一元素作为角落。

相较于用于矩形形状分区的方案，DBBP扫描可以提供译码后的视频译码块中的DBBP分区或分段的更准确角落检测。由于可以不使用对视频译码块中的所有像素或点的扫描或滤波，因此DBBP扫描可以提供用于不规则形状分区的角落检测的低复杂度方案。DBBP扫描可以用于例如未来3D-HEVC或3D-AVC标准的特定算法。

Claims

1.一种用于确定视频译码块的分区的角落视频部分的方法（100），所述视频译码块包括多个视频部分，其特征在于，所述方法（100）包括：

从所述分区的左上角视频部分，左下角视频部分，右上角视频部分，和右下角视频部分开始扫描，根据预定扫描模式选择（101）所述视频译码块的视频部分以获得选定视频部分，其中所述预定扫描模式指示所述视频译码块中的所述视频部分的扫描顺序；

确定（103）所述选定视频部分是否布置在所述分区内并且按照所述扫描模式确定所述选定视频部分是否属于所述分区的第一元素；以及

若所述选定视频部分布置在所述分区内且属于所述分区的第一元素，则确定（105）所述选定视频部分为所述角落视频部分。

2.根据权利要求1所述的方法（100），其特征在于，进一步包括：

若所述选定视频部分并非布置在所述分区内，则基于所述预定扫描模式确定另一视频部分，所述另一视频部分形成选定视频部分；

确定所述选定视频部分是否布置在所述分区内；以及

若所述选定视频部分布置在所述分区内，则确定所述选定视频部分为所述角落视频部分。

3.根据前述权利要求中任一权利要求所述的方法（100），其特征在于，所述视频部分包括像素或像素群组，所述像素群组包括4×4像素群组。

4.根据权利要求1所述的方法（100），其特征在于，所述视频译码块的所述分区具有不规则的形状，所述不规则的形状包括非矩形形状。

5.根据权利要求1所述的方法（100），其特征在于，通过分区掩码确定所述视频译码块的所述分区，所述分区掩码以预定数值指示所述分区的所述视频部分，并且其中所述方法（100）包括基于所述分区掩码确定所述选定视频部分是否布置在所述分区内。

6.根据权利要求5所述的方法（100），其特征在于，通过比较所述分区掩码内的所述选定视频部分的数值与所述分区掩码内的所述分区的所述预定数值来执行所述选定视频部分是否布置在所述分区内的确定。

7.根据权利要求5所述的方法（100），其特征在于，所述方法（100）进一步包括以预定下采样系数对所述分区掩码进行下采样。

8.根据权利要求1所述的方法（100），其特征在于，所述根据预定扫描模式选择（101）所述视频译码块的视频部分以获得选定视频部分包括：使用水平的左-右-上-下HLRTB扫描模式、垂直的上-下-左-右VTBLR扫描模式、水平的Z形左-上HZZLT扫描模式或垂直的Z形左-上VZZLT扫描模式确定所述分区的左上角视频部分。

9.根据权利要求1所述的方法（100），其特征在于，所述根据预定扫描模式选择（101）所述视频译码块的视频部分以获得选定视频部分包括：使用水平的右-左-上-下HRLTB扫描模式、垂直的上-下-右-左VTBRL扫描模式、水平的Z形右-上HZZRT扫描模式或垂直的Z形右-上VZZRT扫描模式确定所述分区的右上角视频部分。

10.根据权利要求1所述的方法（100），其特征在于，所述根据预定扫描模式选择（101）所述视频译码块的视频部分以获得选定视频部分包括：使用水平的左-右-下-上HLRBT扫描模式、垂直的下-上-左-右VBTLR扫描模式、水平的Z形左-下HZZLB扫描模式或垂直的Z形左-下VZZLB扫描模式确定所述分区的左下角视频部分。

11.根据权利要求1所述的方法（100），其特征在于，所述根据预定扫描模式选择（101）所述视频译码块的视频部分以获得选定视频部分包括：使用水平的右-左-下-上HRLBT扫描模式、垂直的下-上-右-左VBTRL扫描模式、水平的Z形右-下HZZRB扫描模式或垂直的Z形右-下VZZRB扫描模式确定所述分区的右下角视频部分。

12.根据权利要求1所述的方法（100），其特征在于，在所述视频译码块的所述分区的先前确定的角落视频部分的行或列处选择所述选定视频部分。

13.一种用于对视频信号进行译码的视频译码器（200），所述视频信号包括多个视频译码块，其特征在于，所述视频译码器（200）包括：

处理器（201），所述处理器用于确定视频译码块的分区的角落视频部分，所述视频译码块包括多个视频部分，所述处理器（201）进一步用于：从所述分区的左上角视频部分，左下角视频部分，右上角视频部分，和右下角视频部分开始扫描，根据预定扫描模式选择所述视频译码块的视频部分以获得选定视频部分，其中所述预定扫描模式指示所述视频译码块中的所述视频部分的扫描顺序；确定所述选定视频部分是否布置在所述分区内并且按照所述扫描模式确定所述选定视频部分是否属于所述分区的第一元素；以及若所述选定视频部分布置在所述分区内且属于所述分区的第一元素，则确定所述选定视频部分为所述角落视频部分。

14.根据权利要求13所述的视频译码器（200），其特征在于，所述处理器（201）进一步用于：若所述选定视频部分并非布置在所述分区内，则基于所述预定扫描模式确定另一视频部分，所述另一视频部分形成选定视频部分；确定所述选定视频部分是否布置在所述分区内；以及若所述选定视频部分布置在所述分区内，则确定所述选定视频部分为所述角落视频部分。