WO2009065325A1

WO2009065325A1 - A video encoding/decoding method and a video encoder/decoder

Info

Publication number: WO2009065325A1
Application number: PCT/CN2008/072675
Authority: WO
Inventors: Ping Fang
Original assignee: Shenzhen Huawei Communication Technologies Co. , Ltd.
Priority date: 2007-10-24
Filing date: 2008-10-14
Publication date: 2009-05-28
Also published as: US20140313291A1; US20100202540A1; EP2207352A1; JP5232866B2; EP2207352A4; CN101420609B; CN101420609A; JP2011501581A

Description

视频编码、解码方法及视频编码器、解码器技术领域

本发明涉及视频技术领域，尤其涉及一种视频编码、解码方法及视频编码器、解码器。背景技术

传统的二维视频是一种平面信息的载体，它只能表现出场景的内容，而不能表现场景的深度信息，而人类在观看周围世界时，不仅能看到物体的宽度和高度，而且能获知物体的深度，并判断物体之间或观看者与物体之间的距离。这种三维视觉特性产生的原因是：人们用双目同时观看物体，由于双目间距，左眼和右眼在看一定距离的物体时，所接收到的视觉图像是不同的，综合两幅图像的信息，从而在人们大脑中产生立体感。随着视频技术的发展，人们不满足于二维视频所带来的视频感受，进一步追求更好的用户体验和身临其境的感受，立体视频技术成为实现这一目标的关键技术之一。

立体视频技术基于人类的双目视差原理，通过摄像机获取同一场景不同角度的两幅图像，将两幅图像同时或者先后显示在屏幕上，让两眼分别观看两幅图像来获得立体感觉。因此，与传统的二维视频相比，立体视频具有两个视频流，在保证图像分辨率且不考虑压缩编码的情况下，立体视频需要传输的数据流量是二维视频的两倍，数据流量的增加给存储和传输带来了极大的挑战，仅仅提高存储容量和网络带宽已不足以解决该问题，必须设计高效的编码方法对立体视频数据进行压缩处理。

目前市场上存在各种规格的立体显示设备，如头盔显示器、立体眼睛、全息显示设备和各种不同分辨率的自动立体显示器，不同的立体显示器所需要的立体视频内容的等级也不尽相同，并且，与这些立体显示器连接的网络的带宽也各有不同，使得相同的立体显示器连接在不同的网络中，也需要不同等级的立体视频内容。例如，连接在高速网络上的立体显示设备可以根据自身的分辩能力，要求较丰富的立体信息，从而显示高质量的立体视频；在某些情况下，立体显示器受本身条件制约或受网络带宽限制，仅需要较简单的立体信息，显示具有简单立体感的视频；甚至不需要任何立体信息，如传统的二维显示器，只需显示二维图像。这种不同显示设备和不同网络传输能力并存的现状要求一种立体视频编解码方法，可以满足连接在不同网络下各种立体显示设备的不同级别的立体显示需求。

在完成本发明的过程中，发明人发现现有技术存在以下问题：现有的立体视频编解码方法仅实现了二维显示和三维显示分别编码，即将双目视频中的其中一视图作为基准视图，釆用标准的编码方式进行编码，将另一视图参考基准视图进行编码，这样，在显示端解码基准视图的内容可实现二维显示，解码所有的内容实现三维显示，但无法满足连接在不同网络下各种立体显示设备的不同级别的立体显示需求。发明内容

本发明实施例提供了一种视频编码、解码方法及视频编码器、解码器，以实现对立体视图的分级编码，满足连接在不同网络下各种立体显示设备不同显示级别的立体视图显示需求。

本发明实施例提供了一种视频编码方法，包括：

将第一视图作为参考视图进行基层编码，结合本地解码后的第一视图和第二视图提取至少一层的预测信息；

将所述至少一层的预测信息分别进行增强层编码；

将所述增强层编码与所述第一视图的基层编码复用得到编码信息。

本发明实施例提供了一种视频编码器，包括：

基层编码模块，用于将第一视图作为参考视图进行基层编码；

至少一个的预测信息提取模块，用于结合本地解码后的第一视图和第二视图提取至少一层的预观 'J信息；

增强层编码模块，用于将所述至少一层的预测信息分别进行增强层编码；复用模块，用于将所述增强层编码与所述第一视图的基层编码复用得到编码信息。

本发明实施例提供了一种视频解码方法，包括：

将接收到的编码信息解复用，获得基层编码和增强层编码；

将所述基层编码解码，获得作为参考视图的第一视图；

将所述增强层编码解码，获得至少一层的预测信息；

根据所述至少一层的预测信息和所述第一视图预测第二视图。

本发明实施例提供了一种视频解码器，包括：

解复用模块，用于将接收到的编码信息解复用，获得基层编码和增强层编码；

基层解码模块，用于将所述基层编码解码，获得作为参考视图的第一视图；

增强层解码模块，用于将所述增强层编码解码，获得至少一层的预测信息；

预测模块，用于根据所述至少一层的预测信息和所述第一视图预测第二视图。

本发明实施例还提供了一种视频编码方法，包括：

将第一视图作为参考视图进行基层编码，结合本地解码后的第一视图和第二视图提取第一层预测信息；

对所述第一层预测信息进行增强层编码；

从提取第二层预测信息增量开始，提取当前层预测信息增量的步骤如下：结合本地解码后的第一视图、第二视图及前一层预测信息提取当前层预测信息增量，对当前层预测信息增量进行增强层编码；依次类推，直至对最后一层预测信息增量进行增强层编码；将所述基层编码和所述增强层编码复用得到编码信息。

本发明实施例还提供了一种视频编码器，包括：

至少两层预测信息提取模块，所述多层预测信息提取模块中的第一层预测信息提取模块与所述基层编码模块连接，用于结合本地解码后的第一视图和第二视图提取第一层预测信息；所述多层预测信息提取模块中除第一层预测信息提取模块以外的其他层预测信息提取模块，与其前一层预测信息提取模块连接，用于结合本地解码后的第一视图、第二视图以及前一层预测信息提取当前层预测信息增量；

增强层编码模块，用于对第一层预测信息和若干层预测信息增量进行增强层编码；

复用模块，用于将所述基层编码和所述增强层编码复用得到编码信息。本发明实施例还提供了一种视频解码方法，包括：

将接收到的编码信息解复用，获得基层编码和增强层编码；

将基层编码解码，获得作为参考视图的第一视图；

将增强层编码解码，获得第一层预测信息和若干层预测信息增量；根据所述第一层预测信息和若干层预测信息增量，计算至少两层的预测信息；

根据所述至少两层的预测信息和第一视图预测第二视图。

本发明实施例还提供了一种视频解码器，包括：

增强层解码模块，用于将所述增强层编码解码，获得第一层预测信息和若干层预测信息增量；计算模块，用于根据所述第一层预测信息和若干层预测信息增量，计算至少两层的预测信息；

预测模块，用于根据所述至少两层的预测信息和第一视图预测第二视图。本发明实施例的视频编码、解码方法及视频编码器、解码器，通过提取至少一层的预测信息并分别进行增强层编码，实现了对立体视图的分级编码，满足了连接在不同网络下各种立体显示设备不同显示级别的立体视图显示需求。附图说明

图 1为本发明提供的一种视频编码方法实施例一的流程图；

图 2为本发明提供的一种视频编码方法实施例二的流程图；

图 3为本发明提供的一种视频编码方法实施例三的流程图；

图 4为本发明提供的一种视频编码方法实施例四的流程图；

图 5为本发明提供的一种视频编码器实施例一的结构示意图；

图 6为本发明提供的一种视频编码器实施例二的结构示意图；

图 7为本发明提供的一种视频解码方法实施例一的流程图；

图 8为本发明提供的一种视频解码方法实施例二的流程图；

图 9为本发明提供的一种视频解码方法实施例三的流程图；

图 1 0为本发明提供的一种视频解码方法实施例四的流程图；

图 11为本发明提供的一种视频解码器实施例一的结构示意图；图 12为本发明提供的另一种视频编码方法实施例一的流程图；图 1 3为本发明提供的另一种视频编码方法实施例二的流程图；图 14为本发明提供的另一种视频编码方法实施例三的流程图；图 15为本发明提供的另一种视频编码方法实施例四的流程图；图 16为本发明提供的另一种视频编码器实施例一的结构示意图；图 17为本发明提供的另一种视频编码器实施例二的结构示意图；图 18为本发明提供的另一种视频解码方法实施例一的流程图；图 19为本发明提供的另一种视频解码方法实施例二的流程图；图 20为本发明提供的另一种视频解码方法实施例三的流程图；图 21为本发明提供的另一种视频解码方法实施例四的流程图；图 22为本发明提供的另一种视频解码器实施例一的结构示意图。具体实施方式

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。本发明提供的一种视频编码方法实施例一：

如图 1所示，为本发明提供的一种视频编码方法实施例一的流程图，具体包括如下步骤：

步骤 1 01、将第一视图作为参考视图进行基层编码，结合本地解码后的第一视图和第二视图提取至少一层的预测信息；其中第一视图和第二视图可以分别为左眼视图和右眼视图，预测信息可以为运动矢量信息和 /或，深度或视差信息；

步骤 102、将至少一层的预测信息分别进行增强层编码；

步骤 103、将增强层编码和第一视图的基层编码复用得到编码信息。本实施例通过提取至少一层的预测信息并分别进行增强层编码，实现了对立体视图的分级编码，满足了连接在不同网络下各种立体显示设备不同显示级别的立体视图显示需求。本发明提供的一种视频编码方法实施例二：

如图 2所示，为本发明提供的一种视频编码方法实施例二的流程图，本实施例以深度 /视差信息作为预测信息，提取一层深度 /视差信息，假如所要提取的为稀疏深度 /视差信息。本实施例具体包括如下步骤：

步骤 201、釆用两台或多台摄像机从不同角度对同一场景进行拍摄，获得两幅视图，分别为左目艮视图和右目艮视图；

步骤 202、从左眼视图和右眼视图中任选一视图作为参考视图进行基层编码，可以选择左眼视图，也可以选择右眼视图，本实施例选择左目艮视图作为参考视图；

步骤 203、将经过基层编码后的左眼视图在本地解码，结合右眼视图进行稀疏深度 /视差信息提取；该稀疏深度 /视差信息与预先获取的一个立体视图显示级别相对应；

步骤 204、将稀疏深度 /视差信息进行增强层编码；

步骤 205、将左眼视图的基层编码和增强层编码复用得到编码信息。其中步骤 203中，预先获取的一个立体视图显示级别可以根据预先设定的所要提取的深度 /视差信息的层数和级别来确定，也可以根据在步骤 203之前增加的如下步骤来确定：

步骤 2021、分析显示设备的请求信息和 /或网络传输信息，得出网络较拥挤时，仅能传输较少的内容，则所需的立体视图的显示级别较低，可要求提取稀疏深度 /视差信息。

本实施例中预测信息也可以为运动矢量信息，或是深度 /视差信息与运动矢量信息的结合；基层编码和增强层编码可以为带运动补偿的离散余弦变换编码。当预先获得的一个立体视图显示级别较高时，本实施例的一层预测信息也可以为致密预测信息或精细预测信息。

本实施例通过提取一层的稀疏深度 /视差信息并进行增强层编码，实现了对立体视图的分级编码，满足了连接在不同网络下各种立体显示设备不同显示级别的立体视图显示需求；还可以根据显示设备和网络状况的具体要求，提取相应级别的深度 /视差信息，提高了编码效率，降低了编码复杂度，且进一步的提高了网络传输效率；本实施例还对基层编码进行复用，根据该基层编码，可以对二维视图进行显示，兼容二维显示的功能。本发明提供的一种视频编码方法实施例三：

如图 3所示，为本发明提供的一种视频编码方法实施例三的流程图，本实施例以深度 /视差信息作为预测信息。在执行图 1中所示的步骤之前，可以预先设定所要提取的深度 /视差信息的层数和级别，本实施例以提取三层深度 /视差信息为例，从粗糙到精细依次为稀疏深度 /视差信息、致密深度 /视差信息及精细深度 /视差信息，对本实施例的技术方案做进一步介绍。本实施例视频编码方法执行以下步骤：

步骤 301、釆用两台或多台摄像机从不同角度对同一场景进行拍摄，获得两幅视图，分别为左目艮视图和右目艮视图；

步骤 302、从左眼视图和右眼视图中任选一视图作为参考视图进行基层编码，可以选择左眼视图，也可以选择右眼视图，本实施例选择左目艮视图作为参考视图；

步骤 303、将经过基层编码后的左眼视图在本地解码，结合右眼视图分别进行稀疏深度 /视差信息提取、致密深度 /视差信息提取以及精细深度 /视差信息提取；

步骤 304、将稀疏深度 /视差信息、致密深度 /视差信息以及精细深度 /视差信息分别进行增强层编码；

步骤 305、将左眼视图的基层编码和增强层编码复用得到编码信息。本发明实施例视频编码方法中的预测信息也可以为运动矢量信息，或是深度 /视差信息与运动矢量信息的结合；基层编码和增强层编码可以为带运动补偿的离散余弦变换编码。

本实施例的视频编码方法，通过提取至少一层的深度 /视差信息并分别进行增强层编码，实现了对立体视图的分级编码，满足了连接在不同网络下各种立体显示设备不同显示级别的立体视图显示需求；本实施例还对基层编码进行复用，根据该基层编码，可以对二维视图进行显示，兼容二维显示的功匕。本发明提供的一种视频编码方法实施例四：

如图 4所示，为本发明提供的一种视频编码方法实施例四的流程图，本实施例与上述实施例三的区别在于，在步骤 301之前，也可以不对提取的深度 /视差信息的层数和级别做预先设定，而在步骤 303之前增加如下步骤：步骤 3021、分析显示设备的请求信息和 /或网络传输信息，分辨率较高的显示设备所需的立体视图的显示级别较高，可要求提取精细深度 /视差信息；网络较拥挤时仅能传输较少的内容，则所需的立体视图的显示级别较低，可要求提取稀疏深度 /视差信息；综合这两种因素，获取各种显示设备在不同网络下所需的至少一个的立体视图显示级别。

进一步地，所述步骤 303具体为：将经过基层编码后的左眼视图在本地解码，结合右目艮视图提取与显示设备和 /或网络所需的立体视图显示级别对应的至少一层的深度 /视差信息。

本实施例在上述实施例三的基础上，进一步根据显示设备和网络状况的具体要求，提取相应级别的深度 /视差信息，提高了编码效率，降低了编码复杂度，提高了网络传输效率。本发明提供的一种视频编码器实施例一：

如图 5所示，为本发明提供的一种视频编码器实施例一的结构示意图，具体包括：

基层编码模块 10 , 用于将第一视图作为参考视图进行基层编码；至少一个的预测信息提取模块，如图 5中的预测信息提取模块 11、 12、 1 3......等，用于结合本地解码后的第一视图和第二视图提取至少一层的预测信息；增强层编码模块 14 , 用于将至少一层的预测信息分别进行增强层编码；复用模块 15 , 用于将增强层编码与第一视图的基层编码复用得到编码信息。

本实施例提供的编码器可以适用于上述本发明提供的一种视频编码方法实施例——实施例四。本实施例通过至少一个的预测信息提取模块，提取了至少一层预测信息并分别进行增强层编码，实现了对立体视图的分级编码，满足了连接在不同网络下各种立体显示设备不同显示级别的立体视图显示需求。本发明提供的一种视频编码器实施例二：

如图 6所示，为本发明提供的一种视频编码器实施例二的结构示意图，具体包括：

基层编码模块 20, 用于对作为参考视图的左眼视图进行基层编码，也可以将右眼视图作为参考视图，对右目艮视图进行基层编码；稀疏预测信息提取模块 21 , 用于结合右目艮视图和本地解码后的左目艮视图提取稀疏预测信息；致密预测信息提取模块 22 , 用于结合右目艮视图和本地解码后的左眼视图提取致密预测信息；精细预测信息提取模块 23 , 用于结合右眼视图和本地解码后的左眼视图提取精细预测信息；增强层编码模块 24 , 用于将稀疏预测信息、致密预测信息、精细预测信息分别进行增强层编码；复用模块 25 , 用于将左眼视图的基层编码和增强层编码复用得到编码信息。

本实施例还可以包括分析模块 26 , 用于分析显示设备的请求信息和 /或网络传输信息，获取显示设备和 /或网络所需的至少一个的立体视图显示级别。

本发明实施例的视频编码器不限于上述三层预测信息提取模块，可以根据实际需要，如显示设备和 /或网络的需要，设置至少一个的预测信息提取模块，满足不同显示设备和 /或网络的需求。

本实施例通过设置稀疏预测信息提取模块 21、致密预测信息提取模块 22 及精细预测信息提取模块 23 , 提取了三层预测信息并分别进行增强层编码，实现了对立体视图的分级编码，满足了连接在不同网络下各种立体显示设备不同显示级别的立体视图显示需求；还可以根据分析模块 26 , 获得显示设备和网络状况的具体要求，并提取相应级别的预测信息，提高了编码效率，降低了编码复杂度，且进一步的提高了网络传输效率。本发明提供的一种视频解码方法实施例一：

如图 7所示，为本发明提供的一种视频解码方法实施例一的流程图，本实施例的解码方法是针对本发明提供的一种视频编码方法实施例一所作出的，具体包括以下步骤：

步骤 401、将接收到的编码信息解复用，获得基层编码和增强层编码；步骤 402、将基层编码解码，获得作为参考视图的第一视图；

步骤 403、将增强层编码解码，获得至少一层的预测信息；

步骤 404、根据至少一层的预测信息和第一视图预测第二视图。

其中第一视图和第二视图可以分别为左目艮视图和右目艮视图，预测信息可以为运动矢量信息和 /或，深度或视差信息。

本实施例通过获得至少一层的预测信息，实现了对立体视图的分级解码，结合第一视图，预测第二视图，故可以根据第一视图和预测得到的第二视图进行立体视图显示，满足了各种立体显示设备不同显示级别的立体视图显示需求。本发明提供的一种视频解码方法实施例二：

如图 8所示，为本发明提供的一种视频解码方法实施例二的流程图，本实施例的解码方法是针对本发明提供的一种视频编码方法实施例二所作出的，具体包括以下步骤：

步骤 501、将接收到的编码信息解复用，获得基层编码和增强层编码；步骤 502、将基层编码解码，获得作为参考视图的左眼视图；

步骤 503、将增强层编码解码，获得稀疏深度 /视差信息；

步骤 504、根据稀疏深度 /视差信息以及左眼视图预测右眼视图。

本实施例通过获得稀疏深度 /视差信息，该稀疏深度 /视差信息与编码时预先获取的一个立体视图显示级别相对应，实现了对立体视图的分级解码，结合第一视图，预测第二视图，故可以根据第一视图和预测得到的第二视图进行立体视图显示，满足了各种立体显示设备不同显示级别的立体视图显示需求。本发明提供的一种视频解码方法实施例三：

如图 9所示，为本发明提供的一种视频解码方法实施例三的流程图，本实施例的解码方法是针对本发明提供的一种视频编码方法实施例四所作出的，具体包括以下步骤：

步骤 601、将接收到的编码信息解复用，获得基层编码和增强层编码；步骤 602、将基层编码解码，获得作为参考视图的左眼视图；

步骤 603、将增强层编码解码，获得稀疏深度 /视差信息、致密深度 /视差信息及精细深度 /视差信息；

步骤 604、根据稀疏深度 /视差信息、致密深度 /视差信息、精细深度 /视差信息以及左目艮视图预测右目艮视图。

由于在编码过程中，通过分析显示设备和 /或网络传输信息，获得至少一个的立体视图显示级别，根据该显示级别获取与其对应的稀疏深度 /视差信息、致密深度 /视差信息及精细深度 /视差信息的三层预测信息结构，则在解码过程中，直接对增强层编码进行解码，获得上述三层深度 /视差信息即可。

本发明实施例视频解码方法中的预测信息也可以为运动矢量信息，或是深度 /视差信息与运动矢量信息的结合。

本实施例视频解码方法，通过获得至少一层的深度 /视差信息，实现了对立体视图的分级解码，结合左目艮视图，预测右目艮视图，故可以根据左眼视图和预测得到的右目艮视图进行立体视图显示，满足了各种立体显示设备不同显示级别的立体视图显示需求；本实施例还对基层编码进行解码，根据该基层编码的解码信息，可以显示二维视图，兼容二维显示的功能。本发明提供的一种视频解码方法实施例四：

如图 1 0所示，为本发明提供的一种视频解码方法实施例四的流程图，本实施例的解码方法是针对本发明提供的一种视频编码方法实施例三所作出的，与上述解码方法实施例三的区别在于：

由于在编码过程中，通过预先设定所要提取的预测信息的层数和级别确定上述三层预测信息结构，则在解码过程中步骤 603之前，还可以包括：步骤 6021、分析显示设备的请求信息，获取各种显示设备所需的至少一个的立体视图显示级别。

进一步地，所述步骤 603具体为：将与至少一个的立体视图的显示级别对应的增强层编码解码，获得至少一层的深度 /视差信息，可以为稀疏深度 / 视差信息或致密深度 /视差信息或精细深度 /视差信息或三者的任意组合。

本实施例在上述解码方法实施例三的基础上，进一步根据显示设备的具体要求，解码相应级别的增强层编码，获得相应级别的深度 /视差信息，提高了解码效率，降低了解码复杂度。本发明提供的一种视频解码器实施例一：

如图 1 1所示，为本发明提供的一种视频解码器实施例一的结构示意图，具体包括：

解复用模块 30 , 用于将接收到的编码信息解复用，获得基层编码和增强层编码；基层编码模块 31 , 用于将基层编码解码，获得作为参考视图的第一视图；增强层解码模块 32 , 用于将增强层编码解码，获得至少一层预测信息；预测模块 33 , 用于根据至少一层预测信息和第一视图预测右眼视图。

本实施例还可以包括分析模块 34 , 用于分析显示设备的请求信息，获取显示设备所需的至少一个的立体视图显示级别。其中增强层解码模块 32获取与至少一个的立体视图显示级别对应的至少一层预测信息。

本实施例提供的解码器可以适用于上述本发明提供的一种视频解码方法实施例——实施例四。

本实施例通过设置增强层解码模块 32 , 获得了至少一层预测信息，实现了对立体视图的分级解码，满足了各种立体显示设备不同显示级别的立体视图显示需求；还可以根据分析模块 24 , 获得显示设备的具体要求，解码相应级别的预测信息，提高了解码效率，降低了解码复杂度。本发明提供的另一种视频编码方法实施例一：

如图 12所示，为本发明提供的另一种视频编码方法实施例一的流程图，具体包括如下步骤：

步骤 701、将第一视图作为参考视图进行基层编码，结合本地解码后的第一视图和第二视图提取第一层预测信息；

步骤 702、对第一层预测信息进行增强层编码；

步骤 703、从提取第二层预测信息增量开始，提取当前层预测信息增量的步骤如下：

结合本地解码后的第一视图、第二视图及前一层预测信息提取当前层预测信息增量，对当前层预测信息增量进行增强层编码；依次类推，直至对最后一层预测信息增量进行增强层编码；

步骤 704、将基层编码和增强层编码复用得到编码信息。

本实施例的视频编码方法，通过提取一层预测信息和至少一层预测信息增量，并分别进行增强层编码，实现了对立体视图的分级编码，满足了连接在不同网络下各种立体显示设备不同显示级别的立体视图显示需求；由于对至少一层深度 /视差信息增量进行增强层编码，相比于直接将预测信息进行增强层编码来说，网络中传输的信息量减少，减小了网络传输带宽，提高了传输效率。本发明提供的另一种视频编码方法实施例二：如图 1 3所示，为本发明提供的另一种视频编码方法实施例二的流程图，本实施例以深度 /视差信息作为预测信息，提取一层深度 /视差信息和一层深度 /视差信息增量，分别为稀疏深度 /视差信息和致密深度 /视差信息增量。本实施例具体包括如下步骤：

步骤 801、釆用两台或多台摄像机从不同角度对同一场景进行拍摄，获得两幅视图，分别为左目艮视图和右目艮视图；

步骤 802、从左眼视图和右眼视图中任选一视图作为参考视图进行基层编码，可以选择左眼视图，也可以选择右眼视图，本实施例选择左目艮视图作为参考视图；

步骤 803、将经过基层编码后的左眼视图在本地解码，结合右眼视图进行稀疏深度 /视差信息提取，并对稀疏深度 /视差信息进行增强层编码；

步骤 804、结合本地解码后的左目艮视图、右眼视图及稀疏深度 /视差信息进行致密深度 /视差信息增量提取，并对致密深度 /视差信息增量进行增强层编码；

本步骤可以具体为：结合本地解码后的左眼视图和右眼视图提取致密深度 /视差信息；计算致密深度 /视差信息相当于稀疏深度 /视差信息的增量，即致密深度 /视差信息增量。

步骤 805、将基层编码和增强层编码复用得到编码信息。

本实施例中稀疏深度 /视差信息和致密深度 /视差信息和预先获取的两个立体视图显示级别相对应，预先获取的两个立体视图显示级别可以根据预先设定所要提取的深度 /视差信息的层数和级别来确定，也可以根据在步骤 803 之前增加如下步骤来确定：

步骤 8021、分析显示设备的请求信息和 /或网络传输信息，分辨率较高的显示设备所需的立体视图的显示级别较高，可要求提取致密深度 /视差信息；网络较拥挤时仅能传输较少的内容，则所需的立体视图的显示级别较低，可要求提取稀疏深度 /视差信息；综合这两种因素，获取显示设备和 /或网络所需的立体视图的显示级别，根据所述显示级别确定提取深度 /视差信息的总层数和级别，例如，根据显示级别需要提取两层深度 /视差信息，级别为稀疏、致密。

本发明实施例视频编码方法中的预测信息也可以为运动矢量信息，或是深度 /视差信息与运动矢量信息的结合；基层编码和增强层编码可以为带运动补偿的离散余弦变换编码。本实施例的两层预测信息可以为稀疏、致密和精细预测信息中的任两种组合。

本实施例的视频编码方法，通过提取一层深度 /视差信息和一层深度 /视差信息增量，并分别进行增强层编码，实现了对立体视图的分级编码，满足了连接在不同网络下各种立体显示设备不同显示级别的立体视图显示需求；由于对一层深度 /视差信息增量进行增强层编码，网络中传输的信息量减少，减小了网络传输带宽，提高了传输效率；还可以根据显示设备和网络状况的具体要求，提取相应层数和级别的深度 /视差信息，提高了编码效率，降低了编码复杂度，且进一步的提高了网络传输效率；本实施例还对基层编码进行复用，根据该基层编码，可以对二维视图进行显示，兼容二维显示的功能。本发明提供的另一种视频编码方法实施例三：

如图 14所示，为本发明提供的另一种视频编码方法实施例三的流程图，本实施例以深度 /视差信息作为预测信息。在执行图 14所示的步骤之前，可以预先设定所要提取的深度 /视差信息的层数和级别，本实施例以提取三层深度 /视差信息为例，从粗糙到精细依次为稀疏深度 /视差信息、致密深度 /视差信息及精细深度 /视差信息，对本实施例的技术方案做进一步介绍。本实施例视频编码方法执行以下步骤：

步骤 901、釆用两台或多台摄像机从不同角度对同一场景进行拍摄，获得两幅视图，分别为左目艮视图和右目艮视图；

步骤 902、从左眼视图和右眼视图中任选一视图作为参考视图进行基层编码，可以选择左眼视图，也可以选择右眼视图，本实施例选择左目艮视图作为参考视图；

步骤 903、将经过基层编码后的左眼视图在本地解码，结合右眼视图进行稀疏深度 /视差信息提取，并对稀疏深度 /视差信息进行增强层编码；

步骤 904、结合本地解码后的左目艮视图、右眼视图及稀疏深度 /视差信息进行致密深度 /视差信息增量提取，并对致密深度 /视差信息增量进行增强层编码；

步骤 905、结合本地解码后的左目艮视图、右目艮视图及致密深度 /视差信息进行精细深度 /视差信息增量提取，并对精细深度 /视差信息增量进行增强层编码；

步骤 906、将基层编码和增强层编码复用得到编码信息。

具体地说，步骤 904可以具体为：结合本地解码后的左眼视图和右眼视图提取致密深度 /视差信息；计算致密深度 /视差信息相当于稀疏深度 /视差信息的增量，即致密深度 /视差信息增量。同理，步骤 905也可以通过依此实现。

本发明实施例视频编码方法中的预测信息也可以为运动矢量信息，或是深度 /视差信息与运动矢量信息的结合；基层编码和增强层编码可以为带运动补偿的离散余弦变换编码。

本发明实施例编码方法不限于提取三层预测信息，根据确定的提取预测信息的总层数和级别可以提取一层预测信息和至少一层的预测信息增量。

本实施例的视频编码方法，通过提取一层深度 /视差信息和若干层深度 / 视差信息增量，并分别进行增强层编码，实现了对立体视图的分级编码，满足了连接在不同网络下各种立体显示设备不同显示级别的立体视图显示需求；由于对若干层深度 /视差信息增量进行增强层编码，网络中传输的信息量减少，减小了网络传输带宽，提高了传输效率；本实施例还对基层编码进行复用，根据该基层编码，可以对二维视图进行显示，兼容二维显示的功能。本发明提供的另一种视频编码方法实施例四：

如图 15所示，为本发明提供的另一种视频编码方法实施例四的流程图，本实施例与上述另一种视频编码方法实施例三的区别在于，在步骤 901之前，也可以不对提取的深度 /视差信息的层数和级别做预先设定，可以在步骤 903 之前增加如下步骤：

步骤 9021、分析显示设备的请求信息和 /或网络传输信息，分辨率较高的显示设备所需的立体视图的显示级别较高，可要求提取精细深度 /视差信息；网络较拥挤时仅能传输较少的内容，则所需的立体视图的显示级别较低，可要求提取稀疏深度 /视差信息；综合这两种因素，获取显示设备和 /或网络所需的立体视图的显示级别，根据所述显示级别确定提取深度 /视差信息的总层数和级别，例如，根据显示级别需要提取三层深度 /视差信息，级别为稀疏、致密和精细，则在执行步骤 9021后，继续执行步骤 903 -步骤 906。

本实施例在上述另一种视频编码方法实施例三的基础上，进一步根据显示设备和网络状况的具体要求，提取相应层数和级别的深度 /视差信息，提高了编码效率，降低了编码复杂度，提高了网络传输效率。本发明提供的另一种视频编码器实施例一：

如图 1 6 所示，为本发明提供的另一种视频编码器实施例一的结构示意图，具体包括：

基层编码模块 40 , 用于将第一视图作为参考视图进行基层编码；至少两层预测信息提取模块，其中包括的第一层预测信息提取模块 41与基层编码模块 40 连接，用于结合本地解码后的第一视图和第二视图提取第一层预测信息，其中还包括的除第一层预测信息提取模块 41以外的其他层预测信息提取模块 42、 4 3 ······等，与其前一层预测信息提取模块连接，用于结合本地解码后的第一视图、第二视图以及前一层预测信息提取当前层预测信息增量；增强层编码模块 44 , 用于对第一层预测信息和若干层预测信息增量进行增强层编码；复用模块 45 , 用于将基层编码和增强层编码复用得到编码信息。本实施例提供的编码器可以适用于上述本发明提供的另一种视频编码方法实施例——实施例四。

本实施例通过设置有第一层预测信息提取模块 41 和其他层预测信息提取模块 42、 43……等，提取了一层预测信息和至少一层预测信息增量，并分别进行增强层编码，实现了对立体视图的分级编码，满足了连接在不同网络下各种立体显示设备不同显示级别的立体视图显示需求；由于对增量进行增强层编码，网络中传输的信息量减少，对网络传输带宽的要求降低，提高了传输效率。本发明提供的另一种视频编码器实施例二：

如图 1 7 所示，为本发明提供的另一种视频编码器实施例二的结构示意图，具体包括：

基层编码模块 50 , 用于对左眼视图进行基层编码；稀疏预测信息提取模块 51 , 与基层编码模块 50连接，用于结合右眼视图和本地解码后的左眼视图提取稀疏预测信息；致密预测信息提取模块 52 , 与稀疏预测信息提取模块 51连接，用于接收稀疏预测信息提取模块 51发送来的稀疏预测信息，并结合右目艮视图和本地解码后的左目艮视图提取致密预测信息增量；精细预测信息提取模块 53 , 与致密预测信息提取模块 52连接，用于接收致密预测信息提取模块 52发送来的致密预测信息，并结合右眼视图和本地解码后的左眼视图提取精细预测信息增量；增强层编码模块 54 , 用于对稀疏预测信息、致密预测信息增量及精细预测信息增量进行增强层编码；复用模块 55 , 用于将基层编码和增强层编码复用得到编码信息。

本实施例还可以包括分析模块 56 , 用于分析显示设备的请求信息和 /或网络传输信息，获取显示设备和 /或网络所需的立体视图的显示级别，根据所述显示级别确定提取预测信息增量的总层数和级别。本发明实施例的视频编码器不限于上述三层预测信息提取模块，可以根据实际需要，如显示设备和 /或网络的需要，设置至少两层预测信息提取模块，满足不同显示设备和 /或网络的需求。

本实施例通过设置稀疏预测信息提取模块 51、致密预测信息提取模块 52 及精细预测信息提取模块 53 , 提取了稀疏预测信息、致密预测信息增量及精细预测信息增量，并分别进行增强层编码，实现了对立体视图的分级编码，满足了连接在不同网络下各种立体显示设备不同显示级别的立体视图显示需求；由于对致密预测信息增量及精细预测信息增量进行增强层编码，网络中传输的信息量减少，对网络传输带宽的要求降低，提高了传输效率；还可以根据分析模块 56 , 获得显示设备和网络状况的具体要求，并提取相应层数和级别的预测信息，提高了编码效率，降低了编码复杂度，且进一步的提高了网络传输效率。本发明提供的另一种视频解码方法实施例一：

如图 18所示，为本发明提供的另一种视频解码方法实施例一的流程图，本实施例的解码方法是针对另一种视频编码方法实施例一所作出的，具体包括如下步骤：

步骤 1001、将接收到的编码信息解复用，获得基层编码和增强层编码；步骤 1002、将基层编码解码，获得作为参考视图的第一视图；

步骤 1003、将增强层编码解码，获得第一层预测信息和若干层预测信息增量；

步骤 1004、根据第一层预测信息和若干层预测信息增量，计算至少两层的预测信息；

步骤 1005、根据至少两层的预测信息和第一视图预测第二视图。

本实施例视频解码方法，通过根据获得的第一层预测信息和若干层预测信息增量，计算至少两层的预测信息，实现了对立体视图的分级解码，满足了各种立体显示设备不同显示级别的立体视图显示需求；由于对若干层预测信息增量进行增强层解码，网络中传输的信息量减少，对网络传输带宽的要求降低，提高了传输效率；本实施例还对基层编码进行解码，根据该基层编码的解码信息，可以显示二维视图，兼容二维显示的功能。本发明提供的另一种视频解码方法实施例二：

如图 19所示，为本发明提供的另一种视频解码方法实施例二的流程图，本实施例的解码方法是针对另一种视频编码方法实施例二所作出的，具体包括如下步骤：

步骤 11 01、将接收到的编码信息解复用，获得基层编码和增强层编码；步骤 11 02、将基层编码解码，获得作为参考视图的左眼视图；

步骤 11 03、将增强层编码解码，获得稀疏深度 /视差信息和致密深度 /视差信息增量；

步骤 11 04、根据稀疏深度 /视差信息和致密深度 /视差信息增量，计算致密深度 /视差信息；

步骤 11 05、根据稀疏深度 /视差信息、致密深度 /视差信息以及左眼视图预测右眼视图。

本实施例视频解码方法，通过根据获得的稀疏预测信息和致密预测信息增量，计算两层的预测信息，实现了对立体视图的分级解码，满足了各种立体显示设备不同显示级别的立体视图显示需求；由于对致密预测信息增量进行增强层解码，网络中传输的信息量减少，对网络传输带宽的要求降低，提高了传输效率；本实施例还对基层编码进行解码，根据该基层编码的解码信息，可以显示二维视图，兼容二维显示的功能。本发明提供的另一种视频解码方法实施例三：

如图 20所示，为本发明提供的另一种视频解码方法实施例三的流程图，本实施例的解码方法是针对另一种视频编码方法实施例四所作出的，具体包括如下步骤：

步骤 1201、将接收到的编码信息解复用，获得基层编码和增强层编码；步骤 1202、将基层编码解码，获得作为参考视图的左眼视图；

步骤 1203、将增强层编码解码，获得稀疏深度 /视差信息、致密深度 /视差信息增量及精细深度 /视差信息增量；

步骤 1204、根据稀疏深度 /视差信息和致密深度 /视差信息增量，计算致密深度 /视差信息；根据致密深度 /视差信息和精细深度 /视差信息增量，计算精细深度 /视差信息；

步骤 1205、根据稀疏深度 /视差信息、致密深度 /视差信息、精细深度 / 视差信息以及左目艮视图预测右目艮视图。

本实施例视频解码方法，通过根据获得的第一层深度 /视差信息和若干层深度 /视差信息增量，计算至少两层的深度 /视差信息，实现了对立体视图的分级解码，结合左目艮视图，预测右目艮视图，故可以根据左目艮视图和预测得到的右目艮视图进行立体视图显示，满足了各种立体显示设备不同显示级别的立体视图显示需求；由于对若干层深度 /视差信息增量进行增强层解码，网络中传输的信息量减少，对网络传输带宽的要求降低，提高了传输效率；本实施例还对基层编码进行解码，根据该基层编码的解码信息，可以显示二维视图，兼容二维显示的功能。本发明提供的另一种视频解码方法实施例四：

如图 21所示，为本发明提供的另一种视频解码方法实施例四的流程图，本实施例的解码方法是针对另一种视频编码方法实施例三所作出的，与上述另一种视频解码方法实施例三的区别在于：

由于在编码过程中，通过预先设定所要提取的预测信息的层数和级别确定上述三层预测信息结构，则在解码过程中步骤 1203之前，还可以包括：步骤 1 2021、分析显示设备的请求信息，获取各种显示设备所需的至少一个的立体视图显示级别，根据该显示级别确定增强层解码的总层数和级别。

进一步地，所述步骤 1203具体为：根据确定的增强层解码的总层数和级别对增强层编码进行解码，获得稀疏深度 /视差信息和至少一层的深度 /视差信息增量，该至少一层的深度 /视差信息增量可以为致密深度 /视差信息增量或致密深度 /视差信息增量和精细深度 /视差信息增量。

本实施例在上述另一种视频解码方法实施例三的基础上，进一步根据显示设备的具体要求，解码相应层数和级别的增强层编码，获得相应级别的深度 /视差信息，提高了解码效率，降低了解码复杂度。本发明提供的另一种视频解码器实施例一：

如图 11 所示，为本发明提供的另一种视频解码器实施例一的结构示意图，具体包括：

解复用模块 60 , 用于将接收到的编码信息解复用，获得基层编码和增强层编码；基层编码模块 61 , 用于将基层编码解码，获得作为参考视图的第一视图；增强层解码模块 62 , 用于将增强层编码解码，获得第一层预测信息和若干层预测信息增量；计算模块 63 , 用于艮据第一层预测信息和若干层预测信息增量，计算至少两层的预测信息；预测模块 64 , 用于根据至少两层预测信息和第一视图预测第二视图。

本实施例还可以包括分析模块 65 , 用于分析显示设备的请求信息，获取所述显示设备所需的立体视图的显示级别，根据所述显示级别确定增强层解码的总层数。

本实施例提供的解码器可以适用于上述本发明提供的另一种视频解码方法实施例——实施例四。

本实施例通过设置增强层解码模块 62和计算模块 63 , 获得了至少两层预测信息，实现了对立体视图的分级解码，满足了各种立体显示设备不同显示级别的立体视图显示需求；由于对若干层预测信息增量进行增强层解码，网络中传输的信息量减少，对网络传输带宽的要求降低，提高了传输效率；还可以根据分析模块 65 , 获得显示设备的具体要求，解码相应层数和级别的预测信息，提高了解码效率，降低了解码复杂度。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

权利要求

1、一种视频编码方法，其特征在于，包括：

将所述至少一层的预测信息分别进行增强层编码；

2、根据权利要求 1 所述的视频编码方法，其特征在于，所述预测信息具体为运动矢量信息和 /或深度 /视差信息。

3、根据权利要求 1 所述的视频编码方法，其特征在于，所述基层编码和增强层编码为带运动补偿的离散余弦变换编码。

4、根据权利要求 1 - 3任一所述的视频编码方法，其特征在于，在所述将第一视图作为参考视图进行基层编码之前，还包括：分析显示设备的请求信息和 /或网络传输信息，获取所述显示设备和 /或网络所需的至少一个的立体视图显示级别；

所述结合本地解码后的第一视图和第二视图提取至少一层的预测信息具体为：结合本地解码后的第一视图和第二视图提取与所述显示设备和 /或网络所需的立体视图显示级别对应的至少一层的预测信息。

5、一种视频编码器，其特征在于，包括：

6、根据权利要求 5所述的视频编码器，其特征在于，还包括：分析模块，用于分析显示设备的请求信息和 /或网络传输信息，获取所述显示设备和 /或网络所需的至少一个的立体视图显示级别。

7、一种视频解码方法，其特征在于，包括：

将接收到的编码信息解复用，获得基层编码和增强层编码；

将所述基层编码解码，获得作为参考视图的第一视图；

将所述增强层编码解码，获得至少一层的预测信息；

8、根据权利要求 7所述的视频解码方法，其特征在于，所述预测信息具体为运动矢量信息和 /或深度 /视差信息。

9、根据权利要求 7或 8所述的视频解码方法，其特征在于，在所述将增强层编码解码之前还包括：分析显示设备的请求信息，获取所述显示设备所需的至少一个的立体视图显示级别；

所述将增强层编码解码，获得至少一层的预测信息，具体为：将增强层编码解码，获得与所述显示设备所需的立体显示级别对应的至少一层的预测信息。

10、一种视频解码器，其特征在于，包括：

11、根据权利要求 10所述的视频解码器，其特征在于，还包括：分析模块，用于分析显示设备的请求信息，获取所述显示设备所需的至少一个的立体视图显示级别。

12、一种视频编码方法，其特征在于，包括：

对所述第一层预测信息进行增强层编码；

从提取第二层预测信息增量开始，提取当前层预测信息增量的步骤如下：结合本地解码后的第一视图、第二视图及前一层预测信息提取当前层预测信息增量，对当前层预测信息增量进行增强层编码；依次类推，直至对最后一层预测信息增量进行增强层编码；

将所述基层编码和所述增强层编码复用得到编码信息。

1 3、根据权利要求 12所述的视频编码方法，其特征在于，所述结合本地解码后的第一视图、第二视图及前一层预测信息提取当前层预测信息增量，具体为：

结合本地解码后的第一视图以及第二视图提取当前层预测信息；才艮据当前层预测信息和前一层预测信息计算当前层预测信息增量。

14、根据权利要求 1 3所述的视频编码方法，其特征在于，所述提取当前层预测信息增量具体为：提取当前层运动矢量信息增量和 /或当前层深度 / 视差信息增量。

15、根据权利要求 14所述的视频编码方法，其特征在于，所述基层编码和增强层编码为带运动补偿的离散余弦变换编码。

16、根据权利要求 12 - 15任一所述的视频编码方法，其特征在于，在所述对第一层预测信息进行增强层编码之前还包括：分析显示设备的请求信息和 /或网络传输信息，获取显示设备和 /或网络所需的立体视图的显示级别，根据所述显示级别确定提取预测信息增量的级别和总层数。

17、一种视频编码器，其特征在于，包括：

复用模块，用于将所述基层编码和所述增强层编码复用得到编码信息。

18、根据权利要求 17所述的视频编码器，其特征在于，还包括：分析模块，用于分析显示设备的请求信息和 /或网络传输信息，获取显示设备和 / 或网络所需的立体视图的显示级别，根据所述显示级别确定提取预测信息增量的级别和总层数。

19、一种视频解码方法，其特征在于，包括：

将接收到的编码信息解复用，获得基层编码和增强层编码；

将基层编码解码，获得作为参考视图的第一视图；

根据所述至少两层的预测信息和第一视图预测第二视图。

20、根据权利要求 19所述的视频解码方法，其特征在于，所述获得第一层预测信息和若干层预测信息增量具体为：获得第一层运动矢量信息和 / 或第一层深度 /视差信息以及若干层运动矢量信息增量和 /或若干层深度 /视差信息增量。

21、根据权利要求 19或 20所述的视频解码方法，其特征在于，在将增强层编码解码之前还包括：分析显示设备的请求信息，获取显示设备所需的立体视图的显示级别，根据所述显示级别确定增强层解码的级别和总层数。

22、一种视频解码器，其特征在于，包括：

增强层解码模块，用于将所述增强层编码解码，获得第一层预测信息和若干层预测信息增量；

计算模块，用于根据所述第一层预测信息和若干层预测信息增量，计算至少两层的预测信息；

预测模块，用于根据所述至少两层的预测信息和第一视图预测第二视图。

23、根据权利要求 22所述的视频解码器，其特征在于，还包括：分析模块，分析显示设备的请求信息，获取显示设备所需的立体视图的显示级别，根据所述显示级别确定增强层解码的级别和总层数。