WO2023115489A1

WO2023115489A1 - 编解码方法、码流、装置、设备以及可读存储介质

Info

Publication number: WO2023115489A1
Application number: PCT/CN2021/140985
Authority: WO
Inventors: 虞露; 王楚楚; 李思成; 白雨箫; 戴震宇
Original assignee: 浙江大学; Oppo广东移动通信有限公司
Priority date: 2021-12-23
Filing date: 2021-12-23
Publication date: 2023-06-29

Abstract

本申请实施例公开了一种编解码方法、码流、装置、设备以及可读存储介质，该方法包括：根据码流，获得拼接地图集信息以及待解码视频数据；对拼接地图集信息进行元数据解码，得到至少两种异构格式各自的辅助信息；对待解码视频数据进行视频解码，得到拼接图像；其中，拼接图像是由至少两种异构格式对应的图像子块组成。这样，在同一张地图集中支持至少两种异构格式对应的视觉数据，不仅能够实现对编解码标准的扩展，而且还能够减少视频解码器的需求量，同时提高了图像的合成质量。

Description

编解码方法、码流、装置、设备以及可读存储介质

技术领域

本申请实施例涉及虚实混合技术领域，尤其涉及一种编解码方法、码流、装置、设备以及可读存储介质。

背景技术

随着视频编码技术的不断发展，点云数据作为一种重要而流行的三维物体表示方法，广泛应用于虚拟和混合现实、自动驾驶、三维打印等诸多领域。与传统的二维图像数据相比，点云数据包含更加生动的细节信息，使得点云数据量非常大。

在相关技术中，已有的视频编解码标准并不支持将点云数据和二维图像数据编码到同一地图集中。当一张地图集中既包含二维图像数据又包含点云数据时，这时候通常是将点云数据投影成图像数据再进行编解码处理，从而无法保留点云的细节信息，导致观看视点图像的质量降低；若需要在系统层支持则会增加视频解码器的需求量，进而提高实施的成本。

发明内容

本申请实施例提供一种编解码方法、码流、装置、设备以及可读存储介质，不仅可以减少视频解码器的需求量，充分利用视频解码器的处理像素率；而且还能够提高视频图像的合成质量。

本申请实施例的技术方案可以如下实现：

第一方面，本申请实施例提供了一种解码方法，该方法包括：

根据码流，获得拼接地图集信息以及待解码视频数据；

对拼接地图集信息进行元数据解码，得到至少两种异构格式各自的辅助信息；

对待解码视频数据进行视频解码，得到拼接图像；其中，拼接图像是由至少两种异构格式对应的图像子块组成。

第二方面，本申请实施例提供了一种编码方法，该方法包括：

获取至少两种异构格式的视觉数据对应的图像子块；

对至少两种异构格式的视觉数据对应的图像子块进行拼接，得到拼接地图集信息和拼接图像；

对拼接地图集信息和拼接图像进行编码，并将所得到的编码比特写入码流。

第三方面，本申请实施例提供了一种码流，该码流是根据待编码信息进行比特编码生成的；其中，待编码信息包括下述至少之一：拼接地图集信息、拼接图像和语法元素标识信息的取值。

第四方面，本申请实施例提供了一种编码装置，该编码装置包括第一获取单元、拼接单元和编码单元；其中，

第一获取单元，配置为获取至少两种异构格式的视觉数据对应的图像子块；

拼接单元，配置为对至少两种异构格式的视觉数据对应的图像子块进行拼接，得到拼接地图集信息和拼接图像；

编码单元，配置为对拼接地图集信息和拼接图像进行编码，并将所得到的编码比特写入码流。

第五方面，本申请实施例提供了一种编码设备，该编码设备包括第一存储器和第一处理器；其中，

第一存储器，用于存储能够在第一处理器上运行的计算机程序；

第一处理器，用于在运行计算机程序时，执行如第二方面所述的方法。

第六方面，本申请实施例提供了一种解码装置，该解码装置包括第二获取单元、元数据解码单元和视频解码单元；其中，

第二获取单元，配置为根据码流，获得拼接地图集信息以及待解码视频数据；

元数据解码单元，配置为对拼接地图集信息进行元数据解码，得到至少两种异构格式各自的辅助信息；

视频解码单元，配置为对待解码视频数据进行视频解码，得到拼接图像；其中，拼接图像是由至少两种异构格式对应的图像子块组成。

第七方面，本申请实施例提供了一种解码设备，该解码设备包括第二存储器和第二处理器；其中，

第二存储器，用于存储能够在第二处理器上运行的计算机程序；

第二处理器，用于在运行计算机程序时，执行如第一方面所述的方法。

第八方面，本申请实施例提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序，所述计算机程序被执行时实现如第一方面所述的方法、或者实现如第二方面所述的方法。

本申请实施例提供了一种编解码方法、码流、装置、设备以及可读存储介质，在编码侧，获取至少两种异构格式的视觉数据对应的图像子块；对至少两种异构格式的视觉数据对应的图像子块进行拼接，得到拼接地图集信息和拼接图像；对拼接地图集信息和拼接图像进行编码，并将所得到的编码比特写入码流。在解码侧，根据码流，获得拼接地图集信息以及待解码视频数据；对拼接地图集信息进行元数据解码，得到至少两种异构格式各自的辅助信息；对待解码视频数据进行视频解码，得到拼接图像；其中，拼接图像是由至少两种异构格式对应的图像子块组成。这样，在同一张地图集中支持至少两种异构格式对应的视觉数据，然后可以利用不同的元数据解码器对这至少两种异构格式各自的辅助信息进行解码，利用一个视频解码器可以对这至少两种异构格式组成的拼接图像进行解码，从而不仅实现了对编解码标准的扩展，而且还减少了视频解码器的需求量，能够充分利用视频解码器的处理像素率，降低了硬件需求；另外，由于还能够保留来自不同异构格式的渲染特性，进而还提高了图像的合成质量。

附图说明

图1A为一种基于数据格式的合成框架示意图；

图1B为另一种基于数据格式的合成框架示意图；

图2为一种基于数据格式的编码方法和解码方法示意图；

图3A为本申请实施例提供的一种视频编码器的详细框架示意图；

图3B为本申请实施例提供的一种视频解码器的详细框架示意图；

图4为本申请实施例提供的一种解码方法的流程示意图；

图5为本申请实施例提供的另一种解码方法的流程示意图；

图6为本申请实施例提供的又一种解码方法的流程示意图；

图7为本申请实施例提供的一种编码方法的流程示意图；

图8为本申请实施例提供的另一种编码方法的流程示意图；

图9为本申请实施例提供的一种编码装置的组成结构示意图；

图10为本申请实施例提供的一种编码设备的具体硬件结构示意图；

图11为本申请实施例提供的一种解码装置的组成结构示意图；

图12为本申请实施例提供的一种解码设备的具体硬件结构示意图；

图13为本申请实施例提供的一种编解码系统的组成结构示意图。

具体实施方式

为了能够更加详尽地了解本申请实施例的特点与技术内容，下面结合附图对本申请实施例的实现进行详细阐述，所附附图仅供参考说明之用，并非用来限定本申请实施例。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的，不是旨在限制本申请。

在以下的描述中，涉及到“一些实施例”，其描述了所有可能实施例的子集，但是可以理解，“一些实施例”可以是所有可能实施例的相同子集或不同子集，并且可以在不冲突的情况下相互结合。还需要指出，本申请实施例所涉及的术语“第一\第二\第三”仅是用于区别类似的对象，不代表针对对象的特定排序，可以理解地，“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序，以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。

对本申请实施例进行进一步详细说明之前，先对本申请实施例中涉及的名词和术语进行说明，本申请实施例中涉及的名词和术语适用于如下的解释：

动态图像专家组(Moving Picture Experts Group，MPEG)

可视体视频编码(Visual Volumetric Video-based Coding，V3C)

MPEG沉浸式视频(MPEG Immersive Video，MIV)

点云压缩(Point Cloud Compression，PCC)

基于视频的点云压缩(Video based Point Cloud Compression，V-PCC)

三维(Three Dimensions，3D)

虚拟现实(Virtual Reality，VR)

增强现实(Augmented Reality，AR)

混合现实(Mix Reality，MR)

地图集(Atlas)

图像子块(Patch)

可以理解，通常情况下，将同构数据格式定义为源的表达方式一样的数据格式，异构数据格式定义为起源不同的数据格式。在本申请实施例中，同构数据格式的源可简称为同构源，异构数据格式的源可简称为异构源。

参见图1A，其示出了一种基于数据格式的合成框架示意图。如图1A所示，可以允许在同一视频场景中解码和合成不同的数据格式比特流。其中，格式0和格式1均为图像格式，即格式0和格式1为同构数据格式；格式2为点云(Point Cloud)格式，格式3为网格(Mesh)格式，即格式2和格式3为异构数据格式。也就是说，在图1A中，两个异构数据格式(即格式2和格式3)与场景中的同构数据格式(即格式0和格式1)组合在一起。通过这种方式，可以为具有不同来源的多个数据格式(例如，网格、点云、图像等等)提供实时沉浸式视频交互服务。

在一种具体的示例中，对于点云和图像这两种数据格式，图1B示出了另一种基于数据格式的合成框架示意图。如图1B所示，点云和图像作为异构数据格式，这里可以将其组合在一起，然后基于数据格式的方法进行独立的编码和解码。另外，需要注意的是，点云格式为非均匀采样处理，图像格式为均匀采样处理。

在本申请实施例中，基于数据格式的方法可以允许以数据格式的比特流级进行独立性处理。即与视频编码中的瓦片(tiles)或切片(slices)一样，该场景中的不同数据格式可以以独立的方式编码，从而可以基于数据格式进行独立的编码和解码。

参见图2，其示出了一种基于数据格式的编码方法和解码方法示意图。如图2所示，(a)示出了一种编码方法的流程，(b)示出了一种解码方法的流程。

在(a)中，对于内容预处理过程，可通过格式0～格式3中的每种格式分别进行编码。假定这些格式共享一个公共的3D场景，针对一些来自不同源的数据格式(例如，格式2和格式3)还必须在编码之前将其转换为图像格式，具体地，网格(Mesh)格式需要转换为图像格式，点云(Point Cloud)格式也需要转换为图像格式；然后再由基于数据格式的元数据编码器进行编码，生成比特流(或者可称为“码流”)。

在(b)中，基于数据格式的元数据解码器对所接收到的比特流进行解码，这时候需要在内容合成过程中将基于数据格式单独编码得到的比特流一起合成到该场景中。其中，为了提高渲染效率，可以从渲染中过滤某些数据格式。如果外来数据格式可以共享相同的场景，那么可以将外来数据格式(或比特流)添加到合成过程中。假设这些数据格式共享一个公共的3D场景，一些来自不同源的数据格式(例如，格式2和格式3)还必须在编码之前转换为相同源的数据格式，然后再进行后续处理。

这样，通过启用基于数据格式的独立编码/解码，可以在内容描述中独立地描述每个数据格式。因此，相关技术提出了可以将异构数据格式(例如，Mesh、点云等)转换成图像格式(也可称之为“多视点平面图像格式”、“图像平面格式”等)，将其作为新的数据格式，用元数据编解码方法进行渲染；甚至还提出了可以在系统层支持虚实混合，例如将点云格式的码流与图像格式的码流在系统层进行混合(Multiplex)。

然而，在相关技术中，目前并不支持将异构数据格式编码进同一张地图集(Atlas)中，即一张地图集中既包含图像的patch又包含点云的patch。如果将点云等投影成图像再进行编解码，解码后基于重建图像再渲染需要观看的视点图像，点云中实际包含了可供连续的多视点观看的充分信息，由于编码前的投影只有有限个视点图像，在这些视点中点云的部分遮挡信息在此投影过程会丢失，导致观看视点图像的质量降低；如果在系统层支持虚实混合，每种数据格式形成独立码流，不同数据格式的多个码流由系统层混合为复合的系统层码流，每种数据格式对应的独立码流至少调用一个视频编解码器，那么又会导致视频解码器个数的需求量增加，进而提高实施的成本。

本申请实施例提供了一种解码方法，通过根据码流，获得拼接地图集信息以及待解码视频数据；对拼接地图集信息进行元数据解码，得到至少两种异构格式各自的辅助信息；对待解码视频数据进行视频解码，得到拼接图像；其中，拼接图像是由至少两种异构格式对应的图像子块组成。

本申请实施例还提供了一种编码方法，通过获取至少两种异构格式的视觉数据对应的图像子块；对至少两种异构格式的视觉数据对应的图像子块进行拼接，得到拼接地图集信息和拼接图像；对拼接地图集信息和拼接图像进行编码，并将所得到的编码比特写入码流。

这样，在同一张地图集中支持至少两种异构格式对应的视觉数据，然后可以利用不同的元数据解码器对这至少两种异构格式各自的辅助信息进行解码，利用一个视频解码器可以对这至少两种异构格式组成的拼接图像进行解码，从而不仅实现了对编解码标准的扩展，而且还减少了视频解码器的需求量，能够充分利用视频解码器的处理像素率，降低了硬件需求；另外，由于还能够保留来自不同异构格式的渲染特性，进而还提高了图像的合成质量。

下面将结合附图对本申请各实施例进行详细说明。

参见图3A，其示出了本申请实施例提供的一种视频编码器的详细框架示意图。如图3A所示，该视频编码器10包括变换与量化单元101、帧内估计单元102、帧内预测单元103、运动补偿单元104、运动估计单元105、反变换与反量化单元106、滤波器控制分析单元107、滤波单元108、编码单元109和解码图像缓存单元110等，其中，滤波单元108可以实现去方块滤波及样本自适应缩进(Sample Adaptive 0ffset，SAO)滤波，编码单元109可以实现头信息编码及基于上下文的自适应二进制算术编码(Context-based Adaptive Binary Arithmatic Coding，CABAC)。针对输入的原始视频信号，通过编码树块(Coding Tree Unit，CTU)的划分可以得到一个视频编码块，然后对经过帧内或帧间预测后得到的残差像素信息通过变换与量化单元101对该视频编码块进行变换，包括将残差信息从像素域变换到变换域，并对所得的变换系数进行量化，用以进一步减少比特率；帧内估计单元102和帧内预测单元103是用于对该视频编码块进行帧内预测；明确地说，帧内估计单元102和帧内预测单元103用于确定待用以编码该视频编码块的帧内预测模式；运动补偿单元104和运动估计单元105用于执行所接收的视频编码块相对于一或多个参考帧中的一或多个块的帧间预测编码以提供时间预测信息；由运动估计单元105执行的运动估计为产生运动向量的过程，所述运动向量可以估计该视频编码块的运动，然后由运动补偿单元104基于由运动估计单元105所确定的运动向量执行运动补偿；在确定帧内预测模式之后，帧内预测单元103还用于将所选择的帧内预测数据提供到编码单元109，而且运动估计单元105将所计算确定的运动向量数据也发送到编码单元109；此外，反变换与反量化单元106是用于该视频编码块的重构建，在像素域中重构建残差块，该重构建残差块通过滤波器控制分析单元107和滤波单元108去除方块效应伪影，然后将该重构残差块添加到解码图像缓存单元110的帧中的一个预测性块，用以产生经重构建的视频编码块；编码单元109是用于编码各种编码参数及量化后的变换系数，在基于CABAC的编码算法中，上下文内容可基于相邻编码块，可用于编码指示所确定的帧内预测模式的信息，输出该视频信号的码流；而解码图像缓存单元110是用于存放重构建的视频编码块，用于预测参考。随着视频图像编码的进行，会不断生成新的重构建的视频编码块，这些重构建的视频编码块都会被存放在解码图像缓存单元110中。

参见图3B，其示出了本申请实施例提供的一种视频解码器的详细框架示意图。如图3B所示，该视频解码器20包括解码单元201、反变换与反量化单元202、帧内预测单元203、运动补偿单元204、滤波单元205和解码图像缓存单元206等，其中，解码单元201可以实现头信息解码以及CABAC解码，滤波单元205可以实现去方块滤波以及SAO滤波。输入的视频信号经过图3A的编码处理之后，输出该视频信号的码流；该码流输入视频解码器20中，首先经过解码单元201，用于得到解码后的变换系数；针对该变换系数通过反变换与反量化单元202进行处理，以便在像素域中产生残差块；帧内预测单元203可用于基于所确定的帧内预测模式和来自当前帧或图片的先前经解码块的数据而产生当前视频解码块的预测数据；运动补偿单元204是通过剖析运动向量和其他关联语法元素来确定用于视频解码块的预测信息，并使用该预测信息以产生正被解码的视频解码块的预测性块；通过对来自反变换与反量化单元202的残差块与由帧内预测单元203或运动补偿单元204产生的对应预测性块进行求和，而形成解码的视频块；该解码的视频信号通过滤波单元205以便去除方块效应伪影，可以改善视频质量；然后将经解码的视频块存储于解码图像缓存单元206中，解码图像缓存单元206存储用于后续帧内预测或运动补偿的参考图像，同时也用于视频信号的输出，即得到了所恢复的原始视频信号。

在本申请的一实施例中，参见图4，其示出了本申请实施例提供的一种解码方法的流程示意图。如图4所示，该方法可以包括：

S401：根据码流，获得拼接地图集信息以及待解码视频数据。

S402：对拼接地图集信息进行元数据解码，得到至少两种异构格式各自的辅助信息。

S403：对待解码视频数据进行视频解码，得到拼接图像；其中，拼接图像是由至少两种异构格式对应的图像子块组成。

需要说明的是，在本申请实施例中，针对点云、图像等不同异构格式对应的图像子块是可以共存于一张拼接图像的。这样，仅需要一个视频解码器即可实现对这至少两种异构格式对应的图像子块进行解码，从而能够减少视频解码器的需求量。

还需要说明的是，在本申请实施例中，针对点云、图像等不同异构格式各自的辅助信息是可以共存于同一地图集上的，但是在该拼接地图集信息中，针对每一种异构格式的辅助信息可以调用相应元数据解码器进行解码，从而能够保留来自不同异构格式的渲染特性。

还需要说明的是，在本申请实施例中，属于同一拼接图像的序列使用一个视频解码器，而同一时刻的不同拼接图像则属于不同序列。另外，本申请实施例所述的异构格式可以是指数据的来源不同，也可以是指同一来源处理为不同的数据格式，这里不作任何限定。

在这里，拼接地图集信息可以是由至少两种异构格式的视觉数据各自的辅助信息进行拼接构成的。因此，在一些实施例中，对于S402来说，所述对拼接地图集信息进行元数据解码，得到至少两种异构格式各自的辅助信息，可以包括：

调用至少两种元数据解码器对拼接地图集信息进行元数据解码，得到至少两种异构格式各自的辅助信息。

也就是说，拼接地图集信息可以包括至少两种异构格式各自的辅助信息，而针对每一种异构格式的辅助信息可以使用对应的元数据解码器进行解码。换言之，在本申请实施例中，拼接地图集信息中所包括多少种异构格式的辅助信息，那么就需要多少种元数据解码器，即元数据解码器的数量与异构格式的数量具有对应关系。

进一步地，在一些实施例中，至少两种异构格式可以包括第一数据格式和第二数据格式。相应地，对于S402来说，所述对拼接地图集信息进行元数据解码，得到至少两种异构格式各自的辅助信息，可以包括：

若当前解码的辅助信息为拼接地图集信息中第一数据格式的对应信息，则调用第一数据格式对应的元数据解码器进行解码，得到第一数据格式对应的辅助信息；

若当前解码的辅助信息为拼接地图集信息中第二数据格式的对应信息，则调用第二数据格式对应的元数据解码器进行解码，得到第二数据格式对应的辅助信息。

需要说明的是，针对共存于一个拼接图像中的第一数据格式和第二数据格式对应的图像子块可以是由一个视频解码器进行解码得到。但是针对这种两种数据格式的虚实混合应用事件(Use Case)，当解码拼接地图集信息中不同数据格式的对应信息时，如果当前需要解码的是第一数据格式的对应信息，那么就需要调用第一数据格式对应的元数据解码器进行解码，得到第一数据格式对应的辅助信息；如果当前需要解码的是第二数据格式的对应信息，那么就需要调用第二数据格式对应的元数据解码器进行解码，得到第二数据格式对应的辅助信息。

进一步地，在一些实施例中，至少两种异构格式还可以包括第三数据格式。相应地，所述对拼接地图集信息进行元数据解码，得到至少两种异构格式各自的辅助信息，还可以包括：

若当前解码的辅助信息为拼接地图集信息中第三数据格式的对应信息，则调用第三数据格式对应的元数据解码器进行解码，得到第三数据格式对应的辅助信息。

也就是说，在本申请实施例中，这至少两种异构格式并不仅限于第一数据格式和第二数据格式，甚至还可以包括第三数据格式、第四数据格式等等，当需要解码某一数据格式的辅助信息时，只需要调用相应元数据解码器进行解码即可，下面仅以第一数据格式和第二数据格式为例进行说明。

在一种具体的实施例中，第一数据格式为图像格式，第二数据格式为点云格式。相应地，在一些实施例中，如图5所示，对于S402来说，可以包括如下步骤：

S501：若当前解码的辅助信息为拼接地图集信息中图像格式的对应信息，则调用多视点解码器进行解码，得到图像格式对应的辅助信息。

S502：若当前解码的辅助信息为拼接地图集信息中点云格式的对应信息，则调用点云解码器进行解码，得到点云格式对应的辅助信息。

需要说明的是，在本申请实施例中，第一数据格式和第二数据格式不同。其中，第一数据格式可以为图像格式，第二数据格式可以为点云格式；或者，第一数据格式和第二数据格式的投影格式不同，第一数据格式可以为透视投影格式，第二数据格式可以为正交投影格式；或者，第一数据格式还可以为网格格式、点云格式等等，第二数据格式也可以为网格格式、图像格式等等，这里并不作任何限定。

还需要说明的是，在本申请实施例中，点云格式为非均匀采样处理，图像格式为均匀采样处理，因此，点云格式和图像格式可以作为两种异构格式。在这种情况下，对于图像格式，可以调用多视点解码器进行解码；对于点云格式，可以调用点云解码器进行解码。这样，如果当前需要解码的是图像格式的对应信息，那么就需要调用多视点解码器进行解码，即可得到图像格式对应的辅助信息；如果当前需要解码的是点云格式的对应信息，那么就需要调用点云解码器进行解码，即可得到点云格式对应的辅助信息，从而既能够保留来自图像格式的渲染特性，又能够保留来自点云格式的渲染特性。

进一步地，在一些实施例中，对于S403来说，所述对待解码视频数据进行视频解码，得到拼接图像，可以包括：

调用视频解码器对待解码视频数据进行视频解码，得到拼接图像；其中，视频解码器的数量为一个。

也就是说，针对共存于一个拼接图像中的至少两种异构格式对应的图像子块可以是由一个视频解码器进行解码得到的。这样，与相关技术中分别编码再调用各自的解码器独立解码多路信号相比，本申请实施例需要调用的视频解码器数量少，可以充分利用视频解码器的处理像素率，使得对硬件要求降低。

具体来讲，针对拼接图像中的多种异构格式对应的图像子块，可以由一个视频解码器进行解码得到；但是针对拼接地图集信息中这多种异构格式各自的辅助信息，可以调用各自的元数据解码器进行解码，以得到不同异构格式对应的辅助信息。示例性地，如果需要解码拼接地图集信息中点云格式的对应信息，可以调用点云解码器进行解码，以得到点云格式对应的辅助信息；如果需要解码拼接地图集信息中图像格式的对应信息，可以调用多视点解码器进行解码，以得到图像格式对应的辅助信息等，本申请实施例不作任何限定。

进一步地，在得到至少两种异构格式各自的辅助信息和拼接图像之后，在一些实施例中，如图6所示，该方法还可以包括：

S601：利用至少两种异构格式各自的辅助信息对拼接图像进行渲染处理，得到目标三维图像。

这样，在本申请实施例中，针对至少两种异构格式对应的图像子块可以共存于一张拼接图像中，而且该拼接图像使用一个视频解码器进行解码，从而减少了视频解码器的数量；但是针对至少两种异构格式各自的辅助信息，可以分别调用相应元数据解码器进行解码，从而能够保留来自不同数据格式(例如图像格式、点云格式等)的渲染优点，还能够提高图像的合成质量。

可以理解的是，在相关技术中，对于点云、图像等不同数据格式，如果共存在一张拼接图像上则是不支持的。在MPEG标准中，目前已经定义了图像格式和点云格式的公共高层语法信息，这时候需要搭配图像格式或者是点云格式才可以使用，所以在标准里定义了语法元素asps_extension_present_flag的标志位是用于指示拓展功能的开启。其中，如果语法元素asps_vpcc_extension_present_flag的标志位为真(或取值为1)，那么可以参考点云解码标准中的具体解码过程；如果语法元素asps_miv_extension_present_flag的标志位为真(或取值为1)，那么可以遵守图像解码标准里的具体解码过程，具体如表1所示。

表1

在这里，表2所示的点云解码标准中规定了当语法元素asps_vpcc_extension_present_flag的标志位为真(或取值为1)时，图像解码标准拓展涉及的相关语法元素(以灰色为底的语法元素部分)的标志位均为假(或取值为0)。具体如下所示。所以点云解码标准(例如V-PCC标准)和图像解码标准(例如MIV标准)均不能支持二者同时为真。

表2

也就是说，在使用V-PCC标准或MIV标准时实际上二者只能有一个为真，并无法处理二者均为真的情况。基于此，本申请实施例提供了一种解码方法，可以实现点云、图像等不同数据格式的图像子块共存在一张拼接图像，以便实现前述的节省视频解码器数量的优点，而且还能够保留来自图像格式、点云格式等不同数据格式的渲染特性，提高了图像的合成质量。

也就是说，本申请实施例设置有目标语法元素概述表(Profile)，且该目标语法元素概述表用于指示可以支持至少两种异构格式对应的图像子块共存于一张拼接图像。这样，由当点云、图像等不同数据格式对应的图像子块共存于一张拼接图像时，本申请实施例可以实现通过一个视频解码器进行解码处理。

在这里，对于目标语法元素概述表而言，其可以是在初始语法元素概述表的基础上扩展得到的。也就是说，目标语法元素概述表可以是由初始概述部分和混合概述部分组成。在一种具体的实施例中，初始概述部分用于指示不支持图像格式对应的图像子块和点云格式对应的图像子块共存于一张拼接图像；混合概述部分用于指示可以支持图像格式对应的图像子块和点云格式对应的图像子块共存于一张拼接图像。

示例性地，以MIV解码标准和V-PCC解码标准为例，在这里，初始语法元素概述表或者可以说是初始概述部分仅支持图像格式对应的图像子块，而且明确指出图像格式对应的图像子块和点云格式对应的图像子块不能共存于一张拼接图像；目标语法元素概述表由于增加了混合概述部分，使其能够支持图像格式对应的图像子块和点云格式对应的图像子块共存于一张拼接图像，具体详见表3所示。其中，表3是在标准中已有的MIV语法元素概述的基础上扩展得到的，以灰色为底的部分即为本申请实施例新增混合概述部分的内容。

表3

需要说明的是，表3提供了一种目标语法元素概述表的示例。该目标语法元素概述表仅是一种具体示例，除了语法元素vps_occupancy_video_present_flag[atlasID]的标志位确定为1(点云投影方式的原因，必须有occupancy信息)，其余一些语法元素的标志位可以不加限制，例如语法元素ai_attribute_count[atlasID]可以不加约束(除了纹理、透明度，点云也支持反射率、材质等属性)。简言之，表3仅是一个示例，本申请实施例不作具体限定。

还需要说明的是，在表3中，新增加了一些图像格式和点云格式混合相关的语法元素，也就是说，目标语法元素概述表可以是由初始概述部分和混合概述部分组成。因此，在一些实施例中，该方法还可以包括：

根据码流，获得语法元素标识信息的取值；

若语法元素标识信息指示在初始概述部分不支持至少两种异构格式对应的图像子块共存于拼接图像、且在混合概述部分支持述至少两种异构格式对应的图像子块共存于拼接图像，则执行根据码流，获得拼接地图集信息以及待解码数据的步骤。

在一种具体的实施例中，所述根据码流，获得语法元素标识信息的取值，可以包括：

若语法元素标识信息的取值在初始概述部分为第一值，则确定语法元素标识信息指示在初始概述部分不支持至少两种异构格式对应的图像子块共存于拼接图像；

若语法元素标识信息的取值在混合概述部分为第二值，则确定语法元素标识信息指示在混合概述部分支持至少两种异构格式对应的图像子块共存于拼接图像。

需要说明的是，该方法还可以包括：若语法元素标识信息的取值在初始概述部分为第二值，则确定语法元素标识信息指示在初始概述部分支持至少两种异构格式对应的图像子块共存于拼接图像；或者，若语法元素标识信息的取值在混合概述部分为第一值，则确定语法元素标识信息指示在混合概述部分不支持至少两种异构格式对应的图像子块共存于拼接图像。

在本申请实施例中，第一值和第二值不同。其中，第一值等于0，第二值等于1；或者，第一值等于1，第二值等于0；或者，第一值为假(false)，第二值为真(true)等等。在一种具体的实施例中，第一值等于0，第二值等于1，但是这里并不作任何限定。

也就是说，针对标准中的初始语法元素概述表中增加了关于V-PCC extension相关的标志位(flag)限制，这里增加两个语法元素asps_vpcc_extension_present_flag和aaps_vpcc_extension_present_flag，并且在初始概述部分中语法元素标识信息的取值明确为0，即明确图像格式和点云格式不能共存。因此，这里定义新的概述表(即表3所示的目标语法元素概述表)可以支持这一情况，如果是这种虚实混合的应用场景，在解码辅助信息时，遇见图像格式就调用相应的图像解码标准(即图像解码器)，遇见点云格式就调用点云解码标准(即点云解码器)，然后把像素点都恢复在三维空间中，再投影至目标视点。

还需要说明的是，语法元素的解析以及在相关标准中记载的点云格式的解码过程以及图像格式的解码过程引入到新概述表(即本申请实施例所述的目标语法元素概述表)的解码过程。示例性地，MIV Main Mixed V-PCC Profile的解码过程来自MIV Main以及V-PCC的相关解码过程，以此类推。另外，在标准中，V-PCC Profile有如下四种，如表4所示。

表4

因此，由于MIV Profile有四种，V-PCC Profile有如下四种，所以虚实混合(MIV Mixed V-PCC)总共有16种组合，如下所示。

表5

进一步地，在一些实施例中，在对符合混合V-PCC Profile的比特流进行解码之后，还需要进行渲染处理，该过程可以包括如下步骤：尺度缩放几何(Scale geometry)、子块的属性补偿处理(Apply patch attribute offset process)、过滤不必要子块(Filter inpaint patches)、重建裁剪视图(Reconstruct pruned views)、基于视点信息确定视图混合权重(Determine view blending weights based on a viewport pose)、恢复样本权重(Recover sample weights)、重建3D点(Reconstruct 3D points)、重建标准中规定的3D点云(Reconstruct 3D point cloud)、投影到视点(Project to a viewport)、从多视图中获取纹理信息(Fetch texture from multiple views)、混合纹理贡献(Blend texture contributions)等。其中，“重建标准中规定的3D点云”为本申请实施例新增加的步骤，以实现虚实混合。

简言之，本申请实施例所提供的用于虚实混合的解码方法，如果一张拼接图像中共存图像格式和点云格式的patch或者不同投影格式的patch，对于辅助信息的解码，元数据解码器需要区分是图像部分的元数据解码还是点云部分的元数据解码，但是拼接图像仅需要一个视频解码器即可，也即需要的视频解码器数量少。具体而言，不仅能够实现对标准的扩展，而且针对由不同的(或异构的)数据格式与场景中的同构数据格式组成的应用场景，可以通过这种方式，为不同来源的多个数据格式(例如图像、点云、网格等)提供实时沉浸式视频交互服务，促进VR/AR/MR产业的发展。

另外，在本申请实施例中，将图像格式与点云格式混合编码，与分别编码再调用各自解码器独立解多路信号相比，这里需要调用的视频解码器数量少，充分利用了视频解码器的处理像素率，对硬件要求降低。此外，本申请实施例保留了来自不同源的数据格式(网格、点云等)的渲染优点，还能够提高图像的合成质量。

本实施例提供了一种解码方法，通过根据码流，获得拼接地图集信息以及待解码视频数据；对拼接地图集信息进行元数据解码，得到至少两种异构格式各自的辅助信息；对待解码视频数据进行视频解码，得到拼接图像；其中，拼接图像是由至少两种异构格式对应的图像子块组成。这样，在同一张地图集中支持至少两种异构格式对应的视觉数据，然后可以利用不同的元数据解码器对这至少两种异构格式各自的辅助信息进行解码，利用一个视频解码器可以对这至少两种异构格式组成的拼接图像进行解码，从而不仅实现了对编解码标准的扩展，而且还减少了视频解码器的需求量，能够充分利用视频解码器的处理像素率，降低了硬件需求；另外，由于还能够保留来自不同异构格式的渲染特性，进而还提高了图像的合成质量。

在本申请的另一实施例中，参见图7，其示出了本申请实施例提供的一种编码方法的流程示意图。如图7所示，该方法可以包括：

S701：获取至少两种异构格式的视觉数据对应的图像子块。

S702：对至少两种异构格式的视觉数据对应的图像子块进行拼接，得到拼接地图集信息和拼接图像。

S703：对拼接地图集信息和拼接图像进行编码，并将所得到的编码比特写入码流。

需要说明的是，本申请实施例所述的编码方法具体可以是指3D异构视觉数据的编码方法。在本申请实施例中，针对点云、图像等不同异构格式对应的图像子块是可以共存在一张拼接图像的。这样，在对这至少两种异构格式的视觉数据对应的图像子块所组成的拼接图像进行编码之后，后续可以仅通过一个视频解码器进行解码，从而能够减少视频解码器的需求量。

还需要说明的是，在本申请实施例中，属于同一拼接图像的序列使用一个视频解码器，而同一时刻的不同拼接图像属于不同序列。另外，本申请实施例所述的异构格式可以是指数据的来源不同，也可以是指同一来源处理为不同的数据格式，这里不作任何限定。

还需要说明的是，在本申请实施例中，拼接地图集信息可以是由至少两种异构格式的视觉数据各自的辅助信息进行拼接构成的；拼接图像可以是由至少两种异构格式的视觉数据对应的图像子块进行拼接构成的。

进一步地，在一些实施例中，如图8所示，对于S703而言，可以包括如下步骤：

S801：调用元数据编码器对拼接地图集信息进行元数据编码。

S802：调用视频编码器对拼接图像进行视频编码。

也就是说，针对点云、图像等不同数据格式各自的辅助信息是可以共存于同一地图集上的，但是在该拼接地图集信息中，针对每一种异构格式的辅助信息可以调用相应元数据编码器进行编码处理。

对于拼接图像而言，可以是将点云、图像等不同数据格式的视觉数据对应的图像子块重排列在同一拼接图像上，然后针对该拼接图像可以调用视频编码器进行编码处理。

在本申请实施例中，视频编码器的数量为一个；而元数据编码器的数量为至少两种，且元数据编码器的数量与异构格式的数量具有对应关系。也就是说，针对每一种异构格式的辅助信息可以使用对应的元数据编码器进行编码。换言之，在本申请实施例中，拼接地图集信息中所包括多少种异构格式的辅助信息，那么就需要多少种元数据编码器。

进一步地，在一些实施例中，至少两种异构格式可以包括第一数据格式和第二数据格式。相应地，所述调用元数据编码器对所述拼接地图集信息进行元数据编码，可以包括：

若当前编码的辅助信息为所述拼接地图集信息中所述第一数据格式的对应信息，则调用所述第一数据格式对应的元数据编码器进行编码；

若当前编码的辅助信息为所述拼接地图集信息中所述第二数据格式的对应信息，则调用所述第二数据格式对应的元数据编码器进行编码。

需要说明的是，针对共存于一个拼接图像中的第一数据格式和第二数据格式对应的图像子块可以是由一个视频编码器进行编码。但是针对这种两种数据格式的虚实混合应用事件(Use Case)，当编码拼接地图集信息中不同数据格式的辅助信息时，如果当前需要编码的辅助信息是第一数据格式的对应信息，那么就需要调用第一数据格式对应的元数据编码器进行编码；如果当前需要编码的辅助信息是第二数据格式的对应信息，那么就需要调用第二数据格式对应的元数据编码器进行编码。

进一步地，在一些实施例中，至少两种异构格式还可以包括第三数据格式。相应地，所述调用元数据编码器对拼接地图集信息进行元数据编码，还可以包括：

若当前编码的辅助信息为拼接地图集信息中第三数据格式的对应信息，则调用第三数据格式对应的元数据编码器进行编码。

也就是说，在本申请实施例中，这至少两种异构格式并不仅限于第一数据格式和第二数据格式，甚至还可以包括第三数据格式、第四数据格式等等，当需要编码某一数据格式的辅助信息时，只需要调用相应元数据编码器进行编码即可，下面仅以第一数据格式和第二数据格式为例进行说明。

在一种具体的实施例中，第一数据格式为图像格式，第二数据格式为点云格式。相应地，所述调用元数据编码器对拼接地图集信息进行元数据编码，可以包括：

若当前编码的辅助信息为拼接地图集信息中图像格式的对应信息，则调用多视点编码器进行编码；

若当前编码的辅助信息为拼接地图集信息中点云格式的对应信息，则调用点云编码器进行编码。

还需要说明的是，在本申请实施例中，点云格式为非均匀采样处理，图像格式为均匀采样处理，因此，点云格式和图像格式可以作为两种异构格式。在这种情况下，对于图像格式的辅助信息，可以调用多视点编码器进行编码；对于点云格式的辅助信息，可以调用点云编码器进行编码。这样，如果当前需要编码的辅助信息是图像格式的对应信息，那么就需要调用多视点编码器进行编码；如果当前需要编码的辅助信息是点云格式的对应信息，那么就需要调用点云编码器进行编码，以便后续在解码侧进行解码处理时，既能够保留来自图像格式的渲染特性，又能够保留来自点云格式的渲染特性。

这样，在本申请实施例中，针对至少两种异构格式的视觉数据对应的图像子块可以共存于一张拼接图像中，而且该拼接图像可以使用一个视频编码器进行编码，减少了视频编码器的数量；由于后续是使用一个视频解码器进行解码，同时还减少了视频解码器的数量；但是针对至少两种异构格式各自的辅助信息，可以分别调用相应元数据编码器进行编码，然后再解码时调用相应元数据解码器进行解码，从而还能够保留来自不同数据格式(例如图像格式、点云格式等)的渲染优点，以提高图像的合成质量。

可以理解的是，在本申请实施例中，对于目标语法元素概述表而言，其可以是在标准中已有的初始语法元素概述表的基础上扩展得到的。也就是说，目标语法元素概述表可以是由初始概述部分和混合概述部分组成。在一种具体的实施例中，初始概述部分用于指示不支持图像格式对应的图像子块和点云格式对应的图像子块共存于一张拼接图像；混合概述部分用于指示可以支持图像格式对应的图像子块和点云格式对应的图像子块共存于一张拼接图像。

示例性地，在这里，初始语法元素概述表或者可以说是初始概述部分仅支持图像格式对应的图像子块，而且明确指出图像格式对应的图像子块和点云格式对应的图像子块不能共存于一张拼接图像；目标语法元素概述表由于增加了混合概述部分，使其能够支持图像格式对应的图像子块和点云格式对应的图像子块共存于一张拼接图像，具体详见前述表3所示。

另外，还需要说明的是，表3提供了一种目标语法元素概述表的示例。该目标语法元素概述表仅是一种具体示例，除了语法元素vps_occupancy_video_present_flag[atlasID]的标志位确定为1(点云投影方式的原因，必须有occupancy信息)，其余一些语法元素的标志位可以不加限制，例如语法元素ai_attribute_count[atlasID]可以不加约束(除了纹理、透明度，点云也支持反射率、材质等属性)。简言之，表3仅是一个示例，本申请实施例不作具体限定。

还需要说明的是，在前述表3中，新增加了一些图像格式和点云格式混合相关的语法元素，也就是说，目标语法元素概述表可以是由初始概述部分和混合概述部分组成。因此，在一些实施例中，该方法还可以包括：

确定语法元素标识信息的取值；

对语法元素标识信息的取值进行编码，并将所得到的编码比特写入码流。

在一种具体的实施例中，所述确定语法元素标识信息的取值，可以包括：

若语法元素标识信息指示在初始概述部分不支持至少两种异构格式对应的图像子块共存于拼接图像，则确定语法元素标识信息的取值在初始概述部分为第一值；

若语法元素标识信息指示在混合概述部分支持至少两种异构格式对应的图像子块共存于拼接图像，则确定语法元素标识信息的取值在混合概述部分为第二值。

需要说明的是，该方法还可以包括：若语法元素标识信息指示在初始概述部分支持至少两种异构格式对应的图像子块共存于拼接图像，则确定语法元素标识信息的取值在初始概述部分为第二值；或者，若语法元素标识信息指示在混合概述部分不支持至少两种异构格式对应的图像子块共存于拼接图像，则确定语法元素标识信息的取值在混合概述部分为第一值。

也就是说，针对标准中的初始语法元素概述表中增加了关于V-PCC extension相关的标志位(flag)限制，这里增加两个语法元素asps_vpcc_extension_present_flag和aaps_vpcc_extension_present_flag，并且在初始概述部分中语法元素标识信息的取值明确为0，即明确图像格式和点云格式不能共存。因此，这里定义新的概述表(即表3所示的目标语法元素概述表)可以支持这一情况，如果是这种虚实混合的应用场景，在编码辅助信息时，遇见图像格式就调用相应的图像编码标准(即图像编码器)，遇见点云格式就调用点云编码标准(即点云编码器)，以便后续再解码时调用相应元数据解码器进行解码，从而当把像素点都恢复在三维空间中再投影至目标视点时，能够保留来自不同数据格式(例如图像格式、点云格式等)的渲染优点，以提高图像的合成质量。

简言之，本申请实施例所提供的用于虚实混合的编码方法，具体可以是指3D异构视觉数据的编码方法，这时候如果一张拼接图像中共存图像格式和点云格式的patch或者不同投影格式的patch，对于辅助信息的编码，元数据编码器需要区分是图像部分的元数据编码还是点云部分的元数据编码，但是拼接图像仅需要一个视频编码器即可，也即需要的视频编码器数量少。具体而言，不仅能够实现对标准的扩展，而且针对由不同的(或异构的)数据格式与场景中的同构数据格式组成的应用场景，可以通过这种方式，为不同来源的多个数据格式(例如图像、点云、网格等)提供实时沉浸式视频交互服务，促进VR/AR/MR产业的发展。

另外，在本申请实施例中，将图像格式与点云格式混合编码，与分别编码再调用各自解码器独立解多路信号相比，这里需要调用的视频编解码器的数量少，对硬件要求降低。此外，本申请实施例保留了来自不同源的数据格式(网格、点云等)的渲染优点，还能够提高图像的合成质量。

本实施例提供了一种编码方法，通过获取至少两种异构格式的视觉数据对应的图像子块；对至少两种异构格式的视觉数据对应的图像子块进行拼接，得到拼接地图集信息和拼接图像；对拼接地图集信息和拼接图像进行编码，并将所得到的编码比特写入码流。这样，在同一张地图集中支持至少两种异构格式对应的视觉数据，不仅实现了对编解码标准的扩展，而且还减少了视频解码器的需求量，能够充分利用视频解码器的处理像素率，降低了硬件需求；另外，由于还能够保留来自不同异构格式的渲染特性，进而还提高了图像的合成质量。

在本申请的又一实施例中，本申请实施例提供了一种码流，该码流是根据待编码信息进行比特编码生成的。

在本申请实施例中，待编码信息可以包括下述至少之一：拼接地图集信息、拼接图像和语法元素标识信息的取值。其中语法元素标识信息的取值用于明确相关技术中图像和点云等不同格式在同一张拼接图像上不能共存，但本申请实施例可以支持图像和点云等不同格式共存在同一张拼接图像上；这样，在同一张地图集中支持至少两种异构格式对应的视觉数据，然后可以利用不同的元数据解码器对这至少两种异构格式各自的辅助信息进行解码，利用一个视频解码器可以对这至少两种异构格式组成的拼接图像进行解码，从而不仅实现了对编解码标准的扩展，而且还减少了视频解码器的需求量，能够充分利用视频解码器的处理像素率，降低了硬件需求；另外，由于还能够保留来自不同异构格式的渲染特性，进而还提高了图像的合成质量。

在本申请的再一实施例中，基于前述实施例相同的发明构思，参见图9，其示出了本申请实施例提供的一种编码装置90的组成结构示意图。如图9所示，该编码装置90可以包括：第一获取单元901、拼接单元902和编码单元903；其中，

第一获取单元901，配置为获取至少两种异构格式的视觉数据对应的图像子块；

拼接单元902，配置为对至少两种异构格式的视觉数据对应的图像子块进行拼接，得到拼接地图集信息和拼接图像；

编码单元903，配置为对拼接地图集信息和拼接图像进行编码，并将所得到的编码比特写入码流。

在一些实施例中，拼接地图集信息是由至少两种异构格式的视觉数据各自的辅助信息进行拼接构成的；拼接图像是由至少两种异构格式的视觉数据对应的图像子块进行拼接构成的。

在一些实施例中，编码单元903，具体配置为调用元数据编码器对拼接地图集信息进行元数据编码；以及调用视频编码器对拼接图像进行视频编码。

在一些实施例中，视频编码器的数量为一个；元数据编码器的数量为至少两种，且元数据编码器的数量与异构格式的数量具有对应关系。

在一些实施例中，至少两种异构格式包括第一数据格式和第二数据格式；相应地，编码单元903，还配置为若当前编码的辅助信息为拼接地图集信息中第一数据格式的对应信息，则调用第一数据格式对应的元数据编码器进行编码；以及若当前编码的辅助信息为拼接地图集信息中第二数据格式的对应信息，则调用第二数据格式对应的元数据编码器进行编码。

在一些实施例中，第一数据格式为图像格式，第二数据格式为点云格式；相应地，编码单元903，还配置为若当前编码的辅助信息为拼接地图集信息中图像格式的对应信息，则调用多视点编码器进行编码；以及若当前编码的辅助信息为拼接地图集信息中点云格式的对应信息，则调用点云编码器进行编码。

在一些实施例中，至少两种异构格式还包括第三数据格式；相应地，编码单元903，还配置为若当前编码的辅助信息为拼接地图集信息中第三数据格式的对应信息，则调用第三数据格式对应的元数据编码器进行编码。

在一些实施例中，参见图9，编码装置90还可以包括第一确定单元904，配置为确定语法元素标识信息的取值；

编码单元903，还配置为对语法元素标识信息的取值进行编码，并将所得到的编码比特写入码流。

在一些实施例中，第一确定单元904，具体配置为若语法元素标识信息指示在初始概述部分不支持至少两种异构格式对应的图像子块共存于拼接图像，则确定语法元素标识信息的取值在初始概述部分为第一值；以及若语法元素标识信息指示在混合概述部分支持至少两种异构格式对应的图像子块共存于拼接图像，则确定语法元素标识信息的取值在混合概述部分为第二值。

在一些实施例中，第一值等于0，第二值等于1。

可以理解地，在本申请实施例中，“单元”可以是部分电路、部分处理器、部分程序或软件等等，当然也可以是模块，还可以是非模块化的。而且在本实施例中的各组成部分可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。

所述集成的单元如果以软件功能模块的形式实现并非作为独立的产品进行销售或使用时，可以存储在一个计算机可读取存储介质中，基于这样的理解，本实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或processor(处理器)执行本实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

因此，本申请实施例提供了一种计算机存储介质，该计算机存储介质存储有计算机程序，所述计算机程序被第一处理器执行时实现前述实施例中任一项所述的方法。

基于上述编码装置90的组成以及计算机存储介质，参见图10，其示出了本申请实施例提供的一种编码设备100的具体硬件结构示意图。如图10所示，该编码设备100可以包括：第一通信接口1001、第一存储器1002和第一处理器1003；各个组件通过第一总线系统1004耦合在一起。可理解，第一总线系统1004用于实现这些组件之间的连接通信。第一总线系统1004除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图10中将各种总线都标为第一总线系统1004。其中，

第一通信接口1001，用于在与其他外部网元之间进行收发信息过程中，信号的接收和发送；

第一存储器1002，用于存储能够在第一处理器1003上运行的计算机程序；

第一处理器1003，用于在运行所述计算机程序时，执行：

获取至少两种异构格式的视觉数据对应的图像子块；

可以理解，本申请实施例中的第一存储器1002可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(Static RAM，SRAM)、动态随机存取存储器(Dynamic RAM，DRAM)、同步动态随机存取存储器(Synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM，DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM，SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM，DRRAM)。本申请描述的系统和方法的第一存储器1002旨在包括但不限于这些和任意其它适合类型的存储器。

而第一处理器1003可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过第一处理器1003中的硬件的集成逻辑电路或者软件形式的指令完成。上述的第一处理器1003可以是通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于第一存储器1002，第一处理器1003读取第一存储器1002中的信息，结合其硬件完成上述方法的步骤。

可以理解的是，本申请描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现，处理单元可以实现在一个或多个专用集成电路(Application Specific Integrated Circuits，ASIC)、数字信号处理器(Digital Signal Processing，DSP)、数字信号处理设备(DSP Device，DSPD)、可编程逻辑设备(Programmable Logic Device，PLD)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。对于软件实现，可通过执行本申请所述功能的模块(例如过程、函数等)来实现本申请所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。

可选地，作为另一个实施例，第一处理器1003还配置为在运行所述计算机程序时，执行前述实施例中任一项所述的方法。

本实施例提供了一种编码设备，该编码设备可以包括前述实施例中所述的编码装置90。这样，在同一张地图集中支持至少两种异构格式对应的视觉数据，然后可以利用不同的元数据解码器对这至少两种异构格式各自的辅助信息进行解码，利用一个视频解码器可以对这至少两种异构格式组成的拼接图像进行解码，从而不仅实现了对编解码标准的扩展，而且还减少了视频解码器的需求量，能够充分利用视频解码器的处理像素率，降低了硬件需求；另外，由于还能够保留来自不同异构格式的渲染特性，进而还提高了图像的合成质量。

在本申请的再一实施例中，基于前述实施例相同的发明构思，参见图11，其示出了本申请实施例提供的一种解码装置110的组成结构示意图。如图11所示，该解码装置110可以包括第二获取单元1101、元数据解码单元1102和视频解码单元1103；其中，

第二获取单元1101，配置为根据码流，获得拼接地图集信息以及待解码视频数据；

元数据解码单元1102，配置为对拼接地图集信息进行元数据解码，得到至少两种异构格式各自的辅助信息；

视频解码单元1103，配置为对待解码视频数据进行视频解码，得到拼接图像；其中，拼接图像是由至少两种异构格式对应的图像子块组成。

在一些实施例中，元数据解码单元1102，具体配置为调用至少两种元数据解码器对拼接地图集信息进行元数据解码，得到至少两种异构格式各自的辅助信息。

在一些实施例中，至少两种异构格式包括第一数据格式和第二数据格式；相应地，元数据解码单元1102，还配置为若当前解码的辅助信息为拼接地图集信息中第一数据格式的对应信息，则调用第一数据格式对应的元数据解码器进行解码，得到第一数据格式对应的辅助信息；以及若当前解码的辅助信息为拼接地图集信息中第二数据格式的对应信息，则调用第二数据格式对应的元数据解码器进行解码，得到第二数据格式对应的辅助信息。

在一些实施例中，第一数据格式为图像格式，第二数据格式为点云格式；相应地，元数据解码单元1102，还配置为若当前解码的辅助信息为拼接地图集信息中图像格式的对应信息，则调用多视点解码器进行解码，得到图像格式对应的辅助信息；以及若当前解码的辅助信息为拼接地图集信息中点云格式的对应信息，则调用点云解码器进行解码，得到点云格式对应的辅助信息。

在一些实施例中，至少两种异构格式还包括第三数据格式；相应地，元数据解码单元1102，还配置为若当前解码的辅助信息为拼接地图集信息中第三数据格式的对应信息，则调用第三数据格式对应的元数据解码器进行解码，得到第三数据格式对应的辅助信息。

在一些实施例中，视频解码单元1103，具体配置为调用视频解码器对待解码视频数据进行视频解码，得到拼接图像；其中，视频解码器的数量为一个。

在一些实施例中，参见图11，解码装置110还可以包括渲染单元1104，配置为利用至少两种异构格式各自的辅助信息对拼接图像进行渲染处理，得到目标三维图像。

在一些实施例中，第二获取单元1101，还配置为根据码流，获得语法元素标识信息的取值；以及若语法元素标识信息指示在初始概述部分不支持至少两种异构格式对应的图像子块共存于拼接图像、且在混合概述部分支持述至少两种异构格式对应的图像子块共存于拼接图像，则执行根据码流，获得拼接地图集信息以及待解码数据的步骤。

在一些实施例中，参见图11，解码装置110还可以包括第二确定单元1105，配置为若语法元素标识信息的取值在初始概述部分为第一值，则确定语法元素标识信息指示在初始概述部分不支持至少两种异构格式对应的图像子块共存于拼接图像；以及若语法元素标识信息的取值在混合概述部分为第二值，则确定语法元素标识信息指示在混合概述部分支持至少两种异构格式对应的图像子块共存于拼接图像。

在一些实施例中，第一值等于0，第二值等于1。

可以理解地，在本实施例中，“单元”可以是部分电路、部分处理器、部分程序或软件等等，当然也可以是模块，还可以是非模块化的。而且在本实施例中的各组成部分可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。

所述集成的单元如果以软件功能模块的形式实现并非作为独立的产品进行销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本实施例提供了一种计算机存储介质，该计算机存储介质存储有计算机程序，所述计算机程序被第二处理器执行时实现前述实施例中任一项所述的方法。

基于上述解码装置110的组成以及计算机存储介质，参见图12，其示出了本申请实施例提供的一种解码设备120的具体硬件结构示意图。如图12所示，该解码设备120可以包括：第二通信接口1201、第二存储器1202和第二处理器1203；各个组件通过第二总线系统1204耦合在一起。可理解，第二总线系统1204用于实现这些组件之间的连接通信。第二总线系统1204除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图12中将各种总线都标为第二总线系统1204。其中，

第二通信接口1201，用于在与其他外部网元之间进行收发信息过程中，信号的接收和发送；

第二存储器1202，用于存储能够在第二处理器1203上运行的计算机程序；

第二处理器1203，用于在运行所述计算机程序时，执行：

根据码流，获得拼接地图集信息以及待解码视频数据；

可选地，作为另一个实施例，第二处理器1203还配置为在运行所述计算机程序时，执行前述实施例中任一项所述的方法。

可以理解，第二存储器1202与第一存储器1002的硬件功能类似，第二处理器1203与第一处理器1003的硬件功能类似；这里不再详述。

本实施例提供了一种解码设备，该解码设备可以包括前述实施例中任一项所述的解码装置110。这样，在同一张地图集中支持至少两种异构格式对应的视觉数据，然后可以利用不同的元数据解码器对这至少两种异构格式各自的辅助信息进行解码，利用一个视频解码器可以对这至少两种异构格式组成的拼接图像进行解码，从而不仅实现了对编解码标准的扩展，而且还减少了视频解码器的需求量，能够充分利用视频解码器的处理像素率，降低了硬件需求；另外，由于还能够保留来自不同异构格式的渲染特性，进而还提高了图像的合成质量。

在本申请的再一实施例中，参见图13，其示出了本申请实施例提供的一种编解码系统的组成结构示意图。如图13所示，编解码系统130可以包括编码设备1301和解码设备1302。其中，编码设备1301可以为前述实施例中任一项所述的编码设备，解码设备1302可以为前述实施例中任一项所述的解码设备。

在本申请实施例中，该编解码系统130可以在同一张地图集中支持至少两种异构格式对应的视觉数据，不仅能够实现对编解码标准的扩展，而且还能够减少视频解码器的需求量，降低了硬件需求；另外，由于还能够保留来自不同异构格式的渲染特性，进而还提高了图像的合成质量。

需要说明的是，在本申请中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

本申请所提供的几个方法实施例中所揭露的方法，在不冲突的情况下可以任意组合，得到新的方法实施例。

本申请所提供的几个产品实施例中所揭露的特征，在不冲突的情况下可以任意组合，得到新的产品实施例。

本申请所提供的几个方法或设备实施例中所揭露的特征，在不冲突的情况下可以任意组合，得到新的方法实施例或设备实施例。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

工业实用性

本申请实施例中，在编码侧，获取至少两种异构格式的视觉数据对应的图像子块；对至少两种异构格式的视觉数据对应的图像子块进行拼接，得到拼接地图集信息和拼接图像；对拼接地图集信息和拼接图像进行编码，并将所得到的编码比特写入码流。在解码侧，根据码流，获得拼接地图集信息以及待解码视频数据；对拼接地图集信息进行元数据解码，得到至少两种异构格式各自的辅助信息；对待解码视频数据进行视频解码，得到拼接图像；其中，拼接图像是由至少两种异构格式对应的图像子块组成。这样，在同一张地图集中支持至少两种异构格式对应的视觉数据，然后可以利用不同的元数据解码器对这至少两种异构格式各自的辅助信息进行解码，利用一个视频解码器可以对这至少两种异构格式组成的拼接图像进行解码，从而不仅实现了对编解码标准的扩展，而且还减少了视频解码器的需求量，能够充分利用视频解码器的处理像素率，降低了硬件需求；另外，由于还能够保留来自不同异构格式的渲染特性，进而还提高了图像的合成质量。

Claims

一种解码方法，所述方法包括：

根据码流，获得拼接地图集信息以及待解码视频数据；

对所述拼接地图集信息进行元数据解码，得到至少两种异构格式各自的辅助信息；

对所述待解码视频数据进行视频解码，得到拼接图像；其中，所述拼接图像是由所述至少两种异构格式对应的图像子块组成。
根据权利要求1所述的方法，其中，所述对所述拼接地图集信息进行元数据解码，得到至少两种异构格式各自的辅助信息，包括：

调用至少两种元数据解码器对所述拼接地图集信息进行元数据解码，得到所述至少两种异构格式各自的辅助信息。
根据权利要求1所述的方法，其中，所述至少两种异构格式包括第一数据格式和第二数据格式；

所述对所述拼接地图集信息进行元数据解码，得到至少两种异构格式各自的辅助信息，包括：

若当前解码的辅助信息为所述拼接地图集信息中所述第一数据格式的对应信息，则调用所述第一数据格式对应的元数据解码器进行解码，得到所述第一数据格式对应的辅助信息；

若当前解码的辅助信息为所述拼接地图集信息中所述第二数据格式的对应信息，则调用所述第二数据格式对应的元数据解码器进行解码，得到所述第二数据格式对应的辅助信息。
根据权利要求3所述的方法，其中，所述第一数据格式为图像格式，所述第二数据格式为点云格式；

所述对所述拼接地图集信息进行元数据解码，得到至少两种异构格式各自的辅助信息，包括：

若当前解码的辅助信息为所述拼接地图集信息中所述图像格式的对应信息，则调用多视点解码器进行解码，得到所述图像格式对应的辅助信息；

若当前解码的辅助信息为所述拼接地图集信息中所述点云格式的对应信息，则调用点云解码器进行解码，得到所述点云格式对应的辅助信息。
根据权利要求3所述的方法，其中，所述至少两种异构格式还包括第三数据格式；

所述对所述拼接地图集信息进行元数据解码，得到至少两种异构格式各自的辅助信息，还包括：

若当前解码的辅助信息为所述拼接地图集信息中所述第三数据格式的对应信息，则调用所述第三数据格式对应的元数据解码器进行解码，得到所述第三数据格式对应的辅助信息。
根据权利要求1所述的方法，其中，所述对所述待解码视频数据进行视频解码，得到拼接图像，包括：

调用视频解码器对所述待解码视频数据进行视频解码，得到所述拼接图像；其中，所述视频解码器的数量为一个。
根据权利要求1所述的方法，其中，所述方法还包括：

利用所述至少两种异构格式各自的辅助信息对所述拼接图像进行渲染处理，得到目标三维图像。
根据权利要求1至7任一项所述的方法，其中，所述方法还包括：

根据码流，获得语法元素标识信息的取值；

若所述语法元素标识信息指示在初始概述部分不支持所述至少两种异构格式对应的图像子块共存于所述拼接图像、且在混合概述部分支持述至少两种异构格式对应的图像子块共存于所述拼接图像，则执行所述根据码流，获得拼接地图集信息以及待解码数据的步骤。
根据权利要求8所述的方法，其中，所述根据码流，获得语法元素标识信息的取值，包括：

若所述语法元素标识信息的取值在所述初始概述部分为第一值，则确定所述语法元素标识信息指示在初始概述部分不支持所述至少两种异构格式对应的图像子块共存于所述拼接图像；

若所述语法元素标识信息的取值在所述混合概述部分为第二值，则确定所述语法元素标识信息指示在混合概述部分支持所述至少两种异构格式对应的图像子块共存于所述拼接图像。
根据权利要求9所述的方法，其中，所述第一值等于0，所述第二值等于1。
一种编码方法，所述方法包括：

获取至少两种异构格式的视觉数据对应的图像子块；

对所述至少两种异构格式的视觉数据对应的图像子块进行拼接，得到拼接地图集信息和拼接图像；

对所述拼接地图集信息和所述拼接图像进行编码，并将所得到的编码比特写入码流。
根据权利要求11所述的方法，其中，所述拼接地图集信息是由所述至少两种异构格式的视觉数据各自的辅助信息进行拼接构成的；

所述拼接图像是由所述至少两种异构格式的视觉数据对应的图像子块进行拼接构成的。
根据权利要求12所述的方法，其中，所述对所述拼接地图集信息和所述拼接图像进行编码，包括：

调用元数据编码器对所述拼接地图集信息进行元数据编码；以及

调用视频编码器对所述拼接图像进行视频编码。
根据权利要求13所述的方法，其中，

所述视频编码器的数量为一个；

所述元数据编码器的数量为至少两种，且所述元数据编码器的数量与所述异构格式的数量具有对应关系。
根据权利要求13所述的方法，其中，所述至少两种异构格式包括第一数据格式和第二数据格式；

所述调用元数据编码器对所述拼接地图集信息进行元数据编码，包括：

若当前编码的辅助信息为所述拼接地图集信息中所述第一数据格式的对应信息，则调用所述第一数据格式对应的元数据编码器进行编码；

若当前编码的辅助信息为所述拼接地图集信息中所述第二数据格式的对应信息，则调用所述第二数据格式对应的元数据编码器进行编码。
根据权利要求15所述的方法，其中，所述第一数据格式为图像格式，所述第二数据格式为点云格式；

所述调用元数据编码器对所述拼接地图集信息进行元数据编码，包括：

若当前编码的辅助信息为所述拼接地图集信息中所述图像格式的对应信息，则调用多视点编码器进行编码；

若当前编码的辅助信息为所述拼接地图集信息中所述点云格式的对应信息，则调用点云编码器进行编码。
根据权利要求15所述的方法，其中，所述至少两种异构格式还包括第三数据格式；

所述调用元数据编码器对所述拼接地图集信息进行元数据编码，还包括：

若当前编码的辅助信息为所述拼接地图集信息中所述第三数据格式的对应信息，则调用所述第三数据格式对应的元数据编码器进行编码。
根据权利要求11至17任一项所述的方法，其中，所述方法还包括：

确定语法元素标识信息的取值；

对所述语法元素标识信息的取值进行编码，并将所得到的编码比特写入所述码流。
根据权利要求18所述的方法，其中，所述确定语法元素标识信息的取值，包括：

若所述语法元素标识信息指示在初始概述部分不支持所述至少两种异构格式对应的图像子块共存于所述拼接图像，则确定所述语法元素标识信息的取值在所述初始概述部分为第一值；

若所述语法元素标识信息指示在混合概述部分支持所述至少两种异构格式对应的图像子块共存于所述拼接图像，则确定所述语法元素标识信息的取值在所述混合概述部分为第二值。
根据权利要求19所述的方法，其中，所述第一值等于0，所述第二值等于1。
一种码流，所述码流是根据待编码信息进行比特编码生成的；其中，所述待编码信息包括下述至少之一：拼接地图集信息、拼接图像和语法元素标识信息的取值。
一种编码装置，所述编码装置包括第一获取单元、拼接单元和编码单元；其中，

所述第一获取单元，配置为获取至少两种异构格式的视觉数据对应的图像子块；

所述拼接单元，配置为对所述至少两种异构格式的视觉数据对应的图像子块进行拼接，得到拼接地图集信息和拼接图像；

所述编码单元，配置为对所述拼接地图集信息和所述拼接图像进行编码，并将所得到的编码比特写入码流。
一种编码设备，所述编码设备包括第一存储器和第一处理器；其中，

所述第一存储器，用于存储能够在所述第一处理器上运行的计算机程序；

所述第一处理器，用于在运行所述计算机程序时，执行如权利要求11至20任一项所述的方法。
一种解码装置，所述解码装置包括第二获取单元、元数据解码单元和视频解码单元；其中，

所述第二获取单元，配置为根据码流，获得拼接地图集信息以及待解码视频数据；

所述元数据解码单元，配置为对所述拼接地图集信息进行元数据解码，得到至少两种异构格式各自的辅助信息；

所述视频解码单元，配置为对所述待解码视频数据进行视频解码，得到拼接图像；其中，所述拼接图像是由所述至少两种异构格式对应的图像子块组成。
一种解码设备，所述解码设备包括第二存储器和第二处理器；其中，

所述第二存储器，用于存储能够在所述第二处理器上运行的计算机程序；

所述第二处理器，用于在运行所述计算机程序时，执行如权利要求1至10任一项所述的方法。
一种计算机可读存储介质，其中，所述计算机可读存储介质存储有计算机程序，所述计算机程序被执行时实现如权利要求1至10任一项所述的方法、或者实现如权利要求11至20任一项所述的方法。