CN113892128A

CN113892128A - 点云编解码方法和装置

Info

Publication number: CN113892128A
Application number: CN202080038882.4A
Authority: CN
Inventors: 张翔; 高文; 刘杉
Original assignee: Tencent America LLC
Current assignee: Tencent America LLC
Priority date: 2019-12-02
Filing date: 2020-10-07
Publication date: 2022-01-04
Also published as: US11223836B2; CA3136071C; KR20210135557A; JP2022526766A; EP4070280A4; JP7252372B2; US20210168386A1; AU2020397870A1; US20230090436A1; SG11202110885VA; AU2020397870B2; US20220030258A1; WO2021112953A1; US11582469B2; EP4070280A1; CA3136071A1

Abstract

一种点云解码装置，包括处理电路。处理电路从点云的已编码码流中接收点云的八叉树结构中的节点的已编码占用码。八叉树结构中的节点对应于点云的空间的3D分区。节点的大小与对应的3D分区的大小相关联。进一步地，处理电路从已编码占用码中解码出节点的占用码。至少第一节点的子节点的第一占用码的解码无需等待第二节点的第二占用码的解码，第二节点与第一节点的节点大小相同。然后，处理电路基于节点的已解码占用码，重建八叉树结构，并且基于八叉树结构重建点云。

Description

点云编解码方法和装置

引用加入

本申请要求于2020年10月5日提交的申请号为17/063,411的美国专利申请“点云编解码方法和装置(METHOD AND APPARATUS FOR POINT CLOUD CODING)”的优先权，该美国专利申请要求于2019年12月2日提交的申请号为62/942,549的美国临时专利申请“点云编解码的混合编解码次序(HYBRID CODING ORDER FOR POINT CLOUD CODING)”。所述两个在先申请的全部内容通过引用包含在本申请中。

技术领域

本申请描述了大体上涉及点云编解码的实施例。

背景技术

本文中提供的背景技术描述是为了大体上呈现本申请的上下文。在此背景技术部分描述的程度上，当前署名的发明人的工作，以及在本申请提交时可能不具有作为现有技术的资格的描述的各方面，既不明确认为也不隐含认为是本申请的现有技术。

人们开发了各种技术来捕捉世界并在三维(3D)空间中表示世界，例如，世界中的物体、世界中的环境等。世界的3D表示可以实现更身临其境的交互和交流形式。点云可以用作世界的3D表示。点云是3D空间中的一组点，每个点都有相关的属性，例如，颜色、材料属性、纹理信息、强度属性、反射率属性、运动相关属性、形态属性和各种其它属性。此类点云可能包括大量的数据，其存储和传输可能成本高昂且耗时。

发明内容

本申请的各方面提供了点云压缩和解压缩方法和装置。在一些示例中，点云压缩/解压缩装置包括处理电路。在一些实施例中，处理电路从点云的已编码码流中接收点云的八叉树结构中的节点的已编码占用码。八叉树结构中的节点对应于点云的空间的三维(3D)分区，节点的大小与对应的3D分区的大小相关联。此外，处理电路从已编码占用码中解码出节点的占用码。至少第一节点的子节点的第一占用码的解码无需等待第二节点的第二占用码的解码。第二节点与第一节点具有相同的节点大小。然后，处理电路基于节点的已解码占用码，重建八叉树结构；以及基于八叉树结构重建点云。

在一些实施例中，处理电路解码第一子八叉树中的第一组节点的第一组占用码，第一节点是第一子八叉树的根；以及解码第二子八叉树中的第二组节点的第二组占用码，第二节点是第二子八叉树的根。在一实施例中，处理电路解码第一子八叉树中的第一组节点的第一组占用代码，与解码第二子八叉树中的第二组节点的第二组占用代码是并行的。

在另一实施例中，处理电路使用第一编解码模式解码第一子八叉树中的第一组节点的第一组占用码；以及使用第二编解码模式解码第二子八叉树中的第二组节点的第二组占用码。在一示例中，处理电路从已编码码流中解码出指示第一子八叉树的第一编解码模式的第一索引；以及从已编码码流中解码出指示第二子八叉树的第二编解码模式的第二索引。

在一些实施例中，处理电路对于节点中的较大节点，使用第一编解码次序来解码占用码的第一部分。较大节点大于用于改变编解码次序的特定节点大小；以及对于节点中的较小节点，使用不同于第一编解码次序的第二编解码次序来解码占用码的第二部分。较小节点等于或小于用于改变编解码次序的特定节点大小。在一示例中，第一编解码次序为广度优先编解码次序，第二编解码次序为深度优先编解码次序。在另一示例中，第一编解码次序为深度优先编解码次序，第二编解码次序为广度优先编解码次序。

在一些示例中，处理电路基于点云的已编码码流中的信号，确定用于改变编解码次序的特定节点大小。在一示例中，处理电路从点云的已编码码流中解码出控制信号，所述控制信号指示编解码次序改变。然后，处理电路解码出信号，并确定用于改变编解码次序的特定节点大小。

本申请的各方面还提供了存储指令的非易失性计算机可读介质，所述指令在由点云编码/解码计算机执行时，使所述计算机执行所述点云编码/解码方法中的任意一种或其组合。

附图说明

结合以下详细描述和附图，本申请主题的其它特征、本质和各种优点将会变得更加清楚，其中：

图1是根据实施例的通信系统的简化框图示意图；

图2是根据实施例的流式传输系统的简化框图示意图；

图3示出了根据一些实施例的用于对点云帧进行编码的编码器框图；

图4示出了根据一些实施例的用于对与点云帧相对应的压缩码流进行解码的解码器框图；

图5是根据实施例的视频解码器的简化框图示意图；

图6是根据实施例的视频编码器的简化框图示意图；

图7示出了根据一些实施例的用于对点云帧进行编码的编码器框图；

图8示出了根据一些实施例的用于对与点云帧相对应的压缩码流进行解码的解码器的框图；

图9示出了根据本申请一些实施例的基于八叉树划分技术的立方体分割的图示。

图10示出了根据本申请一些实施例的八叉树划分和与八叉树划分相对应的八叉树结构的示例。

图11示出了说明广度优先编解码次序的八叉树结构的示图。

图12示出了说明深度优先编解码次序的八叉树结构的示图。

图13示出了根据本申请一些实施例的几何参数集的语法示例。

图14示出了根据本申请一些实施例的几何参数集的另一语法示例。

图15示出了根据本申请一些实施例的用于八叉树编解码的伪码示例。

图16示出了根据本申请一些实施例的用于深度优先编解码次序的伪码示例。

图17示出了概述根据一些实施例的方法示例的流程图。

图18是根据实施例的计算机系统的示意图。

具体实施方式

本申请的各方面提供了点云编解码(PCC)技术。可以根据各种方案来进行PCC，例如，基于几何的方案(称为G-PCC)、基于视频编解码的方案(称为V-PCC)等。根据本申请的一些方面，G-PCC直接对3D几何结构进行编码，并且是纯基于几何结构的方法，与视频编解码没有太多共享内容，而V-PCC主要基于视频编解码。例如，V-PCC可以将3D云的点映射到2D网格(图像)的像素。V-PCC方案可以利用通用视频编解码器进行点云压缩。运动图片专家组(MPEG)正在研究分别使用G-PCC方案和V-PCC方案的G-PCC标准和V-PCC标准。

本申请的各方面提供了用于可以在PCC(例如，G-PCC方案和V-PCC方案)中使用的混合编解码次序的技术。混合编码编码器可以按编解码次序包括深度优先遍历方案和广度优先遍历方案。本申请还提供了用于用信号表示编解码次序的技术。

点云可以广泛用于许多应用中。例如，点云可以用于自主驾驶车辆中进行物体检测和定位；点云可以在地理信息系统(GIS)中用于测绘，并且可以在文化遗产中用于可视化和存档文化遗产对象和收藏等。

在下文中，点云通常可以指3D空间中的一组点，每个点具有相关联的属性，例如颜色、材质、纹理信息、强度属性、反射率属性、运动相关属性、模态属性，以及各种其它属性。点云可以用于将对象或场景重建为这些点的组合。这些点可以在各种设置中使用多个相机、深度传感器或激光雷达来采集，并且可以由数千到数十亿个点组成，以便真实地表示已重建场景。面片(patch)一般可以指由点云描述的表面的邻接子集。在一个示例中，面片包括彼此的表面法线向量的偏离小于阈值量的点。

压缩技术可以减少表示点云所需的数据量，以便更快地传输或减少存储量。这样，需要用于实时通信和六自由度(6DoF)虚拟现实的点云的有损压缩的技术。另外，也在寻求用于在自主驾驶和文化遗产应用等动态映射上下文中进行无损点云压缩的技术。

根据本申请的一个方面，V-PCC背后的主要理念是利用现有的视频编解码器将动态点云的几何结构、占用情况和纹理压缩为三个单独的视频序列。解释这三个视频序列所需的额外元数据分别进行压缩。整个码流的一小部分是元数据，其可使用软件实施方案来有效地编码/解码。大部分信息由视频编解码器处理。

图1示出了根据本申请实施例的通信系统(100)的简化框图。通信系统(100)包括可以经由例如网络(150)彼此通信的多个终端装置。例如，通信系统(100)包括经由网络(150)互连的一对终端装置(110)和(120)。在图1的示例中，第一对终端装置(110)和(120)可以执行点云数据的单向传输。例如，终端装置(110)可以压缩由与终端装置(110)连接的传感器(105)采集的点云(例如，表示结构的点)。压缩的点云可以经由网络(150)，例如以码流的形式发送到另一终端装置(120)。终端装置(120)可以从网络(150)接收压缩的点云，对码流进行解压以重建点云，并且适当地显示已重建点云。单向数据传输在媒体服务应用等中可为常见的。

在图1的示例中，终端装置(110)和终端装置(120)可能图示为服务器和个人计算机，但是本申请的原理可以不限于此。本申请实施例适用于膝上型计算机、平板计算机、智能电话、游戏终端、媒体播放器和/或专用三维(3D)装置。网络(150)表示能够在终端装置(110)和终端装置(120)之间传输压缩点云的任意数量的网络。网络(150)可以包括例如有线和/或无线通信网络。网络(150)可以在电路交换和/或分组交换信道中交换数据。代表性网络包括电信网络、局域网、广域网和/或因特网。出于本申请讨论的目的，网络(150)的架构和拓扑对于本申请的操作可能并不重要，除非在下文另有解释。

图2图示了根据实施例的流式传输系统(200)的简化框图。图2的示例是将本申请所公开主题用于点云的应用。本申请所公开主题同样适用于其它用点云实现的应用，例如，3D远地视在应用、虚拟现实应用等等。

流式传输系统(200)可以包括采集子系统(213)。采集子系统(213)可以包括点云源(201)，例如光检测和测距(LIDAR)系统、3D照相机、3D扫描仪、以软件形式生成未压缩点云的图形生成部件等生成例如未压缩点云(202)的部件。在一示例中，点云(202)包括由3D照相机采集的点。点云(202)描绘为粗线，以强调与压缩点云(204)(压缩点云的码流)相比，其具有较高的数据量。压缩点云(204)可以由电子装置(220)生成，电子装置(220)包括耦合到点云源(201)的编码器(203)。编码器(203)可以包括硬件、软件或其组合，以实现或实施以下更详细描述的本申请所公开主题的各方面。压缩点云(204)(或压缩点云的码流(204))描绘为细线，以强调与点云流(202)相比，其具有较低的数据量，其可以存储在流式传输服务器(205)上以供将来使用。一个或多个流式传输客户端子系统，如图2中的客户端子系统(206)和客户端子系统(208)，可以访问流式传输服务器(205)，以检索压缩点云(204)的副本(207)和副本(209)。客户端子系统(206)可以包括例如在电子装置(230)中的解码器(210)。解码器(210)对压缩点云的传入副本(207)进行解码，并产生可在呈现装置(212)上呈现的已重建点云的输出流(211)。

请注意，电子装置(220)和(230)可以包括其它组件(未示)。例如，电子装置(220)可以包括解码器(未示)，电子装置(230)也可以包括编码器(未示)。

在一些流式传输系统中，压缩点云(204)、压缩点云(207)和压缩点云(209)(例如，压缩点云的码流)可以根据特定的标准来压缩。在一些示例中，视频编解码标准用于点云的压缩。这些标准的示例包括高效视频编码(HEVC)、通用视频编码(VVC)等等。

图3示出了根据一些实施例的用于编码点云帧的V-PCC编码器(300)的框图。在一些实施例中，V-PCC编码器(300)可以用于通信系统(100)和流式传输系统(200)中使用。例如，可以以与V-PCC编码器(300)类似的方式来配置和操作编码器(203)。

V-PCC编码器(300)接收点云帧作为未压缩输入，并生成与压缩点云帧相对应的码流。在一些实施例中，V-PCC编码器(300)可以从诸如点云源(201)等点云源接收点云帧。

在图3的示例中，V-PCC编码器(300)包括面片生成模块(306)、面片打包模块(308)、几何图像生成模块(310)、纹理图像生成模块(312)、面片信息模块(304)、占用地图模块(314)、平滑模块(336)、图像填充模块(316)和(318)、组膨胀模块(320)、视频压缩模块(322)、(323)和(332)、辅助面片信息压缩模块(338)、熵压缩模块(334)和复用器(324)。

根据本申请的一个方面，V-PCC编码器(300)将3D点云帧连同用于将压缩点云转换回解压缩点云的一些元数据(例如，占用地图和面片信息)一起转换为基于图像的表示。在一些示例中，V-PCC编码器(300)可以将3D点云帧转换为几何图像、纹理图像和占用地图，然后使用视频编码技术将几何图像、纹理图像和占用地图编码为码流。通常，几何图像是其像素填充有与投影到像素的点相关联的几何值的2D图像，填充有几何值的像素可以称为几何样本。纹理图像是其像素填充有与投影到像素的点相关联的纹理值的2D图像，填充有纹理值的像素可以被称为纹理样本。占用地图是其像素填充有指示由面片占用或未由面片占用的值的2D图像。

面片生成模块(306)将点云分割成一组面片(例如，面片被定义为由点云描述的表面的邻接子集)，该组面片可以重叠或不重叠，使得每个面片可以由相对于2D空间中的平面的深度场来描述。在一些实施例中，面片生成模块(306)旨在将点云分解为具有光滑边界的最小数量的面片，同时还使重建误差最小化。

面片信息模块(304)可以收集指示面片的大小和形状的面片信息。在一些示例中，可以将面片信息打包到图像帧中，然后由辅助面片信息压缩模块(338)编码，以生成压缩的辅助面片信息。

面片打包模块(308)被配置为将提取的面片映射到2维(2D)网格上，同时使未使用的空间最小化并保证网格的每个M×M(例如，16×16)的块与唯一的面片相关联。有效的面片打包可以通过使未使用的空间最小化或确保时间一致性来直接影响压缩效率。

几何图像生成模块(310)可以生成与在给定面片位置处的点云的几何结构相关联的2D几何图像。纹理图像生成模块(312)可以生成与点云在给定面片位置处的纹理相关联的2D纹理图像。几何图像生成模块(310)和纹理图像生成模块(312)利用在打包过程期间计算的3D到2D映射，将点云的几何结构和纹理存储为图像。为了更好地处理多个点被投影到同一样本上的情况，将每个面片投影到两个图像上，称为层。在一个示例中，几何图像由YUV420-8比特格式的W×H的单色帧表示。为了生成纹理图像，纹理生成步骤利用已重建/平滑过的几何结构，以便计算要与重新采样点相关联的颜色。

占用地图模块(314)可以生成描述每个单元处的填充信息的占用地图。例如，占用图像包括二进制地图，该二进制地图针对网格的每个单元格，指示该单元格属于空白空间还是属于点云。在一个示例中，占用地图对每个像素使用二进制信息描述，描述该像素是否被填充。在另一示例中，占用地图对每个像素块使用二进制信息描述，描述该像素块是否被填充。

占用地图模块(314)生成的占用地图可以使用无损编码或有损编码来压缩。当使用无损编码时，使用熵压缩模块(334)来压缩占用地图。当使用有损编码时，使用视频压缩模块(332)来压缩占用地图。

请注意，面片打包模块(308)可以在打包在图像帧中的2D面片之间留下一些空白空间。图像填充模块(316)和(318)可以填充空白空间(称为填充)，以生成可以适用于2D视频和图像编解码器的图像帧。图像填充也称为背景填充，其可以用冗余信息来填充未使用的空间。在一些示例中，良好的背景填充会最低限度地增加比特率，而不会在面片边界周围引入显著的编码失真。

视频压缩模块(322)、(323)和(332)可以基于适当的视频编码标准，例如，HEVC、VVC等，对2D图像，例如填充过的几何图像、填充过的纹理图像和占用地图进行编码。在一个示例中，视频压缩模块(322)、(323)和(332)是分开操作的单独组件。请注意，在另一示例中，视频压缩模块(322)、(323)和(332)可以实现为单个组件。

在一些示例中，平滑模块(336)被配置为生成已重建几何图像的平滑图像。可以将平滑图像提供给纹理图像生成(312)。然后，纹理图像生成(312)可以基于已重建几何图像来调整纹理图像的生成。例如，当面片形状(例如，几何结构)在编码和解码期间有轻微失真时，可以在生成纹理图像时考虑失真以校正面片形状的失真。

在一些实施例中，分组扩张(group dilation)(320)被配置为用冗余低频内容填充对象边界周围的像素，以便提高编解码增益以及已重建点云的视觉质量。

复用器(324)可以将压缩的几何图像、压缩的纹理图像、压缩的占用地图、压缩的辅助面片信息，多路复用到压缩的码流中。

图4示出了根据一些实施例的用于解码与点云帧相对应的压缩码流的V-PCC解码器(400)的框图。在一些实施例中，V-PCC解码器(400)可以在通信系统(100)和流式传输系统(200)中使用。例如，解码器(210)可以被配置为以与V-PCC解码器(400)类似的方式操作。V-PCC解码器(400)接收压缩码流，并基于压缩码流生成已重建点云。

在图4的示例中，V-PCC解码器(400)包括解复用器(432)、视频解压缩模块(434)和(436)、占用地图解压缩模块(438)、辅助面片信息解压缩模块(442)、几何重建模块(444)、平滑模块(446)、纹理重建模块(448)以及颜色平滑模块(452)。

解复用器(432)可以接收压缩码流，并将其分离成压缩的纹理图像、压缩的几何图像、压缩的占用地图和压缩的辅助面片信息。

视频解压缩模块(434)和(436)可以根据适当的标准(例如，HEVC、VVC等)，对压缩的图像进行解码，并输出解压缩的图像。例如，视频解压缩模块(434)对压缩的纹理图像进行解码，并输出解压缩的纹理图像；视频解压缩模块(436)对压缩的几何图像进行解码，并输出解压缩的几何图像。

占用地图解压缩模块(438)可以根据适当的标准(例如，HEVC、VVC等)对压缩的占用地图进行解码，并输出解压缩的占用地图。

辅助面片-信息解压缩模块(442)可以根据适当的标准(例如，HEVC、VVC等)对压缩的辅助面片信息进行解码，并输出解压缩的辅助面片信息。

几何重建模块(444)可以接收解压缩的几何图像，并基于解压缩的占用地图和解压缩的辅助面片信息，生成重建的点云几何结构。

平滑模块(446)可以对面片边缘处的不一致进行平滑。平滑过程旨在减轻可能由于压缩伪影而可能在面片边界处出现的不连续性。在一些实施例中，可以将平滑滤波器应用于位于面片边界上的像素，以减轻可能由压缩/解压缩引起的失真。

纹理重建模块(448)能够基于解压缩的纹理图像和平滑后的几何结构来确定点云中的点的纹理信息。

颜色平滑模块(452)可以对着色的不一致进行平滑。3D空间中的非相邻面片通常在2D视频中被打包成彼此相邻。在一些示例中，来自非相邻面片的像素值可以由基于块的视频编解码器进行混合。颜色平滑的目标是减少出现在面片边界处的可见伪影。

图5示出了根据本申请实施例的视频解码器(510)的框图。视频解码器(510)可以用于V-PCC解码器(400)中。例如，视频解压缩模块(434)和(436)、占用地图解压缩模块(438)可以与视频解码器(510)以类似的方式配置。

视频解码器(510)可包括解析器(520)，以根据诸如已编码视频序列的压缩图像重建符号(521)。这些符号的类别包括用于管理视频解码器(510)的操作的信息。解析器(520)可对接收到的已编码视频序列进行解析/熵解码。已编码视频序列的编码可根据视频编码技术或标准进行，且可遵循各种原理，包括可变长度编码、霍夫曼编码(Huffman coding)、具有或不具有上下文灵敏度的算术编码等等。解析器(520)可基于对应于群组的至少一个参数，从已编码视频序列中提取用于视频解码器中的像素的子群中的至少一个子群的子群参数集。子群可包括图片群组(Group of Pictures，GOP)、图片、图块(tile)、条带(slice)、宏块、编码单元(Coding Unit，CU)、块、变换单元(Transform Unit，TU)、预测单元(Prediction Unit，PU)等等。解析器(520)还可从已编码视频序列提取信息，例如，变换系数、量化器参数值、运动矢量等等。

解析器(520)可对从缓冲存储器接收的视频序列执行熵解码/解析操作，从而创建符号(521)。

取决于已编码视频图片或已编码视频图片部分的类型(例如：帧间图片和帧内图片、帧间块和帧内块)以及其它因素，符号(521)的重建可涉及多个不同单元。涉及哪些单元以及涉及方式可由解析器(520)从已编码视频序列解析的子群控制信息控制。为了简洁起见，未描述解析器(520)与下文的多个单元之间的此类子群控制信息流。

除已经提及的功能块以外，视频解码器(510)可在概念上细分成如下文所描述的数个功能单元。在商业约束下运行的实际实施例中，这些单元中的许多单元彼此紧密交互并且至少可以部分彼此集成。然而，出于描述所公开主题的目的，概念上细分成下文的功能单元是适当的。

第一单元是缩放器/逆变换单元(551)。缩放器/逆变换单元(551)从解析器(520)接收作为符号(521)的量化变换系数以及控制信息，包括使用哪种变换方式、块大小、量化因子、量化缩放矩阵等。缩放器/逆变换单元(551)可输出包括样本值的块，所述样本值可输入到聚合器(555)中。

在一些情况下，缩放器/逆变换单元(551)的输出样本可属于帧内编码块；即：不使用来自先前已重建图片的预测性信息、但可使用来自当前图片的先前已重建部分的预测性信息的块。此类预测性信息可由帧内图片预测单元(552)提供。在一些情况下，帧内图片预测单元(552)采用从当前图片缓冲器(558)提取的周围已重建信息，生成大小和形状与正在重建的块相同的块。举例来说，当前图片缓冲器(558)缓冲部分已重建当前图片和/或完全已重建当前图片。在一些情况下，聚合器(555)基于每个样本，将帧内预测单元(552)生成的预测信息添加到由缩放器/逆变换单元(551)提供的输出样本信息中。

在其它情况下，缩放器/逆变换单元(551)的输出样本可属于帧间编码和潜在运动补偿块。在此情况下，运动补偿预测单元(553)可访问参考图片存储器(557)以提取用于预测的样本。在根据属于所述块的符号(521)对提取的样本进行运动补偿之后，这些样本可由聚合器(555)添加到缩放器/逆变换单元(551)的输出(在这种情况下被称作残差样本或残差信号)，从而生成输出样本信息。运动补偿预测单元(553)从参考图片存储器(557)内的地址获取预测样本可受到运动矢量控制，且所述运动矢量以所述符号(521)的形式而供运动补偿预测单元(553)使用，所述符号(521)例如是包括X、Y和参考图片分量。运动补偿还可包括在使用子样本精确运动矢量时，从参考图片存储器(557)提取的样本值的插值、运动矢量预测机制等等。

聚合器(555)的输出样本可在环路滤波器单元(556)中被各种环路滤波技术采用。视频压缩技术可包括环路内滤波器技术，所述环路内滤波器技术受控于包括在已编码视频序列(也称作已编码视频码流)中的参数，且所述参数作为来自解析器(520)的符号(521)可用于环路滤波器单元(556)，但是还可响应于在解码已编码图片或已编码视频序列的先前(按解码次序)部分期间获得的元信息，以及响应于先前已重建且经过环路滤波的样本值。

环路滤波器单元(556)的输出可以是样本流，所述样本流可输出到显示装置以及存储在参考图片存储器(557)中，以用于后续的帧间图片预测。

一旦完全重建，某些已编码图片就可用作参考图片以用于将来预测。举例来说，一旦对应于当前图片的已编码图片被完全重建，且已编码图片(通过例如解析器(520))被识别为参考图片，则当前图片缓冲器(558)可变为参考图片存储器(557)的一部分，且可在开始重建后续已编码图片之前重新分配新的当前图片缓冲器。

视频解码器(510)可根据例如ITU-T H.265建议书等标准中的预定视频压缩技术执行解码操作。在已编码视频序列遵循视频压缩技术或标准的语法以及视频压缩技术或标准中记录的配置文件的意义上，已编码视频序列可符合所使用的视频压缩技术或标准指定的语法。具体地说，配置文件可从视频压缩技术或标准中可用的所有工具中选择某些工具作为在所述配置文件下可供使用的仅有工具。对于合规性，还要求已编码视频序列的复杂度处于视频压缩技术或标准的层级所限定的范围内。在一些情况下，层级限制最大图片大小、最大帧率、最大重建取样率(以例如每秒兆(mega)个样本为单位进行测量)、最大参考图片大小等。在一些情况下，由层级设定的限制可通过假想参考解码器(HypotheticalReference Decoder，HRD)规范和在已编码视频序列中用信号表示的HRD缓冲器管理的元数据来进一步限定。

图6示出了根据本申请实施例的视频编码器(603)的框图。视频编码器(603)能够用于在V-PCC编码器(300)中压缩点云。在一个示例中，视频压缩模块(322)和(323)以及视频压缩模块(332)与编码器(603)以类似的方式配置。

视频编码器(603)可以接收图像，例如填充的几何图像、填充的纹理图像等，并且生成压缩图像。

根据实施例，视频编码器(603)可实时或在由应用所要求的任何其它时间约束下，将源视频序列的图片(图像)编码且压缩成已编码视频序列(压缩图像)。施行适当的编码速度是控制器(650)的一个功能。在一些实施例中，控制器(650)控制如下文所描述的其它功能单元且在功能上耦接到这些单元。为了简洁起见，图中未标示耦接。由控制器(650)设置的参数可包括速率控制相关参数(图片跳过、量化器、率失真优化技术的λ值等)、图片大小、图片群组(group of pictures，GOP)布局，最大运动矢量搜索范围等。控制器(650)可用于具有其它合适的功能，这些功能涉及针对某一系统设计优化的视频编码器(603)。

在一些实施例中，视频编码器(603)在编码环路中运作。作为简单的描述，在一个示例中，编码环路可包括源编码器(630)(例如，负责基于待编码的输入图片和参考图片创建符号，例如，符号流)和嵌入于视频编码器(603)中的(本地)解码器(633)。解码器(633)以类似于(远程)解码器创建样本数据的方式重建符号，以创建样本数据(因为在本申请所公开的主题所考虑的视频压缩技术中，符号与已编码视频码流之间的任何压缩是无损的)。将已重建样本流(样本数据)输入到参考图片存储器(634)。由于符号流的解码产生与解码器位置(本地或远程)无关的位精确结果，因此参考图片存储器(634)中的内容在本地编码器与远程编码器之间也是按比特位精确对应的。换句话说，编码器的预测部分“看到”的参考图片样本与解码器将在解码期间使用预测时所“看到”的样本值完全相同。这种参考图片同步性基本原理(以及在例如因信道误差而无法维持同步性的情况下产生的漂移)也用于一些相关技术。

“本地”解码器(633)的操作可与例如已在上文结合图5详细描述视频解码器(510)的“远程”解码器相同。然而，另外简要参考图5，当符号可用且熵编码器(645)和解析器(520)能够无损地将符号编码/解码到已编解码视频序列时，包括解析器(520)在内的视频解码器(510)的熵解码部分，可能不完全在本地解码器(633)中实施。

此时可以观察到，除存在于解码器中的解析/熵解码之外的任何解码器技术，也必定以基本上相同的功能形式存在于对应的编码器中。出于此原因，本申请侧重于解码器操作。可简化编码器技术的描述，因为编码器技术与全面地描述的解码器技术互逆。仅在某些区域中需要更详细的描述，并且在下文提供。

在操作期间，在一些示例中，源编码器(630)可执行运动补偿预测编码，参考来自视频序列中被指定为“参考图片”的一个或多个先前已编码图片，对输入图片进行预测性编码。以此方式，编码引擎(632)对输入图片的像素块与参考图片的像素块之间的差值进行编码，所述参考图片可被选作所述输入图片的预测参考。

本地视频解码器(633)可基于源编码器(630)创建的符号，对可指定为参考图片的图片的已编码视频数据进行解码。编码引擎(632)的操作可为有损过程。当已编码视频数据可在视频解码器(图6中未示)处解码时，已重建视频序列通常可以是带有一些误差的源视频序列的副本。本地视频解码器(633)复制解码过程，所述解码过程可由视频解码器对参考图片执行，且可使已重建参考图片存储在参考图片高速缓存(634)中。以此方式，视频编码器(603)可在本地存储已重建参考图片的副本，所述副本与将由远端视频解码器获得的已重建参考图片具有共同内容(不存在传输误差)。

预测器(635)可针对编码引擎(632)执行预测搜索。即，对于将要编码的新图片，预测器(635)可在参考图片存储器(634)中搜索可作为所述新图片的适当预测参考的样本数据(作为候选参考像素块)或某些元数据，例如，参考图片运动矢量、块形状等。预测器(635)可基于样本块逐像素块操作，以找到合适的预测参考。在一些情况下，根据预测器(635)获得的搜索结果，可确定输入图片可具有从参考图片存储器(634)中存储的多个参考图片取得的预测参考。

控制器(650)可管理源编码器(630)的编码操作，包括例如设置用于对视频数据进行编码的参数和子群参数。

可在熵编码器(645)中对所有上述功能单元的输出进行熵编码。熵编码器(645)根据例如霍夫曼编码、可变长度编码、算术编码等技术对各种功能单元生成的符号进行无损压缩，从而将所述符号转换成已编码视频序列。

控制器(650)可管理视频编码器(603)的操作。在编码期间，控制器(650)可以为每个已编码图片分配某一已编码图片类型，这可能影响可应用于相应的图片的编码技术。例如，通常可将图片分配为以下任一种图片类型：

帧内图片(I图片)，其可以是不将序列中的任何其它图片用作预测源就可被编码和解码的图片。一些视频编解码器容许不同类型的帧内图片，包括例如独立解码器刷新(Independent Decoder Refresh，“IDR”)图片。所属领域的技术人员了解I图片的变体及其相应的应用和特征。

预测性图片(P图片)，其可以是可使用帧内预测或帧间预测进行编码和解码的图片，所述帧内预测或帧间预测使用至多一个运动矢量和参考索引来预测每个块的样本值。

双向预测性图片(B图片)，其可以是可使用帧内预测或帧间预测进行编码和解码的图片，所述帧内预测或帧间预测使用至多两个运动矢量和参考索引来预测每个块的样本值。类似地，多个预测性图片可使用多于两个参考图片和相关联元数据以用于重建单个块。

源图片通常可在空间上细分成多个样本块(例如，每个具有4×4、8×8、4×8或16×16个样本的块)，且逐块进行编码。这些块可参考其它(已编码)块进行预测编码，根据应用于块的相应图片的编码分配来确定所述其它块。举例来说，I图片的块可进行非预测编码，或所述块可参考同一图片的已经编码的块来进行预测编码(空间预测或帧内预测)。P图片的像素块可参考一个先前编码的参考图片通过空间预测或通过时域预测进行预测编码。B图片的块可参考一个或两个先前编码的参考图片通过空间预测或通过时域预测进行预测编码。

视频编码器(603)可根据例如ITU-T H.265建议书的预定视频编码技术或标准执行编码操作。在操作中，视频编码器(603)可执行各种压缩操作，包括利用输入视频序列中的时间和空间冗余的预测编码操作。因此，已编码视频数据可符合所用视频编码技术或标准指定的语法。

视频可呈时间序列的多个源图片(图像)的形式。帧内图片预测(常常简化为帧内预测)利用给定图片中的空间相关性，而帧间图片预测则利用图片之间的(时间或其它)相关性。在实施例中，将正在编码/解码的特定图片分割成块，正在编码/解码的特定图片被称作当前图片。在当前图片中的块类似于视频中先前已编码且仍被缓冲的参考图片中的参考块时，可通过称作运动矢量的矢量对当前图片中的块进行编码。所述运动矢量指向参考图片中的参考块，且在使用多个参考图片的情况下，所述运动矢量可具有识别参考图片的第三维度。

在一些实施例中，双向预测技术可用于帧间图片预测中。根据双向预测技术，使用两个参考图片，例如，按解码次序都在视频中的当前图片之前(但按显示次序可能分别是过去和将来)第一参考图片和第二参考图片。可通过指向第一参考图片中的第一参考块的第一运动矢量和指向第二参考图片中的第二参考块的第二运动矢量对当前图片中的块进行编码。可通过第一参考块和第二参考块的组合来预测所述块。

此外，合并模式技术可用于帧间图片预测中以改善编码效率。

根据本申请公开的一些实施例，帧间图片预测和帧内图片预测等预测的执行以块为单位。举例来说，根据HEVC标准，将视频图片序列中的图片分割成编码树单元(codingtree unit，CTU)以用于压缩，图片中的CTU具有相同大小，例如，64×64像素、32×32像素或16×16像素。一般来说，CTU包括三个编码树块(coding tree block，CTB)，所述三个编码树块是一个亮度CTB和两个色度CTB。更进一步的，还可将每个CTU以四叉树拆分为一个或多个编码单元(coding unit，CU)。举例来说，可将64×64像素的CTU拆分为一个64×64像素的CU，或4个32×32像素的CU，或16个16×16像素的CU。在实施例中，分析每个CU以确定用于CU的预测类型，例如，帧间预测类型或帧内预测类型。此外，取决于时间和/或空间可预测性，将CU拆分为一个或多个预测单元(prediction unit，PU)。通常，每个PU包括亮度预测块(prediction block，PB)和两个色度PB。在实施例中，编码(编码/解码)中的预测操作以预测块为单位来执行。以亮度预测块作为预测块为例，预测块包括像素值(例如，亮度值)的矩阵，例如，8×8像素、16×16像素、8×16像素、16×8像素等等。

图7示出了根据实施例的G-PPC编码器(700)的框图。编码器(700)可以被配置为接收点云数据并压缩点云数据，以生成携带压缩点云数据的码流。在实施例中，编码器(700)可以包括位置量化模块(710)、重复点去除模块(712)、八叉树编码模块(730)、属性传递模块(720)、细节层次(LOD)生成模块(740)、属性预测模块(750)、残差量化模块(760)、算术编码模块(770)、逆残差量化模块(780)、加法模块(781)以及用于存储已重建属性值的存储器(790)。

如图7所示，可以在编码器(700)处接收输入点云(701)。将点云(701)的位置(例如，3D坐标)提供给量化模块(710)。量化模块(710)被配置为对所述坐标进行量化，以生成量化的位置。重复点去除模块(712)被配置为接收量化的位置并执行滤波过程，以标识和去除重复点。八叉树编码模块(730)被配置为从重复点去除模块(712)接收经滤波的位置，并且执行基于八叉树的编码过程，以生成用于描述体素的3D网格的占用码序列。占用码提供给算术编码模块(770)。

属性传递模块(720)被配置为接收输入点云的属性，并且当多个属性值与各个体素相关联时，执行属性传递过程以确定每个体素的属性值。可以对从八叉树编码模块(730)输出的重新排序后的点执行属性传递过程。将传递操作之后的属性提供给属性预测模块(750)。LOD生成模块(740)被配置为对八叉树编码模块(730)输出的重新排序后的点进行操作，并将这些点重新组织成不同的LOD。将LOD信息提供给属性预测模块(750)。

属性预测模块(750)根据来自LOD生成模块(740)的LOD信息所指示的基于LOD的顺序，处理这些点。属性预测模块(750)基于存储在存储器(790)中的当前点的一组相邻点的已重建属性，生成当前点的属性预测值。随后可以基于从属性传递模块(720)接收的原始属性值和本地生成的属性预测值，获得预测残差。当在各个属性预测过程中使用候选索引时，可以将与所选择的预测候选对应的索引提供给算术编码模块(770)。

残差量化模块(760)被配置为从属性预测模块(750)接收预测残差，并执行量化以生成量化残差。量化残差提供给算术编码模块(770)。

逆残差量化模块(780)被配置为从残差量化模块(760)接收量化残差，并且通过在残差量化模块(760)处执行的量化操作的逆操作来生成已重建预测残差。加法模块(781)被配置为从逆残差量化模块(780)接收已重建预测残差，并从属性预测模块(750)接收各个属性预测值。通过组合已重建预测残差和属性预测值，生成已重建属性值，并将其存储到存储器(790)。

算术编码模块(770)被配置为接收占用码、候选索引(如果使用)、量化残差(如果生成)和其它信息，并且执行熵编码，以进一步压缩接收到的值或信息。结果，可以生成携带压缩信息的压缩的码流(702)。码流(702)可以被传输或以其它方式提供给对压缩的码流进行解码的解码器，或者可以存储在存储装置中。

图8示出了根据实施例的G-PCC解码器(800)的框图。解码器(800)可被配置为接收压缩的码流，并执行点云数据解压缩以解压缩该码流来生成已解码点云数据。在实施例中，解码器(800)可以包括算术解码模块(810)、逆残差量化模块(820)、八叉树解码模块(830)、LOD生成模块(840)、属性预测模块(850)和用于存储已重建属性值的存储器(860)。

如图8所示，可以在算术解码模块(810)处接收压缩的码流(801)。算术解码模块(810)被配置为对压缩的码流(801)进行解码，以获得点云的量化残差(如果生成)和占用码。八叉树解码模块(830)被配置为根据占用码确定点云中的点的已重建位置。LOD生成模块(840)被配置为基于已重建位置将点重新组织成不同的LOD，并确定基于LOD的顺序。逆残差量化模块(820)被配置为基于从算术解码模块(810)接收的量化残差来生成已重建残差。

属性预测模块(850)被配置为执行属性预测过程，以根据基于LOD的顺序确定点的属性预测。例如，可以基于存储在存储器(860)中的当前点的相邻点的已重建属性值来确定当前点的属性预测。属性预测模块(850)可将属性预测与各个已重建残差相组合以生成当前点的已重建属性。

在一个示例中，从属性预测模块(850)生成的已重建属性序列与从八叉树解码模块(830)生成的已重建位置一起，对应于从解码器(800)输出的已解码点云(802)。另外，已重建属性也存储到存储器(860)中，并且随后可以用于导出后续点的属性预测。

在各种实施例中，编码器(300)、解码器(400)、编码器(700)和/或解码器(800)可以用硬件、软件或其组合来实现。例如，编码器(300)、解码器(400)、编码器(700)和/或解码器(800)可以用诸如一个或多个集成电路(IC)的处理电路来实现，处理电路在使用或不使用诸如专用集成电路(ASIC)、现场可编程门阵列(FPGA)等软件的情况下操作。在另一示例中，编码器(300)、解码器(400)、编码器(700)和/或解码器(800)可以实现为软件或固件，包括存储在非挥发性(或非易失性)计算机可读存储介质中的指令。这些指令在由诸如一个或多个处理器执行处理电路时，使处理电路执行编码器(300)、解码器(400)、编码器(700)和/或解码器(800)的功能。

请注意，被配置为实施本文中所揭示的属性预测技术的属性预测模块(750)或(850)可以被包括在其他与图7和图8中所示的结构类似或不同的解码器或编码器中。另外，编码器(700)和解码器(800)可以被包括在同一装置中，或者在各种示例中被包括在单独的装置中。

根据本申请的一些方面，可以在PCC中使用几何八叉树结构。在一些相关示例中，几何八叉树结构是按广度优先次序遍历的。按照广度优先次序，当前层级的八叉树节点可以在上一层级的八叉树节点被访问后进行访问。根据本申请的一个方面，广度优先次序方案不适合并行处理，因为当前层级必须等待上一层级的编解码。本申请提供了在用于几何八叉树结构的编解码次序技术中增加深度优先编解码次序的技术。在一些实施例中，深度优先编解码次序可以与广度优先次序组合，或在一些实施例中可以单独使用。编解码次序(例如深度优先编解码次序、深度优先编解码次序和广度优先编解码次序的组合等)在本申请中可以称为PCC的混合编解码次序。

所提出的方法可以单独使用或以任何顺序组合使用。此外，方法(或实施例)、编码器和解码器中的每一者可由处理电路(例如，一个或多个处理器或一个或多个集成电路)实施。在一个示例中，一个或多个处理器执行存储在非易失性计算机可读介质中的程序。

根据本申请的一些方面，可以(例如，在测试模型13(TMC13)模型中)单独地压缩点云的几何信息和相关联的属性，诸如颜色、反射率等。点云的几何信息，包括点云中点的3D坐标，可以由具有分区占用信息的八叉树划分进行编码。可以使用例如预测、提升和区域自适应分级变换技术基于已重建几何结构来压缩属性。

根据本申请的一些方面，可以使用八叉树划分来划分三维空间。八叉树是二维空间中四叉树的三维模拟。八叉树划分技术是指将三维空间递归细分为八个八分体(octant)的划分技术，八叉树结构是指表示这些分区的树结构。在一个示例中，八叉树结构中的每个节点对应于三维空间，并且该节点可以是端节点(不再划分，在一些示例中也称为叶节点)或具有进一步划分的节点。节点处的划分可将节点所表示的三维空间划分成八个八分体。在一些示例中，对应于特定节点的分区的节点可以称为该特定节点的子节点。

图9示出了根据本申请一些实施例的基于八叉树划分技术的3D立方体(900)(对应于节点)的划分图示。该划分可以将3D立方体(900)分割成8个更小的大小相等的立方体0-7，如图9所示。

八叉树划分技术(例如，在TMC13中)可以递归地将原始3D空间分割成较小的单元，并且可以对每个子空间的占用信息进行编码以表示几何位置。

在一些实施例中(例如，在TMC13中)，使用八叉树几何编解码器。八叉树几何编解码器可以进行几何编码。在一些示例中，在立方体框上执行几何编码。例如，立方体框可以是由两点(0，0，0)和(2^M-1，2^M-1，2^M-1)定义的轴对准的边界框B，其中，2^M-1定义了边界框B的尺寸，M可以在码流中指定。

然后，通过对立方体框进行递归细分来构建八叉树结构。例如，将由两个点(0，0，0)和(2^M-1，2^M-1，2^M-1)定义的立方体框划分为8个子立方框，生成8位代码，称为占用码。占用码中的每个比特位都与子立方体框相关联，比特位的值用于指示相关联的子立方体框是否包含点云的任意点。例如，一个比特位的值1表示与该比特位相关联的子立方体框包含点云的一个或多个点；一个比特位的值0表示与该比特位相关联的子立方体框不包含点云的点。

此外，对于空的子立方体框(例如，与子立方体框相关联的比特位的值为0)，不再对该子立方体框进行分割。当子立方体框具有点云的一个或多个点时(例如，与子立方体框相关联的比特位的值为1)，将子立方体框进一步划分为8个更小的子立方体框，可以为子立方体框生成占用码，以指示更小的子立方体框的占用。在一些示例中，细分操作可以在非空的子立方体框上重复执行，直到子立方体框的尺寸等于预定阈值，例如尺寸为1。在一些示例中，尺寸为1的子立方体框称为体素，尺寸大于体素的子立方体框可以称为非-体素。

图10示出了根据本申请一些实施例的八叉树划分(1010)和与八叉树划分(1010)相对应的八叉树结构(1020)的示例。图10示出了八叉树划分(1010)中的两级划分。八叉树结构(1020)包括与八叉树划分(1010)的立方体框对应的节点(N0)。在第一层级，根据图9所示的编号技术，将立方体框划分成编号为0至7的8个子立方体框。节点N0的划分的占用码为二进制的“10000001”，其表示节点N0-0表示的第一个子立方体框和节点N0-7表示的第八个子立方体框包括点云中的点，其它子立方体框为空。

然后，在第二层级划分中，将第一子立方体框(由节点N0-0表示)和第八子立方体框(由节点N0-7表示)进一步分别细分为八个八分体。例如，根据图9所示的编号技术，将第一子立方体框(由节点N0-0表示)划分成编号为0至7的8个更小的子立方体框。节点N0-0的划分的占用码为二进制“00011000”，其表示第四个更小的子立方体框(由节点N0-0-3表示)和第五个更小的子立方体框(由节点N0-0-4表示)包括点云中的点，其它更小的子立方体框为空。在第二级，第七子立方体框(由节点N0-7表示)以类似的方式分割成8个更小的子立方体框，如图10所示。

在图10的示例中，与非空立方体空间的节点(例如，立方体框、子立方体框、更小的子立方体框等等)对应的节点着色为灰色，称为阴影节点。

根据本申请的一些方面，可以使用适当的编码技术来适当地压缩占用码。在一些实施例中，使用算术编码器来压缩八叉树结构中的当前节点的占用码。该占用码可以表示为一个8位的整数S，S中的每个比特位指示当前节点的子节点的占用状态。在一个实施例中，使用逐位编码对占用码进行编码。在另一实施例中，使用逐字节编码对占用码进行编码。在一些示例(例如，TMC13)中，默认启用逐位编码。逐位编码和逐字节编码都可以执行带有上下文建模的算术编码，以对占用码进行编码。上下文状态可以在整个占用码编码过程开始时初始化，在占用码编码过程中更新。

在对当前节点的占用码进行编码的逐位编码的实施例中，以特定次序对当前节点的占用码S中的八个二进制数(bin)进行编码。S中的每个二进制数通过参照当前码的相邻节点和/或相邻节点的子节点的占用状态来编码。相邻节点与当前节点处于同一层级，可称为当前节点的兄弟节点。

在对当前节点的占用码进行逐字节编码的实施例中，占用码S(一个字节)可以通过参考以下进行编码：(1)自适应查找表(A-LUT)，其追踪P(例如，32)个最频繁使用的占用码；以及(2)缓存，其追踪最后观察到的不同的Q(例如，16)个占用码。

在逐字节编码的一些示例中，对指示S是否在A-LUT中的二进制标志进行编码。如果S在A-LUT中，则其在A-LUT中的索引是通过使用二进制算术编码器来编码。如果S不在A-LUT中，则对指示S是否在高速缓存中的二进制标志进行编码。如果S在高速缓存中，则其在高速缓存中的索引的二进制表示是使用二进制算术编码器进行编码。否则，如果S不在高速缓存中，则S的二进制表示是使用二进制算术编码器进行编码。

在一些实施例中，在解码器侧，解码过程可以通过从码流中解析边界框的维度开始。边界框表示八叉树结构中的根节点对应的立方体框，用于根据点云的几何信息(例如，点云中点的占用信息)分割立方体框。然后根据解码后的占用码对立方体框进行细分，构建八叉树结构。

在一些相关示例中，(例如，TMC13的版本中)，为了对占用码进行编码，以广度优先次序遍历八叉树结构。按广度优先次，一层级中的八叉树节点(八叉树结构中的节点)可以在上一层级的八叉树节点全部访问完毕后进行访问。在一个实现示例中，可以使用先进先出(FIFO)数据结构。

图11示出了图示广度优先编解码次序的八叉树结构(1100)图。八叉树结构(1100)中的阴影节点为对应于非空立方体空间的节点。可以按照图11所示的从0到8的广度优先编解码次序对阴影节点的占用码进行编解码。按广度优先编解码次序，逐层级访问八叉树节点。广度优先编解码次序本身不适用于并行处理，因为当前层级必须等待上一层级进行编解码。

本申请的一些方面提供了一种混合编解码次序，其包括使用深度优先编解码次序而不是广度优先编解码次序来编解码至少一个层级。因此，在一些实施例中，使用深度优先编解码次序的层级中的节点及其后代节点可以形成八叉树结构的子八叉树结构。当使用深度优先编解码次序的层级包括分别与非空立方体空间对应的多个节点时，该多个节点及它们对应的后代节点可形成多个子八叉树结构。在一些实施例中，多个子八叉树结构可以并行编解码。

图12示出了图示深度优先编解码次序的八叉树结构(1200)图。八叉树结构(1200)中的阴影节点为对应于非空立方体空间的节点。八叉树结构(1200)可以与八叉树结构(1100)对应点云的相同占用几何结构。阴影节点的占用码可以按照图12所示的从0到8的深度优先编解码次序进行编解码。

在图12的示例中，节点“0”可以处于任何合适的划分深度，例如PD0，节点“0”的子节点处于划分深度PD0+1，节点“0”的孙子节点处于划分深度PD0+2。在图12的示例中，划分深度PD0+1处的节点可以按深度优先编解码次序进行编解码。在划分深度PD0+1处的节点包括对应于非空空间的两个节点。这两个节点及其各自的后代节点可形成第一子八叉树结构(1210)和第二子八叉树结构(1220)，这两个节点可分别称为这两个子八叉树结构的根节点。

图12中的深度优先编解码次序称为深度优先编解码次序的前序版本。在该深度优先编解码次序的前序版本中，对于每个子八叉树结构，在访问子八叉树结构的子节点之前先访问子八叉树的根节点。进一步地，首先访问最深的节点，然后回溯到父节点的兄弟节点。

在图12的示例中，在一些实现方式中，可以在并行处理中对第一子八叉树结构(1210)和第二子八叉树结构(1220)进行编解码。例如，可以同时访问节点1和节点5。在一些示例中，可以使用递归编程或栈数据结构来实现深度优先编解码次序。

在一些实施例中，混合编解码次序以广度优先遍历(编解码)开始，并且在几个层级的广度优先遍历之后，可以启用深度优先遍历(编解码)。

应注意，混合编解码次序可用于任何适当的PCC系统中，例如基于TMC 13的PCC系统、基于MPEG-PCC的PCC系统等。

根据本申请的一个方面，混合编解码次序可以包括用于对点云的几何信息进行编解码的广度优先编解码次序和深度优先编解码次序两者。在一个实施例中，可以指定八叉树结构中的节点从广度优先编解码次序变为深度优先编解码次序的节点大小。在一个示例中，在PCC期间，八叉树结构的编解码以广度优先编解码次序开始，且在节点大小等于用于改变编解码次序的指定节点大小的层级处，编解码次序可以在该层级处改变为深度优先编解码次序。请注意，在一些示例中，节点大小与划分深度相关联。

在另一实施例中，可以指定八叉树结构中的节点从深度优先编解码次序改变为广度优先编解码次序的节点大小。在一个示例中，在PCC期间，八叉树结构的编解码以深度优先编解码次序开始，且在节点大小等于用于改变编解码次序的指定节点大小的层级处，编解码次序可以改变为广度优先编解码次序。请注意，在一些示例中，节点大小与划分深度相关联。

更具体地，在以广度优先编解码次序开始的实施例中，节点大小可以用log2标度来表示，并且用d＝0，1，...，M-1表示，其中M-1是根节点的节点大小，M是最大数目的八叉树划分深度(在一些例子中也称为层级)。此外，可以定义被称为编解码次序改变大小的参数d_t。在一个示例中，参数d_t(1≤d_t≤M-1)用于指定将广度优先次序应用于大小为M-1至d_t的节点，将深度优先次序应用于大小为d_t-1至0的节点。当d_t＝M-1时，深度优先方案应用于从根节点开始的所有八叉树节点。当d_t＝0时，仅使用广度优先编解码次序来编解码八叉树结构。

在一些实施例中，八叉树结构的编解码次序可以以广度优先编解码顺序开始，然后在特定深度(对应于特定节点大小)，该特定深度处的每个节点和该节点的后代节点形成点云的单独子八叉树结构。由此，在该特定深度处，形成多个子八叉树结构。子八叉树结构可以使用任何适当的编解码模式单独编解码。在一个示例中，可以使用深度优先编解码次序来编解码子八叉树结构。在另一示例中，可以使用广度优先编解码次序来编解码子八叉树结构。在另一示例中，可以使用混合编解码次序来编解码子八叉树结构。在另一示例中，可以使用逐位编解码方案来对子八叉树结构中的占用码进行编解码。在另一示例中，可以使用逐字节编解码方案来对子八叉树结构中的占用码进行编解码。在另一示例中，可以使用预测几何编解码技术对子八叉树结构进行编解码，预测几何编解码技术是深度优先八叉树编解码模式的可替代编解码模式。在一些示例中，预测几何编解码技术可以使用已编解码校正向量基于先前已编解码的相邻点来预测点。

在一些实施例中，在编码器侧，对于每个子八叉树结构，编码器可以基于编解码效率从多个编解码模式中选择编解码模式。例如，所选择的用于子八叉树结构的编解码模式可以实现针对子八叉树结构的最佳编解码效率。然后，编码器可以使用针对子八叉树结构分别选择的编解码模式，分别对子八叉树结构进行编解码。在一些实施例中，编码器可以在码流中用信号表示用于子八叉树结构的索引，该索引指示为子八叉树结构选择的编解码模式。在解码器侧，解码器可以基于码流中的索引确定用于子八叉树结构的编解码模式，然后根据编解码模式对子八叉树结构进行解码。

本申请的各方面还提供用于混合编解码次序的信号表示技术。根据本申请的一方面，待在混合编解码次序中使用的控制参数可以以高级语法来用信号表示，例如，码流的序列参数集(SPS)、条带头、几何参数集等。请注意，在以下描述中提供了具体示例。由这些具体示例说明的本申请所公开的技术不限于这些具体示例，可以适当地调整，在其它示例中使用。

在一个实施例中，参数d_t(编解码次序改变大小)在高级语法中指定。

图13示出根据本申请一些实施例的几何参数集的语法示例(1300)。如(1310)所示，在几何参数集中指定gps_depth_first_node_size_log2_minus_1。可以基于gps_depth_first_node_size_log2_minus_1确定参数d_t，例如根据(等式1)。

d_t＝gps_depth_first_node_size_log2_minus_1+1 (等式1)

请注意，当gps_depth_first_node_size_log2_minus_1等于0时，禁用深度优先编解码次序。

在另一实施例中，控制标志是明确地用信号表示，以指示是否使用混合编解码次序。

图14示出了根据本申请一些实施例的几何参数集的另一语法示例(1400)。如(1410)所示，使用由gps_hybrid_coding_order_flag表示的控制标志。当控制标志gps_hybrid_coding_order_flag为“真”(true)时(例如，值为1)，启用混合编解码次序方案；当gps_hybrid_coding_order_flag为“假”(false)(例如，值为0)时，禁用混合编解码次序方案。当gps_hybrid_coding_order_flag为“真”时(例如，值为1)，可以基于gps_depth_first_node_size_log2_minus_2确定参数d_t，例如根据(等式2)：

d_t＝gps_depth_first_node_size_log2_minus_2+2 (等式2)

当gps_hybrid_coding_order_flag为“假”(例如，值为0)时，将d_t默认设置为1，以指示禁用深度优先编解码次序，且在示例中仅应用广度优先编解码次序。

在一个实施例中，当启用混合编解码次序时，将广度优先次序应用于大小为M-1至d_t的节点，将深度优先次序应用于大小为d_t-1至0的节点。

图15示出了根据本申请一些实施例的用于八叉树编解码的伪码示例(1500)。如(1510)所示，当depth>＝MaxGeometryOctreeDepth-d_t时，可以使用深度优先编解码次序。在图15的示例中，可以将伪码“geometry_node_depth_first”应用于深度优先编解码次序。

图16示出了根据本申请一些实施例的用于深度优先编解码次序的伪码示例(1600)。伪码“geometry_node_depth_first”是递归函数。在递归函数中，首先调用“geometry_node”函数获得当前八叉树节点的占用码，然后调用伪码“geometry_node_depth_first”对每个子节点进行编解码，直到到达叶节点，例如，当depth>＝MaxGeometryOctreeDepth-1时。

图17示出了概述根据本申请实施例的方法(1700)的流程图。方法(1700)可以在用于点云的编解码过程期间使用。在各种实施例中，方法(1700)由处理电路执行，例如终端装置(110)中的处理电路、执行编码器(203)和/或解码器(201)的功能的处理电路、执行编码器(300)、解码器(400)、编码器(700)和/或解码器(800)的功能的处理电路等。在一些实施例中，方法(1700)以软件指令实现，因此当处理电路执行软件指令时，处理电路执行方法(1700)。该过程开始于(S1701)并进行到(S1710)。

在(S1710)，接收点云的已编码码流。已编码码流包括点云的八叉树结构中的节点的已编码占用码形式的几何信息。八叉树结构中的节点与点云空间的3D分区相对应。节点的大小与对应的3D分区的大小相关联。

在(S1720)，从已编码占用码中解码出节点的占用码。至少第一节点的子节点的第一占用码的解码无需等待第二节点的第二占用码的解码，第二节点与第一节点的节点大小相同。

在一个实施例中，子节点在第一子八叉树中的第一组节点(第一后代节点)之中，第一节点是第一子八叉树的根。第一节点和第二节点是具有相同节点大小的兄弟节点。第二节点是包括第二组节点(第二后代节点)的第二子八叉树的根节点。然后，在一些示例中，第一组节点的第一组占用码和第二组节点的第二组占用码可以被分别解码。在一个示例中，第一组节点的第一组占用码和用于第二组节点的第二组占用码可以并行地解码。在另一示例中，使用第一编解码模式解码第一组节点的第一组占用码，使用第二编解码模式解码第二组节点的第二组占用码。

第一编解码模式和第二编解码模式可以使用深度优先编解码次序、广度优先编解码次序、预测几何编解码技术等中的任一种。在一些示例中，已编码码流中包括指示第一子八叉树的第一编解码模式的第一索引和指示第二子八叉树的第二编解码模式的第二索引。

在另一实施例中，第一节点和第二节点具有用于改变编解码次序的特定节点大小。在一些示例中，使用第一编解码次序对节点中的较大节点进行编解码，使用第二编解码次序对节点中的较小节点进行编解码。较大节点的节点大小大于用于改变编解码次序的特定节点大小。较小节点的节点大小等于或小于用于编解码次序的特定节点大小。在一个示例中，第一编解码次序为广度优先编解码次序，第二编解码次序为深度优先编解码次序。在另一示例中，第一编解码次序是深度优先编解码次序，第二编解码次序是广度优先编解码次序。

在一些示例中，基于点云的已编码码流中的信号，确定用于改变编解码次序的特定节点大小。在一些示例中，当控制信号指示编解码次序改变时，提供所述信号。

在(S1730)，可以基于节点的已解码占用码来重建八叉树结构。

在(S1740)，基于八叉树结构重建点云。然后，方法进行到(S1799)并结束。

上文所描述的技术可使用计算机可读指令实施为计算机软件且以物理方式存储在一个或多个计算机可读存储介质中。举例来说，图18示出适于实施所公开主题的某些实施例的计算机系统(1800)。

所述计算机软件可使用任何合适的机器代码或计算机语言来编码，所述机器代码或计算机语言可经受汇编、编译、链接或类似机制以创建包括指令的代码，所述指令可直接或通过解译、微码执行等而由一个或多个计算机中央处理单元(CPU)、图形处理单元(GPU)等执行。

可在各种类型的计算机或计算机组件上执行所述指令，所述计算机或计算机组件包括例如个人计算机、平板电脑、服务器、智能电话、游戏装置、物联网装置等。

图18中所示的用于计算机系统(1800)的组件在本质上是示范性的，并非旨在暗示关于实施本申请实施例的计算机软件的使用或功能的范围的任何限制。也不应将组件的配置解释为对计算机系统(1800)的示范性实施例中所示的组件中的任一个组件或组件组合有任何依赖或需求。

计算机系统(1800)可包括某些人机接口输入装置。此类人机接口输入装置可响应于一个或多个人类用户通过例如触觉输入(例如：按键、滑动、数据手套移动)、音频输入(例如：语音、拍击)、视觉输入(例如：手势)、嗅觉输入(未描绘)进行的输入。人机接口装置还可用于捕获未必与人的有意识输入直接相关的某些媒体，例如音频(例如：话语、音乐、环境声)、图像(例如：扫描图像、从静态图像相机获得的摄影图像)、视频(例如，二维视频、包括立体视频的三维视频)。

输入人机接口装置可包括以下一个或多个(每种仅描绘一个)：键盘(1801)、鼠标(1802)、轨迹垫(1803)、触摸屏(1810)、数据手套(未示出)、操纵杆(1805)、麦克风(1806)、扫描仪(1807)、相机(1808)。

计算机系统(1800)还可包括某些人机接口输出装置。此类人机接口输出装置可通过例如触觉输出、声音、光和气味/味道刺激一个或多个人类用户的感觉。此类人机接口输出装置可包括触觉输出装置(例如，触摸屏(1810)、数据手套(未示出)或操纵杆(1805)的触觉反馈，但还可存在不充当输入装置的触觉反馈装置)、音频输出装置(例如：扬声器(1809)、头戴式耳机(未描绘))、视觉输出装置(例如，屏幕(1810)，包括阴极射线管(CRT)屏幕、液晶显示(LCD)屏幕、等离子体屏幕、有机发光二极管(OLED)屏幕，各自具有或不具有触摸屏输入能力，各自具有或不具有触觉反馈能力--其中的一些能够通过例如立体平画输出的方式输出二维视觉输出或大于三维的输出；虚拟现实眼镜(未描绘)、全息显示器和烟雾箱(未描绘))，以及打印机(未描绘)。

计算机系统(1800)还可包括人类可访问的存储装置和存储装置的相关联介质，例如，光学介质，包括具有CD/DVD等介质(1821)的CD/DVD ROM/RW(1820)、拇指驱动器(1822)、可移动硬盘驱动器或固态驱动器(1823)、磁带和软盘(未描绘)等旧版磁性媒体、基于ROM/专用集成电路(ASIC)/可编程逻辑设备(PLD)的专用装置，例如，安全保护装置(未描绘)，等等。

所属领域的技术人员还应理解，结合当前公开的主题使用的术语“计算机可读介质”并未涵盖传输介质、载波或其它瞬时信号。

计算机系统(1800)还可包括到一个或多个通信网络的接口。网络可例如是无线的、有线的、光学的。网络还可以是本地的、广域的、城域的、车载和工业的、实时的、容忍延迟的等等。网络的实例包括例如以太网、无线LAN的局域网、包括全球移动通信系统(GSM)、第三代(3G)、第四代(4G)、第五代(5G)、长期演进(LTE)等的蜂窝网络、包括有线TV、卫星TV和地面广播TV的TV有线或无线广域数字网络、包括控制器局域网总线(CANBus)的车载网络和工业网络等。某些网络通常需要附接到某些通用数据端口或外围总线(1849)(例如，计算机系统(1800)的通用串行总线(USB)端口)的外部网络接口适配器；其它网络通常通过附接到如下文所描述的系统总线而集成到计算机系统(1800)的核心中(例如，通过以太网接口集成到PC计算机系统中，或通过蜂窝网络接口集成到智能电话计算机系统中)。通过使用这些网络中的任一网络，计算机系统(1800)可与其它实体通信。此类通信可以是仅单向接收(例如，广播TV)、仅单向发送(例如，连到某些CANBus装置的CANBus)或是双向的，例如，使用局域数字网络或广域数字网络连接到其它计算机系统。可在如上文所描述的那些网络和网络接口中的每一个上使用某些协议和协议栈。

上述人机接口装置、人类可访问存储装置和网络接口可附接到计算机系统(1800)的核心(1840)。

核心(1840)可包括一个或多个中央处理单元(CPU)(1841)、图形处理单元(GPU)(1842)、现场可编程门区域(Field Programmable Gate Areas，FPGA)形式的专用可编程处理单元(1843)、用于某些任务的硬件加速器(1844)等等。这些装置连同只读存储器(read-only memory，ROM)(1845)、随机存取存储器(1846)、例如内部非用户可访问的硬盘驱动器、固态驱动器(SSD)等内部大容量存储装置(1847)可通过系统总线(1848)连接。在一些计算机系统中，系统总线(1848)可通过一个或多个物理插头形式访问以实现通过额外CPU、GPU等来扩展。外围装置可直接或通过外围总线(1849)附接到核心的系统总线(1848)。用于外围总线的架构包括外围设备互连(PCI)、USB等等。

CPU(1841)、GPU(1842)、FPGA(1843)和加速器(1844)可执行某些指令，所述指令组合起来可构成上述计算机代码。计算机代码可存储在ROM(1845)或RAM(1846)中。过渡数据也可存储在RAM(1846)中，而永久性数据可例如存储在内部大容量存储装置(1847)中。可通过使用高速缓冲存储器来实现对任一存储器装置的快速存储和检索，所述高速缓冲存储器可与一个或多个CPU(1841)、GPU(1842)、大容量存储装置(1847)、ROM(1845)、RAM(1846)等紧密关联。

计算机可读介质上可具有用于执行各种计算机实施的操作的计算机代码。所述介质和计算机代码可以是专为本申请的目的设计和构建的介质和计算机代码，或可属于计算机软件领域中的技术人员众所周知且可用的种类。

举例来说但不作为限制，具有架构(1800)且尤其是核心(1840)的计算机系统可提供因处理器(包括CPU、GPU、FPGA、加速器等)执行以一个或多个有形计算机可读介质体现的软件而产生的功能。此类计算机可读介质可以是与上文所介绍的用户可访问大容量存储装置以及核心(1840)的非暂时性质的某些存储装置(例如，核心内部大容量存储装置(1847)或ROM(1845))相关联的介质。实施本申请的各种实施例的软件可存储在此类装置中且由核心(1840)执行。根据特定需求，计算机可读介质可包括一个或多个存储器装置或芯片。软件可使核心(1840)且具体地说使其中的处理器(包括CPU、GPU、FPGA等等)执行本文中所描述的特定过程或特定过程的特定部分，包括限定存储在RAM(1846)中的数据结构以及根据由软件限定的过程修改此类数据结构。另外或作为替代方案，计算机系统可提供由硬连线的或以其它方式体现于电路(例如：加速器(1844))中的逻辑所产生的功能，所述逻辑可代替或连同软件一起操作以执行本文描述的特定过程或特定过程的特定部分。适当时，对软件的引用可涵盖逻辑，且反之亦然。适当时，对计算机可读介质的引用可涵盖存储用于执行的软件的电路(例如，集成电路(IC))、体现用于执行的逻辑的电路或这两种电路。本申请涵盖硬件与软件的任何合适的组合。

尽管本申请描述了若干示范性实施例，但在本申请的范围内，可以有各种改动、排列组合方式以及各种替代等同物。因此，应该理解，在申请的精神和范围内，本领域技术人员能够设计出各种虽未在本文明确示出或描述、但可以体现本申请的原理的系统和方法。

Claims

1.一种点云编解码方法，其特征在于，包括：

处理器从点云的已编码码流中接收所述点云的八叉树结构中的节点的已编码占用码，所述八叉树结构中的所述节点对应于所述点云的空间的三维3D分区，所述节点的大小与所述对应的3D分区的大小相关联；

所述处理器从所述已编码占用码中解码出所述节点的占用码，其中，至少第一节点的子节点的第一占用码的解码无需等待第二节点的第二占用码的解码，所述第二节点与所述第一节点具有相同的节点大小；

所述处理器基于所述节点的已解码占用码，重建所述八叉树结构；以及

所述处理器基于所述八叉树结构重建所述点云。

2.根据权利要求1所述的方法，其特征在于，还包括：

解码第一子八叉树中的第一组节点的第一组占用码，所述第一节点是所述第一子八叉树的根；以及

解码第二子八叉树中的第二组节点的第二组占用码，所述第二节点是所述第二子八叉树的根。

3.根据权利要求2所述的方法，其特征在于，还包括：

解码所述第一子八叉树中的所述第一组节点的所述第一组占用代码，与解码所述第二子八叉树中的所述第二组节点的所述第二组占用代码是并行的。

4.根据权利要求2所述的方法，其特征在于，还包括：

使用第一编解码模式解码所述第一子八叉树中的所述第一组节点的所述第一组占用码；以及

使用第二编解码模式解码所述第二子八叉树中的所述第二组节点的所述第二组占用码。

5.根据权利要求4所述的方法，其特征在于，还包括：

从所述已编码码流中解码出指示所述第一子八叉树的所述第一编解码模式的第一索引；以及

从所述已编码码流中解码出指示所述第二子八叉树的所述第二编解码模式的第二索引。

6.根据权利要求1所述的方法，其特征在于，还包括：

对于所述节点中的较大节点，使用第一编解码次序来解码所述占用码的第一部分，所述较大节点大于用于改变编解码次序的特定节点大小；以及

对于所述节点中的较小节点，使用不同于所述第一编解码次序的第二编解码次序来解码所述占用码的第二部分，所述较小节点等于或小于所述用于改变编解码次序的特定节点大小。

7.根据权利要求6所述的方法，其特征在于，所述第一编解码次序为广度优先编解码次序，所述第二编解码次序为深度优先编解码次序。

8.根据权利要求6所述的方法，其特征在于，所述第一编解码次序为深度优先编解码次序，所述第二编解码次序为广度优先编解码次序。

9.根据权利要求6所述的方法，其特征在于，还包括：

基于所述点云的所述已编码码流中的信号，确定所述用于改变编解码次序的特定节点大小。

10.根据权利要求9所述的方法，其特征在于，还包括：

从所述点云的所述已编码码流中解码出控制信号，所述控制信号指示编解码次序改变。

11.一种点云编解码装置，其特征在于，包括：

处理电路，所述处理电路被配置为：

从点云的已编码码流中接收所述点云的八叉树结构中的节点的已编码占用码，所述八叉树结构中的所述节点对应于所述点云的空间的三维3D分区，所述节点的大小与所述对应的3D分区的大小相关联；

从所述已编码占用码中解码出所述节点的占用码，其中，至少第一节点的子节点的第一占用码的解码无需等待第二节点的第二占用码的解码，所述第二节点与所述第一节点具有相同的节点大小；

基于所述节点的已解码占用码，重建所述八叉树结构；以及

基于所述八叉树结构重建所述点云。

12.根据权利要求11所述的装置，其特征在于，所述处理电路被配置为：

13.根据权利要求12所述的装置，其特征在于，所述处理电路被配置为：解码所述第一子八叉树中的所述第一组节点的所述第一组占用代码，与解码所述第二子八叉树中的所述第二组节点的所述第二组占用代码是并行的。

14.根据权利要求12所述的装置，其特征在于，所述处理电路被配置为：

15.根据权利要求14所述的装置，其特征在于，所述处理电路被配置为：

16.根据权利要求11所述的装置，其特征在于，所述处理电路被配置为：

17.根据权利要求16所述的装置，其特征在于，所述第一编解码次序为广度优先编解码次序，所述第二编解码次序为深度优先编解码次序。

18.根据权利要求16所述的装置，其特征在于，所述第一编解码次序为深度优先编解码次序，所述第二编解码次序为广度优先编解码次序。

19.根据权利要求16所述的装置，其特征在于，所述处理电路被配置为：

20.根据权利要求19所述的装置，其特征在于，所述处理电路被配置为：