WO2022111343A1

WO2022111343A1 - 非时序点云媒体的处理方法、装置、设备及存储介质

Info

Publication number: WO2022111343A1
Application number: PCT/CN2021/131037
Authority: WO
Inventors: 胡颖
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2020-11-26
Filing date: 2021-11-17
Publication date: 2022-06-02
Also published as: US20230048474A1; EP4254351A1; EP4254351A4; JP2023550752A; CN114549778A; KR20230110790A9; KR20230110790A

Abstract

一种非时序点云媒体的处理方法、装置、设备及存储介质，该方法包括：通过GPCC编码方式对静态物体的非时序点云数据进行处理，得到GPCC比特流（S302）；对GPCC比特流进行封装，生成至少一个GPCC区域的条目（S303）；对至少一个GPCC区域的条目进行封装，生成静态物体的至少一个非时序点云媒体（S304）；发送至少一个非时序点云媒体的MDP信令（S305）；接收视频播放设备发送的第一请求消息；发送第一非时序点云媒体；其中，GPCC区域的条目用于表示GPCC区域对应的三维3D空间区域的GPCC成分；非时序点云媒体包括：静态物体的标识，以使用户可以分多次，且具有目的性地请求同一静态物体的非时序点云媒体，以提高用户体验感。

Description

非时序点云媒体的处理方法、装置、设备及存储介质

本申请要求于2020年11月26日提交中国专利局、申请号为202011347626.1、申请名称为“非时序点云媒体的处理方法、装置、设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及计算机技术领域，尤其涉及非时序点云媒体。

背景技术

目前可以通过许多方式获取物体的点云数据，而视频制作设备可以将点云数据以点云媒体，即点云媒体文件的形式传输给视频播放设备，以供视频播放设备播放点云媒体。

值得一提的是，针对同一物体的点云数据，可以封装成不同的点云媒体，例如：有些点云媒体是该物体的整个点云媒体，而有些点云媒体只是该物体的部分点云媒体。

发明内容

本申请提供一种时序点云媒体的处理方法、装置、设备及存储介质，以使用户可以分多次，且具有目的性地请求同一静态物体的非时序点云媒体，以提高处理效率和用户体验感。

一方面，本申请提供一种非时序点云媒体的处理方法，所述方法由视频制作设备执行，所述方法包括：获取静态物体的非时序点云数据；通过GPCC编码方式对非时序点云数据进行处理，得到GPCC比特流；对GPCC比特流进行封装，生成至少一个GPCC区域的条目，所述GPCC区域的条目用于表示所述GPCC区域对应的三维3D空间区域的GPCC成分；对至少一个GPCC区域的条目进行封装，生成静态物体的至少一个非时序点云媒体，所述非时序点云媒体包括所述静态物体的标识；向视频播放设备发送至少一个非时序点云媒体的MPD信令；接收视频播放设备根据所述MPD信令发送的第一请求消息，所述第一请求消息用于请求所述至少一个非时序点云媒体中的第一非时序点云媒体；根据第一请求消息，向视频播放设备发送第一非时序点云媒体。

另一方面，本申请提供一种非时序点云媒体的处理方法，所述方法由视频播放设备执行，所述方法包括：接收至少一个非时序点云媒体的MPD信令，所述非时序点云媒体包括所述静态物体的标识；根据所述MPD信令向视频制作设备发送第一请求消息，所述第一请求消息用于请求所述至少一个非时序点云媒体中的第一非时序点云媒体；从所述视频制作设备接收第一非时序点云媒体；播放第一非时序点云媒体；其中，至少一个非时序点云媒体是对至少一个点云压缩GPCC区域的条目进行封装生成得到的，所述至少一个GPCC区域的条目是对GPCC比特流进行封装生成的，所述GPCC比特流是通过GPCC编码方式对静态物体的非时序点云数据进行处理得到的；针对至少一个GPCC区域的条目中的任一个GPCC区域的条目，GPCC区域的条目用于表示GPCC区域对应的3D空间区域的GPCC成分。

另一方面，本申请提供一种非时序点云媒体的处理装置，包括：处理单元和通信单元；处理单元用于：获取静态物体的非时序点云数据；通过GPCC编码方式对非时序点云数据进行处理，得到GPCC比特流；对GPCC比特流进行封装，生成至少一个GPCC区域的条目，所述GPCC区域的条目用于表示所述GPCC区域对应的三维3D空间区域的GPCC成分；对至少一个GPCC区域的条目进行封装，生成静态物体的至少一个非时序点云媒体，所述非时序点云媒体包括所述静态物体的标识；向视频播放设备发送至少一个非时序点云媒体的MPD信令；通信单元用于：接收视频播放设备根据所述MPD信令发送的第一请求消息，所述第一请求消息用于请求所述至少一个非时序点云媒体中的第一非时序点云媒体；根据第一请求消息，向视频播放设备发送第一非时序点云媒体。

另一方面，本申请提供一种非时序点云媒体的处理装置，包括：处理单元和通信单元；通信单元用于：接收至少一个非时序点云媒体的MPD信令，所述非时序点云媒体包括所述静态物体的标识；根据所述MPD信令向视频制作设备发送第一请求消息，所述第一请求消息用于请求所述至少一个非时序点云媒体中的第一非时序点云媒体；从所述视频制作设备接收第一非时序点云媒体；处理单元用于播放第一非时序点云媒体；其中，至少一个非时序点云媒体是对至少一个点云压缩GPCC区域的条目进行封装生成得到的，所述至少一个GPCC区域的条目是对GPCC比特流进行封装生成的，所述GPCC比特流是通过GPCC编码方式对静态物体的非时序点云数据进行处理得到的；针对至少一个GPCC区域的条目中的任一个GPCC区域的条目，GPCC区域的条目用于表示GPCC区域对应的3D空间区域的GPCC成分。

又一方面，提供了一种视频制作设备，包括：处理器和存储器，该存储器用于存储计算机程序，该处理器用于调用并运行该存储器中存储的计算机程序，以执行以上方面的方法。

又一方面，提供了一种视频播放设备，包括：处理器和存储器，该存储器用于存储计算机程序，该处理器用于调用并运行该存储器中存储的计算机程序，以执行以上方面的方法。

又一方面，提供了一种计算机可读存储介质，用于存储计算机程序，该计算机程序使得计算机执行以上方面的方法。

又一方面，本申请实施例提供了一种包括指令的计算机程序产品，当其在计算机上运行时，使得所述计算机执行以上方面的方法。

综上，在本申请中，视频制作设备在封装非时序点云媒体时，可以将静态物体的标识携带在非时序点云媒体中，以使用户可以分多次，且具有目的性地请求同一静态物体的非时序点云媒体，以提高用户体验感。

进一步地，在本申请中，GPCC区域的条目对应的3D空间区域可以划分为多个子空间区域，结合GPCC tile独立编解码的特性，可以使用户解码呈现非时序点云媒体的效率更高，时延更低。

更进一步地，视频制作设备可以对多个GPCC区域的条目进行灵活组合，以形成不同的非时序点云媒体，其中非时序点云媒体可以构成完整的GPCC帧，也可以构成部分GPCC帧。从而可以提高视频制作的灵活性。

附图说明

图1示出了本申请一个示例性实施例提供的一种非时序点云媒体的处理系统的架构示意图；

图2A示出了本申请一个示例性实施例提供的一种非时序点云媒体的处理架构的架构示意图；

图2B示出了本申请一个示例性实施例提供的一种样本的结构示意图；

图2C示出了本申请一个示例性实施例提供的一种包含多个文件轨道的容器的结构示意图；

图2D示出了本申请另一个示例性实施例提供的一种样本的结构示意图；

图3示出了本申请实施例提供的一种非时序点云媒体的处理方法的交互流程图；

图4A示出了本申请实施例提供的一种点云媒体的封装示意图；

图4B示出了本申请实施例提供的另一种点云媒体的封装示意图；

图5示出了本申请实施例提供的一种非时序点云媒体的处理装置500的示意图；

图6示出了本申请实施例提供的一种非时序点云媒体的处理装置600的示意图；

图7示出了本申请实施例提供的视频制作设备700的示意性框图；

图8示出了本申请实施例提供的视频播放设备800的示意性框图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

在介绍本申请技术方案之前，下面先对本申请相关知识进行介绍：

所谓点云(Point Cloud)是指空间中一组无规则分布的、表达三维物体或三维场景的空间结构及表面属性的离散点集。点云数据(Point Cloud Data)是点云的具体记录形式，点云中每个点的点云数据可以包括几何信息(即三维位置信息)和属性信息，其中，点云中每个点的几何信息是指该点的笛卡尔三维坐标数据，点云中每个点的属性信息可以包括但不限于以下至少一种：色彩信息、材质信息、激光反射强度信息。通常，点云中的每个点都具有相同数量的属性信息；例如，点云中的每个点都具有色彩信息和激光反射强度两种属性信息；或者点云中的每个点都具有色彩信息、材质信息和激光反射强度信息三种属性信息。

随着科学技术的进步与发展，目前已经能够以较低的成本、在较短的时间周期内获得大量高精确度的点云数据，点云数据的获取途径可以包括但不限于以下至少一种：(1)计算机设备生成。计算机设备可以根据虚拟三维物体及虚拟三维场景的生成点云数据。(2)3D(3-Dimension，三维)激光扫描获取。通过3D激光扫描可以获取静态现实世界三维物体或三维场景的点云数据，每秒可以获取百万级点云数据；(3)3D摄影测量获取。通过3D摄影设备(即一组摄像机或具有多个镜头和传感器的摄像机设备)对现实世界的视觉场景进行采集以获取现实世界的视觉场景的点云数据，通过3D摄影可以获得动态现实世界三维物体或三维场景的点云数据。(4)通过医学设备获取生物组织器官的点云数据。在医学领域可以通过磁共振成像(Magnetic Resonance Imaging，MRI)、电子计算机断层扫描(Computed Tomography，CT)、电磁定位信息等医学设备获取生物组织器官的点云数据。

所谓点云媒体是指由点云数据形成的点云媒体文件，点云媒体包括多个媒体帧，点云媒体中的每个媒体帧由点云数据组成。点云媒体可以灵活方便地表达三维物体或三维场景的空间结构及表面属性，因此被广泛应用在虚拟现实(Virtual Reality，VR)游戏、计算机辅助设计(Computer Aided Design，CAD)、地理信息系统(Geography Information System，GIS)、自动导航系统(Autonomous Navigation System，ANS)、数字文化遗产、自由视点广播、三维沉浸远程呈现、生物组织器官三维重建等项目中。

所谓非时序点云媒体针对的是同一静态物体，即对于同一静态物体，它对应的点云媒体是非时序的。

基于上述描述，请参见图1，图1示出了本申请一个示例性实施例提供的一种非时序点云媒体的处理系统的架构示意图，该非时序点云媒体的处理系统10包括视频播放设备101和视频制作设备102。其中，视频制作设备是指非时序点云媒体的提供者(例如非时序点云媒体的内容制作者)所使用的计算机设备，该计算机设备可以是终端(例如个人计算机(Personal Computer，PC)、智能移动设备(例如智能手机)等)、服务器等；视频播放设备是指非时序点云媒体的使用者(例如用户)所使用的计算机设备，该计算机设备可以是终端(例如PC)、智能移动设备(例如智能手机)、VR设备(例如VR头盔、VR眼镜)等)。视频制作设备和视频播放设备可以通过有线通信或者无线通信的方式进行直接或间接地连接，本申请实施例在此不做限制。

图2A示出了本申请一个示例性实施例提供的一种非时序点云媒体的处理架构的架构示意图，下面将结合图1所示的非时序点云媒体的处理系统以及图2A所示的非时序点云媒体的处理架构，对本申请实施例提供的非时序点云媒体的处理方案进行介绍，非时序点云媒体的处理过程包括视频制作设备侧的处理过程以及视频播放设备侧的处理过程，具体处理过程如下：

一、视频制作设备侧的处理过程：

(1)点云数据的获取过程。

在一种实现方式中，从点云数据的获取方式看，点云数据的获取方式可以分为通过捕获设备采集真实世界的视觉场景来获取点云数据，以及，通过计算机设备生成两种方式。在一种实现方式中，捕获设备可以是设置于视频制作设备中的硬件组件，例如捕获设备是终端的摄像头、传感器等。捕获设备也可以是与内容制作设备相连接的硬件装置，例如与服务器相连接摄像头等。捕获设备用于为视频制作设备提供点云数据的获取服务，捕获设备可以包括但不限于以下任一种：摄像设备、传感设备、扫描设备；其中，摄像设备可以包括普通摄像头、立体摄像头、光场摄像头等；传感设备可以包括激光设备、雷达设备等；扫描设备可以包括3D激光扫描设备等。捕获设备的数量可以为多个，这些捕获设备被部署在现实空间中的一些特定位置以同时捕获该空间内不同角度的点云数据，捕获到的点云数据在时间上和空间上均保持同步。在另一种实现方式中，计算机设备可以根据虚拟三维物体及虚拟三维场景的生成点云数据。由于点云数据的获取方式不同，通过不同方式获取到的点云数据对应的压缩编码方式也可能有所区别。

(2)点云数据的编码及封装过程。

在一种实现方式中，视频制作设备采用基于几何的点云压缩(Geometry-Based Point Cloud Compression，GPCC)编码方式或者基于传统视频编码的点云压缩(Video-BasedPointCloudCompression，VPCC)编码方式对获取到的点云数据进行编码处理，得到点云数据的GPCC比特流或者VPCC比特流。

在一种实现方式中，以GPCC编码方式为例，视频制作设备采用文件轨道对编码后的点云数据的GPCC比特流进行封装；所谓文件轨道是指编码后的点云数据的GPCC比特流的封装容器；GPCC比特流可以封装在单个文件轨道中，GPCC比特流也可以封装到多个文件轨道中，GPCC比特流封装在单个文件轨道中和GPCC比特流封装在多个文件轨道中的具体情况如下：

1、GPCC比特流封装在单个文件轨道中。当GPCC比特流在单个文件轨道中传输时，要求GPCC比特流根据单个文件轨道的传输规则进行声明并表示。封装在单个文件轨道中的GPCC比特流无需进行进一步处理，可以通过国际标准化组织基本媒体文件格式(International Organization for Standardization Base Media File Format，ISOBMFF)进行封装。具体地，封装在单个文件轨道中的每个样本(Sample)都包含一个或多个GPCC组件，该GPCC组件也被称为GPCC成分，该GPCC成分可以是GPCC几何成分或者GPCC属性成分。所谓样本是指一个或多个点云的封装结构集合，也就是说，每个样本由一个或多个类型-长度-值字节流格式(Type-Length-Value ByteStream Format，TLV)封装结构组成。图2B示出了本申请一个示例性实施例提供的一种样本的结构示意图，如图2B所示，在进行单个文件轨道传输时，该文件轨道中的样本由GPCC参数集TLV、几何比特流TLV和属性比特流TLV组成，该样本被封装到单个文件轨道中。

2、GPCC比特流封装在多个文件轨道中。当编码的GPCC几何比特流和编码的GPCC属性比特流在不同的文件轨道中进行传输时，文件轨道中的每个样本都包含至少一个TLV封装结构，该TLV封装结构中携带单个GPCC成分数据，并且TLV封装结构中不同时包含编码的GPCC几何比特流和编码的GPCC属性比特流。图2C示出了本申请一个示例性实施例提供的一种包含多个文件轨道的容器的结构示意图，如图2C所示，在文件轨道1中传输的封装包1包含编码的GPCC几何比特流，不包含编码的GPCC属性比特流；在文件轨道2中传输的封装包2包含编码的GPCC属性比特流，不包含编码的GPCC几何比特流。由于视频播放设备在解码时首先应对编码的GPCC几何比特流进行解码，而编码的GPCC属性比特流的解码取决于解码后的几何信息，因此将不同的GPCC分量比特流封装在单独的文件轨道中，使得视频播放设备可以在编码的GPCC属性比特流之前访问承载编码的GPCC几何比特流的文件轨道。图2D示出了本申请另一个示例性实施例提供的一种样本的结构示意图，如图2D所示，在进行多个文件轨道传输时，编码的GPCC几何比特流和编码的GPCC属性比特流在不同的文件轨道中进行传输，该文件轨道中的样本由GPCC参数集TLV、几何比特流TLV组成，样本中不包含属性比特流TLV，该样本被封装在多个文件轨道中的任一个文件轨道中。

在一种实现方式中，获取到的点云数据经视频制作设备编码、封装后形成非时序点云媒体，该非时序点云媒体可以是物体的整个媒体文件，也可以是物体的媒体片段；并且视频制作设备按照非时序点云媒体的文件格式要求采用媒体呈现描述信息(即描述信令文件)(Media presentation description，MPD)记录该非时序点云媒体的封装文件的元数据，此处的元数据是对与非时序点云媒体的呈现有关的信息的总称，该元数据可以包括对非时序点云媒体的描述信息、对视窗的描述信息以及对非时序点云媒体呈现相关的信令信息等等。视频制作设备将MPD下发至视频播放设备，以使视频播放设备根据该MPD中的相关描述信息请求获取点云媒体。具体地，点云媒体和MPD通过传输机制(例如动态自适应流媒体传输(Dynamic Adaptive Streaming over HTTP，DASH)、智能媒体传输(Smart Media Transport，SMT))由视频制作设备下发至视频播放设备。

二、视频播放设备侧的数据处理过程：

(1)点云数据的解封装及解码过程。

在一种实现方式中，视频播放设备可以通过视频制作设备下发的MPD信令获取非时序点云媒体。视频播放设备端的文件解封装的过程与视频制作设备端的文件封装过程是相逆的，视频播放设备按照非时序点云媒体的文件格式要求对非时序点云媒体的封装文件进行解封装，得到编码比特流(即GPCC比特流或VPCC比特流)。视频播放设备端的解码过程与视频制作设备端的编码过程是相逆的，视频播放设备对编码比特流进行解码，还原出点云数据。

(2)点云数据的渲染过程。

在一种实现方式中，视频播放设备根据MPD中与渲染、视窗相关的元数据对GPCC比特流解码得到的点云数据进行渲染，渲染完成即实现了对点云数据对应的视觉场景的呈现。

可以理解的是，本申请实施例描述的非时序点云媒体的处理系统是为了更加清楚的说明本申请实施例的技术方案，并不构成对于本申请实施例提供的技术方案的限定，本领域普通技术人员可知，随着系统架构的演变和新业务场景的出现，本申请实施例提供的技术方案对于类似的技术问题，同样适用。

如上所述，针对同一物体的点云数据，可以封装成不同的点云媒体，例如：有些点云媒体是该物体的整个点云媒体，有些点云媒体而是该物体的部分点云媒体。基于此，用户可以请求播放不同的点云媒体，然而，用户在请求时，却并不知道不同的点云媒体是否为同一物体的点云媒体，从而造成请求盲目的问题。对于静态物体的非时序点云媒体也存在这一问题。

为了解决上述技术问题，本申请通过在非时序点云媒体中携带静态物体的标识，以使用户可以分多次，且具有目的性地请求同一静态物体的非时序点云媒体。

下面将对本申请技术方案进行详细阐述：

图3为本申请实施例提供的一种非时序点云媒体的处理方法的交互流程图，该方法的执行主体是视频制作设备和视频播放设备，如图3所示，该方法包括如下步骤：

S301：视频制作设备获取静态物体的非时序点云数据。

S302：视频制作设备通过GPCC编码方式对非时序点云数据进行处理，得到GPCC比特流。

S303：视频制作设备对GPCC比特流进行封装，生成至少一个GPCC区域的条目。

S304：视频制作设备对至少一个GPCC区域的条目进行封装，生成静态物体的至少一个非时序点云媒体，每个非时序点云媒体包括静态物体的标识。

S305：视频制作设备向视频播放设备发送至少一个非时序点云媒体的MPD信令。

S306：视频播放设备发送第一请求消息。

其中，第一请求消息是视频播放设备根据MPD信令发送的，所述第一请求消息用于请求所述至少一个非时序点云媒体中的第一非时序点云媒体。

S307：视频制作设备根据第一请求消息，向视频播放设备发送第一非时序点云媒体。

S308：视频播放设备播放第一非时序点云媒体。

应理解的是，关于如何获取静态物体的非时序点云数据以及得到GPCC比特流，可参考上述相关知识，本申请对此不再赘述。

其中，针对至少一个GPCC区域的条目(Item)中的任一个GPCC区域的条目，GPCC区域的条目用于表示GPCC区域对应的3D空间区域的GPCC成分。

每个GPCC区域对应上述静态物体的一个3D空间区域，该3D空间区域可以是静态物体的整个或者部分3D空间区域。

如上所述，GPCC成分也被称为GPCC组件，该GPCC成分可以是GPCC几何成分或者属性成分。

应理解的是，在视频制作设备侧，可以通过如下代码定义静态物体的标识：

aligned(8)class ObjectInfoProperty extends ItemProperty('obif'){

unsigned int(32)object_ID；}

其中，ObjectInfoProperty指示条目对应的内容的属性，GPCC几何成分和属性成分均可包含该属性。若仅GPCC几何成分包含该属性，则该GPCC几何成分关联的所有属性成分的ObjectInfoProperty与其相同。

object_ID指示静态物体的标识，同一个静态物体的不同GPCC区域的条目，其object_ID相同。

可选地，上述静态物体的标识可以携带在点云媒体中的GPCC几何成分相关的条目中，或者携带在点云媒体中的GPCC属性成分相关的条目中，又或者携带在点云媒体中的GPCC几何成分相关的条目，以及，GPCC属性成分相关的条目中，本申请对此不做限制。

示例性地，图4A为本申请实施例提供的一种点云媒体的封装示意图，如图4A所示，该点云媒体包括：GPCC几何成分相关的条目，以及GPCC属性成分相关的条目。其中，可以通过该点云媒体中的GPCC条目组盒子将这些条目关联起来。如图4A所示，GPCC几何成分相关的条目，关联有GPCC属性成分相关的条目。其中，GPCC几何成分相关的条目可以包括如下的条目属性：如GPCC配置(GPCC Configuration)、3D空间区域属性(3D spatial region或者ItemSpatialInfoProperty)、静态物体的标识。GPCC属性成分相关的条目可以包括如下的条目属性：如GPCC配置(GPCC Configuration)、静态物体的标识等。

可选地，GPCC配置指示了解码对应条目所需的解码器的配置信息以及每个GPCC成分相关的信息，但不限于此。

值得一提的是，GPCC属性成分相关的条目也可以包括：3D空间区域属性，本申请对此不做限制。

示例性地，图4B为本申请实施例提供的另一种点云媒体的封装示意图，图4B与图4A的区别在于：在图4B中，该点云媒体包括：一个GPCC几何成分相关的条目，且该条目关联两个GPCC属性成分相关的条目。其余的关于GPCC几何成分相关的条目所包括的各个属性，以及GPCC属性成分相关的条目所包括的各个属性可参考图4A，本申请对此不再赘述。

应理解的是，上述静态物体的标识不限于携带在每个GPCC区域的条目对应包括的属性中。

应理解的是，上述MPD信令可参考本申请上述的相关知识，本申请对此不再赘述。

可选地，针对上述至少一个非时序点云媒体中的任一个非时序点云媒体，该非时序点云媒体可以是上述静态物体的整个或者部分点云媒体。

应理解的是，视频播放设备可以根据上述MPD信令发送第一请求消息，以请求第一非时序点云媒体。

相关技术中，每个GPCC区域的条目只对应一个3D空间区域，而在本申请中，可以对该3D空间区域进行进一步划分，基于此，本申请对非时序点云媒体中的条目属性以及MPD信令进行了相应的更新，具体如下：

可选地，目标GPCC区域的条目包括：3D空间区域条目属性，3D空间区域条目属性包括：第一标识和第二标识。其中，目标GPCC区域为至少一个GPCC区域中的一个GPCC区域。第一标识(Sub_region_contained)用于标识目标GPCC区域对应的目标3D空间区域是否被划分为多个子空间区域。第二标识(tile_id_present)用于标识目标GPCC区域是否采用GPCC tile编码方式。

示例性地，当Sub_region_contained＝0时，表示目标GPCC区域对应的目标3D空间区域未被划分为多个子空间区域，当Sub_region_contained＝1时，表示目标GPCC区域对应的目标3D空间区域被划分为多个子空间区域。

示例性地，当tile_id_present＝0时，表示目标GPCC区域未采用GPCC tile编码方式。当tile_id_present＝1时，表示目标GPCC区域采用GPCC tile编码方式。

应理解的是，当Sub_region_contained＝1时，tile_id_present＝1，即当目标GPCC区域对应的目标3D空间区域被划分为多个子空间区域时，视频制作端必须采用GPCC tile编码方式。

可选地，若目标GPCC区域对应的目标3D空间区域被划分为多个子空间区域，则3D空间区域条目属性还包括，但不限于此：多个子空间区域各自的信息和目标3D空间区域的信息。

可选地，针对多个子空间区域中的任一个子空间区域，子空间区域的信息包括以下至少一项，但不限于此：子空间区域的标识、子空间区域的位置信息、目标GPCC区域采用GPCC tile编码时，子空间区域中的tile(区块)标识。

可选地，子空间区域的位置信息包括，但不限于此：该子空间区域的一个锚点的位置信息，以及，该子空间区域分别沿着X轴、Y轴、Z轴的长度。或者，子空间区域的位置信息包括，但不限于此：该子空间区域的两个锚点的位置信息。

可选地，目标3D空间区域的信息包括以下至少一项，但不限于此：目标3D空间区域的标识、目标3D空间区域的位置信息、目标3D空间区域包括的子空间区域的数量。

可选地，目标3D空间区域的位置信息包括，但不限于此：该目标3D空间区域的一个锚点的位置信息，以及，该目标3D空间区域分别沿着X轴、Y轴、Z轴的长度。或者，目标3D空间区域的位置信息包括，但不限于此：该目标3D空间区域的两个锚点的位置信息。

可选地，若目标GPCC区域对应的目标3D空间区域被划分为多个子空间区域，则3D空间区域条目属性还包括：第三标识(initial_region_id)。当第三标识的取值为第一数值或者空时，表示目标GPCC区域对应的条目是视频播放设备初始呈现的条目时，针对目标3D空间区域和目标3D空间区域的子空间区域，在视频播放设备初始呈现的是目标3D空间区域。当第三标识的取值为第二数值时，表示目标GPCC区域对应的条目是视频播放设备初始呈现的条目时，针对目标3D空间区域和目标3D空间区域的子空间区域，在视频播放设备初始呈现的是目标3D空间区域中第二数值所对应的子空间区域。

可选地，上述第一数值是0，第二数值是目标3D空间区域中需要初始呈现的子空间区域的标识。

可选地，若目标GPCC区域对应的目标3D空间区域未被划分为多个子空间区域，则3D空间区域条目属性还包括：目标3D空间区域的信息。可选地，目标3D空间区域的信息包括以下至少一项，但不限于此：目标3D空间区域的标识、目标3D空间区域的位置信息、目标GPCC区域采用GPCC tile编码时，目标3D空间区域中的tile标识。

应理解的是，关于目标3D空间区域的位置信息的情况，可参考上述内容中目标3D空间区域的位置信息的解释，本申请对此不再赘述。

下面将通过代码形式说明本申请对对非时序点云媒体中的条目属性的更新情况：

其中各字段语义如下：

ItemSpatialInfoProperty表示GPCC区域的条目的3D空间区域属性。若该条目是几何成分对应的条目，则必须包含该属性；若条目是属性成分对应的条目，则可以不包含该3D空间区域属性。

sub_region_contained取值为1，表示3D空间区域内部还可进一步划分为多个子空间区域，当该字段取值为1时，tile_id_present必须取值为1。该sub_region_contained取值为0，表示3D空间内无进一步的子空间区域划分。

tile_id_present取值为1表示该非时序点云数据采用GPCC tile编码，且该非时序点云对应的tile id在本属性中给出。

inital_region_id表示当前条目为初始消费或者播放的条目时，该条目整体空间内部初始呈现的空间区域的ID。若该字段取值为0或该字段不存在，则该条目初始呈现的区域为整体的3D空间区域。若该字段取值为子空间区域的标识时，则该条目初始呈现的区域为该标识对应的子空间区域。

3DSpatialRegionStruct表示3D空间区域，ItemSpatialInfoProperty中的第一个3DSpatialRegionStruct指示ItemSpatialInfoProperty对应条目对应的3D空间区域，其余3DSpatialRegionStruct指示该条目对应的3D空间区域中各个子空间区域。

num_sub_regions指示该条目对应的3D空间区域内划分的子空间区域个数。

num_tiles指示该条目对应的3D空间区域中的tile数量，或者其子空间区域对应的tile数量。

tile_id指示GPCC tile的标识符。

anchor_x、anchor_y、anchor_z分别表示3D空间区域或者该区域的子空间区域的锚点的x、y、z坐标。

region_dx、region_dy、region_dz分别表示3D空间区域或者该区域的子空间区域分别沿着X轴、Y轴、Z轴的长度。

综上，在本申请中，3D空间区域可以划分为多个子空间区域，结合GPCC tile独立编解码的特性，可以使用户解码呈现非时序点云媒体的效率更高，时延更低。

如上所述，视频制作设备可以对至少一个GPCC区域的条目进行封装，生成静态物体的至少一个非时序点云媒体。其中，若至少一个GPCC区域的条目是1个，则将1个GPCC区域的条目封装为1个非时序点云媒体。若至少一个GPCC区域的条目是N个，则将N个GPCC区域的条目封装为M个非时序点云媒体。其中，N为大于1的整数，M的取值范围为【1，N】，M为整数。例如：若至少一个GPCC区域的条目是N个，则可以将N个GPCC区域的条目封装为1个非时序点云媒体，该封装情况下，一个非时序点云媒体包括N个条目，或者封装为N个非时序点云媒体，该封装情况下，每个非时序点云媒体包括一个条目。

下面将针对第二非时序点云媒体中的字段进行说明，其中，第二非时序点云媒体是至少一个非时序点云媒体中包括多个GPCC区域的条目的任一个非时序点云媒体。

可选地，第二非时序点云媒体包括：

GPCC条目组盒子(GPCCItemGroupBox)。其中，GPCC条目组盒子用于关联多个GPCC区域的条目，如图4A和4B所示。

可选地，该GPCC条目组盒子包括：多个GPCC区域的条目的标识。

可选地，GPCC条目组盒子包括：第四标识(initial_item_ID)。其中，第四标识是多个GPCC区域的条目中，在视频播放设备初始呈现的条目的标识。

可选地，GPCC条目组盒子包括：第五标识(partial_item_flag)。若第五标识取值为第三数值，则表示多个GPCC区域的条目构成静态物体的完整GPCC帧。若第五标识取值为第四数值，则表示多个GPCC区域的条目构成静态物体的部分GPCC帧。

可选地，该第三数值可以是0，第四数值可以是1，但不限于此。

可选地，GPCC条目组盒子包括：多个GPCC区域构成的GPCC区域的位置信息。

示例性地，若多个GPCC区域是R1和R2两个区域，则GPCC条目组盒子包括R1+R2区域的位置信息。

下面将通过代码对上述GPCC条目组盒子中的各个字段进行说明：

GPCCItemGroupBox包含的条目为同属一个静态物体的条目，在呈现消费时存在关联关系的条目。该GPCCItemGroupBox中包含的所有条目可能构成一个完整的GPCC帧，也可能为一个GPCC帧的一部分。

initial_item_ID指示在一个条目组内，初始消费的条目的标识。

需要说明的是，该initial_item_ID仅在当前条目组为用户初次请求的条目组时有效，例如：同一个静态物体对应了两个点云媒体，分别为F1和F2，当用户第一次请求F1时，则F1内的条目组中的initial_item_ID有效，对于第二次请求的F2，其内部的initial_item_ID无效。

partial_item_flag取值为0时，表示GPCCItemGroupBox包含的所有条目及其关联的条目构成一个完整的GPCC帧，取值为1时，表示GPCCItemGroupBox包含的所有条目及其关联的条目仅构成部分GPCC帧。

为支持本申请提出的技术，还需扩展对应的信令消息，以MPD信令为例，扩展如下：

GPCC条目描述子用于描述GPCC条目相关的元素和属性，该描述子为一个SupplementalProperty元素。

其@schemeIdUri属性等于"urn:mpeg:mpegI:gpcc:2020:gpsr"。该描述子可以位于Adaptation Set层级或者Representation层级。

其中，Representation：DASH中，一个或多个媒体成分的组合，比如某种分辨率的视频文件可以看作一个Representation(描述)。

Adaptation Sets：DASH中，一个或多个视频流的集合，一个Adaptation Sets中可以包含多个Representation。

表1：GPCC条目描述子元素及属性

综上，在本申请中，视频制作设备可以对多个GPCC区域的条目进行灵活组合，以形成不同的非时序点云媒体，其中非时序点云媒体可以构成完整的GPCC帧，也可以构成部分GPCC帧。从而可以提高视频制作的灵活性。进一步地，当一个非时序点云媒体包括多个GPCC区域的条目时，视频制作设备还可以提高初始呈现的条目。

下面将通过下述实施例对前述图3对应的实施例进行举例说明：

假设视频制作设备获取到某静态物体的非时序点云数据，该非时序点云数据在视频制作设备端存在4个版本的点云媒体：对应全部非时序点云数据的点云媒体F0，对应部分非时序点云数据的点云媒体F1～F3，其中，F1～F3分别对应3D空间区域R1～R3。基于此，F0～F3的点云媒体封装内容如下：

F0：ObjectInfoProperty：object_ID＝10；

ItemSpatialInfoProperty：sub_region_contained＝1；tile_id_present＝1

inital_region_id＝1001；

R0：3d_region_id＝100，anchor＝(0,0,0)，region＝(200,200,200)

num_sub_regions＝3；

SR1：3d_region_id＝1001，anchor＝(0,0,0)，region＝(100,100,200)；

num_tiles＝1，tile_id[]＝(1)；

SR2：3d_region_id＝1002，anchor＝(100,0,0)，region＝(100,100,200)；

num_tiles＝1，tile_id[]＝(2)；

SR3：3d_region_id＝1003，anchor＝(0,100,0)，region＝(200,100,200)；

num_tiles＝2，tile_id[]＝(3,4)；

F1：ObjectInfoProperty：object_ID＝10；

ItemSpatialInfoProperty：sub_region_contained＝0；tile_id_present＝1；

inital_region_id＝0；

R1：3d_region_id＝101，anchor＝(0,0,0)，region＝(100,100,200)；

num_tiles＝1，tile_id[]＝(1)；

F2：ObjectInfoProperty：object_ID＝10；

ItemSpatialInfoProperty：sub_region_contained＝0；tile_id_present＝1

inital_region_id＝0；

R2：3d_region_id＝102，anchor＝(100,0,0)，region＝(100,100,200)；

num_tiles＝1，tile_id[]＝(2)；

F3：ObjectInfoProperty：object_ID＝10；

ItemSpatialInfoProperty：sub_region_contained＝0；tile_id_present＝1；inital_region_id＝0；

R3：3d_region_id＝103，anchor＝(0,100,0)，region＝(200,100,200)；

num_tiles＝2，tile_id[]＝(3,4)；

进一步地，视频制作设备将F0～F3的MPD信令发送给用户，其中的Object_ID、空间区域、子空间区域、tile标识信息与文件封装中相同，在此不再赘述。

由于用户U1网络条件好，数据传输时延低，所以可以请求F0；用户U2网络条件较差，数据传输时延较高，所以可以请求F1。

视频制作设备向用户U1对应的视频播放设备传输F0，向用户U2对应的视频播放设备传输F1。

用户U1对应的视频播放设备收到F0后，初始观看区域为SR1区域，对应tile ID为1。U1在解码消费时，可从整体码流中单独解码tile’1’直接消费呈现，而不需要解码整体文件后呈现，提升了解码效率，降低了渲染呈现所需要的时间。当U1继续消费，观看到SR2区域时，对应tile ID为2，则直接解码整体码流中tile’2’对应的部分进行呈现消费。

用户U2对应的视频播放设备收到F1后，解码F1进行消费，并根据用户下一步可能消费的区域，结合MPD文件中的信息，即Object_ID以及空间区域信息，提前请求F2或F3进行缓存。

也就是说，在视频制作设备向视频播放设备发送第一非时序点云媒体之后，视频播放设备还可以基于用户的消费需求和可能的消费区域等情况，再次向视频制作设备有目的性地请求同一静态物体的非时序点云媒体。

在一种可能的实现方式中，在S307：根据所述第一请求消息，向所述视频播放设备发送所述第一非时序点云媒体之后，所述方法还包括：

接收所述视频播放设备基于所述静态物体的标识所发送的第二请求消息，所述第二请求消息用于请求所述至少一个非时序点云媒体中的第三非时序点云媒体；根据所述第二请求消息，向所述视频播放设备发送所述第三非时序点云媒体。

由于视频播放设备通过前述获取的点云媒体中静态物体的标识，在需要再次获取该静态物体对应的其他点云媒体时，可以基于该静态物体的标识有针对性的分多次请求同一个静态物体的点云媒体。

假设视频制作设备获取到某静态物体的非时序点云数据，该非时序点云数据在视频制作设备端存在2个版本的点云媒体：F1与F2，F1中包含item1～item2，F2中包含item3～item4。

F1与F2的点云媒体封装内容如下：

F1：

item1：ObjectInfoProperty：object_ID＝10；item_ID＝101

ItemSpatialInfoProperty：sub_region_contained＝0；tile_id_present＝1

inital_region_id＝0；

R1：3d_region_id＝1001，anchor＝(0,0,0)，region＝(100,100,200)；

num_tiles＝1，tile_id[]＝(1)；

item2：ObjectInfoProperty：object_ID＝10；item_ID＝102

ItemSpatialInfoProperty：sub_region_contained＝0；tile_id_present＝1

inital_region_id＝0；

R2：3d_region_id＝1002，anchor＝(100,0,0)，region＝(100,100,200)；

num_tiles＝1，tile_id[]＝(2)；

GPCCItemGroupBox：

initial_item_ID＝101；partial_item_flag＝1；

R1+R2：3d_region_id＝0001，anchor＝(0,0,0)，region＝(200,100,200)；

F2：

item3：ObjectInfoProperty：object_ID＝10；item_ID＝103

ItemSpatialInfoProperty：sub_region_contained＝0；tile_id_present＝1

inital_region_id＝0；

R3：3d_region_id＝1003，anchor＝(0,100,0)，region＝(100,100,200)；

num_tiles＝1，tile_id[]＝(3)；

item4：ObjectInfoProperty：object_ID＝10；item_ID＝104

ItemSpatialInfoProperty：sub_region_contained＝0；tile_id_present＝1

inital_region_id＝0；

R4：3d_region_id＝1004，anchor＝(100,100,0)，region＝(100,100,200)；

num_tiles＝1，tile_id[]＝(4)；

GPCCItemGroupBox：

initial_item_ID＝103；partial_item_flag＝1；

R3+R4：3d_region_id＝0002，anchor＝(0,100,0)，region＝(200,100,200)；

视频制作设备将F1～F2的MPD信令发送给用户，其中的Object_ID、空间区域、tile ID信息与点云媒体封装中相同，在此不再赘述。

用户U1请求F1消费；用户U2请求F2消费。

视频制作设备分别向用户U1对应的视频播放设备传输F1，并向用户U2对应的视频播放设备传输F2。

U1对应的视频播放设备收到F1后，初始观看item1，item1的初始观看区域为item1整体观看空间，因此U1消费item1整体。由于F1中包含item1与item2，分别对应tile1和tile2，U1在消费item1时可以直接解码tile1对应的部分码流进行呈现。若U1继续消费，观看到item2区域时，对应tile ID为2，则直接解码整体码流中tile’2’对应的部分进行呈现消费。若U1继续消费，需观看item3对应的区域时，则根据MPD文件请求F2。收到F2后，直接根据用户观看的区域进行呈现消费，不再判断F2中的初始消费item信息和初始观看区域信息。

U2对应的视频播放设备收到F2后，初始观看item3，item3的初始观看区域为item3整体观看空间，因此U2消费item3整体。由于F2中包含item3与item4，分别对应tile3和tile4，U2在消费item3时可以直接解码tile3对应的部分码流进行呈现。

图5为本申请实施例提供的一种非时序点云媒体的处理装置500的示意图，该装置500包括：处理单元510和通信单元520。处理单元510用于：获取静态物体的非时序点云数据。通过GPCC编码方式对非时序点云数据进行处理，得到GPCC比特流。对GPCC比特流进行封装，生成至少一个GPCC区域的条目，所述GPCC区域的条目用于表示所述GPCC区域对应的三维3D空间区域的GPCC成分。对至少一个GPCC区域的条目进行封装，生成静态物体的至少一个非时序点云媒体，所述非时序点云媒体包括所述静态物体的标识。向视频播放设备发送至少一个非时序点云媒体的MPD信令。通信单元520用于：接收视频播放设备根据所述MPD信令发送的第一请求消息，所述第一请求消息用于请求所述至少一个非时序点云媒体中的第一非时序点云媒体。根据第一请求消息，向视频播放设备发送第一非时序点云媒体。

可选地，目标GPCC区域的条目包括：3D空间区域条目属性，3D空间区域条目属性包括：第一标识和第二标识。其中，目标GPCC区域为至少一个GPCC区域中的一个GPCC区域。第一标识用于标识目标GPCC区域对应的目标3D空间区域是否被划分为多个子空间区域。第二标识用于标识目标GPCC区域是否采用GPCC tile编码方式。

可选地，若目标GPCC区域对应的目标3D空间区域被划分为多个子空间区域，则3D空间区域条目属性还包括：多个子空间区域各自的信息和目标3D空间区域的信息。

可选地，针对多个子空间区域中的任一个子空间区域，子空间区域的信息包括以下至少一项：子空间区域的标识、子空间区域的位置信息、目标GPCC区域采用GPCC tile编码时，子空间区域中的tile标识。目标3D空间区域的信息包括以下至少一项：目标3D空间区域的标识、目标3D空间区域的位置信息、目标3D空间区域包括的子空间区域的数量。

可选地，若目标GPCC区域对应的目标3D空间区域被划分为多个子空间区域，则3D空间区域条目属性还包括：第三标识。当第三标识的取值为第一数值或者空时，表示目标GPCC区域对应的条目是视频播放设备初始呈现的条目时，针对目标3D空间区域和目标3D空间区域的子空间区域，在视频播放设备初始呈现的是目标3D空间区域。当第三标识的取值为第二数值时，表示目标GPCC区域对应的条目是视频播放设备初始呈现的条目时，针对目标3D空间区域和目标3D空间区域的子空间区域，在视频播放设备初始呈现的是目标3D空间区域中第二数值所对应的子空间区域。

可选地，若目标GPCC区域对应的目标3D空间区域未被划分为多个子空间区域，则3D空间区域条目属性还包括：目标3D空间区域的信息。

可选地，目标3D空间区域的信息包括以下至少一项：目标3D空间区域的标识、目标3D空间区域的位置信息、目标GPCC区域采用GPCC tile编码时，目标3D空间区域中的tile标识。

可选地，处理单元510具体用于：若至少一个GPCC区域的条目是1个，则将1个GPCC区域的条目封装为1个非时序点云媒体。若至少一个GPCC区域的条目是N个，则将N个GPCC区域的条目封装为M个非时序点云媒体。其中，N为大于1的整数，1≤M≤N，M为整数。

可选地，第二非时序点云媒体包括：GPCC条目组盒子。其中，第二非时序点云媒体是至少一个非时序点云媒体中包括多个GPCC区域的条目的任一个非时序点云媒体，GPCC条目组盒子用于关联多个GPCC区域的条目。

可选地，GPCC条目组盒子包括：第四标识。其中，第四标识是多个GPCC区域的条目中，在视频播放设备初始呈现的条目的标识。

可选地，GPCC条目组盒子包括：第五标识若第五标识取值为第三数值，则表示多个GPCC区域的条目构成静态物体的完整GPCC帧。若第五标识取值为第四数值，则表示多个GPCC区域的条目构成静态物体的部分GPCC帧。

可选地，通信单元520还用于：接收视频播放设备基于所述静态物体的标识所发送的第二请求消息，所述第二请求消息用于请求所述至少一个非时序点云媒体中的第三非时序点云媒体。根据第二请求消息，向视频播放设备发送第三非时序点云媒体。

应理解的是，装置实施例与方法实施例可以相互对应，类似的描述可以参照方法实施例。为避免重复，此处不再赘述。具体地，图5所示的装置500可以执行视频制作设备对应的方法实施例，并且装置500中的各个模块的前述和其它操作和/或功能分别为了实现视频制作设备对应的方法实施例，为了简洁，在此不再赘述。

上文中结合附图从功能模块的角度描述了本申请实施例的装置500。应理解，该功能模块可以通过硬件形式实现，也可以通过软件形式的指令实现，还可以通过硬件和软件模块组合实现。具体地，本申请实施例中的方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路和/或软件形式的指令完成，结合本申请实施例公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。可选地，软件模块可以位于随机存储器，闪存、只读存储器、可编程只读存储器、电可擦写可编程存储器、寄存器等本领域的成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法实施例中的步骤。

图6为本申请实施例提供的一种非时序点云媒体的处理装置600的示意图，该装置600包括：处理单元610和通信单元620。通信单元620用于：接收至少一个非时序点云媒体的MPD信令，所述非时序点云媒体包括所述静态物体的标识。根据所述MPD信令向视频制作设备发送第一请求消息，所述第一请求消息用于请求所述至少一个非时序点云媒体中的第一非时序点云媒体。从所述视频制作设备接收第一非时序点云媒体。处理单元610用于播放第一非时序点云媒体。其中，至少一个非时序点云媒体是对至少一个点云压缩GPCC区域的条目进行封装生成得到的，所述至少一个GPCC区域的条目是对GPCC比特流进行封装生成的，所述GPCC比特流是通过GPCC编码方式对静态物体的非时序点云数据进行处理得到的。针对至少一个GPCC区域的条目中的任一个GPCC区域的条目，GPCC区域的条目用于表示GPCC区域对应的3D空间区域的GPCC成分。

可选地，若至少一个GPCC区域的条目是1个，则1个GPCC区域的条目被封装为1个非时序点云媒体。若至少一个GPCC区域的条目是N个，则N个GPCC区域的条目被封装为M个非时序点云媒体。其中，N为大于1的整数，1≤M≤N，M为整数。

可选地，第二非时序点云媒体包括：GPCC条目组盒子。其中，第二非时序点云媒体是至少一个非时序点云媒体中包括多个GPCC区域的条目的任一个非时序点云媒体。GPCC条目组盒子用于关联多个GPCC区域的条目。

可选地，GPCC条目组盒子包括：第五标识。若第五标识取值为第三数值，则表示多个GPCC区域的条目构成静态物体的完整GPCC帧。若第五标识取值为第四数值，则表示多个GPCC区域的条目构成静态物体的部分GPCC帧。

可选地，通信单元620还用于根据MPD信令，向视频制作设备发送第二请求消息。接收第二非时序点云媒体。

可选地，处理单元610还用于播放第二非时序点云媒体。

应理解的是，装置实施例与方法实施例可以相互对应，类似的描述可以参照方法实施例。为避免重复，此处不再赘述。具体地，图6所示的装置600可以执行视频播放设备对应的方法实施例，并且装置600中的各个模块的前述和其它操作和/或功能分别为了实现视频播放设备对应的方法实施例，为了简洁，在此不再赘述。

上文中结合附图从功能模块的角度描述了本申请实施例的装置600。应理解，该功能模块可以通过硬件形式实现，也可以通过软件形式的指令实现，还可以通过硬件和软件模块组合实现。具体地，本申请实施例中的方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路和/或软件形式的指令完成，结合本申请实施例公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。可选地，软件模块可以位于随机存储器，闪存、只读存储器、可编程只读存储器、电可擦写可编程存储器、寄存器等本领域的成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法实施例中的步骤。

实施例8

图7是本申请实施例提供的视频制作设备700的示意性框图。

如图7所示，该视频制作设备700可包括：

存储器710和处理器720，该存储器710用于存储计算机程序，并将该程序代码传输给该处理器720。换言之，该处理器720可以从存储器710中调用并运行计算机程序，以实现本申请实施例中的方法。

例如，该处理器720可用于根据该计算机程序中的指令执行上述方法实施例。

在本申请的一些实施例中，该处理器720可以包括但不限于：

通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等等。

在本申请的一些实施例中，该存储器710包括但不限于：

易失性存储器和/或非易失性存储器。其中，非易失性存储器可以是只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(Static RAM，SRAM)、动态随机存取存储器(Dynamic RAM，DRAM)、同步动态随机存取存储器(Synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM，DDR SDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(synch link DRAM，SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM，DR RAM)。

在本申请的一些实施例中，该计算机程序可以被分割成一个或多个模块，该一个或者多个模块被存储在该存储器710中，并由该处理器720执行，以完成本申请提供的方法。该一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述该计算机程序在该视频制作设备中的执行过程。

如图7所示，该视频制作设备还可包括：

收发器730，该收发器730可连接至该处理器720或存储器710。

其中，处理器720可以控制该收发器730与其他设备进行通信，具体地，可以向其他设备发送信息或数据，或接收其他设备发送的信息或数据。收发器730可以包括发射机和接收机。收发器730还可以进一步包括天线，天线的数量可以为一个或多个。

应当理解，该视频制作设备中的各个组件通过总线系统相连，其中，总线系统除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。

实施例9

图8是本申请实施例提供的视频播放设备800的示意性框图。

如图8所示，该视频播放设备800可包括：

存储器810和处理器820，该存储器810用于存储计算机程序，并将该程序代码传输给该处理器820。换言之，该处理器820可以从存储器810中调用并运行计算机程序，以实现本申请实施例中的方法。

例如，该处理器820可用于根据该计算机程序中的指令执行上述方法实施例。

在本申请的一些实施例中，该处理器820可以包括但不限于：

通用处理器、DSP、ASIC、FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等等。

在本申请的一些实施例中，该存储器810包括但不限于：

易失性存储器和/或非易失性存储器。其中，非易失性存储器可以是ROM、PROM、EPROM、EEPROM或闪存。易失性存储器可以是RAM，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如SRAM、DRAM、SDRAM、DDR SDRAM、ESDRAM、SLDRAM和DR RAM。

在本申请的一些实施例中，该计算机程序可以被分割成一个或多个模块，该一个或者多个模块被存储在该存储器810中，并由该处理器820执行，以完成本申请提供的方法。该一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述该计算机程序在该视频播放设备中的执行过程。

如图8所示，该视频播放设备还可包括：

收发器830，该收发器830可连接至该处理器820或存储器810。

其中，处理器820可以控制该收发器830与其他设备进行通信，具体地，可以向其他设备发送信息或数据，或接收其他设备发送的信息或数据。收发器830可以包括发射机和接收机。收发器830还可以进一步包括天线，天线的数量可以为一个或多个。

应当理解，该视频播放设备中的各个组件通过总线系统相连，其中，总线系统除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。

本申请还提供了一种计算机存储介质，其上存储有计算机程序，该计算机程序被计算机执行时使得该计算机能够执行上述方法实施例的方法。或者说，本申请实施例还提供一种包含指令的计算机程序产品，该指令被计算机执行时使得计算机执行上述方法实施例的方法。

当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时，全部或部分地产生按照本申请实施例该的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line，DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如，软盘、硬盘、磁带)、光介质(例如数字视频光盘(digital video disc，DVD))、或者半导体介质(例如固态硬盘(solid state disk，SSD))等。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的模块及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，该模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。

作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。例如，在本申请各个实施例中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。

以上该，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以该权利要求的保护范围为准。

Claims

一种非时序点云媒体的处理方法，所述方法由视频制作设备执行，所述方法包括：

获取静态物体的非时序点云数据；

通过基于几何模型的点云压缩GPCC编码方式对所述非时序点云数据进行处理，得到GPCC比特流；

对所述GPCC比特流进行封装，生成至少一个GPCC区域的条目，所述GPCC区域的条目用于表示所述GPCC区域对应的三维3D空间区域的GPCC成分；

对所述至少一个GPCC区域的条目进行封装，生成所述静态物体的至少一个非时序点云媒体，所述非时序点云媒体包括所述静态物体的标识；

向视频播放设备发送所述至少一个非时序点云媒体的媒体演示描述MPD信令；

接收所述视频播放设备根据所述MPD信令发送的第一请求消息，所述第一请求消息用于请求所述至少一个非时序点云媒体中的第一非时序点云媒体；

根据所述第一请求消息，向所述视频播放设备发送所述第一非时序点云媒体。
根据权利要求1所述的方法，目标GPCC区域的条目包括：3D空间区域条目属性，所述3D空间区域条目属性包括：第一标识和第二标识；

其中，所述目标GPCC区域为所述至少一个GPCC区域中的一个GPCC区域；所述第一标识用于标识所述目标GPCC区域对应的目标3D空间区域是否被划分为多个子空间区域；所述第二标识用于标识所述目标GPCC区域是否采用GPCC tile编码方式。
根据权利要求2所述的方法，若所述目标GPCC区域对应的目标3D空间区域被划分为多个子空间区域，则所述3D空间区域条目属性还包括：所述多个子空间区域各自的信息和所述目标3D空间区域的信息。
根据权利要求3所述的方法，针对所述多个子空间区域中的任一个子空间区域，所述子空间区域的信息包括以下至少一项：所述子空间区域的标识、所述子空间区域的位置信息、所述目标GPCC区域采用GPCC tile编码时，所述子空间区域中的tile标识；

所述目标3D空间区域的信息包括以下至少一项：所述目标3D空间区域的标识、所述目标3D空间区域的位置信息、所述目标3D空间区域包括的子空间区域的数量。
根据权利要求2-4任一项所述的方法，若所述目标GPCC区域对应的目标3D空间区域被划分为多个子空间区域，则所述3D空间区域条目属性还包括：第三标识；

当所述第三标识的取值为第一数值或者空时，表示所述目标GPCC区域对应的条目是所述视频播放设备初始呈现的条目时，针对所述目标3D空间区域和所述目标3D空间区域的子空间区域，在所述视频播放设备初始呈现的是所述目标3D空间区域；

当所述第三标识的取值为第二数值时，表示所述目标GPCC区域对应的条目是所述视频播放设备初始呈现的条目时，针对所述目标3D空间区域和所述目标3D空间区域的子空间区域，在所述视频播放设备初始呈现的是所述目标3D空间区域中所述第二数值所对应的子空间区域。
根据权利要求2所述的方法，若所述目标GPCC区域对应的目标3D空间区域未被划分为多个子空间区域，则所述3D空间区域条目属性还包括：所述目标3D空间区域的信息。
根据权利要求6所述的方法，所述目标3D空间区域的信息包括以下至少一项：所述目标3D空间区域的标识、所述目标3D空间区域的位置信息、所述目标GPCC区域采用GPCC tile编码时，所述目标3D空间区域中的tile标识。
根据权利要求1-4任一项所述的方法，所述对所述至少一个GPCC区域的条目进行封装，生成所述静态物体的至少一个非时序点云媒体，包括：

若所述至少一个GPCC区域的条目是1个，则将1个GPCC区域的条目封装为1个非时序点云媒体；

若所述至少一个GPCC区域的条目是N个，则将N个GPCC区域的条目封装为M个非时序点云媒体；

其中，N为大于1的整数，1≤M≤N，M为整数。
根据权利要求1-4任一项所述的方法，第二非时序点云媒体包括：GPCC条目组盒子；

其中，所述第二非时序点云媒体是所述至少一个非时序点云媒体中包括多个GPCC区域的条目的任一个非时序点云媒体，所述GPCC条目组盒子用于关联所述多个GPCC区域的条目。
根据权利要求9所述的方法，所述GPCC条目组盒子包括：第四标识；

其中，所述第四标识是所述多个GPCC区域的条目中，在所述视频播放设备初始呈现的条目的标识。
根据权利要求9所述的方法，所述GPCC条目组盒子包括：第五标识；

若所述第五标识取值为第三数值，则表示所述多个GPCC区域的条目构成所述静态物体的完整GPCC帧；

若所述第五标识取值为第四数值，则表示所述多个GPCC区域的条目构成所述静态物体的部分GPCC帧。
根据权利要求9所述的方法，所述GPCC条目组盒子包括：所述多个GPCC区域构成的GPCC区域的位置信息。
根据权利要求1-4任一项所述的方法，在所述根据所述第一请求消息，向所述视频播放设备发送所述第一非时序点云媒体之后，所述方法还包括：

接收所述视频播放设备基于所述静态物体的标识所发送的第二请求消息，所述第二请求消息用于请求所述至少一个非时序点云媒体中的第三非时序点云媒体；

根据所述第二请求消息，向所述视频播放设备发送所述第三非时序点云媒体。
一种非时序点云媒体的处理方法，所述方法由视频播放设备执行，所述方法包括：

接收至少一个非时序点云媒体的MPD信令，所述非时序点云媒体包括所述静态物体的标识；

根据所述MPD信令向视频制作设备发送第一请求消息，所述第一请求消息用于请求所述至少一个非时序点云媒体中的第一非时序点云媒体；

从所述视频制作设备接收所述第一非时序点云媒体；

播放所述第一非时序点云媒体；

其中，所述至少一个非时序点云媒体是对至少一个点云压缩GPCC区域的条目进行封装生成得到的，所述至少一个GPCC区域的条目是对GPCC比特流进行封装生成的，所述GPCC比特流是通过GPCC编码方式对静态物体的非时序点云数据进行处理得到的；

针对所述至少一个GPCC区域的条目中的任一个GPCC区域的条目，所述GPCC区域的条目用于表示所述GPCC区域对应的3D空间区域的GPCC成分。
根据权利要求14所述的方法，目标GPCC区域的条目包括：3D空间区域条目属性，所述3D空间区域条目属性包括：第一标识和第二标识；

其中，所述目标GPCC区域为所述至少一个GPCC区域中的一个GPCC区域；所述第一标识用于标识所述目标GPCC区域对应的目标3D空间区域是否被划分为多个子空间区域；所述第二标识用于标识所述目标GPCC区域是否采用GPCC tile编码方式。
根据权利要求15所述的方法，若所述目标GPCC区域对应的目标3D空间区域被划分为多个子空间区域，则所述3D空间区域条目属性还包括：所述多个子空间区域各自的信息和所述目标3D空间区域的信息。
根据权利要求16所述的方法，针对所述多个子空间区域中的任一个子空间区域，所述子空间区域的信息包括以下至少一项：所述子空间区域的标识、所述子空间区域的位置信息、所述目标GPCC区域采用GPCC tile编码时，所述子空间区域中的tile标识；

所述目标3D空间区域的信息包括以下至少一项：所述目标3D空间区域的标识、所述目标3D空间区域的位置信息、所述目标3D空间区域包括的子空间区域的数量。
根据权利要求15-17任一项所述的方法，若所述目标GPCC区域对应的目标3D空间区域被划分为多个子空间区域，则所述3D空间区域条目属性还包括：第三标识；

当所述第三标识的取值为第一数值或者空时，表示所述目标GPCC区域对应的条目是所述视频播放设备初始呈现的条目时，针对所述目标3D空间区域和所述目标3D空间区域的子空间区域，在所述视频播放设备初始呈现的是所述目标3D空间区域；

当所述第三标识的取值为第二数值时，表示所述目标GPCC区域对应的条目是所述视频播放设备初始呈现的条目时，针对所述目标3D空间区域和所述目标3D空间区域的子空间区域，在所述视频播放设备初始呈现的是所述目标3D空间区域中所述第二数值所对应的子空间区域。
根据权利要求15所述的方法，若所述目标GPCC区域对应的目标3D空间区域未被划分为多个子空间区域，则所述3D空间区域条目属性还包括：所述目标3D空间区域的信息。
根据权利要求19所述的方法，所述目标3D空间区域的信息包括以下至少一项：所述目标3D空间区域的标识、所述目标3D空间区域的位置信息、所述目标GPCC区域采用GPCC tile编码时，所述目标3D空间区域中的tile标识。
根据权利要求14-17任一项所述的方法，若所述至少一个GPCC区域的条目是1个，则1个GPCC区域的条目被封装为1个非时序点云媒体；

若所述至少一个GPCC区域的条目是N个，则N个GPCC区域的条目被封装为M个非时序点云媒体；

其中，N为大于1的整数，1≤M≤N，M为整数。
根据权利要求14-17任一项所述的方法，第二非时序点云媒体包括：GPCC条目组盒子；

其中，所述第二非时序点云媒体是所述至少一个非时序点云媒体中包括多个GPCC区域的条目的任一个非时序点云媒体；所述GPCC条目组盒子用于关联所述多个GPCC区域的条目。
根据权利要求22所述的方法，所述GPCC条目组盒子包括：第四标识；

其中，所述第四标识是所述多个GPCC区域的条目中，在所述视频播放设备初始呈现的条目的标识。
根据权利要求22所述的方法，所述GPCC条目组盒子包括：第五标识；

若所述第五标识取值为第三数值，则表示所述多个GPCC区域的条目构成所述静态物体的完整GPCC帧；

若所述第五标识取值为第四数值，则表示所述多个GPCC区域的条目构成所述静态物体的部分GPCC帧。
根据权利要求22所述的方法，所述GPCC条目组盒子包括：所述多个GPCC区域构成的GPCC区域的位置信息。
根据权利要求14-17任一项所述的方法，在所述从所述视频制作设备接收所述第一非时序点云媒体之后，所述方法还包括：

根据所述MPD信令，基于所述静态物体的标识向视频制作设备发送第二请求消息，所述第二请求消息用于请求所述至少一个非时序点云媒体中的第三非时序点云媒体；

从所述视频制作设备接收所述第三非时序点云媒体；

播放所述第三非时序点云媒体。
一种非时序点云媒体的处理装置，包括：处理单元和通信单元；

所述处理单元用于：

获取静态物体的非时序点云数据；

通过GPCC编码方式对所述非时序点云数据进行处理，得到GPCC比特流；

对所述GPCC比特流进行封装，生成至少一个GPCC区域的条目，所述GPCC区域的条目用于表示所述GPCC区域对应的三维3D空间区域的GPCC成分；

对所述至少一个GPCC区域的条目进行封装，生成所述静态物体的至少一个非时序点云媒体，所述非时序点云媒体包括所述静态物体的标识；

向视频播放设备发送所述至少一个非时序点云媒体的MPD信令；

所述通信单元用于：

接收所述视频播放设备根据所述MPD信令发送的第一请求消息，所述第一请求消息用于请求所述至少一个非时序点云媒体中的第一非时序点云媒体；

根据所述第一请求消息，向所述视频播放设备发送所述第一非时序点云媒体。
一种非时序点云媒体的处理装置，包括：处理单元和通信单元；

所述通信单元用于：

接收至少一个非时序点云媒体的MPD信令，所述非时序点云媒体包括所述静态物体的标识；

根据所述MPD信令向视频制作设备发送第一请求消息，所述第一请求消息用于请求所述至少一个非时序点云媒体中的第一非时序点云媒体；

从所述视频制作设备接收所述第一非时序点云媒体；

所述处理单元用于播放所述第一非时序点云媒体；

其中，所述至少一个非时序点云媒体是对至少一个点云压缩GPCC区域的条目进行封装生成得到的，所述至少一个GPCC区域的条目是对GPCC比特流进行封装生成的，所述GPCC比特流是通过GPCC编码方式对静态物体的非时序点云数据进行处理得到的；

针对所述至少一个GPCC区域的条目中的任一个GPCC区域的条目，所述GPCC区域的条目用于表示所述GPCC区域对应的3D空间区域的GPCC成分。
一种视频制作设备，包括：

处理器和存储器，所述存储器用于存储计算机程序，所述处理器用于调用并运行所述存储器中存储的计算机程序，以执行权利要求1至13中任一项所述的方法。
一种视频播放设备，包括：

处理器和存储器，所述存储器用于存储计算机程序，所述处理器用于调用并运行所述存储器中存储的计算机程序，以执行权利要求14至26中任一项所述的方法。
一种计算机可读存储介质，用于存储计算机程序，所述计算机程序使得计算机执行如权利要求1至13中任一项所述的方法，或者执行如权利要求14至26中任一项所述的方法。
一种包括指令的计算机程序产品，当其在计算机上运行时，使得所述计算机执行权利要求1至13中任一项所述的方法，或者执行如权利要求14至26中任一项所述的方法。