CN113632486A - 处理点云的中间点 - Google Patents

处理点云的中间点 Download PDF

Info

Publication number
CN113632486A
CN113632486A CN202080022209.1A CN202080022209A CN113632486A CN 113632486 A CN113632486 A CN 113632486A CN 202080022209 A CN202080022209 A CN 202080022209A CN 113632486 A CN113632486 A CN 113632486A
Authority
CN
China
Prior art keywords
texture
sample
patch
point cloud
syntax element
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080022209.1A
Other languages
English (en)
Inventor
J·C·切维特
Y·奥利维尔
J·拉奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
InterDigital VC Holdings Inc
Original Assignee
InterDigital VC Holdings Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by InterDigital VC Holdings Inc filed Critical InterDigital VC Holdings Inc
Publication of CN113632486A publication Critical patent/CN113632486A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10028Range image; Depth image; 3D point clouds

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)

Abstract

至少一个实施例涉及用信号发送表示至少一个中间3D样本的纹理值的至少一个纹理补片,纹理补片是表示沿着投影线正交投影到投影平面上的点云的3D样本的纹理值的一组2D样本,并且所述至少一个中间3D样本是所述点云的3D样本,该3D样本具有大于所述点云的较近3D样本且小于所述点云的较远3D样本的深度值,所述至少一个中间3D样本以及所述较近和较远3D样本沿着相同投影线被投影。

Description

处理点云的中间点
技术领域
本发明的至少一个实施例主要涉及点云的处理。
背景技术
本部分旨在向读者介绍可能与下面描述和/或要求保护的本发明的实施例中的至少一个的各方面相关的技术的各方面。相信该讨论有助于向读者提供背景信息,以便于更好地理解至少一个实施例的各个方面。
点云可以用于各种目的,诸如文化遗产/建筑,其中,以3D扫描像雕像或建筑的对象,以便共享该对象的空间配置,而不发送或访问它。而且,这是一种确保在对象可能被破坏(例如,地震引起的寺庙倒塌)的情况下保留该对象的知识的方式。这种点云通常是静态的、彩色的和巨大的。
另一使用情况是在地形图和制图中,其中使用3D表示来允许地图不限于平面且可包含起伏。Google Maps现在是3D地图的良好示例,但是使用网格而不是点云。然而,点云可以是用于3D地图的合适的数据格式,并且这样的点云通常是静态的、彩色的和巨大的。
汽车工业和自动驾驶汽车也是其中可以使用点云的领域。自动驾驶汽车应当能够“探测”它们的环境以基于它们的紧邻车辆的现实而做出良好的驾驶决策。像LIDAR(光检测和测距)的典型传感器产生决策引擎所使用的动态点云。这些点云不旨在被人类查看,并且它们通常是小的,不一定是有色的,并且是动态的,具有高频率捕获。这些点云可以具有其他属性,例如LIDAR提供的反射率,因为该属性提供关于感测对象的材料的良好信息,并且可以帮助做出决定。
虚拟现实和沉浸式世界近来已经成为热点主题,并且被很多人预见为2D平面视频的未来。基本思想是使观看者沉浸在围绕观看者的环境中,这与观看者仅能够观看者前方的虚拟世界的标准TV形成对比。根据观看者在环境中的自由度,在沉浸度中存在若干等级。点云是用于分发虚拟现实(VR)世界的良好格式候选。
在许多应用中,重要的是能够通过仅消耗合理量的比特率(或用于存储应用的存储空间)同时维持可接受的(或优选地非常好的)体验质量而将动态点云分发给最终用户(或将它们存储在服务器中)。为了使多沉浸世界的分发链实用化,这些动态点云的高效压缩是关键点。
考虑到前述内容,设计了至少一个实施例。
发明内容
以下呈现了本发明的实施例中的至少一者的简化概述,以便提供对本发明的一些方面的基本理解。本概述不是对实施例的广泛综述。其不旨在标识实施例的关键或重要元素。以下发明内容仅以简化形式呈现了本发明的实施例中的至少一者的一些方面,作为在本文档中的其它地方提供的更详细描述的序言。
根据至少一个实施例的一般方面,提供了一种方法,包括:用信号发送表示至少一个中间3D样本的纹理值的至少一个纹理补片(patch),该纹理补片是表示沿着投影线正交投影到投影平面上的点云的3D样本的纹理值的一组2D样本,并且所述至少一个中间3D样本是所述点云中具有大于所述点云的较近3D样本且小于所述点云的较远3D样本的深度值的3D样本,所述至少一个中间3D样本和所述较近及较远3D样本沿着相同投影线被投影。
根据实施例,用信号发送表示至少一个中间3D样本的纹理值的纹理补片包括:
-在所述比特流中添加至少一个语法元素,所述至少一个语法元素表示在2D网格中定义的所述纹理补片的2D位置和所述纹理补片的大小;
-发送所述比特流;以及
-从所述比特流中取回所述至少一个语法元素,并从所述至少一个取回到的语法元素中提取在2D网格中定义的所述纹理补片的2D位置和所述纹理补片的大小。
根据实施例,所述至少一个语法元素还可以用信号发送所述2D网格的补片的2D样本的数量。
根据实施例,所述至少一个语法元素还可以用信号发送所述2D网格中的纹理补片的数目和用于确定纹理补片的起始位置的偏移。
根据实施例,所述至少一个语法元素还可用信号发送纹理补片的索引。
根据实施例,语法元素还可以用信号发送在所述比特流中添加的所述至少一个语法元素在表示所述点云帧的整个语法的不同级别被用信号发送。
根据至少一个实施例的另一个一般方面,提供了一种方法,包括:分析点云帧到投影平面上的正交投影以导出至少一个中间3D样本的纹理值;将所述至少一个纹理值映射到至少一个纹理补片;将所述至少一个纹理补片打包成纹理图像;以及根据上述方法在比特流中用信号发送所述至少一个纹理补片。
根据至少一个实施例的另一个一般方面,提供了一种方法,包括:从根据上述用信号发送方法在比特流中用信号发送的至少一个语法元素,导出至少一个纹理补片;从所述至少一个纹理补片导出至少一个纹理值;以及将所述至少一个纹理值指派给至少一个中间3D样本。
至少一个实施例中的一个或多个还提供了一种设备、计算机程序产品、非瞬态计算机可读介质和信号。
根据结合附图进行的以下实例描述,本发明实施例中的至少一者的特定性质以及本发明实施例中的所述至少一者的其它目的、优点、特征和用途将变得显而易见。
附图说明
在附图中,示出了若干实施例的示例。附图示出:
图1示出了根据至少一个本发明实施例的基于两层的点云编码结构的示例的示意性框图;
图2示出了根据至少一个本发明实施例的基于两层的点云解码结构的示例的示意性框图;
图3示出了根据至少一个本发明实施例的基于图像的点云编码器的示例的示意性框图;
图3a示出了包括2个补片及其2D边界框的画布的示例;
图3b示出了位于沿投影线的两个3D样本之间的两个中间3D样本的示例;
图4示出了根据至少一个本发明实施例的基于图像的点云解码器的示例的示意性框图;
图5示意性地示出了根据至少一个当前实施例的表示基本层BL的比特流的语法的示例;
图6示出了其中实现了各个方面和实施例的系统的示例的示意性框图;
图7示出了根据本发明的至少一个实施例的用于用信号发送至少一个EOM纹理补片的方法的示例;
图8a-d示出了根据步骤710的至少一个实施例的语法元素的示例;
图9a-c示出了根据步骤710的至少一个实施例的示例画布;
图10示出了根据步骤710的实施例的语法元素的示例;
图11示出了根据步骤710的所述实施例的所述变型的语法元素的示例;
图12示出了根据步骤710的实施例的变型的语法元素的示例;
图13示出了根据至少一个当前实施例的定义补片模式的表的示例;
图14示出了根据步骤710的实施例的变型的语法元素的示例;
图15示出了根据步骤710的实施例的语法元素的示例;
图16示出了根据至少一个本实施例的用于对中间3D样本的纹理值进行编码的方法的框图;
图17示出了根据至少一个本实施例的用于对中间3D样本的纹理值进行解码的方法的框图;以及
图18示出了按照块的光栅扫描顺序的示例。
具体实施方式
在下文中参考附图更全面地描述至少一个本发明实施例,其中示出了至少一个本发明实施例的示例。然而,实施例可以以许多替代形式来体现,并且不应被解释为限于本文阐述的示例。因此,应当理解,不旨在将实施例限于所公开的特定形式。相反,本公开旨在覆盖落入本申请的精神和范围内的所有修改、等同物和替代物。
当附图被呈现为流程图时,应当理解,它还提供了对应装置的框图。类似地,当附图被呈现为框图时,应当理解,它还提供了对应的方法/过程的流程图。
图中相似或相同的元件用相同的参考数字表示。
一些图表示了在V-PCC中广泛使用的语法表,用于定义符合V-PCC的比特流的结构。在这些语法表中,术语'…'表示相对于在V-PCC中给出的原始定义的语法的未改变部分,并且在图中被去除以便于阅读。图中的粗体项指示该项的值是通过解析比特流获得的。语法表的右列指示用于编码语法元素的数据的比特数。例如,u(4)表示4比特用于编码数据,u(8)表示8比特,ae(v)表示使用例如CABAC(Contex-Adaptive-Binary-ArithmeticCoding,上下文自适应二进制算术编码)对整数值v进行算术编码。
下面描述和预期的方面可以以许多不同的形式来实现。图1-18提供了一些实施例,但是可以设想其它实施例,并且图1-18的讨论不限制实现的广度。
至少一个方面一般涉及点云编码和解码,并且至少一个其它方面一般涉及传送所生成或编码的比特流。
更准确地说,本文描述的各种方法和其它方面可用于修改模块,例如,图3的模块3100、3200、3400和3700可经修改以实施图16的方法。模块4400和4600也可经修改以实施图17的方法。
此外,本发明的方面不限于MPEG标准(例如,涉及点云压缩的MPEG-I部分5),并且可以应用于例如其他标准和建议(无论是预先存在的还是将来开发的)以及任何这样的标准和建议的扩展(包括MPEG-I部分5)。除非另外指出或在技术上排除,否则本申请中描述的方面可以单独或组合使用。
在下文中,图像数据指的是数据,例如特定图像/视频格式的一个或几个2D样本阵列。特定图像/视频格式可以指定与图像(或视频)的像素值有关的信息。特定图像/视频格式还可以指定可以由显示器和/或任何其他装置用来例如可视化和/或解码图像(或视频)的信息。图像通常包括第一分量,其形状为第一2D样本阵列,通常表示该图像的亮度(或luma)。图像还可以包括第二分量和第三分量,其形状为其它2D样本阵列,通常表示图像的色度(或chroma)。一些实施例使用一组2D颜色样本阵列来表示相同的信息,诸如传统的三色RGB表示。
在一个或多个实施例中,像素值由具有C个值的向量来表示,其中C是分量的数目。向量的每一值通常用可定义像素值的动态范围的若干个比特来表示。
图像块是指属于图像的一组像素。图像块(或图像块数据)的像素值指的是属于该图像块的像素值。图像块可以具有任意形状,尽管矩形是常见的。
点云可以由3D体积空间内的3D样本的数据集来表示,这些3D样本具有唯一的坐标并且还可以具有一个或多个属性。
该数据集的3D样本可以由其空间位置(3D空间中的X、Y和Z坐标)来定义,并且可能由一个或多个相关联的属性来定义,所述属性诸如颜色(在例如RGB或YUV颜色空间中表示的颜色)、透明度、反射率、两分量法向量或表示该样本的特征的任何特征。例如,3D样本可以由6个分量(X,Y,Z,R,G,B)或等效地(X,Y,Z,y,U,V)来定义,其中(X,Y,Z)定义3D空间中的点的坐标,并且(R,G,B)或(y,U,V)定义该3D样本的颜色。相同类型的属性可以多次出现。例如,多个颜色属性可以提供来自不同视点的颜色信息。
点云可以是静态的或动态的,这取决于该云是否随时间变化。静态点云或动态点云的实例通常被表示为点云帧。应当注意,在动态点云的情况下,点数通常不是恒定的,而是相反,通常随时间变化。更一般地,如果任何事物(例如,点的数量、一个或多个点的位置、或任何点的任何属性)随时间变化,,则该点云可被认为是动态的。
作为示例,2D样本可以由6个分量(u,v,Z,R,G,B)或等效地(u,v,Z,y,U,V)来定义。(u,v)定义了投影平面的2D空间中的2D样本的坐标。Z是投影到该投影平面上的3D样本的深度值。(R,G,B)或(y,U,V)定义了该3D样本的颜色。
图1示出了根据本发明的至少一个实施例的基于两层的点云编码结构1000的示例的示意性框图。
该基于两层的点云编码结构1000可提供表示输入点云帧IPCF的比特流B。可能地,所述输入点云帧IPCF表示动态点云的帧。然后,所述动态点云的帧可以独立于另一帧由所述基于两层的点云编码结构1000编码。
基本上,所述基于两层的点云编码结构1000可提供将比特流B结构化为基本层BL和增强层EL的能力。所述基本层BL可以提供输入点云帧IPCF的有损表示,并且所述增强层EL可以通过对所述基本层BL未表示的孤立点进行编码来提供更高质量(可能无损)的表示。
所述基本层BL可以由如图3中所示的基于图像的编码器3000提供。所述基于图像的编码器3000可以提供表示所述输入点云帧IPCF的3D样本的几何结构/属性的几何结构/纹理图像。它可以允许丢弃孤立的3D样本。所述基本层BL可以由如图4中所示的基于图像的解码器4000解码,其可以提供中间重构点云帧IRPCF。
然后,回到图1中的基于两层的点云编码1000,比较器COMP可以将输入点云帧IPCF的3D样本与中间重构点云帧IRPCF的3D样本进行比较,以便检测/定位丢失/孤立的3D样本。接下来,编码器ENC可以对丢失的3D样本进行编码,并且可以提供增强层EL。最后,基本层BL和增强层EL可由多路复用器MUX一起多路复用以产生所述比特流B。
根据实施例,所述编码器ENC可以包括检测器,该检测器可以检测中间重构点云帧IRPCF的3D参考样本R并将其与丢失的3D样本M相关联。
举例来说,与丢失的3D样本M相关联的3D参考样本R可根据给定度量而为M的最近相邻者。
根据实施例,所述编码器ENC然后可以将所丢失的3D样本M的空间位置及其属性编码为根据所述3D参考样本R的空间位置和属性确定的差异。
在一种变型中,这些差异可以被单独编码。
例如,对于丢失的3D样本M,其具有空间坐标x(M)、y(M)和z(M),则x坐标位置差Dx(M)、y坐标位置差Dy(M)、z坐标位置差Dz(M)、R属性分量差Dr(M)、G属性分量差Dg(M)和B属性分量差Db(M)可以如下计算:
Dx(M)=x(M)-x(R),
其中x(M)是图3提供的几何结构图像中的3D样本M和相应R的x坐标,
Dy(M)=y(M)-y(R)
其中y(M)是图3提供的几何结构图像中的3D样本M和相应R的y坐标,
Dz(M)=z(M)-z(R)
其中z(M)是图3提供的几何结构图像中的3D样本M和相应R的z坐标,
Dr(M)=R(M)-R(R).
其中R(M)、R(R)分别是所述3D样本M和相应R的颜色属性的r颜色分量,
Dg(M)=G(M)-G(R).
其中G(M)、G(R)分别是所述3D样本M和相应R的颜色属性的g颜色分量,
Db(M)=B(M)-B(R).
其中B(M)、B(R)分别是所述3D样本M和相应R的颜色属性的b颜色分量。
图2示出了根据至少一个本发明实施例的基于两层的点云解码结构2000的示例的示意性框图。
所述基于两层的点云解码结构2000的行为取决于其能力。
具有有限能力的基于两层的点云解码结构2000可通过使用解复用器DMUX从比特流B仅访问基本层BL,然后可通过由如图4所示的点云解码器4000对基本层BL进行解码来提供所述输入点云帧IPCF的忠实(但有损)版本IRPCF。
具有全能力的基于两层的点云解码结构2000可通过使用解复用器DMUX从比特流B访问基本层BL和增强层EL。如图4所示,点云解码器4000可以根据基本层BL,确定中间重构点云帧IRPCF。解码器DEC可以从增强层EL确定互补点云帧CPCF。然后,组合器COM可以将中间重构点云帧IRPCF和互补点云帧CPCF组合在一起,以因此提供输入点云帧IPCF的更高质量(可能无损)表示(重构)CRPCF。
图3示出了根据至少一个本实施例的基于图像的点云编码器3000的示例的示意性框图。
基于图像的点云编码器3000利用现有视频编解码器来压缩动态点云的几何结构和纹理(属性)信息。这是通过将所述点云数据基本上转换成一组不同的视频序列来实现的。
在特定实施例中,可以使用现有的视频编解码器来生成和压缩两个视频,其中一个用于捕获点云数据的几何结构信息,另一个用于捕获纹理信息。现有视频编解码器的一个示例是HEVC主简档编码器/解码器(ITU(02/2018)的ITU-T H.265电信标准化部门,H系列:视听和多媒体系统,视听服务基础设施-运动视频的编码,高效视频编码,推荐ITU-TH.265)。
用于解释所述两个视频的附加元数据通常也被分别生成和压缩。这样的附加元数据包括例如占用图OM和/或辅助补片信息PI。
然后,可以将所生成的视频比特流和元数据复用在一起,以生成组合比特流。
应当注意,所述元数据通常表示少量的总体信息。大量信息在视频比特流中。
这种点云编码/解码过程的一个例子由测试模型类别2算法(也称为V-PCC)给出,该算法实现了ISO/IEC JTC1/SC29/WG11MPEG2019/w18180(2019年1月,Mareshkak)中定义的MPEG草案标准。
在步骤3100中,模块PGM可以通过使用提供最佳压缩的策略而将表示输入点云帧IPCF的数据集的3D样本分解成投影平面上的2D样本,从而生成至少一个补片。
补片可以被定义为一组2D样本。
例如,在V-PCC中,首先如Hoppe等人(Hugues Hoppe,Tony DeRose,Tom Duchamp,John McDonald,Werner Stuetzle.Surface reconstruction from unorganized points(来自未组织的点的表面重构).ACM SIGGRAPH 1992Proceedings,71-78)所述,估计每个3D样本处的法线。接下来,通过将每个3D样本与包含输入点云帧IPCF的3D样本的3D边界框的六个定向平面之一相关联,获得输入点云帧IPCF的初始聚类。更准确地说,每个3D样本被聚类并与具有最接近法线(即,最大化点法线和面法线的点积)的定向平面相关联。然后,将3D样本投影到它们的相关平面。在它们的平面中形成连通区域的一组3D样本被称为连通分量。连通分量是具有相似法线和相同关联定向平面的至少一个3D样本的集合。然后,通过基于每个3D样本的法线和其最近的相邻样本的聚类而迭代地更新与每个3D样本相关联的聚类,从而细化所述初始聚类。最后的步骤包括从每个连通分量生成一个补片,这是通过将每个连通分量的3D样本投影到与该连通分量相关联的定向平面上来完成的。补片与辅助补片信息PI相关联,该辅助补片信息PI表示为每个补片定义的辅助补片信息,以解释对应于几何结构和/或属性信息的投影的2D样本。
例如,在V-PCC中,所述辅助补片信息PI包括1)指示包含连通分量的3D样本的3D边界框的六个定向平面之一的信息;2)相对于平面法线的信息;3)确定连通分量相对于补片的3D位置的信息,其按照深度、切向移位和双切向移位而被表示;以及4)诸如在投影平面中定义包含补片的2D边界框的坐标(u0、v0、u1、v1)的信息。
在步骤3200中,补片打包模块PPM可以以通常使未使用空间最小化的方式将至少一个生成的补片映射(放置)到2D网格(也称为画布)上而没有任何重叠,并且可以保证2D网格的每个TxT(例如,16×16)块与唯一的补片相关联。所述2D网格的给定最小块大小TxT可以指定如放置在该2D网格上的不同补片之间的最小距离。2D网格分辨率可以取决于输入点云大小及其宽度W和高度H,并且块大小T可以作为元数据被发送到解码器。
所述辅助补片信息PI可以进一步包括关于所述2D网格的块和补片之间的关联的信息。
在V-PCC中,所述辅助信息PI可以包括块到补片索引信息(BlockToPatch),其确定所述2D网格的块和补片索引之间的关联。
图3a示出了画布C的示例,该画布C包括2个补片P1和P2以及它们相关联的2D边界框B1和B2。注意,如图3a所示,画布C中的两个边界框可以重叠。2D网格(画布的分割)仅在所述边界框内部表示,但是画布的分割也发生在那些边界框外部。与补片相关联的边界框可以被分割成TxT块,典型地为T=16。
包含属于补片的2D样本的TxT块可以被认为是占用块。画布的每个占用块由占用图OM中的特定像素值(例如1)表示,而画布的每个未被占用的块由另一个特定值(例如0)表示,然后,占用图OM的像素值可以指示画布的TxT块是否被占用,即,是否包含属于一个补片的2D样本。
在图3a中,占用块由白色块表示,而浅灰色块表示未占用块。图像生成过程(步骤3300和3400)利用在步骤3200期间计算的至少一个生成的补片到2D网格上的映射,以将输入点云帧IPCF的几何结构和纹理存储为图像。
在步骤3300中,几何结构图像生成器GIG可以根据输入点云框IPCF、占用图OM和辅助补片信息PI,生成至少一个几何结构图像GI。所述几何结构图像生成器GIG可以利用该占用图信息来检测(定位)几何结构图像GI中的占用块以及非空像素。
几何结构图像GI可以表示输入点云帧IPCF的几何结构,并且可以是例如以YUV420-8比特格式表示的WxH个像素的单色图像。
为了更好地处理多个3D样本被投影(映射)到投影平面的相同2D样本(沿着相同的投影方向(线))的情况,可以生成被称为层的多个图像。因此,不同的深度值D1、…、Dn可以与补片的2D样本相关联,并且然后可以生成多个几何结构图像。
在V-PCC中,将补片的2D样本投影到两层上。第一层,也称为近层,可以存储例如与具有较小深度的2D样本相关联的深度值D0。被称为远层的第二层可以存储例如与具有较大深度的2D样本相关联的深度值D1。或者,第二层可存储深度值D1与D0之间的差值。例如,由第二深度图像存储的信息可以在对应于范围[D0,D0+Δ]中的深度值的间隔[0,Δ]内,其中Δ是描述表面厚度的用户定义的参数。
通过这种方式,第二层可以包含显著的轮廓状高频特征。因此,清楚地看起来第二深度图像可能难以通过使用传统视频编码器来编码,并且因此,深度值可能从所述解码的第二深度图像被较差地重构,这导致重构的点云帧的几何结构的较差质量。
根据实施例,所述几何结构图像生成模块GIG可以通过使用辅助补片信息PI来编码(导出)与第一和第二层的2D样本相关联的深度值。
在V-PCC中,具有相应连通分量的3D样本在补片中的位置可以用深度δ(u,v)、切向移位s(u,v)和双切向移位r(u,v)表示如下:
δ(u,v)=δ0+g(u,v)
s(u,v)=s0–u0+u
r(u,v)=r0–v0+v
其中g(u,v)是几何结构图像的亮度分量,(u,v)是投影平面上的与所述3D样本相关联的像素,(δ0,s0,r0)是所述3D样本所属的连通分量的对应补片的3D位置,以及(u0,v0,u1,v1)是所述投影平面中的坐标,其定义了包含与所述连通分量相关联的补片的投影的2D边界框。
因此,几何结构图像生成模块GIG可以将与层(第一层或第二层或这两者)的2D样本相关联的深度值编码(导出)为亮度分量g(u,v),其由下式给出:g(u,v)=δ(u,v)-δ0。应当注意,该关系可以用于从具有伴随的辅助补片信息PI的重构几何结构图像g(u,v),重构3D样本位置(δ0,s0,r0)。
根据实施例,投影模式可以用于指示第一几何结构图像GI0是否可以存储所述第一层或第二层的2D样本的深度值,以及第二几何结构图像GI1是否可以存储与所述第二层或第一层的2D样本相关联的深度值。
例如,当投影模式等于0时,第一几何结构图像GI0可以存储第一层的2D样本的深度值,第二几何结构图像GI1可以存储与第二层的2D样本相关联的深度值。相反,当投影模式等于1时,第一几何结构图像GI0可以存储第二层的2D样本的深度值,第二几何结构图像GI1可以存储与第一层的2D样本相关联的深度值。
根据实施例,帧投影模式可以用于指示一固定投影模式是否用于所有补片,或者是否使用可变投影模式,在可变投影模式中,每个补片可以使用不同的投影模式。
可以将所述投影模式和/或帧投影模式作为元数据发送。
例如,在V-PCC的第2.2.1.3.1节中可以提供帧投影模式判定算法。
根据实施例,当所述帧投影指示可以使用可变投影模式时,可以使用补片投影模式来指示用于(去)投影补片的适当模式。
补片投影模式可以作为元数据发送,并且可能是包括在辅助补片信息PI中的信息。
例如在V-PCC的第2.2.1.3.2节中提供了补片投影模式决策算法。
根据步骤3300的实施例,第一几何结构图像(例如GI0)中对应于补片的2D样本(u,v)的像素值可表示沿对应于所述2D样本(u,v)的投影线定义的至少一个中间3D样本的深度值。更准确地说,所述中间3D样本位于沿着投影线的位置,并共享所述2D样本(u,v)的相同坐标,该样本的深度值D1被编码在第二几何结构图像中,例如GI1。此外,所述中间3D样本可具有介于深度值D0与深度值D1之间的深度值。指定的比特可以与每个所述中间3D样本相关联,如果中间3D样本存在,则该比特被设置为1,否则被设置为0。
图3b示出了沿着投影线PL位于两个3D样本P0和P1之间的两个中间3D样本Pi1和Pi2的示例。3D样本P0和P1分别具有等于D0和D1的深度值。该两个中间3D样本Pi1与Pi2的深度值Di1与Di2分别大于D0且低于D1。
然后,沿着所述投影线的所有所述指定比特可以被级联以形成一码字,其此后被表示为增强占用图(EOM)码字。如图3b所示,假设EOM码字为8比特长,2比特等于1,以表示两个3D样本Pi1和Pi2的位置。最后,所有EOM码字可以被打包在图像中,例如,占用图OM。在这种情况下,画布的至少一个补片可以包含至少一个EOM码字。这样的补片被表示为参考补片,并且参考补片的块被表示为EOM参考块。因此,例如当D1-D0<=1时,占用图OM的像素值可以等于第一值(例如0)以指示所述画布的未占用块,或者等于另一个值(例如大于0)以指示所述画布的占用块,或者例如当D1-D0>1时,指示画布的EOM参考块。
指示EOM参考块的占用图OM中的像素的位置和从那些像素的值获得的EOM码字的比特的值指示所述中间3D样本的3D坐标。
在步骤3400中,纹理图像生成器TIG可从输入点云帧IPCF、占用图OM、辅助补片信息PI以及(图4中的步骤4200)从视频解码器VDEC的输出的至少一个解码的几何结构图像DGI导出的重构点云帧的几何结构,生成至少一个纹理图像TI。
纹理图像TI可以表示输入点云帧IPCF的纹理,并且可以是例如以YUV420-8比特格式表示的WxH个像素的图像。
所述纹理图像生成器TG可以利用所述占用图信息来检测(定位)占用块,从而检测(定位)所述纹理图像中的非空像素。
所述纹理图像生成器TIG可适于生成纹理图像TI并将其与每个几何结构图像/层DGI相关联。
根据实施例,所述纹理图像生成器TIG可将与第一层的2D样本相关联的纹理(属性)值T0编码(存储)为第一纹理图像TI0的像素值,将与第二层的2D样本相关联的纹理值T1编码(存储)为第二纹理图像TI1的像素值。
可替换地,所述纹理图像产生模块TIG可将与第二层的2D样本相关联的纹理值T1编码(存储)为第一纹理图像TI0的像素值,并将与第一层的2D样本相关联的纹理值D0编码(存储)为第二几何结构图像GI1的像素值。
例如,3D样本的颜色可如V-PCC第2.2.3、2.2.4、2.2.5、2.2.8或2.5节所述那样获得。
两个3D样本的纹理值被存储在第一或第二纹理图像中。但是,中间3D样本的纹理值既不能存储在该第一纹理图像TI0中也不能存储在第二纹理图像TI1中,因为投影的中间3D样本的位置对应于已经用于存储另一3D样本(P0或P1)的纹理值的已占用块,如图3b所示。因此,中间3D样本的纹理值被存储在位于第一或第二纹理图像中其它地方的EOM纹理块中的程序化定义的位置(V-PCC的第9.4.5部分)。简言之,该过程确定纹理图像中未占用块的位置,并将与中间3D样本相关联的纹理值存储为所述纹理图像的所述未占用块的像素值,其被表示为EOM纹理块。
根据实施例,可以对几何结构和/或纹理图像应用填充处理。该填充过程可用于填充补片之间的空白空间,以生成适合于视频压缩的分段平滑图像。
在V-PCC的2.2.6和2.2.7节中提供了图像填充示例。
在步骤3500中,视频编码器VENC可以对所产生的图像/层TI和GI进行编码。
在步骤3600中,编码器OMENC可以将占用图编码为例如V-PCC的2.2.2节中详细描述的图像。可以使用有损或无损编码。
根据实施例,视频编码器ENC和/或OMENC可以是基于HEVC的编码器。
在步骤3700中,编码器PIENC可以对辅助补片信息PI以及可能的附加元数据进行编码,该附加元数据诸如为块大小T、几何结构/纹理图像的宽度W和高度H。
根据一个实施例,所述辅助补片信息可以被差分编码(例如,如V-PCC的2.4.1节中所定义的)。
在步骤3800中,复用器可被应用于步骤3500、3600和3700的生成的输出,并且作为结果,这些输出可被复用在一起以便生成表示基本层BL的比特流。应当注意,所述元数据信息表示整个比特流的一小部分。大量信息是使用视频编解码器来压缩的。
图4示出了根据本发明的至少一个实施例的基于图像的点云解码器4000的示例的示意性框图。
在步骤4100中,解复用器DMUX可以用于解复用表示基本层BL的比特流的编码信息。
在步骤4200中,视频解码器VDEC可解码编码信息以获得至少一个解码几何结构图像DGI及至少一个解码纹理图像DTI。
在步骤4300中,解码器OMDEC可以对编码信息进行解码以导出解码后的占用图DOM。
根据一实施例,所述视频解码器VDEC和/或OMDEC可为基于HEVC的解码器。
在步骤4400中,解码器PIDEC可以对编码信息进行解码以导出辅助补片信息DPI。
可能地,元数据也可以从所述比特流BL中导出。
在步骤4500中,几何结构生成模块GGM可从至少一个解码的几何结构图像DGI、解码的占用图DOM、解码的辅助补片信息DPI和可能的附加元数据,导出重构的点云帧IRPCF的几何结构RG。
几何结构生成模块GGM可利用经解码的占用图信息DOM来定位至少一个经解码的几何结构图像DGI中的非空像素。
所述非空像素属于占用块或EOM参考块,这取决于如上所述的解码的占用信息DOM的像素值和D1-D0的值。
根据步骤4500的实施例,几何结构生成模块GGM可从非空像素的坐标,导出中间3D样本的3D坐标中的两个。
根据步骤4500的实施例,当所述非空像素属于所述EOM参考块时,几何结构生成模块GGM可从EOM码字的比特值,导出中间3D样本的3D坐标中的第三个。
例如,根据图3b的示例,所述EOM码字EOMC用于确定中间3D样本Pi1和Pi2的3D坐标。例如,可以由Di1=D0+3从D0导出所述中间3D样本Pi1的第三坐标,并且例如可以由Di2=D0+5从D0导出所述重构3D样本Pi2的第三坐标。偏移值(3或5)是沿投影线的D0和D1之间的间隔数。
根据实施例,当所述非空像素属于占用块时,几何结构生成模块GGM可从非空像素的坐标、至少一个解码的几何结构图像DGI中的一个的所述非空像素的值、解码的辅助补片信息、以及可能地从附加元数据,导出重构的3D样本的3D坐标。
非空像素的使用是基于与3D样本的2D像素关系。例如,对于V-PCC中的所述投影,重构的3D样本的3D坐标可以用深度δ(u,v)、切向移位s(u,v)和双切向移位r(u,v)表示如下:
δ(u,v)=δ0+g(u,v)
s(u,v)=s0–u0+u
r(u,v)=r0–v0+v
其中g(u,v)是解码的几何结构图像DGI的亮度分量,(u,v)是与重构的3D样本相关联的像素,(δ0,s0,r0)是重构的3D样本所属的连通分量的3D位置,以及(u0,v0,u1,v1)是定义2D边界框的投影平面中的坐标,该边界框包含与所述连通分量相关联的补片的投影。
在步骤4600中,纹理生成模块TGM可以从几何结构RG和至少一个解码的纹理图像DTI,导出重构的点云帧IRPCF的纹理。
根据步骤4600的实施例,纹理生成模块TGM可以从相应的EOM纹理块中导出属于EOM参考块的非空像素的纹理。在纹理图像中EOM纹理块的位置被程序化地定义(V-PCC的第9.4.5节)
根据步骤4600的实施例,纹理生成模块TGM可以直接导出属于已占用块的非空像素的纹理作为所述第一或第二纹理图像的像素值。
图5示意性地示出了根据至少一个本实施例的表示基本层BL的比特流的示例语法。
该比特流包括比特流头部SH和至少一帧流组GOFS。
所述帧流组GOFS包括头部HS、表示占用图OM的至少一个语法元素OMS、表示至少一个几何结构图像(或视频)的至少一个语法元素GVS、表示至少一个纹理图像(或视频)的至少一个语法元素TVS以及表示辅助补片信息和其它附加元数据的至少一个语法元素PIS。
在一种变型中,帧流组GOFS包括至少一个帧流。
图6示出了说明其中实现了各个方面和实施例的系统的示例的示意性框图。
系统6000可以被实现为包括下面描述的各种组件的一个或多个设备,并且被配置为执行本文中描述的一个或多个方面。可以形成系统6000的全部或部分的装置的示例包括个人计算机、膝上型计算机、智能电话、平板计算机、数字多媒体机顶盒、数字电视接收机、个人视频记录系统、连接的家用电器、连接的车辆及其相关联的处理系统、头戴式显示设备(HMD、透视眼镜)、投影仪(投影机)、“caves”(包括多个显示器的系统)、服务器、视频编码器、视频解码器、处理来自视频解码器的输出的后处理器、向视频编码器提供输入的预处理器、web服务器、机顶盒、以及用于处理点云、视频或图像的任何其他设备或其他通信设备。系统6000的元件可以单独地或组合地实现在单个集成电路、多个IC和/或分立组件中。例如,在至少一个实施例中,系统6000的处理和编码器/解码器元件可以分布在多个IC和/或分立组件上。在各种实施例中,系统6000可以例如经由通信总线或通过专用输入和/或输出端口通信地耦合到其它类似系统或其它电子设备。在各种实施例中,系统6000可以被配置为实现本文档中描述的一个或多个方面。
系统6000可以包括至少一个处理器6010,其被配置成执行加载在其中的指令,以便实现例如本文中描述的各个方面。处理器6010可以包括嵌入式存储器、输入输出接口以及本领域已知的各种其它电路。系统6000可以包括至少一个存储器6020(例如,易失性存储器设备和/或非易失性存储器设备)。系统6000可以包括存储设备6040,其可以包括非易失性存储器和/或易失性存储器,这其中包括但不限于电可擦除可编程只读存储器(EEPROM)、只读存储器(ROM)、可编程只读存储器(PROM)、随机存取存储器(RAM)、动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)、闪存、磁盘驱动器和/或光盘驱动器。作为非限制性示例,存储设备6040可以包括内部存储设备、附加存储设备和/或网络可访问存储设备。
系统6000可以包括编码器/解码器模块6030,其被配置为例如处理数据以提供编码数据或解码数据,并且编码器/解码器模块6030可以包括其自己的处理器和存储器。编码器/解码器模块6030可表示可包括在设备中以执行编码和/或解码功能的模块(一个或多个)。如已知的,设备可以包括编码模块和解码模块中的一个或两个。另外,编码器/解码器模块6030可以实现为系统6000的单独元件,或者可以作为本领域技术人员公知的硬件和软件的组合结合在处理器6010内。
要加载到处理器6010或编码器/解码器6030上以执行本文档中描述的各个方面的程序代码可以存储在存储设备6040中,并且随后加载到存储器6020上以由处理器6010执行。根据各种实施例,处理器6010、存储器6020、存储设备6040和编码器/解码器模块6030中的一个或多个可以在执行本文中描述的过程期间存储各种项中的一个或多个。这样的存储项可以包括但不限于点云帧、编码/解码的几何结构/纹理视频/图像或编码/解码的几何结构/纹理视频/图像的部分、比特流、矩阵、变量以及来自等式、公式、运算和运算逻辑的处理的中间或最终结果。
在若干实施例中,处理器6010和/或编码器/解码器模块6030内部的存储器可用于存储指令,并提供用于可在编码或解码期间执行的处理的工作存储器。
然而,在其它实施例中,所述处理设备外部的存储器(例如,所述处理设备可以是处理器6010或编码器/解码器模块6030)可以用于这些功能中的一个或多个。所述外部存储器可以是存储器6020和/或存储设备6040,例如,动态易失性存储器和/或非易失性闪存。在若干实施例中,外部非易失性闪存可用于存储电视的操作系统。在至少一个实施例中,诸如RAM的快速外部动态易失性存储器可以用作视频编码和解码操作的工作存储器,诸如用于MPEG-2部分2(也称为ITU-T建议H.262和ISO/IEC 13818-2,也称为MPEG-2视频)、HEVC(高效视频编码)或VVC(通用视频编码)。
如框6130中所示,可以通过各种输入设备来提供对系统6000的元件的输入。这样的输入设备包括但不限于(i)RF部分,其可以接收例如由广播者通过空中传输的RF信号,(ii)复合输入端子,(iii)USB输入端子,和/或(iv)HDMI输入端子。
在各种实施例中,框6130的输入设备可以具有本领域已知的相关联的相应输入处理元件。例如,RF部分可以与以下必要的元件相关联:(i)选择期望的频率(也称为选择信号,或者将信号频带限制到一频带),(ii)将所选择的信号下变频,(iii)再次频带限制到较窄的频带,以选择(例如)在某些实施例中可以称为信道的信号频带,(iv)解调所述下变频和频带限制的信号,(v)执行纠错,以及(vi)解复用,以选择期望的数据分组流。各种实施例的RF部分可以包括一个或多个元件以执行这些功能,例如,频率选择器、信号选择器、限带器、信道选择器、滤波器、下变频器、解调器、纠错器和解复用器。所述RF部分可以包括执行各种这些功能的调谐器,这些功能包括例如将接收的信号下变频到较低频率(例如,中频或近基带频率)或基带。
在一个机顶盒实施例中,所述RF部分及其相关的输入处理元件可以接收通过有线(例如,电缆)介质发送的RF信号。然后,所述RF部分可以通过滤波、下变频以及再次滤波到期望的频带来执行频率选择。
各种实施例可重新安排上述(和其它)元件的顺序,移除这些元件中的一些,和/或添加执行类似或不同功能的其它元件。
添加元件可以包括在现有元件之间插入元件,例如插入放大器和模数转换器。在各种实施例中,所述RF部分可以包括天线。
另外,USB和/或HDMI终端可以包括用于通过USB和/或HDMI连接而将系统6000连接到其它电子设备的相应接口处理器。应当理解,输入处理的各个方面(例如,Reed-Solomon纠错)可以根据需要在例如单独的输入处理IC内或处理器6010内实现。类似地,USB或HDMI接口处理的方面可根据需要在单独的接口IC内或处理器6010内实现。可以将解调、纠错和解复用的流提供给各种处理元件,这其中包括例如处理器6010和编码器/解码器6030,它们与存储器和存储元件结合操作以便根据需要处理数据流以便呈现在输出设备上。
系统6000的各种元件可以设置在集成壳体内。在集成壳体内,各种元件可以使用合适的连接布置6140互连,并在其间传输数据,所述连接布置6140例如为本领域已知的内部总线,这其中包括I2C总线、布线和印刷电路板。
所述系统6000可以包括使得能够经由通信信道6060与其它设备通信的通信接口6050。通信接口6050可以包括但不限于被配置成通过通信信道6060发送和接收数据的收发器。所述通信接口6050可以包括但不限于调制解调器或网卡,并且所述通信信道6060可以例如在有线和/或无线介质内实现。
在各种实施例中,可以使用诸如IEEE 802.11的Wi-Fi网络将数据流式传输到系统6000。这些实施例的Wi-Fi信号可通过适用于Wi-Fi通信的通信信道6060和通信接口6050来接收。这些实施例的通信信道6060通常可连接到接入点或路由器,所述接入点或路由器提供对包括因特网的外部网络的接入以允许流式应用和其它云上(over-the-top)通信。
其它实施例可以使用通过输入框6130的HDMI连接递送数据的机顶盒来向系统6000提供流式数据。
其他实施例可以使用输入框6130的RF连接而向系统6000提供流式数据。
应当理解,可以以各种方式来实现信令。例如,在各种实施例中,一个或多个语法元素、标志等可以用于将信息用信号发送给对应的解码器。
系统6000可以向包括显示器6100、扬声器6110和其它外围设备6120的各种输出设备提供输出信号。在实施例的各种示例中,所述其他外围设备6120可以包括以下中的一个或多个:独立的DVR、盘播放器、立体声系统、照明系统和基于系统3000的输出提供功能的其他设备。
在各种实施例中,可以使用信令在系统6000与显示器6100、扬声器6110或其它外围设备6120之间传送控制信号,所述信令诸如为AV.Link(音频/视频链路)、CEC(消费电子控制)或使得能够在有或没有用户干预的情况下进行设备到设备控制的其他通信协议。。
输出设备可以通过各自的接口6070、6080和6090经由专用连接而通信地耦合到系统6000。
或者,所述输出设备可以使用通信信道6060经由通信接口6050连接到系统6000。显示器6100和扬声器6110可以与系统6000的其它组件一起集成在诸如电视机之类的电子设备中的单个单元中。
在各种实施例中,所述显示接口6070可包括显示驱动器,例如定时控制器(T Con)芯片。
例如,如果输入6130的RF部分是单独的机顶盒的一部分,则显示器6100和扬声器6110可以备选地与其他组件中的一个或多个分离。在显示器6100和扬声器6110可以是外部组件的各种实施例中,所述输出信号可经由专用输出连接而被提供,这其中包括例如HDMI端口、USB端口或COMP输出。
从如V-PCC中定义的EOM纹理块中取回中间3D样本的纹理值不需要附加的语法来指示所述中间3D样本的位置,因为这些位置是从占用图OM的EOM参考块的EOM码字导出的,并且指示通过顺序处理定义的EOM纹理块的位置。但是,随机访问特定的中间3D样本的纹理值是不可能的,因为所有EOM纹理块随后将被系统地处理以确定特定EOM纹理块的位置。
另外,在纹理图像的补片之间嵌入EOM纹理块可能降低所述纹理图像的压缩效率,因为所述纹理图像的内容可能因此而具有低空间相关性(冗余)。
根据至少一个实施例的一般方面,提供了一种方法,包括:用信号发送表示至少一个中间3D样本的纹理值的至少一个EOM(增强占用图)纹理补片。
用信号发送EOM纹理补片允许对特定中间3D样本的纹理值的随机(直接、快速)访问。换句话说,可以独立地解码与从EOM码字重构的中间3D样本对应的纹理。这允许实现附加特征,如空间可缩放性或并行解码。
图7示出了根据本发明的至少一个实施例的用于用信号发送至少一个EOM纹理补片的方法的示例。
在步骤710中,模块可以在比特流中添加至少一个语法元素SE1,其表示EOM纹理补片(由patchIndex索引)在点云帧(由frmIdx索引)的画布中的2D位置,以及所述EOM纹理补片的大小(高度、宽度)。
画布的示例在图3a中示出。
在步骤720中,可以发送所述比特流。
在步骤730中,模块可从比特流(接收的比特流)取回(读取)至少一个语法元素SE1,并且可从所述至少一个语法元素SE1提取点云帧的画布中的EOM纹理补片的2D位置以及所述EOM纹理补片的大小(高度、宽度)。
根据实施例,可以通过画布的2D坐标系统中定义的水平坐标etpdu_2d_shift_u和垂直坐标etpdu_2d_shift_v来用信号发送(由patchIndex索引的)EOM纹理补片在画布中的2D位置。
该实施例提供了在画布中灵活放置EOM纹理补片。
根据实施例,所述EOM纹理补片(由patchIndex索引)的大小(高度,宽度)可以通过分别表示EOM纹理补片的高度和宽度的etpdu_2d_delta_size_u和etpdu_2d_delta_size_v来用信号发送。
该实施例允许调整EOM纹理补片的大小。
根据步骤710的实施例,如图8a中所示,语法元素SE1也可以是用信号发送画布的补片(由patchIndex索引)的2D样本的数量的元素etpdu_points。
该实施例是有利的,因为它需要发送少量的数据。
然而,即使补片不是EOM纹理补片,即即使该补片不携带任何中间3D样本的纹理值(在该情况下,etpdu_points被设置为0),补片的2D样本的数量也被用信号发送。
此外,该实施例要求EOM纹理补片中的补片信息与当前点云帧中的补片处于相同的顺序。
图9a示出了根据步骤710的所述实施例的具有包括四个纹理补片和单个EOM纹理补片EOMP的画布的纹理图像的示例。
所述纹理补片#1、#2、#3和#4中的每一个存储点云的3D样本的纹理值,并且所述EOM纹理补片EOMP存储相对于纹理补片#1、#2和#4的中间样本的纹理值。首先从EOM纹理补片EOMP的左上角添加相对于纹理补片#1的至少一个中间3D样本的纹理值,接着添加相对于纹理补片#2的至少一个中间3D样本的纹理值(一个或多个),接着添加相对于纹理补片#4的至少一个中间3D样本的纹理值(一个或多个)。
该实施例不支持多个EOM纹理补片。
该实施例不允许例如图9a中所示的两个连续补片的3D样本之间的纹理值之间存在“间隙”。
根据步骤710的实施例,如图8b中所示,语法元素SE1也可以是表示EOM纹理补片中的参考补片的数量的元素etpdu_patch_count,另一语法元素SE1也可以是表示第“p”个参考补片的索引的元素etpdu_ref_index,并且另一语法元素SE1也可以是元素etpdu_offset,其表示用于确定第“p”个(当前)参考补片(在先前参考补片“p-1”之后)的起始位置的偏移(以像素为单位)。
图9b示出了根据步骤710的所述实施例的具有包括四个纹理补片和单个EOM纹理补片EOMP的画布的纹理图像的示例。
所述纹理补片#1、#2、#3和#4中的每一个存储点云的3D样本的纹理值,并且所述EOM纹理补片EOMP存储相对于纹理补片#1、#2和#4的中间样本的纹理值。首先从EOM纹理补片EOMP的左上角添加相对于纹理补片#1的至少一个中间3D样本的纹理值(一个或多个)。接着,从相对于所述纹理补片#2的元素etpdu_offset,确定所述纹理补片#2的起始位置S1。然后存储与纹理补片#2相关的至少一个中间3D样本的纹理值(一个或多个)。接着,从相对于纹理补片#4的元素etpdu_offset确定所述纹理补片#4的起始位置S2。然后存储与纹理补片#4相关的至少一个中间3D样本的纹理值(一个或多个)。
该实施例提供了非常灵活的解决方案,并且可以支持如图9c所示的多个EOM纹理补片,但是与先前的实施例相比,需要传送更多的数据。
根据步骤710的实施例,如图8c中所示,语法元素SE1还可以是表示EOM纹理补片中的参考补片的数量的元素etpdu_patch_count,以及表示用于确定第“p”(当前)参考补片(在前一参考补片“p-1”之后)的起始位置的偏移(以像素为单位)的元素etpdu_offset。
与图8a-b中所示的实施例相比,图8c中所示的实施例在语法(“if”语句)的解析中添加了一点点复杂性,但是提供了非常接近于图8b中所示的实施例的级别灵活性(仅补块的顺序不能改变)。
图8c中所示的实施例支持多个EOM纹理参考补片,但是它要求EOM纹理参考补片的索引遵循与所有EOM纹理补片上的点云的补片的索引相同的顺序;即,如果存在N个常规补片,则前m1个补片的纹理应当在第一EOM纹理补片中,接下来m2个补片的纹理应当在接下来的EOM纹理补片中,以此类推,其中m1…mX的和应当等于或小于N。
根据步骤710的实施例,如图8d中所示,语法元素SE1也可以是元素etpdu_mode,其指示表示如图8a-c中所示的步骤710的实施例之一所定义的EOM纹理补片的特定语法。
该实施例允许将多个变型组合成单个语法SE1。
根据步骤710的实施例,所述模块还可在比特流中添加至少一个其它语法元素SE2,以在表示点云帧的整个语法的不同级别处用信号发送所述至少一个语法元素SE1。
根据步骤710的实施例,可在序列层级用信号发送至少一个语法元素SE1。
例如,所述至少一个语法元素SE1可在如V-PCC中定义的语法元素sequence_parameter_set()用信号发送。
根据步骤710的所述实施例的变型,如图10所示,第二语法元素SE2可以是V-PCC中定义的序列参数集语法的语法元素sps_enhanced_occupancy_map_texture_patch_present_flag。
语法元素sps_enhanced_occupancy_map_texture_patch_present_flag指示是否存在对于点云帧序列的EOM纹理补片。
当语法元素sps_enhanced_occupancy_map_texture_patch_present_flag等于0时,所述EOM纹理补片不存在。当语法元素sps_enhanced_occupancy_map_texture_patch_present_flag等于1时,所述EOM纹理补片存在。
所述语法元素sps_enhanced_occupancy_map_texture_patch_present_flag还可以与如V-PCC中定义的语法元素sps_enhanced_occupancy_map_depth_for_enabled_flag组合,以指示现有EOM纹理补片是否存在于纹理图像TI0或TI1中或者所述现有EOM纹理补片是否存在于另一比特流中。
根据步骤710的所述实施例的变型,语法元素sequence_parameter_set()可以可选地使用用于EOM纹理补片的不同视频;即pcm补片(V-PCC中的7.3.33部分和7.4.33部分)和EOM纹理补片将在不同的纹理图像(视频比特流)中。
虽然这增加了全局V-PCC比特流中的子比特流的数量,但是它允许更好地调整每个比特流的编码参数,并且主要提供更好的可缩放性特征-例如,如果仅需要pcm补片的纹理,则不需要解码EOM纹理补片,并且反之亦然。
图11示出了根据步骤710的所述实施例的所述变型的语法元素sequence_parameter_set()的语法表的示例。
语法元素sps_eom_texture_patch_separate_video_present_flag明确地指示单独的视频是否用于EOM纹理补片。
根据步骤710的实施例,如图12和14中所说明,在帧层级用信号发出至少一个语法元素SE1。
例如,在V-PCC中定义的语法元素patch_frame_data_unit()中用信号发送所述至少一个语法元素SE1。
根据步骤710的所述实施例的变型,如图12中所说明的,第二语法元素SE2可为语法元素sps_enhanced_occupancy_map_texture_patch_present_flag,其用信号发送用于表示EOM纹理补片的特定语法。
语法元素sps_enhanced_occupancy_map_texture_patch_present_flag指示EOM纹理补片是否存在于比特流中。
当语法元素sps_enhanced_occupancy_map_texture_patch_present_flag等于0时,EOM纹理补片不存在。当语法元素sps_enhanced_occupancy_map_texture_patch_present_flag等于1时,EOM纹理补片存在,并且由于如V-PCC中定义的函数patch_information_data(.),因此从比特流取回与EOM纹理补片相关的数据。
所述函数取决于如图13的表中定义的补片模式。
补片模式I_EOMT(用于帧内帧)标识该补片是如V-PCC中定义的帧内帧中的增强占用图纹理补片,而补片模式P_EOMT(用于帧间或预测帧)标识该补片是如V-PCC中定义的帧间帧中的增强占用图纹理补片。
根据图14所示的步骤710的所述实施例的变型,第二元素SE2也可以是指示存在多少EOM纹理补片的语法元素pfdu_eom_texture_patch_count。EOM纹理补片的数量必须等于或小于pfdu_patch_count_minus1+1。
所述变型在图14中示出。针对所获得的与EOM纹理补片中的每一个相关的数据,在所述EOM纹理补片的所述数量上循环。
使用多个EOM纹理补片比使用单个补片需要稍微更多的比特率,但是允许更紧凑的补片打包(若干小的EOM纹理补片比单个大的EOM纹理补片更容易适合纹理画布)。
根据图15中所示的步骤710的实施例,第二元素SE2也可以是指示补片类型的语法元素patch_mode;例如,常规帧内补片、I_INTRA或P_INTRA。
图16示出了根据至少一个当前实施例的用于对中间3D样本的纹理值进行编码的方法的框图。
在步骤1610中,模块可以分析点云帧PCF到投影平面上的正交投影以导出至少一个中间3D样本的纹理值TV。
在步骤1620中,模块可以将所述至少一个纹理值TV映射到至少一个EOM纹理补片EOMP中。
在步骤1630中,模块可以将所述至少一个EOM纹理补片EOMTP打包成纹理图像。
例如,步骤1610和1620可以是步骤3100的一部分,其中模块PGM可以生成每个EOM纹理补片EOMTP的附加补片。步骤1630然后可以是步骤3200和3400的一部分。在步骤3200中,所述至少一个附加补片与画布中的其它生成的补片一起打包,并且在步骤3400中,纹理图像生成器TG可以编码(映射)在至少一个EOM纹理补片EOMTP中的纹理值TV,该至少一个EOM纹理补片EOMTP与所述至少一个附加补片在纹理图像中处于同一位置。
如关于图7描述的,在步骤1640,模块可以在比特流中用信号发送所述至少一个打包EOM纹理补片EOMTP。
例如,步骤1640可以是步骤3700的一部分,其中编码器PIENC可以遵循关于图10-15描述的语法,对表示所述至少一个EOM纹理补片EOMTP的至少一个语法元素SE1以及可能的SE2进行编码。
根据步骤1620的实施例,将纹理值TV映射到至少一个EOM纹理补片EOMTP包括:如图16中所示的两个子步骤1621和1622。
在子步骤1621中,模块可以检查点云帧的占用图OM的补片是否包含EOM参考块EOMB。
在步骤1622中,模块可将每个EOM参考块的至少一个中间3D样本的纹理值TV嵌入到至少一个EOM纹理补片EOPM中。因此,每个EOM纹理补片与至少一个EOM参考块相关联。
基本上,对于包括至少一个EOM参考块的每个路径,形成关于纹理值TV的排序列表,然后将所述有序列表光栅化为至少一个EOM纹理补片。
根据步骤1622的实施例,可以通过顺序地扫描所述占用图OM的画布的补片的像素来形成纹理值TV的排序列表。如果像素值对应于EOM码字,则相应的中间3D样本的纹理值TV被级联到所述有序列表的末尾。
扫描的示例是光栅扫描、Z阶扫描和2D-希尔伯特曲线。光栅扫描可以从左到右和从上到下扫描EOM纹理补片。还可以使用基于块的扫描或EOM纹理补片的按照块的扫描,其中块被光栅扫描的。
步骤1622的该实施例是最直接的方法,因为其不需要扫描3D空间。
根据步骤1622的实施例,可以如下形成纹理值TV的排序列表:
首先,重构补片的所有中间3D样本。然后,使用3D曲线扫描3D空间,补片的中间3D样本的纹理值DV以在3D曲线中找到的顺序被级联到所述列表。
所述3D曲线的例子是希尔伯特曲线、Z阶曲线或任何位置保持曲线都是合适的。
由于3D扫描,该实施例更加复杂,但是增加了EOM纹理补片的相邻样本之间的相关性,从而增加了编码效率。
根据步骤1622的实施例,可以如下形成纹理值TV的所述排序列表:
首先,重构补片的所有中间3D样本并通过树来表示。所述树通过以下而被创建:首先将所有中间样本映射到3D空间,然后在例如八分元(以形成八叉树)或二分元(以形成KD树)中递归地划分所述3D空间。然后,通过遍历这种树来形成纹理值TV的排序列表。
树的例子是八叉树和KD树。遍历可以深度优先或宽度优先地进行。
该实施例是2D和3D扫描之间的折衷。
根据步骤710的实施例,语法元素SE1也可以是指示如何对纹理值列表进行排序的元素。
根据步骤710的实施例,语法元素SE1还可为指示如何使用光栅化类型的元素。
根据一个实施例,所述分类和光栅化类型是固定的,并且对于编码器和解码器都是已知的。
图17示出了根据至少一个当前实施例的用于对中间3D样本的纹理值进行解码的方法的框图。
在步骤1710中,当根据关于图7描述的方法用信号发送至少一个EOM纹理补片EOMTP时,模块可从比特流中导出所述至少一个EOM纹理补片EOMTP。
例如,步骤1710是步骤4400的一部分,其中解码的PIDEC可以根据遵循关于图10-15描述的语法的至少一个语法元素SE1和可能的SE2,解码至少一个EOM纹理补片EOMTP信息。
在步骤1720中,模块可以从所述至少一个EOM纹理补片EOMTP,导出纹理值TV。
在步骤1730中,模块可将至少一个纹理值指派给至少一个中间3D样本。
例如,步骤1720可以是步骤4600的一部分,其中纹理生成模块TGM可以将纹理值TV指派给至少一个中间3D样本。
根据步骤1720的实施例,从EOM纹理补片EOMTP导出纹理值TV是如V-PCC的9.4.5节中描述的重构过程的步骤6的修改。
更准确地说,在子步骤1721中,确定EOM纹理补片中的参考补片的第一像素的(u,v)坐标。所述像素值向第一中间3D样本提供纹理值TV。接着,在子步骤1722中,从所述第一像素的(u,v)坐标取回至少一个随后的中间3D样本的纹理值TV。
假设如图8b所示的EOM纹理补片的更丰富语法,提供这些子步骤的描述。但是也可以导出这些子步骤的相对于如上所述的EOM纹理补片的其他语法的其他可选实施例。
在下文中,假设已经解析了所述比特流以解码点云帧(具有索引帧frameIdx)中的EOM纹理补片的语法。pfdu_eom_texture_patch_count指的是点云帧frameIdx中的EOM纹理补片的数量。帧frameIdx中属于补片patchIdx的点,该点是补片patchIdx的解码顺序中的第一中间点。
根据子步骤1721的实施例,EOM纹理补片中的参考补片的第一像素的(u,v)坐标被计算如下:
-扫描EOM纹理补片,直到当前索引p等于目标补片索引patchIdx;
以及
-通过偏移(etpdu_2d_shift_u和etpdu_2d_shift_v),将坐标(u,v)初始化为当前补片(当前P)的起始位置。
下面是实现该实施例的算法的伪代码。
Figure BDA0003267869490000341
根据用于EOM纹理补片语法的实施例,上述参数中的一些可以被设置为它们的默认值。
例如:
·如果不存在用于所述偏移的语法元素,那么在以上算法中设定etpdu_offset[frmIdx][p][r]=0。
·如果不存在用于参考补片计数的语法元素pfdu_eom_texture_patch_count,则将pfdu_eom_texture_patch_count[frmIdx][p]设置为pfdu_patch_count_minus1+1。
根据子步骤1722的实施例,根据具有带有所述第一像素的(u,v)坐标的第一点的参考补片的扫描,从所述第一像素的(u,v)坐标取回用于至少一个随后的中间3D样本的纹理值TV(步骤1721)。
例如,这种扫描可以通过函数coordinate_advance_raster(u,v,n)来完成,该函数按照给定的光栅扫描顺序(例如,在V-PCC的3.1.2节中列出的光栅化模式之一)和EOM纹理补片上的大小,将坐标(u,v)推进n个位置。
图18中说明了典型的光栅扫描。
在图1-18中,本文描述了各种方法,并且每种方法包括用于实现所描述的方法的一个或多个步骤或动作。除非方法的正确操作需要特定顺序的步骤或动作,否则可修改或组合特定步骤和/或动作的顺序和/或使用。
一些示例是关于框图和操作流程图来描述的。每个方框表示电路元件、模块或代码部分,其包括用于实现指定逻辑功能(一个或多个)的一个或多个可执行指令。还应当注意,在其它实现中,框中所标注的功能(一个或多个)可以不按所指明的顺序发生。例如,取决于所涉及的功能,连续示出的两个框实际上可以基本上同时执行,或者这些框有时可以以相反的顺序执行。
本文描述的实现方式和方面可以在例如方法或过程、装置、计算机程序、数据流、比特流或信号中实现。即使仅在单一形式的实现的上下文中讨论(例如,仅作为方法讨论),所讨论的特征的实现也可以以其他形式(例如,装置或计算机程序)来实现。
所述方法可以在例如处理器中实现,所述处理器通常指处理设备,这其中包括例如计算机、微处理器、集成电路或可编程逻辑设备。处理器还包括通信设备。
另外,所述方法可由处理器执行的指令实施,且此类指令(和/或由实施方案产生的数据值)可存储在计算机可读存储介质上。计算机可读存储介质可以采取计算机可读程序产品的形式,该计算机可读程序产品包含在一个或多个计算机可读介质中,并且具有包含在其上的计算机可读程序代码,该计算机可读程序代码可由计算机执行。如本文所使用的计算机可读存储介质可以被认为是非暂时性存储介质,其具有在其中存储信息的固有能力以及提供从其中取回信息的固有能力。计算机可读存储介质可以是,例如,但不限于,电、磁、光、电磁、红外或半导体系统、装置或设备,或前述的任何合适的组合。应当理解,尽管提供了可以应用本实施例的计算机可读存储介质的更具体的示例,但是以下仅是说明性的而不是如本领域普通技术人员容易理解的穷举列表:便携式计算机磁盘;硬盘;只读存储器(ROM);可擦除可编程只读存储器(EPROM或闪存);便携式光盘只读存储器(CD-ROM);光学存储设备;磁存储装置;或前述的任何合适的组合。
所述指令可以形成有形地体现在处理器可读介质上的应用程序。
指令可以是例如硬件、固件、软件或其组合。指令可以在例如操作系统、单独的应用程序或两者的组合中找到。因此,处理器可以被表征为例如被配置为执行过程的设备和包括具有用于执行过程的指令的处理器可读介质(诸如存储设备)的设备。此外,处理器可读介质可以存储由实现产生的数据值,作为指令的补充或替代。
例如,可以以适当的硬件、软件和固件来实现装置。这样的装置的示例包括个人计算机、膝上型计算机、智能电话、平板计算机、数字多媒体机顶盒、数字电视接收机、个人视频记录系统、连接的家用电器、头戴式显示设备(HMD、透视眼镜)、投影仪(投影机)、“caves”(包括多个显示器的系统)、服务器、视频编码器、视频解码器、处理来自视频解码器的输出的后处理器、向视频编码器提供输入的预处理器、web服务器、机顶盒、以及用于处理点云、视频或图像的任何其他设备或其他通信设备。应当清楚,该设备可以是移动的,甚至可以安装在移动车辆中。
计算机软件可以由处理器6010或由硬件实现,或者由硬件和软件的组合实现。作为非限制性示例,所述实施例还可以由一个或多个集成电路实现。存储器6020可以是适合于技术环境的任何类型,并且可以使用任何适当的数据存储技术来实现,作为非限制性示例,诸如光存储器设备、磁存储器设备、基于半导体的存储器设备、固定存储器和可移动存储器。处理器6010可以是适合于技术环境的任何类型,并且可以包含作为非限制性示例的微处理器、通用计算机、专用计算机和基于多核架构的处理器中的一个或多个。
如对于本领域普通技术人员将显而易见的,实现可以产生被格式化以携带例如可以被存储或发送的信息的各种信号。该信息可以包括例如用于执行方法的指令,或者由所描述的实现之一产生的数据。例如,信号可以被格式化以携带所描述的实施例的比特流。这种信号可以被格式化为例如电磁波(例如,使用频谱的射频部分)或基带信号。所述格式化可以包括例如编码数据流和用编码数据流调制载波。所述信号携带的信息可以是例如模拟或数字信息。如已知的,所述信号可以通过各种不同的有线或无线链路来传输。该信号可以存储在处理器可读介质上。
本文所用的术语仅是为了描述特定实施例的目的,而不是旨在进行限制。如本文所用,单数形式“一”、“一个”和“该”也可旨在包括复数形式,除非上下文另有明确指示。还应当理解,术语“包括/包含”在本说明书中使用时可以指定所述的例如特征、整数、步骤、操作、元素和/或组件的存在,但是不排除一个或多个其它特征、整数、步骤、操作、元素、组件和/或其组合的存在或添加。此外,当元素被称为“响应”或“连接”到另一元素时,其可以直接响应或连接到另一元素,或者可以存在中间元素。相反,当元素被称为“直接响应”或“直接连接”到其它元素时,不存在中间元素。
应当理解,符号/术语“/”、“和/或”和“至少一个”中的任意者的使用,例如在“A/B”、“A和/或B”和“A和B中的至少一个”的情况下,可以旨在仅包括选择第一列出的选项(A)择,或仅选择第二列出的选项(B),或选择两个选项(A和B)。作为进一步的例子,在“A、B和/或C”和“A、B和C中的至少一个”的情况下,这样的措词旨在包括仅选择第一个列出的选项(A),或者仅选择第二个列出的选项(B),或者仅选择第三个列出的选项(C),或者仅选择第一个和第二个列出的选项(A和B),或者仅选择第一个和第三个列出的选项(A和C),或者仅选择第二个和第三个列出的选项(B和C),或者选择所有三个选项(A和B和C)。如本领域和相关领域的普通技术人员所清楚的,这可以扩展到所列的多个项目。
在本申请中可以使用各种数值。具体值可以是例如目的,并且所描述的方面不限于这些具体值。
应当理解,尽管术语第一、第二等可以在这里用来描述各种元素,但是这些元素不受这些术语的限制。这些术语仅用于将一个元素与另一个元素区分。例如,在不脱离本申请的教导的情况下,第一元素可以被称为第二元素,并且类似地,第二元素可以被称为第一元素。在第一元素和第二元素之间不暗示顺序。
对“一个实施例”或“一实施方式”或“一个实现”或“一实现”及其它变型的引用经常用于表达特定特征、结构、特性等(结合实施例/实现所描述的)包括在至少一个实施例/实现中。因此,在本申请中的各个地方出现的短语“在一个实施例中”或“在一实施例”或“在一个实现中”或“在一实现中”以及任何其他变型的出现不一定都指同一实施例。
类似地,本文中对“根据实施例/示例/实现”或“在实施例/示例/实现中”及其它变型的引用经常用于传达特定特征、结构或特性(结合实施例/示例/实现描述)可以包括在至少一个实施例/示例/实现中。因此,在说明书中的各个地方出现的表述“根据实施例/示例/实现”或“在实施例/示例/实现中”不一定全部指代相同的实施例/示例/实现,也不一定是与其他实施例/示例/实现相互排斥的单独的或替代的实施例/示例/实现。
权利要求中出现的附图标记仅作为说明,并且不应对权利要求的范围具有限制作用。尽管没有明确描述,但是本发明的实施例/示例和变型可以以任何组合或子组合来采用。
当附图被呈现为流程图,但是应当理解,它还提供了相应装置的框图。类似地,当附图被呈现为框图时,应当理解,它还提供了对应的方法/过程的流程图。
尽管一些图包括通信路径上的箭头以示出通信的主要方向,但是应当理解,通信可以在与所描绘的箭头相反的方向上发生。
各种实现方式涉及解码。如本申请中所使用的,“解码”可以包括例如对接收到的点云帧(可能包括接收到的比特流,其对一个或多个点云帧进行编码)执行的全部或部分过程,以便产生适合于显示或适合于在重构的点云域中进一步处理的最终输出。在各种实施例中,此类过程包括通常由基于图像的解码器执行的过程中的一者或多者。
作为进一步的示例,在一个实施例中,“解码”可以仅指熵解码,在另一个实施例中,“解码”可以仅指差分解码,并且在另一个实施例中,“解码”可以指熵解码和差分解码的组合。基于具体描述的上下文,短语“解码过程”是否可以旨在具体地指代操作的子集或一般地指代更广泛的解码过程将是清楚的,并且相信是本领域技术人员所充分理解的。
各种实现涉及编码。以与以上关于“解码”的讨论类似的方式,如在本申请中使用的“编码”可以包括例如对输入点云帧执行的以便产生编码的比特流的过程的全部或部分。在各种实施例中,此类过程包括通常由基于图像的解码器执行的过程中的一者或多者。
作为进一步的示例,在一个实施例中,“编码”可以仅指熵编码,在另一个实施例中,“编码”可以仅指差分编码,并且在另一个实施例中,“编码”可以指差分编码和熵编码的组合。基于具体描述的上下文,短语“编码过程”是否可以旨在具体地指代操作的子集或一般地指代更广泛的编码过程将是清楚的,并且相信是本领域技术人员所充分理解的。
注意,如本文所使用的语法元素,例如etpdu_2d_shift_u,etpdu_2d_shift_v,etpdu_2d_delta_size_u,etpdu_2d_delta_size_v,etpdu_points,etpdu_patch_count,etpdu_ref_index,etpdu_offset,etpdu_mode,sps_enhanced_occupancy_map_texture_patch_present_flag,sps_enhanced_occupancy_map_depth_for_enabled_flag,sps_eom_texture_patch_separate_video_present_flag,pfdu_eom_texture_patch_count,pfdu_patch_count_minus1,patch_mode是描述性术语。因此,它们不排除使用其它语法元素名称。
各种实施例涉及速率失真优化。特别地,在编码过程期间,通常考虑速率和失真之间的平衡或折衷,通常给出计算复杂度的约束。速率失真优化通常可以被公式化为最小化速率失真函数,该函数是速率和失真的加权和。存在不同的方法来解决速率失真优化问题。例如,这些方法可以基于对所有编码选项的广泛测试,这其中包括所有考虑的模式或编码参数值,在编码和解码之后对它们的编码成本和重构信号的相关失真进行完整评估。还可以使用更快的方法来节省编码复杂度,特别是基于预测或预测残差信号而不是重构信号来计算近似失真。也可以使用这两种方法的混合,例如通过仅对一些可能的编码选项使用近似失真,而对其它编码选项使用完全失真。其它方法仅评估可能的编码选项的子集。更一般地,许多方法采用各种技术中的任何一种来执行所述优化,但是该优化不一定是对编码成本和相关失真两者的完整评估。
另外,本申请可以涉及“确定”各种信息。确定该信息可以包括例如估计信息、计算信息、预测信息或从存储器取回信息中的一个或多个。
此外,本申请可以涉及“访问”各种信息。访问该信息可以包括例如接收信息、取回信息(例如,从存储器)、存储信息、移动信息、复制信息、计算信息、确定信息、预测信息或估计信息中的一个或多个。
另外,本申请可以指“接收”各种信息。如同“访问”一样,接收旨在是广义的术语。接收该信息可以包括例如访问信息或(例如从存储器)取回信息中的一个或多个。此外,在诸如存储信息、处理信息、发送信息、移动信息、复制信息、擦除信息、计算信息、确定信息、预测信息或估计信息的操作期间,通常以一种方式或另一种方式涉及“接收”。
此外,如本文所使用的,词语“信号”尤其是指向对应的解码器指示某物。举例来说,在某些实施例中,编码器用信号发送特定语法元素SE1且可能用信号发送语法元素SE2。这样,在一个实施例中,可以在编码器侧和解码器侧使用相同的参数。因此,例如,编码器可以向解码器发送(显式信令)特定参数,使得解码器可以使用相同的特定参数。相反,如果解码器已经具有特定参数以及其它参数,则可以使用信令而不进行发送(隐式信令),以简单地允许解码器知道并选择特定参数。通过避免任何实际功能的传输,在各种实施例中实现了比特节省。应当理解,可以以各种方式来实现信令。例如,在各种实施例中,一个或多个语法元素、标志等被用于将信息用信号发送给对应的解码器。虽然前述内容涉及词语“信号”的动词形式,但是词语“信号”在本文中也可以用作名词。
已经描述了许多实现。然而,应当理解,可以进行各种修改。例如,不同实现的元素可以被组合、补充、修改或移除以产生其他实现。另外,本领域技术人员将理解,其他结构和过程可以替代所公开的那些,并且所得到的实现将以至少基本上相同的方式(一个或多个)执行至少基本上相同的功能(一个或多个),以实现与所公开的实现至少基本上相同的结果(一个或多个)。因此,本申请考虑了这些和其他实现。

Claims (45)

1.一种方法,包括传输至少一个纹理补片,所述至少一个纹理补片表示点云帧的至少一个中间3D样本的纹理值。
2.根据权利要求1所述的方法,其中所述至少一个中间3D样本是所述点云帧的3D样本,该3D样本具有大于所述点云帧的较近3D样本且低于所述点云帧的较远3D样本的深度值,所述至少一个中间3D样本以及所述较近和较远3D样本沿着相同投影线被投影。
3.根据权利要求1所述的方法,其中传输表示至少一个中间3D样本的纹理值的纹理补片包括:传输表示在2D网格中定义的所述纹理补片的2D位置和所述纹理补片的大小的至少一个语法元素。
4.根据权利要求3所述的方法,其中所述至少一个语法元素还表示所述2D网格的补片的2D样本的数目。
5.根据权利要求3所述的方法,其中所述至少一个语法元素还表示所述2D网格中的纹理补片的数目和用于确定纹理补片的起始位置的偏移。
6.根据权利要求5所述的方法,其中所述至少一个语法元素还表示纹理补片的索引。
7.根据权利要求1所述的方法,其中所述方法进一步包括:传输另一语法元素,所述另一语法元素指示所述至少一个传输的语法元素是在表示所述点云帧的整个语法的不同层级处传输的。
8.根据权利要求1所述的方法,还包括:
导出所述点云帧到投影平面上的正交投影,以导出至少一个中间3D样本的纹理值;
将所述至少一个纹理值映射到所述至少一个纹理补片中。
9.根据权利要求1所述的方法,其中传输所述至少一个纹理补片包括:
将所述至少一个纹理补片打包成纹理图像;以及
传输所述纹理图像。
10.一种方法,包括:接收表示点云帧的至少一个中间3D样本的纹理值的至少一个纹理补片。
11.根据权利要求10所述的方法,其中所述至少一个中间3D样本是所述点云帧的3D样本,该3D样本具有大于所述点云帧的较近3D样本且低于所述点云帧的较远3D样本的深度值,所述至少一个中间3D样本以及所述较近和较远3D样本沿着相同投影线被投影。
12.根据权利要求10所述的方法,其中接收表示至少一个中间3D样本的纹理值的纹理补片包括:
接收至少一个语法元素,所述至少一个语法元素表示在2D网格中定义的所述纹理补片的2D位置和所述纹理补片的大小;以及
基于所述纹理补片的所述2D位置和所述纹理补片的所述大小,取回所述至少一个纹理补片。
13.根据权利要求12所述的方法,其中所述至少一个语法元素还表示所述2D网格的补片的2D样本的数目。
14.根据权利要求13所述的方法,其中所述至少一个语法元素还表示所述2D网格中的纹理补片的数目和用于确定纹理补片的起始位置的偏移。
15.根据权利要求14所述的方法,其中所述至少一个语法元素还表示纹理补片的索引。
16.根据权利要求10所述的方法,其中所述方法进一步包括:接收另一语法元素,所述另一语法元素指示所述至少一个所接收的语法元素是在表示所述点云帧的整体语法的不同层级处接收的。
17.根据权利要求10所述的方法,还包括:
从所述至少一个接收到的纹理补片导出至少一个纹理值;以及
将所述至少一个纹理值指派给至少一个中间3D样本。
18.一种包括一个或多个处理器的装置,所述一个或多个处理器被配置为传输表示点云帧的至少一个中间3D样本的纹理值的至少一个纹理补片。
19.根据权利要求18所述的装置,其中,所述至少一个中间3D样本是所述点云帧的3D样本,该3D样本具有比所述点云帧的较近3D样本更大且比所述点云帧的较远3D样本更低的深度值,所述至少一个中间3D样本以及所述较近和较远3D样本沿着相同投影线被投影。
20.根据权利要求18所述的装置,其中传输表示至少一个中间3D样本的纹理值的纹理补片包括:传输表示在2D网格中定义的所述纹理补片的2D位置和所述纹理补片的大小的至少一个语法元素。
21.根据权利要求20所述的装置,其中所述至少一个语法元素还表示所述2D网格的补片的2D样本的数目。
22.根据权利要求20所述的装置,其中所述至少一个语法元素还表示所述2D网格中的纹理补片的数目和用于确定纹理补片的起始位置的偏移。
23.根据权利要求22所述的装置,其中所述至少一个语法元素还表示纹理补片的索引。
24.根据权利要求18所述的装置,其中所述一或多个处理器进一步经配置以传输另一语法元素,该另一语法元素指示所述至少一个所传输的语法元素是在表示所述点云帧的整个语法的不同层级处被传输的。
25.根据权利要求18所述的装置,其中所述一或多个处理器进一步经配置以:
导出所述点云帧到投影平面上的正交投影,以导出至少一个中间3D样本的纹理值;
将所述至少一个纹理值映射到所述至少一个纹理补片中。
26.根据权利要求18所述的装置,其中传输所述至少一个纹理补片包括:
将所述至少一个纹理补片打包成纹理图像;以及
传输所述纹理图像。
27.一种包括一个或多个处理器的装置,所述一个或多个处理器被配置为接收表示点云帧的至少一个中间3D样本的纹理值的至少一个纹理补片。
28.根据权利要求27所述的装置,其中,所述至少一个中间3D样本是所述点云帧的3D样本,该3D样本具有比所述点云帧的较近3D样本更大且比所述点云帧的较远3D样本更低的深度值,所述至少一个中间3D样本以及所述较近和较远3D样本沿着相同投影线被投影。
29.根据权利要求27所述的装置,其中接收表示至少一个中间3D样本的纹理值的纹理补片包括:
接收至少一个语法元素,所述至少一个语法元素表示在2D网格中定义的所述纹理补片的2D位置和所述纹理补片的大小;以及
基于所述纹理补片的所述2D位置和所述纹理补片的所述大小,取回所述至少一个纹理补片。
30.根据权利要求29所述的装置,其中所述至少一个语法元素还表示所述2D网格的补片的2D样本的数目。
31.根据权利要求29所述的装置,其中所述至少一个语法元素还表示2D网格中的纹理补片的数量和用于确定纹理补片的起始位置的偏移。
32.根据权利要求31所述的装置,其中所述至少一个语法元素还表示纹理补片的索引。
33.根据权利要求27所述的装置,其中所述一或多个处理器进一步经配置以接收指示所述至少一个所接收的语法元素是在表示所述点云帧的整个语法的不同层级处接收的另一语法元素。
34.根据权利要求27所述的方法,其中所述一或多个处理器进一步经配置以:
从所述至少一个接收到的纹理补片导出至少一个纹理值;以及
将所述至少一个纹理值指派给至少一个中间3D样本。
35.一种比特流,包括表示至少一个纹理补片的数据,所述至少一个纹理补片表示点云的至少一个中间3D样本的纹理值。
36.根据权利要求35所述的比特流,其中所述至少一个在中间的3D样本是所述点云的3D样本,该3D样本具有大于所述点云的较近3D样本且低于所述点云的较远3D样本的深度值,所述至少一个在中间的3D样本以及所述较近和较远的3D样本沿着相同投影线被投影。
37.根据权利要求35所述的比特流,其中表示至少一个中间3D样本的纹理值的纹理补片包括至少一个语法元素,该至少一个语法元素表示在2D网格中定义的所述纹理补片的2D位置和所述纹理补片的大小。
38.根据权利要求37所述的比特流,其中所述至少一个语法元素还表示所述2D网格的补片的2D样本的数目。
39.根据权利要求37所述的比特流,其中,所述至少一个语法元素还表示所述2D网格中的纹理补片的数量和用于确定纹理补片的起始位置的偏移。
40.根据权利要求37所述的比特流,其中所述至少一个语法元素还表示纹理补片的索引。
41.根据权利要求35所述的比特流,其中所述比特流进一步包括指示所述至少一个所传输的语法元素是在表示所述点云帧的整体语法的不同层级处传输的另一语法元素。
42.一种包括指令的计算机程序产品,当所述程序由一个或多个处理器执行时,所述指令使所述一个或多个处理器执行一种方法,所述方法包括传输表示点云帧的至少一个中间3D样本的纹理值的至少一个纹理补片。
43.一种非暂时性计算机可读介质,其包含用于致使一或多个处理器执行传输表示点云帧的至少一个中间3D样本的纹理值的至少一个纹理补片的指令。
44.一种包括指令的计算机程序产品,当所述程序由一个或多个处理器执行时,所述指令使所述一个或多个处理器执行一种方法,所述方法包括接收表示点云帧的至少一个中间3D样本的纹理值的至少一个纹理补片。
45.一种非暂时性计算机可读介质,其包含用于致使一或多个处理器执行接收表示点云帧的至少一个中间3D样本的纹理值的至少一个纹理补片的指令。
CN202080022209.1A 2019-03-20 2020-01-27 处理点云的中间点 Pending CN113632486A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP19305341.0A EP3713238A1 (en) 2019-03-20 2019-03-20 Processing a point cloud
EP19305341.0 2019-03-20
PCT/US2020/015170 WO2020190374A1 (en) 2019-03-20 2020-01-27 Processing the in-between points of a point cloud

Publications (1)

Publication Number Publication Date
CN113632486A true CN113632486A (zh) 2021-11-09

Family

ID=66041384

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080022209.1A Pending CN113632486A (zh) 2019-03-20 2020-01-27 处理点云的中间点

Country Status (8)

Country Link
US (1) US20220191519A1 (zh)
EP (2) EP3713238A1 (zh)
JP (1) JP2022527882A (zh)
KR (1) KR20210134041A (zh)
CN (1) CN113632486A (zh)
AU (1) AU2020241105A1 (zh)
MX (1) MX2021011377A (zh)
WO (1) WO2020190374A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11756234B2 (en) * 2018-04-11 2023-09-12 Interdigital Vc Holdings, Inc. Method for encoding depth values of a set of 3D points once orthogonally projected into at least one image region of a projection plane

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10867414B2 (en) * 2018-04-10 2020-12-15 Apple Inc. Point cloud attribute transfer algorithm
WO2020071703A1 (ko) * 2018-10-01 2020-04-09 엘지전자 주식회사 포인트 클라우드 데이터 전송 장치, 포인트 클라우드 데이터 전송 방법, 포인트 클라우드 데이터 수신 장치 및/또는 포인트 클라우드 데이터 수신 방법
US11122279B2 (en) * 2018-10-02 2021-09-14 Samsung Electronics Co., Ltd. Point cloud compression using continuous surface codes
US10944991B2 (en) * 2018-10-03 2021-03-09 Samsung Electronics Co., Ltd. Prediction for matched patch index coding
US11348284B2 (en) * 2019-01-08 2022-05-31 Apple Inc. Auxiliary information signaling and reference management for projection-based point cloud compression
US20200302655A1 (en) * 2019-03-20 2020-09-24 Lg Electronics Inc. Point cloud data transmission device, point cloud data transmission method, point cloud data reception device and point cloud data reception method
US20230306646A1 (en) * 2022-03-24 2023-09-28 Nokia Technologies Oy Adaptive Filtering of Occupancy Map for Dynamic Mesh Compression

Also Published As

Publication number Publication date
AU2020241105A1 (en) 2021-11-11
MX2021011377A (es) 2021-10-13
EP3942826A1 (en) 2022-01-26
JP2022527882A (ja) 2022-06-07
KR20210134041A (ko) 2021-11-08
US20220191519A1 (en) 2022-06-16
WO2020190374A1 (en) 2020-09-24
EP3713238A1 (en) 2020-09-23

Similar Documents

Publication Publication Date Title
WO2019142163A1 (en) Processing a point cloud
CN111630571A (zh) 处理点云
US20240114143A1 (en) Encoding and decoding a point cloud using patches for in-between samples
US20220164993A1 (en) Processing missing points of a point cloud
US20220191519A1 (en) Processing the in-between points of a point cloud
US20220164992A1 (en) Processing a point cloud
WO2021048050A1 (en) Processing a point cloud
WO2021001193A1 (en) Processing a point cloud
WO2021001186A1 (en) Processing a point cloud
US20220405975A1 (en) Transporting format of a coded point cloud
CN113475093B (zh) 用于处理点云的方法和装置
EP3713240A1 (en) Processing a point cloud
CN112673635A (zh) 处理点云

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination