CN113302940A - 使用单应性变换的点云编码 - Google Patents
使用单应性变换的点云编码 Download PDFInfo
- Publication number
- CN113302940A CN113302940A CN202080008578.5A CN202080008578A CN113302940A CN 113302940 A CN113302940 A CN 113302940A CN 202080008578 A CN202080008578 A CN 202080008578A CN 113302940 A CN113302940 A CN 113302940A
- Authority
- CN
- China
- Prior art keywords
- homography
- matrix
- encoding
- dimensional content
- dimensional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000009466 transformation Effects 0.000 title claims description 33
- 238000000034 method Methods 0.000 claims abstract description 42
- 239000011159 matrix material Substances 0.000 claims description 86
- 230000005540 biological transmission Effects 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 12
- 230000006835 compression Effects 0.000 description 7
- 238000007906 compression Methods 0.000 description 7
- 230000011218 segmentation Effects 0.000 description 7
- 238000000844 transformation Methods 0.000 description 6
- 238000011426 transformation method Methods 0.000 description 5
- 238000013507 mapping Methods 0.000 description 4
- 238000012856 packing Methods 0.000 description 4
- 101000638069 Homo sapiens Transmembrane channel-like protein 2 Proteins 0.000 description 2
- 102100032054 Transmembrane channel-like protein 2 Human genes 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000002310 reflectometry Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/06—Topological mapping of higher dimensional structures onto lower dimensional surfaces
- G06T3/067—Reshaping or unfolding 3D tree structures onto 2D planes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/50—Depth or shape recovery
- G06T7/536—Depth or shape recovery from perspective effects, e.g. by using vanishing points
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/007—Transform coding, e.g. discrete cosine transform
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/18—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/20—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/649—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding the transform being applied to non rectangular image segments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Discrete Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
使用单应性变换的点云编码方法发送3D面片的单应性变换,而不是明确的投影值(例如边界框和面片定向、旋转)。该方法具有更紧凑的表示法,在传输方面更高效,并且允许更快的解码,特别是在3D点将被重新投影的情况下。
Description
相关申请的交叉引用
本申请按照35 U.S.C.§119(e)要求于2019年1月18日提交的序列号为62/794,091的美国临时专利申请“POINT CLOUD CODING USING HOMOGRAPHY TRANSFORM”的优先权,该申请通过引用整体包含在本文中以用于所有目的。
技术领域
本发明涉及三维图形。更具体地,本发明涉及三维图形的编码。
背景技术
点云已被视为或者由3D扫描仪、LIDAR传感器捕捉,或者在诸如虚拟现实/增强现实(VR/AR)之类流行应用中使用的3D数据的候选传输格式。点云是3D空间中的一组点。除空间位置(X,Y,Z)之外,每个点通常具有关联的属性,比如颜色(R,G,B),或者甚至反射率和时间戳(例如,在LIDAR图像中)。为了获得目标3D对象的高保真表示,设备捕捉大约数千个甚至数百万个点的点云。此外,对于在VR/AR应用中使用的动态3D场景,每一帧通常具有独特的密集点云,这导致每秒数百万个点云的传输。对于这种大量数据的可行传输,通常采用压缩。
在2017年,MPEG发布了关于点云的压缩的提案征集(call for proposal,CfP)。在评估了几种提案之后,MPEG正在考虑用于点云压缩的两种不同技术:3D原生编码技术(基于八叉树和类似的编码方法),或者3D到2D投影,随后是传统的视频编码。在动态3D场景的情况下,MPEG正在使用基于面片(patch)表面建模,面片从3D图像到2D图像的投影,以及用诸如HEVC之类的视频编码器对2D图像编码的测试模型软件(TMC2)。该方法已被证明比原生3D编码更高效,并且能够在可接受的质量下实现有竞争力的比特率。
当对点云编码时,TMC2对与面片投影相关的辅助信息(比如2D画布图像中的面片位置和边界框大小)编码。对于辅助信息的时间编码,来自当前点云的面片和来自即刻解码的点云的面片之间的面片匹配被用于预测。该过程限于相邻帧,并且包括对序列中的所有帧进行增量(delta)编码。
发明内容
使用单应性变换的点云编码方法发送3D面片的单应性变换,而不是明确的投影值(例如,边界框和面片定向、旋转)。该方法具有更紧凑的表示法(notation),在传输方面更高效,并且允许更快的解码,特别是在3D点将被重新投影的情况下。
在一个方面,一种在设备的非临时性存储器中编程的方法包括获取三维内容,并使用单应性变换对三维内容编码。使用单应性变换对三维内容编码包括将三维内容转换为二维内容。使用单应性变换对三维内容编码包括传送三维到二维变换的单应性变换系数。使用单应性变换对三维内容编码包括计算单应性矩阵。单应性矩阵是从三个矩阵计算的。所述三个矩阵包括观察矩阵、投影矩阵和视口矩阵。观察矩阵表示相机,投影矩阵表示相机的传感器中的像素,而视口矩阵表示相机中的像素到图像中的像素的变换。
在另一个方面,一种设备包括:用于存储应用的非临时性存储器,所述应用用于:获取三维内容,并使用单应性变换对三维内容编码;和耦接到所述存储器的处理器,所述处理器配置为处理所述应用。使用单应性变换对三维内容编码包括将三维内容转换为二维内容。使用单应性变换对三维内容编码包括传送三维到二维变换的单应性变换系数。使用单应性变换对三维内容编码包括计算单应性矩阵。单应性矩阵是从三个矩阵计算的。所述三个矩阵包括观察矩阵、投影矩阵和视口矩阵。观察矩阵表示相机,投影矩阵表示相机的传感器中的像素,而视口矩阵表示相机中的像素到图像中的像素的变换。
在另一个方面,一种系统包括用于获取三维内容的一个或多个相机,和用于使用单应性变换对三维内容编码的编码器。使用单应性变换对三维内容编码包括将三维内容转换为二维内容。使用单应性变换对三维内容编码包括传送三维到二维变换的单应性变换系数。使用单应性变换对三维内容编码包括计算单应性矩阵。单应性矩阵是从三个矩阵计算的。所述三个矩阵包括观察矩阵、投影矩阵和视口矩阵。观察矩阵表示相机,投影矩阵表示相机的传感器中的像素,而视口矩阵表示相机中的像素到图像中的像素的变换。
附图说明
图1图解说明按照一些实施例的点云映射的方法的流程图。
图2图解说明按照一些实施例的用于分割的投影的示图。
图3图解说明按照一些实施例的对数据进行编码的表示。
图4图解说明按照一些实施例的基于相机投影的面片(patch)生成的示图。
图5图解说明按照一些实施例的如何构造单应性变换的示图。
图6图解说明按照一些实施例的实现使用单应性变换方法的点云编码的图形流水线的流程图。
图7图解说明按照一些实施例的例证V-PCC比特流结构。
图8图解说明按照一些实施例的例证面片帧层单元语法。
图9图解说明按照一些实施例的例证面片帧头语法。
图10图解说明按照一些实施例的例证面片帧数据单元语法。
图11图解说明按照一些实施例的例证面片信息数据语法。
图12图解说明按照一些实施例的例证面片数据单元语法。
图13图解说明按照一些实施例的增量(delta)面片数据单元语法。
图14图解说明按照一些实施例的例证PCM面片数据单元语法。
图15图解说明按照一些实施例的例证单应性面片数据单元语法。
图16图解说明按照一些实施例的用于从单应性面片重构点云的矩阵。
图17图解说明按照一些实施例的配置成实现使用单应性变换的点云编码的例证计算设备的方框图。
具体实施方式
使用视频编码器的点云压缩的现有技术将点云表示为3D面片,并将通过几何和属性的投影形成的2D图像编码到2D画布中。3D点到2D点的映射是考虑到几个不同的选项,比如方向平面和面片定向来进行的。目前,点云压缩标准将所有这些选项编码在辅助数据结构中,并将其发送到解码器,解码器重构3D点。由于这些点将被用于渲染,因此将对这些点应用另一个变换以重新投影它们。本文中描述的方法直接传送单应性变换,这可以实现点云的快速渲染。此外,该方法在压缩效率方面更加紧凑。
与以前的点云压缩方案相比,本文中描述的方法发送3D面片的单应性变换,而不是明确的投影值(例如,边界框和面片定向、旋转)。该方法具有更紧凑的表示法,在传输方面更高效,并且允许更快的解码,特别是在3D点将被重新投影的情况下(例如,当在移动电话中生成视频时)。
本文中描述了一种用于将3D点云数据编码为2D表面的新方法。该方法利用3D表面面片来表示点云,并将3D点的一系列单应性变换传送到2D面片表面。
在使用视频编码器的3D点云编码中,使用从3D到2D的投影来生成将表示该点云的视频。生成这些视频的最高效方式是使用3D面片,3D面片分割对象的表面,并使用正交投影来生成被捆绑在一起并用作视频编码器的输入的分割深度图像。然而,指示如何在3D中重构投影点的一些辅助信息连同视频图像一起被传送。目前在比特流中明确地发送诸如边界框和面片定向、位移之类的值。
如本文中所述,用于将点从2D重新投影到3D的辅助数据被表示为单应性变换。单应性变换被广泛用于投影几何中,用于定义3D点和2D面之间的投影。通过发送投影矩阵,辅助数据表示能够被更高效地编码。此外,该单应性变换能够与其他单应性变换结合使用,以将点直接从2D面片重新投影到观察投影,避免了与目前的使用确切值的2D到3D投影关联的高成本操作。
图1图解说明按照一些实施例的点云映射的方法的流程图。获取3D点云100(例如,由相机/摄像机捕捉、接收自另一设备、下载)。在步骤110,对于3D点云估计法线。估计法线包括建立kd树,检查本地邻域(例如,k最近邻),计算最佳的近似切平面(使用协方差分析),实现法线平滑,并确定法线定向(最小生成树传播)。在步骤112,实现初始分割。初始分割包括按照6个定向(+X、-X、+Y、-Y、+Z、-Z)对点进行分类。初始分割按照固定定向对点进行分类。在分类之后,定向被投影到平面上。一旦确定了一簇点,就将这些点投影在同一平面上。投影这些点限定了这些点的边界框。在步骤114,细化分割。细化分割包括使用邻域来平滑像素分类(例如,使指定的分数最大化)。在步骤116,分割面片。分割面片包括计算邻接信息,提取面片,实现深度过滤和定位遗漏点。3D点云映射导致2D图像102。在一些实施例中,实现较少或额外的步骤。在一些实施例中,步骤的顺序被更改。
图2图解说明按照一些实施例的用于分割的投影的示图。与以前的只允许在平行于x、y、z轴的表面上的投影的实施不同,本文中描述的方法能够通过使用单应性变换,在任何位置投影到平面上。单应性变换(或转换)将3D点映射成2D(反之亦然)。
用于正射投影的矩阵能够由定义裁剪平面的6元组(左、右、下,上,近、远)定义。这些平面形成最小拐角在(左、下、-近)和最大拐角在(右、上、-远)的框。
图3图解说明按照一些实施例的对数据进行编码的表示。表示300示出了以前的实现如何表示固定投影信息,所述固定投影信息包括每个面片的诸如U0、V0、大小U0和大小V0之类的信息。表示302是包括每个面片的单应性变换信息(例如,图2中所示的矩阵的系数)的当前实现。通过使用单应性变换,系统不关心边界框被投影在哪个平面上。
图4图解说明按照一些实施例的基于相机投影的面片生成的示图。使用相机402捕捉3D模型/目标400的点云。在一些实施例中,相机402是沿着x、y和z轴放置的。获取点云,然后分割面片。定位具有相似特性的点(例如,投影图像404中的网格406之中的所有点),并将其投影到同一平面上。3D位置是从点到在投影图像404中编码的表面或网格406的距离。发送指示平面中的哪些平面(例如+X平面)被选择的索引,所述平面用于生成边界框。所有的信息能够被表示为单应性变换。
图5图解说明按照一些实施例如何构造单应性变换的示图。单应性变换是相乘的三个矩阵(例如,观察矩阵、投影矩阵和视口矩阵)。所述矩阵是基于与各个相机矩阵关联的相机(例如R0,0)的旋转而生成的。操作(例如,投影矩阵)能够按照诸如U1、V1和D1之类的值移动投影。矩阵之一(例如,视口矩阵)确定表面并将该表面映射到2D画布。
观察矩阵(ViewMat)表示相机,投影矩阵(ProjMat)表示相机传感器中的像素,视口矩阵(ViewportMat)表示相机中的像素到图像中的像素的变换。单应性变换能够应用于3D像素以将像素映射到2D表面。也能够实现诸如缩放、剪切、透视投影之类的操作。
图6图解说明按照一些实施例的实现使用单应性变换方法的点云编码的图形流水线的流程图。在步骤600,输入模型(x,y,z)顶点。在步骤602,应用模型视图变换。在步骤604,应用投影变换。在步骤606,应用归一化和裁剪变换。在步骤608,应用视口变换。在步骤610,实现栅格化。在步骤612,应用明暗处理。在步骤614,应用合成来生成2D表示。在一些实施例中,实现较少或者额外的步骤。在一些实施例中,步骤的顺序被更改。
在一些实施例中,对单应性变换编码包括使用算术编码器分别对每个系数(浮点)编码。
图7图解说明按照一些实施例的例证V-PCC比特流结构。图8图解说明按照一些实施例的例证面片帧层单元语法。图9图解说明按照一些实施例的例证面片帧头语法。
图10图解说明按照一些实施例的例证面片帧数据单元语法。pfdu_patch_mode[frmIdx][p]指示对于索引为frmIdx的面片帧中的索引为p的面片的面片模式。对于pfh_type[frmIdx]=I的面片帧,pfdu_patch_mode[frmIdx][p]的允许值在1000中指定,而对于pfh_type[frmIdx]=P的面片帧,pfdu_patch_mode[frmIdx][p]的允许值在1002中指定。
图11图解说明按照一些实施例的例证面片信息数据语法。
图12图解说明按照一些实施例的例证面片数据单元语法。pdu_lod[frmIdx][p]指定将应用于面片帧frmIdx的索引为p的面片的LOD缩放因子。帧frmIdx中的面片p的重构点3D位置在它们从2D投影之后,并在应用任何进一步的变换之前将按2pdu_lod[frmIdx][p]被缩放。如果不存在pdu_lod[frmIdx][p],那么其值应被推断为等于0。
等于0的pdu_projection_mode[frmIdx][p]指定面片帧frmIdx的索引为p的面片被投影到近投影平面上。等于1的pdu_projection_mode[frmIdx][p]指定该面片被投影到远投影平面上。当不存在pdu_projection_mode[frmIdx][p]时,其值应被推断为等于0。
图13图解说明按照一些实施例的增量(delta)面片数据单元语法。
图14图解说明按照一些实施例的例证PCM面片数据单元语法。ppdu_patch_in_pcm_video_flag[frmIdx][p]指定与帧内和帧间编码面片的几何和属性数据相比,与索引为frmIdx的面片帧中的PCM编码面片p关联的几何和属性数据是否是在单独的视频中编码。如果ppdu_patch_in_pcm_video_flag[frmIdx][p]等于0,那么与索引为frmIdx的面片帧中的PCM编码面片p关联的几何和属性数据是在与帧内和帧间编码面片的几何和属性数据相同的视频中编码的。如果ppdu_patch_in_pcm_video_flag[frmIdx][p]等于1,那么与索引为frmIdx的面片帧中的PCM编码面片p关联的几何和属性数据是在与帧内和帧间编码面片的几何和属性数据分离的视频中编码的。ppdu_pcm_points[frmIdx][p]指定存在于索引为frmIdx的面片帧中的PCM编码面片p中的pcm点的数量。ppdu_pcm_points[frmIdx][p]的值应在0~(Patch2dSizeU[frmIdx][p]*Patch2dSizeU[frmIdx][p]/3)(含端点)的范围之中。
图15图解说明按照一些实施例的例证单应性面片数据单元语法。hpdu_2d_shift_u[frmIdx][p]指定索引为frmIdx的面片帧中的面片p的表示为ops_occupancy_packing_block_size的倍数的面片边界框大小的左上角的x坐标。hpdu_2d_shift_u[frmIdx][p]的值应在0~Min(2pfh_2d_shift_u_bit_count_minus1[frmIdx]+1-1,sps_frame_width/ops_occupancy_packing_block_size-1)(含端点)的范围之中。hpdu_2d_shift_v[frmIdx][p]指定表示为ops_occupancy_packing_block_size的倍数的索引为frmIdx的面片帧中的面片p的面片边界框大小的左上角的y坐标。hpdu_2d_shift_v[frmIdx][p]的值应在0~Min(2pfh_2d_shift_v_bit_count_minus1[frmIdx]+1-1,sps_frame_height/ops_occupancy_packing_block_size-1)(含端点)的范围之中。当p等于0时,hpdu_2d_delta_size_u[frmIdx][p]指定索引为frmIdx的面片帧中索引为0的面片的宽度值。当p大于0时,hpdu_2d_delta_size_u[frmIdx][p]指定索引为p的面片与索引为(p-1)的面片的宽度值之差。当p等于0时,hpdu_2d_delta_size_v[frmIdx][p]指定索引为frmIdx的面片帧中索引为0的面片的高度值。当p大于0时,hpdu_2d_delta_size_v[frmIdx][p]指定索引为p的面片与索引为(p-1)的面片的高度值之差。hpdu_orientation_swap_flag[frmIdx][p]指示按照表格是否使用面片帧frmIdx的索引为p的面片的面片定向。如果不存在pdu_orientation_swap_flag[frmIdx][p],那么其值应被推断为等于0。hpdu_homography_transform[frmIdx][patchIndex][i][j]指定4×4单应性矩阵的系数[i][j]。单应性变换允许对于面片的变换,比如不同的面片定向、不同的相机方向等。
实现对于以单应性模式编码的面片单元的解码处理。该处理的输入是当前面片帧索引frmIdx和当前面片索引p。给定面片数据单元中的被解析元素,首先分配以下与面片相关的变量:
Patch2dShiftU[frmIdx][p]=pdu_2d_shift_u[frmIdx][p]
*ops_occupancy_packing_block_size (8-6)
Patch2dShiftV[frmIdx][p]=pdu_2d_shift_v[frmIdx][p]
*ops_occupancy_packing_block_size (8-7)
随后如下导出变量Patch2dSizeU[frmIdx][p]和Patch2dSizeV[frmIdx][p]:
如果p等于0,那么:
Patch2dSizeU[frmIdx][p]=pdu_2d_delta_size_u[frmIdx][p]*ops_occupancy_packing_block_size (8-8)
Patch2dSizeV[frmIdx][p]=pdu_2d_delta_size_v[frmIdx][p]*ops_occupancy_packing_block_size (8-9)
否则,如果(p>0),那么:
Patch2dSizeU[frmIdx][p]=Patch2dSizeU[frmIdx][p-1]+pdu_2d_delta_size_u[frmIdx][p]*ops_occupancy_packing_block_size (8-10)
Patch2dSizeV[frmIdx][p]=Patch2dSizeV[frmIdx][p-1]+pdu_2d_delta_size_v[frmIdx][p]*ops_occupancy_packing_block_size (8-11)
图16图解说明按照一些实施例的用于从单应性面片重构点云的矩阵。通过将单应性变换乘以由画布中的位置和深度值形成的齐次坐标表示法中的向量,简单地生成输出点云。
用信号通知单应性变换的另一种方式是向面片数据单元添加标志,并用信号通知将发送更多信息,即单应性变换系数。
图17图解说明按照一些实施例的配置成实现使用单应性变换的点云编码的例证计算设备的方框图。计算设备1700能够用于获取、存储、计算、处理、通信和/或显示诸如包括3D内容的图像和视频之类的信息。计算设备1700能够实现点云编码的任何方面。通常,适合于实现计算设备1700的硬件结构包括网络接口1702、存储器1704、处理器1706、一个或多个I/O设备1708、总线1710和存储设备1712。处理器的选择并不重要,只要选择具有足够速度的适当处理器即可。存储器1704能够是本领域已知的任何常规计算机存储器。存储设备1712能够包括硬盘驱动器、CDROM、CDRW、DVD、DVDRW、高清光盘/驱动器、超高清驱动器、闪存卡或任何其他存储设备。计算设备1700能够包括一个或多个网络接口1702。网络接口的例子包括连接到以太网或其他类型的LAN的网卡。I/O设备1708能够包括以下中的一个或多个:键盘、鼠标、监视器、屏幕、打印机、调制解调器、触摸屏、按钮接口和其他设备。用于实现点云编码的点云编码应用1730可能存储在存储设备1712和存储器1704中,并且按照通常处理应用的方式被处理。计算设备1700中能够包括图17中所示的更多或更少的组件。在一些实施例中,包括点云编码硬件1720。尽管图17中的计算设备1700包括用于点云编码的应用1730和硬件1720,但点云编码能够在计算设备上用硬件、固件、软件或它们的任何组合来实现。例如,在一些实施例中,点云编码应用1730被编码在存储器中,并使用处理器来执行。在另一个例子中,在一些实施例中,点云编码硬件1720是编程的硬件逻辑,包括专门为实现点云编码而设计的逻辑门。
在一些实施例中,点云编码应用1730包括几个应用和/或模块。在一些实施例中,模块还包括一个或多个子模块。在一些实施例中,能够包括更少或额外的模块。
在一些实施例中,点云编码硬件1720包括诸如镜头、图像传感器和/或任何其他相机组件之类的相机组件。
适当的计算设备的例子包括个人计算机、膝上型计算机、计算机工作站、服务器、大型计算机、手持式计算机、个人数字助手、蜂窝/移动电话、智能家电、游戏机、数字相机、数字摄像机、照相手机、智能电话、便携式音乐播放器、平板计算机、移动设备、视频播放器、视频光盘刻录机/播放器(例如,DVD刻录机/播放器、高清光盘刻录机/播放器、超高清光盘刻录机/播放器)、电视机、家庭娱乐系统、增强现实设备、虚拟现实设备、智能珠宝(例如智能手表)、车辆(例如自动驾驶车辆)或任何其他适当的计算设备。
为了利用使用单应性变换方法的点云编码,设备获取或接收3D内容,并且以优化的方式处理和/或发送所述内容,以使得能够适当、高效地显示3D内容。点云编码能够在用户帮助下实现,或者可以在没有用户参与的情况下自动实现。
操作中,使用单应性变换方法的点云编码发送3D面片的单应性变换,而不是明确的投影值(比如边界框和面片定向、旋转)。该方法具有更紧凑的表示法,在传输方面更高效,并且允许更快的解码,特别是在3D点将被重新投影的情况下(例如,当在移动电话中生成视频时)。测试表明,与以前的实现相比,使用利用单应性变换方法的点云编码提高了性能。
使用单应性变换(面片)的其他优点包括:利用任何方向(不仅仅是6个轴对准的定向)(例如,利用单应性变换能够对10个投影建模);能够使用不同类型的相机(在深度和纹理上使用的正射X透视相机),生成与2D纹理(仅解码属性),2D+深度纹理(解码属性和单应性面片)和点云(解码全部)兼容的向后兼容的比特流;并且单应性面片与当前的面片定义(例如,使用当前表示法能够获得单应性变换)、帧内/帧间能力兼容。
使用单应性变换的点云编码的一些实施例
1、一种在设备的非临时性存储器中编程的方法,所述方法包括:
获取三维内容;和
使用单应性变换对三维内容编码。
2、按照条款1所述的方法,其中使用单应性变换对三维内容编码包括将三维内容转换为二维内容。
3、按照条款1所述的方法,其中使用单应性变换对三维内容编码包括传送三维到二维变换的单应性变换系数。
4、按照条款1所述的方法,其中使用单应性变换对三维内容编码包括计算单应性矩阵。
5、按照条款4所述的方法,其中单应性矩阵是从三个矩阵计算的。
6、按照条款5所述的方法,其中所述三个矩阵包括观察矩阵、投影矩阵和视口矩阵。
7、按照条款6所述的方法,其中观察矩阵表示相机,投影矩阵表示相机的传感器中的像素,而视口矩阵表示相机中的像素到图像中的像素的变换。
8、一种设备,包括:
用于存储应用的非临时性存储器,所述应用用于:
获取三维内容;和
使用单应性变换对三维内容编码;和
耦接到所述存储器的处理器,所述处理器配置为处理所述应用。
9、按照条款8所述的设备,其中使用单应性变换对三维内容编码包括将三维内容转换为二维内容。
10、按照条款8所述的设备,其中使用单应性变换对三维内容编码包括传送三维到二维变换的单应性变换系数。
11、按照条款8所述的设备,其中使用单应性变换对三维内容编码包括计算单应性矩阵。
12、按照条款11所述的设备,其中单应性矩阵是从三个矩阵计算的。
13、按照条款12所述的设备,其中所述三个矩阵包括观察矩阵、投影矩阵和视口矩阵。
14、按照条款13所述的设备,其中观察矩阵表示相机,投影矩阵表示相机的传感器中的像素,而视口矩阵表示相机中的像素到图像中的像素的变换。
15、一种系统,包括:
用于获取三维内容的一个或多个相机;和
用于使用单应性变换对三维内容编码的编码器。
16、按照条款15所述的系统,其中使用单应性变换对三维内容编码包括将三维内容转换为二维内容。
17、按照条款15所述的系统,其中使用单应性变换对三维内容编码包括传送三维到二维变换的单应性变换系数。
18、按照条款15所述的系统,其中使用单应性变换对三维内容编码包括计算单应性矩阵。
19、按照条款18所述的系统,其中单应性矩阵是从三个矩阵计算的。
20、按照条款19所述的系统,其中所述三个矩阵包括观察矩阵、投影矩阵和视口矩阵。
21、按照条款20所述的系统,其中观察矩阵表示相机,投影矩阵表示相机的传感器中的像素,而视口矩阵表示相机中的像素到图像中的像素的变换。
通过具体实施例说明了本发明,所述具体实施例包含便于理解本发明的构成和操作原理的细节。本文中对特定实施例及其细节的这种参考并不意图限制所附的权利要求书的范围。对本领域的技术人员来说,显然可以在为举例说明而选择的实施例中进行其他各种修改,而不脱离由权利要求书所限定的本发明的精神和范围。
Claims (21)
1.一种在设备的非临时性存储器中编程的方法,所述方法包括:
获取三维内容;和
使用单应性变换对三维内容编码。
2.按照权利要求1所述的方法,其中使用单应性变换对三维内容编码包括将三维内容转换为二维内容。
3.按照权利要求1所述的方法,其中使用单应性变换对三维内容编码包括传送三维到二维变换的单应性变换系数。
4.按照权利要求1所述的方法,其中使用单应性变换对三维内容编码包括计算单应性矩阵。
5.按照权利要求4所述的方法,其中单应性矩阵是从三个矩阵计算的。
6.按照权利要求5所述的方法,其中所述三个矩阵包括观察矩阵、投影矩阵和视口矩阵。
7.按照权利要求6所述的方法,其中观察矩阵表示相机,投影矩阵表示相机的传感器中的像素,而视口矩阵表示相机中的像素到图像中的像素的变换。
8.一种设备,包括:
用于存储应用的非临时性存储器,所述应用用于:
获取三维内容;和
使用单应性变换对三维内容编码;和
耦接到所述存储器的处理器,所述处理器配置为处理所述应用。
9.按照权利要求8所述的设备,其中使用单应性变换对三维内容编码包括将三维内容转换为二维内容。
10.按照权利要求8所述的设备,其中使用单应性变换对三维内容编码包括传送三维到二维变换的单应性变换系数。
11.按照权利要求8所述的设备,其中使用单应性变换对三维内容编码包括计算单应性矩阵。
12.按照权利要求11所述的设备,其中单应性矩阵是从三个矩阵计算的。
13.按照权利要求12所述的设备,其中所述三个矩阵包括观察矩阵、投影矩阵和视口矩阵。
14.按照权利要求13所述的设备,其中观察矩阵表示相机,投影矩阵表示相机的传感器中的像素,而视口矩阵表示相机中的像素到图像中的像素的变换。
15.一种系统,包括:
用于获取三维内容的一个或多个相机;和
用于使用单应性变换对三维内容编码的编码器。
16.按照权利要求15所述的系统,其中使用单应性变换对三维内容编码包括将三维内容转换为二维内容。
17.按照权利要求15所述的系统,其中使用单应性变换对三维内容编码包括传送三维到二维变换的单应性变换系数。
18.按照权利要求15所述的系统,其中使用单应性变换对三维内容编码包括计算单应性矩阵。
19.按照权利要求18所述的系统,其中单应性矩阵是从三个矩阵计算的。
20.按照权利要求19所述的系统,其中所述三个矩阵包括观察矩阵、投影矩阵和视口矩阵。
21.按照权利要求20所述的系统,其中观察矩阵表示相机,投影矩阵表示相机的传感器中的像素,而视口矩阵表示相机中的像素到图像中的像素的变换。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962794091P | 2019-01-18 | 2019-01-18 | |
US62/794,091 | 2019-01-18 | ||
US16/525,175 US11190803B2 (en) | 2019-01-18 | 2019-07-29 | Point cloud coding using homography transform |
US16/525,175 | 2019-07-29 | ||
PCT/IB2020/050101 WO2020148603A1 (en) | 2019-01-18 | 2020-01-08 | Point cloud coding using homography transform |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113302940A true CN113302940A (zh) | 2021-08-24 |
Family
ID=71609268
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080008578.5A Pending CN113302940A (zh) | 2019-01-18 | 2020-01-08 | 使用单应性变换的点云编码 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11190803B2 (zh) |
EP (1) | EP3891991A1 (zh) |
JP (1) | JP7371691B2 (zh) |
KR (1) | KR20210096234A (zh) |
CN (1) | CN113302940A (zh) |
WO (1) | WO2020148603A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210134391A (ko) * | 2019-03-12 | 2021-11-09 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 포인트 클라우드 코딩을 위한 패치 데이터 유닛 코딩 및 디코딩 |
CN118042135A (zh) * | 2019-03-19 | 2024-05-14 | 华为技术有限公司 | 点云编码方法、点云解码方法、装置及存储介质 |
CN114503579A (zh) * | 2019-09-24 | 2022-05-13 | 交互数字Vc控股法国有限公司 | 使用中间样品的贴片对点云进行编码和解码 |
CN116778128B (zh) * | 2023-08-15 | 2023-11-17 | 武汉大学 | 一种基于三维重建的对抗补丁重投影方法及系统 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040155965A1 (en) * | 2002-12-03 | 2004-08-12 | University Of Kentucky Research Foundation | Monitoring and correction of geometric distortion in projected displays |
US20110025929A1 (en) * | 2009-07-31 | 2011-02-03 | Chenyu Wu | Light Transport Matrix from Homography |
US20120002014A1 (en) * | 2010-07-02 | 2012-01-05 | Disney Enterprises, Inc. | 3D Graphic Insertion For Live Action Stereoscopic Video |
CN102821323A (zh) * | 2012-08-01 | 2012-12-12 | 成都理想境界科技有限公司 | 基于增强现实技术的视频播放方法、系统及移动终端 |
CN102903130A (zh) * | 2012-08-21 | 2013-01-30 | 苏州两江科技有限公司 | 二维视频图像中目标的二维图像重建方法 |
CN103226811A (zh) * | 2012-01-27 | 2013-07-31 | 索尼公司 | 图像处理器、图像处理方法、学习设备、学习方法和程序 |
CN104010560A (zh) * | 2011-12-21 | 2014-08-27 | 皇家飞利浦有限公司 | 来自体积模态的结构到未校准内窥镜的视频上的叠加与运动补偿 |
US20150310604A1 (en) * | 2014-04-24 | 2015-10-29 | General Electric Company | System and method for image based inspection of an object |
US20160196634A1 (en) * | 2015-01-07 | 2016-07-07 | Canon Kabushiki Kaisha | Information processing apparatus, control method of the same, and video camera |
CN106134197A (zh) * | 2013-12-27 | 2016-11-16 | 日本电信电话株式会社 | 视频编码方法、视频解码方法、视频编码装置、视频解码装置、视频编码程序以及视频解码程序 |
CN107194983A (zh) * | 2017-05-16 | 2017-09-22 | 华中科技大学 | 一种基于点云与影像数据的三维可视化方法和系统 |
US20180205963A1 (en) * | 2017-01-17 | 2018-07-19 | Seiko Epson Corporation | Encoding Free View Point Data in Movie Data Container |
CN108810571A (zh) * | 2017-05-04 | 2018-11-13 | 汤姆逊许可公司 | 编码和解码二维点云的方法和设备 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4199159B2 (ja) * | 2004-06-09 | 2008-12-17 | 株式会社東芝 | 描画処理装置、描画処理方法、及び描画処理プログラム |
JP2006146760A (ja) * | 2004-11-24 | 2006-06-08 | Aisin Seiki Co Ltd | 画像変換方法及び画像変換装置 |
WO2012126135A1 (en) * | 2011-03-21 | 2012-09-27 | Intel Corporation | Method of augmented makeover with 3d face modeling and landmark alignment |
CN103414861B (zh) | 2013-08-21 | 2016-12-28 | 浙江大学 | 一种投影仪画面自适应几何矫正的方法 |
US11514613B2 (en) | 2017-03-16 | 2022-11-29 | Samsung Electronics Co., Ltd. | Point cloud and mesh compression using image/video codecs |
JP6905184B2 (ja) * | 2017-06-07 | 2021-07-21 | 富士通株式会社 | 画像圧縮プログラム、画像圧縮装置、及び画像圧縮方法 |
EP3429210A1 (en) * | 2017-07-13 | 2019-01-16 | Thomson Licensing | Methods, devices and stream for encoding and decoding volumetric video |
US10779011B2 (en) * | 2017-07-31 | 2020-09-15 | Qualcomm Incorporated | Error concealment in virtual reality system |
US10424083B2 (en) * | 2017-10-21 | 2019-09-24 | Samsung Electronics Co., Ltd. | Point cloud compression using hybrid transforms |
-
2019
- 2019-07-29 US US16/525,175 patent/US11190803B2/en active Active
-
2020
- 2020-01-08 JP JP2021541522A patent/JP7371691B2/ja active Active
- 2020-01-08 KR KR1020217020599A patent/KR20210096234A/ko not_active Application Discontinuation
- 2020-01-08 CN CN202080008578.5A patent/CN113302940A/zh active Pending
- 2020-01-08 WO PCT/IB2020/050101 patent/WO2020148603A1/en unknown
- 2020-01-08 EP EP20701882.1A patent/EP3891991A1/en active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040155965A1 (en) * | 2002-12-03 | 2004-08-12 | University Of Kentucky Research Foundation | Monitoring and correction of geometric distortion in projected displays |
US20110025929A1 (en) * | 2009-07-31 | 2011-02-03 | Chenyu Wu | Light Transport Matrix from Homography |
US20120002014A1 (en) * | 2010-07-02 | 2012-01-05 | Disney Enterprises, Inc. | 3D Graphic Insertion For Live Action Stereoscopic Video |
CN104010560A (zh) * | 2011-12-21 | 2014-08-27 | 皇家飞利浦有限公司 | 来自体积模态的结构到未校准内窥镜的视频上的叠加与运动补偿 |
CN103226811A (zh) * | 2012-01-27 | 2013-07-31 | 索尼公司 | 图像处理器、图像处理方法、学习设备、学习方法和程序 |
CN102821323A (zh) * | 2012-08-01 | 2012-12-12 | 成都理想境界科技有限公司 | 基于增强现实技术的视频播放方法、系统及移动终端 |
CN102903130A (zh) * | 2012-08-21 | 2013-01-30 | 苏州两江科技有限公司 | 二维视频图像中目标的二维图像重建方法 |
CN106134197A (zh) * | 2013-12-27 | 2016-11-16 | 日本电信电话株式会社 | 视频编码方法、视频解码方法、视频编码装置、视频解码装置、视频编码程序以及视频解码程序 |
US20150310604A1 (en) * | 2014-04-24 | 2015-10-29 | General Electric Company | System and method for image based inspection of an object |
US20160196634A1 (en) * | 2015-01-07 | 2016-07-07 | Canon Kabushiki Kaisha | Information processing apparatus, control method of the same, and video camera |
US20180205963A1 (en) * | 2017-01-17 | 2018-07-19 | Seiko Epson Corporation | Encoding Free View Point Data in Movie Data Container |
CN108810571A (zh) * | 2017-05-04 | 2018-11-13 | 汤姆逊许可公司 | 编码和解码二维点云的方法和设备 |
CN107194983A (zh) * | 2017-05-16 | 2017-09-22 | 华中科技大学 | 一种基于点云与影像数据的三维可视化方法和系统 |
Non-Patent Citations (4)
Title |
---|
"A Calibration Method for Structured Light Systems Based on a Virtual Camera", 2015 8TH INTERNATIONAL CONGRESS ON IMAGE AND SIGNAL PROCESSING (CISP2015), 20 August 2015 (2015-08-20), pages 2 - 3 * |
"Lenslet Light Field Imaging Scalable Coding", 2018 26TH EUROPEAN SIGNAL PROCESSING CONFERENCE, 3 September 2018 (2018-09-03), pages 3 - 4 * |
DANILLO GRAZIOSI(SONY): "[VPCC]New Contribution on Patch Coding", MPEG MEETING NO.M47505, 20 March 2019 (2019-03-20), pages 1 - 3 * |
PAWAN HARISH ET AL: "Designing Perspectively Correct Multiplanar Displays", IEEE TRANSACTIONS ON VISUALIZATION AND COMPUTER GRAPHICS, vol. 19, no. 3, pages 3 * |
Also Published As
Publication number | Publication date |
---|---|
US20200236401A1 (en) | 2020-07-23 |
JP7371691B2 (ja) | 2023-10-31 |
US11190803B2 (en) | 2021-11-30 |
EP3891991A1 (en) | 2021-10-13 |
WO2020148603A1 (en) | 2020-07-23 |
JP2022519462A (ja) | 2022-03-24 |
KR20210096234A (ko) | 2021-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11562507B2 (en) | Point cloud compression using video encoding with time consistent patches | |
US11348285B2 (en) | Mesh compression via point cloud representation | |
KR102431117B1 (ko) | 포인트 클라우드 맵핑 | |
US11836953B2 (en) | Video based mesh compression | |
JP7371691B2 (ja) | ホモグラフィ変換を使用した点群符号化 | |
US20210211703A1 (en) | Geometry information signaling for occluded points in an occupancy map video | |
US11908169B2 (en) | Dense mesh compression | |
US10735766B2 (en) | Point cloud auxiliary information coding | |
US20230306643A1 (en) | Mesh patch simplification | |
US20240127489A1 (en) | Efficient mapping coordinate creation and transmission | |
US20230306683A1 (en) | Mesh patch sub-division | |
US20230306687A1 (en) | Mesh zippering | |
US20230306641A1 (en) | Mesh geometry coding | |
US20240127537A1 (en) | Orthoatlas: texture map generation for dynamic meshes using orthographic projections | |
US20240233189A1 (en) | V3c syntax extension for mesh compression using sub-patches | |
WO2023180842A1 (en) | Mesh patch simplification | |
WO2023180844A1 (en) | Mesh zippering | |
KR20210122836A (ko) | 룩업 테이블들을 사용한 포인트 클라우드 압축을 위한 순방향 및 역방향 양자화 | |
WO2023180839A1 (en) | Mesh geometry coding | |
WO2023180841A1 (en) | Mesh patch sub-division | |
CN117897731A (zh) | 网格拉链扣紧 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |