CN109166160A - 一种采用图形预测的三维点云压缩方法 - Google Patents
一种采用图形预测的三维点云压缩方法 Download PDFInfo
- Publication number
- CN109166160A CN109166160A CN201811082243.9A CN201811082243A CN109166160A CN 109166160 A CN109166160 A CN 109166160A CN 201811082243 A CN201811082243 A CN 201811082243A CN 109166160 A CN109166160 A CN 109166160A
- Authority
- CN
- China
- Prior art keywords
- point cloud
- dimensional point
- coding unit
- prediction
- block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/007—Transform coding, e.g. discrete cosine transform
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Discrete Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明公开了一种采用图形预测的三维点云压缩方法,属于视频编码领域,方法包括:采用KD树对输入三维点云进行自适应分块;采用KNN算法计算编码单元内每个点的K邻近点;构建每个单元块的图并计算图形平移算子;对每个编码单元的块进行去均值,采用K‑means算法对编码单元进行自适应采样,通过求解优化问题对未采样点进行预测;利用基于KD树的块均值预测算法对每个编码单元块的均值进行预测编码;最后用算术编码器对所有量化的参数和残差进行熵编码。本发明采用图形预测,能够对庞大的三维点云数据进行有效压缩,极大地改善三维点云的传输和存储效率。
Description
技术领域
本发明涉及视频编码领域,具体为一种采用图形预测的三维点云压缩方法。
背景技术
随着多媒体通信和3D采集技术的快速发展,三维点云作为一种新兴媒质被广泛应用于虚拟现实、增强现实、混合现实等多个领域。三维点云是由大量拥有具体三维位置信息的点集组成,其中每个点具备一个或多个特征(如:颜色、法线等)。作为新型空间数据类型,三维点云能够更有效地表示三维物体或场景信息,但是其数据量庞大。对于一般大小的三维点云,点的个数通常为百万的数量级。三维点云巨大的数据量给其存储和传输带来了极大的挑战。因此,如何构建高效稳定的三维点云压缩方法显得尤为重要。
与传统自然图像视频不同,三维点云的特征是不规则的,这种不规则性主要表现为三维点云的每个点并不是规则地落在标准的三维坐标空间上,这些都给三维点云的压缩带来了极大挑战。随着研究工作的进展,采用图形来表示三维点云不仅能够有效地规避三维点云的不规则性,而且可以利用点与点之间的欧式距离来表征点之间的相关性。但是如何构造图形,如何对基于图形表示的三维点云进行采样、预测、量化和熵编码仍然是有待解决的难题
发明内容
本发明的主要目的在于克服现有技术中的上述缺陷,提出一种采用图形预测的三维点云压缩方法。本发明方法充分考虑三维点云数据中相邻点的内在相关性,通过少量采样点来预测大量未采样点的颜色值,从而实现对庞大三维点云数据的有效压缩。
本发明采用如下技术方案:
一种采用图形预测的三维点云压缩方法,其特征在于,包括如下步骤:
1)输入三维点云数据;
2)采用KD树对三维点云数据进行自适应分割得到编码单元;
3)去除每个编码单元的均值,采用K-Means方法对编码单元的每个块进行自适应采样;
4)采用KNN算法将每个块内的点进行连接构成图形,计算归一化的图形平移算子;基于图形平滑原则进行预测优化,通过解优化问题可得未知采样点的预测值,计算预测残差;
5)每个块的均值采用基于KD树的预测模式,对已知采样点和预测残差进行量化,预测模式和量化后的参数均采用算术编码器进行熵编码。
优选的,所述步骤2)具体为:设置分割深度L,则三维点云数据包括L层待分割单元;对于每一层的待分割单元,计算该待分割单元内所有点X,Y,Z三个维度位置坐标的方差,选择方差最大的那一维度将待分割单元一分为二;重复这个分割过程,直到完成该分割深度L;对分割完的块,从左到右依次进行标注;分割完的三维点云数据将被分成2L个编码单元,每个编码单元内的点的个数为:n≈S/2L,其中S为原始输入的所述三维点云数据中点的个数。
优选的,所述步骤3)中,所述采用K-Means方法对编码单元的每个块进行自适应采样,其自适应采样点的个数通过如下公式获取:K=0.1*n,其中n为每个编码单元内的点的个数。
优选的,所述步骤4)中,所述归一化的图形平移算子通过如下公式获取:
Ai,j=Pi,j/ΣiPi,j
其中:A为图形平移算子,Ai,j则是矩阵A中位于(i,j)位置的元素,N为KNN算法中设置的连接参数,ni和nj为编码单元的块内第i和第j个点的三维坐标,||·||为求模算子。
优选的,所述步骤4)中,所述图形平滑原则通过如下公式获取:
其中,Z(x)为构建图形的信号变化函数,x为分割后每个编码单元输入的图形信号,xM为已知采样点的颜色信息,xU为未知采样点的信息。
优选的,所述步骤4)中,所述预测优化问题通过如下公式获取:
其中:x*为每个块内点的预测颜色信息,为已知采样点的预测颜色信息,λ为权重参数。
优选的,所述步骤4)中,所述预测优化问题可通过如下公式求解:
其中,IM、I均为单位矩阵。
优选的,所述步骤5)中,预测模式具体如下:对于当前编码单元,共有6个候选预测模式,包括五个角度模式和一个DC模式;该角度模式包括使用三个相邻块作为参考块及使用两个相邻宏块作为参考块,该DC模式则不参考相邻的块和宏块,直接对当前块的颜色均值进行量化;最佳的预测模式可由如下公式获取:
best mode=argmin ai,i∈{0,1,2,3,4,5}
其中,c是当前编码单元的均值,ci是第i个预测模式下参考块的均值,ai为第i个预测模式下的预测残差,Q为量化步长,|·|是绝对值符号。
由上述对本发明的描述可知,与现有技术相比,本发明具有如下有益效果:
1、本发明方法采用KD树对三维点云进行自适应采样,不仅有效地保留了点与点之间的相关性,还可以让每个编码单元内的点个数保持近乎相同,避免了空编码单元;
2、本发明方法利用点与点之间存在较强的相关性,利用采样点,基于图形平滑的原则有效地对未采样的点进行预测,极大地提高三维点云的压缩效率。
附图说明
图1为本发明方法的主流程图
图2为本发明方法的KD树分割方法。
图3为本发明的基于KD树的编码单元均值预测方法。
具体实施方式
以下通过具体实施方式对本发明作进一步的描述。
参见图1,一种采用图形预测的三维点云压缩方法,对输入的三维点云进行KD树自适应分割并去除每个编码单元的均值,随后用K-Means算法对每个编码单元块进行自适应采样,计算图形平移算子,对未采样点进行预测,计算残差并量化。而对于每个编码单元块的均值,采用基于KD树的块均值预测方法进行预测编码并量化。最后所有的编码参数采用算术编码器进行熵编码具体实施步骤如下:
步骤1),输入三维点云数据。
步骤2),采用KD树自适应分割算法。
具体的,如图2所示。给定分割深度L,即三维点云数据包括L层待分割单元;对于每一层的待分割单元,计算该待分割单元内所有点X,Y,Z三个维度位置坐标的方差,选择方差最大的那一维度将待分割单元一分为二;重复这个分割过程,直到深度L。对分割完的块,从左到右依次进行标注。
分割完的三维点云将被分成2L个编码单元,每个编码单元内的点的个数为:
n≈S/2L
其中S为原始输入三维点云中点的个数。
步骤3),采用K-Means算法对每个编码单元进行自适应采样,得到K个采样点。具体如下:
K=0.1*n
其中n为每个编码单元内点的个数。
步骤4),利用KNN算法将每个编码单元的所有点进行连接,生成图形,通过图形预测方法,基于K个采样点对编码单元的其他未采样点进行预测。图形平移算子计算具体如下:
Ai,j=Pi,j/∑iPi,j
其中,A为图形平移算子,Ai,j则是矩阵A中位于(i,j)位置的元素,N=8为KNN算法中设置的连接参数,ni和nj为编码单元块内第i和第j个点的三维坐标,||·||为求模算子。
根据图形平滑原则,可以将预测问题转化为解优化为题。具体如下:
图形平滑准则:
进一步变形可得:
图形信号:
其中:x为分割后每个编码单元输入的图形信号。Z(x)为构建图形的信号变化函数,即:图形信号差异比较小(也就是比较平滑),则Z(x)的值就会比较小;如果图形信号差异比较大(也就是图形不平滑),则Z(x)的值就会比较大。xM为已知的采样信号,xU为未知的待预测信号。
假定x是一个平滑的信号,则可以通过解下面的优化问题来恢复xU。
其中ε为给定的预测误差。
将上述优化问题变形可得:
其中,x*为每个块内点的预测颜色信息,为采样点的预测颜色信息,λ为权重参数,设为0.1。
求解这个问题可得:
其中,I为n*n单位矩阵、IM为K*K单位矩阵,
步骤5),每个编码块的均值采用基于KD树的预测方法进行编码,如图3所示,具体如下:
对于当前编码单元(图3中用灰色块表示,块标签为2i),共有6个候选预测模式,包括5个角度模式(mode0-mode4)和DC模式。其中5个角度模式中,mode0,mode1和mode2是分别使用三个相邻块作为参考块的模式;mode3和mode4是分别使用两个相邻宏块作为参考块的模式。DC模式则不参考相邻的块和宏块,直接对当前块的颜色均值进行量化。则最佳预测模式可由如下公式获取:
best mode=argmin ai,i∈{0,1,2,3,4,5}
其中,c是当前编码单元的均值,ci是第i个预测模式下参考块的均值,ai为第i个预测模式下的预测残差,Q为量化步长,|·|是绝对值符号。
步骤6),对采样点和预测残差进行量化,所有的量化参数、模式标签、残差等编码信息用算术编码器进行熵编码。
上述仅为本发明的具体实施方式,但本发明的设计构思并不局限于此,凡利用此构思对本发明进行非实质性的改动,均应属于侵犯本发明保护范围的行为。
Claims (8)
1.一种采用图形预测的三维点云压缩方法,其特征在于,包括如下步骤:
1)输入三维点云数据;
2)采用KD树对三维点云数据进行自适应分割得到编码单元;
3)去除每个编码单元的均值,采用K-Means方法对编码单元的每个块进行自适应采样;
4)采用KNN算法将每个块内的点进行连接构成图形,计算归一化的图形平移算子;基于图形平滑原则进行预测优化,通过解优化问题可得未知采样点的预测值,计算预测残差;
5)每个块的均值采用基于KD树的预测模式,对已知采样点和预测残差进行量化,预测模式和量化后的参数均采用算术编码器进行熵编码。
2.如权利要求1所述的一种采用图形预测的三维点云压缩方法,其特征在于,所述步骤2)具体为:设置分割深度L,则三维点云数据包括L层待分割单元;对于每一层的待分割单元,计算该待分割单元内所有点X,Y,Z三个维度位置坐标的方差,选择方差最大的那一维度将待分割单元一分为二;重复这个分割过程,直到完成该分割深度L;对分割完的块,从左到右依次进行标注;分割完的三维点云数据将被分成2L个编码单元,每个编码单元内的点的个数为:n≈S/2L,其中S为原始输入的所述三维点云数据中点的个数。
3.如权利要求2所述的一种采用图形预测的三维点云压缩方法,其特征在于:所述步骤3)中,所述采用K-Means方法对编码单元的每个块进行自适应采样,其自适应采样点的个数通过如下公式获取:K=0.1*n,其中n为每个编码单元内的点的个数。
4.如权利要求2所述的一种采用图形预测的三维点云压缩方法,其特征在于:所述步骤4)中,所述归一化的图形平移算子通过如下公式获取:
Ai,j=Pi,j/∑iPi,j
其中:A为图形平移算子,Ai,j则是矩阵A中位于(i,j)位置的元素,N为KNN算法中设置的连接参数,ni和nj为编码单元的块内第i和第j个点的三维坐标,||·||为求模算子。
5.如权利要求4所述的一种采用图形预测的三维点云压缩方法,其特征在于:所述步骤4)中,所述图形平滑原则通过如下公式获取:
其中,Z(x)为构建图形的信号变化函数,x为分割后每个编码单元输入的图形信号,xM为已知采样点的颜色信息,xU为未知采样点的信息。
6.如权利要求5所述的一种采用图形预测的三维点云压缩方法,其特征在于:所述步骤4)中,所述预测优化问题通过如下公式获取:
其中:x*为每个块内点的预测颜色信息,为已知采样点的预测颜色信息,λ为权重参数。
7.如权利要求6所述的一种采用图形预测的三维点云压缩方法,其特征在于:所述步骤4)中,所述预测优化问题可通过如下公式求解:
其中,IM、I均为单位矩阵。
8.如权利要求6所述的一种采用图形预测的三维点云压缩方法,其特征在于:所述步骤5)中,预测模式具体如下:对于当前编码单元,共有6个候选预测模式,包括五个角度模式和一个DC模式;该角度模式包括使用三个相邻块作为参考块及使用两个相邻宏块作为参考块,该DC模式则不参考相邻的块和宏块,直接对当前块的颜色均值进行量化;最佳的预测模式可由如下公式获取:
best mode=argmin ai,i∈{0,1,2,3,4,5}
其中,c是当前编码单元的均值,ci是第i个预测模式下参考块的均值,ai为第i个预测模式下的预测残差,Q为量化步长,|·|是绝对值符号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811082243.9A CN109166160B (zh) | 2018-09-17 | 2018-09-17 | 一种采用图形预测的三维点云压缩方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811082243.9A CN109166160B (zh) | 2018-09-17 | 2018-09-17 | 一种采用图形预测的三维点云压缩方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109166160A true CN109166160A (zh) | 2019-01-08 |
CN109166160B CN109166160B (zh) | 2022-07-01 |
Family
ID=64879398
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811082243.9A Active CN109166160B (zh) | 2018-09-17 | 2018-09-17 | 一种采用图形预测的三维点云压缩方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109166160B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110278444A (zh) * | 2019-07-17 | 2019-09-24 | 华侨大学 | 一种采用几何引导的稀疏表示三维点云压缩方法 |
WO2020186548A1 (zh) * | 2019-03-20 | 2020-09-24 | 北京大学深圳研究生院 | 点云编码和解码的方法、编码设备和解码设备 |
WO2021003726A1 (zh) * | 2019-07-10 | 2021-01-14 | 深圳市大疆创新科技有限公司 | 一种数据编码、数据解码方法、设备及存储介质 |
WO2021023206A1 (zh) * | 2019-08-05 | 2021-02-11 | 北京大学深圳研究生院 | 基于邻居权重优化的点云属性预测、编码和解码方法及设备 |
WO2023245981A1 (zh) * | 2022-06-20 | 2023-12-28 | 北京大学深圳研究生院 | 一种点云的压缩方法、装置、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107403456A (zh) * | 2017-07-28 | 2017-11-28 | 北京大学深圳研究生院 | 一种基于kd树和优化图变换的点云属性压缩方法 |
US20180053324A1 (en) * | 2016-08-19 | 2018-02-22 | Mitsubishi Electric Research Laboratories, Inc. | Method for Predictive Coding of Point Cloud Geometries |
CN108335335A (zh) * | 2018-02-11 | 2018-07-27 | 北京大学深圳研究生院 | 一种基于增强图变换的点云属性压缩方法 |
-
2018
- 2018-09-17 CN CN201811082243.9A patent/CN109166160B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180053324A1 (en) * | 2016-08-19 | 2018-02-22 | Mitsubishi Electric Research Laboratories, Inc. | Method for Predictive Coding of Point Cloud Geometries |
CN107403456A (zh) * | 2017-07-28 | 2017-11-28 | 北京大学深圳研究生院 | 一种基于kd树和优化图变换的点云属性压缩方法 |
CN108335335A (zh) * | 2018-02-11 | 2018-07-27 | 北京大学深圳研究生院 | 一种基于增强图变换的点云属性压缩方法 |
Non-Patent Citations (2)
Title |
---|
SHUAI GU等: "COMPRESSION OF 3D POINT CLOUDS USING 1D DISCRETE COSINE TRANSFORM", 《2017 INTERNATIONAL SYMPOSIUM ON INTELLIGENT SIGNAL PROCESSING AND COMMUNICATION SYSTEMS》, 9 November 2017 (2017-11-09), pages 196 - 200, XP033305613, DOI: 10.1109/ISPACS.2017.8266472 * |
黄源 等: "基于改进八叉树的三维点云压缩算法", 《光学学报》, vol. 37, no. 12, 31 December 2017 (2017-12-31), pages 1210003 - 1 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020186548A1 (zh) * | 2019-03-20 | 2020-09-24 | 北京大学深圳研究生院 | 点云编码和解码的方法、编码设备和解码设备 |
WO2021003726A1 (zh) * | 2019-07-10 | 2021-01-14 | 深圳市大疆创新科技有限公司 | 一种数据编码、数据解码方法、设备及存储介质 |
CN110278444A (zh) * | 2019-07-17 | 2019-09-24 | 华侨大学 | 一种采用几何引导的稀疏表示三维点云压缩方法 |
CN110278444B (zh) * | 2019-07-17 | 2022-11-01 | 华侨大学 | 一种采用几何引导的稀疏表示三维点云压缩方法 |
WO2021023206A1 (zh) * | 2019-08-05 | 2021-02-11 | 北京大学深圳研究生院 | 基于邻居权重优化的点云属性预测、编码和解码方法及设备 |
WO2023245981A1 (zh) * | 2022-06-20 | 2023-12-28 | 北京大学深圳研究生院 | 一种点云的压缩方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109166160B (zh) | 2022-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109166160A (zh) | 一种采用图形预测的三维点云压缩方法 | |
Song et al. | Neural network-based arithmetic coding of intra prediction modes in HEVC | |
CN106131547B (zh) | 视频编码中帧内预测模式的快速决策方法 | |
Wang et al. | Towards analysis-friendly face representation with scalable feature and texture compression | |
Daribo et al. | Efficient rate-distortion compression of dynamic point cloud for grid-pattern-based 3D scanning systems | |
WO2019079093A1 (en) | METHOD AND DEVICE FOR PREDICTIVE CODING / DECODING OF A POINT CLOUD | |
CN104125473B (zh) | 一种3d视频深度图像帧内预测模式选择方法及系统 | |
CN105453570A (zh) | 用于下一代视频的对分区数据的内容自适应熵编码 | |
CN104904220B (zh) | 用于深度图像的编码、解码设备以及编码、解码方法 | |
CN107027025B (zh) | 一种基于宏像素块自适应预测的光场图像压缩方法 | |
CN107046645A (zh) | 图像编解码方法及装置 | |
CN107852495A (zh) | 低时延两次视频代码化 | |
Doumanoglou et al. | Toward real-time and efficient compression of human time-varying meshes | |
CN107743706A (zh) | 超变换视频代码化 | |
CN110278444B (zh) | 一种采用几何引导的稀疏表示三维点云压缩方法 | |
CN104284186A (zh) | 一种适用于hevc标准帧内预测模式判决过程的快速算法 | |
CN107005702A (zh) | 用于处理数字图像的块的系统和方法 | |
Liu et al. | Pcgformer: Lossy point cloud geometry compression via local self-attention | |
Filali et al. | Rate-distortion optimized tree-structured point-lattice vector quantization for compression of 3D point clouds geometry | |
Kekre et al. | Color Image Segmentation using Vector Quantization Techniques Based on the Energy Ordering concept | |
CN107454425B (zh) | 一种scc帧内编码单元候选预测模式缩减方法 | |
Zhang et al. | Fast intra algorithm based on texture characteristics for 360 videos | |
CN112861862A (zh) | 基于区域生长与深度学习结合的针对兵马俑点云的无监督分割方法 | |
Li et al. | Explainable machine learning based transform coding for high efficiency intra prediction | |
Zuo et al. | Bi-layer texture discriminant fast depth intra coding for 3D-HEVC |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |