CN105741332A - 一种真实感三维网格压缩方法 - Google Patents

一种真实感三维网格压缩方法 Download PDF

Info

Publication number
CN105741332A
CN105741332A CN201610069414.9A CN201610069414A CN105741332A CN 105741332 A CN105741332 A CN 105741332A CN 201610069414 A CN201610069414 A CN 201610069414A CN 105741332 A CN105741332 A CN 105741332A
Authority
CN
China
Prior art keywords
image
theta
angular image
phi
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610069414.9A
Other languages
English (en)
Other versions
CN105741332B (zh
Inventor
施云惠
高原
丁文鹏
尹宝才
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201610069414.9A priority Critical patent/CN105741332B/zh
Publication of CN105741332A publication Critical patent/CN105741332A/zh
Application granted granted Critical
Publication of CN105741332B publication Critical patent/CN105741332B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开一种真实感三维网格压缩方法,其能够提高在压缩法向图像上的效率,从而有效地提高真实感三维网格的压缩效率。该方法包括编码阶段和解码阶段;原始的输入数据是原始的几何图像GI,原始的θ′?角度图像Iθ′以及原始的φ?角度图像Iφ,编码阶段包括:(1)下采样平滑的几何图像;(2)通过解码重建后的几何图像预测角度图像;解码阶段包括:(3)解码并上采样上述几何图像,得到重建后的几何图像(4)通过预测θ?角度图像,φ?角度图像和θ′?角度图像,得到预测的(5)解码残差并添加到预测的得到重建的θ′?角度图像和重建的φ?角度图像(6)利用估计边信息作用于最后得到重建后的角度图像

Description

一种真实感三维网格压缩方法
技术领域
本发明属于数据压缩的技术领域,具体地涉及一种真实感三维网格压缩方法。
背景技术
真实感三维网格是通过三维建模技术生成的带有法向渲染的几何网格,它是由三维模型的几何数据、法向数据以及其他属性数据构成。随着计算机图形学技术的飞速发展,三维网格越来越多地应用在了科学探索、工程设计、模拟游戏等领域,这些应用对于三维网格的真实感和精度的要求也在与日俱增。但是,作为网格真实感渲染的重要因素,法向数据包含了太多的细节信息,这严重影响了压缩的效率。因此,在带宽受限的网络环境下,如何高效地压缩和传输带有法向数据的三维网格成为一个重要又流行的课题。
目前针对真实感三维网格压缩可以分为两类:基于网格的压缩方法和基于图像的重网格的压缩方法。对于基于网格的压缩方法,主要是在不改变三维网格的几何结构和性质的基础上,对三维网格的几何数据、法向数据以及属性数据等使用预测、量化等常规压缩手段进行压缩。而对于基于图像的重网格的压缩方法,主要是将三维网格几何数据和法向数据通过参数化映射到二维平面,再经过重采样及量化生成与之同构的几何图像和法向图像,并利用常用的图像压缩算法进行压缩。
由于重新生成了规则化的网格,基于图像的重网格的压缩方法在性能上要优于基于网格的压缩方法。因为三维网格的连接关系被隐藏在参数化过程中,所以降低了整体数据的规模且可以利用图像压缩方法例如JPEG2000压缩。但是,由于传统的法向图像压缩需要三个图像,因此这类压缩方法在压缩法向图像上的效率有待提高。
发明内容
本发明的技术解决问题是:克服现有技术的不足,提供一种真实感三维网格压缩方法,其能够提高在压缩法向图像上的效率,从而有效地提高真实感三维网格的压缩效率。
本发明的技术解决方案是:这种真实感三维网格压缩方法,该方法包括编码阶段和解码阶段;
原始的输入数据是原始的几何图像GI,原始的θ′-角度图像Iθ′以及原始的φ-角度图像Iφ,编码阶段包括:
(1)下采样平滑的几何图像;
(2)通过解码重建后的几何图像预测角度图像;
解码阶段包括:
(3)解码并上采样上述几何图像,得到重建后的几何图像
(4)通过预测θ-角度图像,φ-角度图像和θ′-角度图像,得到预测的
(5)解码残差并添加到预测的得到重建的θ′-角度图像和重建的φ-角度图像
(6)利用估计边信息作用于最后得到重建后的角度图像
由于针对传统的法向图像压缩需要三个图像,不能有效地提高压缩效率,本发明提出了角度图像的概念以及一种基于预测的角度图像的编解码框架,首先提出降低法向成分的数量从3个降为2个,同时考虑几何数据与法向数据的相关性,提出了通过几何图像预测角度图像,使得可以利用现有的图像压缩算法压缩2个角度图像,而不是3个法向图像分量,因此能够提高在压缩法向图像上的效率,从而有效地提高真实感三维网格的压缩效率。
附图说明
图1示出了以bunny和venus模型为例,使用1:1的码率比例压缩几何网格以及法向图像的重建PSNR结果比较。
具体实施方式
这种真实感三维网格压缩方法,该方法包括编码阶段和解码阶段;
原始的输入数据是原始的几何图像GI,原始的θ′-角度图像Iθ′以及原始的φ-角度图像Iφ,编码阶段包括:
(1)下采样平滑的几何图像;
(2)通过解码重建后的几何图像预测角度图像;
解码阶段包括:
(3)解码并上采样上述几何图像,得到重建后的几何图像
(4)通过预测θ-角度图像,φ-角度图像和θ′-角度图像,得到预测的
(5)解码残差并添加到预测的得到重建的θ′-角度图像和重建的φ-角度图像
(6)利用估计边信息作用于最后得到重建后的角度图像
由于针对传统的法向图像压缩需要三个图像,不能有效地提高压缩效率,本发明提出了角度图像的概念以及一种基于预测的角度图像的编解码框架,首先提出降低法向成分的数量从3个降为2个,同时考虑几何数据与法向数据的相关性,提出了通过几何图像预测角度图像,使得可以利用现有的图像压缩算法压缩2个角度图像,而不是3个法向图像分量,因此能够提高在压缩法向图像上的效率,从而有效地提高真实感三维网格的压缩效率。
优选地,所述步骤(1)中,对几何图像进行纵横1/2分辨率下采样后编码输出。
优选地,在所述步骤(2)中通过解码并纵横2倍分辨率上采样重建的几何图像来预测θ′-角度图像和φ-角度图像,得到预测的计算Iθ′之间的残差ΔIθ′,Iφ之间的残差ΔIφ;最后通过小波变换编码这些残差以及下采样的几何图像。
优选地,在所述步骤(4)中通过公式(6)得到每个三角形的角度θ的修正版本θ′
θ ′ = a t a n 2 ( a b s ( x 2 - x 1 z 2 - z 1 x 3 - x 1 z 3 - z 1 ) , y 2 - y 1 z 2 - z 1 y 3 - y 1 z 3 - z 1 ) - - - ( 6 )
其中θ′∈[0,π],M′上顶点v的法向角度分量θ′通过计算顶点v的所有相邻三角形的θ′法向角度分量的平均值获得,通过参数化和重采样量化分别获得预测的角度图像 I ^ θ = { θ u v } u = 1 , ... m 1 , v = 1 , ... , m 2 , I ^ φ = { φ u v } u = 1 , ... m 1 , v = 1 , ... , m 2 I ^ θ ′ = { θ u v ′ } u = 1 , ... m 1 , v = 1 , ... , m 2 .
优选地,在所述步骤(6)中边信息通过预测的θ-角度图像估计,重建的θ-角度图像由公式(7)获得
I ~ θ = si g n ( 2 I ^ θ 2 m - 1 - 1 ) · I · θ ′ - - - ( 7 )
其中为解码端估计的边信息。
以下更详细地说明本发明。
考虑到在球面坐标系中,法向量可以用两个角度分量表达(极角θ和方位角φ),因此提出了角度图像,一种全新的法向数据的表达方法。
定义一个真实感三角网格(M,N),M代表几何网格,由网格的顶点坐标和他们之间的拓扑连接数据组成,N代表三维网格的法向数据。定义为三维网格顶点的空间坐标点集,为顶点的法向集,其中s是M顶点的个数。
使用球面坐标系来表示归一化的法向为其中第i个分量由下式计算得到:
θi=atan 2(y′i,x′i) (1)
φ i = a r c t a n ( x i ′ 2 + y i ′ 2 z i ′ ) - - - ( 2 )
其中atan2是arctan的象限区分函数,且θi∈[-π,π]。
采用传统的几何拉伸参数化方法映射几何网格M到参数域中。M顶点的参数坐标通过公式3给出,通过最小化参数域所有三角面片的几何拉伸函数获得。
area(Tj)代表三角形Tj的面积,Γjj代表雅可比矩阵的最大和最小的奇异值,是对第j个参数三角形的顶点参数坐标进行仿射映射得来的。经过将M的法向角度分量NA映射到参数域中并对其进行量化,获得了两个m-bit,m1×m2分辨率的角度图像,命名为θ-角度图像和φ-角度图像,记作 I θ = { θ u v } u = 1 , ... , m 1 , v = 1 , ... , m 2 , I φ = { φ u v } u = 1 , ... , m 1 , v = 1 , ... , m 2 .
由于三角函数的特性,有一些高频分量存在于θ-角度图像中,这增加了压缩的复杂度。因此引入了修正的θ-角度图像,称之为θ′-角度图像它是由修正过的角度数据取代Nθ采样得来,其中abs(·)是对括号里的数据取绝对值且修正后的θ角度分量经过参数化和重采样量化过程后生成了θ′-角度图像I′θ,可以明显看出θ′-角度图像更易于压缩。
基于预测的编码框架有两个重要的步骤:下采样平滑的几何图像以及通过解码重建后的几何图像预测角度图像。原始的输入数据是原始的几何图像GI,原始的θ′-角度图像Iθ′以及原始的φ-角度图像Iφ
在编码端,考虑到几何图像的平滑特性及其对于预测的重要性,对几何图像进行纵横1/2分辨率下采样后编码输出。对于角度图像,通过解码并纵横2倍分辨率上采样重建的几何图像来预测θ′-角度图像和φ-角度图像,得到预测的计算Iθ′之间的残差ΔIθ′,Iφ之间的残差ΔIφ。最后通过小波变换编码这些残差以及下采样的几何图像。
在解码端,首先解码并上采样上述几何图像,得到重建后的几何图像再通过预测θ-角度图像,φ-角度图像和θ′-角度图像,得到预测的 解码残差并添加到预测的得到重建的θ′-角度图像和重建的φ-角度图像为了能够得到重建的θ-角度图像,利用估计边信息作用于(接下来会详细描述)。最后得到了重建后的角度图像
上述提及的角度图像预测,是指利用重建后的几何图像预测θ-角度图像和φ-角度图像。众所周知,重建后的几何网格可以由重建后的几何图像获得,几何网格的顶点空间坐标通过几何图像的像素点的三个颜色值给定,顶点之间的拓扑连接关系通过几何图像像素点之间的关系描述。
给定重建几何网格M′上的一个三角形,v1,v2,v3是这个三角形的三个顶点,v1=(x1,y1,z1),v2=(x2,y2,z2),v3=(x3,y3,z3)。定义Nt(θ,φ)是这个三角形的法向,θ和φ由下式给定,
θ = a tan 2 ( - x 2 - x 1 z 2 - z 1 x 3 - x 1 z 3 - z 1 , y 2 - y 1 z 2 - z 1 y 3 - y 1 z 3 - z 1 ) - - - ( 4 )
φ = arctan ( ( y 2 - y 1 z 2 - z 1 y 3 - y 1 z 3 - z 1 2 + x 2 - x 1 z 2 - z 1 x 3 - x 1 z 3 - z 1 2 ) 1 2 x 2 - x 1 y 2 - y 1 x 3 - x 1 y 3 - y 1 - 1 ) - - - ( 5 )
其中θ∈[-π,π]。M′的顶点的法向可以通过计算顶点的所有相邻三角形的法向平均值获得。通过下式定义每个三角形的角度θ的修正版本θ′,
θ ′ = a tan 2 ( a b s ( x 2 - x 1 z 2 - z 1 x 3 - x 1 z 3 - z 1 ) , y 2 - y 1 z 2 - z 1 y 3 - y 1 z 3 - z 1 ) - - - ( 6 )
其中θ′∈[0,π]。M′上顶点v的法向角度分量θ′可以通过计算顶点v的所有相邻三角形的θ′法向角度分量的平均值获得。通过参数化和重采样量化分别获得预测的角度图像 I ^ θ = { θ u v } u = 1 , ... m 1 , v = 1 , ... , m 2 , I ^ φ = { φ u v } u = 1 , ... m 1 , v = 1 , ... , m 2 I ^ θ ′ = { θ u v ′ } u = 1 , ... m 1 , v = 1 , ... , m 2 .
由于θ′-角度图像比θ-角度图像平滑,所以编码θ′-角度图像和φ-角度图像。在解码端,获得重建的θ′-角度图像和φ-角度图像为了重建θ-角度图像,边信息通过预测的θ-角度图像估计。重建的θ-角度图像可以由下式获得,
I ~ θ = s i g n ( 2 I ^ θ 2 m - 1 - 1 ) · I ~ θ ′ - - - ( 7 )
其中为解码端估计的边信息。因此获得了重建的角度图像
把上述提案应用到4个真实感三维网格的压缩中,并且取得了明显的效果(模型名称分别为bunny,venus,gargoyle,armadillo)。在实验中通过参数化和重采样量化生成256×256分辨率的16-bit的几何图像和8-bit的法向/角度图像。并利用小波变换技术使用VM9软件在0.3,0.6,0.9,1.2,1.5的总码率下分别压缩几何图像和法向/角度图像,且几何和法向之间的码率比例为1:1。使用峰值信噪比(PSNR)来衡量重建三维网格的客观质量,PSNR=20·log10(peak/d),其单位为dB,peak为三维网格包围盒的对角线长度,d为原始网格与重建网格之间的Hausdorff距离。衡量上述码率下每几何图像像素点所占比特下的三维网格压缩前后的PSNR值以及每法向/角度图像像素点所占比特下的法向图像压缩前后的PSNR值。
提出了4种方法,并将它们与2种之前传统的几何图像压缩方法(NDS+NI-NPRE)以及传统的基于预测的法向图像压缩方法(NDS+NI-PRE)进行比较。这些方法都是由几何图像编解码和法向/角度图像编解码组成。提出的4种方法分别是:DS+NI-PRE,NDS+ANI-NPRE,NDS+ANI-PRE,DS+ANI-PRE。其中符号代表的含义:DS/NDS代表是否对几何图像进行下采样,NI代表法向图像,ANI代表角度图像,PRE/NPERE代表是否基于预测编码框架。6种方法的PSNR结果比较见图1,表1和表2。可以看出比较NDS,应用在几何图像上的DS最大获得了1.78dB的PSNR增益(0.15bpp下的venus模型)以及平均0.57dB的PNSR增益。对于法向图像编解码,比较NDS+NI-PRE,提出的方法最大获得了2.03dB的PSNR增益(0.6bpp下的gargoyle模型)以及平均1.31dB的PSNR增益。实验结果表明,提出的基于预测的角度图像的真实感三维网格压缩方法在主客观质量上都优于传统方法。
表1
表2
以上所述,仅是本发明的较佳实施例,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属本发明技术方案的保护范围。

Claims (5)

1.一种真实感三维网格压缩方法,其特征在于,该方法包括编码阶段和解码阶段;
原始的输入数据是原始的几何图像GI,原始的θ′-角度图像Iθ′以及原始的φ-角度图像Iφ,编码阶段包括:
(1)下采样平滑的几何图像;
(2)通过解码重建后的几何图像预测角度图像;
解码阶段包括:
(3)解码并上采样上述几何图像,得到重建后的几何图像
(4)通过预测θ-角度图像,φ-角度图像和θ′-角度图像,得到预测的
(5)解码残差并添加到预测的得到重建的θ′-角度图像和重建的φ-角度图像
(6)利用估计边信息作用于最后得到重建后的角度图像
2.根据权利要求1所述的真实感三维网格压缩方法,其特征在于,所述步骤(1)中,对几何图像进行纵横1/2分辨率下采样后编码输出。
3.根据权利要求2所述的真实感三维网格压缩方法,其特征在于,在所述步骤(2)中通过解码并纵横2倍分辨率上采样重建的几何图像来预测θ′-角度图像和φ-角度图像,得到预测的计算Iθ′之间的残差ΔIθ′,Iφ之间的残差ΔIφ;最后通过小波变换编码这些残差以及下采样的几何图像。
4.根据权利要求3所述的真实感三维网格压缩方法,其特征在于,在所述步骤(4)中通过公式(6)得到每个三角形的角度θ的修正版本θ′
θ ′ = a t a n 2 ( a b s ( x 2 - x 1 z 2 - z 1 x 3 - x 1 z 3 - z 1 ) , | y 2 - y 1 z 2 - z 1 y 3 - y 1 z 3 - z 1 | ) - - - ( 6 )
其中θ′∈[0,π],重建的几何网格M′上顶点v的法向角度分量θ′通过计算顶点v的所有相邻三角形的θ′法向角度分量的平均值获得,通过参数化和重采样量化分别获得预测的角度图像 I ^ φ = { φ u v } u = 1 , ... m 1 , v = 1 , ... , m 2 I ^ θ ′ = { θ u v ′ } u = 1 , ... m 1 , v = 1 , ... , m 2 .
5.根据权利要求4所述的真实感三维网格压缩方法,其特征在于,在所述步骤(6)中边信息通过预测的θ-角度图像估计,重建的θ-角度图像由公式(7)获得
I ~ θ = s i g n ( 2 I ^ θ 2 m - 1 - 1 ) · I ~ θ ′ - - - ( 7 )
其中为解码端估计的边信息。
CN201610069414.9A 2016-02-01 2016-02-01 一种真实感三维网格压缩方法 Expired - Fee Related CN105741332B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610069414.9A CN105741332B (zh) 2016-02-01 2016-02-01 一种真实感三维网格压缩方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610069414.9A CN105741332B (zh) 2016-02-01 2016-02-01 一种真实感三维网格压缩方法

Publications (2)

Publication Number Publication Date
CN105741332A true CN105741332A (zh) 2016-07-06
CN105741332B CN105741332B (zh) 2019-08-16

Family

ID=56242140

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610069414.9A Expired - Fee Related CN105741332B (zh) 2016-02-01 2016-02-01 一种真实感三维网格压缩方法

Country Status (1)

Country Link
CN (1) CN105741332B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111194550A (zh) * 2017-05-06 2020-05-22 北京达佳互联信息技术有限公司 处理3d视频内容

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7769217B2 (en) * 2006-03-06 2010-08-03 Siemens Medical Solutions Usa, Inc. Fast iterative 3D PET image reconstruction using a set of 2D linogram transformations
CN102625126A (zh) * 2012-03-22 2012-08-01 北京工业大学 一种基于预测的三维网格编码方法
CN105069820A (zh) * 2015-08-07 2015-11-18 北京工业大学 一种适用于三维网格序列的压缩方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7769217B2 (en) * 2006-03-06 2010-08-03 Siemens Medical Solutions Usa, Inc. Fast iterative 3D PET image reconstruction using a set of 2D linogram transformations
CN102625126A (zh) * 2012-03-22 2012-08-01 北京工业大学 一种基于预测的三维网格编码方法
CN105069820A (zh) * 2015-08-07 2015-11-18 北京工业大学 一种适用于三维网格序列的压缩方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
YUNHUI SHI 等: "Prediction-based realistic 3D model compression", 《MULTIMED TOOLS & APPLICATIONS》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111194550A (zh) * 2017-05-06 2020-05-22 北京达佳互联信息技术有限公司 处理3d视频内容
CN111194550B (zh) * 2017-05-06 2021-06-08 北京达佳互联信息技术有限公司 处理3d视频内容

Also Published As

Publication number Publication date
CN105741332B (zh) 2019-08-16

Similar Documents

Publication Publication Date Title
Maglo et al. 3d mesh compression: Survey, comparisons, and emerging trends
CN101626509B (zh) 三维网格编码、解码方法及编码、解码装置
CN102625126B (zh) 一种基于预测的三维网格编码方法
Attene et al. Swingwrapper: Retiling triangle meshes for better edgebreaker compression
WO2022067790A1 (zh) 一种点云分层方法及解码器、编码器、存储介质
CN103927746A (zh) 一种三维网格序列的配准及压缩方法
KR20060087662A (ko) 3차원 사각 메쉬의 기하 정보 데이터 단순 압축 및 해제 기술
KR20060087631A (ko) 3차원 삼각 메쉬의 기하 정보 데이터 단순 압축 및 해제 기술
CN113034627B (zh) 基于几何重排的虚拟结构光3d点云压缩方法
CN105741332A (zh) 一种真实感三维网格压缩方法
CN115393452A (zh) 一种基于非对称自编码器结构的点云几何压缩方法
CN115065822A (zh) 点云几何信息压缩系统、方法及计算机系统
Siddeq et al. Novel 3D compression methods for geometry, connectivity and texture
CN110349228B (zh) 一种数据驱动最小二乘预测的三角网格压缩方法
Wang [Retracted] Optimization of Three‐Dimensional Model of Landscape Space Based on Big Data Analysis
CN103065335B (zh) 基于轮廓波域四叉块分裂模型的图像编码方法
CN103400356A (zh) 一种基于通用隐马尔可夫树模型的加权图像压缩感知方法
Bouzidi et al. Joint watermarking and progressive geometric compression of 3D meshes
Chen et al. Geometric compression of a quadrilateral mesh
WO2023231872A1 (zh) 编码方法、解码方法、装置及设备
WO2023155794A1 (zh) 编码、解码方法、装置及设备
Shi et al. Prediction-based realistic 3D model compression
Cheng et al. Anchors-based lossless compression of progressive triangle meshes
KR100473702B1 (ko) 3차원 영상의 꼭지점 좌표 압축장치
Shu et al. A novel blind robust digital watermarking on 3d meshes

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190816

Termination date: 20210201

CF01 Termination of patent right due to non-payment of annual fee