CN103329169A - 几何图案编码方法和设备,以及几何图案解码方法和设备 - Google Patents

几何图案编码方法和设备,以及几何图案解码方法和设备 Download PDF

Info

Publication number
CN103329169A
CN103329169A CN2010800693560A CN201080069356A CN103329169A CN 103329169 A CN103329169 A CN 103329169A CN 2010800693560 A CN2010800693560 A CN 2010800693560A CN 201080069356 A CN201080069356 A CN 201080069356A CN 103329169 A CN103329169 A CN 103329169A
Authority
CN
China
Prior art keywords
cluster
geometric
displacement
geometric scheme
representative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010800693560A
Other languages
English (en)
Other versions
CN103329169B (zh
Inventor
蔡康颖
杨继珩
滕军
夏志进
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
InterDigital VC Holdings Inc
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of CN103329169A publication Critical patent/CN103329169A/zh
Application granted granted Critical
Publication of CN103329169B publication Critical patent/CN103329169B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/10Constructive solid geometry [CSG] using solid primitives, e.g. cylinders, cubes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/04Texture mapping
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/001Model-based coding, e.g. wire frame

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Generation (AREA)

Abstract

3D模型通常具有有着较少数量的大三角形并通常具有任意连通性的大量的小到中型的连通部件。大型多组件3D模型紧凑表示的效率通过检测并表示其组件之间的相似性而得到提升,即使这些组件不精确相等。本发明基于聚类和聚类代表表面(CRS)使用位移图对两个或更多不同但相似的几何图案进行差分编码。一种用于对多个几何图案进行编码的方法包括检测和编码几何图案(100)的完全相同的副本、检测和聚类相似的几何图案(200)以及检测部分相似性(300)。检测部分相似性(300)包括生成聚类代表表面、为至少一个被聚类的几何图案生成位移图以及对共同表面和位移图进行编码。

Description

几何图案编码方法和设备,以及几何图案解码方法和设备
技术领域
本发明涉及对相似几何图案(如,多组件三维网格模型的若干组件)进行高效编码。
背景技术
本节旨在向读者介绍可能与下面描述和/或要求保护的本发明的各个方面相关的本技术领域的各个方面。这种讨论被认为有助于向读者提供背景信息以便更好地理解本发明的各个方面。因此,应该理解的是,应该从这个角度阅读这些陈述,而不是当作对现有技术的认可。
在各种应用中使用最广泛的3D模型是那些具有大量的较小到中等大小的相互连通的组件的模型,其中平均每个组件具有多达几百个的多边形。这种模型被称为多连通或者多组件3D模型。它们在生物学、物理学、工程学和艺术等不同的领域发挥着重要的作用。这种模型可以用于例如机械CAD设计、建筑设计和化学工厂,在各种现实世界的应用中正越来越多地使用。
紧凑表示是紧凑存储和高效传输的关键问题之一。3D模型通常用由坐标数组和面片数组(face array)组成的“索引化面片集(indexed face set)”表示。坐标数组列出所有顶点的坐标,面片数组通过给它在坐标数组中的三个顶点编索引列出每个面片。索引面集不涉及压缩。“三角形条带”1是一种广泛使用的可以被大多数图形卡很好地支持的3D模型的紧凑表示。三角形条带方法尝试将三维网格分割成若干的三角形长条带,如图l所示,然后对这些条带进行编码。在图1中,顶点v0,……,v7定义一个三角形条带,它是三维网格模型的一部分。
最著名的三维压缩算法都提出了它们自己的三维模型紧凑表示以提升压缩比。这些紧凑表示对具有密集的小三角形网格的光滑表面最为有效。然而,大型多连通3D模型具有大量有着较少数量的大三角形并通常具有任意连通性的连通组件。建筑和机械CAD模型通常具有许多使得这些方法更加不适用的非光滑表面。此外,大多数已知的方法对每个连通的组件分开进行处理。因此,这些三维模型表示在大型多组件三维模型上的表现不是很好。
近来已经提出一些专门设计用于大型多组件三维模型的紧凑表示。[CAI09VRST]2和[CAI09VRCAI]3提出了一种用于大型多组件三维模型紧凑表示方法,可以检测出无论旋转、平移和/或缩放情况下的重复实例。此外,在[SKU2008]4中描述了用于定义三维网格模型的表面细节的位移图(displacement map)。这些细节被称为细微结构(mesostructure)(与定义物体形状的宏观结构相对),并包括提供纹理或灯光效果的高频几何细节。因此,它们相对较小,但仍然可见,如表面上的凸起。
发明内容
本发明人已经认识到上述得益于检测出重复图案的紧凑表示方法只能够检测出预定义变换类型(即旋转、平移和缩放)下精确相等的重复图案。在实际应用中,只有少量3D模型包含此类组件。
本发明正是基于认识到下述事实:大型多组件3D模型紧凑表示的效率可以通过检测并表示其并不精确相等的组件之间的相似性而得到较大的提升。一般情况下,这些组件是几何图案(geometry pattern)。
本发明的一个创新方面是使用位移图基于单个基础模型(single basemodel)对两个或更多不同但相似的几何图案进行差分编码。
根据本发明的一个方面,一种用于对多个几何图案进行编码的方法包括下列步骤:检测并聚类相似的几何图案;生成聚类代表表面(例如,通过求取所有聚类几何图案的平均);为至少一个聚类几何图案生成位移图;以及编码共同表面和位移图。可以在一个归一化步骤之后确定几何图案的相似性。
根据本发明的一个方面,一种用于对多个(可以是一个或多个三维网格模型中连通的组件的)几何图案进行编码的方法包括下列步骤:检测相似的几何图案;将检测出的相似的几何图案聚类到一个共同聚类;生成该共同聚类的聚类代表表面;为被聚类在所述聚类中的至少两个几何图案生成若干单独的位移图,其中每个位移图定义聚类代表表面的顶点和被聚类的几何图案的顶点之间的位移;以及通过对聚类代表表面进行编码和对位移图进行编码来对多个几何图案进行编码。对位移图进行的编码还可以包括缩放、位置、方向和/或复制信息。
根据本发明的另一个方面,一种用于对多个(可以但不必须是一个或多个三维网格模型中连通的组件的)几何图案进行解码的方法包括下列步骤:对第一数据进行解码以获得聚类代表表面;对第二和第三数据进行解码以获得至少两个位移图;重建聚类代表表面;通过将至少两个位移图中的第一位移图应用到聚类代表表面重建第一几何图案;以及通过将至少两个位移图中的第二位移图应用到聚类代表表面重建第二几何图案。该方法还可以包括对包括涉及单个几何图案的缩放、位置、方向和/或复制信息的第四数据进行解码。第四数据可以例如与第二和/或第三数据相关联或从第二和/或第三数据中提取。
根据本发明的又一个方面,一种用于对多个(可以但不必须是一个或多个三维网格模型中连通的组件的)几何图案进行编码的设备包括:检测部件,用于检测相似的几何图案;聚类部件,用于将检测出的相似的几何图案聚类到一个共同聚类;计算部件,用于生成聚类代表表面;位移图生成部件,用于为至少两个被聚类的几何图案生成若干单独的位移图,其中每个位移图定义聚类代表表面的顶点和被聚类的几何图案的顶点之间的位移;以及编码器,用于通过聚类代表表面和位移图对多个几何图案进行编码。
根据本发明的又一个方面,一种用于对多个(可以但不必须是一个或多个三维网格模型中连通的组件的)几何图案进行解码的设备包括:第一解码器,用于对第一数据进行解码以获得聚类代表表面;第二解码器,用于对第二数据和第三数据进行解码以获得至少两个位移图;第一重建部件,用于重建聚类代表表面;第二重建部件,用于通过将至少两个位移图中的第一位移图应用到聚类代表表面重建第一几何图案;以及第三重建部件,用于通过将至少两个位移图中的第二位移图应用到聚类代表表面重建第二几何图案。
通过结合附图考虑下面的说明和所附的权利要求,本发明的更多的目的、特征和优点将变得更加明显。
附图说明
下面将参照附图对本发明的示例性实施例进行说明,附图中:
图1示出了用于三维网格模型编码的三角形条带的概念;
图2示出了根据一个实施例的编码方法的流程图;
图3示出了位移映射(displacement mapping)的原理;
图4示出了一个聚类代表表面图案的创建,以及对一个示例性聚类中若干成员进行的编码;
图5示出了基于聚类代表表面图案对一个示例性聚类中若干成员进行的解码;
图6示出了一个顶点、它的圆心角和它的法向;
图7示出了部分相似性检测方法的一个简化实施例的流程图;
图8示出了一个示例性位移图的计算;
图9示出了一个示例性编码器的主要结构;
图10示出了一个示例性解码器的主要结构;以及
图11示出了本发明的编码和解码方法的示例性流程图。
具体实施方式
图2示出了处理三维网格模型的一个示例性流程图。输入网格被分离100成多个几何图案。分离包括根据大小、位置和方向方面归一化几何图案。归一化数据(尺寸因子、位置和方向数据)可以与每个几何图案相关联,或存储在列表中,或类似。它们稍后将被用于重建原始网格模型。在一个可选的步骤中,检测重复的几何图案。也就是说,该可选的步骤对精确相等的(在模型空间分辨率、量化或类似物给定的限制内)几何图案进行检测。这种几何图案在本说明书中被称为“副本集(copy set)”,因为它们是若干相等复制的集合。检测到的若干相等的图案用单个有代表性的图案代表,它在本说明书中被称为“副本集代表”。
然后,根据它们的相似性对其他的几何图案以及副本集代表进行聚类200:相似的图案被分配到一个共同聚类。在聚类步骤200中,将几何图案相互比较,识别出相似的图案并将其分配给它们的聚类。在一个实施例中,计算每个几何图案的形状描述符,将形状描述符相互比较,聚类基于形状描述符比较的结果进行。更多的细节将在下面提供。在一个实施例中,在聚类步骤200结束时输入网格的每一部分都被分配给一个几何图案聚类。在另一个实施例中,输入网格的一部分或多个部分未被分配到某个聚类,因为未能检测到代表相似部分的几何图案,或者检测到的几何图案的相似性不够好。例如,当下文描述的相对编码比传统编码需要更多的比特时,可能就是这种情况。通常地,下文描述的编码更加有效,每个聚类中的几何图案越多,聚类中的几何图案就越相似。
在“部分相似性检测”步骤300中,生成聚类中元素的一个共同代表(common representative)。它被称为“聚类代表表面”(CRS)或“初始共同表面”,因为它是用来代表所有的聚类元素的表面。一般来说,聚类代表表面是与被分配到该聚类中的所有的几何图案尽可能相似的几何图案。可以使用不同的方法获得CRS。在一个实施例中,它通过求取被分配给该聚类的所有的几何图案的平均获得。在另一个实施例中,它通过将该聚类中所有的几何图案嵌入规则网格(regular grid)并提取体素外壳(voxel hull)的外可见表面获得。体素是一种体积像素,即代表三维空间中规则网格上的值的体积元。图案聚类的体素外壳被定义为聚类中所有图案模型内部的所有网格体素的集合。在一个实施例中,使用(解析或数值)优化函数进一步优化平均几何图案或体素外壳。
由于被分配到某个聚类的(所有或几乎所有的)若干单独的几何图案与CRS不同,因此如在下面更详细地描述的,通过比较每一个单个几何图案和它的CRS确定该差异。然后,对每个几何图案分别使用位移图对该差异进行编码。图3a示出了位移图的一般用法。虽然位移图通常用于生成较小的、几乎不可见的表面效果,例如表面纹理、光线和阴影效果等,但本发明使用位移图以用于对几何图案进行差分编码,即代表实际几何图案和CRS之间的差异。这样做的优点在于,两个或更多的相似的几何图案可以共享一个CRS。由于对位移图进行编码需要的比特比一个完整的几何图案要少得多,因此可以实现大量的数据削减(即冗余简化)。越多的几何图案被确定为是相似的并被分配到一个共同聚类,编码就越高效。
在一个实施例中,位移图定义了CRS顶点的空间位移。该空间位移是空间中的平移操作。在一个实施例中,可以单独定义每个顶点的平移方向。在一个实施例中,平移方向被定义为顶点的法线方向,这对三维网格模型来说通常是已知的。也就是说,几何图案的位移图定义了聚类代表表面的每个顶点为了匹配实际几何图案的顶点必须在各自的顶点法线方向上移动的量。在一个实施例中,CRS可以具有比实际的几何图案更多的顶点,位移图可以通过例如给CRS的一个或多个顶点赋值零来跳过它们。在一个实施例中,CRS可以具有比实际的几何图案更少的顶点,位移图可以使用CRS的一个或多个顶点两次(或更多次)。在一个实施例中,位移图还可以定义不同方向的位移。位移图可以简单地实施为数字序列,其中每个数字代表一个顶点的位移,例如当顶点被显性或隐性地编号时,如图1所示的条带。列表中可以包括位置、缩放和方位数据,以及(如果适用)其中CRS顶点的数目被修改的实施例的更多的部分。可以使用任何压缩方法对该列表进行进一步的压缩。
在图3b所示的实例中,位移图赋给CRS Srep的顶点v2两个不同的位移向量dv20,dv21,从而增加实际几何图案Sact顶点的数量。可以对一个或多个或甚至(在例外情况下)所有的顶点都这样做。两个或多个位移向量dv20、dv21可以——但不是必须——具有不同的方向。
图4示出了用于编码的一个例子。在该示例中,一个三维网格模型有四个单独的组件301-304(即可能是同时可见)。在图4中,假定,组件301-304已经被分离和规范化。重复图案的检测块100检测到两个组件303,304的图案是完全相等的。它们可以由单个副本集代表313,和具有组件303、304详情的副本集信息(例如,一个列表)313a来代表。这样的组件303,304可以通过参考(如标识符)以下来编码,副本集代表313、或分别地其参考位移图和CRS、以及单独位置、方向和规模303a,304a。为了简单起见,组件被描绘在图4中的轮廓视图321-323。聚类块200确定组件321-323是相似的,并且部分相似性检测块300生成CRS320。例如CRS320是包含在所有的几何图案321-323(在它们归一化之后,如示于图4b)中的体素的集合。在这个例子中,其中一个图案是副本集代表313。关于副本集的独立副本的信息303A,304A可能独立于,或与副本集代表的数据相关联。
然后通过将单个组件与特定聚类(例如,聚类ID或CRS ID)相关联,由此使用该聚类的CRS320和定义其各自距CRS的偏差331-333的位移图341-343表示单个组件。另外,组件可以具有定义组件缩放、位置和方向的相关联的数据301a-304a,和/或定义单个副本的进一步相关联的数据,如示例性示出的副本集代表313。然后,对CRS和位移图进行熵编码。可以使用任何已知的熵编码方法对它们进行单独熵编码或一起进行熵编码。
图5示出了一个实施例中的示例性解码。对用CRS400和带有相关联的缩放、位置、方向和(如果适用)副本数据403a的各个位移图401-403表示的已编码组件进行熵解码。通过将位移图应用410到CRS400重建原始组件411、412、413。然后,对于副本集代表(如组件413),可以通过根据副本集信息403a复制副本集代表重建每个单独的副本423、424。最后,通过将缩放、位置和方向信息应用到每个单独的组件重建原始组件。如上所述,块200对由100产生的几何图案进行聚类。聚类基于被称为圆心角的形状描述符,如图6中所示。A(P)是图案网格P的圆心角,计算如下:
A ( P ) = Σ i A ( v i ) / | | v i | |      (等式1)
圆心角A(P)可用于将组件在归一化之后分类成若干个聚类。通常情况下,一个三维网格模型包括被聚类在若干个聚类中的多个组件。同样地如上所述,块300计算属于同一个共同图案聚类的几何图案之间的部分相似性。块300的一个示例性实施例的详细信息如图7所示。它首先构建一个在聚类中所有的图案模型内部的初始表面。通过迭代局部优化处理计算得到共同表面。初始化块310通过将所有的几何图案嵌入规则网格计算初始共同表面。图案聚类的体素外壳是在所有的图案模型内部的所有的网格体素的集合。随后,体素外壳的外部可见表面被提取作为初始共同表面,或CRS。
迭代调整(fitting)块320迭代地调整共同表面以使它尽可能地代表图案模型。每一次迭代由两个步骤组成,匹配块321中的匹配和变形块322中的变形。当共同表面稳定,或者达到最大迭代次数时,该过程终止。
匹配块321将共同表面的每个顶点匹配到当前图案模型聚类中每个图案模型上最接近的位置。设vi是共同表面的一个顶点,wij是最接近vi的图案模型Pj的顶点。优化块322通过最优化等式(2)(vi作为参数)计算出新的共同表面,并输出CRS。该优化过程最优化CRS和位移。
E ( v i 2 ) = min v i Σ i ( c 1 Σ j | | w ij - v ij | | 2 + c 2 Σ j | | ( v ij - 1 | ( ij , kj ) | Σ e = ( ji , kj ) v kj ) - l ij | | 2 + c 3 | | v i - v i ' | | 2 )   (等式2)
(·=标量乘法)    (等式3)
l i = ( v i - 1 | ( i , k ) | Σ e = ( i , k ) v k ) , l ij = w ij - 1 | ( ij , kj ) | Σ e = ( ij , kj ) w kj     (等式4)
其中vi是共同表面顶点的新位置,vi'是共同表面顶点的当前位置,||x,y,z||表示向量(x,y,z)的长度。
等式2表示一个代表能量函数(理论上对应于冗余度)的项(term)。最优化是指使得该能量最小。在等式(2)中,使用c1,c2和c3加权的不同的项代表以下含义:使用c1加权的第一项代表偏离的CRS顶点和实际顶点之间的距离,即位置匹配。使用c2加权的第二项代表偏离的CRS顶点的法向和实际顶点的法向之间的距离,即法向匹配。使用c3加权的第三项代表迭代步长大小。换句话说,第一项将重建网格(restored mesh)拉向原始网格,第二项保持原始网格的局部细节(法向),第三项将共同表面拉向其在前一次迭代中被调整到的位置(即与前一次迭代比较)。c1,c2和c3是参数,例如用户定义的阈值。为简单起见,它们最初可以设置为c1=c2=c3=1,并在稍后根据经验进行修改。等式4中的li是所谓的拉普拉斯算子向量5,它可以用来近似部分法向。
验证块330计算每个图案网格的位移图,并验证共同表面和位移图是否可以代表图案网格。对于图案网格P,其位移图的计算如图8所示,其中P是图案网格,S是其对应的共同表面。拉普拉斯算子向量可以根据下式计算:
l i = v i - 1 | ( i , k ) | Σ e = ( i , k ) v k     (等式5)
位移图可以根据下式计算:
h P ( v i ) = | | v i P - v i | |     (等式6)
重建的图案网格为P'=P+hp(.)。如果P'和P之间的距离小于某些用户定义的阈值,那么P可以用与之对应的共同表面S和位移图h()表示。P'和P之间的距离可以是所谓的Hausdorff距离。[ASPERT02]6描述了计算两个网格之间的距离的一种示例性方法。可以对上述用户定义的阈值进行修改以适应当前需要,因此进行的压缩要么是有损的要么是(至少视觉上)无损的。
在输出的紧凑表示中,在块300中计算的共同表面也被称为几何图案。
在一个实施例中,一个多连通的三维网格模型的紧凑表示包括:
-表示几何图案的数量的若干比特,其中CRS也被视为是一种几何图案;
-表示每个几何图案的压缩几何图案的若干比特;
-表示实例的数量的若干比特;
-对于每个实例,示出其位置的若干比特、示出其缩放的若干比特、示出其方向轴的若干比特,示出其几何图案标识符的若干比特、指示位移图是否必需的1比特标志,以及示出其单独的位移图(如果有)的若干比特。
图9示出了一种用于对可以是(但不必须是)一个或多个三维网格模型中连通的组件的多个几何图案ei进行编码的装置的一个实施例。该装置包括检测部件92,用于检测相似的几何图案;聚类部件93,用于将检测到的相似的几何图案聚类到一个共同聚类;计算部件94,用于生成聚类代表表面;位移图生成部件95a和95b,用于为至少两个被聚类的几何图案生成单独的位移图,其中每个位移图定义聚类代表表面的顶点和被聚类的几何图案的顶点之间的位移;以及编码器96,用于通过聚类代表表面和位移图对多个几何图案进行编码。该编码器输出已编码的数据流eo。该装置可以包括一个或多个位移图生成部件95a和95b。在一个实施例中,检测部件92包括归一化器91a(例如,计算部件),用于归一化检测到的几何图案以及用于提供有关检测到的几何图案的位置、方向和缩放信息。一些或所有的模块都可以访问一个共同的存储部件97。
在一个实施例中,用于检测相似的几何图案的检测部件92包括副本检测部件91b,用于在最初始时检测出至少两个相等的几何图案(归一化之后),并用于将它们表示为一个副本集代表几何图案的若干实例。在此情形中,随后的模块(聚类部件93、CRS计算部件94、位移图生成部件95a和95b以及编码器96)使用副本集代表而不是单独的相等的几何图案,并且编码器96使用至少两个有关的几何图案来编码到副本集合代表和个体的位置,方向和规模的信息的参考。
图10示出了一种用于对输入数据流110中可以是(但不必须是)一个或多个三维网格模型中连通的组件的多个几何图案进行解码的装置的一个实施例。该装置包括:第一解码器101,用于对第一数据进行解码以获得聚类代表表面111(即,CRS解码器101);第二解码器102,用于对第二数据进行解码以获得至少两个位移图112a和112b;第一重建部件103,用于重建聚类代表面113(即,103CRS重建器);第二重建部件104a,用于通过将至少两个位移图中的第一位移图112a应用到聚类代表表面重建第一几何图案114a(即,几何图案重建器104a);以及第三重建部件104b,用于通过将至少两个位移图中的第二位移图112b应用到聚类代表表面113重建第二几何图案114b。第二和第三重建部件104a和104b可以完全相同,即单个几何图案重建部件104。可替代地,也可以有更多的几何图案重建部件,这是有利于同时处理。
在一个实施例中,用于解码的装置还包括第三解码器105,用于对输入数据流110中的第三数据进行解码以获得第一和/或第二和/或更多的几何图案的位置、方向和缩放数据115,它们在稍后被用来重建单个的几何图案。在一个实施例中,组合部件106(例如,呈现器)至少将第一和第二重建的几何图案114a和114b以及可选择地更多的几何图案114X组合成输出的3D网格模型116。
在一个实施例中,解码器还包括第四重建部件107,用于从是一个副本集代表(例如部件413)的一个几何图案重建至少两个相等的组件,其中两个相等的组件具有相关联的不同的位置、方向和/或尺寸信息。然后可以通过根据副本集信息403a或根据与表示一个组件的数据集相关联的单个组件信息复制副本集代表来重建每个单独的副本423、424。
在一个实施例中,如图11a)所示,一种用于对多个几何图案进行编码的方法,其中几何图案可以是(但不必须是)一个或多个三维网格模型中连通的组件,包括下列步骤:检测201相似的几何图案301、302、303和304;将检测到的相似的几何图案聚类203到一个共同聚类;生成或计算204一个CRS320;为至少两个被聚类的几何图案生成205各自单独的位移图331、332和333,其中每个位移图定义CRS320的顶点和被聚类的几何图案的顶点之间的位移;以及通过对CRS和位移图进行编码来对多个几何图案进行编码。
在一个实施例中,检测相似的几何图案201的步骤包括归一化201a连通的组件,然后相互比较201b归一化后的组件,以检测相似性。归一化可以包括归一化几何图案的大小(即缩放)、方向(即旋转)和/或位置(即平移)。
在一个实施例中,生成或计算204一个聚类的CRS的步骤包括求取该聚类中被聚类的几何图案的平均。
在一个实施例中,检测201相似的几何图案的步骤包括下列初始步骤:(在一个实施例中,归一化之后)检测202至少两个相等的几何图案,并将它们表示为一个几何图案代表313的若干实例:对于聚类203的步骤和更多的步骤,使用的是几何图案代表313,而不是单独的相等的几何图案303和304。在本实施例中,使用几何图案或它的位移图编码指示,指示它所指的几何图案代表313。它也可以指示出它们的变换信息,即它们中一个或多个的位置、方向和缩放。在一个实施例中,相等的几何图案303和304使用它们的共同代表320(或其标识符)、单个位移图和不同的单独的变换信息数据集表示在编码数据流中。
在一个实施例中,生成聚类中至少两个几何图案的位移图的步骤95包括最小化能量函数(上面提到的等式(2))。在一个实施例中,迭代地最小化能量函数。在一个实施例中,能量函数至少包括表示顶点的位置匹配的第一部分和表示法线的方向匹配的第二部分。如果迭代地最小化能量函数,那么能量函数可以包括代表迭代步长大小的第三部分。
在一个实施例中,位移图定义聚类代表表面320的每个顶点在其各自的法线方向上的位移。在一个实施例中,位移图还可以定义顶点位移的方向。可以对位移方向进行差分编码,例如距离顶点的法线方向的偏差。
在一个实施例中,计算204初始共同表面包括迭代:每次迭代都包括一个匹配的步骤(即将共同表面的每个顶点匹配到当前图案模型聚类中每个图案模型上最接近的位置),以及一个变形的步骤(即最小化位置偏差和法向偏差)。在一个实施例中,根据等式5的拉普拉斯算子向量被用来近似法向。
在一个实施例中,计算204CRS包括将一个聚类中所有的几何图案嵌入规则网格并提取体素外壳的可见表面作为初始共同表面。一个图案聚类的体素外壳是所有图案模型内部的所有网格体素的集合。
在一个实施例中,计算204CRS初始共同表面包括根据等式2的最优化。
在一个实施例中,该方法包括存储和/或发送一个聚类的代表表面和位移图的步骤。
在一个实施例中,如图11b)所示,一种用于对是一个或多个三维网格模型中连通的组件的多个几何图案进行解码的方法包括下列步骤:对第一数据进行解码501以获得聚类代表表面420;对第二数据进行解码502以获得至少两个位移图;重建503CRS420;通过将至少两个位移图中的第一位移图应用到CRS420重建504第一几何图案421;以及通过将至少两个位移图中的第二位移图应用到CRS420重建505第二几何图案422。
在该解码方法的一个实施例中,它进一步包括对第三数据进行解码506以获得第一几何图案421和/或第二几何图案422的位置、方向和缩放数据的步骤。
应当指出,虽然在上述示例性实施例中,一个聚类的共同代表是体素的最小共有子集,但也可以为一个聚类构建其他类型的共同代表,如它(们)对本领域的普通技术人员来说是显而易见的,所有都被视为在本发明的精神和范围之内。
虽然已经以本发明应用于其优选实施例的方式示出、描述并指出本发明的根本新颖特征所在,但应该理解的是,本领域的技术人员在不脱离本发明的精神的情况下可以对所述设备和方法、公开的装置的形式和细节以及其操作做出各种省略、替换和改变。虽然本发明已经公开为有关旋转对称组件,但是本领域的一个技术人员将会认识到本说明书中描述的方法和装置可以应用于任何类型的组件。尽管多个几何图案已经被描述为一个或多个三维网格模型中连通的组件,但是该多个几何图案在理论上可以包括被编码在一起的任何一组几何图案,尤其是当可以利用几何图案之间的冗余进行编码时。这里明确表明的是,以实质上相同的方式执行实质上相同的功能来实现相同的结果的那些元件的所有组合都在本发明的范围之内。将一个已描述实施例中的元件替换成另一个也被完全预料和考虑。为了简单,指代几何形状模型的参考符号可以被理解为指的是表示这些几何模型的数据。
应该理解的是,已经通过单纯举例的方式对本发明进行了描述,在不脱离本发明的范围的情况下,可以对细节做出修改。在说明书以及(如果适用)权利要求和附图中公开的每个特征可以被独立地或以任何合适的组合提供。各个特征可以在合适的情况下被实施在硬件、软件或两者的组合中。出现在权利要求中的参考标号仅用作示例,对权利要求的范围不具有限制作用。
注解
1J.L.Peng,C.-S.Kim and C.-C.Jay Kuo.Technologies for3D meshcompression:A survey.ELSEVIER Journal of Visual Communication and ImageRepresentation,16(6),688-733,2005
2Kangying Cai,Yu Jin,Wencheng Wang,Quqing Chen,Zhibo Chen,JunTeng:Compression of massive models by efficiently exploiting repeated patterns.VRST2009:229-230
3Kangying Cai,Wencheng Wang,Zhibo Chen,Quqing Chen,Jun Teng:Exploiting repeated patterns for efficient compression of massive models.VRCAI2009:145-150
4L.Szirmay-Kalos,.Umenhoffer:"Displacement Mapping on the GPU-State of the Art";in Computer Graphics Forum(CGF),Volume25(2006),Number3,pp.1-24
5SORKINE,0.,LIPMAN,Y.,COHEN-OR,D.,ALEXA,.,RoSSL,C,ANDSEIDEL,H.-P.2004.Laplacian surface editing.In Proc.of Symp.of GeometryProcessing,179-188.
6N.Aspert,D.Santa-Cruz and T.Ebrahimi,MESH:Measuring Errorbetween Surfaces using the Hausdorff distance,in Proceedings of the IEEEInternational Conference on Multimedia and Expo2002(ICME),vol.I,pp.705-70

Claims (15)

1.一种用于对多个几何图案进行编码的方法,其中几何图案是一个或多个三维网格模型中连通的组件,所述方法包括下列步骤:
-检测(201)相似的几何图案(301,302,303,304);
-将检测到的相似的几何图案聚类(203)到一个共同聚类;
-生成(204)一个聚类代表平面(320);
-为至少两个被聚类的几何图案生成(205)单独的位移图(331,332,333),其中每个位移图定义聚类代表平面(320)的顶点和被聚类的几何图案的顶点之间的位移;以及
-通过对代表平面和位移图进行编码来对多个几何图案进行编码。
2.如权利要求1所述的方法,其中检测相似的几何图案的步骤包括归一化连通的组件,然后比较归一化后的组件,其中归一化是指位置、方向和尺寸。
3.如权利要求2所述的方法,其中位移图(331,332,333)具有相关联的或包括各个原始组件的位置信息、方向信息和/或尺寸信息。
4.如权利要求1-3中任何一项所述的方法,其中生成(204)一个聚类的聚类代表平面包括求取该聚类中被聚类的几何图案的平均。
5.如权利要求1-4中任何一项所述的方法,其中所述检测(201)相似的几何图案的步骤包括下列初始步骤:检测出(202)在归一化之后至少两个相等的几何图案(303,304),并将它们表示为一个几何图案代表(313)的若干实例,其中对于聚类(203)的步骤和更多的步骤,使用的是几何图案代表(313),而不是单独的相等的几何图案(303,304),并且其中,使用所述至少两个几何图案来编码指示,指示它们所指的几何图案代表(313)。
6.如权利要求1-5中任何一项所述的方法,其中位移图定义聚类代表表面(320)的至少一个顶点在其法线方向上的位移。
7.如权利要求1-6中任何一项所述的方法,其中所述生成聚类中所述至少两个几何图案的位移图的步骤包括最小化能量函数
8.如权利要求7所述的方法,其中迭代地最小化能量函数,并且其中,能量函数包括表示顶点的位置匹配的第一部分、表示法线的方向匹配的第二部分和代表迭代步长大小的第三部分。
9.一种用于对多个几何图案进行解码的方法,其中几何图案是一个或多个三维网格模型中连通的组件,所述方法包括下列步骤:
-对第一数据进行解码(401)以获得聚类代表表面(420);
-对第二数据和第三数据进行解码(402)以获得至少两个位移图;
-重建聚类代表表面(420);
-通过将至少两个位移图中的第一位移图应用到聚类代表表面(420)重建第一几何图案(421);以及
-通过将至少两个位移图中的第二位移图应用到聚类代表表面(420)重建第二几何图案(422)。
10.如权利要求9所述的方法,进一步包括对第四数据进行解码(403)以获得第一几何图案和/或第二几何图案(421,422)的位置、方向和缩放数据的步骤,其中第四数据从所述第二或第三数据中提取。
11.如权利要求9或10所述的方法,进一步包括至少将第一和第二重建的几何图案(114a,114b)组合成3D网格模型(116)的步骤。
12.一种用于对是一个或多个三维网格模型中连通的组件的多个几何图案进行编码的装置,包括:
-检测部件(92),用于检测相似的几何图案;
-聚类部件(93),用于将检测到的相似的几何图案聚类到一个共同聚类;
-计算部件(94),用于生成聚类代表表面;
-位移图生成部件(95a,95b),用于为至少两个被聚类的几何图案生成单独的位移图,其中每个位移图定义聚类代表表面的顶点和被聚类的几何图案的顶点之间的位移;以及
-编码部件(96),用于通过聚类代表表面和位移图对多个几何图案进行编码。
13.一种用于对是一个或多个三维网格模型中连通的组件的多个几何图案进行解码的装置,包括:
-第一解码器(101),用于对第一数据进行解码以获得聚类代表表面;
-第二解码器(102),用于对第二数据进行解码以获得至少两个位移图;
-第一重建部件(103),用于重建聚类代表面;
-第二重建部件(104a),用于通过将至少两个位移图中的第一位移图应用到聚类代表表面重建第一几何图案;以及
-第三重建部件(104b),用于通过将至少两个位移图中的第二位移图应用到聚类代表表面重建第二几何图案。
14.如权利要求13所述的解码装置,还包括:组合部件(106),用于至少将第一和第二重建的几何图案(114a,114b)组合成3D网格模型;以及第四重建部件,用于从作为副本集代表的几何图案来重建至少两个相等的组件,其中两个相等的组件具有相关联的不同的位置、方向和/或尺寸信息。
15.一种表示3D网格模型的数据结构或数据流,包括:
-作为至少两个不同的几何图案(301,302)的共同代表(320)的组件的数据;以及
-与共同代表和至少两个几何图案相关的至少两个不同的位移图(341,342)。
CN201080069356.0A 2010-09-30 2010-09-30 几何图案编码方法和设备,以及几何图案解码方法和设备 Active CN103329169B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2010/001540 WO2012040883A1 (en) 2010-09-30 2010-09-30 Method and apparatus for encoding geometry patterns, and method and apparatus for decoding geometry patterns

Publications (2)

Publication Number Publication Date
CN103329169A true CN103329169A (zh) 2013-09-25
CN103329169B CN103329169B (zh) 2016-01-27

Family

ID=45891788

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080069356.0A Active CN103329169B (zh) 2010-09-30 2010-09-30 几何图案编码方法和设备,以及几何图案解码方法和设备

Country Status (8)

Country Link
US (1) US9002121B2 (zh)
EP (1) EP2622579A4 (zh)
JP (1) JP5735114B2 (zh)
KR (1) KR101730217B1 (zh)
CN (1) CN103329169B (zh)
AU (1) AU2010361598B2 (zh)
BR (1) BR112013006538A2 (zh)
WO (1) WO2012040883A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023174336A1 (zh) * 2022-03-18 2023-09-21 维沃移动通信有限公司 编码、解码方法、装置及设备

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9235920B2 (en) * 2011-12-22 2016-01-12 Telefonaktiebolaget L M Ericsson (Publ) Method and processor for 3D scene representation
US9621924B2 (en) 2012-04-18 2017-04-11 Thomson Licensing Vextex correction method and apparatus for rotated three-dimensional (3D) components
CN104246830A (zh) * 2012-04-19 2014-12-24 汤姆逊许可公司 估计多组件三维模型的误差度量的方法和装置
KR20150004838A (ko) * 2012-04-19 2015-01-13 톰슨 라이센싱 멀티-컴포넌트 3d 모델에 대한 에러 메트릭을 추정하기 위한 방법 및 장치
JP6246233B2 (ja) 2013-01-10 2017-12-13 トムソン ライセンシングThomson Licensing 頂点誤差訂正のための方法および装置
GB2530103B (en) * 2014-09-15 2018-10-17 Samsung Electronics Co Ltd Rendering geometric shapes
EP3018630A3 (en) 2014-09-15 2018-05-16 Samsung Electronics Co., Ltd. Display method and apparatus for rendering repeated geometric shapes
US9893948B2 (en) 2015-03-26 2018-02-13 Utopus Insights, Inc. Network management using hierarchical and multi-scenario graphs
WO2019023400A1 (en) * 2017-07-28 2019-01-31 Baobab Studios Inc. SYSTEMS AND METHODS FOR ANIMATIONS AND INTERACTIVITY OF REAL-TIME COMPLEX CHARACTERS
US11225028B2 (en) * 2019-11-14 2022-01-18 NEXA3D Inc. Methods of representing three dimensional articles to be produced using additive manufacturing processes in digital file formats
WO2024030279A1 (en) * 2022-08-01 2024-02-08 Innopeak Technology, Inc. Encoding method, decoding method, encoder and decoder

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1339142A (zh) * 1999-02-03 2002-03-06 伊瑟夫电视公司 使用通用3d图形管道进行成本低廉的数字图像和视频编辑的方法和装置
WO2009128660A2 (en) * 2008-04-18 2009-10-22 Electronics And Telecommunications Research Institute Method and apparatus for real time 3d mesh compression, based on quanitzation

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5903458A (en) * 1997-06-06 1999-05-11 Ford Global Technologies, Inc. System and method for forming geometric features using global reparametrization
EP1086412A4 (en) * 1998-06-08 2008-05-07 Microsoft Corp COMPRESSION OF TIME-DEPENDENT GEOMETRY
GB2377604B (en) 2001-07-09 2005-09-28 Superscape Plc Mesh compression
US7174050B2 (en) * 2002-02-12 2007-02-06 International Business Machines Corporation Space-optimized texture maps
JP4893148B2 (ja) * 2006-08-09 2012-03-07 株式会社日立製作所 形状簡略化装置及びそれに用いられるプログラム
EP2097920B1 (de) * 2007-07-23 2017-08-09 TRUMPF Hüttinger GmbH + Co. KG Plasmaversorgungseinrichtung
KR100910031B1 (ko) * 2007-09-06 2009-07-30 한양대학교 산학협력단 3차원 메쉬 모델의 부호화 장치, 그 방법 및 이를 기록한기록매체
US8384714B2 (en) * 2008-05-13 2013-02-26 The Board Of Trustees Of The Leland Stanford Junior University Systems, methods and devices for motion capture using video imaging
EP2216750A1 (en) 2009-02-06 2010-08-11 Thomson Licensing Method and apparatus for encoding 3D mesh models, and method and apparatus for decoding encoded 3D mesh models

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1339142A (zh) * 1999-02-03 2002-03-06 伊瑟夫电视公司 使用通用3d图形管道进行成本低廉的数字图像和视频编辑的方法和装置
WO2009128660A2 (en) * 2008-04-18 2009-10-22 Electronics And Telecommunications Research Institute Method and apparatus for real time 3d mesh compression, based on quanitzation

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KANGYING CAI ETAL: "《VRCAI》", 15 December 2009 *
于行洲等: "位移蝶形细分面片的渐进传输", 《计算机辅助设计与图形学学报》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023174336A1 (zh) * 2022-03-18 2023-09-21 维沃移动通信有限公司 编码、解码方法、装置及设备

Also Published As

Publication number Publication date
US20130182960A1 (en) 2013-07-18
KR101730217B1 (ko) 2017-04-25
EP2622579A4 (en) 2016-12-07
WO2012040883A1 (en) 2012-04-05
JP2013539125A (ja) 2013-10-17
AU2010361598A8 (en) 2013-04-11
KR20130115237A (ko) 2013-10-21
JP5735114B2 (ja) 2015-06-17
AU2010361598A1 (en) 2013-03-28
BR112013006538A2 (pt) 2016-05-31
EP2622579A1 (en) 2013-08-07
CN103329169B (zh) 2016-01-27
AU2010361598B2 (en) 2014-08-07
US9002121B2 (en) 2015-04-07

Similar Documents

Publication Publication Date Title
CN103329169B (zh) 几何图案编码方法和设备,以及几何图案解码方法和设备
Huang et al. 3d point cloud geometry compression on deep learning
CN102804230B (zh) 使用重复图案压缩3d网格
Xiao et al. Unsupervised point cloud representation learning with deep neural networks: A survey
JP5456903B2 (ja) メッシュ・モデルを符号化する方法及び装置、符号化されたメッシュ・モデル、並びに、メッシュ・モデルを復号化する方法及び装置
CN103918009A (zh) 预测位置编码
CN104040592A (zh) 预测位置编码
Zhang et al. Dspoint: Dual-scale point cloud recognition with high-frequency fusion
CN114140601A (zh) 深度学习框架下基于单幅图像的三维网格重建方法及系统
US8022949B2 (en) System and method for generating curvature adapted isosurface based on delaunay triangulation
Alqudah Survey of surface reconstruction algorithms
CN101894395A (zh) 一种计算机图形的点模型几何信息的各向异性表示方法
Pournin et al. Constrained paths in the flip-graph of regular triangulations
Masuda et al. Coding topological structure of 3D CAD models
Wang et al. Spectral animation compression
Gao et al. Learning Spectral Dictionary for Local Representation of Mesh.
Chen et al. Neighborhood selection for differential coordinates of 3d point clouds
Lu Linear-time compression of bounded-genus graphs into information-theoretically optimal number of bits
Klawitter et al. A Dual Quaternion Based Pipe Alignment Algorithm for Constrained Pipe Systems
Sun et al. Density-Based Geometry Compression for LiDAR Point Clouds.
Fayolle et al. Constructive tree recovery using genetic algorithms
Silva et al. Computational Applications of Geometric Algebra
De Floriani et al. Representing non-manifold shapes in arbitrary dimensions
CN101763653A (zh) 基于附属平行六面体空间的面心立方网格直线生成方法
Bajaj et al. Operations on Polynomial Curves and Surfaces

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190530

Address after: American Delaware

Patentee after: Interactive Digital VC Holding Company

Address before: I Si Eli Murli Nor, France

Patentee before: Thomson Licensing SA