CN1356669A - 利用线性近似对动画路径进行压缩和重构的方法和装置 - Google Patents

利用线性近似对动画路径进行压缩和重构的方法和装置 Download PDF

Info

Publication number
CN1356669A
CN1356669A CN01139423A CN01139423A CN1356669A CN 1356669 A CN1356669 A CN 1356669A CN 01139423 A CN01139423 A CN 01139423A CN 01139423 A CN01139423 A CN 01139423A CN 1356669 A CN1356669 A CN 1356669A
Authority
CN
China
Prior art keywords
key
breakpoint
key assignments
path
animation path
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN01139423A
Other languages
English (en)
Other versions
CN1215440C (zh
Inventor
张义善
金道均
禹相玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020010040704A external-priority patent/KR100561835B1/ko
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN1356669A publication Critical patent/CN1356669A/zh
Application granted granted Critical
Publication of CN1215440C publication Critical patent/CN1215440C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T13/00Animation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/001Model-based coding, e.g. wire frame
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • H04N19/25Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding with scene description coding, e.g. binary format for scenes [BIFS] compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • H04N19/27Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding involving both synthetic and natural picture components, e.g. synthetic natural hybrid coding [SNHC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Processing Or Creating Images (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

在此提供一种用于利用线性近似压缩和重构动画路径的方法,用于执行该方法的装置,及其数据结构。该用于压缩动画路径的装置包括:插值分析单元,用于从动画路径提取预定数目的断点,并且输出对应于该断点的键和键值;键编码器,用于编码从插值分析单元输出的键;键值编码器,用于编码从插值分析单元输出的键值;以及熵编码器,用于分别对在键编码器和键值编码器中编码的键和键值进行熵编码,并且输出编码的位流。根据该方法,通过分析断点,获得具有最小数目的断点的简化编码位流。

Description

利用线性近似对动画路径进行压缩和重构的方法和装置
技术领域
本发明涉及三维(3D)模型的动画制作,更加特别涉及利用线性近似对用于动画制作中的动画路径进行压缩和重构的装置,用于该装置中的压缩和重构方法,以及用于该装置和方法的数据格式。
背景技术
在三维计算机动画制作中,使用插值来表现三维模型对象在空间中的运动和旋转、模型变形、颜色改变等等。
图1为用于说明在普通3D动画制作中的动画路径,并且垂直轴表示键值(KEY_VALUE)并且水平轴表示键(KEY)。
如图1中所示,动画路径20表示3D模型10的动画轨迹。动画信息的路径20是随时间变化的二维曲线,如图1中所示。该动画路径被由多种方法来表现,该方法在由Prentice Hall在1989年由A.K.Jain所著的“数字图像处理基础”的第九章中说明。
在使用插值的表现中,具有如图1中所示的曲线形状的动画路径20可以利用多个线段由确定的线条所表示。在该表现中的基本信息包括每条确定的直线段的断点或顶点。在此,断点或顶点被表示为在图1的动画路径上的点。利用线性插值,可以从该断点重构原始曲线。
图2是用于虚似现实模型语言(VRML)或者MPEG-4中的动画路径的表达式(标量插值)的一个例子。要被处理的信息包括键和键值,并且使用给定的信息执行线性插值。
插值可以大概分为6种:标量插值、位置插值、坐标插值、方向插值、标准插值和颜色插值。在这些插值中,标量插值可以表达为如图2中所示。6种插值的特征和功能在下表1中示出,并且所有插值是给定键的组合以及对应于该键的键值。
表1
种类 特征 功能
标量插值 标量改变量的线性插值 宽度、弧度、体积等等的表达
位置插值 在三维坐标上的线性插值 在三维空间中的平移运动
方向插值 三维轴的球面线性插值以及旋转量 在三维空间中的旋转
坐标插值 三维模型坐标改变量的线性插值 三维变形
标准插值 三维标准坐标的球面线性插值 三维标准矢量改变的表达
颜色插值 色调信息的线性插值 色调改变量的表达
图3为用于说明三维动画据格式的示意图,并且示出编码器30、解码器40和三维动画文件格式50。在此,从编码器30输出到解码器40的三维动画文件格式50由模型数据、动画数据、属性、视频/纹理和声音所形成。
参见图3,插值对应于有效表达三维动画路径的动画数据。由VRML或者MPEG-4所表达的三维动画数据由图3中所示的信息所形成的。而标准化的压缩技术被用于音频、视频和三维模型,仅仅面向表达的通用压缩技术被用于确定动画路径的插值。在包括音频/视频的动画中,用于动画路径与三维模型的数据量占用了大多数所需的数据量。因此,用于动画路径压缩的技术与用于三维模型压缩的技术一样都是重要的。尽管该MPEG-4用于场景二进制格式(BIFS)对动画提供一种基本的量化/压缩方法,但是该方法不是专用于插值的技术,而是一种通用的压缩技术并且具有较差的压缩性能。这在于2000年在纽约举行的关于多媒体的国际会议和博览会中公开于由Euee S.Jang所著的“三维动画编码:其历史和固件”报告中。
图4a和4b分别为现有动画路径压缩和重构装置的方框图。图4a的现有技术压缩装置由一个标量量化单元60所形成。并且图4b的现有重构装置由一个标量去量化单元70所形成。原始动画路径以(键,键值)的形式通过输入端IN1输入到图4a的标量量化单元60中,并且被标量量化。作为标量量化的结果和编码位流被通过输出端OUT1输出。图4b的标量去量化单元70通过输入端IN2接收编码的位流,并且以重构的动画路径(键,键值)的形式把数据通过输出端OUT2输出。
在现有MPEG-4 BIFS中的插值压缩需要图4a中所示的标量量化。图4a的现有压缩处理不但用于插值而且用于在BIFS中需要压缩的所有单元。在压缩次序的反向操作中,利用输入到图4b的现有重构装置的编码位流通过70重构动画路径。在图4a和图4b的装置中,以统一的方式压缩插值的键和键值,而不考虑每种插值的特性,从而不能够实现最大程度的压缩。
发明内容
为了解决上述问题,本发明的第一个目的是提供一种用于利用线性近似压缩动画路径的装置和方法,其中以插值形式的动画数据被有效压缩,从而快速地执行数据发送和数据存储。
本发明的第二个目的是提供一种动画路径重构装置和方法,用于重构所压缩的动画路径数据。
本发明的第三个目的是提供一种用于压缩动画路径数据的数据格式。
为了实现本发明的第一个目的,在此提高一种用于压缩动画路径的装置,其具有插值分析单元,用于从动画路径提取预定数目的断点,并且输出对应于该断点的键和键值;键编码器,用于编码从插值分析单元输出的键;键值编码器,用于编码从插值分析单元输出的键值;以及熵编码器,用于分别对在键编码器和键值编码器中编码的键和键值进行熵编码,并且输出编码的位流。
为了实现本发明的第二目的,在此提供一种用于重构动画路径的装置,其具有熵解码器,用于接收编码的位流并且对该位流进行熵解码;键值解码器,用于接收熵解码结果和解码的键值;以及插值重构单元,用于分别根据在键解码器和键值解码器中解码的键和键值通过线性插值获得空的键值,并且重构原始动画路径。
并且,为了实现本发明的第一目的,在此提供一种用于压缩动画路径的方法,其具有如下步骤:从原始动画路径提取预定数目的断;利用所提取的断点提取键和键值,并且对该键和键值编码;以及对编码的键和键值进行熵编码,以获得编码的位流。
为了实现本发明的第二目的,在此提供一种用于提取动画路径的断点的方法,其中包括如下步骤:(a)在动画路径上的断点中选择在原始动画路径的两个端点上的断点;(b)在除了两个所选择断点之外的剩余断点中选择一个断点;(c)利用所选择的断点,对除了所选择断点之外的剩余断点的键值进行插值;(d)根据所选择的断点和插值的键值形成近似路径,选择在原始动画路径和近似动画路径之间具有最小路径差异的一个近似动画路径,并且选择对应于所选动画路径的断点;(e)在除了步骤(a)和(b)中选择的断点之外的剩余断点中选择一个断点,并且重复步骤(c)至(e),直到该路径差小于许可的差值。
最好,该路径差由原始动画路径和近似动画路径所形成的梯形或扭曲梯形的面积和所表达。
最好,在方向插值中,该路径差值被定义为在差动旋转变换中的差动旋转角,其是原始动画路径的旋转变换与近似路径的旋转变换之间的差。
并且,为了实现本发明的第二个目的,在此提供一种用于重构动画路径的方法,其具有如下步骤:接收和熵解码一个所编码的位流;从熵解码的结果对键和键值解码;以及通过根据解码的键和键值进行线性插值而获得空的键值,来重构原始动画路径。
为了实现本发明的第三个目的,在此提供一种通过对动画路径进行编码而获得的位流的数据格式,该数据格式具有键标志,用于表示在对应于动画路径的每个断点的x、y或z坐标的键值中选择哪个轴的键值;矩阵型的键,用于表示在对应于每个断点的x、y或z坐标的键值中选择至少一个或多个键值;以及用于表示为每个断点所选择的键值的矩阵型键值。
附图说明
通过参照附图详细描述优选实施例,本发明的上述目的和特点将变得更加清楚,其中:
图1为说明在普通三维(3D)动画中的动画路径的示意图;
图2为用于虚拟现实模型语言(VRML)或者MPEG-4中的动画路径的一种表达的例子;
图3为用于说明三维动画的数据格式的示意图;
图4a和4b分别为现有动画路径压缩和重构装置的方框图;
图5a和5b分别为根据本发明的动画路径压缩和重构装置的方框图;
图6为图5a的根据本发明的压缩装置的优选实施例的方框图;
图7为图5b的根据本发明的压缩装置的优选实施例的方框图;
图8a至8h为用于说明根据本发明利用线性近似提取断点的优选实施例的示意图;
图9为用于说明用于获得实际动画路径和近似动画路径之间的插值的方法;
图10为量化处理的示意图,更加具体来说是通常使用的差分脉码调制(DPCM)的量化处理;
图11a至11e为用于示出根据本发明的编码位流的格式的示意图;
图12为用于说明根据本发明在语法表达中表达的解码处理的表格;
图13a至13d为用于把本发明的压缩方法和现有压缩方法相比较的实验动画序列的曲线图;以及
图14a至14f为用于说明根据本发明使用球面线性近似提取断点的另一个优选实施例的示意图。
具体实施方式
在下文本发明的描述中,所用的插值表达式是用于VRML/MPEG-4中的表达式,并且该插值所使用的领域包括在线计算机游戏、动画广告等等。
图5a为根据本发明用于压缩动画路径的装置的方框图,该装置包括插值分析单元80、键(K)编码器82、键值(KV)编码器84、以及熵编码器86。图5b为根据本发明用于重构动画路径的装置的方框图,该装置包括熵解码器90、键解码器92、键值解码器94以及插值重构单元96。
图5a的压缩装置的插值分析单元80选择要被编码的键和键值,并且可以考虑插值的不同类型的特性而设计。具体分析的例子将在下文中描述。
图6为图5a的根据本发明的压缩装置的优选实施例的方框图。图6的压缩装置包括具有标准化单元100和断点最小化单元102的插值分析单元80、具有差分脉码调制(DPCM)量化器104的键编码器82、具有DPCM量化单元106的键值编码器84以及熵编码器86。
图7为图5b的根据本发明的重构装置的优选实施例的方框图。该重构装置包括熵解码器90、具有DPCM去量化器126的键解码器92、具有DPCM去量化器128的键值解码器、以及具有键和键值重构单元95的插值重构单元。
提供到插值分析单元80的输入端的插值表达式包括键(K)和键值(KV)。在图6的压缩装置中,插值分析单元80调节断点数目,使得通过输入端IN3输入的动画路径可以用最少数目的断点来表达。如果动画路径的断点的原始数目为N,则从插值分析单元80输出的该断点数被调节为M(M≤N)。也就是说,插值分析单元80从输入到输入端IN3的原始动画路径提取断点。
在一个插值中,键和键值可以被分别标准化并使用。为此,标准化单元100对通过输入端IN3输入的原始动画路径中的每个键和键值进行标准化,并且把标准化的结果输出到断点最小化单元102。由VRML所支持的键是在0和1之间包括0和1在内的一个数值。
可以确定插值分析单元80调节断点数的方式,使得由所调节断点产生的动画路径与原始动画路径的差值最小。为此,断点最小化单元102从由标准化单元102输出的标准化的键和键值提取断点,使得所提取断点的数目最小化。例如,对于位置插值,断点最小化单元102确定断点,使得由插值分析单元80所确定的表示实际路径和量化路径之间的误差的面积最小化。
同时,现在将描述在图6的断点最小化单元102中执行的利用线性近似的断点提取。
图8a至8h为用于说明根据本发明使用线性近似的提取断点的优选实施例的方框图。在动画路径上的每个点表示一个断点。图8a为原始动画路径。图8b示出用于查找该路径的两个端点(A,B)的处理。图8c示出用于选择最接近于原始路径的断点的处理。图8d示出被首先选择的断点A、B和C。图8e示出用于提取最接近于原始路径的第二断点的处理。图8f示出其次选择的断点A、B、C和D。图8g示出第三次选择的断点A、B、C、D和E。图8h示出第四次选择的断点A、B、C、D、E和F。
当给出如图8a中所示的原始动画路径时,重复执行一个处理,用于以端点A和B作为起点在原始动画路径上的断点(N)中查找表示与原始路径具有最小差别的近拟路径的断点(M个断点,2≤M≤N)。该处理在图8b至8h中示出。在此时,可以重复执行断点的提取直到确定近似路径足够接近于原始路径时为止。
参照附图,现在将描述使用面积差的方法,作为一种用于获得近似路径与实际路径之间的差的方法。
图9为用于说明获得实际动画路径和近似动画路径之间的差的方法的示意图。参照图9由一个梯形或一个扭曲的梯形来表达两个路径之间的差。下面提供用于获得该梯形的面积的方程1以及用于获得该扭曲梯形的面积的方程2。实际动画路径200和近似动画路径210之间的差可以由该梯形的面积与扭曲梯形的面积之和来表达。该面积之和是方程3中所示的两个路径之间的面积差(DA)。 D trapezoid = ( a + b ) h 2 … … … ( 1 ) D twisted _ trapezoid = 1 2 ( a 2 + b 2 ) ( a + b ) · h … … … ( 2 ) D A = Σ i D trapezoid + Σ j D twisted _ trapezoid … … … … ( 3 )
提取断点使得方程3的面积差(DA)最小化。因此,断点最小化单元102提取断点。通过插值分析单元80,提取动画路径的基本断点。当需要无损处理时,所提取的断点数(M)可以与原始断点数相同。
在位置插值中,键值表示在具有X、Y和Z轴的三维空间中的一个位置,并且动画路径由在X、Y和Z轴上的三条曲线来表示。插值分析单元80可以提取在每条轴上的断点,并且在此时,在每条轴上的断点可以与其它轴的断点不同。如下表格2示出在插值分析单元80中从具有8个断点(P0,P1,P2,P3,P4,P5,P6,和P7)的实际路径提取新的断点的结果。
表2
断点 P0  P1  P2  P3  P4  P5  P6  P7
 kvx  O  X  X  X  O  X  X  O
 kvy  O  X  O  X  O  X  X  O
kvz O X O X X O X O
 键  O  X  O  X  O  O  X  O
 Key_flag  7  -  6  -  3  4  -  7
在表2中,key_flag表示一个键标志,以及kvx、kvy和kvz分别表示在X、Y和Z轴上的键值。“O”表示选择对应于每个断点的一个x、y或z坐标的键值。例如,对断点P0选择键值kvx。“X”表示不选择对应于每个断点上的一条轴的键值。键标志表示在每个断点上在X、Y和Z轴被选择的轴的键值。例如,“7”表示所有轴的所有键值被选择,以及“6”表示选择除了X轴的键值kvx之外的所有键值。
如表2中所示,断点P1、P3和P6被当作不需要的断点(在key_flag项中由“_”所表示),因为在该断点上没有X、Y和Z的键值被选择。P0和P7是在该路径两端的断点,所有轴的键值被选择。在P2,X轴的键值不被选择,但是在另一条轴上的键值被选择。因此,插值分析单元80确定对应于五个断点的键,而不是原始的8个断点,并且确定对应于所选择断点的每条轴的键值。在表2中,需要5个键和11个键值。键和键值之间的对应关系由另外发送的键标志(key_flag)所表示。因此,键和键值的数目从实际路径的32个(4×8=32)减小为16个键和键值加上一个附加的键标志。因此,通过该处理实现表达的简化。
图14a至14f为用于说明根据本发明使用球面线性近似提取断点的另一个优选实施例的示意图。其中示出用于减少在方向插值中的断点(也被称为键帧)的方法。
图14a示出对于在原始动画路径上的n+1个时间点在每个断点上的键值(=Q0,Q1,Q2,…,Qn),并且该键值由黑点所标记。如图14b中所示,首先选择对应于动画路径的两个端的两个断点(=Q0,Qn)。所选择的点被示出为白点。
图14c示出用于在除了两个所选择端断点之外的剩余断点中选择一个断点(第三断点)的处理。在此时,用于选择一个断点的方式数目为(n-1)。图4c示出选择两个候选值(=Q1,Qk)的例子。对于(n-1)的候选值,使用3个所选择断点,对不被选择的断点的键值执行球面线性插值。通过把原始动画路径与通过插值获得的(n-1)个候选动画路径中的每一个相比较,选择具有最小路径差的候选动画路径。在(n-1)个候选断点中,选择对应于所选择候选动画路径的断点。作一个例子,图14d中示出选择图1的候选路径2。通过使用平均误差Em获得路径之间的误差。
参照图14e,在除了图14d的三个所选择断点之外的剩余断点中选择一个候选断点之后,通过执行参照图14c和14d所述的处理选择第4个断点。例如,图14f示出选择候选1。通过重复图14e的断点选择处理直到平均误差小于许可误差为止,选择数目小于或等于原始路径的断点数的断点。
现在将描述上述平均误差Em。量化误差在差动旋转变换中被定义为差动旋转角,其是原始动画路径的旋转变换与重构动画路径的旋转变换之间的差。也就是说,假设 表示方向插值的一个键值,以及
Figure A0113942300152
θ′)表示在重构单元96中重构的一个键值(矢量
Figure A0113942300153
表示旋转轴,θ表示旋转量,该旋转量满足θ∈[-π,π]),当由
Figure A0113942300154
在三维空间中执行从任意位置
Figure A0113942300156
Figure A0113942300157
Figure A0113942300158
的旋转变换,所出现的量化误差被计算为
Figure A01139423001510
之间的差。因此,如果
Figure A01139423001511
表示一个量化误差矢量,则
Figure A01139423001512
。在四元组表达式中,X、Y和Y’被定义为如下方程4:
Figure A01139423001513
如果Q和Q’分别表示
Figure A01139423001514
Figure A01139423001515
的四元组表达式,其表示旋转变换,推导出如下方程5:
  Y=Q*X*Q*
  X=Q**Y*Q…………(5)
在此,A*B表示A和B的四元数乘积,A*表示A的共轭。因此,推导出如下方程6:
   Y′=Q′*X*Q′*=Q′*Q**Y*Q*Q′*=Q″*YQ″*……………(6)
在此,Q”是用于表示
Figure A01139423001516
Figure A01139423001517
之间的旋转变换关系的数值,并且它由如下方程7所表示:
Q″=Q′*Q*………(7)
因此,如果θ″表示
Figure A01139423001518
Figure A01139423001519
之间的差动旋转角,则可以利用四元数转换方程和方程7获得θ″,如下述方程8所示:
θ″=2cos-1(Q′·Q),θ″∈[0,π],q0″=Q′·Q…………(8)
(·表示内积运算)
方程8表示在所有动画断点中在预定时间出现的瞬时量化误差。为了推导用于获得所有动画间隔的量化误差的方程,在预定时间t的瞬时量化误差可以表达为如下方程9:
e(t)=2arccos(Q(t)·Q′(t))………(9)
如果由方向插值把方程9应用到该动画的所有断点间隔,则可以对用于整个间隔[t0,tL]的平均误差Em推导和最大误差Ep推导如下方程10:
Figure A0113942300161
在此,首先对间隔[ti-1,ti]获得部分和Et m,为了获得Em,使用如下方程11: E m i = ∫ i - 1 i e 2 ( t ) dt = 4 ∫ i - 1 i arccos 2 ( Q ( t ) · Q ′ ( t ) ) dt … … … … … ( 11 )
同时,还推导导出如下方程12:
4arccos2(Q(t)·Q′(t))=φ2(α),t=ti-1+α(ti-ti-1)…………(12)
因此,推出如下方程13: E m i = ( t i - t i - 1 ) ∫ 0 1 φ 2 ( α ) dα … … … … … ( 13 )
由于难以获得φ2(α)在0和1之间的定积分,执行如下方程14中所示的近似计算: φ ( α ) ≅ φ ( 0 ) + α ( φ ( 1 ) - φ ( 0 ) ) φ 2 ( α ) ≅ φ 2 ( 0 ) + α 2 ( φ ( 1 ) - φ ( 0 ) ) 2 + 2 αφ ( 0 ) ( φ ( 1 ) - φ ( 0 ) ) … … … … … ( 14 )
在此, cos φ ( 0 ) 2 = Q ( t i - 1 ) · Q ′ ( t i - 1 ) , cos φ ( 1 ) 2 = Q ( t i ) · Q ′ ( t i ) … … … … … ( 15 )
使用近似方程14,获得如下方程16所示的部分和Ei m E m i = 1 3 ( t i - t i - 1 ) ( φ 2 ( 0 ) + φ 2 ( 1 ) + φ ( 0 ) φ ( 1 ) ) … … … … ( 16 )
这些方程可以被重新排列为如下方程17: E m i = 4 3 ( t i - t i - 1 ) ( arccos 2 ( Q ( t i - 1 ) · Q ′ ( t i - 1 ) ) + ( arccos 2 ( Q ( t i ) · Q ′ ( t i ) )
+arccos(Q(ti-1)·Q′(ti-1))(arccos(Q(ti)·Q′(ti)))…………(17)
在整个间隔[t0,tL]上对部分和Ei m求和,以获得如下方程18中所示的平均误差Em E m = 1 t L - t 0 Σ i = 0 L E m i … … … … … … ( 18 )
为了获得平均误差Ep,从在每个间隔[ti-1,ti]中通过如下方程19获得的最大误差Ei p的数值中选择最大值: E p i ≅ max | e ( t ) | = max 2 | arccos ( Q ( t ) · Q ′ ( t ) ) | … … … … … ( 19 )
使用上述近似函数,可以把Ei p近似为如下方程20中所示: E p i ≅ max ( φ ( 0 ) , φ ( 1 ) ) = max { 2 | arccos ( Q ( t i - 1 ) · Q ′ ( t i - 1 ) ) | , 2 | arccos ( Q ( t i ) · Q ′ ( t i ) ) | } … ( 20 )
在整个间隔[t0,tL]中的最大误差Ep由如下方程21所表达: E p ≅ max E p i , fori = 1,2 , … , L … … ( 21 )
图6中所示的插值分析单元80把关于键的数目、标准化键值的最小值和最大值、键和键值的分辨率、以及键标志的信息114发送到熵编码器86。在此时,插值分析单元80把键110发送到键编码器82,并且把关于键值的信息,包括标准化键值的最大值和最小值,发送到键值编码器84。
现在将说明在键编码器82和键值编码器84中的编码键和键值。键和键值被分别用DPCM量化方法在键编码器82和键值编码器84中分别压缩。量化的信息与其它信息一同被发送到熵编码器86,并且作为最终被压缩编码的位流通过输出端OUT3输出。例如,键编码器82的DPCM量化器104对从插值分析单元80发送的一个键进行编码(即,对当前值和紧接着先前的数值之间的差进行编码),并且把编码的结果输出到熵编码器86。在此时,键值编码器84的DPCM量化器106对由插值分析单元80所发送的键值和该键值的最小值及最大值进行DPCM量化编码(即,对当前值和紧接着先前的数值之间的差进行编码),并且把编码的结果输出到熵编码器86。
图10为一种量化处理的示意图并且示出通常使用的DPCM方法。参见图10,在键(k)的情况中,最终误差(e)被按照如下方程22进行量化压缩。图10说明方程22。也就是说,获得紧接着先前的数值(Ki-1)和它先前的数值(Ki-2)。该差值(d1)被加到紧着先前的数值(Ki-1),以产生一个近似值
Figure A0113942300181
。然后,获得作为该近似值
Figure A0113942300182
和当前值(Ki)之间的差的最终误差(e)。同时,该误差(e)可以作为当前值(Ki)和紧接着先前数值(Ki-1)之间的差而简单地获得。
    Ki=0,for i<0
    d1=Ki-1-Ki-2 K ^ i = K i - 1 + d 1 , d 2 = K i - K ^ i ,
    e=d2    ……………(22)
图11a至11e为用于示出根据本发明的编码位流的格式的示意图。图11a示出根据本发明的编码位流的格式,其包括键的数目(n_key),键的分辨率(k_res),键值的分辨率(kv_res),键值阵列的最小值和最大值([min/max])230,键标志阵列([key_flag])232,键阵列([key])234,以及键值阵列([kv])236。在此,[]表示一个阵列。图11b示出图11a的键值阵列230的最小值和最大值的格式,图11c示出键标志阵列232的格式,图11b示出键阵列234的格式,以及图11e示出键值阵列236的格式。
图11a的键值阵列230的键值的最小值和最大值由X,Y和Z轴的最小值(minx,miny和minz)所形成以及由X,Y和Z轴的最大值(maxx,maxy和maxz所形成,如图11b中所示。键标志阵列232由n个键标志(key_flag0,key_flag1,key_flag2,key_flag3,...key_flagn-1)所形成。在此,n表示键的数目。键阵列234由n个键(key0,key1,key2,...keyn-1)所形成。在此,用于被分类为不需要的断点的键和键值的数据,例如表2中的断点P1、P3和P6,可以从键阵列或键标志阵列中排除。因此,键阵列和/或键标志阵列可以由小于原始键的数目(n)的数据所构成。键值阵列236由p个第一键值(kv_X0,kv_X1,...,kv_Xp-1),q个第二键值(kv_Y0,kv_Y1,...,kv_Yq-1),以及r个第三键值(kv_Z0,kv_Z1,...,kv_Zr-1)所形成。在此,p≤n,q≤n,以及r≤n。
同时,用于重构根据本发明的动画路径的装置的方法被作为压缩处理的逆转而执行。图7的熵解码器90通过输入端IN4接收编码的位流,对该位流进行熵解码,并且把熵解码的结果输出到键解码器92和键值解码器94。键解码器92和键值解码器94分别接收量化的键和键值,这是熵解码的结果,并且使用附加信息作为键标志,在量化之前重复该数据。也就是说,键解码器92接收熵解码的结果,并且对该键进行解码,并且键值解码器94接收熵解码结果并对该键值进行解码。为此,键解码器92可以用作为DPCM去量化器126,并且键值解码器94被用作为DPCM去量化器128。每个DPCM去量化器126或128用DPCM去量化方法对在熵解码器92中解码的输入数据进行解码。
插值重构单元96接收在键解码器92和键值解码器94中解码的数据,并且重构原始动画路径。插值重构单元96从熵解码器90接收关于键的数目、标准化键值的最小值和最大值、键和键值的分辨率以及键标志的信息124,从键解码器92接收键120,以及从键值解码器94接收关于键值和标准化键值的最小值和最大值的信息122。插值重构单元94通过利用输入信息进行线性插值而重构空白键值。例如,在表2中,可以利用P0和P4的键值通过线性插值重构关于断点P2的X轴的键值。为此,插值重构单元96可以被用作为一个键和键值重构单元96。采用(键,键值)形式的重构动画路径被通过输出端OUT4输出。
图12为用于说明在根据本发明的程序语言中表达的解码处理的表格,该表格也被称为位流语法。
参照附图,现在将把根据本发明的利用线性近似的压缩动画路径的方法与利用MPEG-4 BIFS的用于插值压缩的现有方法相比较。
图13a至13d为用于把本发明的压缩方法与现有压缩方法相比较实验动画序列的曲线图。垂直轴表示失真度,水平轴表示位数,根据本发明的用于压缩动画路径的方法由粗线所表示,并且现有的压缩方法由虚线所表示。图13a至13d示出仿真的结果,在每个图中采用不同的动画路径。本发明的方法按照图13b-13a-13d-13c的次序表现出逐步增加的效果。在相同的位率,本发明的要求方法表现出比现有BIFS方法好的多的图像质量,而在相同的图像质量下,本发明的要求方法表现出更好的压缩率。
如上文所述,动画路径的插值表现被用于利用断点简化路径。但是,在现有的方法中,每个键之间的间隔被均匀地形成在路径的表现上,因此断点被过采样。但是,在本发明中,通过分析断点,获得具有最小断点数的简化编码位流。DPCM压缩在断点之间保持更高的线性相关性,因此利用较高的相关性能够实现有效的压缩。

Claims (20)

1.一种用于压缩动画路径的装置,其包括:
插值分析单元,用于从动画路径提取预定数目的断点,并且输出对应于该断点的键和键值;
键编码器,用于编码从插值分析单元输出的键;
键值编码器,用于编码从插值分析单元输出的键值;以及
熵编码器,用于分别对在键编码器和键值编码器中编码的键和键值进行熵编码,并且输出编码的位流。
2.根据权利要求1所述的装置,其中插值分析单元确定断点的数目,使得近似动画路径与原始动画之间的差被最小化,该近似动画路径是通过在原始动画路径的断点中提取的预定数目的断点而获得的。
3.根据权利要求1所述的装置,其中键编码器通过差分脉码调制(DPCM)量化方法对从插值分析单元输出的键进行编码。
4.根据权利要求1所述的装置,其中键值编码器利用DPCM量化方法对从插值分析单元输出的键值信息编码。
5.根据权利要求1所述的装置,其中以该原始路径的端点作为起点,该插值分析单元在断点中查找表示与原始路径具有最小差别的近拟路径的断点M个断点,并且该处理被重复执行直到一条近似路径接近于原始路径时为止。
6.根据权利要求5所述的装置,其中确定断点使得原始动画路径和近似动画路径之间的面积差为最小。
7.根据权利要求3或4所述的装置,其中DPCM量化是对当前值与紧接着在前的数值之间的差进行编码,或者对当前值与近似值之间的差进行编码,该近似值是通过把紧接着在前数值加到该紧接着在前与其先前数值之间的差上而获得的。
8.一种用于重构动画路径的装置,其中包括:
熵解码器,用于接收编码的位流并且对该位流进行熵解码;
键解码器,用于接收熵解码的结果和并对键进行解码;
键值解码器,用于接收熵解码的结果并且对键值进行解码;以及
插值重构单元,用于分别根据在键解码器和键值解码器中解码的键和键值通过线性插值而获得的空键值,并且重构原始动画路径。
9.根据权利要求8所述的装置,其中键解码器通过DPCM去量化方法对从熵解码器输入的熵解码结果进行解码。
10.根据权利要求8所述的装置,其中键值解码器通过DPCM去量化方法对从熵解码器输入的熵解码结果进行解码。
11.一种用于压缩动画路径的方法,其包括如下步骤:
从原始动画路径提取预定数目的断;
利用所提取的断点提取键和键值,并且对该键和键值编码;以及
对编码的键和键值进行熵编码,以获得编码的位流。
12.一种用于重构动画路径的方法,包括如下步骤:
接收编码的位流,并对其进行熵解码;
对来自熵解码结果的键和键值进行解码;以及
通过根据解码的键和键值进行线性插值而获得空键值来重构原始动画路径。
13.一种通过对动画路径进行编码而获得的位流的数据格式,该数据格式包括:
矩阵型键标志,用于表示在对应于动画路径的每个断点的x、y或z坐标的键值中选择哪个轴的键值;
矩阵型的键,用于表示在对应于每个断点的x、y或z坐标的键值中选择至少一个或多个键值;以及
用于表示为每个断点所选择的键值的矩阵型键值。
14.根据权利要求12所述的数据格式,其中进一步包括:
对应于X、Y和Z坐标轴的键值的最小值;以及
对应于X、Y和Z坐标轴的键值的最大值。
15.根据权利要求12所述的数据格式,其中阵列型键标志包括M个数据,M等于或小于原始键的数目。
16.根据权利要求12所述的数据格式,其中阵列型键包括M个数据,M等于或小于原始键的数目。
17.根据权利要求12所述的数据格式,其中键值包括对应于x轴的p(≤n)个第一键值,对应于y轴的q(≤n)个第二键值,以及对应于z轴的r(≤n)个第三键值,以及n表示键的数目。
18.一种用于提取动画路径的断点的方法,其中包括如下步骤:
(a)在动画路径上的断点中选择在原始动画路径的两个端点上的断点;
(b)在除了两个所选择断点之外的剩余断点中选择一个断点;
(c)利用所选择的断点,对除了所选择断点之外的剩余断点的键值进行插值;
(d)根据所选择的断点和插值的键值形成近似路径,选择在原始动画路径和近似动画路径之间具有最小路径差异的一个近似动画路径,并且选择对应于所选动画路径的断点;
(e)在除了步骤(a)和(b)中选择的断点之外的剩余断点中选择一个断点,并且重复步骤(c)至(e),直到该路径差小于许可的差值。
19.根据权利要求18所述的方法,其中路径差由原始动画路径和近似动画路径形成的梯形或扭曲梯形的面积和来表达。
20.根据权利要求18所述的方法,其中在方向插值中,该路径差值被定义为在差动旋转变换中的差动旋转角,其是原始动画路径的旋转变换与近似路径的旋转变换之间的差。
CNB011394234A 2000-11-23 2001-11-23 利用线性近似对动画路径进行压缩和重构的方法和装置 Expired - Fee Related CN1215440C (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR70090/2000 2000-11-23
KR20000070090 2000-11-23
KR1020010040704A KR100561835B1 (ko) 2000-11-23 2001-07-07 선형 근사화를 이용한 애니메이션 궤적의 압축 및 복원 방법, 이 방법을 수행하는 장치
KR40704/2001 2001-07-07

Publications (2)

Publication Number Publication Date
CN1356669A true CN1356669A (zh) 2002-07-03
CN1215440C CN1215440C (zh) 2005-08-17

Family

ID=36648539

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB011394234A Expired - Fee Related CN1215440C (zh) 2000-11-23 2001-11-23 利用线性近似对动画路径进行压缩和重构的方法和装置

Country Status (8)

Country Link
US (1) US7006097B2 (zh)
EP (1) EP1209626B1 (zh)
JP (1) JP3694477B2 (zh)
CN (1) CN1215440C (zh)
CA (1) CA2363385C (zh)
DE (1) DE60126895T2 (zh)
ES (1) ES2282209T3 (zh)
RU (1) RU2236751C2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111343462A (zh) * 2020-03-08 2020-06-26 苏州浪潮智能科技有限公司 一种图像数据压缩传输方法、装置及存储介质

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7733345B2 (en) * 2001-11-27 2010-06-08 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding position interpolator
US7809204B2 (en) * 2002-10-18 2010-10-05 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding key value data of coordinate interpolator
PT1600008E (pt) * 2003-02-27 2008-06-12 T Mobile Deutschland Gmbh Processo para a transmissão comprimida de dados de imagem para efeito da representação tridimensional de cenas e objectos
US20050168485A1 (en) * 2004-01-29 2005-08-04 Nattress Thomas G. System for combining a sequence of images with computer-generated 3D graphics
US8243078B2 (en) * 2005-02-28 2012-08-14 Kenneth Perlin Method and apparatus for creating a computer simulation of an actor
US20060274070A1 (en) * 2005-04-19 2006-12-07 Herman Daniel L Techniques and workflows for computer graphics animation system
US11408572B2 (en) 2014-03-15 2022-08-09 Ideal Industries Lighting Llc Luminaires utilizing optical waveguide
US10381808B2 (en) 2016-09-26 2019-08-13 Norman R. Byrne Cord system for height-adjustable furniture

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0250532A1 (en) 1985-12-24 1988-01-07 British Broadcasting Corporation Method of transmitting a video signal in sampled form
JP3250841B2 (ja) 1992-06-12 2002-01-28 新日鉄ソリューションズ株式会社 図形データの処理方法及び装置
JP3038143B2 (ja) 1994-12-29 2000-05-08 現代電子産業株式会社 映像機器の物体別形状情報の減縮装置及びその減縮方法並びに多角近似化方法
JP3597583B2 (ja) 1995-02-03 2004-12-08 富士通株式会社 アニメーションパス作成装置
KR970064261A (ko) 1996-02-09 1997-09-12 모리시타 요우이치 윤곽 부호화 방법, 윤곽 복호화 방법, 및 그의 방법을 이용한 윤곽 부호화 장치, 윤곽 복호화 장치 및 그의 방법을 기록한 기록 매체
US5909218A (en) 1996-04-25 1999-06-01 Matsushita Electric Industrial Co., Ltd. Transmitter-receiver of three-dimensional skeleton structure motions and method thereof
KR100212552B1 (ko) 1996-12-23 1999-08-02 전주범 이산적 사인 변환을 이용한 윤곽선 영상 신호 부호화 방법 및 그 장치
TW388843B (en) 1997-04-24 2000-05-01 Mitsubishi Electric Corp Moving image encoding method, moving image encoder and moving image decoder
US6606095B1 (en) 1998-06-08 2003-08-12 Microsoft Corporation Compression of animated geometry using basis decomposition
JP3428513B2 (ja) 1998-07-17 2003-07-22 松下電器産業株式会社 多次元ストリームデータを用いた、送信装置、送信方法、受信装置、受信方法および通信システム
US20020036639A1 (en) * 2000-01-31 2002-03-28 Mikael Bourges-Sevenier Textual format for animation in multimedia systems
US6559848B2 (en) * 2000-12-13 2003-05-06 Intel Corporation Coding and decoding three-dimensional data

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111343462A (zh) * 2020-03-08 2020-06-26 苏州浪潮智能科技有限公司 一种图像数据压缩传输方法、装置及存储介质
CN111343462B (zh) * 2020-03-08 2021-10-22 苏州浪潮智能科技有限公司 一种图像数据压缩传输方法、装置及存储介质

Also Published As

Publication number Publication date
EP1209626A2 (en) 2002-05-29
US7006097B2 (en) 2006-02-28
ES2282209T3 (es) 2007-10-16
CA2363385A1 (en) 2002-05-23
DE60126895T2 (de) 2007-11-08
CN1215440C (zh) 2005-08-17
RU2236751C2 (ru) 2004-09-20
JP3694477B2 (ja) 2005-09-14
EP1209626A3 (en) 2003-11-12
DE60126895D1 (de) 2007-04-12
JP2002230581A (ja) 2002-08-16
CA2363385C (en) 2006-07-04
EP1209626B1 (en) 2007-02-28
US20020097246A1 (en) 2002-07-25

Similar Documents

Publication Publication Date Title
CN100348049C (zh) 用于渐进地变换并编码数字数据的系统和方法
CN1119868C (zh) 利用紧凑型源编码表编码和译码代表多个符号的信息的方法和装置
US20090074307A1 (en) Textual Image Coding
KR20200140824A (ko) 3d 객체를 나타내는 포인트 클라우드를 인코딩/디코딩하기 위한 방법 및 장치
US8285062B2 (en) Method for improving the performance of embedded graphics coding
CN1155221C (zh) 编码方法及系统以及译码方法及系统
CN1547708A (zh) 以无损方式对数字图像和音频数据解码的系统和方法
US10003794B2 (en) Terminable spatial tree-based position coding and decoding
CN1212806A (zh) 渐进图象编码
CN1134990C (zh) 着重区编码方法和系统
CN102396219A (zh) 对于具有稀疏直方图的图像的嵌入式图形编码
KR20140089426A (ko) 예측성 위치 디코딩
CN109996073B (zh) 一种图像压缩方法、系统、可读存储介质及计算机设备
CN1777038A (zh) 一种二维矢量数据的压缩方法
CN1525761A (zh) 使用神经网络选择可变长度编码比特流长度的装置和方法
CN1630371A (zh) 一种应用于实时传输的无损图像压缩方法
US9245353B2 (en) Encoder, decoder and method
CN102668560A (zh) 嵌入式图形编码:用于并行解码的重排序比特流
CN1215440C (zh) 利用线性近似对动画路径进行压缩和重构的方法和装置
US12022078B2 (en) Picture processing method and apparatus
CN1628466A (zh) 视频数据流的上下文灵敏的编码和解码
CN1622593A (zh) 用于实现信噪比可伸缩性的视频处理的装置和方法
CN1725861A (zh) 压缩/解压缩图像的方法和使用该方法的设备
CN1159922C (zh) 编码二进制形状信号的方法
CN1229325A (zh) 编码视频信号的方法和设备

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20050817

Termination date: 20151123