JP2008516318A - 時間的に変わるグラフィックモデルを表すデータストリームの符号化方法 - Google Patents

時間的に変わるグラフィックモデルを表すデータストリームの符号化方法 Download PDF

Info

Publication number
JP2008516318A
JP2008516318A JP2007535041A JP2007535041A JP2008516318A JP 2008516318 A JP2008516318 A JP 2008516318A JP 2007535041 A JP2007535041 A JP 2007535041A JP 2007535041 A JP2007535041 A JP 2007535041A JP 2008516318 A JP2008516318 A JP 2008516318A
Authority
JP
Japan
Prior art keywords
prediction error
error vector
prediction
data
data portion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007535041A
Other languages
English (en)
Other versions
JP4579987B2 (ja
Inventor
マティアス カウツナー
カルステン ミューラー
アリョーシャ スモリック
トーマス ウィーガント
Original Assignee
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ filed Critical フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Publication of JP2008516318A publication Critical patent/JP2008516318A/ja
Application granted granted Critical
Publication of JP4579987B2 publication Critical patent/JP4579987B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/001Model-based coding, e.g. wire frame
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T13/00Animation
    • G06T13/203D [Three Dimensional] animation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Processing Or Creating Images (AREA)
  • Image Generation (AREA)

Abstract

さらに予測段階(14)を導入すること、すなわち、第1の予測段階の運動ベクトルまたは予測エラー(d(t))の予測を行うことにより、実際に、まずはじめに、符号化または圧縮計算量が増加し、それに対応して、復号化または復元計算量も増加するが、ここで提案する予測を行うことにより、運動の均一性のために、大抵のグラフィックモデルシーケンスの計算量について、この予測により、圧縮利得が大幅に向上することになる。
【選択図】図1

Description

本発明は、時間的に変わるグラフィックモデルを表すデータストリームの符号化/復号化に関し、特に、このようなグラフィックモデルデータの圧縮に関する。
今日、時間的に変わる3Dコンピュータグラフィックモデルは、標準的なコンピュータグラフィックに幅広く応用されている。3Dコンピュータグラフィックモデルは、例えば、ゲーム、仮想世界、アニメ作成等に応用されているが、フリービューポイントビデオ(Free Viewpoint Video(FVV))または3Dビデオオブジェクト(3DVO)と呼ばれる、さらに新しいシステムに応用されている。
3Dコンピュータグラフィックモデルは、仮想3D座標系の3Dオブジェクトの表面を記述するものである。このために、表面に存在していたり、この表面に沿って配置されていたりする特定の数の制御点または頂点の3D座標(x、y、z)が定義されている。パラメータ化を行う別々のアプローチにより、連続面が定義されている。ポリゴンメッシュと呼ばれるパラメータ化では、3Dオブジェクトの表面の形状を、例えば、多角形の制御点を構成するコーナー点により定義する。あるオブジェクトを完全に記述するには、連結性表示、すなわち、制御点がそれぞれ多角形に集約されている表示がここに属している。次に、色、質感や、さらに反射等の特徴を対応付けることにより、完全な3Dオブジェクトが展開する。用いられる表面パラメータ化によるが、これらの特徴は、連結性に関連しており、または点表現に直接関連している。
従って、3D形状の通常の表現は、連結性表示があるリストまたはないリストにおいて、制御点が3D座標で表示されたものである。三角形メッシュに関しての上述の多角形連結性の場合、例えば、対応するリスト番号それぞれの3つの制御点が三角形を形成し、これもやはりリストに集約されている。3D座標は、浮動小数点または整数値として存在する場合もある。連結性は、整数値、すなわち、対応する制御点がリストとして構成されているリスト番号表示からなる。
各種のシステムとアプリケーションとの間で3D形状を交換して送信するためには、受信側で3Dデータの構文解析を行うことができるという理由から、バーチャルリアリティモデリングランゲージ(VRML)等の指定のテキストフォーマットを用いることが望ましい。
さらに、とりわけ、伝送データ速度および必要なメモリ空間を低減するために、3D形状を符号化するデータ所要量を低減することが望ましい。特別な圧縮方法を用いれば、このような低減を行うことが可能である。この理由から、MPEG−4規格では、静止物体の3D形状を符号化する方法が規格化された。これは、3Dメッシュ符号化(3DMC)と呼ばれている。3DMCはバイナリフォーマットで、30〜40倍の圧縮を別にして、利用可能なテキストフォーマットと逆に、伝送機能を向上させることもできる。
しかしながら、複数のアプリケーションでは、動的な、すなわち、時間的に変わる3Dモデルが存在する。標準的なコンピュータグラフィックでは、多くの場合、オペレータが各時刻でモデルを新規に構築することにより、アニメーションでモデルが展開する。FVVまたは3DVOなどのより新しい方法では、実物のオブジェクトの3D運動を再現することにより、動的モデルが展開する。これを、数台のカメラで記録する。基本的に、動的3Dモデルの2つの場合を区別することができる。第1の場合では、トポロジは同じままである。すなわち、制御点または頂点の数と、連結性とが、時間的に一定である。制御点の3D位置だけが変化する。第2の場合は、一般化を表す。この場合、トポロジの変化を許容できる。
場合によっては、アニメーションにより、すなわち、基礎となる物理運動モデルで変化を記述することにより、時間的変化を記述することができる。この例として、人間の顔および身体のアニメーションがあり、これはすでにMPEG−4で、すなわち、いわゆるFBA(フェースアンドボディアニメーション)方法により規格化されている。一般的な場合に転用できない点、すなわち、特別な運動シーケンスおよび/または顔等の特別なオブジェクトに限定されているという点で、このようなアニメーションモデルには欠点がある。アニメーションモデルがなければ、時刻毎に、むしろ新規の3Dモデルまたは制御点の新規のメッシュを移す必要があり、次に、MPEG−4、3DMCで時刻毎に符号化する。しかし、これは時刻毎に動く同じオブジェクトなので、このデータはやはり時間的冗長性を多く含み、さらに圧縮されることもある。
J.チャン(Zhang)およびC.B.オーエン(Owen)著、「オクトリーベースの動画ジオメトリ圧縮(Octree−based Animated Geometry Compression)」(DCCデータ圧縮会議2004年米国ユタ州スノーバード、508〜517ページ、2004年3月23〜25日)に、時間的に変わる3Dモデルの符号化方法が記載されている。制御点を予測し、予測エラーまたは運動ベクトルの量子化を行い、運動ベクトルをグループに集約することにより、時間的変化を記述している。圧縮、すなわち、ビットレートの低減は、差動パルス符号変調(DPCM)の一般原理に従って行われる。このように、3DMCとは逆に、さらに大きい圧縮利得、すなわち、等品質でのビットレート削減、または等しいビットレートでさらによい品質が動的モデルにおいて実現できる。
J.チャン(Zhang)およびC.B.オーエン(Owen)著、「オクトリーベースの動画ジオメトリ圧縮(Octree−based Animated Geometry Compression)」(DCCデータ圧縮会議2004年米国ユタ州スノーバード、508〜517ページ、2004年3月23〜25日)
しかしながら、様々な応用分野で3Dモデルがますます用いられるようになっており、動的モデルをより良く圧縮するより効果的な符号化方法の必要性が増している。
従って、本発明の目的は、高い圧縮利得、すなわち、等品質でのビットレート節減またはより良い品質での等しいビットレートが可能な、時間的に変わるグラフィックモデルを表すデータストリームの符号化/復号化を行う符号化方法を提供することである。
この目的を、請求項1または12に記載の装置、および請求項19または20に記載の方法により達成する。
本発明によれば、時間的に変わるグラフィックモデルを表すとともに、一連のデータ部分を含み、異なる時刻でグラフィックモデルを定義する座標データを含むデータストリームの符号化を行うことが、第1のデータ部分のための予測した座標データを得るために、現在符号化される第1のデータ部分の前の第2のデータ部分の座標データに基づいて、現在符号化される第1のデータ部分の座標データの予測を行うことと、現在符号化される第1のデータ部分のための予測エラーベクトルを得るために、第1のデータ部分のための予測した座標データと第1のデータ部分の座標データとの比較を行うこととを含む。次に、第2の予測を行う。すなわち、第1のデータ部分の予測エラーベクトルを得るために、既に得られている予測エラーベクトルに基づいて、第1のデータ部分のための予測エラーベクトルの予測を行い、そして、第1のデータ部分のための予測エラーベクトル差を得るために、第1のデータ部分のための予測した予測エラーベクトルと、第1のデータ部分のための予測エラーベクトルとを互いに比較する。次に、これらの予測エラーベクトル差を処理して、符号化データストリームの一部を得る。
それに対応して、逆のやり方で復号化を行う。上記のデータストリームの符号化形式を表し、符号化予測エラーベクトル差を含む符号化データストリームを、復号化予測エラーベクトル差を得るために、まずはじめに、符号化データストリームを処理することにより符号化する。第1のデータ部分のための予測した予測エラーベクトルを得るために、既に復号化した予測エラーベクトル差に基づいて、現在復号化される第1のデータ部分のための予測エラーベクトルを予測する。第1のデータ部分のための予測エラーベクトルを得るために、これらの予測した予測エラーベクトルを、現在復号化される第1のデータ部分の予測エラーベクトル差と合成する。次に、第2の予測を行う。すなわち、第1のデータ部分のための予測した座標データを得るために、第1のデータ部分の前の第2のデータ部分の座標データに基づいて、第1のデータ部分の座標データを予測し、そして、現在復号化される第1のデータ部分の座標データを得るために、第1のデータ部分のための予測した座標データを、第1のデータ部分のための予測エラーベクトルと合成する。
本発明の知見は、さらに予測段階を導入すること、すなわち、第1の予測段階で運動ベクトルまたは予測エラーの予測を導入することであり、実際に、まずはじめに、符号化および/または圧縮計算量が増加し、それに対応して、復号化および/または復元計算量も増加するが、運動の均一性によって、大抵のグラフィックモデルシーケンスの計算量について、この予測により、圧縮利得が大幅に向上することになる。
予測エラーベクトルの予測、すなわち、第2の予測段階は、時間的予測および/または空間的予測を含んでもよい。より具体的には、現在符号化されるデータ部分の予測エラーベクトルの予測を行うのに、現在符号化されるデータ部分の前のデータ部分の予測エラーベクトルと、現在符号化されるデータ部分の予測エラーベクトルとを用いることができる。もちろん、2つとも既に存在する場合に限られる。
特定の実施の形態によれば、前のデータ部分の予測エラーベクトルに基づいて、予測エラーベクトルの時間的予測を行うのに、同じ座標情報および/または同じ制御点に対し、運動ベクトルを表すこのデータ部分の予測エラーベクトルを用いる。
同じデータ部分の既に得られている予測エラーベクトルに基づいて、予測エラーベクトルの空間的予測を行う場合、予測を行うのに、予測したものに隣接する予測エラーベクトルを用いる。連結性および/またはデータストリームの近傍情報に基づいて、または幾何学的分析により、これを求める。
予測される予測エラーベクトルに利用可能な、時間的/空間的プレディクタまたは予測した予測エラーベクトルがいくつかある場合は、例えば、すべてのこれらのプレディクタの中央値に基づいて、予測した予測エラーベクトルを求める。
本発明の特定の実施の形態によれば、ビットレートを低減するために、予測エラーベクトル差は、やはりクラスタ化に従い、次にスケーリング/量子化に従う。
本発明の特定の実施の形態によれば、最後に、予測エラーベクトル差の2値算術符号化を行う。このために、まずはじめに、2値化する、すなわち、一連の二者択一の形式、またはビン、またはビット列にすると都合がよい。次に、ビンまたはビット的なやり方で、ビット列の2値算術符号化を行う。適応確率評価および/または静的確率評価に基づいて、2値算術符号化を行う。コンテクストモデルを用いること、すなわち、互いに独立したやり方で、2値化した異なるビットまたはビンに確率評価を適応することも可能である。
2値算術符号化の計算量を制限し、可能な限り圧縮率を維持するために、本発明の特定の実施の形態によれば、2つの異なる2値化方法に基づいて、2値化を行う。ここで、2値化されるデータが所定の閾値より小さい場合は、第1の2値化方法はもっぱら適用するものを検出し、データが閾値より大きい場合は、プレフィクスを得るために、閾値に第1の2値化方法を適用し、2値化されるデータの残りに、第2の2値化方法を用いる。換言すれば、はじめに述べた場合の2値化は、プレフィクスだけから構成され、次に述べた場合では、プレフィクスとサフィックスの両方で構成される。特定の実施の形態によれば、次に、適応確率モデルを用いて、プレフィクスのビットの2値適応符号化を行う。必要ならばコンテクストモデリングにより、すなわち、個別のビットに対し異なる適応確率評価で行う。そして、静的確率評価により、サフィックスのビットの2値算術符号化を行う。これにより、算術符号化の計算量を相当に低減し、予測エラーベクトル差の2値化方法を適切に選択して、圧縮率損失を小さくする。
以下に、添付の図面を参照して、本発明の好適な実施の形態についてより詳細に説明する。
図1は、本発明の一実施の形態による、時間的に変わるグラフィックモデルを表すデータストリームを符号化するためのエンコーダを示す。全体として10で表すエンコーダは、符号化するデータストリームを受け取る入力12と、符号化されたデータストリームを出力する出力14とを含んでいる。エンコーダ10は内部に、入力12とスイッチ20の第1の入力との間に延設する内部符号化経路18に接続された内部符号化手段16を含んでいる。内部経路18と平行に通っている相互符号化経路22には、エンコーダ10の残りの部分24が接続している。これは、相互符号化部、すなわち、前の時刻を参照するデータストリームの前の部分と独立して、時刻に関連して、グラフィックモデルの位置の符号化を行うエンコーダ10の部分を表す。以下でさらに明らかになるが、内部符号化手段16とは対照的に、他の時刻を参照するデータストリーム部分と独立して、ある時刻のグラフィックモデルの位置の符号化を行う。
相互符号化部24は、2つのインターリーブDPCMループから構成されている。すなわち、入力12でデータストリームの頂点または制御点を予測するのに用いられる外部ループ26と、シフトベクトルの予測および/または外部ループ26の予測エラーを行う内部ループ28とである。
内部ループ28は、比較器、すなわち差生成手段または差動器30と、コンバイナ、すなわち加算手段または加算器32と、クラスタ生成手段34と、スケーリング/量子化手段36と、スケーリング/量子化手段36に対応するものとしての逆スケーリング手段38と、クラスタ生成手段34に対応するものとしての逆クラスタ生成手段またはクラスタ分解手段40と、時間的または空間的予測を行う予測手段42と、スイッチ44とを含んでいる。
外部ループ26は、構成要素30〜40に関連して内部ループ28と重なっており、さらに、比較器または比較手段、すなわち、差動器46と、コンバイナまたは合成手段、すなわち加算器48と、メモリまたはメッシュメモリ50と、スイッチ52とを含んでいる。
相互符号化部24はさらに、内部/相互スイッチとも呼ばれる制御手段54と、算術符号化を行う符号化手段56とを含んでいる。
構成要素の内部接続を参照すると、差動器46と、差動器30と、クラスタ生成手段34と、スケーリング/量子化手段36と、符号化手段56とが、入力12とスイッチ20との間の相互符号化経路22に直列で接続している。内部経路18または相互経路22を出力14に制御可能に接続するために、スイッチ20は、制御手段54により制御可能になっている。
スケーリング/量子化手段36の出力と、符号化手段56の入力との間で、ループ26および28が分岐して、逆スケーリング手段38と、逆クラスタ生成手段40と、加算器32とが直列接続を構成している。特に、加算器32の第1の入力が逆クラスタ生成手段40の出力に接続していて、加算器32の出力が内部ループ28の予測手段42の入力に接続している。スイッチ44は、2つの入力を含んでいる。すなわち、一方は予測手段42の出力に接続していて、もう一方には、シフトベクトルの予測置き換えを表す論理ゼロが存在している。スイッチ44は制御手段54により制御され、予測手段42の出力または論理ゼロを差動器30の反転入力に入力することが可能になる。非反転入力により、差動器30は、差動器46の出力に接続している。スイッチ44の出力は、差動器30の反転入力に接続しているだけでなく、さらに加算器32の入力にも接続している。
加算器32の出力はさらに、加算器48の入力に接続しており、この出力は次に、メモリ50の入力に接続している。スイッチ52は、2つの入力を含んでいる。一方はメモリ50の出力に接続していて、もう一方は、予測した制御点の置き換えとして論理ゼロが存在している端子に接続している。スイッチ52は制御手段54により制御され、論理ゼロまたはメモリ50の内容を差動器46の反転入力と、さらに加算器48の入力とに入力することが可能である。差動器46の非反転入力は、相互経路22を介して入力12に接続している。
エンコーダ10の構成について説明した。以下に、その機能について説明する。
入力12に入力するデータストリームは、時間的に変わるグラフィックモデルを表す。換言すれば、入力データストリームは、一連のデータ部分から構成され、異なる時刻でグラフィックモデルを定義する制御点または座標データを有している。これは、制御点から最終的にどのようにモデルの表面が自身を規定するかという、基礎となるパラメータ化に基づいている。パラメータ化によるが、制御点の近傍関係を求め、モデルの完全な確定またはパラメータ化に必要な連結性情報は、さらに制御点に関連している。
実際に、パラメータ化の異なるアプローチがある。一方、以下に一例として、パラメータ化がポリゴンメッシュパラメータ化であると仮定する。ポリゴンメッシュパラメータ化においては、グラフィックモデルの表面または3Dオブジェクトの形状を、多角形、つまり制御点を形成するコーナー点により定義する。最も単純な表面多角形の形状は、平面三角形領域である。オブジェクトを完全に記述するには、制御点それぞれを、多角形に集約した連結性表示が必要となる。既に述べたように、この連結性情報は、入力データストリームに含まれている。制御点および連結性はともに、オブジェクトの形状を記述する。
ある時刻のグラフィックモデルの表面を定義する制御点は、データ部分で得られる。連結性情報をデータ部分毎および/または時刻毎に再送信することもできるが、データストリームのトポロジおよび/または連結性情報が変化するデータ部分だけにデータストリーム12が存在することが好ましい。
ポリゴンメッシュパラメータ化の特別な場合は、いわゆる正方形グリッド、いわゆるエレベーショングリッドで、任意に空間に存在する平面に関連して定義されるものである。ここで,制御点の3つの座標(x,y,z)のうちの2つが、グリッドの制御点の空間位置を示し、残りの3番目の座標が、平面からの点の垂直方向のずれ、または平面に関連した点の深さを表す。
図1のエンコーダ10の機能をより明らかに説明することができるように、既に述べたように、ポリゴンメッシュパラメータ化は、入力12のデータストリームに基づいていると仮定する。図2は、空間説明図での、任意の時刻におけるポリゴンメッシュパラメータ化のグラフィックモデル60を一例として示す。この時刻と、このデータ部分が定義するグラフィックモデルが変化する位置とを定義する入力データストリームのデータ部分は、図2からわかるように、連結性情報により、制御点が接続線で互いに接続している場合に得られるグリッドから類推して、メッシュまたはグリッドと呼ばれることがよくある。メッシュは、オブジェクト60の表面上の制御点62を含んでいる。さらに、データ部分自体、または前のデータ部分いずれかにあるデータストリーム12は、多角形64(ここでは、三角形)に属する3つの制御点62を示す連結性情報を含んでいる。制御点62は図2のグラフィックモデル60の線の交点にあり、多角形または三角形はこれらの線で囲まれている。
次の説明では、制御点はmi(t)で示されている。添え字iは、それぞれの制御点62に一意的に対応付けられているリスト番号で、tは、この制御点が位置mi(t)にある時刻を示している。換言すれば、mi(t)は、所定の原点68で座標系66を基準とする制御点iの位置を定義するベクトルである。時刻tでグラフィックモデルを定義するすべての制御点i全体について、以下でm(t)と呼ぶこともある。m(t−1)により、時刻t−1で、すなわち、時刻tの直前の時刻で、グラフィックモデルを定義する制御点の全体を指定し、m(t−2)で、時刻t−2のグラフィックモデルを定義する制御点の全体を指定する。時刻tにおける3Dモデルm(t)が、現在圧縮されるものである。
データストリームが、ここで入力12に入力した場合は、まずはじめに、第1のデータ部分が入力し、これは、第1の時刻t=0でのグラフィックモデルを定義している。この状態では、エンコーダ10にはグラフィックモデルの前の情報がない。換言すれば、このモデルは前処理されておらず、メッシュメモリ50は空のままである。この状態では、相互符号化経路24は予測を行うことができない。このような理由から、この場合は、まずはじめに、時刻t=0でのデータ部分および/または制御点m(t)のデータ部分について内部符号化手段16によって生成され、連結性情報に関連付けられたスタティックコード化が符号化データストリーム14に結合するように、制御手段54がスイッチ20を調整する。スタティックコード化は、例えば、MPEG−4からの3DMCである。データ部分のスタティックコード化の意味は、このデータ部分内のこの時間部分および/または制御点m(t=0)の符号化を、分離したやり方で、すなわち、データストリーム内の他のデータに依存しないで符号化することであり、他のデータ部分の内容の認識とは無関係に、このデータ部分の復号化結果を得ることができる。
Figure 2008516318
Figure 2008516318
再現エラーを確定するために、制御装置54は、差動器46の出力にも接続している。
従って、スイッチ20、44および52が上側のスイッチ位置にあるスイッチの位置は、予測を行わないので、エンコーダ10の内部モードと呼ばれる。
対照として、相互モードの間のエンコーダ10の機能について以下に説明する。このモードでは、スイッチ20および52が下側のスイッチの位置にあるように、すなわち、相互経路22が出力14に接続していて、メモリ50の出力が差動器46の反転入力に接続しているように、スイッチ20および52を制御装置54で制御する。以下で説明するように、スイッチ44の調整を運動ベクトル的に行うので、予測手段42の出力または予測置き換えゼロとどちらかが差動器30の反転入力に接続していることになる。
相互モードでは、さらに圧縮を行う。以下でより詳細に説明するように、まずはじめに、外部ループ26による予測を行って、時間的冗長性を低減し、次に、内部ループ28による時間的予測および/または空間的予測を行うことにより、時間的および/または空間的冗長性を低減する。
Figure 2008516318
Figure 2008516318
Figure 2008516318
Figure 2008516318
Figure 2008516318
中央値フィルタリングを行う代わりに、平均化等を行うことも可能である。
Figure 2008516318
前述の内部ループ28が行う予測、すなわち、シフトベクトルを予測するとともに、シフトベクトル差e(t)をさらに処理することは、頂点自体のみを予測し、発生するシフトベクトルをさらに処理するという導入部分の説明で述べた方法とは、決定的な差があり、利点がある。
Figure 2008516318
さらに、前述において、差動器30の出力と加算器32の入力との間のループ28および26を無視していた。この部分の意味について、以下に説明する。より正確に説明するには、2つの前の時刻、すなわち、mi(t−1)およびmi(t−2)での前のシフトベクトルdi(t−1)および/または制御点に基づいて、予測手段42は時間的予測だけを行うこと、すなわち、入力シフトベクトルdi(t)の予測を行うことを仮定している点を指摘しておく。
クラスタ生成手段34は、時刻tで現在符号化されるメッシュのためのシフトベクトル差e(t)を受け取る。図3を参照して以下に機能をより詳細に説明するが、クラスタ生成手段34は、例えば以下のオクトリーアルゴリズムに従って、類似の隣接シフトベクトル差の集約を行う。換言すれば、クラスタ生成手段34は、シフトベクトル差e(t)を置換シフトベクトル差o(t)のセットと置換する。置換シフトベクトル差の数は、シフトベクトル差e(t)の数より小さい。その結果、送信される値の数が低減する。すなわち、個別のベクトル差の座標である。次に、置換シフトベクトル差o(t)をスケーリング/量子化手段36でスケーリングして量子化することにより、量子化ベクトルy(t)が得られる。これらを順に、符号化手段56に供給し、以下により詳細に説明するように、算術的に符号化する。このようなやり方で符号化して圧縮した値y(t)を、出力14で符号化データストリームに連結する。
Figure 2008516318
Figure 2008516318
Figure 2008516318
Figure 2008516318
Figure 2008516318
Figure 2008516318
手段42で合成された空間的/時間的予測を用いる際に、e(t)のいくつかに対しては、同じメッシュの別のものと相対するものとしてのシフトベクトルdに対応するプレディクタを全く求めなくてもよいことに留意されたい。この場合、シフトベクトルを実際のシフトベクトル差eのクラスタ化に組み込まない方が有利である。
分類情報を用いて、関連付けられた置換ベクトル差をそれぞれのグループのすべての頂点に関連付けることにより、手段40は、もう一度ベクトルの数のデシメーションをキャンセルする。
前の記述は、2つの予測ループ26および28の機能記述に実質的に限定されていた。次に、量子化ベクトルy(t)、より具体的には、これらの3Dベクトルの個別の成分x、y、zの算術符号化を行い、結局は置換シフトベクトル差の量子化を表す符号化手段56の機能について、より詳細に説明する。
エントロピー符号化の特別な形態である算術符号化では、符号化されるソースアルファベットのキャラクタ、すなわち、ここでは符号化されるベクトルy(t)の成分が、別々に発生する確率に関連付けられている。現在符号化されるキャラクタを符号化するには、現在の確率区間を、ソースアルファベットのすべてのキャラクタが発生する確率に従って細分し、次に、現在符号化されるキャラクタに対応する現在の確率区間の当該サブエリアに圧縮することにより、確率区間を更新する。この手順を、符号化される一連のキャラクタに繰り返す。この一連のキャラクタに対して最終的に出力する符号語が、得られる確率区間を表す。デコーダ側では、この手順を算術復号化でエミュレートする。すなわち、どのエリアを符号語が示しているのか調べるために、例えば、0から1のような最初の確率区間を、ソースアルファベットの発生確率に従って細分する。そして、確率区間をこのサブエリア等に更新する。次に用いられる2値算術符号化では、ソースアルファベットを、2つの考えられるバイナリ状態または0および1等の値に固定する。これは、以下で説明するように、y(t)成分が既に2値化されているからである。
この場合は、シフトベクトル差の確率統計で、CABAC(コンテクストベースの適応2値算術符号化)に従う算術符号化により、高い圧縮率になることが実現されている。CABACについては、例えば、D.マルペ(Marpe)、H.シュワルツ(Schwarz)およびT.ウィーガンド(Wiegand)著、「H.264/AVCビデオ圧縮規格におけるコンテクストベースの適応2値算術符号化(Context−Based Adaptive Binary Arithmetic Coding in the H.264 / AVC Video Compression Standard)」(招待論文)、(ビデオ技術のための回路およびシステムIEEE会報13巻、第7号、620〜636ページ、2003年7月)に記載されている。クラスタ化低減ベクトルy(t)または非クラスタ化運動ベクトルd(t)に基づいてCABACまたは2値算術符号化を用いることにより、より高いデータ圧縮となる。
次に、符号化手段56の内部構成について説明する。まずはじめに、図4は、手段56の大まかな構成を示す。図からわかるように、これは、直列の2値化手段100と2値算術符号化手段102とから構成されている。2値化手段は、符号化される値y(t)を受け取って2値化する。値を2値化することは、非バイナリ値をバイナリ表現に変換することを示す。次に説明するように、本実施の形態による2値化手段は、2つの2値化方法の組み合わせ、すなわち、単項2値化を、厳密に言えば、切頭単項(TU)2値化およびk次指数ゴロム2値化を用いる。手段100による2値化の結果は、置換シフトベクトル差y(t)の成分x、yまたはz等の、符号化されるそれぞれの値を表す一連のビットである。
値の2値化の結果は、ビンチェーン、または一連の二者択一、またはビンと呼ばれる場合もある。2値化が、バイナリツリーにより2値化値をビンチェーンにマッピングすることであると考える場合は、この種の名称となる。バイナリツリーの葉が2値化される値のうちの可能な値を表し、ツリーのノードが二者択一を表し、それぞれノードから次のレベルへ行く個別の2つの分岐が、可能なバイナリ値0および1それぞれに関連付けられている。次に、2値化される値を、2値化される値に対応するそれぞれの葉へ向かうバイナリツリーのルートからの途中で得られる当該ビンチェーンまたはビン列にマッピングする。
2値化手段100の機能を示す図5を参照して、手段100が用いるTU2値化およびk次指数ゴロム2値化の組み合わせについて、より詳細に説明する。図からわかるように、まずはじめに、2値化手段100は、主プレフィクスを得るために、第1の2値化方法、ここでは単項2値化にしたがって、境界値sより小さい最小値と、2値化される値y(t)とを2値化する。値xの単項2値化により、x−1で始まり、ゼロで終わる長さxの符号語を生成する。ここでプレフィクスの2値化に用いられるTU2値化は、厳密に言えば、ここではsまたは15に等しい境界値wを用いた単項2値化を表す。純粋単項2値化とは逆に、s以上の値のTU2値化では、終端ゼロを省略する。
次のステップ122では、2値化手段100は、2値化される値y(t)が境界値sよりも大であるかどうかを検証し、そうでなければ、2値化手段100は、この2値化される値y(t)のための2値化処理を終了する(124)。その結果、この場合、2値化結果は、プレフィクスだけを含む。そうでない場合、手段100は、主サフィックスを得るために、ステップ126で第2の2値化方法、ここではk次指数ゴロム方法にしたがって、2値化される値y(t)と境界値sとの間の差を2値化する。
2値化結果および/またはビンチェーンを得るために、ステップ128で、主サフィックスを主プレフィクスに付加する。
図6は、k=0、s=14の場合の、図5による2値化の一例の結果を示す。図6の表は、左列140に2値化される値のうちの可能な値を示し、2値化結果および/または対応するビットまたはビン列を右列の142に示す。図からわかるように、ビン列142は、1から14の間の2値化される値のプレフィクスだけを含んでいる。
sより大きい2値化される値は、TUプレフィクス144ばかりでなく、2値化される値bマイナスsの0次指数ゴロム2値化を表すサフィックス145も含んでいる。破線146は、主サフィックス145自体が順に、破線146左までの副プレフィクスと、破線の右までの副サフィックスとを含んでいること示している。図6の表の最後のラインは、以下に説明するように、個別のビンとコンテクストモデルとの対応付けに関連するビン番号を表す。
Figure 2008516318
Figure 2008516318
図7に基づいて、2値化結果のビンの2値算術符号化を行う手段102の機能について説明する。次に、ステップ160で、このビンが主プレフィクスの一部かどうか、ビンチェーンのビンを引き続いて検証する。もしそうであれば、手段102は、ステップ162で、ビンの適応2値算術符号化を行う。このことは、確率区間を、ビンの値により、細分した確率区間を二等分したものの一方に更新するように、現在の確率区間の予備細分を行うビンまたはビットに、可変確率評価を行うことを意味している。ここで、現在のビンの値にしたがって、次のビンに対する確率評価を更新する。ここで、CABACの場合のように、ステップ162で、コンテクスト依存の適応2値算術符号化を行うことも可能である。この場合、手段102は、主プレフィクスのすべてのビンまたはビット位置に対し、同じ確率評価を行わないが、例えば、それ自体が持つ適応確率評価がそれぞれ関連付けられた各種のコンテクストモデルを、個別のビン位置に割り当てる。
ステップ160の検証が否定的な場合、ステップ162で、ビンが主サフィックスの一部であるかどうか検証する。副情報伝送によるためではないが、エンコーダ56に量子化置換シフトベクトル差しか供給されていない場合は、このステップを省略することもある。ステップ164の検証が肯定的な場合、手段102は、ステップ166で、静的確率評価によって、すなわち、ビンが固定確率pを有する値1と、固定確率1−pを有するバイナリ値0とを有するかに基づく確率評価によって、現在のビンの2値算術符号化を行う。ここで、好ましくは、p=0.5である適応確率推定値またはコンテクストモデルの管理を全く必要としないので、主サフィックスのビンに統計確率評価を行うことにより、計算量が大幅に低減する。
適応2値算術符号化方法と、さらに符号化されるシンボルの確率のコンテクスト依存モデリングを前述のように組み合わせることにより、上述の算術符号化方法は、符号化される信号統計データに対する高度な適応性が得られ、エントロピー符号化を行う非常に効果的な方法を示す。大幅な圧縮向上が得られる。さらに、特に、乗算を行うことなく、区間の更新および確率評価の更新を表ベースのやり方で、CABACを用いて実施する場合は、上述のやり方に基づく算術符号化は、複雑さが低いので、ハードウェアおよびソフトウェアに統合するのに適している。
特に、上述のアルゴリズムに従って、類似の隣接シフトベクトル差を集約することで展開するように、前述のTUおよびk次指数ゴロム2値化の組み合わせにより、互いに比較的強く逸脱している任意の振幅の量子化置換シフトベクトル差を効率的に表現することが可能になる。符号化される値の全体に基づいて、バイナリ表現の単項部の最適長さsとともに、用いられるゴロムコードの次数kを求める。2値化ビンシーケンスの2値算術符号化のためのいくつかのコンテクストモデルを用いることにより、信号統計データに対しより良い適応が行われる。
算術符号化について、以下に指摘する。もちろん、符号語生成と、各メッシュに対する再度の適応を行うことが可能である。しかしながら、既に述べたように、類似の隣接シフトベクトル差をクラスタに集約することにより、伝達する値y(t)の数が低減される。ここで、2つの連続3Dメッシュ間にこの符号化に適した度数分布が全く生成されないので、上述の算術符号化方法による算術符号化の適正に関して符号化されるシンボル分布がもはや最適でないほど、数が小さくなっている。従って、効率的算術符号化を行うのに、連続3D形状のシーケンスの予測したシフトベクトルが、共通符号語を求める、すなわち、連続区間細分および(コンテクスト)適応を有する、いわゆるメッシュグループ、またはデータ部分のグループに集約されている場合もある。従って、個別のメッシュの別々のフレーム毎の符号化またはメッシュ毎の符号化と逆に、全グループのシフトベクトル差が等差級数的に普通に符号化される。要約すると、より適したシンボル周波数または分布関数が生成される。
図8を参照して、完全を期すために、図1のエンコーダが生成する符号化データストリームを復号化するのに適したデコーダの構成について説明する。図8のデコーダを、全体として200で表す。その構成は基本的に、出力14からメッシュメモリ50に延びるエンコーダ10の構成部分に対応する。違いは、もちろん、算術符号化が算術復号化に変わっていることである。それに対応して、デコーダ200は、内部復号化経路204に接続された初期デコーダまたは内部デコーダ202を含み、内部複合化経路204は、符号化データストリーム受信用入力210と、復号化データストリームまたは再生データストリーム出力用出力212との間の入力側スイッチ206および出力側スイッチ208に延びている。
内部復号化経路204から離れて、入力210からスイッチ208へ延びる相互復号化経路214があり、手段56の符号化と逆の算術符号化を行う算術復号化手段216と、逆スケーリング手段218と、クラスタ分割手段220と、コンバイナまたは加算器222と、コンバイナまたは加算器224とが直列に接続されている。構成要素218〜224は、機能および必須のタスクにおいてエンコーダ10の構成要素38、40、32および48に対応している。それに対応して、デコーダ200は、時間的/位置的予測手段226を含んでいて、その入力が、加算器222の出力と加算器224の入力との間に接続され、その出力が、スイッチ228を介して加算器222の入力に接続されている。スイッチ228は、図1のスイッチ44に対応し、予測手段226の出力または加算器222の入力への置換予測値としての論理ゼロを切り換える。加算器222のもう一方の入力は、クラスタ分割手段220の出力に接続されている。同様に、デコーダ200は、メッシュメモリ230を含んでいて、その入力は、加算器224の出力に接続されていて、その出力は、スイッチ52に対応するスイッチ232を介して加算器224の入力に接続されている。スイッチ232は、ゼロの予測置き換え値、またはメッシュメモリ230の出力信号を加算器224の入力に入力するように構成されている。図1で説明したものに対応するやり方で、デコーダ内の内部および相互モードを調整するように、図8に図示しない制御手段が、スイッチ206、208、228および232を制御し、スイッチ206および208が常に同期して動作する。
デコーダ200の機能は、図1の前の説明から得られ、この理由から、次にもう一度概要だけを簡単に説明する。復号化されるデータストリームが入力210に入力した場合、まずはじめに、内部モードになっているので、内部復号化手段202は、第1のデータ部分またはメッシュの復号化を行う。再生/復号化データストリームの一部として、結果をスイッチ208を介して出力212に出力する。わかりやすくするために図8に図示しないが、内部モード間の図1のエンコーダの手段34および36の直列接続に対応する直列接続を介して、復号化の結果を逆スケーリング手段218の入力に送る。これにより、内部モードでメッシュの再現が得られ、これをメッシュメモリ230に入力する。ここで、スイッチ228および232を両方とも、ゼロの置換プレディクタ信号に切り換える。
次のデータ部分の復号化は、相互復号化経路214を介して既に行われている。受け取って、算術符号化し、量子化した置換シフトベクトル差に対し、復号化手段216で算術復号化を行う。より具体的には、主プレフィクスまたは主サフィックスの連携による、用いられる適応または静的確率評価に従って現在の確率区間を分割し、符号化データストリームの受け取った符号語が、発生する上半分または下半分等にあるかどうかを調べる手段216により、デコーダ216が、符号化値y(t)に対しビン毎にビン列を求める。このように、手段216が、復号化される値y(t)を2値化したものを得て、次に逆にして、すなわち2値化から非2値化表現の値を求める。結果は、エンコーダ10の手段56に供給したような、値y(t)である。
Figure 2008516318
前の記述を参照して、以下のことを指摘しておく。本発明は、ポリゴンメッシュパラメータ化の背景についてだけ説明してきたが、本発明は、他のパラメータ化に対しても適用可能である。例えば、頂点が制御点として作用する関数として、表面の一区画毎、または全体としてパラメータ化することで、スプラインパラメータ化により3Dグラフィックモデルを定義する。最も良く知られている形式の1つは、3次Bスプライン等の、低次多項式を用いるスプラインによる記述である。
本発明を適用可能な別の考えられるパラメータ化の形式は、スライスパラメータ化またはスライス表現にある。これは、特に、コンピュータ断層撮影法に応用されている表面記述の形式である。これは、3D空間内のその位置がわかっている一連の2D断面領域で展開する。これらの断面領域の輪郭が、多角形またはパラメータ化関数により、3Dオブジェクトに結び付けられている。
パラメータ化の別の形式は、いわゆる点群である。ここで、制御点を球または楕円体等の単純な幾何学的3D体に拡張することにより、表面記述を生成する。これらの幾何学的立体に接して、貫通することにより、グラフィックモデルの閉じた表面を形成する。
ボクセルモデルパラメータ化により、連結性のない特別な種類の3D記述を形成する。ここで、実施の形態により、大きさが同じだったり異なっていたりする立方体または立方体に近い形を、幾何学的立体として用いる。幾何学的立体の位置を、制御点により求める。
スケルトンモデルパラメータ化では、制御点を3Dモデルのスケルトンを記述する多数の1次元パラメータ化関数の支持位置として用いる。次に、モデルの表面を、例えば、円柱、楕円体、またはブロブのように、スケルトン関数により放射状に拡張するように展開する。
最後に、幾何学的プリミティブを用いるパラメータ化の形式がまだ1つある。ここでは、3Dグラフィックまたはオブジェクトを、単純な、いわゆる幾何学的プリミティブ、またはいくつかのプリミティブを統合したものとして表現する。プリミティブは、球、円錐、角錐、切頭円錐、切頭角錐、円柱、角柱、矩形ブロック、楕円体、または平行六面体であってもよく、場所とその位置を、制御点で示す。
前述のように、用いられるパラメータ化により、空間予測で現在符号化される頂点の空間近傍を求めるやり方は変わる場合もある。
時間的に連続するメッシュの運動またはシフトベクトルを求めた前述の外部ループ、および時間的にまたは空間的に隣接するシフトベクトル間の差の生成に用いた内部ループでは、手段36でスケーリングを行った。このスケーリングを省略する場合もあるので、ブロック38および/または218を省くこともある。さらに、本発明を考察することにより、一般化することは、当業者にとって確かに明らかであり、上記の特定の実施の形態に限定されたものと理解されるべきではない。
従って、上記の実施の形態は、時間的に変わる3Dコンピュータグラフィックモデルの符号化および復号化を行う方法および構成を説明したものであり、符号化および復号化は、運動補償、量子化および算術符号化とともに、対応するコンピュータプログラムと、コンピュータプログラムが実行可能なやり方で記憶されているコンピュータ読み取り可能媒体とを含んでいる。
特に、上記の実施の形態は、静的モデルおよび動的モデル(トポロジ変化のあるものとないもの)を同じように処理できる、3Dメッシュの内部−相互符号化を行う完全なシステムについて説明している。固定数または可変数の符号化メッシュの後で内部モードに切り換えることが可能である。連続した時刻において3Dメッシュの頂点の間で、シフトベクトルの予測が行われる。3Dメッシュのシフトベクトルおよびシフトベクトル差の算術符号化を行うCABACの適応および最適化を、時刻ごとに別々に、またはメッシュグループの多数の連続した時刻にまとめて用いることにより、圧縮率をさらに高めることが可能になる。エンコーダに中央値プレディクタまたは共通グループプレディクタにより、デコーダに副情報がある場合やない場合で、1つ以上の頂点の1つ以上のシフトベクトルを成分毎に予測を行うこともできる。空間的、時間的に前に符号化した頂点のシフトベクトルを用いることにより、中央値プレディクタに対応する副情報を生成して、オプションとして送信することもできる。同様に、符号化されるシフトベクトルまたは頂点のグループの共通プレディクタを生成して送信することも可能である。符号化される頂点のもともとのシフトベクトルと、対応する予測したシフトベクトルそれぞれとの間で、成分毎にシフトベクトル差を量子化することにより、さらに簡単に圧縮可能な小さな値にすることが可能である。符号化される頂点のもともとのシフトベクトルと、対応する予測したシフトベクトルそれぞれとの間の量子化または非量子化シフトベクトル差のエントロピー復号化を行うことにより、さらに圧縮を行う。デコーダ側で、デコーダで算出した中央値プレディクタまたはグループプレディクタと、復号化シフトベクトル差とを加算することにより、符号化した頂点の復号化を行う。上述のように、対応するエントロピー復号化のように、加算する際に、コンテクスト適応算術エンコーダを用いたエントロピー符号化を行ってもよい。上述のように、空間的、時間的に前に符号化した頂点のシフトベクトルと、これらの頂点の位置とを用いて、コーダおよびデコーダでコンテクスト算出を行うことが可能である。
最後に、条件によるが、本発明の符号化方法を、ソフトウェアで実施することもできることを指摘しておく。対応する方法を実行するプログラム可能コンピュータシステムと協働可能な、デジタル記憶媒体、特に電気的に読み取り可能な制御信号を格納したフレキシブルディスクまたはCDにより、実施することもできる。一般に、コンピュータプログラム製品をコンピュータ上で実行する場合は、本発明は、本発明による方法を実行する、機械読み取り可能キャリアに格納したプログラムコードを有するコンピュータプログラム製品にある。換言すれば、本発明は、コンピュータプログラムをコンピュータ上で実行する場合、本発明の方法を実行するプログラムコードを有するコンピュータプログラムとして実施することもできる。
特に、フローチャートのブロック、または手段ブロックの上記の方法ステップを、サブプログラムルーチンで、個別にまたはいくつかのものを実施してもよい。あるいは、これらのブロックを、もちろんASICの個別の部分として実施することもできる。
本発明の一実施の形態によるエンコーダを示すブロック回路図である。 ポリゴンメッシュを示す概略図である。 図1のクラスタ生成手段を示すブロック回路図である。 図1の算術符号器を示す概略ブロック回路図である。 図4の2値化手段の機能を説明するフローチャートである。 図5による2値化結果の一例を説明する表である。 図4の2値算術符号化手段の機能を説明するフローチャートである。 本発明の一実施の形態による、図1のエンコーダが生成するデータストリームを復号化するのに適したデコーダを示すブロック回路図である。

Claims (21)

  1. Figure 2008516318
  2. Figure 2008516318
  3. 現在符号化される前記第1のデータ部分の座標データ(m(t))と、前記第2のデータ部分の座標データ(m(t−1))との間に、一意的な関連付けがあるかどうかを検証し、そうでなければ、現在符号化される前記データ部分の座標データ(m(t))を予測を行わずにすぐに符号化し(16)、前記第1のデータ部分の前のデータ部分の座標データに基づかないで、前記第1のデータ部分に続くデータ部分の座標データ(m(t+1))の予測を行う手段(54)をさらに備える、請求項2に記載の装置。
  4. 予測のための前記第2の手段(24)は、前記第2のデータ部分のための予測エラーベクトル(d(t−1))に基づいて、前記第1のデータ部分のための前記予測エラーベクトル(d(t))を予測するように構成され、比較のための前記第2の手段(30)は、前記第1のデータ部分の座標データ(m(t))と、前記第2のデータ部分の座標データ(m(t−1))との間の一意的な関連付けにより、前記第1のデータ部分のための前記予測エラーベクトル(d(t))に割り当てられている前記第2のデータ部分のためのこれらの予測エラーベクトル(d(t−1))の比較を行うように構成される、請求項2または請求項3に記載の装置。
  5. 予測のための前記第2の手段(24)は、前記第1のデータ部分のための既に得られている予測エラーベクトル(d(t))に基づいて、現在符号化される第1のデータ部分の前記予測エラーベクトル(d(t))の一部の予測を行うように構成される、請求項1ないし請求項4のいずれかに記載の装置。
  6. Figure 2008516318
  7. 前記第1のデータ部分のための予測エラーベクトルのうち、所定の予測エラーベクトル(di(t))に1つより多いプレディクタがある場合、予測のための前記第2の手段(24)が、これらのプレディクタの中央値に基づいて、所定の予測エラーベクトルの予測を行うように構成される、請求項1ないし請求項6のいずれかに記載の装置。
  8. 前記予測エラーベクトル(d(t))が所定の基準に反しているかどうかを検証する手段(54)をさらに備え、その場合、予測を行わずにすぐに、前記第1のデータ部分の座標データ(m(t))を符号化し(16)、前記第1のデータ部分の前のデータ部分の座標データに基づかないで、予測する前記第1のデータ部分に続くデータ部分の座標データの予測を行う、請求項1ないし請求項7のいずれかに記載の装置。
  9. 符号化するための手段(56)が、予測エラーベクトル差(e(t))を量子化する手段(36)を備える、請求項1ないし請求項8のいずれかに記載の装置。
  10. 符号化するための手段(56)が、多数の予測エラーベクトル差を除去する手段(34)を備え、前記手段(34)は、
    (a)それぞれの予測エラーベクトル差を求めた予測エラーベクトルが得られた座標情報、または前記データストリームの近傍情報に基づいて、前記予測エラーベクトル差をグループに分類し(80)、
    (b)予測エラーベクトル差のグループ毎の置換予測エラーベクトル差を求め(82)、
    (c)前記置換予測エラーベクトル差に対するグループの前記予測エラーベクトル差のずれが、所定の閾値を超えているかどうかをグループ毎に検証し(84)、
    (d)その場合、グループ毎に、前記測定(a)〜(c)をそれぞれのグループで繰り返し(86)、
    (e)前記予測エラーベクトル差として用いるために、各グループの予測エラーベクトル差を置換予測エラーベクトル差と置換し(88)、前記ステップ(a)の分類の結果を符号化データストリームに導入することにより多数の予測エラーベクトル差を除去する、請求項1または請求項9のいずれかに記載の装置。
  11. 前記予測エラーベクトル差を符号化する手段(56)が、
    主プレフィクス(144)を得るために、第1の2値化方法にしたがって、前記予測エラーベクトル差の最小値および所定の境界値(s)を2値化する手段(120)と、
    所定の予測エラーベクトル差が前記境界値(s)より大きい場合(122)、主サフィックス(145)を得るために、前記第1の2値化方法と異なる第2の2値化方法にしたがって、所定の予測エラーベクトル差マイナス所定の境界値(s)の差を2値化し(126)、前記主サフィックス(145)を前記主プレフィクス(144)に付加する(128)手段と、
    前記主プレフィクスまたは前記主プレフィクスと前記主サフィックスとから構成される符号語で各ビットを2値算術符号化する手段(102)とを備え、手段(102)が、
    前記符号語のビットが前記主プレフィクス(144)、(160)の一部の場合は、順応して変わるビット値確率評価により前記ビットの2値算術符号化(162)を行い、
    前記符号語のビットが、前記主サフィックス(145)、(162)の一部の場合は、静的ビット値確率評価により前記ビットの2値算術符号化(166)を行う、請求項1ないし請求項10のいずれかに記載の装置。
  12. Figure 2008516318
  13. Figure 2008516318
  14. 予測のための前記第2の手段(226)が、前記第1のデータ部分のための既に得られている予測エラーベクトル(d(t))に基づいて、現在復号化される前記第1のデータ部分のための前記予測エラーベクトル(d(t))の一部に予測を行うように構成されている、請求項12または請求項13に記載の装置。
  15. Figure 2008516318
  16. 前記第1のデータ部分のための前記予測エラーベクトルのうち、所定の予測エラーベクトルに1つより多いプレディクタがある場合は、予測のための第1の手段(226)が、これらのプレディクタの中央値に基づいて、所定の予測エラーベクトルの予測を行うように構成されている、請求項12ないし請求項15のいずれかに記載の装置。
  17. 符号化のための手段(56)が、
    (a)前記符号化データストリームの分類情報にしたがって、前記予測エラーベクトル差を置換予測エラーベクトル差としてグループに割り当て、
    (b)これらを前記予測エラーベクトル差として用いるように、各予測エラーベクトル差を同一の予測エラーベクトル差のグループと置換する(88)ことにより、
    予測エラーベクトル差の数を拡張する手段(34)を備える、請求項12ないし請求項16のいずれかに記載の装置。
  18. ビット毎に前記符号化データストリームに2値化することを表す符号語の符号化ビットにより、所定の予測エラーベクトル差を、前記符号化データストリームに符号化する装置であって、前記符号語が、第1の2値化方法にしたがって、所定の予測エラーベクトル差の最小値の2値化を表す主プレフィクスと、所定の予測エラーベクトル差が所定の境界値より大きい場合は、前記第1の2値化方法と異なる第2の2値化方法にしたがって、所定の予測エラーベクトル差マイナス所定の境界値の差の2値化を表す主サフィックスとを含み、前記符号化データストリームを処理する手段(216)が、
    前記符号語のビット毎に、
    前記符号語を得るために、
    前記符号語のビットが前記主プレフィクスの一部である場合は、順応して変わるビット値確率評価により、前記ビットの2値算術復号化を行い、前記符号語のビットが前記主サフィックスの一部である場合は、スタティックビット値確率評価により、前記ビットの2値算術復号化を行なう手段と、
    前記主プレフィクスから最小値を抽出する手段と、
    前記最小値が所定の境界値より小さい場合は、所定の予測エラーベクトル差を得るために、前記主サフィックスから差を抽出して、前記所定の境界値の差を加算し、そうでない場合は、前記最小値を前記予測エラーベクトル差と見なす手段とを備える、請求項12ないし請求項17のいずれかに記載の装置。
  19. Figure 2008516318
  20. Figure 2008516318
  21. 前記コンピュータプログラムをコンピュータ上で実行する場合、請求項19または請求項20に記載の方法を実行するプログラムコードを有する、コンピュータプログラム。
JP2007535041A 2004-10-08 2005-09-15 時間的に変わるグラフィックモデルを表すデータストリームの符号化方法 Active JP4579987B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102004049156A DE102004049156B4 (de) 2004-10-08 2004-10-08 Codierschema für einen ein zeitlich veränderliches Graphikmodell darstellenden Datenstrom
PCT/EP2005/009937 WO2006039979A1 (de) 2004-10-08 2005-09-15 Codierschema für einen ein zeitlich veraenderliches graphikmodell darstellenden datenstrom

Publications (2)

Publication Number Publication Date
JP2008516318A true JP2008516318A (ja) 2008-05-15
JP4579987B2 JP4579987B2 (ja) 2010-11-10

Family

ID=35115770

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007535041A Active JP4579987B2 (ja) 2004-10-08 2005-09-15 時間的に変わるグラフィックモデルを表すデータストリームの符号化方法

Country Status (8)

Country Link
US (1) US7929795B2 (ja)
EP (1) EP1797536B1 (ja)
JP (1) JP4579987B2 (ja)
KR (1) KR100891375B1 (ja)
CN (1) CN100547615C (ja)
AT (1) ATE441905T1 (ja)
DE (2) DE102004049156B4 (ja)
WO (1) WO2006039979A1 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005008594A1 (en) * 2003-07-16 2005-01-27 Hanyang Hak Won Co., Ltd. Method and apparatus for encoding and decoding three-dimensional mesh information
US8542748B2 (en) 2008-03-28 2013-09-24 Sharp Laboratories Of America, Inc. Methods and systems for parallel video encoding and decoding
WO2010041488A1 (ja) * 2008-10-10 2010-04-15 株式会社東芝 動画像符号化装置
KR101669873B1 (ko) * 2009-10-16 2016-10-27 삼성전자주식회사 삼차원 메쉬 압축장치 및 방법
US8711760B2 (en) * 2010-03-26 2014-04-29 Intel Corporation Method and apparatus to adjust received signal
CN102263560B (zh) * 2010-05-28 2013-11-20 富士通株式会社 差分编码方法和系统
US20120014431A1 (en) * 2010-07-14 2012-01-19 Jie Zhao Methods and Systems for Parallel Video Encoding and Parallel Video Decoding
US10349070B2 (en) * 2010-09-30 2019-07-09 Texas Instruments Incorporated Simplified binary arithmetic coding engine
US9313514B2 (en) 2010-10-01 2016-04-12 Sharp Kabushiki Kaisha Methods and systems for entropy coder initialization
CN107529708B (zh) 2011-06-16 2019-05-07 Ge视频压缩有限责任公司 解码器、编码器、解码和编码视频的方法及存储介质
ES2711671T3 (es) * 2011-06-28 2019-05-06 Samsung Electronics Co Ltd Procedimiento de decodificación de vídeo usando decodificación
UA114674C2 (uk) 2011-07-15 2017-07-10 ДЖ.І. ВІДІЕУ КЕМПРЕШН, ЛЛСі Ініціалізація контексту в ентропійному кодуванні
US8736603B2 (en) * 2011-11-02 2014-05-27 Visual Technology Services Limited Compression of texture rendered wire mesh models
US9357185B2 (en) 2011-11-08 2016-05-31 Qualcomm Incorporated Context optimization for last significant coefficient position coding
US9154792B2 (en) 2011-11-08 2015-10-06 Qualcomm Incorporated Progressive coding of position of last significant coefficient
KR102366842B1 (ko) 2013-04-08 2022-02-24 돌비 인터네셔널 에이비 Lut를 인코딩하는 방법, lut를 디코딩하는 방법 및 대응하는 장치들
WO2017022973A1 (ko) * 2015-08-04 2017-02-09 엘지전자 주식회사 비디오 코딩 시스템에서 인터 예측 방법 및 장치
TWI620437B (zh) * 2016-12-02 2018-04-01 英業達股份有限公司 重覆播放系統與方法
GB2565268B (en) * 2017-06-22 2021-11-24 Avago Tech Int Sales Pte Lid Apparatus and method for packing a bit stream
TWI659205B (zh) * 2017-09-19 2019-05-11 財團法人工業技術研究院 即位量測系統、基準校準方法、誤差量測方法與電腦可讀取記錄媒體
CN111541456B (zh) * 2020-05-18 2023-07-18 深圳市埃伯瑞科技有限公司 一种连续变量分布的软网格编码方法及其解码方法
CN112218008B (zh) * 2020-10-12 2024-01-23 Oppo广东移动通信有限公司 设备控制方法、装置、存储介质和电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002290743A (ja) * 2001-03-23 2002-10-04 Ricoh Co Ltd 画像情報符号化方法、符号化装置、ディジタル複写機、ディジタルファクシミリ装置、及び、ディジタルファイリング装置
JP2002300043A (ja) * 2001-04-03 2002-10-11 Sony Corp 情報処理装置及び方法、並びに記憶媒体
JP2003204558A (ja) * 2003-01-10 2003-07-18 Mitsubishi Electric Corp 画像符号化装置および画像復号化装置
JP2003256874A (ja) * 2002-03-04 2003-09-12 Matsushita Electric Ind Co Ltd 画像合成変換装置
WO2003079681A1 (en) * 2002-03-15 2003-09-25 Nokia Corporation Method for coding motion in a video sequence
JP2004088801A (ja) * 1997-02-13 2004-03-18 Mitsubishi Electric Corp 動画像復号装置及び動画像復号方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4802102A (en) * 1987-07-15 1989-01-31 Hewlett-Packard Company Baseline correction for chromatography
US5568378A (en) * 1994-10-24 1996-10-22 Fisher-Rosemount Systems, Inc. Variable horizon predictor for controlling dead time dominant processes, multivariable interactive processes, and processes with time variant dynamics
US5818463A (en) * 1997-02-13 1998-10-06 Rockwell Science Center, Inc. Data compression for animated three dimensional objects
US7809203B2 (en) * 2001-11-27 2010-10-05 Samsung Electronics Co., Ltd. Apparatus for encoding and decoding key data and key value data of coordinate interpolator and recording medium containing bitstream into which coordinate interpolator is encoded
KR100480787B1 (ko) * 2001-11-27 2005-04-07 삼성전자주식회사 좌표 인터폴레이터의 키 값 데이터 부호화/복호화 방법 및 장치
US6690307B2 (en) 2002-01-22 2004-02-10 Nokia Corporation Adaptive variable length coding of digital video

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004088801A (ja) * 1997-02-13 2004-03-18 Mitsubishi Electric Corp 動画像復号装置及び動画像復号方法
JP2002290743A (ja) * 2001-03-23 2002-10-04 Ricoh Co Ltd 画像情報符号化方法、符号化装置、ディジタル複写機、ディジタルファクシミリ装置、及び、ディジタルファイリング装置
JP2002300043A (ja) * 2001-04-03 2002-10-11 Sony Corp 情報処理装置及び方法、並びに記憶媒体
JP2003256874A (ja) * 2002-03-04 2003-09-12 Matsushita Electric Ind Co Ltd 画像合成変換装置
WO2003079681A1 (en) * 2002-03-15 2003-09-25 Nokia Corporation Method for coding motion in a video sequence
JP2003204558A (ja) * 2003-01-10 2003-07-18 Mitsubishi Electric Corp 画像符号化装置および画像復号化装置

Also Published As

Publication number Publication date
EP1797536B1 (de) 2009-09-02
EP1797536A1 (de) 2007-06-20
KR20070088609A (ko) 2007-08-29
KR100891375B1 (ko) 2009-04-02
US7929795B2 (en) 2011-04-19
CN101061515A (zh) 2007-10-24
US20070242894A1 (en) 2007-10-18
ATE441905T1 (de) 2009-09-15
CN100547615C (zh) 2009-10-07
JP4579987B2 (ja) 2010-11-10
DE102004049156A1 (de) 2006-04-20
DE502005008069D1 (de) 2009-10-15
DE102004049156B4 (de) 2006-07-13
WO2006039979A1 (de) 2006-04-20

Similar Documents

Publication Publication Date Title
JP4579987B2 (ja) 時間的に変わるグラフィックモデルを表すデータストリームの符号化方法
US11750839B2 (en) Method and apparatus for point cloud compression
CN113615181A (zh) 用于点云编码的隐式四叉树或二叉树几何形状分割
US11469771B2 (en) Method and apparatus for point cloud compression
KR102645508B1 (ko) Haar 기반 포인트 클라우드 코딩을 위한 방법 및 장치
CN105027560A (zh) 确定用于变换系数的二进制码字的方法
CN115379191B (zh) 一种点云解码方法、点云编码方法及相关设备
TW202143709A (zh) 針對基於幾何的點雲壓縮的三湯語法訊號傳遞
KR102002654B1 (ko) 반복 구조를 갖는 3d 모델을 위한 비트스트림을 인코딩하고 디코딩하는 시스템 및 방법
Fan et al. Deep geometry post-processing for decompressed point clouds
WO2022131948A1 (en) Devices and methods for sequential coding for point cloud compression
CN110046693B (zh) 选择编码选项的方法、训练神经网络的方法、设备和介质
JP7394980B2 (ja) ブロック分割を伴うニューラルネットワークを復号する方法、装置及びプログラム
EP4405899A1 (en) Point cloud data frames compression
RU2778864C1 (ru) Неявное геометрическое разделение на основе квадродерева или бинарного дерева для кодирования облака точек
WO2024123569A1 (en) Geometry point cloud coding method, encoder and decoder
Park et al. Topological surgery encoding improvements based on adaptive bit allocation and DFSVQ
WO2023244551A1 (en) Color component coding method, encoder and decoder
Smolic et al. A survey on coding of static and dynamic 3D meshes
JP2024512921A (ja) メッシュ圧縮のためのパッチ時間的位置合わせの符号化
WO2024129365A1 (en) Decoding method, decoder, encoding method, encoder and non-transitory computer readable recording medium

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091201

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100226

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100305

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100326

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100427

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100726

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100818

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100826

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130903

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4579987

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250