JP2002527014A

JP2002527014A - ３次元メッシュネットワークの圧縮およびコーディング

Info

Publication number: JP2002527014A
Application number: JP2000575086A
Authority: JP
Inventors: ロラン，ナタリー; ルシャ，パトリク; サンソン，アンリ
Original assignee: France Telecom SA
Current assignee: Orange SA
Priority date: 1998-10-02
Filing date: 1999-09-30
Publication date: 2002-08-20
Anticipated expiration: 2019-09-30
Also published as: US6795070B1; DE69904843T2; CA2346342C; DE69904843D1; JP2010273367A; JP5414121B2; CA2346342A1; FR2784211A1; ATE230869T1; EP1116185B1; JP4638037B2; EP1116185A1; WO2000021035A1; FR2784211B1

Abstract

(57)【要約】本発明はデジタル画像をコード化し、前記画像を表現するビットストリームを生成し、ビットストリームの長さは所望の表現の品質に依存する方法において、a) コード化される画像領域に、メッシュピークが前記画像のピクセルである複数のネストメッシュを含む階層メッシングを規定し、b)前記階層メッシングの各メッシュに対して、コード化される画像と、該メッシュが属するネストメッシングのピークから得られる補間画像との間の輝度変数を決定し、c) 輝度変数が閾値変数より大きいメッシュのピークの位置、輝度およびクロミナンスの値をビットストリーム位置に挿入することから成ることを特徴とする方法に関するものである。本発明は減速(圧縮)によって静止画または動画をコード化するのに有用である。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】

本発明は、フローレイトの削減（圧縮）による静止画または動画のコーディン
グ分野に関する。

【０００２】

【従来の技術】

画像を圧縮する技術は従来、ビデオ数値信号のフローレイトを削減し、それら
を伝送または記憶するのに用いられている。第１の応用において提案されるコー
ディング法は特に、低いフローレイトの伝送およびフローレイトの保証が全くな
い伝送、例えばIPプロトコル（インターネットプロトコル）によって行われる伝
送に適合している。静止画または動画をフローレイトを削減してコーディングする方法は多数あり
、最もよく知られている方法は規格、例えばISO-JPEGまたはISO-MPEGとなった方
法である。

【０００３】これらのコーディング法は静止画（JPEG）では画像内の空間的冗長性、隣接す
る点と点との相関および細部に対する目の感度の低さを利用し、動画（MPEG）で
は連続する画像間の時間的冗長性を利用する一般的な圧縮原理を用いている。この種の方法ではまず、画像の複数のブロックに離散コサイン変換（DCT）を
適用するか、または画像全体にウェーブレット変換を適用して画像を変換する。
次に、得られた信号を定量化して信号のとりうる値の数を制限し、次に、定量化
した信号の統計的冗長性を用いるエントロピーコーディングを用いてコード化し
、伝送または記憶されるデータの量を減少させる。

【０００４】

【発明が解決しようとする課題】

しかし、これらの従来の方法には主として画像の内容およびそれらの純粋に数
値的な性格を考慮しない方法の使用によって生じるいくつかの制限がある：・離散コサイン変換の場合に画像の輪郭近くに現れるブロック効果に起因するリ
ンギング、これらのリンギングは低いフローレイトのウェーブレットの場合にも
現れる；・これらの方法は動画（MPEG）の場合には２つの画像間の動きの補償を決定した
り、合成画像を自然の背景に合成するのに従来用いられる幾何学的処理（相似変
換等）に十分に適合していない。

【０００５】さらに、画像の空間的領域において直接作用する方法もあり、この方法は画像
に特有のピクセルを直接選択して画像の各色彩成分を特徴付ける光度測定表面を
生成し、画像の残りのピクセルを画像に特有のピクセルを補間して得ることから
構成される。幾何学的処理に関係する多くの可能性が提供されているが、これらの方法はや
はり圧縮に関して全くあてにならないということがわかっている。さらに、これ
らの方法はウェーブレットによるコーディングを用いる場合とは違って、画像の
複雑さおよび表現の所望の品質に適合したデータの量をコーディング終了時に得
ることができない。特に、これらの方法は特にフローレイトが低い場合に、許容
可能な品質を有する画像を得ることができない。

【０００６】

【課題を解決する手段】

本発明の方法の目的は上記の従来技術の欠点を減らすことにある。本発明の目的は数値画像をコード化し、前記画像を表す２進列を生成し、２進
列の長さが表現の所望の品質に依存する方法において、 a) コード化される画像領域に、メッシュトップが前記画像のピクセルである複
数のネストメッシングを含む階層メッシングを規定し、 b)前記階層メッシングの各メッシュに対して、コード化される画像と、該メッシ
ュが属するネストメッシングのトップから得られる補間画像との間の輝度偏差を
決定し、 c)輝度偏差が閾値偏差より大きいメッシュのトップの位置、輝度およびクロミナ
ンスの値を２進列に導入するステップを含むことを特徴とする方法に関するものである。

【０００７】

【発明の実施の形態】

階層メッシングはより粗いベースを用いるメッシングのメッシュを規則的かつ
連続的に細分化して得られるのが好ましい。メッシュのトップのクロミナンス値、輝度値および位置の値をより容易に処理
するために、本発明の方法は前記階層メッシングと組み合わされるツリー構造を
具体化するステップをさらに含むのが有利である。本発明の一実施例では、ステップc)は数回繰り返され、閾値偏差がだんだん小
さくなり、各繰り返しにおいてビットのグループが生成され、表現の品質が向上
する。

【０００８】２進列のサイズを減らすためにまず、２進列に導入される値を定量化および圧
縮操作する。最後に、別の実施例では、多重メッシングのトップの位置および対応するクロ
ミナンスおよび輝度の値を最適化し、２進列の表現の品質をさらに高めることも
できる。本発明の他の特性および利点は、添付図面を参照して下記の詳細な説明を読め
ば明らかになるであろう。

【０００９】

【実施例】

以下の説明では、コード化される画像のピクセルが横座標xおよび縦座標yによ
って空間内に指定されると考える。輝度成分Yおよび２つの色彩成分UおよびVが
各ピクセルと組み合わされている。成分Y、UおよびVの代わりに比色成分RVB、HS
Vを用いることも可能である。

【００１０】本発明の方法の第１ステップa)ではまず、コード化される画像領域に、複数の
ネストメッシングを含む１つの階層メッシングが定義される。前記メッシングの
メッシュのトップはコード化される画像のピクセルである。この階層メッシング
は例えばより粗いベースメッシングのメッシュを規則的に連続して細分化するこ
とによって得られる。前記メッシングと組み合わされるツリーのノードと混同し
ないように、メッシング「ノード」という用語は使用しない点に注意しなくては
ならない。

【００１１】３個のネストメッシュを含む三角形階層メッシュの例が図１Ａに図示されてい
る。このメッシュは、10個のメッシュと８個のメッシュトップを有する。図１Ａの太い実線で表されたベースメッシングはそのメッシュトップの規則的
なスタガー分布を示している。規則的なトポロジーによって三角形を画像上にう
まく配置することができる。このトポロジーは演繹的にコード化される画像の内
容が知られていないときに最も適している。このベースメッシングで規定された
三角形はレベル０の三角形に対応する。

【００１２】図１Ａのメッシングの例では、レベル０の三角形は４個の同一の三角形、レベ
ル１に細分化される。この細分化は図の細い実線で示されている。図１Ｂには、親の三角形T₁がより高いレベルの４個の子の三角形T₁₁、T₁₂、T₁ ₃ 、T₁₄に細分化されるのが示されている。最後に、レベル１の三角形は４個の三角形、レベル２に細分化される。この新
たな細分化は図１Ａの破線で表されている。この階層メッシングによって高い精
度を有する、したがってネストメッシングの数に比例して向上する品質を有する
画像を表すことができよう。各ネストメッシングは階層メッシングの１つのメッ
シングレベルに対応する。

【００１３】あるメッシュトップは複数のメッシングレベルに属し、これは例えば画像の左
上側ピクセルが３つのメッシングレベルに対して１つの三角形の頂点を構成する
場合である。一方では、各三角形は唯一のメッシングレベル（唯一のネストメッ
シング）にリンクされる。メッシングの各トップは画像のマークに１つの位置を
有し、輝度YおよびクロミナンスU、V情報の中心である。

【００１４】生成されたメッシングによって、メッシングレベルで単一の三角形を画像の各
ピクセルと組み合わせることができる。画像のピクセルの輝度およびクロミナン
スの値の近似値は組み合わされる三角形の頂点の対応する値から補間することに
よって得ることができる。本明細書で用いる補間モデルはラグランジュモデルである。これは以下の式で
定義される細分基底関数を含む：

【００１５】

【式３】（ここで、eは頂点i、j、kを有する三角形である）

【００１６】座標(x，y)の点をpおよび点pの補間された輝度V_YおよびクロミナンスV_Uおよび
V_Vの値を含むベクトル

【式４】で示す場合、ベクトル

【外１】は以下の式で定義される：

【式５】

【００１７】本発明（細分補間）の場合は、値Ψ_i ^e(x，y)、Ψ_j ^e(x，y)およびΨ_k ^e(x，y)は
三角形eにおける点pの重心座標を表す。これらの座標は以下の式で表される：

【式６】 Ψ_j ^e(x，y)およびΨ_k ^e(x，y)は式Ψ_i ^e(x，y)において指数i、j、kを環状に置
換して得られる。

【００１８】メッシングステップ終了時に、ツリー構造を前記階層メッシングと組み合わせ
て構成し、メッシュトップの値を操作するのが有利である。ツリーはメッシング
レベル（またはネストメッシング）の数と同じ数のレベルを有する。ツリーの各
レベルは対応するメッシングレベルにおける三角形の数と同じ数のノードを有す
る。ツリーの各ノードは階層メッシングの単一の三角形に関連する。したがって
、三角形T₁およびその４個の子の三角形T₁₁、T₁₂、T₁₃、T₁₄に関連するツリーの
部分は図２に示されている。三角形T₁が多重メッシングのレベルnに属する場合
は、ツリーのレベルnに対応する１つのノードおよび、各ノードが子の三角形T₁₁ 、T₁₂、T₁₃、T₁₄の１つに関連するレベルn+1に対応する４つの子のノードが形成
される。

【００１９】三角形T₁、T₁₁、T₁₂、T₁₃およびT₁₄の頂点はそれぞれABC、AEF、BEG、FGCおよ
びEFGである。三角形T₁に関連するノードは点A、BまたはCの１つを頂点として有
する他の三角形と、頂点A、BおよびCの位置、輝度およびクロミナンスの値を共
有し、冗長値を記憶しないようにする。同様に、点E、F、Gの値は三角形T₁₁、T₁ ₂ 、T₁₃、T₁₄に関連するノードに分配される。

【００２０】階層メッシングの全ての三角形に対して１つのノードが同じ方法で形成される
場合は、図３に示すように１つのツリーが得られ、このツリーのルートはベース
メッシングの三角形の数と同じ数の複数のノードを含んでいる。ツリーが構成されると、残るは画像の２進列の代表に導入されるツリーのデー
タを決定することである。この決定は表現の所望の品質に依存する。この決定を
実施するためには、ステップb)にしたがって階層メッシングの各三角形に対して
、コード化される画像と、そのメッシュが属するネストメッシングのトップから
得られる補間画像との間の輝度偏差を計算する。ステップc)では、次にこの偏差を各三角形に対する閾値偏差と比較する。閾値
偏差の値は表現の所望の品質に依存する。次に、輝度偏差が閾値偏差より大きい
三角形に関連するツリーの部分を２進列に導入する。

【００２１】実際には、決定は以下のように実施される：ツリーの各ノードに対して、対応
する三角形の輝度偏差を計算し、次にこのノードと組み合わされる三角形の輝度
偏差が閾値偏差より小さいか、大きいかに応じて値０または１をそれらに加える
。図４はこのステップを示している。最初に、２進列に導入されるツリーの部分
をデコーダによって再構成することを可能にするシーケンス、すなわちシーケン
ス11101110000000011が２進列に導入され、次に上記シーケンスにおいて１を有
するノードに含まれる値が２進列に導入される。

【００２２】この方法の過程で閾値が減少し、コーディングを段階的に進行させることがで
きるのが有利である。したがって、好ましい実施例では、ステップc)は数回繰り
返され、閾値偏差がだんだん小さくなり、各繰り返しにおいてビットの追加のグ
ループが生成され、表現の品質が向上する。冗長度の全くない最終２進列を構築
するために、基準テーブルが用いられ、このテーブルではノードの値が既にビッ
ト列に導入されたか否かを示す値０または１がツリーの各ノードと組み合わされ
る。テーブルの値はノードの値がビット列に導入されると更新される。したがっ
て、閾値偏差が減少するとき、ビット列に導入されることが求められるノード値
が既にそこにはないことを確かめるための検査が行われる。これによって、閾値
偏差の低減に対応するツリーの追加部分のみをビット列に導入することができる
。

【００２３】したがって、高品質の表現が要求されないときは、最も高い閾値偏差で得られ
た２進列の第１の部分のみを利用することができる。ある程度の品質の表現を得
るためには、２進列のより大きな部分を利用する必要があろう。

【００２４】改良実施例では、トップの値を２進列に導入する前に定量化および圧縮して２
進列のサイズを制限することができる。定量化は不均一になるように選択するの
が好ましい。定量化は例えば輝度値（それぞれクロミナンスおよび位置）の統計
分布を利用することができる。このために、処理される画像の輝度値のヒストグ
ラム（グレーのレベル）をモデル化する。このヒストグラムは一般にほとんど拡
張されず、一般化されたガウスと同化させることができる。平均値および標準偏
差を計算し、不規則な区間の数を固定した後で、各区間I_iに対して最適な定量化
値V_iを計算する。この値は基準Dを最小化して得られる。この基準Dは以下の式で
定義される：

【００２５】

【式７】（ここで、p(x)は一般化されたガウスで得られた点xの周辺確率密度を示し、Lは
不規則な区間の数である）。

【００２６】定量化ステップの最後に、定量化微分値にデータ圧縮操作を行い、２進列の長
さを制限する。圧縮は本発明の場合は最良の圧縮率を有する算術および適応コー
ダによって実施されるのが有利である。算術コーディング（または算術圧縮）の一般法則は以下の通り：記号で形成さ
れる各メッセージは０〜１の実数の区間で表される。記号の出現の可能性が高け
れば高いほど、その表現区間は大きくなる。算術コーディングはPascal Plumeに
よる「Data Compression」（出版元：Eyrolles）pp 111-168という文献に詳細に
説明されている。

【００２７】さらに、適応コーディングは圧縮ステップ中に記号のコーディングを、その出
現頻度にしたがって徐々に適合させることで構成されている。したがって、記号
が圧縮開始時に５ビットでコード化される場合は、圧縮の別のステップで、この
同じ記号をその出現頻度が高いか、低いかに応じて１または８ビットでコード化
することができる。圧縮のどの時点においても、最も頻度の高い記号が最低の数
のビットでコード化される。当然、この方法では圧縮を実施するコーダの部分お
よび解凍を実施するデコーダの部分が並行にかつ均一に機能する必要がある。こ
の種のコーディングでは、コーダおよびデコーダは全ての記号が同程度に確から
しい所定の統計テーブルから始まる。圧縮中に徐々に、コーダはテーブルを更新
する。実際には、デコーダは解凍中にそのテーブルを用いて同じことを行う。更
新するアルゴリズムがコーダおよびデコーダで同一である限り、この種のコーデ
ィングは完全に機能するので、統計テーブルを伝送する必要がない。

【００２８】輝度、クロミナンスおよび位置の値の統計分布は互いに異なるので、これらの
値は別々にコード化するのが好ましい。また、これらの3つの値のタイプを別々
に処理するために適応算術コーダが備えられている。２進列のサイズを減らすために、一改良実施例では、ベースメッシングを除い
て、ネストメッシングのメッシュトップの正確な輝度、クロミナンスおよび位置
の微分値以外の値を２進列に導入しないことが決められている。各微分値はコー
ド化される画像の対応する正確な値と、より低いレベルのネスト階層メッシング
の隣接するトップの対応する正確な値から得られる補間値との間の差を表す。

【００２９】図５には微分値を決定する実施例が示されている。この図には三角形、レベル
０が示され、その頂点A、B、Cはそれぞれ輝度値が210、150および132である。こ
の三角形は４個の同一のレベル１の三角形に細分化され、３個の新しい頂点E、F
およびGが現れ、それぞれレベル０の三角形の辺AB、ACおよびBCの中間に位置し
ている。頂点E、FおよびGの輝度値はそれぞれ182、170および143である。頂点E
、FおよびGの輝度値を隣接する頂点の値を補間することによって計算する場合は
、値180、171および141が得られる。２進列に導入した値はこの場合、正確な値
と補間値との間の差に対応して+2、-1および+2である。しかし、これらの値は事
前に定量化されており、とりうる値の数が制限されるので、次のデータ圧縮操作
の性能が高まる。

【００３０】さらに、定量化誤差が累積しないように、低いレベルの定量化値から微分値の
計算を行う。好ましい一実施例では、メッシング（トップの位置および値Y、U、V）はさら
にそれらのコーディングポテンシャルをできるだけ完全に利用するように画像の
内容に適合している。この適合は3つのレベルで行うことができる：

【００３１】・メッシングのトップの位置の最適化：ノードの位置は画像を局所的に表現する
それらの効果にしたがって変更される；・メッシングのトップの輝度およびクロミナンスの値の最適化：値Y、U、Vは元
の画像をできるだけ完全に表現するように最適化される；・メッシングのトポロジーの最適化：メッシングのトポロジーは対角線反転操作
を用いて画像を局所的に表現するメッシングの能力をさらに高めることによって
変更される。

【００３２】先に選択したメッシング構造は規則的な構造を有する。したがって、その内容
に不一致があり、特に均一領域と、トップでより高い密度を必要とするテクスチ
ャ領域とを混合する画像を表現するのに適合しないようにみえることがある。メ
ッシングのトップの位置を最適化することによって、メッシングトップの集中を
それを必要とするトップの領域に移動させることができよう。この最適化の最も早い視覚的効果はメッシングのトップが一緒に画像の物体の
物理的輪郭へ向かって運ばれることによって示される。

【００３３】この操作はベースメッシングに対応するレベル（レベル０）から始まるレベル
ごとに実施される。レベル０での最適化の結果を次にレベルn+1に伝送し、レベ
ルｎのトップの新しい位置からレベルn+1の追加トップの位置が得られる。各レ
ベルでの位置の最適化およびツリーの各種レベルへのその伝播は図７に示されて
いる。

【００３４】位置の最適化はコード化される画像と補間された画像との間の輝度偏差に対応
する基準Eを最小化して実施される。Eを計算するためには、座標(x，y，z)でz=Y
（輝度成分）の

【外２】の点qを考慮する。基準Eは以下の式で定義される：

【式８】ここで、Fはqが元の画像の点qから形成される表面と、補間された画像の点qか
ら形成される表面との間にある場合は値が１であり、それ以外の場合は値が０の
特性関数である。

【００３５】偏差Eの最小化は適応ステップ傾斜降下アルゴリズムを用いて実施される。こ
の最小化には

【外３】（ここでEは最小である、すなわち∇E（X）＝０）の点のベクトルXを探すことが含まれる。

【００３６】要するに、この最小化は以下の非線形方程式システムを解く点にある：

【式９】

【００３７】このシステムはニュートン法によって直接解くことができる。しかし、この方
法は、繰り返しの開始点が解からあまりに遠いときには集束しないことがある。
また、繰り返し処理を用いて、Eの局所的最適へ向かって集束する一組の中間位
置q₁，q₂を生成するのが好ましい。この種の繰り返し処理は以下のように行われる：トップS_oの最適位置を決定す
るために、その開始位置q_Soから始め、この点でEの勾配を計算する。∇E（q_So）
がEの最大増加方向を示すとき、量α₀は反対方向に移動し、トップS₀は新しい位
置を有する。

【００３８】

【式１０】繰り返し処理によって中間位置q₂、q₃、…qkが生成され、

【式１１】になる。

【００３９】適応ステップα_kは集束を加速するように選択されるのが有利である。適応ス
テップ傾斜降下法は偏差Eが増加（減少）するときに、ステップα_kを減少（増加
）させることで構成されているが、α_k∈［α_min,α_max］を目指すステップにサ
イズの制約がみられる。連続する偏差E間の差が最小閾値偏差より低いときに最
終位置q_n＝q_Soが得られる。同様に、メッシングの残りのトップの最適位置が計
算される。

【００４０】既に述べたように、偏差Eは実際の画像に対して計算される。改良例では、メ
ッシングレベルで「頻繁な」内容に関して類似している特定の基準画像Iに対し
て各メッシングレベルで偏差Eが計算される。したがって、ベースメッシング（
レベル０）は画像の低い頻度のアスペクトのみを表し、このレベルのトップの位
置を最適化するのに用いる基準画像も低い頻度の「頻繁な」内容を有する。この
基準画像は実際の画像をフィルタリングして得られる。

【００４１】同様に、各メッシングレベルには「頻繁な」内容がそのメッシングに適合した
基準画像が組み合わされる。この基準画像は最高のメッシングレベルに組み合わ
され、実際の画像に対応する（フィルタリングなし）。これらの基準画像を生成
するために、無限パルスレスポンスハーフバンドローパスフィルタの近似値が用
いられる：

【式１２】（ここで、Lは二段抽出ファクタである）。

【００４２】したがって、値Eを計算するために各メッシングレベルで異なる基準画像が用
いられる。メッシングトップと組み合わされる輝度およびクロミナンスの値の最適化によ
って本発明の方法の別の可能な改良が与えられる。値Y、U、Vの最適化は最少誤差二乗法によって行われ、画像の領域Ωで以下の
式で定義される基準Eを最小化することから成る：

【００４３】

【式１３】（ここで、・S_nは前記階層メッシングの指数トップnであり、・Mは前記階層メッシングのトップの合計数であり、・I（x，y）はコード化される画像の座標(x，y)のピクセルの輝度値（それぞれ
クロミナンス値UまたはV）を表し、・ΨS_nはトップS_nと組み合わされる補間関数であり、・V（S_n）はトップS_nと組み合わされる最適化輝度値（それぞれクロミナンス）
である）。

【００４４】この式が演繹される場合、最適化値はM個の式の以下の線形システムを解いて
て得られる：

【式１４】

【００４５】関数ΨS_mのコンパクト支持関数によって、式のこのシステムは以下の式で表す
こともできる：

【式１５】（ここで、・supp(S_m)はトップまたは頂点がS_mである三角形またはメッシュを示し、・ver(e)は三角形eのトップを示す）。

【００４６】方程式の上記のシステムを解くことは AX＝B （ここで、・Aは規定された正の対称行列であり、・Xはm∈［1..M］を有する最適化値V（S_m）の列行列であり、・Bはシステム（1）の右の項の値の列行列である）のタイプの行列システムを解くことと同じである。

【００４７】行列Aは正として規定された対称行列であるので、行列Aは唯一のA=LDL^t因数
分解を有し、Lは単位対角線を有するより低い三角行列を示し、Dは全ての対角係
数が厳密に正である対角行列を示す。さらに隣接する行列Aの調整は単位値を有
する。 LおよびDの係数の決定は行列のより低い三角部分に位置した係数を識別して行
うことができる：

【００４８】

【式１６】さらに、以下の式が得られる：

【式１７】

【００４９】

【式１８】次に、最適化値のマトリクスXの項を以下の式で求める：

【式１９】

【００５０】一改良実施例では、Aの分解中にメモリサイズを制限するためにAX=Bシステム
を分解するのにプロフィール法を用いることができる。プロフィール法はテーブ
ルM×Mの形での従来の行列の表現の代わりに、2つのベクトルの形での表現を用
いる。実際には、行列Aは中空である（多くのゼロを有する）ので、従来の形で
のその表現は不適当である。最近の改良例では、メッシングのトポロジーを改良することもできる。実際に
は、メッシングの局所的構造は画像の特定の特性に適合していない。適合する階
層メッシングが得られるまでメッシングを細分することは可能であるが、対角線
反転操作を実施する方が簡単であることはわかる。

【００５１】この対角線反転操作は最後のメッシングレベルで実施され、この操作は変更し
たメッシングが画像を再構築するためにより良い品質を与える場合は、前記メッ
シングレベルの２個の隣接する三角形で形成される凸状不等辺四辺形において対
角線を反転させることから成る。この対角線反転操作は凸状不等辺四辺形にのみ関与するものである。図８Ａに
は対角線反転操作が可能でない非凸状の不等辺四辺形の例が示されている。

【００５２】図８Ｂには２個の三角形T1とT2とで形成される凸状不等辺四辺形Qでの対角線
反転操作が示されている。この操作は２個の三角形T1とT2とに共通する辺を表す
対角線を反転させることから成る。反転後、不等辺四辺形Qは２個の新しい三角
形T1およびT2を含む。トポロジーを最適化する操作は次に下記ステップを含む：・最高のメッシングレベルの２個の隣接する三角形T1、T2で形成される各凸状不
等辺四辺形Qで輝度偏差Eを計算し、この輝度偏差はT1およびT2の輝度偏差の合計
の合計に等しい、E(Q)＝E(T1)+E(T2)、・２個の三角形T1とT2とに共通する辺を表す対角線を反転させて２個の新しい三
角形T1およびT2を形成し、・新しい三角形T1およびT2の輝度偏差を計算し、E(Q)＝E(T1)+E(T2)を加え、・輝度偏差の合計が最低である２個の三角形を保持する。

【図面の簡単な説明】

【図１Ａ】３つのレベルの多重メッシングを示す。

【図１Ｂ】１つの三角形T1の４つの低いレベルの三角形への細分化を示す。

【図２】図１Ｂの三角形T1と組み合わされたツリー部分を示す。

【図３】多重メッシングと組み合わされたツリー構造を示す。

【図４】２進列に導入されるツリーの部分を示す。

【図５】定量化の後に２進列に導入される微分値の決定を示す。

【図６】算術圧縮操作を示す。

【図７】メッシングレベルのトップの位置の最適化およびより高いメッシングレベルで
のその伝播を示す。

【図８Ａ】対角線反転操作が除外される場合を示す。

【図８Ｂ】対角線反転操作が可能な場合を示す。

【手続補正書】特許協力条約第３４条補正の翻訳文提出書

【提出日】平成１２年９月１４日（２０００．９．１４）

【手続補正１】

【補正対象書類名】明細書

【補正対象項目名】全文

【補正方法】変更

【補正内容】

【発明の名称】３次元メッシュネットワークの圧縮およびコーディング

【特許請求の範囲】

【式１】（ここで、・S_nは前記階層メッシングの指数トップnであり、・Mは前記階層メッシングのトップの合計数であり、・I（x，y）はコード化される画像の座標(x，y)のピクセルの輝度値（それぞれ
クロミナンス値UまたはV）を表し、・ΨS_nはトップS_nと組み合わされる補間関数であり、・V（S_n）はトップS_nと組み合わされる最適化輝度値（それぞれクロミナンス）
である）。

【式２】（ここで、・supp(S_m)はトップがS_mであるメッシュを示し、・ver(e)はメッシュeのトップを示す）。

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、フローレイトの削減（圧縮）による静止画または動画のコーディン
グ分野に関する。

【０００２】

【従来の技術】画像を圧縮する技術は従来、ビデオ数値信号のフローレイトを削減し、それら
を伝送または記憶するのに用いられている。第１の応用において提案されるコー
ディング法は特に、低いフローレイトの伝送およびフローレイトの保証が全くな
い伝送、例えばIPプロトコル（インターネットプロトコル）によって行われる伝
送に適合している。静止画または動画をフローレイトを削減してコーディングする方法は多数あり
、最もよく知られている方法は規格、例えばISO-JPEGまたはISO-MPEGとなった方
法である。

【０００４】

【発明が解決しようとする課題】しかし、これらの従来の方法には主として画像の内容およびそれらの純粋に数
値的な性格を考慮しない方法の使用によって生じるいくつかの制限がある：・離散コサイン変換の場合に画像の輪郭近くに現れるブロック効果に起因するリ
ンギング、これらのリンギングは低いフローレイトのウェーブレットの場合にも
現れる；・これらの方法は動画（MPEG）の場合には２つの画像間の動きの補償を決定した
り、合成画像を自然の背景に合成するのに従来用いられる幾何学的処理（相似変
換等）に十分に適合していない。

【０００６】さらに、「Progressive coding of 3-D graphic models」（IEEEの会報、1998
年6月、第86版、第6号、1052-1053頁）という文献に記載されているように複数
のネストメッシングを含む階層メッシングを用いるコーディング法がある。この
方法は近傍基準に基づくもので、近傍と同一平面上の重要ではない辺と、近傍と
はかなり異なる視覚的に重要な辺とを区別する。位置の値は辺の属性としてコー
ド化される。コーディング法の終了時のビットの数を制限するために、メッシン
グの構造データおよびメッシングのトップの属性はテーブルを参照してコード化
される。本発明の一目的は上記の欠点を減らす別のコーディング法を提供するこ
とにある。

【０００７】

【課題を解決する手段】本発明の目的は数値画像をコード化し、前記画像を表す２進列を生成し、２進
列の長さが表現の所望の品質に依存する方法において、 a) コード化される画像領域に、メッシュトップが前記画像のピクセルである複
数のネストメッシングを含む階層メッシングを規定し、 b)前記階層メッシングの各メッシュに対して、コード化される画像と、該メッシ
ュが属するネストメッシングのトップから得られる補間画像との間の輝度偏差を
決定し、 c)輝度偏差が閾値偏差より大きいメッシュのトップの位置、輝度およびクロミナ
ンスの値を２進列に導入するステップを含むことを特徴とする方法にある。

【０００８】

【発明の実施の形態】階層メッシングはより粗いベースを用いるメッシングのメッシュを規則的かつ
連続的に細分化して得られるのが好ましい。メッシュのトップのクロミナンス値、輝度値および位置の値をより容易に処理
するために、本発明の方法は前記階層メッシングと組み合わされるツリー構造を
具体化するステップをさらに含むのが有利である。本発明の一実施例では、ステップc)は数回繰り返され、閾値偏差がだんだん小
さくなり、各繰り返しにおいてビットのグループが生成され、表現の品質が向上
する。

【０００９】２進列のサイズを減らすためにまず、２進列に導入される値を定量化および圧
縮操作する。最後に、別の実施例では、多重メッシングのトップの位置および対応するクロ
ミナンスおよび輝度の値を最適化し、２進列の表現の品質をさらに高めることも
できる。本発明の他の特性および利点は、添付図面を参照して下記の詳細な説明を読め
ば明らかになるであろう。

【００１０】

【実施例】以下の説明では、コード化される画像のピクセルが横座標xおよび縦座標yによ
って空間内に指定されると考える。輝度成分Yおよび２つの色彩成分UおよびVが
各ピクセルと組み合わされている。成分Y、UおよびVの代わりに比色成分RVB、HS
Vを用いることも可能である。

【００１１】本発明の方法の第１ステップa)ではまず、コード化される画像領域に、複数の
ネストメッシングを含む１つの階層メッシングが定義される。前記メッシングの
メッシュのトップはコード化される画像のピクセルである。この階層メッシング
は例えばより粗いベースメッシングのメッシュを規則的に連続して細分化するこ
とによって得られる。前記メッシングと組み合わされるツリーのノードと混同し
ないように、メッシング「ノード」という用語は使用しない点に注意しなくては
ならない。

【００１２】３個のネストメッシュを含む三角形階層メッシュの例が図１Ａに図示されてい
る。このメッシュは、10個のメッシュと８個のメッシュトップを有する。図１Ａの太い実線で表されたベースメッシングはそのメッシュトップの規則的
なスタガー分布を示している。規則的なトポロジーによって三角形を画像上にう
まく配置することができる。このトポロジーは演繹的にコード化される画像の内
容が知られていないときに最も適している。このベースメッシングで規定された
三角形はレベル０の三角形に対応する。

【００１３】図１Ａのメッシングの例では、レベル０の三角形は４個の同一の三角形、レベ
ル１に細分化される。この細分化は図の細い実線で示されている。図１Ｂには、親の三角形T₁がより高いレベルの４個の子の三角形T₁₁、T₁₂、T₁ ₃ 、T₁₄に細分化されるのが示されている。最後に、レベル１の三角形は４個の三角形、レベル２に細分化される。この新
たな細分化は図１Ａの破線で表されている。この階層メッシングによって高い精
度を有する、したがってネストメッシングの数に比例して向上する品質を有する
画像を表すことができよう。各ネストメッシングは階層メッシングの１つのメッ
シングレベルに対応する。

【００１４】あるメッシュトップは複数のメッシングレベルに属し、これは例えば画像の左
上側ピクセルが３つのメッシングレベルに対して１つの三角形の頂点を構成する
場合である。一方では、各三角形は唯一のメッシングレベル（唯一のネストメッ
シング）にリンクされる。メッシングの各トップは画像のマークに１つの位置を
有し、輝度YおよびクロミナンスU、V情報の中心である。

【００１５】生成されたメッシングによって、メッシングレベルで単一の三角形を画像の各
ピクセルと組み合わせることができる。画像のピクセルの輝度およびクロミナン
スの値の近似値は組み合わされる三角形の頂点の対応する値から補間することに
よって得ることができる。本明細書で用いる補間モデルはラグランジュモデルである。これは以下の式で
定義される細分基底関数を含む：

【００１６】

【式３】（ここで、eは頂点i、j、kを有する三角形である）

【００１７】座標(x，y)の点をpおよび点pの補間された輝度V_YおよびクロミナンスV_Uおよび
V_Vの値を含むベクトル

【式４】で示す場合、ベクトル

【外１】は以下の式で定義される：

【式５】

【００１８】本発明（細分補間）の場合は、値Ψ_i ^e(x，y)、Ψ_j ^e(x，y)およびΨ_k ^e(x，y)は
三角形eにおける点pの重心座標を表す。これらの座標は以下の式で表される：

【００１９】メッシングステップ終了時に、ツリー構造を前記階層メッシングと組み合わせ
て構成し、メッシュトップの値を操作するのが有利である。ツリーはメッシング
レベル（またはネストメッシング）の数と同じ数のレベルを有する。ツリーの各
レベルは対応するメッシングレベルにおける三角形の数と同じ数のノードを有す
る。ツリーの各ノードは階層メッシングの単一の三角形に関連する。したがって
、三角形T₁およびその４個の子の三角形T₁₁、T₁₂、T₁₃、T₁₄に関連するツリーの
部分は図２に示されている。三角形T₁が多重メッシングのレベルnに属する場合
は、ツリーのレベルnに対応する１つのノードおよび、各ノードが子の三角形T₁₁ 、T₁₂、T₁₃、T₁₄の１つに関連するレベルn+1に対応する４つの子のノードが形成
される。

【００２０】三角形T₁、T₁₁、T₁₂、T₁₃およびT₁₄の頂点はそれぞれABC、AEF、BEG、FGCおよ
びEFGである。三角形T₁に関連するノードは点A、BまたはCの１つを頂点として有
する他の三角形と、頂点A、BおよびCの位置、輝度およびクロミナンスの値を共
有し、冗長値を記憶しないようにする。同様に、点E、F、Gの値は三角形T₁₁、T₁ ₂ 、T₁₃、T₁₄に関連するノードに分布される。

【００２１】階層メッシングの全ての三角形に対して１つのノードが同じ方法で形成される
場合は、図３に示すように１つのツリーが得られ、このツリーのルートはベース
メッシングの三角形の数と同じ数の複数のノードを含んでいる。ツリーが構成されると、残るは画像の２進列の代表に導入されるツリーのデー
タを決定することである。この決定は表現の所望の品質に依存する。この決定を
実施するためには、ステップb)にしたがって階層メッシングの各三角形に対して
、コード化される画像と、そのメッシュが属するネストメッシングのトップから
得られる補間画像との間の輝度偏差を計算する。ステップc)では、次にこの偏差を各三角形に対する閾値偏差と比較する。閾値
偏差の値は表現の所望の品質に依存する。次に、輝度偏差が閾値偏差より大きい
三角形に関連するツリーの部分を２進列に導入する。

【００２２】実際には、決定は以下のように実施される：ツリーの各ノードに対して、対応
する三角形の輝度偏差を計算し、次にこのノードと組み合わされる三角形の輝度
偏差が閾値偏差より小さいか、大きいかに応じて値０または１をそれらに加える
。図４はこのステップを示している。最初に、２進列に導入されるツリーの部分
をデコーダによって再構成することを可能にするシーケンス、すなわちシーケン
ス11101110000000011が２進列に導入され、次に上記シーケンスにおいて１を有
するノードに含まれる値が２進列に導入される。

【００２３】この方法の過程で閾値が減少し、コーディングを段階的に進行させることがで
きるのが有利である。したがって、好ましい実施例では、ステップc)は数回繰り
返され、閾値偏差がだんだん小さくなり、各繰り返しにおいてビットの追加のグ
ループが生成され、表現の品質が向上する。冗長度の全くない最終２進列を構築
するために、基準テーブルが用いられ、このテーブルではノードの値が既にビッ
ト列に導入されたか否かを示す値０または１がツリーの各ノードと組み合わされ
る。テーブルの値はノードの値がビット列に導入されると更新される。したがっ
て、閾値偏差が減少するとき、ビット列に導入されることが求められるノード値
が既にそこにはないことを確かめるための検査が行われる。これによって、閾値
偏差の低減に対応するツリーの追加部分のみをビット列に導入することができる
。

【００２４】したがって、高品質の表現が要求されないときは、最も高い閾値偏差で得られ
た２進列の第１の部分のみを利用することができる。ある程度の品質の表現を得
るためには、２進列のより大きな部分を利用する必要があろう。

【００２５】改良実施例では、トップの値を２進列に導入する前に定量化および圧縮して２
進列のサイズを制限することができる。定量化は不均一になるように選択するの
が好ましい。定量化は例えば輝度値（それぞれクロミナンスおよび位置）の統計
分布を利用することができる。このために、処理される画像の輝度値のヒストグ
ラム（グレーのレベル）をモデル化する。このヒストグラムは一般にほとんど拡
張されず、一般化されたガウスと同化させることができる。平均値および標準偏
差を計算し、不規則な区間の数を固定した後で、各区間I_iに対して最適な定量化
値V_iを計算する。この値は基準Dを最小化して得られる。この基準Dは以下の式で
定義される：

【００２６】

【００２７】定量化ステップの最後に、定量化微分値にデータ圧縮操作を行い、２進列の長
さを制限する。圧縮は本発明の場合は最良の圧縮率を有する算術および適応コー
ダによって実施されるのが有利である。算術コーディング（または算術圧縮）の一般法則は以下の通り：記号で形成さ
れる各メッセージは０〜１の実数の区間で表される。記号の出現の可能性が高け
れば高いほど、その表現区間は大きくなる。算術コーディングはPascal Plumeに
よる「Data Compression」（出版元：Eyrolles）pp 111-168という文献に詳細に
説明されている。

【００２８】さらに、適応コーディングは圧縮ステップ中に記号のコーディングを、その出
現頻度にしたがって徐々に適合させることで構成されている。したがって、記号
が圧縮開始時に５ビットでコード化される場合は、圧縮の別のステップで、この
同じ記号をその出現頻度が高いか、低いかに応じて１または８ビットでコード化
することができる。圧縮のどの時点においても、最も頻度の高い記号が最低の数
のビットでコード化される。当然、この方法では圧縮を実施するコーダの部分お
よび解凍を実施するデコーダの部分が並行にかつ均一に機能する必要がある。こ
の種のコーディングでは、コーダおよびデコーダは全ての記号が同程度に確から
しい所定の統計テーブルから始まる。圧縮中に徐々に、コーダはテーブルを更新
する。実際には、デコーダは解凍中にそのテーブルを用いて同じことを行う。更
新するアルゴリズムがコーダおよびデコーダで同一である限り、この種のコーデ
ィングは完全に機能するので、統計テーブルを伝送する必要がない。

【００２９】輝度、クロミナンスおよび位置の値の統計分布は互いに異なるので、これらの
値は別々にコード化するのが好ましい。また、これらの3つの値のタイプを別々
に処理するために適応算術コーダが備えられている。２進列のサイズを減らすために、一改良実施例では、ベースメッシングを除い
て、ネストメッシングのメッシュトップの正確な輝度、クロミナンスおよび位置
の微分値以外の値を２進列に導入しないことが決められている。各微分値はコー
ド化される画像の対応する正確な値と、より低いレベルのネスト階層メッシング
の隣接するトップの対応する正確な値から得られる補間値との間の差を表す。

【００３０】図５には微分値を決定する実施例が示されている。この図には三角形、レベル
０が示され、その頂点A、B、Cはそれぞれ輝度値が210、150および132である。こ
の三角形は４個の同一のレベル１の三角形に細分化され、３個の新しい頂点E、F
およびGが現れ、それぞれレベル０の三角形の辺AB、ACおよびBCの中間に位置し
ている。頂点E、FおよびGの輝度値はそれぞれ182、170および143である。頂点E
、FおよびGの輝度値を隣接する頂点の値を補間することによって計算する場合は
、値180、171および141が得られる。２進列に導入した値はこの場合、正確な値
と補間値との間の差に対応して+2、-1および+2である。しかし、これらの値は事
前に定量化されており、とりうる値の数が制限されるので、次のデータ圧縮操作
の性能が高まる。

【００３１】さらに、定量化誤差が累積しないように、低いレベルの定量化値から微分値の
計算を行う。好ましい一実施例では、メッシング（トップの位置および値Y、U、V）はさら
にそれらのコーディングポテンシャルをできるだけ完全に利用するように画像の
内容に適合している。この適合は3つのレベルで行うことができる：

【００３２】・メッシングのトップの位置の最適化：ノードの位置は画像を局所的に表現する
それらの効果にしたがって変更される；・メッシングのトップの輝度およびクロミナンスの値の最適化：値Y、U、Vは元
の画像をできるだけ完全に表現するように最適化される；・メッシングのトポロジーの最適化：メッシングのトポロジーは対角線反転操作
を用いて画像を局所的に表現するメッシングの能力をさらに高めることによって
変更される。

【００３３】先に選択したメッシング構造は規則的な構造を有する。したがって、その内容
に不一致があり、特に均一領域と、トップでより高い密度を必要とするテクスチ
ャ領域とを混合する画像を表現するのに適合しないようにみえることがある。メ
ッシングのトップの位置を最適化することによって、メッシングトップの集中を
それを必要とするトップの領域に移動させることができよう。この最適化の最も早い視覚的効果はメッシングのトップが一緒に画像の物体の
物理的輪郭へ向かって運ばれることによって示される。

【００３４】この操作はベースメッシングに対応するレベル（レベル０）から始まるレベル
ごとに実施される。レベル０での最適化の結果を次にレベルn+1に伝送し、レベ
ルｎのトップの新しい位置からレベルn+1の追加トップの位置が得られる。各レ
ベルでの位置の最適化およびツリーの各種レベルへのその伝播は図７に示されて
いる。

【００３５】位置の最適化はコード化される画像と補間された画像との間の輝度偏差に対応
する基準Eを最小化して実施される。Eを計算するためには、座標(x，y，z)でz=Y
（輝度成分）の

【００３６】偏差Eの最小化は適応ステップ傾斜降下アルゴリズムを用いて実施される。こ
の最小化には

【００３７】要するに、この最小化は以下の非線形方程式システムを解く点にある：

【式９】

【００３８】このシステムはニュートン法によって直接解くことができる。しかし、この方
法は、繰り返しの開始点が解からあまりに遠いときには集束しないことがある。
また、繰り返し処理を用いて、Eの局所的最適へ向かって集束する一組の中間位
置q₁，q₂を生成するのが好ましい。この種の繰り返し処理は以下のように行われる：トップS_oの最適位置を決定す
るために、その開始位置q_Soから始め、この点でEの勾配を計算する。∇E（q_So）
がEの最大増加方向を示すとき、量α₀は反対方向に移動し、トップS₀は新しい位
置を有する。

【００３９】

【式１１】になる。

【００４０】適応ステップα_kは集束を加速するように選択されるのが有利である。適応ス
テップ傾斜降下法は偏差Eが増加（減少）するときに、ステップα_kを減少（増加
）させることで構成されているが、α_k∈［α_min,α_max］を目指すステップにサ
イズの制約がみられる。連続する偏差E間の差が最小閾値偏差より低いときに最
終位置q_n＝q_Soが得られる。同様に、メッシングの残りのトップの最適位置が計
算される。

【００４１】既に述べたように、偏差Eは実際の画像に対して計算される。改良例では、メ
ッシングレベルで「頻繁な」内容に関して類似している特定の基準画像Iに対し
て各メッシングレベルで偏差Eが計算される。したがって、ベースメッシング（
レベル０）は画像の低い頻度のアスペクトのみを表すので、このレベルのトップ
の位置を最適化するのに用いる基準画像も低い頻度の「頻繁な」内容を有する。
この基準画像は実際の画像をフィルタリングして得られる。

【００４２】同様に、各メッシングレベルには「頻繁な」内容が該メッシングに適合した基
準画像が組み合わされる。最高のメッシングレベルに組み合わされるこの基準画
像は実際の画像に対応する（フィルタリングなし）。これらの基準画像を生成す
るために、無限パルスレスポンスハーフバンドローパスフィルタの近似値が用い
られる：

【式１２】（ここで、Lは二段抽出ファクタである）。

【００４３】したがって、値Eを計算するために各メッシングレベルで異なる基準画像が用
いられる。メッシングトップと組み合わされる輝度およびクロミナンスの値の最適化によ
って本発明の方法の別の可能な改良が与えられる。値Y、U、Vの最適化は最少誤差二乗法によって行われ、画像の領域Ωで以下の
式で定義される基準Eを最小化することから成る：

【００４４】

【００４５】この式が演繹される場合、最適化値はM個の式の以下の線形システムを解いて
て得られる：

【式１４】

【００４６】関数ΨS_mのコンパクト支持関数によって、式のこのシステムは以下の式で表す
こともできる：

【００４７】方程式の上記のシステムを解くことは AX＝B （ここで、・Aは規定された正の対称行列であり、・Xはm∈［1..M］を有する最適化値V（S_m）の列行列であり、・Bはシステム（1）の右の項の値の列行列である）のタイプの行列システムを解くことと同じである。

【００４８】行列Aは正として規定された対称行列であるので、行列Aは唯一のA=LDL^t因数
分解を有し、Lは単位対角線を有するより低い三角行列を示し、Dは全ての対角係
数が厳密に正である対角行列を示す。さらに隣接する行列Aの調整は単位値を有
する。 LおよびDの係数の決定は行列のより低い三角部分に位置した係数を識別して行
うことができる：

【００４９】

【式１６】さらに、以下の式が得られる：

【式１７】

【００５０】

【式１９】

【００５１】一改良実施例では、Aの分解中にメモリサイズを制限するためにAX=Bシステム
を分解するのにプロフィール法を用いることができる。プロフィール法はテーブ
ルM×Mの形での従来の行列の表現の代わりに、2つのベクトルの形での表現を用
いる。実際には、行列Aは中空である（多くのゼロを有する）ので、従来の形で
のその表現は不適当である。最近の改良例では、メッシングのトポロジーを改良することもできる。実際に
は、メッシングの局所的構造は画像の特定の特性に適合していない。適合する階
層メッシングが得られるまでメッシングを細分することは可能であるが、対角線
反転操作を実施する方が簡単であることはわかる。

【００５２】この対角線反転操作は最後のメッシングレベルで実施され、この操作は変更し
たメッシングが画像を再構築するためにより良い品質を与える場合は、前記メッ
シングレベルの２個の隣接する三角形で形成される凸状不等辺四辺形において対
角線を反転させることから成る。この対角線反転操作は凸状不等辺四辺形にのみ関与するものである。図８Ａに
は対角線反転操作が可能でない非凸状の不等辺四辺形の例が示されている。

【００５３】図８Ｂには２個の三角形T1とT2とで形成される凸状不等辺四辺形Qでの対角線
反転操作が示されている。この操作は２個の三角形T1とT2とに共通する辺を表す
対角線を反転させることから成る。反転後、不等辺四辺形Qは２個の新しい三角
形T1およびT2を含む。トポロジーを最適化する操作は次に下記ステップを含む：・最高のメッシングレベルの２個の隣接する三角形T1、T2で形成される各凸状不
等辺四辺形Qで輝度偏差Eを計算し、この輝度偏差はT1およびT2の輝度偏差の合計
の合計に等しい、E(Q)＝E(T1)+E(T2)、・２個の三角形T1とT2とに共通する辺を表す対角線を反転させて２個の新しい三
角形T1およびT2を形成し、・新しい三角形T1およびT2の輝度偏差を計算し、E(Q)＝E(T1)+E(T2)を加え、・輝度偏差の合計が最低である２個の三角形を保持する。