JPH10210468A

JPH10210468A - 頂点群をデータベースとする階層的形状表現及び符号化方法並びに装置

Info

Publication number: JPH10210468A
Application number: JP9290229A
Authority: JP
Inventors: Richard Jungiang Qian; ユンイャンキアンリチャード; Muhammed Ibrahim Sezan; イブラヒムセザンムハメッド
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1996-09-18
Filing date: 1997-09-16
Publication date: 1998-08-07
Anticipated expiration: 2017-09-16
Also published as: EP0831657A3; DE69713559T2; JP3597025B2; EP0831657B1; US5838830A; DE69713559D1; EP0831657A2

Abstract

(57)【要約】【課題】頂点群をデータベースとして階層的に輪郭を
表現する新規な方法及びこの表現に基づいた階層的形状
符号化方法並びに装置を提供する。【解決手段】本方法は、注目する画像を選択するステ
ップ、注目する画像中の注目する被写体の周りの境界を
輪郭点の組みにより規定するステップ、各々関連する所
定の突出度パラメータをもち、突出度の最も大きいベー
スレイヤ３２から最も少なく突出したレイヤ４０までの
範囲で規定されているレイヤ表現３０のレイヤ数を選択
するステップ、境界における最も突出した輪郭点を識別
し、最も突出した輪郭点を最も突出したベースレイヤ３
２に入れ、次の最も突出した輪郭点を識別し次の最も突
出したレイヤ３４に入れ、選択された全てのレイヤ３２
〜４０に輪郭点を入れるステップ、レイヤ表現３０をデ
ータベースに階層的に記憶するステップを含む。

Description

【発明の詳細な説明】

【０００１】（発明の分野）本発明は、ビデオに取り込
まれた被写体（オブジェクト）の形状の表現および符号
化に関し、特に、ビデオに取り込まれた被写体（オブジ
ェクト）の形状輪郭に沿って頂点群を参照することによ
ってビデオに取り込まれた被写体（オブジェクト）を符
号化し、しかもいろいろな階層レベルで配置する頂点群
の組みを異ならせるようにしその符号化を行う方法およ
び装置に関するものである。

【０００２】（発明の背景）内容に基づいた（コンテン
トベースの）符号化や取り扱いは、実現しつつあるＭＰ
ＥＧ４規格がサポートする中心的な機能性の中の１つで
ある。この機能性は、任意の形状の画像被写体（イメー
ジオブジェクト）の表現および符号化を要求し、かかる
符号化問題をテクスチュアおよび形状（輪郭）符号化に
分け得る。

【０００３】既知の形状認識の方法は、画像およびビデ
オのデータを含むコンピュータファイルの集合をファイ
ルの種類、すなわち、ＧＩＦ、ＭＰＥＧ、およびテキス
トリファレンスによって検索するＷｅｂＳＥＥＫプログ
ラムで使用されるような方法を含んでいる。したがっ
て、システムは、ファイルを解凍し、カラーおよび／又
はテクスチュアに対するファイルの内容を分析する。画
像のミニチュア版を含むアイコンが形成され、そのアイ
コンにより特定の画像の種類を調べることができる。

【０００４】他の形状認識プログラムは、ＩＢＭ（登録
商標）製品である“画像内容による問い合わせ（ＱＢＩ
Ｃ）”として知られている。ＱＢＩＣは、カラー、コン
トラスト、きめおよび方向性について画像ファイルを調
べる。限られた形状情報だけが画像分析に役立てられ、
画像が全体として分析される。既知の方法は、非常に低
速で、資源集約的であるし、形状を評価基準とする検索
は容易に実現できない。本発明の方法および装置は、こ
れらの制限を克服することを意図してなされたものであ
る。

【０００５】（発明の要約）本発明は、新規な形状表現
及び符号化の方法を示すものである。特に、新規な階層
的輪郭表現法、およびこの表現に基づいた階層的形状符
号化アルゴリズムを開示する。かかる表現は、頂点群に
基づく（頂点群をデータベースとする）方式による、す
なわち、輪郭は輪郭上の有限の頂点群の組によって表現
される。

【０００６】この階層的形状符号化方法は、実現しつつ
あるＭＰＥＧ４規格のわく内で使用されることを目的と
している。ＭＰＥＧ４の形状符号化の中心的な実験（Ｍ
ＰＥＧ４‐ＳＣＣＥ）は、頂点選択ステップ、頂点符号
化ステップ、最新の頂点リストによる一時的予測ステッ
プ、多角形輪郭再構成ステップ及び再構成エラー符号化
からなる非階層的頂点群をデータベースとする形状符号
化方法を示している。

【０００７】本願で提案される形状符号法は、ＭＰＥＧ
４‐ＳＣＣＥにおける頂点群方式を階層的表現へ拡張し
たものとみなすことができる。しかしながら、ＭＰＥＧ
４‐ＳＣＣＥに使用された頂点選択方法を階層的な方法
で頂点を抽出するために修正したとしても、この方法は
必ずしも可視的に突出した頂点を選択しない。ＭＰＥＧ
４‐ＳＣＣＥの方法を本明細書に示した階層的な突出頂
点選択方法に置き換えることによって、可視的に突出し
た頂点を選択することになる。さらに、本発明における
頂点符号化は、それに応じた階層表現に反映するように
修正もなされる。特に、輪郭は、その各々が所定の階層
レイヤに関連している頂点群の組みによって表現されて
いる。

【０００８】本発明の方法は、注目する画像を選択し、
注目する画像の中の注目する被写体（オブジェクト）の
周りの境界を規定することであって、前記境界が、輪郭
点群の組みによって規定されていることと、各々のレイ
ヤが関連した予め定義済の突出度パラメータをもち、前
記突出度パラメータが最も突出したレイヤから最も突出
していないレイヤまでの範囲で規定されているレイヤ数
を選択することと、前記境界における最も突出した点を
特定し、かつ前記最も突出した輪郭点群を前記最も突出
したレイヤに入れることと、前記境界における次の最も
突出した輪郭点群を特定し、選択されたレイヤの全てが
各レイヤに入れられる輪郭点群を有するまで前記次の最
も突出した輪郭点群を前記次の最も突出したレイヤに入
れることと、各レイヤをデータベースに階層的に記憶す
ることを含む。

【０００９】本発明の装置は、注目する画像を含む画像
入力と、前記画像の中の注目する被写体（オブジェク
ト）を選択する分析器と、前記注目する被写体の周りの
境界およびこの境界の輪郭点群の組みを規定する操作機
構と、選択された輪郭点群を同じ突出輪郭点群の階層レ
イヤに入れる選択機構とを含む。

【００１０】本発明の目的は、被写体（オブジェクト）
ベースの画像およびビデオフレームワークにおける被写
体の定量化可能な形状の符号化を容易にする方法および
装置を提供することにある。本発明の他の目的は、画像
を各レベルが予め定義済の突出の輪郭点群を含む複数の
レベルに分割する方法を提供することにある。本発明の
さらに他の目的は、内容（コンテント）ベースのデータ
ベースに記憶された画像の高速閲覧を提供することにあ
る。本発明の他の目的は、画像中の形状による該画像の
認識を容易にする方法および装置を提供することにあ
る。本発明の他の目的および長所は、図面に関して示さ
れている下記の説明によって、明らかになる。

【００１１】（好ましい実施例の詳細な説明）本発明で
は、形状は頂点、すなわち、形状輪郭上の点によって表
現される。このような表現は頂点群をデータベースとす
る形状表現と呼ばれる。図１には、階層的頂点群をデー
タベースとする表現を決定する主要なステップを大まか
に１０として示し、注目する画像を１２として示してい
る。形状は、注目するビデオに取り込まれた被写体（Ｖ
Ｏ）１４に対応するグレイレベルが“１”の値を割り当
てられ、ビデオ画像の残りの部分１６が“０”とされる
２進形状マップによって先ず示すことができる。境界１
８は、被写体１４と残りの部分１６との間に決められ
る。輪郭をトレースするステップ２０は、注目する被写
体１４の境界１８上にある全てのピクセルの座標あるい
は輪郭点の座標を決定する。代表的な頂点Ｓ_０、Ｓ_１、
Ｓ_２‥Ｓ_ｎは、この輪郭点の組みから選択される。次の
２つのステップ、すなわち階層的頂点群選択２２および
階層的頂点群をデータベースとする形状表現２４は、以
下に詳細に記述される。

【００１２】ここで使用されるような階層という用語
は、“可視的突出度”という用語によって規定される、
すなわちビデオ被写体の輪郭を表現する際に頂点群をど
う組むかが重要な意味をもつ。ベース階層レイヤ、すな
わちレイヤ“０”で、最も突出している頂点群が決定さ
れ、その頂点群が注目する被写体の形状の最も突出した
部分の特徴をとらえる。その後のレイヤで、より少ない
突出度の点が決定される。全てのレイヤで決定された全
ての頂点群の組みは、当該ビデオ被写体の輪郭の階層的
表現を形成する。異なるレイヤに属する頂点群は異なる
可視的突出度を反映する。ベース階層レイヤに属する頂
点群は、突出している頂点群を可能な最も少ない頂点数
をもつ輪郭で表現するために使用することができる。そ
の後のレイヤの頂点群は、正確度の増した表現を得るた
めに順次付加される。

【００１３】階層表示は、各組みが、階層的頂点群選択
２２とここで呼ばれる手段で、階層表現で１つのレイヤ
を構成する複数の頂点群の組みを選択することによって
形成される。多数の頂点による表現は、より高レベルの
突出度によるレイヤからの頂点を結合することによって
得られる。図２は、大まかに３０として示された５つの
レイヤ表現を１つの形状を例にして示す。ベースレイヤ
（レイヤ０）３２は、形状３３の最も突出している特徴
をとらえた８つの頂点（Ｓ_００−Ｓ_７０）を有する。次
に、最も突出しているレイヤ、すなわちレイヤ１（３
４）は４つの頂点（Ｓ_０１〜Ｓ_３１）を有する。図面に
おける表現は、再構成状態で結合されたレイヤを示して
いるので、より多くの頂点を付加する効果は、形状が原
形を得ていくように見えることにある。レイヤ２（３
６）およびレイヤ３（３８）は個々に頂点群の組みをも
ち、形状に付加的な特徴を加え、順次頂点群を付加し、
レイヤ４（４０）の比較的滑らかな表現がテニスプレイ
ヤーの輪郭を示しているのが分かるまでこれを続ける。
任意の指定レイヤの頂点群は、頂点群の組み（セット）
を含み、すなわち、レイヤ０はセット１における頂点群
の集合を有し、レイヤ１は、セット２における頂点群の
集合を有し、以下同様である。図２に示されるように、
図示の各レイヤは、このレイヤのセットからの頂点群並
びにより突出度の高いレイヤのレイヤセットからの頂点
群を伴う形式で示されている。

【００１４】形状表現は、画像あるいはビデオの被写体
が他の被写体から分離して符号化される場合における被
写体ベースの画像およびビデオ圧縮で使用されるもので
ある。本発明の装置５０は図３に示されている。ビデオ
入力部５２からの入力は、ブロック５４で示される分析
部で、ＶＯ１（５６ａ）、ＶＯ２（５６ｂ）…ＶＯｎ
（５６ｎ）のようなビデオ被写体（ＶＯ）５６に分析さ
れる。各ＶＯは、その形状成分５８、そのテクスチュア
成分６０、およびその動き成分６２で定義されている。
エンコーダ機構６３は、特定の形状表現、例えば、頂点
群をデータベースとする表現を符号化する形状エンコー
ダ６４を含んでいる。テクスチュアエンコーダ６６はＶ
Ｏのカラーあるいはテクスチュアの表現を符号化するの
に対して、動きエンコーダ６８はＶＯの動きの表現を符
号化する。形状エンコーダ６４で生成されたビットスト
リームにおいて、異なる階層レイヤにある頂点群は単一
のビットストリームの中に含められ、一緒に符号化され
る。代えて、各レイヤにおける頂点群を、各階層レイヤ
が別々に符号化される別個のビットストリームに含める
ことができる。異なる階層レイヤに対応する異なる組み
のセットが別個のビットストリームに入れられる場合、
選択されたレイヤの頂点群のセットは粗いレイヤからの
頂点群を使用した予測符号化ができる。

【００１５】符号化された形状、テクスチュアおよび動
きを表現する信号は、マルチプレクサ７０に伝送され、
適当な種類の伝送機構７２でデマルチプレクサ７４に、
次に、デコーダ７５に転送される。デコーダ７５は、特
定形状デコーダ７６と、テクスチュアデコーダ７８と、
動きデコーダ８０とを含んでいる。これらＶＯは、再構
成機構８２によってビデオ画像に再編成され、ビデオ出
力部８４でビデオ画像として出力する。一旦これらの信
号が符号化されると、信号はマルチプレクサ７０に伝送
するか、あるいはデータベースの中に入れることにより
その画像を高速閲覧するといった将来の使用のために、
マルチプレクサ７０に置換するか、またはマルチプレク
サ７０に加えて設けたデータベースに記憶することがで
きることを理解すべきである。この記憶された信号は後
で再構成することができる。

【００１６】本発明の方法および装置は、形状認識を容
易にし、画像の再構成に際し精細度に変化を与える。す
なわち、レイヤ０にあるこれらの輪郭点群だけを使用す
るビデオ被写体の形状の表現は、ベースレイヤ頂点群が
復号化され、被写体が再構成される場合、粗い表現によ
る画像を結果としてもたらす。より小さい突出度のレイ
ヤからの頂点群の取り込みは、より多くのビットを使用
する再構成を必要とし、より高品質の表現を結果として
もたらす。

【００１７】形状の表現としていろいろな異なる表現が
あり、２進形状マップ１２は、それだけで可能な表現で
ある。形状輪郭１８、特に、輪郭上の頂点群（Ｓ_０〜Ｓ
_ｎ）による表現は、被写体の形状を容易に記述でき、被
写体を取り扱うにあたり直接使用できる。

【００１８】階層的な頂点群をデータベースとする表現
は多数の応用にとって有利である。例えば、この表示
は、内容ベースによる画像およびビデオデータベースを
高速閲覧することを容易にする。画像被写体は、形状を
最少数の、最も突出度の高い、ともいえる頂点群で表現
されたその形状で再構成することができる。ユーザは、
最も突出した形状の表現がユーザが探しているものに合
わない場合、他の候補にスキップすることを迅速に決定
できる。したがって、ユーザは、次の候補を考慮にい
れ、照会を変更又は修正する。さもなければ、ユーザ
は、その形状情報の付加的なレイヤを使用し被写体の再
構成を要求し、被写体全体を検索するための決定を行
う。

【００１９】内容（コンテント）ベースによる画像およ
びビデオデータベースは、特に形状がデータベース中の
被写体において主要な識別子である場合、画像内容を示
す特徴の一つとして形状を直接使用することができる。
このような場合、形状は階層の多重レイヤを使用して表
現し得る。形状が閲覧中、必要に応じて除々に精緻化す
ることができる場合に、高速閲覧は、形状だけに基づい
て実行できる。形状が所望の被写体に属していると決定
された場合、この形状および関連テクスチュアは、その
被写体をユーザに提供するためにその最高の正確度で再
構成することができる。このようなデータベースにおい
て、テクスチュアは階層的な方法で表現されてもよいし
表現されなくてもよい。後者の場合、テクスチュア表現
は、形状の最高の性能のバージョンと関連付けられるこ
とになる。このような場合に、類似度を測ること、すな
わち照合の判断は階層的な方法で実行することもでき
る。例えば、照合スコアは、最も突出した頂点群を使用
して最初に計算することができる。この下位レベルで一
致が得られるかどうかの可能性について更に考察を行
う。

【００２０】階層的頂点群表現は、スケーラブル（量が
可変な）形状符号化を容易にする。実施に移されつつあ
るＭＰＥＧ４オーディオビジュアル符号化基準と併用す
ることを目的としている形状符号化方法がこの後に記述
される。ビデオ被写体は、提案された階層的輪郭表現を
使用することによってスケーラブルにすることができ
る。ビデオ被写体のためのビットストリームは、デコー
ダ７５のようなデコーダが最高レイヤから初めてレイヤ
毎に頂点を復号化できる意味で品質スケーラブルであ
る。輪郭レンダリングに対する正確度が所望の程度に到
達した場合、デコーダは復号化を中止する。また、デコ
ーダはレイヤ毎に頂点群を復号化でき、異なる空間解像
度で符号化形状を再構成するために頂点群を使用し得る
という意味で、このビットストリームが空間的にスケー
ラブルであるともいえる。デコーダは、低空間解像度で
形状を再構成するために選択でき、それは、デコーダ
は、ベースレイヤの頂点群だけを復号化することによっ
て実施することができる。したがって、デコーダは、復
号化された頂点群の座標を量子化でき、低解像度グリッ
ド上のその最も近いノードにその頂点群を配置できる。
より高い空間解像度が必要である場合、デコーダは、そ
れに応じて量子化器を調整でき、いくつかの上位レイヤ
の頂点群を復号化するために選択もできる。

【００２１】・階層的突出点群の選択方法階層的頂点群選択方法２２は、可視的突出度に基づいて
おり、フィシャー（Ｆｉｓｃｈｅｒ）およびボールズ
（Ｂｏｌｌｅｓ）著の文献「ＰｅｒｃｅｐｔｕａｌＯ
ｒｇａｎｉｚａｔｉｏｎａｎｄＣｕｒｖｅＰａｒ
ｔｉｔｉｏｎｉｎｇ，ＩＥＥＥＴｒａｎｓ．Ｐａｔ
ｔ．Ａｎａｌ．ＭａｃｈｉｎｅＩｎｔｅｌｌ．Ｖｏ
ｌ．８，Ｎｏ．１，ｐｐ１００〜１０５，１９８６．」
に記載された方法の階層的な拡張である。しかしなが
ら、本方法はより正確に輪郭表現ができる。

【００２２】この点選択方法は、突出点群の階層的抽出
ができる。各階層レイヤは予め規定された突出部に相応
する。この方法によって、ユーザは、抽出される全頂点
群のレイヤ数および各個別レイヤで頂点群の突出度を指
定できる。頂点群の突出度は、後述されるように、輪郭
点とその近くの輪郭点の弦との間の距離の測定値である
Ｄｍａｘと呼ばれるパラメータによって決定される。

【００２３】形状符号化アルゴリズムは、最大突出度に
対応するベースレイヤにある突出点群を最初に抽出す
る。その後、このアルゴリズムは、最小突出度のレイヤ
に達するまで、次々に抽出されるレイヤにおいて突出点
群を反復的に抽出する。階層的な方法の詳細は後述され
る。

【００２４】図４を参照するに、輪郭上の点群は、
Ｐ_０、Ｐ_１、．．．Ｐ_Ｎ−１として順序付けられると仮
定する。抽出された突出点は、Ｓ_０［ｊ］、Ｓ
_１［ｊ］、．．．、Ｓ_{Ｍ（ｊ）−１}［ｊ］と呼ばれる。
ここで、ｊはｊ番目のレイヤを示す。この方法には３つ
の主要なステップがある。

【００２５】ステップ１：初期化（１ａ）全レイヤ数：Ｌを選択する（１ｂ）各レイヤに対する突出度パラメータ（所定の突
出度パラメータ）を選択し、各所定の突出度パラメータ
をＤ_ｍａｘ［Ｌ］と呼ばれるアレイに記録する。ステップ２：レイヤ０（最も突出したレイヤ）の突
出点群の抽出（２ａ）任意の点、すなわち、Ｐ_ｎから開始する。Ｐ_ｎ
とＰ_ｍ＝Ｐ_ｎ＋２との間に直線を形成する。各輪郭点Ｐ
ｋと該直線との距離ｄ_ｋ（ここで、ｎ＜ｋ＜ｍである）
を計算する。ｄ_ｋから最大距離ｄ_ｍａｘ（ここで、ｎ＜
ｋ＜ｍである）を選択する。ｄ_ｍａｘ≧Ｄ_ｍａｘ［０］
ならば、Ｐ_ｍａｘをレイヤ０の突出点、すなわちＳ
_０［０］として記録し、次にステップ（２ｂ）に進む。
ｄ_ｍａｘ＜Ｄ_ｍａｘ［０］ならば、Ｐ_ｍをその次の輪郭
点、すなわちＰ_ｍ＝Ｐ_ｍ＋１に移動させ、突出点が見つ
かるまで、上記の処理を繰り返す。（２ｂ）ステップ（２ａ）でＰｎのような点を開始点と
してＳ_０［０］を使用し、次の突出点Ｓ_１［０］が見つ
かるまで、ステップ（２ａ）でこの処理を繰り返す。次
に、Ｓ_１［０］を開始点として使用し、次の突出点が見
つかるまでかあるいは処理がＳ_０［０］まで戻して検索
するまで、この処理を繰り返す。次にステップ３に進
む。

【００２６】ステップ３：レイヤｊ＞０における突
出点群の抽出（３ａ）前のレイヤにおける隣接突出点の各対、すなわ
ち、Ｓ_ｉ［ｊ−１］とＳ_ｉ＋１［ｊ−１］との間の輪郭
セグメント内で、ステップ２におけるような突出点抽出
処理を繰り返すがＤ_ｍａｘ［１］を使用する。抽出され
た突出点をＳ_０［ｊ］、Ｓ_１［ｊ］、．．．、Ｓ_Ｍ（
_ｊ）［ｊ］として記録する。（３ｂ）ｊ＝Ｌ−１まで、（３ａ）を繰り返し、中止す
る。

【００２７】突出度とパラメータＤ_ｍａｘの値との間の
関係は、図４に示される、ここでは、より大きなＤ
_ｍａｘを有するレイヤで選択された頂点群はより顕著な
形状の特性をとらえる傾向があるのに対してより小さい
Ｄ_ｍａｘを有するレイヤで選択された頂点群は形状をよ
り微細にとらえる傾向があるということが分かる。

【００２８】この方法の１つの変更された形式は、階層
的な頂点群を決定する反復精緻化法を使用するもので、
それを次に示す。ステップ１：初期化（１ａ）全レイヤ数：Ｌを選択する（１ｂ）各レイヤに対する突出度パラメータ（所定の突
出度パラメータ）を選択し、所定の突出度パラメータを
Ｄ_ｍ _ａｘ［Ｌ］と呼ばれるアレイに記録する。

【００２９】ステップ２：レイヤ０（最も突出した
レイヤ）の頂点群の抽出（２ａ）対をなす点間に最大の距離を有する輪郭上の該
点対を探す。この距離がＤ_ｍａｘ［０］よりも大きいな
らば、２点をレイヤ０における頂点と選択する。さもな
ければ、頂点が選択されなかったとして中止する。２つ
の点が頂点として選択されるならば、これらの点をライ
ンセグメントで接続する。輪郭の各側に沿って、ライン
セグメントからの最大垂直距離を有する点を探す。この
距離がＤ_ｍａｘ［０］よりも大きいならば、この点をレ
イヤ０における新しい頂点として選択する。この処理
は、Ｄ_ｍａｘ［０］よりも大きい垂直な距離を有する輪
郭点がなくなるまで、得られる各ラインセグメントに沿
って繰り返される。ステップ３：レイヤｊ＞０における頂点群の抽出（３ａ）ステップ２における頂点群選択を繰り返すが、
Ｄ_ｍａ _ｘ［０］をＤ_ｍａｘ［ｊ］と取り換える。選択さ
れた頂点はレイヤｊにおける頂点として記録される。（３ｂ）ｊ＝Ｌ−１まで（３ａ）を繰り返し、中止す
る。

【００３０】・階層的形状符号化次に、図５を参照すると、突出頂点群選択に基づいた階
層的頂点群表現を示すブロック図は大まかに２４で示さ
れている。前述のように、このような表現は階層的形状
符号化ができる。階層的形状符号化方法は、実現しつつ
あるＭＰＥＧ４規格のわく内で使用されることを目的と
している。ＭＰＥＧ４−ＳＣＣＥは、多角形頂点選択
（ｐｏｌｙｇｏｎａｌｖｅｒｔｅｘｓｅｌｅｃｔｉ
ｏｎ）ステップと、頂点符号化（ｖｅｒｔｅｘｅｎｃ
ｏｒｄｉｎｇ）ステップと、頂点リスト（ｖｅｒｔｅｘ
ｌｉｓｔ）更新による一時的予測（ｔｅｍｐｏｒａｌ
ｐｒｅｄｉｃｔｉｏｎ）ステップと、多角形輪郭再構
成（ｐｏｌｙｇｏｎａｌｃｏｎｔｏｕｒｒｅｃｏｎ
ｓｔｒｕｃｔｉｏｎ）ステップと再構成エラー符号化
（ｒｅｃｏｎｓｔｒｕｃｔｉｏｎｅｒｒｏｒｅｎｃ
ｏｒｄｉｎｇ）ステップとからなる非階層的頂点群をデ
ータベースとする形状符号化方法を述べている。

【００３１】本形状符号化方法は、ＭＰＥＧ４‐ＳＣＣ
Ｅにおける階層的方法の拡張とみなすことができる。し
かしながら、ＭＰＥＧ４‐ＳＣＣＥで使用される頂点群
選択方法は階層的方法へ変更することができたとして
も、この方法は、必ずしも可視的に突出した頂点群を選
択しない。ＭＰＥＧ４‐ＳＣＣＥの方法を図１に示され
たようなここに記載された階層的突出頂点群選択方法、
すなわちブロック２２と取り換えることによって、可視
的に突出した頂点群を選択することができる。選択され
た全頂点群はレイヤ９０に抽出されて、例えば、ｎ＞３
の場合、図５に示されるように、レイヤ間がｎ−１の間
隔をなすレイヤ９２，９４，９６および９８毎に符号化
される。さらに、本発明における頂点符号化は、階層的
表現に反映するためにそれに応じても変更もなされる。
特に、輪郭は、その各々が所定の階層的レイヤに関連す
る頂点群の組みによって表現される。各頂点はその座標
およびそのレイヤ番号によって記述される。

【００３２】・シンタックススケラーブル形状符号化方法は、頂点群をデータベース
とするのＭＰＥＧ４‐ＳＣＣＥシンタックスの拡張を必
要とする。拡張シンタックスは下記の表１〜３に示され
る。

【００３３】

【表１】

【００３４】

【表２】

【００３５】

【表３】

【００３６】上記の表において、“ｓａａｃ”は、シン
タックス適応算術符号化を示し、“ｂｓｌｂｆ”は、最
初が左ビットのバイナリストリングを示し、“ｕｉｍｓ
ｂｆ”は、最初が符号がない最上位ビット間を示し、
“ｖｉｃｌｂｆ”は、最初が可変長コードの左ビットを
示している。拡張シンタックスは、ＭＰＥＧ４−ＳＣＣ
Ｅの非階層的シンタックスと逆互換性がある。ｈｉｅｒ
ａｃｈｉｃａｌｖｅｒｔｅｘｒｅｐｒｅｓｅｎｔａ
ｔｉｏｎフラグがダウン、すなわち“１”に等しくない
ならば、シンタックスは非階層的方法を実行する。

【００３７】・スケーラブル符号化階層的頂点群表現によって、デコーダに、“正確度スケ
ーラビリティ”とみなせる機能をもたせることができ、
これは、ビットストリームを復号化する部分によっては
異なる正確度で輪郭を再構成することである。デコーダ
は、所定の正確度を得るために必要となる各頂点へのレ
イヤの番号を決定し、これを輪郭の再構成で使用する。
例えば、最少頂点数を使用する最善の可能な表現に関し
ては、デコーダは、ベースレベルの頂点群、すなわち、
最も突出した頂点だけを復号化するように選択できる。
より高い正確度に関しては、より少ない突出レベルに属
している頂点群もまた復号化される必要がある。

【００３８】デコーダは、例えば、使用可能なディスプ
レイ解像度を考慮してこの決定をすることができる。空
間的スケーラブル形状符号化を実行すべく、突出部パラ
メータＤ_ｍａｘとディスプレイ解像度との関係を規定す
ることができる。高解像度ディスプレイは、通常、形状
のより密な細部を表示するため、こうした装置に対しよ
り多くの頂点群をもつレイヤを使用するような決定をデ
コーダは行う。より多くの頂点群をもつレイヤを使用す
ることは、より小さいＤ_ｍａｘ′に関連した頂点群のレ
イヤを含むことを意味する。したがって、解像度が増す
につれて、より多くの頂点群のレイヤを含ませるために
Ｄ_ｍａｘをより小さな値を必要とするように突出度パラ
メータＤ_ｍａｘとディスプレイ解像度との関係を規定で
きる。

【００３９】空間的にスケーラブル（量が可変な）な符
号化アプリケーションでは、デコーダは、空間的に下位
の解像度のビデオ被写体を再構成し、したがって空間的
に下位の解像度のビデオ画像を再構成する。換言する
と、テクスチュアおよび形状は下位空間解像度で再構成
される。空間的にスケーラブルなデコーダでは、デコー
ダは、最低空間解像度で被写体形状を再構成する際にベ
ースレイヤ頂点群を使用できる。すなわち、頂点の座標
はＭだけ縮小される。ここに、Ｍは、水平および垂直の
寸法の両方の空間解像度の減少係数を示している。例え
ば、Ｍは、２、４、あるいは任意の整数であってもよ
い。

【００４０】品質スケーラビリティは“正確度スケーラ
ビリティ”とも呼ばれる。空間スケーラビリティはこの
方法のより一般的なステートメントであるＤ_ｍａｘパラ
メータに結びつく。内容（コンテント）スケーラブル形
状符号化は、多数のレイヤによって輪郭の重要な部分を
表すことによって得られる。輪郭の重要な部分は、人間
に対する場合の顔のような被写体の重要な部分を囲むレ
イヤの部分である。

【００４１】本発明の方法および装置の好ましい実施例
はここに開示されているけれども、修正および変更は添
付された特許請求の範囲に規定されるような発明の範囲
から逸脱しないでこれに対して行うことができることが
理解される。

【図面の簡単な説明】

【図１】本発明の方法を示すブロック図である。

【図２】本発明に使用される階層的レイヤの概略図であ
る。

【図３】本発明の装置のブロック図である。

【図４】階層的頂点選択方法におけるステップの図であ
る。

【図５】階層的形状符号化方法のブロック図である。

【符号の説明】

１２…２進形状マップ、１４…被写体（ＶＯ）、１６…
ビデオ画像の残りの部分、１８…境界、２０…輪郭トレ
ース、２２…階層的頂点群選択、２４…頂点群データベ
ースによる階層的形状表現、３０…レイヤ表現、３２…
ベースレイヤ、３３…形状、３４…レイヤ１、３６…レ
イヤ２、３８…レイヤ３、４０…レイヤ４、５０…本発
明の装置、５２…ビデオ入力部、５４…分析部、５６…
ビデオ被写体、５６ａ…ビデオオブジェクト１（ＶＯ
１）、５６ｂ…ビデオオブジェクト２（ＶＯ２）、５６
ｎ…ビデオオブジェクトｎ（ＶＯｎ）、５８…形状成
分、６０…テクスチュア成分、６２…動き成分、６３…
エンコーダ機構、６４…形状エンコーダ、６６…テクス
チュアエンコーダ、６８…動きエンコーダ、７０…マル
チプレクサ、７２…伝送機構、７４…デマルチプレク
サ、７５…デコーダ、７６…形状デコーダ、７８…テク
スチュアデコーダ、８０…動きデコーダ、８２…復号化
ビデオ被写体の再構成機構、８４…ビデオ出力部、９０
…階層的頂点群抽出、９２…レイヤ０における頂点群の
符号化、９４…レイヤ１における頂点群の符号化、９６
…レイヤ２における頂点群の符号化、９８…レイヤ（Ｎ
−１）における頂点群の符号化、Ｓ_１〜Ｓ_ｎ，Ｓ_００〜
Ｓ_７０，Ｓ_０１〜Ｓ_３１…頂点。

Claims

【特許請求の範囲】

【請求項１】頂点群をデータベースとする階層的形状
表現及び符号化方法において、注目する画像を選択するステップと、前記注目する画像の形状表現を規定するステップと、前記注目する画像中の注目する被写体と残りの部分との
境界を確定するステップと、前記注目する画像の輪郭をトレースし、前記輪郭上の輪
郭点群の全ての集まりについてその座標を決定するステ
ップと、前記輪郭点群が蓄積されるべき階層レイヤ数を決定する
ステップと、前記輪郭上の最も突出した輪郭点群を選択するステップ
と、前記最も突出した輪郭点群をベース階層レイヤに記憶す
るステップと、より突出の小さい輪郭点群を連続したより突出の小さい
輪郭点群を集めた上位の階層レイヤに記憶するステップ
と、そして、内容ベースのデータベースとして形状表現階層レイヤを
構築するステップを有してなる頂点群をデータベースと
する階層的形状表現及び符号化方法。
【請求項２】任意の前記レイヤのための突出した輪郭
点群を選択するステップが、各レイヤに対する所定の突
出度パラメータを選択し、かつ各所定の突出度パラメー
タを突出度パラメータのアレイに記録するステップ、及
び前記選択された輪郭点の双方の側にある前記輪郭点を
接続する直線からの予め選択された距離よりも大きい距
離にある前記選択された輪郭点群を捜し当てることによ
ってレイヤにおける突出した輪郭点群を抽出するステッ
プを含むことを特徴とする請求項１記載の頂点群をデー
タベースとする階層的形状表現及び符号化方法。
【請求項３】任意の前記レイヤのための突出した輪郭
点群を選択する前記ステップが、階層の頂点群を決定す
るために反復精緻化法の使用を含むことを特徴とする請
求項１記載の頂点群をデータベースとする階層的形状表
現及び符号化方法。
【請求項４】スケーラブル形状符号化ステップを含む
ことを特徴とする請求項１記載の頂点群をデータベース
とする階層的形状表現及び符号化方法。
【請求項５】頂点群をデータベースとする階層的形状
表現及び符号化方法において、注目する画像を選択するステップと、前記注目する画像中の注目する被写体の周りの境界を規
定するステップであって、前記境界が輪郭点群の組みに
よって規定されるステップと、それに関連した予め定義済の突出度パラメータをもち、
突出度パラメータが最も突出したレイヤから最も突出し
ていないレイヤまでの範囲で定義されているレイヤ数を
選択するステップと、前記境界における最も突出した輪郭点群を識別し、前記
最も突出した輪郭点群の組みを前記最も突出したレイヤ
に入れるステップと、前記境界における次の最も突出した輪郭点群を識別し、
前記選択されたレイヤの全てが輪郭点群を該レイヤに入
れられるまで前記次の最も突出した輪郭点の群の組みを
前記次の最も突出したレイヤに入れるステップと、前記全レイヤをデータベースに階層的に記憶するステッ
プとからなることを特徴とする頂点群をデータベースと
する階層的形状表現及び符号化方法。
【請求項６】前記境界を規定するステップが、２進形
状マップによって表現されるような前記注目する画像の
形状を分析するステップを含むことを特徴とする請求項
５記載の頂点群をデータベースとする階層的形状表現及
び符号化方法。
【請求項７】スケーラブル形状符号化ステップをさら
に含むことを特徴とする請求項５記載の頂点群をデータ
ベースとする階層的形状表現及び符号化方法。
【請求項８】ビデオ画像の形状表現及び符号化を提供
する装置において、注目する画像を含むビデオ入力の入力部と、前記画像中の注目する被写体を選択し、かつそこからビ
デオ被写体を形成する分析器と、前記ビデオ画像を形状成分、テクスチュア成分および動
き成分に分離し、かつ前記注目する被写体の形状成分の
周りの境界およびその境界上の輪郭点群の組みを規定す
る処理機構と、選択された輪郭点群を同じに突出した輪郭点群の階層レ
イヤに入れる選択機構と、前記ビデオ被写体の各成分を前記成分を示す信号に符号
化するエンコーダと、前記各成分を示す信号を多重化するマルチプレクサと、前記多重化された符号化信号を伝送する伝送機構と、前記多重化された符号化信号を多重分離する多重分離装
置と、前記各符号化信号を復号化するデコーダと、前記復号化された各成分信号をビデオ画像に再構成する
再構成機構と、再構成されたビデオ画像を出力するビデオ出力の出力部
とを備えていることを特徴とするビデオ画像の形状表現
及び符号化を提供する装置。
【請求項９】ビデオ被写体の表現を包含するためのデ
ータベースを備え、前記表現がビデオ被写体の少なくと
も前記最も突出したレイヤを含むことを特徴とする請求
項８記載のビデオ画像の形状表現及び符号化を提供する
装置。