JPH10210468A - 頂点群をデータベースとする階層的形状表現及び符号化方法並びに装置 - Google Patents

頂点群をデータベースとする階層的形状表現及び符号化方法並びに装置

Info

Publication number
JPH10210468A
JPH10210468A JP9290229A JP29022997A JPH10210468A JP H10210468 A JPH10210468 A JP H10210468A JP 9290229 A JP9290229 A JP 9290229A JP 29022997 A JP29022997 A JP 29022997A JP H10210468 A JPH10210468 A JP H10210468A
Authority
JP
Japan
Prior art keywords
layer
shape
contour
hierarchical
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9290229A
Other languages
English (en)
Other versions
JP3597025B2 (ja
Inventor
Richard Jungiang Qian
ユンイャン キアン リチャード
Muhammed Ibrahim Sezan
イブラヒム セザン ムハメッド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of JPH10210468A publication Critical patent/JPH10210468A/ja
Application granted granted Critical
Publication of JP3597025B2 publication Critical patent/JP3597025B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • H04N19/29Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding involving scalability at the object level, e.g. video object layer [VOL]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Processing Or Creating Images (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】 【課題】 頂点群をデータベースとして階層的に輪郭を
表現する新規な方法及びこの表現に基づいた階層的形状
符号化方法並びに装置を提供する。 【解決手段】 本方法は、注目する画像を選択するステ
ップ、注目する画像中の注目する被写体の周りの境界を
輪郭点の組みにより規定するステップ、各々関連する所
定の突出度パラメータをもち、突出度の最も大きいベー
スレイヤ32から最も少なく突出したレイヤ40までの
範囲で規定されているレイヤ表現30のレイヤ数を選択
するステップ、境界における最も突出した輪郭点を識別
し、最も突出した輪郭点を最も突出したベースレイヤ3
2に入れ、次の最も突出した輪郭点を識別し次の最も突
出したレイヤ34に入れ、選択された全てのレイヤ32
〜40に輪郭点を入れるステップ、レイヤ表現30をデ
ータベースに階層的に記憶するステップを含む。

Description

【発明の詳細な説明】
【0001】(発明の分野)本発明は、ビデオに取り込
まれた被写体(オブジェクト)の形状の表現および符号
化に関し、特に、ビデオに取り込まれた被写体(オブジ
ェクト)の形状輪郭に沿って頂点群を参照することによ
ってビデオに取り込まれた被写体(オブジェクト)を符
号化し、しかもいろいろな階層レベルで配置する頂点群
の組みを異ならせるようにしその符号化を行う方法およ
び装置に関するものである。
【0002】(発明の背景)内容に基づいた(コンテン
トベースの)符号化や取り扱いは、実現しつつあるMP
EG4規格がサポートする中心的な機能性の中の1つで
ある。この機能性は、任意の形状の画像被写体(イメー
ジオブジェクト)の表現および符号化を要求し、かかる
符号化問題をテクスチュアおよび形状(輪郭)符号化に
分け得る。
【0003】既知の形状認識の方法は、画像およびビデ
オのデータを含むコンピュータファイルの集合をファイ
ルの種類、すなわち、GIF、MPEG、およびテキス
トリファレンスによって検索するWebSEEKプログ
ラムで使用されるような方法を含んでいる。したがっ
て、システムは、ファイルを解凍し、カラーおよび/又
はテクスチュアに対するファイルの内容を分析する。画
像のミニチュア版を含むアイコンが形成され、そのアイ
コンにより特定の画像の種類を調べることができる。
【0004】他の形状認識プログラムは、IBM(登録
商標)製品である“画像内容による問い合わせ(QBI
C)”として知られている。QBICは、カラー、コン
トラスト、きめおよび方向性について画像ファイルを調
べる。限られた形状情報だけが画像分析に役立てられ、
画像が全体として分析される。既知の方法は、非常に低
速で、資源集約的であるし、形状を評価基準とする検索
は容易に実現できない。本発明の方法および装置は、こ
れらの制限を克服することを意図してなされたものであ
る。
【0005】(発明の要約)本発明は、新規な形状表現
及び符号化の方法を示すものである。特に、新規な階層
的輪郭表現法、およびこの表現に基づいた階層的形状符
号化アルゴリズムを開示する。かかる表現は、頂点群に
基づく(頂点群をデータベースとする)方式による、す
なわち、輪郭は輪郭上の有限の頂点群の組によって表現
される。
【0006】この階層的形状符号化方法は、実現しつつ
あるMPEG4規格のわく内で使用されることを目的と
している。MPEG4の形状符号化の中心的な実験(M
PEG4‐SCCE)は、頂点選択ステップ、頂点符号
化ステップ、最新の頂点リストによる一時的予測ステッ
プ、多角形輪郭再構成ステップ及び再構成エラー符号化
からなる非階層的頂点群をデータベースとする形状符号
化方法を示している。
【0007】本願で提案される形状符号法は、MPEG
4‐SCCEにおける頂点群方式を階層的表現へ拡張し
たものとみなすことができる。しかしながら、MPEG
4‐SCCEに使用された頂点選択方法を階層的な方法
で頂点を抽出するために修正したとしても、この方法は
必ずしも可視的に突出した頂点を選択しない。MPEG
4‐SCCEの方法を本明細書に示した階層的な突出頂
点選択方法に置き換えることによって、可視的に突出し
た頂点を選択することになる。さらに、本発明における
頂点符号化は、それに応じた階層表現に反映するように
修正もなされる。特に、輪郭は、その各々が所定の階層
レイヤに関連している頂点群の組みによって表現されて
いる。
【0008】本発明の方法は、注目する画像を選択し、
注目する画像の中の注目する被写体(オブジェクト)の
周りの境界を規定することであって、前記境界が、輪郭
点群の組みによって規定されていることと、各々のレイ
ヤが関連した予め定義済の突出度パラメータをもち、前
記突出度パラメータが最も突出したレイヤから最も突出
していないレイヤまでの範囲で規定されているレイヤ数
を選択することと、前記境界における最も突出した点を
特定し、かつ前記最も突出した輪郭点群を前記最も突出
したレイヤに入れることと、前記境界における次の最も
突出した輪郭点群を特定し、選択されたレイヤの全てが
各レイヤに入れられる輪郭点群を有するまで前記次の最
も突出した輪郭点群を前記次の最も突出したレイヤに入
れることと、各レイヤをデータベースに階層的に記憶す
ることを含む。
【0009】本発明の装置は、注目する画像を含む画像
入力と、前記画像の中の注目する被写体(オブジェク
ト)を選択する分析器と、前記注目する被写体の周りの
境界およびこの境界の輪郭点群の組みを規定する操作機
構と、選択された輪郭点群を同じ突出輪郭点群の階層レ
イヤに入れる選択機構とを含む。
【0010】本発明の目的は、被写体(オブジェクト)
ベースの画像およびビデオフレームワークにおける被写
体の定量化可能な形状の符号化を容易にする方法および
装置を提供することにある。本発明の他の目的は、画像
を各レベルが予め定義済の突出の輪郭点群を含む複数の
レベルに分割する方法を提供することにある。本発明の
さらに他の目的は、内容(コンテント)ベースのデータ
ベースに記憶された画像の高速閲覧を提供することにあ
る。本発明の他の目的は、画像中の形状による該画像の
認識を容易にする方法および装置を提供することにあ
る。本発明の他の目的および長所は、図面に関して示さ
れている下記の説明によって、明らかになる。
【0011】(好ましい実施例の詳細な説明)本発明で
は、形状は頂点、すなわち、形状輪郭上の点によって表
現される。このような表現は頂点群をデータベースとす
る形状表現と呼ばれる。図1には、階層的頂点群をデー
タベースとする表現を決定する主要なステップを大まか
に10として示し、注目する画像を12として示してい
る。形状は、注目するビデオに取り込まれた被写体(V
O)14に対応するグレイレベルが“1”の値を割り当
てられ、ビデオ画像の残りの部分16が“0”とされる
2進形状マップによって先ず示すことができる。境界1
8は、被写体14と残りの部分16との間に決められ
る。輪郭をトレースするステップ20は、注目する被写
体14の境界18上にある全てのピクセルの座標あるい
は輪郭点の座標を決定する。代表的な頂点S、S
2‥は、この輪郭点の組みから選択される。次の
2つのステップ、すなわち階層的頂点群選択22および
階層的頂点群をデータベースとする形状表現24は、以
下に詳細に記述される。
【0012】ここで使用されるような階層という用語
は、“可視的突出度”という用語によって規定される、
すなわちビデオ被写体の輪郭を表現する際に頂点群をど
う組むかが重要な意味をもつ。ベース階層レイヤ、すな
わちレイヤ“0”で、最も突出している頂点群が決定さ
れ、その頂点群が注目する被写体の形状の最も突出した
部分の特徴をとらえる。その後のレイヤで、より少ない
突出度の点が決定される。全てのレイヤで決定された全
ての頂点群の組みは、当該ビデオ被写体の輪郭の階層的
表現を形成する。異なるレイヤに属する頂点群は異なる
可視的突出度を反映する。ベース階層レイヤに属する頂
点群は、突出している頂点群を可能な最も少ない頂点数
をもつ輪郭で表現するために使用することができる。そ
の後のレイヤの頂点群は、正確度の増した表現を得るた
めに順次付加される。
【0013】階層表示は、各組みが、階層的頂点群選択
22とここで呼ばれる手段で、階層表現で1つのレイヤ
を構成する複数の頂点群の組みを選択することによって
形成される。多数の頂点による表現は、より高レベルの
突出度によるレイヤからの頂点を結合することによって
得られる。図2は、大まかに30として示された5つの
レイヤ表現を1つの形状を例にして示す。ベースレイヤ
(レイヤ0)32は、形状33の最も突出している特徴
をとらえた8つの頂点(S0−S0)を有する。次
に、最も突出しているレイヤ、すなわちレイヤ1(3
4)は4つの頂点(S1〜S1)を有する。図面に
おける表現は、再構成状態で結合されたレイヤを示して
いるので、より多くの頂点を付加する効果は、形状が原
形を得ていくように見えることにある。レイヤ2(3
6)およびレイヤ3(38)は個々に頂点群の組みをも
ち、形状に付加的な特徴を加え、順次頂点群を付加し、
レイヤ4(40)の比較的滑らかな表現がテニスプレイ
ヤーの輪郭を示しているのが分かるまでこれを続ける。
任意の指定レイヤの頂点群は、頂点群の組み(セット)
を含み、すなわち、レイヤ0はセット1における頂点群
の集合を有し、レイヤ1は、セット2における頂点群の
集合を有し、以下同様である。図2に示されるように、
図示の各レイヤは、このレイヤのセットからの頂点群並
びにより突出度の高いレイヤのレイヤセットからの頂点
群を伴う形式で示されている。
【0014】形状表現は、画像あるいはビデオの被写体
が他の被写体から分離して符号化される場合における被
写体ベースの画像およびビデオ圧縮で使用されるもので
ある。本発明の装置50は図3に示されている。ビデオ
入力部52からの入力は、ブロック54で示される分析
部で、VO1(56a)、VO2(56b)…VOn
(56n)のようなビデオ被写体(VO)56に分析さ
れる。各VOは、その形状成分58、そのテクスチュア
成分60、およびその動き成分62で定義されている。
エンコーダ機構63は、特定の形状表現、例えば、頂点
群をデータベースとする表現を符号化する形状エンコー
ダ64を含んでいる。テクスチュアエンコーダ66はV
Oのカラーあるいはテクスチュアの表現を符号化するの
に対して、動きエンコーダ68はVOの動きの表現を符
号化する。形状エンコーダ64で生成されたビットスト
リームにおいて、異なる階層レイヤにある頂点群は単一
のビットストリームの中に含められ、一緒に符号化され
る。代えて、各レイヤにおける頂点群を、各階層レイヤ
が別々に符号化される別個のビットストリームに含める
ことができる。異なる階層レイヤに対応する異なる組み
のセットが別個のビットストリームに入れられる場合、
選択されたレイヤの頂点群のセットは粗いレイヤからの
頂点群を使用した予測符号化ができる。
【0015】符号化された形状、テクスチュアおよび動
きを表現する信号は、マルチプレクサ70に伝送され、
適当な種類の伝送機構72でデマルチプレクサ74に、
次に、デコーダ75に転送される。デコーダ75は、特
定形状デコーダ76と、テクスチュアデコーダ78と、
動きデコーダ80とを含んでいる。これらVOは、再構
成機構82によってビデオ画像に再編成され、ビデオ出
力部84でビデオ画像として出力する。一旦これらの信
号が符号化されると、信号はマルチプレクサ70に伝送
するか、あるいはデータベースの中に入れることにより
その画像を高速閲覧するといった将来の使用のために、
マルチプレクサ70に置換するか、またはマルチプレク
サ70に加えて設けたデータベースに記憶することがで
きることを理解すべきである。この記憶された信号は後
で再構成することができる。
【0016】本発明の方法および装置は、形状認識を容
易にし、画像の再構成に際し精細度に変化を与える。す
なわち、レイヤ0にあるこれらの輪郭点群だけを使用す
るビデオ被写体の形状の表現は、ベースレイヤ頂点群が
復号化され、被写体が再構成される場合、粗い表現によ
る画像を結果としてもたらす。より小さい突出度のレイ
ヤからの頂点群の取り込みは、より多くのビットを使用
する再構成を必要とし、より高品質の表現を結果として
もたらす。
【0017】形状の表現としていろいろな異なる表現が
あり、2進形状マップ12は、それだけで可能な表現で
ある。形状輪郭18、特に、輪郭上の頂点群(S〜S
)による表現は、被写体の形状を容易に記述でき、被
写体を取り扱うにあたり直接使用できる。
【0018】階層的な頂点群をデータベースとする表現
は多数の応用にとって有利である。例えば、この表示
は、内容ベースによる画像およびビデオデータベースを
高速閲覧することを容易にする。画像被写体は、形状を
最少数の、最も突出度の高い、ともいえる頂点群で表現
されたその形状で再構成することができる。ユーザは、
最も突出した形状の表現がユーザが探しているものに合
わない場合、他の候補にスキップすることを迅速に決定
できる。したがって、ユーザは、次の候補を考慮にい
れ、照会を変更又は修正する。さもなければ、ユーザ
は、その形状情報の付加的なレイヤを使用し被写体の再
構成を要求し、被写体全体を検索するための決定を行
う。
【0019】内容(コンテント)ベースによる画像およ
びビデオデータベースは、特に形状がデータベース中の
被写体において主要な識別子である場合、画像内容を示
す特徴の一つとして形状を直接使用することができる。
このような場合、形状は階層の多重レイヤを使用して表
現し得る。形状が閲覧中、必要に応じて除々に精緻化す
ることができる場合に、高速閲覧は、形状だけに基づい
て実行できる。形状が所望の被写体に属していると決定
された場合、この形状および関連テクスチュアは、その
被写体をユーザに提供するためにその最高の正確度で再
構成することができる。このようなデータベースにおい
て、テクスチュアは階層的な方法で表現されてもよいし
表現されなくてもよい。後者の場合、テクスチュア表現
は、形状の最高の性能のバージョンと関連付けられるこ
とになる。このような場合に、類似度を測ること、すな
わち照合の判断は階層的な方法で実行することもでき
る。例えば、照合スコアは、最も突出した頂点群を使用
して最初に計算することができる。この下位レベルで一
致が得られるかどうかの可能性について更に考察を行
う。
【0020】階層的頂点群表現は、スケーラブル(量が
可変な)形状符号化を容易にする。実施に移されつつあ
るMPEG4オーディオビジュアル符号化基準と併用す
ることを目的としている形状符号化方法がこの後に記述
される。ビデオ被写体は、提案された階層的輪郭表現を
使用することによってスケーラブルにすることができ
る。ビデオ被写体のためのビットストリームは、デコー
ダ75のようなデコーダが最高レイヤから初めてレイヤ
毎に頂点を復号化できる意味で品質スケーラブルであ
る。輪郭レンダリングに対する正確度が所望の程度に到
達した場合、デコーダは復号化を中止する。また、デコ
ーダはレイヤ毎に頂点群を復号化でき、異なる空間解像
度で符号化形状を再構成するために頂点群を使用し得る
という意味で、このビットストリームが空間的にスケー
ラブルであるともいえる。デコーダは、低空間解像度で
形状を再構成するために選択でき、それは、デコーダ
は、ベースレイヤの頂点群だけを復号化することによっ
て実施することができる。したがって、デコーダは、復
号化された頂点群の座標を量子化でき、低解像度グリッ
ド上のその最も近いノードにその頂点群を配置できる。
より高い空間解像度が必要である場合、デコーダは、そ
れに応じて量子化器を調整でき、いくつかの上位レイヤ
の頂点群を復号化するために選択もできる。
【0021】・階層的突出点群の選択方法 階層的頂点群選択方法22は、可視的突出度に基づいて
おり、フィシャー(Fischer)およびボールズ
(Bolles)著の文献「Perceptual O
rganization and Curve Par
titioning,IEEE Trans.Pat
t.Anal.Machine Intell.Vo
l.8,No.1,pp100〜105,1986.」
に記載された方法の階層的な拡張である。しかしなが
ら、本方法はより正確に輪郭表現ができる。
【0022】この点選択方法は、突出点群の階層的抽出
ができる。各階層レイヤは予め規定された突出部に相応
する。この方法によって、ユーザは、抽出される全頂点
群のレイヤ数および各個別レイヤで頂点群の突出度を指
定できる。頂点群の突出度は、後述されるように、輪郭
点とその近くの輪郭点の弦との間の距離の測定値である
Dmaxと呼ばれるパラメータによって決定される。
【0023】形状符号化アルゴリズムは、最大突出度に
対応するベースレイヤにある突出点群を最初に抽出す
る。その後、このアルゴリズムは、最小突出度のレイヤ
に達するまで、次々に抽出されるレイヤにおいて突出点
群を反復的に抽出する。階層的な方法の詳細は後述され
る。
【0024】図4を参照するに、輪郭上の点群は、
、P、...PN−1として順序付けられると仮
定する。抽出された突出点は、S[j]、S
[j]、...、SM(j)−1[j]と呼ばれる。
ここで、jはj番目のレイヤを示す。この方法には3つ
の主要なステップがある。
【0025】ステップ1: 初期化 (1a)全レイヤ数:Lを選択する (1b)各レイヤに対する突出度パラメータ(所定の突
出度パラメータ)を選択し、各所定の突出度パラメータ
をDmax[L]と呼ばれるアレイに記録する。 ステップ2: レイヤ0(最も突出したレイヤ)の突
出点群の抽出 (2a)任意の点、すなわち、Pから開始する。P
とP=Pn+2との間に直線を形成する。各輪郭点P
kと該直線との距離d(ここで、n<k<mである)
を計算する。dから最大距離dmax(ここで、n<
k<mである)を選択する。dmax≧Dmax[0]
ならば、Pmaxをレイヤ0の突出点、すなわちS
[0]として記録し、次にステップ(2b)に進む。
max<Dmax[0]ならば、Pをその次の輪郭
点、すなわちP=Pm+1に移動させ、突出点が見つ
かるまで、上記の処理を繰り返す。 (2b)ステップ(2a)でPnのような点を開始点と
してS[0]を使用し、次の突出点S[0]が見つ
かるまで、ステップ(2a)でこの処理を繰り返す。次
に、S[0]を開始点として使用し、次の突出点が見
つかるまでかあるいは処理がS[0]まで戻して検索
するまで、この処理を繰り返す。次にステップ3に進
む。
【0026】ステップ3: レイヤj>0における突
出点群の抽出 (3a)前のレイヤにおける隣接突出点の各対、すなわ
ち、S[j−1]とSi+1[j−1]との間の輪郭
セグメント内で、ステップ2におけるような突出点抽出
処理を繰り返すがDmax[1]を使用する。抽出され
た突出点をS[j]、S[j]、...、SM(
j)[j]として記録する。 (3b)j=L−1まで、(3a)を繰り返し、中止す
る。
【0027】突出度とパラメータDmaxの値との間の
関係は、図4に示される、ここでは、より大きなD
maxを有するレイヤで選択された頂点群はより顕著な
形状の特性をとらえる傾向があるのに対してより小さい
maxを有するレイヤで選択された頂点群は形状をよ
り微細にとらえる傾向があるということが分かる。
【0028】この方法の1つの変更された形式は、階層
的な頂点群を決定する反復精緻化法を使用するもので、
それを次に示す。 ステップ1: 初期化 (1a)全レイヤ数:Lを選択する (1b)各レイヤに対する突出度パラメータ(所定の突
出度パラメータ)を選択し、所定の突出度パラメータを
ax[L]と呼ばれるアレイに記録する。
【0029】ステップ2: レイヤ0(最も突出した
レイヤ)の頂点群の抽出 (2a)対をなす点間に最大の距離を有する輪郭上の該
点対を探す。この距離がDmax[0]よりも大きいな
らば、2点をレイヤ0における頂点と選択する。さもな
ければ、頂点が選択されなかったとして中止する。2つ
の点が頂点として選択されるならば、これらの点をライ
ンセグメントで接続する。輪郭の各側に沿って、ライン
セグメントからの最大垂直距離を有する点を探す。この
距離がDmax[0]よりも大きいならば、この点をレ
イヤ0における新しい頂点として選択する。この処理
は、Dmax[0]よりも大きい垂直な距離を有する輪
郭点がなくなるまで、得られる各ラインセグメントに沿
って繰り返される。 ステップ3: レイヤj>0における頂点群の抽出 (3a)ステップ2における頂点群選択を繰り返すが、
ma [0]をDmax[j]と取り換える。選択さ
れた頂点はレイヤjにおける頂点として記録される。 (3b)j=L−1まで(3a)を繰り返し、中止す
る。
【0030】・階層的形状符号化 次に、図5を参照すると、突出頂点群選択に基づいた階
層的頂点群表現を示すブロック図は大まかに24で示さ
れている。前述のように、このような表現は階層的形状
符号化ができる。階層的形状符号化方法は、実現しつつ
あるMPEG4規格のわく内で使用されることを目的と
している。MPEG4−SCCEは、多角形頂点選択
(polygonal vertex selecti
on)ステップと、頂点符号化(vertex enc
ording)ステップと、頂点リスト(vertex
list)更新による一時的予測(temporal
prediction)ステップと、多角形輪郭再構
成(polygonal contour recon
struction)ステップと再構成エラー符号化
(reconstruction error enc
ording)ステップとからなる非階層的頂点群をデ
ータベースとする形状符号化方法を述べている。
【0031】本形状符号化方法は、MPEG4‐SCC
Eにおける階層的方法の拡張とみなすことができる。し
かしながら、MPEG4‐SCCEで使用される頂点群
選択方法は階層的方法へ変更することができたとして
も、この方法は、必ずしも可視的に突出した頂点群を選
択しない。MPEG4‐SCCEの方法を図1に示され
たようなここに記載された階層的突出頂点群選択方法、
すなわちブロック22と取り換えることによって、可視
的に突出した頂点群を選択することができる。選択され
た全頂点群はレイヤ90に抽出されて、例えば、n>3
の場合、図5に示されるように、レイヤ間がn−1の間
隔をなすレイヤ92,94,96および98毎に符号化
される。さらに、本発明における頂点符号化は、階層的
表現に反映するためにそれに応じても変更もなされる。
特に、輪郭は、その各々が所定の階層的レイヤに関連す
る頂点群の組みによって表現される。各頂点はその座標
およびそのレイヤ番号によって記述される。
【0032】・シンタックス スケラーブル形状符号化方法は、頂点群をデータベース
とするのMPEG4‐SCCEシンタックスの拡張を必
要とする。拡張シンタックスは下記の表1〜3に示され
る。
【0033】
【表1】
【0034】
【表2】
【0035】
【表3】
【0036】上記の表において、“saac”は、シン
タックス適応算術符号化を示し、“bslbf”は、最
初が左ビットのバイナリストリングを示し、“uims
bf”は、最初が符号がない最上位ビット間を示し、
“viclbf”は、最初が可変長コードの左ビットを
示している。拡張シンタックスは、MPEG4−SCC
Eの非階層的シンタックスと逆互換性がある。hier
achical vertex representa
tionフラグがダウン、すなわち“1”に等しくない
ならば、シンタックスは非階層的方法を実行する。
【0037】・スケーラブル符号化 階層的頂点群表現によって、デコーダに、“正確度スケ
ーラビリティ”とみなせる機能をもたせることができ、
これは、ビットストリームを復号化する部分によっては
異なる正確度で輪郭を再構成することである。デコーダ
は、所定の正確度を得るために必要となる各頂点へのレ
イヤの番号を決定し、これを輪郭の再構成で使用する。
例えば、最少頂点数を使用する最善の可能な表現に関し
ては、デコーダは、ベースレベルの頂点群、すなわち、
最も突出した頂点だけを復号化するように選択できる。
より高い正確度に関しては、より少ない突出レベルに属
している頂点群もまた復号化される必要がある。
【0038】デコーダは、例えば、使用可能なディスプ
レイ解像度を考慮してこの決定をすることができる。空
間的スケーラブル形状符号化を実行すべく、突出部パラ
メータDmaxとディスプレイ解像度との関係を規定す
ることができる。高解像度ディスプレイは、通常、形状
のより密な細部を表示するため、こうした装置に対しよ
り多くの頂点群をもつレイヤを使用するような決定をデ
コーダは行う。より多くの頂点群をもつレイヤを使用す
ることは、より小さいDmax′に関連した頂点群のレ
イヤを含むことを意味する。したがって、解像度が増す
につれて、より多くの頂点群のレイヤを含ませるために
maxをより小さな値を必要とするように突出度パラ
メータDmaxとディスプレイ解像度との関係を規定で
きる。
【0039】空間的にスケーラブル(量が可変な)な符
号化アプリケーションでは、デコーダは、空間的に下位
の解像度のビデオ被写体を再構成し、したがって空間的
に下位の解像度のビデオ画像を再構成する。換言する
と、テクスチュアおよび形状は下位空間解像度で再構成
される。空間的にスケーラブルなデコーダでは、デコー
ダは、最低空間解像度で被写体形状を再構成する際にベ
ースレイヤ頂点群を使用できる。すなわち、頂点の座標
はMだけ縮小される。ここに、Mは、水平および垂直の
寸法の両方の空間解像度の減少係数を示している。例え
ば、Mは、2、4、あるいは任意の整数であってもよ
い。
【0040】品質スケーラビリティは“正確度スケーラ
ビリティ”とも呼ばれる。空間スケーラビリティはこの
方法のより一般的なステートメントであるDmaxパラ
メータに結びつく。内容(コンテント)スケーラブル形
状符号化は、多数のレイヤによって輪郭の重要な部分を
表すことによって得られる。輪郭の重要な部分は、人間
に対する場合の顔のような被写体の重要な部分を囲むレ
イヤの部分である。
【0041】本発明の方法および装置の好ましい実施例
はここに開示されているけれども、修正および変更は添
付された特許請求の範囲に規定されるような発明の範囲
から逸脱しないでこれに対して行うことができることが
理解される。
【図面の簡単な説明】
【図1】本発明の方法を示すブロック図である。
【図2】本発明に使用される階層的レイヤの概略図であ
る。
【図3】本発明の装置のブロック図である。
【図4】階層的頂点選択方法におけるステップの図であ
る。
【図5】階層的形状符号化方法のブロック図である。
【符号の説明】
12…2進形状マップ、14…被写体(VO)、16…
ビデオ画像の残りの部分、18…境界、20…輪郭トレ
ース、22…階層的頂点群選択、24…頂点群データベ
ースによる階層的形状表現、30…レイヤ表現、32…
ベースレイヤ、33…形状、34…レイヤ1、36…レ
イヤ2、38…レイヤ3、40…レイヤ4、50…本発
明の装置、52…ビデオ入力部、54…分析部、56…
ビデオ被写体、56a…ビデオオブジェクト1(VO
1)、56b…ビデオオブジェクト2(VO2)、56
n…ビデオオブジェクトn(VOn)、58…形状成
分、60…テクスチュア成分、62…動き成分、63…
エンコーダ機構、64…形状エンコーダ、66…テクス
チュアエンコーダ、68…動きエンコーダ、70…マル
チプレクサ、72…伝送機構、74…デマルチプレク
サ、75…デコーダ、76…形状デコーダ、78…テク
スチュアデコーダ、80…動きデコーダ、82…復号化
ビデオ被写体の再構成機構、84…ビデオ出力部、90
…階層的頂点群抽出、92…レイヤ0における頂点群の
符号化、94…レイヤ1における頂点群の符号化、96
…レイヤ2における頂点群の符号化、98…レイヤ(N
−1)における頂点群の符号化、S〜S,S0〜
0,S1〜S1…頂点。

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 頂点群をデータベースとする階層的形状
    表現及び符号化方法において、 注目する画像を選択するステップと、 前記注目する画像の形状表現を規定するステップと、 前記注目する画像中の注目する被写体と残りの部分との
    境界を確定するステップと、 前記注目する画像の輪郭をトレースし、前記輪郭上の輪
    郭点群の全ての集まりについてその座標を決定するステ
    ップと、 前記輪郭点群が蓄積されるべき階層レイヤ数を決定する
    ステップと、 前記輪郭上の最も突出した輪郭点群を選択するステップ
    と、 前記最も突出した輪郭点群をベース階層レイヤに記憶す
    るステップと、 より突出の小さい輪郭点群を連続したより突出の小さい
    輪郭点群を集めた上位の階層レイヤに記憶するステップ
    と、そして、 内容ベースのデータベースとして形状表現階層レイヤを
    構築するステップを有してなる頂点群をデータベースと
    する階層的形状表現及び符号化方法。
  2. 【請求項2】 任意の前記レイヤのための突出した輪郭
    点群を選択するステップが、各レイヤに対する所定の突
    出度パラメータを選択し、かつ各所定の突出度パラメー
    タを突出度パラメータのアレイに記録するステップ、及
    び前記選択された輪郭点の双方の側にある前記輪郭点を
    接続する直線からの予め選択された距離よりも大きい距
    離にある前記選択された輪郭点群を捜し当てることによ
    ってレイヤにおける突出した輪郭点群を抽出するステッ
    プを含むことを特徴とする請求項1記載の頂点群をデー
    タベースとする階層的形状表現及び符号化方法。
  3. 【請求項3】 任意の前記レイヤのための突出した輪郭
    点群を選択する前記ステップが、階層の頂点群を決定す
    るために反復精緻化法の使用を含むことを特徴とする請
    求項1記載の頂点群をデータベースとする階層的形状表
    現及び符号化方法。
  4. 【請求項4】 スケーラブル形状符号化ステップを含む
    ことを特徴とする請求項1記載の頂点群をデータベース
    とする階層的形状表現及び符号化方法。
  5. 【請求項5】 頂点群をデータベースとする階層的形状
    表現及び符号化方法において、 注目する画像を選択するステップと、 前記注目する画像中の注目する被写体の周りの境界を規
    定するステップであって、前記境界が輪郭点群の組みに
    よって規定されるステップと、 それに関連した予め定義済の突出度パラメータをもち、
    突出度パラメータが最も突出したレイヤから最も突出し
    ていないレイヤまでの範囲で定義されているレイヤ数を
    選択するステップと、 前記境界における最も突出した輪郭点群を識別し、前記
    最も突出した輪郭点群の組みを前記最も突出したレイヤ
    に入れるステップと、 前記境界における次の最も突出した輪郭点群を識別し、
    前記選択されたレイヤの全てが輪郭点群を該レイヤに入
    れられるまで前記次の最も突出した輪郭点の群の組みを
    前記次の最も突出したレイヤに入れるステップと、 前記全レイヤをデータベースに階層的に記憶するステッ
    プとからなることを特徴とする頂点群をデータベースと
    する階層的形状表現及び符号化方法。
  6. 【請求項6】 前記境界を規定するステップが、2進形
    状マップによって表現されるような前記注目する画像の
    形状を分析するステップを含むことを特徴とする請求項
    5記載の頂点群をデータベースとする階層的形状表現及
    び符号化方法。
  7. 【請求項7】 スケーラブル形状符号化ステップをさら
    に含むことを特徴とする請求項5記載の頂点群をデータ
    ベースとする階層的形状表現及び符号化方法。
  8. 【請求項8】 ビデオ画像の形状表現及び符号化を提供
    する装置において、 注目する画像を含むビデオ入力の入力部と、 前記画像中の注目する被写体を選択し、かつそこからビ
    デオ被写体を形成する分析器と、 前記ビデオ画像を形状成分、テクスチュア成分および動
    き成分に分離し、かつ前記注目する被写体の形状成分の
    周りの境界およびその境界上の輪郭点群の組みを規定す
    る処理機構と、 選択された輪郭点群を同じに突出した輪郭点群の階層レ
    イヤに入れる選択機構と、 前記ビデオ被写体の各成分を前記成分を示す信号に符号
    化するエンコーダと、 前記各成分を示す信号を多重化するマルチプレクサと、 前記多重化された符号化信号を伝送する伝送機構と、 前記多重化された符号化信号を多重分離する多重分離装
    置と、 前記各符号化信号を復号化するデコーダと、 前記復号化された各成分信号をビデオ画像に再構成する
    再構成機構と、 再構成されたビデオ画像を出力するビデオ出力の出力部
    とを備えていることを特徴とするビデオ画像の形状表現
    及び符号化を提供する装置。
  9. 【請求項9】 ビデオ被写体の表現を包含するためのデ
    ータベースを備え、前記表現がビデオ被写体の少なくと
    も前記最も突出したレイヤを含むことを特徴とする請求
    項8記載のビデオ画像の形状表現及び符号化を提供する
    装置。
JP29022997A 1996-09-18 1997-09-16 頂点群をデータベースとする階層的形状符号化/復号方法並びに装置 Expired - Fee Related JP3597025B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US2627696P 1996-09-18 1996-09-18
US08/825,646 US5838830A (en) 1996-09-18 1997-04-03 Vertex-based hierarchical shape representation and coding method and apparatus
US60/026276 1997-04-03
US08/825646 1997-04-03

Publications (2)

Publication Number Publication Date
JPH10210468A true JPH10210468A (ja) 1998-08-07
JP3597025B2 JP3597025B2 (ja) 2004-12-02

Family

ID=26701022

Family Applications (1)

Application Number Title Priority Date Filing Date
JP29022997A Expired - Fee Related JP3597025B2 (ja) 1996-09-18 1997-09-16 頂点群をデータベースとする階層的形状符号化/復号方法並びに装置

Country Status (4)

Country Link
US (1) US5838830A (ja)
EP (1) EP0831657B1 (ja)
JP (1) JP3597025B2 (ja)
DE (1) DE69713559T2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100353851B1 (ko) * 2000-07-07 2002-09-28 한국전자통신연구원 파문 스캔 장치 및 그 방법과 그를 이용한 영상코딩/디코딩 장치 및 그 방법
JP2011081788A (ja) * 2009-10-01 2011-04-21 Intel Corp 階層メッシュ量子化によるメモリ効率の優れたレイトレーシング
WO2020145140A1 (ja) * 2019-01-08 2020-07-16 ソニー株式会社 情報処理装置および方法

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100501902B1 (ko) * 1996-09-25 2005-10-10 주식회사 팬택앤큐리텔 영상정보부호화/복호화장치및방법
KR100219706B1 (ko) * 1997-01-10 1999-09-01 윤종용 정점기반 형상 부호화 및 인접 프레임간 정점예측방법
US5969764A (en) * 1997-02-14 1999-10-19 Mitsubishi Electric Information Technology Center America, Inc. Adaptive video coding method
KR100373331B1 (ko) * 1997-07-02 2003-04-21 주식회사 팬택앤큐리텔 스캔 인터리빙 방법을 이용한 신축형 모양정보 부호화/복호화장치 및 방법
KR100295798B1 (ko) * 1997-07-11 2001-08-07 전주범 스케일러빌리티를구현한이진현상신호부호화장치
AU7927298A (en) * 1997-07-11 1999-02-08 France Telecom Audiovisual data decoding method
US7383504B1 (en) * 1999-08-30 2008-06-03 Mitsubishi Electric Research Laboratories Method for representing and comparing multimedia content according to rank
US6711306B1 (en) 2000-06-02 2004-03-23 Eastman Kodak Company Automatic bright window detection
GB0105518D0 (en) * 2001-03-07 2001-04-25 Telemedia Systems Ltd Scalable video library to a limited resource client device using a vector graphic representation
US20040101204A1 (en) * 2001-03-07 2004-05-27 King Tony Richard Method of processing video into an encoded bitstream
KR100523052B1 (ko) * 2002-08-30 2005-10-24 한국전자통신연구원 다중 디스플레이 방식을 지원하는 다시점 동영상의 객체 기반 부호화 장치 및 그 방법과 그를 이용한 객체 기반 송수신 시스템 및 그 방법
JP4371982B2 (ja) * 2004-11-08 2009-11-25 キヤノン株式会社 画像処理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
CN100446039C (zh) * 2006-09-13 2008-12-24 浙江大学 基于层次化视点相关模型的计算机辅助二维手绘动画方法
EP2051208A3 (en) * 2007-10-17 2017-05-24 Sony Interactive Entertainment Inc. Generating an asset for interactive entertainment using digital image capture
US20110026591A1 (en) * 2009-07-29 2011-02-03 Judit Martinez Bauza System and method of compressing video content
US8363984B1 (en) 2010-07-13 2013-01-29 Google Inc. Method and system for automatically cropping images
US9070182B1 (en) 2010-07-13 2015-06-30 Google Inc. Method and system for automatically cropping images
JP5885886B2 (ja) * 2013-06-04 2016-03-16 三菱電機株式会社 画像解析装置及び画像解析方法
WO2015047400A1 (en) 2013-09-30 2015-04-02 Hewlett-Packard Development Company, L.P. Encoding information in a graphical element of an image
CN103544683B (zh) * 2013-10-12 2016-04-20 南京理工大学 一种基于视觉皮层的夜视图像凸显轮廓提取方法
NL2017454A (en) * 2015-09-28 2017-03-30 Asml Netherlands Bv Hierarchical representation of two-dimensional or threedimensional shapes
CN109522911A (zh) * 2018-09-29 2019-03-26 北京信息科技大学 一种图像形状的编码方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3987412A (en) * 1975-01-27 1976-10-19 International Business Machines Corporation Method and apparatus for image data compression utilizing boundary following of the exterior and interior borders of objects
DE4138979C2 (de) * 1991-11-27 2003-08-07 Bosch Gmbh Robert Einrichtung zur objekt-orientierten Codierung von Bildsignalen
FR2695497A1 (fr) * 1992-09-09 1994-03-11 Philips Electronique Lab Dispositif de codage d'images fixes.
US5579471A (en) * 1992-11-09 1996-11-26 International Business Machines Corporation Image query system and method
KR0181059B1 (ko) * 1995-03-18 1999-05-01 배순훈 물체의 윤곽을 나타내기 위한 윤곽 근사장치
US5764808A (en) * 1995-10-26 1998-06-09 Motorola, Inc. Method and device for compact representation of a discrete region contour
US5764814A (en) * 1996-03-22 1998-06-09 Microsoft Corporation Representation and encoding of general arbitrary shapes

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100353851B1 (ko) * 2000-07-07 2002-09-28 한국전자통신연구원 파문 스캔 장치 및 그 방법과 그를 이용한 영상코딩/디코딩 장치 및 그 방법
JP2011081788A (ja) * 2009-10-01 2011-04-21 Intel Corp 階層メッシュ量子化によるメモリ効率の優れたレイトレーシング
US8669977B2 (en) 2009-10-01 2014-03-11 Intel Corporation Hierarchical mesh quantization that facilitates efficient ray tracing
WO2020145140A1 (ja) * 2019-01-08 2020-07-16 ソニー株式会社 情報処理装置および方法

Also Published As

Publication number Publication date
EP0831657A3 (en) 1998-09-09
DE69713559T2 (de) 2003-02-20
JP3597025B2 (ja) 2004-12-02
EP0831657B1 (en) 2002-06-26
US5838830A (en) 1998-11-17
DE69713559D1 (de) 2002-08-01
EP0831657A2 (en) 1998-03-25

Similar Documents

Publication Publication Date Title
JP3597025B2 (ja) 頂点群をデータベースとする階層的形状符号化/復号方法並びに装置
US6285788B1 (en) Method for fast return of abstracted images from a digital image database
KR101033866B1 (ko) 화상 검색 방법, 화상 특징량 부호화 방법 및 화상 특징량복호 방법
JP2001504296A (ja) 一般化された内容・スケーラブルな形状表現及び符号化方法
CN111026915A (zh) 视频分类方法、视频分类装置、存储介质与电子设备
JP2003523587A (ja) ビジュアルアテンションシステム
KR20020031015A (ko) 에지 히스토그램 빈의 비선형 양자화 및 유사도 계산
CN102017634A (zh) 重新排序的变换系数的多级表示
JP2009509215A (ja) 画像データベースでのナビゲーション、視覚化、及びクラスタ化のための相互ランク類似度空間
CN111932445A (zh) 对风格迁移网络的压缩方法及风格迁移方法、装置和系统
CN112348111A (zh) 视频中的多模态特征融合方法、装置、电子设备及介质
KR100442991B1 (ko) 트리구조의 동영상 색인 기술자를 이용한 검색장치 및 그 방법
WO2021007999A1 (zh) 视频帧处理方法及装置
CN114598883A (zh) 点云属性的预测方法、编码器、解码器及存储介质
JP2007199749A (ja) 画像検索方法及び画像検索装置
Qiu Embedded colour image coding for content-based retrieval
CN115086660B (zh) 基于点云属性预测的解码、编码方法、解码器及编码器
KR101400928B1 (ko) 히스토그램을 이용한 고속 유사도 측정 방법 및 장치
CN107870923B (zh) 图像检索方法和装置
Shah et al. Video to text summarisation and timestamp generation to detect important events
CN116561350B (zh) 一种资源生成方法及相关装置
CN113766311B (zh) 用于确定视频中的视频段数的方法及装置
Borkar et al. Content based video retrieval scheme using halftone block truncation coding
JP2000201078A (ja) デ―タ圧縮装置および方法、デ―タ伸長装置および方法、デ―タ圧縮伸長システムおよび方法、コ―ドブックの作成方法、記録媒体
JP2007306559A (ja) 画像特徴符号化方法及び画像検索方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040316

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040517

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040907

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040907

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080917

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080917

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090917

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090917

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100917

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110917

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120917

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130917

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees