JP2000339477A - 物体を表現する方法、物体を探索する方法、並びに物体を表現又は探索する装置、コンピュータプログラム、コンピュータシステム、及びコンピュータ読取り可能な記憶媒体 - Google Patents

物体を表現する方法、物体を探索する方法、並びに物体を表現又は探索する装置、コンピュータプログラム、コンピュータシステム、及びコンピュータ読取り可能な記憶媒体

Info

Publication number
JP2000339477A
JP2000339477A JP2000117958A JP2000117958A JP2000339477A JP 2000339477 A JP2000339477 A JP 2000339477A JP 2000117958 A JP2000117958 A JP 2000117958A JP 2000117958 A JP2000117958 A JP 2000117958A JP 2000339477 A JP2000339477 A JP 2000339477A
Authority
JP
Japan
Prior art keywords
descriptor
view
query
image
deriving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000117958A
Other languages
English (en)
Other versions
JP5121086B2 (ja
Inventor
Miroslaw G Bober
ミロスロフ・ジー・ボーバー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MITSUBISHI ELECTRIC INF TECHNOL CENTER EUROP BV
Mitsubishi Electric Information Technology Corp
Original Assignee
MITSUBISHI ELECTRIC INF TECHNOL CENTER EUROP BV
Mitsubishi Electric Information Technology Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MITSUBISHI ELECTRIC INF TECHNOL CENTER EUROP BV, Mitsubishi Electric Information Technology Corp filed Critical MITSUBISHI ELECTRIC INF TECHNOL CENTER EUROP BV
Publication of JP2000339477A publication Critical patent/JP2000339477A/ja
Application granted granted Critical
Publication of JP5121086B2 publication Critical patent/JP5121086B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7847Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
    • G06F16/7854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using shape
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7837Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/752Contour matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/64Three-dimensional objects
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 周知の画像データベースシステムの欠点は、
あらゆる輪郭を有するある物体のそれぞれのビューが異
なる物体として処理されるということである。 【解決手段】 静止またはビデオ画像に第1の2次元輪
郭を有して現れる物体を、画像に対応する信号を処理す
ることによって表現する、探索に使用される方法であっ
て、物体の第1の輪郭のビューデスクリプタを導出する
ことと、異なるビューの物体の輪郭の少なくとも1つの
追加のビューデスクリプタを導出することと、複数のビ
ューデスクリプタを関連付けることによって物体デスク
リプタを形成することと、を含む。 【効果】 1つの物体の複数のビューが格納されること
により、輪郭形状の完全なまたは準完全な記述が形成さ
れる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、形状を用いて静
止またはビデオ画像の物体を表現し、特に探索に使用さ
れる方法および装置に関するものである。また、この発
明は、形状表現を用いて画像の物体を探索する方法およ
び装置に関するものである。
【0002】
【従来の技術】画像に現れる物体の表現を用いて、例え
ば画像ライブラリに静止またはビデオ画像を格納するこ
とが知られている。この表現が探索方法において使用さ
れることにより、対象となる物体を含む画像を検索する
ことが可能となる。この表現は、カラー(colour)、テ
クスチャ(texture)および形状(shape)を含む物体の
あらゆる特徴に基づくことができる。
【0003】画像内の物体の形状を表現するあらゆる方
法が知られている。周知の方法には、チェインコーディ
ング、4分木方法および曲率スケール空間表現方法があ
る。
【0004】画像探索システムにおいて探索を実行する
ために、ユーザは、捜している物体のスケッチまたは画
像をシステムに提示することにより、あるいは、システ
ムに格納されている物体のビューを選択することによ
り、クエリを入力する。そして、システムは、クエリ物
体の表現を導出または取得し、適当なマッチング方法を
用いて、そのクエリ表現をデータベースに格納された画
像の表現と比較する。その最も近似して一致したもの
が、表示装置に表示される。
【0005】大抵の場合、ビデオ画像に現れる物体は、
3次元の現実の物体を2次元画像平面に投影したもので
ある。このため、画像に現れる物体の2次元形状または
輪郭は、ビューイング位置、ビューイング角度、カメラ
および光学系パラメータ等の要素によって決まる。従っ
て、物体は、異なるビューに対応する異なる輪郭を有す
ることとなる。
【0006】
【発明が解決しようとする課題】周知の画像データベー
スシステムの欠点は、あらゆる輪郭を有するある物体の
それぞれのビューが異なる物体として処理されるという
ことである。その結果、例えば、ユーザが物体Aの前方
のビューに基づいてクエリを入力するが、その物体Aが
ビデオシーケンスにおいて後方および側方のビューから
しか現れていない場合、適切に一致せず、その物体は検
索されない。
【0007】
【課題を解決するための手段】本発明は、デジタル画像
に現れる物体を表現する方法であって、その物体に対応
する複数の異なる2次元ビューの表現を導出することを
含む方法を提供する。
【0008】また、本発明は、クエリを入力すること
と、物体の画像に対応する信号を処理することにより、
クエリを物体の異なるビューの複数の表現と比較して最
も近似した一致を見つけることと、を含む物体をマッチ
ングする方法を提供する。
【0009】
【発明の実施の形態】実施の形態1.本発明の実施の形
態を、添付図面を参照して説明する。
【0010】本発明の実施の形態によるシステムを、図
1に示す。本システムは、システムの動作を制御するコ
ンピュータ等の制御装置2と、制御装置2に接続され、
画像およびテキストを含む出力を表示するモニタ等の表
示装置4と、制御装置2への命令を入力するマウス等の
ポインティングデバイス6と、を有している。また、本
システムは、複数のビデオシーケンスのデジタルバージ
ョンを格納する画像データベース8と、画像データベー
ス8に格納されたビデオシーケンスの各々に現れる物体
について、後に詳述するデスクリプタ情報を格納するデ
スクリプタデータベース10と、も有している。画像デ
ータベース8およびデスクリプタデータベース10の各
々は、制御装置2に接続されている。
【0011】本実施の形態において、システムの要素
は、画像ライブラリ等の単一サイトに設けられており、
システムの構成要素は永久的にリンクされている。
【0012】本発明の実施の形態による物体のデスクリ
プタを導出する方法について、図2および図3を参照し
て説明する。本方法では、比較的単純な形状を有する物
体、この場合は円筒状物体について説明する。
【0013】この例では、画像データベース8に格納さ
れたビデオシーケンスにおいて、円筒状物体は2回現れ
る。図2を参照すると、第1の出現において、物体の輪
郭は側方からのビューであるビュー1に対応しており、
第2の出現では、側方および上方からの透視ビューであ
るビュー3に対応している。
【0014】ここで、本方法のステップを、図3に示す
フローチャートを参照して説明する。
【0015】データベースインデクサ(indexer)は、
2つの輪郭が同じ物体のものであり、それら輪郭に対応
する3次元物体が円筒であることを認識する(ステップ
10)。ビュー1およびビュー3の各々について、曲率
スケール空間(CSS)表現を用いる形状デスクリプタ
を導出する(ステップ20)。また、データベースイン
デクサは、その物体を表していると思われるいずれかの
追加のビューを、検討中のビデオシーケンスにそれらが
現れていない場合であっても選択する(ステップ3
0)。この例では、上方からの円筒のビューであるビュ
ー2がその物体を表しているものとして選択される。そ
のビューのCSS表現もまた、取得する(ステップ4
0)。
【0016】Farzin Mokhtarian、Sadegh Abbassiおよ
びJosef Kittlerによる論文「Robustand Efficient Sha
pe Indexing through Curvature Scale Space」(Proc.
British Machine Vision Conference, pp.53-62, Edin
burgh, U.K.,1996)では、曲率スケール空間表現の方法
が述べられており、この論文の内容は引用をもって本明
細書に包含されたものとする。簡単に言えば、形状の輪
郭を表現する曲線が、その曲線を平滑化することによっ
て展開される。その曲線は、展開の多くの異なる段階で
考慮される。より具体的には、展開の各段階で、曲率関
数における曲率ゼロ交差が識別される。曲率ゼロ交差の
グラフは、展開のすべての段階からのゼロ交差を結合す
ることによって得られる。そのグラフの一方の軸は、曲
線の展開パラメータを表すσに対応し、他方の軸は、曲
線円弧長パラメータuに対応する。そして、形状は、グ
ラフの輪郭線の最大値の位置によって表される。
【0017】物体を表すビューのCSS形状表現に加え
て、物体のビューとは無関係な、物体のグローバル3D
形状パラメータを取得する(ステップ50)。この例で
は、グローバルパラメータは、現実の物体の体積であ
る。この体積はすでに知られていてもよく、あるいは、
ビデオシーケンスに現れる、寸法を近似させることがで
きる人間等の他の物体に関連して、近似させるようにし
てもよい。
【0018】グローバルパラメータおよびビュー形状デ
スクリプタを結合することにより、3D物体形状デスク
リプタを形成する(ステップ60)。
【0019】上述した方法により、画像データベース8
の画像に現れる対象となるすべての物体について、3D
物体形状デスクリプタが取得される。所定の物体に対す
るビューの数と、いずれのビューが使用されるかとは、
その物体の複雑さによって決まる。物体によっては、例
えば、体積の値が既知ではないかまたは容易に導出され
ない場合に、3D物体形状デスクリプタにグローバルパ
ラメータを有していない場合がある。各ビューは、それ
がビデオシーケンスのいずれのフレームに現れるか、お
よび、それはそのフレームのいずれの物体であるかを示
す参照ポインタを有する。例えば、物体のビューは、そ
れがフレーム1000に現れ物体番号3であることを示
すポインタを有することができる。
【0020】また、異なる形状表現方法を用いる他の実
施の形態においても、ビューの数および特徴は、使用さ
れる形状表現方法によって決まる。例えば、ビューイン
グジオメトリの変化に起因する形状の変形に影響を受け
難い方法では、必要とするビューの数は少なくなる。
【0021】デスクリプタデータベース10は、画像デ
ータベース8に格納されたビデオシーケンスの物体に対
し3D物体形状デスクリプタを格納する。
【0022】ここで、ビデオシーケンスの物体を探索す
る方法について、図4および図5を参照して説明する。
【0023】ユーザは、クエリを入力することによって
探索を開始する。クエリは、ポインティングデバイス6
を用いて表示装置4上に1つまたは複数の形状輪郭を描
くことによって入力される(ステップ62)。この例で
は、2つのクエリ輪郭100が入力されている。これら
は、クエリビューである。ユーザはまた、探索している
物体の体積を表すパラメータを入力する(ステップ6
4)。
【0024】そして、制御装置2は、それらクエリビュ
ーの各々に対しCSSビューデスクリプタを導出する
(ステップ66)。
【0025】他の実施の形態では、ユーザは、制御装置
2によって表示装置4に表示される形状のメニューから
1つまたは複数のクエリ形状を選択することによってク
エリを入力する。かかる実施の形態では、ビューデスク
リプタをデスクリプタデータベース10においてすでに
入手することができる。
【0026】クエリ体積パラメータおよびクエリビュー
デスクリプタが結合され、クエリ3D物体デスクリプタ
が形成される。
【0027】そして、システムは、クエリ物体デスクリ
プタとデスクリプタデータベース10に格納された物体
デスクリプタ(以下、モデル物体デスクリプタと言う)
との類似性を判断するマッチングプロシージャを実行す
る。デスクリプタデータベース内の各モデル物体デスク
リプタを、セレクタ205によって順次選択し(ステッ
プ68)、各モデル物体デスクリプタに対しそれぞれ順
番がくると以下のステップを実行する。
【0028】まず、グローバル類似測度(GS)を、コ
ンパレータ200により、クエリ物体デスクリプタおよ
びモデル物体デスクリプタのグローバルパラメータを用
いて取得する(ステップ70)。本実施の形態では、G
Sは、クエリ体積パラメータの、データベースから取出
されたデスクリプタのモデル体積パラメータに対する割
合を求めることにより、導出される。その割合が区域
(1/c,c)(c>1)にある場合、物体は類似して
いるとみなされ、GSは値0をとる。それ以外の場合、
GSは無限大の値をとる。cの値は、その適用法によっ
て決まる。例えば、劇映画の場合、c=5である。
【0029】クエリ物体デスクリプタとモデル物体デス
クリプタの少なくとも一方がグローバルパラメータ値を
有していない場合、GS=0となる。
【0030】GS≠0である場合、デスクリプタデータ
ベースから新たなモデル物体デスクリプタを選択する。
GS=0である場合、以下のようにビューデスクリプタ
比較を実行する(ステップ72)。
【0031】コンパレータ810において、マッチング
機能を用いてビュー類似測度を導出することにより、各
クエリビューデスクリプタを、検討中のモデル物体デス
クリプタの各ビューデスクリプタと比較する(ステップ
74)。i番目のクエリビューデスクリプタとj番目の
モデルビューデスクリプタとを比較することにより、ビ
ュー類似測度sijが得られる。
【0032】より詳細には、セレクタ600を用いてク
エリビューデスクリプタを選択し、セレクタ700を用
いてデータベースビューデスクリプタを選択する。ま
ず、第1のクエリビューに対するビューデスクリプタ
を、データベースからのモデル物体デスクリプタの各ビ
ューデスクリプタと比較する。各ペアに対し、適切なマ
ッチングアルゴリズムを用いてビュー類似値sを計算す
る。本実施の形態では、ビュー類似値sは、上述したMo
khtarian、AbbasiおよびKittlerの論文において述べら
れているマッチングアルゴリズムを用いて計算する。こ
の特定の類似測度を使用する場合、ビュー類似値が小さ
いほど、一致がより近似する。この結果、第1のクエリ
ビューに対するk個のビュー類似測度の組が得られる。
なお、kは、検討中のモデル物体デスクリプタのビュー
デスクリプタの数であり、k個の測度は、グローバルお
よびローカル類似コンバイナ820に格納される。
【0033】そして、同様に、第2のクエリビューデス
クリプタとデータベースからのモデルビューデスクリプ
タとに対し、ビュー類似値を計算し格納する。その結
果、更にk個のビュー類似測度が得られる。
【0034】各クエリビューに対し、検討中のデータベ
ースデスクリプタ値の最小ビュー類似値を選択する(ス
テップ76)。この最小値は、各クエリビューと、考慮
中の物体デスクリプタのビューの1つとの間の最も近接
した一致の測度である。この結果、p個の最小ビュー類
似値が得られる。なお、pはクエリビューの数である。
この例では、p=2である。
【0035】クエリデスクリプタと考慮中のモデル物体
デスクリプタとに対する全類似測度Sを、p個の類似値
の中央値として求める(ステップ78)。これは、すべ
てのビューを考慮して、クエリデスクリプタとモデル物
体デスクリプタとが最も近似して一致していることを表
している。このため、一方のクエリビューがデータベー
スデスクリプタのビューと近似して一致するが、他方の
クエリビューがデータベースデスクリプタのいかなるビ
ューとも近似して一致しない場合、これは、中間値によ
ってSに反映される。
【0036】上記ステップを、デスクリプタデータベー
ス8の各物体デスクリプタに対して繰返し、その結果、
n個の類似測度Sが得られる(ステップ80)。なお、
nは、デスクリプタデータベースの3D物体デスクリプ
タの数である。そして、n個の類似測度を、最も近似し
た一致を示す最低値から開始して順序付ける(ステップ
82)。その後、m個の最低値(mは、ユーザが選択し
た値か、もしくは制御装置の設定によって決定された値
である)を選択し、物体を含む対応するm個のビデオシ
ーケンスの各々からの画像を表示装置4に表示する(ス
テップ84)。
【0037】本発明によれば、1つの物体の複数のビュ
ーが格納されることにより、輪郭形状の完全なまたは準
完全な記述が形成される。検索に重要であると考えられ
るビューのみが格納される場合、表現は準完全なものと
なる。例えば、劇映画を格納する一般的なデータベース
の場合、車の前方、後方、側方および上方のビューのみ
が統合された表現として格納されるが、車の下方からの
ビューは格納されない。それは、そのビューがクエリと
して使用される可能性が低いためである。
【0038】本発明によるシステムは、例えば、画像ラ
イブラリに設けることができる。あるいは、データベー
スを、システムの制御装置から遠隔に設置し、電話線な
どの一時的なリンクによるかまたはインタネット等のネ
ットワークにより制御装置に接続することも可能であ
る。画像データベースおよびデスクリプタデータベース
を、例えば、永久記憶装置、あるいは、CD−ROMま
たはDVD等のポータブルデータ記憶媒体に設けるよう
にしてもよい。
【0039】上述したセレクタおよびコンパレータ等の
システムの構成要素は、ソフトウェア形態でもハードウ
ェア形態でも設けることができる。本発明は、コンピュ
ータシステムの形態で説明されているが、例えば専用チ
ップを使用して他の形態で実装することも可能である。
【0040】物体の2D形状を表現する方法および2つ
の形状の類似性を表す値を計算する方法の特定の例を与
えたが、そのような他の適切な方法を用いることも可能
である。
【0041】完全なまたは準完全な形状記述を構成する
あらゆるビューは、例えば、フィルムの製作者によって
与えられるようにしてもよい。例えば、車を含むフィル
ムでは、製作者は、データベースのフィルムのインデク
シング(indexing)に使用するために、その車の20の
異なるビューが撮影されるようにすることができる。あ
るいは、ビューを見つけることができるシーケンスにお
いて、物体のすべての異なるビューの間にリンクを設け
るようにしてもよく、例えば、シーケンスに現れないあ
らゆる有用なビューに対する形状を、物体の第1のビュ
ーのデータが含まれる場合に、与えるようにしてもよ
い。
【0042】本発明はまた、例えば、検査の目的で物体
の画像をマッチングするため、またはフィルタリングす
るためにも使用することも可能である。
【図面の簡単な説明】
【図1】 本発明の実施の形態によるシステムのブロッ
ク図である。
【図2】 物体のデスクリプタが取得される方法を示す
図である。
【図3】 物体のデスクリプタが取得される方法を示す
フローチャートである。
【図4】 探索する装置および方法を示す図である。
【図5】 探索方法を示すフローチャートである。
【符号の説明】
2 制御装置、4 表示装置、6 ポインティングデバ
イス、8 画像データベース、10 デスクリプタデー
タベース。

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 第1の2次元輪郭を有し、静止またはビ
    デオ画像に現れる物体を、前記画像に対応する信号を処
    理することによって、表現する方法であって、 前記物体の前記第1の輪郭のビューデスクリプタを導出
    するとともに、 異なるビューの前記物体の輪郭の少なくとも1つの追加
    のビューデスクリプタを導出するステップと、 前記複数のビューデスクリプタを関連付けることによっ
    て物体デスクリプタを形成するステップとを含む物体を
    表現する方法。
  2. 【請求項2】 前記ビューデスクリプタは、曲率スケー
    ル空間表現を用いて導出される請求項1記載の物体を表
    現する方法。
  3. 【請求項3】 前記物体の形状および/またはサイズに
    関連し、かつ、前記画像の物体のビューとは無関係であ
    る、物体のデスクリプタを導出するステップを更に含む
    請求項1又は2記載の物体を表現する方法。
  4. 【請求項4】 静止またはビデオ画像に現れる物体を表
    現する方法であって、 前記物体の形状および/またはサイズに関連し、かつ、
    前記画像の物体のビューとは無関係である、デスクリプ
    タを導出するステップを含む物体を表現する方法。
  5. 【請求項5】 前記ビューとは無関係であるデスクリプ
    タは、前記物体の体積に対応している請求項3又は4記
    載の物体を表現する方法。
  6. 【請求項6】 画像に対応する信号を処理することによ
    り、静止またはビデオ画像の物体を探索する方法であっ
    て、 物体の少なくとも1つの2次元輪郭の形態でクエリをコ
    ンピュータに入力するステップと、 前記クエリ物体のデスクリプタを導出するステップと、 前記クエリデスクリプタを、請求項1乃至4のいずれか
    1項に記載の方法に従って導出された画像の物体の格納
    されたデスクリプタと比較するステップと、 前記各デスクリプタと前記クエリデスクリプタとの比較
    がそのクエリと前記物体との類似の度合を示す、その対
    象となる物体を含む画像に対応する少なくとも1つの結
    果を選択して表示するステップとを含む物体を探索する
    方法。
  7. 【請求項7】 クエリは、物体の複数の2次元輪郭の形
    態で入力され、 クエリビューデスクリプタは、前記輪郭の各々について
    を導出され、 前記比較するステップは、前記クエリビューデスクリプ
    タの各々を、格納された各物体デスクリプタの各ビュー
    デスクリプタと比較することによって、複数のビュー類
    似値を導出する請求項1又は2記載の方法に従った請求
    項6記載の物体を探索する方法。
  8. 【請求項8】 前記ビュー類似値が分析されて、物体類
    似値を導出する請求項6記載の物体を探索する方法。
  9. 【請求項9】 前記物体デスクリプタの少なくともいく
    つかは、請求項3記載の方法に従って導出された、ビュ
    ーとは無関係であるデスクリプタを含むものであって、 ビューとは無関係であるクエリ値を入力するステップを
    含み、 前記比較するステップでは、前記クエリ値を、前記格納
    された物体デスクリプタの、ビューとは無関係であるデ
    スクリプタと比較する請求項6乃至8のいずれかに記載
    の物体を探索する方法。
  10. 【請求項10】 前記クエリデスクリプタは、前記クエ
    リ物体輪郭の曲率スケール空間表現を用いて導出される
    請求項6乃至9のいずれかに記載の物体を探索する方
    法。
  11. 【請求項11】 画像に現れる物体を、前記画像に対応
    する信号を処理することによって表現する方法であっ
    て、 前記物体に対応する複数の異なる2次元ビューの表現を
    導出するステップを含む物体を表現する方法。
  12. 【請求項12】 請求項1乃至11のいずれかに記載の
    方法を実現するために適応された装置。
  13. 【請求項13】 請求項1乃至11のいずれかに記載の
    方法を実現するためのコンピュータプログラム。
  14. 【請求項14】 請求項1乃至11のいずれかに記載の
    方法に従って動作するようプログラムされているコンピ
    ュータシステム。
  15. 【請求項15】 請求項1乃至11のいずれかに記載の
    方法を実現するコンピュータ実行可能プロセスステップ
    を格納するコンピュータ読取り可能な記憶媒体。
JP2000117958A 1999-04-29 2000-04-19 物体を表現する方法、物体を探索する方法 Expired - Fee Related JP5121086B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB9909963.2 1999-04-29
GB9909963A GB2349493B (en) 1999-04-29 1999-04-29 Method of representing an object using shape

Publications (2)

Publication Number Publication Date
JP2000339477A true JP2000339477A (ja) 2000-12-08
JP5121086B2 JP5121086B2 (ja) 2013-01-16

Family

ID=10852535

Family Applications (4)

Application Number Title Priority Date Filing Date
JP2000117958A Expired - Fee Related JP5121086B2 (ja) 1999-04-29 2000-04-19 物体を表現する方法、物体を探索する方法
JP2000615922A Pending JP2002543526A (ja) 1999-04-29 2000-04-28 形状を利用してオブジェクトを表現しかつ検索する方法と装置
JP2009279841A Pending JP2010055651A (ja) 1999-04-29 2009-12-09 形状を利用してオブジェクトを表現しかつ検索する方法と装置
JP2011021726A Pending JP2011096286A (ja) 1999-04-29 2011-02-03 画像または画像シーケンス内のオブジェクトを検索する方法と装置

Family Applications After (3)

Application Number Title Priority Date Filing Date
JP2000615922A Pending JP2002543526A (ja) 1999-04-29 2000-04-28 形状を利用してオブジェクトを表現しかつ検索する方法と装置
JP2009279841A Pending JP2010055651A (ja) 1999-04-29 2009-12-09 形状を利用してオブジェクトを表現しかつ検索する方法と装置
JP2011021726A Pending JP2011096286A (ja) 1999-04-29 2011-02-03 画像または画像シーケンス内のオブジェクトを検索する方法と装置

Country Status (8)

Country Link
US (3) US7362921B1 (ja)
EP (4) EP2312472A1 (ja)
JP (4) JP5121086B2 (ja)
KR (4) KR100874787B1 (ja)
CN (4) CN100430935C (ja)
AU (1) AU4766900A (ja)
GB (2) GB2349493B (ja)
WO (1) WO2000067151A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011096286A (ja) * 1999-04-29 2011-05-12 Mitsubishi Electric R&D Centre Europe Bv 画像または画像シーケンス内のオブジェクトを検索する方法と装置

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2393012B (en) * 1999-07-05 2004-05-05 Mitsubishi Electric Inf Tech Representing and searching for an object in an image
GB2352076B (en) * 1999-07-15 2003-12-17 Mitsubishi Electric Inf Tech Method and apparatus for representing and searching for an object in an image
US6625607B1 (en) 1999-07-22 2003-09-23 Parametric Technology Corporation Method of comparing parts
GB2364590B (en) 2000-07-07 2004-06-02 Mitsubishi Electric Inf Tech Method and apparatus for representing and searching for an object in an image
US20040207656A1 (en) * 2001-06-30 2004-10-21 Sang-Youn Lee Apparatus and method for abstracting summarization video using shape information of object, and video summarization and indexing system and method using the same
KR100477801B1 (ko) 2002-12-26 2005-03-22 한국전자통신연구원 3차원 영상정보 기술장치와 그 방법 및 이를 이용한 3차원영상정보 검색장치 및 그 방법
US8429174B2 (en) 2003-01-25 2013-04-23 Purdue Research Foundation Methods, systems, and data structures for performing searches on three dimensional objects
US20060238919A1 (en) * 2005-04-20 2006-10-26 The Boeing Company Adaptive data cleaning
JP4542013B2 (ja) * 2005-09-29 2010-09-08 富士フイルム株式会社 プリント注文システム、プログラム、プログラム記憶媒体、およびプリント注文サーバ
CN101246475B (zh) * 2007-02-14 2010-05-19 北京书生国际信息技术有限公司 一种基于版面信息的检索方法
JP5041229B2 (ja) * 2007-12-07 2012-10-03 ソニー株式会社 学習装置および方法、認識装置および方法、並びにプログラム
US8239359B2 (en) * 2008-09-23 2012-08-07 Disney Enterprises, Inc. System and method for visual search in a video media player
US8473481B2 (en) * 2009-03-16 2013-06-25 Microsoft Corporation Object recognition and library
US8611604B2 (en) * 2009-06-03 2013-12-17 Chubu University Educational Foundation Object detection device
KR100971777B1 (ko) * 2009-09-16 2010-07-22 (주)올라웍스 파노라마 이미지 사이의 중복을 제거하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체
KR100971778B1 (ko) * 2009-09-16 2010-07-22 (주)올라웍스 그래프 구조를 이용하여 파노라마 이미지에 대한 이미지 매칭을 수행하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체
US8555192B2 (en) * 2010-06-03 2013-10-08 Microsoft Corporation Sketching and searching application for idea generation
WO2012176317A1 (ja) * 2011-06-23 2012-12-27 サイバーアイ・エンタテインメント株式会社 画像認識システムを組込んだ関連性検索によるインタレスト・グラフ収集システム
JP5660067B2 (ja) * 2012-03-21 2015-01-28 カシオ計算機株式会社 画像検索システム、画像検索装置、画像検索方法、及びプログラム
US10645345B2 (en) * 2012-07-03 2020-05-05 Verint Americas Inc. System and method of video capture and search optimization
CN108197631B (zh) * 2012-07-23 2022-06-28 苹果公司 提供图像特征描述符的方法
US9684881B2 (en) 2013-06-26 2017-06-20 Verint Americas Inc. System and method of workforce optimization
US9299007B2 (en) * 2014-01-28 2016-03-29 Ncr Corporation Methods and apparatus for item identification using brightness compensation
US20170228929A1 (en) * 2015-09-01 2017-08-10 Patrick Dengler System and Method by which combining computer hardware device sensor readings and a camera, provides the best, unencumbered Augmented Reality experience that enables real world objects to be transferred into any digital space, with context, and with contextual relationships.
US10719193B2 (en) * 2016-04-20 2020-07-21 Microsoft Technology Licensing, Llc Augmenting search with three-dimensional representations
US10628132B2 (en) * 2016-09-15 2020-04-21 Oracle International Corporation Inversion of control framework for multiple behaviors of a process
US11294644B2 (en) 2016-09-16 2022-04-05 Oracle International Corporation Inversion of control framework for multiple behaviors on top of a process
CN110392897A (zh) * 2017-01-04 2019-10-29 艾奎菲股份有限公司 用于基于形状的物品检索的系统和方法
CN109344750B (zh) * 2018-09-20 2021-10-22 浙江工业大学 一种基于结构描述子的复杂结构三维对象识别方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06347235A (ja) * 1993-06-07 1994-12-20 N T T Data Tsushin Kk パターン識別装置
JPH10222792A (ja) * 1997-02-05 1998-08-21 Kotaro Kishi 車両用障害物監視装置
JPH1185985A (ja) * 1997-09-02 1999-03-30 Adoin Kenkyusho:Kk 画像による対象登録方法及び画像による対象照合方法、画像による対象照合装置、並びに、画像による対象照合プログラムを格納した記憶媒体
JPH1185988A (ja) * 1997-09-04 1999-03-30 Fujitsu Ltd 顔画像認識システム

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BE790510A (fr) * 1971-11-04 1973-02-15 Rothfjell Rolf E Procede pour l'identification de personnes en utilisant des courbes caracteristiques selectionnees du corps
GB1537322A (en) * 1975-01-30 1978-12-29 Agency Ind Science Techn Apparatus for recognition of approximate shape of an article
US4179824A (en) * 1978-05-04 1979-12-25 The Singer Company Simulation of an object system formed by polygon faces having a series of fundamental shapes and dimension
GB2085629B (en) * 1980-10-17 1984-08-08 Micro Cosultants Ltd Object recognition
US4882679A (en) * 1987-11-27 1989-11-21 Picker International, Inc. System to reformat images for three-dimensional display
US5144685A (en) 1989-03-31 1992-09-01 Honeywell Inc. Landmark recognition for autonomous mobile robots
CA2069976A1 (en) 1991-05-31 1992-12-01 Shin-Ichi Nakazawa Retrieval system for graphic information
EP0562672A3 (en) 1992-03-22 1994-07-13 Igp Res & Dev Ltd Process of picture representation by data compression
US5579471A (en) * 1992-11-09 1996-11-26 International Business Machines Corporation Image query system and method
US6182069B1 (en) * 1992-11-09 2001-01-30 International Business Machines Corporation Video query system and method
US5850490A (en) * 1993-12-22 1998-12-15 Xerox Corporation Analyzing an image of a document using alternative positionings of a class of segments
JP2812168B2 (ja) 1993-12-27 1998-10-22 松下電器産業株式会社 形状データ圧縮方法および形状データ伸長方法
US5682468A (en) 1995-01-23 1997-10-28 Intergraph Corporation OLE for design and modeling
US5852823A (en) * 1996-10-16 1998-12-22 Microsoft Image classification and retrieval system using a query-by-example paradigm
JP2001503895A (ja) 1996-11-15 2001-03-21 サーノフ コーポレイション ビデオ情報を効果的に表示、保存、およびアクセスするための方法および装置
US5901245A (en) 1997-01-23 1999-05-04 Eastman Kodak Company Method and system for detection and characterization of open space in digital images
US6631364B1 (en) 1997-03-26 2003-10-07 National Research Council Of Canada Method of searching 3-Dimensional images
US6016487A (en) * 1997-03-26 2000-01-18 National Research Council Of Canada Method of searching three-dimensional images
US6366797B1 (en) * 1998-08-25 2002-04-02 The Cleveland Clinic Foundation Method and system for brain volume analysis
US6591004B1 (en) * 1998-09-21 2003-07-08 Washington University Sure-fit: an automated method for modeling the shape of cerebral cortex and other complex structures using customized filters and transformations
GB2349493B (en) * 1999-04-29 2002-10-30 Mitsubishi Electric Inf Tech Method of representing an object using shape
GB2393012B (en) 1999-07-05 2004-05-05 Mitsubishi Electric Inf Tech Representing and searching for an object in an image

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06347235A (ja) * 1993-06-07 1994-12-20 N T T Data Tsushin Kk パターン識別装置
JPH10222792A (ja) * 1997-02-05 1998-08-21 Kotaro Kishi 車両用障害物監視装置
JPH1185985A (ja) * 1997-09-02 1999-03-30 Adoin Kenkyusho:Kk 画像による対象登録方法及び画像による対象照合方法、画像による対象照合装置、並びに、画像による対象照合プログラムを格納した記憶媒体
JPH1185988A (ja) * 1997-09-04 1999-03-30 Fujitsu Ltd 顔画像認識システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011096286A (ja) * 1999-04-29 2011-05-12 Mitsubishi Electric R&D Centre Europe Bv 画像または画像シーケンス内のオブジェクトを検索する方法と装置

Also Published As

Publication number Publication date
JP2011096286A (ja) 2011-05-12
US7769248B2 (en) 2010-08-03
KR20020006712A (ko) 2002-01-24
KR20080050538A (ko) 2008-06-05
EP2312472A1 (en) 2011-04-20
GB9909963D0 (en) 1999-06-30
JP5121086B2 (ja) 2013-01-16
KR100874787B1 (ko) 2008-12-18
GB0216853D0 (en) 2002-08-28
GB2375212A (en) 2002-11-06
JP2002543526A (ja) 2002-12-17
KR20070064686A (ko) 2007-06-21
CN1979481A (zh) 2007-06-13
KR20080104076A (ko) 2008-11-28
EP1183624A1 (en) 2002-03-06
AU4766900A (en) 2000-11-17
US7877414B2 (en) 2011-01-25
WO2000067151A1 (en) 2000-11-09
KR100925081B1 (ko) 2009-11-04
GB2375212B (en) 2003-06-11
GB2349493A (en) 2000-11-01
US20080065614A1 (en) 2008-03-13
KR100809828B1 (ko) 2008-03-07
US20080065615A1 (en) 2008-03-13
EP2312471A1 (en) 2011-04-20
JP2010055651A (ja) 2010-03-11
EP2309402A1 (en) 2011-04-13
CN1162793C (zh) 2004-08-18
GB2349493B (en) 2002-10-30
CN1979480A (zh) 2007-06-13
KR100937270B1 (ko) 2010-01-18
US7362921B1 (en) 2008-04-22
CN100430935C (zh) 2008-11-05
CN1534521A (zh) 2004-10-06
CN1359499A (zh) 2002-07-17

Similar Documents

Publication Publication Date Title
JP5121086B2 (ja) 物体を表現する方法、物体を探索する方法
JP4632627B2 (ja) 画像中のオブジェクトを表現および探索する方法および装置
US7761438B1 (en) Method and apparatus for representing and searching for an object using shape

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070419

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090609

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090909

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090914

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091209

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100803

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20101216

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20101216

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120511

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120516

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120713

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120719

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120810

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121023

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151102

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5121086

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S634 Written request for registration of reclamation of nationality

Free format text: JAPANESE INTERMEDIATE CODE: R313634

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees