JP4875200B2 - 画像中に現れるオブジェクトを検索する方法、その装置、コンピュータ・プログラム、コンピュータ・システム、及びコンピュータ可読記憶媒体 - Google Patents

画像中に現れるオブジェクトを検索する方法、その装置、コンピュータ・プログラム、コンピュータ・システム、及びコンピュータ可読記憶媒体 Download PDF

Info

Publication number
JP4875200B2
JP4875200B2 JP2010268521A JP2010268521A JP4875200B2 JP 4875200 B2 JP4875200 B2 JP 4875200B2 JP 2010268521 A JP2010268521 A JP 2010268521A JP 2010268521 A JP2010268521 A JP 2010268521A JP 4875200 B2 JP4875200 B2 JP 4875200B2
Authority
JP
Japan
Prior art keywords
image
peak
contour
descriptor
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2010268521A
Other languages
English (en)
Other versions
JP2011100467A (ja
Inventor
ミロスロフ・ジー ボーバー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric R&D Centre Europe BV Netherlands
Original Assignee
Mitsubishi Electric R&D Centre Europe BV Netherlands
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric R&D Centre Europe BV Netherlands filed Critical Mitsubishi Electric R&D Centre Europe BV Netherlands
Publication of JP2011100467A publication Critical patent/JP2011100467A/ja
Application granted granted Critical
Publication of JP4875200B2 publication Critical patent/JP4875200B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/752Contour matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)
  • Studio Circuits (AREA)
  • Television Signal Processing For Recording (AREA)

Description

本発明は、検索を目的とする、マルチメディア・データベースに保存された画像のような静止画像またはビデオ画像中に現れるオブジェクトの表示に関し、特に、そのような表示を用いてオブジェクトを検索する方法及び装置に関する。
ビデオ・ライブラリの画像のようなアプリケーションでは、ビデオ画像あるいは静止画像中に現れるオブジェクトの輪郭や形状またはオブジェクトの一部の効率的な表示および保存を行うことが望ましい。形状ベースの索引付けと検索を行うための公知の手法では曲率スケール空間(CSS)表示が用いられる。CSSの詳細については、論文「曲率スケール空間によるロバストで効率的な形状索引付け」(英国マシーン・ビジョン会報pp.53〜62、エジンバラ、英国、1996年)ならびに「曲率スケール空間を用いる形状内容による画像データベースの索引付け」(インテリジェント・データベースに関するIEE専門家会議会報、ロンドン、1996年)の中で入手することができる。両論文ともMokhtarian、S.AbbasiならびにJ.Kittlerによるものであり、その内容は本明細書中に参考文献として取り入れられている。
CSS表示では、オブジェクトの輪郭を求めるために曲率関数が使用され、輪郭上の任意の点から表示が開始される。形状を平滑化する一連の変形を行うことにより輪郭の形状を展開しながら、曲率関数が検討される。さらに具体的には、ガウスフィルタの族と共に畳み込まれた曲率関数の導関数のゼロ・クロスが計算される。曲率スケール空間として周知のように、ゼロ・クロスはグラフ上にプロットされる。但し、x軸は曲線の正規化された弧長であり、y軸は展開パラメータ、特に、適用フィルタのパラメータである。グラフ上のプロットは輪郭の特徴を示すループを形成する。オブジェクトの輪郭の各凸状または凹状を成す部分はCSS画像におけるループに対応する。CSS画像において最も突起したループのピークの縦座標は輪郭の表示として利用される。
入力オブジェクトの形状に一致する、データベース中の保存画像のオブジェクトを検索するために、入力形状のCSS表示が計算される。マッチング・アルゴリズムを用いて、それぞれのCSS画像のピークの位置および高さを比較することにより、入力形状と保存形状との間の類似度が判定される。
公知のCSS表示に関する問題点として、所定の輪郭のピークが輪郭上の任意の点から開始され計算される曲率関数に基づくということが挙げられる。この開始点が変更されるとCSS画像のピークのx軸に沿って周期的シフトが生じる。したがって、類似度測定値を計算するとき、すべての可能なシフトあるいは少なくとも最も生じ得るシフトについて検討する必要がある。この結果、検索手順およびマッチング手順の複雑さが増すということになる。
したがって本発明は、画像に対応する信号を処理することにより静止画像またはビデオ画像中に現れるオブジェクトを表す方法を提供するものであり、該方法は、輪郭上の任意の点から始まり、オブジェクトの輪郭上に現れている特徴と関連する複数の数値を導き出すステップと、前記値に対して所定のソーティングを適用して輪郭の表示を得るステップとを有する。好適には、前記輪郭のCSS表示から前記値を導き出すことが望ましく、また、前記値がCSSピーク値に対応することが望ましい。
本発明の結果として、検索精度の著しい低下を伴うことなくマッチング手順に関わる計算を大幅に低減することが可能となる。
この発明に係る請求項1に記載の画像中に現れるオブジェクトを検索する方法は、コンピュータを用いて、画像データベースに保存された1つの画像または一連の画像に対応する信号を処理することにより、画像中に現れるオブジェクトを検索するものであり、前記コンピュータは、2次元の輪郭の形状として入力されるクエリを受信するステップと、前記輪郭の記述子を導き出すステップと、記憶された画像のオブジェクトの記述子を取得し、前記クエリの記述子と、記憶されたオブジェクトに対するそれぞれの記述子とを比較するステップと、前記クエリとの類似度を示す比較がなされたオブジェクトを含む画像に対応した、少なくとも1つの比較結果を選択し、表示するステップとを有し、記憶された記述子とクエリの記述子は、前記オブジェクトの前記輪郭のCSS表示から導出され、前記CSS表示のピークの座標値のそれぞれは、ピークの高さの値に基づいてソーティングされる。
この発明に係る請求項2に記載の画像中に現れるオブジェクトを検索する方法は、前記ピークの座標値は、最大値から開始される、あるいは最小値から開始されるピーク値の高さに基づいてソーティングされる。
この発明に係る請求項3に記載の画像中に現れるオブジェクトを検索する方法は、前記クエリの輪郭および記憶された輪郭のそれぞれに対して係数が導出され、前記比較は、あらかじめ決められた順序付けのみ、あるいはあらかじめ決められた順序付けと前記係数に依存する他のいくつかの順序付けとを用いてなされ、前記係数は、CSS表示におけるピークの座標値のように、輪郭を表すためのオブジェクトの輪郭に現れる特徴に関連した複数の数値を導出することで導き出され、前記複数の数値のうちの少なくとも2つの数値の関係を用いて前記CSS表示の信頼性を示す係数を導出する。
この発明に係る請求項4に記載の画像中に現れるオブジェクトを検索する方法は、前記係数は、前記複数の数値のうちの2つの数値の比率に基づき、例えば、2つの最大値の比率に基づく。

この発明に係る請求項5に記載の画像中に現れるオブジェクトを検索する装置は、請求項1乃至4のいずれか1つに記載の方法を実行するように適合される。
この発明に係る請求項6に記載のコンピュータ可読記憶媒体は、請求項1乃至4のいずれか1つに記載の方法を実現するためのコンピュータで実行可能な処理を保存する。
本発明によるシステムは例えば画像ライブラリ中に設けることができる。或いは、データベースは、インターネットのようなネットワークにより電話線のような一時的リンクによって制御装置と接続し、システムの制御装置から遠隔地に配置することができる。例えば、画像データベースおよび記述子データベースは永久記憶装置またはROMやDVDのような携帯用記憶媒体中に設けることができる。
ビデオ・データベース・システムのブロック図、 オブジェクトの輪郭の図、 図2の輪郭を示すCSS表示の図、 検索方法を例示するブロック図である。
添付図面を参照しながら本発明の実施の形態について説明する。
実施の形態1.
図1は、本発明の実施の形態によるコンピュータ処理が行われるビデオ・データベース・システムを図示する。このシステムには、コンピュータの形の制御装置2、モニターの形の表示装置4、マウスの形のポインティング・デバイス6、保存された静止画像とビデオ画像とを含む画像データベース8および画像データベース8に保存された画像中に現れるオブジェクトまたはオブジェクトのいくつかの部分の記述子を保存する記述子データベース10が含まれる。
画像データベースの画像中に現れる興味のある各オブジェクトの形状を表す記述子は、制御装置2によって導き出され、記述子データベース10に保存される。制御装置2は、以下に説明するような方法を実行する適切なプログラムの制御によって動作して記述子を導き出す。
第一に、所定のオブジェクトの輪郭について、この輪郭のCSS表示が導き出される。上述の論文の1つに記載されているような周知の方法を用いてこのCSS表示が行われる。
さらに具体的には、この輪郭は写像表現Ψ={(x(u),y(u),u∈[0,1]}によって表される(ただし、uは正規化された弧長パラメータである)。
この輪郭は、IDガウスカーネルg(u,ρ)を用いて畳み込みを行う(convolve)ことにより平滑化され、ρの変化として展開(evolving)曲線の曲率ゼロ・クロスが調べられる。ゼロクロスは曲率を表す下記の式を用いて特定される。
Figure 0004875200
但し、
Figure 0004875200
かつ、
Figure 0004875200
上記で、*は畳み込みを表し、添え字は導関数を表す。
曲率ゼロ・クロスの数はρの変化につれて変化し、ρが十分に高いときΨはゼロ・クロスの凸状の曲線となる。
ゼロクロス・ポイント(u, ρ)はCSS画像空間として知られるグラフ上にプロットされる。この結果元の輪郭の特徴を示す曲線が生じる。この特徴を示す曲線のピークが特定され、対応する縦座標が抽出され保存される。一般に上記の結果、n個の座標の対((x1, y1)、(x2, y2)、...(xn, yn)の組(ただし、nはピークの数、xiはi番目のピークの弧長の位置、yiはピークの高さである)が与えられる。
この特徴を示す曲線のソートおよび位置ならびに対応するピークは、CSS画像空間に現れるとき、上述の曲率関数の開始点に依存する。本発明ではピークの縦座標は専用のソート関数を用いて再ソートされる。
ソーティングは、新しい集合のインデックス{1...n}に対するピーク・インデックス{1...n}の1対1写像Tによって行われる。
本実施の形態では、縦座標の対はy縦座標のサイズを考慮することによりソートされる。第1に最大ピークが選択される。k番目のピークが最も突起していると仮定する。その場合、値のソートされた集合の中で(xk, yk)が第1番目の座標になる。言い換えればT(k)=1である。同様に、その他のピークの縦座標はピークの高さの降順に再ソートされる。2つのピークが同じ高さを持っている場合、上記縦座標の対のx座標に最も近いx座標を持っているピークが第1に配置される。言い換えれば、元のインデックスiを持っている各縦座標の対が新しいインデックスjに割り当てられる。但し、T(i)=jかつyj>=y(j+1)である。また、各値xiは−xkの周期的シフトに従う。
特定の例として、図2に図示の輪郭から図3に図示のようなCSS画像の結果が得られる。CSS画像の曲線のピークの縦座標の詳細を以下の表1に示す。
Figure 0004875200
これらのピークは上述のソーティングを用いてソートされる。すなわち、縦座標はピークの高さの降順にソートされる。また、x縦座標はすべて最大ピークの元のx縦座標に等しい量だけゼロの方へシフトされる。この結果以下の表2に示されるような再ソートされたピーク座標が生じる。
Figure 0004875200
これらの再ソートされたピークの縦座標によって、データベース10に保存される、オブジェクトの輪郭についての記述子のベースが形成される。本実施の形態では、表2に示すソート順にピークの縦座標が保存される。或いは新しいソート順を示す関連するインデックスと共に縦座標を保存してもよい。
実施の形態2.
第2の実施の形態に従うオブジェクトの輪郭を表す代替方法について説明する。
輪郭を示すCSS表示は上述のように導き出される。しかし、ピークの縦座標のソートは上述の実施の形態1のソートとは異なる。さらに具体的には、第1に最大ピークが選択される。ピークkを最も突起したピークと仮定する。その場合、(xk, yk)がピークのソートされた集合の中で第1のピークになる。次に続くピークは、元のインデックスiのピークの縦座標について、T(i)=jかつxj<=x(j+1)となるようにソートされる。また、元のピークkの元のx縦座標に等しい量xkだけ下方へすべての値xiがシフトされる。
換言すれば、実施の形態2に従うソート方法では、最大ピークが選択され、第1に配置され、次いで、残りのピークが最大ピークから始まる元のシーケンスで続く。
以下の表3は第2の実施の形態に従ってソートされた表1のピーク値を示す表である。
Figure 0004875200
上述の実施の形態1と2の展開では信頼係数(CF)が形状の各表示と関連付けられる。CFは、所定の形状の第2の最大ピーク値と最大ピーク値との比から計算される。
図2に図示の輪郭については、CF値はCF=1001/2120である。この例では、CFは最も近い0.1に丸めることにより量子化されて記憶要件が少なくなる。したがって、本例ではCF=0.5である。
本例のCF値は表示の精確さすなわち一意性の反映である。本例では、1に近いCF値は低い信頼性を意味し、ゼロに近いCF値は高い信頼性を意味する。言い換えれば2つの最大ピーク値が近ければ近いほど表示は正確なものとなる可能性が少なくなる。
以下の説明に示されるようなマッチング手順を行うとき、CF値は有益なものとなり得る。
実施の形態3.
本発明の一実施の形態に準拠する、画像中のオブジェクトを検索する方法について、検索方法を示すブロック図である図4を参照しながら説明する。
本例では、図1のシステムの記述子データベース10中には、関連づけられたCF値とともに、上述した第1のソート方法に従って導き出された記述子が保存されている。
ユーザーは、ポインティング・デバイスを用いて、ディスプレイ上にオブジェクトの輪郭を描くことにより検索を開始する(ステップ410)。次いで、制御装置2が入力輪郭のCSS表示を導き出し、データベース中の画像に対して使用する関数と同じソート関数に従ってピークの縦座標のソートが行われ、入力輪郭を表す記述子が得られる(ステップ420)。次いで、制御装置2は、最大ピーク値に対する第2の最大ピーク値の比率を計算することにより入力輪郭のCF値も計算し、その結果の量子化を行う(ステップ430)。
次いで、制御装置2は入力輪郭のCF値を所定の閾値と比較する(ステップ440)。本例ではその閾値は0.75である。入力記述子の精度に対して相対的に高い信頼性を示して、CF値がこの閾値より低い場合には、次のステップは考慮中のモデル(すなわちデータベースに保存された画像)のCF値について考慮するステップである。モデルのCFがやはり閾値より低い場合(ステップ450)、所定のソート順のそれぞれの記述子のみを用いて入力記述子とモデルとの比較が行われる(ステップ460)。入力記述子またはモデルのいずれかのCFが閾値より大きい場合、入力記述子中の縦座標値のすべての可能な異なるソート順をデータベース中のモデル記述子と比較することによりマッチングが行われる(ステップ470)。
データベース中に各記述子の類似度測定値が結果として得られる適切なアルゴリズムを用いてマッチング比較が行われる。上述の論文で説明したような公知のマッチング・アルゴリズムを用いてもよい。このマッチング手順について簡単に説明する。
2つの閉鎖した輪郭の形状、画像曲線Ψiとモデル曲線Ψmおよびそれらの曲線のピークのそれぞれの設定値{(xi1, yi1),(xi2, yi2),..,(xin, yin)}と{(xm1, ym1), (xm2, ym2),..,(xmn, ymn)}が与えられれば、類似度測定値は計算される。類似度測定値は、画像中のピークとモデル中のピークのマッチングの総コストとして定義される。総コストを最少化するマッチングはダイナミック・プログラミングを用いて計算される。アルゴリズムによって、モデルから得たピークが画像から得たピークに再帰的にマッチされ、このようなマッチの各々のコスト計算が行われる。各モデルのピークを唯一の画像ピークとマッチさせることができ、各画像ピークを唯一のモデル・ピークとマッチさせることができる。モデルおよび/または画像ピークのなかにはマッチしないままのものがある場合もあり、各マッチしないピークについては追加のペナルティ・コストが存在する。2つのピークの水平距離が0.2未満の場合、2つのピークをマッチすることができる。マッチのコストは2つのマッチしたピーク間の直線の長さである。マッチしなかったピークのコストはその高さである。
更に詳述すれば、アルゴリズムは、ノードがマッチしたピークに対応するツリー状の構造を作成し拡張することにより機能する。
1.画像(xik, yik)の最大値とモデル(xir, yir)の最大値とから成る開始ノードを作成する。
2. 画像ピークの最大値の80%以内の各残りのモデル・ピークについて追加の開始ノードを作成する。
3. 1および2で作成した各開始ノードのコストを、この開始ノードとリンクした画像ピークおよびモデル・ピークのy座標の差の絶対値に初期化する。
4. 3の各開始ノードについて、この開始ノードでマッチしたモデル・ピークと画像ピークのx(水平)座標の差として定義するCSSシフト・パラメータアルファを計算する。シフト・パラメータは各ノードについて異なるものとなる。
5. 各開始ノードについて、モデル・ピークのリストおよび画像ピークのリストを作成する。このリストにはどのピークがまだマッチしていないかに関する情報が含まれる。各開始ノードについて、“マッチしたもの”としてこのノードでマッチしたピークにマークをつけ、他のすべてのピークには“マッチしなかったもの”としてマークをつける。
6. ポイント8の条件が満たされるまで、最低コストのノードを再帰的に拡大する(ステップ1〜6でを作成した各ノードから始めて、各ノードの子ノードが後に続く)。ノードを拡大するために以下の手順を用いる。
7.ノードの拡大:
マッチしないままになっている少なくとも1つの画像と1つのモデル・ピークが存在する場合、マッチしない最も大きなスケール画像曲線CSSの最大値(xip, yip)を選択する。(ステップ4で計算した)開始ノード・シフト・パラメータを適用して選択した最大値をモデルCSS画像に写像し、選択されたピークは座標(xip-alpha, yip)を持つことになる。マッチしない最も近いモデル曲線ピーク(xms, yms)を決定する。2つのピーク間の水平距離が0.2未満(すなわち|xip-alpha-xms|<0.2)である場合、2つのピークをマッチさせ、2つのピーク間の直線の長さとしてマッチのコストを定義する。そのノードの総コストにマッチのコストを加える。マッチしたピークに“マッチした”ものとしてマークをつけることによりそれぞれのリストからマッチしたピークを取り除く。2つのピーク間の水平距離が0.2より大きい場合、画像ピーク(xip, yip)はマッチすることはできない。その場合総コストに画像ピークの高さyipを加え、“マッチした”ものそのピークにマークとつけることにより画像ピーク・リストからピーク(xip, yip)だけを取り除く。
上記条件が当てはまらない(マッチしなかった画像ピークしか存在しない、またはマッチしなかったモデル・ピークしか存在しない)場合、マッチしないままの状態に放置する。
マッチしなかった画像ピークまたはモデル・ピークの最も高い高さとしてマッチのコストを定義しリストからピークを取り除く。
8.7でノードを拡大した後、画像リストおよびモデル・リストの双方にマッチしないピークが存在しない場合マッチング処理は終了する。このノードのコストは画像とモデル曲線間の類似度測定値である。ピークが存在する場合には、ポイント7へ戻り最低コストのノードを拡大する。
画像曲線ピーク値とモデル曲線ピーク値とを交換して上記手順を繰り返す。最終マッチング値はこれら2つのピーク値のうちの低い方の値である。
もう1つの例として、ソートされた順序の各位置について、入力されたx値とそれに対応するモデルのx値との間の距離および入力されたy値とそれに対応するモデルのy値との間の距離が計算される。すべての位置についての合計距離が計算され、合計距離が小さければ小さいほどマッチの程度は近くなる。入力輪郭とモデルのピークの数が異なる場合、合計距離の中に残りのマッチしなかったピークの高さが含まれる。
上記ステップがデータベースの各モデルについて繰り返される(ステップ480)。
マッチング比較の結果生じる類似度値がソートされ(ステップ490)、次いで、最も近いマッチング値(すなわち本例では最も低い類似度値)を示す類似度値を持つ記述子に対応するオブジェクトがユーザーに対して表示装置4に表示される(ステップ500)。表示対象のオブジェクト数はユーザーが予め設定するか選択することができる。
上記実施の形態では、CF値の方が閾値より大きい場合、マッチング時に入力記述子値のすべての可能な順序が考慮される。しかしながら、すべての可能な順序を考慮する必要はなく、代わりに、元のCSS表示のいくつかのまたはすべての周期的シフトのようないくつかの可能な順序だけを考慮することができる。さらに、上記実施の形態では、閾値は0.75に設定されるが、この閾値は異なるレベルに設定することもできる。例えば、閾値がゼロに設定された場合、いくつかのまたはすべての可能な順序の分析によってすべてのマッチングが行われる。このため、閾値がゼロ以上の場合と比較して必要な計算量が増えることになるがピーク値が既にソートされていて、ピーク値のx座標が、特定の開始点またはオブジェクト回転について調整されているので、そのような調整が行われていない元のシステムと比較すると必要な計算量は低減する。したがってゼロに閾値を設定することによりシステムは計算コストの若干の減少を行い、検索パフォーマンスは元のシステムの場合とまったく同じになる。
或いは、閾値が1に設定された場合、保存された順序だけを用いてマッチングが行われる。その場合、検索精度にはほんのわずかの低下しか伴わずに必要な計算量を著しく減らすことができる。
上述の実施の形態に対して様々な変更が可能である。例えば、実施の形態1および2に説明したようなCSSピークの縦座標値のソーティングの代わりに、他のソーティングを利用することもできる。例えば、ピークの高さの降順に配置する代わりに昇順に縦座標値を配置してもよい。データベースにソーティングされた値を保存する代わりにマッチング手順中にソーティングを行ってもよい。
以上説明したようなシステムの構成要素は、ソフトウェアまたはハードウェアの形で設けることができる。コンピュータ・システムの形で本発明について説明したが、本発明は専用チップなどを用いて他の形で実現することもできる。
オブジェクトの2D形状を表す方法および2つの形状間の類似度を表す値を計算する方法を示す特定の例を示したが、同様の任意の適切な方法を用いることができる。
例えば、確認目的のためにオブジェクト画像のマッチングを行うために、またはフィルタリングを行うために本発明を用いることができる。

Claims (6)

  1. コンピュータを用いて、画像データベースに保存された1つの画像または一連の画像に対応する信号を処理することにより、前記画像中に現れるオブジェクトを検索する方法であって、
    前記コンピュータは、
    2次元の輪郭の形状として入力されるクエリを受信するステップと、
    前記輪郭の記述子を導き出すステップと、
    記憶された画像のオブジェクトの記述子を取得し、前記クエリの記述子と、記憶されたオブジェクトに対するそれぞれの記述子とを比較するステップと、
    前記クエリとの類似度を示す比較がなされたオブジェクトを含む画像に対応した、少なくとも1つの比較結果を選択し、表示するステップと
    を有し、
    記憶された記述子とクエリの記述子は、前記オブジェクトの前記輪郭のCSS表示から導出され、
    前記CSS表示のピークの座標値のそれぞれは、ピークの高さの値に基づいてソーティングされる
    ことを特徴とする画像中に現れるオブジェクトを検索する方法。
  2. 前記ピークの座標値は、最大値から開始される、あるいは最小値から開始されるピーク値の高さに基づいてソーティングされる
    ことを特徴とする請求項1に記載の方法。
  3. 前記クエリの輪郭および記憶された輪郭のそれぞれに対して係数が導出され、前記比較は、あらかじめ決められた順序付けのみ、あるいはあらかじめ決められた順序付けと前記係数に依存する他のいくつかの順序付けとを用いてなされ、
    前記係数は、CSS表示におけるピークの座標値のように、輪郭を表すためのオブジェクトの輪郭に現れる特徴に関連した複数の数値を導出することで導き出され、前記複数の数値のうちの少なくとも2つの数値の関係を用いて前記CSS表示の信頼性を示す係数を導出する
    請求項1または2に記載の方法。
  4. 前記係数は、前記複数の数値のうちの2つの数値の比率に基づき、例えば、2つの最大値の比率に基づく
    ことを特徴とする請求項3に記載の方法。
  5. 請求項1乃至4のいずれか1つに記載の方法を実行するように適合される、画像中に現れるオブジェクトを検索する装置。
  6. 請求項1乃至4のいずれか1つに記載の方法を実現するためのコンピュータで実行可能な処理を保存するコンピュータ可読記憶媒体。
JP2010268521A 1999-07-05 2010-12-01 画像中に現れるオブジェクトを検索する方法、その装置、コンピュータ・プログラム、コンピュータ・システム、及びコンピュータ可読記憶媒体 Expired - Lifetime JP4875200B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB9915698A GB2351826B (en) 1999-07-05 1999-07-05 Method of representing an object in an image
GB9915698.6 2000-07-05

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2001508781A Division JP4689119B2 (ja) 1999-07-05 2000-07-03 画像中に現れるオブジェクトを表示する方法、その装置、コンピュータ・システム、及びコンピュータ可読記憶媒体

Publications (2)

Publication Number Publication Date
JP2011100467A JP2011100467A (ja) 2011-05-19
JP4875200B2 true JP4875200B2 (ja) 2012-02-15

Family

ID=10856660

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2001508781A Expired - Fee Related JP4689119B2 (ja) 1999-07-05 2000-07-03 画像中に現れるオブジェクトを表示する方法、その装置、コンピュータ・システム、及びコンピュータ可読記憶媒体
JP2010268521A Expired - Lifetime JP4875200B2 (ja) 1999-07-05 2010-12-01 画像中に現れるオブジェクトを検索する方法、その装置、コンピュータ・プログラム、コンピュータ・システム、及びコンピュータ可読記憶媒体

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2001508781A Expired - Fee Related JP4689119B2 (ja) 1999-07-05 2000-07-03 画像中に現れるオブジェクトを表示する方法、その装置、コンピュータ・システム、及びコンピュータ可読記憶媒体

Country Status (8)

Country Link
US (7) US6882756B1 (ja)
JP (2) JP4689119B2 (ja)
KR (3) KR100708799B1 (ja)
CN (5) CN1967543B (ja)
BR (1) BR0006894A (ja)
GB (5) GB2393012B (ja)
RU (1) RU2216040C2 (ja)
WO (1) WO2001003068A1 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2375212B (en) 1999-04-29 2003-06-11 Mitsubishi Electric Inf Tech Method and apparatus for searching for an object using shape
GB2394349B (en) * 1999-07-05 2004-06-16 Mitsubishi Electric Inf Tech Method and apparatus for representing and searching for an object in an image
GB2359913B (en) 2000-02-29 2003-12-03 Mitsubishi Electric Inf Tech A method for efficient coding of shape descriptor parameters
US7680324B2 (en) 2000-11-06 2010-03-16 Evryx Technologies, Inc. Use of image-derived information as search criteria for internet and other search engines
US9310892B2 (en) 2000-11-06 2016-04-12 Nant Holdings Ip, Llc Object information derived from object images
US7899243B2 (en) 2000-11-06 2011-03-01 Evryx Technologies, Inc. Image capture and identification system and process
US8224078B2 (en) 2000-11-06 2012-07-17 Nant Holdings Ip, Llc Image capture and identification system and process
US7565008B2 (en) 2000-11-06 2009-07-21 Evryx Technologies, Inc. Data capture and identification system and process
GB2384095B (en) * 2001-12-10 2004-04-28 Cybula Ltd Image recognition
US7656408B1 (en) * 2006-02-10 2010-02-02 Adobe Systems, Incorporated Method and system for animating a border
US7711157B2 (en) * 2006-08-01 2010-05-04 California Institute Of Technology Artificial intelligence systems for identifying objects
US20080181513A1 (en) * 2007-01-31 2008-07-31 John Almeida Method, apparatus and algorithm for indexing, searching, retrieval of digital stream by the use of summed partitions
GB2449125A (en) * 2007-05-11 2008-11-12 Sony Uk Ltd Metadata with degree of trust indication
JP5041229B2 (ja) * 2007-12-07 2012-10-03 ソニー株式会社 学習装置および方法、認識装置および方法、並びにプログラム
DE112008000017T5 (de) * 2008-05-09 2009-11-05 Hankuk University of Foreign Studies Research and Industry-University Cooperation Foundation, Yongin Abbilden von Bildern mit Gestaltbeschreibern
US8340435B2 (en) * 2009-06-11 2012-12-25 California Institute Of Technology Method and system for object recognition search
JP5444115B2 (ja) * 2010-05-14 2014-03-19 株式会社Nttドコモ データ検索装置、データ検索方法及びプログラム
KR20140108726A (ko) 2012-02-27 2014-09-12 아셀산 엘렉트로닉 사나이 베 티카렛 아노님 시르케티 이미지들 상의 객체 윤곽선들의 스케일 불변 특징들을 식별하기 위한 방법 및 시스템
CN103870516B (zh) * 2012-12-18 2019-10-25 北京三星通信技术研究有限公司 检索图像的方法、实时绘画提示方法及其装置
EP2807609A1 (en) 2013-04-01 2014-12-03 Aselsan Elektronik Sanayi ve Ticaret Anonim Sirketi System and method for describing image outlines
WO2015080723A1 (en) * 2013-11-27 2015-06-04 Hewlett-Packard Development Company, Lp. Determine the shape of a representation of an object
KR102312334B1 (ko) 2015-02-17 2021-10-13 삼성전자주식회사 프린팅 정보를 생성하는 디바이스 및 프린팅 정보를 생성하는 방법

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0293397A1 (en) * 1986-09-18 1988-12-07 LEAVERS, Violet Frances Shape detection
GB2203877A (en) * 1986-09-18 1988-10-26 Violet Frances Leavers Shape parametrisation
US4989257A (en) * 1987-03-13 1991-01-29 Gtx Corporation Method and apparatus for generating size and orientation invariant shape features
JPH0283A (ja) * 1987-10-29 1990-01-05 Kawasaki Steel Corp 乾式二成分系現像剤用キャリア
JPH0275083A (ja) * 1988-09-12 1990-03-14 Nippon Yougiyoushi Kenkyusho:Kk 考古学出土品の輪郭描画装置
US5081689A (en) * 1989-03-27 1992-01-14 Hughes Aircraft Company Apparatus and method for extracting edges and lines
JPH0820725B2 (ja) * 1990-02-06 1996-03-04 大日本スクリーン製造株式会社 画像輪郭データの作成方法
JP2856229B2 (ja) * 1991-09-18 1999-02-10 財団法人ニューメディア開発協会 画像切り出し箇所検出方法
US6182069B1 (en) * 1992-11-09 2001-01-30 International Business Machines Corporation Video query system and method
JPH06309465A (ja) 1993-04-21 1994-11-04 Nippon Telegr & Teleph Corp <Ntt> 線図形学習認識方法
US5487116A (en) * 1993-05-25 1996-01-23 Matsushita Electric Industrial Co., Ltd. Vehicle recognition apparatus
US6014461A (en) * 1994-11-30 2000-01-11 Texas Instruments Incorporated Apparatus and method for automatic knowlege-based object identification
US6044171A (en) * 1995-05-09 2000-03-28 Polyakov; Vladislav G. Method and apparatus for pattern recognition and representation using fourier descriptors and iterative transformation-reparametrization
JPH09138471A (ja) 1995-09-13 1997-05-27 Fuji Photo Film Co Ltd 特定形状領域の抽出方法、特定領域の抽出方法及び複写条件決定方法
JP3315861B2 (ja) * 1996-05-13 2002-08-19 シャープ株式会社 文字生成装置
JPH1055447A (ja) * 1996-05-21 1998-02-24 Monorisu:Kk オブジェクト認識方法およびその方法を用いた装置
JP2815045B2 (ja) * 1996-12-16 1998-10-27 日本電気株式会社 画像特徴抽出装置,画像特徴解析装置,および画像照合システム
US5892854A (en) * 1997-01-21 1999-04-06 Xerox Corporation Automatic image registration using binary moments
AU9676298A (en) * 1997-10-01 1999-04-23 Island Graphics Corporation Image comparing system
KR100305591B1 (ko) * 1998-07-22 2001-11-30 오길록 관절점기반동작정보를사용한동영상검색방법
JP2000050258A (ja) * 1998-07-31 2000-02-18 Toshiba Corp 映像検索方法および映像検索装置
US6687402B1 (en) * 1998-12-18 2004-02-03 Cognex Corporation Machine vision methods and systems for boundary feature comparison of patterns and images
GB2375212B (en) * 1999-04-29 2003-06-11 Mitsubishi Electric Inf Tech Method and apparatus for searching for an object using shape
GB2394349B (en) 1999-07-05 2004-06-16 Mitsubishi Electric Inf Tech Method and apparatus for representing and searching for an object in an image

Also Published As

Publication number Publication date
KR20030078953A (ko) 2003-10-08
CN1321284A (zh) 2001-11-07
CN1311411C (zh) 2007-04-18
KR20030078952A (ko) 2003-10-08
CN100573521C (zh) 2009-12-23
US20080065610A1 (en) 2008-03-13
GB2351826B (en) 2004-05-19
JP2011100467A (ja) 2011-05-19
US20050238256A1 (en) 2005-10-27
GB2391677A (en) 2004-02-11
US7492972B2 (en) 2009-02-17
CN1967544A (zh) 2007-05-23
CN1967543B (zh) 2010-05-26
WO2001003068A1 (fr) 2001-01-11
US7356203B2 (en) 2008-04-08
GB2393012A (en) 2004-03-17
GB2391676B (en) 2004-05-05
CN1295649C (zh) 2007-01-17
CN1542695A (zh) 2004-11-03
GB2393012B (en) 2004-05-05
GB0325150D0 (en) 2003-12-03
US20080050049A1 (en) 2008-02-28
KR20010073126A (ko) 2001-07-31
GB2391677B (en) 2004-05-12
KR100708800B1 (ko) 2007-04-18
WO2001003068A8 (fr) 2001-03-22
US7505637B2 (en) 2009-03-17
CN100573522C (zh) 2009-12-23
JP4689119B2 (ja) 2011-05-25
US20080050048A1 (en) 2008-02-28
CN1967543A (zh) 2007-05-23
US7483594B2 (en) 2009-01-27
GB2391678A (en) 2004-02-11
RU2216040C2 (ru) 2003-11-10
BR0006894A (pt) 2001-06-12
GB2351826A (en) 2001-01-10
GB0329009D0 (en) 2004-01-14
CN1967542A (zh) 2007-05-23
GB2391676A (en) 2004-02-11
GB2391678B (en) 2004-05-05
GB0325153D0 (en) 2003-12-03
US6882756B1 (en) 2005-04-19
GB0325156D0 (en) 2003-12-03
US7542626B2 (en) 2009-06-02
KR100431677B1 (ko) 2004-05-17
KR100708799B1 (ko) 2007-04-18
US7162105B2 (en) 2007-01-09
US20080044108A1 (en) 2008-02-21
GB9915698D0 (en) 1999-09-08
US20070065016A1 (en) 2007-03-22

Similar Documents

Publication Publication Date Title
JP4875200B2 (ja) 画像中に現れるオブジェクトを検索する方法、その装置、コンピュータ・プログラム、コンピュータ・システム、及びコンピュータ可読記憶媒体
JP5236719B2 (ja) 画像中に現れるオブジェクトを表示または検索する方法、その装置、コンピュータ・システム、及びコンピュータ・プログラム
JP2011100465A (ja) 画像中に現れるオブジェクトを表示する方法、その装置、コンピュータ・プログラム、コンピュータ・システム、及びコンピュータ可読記憶媒体
MXPA01002354A (es) Metodo, aparato programa de computadora, sistema de computadora, y medio de almacenamiento leible por computadora para representar y buscar un objeto en una imagen

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110517

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110817

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110822

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110914

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110920

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111014

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111108

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111124

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141202

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4875200

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term
S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R370 Written measure of declining of transfer procedure

Free format text: JAPANESE INTERMEDIATE CODE: R370