JP5236719B2 - 画像中に現れるオブジェクトを表示または検索する方法、その装置、コンピュータ・システム、及びコンピュータ・プログラム - Google Patents

画像中に現れるオブジェクトを表示または検索する方法、その装置、コンピュータ・システム、及びコンピュータ・プログラム Download PDF

Info

Publication number
JP5236719B2
JP5236719B2 JP2010268522A JP2010268522A JP5236719B2 JP 5236719 B2 JP5236719 B2 JP 5236719B2 JP 2010268522 A JP2010268522 A JP 2010268522A JP 2010268522 A JP2010268522 A JP 2010268522A JP 5236719 B2 JP5236719 B2 JP 5236719B2
Authority
JP
Japan
Prior art keywords
image
peak
descriptor
contour
css
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2010268522A
Other languages
English (en)
Other versions
JP2011100468A (ja
Inventor
ミロスロフ・ジー ボーバー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric R&D Centre Europe BV Netherlands
Original Assignee
Mitsubishi Electric R&D Centre Europe BV Netherlands
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric R&D Centre Europe BV Netherlands filed Critical Mitsubishi Electric R&D Centre Europe BV Netherlands
Publication of JP2011100468A publication Critical patent/JP2011100468A/ja
Application granted granted Critical
Publication of JP5236719B2 publication Critical patent/JP5236719B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/752Contour matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Processing (AREA)
  • Processing Or Creating Images (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Television Systems (AREA)
  • Picture Signal Circuits (AREA)

Description

本発明は、検索を目的とする、マルチメディア・データベースに保存された画像のような静止画像またはビデオ画像中に現れるオブジェクトの表示に関し、特に、そのような表示を用いてオブジェクトを検索する方法及び装置に関する。
ビデオ・ライブラリの画像のようなアプリケーションでは、ビデオ画像あるいは静止画像中に現れるオブジェクトの輪郭や形状またはオブジェクトの一部の効率的な表示および保存を行うことが望ましい。形状ベースの索引付けと検索を行うための公知の手法では曲率スケール空間(CSS)表示が用いられる。CSSの詳細については、論文「曲率スケール空間によるロバストで効率的な形状索引付け」(英国マシーン・ビジョン会報pp.53〜62、エジンバラ、英国、1996年)ならびに「曲率スケール空間を用いる形状内容による画像データベースの索引付け」(インテリジェント・データベースに関するIEE専門家会議会報、ロンドン、1996年)の中で入手することができる。両論文ともMokhtarian、S.AbbasiならびにJ.Kittlerによるものであり、その内容は本明細書中に参考文献として取り入れられている。
CSS表示では、オブジェクトの輪郭を求めるために曲率関数が使用され、輪郭上の任意の点から表示が開始される。形状を平滑化する一連の変形を行うことにより輪郭の形状を展開しながら、曲率関数が検討される。さらに具体的には、ガウスフィルタの族と共に畳み込まれた曲率関数の導関数のゼロ・クロスが計算される。曲率スケール空間として周知のように、ゼロ・クロスはグラフ上にプロットされる。但し、x軸は曲線の正規化された弧長であり、y軸は展開パラメータ、特に、適用フィルタのパラメータである。グラフ上のプロットは輪郭の特徴を示すループを形成する。オブジェクトの輪郭の各凸状または凹状を成す部分はCSS画像におけるループに対応する。CSS画像において最も突起したループのピークの縦座標は輪郭の表示として利用される。
入力オブジェクトの形状に一致する、データベース中の保存画像のオブジェクトを検索するために、入力形状のCSS表示が計算される。マッチング・アルゴリズムを用いて、それぞれのCSS画像のピークの位置および高さを比較することにより、入力形状と保存形状との間の類似度が判定される。
スケールの変化、回転、何らかの輪郭の変形および射影変換のような作像状態の変化の下でも変わらないオブジェクトの輪郭表示が得られることが望しい。また、さらに広いクラスの範囲で、形状の変動に対して鈍感な方法で形状を表すことが望まれる。例えば、オブジェクト‘車’の表示をその車のモデルとメーカーに対して不変にして抽出された特徴表示を利用してすべての車らしさを示す形状を容易に検索できるようにするほうがよい。
したがって本発明は、画像に対応する信号を処理することにより静止画像またはビデオ画像中に現れるオブジェクトを表す方法を提供するものであり、該方法は、オブジェクトの輪郭上に現れる特徴を表す複数の数値を導き出すステップと、前記値に対してスカラーまたは非線形変換を適用して輪郭の表示を得るステップとを有する。好適には、この変換は非線形変換であることが望ましい。好適には、CSS表示を用いることが望ましく、また、好適には、展開パラメータに対応するピークの高さを示す値を変換することが望ましい。
本発明の場合のように、特にCSS値に対して変換を適用することにより、オブジェクト検索のパフォーマンスが改善することが判明した。
この発明に係る請求項1に記載の画像中に現れるオブジェクトを表示する方法は、1つの画像または一連の画像に対応する信号を処理することにより、画像中に現れるオブジェクトを表示する方法であって、信号に基づいて、複数回に渡ってオブジェクトの輪郭を平滑化することによって、適用された平滑化のパラメータに対応したピークの高さの値を複数有する、オブジェクトの輪郭の曲率スケール空間(CSS)画像を導き出すステップと、オブジェクトのCSS画像内のピークの縦座標値を複数導き出すステップと、非線形変換をピークの縦座標値におけるピークの高さに対して適用するステップとを有し、非線形変換による変換後の座標値は、輪郭の表示である記述子の要素を形成するために用いられ、CSS表示を導き出す方法として、2項フィルタが用いられる。
この発明に係る請求項2に記載の画像中に現れるオブジェクトを表示する方法は、2項フィルタが、係数(1/4、1/2、1/4)を有する。
この発明に係る請求項に記載の画像中に現れるオブジェクトを検索する方法は、1つの画像または一連の画像に対応する信号を処理することにより、画像中に現れるオブジェクトを検索する方法であって、2次元の輪郭の形状のクエリを入力するステップと、請求項1または2に記載の方法を用いて輪郭の記述子を導き出すステップと、請求項1または2に記載の方法を用いて導出され、記憶された画像内のオブジェクトの記述子を取得し、クエリの記述子と、記憶されたオブジェクトに対するそれぞれの記述子とを比較するステップと、クエリとの類似度を示す比較がなされたオブジェクトを含む画像に対応した、少なくとも1つの比較結果を選択し、表示するステップとを有する。
この発明に係る請求項4に記載の画像中に現れるオブジェクトを表示する装置は、1つの画像または一連の画像に対応する信号を処理することにより、画像中に現れるオブジェクトを表示する装置であって、信号に基づいて、複数回に渡ってオブジェクトの輪郭を平滑化することによって、適用された平滑化のパラメータに対応したピークの高さの値を複数有する、オブジェクトの輪郭の曲率スケール空間(CSS)画像を導き出す手段と、オブジェクトのCSS画像内のピークの縦座標値を複数導き出す手段と、非線形変換をピークの縦座標値におけるピークの高さに対して適用する手段とを有し、非線形変換による変換後の座標値は、輪郭の表示である記述子の要素を形成するために用いられ、CSS表示を導き出す方法として、2項フィルタが用いられる。
この発明に係る請求項5に記載の画像中に現れるオブジェクトを検索する装置は、1つの画像または一連の画像に対応する信号を処理することにより、画像中に現れるオブジェクトを検索する装置であって、2次元の輪郭の形状のクエリを入力する手段と、請求項4に記載の装置を用いて輪郭の記述子を導き出す手段と、請求項4に記載の装置を用いて導出され、記憶された画像内のオブジェクトの記述子を取得し、クエリの記述子と、記憶されたオブジェクトに対するそれぞれの記述子とを比較する手段と、クエリとの類似度を示す比較がなされたオブジェクトを含む画像に対応した、少なくとも1つの比較結果を選択し、表示する手段とを有する。
この発明に係る請求項6に記載の画像中に現れるオブジェクトを表示するコンピュータ・システムは、請求項1ないしのいずれか1項に記載の方法に従って作動するようにプログラムされている。
この発明に係る請求項7に記載のコンピュータ・プログラムは、請求項1ないしのいずれか1項に記載の方法処理ステップをコンピュータに実行させるためのものである
本発明によるシステムは例えば画像ライブラリ中に設けることができる。或いは、データベースは、インターネットのようなネットワークにより電話線のような一時的リンクによって制御装置と接続し、システムの制御装置から遠隔地に配置することができる。例えば、画像データベースおよび記述子データベースは永久記憶装置またはROMやDVDのような携帯用記憶媒体中に設けることができる。
ビデオ・データベース・システムのブロック図である。 オブジェクトの輪郭の図である。 図2の輪郭を示すCSS表示の図である。 ある形状の表示を例示する図である。 あるオブジェクトの形状を示す図である。 図5の形状のCSS表示の図である。 図5の形状の変換された表示の図である。 検索方法を例示するブロック図である。
添付図面を参照して本発明の実施の形態について説明する。
実施の形態1.
図1は、本発明の実施の形態によるコンピュータ処理を行うビデオ・データベース・システムを図示する。このシステムには、コンピュータの形の制御装置2、モニターの形の表示装置4、マウスの形のポインティング・デバイス6、保存された静止画像とビデオ画像とを含む画像データベース8および画像データベース8に保存された画像中に現れるオブジェクトまたはオブジェクトのいくつかの部分の記述子を保存する記述子データベース10が含まれる。
画像データベースの画像中に現れる興味のある各オブジェクトの形状を表す記述子は、制御装置2によって導き出され、記述子データベース10に保存される。制御装置2は、以下に説明するような方法を実行する適切なプログラムの制御によって動作して記述子を導き出す。
第一に、所定のオブジェクトの輪郭について、この輪郭のCSS表示が導き出される。上述の論文の1つに記載されているような周知の方法を用いてこのCSS表示が行われる。
さらに具体的には、この輪郭は写像表現Ψ={(x(u),y(u),u∈[0,1]}によって表される(ただし、uは正規化された弧長パラメータである)。
この輪郭は、IDガウスカーネルg(u,ρ)を用いて畳み込みを行う(convolve)ことにより平滑化され、ρの変化として展開(evolving)曲線の曲率ゼロ・クロスが調べられる。ゼロクロスは曲率を表す下記の式を用いて特定される。
Figure 0005236719
但し、
Figure 0005236719
かつ、
Figure 0005236719
上記で、*は畳み込みを表し、添え字は導関数を表す。
曲率ゼロ・クロスの数はρの変化につれて変化し、ρが十分に高いときΨはゼロ・クロスの凸状の曲線となる。
ゼロクロス・ポイントはCSS画像空間として知られるグラフ上にプロットされる。この結果複数の特徴を示す曲線が生じる。この特徴を示す曲線のピークが特定され、対応する縦座標が抽出され保存される。一般に上記の結果、n個の座標の対((x1, y1)、(x2, y2)、...(xn, yn)の集合(ただし、nはピークの数、xiはi番目のピークの弧長の位置、yiはピークの高さである)が与えられる。
本実施の形態では、ガウスフィルタの近似値として係数(1/4、1/2、1/4)の2項フィルタが用いられ計算上の複雑さが若干減少する。この計算上の複雑さの減少は、DSPや汎用プロセッサ上で効率的に実行することができる便利なフィルタ係数から結果として生じるものである。
次いで、ピーク値、すなわちピークを表すy成分値はさらに処理される。具体的には、y値は次の変換を用いて変換される。
Figure 0005236719
但し、pow(y,b)はybを示す。
この結果、ピーク値[(x1,y'1)、(x22,y'2)...(xn,y'n)]からなる新しい集合が生じ、これらの値は輪郭を示す記述子として記述子データベースに保存される。
特定の例として、図2に図示の輪郭は図3に図示のようなCSS画像を結果として生じる。CSS画像中の曲線のピークの縦座標の詳細を以下の表1に示す。
Figure 0005236719
次いで、a=6、b=0.5、c=0を用いて上記の変換が適用される。すなわち、元のy値の平方根を計算しこれに定数を乗じる。この結果以下の値が生じる:
Figure 0005236719
ここで、これらの値は最も近い整数に丸められるが、別の丸め方を用いてもよい。
実施の形態2. 別の例を図4に示す。 図5はオブジェクト形状(この場合カメ)についてのもう1つの例を図示するものである。図6は図5の形状のCSSピーク示す。図7は、a=6、b=0.5、c=0を用いて上記式(1)で示す変換を用いた図6の変換されたピークを示す。
保存された記述子は検索目的に利用される。ユーザーは、ポインティング・デバイスを用いて、ディスプレイ上にオブジェクトの輪郭を描くことにより検索を開始する(ステップ510)。次いで、制御装置2が入力輪郭のCSS表示を導き出し(ステップ520)、次いで、上述のようにy値に対する変換が適用される(ステップ530)。次いで、この結果生じる入力輪郭の記述子は、以下モデル記述子として知られる記述子データベースに保存された各記述子と公知のマッチング手順を用いて比較される(ステップ540)。
このマッチング比較は適切なアルゴリズムを用いて行われ、データベースに各記述子の類似度測定値が結果として得られる。上述の論文に記載されているような公知のマッチング・アルゴリズムを用いてもよい。このマッチング手順について以下簡単に説明する。
2つの閉鎖した輪郭の形状、画像曲線Ψiとモデル曲線Ψmおよびそれらの曲線のピークのそれぞれの設定値{(xi1, yi1),(xi2, yi2),..,(xin, yin)}と{(xm1, ym1), (xm2, ym2),..,(xmn, ymn)}が与えられれば、類似度測定値が計算される。類似度測定値は、画像中のピークとモデル中のピークのマッチングの総コストとして定義される。総コストを最少化するマッチングはダイナミック・プログラミングを用いて計算される。アルゴリズムによって、モデルから得たピークが画像から得たピークに再帰的にマッチされ、このようなマッチの各々のコスト計算が行われる。各モデルのピークを唯一の画像ピークとマッチさせることができ、各画像ピークを唯一のモデル・ピークとマッチさせることができる。モデルおよび/または画像ピークのなかにはマッチしないままのものがある場合もあり、各マッチしないピークについては追加のペナルティ・コストが存在する。2つのピークの水平距離が0.2未満の場合、2つのピークをマッチすることができる。マッチのコストは2つのマッチしたピーク間の直線の長さである。マッチしなかったピークのコストはその高さである。
更に詳述すれば、アルゴリズムは、ノードがマッチしたピークに対応するツリー状の構造を作成し拡張することにより機能する。
1.画像(xik, yik)の最大値とモデル(xir, yir)の最大値とから成る開始ノードを作成する。
2.画像ピークの最大値の80%以内の各残りのモデル・ピークについて追加の開始ノードを作成する。
3.1および2で作成した各開始ノードのコストを、この開始ノードとリンクした画像ピークおよびモデル・ピークのy座標の差の絶対値に初期化する。
4.3の各開始ノードについて、この開始ノードでマッチしたモデル・ピークと画像ピークのx(水平)座標の差として定義するCSSシフト・パラメータアルファを計算する。シフト・パラメータは各ノードについて異なるものとなる。
5.各開始ノードについて、モデル・ピークのリストおよび画像ピークのリストを作成する。このリストにはどのピークがまだマッチしていないかに関する情報が含まれる。各開始ノードについて、“マッチしたもの”としてこのノードでマッチしたピークにマークをつけ、他のすべてのピークには“マッチしなかったもの”としてマークをつける。
6.ポイント8の条件が満たされるまで、最低コストのノードを再帰的に拡大する(ステップ1〜6で作成した各ノードから始めて、各ノードの子ノードが後に続く)。ノードを拡大するために以下の手順を用いる。
7.ノードの拡大:
マッチしないままになっている少なくとも1つの画像と1つのモデル・ピークが存在する場合、
マッチしない最も大きなスケール画像曲線CSSの最大値(xip, yip)を選択する。(ステップ4で計算した)開始ノード・シフト・パラメータを適用して選択した最大値をモデルCSS画像に写像し、選択されたピークは座標(xip-alpha, yip)を持つことになる。マッチしない最も近いモデル曲線ピーク(xms, yms)を決定する。2つのピーク間の水平距離が0.2未満(すなわち|xip-alpha-xms|<0.2)である場合、2つのピークをマッチさせ、2つのピーク間の直線の長さとしてマッチのコストを定義する。そのノードの総コストにマッチのコストを加える。マッチしたピークに“マッチした”ものとしてマークをつけることによりそれぞれのリストからマッチしたピークを取り除く。2つのピーク間の水平距離が0.2より大きい場合、画像ピーク(xip, yip)はマッチすることはできない。その場合総コストに画像ピークの高さyipを加え、“マッチした”ものとしてそのピークにマークをつけることにより画像ピーク・リストからピーク(xip, yip)だけを取り除く。
上記条件が当てはまらない(マッチしなかった画像ピークしか存在しない、またはマッチしなかったモデル・ピークしか存在しない)場合、マッチしないままの状態に放置する。
マッチしなかった画像ピークまたはモデル・ピークの最も高い高さとしてマッチのコストを定義しリストからピークを取り除く。
8.7でノードを拡大した後、画像リストおよびモデル・リストの双方にマッチしないピークが存在しない場合マッチング処理は終了する。このノードのコストは画像とモデル曲線間の類似度測定値である。ピークが存在する場合には、ポイント7へ戻り最低コストのノードを拡大する。
画像曲線ピーク値とモデル曲線ピーク値とを交換して上記手順を繰り返す。最終マッチング値はこれら2つのピーク値のうちの低い方の値である。
もう1つの例として、ソートされた順序の各位置について、入力されたx値とそれに対応するモデルのx値との間の距離および入力されたy値とそれに対応するモデルのy値との間の距離が計算される。すべての位置について合計距離が計算され、合計距離が小さければ小さいほどマッチの程度は近くなる。入力輪郭とモデルのピークの数が異なる場合、合計距離の中に残りのマッチしなかったピークの高さが含まれる。
上記ステップがデータベースの各モデルについて繰り返される(ステップ480)。
マッチング比較の結果生じる類似度値がソートされ(ステップ490)、次いで、最も近いマッチング値(すなわち本例では最も低い類似度値)を示す類似度値を持つ記述子に対応するオブジェクトがユーザーに対して表示装置4に表示される(ステップ500)。表示対象のオブジェクト数はユーザーが予め設定するか選択することができる。
実施の形態3.
別の実施の形態について説明する。本実施の形態は、様々な変換が用いられることを除けば前回の実施の形態と同じである。具体的にはy値は以下の変換を用いて変換される:
Figure 0005236719
すなわち、線形スケーリング変換が適用される。
ここで、a0=41、a1=0.19である。
変更例では、a0=0、a1=0.27である。
0、a1の様々な値を適宜使用することができる。
検索およびマッチング手順は前回の実施の形態で説明したものとほぼ同様である。 変換、特に、上述のようなスケーリングまたは非線形変換を含む線形変換を適用することにより、オブジェクト・クラスの範囲で形状輪郭の変化などに対して敏感でない記述子が結果として得られ、その結果オブジェクトの検索の改善という結果が得られるということが判明した。
上述の実施の形態では、記述子データベース10に保存する前のCSS値に対して変換が適用される。上記とは別に、CSS値をデータベース10に保存してもよい。次いで、マッチング手順を行う前に検索処理の一部として変換を行ってもよい。
以上記載の実施の形態では変換はy座標値に対して適用される。しかし、x座標値に対して変換を適用することもできる。
以上説明したようなシステムの構成要素は、ソフトウェアまたはハードウェアの形で設けることができる。コンピュータ・システムの形で本発明について説明したが、本発明は専用チップなどを用いて他の形で実現することもできる。
(本発明ではCSS表示を利用して)オブジェクトの2D形状を表す方法および2つの形状間の類似度を表す値を計算する方法を示す特定の例を示したが、同様の任意の適切な方法を用いることができる。
例えば、確認目的のためのオブジェクト画像のマッチングを行うために、またはフィルタリングを行うために本発明を用いることができる。

Claims (7)

  1. 1つの画像または一連の画像に対応する信号を処理することにより、前記画像中に現れるオブジェクトを表示する方法であって、
    前記信号に基づいて、複数回に渡って前記オブジェクトの輪郭を平滑化することによって、適用された平滑化のパラメータに対応したピークの高さの値を複数有する、前記オブジェクトの前記輪郭の曲率スケール空間(CSS)画像を導き出すステップと、
    前記オブジェクトの前記CSS画像内のピークの縦座標値を複数導き出すステップと、
    非線形変換を前記ピークの縦座標値におけるピークの高さに対して適用するステップと
    を有し、
    前記非線形変換による変換後の座標値は、前記輪郭の表示である記述子の要素を形成するために用いられ、
    CSS表示を導き出す方法として、2項フィルタが用いられる
    ことを特徴とする方法。
  2. 前記2項フィルタは、係数(1/4、1/2、1/4)を有する
    ことを特徴とする請求項1に記載の方法。
  3. 1つの画像または一連の画像に対応する信号を処理することにより、前記画像中に現れるオブジェクトを検索する方法であって、
    2次元の輪郭の形状のクエリを入力するステップと、
    請求項1または2に記載の方法を用いて前記輪郭の記述子を導き出すステップと、
    請求項1または2に記載の方法を用いて導出され、記憶された画像内のオブジェクトの記述子を取得し、前記クエリの記述子と、記憶されたオブジェクトに対するそれぞれの記述子とを比較するステップと、
    前記クエリとの類似度を示す比較がなされたオブジェクトを含む画像に対応した、少なくとも1つの比較結果を選択し、表示するステップと
    を有することを特徴とする方法。
  4. 1つの画像または一連の画像に対応する信号を処理することにより、前記画像中に現れるオブジェクトを表示する装置であって、
    前記信号に基づいて、複数回に渡って前記オブジェクトの輪郭を平滑化することによって、適用された平滑化のパラメータに対応したピークの高さの値を複数有する、前記オブジェクトの前記輪郭の曲率スケール空間(CSS)画像を導き出す手段と、
    前記オブジェクトの前記CSS画像内のピークの縦座標値を複数導き出す手段と、
    非線形変換を前記ピークの縦座標値におけるピークの高さに対して適用する手段と
    を有し、
    前記非線形変換による変換後の座標値は、前記輪郭の表示である記述子の要素を形成するために用いられ、
    CSS表示を導き出す方法として、2項フィルタが用いられる
    ことを特徴とする装置。
  5. 1つの画像または一連の画像に対応する信号を処理することにより、前記画像中に現れるオブジェクトを検索する装置であって、
    2次元の輪郭の形状のクエリを入力する手段と、
    請求項4に記載の装置を用いて前記輪郭の記述子を導き出す手段と、
    請求項4に記載の装置を用いて導出され、記憶された画像内のオブジェクトの記述子を取得し、前記クエリの記述子と、記憶されたオブジェクトに対するそれぞれの記述子とを比較する手段と、
    前記クエリとの類似度を示す比較がなされたオブジェクトを含む画像に対応した、少なくとも1つの比較結果を選択し、表示する手段と
    を有することを特徴とする装置。
  6. 請求項1ないし3のいずれか1項に記載の方法に従って作動するようにプログラムされた画像中に現れるオブジェクトを表示するコンピュータ・システム。
  7. 請求項1ないし3のいずれか1項に記載の方法の処理ステップをコンピュータに実行させるためのコンピュータ・プログラム。
JP2010268522A 1999-07-05 2010-12-01 画像中に現れるオブジェクトを表示または検索する方法、その装置、コンピュータ・システム、及びコンピュータ・プログラム Expired - Lifetime JP5236719B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB9915699.4 1999-07-05
GB9915699A GB2352075B (en) 1999-07-05 1999-07-05 Method and Apparatur for Representing and Searching for an Object in an Image

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2001508782A Division JP4688382B2 (ja) 1999-07-05 2000-07-03 画像中に現れるオブジェクトを表示する方法、その装置、コンピュータ・システム、及びコンピュータ可読記憶媒体

Publications (2)

Publication Number Publication Date
JP2011100468A JP2011100468A (ja) 2011-05-19
JP5236719B2 true JP5236719B2 (ja) 2013-07-17

Family

ID=10856661

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2001508782A Expired - Lifetime JP4688382B2 (ja) 1999-07-05 2000-07-03 画像中に現れるオブジェクトを表示する方法、その装置、コンピュータ・システム、及びコンピュータ可読記憶媒体
JP2010268522A Expired - Lifetime JP5236719B2 (ja) 1999-07-05 2010-12-01 画像中に現れるオブジェクトを表示または検索する方法、その装置、コンピュータ・システム、及びコンピュータ・プログラム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2001508782A Expired - Lifetime JP4688382B2 (ja) 1999-07-05 2000-07-03 画像中に現れるオブジェクトを表示する方法、その装置、コンピュータ・システム、及びコンピュータ可読記憶媒体

Country Status (8)

Country Link
US (6) US6931154B1 (ja)
JP (2) JP4688382B2 (ja)
KR (6) KR100448610B1 (ja)
CN (6) CN1940934B (ja)
BR (1) BR0006896A (ja)
GB (6) GB2394349B (ja)
RU (1) RU2225034C2 (ja)
WO (1) WO2001003069A1 (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100438818B1 (ko) * 1998-09-10 2004-07-16 삼성전자주식회사 2차원 물체 이미지의 표현자 생성방법 및 2차원 물체 이미지의인식방법
GB2391678B (en) * 1999-07-05 2004-05-05 Mitsubishi Electric Inf Tech Method and apparatus for representing and searching for an object in an image
GB2352076B (en) * 1999-07-15 2003-12-17 Mitsubishi Electric Inf Tech Method and apparatus for representing and searching for an object in an image
CA2400161C (en) * 2000-02-22 2015-11-24 Metacarta, Inc. Spatially coding and displaying information
GB2364590B (en) * 2000-07-07 2004-06-02 Mitsubishi Electric Inf Tech Method and apparatus for representing and searching for an object in an image
KR100415074B1 (ko) * 2001-10-09 2004-01-14 채영도 물체의 닮음을 인식하는 방법 및 그 장치
GB2384095B (en) * 2001-12-10 2004-04-28 Cybula Ltd Image recognition
JP2005215985A (ja) * 2004-01-29 2005-08-11 Fujitsu Ltd 走行車線判定プログラムおよびその記録媒体、走行車線判定装置ならびに走行車線判定方法
EP2468853B1 (en) * 2004-06-16 2015-04-01 DSM IP Assets B.V. Method for enzymatic decolorization of pheophytin
US7623685B2 (en) * 2004-08-20 2009-11-24 The Regents Of The University Of Colorado Biometric signatures and identification through the use of projective invariants
EA006327B1 (ru) * 2004-09-08 2005-12-29 Борис Викторович Моисеев Устройство для управления отображением данных на экране дисплея
EP1861506B1 (en) * 2005-03-15 2015-04-15 BP Corporation North America Inc. Cellulases, nucleic acids encoding them and methods for making and using them
CN101657824B (zh) * 2005-03-15 2012-04-04 切夫里昂美国公司 使用改进Newton-Raphson算法求解S形非线性函数的稳定方法和设备
WO2007002800A2 (en) * 2005-06-28 2007-01-04 Metacarta, Inc. User interface for geographic search
US9411896B2 (en) * 2006-02-10 2016-08-09 Nokia Technologies Oy Systems and methods for spatial thumbnails and companion maps for media objects
US20080010273A1 (en) 2006-06-12 2008-01-10 Metacarta, Inc. Systems and methods for hierarchical organization and presentation of geographic search results
US20080140348A1 (en) * 2006-10-31 2008-06-12 Metacarta, Inc. Systems and methods for predictive models using geographic text search
US9721157B2 (en) 2006-08-04 2017-08-01 Nokia Technologies Oy Systems and methods for obtaining and using information from map images
WO2009075689A2 (en) * 2006-12-21 2009-06-18 Metacarta, Inc. Methods of systems of using geographic meta-metadata in information retrieval and document displays
BR112012015945A2 (pt) * 2009-12-30 2019-02-12 Nokia Corp métodos e aparelhos para facilitar a recuperação de imagem baseada em conteúdo
KR101244934B1 (ko) * 2011-12-06 2013-03-19 경북대학교 산학협력단 코드북을 이용한 객체 인식 장치, 객체 인식 방법 및 기록 매체
US8687104B2 (en) * 2012-03-27 2014-04-01 Amazon Technologies, Inc. User-guided object identification
CN106462774B (zh) * 2014-02-14 2020-01-24 河谷控股Ip有限责任公司 通过规范形状的对象摄取、系统和方法
CN109544542B (zh) * 2018-11-29 2020-10-30 蚌埠翰邦知识产权服务有限公司 清洗次数设定平台
US11941863B2 (en) * 2021-08-04 2024-03-26 Datalogic Ip Tech S.R.L. Imaging system and method using a multi-layer model approach to provide robust object detection

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2203877A (en) * 1986-09-18 1988-10-26 Violet Frances Leavers Shape parametrisation
WO1988002158A1 (en) * 1986-09-18 1988-03-24 Violet Frances Leavers Shape detection
US4989257A (en) * 1987-03-13 1991-01-29 Gtx Corporation Method and apparatus for generating size and orientation invariant shape features
US4802230A (en) * 1987-03-13 1989-01-31 Gtx Corporation Method and apparatus for generating size and orientation invariant shape features
US5081689A (en) * 1989-03-27 1992-01-14 Hughes Aircraft Company Apparatus and method for extracting edges and lines
JPH0820725B2 (ja) * 1990-02-06 1996-03-04 大日本スクリーン製造株式会社 画像輪郭データの作成方法
JPH07504056A (ja) * 1992-02-18 1995-04-27 ネオパス,インク. データ処理技術を使用して物体を識別するための方法
US6182069B1 (en) * 1992-11-09 2001-01-30 International Business Machines Corporation Video query system and method
JPH06309465A (ja) * 1993-04-21 1994-11-04 Nippon Telegr & Teleph Corp <Ntt> 線図形学習認識方法
US5487116A (en) * 1993-05-25 1996-01-23 Matsushita Electric Industrial Co., Ltd. Vehicle recognition apparatus
JP3162918B2 (ja) * 1994-10-14 2001-05-08 キヤノン株式会社 画像処理装置および方法
US6014461A (en) * 1994-11-30 2000-01-11 Texas Instruments Incorporated Apparatus and method for automatic knowlege-based object identification
JPH1055447A (ja) * 1996-05-21 1998-02-24 Monorisu:Kk オブジェクト認識方法およびその方法を用いた装置
KR100305591B1 (ko) * 1998-07-22 2001-11-30 오길록 관절점기반동작정보를사용한동영상검색방법
GB2391678B (en) 1999-07-05 2004-05-05 Mitsubishi Electric Inf Tech Method and apparatus for representing and searching for an object in an image
US6457766B1 (en) 2001-11-10 2002-10-01 Lee J. Telnack Vehicle streamlining structure

Also Published As

Publication number Publication date
US7505628B2 (en) 2009-03-17
CN1940934B (zh) 2010-06-16
GB2391374A (en) 2004-02-04
KR20030078932A (ko) 2003-10-08
US20080131003A1 (en) 2008-06-05
US6931154B1 (en) 2005-08-16
CN100399331C (zh) 2008-07-02
US20080056583A1 (en) 2008-03-06
US7430338B2 (en) 2008-09-30
KR100937273B1 (ko) 2010-01-18
US7532775B2 (en) 2009-05-12
GB2352075B (en) 2004-06-16
WO2001003069A8 (fr) 2001-03-22
GB2352075A (en) 2001-01-17
GB2391099A (en) 2004-01-28
US7505638B2 (en) 2009-03-17
GB0324370D0 (en) 2003-11-19
KR20070073925A (ko) 2007-07-10
GB2391374B (en) 2004-06-16
US20080063310A1 (en) 2008-03-13
GB2393839B (en) 2004-06-16
KR100448610B1 (ko) 2004-09-13
JP2011100468A (ja) 2011-05-19
CN1940932A (zh) 2007-04-04
CN1940932B (zh) 2010-06-16
CN1940935A (zh) 2007-04-04
GB2394350B (en) 2004-06-16
KR100892470B1 (ko) 2009-04-10
KR100809831B1 (ko) 2008-03-04
CN1940933A (zh) 2007-04-04
GB0324377D0 (en) 2003-11-19
US20070258659A1 (en) 2007-11-08
WO2001003069A1 (fr) 2001-01-11
GB9915699D0 (en) 1999-09-08
GB0401488D0 (en) 2004-02-25
RU2225034C2 (ru) 2004-02-27
KR20080100393A (ko) 2008-11-17
GB2394349A (en) 2004-04-21
US20050238236A1 (en) 2005-10-27
BR0006896A (pt) 2001-06-12
GB2393839A (en) 2004-04-07
KR100944584B1 (ko) 2010-02-25
KR20010073125A (ko) 2001-07-31
CN1684094A (zh) 2005-10-19
GB0401486D0 (en) 2004-02-25
GB0329841D0 (en) 2004-01-28
CN1940933B (zh) 2010-06-23
KR100732109B1 (ko) 2007-06-27
US7257277B2 (en) 2007-08-14
CN1316082A (zh) 2001-10-03
CN1940934A (zh) 2007-04-04
KR20060066140A (ko) 2006-06-15
KR20040053208A (ko) 2004-06-23
GB2391099B (en) 2004-06-16
CN1292387C (zh) 2006-12-27
JP4688382B2 (ja) 2011-05-25
GB2394350A (en) 2004-04-21
CN1940935B (zh) 2010-06-16
GB2394349B (en) 2004-06-16

Similar Documents

Publication Publication Date Title
JP5236719B2 (ja) 画像中に現れるオブジェクトを表示または検索する方法、その装置、コンピュータ・システム、及びコンピュータ・プログラム
JP4875200B2 (ja) 画像中に現れるオブジェクトを検索する方法、その装置、コンピュータ・プログラム、コンピュータ・システム、及びコンピュータ可読記憶媒体
US7664327B2 (en) Method, apparatus, computer program, computer system and computer-readable storage for representing and searching for an object in an image
MXPA01002353A (en) Method and device for displaying or searching for object in image and computer-readable storage medium

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120110

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120410

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120413

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120510

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120515

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120611

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120614

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120710

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120911

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130226

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130327

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160405

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350