JP2001515629A - イメージのマルチスケールエッジ表示を用いる高速イメージ検索 - Google Patents

イメージのマルチスケールエッジ表示を用いる高速イメージ検索

Info

Publication number
JP2001515629A
JP2001515629A JP53586199A JP53586199A JP2001515629A JP 2001515629 A JP2001515629 A JP 2001515629A JP 53586199 A JP53586199 A JP 53586199A JP 53586199 A JP53586199 A JP 53586199A JP 2001515629 A JP2001515629 A JP 2001515629A
Authority
JP
Japan
Prior art keywords
image
database
images
feature vector
forming
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP53586199A
Other languages
English (en)
Inventor
ランジット デサイ
モハメド アブデル−モッタレブ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Electronics NV filed Critical Philips Electronics NV
Publication of JP2001515629A publication Critical patent/JP2001515629A/ja
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99932Access augmentation or optimizing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 イメージ検索装置は、ユーザ−入力ターゲットイメージとの一致の程度に依存してデータベースからイメージを検索する。ターゲットイメージ及びデータベースの各イメージは、各イメージ内のエッジ特徴のベクトルによって特徴づけられる。検索は、イメージそれ自体の比較ではなく特徴ベクトルの比較によって行われる。パフォーマンスを最適にするために、イメージの抽象の相違するレベルで、特徴ベクトルの組を各データベースイメージに関連させる。ターゲットイメージに類似するイメージが、任意の抽象レベルで検索される。検索速度を更に最適にするために、データベースをクラスタに区画化し、検索を、ターゲットイメージに最も類似するクラスタに制限する。

Description

【発明の詳細な説明】 イメージのマルチスケールエッジ表示を用いる高速イメージ検索 発明の背景1.発明の分野 イメージのマルチスケールエッジ表示を使用するイメージ検索方法及び装置を開 示する。本発明によって、デジタル的に符号化された写真、CADデザイン線画 、ビデオシーン等のイメージを、高速検索のためにカテゴリー化することができ る。検索を、特徴エッジを有するスケッチ又はイメージを提供することによって 行う。イメージは、提供されたスケッチ又はイメージに対する類似の順序で検索 され及び提供される。本発明は、特に、写真アーカイブ、デジタル図書館、カタ ログ、ビデオのような大容量のイメージデータベースからのイメージ検索に利用 できる。2.関連技術の説明 データベースに格納されたビデオを検索するのに通常は種々の技術が用いられ ている。所望の特徴に適合するイメージを格納し及び検索する最も一般的な技術 は、「肖像」、「海洋画」、「山」、「大統領」のような各イメージにキーワードを関連 させることである。イメージに対してこのような関連のキーワードを有するので 、ユーザは、1個以上の検索ワードを探索すなわち検索装置に提供し、装置は、 検索ワードと記憶されたキーワードとの間の一致の程度に依存して1個以上のイ メージを表示する。通常のインターネット検索エンジンは、このような検索手段 に基づくテキストの例である。 検索に基づくグラフィックは、イメージ検索に対して最も直感的なアプローチ である。通常の検索装置に基づくグラフィッタは、種々の形態の色又はパターン の整合を用いる。典型的には、ユーザはサンプルイメージを提供し、装置は、同 様なパターンの色を有するイメージを検索する。例えば、海洋画のイメージを提 供することによって、検索したイメージは、下側に青色又は緑色を有し、中間に ベージュ色又は茶色を有し、上側に青色/白色を有するイメージとなる。通常の パターン整合技術を用いることもできる。例えば、イメージを、山のシーンに対 する上が尖った三角形とボディ形状に対する円及び矩形等との混合のような認識 できるパターンを有するようにカテゴリー化することができる。三角形のうちの 円のターゲットイメージは、例えば、背景に山を有する人の頭の写真を検索し、 矩形内の4個の円は、ルシモール(Rushmore)山の写真を検索する。 正式なアルゴリズム的アプローチも利用されている。1977年に刊行された IEEE Trans.Computers,Vol.C−26,No.10の 988−998ページのFrei及びChen.C.C,による論文“Fast Boundary detection:A generation an anew algorithm”において、ユーザは、スケッチ、線画又は詳細 なイメージを提供し、イメージ検索は、抽象レベルでスケッチをデータベース中 の各イメージと比較することによって行われる。各データベースイメージを、実 際のイメージの抽象画であるアイコンに関連させる。ターゲットアイコンは、タ ーゲットイメージを提供したユーザの抽象画から形成される。各データベースイ メージアイコンは、アイコン間の局所的又は全体的な相関の程度を算出すること によって、ターゲットイメージアイコンに対して算出される。最も強固な相関を 有するアイコンに関連したイメージがユーザに提供される。 これら現存するイメージ検索方法は、検索プロセス中に多量の分析及び演算を 必要とし、テキストに基づく検索技術に比べて著しく効率の悪い図形例によって イメージ検索を行う。しかしながら、テキストに基づく画像検索は、キーボード による各画像のカテゴリー化が要求され、これは、数百又は数千のイメージに適 用される場合には厄介なプロセスとなるおそれがある。また、キーボードの個別 の選択によって、記憶イメージを描写するためにカテゴライザが用いたワードと 所望のイメージを描写するためにサーチャが用いるワードとの間の一致の程度の 検索の有効性が制限される。パターンに基づく装置は、特徴パターンを予め決定 する必要があり、検索の効率及び有効性は、データベース中の相違する特性パタ ーンに直接関連する。 発明の要約 本発明の目的は、有効であり、かつ、データベースのイメージをカテゴリー化 するのに手動操作を必要としない図形に基づくイメージ検索装置を提供すること である。 本発明の他の目的は、データベースのイメージの内容に関係なく用いることが できるカテゴリー化方法を提供することである。 本発明の他の目的は、少ないユーザ入力で検索を行うことができるイメージ検 索装置を提供することである。 本発明によれば、イメージは、エッジ成分の関連の特徴とともにデータベース に格納される。同様な特徴を有するイメージはクラスタにグループ化される。ユ ーザは、ターゲットイメージをスケッチ又は詳細な形態で入力する。検索装置は 、データベースのイメージを特徴づけるのに用いられる技術と同一の技術を用い て、ターゲットイメージのエッジ成分を特徴づける。ターゲット特徴と同様な特 徴を有するクラスタが識別され、これらクラスタ内のイメージの特徴が、ターゲ ット特徴に対して算出ざれる。ターゲット特徴に対して最も類似した特徴を有す るイメージが表示用に提供される。特徴技術を用いることによって、各イメージ に対するターゲットの比較が迅速に行われる。階層的なクラスター化を行うこと によって、比較の数が減少され、比較のオーダを減少させることができる。 同一でないにもかかわらず装置が同様なイメージを配置することができるよう にするために、マルチスケール表示を利用する。本発明によれば、各イメージは 、複数のレベルの詳細で特徴づけられ、詳細レベルの各々の特徴をイメージに関 連させる。このようにして、ターゲットに全体的に類似するイメージが、ターゲ ットに最も類似するイメージとともに、表示の際に任意の詳細レベルで識別され る。 図面の簡単な説明 図1は、イメージ検索装置を示す。 図2は、本発明によるイメージ検索データベースを形成するフローチャートを 示す。 図3は、本発明によるイメージを検索するフローチャートを示す。 好適な実施の形態の説明 図1はイメージ検索装置を示す。ユーザ110は、グラフィック入力装置12 1を用いて、ターゲットイメージのグラフィック表示をコントローラ130に供 給する。グラフィック入力装置121を、イメージスキャナ、デジタイザ、カメ ラ等とすることができる。それを、通常のマウス又はキーボードとすることがで き、グラフィックディスプレイ120と組み合わせて用いる場合、ターゲットイ メージを選択し又は形成するのに用いることができる。例えば、マウス及びディ スプレイを、通常利用できるコンピュータ線画パッケージを用いることによって 、イメージのスケッチを形成するのに利用することができる。マウス及びキーボ ードを、格納されたイメージから選択するのに利用することができる。スキャナ を利用して、写真又は線画のコピーを提供する。ユーザは、入力イメージを修正 して、ターゲットイメージを洗練し又は修正することができる。 コントローラ130を、ローカルディスクメモリ140、リモートディスクメ モリ142、記憶装置144等に配置することができるイメージのデータベース に接続する。イメージを、既に説明したようにスキャナや、デジタイザや、カメ ラのような入力装置を用いて形成し及び格納する。さらに、それらイメージを、 MPEG符号化ビデオや通常のビデオカセットテープで見つけられるように一連 の関連のイメージとすることができる。ここでは、用語データベースを、アイテ ム(イメージ)の収集を意味するものとし、その各々を、典型的には装置内のロ ケーションに対するアドレス又はインデックスによって独自に識別することがで きる。例えば、リモートディスクのイメージを、ファイルネームが続くディスク の指示によってアドレス指定することができる。カセットテープのイメージを、 イメージ又はフレームがテープ上のどこに配置されているかを識別するインデッ クスに続くカセットのタイトルによってアドレス指定することができる。従来窺 知のように、データベースを分布させることができ、単一の物理装置にある必要 も全ての装置に共通のアドレス形態にする必要もない。すなわち、ここで用いら れているように、イメージデータベースは、イメージを有する物理媒体に依存せ ず、各イメージにアクセスする技術に依存する媒体に依存しない。 本発明によれば、データベース内の各イメージは、イメージに含まれるエッジ のパターンに基づいて特徴づけられる。複数の技術が、イメージ内のエッジの検 出に利用できる。好適な実施の形態において、エッジを、上記文献のFrei及 びChenの技術を適用することによって決定して、検出可能なエッジの発生を 決定する。各エッジは、垂直、水平、左−対角線又は右−対角線として特徴づけ られる。雑音の影響を最小にするために、同一方向に3個の連続点を形成するエ ッジ点のみを利用する。相違するレベルのフィルタ処理を、多少の連続点を要求 することによって行うことができる。したがって、イメージ中の各点すなわち画 像素子(画素)は、エッジ上にあるか否かによって識別され、エッジ上にある場 合、4方向のうちのいずれかにエッジを向ける。イメージ中のエッジに関するイ メージの各画素を特徴づける他の手段は当業者には既知である。 イメージ中の各画素の特徴に基づいてイメージを特徴づけるために、ブロック ヒストグラム技術が用いられる。イメージは、個別のブロックに分解されすなわ ち区画化される。好適な実施の形態において、各イメージを、16×16格子の ブロック(256格子ブロック)に分解される。イメージが主に矩形である場合 、非対称格子構造を用いることができる。Mブロック(好適な実施の形態では、 M=256)の各々に対して、ブロック内の画素の特徴のヒストグラムを演算す る。好適な実施の形態では、ヒストグラムは、水平エッジ、垂直エッジ及び2個 の対角線エッジの各々にあるブロック内に複数の画素を具える。別の画素特徴を 用いる場合、既に説明したように、ヒストグラムは、画素特徴カテゴリーの各々 に従う画素数を有する。各ヒストグラムを、ブロック中の全エッジ数に対して正 規化する。 したがって、本発明によれば、各イメージは、N個のエッジタイプのうちのM 個の規格化されたヒストグラムによって特徴づけられる。好適な実施の形態では 、各イメージは、256(M)×4(N)ベクトルによって特徴づけられる。す なわち、従来の装置における他のイメージによるイメージの特徴づけに比べて、 イメージは、エッジそれ自体ではなくエッジの特徴を表すベクトル又はマトリッ クスによって特徴づけられる。当業者には明らかなように、相違するイメージは 、それらが同様なエッジを有しなくても同様なエッジの特徴を有することができ る。本発明は、検索速度の向上によって得られる利点が誤りの起こりやすい検索 によって生じる不利益に優るという仮定に基づく。 ターゲットイメージの一般的な特徴に従うイメージの整合を確実にするために 、詳細な相違があるとしても、各イメージは、既に説明したヒストグラム法すな わち分解によって特徴づけられる。変動するレベルの詳細でイメージを表す複数 の 技術が従来既知である。例えば、インターネット上では、イメージは、最小の詳 細(不明瞭なエッジ等)で送信され、その後の連続的な送信によって洗練される 。好適な実施の形態において、元のイメージの連続的なブラーリングイメージが 、連続的な幅のガウス核(Gaussian kernel)によって得られる 。元のイメージは、零(0)のガウス核の畳み込みに相当する。好適な実施の形 態では、5及び7のガウス核幅を用いて、元のイメージの2個の連続的なブラー リング表示を得る。他の技術を用いて、イメージのブラーリング表示を得ること ができ、2個より多い又は少ないブラーリング表示を利用することができる。ブ ラーリング表示の各々は、既に説明したようにブロックヒストグラムによって順 次特徴づけられる。 本発明によれば、各イメージを、Lレベルの詳細でM×Nエッジ特徴によって 表される。好適な実施の形態において、イメージの各々は、3個のガウス幅(0 ,5,7)の各々のイメージの畳み込みによって生じた詳細のレベルでサイズ2 56×4(16×16ブロック、4エッジ特徴)のブロックヒストグラムベクト ルによって表される。 各イメージのこれらヒストグラム表示を配置して、探索に有効な区画化を行う ために、イメージをクラスタにグループ化する。クラスタは、同様なヒストグラ ム特徴を有するイメージを具える。このクラスタ化は、詳細のレベルの各々で行 われ、詳細な各レベルは、独立したクラスタ化を有する。任意の数のクラスタ化 技術を用いることができ、好適な実施の形態では、詳細の各レベルのイメージの 全データベースを、K−平均クラスタ化(K−means clusterin g)を用いて区画化する。好適な実施の形態において、K、クラスタの数を8に 等しくする。このように全データベースをK−クラスタに区画化することによっ て、区画化は、相違するデータベース内のイメージの相違のレベルの変動を自動 的に補償する。例えば、好適な実施の形態において、データベースは、肖像、風 景、建物、集合写真の寄せ集めを具え、肖像の全てを1又は2クラスタに区画化 することを予測することができる。それに対して、データベースが肖像のみであ る場合、クラスタを、肖像の8個の相違する特徴の間で区別するように形成する 。そのようなクラスタ化技術は従来既知である。8より多い又は少ないクラスタ 区画 化を用いることができる。区画を増大させることによって探索プロセスの速度が 上がるが、探索の幅が制限され、イメージを見失うおそれがあり、探索者も同様 に考える。区画を減少させることによって探索プロセスは遅くなるが、探索の幅 が増大し、探索イメージのようにイメージを省略するおそれが少なくなる。 したがって、本発明によれば、データベースは、Lレベルの詳細の各々のイメ ージの各々のM×Nヒストグラムベクトルの特徴に基づいて、Lレベルの詳細の 各々でKクラスタのイメージに区画化する。好適な実施の形態において、K=8 ,L=3,M=256及びN=4とする。 図2は、本発明によるデータベースのイメージを特徴づけるフローチャートを 示す。データベースイメージを特徴づけ及びカテゴリー化するプロセスは200 から開始する。各データベースイメージは、210−259のループで処理され る。215では、データベースイメージは、詳細の相違するレベルの各々でL個 のイメージを形成するように畳み込まれる。L個のイメージの各々は、220ー 249のループで処理される。畳み込まれたイメージ内のエッジが222で検出 され、畳み込まれたイメージ内の画素は、224において、検出したエッジに依 存して特徴づけられる。イメージはMブロックに区画化され、各ブロックは23 0−239のループで処理される。このループの235では、ブロック内の画素 のエッジの特徴は、ブロックに関連するヒストグラムに要約され及び正規化され る。240において、Mブロックのヒストグラムは、畳み込まれたイメージに関 連するヒストグラムベクトルを形成する。データベースイメージに関連するL個 のヒストグラムベクトルが、250で格納される。 全てのデータベースイメージを、Lレベルの詳細で証明したヒストグラムベク トルとして処理した後、データベースは、260−269のループにおいて、各 レベルの詳細に対するクラスタに区画化される。265において、各レベルの詳 細のデータベース・イメージをK個のクラスタに区画化する。各データベースイ メージを、N個のエッジ特徴のMブロックのL個のヒストグラムベクトルに特徴 づけ、次いで、ヒストグラムベクトルを、Lレベルの詳細の各々でK個のクラス タにカテゴリー化し.299でプロセスを終了する。 上記イメージのカテゴリー化及び特徴づけに基づくデータベースからのイメー ジの検索を、後に説明する。既に説明したように、K,L,M及びNの選択は制 約がないが、その選択は、当業者には理解できるように、整合プロセスの効率及 び有効性に影響を及ぼす。同様に、エッジを特徴づけるのに用いられる特定のプ ロセスは、詳細の相違するレベルでイメージを形成し、特徴のクラスタへの区画 化も、当業者には明らかなように自由に選択される。 図3は、上記イメージのカテゴリー化及び特徴づけを行うデータベースからイ メージを検索するフローチャートを示す。イメージの検索者は、表示ターゲット イメージを310で提供する。このターゲットイメージを、スケッチ、線画、十 分詳細なイメージ等とすることができる。ターゲットイメージを、データベース のイメージを特徴づけるのに用いられるプロセスと同様に処理し、図2及び3に おいて同一参照番号を同様なプロセスに対して付す。ターゲットイメージが、既 に抽象的なイメージであるスケッチである場合、それはLレベルの詳細に畳み込 まれない。それが詳細なイメージである場合、データベースイメージに適用され るのと同一の畳み込みが適用されて、詳細の各レベルでターゲットイメージを発 生させる。222において、エッジはターゲットイメージ中で識別され、224 において、ターゲットイメージの画素は、データベース中のイメージの特徴づけ にどのような方法を用いても、識別されたエッジによって特徴づけられる。ター ゲットイメージは、226でM個のブロックに区画化され、ヒストグラムベクト ルは、230−240でデータベースイメージのヒストグラムベクトルと同様に して形成される。 ループ350−359に示すように、詳細Lの各レベルで、ターゲットヒスト グラムベクトルに最も近接するクラスタを決定する。360で、L個の最も近接 するクラスタは、識別され及びスーパクラスタ(supercluster)に グループ化される。このスーパクラスタの冗長は、データベースイメージがスー パクラスタに一度だけ含まれるようにして除去される。このスーパクラスタ内の ヒストグラムベクトルのみが次の探索に対して選択される。ループ370−37 9において、ターゲットヒストグラムベクトルとデータベースイメージヒストグ ラムベクトルの各々との間の距離が算出される。ソートされたリストをこのルー プ中で形成し、この場合、イメージの識別子を、ターゲットヒストグラムベクト ルからの距離が増大するような順序でリストに配置する。このように配置された リストは、典型的には最も近接する最初の10個の画像、次に近接する10個の 画像、等々を表示することによってイメージをユーザに表示するために、399 で戻される。 ターゲットヒストグラムベクトルからイメージヒストグラムベクトルまでの距 離を、種々の方法で決定することができる。好適な実施の形態において、ベクト ルのブロック間のn次のユークリッド距離を利用する。すなわち、ブロック間の 距離Dは、 となる。この場合、Nを、エッジ特徴の数とし、Tjを、エッジ特徴の各々に対 するターゲットヒストグラムエントリーとし、Ijを、イメージヒストグラムエ ントリーとする。好適な実施の形態において、N=4とし、4個のエッジ特徴を 、水平、垂直、左−対角線及び右−対角線とする。ヒストグラムエントリーを、 各々が特徴を有する正規化された数の画素とする。ベクトル間の距離を形成する ために、距離の平均やメジアンのようなブロック距離の合成を計算する。既に説 明したように、クラスタに対する距離を、クラスタ内のイメージベクトルの特徴 の平均を用いて、同様に決定する。 本発明は、上記実施の形態に限定されるものではなく、幾多の変更及び変形が 可能である。

Claims (1)

  1. 【特許請求の範囲】 1.データベースから1個以上のデータベースイメージを検索するイメージ検索 装置であって、 イメージに関連する特徴ベクトルを形成する手段を具え、 前記特徴ベクトルを形成する手段が、 前記イメージ内のエッジを検出する手段と、 検出したエッジを特徴づける手段と、 前記イメージを複数のブロックに区画化する手段と、 前記イメージの各ブロック内の検出したエッジの特徴に依存して前記ブロック を特徴づける手段とを具え、 前記特徴ベクトルを、前記イメージを具えるブロックの特徴の合成とし、 各データベースイメージを前記特徴ベクトル形成手段に供給して、各データベ ースイメージに関連したデータベース特徴ベクトルを形成する手段と、 ターゲットイメージを前記特徴ベクトル形成手段に供給して、前記ターゲット イメージに関連したターゲット特徴ベクトルを形成する手段と、 ターゲット特徴ベクトルと、1個以上の前記データベースイメージの各々に関 連したデータベース特徴ベクトルとの比較に依存して、1個以上の前記データベ ースイメージを選択する手段とを具えることを特徴とするイメージ検索装置。 2.前記データベースイメージの各々に関連した1個以上の抽象イメージの組を 形成する手段と、 各抽象イメージを前記特徴ベクトル形成手段に供給して、各データベースイメ ージに関連した抽象特徴ベクトルの組を形成する手段と、 前記1個以上のデータベースイメージを選択する手段が、前記ターゲット特徴 ベクトルと前記1個以上のデータベースイメージの各々に関連した抽象特徴ベク トルのセットとの比較にも依存することを特徴とする請求の範囲1記載のイメー ジ検索装置。 3.前記特徴ベクトル間の類似の程度を決定する手段と、 前記データベースイメージ間の類似の程度に依存して、前記データベースイメ ージをグループに区画化する手段と、 各グループ内の前記データベースイメージに関連したデータベース特徴ベクト ルに依存して、各グループに関連したグループ特徴ベクトルを形成する手段とを 更に具え、 前記1個以上のデータベースイメージを選択する手段が、前記ターゲット特徴 ベクトルと前記グループ特徴ベクトルとの間の類似の程度にも依存することを特 徴とする請求の範囲1記載のイメージ検索装置。 4.前記検出したエッジを特徴づける手段が、前記検出したエッジの各々の向き を決定する手段を具え、 前記ブロックを特徴づける手段が、各ブロック内の前記検出したエッジの各々 の向きのヒストグラムを形成する手段を具えることを特徴とする請求の範囲1記 載のイメージ検索装置。 5.前記特徴ベクトル間の類似の程度を決定する手段が、前記特徴ベクトル間の ユークリッド距離の演算を具えることを特徴とする請求の範囲3記載のイメージ 検索装置。 6.前記データベースイメージを区画化する手段が、K−平均クラスタ化を行う 手段を具えることを特徴とする請求の範囲3記載のイメージ検索装置。 7.各抽象イメージを形成する手段が、特定の幅のガウス核によって前記データ ベースイメージを畳み込む手段を具えることを特徴とする請求の範囲2記載のイ メージ検索装置。 8.各データベースイメージに関連する抽象イメージの組が、少なくとも2個の 抽象イメージを具え、抽象の相違するレベルの各々で、 各イメージを256ブロックに区画化し、 各エッジの向きを、水平、垂直、左−対角線及び右−対角線としたことを特徴 とする請求の範囲4記載のイメージ検索方法。 9.少なくとも2個の抽象イメージの各々を形成する手段が、相違する幅のガウ スカーネルによって前記データベースイメージを畳み込む手段を具えることを特 徴とする請求の範囲8記載のイメージ検索方法。
JP53586199A 1997-12-31 1998-11-13 イメージのマルチスケールエッジ表示を用いる高速イメージ検索 Ceased JP2001515629A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/002,097 US6072904A (en) 1997-12-31 1997-12-31 Fast image retrieval using multi-scale edge representation of images
US09/002,097 1997-12-31
PCT/IB1998/001816 WO1999035596A1 (en) 1997-12-31 1998-11-13 Fast image retrieval using multi-scale edge representation of images

Publications (1)

Publication Number Publication Date
JP2001515629A true JP2001515629A (ja) 2001-09-18

Family

ID=21699233

Family Applications (1)

Application Number Title Priority Date Filing Date
JP53586199A Ceased JP2001515629A (ja) 1997-12-31 1998-11-13 イメージのマルチスケールエッジ表示を用いる高速イメージ検索

Country Status (4)

Country Link
US (1) US6072904A (ja)
EP (1) EP0963577A1 (ja)
JP (1) JP2001515629A (ja)
WO (1) WO1999035596A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014197412A (ja) * 2014-06-12 2014-10-16 トムソン ライセンシングThomson Licensing 画像の類似検索システム及び方法

Families Citing this family (66)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10361802B1 (en) 1999-02-01 2019-07-23 Blanding Hovenweep, Llc Adaptive pattern recognition based control system and method
US6850252B1 (en) 1999-10-05 2005-02-01 Steven M. Hoffberg Intelligent electronic appliance system and method
USRE47908E1 (en) 1991-12-23 2020-03-17 Blanding Hovenweep, Llc Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
USRE46310E1 (en) 1991-12-23 2017-02-14 Blanding Hovenweep, Llc Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
US5903454A (en) * 1991-12-23 1999-05-11 Hoffberg; Linda Irene Human-factored interface corporating adaptive pattern recognition based controller apparatus
USRE48056E1 (en) 1991-12-23 2020-06-16 Blanding Hovenweep, Llc Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
US6260044B1 (en) 1998-02-04 2001-07-10 Nugenesis Technologies Corporation Information storage and retrieval system for storing and retrieving the visual form of information from an application in a database
US6253201B1 (en) * 1998-06-23 2001-06-26 Philips Electronics North America Corporation Scalable solution for image retrieval
US6411953B1 (en) * 1999-01-25 2002-06-25 Lucent Technologies Inc. Retrieval and matching of color patterns based on a predetermined vocabulary and grammar
US7417640B1 (en) 1999-01-29 2008-08-26 Lg Electronics Inc. Method for dominant color setting of video region and data structure and method of confidence measure extraction
US6807298B1 (en) * 1999-03-12 2004-10-19 Electronics And Telecommunications Research Institute Method for generating a block-based image histogram
US6941323B1 (en) 1999-08-09 2005-09-06 Almen Laboratories, Inc. System and method for image comparison and retrieval by enhancing, defining, and parameterizing objects in images
US7082436B1 (en) 2000-01-05 2006-07-25 Nugenesis Technologies Corporation Storing and retrieving the visual form of data
US6574616B1 (en) * 2000-02-16 2003-06-03 Index Stock Imagery, Inc. Stochastic visually based image query and retrieval system
US6584465B1 (en) * 2000-02-25 2003-06-24 Eastman Kodak Company Method and system for search and retrieval of similar patterns
JP2001256244A (ja) * 2000-03-14 2001-09-21 Fuji Xerox Co Ltd 画像データ分類装置および画像データ分類方法
US6785421B1 (en) * 2000-05-22 2004-08-31 Eastman Kodak Company Analyzing images to determine if one or more sets of materials correspond to the analyzed images
GB2364417B (en) * 2000-06-30 2004-10-06 Post Office Image processing
WO2002019147A1 (en) 2000-08-28 2002-03-07 Emotion, Inc. Method and apparatus for digital media management, retrieval, and collaboration
KR20020031015A (ko) * 2000-10-21 2002-04-26 오길록 에지 히스토그램 빈의 비선형 양자화 및 유사도 계산
US8224078B2 (en) 2000-11-06 2012-07-17 Nant Holdings Ip, Llc Image capture and identification system and process
US7680324B2 (en) 2000-11-06 2010-03-16 Evryx Technologies, Inc. Use of image-derived information as search criteria for internet and other search engines
US9310892B2 (en) 2000-11-06 2016-04-12 Nant Holdings Ip, Llc Object information derived from object images
US7565008B2 (en) 2000-11-06 2009-07-21 Evryx Technologies, Inc. Data capture and identification system and process
US7899243B2 (en) 2000-11-06 2011-03-01 Evryx Technologies, Inc. Image capture and identification system and process
US7016897B2 (en) * 2000-12-29 2006-03-21 International Business Machines Corporation Authentication referral search for LDAP
US20020165839A1 (en) * 2001-03-14 2002-11-07 Taylor Kevin M. Segmentation and construction of segmentation classifiers
US7552139B2 (en) * 2001-03-19 2009-06-23 Xerox Corporation Represented object groups
US6915011B2 (en) * 2001-03-28 2005-07-05 Eastman Kodak Company Event clustering of images using foreground/background segmentation
US6834288B2 (en) * 2001-04-13 2004-12-21 Industrial Technology Research Institute Content-based similarity retrieval system for image data
US6798910B1 (en) 2001-05-17 2004-09-28 The United States Of America As Represented By The Secretary Of The Air Force Self-optimizing edge detection in blurred, high-noise images
US20030103673A1 (en) * 2001-11-30 2003-06-05 Nainesh Rathod Shape searcher
CN100346339C (zh) * 2002-11-20 2007-10-31 富士通株式会社 图像检索方法及图像检索装置
US7587068B1 (en) 2004-01-22 2009-09-08 Fotonation Vision Limited Classification database for consumer digital images
US8553949B2 (en) 2004-01-22 2013-10-08 DigitalOptics Corporation Europe Limited Classification and organization of consumer digital images using workflow, and face detection and recognition
US8363951B2 (en) * 2007-03-05 2013-01-29 DigitalOptics Corporation Europe Limited Face recognition training method and apparatus
US7558408B1 (en) 2004-01-22 2009-07-07 Fotonation Vision Limited Classification system for consumer digital images using workflow and user interface modules, and face detection and recognition
US7555148B1 (en) 2004-01-22 2009-06-30 Fotonation Vision Limited Classification system for consumer digital images using workflow, face detection, normalization, and face recognition
US7551755B1 (en) 2004-01-22 2009-06-23 Fotonation Vision Limited Classification and organization of consumer digital images using workflow, and face detection and recognition
US7564994B1 (en) 2004-01-22 2009-07-21 Fotonation Vision Limited Classification system for consumer digital images using automatic workflow and face detection and recognition
US20060082672A1 (en) * 2004-10-14 2006-04-20 M-Systems Flash Disk Pioneers Ltd. Filtering digital images
US7715597B2 (en) 2004-12-29 2010-05-11 Fotonation Ireland Limited Method and component for image recognition
JP4493050B2 (ja) * 2005-06-27 2010-06-30 パイオニア株式会社 画像分析装置および画像分析方法
EP1898339A1 (en) * 2005-06-30 2008-03-12 Olympus Corporation Retrieval system and retrieval method
US8078618B2 (en) 2006-01-30 2011-12-13 Eastman Kodak Company Automatic multimode system for organizing and retrieving content data files
US20090048860A1 (en) * 2006-05-08 2009-02-19 Corbis Corporation Providing a rating for digital media based on reviews and customer behavior
US20070271202A1 (en) * 2006-05-08 2007-11-22 Corbis Corporation Determining content pricing for categories of use based on extrinsic and intrinsic factors
EP2050043A2 (en) * 2006-08-02 2009-04-22 Fotonation Vision Limited Face recognition with combined pca-based datasets
EP2315161A1 (en) 2006-10-11 2011-04-27 Mitsubishi Electric Information Technology Centre Europe B.V. Image descriptor for image recognition
US7933765B2 (en) * 2007-01-25 2011-04-26 Corbis Corporation Cross-lingual information retrieval
WO2008109622A1 (en) 2007-03-05 2008-09-12 Fotonation Vision Limited Face categorization and annotation of a mobile phone contact list
US8073828B2 (en) 2007-06-14 2011-12-06 Curbis Corporation Licensed rights clearance and tracking for digital assets
WO2009002847A1 (en) * 2007-06-22 2008-12-31 Corbis Corporation Distributed media reviewing for conformance to criteria
US8219494B1 (en) 2007-08-16 2012-07-10 Corbis Corporation End-to-end licensing of digital media assets
US20090082637A1 (en) * 2007-09-21 2009-03-26 Michael Galperin Multi-modality fusion classifier with integrated non-imaging factors
US8341195B1 (en) 2007-10-04 2012-12-25 Corbis Corporation Platform for managing media assets for multi-model licensing over multi-level pricing and asset grouping
CN103475837B (zh) 2008-05-19 2017-06-23 日立麦克赛尔株式会社 记录再现装置及方法
US8086048B2 (en) * 2008-05-23 2011-12-27 Yahoo! Inc. System to compile landmark image search results
WO2010063463A2 (en) 2008-12-05 2010-06-10 Fotonation Ireland Limited Face recognition using face tracker classifier data
JP5438436B2 (ja) * 2009-08-27 2014-03-12 株式会社日立国際電気 画像検索装置
CN102110122B (zh) 2009-12-24 2013-04-03 阿里巴巴集团控股有限公司 一种建立样本图片索引表和图片过滤、搜索方法及装置
US10554965B2 (en) 2014-08-18 2020-02-04 Google Llc Motion-compensated partitioning
US10462457B2 (en) 2016-01-29 2019-10-29 Google Llc Dynamic reference motion vector coding mode
US10397600B1 (en) 2016-01-29 2019-08-27 Google Llc Dynamic reference motion vector coding mode
CN107871110B (zh) * 2016-09-27 2018-12-14 北京航空航天大学 一种基于多尺度结构相关性的行人目标识别方法
CN112927245B (zh) * 2021-04-12 2022-06-21 华中科技大学 一种基于实例查询的端到端实例分割方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2894113B2 (ja) * 1992-11-04 1999-05-24 松下電器産業株式会社 画像クラスタリング装置
US6606636B1 (en) * 1993-07-29 2003-08-12 Canon Kabushiki Kaisha Method and apparatus for retrieving dynamic images and method of and apparatus for managing images
JP3340532B2 (ja) * 1993-10-20 2002-11-05 株式会社日立製作所 ビデオの検索方法および装置
JP3026712B2 (ja) * 1993-12-09 2000-03-27 キヤノン株式会社 画像検索方法及びその装置
US5465353A (en) * 1994-04-01 1995-11-07 Ricoh Company, Ltd. Image matching and retrieval by multi-access redundant hashing
US5631971A (en) * 1994-05-24 1997-05-20 Sparrow; Malcolm K. Vector based topological fingerprint matching
US5802361A (en) * 1994-09-30 1998-09-01 Apple Computer, Inc. Method and system for searching graphic images and videos
US5893095A (en) * 1996-03-29 1999-04-06 Virage, Inc. Similarity engine for content-based retrieval of images
US5819288A (en) * 1996-10-16 1998-10-06 Microsoft Corporation Statistically based image group descriptor particularly suited for use in an image classification and retrieval system
US5852823A (en) * 1996-10-16 1998-12-22 Microsoft Image classification and retrieval system using a query-by-example paradigm
US5899999A (en) * 1996-10-16 1999-05-04 Microsoft Corporation Iterative convolution filter particularly suited for use in an image classification and retrieval system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014197412A (ja) * 2014-06-12 2014-10-16 トムソン ライセンシングThomson Licensing 画像の類似検索システム及び方法

Also Published As

Publication number Publication date
US6072904A (en) 2000-06-06
WO1999035596A1 (en) 1999-07-15
EP0963577A1 (en) 1999-12-15

Similar Documents

Publication Publication Date Title
JP2001515629A (ja) イメージのマルチスケールエッジ表示を用いる高速イメージ検索
Platt AutoAlbum: Clustering digital photographs using probabilistic model merging
Marques et al. Content-based image and video retrieval
US6993180B2 (en) Method and system for automated grouping of images
Niblack et al. Updates to the QBIC system
EP1036354B1 (en) A scalable solution for image retrieval
Mehrotra et al. Supporting content-based queries over images in MARS
Veltkamp et al. Content-based image retrieval systems: A survey
US7043474B2 (en) System and method for measuring image similarity based on semantic meaning
JP4260114B2 (ja) 画像の検索
US8150216B2 (en) Methods and apparatus for automated true object-based image analysis and retrieval
Aggarwal et al. An image retrieval system with automatic query modification
US7489804B2 (en) Apparatus and method for trajectory-based identification of digital data content
US7917518B2 (en) Compositional balance and color driven content retrieval
US20070071323A1 (en) Apparatus and method for processing user-specified search image points
US20030123737A1 (en) Perceptual method for browsing, searching, querying and visualizing collections of digital images
JP2010507139A (ja) 顔に基づく画像クラスタリング
US7519236B2 (en) Image retrieval
JP2006127484A (ja) 情報処理方法
JP2004164608A (ja) 情報検索装置
Song et al. Analyzing scenery images by monotonic tree
Chen et al. Automatic classification of photographs and graphics
Khokher et al. Content-based image retrieval: state-of-the-art and challenges
JP3510980B2 (ja) 直線による画像の検索装置,検索方法およびそのプログラム記録媒体
JP2002007413A (ja) 画像検索装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080325

A313 Final decision of rejection without a dissenting response from the applicant

Free format text: JAPANESE INTERMEDIATE CODE: A313

Effective date: 20080819

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081007