JP2001515629A - イメージのマルチスケールエッジ表示を用いる高速イメージ検索 - Google Patents
イメージのマルチスケールエッジ表示を用いる高速イメージ検索Info
- Publication number
- JP2001515629A JP2001515629A JP53586199A JP53586199A JP2001515629A JP 2001515629 A JP2001515629 A JP 2001515629A JP 53586199 A JP53586199 A JP 53586199A JP 53586199 A JP53586199 A JP 53586199A JP 2001515629 A JP2001515629 A JP 2001515629A
- Authority
- JP
- Japan
- Prior art keywords
- image
- database
- images
- feature vector
- forming
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
- 239000013598 vector Substances 0.000 claims abstract description 43
- 238000005192 partition Methods 0.000 claims abstract description 3
- 238000000034 method Methods 0.000 claims description 32
- 238000000638 solvent extraction Methods 0.000 claims description 8
- 238000003064 k means clustering Methods 0.000 claims description 2
- 238000013459 approach Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000037237 body shape Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010422 painting Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5854—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99932—Access augmentation or optimizing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99943—Generating database or data structure, e.g. via user interface
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99944—Object-oriented database structure
- Y10S707/99945—Object-oriented database structure processing
Landscapes
- Engineering & Computer Science (AREA)
- Library & Information Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
(57)【要約】
イメージ検索装置は、ユーザ−入力ターゲットイメージとの一致の程度に依存してデータベースからイメージを検索する。ターゲットイメージ及びデータベースの各イメージは、各イメージ内のエッジ特徴のベクトルによって特徴づけられる。検索は、イメージそれ自体の比較ではなく特徴ベクトルの比較によって行われる。パフォーマンスを最適にするために、イメージの抽象の相違するレベルで、特徴ベクトルの組を各データベースイメージに関連させる。ターゲットイメージに類似するイメージが、任意の抽象レベルで検索される。検索速度を更に最適にするために、データベースをクラスタに区画化し、検索を、ターゲットイメージに最も類似するクラスタに制限する。
Description
【発明の詳細な説明】
イメージのマルチスケールエッジ表示を用いる高速イメージ検索
発明の背景1.発明の分野
イメージのマルチスケールエッジ表示を使用するイメージ検索方法及び装置を開
示する。本発明によって、デジタル的に符号化された写真、CADデザイン線画
、ビデオシーン等のイメージを、高速検索のためにカテゴリー化することができ
る。検索を、特徴エッジを有するスケッチ又はイメージを提供することによって
行う。イメージは、提供されたスケッチ又はイメージに対する類似の順序で検索
され及び提供される。本発明は、特に、写真アーカイブ、デジタル図書館、カタ
ログ、ビデオのような大容量のイメージデータベースからのイメージ検索に利用
できる。2.関連技術の説明
データベースに格納されたビデオを検索するのに通常は種々の技術が用いられ
ている。所望の特徴に適合するイメージを格納し及び検索する最も一般的な技術
は、「肖像」、「海洋画」、「山」、「大統領」のような各イメージにキーワードを関連
させることである。イメージに対してこのような関連のキーワードを有するので
、ユーザは、1個以上の検索ワードを探索すなわち検索装置に提供し、装置は、
検索ワードと記憶されたキーワードとの間の一致の程度に依存して1個以上のイ
メージを表示する。通常のインターネット検索エンジンは、このような検索手段
に基づくテキストの例である。
検索に基づくグラフィックは、イメージ検索に対して最も直感的なアプローチ
である。通常の検索装置に基づくグラフィッタは、種々の形態の色又はパターン
の整合を用いる。典型的には、ユーザはサンプルイメージを提供し、装置は、同
様なパターンの色を有するイメージを検索する。例えば、海洋画のイメージを提
供することによって、検索したイメージは、下側に青色又は緑色を有し、中間に
ベージュ色又は茶色を有し、上側に青色/白色を有するイメージとなる。通常の
パターン整合技術を用いることもできる。例えば、イメージを、山のシーンに対
する上が尖った三角形とボディ形状に対する円及び矩形等との混合のような認識
できるパターンを有するようにカテゴリー化することができる。三角形のうちの
円のターゲットイメージは、例えば、背景に山を有する人の頭の写真を検索し、
矩形内の4個の円は、ルシモール(Rushmore)山の写真を検索する。
正式なアルゴリズム的アプローチも利用されている。1977年に刊行された
IEEE Trans.Computers,Vol.C−26,No.10の
988−998ページのFrei及びChen.C.C,による論文“Fast
Boundary detection:A generation an
anew algorithm”において、ユーザは、スケッチ、線画又は詳細
なイメージを提供し、イメージ検索は、抽象レベルでスケッチをデータベース中
の各イメージと比較することによって行われる。各データベースイメージを、実
際のイメージの抽象画であるアイコンに関連させる。ターゲットアイコンは、タ
ーゲットイメージを提供したユーザの抽象画から形成される。各データベースイ
メージアイコンは、アイコン間の局所的又は全体的な相関の程度を算出すること
によって、ターゲットイメージアイコンに対して算出される。最も強固な相関を
有するアイコンに関連したイメージがユーザに提供される。
これら現存するイメージ検索方法は、検索プロセス中に多量の分析及び演算を
必要とし、テキストに基づく検索技術に比べて著しく効率の悪い図形例によって
イメージ検索を行う。しかしながら、テキストに基づく画像検索は、キーボード
による各画像のカテゴリー化が要求され、これは、数百又は数千のイメージに適
用される場合には厄介なプロセスとなるおそれがある。また、キーボードの個別
の選択によって、記憶イメージを描写するためにカテゴライザが用いたワードと
所望のイメージを描写するためにサーチャが用いるワードとの間の一致の程度の
検索の有効性が制限される。パターンに基づく装置は、特徴パターンを予め決定
する必要があり、検索の効率及び有効性は、データベース中の相違する特性パタ
ーンに直接関連する。
発明の要約
本発明の目的は、有効であり、かつ、データベースのイメージをカテゴリー化
するのに手動操作を必要としない図形に基づくイメージ検索装置を提供すること
である。
本発明の他の目的は、データベースのイメージの内容に関係なく用いることが
できるカテゴリー化方法を提供することである。
本発明の他の目的は、少ないユーザ入力で検索を行うことができるイメージ検
索装置を提供することである。
本発明によれば、イメージは、エッジ成分の関連の特徴とともにデータベース
に格納される。同様な特徴を有するイメージはクラスタにグループ化される。ユ
ーザは、ターゲットイメージをスケッチ又は詳細な形態で入力する。検索装置は
、データベースのイメージを特徴づけるのに用いられる技術と同一の技術を用い
て、ターゲットイメージのエッジ成分を特徴づける。ターゲット特徴と同様な特
徴を有するクラスタが識別され、これらクラスタ内のイメージの特徴が、ターゲ
ット特徴に対して算出ざれる。ターゲット特徴に対して最も類似した特徴を有す
るイメージが表示用に提供される。特徴技術を用いることによって、各イメージ
に対するターゲットの比較が迅速に行われる。階層的なクラスター化を行うこと
によって、比較の数が減少され、比較のオーダを減少させることができる。
同一でないにもかかわらず装置が同様なイメージを配置することができるよう
にするために、マルチスケール表示を利用する。本発明によれば、各イメージは
、複数のレベルの詳細で特徴づけられ、詳細レベルの各々の特徴をイメージに関
連させる。このようにして、ターゲットに全体的に類似するイメージが、ターゲ
ットに最も類似するイメージとともに、表示の際に任意の詳細レベルで識別され
る。
図面の簡単な説明
図1は、イメージ検索装置を示す。
図2は、本発明によるイメージ検索データベースを形成するフローチャートを
示す。
図3は、本発明によるイメージを検索するフローチャートを示す。
好適な実施の形態の説明
図1はイメージ検索装置を示す。ユーザ110は、グラフィック入力装置12
1を用いて、ターゲットイメージのグラフィック表示をコントローラ130に供
給する。グラフィック入力装置121を、イメージスキャナ、デジタイザ、カメ
ラ等とすることができる。それを、通常のマウス又はキーボードとすることがで
き、グラフィックディスプレイ120と組み合わせて用いる場合、ターゲットイ
メージを選択し又は形成するのに用いることができる。例えば、マウス及びディ
スプレイを、通常利用できるコンピュータ線画パッケージを用いることによって
、イメージのスケッチを形成するのに利用することができる。マウス及びキーボ
ードを、格納されたイメージから選択するのに利用することができる。スキャナ
を利用して、写真又は線画のコピーを提供する。ユーザは、入力イメージを修正
して、ターゲットイメージを洗練し又は修正することができる。
コントローラ130を、ローカルディスクメモリ140、リモートディスクメ
モリ142、記憶装置144等に配置することができるイメージのデータベース
に接続する。イメージを、既に説明したようにスキャナや、デジタイザや、カメ
ラのような入力装置を用いて形成し及び格納する。さらに、それらイメージを、
MPEG符号化ビデオや通常のビデオカセットテープで見つけられるように一連
の関連のイメージとすることができる。ここでは、用語データベースを、アイテ
ム(イメージ)の収集を意味するものとし、その各々を、典型的には装置内のロ
ケーションに対するアドレス又はインデックスによって独自に識別することがで
きる。例えば、リモートディスクのイメージを、ファイルネームが続くディスク
の指示によってアドレス指定することができる。カセットテープのイメージを、
イメージ又はフレームがテープ上のどこに配置されているかを識別するインデッ
クスに続くカセットのタイトルによってアドレス指定することができる。従来窺
知のように、データベースを分布させることができ、単一の物理装置にある必要
も全ての装置に共通のアドレス形態にする必要もない。すなわち、ここで用いら
れているように、イメージデータベースは、イメージを有する物理媒体に依存せ
ず、各イメージにアクセスする技術に依存する媒体に依存しない。
本発明によれば、データベース内の各イメージは、イメージに含まれるエッジ
のパターンに基づいて特徴づけられる。複数の技術が、イメージ内のエッジの検
出に利用できる。好適な実施の形態において、エッジを、上記文献のFrei及
びChenの技術を適用することによって決定して、検出可能なエッジの発生を
決定する。各エッジは、垂直、水平、左−対角線又は右−対角線として特徴づけ
られる。雑音の影響を最小にするために、同一方向に3個の連続点を形成するエ
ッジ点のみを利用する。相違するレベルのフィルタ処理を、多少の連続点を要求
することによって行うことができる。したがって、イメージ中の各点すなわち画
像素子(画素)は、エッジ上にあるか否かによって識別され、エッジ上にある場
合、4方向のうちのいずれかにエッジを向ける。イメージ中のエッジに関するイ
メージの各画素を特徴づける他の手段は当業者には既知である。
イメージ中の各画素の特徴に基づいてイメージを特徴づけるために、ブロック
ヒストグラム技術が用いられる。イメージは、個別のブロックに分解されすなわ
ち区画化される。好適な実施の形態において、各イメージを、16×16格子の
ブロック(256格子ブロック)に分解される。イメージが主に矩形である場合
、非対称格子構造を用いることができる。Mブロック(好適な実施の形態では、
M=256)の各々に対して、ブロック内の画素の特徴のヒストグラムを演算す
る。好適な実施の形態では、ヒストグラムは、水平エッジ、垂直エッジ及び2個
の対角線エッジの各々にあるブロック内に複数の画素を具える。別の画素特徴を
用いる場合、既に説明したように、ヒストグラムは、画素特徴カテゴリーの各々
に従う画素数を有する。各ヒストグラムを、ブロック中の全エッジ数に対して正
規化する。
したがって、本発明によれば、各イメージは、N個のエッジタイプのうちのM
個の規格化されたヒストグラムによって特徴づけられる。好適な実施の形態では
、各イメージは、256(M)×4(N)ベクトルによって特徴づけられる。す
なわち、従来の装置における他のイメージによるイメージの特徴づけに比べて、
イメージは、エッジそれ自体ではなくエッジの特徴を表すベクトル又はマトリッ
クスによって特徴づけられる。当業者には明らかなように、相違するイメージは
、それらが同様なエッジを有しなくても同様なエッジの特徴を有することができ
る。本発明は、検索速度の向上によって得られる利点が誤りの起こりやすい検索
によって生じる不利益に優るという仮定に基づく。
ターゲットイメージの一般的な特徴に従うイメージの整合を確実にするために
、詳細な相違があるとしても、各イメージは、既に説明したヒストグラム法すな
わち分解によって特徴づけられる。変動するレベルの詳細でイメージを表す複数
の
技術が従来既知である。例えば、インターネット上では、イメージは、最小の詳
細(不明瞭なエッジ等)で送信され、その後の連続的な送信によって洗練される
。好適な実施の形態において、元のイメージの連続的なブラーリングイメージが
、連続的な幅のガウス核(Gaussian kernel)によって得られる
。元のイメージは、零(0)のガウス核の畳み込みに相当する。好適な実施の形
態では、5及び7のガウス核幅を用いて、元のイメージの2個の連続的なブラー
リング表示を得る。他の技術を用いて、イメージのブラーリング表示を得ること
ができ、2個より多い又は少ないブラーリング表示を利用することができる。ブ
ラーリング表示の各々は、既に説明したようにブロックヒストグラムによって順
次特徴づけられる。
本発明によれば、各イメージを、Lレベルの詳細でM×Nエッジ特徴によって
表される。好適な実施の形態において、イメージの各々は、3個のガウス幅(0
,5,7)の各々のイメージの畳み込みによって生じた詳細のレベルでサイズ2
56×4(16×16ブロック、4エッジ特徴)のブロックヒストグラムベクト
ルによって表される。
各イメージのこれらヒストグラム表示を配置して、探索に有効な区画化を行う
ために、イメージをクラスタにグループ化する。クラスタは、同様なヒストグラ
ム特徴を有するイメージを具える。このクラスタ化は、詳細のレベルの各々で行
われ、詳細な各レベルは、独立したクラスタ化を有する。任意の数のクラスタ化
技術を用いることができ、好適な実施の形態では、詳細の各レベルのイメージの
全データベースを、K−平均クラスタ化(K−means clusterin
g)を用いて区画化する。好適な実施の形態において、K、クラスタの数を8に
等しくする。このように全データベースをK−クラスタに区画化することによっ
て、区画化は、相違するデータベース内のイメージの相違のレベルの変動を自動
的に補償する。例えば、好適な実施の形態において、データベースは、肖像、風
景、建物、集合写真の寄せ集めを具え、肖像の全てを1又は2クラスタに区画化
することを予測することができる。それに対して、データベースが肖像のみであ
る場合、クラスタを、肖像の8個の相違する特徴の間で区別するように形成する
。そのようなクラスタ化技術は従来既知である。8より多い又は少ないクラスタ
区画
化を用いることができる。区画を増大させることによって探索プロセスの速度が
上がるが、探索の幅が制限され、イメージを見失うおそれがあり、探索者も同様
に考える。区画を減少させることによって探索プロセスは遅くなるが、探索の幅
が増大し、探索イメージのようにイメージを省略するおそれが少なくなる。
したがって、本発明によれば、データベースは、Lレベルの詳細の各々のイメ
ージの各々のM×Nヒストグラムベクトルの特徴に基づいて、Lレベルの詳細の
各々でKクラスタのイメージに区画化する。好適な実施の形態において、K=8
,L=3,M=256及びN=4とする。
図2は、本発明によるデータベースのイメージを特徴づけるフローチャートを
示す。データベースイメージを特徴づけ及びカテゴリー化するプロセスは200
から開始する。各データベースイメージは、210−259のループで処理され
る。215では、データベースイメージは、詳細の相違するレベルの各々でL個
のイメージを形成するように畳み込まれる。L個のイメージの各々は、220ー
249のループで処理される。畳み込まれたイメージ内のエッジが222で検出
され、畳み込まれたイメージ内の画素は、224において、検出したエッジに依
存して特徴づけられる。イメージはMブロックに区画化され、各ブロックは23
0−239のループで処理される。このループの235では、ブロック内の画素
のエッジの特徴は、ブロックに関連するヒストグラムに要約され及び正規化され
る。240において、Mブロックのヒストグラムは、畳み込まれたイメージに関
連するヒストグラムベクトルを形成する。データベースイメージに関連するL個
のヒストグラムベクトルが、250で格納される。
全てのデータベースイメージを、Lレベルの詳細で証明したヒストグラムベク
トルとして処理した後、データベースは、260−269のループにおいて、各
レベルの詳細に対するクラスタに区画化される。265において、各レベルの詳
細のデータベース・イメージをK個のクラスタに区画化する。各データベースイ
メージを、N個のエッジ特徴のMブロックのL個のヒストグラムベクトルに特徴
づけ、次いで、ヒストグラムベクトルを、Lレベルの詳細の各々でK個のクラス
タにカテゴリー化し.299でプロセスを終了する。
上記イメージのカテゴリー化及び特徴づけに基づくデータベースからのイメー
ジの検索を、後に説明する。既に説明したように、K,L,M及びNの選択は制
約がないが、その選択は、当業者には理解できるように、整合プロセスの効率及
び有効性に影響を及ぼす。同様に、エッジを特徴づけるのに用いられる特定のプ
ロセスは、詳細の相違するレベルでイメージを形成し、特徴のクラスタへの区画
化も、当業者には明らかなように自由に選択される。
図3は、上記イメージのカテゴリー化及び特徴づけを行うデータベースからイ
メージを検索するフローチャートを示す。イメージの検索者は、表示ターゲット
イメージを310で提供する。このターゲットイメージを、スケッチ、線画、十
分詳細なイメージ等とすることができる。ターゲットイメージを、データベース
のイメージを特徴づけるのに用いられるプロセスと同様に処理し、図2及び3に
おいて同一参照番号を同様なプロセスに対して付す。ターゲットイメージが、既
に抽象的なイメージであるスケッチである場合、それはLレベルの詳細に畳み込
まれない。それが詳細なイメージである場合、データベースイメージに適用され
るのと同一の畳み込みが適用されて、詳細の各レベルでターゲットイメージを発
生させる。222において、エッジはターゲットイメージ中で識別され、224
において、ターゲットイメージの画素は、データベース中のイメージの特徴づけ
にどのような方法を用いても、識別されたエッジによって特徴づけられる。ター
ゲットイメージは、226でM個のブロックに区画化され、ヒストグラムベクト
ルは、230−240でデータベースイメージのヒストグラムベクトルと同様に
して形成される。
ループ350−359に示すように、詳細Lの各レベルで、ターゲットヒスト
グラムベクトルに最も近接するクラスタを決定する。360で、L個の最も近接
するクラスタは、識別され及びスーパクラスタ(supercluster)に
グループ化される。このスーパクラスタの冗長は、データベースイメージがスー
パクラスタに一度だけ含まれるようにして除去される。このスーパクラスタ内の
ヒストグラムベクトルのみが次の探索に対して選択される。ループ370−37
9において、ターゲットヒストグラムベクトルとデータベースイメージヒストグ
ラムベクトルの各々との間の距離が算出される。ソートされたリストをこのルー
プ中で形成し、この場合、イメージの識別子を、ターゲットヒストグラムベクト
ルからの距離が増大するような順序でリストに配置する。このように配置された
リストは、典型的には最も近接する最初の10個の画像、次に近接する10個の
画像、等々を表示することによってイメージをユーザに表示するために、399
で戻される。
ターゲットヒストグラムベクトルからイメージヒストグラムベクトルまでの距
離を、種々の方法で決定することができる。好適な実施の形態において、ベクト
ルのブロック間のn次のユークリッド距離を利用する。すなわち、ブロック間の
距離Dは、
となる。この場合、Nを、エッジ特徴の数とし、Tjを、エッジ特徴の各々に対
するターゲットヒストグラムエントリーとし、Ijを、イメージヒストグラムエ
ントリーとする。好適な実施の形態において、N=4とし、4個のエッジ特徴を
、水平、垂直、左−対角線及び右−対角線とする。ヒストグラムエントリーを、
各々が特徴を有する正規化された数の画素とする。ベクトル間の距離を形成する
ために、距離の平均やメジアンのようなブロック距離の合成を計算する。既に説
明したように、クラスタに対する距離を、クラスタ内のイメージベクトルの特徴
の平均を用いて、同様に決定する。
本発明は、上記実施の形態に限定されるものではなく、幾多の変更及び変形が
可能である。
Claims (1)
- 【特許請求の範囲】 1.データベースから1個以上のデータベースイメージを検索するイメージ検索 装置であって、 イメージに関連する特徴ベクトルを形成する手段を具え、 前記特徴ベクトルを形成する手段が、 前記イメージ内のエッジを検出する手段と、 検出したエッジを特徴づける手段と、 前記イメージを複数のブロックに区画化する手段と、 前記イメージの各ブロック内の検出したエッジの特徴に依存して前記ブロック を特徴づける手段とを具え、 前記特徴ベクトルを、前記イメージを具えるブロックの特徴の合成とし、 各データベースイメージを前記特徴ベクトル形成手段に供給して、各データベ ースイメージに関連したデータベース特徴ベクトルを形成する手段と、 ターゲットイメージを前記特徴ベクトル形成手段に供給して、前記ターゲット イメージに関連したターゲット特徴ベクトルを形成する手段と、 ターゲット特徴ベクトルと、1個以上の前記データベースイメージの各々に関 連したデータベース特徴ベクトルとの比較に依存して、1個以上の前記データベ ースイメージを選択する手段とを具えることを特徴とするイメージ検索装置。 2.前記データベースイメージの各々に関連した1個以上の抽象イメージの組を 形成する手段と、 各抽象イメージを前記特徴ベクトル形成手段に供給して、各データベースイメ ージに関連した抽象特徴ベクトルの組を形成する手段と、 前記1個以上のデータベースイメージを選択する手段が、前記ターゲット特徴 ベクトルと前記1個以上のデータベースイメージの各々に関連した抽象特徴ベク トルのセットとの比較にも依存することを特徴とする請求の範囲1記載のイメー ジ検索装置。 3.前記特徴ベクトル間の類似の程度を決定する手段と、 前記データベースイメージ間の類似の程度に依存して、前記データベースイメ ージをグループに区画化する手段と、 各グループ内の前記データベースイメージに関連したデータベース特徴ベクト ルに依存して、各グループに関連したグループ特徴ベクトルを形成する手段とを 更に具え、 前記1個以上のデータベースイメージを選択する手段が、前記ターゲット特徴 ベクトルと前記グループ特徴ベクトルとの間の類似の程度にも依存することを特 徴とする請求の範囲1記載のイメージ検索装置。 4.前記検出したエッジを特徴づける手段が、前記検出したエッジの各々の向き を決定する手段を具え、 前記ブロックを特徴づける手段が、各ブロック内の前記検出したエッジの各々 の向きのヒストグラムを形成する手段を具えることを特徴とする請求の範囲1記 載のイメージ検索装置。 5.前記特徴ベクトル間の類似の程度を決定する手段が、前記特徴ベクトル間の ユークリッド距離の演算を具えることを特徴とする請求の範囲3記載のイメージ 検索装置。 6.前記データベースイメージを区画化する手段が、K−平均クラスタ化を行う 手段を具えることを特徴とする請求の範囲3記載のイメージ検索装置。 7.各抽象イメージを形成する手段が、特定の幅のガウス核によって前記データ ベースイメージを畳み込む手段を具えることを特徴とする請求の範囲2記載のイ メージ検索装置。 8.各データベースイメージに関連する抽象イメージの組が、少なくとも2個の 抽象イメージを具え、抽象の相違するレベルの各々で、 各イメージを256ブロックに区画化し、 各エッジの向きを、水平、垂直、左−対角線及び右−対角線としたことを特徴 とする請求の範囲4記載のイメージ検索方法。 9.少なくとも2個の抽象イメージの各々を形成する手段が、相違する幅のガウ スカーネルによって前記データベースイメージを畳み込む手段を具えることを特 徴とする請求の範囲8記載のイメージ検索方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/002,097 | 1997-12-31 | ||
US09/002,097 US6072904A (en) | 1997-12-31 | 1997-12-31 | Fast image retrieval using multi-scale edge representation of images |
PCT/IB1998/001816 WO1999035596A1 (en) | 1997-12-31 | 1998-11-13 | Fast image retrieval using multi-scale edge representation of images |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001515629A true JP2001515629A (ja) | 2001-09-18 |
Family
ID=21699233
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP53586199A Ceased JP2001515629A (ja) | 1997-12-31 | 1998-11-13 | イメージのマルチスケールエッジ表示を用いる高速イメージ検索 |
Country Status (4)
Country | Link |
---|---|
US (1) | US6072904A (ja) |
EP (1) | EP0963577A1 (ja) |
JP (1) | JP2001515629A (ja) |
WO (1) | WO1999035596A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014197412A (ja) * | 2014-06-12 | 2014-10-16 | トムソン ライセンシングThomson Licensing | 画像の類似検索システム及び方法 |
Families Citing this family (66)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
USRE46310E1 (en) | 1991-12-23 | 2017-02-14 | Blanding Hovenweep, Llc | Ergonomic man-machine interface incorporating adaptive pattern recognition based control system |
US5903454A (en) * | 1991-12-23 | 1999-05-11 | Hoffberg; Linda Irene | Human-factored interface corporating adaptive pattern recognition based controller apparatus |
USRE47908E1 (en) | 1991-12-23 | 2020-03-17 | Blanding Hovenweep, Llc | Ergonomic man-machine interface incorporating adaptive pattern recognition based control system |
US10361802B1 (en) | 1999-02-01 | 2019-07-23 | Blanding Hovenweep, Llc | Adaptive pattern recognition based control system and method |
USRE48056E1 (en) | 1991-12-23 | 2020-06-16 | Blanding Hovenweep, Llc | Ergonomic man-machine interface incorporating adaptive pattern recognition based control system |
US6850252B1 (en) | 1999-10-05 | 2005-02-01 | Steven M. Hoffberg | Intelligent electronic appliance system and method |
US6260044B1 (en) * | 1998-02-04 | 2001-07-10 | Nugenesis Technologies Corporation | Information storage and retrieval system for storing and retrieving the visual form of information from an application in a database |
US6253201B1 (en) * | 1998-06-23 | 2001-06-26 | Philips Electronics North America Corporation | Scalable solution for image retrieval |
US6411953B1 (en) * | 1999-01-25 | 2002-06-25 | Lucent Technologies Inc. | Retrieval and matching of color patterns based on a predetermined vocabulary and grammar |
US7417640B1 (en) | 1999-01-29 | 2008-08-26 | Lg Electronics Inc. | Method for dominant color setting of video region and data structure and method of confidence measure extraction |
US6807298B1 (en) * | 1999-03-12 | 2004-10-19 | Electronics And Telecommunications Research Institute | Method for generating a block-based image histogram |
US6941323B1 (en) | 1999-08-09 | 2005-09-06 | Almen Laboratories, Inc. | System and method for image comparison and retrieval by enhancing, defining, and parameterizing objects in images |
US7082436B1 (en) | 2000-01-05 | 2006-07-25 | Nugenesis Technologies Corporation | Storing and retrieving the visual form of data |
US6574616B1 (en) * | 2000-02-16 | 2003-06-03 | Index Stock Imagery, Inc. | Stochastic visually based image query and retrieval system |
US6584465B1 (en) * | 2000-02-25 | 2003-06-24 | Eastman Kodak Company | Method and system for search and retrieval of similar patterns |
JP2001256244A (ja) * | 2000-03-14 | 2001-09-21 | Fuji Xerox Co Ltd | 画像データ分類装置および画像データ分類方法 |
US6785421B1 (en) * | 2000-05-22 | 2004-08-31 | Eastman Kodak Company | Analyzing images to determine if one or more sets of materials correspond to the analyzed images |
GB2364417B (en) * | 2000-06-30 | 2004-10-06 | Post Office | Image processing |
AU2001288469A1 (en) * | 2000-08-28 | 2002-03-13 | Emotion, Inc. | Method and apparatus for digital media management, retrieval, and collaboration |
KR20020031015A (ko) * | 2000-10-21 | 2002-04-26 | 오길록 | 에지 히스토그램 빈의 비선형 양자화 및 유사도 계산 |
US8224078B2 (en) | 2000-11-06 | 2012-07-17 | Nant Holdings Ip, Llc | Image capture and identification system and process |
US7565008B2 (en) | 2000-11-06 | 2009-07-21 | Evryx Technologies, Inc. | Data capture and identification system and process |
US7899243B2 (en) | 2000-11-06 | 2011-03-01 | Evryx Technologies, Inc. | Image capture and identification system and process |
US9310892B2 (en) | 2000-11-06 | 2016-04-12 | Nant Holdings Ip, Llc | Object information derived from object images |
US7680324B2 (en) | 2000-11-06 | 2010-03-16 | Evryx Technologies, Inc. | Use of image-derived information as search criteria for internet and other search engines |
US7016897B2 (en) * | 2000-12-29 | 2006-03-21 | International Business Machines Corporation | Authentication referral search for LDAP |
US20020164070A1 (en) * | 2001-03-14 | 2002-11-07 | Kuhner Mark B. | Automatic algorithm generation |
US7552139B2 (en) * | 2001-03-19 | 2009-06-23 | Xerox Corporation | Represented object groups |
US6915011B2 (en) * | 2001-03-28 | 2005-07-05 | Eastman Kodak Company | Event clustering of images using foreground/background segmentation |
US6834288B2 (en) * | 2001-04-13 | 2004-12-21 | Industrial Technology Research Institute | Content-based similarity retrieval system for image data |
US6798910B1 (en) | 2001-05-17 | 2004-09-28 | The United States Of America As Represented By The Secretary Of The Air Force | Self-optimizing edge detection in blurred, high-noise images |
US20030103673A1 (en) * | 2001-11-30 | 2003-06-05 | Nainesh Rathod | Shape searcher |
WO2004047026A1 (ja) * | 2002-11-20 | 2004-06-03 | Fujitsu Limited | 画像検索プログラム |
US7587068B1 (en) | 2004-01-22 | 2009-09-08 | Fotonation Vision Limited | Classification database for consumer digital images |
US8553949B2 (en) | 2004-01-22 | 2013-10-08 | DigitalOptics Corporation Europe Limited | Classification and organization of consumer digital images using workflow, and face detection and recognition |
US8189927B2 (en) | 2007-03-05 | 2012-05-29 | DigitalOptics Corporation Europe Limited | Face categorization and annotation of a mobile phone contact list |
US8363951B2 (en) * | 2007-03-05 | 2013-01-29 | DigitalOptics Corporation Europe Limited | Face recognition training method and apparatus |
US7555148B1 (en) | 2004-01-22 | 2009-06-30 | Fotonation Vision Limited | Classification system for consumer digital images using workflow, face detection, normalization, and face recognition |
US7558408B1 (en) | 2004-01-22 | 2009-07-07 | Fotonation Vision Limited | Classification system for consumer digital images using workflow and user interface modules, and face detection and recognition |
US7564994B1 (en) * | 2004-01-22 | 2009-07-21 | Fotonation Vision Limited | Classification system for consumer digital images using automatic workflow and face detection and recognition |
US7551755B1 (en) | 2004-01-22 | 2009-06-23 | Fotonation Vision Limited | Classification and organization of consumer digital images using workflow, and face detection and recognition |
US20060082672A1 (en) * | 2004-10-14 | 2006-04-20 | M-Systems Flash Disk Pioneers Ltd. | Filtering digital images |
US7715597B2 (en) | 2004-12-29 | 2010-05-11 | Fotonation Ireland Limited | Method and component for image recognition |
WO2007000999A1 (ja) * | 2005-06-27 | 2007-01-04 | Pioneer Corporation | 画像分析装置および画像分析方法 |
CN101010694A (zh) * | 2005-06-30 | 2007-08-01 | 奥林巴斯株式会社 | 检索系统以及检索方法 |
US8078618B2 (en) | 2006-01-30 | 2011-12-13 | Eastman Kodak Company | Automatic multimode system for organizing and retrieving content data files |
US20090048860A1 (en) * | 2006-05-08 | 2009-02-19 | Corbis Corporation | Providing a rating for digital media based on reviews and customer behavior |
US20070271202A1 (en) * | 2006-05-08 | 2007-11-22 | Corbis Corporation | Determining content pricing for categories of use based on extrinsic and intrinsic factors |
WO2008015586A2 (en) * | 2006-08-02 | 2008-02-07 | Fotonation Vision Limited | Face recognition with combined pca-based datasets |
EP1912160B1 (en) * | 2006-10-11 | 2012-05-16 | Mitsubishi Electric R&D Centre Europe B.V. | Image descriptor for image recognition |
US7933765B2 (en) * | 2007-01-25 | 2011-04-26 | Corbis Corporation | Cross-lingual information retrieval |
US8073828B2 (en) | 2007-06-14 | 2011-12-06 | Curbis Corporation | Licensed rights clearance and tracking for digital assets |
US20080319870A1 (en) * | 2007-06-22 | 2008-12-25 | Corbis Corporation | Distributed media reviewing for conformance to criteria |
US8219494B1 (en) | 2007-08-16 | 2012-07-10 | Corbis Corporation | End-to-end licensing of digital media assets |
US20090082637A1 (en) * | 2007-09-21 | 2009-03-26 | Michael Galperin | Multi-modality fusion classifier with integrated non-imaging factors |
US8341195B1 (en) | 2007-10-04 | 2012-12-25 | Corbis Corporation | Platform for managing media assets for multi-model licensing over multi-level pricing and asset grouping |
CN103402070B (zh) | 2008-05-19 | 2017-07-07 | 日立麦克赛尔株式会社 | 记录再现装置及方法 |
US8086048B2 (en) * | 2008-05-23 | 2011-12-27 | Yahoo! Inc. | System to compile landmark image search results |
WO2010063463A2 (en) | 2008-12-05 | 2010-06-10 | Fotonation Ireland Limited | Face recognition using face tracker classifier data |
JP5438436B2 (ja) * | 2009-08-27 | 2014-03-12 | 株式会社日立国際電気 | 画像検索装置 |
CN102110122B (zh) | 2009-12-24 | 2013-04-03 | 阿里巴巴集团控股有限公司 | 一种建立样本图片索引表和图片过滤、搜索方法及装置 |
US10554965B2 (en) | 2014-08-18 | 2020-02-04 | Google Llc | Motion-compensated partitioning |
US10462457B2 (en) | 2016-01-29 | 2019-10-29 | Google Llc | Dynamic reference motion vector coding mode |
US10397600B1 (en) | 2016-01-29 | 2019-08-27 | Google Llc | Dynamic reference motion vector coding mode |
CN107871110B (zh) * | 2016-09-27 | 2018-12-14 | 北京航空航天大学 | 一种基于多尺度结构相关性的行人目标识别方法 |
CN112927245B (zh) * | 2021-04-12 | 2022-06-21 | 华中科技大学 | 一种基于实例查询的端到端实例分割方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2894113B2 (ja) * | 1992-11-04 | 1999-05-24 | 松下電器産業株式会社 | 画像クラスタリング装置 |
US6606636B1 (en) * | 1993-07-29 | 2003-08-12 | Canon Kabushiki Kaisha | Method and apparatus for retrieving dynamic images and method of and apparatus for managing images |
JP3340532B2 (ja) * | 1993-10-20 | 2002-11-05 | 株式会社日立製作所 | ビデオの検索方法および装置 |
JP3026712B2 (ja) * | 1993-12-09 | 2000-03-27 | キヤノン株式会社 | 画像検索方法及びその装置 |
US5465353A (en) * | 1994-04-01 | 1995-11-07 | Ricoh Company, Ltd. | Image matching and retrieval by multi-access redundant hashing |
US5631971A (en) * | 1994-05-24 | 1997-05-20 | Sparrow; Malcolm K. | Vector based topological fingerprint matching |
US5802361A (en) * | 1994-09-30 | 1998-09-01 | Apple Computer, Inc. | Method and system for searching graphic images and videos |
US5893095A (en) * | 1996-03-29 | 1999-04-06 | Virage, Inc. | Similarity engine for content-based retrieval of images |
US5852823A (en) * | 1996-10-16 | 1998-12-22 | Microsoft | Image classification and retrieval system using a query-by-example paradigm |
US5899999A (en) * | 1996-10-16 | 1999-05-04 | Microsoft Corporation | Iterative convolution filter particularly suited for use in an image classification and retrieval system |
US5819288A (en) * | 1996-10-16 | 1998-10-06 | Microsoft Corporation | Statistically based image group descriptor particularly suited for use in an image classification and retrieval system |
-
1997
- 1997-12-31 US US09/002,097 patent/US6072904A/en not_active Expired - Fee Related
-
1998
- 1998-11-13 EP EP98951631A patent/EP0963577A1/en not_active Withdrawn
- 1998-11-13 JP JP53586199A patent/JP2001515629A/ja not_active Ceased
- 1998-11-13 WO PCT/IB1998/001816 patent/WO1999035596A1/en not_active Application Discontinuation
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014197412A (ja) * | 2014-06-12 | 2014-10-16 | トムソン ライセンシングThomson Licensing | 画像の類似検索システム及び方法 |
Also Published As
Publication number | Publication date |
---|---|
WO1999035596A1 (en) | 1999-07-15 |
US6072904A (en) | 2000-06-06 |
EP0963577A1 (en) | 1999-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2001515629A (ja) | イメージのマルチスケールエッジ表示を用いる高速イメージ検索 | |
Platt | AutoAlbum: Clustering digital photographs using probabilistic model merging | |
Marques et al. | Content-based image and video retrieval | |
US6993180B2 (en) | Method and system for automated grouping of images | |
Niblack et al. | Updates to the QBIC system | |
EP1036354B1 (en) | A scalable solution for image retrieval | |
Mehrotra et al. | Supporting content-based queries over images in MARS | |
Veltkamp et al. | Content-based image retrieval systems: A survey | |
US7043474B2 (en) | System and method for measuring image similarity based on semantic meaning | |
JP4260114B2 (ja) | 画像の検索 | |
Aggarwal et al. | An image retrieval system with automatic query modification | |
US7489804B2 (en) | Apparatus and method for trajectory-based identification of digital data content | |
US7917518B2 (en) | Compositional balance and color driven content retrieval | |
US20070071323A1 (en) | Apparatus and method for processing user-specified search image points | |
US20100082597A1 (en) | Methods and apparatus for automated true object-based image analysis and retrieval | |
US20030123737A1 (en) | Perceptual method for browsing, searching, querying and visualizing collections of digital images | |
JP2010507139A (ja) | 顔に基づく画像クラスタリング | |
US7519236B2 (en) | Image retrieval | |
JP2006127484A (ja) | 情報処理方法 | |
JP2004164608A (ja) | 情報検索装置 | |
Song et al. | Analyzing scenery images by monotonic tree | |
Chen et al. | Automatic classification of photographs and graphics | |
JP2002007413A (ja) | 画像検索装置 | |
JP3510980B2 (ja) | 直線による画像の検索装置,検索方法およびそのプログラム記録媒体 | |
Zhang | On the use of CBIR in Image Mosaic Generation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051110 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080325 |
|
A313 | Final decision of rejection without a dissenting response from the applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A313 Effective date: 20080819 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20081007 |