JP2000339352A - 知覚的顕在特徴に基づく画像のアーカイブ及び検索 - Google Patents
知覚的顕在特徴に基づく画像のアーカイブ及び検索Info
- Publication number
- JP2000339352A JP2000339352A JP2000112139A JP2000112139A JP2000339352A JP 2000339352 A JP2000339352 A JP 2000339352A JP 2000112139 A JP2000112139 A JP 2000112139A JP 2000112139 A JP2000112139 A JP 2000112139A JP 2000339352 A JP2000339352 A JP 2000339352A
- Authority
- JP
- Japan
- Prior art keywords
- image
- color
- perceptually
- representation
- texture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5862—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using texture
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
Abstract
(57)【要約】
【課題】 画像をその知覚的顕在特徴に基づいてアーカ
イブ及び検索する方法を提供する。 【解決手段】 画像をその描写的特徴に基づく表現に基
づいてアーカイブする方法が、前記画像の前記表現を、
前記画像の知覚を支配する一つ又はそれ以上の知覚的に
顕在する描写的特徴により、自動的に抽出するステップ
(S20)と、前記画像及びその表現をデータベースに
記憶するステップ(S40)と、を含む。
イブ及び検索する方法を提供する。 【解決手段】 画像をその描写的特徴に基づく表現に基
づいてアーカイブする方法が、前記画像の前記表現を、
前記画像の知覚を支配する一つ又はそれ以上の知覚的に
顕在する描写的特徴により、自動的に抽出するステップ
(S20)と、前記画像及びその表現をデータベースに
記憶するステップ(S40)と、を含む。
Description
【0001】
【発明の属する技術分野】本発明は、一般的にはデジタ
ル画像処理の分野に関しており、より具体的には、知覚
的に顕在する(知覚的顕在;perceptually
significant)特徴に基づいた画像の記憶
及び検索に関している。
ル画像処理の分野に関しており、より具体的には、知覚
的に顕在する(知覚的顕在;perceptually
significant)特徴に基づいた画像の記憶
及び検索に関している。
【0002】
【従来の技術】大きな画像コレクション(又はデータベ
ース)を効果的に利用するためには、与えられた例又は
問合せ画像に類似した画像の効率的な選択及び/又は検
索が、本質的に求められる。データベースをサーチして
問合せに類似した画像を選択/検索する最も一般的なア
プローチは、問合せ画像とデータベース中の画像とをそ
の特徴に基づいた表現を使用して距離関数によって比較
することである。R・J・バーバーら(R.J.Bar
ber et al.)の米国特許第5,579,47
1号「画像問合せシステム及び方法」、J・S・デュボ
ネ(J.S.DeBonet)の米国特許第5,85
2,823号「例示質問パラダイムを使用したデータベ
ースからの自動画像分類及び検索システム」、S・チャ
ング及びJ・R・スミス(S.Chang and
J.R.Smith)の国際特許出願公開公報第WO9
8/52119号「特徴及び領域に基づくデータベース
画像の検索方法」、M・J・スエイン及びD・H・バラ
ード(M.J.Swain and D.H.Ball
ard)の「カラーインデクシング」(国際コンピュー
タビジョン誌、第7巻第1号、1991、第11〜32
頁)、及びG・パスら(G.Pass et al.)
の「カラーコヒーレンスベクトルを使用した画像の比
較」(ACMマルチメディア会議講演論文集、199
6)を参照のこと。これらの技法は全て、画像を、カラ
ーやテクスチュアのようなその描写的特徴により表現す
る。問合せ画像Qが与えられると、その特徴に基づく表
現がデータベース中の各画像Iの表現に対して比較され
て、QとIとの類似性が計算される。データベース中の
画像はその後に、その問合せ画像に対する類似性の降順
にランク付けされて、その問合せに対する回答が形成さ
れる。
ース)を効果的に利用するためには、与えられた例又は
問合せ画像に類似した画像の効率的な選択及び/又は検
索が、本質的に求められる。データベースをサーチして
問合せに類似した画像を選択/検索する最も一般的なア
プローチは、問合せ画像とデータベース中の画像とをそ
の特徴に基づいた表現を使用して距離関数によって比較
することである。R・J・バーバーら(R.J.Bar
ber et al.)の米国特許第5,579,47
1号「画像問合せシステム及び方法」、J・S・デュボ
ネ(J.S.DeBonet)の米国特許第5,85
2,823号「例示質問パラダイムを使用したデータベ
ースからの自動画像分類及び検索システム」、S・チャ
ング及びJ・R・スミス(S.Chang and
J.R.Smith)の国際特許出願公開公報第WO9
8/52119号「特徴及び領域に基づくデータベース
画像の検索方法」、M・J・スエイン及びD・H・バラ
ード(M.J.Swain and D.H.Ball
ard)の「カラーインデクシング」(国際コンピュー
タビジョン誌、第7巻第1号、1991、第11〜32
頁)、及びG・パスら(G.Pass et al.)
の「カラーコヒーレンスベクトルを使用した画像の比
較」(ACMマルチメディア会議講演論文集、199
6)を参照のこと。これらの技法は全て、画像を、カラ
ーやテクスチュアのようなその描写的特徴により表現す
る。問合せ画像Qが与えられると、その特徴に基づく表
現がデータベース中の各画像Iの表現に対して比較され
て、QとIとの類似性が計算される。データベース中の
画像はその後に、その問合せ画像に対する類似性の降順
にランク付けされて、その問合せに対する回答が形成さ
れる。
【0003】
【発明が解決しようとする課題】これらの技法のキーと
なる短所は、画像表現及びマッチングスキームにおける
知覚的顕在画像特徴と非顕在(insignifica
nt)画像特徴との間が区別されていないということで
ある。一般に、人間の観察者は、二つの画像の内容に基
づく類似性を、細かい詳細ではなく、画像の知覚的顕在
内容に基づいて決定する。この行為を模倣することによ
って、類似性検索システムは、人間による類似性の解釈
により一致する結果を生成することができる。しかし、
この事実は、現存する技法の何れにおいても満足されて
きていない。本発明は、画像をその知覚的顕在特徴によ
り表現することによって、この短所を克服する。これよ
り、二つの画像の類似性が、それらの知覚的顕在特徴の
類似性の関数となる。
なる短所は、画像表現及びマッチングスキームにおける
知覚的顕在画像特徴と非顕在(insignifica
nt)画像特徴との間が区別されていないということで
ある。一般に、人間の観察者は、二つの画像の内容に基
づく類似性を、細かい詳細ではなく、画像の知覚的顕在
内容に基づいて決定する。この行為を模倣することによ
って、類似性検索システムは、人間による類似性の解釈
により一致する結果を生成することができる。しかし、
この事実は、現存する技法の何れにおいても満足されて
きていない。本発明は、画像をその知覚的顕在特徴によ
り表現することによって、この短所を克服する。これよ
り、二つの画像の類似性が、それらの知覚的顕在特徴の
類似性の関数となる。
【0004】
【課題を解決するための手段】本発明は、上述の問題の
一つ又はそれ以上を克服することを目的としている。簡
単に要約すると、本発明のある局面によれば、画像をそ
の描写的特徴に基づく表現に基づいてアーカイブする方
法が、画像の知覚を支配する一つ又はそれ以上の知覚的
に顕在する描写的特徴により画像の表現を自動的に抽出
するステップと、画像及びその表現をデータベースに記
憶するステップとを含む。
一つ又はそれ以上を克服することを目的としている。簡
単に要約すると、本発明のある局面によれば、画像をそ
の描写的特徴に基づく表現に基づいてアーカイブする方
法が、画像の知覚を支配する一つ又はそれ以上の知覚的
に顕在する描写的特徴により画像の表現を自動的に抽出
するステップと、画像及びその表現をデータベースに記
憶するステップとを含む。
【0005】上述の技術水準を考慮すると、本発明の目
的は、画像をその知覚的顕在特徴により表現する、描写
的特徴に基づく画像の表現方法を提供することである。
的は、画像をその知覚的顕在特徴により表現する、描写
的特徴に基づく画像の表現方法を提供することである。
【0006】第2の目的は、知覚的顕在特徴に基づく画
像表現を使用して画像をデータベースにアーカイブする
スキームを提供することである。
像表現を使用して画像をデータベースにアーカイブする
スキームを提供することである。
【0007】第3の目的は、知覚的顕在特徴に基づく画
像表現を使用した例(又は問合せ)画像に類似した画像
の選択及び/又は検索を効果的に取り扱うことができる
画像検索システムを提供することである。
像表現を使用した例(又は問合せ)画像に類似した画像
の選択及び/又は検索を効果的に取り扱うことができる
画像検索システムを提供することである。
【0008】本発明のこれら及びその他の局面、目的、
特徴、及び効果が、好適な実施形態の以下の詳細な説明
及び添付の請求の範囲のレビューから、及び添付の図面
を参照することによって、より明瞭に理解され且つ認識
されるであろう。
特徴、及び効果が、好適な実施形態の以下の詳細な説明
及び添付の請求の範囲のレビューから、及び添付の図面
を参照することによって、より明瞭に理解され且つ認識
されるであろう。
【0009】
【発明の実施の形態】以下の説明では、本発明が、好適
な実施形態においてソフトウエアプログラムとして説明
される。そのようなソフトウエアの均等物がハードウエ
アにおいても構築され得ることを、当業者は容易に認識
するであろう。
な実施形態においてソフトウエアプログラムとして説明
される。そのようなソフトウエアの均等物がハードウエ
アにおいても構築され得ることを、当業者は容易に認識
するであろう。
【0010】さらに、本明細書で使用されているよう
に、コンピュータが読み取り可能な記憶媒体は、例え
ば、(フロッピー(登録商標)ディスクのような)磁気
ディスク又は磁気テープのような磁気的記憶媒体、光デ
ィスク、光テープ、又は機械読み取り可能なバーコード
のような光学的記憶媒体、ランダムアクセスメモリ(R
AM)又はリードオンリーメモリ(ROM)のような固
体電子記憶デバイス、あるいはコンピュータプログラム
を記憶するために使用される任意の他の物理的装置又は
媒体を備えてもよい。
に、コンピュータが読み取り可能な記憶媒体は、例え
ば、(フロッピー(登録商標)ディスクのような)磁気
ディスク又は磁気テープのような磁気的記憶媒体、光デ
ィスク、光テープ、又は機械読み取り可能なバーコード
のような光学的記憶媒体、ランダムアクセスメモリ(R
AM)又はリードオンリーメモリ(ROM)のような固
体電子記憶デバイス、あるいはコンピュータプログラム
を記憶するために使用される任意の他の物理的装置又は
媒体を備えてもよい。
【0011】さらに、本発明は、コンピュータシステム
上で実現される。そのようなコンピュータシステムは当
該技術分野では良く知られており、本明細書では詳細に
説明されないであろう。
上で実現される。そのようなコンピュータシステムは当
該技術分野では良く知られており、本明細書では詳細に
説明されないであろう。
【0012】本発明は描写的特徴に基づく画像アーカイ
ブ及び検索システムを提供し、このシステムは二つの機
能的なフェーズからなっている。画像アーカイブフェー
ズと呼ばれる第1のフェーズでは、システムにより記憶
且つ管理される各画像が処理され、その描写的特徴に基
づく表現が自動的に抽出される。画像表現及び画像はデ
ータベースに記憶され、サーチインデックスが更新され
て、将来の描写的特徴に基づく画像選択及び/又は検索
にその画像表現が参加できるようにする。画像検索フェ
ーズと呼ばれる第2のフェーズは、ユーザが特定した描
写的特徴に基づく制約を満足する画像の検索及び/又は
選択に関する。アーカイブ及び検索フェーズのために画
像カラー空間が任意のあらかじめ規定された又は所望の
カラー空間に変換されることができることに留意された
い。以下に説明される実施形態の詳細は、何れのカラー
空間(例えば、RGB、YCC、HSV、CIEカラー
空間など)の画像にも適用可能である。また、画像は、
計算コスト及び記憶の要求条件を減らすために、両フェ
ーズにおいて所望の圧縮ダイナミックレンジに変換され
ることができる。
ブ及び検索システムを提供し、このシステムは二つの機
能的なフェーズからなっている。画像アーカイブフェー
ズと呼ばれる第1のフェーズでは、システムにより記憶
且つ管理される各画像が処理され、その描写的特徴に基
づく表現が自動的に抽出される。画像表現及び画像はデ
ータベースに記憶され、サーチインデックスが更新され
て、将来の描写的特徴に基づく画像選択及び/又は検索
にその画像表現が参加できるようにする。画像検索フェ
ーズと呼ばれる第2のフェーズは、ユーザが特定した描
写的特徴に基づく制約を満足する画像の検索及び/又は
選択に関する。アーカイブ及び検索フェーズのために画
像カラー空間が任意のあらかじめ規定された又は所望の
カラー空間に変換されることができることに留意された
い。以下に説明される実施形態の詳細は、何れのカラー
空間(例えば、RGB、YCC、HSV、CIEカラー
空間など)の画像にも適用可能である。また、画像は、
計算コスト及び記憶の要求条件を減らすために、両フェ
ーズにおいて所望の圧縮ダイナミックレンジに変換され
ることができる。
【0013】画像アーカイブフェーズ 画像アーカイブフェーズの主なステップが図1に示され
ている。各入力画像は分析されて、その表現が構築され
る。画像は、カラー、テクスチュア、及びカラー成分の
ような様々な異なる描写的特徴により表現されることが
できる。図1を参照すると、S10で、描写的特徴fが
まず選択される。好適な実施形態では、カラー又はテク
スチュアの何れかを選択することができる。S20で、
画像は分析されて、特徴fによってその知覚的顕在成分
が識別される。画像の描写的特徴は、それが観察者によ
る画像の知覚を支配するならば、知覚的に顕在する描写
的特徴とみなされる。例えば、赤というカラーは、大き
な赤い花の画像では、知覚的顕在カラー特徴である。画
像はそれから、S30で、選択された特徴の検出された
知覚的顕在成分により表現される。入力画像及びその表
現はその後に、S40で、画像データベースに追加され
る。
ている。各入力画像は分析されて、その表現が構築され
る。画像は、カラー、テクスチュア、及びカラー成分の
ような様々な異なる描写的特徴により表現されることが
できる。図1を参照すると、S10で、描写的特徴fが
まず選択される。好適な実施形態では、カラー又はテク
スチュアの何れかを選択することができる。S20で、
画像は分析されて、特徴fによってその知覚的顕在成分
が識別される。画像の描写的特徴は、それが観察者によ
る画像の知覚を支配するならば、知覚的に顕在する描写
的特徴とみなされる。例えば、赤というカラーは、大き
な赤い花の画像では、知覚的顕在カラー特徴である。画
像はそれから、S30で、選択された特徴の検出された
知覚的顕在成分により表現される。入力画像及びその表
現はその後に、S40で、画像データベースに追加され
る。
【0014】本発明によれば、画像のカラー特徴に基づ
く表現は、その画像中に存在する知覚的顕在カラーによ
る。画像の知覚的顕在カラーを識別する好適なアプロー
チは、画像における顕著なサイズのコヒーレントにカラ
ーが付いた領域は知覚的に顕在するという推定に基づい
ている。したがって、顕著なサイズのコヒーレントにカ
ラーが付いた領域は、知覚的顕在カラーとみなされる。
好適な実施形態は、画像の知覚的顕在カラーの識別のた
めに、2つの異なる方法を提供する。これらの方法の一
つは、データベースをセットアップするために選択され
る。第1のアプローチのキーとなるステップが図2に示
されている。入力画像毎に、そのコヒーレントカラーヒ
ストグラムがS100で最初に計算される。画像のコヒ
ーレントカラーヒストグラムは、H(c)=コヒーレン
トにカラーが付いた領域に属するカラーcのピクセル数
という形の関数である。ここで、cは画像のダイナミッ
クレンジにおける有効カラーである。ピクセルは、その
カラーがあらかじめ特定された最小数の近隣ピクセルの
カラーと等しいか又は類似しているならば、コヒーレン
トにカラーが付いた領域に属しているとみなされる。本
実施形態では、コヒーレンシーには、(i)少なくとも
2つの近隣がマッチする又は類似する場合、(ii)全て
の近隣がマッチ/類似しているという2つの定義があ
る。コヒーレンシーの同じ定義を、画像アーカイブ及び
検索フェーズの両方において全ての画像の分析のために
使用しなければならない。2つのカラーは、対応するチ
ャネル値が全て等しければ、等しいとみなされる。2つ
のカラーc1及びc2は、それらの差diff(c1,
c2)がユーザにより特定された閾値CTよりも小さけ
れば、類似しているとみなされる。CTの好適な値は、
diff(c1,c2)の可能性のある最大値の15%
から20%の範囲である。幾つかの異なるカラー差の計
算方法が可能である。本実施形態では、2つのLチャネ
ルのカラーを比較する以下の3つの方法の一つを、シス
テムの初期化時に選択することができる。
く表現は、その画像中に存在する知覚的顕在カラーによ
る。画像の知覚的顕在カラーを識別する好適なアプロー
チは、画像における顕著なサイズのコヒーレントにカラ
ーが付いた領域は知覚的に顕在するという推定に基づい
ている。したがって、顕著なサイズのコヒーレントにカ
ラーが付いた領域は、知覚的顕在カラーとみなされる。
好適な実施形態は、画像の知覚的顕在カラーの識別のた
めに、2つの異なる方法を提供する。これらの方法の一
つは、データベースをセットアップするために選択され
る。第1のアプローチのキーとなるステップが図2に示
されている。入力画像毎に、そのコヒーレントカラーヒ
ストグラムがS100で最初に計算される。画像のコヒ
ーレントカラーヒストグラムは、H(c)=コヒーレン
トにカラーが付いた領域に属するカラーcのピクセル数
という形の関数である。ここで、cは画像のダイナミッ
クレンジにおける有効カラーである。ピクセルは、その
カラーがあらかじめ特定された最小数の近隣ピクセルの
カラーと等しいか又は類似しているならば、コヒーレン
トにカラーが付いた領域に属しているとみなされる。本
実施形態では、コヒーレンシーには、(i)少なくとも
2つの近隣がマッチする又は類似する場合、(ii)全て
の近隣がマッチ/類似しているという2つの定義があ
る。コヒーレンシーの同じ定義を、画像アーカイブ及び
検索フェーズの両方において全ての画像の分析のために
使用しなければならない。2つのカラーは、対応するチ
ャネル値が全て等しければ、等しいとみなされる。2つ
のカラーc1及びc2は、それらの差diff(c1,
c2)がユーザにより特定された閾値CTよりも小さけ
れば、類似しているとみなされる。CTの好適な値は、
diff(c1,c2)の可能性のある最大値の15%
から20%の範囲である。幾つかの異なるカラー差の計
算方法が可能である。本実施形態では、2つのLチャネ
ルのカラーを比較する以下の3つの方法の一つを、シス
テムの初期化時に選択することができる。
【0015】(i)カラーcxとcyとは、|cx i−cy i
|<Ci Tであれば類似しているとみなされる。ここで、
ck iはカラーckのi番目のチャネルの値を示し、CT i
はi番目のチャネル値の差に対するあらかじめ特定され
た閾値である。
|<Ci Tであれば類似しているとみなされる。ここで、
ck iはカラーckのi番目のチャネルの値を示し、CT i
はi番目のチャネル値の差に対するあらかじめ特定され
た閾値である。
【0016】(ii)カラーcxとcyとは、Σi=1、Lwi・
(cx i−cy i)2<CTであれば類似しているとみなされ
る。ここで、ck iはカラーckのi番目のチャネルの値
を示し、wiはi番目のチャネルの重みを示し、CTはあ
らかじめ特定された閾値である。
(cx i−cy i)2<CTであれば類似しているとみなされ
る。ここで、ck iはカラーckのi番目のチャネルの値
を示し、wiはi番目のチャネルの重みを示し、CTはあ
らかじめ特定された閾値である。
【0017】(iii)カラーcxとcyとは、Σi=1、Lwi
・|(cx i−cy i)|<CTであれば類似しているとみ
なされる。ここで、ck iはカラーckのi番目のチャネ
ルの値を示し、wiはi番目のチャネルの重みを示し、
CTはあらかじめ特定された閾値である。
・|(cx i−cy i)|<CTであれば類似しているとみ
なされる。ここで、ck iはカラーckのi番目のチャネ
ルの値を示し、wiはi番目のチャネルの重みを示し、
CTはあらかじめ特定された閾値である。
【0018】その後にS110で、コヒーレントカラー
ヒストグラムが分析されて、知覚的顕在カラーを識別す
る。カラーkは、H(k)>Tであれば知覚的顕在カラ
ーであるとみなされる。ここでTは閾値である。この実
施形態では、T=画像中の全ピクセル数の0.5%であ
る。次のステップは、S120で、画像をその知覚的顕
在カラーにより表現することである。具体的には、画像
Iは、IC={N,Z,<Ci,Si>}(ただし、0<
i<N+1)というかたちのベクトルによって表現され
る。ここで、Nは画像Iにおける知覚的顕在カラーの数
であり、Z=ΣSiであり、Ciは画像Iのi番目の知覚
的顕在カラーのカラー値であり、Siは画像IのH
(Ci)と全ピクセル数との比である。
ヒストグラムが分析されて、知覚的顕在カラーを識別す
る。カラーkは、H(k)>Tであれば知覚的顕在カラ
ーであるとみなされる。ここでTは閾値である。この実
施形態では、T=画像中の全ピクセル数の0.5%であ
る。次のステップは、S120で、画像をその知覚的顕
在カラーにより表現することである。具体的には、画像
Iは、IC={N,Z,<Ci,Si>}(ただし、0<
i<N+1)というかたちのベクトルによって表現され
る。ここで、Nは画像Iにおける知覚的顕在カラーの数
であり、Z=ΣSiであり、Ciは画像Iのi番目の知覚
的顕在カラーのカラー値であり、Siは画像IのH
(Ci)と全ピクセル数との比である。
【0019】画像の知覚的顕在カラーを識別する第2の
方法のキーとなるステップが、図3に示されている。こ
の方法は、第1の方法の延長である。この場合、S20
0で、第1のステップのステップS100及びS110
が実行されて、知覚的顕在カラーを検出する。そのよう
にして獲得された知覚的顕在カラーのセットは知覚的顕
在カラーの初期セットとみなされ、支配的な知覚的顕在
カラーのセットを得るためにリファインされる。リファ
インプロセスは、S210で、知覚的顕在カラーの初期
セットに属するカラーのピクセルのみで構成された接続
成分を見いだすことでスタートする。これは、知覚的顕
在カラーのピクセルのみを考慮して(すなわち、それら
を目的のピクセルとみなして)且つ他のものを無視し
(すなわち、それらを背景ピクセルとみなし)ながら、
入力画像上の接続成分の分析を実行することによって達
成される。知覚的顕在カラー(すなわち、知覚的顕在カ
ラーの初期セットのカラー)を有する2つの近隣ピクセ
ル(4又は8の近隣)は、それらがマッチする/類似の
カラーであるときのみ、接続されているとみなされる。
そのようにして獲得された接続成分は、S220で、支
配的な知覚的顕在カラーのセットを決定するために分析
される。あらかじめ特定された閾値TSよりも大きなサ
イズの接続成分は、支配的な知覚的顕在セグメントとみ
なされる。本実施形態では、TS=画像中の全ピクセル
数の0.25%である。支配的な知覚的顕在セグメント
に属するカラーは、画像表現のための知覚的顕在カラー
のセットを形成する。最終ステップは再び、S230に
おいて、知覚的顕在カラーにより画像を表現することで
ある。知覚的顕在カラーのこの最終的なセットが知覚的
顕在カラーの初期セットのサブセットであることに留意
されたい。
方法のキーとなるステップが、図3に示されている。こ
の方法は、第1の方法の延長である。この場合、S20
0で、第1のステップのステップS100及びS110
が実行されて、知覚的顕在カラーを検出する。そのよう
にして獲得された知覚的顕在カラーのセットは知覚的顕
在カラーの初期セットとみなされ、支配的な知覚的顕在
カラーのセットを得るためにリファインされる。リファ
インプロセスは、S210で、知覚的顕在カラーの初期
セットに属するカラーのピクセルのみで構成された接続
成分を見いだすことでスタートする。これは、知覚的顕
在カラーのピクセルのみを考慮して(すなわち、それら
を目的のピクセルとみなして)且つ他のものを無視し
(すなわち、それらを背景ピクセルとみなし)ながら、
入力画像上の接続成分の分析を実行することによって達
成される。知覚的顕在カラー(すなわち、知覚的顕在カ
ラーの初期セットのカラー)を有する2つの近隣ピクセ
ル(4又は8の近隣)は、それらがマッチする/類似の
カラーであるときのみ、接続されているとみなされる。
そのようにして獲得された接続成分は、S220で、支
配的な知覚的顕在カラーのセットを決定するために分析
される。あらかじめ特定された閾値TSよりも大きなサ
イズの接続成分は、支配的な知覚的顕在セグメントとみ
なされる。本実施形態では、TS=画像中の全ピクセル
数の0.25%である。支配的な知覚的顕在セグメント
に属するカラーは、画像表現のための知覚的顕在カラー
のセットを形成する。最終ステップは再び、S230に
おいて、知覚的顕在カラーにより画像を表現することで
ある。知覚的顕在カラーのこの最終的なセットが知覚的
顕在カラーの初期セットのサブセットであることに留意
されたい。
【0020】当業者は、上記の2つのカラーに基づく画
像表現の様々な変化が、本発明の範囲内で可能であるこ
とを認識するであろう。例えば、一つの簡単な延長はこ
れらの2つの表現のコンビネーションであり、その場合
には、方法1の表現が、各々の知覚的顕在カラーを、そ
のカラーが支配的な知覚的顕在セグメントに属するかど
うかを示すタイプによって修飾することによって延長さ
れる。
像表現の様々な変化が、本発明の範囲内で可能であるこ
とを認識するであろう。例えば、一つの簡単な延長はこ
れらの2つの表現のコンビネーションであり、その場合
には、方法1の表現が、各々の知覚的顕在カラーを、そ
のカラーが支配的な知覚的顕在セグメントに属するかど
うかを示すタイプによって修飾することによって延長さ
れる。
【0021】本発明によれば、テクスチュアに基づく画
像の表現は、その画像にランダムに又は組織化されて
(structured)存在する知覚的顕在テクスチ
ュアによる。画像の知覚的顕在テクスチュアを識別する
好適なアプローチは、各々の知覚的顕在テクスチュアが
同じカラー転移(transition)の多数の反復
で構成されるという推定に基づいている。したがって、
頻繁に生じる(頻出;frequently occu
rring)カラー転移を識別してそれらのテクスチュ
ア特性を分析することによって、知覚的顕在テクスチュ
アを抽出して表現することができる。画像の知覚的顕在
テクスチュアの識別のための好適な実施形態が、図4に
示されている。入力画像毎に、プロセスの第1のステッ
プは、S300で、その画像中に存在するカラー転移を
全て検出することである。カラー転移は、今着目してい
る(カレント)ピクセル(c)とそれよりも下位の位置
にある直前のピクセル(p)との間で、カラー値の変化
dist(c,p)が所定の閾値thよりも大きければ
発生する。thの好適な値は、dist(c,p)の可
能な最大値の15%〜20%の範囲である。カラー転移
が生じるピクセルは、カラー転移ピクセルと呼ばれる。
本実施形態では、2つのLチャネルのカラーを比較する
以下の2つの方法の一つを選択して、カラー値の変化、
ここではカラー転移の発生を決定することができる。
像の表現は、その画像にランダムに又は組織化されて
(structured)存在する知覚的顕在テクスチ
ュアによる。画像の知覚的顕在テクスチュアを識別する
好適なアプローチは、各々の知覚的顕在テクスチュアが
同じカラー転移(transition)の多数の反復
で構成されるという推定に基づいている。したがって、
頻繁に生じる(頻出;frequently occu
rring)カラー転移を識別してそれらのテクスチュ
ア特性を分析することによって、知覚的顕在テクスチュ
アを抽出して表現することができる。画像の知覚的顕在
テクスチュアの識別のための好適な実施形態が、図4に
示されている。入力画像毎に、プロセスの第1のステッ
プは、S300で、その画像中に存在するカラー転移を
全て検出することである。カラー転移は、今着目してい
る(カレント)ピクセル(c)とそれよりも下位の位置
にある直前のピクセル(p)との間で、カラー値の変化
dist(c,p)が所定の閾値thよりも大きければ
発生する。thの好適な値は、dist(c,p)の可
能な最大値の15%〜20%の範囲である。カラー転移
が生じるピクセルは、カラー転移ピクセルと呼ばれる。
本実施形態では、2つのLチャネルのカラーを比較する
以下の2つの方法の一つを選択して、カラー値の変化、
ここではカラー転移の発生を決定することができる。
【0022】(i)現在のピクセルは、|c.ch0−
p.ch0|≧th.ch0 又は|c.ch1−p.c
h1|≧th.ch1... 又は|c.chi−p.c
hi|≧th.chi (ただし、0≦i≦L)であるな
らば、カラー転移ピクセルと識別される。ここで、c.
chiはカレントピクセルのi番目のカラーチャネル値
を示し、p.chiはそれよりも下位の位置にある直前
のピクセルのi番目のカラーチャネル値を示し、th.
chiはi番目のカラーチャネルのための所定の差閾値
を示す。
p.ch0|≧th.ch0 又は|c.ch1−p.c
h1|≧th.ch1... 又は|c.chi−p.c
hi|≧th.chi (ただし、0≦i≦L)であるな
らば、カラー転移ピクセルと識別される。ここで、c.
chiはカレントピクセルのi番目のカラーチャネル値
を示し、p.chiはそれよりも下位の位置にある直前
のピクセルのi番目のカラーチャネル値を示し、th.
chiはi番目のカラーチャネルのための所定の差閾値
を示す。
【0023】(ii)カレントピクセルは、
【数1】 であるならば、カラー転移ピクセルと識別される。ここ
で、c.chiはカレントピクセルのi番目のカラーチ
ャネル値を示し、p.chiはそれよりも下位の位置に
ある直前のピクセルのi番目のカラーチャネル値を示
し、thは所定のカラー差閾値を示す。
で、c.chiはカレントピクセルのi番目のカラーチ
ャネル値を示し、p.chiはそれよりも下位の位置に
ある直前のピクセルのi番目のカラーチャネル値を示
し、thは所定のカラー差閾値を示す。
【0024】当業者は、カラー転移の概念が、白黒画像
の場合にはグレイレベル又は明るさ(ブライトネス)の
転移として規定できることを認識するであろう。当業者
はまた、本発明の範囲内で、他のカラー差の計量法(メ
トリックス)を使用してカラー転移の存在を決定できる
ことも認識するであろう。画像は水平及び垂直にスキャ
ンされて、上記の方法の一つを使用して全てのカラー転
移ピクセルを識別する。カラー転移ピクセル毎にカラー
転移をシグナルし、各カラー転移は、カラー転移を形成
する過去及び現在ピクセルカラー値に対応する2つのカ
ラー(c1,c2)により表現される。プロセスにおけ
る第2のステップは、S310で、頻出カラー転移を全
て識別することである。c1及びc2を2つの次元とす
る2次元カラー転移ヒストグラムが構築されて、先のス
テップで発見された様々なカラー転移の頻度が記録され
る。好適な実施形態では、カラー転移ヒストグラムの構
築及び頻度記録(populating)のために3つ
のオプションを提供する。第1のオプションではグロー
バルなカラー転移ヒストグラムの構築を行い、これに
は、その画像で発見される全てのカラー転移の頻度が記
録される。カラー転移ヒストグラムにおける発生閾値の
所定の最小頻度も越えるピークを全て見いだすことで、
頻出カラー転移を識別する。グローバルなカラー転移ヒ
ストグラムのための頻出カラー転移を識別するための好
適な最小頻度閾値は、画像の全ピクセル数の0.25%
である。第2のオプションでは、画像をオーバーラップ
しないセクションにモザイク化し、それからセクション
転移ヒストグラムのセットを構築して、これに、対応す
る画像セクションで発見されるカラー転移の頻度を記録
する。本実施形態では、24のセクションヒストグラム
のセットを構築する。全セクション転移ヒストグラムに
おける発生閾値の所定の最小頻度も越えるピークを全て
見いだすことで、頻出カラー転移を識別する。セクショ
ンカラー転移ヒストグラムのための頻出カラー転移を識
別するための好適な最小頻度閾値は、各モザイクセクシ
ョンにおける画像の全ピクセル数の2.5%である。最
後のオプションは、上記2つの方法のコンビネーション
であり、グローバルヒストグラム及びセクションヒスト
グラムの両方が構築されて、全ピークが上述の方法で識
別される。これらのピークは最頻出カラー転移を示し、
これらは、画像における知覚的顕在テクスチュアに対応
する。プロセスの第3のステップは、S320における
知覚的顕在テクスチュアを表現するための頻出カラー転
移のテクスチュア特性の分析である。頻出カラー転移毎
に、画像全体におけるこの特定のカラー転移の発生を全
て見いだして、スケール及び勾配値が計算される。現在
の実施形態では、スケールは、カラーc1とカラーc2
との発生の間のピクセルによる距離として計算される。
勾配は、tan-1(gy/gx)として計算されるが、こ
こでgy及びgxはそれぞれ、カラー転移における垂直及
び水平のエッジ情報であり、ソベルオペレータ(Sob
el operator)を使用して計算される。スケ
ール及び勾配値を計算するための他の技法が本発明の範
囲を超えることなく可能であることに留意されたい。各
々の発生に対する計算されたスケール及び勾配値は、ス
ケール−勾配ヒストグラムを構築するために使用され
る。全ての発生が考慮された後で、スケール−勾配ヒス
トグラムを使用して知覚的顕在テクスチュアのテクスチ
ュア特性を分析する。ランダムテクスチュアに対して
は、スケール−勾配ヒストグラムはランダムに分布し、
組織化テクスチュアに対しては、スケール、勾配、又は
その両方の顕在するシャープなモードがスケール−勾配
ヒストグラムに検出されることができる。ランダムテク
スチュアに対応するカラー転移に対しては、スケール−
勾配ヒストグラムを使用してスケール−勾配平均ベクト
ル及びスケール−勾配共分散(co−varianc
e)マトリクスを計算する。組織化テクスチュアに対応
するカラー転移に対しては、対応するヒストグラムモー
ドを使用してスケール−勾配平均ベクトル及びスケール
−勾配共分散マトリクスを計算する。これらの特性を使
用して、知覚的顕在テクスチュアを表現する。最終ステ
ップは、S330において、画像をその知覚的顕在テク
スチュアにより表現することである。画像Iは、IT=
{N,Z,<C1 i,C2 i,Pi,Mi,Vi,Si>}(た
だし、0<i<N+1)という形のベクトルにより表現
される。ここで、Nは画像Iにおける支配的な知覚的顕
在テクスチュアの数であり、Z=ΣSiであり、C1 i及
びC2 iはi番目の知覚的顕在テクスチュアに対応する頻
出カラー転移のカラー値であり、Piはi番目の知覚的
顕在テクスチュアのテクスチュアタイプであって、ラン
ダム、スケール組織化、勾配組織化、又はスケール−勾
配組織化という可能性のある値のうちの一つをとり、M
i及びViはそれぞれ、セットにおけるi番目の知覚的顕
在テクスチュアのスケール−勾配平均ベクトル及びスケ
ール−勾配共分散マトリクスであり、Siはi番目の知
覚的顕在テクスチュアの全エリアカバレッジであって、
i番目の知覚的顕在テクスチュアに対応する頻出カラー
転移の全ての発生に対するスケール値を全て累積するこ
とによって計算される。当業者は、ITの他のテクスチ
ュア特性又はサブセット/スーパーセットを使用して知
覚的顕在テクスチュアを表現することができることを認
識するであろう。
の場合にはグレイレベル又は明るさ(ブライトネス)の
転移として規定できることを認識するであろう。当業者
はまた、本発明の範囲内で、他のカラー差の計量法(メ
トリックス)を使用してカラー転移の存在を決定できる
ことも認識するであろう。画像は水平及び垂直にスキャ
ンされて、上記の方法の一つを使用して全てのカラー転
移ピクセルを識別する。カラー転移ピクセル毎にカラー
転移をシグナルし、各カラー転移は、カラー転移を形成
する過去及び現在ピクセルカラー値に対応する2つのカ
ラー(c1,c2)により表現される。プロセスにおけ
る第2のステップは、S310で、頻出カラー転移を全
て識別することである。c1及びc2を2つの次元とす
る2次元カラー転移ヒストグラムが構築されて、先のス
テップで発見された様々なカラー転移の頻度が記録され
る。好適な実施形態では、カラー転移ヒストグラムの構
築及び頻度記録(populating)のために3つ
のオプションを提供する。第1のオプションではグロー
バルなカラー転移ヒストグラムの構築を行い、これに
は、その画像で発見される全てのカラー転移の頻度が記
録される。カラー転移ヒストグラムにおける発生閾値の
所定の最小頻度も越えるピークを全て見いだすことで、
頻出カラー転移を識別する。グローバルなカラー転移ヒ
ストグラムのための頻出カラー転移を識別するための好
適な最小頻度閾値は、画像の全ピクセル数の0.25%
である。第2のオプションでは、画像をオーバーラップ
しないセクションにモザイク化し、それからセクション
転移ヒストグラムのセットを構築して、これに、対応す
る画像セクションで発見されるカラー転移の頻度を記録
する。本実施形態では、24のセクションヒストグラム
のセットを構築する。全セクション転移ヒストグラムに
おける発生閾値の所定の最小頻度も越えるピークを全て
見いだすことで、頻出カラー転移を識別する。セクショ
ンカラー転移ヒストグラムのための頻出カラー転移を識
別するための好適な最小頻度閾値は、各モザイクセクシ
ョンにおける画像の全ピクセル数の2.5%である。最
後のオプションは、上記2つの方法のコンビネーション
であり、グローバルヒストグラム及びセクションヒスト
グラムの両方が構築されて、全ピークが上述の方法で識
別される。これらのピークは最頻出カラー転移を示し、
これらは、画像における知覚的顕在テクスチュアに対応
する。プロセスの第3のステップは、S320における
知覚的顕在テクスチュアを表現するための頻出カラー転
移のテクスチュア特性の分析である。頻出カラー転移毎
に、画像全体におけるこの特定のカラー転移の発生を全
て見いだして、スケール及び勾配値が計算される。現在
の実施形態では、スケールは、カラーc1とカラーc2
との発生の間のピクセルによる距離として計算される。
勾配は、tan-1(gy/gx)として計算されるが、こ
こでgy及びgxはそれぞれ、カラー転移における垂直及
び水平のエッジ情報であり、ソベルオペレータ(Sob
el operator)を使用して計算される。スケ
ール及び勾配値を計算するための他の技法が本発明の範
囲を超えることなく可能であることに留意されたい。各
々の発生に対する計算されたスケール及び勾配値は、ス
ケール−勾配ヒストグラムを構築するために使用され
る。全ての発生が考慮された後で、スケール−勾配ヒス
トグラムを使用して知覚的顕在テクスチュアのテクスチ
ュア特性を分析する。ランダムテクスチュアに対して
は、スケール−勾配ヒストグラムはランダムに分布し、
組織化テクスチュアに対しては、スケール、勾配、又は
その両方の顕在するシャープなモードがスケール−勾配
ヒストグラムに検出されることができる。ランダムテク
スチュアに対応するカラー転移に対しては、スケール−
勾配ヒストグラムを使用してスケール−勾配平均ベクト
ル及びスケール−勾配共分散(co−varianc
e)マトリクスを計算する。組織化テクスチュアに対応
するカラー転移に対しては、対応するヒストグラムモー
ドを使用してスケール−勾配平均ベクトル及びスケール
−勾配共分散マトリクスを計算する。これらの特性を使
用して、知覚的顕在テクスチュアを表現する。最終ステ
ップは、S330において、画像をその知覚的顕在テク
スチュアにより表現することである。画像Iは、IT=
{N,Z,<C1 i,C2 i,Pi,Mi,Vi,Si>}(た
だし、0<i<N+1)という形のベクトルにより表現
される。ここで、Nは画像Iにおける支配的な知覚的顕
在テクスチュアの数であり、Z=ΣSiであり、C1 i及
びC2 iはi番目の知覚的顕在テクスチュアに対応する頻
出カラー転移のカラー値であり、Piはi番目の知覚的
顕在テクスチュアのテクスチュアタイプであって、ラン
ダム、スケール組織化、勾配組織化、又はスケール−勾
配組織化という可能性のある値のうちの一つをとり、M
i及びViはそれぞれ、セットにおけるi番目の知覚的顕
在テクスチュアのスケール−勾配平均ベクトル及びスケ
ール−勾配共分散マトリクスであり、Siはi番目の知
覚的顕在テクスチュアの全エリアカバレッジであって、
i番目の知覚的顕在テクスチュアに対応する頻出カラー
転移の全ての発生に対するスケール値を全て累積するこ
とによって計算される。当業者は、ITの他のテクスチ
ュア特性又はサブセット/スーパーセットを使用して知
覚的顕在テクスチュアを表現することができることを認
識するであろう。
【0025】知覚的顕在特徴に基づく画像表示を生成し
た後、次のステップは、画像及び関連する表現をデータ
ベース及び適当なインデックス構造へ挿入することであ
る。当業者は、全体のデータベース組織が下位のデータ
ベース/ファイル管理システムに依存することを認識す
るであろう。また、インデクシングスキームは、問合せ
のタイプとそれらの期待頻度とに依存する。本実施形態
では、画像は画像データベースの中に存在する。登録さ
れた画像毎にサムネイルバージョンが生成され、これが
サムネイルデータベースに記憶される。画像のサムネイ
ルバージョンは、サーチ/検索結果を表示するために使
用される。画像表現(メタデータ)はメタデータベース
に記憶される。知覚的顕在特徴の表現に加えて、画像表
現(メタデータ)は、対応するサムネイルと共に画像フ
ァイルへのリファレンスとして機能する画像識別子/ロ
ケータも含む。画像名/IDは、その表現のロケータと
して機能する。本実施形態ではカラー及びテクスチュア
表現が別個の構造に組織されるが、これらが共通の画像
及びサムネイルセットを共有することに留意されたい。
た後、次のステップは、画像及び関連する表現をデータ
ベース及び適当なインデックス構造へ挿入することであ
る。当業者は、全体のデータベース組織が下位のデータ
ベース/ファイル管理システムに依存することを認識す
るであろう。また、インデクシングスキームは、問合せ
のタイプとそれらの期待頻度とに依存する。本実施形態
では、画像は画像データベースの中に存在する。登録さ
れた画像毎にサムネイルバージョンが生成され、これが
サムネイルデータベースに記憶される。画像のサムネイ
ルバージョンは、サーチ/検索結果を表示するために使
用される。画像表現(メタデータ)はメタデータベース
に記憶される。知覚的顕在特徴の表現に加えて、画像表
現(メタデータ)は、対応するサムネイルと共に画像フ
ァイルへのリファレンスとして機能する画像識別子/ロ
ケータも含む。画像名/IDは、その表現のロケータと
して機能する。本実施形態ではカラー及びテクスチュア
表現が別個の構造に組織されるが、これらが共通の画像
及びサムネイルセットを共有することに留意されたい。
【0026】当業者は、データセットを組織するための
インデックス構造の選択が、そのインデックス構造によ
り実行されるべき所望の機能に依存していることを認識
するであろう。本実施形態で必要とされる機能性は、所
与の問合せ/例画像に類似する画像の選択及び検索を促
進することである。この機能を促進するために、カラー
/テクスチュア表現を組織するために使用される概念的
インデックス構造が図5に示されている。知覚的顕在特
徴値fが与えられると、この組織は、その特徴fを含む
データベース中の全ての画像表現へのポインタ/リファ
レンスのリストを提供する。当業者は、この概念的イン
デックス構造が本発明の範囲内で様々な方法で実現でき
ることを認識するであろう。当業者はまた、所望のタス
クを達成するために様々な他のインデックス構造が可能
であることも認識するであろう。一般に、知覚的顕在特
徴の重要性は、その表現の中の対応するS値に直接的に
比例する。したがって、画像表現を、その知覚的顕在特
徴の各々に関連する画像表現リストに加える代わりに、
本実施形態は、表現の挿入を、その特定の画像における
主要な特徴に関連したリストのみに限定するというオプ
ションを提供する。好適な実施形態では、知覚的顕在特
徴は、そのS値が閾値Gよりも大きいか、又はそのS値
が画像の知覚的顕在特徴のM個の最大S値の一つである
ならば、主要であるとみなされる。G及びMの値は、シ
ステムのインストール/初期化の時点で設定される。オ
プションの一つが、画像の各々の知覚的顕在特徴を主要
な知覚的顕在特徴とみなすことであることに留意された
い。
インデックス構造の選択が、そのインデックス構造によ
り実行されるべき所望の機能に依存していることを認識
するであろう。本実施形態で必要とされる機能性は、所
与の問合せ/例画像に類似する画像の選択及び検索を促
進することである。この機能を促進するために、カラー
/テクスチュア表現を組織するために使用される概念的
インデックス構造が図5に示されている。知覚的顕在特
徴値fが与えられると、この組織は、その特徴fを含む
データベース中の全ての画像表現へのポインタ/リファ
レンスのリストを提供する。当業者は、この概念的イン
デックス構造が本発明の範囲内で様々な方法で実現でき
ることを認識するであろう。当業者はまた、所望のタス
クを達成するために様々な他のインデックス構造が可能
であることも認識するであろう。一般に、知覚的顕在特
徴の重要性は、その表現の中の対応するS値に直接的に
比例する。したがって、画像表現を、その知覚的顕在特
徴の各々に関連する画像表現リストに加える代わりに、
本実施形態は、表現の挿入を、その特定の画像における
主要な特徴に関連したリストのみに限定するというオプ
ションを提供する。好適な実施形態では、知覚的顕在特
徴は、そのS値が閾値Gよりも大きいか、又はそのS値
が画像の知覚的顕在特徴のM個の最大S値の一つである
ならば、主要であるとみなされる。G及びMの値は、シ
ステムのインストール/初期化の時点で設定される。オ
プションの一つが、画像の各々の知覚的顕在特徴を主要
な知覚的顕在特徴とみなすことであることに留意された
い。
【0027】好適な実施形態では、カラーに基づくサー
チに対しては、知覚的顕在(支配的な知覚的顕在)カラ
ーに基づくインデックスが生成される。すなわち、カラ
ー値を与えられると、インデックスは、そのカラーを知
覚的顕在カラーとして含む画像のリストを提供する。テ
クスチュアに基づくサーチに対しては、以下の2つのイ
ンデックスのうちの一つ又は両方が生成される;(a)
カラー転移値、そのカラー転移からなる知覚的顕在特徴
を含む画像及び対応する表現のリストに関連するインデ
ックス、及び(b)(カラー転移、テクスチュアタイ
プ)ペア、そのカラー転移からなるタイプの知覚的顕在
テクスチュアを含む画像及び対応する表現のリストに関
連するインデックス。2つの画像のテクスチュア類似性
が、テクスチュアタイプを強制的に同じにするならば、
そのときには、(カラー転移、テクスチュアタイプ)ペ
アに基づくインデックスを使用して所望の画像がサーチ
される。そうでなければ、カラー転移に基づくインデッ
クスがサーチされる。
チに対しては、知覚的顕在(支配的な知覚的顕在)カラ
ーに基づくインデックスが生成される。すなわち、カラ
ー値を与えられると、インデックスは、そのカラーを知
覚的顕在カラーとして含む画像のリストを提供する。テ
クスチュアに基づくサーチに対しては、以下の2つのイ
ンデックスのうちの一つ又は両方が生成される;(a)
カラー転移値、そのカラー転移からなる知覚的顕在特徴
を含む画像及び対応する表現のリストに関連するインデ
ックス、及び(b)(カラー転移、テクスチュアタイ
プ)ペア、そのカラー転移からなるタイプの知覚的顕在
テクスチュアを含む画像及び対応する表現のリストに関
連するインデックス。2つの画像のテクスチュア類似性
が、テクスチュアタイプを強制的に同じにするならば、
そのときには、(カラー転移、テクスチュアタイプ)ペ
アに基づくインデックスを使用して所望の画像がサーチ
される。そうでなければ、カラー転移に基づくインデッ
クスがサーチされる。
【0028】画像選択/検索フェーズ 画像選択/検索フェーズでは、サーチ/検索リクエスト
が、問合せ/例画像と、検索又は選択された画像により
満足されなければならないある制約条件とを特定する。
好適な実施形態では、許容される制約条件は、(i)知
覚的に顕在する問合せ/例画像の特徴のうちでマッチし
なければならない最小数、(ii)問合せ画像の知覚的顕
在特徴の全サイズのうちでマッチしなければならない最
小パーセンテージ、及び(iii)これら2つの制約条件
の論理的なコンビネーション、である。問合せ/例画像
に類似すると共に特定された制約条件を満足する画像
が、選択及び/又は検索される。これを達成するため
に、適当なインデックスサーチがまず実行されて、問合
せ/例画像の一つ又はそれ以上の知覚的顕在特徴(又
は、主要な知覚的顕在特徴に基づくインデックスが使用
されるときには、主要な知覚的顕在特徴)を含む画像を
選択する。選択された画像毎に、その表現がそれから分
析されて、上述の特定された制約条件を満たすかどうか
が決定され、その制約条件を満たす画像に対しては、問
合せ/例との類似性の尺度(measure)が計算さ
れて、これらが候補画像として検索される。候補画像は
その後に、問合せ/例画像に対するそれらの類似値に基
づいてランク付けされる。
が、問合せ/例画像と、検索又は選択された画像により
満足されなければならないある制約条件とを特定する。
好適な実施形態では、許容される制約条件は、(i)知
覚的に顕在する問合せ/例画像の特徴のうちでマッチし
なければならない最小数、(ii)問合せ画像の知覚的顕
在特徴の全サイズのうちでマッチしなければならない最
小パーセンテージ、及び(iii)これら2つの制約条件
の論理的なコンビネーション、である。問合せ/例画像
に類似すると共に特定された制約条件を満足する画像
が、選択及び/又は検索される。これを達成するため
に、適当なインデックスサーチがまず実行されて、問合
せ/例画像の一つ又はそれ以上の知覚的顕在特徴(又
は、主要な知覚的顕在特徴に基づくインデックスが使用
されるときには、主要な知覚的顕在特徴)を含む画像を
選択する。選択された画像毎に、その表現がそれから分
析されて、上述の特定された制約条件を満たすかどうか
が決定され、その制約条件を満たす画像に対しては、問
合せ/例との類似性の尺度(measure)が計算さ
れて、これらが候補画像として検索される。候補画像は
その後に、問合せ/例画像に対するそれらの類似値に基
づいてランク付けされる。
【0029】例画像に基づく類似画像の検索/選択プロ
セスのキーとなるステップは、図6に示されている。問
合せ/例画像が与えられると、S500で、その所望の
表現(すなわちカラー又はテクスチュアに基づいた)が
計算又は獲得される。問合せ/例画像が現在の画像デー
タベースから選択されるならば、その表現はそのデータ
ベースから獲得される。問合せ/例画像が新しい画像で
あれば、そのときにはその表現が計算される。次に、S
510で、メタデータのデータベース又は関連したイン
デックス構造がサーチされて、サーチ規準を潜在的に満
たすことができる候補画像を見いだす。これは、インデ
ックス構造をサーチして、問合せ/例画像と共通な少な
くとも一つの知覚的顕在特徴(又は、主要な知覚的顕在
特徴に基づく表現が使用されるときには、主要な知覚的
顕在特徴)を含む画像を識別することによって達成され
る。好適なインデックス構造に対して、これは、知覚的
顕在(又は主要な知覚的顕在)特徴fp毎にインデック
ス構造をサーチして、特徴fpを知覚的顕在(又は主要
な知覚的顕在)特徴として有する画像を見いだすことに
より達成される。各々の個別のサーチから獲得された画
像のセットの組合せ(ユニオン)が、選択された画像の
セットを形成する。S520で、各々の選択された画像
の表現が問合せ画像の表現と比較されて、特定された制
約条件を満足する候補画像が選択される。オプションと
して、S530で、サーチ/検索制約条件を満足する各
画像に対して問合せ画像との類似性の尺度が計算され
て、選択された画像のセットが計算された画像類似性に
基づいた順番にランク付けされる。
セスのキーとなるステップは、図6に示されている。問
合せ/例画像が与えられると、S500で、その所望の
表現(すなわちカラー又はテクスチュアに基づいた)が
計算又は獲得される。問合せ/例画像が現在の画像デー
タベースから選択されるならば、その表現はそのデータ
ベースから獲得される。問合せ/例画像が新しい画像で
あれば、そのときにはその表現が計算される。次に、S
510で、メタデータのデータベース又は関連したイン
デックス構造がサーチされて、サーチ規準を潜在的に満
たすことができる候補画像を見いだす。これは、インデ
ックス構造をサーチして、問合せ/例画像と共通な少な
くとも一つの知覚的顕在特徴(又は、主要な知覚的顕在
特徴に基づく表現が使用されるときには、主要な知覚的
顕在特徴)を含む画像を識別することによって達成され
る。好適なインデックス構造に対して、これは、知覚的
顕在(又は主要な知覚的顕在)特徴fp毎にインデック
ス構造をサーチして、特徴fpを知覚的顕在(又は主要
な知覚的顕在)特徴として有する画像を見いだすことに
より達成される。各々の個別のサーチから獲得された画
像のセットの組合せ(ユニオン)が、選択された画像の
セットを形成する。S520で、各々の選択された画像
の表現が問合せ画像の表現と比較されて、特定された制
約条件を満足する候補画像が選択される。オプションと
して、S530で、サーチ/検索制約条件を満足する各
画像に対して問合せ画像との類似性の尺度が計算され
て、選択された画像のセットが計算された画像類似性に
基づいた順番にランク付けされる。
【0030】カラーに基づく画像の選択/検索に対して
は、知覚的顕在又は主要な知覚的顕在カラーに基づくイ
ンデックス構造がサーチされて、問合せ画像の知覚的顕
在(又は主要な知覚的顕在)カラーの少なくとも一つを
その表現の中に含む画像を見いだす。カラーに基づく表
現に対する類似性の尺度に対する好適なオプションは、
は、知覚的顕在又は主要な知覚的顕在カラーに基づくイ
ンデックス構造がサーチされて、問合せ画像の知覚的顕
在(又は主要な知覚的顕在)カラーの少なくとも一つを
その表現の中に含む画像を見いだす。カラーに基づく表
現に対する類似性の尺度に対する好適なオプションは、
【数2】 である。ここで、Nはデータベース中の問合せ画像q及
び画像dのマッチするカラーの数であり、Si q及びSi d
はそれぞれ、画像q及びdのi番目のマッチングカラー
に対するサイズ修飾値であり、diffは与えられたxに対
するLx|.|ノームというタイプの正規化された距離関
数であり、Ωq及びΩdは画像q及びdの対応する知覚的
顕在カラーのサイズ修飾値のセットである。
び画像dのマッチするカラーの数であり、Si q及びSi d
はそれぞれ、画像q及びdのi番目のマッチングカラー
に対するサイズ修飾値であり、diffは与えられたxに対
するLx|.|ノームというタイプの正規化された距離関
数であり、Ωq及びΩdは画像q及びdの対応する知覚的
顕在カラーのサイズ修飾値のセットである。
【0031】テクスチュアに基づく画像の選択/検索に
対しては、知覚的顕在(又は主要な知覚的顕在)テクス
チュアに基づくインデックス構造がサーチされて、問合
せ画像の知覚的顕在(又は主要な知覚的顕在)テクスチ
ュアの少なくとも一つをその表現の中に含むとともに、
特定された候補制約条件を満足する画像を見いだす。結
果として得られた候補画像のセットは、さらに問合せ/
例画像と比較されて、問合せ/例画像に対する候補のテ
クスチュアに基づく類似性が決定される。問合せ/例画
像と候補画像との間の類似性の好適な尺度は、マッチす
る又は共通の知覚的顕在テクスチュアの類似性に依存し
ており、また、マッチする/共通の知覚的顕在テクスチ
ュアによる問合せ/例画像及び候補画像における全エリ
アカバレッジにも依存している。2つの知覚的顕在テク
スチュアは、それらがその表現の中にマッチするカラー
値C1,C2及びテクスチュア特性値P(ランダムな又
は組織化された)を有するならば、マッチする/共通で
ある。好適な実施形態では、各々のマッチする/共通な
知覚的顕在テクスチュアに対して、マッチする知覚的顕
在テクスチュアの類似性が、スケール−勾配平均ベクト
ルM及びスケール−勾配共分散マトリクスVからユーク
リッド距離又はマハラノビス距離の何れかを使用して計
算される。他の距離関数が本発明の範囲内で使用されて
も良いことに留意されたい。候補と問合せ/例画像との
間の全体的な画像類似性のスコアは、全てのマッチする
知覚的顕在テクスチュアの類似性値に画像内でのそのテ
クスチュアの相対的なエリアカバレッジSをかけたもの
の合計として決定される。一般的に、マハラノビス距離
はシンメトリックな距離ではなく、分布Aから分布Bま
での距離は分布Bから分布Aまでの距離とは異なること
に留意されたい。加えて、相対的なエリアカバレッジS
は、候補及び問合せ画像で異なっている。したがって、
2つの全体的な画像の類似性スコアが一般的に類似性の
計算から得られるのであり、その一つは、問合せから候
補までのSq-cであり、他方は、候補から問合せまでの
Sc-qである。好適な実施形態は、一つの単一類似性メ
トリックを得るために5つの異なるオプションを有して
いる。最初の2つのオプションは、Sq-c又はSc-qの何
れかを最終的な全体的類似性メトリックとしてとり、第
3のオプションはSq-c及びSc-qのうちの最大をとり、
第4のオプションはSq-c及びSc-qの平均をとり、第5
のオプションはSq-c及びSc-qの積をとる。他のコンビ
ネーション的な方法を、本発明の範囲を超えることなく
使用することもできる。全ての候補画像に対して類似性
メトリックを計算した後に、それらはその類似性メトリ
ックに従って順にランク付けされて表示される。
対しては、知覚的顕在(又は主要な知覚的顕在)テクス
チュアに基づくインデックス構造がサーチされて、問合
せ画像の知覚的顕在(又は主要な知覚的顕在)テクスチ
ュアの少なくとも一つをその表現の中に含むとともに、
特定された候補制約条件を満足する画像を見いだす。結
果として得られた候補画像のセットは、さらに問合せ/
例画像と比較されて、問合せ/例画像に対する候補のテ
クスチュアに基づく類似性が決定される。問合せ/例画
像と候補画像との間の類似性の好適な尺度は、マッチす
る又は共通の知覚的顕在テクスチュアの類似性に依存し
ており、また、マッチする/共通の知覚的顕在テクスチ
ュアによる問合せ/例画像及び候補画像における全エリ
アカバレッジにも依存している。2つの知覚的顕在テク
スチュアは、それらがその表現の中にマッチするカラー
値C1,C2及びテクスチュア特性値P(ランダムな又
は組織化された)を有するならば、マッチする/共通で
ある。好適な実施形態では、各々のマッチする/共通な
知覚的顕在テクスチュアに対して、マッチする知覚的顕
在テクスチュアの類似性が、スケール−勾配平均ベクト
ルM及びスケール−勾配共分散マトリクスVからユーク
リッド距離又はマハラノビス距離の何れかを使用して計
算される。他の距離関数が本発明の範囲内で使用されて
も良いことに留意されたい。候補と問合せ/例画像との
間の全体的な画像類似性のスコアは、全てのマッチする
知覚的顕在テクスチュアの類似性値に画像内でのそのテ
クスチュアの相対的なエリアカバレッジSをかけたもの
の合計として決定される。一般的に、マハラノビス距離
はシンメトリックな距離ではなく、分布Aから分布Bま
での距離は分布Bから分布Aまでの距離とは異なること
に留意されたい。加えて、相対的なエリアカバレッジS
は、候補及び問合せ画像で異なっている。したがって、
2つの全体的な画像の類似性スコアが一般的に類似性の
計算から得られるのであり、その一つは、問合せから候
補までのSq-cであり、他方は、候補から問合せまでの
Sc-qである。好適な実施形態は、一つの単一類似性メ
トリックを得るために5つの異なるオプションを有して
いる。最初の2つのオプションは、Sq-c又はSc-qの何
れかを最終的な全体的類似性メトリックとしてとり、第
3のオプションはSq-c及びSc-qのうちの最大をとり、
第4のオプションはSq-c及びSc-qの平均をとり、第5
のオプションはSq-c及びSc-qの積をとる。他のコンビ
ネーション的な方法を、本発明の範囲を超えることなく
使用することもできる。全ての候補画像に対して類似性
メトリックを計算した後に、それらはその類似性メトリ
ックに従って順にランク付けされて表示される。
【0032】当業者は、他の類似性尺度を本発明の範囲
内で使用できることを認識するであろう。オプションと
して、選択された画像のサムネールを検索し、ランク付
けされた順に表示することができる。
内で使用できることを認識するであろう。オプションと
して、選択された画像のサムネールを検索し、ランク付
けされた順に表示することができる。
【0033】本発明が、好適な実施形態を参照して説明
されてきたが、本発明の範囲を離れることなく変更及び
改変が当業者により行われることができることが理解さ
れるであろう。
されてきたが、本発明の範囲を離れることなく変更及び
改変が当業者により行われることができることが理解さ
れるであろう。
【図1】 本発明の実施の形態に係るソフトウエアプロ
グラムの概略を示すフローチャートである。
グラムの概略を示すフローチャートである。
【図2】 画像における知覚的顕在カラーを計算する一
つの方法を示すフローチャートである。
つの方法を示すフローチャートである。
【図3】 画像における知覚的顕在カラーを計算する第
2の方法を示すフローチャートである。
2の方法を示すフローチャートである。
【図4】 画像における知覚的顕在テクスチュアを示す
フローチャートである。
フローチャートである。
【図5】 画像を組織するために使用されるインデック
ス構造のダイアグラム図である。
ス構造のダイアグラム図である。
【図6】 例の画像を使用した画像検索を示すフローチ
ャートである。
ャートである。
S20 画像を分析して、その知覚的顕在成分を識別す
るステップ、S30特徴fのその検出された知覚的顕在
成分により画像を表現するステップ、S40画像とその
表現をデータベースに記憶するステップ。
るステップ、S30特徴fのその検出された知覚的顕在
成分により画像を表現するステップ、S40画像とその
表現をデータベースに記憶するステップ。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06T 7/00 300 G06T 7/00 300F 7/40 7/40 Z
Claims (3)
- 【請求項1】 画像を前記画像の描写的特徴に基づく表
現に基づいてアーカイブする方法であって、 (a)前記画像の知覚において優勢である、一つ又は複
数の知覚的に顕在する描写的特徴により表された前記表
現を、自動的に抽出するステップと、 (b)前記画像及び該表現をデータベースに記憶するス
テップと、を含む、方法。 - 【請求項2】 前記画像の知覚的に顕在する描写的特徴
に基づく表現を自動的に抽出する前記ステップ(a)
が、その知覚的に顕在するカラーに基づく表現の抽出を
含む、請求項1に記載の方法。 - 【請求項3】 前記画像の知覚的に顕在する描写的特徴
に基づく表現を自動的に抽出する前記ステップ(a)
が、その知覚的に顕在するテクスチュアに基づく表現の
抽出を含む、請求項1に記載の方法。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US29185799A | 1999-04-14 | 1999-04-14 | |
| US09/291857 | 1999-04-14 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2000339352A true JP2000339352A (ja) | 2000-12-08 |
Family
ID=23122157
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2000112139A Pending JP2000339352A (ja) | 1999-04-14 | 2000-04-13 | 知覚的顕在特徴に基づく画像のアーカイブ及び検索 |
Country Status (2)
| Country | Link |
|---|---|
| EP (1) | EP1045313A3 (ja) |
| JP (1) | JP2000339352A (ja) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6826316B2 (en) * | 2001-01-24 | 2004-11-30 | Eastman Kodak Company | System and method for determining image similarity |
| GB0103965D0 (en) * | 2001-02-17 | 2001-04-04 | Univ Nottingham | Image and image content processing,representation and analysis for image matching,indexing or retrieval and database management |
| JP4335538B2 (ja) | 2001-05-18 | 2009-09-30 | シャープ株式会社 | コンテンツサーバ、コンテンツ表示端末およびコンテンツ配信システム |
-
2000
- 2000-04-03 EP EP00201205A patent/EP1045313A3/en not_active Withdrawn
- 2000-04-13 JP JP2000112139A patent/JP2000339352A/ja active Pending
Also Published As
| Publication number | Publication date |
|---|---|
| EP1045313A2 (en) | 2000-10-18 |
| EP1045313A3 (en) | 2006-01-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4139615B2 (ja) | 前景/背景セグメント化を用いた画像のイベント・クラスタリング | |
| US6826316B2 (en) | System and method for determining image similarity | |
| JP4964788B2 (ja) | 時間情報が欠落した画像の追加的クラスタリング | |
| US6345274B1 (en) | Method and computer program product for subjective image content similarity-based retrieval | |
| US8391618B1 (en) | Semantic image classification and search | |
| US6584221B1 (en) | Method for image retrieval with multiple regions of interest | |
| US20080208791A1 (en) | Retrieving images based on an example image | |
| US6115717A (en) | System and method for open space metadata-based storage and retrieval of images in an image database | |
| JP5005154B2 (ja) | 記憶媒体上に記憶された情報信号を再生する装置 | |
| JP2006508446A5 (ja) | ||
| JP2001202523A (ja) | 画像処理方法及びその装置 | |
| JP2004361987A (ja) | 画像検索システム、画像分類システム、画像検索プログラム及び画像分類プログラム、並びに画像検索方法及び画像分類方法 | |
| JP2001273302A (ja) | 画像検索システムおよび画像検索方法 | |
| US8254678B2 (en) | Image segmentation | |
| Chaira et al. | Fuzzy measures for color image retrieval | |
| EP0990997A1 (en) | A method for controlling and managing redundancy in an image database by elimination of automatically detected exact duplicate and near duplicate images | |
| Shih et al. | An intelligent content-based image retrieval system based on color, shape and spatial relations | |
| Chu et al. | Automatic selection of representative photo and smart thumbnailing using near-duplicate detection | |
| CN101529422B (zh) | 通过词汇表示的图像管理 | |
| JP2000339352A (ja) | 知覚的顕在特徴に基づく画像のアーカイブ及び検索 | |
| Chahir et al. | Searching images on the basis of color homogeneous objects and their spatial relationship | |
| Das et al. | FOCUS: A system for searching for multi-colored objects in a diverse image database | |
| Loui et al. | Matching of Complex Scenes Based on Constrained Clustering. | |
| Izquierdo | Compact hierarchical image descriptors |