JP2005235175A - コンテンツエンジンのためのexifに基づく画像の特徴セット - Google Patents

コンテンツエンジンのためのexifに基づく画像の特徴セット Download PDF

Info

Publication number
JP2005235175A
JP2005235175A JP2005001179A JP2005001179A JP2005235175A JP 2005235175 A JP2005235175 A JP 2005235175A JP 2005001179 A JP2005001179 A JP 2005001179A JP 2005001179 A JP2005001179 A JP 2005001179A JP 2005235175 A JP2005235175 A JP 2005235175A
Authority
JP
Japan
Prior art keywords
image
digital color
feature
feature set
color
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2005001179A
Other languages
English (en)
Inventor
Jau-Yuen Chen
ユエン チェン ジャウ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Publication of JP2005235175A publication Critical patent/JP2005235175A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5862Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • G06V10/507Summing image-intensity values; Histogram projection analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】高速で信頼性の高い検索結果を可能にする特徴セットを利用すると共に、小さいサムネイル画像を活用する、画像の検索アルゴリズムを提供する。
【解決手段】改良された特徴セットおよび付随する画像コンテンツに基づく管理/検索の方法/アルゴリズムは、特定の画像または画像グループを特定するために、複数のデジタルカラー画像の集合を高速で効果的に検索することを可能にする。特徴セットは、EXIF形式のサムネイルカラー画像のために設計されており、検索画像の個別の色成分の複数の選択変換(例えばDCT)係数から導かれる。特徴セットは、複数のカラー特徴と、複数のエッジ特徴と、テクスチャタイプ、テクスチャスケール、テクスチャエネルギを含む複数のテクスチャ特徴と、を含む。クエリ画像の特徴セットは、すべての類似画像を特定するために、関連する検索範囲内の複数の画像の特徴セットと比較される。
【選択図】図1

Description

本発明は、特別にフォーマットされたタイプのサムネイル画像用に設計された特徴セットと、画像集合を管理および検索するツールとして特徴セットを利用する画像コンテンツに基づいた方法/アルゴリズムと、に関する。本発明の方法/アルゴリズムは、コンピュータ等の装置において、あるいは、機械読み取り可能な媒体に実装された命令のプログラム(例えばソフトウェア)として、実現される。
デジタルカメラ、スキャナ、カメラ付き携帯電話などのデジタル写真/画像取得デバイスが普及するにつれて、ユーザは、より多くのデジタル写真および画像を蓄積および格納するようになっている。ユーザの写真/画像の集合(collection)のサイズが大きくなると、特定の項目を管理および発見することは、より困難になる。問題の一部は、個々のファイル名は、通常、写真/画像のコンテンツまたは撮影時の状況について、多くの情報を提供しないことである。そのため、写真/画像の集合を管理する多くのアプローチでは、例示による照会法に重点が置かれてきた。この方法では、例示画像が比較の目的で提示され、複数の画像を含むフォルダ(群)で、類似するビジュアルコンテンツを有する画像が検索される。このようなアルゴリズムでは、検索規準として、特徴抽出および類似性測定が使用される。現在の高度な特徴抽出アルゴリズムでも、1画像について1秒を超える時間を要し得る。しかしながら、ユーザは、さらに短時間での結果を欲する。例えば、ユーザが新たに約1000枚の写真/画像のセットをアップロードするとき、ユーザは、結果のために20分以上も待たされることを望まない。
現在、最新式のデジタルカメラでは、EXIF(Exchangeable Image File Format)として知られる標準フォーマットを用いて、カメラの設定および写真撮影条件に関する情報が画像内に保存されている。ISOは、現在、ディレクトリ構造、ファイル命名方法、文字セット、ファイル形式などを含むデジタルカメラのファイルシステム全体を定義する、国際規格DCF(Design rule for Camera File system)の作成に取り組んでいる。DCFのファイル形式は、EXIF2.1規格に基づいており、該規格は、写真が撮影された正確な時刻、フラッシュ設定、シャッタ速度、絞りなどの情報を含む。最も重要なことは、160×120のサイズのサムネイル画像が、JPEGストリームとしてEXIFヘッダに含まれる。
このような発展は、より高速で信頼性の高い検索結果を可能にする特徴セットを利用すると共に、より小さいサムネイル画像サイズを活用する、改良された画像コンテンツに基づく検索アルゴリズムに対する関心と必要性とを生じさせた。
したがって、本発明の目的は、このようなアルゴリズムを提供することである。本発明の別の目的は、より高速の写真/画像検索アルゴリズムを生成するために、特別にフォーマットされたタイプのサムネイル画像用に設計された圧縮領域の特徴セットを提供することである。
本発明の一態様では、複数のデジタルカラー画像の集合を管理する方法が提供される。方法は、集合内の複数のデジタルカラー画像を解析する工程を含む。解析される各デジタル画像毎に、方法は、そのデジタルカラー画像を複数の変換係数をそれぞれが含む複数のブロックに区分する工程と、そのデジタル画像の複数の変換係数から導出された特徴セットを抽出する工程であって、特徴セットは複数のカラー特徴と、複数のエッジ特徴と、テクスチャタイプとテクスチャスケールとテクスチャエネルギとを含む複数のテクスチャ特徴と、を含む、工程と、を備える。
解析される複数のデジタルカラー画像は、特別にフォーマットされたサムネイルカラー画像であることが好ましい。
区分工程は、解析対象のデジタルカラー画像の各主要色成分を区分する工程を備えることが好ましい。複数のカラー特徴と複数のエッジ特徴とは、そのデジタルカラー画像の各主要色毎に別個のカラー特徴と別個のエッジ特徴とを含むことが好ましい。複数の別個のカラー特徴は、各主要色毎に1つの別個のヒストグラムによって表現されてもよい。複数の別個のエッジ特徴は、同様に表現されてもよい。また、テクスチャタイプ特徴とテクスチャスケール特徴とテクスチャエネルギ特徴とは、それぞれのヒストグラムによって表現されてもよい。
方法は、クエリ画像に類似する複数の画像を検索するために使用可能であり、クエリ画像は、新しい画像であってもよいし、既に集合内に存在する画像であってもよい。前者の場合、方法は、さらに、クエリ画像として使用される新しいデジタルカラー画像に区分工程と抽出工程とを適用する工程と、クエリ画像の特徴セットを集合の少なくとも1つのサブセット内の各デジタルカラー画像の特徴セットと比較する工程と、クエリ画像の特徴セットに類似する特徴セットを有する、集合内の各デジタルカラー画像を特定する工程と、を備えていてもよい。
既に解析され、特徴セットが抽出された画像がクエリ画像として使用される場合には、集合内の特定のデジタルカラー画像が、クエリ画像として選択される。次に、選択されたクエリ画像の特徴セットが、集合の少なくとも1つのサブセット内の各デジタルカラー画像の特徴セットと比較され、選択されたクエリ画像の特徴セットに類似する特徴セットを有する集合内の各デジタルカラー画像が特定される。
別の態様において、本発明は、複数のデジタル画像の集合を管理するアルゴリズムを実行するための装置を含む。装置は、方法に関して説明した処理を実行する1以上のモジュールを備える。各モジュールは、ソフトウェアまたはハードウェアの形態で実現され得る。ハードウェアに基づくモジュールは、以下の1以上を含む:命令に基づくプロセッサ(例えば中央演算処理装置(CPU))、特定用途向け集積回路(ASIC)、デジタル信号処理回路、これらの組み合わせ。任意の実施において、必要に応じて、複数のモジュールが組み合わされてもよい。
装置自体は、パーソナルコンピュータ(例えば、デスクトップ、ラップトップなど)、パーソナルデジタルアシスタント(PDA)、携帯電話などを含む、プロセッサ制御デバイスを備えていてもよい。
本発明の更なる態様では、上記の方法またはその任意の工程は、実行のためにコンピュータなどのプロセッサ制御デバイスに格納または搬送され得る命令のプログラム(例えばソフトウェア)で具現化される。あるいは、方法またはその任意の工程は、機能的に同等のハードウェア(例えば、ASIC、デジタル信号処理回路など)、あるいは、ソフトウェアとハードウェアとの組み合わせを用いて実施され得る。
他の目的および達成事項は、本発明のより完全な理解と共に、以下の説明および特許請求の範囲を添付の図面を併せて参照することによって、明らかになり、理解される。
本発明は、特定の画像または画像グループのために、複数のデジタル画像(デジタル写真であってもよいし、デジタル写真を含んでいてもよい)を迅速に検索するように設計された、画像コンテンツに基づく管理/検索の方法/アルゴリズムに組み込まれる改良された特徴セットを提供する。検索される各デジタル画像および検索クエリ画像からは、その画像に関する特定の情報を含む特徴セットが抽出される。そして、クエリ画像の特徴セットは、クエリ画像に「類似」するすべての画像を特定するために、関連する記憶領域(群)内の複数の画像の複数の特徴セットと比較される。
好適な実施形態において、画像は、EXIF形式のサムネイルカラー画像であり、特徴セットは、この形式に基づく圧縮領域の特徴セットである。特徴セットは、ヒストグラムまたはモーメントに基づくものである。ヒストグラムに基づく好適な実施形態において、特徴セットは、特定のEXIFサムネイルカラー画像の離散コサイン変換(DCT)の複数の係数から導かれたいくつかの統計値のヒストグラムを含む。特徴セットは、その画像を定義する(i)複数のカラー特徴と、(ii)複数のエッジ特徴と、(iii)複数のテクスチャ特徴(テクスチャタイプ、テクスチャスケール、テクスチャエネルギの3つがある)と、を含む。特徴セット抽出プロセスの詳細について説明する。
カラー画像の個別の色平面は、それぞれ、複数のブロックに区分される。各ブロックは、複数の変換係数を含む。そして、複数の変換係数から、統計情報が導出される。この処理の好適な実施形態は、図1に示されている。立方体11は、YCrCb色空間を規定し、処理対象EXIFサムネイルカラー画像はYCrCb色空間で表現される。なお、検索されるフォルダ(群)内の任意のカラー画像であって、YCrCb色空間で表現されていないものは、その画像からの特徴セットの抽出が開始される前に、適切な公知の変換を使用して、現行の3色表現(例えば、RGBカラー)からYCrCbに変換される。
処理対象サムネイルカラー画像から分離された個別のY,Cr,Cb色平面は、それぞれ参照番号12,13,14で特定されている。各色平面は、図1に示すように、複数のブロックに区分される。EXIFサムネイルカラー画像は、一般に、160×120または120×160のサイズを有している。この場合には、各色平面は、20×15個または15×20個のブロックに区分されることが好ましい。なお、図1では、各色空間は16個のブロックのみに区分されているが、単なる例示である。各ブロックは、複数の変換係数(例えばDCT係数)を含む。好適な実施形態において、各ブロックは、図2に示すように、8×8のサイズであり、64個のDCT係数を含む。他の直交変換で使用される異なる数の複数の変換係数を有する他のブロックサイズは、適切な修正により対応可能である。
特徴セットの情報は、個別の色平面における複数のブロックの複数の選択変換係数(例えばDCT係数)から導出される。好適な実施形態では、図1に概略的に示すように、Y色平面における複数の選択変換係数からの情報を用いて、処理対象サムネイル画像に関するカラー、エッジ、テクスチャ情報が導出される。一方、CrおよびCb色平面のそれぞれにおける複数の選択変換係数からの情報を用いて、そのような画像に関するカラーおよびエッジ情報が導出される。
カラー特徴情報は、好適な実施形態において、3つの独立したヒストグラムに包含されている。1つのヒストグラムは、サムネイル画像の3つの色成分(Y,Cr,Cb)のそれぞれに関する。例えば、Y成分のカラーヒストグラムは、その色成分の複数のDCTブロックに含まれる複数のDC(直流)係数から導かれる。同様に、CrカラーヒストグラムおよびCbカラーヒストグラムは、それぞれ、その色成分の複数のDCTブロックに含まれる複数のDC(直流)係数から導かれる。なお、各DCTブロックには、1つのDC(直流)係数が存在し、それは、図2の左上の係数F[0,0]である。数学的には、各カラーヒストグラムは、次のように定義される。
(Y,Cr,CbチャネルそれぞれのDC係数に基づく)カラーヒストグラム
Figure 2005235175
ここで、mは、整数であり、hc [m]は、値mに応じた頻度を示す。i,jは、それぞれ各色平面におけるブロックの行,列番号を示す。height,width は、それぞれブロックの行,列番号の最大値を示す。すなわち、i,jによって各ブロックが特定される。Fij[0,0]は、位置(i,j)のブロック内の位置(0,0)の変換係数の値を示す。Q(Fij[0,0])は、量子化を行う演算式であり、Fij[0,0]の値を所定の値で割って得られる商(整数部分)を示す。
3つの色成分のそれぞれに関して、各DCTブロックの値が決定され、値の範囲は、重複しない複数のサブ範囲すなわちビンに区分される。一実施形態において、範囲は、9個の等しいサブ範囲に区分される。したがって、各ブロックは、対応するサブ範囲、ビンに割り当てられ、各ヒストグラムは、頻度(すなわちブロック数/ビン)と個別のビンまたはサブ範囲との関係を表す。
エッジ特徴情報は、好適な実施形態において、複数の配向性ヒストグラムに包含されている。1つのヒストグラムは、サムネイル画像の3つの色成分(Y,Cr,Cb)のそれぞれに関する。特定のヒストグラムを計算するために、対応する色平面の各ブロックにおける変換係数F[0,1],F[1,0](図2参照)を調べる。これらの係数は、有意なエッジを示す。次に、|F[0,1]|+|F[1,0]|が、その色平面のための好適な閾値よりも大きいか否かを判断する。一実施形態において、Y,Cr,Cb色平面のそれぞれについて、閾値として160,40,40が選択される。そして、各有意エッジに関し、値F[0,1],F[1,0]によって、配向性が定義される。一実施形態では、図3に示すように、8個の領域が定義される。より具体的には、各配向性ヒストグラムは、次のように定義される。
(Y,Cr,CbチャネルそれぞれのDCT係数F[0,1],F[1,0]に基づく)配向性ヒストグラム
Figure 2005235175
ここで、ho [m]は、値mに応じた頻度を示す。配向性(F[0,1],F[1,0])は、下記のテーブル1において定義される。
テーブル1:配向性のビン割り当て
Figure 2005235175
テクスチャ特徴情報は、好適な実施形態において、サムネイル画像のY成分の複数の選択DCT係数から導出されたタイプ、スケール、エネルギのヒストグラムに包含されている。
テクスチャタイプヒストグラムは、DCTブロック内の複数の選択係数のうちの支配的な係数(図4参照)が所定の閾値より大きいときに、その支配的な係数によって定義される。一実施形態では、閾値として10が選択される。より具体的には、テクスチャタイプヒストグラムは、次のように定義される。
(YチャネルのDCT係数F[0,2],F[1,1],F[2,0],F[0,3],F[1,2],F[2,1],F[3,0]に基づく)テクスチャタイプヒストグラム
Figure 2005235175
ここで、ht [m]は、値mに応じた頻度を示す。argmaxk(Fij[Type(k)])は、Fij[Type(k)]が最大になるときの値kを求める演算式である。type(k)は、下記のテーブル2において定義される。
テーブル2:テクスチャタイプのビン割り当て
Figure 2005235175
テクスチャスケール特徴は、DCTブロック内の複数の係数の支配的なスケールによって定義される。図5は、テクスチャスケールの定義を示す。一実施形態では、閾値として200が選択される。より具体的には、テクスチャスケールヒストグラムは、次のように定義される。
(Yチャネルの複数のDCT係数に基づく)テクスチャスケールヒストグラム
Figure 2005235175
ここで、a,bは、それぞれ各ブロック内の係数の行,列番号を示す。すなわち、a,bによって位置(i,j)のブロック内の各変換係数が特定される。Sij(k)は、位置(i,j)のブロックに含まれるすべての変換係数のうち、a,bの和が値kとなる位置(a,b)の変換係数の和を示す。hs [m]は、値mに応じた頻度を示す。argmaxk ij(k)は、Sij(k)が最大になるときの値kを求める演算式である。
テクスチャエネルギ特徴は、各DCTブロックの合計エネルギによって定義される。より具体的には、テクスチャエネルギヒストグラムは、次のように定義される。
(YチャネルのDCT係数に基づく)テクスチャエネルギヒストグラム
Figure 2005235175
ここで、Eijは、位置(i,j)のブロックに含まれるすべての変換係数の絶対値の和を示す。he [m]は、値mに応じた頻度を示す。Q(Eij)は、量子化を行う演算式であり、Eijの値を所定の値で割って得られる商(整数部分)を示す。
既に明らかになったように、凸距離関数(convax distance function)を使用することによって、全体的な非類似性尺度に関する有用な下界が定式化できる。良好な下界を用いることにより、大きな画像集合に関するマッチングプロセスを高速化する多数の検索アルゴリズムを適用できる。この目的から、Lpノルムを使用できる。クエリ画像とターゲット画像との間の距離は、対応するヒストグラムの各ペアのL1ノルムの合計として定義される。
処理対象サムネイル画像に関するカラー、エッジ、テクスチャ情報が包含される種々のヒストグラムを決定する際の詳細についての説明を終了し、この情報が利用される画像コンテンツに基づく管理/検索の方法/アルゴリズムの動作について、図6〜図8のフローチャートを参照して説明する。
図6は、コンピュータシステムまたは同様のデバイスにおける全てのまたは選択された記憶領域に現在格納されているサムネイル画像の集合に適用される管理/検索の方法/アルゴリズムの処理を示すフローチャートである。解析プロセスは、記憶領域(群)内の第1のサムネイルカラー画像が取得されることによって、開始される(ステップ61)。その画像の各主要色成分(例えばY,Cr,Cb)は、前述したように、複数の変換係数包含ブロックに区分される(ステップ62)。その画像のブロック区分済み色成分のそれぞれのDC変換係数から、対応するカラーヒストグラムが導出される(ステップ63)。すなわち、その画像の各主要色成分毎に、1つのカラーヒストグラムが取得される。
ヒストグラムの形態における追加的な統計情報は、ステップ64,65で取得される。ステップ64では、現行画像の各ブロック区分済み色成分の各ブロックに含まれる複数の選択変換係数を使用して、前述したように、対応する配向性ヒストグラムが導出される。ステップ65では、現行画像のブロック区分済みY色成分の各ブロックに含まれる選択変換係数を使用して、テクスチャタイプ、テクスチャスケール、テクスチャエネルギのヒストグラムが導出される。
このような現行画像に関する統計情報のヒストグラムが取得された後、現行サムネイル画像について、この統計情報を具現化する特徴セットが抽出される(ステップ66)。特徴セットは、その後、格納される(ステップ67)。次に、考慮すべきサムネイル画像がさらに存在するか否かを判断する(ステップ68)。存在する場合には、アルゴリズムは、再びステップ61に戻り、次のサムネイル画像が取得される。記憶領域(群)内の全画像が考慮された後(ステップ68の判断結果が「no」)、アルゴリズムは終了する。
図7は、以前に格納され複数のサムネイルカラー画像を検索するために、新しいサムネイルカラー画像が検索クエリとして使用されるときの管理/検索の方法/アルゴリズムの処理を示すフローチャートである。図6に示す処理が記憶領域(群)内に現在含まれる複数の画像に対して既に実行された場合には、方法/アルゴリズムは、新しいサムネイル画像の特徴セットを抽出し、関連する記憶領域(群)で類似画像を検索し、ユーザに提示するだけでよい。ユーザがコンピュータの2以上の領域に画像を格納している場合には、検索は、そのような全ての領域で実行可能である。あるいは、検索範囲は、選択された記憶領域に限定可能である。検索範囲は、例えば、ユーザのデバイスの画面上に現れるコントロールパネルを介して、検索対象となるドライブ、ファイルフォルダなどのデータ編成構造を特定することによって制限されてもよい。方法/アルゴリズムは、異なる検索範囲が指定されない限り、すべての格納済みのサムネイルカラー画像が検索されるように構成され得る。新しいサムネイルカラー画像がアップロードされ、検索範囲が設定されると(ステップ71)、ステップ62〜65の処理が、対応するステップ72〜75において、新しい画像に対して実行される。新しい画像の特徴セットは、ステップ76において抽出される。その特徴セットは、ステップ77において、記憶領域(群)において類似画像を特定するために使用される。すなわち、新しい画像の特徴セットにおいて具現化される統計情報は、前述した基準を使用して、類似する特徴セットを有する画像を特定するために使用される。その後、ステップ78において、記憶領域(群)で発見されたそのような全ての類似画像がユーザに提示される。
なお、「類似する」画像の特定の前に、関連する記憶領域(群)内のすべての画像が解析されるまで待つ必要はない。ステップ77,78は、「迅速に(on-the-fly)」実行可能であり、すなわち、類似画像は、ステップ77において特定され次第、ステップ78においてユーザに提示される。いかなる場合でも、検索および解析工程の終了後、類似するとして特定されたすべての画像がユーザに提示される。
図8のフローチャートは、特徴セットが既に抽出されて格納された格納済みサムネイルカラー画像が検索クエリとして使用される状況を示す。既に格納済みの特定の注目画像は、例えば、クリック等の任意の公知の手法で、ユーザによって特定される(ステップ81)。検索クエリとして用いられる注目画像が特定され、検索範囲が設定されると、ステップ82において、検索が実行されるコンピュータまたは同様のデバイスは、検索クエリ画像の特徴セットを、関連する記憶領域(群)内の他のサムネイル画像のそれぞれの特徴セットと比較する。類似画像は、ステップ83において、ユーザに提示される。図7に関して前述したように、比較工程および提示工程は、「迅速に(on-the-fly)」実行可能である。
上記のように、管理/検索アルゴリズムは、図9に示すタイプのコンピュータシステム90で実行されるソフトウェアの形態で都合よく実施され得る。図10に示すように、システムは、デスクトップコンピュータ101や、ラップトップ102、携帯電話およびパーソナルデジタルアシスタント(PDA)等のハンドヘルドデバイス103などを含む種々の適切なデバイスのいずれかにおいて実現され得る。
再び図9を参照すると、図示されたシステムは、コンピューティングリソースを提供してシステムを制御する中央演算処理装置(CPU)91を含む。CPU91は、マイクロプロセッサなどによって実現され、数学的な計算等の特定のタイプの処理を扱う1以上の補助チップを含んでいてもよい。システム90は、さらに、ランダムアクセスメモリ(RAM)およびリードオンリメモリ(ROM)の形態を採り得るシステムメモリ92を含む。このようなシステム90は、通常、図9に示すように、多数のコントローラと関連コンポーネントとを含む。
図示された実施形態において、入力コントローラ(群)93は、キーボード、マウス、スタイラスなどの1以上の入力デバイス94とインタフェースする。もちろん、入力コントローラ(群)93の特定の構成および対応する入力デバイス(群)94は、システム90の具体的な実装に依存する。
ストレージコントローラ(群)95は、1以上のストレージデバイス96とインタフェースする。各ストレージデバイス96は、磁気テープや、ディスク、光学媒体などの記憶媒体を含み、記憶媒体は、オペレーティングシステムとユーティリティとアプリケーションに対する命令のプログラムを記録するために使用され、命令のプログラムは、本発明のアルゴリズムや種々の態様を実装するプログラムの統合体を含み得る。ストレージデバイス(群)96は、サムネイル画像の集合を包含するフォルダ88によって概略的に示されるように、本発明に従って検索/解析される画像が格納される1以上の記憶領域(群)を含んでいてもよい。ディスプレイコントローラ(群)97は、ディスプレイデバイス(群)98とインタフェースし、ディスプレイデバイス(群)は、システム90が具現化される具体的なデバイスに最適な任意のタイプである。
例示したシステムにおいて、すべての主要なシステムコンポーネントは、2以上の物理バスを表すバス99に接続する。
格納および解析/検索される画像は、種々の手法によってシステム90にアップロードされる。例えば、該画像は、デジタルカメラから直接アップロードされたり、スキャナからアップロードされたり、インターネットなどのネットワークから取得されたりる。この目的のために、システム90は、画像の有線または無線のアップロードを可能にする適切な通信コントローラ/インタフェースを有することが好ましい。
さらに、本発明の具体的な適用に応じて、検索対象の記憶領域(群)および/または検索アルゴリズムを実施するプログラムは、ネットワークを介して遠隔位置(例えばサーバ)からアクセスされてもよい。このようなデータおよび命令の転送は、ネットワーク信号や、赤外線信号を含む任意の適切な電磁搬送信号を含む任意の最適な手段を介して搬送されてもよい。
システムは、検索によって取得された1以上の画像を印刷するプリンタとインタフェースするためのプリンタコントローラを有していてもよい。
本発明のアルゴリズムは、前述した適切なデバイス上で実行されるソフトウェアを用いて都合よく実施され得るが、アルゴリズムのハードウェアによる実施、または、ハードウェア/ソフトウェアの複合による実施も可能である。ハードウェアによる実施は、例えば、ASIC(群)、デジタル信号処理回路などを使用して、実現され得る。「機械読み取り可能な媒体」という請求項の用語は、ソフトウェア搬送媒体だけでなく、必要な処理を実行する命令が物理的に組み込まれたハードウェアと、ハードウェアおよびソフトウェアの組み合わせと、を含む。同様に、「命令のプログラム」という請求項の用語は、ソフトウェアと、ハードウェアに組み込まれた命令と、の双方を含む。さらに、請求項において使用される「モジュール」という用語は、命令に基づくプロセッサ(例えば、CPU)や、ASIC、デジタル信号処理回路、これらの組み合わせなどの適切に構成された任意の処理デバイスを包含する。こうした実施の代替物を考慮すると、図および付随する説明は、当業者が、プログラムコード(すなわちソフトウェア)を書き、または回路(すなわち、ハードウェア)を作成して、必要な処理を実行するために要求する、機能的な情報を提供すると理解される。
以上説明したように、本発明は、大きな集合内で選択画像/写真を見つけるための画像コンテンツに基づく管理/検索アルゴリズムにおいて利用可能な、サムネイル画像形式(好ましくは、EXIFサムネイル画像形式)のために設計された特徴セットを提供する。本発明について、いくつかの具体的な実施形態に関連して説明したが、前述の説明を考慮すれば、さらに数多くの代替、修正、変更、応用が当業者に明らかになる。したがって、本明細書で説明された本発明は、請求項の趣旨および範囲内のすべての代替、修正、変更、応用を包含する。
本発明の特徴セット抽出処理を示す概念図。 本発明の実施形態に従った解析済みのデジタル画像の8×8ブロックの複数の変換係数を示す図。 本発明の実施形態に従ったエッジ配向性のビン割り当てを示す図。 本発明の実施形態に従ったテクスチャタイプを示す図。 本発明の実施形態に従ったテクスチャスケールを示す図。 本発明の実施形態に従った各特徴セットを取得するために格納済み画像に適用される管理/検索の方法/アルゴリズムの処理を示すフローチャート。 本発明の実施形態に従った検索クエリとして使用される新しい画像がアップロードされるときに適用される管理/検索の方法/アルゴリズムの処理を示すフローチャート。 本発明の実施形態に従った格納済み画像が検索クエリとして使用されるときに適用される管理/検索の方法/アルゴリズムの処理を示すフローチャート。 本発明の方法/アルゴリズムの実施形態を実施するために使用され得るシステムの例を示すブロック図。 図9のシステムが具現化されるいくつかのデバイスを示す図。
符号の説明
88…フォルダ
90…コンピュータシステム
91…CPU
92…システムメモリ
93…入力コントローラ
94…入力デバイス
95…ストレージコントローラ
96…ストレージデバイス
97…ディスプレイコントローラ
98…ディスプレイデバイス
99…バス
101…デスクトップコンピュータ
102…ラップトップ
103…ハンドヘルドデバイス

Claims (28)

  1. 複数のデジタルカラー画像を含む集合を管理するための方法であって、
    前記集合内の前記複数のデジタルカラー画像を解析する工程を備え、
    前記解析工程は、解析される各デジタルカラー画像毎に、
    前記デジタルカラー画像を、複数の変換係数をそれぞれが含む複数のブロックに区分する工程と、
    前記デジタルカラー画像の前記複数の変換係数から導出された特徴セットを抽出する工程であって、前記特徴セットは、複数のカラー特徴と、複数のエッジ特徴と、テクスチャタイプとテクスチャスケールとテクスチャエネルギとを含む複数のテクスチャ特徴と、を含む、前記工程と、
    を備える方法。
  2. 請求項1記載の方法であって、
    解析される前記複数のデジタルカラー画像は、特別にフォーマットされたサムネイルカラー画像である、方法。
  3. 請求項1または2記載の方法であって、
    前記区分工程は、
    解析対象の前記デジタルカラー画像の各主要色成分を区分する工程を備え、
    前記複数のカラー特徴は、前記デジタルカラー画像の各主要色毎に別個のカラー特徴を含む、方法。
  4. 請求項3記載の方法であって、
    前記複数の別個のカラー特徴は、各主要色毎に1つの別個のヒストグラムによって表現される、方法。
  5. 請求項1ないし4のいずれかに記載の方法であって、
    前記区分工程は、
    解析対象の前記デジタルカラー画像の各主要色成分を区分する工程を備え、
    前記複数のエッジ特徴は、前記デジタルカラー画像の各主要色毎に別個のエッジ特徴を含む、方法。
  6. 請求項5記載の方法であって、
    前記複数の別個のエッジ特徴は、各主要色毎に1つの別個のヒストグラムによって表現される、方法。
  7. 請求項1ないし6のいずれかに記載の方法であって、
    前記テクスチャタイプ特徴と前記テクスチャスケール特徴と前記テクスチャエネルギ特徴とは、それぞれのヒストグラムによって表現される、方法。
  8. 請求項1ないし7のいずれかに記載の方法であって、さらに、
    クエリ画像として使用される新しいデジタルカラー画像に対して前記区分工程と前記抽出工程とを適用する工程と、
    前記クエリ画像の前記特徴セットを、前記集合の少なくとも1つのサブセット内の各デジタルカラー画像の前記特徴セットと比較する工程と、
    前記クエリ画像の前記特徴セットに類似する特徴セットを有する、前記集合内の各デジタルカラー画像を特定する工程と、
    を備える、方法。
  9. 請求項1ないし7のいずれかに記載の方法であって、さらに、
    前記集合内の特定のデジタルカラー画像をクエリ画像として選択する工程と、
    前記選択されたクエリ画像の前記特徴セットを、前記集合の少なくとも1つのサブセット内の各デジタルカラー画像の前記特徴セットと比較する工程と、
    前記選択されたクエリ画像の前記特徴セットに類似する特徴セットを有する、前記集合内の各デジタルカラー画像を特定する工程と、
    を備える、方法。
  10. 複数のデジタルカラー画像を含む集合を管理するためのアルゴリズムを実行するための装置であって、
    解析対象の各デジタルカラー画像を、複数の変換係数をそれぞれが含む複数のブロックに区分するように構成された区分モジュールと、
    前記デジタルカラー画像の前記複数の変換係数から導出された特徴セットを抽出するように構成された抽出モジュールであって、前記特徴セットは、複数のカラー特徴と、複数のエッジ特徴と、テクスチャタイプとテクスチャスケールとテクスチャエネルギとを含む複数のテクスチャ特徴と、を含む、前記抽出モジュールと、
    を備える装置。
  11. 請求項10記載の装置であって、
    解析される前記複数のデジタルカラー画像は、特別にフォーマットされたサムネイルカラー画像である、装置。
  12. 請求項10または11記載の装置であって、
    前記区分モジュールは、解析対象の前記デジタルカラー画像の各主要色成分を区分するように構成されており、
    前記複数のカラー特徴は、前記デジタルカラー画像の各主要色毎に別個のカラー特徴を含む、装置。
  13. 請求項12記載の装置であって、
    前記複数の別個のカラー特徴は、各主要色毎に1つの別個のヒストグラムによって表現される、装置。
  14. 請求項10ないし13のいずれかに記載の装置であって、
    前記区分モジュールは、
    解析対象の前記デジタルカラー画像の各主要色成分を区分するように構成されており、
    前記複数のエッジ特徴は、前記デジタルカラー画像の各主要色毎に別個のエッジ特徴を含む、装置。
  15. 請求項14記載の装置であって、
    前記複数の別個のエッジ特徴は、各主要色毎に1つの別個のヒストグラムによって表現される、装置。
  16. 請求項10ないし15のいずれかに記載の装置であって、
    前記テクスチャタイプ特徴と前記テクスチャスケール特徴と前記テクスチャエネルギ特徴とは、それぞれのヒストグラムによって表現される、装置。
  17. 請求項10ないし16のいずれかに記載の装置であって、さらに、
    デジタルカラー画像をクエリ画像として選択するように構成された選択モジュールと、
    前記選択されたクエリ画像の前記特徴セットを、前記集合の少なくとも1つのサブセット内の各デジタルカラー画像の前記特徴セットと比較するように構成された比較モジュールと、
    前記選択されたクエリ画像の前記特徴セットに類似する特徴セットを有する、前記集合内の各デジタルカラー画像を特定するように構成された特定モジュールと、
    を備える、装置。
  18. 請求項10ないし17のいずれかに記載の装置であって、さらに、
    プロセッサ制御デバイスを備える、装置。
  19. 請求項18記載の装置であって、
    前記プロセッサ制御デバイスは、パーソナルコンピュータと、パーソナルデジタルアシスタントと、携帯電話と、のうちのいずれかを含む、装置。
  20. 複数のデジタルカラー画像を含む集合を管理するためのアルゴリズムを機械に実行させるための命令のプログラムを格納した機械読み取り可能な媒体であって、
    前記命令のプログラムは、
    前記集合内の前記複数のデジタルカラー画像を解析する命令を備え、
    前記解析命令は、解析される各デジタルカラー画像毎に、
    前記デジタルカラー画像を、複数の変換係数をそれぞれが含む複数のブロックに区分する命令と、
    前記デジタルカラー画像の前記複数の変換係数から導出された特徴セットを抽出する命令であって、前記特徴セットは、複数のカラー特徴と、複数のエッジ特徴と、テクスチャタイプとテクスチャスケールとテクスチャエネルギとを含む複数のテクスチャ特徴と、を含む、前記命令と、
    を備える機械読み取り可能な媒体。
  21. 請求項20記載の機械読み取り可能な媒体であって、
    解析される前記複数のデジタルカラー画像は、特別にフォーマットされたサムネイルカラー画像である、機械読み取り可能な媒体。
  22. 請求項20または21記載の機械読み取り可能な媒体であって、
    前記区分命令は、
    解析対象の前記デジタルカラー画像の各主要色成分を区分する命令を備え、
    前記複数のカラー特徴は、前記デジタルカラー画像の各主要色毎に別個のカラー特徴を含む、機械読み取り可能な媒体。
  23. 請求項22記載の機械読み取り可能な媒体であって、
    前記複数の別個のカラー特徴は、各主要色毎に1つの別個のヒストグラムによって表現される、機械読み取り可能な媒体。
  24. 請求項20ないし23のいずれかに記載の機械読み取り可能な媒体であって、
    前記区分命令は、
    解析対象の前記デジタルカラー画像の各主要色成分を区分する命令を備え、
    前記複数のエッジ特徴は、前記デジタルカラー画像の各主要色毎に別個のエッジ特徴を含む、機械読み取り可能な媒体。
  25. 請求項24記載の機械読み取り可能な媒体であって、
    前記複数の別個のエッジ特徴は、各主要色毎に1つの別個のヒストグラムによって表現される、機械読み取り可能な媒体。
  26. 請求項20ないし25のいずれかに記載の機械読み取り可能な媒体であって、
    前記テクスチャタイプ特徴と前記テクスチャスケール特徴と前記テクスチャエネルギ特徴とは、それぞれのヒストグラムによって表現される、機械読み取り可能な媒体。
  27. 請求項20ないし26のいずれかに記載の機械読み取り可能な媒体であって、
    前記命令のプログラムは、さらに、
    クエリ画像として使用される新しいデジタルカラー画像に対して前記区分工程と抽出工程とを適用する命令と、
    前記クエリ画像の前記特徴セットを、前記集合の少なくとも1つのサブセット内の各デジタルカラー画像の前記特徴セットと比較する命令と、
    前記クエリ画像の前記特徴セットに類似する特徴セットを有する、前記集合内の各デジタルカラー画像を特定する命令と、
    を備える、機械読み取り可能な媒体。
  28. 請求項20ないし26のいずれかに記載の機械読み取り可能な媒体であって、
    前記命令のプログラムは、さらに、
    前記集合内の特定のデジタルカラー画像をクエリ画像として選択する命令と、
    前記選択されたクエリ画像の前記特徴セットを、前記集合の少なくとも1つのサブセット内の各デジタルカラー画像の前記特徴セットと比較する命令と、
    前記選択されたクエリ画像の前記特徴セットに類似する特徴セットを有する、前記集合内の各デジタルカラー画像を特定する命令と、
    を含む、機械読み取り可能な媒体。
JP2005001179A 2004-01-22 2005-01-06 コンテンツエンジンのためのexifに基づく画像の特徴セット Withdrawn JP2005235175A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/762,448 US20050163378A1 (en) 2004-01-22 2004-01-22 EXIF-based imaged feature set for content engine

Publications (1)

Publication Number Publication Date
JP2005235175A true JP2005235175A (ja) 2005-09-02

Family

ID=34701314

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005001179A Withdrawn JP2005235175A (ja) 2004-01-22 2005-01-06 コンテンツエンジンのためのexifに基づく画像の特徴セット

Country Status (3)

Country Link
US (1) US20050163378A1 (ja)
EP (1) EP1564660A1 (ja)
JP (1) JP2005235175A (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8456488B2 (en) * 2004-10-06 2013-06-04 Apple Inc. Displaying digital images using groups, stacks, and version sets
US7705858B2 (en) * 2004-10-06 2010-04-27 Apple Inc. Techniques for displaying digital images on a display
US7804508B2 (en) * 2004-10-06 2010-09-28 Apple Inc. Viewing digital images on a display using a virtual loupe
US7734622B1 (en) * 2005-03-25 2010-06-08 Hewlett-Packard Development Company, L.P. Media-driven browsing
GB2431797B (en) 2005-10-31 2011-02-23 Sony Uk Ltd Image processing
GB2431793B (en) 2005-10-31 2011-04-27 Sony Uk Ltd Image processing
US20070141545A1 (en) * 2005-12-05 2007-06-21 Kar-Han Tan Content-Based Indexing and Retrieval Methods for Surround Video Synthesis
US20070174010A1 (en) * 2006-01-24 2007-07-26 Kiran Bhat Collective Behavior Modeling for Content Synthesis
US8639028B2 (en) * 2006-03-30 2014-01-28 Adobe Systems Incorporated Automatic stacking based on time proximity and visual similarity
US7889212B2 (en) * 2006-09-07 2011-02-15 Apple Inc. Magnifying visual information using a center-based loupe
US7916944B2 (en) * 2007-01-31 2011-03-29 Fuji Xerox Co., Ltd. System and method for feature level foreground segmentation
US7936946B2 (en) * 2007-02-23 2011-05-03 Apple Inc. Migration for old image database
TWI373718B (en) * 2007-07-06 2012-10-01 Quanta Comp Inc Classifying method and classifying apparatus for digital image
CN101420503A (zh) * 2007-10-23 2009-04-29 佛山普立华科技有限公司 可在数码照片上显示用户信息的系统及方法
US8775953B2 (en) 2007-12-05 2014-07-08 Apple Inc. Collage display of image projects
US9699242B2 (en) 2007-12-07 2017-07-04 Dan Atsmon Multimedia file upload
CN101556600B (zh) * 2009-05-18 2011-08-24 中山大学 一种dct域上的图像检索方法
EP2435983A4 (en) * 2009-05-28 2017-08-23 Hewlett-Packard Development Company, L.P. Image processing
JP5627617B2 (ja) * 2012-02-22 2014-11-19 株式会社東芝 画像処理装置及び画像表示システム
JP5987550B2 (ja) * 2012-08-10 2016-09-07 株式会社リコー 画像処理装置および画像処理方法および画像形成装置
CN103853795A (zh) * 2012-12-07 2014-06-11 中兴通讯股份有限公司 一种基于n元模型的图片索引构建方法及装置
US8897556B2 (en) 2012-12-17 2014-11-25 Adobe Systems Incorporated Photo chapters organization
US8983150B2 (en) 2012-12-17 2015-03-17 Adobe Systems Incorporated Photo importance determination

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5161015A (en) * 1990-12-31 1992-11-03 Zenith Electronics Corporation System for peaking a video signal with a control signal representative of the perceptual nature of blocks of video pixels
US5579471A (en) * 1992-11-09 1996-11-26 International Business Machines Corporation Image query system and method
AU1365699A (en) * 1997-10-27 1999-05-17 Imagen Incorporated Image search and retrieval system
US6163622A (en) * 1997-12-18 2000-12-19 U.S. Philips Corporation Image retrieval system
US6445818B1 (en) * 1998-05-28 2002-09-03 Lg Electronics Inc. Automatically determining an optimal content image search algorithm by choosing the algorithm based on color
US6243713B1 (en) * 1998-08-24 2001-06-05 Excalibur Technologies Corp. Multimedia document retrieval by application of multimedia queries to a unified index of multimedia data for a plurality of multimedia data types
US6584221B1 (en) * 1999-08-30 2003-06-24 Mitsubishi Electric Research Laboratories, Inc. Method for image retrieval with multiple regions of interest
IT1311443B1 (it) * 1999-11-16 2002-03-12 St Microelectronics Srl Metodo di classificazione di immagini digitali in base al lorocontenuto.
US6490320B1 (en) * 2000-02-02 2002-12-03 Mitsubishi Electric Research Laboratories Inc. Adaptable bitstream video delivery system
US6813313B2 (en) * 2000-07-06 2004-11-02 Mitsubishi Electric Research Laboratories, Inc. Method and system for high-level structure analysis and event detection in domain specific videos
KR20020031015A (ko) * 2000-10-21 2002-04-26 오길록 에지 히스토그램 빈의 비선형 양자화 및 유사도 계산
US20030039410A1 (en) * 2001-08-23 2003-02-27 Beeman Edward S. System and method for facilitating image retrieval
US20030123737A1 (en) * 2001-12-27 2003-07-03 Aleksandra Mojsilovic Perceptual method for browsing, searching, querying and visualizing collections of digital images

Also Published As

Publication number Publication date
US20050163378A1 (en) 2005-07-28
EP1564660A1 (en) 2005-08-17

Similar Documents

Publication Publication Date Title
JP2005235175A (ja) コンテンツエンジンのためのexifに基づく画像の特徴セット
KR101346730B1 (ko) 화상 처리 시스템, 화상 처리 장치 및 방법, 프로그램, 및기록 매체
US7379627B2 (en) Integrated solution to digital image similarity searching
TWI506459B (zh) 基於內容之圖像搜尋
JP4545641B2 (ja) 類似画像検索方法,類似画像検索システム,類似画像検索プログラム及び記録媒体
US20060159442A1 (en) Method, medium, and apparatus with category-based clustering using photographic region templates
US9916330B2 (en) Method and system for analyzing an image generated by at least one camera
JP2007206920A (ja) 画像処理装置および方法、検索装置および方法、プログラム、並びに記録媒体
EP2224372A2 (en) Grouping images by location
US20100250539A1 (en) Shape based picture search
JP2007206919A (ja) 表示制御装置および方法、プログラム、並びに記録媒体
JP2001511930A (ja) イメージ検索システム
KR20030029410A (ko) 웹 기반 영상 데이터 검색 시스템 및 그 방법
JP4327827B2 (ja) 映像記録再生システムおよび映像記録再生方法
JP2005151127A5 (ja)
US7755646B2 (en) Image management through lexical representations
Singh et al. Design & performance analysis of content based image retrieval system based on image classification usingvarious feature sets
Singh et al. Ensemble visual content based search and retrieval for natural scene images
JP2001319232A (ja) 類似画像検索装置および類似画像検索方法
JP6109118B2 (ja) 画像処理装置および方法、情報処理装置および方法、並びにプログラム
AU2011254041A1 (en) Compression of sift vectors for image matching
Mumar Image retrieval using SURF features
Coelho et al. Evaluation of global descriptors for multimedia retrieval in medical applications
Kao et al. CLIMS—a system for image retrieval by using colour and wavelet features
Vimina et al. Image retrieval using local and global properties of image regions with relevance feedback

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070612

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20070914