JP2002170116A - 画像を記述する方法 - Google Patents

画像を記述する方法

Info

Publication number
JP2002170116A
JP2002170116A JP2001352332A JP2001352332A JP2002170116A JP 2002170116 A JP2002170116 A JP 2002170116A JP 2001352332 A JP2001352332 A JP 2001352332A JP 2001352332 A JP2001352332 A JP 2001352332A JP 2002170116 A JP2002170116 A JP 2002170116A
Authority
JP
Japan
Prior art keywords
image
color
colors
quantizing
quantized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001352332A
Other languages
English (en)
Inventor
Dean Messing
メッシング ディーン
Beek Petrus J L Van
ジェイ.エル ヴァン ビーク ペトラス
James Errico
エリコ ジェームズ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of JP2002170116A publication Critical patent/JP2002170116A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)

Abstract

(57)【要約】 【課題】 記述子に十分な空間情報を埋め込み、そのコ
ンテンツに基づいて記述子を容易に識別できる画像記述
方法を提供する。 【解決手段】 複数の画像を含む空間構成要素を規定
し、空間構成要素に対応する複数のテスト領域6を画像
上に描写し、そのテスト領域毎に複数の色を量子化す
る。このときに、テスト領域毎の複数色の量子化ステッ
プは、個別のテスト領域毎の量子化色の各色数とは無関
係に実行する。これにより、記述子に十分な空間情報を
埋め込み、そのコンテンツに基づいて記述子を容易に識
別できる画像記述方法を提供することができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像の色のコンテ
ンツに基づいて画像を記述する方法に関する。
【0002】
【従来の技術】画像の記述は、画像に予め選択された測
度を適用した結果に基づきその画像を識別記述するプロ
セスである。画像の記述は、画像の記述が画像のインデ
クシングと検索に有効であるディジタル画像ライブラリ
のような多数の用途に有効に用いられる。画像の記述が
実用的で有効であるためには、画像にその測度を適用し
た結果が、(1)異なる画像を十分に識別でき、(2)
或る特定の種類の画像変換に対し不変であり、(3)ノ
イズに不感で、(4)計算が容易で、(5)コンパク
ト、でなければならない。画像を記述する種々の方法
が、識別属性を示す画像記述子と共に使用されまた提案
されている。
【0003】Swain他による論文「色インデクシン
グ(COLOR INDEXING)」は、色ヒストグラムを用い画像を
記述することを記述している。画像の色ヒストグラム
は、画素すなわちピクセルの頻度分布をピクセルの色の
関数として計算することにより得る。色ヒストグラム
は、視軸を中心とした画像の回転または平行移動に対し
不変である。色ヒストグラムは、異なる特徴を有する画
像の場合、著しい差異を示すことができる。しかしなが
ら、画像中の特徴に関する全ての空間情報は、色ヒスト
グラムの作成時に破棄される。従って、2枚の画像が各
色同数の画素を有する場合、これらの画像を色ヒストグ
ラムで識別することは不可能である。これは、2枚の画
像が全く異なるサイズと形状を特徴としていたとしても
同じである。
【0004】図29は、異なるスケールの特徴を有する
2枚の画像を示す図である。例えば、図29(A)と図
29(B)の2枚の画像は、2種の同色(同じ線影を付
けた)の幾何学的な特徴を有し、各特徴図形の総面積は
同じで、画素数も同一である。これら2枚の画像は、各
々の特徴はサイズと数が明らかに異なっているのに色ヒ
ストグラムでは識別できない。一方、これらの画像は、
人間の目で容易に識別できる。
【0005】色ヒストグラムの種々の実施性能を改善す
るために幾つかの方法が提案されている。Strick
er他は、論文「カラー画像の類似性(SIMILARITY OF C
OLOR)」において、色モーメントの使用を提案してい
る。色モーメントは、ピクセルの色の母集団分布の形状
と位置に関する統計的な測度である。特に、色モーメン
トは、平均,標準偏差及び歪度を含んでいる。色ヒスト
グラムに含まれている情報を色モーメントで表現する
と、非常にコンパクトな画像記述子が得られる。Fun
t他は、その論文「色定数色インデクシング(COLOR CON
STANT COLOR INDEXING)」において、画像の隣接領域か
らの三原色である赤緑青(RGB)のピクセルの割合を
用いて強度変化の効果を低減させることを提案してい
る。Rubner他は論文「カラー画像の1空間のナビ
ゲーション(NAVIGATING THROUGH A SPACE OF COLOR IMA
GES)」において、RGB色空間における類似色のクラス
タのプロットである色シグニチャを用いることを提案し
ている。色シグニチャを用いると、1画像を記述するの
に必要なデータ量を色ヒストグラムに要するデータ量と
比較して減少させることができる。これらの方法は、色
ヒストグラムより、画像記述子の実施性能を幾つかの面
において改善する。しかしながら、色ヒストグラムと同
様、空間情報が全然保存されない。
【0006】色ヒストグラムの構成時に破棄される幾つ
かの空間情報を保存することを試みた幾つかのプロセス
が提案されている。Pass他は、論文「コンテンツベ
ースによる画像検索用ヒストグラムの更新(HISTOGRAM R
EFINEMENT FOR CONTENT BASED IMAGED RETRIEVAL)」に
おいて、色ヒストグラムを色コヒーレンスベクトルで更
新することを提案している。このプロセスにおいて、画
素の色のコヒーレンスは、隣接領域中の他の画素のコヒ
ーレンスに関連して決定される。これは、各色の画素数
が同数で、従って2枚の画像の色ヒストグラムが同一で
あっても、画像中の特徴の差異により、色のコヒーレン
スである各色の画素数が変化することを意味する。色コ
ヒーレンスベクトルは、若干の空間情報を記述子に埋め
込む。残念ながら、これには、従来のヒストグラムと比
較し2倍の付加的な記憶容量を要する。
【0007】Rickman他は、論文「色要素ヒスト
グラムを用いたコンテンツベースによる画像検索(CONTE
NT-BASED IMAGE RETRIEVAL USING COLOUR TUPLE HISTOG
RAMS)」において、無作為に位置決めした三角形色要素
の各頂点における色相ヒストグラムを構成することによ
る画像の特徴付けを提案している。三角形要素の各頂点
は離れているので、若干の空間情報は保留される。残念
ながら、色要素データから画像の優勢色を決定すること
は困難である。さらに、保持された空間情報は、通常の
解釈が困難であり、従って、画像データベースのインデ
クシングにこの情報を用いることは困難である。
【0008】画像の記述のための“色コレログラム(Col
or correlograms)”が、Huang他の論文「色コレロ
グラムを用いた画像インデクシング(IMAGE INDEXING US
INGCOLOR CORRELOGRAMS)」に提案されている。色コレロ
グラムは、特定色のピクセルが、画像中の特定色のピク
セルから特定の半径距離にある確率を量子化する。色コ
レログラムは、画像上の1点からの異なるスケール又は
距離における色コヒーレンスを測定する技法を提供す
る。しかしながら、コレログラムから画像の優勢色を決
定することは困難であり、通常の人間のセンスでのコレ
ログラムの解釈も困難である。
【0009】Smith他は、論文「視覚的探査コンテ
ンツベースによる視覚クエリシステムを用いた色領域に
よるクエリ(QUERYING BY COLOR REGIONS USING THE VIS
UALSEEK CONTENT-BASED VISUAL QUERY SYSTEM)」におい
て、色の領域を用いる画像の特徴付け方法を提案してい
る。色データを変換し、画像の色を量子化し、次にフィ
ルタで処理し優勢色領域を強調する。“色セット”値を
抽出し、しきい値レベルを越える色セット値を保持する
ことによりヒストグラムを近似させる。この画像の特徴
付け方法は画像の分割を必要とし、プロセスが難しく、
計算量が多大である。領域表現はリジッドであり、画像
の回転又は平行移動により変化する。
【0010】“ブロブワールド”は、Carson他が
論文「領域にベースによる画像クエリー(REGION-BASED
IMAGE QUERYING)」中で提案した画像の表現方法であ
る。この方法において、画像は、“ブロブ”と呼ばれる
色とテクスチャの1セットの局部的コヒーレント領域に
分割される。画像の“ブロブワールド”表現は、分割さ
れた色ブロブの位置,サイズ及び色を記録した結果であ
る。この方法は、画像に関するかなりの空間情報を提供
するが、しかし、画像の“ブロブワールド”表現はリジ
ッドであり、画像の回転又は平行移動により変化する。
さらに、画像の分割プロセスは容易でなく、かなりの計
算機資源を要する。
【0011】
【発明が解決しようとする課題】本発明は、色及び局部
空間情報を用いる画像記述方法、すなわち、複数の画像
を含む空間構成要素を規定して、その空間構成要素に対
応する複数のテスト領域を画像上に描写し、テスト領域
毎に量子化色の色数とは無関係に複数の色を量子化する
ようにした色及び局部空間情報を用いる画像記述方法で
あって、記述子に十分な空間情報を埋め込み、そのコン
テンツに基づいて画像を記述してその画像を容易に識別
できるようにする画像記述方法を提供することを目的と
するものである。
【0012】
【課題を解決するための手段】第1の技術手段は、画像
を記述する方法において、 a)複数の画素を含む空間構成要素を規定するステップ
と、 b)前記空間構成要素に対応する複数のテスト領域を前
記画像上に描写するステップと、 c)前記テスト領域毎に複数の色を量子化するステップ
とを含んで成り、前記テスト領域毎の前記複数色の量子
化ステップは、個別の前記テスト領域毎の前記量子化色
毎の各色数とは無関係であることを特徴としたものであ
る。
【0013】第2の技術手段は、第1の技術手段におい
て、前記テスト領域毎の前記複数色の前記量子化ステッ
プは、同一量子化色を持つ前記各テスト領域内の画素数
と無関係であることを特徴としたものである。
【0014】第3の技術手段は、第1の技術手段におい
て、前記量子化ステップは、複数の量子化色範囲に従っ
て前記複数の色を量子化し、前記各量子化色範囲が前記
画像の色空間の複数色を含んでいることを特徴としたも
のである。
【0015】第4の技術手段は、第1の技術手段におい
て、前記画像の前記色空間を複数の量子化色範囲に量子
化し、前記テスト領域毎の前記複数色を前記量子化色範
囲に従って量子化することを特徴としたものである。
【0016】第5の技術手段は、第4の技術手段におい
て、前記テスト領域毎の前記複数色の量子化ステップ
は、1次元ヒストグラムを提供することを特徴としたも
のである。
【0017】第6の技術手段は、第1の技術手段におい
て、前記画像を記述する方法は、
【0018】
【表2】
【0019】により記述されることを特徴としたもので
ある。
【0020】第7の技術手段は、第1の技術手段におい
て、前記空間構成要素の前記サイズは、前記画像のサイ
ズに従って選択されることを特徴としたものである。
【0021】第8の技術手段は、画像を記述する方法に
おいて、 a)複数の画素を含む空間構成要素を規定するステップ
と、 b)前記空間構成要素に対応する複数のテスト領域を前
記画像上に描写するステップと、 c)前記テスト領域毎に複数の色を量子化するステップ
とを含んで成り、前記テスト領域毎の前記複数色の量子
化ステップはコヒーレントな色の空間範囲への強調を弱
めて、色の空間的にインコヒーレントな範囲へ効果を強
調することを特徴としたものである。
【0022】第9の技術手段は、第8の技術手段におい
て、前記複数色の前記量子化ステップは、前記個別テス
ト領域毎の前記量子化された各色数と無関係であること
を特徴としたものである。
【0023】第10の技術手段は、第8の技術手段にお
いて、前記テスト領域毎の前記複数色の前記量子化ステ
ップは、同一量子化色を持つ前記各テスト領域内の画素
数と無関係であることを特徴としたものである。
【0024】第11の技術手段は、第8の技術手段にお
いて、前記量子化ステップは、複数の量子化色範囲に従
って前記複数の色を量子化し、前記各量子化色範囲が前
記画像の色空間の複数色を含んでいることを特徴とした
ものである。
【0025】第12の技術手段は、第7の技術手段にお
いて、前記画像の前記色空間を複数の量子化色範囲に量
子化し、前記テスト領域毎の前記複数色を前記量子化色
範囲に従って量子化することを特徴としたものである。
【0026】第13の技術手段は、第12の技術手段に
おいて、前記テスト領域毎の前記複数色の量子化ステッ
プは、1次元ヒストグラムを提供することを特徴とした
ものである。
【0027】第14の技術手段は、第8の技術手段にお
いて、前記空間構成要素の前記サイズは、前記画像のサ
イズに従って選択されることを特徴としたものである。
【0028】第15の技術手段は、画像を記述する方法
において、 a)画像のサイズに従ってサイズを選択する複数の画素
を含む空間構成要素を規定するステップと、 b)前記空間構成要素に対応する前記画像上に複数のテ
スト領域を描写するステップと、 c)前記テスト領域毎に複数の色を量子化するステップ
とを含んで成ることを特徴としたものである。
【0029】第16の技術手段は、第15の技術手段に
おいて、前記空間構成要素は、前記画像が第1画像サイ
ズである時に第1要素サイズであり、前記空間構成要素
は、前記画像が第2画像サイズである時に第2要素サイ
ズであり、前記第1要素サイズは前記第2要素サイズよ
り小さく、前記第1画像サイズは前記第2画像サイズよ
り小さいことを特徴としたものである。
【0030】第17の技術手段は、第16の技術手段に
おいて、前記テスト領域毎の前記複数色の前記量子化ス
テップは、前記個別テスト領域毎の前記量子化の各色数
と無関係であることを特徴としたものである。
【0031】第18の技術手段は、第15の技術手段に
おいて、前記テスト領域毎の前記複数色の前記量子化ス
テップは、同一量子化色を持つ前記各テスト領域内の画
素数と無関係であることを特徴としたものである。
【0032】第19の技術手段は、第15の技術手段に
おいて、前記量子化ステップは複数の量子化色範囲に適
宜に前記複数の色を量子化し、前記各量子化色範囲が前
記画像の色空間の複数色を含んでいることを特徴とした
ものである。
【0033】第20の技術手段は、第15の技術手段に
おいて、前記画像の前記色空間を複数の量子化色範囲に
量子化し、前記テスト領域毎の前記複数色を前記量子化
色範囲に従って量子化することを特徴としたものであ
る。
【0034】第21の技術手段は、第15の技術手段に
おいて、前記テスト領域毎の前記複数色の量子化ステッ
プは1次元ヒストグラムを提供することを特徴としたも
のである。
【0035】第22の技術手段は、第15の技術手段に
おいて、前記テスト領域毎の前記複数色の量子化ステッ
プはコヒーレントな色の空間範囲への強調を弱めて、色
の空間的にインコヒーレントな範囲への効果を強調する
ことを特徴としたものである。
【0036】第23の技術手段は、第15の技術手段に
おいて、前記空間構成要素が8×8であることを特徴と
したものである。
【0037】第24の技術手段は、第23の技術手段に
おいて、前記8×8空間構成要素が64サンプルを含む
ことを特徴としたものである。
【0038】第25の技術手段は、第15の技術手段に
おいて、前記空間構成要素を予定サイズに保持し、前記
画像をサブサンプリングして前記空間構成要素に対応す
る前記テスト領域を決定することを特徴としたものであ
る。
【0039】第26の技術手段は、第25の技術手段に
おいて、前記サブサンプリングを絶対的に実行すること
を特徴としたものである。
【0040】第27の技術手段は、第15の技術手段に
おいて、p=max[0,round(0.5*log2(width*height)-8)]の
式において、widthは画像の幅であり、heigh
tは画像の高さであり、Kは前記画像に適用されるサブ
サンプリング係数であってK=2Pであり、Eは前記空
間構成要素の空間範囲であってE=8×Kであることを
特徴としたものである。
【0041】第28の技術手段は、第1画像を第2画像
と比較する方法であって、(a)複数の画素を含む第1
空間構成要素を規定するステップと、(b)前記第1空
間構成要素に対応する複数の第1テスト領域を前記画像
上に描写するステップと、(c)前記第1テスト領域毎
に第1の複数の色を量子化するステップと、(d)ステ
ップ(c)の前記量子化を異なるレベルに再量子化する
ステップと、(e)複数の画素を含む第2空間構成要素
を規定するステップと、(f)前記第2空間構成要素に
対応する複数の第2テスト領域を前記画像上に描写する
ステップと、(g)前記第2テスト領域毎の第2の複数
の色を量子化するステップと、(h)ステップ(g)の
前記量子化を異なる量子化レベルに再量子化するステッ
プと、(i)ステップ(d)の前記再量子化をステップ
(h)の再量子化と比較するステップとを含んで成るこ
とを特徴としたものである。
【0042】第29の技術手段は、第28の技術手段に
おいて、前記第1の複数色の前記量子化ステップは、第
1のビン数を持つ第1記述子を生じ、前記第2の複数色
の前記量子化ステップは、第2のビン数を持つ第2記述
子を生じることを特徴としたものである。
【0043】第30の技術手段は、第29の技術手段に
おいて、前記第1ビン数と前記第2ビン数が等しいこと
を特徴としたものである。
【0044】第31の技術手段は、第29の技術手段に
おいて、前記第1ビン数と前記異なる量子化レベルのビ
ン数が等しいことを特徴としたものである。
【0045】第32の技術手段は、第29の技術手段に
おいて、前記第2ビン数と前記異なる量子化レベルのビ
ン数が等しいことを特徴としたものである。
【0046】第33の技術手段は、第28の技術手段に
おいて、前記再量子化ステップは、適切な細分化を含む
ことを特徴としたものである。
【0047】第34の技術手段は、画像を記述する方法
であって、(a)複数の画素を含む空間構成要素を規定
するステップと、(b)前記空間構成要素に対応する複
数のテスト領域を前記画像上に描写するステップと、
(c)前記テスト領域毎に複数の色を量子化するステッ
プと、(d)ステップ(c)の前記量子化の結果値を非
一様に量子化するステップと、(e)前記非一様量子化
値を符号値に変換するステップを含んで成ることを特徴
としたものである。
【0048】第35の技術手段は、第34の技術手段に
おいて、前記符号値は6つの範囲に分割された近似的に
ほぼ0.0から1.0までの範囲を有し、第1範囲は近似
的に0とほぼゼロの間であり、第2範囲は近似的にほぼ
ゼロと0.037の間であり、第3範囲は近似的に0.0
37と0.080の間であり、第4範囲は近似的に0.0
80と0.195の間であり、第5範囲は近似的に0.1
95と0.320の間であり、第6範囲は近似的に0.3
20と1.0の間であることを特徴としたものである。
【0049】第36の技術手段は、第35の技術手段に
おいて、前記第1範囲を1個の範囲に分割することを特
徴としたものである。
【0050】第37の技術手段は、第35の技術手段に
おいて、前記第2範囲を25個のほぼ等しい範囲に分割
することを特徴としたものである。
【0051】第38の技術手段は、第35の技術手段に
おいて、前記第3範囲を20個のほぼ等しい範囲に分割
することを特徴としたものである。
【0052】第39の技術手段は、第35の技術手段に
おいて、前記第4範囲を35個のほぼ等しい範囲に分割
することを特徴としたものである。
【0053】第40の技術手段は、第35の技術手段に
おいて、前記第5範囲を35個のほぼ等しい範囲に分割
することを特徴としたものである。
【0054】第41の技術手段は、第35の技術手段に
おいて、前記第6範囲を140個のほぼ等しい範囲に分
割することを特徴としたものである。
【0055】第42の技術手段は、第35の技術手段に
おいて、前記第1範囲を1個の範囲に分割し、前記第2
範囲を25個のほぼ等しい範囲に分割し、前記第3範囲
を20個のほぼ等しい範囲に分割し、前記第4範囲を3
5個のほぼ等しい範囲に分割し、前記第5範囲を35個
のほぼ等しい範囲に分割し、前記第6範囲を140個の
ほぼ等しい範囲に分割することを特徴としたものであ
る。
【0056】第43の技術手段は、画像を記述する方法
であって、(a)複数の画素を含む空間構成要素を規定
するステップと、(b)前記空間構成要素に対応する複
数のテスト領域を前記画像上に描写するステップと、
(c)前記テスト領域毎に複数の色を量子化するステッ
プと、(d)ステップ(c)の前記量子化を異なる量子
化レベルに選択的に再量子化するステップと、(e)ス
テップ(d)の前記量子化の結果値を非一様に量子化す
るステップと、(f)前期非一様量子化値を符号値に変
換するステップを含んで成ることを特徴としたものであ
る。
【0057】第44の技術手段は、第43の技術手段に
おいて、前記選択的再量子化が選択されない場合に前記
ステップ(c)の前記量子化の結果値を非一様に量子化
するステップをさらに含むことを特徴としたものであ
る。
【0058】第45の技術手段は、第43の技術手段に
おいて、前記テスト領域毎の前記複数色の前記量子化ス
テップの結果生じる値が、該値と関係する量子化色を含
む前記空間構成要素の数に直線的に関係することを特徴
としたものである。
【0059】第46の技術手段は、第44の技術手段に
おいて、前記非一様量子化に先立ち、前記結果値をクリ
ッピングするステップをさらに含んで成ることを特徴と
したものである。
【0060】第47の技術手段は、第46の技術手段に
おいて、前記符号値を前記結果値を表わす変換値に変換
するステップをさらに含んで成ることを特徴としたもの
である。
【0061】第48の技術手段は、第47の技術手段に
おいて、前記変換値を異なる量子化レベルに再量子化す
るステップをさらに含んで成ることを特徴としたもので
ある。
【0062】第49の技術手段は、第48の技術手段に
おいて、前記変換値の前記再量子化を非一様に量子化す
るステップをさらに含んで成ることを特徴としたもので
ある。
【0063】第50の技術手段は、第48の技術手段に
おいて、前記変換値の前記非一様量子化値を符号値に変
換するステップをさらに含んで成ることを特徴としたも
のである。
【0064】
【発明の実施の形態】画像記述の現存するシステムにお
いては、色又はテクスチャを予め規定したサイズと形状
の複数の領域毎に量子化する。これらの領域は予め定め
た計画に従って画像上に配置するのが好ましい。画像の
これら領域の色又はテクスチャのデータ或いは本方法を
用いて得た関連統計データは、画像を記述し画像を識別
する上で有効である。得られたデータは、画像の記述子
として参照される。
【0065】図1は、テスト領域を描いた異なる色又は
テクスチャの特徴を含む画像を示す図で第1色の三角形
特徴2と第2色の円形特徴4を持つ画像に基づく(一般
ヒストグラム記述子特徴)を用いる、一般的な画像記述
の用例を示す図である。画像の残部の色は、第3の背景
色である。まず多数の正方形テスト領域6を画像上に描
く。テスト領域6のサイズと形状は、複数の画素すなわ
ちピクセルを取り囲む予め規定された空間構成要素のサ
イズと形状に対応することが好ましい。図12に図示さ
れたテスト領域6を規定する空間構成要素は正方形であ
るが、この要素のサイズと形状には制限は無い。矩形又
は円形のような正則形状は、無定形状すなわちブロブ形
状よりも多くの応用においてより好便である。又、テス
ト領域6は、散乱弾に似た画素(ピクセル)の散乱パタ
ーンであって良い。同様に、画像上のテスト領域6の配
置プランは図1に示した直線で囲まれたパターンに制限
されない。
【0066】図1において多数のテスト領域6が完全に
三角形特徴2の領域内に入っている。これらのテスト領
域内の画像の色は均一な第1色である。同様に、多数の
テスト領域6が完全に円形特徴4の領域内又は背景内に
入っている。これらのテスト領域内の画像の色は均一
で、第2色又は背景色として各々量子化できる。程度は
異なるが、残りのテスト領域6は2つ以上の特徴領域に
重なり合っている。これらのテスト領域6の色は均一で
はない。
【0067】図2は、図1の画像上により大きいスケー
ルでテスト領域6を描いた場合を示す図である。テスト
領域6の形状とテスト領域6の配置プランと同様に、テ
スト領域6のサイズはその用途において決定される。但
し、画像に関する空間情報は、データ又は画像記述子に
埋め込まれる。理由は、テスト領域6はスケールを有す
る、即ちテスト領域6は複数の画素を囲んでいるからで
ある。図1,2を比較するとわかるようにテスト領域6
を変えると各色のテスト領域数が変化する。
【0068】図3は、8つの正方形の特徴及び8つの円
形の特徴で特徴付ける画像を示す図、図4は、1つの正
方形の特徴と1つの円形の特徴で特徴付ける画像で、各
特徴が図3における8つの同一幾何学形状の特徴と等し
い面積を有している画像を示す図である。同様に、2つ
の画像の個々の色領域のサイズが異なると、各色のテス
ト領域6の数が同様に変化する。例えば、図3の画像の
8個の正方形特徴10と8個の円形特徴12の総面積
は、それぞれ図4の画像の正方形特徴20と円形特徴2
2の総面積と等しい。その結果、色の関数としての画素
の母集団分布は、2枚の画像とも等しくなる。しかしな
がら、画像の個々の色領域のサイズが異なるために、各
均一色のテスト領域6の数はテスト領域の測度が一定で
ある場合でも変化する。図4において、円形特徴22の
色を含むテスト領域6の方が、図3の円形特徴12で完
全に満たされているテスト領域6より多い。大きい均一
色領域又は“ブロブ”を含む画像は、小さいより分散し
た色領域を有する画像より、これらブロブの均一色を有
するテスト領域を多く生み出す。
【0069】図1において、若干のテスト領域6は均一
色領域の中に完全に含まれているが、若干のテスト領域
6は、2つ以上の色領域に重なって含まれている。その
結果、これらの領域の色は均一でなく、画像を記述する
際に有利なように量子化されねばならない。例えば、各
赤,緑,青(RGB)ピクセルの平均値、RGBピクセ
ル値の変換,平均色又はRGB強度値のベクトル和が、
非均一色のテスト領域の色を記述するために使用でき
る。非均一な色を持つ各テスト領域は、恐らく2つ又は
それ以上の色領域が重なっており、どの他のテスト領域
からもある程度異なっていると考えられるので、非均一
な色のテスト領域の数だけ、多数の平均色又はピクセル
強度の組み合わせが有り得る。可能な入力値をより少数
の量子化レベルにマッピングすれば色数を削減できる。
例えば、RGB色データは、赤緑青の寄与割合が或る特
定の範囲内にあるテスト領域の母集団として表現でき
る。
【0070】図1及び図2に見られるように、小数のテ
スト領域6のみが画像の特徴境界内に完全に含まれ、従
って真に均一の色を有している。但し、図1のように若
干の場合、テスト領域の殆ど(全部ではない)が特定の
色をもつ。均一色を持つ領域の集合に含まれるテスト領
域6の数は、その用途において、“殆ど”均一のデータ
領域に含まれる均一性のテストを含めることにより増大
させることができる。同様に、殆ど均一である画像領域
を受け入れることは、多数の均一色領域を含まない画像
の場合に必要であるかもしれない。
【0071】例えば、均一性のテストは、テスト領域中
の画素の色の標準偏差に基づき行うことができる。テス
ト領域ε内の色チャネルkのピクセル値の標準偏差をσ
kとすると、均一性は次式で定義される。
【0072】
【数1】
【0073】式中、wkは色チャネルkの重み係数であ
る。上記に代わる均一性テスト関数は、基本成分解析に
基づくことができる。マトリックスAはA=(Pij
MXNとして定義される。ここで、Pijはテスト領域εの
i番目のピクセルのj番目の色成分である。Aの特異値
は、特異値の分解によって決められる。ρk(k=1,
2,…)を大きさ降順のマトリックスAの特異値である
とすると、均一性は下式で定義される。
【0074】
【数2】
【0075】式中、Wkは特異値Pk(k>1)に対応す
る重み係数である。画像を記述する本方法により得られ
たデータは、この分野ではよく知られている統計的表現
に組み込むことができる。“色ブロブ”のヒストグラム
を作成し、それらの色の関数としてテスト領域の母集団
の頻度分布を表すことができる。所与の画像Iに対し
て、色ブロブのヒストグラムは、スケールsの全テスト
領域の母集団分布である。尚、sは画素中のテスト領域
サイズである。この色ブロブのヒストグラムは、集合C
に属する各量子化色c(即ち、c∈C)に対して1つの
要素hs,cを有する配列hsとして定義される。
【0076】
【数3】
【0077】式中、Cは全ての量子化された色の集合で
あり、Isは画像I中のサイズsの全ての色ブロブの集
合である。色関数としてのテスト領域の母集団分布は、
色ブロブヒストグラムの統計的モーメントである色ブロ
ブモーメントによって記述することもできる。この方法
は、色ブロブモーメントが極めてコンパクトな画像記述
子であると云う利点を提供する。所与の画像Iに対し
て、各色チャネルk内のサイズsのテスト領域の母集団
分布の第1,第2及び第3の統計的モーメントは、次の
通りである。 平均値(μ)(第1モーメント):
【0078】
【数4】
【0079】標準偏差(σ)(第2モーメント):
【0080】
【数5】
【0081】歪度(λ)(第3モーメント):
【0082】
【数6】
【0083】式中、ck(ε)は、c(ε)のk番目の
色成分である。図6は、本発明の第1実施例において得
られた画像データ例を示す図で、処理画像より得られる
データは、量子化された色の集合μ0〜μ10として表現
でき、その際、量子化した色の1つに一致する十分に均
一な色を有するテスト領域の数を共に示すことができ
る。言い換えれば、μsが赤色で、サイズがx1の6つ
のテスト領域が十分に均一な赤色であれば、サイズx=
19μsは総計6を持つ。その結果、個々のピクセルの
色の総和ではなく、各項目が十分に均一な色を有するサ
イズx1のテスト領域数を合計するヒストグラムが得ら
れる。異なるテスト領域サイズsで画像を処理して追加
データを得る。多数の画像から得たデータは、画像の比
較目的に使用することができる。
【0084】図5は、同一サイズ及び形状の特徴を有
し、その特徴が平行移動及び回転した2枚の類似画像を
示す図である。空間テスト領域を用いる画像記述は、画
像の回転と平行移動に不変となる。図5(A),(B)
の2つの画像では、正方形の特徴領域14は水平方向と
垂直方向に移動し、三角形の特徴領域16は90度回転
している。各特徴の均一色を有するテスト領域6の数は
不変である。等方性色領域の場合、色ブロブのヒストグ
ラムと色ブロブのモーメントが画像特徴の平行移動と回
転に対し不変であることを示すことができる。
【0085】本システムによると、画像のテクスチャ又
は表面外観に基づく画像を記述することができる。色は
点特性であり、色ヒストグラム又は画素の色特性の他の
表現法によって記述でき、一方、テクスチャは局部的な
近傍特性であり、テクスチャ記述子は、画素の周辺領域
の特性を記述する。個別のテスト領域のテクスチャは、
異方性,指向性及びコントラストのような平均テクスチ
ャ記述子によって表現することができる。テクスチャ記
述子はテクスチャブロブのヒストグラムで統計的に記述
することができる。画像Iに対して、s画素を含むテス
ト領域に対するテクスチャブロブのヒストグラムは、T
に含まれる各量子化テクスチャモデルtに対し1個の要
素hs,tを有する1つの配列hsとして定義されたサイズ
sのテスト領域の母集団分布である。
【0086】
【数7】
【0087】式中、Tは全ての量子化テクスチャモデル
を含む集合である。所与の画像Iに対して、スケールs
のテスト領域に対するテクスチャブロブのモーメント
は、各テクスチャバンドkにおけるサイズsのテスト領
域の頻度分布の第1,第2及び第3の統計的モーメント
である。即ち、 平均値(μ)(第1モーメント):
【0088】
【数8】
【0089】標準偏差(σ)(第2モーメント):
【0090】
【数9】
【0091】歪度(λ)(第3モーメント):
【0092】
【数10】
【0093】式中、tk(ε)は、t(ε)のk番目の
成分である。上記の技法は、色又はテクスチャの標準偏
差に基づき、十分に均一なテスト領域の総数を計数す
る。残念ながら、標準偏差のためのしきい値の選択が難
しい。しきい値がゼロであれば、十分に均一なテスト領
域は無くなる。一方、しきい値が大きいと、多数のテス
ト領域があまり均一でなくても計数される。
【0094】図7は、本発明の第2の実施例において得
られた画像データ例を示す図で、各テスト領域毎に量子
化色に関する色分布の割合の計算を含んでいる。結果と
して得られるマトリックスは、色の割合の関数として各
量子化色の発現数を持つ。図7の100%の欄は図6に
示した先述の技法の単一欄(s=x1)と同じであるこ
とに注意すべきである。
【0095】再度図1乃至図4を参照する。便宜上、互
いに間隔を置いたテスト領域6のセットを示し、この技
法を説明する。平行移動と回転に対する不変性を高める
ために、この好ましい技法は、画像内の各ピクセルにテ
スト領域を配置することを含んでいる。
【0096】テスト領域6のサイズは、十分に均一なテ
スト領域数に十分な影響をもつ。図3及び図4を参照す
る。使用テスト領域を、図3の正方形の特徴10及び,
円形の特徴12より大きく、但し、図4の正方形の特徴
20及び円形の特徴22より小さいように選択すると、
図3の処理では十分に均一な領域は得られないという結
果をもたらす。しかしながら、図4の処理では、幾つか
の十分に均一な領域をもたらす。このように、十分に均
一なテスト領域6の数の違いが増大し、かような測度を
用いる画像間の識別が容易になる。
【0097】ここに記述した技法は、Y/Cb/Crの
ような適当な色空間に適用できる。画像上のテスト領域
のパターンとサイズは、要望に応じ変更できまたはラン
ダムとすることができる。
【0098】上述の均一性試験は、ステップ機能のよう
に、十分に均一か(イエス又は“1”)又は不十分か
(ノー又は“0”)の何れかの結果を提供する。かよう
な均一性試験は、標準偏差がしきい値に近似の場合、計
算値であるその標準偏差の僅かな変動が均一性試験の結
果を変えることになるので、ノイズに反応する。従っ
て、上述の均一性試験は、ノイズに反応し、均一性のさ
らに微細なグラデーションは考慮しない。図8は、非2
進しきい値技法のグラフを示す図である。均一性のしき
い値の決定は、“ソフト”なしきい値メカニズムを含む
ことができる。このしきい値メカニズムは、標準偏差の
ような或る均一性測度を参照して均一性の(例えば、Y
es/Noの2値による決定でない)浮動点測度(フロ
ーティングポイントメジャー)を提供する。このしきい
値メカニズムは、標準偏差が減少するに従って徐々に均
一性を増大させる。このように、しきい値付近の領域に
おける標準偏差の僅かな変化により、均一性の測定値に
大きな変化が生じることがなくなる。さらに、しきい値
の特別な選択により正確な結果の達成が左右されるのを
緩和する。他の非2値機能により、均一性を或る測定基
準の関数として定義することも望むならば同様に可能で
ある。
【0099】図8の表を再び参照する。テスト領域毎の
量子化色の割合分布を、列毎に等百分率分布に基づいて
示している。しかしながら、殆どの画像は、殆どの範囲
に種々多様な色内容を含んでいる。従って、殆どの画像
の色分布は、より少ない割合の方に配分される傾向があ
る。言い換えれば、通常の画像には、ほぼ純粋で均一な
色の大きな領域は比較的少ない。比較的少ない大きな均
一色範囲の場合、より大きな割合(百分率)値のマトリ
ックス部分は、主としてゼロになる傾向があり、これ
は、空間を浪費するだけで、より細かな差異を含む実世
界の画像を識別する有効な技法は提供できない。図9
は、本発明の第3実施態様において得られた画像データ
例を示す図である。この制約を克服し、比較的簡潔なマ
トリックス(行列)を維持するために、このマトリック
スは、比率範囲をより大きな比率の方に増大させ、より
小さな比率でより小さな比率範囲を含むことができる。
これにより、埋設システムに適した小さなマトリックス
を維持すると共に、内容の類似している画像をより正確
に識別できる。“ソフト”なしきい値技法と変更マトリ
ックスに関する上記の説明は、テクスチャにも同様に適
用できる。
【0100】本発明では、上述の技法により、図7及び
9に示すように、割合の選択を少なくとも部分的に任意
とすることを実現した。任意としたことに加え、量子化
色(μx)の選択の間隔を細かくすると、通常多数の可
能な量子化色を生じ、ノイズの結果生じる画像色の小さ
な変化が全体的な結果を大きく変化させる。任意の割合
と細かく量子化した色(μx)の影響に加え、さらに、
比率の間隔を細かくすると、色量の僅かな差が、画像記
述子に著しい差を生じさせる。よく見られるように、画
像記述子自体の差異には感じやすいので、異なるが視覚
的に類似している画像に由来する、異なる画像記述子を
正確に比較することは益々困難になる。
【0101】可能な量子化色と比率の細分化の試みとは
異なり、本発明では、図7及び図9に示すように、比率
の境界を取り除き、均一性試験を、テスト領域内に量子
化色のいずれかが存在するのを確かめるだけに簡素化す
れば、堅実ですぐ使用できる画像記述子が得られると推
定した。図10は、色構成ヒストグラムの1例を示す図
である。軸線に沿って付けられたインデックス(例え
ば、0−255)は、選択した色空間における量子化色
を表わしており、それにより、色構成ヒストグラムを形
成する。色構成ヒストグラムを作成するために、各テス
ト領域(又は選択したテスト領域のセット)内の画像に
含まれる各々異なる色を特定する。次に、異なり特定さ
れた各色を量子化色範囲に従って量子化する。
【0102】二重に量子化された色は、テスト領域毎に
破棄する。言い換えれば、テスト領域毎に、画像のテス
ト範囲内の各量子化色を一回だけカウントする。得られ
た色構成ヒストグラムは、一次元ヒストグラム画像であ
り総色分布のみではなく、それ以上の包含データを示し
ている。この得られた色構成ヒストグラムに含まれてい
る追加情報は、例えば、色の頻度と各量子化色の色コヒ
ーレント(空間情報)を含んでいる。実際に、このシス
テムは、ヒストグラム内のコヒーレントな色空間範囲の
効果の強調を減じ、ヒストグラム内の空間的にインコヒ
ーレントな色範囲の効果を強調する。
【0103】図11(A)は、高度にコヒーレントな色
の画像を示す図であり、図11(B)は、高度にコヒー
レントな色の画像を示す図である。この色ヒストグラム
は、所与の色が同量存在するがその色を有する画素群の
構成が異なる2つの画像を識別することができる。例え
ば、図11(A)は、ヒストグラム中の前記色につき9
0(9×10)の値を記録する。これに対し、図11
(B)は、ヒストグラム中の前記色につき、459(各
内部色につき9(9×45)、各エッジ色に付き3(3
×4)及び各エッジより1つ離れた色につき6(7×
6))の値を記録する。従来の色ヒストグラムとこの色
構成ヒストグラムの特定実施例を比較してその利点を示
したものが、ここに参照して組み込む資料ISO/IE
C JTC1/SC 29/WG 11/M5572
(ハワイ州マウイ、1999年12月)に記述され、本
明細書に参照として一体化されている。
【0104】この色構成用のDDL(データ記述言語)
表現シンタックスは次のように記述される。
【0105】
【表3】
【0106】色構成ヒストグラムの検索有効性は、従来
のヒストグラムよりも、同数の“ビン”の記述子(即
ち、量子化色数)の場合で比較してかなり高い。従来の
ヒストグラムに比し、色構成ヒストグラムは、ビンの数
が少ない記述子を比較する時、即ち、粗い色量子化の場
合に特に有効である。色構成ヒストグラムの抽出複雑度
は次の通りである。ヒストグラムの量子化色数をKとし
構成要素中の画素数をSとすると、複雑さの順位は、画
素当たりO(S+K)であり、O()は通常、計算の複
雑さ演算子の順位に関連し、当分野においては、所謂ビ
ッグ“O”又は“ランダウ”表示法としてよく知られて
いる。画像全体のヒストグラムを計算する複雑性は、O
((S+K)n)であり、ここで、nは画像中の画素数
である。色の量子化をヒストグラムの抽出前に実行する
と仮定すると、色構成ヒストグラムを計算するために整
数のみの総和、乗算、比較及びメモリの読出し/書き込
みが必要である。
【0107】ヒストグラム中のビン数をnとすると、l
1ノルム(絶対差分の和)に関するl1距離を相似性の測
度として使用する場合、ヒストグラムマッチングの複雑
さの順位はO(n)である。l1距離を用いる場合は、
整数のみの総和、比較演算及びメモリの読出し/書き込
みが2つの色構成ヒストグラムを一致させるために必要
である。
【0108】テスト領域をさらに考察し、その最適サイ
ズを決定することを試みた。勿論、この最適テストサイ
ズの計算は、空間情報を含む他の形式のヒストグラムに
も同様に適用できる。構成要素の場合の検索精度に関す
る最適サイズの算定は問題である。困難さの1つは、固
定サイズの構成要素は、全ての画像に対し最適ではない
ことである。異なる尺度の同一画面を表わしている2つ
の異なる画像を同一サイズのテスト領域を用いて処理し
たところ、驚いたことに、異なる画像サイズを考慮し基
準を統一して得られた色構成ヒストグラムが非常に異な
っていることが観察された。これは、従来のヒストグラ
ムでは見られないことである。この予期せぬ結果を検討
し、主たる差異源は2つの画像の異なる尺度であると推
定した。この推定と観察に基づき、テスト領域のサイズ
(又は同等の構成要素のサイズ)は、処理中の画像サイ
ズに一致して変更すべきであると決定した。従って、比
較的大きい画像は、比較的大きいテスト領域を用いるべ
きであり、小さい画像は比較的小さいテスト領域を用い
るべきである。
【0109】ほぼ同一サイズ(例えば、320×240
及び352×288)の画像のデータベースの分析を、
異なるサイズの構成要素(テスト領域)、異なる画素密
度及び画像内の異なる位置配列パターンを用いて実施し
た。使用した構成要素は、1×1,2×2,4×4,8
×8及び16×16であった。1×1の構成要素は、従
来の色ヒストグラムの抽出と同等の特別なケースであ
る。テスト結果は、検索性能が、構成要素のサイズ(所
与の画素密度と所与の配列パターンを有している)の増
加と共に改善されることを示唆している。かなりのパフ
ォーマンスの改善は、構成要素サイズが1×1(通常ヒ
ストグラム)から2×2、4×4、8×8へ増大する時
に観察できる。多くの場合、構成要素をさらに増大して
もパフォーマンスの改善は僅かになる。このパフォーマ
ンスの構成要素サイズに対する感度は比較的低い(即
ち、特定の構成要素サイズに対する明確なパフォーマン
ス“ピーク”が存在しない)。正確な構成要素サイズ
(数個の画素内で)は、クリティカルではないが、8×
8の構成要素が好適である。構成要素を2倍づつ増大さ
せた時に性能の改善が観察された。データベースの分析
により得られた検索精度を検討し、構成要素を画像に正
確に関係させる必要は無く、むしろ、直進対数指数関係
を許し、計算の複雑さを制限する2つの因子を用いれば
十分であることが判明した。
【0110】任意の技法を使用して構成要素の相対寸法
を変更することができるが、好適な技法について以下に
説明する。図12は、異なる解像度の画像の構成要素を
示す図である。図12(A)の画像は320×240、
図12(B)の画像は640×480(画像サンプルの
一部のみを示す)。図は、画像の上部左隅の当初位置に
ある構成要素を示している。構成要素は、画像上を滑動
し、図12(A)では1画素分移動し、図12(B)で
は2画素分移動する。図12(B)は、画像を両方向に
2だけサブサンプリングし、次に、同じ8×8構成要素
を適用することに相応する。構成要素の空間範囲は画像
サイズに依存すべきである。但し、構成要素内のサンプ
ル数は、画像と構成要素を同時にサブサンプリングする
ことにより一定に保持できる。構成要素内のサンプル数
は、8×8の配列パターンで64個に維持するのが好ま
しく、このパターン内の2個のサンプル間の距離は、画
像サイズの増大に応じて増大する。この技法は、2の累
乗と8×8画素の構成要素を使用する画像サブサンプリ
ングに等しい。即ち、この技法は、1実施例において
は、画像を固定ベースサイズに再修正して、常に、同一
密度パケットの8×8構成要素を使用すると説明でき
る。この技法は、ソフトウェア内の“適所で”実行でき
る。即ち、画像のサブサンプリングは、色構成ヒストグ
ラムを計算しながら、処理期間中にサンプルを単純にス
キップすることにより間接的に実施できる。サブサンプ
リング係数と構成要素の幅と高さの空間範囲を同時に次
のように計算することができる。構成要素サイズの空間
範囲をEとする。即ち、空間範囲は好ましくはE×Eで
ある。使用するサブサンプリング係数をKとする。K=
1はサブサンプリングをしないことを意味し、K=2は
水平及び垂直等の方向等に2回サブサンプリングするこ
とを意味する。K及びEは、次のように計算するのが好
ましい。 p=max[0,round(0.5*log2(幅*高さ)-8)]、 ここで、K=2p及びE=8*Kである。
【0111】例えば、サイズ320×240の画像は、
上記公式により、K=1及びE=8を生じ、この場合、
構成要素は、図12(A)に示すように、サブサンプリ
ングはされず単純に8×8である。サイズ640×48
の画像は、上記公式により、K=2及びE=16を生
じ、この場合、図12(B)に示すように、構成要素の
空間範囲は16×16でサブサンプリングは2×2であ
り、サブサンプリングした画像上に8×8の空間範囲を
持つ構成要素が生じる。256×256より小さい画像
は、全ての場合にK=1及びE=8であるという意味
で、特殊なケースである。これにより、より小さな画像
をより大きいサイズにサンプリングするのを避けると同
時に十分良好に実行できる。
【0112】可変寸法テスト領域の実施例が、その利点
と共に、ここに参照により一体化する資料ISO/IEC JTC
1/SC 29WG 11/M5785 (オランダ、Noordwjekerhout, 200
0年3月)に記述されている。
【0113】異なる長さ、即ち、異なる“ビン”数の使
用可能な記述子をもつことが望ましい。前述したよう
に、これは、より粗く又は細かく量子化した色空間での
記述子の抽出に相当する。一般に、小さな記述子は、よ
り粗く量子化した色空間に該当する。しかしながら、こ
の色空間は、望むならば任意の非一様な方法で量子化し
てもよい。異なるサイズの記述子は、特定のシステムが
少なくとも部分的に、色構成ヒストグラムの保管に必要
な蓄積条件を選択することを可能にする。さらに、色構
成ヒストグラムの記述子サイズの選択は、システムがシ
ステムの複雑さと計算必要条件を少なくとも部分的に決
定できるようにする。例えば、画像数が制限されており
蓄積装置がほぼ制限無く使用可能な場合は、比較的多数
のビンを持つ記述子が望まれる。画像数が異常に多く、
追加の使用可能な蓄積装置に限りがあり、計算能力にも
制限がある場合、ビン数を厳しく制限した記述子が望ま
れる。蓄積スペースが厳しく制限されている埋め込みシ
ステムの場合も、ビン数を厳しく制限した記述子が望ま
れる。使用可能な記述子は、要望に応じ、例えば、25
6,200,175,130,96,75,32及び1
2のように選択することができる。勿論、(色構成ヒス
トグラムを限定することなく)複数の記述子サイズを含
む、任意の画像記述システムと共に使用することができ
る。
【0114】図13,図14,及び図15は、色(又は
色構成)ヒストグラム記述子の独立軸に沿って配列した
関連ビンと量子化色空間の間の関係を示しており、又、
2つの異なる色空間量子化に由来する2つのヒストグラ
ム間の関係を記述している。図13(A)は、説明のた
めにのみ図示したものであるが、2次元色空間を、各々
隣接する空間範囲を囲む少数の互いに素なサブセットに
分割している。実際には、色空間の次元数はより高く、
通常は三次元であり、その形状は任意であってよい。
又、実際には、サブセット数は、多くても少なくてもよ
く、形状も任意であり、包含空間部分は、1個以上の非
連結(離散)点より成る場合でも高度に非連結であり得
る。議論を容易にするために、これらの互いに素な色空
間のサブセットを“セル”と呼ぶことにするが、上記の
ように、形状及び形式は任意である。図13(A)は、
“A”型の量子化として表示する表示色空間の特定量子
化を示している。セルに0からN−1(Nはセルの総数
であり、この場合はN=16)まで番号を付け、図13
(B)に示すNビンのヒストグラムにも同じ番号を付け
る。これにより、双射的(bijective)な関係がヒスト
グラムのビンと色空間セルの間に確立される。即ち、各
ビンは、1つだけのセルに対応し、反対に、各セルは、
1つだけのビンに対応している。色空間セルとヒストグ
ラムビンの両方へのN番号の割当は任意であるが、実際
には、図13,図14,図15に示すような順序が用い
られる。色構成ヒストグラムの特定ビン内の数値、例え
ば、k番目のビン内の数値を、前述したように、k番目
の色空間セル内に位置する構成要素の位置番号によって
決定する。従来のヒストグラムの場合、k番目のビン内
の数値は、k番目セル内の色を持つ画素が画像内で発生
する回数である。
【0115】図14(A)は、色空間の再量子化を示し
ており、“B”型色空間量子化と表示する。再量子化に
よれば、色空間を異なるセルのセットに区分けし、必ず
しも必要ではないができれば異なるセル数とする。図1
4(A)に関連するヒストグラムの独立軸を図14
(B)に示す。図13(A)と図14(A)は、空間量
子化セル及び再量子化セル間に僅かな関係がある場合を
示している。図13(B)のヒストグラムが与えられ、
相互操作性のために、関連画像を参照することなく、そ
れを図14(B)のヒストグラムに変換することを望む
場合には、次の困難が発生する。どのようにして、図1
3(B)のヒストグラムビン内の値を正確に結合して図
14(B)のビン値を得ることができるのであろうか。
ビンと色空間セルの間の双射関係により、これは、
“B”型量子化のセル内に存在する画素数に“A”型量
子化のセル内に存在する色の画素数を分配する方法を求
めることと同じである。3のインデックスを持つ“B”
型量子化セルを考慮して困難さを説明する。このセル
は、図14(A)に破線で示した“A”型量子化セル
4,5,7及び8の各々の部分を含んでいる。かよう
に、これらの“A”型量子化セルに存在する色を持つ画
素数の或る部分が“B”型量子化に該当する図14
(B)のヒストグラムのビン3内に値を提供すべきであ
る。しかしながら、原画像の画素を参照しないで、この
配分を決めることは困難である。
【0116】この配分を合理的に行うための種々の可能
なスキームをテストする実験を実施した。1つのアイデ
ィアは、所与の“B"セルに重なる所与の“A"セル領域
に比例して、“B”型量子化の所与のセルに、“A”型
量子化の所与のセル内の色を有する画素を割り当てるこ
とであった。記述子を再量子化するこの方法を用いるこ
とによる検索結果は貧しいものであった。理由は、この
方法は所与の“A”量子化セルに画素色が元々存在して
いることを考慮しなかったからである。“A”量子化か
らのセルが完全に再量子化空間のセルの内側又は外側に
ある場合にのみ、かような配分を行えることが判明し
た。その場合、所与の“A”量子化セル内の画素の全て
又はゼロが、事実上、再量子化空間の所与のセル内に存
在する。
【0117】図15(A)は、この特性を持つ“A”量
子化の色空間再量子化を示す。これを、色空間の“C"
量子化と記述する。全ての“A”セルが完全に或る
“C”セルの内側又は外側にあることを観察する。同様
に、全ての“C”セルの境界線は“A”セルの境界線で
ある。かような色空間の再量子化の場合、“A”量子化
ヒストグラム値からの“C”量子化ヒストグラム値の導
出を継続できる。好適な導出技法は、再量子化により
“C”に結合された“A”セルに対応する“A”ヒスト
グラムのビンの値を加法により結合することである。図
15(B)は、2つの“C”ヒストグラムのビン、即ち
ビン0とビン3の場合のこの技法を説明する図である。
図15(B)のビン0は、図15(A)のセルインデッ
クス0に対応する。このセルは、図13(A)からの唯
1つの"A"量子化セル、即ち、インデックス4のセルの
(自明な)結合である。従って、図15(B)のビン0
内の値は、図13(B)の“A”ヒストグラムのビン4
内の値からのみ導出される。
【0118】重要な例として、図15(B)の“C"ヒ
ストグラムのビン3を検討する。これは、“A"色空間
量子化からのセル1,2,3及び11を正確に取り囲む
図15(A)の"C"セルインデックス3に対応する。従
って、ビン1,2,3及び11内で発見された"A"ヒス
トグラムからの値は、好ましくは加法にて結合され、図
15(B)の“C"ヒストグラムのビン3用の導出値を
得る。
【0119】この再量子化を達成できる方法の1例につ
いて以下に説明する。ヒストグラムの色空間量子化をA
で表わし、目標の再量子化をBで表わす。IAはAヒス
トグラム内にある所与の色ビンのインデックスである。
HSV(色相飽和値)の色空間において、例えば、再量
子化は、先ずIAを、A型量子化用3個のHSV色成分
HqA,SqA及びVqAにマッピングすることにより実
施する。このマッピングは、個別の量子化色インデック
スを取り、ヒストグラムビンインデックスを配達するマ
ップを逆にすることにより定義される。次に、3個の色
インデックスを、H=(HqA+0.5)/nHqAに従
い逆量子化する。ここで、nHqAは、浮動点数量であ
るHが当初A型に量子化されたレベル数である。同じ公
式を、適当な変更を加えてS及びVに適用することがで
きる。その後、H,S及びVを“B”型量子化の量子化
レベルに従って再量子化し、ヒストグラムビンのインデ
ックスIBを、HqB,SqB及びVqBから再計算するこ
とにより算出する。これにより、IAからIBまでのマッ
プが定義される。IAにおけるヒストグラムの振幅イン
デックスを単純にIBに加える。これは、IAとIBにお
けるヒストグラムの振幅を加算することに等しいことを
示している。
【0120】再量子化は、色ヒストグラムと色構成ヒス
トグラムに適用できるが、これは、以下に述べるよう
に、画像検索のための色構成ヒストグラム記述子を用い
る場合には、最適な操作ではないことが判明した。特
に、色構成ヒストグラムを異なる量子化レベルで抽出
し、次に続けて再量子化する場合には、これは最適な操
作ではない。この挙動の主要な理由は、色構成ヒストグ
ラムの性質にあり、色構成ヒストグラムは通常、従来の
ヒストグラムより高性能である理由に密接に関係してい
る。再び、図11(A)と図11(B)を参照する。こ
れらの図は、等色平面内に2つの異常な、但し、有効な
タイプの色構成が存在し、画素平面が同色である場合の
色構成ヒストグラムの挙動を示す。図11(A)におい
て、P色と記す同一色の画素は、矩形“ブロブ”内に群
集している。説明のために、この群塊をコヒーレンス
(干渉性)と記す。等色平面の干渉性が高ければ高いほ
ど、等色平面内の画素群はより密集して見える。反対
に、等色平面の非干渉性が高くなればなるだけ、画素
は、色構成ヒストグラムに用いられている構成要素の寸
法(ディメンション)に関して、“遠く離れる”傾向が
ある。
【0121】図11(A)の干渉性は、エッジ効果を無
視し、色Pに対応する色構成ヒストグラム(非正規化色
構成ヒストグラム)のPビンに、(8+2)×(7+
2)=90の計数値を与える。これは、色Pの画素が、
構成要素の90異なる位置の構成要素内で発見されるか
らである。一方、図11(B)の場合の計数値は、エッ
ジ効果を無視すれば、各画素は色構成ヒストグラムビン
に合計9の計数値を与えるので、(8×7)×(3×
3)=504となる。
【0122】対応する従来のヒストグラムは、いずれの
場合も、非正規化56の計数値を持つ。従って、従来の
ヒストグラムは色構成のインコヒーレンスに不感である
のに反し、色構成ヒストグラムは、各色量の測定に加
え、等色平面内のインコヒーレンスに反応する。この追
加情報は、色構成ヒストグラムが従来のヒストグラムよ
り優れている主要な理由である。同様に、これが、色構
成ヒストグラムは再量子化の下では良好な動作が期待で
きない主たる要因であることが判明した。以下にその説
明をする。
【0123】図16は2つの等色平面P及びQを持つ画
像を示す図である。原色空間量子化をAで表わし、より
粗いスケーラブルな再量子化をBで表わす。次の3つの
特性を有する第2色Qを導入する。(i)色構成は又非
干渉性(インコヒーレント)であり、(ii)画素は色
Pの画素近くの空間にあり、(iii)色空間中の位置
は色Pに十分に近く、再量子化された時にP,セルPQ
と同じ量子化ビン内に存在する。色Qは、又、各々改善
されたヒストグラムのビン“Qビン”に計数値504を
供給する。相当する従来のヒストグラムは、Qビンに
(8×7)=56の計数値を提供する。
【0124】説明のために、この色構成ヒストグラムと
従来のヒストグラムを再量子化すると仮定する。Pビン
とQビンは新しいPQビンになる。従来のヒストグラム
の場合、PQビン内の計数値は112であり、これはP
ビンとQビン内の計数値の合計である。理由は、スケー
ラブルな再量子化の方法では、B量子化においてビン
は、A量子化のビンの内容を取得するからである。これ
は、画像が最初にB量子化された場合、従来のヒストグ
ラムのPQビンに存在した数値と同じである。これは、
A量子化空間において色P又は色Qを有していた場合及
びその場合にのみ、B空間内の画素は色PQを有してい
るからである。言い換えれば、従来のヒストグラムの場
合の再量子化は、2つの色を1つに結合してから計数す
るのは、2つの色を個別に計数して結果を和算すること
と同じであるので、加法(又は、より正確には、準同形
(homomorphic))である。
【0125】この挙動は、色構成ヒストグラムと全く異
なっている。色構成ヒストグラムを再量子化する場合、
従来のヒストグラムの場合と同様に所与の再量子化ビン
に写像する全てのビン内の計数値を加える。これは、関
連する等色平面の構成に関する知識がなくてもできる最
良の方法である。結果は1008を数える。しかしなが
ら、画像がB量子化色空間内で出発する場合、非常に異
なる結果が生じる。これは、図15に見られるように、
異なっていた色が今は同じ色になっている。等色平面の
非干渉性が図11(B)に比して減少していることが観
察できる。従って、再量子化は、色構成を考慮すること
ができないので、色構成ヒストグラムを再量子化して得
られた計数値より低い計数値が、色構成ヒストグラムの
PQビン内に得られることが期待できる。実際に、この
計数値は、図15の場合736であり、記述子は、所与
の3×3構成要素であるB型色量子化空間内で量子化し
た画像から抽出された。
【0126】結果として、再量子化色構成ヒストグラム
は、準同形ではない。B量子化画像から抽出した色構成
ヒストグラムは、l1ノームに関し、AからBに再量子
化したものと十分に相違している。色構成ヒストグラム
と従来のヒストグラムの再量子化試験は、ここに参照す
ることにより組み込む資料ISO/IEC JTC 1/SC 29/WG 11/
M6018 (2000年5月,ジュネーブ)に記述されている。
【0127】前述したMPEG−7のDDL(データ記
述言語)による記述子の定義中の属性名の1つである
“colorQuant(色量子化)”は、色空間と量
子化演算位置を規定し、DDL表現シンタックスに用い
られたColorStructure(色構成)値の数
を決定する。その意味(セマンティクス)は、図18に
示すように規定できる。変数ColorQuantは、
例えば、001,010,011及び100のような適
当な値をとることができる。数値フィールドは、m∈
{0,1,…,M−1}の場合の8ビット整数値h
(m)のM要素配列として編成されたColorStr
ucture記述子を含んでいる。ビンの数Mは、許容
演算点のセット{256,128,64,32}から選
択できる。M−ビン記述子のビンは、後述するMセル色
空間のM量子化色c0,c1,c2,…,cM -1に双射的に
関連する。h(m)値は、非線形方式で記述され、色c
mの画素を1個以上含む画像内の構成要素の数を表わ
す。
【0128】勿論、望むならば、任意の色空間を使用で
きる。しかしながら、完全性を確保するために、好適な
色空間は“HMMD"として記述する。HMMD色空間
は、RGB色空間から非線形可逆変換によって定義す
る。HMMD色空間内には、5つの別個の属性(成分)
がある。5つの属性の意味は次のように定義される。
【0129】Hue :Hue(色相); Max :max(R,G,B);画像が影又は黒色度
を与える黒色をどれだけ持っているかを示す。 Min :min(R,G,B);画像が淡色又は白色
度を与える白色をどれだけ持っているかを示す。 Diff:Max−Min;色調又は色彩度を生み出す
灰色をどれだけ画像が含んでおり、どれだけ純粋色に近
いかを示す。 Sum :(Max+Min)/2;及び、色の明るさ
を示す。
【0130】図19はHMMD色空間を示す図である。
HMMD色空間は、黒さ、白さ、彩度及び色相より成る
2重円錐形の外観を有している。使用可能な色空間の選
択は、図20に示すシーケンスのような任意のシーケン
スに配列することができる。使用可能な色空間は、さら
に、望むならば、図21に示す2値表現の2進値で表現
することができる。
【0131】通常、画像記述子は、共通の色空間におい
て抽出され比較される。異なる色空間から導出した画像
記述子を比較することは、かなり困難である。
【0132】比較のために、色構成記述子を再量子化す
ることが最適ではないことを考慮し、色構成ヒストグラ
ムは、256のレベルのような、最も細い量子化粒度に
おいて画像から常に最初に抽出すべきであることが判明
した。図22はビンの一様化の1例を示す図である。最
も細かい量子化レベルで抽出後、記述子は、例えば単純
な加法で適当なビンを結合することにより再量子化す
る。このようにして、128,64及び32のような他
のレベルを、画像の色コヒーレンスと無関係である統一
された一様な方法で決定する。
【0133】図23は再量子化及び比較技法を示す図で
ある。色構成ヒストグラムのデータベースは、ブロック
250において、256ビンのような最高量子化レベル
において各画像を最初に量子化することにより生成す
る。ブロック250の結果得られた量子化画像は次に、
ブロック252において、128,64及び32のよう
な所望数のビンに再量子化する。探索クエリは、ブロッ
ク260において256ビンのような最高量子化レベル
で最初に量子化する。ブロック260の結果得られた量
子化画像は次に、ブロック262において、128,6
4及び32のような所望のビン数に量子化する。ブロッ
ク250及び260の結果である量子化画像は、望むな
らば、再量子化する必要はない。ブロック270では、
問合せ記述子が特定のヒストグラム記述子と異なるレベ
ルで量子化されるかを決定する。2つの記述子が同数の
ビンを有している場合は、ブロック272において記述
子を比較する。2つの記述子が異なる数のビンを有して
いる場合は、比較する前に、ブロック274において片
方の記述子を再量子化して他方の記述子の量子化に合わ
せる。記述子は、要望に応じ、両方共同数のビンに再量
子化してもよい。同サイズになった再量子化記述子を、
ブロック272において比較する。同じ方法で同じサイ
ズに量子化した各色構成ヒストグラムは互いに一致し、
従って、含まれている空間情報も等しく取り扱うことが
できる。
【0134】空間情報を含んでいるヒストグラムをさら
に検討したが、特に、各量子化色がテスト領域毎に1回
だけ計数される場合に、かなりの数のビンが比較的少な
い数を含んでいる。ヒストグラム用に必要な蓄積条件を
さらに低減させるために、ビンの振幅を選択した符号値
のセットに量子化する。色構成ヒストグラムの場合に、
ある特定ビンの振幅がとることができる最大値は、予め
規定された数値、即ち、(N−Sx+1)×(M−Sy
1)であり、ここで、Nは画素内構成要素の水平方向の
幅、Mは画素内構成要素の垂直方向の高さ、Sxは画素
内構成要素の水平方向の幅、Syは画素内構成要素の垂
直方向の高さである。注意すべきことは、この最大値は
従来の色ヒストグラムと同じであり、ここでSx=Sy
1である。最大ポテンシャル値が明らかになれば、生成
ヒストグラムを良好に規定された方法で正規化すること
ができる。正規化した総画素計数と生成符号値間の相互
関係の1例を図24に示す。従来は、画素計数を一様に
量子化しており、図24に破線で描いた斜線のように符
号値と量子化振幅の間は直線的関係を含んでいる。
【0135】図25は、正規化した画素計数が符号値と
非線形の関係を示す別の相互関係例を示す。これは、非
一様な量子化である。
【0136】通常の色構成ヒストグラム内の殆どのデー
タは、図10に示すような、小さな数字プラス少数の大
きな数字である。殆どが小さい数字より成る2つのヒス
トグラムを、通常片方のヒストグラムの他方との絶対差
によって比較する時に、その結果は主としてより小さい
数字になる。小さい数値間の見掛けの差の減少は、続い
て振幅量子化を実行すれば、さらに減少する。従って、
残る少数の大きな数値が2つの色構成ヒストグラム間の
比較を左右する傾向が見られる。小さい符号値(即ち、
小さい数)が殆ど無関係になり、大きな符号値(即ち、
大きな数)が支配する傾向を補償するためには、振幅を
非一様に量子化して、振幅と符号値の間に非直線的な関
係を導入しなければならない。異なる符合値の分布例で
は、ビンの振幅範囲を6つの範囲に細分し、次に異なる
数の量子化レベルを各細分範囲内に一様に割当てる。ビ
ン振幅範囲(0.0〜1.0)を6つの小範囲に分割する
閾値は、(およそ)次の通りである。
【0137】Th0 0.000000001;(又
は、0.037よりかなり小さいか又は、ほぼゼロに等
しい数値) Th1 0.037; Th2 0.080; Th3 0.195;及び Th4 0.320 各分割範囲に割当てる量子化レベル(又は、符号値)数
は、(およそ)次の通りである。 N0=1 0.0及びTh0の間; N1=25 Th0及びTh1の間; N2=20 Th1及びTh2の間; N3=35 Th2及びTh3の間; N4=35 Th3及びTh4の間;及び N5=140 Th4及び1.0の間。
【0138】しきい値の数値は、要求に応じ修正するこ
とができる。従来のビンを一様に量子化する方法とは異
なり、この改良技法は、非一様振幅量子化技法を用い
る。振幅の非一様量子化の実装については、参考資料IS
O/IEC JTC 1/SC 29/WG 11/M5218 (2000年7月、北京)に
記載され、ここに参照して一体化する。
【0139】図26は、色構成ヒストグラム記述子の抽
出プロセスの実装例を示す図である。ブロック300に
おいて、“生の”256ビンヒストグラムを画像から直
接集積(例えば、コンパイル)する。この時点で、ビン
の振幅はまだ量子化されておらず、“線形”ドメインに
残っており、即ち、ビンに関係する色を含む構成要素数
に線形に関係している。256ビンが要求されると、ブ
ロック302はブロック304に分岐し、そこで、前述
した技法を使用してビンの振幅を非一様に量子化する。
256ビンより少ないビンが要求されると、ブロック3
02は306に分岐し、そこで、前述した技法を使用し
てビンの単一化により色空間を再量子化する。ブロック
306におけるビン一様化の結果は、まだ“線形”ドメ
インにある。ブロック306の結果をブロック308で
最大振幅にクリップして、制限されたビット数を使用し
ている場合に整数の“ロールオーバー”が発生するのを
避ける。ブロック308によるクリッピングの結果をブ
ロック304に提供し、そこで、ビンの振幅を非一様に
量子化する。ブロック304による振幅の非一様な量子
化の結果は、ビン関係色を含む構成要素の数に非線形的
に関係する符号値を供給する。かなりの分析を実施した
結果、“線形”ドメイン内のビンの一様化による再量子
化により、符号値を用いる“非線形”ドメイン内のビン
の一様化で検索パフォーマンスが増強されることを確認
した。この増強されたパフォーマンスは、主として、減
少したクリッピングの結果であることも確認された。
【0140】図27はクエリ及びデータベース記述子用
の比較例を示す図である。クエリ記述子とデータベース
記述子を相似性測度の比較のために提供する場合、記述
子のサイズが一致しなければならない。サイズM320
のデータベースとサイズN322の問合せ記述子が与え
られた場合、2つの記述子のうちの大きい方を減寸して
小さい方のサイズに合わせる。減寸させる記述子の符号
値を先ずブロック326で(量子化)線形振幅に変換す
る。符号値の線形振幅への変換は、通常、次の特性を有
する。(i)結果振幅と先に定義した[0,1]以内の
非一様量子化間隔の中央間隔値との間には線形の関係で
あり、(ii)これらの線形振幅中央間隔値は、B個の
ビットで表現される。Bは、好ましくは20である。ブ
ロック328においてビンの一様化を行う。特に、M>
Nであると仮定した場合、M−ビン記述子内ビンのNビ
ン記述子内ビンへのマッピングは、Mビン記述子の各ビ
ンにより表現される色をNセル色空間に再量子化し、各
再量子化色を表わすビンインデックスを計算することに
より定義される。ブロック328の結果は、非一様振幅
量子化を含む記述子である。ビン一様化の期間中、2つ
のビンの合計は、好ましくは、ブロック330におい
て、最大可能線形振幅2B−1にクリップする。その
後、減寸した記述子の線形振幅を非線形符号値に変換し
て戻す。図28は、ゼロ色相角度用diff−sum平
面内のHMMD空間の断面を示しており、128セル操
作点用量子化セルを説明するための図である。部分空間
(サブスペース)を規定する分割点は、色平面に垂直線
で示してある。分割点を決定するdiff軸値は、平面
の上エッジに沿う分割点マーカの上部に黒色で表示して
ある。各部分空間内の水平線は、sum軸に沿った量子
化を示している。色相角の量子化は、各分割点マーカの
回りのグレイ回転矢印で示している。回転矢印の右側の
グレイ番号は、分割点の右側の部分空間において量子化
された色相のレベル番号に該当する。例えば、図13,
図14,図15は、diff=60とdiff=110
の間のサブ空間(即ち、サブ空間3)に関係する色相値
は、8つのレベルに量子化される。
【0141】色空間セルと記述子ビンインデックス間の
双射マッピングは、セル内の数値により明示される。こ
れらの数字は、先ず、(sum軸に平行に)下から上ま
で、次に、サブ平面内にあるdiff−sum平面から
diff−sum平面まで(色相軸の回り)、最後にサ
ブ空間からサブ空間への順序で与えられる。例えば、サ
ブ空間2及び3の底縁に最も近い図13,図14,図1
5のセルには、32と64の番号が与えられる。数字の
ジャンプは、このサブ空間用に4つの合計レベルと8つ
の色相レベルがあるためである。サブ空間内の数字は、
従って、32から32+4×8−1=63に増加する。
本明細書に使用してきた用語と表現は、説明のためであ
り限定するものではなく、かような用語と表現の使用に
より、図示説明してきた特徴又はその部分を表わす同等
の用語と表現を排除する意図は全くない。本発明の範囲
は、特許請求範囲によってのみ規定され限定されること
を確認する。
【図面の簡単な説明】
【図1】テスト領域を描いた異なる色又はテクスチャの
特徴を含む画像を示す図である。
【図2】画像上により大きいスケールで描いたテスト領
域を有する図2の画像を示す図である。
【図3】8つの正方形の特徴及び8つの円形の特徴を有
する記述用画像を示す図である。
【図4】1つの正方形特徴と1つの円形特徴を有し、各
特徴が、図3における8つの同一幾何学形状の特徴に等
しい面積を有している、記述用画像を示す図である。
【図5】同一サイズ及び形状の特徴を有し、その特徴が
平行移動及び回転した2枚の類似画像を示す図である。
【図6】本発明の第1実施態様において得られた画像デ
ータ例を示す図である。
【図7】本発明の第2実施態様において得られた画像デ
ータ例を示す図である。
【図8】非2進しきい値技法のグラフを示す図である。
【図9】本発明の第3実施態様において得られた画像デ
ータ例を示す図である。
【図10】色構成ヒストグラムの1例を示す図である。
【図11】図11(A)は、高干渉性色の画像を示す図
であり、図11(B)は、高非干渉性色の画像を示す図
である。
【図12】図12(A)は、シングルスペーシングでの
8×8構成要素の画像を示す図であり、図12(B)
は、ダブルスペーシングでの8×8構成要素の画像を示
す図である。
【図13】図13(A)は、量子化Aの色空間を示す図
であり、図13(B)は、図13(A)の色構成ヒスト
グラムを示す図である。
【図14】図14(A)は、量子化Bの色空間を示す図
であり、図14(B)は、図14(A)の色構成ヒスト
グラムを示す図である。
【図15】図15(A)は、量子化Cの色空間を示す図
であり、図15(B)は、図15(A)の色構成ヒスト
グラムを示す図である。
【図16】2つの等色平面P及びQを持つ画像を示す図
である。
【図17】1つのシングル等色平面PQを持つ画像を示
す図である。
【図18】色量子化のためのデータ構造例を示す図であ
る。
【図19】HMMD色空間を示す図である。
【図20】可能な色空間の選択例を示す図である。
【図21】図20の色空間の順序例を示す図である。
【図22】ビンの一様化の1例を示す図である。
【図23】再量子化及び比較技法を示す図である。
【図24】線形画素計数値対符号値を示す図である。
【図25】非線形画素計数値対符号値を示す図である。
【図26】色構成ヒストグラム記述子抽出プロセスの実
装例を示す図である。
【図27】クエリ及びデータベース記述子用の比較例を
示す図である。
【図28】HMMD(隠れマルコフモデル記述子)の色
空間量子化の1例を示す図である。
【図29】異なるスケールの特徴を有する2つの画像を
示す図である。
【符号の説明】
2…第1色の三角形特徴、4…第2色の円形特徴、6…
テスト領域、10,20…正方形特徴、12,22…円
形特徴。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ジェームズ エリコ アメリカ合衆国,97229 オレゴン州,ポ ートランド,9130 エヌダブリュ ウッド ローズ ループ Fターム(参考) 5L096 AA02 AA06 DA02 GA19 GA40 GA41 JA18

Claims (50)

    【特許請求の範囲】
  1. 【請求項1】 画像を記述する方法において、 a)複数の画素を含む空間構成要素を規定するステップ
    と、 b)前記空間構成要素に対応する複数のテスト領域を前
    記画像上に描写するステップと、 c)前記テスト領域毎に複数の色を量子化するステップ
    とを含んで成り、前記テスト領域毎の前記複数色の量子
    化ステップは、個別の前記テスト領域毎の前記量子化色
    毎の各色数とは無関係であることを特徴とする画像を記
    述する方法。
  2. 【請求項2】 前記テスト領域毎の前記複数色の前記量
    子化ステップは、同一量子化色を持つ前記各テスト領域
    内の画素数と無関係であることを特徴とする請求項1に
    記載の画像を記述する方法。
  3. 【請求項3】 前記量子化ステップは、複数の量子化色
    範囲に従って前記複数の色を量子化し、前記各量子化色
    範囲が前記画像の色空間の複数色を含んでいることを特
    徴とする請求項1に記載の画像を記述する方法。
  4. 【請求項4】 前記画像の前記色空間を複数の量子化色
    範囲に量子化し、前記テスト領域毎の前記複数色を前記
    量子化色範囲に従って量子化することを特徴とする請求
    項1に記載の画像を記述する方法。
  5. 【請求項5】 前記テスト領域毎の前記複数色の量子化
    ステップは、1次元ヒストグラムを提供することを特徴
    とする請求項4に記載の画像を記述する方法。
  6. 【請求項6】 前記画像を記述する方法は、 【表1】 により記述されることを特徴とする請求項1に記載の画
    像を記述する方法。
  7. 【請求項7】 前記空間構成要素の前記サイズは、前記
    画像のサイズに従って選択されることを特徴とする請求
    項1に記載の画像を記述する方法。
  8. 【請求項8】 画像を記述する方法において、 a)複数の画素を含む空間構成要素を規定するステップ
    と、 b)前記空間構成要素に対応する複数のテスト領域を前
    記画像上に描写するステップと、 c)前記テスト領域毎に複数の色を量子化するステップ
    とを含んで成り、前記テスト領域毎の前記複数色の量子
    化ステップはコヒーレントな色の空間範囲への強調を弱
    めて、色の空間的にインコヒーレントな範囲へ効果を強
    調することを特徴とする画像を記述する方法。
  9. 【請求項9】 前記複数色の前記量子化ステップは、前
    記個別テスト領域毎の前記量子化された各色数と無関係
    であることを特徴とする請求項8に記載の画像を記述す
    る方法。
  10. 【請求項10】 前記テスト領域毎の前記複数色の前記
    量子化ステップは、同一量子化色を持つ前記各テスト領
    域内の画素数と無関係であることを特徴とする請求項8
    に記載の画像を記述する方法。
  11. 【請求項11】 前記量子化ステップは、複数の量子化
    色範囲に従って前記複数の色を量子化し、前記各量子化
    色範囲が前記画像の色空間の複数色を含んでいることを
    特徴とする請求項8に記載の画像を記述する方法。
  12. 【請求項12】 前記画像の前記色空間を複数の量子化
    色範囲に量子化し、前記テスト領域毎の前記複数色を前
    記量子化色範囲に従って量子化することを特徴とする請
    求項7に記載の画像を記述する方法。
  13. 【請求項13】 前記テスト領域毎の前記複数色の量子
    化ステップは、1次元ヒストグラムを提供することを特
    徴とする請求項12に記載の画像を記述する方法。
  14. 【請求項14】 前記空間構成要素の前記サイズは、前
    記画像のサイズに従って選択されることを特徴とする請
    求項8に記載の画像を記述する方法。
  15. 【請求項15】 画像を記述する方法において、 a)画像のサイズに従ってサイズを選択する複数の画素
    を含む空間構成要素を規定するステップと、 b)前記空間構成要素に対応する前記画像上に複数のテ
    スト領域を描写するステップと、 c)前記テスト領域毎に複数の色を量子化するステップ
    とを含んで成ることを特徴とする画像を記述する方法。
  16. 【請求項16】 前記空間構成要素は、前記画像が第1
    画像サイズである時に第1要素サイズであり、前記空間
    構成要素は、前記画像が第2画像サイズである時に第2
    要素サイズであり、前記第1要素サイズは前記第2要素
    サイズより小さく、前記第1画像サイズは前記第2画像
    サイズより小さいことを特徴とする請求項15に記載の
    画像を記述する方法。
  17. 【請求項17】 前記テスト領域毎の前記複数色の前記
    量子化ステップは、前記個別テスト領域毎の前記量子化
    の各色数と無関係であることを特徴とする請求項16に
    記載の画像を記述する方法。
  18. 【請求項18】 前記テスト領域毎の前記複数色の前記
    量子化ステップは、同一量子化色を持つ前記各テスト領
    域内の画素数と無関係であることを特徴とする請求項1
    5に記載の画像を記述する方法。
  19. 【請求項19】 前記量子化ステップは複数の量子化色
    範囲に適宜に前記複数の色を量子化し、前記各量子化色
    範囲が前記画像の色空間の複数色を含んでいることを特
    徴とする請求項15に記載の画像を記述する方法。
  20. 【請求項20】 前記画像の前記色空間を複数の量子化
    色範囲に量子化し、前記テスト領域毎の前記複数色を前
    記量子化色範囲に従って量子化することを特徴とする請
    求項15に記載の画像を記述する方法。
  21. 【請求項21】 前記テスト領域毎の前記複数色の量子
    化ステップは1次元ヒストグラムを提供することを特徴
    とする請求項15に記載の画像を記述する方法。
  22. 【請求項22】 前記テスト領域毎の前記複数色の量子
    化ステップはコヒーレントな色の空間範囲への強調を弱
    めて、色の空間的にインコヒーレントな範囲への効果を
    強調することを特徴とする請求項15に記載の画像を記
    述する方法。
  23. 【請求項23】 前記空間構成要素が8×8であること
    を特徴とする請求項15に記載の画像を記述する方法。
  24. 【請求項24】 前記8×8空間構成要素が64サンプ
    ルを含むことを特徴とする請求項23に記載の画像を記
    述する方法。
  25. 【請求項25】 前記空間構成要素を予定サイズに保持
    し、前記画像をサブサンプリングして前記空間構成要素
    に対応する前記テスト領域を決定することを特徴とする
    請求項15に記載の画像を記述する方法。
  26. 【請求項26】 前記サブサンプリングを絶対的に実行
    することを特徴とする請求項25に記載の画像を記述す
    る方法。
  27. 【請求項27】 p=max[0,round(0.5*log2(width*heigh
    t)-8)]の式において、widthは画像の幅であり、h
    eightは画像の高さであり、Kは前記画像に適用さ
    れるサブサンプリング係数であってK=2Pであり、E
    は前記空間構成要素の空間範囲であってE=8×Kであ
    ることを特徴とする請求項15に記載の画像を記述する
    方法。
  28. 【請求項28】 第1画像を第2画像と比較する方法で
    あって、(a)複数の画素を含む第1空間構成要素を規
    定するステップと、(b)前記第1空間構成要素に対応
    する複数の第1テスト領域を前記画像上に描写するステ
    ップと、(c)前記第1テスト領域毎に第1の複数の色
    を量子化するステップと、(d)ステップ(c)の前記
    量子化を異なるレベルに再量子化するステップと、
    (e)複数の画素を含む第2空間構成要素を規定するス
    テップと、(f)前記第2空間構成要素に対応する複数
    の第2テスト領域を前記画像上に描写するステップと、
    (g)前記第2テスト領域毎の第2の複数の色を量子化
    するステップと、(h)ステップ(g)の前記量子化を
    異なる量子化レベルに再量子化するステップと、(i)
    ステップ(d)の前記再量子化をステップ(h)の再量
    子化と比較するステップとを含んで成ることを特徴とす
    る第1画像を第2画像と比較する方法。
  29. 【請求項29】 前記第1の複数色の前記量子化ステッ
    プは、第1のビン数を持つ第1記述子を生じ、前記第2
    の複数色の前記量子化ステップは、第2のビン数を持つ
    第2記述子を生じることを特徴とする請求項28に記載
    の第1画像を第2画像と比較する方法。
  30. 【請求項30】 前記第1ビン数と前記第2ビン数が等
    しいことを特徴とする請求項29に記載の第1画像を第
    2画像と比較する方法。
  31. 【請求項31】 前記第1ビン数と前記異なる量子化レ
    ベルのビン数が等しいことを特徴とする請求項29に記
    載の第1画像を第2画像と比較する方法。
  32. 【請求項32】 前記第2ビン数と前記異なる量子化レ
    ベルのビン数が等しいことを特徴とする請求項29に記
    載の第1画像を第2画像と比較する方法。
  33. 【請求項33】 前記再量子化ステップは、適切な細分
    化を含むことを特徴とする請求項28に記載の第1画像
    を第2画像と比較する方法。
  34. 【請求項34】 画像を記述する方法であって、(a)
    複数の画素を含む空間構成要素を規定するステップと、
    (b)前記空間構成要素に対応する複数のテスト領域を
    前記画像上に描写するステップと、(c)前記テスト領
    域毎に複数の色を量子化するステップと、(d)ステッ
    プ(c)の前記量子化の結果値を非一様に量子化するス
    テップと、(e)前記非一様量子化値を符号値に変換す
    るステップを含んで成ることを特徴とする画像記述方
    法。
  35. 【請求項35】 前記符号値は6つの範囲に分割された
    近似的にほぼ0.0から1.0までの範囲を有し、第1範
    囲は近似的に0とほぼゼロの間であり、第2範囲は近似
    的にほぼゼロと0.037の間であり、第3範囲は近似
    的に0.037と0.080の間であり、第4範囲は近似
    的に0.080と0.195の間であり、第5範囲は近似
    的に0.195と0.320の間であり、第6範囲は近似
    的に0.320と1.0の間であることを特徴とする請求
    項34に記載の第1画像を第2画像と比較する方法。
  36. 【請求項36】 前記第1範囲を1個の範囲に分割する
    ことを特徴とする請求項35に記載の第1画像を第2画
    像と比較する方法。
  37. 【請求項37】 前記第2範囲を25個のほぼ等しい範
    囲に分割することを特徴とする請求項35に記載の第1
    画像を第2画像と比較する方法。
  38. 【請求項38】 前記第3範囲を20個のほぼ等しい範
    囲に分割することを特徴とする請求項35に記載の第1
    画像を第2画像と比較する方法。
  39. 【請求項39】 前記第4範囲を35個のほぼ等しい範
    囲に分割することを特徴とする請求項35に記載の第1
    画像を第2画像と比較する方法。
  40. 【請求項40】 前記第5範囲を35個のほぼ等しい範
    囲に分割することを特徴とする請求項35に記載の第1
    画像を第2画像と比較する方法。
  41. 【請求項41】 前記第6範囲を140個のほぼ等しい
    範囲に分割することを特徴とする請求項35に記載の第
    1画像を第2画像と比較する方法。
  42. 【請求項42】 前記第1範囲を1個の範囲に分割し、
    前記第2範囲を25個のほぼ等しい範囲に分割し、前記
    第3範囲を20個のほぼ等しい範囲に分割し、前記第4
    範囲を35個のほぼ等しい範囲に分割し、前記第5範囲
    を35個のほぼ等しい範囲に分割し、前記第6範囲を1
    40個のほぼ等しい範囲に分割することを特徴とする請
    求項35に記載の第1画像を第2画像と比較する方法。
  43. 【請求項43】 画像を記述する方法であって、(a)
    複数の画素を含む空間構成要素を規定するステップと、
    (b)前記空間構成要素に対応する複数のテスト領域を
    前記画像上に描写するステップと、(c)前記テスト領
    域毎に複数の色を量子化するステップと、(d)ステッ
    プ(c)の前記量子化を異なる量子化レベルに選択的に
    再量子化するステップと、(e)ステップ(d)の前記
    量子化の結果値を非一様に量子化するステップと、
    (f)前期非一様量子化値を符号値に変換するステップ
    を含んで成ることを特徴とする画像記述方法。
  44. 【請求項44】 前記選択的再量子化が選択されない場
    合に前記ステップ(c)の前記量子化の結果値を非一様
    に量子化するステップをさらに含むことを特徴とする請
    求項43に記載の画像記述方法。
  45. 【請求項45】 前記テスト領域毎の前記複数色の前記
    量子化ステップの結果生じる値が、該値と関係する量子
    化色を含む前記空間構成要素の数に直線的に関係するこ
    とを特徴とする請求項43に記載の画像記述方法。
  46. 【請求項46】 前記非一様量子化に先立ち、前記結果
    値をクリッピングするステップをさらに含んで成ること
    を特徴とする請求項44に記載の画像記述方法。
  47. 【請求項47】 前記符号値を前記結果値を表わす変換
    値に変換するステップをさらに含んで成ることを特徴と
    する請求項46に記載の画像記述方法。
  48. 【請求項48】 前記変換値を異なる量子化レベルに再
    量子化するステップをさらに含んで成ることを特徴とす
    る請求項47に記載の画像記述方法。
  49. 【請求項49】 前記変換値の前記再量子化を非一様に
    量子化するステップをさらに含んで成ることを特徴とす
    る請求項48に記載の画像記述方法。
  50. 【請求項50】 前記変換値の前記非一様量子化値を符
    号値に変換するステップをさらに含んで成ることを特徴
    とする請求項48に記載の画像記述方法。
JP2001352332A 2000-12-01 2001-11-16 画像を記述する方法 Pending JP2002170116A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US25080600P 2000-12-01 2000-12-01
US09/729,470 US7062084B2 (en) 2000-12-01 2000-12-04 Method for image description using color and local spatial information
US09/729470 2000-12-04
US60/250806 2000-12-04

Publications (1)

Publication Number Publication Date
JP2002170116A true JP2002170116A (ja) 2002-06-14

Family

ID=26941157

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001352332A Pending JP2002170116A (ja) 2000-12-01 2001-11-16 画像を記述する方法

Country Status (3)

Country Link
US (1) US7062084B2 (ja)
EP (1) EP1211645A3 (ja)
JP (1) JP2002170116A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004054253A1 (ja) * 2002-12-06 2004-06-24 Nec Corporation 画像記述システムおよびその方法
CN100454997C (zh) * 2002-12-06 2009-01-21 日本电气株式会社 图像记述系统及其方法
JP2014229317A (ja) * 2013-05-24 2014-12-08 タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited 1つ以上の画像処理アルゴリズムの自動選択のための方法およびシステム
JP2019008573A (ja) * 2017-06-26 2019-01-17 日本電信電話株式会社 類似文書検索装置、類似文書検索方法及びプログラム

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8374237B2 (en) * 2001-03-02 2013-02-12 Dolby Laboratories Licensing Corporation High precision encoding and decoding of video images
US6903782B2 (en) * 2001-03-28 2005-06-07 Koninklijke Philips Electronics N.V. System and method for performing segmentation-based enhancements of a video image
DE10239801A1 (de) * 2002-08-29 2004-03-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Extrahieren von Texturmerkmalen aus einem mehrkanaligen Bild
KR100488011B1 (ko) * 2002-10-07 2005-05-06 엘지전자 주식회사 칼라 히스토그램의 빈값 양자화 방법
US7263220B2 (en) * 2003-02-28 2007-08-28 Eastman Kodak Company Method for detecting color objects in digital images
US7694318B2 (en) 2003-03-07 2010-04-06 Technology, Patents & Licensing, Inc. Video detection and insertion
US7738704B2 (en) 2003-03-07 2010-06-15 Technology, Patents And Licensing, Inc. Detecting known video entities utilizing fingerprints
US7809154B2 (en) 2003-03-07 2010-10-05 Technology, Patents & Licensing, Inc. Video entity recognition in compressed digital video streams
US20050177847A1 (en) * 2003-03-07 2005-08-11 Richard Konig Determining channel associated with video stream
EP1881455B1 (en) * 2003-07-04 2009-12-23 Mitsubishi Electric Information Technology Centre Europe B.V. Method and apparatus for representing a group of images
US7765319B1 (en) 2003-07-30 2010-07-27 Gorman Sean P System and method for analyzing the structure of logical networks
JP4606828B2 (ja) * 2003-09-25 2011-01-05 富士フイルム株式会社 特定シーンの画像を選別する装置、プログラムおよびプログラムを記録した記録媒体
US7529195B2 (en) 2004-07-30 2009-05-05 Fortiusone, Inc. System and method of mapping and analyzing vulnerabilities in networks
US20060195859A1 (en) * 2005-02-25 2006-08-31 Richard Konig Detecting known video entities taking into account regions of disinterest
US20060195860A1 (en) * 2005-02-25 2006-08-31 Eldering Charles A Acting on known video entities detected utilizing fingerprinting
US7690011B2 (en) 2005-05-02 2010-03-30 Technology, Patents & Licensing, Inc. Video stream modification to defeat detection
US7860308B2 (en) * 2005-12-01 2010-12-28 Yahoo! Inc. Approach for near duplicate image detection
JP4393489B2 (ja) * 2006-09-06 2010-01-06 キヤノン株式会社 画像処理装置およびその方法
US9147272B2 (en) * 2006-09-08 2015-09-29 Christopher Allen Ingrassia Methods and systems for providing mapping, data management, and analysis
US8405868B2 (en) * 2006-09-27 2013-03-26 Andrew Jackson Method, apparatus and technique for enabling individuals to create and use color
AU2008216368A1 (en) * 2007-02-13 2008-08-21 Fortiusone, Inc. A method and system for integrating a social network and data repository to enable map creation
US8208731B2 (en) * 2008-04-07 2012-06-26 Microsoft Corporation Image descriptor quantization
US8295651B2 (en) * 2008-09-23 2012-10-23 Microsoft Corporation Coherent phrase model for efficient image near-duplicate retrieval
CN103106668B (zh) * 2011-11-09 2016-08-03 佳能株式会社 基于颜色直方图来描述图像区域的方法和系统
US20130135525A1 (en) * 2011-11-30 2013-05-30 Mobitv, Inc. Fragment boundary independent closed captioning
JP5919979B2 (ja) * 2012-04-06 2016-05-18 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
CN114397929B (zh) * 2022-01-18 2023-03-31 中山东菱威力电器有限公司 一种可以改善冲洗水初始温度的智能马桶盖控制系统

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2603946B2 (ja) 1986-09-26 1997-04-23 オリンパス光学工業株式会社 画像間の対応領域の検出装置
JP2603144B2 (ja) 1990-01-17 1997-04-23 富士写真フイルム株式会社 画像ファイリング装置
US5309228A (en) 1991-05-23 1994-05-03 Fuji Photo Film Co., Ltd. Method of extracting feature image data and method of extracting person's face data
US5509111A (en) 1992-04-27 1996-04-16 International Business Machines Corporation Color image region management system and color image region management method and color image region retrieval method
US5446543A (en) 1992-07-24 1995-08-29 Kabushiki Kaisha Toshiba Method and apparatus for extracting a pattern of color from an object using a neural network
US5579471A (en) 1992-11-09 1996-11-26 International Business Machines Corporation Image query system and method
JP3234064B2 (ja) 1993-09-02 2001-12-04 キヤノン株式会社 画像検索方法並びにその装置
JPH07146871A (ja) 1993-11-24 1995-06-06 Hitachi Ltd 静止画検索装置および静止画検索方法
US5521841A (en) 1994-03-31 1996-05-28 Siemens Corporate Research, Inc. Browsing contents of a given video sequence
US6026411A (en) 1997-11-06 2000-02-15 International Business Machines Corporation Method, apparatus, and computer program product for generating an image index and for internet searching and querying by image colors
US6516100B1 (en) * 1998-10-29 2003-02-04 Sharp Laboratories Of America, Inc. Method for image characterization using color and texture statistics with embedded spatial information
US6542632B1 (en) * 1999-02-01 2003-04-01 Sharp Laboratories Of America, Inc. Method for image characterization using color and texture statistics with embedded spatial information

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004054253A1 (ja) * 2002-12-06 2004-06-24 Nec Corporation 画像記述システムおよびその方法
CN100454997C (zh) * 2002-12-06 2009-01-21 日本电气株式会社 图像记述系统及其方法
JP2014229317A (ja) * 2013-05-24 2014-12-08 タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited 1つ以上の画像処理アルゴリズムの自動選択のための方法およびシステム
JP2019008573A (ja) * 2017-06-26 2019-01-17 日本電信電話株式会社 類似文書検索装置、類似文書検索方法及びプログラム

Also Published As

Publication number Publication date
EP1211645A3 (en) 2003-12-17
US7062084B2 (en) 2006-06-13
EP1211645A2 (en) 2002-06-05
US20020106122A1 (en) 2002-08-08

Similar Documents

Publication Publication Date Title
JP2002170116A (ja) 画像を記述する方法
JP4293690B2 (ja) 画像の特徴付け方法
Wang et al. Color clustering techniques for color-content-based image retrieval from image databases
JP3740065B2 (ja) 領域分割された映像の領域特徴値整合に基づいた客体抽出装置およびその方法
Messing et al. The mpeg-7 colour structure descriptor: Image description using colour and local spatial information
Plataniotis et al. Color image processing and applications
Eidenberger How good are the visual MPEG-7 features?
Krig et al. Image pre-processing
US8340412B2 (en) Image processing
JP2003523587A (ja) ビジュアルアテンションシステム
Tan et al. Colour texture analysis using colour histogram
EP2842106B1 (en) Method and system for image analysis
CN108829711B (zh) 一种基于多特征融合的图像检索方法
US20220222858A1 (en) Systems and methods for hue based encoding of a digital image
Pei et al. Extracting color features and dynamic matching for image database retrieval
JP4052837B2 (ja) イメージ領域を描写する方法
Celebi Forty years of color quantization: a modern, algorithmic survey
Wei Color object indexing and retrieval in digital libraries
Admile et al. Content based image retrieval using feature extracted from dot diffusion block truncation coding
Varish et al. A content based image retrieval using color and texture features
Dimai Unsupervised extraction of salient region-descriptors for content based image retrieval
Schaefer An uncompressed benchmark image dataset for colour imaging
Mihalik et al. Color content descriptors of images by vector quantization
Ramella et al. Color quantization via spatial resolution reduction
Palus et al. Colour image quantisation using KM and KHM clustering techniques with outlier-based initialisation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040611

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060911

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070703

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071120