JP3814499B2 - 画像処理装置及びその方法、プログラム - Google Patents

画像処理装置及びその方法、プログラム Download PDF

Info

Publication number
JP3814499B2
JP3814499B2 JP2001191850A JP2001191850A JP3814499B2 JP 3814499 B2 JP3814499 B2 JP 3814499B2 JP 2001191850 A JP2001191850 A JP 2001191850A JP 2001191850 A JP2001191850 A JP 2001191850A JP 3814499 B2 JP3814499 B2 JP 3814499B2
Authority
JP
Japan
Prior art keywords
color
image
component
input
scaling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001191850A
Other languages
English (en)
Other versions
JP2003006639A (ja
Inventor
康男 福田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2001191850A priority Critical patent/JP3814499B2/ja
Publication of JP2003006639A publication Critical patent/JP2003006639A/ja
Application granted granted Critical
Publication of JP3814499B2 publication Critical patent/JP3814499B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4084Scaling of whole images or parts thereof, e.g. expanding or contracting in the transform domain, e.g. fast Fourier transform [FFT] domain scaling

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Color Image Communication Systems (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Color Television Systems (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Facsimile Image Signal Circuits (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、画像の画像特徴量を抽出する画像処理装置及びその方法、プログラムに関するものである。
【0002】
【従来の技術】
画像を変倍し、生成された変倍画像に対して公知の離散コサイン変換(DCT)処理と量子化処理を行い、その結果、得られたDCT係数のうち低周波成分側から幾つかのDCT係数を取り出し、取り出したDCT係数を原画像の画像特徴量とし、これを、例えば、画像検索に用いるデータとする方式が知られている(ISO/IEC JTC1/SC29/WG11/N3522 "MPEG-7 Visual Working Draft 4.0"(以下、[VWD4.0])、あるいはISO/IEC JTC1/SC29/WG11/N3522 "MPEG-7 Visual part of eXperimentation Model Version 7.0" ([VXM7.0]))。
【0003】
以下、[VWD4.0]もしくは[VXM7.0]に記載されている「Color Layout descriptor」における画像特徴量抽出処理について、図10〜図14を用いて説明する。
【0004】
図10は[VWD4.0]もしくは[VXM7.0]に記載されている「Color Layout descriptor」における画像特徴量抽出処理を説明するための図である。また、図11はその画像特徴量処理を示すフローチャートである。
【0005】
原画像10001をRGB色成分毎に8×8画素の画像に変倍する画像変倍処理を行う(ステップS10401)。次に、生成した各色成分毎の8×8画素の画像10011、10012、10013の各画素をYCbCr色空間の各色成分データ10021、10022、10023に変換する色変換処理を行う(ステップS10402)。次に、YCbCr色空間の各色成分データ10021、10022、10023に対してDCT処理を行い、各色成分のDCT係数10031、10032、10033を取得する(ステップS10403)。
【0006】
尚、画像変倍処理、色変換処理、DCT処理は、公知のものでよい。
【0007】
次に、DCT係数10031、10032、10033に対して量子化処理を行う(ステップS10404)。
【0008】
量子化処理は、例えば、[VWD4.0]によれば、以下のプログラムコード10000〜10003に示すような処理で実現することができる。プログラムコード10000〜10003は、公知のC言語を用いて記述されている。[VWD4.0]によれば、量子化処理は、Y成分とCb/Cr成分それぞれについて、DC成分とAC成分で異なる処理を施すので、量子化処理として、4通りの処理を実現するプログラムコード10000〜10003が用意されている。
【0009】
プログラムコード10000:Y係数のDC成分に対する量子化処理
【0010】
Figure 0003814499
プログラムコード10001:Cb/Cr係数のDC成分に対する量子化処理
【0011】
Figure 0003814499
プログラムコード10002:Y係数のAC成分に対する量子化処理
【0012】
Figure 0003814499
プログラムコード10003:Cb/Cr係数のAC成分に対する量子化処理
【0013】
Figure 0003814499
プログラムコード10000、10001による量子化処理の結果、YもしくはCb/Cr成分の量子化されたDCT係数(以下、量子化DCT係数)は、0〜64の値になる。また、プログラムコード10002、10003による量子化処理の結果、YもしくはCb/Cr成分の量子化DCT係数は、0〜32の値となる。従って、量子化DCT係数のDC成分は符号無し6bit、AC成分は符号無し5bitで表現することができる。
【0014】
続いて、量子化処理の結果によって得られた量子化DCT係数10041、10042、10043の内、低周波数成分側から幾つかの係数を選択する係数選択処理を行う(ステップS10405)。
【0015】
図10の場合は、例として、Y成分の量子化DCT係数に関しては6個、Cb/Cr成分の量子化DCT係数に関しては3個ずつ選択している例である。係数選択処理は、実際は、図12に示すようなジグザグスキャン処理によって、8×8と二次元に配置された量子化DCT係数を一次元に並び替え、その先頭から幾つかを選択することによって実現される。図12の10101は、ジグザグスキャンを表す図であり、8×8ブロックの各ブロックに記述されている1から64の数字は、一次元に並びかえられた後にその量子化DCT係数が先頭から何番目に配置されるかを示す数字である。
【0016】
そして、得られた量子化DCT係数の低周波成分側から幾つかの量子化DCT係数を取得する。[VWD4.0]によれば、ここで取得する量子化DCT係数の数は、1、3、6、10、15、21、28、64のいずれかである。また、量子化DCT係数の数は、Cb成分の量子化DCT係数とCr成分の量子化DCT係数に関しては同数であるが、Y成分の量子化DCT係数の数とCb/Cr成分の量子化DCT係数の数には別々の数を設定可能である。また、デフォルトではY成分の量子化DCT係数に関して6個、Cb/Cr成分の量子化DCT係数に関しては3個を選択する。図10では、例として、このデフォルト時の係数選択である、Y成分の量子化DCT係数に関して6個(10051)、Cb/Cr成分の量子化DCT係数に関しては3個(10052、10053)を選択している。
【0017】
この選択された量子化DCT係数10051、10052、10053を、原画像10001の画像特徴量、即ち、Color Layout descriptorとする。
【0018】
また、[VWD4.0]によれば、このColor Layout descriptorは、図13や図14に示すようなバイナリ構造で格納される。図13の10201や図14の10301において、各ブロックは1bitを表現している。また、10201や10301では、便宜上、フィールド毎に区切っているが、実際は、同図の破線矢印で示しているような順序で連続して格納されている。
【0019】
図13はColor Layout descriptorがデフォルトの場合、即ち、Y成分の量子化DCT係数6個、Cb/Cr成分の量子化DCT係数が各3個の場合のバイナリ構造を表す図である。この場合、先頭の拡張フラグには「0」が格納されている。さらに、それに後続して、Y成分の量子化DCT係数が6個、Cb成分の量子化DCT係数が3個、Cr成分の量子化DCT係数が3個の順に格納されている。量子化DCT係数は、DC成分については符号無し6bit、AC成分については符号無し5bitで表現できるので、DC成分については6bit、AC成分については5bitの領域に格納される。
【0020】
一方、図14はColor Layout descriptorがデフォルトでない場合のバイナリ構造を表す図である。この場合、先頭の拡張フラグには「1」が格納されている。それに後続して、3bitのフィールドが2つ後続する。この3bitのフィールドは、それぞれY成分の量子化DCT係数の数、Cb/Cr成分の量子化DCT係数の数を表すのに用いられる係数指定フィールドである。例えば、その数を示すビットパターンと量子化DCT係数の数との対応を示すと、以下のような表になる。
【0021】
Figure 0003814499
【0022】
さらに、この2つの3bitの係数指定フィールドに、後続してY、Cb、Cr成分の順に量子化DCT係数が格納される。Y、Cb、Cr成分の係数の数は、係数指定フィールドで指定した係数の数である。図14の10301では、例として、Y成分の量子化DCT係数が6個、Cb/Cr成分の量子化DCT係数がそれぞれ6個の場合を示している。
【0023】
また、この画像特徴量として選択した量子化DCT係数による画像間の類似度については、[VXM7.0]によれば、以下の類似度算出式により算出される。例えば、2つのColor Layout descriptor、CLD1(YCoeff, CbCoeff, CrCoeff)とCLD2(YCoeff', CbCoeff', CrCoeff')の間の類似度Dは、以下の類似度算出式で算出される。
【0024】
Figure 0003814499
【0025】
類似度算出式において、λは各量子化DCT係数に関する重み付けであり、[VXM7.0]には、以下の表に示すような重み付け値が示されている。尚、表の空欄部分の重み付け値は1である。
【0026】
Figure 0003814499
【0027】
また、2つのColor Layout descriptorの持つ量子化DCT係数の数が異なる場合には、少ない量子化DCT係数に合わせて類似度算出式を適用するか、あるいは不足している量子化DCT係数は16をその値として補い、多い量子化DCT係数に合わせて類似度算出式を適用するということが示されている。
【0028】
【発明が解決しようとする課題】
上述したように、Color Layout descriptorは、原画像ないし縮小後の8×8画素画像の画素値を周波数空間に投射した距離を類似度として算出している。しかしながら、人間の画像に対する認識は相対的であり、例えば、ある色の認識はその周囲の色などに影響を受けることが知られている。従って、例えば、同一対象を照明条件を違えて撮影した2つの画像や、あるいは同一画像を性能の異なる公知のスキャナ装置などで読み込んだ2つの画像などでは、各画素値がかなり異なる可能性がある。そのような場合にも、人間は若干の色の違いがあると感じても十分に類似しているという認識を持つことが可能であるにもかかわらず、上述したColor Layout descriptorによる方式においては、画像間の画素値の違いがそのまま類似度に反映してしまう。そのため、従来の類似度による類似画像の検索では、人間が十分に類似していると認識できる画像同士を、類似画像として検索することができない場合があった。
【0029】
本発明は上記の課題を解決するためになされたものであり、従来の画像の類似度による類似度判定では類似画像と判定することが困難な関係にある画像群を、類似画像として判定することが可能な画像特徴量を抽出できる画像処理装置及びその方法、プログラムを提供することを目的とする。
【0030】
【課題を解決するための手段】
上記目的を達成するために、本発明の画像処理装置は、次の構成を備える。即ち、
画像の特徴量を抽出する画像処理装置であって、
入力画像を入力する入力手段と、
前記入力画像の色空間の各色成分の色変域を取得する色変域取得手段と、
前記入力画像を変倍して縮小画像を生成する変倍手段と、
前記入力画像の色空間の各色成分の値域と、前記色変域取得手段で取得した各色成分の色変域とに基づいて、前記変倍手段によって生成された縮小画像を色正規化する色正規化手段と、
前記色正規化手段で色正規化された画像をDCTするDCT手段と、
前記DCT手段によって得られるDCT係数を量子化する量子化手段と、
前記量子化手段によって得られる量子化DCT係数群の内、低周波数成分側から所定範囲内の量子化DCT係数を、前記入力画像の画像特徴量として選択する選択手段と
を備えることを特徴とする画像処理装置。
【0031】
また、本発明の画像処理方法は、次の構成を備える。即ち、
画像の特徴量を抽出する画像処理方法であって、
入力画像を入力する入力工程と、
前記入力画像の色空間の各色成分の色変域を取得する色変域取得工程と、
前記入力画像を変倍して縮小画像を生成する変倍工程と、
前記入力画像の色空間の各色成分の値域と、前記色変域取得工程で取得した各色成分の色変域とに基づいて、前記変倍工程によって生成された縮小画像を色正規化する色正規化工程と、
前記色正規化工程で色正規化された画像をDCTするDCT工程と、
前記DCT工程によって得られるDCT係数を量子化する量子化工程と、
前記量子化工程によって得られる量子化DCT係数群の内、低周波数成分側から所定範囲内の量子化DCT係数を、前記入力画像の画像特徴量として選択する選択工程と
を備えることを特徴とする画像処理方法。
【0043】
【発明の実施の形態】
以下、図面を参照して本発明の好適な実施形態について詳細に説明する。
【0044】
図1は本発明の各実施形態で適用可能な画像処理装置の構成を示すブロック図である。
【0045】
データ入出力部10500は、静止画像データと動画像データの両方を入出力可能な画像入力装置である。具体的には、スチル撮影可能なデジタルビデオ装置がある。また、メモリーカード、PCカード等の外部記憶装置からUSB等の通信インタフェースを介して、画像データを読み込むことも可能である。更に、CD−ROM装置やフロッピーディスク装置等の記憶媒体を着脱可能な記憶装置から画像データを入力する構成であってもよい。加えて、イーサネットカードやモデム、無線通信等の通信路制御装置によるネットワーク接続等の通信路を介して画像データを入力する構成であってもよい。一方、データ入出力部10500は、画像データを、例えば、メモリーカードへ書き込むことも行う。
【0046】
入力部10501は、ユーザからの指示やデータを入力する装置であり、キーボードやポインティング装置を含む。尚、ポインティング装置としては、マウス、トラックボール、トラックパッド、タブレット等が挙げられる。
【0047】
蓄積部10502は、画像データや後述する画像特徴量抽出処理によって得られる画像特徴量データを蓄積する装置であり、通常は、ハードディスク等の大容量記憶媒体が用いられるが、この他でも、例えば、CD−ROM、CD−R/RW等の光/光磁気ディスクであってもよい。さらには、メモリーカード、PCカード等の記憶媒体であってもよい。概念上、蓄積部10502とデータ入出力部10500を区別して説明しているが、実際の装置においてはこれらが同一のものであっても構わない。
【0048】
表示部10503は、GUI(グラフィックユーザインタフェース)等の画像を表示する装置であり、一般的には、CRTや液晶ディスプレイ等が用いられる。
【0049】
CPU10504は、上述の各構成要素を制御する。ROM10505とRAM10506は、CPU10504が実行する処理に必要な制御プログラム、データ、作業領域等をCPU10504に提供する。また、後述する各実施形態で説明するフローチャートで示される画像特徴抽出処理を実現する制御プログラムは、例えば、蓄積部10502に格納されていても、ROM10505に記憶されていても良い。特に、ROM10505に格納されている場合は、一旦、RAM10506上に、その制御プログラムを読み込んでから実行される。
【0050】
バス10507は、上述の各構成要素を相互に接続する。
【0051】
尚、以下に説明する各実施形態で説明するフローチャートの各処理は、CPU10504によって制御される専用プログラムで実現されるものとするが、各処理のすべて/一部を専用ハードウェアで実現しても、もちろん構わない。
参考の実施形態1>
図2は本発明の実施形態1の画像特徴量抽出処理の示すフローチャートである。
【0052】
まず、原画像に対して色正規化処理を行う(ステップS101)。この色正規化処理についての詳細については後述する。次に、色正規化された画像を入力として、以降、ステップS102〜ステップS106の処理を実行するが、これらはそれぞれ上述の図11のステップS10402〜ステップS10405に対応するので、ここでは説明を省略する。
【0053】
次に、ステップS101の色正規化処理の詳細について説明する。
【0054】
図3は本発明の実施形態1の画像特徴量抽出対象の画像の一例を示す図である。
【0055】
201は、画像特徴量抽出対象の画像であり、実施形態1では、高さH画素、幅W画素の大きさを有し、RGB色空間のRGB成分の各成分は、RNmin以上RNmax以下、GNmin以上GNmax以下、BNmin以上BNmax以下の値域を取るものとする。これは、例えば、RGB成分の各成分8bit整数値(即ち、0以上255以下の整数値)で表現されている場合、全色成分とも0以上255以下ということになる。
【0056】
P(i,j)は、画像201の水平方向i、垂直方向jの位置の画素の画素値であり、そのRGB成分は、それぞれrij、gij、bijであるとする。また、rij、gij、bijの色変域の最小値及び最大値を、それぞれrmin及びrmax、gmin及びgmax、bmin及びbmaxとする。
【0057】
これらの各色成分の色変域の最小値及び最大値を取得する方法としては、画像201の各画素を走査して各画素の画素値を取得し、その取得された画素値の分布から各色成分の最小値及び最大値を取得すればよい。また、予め取得済みであれば、それを本処理の入力として与える方法でも良い。後者の方法の場合、画像201の各画素を走査する処理を省略することができ、より効率的となる。
【0058】
実施形態1では、以下の(1)式を画像201の全画素に施すことで、色正規化処理を実現する。即ち、任意の画素値P(i,j)より正規化画素値P'(i,j)を算出する。尚、この(1)式は、処理対象画像の色空間の各色成分の値域と、該処理対象画像の各色成分の色変域に基づいて、該処理対象画像を色正規化するものである。
【0059】
Figure 0003814499
【0060】
但し、
【0061】
Figure 0003814499
また、
【0062】
Figure 0003814499
この色正規化処理を、R成分を例に挙げて図式化すると、図4のようになる。つまり、色正規化前の画像のR成分の色変域rrangeは、色正規化後はRNrangeとなる。尚、図4では、R成分に対する色正規化処理を例として挙げているが、G、B成分についても同様である。
【0063】
次に、色正規化処理の具体例について、図5を用いて説明する。
【0064】
図5は本発明の実施形態1の色正規化処理の具体例を示す図である。
【0065】
図5では、明るさの異なる類似した2つの画像の例を示しており、401は明るい環境で撮影された画像である。411はやや暗い環境で撮影された画像である。また、画像401は前景402、403と背景404、画像411は前景412、413と背景414から成る。
【0066】
例えば、各領域の画素値が
402: P402=(r402, g402, b402)=(5, 5, 5)
403: P403=(r403, g403, b403)=(130, 130, 130)
404: P404=(r404, g404, b404)=(255, 255, 255)
412: P412=(r412, g412, b412)=(20, 20, 20)
413: P413=(r413, g413, b413)=(70, 70, 70)
414: P414=(r414, g414, b414)=(120, 120, 120)
とする。
【0067】
また、RGB各成分の画素値は8bit整数値(即ち、0以上255以下の整数値)であるとする。
【0068】
そして、式(1)を用いて、P402, P403, P404, P412, P413, P414に対して色正規化処理を実行して得られる結果をそれぞれ、P'402, P'403, P'404, P'412, P'413, P'414とすると、以下のようになる。
【0069】
P'402=(r'402, g'402, b'402)=(0, 0, 0)
P'403=(r'403, g'403, b'403)=(127.5, 127.5, 127.5)
P'404=(r'404, g'404, b'404)=(255, 255, 255)
P'412=(r'412, g'412, b'412)=(0, 0, 0)
P'413=(r'413, g'413, b'413)=(127.5, 127.5, 127.5)
P'414=(r'414, g'414, b'414)=(255, 255, 255)
このように色正規化処理後の画像401及び画像411は、その画素値が類似するものとなり、明るさが異なるよく似た2つの画像401、411を同一視することができる。
【0070】
尚、実施形態1では、式(1)において、RGBの各色成分について独立に色正規化処理を行ったが、これはあくまでも単なる例示であり、例えば、以下のような式(2)によって色正規化処理を実行しても良い。
【0071】
Figure 0003814499
【0072】
但し、
【0073】
Figure 0003814499
となる色成分cを選択し、その色成分cの最小値cmin、また、その色成分cの色正規化前の最小値cmin、また、その色成分の色正規化後の値域CNrangeを用いるというように、全ての色成分について共通のスケールにより、色正規化を実現するようにしても良い。
【0074】
また、実施形態1では、RGB色空間における色正規化処理を例として説明を行ったが、色正規化に用いられる色空間はRGB色空間に限定されるものではない。例えば、公知の色変換処理を原画像の各画素に施し、YCbCr色空間やL*a*b*色空間等の他の色空間上で色正規化処理を行ってから逆変換により元の色空間に戻して処理を進めるのであっても構わない。
【0075】
以上説明したように、実施形態1によれば、原画像に対し色正規化処理を施し、この処理結果に基づいて画像特徴量を抽出することで、従来の画像の類似度による類似度判定では類似画像と判定することが困難な関係にある画像群を、類似画像として判定することが可能である。
参考の実施形態2>
実施形態1では、色正規化処理を原画像に対して施す例を説明したが、この色正規化処理の処理対象は原画像に制限されるものではない。例えば、図6のフローチャートに示すように、色正規化処理を原画像を変倍後の画像、例えば、8×8画素の縮小画像に対して施すものであってもよい。
【0076】
尚、図6のフローチャートのステップS501〜ステップS506は、図1のステップS101〜ステップS106に対応するが、ステップS501の色正規化処理に対する入力は、原画像ではなく、原画像を変倍した8×8画素の縮小画像である。つまり、色正規化処理においては、原画像の色空間の各色成分の色変域ではなく、縮小画像の色空間の各色成分の色変域が用いられることになる。また、Color Layout descriptorでは、YCbCr色空間で表現されているが、適当な公知の色変換を施してから色正規化処理を行い、色正規化後のデータを逆の色変換を施してYCbCr色空間に戻すことにより、任意の色空間で正規化処理を施すことができる。
【0077】
以上説明したように、実施形態2によれば、色正規化処理の処理対象となる画像が、原画像を変倍した縮小画像であるので、一般にそれより大きい原画像に対して色正規化処理を施すのに比べて処理速度を高速にすることができる。
本発明の実施形態>
本発明の実施形態では、原画像の色変域に基づいて、原画像を変倍した縮小画像に対して色正規化処理を施す例を説明する。
【0078】
図7は本発明の実施形態の画像特徴量抽出処理を示すフローチャートである。
【0079】
尚、図7のステップS601〜S606は、図6のステップS501〜ステップS506に対応するので、ここでは説明を省略する。但し、図7では、ステップS602の前に、ステップS607として色変域取得処理を実行する。
【0080】
ステップS607の色変域取得処理では、実施形態1で説明した原画像の色空間の各色成分、rij、gij、bijの色変域を取得する処理を行う。具体的には、原画像の全画素を走査して各画素の画素値を取得して、原画像の各画素の画素値の分布から各色変域を取得すればよい。そして、この各色成分に対する色変域に基づいて、ステップS601の色正規化処理を実行する。つまり、ステップS601の色正規化処理は、実施形態2のステップS501の色正規化処理のような原画像の縮小画像の各色成分の色変域に基づいて実行するのではなく、原画像の各色成分の色変域に基づいて実行する。
【0081】
尚、原画像がRGB色空間以外の色空間で表現されている場合は、適当な公知の色空間変換処理を施せばよい。また、ここでは、例として、RGB色空間を用いているが、適当な公知の色変換処理を施すことにより、RGB色空間以外の色変域を得るのでも良い。あるいは、この色変域が予め取得済みであれば、それをステップS601の入力として与えるのでも良く、その場合、ステップS607の処理は、省略することが可能である。
【0082】
以上説明したように、本発明の実施形態によれば、実施形態2が処理の高速化という利点がある一方で、変倍画像から色正規化処理を行うため原画像の持つ色正規化処理前の原画像の色変域を忠実に再現できないという特徴があるのに対して、本発明の実施形態では、色正規化処理前に原画像の色変域を取得してそれを利用して色正規化処理を実行するので、より原画像の特徴に忠実な画像特徴量の抽出が可能となる。加えて、実施形態1と比較して、色正規化処理の計算コストを削減することができる。
参考の実施形態4>
実施形態2における色正規化処理は、色変換処理前の縮小画像に対して行うものであったが、例えば、図8に示すように、色変換処理後の画像に対して色正規化処理を行っても良い。
【0083】
尚、図8のフローチャートのステップS701〜ステップS706は、図6のステップS501〜ステップS506に対応するが、ステップS701の色正規化処理に対する入力は、RGB成分の色空間の画像ではなく、YCrCb成分の色空間の画像となる。また、この時の色正規化処理は、上述の式(1)や(2)のRGB成分に対応する式をYCrCbに置き換えることで実現できる。
参考の実施形態5>
本発明の実施形態における色正規化処理は、原画像の各色成分の色変域を取得し、それを用いて、画像変倍処理後の縮小画像に対して行うものであったが、例えば、図9に示すように、色変換処理後の画像に対して色正規化処理を行っても良い。
【0084】
尚、図9のフローチャートのステップS801〜ステップS806は、図7のステップS601〜ステップS606に対応するが、ステップS807の色変域取得処理では、ステップ608の色変換処理を原画像に施した画像の各色成分の色変域を取得する。また、ステップS801の色正規化処理に対する入力は、実施形態4と同様、RGB成分の色空間の画像ではなく、YCrCb成分の色空間の画像となり、この時の色正規化処理は、上述の式(1)や(2)のRGB成分に対応する式をYCrCbに置き換えることで実現できる。
【0085】
尚、本発明は、複数の機器(例えばホストコンピュータ、インタフェース機器、リーダ、プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置など)に適用してもよい。
【0086】
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
【0087】
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
【0088】
プログラムコードを供給するための記憶媒体としては、例えば、フロッピディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R/RW、DVD−ROM/RAM、磁気テープ、不揮発性のメモリカード、ROMなどを用いることができる。
【0089】
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0090】
更に、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0091】
本発明を上記記憶媒体に適用する場合、その記憶媒体には、先に説明したフローチャートに対応するプログラムコードが格納されることになる。
【0092】
【発明の効果】
以上説明したように、本発明によれば、従来の画像の類似度による類似度判定では類似画像と判定することが困難な関係にある画像群を、類似画像として判定することが可能な画像特徴量を抽出できる画像処理装置及びその方法、プログラムを提供できる。
【図面の簡単な説明】
【図1】 本発明の各実施形態で適用可能な画像処理装置の構成を示すブロック図である。
【図2】 本発明の参考の実施形態1の画像特徴量抽出処理の示すフローチャートである。
【図3】 本発明の参考の実施形態1の画像特徴量抽出対象の画像の一例を示す図である。
【図4】 本発明の参考の実施形態1の色正規化処理を説明するための図である。
【図5】 本発明の参考の実施形態1の色正規化処理の具体例を示す図である。
【図6】 本発明の参考の実施形態2の画像特徴量抽出処理の示すフローチャートである。
【図7】 本発明の実施形態の画像特徴量抽出処理を示すフローチャートである。
【図8】 本発明の参考の実施形態4の画像特徴量抽出処理を示すフローチャートである。
【図9】 本発明の参考の実施形態5の画像特徴量抽出処理を示すフローチャートである。
【図10】 [VWD4.0]もしくは[VXM7.0]に記載されている「Color Layout descriptor」における画像特徴量抽出処理を説明するための図である。
【図11】 [VWD4.0]もしくは[VXM7.0]による画像特徴抽出処理を示すフローチャートである。
【図12】 ジグザグスキャン処理を説明するための図である。
【図13】 [VWD4.0]もしくは[VXM7.0]に記載されているColor Layout descriptorのバイナリ構造を示す図である。
【図14】 [VWD4.0]もしくは[VXM7.0]に記載されているColor Layout descriptorのバイナリ構造を示す図である。

Claims (2)

  1. 画像の特徴量を抽出する画像処理装置であって、
    入力画像を入力する入力手段と、
    前記入力画像の色空間の各色成分の色変域を取得する色変域取得手段と、
    前記入力画像を変倍して縮小画像を生成する変倍手段と、
    前記入力画像の色空間の各色成分の値域と、前記色変域取得手段で取得した各色成分の色変域とに基づいて、前記変倍手段によって生成された縮小画像を色正規化する色正規化手段と、
    前記色正規化手段で色正規化された画像をDCTするDCT手段と、
    前記DCT手段によって得られるDCT係数を量子化する量子化手段と、
    前記量子化手段によって得られる量子化DCT係数群の内、低周波数成分側から所定範囲内の量子化DCT係数を、前記入力画像の画像特徴量として選択する選択手段と
    を備えることを特徴とする画像処理装置。
  2. 画像の特徴量を抽出する画像処理方法であって、
    入力画像を入力する入力工程と、
    前記入力画像の色空間の各色成分の色変域を取得する色変域取得工程と、
    前記入力画像を変倍して縮小画像を生成する変倍工程と、
    前記入力画像の色空間の各色成分の値域と、前記色変域取得工程で取得した各色成分の色変域とに基づいて、前記変倍工程によって生成された縮小画像を色正規化する色正規化工程と、
    前記色正規化工程で色正規化された画像をDCTするDCT工程と、
    前記DCT工程によって得られるDCT係数を量子化する量子化工程と、
    前記量子化工程によって得られる量子化DCT係数群の内、低周波数成分側から所定範囲内の量子化DCT係数を、前記入力画像の画像特徴量として選択する選択工程と
    を備えることを特徴とする画像処理方法。
JP2001191850A 2001-06-25 2001-06-25 画像処理装置及びその方法、プログラム Expired - Fee Related JP3814499B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001191850A JP3814499B2 (ja) 2001-06-25 2001-06-25 画像処理装置及びその方法、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001191850A JP3814499B2 (ja) 2001-06-25 2001-06-25 画像処理装置及びその方法、プログラム

Publications (2)

Publication Number Publication Date
JP2003006639A JP2003006639A (ja) 2003-01-10
JP3814499B2 true JP3814499B2 (ja) 2006-08-30

Family

ID=19030401

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001191850A Expired - Fee Related JP3814499B2 (ja) 2001-06-25 2001-06-25 画像処理装置及びその方法、プログラム

Country Status (1)

Country Link
JP (1) JP3814499B2 (ja)

Also Published As

Publication number Publication date
JP2003006639A (ja) 2003-01-10

Similar Documents

Publication Publication Date Title
US7564487B2 (en) Digital camera and control method for generating an image file using feature extraction data
JP3828210B2 (ja) 画像コントラスト強化方法
US6608926B1 (en) Image processing method, image processing apparatus and recording medium
CA2239850C (en) Method and apparatus for extracting a foreground image and a background image from a color document image
JP4491129B2 (ja) ローカル・エリア情報を使用する色域マッピング方法及び装置
US7468812B2 (en) Image processing apparatus and its method for color correction
US5034806A (en) Image processing apparatus and method
US7856144B2 (en) Image retrieving apparatus, image retrieving method, program, and storage medium
US6681041B1 (en) System and method for converting color data
US6715127B1 (en) System and method for providing editing controls based on features of a raster image
JP4078085B2 (ja) 変倍画像生成装置、方法、及びそのコンピュータプログラムとコンピュータ読み取り可能な記憶媒体
JP2003289550A (ja) データ格納フォーマット、画像データを格納する方法、及び、格納データを用いる方法
US7609881B2 (en) Device and method for image processing as well as image processing computer program
JP4920814B2 (ja) 画像処理方法、装置および記録媒体
US7394928B2 (en) Selection of coefficients for quantization processing based on whether an original image is a still image or a moving image
US7375850B2 (en) Image output apparatus, method of controlling the image output apparatus, and image output system
JP3814499B2 (ja) 画像処理装置及びその方法、プログラム
JP2004120092A (ja) 画像処理装置、画像処理システム、画像処理方法、記憶媒体、及びプログラム
JP4001446B2 (ja) 画像背景色特定のための方法、装置及びコンピュータ読み取り可能な記録媒体
JP2001186366A (ja) 画像処理方法、装置および記録媒体
JP4571758B2 (ja) 文字認識装置、文字認識方法、画像処理装置、画像処理方法、並びにコンピュータ読み取り可能な記録媒体
JP6145983B2 (ja) 画像処理装置およびコンピュータプログラム
JP3882657B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP6759914B2 (ja) 画像処理装置、画像形成装置およびプログラム
JP4032735B2 (ja) 画像処理装置および画像処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040610

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060407

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060522

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060605

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090609

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100609

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110609

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120609

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120609

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130609

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees