JP4968882B2 - 画像検索装置、画像検索方法およびプログラム - Google Patents

画像検索装置、画像検索方法およびプログラム Download PDF

Info

Publication number
JP4968882B2
JP4968882B2 JP2006068273A JP2006068273A JP4968882B2 JP 4968882 B2 JP4968882 B2 JP 4968882B2 JP 2006068273 A JP2006068273 A JP 2006068273A JP 2006068273 A JP2006068273 A JP 2006068273A JP 4968882 B2 JP4968882 B2 JP 4968882B2
Authority
JP
Japan
Prior art keywords
image
color space
feature amount
search
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006068273A
Other languages
English (en)
Other versions
JP2007012024A (ja
JP2007012024A5 (ja
Inventor
昌弘 松下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2006068273A priority Critical patent/JP4968882B2/ja
Priority to US11/441,100 priority patent/US7856144B2/en
Publication of JP2007012024A publication Critical patent/JP2007012024A/ja
Publication of JP2007012024A5 publication Critical patent/JP2007012024A5/ja
Application granted granted Critical
Publication of JP4968882B2 publication Critical patent/JP4968882B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Description

本発明は、印刷されたりスキャンされたりすることにより色味が変わった画像を検索する、又は、印刷されたりスキャンされたりすることにより色味が変化した画像から元の画像を検索する画像検索装置、画像検索方法、プログラム及び記憶媒体に関する。
従来より、類似画像を検索するための種々の技術が提案されている。例えば、自然画像について類似画像検索を行うためにある程度実用化されている技術では、色情報を画像特徴量として用いるものが多い。そして、その多くが、色情報に関するヒストグラムを取ることにより、RGBの割合や画像中に多く存在する色の組み合わせを用いて検索を行うものである。しかしながら、上記手法は、色の位置情報が失われてしまうために、その検索精度は必ずしも高くはなかった。
画像の特徴量の配置を考慮した類似画像の検索方法も開示されている(特許文献1参照)。特許文献1に記載の手法では、画像中の色の配置の違いに対する検索に関して、一定の向上が見られた。
一方、次に示すように、オリジナルの画像データと、その画像データを印刷した紙画像の比較を行うシステムも考えられてきている。
従来、印刷された紙画像の画像を利用して文書を作成したいときは、スキャンすることにより画像データに変換した後、文書に貼り付けていた。また、印刷された紙画像を複製したいときは、複写機でコピー(すなわち、スキャンして印刷)していた。しかしながら、一般に、画像データを印刷することにより、オリジナルの画像データに対し、画質の劣化、色味の変化がおこる。また、印刷された紙画像をスキャンして画像データに変換する際も、同様に、印刷された紙画像に対し、画質の劣化、色味の変化がおこる。
これらの現象は、オリジナルの画像データが使用している色域、プリンタが出力可能な色域、スキャナでスキャンできる色域のそれぞれが完全には一致していないために発生する。これらの画質の劣化、色味の変化を極力少なくし、品質の良い文書、複製を作成するには、印刷、スキャンの系をできるだけ少なくすることである。具体的には、文書に貼り付けて使用したい場合はオリジナルの画像データを貼り付ける、複製したい場合はオリジナルの画像データを印刷することである。そのために、紙画像から、オリジナルの画像データを検索する技術が必要となった。
また別の例として、情報管理に応用したシステムが考えられている。当該システムは、印刷された画像データ、スキャンされた画像データ、コピーされた画像データ等を、日時や担当者情報等とともに、データベースに登録しておき、ある画像データの、印刷、スキャン、コピーされた日時、担当者を調べるものである。このようなシステムでは、オリジナルの画像から、紙画像をスキャンした画像データを検索する技術が必要となった。
しかしながら、従来の画像検索方法は、色味の違いを厳密に比較する方法であったため、画質の劣化、色味の変化がおこった画像の検索精度は、必ずしも高くなかった。
特開平11−288418号公報
本発明は、このような事情を考慮してなされたものであり、画質の劣化、色味の変化に耐性のある画像の検索を好適に行うことができる画像検索装置、画像検索方法、プログラム及び記憶媒体を提供することを目的とする。
上記目的を達成するため、本発明に係る画像検索装置は、
画像を入力する入力手段と、
前記入力された画像の色空間を等色色空間に変換する第1の色空間変換手段と、
前記等色色空間に変換された画像の画像特徴量を抽出して正規化前の画像特徴量を生成する生成手段と、
前記画像の等色色空間の各成分において、前記画像の画素値を正規化した正規化画像を生成する正規化手段と、
前記正規化画像を複数の領域に分割し、領域ごとに特徴量を抽出して特徴量行列を生成する生成手段と、
前記正規化前の画像特徴量と前記特徴量行列とを、前記画像と対応付けて記憶する記憶手段と、
検索元画像を指定する指定手段と、
前記検索元画像の正規化前の画像特徴量と前記記憶手段に記憶された前記画像の正規化前の画像特徴量とを比較し、前記検索元画像の正規化前の画像特徴量と前記画像の正規化前の画像特徴量との類似度が一定値以上であった場合、該検索元画像の正規化後の特徴量行列と該画像の正規化後の特徴量行列との類似度を判定する判定手段と、
前記判定手段によって類似していると判定された画像を前記検索元画像の類似画像として出力する出力手段と、
を備えることを特徴とする。
本発明によれば、画質の劣化、色味の変化に耐性のある画像の検索を好適に行うことができる。
以下、図面を参照して、本発明の一実施形態に係る画像検索装置の詳細について説明する。尚、本実施形態では、特徴量をラベル表現した場合の実施例について説明する。
図1は、本発明の一実施形態に係る画像検索装置の制御構成を示すブロック図である。図1において、101はCPUであり、本実施形態の画像検索装置における各種制御を実行する。102はROMであり、本画像検索装置の立ち上げ時に実行されるブートプログラムや各種データを格納する。103はRAMであり、CPU101が処理するための制御プログラムを格納するとともに、CPU101が各種制御を実行する際の作業領域を提供する。104はキーボード、105はマウスであり、ユーザによる各種入力操作環境を提供する。
106は外部記憶装置であり、ハードディスクやフレキシブルディスク、CD−ROM等で構成される。107は表示器であり、処理の内容や処理結果を画面表示することによってユーザに伝える。108はネットワークインタフェースであり、ネットワーク上の各機種との通信を可能とする。110は画像読み取りのためのスキャナ、109はスキャナ110と上記各構成とを接続するためのインタフェースである。また、100は、上記各構成を互いに接続するためのバスである。
尚、上記構成においてスキャナ110や外部記憶装置106はネットワーク上に配置されたもので代用してもよい。
図2は、本発明の一実施形態に係る画像検索装置の機能構成を示すブロック図である。図2において、11はユーザインタフェース部であり、図1に示す表示器107、キーボード104及びマウス105を用いて、ユーザからの各種の操作入力を検出する。12は画像入力部であり、スキャナ110による画像の読み取りを行う。13は画像メモリであり、画像入力部12によって得られたイメージデータをRAM103の所定の領域に格納する。14は画像特徴量抽出部であり、画像メモリ13に格納した画像について、後述する手順で特徴量を抽出する。15は特徴量ラベル行列化部であり、画像特徴量抽出部14によって得られた特徴量に基づいてラベル行列を生成する。16はパターンマッチング部であり、指定された画像のラベル行列と、画像蓄積部17に蓄積されている画像のラベル行列に対し、後述の手順で類似度を算出する。
また、図2において、17は画像蓄積部であり、画像入力部12等によって得られた画像データを蓄積する。図3は、画像蓄積部17における画像データの格納状態を説明するための図である。図3に示すように、各画像データ112には画像ID111が付与され、画像蓄積部17にはこれらが対になって保持される。また、図2において、18は画像管理データベース(以下、「画像管理DB」という。)であり、図4で示されるデータ形態で画像蓄積部17に格納された画像データを管理する。図4は、本発明の一実施形態に係る画像管理DB18における画像データの格納形態を説明するための図である。本実施形態では、図4に示されるように、各画像データ毎に、画像IDと、フルパスのファイル名、画像正規化前の特徴量のラベル行列、画像正規化後の特徴量のラベル行列、その他の属性等を画像管理DB18に格納しておく。
以上のような構成を備えた画像検索装置の動作例について以下に説明する。
(第1の実施の形態)
<画像の登録処理>
最初に、本実施形態に係る画像検索装置に対して画像を登録する際に行う処理について説明する。
図5は、本発明の一実施形態に係る画像検索装置における画像登録処理の手順を説明するためのフローチャートである。まず、ユーザインタフェース部11を介したユーザの指示によって、画像入力部12を用いて画像を読み込み、読み込まれた画像を画像メモリ13に保持する(ステップS501)。次に、この画像を所定の大きさに拡大若しくは縮小する(ステップS502)。画像の拡大/縮小を行うことにより、スキャンした画像に存在する網点やモアレ等をある程度除去することができる。また、画像の縮小処理においては、後述するハイライト・シャドウ設定処理、色空間変換処理、画像正規化処理、特徴量抽出処理の高速化の面でも効果がある。
次に、ハイライト・シャドウ処理(ステップS503からステップS505)を行う。紙画像をスキャンする際は、安易に黒潰ししたり、白飛ばししたりせず、紙画像の諧調性をつぶさないようにスキャンが行われることが多い。したがって、印刷に用いた紙の色や、原稿をスキャナの原稿台に置いた際に生じる浮きによる影等が、読み取った画像データに乗ってしまい、何も印刷されていない部分も真っ白にはならない。また、真っ黒に印刷された部分も、トナーや紙の光沢により光を反射するため、画像データとしては真っ黒にはならない。本処理では、元の画像データにおいて、真っ黒もしくは真っ白であったと思われる部分を、真っ黒もしくは真っ白に変換する。
まず、画像の色空間がハイライト・シャドウ処理に適した色空間であるか調べ(ステップS503)、ハイライト・シャドウ処理に適した色空間で無かった場合は、ハイライト・シャドウ処理に適した色空間に変換する(ステップS504)。ハイライト・シャドウ処理は、前述したように、白に近い部分を白にし、黒に近い部分を黒にする処理である。そのため、処理に適した色空間は、白と黒が対極にある色空間であり、RGB色空間や、CMY色空間、CMYK色空間がハイライト・シャドウ処理に適している。通常使用されている画像はRGB色空間の画像であるので、ハイライト・シャドウ処理に用いる色空間をRGB色空間とすることにより、色空間変換処理が不要になり、処理の高速化にも寄与する。印刷に直結した作業を行っているデザイン事務所等、CMY色空間やCMYK色空間を使用した画像が多い環境においては、CMY色空間やCMYK色空間をハイライト・シャドウ処理に使用することにより、効率が良くなる。
次に、保持された画像のヒストグラムのハイライト側から発生頻度を足し合わせ、一定割合を越えた部分をハイライト値とする。同様に、当該画像のヒストグラムのシャドウ側から発生頻度を足し合わせ、一定割合を越えた部分をシャドウ値とし、それらの値を使用して、次の手順で画像の変換を行う(ステップS505)。
まず、画像変換用の変換テーブルConv1(i)(i=0,1,2,・・・,255)を式(1)を用いて作成する。ここで、ハイライト値、シャドウ値をそれぞれ、HL、SDとする。
Figure 0004968882
次に、変換テーブルConv1(i)を用いて、画像データの全画素を変換する。図6は、本発明の一実施形態に係る画像検索装置におけるハイライト・シャドウ処理を説明するための図である。図6において、ハイライト・シャドウ処理前のヒストグラム形状は、(a)に示す形状をしており、ハイライト・シャドウ処理後のヒストグラム形状は、(b)に示す形状のようになる。
次に、画像正規化処理(ステップS506、ステップS507、ステップS510)を行う。画像データを印刷する際は、オリジナルの画像データが使用している色域とプリンタが出力可能な色域が異なるため、ガマットマッピングが行われる。また、紙画像をスキャンする際にも、プリンタで出力された色域とスキャナでスキャンできる色域が異なるため、ガマットマッピングが行われる。ガマットマッピングにより、使用することができない色が、代替色に変換される。
ガマットマッピングはL*a*b*やJChといった等色色空間と言われる色空間上で行われ、その方法として代表的なものは、明度を保存する方法、色差を最小にする方法、相対関係を保存する方法である。いずれの方法においても、ガマットマッピングが行われる色空間上において、色空間を構成する成分値の大小関係が逆転することはない。本処理では、平均値が所定の値となり、色空間を構成する成分ごとに成分値の大小関係が逆転しない正規化を行う。その結果、色味の情報が薄れ、濃淡情報が強調されたデータに変換される。
まず、画像の色空間が画像正規化処理に適した色空間であるか調べ(ステップS506)、画像正規化処理に適した色空間で無かった場合は、画像正規化処理に適した色空間に変換する(ステップS507)。画像正規化処理は、前述したように、ガマットマッピングにより色味が変わってしまった画像の濃淡情報を強調する処理である。そのため、処理に適した色空間は、ガマットマッピングを行う際の色空間もしくはそれに近い特性をもつ色空間であり、L*a*b*色空間や、JCh色空間といった等色色空間と言われる色空間が画像正規化処理に適している。
次に、画像正規化処理を行う前の画像特徴量を抽出する(ステップS508)。この画像を1以上の領域(ブロック)に分割する。本実施形態では、画像を縦横の領域(ブロック)に分割する。図8は、本発明の一実施形態に係る画像検索装置における領域分割例を示す図である。図8に示されるように、本実施形態では、3×3の計9個に画像を分割するものとする。次に、分割された各領域の特徴量を算出し、得られた特徴量を次の手順でラベル化する。
尚、本実施形態で用いる3×3への分割は、あくまで説明のためのものである。画像検索処理のところで後述するが、本処理は、プリサーチとして用いられる。画像正規化処理により、色味の情報が薄れるため、極端に色味のことなる画像をふるい落とすのが目的である。本特徴量が大きくなるほど処理速度が遅くなるため、プリサーチという性格上、あまり分割数を多くする必要は無く、領域分割を行わず、画像全体から1つの特徴量を取得すればよい場合もある。
図9は、本発明の一実施形態における多次元特徴量空間を説明するための図である。図9に示すように、多次元特徴量空間(L*a*b*カラー空間)を複数のブロック(色ブロック)、すなわち、セル(色セル)に分割し、それぞれのセル(色セル)に対して通し番号でユニークなラベルを付与する。ここで、多次元特徴量空間(L*a*b*カラー空間)を複数のブロックに分けたのは、微妙な特徴量(色)の違いを吸収するためである。また、色成分を強めるためにL*×a*×b*を3×5×5のように分割しても良いし、輝度成分を強めるためにL*×a*×b*を5×3×3のように分割しても良い。
各分割領域に対して、定められた画像特徴量計算処理を行い、上記多次元特徴量空間上のどのセルに属するかを求め、対応するラベルを求める。この処理をすべての領域に対して行う。すなわち、分割画像領域に対して、すべての画素値の平均値を求め、その色がどの色セルに属するかの計算処理を行い、そのラベルをその分割画像領域のパラメータラベル(カラーラベル)として決定する。この処理をすべての領域に対して行う。
以上のようにして各領域に対してパラメータラベルが付与された後、各領域に付与されたパラメータラベルを所定の領域順序で並べることにより、パラメータラベル行列(以下、「ラベル行列」と称す。)が生成される(ステップS509)。図10は、本発明の一実施形態におけるラベル行列を生成する際の領域順序列を説明するための図である。本実施形態では、図10に示す分割画像領域の領域内に記載された数字に従って上記のパラメータラベルを並べ、ラベル行列を作る。尚、画像管理DB18にラベル行列を格納するに際しては、上述したように、2次元的なラベル行列を所定の順序で1次元に並べたものを格納するが、本実施形態ではこのような1次元の形態のものもラベル行列と称する。
次に、画像正規化処理を行う(ステップS510)。画像正規化処理の方法としては、画素値をシフトして平均値をそろえる方法、画素値をスケーリング変換して平均値をそろえる方法、ヒストグラムを平坦化して平均値をそろえる方法等がある。本実施形態ではヒストグラムを平坦化して平均値をそろえる。ヒストグラムの平坦化を行うに当たって次の処理手順で行う。
まず、変換前画像のヒストグラムHist(i)(i=0,1,2,・・・,255)を作成する。そして、画素値iの出現頻度をHist(i)に格納する。これと同時に、全画素の濃度の和Sumを計算する。図7は、本発明の一実施形態に係る画像検索装置におけるヒストグラムの平坦化処理を説明するための図である。図7において、(a)は、Hist(i)をグラフで表したものである。
次に、全濃度の出現頻度がほぼ一律なヒストグラムを作成するための、変換テーブルConv2(i)(i=0,1,2,・・・,255)を作成する。この処理は、Hist(0)から順に出現頻度を足し合わせて、その和がSum/255を越えたときのiをk1としたときに、Conv2(0)からConv2(k1)の値をk1とする。次に、Hist(k1+1)から順に出現頻度を足し合わせて、その和がSum/255を越えたときのiをk2としたとき、Conv2(k1+1)からConv2(k2)の値をk2とする。同様の手順でConv2(255)まで求める。
最後に、変換テーブルConv2(i)を用いて、画像データの全画素を変換する。ヒストグラムの平坦化後の理想のヒストグラム形状は、図7の(b)に示すようになるが、実際には完全に平坦にはならず、(c)に示すようになることが通常である。
次に、画像正規化処理を行った後の画像特徴量を抽出する(ステップS511)。この画像を複数の領域に分割し、分割された各領域の特徴量を算出し、得られた特徴量をラベル化する。領域分割、ラベル化の方法に関しては、前述の画像正規化前特徴量の領域分割、ラベル化と同様である。
本実施形態では、画像を縦横3×3の計9個の領域に分割するが、本実施形態で用いる3×3への分割は、あくまで説明のためのものである。実際には、自然画像であれば10×10以上の分割数とすることが好ましい。また、白の無地背景に商品が写っているような場合であれば、13×13以上の分割数とすることが好ましい。
続いて、以上のようにして得たラベル行列や画像データを画像蓄積部17、画像管理DB18に格納する(ステップS513)。すなわち、ステップS11で読み込んだ画像データに対して画像IDを取得し、これらをペアにして画像蓄積部17に格納する。そして、当該画像IDに対応付けて図4に示す画像管理DBレコードを生成し、これを画像管理DB18に登録する。
以上が画像登録時に行われる処理である。
<類似画像検索処理>
次に、図11に示すフローチャートに従って類似画像検索の処理を説明する。図11は、本発明の一実施形態に係る画像検索装置による類似画像検索処理手順を説明するためのフローチャートである。
まず、ユーザインタフェース部11からユーザによって類似検索元画像が指定される(ステップS1101)。これにより、画像検索装置は、指定された類似検索元画像の画像IDを取得し、さらに画像管理DB18から当該原画像の画像正規化前後のラベル行列(本実施形態では、カラーラベル行列)を取得する(ステップS1102)。同様に、画像検索装置は、類似比較先画像の画像正規化前後のラベル行列を取得する(ステップS1103)。
次に、画像検索装置は、類似検索元画像と類似比較先画像のそれぞれの画像正規化前のラベル行列の比較を行う(ステップS1104)。
ここで、ラベル行列同士の類似比較(類似度の算出)を行う方法について述べる。図12は、ステップS1104においてラベル行列を比較して類似度を求める際に用いられるラベル間のペナルティマトリックスの一例を示す図である。図12では、マトリクス中の値が小さい程類似していることになる。
例えば、ラベル2とラベル6のペナルティは「7」である。また、同じラベル同士のペナルティは当然のことながら「0」となっている。本マトリクスの使用目的は、ラベルの類似に応じた距離判定を行うことにある。すなわち、本実施形態では、特徴量空間としてL*a*b*カラー空間を用いているので、色の類似に応じた距離判定を行うことが可能となっている。
例えば、検索元画像と検索対象画像のラベル列中のそれぞれ対応する位置のラベルの値から図12のペナルティマトリクスを参照して距離を求め、ラベル列中の全ラベルについての距離の和を求めることで、両ラベル列間の距離を得る。例えば、図13に示す例では、検索元画像のラベル列が「112313441」であり、検索対象画像のラベル列が「113224452」であるので、図12のペナルティマトリクスを用いてマッチングを行うことにより、距離(最終解)が求まる。すなわち、図13は、本発明の一実施形態に係るマッチングによるラベル列間の距離の算出を説明する図である。
以上説明したように、ラベル間のパターンマッチングの際に、隣接するセル同士ではペナルティ(距離)を小さくし、遠いものには大きなペナルティを与えるために図12に示すようなラベル間でのペナルティマトリックスを導入する。ステップS1104では、このペナルティマトリックスを考慮して、ラベル行列同士を比較する。
また、画像正規化前の特徴量取得時に、領域分割を行わなかった場合は、単純に差を求めることにより、類似度を得ることができ、非常に高速な処理が可能である。
その結果、類似度が一定値以上の場合(No)は、類似検索元画像と類似比較先画像のそれぞれの画像正規化後ラベル行列の比較を行って類似度を算出する(ステップS1106)。そして、ステップS1107に進んで、ステップS1103からステップS1106の処理を全登録データに対して行う。一方、ステップS1105で類似度が一定値未満の場合は、検索元画像データと当該画像データとは類似しないものと判定し、ステップS1103に戻って次の画像データとの比較に遷移する。
画像正規化後のラベル行列同士の類似比較(類似度の算出)を行う方法は、画像正規化前のラベル行列同士の類似比較と同様に行うことができる。
ステップS1108では、得られた類似度を高い順にソートして、ステップS1109へ進む。そして、ステップS1109において、画像管理DB18を参照して、画像ID群の各画像IDについてフルパスのファイル名を取得し、これをユーザに提示する。
本実施形態では、特徴量をラベル表現して類似検索を行っているが、特徴量をラベル化せずに類似検索を行う方法も上記の方法より容易に推測できる。
(第2の実施の形態)
<画像の登録処理>
本実施の形態における画像の登録処理は、第1の実施の形態と同様の処理である。
<類似画像検索処理>
次に、第2の実施の形態における類似画像検索の処理を図15を用いて説明する。なお、ステップS1107とステップS1108の間に、ステップS1110が挿入された点が、第1の実施の形態と異なるので、ステップS1110について説明する。
次にステップS1108において、画像正規化前のラベル行列を比較した結果の類似度と、画像正規化後のラベル行列を比較した結果の類似度を統合する。ここで、前者をDeg_before、後者をDeg_afterとし、これらの類似度は0〜100の間の値で表現されているとする。この場合、統合類似度Deg_comb(0〜100)は、ウェイトweight(0〜1.0)を用いて、下記の変換式であらわすことができる。
Figure 0004968882
式2の変換式では、weightを大きくするほど画質の劣化や色味の変化への耐性が強くなり、同時に、もともと色味の異なる画像が検出されやすくなる。逆に、本変換式のweightを小さくするほど画質の劣化や色味の変化への耐性が弱くなり、同時に、もともと色味の異なる画像は検出されにくくなる。
なお、本変換式は、本実施例のための一例であって、本変換式とは異なる変換式を用いて類似度の統合を行っても構わない。別の変換式としては、たとえば下記の変換式等がある。
Figure 0004968882
式3の変換式においては、weightを大きくするほど画質の劣化や色味の変化への耐性が強くなり、同時に、もともと色味の異なる画像が検出されやすくなる。逆に、本変換式のweightを小さくするほど画質の劣化や色味の変化への耐性が弱くなり、同時に、もともと色味の異なる画像は検出されにくくなる。
以下、ステップS1108を第1の実施の形態と同様に処理する。
(第3の実施の形態)
また、実際に印刷やスキャンを行った際には、画像データ上で同色の部分であっても、若干の色の違いが発生する。特に、元の画像に使用されている色の階調数が少ない場合において、元画像と同じ階調数で画像正規化を行うと、同色であるべき部分に存在する若干の色の違いが強調され、意図しない濃淡情報になってしまう。
従って、本実施の形態においては、画像正規化を行う際に、元画像よりも少ない階調数で画像正規化処理を行うことにより、若干色が異なっていても、同色であるのと同等の処理が行われ、意図しない濃淡情報の強調を抑制することが可能である。
<画像の登録処理>
以下、画像の登録処理について、第1の実施の形態と異なる部分について説明する。本実施の形態は、ヒストグラムの平坦化を行うに当たって次の処理手順で行う。
まず、変換前画像のヒストグラムHist(i)(i=0,1,2,・・・,255)を作成する。そして、画素値iの出現頻度をHist(i)に格納する。これと同時に、全画素の濃度の和Sumを計算する。本実施の形態では、画像の階調数をそれぞれの色成分について256階調としているが、これに限定するものではない。また、L*a*b*等の色空間では、それぞれの成分ごとに階調数が異なり、使用する階調数が異なる場合は、以降の説明に用いられている値は適宜変形される。
図14は、本発明の一実施形態に係る画像検索装置におけるヒストグラムの平坦化処理を説明するための図である。図14において、(a)は、Hist(i)をグラフで表したものである。
次に、画素値iが0でない階調数HistWidthを数える。本実施形態では、HistWidthを得るために、画素値iが0でない階調数を数えているが、前述のハイライト・シャドウ処理と同様にハイライト値、シャドウ値を求め、それらの値の幅をHistWidthとする等、別の方法を用いることも可能である。
次に、HistWidthに所定の割合HistWidthRatioを掛け合わせた階調数EqHistWidthにおいて、濃度の出現頻度がほぼ一律なヒストグラムを作成する。本実施形態では、HistWidthRatioを50%としているが、これに限定するものではない。さらに、元画像の階調上のどの範囲に、EqHistWidthの範囲をあてはめるかを決定し、その最小点、最大点をそれぞれEqHistMin、EqHistMaxとする。EqHistWidthをあてはめる範囲を決めるにあたっては、元画像の階調の中心点もしくは重心点を、EqHistWidthの中央に合わせる方法や、使用する色空間の中心点を、EqHistWidthの中央に合わせる方法等がある。
ヒストグラムの平坦化を行うにあたって、変換テーブルConv3(i)(i=0,1,2,・・・,255)を作成する。
この処理は、Hist(0)から順に出現頻度を足し合わせて、その和がSum/EqHistWidthを越えたときのiをk1としたときに、Conv3(0)からConv3(k1)の値をk1+EqHistMinとする。
次に、Hist(k1+1)から順に出現頻度を足し合わせて、その和がSum/EqHistWidthを越えたときのiをk2としたとき、Conv3(k1+1)からConv3(k2)の値をk2+EqHistMinとする。同様の手順でConv2(255)まで求める。
最後に、変換テーブルConv3(i)を用いて、画像データの全画素を変換する。ヒストグラムの平坦化後の理想のヒストグラム形状は、図14の(b)に示すようになるが、実際には完全に平坦にはならず、(c)に示すようになることが通常である。
以下、第1の実施の形態と同様に画像正規化処理を行った後の画像特徴量を抽出する。
<類似画像検索処理>
本実施の形態における類似画像検索処理は、第2の実施の形態と同様の処理である。
以上説明したように、本実施形態によれば、画質の劣化、色味の変化に耐性のある画像の検索を好適に行うことができる。特に、印刷した画像データをスキャンして作成された際に色味、濃度の変化が起きた画像データ、シャドウ部、ハイライト部の階調再現が正確でなく、かつ、黒浮き、白濁りしている画像データから、元の画像データを検索することが可能となる。
尚、上記実施形態においては、自然画像検索を行う例を説明したが、本発明はCGやCAD等の人工的な画像の検索にも適応可能である。また、上記実施形態では画像特徴量として色情報を選んだが、本発明はこれに限られるものではなく、その他の画像パラメータを画像分割領域ごとに求めることで実施することも可能である。さらに、上記実施形態では、1つの特徴量での認識の例について説明したが、その他の特徴量での検索結果との論理演算を行うことにより、複数の特徴量からの高速な検索を行うことも可能である。
1つの画像に対して複数の画像特徴量を用いた検索を行う場合には、本発明で得られる類似度を1つの新たなる画像特徴量とみなし、複数のパラメータを用いた多変量解析を行い、統計的な距離尺度を用いた検索を行うことも可能である。また、上記実施形態では、類似度が所定値を越える類似画像を検索結果として得るが、類似度の高い画像から順に前もって指定された個数の画像を検索結果として出力するようにしてもよいことはいうまでもない。
以上、実施形態例を詳述したが、本発明は、例えば、システム、装置、方法、プログラム若しくは記憶媒体(記録媒体)等としての実施態様をとることが可能である。具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接あるいは遠隔から供給する。そして、そのシステムあるいは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であっても良い。
プログラムを供給するための記録媒体としては、例えば、以下のようなものがある。フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページからハードディスク等の記録媒体にダウンロードすることによっても供給できる。すなわち、ホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをダウンロードする。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布する。そして、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせる。そして、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される。その他にも、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後にも前述した実施形態の機能が実現される。すなわち、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行うことによっても前述した実施形態の機能が実現される。
以上説明したように、本発明によれば、画質の劣化、色味の変化に耐性のある画像の検索を好適に行うことができる。特に、印刷した画像データをスキャンして作成された際に色味、濃度の変化が起きた画像データ、シャドウ部、ハイライト部の階調再現が正確でなく、かつ、黒浮き、白濁りしている画像データから、元の画像データを検索することが可能となる。
本発明の一実施形態に係る画像検索装置の制御構成を示すブロック図である。 本発明の一実施形態に係る画像検索装置の機能構成を示すブロック図である。 画像蓄積部17における画像データの格納状態を説明するための図である。 本発明の一実施形態に係る画像管理DB18における画像データの格納形態を説明するための図である。 本発明の一実施形態に係る画像検索装置における画像登録処理の手順を説明するためのフローチャートである。 本発明の一実施形態に係る画像検索装置におけるハイライト・シャドウ処理を説明するための図である。 本発明の一実施形態に係る画像検索装置におけるヒストグラムの平坦化処理を説明するための図である。 本発明の一実施形態に係る画像検索装置における領域分割例を示す図である。 本発明の一実施形態における多次元特徴量空間を説明するための図である。 本発明の一実施形態におけるラベル行列を生成する際の領域順序列を説明するための図である。 本発明の一実施形態に係る画像検索装置による類似画像検索処理手順を説明するためのフローチャートである。 ステップS1105においてラベル行列を比較して類似度を求める際に用いられるラベル間のペナルティマトリックスの一例を示す図である。 本発明の一実施形態に係るマッチングによるラベル列間の距離の算出を説明する図である。 本発明の一実施形態に係る画像検索装置におけるヒストグラムの平坦化処理を説明するための図である。 本発明の一実施形態に係る画像検索装置による類似画像検索処理手順を説明するためのフローチャートである。
符号の説明
11 ユーザインタフェース部
12 画像入力部
13 画像メモリ
14 画像特徴量抽出部
15 特徴量ラベル行列化部
16 パターンマッチング部
17 画像蓄積部
18 画像管理DB

Claims (5)

  1. 画像を入力する入力手段と、
    前記入力された画像の色空間を等色色空間に変換する第1の色空間変換手段と、
    前記等色色空間に変換された画像の画像特徴量を抽出して正規化前の画像特徴量を生成する生成手段と、
    前記画像の等色色空間の各成分において、前記画像の画素値を正規化した正規化画像を生成する正規化手段と、
    前記正規化画像を複数の領域に分割し、領域ごとに特徴量を抽出して特徴量行列を生成する生成手段と、
    前記正規化前の画像特徴量と前記特徴量行列とを、前記画像と対応付けて記憶する記憶手段と、
    検索元画像を指定する指定手段と、
    前記検索元画像の正規化前の画像特徴量と前記記憶手段に記憶された前記画像の正規化前の画像特徴量とを比較し、前記検索元画像の正規化前の画像特徴量と前記画像の正規化前の画像特徴量との類似度が一定値以上であった場合、該検索元画像の正規化後の特徴量行列と該画像の正規化後の特徴量行列との類似度を判定する判定手段と、
    前記判定手段によって類似していると判定された画像を前記検索元画像の類似画像として出力する出力手段と、
    を備えることを特徴とする画像検索装置。
  2. 前記画像をRGB色空間またはCMYK色空間に変換する第2の色空間変換手段と、
    前記変換された色空間の成分ごとに、データ値の大きい方から第1の割合にある値をハイライト値として設定するハイライト値設定手段と、
    前記第1の色空間の成分ごとに、データ値の小さい方から第2の割合にある値をシャドウ値として設定するシャドウ値設定手段と、
    前記ハイライト値及び前記シャドウ値を用いて前記画像を変換する画像変換手段と
    をさらに備えることを特徴とする請求項1に記載の画像検索装置。
  3. 前記正規化手段が、等色色空間上において、画素値のシフト、画素値のスケーリング、又はヒストグラムの平坦化のうちの少なくとも1つの手法を用いて、前記画像を正規化することを特徴とする請求項1または2に記載の画像検索装置。
  4. 画像を入力する入力工程と、
    前記入力された画像の色空間を等色色空間に変換する第1の色空間変換工程と、
    前記等色色空間に変換された画像の画像特徴量を抽出して正規化前の画像特徴量を生成する生成工程と、
    前記画像の等色色空間の各成分において、前記画像の画素値を正規化した正規化画像を生成する正規化工程と、
    前記正規化画像を複数の領域に分割し、領域ごとに特徴量を抽出して特徴量行列を生成する生成工程と、
    前記正規化前の画像特徴量と前記特徴量行列とを、前記画像と対応付けて記憶する記憶工程と、
    検索元画像を指定する指定工程と、
    前記検索元画像の正規化前の画像特徴量と前記記憶工程で記憶された前記画像の正規化前の画像特徴量とを比較し、前記検索元画像の正規化前の画像特徴量と前記画像の正規化前の画像特徴量との類似度が一定値以上であった場合、該検索元画像の正規化後の特徴量行列と該画像の正規化後の特徴量行列との類似度を判定する判定工程と、
    前記判定工程によって類似していると判定された画像を前記検索元画像の類似画像として出力する出力工程と、
    を備えることを特徴とする画像検索方法。
  5. 請求項に記載の画像検索方法の各工程をコンピュータに実行させるためのプログラム。
JP2006068273A 2005-06-03 2006-03-13 画像検索装置、画像検索方法およびプログラム Expired - Fee Related JP4968882B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006068273A JP4968882B2 (ja) 2005-06-03 2006-03-13 画像検索装置、画像検索方法およびプログラム
US11/441,100 US7856144B2 (en) 2005-06-03 2006-05-26 Image retrieving apparatus, image retrieving method, program, and storage medium

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2005164865 2005-06-03
JP2005164865 2005-06-03
JP2006068273A JP4968882B2 (ja) 2005-06-03 2006-03-13 画像検索装置、画像検索方法およびプログラム

Publications (3)

Publication Number Publication Date
JP2007012024A JP2007012024A (ja) 2007-01-18
JP2007012024A5 JP2007012024A5 (ja) 2009-04-23
JP4968882B2 true JP4968882B2 (ja) 2012-07-04

Family

ID=37493676

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006068273A Expired - Fee Related JP4968882B2 (ja) 2005-06-03 2006-03-13 画像検索装置、画像検索方法およびプログラム

Country Status (2)

Country Link
US (1) US7856144B2 (ja)
JP (1) JP4968882B2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4235604B2 (ja) * 2004-11-22 2009-03-11 キヤノン株式会社 画像処理装置、画像処理方法、ならびにプログラム
KR101330637B1 (ko) * 2007-05-15 2013-11-18 삼성전자주식회사 영상 및 영상 정보 검색 장치 및 방법, 그리고 그 시스템
JP4989308B2 (ja) * 2007-05-16 2012-08-01 キヤノン株式会社 画像処理装置及び画像検索方法
US8139860B2 (en) * 2008-07-31 2012-03-20 Fuji Xerox Co., Ltd. Retrieving and sharing electronic documents using paper
JP5188334B2 (ja) 2008-09-04 2013-04-24 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
EP2420973B1 (en) * 2009-04-14 2019-11-13 Nec Corporation Image identifier extraction device
JP5071539B2 (ja) 2010-09-13 2012-11-14 コニカミノルタビジネステクノロジーズ株式会社 画像検索装置、画像読取装置、画像検索システム、データベース生成方法およびデータベース生成プログラム
CN102622366B (zh) * 2011-01-28 2014-07-30 阿里巴巴集团控股有限公司 相似图像的识别方法和装置
GB2492450B (en) 2011-06-27 2015-03-04 Ibm A method for identifying pairs of derivative and original images
CN104424230B (zh) 2013-08-26 2019-10-29 阿里巴巴集团控股有限公司 一种网络商品推荐方法及装置
CN104298749A (zh) * 2014-10-14 2015-01-21 杭州淘淘搜科技有限公司 一种图像视觉和文本语义融合商品检索方法
CN108804499B (zh) * 2018-04-03 2022-04-29 南昌奇眸科技有限公司 一种商标图像检索方法
CN111680700A (zh) * 2020-05-07 2020-09-18 中国船舶重工集团公司第七一六研究所 基于蝙蝠算法与归一化色差的遥感图像特征提取方法及装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6400853B1 (en) * 1997-03-19 2002-06-04 Canon Kabushiki Kaisha Image retrieval apparatus and method
JPH11110557A (ja) * 1997-10-02 1999-04-23 Ntt Data Corp 画像正規化方法、画像類似度判定装置及び記録媒体
JP3821558B2 (ja) * 1997-10-27 2006-09-13 日本電信電話株式会社 映像情報一斉付加方法およびその方法を記録した記録媒体
JP3720573B2 (ja) 1998-04-02 2005-11-30 キヤノン株式会社 画像検索装置及び方法
US6584223B1 (en) * 1998-04-02 2003-06-24 Canon Kabushiki Kaisha Image search apparatus and method
US6567551B2 (en) * 1998-04-27 2003-05-20 Canon Kabushiki Kaisha Image search apparatus and method, and computer readable memory
JP2001101407A (ja) * 1999-09-27 2001-04-13 Oki Data Corp 類似画像検索装置
JP3805247B2 (ja) * 2001-12-26 2006-08-02 キヤノン株式会社 画像処理装置およびその方法
JP2003346151A (ja) * 2002-05-29 2003-12-05 Fuji Photo Film Co Ltd 画像認識方法および装置並びにプログラム
JP2004021430A (ja) * 2002-06-13 2004-01-22 Fuji Xerox Co Ltd 画像検索装置、画像検索方法及び画像検索プログラム
JP2004023737A (ja) * 2002-06-20 2004-01-22 Canon Inc 画像処理装置及びその方法
JP4235604B2 (ja) * 2004-11-22 2009-03-11 キヤノン株式会社 画像処理装置、画像処理方法、ならびにプログラム

Also Published As

Publication number Publication date
JP2007012024A (ja) 2007-01-18
US7856144B2 (en) 2010-12-21
US20060274081A1 (en) 2006-12-07

Similar Documents

Publication Publication Date Title
JP4968882B2 (ja) 画像検索装置、画像検索方法およびプログラム
US7593961B2 (en) Information processing apparatus for retrieving image data similar to an entered image
US8488181B2 (en) Preserving user applied markings made to a hardcopy original document
JP4266695B2 (ja) 画像処理装置及び画像処理方法
JP5511450B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP4533273B2 (ja) 画像処理装置及び画像処理方法、プログラム
US7783108B2 (en) Document management method and apparatus
US7525694B2 (en) Image processing device, image processing method, image processing program, and recording medium
JP4448549B2 (ja) 図形要素を含む文書の比較
US8384936B2 (en) System which performs resolution-dependent vectorization of print data
US20060115153A1 (en) Page background estimation using color, texture and edge features
US9384519B1 (en) Finding similar images based on extracting keys from images
CN115812221A (zh) 图像生成及着色方法及装置
JP4632443B2 (ja) 画像処理装置及び画像処理方法並びにプログラム
JP2008113446A (ja) 画像処理装置、画像処理プログラムおよび記録媒体
JP5845797B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP4261988B2 (ja) 画像処理装置及び方法
US6360006B1 (en) Color block selection
JP2009027385A (ja) 画像処理装置とその方法およびコンピュータプログラム
JP2007109179A (ja) 画像処理装置及びその制御方法、プログラム
CN111126273B (zh) 图像处理方法、装置、电子设备以及存储介质
JP2007109177A (ja) 画像処理装置及びその制御方法、プログラム
JP2008282149A (ja) 画像処理装置、画像処理方法、画像処理プログラム
US20030237054A1 (en) Concept for automated scatter proofing of content elements used in personalized print jobs
JP4507673B2 (ja) 画像処理装置、画像処理方法、およびプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090306

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090306

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110517

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110530

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110815

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111216

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120224

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20120305

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120330

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120402

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150413

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4968882

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150413

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees