JP2007066286A6 - 画像検索装置、画像処理装置、及びそれらの方法 - Google Patents
画像検索装置、画像処理装置、及びそれらの方法 Download PDFInfo
- Publication number
- JP2007066286A6 JP2007066286A6 JP2006024785A JP2006024785A JP2007066286A6 JP 2007066286 A6 JP2007066286 A6 JP 2007066286A6 JP 2006024785 A JP2006024785 A JP 2006024785A JP 2006024785 A JP2006024785 A JP 2006024785A JP 2007066286 A6 JP2007066286 A6 JP 2007066286A6
- Authority
- JP
- Japan
- Prior art keywords
- image
- pixel density
- density distribution
- search
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 claims description 19
- 238000000034 method Methods 0.000 claims description 17
- 239000000284 extract Substances 0.000 claims description 13
- 238000003672 processing method Methods 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 5
- 230000002093 peripheral Effects 0.000 description 16
- 238000010586 diagram Methods 0.000 description 5
- 238000007639 printing Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 2
- 230000003287 optical Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000001174 ascending Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006011 modification reaction Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
Images
Abstract
【課題】 異なる画像解像度、異なるフォーマット、異なる言語の文書・画像から迅速かつ高精度に文書・画像を検索することができ、検索された文書・画像を編集して再利用することができる画像検索方法を提供することである。
【解決手段】 検索対象画像の画素密度分布を抽出し、複数の参照画像の画像データ、画素密度分布データ、及び主要領域のデータが記憶されるデータベースから、抽出される検索対象画像の画素密度分布を各々の参照画像の画素密度分布と比較し、検索対象画像とマッチングする参照画像を検索し、また、検索対象画像の主要領域のデータを抽出し、抽出される検索対象画像の主要領域データを、画素密度分布を用いて検索された参照画像の主要領域データと比較し、検索対象画像とマッチングする参照画像を検索する。
【選択図】 図2
【解決手段】 検索対象画像の画素密度分布を抽出し、複数の参照画像の画像データ、画素密度分布データ、及び主要領域のデータが記憶されるデータベースから、抽出される検索対象画像の画素密度分布を各々の参照画像の画素密度分布と比較し、検索対象画像とマッチングする参照画像を検索し、また、検索対象画像の主要領域のデータを抽出し、抽出される検索対象画像の主要領域データを、画素密度分布を用いて検索された参照画像の主要領域データと比較し、検索対象画像とマッチングする参照画像を検索する。
【選択図】 図2
Description
本発明は、画像検索装置、画像処理装置、及びそれらの方法に関し、特にデジタル複合機などの画像処理装置、及びそれに用いる画像検索装置、画像検索方法、画像処理方法、及びこれらの方法を実現するためのプログラムに関する。
文書や画像の検索処理は、電子図書館や事務処理自動化を実現するための重要な機能であり、高性能デジタル複合機などの文書画像処理システムにも使われている。例えば、鮮明でない文書や画像が入力された場合、それを高品質に出力するために、数多くの文書や画像のデータを記憶した管理サーバとデジタル複合機をネットワークで接続し、管理サーバから入力画像と一致する文書・画像を検索して出力する。
文書や画像の検索システムに、文書や画像のマッチング処理は中心的な技術である。文書や画像のマッチング処理により、文書・画像データベースから、入力された文書や画像と最も一致する文書や画像が検索される。
従来、たとえば、文書等の具体的な内容を文字認識(OCR:Optical Character Recognition)技術により識別して文書画像を検索する手法と、電子透かしを検出して文書画像を検索する手法と、文書や画像の画像特徴により文書を検索する手法とがある。
しかしながら、OCRによる文書検索は、処理時間が長い、また、異なる言語の文書について、異なるOCR装置が要求されるので、不便である。また、OCRや電子透かしによる文書検索は、OCR処理や、電子透かし検出などの処理が必要であるため、検索の処理が煩雑であり、また、検索の成功率はOCRの認識精度と電子透かしの検出精度に影響される。さらに、OCRで対応していない言語種の原稿あるいは透かしのない原稿の場合は、検索ができない。
文書や画像の画像特徴による文書の検索の場合は、検索の成功率が文書や画像の画像特徴の選択方法に大きく影響され、異なる画像解像度、異なるフォーマット、異なる言語の文書や画像について、今のところ、高性能な検索は実現されていない。
さらに、従来の文書や画像の検索システムは、データベースから検索された文書や画像などが編集可能な形式ではないので、文書、画像が検索され、出力されても、該文書・画像は、画像データを編集して、他の用途に再利用することができない。
本発明は、上記のような問題点に鑑みてなされたものであり、その目的は、異なる画像解像度、異なるフォーマット、異なる言語の文書・画像から、迅速かつ高精度に検索することができ、検索された文書・画像を編集して再利用することができる画像検索装置、画像処理装置、及びそれらの方法を提供することを目的とする。
上記課題を解決するため、本発明の画像検索装置は、所定の検索対象画像の画素密度分布を抽出する画素密度分布抽出手段と、複数の参照画像の画像データ及び当該各々の参照画像の画素密度分布データが記憶される記憶装置と、前記検索対象画像とマッチングする前記参照画像を検索する検索手段とを有し、前記検索手段は、前記画素密度分布抽出手段により抽出される前記検索対象画像の画素密度分布を、前記各々の参照画像の画素密度分布と比較し、前記検索対象画像とマッチングする少なくとも一つの参照画像を検索する。
好適に、前記検索対象画像を構成する複数の主要領域を抽出する主要領域抽出手段をさらに有し、前記各々の参照画像を構成する複数の主要領域のデータは前記記憶装置に記憶されており、前記検索手段は、前記主要領域抽出手段により抽出される前記検索対象画像の主要領域データを、前記検索対象画像の画素密度分布を用い検索された参照画像の主要領域データと比較し、前記検索対象画像とマッチングする前記参照画像を検索する。
好適に、前記検索対象画像の画像データを2値化し、前記検索対象画像の有効領域を特定する有効領域特定手段をさらに有し、前記画素密度分布抽出手段は、前記有効領域特定手段により特定された前記第1の画像の有効領域を複数の分割領域に分割し、当該各分割領域の画素密度を求め、前記検索対象画像の画素密度分布を抽出する。また、前記主要領域抽出手段は、前記有効領域特定手段により特定された前記検索対象画像の有効領域を複数の画像領域に分割し、前記複数の画像領域から前記検索対象画像の主要領域を抽出する。
上記課題を解決するため、本発明の画像検索方法は、所定の検索対象画像の画素密度分布を抽出する画素密度分布抽出工程と、複数の参照画像の画像データ及び当該各々の参照画像の画素密度分布データが記憶されるデータベースから、抽出される前記検索対象画像の画素密度分布を、前記各々の参照画像の画素密度分布と比較し、前記検索対象画像とマッチングする少なくとも一つの参照画像を検索する第1の検索工程とを有する。
好適には、前記データベースに、前記各々の参照画像を構成する複数の主要領域のデータは記憶されており、前記画像検索方法は、前記検索対象画像を構成する複数の主要領域を抽出する主要領域抽出工程と、抽出される前記検索対象画像の主要領域データを、前記検索対象画像の画素密度分布を用い検索された参照画像の主要領域データと比較し、前記検索対象画像とマッチングする前記参照画像を検索する第2の検索工程とをさらに有する。
好適には、前記検索対象画像の画像データを2値化し、前記検索対象画像の有効領域を特定する有効領域特定工程をさらに有し、前記画素密度分布抽出工程には、特定された前記検索対象画像の有効領域を複数の分割領域に分割し、当該各分割領域の画素密度を求め、前記検索対象画像の画素密度分布を抽出する。また、前記主要領域抽出工程には、前記特定された前記検索対象画像の有効領域を複数の画像領域に分割し、前記複数の画像領域から前記検索対象画像の主要領域を抽出する。
好ましくは、前記各々の複数参照画像の画素密度分布を抽出し、当該各々の参照画像を構成する複数の主要領域を抽出し、前記各々の参照画像の画像データ、当該各々の参照画像の画素密度分布データ、及び当該各々の参照画像の主要領域データを、互いに関連付けて前記データベースに記憶するデータベース構築工程をさらに有する。
上記課題を解決するため、本発明の画像処理装置は、画像を入力する画像入力手段と、複数の参照画像の画像データ及び当該各々の参照画像の画素密度分布データが記憶される記憶装置と、前記画像入力手段により入力された入力画像の画素密度分布を抽出する画素密度分布抽出手段と、前記画素密度分布抽出手段により抽出される前記入力画像の画素密度分布を、前記各々の参照画像の画素密度分布と比較し、前記入力画像とマッチングする少なくとも一つの参照画像を検索する検索手段と、前記検索手段によって前記入力画像とマッチングする前記参照画像が検索されたとき、当該検出された参照画像を出力する画像出力手段とを有する。
好適には、前記入力画像を構成する複数の主要領域を抽出する主要領域抽出手段をさらに有し、前記検索手段は、前記主要領域抽出手段により抽出される前記入力画像の主要領域データを、前記画素密度分布を用い検索された参照画像の主要領域データと比較し、前記入力画像とマッチングする前記参照画像を検索する。
好適には、前記検索手段によって前記入力画像にマッチングする前記参照画像が検索されたとき、当該検出された参照画像を表示する表示手段と、当該検出された参照画像を編集する編集手段とを有する。
上記課題を解決するため、本発明の画像処理方法は、入力画像を読み取る画像入力工程と、前記入力画像の画素密度分布を抽出する画素密度分布抽出工程と、複数の参照画像の画像データ及び当該各々の参照画像の画素密度分布データが記憶されるデータベースから、抽出される前記入力画像の画素密度分布を、前記各々の参照画像の画素密度分布と比較し、前記入力画像とマッチングする少なくとも一つの参照画像を検索する第1の検索工程と、前記入力画像とマッチングする前記参照画像が検索されたとき、当該参照画像を出力する画像出力工程とを有する。
好適には、前記画像検索方法は、前記入力画像を構成する複数の主要領域を抽出する主要領域抽出工程と、抽出される前記入力画像の主要領域データを、前記入力画像の画素密度分布を用い検索された参照画像の主要領域データと比較し、前記入力画像とマッチングする前記参照画像を検索する第2の検索工程とをさらに有する。
好適には、前記入力画像にマッチングする前記参照画像が検索されたとき、当該参照画像を表示する表示工程と、当該参照画像を編集する編集工程とを有する。
好適には、前記入力画像にマッチングする前記参照画像が検索されたとき、当該参照画像を表示する表示工程と、当該参照画像を編集する編集工程とを有する。
上記課題を解決するため、本発明の画像検索プログラムは、所定の検索対象画像の画素密度分布を抽出する画素密度分布抽出工程と、複数の参照画像の画像データ及び当該各々の参照画像の画素密度分布データが記憶されるデータベースから、抽出される前記検索対象画像の画素密度分布を、前記各々の参照画像の画素密度分布と比較し、前記検索対象画像とマッチングする少なくとも一つの参照画像を検索する第1の検索工程とをコンピュータに実行させる。
好適に、前記画像検索プログラムは、さらに、前記コンピュータに前記検索対象画像を構成する複数の主要領域を抽出する主要領域抽出工程と、抽出される前記検索対象画像の主要領域データを、前記検索対象画像の画素密度分布を用い検索された参照画像の主要領域データと比較し、前記検索対象画像とマッチングする前記参照画像を検索する第2の検索工程とを実行させる。
上記課題を解決するため、本発明の画像処理プログラムは、入力画像を読み取る画像入力工程と、複数の参照画像の画像データ及び当該各々の参照画像の画素密度分布データが記憶されるデータベースから、抽出される前記入力画像の画素密度分布を、前記各々の参照画像の画素密度分布と比較し、前記入力画像とマッチングする少なくとも一つの参照画像を検索する第1の検索工程と、前記入力画像とマッチングする前記参照画像が検索されたとき、当該参照画像を出力する画像出力工程とをコンピュータに実行させる。
好適に、前記画像処理プログラムは、さらに、前記コンピュータに前記入力画像を構成する複数の主要領域を抽出する主要領域抽出工程と、抽出される前記入力画像の主要領域データを、前記画素密度分布を用い検索された参照画像の主要領域データと比較し、前記入力画像とマッチングする前記参照画像を検索する第2の検索工程とを実行させる。
好適に、前記画像処理プログラムは、前記入力画像にマッチングする前記参照画像が検索されたとき、当該参照画像を表示する表示工程と、当該参照画像を編集する編集工程とをさらに前記コンピュータに実行させる。
本発明によれば、異なる画像解像度、異なるフォーマット、異なる言語の文書・画像から、迅速かつ高精度に画像を検索することができ、検索された文書・画像を編集して再利用することができる。
以下、本発明の実施の形態を図面に基づいて説明する。
図1は本発明の一実施例となるデジタル複合機100の構成を示すブロック図である。図1に示すデジタル複合機100、例えば、コピー機、プリンタ、ファックシミリ、スキャナなどの機能を有するデジタル複合機である。デジタル複合機100は、例えば、数多くの文書や画像のデータを記憶したデータベースから、入力画像と一致する文書・画像を検索して出力する機能を有する。これにより、入力された文書や画像が鮮明でない場合でも、高品質に文書や画像出力することができる。
図1に示すように、デジタル複合機100は、装置全体の動作を制御する制御部101、紙原稿から画像データを入力する画像入力部102、画像データを紙に印刷する画像出力部103、画像データ、文書データ、各種プログラムを格納するハードディスク104、各種処理を行うためのワークメモリ105、電子文書を管理する文書管理部106、入力された画像と関連する電子文書を検索する文書検索部107、電子文書を編集する文書編集部108、ネットワークと接続するコンピュータインタフェース(I/F)部109、ユーザの操作を受付し、操作の結果を表示するユーザインタフェース部110、及び電話回線と接続するファクシミリ部111を含む。
デジタル複合機100において、画像入力部102は原稿から画像を入力する。制御部101は、入力された画像の特徴を抽出する。そして、抽出された画像の特徴を用いて、文書検索部107は、ハードディスク104に記憶され、デジタル複合機100が動作中に、ワークメモリ105に読み込まれる、画像データ、文書データが格納されるデータベースから、入力された文書・画像とマッチングする文書・画像を検索する。マッチングする文書・画像が検索された場合、当該文書や画像を、例えば、表示装置である画像出力部103により表示される。例えば、ユーザは表示された文書の内容を確認し、必要に応じて文書内容の修正、追加及び削除などの編集作業を行う。当該文書を出力する場合は、画像出力部103は、印刷、コピーなどを行い、入力文書・画像と同じ内容の綺麗な文書・画像を出力する。
以下、本実施形態に係る画像特徴の抽出、及び画像の検索方法を説明する。
本実施形態において、文字認識(OCR:Optical Character Recognition)技術や、電子透かし検出による文書の検索手法を採用せず、事前に参照用文書や画像の画像特徴量を抽出して、当該特徴量を画像データと関連してデータベースに記憶し、検索用データベースを構築し、そして、デジタル複合機100が画像処理を行う際に、入力文書・画像の当該画像特徴量を抽出し、当該特徴量を用いてデータベースからマッチングする文書・画像を検索する。
具体的に、本実施形態において、画像の前景(foreground)の画素密度分布の特徴データ(foreground pixel distribution)を抽出して、当該画像の局部的な特徴量(local feature)として用い、当該画像を構成する複数の主要ブロック(key block)を抽出し、その特徴量を当該画像の全体特徴量(global feature)として用い、画像の画素密度分布の特徴量、又は/及び、画像の主要ブロックの特徴量により、データベースからマッチングする文書・画像を検索する。ここで、主要ブロック(key block)は、画像に目立つ領域を言う。
次に、本実施形態に係る画像特徴抽出方法を説明する。
図2は本実施形態に係る画素密度分布特徴を抽出する方法を示すフローチャートである。
ステップS101において、入力画像データの2値化処理を行う。
画像入力部102により紙原稿から入力された原始の画像データは、様々なフォーマットを有し、また、ひずみ角度(skew angle)やスキャンノイズなどを含む可能性があるので、入力画像データの2値化処理により、入力画像データをデジタル化し、ひずみやノイズを除去し、異なるフォーマットの文書・画像に対応できるようになる。また、この2値化処理により、画像の前景が抽出されやすくなる。
2値化の方法として、例えば、画素の値は0〜255にあるグレー画像として、ある閾値(Th、0<Th<255)を用いて、画素値がThより小さい画素を黒画素とし、それ以外を白画素とする。
ステップS102において、入力画像データの2値化処理を行った後、入力画像の印刷コア(print-core)を求める。
印刷コアとは画像の有効領域であり、印刷コアの範囲内に、画像の特徴量を抽出する。また、異なる画像を処理する際に、印刷コアは均一な参照フレームとしての役割がある。
印刷コアの位置は、2値化後の画像を横と縦方向へ投影して、その投影の範囲から確定する。また、印刷コアの位置を確定すると同時に、2値化後の画像の横と縦方向の投影の特徴により、文書が横書き/縦書きの方向(以下、文書主方向と呼ぶ)を判別することができる。例えば、横書きの文書の場合、横方向への投影の変動は縦方向より大きい。縦書きの場合は、縦方向への投影の変動は横方向より大きい。
図3は、本実施形態における印刷コアを確定する処理を示す図である。図3は、入力画像を2値化処理した後の画像であり、301は画像入力部102により読み取った紙原稿の全範囲を示し、302は、読み取った紙原稿の全範囲のうち、印刷対象となる画像の有効領域、すなわち、印刷コアを示す。印刷コア302から、入力画像の特徴量を抽出する。
再び図2を参照する。
ステップS103において、入力画像データの2値化処理により得られた黒画素の密度分布特徴DDF(Density Distribution Feature)を求める。
図4は、本実施形態に係る黒画素の密度分布特徴を抽出する方法を示す図である。
まず、印刷コア302をM×Nの領域に分割する。例えば、図4に示すように、横M、縦N本の線で印刷コア302をm×nの領域に分割する。
次に、各分割領域の黒画素数si(i=0, …,m×n−1)を集計する。ここで、iは分割領域のインデックスである。
次に、各分割領域の黒画素数を正規化する。各分割領域黒画素siと最大黒画素Sの比riを求める。
横書きの文書画像の場合、
同様に、ステップS121において、入力画像データの2値化処理を行う。
ステップS122において、入力画像の印刷コアを確定する。
ステップS123において、入力画像の主要ブロック特徴(KBF:key block feature)を求める。
例えば、図3を参照すると、図3に示す画像には、所定のイメージが表現される画像領域(ブロック)(2台の車、グラフ、多くの文字のイメージなど、)は複数存在する。図5に示す手順に従って、その中の主要なブロックの特徴量を抽出する。
まず、2値化処理を行い、印刷コア302を確定した後、印刷コア302に対して、文書主方向の隣接する位置の文字の間の空白を黒で埋めるような処理を施す。元々、入力画像において、黒画素が分散して分布しており、連続しない。即ち、文書主方向の隣接する位置の文字の間に、空白がある。隣接する位置の文字の間の空白を黒で埋めると、一行/列の文字の2値化の黒画素が互いにつながり、分散している黒スポットから一定の長さを有する黒線になる。
次に、得られた黒線の長さと黒線間の間隔の疎密により、印刷コアを複数の画像ブロックに分割する。
次に、各画像ブロック内の黒線の長さの平均値を求める。例えば、この平均値の上位3つの画像ブロックを、主要ブロックKB1,KB2,KB3として選択する。
図6、図7、図8は、以上のように得られた主要ブロックKB1,KB2,KB3を示す図である。図6、図7、図8に,401,402,403はそれぞれ主要ブロックKB1,KB2,KB3を示す。
図6、図7、図8において、上記のように、隣接する位置の黒画素の空白を黒で埋め、一定の長さを有する黒線になり、また、これら黒線の長さと黒線間の間隔の疎密は、印刷コアを画像ブロックに分割する参考基準となる。
また、図6、図7、図8の左側に、主要ブロックKB1,KB2,KB3の横方向への投影が示されている。画像ブロックのこのような投影から、当該画像ブロックにおける黒線の長さと黒線間の間隔の疎密の情報が得られる。
図9は、入力画像上に主要ブロックKB1,KB2,KB3の相対関係を示す。図9に示すように、401,402,403に示された主要ブロックKB1,KB2,KB3はそれぞれ一番目、二番目、三番目大きいな主要ブロックである。
主要ブロックKB1,KB2,KB3の重心をc1,c2,c3とし、下記の各指標を求める。
そして、主要ブロック特徴KBFを下記の式で表す。
次に、画素密度分布の特徴データ、又は/及び、主要ブロックの特徴データを用い、データベースから入力画像とマッチングする文書・画像を検索する方法を説明する。
次に、本実施形態に係る画像検索方法を説明する。
本実施形態に係る画像検索方法を実行することに先立って、文書・画像データベースを構築する。例えば、10,000以上の文書・画像のデータを含む大規模なデータベースを構築する。これら大量の文書・画像のデータは、例えば、
異なる画像解像度(例えば、100dpi、200dpi、400dpiなど)、異なるフォーマット(例えば、1ビット、8ビット、24ビットなど)、異なる言語(例えば、中国語、日本語、英語など)の文字の文書・画像からなる。これらの大量の文書・画像の各々について、上記のような画像特徴量抽出処理が行われ、各文書や画像の画素密度分布の特徴データ、及び主要ブロックの特徴データが抽出され、文書・画像のデータと関連付けられてデータベースに記憶される。このデータベースは、ハードディスク104に記憶されており、デジタル複合機100が動作中に、ワークメモリ105に読み込まれ、文書管理部106により管理される。
異なる画像解像度(例えば、100dpi、200dpi、400dpiなど)、異なるフォーマット(例えば、1ビット、8ビット、24ビットなど)、異なる言語(例えば、中国語、日本語、英語など)の文字の文書・画像からなる。これらの大量の文書・画像の各々について、上記のような画像特徴量抽出処理が行われ、各文書や画像の画素密度分布の特徴データ、及び主要ブロックの特徴データが抽出され、文書・画像のデータと関連付けられてデータベースに記憶される。このデータベースは、ハードディスク104に記憶されており、デジタル複合機100が動作中に、ワークメモリ105に読み込まれ、文書管理部106により管理される。
次に、入力画像をQとし、入力画像の画素密度分布特徴をQDDF、主要ブロックの特徴データをQKBFとし、文書管理部106はK個の文書・画像データ(データベース)を管理しており、そのうちk番目(k=1,…,K)の文書・画像データの画素密度分布特徴と主要ブロックの特徴データをそれぞれDDDF(k)とDKBF(k)として、本実施形態の検索方法を説明する。
図10は本実施形態に係る文書・画像を検索する方法を説明するフローチャートである。
ステップS131において、文章検索部107は、図2に示す手順で抽出された入力画像の密度分布特徴DDFを用い、第1段階の検索を行い、密度分布特徴DDFで入力文書・画像とマッチングする文書・画像をデータベースから検索する。
具体的に、まず、入力画像の画素密度分布特徴QDDFとデータベースに記憶されている文書・画像データの画素密度分布特徴DDDF(k)(k=1,…,K)の二つの距離値DdiskとDdifkを次のように計算する。
ステップS132において、文章検索部107は、図5に示す手順で抽出された入力画像の主要ブロック特徴KBFを用い、第2段階の検索を行う。
具体的に、まず、第1段階で得られた10個の候補の主要ブロックの特徴データをDKBF(i)(i=0,…,9)とする。QDDFとDKBF(i) (i=0,…,9)の二つの指標sciとpciを求めて,信頼度数Rkbfiを計算する。
図11と図12は、以上に説明した本実施形態の画像検索方法を用いて行った実験結果を示す表である。図11と図12の実験には、10,385個の文書・画像のデータを含むデータベースが構築され、Pentium(登録商標)1.7 GHzのCPU、256MBのメモリを有するパソナル・コンピュータを用いた。図11の実験には、画素密度分布の特徴データを用いて一致度の高い5つの画像を検索した。図12の実験には、画素密度分布の特徴データと主要ブロックの特徴データ両方を用いて一致度の高い5つの画像を検索した。画像処理には約1.8秒掛かった、検索処理に約1.6秒掛かった。
図11と図12に示すように、本実施形態の検索方法により、異なる画像解像度、異なるフォーマット、異なる言語の文書・画像について、迅速・高精度な画像検索を実現した。
図13は本実施形態のデジタル複合機100の画像処理動作を示すフローチャートである。
ステップS201において、画像入力部102、原稿から画像を入力する。
ステップS202において、制御部101は入力された画像の特徴を抽出する。
ステップS203において、文書検索部107は、抽出された画像の特徴を用いて、文書管理部106に管理されるデータベースから入力画像とマッチングする文書画像を検索する。
ステップS204において、制御部101は、マッチングする文書画像が検索されたかどうかを判断する。
検索されなかった場合は画像処理を終了する。
検索された場合は、ステップS205へ進む。
ステップS205において、検索された入力画像とマッチングする文書データを表示する。ユーザは表示された文書の内容を確認できる。
ステップS206においえ、表示された文書を編集するかどうかのユーザの指示を待つ。ユーザは表示された文書を編集するかどうかを選択できる。編集が選択されたとき、ステップS207へ進む。編集が選択されなかったとき、ステップS208へ進む。
ステップS207において、ユーザが文書データに対し、内容の修正、追加及び削除などの編集作業を行う。
ステップS208において、文書データの出力をするかどうかのユーザの指示を待つ。出力が選択されたとき、ステップS209へ進む。出力が選択されなかったとき、終了する。
ステップS209において、出力の各種設定が行われて、文書データは画像出力部によって出力される。
上記の効果に加えて、本実施形態の画像処理装置により、検索された文書・画像を編集して再利用することができる。
本実施形態にいて、画素密度分布と主要ブロックの相対位置とサイズを画像特徴量とする。この2つの特徴量は、画質の劣化により変化しにくい。
特に、画素密度分布の処理がシンプルであり、計算が少なく、抽出が効率、処理時間が短い。また、主要ブロックの特徴量は、画像変形により変動しにくい。
ゆえに、本実施形態により、異なる画像解像度、異なるフォーマット、異なる言語の文書・画像について、迅速かつ高精度に画像を検索することができ、また、検索された文書・画像を編集して再利用することができる。
以上の実施例は、本発明を説明するために用いられたものであり、本発明を制限するものではない。本発明を逸脱しない範囲内で当業者が本発明に加えた如何なる変更、改変、修正は、本発明の範囲に属する。
100 デジタル複合機
101 制御部
102 画像入力部
103 画像出力部
104 ハードディスク
105 ワークメモリ
106 文書管理部
107 文書検索部
108 文書編集部
109 コンピュータインタフェース(I/F)部
110 ユーザインタフェース部
111 ファクシミリ部
101 制御部
102 画像入力部
103 画像出力部
104 ハードディスク
105 ワークメモリ
106 文書管理部
107 文書検索部
108 文書編集部
109 コンピュータインタフェース(I/F)部
110 ユーザインタフェース部
111 ファクシミリ部
Claims (31)
- 所定の検索対象画像の画素密度分布を抽出する画素密度分布抽出手段と、
複数の参照画像の画像データ及び当該各々の参照画像の画素密度分布データが記憶される記憶装置と、
前記検索対象画像とマッチングする前記参照画像を検索する検索手段と
を有し、
前記検索手段は、前記画素密度分布抽出手段により抽出される前記検索対象画像の画素密度分布を、前記各々の参照画像の画素密度分布と比較し、前記検索対象画像とマッチングする少なくとも一つの参照画像を検索する
ことを特徴とする画像検索装置。 - 前記検索対象画像を構成する複数の主要領域を抽出する主要領域抽出手段をさらに有し、
前記各々の参照画像を構成する複数の主要領域のデータは前記記憶装置に記憶されており、
前記検索手段は、前記主要領域抽出手段により抽出される前記検索対象画像の主要領域データを、前記検索対象画像の画素密度分布を用い検索された参照画像の主要領域データと比較し、前記検索対象画像とマッチングする少なくとも一つの参照画像を検索する
ことを特徴とする請求項1に記載の画像検索装置。 - 前記検索対象画像の画像データを2値化し、前記検索対象画像の有効領域を特定する有効領域特定手段をさらに有し、
前記画素密度分布抽出手段は、前記有効領域特定手段により特定された前記第1の画像の有効領域を複数の分割領域に分割し、当該各分割領域の画素密度を求め、前記検索対象画像の画素密度分布を抽出する
ことを特徴とする請求項1に記載の画像検索装置。 - 前記検索対象画像の画像データを2値化し、前記検索対象画像の有効領域を特定する有効領域特定手段をさらに有し、
前記主要領域抽出手段は、前記有効領域特定手段により特定された前記検索対象画像の有効領域を複数の画像領域に分割し、前記複数の画像領域から前記検索対象画像の主要領域を抽出する
ことを特徴とする請求項2に記載の画像検索装置。 - 所定の検索対象画像の画素密度分布を抽出する画素密度分布抽出工程と、
複数の参照画像の画像データ及び当該各々の参照画像の画素密度分布データが記憶されるデータベースから、抽出される前記検索対象画像の画素密度分布を、前記各々の参照画像の画素密度分布と比較し、前記検索対象画像とマッチングする参照画像を検索する第1の検索工程を
有する
ことを特徴とする画像検索方法。 - 前記データベースには、前記各々の参照画像を構成する複数の主要領域のデータは記憶されており、
前記画像検索方法は、
前記検索対象画像を構成する複数の主要領域を抽出する主要領域抽出工程と、
抽出される前記検索対象画像の主要領域データを、前記検索対象画像の画素密度分布を用い検索された参照画像の主要領域データと比較し、前記検索対象画像とマッチングする参照画像を検索する第2の検索工程と
をさらに有する
ことを特徴とする請求項5に記載の画像検索方法。 - 前記検索対象画像の画像データを2値化し、前記検索対象画像の有効領域を特定する有効領域特定工程をさらに有し、
前記画素密度分布抽出工程には、特定された前記検索対象画像の有効領域を複数の分割領域に分割し、当該各分割領域の画素密度を求め、前記検索対象画像の画素密度分布を抽出する
ことを特徴とする請求項5に記載の画像検索方法。 - 前記検索対象画像の画像データを2値化し、前記検索対象画像の有効領域を特定する有効領域特定工程をさらに有し、
前記主要領域抽出工程には、前記特定された前記検索対象画像の有効領域を複数の画像領域に分割し、前記複数の画像領域から前記検索対象画像の主要領域を抽出する
ことを特徴とする請求項6に記載の画像検索方法。 - 前記各々の複数参照画像の画素密度分布を抽出し、当該各々の参照画像を構成する複数の主要領域を抽出し、前記各々の参照画像の画像データ、当該各々の参照画像の画素密度分布データ、及び当該各々の参照画像の主要領域データを、互いに関連付けて前記データベースに記憶するデータベース構築工程をさらに有する
ことを特徴とする請求項5に記載の画像検索方法。 - 画像を入力する画像入力手段と、
複数の参照画像の画像データ及び当該各々の参照画像の画素密度分布データが記憶される記憶装置と、
前記画像入力手段により入力された入力画像の画素密度分布を抽出する画素密度分布抽出手段と、
前記画素密度分布抽出手段により抽出される前記入力画像の画素密度分布を、前記各々の参照画像の画素密度分布と比較し、前記入力画像とマッチングする少なくとも一つの前記参照画像を検索する検索手段と、
前記検索手段によって前記入力画像とマッチングする前記参照画像が検索されたとき、当該検出された参照画像を出力する画像出力手段と
を有する
ことを特徴とする画像処理装置。 - 前記入力画像を構成する複数の主要領域を抽出する主要領域抽出手段をさらに有し、
前記各々の参照画像を構成する複数の主要領域のデータは前記記憶装置に記憶されており、
前記検索手段は、前記主要領域抽出手段により抽出される前記入力画像の主要領域データを、前記入力画像の画素密度分布を用い検索された参照画像の主要領域データと比較し、前記入力画像とマッチングする参照画像を検索する
ことを特徴とする請求項10に記載の画像処理装置。 - 前記入力画像の画像データを2値化し、前記入力画像の有効領域を特定する有効領域特定手段をさらに有し、
前記画素密度分布抽出手段は、前記有効領域特定手段により特定された前記入力画像の有効領域を複数の分割領域に分割し、当該各分割領域の画素密度を求め、前記入力画像の画素密度分布を抽出する
ことを特徴とする請求項10に記載の画像処理装置。 - 前記入力画像の画像データを2値化し、前記入力画像の有効領域を特定する有効領域特定手段をさらに有し、
前記主要領域抽出手段は、前記有効領域特定手段により特定された前記入力画像の有効領域を複数の画像領域に分割し、前記複数の画像領域から前記入力画像の主要領域を抽出する
ことを特徴とする請求項11に記載の画像処理装置。 - 前記検索手段によって前記入力画像とマッチングする前記参照画像が検索されたとき、当該検出された参照画像を表示する表示手段と、
当該検出された参照画像を編集する編集手段と
を有する
ことを特徴とする請求項10記載の画像処理装置。 - 入力画像を読み取る画像入力工程と、
前記入力画像の画素密度分布を抽出する画素密度分布抽出工程と、
複数の参照画像の画像データ及び当該各々の参照画像の画素密度分布データが記憶されるデータベースから、抽出される前記入力画像の画素密度分布を、前記各々の参照画像の画素密度分布と比較し、前記入力画像とマッチングする少なくとも一つの参照画像を検索する第1の検索工程と、
前記入力画像とマッチングする前記参照画像が検索されたとき、当該参照画像を出力する画像出力工程と
を有し、
ことを特徴とする画像処理方法。 - 前記データベースには、前記各々の参照画像を構成する複数の主要領域のデータは記憶されており、
前記画像検索方法は、
前記入力画像を構成する複数の主要領域を抽出する主要領域抽出工程と、
抽出される前記入力画像の主要領域データを、前記入力画像の画素密度分布を用い検索された参照画像の主要領域データと比較し、前記入力画像とマッチングする参照画像を検索する第2の検索工程と
をさらに有する
ことを特徴とする請求項15に記載の画像処理方法。 - 前記入力画像の画像データを2値化し、前記入力画像の有効領域を特定する有効領域特定工程をさらに有し、
前記画素密度分布抽出工程には、特定された前記入力画像の有効領域を複数の分割領域に分割し、当該各分割領域の画素密度を求め、前記入力画像の画素密度分布を抽出する
ことを特徴とする請求項15に記載の画像処理方法。 - 前記入力画像の画像データを2値化し、前記入力画像の有効領域を特定する有効領域特定工程をさらに有し、
前記主要領域抽出工程には、前記特定された前記入力画像の有効領域を複数の画像領域に分割し、前記複数の画像領域から前記入力画像の主要領域を抽出する
ことを特徴とする請求項16に記載の画像処理方法。 - 前記各々の複数参照画像の画素密度分布を抽出し、当該各々の参照画像を構成する複数の主要領域を抽出し、前記各々の参照画像の画像データ、当該各々の参照画像の画素密度分布データ、及び当該各々の参照画像の主要領域データを、互いに関連付けて前記データベースに記憶するデータベース構築工程をさらに有する
ことを特徴とする請求項15に記載の画像処理方法。 - 前記入力画像にマッチングする前記参照画像が検索されたとき、当該参照画像を表示する表示工程と、
当該参照画像を編集する編集工程と
を有する
ことを特徴とする請求項15記載の画像処理方法。 - 所定の検索対象画像の画素密度分布を抽出する画素密度分布抽出工程と、
複数の参照画像の画像データ及び当該各々の参照画像の画素密度分布データが記憶されるデータベースから、抽出される前記検索対象画像の画素密度分布を、前記各々の参照画像の画素密度分布と比較し、前記検索対象画像とマッチングする少なくとも一つの参照画像を検索する第1の検索工程と
をコンピュータに実行させるための画像検索プログラム。 - 前記データベースには、前記各々の参照画像を構成する複数の主要領域のデータは記憶されており、
前記画像検索プログラムは、さらに、前記コンピュータに
前記検索対象画像を構成する複数の主要領域を抽出する主要領域抽出工程と、
抽出される前記検索対象画像の主要領域データを、前記検索対象画像の画素密度分布を用い検索された参照画像の主要領域データと比較し、前記検索対象画像とマッチングする参照画像を検索する第2の検索工程と
を実行させる
ことを特徴とする請求項21に記載の画像検索プログラム。 - 前記画像検索プログラムは、さらに、前記コンピュータに前記検索対象画像の画像データを2値化し、前記検索対象画像の有効領域を特定する有効領域特定工程を実行させ、
前記画素密度分布抽出工程には、特定された前記検索対象画像の有効領域を複数の分割領域に分割し、当該各分割領域の画素密度を求め、前記検索対象画像の画素密度分布を抽出する
ことを特徴とする請求項21に記載の画像検索プログラム。 - 前記画像検索プログラムは、前記検索対象画像の画像データを2値化し、前記検索対象画像の有効領域を特定する有効領域特定工程を前記コンピュータにさらに実行させ、
前記主要領域抽出工程には、前記特定された前記検索対象画像の有効領域を複数の画像領域に分割し、前記複数の画像領域から前記検索対象画像の主要領域を抽出する
ことを特徴とする請求項22に記載の画像検索プログラム。 - 前記各々の複数参照画像の画素密度分布を抽出し、当該各々の参照画像を構成する複数の主要領域を抽出し、前記各々の参照画像の画像データ、当該各々の参照画像の画素密度分布データ、及び当該各々の参照画像の主要領域データを、互いに関連付けて前記データベースに記憶するデータベース構築工程を前記コンピュータにさらに実行させる
ことを特徴とする請求項21に記載の画像検索プログラム。 - 入力画像を読み取る画像入力工程と、
前記入力画像の画素密度分布を抽出する画素密度分布抽出工程と、
複数の参照画像の画像データ及び当該各々の参照画像の画素密度分布データが記憶されるデータベースから、抽出される前記入力画像の画素密度分布を、前記各々の参照画像の画素密度分布と比較し、前記入力画像とマッチングする少なくとも一つの参照画像を検索する第1の検索工程と、
前記入力画像とマッチングする前記参照画像が検索されたとき、当該参照画像を出力する画像出力工程と
をコンピュータに実行させるための画像処理プログラム。 - 前記データベースには、前記各々の参照画像を構成する複数の主要領域のデータは記憶されており、
前記画像処理プログラムは、さらに、前記コンピュータに
前記入力画像を構成する複数の主要領域を抽出する主要領域抽出工程と、
抽出される前記入力画像の主要領域データを、前記入力画像の画素密度分布を用い検索された参照画像の主要領域データと比較し、前記入力画像とマッチングする前記参照画像を検索する第2の検索工程と
を実行させる
ことを特徴とする請求項26に記載の画像処理プログラム。 - 前記画像処理プログラムは、さらに、前記コンピュータに前記入力画像の画像データを2値化し、前記入力画像の有効領域を特定する有効領域特定工程を実行させ、
前記画素密度分布抽出工程には、特定された前記入力画像の有効領域を複数の分割領域に分割し、当該各分割領域の画素密度を求め、前記入力画像の画素密度分布を抽出する
ことを特徴とする請求項26に記載の画像処理プログラム。 - 前記画像処理プログラムは、さらに、前記コンピュータに前記入力画像の画像データを2値化し、前記入力画像の有効領域を特定する有効領域特定工程を実行させ、
前記主要領域抽出工程には、前記特定された前記入力画像の有効領域を複数の画像領域に分割し、前記複数の画像領域から前記入力画像の主要領域を抽出する
ことを特徴とする請求項27に記載の画像処理プログラム。 - 前記各々の複数参照画像の画素密度分布を抽出し、当該各々の参照画像を構成する複数の主要領域を抽出し、前記各々の参照画像の画像データ、当該各々の参照画像の画素密度分布データ、及び当該各々の参照画像の主要領域データを、互いに関連付けて前記データベースに記憶するデータベース構築工程を前記コンピュータにさらに実行させる
ことを特徴とする請求項26に記載の画像処理プログラム。 - 前記画像処理プログラムは、
前記入力画像にマッチングする前記参照画像が検索されたとき、当該参照画像を表示する表示工程と、
当該参照画像を編集する編集工程と
をさらに前記コンピュータに実行させる
ことを特徴とする請求項26記載の画像処理プログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200510092330.9 | 2005-08-26 | ||
CN 200510092330 CN1921535A (zh) | 2005-08-26 | 2005-08-26 | 图像检索装置,图像处理装置,图像检索方法,以及图像处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007066286A JP2007066286A (ja) | 2007-03-15 |
JP2007066286A6 true JP2007066286A6 (ja) | 2007-07-05 |
Family
ID=37779089
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006024785A Pending JP2007066286A (ja) | 2005-08-26 | 2006-02-01 | 画像検索装置、画像処理装置、及びそれらの方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2007066286A (ja) |
CN (1) | CN1921535A (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7882177B2 (en) * | 2007-08-06 | 2011-02-01 | Yahoo! Inc. | Employing pixel density to detect a spam image |
KR20090067913A (ko) * | 2007-12-21 | 2009-06-25 | 삼성디지털이미징 주식회사 | 영상 트리밍 장치 및 방법 |
EP2323081A1 (en) | 2008-08-05 | 2011-05-18 | Fujitsu Limited | Method of creating estimation model by means of multiple regression analysis, creation system and creation program |
CN102685072B (zh) * | 2011-03-11 | 2016-09-14 | 腾讯科技(深圳)有限公司 | 上传图片的方法和终端设备 |
-
2005
- 2005-08-26 CN CN 200510092330 patent/CN1921535A/zh active Pending
-
2006
- 2006-02-01 JP JP2006024785A patent/JP2007066286A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4533273B2 (ja) | 画像処理装置及び画像処理方法、プログラム | |
CN100397864C (zh) | 图像处理系统及图像处理方法 | |
JP4393161B2 (ja) | 画像処理装置及び画像処理方法 | |
US7596271B2 (en) | Image processing system and image processing method | |
JP2004265384A (ja) | 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体 | |
JP4785655B2 (ja) | 文書処理装置及び文書処理方法 | |
JP2007164648A (ja) | 類似画像検索装置、類似画像検索方法、プログラム及び情報記録媒体 | |
US20070133031A1 (en) | Image processing apparatus and image processing method | |
CN112949471A (zh) | 基于国产cpu的电子公文识别复现方法及系统 | |
JP4338189B2 (ja) | 画像処理システム及び画像処理方法 | |
JP4261988B2 (ja) | 画像処理装置及び方法 | |
JP2007066286A6 (ja) | 画像検索装置、画像処理装置、及びそれらの方法 | |
JP2007066286A (ja) | 画像検索装置、画像処理装置、及びそれらの方法 | |
CN115828874A (zh) | 基于图像识别技术的行业表格数字化处理方法 | |
JP2008129793A (ja) | 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体 | |
JP2008108114A (ja) | 文書処理装置および文書処理方法 | |
JP4780184B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2007129557A (ja) | 画像処理システム | |
JP2005208977A (ja) | 文書ファイリング装置および文書ファイリング方法 | |
JP5476884B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2009182530A (ja) | 業務処理遂行支援装置 | |
JP2006134042A (ja) | 画像処理システム | |
JP2004334340A (ja) | 画像処理方法及び装置 | |
WO2023062799A1 (ja) | 情報処理システム、原稿種識別方法、モデル生成方法及びプログラム | |
JP2007334437A (ja) | 画像処理装置及び方法、並びにプログラム及び記憶媒体 |