JP2007299210A - 画像処理装置、画像形成装置、画像読取装置及び画像処理方法 - Google Patents

画像処理装置、画像形成装置、画像読取装置及び画像処理方法 Download PDF

Info

Publication number
JP2007299210A
JP2007299210A JP2006126761A JP2006126761A JP2007299210A JP 2007299210 A JP2007299210 A JP 2007299210A JP 2006126761 A JP2006126761 A JP 2006126761A JP 2006126761 A JP2006126761 A JP 2006126761A JP 2007299210 A JP2007299210 A JP 2007299210A
Authority
JP
Japan
Prior art keywords
image
pixel
label
pixels
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006126761A
Other languages
English (en)
Inventor
Masakazu Ohira
雅和 大平
Atsutoshi Morimoto
淳寿 森本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2006126761A priority Critical patent/JP2007299210A/ja
Priority to US11/790,646 priority patent/US8107734B2/en
Priority to CNB200710100922XA priority patent/CN100533467C/zh
Publication of JP2007299210A publication Critical patent/JP2007299210A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/1801Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
    • G06V30/18076Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by analysing connectivity, e.g. edge linking, connected component analysis or slices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

【課題】従来に比べて必要なメモリ容量を低減することができ、ハードウエアで実現可能であって、高速に画像の類似度を判定することができる画像処理装置、画像形成装置、画像読取装置、及び画像処理方法を提供する。
【解決手段】特徴点算出部241は、二値化処理のための閾値の算出及び画像の二値化処理を画素ブロック毎に並行して行い、二値画像に基づいてラベリング処理及び連結領域の特徴点抽出を注目ライン毎に並行して行い、抽出した特徴点を特徴量算出部242へ出力する。特徴量算出部242は、所定の不変量を算出して特徴量であるハッシュ値を算出する。投票処理部243は、ハッシュ値に基づいてハッシュテーブルを検索し、ハッシュ値に登録されているインデックスの原稿について投票する。類似度判定処理部244は、投票数を予め定めた閾値と比較し、投票数が閾値以上であれば、入力画像が予め登録された原稿の画像に類似すると判定する。
【選択図】図2

Description

本発明は、取得した画像から得られる特徴量に基づいて、予め登録された画像との類似度を判定する画像処理装置、該画像処理装置を備える画像形成装置及び画像読取装置、並びに画像処理方法に関する。
スキャナで原稿を読み取り、原稿を読み取って得られた画像データを予め登録されている画像データと照合して、画像の類似度を判定する画像処理としては、例えば、OCR(Optical Character Reader)で画像からキーワードを抽出し、抽出したキーワードにより画像の類似度を判定する方法、類似度の判定を行う画像を罫線のある帳票画像に限定して、罫線の特徴を抽出して画像の類似度を判定する方法などが提案されている。
しかし、これらの判定処理において、画像の類似度を精度良く判定するためには、読み取る原稿の傾きなどを事前に補正(スキュー補正)しておく必要があり、スキュー補正を行うことができない場合には、画像の類似度を精度良く判定できないという問題があった。また、画像の類似度を判定する場合の処理が複雑であるため、ハードウエアにより実現することが困難であった。類似度の判定処理を単純なアルゴリズムで実現する場合には、ハードウエアにより実現することが容易になるものの、判定精度を向上させることができず、また、スキュー又はノイズなどの外乱に対する耐性が不十分であるという問題があった。
そこで、例えば、文書画像中の連結成分の重心を算出し、算出した重心を連結成分の特徴点として抽出し、抽出した特徴点に基づいて、画像の回転又は歪みに対する不変量を算出して画像の類似度を判定することにより、対象となる画像が傾いた場合、又は予め登録された画像に含まれない書込みなどがある場合でも、画像の類似度を精度良く判定することができる方法が提案されている(非特許文献1)。
また、画像図形の重心を算出する方法として、対象とする図形を囲む外接長方形領域を所定の画素マトリクスを1単位とした複数のブロックに分割し、ブロックごとに相対原点及び相対座標を定義し、所定の処理をブロックごとに行うことにより重心座標の算出を高速に行うことができる画像処理方法が提案されている(特許文献1参照)。
また、画像中の特定パターンの重心を算出する装置として、特定対象物の外接四角形を設定し、設定した特定対象物の領域及び重心値を並行して抽出することにより、重心算出を高速に処理することができる装置が提案されている(特許文献2参照)。
中居 友弘、他3名、「複比とハッシュに基づく文書画像検索」、電子情報通信学会技術研究報告、2005年3月 特開昭61−260370号公報 特開平10−79035号公報
しかしながら、非特許文献1の方法にあっては、連結成分の重心を算出する場合、1頁分の画像データを読み取って記憶し、記憶された1頁分の画像データを二値化処理し、各画素がどの連結成分に含まれるのかラベリング処理を行い、連結成分ごとに連結成分に含まれる画素の座標値を累積して加算し、累積加算された座標値を連結成分に含まれる画素数で除算して連結成分の重心を算出する。このため、重心を算出するためには、1頁分の画像データを記憶しておくことが必要となり、例えば、画像処理をASICなどで実現する場合、メモリ容量が大きくなるとゲート数も増大するため、回路規模が大きくなり、現実的な規模でのハードウエア化が困難になるとともに、コストアップを招く。
また、特許文献1の方法にあっては、画像データをスキャナから取得する場合、画像データがライン単位でスキャナから入力されるため、ブロック単位で処理を行う際には、ブロックに含まれるライン数に応じたラインバッファが必要となる。このため、比較的大きなブロックを用いて処理を行う場合には、大量のメモリが必要になるという問題がある。また、特許文献2の装置にあっては、重心を算出することができる連結成分の形状が限定されるという問題がある。
本発明は、斯かる事情に鑑みてなされたものであり、所定の走査方向に沿った複数のラインに含まれる各画素のラベルを記憶し、前記複数のラインのうちの注目ラインに含まれる画素に、該注目ラインの1つ前に走査されたラインに含まれる画素に付されたラベルと同一ラベルが付されているか否かを判定し、同一ラベルが付されていないと判定された場合、該ラベルが付された画素を連結した連結領域の特徴点を抽出することにより、ラベル付けと特徴点の抽出とを同時に行い、従来に比べて必要なメモリ容量を低減することができ、ハードウエアで実現可能であって、高速に画像の類似度を判定することができる画像処理装置、該画像処理装置を備える画像形成装置及び画像読取装置、並びに画像処理方法を提供することを目的とする。
また、本発明の他の目的は、同一ラベルが付されたと判定された場合、該ラベルが付された画素の座標値を累積加算する加算手段と、各ラベルに関連付けて該ラベルが付された画素の累積加算された座標値を記憶する手段とを備え、記憶された座標値及び前記ラベルが付された画素を連結した連結領域に含まれる画素数に基づいて、該連結領域の特徴点を抽出することにより、ラベル付けと特徴点の抽出とを同時に行い、従来に比べて必要なメモリ容量を低減することができ、ハードウエアで実現可能であって、高速にかつ精度良く画像の類似度を判定することができる画像処理装置、該画像処理装置を備える画像形成装置及び画像読取装置を提供することにある。
また、本発明の他の目的は、画像の複数の画素で構成される画素ブロック毎に、該画素ブロックに含まれる画素が有する輝度値又は明度値に基づいて閾値を算出し、算出された閾値に基づいて、該閾値が算出された画素ブロックの画像を二値化する二値化手段を備えることにより、ハードウエア化を実現することができるとともに、二値化の閾値を動的に求め、連結領域を安定に特定して精度良く画像の類似度を判定することができる画像処理装置、該画像処理装置を備える画像形成装置及び画像読取装置を提供することにある。
また、本発明の他の目的は、画素ブロック内の画素を所定の走査方向に走査して得られた各画素の輝度値又は明度値により該輝度値又は明度値の統計値を算出する手段と、前記画素ブロック内の前記走査方向毎に算出された統計値を記憶する手段とを備え、該手段で記憶された前記走査方向毎の統計値に基づいて前記閾値を算出することにより、画素ブロックのライン毎の統計値を記憶するだけで、二値化処理のための閾値の算出及び画像の二値化を画素ブロック毎に並行して行うことができる画像処理装置、該画像処理装置を備える画像形成装置及び画像読取装置を提供することにある。
また、本発明の他の目的は、画像が有する空間周波数特性を補正するための空間フィルタ処理を行う手段で処理された画像を二値化することにより、画像の類似度を判定する場合に不要な高周波成分を除去し、また、画像データを登録する場合と照合する場合とで画像入力装置が異なる場合であっても、それぞれの入力装置の特性に依存した画像の劣化を補正して、精度良く画像の類似度を判定することができる画像処理装置、該画像処理装置を備える画像形成装置及び画像読取装置を提供することにある。
また、本発明の他の目的は、画像の解像度を変換する手段で変換された画像を二値化することにより、解像度が変化した場合であっても、精度良く画像の類似度を判定することができ、さらに画像入力装置で読みとられた解像度よりも低解像度に変換してから処理を行うことで処理量を低減することがでる画像処理装置、該画像処理装置を備える画像形成装置及び画像読取装置を提供することにある。
本発明に係る画像処理装置は、画像を二値化した二値画像の画素を所定の走査方向に走査し、走査された画素の二値化情報に応じて画素にラベルを付し、同一ラベルが付された画素を連結した連結領域を特定し、特定された連結領域に含まれる各画素の二値画像における座標値に基づいて該連結領域の特徴点を抽出し、抽出した特徴点に基づいて画像の類似度を示す特徴量を算出して画像の類似度を判定する画像処理装置において、前記走査方向に沿った複数のラインに含まれる各画素のラベルを記憶する記憶手段と、前記複数のラインのうちの注目ラインに含まれる画素に、該注目ラインの1つ前に走査されたラインに含まれる画素に付されたラベルと同一ラベルが付されたか否かを判定する判定手段と、該判定手段で同一ラベルが付されていないと判定された場合、該ラベルが付された画素を連結した連結領域の特徴点を抽出する抽出手段とを備えることを特徴とする。
本発明に係る画像処理装置は、前記判定手段で同一ラベルが付されたと判定された場合、該ラベルが付された画素の座標値を累積加算する加算手段と、各ラベルに関連付けて該ラベルが付された画素の累積加算された座標値を記憶する手段とを備え、前記抽出手段は、前記手段で記憶された座標値及び前記ラベルが付された画素を連結した連結領域に含まれる画素数に基づいて、該連結領域の特徴点を抽出するように構成してあることを特徴とする。
本発明に係る画像処理装置は、画像の複数の画素で構成される画素ブロック毎に、該画素ブロックに含まれる画素が有する輝度値又は明度値に基づいて閾値を算出する算出手段と、該算出手段で算出された閾値に基づいて、該閾値が算出された画素ブロックの画像を二値化する二値化手段とを備えることを特徴とする。
本発明に係る画像処理装置は、前記算出手段は、画素ブロック内の画素を所定の走査方向に走査して得られた各画素の輝度値又は明度値により該輝度値又は明度値の統計値を算出する手段と、前記画素ブロック内の前記走査方向毎に算出された統計値を記憶する手段とを備え、該手段で記憶された前記走査方向毎の統計値に基づいて前記閾値を算出するように構成してあることを特徴とする。
本発明に係る画像処理装置は、画像が有する空間周波数特性を補正するための空間フィルタ処理を行う手段を備え、該手段で処理された画像を二値化するように構成してあることを特徴とする。
本発明に係る画像処理装置は、画像の解像度を変換する手段を備え、該手段で変換された画像を二値化するように構成してあることを特徴とする。
本発明に係る画像形成装置は、前述の本発明のいずれか1つに係る画像処理装置と、該画像処理装置で処理された画像の形成を行う画像形成手段とを備えることを特徴とする。
本発明に係る画像読取装置は、画像を読み取る画像読取手段と、該画像読取手段で読み取った画像を処理する画像処理装置とを備える画像読取装置において、前記画像処理装置は、前述の本発明のいずれか1つに係る画像処理装置であることを特徴とする。
本発明に係る画像処理方法は、画像を二値化した二値画像の画素を所定の走査方向に走査し、走査された画素の二値化情報に応じて画素にラベルを付し、同一ラベルが付された画素を連結した連結領域を特定し、特定された連結領域に含まれる各画素の二値画像における座標値に基づいて該連結領域の特徴点を抽出し、抽出した特徴点に基づいて画像の類似度を示す特徴量を算出して画像の類似度を判定する画像処理方法において、前記走査方向に沿った複数のラインに含まれる各画素のラベルを記憶し、前記複数のラインのうちの注目ラインに含まれる画素に、該注目ラインの1つ前に走査されたラインに含まれる画素に付されたラベルと同一ラベルが付されたか否かを判定し、同一ラベルが付されていないと判定された場合、該ラベルが付された画素を連結した連結領域の特徴点を抽出することを特徴とする。
本発明にあっては、注目ラインに含まれる注目画素を所定の走査方向で走査して、例えば、注目画素に隣接する所定の範囲の画素であって注目ライン及び1つ前のラインに含まれる画素の二値化情報(例えば、「1」、「0」)に基づいて注目画素にラベルを付し、付したラベルを記憶する。なお、注目ラインが二値画像の最初のラインの場合は、注目画素の二値化情報に基づいてラベルを付し、付したラベルを記憶し、注目ラインの次のラインを注目ラインとして同様の処理を行う。これにより、注目ライン及び該注目ラインの1つ前のラインに含まれる画素のラベルが記憶される。
注目ラインに含まれる注目画素を走査してラベルを付す場合に、注目ラインに含まれる画素に、注目ラインの1つ前のラインに含まれる画素に付されたラベルと同一ラベルが付されたか否かを判定する。同一ラベルが付されていないと判定された場合、該ラベルが付された連結領域は、注目ラインにおいて終了しているとして、前記ラベルが付された画素を連結した連結領域の特徴点を抽出する。これにより、注目ライン毎に注目ラインに含まれる注目画素のラベル付けと、同一ラベルが付されたか否かの判定とを並行して行う。注目ラインの処理が終了した場合、次のラインを注目ラインとして同様の処理を繰り返すことにより、複数ライン(例えば、2ライン)分の画素のラベルを記憶するだけで、二値画像のラベル付け及び連結領域の特徴点の抽出を行うことができる。
本発明にあっては、注目ラインに含まれる注目画素を走査してラベルを付す場合に、注目ラインに含まれる画素に、注目ラインの1つ前のラインに含まれる画素に付されたラベルと同一ラベルが付されたか否かを判定する。同一ラベルが付されたと判定された場合、該ラベルが付された画素の座標値(例えば、二値画像における画素のx座標及びy座標)を累積加算し、累積加算された座標値を記憶する。抽出手段は、同一ラベルが付された画素を連結した連結領域の累積加算された座標値及び該連結領域に含まれる画素数に基づいて、該連結領域の特徴点を抽出する。例えば、累積加算された座標値を画素数で除算することにより、連結領域の重心を特徴点として抽出することができる。これにより、特徴点を抽出する連結領域の形状に制限はなく、任意のパターンに対して精度良く特徴点を抽出することができる。また、ラベルに関連付けられ累積加算された座標値を記憶するだけで、二値画像のラベル付け及び連結領域の特徴点の抽出(例えば、連結領域の重心の算出)を並行して行うことができる。
本発明にあっては、画像の複数の画素で構成される画素ブロック毎に、該画素ブロックに含まれる画素が有する輝度値又は明度値に基づいて閾値を算出する。二値化手段は、算出された閾値に基づいて、該閾値が算出された画素ブロックの画像を二値化する。これにより、画素ブロック毎に二値化を行うための閾値を動的に算出することができる。
本発明にあっては、画素ブロック内の画素を所定の走査方向に走査して得られた各画素の輝度値又は明度値により該輝度値又は明度値の統計値(例えば、平均値)を算出する。前記画素ブロック内の走査方向毎に算出された統計値を記憶し、記憶された走査方向毎の統計値に基づいて(例えば、平均値の場合はさらに平均して)閾値を算出する。画素ブロックのライン毎の統計値を記憶するだけで、画像の中の画素ブロック内の画素が有する輝度値又は明度値の統計値の算出及び該画素ブロックの画像の二値化を画素ブロック毎に並行して行うことができる。
本発明にあっては、画像の二値化処理を行う前に画像の空間周波数特性を補正する。例えば、画像が入力される画像入力装置(例えば、画像読取装置など)の光学系特性の違いにより生ずる画像の空間周波数特性を補正し、画像入力装置が異なる場合であっても、画像の劣化(例えば、画像のぼけなど)を修復する。また、二値画像における特徴点の抽出に不要な高周波成分を除去する。すなわち、空間フィルタ処理により、画像の境界強調化処理及び平滑化処理を行う。
本発明にあっては、画像の二値化処理を行う前に画像の解像度を変換する。例えば、画像が入力される画像入力装置(例えば、画像読取装置など)で画像の解像度が変倍された場合、所定の解像度になるように再度変倍する。これにより、解像度が変化した場合であっても、その影響を受けることなく二値画像における特徴点の抽出を行うことができる。また、所定の解像度を画像入力装置での読取時の解像度より小さくする場合には、後段での処理量を低減することができる。
本発明にあっては、所定の走査方向に沿った複数のライン(例えば、2ライン)に含まれる各画素のラベルを記憶し、前記複数のラインのうちの注目ラインに含まれる画素に、該注目ラインの1つ前に走査されたラインに含まれる画素に付されたラベルと同一ラベルが付されていないと判定された場合、該ラベルが付された画素を連結した連結領域の特徴点を抽出することにより、複数ライン(例えば、2ライン)分の画素のラベルを記憶するだけで、ラベル付けと特徴点の抽出とを同時に行い、従来に比べて必要なメモリ容量を低減することができ、ハードウエアで実現可能であって、高速に画像の類似度を判定することができる。
本発明にあっては、同一ラベルが付されたと判定された場合、該ラベルが付された画素の座標値を累積加算する加算手段と、各ラベルに関連付けて該ラベルが付された画素の累積加算された座標値を記憶する手段とを備え、累積加算された座標値及び前記ラベルが付された画素を連結した連結領域に含まれる画素数に基づいて、該連結領域の特徴点を抽出することにより、任意のパターンに対して特徴点を抽出することができる。また、ラベル付けと特徴点の抽出とを同時に行い、従来に比べて必要なメモリ容量を低減することができ、ハードウエアで実現可能であって、高速にかつ精度良く画像の類似度を判定することができる。
本発明にあっては、画像の複数の画素で構成される画素ブロック毎に、該画素ブロックに含まれる画素が有する輝度値又は明度値に基づいて閾値を算出し、算出された閾値に基づいて、該閾値が算出された画素ブロックの画像を二値化する二値化手段を備えることにより、ハードウエア化を実現することができるとともに、二値化の閾値を動的に求め、連結領域を安定に特定して精度良く画像の類似度を判定することができる。
本発明にあっては、画素ブロック内の画素を所定の走査方向に走査して得られた各画素の輝度値又は明度値により該輝度値又は明度値の統計値を算出する手段と、前記画素ブロック内の前記走査方向毎に算出された統計値を記憶する手段とを備え、該手段で記憶された前記走査方向毎の統計値に基づいて前記閾値を算出することにより、画素ブロックのライン毎の統計値を記憶するだけで、二値化処理のための閾値の算出及び画像の二値化を画素ブロック毎に並行して行うことができる。
本発明にあっては、画像が有する空間周波数特性を補正するための空間フィルタ処理を行う手段で処理された画像を二値化することにより、画像入力装置が異なる場合であっても、画像の劣化(例えば、画像のぼけなど)を修復することができるとともに、画像の類似度を判定する場合に不要な高周波成分を除去して、精度良く画像の類似度を判定することができる。
本発明にあっては、画像の解像度を変換する手段で変換された画像を二値化することにより、解像度が変化した場合であっても、その影響を受けることなく二値画像における特徴点の抽出を行うことができ、精度良く画像の類似度を判定することができる。また、所定の解像度を画像入力装置での読取時の解像度より小さくする場合には、後段での処理量を低減することができる。
以下、本発明を実施の形態を示す図面に基づいて説明する。図1は本発明に係る画像処理装置を備える画像形成装置100の構成を示すブロック図である。画像形成装置100は、カラー画像入力装置1、カラー画像処理装置2(画像処理装置)、画像形成手段としてのカラー画像出力装置3、各種操作を行うための操作パネル4などを備える。カラー画像入力装置1で原稿を読み込むことにより得られたRGB(R:赤、G:緑、B:青)のアナログ信号の画像データは、カラー画像処理装置2へ出力され、カラー画像処理装置2で所定の処理が行われ、CMYK(C:シアン、M:マゼンダ、Y:イエロー、K:黒)のデジタルカラー信号としてカラー画像出力装置3へ出力される。
カラー画像入力装置1は、例えば、CCD(Charged Coupled Device)を備えたスキャナであり、原稿画像からの反射光像をRGBのアナログ信号として読み取り、読み取ったRGB信号をカラー画像処理装置2へ出力する。また、カラー画像出力装置3は、原稿画像の画像データを記録紙上に出力する電子写真方式又はインクジェット方式などのプリンタである。また、カラー画像出力装置3は、ディスプレイ等の表示装置であってもよい。
カラー画像処理装置2は、後述する各処理部を備え、ASIC(Application Specific Integrated Circuit)などにより構成される。
A/D変換部20は、カラー画像入力装置1から入力されたRGB信号を、例えば、10ビットのデジタル信号に変換し、変換後のRGB信号をシェーディング補正部21へ出力する。
シェーディング補正部21は、入力されたRGB信号に対して、カラー画像入力装置1の照明系、結像系、撮像系などで生じた各種の歪みを取り除く補正処理を行い、補正後のRGB信号を入力階調補正部22へ出力する。
入力階調補正部22は、入力されたRGB信号(RGBの反射率信号)に対して、カラーバランスを整える処理を行うとともに、下地濃度の除去又はコントラストなど画質調整処理を施す。また、入力階調補正部22は、濃度信号などカラー画像処理装置2で採用されている画像処理システムが扱い易い信号に変換する処理を行い、処理後のRGB信号を領域分離処理部23へ出力する。
領域分離処理部23は、入力されたRGB信号に基づき、入力された画像中の各画素が、文字領域、網点領域、写真領域の何れであるかを分離する。領域分離処理部23は、分離結果に基づいて、各画素がどの領域に属しているかを示す領域識別信号を黒生成下色除去部26、空間フィルタ処理部27、出力階調補正部28、階調再現処理部29へ出力する。また、領域分離処理部23は、入力されたRGB信号をそのまま後段の文書照合処理部24へ出力する。
文書照合処理部24は、入力された画像を二値化し、二値画像に基づいて特定された連結領域の特徴点を算出し、その結果を用いて入力された画像と予め登録されている画像(文書画像を含む)との類似度を判定する。文書照合処理部24は、画像が類似していると判定した場合、予め設定されている類似原稿に対する処理を特定した分類信号を出力して、所定の処理を行う。例えば、類似原稿であると判定された場合、その原稿の出力をキャンセルすること、その原稿の複写を禁止すること、その原稿を所定のフォルダにファイルすることなどの処理を行う。このように、画像(文書画像を含む)の照合とともに、照合結果に応じた処理を行うことができる。また、文書照合処理部24は、入力されたRGB信号をそのまま後段の色補正部25へ出力する。
色補正部25は、入力されたRGB信号をCMYの色空間に変換し、カラー画像出力装置3の特性に合わせて色補正を行い、補正後のCMY信号を黒生成下色除去部26へ出力する。具体的には、色補正部25は、色再現の忠実化のため、不要吸収成分を含むCMY色材の分光特性に基づいた色濁りを取り除く処理を行う。
黒生成下色除去部26は、色補正部25から入力されたCMY信号に基づいて、K(黒)信号を生成するとともに、入力されたCMY信号からK信号を差し引いて新たなCMY信号を生成し、生成したCMYK信号を空間フィルタ処理部27へ出力する。
黒生成下色除去部26における処理の一例を示す。例えば、スケルトンブラックによる黒生成を行う処理の場合、スケルトンカーブの入出力特性をy=f(x)とし、入力されるデータをC、M、Yとし、出力されるデータをC´、M´、Y´、K´とし、UCR(Under Color Removal)率をα(0<α<1)とすると、黒生成下色除去処理により出力されるデータ夫々は、K´=f{min(C、M、Y)}、C´=C−αK´、M´=M−αK´、Y´=Y−αK´で表される。
空間フィルタ処理部27は、黒生成下色除去部26から入力されたCMYK信号に対して、領域識別信号に基づいたデジタルフィルタによる空間フィルタ処理を行う。これにより、画像データの空間周波数特性が補正され、カラー画像出力装置3における出力画像のぼやけ、又は粒状性劣化を防止する。例えば、空間フィルタ処理部27は、領域分離処理部23において文字領域に分離された領域を、特に黒文字又は色文字の再現性を高めるため、鮮鋭強調処理を施し高周波成分を強調する。また、空間フィルタ処理部27は、領域分離処理部23において網点領域に分離された領域を、入力網点成分を除去するためのローパス・フィルタ処理を施す。空間フィルタ処理部27は、処理後のCMYK信号を出力階調補正部28へ出力する。
出力階調補正部28は、空間フィルタ処理部27から入力されたCMYK信号に対して、カラー画像出力装置3の特性値である網点面積率に変換する出力階調補正処理を行い、出力階調補正処理後のCMYK信号を階調再現処理部29へ出力する。
階調再現処理部29は、領域分離処理部23から入力された領域識別信号に基づいて、出力階調補正部28から入力されたCMYK信号に対して所定の処理を行う。例えば、階調再現処理部29は、文字領域に分離された領域を、特に黒文字又は色文字の再現性を高めるため、カラー画像出力装置3における高周波成分の再現に適するように二値化処理又は多値化処理を行う。
また、階調再現処理部29は、領域分離処理部23において網点領域に分離された領域を、最終的に画像を画素に分離して、それぞれの階調を再現できるように階調再現処理(中間調生成)を行う。さらに、階調再現処理部29は、領域分離処理部23において写真領域に分離された領域を、カラー画像出力装置3における階調再現性に適するように二値化処理又は多値化処理を行う。
カラー画像処理装置2は、階調再現処理部29で処理された画像データ(CMYK信号)を記憶部(不図示)に一旦記憶し、画像形成をする所定のタイミングで記憶部に記憶した画像データを読み出し、読み出した画像データをカラー画像出力装置3へ出力する。これらの制御は、例えば、CPU(不図示)により行われる。
図2は文書照合処理部24の構成を示すブロック図である。文書照合処理部24は、特徴点算出部241、特徴量算出部242、投票処理部243、類似度判定処理部244、メモリ245、前記各部を制御する制御部246などを備えている。
特徴点算出部241は、入力された画像に対して後述する所定の処理を行うとともに、入力された画像を二値化し、二値画像に基づいて特定された連結領域の特徴点(例えば、連結領域を構成する各画素の二値画像における座標値を累積加算し、累積加算した座標値を連結領域に含まれる画素数で除算した値)を抽出(算出)し、抽出した特徴点を特徴量算出部242へ出力する。
図3は特徴点算出部241の構成を示すブロック図である。特徴点算出部241は、無彩化処理部2410、解像度変換部2411、フィルタ処理部2412、二値化処理部2413、重心算出部2414などを備えている。
無彩化処理部2410は、入力された画像がカラー画像である場合、カラー画像を無彩化して、輝度信号又は明度信号に変換し、変換後の画像を解像度変換部2411へ出力する。例えば、輝度信号Yは、各画素RGBの色成分を夫々Rj、Gj、Bjとし、各画素の輝度信号をYjとして、Yj=0.30×Rj+0.59×Gj+0.11×Bjで表すことができる。なお、上式に限らず、RGB信号をCIE1976L*a*b*信号に変換することもできる。
解像度変換部2411は、入力された画像がカラー画像入力装置1で光学的に変倍された場合であっても、所定の解像度になるように入力された画像を再度変倍し、変倍された画像をフィルタ処理部2412へ出力する。これにより、カラー画像入力装置1で変倍処理が行われ解像度が変化した場合であっても、その影響を受けることなく特徴点の抽出を行うことができ、精度良く画像の類似度を判定することができる。特に、縮小された文字などの場合、二値化処理を行って連結領域を特定するとき、文字が潰れているために本来離れている領域が繋がった状態で特定され、算出される重心がずれる虞を防止できる。また、解像度変換部2411は、カラー画像入力装置1で等倍時に読み込まれる解像度よりも小さい解像度に変換する。例えば、カラー画像入力装置1において600dpi(dot per inch)で読み込まれた画像を300dpiに変換する。これにより、後段における処理量を低減することができる。
フィルタ処理部2412は、入力された画像が有する空間周波数特性を補正し(例えば、画像の強調化処理及び平滑化処理など)、補正後の画像を二値化処理部2413へ出力する。フィルタ処理部2412は、カラー画像入力装置1の空間周波数特性が機種ごとに異なるため、異なる空間周波数特性を所要の特性に補正する。カラー画像入力装置1が出力する画像(例えば、画像信号)には、レンズ又はミラーなどの光学系部品、CCDの受光面のアパーチャ開口度、転送効率、残像、物理的な走査による積分効果及び走査むら等に起因して画像のぼけなどの劣化が生ずる。フィルタ処理部2412は、境界又はエッジなどの強調処理を行うことにより、画像に生じたぼけなどの劣化を修復する。また、フィルタ処理部2412は、後段で処理される特徴点の抽出処理に不要な高周波成分を抑制するための平滑化処理を行う。これにより、特徴点を精度良く抽出することができ、結果として画像の類似度の判定を精度良く行うことが可能となる。
図4はフィルタ処理部2412のフィルタ係数の例を示す説明図である。図に示すように、空間フィルタは、例えば、7×7(7行、7列)の大きさを有し、強調処理及び平滑化処理を行う混合フィルタである。入力された画像の画素を走査し、空間フィルタによる演算処理をすべての画素に対して行う。なお、空間フィルタの大きさは、7×7の大きさに限定されるものではなく、3×3、5×5などの大きさであってもよい。また、フィルタ係数の数値は一例であって、これに限定されるものではなく、使用されるカラー画像入力装置1の機種又は特性などに応じて適宜設定することができる。
二値化処理部2413は、入力された画像の輝度値(輝度信号)又は明度値(明度信号)を閾値と比較することにより画像を二値化し、二値化した二値画像を重心算出部2414へ出力する。
図5は二値化処理部2413の二値化処理を示す説明図である。図は、例えば、原稿1頁分の画像を示し、画像の左上を中心として、横方向が主走査方向、縦方向が副走査方向を示している。主走査方向の1ライン当たりの画素数は3584画素であり、128×128画素からなる画素ブロックA1、A2、…、A28により、画像の主走査方向1ラインが28個のブロックに分割されている。
二値化処理部2413は、画素ブロックA1、A2、…、A28の主走査方向の1ラインに含まれる128画素の輝度値の平均値をライン毎に記憶するためのバッファ2413aを備える。
図6はバッファ2413aの構成を示す模式図である。画素ブロックA1、A2、…、A28は、128画素で構成されるラインを128ライン含むため、バッファ2413aは、画素ブロックA1、A2、…、A28毎に128ライン分、すなわち、128個の平均値を記憶する。例えば、図に示すように、画素ブロックA1に対しては、バッファ2413aの(1,1)、(2,1)、…、(128,1)の各エリアに128画素の輝度値の平均値がライン毎に128ライン分記憶される。
二値化処理部2413は、画素ブロックA1、A2、…、A28毎に二値化処理するための閾値を算出するとともに、画素ブロックA1、A2、…、A28毎に算出した閾値を用いて画素ブロックA1、A2、…、A28の画像を二値化する。より具体的には、二値化処理部2413は、画素ブロックA1、A2、…、A28単位で主走査方向の最初の1ライン分の画素(128画素)の輝度値の平均値を算出し、算出した平均値をバッファ2413aの(1,1)、(1,2)、…、(1,28)の各エリアに記憶する。これにより、画像の主走査方向の1ライン当たり28個の平均値がバッファ2413aに記憶される。
二値化処理部2413は、副走査方向に1つラインを下げて、画素ブロックA1、A2、…、A28単位で主走査方向の2ライン目の画素(128画素)の輝度値の平均値を算出し、算出した平均値をバッファ2413aの(2,1)、(2,2)、…、(2,28)の各エリアに記憶する。二値化処理部2413は、同様の処理を副走査方向の128ラインについて繰り返す。これにより、二値化処理部2413は、画素ブロックA1、A2、…、A28毎に128ライン分の平均値を記憶する。
二値化処理部2413は、画素ブロックA1、A2、…、A28毎に記憶した128ライン分の平均値をさらに平均して平均値を算出し、算出した平均値を二値化処理のための閾値とする。例えば、画素ブロックA1の閾値は、バッファ2413aの(1,1)、(2,1)、…、(128,1)の各エリアに記憶された平均値を平均して算出する。
二値化処理部2413は、画素ブロックA1、A2、…、A28毎に算出した閾値に基づいて、画素ブロックA1、A2、…、A28夫々の画像の注目画素を主走査方向に走査して二値化する。二値化処理部2413は、画素ブロックA1、A2、…、A28に対して、閾値の算出と二値化処理が終了した場合、副走査方向の次の128ラインについて、同様の処理を繰り返し、画像全体の二値化を行う。なお、閾値の算出は、輝度値の平均値を用いる構成に限定されるものではなく、輝度値の中間値など他の統計値を用いることができる。
バッファ2413aを用いることにより、画像全体の広範な領域の画素の輝度値を参照して閾値を算出する場合に比べて、大量の記憶メモリが不要であるため、ハードウエア化を実現することができる。また、所要の大きさの画素ブロック毎に閾値を動的に算出するため、二値画像に基づいて連結領域を特定する場合、スキャナなどのカラー画像入力装置の特性による変化又は原稿自体の下地などの影響を受けることなく連結領域を安定的に特定することができ、結果として連結領域の特徴点(例えば、重心)を精度良く算出することができ、画像の類似判定の精度を向上させることが可能になる。また、画素ブロック毎に閾値の算出と二値化処理を並行して行うため、閾値を動的に算出した場合であっても、二値化処理を高速に行うことができる。
重心算出部2414は、後述するラベルバッファ2414a、座標値バッファ2414b、ラベル等価表などを備え、二値化処理部2413から入力された二値画像の各画素の二値化情報(例えば、「1」、「0」で表される)に基づいて、各画素に対してラベリング(ラベル付け処理)を行い、同一ラベルが付された画素が連結した連結領域を特定し、特定した連結領域の重心を特徴点として抽出し、抽出した特徴点を特徴量算出部242へ出力する。なお、特徴点は、二値画像における座標値(x座標、y座標)で表すことができる。
図7は重心算出部2414の重心算出(特徴点抽出)処理を示す説明図である。図7においては、説明を簡単にするため画像の大きさが16×16画素で示されているが、実際の画像は、例えば、3584×3584画素などの大きさを有する。重心算出部2414は、二値画像の主走査方向に沿った2ライン(注目ライン及び1行前の処理ライン)に含まれる画素(図7では、16×2=32)のラベルを記憶するためのラベルバッファ2414aを備える。
図8は重心算出部2414のラベル付け処理で用いる近傍画素の例を示す説明図である。図8に示すように、注目画素を主走査方向に走査してラベル付けを行う場合、注目画素の1つ前に処理された隣接画素、及び1行前の処理ラインに含まれる3つの隣接画素の合計4つの隣接する画素を注目画素の近傍画素としてラベル付けを行う。なお、近傍画素の例はこれに限定されるものではなく、他の隣接画素を選択することもできる。
重心算出部2414は、注目ラインの注目画素に隣接する近傍画素のすべてにラベルが付されているか否かを判定し、ラベルが付されていない場合、未使用のラベルを注目画素に付し(例えば、ラベル「1」、「2」が使用されている場合、ラベル「3」を付する)、付したラベルを注目画素に対応するラベルバッファ2414aに記憶する。
また、重心算出部2414は、注目画素に隣接する近傍画素に既に同じラベルが付されている場合、同じラベルを注目画素に付し、付したラベルを注目画素に対応するラベルバッファ2414aに記憶する。
また、重心算出部2414は、注目画素に隣接する近傍画素に既に異なるラベルが付されている場合、異なるラベルの中で最も古いラベルを注目画素に付し、付したラベルを注目画素に対応するラベルバッファ2414aに記憶する。また、この場合、重心算出部2414は、異なるラベルが同一のものであることを記録するため、ラベル等価表にラベルを記録してラベルを統合する。また、重心算出部2414は、ラベルを統合する場合、画素の座標値、画素数も統合する。
図9はラベル等価表の例を示す説明図である。図に示すように、ラベル等価表は、ラベル及びテーブル値の各欄で構成され、例えば、ラベル「3」に対応するテーブル値が「1」であることは、ラベル「3」とラベル「1」とが同一のものであることを示す。これにより、ラベル「3」が付された画素は、ラベル「1」が付された画素に統合される。
これにより、重心算出部2414は、2ライン分のラベルバッファ2414aを備えるだけでラベル付け処理を行うことができ、従来のような二値画像の全画素のラベルを記憶するための大容量メモリが不要となり、二値画像のラベル付け処理をハードウエアにより実現することが可能となる。
重心算出部2414は、ラベルバッファ2414aに記憶された2ライン分の画素のラベルに基づいて、ラベル付け処理を行うのと同時に連結領域に含まれる各画素の座標値を累積加算して連結領域の重心算出処理を行う。
図10は座標値バッファ2414bの構成を示す説明図である。座標値バッファ2414bは、ラベル、画素数、累積加算されたx座標値、累積加算されたy座標値、及びフラグの各欄により構成され、各ラベルに関連付けて画素数、累積加算されたx座標値、累積加算されたy座標値、及びフラグが記憶される。画素数は、同一のラベルが付された画素が連結した連結領域の画素数を示す。また、累積加算されたx座標値、及び累積加算されたy座標値は、連結領域に含まれる各画素のx座標値、及びy座標値を加算したものである。
フラグは、「空き」、「処理済」、「未処理」の区別を行うことによりラベルの状態を示すものである。「空き」はラベルが使用されていない状態を示す。また、「処理済」は、注目ラインの中である注目画素にラベルが付された状態を示し、「未処理」は、注目ラインの中でラベルが付されなかった状態を示す。
図10におけるラベル「1」、「2」に対する画素数、累積加算されたx座標値、累積加算されたy座標値、及びフラグは、図7における6行目の注目ラインの処理が終了した時点の状態を示している。例えば、図7において、ラベル「1」が付された9つの画素について説明する。図から明らかなように、ラベル「1」が付された画素数は9である。また、ラベル「1」が付された画素の累積加算されたx座標値は、(3+4)+(3+4)+(4+5)+(4+5+6)=38となる。また、ラベル「1」が付された画素の累積加算されたy座標値は、(3+3)+(4+4)+(5+5)+(6+6+6)=42となる。注目ラインの処理が終了した時点でラベル「1」は、3つの画素に対して付されているため、フラグは「処理済」となる。
また、図7において、ラベル「2」が付される4つの画素(注目画素Xにはラベル「2」が付される)について説明する。図から明らかなように、ラベル「2」が付された画素数は4である。また、ラベル「2」が付された画素の累積加算されたx座標値は、(10+11+12+13)=46となる。また、ラベル「2」が付された画素の累積加算されたy座標値は、(6+6+6+6)=24となる。注目ラインの処理が終了した時点でラベル「2」は、4つの画素に対して付されているため、フラグは「処理済」となる。
重心算出部2414は、ラベル毎にフラグを記憶することにより、1ライン(注目ライン)分の処理が終了した時点で座標値の累積加算が行われたか否かを判定する。
図11はフラグの変遷の例を示す説明図である。図11(a)は、図7において注目ライン(6行目のライン)の処理が終了した時点のフラグを示す。上述したとおり、注目ラインの処理が終了した時点で、注目ラインの中の画素にラベル「1」、「2」が付されているため、フラグは「処理済」となっている。
次に、重心算出部2414は、ラベルバッファ2414aに記憶した注目ライン(6行目のライン)の1行前の処理ライン(5行目のライン)の画素のラベルを消去するとともに、消去した領域に注目ライン(6行目のライン)の画素のラベルを記憶する。これにより、重心算出部2414は、7行目のラインを新たな注目ラインとして、該注目ライン中の画素のラベルを記憶することができる。
重心算出部2414は、7行目のラインを新たな注目ラインとして処理を開始する前に、各ラベルのフラグを初期化する。初期化により、図11(b)に示すように、ラベル「1」、「2」には「未処理」のフラグが設定される。なお、使用されていないラベルは、「空き」のフラグで初期化される。
図7で示すように、7行目のラインでは、ラベル「1」が付された画素が存在しないため、ラベル「1」が付された画素からなる連結領域は、7行目のラインで終了している。一方、7行目のラインでは、ラベル「2」が付された画素が存在する(6行目のラベル「2」が付された画素に隣接する画素が存在する)ため、ラベル「2」が付された画素からなる連結領域は、7行目のラインでも連続する。したがって、図11(c)に示すように、注目ライン(7行目のライン)の処理が終了した時点で、注目ラインの中の画素にラベル「1」は付されず、ラベル「2」は付されているため、フラグ「1」は「未処理」のままとなり、フラグ「2」は「処理済」となる。
これにより、重心算出部2414は、注目ライン(7行目のライン)分の処理が終了した時点で、ラベル「1」の画素の座標値は累積加算されなかったと判定し、ラベル「2」の画素の座標値は累積加算されたと判定する。重心算出部2414は、ラベル「1」の画素の座標値は累積加算されなかったと判定することにより、座標値バッファ2414bに記憶されたラベル「1」の累積加算されたx座標及びy座標夫々を画素数で除算することにより、ラベル「1」が付された画素で構成される連結領域の重心を算出する。例えば、図7の場合、ラベル「1」の連結領域の重心のx座標は、累積加算されたx座標値38を画素数9で除算して、x座標=4.22、重心のy座標は、累積加算されたy座標値42を画素数9で除算して、y座標=4.67となる。
重心算出部2414は、重心が算出された連結領域の画素に付されたラベル「1」を解放する。これにより、ラベル「1」のフラグを「空き」とし、新たなラベルとして再度使用することができ、座標値バッファ2414bの記憶容量を有効活用することができる。
上述のような処理を行うことにより、二値画像全体で連結領域が多数存在する場合でも、2ライン分のラベルバッファ2414a、及び座標値バッファ2414bという限られた記憶容量を備えるだけでラベル付け処理と重心算出処理(特徴点抽出処理)とを同時に処理することができる。これにより、従来に比べて必要なメモリ容量を低減することができ、ハードウエアで実現可能であって、高速に画像の類似度を判定することができる。また、連結領域の形状に拘わらず重心を算出することができ、精度良く画像の類似度を判定することができる。
図12は連結領域の特徴点の例を示す説明図である。図において、特定された連結領域は、文字「A」であり、同一ラベルが付された画素の集合として特定される。この文字「A」の特徴点(重心)は、図中黒丸で示される位置(x座標、y座標)となる。
図13は文字列に対する特徴点の抽出結果の例を示す説明図である。複数の文字から構成される文字列の場合、文字の種類により夫々異なる座標を有する特徴点が複数抽出される。
特徴量算出部242は、特徴点算出部241から入力された特徴点(すなわち、連結領域の重心の座標値)夫々を注目特徴点とし、例えば、注目特徴点からの距離が小さい周辺の他の特徴点を4つ抽出する。
図14は注目特徴点と周辺の特徴点を示す説明図である。図に示すように、注目特徴点P1に対して、例えば、閉曲線S1で囲まれる4つの特徴点を抽出する(注目特徴点P1に対しては、注目特徴点P2も1つの特徴点として抽出されている)。また、注目特徴点P2に対して、例えば、閉曲線S2で囲まれる4つの特徴点を抽出する(注目特徴点P2に対しては、注目特徴点P1も1つの特徴点として抽出されている)。
特徴量算出部242は、抽出した4つの特徴点の中から3つの特徴点を選択して、不変量を算出する。なお、選択する特徴点は3つに限られるものではなく、4つ、5つなどの特徴点を選択することもできる。求めたい不変量の種類によって選択すべき特徴点の数が異なる。例えば、3点から求められる不変量は相似不変量となる。
図15は注目特徴点P1による不変量の算出例を示す説明図であり、図16は注目特徴点P2による不変量の算出例を示す説明図である。図15に示すように、注目特徴点P1の周辺の4つの特徴点から3つの特徴点を選択し、3通りの不変量夫々をH1j(j=1、2、3)とする。不変量H1jは、H1j=(A1j/B1j)×C/Dで表される式で算出する。ここで、A1j、B1j夫々は特徴点間の距離を示し、Cは正規化の定数、Dは予め定められた定数である。これにより、例えば、原稿が回転、移動、傾いた場合であっても、不変量H1jは変化せず、画像の類似度の判定を精度良く行うことができる。
同様に、図16に示すように、注目特徴点P2の周辺の4つの特徴点から3つの特徴点を選択し、3通りの不変量夫々をH2j(j=1、2、3)とする。不変量H2jは、H2j=(A1j/B1j)×C/Dで表される式で算出する。ここで、A2j、B2j夫々は特徴点間の距離を示し、Cは正規化の定数、Dは予め定められた定数である。以下同様に、他の注目特徴点に対して不変量を算出することができる。
特徴量算出部242は、夫々の注目特徴点により算出された不変量に基づいて、ハッシュ値(特徴量)Hiを算出する。注目特徴点Piのハッシュ値Hiは、Hi=(Hi1×102 +Hi2×101 +Hi3×100)/Eで表される。ここで、Eは余りをどの程度設定するかにより決定される定数であり、例えば、「10」とした場合には、余りは「0」〜「9」となり、これが算出するハッシュ値の取り得る範囲となる。また、iは自然数である。なお、特徴量としての上記ハッシュ値は一例であって、これに限定されるものではなく、他のハッシュ関数を用いることができる。上記では、周辺の他の特徴点として4点を抽出する例を示しているが、4点に限定されるものではない。例えば、6点抽出するようにしても良い。この場合、6点の特徴点から5点を抽出し、5点を抽出する6通りそれぞれの方法について、5点から3点を抽出して不変量を求め、ハッシュ値を算出するようにしても良い。
図17はハッシュテーブルの構造を示す説明図である。図に示すように、ハッシュテーブルの構造は、ハッシュ値及び原稿を表すインデックスの各欄により構成されている。より具体的には、原稿を示すインデックスに対応して、原稿中の位置を示すポイントインデックス、及び不変量が登録されている。画像の類似度を判定するため、予め照合する画像・文書画像などをハッシュテーブルに登録しておく。ハッシュテーブルはメモリ245に記憶してある。なお、図17(b)に示すように、ハッシュ値が等しい場合(H1=H5)、ハッシュテーブルの2つのエントリを1つにまとめることもできる。
投票処理部243は、特徴量算出部242が算出したハッシュ値(特徴量)に基づいて、メモリ245に記憶されたハッシュテーブルを検索し、該ハッシュ値に登録されているインデックスの原稿について投票する。投票を累積加算した結果を類似度判定処理部244へ出力する。
類似度判定処理部244は、投票処理部243から入力された投票結果に基づいて、原稿(画像、文書画像)の類似度を判定し、判定結果(分類信号)を出力する。より具体的には、類似度判定処理部244は、投票処理部243から入力された投票数(得票数)を予め定めた閾値と比較し、投票数が閾値以上であれば、入力画像が予め登録された原稿の画像に類似すると判定し、さらに類似と判定された中で最も得票数の高い原稿が一致する原稿であると判定する。判定結果に応じて登録された原稿に対応して定められた処理(例えば、複写禁止、所定のフォルダに記憶など)を行うべく分類信号を出力する。また、類似度判定処理部244は、投票処理部243から入力された投票数が閾値より小さい場合、類似する原稿がないと判定して、その結果を出力する。上記の判定方法は一例であり、別の方法として、例えば、原稿毎の最大得票数(原稿毎に求められる特徴点の数など)で得票数を除算して正規化した後で類似度の判定や一致の判定を行っても良い。
次に文書照合処理部24の動作について説明する。特徴点算出部241は、入力された画像に対して所定の大きさの画素ブロックを用いて、二値化処理のための閾値の算出及び画像の二値化処理を画素ブロック毎に並行して行い、二値画像に基づいてラベリング処理及び連結領域の特徴点抽出(重心算出)を注目ライン毎に並行して行い、抽出した特徴点を特徴量算出部242へ出力する。
特徴量算出部242は、特徴点算出部241から入力された特徴点に基づいて、所定の不変量を算出し、算出した不変量に基づいて特徴量であるハッシュ値を算出し、算出したハッシュ値を投票処理部243へ出力する。
投票処理部243は、特徴量算出部242が算出したハッシュ値に基づいて、メモリ245に記憶されたハッシュテーブルを検索し、該ハッシュ値に登録されているインデックスの原稿について投票する。投票を累積加算した結果を類似度判定処理部244へ出力する。
類似度判定処理部244は、投票処理部243から入力された投票数を予め定めた閾値と比較し、投票数が閾値以上であれば、入力画像が予め登録された原稿の画像に類似すると判定し、さらに類似と判定された中で最も得票数の高い原稿が一致する原稿であると判定する。判定結果に応じて登録された原稿に対応して定められた処理(例えば、複写禁止、所定のフォルダに記憶など)を行うべく分類信号を出力する。また、類似度判定処理部244は、投票処理部243から入力された投票数が閾値より小さい場合、類似する原稿がないと判定して、その結果を出力する。上記の判定方法は一例であり、別の方法として、例えば、原稿毎の最大得票数(原稿毎に求められる特徴点の数など)で得票数を除算して正規化した後で類似度の判定や一致の判定を行っても良い。
以上説明したように、本発明にあっては、2ライン分の画素のラベルを記憶するだけで、ラベル付けと特徴点の抽出とを同時に行い、従来に比べて必要なメモリ容量を低減することができ、ハードウエアで実現可能であって、高速に画像の類似度を判定することができる。また、任意のパターンに対して特徴点を抽出することができ、精度良く画像の類似度を判定することができる。また、二値化処理のための閾値を動的に求め、連結領域を安定に特定して精度良く画像の類似度を判定することができるとともに、二値化処理のための閾値の算出及び画像の二値化を画素ブロック毎に並行して行うことができる。また、画像入力装置が異なる場合であっても、画像の劣化(例えば、画像のぼけなど)を修復することができるとともに、画像の類似度を判定する場合に不要な高周波成分を除去して、精度良く画像の類似度を判定することができる。さらに、解像度が変化した場合であっても、その影響を受けることなく二値画像における特徴点の抽出を行うことができ、精度良く画像の類似度を判定することができる。また、所定の解像度を画像入力装置での読取時の解像度より小さくする場合には、後段での処理量を低減することができる。
上述の実施の形態において、カラー画像入力装置1としては、例えば、フラットベッドスキャナ、フィルムスキャナ、デジタルカメラ、携帯電話機などが用いられる。また、カラー画像出力装置3としては、例えば、CRTディスプレイ、液晶ディスプレイなどの画像表示装置、処理結果を記録紙などに出力する電子写真方式又はインクジェット方式のプリンタなどが用いられる。さらに画像形成装置100としては、ネットワークを介してサーバ装置などに接続するための通信手段としてのモデムなどを備えることもできる。また、カラー画像入力装置1からカラー画像データを取得する代わりに、ネットワークを介して外部記憶装置、サーバ装置などからカラー画像データを取得する構成であってもよい。
上述の実施の形態では、カラー画像入力装置1とカラー画像処理装置2とは別個の装置として説明したが、カラー画像処理装置2をカラー画像入力装置1に統合して、画像読取装置として構成することもできる。
上述の実施の形態では、文書照合処理部24の中にメモリ245、制御部246を備える構成であるが、これに限定されるものではなく、メモリ245、制御部246を文書照合処理部24の外部に設ける構成であってもよい。
上述の実施の形態では、ラベルバッファは2ライン分のラベルを記憶する構成であったが、2ラインに限定されるものではなく、3ライン以上であってもよい。なお、2ライン分の構成とすることで、より記憶容量を小さくすることができる。
本発明に係る画像処理装置を備える画像形成装置の構成を示すブロック図である。 文書照合処理部の構成を示すブロック図である。 特徴点算出部の構成を示すブロック図である。 フィルタ処理部のフィルタ係数の例を示す説明図である。 二値化処理部の二値化処理を示す説明図である。 バッファの構成を示す模式図である。 重心算出部の重心算出(特徴点抽出)処理を示す説明図である。 重心算出部のラベル付け処理で用いる近傍画素の例を示す説明図である。 ラベル等価表の例を示す説明図である。 座標値バッファの構成を示す説明図である。 フラグの変遷の例を示す説明図である。 連結領域の特徴点の例を示す説明図である。 文字列に対する特徴点の抽出結果の例を示す説明図である。 注目特徴点と周辺の特徴点を示す説明図である。 注目特徴点による不変量の算出例を示す説明図である。 注目特徴点による不変量の算出例を示す説明図である。 ハッシュテーブルの構造を示す説明図である。
符号の説明
1 カラー画像入力装置
2 カラー画像処理装置
3 カラー画像出力装置
24 文書照合処理部
241 特徴点算出部
242 特徴量算出部
243 投票処理部
244 類似度判定処理部
245 メモリ
246 制御部
2411 解像度変換部
2412 フィルタ処理部
2413 二値化処理部
2414 重心算出部

Claims (9)

  1. 画像を二値化した二値画像の画素を所定の走査方向に走査し、走査された画素の二値化情報に応じて画素にラベルを付し、同一ラベルが付された画素を連結した連結領域を特定し、特定された連結領域に含まれる各画素の二値画像における座標値に基づいて該連結領域の特徴点を抽出し、抽出した特徴点に基づいて画像の類似度を示す特徴量を算出して画像の類似度を判定する画像処理装置において、
    前記走査方向に沿った複数のラインに含まれる各画素のラベルを記憶する記憶手段と、
    前記複数のラインのうちの注目ラインに含まれる画素に、該注目ラインの1つ前に走査されたラインに含まれる画素に付されたラベルと同一ラベルが付されたか否かを判定する判定手段と、
    該判定手段で同一ラベルが付されていないと判定された場合、該ラベルが付された画素を連結した連結領域の特徴点を抽出する抽出手段と
    を備えることを特徴とする画像処理装置。
  2. 前記判定手段で同一ラベルが付されたと判定された場合、該ラベルが付された画素の座標値を累積加算する加算手段と、
    各ラベルに関連付けて該ラベルが付された画素の累積加算された座標値を記憶する手段と
    を備え、
    前記抽出手段は、
    前記手段で記憶された座標値及び前記ラベルが付された画素を連結した連結領域に含まれる画素数に基づいて、該連結領域の特徴点を抽出するように構成してあることを特徴とする請求項1に記載の画像処理装置。
  3. 画像の複数の画素で構成される画素ブロック毎に、該画素ブロックに含まれる画素が有する輝度値又は明度値に基づいて閾値を算出する算出手段と、
    該算出手段で算出された閾値に基づいて、該閾値が算出された画素ブロックの画像を二値化する二値化手段と
    を備えることを特徴とする請求項1又は請求項2に記載の画像処理装置。
  4. 前記算出手段は、
    画素ブロック内の画素を所定の走査方向に走査して得られた各画素の輝度値又は明度値により該輝度値又は明度値の統計値を算出する手段と、
    前記画素ブロック内の前記走査方向毎に算出された統計値を記憶する手段と
    を備え、
    該手段で記憶された前記走査方向毎の統計値に基づいて前記閾値を算出するように構成してあることを特徴とする請求項3に記載の画像処理装置。
  5. 画像が有する空間周波数特性を補正するための空間フィルタ処理を行う手段を備え、
    該手段で処理された画像を二値化するように構成してあることを特徴とする請求項1乃至請求項4に記載の画像処理装置。
  6. 画像の解像度を変換する手段を備え、
    該手段で変換された画像を二値化するように構成してあることを特徴とする請求項1乃至請求項4に記載の画像処理装置。
  7. 請求項1乃至請求項6のいずれか1つに記載された画像処理装置と、該画像処理装置で
    処理された画像の形成を行う画像形成手段とを備えることを特徴とする画像形成装置。
  8. 画像を読み取る画像読取手段と、該画像読取手段で読み取った画像を処理する画像処理装置とを備える画像読取装置において、
    前記画像処理装置は、
    請求項1乃至請求項6のいずれか1つに記載された画像処理装置であることを特徴とする画像読取装置。
  9. 画像を二値化した二値画像の画素を所定の走査方向に走査し、走査された画素の二値化情報に応じて画素にラベルを付し、同一ラベルが付された画素を連結した連結領域を特定し、特定された連結領域に含まれる各画素の二値画像における座標値に基づいて該連結領域の特徴点を抽出し、抽出した特徴点に基づいて画像の類似度を示す特徴量を算出して画像の類似度を判定する画像処理方法において、
    前記走査方向に沿った複数のラインに含まれる各画素のラベルを記憶し、
    前記複数のラインのうちの注目ラインに含まれる画素に、該注目ラインの1つ前に走査されたラインに含まれる画素に付されたラベルと同一ラベルが付されたか否かを判定し、
    同一ラベルが付されていないと判定された場合、該ラベルが付された画素を連結した連結領域の特徴点を抽出することを特徴とする画像処理方法。
JP2006126761A 2006-04-28 2006-04-28 画像処理装置、画像形成装置、画像読取装置及び画像処理方法 Pending JP2007299210A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2006126761A JP2007299210A (ja) 2006-04-28 2006-04-28 画像処理装置、画像形成装置、画像読取装置及び画像処理方法
US11/790,646 US8107734B2 (en) 2006-04-28 2007-04-26 Image processing apparatus, and method for performing document matching using extracted feature points of connected image components
CNB200710100922XA CN100533467C (zh) 2006-04-28 2007-04-28 图像处理装置、图像形成装置、图像读取装置及图像处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006126761A JP2007299210A (ja) 2006-04-28 2006-04-28 画像処理装置、画像形成装置、画像読取装置及び画像処理方法

Publications (1)

Publication Number Publication Date
JP2007299210A true JP2007299210A (ja) 2007-11-15

Family

ID=38648367

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006126761A Pending JP2007299210A (ja) 2006-04-28 2006-04-28 画像処理装置、画像形成装置、画像読取装置及び画像処理方法

Country Status (3)

Country Link
US (1) US8107734B2 (ja)
JP (1) JP2007299210A (ja)
CN (1) CN100533467C (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010113653A (ja) * 2008-11-10 2010-05-20 Kyodo Printing Co Ltd 枠検出方法、枠検出装置及び枠検出プログラム
US8050501B2 (en) 2007-09-07 2011-11-01 Sharp Kabushiki Kaisha Image matching apparatus, image matching method, and image data output processing apparatus
US8073262B2 (en) 2007-09-10 2011-12-06 Sharp Kabushiki Kaisha Image matching apparatus, image matching method, and image data output processing apparatus
US8121414B2 (en) 2007-06-13 2012-02-21 Sharp Kabushiki Kaisha Image processing method, image processing apparatus, and image forming apparatus
US8260061B2 (en) 2007-09-21 2012-09-04 Sharp Kabushiki Kaisha Image data output processing apparatus and image data output processing method
US8351706B2 (en) 2007-07-24 2013-01-08 Sharp Kabushiki Kaisha Document extracting method and document extracting apparatus
US8452100B2 (en) 2007-07-24 2013-05-28 Sharp Kabushiki Kaisha Image processing apparatus, image forming apparatus and image reading apparatus including the same, and image processing method
JP2014021531A (ja) * 2012-07-12 2014-02-03 Dwango Co Ltd プログラム、画像処理方法、及び、画像処理装置
CN110458232A (zh) * 2019-08-13 2019-11-15 腾讯科技(深圳)有限公司 一种确定图像风格相似度的方法及设备
JPWO2021152829A1 (ja) * 2020-01-31 2021-08-05

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4859390B2 (ja) * 2005-05-10 2012-01-25 株式会社リコー 画像処理方法及び画像処理装置
US8213734B2 (en) * 2006-07-07 2012-07-03 Sony Ericsson Mobile Communications Ab Active autofocus window
JP4989308B2 (ja) * 2007-05-16 2012-08-01 キヤノン株式会社 画像処理装置及び画像検索方法
JP4399486B2 (ja) * 2007-09-27 2010-01-13 シャープ株式会社 画像処理装置、外部記憶装置、画像形成装置、画像送信装置、画像読取装置、画像処理システム、画像処理方法、プログラムおよびその記録媒体
JP5003443B2 (ja) * 2007-12-04 2012-08-15 セイコーエプソン株式会社 画像処理装置および画像形成装置並びに画像処理方法,プログラム
JP4970301B2 (ja) * 2008-02-08 2012-07-04 シャープ株式会社 画像処理方法、画像処理装置、画像読取装置、画像形成装置、画像処理システム、プログラムおよび記録媒体
JP5239883B2 (ja) * 2008-02-26 2013-07-17 株式会社リコー 画像形成装置、および画像形成装置の画像形成方法
US8031202B2 (en) * 2008-03-11 2011-10-04 Xerox Corporation Color transfer between images through color palette adaptation
JP5027075B2 (ja) * 2008-08-05 2012-09-19 株式会社ジャパンディスプレイウェスト 画像処理装置、画像入力装置および画像入出力装置
US10489445B1 (en) 2009-07-13 2019-11-26 Eharmony, Inc. Systems and methods for online matching using visual similarity
US9531906B2 (en) * 2010-06-11 2016-12-27 Xerox Corporation Method for automatic conversion of paper records to digital form
JP5887770B2 (ja) * 2011-09-05 2016-03-16 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP2014127187A (ja) * 2012-12-27 2014-07-07 Toshiba Corp 特徴算出装置、方法及びプログラム
CN103646232B (zh) * 2013-09-30 2016-08-17 华中科技大学 飞行器地面运动目标红外图像识别装置
CN104023165A (zh) * 2014-06-05 2014-09-03 江苏紫光吉地达环境科技有限公司 一种快速色彩判别方法
CN104122271A (zh) * 2014-07-09 2014-10-29 宁波摩视光电科技有限公司 一种基于aoi的子弹表观缺陷检测方法
JP6530811B2 (ja) * 2015-05-14 2019-06-12 オリンパス株式会社 画像処理装置
KR102394202B1 (ko) * 2015-05-29 2022-05-04 삼성전자주식회사 장치 간의 입력 처리 방법 및 이를 구현하는 전자 장치
JP6599672B2 (ja) * 2015-07-17 2019-10-30 日本電産サンキョー株式会社 文字切り出し装置、文字認識装置、および文字切り出し方法
CN106484704A (zh) * 2015-08-25 2017-03-08 中兴通讯股份有限公司 一种图片处理方法及装置
CN105338359B (zh) * 2015-11-02 2018-10-16 浪潮金融信息技术有限公司 一种处理视频数据的方法及装置
EP3399463A1 (en) * 2017-05-05 2018-11-07 Ares Trading S.A. Method and apparatus for determining information about a drug-containing vessel
CN107633048B (zh) * 2017-09-15 2021-02-26 国网重庆市电力公司电力科学研究院 一种图像标注鉴别方法及系统
US10602207B2 (en) * 2018-08-03 2020-03-24 Facebook, Inc. Neural network based content distribution in an online system
US10831383B2 (en) * 2018-11-02 2020-11-10 Hamilton Sundstrand Corporation Command line voting using hashing
CN111510724A (zh) * 2019-01-31 2020-08-07 北京小犀智能科技中心(有限合伙) 基于图像特征提取的等效视频压缩存储方法及系统
CN112085726B (zh) * 2020-09-16 2024-03-22 杭州爱科科技股份有限公司 皮料识别方法、装置、系统及计算机可读存储介质
CN113256571B (zh) * 2021-05-11 2022-05-27 浙江欧威科技有限公司 基于方向特征和局部唯一性的矢量图形特征点提取方法
US20230179805A1 (en) * 2021-12-07 2023-06-08 Qualcomm Incorporated Adaptive film grain synthesis
US20230196717A1 (en) * 2021-12-17 2023-06-22 Pixart Imaging Inc. Connected component analysis method which can reuse label
CN115660520B (zh) * 2022-12-14 2023-03-28 昆明理工大学 一种基于交通运输物流的数据分析方法及系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61260370A (ja) 1985-05-14 1986-11-18 Yokogawa Electric Corp デイジタル画像処理方法及び装置
JPH07175925A (ja) 1993-12-17 1995-07-14 Mitsubishi Electric Corp 特徴量算出装置及び特徴量算出方法
US5465353A (en) * 1994-04-01 1995-11-07 Ricoh Company, Ltd. Image matching and retrieval by multi-access redundant hashing
JP3436025B2 (ja) * 1995-12-27 2003-08-11 ミノルタ株式会社 読取り画像の修正方法及び画像読取り装置
JPH1079035A (ja) 1996-09-05 1998-03-24 Olympus Optical Co Ltd 特定対象物抽出装置
JPH11175710A (ja) * 1997-12-16 1999-07-02 Sharp Corp 画像形成装置
US7701614B2 (en) * 2004-03-31 2010-04-20 Fujifilm Corporation Image processing method, apparatus, and program with selective error diffusion among a pluraity of pixel groups withing a digital image
CN101133429B (zh) 2005-03-01 2010-10-06 公立大学法人大阪府立大学 文档和/或图像检索方法、文档和/或图像存储设备和检索设备

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8121414B2 (en) 2007-06-13 2012-02-21 Sharp Kabushiki Kaisha Image processing method, image processing apparatus, and image forming apparatus
US8798371B2 (en) 2007-06-13 2014-08-05 Sharp Kabushiki Kaisha Image processing method, image processing apparatus, and image forming apparatus
US8452100B2 (en) 2007-07-24 2013-05-28 Sharp Kabushiki Kaisha Image processing apparatus, image forming apparatus and image reading apparatus including the same, and image processing method
US8351706B2 (en) 2007-07-24 2013-01-08 Sharp Kabushiki Kaisha Document extracting method and document extracting apparatus
US8050501B2 (en) 2007-09-07 2011-11-01 Sharp Kabushiki Kaisha Image matching apparatus, image matching method, and image data output processing apparatus
US8073262B2 (en) 2007-09-10 2011-12-06 Sharp Kabushiki Kaisha Image matching apparatus, image matching method, and image data output processing apparatus
US8260061B2 (en) 2007-09-21 2012-09-04 Sharp Kabushiki Kaisha Image data output processing apparatus and image data output processing method
JP2010113653A (ja) * 2008-11-10 2010-05-20 Kyodo Printing Co Ltd 枠検出方法、枠検出装置及び枠検出プログラム
JP2014021531A (ja) * 2012-07-12 2014-02-03 Dwango Co Ltd プログラム、画像処理方法、及び、画像処理装置
CN110458232A (zh) * 2019-08-13 2019-11-15 腾讯科技(深圳)有限公司 一种确定图像风格相似度的方法及设备
CN110458232B (zh) * 2019-08-13 2023-05-30 腾讯科技(深圳)有限公司 一种确定图像风格相似度的方法及设备
JPWO2021152829A1 (ja) * 2020-01-31 2021-08-05
WO2021152829A1 (ja) * 2020-01-31 2021-08-05 日本電気株式会社 物体認識装置、物体認識理方法、及び、記録媒体
JP7521543B2 (ja) 2020-01-31 2024-07-24 日本電気株式会社 物体認識装置、物体認識理方法、及び、プログラム

Also Published As

Publication number Publication date
US20070253623A1 (en) 2007-11-01
CN101064009A (zh) 2007-10-31
US8107734B2 (en) 2012-01-31
CN100533467C (zh) 2009-08-26

Similar Documents

Publication Publication Date Title
JP2007299210A (ja) 画像処理装置、画像形成装置、画像読取装置及び画像処理方法
US8320683B2 (en) Image processing method, image processing apparatus, image reading apparatus, and image forming apparatus
US8224095B2 (en) Image processing apparatus, image forming apparatus, image processing system, and image processing method
US8351706B2 (en) Document extracting method and document extracting apparatus
US8452100B2 (en) Image processing apparatus, image forming apparatus and image reading apparatus including the same, and image processing method
US8144994B2 (en) Image processing method, image processing apparatus, image reading apparatus, image forming apparatus, and recording medium
US8055079B2 (en) Image processing method, image processing apparatus, and image forming apparatus
US8798371B2 (en) Image processing method, image processing apparatus, and image forming apparatus
JP4604100B2 (ja) 画像処理方法、画像処理装置、画像形成装置、プログラムおよび記憶媒体
US20040017579A1 (en) Method and apparatus for enhancement of digital image quality
JP4362538B2 (ja) 画像処理装置、画像形成装置、画像送信装置、画像読取装置、画像処理システム、画像処理方法、画像処理プログラムおよびその記録媒体
US8265345B2 (en) Image processing method, image processing apparatus, image forming apparatus, and image reading apparatus
US8103108B2 (en) Image processing apparatus, image forming apparatus, image processing system, and image processing method
US8107738B2 (en) Image processing method, image processing apparatus, image forming apparatus, image reading apparatus and memory product
JP4913094B2 (ja) 画像照合方法、画像照合装置、画像データ出力処理装置、プログラム及び記憶媒体
JP4362537B2 (ja) 画像処理装置、画像形成装置、画像送信装置、画像読取装置、画像処理システム、画像処理方法、画像処理プログラムおよびその記録媒体
JP4340711B2 (ja) 画像処理方法、画像処理装置、画像形成装置、コンピュータプログラム及び記録媒体
US7986838B2 (en) Image processing apparatus and image processing method
JP2009206658A (ja) 画像処理方法、画像処理装置、画像形成装置、プログラム及び記憶媒体
JP4393556B2 (ja) 画像処理方法、画像処理装置、画像読取装置、画像形成装置、コンピュータプログラム及びコンピュータでの読み取りが可能な記録媒体
JP2008154216A (ja) 画像処理方法、画像処理装置、画像形成装置、原稿読取装置、コンピュータプログラム及び記録媒体
JP2008245147A (ja) 画像処理装置、画像読取装置、画像形成装置、画像処理方法、コンピュータプログラム、及び記録媒体
JP4340714B2 (ja) 原稿抽出方法、原稿抽出装置、コンピュータプログラム及び記録媒体
JP2008123456A (ja) 画像処理方法、画像処理装置、画像形成装置、コンピュータプログラム及び記録媒体

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080411

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080415

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080530

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080624