JP4770863B2 - 画像処理装置及び画像処理プログラム - Google Patents

画像処理装置及び画像処理プログラム Download PDF

Info

Publication number
JP4770863B2
JP4770863B2 JP2008100593A JP2008100593A JP4770863B2 JP 4770863 B2 JP4770863 B2 JP 4770863B2 JP 2008100593 A JP2008100593 A JP 2008100593A JP 2008100593 A JP2008100593 A JP 2008100593A JP 4770863 B2 JP4770863 B2 JP 4770863B2
Authority
JP
Japan
Prior art keywords
image
logical operation
binarized
binarization
color
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008100593A
Other languages
English (en)
Other versions
JP2009253751A (ja
Inventor
一憲 宋
俊一 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2008100593A priority Critical patent/JP4770863B2/ja
Publication of JP2009253751A publication Critical patent/JP2009253751A/ja
Application granted granted Critical
Publication of JP4770863B2 publication Critical patent/JP4770863B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)

Description

本発明は、画像処理装置及び画像処理プログラムに関する。
文字、線画、自然画像等を含んだ画像をJPEG等の変換符号化で圧縮すると、文字部や線画部にモスキートノイズと呼ばれる画像劣化が生じることがある。この画像劣化を低減させるために、文字部や線画部と自然画像部の領域を分割し、自然画像部はJPEG圧縮を行い、文字部や線画部の領域は2値画像とその文字部や線画部の色を示す色情報を加えて1つの層としてMMR圧縮して、伸張時に自然画像に上書きするような多層構造の符号化方式が提案されている。
具体的には、画像から黒の文字や線画を抜き出して2値データを作成する。また、画像から赤の文字や線画を抜き出して2値データを作成する。さらに、画像から、前記黒や赤の文字や線画を除去した多値画像データを作成する。黒の文字や線画を抜き出して作成した2値データは、2値データ用の圧縮方式で圧縮する。また、この画像の色は黒であるという情報を別途付与する。同様に、赤の文字や線画を抜き出して作成した2値データは、2値データ用の圧縮方式で圧縮する。また、この画像の色は赤であるという情報を別途付与する。さらに、画像から前記の文字部や線画部を除去した後のバックグラウンド画像は、JPEG等の多値画像用の圧縮方式で符号化する。
これに関連する技術として、例えば、特許文献1には、文書をスキャナで入力した画像データや、コンピュータ上の文書作成ソフトウェアで作成された文書データを、一般的な圧縮画像データとして、高画質かつ高圧縮率で圧縮することができる画像処理装置及び画像処理方法を提供することを課題とし、入力された文書データについての多値画像について、縮小・二値化部で二値画像が生成される。この二値画像に基づいて文字領域検出部において文字領域が抽出され、文字領域座標が得られ、また、抽出された文字領域内の文字領域代表色が文字色抽出部で抽出され、文字部塗りつぶし部において多値画像から下地多値画像が生成され、さらに、文字領域画像が文字領域画像圧縮部で圧縮されて圧縮コードが生成され、下地画像が下地画像圧縮部で圧縮されて圧縮コードが生成されることが開示されている。
また、例えば、特許文献2には、良好な復元画像を生成することでき、かつ圧縮対象の画像品位を低下させない画像圧縮を行うことができる画像圧縮装置、画像伸長装置及びそれらの方法、プログラムを提供することを課題とし、2値化部で多値画像を2値化し、2値画像中の文字領域の位置を領域特定部で特定し、領域特定部で、文字領域中の単位文字領域の位置を特定し、代表色部抽出部で、単位文字領域の位置情報と多値画像とに基づいて、単位文字領域の代表色を抽出し、文字領域穴埋め部で、文字領域の位置情報に基づいて、文字領域をその周辺色で穴埋めし、縮小部で、穴埋め多値画像を縮小し、JPEG圧縮部で、縮小多値画像を圧縮し、MMR圧縮部で、文字領域に対応する部分2値画像を圧縮し、位置情報と、各圧縮部で生成された圧縮コードと、単位文字領域の代表色情報を含む圧縮データを出力することが開示されている。
また、例えば、特許文献3には、画質を保ちながら効率良く画像を圧縮することができる画像処理装置を提供することを課題とし、文字領域代表色抽出手段により抽出された第1文字領域代表色、線画領域代表色抽出手段により抽出された第1線画領域代表色、背景領域代表色抽出手段により抽出された第1背景領域代表色から、最適な、第2文字領域代表色、第2線画領域代表色及び第2背景領域代表色を判定する代表色判定手段を備えることが開示されている。
また、例えば、特許文献4には、任意かつ複数の背景色を有する画像から文字認識に好適な2値画像を生成する画像処理装置、画像処理方法、画像処理プログラム及び記録媒体を提供することを課題とし、原画像から圧縮画像を生成し、同色とみなせる画素をランとして抽出し、それらの連結成分を色ごとに求め、この連結成分を文字候補とみなして近接する連結成分同士を統合して文字行を生成し、その後抽出された文字行から、過抽出部分を排除して文字行を出力し、こうして得られた行領域データをもとに、文字認識に好適な2値画像を生成することが開示されている。
特開2003−244447号公報 特開2004−128880号公報 特開2007−335983号公報 特開2004−199622号公報
ところで、画像に対する処理によって色変化が生じるような場合に、従来技術を用いると、その色変化による影響を受け、その画像が単色であるか否かの判定は困難である。
本発明は、画像に対する処理による色変化の影響があったとしても、その画像が単色であるか否かの判定の誤りを削減させるようにした画像処理装置及び画像処理プログラムを提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項の発明は、対象とする画像の色空間における色軸に応じた副画像に対して、文字領域と背景部を比較して該文字領域の一部を該背景部と区別し得るように2値化画像を生成する2値化生成手段と、前記2値化生成手段によって2値化された第1の画像と第2の画像の違いを検出するための論理演算を行う論理演算手段と、前記論理演算手段によって論理演算された結果の画像の連結画素数を算出する画素数算出手段と、前記画素数算出手段によって算出された連結画素数に応じて、前記画像が単色であるか否かを判定する色判定手段を具備し、前記第1の画像は、対象とする画像の色空間における色軸に応じた副画像の1つに対して、前記2値化生成手段によって生成された2値化画像であり、前記第2の画像は、前記第1の画像の副画像とは異なる副画像に対して、前記2値化生成手段によって生成された2値化画像であることを特徴とする画像処理装置である。
請求項の発明は、対象とする画像の色空間における色軸に応じた副画像に対して、文字領域と背景部を比較して該文字領域の一部を該背景部と区別し得るように2値化画像を生成する2値化生成手段と、前記2値化生成手段によって生成された第1の画像と第2の画像の違いを検出するための論理演算を行う第1の論理演算手段と、前記2値化生成手段によって生成された第1の画像と第3の画像の違いを検出するための論理演算を行う第2の論理演算手段と、前記2値化生成手段によって生成された第2の画像と第3の画像の違いを検出するための論理演算を行う第3の論理演算手段と、前記第1の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第1の画素数算出手段と、前記第2の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第2の画素数算出手段と、前記第3の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第3の画素数算出手段と、前記第1の画素数算出手段、前記第2の画素数算出手段、前記第3の画素数算出手段によって算出された連結画素数に応じて、前記画像が単色であるか否かを判定する色判定手段を具備し、前記第1の画像は、対象とする画像の色空間における色軸に応じた副画像の1つに対して、前記2値化生成手段によって生成された2値化画像であり、前記第2の画像は、前記第1の画像の副画像とは異なる副画像に対して、前記2値化生成手段によって生成された2値化画像であり、前記第3の画像は、前記第1の画像の副画像及び前記第2の画像の副画像とは異なる副画像に対して、前記2値化生成手段によって生成された2値化画像であることを特徴とする画像処理装置である。
請求項の発明は、対象とする画像の色空間における色軸に応じた3つの副画像に対して、文字領域と背景部を比較して該文字領域の一部を該背景部と区別し得るようにそれぞれ2値化画像を生成する2値化生成手段と、前記2値化生成手段によって生成された3つの2値化画像のうち第1の2値化画像を膨張した第1の膨張画像と3つの2値化画像のうち第2の2値化画像の違いを検出するための論理演算を行い、該第1の膨張画像と該2値化生成手段によって生成された3つの2値化画像のうち第3の2値化画像の違いを検出するための論理演算を行う第1の論理演算手段と、前記第1の膨張画像と前記第2の2値化画像を膨張した第2の膨張画像の違いを検出するための論理演算を行い、該第1の膨張画像と前記第3の2値化画像を膨張した第3の膨張画像の違いを検出するための論理演算を行う第2の論理演算手段と、前記第2の膨張画像と前記第3の膨張画像の違いを検出するための論理演算を行う第3の論理演算手段と、前記第1の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第1の画素数算出手段と、前記第2の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第2の画素数算出手段と、前記第3の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第3の画素数算出手段と、前記第1の画素数算出手段、前記第2の画素数算出手段、前記第3の画素数算出手段によって算出された連結画素数に応じて、前記画像が単色であるか否かを判定する色判定手段を具備することを特徴とする画像処理装置である。
請求項の発明は、前記2値化生成手段は、前記第1の2値化画像を、3つの軸によって表色される色空間における第1の軸の副画像を2値化して生成し、前記第2の2値化画像を、第2の軸の副画像を2値化して生成し、前記第3の2値化画像を、第3の軸の副画像を2値化して生成し、さらに、前記2値化生成手段によって生成された第1の2値化画像を膨張させて、前記第1の膨張画像を生成する第1の膨張画像生成手段と、前記2値化生成手段によって生成された第2の2値化画像を膨張させて、前記第2の膨張画像を生成する第2の膨張画像生成手段と、前記2値化生成手段によって生成された第3の2値化画像を膨張させて、前記第3の膨張画像を生成する第3の膨張画像生成手段と、を具備し、前記第1の論理演算手段は、前記第1の膨張画像生成手段によって生成された第1の膨張画像と前記2値化生成手段によって生成された第2の2値化画像の違いを検出するための論理演算を行い、前記第1の膨張画像と前記2値化生成手段によって生成された第3の2値化画像の違いを検出するための論理演算を行い、前記第1の画素数算出手段は、前記第1の論理演算手段によって第1の膨張画像と第2の2値化画像を論理演算した結果の画像の連結画素数、及び前記第1の論理演算手段によって第1の膨張画像と第3の2値化画像を論理演算した結果の画像の連結画素数を算出し、前記第2の論理演算手段は、前記第1の膨張画像と前記第2の膨張画像生成手段によって生成された第2の膨張画像の違いを検出するための論理演算を行い、前記第1の膨張画像と前記第3の膨張画像生成手段によって生成された第3の膨張画像の違いを検出するための論理演算を行い、前記第2の画素数算出手段は、前記第1の膨張画像と前記第2の膨張画像を論理演算した結果の画像の連結画素数、及び前記第1の膨張画像と前記第3の膨張画像を論理演算した結果の画像の連結画素数を算出し、前記第3の論理演算手段は、前記第2の膨張画像と前記第3の膨張画像の違いを検出するための論理演算を行うことを特徴とする請求項に記載の画像処理装置である。
請求項の発明は、コンピュータを、対象とする画像の色空間における色軸に応じた副画像に対して、文字領域と背景部を比較して該文字領域の一部を該背景部と区別し得るように2値化画像を生成する2値化生成手段と、前記2値化生成手段によって2値化された第1の画像と第2の画像の違いを検出するための論理演算を行う論理演算手段と、前記論理演算手段によって論理演算された結果の画像の連結画素数を算出する画素数算出手段と、前記画素数算出手段によって算出された連結画素数に応じて、前記画像が単色であるか否かを判定する色判定手段として機能させ、前記第1の画像は、対象とする画像の色空間における色軸に応じた副画像の1つに対して、前記2値化生成手段によって生成された2値化画像であり、前記第2の画像は、前記第1の画像の副画像とは異なる副画像に対して、前記2値化生成手段によって生成された2値化画像であることを特徴とする画像処理プログラムである。
請求項の発明は、コンピュータを、対象とする画像の色空間における色軸に応じた副画像に対して、文字領域と背景部を比較して該文字領域の一部を該背景部と区別し得るように2値化画像を生成する2値化生成手段と、前記2値化生成手段によって生成された第1の画像と第2の画像の違いを検出するための論理演算を行う第1の論理演算手段と、前記2値化生成手段によって生成された第1の画像と第3の画像の違いを検出するための論理演算を行う第2の論理演算手段と、前記2値化生成手段によって生成された第2の画像と第3の画像の違いを検出するための論理演算を行う第3の論理演算手段と、前記第1の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第1の画素数算出手段と、前記第2の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第2の画素数算出手段と、前記第3の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第3の画素数算出手段と、前記第1の画素数算出手段、前記第2の画素数算出手段、前記第3の画素数算出手段によって算出された連結画素数に応じて、前記画像が単色であるか否かを判定する色判定手段として機能させ、前記第1の画像は、対象とする画像の色空間における色軸に応じた副画像の1つに対して、前記2値化生成手段によって生成された2値化画像であり、前記第2の画像は、前記第1の画像の副画像とは異なる副画像に対して、前記2値化生成手段によって生成された2値化画像であり、前記第3の画像は、前記第1の画像の副画像及び前記第2の画像の副画像とは異なる副画像に対して、前記2値化生成手段によって生成された2値化画像であることを特徴とする画像処理プログラムである。
請求項の発明は、コンピュータを、対象とする画像の色空間における色軸に応じた3つの副画像に対して、文字領域と背景部を比較して該文字領域の一部を該背景部と区別し得るようにそれぞれ2値化画像を生成する2値化生成手段と、前記2値化生成手段によって生成された3つの2値化画像のうち第1の2値化画像を膨張した第1の膨張画像と3つの2値化画像のうち第2の2値化画像の違いを検出するための論理演算を行い、該第1の膨張画像と該2値化生成手段によって生成された3つの2値化画像のうち第3の2値化画像の違いを検出するための論理演算を行う第1の論理演算手段と、前記第1の膨張画像と前記第2の2値化画像を膨張した第2の膨張画像の違いを検出するための論理演算を行い、該第1の膨張画像と前記第3の2値化画像を膨張した第3の膨張画像の違いを検出するための論理演算を行う第2の論理演算手段と、前記第2の膨張画像と前記第3の膨張画像の違いを検出するための論理演算を行う第3の論理演算手段と、前記第1の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第1の画素数算出手段と、前記第2の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第2の画素数算出手段と、前記第3の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第3の画素数算出手段と、前記第1の画素数算出手段、前記第2の画素数算出手段、前記第3の画素数算出手段によって算出された連結画素数に応じて、前記画像が単色であるか否かを判定する色判定手段として機能させることを特徴とする画像処理プログラムである。
請求項の画像処理装置によれば、色空間における色軸に応じた副画像を用いて、画像に対する処理による色変化の影響があったとしても、本構成を有していない場合に比較して、その画像が単色であるか否かの判定の誤りをより削減することができる。
請求項の画像処理装置によれば、色空間における3つの色軸に応じた副画像を用いて、画像に対する処理による色変化の影響があったとしても、本構成を有していない場合に比較して、その画像が単色であるか否かの判定の誤りをより削減することができる。
請求項の画像処理装置によれば、色空間における3つの色軸に応じた副画像を用いて、画像に対する処理による色変化の影響があったとしても、本構成を有していない場合に比較して、その画像が単色であるか否かの判定の誤りをより削減することができる。
請求項の画像処理装置によれば、雑音による影響を削減し、本構成を有していない場合に比較して、その画像が単色であるか否かの判定の誤りをより削減することができる。
請求項の画像処理プログラムによれば、色空間における色軸に応じた副画像を用いて、画像に対する処理による色変化の影響があったとしても、本構成を有していない場合に比較して、その画像が単色であるか否かの判定の誤りをより削減することができる。
請求項の画像処理プログラムによれば、色空間における3つの色軸に応じた副画像を用いて、画像に対する処理による色変化の影響があったとしても、本構成を有していない場合に比較して、その画像が単色であるか否かの判定の誤りをより削減することができる。
請求項の画像処理プログラムによれば、色空間における3つの色軸に応じた副画像を用いて、画像に対する処理による色変化の影響があったとしても、本構成を有していない場合に比較して、その画像が単色であるか否かの判定の誤りをより削減することができる。
まず、本実施の形態を説明する前に、その前提となる多層構造の符号化方式及び画像に対する処理によって色変化が生じる場合を説明する。この前提の説明は、本実施の形態を理解を容易にすることを目的とするものである。
図15の例に示されるように、赤色で描画された文字(「ABC」、赤色文字1501)と、黒色で描画された文字(「DEF」、黒色文字1502)と、非文字線画部(家が描かれたの画像部分、家画像1503)からなる画像1500が存在する場合、赤色文字の「ABC」のみを抽出した2値画像1505と、黒色文字の「DEF」のみを抽出した2値画像1506と、残りの部分である多値画像1507とに分割し、それぞれの画像を独立に符号化する。また、「ABC」を抽出した2値画像1505の色が赤であり、「DEF」を抽出した2値画像1506の色が黒であるという情報を別途付与する。
なお、本実施の形態が対象とする部分画像とは、4連結又は8連結で連続する画素領域を少なくとも含み、これらの画素領域の集合をも含む。これらの画素領域の集合とは、4連結等で連続した画素領域が複数あり、その複数の画素領域は近傍にあるものをいう。ここで、近傍にあるものとは、例えば、互いの画素領域が距離的に近いもの、文章としての1行から1文字ずつ切り出すように縦又は横方向に射影し、空白地点で切り出した画像領域、又は一定間隔で切り出した画像領域等がある。
なお、1つの画素領域として、1文字の画像となる場合が多い。ただし、実際に人間が文字として認識できる画素領域である必要はない。文字の一部分、文字を形成しない画素領域等もあり、何らかの画素の塊であればよい。例えば、円や線のような図形であってもよい。以下、「文字」又は「文字部画像」という場合は、特に断りがない限り「画素塊」の意で用いる。
例えば、文字を構成する画素の色情報(その色を特定する情報)を、文字の細線化画像の画素上の色情報から求め、仮にその色の分散値が所定閾値以上なら複数色の文字であると判定し、2値の層構造の圧縮対象からは外すことでその文字の色変わりを回避する方式がある。
例えば、この分散値を用いた方式を実現するための判定装置の構成例について、図16を用いて説明する。この判定装置は、2値化処理モジュール1610、文字部切出モジュール1620、分散値算出モジュール1630、閾値処理モジュール1640を有している。なお、この構成は、抜き出した文字が複数色かどうかを判定する部分を示したものである。
2値化処理モジュール1610は、文字部切出モジュール1620と接続されており、受け付けた画像を2値化処理して2値化画像を生成し、その2値化画像を文字部切出モジュール1620へ渡す。
文字部切出モジュール1620は、2値化処理モジュール1610、分散値算出モジュール1630と接続されており、2値化処理モジュール1610から2値化画像を受け取り、その画像内から文字部画像を切り出し、その文字部画像を分散値算出モジュール1630へ渡す。
分散値算出モジュール1630は、文字部切出モジュール1620、閾値処理モジュール1640と接続されており、文字部切出モジュール1620から文字部画像を受け取り、その文字部画像の色情報を元の画像から求め、その色情報を閾値処理モジュール1640へ渡す。例えばRGBコンポーネント毎にその色の分散値を色情報として算出する。なお、RGBコンポーネントとは、RGB色空間におけるR軸、G軸、B軸に応じた副画像のことをいう。つまり、画像がRGBの3色で表されている場合、Rの部分のみの副画像、Gの部分のみの副画像、Bの部分のみの副画像をいう。以下、色空間における色軸に応じた副画像をコンポーネント画像ともいう。
閾値処理モジュール1640は、分散値算出モジュール1630と接続されており、分散値算出モジュール1630から受け取った分散値が所定閾値以上であれば、その文字は複数色であると判定する。
図16の例に示した判定装置では、切り出した文字が複数色で構成される場合、文字の色の分散値だけで複数色かどうかの判定を行うことは非常に困難である。
このことについて、以下、順番に説明する。
複数色で構成される文字において、複数色だと判定されない場合は、図17の例に示すように色変わりが生じてしまう。つまり、図17(a)の例に示すオリジナル文字部画像1701が黒と赤(図では斜め格子柄)の2色で塗り分けられている場合、そのオリジナル文字部画像1701をスキャナで読み取り、そのRGBコンポーネント毎の色の分散値は低いので複数色とは判定されず、単色と判定されてしまう。したがって、オリジナル文字部画像1701の再現画像1702(図17(b))の色は、黒と赤の中間色である茶色となってしまう。
一方、一般的に色付き文字を含む画像をスキャナで読み取った場合は、図18の例に示すように、その読み取りに伴うMTF(Modulation Transfer Factor)の劣化やJPEG圧縮等によって局所的な色変化が文字部のエッジ部に生じてしまう。つまり、図18(a)の例に示すオリジナル文字部画像1801が赤一色であったとしても、スキャナで読み取った場合にMTFの劣化等により、図18(b)の例に示すスキャン文字部画像1802のようにエッジ部に色変化が生じてしまう。
また、図19(a)、(c)の例に示すように、オリジナル文字部画像1701、1801はそれぞれ複数色、単色であるにもかかわらず、MTFの劣化、JPEG圧縮等によって局所的な色変化が生じることにより(図19(b)、(d))、スキャン文字部画像1902、1912の色の分散値は近い値となり、これを所定の閾値によって明確に区別することは困難である。
以上のように、特に多層構造の符号化方式では、文字部に対するMTF劣化、JPEG圧縮等による局所的な色変化の影響を受けないように、単色か否かの判定を行う必要がある。
以下、図面に基づき本発明を実現するにあたっての好適な各種の実施の形態の例を説明する。後述する実施の形態は、画像から切り出した部分画像(文字や線画)が単色であるか否かの判定(複数色であるか否かの判定と同値であり、「単色であるか否かの判定」には複数色であるか否かの判定を含む)に関するものである。特に、画像から、部分画像を切り出して、2値画像符号化プレーンと、多値画像符号化プレーンに分離して画像符号化を行う方式に用いるのに適している。
以下に示す各種の実施の形態の概要は、次の通りである。
(1)類似する色として連結されている画素数が閾値以下である場合は、その画素がスキャンや圧縮等に起因する局所的な色変化によるものであるとして複数色ではないと判定し、閾値以上となる類似する色の連結画素数が2色以上ある場合は複数色であると判定する。
(2)また、類似する色として連結されている画素数を算出するために、限定色化処理を行うか、又はカラー画像の各コンポーネントの2値化画像間で画素毎の論理演算を行う。
図1は、第1の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。所定という用語は、予め定められたの意の他に、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じての意を含めて用いる。
第1の実施の形態は、図1に示すように、文字部切出モジュール110、限定色化処理モジュール120、連結画素数算出モジュール130、閾値設定モジュール140、閾値処理モジュール150を有している。
文字部切出モジュール110は、限定色化処理モジュール120、閾値設定モジュール140と接続されており、対象とする画像から部分画像である文字部画像を切り出す。その切り出した文字部画像を限定色化処理モジュール120へ渡し、文字部画像の形状に関する情報を閾値設定モジュール140へ渡す。文字形状情報として、例えば、文字領域の画素数などがある。
限定色化処理モジュール120は、文字部切出モジュール110、連結画素数算出モジュール130と接続されており、文字部切出モジュール110から渡された文字部画像を限定色化し、その限定色化された画像を連結画素数算出モジュール130へ渡す。なお、限定色化のアルゴリズムは特に限定されず一般的な限定色化処理であってもよい。
連結画素数算出モジュール130は、限定色化処理モジュール120、閾値処理モジュール150と接続されている。限定色化処理モジュール120によって限定色化された文字部画像内の色毎の連結画素数を算出し、限定色毎の連結画素数を閾値処理モジュール150へ渡す。ここでは例えば、後段の処理から、限定された色とその色で連結される画素数の情報として、連結している画素数が多い上位の色(例えば2色)の連結数を渡してもよい。
閾値設定モジュール140は、文字部切出モジュール110、閾値処理モジュール150と接続されており、文字部切出モジュール110から文字形状情報を受け取り、その文字形状情報に応じて正規化した閾値を算出し、その正規化閾値を閾値処理モジュール150へ渡す。例えば、文字領域の面積(画素数)に対する所定の比率から、限定色化された文字画像の画素数に対する正規化閾値を算出する。
閾値処理モジュール150は、連結画素数算出モジュール130、閾値設定モジュール140と接続されている。連結画素数算出モジュール130によって算出された連結画素数を閾値設定モジュール140から渡された正規化閾値と比較して、文字部画像が単色であるか否かを判定し、その判定結果を出力する。例えば、連結画素数算出モジュール130から連結画素数の多い上位の色(例えば2色)の連結画素数を受け取った場合、それぞれの連結画素数を正規化閾値と比較し、1色の連結画素数が正規化閾値を超えた場合は単色の文字と判定し、2色の連結画素数とも正規化閾値を超えた場合は複数色の文字と判定してもよい。
図19に示した例に対する第1の実施の形態による処理例を図2、3に示す。
スキャン文字部画像201、301は、文字部切出モジュール110によって切り出された文字部画像であり、スキャン文字部画像201は、図19(a)の例に示したオリジナル文字部画像1701(2色からなるカラー画像)をスキャナで読み取った画像(つまりスキャン文字部画像1902)から切り出したものであり、スキャン文字部画像301は、図19(c)の例に示したオリジナル文字部画像1801(単色のカラー画像)をスキャナで読み取った画像(つまりスキャン文字部画像1912)から切り出したものである。
限定色化画像202、302は、それぞれスキャン文字部画像201、301に対して、限定色化処理モジュール120によって限定色化された文字部画像である。
連結領域203、204は、限定色化画像202に対して、連結画素数算出モジュール130によって算出された連結画素数が多い上位の2つの領域である。同様に、連結領域303、304は、限定色化画像302に対して、連結画素数算出モジュール130によって算出された連結画素数が多い上位の2つの領域である。
また、文字部切出モジュール110は、スキャン文字部画像201の画素数を計数し、閾値設定モジュール140は、その画素数に基づいて閾値を設定し、閾値処理モジュール150は、設定された閾値と連結領域203、204のそれぞれの画素数とを比較して、単色か否かを判定する。同様に、文字部切出モジュール110は、スキャン文字部画像301の画素数を計数し、閾値設定モジュール140は、その画素数に基づいて閾値を設定し、閾値処理モジュール150は、設定された閾値と連結領域303、304のそれぞれの画素数とを比較して、単色か否かを判定する。この場合、スキャン文字部画像201とスキャン文字部画像301の画素数はほぼ同じであるので閾値もほぼ同じになり、連結領域203、204(つまり2色)の画素数が閾値を超えているので、スキャン文字部画像201は複数色の文字部画像であると判定する。連結領域303の画素数が閾値を超えていないで、連結領域304の画素数が閾値を超えているので、スキャン文字部画像301は単色の文字部画像であると判定する。
図4は、第2の実施の形態の構成例についての概念的なモジュール構成図を示している。
第2の実施の形態は、第1の実施の形態における限定色化処理を簡易的に行うため、まずカラーコンポーネント毎で文字の中央部分(幹部分)の色が1となるような2値化を行う。次に、コンポーネント間で画素単位に論理演算処理(例えばXOR処理)することで、コンポーネント間で文字の幹領域で違う色の画素が1となりやすくなる。最後に論理演算処理画像の最大連結画素数、つまり異なる色画素の塊が閾値以上のときは複数色文字と判定する。
第2の実施の形態は、図4に示すように、文字部切出モジュール410、2値化処理モジュール421、2値化処理モジュール422、論理演算モジュール425、連結画素数算出モジュール430、閾値設定モジュール440、閾値処理モジュール450を有している。なお、第1の実施の形態と同等のものは、第1の実施の形態のモジュールを挙げて説明する。
文字部切出モジュール410は、2値化処理モジュール421、2値化処理モジュール422、閾値設定モジュール440と接続されており、文字部切出モジュール110と同等のものであり、切り出した文字のコンポーネント画像の一つを2値化処理モジュール421へ渡し、その他のコンポーネント画像を2値化処理モジュール422へ渡す。なお、例えばコンポーネント画像として、YCbCr画像を示す。
2値化処理モジュール421、422は、文字部切出モジュール410、論理演算モジュール425と接続されており、文字部切出モジュール410から受け取ったコンポーネント画像に対して2値化処理を行って2値化画像を生成する。そして、それぞれが生成した2値化画像を論理演算モジュール425へ渡す。例えば、2値化処理の閾値を文字領域の平均値とし、背景部の平均値と比較して文字部の幹の領域が1となるようにしてもよい。
論理演算モジュール425は、2値化処理モジュール421、2値化処理モジュール422、連結画素数算出モジュール430と接続されている。2値化処理モジュール421、422から2値化されたコンポーネント画像を受け取り、そのコンポーネント画像間に対して画素毎の論理演算を行う。そして、論理演算画像を連結画素数算出モジュール430に渡す。なお、この論理演算とは、AND、OR、NOT、XOR等を指す。例えば、2つのコンポーネント画像間で異なった画素を「1」とする2値化画像を生成する。この場合の論理演算としてはXORである。
連結画素数算出モジュール430は、論理演算モジュール425、閾値処理モジュール450と接続されており、連結画素数算出モジュール130と同様に、論理演算モジュール425によって論理演算された結果の画像(論理演算画像)の連結画素数を算出する。そして、連結画素数が最も多いものの画素数を閾値処理モジュール450に渡す。前述の例では、「1」となる画素の連結する数をカウントして、その最大値を出力するものである。
閾値設定モジュール440は、文字部切出モジュール410、閾値処理モジュール450と接続されており、閾値設定モジュール140と同等の処理を行う。
閾値処理モジュール450は、連結画素数算出モジュール430、閾値設定モジュール440と接続されており、連結画素数算出モジュール430によって算出された連結画素数に応じて、文字部切出モジュール410によって切り出された文字部画像が単色であるか否かを判定する。例えば、最大連結画素数と正規化閾値とを比較し、正規化閾値を超えた場合は複数色文字と判定し、正規化閾値を超えない場合は単色文字と判定してもよい。
図19に示した例に対する第2の実施の形態による処理例を図5、6に示す。
スキャン文字部画像201、301は、文字部切出モジュール410によって切り出された文字部画像である。
Y画像502、602は、それぞれスキャン文字部画像201、301から、文字部切出モジュール410によってYCrCb空間のY軸に応じたコンポーネント画像である。同様に、Cr画像512、612は、Cr軸に応じたコンポーネント画像である。
2値化画像503、513、603、613は、それぞれY画像502、Cr画像512、Y画像602、Cr画像612に対して、2値化処理モジュール421、422によって2値化処理された2値化画像である。
図5(d)の例に示すXOR処理画像504a、504bは、論理演算モジュール425による2値化画像503と2値化画像513とのXOR処理画像である。同様に、図6(d)の例に示すXOR処理画像604a〜604cは、論理演算モジュール425による2値化画像603と2値化画像613とのXOR処理画像である。
また、文字部切出モジュール410は、スキャン文字部画像201の画素数を計数し、閾値設定モジュール440は、その画素数に基づいて閾値を設定し、閾値処理モジュール450は、設定された閾値とXOR処理画像504a、504bのうちの最大の連結画素数とを比較して、単色か否かを判定する。同様に、文字部切出モジュール410は、スキャン文字部画像301の画素数を計数し、閾値設定モジュール440は、その画素数に基づいて閾値を設定し、閾値処理モジュール450は、設定された閾値とXOR処理画像604a〜604cのうちの最大の連結画素数とを比較して、単色か否かを判定する。この場合、スキャン文字部画像201とスキャン文字部画像301の画素数はほぼ同じであるので閾値もほぼ同じになり、XOR処理画像504aの画素数が閾値を超えているので、スキャン文字部画像201は複数色の文字部画像であると判定する。XOR処理画像604a〜604cのうちの最大の連結画素数が閾値を超えていないで、スキャン文字部画像301は単色の文字部画像であると判定する。
第3の実施の形態は、図7に示すように、文字部切出モジュール710、分散値算出モジュール721、平均値算出モジュール722、2値化処理モジュール723、C1−C2間論理演算モジュール724、C1−C3間論理演算モジュール725、C2−C3間論理演算モジュール726、連結画素数算出モジュール731、連結画素数算出モジュール732、連結画素数算出モジュール733、比較方法決定モジュール741、閾値設定モジュール742、複数色判定モジュール750を有している。
文字部切出モジュール710は、分散値算出モジュール721、平均値算出モジュール722、2値化処理モジュール723、閾値設定モジュール742と接続されており、対象とする画像から部分画像である文字部画像を切り出す。その切り出した文字部画像を分散値算出モジュール721、平均値算出モジュール722、2値化処理モジュール723へ渡し、文字部画像の形状に関する情報を閾値設定モジュール742、分散値算出モジュール721、平均値算出モジュール722へ渡す。文字形状情報として、例えば、文字領域の画素数、文字部画像の2値化画像などがある。
分散値算出モジュール721は、文字部切出モジュール710、比較方法決定モジュール741と接続されており、文字部切出モジュール710から受け取った文字部画像及び文字形状情報を用いて、各コンポーネント毎に文字部画像の分散値を算出し、その分散値を比較方法決定モジュール741へ渡す。
平均値算出モジュール722は、文字部切出モジュール710、2値化処理モジュール723と接続されており、文字部切出モジュール710から受け取った文字部画像及び文字形状情報を用いて、各コンポーネント毎に文字領域の画像の画素平均値を算出し、その平均値を2値化処理モジュール723へ渡す。また、背景領域の平均値を算出するようにしてもよい。
2値化処理モジュール723は、文字部切出モジュール710、平均値算出モジュール722、C1−C2間論理演算モジュール724、C1−C3間論理演算モジュール725、C2−C3間論理演算モジュール726と接続されている。文字部切出モジュール710から受け取った文字部画像の色空間における色軸に応じた副画像の2値化画像を生成する。つまり、各コンポーネント画像毎の文字部画像に対して、平均値算出モジュール722によって算出された平均値を閾値に2値化処理を行って、2値化画像を生成する。その2値化画像を後段のC1−C2間論理演算モジュール724、C1−C3間論理演算モジュール725、C2−C3間論理演算モジュール726へ渡す。2値化処理では、文字領域の平均値と背景領域の平均値とを比較して、背景部に近い方を「0」とすることで、文字の幹部分に相当する画素を「1」とするようにする。ここでは、コンポーネント画像が3つの例であり、2値化されたコンポーネント画像をC1、C2、C3という。ここでは、2値化処理モジュール723は、C1、C2をC1−C2間論理演算モジュール724に渡し、C1、C3をC1−C3間論理演算モジュール725に渡し、C2、C3をC2−C3間論理演算モジュール726に渡す。
C1−C2間論理演算モジュール724は、2値化処理モジュール723、連結画素数算出モジュール731と接続されており、C1−C3間論理演算モジュール725は、2値化処理モジュール723、連結画素数算出モジュール732と接続されており、C2−C3間論理演算モジュール726は、2値化処理モジュール723、連結画素数算出モジュール733と接続されている。これらは、2値化処理モジュール723から受け取ったそれぞれ各コンポーネント画像間で画素毎に論理演算処理をし、その処理画像(2値化画像)をそれぞれ連結画素数算出モジュール731、732、733へ出力する。ここで論理演算は、色の違いを検出するためにXORを用いてもよい。またコンポーネント画像の分散値が所定の閾値より低い場合は、分散値の小さいコンポーネントが「1」で比較対象のコンポーネントが「0」の場合に「1」としてもよい。
連結画素数算出モジュール731は、C1−C2間論理演算モジュール724、複数色判定モジュール750と接続されており、連結画素数算出モジュール732は、C1−C3間論理演算モジュール725、複数色判定モジュール750と接続されており、連結画素数算出モジュール733は、C2−C3間論理演算モジュール726、複数色判定モジュール750と接続されている。これらは、C1−C2間論理演算モジュール724等によって論理演算された処理画像内で最大連結画素数を算出し、その画素数を複数色判定モジュール750へ渡す。
比較方法決定モジュール741は、分散値算出モジュール721、複数色判定モジュール750と接続されており、各コンポーネント画像の分散値によってどのコンポーネント間の比較方法を行うかを決定し、決定した比較方法を比較情報として複数色判定モジュール750へ渡す。また後述する複数色判定モジュール750において、前述のC1−C2間論理演算モジュール724、C1−C3間論理演算モジュール725、C2−C3間論理演算モジュール726を経て、連結画素数算出モジュール731、732、733によって算出される画素数が最大のものを判定に用いる場合には、比較方法決定モジュール741は必要ない。
閾値設定モジュール742は、文字部切出モジュール710、複数色判定モジュール750と接続されており、文字形状情報によって正規化された閾値を、複数色判定モジュール750に設定する。
複数色判定モジュール750は、連結画素数算出モジュール731、連結画素数算出モジュール732、連結画素数算出モジュール733、比較方法決定モジュール741、閾値設定モジュール742と接続されており、比較方法決定モジュール741から受け取った比較情報によって比較する最大連結画素数を選択し、その値が正規化された閾値を超えていればその文字部画像は複数色とし、閾値を超えていなければ単色の文字部画像と判定し、その判定結果を出力する。
第4の実施の形態は、図8に示すように、文字部切出モジュール810、分散値算出モジュール821、平均値算出モジュール822、2値化処理モジュール823、第1演算モジュール824、第2演算モジュール825、第3演算モジュール826、連結画素数算出モジュール831、連結画素数算出モジュール832、連結画素数算出モジュール833、比較方法決定モジュール841、閾値設定モジュール842、複数色判定モジュール850を有している。なお、第3の実施の形態と同等のものは、第3の実施の形態のモジュールを挙げて説明する。文字部切出モジュール810、分散値算出モジュール821、平均値算出モジュール822、閾値設定モジュール842は、それぞれ第3の実施の形態の文字部切出モジュール710、分散値算出モジュール721、平均値算出モジュール722、閾値設定モジュール742と同等である。コンポーネント画像として、Y画像、Cb画像、Cr画像を用いる。
2値化処理モジュール823は、文字部切出モジュール810、平均値算出モジュール822、第1演算モジュール824、第2演算モジュール825、第3演算モジュール826と接続されている。2値化処理モジュール723と同等の処理を行う。ただし、文字部切出モジュール810から受け取った文字部画像のYCbCr色空間におけるY軸、Cb軸、Cr軸に応じたコンポーネント画像の2値化画像を生成する。つまり、各コンポーネント画像毎の文字部画像に対して、平均値算出モジュール722によって算出された平均値を閾値にして2値化処理を行って、2値化画像を生成する。生成したYコンポーネント2値化画像を第1演算モジュール824、第2演算モジュール825へ渡し、Cbコンポーネント2値化画像、Crコンポーネント2値化画像を第1演算モジュール824、第2演算モジュール825、第3演算モジュール826へ渡す。
第1演算モジュール824は、2値化処理モジュール823、連結画素数算出モジュール831と接続されており、第2演算モジュール825は、2値化処理モジュール823、連結画素数算出モジュール832と接続されており、第3演算モジュール826は、2値化処理モジュール823、連結画素数算出モジュール833と接続されている。それぞれは、2値化処理モジュール823によって生成された複数のコンポーネント2値化画像間の論理演算を行う。その処理画像(2値化画像)をそれぞれ連結画素数算出モジュール831、832、833へ出力する。詳細については、図9、10、11を用いて後述する。
連結画素数算出モジュール831は、第1演算モジュール824、複数色判定モジュール850と接続されており、連結画素数算出モジュール832は、第2演算モジュール825、複数色判定モジュール850と接続されており、連結画素数算出モジュール833は、第3演算モジュール826、複数色判定モジュール850と接続されている。これらは、それぞれ第1演算モジュール824等によって論理演算された処理画像内の連結画素数を算出し、その画素数を複数色判定モジュール850へ渡す。詳細については、図9、10、11を用いて後述する。
比較方法決定モジュール841は、分散値算出モジュール821、複数色判定モジュール850と接続されており、分散値算出モジュール821によって算出された各コンポーネントの分散値によって比較方法を決定し、決定した比較方法を比較情報として複数色判定モジュール850へ渡す。
複数色判定モジュール850は、連結画素数算出モジュール831、連結画素数算出モジュール832、連結画素数算出モジュール833、比較方法決定モジュール841、閾値設定モジュール842と接続されており、比較方法決定モジュール841から受け取った比較情報によって比較する連結画素数を選択し、その値が正規化された閾値を超えていればその文字部画像は複数色とし、閾値を超えていなければ単色の文字部画像と判定し、その判定結果を出力する。
より詳細に説明する。まず連結画素数を比較情報によって選択する。3つの比較条件のうち2つに当てはまる場合もあるので、優先順位を付けて選択する。例えば、最初にYが低分散値であれば、第3演算モジュール826の演算処理結果を用いて、それに当てはまらない場合は、Cb及びCrの分散値が閾値以上であれば、第2演算モジュール825の演算処理結果を用い、以上の2つの条件に当てはまらない場合は、第1演算モジュール824の演算処理結果を用いることとする。次に、その演算結果の値が閾値を超えていればその文字部画像は複数色と判定し、閾値を超えていなければ単色文字と判定し、その判定結果を出力する。
Cb、Crの分散値が閾値より低い場合の処理(つまり、第1演算モジュール824と連結画素数算出モジュール831による処理)について説明する。
Cb、Crの分散値が低い場合は、一般的に文字部画像において、色の違う画素が少ないか、色差が小さいかのどちらかになる。この画像を文字領域の平均値によって2値化すると、ダイナミックレンジの小さい雑音をそのまま2値化するため、2値化画像の形状には多くの雑音が反映されたものとなる。
このため、この影響を少なくするため、YとCb及びYとCrの演算処理を行う場合は、Yコンポーネント2値化画像をn回(nは0以上の整数)膨張させ、さらに分散が小さいコンポーネント画像(Cb、Cr)が1となる場合だけXOR処理を行うこととする。つまり膨張処理をしたYの2値化画像からCb、Crの2値化画像がはみ出た画素だけ出力する。
これを図9を用いて説明する。第1演算モジュール824は、膨張処理モジュール910、Cb−Y間XOR処理モジュール921、Cr−Y間XOR処理モジュール922を有している。
膨張処理モジュール910は、Cb−Y間XOR処理モジュール921、Cr−Y間XOR処理モジュール922と接続されており、Yコンポーネント2値化画像を受け取り、n回膨張させる。その膨張させたYコンポーネント2値化画像をCb−Y間XOR処理モジュール921、Cr−Y間XOR処理モジュール922に渡す。
Cb−Y間XOR処理モジュール921は、膨張処理モジュール910、連結画素数算出モジュール831と接続されており、膨張処理モジュール910から膨張されたYコンポーネント2値化画像、2値化処理モジュール823からCbコンポーネント2値化画像を受け取り、その両者間の論理演算を行って、その論理演算結果である処理画像を連結画素数算出モジュール831へ渡す。論理演算として、例えば、Cbコンポーネント2値化画像が1となる場合だけXOR処理を行う。
Cr−Y間XOR処理モジュール922は、膨張処理モジュール910、連結画素数算出モジュール831と接続されており、膨張処理モジュール910から膨張されたYコンポーネント2値化画像、2値化処理モジュール823からCrコンポーネント2値化画像を受け取り、その両者間の論理演算を行って、その論理演算結果である処理画像を連結画素数算出モジュール831へ渡す。論理演算として、例えば、Crコンポーネント2値化画像が1となる場合だけXOR処理を行う。
連結画素数算出モジュール831は、Cb−Y間XOR処理モジュール921、Cr−Y間XOR処理モジュール922と接続されている。前述の処理後に、連結画素数算出モジュール831が各連結画素の画素数をカウントし、Yコンポーネント2値化画像とCbコンポーネント2値化画像、Yコンポーネント2値化画像とCrコンポーネント2値化画像の両者の論理演算の結果のうち最大連結画素数を出力する。
Cb、Crの分散値が閾値より高い場合の処理(つまり、第2演算モジュール825と連結画素数算出モジュール832による処理)について説明する。
Cb、Crの分散値が高い場合は、一般的に文字部画像において、色の違う画素が多いか、色差が大きいかのどちらかになる。このため、Cb、Crが低分散値である時と違って、平均値による2値化画像の形状には、安定的に色の違いが現われる。
このため、YとCb及びYとCrのXOR処理を行う場合は、Y、Cb、Crのコンポーネント2値化画像を雑音除去の目的からm回(mは0以上の整数)膨張させ、一般的なXOR処理を行うこととする。つまり膨張処理をしたYコンポーネント2値化画像とCb、Crのコンポーネント2値化画像の異なる画素だけを出力する。
これを図10を用いて説明する。第2演算モジュール825は、膨張処理モジュール1012、膨張処理モジュール1013、Cb−Y間XOR処理モジュール1021、Cr−Y間XOR処理モジュール1022を有している。
膨張処理モジュール1011は、Cb−Y間XOR処理モジュール1021、Cr−Y間XOR処理モジュール1022と接続されており、膨張処理モジュール1012は、Cb−Y間XOR処理モジュール1021と接続されており、膨張処理モジュール1013は、Cr−Y間XOR処理モジュール1022と接続されている。それぞれは、2値化処理モジュール823からYコンポーネント2値化画像、Cbコンポーネント2値化画像、Crコンポーネント2値化画像を受け取り、m回膨張させる。その膨張させたYコンポーネント2値化画像をCb−Y間XOR処理モジュール1021、Cr−Y間XOR処理モジュール1022へ渡し、膨張させたCbコンポーネント2値化画像をCb−Y間XOR処理モジュール1021へ渡し、膨張させたCrコンポーネント2値化画像をCr−Y間XOR処理モジュール1022へ渡す。なお、膨張処理モジュール1011、1012、1013は、それぞれ異なる回数だけ膨張するようにしてもよい。
Cb−Y間XOR処理モジュール1021は、膨張処理モジュール1011、膨張処理モジュール1012、連結画素数算出モジュール832と接続されており、膨張処理モジュール1011から膨張されたYコンポーネント2値化画像、膨張処理モジュール1012から膨張されたCbコンポーネント2値化画像を受け取り、その両者間の論理演算を行って、その論理演算結果である処理画像を連結画素数算出モジュール832へ渡す。論理演算として、例えば、XOR処理を行う。
Cr−Y間XOR処理モジュール1022は、膨張処理モジュール1011、膨張処理モジュール1013、連結画素数算出モジュール832と接続されており、膨張処理モジュール1011から膨張されたYコンポーネント2値化画像、膨張処理モジュール1013から膨張されたCrコンポーネント2値化画像を受け取り、その両者間の論理演算を行って、その論理演算結果である処理画像を連結画素数算出モジュール832へ渡す。論理演算として、例えば、XOR処理を行う。
連結画素数算出モジュール832は、Cb−Y間XOR処理モジュール1021、Cr−Y間XOR処理モジュール1022と接続されている。前述の処理後に、連結画素数算出モジュール832が各連結画素の画素数をカウントし、Yコンポーネント2値化画像とCbコンポーネント2値化画像、Yコンポーネント2値化画像とCrコンポーネント2値化画像の両者の論理演算の結果のうち最大連結画素数を出力する。
Yの分散値が閾値より低い場合の処理(つまり、第3演算モジュール826と連結画素数算出モジュール833による処理)について説明する。さらに、CbとCrの分散が閾値より大きい場合という条件を設けてもよい。
Yの分散値が閾値より低くCbとCrの分散値が閾値より大きい場合は、輝度変化は少ないが、色差がある程度違う画素が存在する。このため、CbとCrの2値化画像のみの比較を行う。
したがって、雑音除去の目的からCb及びCrの2値化画像をk回(kは0以上の整数)膨張させ、一般的なXOR処理を行う。つまり膨張処理をしたCbとCrの2値化画像の異なる画素だけ出力する。
これを図11を用いて説明する。第3演算モジュール826は、膨張処理モジュール1111、膨張処理モジュール1112、Cb−Cr間XOR処理モジュール1120を有している。
膨張処理モジュール1111は、Cb−Cr間XOR処理モジュール1120と接続されており、膨張処理モジュール1112は、Cb−Cr間XOR処理モジュール1120と接続されている。それぞれは、2値化処理モジュール823からCbコンポーネント2値化画像、Crコンポーネント2値化画像を受け取り、k回膨張させる。その膨張させたCbコンポーネント2値化画像、Crコンポーネント2値化画像をCb−Cr間XOR処理モジュール1120へ渡す。なお、膨張処理モジュール1111、1112は、それぞれ異なる回数だけ膨張するようにしてもよい。
Cb−Cr間XOR処理モジュール1120は、膨張処理モジュール1111、膨張処理モジュール1112、連結画素数算出モジュール833と接続されており、膨張処理モジュール1111から膨張されたCbコンポーネント2値化画像を受け取り、膨張処理モジュール1112から膨張されたCrコンポーネント2値化画像を受け取り、その両者間の論理演算を行って、その論理演算結果である処理画像を連結画素数算出モジュール833へ渡す。論理演算として、例えば、XOR処理を行う。
連結画素数算出モジュール833は、Cb−Cr間XOR処理モジュール1120と接続されている。前述の処理後に、連結画素数算出モジュール833が各連結画素の画素数をカウントし、最大連結画素数を出力する。
図19に示した例に対する第4の実施の形態による処理例を図12、13に示す。
オリジナルの文字部画像の例として、図12に示す例は複数色からなる文字部画像、図13に示す例は単色の文字部画像を取り上げる。スキャナで読み取って細線化した画像の色情報をみると、両者の分散値が近い場合に、図16に示した構成例では判定が難しかった。
スキャン文字部画像201は、文字部切出モジュール810によって切り出された文字部画像である。
コンポーネント画像1202、1212、1222は、2値化処理モジュール823が2値化処理の対象とするY、Cr、Cbのコンポーネント画像である。これらに対して、2値化処理モジュール823によってコンポーネント画像毎に平均値を使って2値化処理された画像が、コンポーネント2値化画像1203、1213、1223である。次に、Cr−Y間XOR処理モジュール922又はCr−Y間XOR処理モジュール1022によって論理演算処理された画像は、論理演算処理画像1204a〜1204bであり、Cb−Y間XOR処理モジュール921又はCb−Y間XOR処理モジュール1021によって論理演算処理された画像は、論理演算処理画像1214a〜1214eであり、Cb−Cr間XOR処理モジュール1120によって論理演算処理された画像は、論理演算処理画像1224a〜1224dである。
そして、比較方法決定モジュール841によって、コンポーネント画像の分散値からCb、Crが高い分散値であると判定される。これによって、連結画素数算出モジュール832の算出結果が採用される。このことは、Cb−Y間XOR処理モジュール1021とCr−Y間XOR処理モジュール1022の処理結果(Y−Cbの2値化画像間(つまり、コンポーネント2値化画像1203とコンポーネント2値化画像1223)及びY−Crの2値化画像間(つまり、コンポーネント2値化画像1203とコンポーネント2値化画像1213)のXOR処理の処理結果)に対して、両者のXOR処理画像で「1」の画素が色が変わった画素に相当する。さらに連結画素数算出モジュール832によって両者の最大連結画素成分の画素数を算出する。
これが文字部画像の中で色が違っている箇所の中で最大面積になるため、最大連結画素数が閾値(文字で許容できる色変化の割合)を超えていれば複数色の文字とし、超えていなければ単色とする。図12に示す例では、最大画素数となる論理演算処理画像1204aが閾値を超えているので、スキャン文字部画像201は複数色からなる文字と判定される。
なお、図12の論理演算処理画像1224a〜1224dに示すように、比較対象と判定されないCb−Cr2値化画像間(つまり、コンポーネント2値化画像1213とコンポーネント2値化画像1223)の比較を行うと、単色という判定になってしまう。
スキャン文字部画像301は、文字部切出モジュール810によって切り出された文字部画像である。
コンポーネント画像1302、1312、1322は、2値化処理モジュール823が2値化処理の対象とするY、Cr、Cbのコンポーネント画像である。これらに対して、2値化処理モジュール823によってコンポーネント画像毎に平均値を使って2値化処理された画像が、コンポーネント2値化画像1303、1313、1323である。次に、Cr−Y間XOR処理モジュール922又はCr−Y間XOR処理モジュール1022によって論理演算処理された画像は、XOR処理画像1304a〜1304cであり、Cb−Y間XOR処理モジュール921又はCb−Y間XOR処理モジュール1021によって論理演算処理された画像は、XOR処理画像1314a〜1314fであり、Cb−Cr間XOR処理モジュール1120によって論理演算処理された画像は、XOR処理画像1324a〜1324eである。
そして、比較方法決定モジュール841によって、コンポーネント画像の分散値からCb、Crが高い分散値であると判定される。これによって、連結画素数算出モジュール832の算出結果が採用される。このことは、Cb−Y間XOR処理モジュール1021とCr−Y間XOR処理モジュール1022の処理結果(Y−Cbの2値化画像間(つまり、コンポーネント2値化画像1303とコンポーネント2値化画像1323)及びY−Crの2値化画像間(つまり、コンポーネント2値化画像1303とコンポーネント2値化画像1313)のXOR処理の処理結果)に対して、両者のXOR処理画像で「1」の画素が色が変わった画素に相当する。さらに連結画素数算出モジュール832によって両者の最大連結画素成分の画素数を算出する。
これが文字部画像の中で色が違っている箇所の中で最大面積になるため、最大連結画素数が閾値(文字で許容できる色変化の割合)を超えていれば複数色の文字とし、超えていなければ単色とする。図13に示す例では、最大画素数となるXOR処理画像1314bが閾値を超えていないので、スキャン文字部画像301は単色の文字と判定される。
なお、図13のXOR処理画像1324a〜1324eに示すように、比較対象と判定されないCb−Cr2値化画像間(つまり、コンポーネント2値化画像1313とコンポーネント2値化画像1323)の比較を行っても、単色という判定になる。
図14を参照して、前述の実施の形態のハードウェア構成例について説明する。図14に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナ等のデータ読み取り部1417と、プリンタなどのデータ出力部1418を備えたハードウェア構成例を示している。
CPU(Central Processing Unit)1401は、前述の実施の形態において説明した各種のモジュール、すなわち、文字部切出モジュール110、限定色化処理モジュール120、連結画素数算出モジュール130、閾値設定モジュール140、閾値処理モジュール150等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
ROM(Read Only Memory)1402は、CPU1401が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)1403は、CPU1401の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス1404により相互に接続されている。
ホストバス1404は、ブリッジ1405を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス1406に接続されている。
キーボード1408、マウス等のポインティングデバイス1409は、操作者により操作される入力デバイスである。ディスプレイ1410は、液晶表示装置又はCRT(Cathode Ray Tube)などからなり、各種情報をテキストやイメージ情報として表示する。
HDD(Hard Disk Drive)1411は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU1401によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、対象とするカラー画像、2値化画像などが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
ドライブ1412は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体1413に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース1407、外部バス1406、ブリッジ1405、及びホストバス1404を介して接続されているRAM1403に供給する。リムーバブル記録媒体1413も、ハードディスクと同様のデータ記録領域として利用可能である。
接続ポート1414は、外部接続機器1415を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート1414は、インタフェース1407、及び外部バス1406、ブリッジ1405、ホストバス1404等を介してCPU1401等に接続されている。通信部1416は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部1417は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部1418は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
なお、図14に示すハードウェア構成は、1つの構成例を示すものであり、前述の実施の形態は、図14に示す構成に限らず、前述の実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図14に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
前述の実施の形態では表色系における色空間として、YCbCrによる色空間を用いたが、この他に、XYZ、CIELAB(L)、CIELUV(L)、NTS CRGB、RGB、YMCK等で表現される色空間を用いてもよい。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
第1の実施の形態の構成例についての概念的なモジュール構成図である。 第1の実施の形態による処理例を示す説明図である。 第1の実施の形態による処理例を示す説明図である。 第2の実施の形態の構成例についての概念的なモジュール構成図である。 第2の実施の形態による処理例を示す説明図である。 第2の実施の形態による処理例を示す説明図である。 第3の実施の形態の構成例についての概念的なモジュール構成図である。 第4の実施の形態の構成例についての概念的なモジュール構成図である。 第1演算モジュール内の構成例についての概念的なモジュール構成図である。 第2論理演算モジュール内の構成例についての概念的なモジュール構成図である。 第3論理演算モジュール内の構成例についての概念的なモジュール構成図である。 第4の実施の形態による処理例を示す説明図である。 第4の実施の形態による処理例を示す説明図である。 第1〜4の実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。 従来例を示す説明図である。 分散値を用いた判定装置の構成例についての概念的なモジュール構成図である。 複数色だと判定されない場合に色変化が生じた画像例を示す説明図である。 スキャン等によって色変化が生じた画像例を示す説明図である。 スキャン等によって色変化が生じた画像例を示す説明図である。
符号の説明
110、410、710、810…文字部切出モジュール
120…限定色化処理モジュール
130、430、731、732、733、831、832、833…連結画素数算出モジュール
140、440、742、842…閾値設定モジュール
150、450…閾値処理モジュール
421、422、723、823…2値化処理モジュール
425…論理演算モジュール
721、821…分散値算出モジュール
722、822…平均値算出モジュール
724…C1−C2間論理演算モジュール
725…C1−C3間論理演算モジュール
726…C2−C3間論理演算モジュール
741、841…比較方法決定モジュール
750、850…複数色判定モジュール
824…第1演算モジュール
825…第2演算モジュール
826…第3演算モジュール
910、1011、1012、1013、1111、1112…膨張処理モジュール
921、1021…Cb−Y間XOR処理モジュール
922、1022…Cr−Y間XOR処理モジュール
1120…Cb−Cr間XOR処理モジュール
1610…2値化処理モジュール
1620…文字部切出モジュール
1630…分散値算出モジュール
1640…閾値処理モジュール

Claims (7)

  1. 対象とする画像の色空間における色軸に応じた副画像に対して、文字領域と背景部を比較して該文字領域の一部を該背景部と区別し得るように2値化画像を生成する2値化生成手段と、
    前記2値化生成手段によって2値化された第1の画像と第2の画像の違いを検出するための論理演算を行う論理演算手段と、
    前記論理演算手段によって論理演算された結果の画像の連結画素数を算出する画素数算出手段と、
    前記画素数算出手段によって算出された連結画素数に応じて、前記画像が単色であるか否かを判定する色判定手段
    を具備し、
    前記第1の画像は、対象とする画像の色空間における色軸に応じた副画像の1つに対して、前記2値化生成手段によって生成された2値化画像であり、
    前記第2の画像は、前記第1の画像の副画像とは異なる副画像に対して、前記2値化生成手段によって生成された2値化画像である
    ことを特徴とする画像処理装置。
  2. 対象とする画像の色空間における色軸に応じた副画像に対して、文字領域と背景部を比較して該文字領域の一部を該背景部と区別し得るように2値化画像を生成する2値化生成手段と、
    前記2値化生成手段によって生成された第1の画像と第2の画像の違いを検出するための論理演算を行う第1の論理演算手段と、
    前記2値化生成手段によって生成された第1の画像と第3の画像の違いを検出するための論理演算を行う第2の論理演算手段と、
    前記2値化生成手段によって生成された第2の画像と第3の画像の違いを検出するための論理演算を行う第3の論理演算手段と、
    前記第1の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第1の画素数算出手段と、
    前記第2の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第2の画素数算出手段と、
    前記第3の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第3の画素数算出手段と、
    前記第1の画素数算出手段、前記第2の画素数算出手段、前記第3の画素数算出手段によって算出された連結画素数に応じて、前記画像が単色であるか否かを判定する色判定手段
    を具備し、
    前記第1の画像は、対象とする画像の色空間における色軸に応じた副画像の1つに対して、前記2値化生成手段によって生成された2値化画像であり、
    前記第2の画像は、前記第1の画像の副画像とは異なる副画像に対して、前記2値化生成手段によって生成された2値化画像であり、
    前記第3の画像は、前記第1の画像の副画像及び前記第2の画像の副画像とは異なる副画像に対して、前記2値化生成手段によって生成された2値化画像である
    ことを特徴とする画像処理装置。
  3. 対象とする画像の色空間における色軸に応じた3つの副画像に対して、文字領域と背景部を比較して該文字領域の一部を該背景部と区別し得るようにそれぞれ2値化画像を生成する2値化生成手段と、
    前記2値化生成手段によって生成された3つの2値化画像のうち第1の2値化画像を膨張した第1の膨張画像と3つの2値化画像のうち第2の2値化画像の違いを検出するための論理演算を行い、
    該第1の膨張画像と該2値化生成手段によって生成された3つの2値化画像のうち第3の2値化画像の違いを検出するための論理演算を行う第1の論理演算手段と、
    前記第1の膨張画像と前記第2の2値化画像を膨張した第2の膨張画像の違いを検出するための論理演算を行い、
    該第1の膨張画像と前記第3の2値化画像を膨張した第3の膨張画像の違いを検出するための論理演算を行う第2の論理演算手段と、
    前記第2の膨張画像と前記第3の膨張画像の違いを検出するための論理演算を行う第3の論理演算手段と、
    前記第1の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第1の画素数算出手段と、
    前記第2の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第2の画素数算出手段と、
    前記第3の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第3の画素数算出手段と、
    前記第1の画素数算出手段、前記第2の画素数算出手段、前記第3の画素数算出手段によって算出された連結画素数に応じて、前記画像が単色であるか否かを判定する色判定手段
    を具備することを特徴とする画像処理装置。
  4. 前記2値化生成手段は、前記第1の2値化画像を、3つの軸によって表色される色空間における第1の軸の副画像を2値化して生成し、前記第2の2値化画像を、第2の軸の副画像を2値化して生成し、前記第3の2値化画像を、第3の軸の副画像を2値化して生成し、
    さらに、
    前記2値化生成手段によって生成された第1の2値化画像を膨張させて、前記第1の膨張画像を生成する第1の膨張画像生成手段と、
    前記2値化生成手段によって生成された第2の2値化画像を膨張させて、前記第2の膨張画像を生成する第2の膨張画像生成手段と、
    前記2値化生成手段によって生成された第3の2値化画像を膨張させて、前記第3の膨張画像を生成する第3の膨張画像生成手段と、
    を具備し、
    前記第1の論理演算手段は、前記第1の膨張画像生成手段によって生成された第1の膨張画像と前記2値化生成手段によって生成された第2の2値化画像の違いを検出するための論理演算を行い、前記第1の膨張画像と前記2値化生成手段によって生成された第3の2値化画像の違いを検出するための論理演算を行い、
    前記第1の画素数算出手段は、前記第1の論理演算手段によって第1の膨張画像と第2の2値化画像を論理演算した結果の画像の連結画素数、及び前記第1の論理演算手段によって第1の膨張画像と第3の2値化画像を論理演算した結果の画像の連結画素数を算出し、
    前記第2の論理演算手段は、前記第1の膨張画像と前記第2の膨張画像生成手段によって生成された第2の膨張画像の違いを検出するための論理演算を行い、前記第1の膨張画像と前記第3の膨張画像生成手段によって生成された第3の膨張画像の違いを検出するための論理演算を行い、
    前記第2の画素数算出手段は、前記第1の膨張画像と前記第2の膨張画像を論理演算した結果の画像の連結画素数、及び前記第1の膨張画像と前記第3の膨張画像を論理演算した結果の画像の連結画素数を算出し、
    前記第3の論理演算手段は、前記第2の膨張画像と前記第3の膨張画像の違いを検出するための論理演算を行う
    ことを特徴とする請求項に記載の画像処理装置。
  5. コンピュータを、
    対象とする画像の色空間における色軸に応じた副画像に対して、文字領域と背景部を比較して該文字領域の一部を該背景部と区別し得るように2値化画像を生成する2値化生成手段と、
    前記2値化生成手段によって2値化された第1の画像と第2の画像の違いを検出するための論理演算を行う論理演算手段と、
    前記論理演算手段によって論理演算された結果の画像の連結画素数を算出する画素数算出手段と、
    前記画素数算出手段によって算出された連結画素数に応じて、前記画像が単色であるか否かを判定する色判定手段
    として機能させ
    前記第1の画像は、対象とする画像の色空間における色軸に応じた副画像の1つに対して、前記2値化生成手段によって生成された2値化画像であり、
    前記第2の画像は、前記第1の画像の副画像とは異なる副画像に対して、前記2値化生成手段によって生成された2値化画像である
    ことを特徴とする画像処理プログラム。
  6. コンピュータを、
    対象とする画像の色空間における色軸に応じた副画像に対して、文字領域と背景部を比較して該文字領域の一部を該背景部と区別し得るように2値化画像を生成する2値化生成手段と、
    前記2値化生成手段によって生成された第1の画像と第2の画像の違いを検出するための論理演算を行う第1の論理演算手段と、
    前記2値化生成手段によって生成された第1の画像と第3の画像の違いを検出するための論理演算を行う第2の論理演算手段と、
    前記2値化生成手段によって生成された第2の画像と第3の画像の違いを検出するための論理演算を行う第3の論理演算手段と、
    前記第1の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第1の画素数算出手段と、
    前記第2の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第2の画素数算出手段と、
    前記第3の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第3の画素数算出手段と、
    前記第1の画素数算出手段、前記第2の画素数算出手段、前記第3の画素数算出手段によって算出された連結画素数に応じて、前記画像が単色であるか否かを判定する色判定手段
    として機能させ
    前記第1の画像は、対象とする画像の色空間における色軸に応じた副画像の1つに対して、前記2値化生成手段によって生成された2値化画像であり、
    前記第2の画像は、前記第1の画像の副画像とは異なる副画像に対して、前記2値化生成手段によって生成された2値化画像であり、
    前記第3の画像は、前記第1の画像の副画像及び前記第2の画像の副画像とは異なる副画像に対して、前記2値化生成手段によって生成された2値化画像である
    ことを特徴とする画像処理プログラム。
  7. コンピュータを、
    対象とする画像の色空間における色軸に応じた3つの副画像に対して、文字領域と背景部を比較して該文字領域の一部を該背景部と区別し得るようにそれぞれ2値化画像を生成する2値化生成手段と、
    前記2値化生成手段によって生成された3つの2値化画像のうち第1の2値化画像を膨張した第1の膨張画像と3つの2値化画像のうち第2の2値化画像の違いを検出するための論理演算を行い、
    該第1の膨張画像と該2値化生成手段によって生成された3つの2値化画像のうち第3の2値化画像の違いを検出するための論理演算を行う第1の論理演算手段と、
    前記第1の膨張画像と前記第2の2値化画像を膨張した第2の膨張画像の違いを検出するための論理演算を行い、
    該第1の膨張画像と前記第3の2値化画像を膨張した第3の膨張画像の違いを検出するための論理演算を行う第2の論理演算手段と、
    前記第2の膨張画像と前記第3の膨張画像の違いを検出するための論理演算を行う第3の論理演算手段と、
    前記第1の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第1の画素数算出手段と、
    前記第2の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第2の画素数算出手段と、
    前記第3の論理演算手段によって論理演算された結果の画像の連結画素数を算出する第3の画素数算出手段と、
    前記第1の画素数算出手段、前記第2の画素数算出手段、前記第3の画素数算出手段によって算出された連結画素数に応じて、前記画像が単色であるか否かを判定する色判定手段
    として機能させることを特徴とする画像処理プログラム。
JP2008100593A 2008-04-08 2008-04-08 画像処理装置及び画像処理プログラム Expired - Fee Related JP4770863B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008100593A JP4770863B2 (ja) 2008-04-08 2008-04-08 画像処理装置及び画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008100593A JP4770863B2 (ja) 2008-04-08 2008-04-08 画像処理装置及び画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2009253751A JP2009253751A (ja) 2009-10-29
JP4770863B2 true JP4770863B2 (ja) 2011-09-14

Family

ID=41313967

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008100593A Expired - Fee Related JP4770863B2 (ja) 2008-04-08 2008-04-08 画像処理装置及び画像処理プログラム

Country Status (1)

Country Link
JP (1) JP4770863B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3061812B2 (ja) * 1989-06-12 2000-07-10 日本電気株式会社 パターン認識方法および装置
CN100346339C (zh) * 2002-11-20 2007-10-31 富士通株式会社 图像检索方法及图像检索装置
JP2005244649A (ja) * 2004-02-26 2005-09-08 Fuji Xerox Co Ltd 画像処理装置
JP4396331B2 (ja) * 2004-03-10 2010-01-13 富士ゼロックス株式会社 画像処理装置

Also Published As

Publication number Publication date
JP2009253751A (ja) 2009-10-29

Similar Documents

Publication Publication Date Title
JP5206503B2 (ja) 画像処理装置及び画像処理プログラム
US7936929B2 (en) Image processing method and apparatus for removing noise from a document image
JP4766030B2 (ja) 画像処理装置及び画像処理プログラム
US8059896B2 (en) Character recognition processing system and computer readable medium storing program for character recognition processing
JP5337563B2 (ja) 帳票認識方法および装置
CN105407251A (zh) 图像处理装置及图像处理方法
JP5304529B2 (ja) 画像処理装置及び画像処理プログラム
JP4770863B2 (ja) 画像処理装置及び画像処理プログラム
KR101646042B1 (ko) 화상 처리 장치, 화상 처리 방법, 및 컴퓨터 가독 기억 매체
JP5407582B2 (ja) 画像処理装置及び画像処理プログラム
JP4894664B2 (ja) 画像処理システム及び画像処理プログラム
JP5200993B2 (ja) 画像処理装置及び画像処理プログラム
JP2010152457A (ja) 画像処理装置及び画像処理プログラム
JP4840388B2 (ja) 画像処理装置及び画像処理プログラム
JP4872780B2 (ja) 画像処理システム及び画像処理プログラム
JP3763954B2 (ja) 文字認識用の学習データ作成方法および記録媒体
JP4650958B2 (ja) 画像処理装置、方法およびプログラム
JP5206468B2 (ja) 画像処理装置及び画像処理プログラム
JP2003032480A (ja) 画像処理装置及び画像処理方法
JP5457853B2 (ja) 画像符号化装置、画像符号化方法、プログラム及び記憶媒体
JP6481301B2 (ja) 画像処理装置及び画像処理プログラム
JP2012142872A (ja) 画像処理装置及び画像処理プログラム
JP5636674B2 (ja) 画像処理装置及び画像処理プログラム
JP2007034972A (ja) 罫線検出装置、罫線検出方法およびプログラム
JP2017169047A (ja) 画像処理装置及び画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090825

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110304

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110308

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110506

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110524

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110606

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140701

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees