JP4483563B2 - 画像処理装置、画像処理方法および画像処理プログラム - Google Patents

画像処理装置、画像処理方法および画像処理プログラム Download PDF

Info

Publication number
JP4483563B2
JP4483563B2 JP2004359709A JP2004359709A JP4483563B2 JP 4483563 B2 JP4483563 B2 JP 4483563B2 JP 2004359709 A JP2004359709 A JP 2004359709A JP 2004359709 A JP2004359709 A JP 2004359709A JP 4483563 B2 JP4483563 B2 JP 4483563B2
Authority
JP
Japan
Prior art keywords
data
binarized
binarized data
image
correction target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2004359709A
Other languages
English (en)
Other versions
JP2006173723A (ja
Inventor
宏樹 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Business Technologies Inc
Original Assignee
Konica Minolta Business Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Business Technologies Inc filed Critical Konica Minolta Business Technologies Inc
Priority to JP2004359709A priority Critical patent/JP4483563B2/ja
Priority to US11/298,108 priority patent/US7545534B2/en
Publication of JP2006173723A publication Critical patent/JP2006173723A/ja
Application granted granted Critical
Publication of JP4483563B2 publication Critical patent/JP4483563B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/403Discrimination between the two tones in the picture signal of a two-tone original
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Processing (AREA)

Description

この発明は、画像処理装置、画像処理方法および画像処理プログラムに関し、特に画像データを2値化する画像処理装置、画像処理方法および画像処理プログラムに関する。
従来、画像データに含まれる文字が表された領域を2値化することがなされている(例えば、特許文献1)。この2値化処理の処理速度を速くするために、専用のハードウェア回路が用いられることが多い。専用のハードウェア回路では、装置コストを低減するために比較的少ない容量のメモリが用いられ、画像データがバンドデータに分割されて2値化される。画像データの分割は、画像データの内容に関わらず、データ量より分割されるため、文字が複数のバンドデータに分割される場合がある。このため、文字が一方のバンドデータでは文字と判別されるが、他方のバンドデータでは文字と判別されない場合がある。また、ハードウェア回路は、予め定められたアルゴリズムに従って画像データを2値化するので、例えば、文字を構成する線が蜜に表された画像等は、そのアルゴリズムでは文字でありながら文字と判別できない場合がある。これらの場合には、文字の一部または全部が2値化されないので、文字の全部または一部が欠けたりして2値化データの画質が劣化するといった問題がある。
特開2001−222683号公報
この発明は上述した問題点を解決するためになされたもので、この発明の目的の1つは、処理の負荷を軽減して処理速度を向上させるとともに、2値化データの画質を向上させることが可能な画像処理装置、画像処理方法および画像処理プログラムを提供することである。
上述した目的を達成するためにこの発明のある局面によれば、画象処理装置は、画像データが入力されると、入力された画像データを第1のアルゴリズムに従って2値化した第1の2値化データを出力する第1の2値化手段と、画像データと第1の2値化データとが入力される制御手段とを備え、制御手段は、入力された画像データを第1のアルゴリズムとは異なる第2のアルゴリズムに従って2値化した第2の2値化データを生成する第2の2値化手段と、第1の2値化データと第2の2値化データとを比較する比較手段と、比較手段による比較結果に基づいて、補正対象領域を決定する補正対象領域決定手段と、画像データの補正対象領域を、第2のアルゴリズムとは異なる第3のアルゴリズムに従って2値化する第3の2値化手段と、第1の2値化データに含まれる補正対象領域の画素値を、第3のアルゴリズムに従って2値化された画素値に置換える置換手段とを含む。
この発明に従えば、画像データを第1のアルゴリズムに従って2値化した第1の2値化データと、画像データを第2のアルゴリズムに従って2値化した第2の2値化データとを比較し、比較結果に基づいて、補正対象領域を決定する。そして、画像データの補正対象領域を、第3のアルゴリズムに従って2値化して、第1の2値化データに含まれる補正対象領域の画素値を、第3のアルゴリズムに従って2値化した画素値に置換える。このため、第1のアルゴリズムに従った2値化処理の不具合が、第1の2値化データと第2の2値化データとを比較することにより決定され、第1の2値化データのうち不具合のある補正対象領域が第3のアルゴリズムに従って2値化した第3の2値化データに置換えられる。第3のアルゴリズムが複雑で処理に時間を要する場合に、画象データ全体を2値化するのではなく、その一部の補正対象領域のみを第3のアルゴリズムに従って2値化するので、処理の負荷を軽減して処理速度を向上させるとともに、2値化データの画質を向上させることが可能な画像処理装置を提供することができる。
好ましくは、第1の2値化手段は、入力された画像データから文字の領域を抽出する抽出手段を含み、抽出した文字領域のみを2値化した第1の2値化データを出力する。
好ましくは、第1の2値化手段は、入力された画像データに含まれる画素の属性を判定する判定手段を含み、判定手段により属性が文字と判定された画素の画素値に基づいて、画像データを2値化して第1の2値化データを出力する。
好ましくは、制御手段は、入力された第1の2値化データから文字を含む矩形の文字領域を抽出する文字領域抽出手段を含み、比較手段は、第1の2値化データの文字領域と第2の2値化データの文字領域とを比較する。
この発明に従えば、第1の2値化データから文字を含む矩形の文字領域が抽出され、第1の2値化データの文字領域と第2の2値化データの文字領域とが比較される。第1の2値化データでは2値化されなかった画素が、第2の2値化データでは2値化される場合がある。このため、第1の2値化手段で誤って2値化されなかった画素を抽出することができる。また、補正対象領域を決定するために比較する領域が少なくなるので、不要な処理をする必要がなく、処理速度をさらに向上させることができる。
好ましくは、比較手段は、第1の2値化データと第2の2値化データとで値の異なる画素が複数連続する画素群を抽出する画素群抽出手段を含み、補正対象領域決定手段は、文字領域から抽出された画素群に含まれる画素数に応じて、文字領域を補正対象領域に決定する。
この発明に従えば、第1の2値化データと第2の2値化データとで値の異なる画素が複数連続する画素群が抽出され、文字領域から抽出された画素群に含まれる画素数に応じて、文字領域が補正対象領域に決定される。このため、第1の2値化データに複数の文字領域が存在する場合であっても、必要な場合に限って第3のアルゴリズムに従って2値化されるので、不要な処理を実行することなく、処理速度をさらに向上させることができる。
好ましくは、比較手段は、第1の2値化データと第2の2値化データとで値の異なる複数の画素が連続する画素群を抽出する画素群抽出手段を含み、補正対象領域決定手段は、文字領域から抽出された画素群で定まる領域に基づき、補正対象領域を決定する。
この発明に従えば、第1の2値化データと第2の2値化データとで、値の異なる複数の画素が連続する画素群が抽出され、文字領域から抽出された画素群で定まる領域に基づき補正対象領域が決定される。このため、文字領域のうちで必要な領域に限って第3のアルゴリズムに従って2値化されるので、不要な処理を実行することなく、処理速度をさらに向上させることができる。
好ましくは、補正対象領域決定手段は、補正対象領域を拡大する領域拡大手段をさらに含む。
この発明に従えば、補正対象領域を拡大するので、第1の2値化データで文字領域とされなかった文字を構成する画素を補正対象領域に含めることができ、2値化データの画質を向上させることができる。また、補正対象領域が少なくとも1文字を含むようにすることができる。このため、文字が部分的に異なるアルゴリズムに従って2値化されることなく、2値化データの画質を向上させることができる。
好ましくは、領域拡大手段は、入力された画像データからエッジ画像を生成するエッジ画像生成手段を含み、補正対象領域に含まれるエッジが途切れるまで補正対象領域を拡大する。
好ましくは、領域拡大手段は、入力された画像データの補正対象領域に含まれる画素の色が変化するまで補正対象領域を拡大する。
好ましくは、第2の2値化手段は、入力された画像データに含まれる画素の画素値を、所定のしきい値を用いて2値化した単純2値化データを生成する単純2値化データ手段を含む。
好ましくは、第3の2値化手段により2値化された第3の2値化データと第2の2値化データとを比較する補正後比較手段と、補正後比較手段による比較結果が第1の比較手段による比較結果よりも第2の2値化データとの差が大きければ、第1の2値化データに含まれる補正対象領域の画素値を所定の値に置換える削除手段をさらに含む。
この発明に従えば、第3の2値化手段により2値化された値が、第2の2値化手段により2値化された値よりも悪くなる場合には、第1の2値化手段により文字と誤って検出された可能性が高い。補正対象領域の画素値が所定の値に置換えられるので、誤って文字と検出された領域を削除することができ、文字領域を検出する精度を向上させることができる。
この発明の他の局面によれば、画像処理方法は、画像データが入力されると、入力された画像データを第1のアルゴリズムに従って2値化した第1の2値化データを出力する第1の2値化手段を備えた画像形成装置で実行される画像処理方法であって、画像データと第1の2値化データとの入力を受付けるステップと、入力された画像データを第1のアルゴリズムとは異なる第2のアルゴリズムに従って2値化した第2の2値化データを生成するステップと、第1の2値化データと第2の2値化データとを比較するステップと、比較ステップによる比較結果に基づいて、補正対象領域を決定するステップと、画像データの補正対象領域を、第2のアルゴリズムとは異なる第3のアルゴリズムに従って2値化するステップと、第1の2値化データに含まれる補正対象領域の画素値を、第3のアルゴリズムに従って2値化された画素値に置換えるステップとを含む。
この発明に従えば、処理の負荷を軽減して処理速度を向上させるとともに、2値化データの画質を向上させることが可能な画像処理方法を提供することができる。
この発明のさらに他の局面によれば、画像処理プログラムは、画像データが入力されると、入力された画像データを第1のアルゴリズムに従って2値化した第1の2値化データを出力する第1の2値化手段を備えた画像形成装置で実行される画像処理プログラムであって、画像データと第1の2値化データとの入力を受付けるステップと、入力された画像データを第1のアルゴリズムとは異なる第2のアルゴリズムに従って2値化した第2の2値化データを生成するステップと、第1の2値化データと第2の2値化データとを比較するステップと、比較ステップによる比較結果に基づいて、補正対象領域を決定するステップと、画像データの補正対象領域を、第2のアルゴリズムとは異なる第3のアルゴリズムに従って2値化するステップと、第1の2値化データに含まれる補正対象領域の画素値を、第3のアルゴリズムに従って2値化された画素値に置換えるステップとを画像処理装置に実行させる。
この発明に従えば、処理の負荷を軽減して処理速度を向上させるとともに、2値化データの画質を向上させることが可能な画像処理プログラムを提供することができる。
以下、図面を参照しつつ本発明の実施の形態について説明する。以下の説明では、同一の部品には同一の符号を付してある。それらの名称および機能も同じである。したがってそれらについての詳細な説明は繰返さない。
<第1の実施の形態>
図1は、本発明の第1の実施の形態におけるMFPの概略構成を示す模式的断面図である。図1を参照して、MFP(Multi Function Peripheral)1は、原稿から画像データを読取るスキャナ部11と、用紙上に画像を印刷するプリンタ部12とを含む。
スキャナ部11の原稿台13上に載置された原稿は、スキャナ14の備える露光ランプ15により照射される。スキャナ14は、スキャナモータ22により矢印方向に移動して原稿全体を走査する。原稿面からの反射光は、ミラー16〜18および集光レンズを介してCCD(Charge Coupled Device)20上に像を結ぶ。CCD20は、原稿面からの反射光をRGBの色データ(アナログ信号)に変換してスキャナ制御部21に出力する。CCD20がスキャナ制御部21に出力する色データを、画像データという。
スキャナ制御部21は、CCD20から入力される画像データに所定の画像処理を施してプリンタ制御部31にデジタル信号を出力する。
ここでスキャナ制御部21からプリンタ制御部31に出力されるデジタル信号は、シアン用の画像色データCと、マゼンタ用の画像色データMと、イエロー用の画像色データYと、ブラック用の画像色データKである。プリンタ制御部31は、入力された画像色データC,M,Y,Kに基づいて、シアン、マゼンタ、イエロー、ブラックそれぞれの感光体ドラム35C,35M,35Y,35Kにレーザビームを出力する。
プリンタ部12において、スキャナ制御部21から出力されるレーザビームは、帯電チャージャ34C,34M,34Y,34Kによって帯電された感光体ドラム35C,35M,35Y,35Kを露光し、静電潜像を形成する。シアン、マゼンタ、イエロー、およびブラックの4色の現像器36C,36M,36Y,36Kにより、感光体ドラム35C,35M,35Y,35K上の静電潜像が現像される。
一方、無端ベルト40は、駆動ローラ43Aと固定ローラ43B,43C,43Dとにより弛まないように懸架されている。駆動ローラ43Aが図中で反時計回りに回転すると、無端ベルト40が所定速度で図中で反時計回りに回転する。
給紙カセット50〜52より適当な用紙が搬送され、タイミングローラ41から無端ベルト40に用紙が供給される。無端ベルト40に供給された用紙は、無端ベルト40上に担持され、図中で左方向に搬送される。これにより、用紙がシアン、マゼンタ、イエロー、ブラックの順に感光体ドラム35C,35M,35Y,35Kと接触する。用紙がそれぞれの感光体ドラム35C,35M,35Y,35Kと接触したときに、感光体ドラムと対をなす転写チャージャ37C,37M,37Y,37Kにより感光体ドラム上に現像されたトナー像が用紙に転写される。
トナー像が転写された用紙は、定着ローラ対42により加熱される。これにより、トナーは溶かされて用紙に定着する。その後、用紙はプリンタ部12から排出される。
また、MFP1は、ネットワークに接続された他の機器と通信するためのネットワークコントローラ、ファクシミリ、およびハードディスクを含み、上述した画像読取機能および画像形成機能に加えて、電子メール送受信機能、ファイル転送機能、ファクシミリ送受信機能、データをプリントするプリント機能、ファイル蓄積機能を備えている。
図2は、本実施の形態におけるMFPの回路構成を示すブロック図である。図2を参照して、MFP1は、MFP1の全体を制御するためのCPU101と、CPU101とCPUバス102を介して接続されたバスブリッジ103と、バスブリッジ103に接続されたROM105およびRAM107と、バスブリッジ103にそれぞれ汎用バス104を介して接続された画像制御部110と、第1の2値化処理回路112と、操作パネルインターフェース(IF)121と、ネットワークインターフェース(IF)123と、メモリインターフェース(IF)125とを含む。
操作パネルIF121は、操作パネル122と接続されており、ネットワークIF123は、ネットワークに接続されており、メモリIF125にはフラッシュROM126が装着可能である。
画像制御部110には、画像バス111を介して、画像メモリ113と、スキャナインターフェース(IF)115と、プリンタインターフェース(IF)117と、ハードディスクユニット119とが接続されている。スキャナIF115はスキャナ制御部21が接続されており、プリンタIF117はプリンタ制御部31が接続されている。
ネットワークIF123は、ネットワークと接続され、MFP1を他のコンピュータとネットワークを介して接続する。ネットワークIF123は、CPU101から入力されたデータをネットワークに送出し、ネットワークから受信されたデータをCPU101に出力する。
画像制御部110は、CPU101によって制御され、画像データの入出力を制御する。ネットワークIF123を介して他のコンピュータから受信された画像データ、スキャナIFから入力される画像データまたはハードディスクから読出された画像データを、プリンタ制御部31またはハードディスクユニット119に出力する。また、画像制御部110は、画像データをプリンタ制御部31に出力する際には、画像データをプリンタ部12でプリント可能なプリントデータに変換する処理を行なう。
第1の2値化処理回路112は、CPU101により制御され、画像データが入力されると、画像データを予め定められた第1のアルゴリズムに従って文字が表された文字領域を2値化処理して2値化データを出力する。第1のアルゴリズムに従った処理は、画像データの文字が表された領域を2値化した2値化データを出力するものであれば、周知のアルゴリズムを用いればよい。予め定められたアルゴリズムは、画素の属性を判別する処理、エッジ強調処理等を含む。第1の2値化処理回路112は、処理速度が高速であることが求められるため、ハードウェアで構成される。第1の2値化処理回路112は、作業エリアとして不揮発性のメモリを有しており、画像データが部分的に入力される。RAMに記憶可能な画像データは、画像データの数ラインから数十ラインである。このため、メモリコストが抑えられている。第1の2値化処理回路112で実行される2値化処理は、画素ごとに文字属性か否かを判別して、文字属性と判別された画素の値のみを2値化する処理であってもよいし、画素ごとに文字属性か否かを判別した後、文字属性と判別された画素の外接矩形の文字領域に含まれる全ての画素の値を2値化する処理であってもよい。
操作パネル122は、ユーザによる操作の入力を受付けるための入力部と、情報を表示するための表示部とを含む。
ハードディスクユニット119は、スキャナで読取られた画像データ、その画像データを圧縮符号化した圧縮データ、ネットワークIF123で他のコンピュータから受信された画像データ、その画像データの圧縮データなど、MFP1に入力されるデータを記憶する。
メモリIF125には、フラッシュROM126が装着される。このフラッシュROM126に記憶された画像処理プログラムが、CPU101で実行される。なお、プログラムを、フラッシュROM126から読み出すのに代えて、EEPROM(electrically erasable/programable read only memory)に記憶するようにしてもよい。CPU101は、EEPROMに記憶されたプログラムを実行する。またこのEEPROMは、記憶内容を書換えるまたは追加して書込みすることが可能なので、ネットワークに接続された他のコンピュータが、MFP1のEEPROMに記憶されたプログラムを書換えたり、新たなプログラムを追加して書込んだりするようにしてもよい。さらに、MFP1が、ネットワークに接続された他のコンピュータからプログラムをダウンロードして、そのプログラムをEEPROMに記憶するようにしてもよい。
ネットワークは、ローカルエリアネットワーク(LAN)であってもよいし、インターネットまたは一般公衆回線であってもよく、有線または無線を問わない。
なお、MFP1で実行される画像処理プログラムはフラッシュROM126に記憶されて流通される例を示すが、他の記録媒体、たとえば、フレキシブルディスク、カセットテープ、CD−ROM(Compact Disc - Read Only Memory)、ハードディスク、光ディスク(MO(Magnetic Optical Disc)/MD(Mini Disc)/DVD(Digital Versatile Disc))、ICカード(メモリカードを含む)、光カード、マスクROM、EPROM、EEPROMなどの半導体メモリ等の固定的にプログラムを担持する媒体でもよい。さらに、ネットワークを介して他の装置からダウンロードされる場合であってもよい。
また、ここでいうプログラムは、CPU101により直接実行可能なプログラムだけでなく、ソースプログラム形式のプログラム、圧縮処理されたプログラム、暗号化されたプログラム等を含む。
本実施の形態におけるMFP1は、画像データを符号化して圧縮する処理を実行する。圧縮処理の対象となる画像データは、スキャナ部11で読取られた画像データ、ネットワークIF123で他のコンピュータから受信された画像データ、ハードディスクユニット119から読出された画像データを含む。また、画像データは、フルカラーの画像データ、モノクロで多値の画像データを含む。
圧縮方式は、PDF、JPEGおよびJBIG等一般的な圧縮方式を含む。複数の圧縮方式のうちからいずれを選択するかは、ユーザが操作パネル122に表示された選択画面で、圧縮方式を選択する指示を入力することにより受付けられる。CPU101で圧縮処理された圧縮データは、ハードディスクユニット119の所定の領域に記憶される。画像データのうち文字領域は、2値化して圧縮符号化すると画質が向上し、圧縮効率が上がる。このため、CPU101は、画像データのうち文字領域のみを抽出して圧縮する。CPU101は、圧縮処理を高速に実行するため、画像データから文字領域を抽出して2値化する処理を、第1の2値化処理回路112に実行させる。
第1の2値化処理回路は、上述したように、作業領域として使用可能なメモリ容量が制限されていること、および、予め定められたアルゴリズムに従って文字領域を判別することなどから文字領域の判別精度に限界がある。作業領域のメモリ容量が制限されているために、画像データの一部が処理対象となる。第1の2値化処理回路112で記憶可能な画像データは、たとえば、画像データの数〜数十ラインであり、処理対象とされる画像データの一部はバンドと呼ばれる。第1の2値化処理回路112で実行する2値化処理には、バンドごとに文字領域を抽出する処理が含まれる。たとえば、文字領域が2つのバンドに分割される場合を例に説明すると、一方のバンドでは文字と判別され、他方のバンドでは文字と判別するべき領域を誤って写真と判別される場合がある。他方のバンドに、文字に隣接して写真が含まれている場合などに誤判別されることが多い。また、1つの文字が2つのバンドに分割される場合も誤判別されることが多い。画素の属性が誤って判別されると、その画素が2値化されないので、文字が欠けたり擦れたりする。本実施の形態におけるMFP1では、CPU101で実行される画像処理プログラムにより、第1の2値化処理回路112から出力される2値化データを補正する。
図3は、第1の実施の形態におけるCPU101の機能を示す機能ブロック図である。図3を参照して、CPU101は、画像データを第2のアルゴリズムに従って2値化して第2の2値化データを出力する第2の2値化処理部151と、第1の2値化データから文字領域を抽出する文字領域抽出部153と、第1の2値化データと第2の2値化データとを比較する比較部155と、画像データを第3のアルゴリズムに従って2値化して第3の2値化データを出力する第3の2値化処理部157と、文字領域抽出部153により抽出された文字属性が正しいか否かを判定する判定部158と、第1の2値化データを第3の2値化データに置換する置換部159とを含む。
CPU101は、画像データと、第1の2値化処理回路112から第1の2値化データとが入力される。第2の2値化処理部151は、画像データが入力され、入力された画像データを予め定められた第2のアルゴリズムに従って2値化する。第2のアルゴリズムは、第1のアルゴリズムとは異なり、CPU101での処理時間を短縮するために、領域判別処理は実行することなく、画像データの各画素値を所定のしきい値と比較して2値化して第2の2値化データを出力する。所定のしきい値は、予め定められた値であってもよく、画素値に応じて変更されてもよい。
文字領域抽出部153は、第1の2値化処理回路112から第1の2値化データが入力される。上述したように、第1の2値化データは、文字属性とされた画素の値、または、文字属性とされた画素の外接矩形の文字領域に含まれる画素の値を2値化した値である。したがって、文字属性と判定されなかった画素の値、または、文字領域と判定されなかった領域の画素の値は、すべて空白の画素値(たとえば「255」)とされる。第1の2値化データのサイズは、画像データのサイズと同じである。第1の2値化処理回路112では、バンドごとに2値化処理がされたが、CPU101には、バンドごとに2値化されたデータを合成した2値化データが入力される。このため、文字領域抽出部153は、2値化データの各画素値から空白の値でない画素値が隣接する領域を文字領域として抽出する。具体的には、空白の値でない画素値を有する画素の集合に外接する矩形の領域を抽出する。文字領域は、2値化データにおける位置とサイズを示す値である。文字領域は、2値化データとサイズが同じデータ、たとえば画像データにおける位置を示す値でもある。
比較部155は、第1の2値化データと、第2の2値化データと、文字領域とが入力され、第1の2値化データの文字領域と、第2の2値化データの文字領域とを比較する。そして、第1の2値化データの文字領域を補正するか否かを判定し、補正すると判定した場合に、文字領域を補正対象領域として第3の2値化処理部157、判定部158および置換部159に出力する。
第3の2値化処理部157は、画像データと補正対象領域とが入力される。第3の2値化処理部157は、入力された画像データの補正対象領域を第3のアルゴリズムに従って2値化した第3の2値化データを判定部に出力する。第3のアルゴリズムに従って2値化する処理は、周知のアルゴリズムを用いればよく、第1のアルゴリズムと同じであってもよい。第3のアルゴリズムは、エッジ強調処理、ノイズを除去する処理等を含んでもよい。第3の2値化処理部157は、画像データの全体を2値化するのではなく、補正対象領域を2値化するので、処理対象となる画素数が少なく、画像データの全体を2値化するのに比較して、短い時間で2値化することが可能である。
判定部158は、第1の2値化データと、第2の2値化データと、第3の2値化データと、比較部155から補正対象領域が入力される。第1の2値化データと、第2の2値化データと、第3の2値化データとを用いて、画像データの文字領域が文字の表された領域か否かを判定する。
置換部159は、第1の2値化データと、第3の2値化データと、補正対象領域とが入力される。また、置換部159は、判定部158から許可信号または不許可信号が入力される。置換部159は、判定部158から許可信号が入力されることに応じて、第1の2値化データの補正対象領域を、第3の2値化データの補正対象領域に置換する。これにより、第1の2値化処理回路112で、誤って2値化された補正対象領域が、第3の2値化処理部157で正しく2値化された補正対象領域に置換される。また、置換部159は、判定部158から不許可信号が入力されることに応じて、第1の2値化データの補正対象領域の画素値を、空白の画素値(例えば「255」)に置換する。これにより、第1の2値化処理回路112により誤って文字領域と判別されて2値化された補正対象領域が、文字領域でない領域とされる。
図4は、比較部155の機能を示す機能ブロック図である。図4を参照して、比較部155は、差分画像作成部161と、ラベリング部162と、文字領域拡大部163とを含む。差分画像作成部161は、第1の2値化データと、第2の2値化データと、文字領域とが入力される。差分画像作成部161は、第1の2値化データの文字領域と第2の2値化データの文字領域との差分を算出し、差分画像を生成する。第1の2値化データと第2の2値化データは、文字を構成する画素の値を「1」、文字を構成しない画素の値を「0」とするデータである。差分画像は、第1の2値化データと第2の2値化データの文字領域とで、文字領域の対応する画素値の差分で算出される。差分がマイナスとなる場合は「1」としてもよい。差分画像は、サイズと位置が文字領域と同じであり、第1の2値化データと第2の2値化データとで対応する画素で値の異なる画素の値を「1」とする2値のデータである。
ラベリング部162は、差分画像を分析して第1の2値化データの文字領域を補正するか否かを判定する。この判定は、差分画像に含まれる画素から値が「1」の画素が隣接する画素群を抽出して、抽出した画素群のサイズに基づいてなされる。画素群のサイズは、画素群に含まれる画素の数である。また、画素群のサイズを画素が所定方向に連続する数としてもよい。画素群は、ラベリング処理により抽出される。
ここで、ラベリング処理について説明する。図5は、ラベリング処理を説明するための図である。図5(A)は、差分画像の一部を示す図である。点線で区切られたマスは、1画素を示し、ハッチングで示されるマスが値「1」、ハッチングなしのマスが値「0」を示している。ラベリング処理では、「1」の画素が隣接する画素に同じラベルを付す処理である。したがって画素群が異なる場合は、付されるラベルが異なる。図5(B)は、ラベリングされたラベル画像を示す。点線で区切られたマスは、差分画像の各画素に対応する画素を示している。図では、ラベル「1」が付された画素群と、ラベル「2」が付された画素群が示されている。
図6は、ラベリング処理の具体的な処理を説明するための図である。ラベリング処理では、値が同じ隣接する画素に同じラベルを付す処理であるため、処理対象画素に対して、その画素の値と、上下左右方向に隣接する画素の値とを比較する。図6(A)は、処理対象画素と左方向に隣接する画素の値を比較する例を示し、図6(B)は、処理対象画素と右方向に隣接する画素の値を比較する例を示し、図6(C)は、処理対象画素と上方向に隣接する画素の値を比較する例を示し、図6(D)は、処理対象画素と下方向に隣接する画素の値を比較する例を示す。ラベリング処理では、処理対象画素について、左、右、上、下の順に画素値を比較し、画素値が同じ場合には処理対象画素と同じラベルを比較対照の画素に付す。左、右、上、下に隣接する画素との比較が終了すると、最初に同じラベルが付された画素を新たに処理対象画素として、その処理対象画素について隣接する画素と比較する。ラベルが付された順に処理対象画素が設定され、処理対象画素に設定する画素がなくなった時点で、1つの画素群に対するラベリング処理が終了する。
図4に戻って、ラベリング部162は、ラベリング処理により抽出された画素群のサイズに基づいて、第1の2値化データの文字領域を補正するか否かを判定する。第1の2値化データの文字領域を補正すると判定する基準の例を示す。
(1)差分画像から抽出された画素群のうち最大の画素数が所定の値T1以上の場合。
(2)差分画像から抽出された所定数T2以上の画素から構成される画素群の数が、所定数T3以上の場合。
(3)差分画像から抽出された画素群の画素が一方向に連続する数の最大値が所定の値T4以上の場合。一方向は、横方向、縦方向、斜め方向を含む。
なお、ここでは、画素群を抽出するのにラベリング処理を例に説明したが、これに代えて、差分画像から値が「1」の画素に外接する矩形の領域を抽出し、その領域に含まれる画素の集合を画素群とするようにしてもよい。
文字領域拡大部163は、文字領域に文字の全てが含まれるように文字領域を拡大する。そして、拡大した文字領域を第3の2値化処理部157に出力する。ここでは、拡大した文字領域を補正対象領域という。
上述したように文字領域は、文字領域抽出部153によって、第1の2値化データから抽出された領域である。第1の2値化データを生成する第1の2値化処理回路112は、バンドごとに2値化処理を行なったため、1つの文字が2つのバンドに分割された場合などに一方のバンドでは文字領域と判定されて2値化されるが、他方のバンドでは文字領域と判定されずに2値化されない場合がある。この場合には、文字領域は1文字の一部を含まない領域として抽出されることになる。文字領域拡大部163は、第1の2値化処理回路112で、他方のバンドで文字領域と判定されずに2値化されなかった文字を構成する画素が文字領域に含まれるように拡大する。文字領域拡大部163は、文字領域を拡大する範囲を決定するために、画像データから算出されたエッジ画像または画像データそのものをラベリング処理する。
(1)画像データから算出されたエッジ画像をラベリング処理する場合。
画像データからエッジ画像を算出し、文字領域に含まれるエッジが途切れるまで文字領域を拡大する。より具体的には、エッジ画像をラベリングして、文字領域の外周にラベルの付された画素がある場合に、その画素のラベルが外周に存在しなくなるまで文字領域を拡大する。または、文字領域に含まれる画素と同じラベルが付された画素群(エッジ画素の集合)を全て含む外接矩形を新たな文字領域とする。
(2)画像データそのものをラベリング処理する場合。
画像データの各画素を、画素値でラベリングする。これにより、同じ色の画素に同じラベルが付される。そして、文字領域に含まれる同じ色の画素が連続するのが途切れるまで文字領域を拡大する。より具体的には、画像データをラベリングして、文字領域の外周に背景色のラベル以外のラベルが付された画素がある場合に、その画素のラベルが外周に存在しなくなるまで文字領域を拡大する。または、文字領域に含まれる画素と背景色のラベル以外のラベルが付された画素群(エッジ画素の集合)を全て含む外接矩形を新たな文字領域とする。
図7は、ラベリング処理を用いて文字領域を拡大する例を示す図である。図7(A)は、ラベリング画像と文字領域との関係を示す図である。ハッチングの付された画素に、同じラベルが付されている。同じラベルの付された画素の全てが文字領域210に含まれていない。図7(B)は、ラベリング画像と拡大された文字領域との関係を示す図である。ハッチングの付された画素に、同じラベルが付されている。同じラベルの付された画素の全てが文字領域210Aに含まれている。
図8は、文字領域を説明するための図である。図8(A)は、文字領域と第1の2値化データとの関係を示す図である。図では、文字の下側半分が2値化されていない第1の2値化データ201の例を示している。この場合、文字領域210は、2値化された文字の部分のみを含む領域として、文字領域抽出部153により抽出される。
図8(B)は、文字領域と第2の2値化データとの関係を示す図である。第2の2値化データ202は、第1の2値化処理回路112とは異なるアルゴリズムに従って画像データを2値化するため、文字の全てが2値化される。したがって、第2の2値化データに含まれる文字の全てが、文字領域210に含まれていない。
図8(C)は、文字領域と差分画像との関係を示す図である。差分画像203は、文字領域と同じサイズおよび位置であるため、第1の2値化データ201と第2の2値化データ203との文字領域における差分のみを含む。
図8(D)は、補正対象領域と画像データとの関係を示す図である。補正対象領域210Aは、画像データの文字の全てを含む領域となるまで、文字領域210を拡大した領域であることが示されている。
図9は、判定部158の機能を示す機能ブロック図である。図9を参照して、判定部158は、第1差分画像作成部171と、第2差分画像作成部172と、補正後比較部173とを含む。第1差分画像作成部171は、第1の2値化データと、第2の2値化データと、文字領域とが入力される。第1差分画像作成部171は、第1の2値化データと第2の2値化データとから文字領域の第1差分画像I1を生成する。第1の2値化データと第2の2値化データは、文字を構成する画素の値を「1」、文字を構成しない画素の値を「0」とするデータである。第1差分画像I1は、第1の2値化データと第2の2値化データの文字領域とで、文字領域の対応する画素値の差分で算出される。差分がマイナスとなる場合は「1」としてもよい。第1差分画像I1は、サイズと位置が文字領域と同じであり、第1の2値化データと第2の2値化データとで対応する画素で値の異なる画素の値を「1」とする2値のデータである。なお、第1差分画像I1を、比較部155から受取るようにしてもよい。この場合には、第1差分画像作成部171は不要となる。
第2差分画像作成部172は、第1の2値化データと、第3の2値化データと、文字領域とが入力される。第2差分画像作成部172は、第1の2値化データと第3の2値化データとから文字領域の第2の差分画像I2を生成し、補正後比較部173に出力する。第3の2値化データは、文字を構成する画素の値を「1」、文字を構成しない画素の値を「0」とするデータである。第2の差分画像I2は、第1の2値化データと第3の2値化データの文字領域とで、文字領域の対応する画素値の差分で算出される。差分がマイナスとなる場合は「1」としてもよい。差分画像は、サイズと位置が文字領域と同じであり、第1の2値化データと第3の2値化データとで対応する画素で値の異なる画素の値を「1」とする2値のデータである。
補正後比較部173は、第1差分画像I1と第2の差分画像I2とが入力され、第1差分画像I1に含まれる画素値が「1」の画素数S1が、第2の差分画像I2に含まれる画素値が「1」の画素数S2よりも大きい場合に、画像データの文字領域が文字の表された領域と判定し、許可信号を置換部159に出力する。そうでない場合は、不許可信号を置換部159に出力する。
図10は、第1の実施の形態におけるMFP1のCPU101で実行される画像処理の流れを示すフローチャートである。ここでの画像処理は、第1の2値化処理回路112により2値化された第1の2値化データの補正処理を示す。
図10を参照して、まず、画像データが取得される(ステップS01)。取得された画像データは、RAM107に一時的に記憶される。そして、第1の2値化処理回路112から第1の2値化データが取得される(ステップS02)。第1の2値化データは、バンド単位で取得され、取得された順にRAM107に記憶される。全てのバンドの2値化データが取得された段階で、RAM107には画像データと同じサイズの2値化データが記憶されることになる。
次のステップS03では、RAM107に記憶されている画像データに対して、第2のアルゴリズムに従った2値化処理を施し、第2の2値化データを生成する。第2の2値化データは、画像データと同じサイズである。第2の2値化データは、RAM107に記憶される。
そして、RAM107に記憶されている第1の2値化データから文字領域が抽出され(ステップS04)、抽出された文字領域の数がカウントされる(ステップS05)。複数の文字領域が抽出された場合には、各文字領域を特定するための識別情報として、文字領域に0から始まる番号が付番される。ここでは、説明のため番号Iが付された文字領域を文字領域(I)で表わす。次のステップS06では、変数Iに「0」が設定される。これにより、ステップS07以降の処理の対象となるのは、文字領域(0)とされる。
ステップS07では、RAM107に記憶されている第1の2値化データの文字領域(I)と、第2の2値化データの文字領域(I)とを比較する。この比較処理については、後で説明する。
そして、ステップS07の比較の結果、第1の2値化データの文字領域に欠損があるか否かが判断される(ステップS08)。欠損がある場合にはステップS09へ進み、ない場合にはステップS16に進む。ステップS09では、文字領域(I)を補正対象領域とする。そして、補正対象領域を拡大する(ステップS10)。この処理は、上述した文字領域拡大部163で実行される処理であり、補正対象領域に一部のみが含まれる文字がある場合に、その文字の全てが含まれるようになる。このため、第1の2値化処理回路112で誤って文字の属性と判別されなかった画素または領域を、補正対象領域に含めることができる。
次に、RAM107に記憶されている画像データの補正対象領域に対して、第3の2値化処理が施される(ステップS11)。これにより、画像データの補正対象領域を第3のアルゴリズムに従って2値化した第3の2値化データが生成される。第3の2値化データは、補正対象領域と同じサイズである。第3の2値化データは、RAM107に記憶される。第3のアルゴリズムに従った2値化処理を実行するCPU101の負荷が大きくても補正対象領域のみを2値化すればよいので、処理速度を短くすることができる。
そして、RAM107に記憶されている第1の2値化データの補正対象領域が、文字領域であるか否かが判定される(ステップS12)。そして、判定の結果により処理が分岐する(ステップS13)。文字領域と判定された場合には、補正対象領域を補正するためにステップS14に進み、文字領域と判定されなかった場合には補正対象領域を第1の2値化データから削除するためにステップS15に進む。
ステップS14では、RAM107に記憶されている第1の2値化データの補正対象領域を、第3の2値化データに置換する。具体的には、第1の2値化データの補正対象領域を、第3の2値化データに書換える。一方、ステップS15では、RAMに記憶されている第1の2値化データの補正対象領域を削除する。具体的には、第1の2値化データの補正対象領域に含まれる画素の値を、空白の画素値「255」に書換る。
ステップS16において、次に処理対象とするべき文字領域が存在するか否かが判断され、存在する場合にはステップS17に進み、存在しない場合には処理を終了する。変数Iが、ステップS05でカウントされた文字領域の数に達しか否かにより判断される。ス ステップS17では、変数Iに「1」が加算され、新たな処理対象領域を文字領域(I)として上述したステップS07〜S15の処理が繰返される。
図11は、図10のステップS07で実行される比較処理の流れを示すフローチャートである。図11を参照して、ステップS21では、RAM107に記憶されている第1の2値化データの文字領域と、第2の2値化データの文字領域との差分画像が生成される。差分画像は、文字領域と画像データ中の位置とサイズが同じである。そして、差分画像に対して画素値が「1」の画素が隣接する画素群に同じラベルを付すラベリング処理が実行される(ステップS22)。同じラベルの付された画素の集合が画素群である。
そして、画素群のうちから最大サイズの画素群のサイズが抽出される(ステップS23)。具体的には、差分画像に含まれる同じラベルが付された画素の数Cをカウントし、その最大値Cmaxを抽出する。
最大値Cmaxが予め定めたしきい値T1を超えるか否かが判断され(ステップS24)、真の場合にはステップS25へ進み、偽の場合にはステップS26へ進む。ステップS25では「欠損あり」を示す信号を返し、ステップS26では「欠損なし」を示す信号を返す。
なお、ステップS23で、所定数T2以上の画素から構成される画素群の数C1をカウントし、ステップS24で画素群の数C1が、所定数T3以上の場合にステップS25へ進み、そうでない場合にステップS26に進むようにしても良い。
また、ステップS23で、画素群の画素が横方向に連続する数、縦方向に連続する数、および斜め方向に連続する数の最大値を求め、ステップS23で、その最大値が所定の値T4以上の場合にステップS25へ進み、そうでない場合にステップS26に進むようにしても良い。
図12は、図10のステップS12で実行される補正後比較処理の流れを示すフローチャートである。図12を参照して、RAM107に記憶されている第1の2値化データと第2の2値化データとから文字領域の第1差分画像I1を生成し(ステップS31)、第1差分画像I1に含まれる画素値が「1」の画素数S1を算出する(ステップS32)。次に、RAM107に記憶されている第1の2値化データの文字領域と第3の2値化データとから文字領域の第2差分画像I2を生成し(ステップS33)、第2差分画像I2に含まれる画素値が「1」の画素数S2を算出する(ステップS34)。
画素数S2が画素数S1より小さいか否かが判断され(ステップS35)、真の場合にはステップS36に進み、偽の場合にはステップS37に進む。ステップS36では、補正するべき領域であることを示す「OK」の信号(許可信号)を返す。ステップS37では、補正するべき領域でないことを示す「NG」の信号(不許可信号)を返す。
第3のアルゴリズムは、第1のアルゴリズムよりも処理対象とする画素数を多く取れるので、画素の属性をより正確に判定することができる。ステップS35では、第3の2値化データが第1の2値化データよりも第2の2値化データとの差が大きい場合に、補正対象領域は文字領域でなく、他の属性の領域と判断する。このため、第1の2値化データに文字の属性以外の属性の画素が含まれないようにすることができる。
以上説明したように第1の実施の形態におけるMFP1は、第1のアルゴリズムによる2値化処理の不具合を、第1の2値化データと第2の2値化データとを比較することにより決定し、第1の2値化データのうち不具合のある補正対象領域が第3のアルゴリズムで2値化した第3の2値化データに置換する。このため、第3のアルゴリズムが複雑で処理に時間を要する場合に、画象データ全体を2値化するのではなく、その一部の補正対象領域のみを第3のアルゴリズムで2値化するので、処理の負荷を軽減して処理速度を向上させるとともに、2値化データの画質を向上させることができる。
また、第1の2値化データから文字を含む矩形の文字領域を抽出し、第1の2値化データの文字領域と第2の2値化データの文字領域とを比較するので、補正対象領域を決定するために比較する領域が少なくなるり、不要な処理をする必要がなく、処理速度をさらに向上させることができる。
また、補正対象領域を拡大するので、第1の2値化データで文字領域とされなかった文字を構成する画素を補正対象領域に含めることができ、2値化データの画質を向上させることができる。
さらに、第3の2値化処理部157により2値化された第3の2値化データが、第2の2値化処理部151により2値化された第2の2値化データよりも悪くなる場合には、補正対象領域の画素値を空白の画素値に置換するので、誤って文字と検出された領域を削除することができ、文字領域を検出する精度を向上させることができる。
<第2の実施の形態>
次に第2の実施の形態におけるMFPについて説明する。上述したように、第1の2値化データを生成する第1の2値化処理回路112が、画素ごとにその属性を判定し、文字属性と判定された画素の値のみを2値化する場合には、1文字のうちでも文字属性と判定される画素と、文字属性と判定されない画素とが含まれる場合がある。この場合には、第1の2値化データでは、1文字のうちに2値化されずに値が「0」の画素が含まれることになる。第2の実施の形態におけるMFPでは、第1の2値化処理回路112で誤って文字属性と判定されずに2値化されなかった文字の部分を補正する。
第1の実施の形態におけるMFP1は、補正対象領域を文字領域とするものであった。第2の実施の形態におけるMFPでは、補正対象領域を文字領域から抽出された画素群に基づき定まる領域とする点で第1の実施の形態におけるMFP1と異なる。以下、第2の実施の形態のMFPについて、第1の実施の形態におけるMFP1と異なる点を主に説明する。
図13は、第2の実施の形態におけるMFP1のCPU101の機能を示す機能ブロック図である。図13を参照して、図3と異なるところは、比較部155Aが変更された点である。他の構成は同様であるので、ここでは、比較部155Aについて説明する。
図14は、第2の実施の形態における比較部の機能を示す機能ブロック図である。図14を参照して、比較部155Aは、差分画像作成部161と、ラベリング部162Aと、補正対象領域拡大部163Aとを含む。
差分画像作成部161は、第1の2値化データの文字領域と第2の2値化データの文字領域との差分を算出し、差分画像を生成する。ラベリング部162Aは、差分画像を分析して補正対象領域を抽出する。
ラベリング部162Aは、差分画像に含まれる画素から値が「1」の画素が隣接する画素群であって、所定のサイズ以上の画素群を抽出して、抽出された画素群を補正対象領域に決定する。画素群のサイズは、画素群に含まれる画素の数である。また、画素群のサイズを画素が所定方向に連続する数としてもよい。画素群はラベリング処理により抽出される。
より具体的に説明すると、ラベリング部162Aは、差分画像に対してラベリング処理を実行する。これにより、画素値が「1」の画素が隣接する画素群が複数決定される。そして、複数の画素群のうちから補正対象とするべき補正対象領域として、同じラベルの付された画素の数が所定数以上の画素群を決定する。ここでは、処理の利便性から補正対象領域を矩形とするために、補正対象領域は、画素群に外接する矩形の領域とされる。
補正対象領域拡大部163Aは、ラベリング部162Aにより決定された補正対象領域に、少なくとも1文字を構成する画素の全てが含まれるように補正対象領域を拡大する。補正対象領域拡大部163Aは、補正対象領域を拡大する範囲を決定するために、画像データから算出されたエッジ画像または画像データそのものをラベリング処理する。
図15は、ラベリング処理を用いて補正対象領域を拡大する例を示す図である。図15を参照して、文字領域210に十字の文字が含まれており、補正対象領域220がまず抽出されたとする。ハッチングの付された画素は、ラベリング処理により同じラベルが付された画素を示している。補正対象領域220には、同じラベルの付された画素の全てが含まれていない。この補正対象領域220を領域220Aにまで拡大することによって、同じラベルの付された画素の全てが文字領域220Aに含まれ、その結果、1文字の全てが文字領域220Aに含まれる。
図16は、補正対象領域を説明するための図である。図16(A)は、文字領域と第1の2値化データとの関係を示す図である。文字の1部が2値化されていない第1の2値化データ201の例を示している。
図16(B)は、文字領域と第2の2値化データとの関係を示す図である。第2の2値化データ202は、第1の2値化処理回路112とは異なるアルゴリズムに従って画像データを2値化するため、文字の1部に欠けがない。
図16(C)は、補正対象領域と差分画像との関係を示す図である。差分画像203は、文字領域と同じサイズおよび位置であるため、第1の2値化データ201と第2の2値化データ202との文字領域における差分のみを含む。そして、差分画像203のうち差分のある画素が隣接する画素群を含む補正対象領域221,222が示される。差分のある画素であってもサイズの小さな画素群は補正対象領域とはされない。
図16(D)は、拡大された補正対象領域を示す図である。補正対象領域221を拡大した、「構」の1文字を含む補正対象領域221Aが示される。また、補正対象領域222を拡大した、「築」の1文字を含む補正対象領域222Aが示される。
図17は、第2の実施の形態におけるMFP1のCPU101で実行される画像処理の流れを示すフローチャートである。図17を参照して、ステップS51〜S56までの処理は、図10に示したステップS01〜S06までの処理と同じである。ここでは説明を繰返さない。
ステップS57では、RAM107に記憶されている第1の2値化データの文字領域(I)と、第2の2値化データの文字領域(I)とを比較する。この比較処理により、文字領域(I)から所定数以上の画素で構成される画素群が抽出される。抽出された画素群の数がカウントされ、複数の画素群が抽出された場合には、各画素群を特定するための識別情報として、画素群に0から始まる番号が付番される。ここでは、説明のため番号Jが付された画素群を画素群(I)で表わす。
次のステップS58では、変数Jに「0」が設定される。これにより、ステップS59〜S67までの処理の対象となるのは、画素群(0)とされる。
ステップS59では、画素群(J)を構成する画素の数がしきい値T5を超えるか否かが判断される。真の場合にはステップS60に進み、偽の場合にはステップS67に進む。ステップS60では、画素群(J)を補正対象領域に設定し、ステップS61に進む。
ステップS61では、補正対象領域を拡大する。この処理は、上述した補正対象領域拡大部163Aで実行される処理であり、補正対象領域が1文字の一部である場合に、補正対象領域にその文字の全てが含まれるようになる。このため、1文字を構成する2つの部分が異なるアルゴリズムに従って2値化されるのを防止することができ、画質を向上させることができる。
次に、RAM107に記憶されている画像データの補正対象領域に対して、第3の2値化処理が施される(ステップS62)。これにより、画像データの補正対象領域を第3のアルゴリズムに従って2値化した第3の2値化データが生成される。したがって、第3の2値化データは、補正対象領域と同じサイズである。第3の2値化データは、RAM107に記憶される。第3のアルゴリズムに従った2値化処理を実行するCPU101の負荷が大きくても補正対象領域のみを2値化すればよいので、処理速度を短くすることができる。
そして、RAM107に記憶されている第1の2値化データの補正対象領域が、文字領域であるか否かが判定される(ステップS63)。そして、判定の結果により処理が分岐する(ステップS64)。文字領域と判定された場合には、補正対象領域を補正するためにステップS65に進み、文字領域と判定されなかった場合には補正対象領域を第1の2値化データから削除するためにステップS66に進む。
ステップS65では、RAM107に記憶されている第1の2値化データの補正対象領域を、第3の2値化データに置換する。具体的には、第1の2値化データの補正対象領域を、第3の2値化データに書換える。一方、ステップS66では、RAMに記憶されている第1の2値化データの補正対象領域を削除する。具体的には、第1の2値化データの補正対象領域を、空白の画素値「255」に書換る。
ステップS67において、次に処理対象とするべき画素群が存在するか否かが判断され、存在する場合にはステップS68に進み、存在しない場合にはステップS69に進む。変数Jが、ステップS57でカウントされた画素群の数に達しか否かにより判断される。ステップS68では、変数Jに「1」が加算され、画素群(J)について上述したステップS59〜S66の処理が繰返される。
ステップS69では、次に処理対象とするべき文字領域が存在するか否かが判断され、存在する場合にはステップS70に進み、存在しない場合には処理を終了する。変数Iが、ステップS55でカウントされた文字領域の数に達しか否かにより判断される。ステップS70では、変数Iに「1」が加算され、文字領域(J)について上述したステップS57〜S67の処理が繰返される。
図18は、図17のステップS57で実行される比較処理の流れを示すフローチャートである。図18を参照して、ステップS71では、RAM107に記憶されている第1の2値化データの文字領域と、第2の2値化データの文字領域との差分画像が生成される。差分画像は、文字領域と画像データ中の位置とサイズが同じである。そして、差分画像に対して画素値が「1」の画素が隣接する画素群に同じラベルを付すラベリング処理が実行される(ステップS72)。同じラベルの付された画素の集合が画素群である。
そして、文字領域のうちから同じラベルの画素で構成される画素群が抽出される(ステップS73)。このとき、抽出された画素群の数がカウントされる。
以上説明したように第2の実施の形態におけるMFP1では、第1の2値化データと第2の2値化データとで値の異なる画素が複数連続する画素群を抽出し、文字領域から抽出された画素群に含まれる画素数に応じて、文字領域を補正対象領域に決定する。このため、第1の2値化データに複数の文字領域が存在する場合であっても、必要な場合に限って第3のアルゴリズムで2値化するので、不要な処理を実行することなく、処理速度をさらに向上させることができる。さらに、画像データの補正対象領域を第3のアルゴリズムで2値化するので、1つの文字が異なるアルゴリズムで2値化されることがなく、2値化データの画質を向上させることができる。
また、補正対象領域が少なくとも1文字を含むようにすることができる。このため、文字が部分的に異なるアルゴリズムで2値化されることなく、2値化データの画質を向上させることができる。
なお、第1および第2の実施の形態では、MFP1について説明したが、図10〜図12または図17、図18に示した処理をコンピュータに実行させるための画像処理方法または画像処理プログラムとして発明を捉えることができるのは言うまでもない。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
本発明の第1の実施の形態におけるMFPの概略構成を示す模式的断面図である。 本実施の形態におけるMFPの回路構成を示すブロック図である。 第1の実施の形態におけるCPU101の機能を示す機能ブロック図である。 比較部の機能を示す機能ブロック図である。 ラベリング処理を説明するための図である。 ラベリング処理の具体的な処理を説明するための図である。 ラベリング処理を用いて文字領域を拡大する例を示す図である。 文字領域を説明するための図である。 判定部の機能を示す機能ブロック図である。 第1の実施の形態におけるMFPのCPUで実行される画像処理の流れを示すフローチャートである。 図10のステップS07で実行される比較処理の流れを示すフローチャートである。 図10のステップS12で実行される補正後比較処理の流れを示すフローチャートである。 第2の実施の形態におけるMFPのCPUの機能を示す機能ブロック図である。 第2の実施の形態における比較部の機能を示す機能ブロック図である。 ラベリング処理を用いて補正対象領域を拡大する例を示す図である。 補正対象領域を説明するための図である。 第2の実施の形態におけるMFPのCPUで実行される画像処理の流れを示すフローチャートである。 図17のステップS57で実行される比較処理の流れを示すフローチャートである。
符号の説明
1 MFP、11 スキャナ部、12 プリンタ部、101 CPU、112 第1の2値化処理回路、126 フラッシュROM、151 第2の2値化処理部、153 文字領域抽出部、155,155A 比較部、157 第3の2値化処理部、158 判定部、159 置換部、161 差分画像作成部、162,162A ラベリング部、163 文字領域拡大部、163A 補正対象領域拡大部、171 第1差分画像作成部、172 第2差分画像作成部、173 補正後比較部。

Claims (13)

  1. 画像データが入力されると、第1のアルゴリズムに従って、入力された前記画像データから文字領域を抽出し、当該文字領域を2値化した第1の2値化データを出力する第1の2値化手段と、
    前記画像データと前記第1の2値化データとが入力される制御手段とを備え、
    前記制御手段は、入力された前記画像データを前記第1のアルゴリズムとは異なる第2のアルゴリズムに従って2値化した第2の2値化データを生成する第2の2値化手段と、
    前記第1の2値化データと前記第2の2値化データとの差分画像を取得し、前記差分画像にラベリング処理を施すことによって前記第1の2値化データと前記第2の2値化データとで値の異なる画素の集合である画素群を抽出する比較手段と、
    前記画素群を中心にして当該画素群に対応する文字を内包するように拡大された補正対象領域を決定する補正対象領域決定手段と、
    前記画像データの前記補正対象領域を、前記第のアルゴリズムよりも正しく2値化できる第3のアルゴリズムに従って2値化する第3の2値化手段と、
    前記第1の2値化データに含まれる前記補正対象領域の画素値を、前記第3のアルゴリズムに従って2値化された画素値に置換える置換手段とを含む、画像処理装置。
  2. 前記第1の2値化手段は、
    入力された前記画像データに含まれる画素の属性を判定する判定手段を含み、
    前記判定手段により属性が文字と判定された画素の画素値に基づいて、前記画像データを2値化して前記第1の2値化データを出力する、請求項1に記載の画像処理装置。
  3. 前記制御手段は、入力された前記第1の2値化データから文字を含む前記文字領域を抽出する文字領域抽出手段を含み、
    前記比較手段は、前記第1の2値化データの前記文字領域と前記第2の2値化データの前記文字領域とを比較することによって前記差分画像を取得する、請求項1に記載の画像処理装置。
  4. 前記補正対象領域決定手段は、前記文字領域から抽出された前記画素群に含まれる画素数に応じて、前記文字領域を前記補正対象領域に決定する、請求項1から3のいずれかに記載の画像処理装置。
  5. 前記補正対象領域決定手段は、抽出された前記補正対象領域を拡大する領域拡大手段をさらに含む、請求項に記載の画像処理装置。
  6. 前記領域拡大手段は、入力された前記画像データに基づいて、前記補正対象領域を前記画素群が含まれる文字列を内包する大きさにまで拡大する、請求項5に記載の画像処理装置。
  7. 前記領域拡大手段は、入力された前記画像データに基づいて、前記補正対象領域のそれぞれを前記画素群が含まれる1文字を内包する大きさにまで拡大する、請求項5に記載の画像処理装置。
  8. 前記領域拡大手段は、
    入力された前記画像データからエッジ画像を生成するエッジ画像生成手段を含み、
    前記補正対象領域に含まれるエッジが途切れるまで前記補正対象領域を拡大する、請求項5から7のいずれかに記載の画像処理装置。
  9. 前記領域拡大手段は、入力された前記画像データの前記補正対象領域に含まれる画素の色が変化するまで前記補正対象領域を拡大する、請求項5から7のいずれかに記載の画像処理装置。
  10. 前記第2の2値化手段は、入力された前記画像データに含まれる画素の画素値を、所定のしきい値を用いて2値化した単純2値化データを生成する単純2値化データ手段を含む、請求項1から9のいずれかに記載の画像処理装置。
  11. 前記第3の2値化手段により2値化された第3の2値化データと前記第2の2値化データとの差分画像を取得する補正後比較手段をさらに含
    前記置換手段は、
    前記第1の2値化データと前記第2の2値化データとの差分が前記第1の2値化データと前記第3の2値化データとの差分よりも大きい場合に、前記第1の2値化データの前記補正対象領域の画素値を、前記第3の2値化データの画素値に置換え、
    前記第1の2値化データと前記第2の2値化データとの差分が前記第1の2値化データと前記第3の2値化データとの差分以下である場合に、前記第1の2値化データの前記補正対象領域の画素値を、前記第3の2値化データの画素値に置換えない、請求項1から10のいずれかに記載の画像処理装置。
  12. 画像データが入力されると、第1のアルゴリズムに従って、入力された前記画像データから文字領域を抽出し、当該文字領域を2値化した第1の2値化データを出力する第1の2値化手段を備えた画像形成装置で実行される画像処理方法であって、
    前記画像データと前記第1の2値化データとの入力を受付けるステップと、
    入力された前記画像データを前記第1のアルゴリズムとは異なる第2のアルゴリズムに従って2値化した第2の2値化データを生成するステップと、
    前記第1の2値化データと前記第2の2値化データとの差分画像を取得するステップと、
    前記差分画像にラベリング処理を施すことによって前記第1の2値化データと前記第2の2値化データとで値の異なる画素の集合である画素群を抽出するステップと、
    前記画素群を中心にして当該画素群に対応する文字を内包するように拡大された補正対象領域を決定するステップと、
    前記画像データの前記補正対象領域を、前記第のアルゴリズムよりも正しく2値化できる第3のアルゴリズムに従って2値化するステップと、
    前記第1の2値化データに含まれる前記補正対象領域の画素値を、前記第3のアルゴリズムに従って2値化された画素値に置換えるステップとを含む、画像処理方法。
  13. 画像データが入力されると、第1のアルゴリズムに従って、入力された前記画像データから文字領域を抽出し、当該文字領域を2値化した第1の2値化データを出力する第1の2値化手段を備えた画像形成装置で実行される画像処理プログラムであって、
    前記画像データと前記第1の2値化データとの入力を受付けるステップと、
    入力された前記画像データを前記第1のアルゴリズムとは異なる第2のアルゴリズムに従って2値化した第2の2値化データを生成するステップと、
    前記第1の2値化データと前記第2の2値化データとの差分画像を取得するステップと、前記差分画像にラベリング処理を施すことによって前記第1の2値化データと前記第2の2値化データとで値の異なる画素の集合である画素群を抽出するステップと、
    前記画素群を中心にして当該画素群に対応する文字を内包するように拡大された補正対象領域を決定するステップと、
    前記画像データの前記補正対象領域を、前記第のアルゴリズムよりも正しく2値化できる第3のアルゴリズムに従って2値化するステップと、
    前記第1の2値化データに含まれる前記補正対象領域の画素値を、前記第3のアルゴリズムに従って2値化された画素値に置換えるステップとを前記画像処理装置に実行させる画像処理プログラム。
JP2004359709A 2004-12-13 2004-12-13 画像処理装置、画像処理方法および画像処理プログラム Active JP4483563B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004359709A JP4483563B2 (ja) 2004-12-13 2004-12-13 画像処理装置、画像処理方法および画像処理プログラム
US11/298,108 US7545534B2 (en) 2004-12-13 2005-12-09 Image processing apparatus, method and program binarizing received image data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004359709A JP4483563B2 (ja) 2004-12-13 2004-12-13 画像処理装置、画像処理方法および画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2006173723A JP2006173723A (ja) 2006-06-29
JP4483563B2 true JP4483563B2 (ja) 2010-06-16

Family

ID=36583410

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004359709A Active JP4483563B2 (ja) 2004-12-13 2004-12-13 画像処理装置、画像処理方法および画像処理プログラム

Country Status (2)

Country Link
US (1) US7545534B2 (ja)
JP (1) JP4483563B2 (ja)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2702928B2 (ja) * 1987-06-19 1998-01-26 株式会社日立製作所 画像入力装置
JPH01198870A (ja) * 1987-10-08 1989-08-10 Ricoh Co Ltd デジタルカラー画像処理装置
JP2744619B2 (ja) * 1988-06-28 1998-04-28 富士通株式会社 画像処理装置
US5001576A (en) * 1988-09-28 1991-03-19 Konica Corporation Image processor with improved discrimination between character image and tonal image
EP0711078B1 (en) * 1994-11-04 2002-05-15 Matsushita Electric Industrial Co., Ltd. Picture coding apparatus and method
JP3985928B2 (ja) 2000-02-14 2007-10-03 株式会社リコー 画像処理方法、画像処理装置、文字認識装置及び記憶媒体

Also Published As

Publication number Publication date
US20060126087A1 (en) 2006-06-15
JP2006173723A (ja) 2006-06-29
US7545534B2 (en) 2009-06-09

Similar Documents

Publication Publication Date Title
JP4745830B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP2000050061A (ja) 画像処理装置
JPH0844827A (ja) デジタル複写機
JP4483567B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
US8411318B2 (en) Color and monochrome image processing and outputting apparatus
JP4483563B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP2018045359A (ja) 画像処理装置及び画像処理プログラム
JPH06290300A (ja) 像域識別装置
US20110064305A1 (en) Image processing apparatus, image processing method and computer readable medium
JP3873947B2 (ja) 画像処理装置および画像処理プログラム
JP4135656B2 (ja) 画像領域判定方法、画像処理装置およびプログラム
JP5720154B2 (ja) 画像処理装置及び画像処理プログラム
JP4454297B2 (ja) 2値化処理装置、および2値化処理方法
JP7013341B2 (ja) 帳票認識装置、帳票認識方法、及び帳票認識プログラム
JP3198267B2 (ja) 画像処理装置と画像形成装置
JP4450785B2 (ja) 画像処理装置、画像形成装置、画像読取装置、画像処理方法及びプログラム
JP4315349B2 (ja) 画像処理方法および装置並びにプログラム
JP5262778B2 (ja) 画像処理装置及び画像処理プログラム
JPH11213089A (ja) 画像処理装置及びその方法
JP2012238051A (ja) 画像処理装置、画像処理方法及びプログラム
JP5146653B2 (ja) 画像処理装置及び画像処理プログラム
JP4140482B2 (ja) 画像処理装置
JP2005316583A (ja) 画像処理方法、画像処理装置及び画像処理プログラム
JP5875551B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム
JP2006202221A (ja) 画像処理装置および画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071017

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090316

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100302

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100315

R150 Certificate of patent or registration of utility model

Ref document number: 4483563

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130402

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140402

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350