JP6841254B2

JP6841254B2 - 画像処理装置、および、コンピュータプログラム

Info

Publication number: JP6841254B2
Application number: JP2018045433A
Authority: JP
Inventors: 竜司山田
Original assignee: Brother Industries Ltd
Current assignee: Brother Industries Ltd
Priority date: 2018-03-13
Filing date: 2018-03-13
Publication date: 2021-03-10
Anticipated expiration: 2038-03-13
Also published as: JP2019159783A

Description

本明細書は、イメージセンサを用いて印刷物を読み取ることによって生成される画像データに対する画像処理に関し、特に、画像内の文字画素を特定するための画像処理に関する。

特許文献１に開示された画像処理装置は、画素ごとにエッジであるか否かを判定するエッジ判定と、画素ごとに網点であるかを判定する網点判定と、を実行する。画像処理装置は、エッジであり、かつ、網点ではない画素を、文字を示す画素として特定する。

特開平６−１６４９２８号公報特開２００４−１０４６１０号公報

イメージセンサを用いて印刷物を読み取ることによって生成される画像データでは、該画像データによって示される画像内に、印刷物に含まれる網点が現れる。このような網点を構成する画素は、画像内の文字画素を特定する際に、文字画素として誤って特定されやすい。

このように、網点を含む画像であっても、例えば、網点に起因して文字のない領域において文字画素が誤って特定されることを抑制して、文字画素を精度良く特定できる技術が求められていた。

本明細書は、網点を含む画像であっても、対象画像内の文字画素を精度良く特定できる技術を開示する。

本明細書に開示された技術は、上述の課題の少なくとも一部を解決するためになされたものであり、以下の適用例として実現することが可能である。

［適用例１］画像処理装置であって、対象画像を示す対象画像データを取得する画像取得部であって、前記対象画像データは、イメージセンサを用いて印刷物を読み取ることによって生成される、前記画像取得部と、前記対象画像内の複数個の画素から、文字を示す文字画素を特定する文字特定部と、を備え、前記文字特定部は、前記対象画像データを用いて、前記対象画像内の複数個の画素のそれぞれが、対象画像内のエッジを構成するエッジ画素であるか否かを画素ごとに判断することによって、前記エッジ画素であると判断される複数個の第１の候補画素を決定し、前記対象画像データを用いて、前記対象画像上に配置される複数個のブロックのそれぞれについて、前記ブロック内の複数個の画素の分布を示すヒストグラムデータを生成し、前記ヒストグラムデータを用いて、前記複数個のブロックのそれぞれが、文字を示す文字ブロックであるか否かをブロックごとに判断することによって、前記文字ブロックであると判断されるブロック内の複数個の第２の候補画素を決定し、前記対象画像内の複数個の画素のうち、前記第１の候補画素であると決定され、かつ、前記第２の候補画素であると決定される画素を、前記文字画素として特定する、画像処理装置。

上記構成によれば、画素ごとの判断によって、複数個の第１の文字候補画素が決定され、ヒストグラムデータを用いたブロックごとの判断によって、複数個の第２の文字候補画素が決定される。そして、第１の文字候補画素であると決定され、かつ、第２の文字候補画素であると決定される画素が、文字画素として特定される。この結果、例えば、画素ごとの判断によって、網点を構成する画素が第１の文字候補画素であると誤って決定されたとしても、ブロックごとの判断によって、網点を構成する画素が第２の文字候補画素であると決定されない場合には、網点を構成する画素が文字画素であると誤って特定されることがない。ブロックごとの判断にヒストグラムデータを用いることにより、文字候補画素の特定に煩雑な処理を要することなく第２の文字候補画素を決定できる。したがって、例えば、網点を含む画像であっても、対象画像内の文字画素を精度良く特定できる。

なお、本明細書に開示される技術は、種々の形態で実現することが可能であり、例えば、複合機、スキャナ、プリンタ、画像処理方法、これら装置の機能または上記方法を実現するためのコンピュータプログラム、そのコンピュータプログラムを記録した記録媒体、等の形態で実現することができる。

画像処理装置の一例である複合機２００の構成を示すブロック図である。画像処理のフローチャートである。画像処理で用いられる画像の一例を示す第１の図である。文字特定処理で用いられる画像の一例を示す図である。第１の二値画像データ生成処理のフローチャートである。エッジ強調処理のフローチャートである。平滑化済みのＲ成分画像データとエッジ強調済みのＲ成分画像データとの説明図である。レベル補正処理のためのトーンカーブの一例を示す図である。第２の二値画像データ生成処理のフローチャートである。スキャンデータの最小成分値と最大成分値の説明図である。画像処理に用いられる画像の一例を示す第２の図である。ブロック判定処理のフローチャートである。スキャン画像ＳＩ上に配置される複数個のブロックＢＬの説明図である。ヒストグラムデータによって示されるヒストグラムの一例を示す図である。ブロックＢＬごとの判断の一例を示す図である。ブロック判定データにおける画素の値の設定の一例を示す図である。実施例の効果について説明する図である。

Ａ．実施例：
Ａ−１：複合機２００の構成
実施の形態を実施例に基づき説明する。図１は、画像処理装置の一例である複合機２００の構成を示すブロック図である。複合機２００は、画像処理装置を制御するプロセッサであるＣＰＵ２１０と、ＤＲＡＭなどの揮発性記憶装置２２０と、フラッシュメモリやハードディスクドライブなどの不揮発性記憶装置２３０と、液晶ディスプレイなどの表示部２４０と、液晶ディスプレイと重畳されたタッチパネルやボタンを含む操作部２５０と、ユーザの端末装置１００などの外部装置と通信を行うためのインタフェース（通信ＩＦ）２７０と、印刷実行部２８０と、読取実行部２９０と、を備えている。

読取実行部２９０は、ＣＰＵ２１０の制御に従って、一次元イメージセンサを用いて原稿を光学的に読み取ることによってスキャンデータを生成する。印刷実行部２８０は、ＣＰＵ２１０の制御に従って、複数種類のトナー、具体的には、シアン（Ｃ）、マゼンタ（Ｍ）、イエロ（Ｙ）、ブラック（Ｋ）のトナーを、色材として用いて、レーザ方式で用紙などの印刷媒体に画像を印刷する。具体的には、印刷実行部２８０は、感光ドラムを露光して静電潜像を形成し、該静電潜像にトナーを付着させてトナー像を形成する。印刷実行部２８０は、感光ドラム上に形成されたトナー像を用紙に転写する。なお、変形例では、印刷実行部２８０は、色材としてのインクを吐出して、用紙上に画像を形成するインクジェット方式の印刷実行部であっても良い。

揮発性記憶装置２２０は、ＣＰＵ２１０が処理を行う際に生成される種々の中間データを一時的に格納するバッファ領域を提供する。不揮発性記憶装置２３０には、コンピュータプログラムＰＧが格納されている。コンピュータプログラムＰＧは、ＣＰＵ２１０に複合機２００の制御を実現させる制御プログラムである。本実施例では、コンピュータプログラムＰＧは、複合機２００の製造時に、不揮発性記憶装置２３０に予め格納される形態で提供される。これに代えて、コンピュータプログラムＰＧは、サーバからダウンロードされる形態で提供されても良く、ＤＶＤ−ＲＯＭなどに格納される形態で提供されてもよい。ＣＰＵ２１０は、コンピュータプログラムＰＧを実行することにより、後述する画像処理を実行することができる。

Ａ−２：画像処理
図２は、画像処理のフローチャートである。この画像処理は、例えば、ユーザが、読取実行部２９０の原稿台に、原稿を載置して、コピーの実行指示を入力した場合に実行される。この画像処理は、原稿を、読取実行部２９０を用いて読み取ることによって生成されるスキャンデータを取得し、該スキャンデータを用いて、原稿を示す印刷データを生成することで、いわゆる原稿のコピーを実現する処理である。

Ｓ１０では、ＣＰＵ２１０は、ユーザが原稿台に設置した原稿を、読取実行部２９０を用いて読み取ることによって、対象画像データとしてのスキャンデータを生成する。原稿は、例えば、複合機２００、あるいは、図示しないプリンタによって画像が印刷された印刷物である。生成されたスキャンデータは、揮発性記憶装置２２０（図１）のバッファ領域に格納される。スキャンデータは、複数個の画素の値を含み、複数個の画素の値のそれぞれは、画素の色をＲＧＢ表色系の色値（ＲＧＢ値とも呼ぶ）で表す。すなわち、スキャンデータは、ＲＧＢ画像データである。１個の画素のＲＧＢ値は、例えば、赤色（Ｒ）と緑色（Ｇ）と青色（Ｂ）との３個の色成分の値（以下、Ｒ値、Ｇ値、Ｂ値とも呼ぶ）を含んでいる。本実施例では、各成分値の階調数は、２５６階調である。

ＲＧＢ画像データであるスキャンデータは、ＲＧＢ表色系を構成する３個の色成分に対応する３個の成分画像データ（Ｒ成分画像データ、Ｇ成分画像データ、Ｂ成分画像データ）を含んでいると言うことができる。各成分画像データは、１種類の色成分の値を、画素の値とする画像データである。

Ｓ１５では、ＣＰＵ２１０は、スキャンデータに対して、スキャンデータによって示されるスキャン画像を、拡大率Ｌｒで拡大する拡大処理を実行して、拡大処理済みのスキャンデータを生成する。拡大率Ｌｒは、例えば、ユーザによって、コピーの実行指示とともに入力される。拡大率Ｌｒは、例えば、０．１〜６（１０％〜６００％）の範囲の値であり、１未満の拡大率Ｌｒでの拡大処理は、スキャン画像のサイズを小さくする処理であり、１より大きな拡大率Ｌｒでの拡大処理は、スキャン画像のサイズを大きくする処理である。スキャン画像のサイズは、具体的には、縦方向および横方向の画素数で定義される。なお、拡大処理前のスキャンデータを元画像データとも呼び、拡大処理済みのスキャンデータを対象画像データとも呼ぶ。以下では、単にスキャンデータと呼ぶとき、拡大処理済みのスキャンデータを意味する。

図３は、画像処理で用いられる画像の一例を示す第１の図である。図３（Ａ）には、スキャンデータによって示されるスキャン画像ＳＩの一例が示されている。スキャン画像ＳＩは、複数個の画素を含む。該複数個の画素は、第１方向Ｄ１と、第１方向Ｄ１と直交する第２方向Ｄ２と、に沿って、マトリクス状に配置されている。

図３（Ａ）のスキャン画像ＳＩは、原稿の用紙の地色を示す白色の背景Ｂｇ１と、３個の文字とは異なるオブジェクトＯｂ１〜Ｏｂ３と、４個の文字Ｏｂ４〜Ｏｂ７と、４個の文字Ｏｂ４〜Ｏｂ７の背景Ｂｇ２と、を含んでいる。文字とは異なるオブジェクトは、例えば、写真である。背景Ｂｇ２は、白色とは異なる色を有する均一な画像である。

Ｓ２０では、ＣＰＵ２１０は、スキャンデータに対して、文字特定処理を実行する。文字特定処理は、スキャン画像ＳＩ内の複数個の画素を、文字を示す複数個の文字画素と、文字を示さない複数個の非文字画素と、に分類することによって、文字画素を特定する処理である。

文字特定処理によって、例えば、文字画素の値が「１」とされ、非文字画素の値が「０」とされた二値画像データ（文字特定データとも呼ぶ）が生成される。図３（Ｂ）には、文字特定データによって示される文字特定画像ＴＩの一例が示されている。この文字特定画像ＴＩには、スキャン画像ＳＩ内の４個の文字Ｏｂ４〜Ｏｂ７のエッジを構成する複数個の画素が、文字画素Ｔｐ４〜Ｔｐ７として、特定されている。なお、比較的大きな文字については、文字のエッジを構成する画素が文字画素として特定され、比較的小さな文字については、文字を構成する画素の全体が文字画素として特定される。文字特定処理の詳細は、後述する。

Ｓ３０では、ＣＰＵ２１０は、スキャンデータに対して、網点平滑化処理を実行して、平滑化画像を示す平滑化画像データを生成する。具体的には、ＣＰＵ２１０は、スキャンデータに含まれる複数個の非文字画素の値のそれぞれに対して、ガウスフィルタなどの平滑化フィルタを用いた平滑化処理を実行して、平滑化処理済みの複数個の非文字画素の値を算出する。平滑化処理の対象となる非文字画素は、Ｓ２０の分類処理によって生成された文字特定データを参照して特定される。ＣＰＵ２１０は、スキャンデータに含まれる複数個の文字画素の値と、平滑化処理済みの複数個の非文字画素の値と、を含む平滑化画像データを生成する。

図３（Ｃ）には、平滑化画像データによって示される平滑化画像ＧＩが示されている。平滑化画像ＧＩは、白色の背景Ｂｇ１ｇと、スキャン画像ＳＩ内のオブジェクトＯｂ１〜Ｏｂ７、背景Ｂｇ２が平滑化されたオブジェクトＯｂ１ｇ〜Ｏｂ７ｇ、背景Ｂｇ２ｇを含んでいる。これらのオブジェクトＯｂ１ｇ〜Ｏｂ７ｇ、背景Ｂｇ２ｇのうち、文字Ｏｂ４ｇ〜Ｏｂ７ｇ以外の部分（非文字部分とも呼ぶ）は、スキャン画像ＳＩと比較して、平滑化されている。

Ｓ４０では、ＣＰＵ２１０は、平滑化画像データに対して、文字鮮鋭化処理を実行して、処理済み画像データを生成する。具体的には、ＣＰＵ２１０は、平滑化画像データに含まれる複数個の文字画素の値のそれぞれに対して、アンシャープマスク処理や鮮鋭化フィルタを適用する処理などの鮮鋭化処理を実行して、鮮鋭化処理済みの複数個の文字画素の値を算出する。鮮鋭化処理の対象となる文字画素は、Ｓ２０の分類処理によって生成された文字特定データを参照して特定される。そして、ＣＰＵ２１０は、平滑化画像データに含まれる複数個の非文字画素の値（平滑化処理済みの複数個の非文字画素の値）と、鮮鋭化処理済みの複数個の文字画素の値と、を含む処理済み画像データを生成する。平滑化画像データに含まれる複数個の文字画素の値は、平滑化処理の対象ではないので、スキャンデータに含まれる複数個の文字画素の値と同じである。したがって、本ステップの文字鮮鋭化処理は、スキャンデータに含まれる複数個の文字画素の値に対して実行される、とも言うことができる。

図３（Ｄ）には、処理済み画像データによって示される処理済み画像ＦＩが示されている。処理済み画像ＦＩは、白色の背景Ｂｇ１ｆと、スキャン画像ＳＩ内のオブジェクトＯｂ１〜Ｏｂ７、背景Ｂｇ２に対応するオブジェクトＯｂ１ｆ〜Ｏｂ７ｆ、背景Ｂｇ２ｆを含んでいる。これらのオブジェクトＯｂ１ｆ〜Ｏｂ７ｆ、背景Ｂｇ２ｆのうち、文字Ｏｂ４ｆ〜Ｏｂ７ｆのエッジは、スキャン画像ＳＩ内の文字Ｏｂ４〜Ｏｂ７や、平滑化画像ＧＩ内の文字Ｏｂ４ｇ〜Ｏｂ７ｇと比較して、鮮鋭化されている。また、文字以外のオブジェクトＯｂ１ｆ〜Ｏｂ３ｆ、背景Ｂｇ２ｆのエッジは、鮮鋭化されていない。

以上の説明から解るように、処理済み画像ＦＩ内のオブジェクトＯｂ１ｆ〜Ｏｂ７ｆ、背景Ｂｇ２ｆは、鮮鋭化された文字と、平滑化された非文字を含む。

Ｓ５０では、ＣＰＵ２１０は、処理済み画像データを用いて印刷データを生成する印刷データ生成処理を実行する。具体的には、ＲＧＢ画像データである処理済み画像データに対して色変換処理が実行されて、印刷に用いられる色材に対応する色成分（Ｃ、Ｍ、Ｙ、Ｋの成分）を有する色値であるＣＭＹＫ値で画素ごとの色を示すＣＭＹＫ画像データが生成される。色変換処理は、例えば、公知のルックアップテーブルを参照して実行される。ＣＭＹＫ値画像データに対して、ハーフトーン処理が実行されて、印刷に用いられる色材ごと、かつ、画素ごとに、ドットの形成状態を示すドットデータが生成される。ドットの形成状態は、例えば、ドット有、ドット無の２種類の状態や、大ドット、中ドット、小ドット、ドット無の４種類の状態を取り得る。ハーフトーン処理は、例えば、ディザ法や、誤差拡散法に従って実行される。該ドットデータは、印刷時に用いられる順に並べ替えられ、該ドットデータに、印刷コマンドが付加されることによって、印刷データが生成される。

Ｓ６０では、ＣＰＵ２１０は、印刷処理を実行して、画像処理を終了する。具体的には、ＣＰＵ２１０は、印刷データを印刷実行部２８０に供給して、印刷実行部２８０に処理済み画像を印刷させる。

以上説明した画像処理によれば、スキャンデータのうち、特定済みの複数個の文字画素の値に対して第１の画像処理（具体的には、エッジ鮮鋭化処理）が実行され（Ｓ４０）、複数個の非文字画素の値に対して第１の画像処理とは異なる第２の画像処理（具体的には、網点平滑化処理）が実行され（Ｓ３０）、処理済み画像データが生成される。この結果、文字画素の値と、文字画素とは異なる画素の値と、に対して、互いに異なる画像処理が実行されるので、スキャンデータに対する適切な画像処理を実現できる。なお、変形例では、Ｓ４０の文字鮮鋭化処理が先に実行され、その後に、Ｓ３０の網点平滑化処理が実行されても良い。

より具体的には、鮮鋭化処理済みの複数個の文字画素の値と、平滑化処理済みの複数個の非文字画素の値と、を含む処理済み画像データが生成される（Ｓ３０、Ｓ４０）。この結果、見栄えの良い処理済み画像ＦＩを示す処理済み画像データを生成することができる。

例えば、図３（Ｄ）の処理済み画像ＦＩに示すように、処理済み画像データでは、文字画素の値には、鮮鋭化処理済みの値が用いられている。この結果、処理済み画像ＦＩの文字がシャープに見えるので、例えば、印刷される処理済み画像ＦＩの見栄えを向上することができる。

また、処理済み画像データでは、処理済み画像ＦＩ内の背景Ｂｇ２ｆや、写真などの文字とは異なるオブジェクトを構成する非文字画素の値には、平滑化処理済みの値が用いられている。この結果、処理済み画像ＦＩの文字とは異なる部分に、例えば、モアレの原因となる網点が表れることを抑制できるので、印刷される処理済み画像ＦＩにモアレなどの不具合が発生することを抑制できる。この結果、印刷される処理済み画像ＦＩの見栄えを向上することができる。また、写真内のエッジが過度に強調されることが抑制されるので、画像ＦＩの見栄えを向上することができる。

例えば、スキャンデータの生成に用いられた原稿は、画像が印刷された印刷物である。このため、例えば、原稿内の白とは異なる色を有する背景Ｂｇ２などの均一な部分は、画像を形成するドットレベルでみると、網点を形成している。網点は、複数個のドットと、ドットが配置されていない部分（原稿の地色を示す部分）と、を含む。このために、スキャン画像ＳＩ内の背景Ｂｇ２を示す領域には、画素レベルでみると、網点が示されている。網点内のドットは、原稿の印刷時に用いられるディザマトリクスなどの影響によって、周期性を持って並んでいる。このためにスキャンデータを用いて印刷を行うと、ハーフトーン処理前の元画像（スキャン画像ＳＩ）内に存在している網点のドットの周期成分と、印刷画像を構成する網点のドットの周期成分と、が干渉して、モアレが表れやすい。本実施例の処理済み画像ＦＩでは、平滑化処理によって、元画像（スキャン画像ＳＩ）内のエッジとは異なる部分のドットの周期成分が低減される。この結果、処理済み画像データを用いて、処理済み画像ＦＩを印刷する場合に、例えば、印刷される処理済み画像ＦＩにモアレが発生することを抑制できる。

特に、上記画像処理では、処理済み画像データを用いて、印刷データが生成される（Ｓ５０）ので、例えば、印刷される処理済み画像ＦＩに発生しやすいモアレを抑制可能な適切な印刷データを生成することができる。

Ａ−３：文字特定処理
図２のＳ２０の文字特定処理について説明する。Ｓ２２では、ＣＰＵ２１０は、スキャンデータを用いて、第１の二値画像データ生成処理を実行して、第１の二値画像データを生成する。第１の二値画像データは、エッジ画素と非エッジ画素とを示す二値データである。ここで、第１の二値画像データによって示されるエッジ画素を第１のエッジ画素とも呼び、第１の二値画像データによって示される非エッジ画素を第１の非エッジ画素とも呼ぶ。第１の二値画像データ生成処理の詳細は、後述する。

Ｓ２４では、ＣＰＵ２１０は、スキャンデータを用いて、第２の二値画像データ生成処理を実行して、第２の二値画像データを生成する。第２の二値画像データは、第１の二値画像データと同様に、エッジ画素と非エッジ画素とを示す二値データである。第２の二値画像データは、第１の二値画像データとは異なる処理によって生成され、第１の二値画像データとは異なるデータである。ここで、第２の二値画像データによって示されるエッジ画素を第２のエッジ画素とも呼び、第２の二値画像データによって示される非エッジ画素を第２の非エッジ画素とも呼ぶ。第２の二値画像データ生成処理の詳細は、後述する。

Ｓ２６では、ＣＰＵ２１０は、Ｓ２２にて生成された第１の二値画像データと、Ｓ２４にて生成された第２の二値画像データと、を合成する論理和合成処理を実行して、最終的に特定されるエッジ画素と非エッジ画素とを示す二値画像データ（エッジ特定データとも呼ぶ）を生成する。具体的には、ＣＰＵ２１０は、第１の二値画像データと、第２の二値画像データと、の各画素の論理和を取ることによって、エッジ特定データとしての二値画像データを生成する。換言すれば、ＣＰＵ２１０は、第１の二値画像データによって特定される複数個の第１のエッジ画素と、第２の二値画像データによって特定される複数個の第２のエッジ画素と、を含む画素群であって、第１のエッジ画素とも第２のエッジ画素とも異なる画素を含まない画素群を、最終的に、複数個のエッジ画素として特定する。この結果、第１の二値画像データと第２の二値画像データとを用いて、対象画像内の画素がエッジ画素であるか否かを精度良く判断することができる。例えば、スキャン画像ＳＩ内のエッジ画素の特定漏れを効果的に低減できる。

エッジ特定データによって特定されるエッジ画素は、文字画素の候補となる画素であり、第１の文字候補画素とも呼ぶ。例えば、エッジ特定データは、第１の文字候補画素（本実施例ではエッジ画素）の値が「１」とされ、第１の文字候補画素ではない画素（本実施例では、非エッジ画素）の値が「０」とされた二値画像データである。

図４は、文字特定処理で用いられる画像の一例を示す図である。図４（Ａ）には、エッジ特定データによって示されるエッジ特定画像ＥＩの一例が示されている。このエッジ特定画像ＥＩには、スキャン画像ＳＩ内のオブジェクトＯｂ１〜Ｏｂ７のエッジＥｇ１〜Ｅｇ７を構成する複数個のエッジ画素と、背景Ｂｇ１と背景Ｂｇ２との境界のエッジＥｇ８を構成する複数個のエッジ画素とが、第１の文字候補画素として特定されている。このように、第１の文字候補画素によって示されるエッジは、文字のエッジを含む。また、該エッジは、文字とは異なるオブジェクト（例えば、写真）に含まれる細線などのエッジを含む。

Ｓ２８では、ＣＰＵ２１０は、スキャンデータに対して、ブロック判定処理を実行して、文字画素の候補である第２の文字候補画素と、第２の文字候補画素ではない画素と、を示す二値画像データ（ブロック判定データとも呼ぶ）を生成する。ブロック判定処理は、スキャンデータを用いて、スキャン画像ＳＩ内に配置される複数個のブロックのそれぞれが、文字を示す文字ブロックであるか否かをブロックごとに判断する処理である。１個のブロックは、Ｎ個（Ｎは２以上の整数）の画素を含む矩形の領域である。詳細は後述するが、ブロックごとの判断結果に基づいて、スキャン画像ＳＩ内の複数個の画素は、第２の文字候補画素か否かが決定される。ブロック判定データは、第２の文字候補画素の値が「１」とされ、第２の文字候補画素ではない画素の値が「０」とされた二値画像データである。

図４（Ｂ）には、ブロック判定データによって示されるブロック判定画像ＢＩの一例が示されている。このブロック判定画像ＢＩには、スキャン画像ＳＩ内の文字Ｏｂ４〜Ｏｂ７が配置された領域を示す第２の文字候補画素Ｂｋ４〜Ｂｋ７ｇ１が特定されている。このように、第２の文字候補画素によって示される領域は、文字を含む文字領域を含み、文字とは異なるオブジェクト（例えば、写真）を含む領域を含まない。

Ｓ２９では、ＣＰＵ２１０は、Ｓ２６にて生成されたエッジ特定データと、Ｓ２８にて生成されたブロック判定データと、を合成する論理積合成処理を実行して、文字画素と非文字画素とを示す上述した文字特定データ（図３（Ｂ）参照）を生成する。具体的には、ＣＰＵ２１０は、エッジ特定データと、ブロック判定データと、の各画素の論理積を取ることによって、文字特定データとしての二値画像データを生成する。換言すれば、ＣＰＵ２１０は、スキャン画像ＳＩ内の複数個の画素のうち、Ｓ２２〜Ｓ２６において第１の文字候補画素であると決定され、かつ、Ｓ２８において第２の文字候補画素であると決定される画素を、文字画素として特定する。ＣＰＵ２１０は、スキャン画像ＳＩ内の複数個の画素のうち、第１の文字候補画素ではないと決定される画素と、第２の文字候補画素ではないと決定される画素とを、非文字画素として特定する。文字特定データが生成されると、文字特定処理は、終了される。

Ａ−４：第１の二値画像データ生成処理
図２のＳ２２の第１の二値画像データ生成処理について説明する。図５は、第１の二値画像データ生成処理のフローチャートである。Ｓ１００では、ＣＰＵ２１０は、スキャンデータに含まれる３個の成分画像データ、すなわち、Ｒ成分画像データ、Ｇ成分画像データ、Ｂ成分画像データのそれぞれに対して、平滑化処理を実行する。これによって、３個の平滑化済みの成分画像データ、すなわち、平滑化済みのＲ成分画像データ、平滑化済みのＧ成分画像データ、平滑化済みのＢ成分画像データが生成される。

平滑化処理は、処理対象の成分画像データによって示される成分画像を平滑化する処理である。本実施例の平滑化処理は、処理対象の成分画像データの各画素の値に対して、所定の平滑化フィルタを適用して、平滑化済みの各画素の値を算出する処理である。平滑化フィルタには、例えば、縦７画素×横７画素のサイズのガウスフィルタが用いられる。

Ｓ１１０では、３個の平滑化済みの成分画像データのそれぞれに対して、エッジ強調処理を実行して、３個のエッジ強調済みの成分画像データ、すなわち、エッジ強調済みのＲ成分画像データ、エッジ強調済みのＧ成分画像データ、エッジ強調済みのＢ成分画像データを生成する。

図６は、エッジ強調処理のフローチャートである。ここでは、平滑化済みのＲ成分画像データが処理対象であるとして説明する。平滑化済みのＧ成分画像データおよび平滑化済みのＢ成分画像データに対しても同様の処理が行われる。

Ｓ２００では、ＣＰＵ２１０は、エッジ強調済みのＲ成分画像データを生成するためのキャンバスデータをメモリ（具体的には、揮発性記憶装置２２０のバッファ領域）に準備する。キャンバスデータによって示されるキャンバス（初期画像）は、スキャン画像ＳＩと同じサイズの画像、すなわち、同じ画素数の画像である。キャンバスデータの各画素の値は、所定の初期値（例えば、０）である。

Ｓ２０５では、ＣＰＵ２１０は、平滑化済みのＲ成分画像データによって示される平滑化済みのＲ成分画像内の複数個の画素から１個の注目画素を選択する。

Ｓ２１０では、ＣＰＵ２１０は、注目画素に対応するマスク値ＭＶを算出する。マスク値ＭＶは、注目画素の値ＴＶと、注目画素に対して上下左右に隣接する４個の画素を含む所定個数の周辺画素の値と、を用いて、注目画素の値ＴＶを平滑化する処理によって算出される。このために、マスク値ＭＶを、平滑値とも呼ぶ。具体的には、注目画素を中心とする縦１０画素×横１０画素の矩形の範囲内の１００個の画素の値の平均値が、注目画素に対応するマスク値ＭＶとして算出される。

Ｓ２２０では、ＣＰＵ２１０は、注目画素の値ＴＶと、注目画素に対応するマスク値ＭＶと、の差分ΔＶを算出する（ΔＶ＝（ＴＶ−ＭＶ））。

Ｓ２３０では、ＣＰＵ２１０は、差分ΔＶは、基準以上であるか否かを判断する。具体的には、差分ΔＶが、予め定められた閾値ＴＨ以上であるか否かが判断される。閾値ＴＨは、成分値が、０〜２５５の範囲の２５６階調の値である場合に、例えば、２０〜３０程度の値である。

差分ΔＶが基準以上である場合には（Ｓ２３０：ＹＥＳ）、Ｓ２４０にて、ＣＰＵ２１０は、注目画素の値ＴＶと、注目画素に対応する差分ΔＶと、の和（ＴＶ＋ΔＶ）を、処理済みの値として算出する。差分ΔＶが基準未満である場合には（Ｓ２３０：ＮＯ）、ＣＰＵ２１０は、Ｓ２４０をスキップする。

Ｓ２４５では、ＣＰＵ２１０は、注目画素の値を、Ｓ２００にて準備されたキャンバスデータに記録する。Ｓ２４０が実行された場合には、Ｓ２４０にて算出された注目画素の値ＴＶと、注目画素に対応する差分ΔＶと、の和が、処理済みの値としてキャンバスデータに記録される。Ｓ２４０がスキップされた場合には、平滑化済みのＲ成分画像データの注目画素の値が、そのまま、キャンバスデータに記録される。

Ｓ２５０では、ＣＰＵ２１０は、Ｒ成分画像内の全ての画素を注目画素として処理したか否かを判断する。未処理の画素がある場合には（Ｓ２５０：ＮＯ）、ＣＰＵ２１０は、Ｓ２０５に戻って、未処理の画素を注目画素として選択する。全ての画素が処理された場合には（Ｓ２５０：ＹＥＳ）、ＣＰＵ２１０は、エッジ強調処理を終了する。この時点でエッジ強調済みのＲ成分画像データが生成されている。

図７は、平滑化済みのＲ成分画像データと、エッジ強調済みのＲ成分画像データと、の説明図である。図７（Ａ）には、図５のＳ１００の平滑化処理前のＲ成分画像データを概念的に示すグラフが図示されている。図７（Ｂ）、図７（Ｃ）には、それぞれ、平滑化処理済みのＲ成分画像データ、および、エッジ強調済みのＲ成分画像データを概念的に示すグラフが図示されている。各グラフのうち、左側の部分には、網点を示す網点領域が概念的に示され、右側の部分には、文字などのオブジェクトのエッジを示すエッジ領域が概念的に示されている。各グラフの縦軸は、Ｒ成分の値を示し、横軸は、所定の方向（例えば、図３の第１方向Ｄ１）の位置を示す。

平滑化処理前のＲ成分画像データには、例えば、網点領域において、複数個の網点と、該網点間の複数個の隙間と、に対応する複数個の谷部Ｃ１〜Ｃ３と、複数個の山部Ｐ１、Ｐ２と、が現れる（図７（Ａ））。このような谷部Ｃ１〜Ｃ３と、複数個の山部Ｐ１、Ｐ２と、の間のＲ成分の値の差が大きいまま残存していると、後述するＳ１５０の二値化処理において、該Ｒ成分の値の差に起因して、網点を示すエッジ画素が特定されやすい。網点領域は、画素レベルの視点（網点を認識できる程度のミクロの視点）でみれば、網点を含むが、観察者の視点（網点を認識できない程度のマクロの視点）でみれば、均一な領域である。このため、本実施例では、網点領域内において、網点に起因するエッジ画素は、特定されるべきではない。網点領域は、図２のＳ３０で平滑化されることが好ましく、Ｓ４０にて、鮮鋭化されるべきではないからである。仮に、網点のエッジが鮮鋭化されると、網点の周期性が目立つために、該画像を印刷する場合に、モアレが目立ちやすくなるからである。例えば、スキャン画像ＳＩ内の背景Ｂｇ２などの均一な部分や、オブジェクトのエッジとは異なる部分において、エッジ画素は、特定されるべきではない。

平滑化済みのＲ成分画像データでは、平滑化処理によって、例えば、網点領域において、複数個の谷部Ｃ１ａ〜Ｃ３ａと、複数個の山部Ｐ１ａ、Ｐ２ａと、のＲ成分の値の差が、平滑化処理前のＲ成分画像データと比較して十分に小さくなっている（図７（Ｂ））。

ここで、本実施例のエッジ強調処理では、注目画素の値ＴＶと、注目画素に対応するマスク値ＭＶと、の差分ΔＶと、が大きいほど、エッジ強調の効果が大きくなる。このために、図７（Ｂ）の網点領域のように、比較的Ｒ成分の値の差が小さく平坦になっている領域では、エッジ強調の効果が小さくなる。また、本実施例のエッジ強調処理では、差分ΔＶが基準未満である場合には、エッジ強調が行われずに、平滑化済みのＲ成分画像データの画素の値がそのまま採用される（図６のＳ２３０）。この結果、エッジ強調済みのＲ成分画像データでは、エッジ強調処理が行われたにも関わらずに、例えば、網点領域において、複数個の谷部Ｃ１ｂ〜Ｃ３ｂと、複数個の山部Ｐ１ｂ、Ｐ２ｂと、のＲ成分の値の差は、平滑化処理済みのＲ成分画像データと比較して大きくなってはいない（図７（Ｃ））。すなわち、平滑化済みのＲ成分画像データと同様に、エッジ強調済みのＲ成分画像データでは、複数個の谷部Ｃ１ｂ〜Ｃ３ｂと、複数個の山部Ｐ１ｂ、Ｐ２ｂと、のＲ成分の値の差が、平滑化処理前のＲ成分画像データ（図７（Ａ））と比較して十分に小さくなっている（図７（Ｃ））。

平滑化処理前のＲ成分画像データには、例えば、文字などのオブジェクトのエッジを示すエッジ領域において、該エッジに対応してＲ成分の値が急激に変化する変動部Ｅ１が現れる（図７（Ａ））。このような変動部Ｅ１において、値の変化が大きいほど、後述するＳ１５０の二値化処理において、該Ｒ成分の値の差に起因して、オブジェクトのエッジを示すエッジ画素が特定されやすい。

平滑化済みのＲ成分画像データでは、平滑化処理によって、例えば、エッジ領域において、変動部Ｅ１ａにおける値の変化が、平滑化処理前のＲ成分画像データと比較して小さくなっている（緩やかになっている）（図７（Ｂ））。

しかしながら、文字などのオブジェクトのエッジに対応する変動部Ｅ１ａにおける値の変化は、網点領域における値の変化よりは十分に大きいので、エッジ強調処理によって、再度、急激な変化に戻される。この結果、エッジ強調済みのＲ成分画像データでは、エッジ領域において、変動部Ｅ１ｂのＲ成分の値の変化は、平滑化処理済みのＲ成分画像データと比較して大きくなっている（図７（Ｃ））。このため、エッジ強調済みのＲ成分画像データでは、エッジ領域において、変動部Ｅ１ｂにおける値の変化が、平滑化処理前のＲ成分画像データと比較して、同程度、もしくは、急激になっている（図７（Ｃ））。

以上の説明から解るように、本実施例では、各成分画像データに対して、平滑化処理（Ｓ１００）と、エッジ強調処理（Ｓ１１０）とを、この順序で実行するので、網点のエッジを示すエッジ画素が特定されることを抑制することができ、かつ、文字などのオブジェクトのエッジを示すエッジ画素が特定されることを促進することができる。この結果、スキャン画像ＳＩ内の複数個のエッジ画素を適切に特定することができる。

Ｒ、Ｇ、Ｂの３個の色成分に対応する３個の強調処理済みの成分画像データが生成されると、図５の１２０では、該３個の強調処理済みの成分画像データを用いて、輝度画像データを生成する。輝度画像データは、該３個の強調処理済みの成分画像データによって示される強調済画像内の複数個の画素の輝度を示すデータである。具体的には、ＣＰＵ２１０は、該３個の強調処理済みの成分画像データから取得される各画素のＲ値、Ｇ値、Ｂ値を用いて、各画素の輝度値Ｙを算出する。輝度値Ｙは、例えば、上記３成分の加重平均であり、具体的には、Ｙ＝０．２９９×Ｒ＋０．５８７×Ｇ＋０．１１４×Ｂの式を用いて算出できる。輝度画像データは、１種類の成分値（輝度を示す値）で構成される単成分画像データである。輝度成分データは、スキャンデータの対応する画素の値（ＲＧＢ値）に基づく輝度値Ｙを画素ごとに含んでいる。輝度成分データは、第１の画像データの例である。

Ｓ１３０では、ＣＰＵ２１０は、生成された輝度画像データに対して、当該輝度画像データによって示される輝度画像内のエッジを抽出するエッジ抽出処理を実行して、エッジ抽出データを生成する。具体的には、ＣＰＵ２１０は、輝度画像データの各画素の値に、公知のエッジ抽出フィルタ、例えば、ソーベルフィルタ（Sobel filter）を適用して、各画素のエッジ強度を算出する。ＣＰＵ２１０は、これらのエッジ強度を、複数個の画素の値とするエッジ抽出データを生成する。

Ｓ１４０では、ＣＰＵ２１０は、エッジ抽出データに対して、レベル補正処理を実行して、補正処理済みのエッジ抽出データを生成する。レベル補正処理は、エッジ抽出データの画素の値が取り得る階調値の範囲（本実施例では、０〜２５５の範囲）内の特定範囲を拡大する補正処理である。

図８は、レベル補正処理のためのトーンカーブの一例を示す図である。具体的には、ＣＰＵ２１０は、エッジ抽出データの各画素に対して、図８のトーンカーブを適用する。この結果、閾値Ｖｂ（例えば、２４５）以上の値は、全て最大値（２５５）に変換されるとともに、閾値Ｖａ（例えば、１０）以下の値は、全て最小値（０）に変換される。そして、閾値Ｖａより大きく、かつ、閾値Ｖｂ未満の範囲は、０から２５５の範囲に拡大される。このように、後述するＳ１５０の二値化処理の前に、二値化閾値を含む範囲（図８の閾値Ｖａより大きく、かつ、閾値Ｖｂ未満の範囲）を拡大するので、二値化の精度を向上できる。

Ｓ１５０では、ＣＰＵ２１０は、補正処理済みのエッジ抽出データに対して、二値化処理を実行して、二値画像データを生成する。例えば、ＣＰＵ２１０は、エッジ画像データにおいて、画素の値（すなわち、エッジ強度）が閾値（例えば、１２８）以上である画素を、エッジ画素に分類し、画素の値が閾値未満である画素を、非エッジ画素に分類する。二値画像データでは、上述したように、エッジ画素の値は、「１」とされ、非エッジ画素の値は、「０」とされる。

以上説明した第１の二値画像データ生成処理によれば、図７を参照して説明したように、複数個の成分画像データのそれぞれに対して平滑化処理を実行することで、スキャン画像ＳＩ内に現れる網点の特徴を低減できる。さらに、図７を参照して説明したように、複数個の平滑化済みの成分画像データのそれぞれに対して、エッジ強調処理を実行することで、平滑化処理によって平滑化されたスキャン画像ＳＩ内のエッジを適切に強調できる。この結果、網点に起因するエッジ画素が特定されることを抑制しつつ、スキャン画像ＳＩ内のエッジ画素の適切に特定できる。

さらに、単成分画像データとして、輝度画像データが用いられるので、スキャン画像ＳＩ内の複数個のエッジ画素をより適切に特定できる。例えば、網点は、印刷に用いられるＣ、Ｍ、Ｙの原色を有することが多いが、このような複数種の原色間の差は、Ｒ、Ｇ、Ｂの各成分画像データにおいて比較的大きくなるが、輝度画像データでは、比較的小さくなる。このために、輝度画像データを用いることで、網点に起因するエッジ画素が特定されることを適切に抑制できる。また、文字の読みやすさのために、文字の色と背景の色とは、輝度に比較的大きな差があることが多い。このために、輝度画像データを用いることで、文字をはじめとするオブジェクトのエッジを示すエッジ画素を適切に特定できる。

さらに、図６のエッジ強調処理では、注目画素に対応するマスク値（平滑値とも呼ぶ）の算出（Ｓ２１０）と、注目画素の値ＴＶと注目画素に対応するマスク値との差分ΔＶの算出（Ｓ２２０）と、注目画素の値ＴＶと対応する差分ΔＶとの和（ＴＶ＋ΔＶ）の算出（Ｓ２４０）と、を含むいわゆるアンシャープマスク処理が実行される。この結果、スキャン画像ＳＩのエッジを適切に強調できるので、特定すべきエッジ画素の特定漏れを抑制できる。この結果、スキャン画像ＳＩ内のエッジ画素をより適切に特定できる。

さらに、図６のエッジ強調処理では、スキャン画像ＳＩ内の複数個の画素のうち、対応する差分ΔＶが基準以上である画素については、アンシャープマスク処理の対象とされ、該差分ΔＶが基準未満である画素については、アンシャープマスク処理の対象とされない（Ｓ２３０、２４０）。この結果、図７を参照して説明したように、スキャン画像ＳＩの網点に起因する画素間の値の差が強調されることをさらに抑制できるので、網点に起因するエッジ画素の特定をさらに抑制できる。そして、文字などのオブジェクトのエッジについては適切に強調できる。したがって、スキャン画像ＳＩ内のエッジ画素をさらに適切に特定できる。

Ａ−５：第２の二値画像データ生成処理
図２のＳ２４の第２の二値画像データ生成処理について説明する。図９は、第２の二値画像データ生成処理のフローチャートである。Ｓ３００では、ＣＰＵ２１０は、スキャンデータを用いて、最小成分データを生成する。具体的には、ＣＰＵ２１０は、スキャンデータに含まれる複数個の画素の値（ＲＧＢ値）のそれぞれから、最小成分値Ｖｍｉｎを取得する。最小成分値Ｖｍｉｎは、ＲＧＢ値に含まれる複数個の成分値（Ｒ値、Ｇ値、Ｂ値）のうちの最小値である。ＣＰＵ２１０は、これらの最小成分値Ｖｍｉｎを複数個の画素の値とする画像データを、最小成分データとして生成する。最小成分データは、スキャン画像ＳＩと同じサイズの画像を示す画像データである。最小成分データに含まれる複数個の画素の値のそれぞれは、スキャンデータの対応する画素の値（ＲＧＢ値）の最小成分値Ｖｍｉｎである。

図１０は、スキャンデータの最小成分値と最大成分値の説明図である。図１０（Ａ）〜図１０（Ｅ）には、ＲＧＢ値の一例として、シアン（Ｃ）、マゼンタ（Ｍ）、イエロ（Ｙ）、黒（Ｋ）、白（Ｗ）のＲＧＢ値が、棒グラフで図示されている。図１０に示すように、Ｃ、Ｍ、Ｙ、Ｋ、ＷのＲＧＢ値（Ｒ、Ｇ、Ｂ）は、それぞれ、（０、２５５、２５５）、（２５５、０、２５５）（２５５、２５５、０）、（０、０、０）、（２５５、２５５、２５５）である。

これらのＲＧＢ値の輝度値Ｙは、上述したように、例えば、Ｙ＝０．２９９×Ｒ＋０．５８７×Ｇ＋０．１１４×Ｂの式を用いて算出できる。Ｃ、Ｍ、Ｙ、Ｋ、Ｗの輝度（０〜２５５の値で表す）は、約１８６、１１３、２２６、０、２５５であり、それぞれに異なる値となる（図１０）。これに対して、Ｃ、Ｍ、Ｙ、Ｋ、Ｗの最小成分値Ｖｍｉｎは、図１０に示すように、０、０、０、０、２５５となり、白（Ｗ）を除いて同じ値となる。

図１１は、画像処理に用いられる画像の一例を示す第２の図である。図１１（Ａ）は、スキャン画像ＳＩのうち、上述した網点領域の拡大図である。例えば、図１１（Ａ）の例では、スキャン画像ＳＩ内の網点領域は、複数個のＭドットＭＤと、複数個のＹドットＹＤと、を含んでいる。ここでは、説明のために、ＭドットＭＤを示す画像は、マゼンタの原色を有する均一な画像であり、ＹドットＹＤを示す画像は、イエロの原色を有する均一な画像であるとする。

図１１（Ｂ）には、最小成分データによって示される最小成分画像ＭＮＩの一例が示されている。この最小成分画像ＭＮＩは、図１１（Ａ）のスキャン画像ＳＩに対応している。最小成分画像ＭＮＩでは、スキャン画像ＳＩのＹドットＭＤに対応する領域ＭＤｂ内の画素の値と、ＹドットＹＤに対応する領域ＹＤｂ内の画素の値と、は互いに同じとなる。図１１（Ｃ）には、比較例として、各画素の輝度を示す輝度画像データによって示される輝度画像ＹＩが示されている。この輝度画像ＹＩは、図１１（Ａ）のスキャン画像ＳＩに対応している。輝度画像ＹＩでは、最小成分画像ＭＮＩとは異なり、スキャン画像ＳＩのＭドットＭＤに対応する領域ＭＤｄ内の画素の値と、ＹドットＹＤに対応する領域ＹＤｄ内の画素の値と、は互いに異なる。

以上の説明から解るように、最小成分画像ＭＮＩでは、スキャン画像ＳＩにおいて、原稿内のＣ、Ｍ、Ｙ、Ｋドットが形成された部分に対応する複数個の画素の値の間の差が、輝度画像ＹＩよりも小さくなる。そして、最小成分画像ＭＮＩでは、スキャン画像ＳＩにおいて、原稿内の地色（用紙の白色）を示す領域に対応する地色領域の画素の値が、ドットが形成された部分に対応する画素の値よりも大きくなる。

Ｓ３１０では、ＣＰＵ２１０は、生成された最小成分データに対して、該最小成分データによって示される最小成分画像ＭＮＩを平滑化する平滑化処理を実行して、平滑化済みの最小成分データを生成する。具体的には、ＣＰＵ２１０は、最小成分データの各画素の値に、所定の平滑化フィルタ、本実施例では、縦５画素×横５画素のガウスフィルタを適用することによって、平滑化済みの各画素の値を算出する。平滑化済みの最小成分データは、スキャンデータの対応する画素の値（ＲＧＢ値）に基づいて上述した処理で生成された平滑化済みの値を画素ごとに含んでいる。平滑化済みの最小成分データは、第２の画像データの例である。

Ｓ３２０では、ＣＰＵ２１０は、平滑化済みの最小成分データに対して、当該平滑化済みの最小成分データによって示される平滑化済みの最小成分画像ＭＮＩ内のエッジを抽出するエッジ抽出処理を実行して、エッジ抽出データを生成する。具体的には、ＣＰＵ２１０は、平滑化済みの最小成分データの各画素の値に、図５のＳ１３０の処理と同一のソーベルフィルタを適用して、エッジ強度を算出する。ＣＰＵ２１０は、これらのエッジ強度を、複数個の画素の値とするエッジ抽出データを生成する。

Ｓ３３０では、ＣＰＵ２１０は、エッジ抽出データに対して、レベル補正処理を実行して、補正処理済みのエッジ抽出データを生成する。レベル補正処理は、図５のＳ１４０の処理と同一である。Ｓ３４０では、ＣＰＵ２１０は、補正処理済みのエッジ抽出データに対して、図５のＳ１５０の処理と同様の二値化処理を実行して、二値画像データを生成する。二値画像データでは、上述したように、エッジ画素の値は、「１」とされ、非エッジ画素の値は、「０」とされる。

以上説明した第２の二値画像データ生成処理によれば、最小成分データに対してエッジ抽出処理が実行され、エッジ抽出データが生成される（Ｓ３２０）。そして、該エッジ抽出データを二値化する処理（Ｓ３４０）を含むエッジ画素特定処理が実行することによって、スキャン画像ＳＩの複数個のエッジ画素が特定される（Ｓ３３０、Ｓ３４０、図２のＳ２６）。最小成分データでは、図１１を参照して説明したように、網点領域において、画素間の値の差を抑制できるので、その後に、エッジ画素を特定する際に、網点に起因するエッジ画素が特定されることを抑制できる。したがって、スキャン画像ＳＩ内のエッジ画素を適切に特定できる。

より具体的に説明すると、網点領域を構成する要素は、Ｃ、Ｍ、Ｙ、Ｋの各ドットと、用紙の地色（白）と、の５種類である。最小成分データでは、これらの要素のうち、４種類の要素を示す画素の間の値の差を抑制できる。この結果、最小成分データを用いる場合には、網点のエッジを示すエッジ画素が特定されることを抑制することができる。

一方で、文字の色と背景の色とは、一方が、濃い色を有し、他方が薄い色を有する場合が多い。このために、文字と背景のうち、一方は、用紙の地色（白）を示す部分を比較的多く含み、他方は、Ｃ、Ｍ、Ｙ、Ｋのドットを示す部分を比較的多く含む場合が多い。図１０に示すように、最小成分データでは、Ｃ、Ｍ、Ｙ、Ｋのドットを示す部分の画素の値と、用紙の地色（白）を示す部分の画素の値と、の間で、大きな差がある。このために、最小成分データを用いて、エッジ画素を特定すると、文字のエッジを構成するエッジ画素は、適切に特定できる可能性が高い。特に、イエロ（Ｙ）は、Ｃ、Ｍ、Ｋと比較して濃度が低い（輝度が高い）。このために、用紙の地色（白）の背景に、イエロの文字がある場合には、輝度画像データを二値化しても、該イエロの文字のエッジを構成するエッジ画素を、適切に特定できない場合がある。本実施例では、このような場合でも該イエロの文字のエッジを構成するエッジ画素を、適切に特定できる。このために、輝度画像データを用いたエッジ画素の特定に加えて、最小成分データを用いたエッジ画素の特定を実行することで、輝度画像データだけでは、特定できない文字などのエッジ画素を特定し得る。この結果、スキャン画像ＳＩ内のエッジ画素の特定精度を向上できる。

さらに、最小成分データに対して、エッジ抽出処理の前に平滑化処理が実行される（Ｓ３１０）。この結果、平滑化処理によって、最小成分画像ＭＮＩ内の網点領域おいて、画素間の値の差を、さらに抑制できる。例えば、スキャン画像ＳＩ内の網点領域において、Ｃ、Ｍ、Ｙ、Ｋのドットの重なりや、読取実行部２９０での読取時のぼけなどによって、ドットを示す部分は、必ずしもＣ、Ｍ、Ｙ、Ｋの原色を有している訳ではない。このために、最小成分画像ＭＮＩ内では、Ｃ、Ｍ、Ｙ、Ｋの各ドットを示す複数個の画素の間の値が、小さくなってはいるものの、ゼロではない。平滑化処理によって、該画素の間の値の差をさらに小さくすることができる。この結果、網点に起因するエッジ画素が特定されることを、さらに抑制できる。また、第２の二値画像データ生成処理においても、第１の二値画像データ生成処理と同様に、レベル補正処理（Ｓ３３０）が実行されるので、スキャン画像ＳＩ内のエッジ画素の特定精度を向上できる。

以上説明したように、上記実施例では、２種類の単成分画像データ、すなわち、輝度画像データと、最小成分データと、を用いて、最終的にエッジ画素が特定される（図２のＳ２２〜Ｓ２６）。このように互いに異なる処理を用いて生成される２種類の単成分画像データを用いて、スキャン画像ＳＩ内の複数個のエッジ画素が特定されるので、スキャン画像ＳＩ内の複数個のエッジ画素の特定漏れを抑制できる。例えば、白の背景にイエロの文字がある場合には、白とイエロの輝度の差は比較的小さいので、輝度画像データを用いて、該文字のエッジを構成するエッジ画素を特定することは困難である。これに対して、図１０（Ｃ）、（Ｅ）から解るように、最小成分データでは、白とイエロとの差が大きく現れるので、白の背景にイエロの文字がある場合には、最小成分データを用いて、該文字のエッジを構成するエッジ画素を特定することは容易である。また、例えば、マゼンタの背景にイエロの文字がある場合には、最小成分データには、マゼンタとイエロとの差が現れないので、最小成分データを用いて、該文字のエッジを構成するエッジ画素を特定することは困難である。これに対して、マゼンタの背景にイエロの文字がある場合には、マゼンタとイエロの輝度の差は、比較的大きいので、輝度画像データを用いて、該文字のエッジを構成するエッジ画素を特定することは容易である。

また、輝度画像データに加えて用いられる単成分画像データは、最小成分データであるので、上述の通り、スキャン画像ＳＩ内の網点に起因するエッジ画素が特定されることは、抑制できる。

Ａ−６：ブロック判定処理
図２のＳ２８のブロック判定処理について説明する。図１２は、ブロック判定処理のフローチャートである。図１３は、スキャン画像ＳＩ上に配置される複数個のブロックＢＬの説明図である。ブロック判定処理は、上述したように、文字画素の候補である第２の文字候補画素と第２の文字候補画素ではない画素とを示すブロック判定データを、スキャン画像ＳＩ内に配置される複数個のブロックＢＬのそれぞれが文字を示す文字ブロックであるか否かをブロックＢＬごとに判断することによって生成する処理である。

Ｓ４００では、ＣＰＵ２１０は、ブロック判定データを生成するためのキャンバスデータをメモリ（具体的には、揮発性記憶装置２２０のバッファ領域）に準備する。キャンバスデータによって示されるキャンバス（初期画像）は、スキャン画像ＳＩと同じサイズの画像、すなわち、同じ画素数の画像である。キャンバスデータの各画素の値は、所定の初期値（例えば、０）である。

Ｓ４０５では、ＣＰＵ２１０は、スキャン画像ＳＩに、注目ブロックを設定する。最初の注目ブロックは、本実施例では、図１３の左上のブロックＢＬ（１）である。１個のブロックは、Ｎ個（Ｎは２以上の整数）の画素を含む矩形の領域である。ここで、図１３において、スキャン画像ＳＩ上にマトリクス状に配置された破線で示される複数個の升目は、サブブロックＳＢを示している。１個のサブブロックＳＢは、ｋ個（ｋは、１≦ｋ＜Ｎをを満たす整数）の画素を含む矩形の領域である。本実施例では、サブブロックＳＢは、縦Ｍ画素×横Ｍ画素（Ｍは、１以上の整数）の領域である（ｋ＝（Ｍ×Ｍ））。例えば、１個のブロックＢＬは、本実施例では、縦Ｌ個×横Ｌ個（Ｌは、２以上の整数）のサブブロックＳＢを含む領域である。すなわち、本実施例の各ブロックＢＬは、縦（Ｌ×Ｍ）画素×横（Ｌ×Ｍ）画素の領域である。本実施例では、Ｍ＝５、Ｌ＝５であるので、各ブロックＢＬは、縦２５画素×横２５画素の領域である（Ｎ＝６２５）。

Ｓ４１０では、ＣＰＵ２１０は、スキャンデータ（ＲＧＢ画像データ）のうち、注目ブロック内の画像を示す部分画像データ、注目ブロック内の複数個の画素の値の分布を示すヒストグラムデータを生成する。ヒストグラムデータは、Ｒ、Ｇ、Ｂの１画素あたり３個の成分値のそれぞれを、当該成分値に応じた複数個のクラスに分類することによって生成される。本実施例では、Ｒ、Ｇ、Ｂの各成分の値が取り得る２５６階調の値のそれぞれを１個のクラスとして、ヒストグラムデータが生成される。これにより、文字が有彩色で表現されたカラー画像に対しても、ブロックＢＬが文字ブロックであるか否かを精度良く判断できる。

図１４は、ヒストグラムデータによって示されるヒストグラムの一例を示す図である。図１４（Ａ）のヒストグラムＨＧａは、文字Ｏｂ７（図３（Ａ））のエッジ部分に位置するブロックＢＬａのヒストグラムである。図１４（Ｂ）のヒストグラムＨＧｂは、写真Ｏｂ３（図３（Ａ））内のエッジ部分に位置するブロックＢＬｂのヒストグラムである。

Ｓ４１３では、ＣＰＵ２１０は、生成されたヒストグラムデータを用いて、注目ブロック内の複数個の画素の値の標準偏差σを算出する。標準偏差σは、以下の式（１）を用いて算出される。

ここで、Ｖｉは、注目ブロック内の（３×Ｎ）個の成分値である。成分値の個数は、Ｎ個の画素のそれぞれが、３個の成分値を含むために、合計で（３×Ｎ）個である。Ｖａｖｅは、注目ブロック内の（３×Ｎ）個の成分値の平均値である。標準偏差σは、注目ブロック内の画素の値のばらつきの程度を示す指標値であり、標準偏差σが大きいほど、注目ブロック内の画素の値のばらつきが大きい。

ここで、文字の読みやすさのために、一般的に、文字の色と、文字の背景の色とは、明るさが大きく異なる場合が多い。例えば、文字の色が、比較的暗い色（例えば、黒）にされる場合には、文字の背景の色は、比較的明るい色（例えば、白）にされやすい。また、文字の色が、比較的明るい色にされる場合には、文字の背景の色は、比較的暗い色にされやすい。また、文字のエッジ部分では、エッジ強度が比較的高いために、画素の値が急激に変化する。このために、縦２５画素×横２５画素程度の小さなブロックが設定される場合であっても、文字のエッジ部分に位置するブロックＢＬａのヒストグラムＨＧａには、比較的離れた位置に２個のピークＶａ、Ｖｂが現れる（図１４（Ａ））。この結果、文字のエッジ部分に位置するブロックＢＬａの標準偏差σｔ（図１４（Ａ））は、比較的大きくなる。

一方、写真内のエッジ（例えば、写真内の網点やオブジェクトのエッジ）では、必ずしも、エッジの両側で明るさ等が大きく異なるとは限らない。また、写真内のエッジでは、文字と比較するとエッジ強度が一般的に低いために、画素の値がなだらかに変化する。このために、縦２５画素×横２５画素程度の小さなブロックが設定される場合には、写真内のエッジ部分に位置するブロックＢＬｂに含まれる画素の値の分布範囲は、比較的狭くなる。このために、写真内のエッジ部分に位置するブロックＢＬｂのヒストグラムＨＧｂには、比較的近い位置に２個のピークＶｂ、Ｖｄが現れる。この結果、写真内のエッジ部分に位置するブロックＢＬｂの標準偏差σｐ（図１４（Ｂ））は、比較的小さくなる。

このような標準偏差σの傾向を利用して、ＣＰＵ２１０は、後述するＳ４１５〜Ｓ４３０に示すように、標準偏差σに基づいて、注目ブロックが、文字を示す文字ブロック、文字を示さない非文字ブロック、文字を示すか不明である不明ブロックのいずれであるかを判断する。ＣＰＵ２１０は、標準偏差σが、ＴＨ１≦σである場合には、注目ブロックは、文字ブロックであると判断する。ＣＰＵ２１０は、標準偏差σが、ＴＨ２≦σ＜ＴＨ１である場合には、注目ブロックは、不明ブロックであると判断する。ＣＰＵ２１０は、標準偏差σが、σ＜ＴＨ２である場合には、注目ブロックは、非文字ブロックであると判断する。閾値ＴＨ１、ＴＨ２は、例えば、複数個の文字や写真を含む画像データを解析することによって、経験的に、予め定められる。

ここで、文字が比較的大きなサイズである場合には、文字のエッジだけではなく、文字の内部に注目ブロックが設定され得る。この場合には、文字は一般的に単色であるので、標準偏差σは、小さな値となる。したがって、この場合には、文字を構成する画素を含む注目ブロックが、非文字ブロックであると判断されてしまう。しかしながら、本実施例では、文字画素に対して鮮鋭化処理が行われて文字のエッジが鮮鋭化されるとともに、非文字画素に対して平滑化処理が行われて写真などの非文字画像が平滑化される。このために、文字のエッジ部分の画素を含むブロックが、精度良く文字ブロックであると判断されれば良く、文字の内部の画素のみを含むブロックは、非文字ブロックと判断されても構わない。

なお、１個の注目ブロック内に、小さな文字の全体が含まれる場合には、エッジと内部の区別なく、小さな文字の全体が文字画素として特定される。この場合には、注目ブロック内に、文字画素と、文字の背景を構成する画素と、の両方が含まれるので、注目ブロックの標準偏差σは、比較的大きくなる。この場合には、文字の全体を含む注目ブロックは、文字ブロックと精度良く判断される。

また、写真内のエッジではなく、写真の外縁と、写真の外側部分と、の間のエッジ部分に注目ブロックが設定され得る（例えば、図１４（Ｂ）のブロックＢＬｘ）。この場合には、写真の外縁と、写真の外側部分と、の間のエッジでは、エッジの両側で明るさ等が大きく異なり得る。また、該エッジでは、エッジ強度が比較的高い場合がある。したがって、この場合には、写真の外縁を含む注目ブロックが、文字ブロックであると判断されてしまう。しかしながら、写真の外縁のエッジ部分に鮮鋭化処理が行われて、写真の外縁が強調されても、画質上の問題はない。このために、エッジ強調されると画質上の問題がある写真内のエッジ（例えば、網点やオブジェクトのエッジ）を含むブロックが、精度良く非文字ブロックであると判断されれば良く、写真の外縁のエッジを含むブロックは、文字ブロックと判断されても構わない。

図１５は、ブロックＢＬごとの判断の一例を示す図である。例えば、図１５（Ａ）のブロックＢＬ（１）や図１５（Ｂ）のブロックＢＬ（２）が注目ブロックである場合には、注目ブロック内の比較的広い範囲を文字が占めているので、注目ブロックは、文字ブロックであると判断される。例えば、図１５（Ｃ）のブロックＢＬ（３）が注目ブロックである場合には、注目ブロック内に文字が含まれているものの、文字が占める範囲は比較的狭いので、注目ブロックは、不明ブロックであると判断される。例えば、図１５（Ｄ）のブロックＢＬ（４）が注目ブロックである場合には、注目ブロック内に文字が含まれていないので、注目ブロックは、非文字ブロックであると判断される。以下、Ｓ４１５〜Ｓ４３０の処理を具体的に説明する。

Ｓ４１５では、ＣＰＵ２１０は、Ｓ４１０にて算出された標準偏差σが閾値ＴＨ１以上であるか否かを判断する。標準偏差σが閾値ＴＨ１以上である場合には（Ｓ４１５：ＹＥＳ）、注目ブロックは文字ブロックであると判断される。このために、この場合には、Ｓ４２０にて、ＣＰＵ２１０は、注目ブロック内の全画素の値を、文字を示す値に設定する。標準偏差σが閾値ＴＨ１未満である場合には（Ｓ４１５：ＮＯ）、Ｓ４２０はスキップされる。

図１６は、ブロック判定データにおける画素の値の設定の一例を示す図である。図１６（Ａ）〜（Ｄ）には、ブロック判定データによって示されるブロック判定画像ＢＩが概念的に示されている。図１５（Ａ）のブロックＢＬ（１）や図１５（Ｂ）のブロックＢＬ（２）が注目ブロックである場合には、注目ブロックは文字ブロックであると判断されるので、ブロック判定画像ＢＩにおいても、図１６（Ａ）、（Ｂ）に示すように、ブロックＢＬ（１）、ＢＬ（２）内の全ての画素の値が、文字を示す値「１」に設定される。

Ｓ４２５では、ＣＰＵ２１０は、標準偏差σが閾値ＴＨ２未満であるか否かを判断する。標準偏差σが閾値ＴＨ２未満である場合には（Ｓ４２５：ＹＥＳ）、注目ブロックは非文字ブロックであると判断される。このために、この場合には、Ｓ４３０にて、ＣＰＵ２１０は、注目ブロック内の全画素の値を非文字を示す値に設定する。標準偏差σが閾値ＴＨ２以上である場合には（Ｓ４２５：ＮＯ）、Ｓ４３０はスキップされる。

図１５（Ｄ）のブロックＢＬ（４）が注目ブロックである場合には、注目ブロックは非文字ブロックであると判断されるので、ブロック判定画像ＢＩにおいても、図１６（Ｄ）に示すように、ブロックＢＬ（４）内の全ての画素の値が、非文字を示す値「２」に設定される。

なお、標準偏差σが閾値ＴＨ２以上であり、かつ、閾値ＴＨ１未満である場合には（Ｓ４１５：ＮＯ、かつ、Ｓ４２５：ＮＯ）、注目ブロックは、不明ブロックであると判断される。このために、この場合には、注目ブロック内の全ての画素の値は変更されない。すなわち、この時点で、文字を示す値「１」を有する画素は、文字を示す値のまま維持され、非文字を示す値「２」を有する画素は、非文字を示す値のまま維持され、不明を示す値「０」を有する画素は、不明を示す値のまま維持される。

図１５（Ｃ）のブロックＢＬ（３）が注目ブロックである場合には、注目ブロックは不明ブロックであると判断されるので、ブロック判定画像ＢＩにおいて、図１６（Ｃ）に示すように、ブロックＢＬ（４）内の全ての画素の値は、変更されることなく、維持される。

Ｓ４３５では、ＣＰＵ２１０は、注目ブロックを右方向にＭ画素だけ移動する。すなわち、注目ブロックは、右方向に１個のサブブロックＳＢ分だけ移動される。例えば、図１３のブロックＢＬ（１）が注目ブロックである場合には、ブロックＢＬ（２）が新たな注目ブロックに設定される。図１３のブロックＢＬ（ｑ−１）が注目ブロックである場合には、ブロックＢＬ（ｑ）が新たな注目ブロックに設定される。

Ｓ４４０では、ＣＰＵ２１０は、注目ブロックを右方向にＭ画素だけ移動した結果、注目ブロックの右端は、スキャン画像ＳＩの右端よりも右側に移動したか否かを判断する。すなわち、移動後の新たな注目ブロックが、スキャン画像ＳＩの右側にはみ出したか否かを判断する。例えば、新たな注目ブロックが、図１３のブロックＢＬ（ｑ）やブロックＢＬ（ｅ）である場合には、注目ブロックの右端は、スキャン画像ＳＩの右端よりも右側に移動したと判断される。

注目ブロックの右端が、スキャン画像ＳＩの右端よりも右側に移動していない場合には（Ｓ４４０：ＮＯ）、ＣＰＵ２１０は、Ｓ４１０に戻る。このように、例えば、注目ブロックを右方向にＭ画素ずつずらしながら、順次に、ブロックごとの判断（Ｓ４１０〜Ｓ４３０）が行われる。図１３の例では、ブロックＢＬ（１）、ＢＬ（２）、ＢＬ（３）の順に、各ブロックＢＬが、文字ブロック、非文字ブロック、不明ブロックのいずれであるかが判断される。

注目ブロックの右端が、スキャン画像ＳＩの右端よりも右側に移動した場合には（Ｓ４４０：ＹＥＳ）、Ｓ４４５にて、ＣＰＵ２１０は、注目ブロックをスキャン画像ＳＩの左端に移動し、Ｓ４５０にて、注目ブロックを下方向にＭ画素だけ移動する。

Ｓ４５５では、ＣＰＵ２１０は、注目ブロックを下方向にＭ画素だけ移動した結果、注目ブロックの下端は、スキャン画像ＳＩの下端よりも下側に移動したか否かを判断する。すなわち、移動後の新たな注目ブロックが、スキャン画像ＳＩの下側にはみ出したか否かを判断する。例えば、新たな注目ブロックが、図１３のブロックＢＬ（ｅ＋１）である場合には、注目ブロックの下端は、スキャン画像ＳＩの下端よりも下側に移動したと判断される。例えば、移動後の新たな注目ブロックが、図１３のブロックＢＬ（ｅ＋１）である場合には、注目ブロックの下端は、スキャン画像ＳＩの下端よりも下側に移動したと判断される。

注目ブロックの下端が、スキャン画像ＳＩの下端よりも下側に移動していない場合には（Ｓ４５５：ＮＯ）、ＣＰＵ２１０は、Ｓ４１０に戻る。このように、例えば、注目ブロックを下方向にＭ画素ずつずらしながら、順次に、左端から右端までの１行分のブロックＢＬの判断が、一行ずつ行われる。例えば、図１３の右端のブロックＢＬ（ｑ−１）の次に、判断の対象となる注目ブロックは、Ｍ画素だけ下側の行の左端のブロックＢＬ（ｑ＋１）である。

注目ブロックの下端が、スキャン画像ＳＩの下端よりも下側に移動した場合には（Ｓ４５５：ＹＥＳ）、全てのブロックＢＬの判断が終了したので、ＣＰＵ２１０は、Ｓ４６０に処理を進める。

Ｓ４６０では、ＣＰＵ２１０は、ブロック判定データに、不明を示す値「０」が残っているか否かを判断する。不明を示す値が残っている場合には、Ｓ４６５にて、ＣＰＵ２１０は、不明を示す値を、文字を示す値「１」に設定する。この結果、ブロック判定データの各画素の値は、文字を示す値「１」と非文字を示す値「２」とのいずれかとなる。

Ｓ４７０では、ＣＰＵ２１０は、非文字を示す値「２」を「０」に変更して、ブロック判定データを「１」と「０」のいずれかの値をとる二値データに変換する。この結果、文字を値、すなわち、上述した第２の文字候補画素であることを示す値「１」と、非文字を示す値、すなわち、上述した第２の文字候補画素でないことを示す値「０」と、のいずれかの値を画素ごとに有するブロック判定データが生成される。

以上説明した本実施例の文字特定処理（図２のＳ２０）では、図２のＳ２２〜Ｓ２６にて、ＣＰＵ２１０は、スキャン画像ＳＩ内のエッジを構成するエッジ画素であるか否かを画素ごとに判断することによって、複数個の第１の候補画素を決定する。図２のＳ２８にて、ＣＰＵ２１０は、スキャン画像ＳＩ上に配置される複数個のブロックＢＬのそれぞれが、文字を示す文字ブロックであるか否かをブロックごとに判断することによって、複数個の第２の文字候補画素を決定する。ブロックごとの判断では、ＣＰＵ２１０は、ブロックＢＬのそれぞれについて、ブロックＢＬ内の複数個の画素の分布を示すヒストグラムデータを生成し（図１２のＳ４１０）、ヒストグラムデータを用いて、複数個のブロックＢＬのそれぞれが、文字ブロックであるか否かを判定する（図１２のＳ４１３〜Ｓ４３０）。図２のＳ２９にて、ＣＰＵ２１０は、スキャン画像ＳＩ内の複数個の画素のうち、第１の文字候補画素であると決定され、かつ、第２の文字候補画素であると決定される画素を、文字画素として特定する。この結果、例えば、画素ごとの判断によって、網点（例えば、写真内の網点）を構成する画素が第１の文字候補画素であると誤って決定されたとしても、ブロックごとの判断によって、網点を構成する画素が第２の文字候補画素であると決定されない場合には、網点を構成する画素が文字画素であると誤って特定されることがない。ブロックＢＬごとの判断にヒストグラムデータを用いることにより、煩雑な処理を要することなく第２の文字候補画素を決定できる。したがって、例えば、スキャン画像ＳＩが網点を含む画像であっても、スキャン画像ＳＩ内の文字画素を精度良く特定できる。

図１７は、実施例の効果について説明する図である。図１７（Ａ）〜（Ｄ）には、スキャンデータによって示されるスキャン画像ＳＩ、エッジ特定データによって示されるエッジ特定画像ＥＩ、ブロック判定データによって示されるブロック判定画像ＢＩ、文字特定データによって示される文字特定画像ＴＩが、それぞれ概念的に示されている。これらの画像ＳＩ、ＥＩ、ＢＩ、ＴＩ内の破線で示す升目は、それぞれ、画素Ｐｘを示している。

図１７（Ａ）に示すスキャン画像ＳＩのように、スキャン画像ＳＩには、文字Ｔｘとともに、文字以外のオブジェクト（例えば、写真）を構成する網点ＤＴが含まれ得る。これは、上述したように、スキャンデータが、印刷物を読み取ることによって生成されたデータであるためである。本実施例のＳ２２〜Ｓ２６のエッジ画素（第１の文字候補画素）の特定処理では、上述したように、網点が第１の文字候補画素として誤って特定されることを抑制するための様々な工夫が成されているが、文字のエッジを示す第１の文字候補画素の特定漏れを抑制することを重視すれば、網点が第１の文字候補画素として誤って特定されることを十分に抑制することは困難である。このために、例えば、図１７（Ｂ）のエッジ特定画像ＥＩに示すように、エッジ特定データにおいて、文字Ｔｘに対応するエッジ画素Ｅｇｔだけでなく、網点ＤＴに対応するエッジ画素Ｅｇｄも第１の文字候補画素として特定されてしまい得る。

本実施例のＳ２８のブロック判定処理では、ブロックＢＬごとに、ブロック内のＮ個の画素の位置とＮ個の画素の値とに応じて、文字ブロックか否かを含む判断が行われるので、画素ごとの判断と比較して、空間的な分解能は粗くなるものの、判断の誤りは比較的少なくなる。より具体的には、本実施例では、文字を含むブロックＢＬと非文字（特に写真）を含むブロックＢＬとでは、画素の値の分布特性が異なる（図１３）ことを利用して、ブロックＢＬ内の画素の分布を示すヒストグラムデータを用いて、ブロックＢＬごとに文字ブロックか否かが判断される。このために、例えば、図１７（Ｃ）のブロック判定画像ＢＩでは、例えば、大まかではあるが、文字Ｔｘを含む領域内の画素は、第２の文字候補画素として特定され、網点ＤＴを含む領域内の画素は、第２の文字候補画素として特定されない。

この結果、エッジ特定データと、ブロック判定データと、の論理積を取って文字特定データを生成すれば、図１７（Ｄ）の文字特定画像ＴＩに示すように、文字Ｔｘを示す画素を文字画素として適切に特定し、かつ、網点ＤＴを示す画素を非文字画素として適切に特定することができる。

この結果、例えば、網点ＤＴを示すにも拘わらずに、誤って文字画素として特定された画素を除去するために、文字特定データに対して、孤立した文字画素を除去するノイズ除去処理を実行する必要もなくなる。このようなノイズ除去処理を実行すると、網点ＤＴを示す文字画素だけでなく、例えば、ピリオド、カンマ、濁音などを示す孤立しがちな文字画素も除去されてしまう場合がある。ピリオド、カンマ、濁音などを示す文字画素は、除去されるべきではないので、誤って除去されると、文字の一部がぼけるなどの不都合が生じて、出力される画像の画質が劣化し得る。

さらに、上記実施例では、ＣＰＵ２１０は、ヒストグラムデータを用いて算出される標準偏差σがＴＨ１以上であるか否かを判断し（図１２のＳ４１５）、標準偏差σがＴＨ１以上である場合に（図１２のＳ４１５にてＹＥＳ）、注目ブロックは文字ブロックであると判断し（図１２のＳ４２０）、標準偏差σがＴＨ１未満である場合である場合に（図１２のＳ４１５にてＮＯ）、注目ブロックは、非文字ブロックまたは不明ブロックであると判断する（図１２のＳ４２５、Ｓ４３０）。換言すれば、ＣＰＵ２１０は、ヒストグラムデータを用いて、注目ブロック内の複数個の画素の値のばらつきが基準以上であるか否かを判断し、注目ブロック内の複数個の画素の値のばらつきが基準以上である場合に、注目ブロックは文字ブロックであると判断し、注目ブロック内の複数個の画素の値のばらつきが基準未満である場合に、注目ブロックは文字ブロックでないと判断する。この結果、ブロックＢＬ内の複数個の画素の値のばらつきに基づいて、ブロックＢＬが文字ブロックであるか否かを精度良く判断できる。

さらに、上記実施例では、スキャンデータの複数個の画素の値のそれぞれは、複数個の成分値を含むＲＧＢ値であり、生成されるヒストグラムデータは、複数個の成分値のそれぞれを、その値に応じて分類して得られるデータである（図１３）。この結果、例えば、文字が有彩色で表現されたカラー画像データ（本実施例ではＲＧＢ画像データ）についても、画像内のブロックＢＬが文字であるか否かを精度良く判断できる。

さらに、上記実施例によれば、例えば、図１５、図１６に示すように、ブロックＢＬ（１）、ブロックＢＬ（２）、ブロックＢＬ（３）、ブロックＢＬ（４）は、互いに一部が重なっている。ＣＰＵ２１０は、これらのブロックの重複領域内のｎ個の画素（ｎは０＜ｎ＜Ｎを満たす整数）が文字を示す画素（第２の文字候補画素）であるか否かを、互いに重複する複数個のブロックの判断結果の少なくとも一方に基づいて決定する。この結果、各ブロックＢＬよりも小さなサブブロックＳＢの単位で、第２の文字候補画素であるか否かを示すブロック判定データを生成できる。

例えば、本実施例では、Ｓ４２０、Ｓ４３０に示すように、注目ブロックが文字ブロックまたは非文字ブロックであると判断されると、ブロック判定データにおいて、注目ブロック内の全ての画素の値が、判断結果に応じて設定される。すなわち、第１のブロックと第２のブロックとの両方が、不明ブロック以外のブロック（すなわち、文字ブロックまたは非文字ブロック）であると判断されるとする。この場合には、第１のブロックと第２のブロックの重複領域については、第１のブロックと第２のブロックとのうち、判断の処理順序が後のブロックについての判断結果が優先される（図１６（Ａ）〜（Ｄ）参照）。

また、本実施例では、上述したように、注目ブロックが不明ブロックであると判断されると、注目ブロック内の全ての画素の値が変更されない。すなわち、第１のブロックと第２のブロックとのうちの一方が、不明ブロックであると判断され、他方が、文字ブロックおよび非文字ブロックのいずれかであると判断されるとする。この場合には、第１のブロックと第２のブロックの重複領域については、第１のブロックと第２のブロックとのうち、文字ブロックおよび非文字ブロックのいずれかであると判断されたブロックについての判断結果が優先される（図１６（Ｂ）〜（Ｄ）参照）。換言すれば、第１のブロックが不明ブロックであると判断され、かつ、第２のブロックが文字ブロックであると判断される場合には、重複領域内の画素は、文字を示す画素（第２の文字候補画素）であると決定される。第１のブロックが不明ブロックであると判断され、かつ、第２のブロックが非文字ブロックであると判断される場合には、重複領域内の画素は、非文字を示す画素（第２の文字候補画素でない画素）であると決定される。さらに、第１のブロックが文字ブロックであると判断され、かつ、第２のブロックが不明ブロックであると判断される場合には、重複領域内の画素は、文字を示す画素であると決定される。第１のブロックが非文字ブロックであると判断され、かつ、第２のブロックが不明ブロックであると判断される場合には、重複領域内の画素は、非文字を示す画素であると決定される。この結果、文字ブロック、非文字ブロック、不明ブロックのいずれであるかを、ブロックごとに判断することによって、重複領域内の画素が文字を示す画素（第２の文字候補画素）であるか否かを適切に決定できる。

Ｂ．変形例：

（１）上記実施例の図１２のブロック判定処理では、標準偏差σを用いて、注目ブロックが、文字ブロックであるか否かを判断している。これに代えて、例えば、別の判断手法を用いて、注目ブロックが、文字ブロックであるか否かを判断しても良い。例えば、注目ブロック内の画素の複数個の画素のばらつきを示す指標値であって、標準偏差σとは異なる指標値を用いて、注目ブロックが、文字ブロックであるか否かを判断しても良い。注目ブロック内の画素の複数個の画素のばらつきを示す指標値は、例えば、ヒストグラムにおける複数個のピークのうち、最小の成分値に対応するピークと、最大の成分値に対応するピークと、の間の距離であっても良い。

また、ＣＰＵ２１０は、ブロックＢＬのヒストグラムデータを用いて導かれる特徴であって、ブロックＢＬ内の画素の複数個の画素のばらつきとは異なる特徴を用いて、注目ブロックが、文字ブロックであるか否かを判断しても良い。例えば、文字を示すブロックＢＬでは、ヒストグラムにおいて、背景に対応する比較的細く高いピークと、文字に対応する比較的細く高いピークと、が現れる。したがって、ＣＰＵ２１０は、注目ブロックのヒストグラムにおいて、基準より細く、基準より高いピークが２個検出される場合には、当該注目ブロックは文字ブロックであると判断しても良い。

（２）上記実施例のブロック判定処理では、縦（Ｌ×Ｍ）画素×横（Ｌ×Ｍ）画素の注目ブロックを、Ｍ画素ずつずらしながら、文字ブロックであるか否かを判断するので、スキャン画像ＳＩ上に配置される複数個のブロックは互いに重複している（図１３）。これに代えて、複数個のブロックが互いに重複しないように、スキャン画像ＳＩ上に複数個のブロックが配置されても良い。

（３）上記実施例のブロック判定処理では、ＣＰＵ２１０は、注目ブロックが、文字ブロック、非文字ブロック、不明ブロックのいずれであるかを判断している。これに代えて、ＣＰＵ２１０は、注目ブロックが、文字ブロックと非文字ブロックとのいずれであるかを判断しても良い。この場合には、例えば、Ｓ４１５で用いる閾値ＴＨ１と、Ｓ４２５で用いる閾値ＴＨ２と、を同じ値にすれば良い。例えば、ＴＨ１＝ＴＨ２＝５０％とすれば良い。

（４）上記実施例の図２の画像処理において、Ｓ２４の第２の二値画像データ生成処理およびＳ２６の合成処理は省略されても良い。すなわち、第１の二値画像データ生成処理において特定される複数個のエッジ画素が、最終的なエッジ特定データであっても良い。

（５）上記実施例では、上述したように、図１２のＳ４２０、Ｓ４３０に示すように、注目ブロックが文字ブロックまたは非文字ブロックであると判断されると、ブロック判定データにおいて、注目ブロック内の全ての画素の値が、判断結果に応じて設定される。これに代えて、ブロック判定データにおいて、注目ブロック内のＮ個の画素のうち、不明を示す値を有する画素の値だけが、判断結果に応じて設定されても良い。すなわち、互いに重複する第１のブロックと第２のブロックとの両方が、不明ブロック以外のブロック（すなわち、文字ブロックまたは非文字ブロック）であると判断されるとする。この場合には、第１のブロックと第２のブロックの重複領域については、第１のブロックと第２のブロックとのうち、判断の処理順序が先のブロックについての判断結果が優先されても良い。

（６）上記実施例の図１２のブロック判定処理では、全てのブロックＢＬについての判断の後に、ブロック判定データに、不明を示す値が残っている場合には（Ｓ４６０：ＹＥＳ）、ＣＰＵ２１０は、Ｓ４６５にて、不明を示す値を、文字を示す値に設定する。これは、文字画素の一部が、誤って非文字画素として特定されることを抑制して、文字の一部がぼけるなどの不都合を避けるためである。例えば、非文字画素の一部が、誤って文字画素として特定されることを抑制して、網点が目立つなどの不都合を避けることを重視する場合には、ＣＰＵ２１０は、Ｓ４６５にて、不明を示す値を、非文字を示す値に設定しても良い。

（７）図５の第１の二値画像データ生成処理（図５）では、単成分画像データとして、輝度画像データが用いられる（Ｓ１２０）。これに代えて、スキャンデータの対応する画素のＲＧＢ値に含まれる３個の成分値（Ｒ値、Ｇ値、Ｂ値）の平均値を、各画素の値とする平均成分値画像データが用いられても良い。

（８）上記実施例の第２の二値画像データ生成処理（図９）では、単成分画像データとして、最小成分データが用いられる（Ｓ３００）。これに代えて、最大成分データや反転最小成分データが用いられても良い。

最大成分データは、スキャンデータに含まれる複数個の画素に対応する複数個の値を含み、該複数個の値のそれぞれは、スキャンデータの対応する画素の最大成分値Ｖｍａｘである。最大成分値Ｖｍａｘは、スキャンデータの対応する画素のＲＧＢ値に含まれる複数個の成分値（Ｒ値、Ｇ値、Ｂ値）のうちの最大値である。

反転最小成分データは、以下のように、取得される。先ず、スキャンデータに含まれる複数個の画素の値（ＲＧＢ値）のそれぞれについて、複数個の成分値（Ｒ値、Ｇ値、Ｂ値）が反転された反転済みの色値が生成される。反転前のＲＧＢ値を（Ｒｉｎ、Ｇｉｎ、Ｂｉｎ）とすると、反転済みのＲＧＢ値（Ｒｏｕｔ、Ｇｏｕｔ、Ｂｏｕｔ）は、以下の式（１）〜（３）で表される。

Ｒｏｕｔ＝Ｒｍａｘ−Ｒｉｎ …（１）
Ｇｏｕｔ＝Ｇｍａｘ−Ｇｉｎ …（２）
Ｂｏｕｔ＝Ｂｍａｘ−Ｂｉｎ …（３）

ここで、Ｒｍａｘ、Ｇｍａｘ、Ｂｍａｘは、それぞれ、Ｒ値、Ｇ値、Ｂ値が取り得る値の最大値であり、本実施例では、Ｒｍａｘ＝Ｇｍａｘ＝Ｂｍａｘ＝２５５である。これらの反転済みのＲＧＢ値を複数個の画素の値とする画像データが、反転画像データとして生成される。そして、反転画像データを用いて、反転最小成分データが生成される。具体的には、反転画像データに含まれる複数個の反転済みのＲＧＢ値のそれぞれから、反転最小成分値ＶＲｍｉｎが取得される。反転最小成分値ＶＲｍｉｎは、該反転済みのＲＧＢ値に含まれる複数個の成分値（Ｒ値、Ｇ値、Ｂ値）のうちの最小値である。反転最小成分データは、これらの反転最小成分値ＶＲｍｉｎを、複数個の画素の値とする画像データである。

反転最小成分値ＶＲｍｉｎは、最大成分値の反転値であり、ＶＲｍｉｎ＝（２５５−Ｖｍａｘ）の関係が成り立つ。このために、最大成分データと反転最小成分データとは、両方とも、スキャンデータの各画素の値に含まれる複数個の成分値のうちの最大値に基づく値（最大値の反転値、あるいは、最大値そのもの）を、画素の値とする画像データである、と言うことができる。

図１０に示すように、Ｃ、Ｍ、Ｙ、Ｋ、Ｗの最大成分値Ｖｍａｘは、２５５、２５５、２５５、０、２５５となり、黒（Ｋ）を除いて同じ値となる。したがって、最大成分データや反転最小成分データにおいては、網点領域を構成する５種類の要素、すなわち、Ｃ、Ｍ、Ｙ、Ｋの各ドットと、用紙の地色（白）と、のうちの４種類の要素（Ｃ、Ｍ、Ｙのドットと、用紙の地色（白））を示す画素間の値の差が抑制される。この結果、最大成分データや反転最小成分データを用いる場合には、最小成分データを用いる場合と同様に、網点に起因するエッジ画素が特定されることを抑制できる。

（９）上記各実施例では、文字画素に対して、文字鮮鋭化処理が実行され（図２のＳ４０）、非文字画素に対して、網点平滑化処理が実行される（図２のＳ３０）。これに代えて、文字画素に対しては、文字の見栄えを向上するためのアンチエイリアス処理が実行されても良い。また、非文字画素に対しては、例えば、印刷時の色材の使用量を減らすために、色を飛ばす処理（白に変換する処理）が実行されても良い。一般的には、文字画素と、非文字画素と、に互いに異なる画像処理が実行されることが好ましい。あるいは、文字画素と非文字画素のいずれか一方に対して、特定の画像処理が実行され、他方に対して、該特定の画像処理が実行されなくても良い。

（１０）上記実施例では、図５のＳ１３０や図９のＳ３２０のエッジ抽出処理において、ソーベルフィルタ（Sobel filter）が用いられている。これに代えて、これらエッジ抽出処理では、ロバーツフィルタや、ラプラシアンフィルタなどの他のエッジ抽出フィルタが用いられても良い。

（１１）上記実施例では、対象画像データは、スキャンデータであるが、これに限られない。対象画像データは、２次元イメージセンサを備えるデジタルカメラによって印刷物を読み取ることによって生成されても良い。

（１２）上記実施例では、第１の二値画像データと、第２の二値画像データと、の論理和を取ることによって、エッジ特定データが生成される（図２のＳ２６）。これに代えて、第１の二値画像データと、第２の二値画像データと、第３の二値画像データと、の論理和を取ることによって、エッジ特定データが生成されても良い。第３の二値画像データには、例えば、上述した最大成分データを用いて生成される二値画像データが用いられても良い。これによって、文字などのエッジの特定漏れをさらに抑制することができる。

（１３）上記実施例の第１の二値画像データ生成処理（図５）や第２の二値画像データ生成処理（図９）は、適宜に変更可能である。例えば、図５のＳ１１０、Ｓ１１０、Ｓ１４０の処理の全部または一部は、省略可能である。また、図９のＳ３１０、Ｓ３３０のうちの全部または一部は、省略可能である。

（１４）図２の画像処理を実現する画像処理装置は、複合機２００に限らず、種々の装置であってよい。例えば、スキャナやデジタルカメラが、自身で生成された画像データを用いて、プリンタに供給するための印刷データを生成するために、図２の画像処理を実行しても良い。また、例えば、スキャナやプリンタと通信可能な接続される端末装置（例えば、端末装置１００）やサーバ（図示省略）が、スキャナから取得したスキャンデータを用いて、図２の画像処理を実行して、印刷データを生成し、該印刷データをプリンタに供給しても良い。また、ネットワークを介して互いに通信可能な複数個のコンピュータ（例えば、クラウドサーバ）が、画像処理に要する機能を一部ずつ分担して、全体として、画像処理を実行してもよい。この場合、複数個のコンピュータの全体が、画像処理装置の例である。

（１５）上記各実施例において、ハードウェアによって実現されていた構成の一部をソフトウェアに置き換えるようにしてもよく、逆に、ソフトウェアによって実現されていた構成の一部あるいは全部をハードウェアに置き換えるようにしてもよい。例えば、図１２のＳ４１０、Ｓ４２０のヒストグラムデータを生成し、該ヒストグラムデータを用いて標準偏差σを算出する処理は、ＡＳＩＣなどの専用のハードウェアによって、実行されても良い。

以上、実施例、変形例に基づき本発明について説明してきたが、上記した発明の実施の形態は、本発明の理解を容易にするためのものであり、本発明を限定するものではない。本発明は、その趣旨並びに特許請求の範囲を逸脱することなく、変更、改良され得ると共に、本発明にはその等価物が含まれる。

１００…端末装置、２００…複合機、２１０…ＣＰＵ、２２０…揮発性記憶装置、２３０…不揮発性記憶装置、２４０…表示部、２５０…操作部、２７０…通信ＩＦ、２８０…印刷実行部、２９０…読取実行部、ＰＧ…コンピュータプログラム、ＳＩ…スキャン画像、ＴＩ…文字特定画像、ＧＩ…平滑化画像、ＦＩ…処理済み画像、ＥＩ…エッジ特定画像、ＢＩ…ブロック判定画像、ＹＩ…輝度画像、ＳＩ…スキャン画像、ＢＬ…ブロック、ＤＴ…網点、ＳＢ…サブブロック、ＨＧａ、ＨＧｂ…ヒストグラム

Claims

画像処理装置であって、
対象画像を示す対象画像データを取得する画像取得部であって、前記対象画像データは、イメージセンサを用いて印刷物を読み取ることによって生成される、前記画像取得部と、
前記対象画像内の複数個の画素から、文字を示す文字画素を特定する文字特定部と、
を備え、
前記文字特定部は、
前記対象画像データを用いて、前記対象画像内の複数個の画素のそれぞれが、対象画像内のエッジを構成するエッジ画素であるか否かを画素ごとに判断することによって、前記エッジ画素であると判断される複数個の第１の候補画素を決定し、
前記対象画像データを用いて、前記対象画像上に配置される複数個のブロックのそれぞれについて、前記ブロック内の複数個の画素の分布を示すヒストグラムデータを生成し、
前記ヒストグラムデータを用いて、前記複数個のブロックのそれぞれが、文字を示す文字ブロックであるか否かをブロックごとに判断することによって、前記文字ブロックであると判断されるブロック内の複数個の第２の候補画素を決定し、
前記対象画像内の複数個の画素のうち、前記第１の候補画素であると決定され、かつ、前記第２の候補画素であると決定される画素を、前記文字画素として特定する、画像処理装置。
請求項１に記載の画像処理装置であって、
前記文字特定部は、
前記ヒストグラムデータを用いて前記ブロック内の複数個の画素の値のばらつきが基準以上であるか否かを判断し、
前記ブロック内の複数個の画素の値のばらつきが基準以上である場合に、前記ブロックは文字ブロックであると判断し、
前記ブロック内の複数個の画素の値のばらつきが基準未満である場合に、前記ブロックは文字ブロックでないと判断する、画像処理装置。
請求項１または２に記載の画像処理装置であって、
複数個の画素の値のそれぞれは、複数個の成分値を含む色値であり、
前記ヒストグラムデータは、前記複数個の成分値のそれぞれを、その値に応じて分類して得られるデータである、画像処理装置。
請求項１〜３のいずれかに記載の画像処理装置であって、
前記文字特定部は、
前記対象画像データを用いて、前記対象画像データに含まれる前記複数個の画素に対応する複数個の第１の値を含む第１の画像データであって、前記複数個の第１の値のそれぞれは、対応する画素の値に基づく輝度値である、前記第１の画像データを生成し、
前記第１の画像データによって示される第１の画像内のエッジを示す複数個の第１のエッジ画素を特定し、
前記対象画像データを用いて、前記対象画像データに含まれる前記複数個の画素に対応する複数個の第２の値を含む第２の画像データであって、前記複数個の第２の値のそれぞれは、対応する画素の複数個の成分値のうち、最小の成分値または最大の成分値に基づく値である、前記第２の画像データを生成し、
前記第２の画像データによって示される第２の画像内のエッジを示す複数個の第２のエッジ画素を特定し、
前記対象画像内の複数個の画素のうち、前記複数個の第１のエッジ画素に対応する複数個の画素と、前記複数個の第２のエッジ画素に対応する複数個の画素と、を含む画素群であって、前記複数個の第１のエッジ画素とも前記複数個の第２のエッジ画素とも対応しない複数個の画素を含まない、前記画素群を、複数個の前記第１の候補画素であると決定する、画像処理装置。
請求項１〜４のいずれかに記載の画像処理装置であって、
前記複数個のブロックは、第１のブロックと、前記第１のブロックと一部が重なる第２のブロックと、を含み、
前記文字特定部は、
前記第１のブロックが前記文字ブロックであるか否かを判断し、
前記第２のブロックが前記文字ブロックであるか否かを判断し、
前記第１のブロックと前記第２のブロックとが重なる重複領域内のｎ個の画素（ｎは１以上の整数）が前記第２の候補画素であるか否かを、前記第１のブロックについての判断結果と前記第２のブロックについての判断結果との少なくとも一方に基づいて決定する、画像処理装置。
請求項５に記載の画像処理装置であって、
前記文字特定部は、
前記ヒストグラムデータを用いて、注目する前記ブロックが、前記文字ブロック、文字を示さない非文字ブロック、および、文字を示すか不明である不明ブロック、のいずれであるかを、ブロックごとに判断し、
前記第１のブロックが前記不明ブロックであると判断され、かつ、前記第２のブロックが前記文字ブロックであると判断される場合には、前記重複領域内のｎ個の画素は、前記第２の候補画素であると決定し、
前記第１のブロックが前記不明ブロックであると判断され、かつ、前記第２のブロックが前記非文字ブロックであると判断される場合には、前記重複領域内のｎ個の画素は、前記第２の候補画素でないと決定し、
前記第１のブロックが前記文字ブロックであると判断され、かつ、前記第２のブロックが前記不明ブロックであると判断される場合には、前記重複領域内のｎ個の画素は、前記第２の候補画素であると決定し、
前記第１のブロックが前記非文字ブロックであると判断され、かつ、前記第２のブロックが前記不明ブロックであると判断される場合には、前記重複領域内のｎ個の画素は、前記第２の候補画素でないと決定する、画像処理装置。
請求項１〜６のいずれかに記載の画像処理装置であって、さらに、
前記対象画像データのうち、特定済みの前記文字画素の値に対して第１の画像処理を実行し、前記文字画素とは異なる画素の値に対して前記第１の画像処理とは異なる第２の画像処理を実行して、画像処理済みの前記対象画像データを生成する画像処理部を備える、画像処理装置。
請求項７に記載の画像処理装置であって、さらに、
前記画像処理済みの前記対象画像データを用いて、印刷データを生成する印刷データ生成部を備える、画像処理装置。
コンピュータプログラムであって、
対象画像を示す対象画像データを取得する画像取得機能であって、前記対象画像データは、イメージセンサを用いて印刷物を読み取ることによって生成される、前記画像取得機能と、
前記対象画像内の複数個の画素から、文字を示す文字画素を特定する文字特定機能と、
をコンピュータに実現させ、
前記文字特定機能は、
前記対象画像データを用いて、前記対象画像内の複数個の画素のそれぞれが、対象画像内のエッジを構成するエッジ画素であるか否かを画素ごとに判断することによって、前記エッジ画素であると判断される複数個の第１の候補画素を決定し、
前記対象画像データを用いて、前記対象画像上に配置される複数個のブロックのそれぞれについて、前記ブロック内の複数個の画素の分布を示すヒストグラムデータを生成し、
前記ヒストグラムデータを用いて、前記複数個のブロックのそれぞれが、文字を示す文字ブロックであるか否かをブロックごとに判断することによって、前記文字ブロックであると判断されるブロック内の複数個の第２の候補画素を決定し、
前記対象画像内の複数個の画素のうち、前記第１の候補画素であると決定され、かつ、前記第２の候補画素であると決定される画素を、前記文字画素として特定する、コンピュータプログラム。