JP2023111408A

JP2023111408A - 画像処理装置及びその制御方法とプログラム

Info

Publication number: JP2023111408A
Application number: JP2022013253A
Authority: JP
Inventors: 裕之酒井; Hiroyuki Sakai
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2022-01-31
Filing date: 2022-01-31
Publication date: 2023-08-10
Also published as: US20230245270A1

Abstract

【課題】画像情報を漏れなく再現することと画像データの圧縮効率を向上する画像処理装置及びその制御方法とプログラムを提供する。【解決手段】画像処理装置あるＭＦＰ（複合機）と、情報処理装置のあるＰＣがネットワークを介して通信可能に接続される画像処理システムにおいて、ＭＦＰの制御ユニットは、原稿をスキャナ部で読み取ることによって生成された元画像３００から文字画素を検出し、画像データを圧縮する際に用いる代表色を決定し、検出された文字以外の画素の色は変更せず、検出された文字の画素の色を代表色に基づいて修正した色変換画像３１０を生成し、色変換画像３１０を代表色の色毎の画像に分割して、分割された画像毎に二値画像の圧縮データ３２０を生成する。【選択図】図３

Description

本発明は、画像処理装置及びその制御方法とプログラムに関し、特に画像データを効率的で圧縮する技術に関する。

カラープリンタやカラースキャナの普及により、多色で印画されたカラー文書の利用機会が増えたことにより、カラー文書をスキャナで読み取ってカラー画像の電子ファイルとして保存し、インターネット等を介して送付する機会が増えている。しかし、カラー画像の画像データ（以下「カラー画像データ」という）は一般的にデータサイズが大きいため、保存時には記憶装置の記憶領域が圧迫され、また、送信時には通信負荷が大きくなる。

そこで、カラー画像データを圧縮する方法として、誤差拡散等で擬似階調を持った二値画像にして圧縮する方法、ＪＰＥＧ形式で圧縮する方法、８ビット等のパレットカラーに変換を行いＺＩＰ圧縮やＬＺＷ圧縮をする方法等が用いられている。

また、圧縮効率の高い手法として、特許文献１は、カラー画像に対して減色処理を行ってカラー情報とインデクスカラー画像を取得し、色ごとの二値画像と背景色情報を生成してＭＭＲ圧縮方法等で圧縮処理を行う技術を開示している。また、特許文献２は、色相環を所定の基準で分割し、画像内の画素の色がどの分割領域にどの程度分布しているかに応じて原稿の色を減色する画像符号化方法を開示している。

特許第３８９０２５０号公報特開２０１３－１０２３００号公報

濃淡にムラのある手書きの文書等をスキャナで読み取った場合、輝度値にばらつきが発生しやすい。そして、輝度値にばらつきのある画像データに対して上記特許文献１に記載された技術を適用して圧縮処理を行うと、１文字に対して、例えば黒色と灰色等の複数色の二値画像が生成される。その際、ＭＭＲ圧縮方法では画素の連続性が高いほど圧縮率が向上するため、文字を構成する画素の輝度値がばらついて連続性が低下していると、圧縮効率が低下してしまう。

また、上記特許文献２に記載された技術を用いて、黒色や灰色等の複数色を近似色と判断して統合した場合、例えば灰色のオブジェクトが黒色で塗り潰されてしまうことによって、画像情報が欠落してしまう。

本発明は、画像情報を漏れなく再現させることを可能にすると共に画像データの圧縮効率を高める技術を提供することを目的とする。

本発明に係る画像処理装置は、原稿をスキャナで読み取ることによって生成された画像から文字画素を検出する検出手段と、画像データを圧縮する際に用いる色情報を決定する決定手段と、前記検出手段で検出された文字以外の画素の色は変更せず、前記検出手段で検出された文字の画素の色を前記色情報に基づいて修正した色変換画像を生成する色変換手段と、前記色変換画像を前記色情報の色ごとの画像に分割する分割手段と、前記分割手段により生成された画像ごとに二値画像の圧縮データを生成する圧縮手段と、を有することを特徴とする。

本発明によれば、画像情報を漏れなく再現させることを可能にすると共に画像データの圧縮効率を高めることができる。

実施形態に係る画像処理システムの概略構成を示す図である。画像処理システムを構成するＭＦＰの概略構成を示すブロック図である。ＭＦＰが有するデータ処理部の構成を示すブロック図である。データ処理部におけるカラー情報生成部及びカラー情報ソート部での処理を説明する図である。データ処理部における二値画像生成部での処理を説明する図である。ＭＦＰで実行される画像符号化処理のフローチャートである。Ｓ６０１のエッジ検出処理のフローチャートである。Ｓ６０５の第１実施形態に係る文字画素色変換処理を説明する模式図である。Ｓ６０５の第１実施形態に係る文字画素色変換処理のフローチャートである。Ｓ６１１で出力される圧縮データの構成例を示す図である。ノイズ画素を有する減色画像の一例を示す図である。第２実施形態に係る文字画素色変換処理のフローチャートである。Ｓ１２０８の黒文字候補画素色変換処理のフローチャートである。

本発明の実施形態について、添付図面を参照して以下に詳細に説明する。

図１は、実施形態に係る画像処理システムの概略構成を示す図である。画像処理システムは、画像処理装置の一例であるＭＦＰ１００（複合機）と、情報処理装置の一例であるＰＣ１０２（パーソナルコンピュータ）がネットワーク１０３を介して通信可能に接続されることにより構成される。

ユーザは、ＭＦＰ１０１の操作部２０３（図２参照）を操作して、スキャン画像を送信する宛先（例えばＰＣ１０２）と、スキャンや送信に関する各種設定を行うことができる。具体的には、ユーザは、生成するスキャン画像の解像度や圧縮率、データ書式（例えば、ＪＰＥＧ、ＴＩＦＦ、ＰＤＦ、少数色圧縮）等を設定することができる。本実施形態では、特に言及しない限り、データ書式として少数色圧縮が指定されたものとして説明を行う。なお、少数色圧縮の技術的内容の詳細については後述する。

ユーザは、ＭＦＰ１０１のソフトウェア機能及びハードウェア機能を利用してスキャナ部２０１により原稿（紙文書）をスキャンし、生成したスキャン画像の画像データを指定した各種設定で生成して、指定された宛先に送信することができる。ここで、ＭＦＰ１０１で生成されたスキャン画像データは、ＰＤＦ等のファイルフォーマットでＰＣ１０２へ送信されるものとし、よって、ＰＣ１０２上ではＰＣ１０２が有する汎用的なビューアで画像を閲覧することができる。

図２は、ＭＦＰ１０１の概略構成を示すブロック図である。ＭＦＰ１０１は、画像入力デバイスであるスキャナ部２０１と、画像出力デバイスであるプリンタ部２０２と、制御ユニット２０４と、ユーザインターフェースである操作部２０３を有する。制御ユニット２０４は、スキャナ部２０１、プリンタ部２０２及び操作部２０３と接続されている。また、制御ユニット２０４は、ネットワーク１０３と接続されており、ネットワーク１０３を介して外部装置との間で画像情報やデバイス情報の入出力を行う。

制御ユニット２０４は、システムバス２１６に接続されたＣＰＵ２０５、ＲＡＭ２０６、ＲＯＭ２１０、記憶部２１１、操作部Ｉ／Ｆ２０７及びネットワークＩ／Ｆ２０８を有する。また、制御ユニット２０４は、画像バス２１７に接続されたＲＩＰ部２１３、デバイスＩ／Ｆ２１４及びデータ処理部２１５を有する。制御ユニット２０４は、システムバス２１６と画像バス２１７とを接続し、データ構造を変換するバスブリッジであるイメージバスＩ／Ｆ２１２を有する。

ＣＰＵ２０５は、ＭＦＰ１０１の全体的な制御を司る制御手段（プロセッサ）である。ＲＡＭ２０６は、ＣＰＵ２０５が動作するためのシステムワークメモリであり、画像データを一時記憶するための画像メモリとしても用いられる。ＲＯＭ２１０は、ブートＲＯＭであり、ＭＦＰ１０１を起動するためのブートプログラム等のプログラムを格納する。記憶部２１１は、ハードディスクドライブ（ＨＤＤ）等であり、システム制御用ソフトウェアや画像データを格納する。

操作部Ｉ／Ｆ２０７は、操作部２０３とＣＰＵ２０５を通信可能に接続するインターフェースであり、操作部２０３に表示するための画像データを操作部２０３に出力する。また、操作部Ｉ／Ｆ２０７は、ユーザによる操作部２０３に対する操作を通じた入力情報をＣＰＵ２０５に通知する。ネットワークＩ／Ｆ２０８は、ＭＦＰ１０１をネットワーク１０３に接続し、パケット形式の情報の入出力を可能とするインターフェースである。

画像バス２１７は、画像データの高速転送を可能とするために、例えば、ＰＣＩバスやＩＥＥＥ１３９４で構成される。ＲＩＰ（Raster Image Processor）部２１３は、ＰＤＬ（Page Description Language）コードを解析し、指定された解像度のビットマップイメージに展開する処理（所謂、レンダリング処理）を実行する。デバイスＩ／Ｆ２１４は、信号線２１８を介してスキャナ部２０１と接続され、また、信号線２１９を介してプリンタ部２０２と接続されて、スキャナ部２０１とプリンタ部２０２のＣＰＵ２０５による制御を可能とするインターフェースである。プリンタ部２０２は、伸長処理が施された画像データをデバイスＩ／Ｆ２１４を介して受け取って印刷を行う。

データ処理部２１５は、スキャナ部２０１より入力されるスキャン画像データの画像処理や、印刷用データをプリンタ部２０２で印刷可能なデータに変換する処理、ＯＣＲ処理等を行う。また、データ処理部２１５は、少数色圧縮処理を行って圧縮データ３２２（図３参照）を生成する。生成された圧縮データ３２２は、ネットワークＩ／Ｆ２０８及びネットワーク１０３を介して、指定された宛先（例えば、ＰＣ１０２）に送信される。更に、データ処理部２１５は、ネットワークＩ／Ｆ２０８及びネットワーク１０３を介して受信した圧縮データ３２２の伸長処理を行う。

図３（ａ）は、ＭＦＰ１０１のデータ処理部２１５の概略構成を示すブロック図である。データ処理部２１５は、エッジ検出部３０１、分散演算部３０３、代表色決定部３０５、減色処理部３０７、文字画素色変換部３０９、カラー情報生成部３１１及びカラー情報ソート部３１３を有する。また、データ処理部２１５は、背景色データ生成部３１５、二値画像生成部３１７、二値画像圧縮部３１９及びデータ統合部３２１を有する。

なお、データ処理部２１５は、本実施形態ではハードウェアとソフトウェアが協同して上記の各部の機能を発揮することで、スキャン画像データ処理を専門に行うマイクロコンピュータとして構成されている。但し、このような構成に限定されず、ＣＰＵ２０５が記憶部２１１に格納された所定のプログラムを実行することによってデータ処理部として機能するよう構成されていてもよい。

先ず、データ処理部２１５に入力される元画像について説明する。図３（ｂ）は、元画像３００の一例を示す図である。上段には、左から順に黒色で「Ｈ」、赤色で「Ｅ」、全体が黒色で灰色のドットで表される色むらを含む「Ｉ」が描画されている。中段の右側には桃色で「Ｌ」が描画されている。下段には、灰色の矩形が描画されている。

なお、「Ｉ」の色むらは、原稿スキャン時に「Ｉ」の色（黒）と背景の色（白）の中間色に減色されることによって生じ得る。また、本実施形態では、「Ｈ」，「Ｅ」，「Ｉ」，「Ｌ」はそれぞれ、文字画素色変換部３０９（詳細は後述する）により文字として認識され、図形としては認識されないものとし、一方で灰色の矩形は図形として認識されるものとする。なお、図示の都合上、図３（ｂ）では、赤色と桃色の文字は所定のハッチングで示されている。

エッジ検出部３０１は、元画像３００の各画素のエッジ情報を検出し、具体的には、強度の異なる２種類のエッジを検出する。なお、エッジ検出の手法の詳細については後述する。エッジ検出処理によって元画像３００の各画素に対応したエッジ検出信号３０２が生成される。エッジ検出信号３０２は、例えば、元画像３００と同じサイズの２ｂｉｔ画像を形成する。

図３（ｃ）は、エッジ検出部３０１が元画像３００から生成したエッジ検出信号３０２による２ｂｉｔ画像の一例を示す図である。ここでは、エッジ検出信号３０２は、元画像３００の各画素のエッジ検出結果に対応して、０，１，２のいずれかの値を取るものとし、‘０’は非エッジであり、‘１’は弱エッジであり、‘２’は強エッジであることを表している。

分散演算部３０３は、元画像３００を例えば縦３×横３画素の領域に分割して各領域内の画素の輝度値の分散を算出し、得られた分散をその領域の中心画素の分散とする。これにより、図３（ｄ）に示されるように、元画像３００の画素ごとの分散を示す分散値テーブル３０４が生成される。

代表色決定部３０５は、元画像３００に対して予め決められた色数で減色処理を行うために必要とされる、減色する色の情報である代表色情報を決定する。図３（ｅ）は、代表色情報３０６の一例を示す図である。本実施形態では、予め決められた色数にはＲＯＭ２１０に保存されている値が用いられるものとするが、これに限定されるものではない。代表色の決定には、例えば、ＲＧＢ値のヒストグラムにおいて頻度の高い色から予め決められた色数を選ぶことにより決定する手法を用いることができる。

本実施形態では、代表色の色数には背景色となる色を含めるものとし、ここでは、代表色の色数は４、代表色は代表色情報３０６の上から順に白色、灰色、赤色及び黒色に決定されたものとする。なお、本実施形態では、文字の色のみを変更し、文字以外のオブジェクト（元画像３００では下段に描画されている灰色の矩形）の色は変更しないこととする。そのため、代表色には文字以外のオブジェクトの色を含めている。

減色処理部３０７は、代表色情報３０６を用いて元画像３００の減色処理を行う。本実施形態では、元画像３００内の全ての画素について、各代表色に最も近い色に減色する。図３（ｂ）の元画像３００が前記の代表色に基づいて減色処理されると、桃色は赤色に変換され、これにより図３（ｆ）に示されるような減色画像３０８が生成される。なお、減色処理はこのような例に限定されるものではない。また、代表色のみからなる元画像の場合には減色処理は行われず、元画像がそのまま減色画像となる。

文字画素色変換部３０９は、エッジ検出信号３０２、分散値テーブル３０４及び代表色情報３０６を用いて減色画像３０８から文字画素を検出し、文字画素の色変換処理を行う。減色画像３０８に対して文字画素の色変換処理を行うことにより、図３（ｇ）に示されるように、減色画像３０８の右上にある「Ｉ」の文字の色むらが改善された文字画素色変換画像３１０（以下「色変換画像３１０」という）が生成される。これにより、二値画像圧縮部３１９での圧縮効率を向上させることができ、また、容易に復号することが可能となる。文字画素の色変換処理の詳細については後述する。

カラー情報生成部３１１及びカラー情報ソート部３１３について、図４を参照して説明する。図４（ａ）は、カラー情報生成部３１１が実行する処理を説明する模式図である。図４（ａ）は、図３（ｇ）の色変換画像内３１０内の文字や図形に対して、各色ごとに座標が設定された様子を表している。

図４（ｂ）は、カラー情報生成部３１１により生成されるカラー情報３１２（以下「第１のカラー情報３１２」という）を示す図である。カラー情報生成部３１１は、色変換画像３１０に含まれる色ごとに第１のカラー情報３１２を生成する。第１のカラー情報３１２は、所定の色の画素の数と、その色の値と、画像内でその色を持つ画素が画像全体の範囲に存在しているかを表す分布範囲と、によって構成される。よって、第１のカラー情報３１２は、色変換画像３１０に用いられている色の数だけ生成される。また、分布範囲のデータは、色変換画像３１０内の色ごとの左上隅にある画素の座標（開始座標）と右下隅にある画素の座標（終了座標）で表される。

カラー情報ソート部３１３は、第１のカラー情報３１２を色ごとの画素数に基づいてソーティングすることにより、ソートされたカラー情報３１４（以下「第２のカラー情報３１４」という）を生成する。図４（ｃ）は、第１のカラー情報３１２をソーティングして得られる第２のカラー情報３１４を示す図である。第２のカラー情報３１４の最上位には、最も画素数の多い色の情報が現れ、ここでは白色の画素が最も多い。

背景色データ生成部３１５は、第２のカラー情報３１４の最上位の色の情報に含まれる色の値を背景色データ３１６として生成する。本実施形態は、ＲＧＢの各８ビットの値を想定しているが、これに限定されるものではない。

二値画像生成部３１７について、図５を用いて説明する。図５は、二値画像生成部３１７での処理を説明する図である。二値画像生成部３１７は、色変換画像３１０と第２のカラー情報３１４に基づいて、色ごとの二値画像３１８を生成する。本実施形態では、第２のカラー情報３１４の最上位の色（本実施形態では白色）を除く色ごとの二値画像が生成される。例えば、二値画像３１８の一例である赤色の二値画像５０１を生成する場合、先ず、色変換画像３１０内で赤色のカラー情報を持つ左上隅の画素の座標を左上頂点、右下隅の画素の座標を右下頂点とした画像サイズを設定する。そして、赤色と同じ色を持つ画素であれば‘１’、赤色でない色を持つ画素であれば‘０’として、赤色を示すデータを付加することにより赤色の二値画像５０１が生成される。黒色及び灰色についても同様に行われ、黒色の二値画像５０２と灰色の二値画像５０３が生成される。

二値画像圧縮部３１９は、二値画像生成部３１７で色ごとに生成された二値画像３１８に対して圧縮を行い、二値画像圧縮データ３２０を生成する。本実施形態ではＭＭＲ圧縮方法を用いるが、これとは異なる圧縮手法を用いてもよい。二値画像圧縮データ３２０は、カラー情報とＭＭＲ圧縮データとで構成されるデータ群である。データ統合部３２１は、背景色データ３１６、二値画像圧縮データ３２０及び第２のカラー情報３１４を統合して、圧縮データ３２２を作成する。

次に、上記構成を備えるＭＦＰ１０１が実行する画像符号化処理について、図６を参照して説明する。図６は、ＭＦＰ１０１で実行される画像符号化処理のフローチャートである。図６にＳ番号（Ｓ６０１～Ｓ６１１）で示す各処理（ステップ）は、ＣＰＵ２０５が記憶部２１１に格納された所定のプログラムをＲＡＭ２０６に展開してＭＦＰ１０１の各部の動作を制御することにより実現される。Ｓ６０１～６１１の処理は、ＣＰＵ２０５の制御下において、データ処理部２１５によって実行される。

先ず、Ｓ６０１の開始前に行われる処理について簡単に説明する。ユーザが符号化して（圧縮して）生成する画像データのデータ形式をＭＦＰ１０１の操作部２０３から入力すると、操作部Ｉ／Ｆ２０７を介して、入力されたデータ形式がＣＰＵ２０５に通知される。ＣＰＵ２０５は、操作部２０３からの通知に基づいてスキャナ部２０１に原稿の読み取りを指示し、また、スキャナ部２０１で生成された元画像３００の画像データの符号化処理を開始するようデータ処理部２１５に指示する。なお、ここでは、画像データの符号化方法として少数色圧縮が指定されたものとし、また、元画像３００は、解像度が３００ｐｉで、ＲＧＢ各８ｂｉｔのカラー画像であるとする。

ＣＰＵ２０５からの処理開始を受けて、Ｓ６０１ではデータ処理部２１５のエッジ検出部３０１が、元画像３００に対するエッジ検出処理を行い、エッジ検出信号３０２を生成する。エッジ検出処理の詳細については後述する。ここでは、図３を参照して説明したように、強度の異なる強エッジと弱エッジの２種類のエッジの検出を行うものとする。例えば、手書き文字のように濃淡のあるオブジェクトでは、文字色と背景色の差による強エッジと、中間色と背景色の差による弱エッジの両方が現れる。このようなエッジの差は、後に行われる文字画素の色変換処理において色変換を行う画素の判定に利用される。

Ｓ６０２ではデータ処理部２１５の分散演算部３０３が、元画像３００の分散を算出し、分散値テーブル３０４を生成する。なお、分散算出方法については前述の通りであり、また、公知の技術を用いるため、ここでの詳細な説明は省略する。

Ｓ６０３ではデータ処理部２１５の代表色決定部３０５が、元画像３００のカラー情報に基づいて代表色情報３０６を生成する。なお、代表色情報３０６の生成方法は前述の通りであり、ここでの詳細な説明を省略する。

Ｓ６０４でデータ処理部２１５の減色処理部３０７は、代表色情報３０６を用いて減色画像３０８を生成する。減色画像３０８の生成方法は前述の通りであり、ここでの説明を省略する。

Ｓ６０５ではデータ処理部２１５の文字画素色変換部３０９が、文字画素の色変換処理を行い、色変換画像３１０を生成する。なお、文字画素の色変換処理の概要については、前述した通りであり、より詳細な説明は追って行う。また、Ｓ６０５での文字画素の色変換処理を、以降、第１実施形態に係る文字画素の色変換処理と称呼する。

Ｓ６０６ではデータ処理部２１５のカラー情報生成部３１１が、色変換画像３１０を元に第１のカラー情報３１２を生成する。第１のカラー情報３１２は、前述したように、色変換画像３１０が含む色を示すデータと、減色された色ごとの画素数と、色変換画像３１０内で最も左上に存在する画素の座標と、最も右下に存在する画素の座標を示すデータとにより構成される。

Ｓ６０７ではデータ処理部２１５のカラー情報ソート部３１３が、第１のカラー情報３１２を色ごとの画素数によってソーティングし、第２のカラー情報３１４を生成する。これにより、最も画素数の多い色のカラー情報が最上位となる。

Ｓ６０８ではデータ処理部２１５の背景色データ生成部３１５が、第２のカラー情報３１４の最上位色の値を背景色データ３１６として出力する。

Ｓ６０９ではデータ処理部２１５の二値画像生成部３１７が、第２のカラー情報３１４のうち、最上位以外のカラー情報と色変換画像３１０を用いて、色ごとの二値画像３１８を生成する。なお、色ごとの二値画像３１８の生成方法は前述の通りであり、ここでの詳細な説明を省略する。

Ｓ６１０ではデータ処理部２１５の二値画像圧縮部３１９が、色ごとの二値画像３１８をＭＭＲ圧縮方法等で圧縮処理し、二値画像圧縮データ３２０を生成する。ここで生成される二値画像圧縮データ３２０は、カラー情報とＭＭＲ圧縮データにより構成される。

Ｓ６１１ではデータ処理部２１５のデータ統合部３２１が、背景色データ３１６、二値画像圧縮データ３２０及び第２のカラー情報３１４から圧縮データ３２２を作成して出力する。なお、圧縮データ３２２の構成例については後述する。Ｓ６１１の処理が終了すると、ＣＰＵ２０５は本処理を終了させる。

次に、Ｓ６０１でのエッジ検出処理、Ｓ６０５での第１実施形態に係る文字画素の色変換処理、Ｓ６１１で出力される圧縮データ３２２のデータ構成について詳細に説明する。

先ず、Ｓ６０１でのエッジ検出処理について説明する。図７は、Ｓ６０１でのエッジ検出処理のフローチャートである。

Ｓ７０１でエッジ検出部３０１は、元画像３００を明度と色差からなるＬＣＨ色空間の画像に変換する。変換式には公知の式を用いることができ、よって、ここでの詳細な説明は省略する。なお、本実施形態ではＬＣＨ各８ｂｉｔの画像に変換するが、明度と色差からなる色空間であればよいため、例えば、Ｌ^＊ａ^＊ｂ^＊色空間やＹＣｂＣｒ色空間等の画像に変換してもよい。

Ｓ７０２でエッジ検出部３０１は、元画像３００内の画素から１つの画素を注目画素として選択する。元画像３００内の画素からの注目画素の選択はどのような順番で行ってもよく、本実施形態では画像全体のラスタスキャン順とする。

Ｓ７０３でエッジ検出部３０１は、注目画素の上下、左右及び斜めに位置する画素のＬＣＨ各成分の差分を算出し、算出した差分の少なくとも１つが予め定められた第１閾値以上であるか否かを判定する。具体的には、注目画素の上の画素と下の画素のＬＣＨ各成分の差分を算出し、いずれかの成分の差分が第一閾値以上であるか否かを判定する。同様に、注目画素の左の画素と右の画素について、また、右斜め上の画素と左斜め下の画素について、更に、左斜め上の画素と右斜め下の画素について、ＬＣＨ各成分の差分を算出し、いずれかの成分の差分が第１閾値以上であるか否かを判定する。なお、ここでは、４方向で３つの成分の差分が、つまり、合計で１２個の差分が算出される。

エッジ検出部３０１は、１２個の差分の少なくとも１つが第１閾値以上であると判定した場合（Ｓ７０３でＹＥＳ）、Ｓ７０４の処理を実行し、１２個の差分の全てが第１閾値未満であると判定した場合（Ｓ７０３でＮＯ）、Ｓ７０５の処理を実行する。

Ｓ７０４でエッジ検出部３０１は、注目画素を強エッジであると判断し、その後、Ｓ７０７の処理を実行する。

Ｓ７０５でエッジ検出部３０１は、Ｓ７０３で求めた１２個の差分の少なくとも１つが予め定められた第２閾値以上であるか否かを判定する。第２閾値は第１閾値よりも小さな値であり、例えば、第１閾値が５０である場合に、第２閾値を４０とすることができる。エッジ検出部３０１は、１２個の差分の少なくとも１つが第２閾値以上であると判定した場合（Ｓ７０５でＹＥＳ）、Ｓ７０６の処理を実行し、１２個の差分の全てが第２閾値未満であると判定した場合（Ｓ７０５でＮＯ）、Ｓ７０７の処理を実行する。

Ｓ７０６でエッジ検出部３０１は、注目画素を弱エッジと判断し、その後、Ｓ７０７の処理を実行する。

Ｓ７０７でエッジ検出部３０１は、画像内の全ての画素を注目画素として選択したか否かを判定する。エッジ検出部３０１は、全ての画素を注目画素として選択したと判定した場合（Ｓ７０７でＹＥＳ）、本処理を終了させ、全ての画素を注目画素として選択していないと判定した場合（Ｓ７０７でＮＯ）、Ｓ７０２の処理を実行する。図７のフローチャートの処理が終了すると、Ｓ６０２の処理が実行される。

続いて、Ｓ６０５での第１実施形態に係る文字画素の色変換処理について説明する。図８（ａ）は、減色処理部３０７までの処理が行われた結果として得られる減色画像３０８の一例を示す図である。図８（ｂ）は、減色画像３０８内の手書き文字８０１の一部の領域８０４の拡大図である。なお、図８（ａ）の減色画像３０８は、図３（ｆ）の減色画像３０８と同じである。

例えば、手書き文字のように濃度のムラがあるような文字を含む原稿をスキャンして元画像３００が生成された場合、図８（ｂ）中の画素８０２のように、手書き文字８０１を構成する画素の色と背景８０３の色の中間色に減色された画素が生じることがある。このような画素が存在すると、二値画像圧縮部３１９が色ごとの二値画像を生成する際に、文字を構成する画素の連続性が低下する。その結果、画素の連続性が高いほど圧縮率が向上するＭＭＲ圧縮方式等では、圧縮効率の低下が顕著となる。

この問題を回避するために、本実施形態では、減色画像３０８内の手書き文字８０１の色を代表色情報３０６に基づいて変更することにより、画像情報（元画像３００が有する情報）を漏れなく再現させることを可能にすると共に圧縮効率を向上させる。

図９は、Ｓ６０５での第１実施形態に係る文字画素の色変換処理のフローチャートである。Ｓ９０１で文字画素色変換部３０９は、減色画像３０８内の画素から１つの画素を注目画素として選択する。減色画像３０８内の注目画素の選択はどのような順序で行ってもよく、本実施形態では画像全体のラスタスキャン順とする。

Ｓ９０２で文字画素色変換部３０９は、代表色情報３０６に基づいて注目画素が灰色画素か否かを判定する。具体的には、注目画素の色が、代表色情報にある色の中で、ＲＧＢ値の各成分の差が５以内である色の中で最も輝度値の高い色と最も輝度値の低い色以外の色か否かが判定される。例えば、図８（ｃ）に示す代表色情報３０６の場合、最も輝度値の高い色は（２５５，２５５，２５５）で、最も輝度値の低い色は（０，０，０）である。そのため、これらの色以外でＲＧＢ値の各成分の差が５以内である色は（１２８，１２８，１２８）であり、この色に減色されている画素を灰色画素とする。なお、灰色画素を判定する方法はこれに限定されるものではなく、例えば、ＬＣＨ色空間のような明度と色相で表せる色空間のＣ成分とＨ成分の値に基づいて判定してもよい。

文字画素色変換部３０９は、注目画素が灰色画素であると判定した場合（Ｓ９０２でＹＥＳ）、Ｓ９０３の処理を実行し、注目画素が灰色画素ではないと判定した場合（Ｓ９０２でＮＯ）、Ｓ９０１の処理を実行する。

Ｓ９０３で文字画素色変換部３０９は、分散値テーブル３０４に基づいて注目画素の分散が予め定められた第３閾値以上か否かを判定する。例えば、図８（ｄ）に示す分散値テーブル３０４の場合、注目画素の座標が（Ｘ４，Ｙ１）であれば、注目画素の分散は５０となり、第３閾値が８０である場合には注目画素の分散は第３閾値未満であると判定される。なお、第３閾値の値はこれに限定されるものではない。

文字画素色変換部３０９は、Ｓ９０３で注目画素の分散が第３閾値以上であると判定した場合（Ｓ９０３でＹＥＳ）、Ｓ９０６の処理を実行し、注目画素の分散が第３閾値未満であると判定した場合（Ｓ９０３でＮＯ）、Ｓ９０４の処理を実行する。Ｓ９０４で文字画素色変換部３０９は、注目画素を中心とした縦７画素×横７画素の４９画素を参照画素として選択する。なお、参照画素の数はこれに限定されるものではない。

Ｓ９０５で、文字画素色変換部３０９は、次の第１乃至第３の条件の全てが満たされるか否かを判定する。第１の条件は、注目画素の分散が第４閾値以下であることである。第２の条件は、Ｓ９０４で選択した参照画素の中に強エッジ判定画素と弱エッジ判定画素がそれぞれ１つ以上あることである。第３の条件は、第２の条件が満たされる場合に、強エッジ判定画素と弱エッジ判定画素の合計数が第５閾値以上であることである。

図８（ｅ）は、図８（ｂ）示される画素のエッジ検出結果の一例を示す図である。エッジ検出結果から、注目画素の周囲の参照画素においてエッジであると判定された画素（エッジ判定画素）の数を求めて、注目画素が濃淡にばらつきのある文字の画素の内側にある画素であるか否かを判定する。図８（ｅ）の例では、強エッジ判定画素が１３個、弱エッジ判定画素が９個存在し、よって、エッジ判定画素の合計数は２２個である。例えば、第４閾値が８０、第５閾値が１５の場合は、全ての条件が満たされる。なお、第４閾値は第３閾値以下の値であればよく、前出の値に限られるものではない。また、第５閾値も、前出の値に限られるものではない。

文字画素色変換部３０９は、第１乃至第３の条件が全て満たされると判定した場合（Ｓ９０５でＹＥＳ）、Ｓ９０６の処理を実行し、第１乃至第３の条件の少なくとも１つが満たされていないと判定した場合（Ｓ９０５でＮＯ）、Ｓ９０７の処理を実行する。なお、Ｓ９０３の判定が‘ＹＥＳ’となる場合、文字画素色変換部３０９は、注目画素は濃淡にばらつきのある文字の外側にある画素であると判定したことになる。

Ｓ９０６で文字画素色変換部３０９は、注目画素を黒色に変換する。例えば、代表色情報３０６にある色の中で、ＲＧＢ値の各成分の差が５以内であり、且つ、最も輝度値の小さい色を黒色画素とする。図８（ｃ）の例では（０，０，０）が黒色画素となる。

Ｓ９０７で文字画素色変換部３０９は、減色画像３０８内のすべての画素を注目画素として選択したか否かを判定する。文字画素色変換部３０９は、全ての画素を注目画素として選択したと判定した場合（Ｓ９０７でＹＥＳ）、本処理を終了させ、全ての画素を注目画素として選択していないと判定した場合（Ｓ９０７でＮＯ）、Ｓ９０１の処理を実行する。図９のフローチャートの処理が終了すると、Ｓ６０６の処理が実行される。

次に、Ｓ６１１で出力される圧縮データ３２２の構成について説明する。図１０は、Ｓ６１１で出力される圧縮データ３２２の構成例を示す図である。圧縮データ３２２は、ヘッダ部と、色ごとの圧縮データ部から構成される。

ヘッダ部は、原稿をスキャンして得られる元画像３００の大きさ（縦横の画素数）、背景色の値、解像度等の情報を含む。背景色には基本的に画素数が最も多い色が選択される。例えば、赤色のカラー用紙に文字や図形等が描画されている原稿から元画像３００が生成されており、背景色が赤であると決定された場合、背景色の値には赤の値が入る。

色ごとの圧縮データ部は、カラー情報とＭＭＲ圧縮データで構成される。背景色を除いて残った色数が‘Ｎ’であった場合、その色数分だけ同じ構造のデータが存在する。そのため、例えば、元画像３００の原稿が白紙等の単色原稿であった場合には、その色の圧縮データ部は作成されない。また、元画像３００の原稿が白黒原稿であった場合には、カラー圧縮データ数は‘１’となり、二値画像とほぼ等価になる。黒画素が原稿の一部分のみである場合、ＭＭＲ圧縮データはその部分のみが圧縮されているため、白黒原稿の元画像全体をＭＭＲ圧縮した場合よりもデータサイズが小さくなる。

圧縮データ３２２の復号は、次の通りに行われる。即ち、先ず、ヘッダ部に格納された背景色で原稿の全領域が描画される。続いて、圧縮データ部に含まれているＭＭＲ圧縮データが格納順に伸長され、得られた画像をマスクにして、記憶されている位置と色に従って上書きされる。これにより、復号された画像が得られる。

以上の説明の通り、本実施形態にうよれば、文字判定された画素の色のみを修正することにより、画像情報を漏れなく再現させることが可能になると共に、圧縮効率を向上させることが可能になる。

次に、文字画素色変換部３０９による第２実施形態に係る文字画素の色変換処理について説明する。図１１（ａ）は、減色処理部３０７での処理を終えて得られる減色画像１１００の一例を示す図である。図１１（ｂ）は、減色画像１１００内の灰色オブジェクト１１０１の右上部分を拡大して示す図である。減色画像１１００は、灰色オブジェクト１１０１の右上近傍に灰色オブジェクト１１０１の色とは異なる色のノイズ画素１１０２が発生している点で、図３（ｆ）の減色画像３０８と異なる。ノイズ画素１１０２は、例えば、原稿のスキャナ部２０１での読み取り時に原稿又は原稿台に付着した塵埃等が原因となって発生する。

Ｓ６０５の第１実施形態の文字画素の色変換処理では、灰色オブジェクト１１０１においてノイズ画素１１０２に近い画素１１０３は、文字画素ではないにもかかわらず、ノイズ画素１１０２の近傍の強エッジ画素が参照されることで黒色に変換されてしまう。これにより、本来の原稿の情報が欠落してしまう。

図１２は、このような問題を解決するための第２実施形態に係る文字画素の色変換処理のフローチャートである。第２実施形態に係る文字画素色変換処理は、第１実施形態に係る文字画素の色変換処理に代えて用いられる。つまり、元画像３００の圧縮データを作成する全体プロセスは図６のフローチャートに示す通りに行われ、Ｓ６０５の処理を説明する図９のフローチャートが図１２のフローチャートに置き換わる。よって、Ｓ１２０１～Ｓ１２０８の処理は、ＣＰＵ２０５の制御下においてデータ処理部２１５の文字画素色変換部３０９によって実行される。

Ｓ１２０１～Ｓ１２０５の処理は、図９のフローチャートのＳ９０１～Ｓ９０５の処理と同じであるため、ここでの説明を省略する。説明の便宜上、図１１（ｂ）に示される画素１１０３（灰色オブジェクト１１０１においてノイズ画素１１０２に最も近い画素）が注目画素として選択されており、Ｓ１２０５の判定の結果（Ｓ１２０５でＹＥＳ）、Ｓ１２０６の処理が実行されるものとする。

Ｓ１２０６で、文字画素色変換部３０９は注目画素を黒文字候補画素に決定する。図１１（ｃ）は、注目画素が黒文字候補画素に決定された状態を示す模式図である。なお、黒文字候補画素に決定されない画素を非黒文字候補画素と呼称する。

Ｓ１２０７の処理は、図９のフローチャートのＳ９０７の処理と同じであるため、ここでの説明を省略する。文字画素色変換部３０９は、全ての画素が選択されていないと判定した場合（Ｓ１２０７でＮＯ）、Ｓ１２０１の処理を実行し、全ての画素が選択されたと判定した場合（Ｓ１２０７でＹＥＳ）、Ｓ１２０８の処理を実行する。

Ｓ１２０８で文字画素色変換部３０９は、黒文字候補画素の色変換処理を実行する。Ｓ１２０８の処理の詳細については後述する。文字画素色変換部３０９は、Ｓ１２０８の処理が終了すると本処理を終了させ、これによりデータ処理部２１５によりＳ６０６の処理が実行される。

図１３は、Ｓ１２０８の黒文字候補画素色変換処理のフローチャートである。Ｓ１３０１で文字画素色変換部３０９は、減色画像３０８内の画素から１つの画素を注目画素として選択する。減色画像３０８内の注目画素の選択はどのような順序で行ってもよく、本実施形態では画像全体のラスタスキャン順とする。

Ｓ１３０１の開始時には、減色画像３０８の全ての画素について、黒文字候補画素か否かの判断が終わっている。そこで、Ｓ１３０２で文字画素色変換部３０９は、注目画素が黒文字候補画素か否かを判定する。文字画素色変換部３０９は、注目画素が黒文字候補画素であると判定した場合（Ｓ１３０２でＹＥＳ）、Ｓ１３０３の処理を実行し、注目画素が非黒文字候補画素であると判定した場合（Ｓ１３０２でＮＯ）、Ｓ１３０１の処理を実行する。

Ｓ１３０３で文字画素色変換部３０９は、注目画素を中心とした縦５画素×横５画素の、注目画素を除く２４画素を参照画素として選択する。なお、参照画素の数はこれに限定されるものではない。

Ｓ１３０４で文字画素色変換部３０９は、Ｓ１３０３で選択した参照画素の中に黒文字候補画素が存在するか否かを判定する。文字画素色変換部３０９は、参照画素の中に黒文字候補画素が存在すると判定した場合（Ｓ１３０４でＹＥＳ）、Ｓ１３０５の処理を実行し、参照画素の中に黒文字候補画素は存在しないと判定した場合（Ｓ１３０４でＮＯ）、Ｓ１３０１の処理を実行する。

Ｓ１３０５で文字画素色変換部３０９は、注目画素を黒色に変換する。変換方法は、Ｓ９０６と同様に行われるため、ここでの説明を省略する。

Ｓ１３０６で文字画素色変換部３０９は、減色画像３０８内のすべての画素を注目画素として選択したか否かを判定する。文字画素色変換部３０９は、全ての画素を注目画素として選択したと判定した場合（Ｓ１３０６でＹＥＳ）、本処理を終了させ、全ての画素を注目画素として選択していないと判定した場合（Ｓ１３０６でＮＯ）、Ｓ１３０１へ処理を戻す。図１３のフローチャートの処理の終了は、図１２のフローチャートの処理の終了でもあり、よって、続いてＳ６０６の処理が実行される。

上記説明の通り、第２実施形態に係る文字画素の色変換処理を採用することにより、第１実施形態と同じ効果を得ることができ、更に、ノイズ画素がある場合の画素の色の誤変換を抑制することができる。

以上、本発明をその好適な実施形態に基づいて詳述してきたが、本発明はこれら特定の実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の様々な形態も本発明に含まれる。更に、上述した各実施形態は本発明の一実施形態を示すものにすぎず、各実施形態を適宜組み合わせることも可能である。

本発明は、上述の実施形態の１以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける１つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、１以上の機能を実現する回路（例えば、ＡＳＩＣ）によっても実現可能である。

１０１ＭＦＰ
２０１スキャナ部
２１５データ処理部
３０１エッジ検出部
３０３分散演算部
３０５代表色決定部
３０７減色処理部
３０９文字画素色変換部
３１７二値画像生成部
３１９二値画像圧縮部

Claims

原稿をスキャナで読み取ることによって生成された画像から文字画素を検出する検出手段と、
画像データを圧縮する際に用いる色情報を決定する決定手段と、
前記検出手段で検出された文字以外の画素の色は変更せず、前記検出手段で検出された文字の画素の色を前記色情報に基づいて修正した色変換画像を生成する色変換手段と、
前記色変換画像を前記色情報の色ごとの画像に分割する分割手段と、
前記分割手段により生成された画像ごとに二値画像の圧縮データを生成する圧縮手段と、を有することを特徴とする画像処理装置。
前記色変換手段は、前記色情報にある色以外の色の文字の画素の色を、前記色情報にある色のうち最も近い色の画素の色に変換することを特徴とする請求項１に記載の画像処理装置。
前記画像における画素ごとの輝度値の分散を演算する演算手段と、
前記画像における画素ごとのエッジ情報を検出するエッジ検出手段と、
前記検出手段は、前記分散と前記エッジ情報とに基づいて前記文字画素を検出することを特徴とする請求項１又は２に記載の画像処理装置。
前記色変換手段は、前記分散と、前記エッジ情報と、前記色情報の色とに基づいて前記色変換画像を生成することを特徴とする請求項３に記載の画像処理装置。
前記スキャナにより生成された画像を前記色情報に基づいて減色した減色画像を生成する減色手段を有し、
前記色変換手段は、前記減色画像から前記色変換画像を生成することを特徴とする請求項１乃至４のいずれか１項に記載の画像処理装置。
前記色変換手段は、前記減色画像の画素の色を該画素の周囲の画素の情報に基づいて変換することを特徴とする請求項５に記載の画像処理装置。
画像処理装置の制御方法であって、
スキャナで原稿を読み取ることによって生成された画像から文字画素を検出するステップと、
画像データを圧縮する際に用いる色情報を決定するステップと、
前記検出された文字以外の画素の色は変更せず、前記検出された文字の画素の色を前記色情報に基づいて修正した色変換画像を生成するステップと、
前記色変換画像を前記色情報の色ごとの画像に分割するステップと、
前記分割された画像ごとに二値画像の圧縮データを生成するステップと、有することを特徴とする画像処理装置の制御方法。
コンピュータを請求項１乃至６のいずれか１項に記載の画像処理装置の各手段として機能させることを特徴とするプログラム。