JP2023111408A - 画像処理装置及びその制御方法とプログラム - Google Patents

画像処理装置及びその制御方法とプログラム Download PDF

Info

Publication number
JP2023111408A
JP2023111408A JP2022013253A JP2022013253A JP2023111408A JP 2023111408 A JP2023111408 A JP 2023111408A JP 2022013253 A JP2022013253 A JP 2022013253A JP 2022013253 A JP2022013253 A JP 2022013253A JP 2023111408 A JP2023111408 A JP 2023111408A
Authority
JP
Japan
Prior art keywords
color
image
pixels
pixel
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022013253A
Other languages
English (en)
Inventor
裕之 酒井
Hiroyuki Sakai
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2022013253A priority Critical patent/JP2023111408A/ja
Priority to US18/155,952 priority patent/US20230245270A1/en
Publication of JP2023111408A publication Critical patent/JP2023111408A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4015Image demosaicing, e.g. colour filter arrays [CFA] or Bayer patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Processing (AREA)

Abstract

【課題】画像情報を漏れなく再現することと画像データの圧縮効率を向上する画像処理装置及びその制御方法とプログラムを提供する。【解決手段】画像処理装置あるMFP(複合機)と、情報処理装置のあるPCがネットワークを介して通信可能に接続される画像処理システムにおいて、MFPの制御ユニットは、原稿をスキャナ部で読み取ることによって生成された元画像300から文字画素を検出し、画像データを圧縮する際に用いる代表色を決定し、検出された文字以外の画素の色は変更せず、検出された文字の画素の色を代表色に基づいて修正した色変換画像310を生成し、色変換画像310を代表色の色毎の画像に分割して、分割された画像毎に二値画像の圧縮データ320を生成する。【選択図】図3

Description

本発明は、画像処理装置及びその制御方法とプログラムに関し、特に画像データを効率的で圧縮する技術に関する。
カラープリンタやカラースキャナの普及により、多色で印画されたカラー文書の利用機会が増えたことにより、カラー文書をスキャナで読み取ってカラー画像の電子ファイルとして保存し、インターネット等を介して送付する機会が増えている。しかし、カラー画像の画像データ(以下「カラー画像データ」という)は一般的にデータサイズが大きいため、保存時には記憶装置の記憶領域が圧迫され、また、送信時には通信負荷が大きくなる。
そこで、カラー画像データを圧縮する方法として、誤差拡散等で擬似階調を持った二値画像にして圧縮する方法、JPEG形式で圧縮する方法、8ビット等のパレットカラーに変換を行いZIP圧縮やLZW圧縮をする方法等が用いられている。
また、圧縮効率の高い手法として、特許文献1は、カラー画像に対して減色処理を行ってカラー情報とインデクスカラー画像を取得し、色ごとの二値画像と背景色情報を生成してMMR圧縮方法等で圧縮処理を行う技術を開示している。また、特許文献2は、色相環を所定の基準で分割し、画像内の画素の色がどの分割領域にどの程度分布しているかに応じて原稿の色を減色する画像符号化方法を開示している。
特許第3890250号公報 特開2013-102300号公報
濃淡にムラのある手書きの文書等をスキャナで読み取った場合、輝度値にばらつきが発生しやすい。そして、輝度値にばらつきのある画像データに対して上記特許文献1に記載された技術を適用して圧縮処理を行うと、1文字に対して、例えば黒色と灰色等の複数色の二値画像が生成される。その際、MMR圧縮方法では画素の連続性が高いほど圧縮率が向上するため、文字を構成する画素の輝度値がばらついて連続性が低下していると、圧縮効率が低下してしまう。
また、上記特許文献2に記載された技術を用いて、黒色や灰色等の複数色を近似色と判断して統合した場合、例えば灰色のオブジェクトが黒色で塗り潰されてしまうことによって、画像情報が欠落してしまう。
本発明は、画像情報を漏れなく再現させることを可能にすると共に画像データの圧縮効率を高める技術を提供することを目的とする。
本発明に係る画像処理装置は、原稿をスキャナで読み取ることによって生成された画像から文字画素を検出する検出手段と、画像データを圧縮する際に用いる色情報を決定する決定手段と、前記検出手段で検出された文字以外の画素の色は変更せず、前記検出手段で検出された文字の画素の色を前記色情報に基づいて修正した色変換画像を生成する色変換手段と、前記色変換画像を前記色情報の色ごとの画像に分割する分割手段と、前記分割手段により生成された画像ごとに二値画像の圧縮データを生成する圧縮手段と、を有することを特徴とする。
本発明によれば、画像情報を漏れなく再現させることを可能にすると共に画像データの圧縮効率を高めることができる。
実施形態に係る画像処理システムの概略構成を示す図である。 画像処理システムを構成するMFPの概略構成を示すブロック図である。 MFPが有するデータ処理部の構成を示すブロック図である。 データ処理部におけるカラー情報生成部及びカラー情報ソート部での処理を説明する図である。 データ処理部における二値画像生成部での処理を説明する図である。 MFPで実行される画像符号化処理のフローチャートである。 S601のエッジ検出処理のフローチャートである。 S605の第1実施形態に係る文字画素色変換処理を説明する模式図である。 S605の第1実施形態に係る文字画素色変換処理のフローチャートである。 S611で出力される圧縮データの構成例を示す図である。 ノイズ画素を有する減色画像の一例を示す図である。 第2実施形態に係る文字画素色変換処理のフローチャートである。 S1208の黒文字候補画素色変換処理のフローチャートである。
本発明の実施形態について、添付図面を参照して以下に詳細に説明する。
図1は、実施形態に係る画像処理システムの概略構成を示す図である。画像処理システムは、画像処理装置の一例であるMFP100(複合機)と、情報処理装置の一例であるPC102(パーソナルコンピュータ)がネットワーク103を介して通信可能に接続されることにより構成される。
ユーザは、MFP101の操作部203(図2参照)を操作して、スキャン画像を送信する宛先(例えばPC102)と、スキャンや送信に関する各種設定を行うことができる。具体的には、ユーザは、生成するスキャン画像の解像度や圧縮率、データ書式(例えば、JPEG、TIFF、PDF、少数色圧縮)等を設定することができる。本実施形態では、特に言及しない限り、データ書式として少数色圧縮が指定されたものとして説明を行う。なお、少数色圧縮の技術的内容の詳細については後述する。
ユーザは、MFP101のソフトウェア機能及びハードウェア機能を利用してスキャナ部201により原稿(紙文書)をスキャンし、生成したスキャン画像の画像データを指定した各種設定で生成して、指定された宛先に送信することができる。ここで、MFP101で生成されたスキャン画像データは、PDF等のファイルフォーマットでPC102へ送信されるものとし、よって、PC102上ではPC102が有する汎用的なビューアで画像を閲覧することができる。
図2は、MFP101の概略構成を示すブロック図である。MFP101は、画像入力デバイスであるスキャナ部201と、画像出力デバイスであるプリンタ部202と、制御ユニット204と、ユーザインターフェースである操作部203を有する。制御ユニット204は、スキャナ部201、プリンタ部202及び操作部203と接続されている。また、制御ユニット204は、ネットワーク103と接続されており、ネットワーク103を介して外部装置との間で画像情報やデバイス情報の入出力を行う。
制御ユニット204は、システムバス216に接続されたCPU205、RAM206、ROM210、記憶部211、操作部I/F207及びネットワークI/F208を有する。また、制御ユニット204は、画像バス217に接続されたRIP部213、デバイスI/F214及びデータ処理部215を有する。制御ユニット204は、システムバス216と画像バス217とを接続し、データ構造を変換するバスブリッジであるイメージバスI/F212を有する。
CPU205は、MFP101の全体的な制御を司る制御手段(プロセッサ)である。RAM206は、CPU205が動作するためのシステムワークメモリであり、画像データを一時記憶するための画像メモリとしても用いられる。ROM210は、ブートROMであり、MFP101を起動するためのブートプログラム等のプログラムを格納する。記憶部211は、ハードディスクドライブ(HDD)等であり、システム制御用ソフトウェアや画像データを格納する。
操作部I/F207は、操作部203とCPU205を通信可能に接続するインターフェースであり、操作部203に表示するための画像データを操作部203に出力する。また、操作部I/F207は、ユーザによる操作部203に対する操作を通じた入力情報をCPU205に通知する。ネットワークI/F208は、MFP101をネットワーク103に接続し、パケット形式の情報の入出力を可能とするインターフェースである。
画像バス217は、画像データの高速転送を可能とするために、例えば、PCIバスやIEEE1394で構成される。RIP(Raster Image Processor)部213は、PDL(Page Description Language)コードを解析し、指定された解像度のビットマップイメージに展開する処理(所謂、レンダリング処理)を実行する。デバイスI/F214は、信号線218を介してスキャナ部201と接続され、また、信号線219を介してプリンタ部202と接続されて、スキャナ部201とプリンタ部202のCPU205による制御を可能とするインターフェースである。プリンタ部202は、伸長処理が施された画像データをデバイスI/F214を介して受け取って印刷を行う。
データ処理部215は、スキャナ部201より入力されるスキャン画像データの画像処理や、印刷用データをプリンタ部202で印刷可能なデータに変換する処理、OCR処理等を行う。また、データ処理部215は、少数色圧縮処理を行って圧縮データ322(図3参照)を生成する。生成された圧縮データ322は、ネットワークI/F208及びネットワーク103を介して、指定された宛先(例えば、PC102)に送信される。更に、データ処理部215は、ネットワークI/F208及びネットワーク103を介して受信した圧縮データ322の伸長処理を行う。
図3(a)は、MFP101のデータ処理部215の概略構成を示すブロック図である。データ処理部215は、エッジ検出部301、分散演算部303、代表色決定部305、減色処理部307、文字画素色変換部309、カラー情報生成部311及びカラー情報ソート部313を有する。また、データ処理部215は、背景色データ生成部315、二値画像生成部317、二値画像圧縮部319及びデータ統合部321を有する。
なお、データ処理部215は、本実施形態ではハードウェアとソフトウェアが協同して上記の各部の機能を発揮することで、スキャン画像データ処理を専門に行うマイクロコンピュータとして構成されている。但し、このような構成に限定されず、CPU205が記憶部211に格納された所定のプログラムを実行することによってデータ処理部として機能するよう構成されていてもよい。
先ず、データ処理部215に入力される元画像について説明する。図3(b)は、元画像300の一例を示す図である。上段には、左から順に黒色で「H」、赤色で「E」、全体が黒色で灰色のドットで表される色むらを含む「I」が描画されている。中段の右側には桃色で「L」が描画されている。下段には、灰色の矩形が描画されている。
なお、「I」の色むらは、原稿スキャン時に「I」の色(黒)と背景の色(白)の中間色に減色されることによって生じ得る。また、本実施形態では、「H」,「E」,「I」,「L」はそれぞれ、文字画素色変換部309(詳細は後述する)により文字として認識され、図形としては認識されないものとし、一方で灰色の矩形は図形として認識されるものとする。なお、図示の都合上、図3(b)では、赤色と桃色の文字は所定のハッチングで示されている。
エッジ検出部301は、元画像300の各画素のエッジ情報を検出し、具体的には、強度の異なる2種類のエッジを検出する。なお、エッジ検出の手法の詳細については後述する。エッジ検出処理によって元画像300の各画素に対応したエッジ検出信号302が生成される。エッジ検出信号302は、例えば、元画像300と同じサイズの2bit画像を形成する。
図3(c)は、エッジ検出部301が元画像300から生成したエッジ検出信号302による2bit画像の一例を示す図である。ここでは、エッジ検出信号302は、元画像300の各画素のエッジ検出結果に対応して、0,1,2のいずれかの値を取るものとし、‘0’は非エッジであり、‘1’は弱エッジであり、‘2’は強エッジであることを表している。
分散演算部303は、元画像300を例えば縦3×横3画素の領域に分割して各領域内の画素の輝度値の分散を算出し、得られた分散をその領域の中心画素の分散とする。これにより、図3(d)に示されるように、元画像300の画素ごとの分散を示す分散値テーブル304が生成される。
代表色決定部305は、元画像300に対して予め決められた色数で減色処理を行うために必要とされる、減色する色の情報である代表色情報を決定する。図3(e)は、代表色情報306の一例を示す図である。本実施形態では、予め決められた色数にはROM210に保存されている値が用いられるものとするが、これに限定されるものではない。代表色の決定には、例えば、RGB値のヒストグラムにおいて頻度の高い色から予め決められた色数を選ぶことにより決定する手法を用いることができる。
本実施形態では、代表色の色数には背景色となる色を含めるものとし、ここでは、代表色の色数は4、代表色は代表色情報306の上から順に白色、灰色、赤色及び黒色に決定されたものとする。なお、本実施形態では、文字の色のみを変更し、文字以外のオブジェクト(元画像300では下段に描画されている灰色の矩形)の色は変更しないこととする。そのため、代表色には文字以外のオブジェクトの色を含めている。
減色処理部307は、代表色情報306を用いて元画像300の減色処理を行う。本実施形態では、元画像300内の全ての画素について、各代表色に最も近い色に減色する。図3(b)の元画像300が前記の代表色に基づいて減色処理されると、桃色は赤色に変換され、これにより図3(f)に示されるような減色画像308が生成される。なお、減色処理はこのような例に限定されるものではない。また、代表色のみからなる元画像の場合には減色処理は行われず、元画像がそのまま減色画像となる。
文字画素色変換部309は、エッジ検出信号302、分散値テーブル304及び代表色情報306を用いて減色画像308から文字画素を検出し、文字画素の色変換処理を行う。減色画像308に対して文字画素の色変換処理を行うことにより、図3(g)に示されるように、減色画像308の右上にある「I」の文字の色むらが改善された文字画素色変換画像310(以下「色変換画像310」という)が生成される。これにより、二値画像圧縮部319での圧縮効率を向上させることができ、また、容易に復号することが可能となる。文字画素の色変換処理の詳細については後述する。
カラー情報生成部311及びカラー情報ソート部313について、図4を参照して説明する。図4(a)は、カラー情報生成部311が実行する処理を説明する模式図である。図4(a)は、図3(g)の色変換画像内310内の文字や図形に対して、各色ごとに座標が設定された様子を表している。
図4(b)は、カラー情報生成部311により生成されるカラー情報312(以下「第1のカラー情報312」という)を示す図である。カラー情報生成部311は、色変換画像310に含まれる色ごとに第1のカラー情報312を生成する。第1のカラー情報312は、所定の色の画素の数と、その色の値と、画像内でその色を持つ画素が画像全体の範囲に存在しているかを表す分布範囲と、によって構成される。よって、第1のカラー情報312は、色変換画像310に用いられている色の数だけ生成される。また、分布範囲のデータは、色変換画像310内の色ごとの左上隅にある画素の座標(開始座標)と右下隅にある画素の座標(終了座標)で表される。
カラー情報ソート部313は、第1のカラー情報312を色ごとの画素数に基づいてソーティングすることにより、ソートされたカラー情報314(以下「第2のカラー情報314」という)を生成する。図4(c)は、第1のカラー情報312をソーティングして得られる第2のカラー情報314を示す図である。第2のカラー情報314の最上位には、最も画素数の多い色の情報が現れ、ここでは白色の画素が最も多い。
背景色データ生成部315は、第2のカラー情報314の最上位の色の情報に含まれる色の値を背景色データ316として生成する。本実施形態は、RGBの各8ビットの値を想定しているが、これに限定されるものではない。
二値画像生成部317について、図5を用いて説明する。図5は、二値画像生成部317での処理を説明する図である。二値画像生成部317は、色変換画像310と第2のカラー情報314に基づいて、色ごとの二値画像318を生成する。本実施形態では、第2のカラー情報314の最上位の色(本実施形態では白色)を除く色ごとの二値画像が生成される。例えば、二値画像318の一例である赤色の二値画像501を生成する場合、先ず、色変換画像310内で赤色のカラー情報を持つ左上隅の画素の座標を左上頂点、右下隅の画素の座標を右下頂点とした画像サイズを設定する。そして、赤色と同じ色を持つ画素であれば‘1’、赤色でない色を持つ画素であれば‘0’として、赤色を示すデータを付加することにより赤色の二値画像501が生成される。黒色及び灰色についても同様に行われ、黒色の二値画像502と灰色の二値画像503が生成される。
二値画像圧縮部319は、二値画像生成部317で色ごとに生成された二値画像318に対して圧縮を行い、二値画像圧縮データ320を生成する。本実施形態ではMMR圧縮方法を用いるが、これとは異なる圧縮手法を用いてもよい。二値画像圧縮データ320は、カラー情報とMMR圧縮データとで構成されるデータ群である。データ統合部321は、背景色データ316、二値画像圧縮データ320及び第2のカラー情報314を統合して、圧縮データ322を作成する。
次に、上記構成を備えるMFP101が実行する画像符号化処理について、図6を参照して説明する。図6は、MFP101で実行される画像符号化処理のフローチャートである。図6にS番号(S601~S611)で示す各処理(ステップ)は、CPU205が記憶部211に格納された所定のプログラムをRAM206に展開してMFP101の各部の動作を制御することにより実現される。S601~611の処理は、CPU205の制御下において、データ処理部215によって実行される。
先ず、S601の開始前に行われる処理について簡単に説明する。ユーザが符号化して(圧縮して)生成する画像データのデータ形式をMFP101の操作部203から入力すると、操作部I/F207を介して、入力されたデータ形式がCPU205に通知される。CPU205は、操作部203からの通知に基づいてスキャナ部201に原稿の読み取りを指示し、また、スキャナ部201で生成された元画像300の画像データの符号化処理を開始するようデータ処理部215に指示する。なお、ここでは、画像データの符号化方法として少数色圧縮が指定されたものとし、また、元画像300は、解像度が300piで、RGB各8bitのカラー画像であるとする。
CPU205からの処理開始を受けて、S601ではデータ処理部215のエッジ検出部301が、元画像300に対するエッジ検出処理を行い、エッジ検出信号302を生成する。エッジ検出処理の詳細については後述する。ここでは、図3を参照して説明したように、強度の異なる強エッジと弱エッジの2種類のエッジの検出を行うものとする。例えば、手書き文字のように濃淡のあるオブジェクトでは、文字色と背景色の差による強エッジと、中間色と背景色の差による弱エッジの両方が現れる。このようなエッジの差は、後に行われる文字画素の色変換処理において色変換を行う画素の判定に利用される。
S602ではデータ処理部215の分散演算部303が、元画像300の分散を算出し、分散値テーブル304を生成する。なお、分散算出方法については前述の通りであり、また、公知の技術を用いるため、ここでの詳細な説明は省略する。
S603ではデータ処理部215の代表色決定部305が、元画像300のカラー情報に基づいて代表色情報306を生成する。なお、代表色情報306の生成方法は前述の通りであり、ここでの詳細な説明を省略する。
S604でデータ処理部215の減色処理部307は、代表色情報306を用いて減色画像308を生成する。減色画像308の生成方法は前述の通りであり、ここでの説明を省略する。
S605ではデータ処理部215の文字画素色変換部309が、文字画素の色変換処理を行い、色変換画像310を生成する。なお、文字画素の色変換処理の概要については、前述した通りであり、より詳細な説明は追って行う。また、S605での文字画素の色変換処理を、以降、第1実施形態に係る文字画素の色変換処理と称呼する。
S606ではデータ処理部215のカラー情報生成部311が、色変換画像310を元に第1のカラー情報312を生成する。第1のカラー情報312は、前述したように、色変換画像310が含む色を示すデータと、減色された色ごとの画素数と、色変換画像310内で最も左上に存在する画素の座標と、最も右下に存在する画素の座標を示すデータとにより構成される。
S607ではデータ処理部215のカラー情報ソート部313が、第1のカラー情報312を色ごとの画素数によってソーティングし、第2のカラー情報314を生成する。これにより、最も画素数の多い色のカラー情報が最上位となる。
S608ではデータ処理部215の背景色データ生成部315が、第2のカラー情報314の最上位色の値を背景色データ316として出力する。
S609ではデータ処理部215の二値画像生成部317が、第2のカラー情報314のうち、最上位以外のカラー情報と色変換画像310を用いて、色ごとの二値画像318を生成する。なお、色ごとの二値画像318の生成方法は前述の通りであり、ここでの詳細な説明を省略する。
S610ではデータ処理部215の二値画像圧縮部319が、色ごとの二値画像318をMMR圧縮方法等で圧縮処理し、二値画像圧縮データ320を生成する。ここで生成される二値画像圧縮データ320は、カラー情報とMMR圧縮データにより構成される。
S611ではデータ処理部215のデータ統合部321が、背景色データ316、二値画像圧縮データ320及び第2のカラー情報314から圧縮データ322を作成して出力する。なお、圧縮データ322の構成例については後述する。S611の処理が終了すると、CPU205は本処理を終了させる。
次に、S601でのエッジ検出処理、S605での第1実施形態に係る文字画素の色変換処理、S611で出力される圧縮データ322のデータ構成について詳細に説明する。
先ず、S601でのエッジ検出処理について説明する。図7は、S601でのエッジ検出処理のフローチャートである。
S701でエッジ検出部301は、元画像300を明度と色差からなるLCH色空間の画像に変換する。変換式には公知の式を用いることができ、よって、ここでの詳細な説明は省略する。なお、本実施形態ではLCH各8bitの画像に変換するが、明度と色差からなる色空間であればよいため、例えば、L色空間やYCbCr色空間等の画像に変換してもよい。
S702でエッジ検出部301は、元画像300内の画素から1つの画素を注目画素として選択する。元画像300内の画素からの注目画素の選択はどのような順番で行ってもよく、本実施形態では画像全体のラスタスキャン順とする。
S703でエッジ検出部301は、注目画素の上下、左右及び斜めに位置する画素のLCH各成分の差分を算出し、算出した差分の少なくとも1つが予め定められた第1閾値以上であるか否かを判定する。具体的には、注目画素の上の画素と下の画素のLCH各成分の差分を算出し、いずれかの成分の差分が第一閾値以上であるか否かを判定する。同様に、注目画素の左の画素と右の画素について、また、右斜め上の画素と左斜め下の画素について、更に、左斜め上の画素と右斜め下の画素について、LCH各成分の差分を算出し、いずれかの成分の差分が第1閾値以上であるか否かを判定する。なお、ここでは、4方向で3つの成分の差分が、つまり、合計で12個の差分が算出される。
エッジ検出部301は、12個の差分の少なくとも1つが第1閾値以上であると判定した場合(S703でYES)、S704の処理を実行し、12個の差分の全てが第1閾値未満であると判定した場合(S703でNO)、S705の処理を実行する。
S704でエッジ検出部301は、注目画素を強エッジであると判断し、その後、S707の処理を実行する。
S705でエッジ検出部301は、S703で求めた12個の差分の少なくとも1つが予め定められた第2閾値以上であるか否かを判定する。第2閾値は第1閾値よりも小さな値であり、例えば、第1閾値が50である場合に、第2閾値を40とすることができる。エッジ検出部301は、12個の差分の少なくとも1つが第2閾値以上であると判定した場合(S705でYES)、S706の処理を実行し、12個の差分の全てが第2閾値未満であると判定した場合(S705でNO)、S707の処理を実行する。
S706でエッジ検出部301は、注目画素を弱エッジと判断し、その後、S707の処理を実行する。
S707でエッジ検出部301は、画像内の全ての画素を注目画素として選択したか否かを判定する。エッジ検出部301は、全ての画素を注目画素として選択したと判定した場合(S707でYES)、本処理を終了させ、全ての画素を注目画素として選択していないと判定した場合(S707でNO)、S702の処理を実行する。図7のフローチャートの処理が終了すると、S602の処理が実行される。
続いて、S605での第1実施形態に係る文字画素の色変換処理について説明する。図8(a)は、減色処理部307までの処理が行われた結果として得られる減色画像308の一例を示す図である。図8(b)は、減色画像308内の手書き文字801の一部の領域804の拡大図である。なお、図8(a)の減色画像308は、図3(f)の減色画像308と同じである。
例えば、手書き文字のように濃度のムラがあるような文字を含む原稿をスキャンして元画像300が生成された場合、図8(b)中の画素802のように、手書き文字801を構成する画素の色と背景803の色の中間色に減色された画素が生じることがある。このような画素が存在すると、二値画像圧縮部319が色ごとの二値画像を生成する際に、文字を構成する画素の連続性が低下する。その結果、画素の連続性が高いほど圧縮率が向上するMMR圧縮方式等では、圧縮効率の低下が顕著となる。
この問題を回避するために、本実施形態では、減色画像308内の手書き文字801の色を代表色情報306に基づいて変更することにより、画像情報(元画像300が有する情報)を漏れなく再現させることを可能にすると共に圧縮効率を向上させる。
図9は、S605での第1実施形態に係る文字画素の色変換処理のフローチャートである。S901で文字画素色変換部309は、減色画像308内の画素から1つの画素を注目画素として選択する。減色画像308内の注目画素の選択はどのような順序で行ってもよく、本実施形態では画像全体のラスタスキャン順とする。
S902で文字画素色変換部309は、代表色情報306に基づいて注目画素が灰色画素か否かを判定する。具体的には、注目画素の色が、代表色情報にある色の中で、RGB値の各成分の差が5以内である色の中で最も輝度値の高い色と最も輝度値の低い色以外の色か否かが判定される。例えば、図8(c)に示す代表色情報306の場合、最も輝度値の高い色は(255,255,255)で、最も輝度値の低い色は(0,0,0)である。そのため、これらの色以外でRGB値の各成分の差が5以内である色は(128,128,128)であり、この色に減色されている画素を灰色画素とする。なお、灰色画素を判定する方法はこれに限定されるものではなく、例えば、LCH色空間のような明度と色相で表せる色空間のC成分とH成分の値に基づいて判定してもよい。
文字画素色変換部309は、注目画素が灰色画素であると判定した場合(S902でYES)、S903の処理を実行し、注目画素が灰色画素ではないと判定した場合(S902でNO)、S901の処理を実行する。
S903で文字画素色変換部309は、分散値テーブル304に基づいて注目画素の分散が予め定められた第3閾値以上か否かを判定する。例えば、図8(d)に示す分散値テーブル304の場合、注目画素の座標が(X4,Y1)であれば、注目画素の分散は50となり、第3閾値が80である場合には注目画素の分散は第3閾値未満であると判定される。なお、第3閾値の値はこれに限定されるものではない。
文字画素色変換部309は、S903で注目画素の分散が第3閾値以上であると判定した場合(S903でYES)、S906の処理を実行し、注目画素の分散が第3閾値未満であると判定した場合(S903でNO)、S904の処理を実行する。S904で文字画素色変換部309は、注目画素を中心とした縦7画素×横7画素の49画素を参照画素として選択する。なお、参照画素の数はこれに限定されるものではない。
S905で、文字画素色変換部309は、次の第1乃至第3の条件の全てが満たされるか否かを判定する。第1の条件は、注目画素の分散が第4閾値以下であることである。第2の条件は、S904で選択した参照画素の中に強エッジ判定画素と弱エッジ判定画素がそれぞれ1つ以上あることである。第3の条件は、第2の条件が満たされる場合に、強エッジ判定画素と弱エッジ判定画素の合計数が第5閾値以上であることである。
図8(e)は、図8(b)示される画素のエッジ検出結果の一例を示す図である。エッジ検出結果から、注目画素の周囲の参照画素においてエッジであると判定された画素(エッジ判定画素)の数を求めて、注目画素が濃淡にばらつきのある文字の画素の内側にある画素であるか否かを判定する。図8(e)の例では、強エッジ判定画素が13個、弱エッジ判定画素が9個存在し、よって、エッジ判定画素の合計数は22個である。例えば、第4閾値が80、第5閾値が15の場合は、全ての条件が満たされる。なお、第4閾値は第3閾値以下の値であればよく、前出の値に限られるものではない。また、第5閾値も、前出の値に限られるものではない。
文字画素色変換部309は、第1乃至第3の条件が全て満たされると判定した場合(S905でYES)、S906の処理を実行し、第1乃至第3の条件の少なくとも1つが満たされていないと判定した場合(S905でNO)、S907の処理を実行する。なお、S903の判定が‘YES’となる場合、文字画素色変換部309は、注目画素は濃淡にばらつきのある文字の外側にある画素であると判定したことになる。
S906で文字画素色変換部309は、注目画素を黒色に変換する。例えば、代表色情報306にある色の中で、RGB値の各成分の差が5以内であり、且つ、最も輝度値の小さい色を黒色画素とする。図8(c)の例では(0,0,0)が黒色画素となる。
S907で文字画素色変換部309は、減色画像308内のすべての画素を注目画素として選択したか否かを判定する。文字画素色変換部309は、全ての画素を注目画素として選択したと判定した場合(S907でYES)、本処理を終了させ、全ての画素を注目画素として選択していないと判定した場合(S907でNO)、S901の処理を実行する。図9のフローチャートの処理が終了すると、S606の処理が実行される。
次に、S611で出力される圧縮データ322の構成について説明する。図10は、S611で出力される圧縮データ322の構成例を示す図である。圧縮データ322は、ヘッダ部と、色ごとの圧縮データ部から構成される。
ヘッダ部は、原稿をスキャンして得られる元画像300の大きさ(縦横の画素数)、背景色の値、解像度等の情報を含む。背景色には基本的に画素数が最も多い色が選択される。例えば、赤色のカラー用紙に文字や図形等が描画されている原稿から元画像300が生成されており、背景色が赤であると決定された場合、背景色の値には赤の値が入る。
色ごとの圧縮データ部は、カラー情報とMMR圧縮データで構成される。背景色を除いて残った色数が‘N’であった場合、その色数分だけ同じ構造のデータが存在する。そのため、例えば、元画像300の原稿が白紙等の単色原稿であった場合には、その色の圧縮データ部は作成されない。また、元画像300の原稿が白黒原稿であった場合には、カラー圧縮データ数は‘1’となり、二値画像とほぼ等価になる。黒画素が原稿の一部分のみである場合、MMR圧縮データはその部分のみが圧縮されているため、白黒原稿の元画像全体をMMR圧縮した場合よりもデータサイズが小さくなる。
圧縮データ322の復号は、次の通りに行われる。即ち、先ず、ヘッダ部に格納された背景色で原稿の全領域が描画される。続いて、圧縮データ部に含まれているMMR圧縮データが格納順に伸長され、得られた画像をマスクにして、記憶されている位置と色に従って上書きされる。これにより、復号された画像が得られる。
以上の説明の通り、本実施形態にうよれば、文字判定された画素の色のみを修正することにより、画像情報を漏れなく再現させることが可能になると共に、圧縮効率を向上させることが可能になる。
次に、文字画素色変換部309による第2実施形態に係る文字画素の色変換処理について説明する。図11(a)は、減色処理部307での処理を終えて得られる減色画像1100の一例を示す図である。図11(b)は、減色画像1100内の灰色オブジェクト1101の右上部分を拡大して示す図である。減色画像1100は、灰色オブジェクト1101の右上近傍に灰色オブジェクト1101の色とは異なる色のノイズ画素1102が発生している点で、図3(f)の減色画像308と異なる。ノイズ画素1102は、例えば、原稿のスキャナ部201での読み取り時に原稿又は原稿台に付着した塵埃等が原因となって発生する。
S605の第1実施形態の文字画素の色変換処理では、灰色オブジェクト1101においてノイズ画素1102に近い画素1103は、文字画素ではないにもかかわらず、ノイズ画素1102の近傍の強エッジ画素が参照されることで黒色に変換されてしまう。これにより、本来の原稿の情報が欠落してしまう。
図12は、このような問題を解決するための第2実施形態に係る文字画素の色変換処理のフローチャートである。第2実施形態に係る文字画素色変換処理は、第1実施形態に係る文字画素の色変換処理に代えて用いられる。つまり、元画像300の圧縮データを作成する全体プロセスは図6のフローチャートに示す通りに行われ、S605の処理を説明する図9のフローチャートが図12のフローチャートに置き換わる。よって、S1201~S1208の処理は、CPU205の制御下においてデータ処理部215の文字画素色変換部309によって実行される。
S1201~S1205の処理は、図9のフローチャートのS901~S905の処理と同じであるため、ここでの説明を省略する。説明の便宜上、図11(b)に示される画素1103(灰色オブジェクト1101においてノイズ画素1102に最も近い画素)が注目画素として選択されており、S1205の判定の結果(S1205でYES)、S1206の処理が実行されるものとする。
S1206で、文字画素色変換部309は注目画素を黒文字候補画素に決定する。図11(c)は、注目画素が黒文字候補画素に決定された状態を示す模式図である。なお、黒文字候補画素に決定されない画素を非黒文字候補画素と呼称する。
S1207の処理は、図9のフローチャートのS907の処理と同じであるため、ここでの説明を省略する。文字画素色変換部309は、全ての画素が選択されていないと判定した場合(S1207でNO)、S1201の処理を実行し、全ての画素が選択されたと判定した場合(S1207でYES)、S1208の処理を実行する。
S1208で文字画素色変換部309は、黒文字候補画素の色変換処理を実行する。S1208の処理の詳細については後述する。文字画素色変換部309は、S1208の処理が終了すると本処理を終了させ、これによりデータ処理部215によりS606の処理が実行される。
図13は、S1208の黒文字候補画素色変換処理のフローチャートである。S1301で文字画素色変換部309は、減色画像308内の画素から1つの画素を注目画素として選択する。減色画像308内の注目画素の選択はどのような順序で行ってもよく、本実施形態では画像全体のラスタスキャン順とする。
S1301の開始時には、減色画像308の全ての画素について、黒文字候補画素か否かの判断が終わっている。そこで、S1302で文字画素色変換部309は、注目画素が黒文字候補画素か否かを判定する。文字画素色変換部309は、注目画素が黒文字候補画素であると判定した場合(S1302でYES)、S1303の処理を実行し、注目画素が非黒文字候補画素であると判定した場合(S1302でNO)、S1301の処理を実行する。
S1303で文字画素色変換部309は、注目画素を中心とした縦5画素×横5画素の、注目画素を除く24画素を参照画素として選択する。なお、参照画素の数はこれに限定されるものではない。
S1304で文字画素色変換部309は、S1303で選択した参照画素の中に黒文字候補画素が存在するか否かを判定する。文字画素色変換部309は、参照画素の中に黒文字候補画素が存在すると判定した場合(S1304でYES)、S1305の処理を実行し、参照画素の中に黒文字候補画素は存在しないと判定した場合(S1304でNO)、S1301の処理を実行する。
S1305で文字画素色変換部309は、注目画素を黒色に変換する。変換方法は、S906と同様に行われるため、ここでの説明を省略する。
S1306で文字画素色変換部309は、減色画像308内のすべての画素を注目画素として選択したか否かを判定する。文字画素色変換部309は、全ての画素を注目画素として選択したと判定した場合(S1306でYES)、本処理を終了させ、全ての画素を注目画素として選択していないと判定した場合(S1306でNO)、S1301へ処理を戻す。図13のフローチャートの処理の終了は、図12のフローチャートの処理の終了でもあり、よって、続いてS606の処理が実行される。
上記説明の通り、第2実施形態に係る文字画素の色変換処理を採用することにより、第1実施形態と同じ効果を得ることができ、更に、ノイズ画素がある場合の画素の色の誤変換を抑制することができる。
以上、本発明をその好適な実施形態に基づいて詳述してきたが、本発明はこれら特定の実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の様々な形態も本発明に含まれる。更に、上述した各実施形態は本発明の一実施形態を示すものにすぎず、各実施形態を適宜組み合わせることも可能である。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
101 MFP
201 スキャナ部
215 データ処理部
301 エッジ検出部
303 分散演算部
305 代表色決定部
307 減色処理部
309 文字画素色変換部
317 二値画像生成部
319 二値画像圧縮部

Claims (8)

  1. 原稿をスキャナで読み取ることによって生成された画像から文字画素を検出する検出手段と、
    画像データを圧縮する際に用いる色情報を決定する決定手段と、
    前記検出手段で検出された文字以外の画素の色は変更せず、前記検出手段で検出された文字の画素の色を前記色情報に基づいて修正した色変換画像を生成する色変換手段と、
    前記色変換画像を前記色情報の色ごとの画像に分割する分割手段と、
    前記分割手段により生成された画像ごとに二値画像の圧縮データを生成する圧縮手段と、を有することを特徴とする画像処理装置。
  2. 前記色変換手段は、前記色情報にある色以外の色の文字の画素の色を、前記色情報にある色のうち最も近い色の画素の色に変換することを特徴とする請求項1に記載の画像処理装置。
  3. 前記画像における画素ごとの輝度値の分散を演算する演算手段と、
    前記画像における画素ごとのエッジ情報を検出するエッジ検出手段と、
    前記検出手段は、前記分散と前記エッジ情報とに基づいて前記文字画素を検出することを特徴とする請求項1又は2に記載の画像処理装置。
  4. 前記色変換手段は、前記分散と、前記エッジ情報と、前記色情報の色とに基づいて前記色変換画像を生成することを特徴とする請求項3に記載の画像処理装置。
  5. 前記スキャナにより生成された画像を前記色情報に基づいて減色した減色画像を生成する減色手段を有し、
    前記色変換手段は、前記減色画像から前記色変換画像を生成することを特徴とする請求項1乃至4のいずれか1項に記載の画像処理装置。
  6. 前記色変換手段は、前記減色画像の画素の色を該画素の周囲の画素の情報に基づいて変換することを特徴とする請求項5に記載の画像処理装置。
  7. 画像処理装置の制御方法であって、
    スキャナで原稿を読み取ることによって生成された画像から文字画素を検出するステップと、
    画像データを圧縮する際に用いる色情報を決定するステップと、
    前記検出された文字以外の画素の色は変更せず、前記検出された文字の画素の色を前記色情報に基づいて修正した色変換画像を生成するステップと、
    前記色変換画像を前記色情報の色ごとの画像に分割するステップと、
    前記分割された画像ごとに二値画像の圧縮データを生成するステップと、有することを特徴とする画像処理装置の制御方法。
  8. コンピュータを請求項1乃至6のいずれか1項に記載の画像処理装置の各手段として機能させることを特徴とするプログラム。
JP2022013253A 2022-01-31 2022-01-31 画像処理装置及びその制御方法とプログラム Pending JP2023111408A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2022013253A JP2023111408A (ja) 2022-01-31 2022-01-31 画像処理装置及びその制御方法とプログラム
US18/155,952 US20230245270A1 (en) 2022-01-31 2023-01-18 Image processing apparatus that improves compression efficiency of image data, method of controlling same, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022013253A JP2023111408A (ja) 2022-01-31 2022-01-31 画像処理装置及びその制御方法とプログラム

Publications (1)

Publication Number Publication Date
JP2023111408A true JP2023111408A (ja) 2023-08-10

Family

ID=87432269

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022013253A Pending JP2023111408A (ja) 2022-01-31 2022-01-31 画像処理装置及びその制御方法とプログラム

Country Status (2)

Country Link
US (1) US20230245270A1 (ja)
JP (1) JP2023111408A (ja)

Also Published As

Publication number Publication date
US20230245270A1 (en) 2023-08-03

Similar Documents

Publication Publication Date Title
JP5132517B2 (ja) 画像処理装置および画像処理方法
JP4574457B2 (ja) 画像処理装置およびその方法
US7903872B2 (en) Image-processing apparatus and method, computer program, and storage medium
US8538086B2 (en) Image inspection apparatus, image inspection method, and computer program product
JP4498233B2 (ja) 画像処理装置および画像処理方法
US8395820B2 (en) Image processing apparatus for printing in black coloring material based on attribute information
JP5146085B2 (ja) 画像処理装置およびプログラム
US11706371B2 (en) Apparatus and method for performing enhancement processing on color information
US8971647B2 (en) Image compression apparatus, image compression method, and storage medium
US11736652B2 (en) Image processing apparatus, image processing method, and storage medium
JP2009060474A (ja) 画像処理装置
JP2009071695A (ja) 画像処理装置、画像処理方法、プログラム及び記憶媒体
JP2023111408A (ja) 画像処理装置及びその制御方法とプログラム
JP7134045B2 (ja) 画像処理装置と画像処理方法、及びプログラム
US8830509B2 (en) Image processing apparatus, method, and medium for performing density adjustment
US11405525B2 (en) Image processing apparatus, control method, and product capable of improving compression efficiency by converting close color to background color in a low light reading mode
US20240064262A1 (en) Image processing apparatus capable of generating color-reduced image with high object reproducibility, control method for image processing apparatus, and storage medium
US11924390B2 (en) Apparatus, method, and storage medium for performing color reduction processing
JP7049292B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP7185451B2 (ja) 画像処理装置と画像処理方法、及びプログラム
US10872216B2 (en) Image output device, image output method, and output image data production method
JP2007189275A (ja) 画像処理装置
JP2020096307A (ja) 画像出力装置、画像出力方法および画像出力プログラム