JP2017175213A

JP2017175213A - 原稿種認識装置、画像形成装置、原稿種認識方法およびプログラム

Info

Publication number: JP2017175213A
Application number: JP2016055991A
Authority: JP
Inventors: 大内　敏; Satoshi Ouchi; 敏大内; 卓治鎌田; Takuji Kamata
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 2016-03-18
Filing date: 2016-03-18
Publication date: 2017-09-28
Anticipated expiration: 2036-03-18
Also published as: US20170270359A1; JP6648580B2; US10115011B2

Abstract

【課題】原稿の属性（例えば、文字のみ原稿／新聞原稿／薄い原稿／その他の原稿）を同じ判定方式を用いた簡単な構成で分類する。
【解決手段】入力画像の文字領域と絵柄領域とを分離した各領域を示す信号を出力する像域分離部２１と、前記入力画像の前記絵柄領域における特定の線数以上の網点ドットを除去する平滑化処理を施す平滑化部と、前記平滑化処理を施した前記入力画像における前記文字領域のエッジ部に対してエッジ量に応じたエッジ強調処理を施した画像を出力するエッジ強調部と、前記エッジ強調処理を施した画像にかかるヒストグラムを作成するヒストグラム作成部と、前記ヒストグラムを利用して前記入力画像にかかる原稿種を認識する原稿種認識部５１と、を備える。
【選択図】図１

Description

本発明は、原稿種認識装置、画像形成装置、原稿種認識方法およびプログラムに関する。

従来、ＰＤＦの圧縮率を高め、さらに高画質化を行う技術として、高圧縮ＰＤＦが知られている。高圧縮ＰＤＦは、画像を文字領域と絵柄領域に像域分離し、文字領域と絵柄領域とのそれぞれに適した圧縮処理（ＭＭＲやＪＰＥＧなど）を施すことで、高圧縮を実現する技術が知られている。

また、原稿全体の属性を判定する技術を一般的に原稿種認識技術と言う。高圧縮ＰＤＦ作成時において、原稿種認識技術により原稿種を判定することによって、原稿種に適した処理の切り替え（例えば、二値化処理の閾値、適切な圧縮方法を選択など）を行うことも知られている。

ところで、高圧縮ＰＤＦ作成時において、原稿種認識技術により判定した原稿種に適した処理の切り替えを行うことにより高画質化が期待される原稿の種類としては、次のような原稿種が存在する。
・文字のみ原稿
・新聞原稿
・薄い原稿

特に、昨今の環境意識の高まりから、複写機で画像を再生する際、トナーセーブモードで複写出力するケースが増えている。このようにトナーセーブモードでの出力画像を原稿としてスキャンし高圧縮ＰＤＦ作成を行う際には、原稿は当然「薄い原稿」となる。

しかしながら、従来の原稿種認識技術によれば、原稿種ごとに判定回路が必要になり、処理コストが大きいという問題があった。さらに、従来の原稿種認識技術および圧縮技術によれば、「文字のみ原稿」と「新聞原稿」とには対応しているが、その他の原稿種（例えば、「薄い原稿」）には対応していないという問題があった。

本発明は、上記に鑑みてなされたものであって、原稿の属性（例えば、文字のみ原稿／新聞原稿／薄い原稿／その他の原稿）を同じ判定方式を用いた簡単な構成で分類することを目的とする。

上述した課題を解決し、目的を達成するために、本発明は、入力画像の文字領域と絵柄領域とを分離した各領域を示す信号を出力する像域分離部と、前記入力画像の前記絵柄領域における特定の線数以上の網点ドットを除去する平滑化処理を施す平滑化部と、前記平滑化処理を施した前記入力画像における前記文字領域のエッジ部に対してエッジ量に応じたエッジ強調処理を施した画像を出力するエッジ強調部と、前記エッジ強調処理を施した画像にかかるヒストグラムを作成するヒストグラム作成部と、前記ヒストグラムを利用して前記入力画像にかかる原稿種を認識する原稿種認識部と、を備える。

本発明によれば、入力画像の原稿種認識について注目画素の画素値を複数の閾値で量子化して作成したヒストグラムを利用して行うが、その前処理として絵柄領域における特定の線数以上の網点ドットを除去する平滑化処理と文字領域のエッジ部に対してエッジ量に応じたエッジ強調処理を施すようにしたので、例えば下記の４種類の原稿種を同じ判定方式を用いた簡単な構成で分類することができる、という効果を奏する。
・文字のみ原稿
・新聞原稿
・薄い原稿
・その他の原稿

図１は、第１の実施の形態にかかる画像形成装置の構成を示すブロック図である。図２は、像域分離部の構成を示すブロック図である。図３は、Ｍ×Ｍ画素からなるマトリックスの画素比較方向を示す図である。図４は、Ｎ×Ｎ画素からなるブロックの例を示す図である。図５は、注目ブロックと周囲ブロックの関係を示す図である。図６は、フィルタ処理部の構成を示すブロック図である。図７は、適応エッジ強調回路の構成を示すブロック図である。図８は、ラプラシアンを例示的に示す模式図である。図９は、エッジ量フィルタを例示的に示す模式図である。図１０は、原稿種認識部における原稿種認識処理の流れを概略的に示すフローチャートである。図１１は、ヒストグラムを作成する際に用いる原稿上の判定領域を示す模式図である。図１２は、ヒストグラム作成例を示す図である。図１３は、高圧縮ＰＤＦの処理手順を説明する模式図である。図１４は、画像圧縮部における画像圧縮処理の流れの一例を示すフローチャートである。図１５は、各原稿種のγ補正テーブルの一例を示す図である。図１６は、原稿種に応じて変換される各レイヤの解像度を示す図である。図１７は、第２の実施の形態にかかる像域分離部の構成を示すブロック図である。図１８は、網点検出回路の構成を示すブロック図である。図１９は、原稿種認識部における原稿種認識処理の流れを概略的に示すフローチャートである。図２０は、原稿種認識部により判定される「薄い原稿」のパターン例を示す図である。図２１は、薄い原稿種の各パターンのγ補正テーブルの一例を示す図である。図２２は、薄い原稿種の各パターンに応じて変換される各レイヤの解像度を示す図である。図２３は、画像形成装置のハードウェア構成例を示すブロック図である。

以下に添付図面を参照して、原稿種認識装置、画像形成装置、原稿種認識方法およびプログラムの実施の形態を詳細に説明する。本実施の形態は、原稿種認識装置としてデジタル式のカラー画像形成装置であって、コピー機能、プリンタ機能、スキャナ機能およびファクシミリ機能のうち少なくとも２つの機能を有する複合機を例にとって説明する。

（第１の実施の形態）
図１は、第１の実施の形態にかかる画像形成装置１００の構成を示すブロック図である。初めに、図１を利用して、画像形成装置１００を構成する各ユニットのイン信号とアウト信号を中心に説明し、各ユニットの内部詳細は必要に応じて後述する。

図１に示すように、画像形成装置１００は、スキャナ１と、画像処理装置２と、ＨＤＤ（Hard Disk Drive）３と、プロッタ４と、高圧縮ＰＤＦファイル（高圧縮画像ファイル）を生成する画像圧縮処理装置５と、を備えている。

スキャナ１は、原稿から画像データを読み取る装置である。スキャナ１は、読み取った画像データ（Ａ／Ｄ変換後のｒ，ｇ，ｂの各８ビット信号：反射率リニア）を、画像処理装置２へ送る。

画像処理装置２は、像域分離部２１と、フィルタ処理部２２と、データインタフェース部２３と、色処理／ＵＣＲ部２４と、プリンタ補正部２５と、を備える。

像域分離部２１は、スキャナ１が読み取った画像データ（ｒ，ｇ，ｂ）を用いて、文字領域と絵柄領域の分離を行う。像域分離部２１から出力されるＸ信号は、２ビット信号（文字／非文字領域信号、色／非色領域信号）である。Ｘ信号は、フィルタ処理部２２およびデータインタフェース部２３を経由して、ＨＤＤ３に出力されて保存される。

フィルタ処理部２２は、スキャナ１が読み取った画像データ（ｒ，ｇ，ｂ）に空間フィルタを施す。フィルタ処理部２２で空間フィルタを施された出力（ＲＧＢ信号、ｚ信号）は、データインタフェース部２３を経由して、ＨＤＤ３に出力されて保存される。なお、ｚ信号は、詳細は後述するが、エッジ領域を表す信号である。

加えて、空間フィルタを施されたＲＧＢ信号は、データインタフェース部２３を経由して、色処理／ＵＣＲ部２４に送られる。色処理／ＵＣＲ部２４は、各８ビットのＲＧＢ信号を所定の変換式に基づきプロッタ４の制御信号である画像信号（Ｃ，Ｍ，Ｙ，Ｂｋの各８ビット）に変換して、プリンタ補正部２５へ送る。

プリンタ補正部２５は、Ｃ，Ｍ，Ｙ，Ｂｋの画像信号に対してプロッタ４の階調特性を反映したγ補正処理及び擬似中間調処理を施して、プロッタ４に出力する。

そして、転写印字ユニットであるプロッタ４は、画像処理装置２から出力された画像信号を転写印字する。

次に、画像処理装置２の像域分離部２１について説明する。ここで、図２は像域分離部２１の構成を示すブロック図である。図２に示すように、像域分離部２１は、スキャナ１が読み取ったデータ（Ａ／Ｄ変換後のｒ，ｇ，ｂ：各色８ビット：反射率リニア）に対して、色毎の諧調バランスを揃えるための一次元変換処理（γ補正処理）を施す。

また、像域分離部２１は、文字判定部２１１と、色判定部２１２と、を備えている。γ補正後の濃度リニア信号（ＲＧＢ信号：白を意味する信号値を０とする）は、文字判定部２１１と色判定部２１２へそれぞれ送られる。

文字判定部２１１は、エッジ検出回路２１１１と、白背景検出回路２１１２と、網点検出回路２１１３と、総合判定回路２１１４と、を備えている。

エッジ検出回路２１１１は、γ補正後の濃度リニア信号（Ｇ）に対してエッジ判定（白画素と黒画素の連続性により判定）を行って線画候補のエッジを検出する処理を行い、その結果（以下、「エッジ検出結果」と呼ぶ）を総合判定回路２１１４に出力する。エッジ検出回路２１１１は、例えば、入力画像信号の３値化により得られる黒画素や白画素の連続性、パターンを利用して、文字などの線画と網点とを分離することで、線画候補を構成するエッジを検出する。エッジ検出回路２１１１の出力は１画素１ビットであり、検出されたエッジ領域画素をアクティブとする。

白背景検出回路２１１２は、γ補正後の濃度リニア信号（Ｇ）について、白背景か非白背景かを判定し、その結果を総合判定回路２１１４に出力する。白背景検出回路２１１２は、例えば、入力画像信号を所定の閾値で２値化して白画素と黒画素に切り分けた後、注目画素の左右あるいは上下両方向に白画素が存在する場合に、白背景と判定する。このとき、左右上下の参照領域のサイズを制御することにより、所望の線幅以下の文字エッジ部は白背景として判定し、所望の線幅を超える文字エッジ部は非白背景として判定することができる。白背景検出回路２１１２の出力は、白背景をアクティブとする。

網点検出回路２１１３は、γ補正後の濃度リニア信号（Ｇ）の各画素に対して、網点判定（画像中の山／谷ピーク画素の繰り返しパターンにより判定）し、その結果を総合判定回路２１１４に出力する。

より詳細には、網点検出回路２１１３は、γ補正後の濃度リニア信号（Ｇ）の各画素に対して、予め定めたＭ×Ｍ画素からなるマトリックス、例えば、図３（ａ）〜（ｃ）に示す如き３×３画素サイズのマトリックス（Ｍ＝３）、４×４画素サイズのマトリックス（Ｍ＝４）あるいは５×５画素サイズのマトリックス（Ｍ＝５）を順次適用し、当該マトリックスの中心画素ｍ_０（図３（ａ）〜（ｃ）参照）が濃度変化の山または谷を示す極点であるか否かを周囲の画素ｍ_１〜ｍ_ｉとの濃度関係から検出する。加えて、網点検出回路２１１３は、Ｎ×Ｎ画素（但し、Ｎ＞Ｍ）からなるブロックＢ、例えば図４に示すような９×９画素サイズ（Ｎ＝９）からなるブロックＢを単位として画像を分割する。

そして、網点検出回路２１１３は、ブロックごとに山を示す極点画素数と谷を示す極点画素数とをそれぞれ計数し、計数値の大きい側の極点画素数を当該ブロックの極点画素数として決定する。その後、網点検出回路２１１３は、図５に示す注目ブロックＢ_０の極点画素数Ｐ_０と、これを囲む上下左右斜めの各周囲ブロックＢ_１〜Ｂ_８の各極点画素数Ｐとの関係から当該注目ブロックＢ_０の中心画素ｎ_０（図４参照）、あるいは当該注目ブロックＢ_０内の全ての画素ｎ_０〜ｎ_８０が網点領域に属するか否かを判定する。網点検出回路２１１３の出力は、網点領域をアクティブとする。

総合判定回路２１１４は、注目画素がエッジ検出回路２１１１でアクティブ、白背景検出回路２１１２でアクティブ、網点検出回路２１１３でノンアクティブの場合に、注目画素を文字領域とする判定結果Ｘ_ｍｏｊｉ（文字／非文字［絵柄］）をＸ信号として出力する。

色判定部２１２は、色判定回路２１２１を備えている。色判定回路２１２１は、γ補正後の濃度リニア信号（Ｒ，Ｇ，Ｂ）について、注目の画素ブロック（４×４画素）が、有彩色ブロックであるか、無彩色ブロックであるかを判定する。

より詳細には、色判定回路２１２１は、例えば、Ｍａｘ（｜Ｒ−Ｇ｜，｜Ｇ−Ｂ｜，｜Ｂ−Ｒ｜）＞ｔｈ（ｔｈは所定の閾値）に該当する画素を有彩画素として検出し、４×４画素からなるブロック毎に有彩画素が１つでも存在すればアクティブブロックとする判定結果Ｘ_ｉｒｏ（有彩色／無彩色）をＸ信号として出力する。

次に、画像処理装置２のフィルタ処理部２２について説明する。ここで、図６はフィルタ処理部２２の構成を示すブロック図である。図６に示すように、フィルタ処理部２２は、平滑化部である平滑化回路２２１と、γテーブル変換回路２２２と、エッジ強調部である適応エッジ強調回路２２３と、を備えている。フィルタ処理部２２は、画像の絵柄領域に対して、特に網点を意識して平滑化処理を施す。その一方で、フィルタ処理部２２は、画像のエッジ部に対して、特に文字エッジを意識してエッジ強調処理を施す。

平滑化回路２２１は、スキャナ１が読み取った画像データ（ｒ，ｇ，ｂ：反射率リニア）に対し、ある特定の線数以上の網点ドットを除去するような空間フィルタ処理を施す。より詳細には、平滑化回路２２１は、スキャナ１が読み取った画像データに平滑化を施す。この平滑化フィルタは、カットオフ周波数１００線付近で、１００線（３.９ｌｐｓ／ｍｍ）を超える網点の周波数をほぼ除去し、それ以下の周波数はほぼ完全に残すような特性を有するフィルタである。これにより、網点原稿のモアレ発生を防ぎ、さらに写真原稿のノイズ低減が可能となる。

γテーブル変換回路２２２は、反射率リニアの信号を濃度リニアに変換する一次元変換処理（γ補正処理）を行う。

適応エッジ強調回路２２３は、画像全体にエッジ強調をかけるのではなく、画像のエッジ部のみを立てるようなエッジ強調処理を施す。画像全体にエッジ強調をかけないのは、平滑化回路２２１で除去した網点ドットが復活してしまうためである。

フィルタ処理部２２は、平滑化処理とエッジ強調処理とで信号の属性を変えることにより、網点ドットを効率良く除去しつつ、文字領域を細くすっきりと再生させることができる。

ここで、図７は適応エッジ強調回路２２３の構成を示すブロック図である。図７に示すように、適応エッジ強調回路２２３は、濃度リニアの平滑化画像信号について、ラプラシアン（エッジ強調フィルタ）２２３１によりエッジを抽出する。図８は、ラプラシアン２２３１を例示的に示す模式図である。ラプラシアン２２３１は、注目画素を４倍し、４隣接画素との差分をとってエッジを抽出する。このように、濃度リニアの信号に基づいてエッジ抽出を行うことは、網点上の文字および色地上の文字を細く、鮮明に再生するために有効である。

ラプラシアン２２３１は、エッジとして検出された領域について、空間周波数上の全域にわたってｐｏｗｅｒを持つような特性のフィルタを掛けることにより、高画質な網点上の文字画像を得る。

また、適応エッジ強調回路２２３は、スキャナ１が読み取った入力画像信号（ｒ，ｇ，ｂ：反射率リニア）について、エッジ量フィルタ２２３２によりエッジ量を算出する。図９は、エッジ量フィルタ２２３２を例示的に示す模式図である。図９に示すエッジ量フィルタ２２３２は、注目画素とその周辺画素に一次微分フィルタをかける例である。すなわち、入力画像データＩのｘ方向の一次微分の絶対値、ｙ方向の一次微分の絶対値をとり、その最大をエッジ量とするもので、ｆは最大値１に規格化する関数である。

なお、エッジ量フィルタ２２３２とラプラシアン２２３１の空間周波数上での相違は、高域において、エッジ量フィルタ２２３２のｐｏｗｅｒはラプラシアン２２３１のｐｏｗｅｒよりも小さいことである。これは、網点上の文字において、網点はできるだけエッジとして検出せずに、網点上文字エッジのエッジ量を大きくするためである。従って、網点は平滑化され、なお且つ高域でのエッジ量はほとんど０になる。

適応エッジ強調回路２２３は、ラプラシアン２２３１の出力とエッジ量フィルタ２２３２の出力を乗算するとともに、注目画素と乗算された値とを加算器で加算して、注目画素をエッジ強調する。

また、適応エッジ強調回路２２３は、エッジ量フィルタ２２３２の出力値を適当な閾値で二値化し、エッジ領域を表す信号（ｚ）を、後段の原稿種認識部５１でヒストグラムを生成する際に利用するため、ＲＧＢ信号やＸ信号と共にデータインタフェース部２３に送る。

以上により、適応エッジ強調回路２２３は、網点上の文字や色地上の文字にコントラストをつけ、さらに絵柄（網点、写真）中のエッジを強調して、めりはりのある画像を得るための処理を施す。反対に、適応エッジ強調回路２２３は、それ以外の網点領域に対しては、エッジ強調を行わず、ざらつきなく、滑らかな画像再生を可能にする。

すなわち、フィルタ処理部２２は、網点を平滑化し、網点をエッジとして検出しないのでエッジ強調せず、また、文字の周りの網点を平滑化して文字エッジを強調するので、めりはりのある画像を得ることができる。

続いて、画像圧縮処理装置５について説明する。図１に示すように、画像圧縮処理装置５は、原稿種認識部５１と、画像圧縮部５２と、を備えている。

まず、原稿種認識部５１について説明する。

原稿種認識部５１は、画像圧縮部５２における画像圧縮に先立ち、フィルタ処理部２２で空間フィルタを施された出力（ＲＧＢ信号、ｚ信号）にかかる注目原稿の画素値のヒストグラムを利用して、該原稿を下記の４種の内のいずれかであるかを判定する。加えて、原稿種認識部５１は、白抜き文字が新聞原稿内に存在する可能性が有るか無いかを判定する。なお、白抜き文字が存在する可能性が有るか無いかについては、新聞原稿に限るものではなく、トナーセーブモードでの出力画像である薄い原稿、絵柄などの画像であるその他の原稿についても判定するようにしても良い。
・文字のみ原稿
・新聞原稿（白抜き文字有り）
・新聞原稿（白抜き文字無し）
・薄い原稿
・その他の原稿

ここで、図１０は原稿種認識部５１における原稿種認識処理の流れを概略的に示すフローチャートである。

図１０に示すように、原稿種認識部５１は、まず、原稿種認識にかかる原稿上の判定領域の特定を行う（ステップＳ１）。より詳細には、原稿種認識部５１は、後段のステップＳ２において一画面のヒストグラムを作成する際に用いる原稿上の判定領域を特定する。原稿上においてヒストグラム作成に用いない領域は二つある。ここで、図１１はヒストグラムを作成する際に用いる原稿上の判定領域を示す模式図である。図１１に示すように、第１には、原稿における上下左右の端部からそれぞれ１０％の領域である。第２には、エッジ領域を表すｚ信号がアクティブな画素、すなわち原稿における画像のエッジ部を除外する。前者は、原稿の影などの入り込みを排除し、後者は、文字と背景部の中間画素の入り込みを排除するものである。原稿の影や文字と背景部の中間画素は、絵柄でないにも係わらず絵柄と誤判定される種となりうるので、予め判定領域から排除するようにしたものである。

続いて、原稿種認識部５１は、注目画素の画素値を複数の閾値で量子化した後、ヒストグラムを作成する（ステップＳ２）。すなわち、原稿種認識部５１は、ヒストグラム作成部としても機能する。ここで、図１２はヒストグラム作成例を示す図である。図１２に示すように、原稿種認識部５１は、フィルタ処理部２２で空間フィルタを施された出力（ＲＧＢ信号、ｚ信号）にかかる原稿上の判定領域において濃度毎に画素数をカウントしてヒストグラムを作成し、作成したヒストグラムからピーク値を決定する。なお、原稿種認識部５１は、図１２に示すように、実験などにより決定する４つの閾値（閾値１〜閾値４）で濃度を下記に示すように５値化して分類する。
１.真の黒色
２.黒色
３.中間色
４.新聞地色（灰色）
５.白色

ここで、各閾値を決める方法を以下に示す。
［１．真の黒色と２．黒色の閾値]
・「１．真の黒色」を規定する閾値１は、新聞の文字色よりも低くする。［新聞原稿判定に影響］
［２．黒色と３．中間色の閾値］
・新聞の文字色が、「２．黒色」に分類されるようにする。［新聞原稿判定に影響］
・文字のみ原稿の文字色（特に黒文字）が、「２．黒色」に分類されるようにする。［文字のみ原稿に影響］
・薄い原稿の黒文字が、「３．中間色」に分類されるようにする。［薄い原稿判定に影響］
［３．中間色と４．新聞地色の閾値］
・新聞地色が、「４．新聞地色」に分類されるようにする。［新聞原稿判定に影響］
［４．新聞地色と５．白色の閾値］
・白地が、「５．白色」に分類されるようにする。［文字のみ原稿判定に影響］
・白抜き文字が、「５．白色」に分類されるようにする。［白抜き文字判定に影響］

続いて、原稿種認識部５１は、白抜き文字の有無の判定を行う（ステップＳ３）。文字領域において、白抜き文字は、黒文字よりも太く、かつ、上述の判定領域の特定（ステップＳ１）において画像のエッジ部を除かれることにより、「５：白色」にカウントされることになる。そこで、原稿種認識部５１は、この性質を利用して、文字領域において「５：白色」にカウントされる場合、白抜き文字有りと判定する（ステップＳ３のＹｅｓ）。

一方、原稿種認識部５１は、白抜き文字無しと判定した場合（ステップＳ３のＮｏ）、白抜き文字（もしくは白地）が無いという情報を一時的に記憶し、新聞原稿、薄い原稿、その他の原稿の白抜き文字検出時に利用する（ステップＳ４）。

続いて、原稿種認識部５１は、原稿が薄い原稿であるか否かの判定を行う（ステップＳ５）。薄い原稿は、「３．中間色」〜「５．白色」が多くを占め、「１．真の黒色」と「２．黒色」が少ない。そこで、原稿種認識部５１は、この性質を利用して、各カウント値に対して閾値判定する。原稿種認識部５１は、薄い原稿であると判定した場合（ステップＳ５のＹｅｓ）、ステップＳ６に進み、原稿の種別を「薄い原稿」とする。

続いて、薄い原稿でないと判定した場合（ステップＳ５のＮｏ）、原稿種認識部５１は、原稿が新聞原稿であるか否かの判定を行う（ステップＳ７）。新聞原稿は、「４．新聞地色」が多くを占め、「１．真の黒色」と「３．中間色」が少ない。そこで、原稿種認識部５１は、この性質を利用して、各カウント値に対して閾値判定する。原稿種認識部５１は、新聞原稿であると判定した場合（ステップＳ７のＹｅｓ）、ステップＳ８に進み、原稿の種別を「新聞原稿」とする。

続いて、新聞原稿でないと判定した場合（ステップＳ７のＮｏ）、原稿種認識部５１は、原稿が文字のみ原稿であるか否かの判定を行う（ステップＳ９）。文字のみ原稿は、「１．真の黒色」、「２．黒色」、「５．白色」が多くを占め、「３．中間色」、「４．新聞地色」が少ない。そこで、原稿種認識部５１は、この性質を利用して、各カウント値に対して閾値判定する。原稿種認識部５１は、文字のみ原稿であると判定した場合（ステップＳ９のＹｅｓ）、ステップＳ１０に進み、原稿の種別を「文字のみ原稿」とする。

一方、文字のみ原稿でないと判定した場合（ステップＳ９のＮｏ）、原稿種認識部５１は、ステップＳ１１に進み、原稿の種別を「その他の原稿」とする。すなわち、原稿種認識部５１は、薄い原稿でもなく新聞原稿でもなく文字のみ原稿でもないと判定された原稿をその他の原稿と判定する。

次に、画像圧縮部５２について説明する。画像圧縮部５２は、高圧縮ＰＤＦ生成装置である。

画像圧縮部５２は、ＨＤＤ３へ一時保存された像域分離部２１からの判定結果Ｘ_ｍｏｊｉ（文字／非文字［絵柄］）および判定結果Ｘ_ｉｒｏ（有彩色／無彩色）と、γ補正後の濃度リニア信号（ＲＧＢ信号）とを受けて、高圧縮ＰＤＦ用のデータを作成する。

次に、原稿種認識部５１における原稿種認識結果を受けた画像圧縮部５２における高圧縮ＰＤＦファイル作成の説明をする。

まず、高圧縮ＰＤＦの概要を説明する。

高圧縮ＰＤＦは、文字などの線画を含む画像から高圧縮ＰＤＦファイルを生成する画像圧縮技術である。ここで線画とは、文字および文字と同様に扱うことが望ましい線で表現されるオブジェクトを指す。線で表現されるオブジェクトであっても、絵柄として扱うことが望ましいオブジェクトは、線画ではなく絵柄に含まれるものとする。絵柄は、線画以外のオブジェクト、つまり、写真などの網点で表現されるオブジェクトや、文字と同様に扱うことが望ましくない図形などのオブジェクトである。

図１３は、高圧縮ＰＤＦの処理手順を説明する模式図である。高圧縮ＰＤＦファイルを生成するには、まず、処理対象となる画像（以下、「入力画像」と呼ぶ）Ｉｍ０から、黒文字の線画のみからなる２値画像である第１の画像レイヤ（黒文字レイヤ）Ｉｍ１と、色文字の線画のみからなる２値画像である第２の画像レイヤ（色文字レイヤ）Ｉｍ２と、線画の文字色（前景）を表現する多値画像である第３の画像レイヤ（前景レイヤ）Ｉｍ３と、線画以外の絵柄（背景）を表現する多値画像である第４の画像レイヤ（背景レイヤ）Ｉｍ４と、を生成する。そして、第１の画像レイヤＩｍ１および第２の画像レイヤＩｍ２に対しては、線画の圧縮に適した圧縮処理を施し、第３の画像レイヤＩｍ３および第４の画像レイヤＩｍ４に対しては、前景（文字色）や背景の圧縮に適した圧縮処理を施す。その後、圧縮処理が施された第１の画像レイヤＩｍ１と、圧縮処理が施された第２の画像レイヤＩｍ２と、圧縮処理が施された第３の画像レイヤＩｍ３と、圧縮処理が施された第４の画像レイヤＩｍ４とを、例えばＰＤＦ形式の１つの画像ファイル上で統合することにより、入力画像Ｉｍ０に対応する高圧縮ＰＤＦファイルＦＩｍを生成する。

第１の画像レイヤＩｍ１および第２の画像レイヤＩｍ２に対して施される圧縮処理は、例えば、２値画像に対するＭＭＲなどの符号化方式による圧縮処理である。第３の画像レイヤＩｍ３および第４の画像レイヤＩｍ４に対して施される圧縮処理は、例えば、多値画像に対するＪＰＥＧなどの符号化方式による圧縮処理である。第１の画像レイヤＩｍ１に対する圧縮処理と第２の画像レイヤＩｍ２に対する圧縮処理は、線画の圧縮に適した圧縮処理である点で共通するため、以下ではこれらの処理を総称して「第１の圧縮処理」と呼ぶ。一方、第３の画像レイヤＩｍ３および第４の画像レイヤＩｍ４に対する圧縮処理は、絵柄や背景の圧縮に適した圧縮処理であるため、以下では、線画の圧縮に適した第１の圧縮処理と区別して、「第２の圧縮処理」と呼ぶ。なお、上述の符号化方式は一例であり、上述の例とは異なる符号化方式による圧縮処理を行ってもよい。

高圧縮ＰＤＦでは、以上のように、処理対象の入力画像Ｉｍ０を線画の領域とそれ以外の絵柄や背景の領域とに分離し、線画の領域に対しては第１の圧縮処理を施すとともに、線画以外の絵柄や背景の領域に対しては第２の圧縮処理を施すことで、圧縮の効率を高めている。ここで、圧縮の効率とは、画像を再現したときの画質（再現性）をあまり損なわずに、どれだけ圧縮率を高めることができたかどうかを表し、再現性を維持しながら高い圧縮率が得られれば、効率のよい圧縮が行われたことになる。

上述の高圧縮ＰＤＦは様々な変形が可能である。

次に、画像圧縮部５２における画像圧縮処理について説明する。

ここで、図１４は画像圧縮部５２における画像圧縮処理の流れの一例を示すフローチャートである。図１４に示すように、まず、画像圧縮部５２は、原稿種のパターンに応じたγ補正パラメータで原稿（入力画像）に対してγ補正を実施する（ステップＳ３１）。

ここで、原稿種のパターンとγ補正の関係について説明する。γ補正によって背景色が濃くなる順は、下記の順序である。
薄い原稿＞その他の原稿＞＝白抜き文字有り新聞原稿＝白抜き文字無し新聞原稿＞文字のみ原稿

ここで、図１５は各原稿種のγ補正パラメータを規定するγ補正テーブルの一例を示す図である。

１．文字のみ原稿
文字のみ原稿は、白地上に低輝度色の文字のみがあることを想定している。そのため、文字のみ原稿の場合、背景を薄くし文字を濃くするγ補正テーブル（図１５（ｄ）参照）を使うようにする。これにより、可読性の向上を図ることができる。
２．白抜き文字無し新聞原稿
白抜き文字無し新聞原稿は、新聞の地は高輝度色、文字は低輝度色であることが予測できる。そのため、白抜き文字無し新聞原稿の場合は、背景を薄くし文字を濃くするγ補正テーブル（図１５（ｃ）参照）を使うようにする。これにより、可読性の向上を図ることができる。ただし、文字のみ原稿よりは、緩めのγ補正テーブルを使う。また、地肌除去をユーザが指定している場合は、新聞の背景を白化し、文字のみを残しても良い。これにより、ＰＤＦファイルをプリントする際のトナー削減を実現し、環境配慮を図ることができる。
３．白抜き文字有り新聞原稿
白抜き文字有り新聞原稿の場合は、白抜き文字らしい文字は白化するγ補正テーブルを使うようにする。これにより、白抜き文字の可読性の向上を図ることができる。ただし、文字のみ原稿よりは、緩めのγ補正テーブルを使う。

４．薄い原稿
薄い原稿の場合は、背景と文字の両方を濃くするγ補正テーブル（図１５（ａ）参照）を使うようにする。これにより、見栄えを良くすることができる。このとき、その他の原稿よりも濃くすることを特徴とする。

５．その他の原稿
その他の原稿の場合は、低輝度をより暗く、高輝度をより明るくするγ補正テーブル（図１５（ｂ）参照）を使うようにする。これにより、背景と文字の階調差を出し、見栄えを良くすることができる。ただし、階調性が損なわれるのを防ぐため、緩やかなγ補正テーブルを使う。

次いで、画像圧縮部５２は、γ補正を実施した後、線画データを利用して、第１の画像レイヤ、第２の画像レイヤ、第３の画像レイヤ、第４の画像レイヤを生成する（ステップＳ３２）。

ここで、原稿種のパターンと解像度の関係について説明する。図１６は、原稿種に応じて変換される各レイヤの解像度を示す図である。図１６に示すように、文字のみ原稿や新聞原稿は、背景の画像レイヤ（第４の画像レイヤ）の圧縮を高くする。文字のみ原稿や新聞原稿は、絵柄が含まれている可能性が低く、文字の抽出精度が高いため、背景の圧縮を高くしても画質への影響は少ないことを利用したものである。

なお、原稿種に応じて解像度を切り替えるのではなく、原稿種に応じてＪＰＥＧなどのＱＦ（Quality Factor：品質係数）を変えて、小ファイルサイズ化を実現しても良い。

次いで、画像圧縮部５２は、第１の画像レイヤおよび第２の画像レイヤについてＭＭＲやＪＢＩＧ２などの可逆圧縮を実施して出力する（ステップＳ３３，Ｓ３４）。また、画像圧縮部５２は、第３の画像レイヤと第４の画像レイヤについてＪＰＥＧやＪＰＥＧ２０００など非可逆圧縮を実施して出力する（ステップＳ３５，Ｓ３６）。

このように本実施の形態によれば、入力画像の原稿種認識について注目画素の画素値を複数の閾値で量子化して作成したヒストグラムを利用して行うが、その前処理として絵柄領域における特定の線数以上の網点ドットを除去する平滑化処理と文字領域のエッジ部に対してエッジ量に応じたエッジ強調処理を施すようにしたので、少なくとも下記の４種類の原稿種を同じ判定方式を用いた簡単な構成で分類することができる。
・文字のみ原稿
・新聞原稿
・薄い原稿
・その他の原稿

また、本実施の形態によれば、認識された原稿種に応じ、高圧縮画像ファイルを生成する圧縮処理にかかる圧縮方式を制御するので、高画質・高圧縮・高速な圧縮を実現することができる。

なお、本実施の形態においては、原稿種認識の結果に基づいて高圧縮ＰＤＦファイル作成時の処理を制御するような例を示した。しかしながら、これに限るものではなく、スキャナ１によりコピー画像を得る際にも、原稿種認識部５１を作動し、その結果を使って画像処理装置２の後段側の色処理／ＵＣＲ部２４やプリンタ補正部２５を制御してもなんら構わない。一例を挙げれば、薄い原稿と判断された時には、プリンタ補正部２５において、画像が濃く再生される（所謂立った）γ補正処理を施せば良い。これにより、プリンタ出力の際にも画像の高画質化が期待できる。

（第２の実施の形態）
次に、第２の実施の形態について説明する。なお、前述した第１の実施の形態と同じ部分は同じ符号で示し説明も省略する。

第１の実施の形態では、平滑化回路２２１において局所的な平滑化フィルタを用いて網点を除去した。しかしながら、平滑化処理を局所的に行う以上、荒い網点線数など除去しきれないものは存在する。網点は元来二値的な構造をしており、これが完全に除去されないと、ヒストグラムにおける中間値を持つ画素が少なくなり、網点絵柄部分であっても文字領域と判断される可能性が高くなる。

そこで、第２の実施の形態では、文字のみ原稿の判定精度を高めるべく、網点絵柄、特に中間部の特徴に注目する。そして、第２の実施の形態では、確実に網点絵柄が存在する場合には、ヒストグラムの結果によらず、文字のみ原稿とは判定されないようにした点で、第１の実施の形態とは異なるものとなっている。

図１７は、第２の実施の形態にかかる像域分離部３１の構成を示すブロック図である。図１７に示す本実施の形態の像域分離部３１は、スキャナ１が読み取ったデータ（Ａ／Ｄ変換後のｒ，ｇ，ｂ：各色８ビット：反射率リニア）に対して、領域の分離を行う。像域分離部３１からの出力Ｘは、３ビット信号であり、文字／非文字領域信号、色／非色領域信号、原稿種認識用網点／非網点領域信号である。

像域分離部３１の網点検出回路３１１３は、第１の実施形態で説明した総合判定回路２１１４への出力（網点分離結果１）に加えて、原稿種認識に反映するための網点分離結果２である判定結果Ｘ_ａｍｉをフィルタ処理部２２に出力する。網点分離結果１は、網点全域、つまり網点ドットでできている領域の検出を目的としたものである。一方、網点分離結果２は、網点文字に少なく網点絵柄に多い網点率５０％付近の網点領域の検出を目的としたものである。

ここで、網点検出回路３１１３について詳述する。図１８は網点検出回路３１１３の構成を示すブロック図である。図１８に示すように、網点検出回路３１１３は、山ピーク検出回路３１１と、谷ピーク検出回路３１２と、総合判定回路３１３と、補正判定回路３１４と、を備えている。

まず、網点分離結果１の出力について説明する。

図１８に示すように、山ピーク検出回路３１１および谷ピーク検出回路３１２は、γ補正後の濃度リニアのＧ信号から、図３（ａ）〜（ｃ）に示す如き３×３画素サイズのマトリックス（Ｍ＝３）、４×４画素サイズのマトリックス（Ｍ＝４）あるいは５×５画素サイズのマトリックス（Ｍ＝５）を順次適用し、当該マトリックスの中心画素ｍ_０（図３（ａ）〜（ｃ）参照）が濃度変化の山または谷を示す極点（山ピーク画素、谷ピーク画素）であるか否かを周囲の画素ｍ_１〜ｍ_ｉとの濃度関係から検出する。この時の検出に用いる閾値をΔｍｔｈ１とする。

次に、総合判定回路３１３は、Ｎ×Ｎ画素（但し、Ｎ＞Ｍ）からなるブロックＢ、例えば図４に示すような９×９画素サイズ（Ｎ＝９）からなるブロックＢを単位として画像を分割する。

そして、総合判定回路３１３は、ブロックごとに山を示す極点画素数（山ピーク画素数）と谷を示す極点画素数（谷ピーク画素数）とをそれぞれ計数し、計数値の大きい側の極点画素数を当該ブロックの極点画素数として決定する。その後、網点検出回路２１１３は、図５に示す注目ブロックＢ_０の極点画素数Ｐ_０と、これを囲む上下左右斜めの各周囲ブロックＢ_１〜Ｂ_８の各極点画素数Ｐとの関係から当該注目ブロックＢ_０の中心画素ｎ_０（図４参照）、あるいは当該注目ブロックＢ_０内の全ての画素ｎ_０〜ｎ_８０が網点領域に属するか否かを判定する。すなわち、補正判定回路３１４は、注目ブロックと周囲ブロックの各ブロック内の極点数に基づき、注目ブロックが網点ブロックか否かを判定し、網点分離結果１を出力する。

次に、網点分離結果２の出力について説明する。

ここで、網点文字（文字のみ原稿と判定される原稿に含まれていても可）と網点絵柄の特徴について述べる。
［１．網点文字］
・二次元的な広がりは小さい（文字なので一般的に細い）。
・中間濃度が含まれる可能性は低い（山ピーク画素、谷ピーク画素が局所的に同時に含まれる可能性は低い）。
［２．網点絵柄］
・二次元的な広がりを持つ（絵なので一般的に面積が広い）。
・中間濃度が含まれる可能性が高い。

本実施の形態では、上記のような網点文字および網点絵柄の特徴に基づき、網点絵柄の一部である網点ブロックを検出する処理の例について説明する。なお、本実施の形態においては、チェッカー状（網点率５０％）の網点文字は少ないと思われ、仮にあっても、文字であれば面積は広くないはずである、と言う思想に基づいている。

網点分離結果２を得る場合には、山ピーク検出回路３１１および谷ピーク検出回路３１２は、濃度変化の山または谷を示す極点（山ピーク画素、谷ピーク画素）の検出に用いる閾値をΔｍｔｈ２（Δｍｔｈ２＞Δｍｔｈ１）に切り替える。このように閾値を変更するのは、中間濃度付近の網点は山の高さ及び谷の深さがそれぞれハイライト部及びダーク部に比べ大きいため、中間濃度付近の網点を限定するためである。

中間濃度付近の網点は、山ピーク及び谷ピークの数が概ね等しくなる。そこで、網点分離結果２を得る場合、総合判定回路３１３は、山ピーク数と谷ピーク数の差がこの条件を満たす場合のみ従来の極点算出を行い、満たさない場合には極点数を「０」として出力すれば良い。

あるいは、網点分離結果２を得る場合、総合判定回路３１３は、注目ブロック（８×８画素）のＧ信号の平均値を求め、平均値がある範囲に入った時が、注目ブロックを中間濃度ブロックとして判断し、その場合のみ従来の極点算出を行い、満たさない場合には極点数を「０」として出力すれば良い。

網点絵柄は、網点文字に比べ広い領域で存在する。そこで、網点分離結果２を得る場合、補正判定回路３１４は、利用する閾値を従来の網点分離結果１の時の閾値より大きなものに切り替える。

次に、本実施の形態の画像圧縮処理装置５の原稿種認識部５１における処理について説明する。ここで、図１９は原稿種認識部５１における原稿種認識処理の流れを概略的に示すフローチャートである。

原稿種認識部５１は、ヒストグラム作成後（ステップＳ２）、網点ブロックを計数する（ステップＳ２０）。より詳細には、ステップＳ２０において、原稿種認識部５１は、判定結果Ｘ_ａｍｉのアクティブブロック数を計数する。

そして、原稿種認識部５１は、ステップＳ９における原稿が文字のみ原稿であるか否かの判定の際に、その計数値が所定の数以上の場合には、文字のみ原稿ではないと判断すれば良い。

すなわち、図１９のフローチャートに示すように、薄い原稿でなく（ステップＳ５のＮｏ）、新聞原稿でない時に（ステップＳ７のＮｏ）、網点の中間濃度部が含まれているならば、文字のみ原稿ではないとして（ステップＳ９のＮｏ）、その他の原稿と判定することになる（ステップＳ１１）。

このように本実施の形態によれば、入力画像に所定の数以上の網点絵柄領域が含まれている場合には、ヒストグラムを利用した認識結果にかかわらず、絵柄を含む原稿種として認識する。これにより、さらに高精度に、「文字のみ原稿」を他の原稿から分類することができる。「文字のみ原稿」の判定については、平滑化処理で潰しきれない大きなサイズの網点が文字に似ているため、網点絵柄があっても文字のみ原稿と判定されることもあったが、網点絵柄領域を積極的に判断するので、「文字のみ原稿」の判定精度を上げることができる。

（第３の実施の形態）
次に、第３の実施の形態について説明する。なお、前述した第１の実施の形態または第２の実施の形態と同じ部分は同じ符号で示し説明も省略する。

第３の実施の形態では、「薄い原稿」について更にパターン分類し、パターン毎に圧縮方式を制御するようにしたものである。

図２０は、第３の実施の形態にかかる原稿種認識部５１により判定される「薄い原稿」のパターン例を示す図である。図２０に示すように、原稿種認識部５１は、薄い原稿に対して、さらに以下のようなパターンに分類する。
薄い原稿（ａ）：色地（３．中間色、４．新聞地色）が大部分を占め、白抜き文字が無い（５．白色が閾値以下）
薄い原稿（ｂ）：色地（３．中間色、４．新聞地色）が大部分を占め、白抜き文字が有る（５．白色が閾値以上）
薄い原稿（ｃ）：色地か白地か判断できない、もしくは、絵柄などにより色数が多い
薄い原稿（ｄ）：白地（５．白色）が大部分を占め、色数が２色（灰＋その他の色）
薄い原稿（ｅ）：白地が大部分を占め、白以外の色数が１色のみ
薄い原稿（ｆ）：白紙原稿もしくは、ほぼ白紙原稿（少し文字があるなど）

原稿種認識部５１は、薄い原稿について、パターンに応じて２値化の方式、閾値を切り替える。ここで、動的閾値２値化は、周囲画素の平均階調値の差が閾値以上であれば、線画候補画素として分離する手法を例にして説明する。

薄い原稿（ａ），（ｂ）の場合は、背景と線画に階調差が無いことが予想できる。そのため、薄い原稿（ａ），（ｂ）の場合、原稿種認識部５１は、かなり低い閾値の動的閾値２値化を使う。より詳細には、凹凸があれば、なるべく拾う閾値である。

薄い原稿（ｃ）の場合は、背景と線画に階調差が少しはあることが予想できる。そのため、薄い原稿（ｃ）の場合、原稿種認識部５１は、低い閾値の動的閾値２値化を使う。

薄い原稿（ｄ），（ｅ）の場合は、背景と線画に階調差がかなりあることが予想できる。そのため、薄い原稿（ｄ），（ｅ）の場合、原稿種認識部５１は、ヒストグラムの谷を使うような閾値の固定閾値２値化を使う。加えて、薄い原稿（ｄ），（ｅ）は、薄い原稿（ｃ）と区別のために、色数を見る必要がある。したがって、原稿種認識部５１は、線画ごとの色を判定するため、原稿全体の色数をカウントすることで、薄い原稿（ｄ），（ｅ）の判定が可能になる。もちろん、薄い原稿（ｄ）の場合、色ごとに原稿全体で線画色を２色で統一しても良い。また、薄い原稿（ｅ）の場合は、原稿全体で線画色を１色にしても良い。

薄い原稿（ｆ）の場合は、背景と線画に階調差がかなりあることが予想できるが、ヒストグラムの谷が無い可能性がある。そのため、薄い原稿（ｆ）の場合、原稿種認識部５１は、白以外と判定できるような閾値の固定閾値２値化を使う。

次に、画像圧縮部５２における「薄い原稿」のパターン例に対する圧縮処理について説明する。

画像圧縮部５２は、原稿に対してγ補正を実施する。画像圧縮部５２は、薄い原稿種のパターンによってγ補正パラメータを切り替える。以下において、薄い原稿種のパターンによるγ補正の狙いについて説明する。

ここで、図２１は薄い原稿種の各パターンのγ補正パラメータを規定するγ補正テーブルの一例を示す図である。

［薄い原稿（ａ），（ｂ）］
白色が原稿に少ないため、図２１のγ補正テーブル３を使うと、ファイルサイズが増える。よって、γ補正テーブル２を使う。γ補正テーブル２，３，４は、全体的に暗くする。数字が増えるにつれて暗くなる。
［薄い原稿（ｃ）］
白色の領域がかなり多いため、図２１のγ補正テーブル３を使っても、ファイルサイズがあまり増えない。よって、γ補正テーブル３を使う。また、白色領域の画素数によって、薄い原稿（ａ），（ｂ），（ｃ）のγ補正テーブルを計算し、ファイルサイズの変動を抑えても良い。
［薄い原稿（ｄ）］
白地であり、背景から文字を分離しやすいため、γ補正テーブル４を使っても、ファイルサイズが増えない。
［薄い原稿（ｅ）］
薄い原稿（ｄ）よりも、さらに背景から文字を分離しやすいため、γ補正テーブル４よりも濃くするようなテーブルを使っても良いし、背景に白地しか残ってない場合は、背景全体を白化しても良い。
［薄い原稿（ｆ）］
背景に白地しか残ってない場合は、背景全体を白化しても良い。また、γ補正テーブル５のように、階調性を減らし、ファイルサイズを減らしても良い。γ補正テーブル５は、階調性を減らすことが目的であり、階段状のイメージである。階調性とファイルサイズのトレードオフの関係になる。

次に、画像圧縮部５２における薄い原稿種の各パターンと解像度の関係について説明する。図２２は、薄い原稿種の各パターンに応じて変換される各レイヤの解像度を示す図である。図２２に示すように、薄い原稿（ａ），（ｂ），（ｃ）の場合、画像圧縮部５２は、絵柄が含まれている可能性が高いため、あまり背景の解像度を下げることができない。薄い原稿（ｄ）の場合、画像圧縮部５２は、絵柄が含まれている可能性もあるため、背景の解像度を少しだけ下げる。薄い原稿（ｅ），（ｆ）の場合、画像圧縮部５２は、絵柄が含まれている可能性が低いため、背景の解像度をかなり下げる。

また、薄い原稿（ｄ），（ｅ）の場合、黒文字が存在せず、色文字のみの可能性がある。薄い原稿（ｄ），（ｅ）の場合、画像圧縮部５２は、黒文字レイヤを使わず、色文字レイヤだけを使うようにしても良い。よって、４レイヤのＰＤＦを３レイヤに切り替えて、ファイルサイズの削減を図ることできる。

また、薄い原稿（ｅ）の場合、色文字が存在せず、黒文字のみの可能性もある。薄い原稿（ｅ）の場合、画像圧縮部５２は、色文字レイヤを使わず、黒文字レイヤだけを使うようにしても良い。よって、４レイヤのＰＤＦを３レイヤにして、ファイルサイズの削減を図ることができる。また、黒文字をＫ単色でプリントすることができるので、ＰＤＦファイルをプリントする際のトナー削減を実現することができる。

このように本実施の形態によれば、薄い原稿についての画像圧縮に際し、輝度値などを使った自動濃度補正により単純に補正する場合に比べ、ファイルサイズの削減を図ることができる。

図２３は、画像形成装置１００のハードウェア構成例を示すブロック図である。上述した第１の実施の形態ないし第３の実施の形態において説明した画像形成装置１００は、例えば図２３に示すように、コントローラ２１０と、オペレーションパネル２２０と、ＦＣＵ（Facsimile Control Unit）２３０と、ＵＳＢ（Universal Serial Bus）デバイス２４０と、ＭＬＢ（Media Link Board）２５０と、スキャナ１と、プロッタ４とを備える。

オペレーションパネル２２０は、画像形成装置１００を使用するユーザが各種の設定入力を行ったり、ユーザに提示する各種情報を表示したりするユーザインタフェースである。上述のユーザによる動作モードの選択は、例えば、このオペレーションパネル２２０を用いて行われる。

ＦＣＵ２３０は、画像形成装置１００のファクシミリ機能を制御する制御ユニットである。ＵＳＢデバイス２４０は、ＵＳＢにより画像形成装置１００に接続される機器である。ＭＬＢ２５０は、画像データのフォーマット変換を行う変換ボードである。スキャナ１は原稿の読み取りを行うエンジンであり、プロッタ４は印刷を行うエンジンである。本実施形態では、スキャナ１による原稿の読み取りによって、処理対象の画像が取得されるものとする。

コントローラ２１０は、画像形成装置１００の動作を制御する制御装置である。コントローラ２１０は、図２３に示すように、ＣＰＵ（Central Processing Unit）２１１と、システムメモリ２１３と、ＨＤＤ３と、ＰＨＹ（Physical Layer：通信系回路の物理階層）２１４と、ＡＳＩＣ（Application Specific Integrated Circuit）２１５とを含む。オペレーションパネル２２０は、コントローラ２１０のＡＳＩＣ２１５に接続されている。また、ＦＣＵ２３０、ＵＳＢデバイス２４０、ＭＬＢ２５０、スキャナ１およびプロッタ４は、データ転送バス２８０を介してコントローラ２１０のＡＳＩＣ２１５に接続されている。

第１の実施の形態ないし第３の実施の形態において説明した画像形成装置１００では、上述の画像処理装置としての機能的な構成要素の一部または全部が、主にコントローラ２１０によって実現される。すなわち、第１の実施の形態ないし第３の実施の形態において説明した機能的な構成要素のうち、画像処理装置２は、例えば、コントローラ２１０のＡＳＩＣ２１５により実現される。また、画像圧縮処理装置５は、例えば、コントローラ２１０のＣＰＵ２１１がシステムメモリ２１３を利用して所定のプログラム（ソフトウェア）を実行することにより実現される。

なお、上記プログラムは、画像形成装置１００にインストール可能な形式または実行可能な形式のファイルでＣＤ−ＲＯＭ、フレキシブルディスク（ＦＤ）、ＣＤ−Ｒ、ＤＶＤなどのコンピュータで読み取り可能な記録媒体に記録して提供される。また、上記プログラムを、インターネットなどのネットワークに接続されたコンピュータ上に格納し、ネットワーク経由で画像形成装置１００にダウンロードさせることにより提供するように構成してもよい。さらに、上記プログラムを、インターネットなどのネットワーク経由で提供または配布するように構成してもよい。また、上記プログラムを、例えば画像形成装置１００内のシステムメモリ２１３やＨＤＤ３などに予め組み込んで提供するようにしてもよい。

また、上述した第１の実施の形態ないし第３の実施の形態では、画像形成装置１００を単体の装置として実現する例を想定したが、画像形成装置１００の機能的な構成要素を物理的に分離した複数の装置に分散して設け、これら複数の装置の連携により、画像形成装置１００としての動作が実現されるように構成してもよい。

なお、上述した第１の実施の形態ないし第３の実施の形態では、本発明の原稿種認識装置を、コピー機能、プリンタ機能、スキャナ機能およびファクシミリ機能のうち少なくとも２つの機能を有する複合機に適用した例を挙げて説明したが、複写機、プリンタ、スキャナ装置、ファクシミリ装置などの画像形成装置であればいずれにも適用することができる。

１原稿種認識装置
２１像域分離部
５１原稿種認識部、ヒストグラム作成部
５２画像圧縮部
２２１平滑化部
２２３エッジ強調部

特許第４８６１７１１号公報

Claims

入力画像の文字領域と絵柄領域とを分離した各領域を示す信号を出力する像域分離部と、
前記入力画像の前記絵柄領域における特定の線数以上の網点ドットを除去する平滑化処理を施す平滑化部と、
前記平滑化処理を施した前記入力画像における前記文字領域のエッジ部に対してエッジ量に応じたエッジ強調処理を施した画像を出力するエッジ強調部と、
前記エッジ強調処理を施した画像にかかるヒストグラムを作成するヒストグラム作成部と、
前記ヒストグラムを利用して前記入力画像にかかる原稿種を認識する原稿種認識部と、
を備えることを特徴とする原稿種認識装置。
前記原稿種認識部は、前記ヒストグラム作成部によって作成されたヒストグラムを複数の閾値で量子化した結果に基づいて、前記入力画像にかかる原稿種を認識する、
ことを特徴とする請求項１記載の原稿種認識装置。
前記エッジ強調部は、前記エッジ量に基づくエッジ領域を表す信号を更に出力し、
前記ヒストグラム作成部は、前記エッジ領域を表す信号がアクティブな画素を前記ヒストグラムの算出から除外する、
ことを特徴とする請求項１または２記載の原稿種認識装置。
前記像域分離部は、前記入力画像から網点文字に少なく網点絵柄に多い特定の網点率の網点絵柄領域を更に検出し、
前記原稿種認識部は、前記入力画像に所定の数以上の前記網点絵柄領域が含まれている場合には、前記ヒストグラムを利用した認識結果にかかわらず、絵柄を含む原稿種として認識する、
ことを特徴とする請求項１ないし３の何れか一記載の原稿種認識装置。
前記像域分離部は、網点文字に少なく網点絵柄に多い特定の網点率をおよそ５０％とする、
ことを特徴とする請求項１ないし４の何れか一記載の原稿種認識装置。
前記原稿種認識部は、文字のみ原稿と、新聞原稿、トナーセーブモードでの出力画像である薄い原稿と、を認識する、
ことを特徴とする請求項１ないし５の何れか一記載の原稿種認識装置。
前記原稿種認識部は、前記エッジ領域を表す信号がアクティブな画素を前記ヒストグラムの算出から除外する性質を利用して、白抜き文字の有無を更に認識する、
ことを特徴とする請求項３ないし５の何れか一記載の原稿種認識装置。
請求項１ないし７の何れか一記載の原稿種認識装置を備えることを特徴とする画像形成装置。
原稿種認識装置で実行される原稿種認識方法であって、
入力画像の文字領域と絵柄領域とを分離した各領域を示す信号を出力する像域分離工程と、
前記入力画像の前記絵柄領域における特定の線数以上の網点ドットを除去する平滑化処理を施す平滑化工程と、
前記平滑化処理を施した前記入力画像における前記文字領域のエッジ部に対してエッジ量に応じたエッジ強調処理を施した画像を出力するエッジ強調工程と、
前記エッジ強調処理を施した画像にかかるヒストグラムを作成するヒストグラム作成部工程と、
前記ヒストグラムを利用して前記入力画像にかかる原稿種を認識する原稿種認識工程と、
を含むことを特徴とする原稿種認識方法。
コンピュータを、
入力画像の文字領域と絵柄領域とを分離した各領域を示す信号を出力する像域分離部と、
前記入力画像の前記絵柄領域における特定の線数以上の網点ドットを除去する平滑化処理を施す平滑化部と、
前記平滑化処理を施した前記入力画像における前記文字領域のエッジ部に対してエッジ量に応じたエッジ強調処理を施した画像を出力するエッジ強調部と、
前記エッジ強調処理を施した画像にかかるヒストグラムを作成するヒストグラム作成部と、
前記ヒストグラムを利用して前記入力画像にかかる原稿種を認識する原稿種認識部と、
として機能させるためのプログラム。