JP3629959B2 - 画像認識装置 - Google Patents

画像認識装置 Download PDF

Info

Publication number
JP3629959B2
JP3629959B2 JP19067298A JP19067298A JP3629959B2 JP 3629959 B2 JP3629959 B2 JP 3629959B2 JP 19067298 A JP19067298 A JP 19067298A JP 19067298 A JP19067298 A JP 19067298A JP 3629959 B2 JP3629959 B2 JP 3629959B2
Authority
JP
Japan
Prior art keywords
size
image
character
image data
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP19067298A
Other languages
English (en)
Other versions
JP2000022899A (ja
Inventor
祥二 今泉
和弘 上田
Original Assignee
ミノルタ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ミノルタ株式会社 filed Critical ミノルタ株式会社
Priority to JP19067298A priority Critical patent/JP3629959B2/ja
Publication of JP2000022899A publication Critical patent/JP2000022899A/ja
Application granted granted Critical
Publication of JP3629959B2 publication Critical patent/JP3629959B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、複写機などの原稿読取部に用いられる原稿の方向を認識する画像認識装置に関する。
【0002】
【従来の技術】
従来、例えば原稿自動搬送装置を備えた複写機において、複数枚の原稿を連続して読み取ってコピーする場合には、読み取られた原稿の向きに応じてコピーが出力されるので、原稿を原稿自動搬送装置にセットする際に、操作者は各原稿が一律に同じ方向を向いているか否かを確認する必要があった。しかし、このような確認作業は結構手間がかかるものであり、原稿枚数が多ければ、それだけ反対方向の原稿を見落とすおそれも多くなる。この確認作業を怠ると、出力されたコピーについていちいちコピーの向きを修正しなければならないという不都合を生じ、さらには自動的にステープル止めを行うステープルユニットを備えた複写機において、ステープルを行うと、異なる方向のコピーを含むコピー束をそのままステープル止めしてしまい、最悪の場合にはもう一度コピー作業をやり直さなければならない事態も生じる。
【0003】
このような不都合を避けるため、各原稿が同じ方向を向いていなくても、読み取った原稿データからまず原稿の向きを認識し(このような原稿方向の認識を以下、「原稿方向認識」という。)、その画像出力が適切な方向になるように画像データを回転処理して出力する方法が提案されている。このような原稿方向認識の手法としては、まず原稿の画像データに基づいて原稿画像の濃度分布を示すヒストグラムを生成するのが一般的である。例えば、特開平9−9040号公報においては、次のような原稿方向認識方法が開示されている。
【0004】
すなわち、原稿の画像データの中から文字画像に属するブロックを判別し、このブロックについての主走査方向および副走査方向における濃度分布を示すヒストグラムをそれぞれ生成し、これらのヒストグラムのグラフ(図形)上における変化点(立ち上がりあるいは立ち下がりエッジ部分)の変化の方向を考慮に入れてカウントすることにより文字の並びと原稿の向きとを認識する。
【0005】
一般に文字画像は、文の先頭箇所、すなわち文字の書き始めの位置が各文で一致する傾向があるのに対し、文の終わる箇所は各文でまちまちであるため、変化点は文の先頭方向に比べて分散する傾向にある。そのため、グラフは文の先頭方向から見たときに、立ち上がりエッジ数が少なく、文の終わる方向に立ち下がりエッジ数が多い形状になる。従って、グラフを見たときに、立ち上がりエッジ数が少なくなる方向が文の先頭方向と認識することができるようになり、その結果から原稿方向認識を行う。
【0006】
このような方法を用いて原稿方向認識を行うには、ヒストグラムをより正確に生成する必要があるが、例えば原稿に微小な汚れやごみなど(以下、「ノイズ」という。)が多数点在している場合には、このノイズの影響により行間や文の先頭箇所などの正確な位置が判別できなくなる恐れがあり、これにより求められたヒストグラムも正確さに欠けたものとなるという問題がある。従って、原稿方向認識の信頼性を向上させるためには、ヒストグラムを生成する前にこのノイズを極力除去しておくことが必要になる。
【0007】
原稿の画像データからノイズを除去する方法として、例えば特開平7−105312号公報には、1文字分の文字画像を切り出して、この文字画像の代表線幅を検出し、当該代表線幅により形成される画像の外接矩形を求め、この外接矩形よりも外に位置する画像の画像データを消去することによりノイズ除去を行う技術が開示されている。
【0008】
【発明が解決しようとする課題】
しかしながら、上記のように1文字ずつ文字画像を切り出してノイズ除去を行う方法では、確かにノイズ除去を効果的に行えるが、その一方で原稿画像中の全ての文字画像についていちいち代表線幅を検出するといった膨大な処理が必要となり、これがノイズ除去処理を大変複雑なものにすると共に処理に長時間を要していた。
【0009】
本発明は、上述したような問題点に鑑みてされたものであって、簡易な構成でありながらノイズを極力除去させてより正確な原稿方向認識を行うことが可能な画像認識装置を提供することを目的とする。
【0010】
【課題を解決するための手段】
上記目的を達成するために本発明は、文字画像を含む原稿の方向を認識する装置であって、原稿を読み取って画像データを生成する画像読取手段と、前記画像データを記憶する画像データ記憶手段と、前記画像データから文字画像のサイズを検出する文字サイズ検出手段と、前記検出された文字サイズに応じて孤立点除去フィルタのフィルタサイズを決定するフィルタサイズ決定手段と、前記決定されたフィルタサイズの孤立点除去フィルタを用いて、前記画像データ記憶手段に記憶されている画像データ内の孤立点を除去する孤立点除去手段と、孤立点が除去された画像データに基づき前記原稿の方向を認識する画像方向認識手段とを備えることを特徴とする。
【0011】
また、前記フィルタサイズ決定手段は、検出された文字サイズが所定のサイズ以下の場合には、フィルタサイズを第1のサイズに決定し、文字サイズが前記所定のサイズよりも大きな場合には、フィルタサイズを前記第1のサイズよりも大きな第2のサイズに決定することを特徴とする。
また、前記文字サイズ検出手段は、原稿の濃度分布を示すヒストグラムを前記画像データから生成し、これに基づいて文字サイズを検出することを特徴とする。
【0012】
また、前記文字サイズ検出手段は、生成されたヒストグラムに基づいて前記原稿の文字の線分の濃度が地肌部の濃度よりも低い濃度で表現されている反転原稿であるか否かを検出する反転原稿検出手段を備え、当該反転原稿検出手段が前記原稿を前記反転原稿であることを検出すると、生成されたヒストグラムを反転させて再生成し、これに基づいて文字サイズを検出することを特徴とする。
【0013】
また、前記画像方向認識手段は、原稿の濃度分布を示すヒストグラムを孤立点が除去された画像データから生成し、これに基づいて文字画像の方向を認識することを特徴とする。
【0014】
【発明の実施の形態】
以下、本発明に係る画像読取り装置の実施の形態を、デジタル複写機に適用した場合について説明する。
(1)デジタル複写機全体の構成
まず、デジタル複写機(以下、単に「複写機」という。)の全体の構成を図1により説明する。
【0015】
同図に示すように、この複写機は、原稿自動搬送装置10と、画像読取部30と、プリンタ部50と、給紙部70とからなる。
原稿自動搬送装置10は、原稿を自動的に画像読取部30に搬送する装置であって、原稿給紙トレイ11に載置された原稿は、給紙ローラ12、捌きローラ13により1枚ずつ分離されて下方に送られ、搬送ベルト14によって、プラテンガラス31上の原稿読取位置まで搬送される。
【0016】
原稿読取位置に搬送された原稿は、画像読取部30のスキャナ32によりスキャンされた後、再び、搬送ベルト14により図の右方向に送られ、排紙ローラ15を経て原稿排紙トレイ16上に排出される。
画像読取部30は、上記プラテンガラス31の原稿読取位置に搬送された原稿の画像を光学的に読み取るものであって、スキャナ32、CCDカラーイメージセンサ38などから構成される。
【0017】
スキャナ32には、露光ランプ33とこの露光ランプ33の照射による原稿からの反射光をプラテンガラス31に平行な方向に光路変更するミラー34が設置され、図の矢印方向に移動することによりプラテンガラス31上の原稿をスキャンする。原稿からの反射光はミラー34に反射された後、さらにミラー35、36および集光レンズ37を介してCCDカラーイメージセンサ(以下、「CCDセンサ」という)38まで導かれ、ここで電気信号に変換されて画像データが生成される。なお、本実施の形態のCCDセンサ38の解像度は、400DPIとする。
【0018】
当該画像データは、制御部100内の画像信号前処理部110(図2参照)においてA/D変換されてデジタル信号となり、さらにシェーディング補正や濃度変換処理等を加えられた後、中間調処理部120へ送られ、公知の誤差拡散処理を加えられた後、高解像度画像メモリ130(同図2)に格納される。高解像度画像メモリ130に格納された画像データは、後述するようにCPU190でなされた原稿方向認識処理の結果に応じて回転処理され、プリンタ部50のレーザダイオード51の駆動信号となる。
【0019】
プリンタ部50は、公知の電子写真方式により記録シート上に画像を形成するものであって、上記駆動信号を受信するとレーザダイオード51を駆動してレーザ光を出射させる。レーザ光は、所定の角速度で回転するポリゴンミラー52側面のミラー面で反射され、fθレンズ53、ミラー54、55を介して、感光体ドラム56の表面を露光走査する。
【0020】
この感光体ドラム56は、上記露光を受ける前にクリーニング部57で感光体表面の残留トナーを除去され、さらにイレーサランプ(図示せず)の照射を受けて除電された後、帯電チャージャ58により一様に帯電されており、このように一様に帯電した状態で上記露光を受けると、感光体ドラム56表面に静電潜像が形成される。
【0021】
現像器59は、感光体ドラム56表面に形成された上記静電潜像を現像する。
一方、給紙部70には、2つの用紙カセット71、72が設けられており、上述の感光体ドラム56の露光および現像の動作と同期して、必要なサイズの記録シートが、用紙カセット71、72のいずれかから、給紙ローラ711もしくは721の駆動により給紙される。給紙された記録シートは、感光体ドラム56の下方で当該感光体ドラム56の表面に接触し、転写チャージャ60の静電力により、感光体ドラム56表面に形成されていたトナー像が当該記録シート表面に転写される。
【0022】
その後、記録シートは、分離チャージャ61の静電力によって感光体ドラム56の表面から引き剥され、搬送ベルト62により定着部63に搬送される。
記録シートに転写されたトナー像は、定着部63において内部にヒータを備えた定着ローラ64で加熱されながら押圧されることにより定着される。定着後の記録シートは、排出ローラ65により排紙トレイ66上に排出される。
【0023】
また、複写機前面の操作しやすい位置には、操作パネル90が設けられており、コピー枚数を入力するテンキーやコピー開始を指示するスタートキー、各種のコピーモードを設定するための設定キー、上記設定キーなどにより設定されたモードをメッセージで表示する表示部などが設けられている。
(2)制御部100の構成
次に、上記制御部100の構成を図2のブロック図を参照して説明する。
【0024】
同図に示すように、制御部100は、画像信号前処理部110、中間調処理部120、高解像度画像メモリ130、回転処理部140、LD駆動部150、解像度変換部160、単純2値化処理部170、低解像度認識用メモリ180、CPU190、RAM191、ROM192から成る。
画像信号前処理部110は、A/Dコンバータ、シェーディング補正部、MTF補正部、γ補正部などを備えており、400DPIの解像度で入力された原稿の画像データは、A/Dコンバータでデジタルの多値信号、例えば256階調のデータ値に変換され、シェーディング補正部でCCDセンサ38の感度ムラが補正された後、MTF補正部でエッジ強調などの画質改善のための処理を受け、γ補正部でγ補正処理を加えられた後に、中間調処理部120および解像度変換部160に送られる。
【0025】
中間調処理部120は、写真などのような中間調の色を含む原稿の濃淡画像の階調再現処理を行うものであって、本実施の形態では公知の誤差拡散処理が用いられる。画像信号前処理部110から送られてくる画像データは、当該誤差拡散処理において2値化される。なお、画像データが2値化される際の閾値(2値化レベル1)は、CPU190から設定されるようになっており、本実施の形態では2値化レベル1=64が設定され、誤差拡散処理後のデータ値が64を越える画素については黒色で、それ以下の画素については白色で再現するように処理される。このようにして2値化された画像データは、ページ単位で高解像度画像メモリ130に格納される。
【0026】
ここで、新聞などのように中間色の地肌部分に文字画像が形成されている原稿(以下、「新聞原稿」という。)の画像データを中間調処理部120で2値化した場合の画像201を図3(a)に示す。なお、同図の画像201は、原稿画像の一部分を抜き出して示したものである。
図3(a)より、画像201の地肌部分には微小な黒点が網点のように分散して形成されているのがわかる。これにより人の目には地肌部分が原稿画像と同様の濃淡で再現されているように見える。
【0027】
このように中間調再現処理では、地肌部分をいかに再現するかで画質の善し悪しが決定されるので、上記2値化レベル1の値についても中間調の再現に最適な値に決定される必要がある。
図2に戻って、回転処理部140は、CPU190からの指示により高解像度画像メモリ130から目的のページの画像データを順次読み出して後述する原稿方向認識処理の結果に基づき必要に応じて回転処理した後、LD駆動部150に転送する。なお、この回転処理は、画像データのメモリアドレスを変更する公知の技術(例えば、特開昭60−126769号公報参照)によってなされる。
【0028】
LD駆動部150は、送られてくる画像データに基づいてレーザダイオード51の駆動信号を生成し、レーザダイオード51を駆動させる。
一方、解像度変換部160は、画像信号前処理部110から送られてくる画像データ(400DPI)を25DPIの低解像度画像データに変換する。この解像度変換処理は、公知の技術であって、例えば400DPIの画像データの中から主走査方向と副走査方向にそれぞれ連続する16画素×16画素のマトリクスを1ブロックとして抽出し、この1ブロックの256画素の中で最も階調データの値が高いものを取得して当該25DPIの1画素としての階調データ値とし、これを画像データの全てについて行い、25DPIの画像データを得るものである。
【0029】
単純2値化処理部170は、解像度変換部160において25DPIに解像度変換された低解像度画像データを2値化して低解像度認識用メモリ180に格納させる。その際の2値化手段は、内部に配されたコンパレータで低解像度画像データの各画素毎の階調データ値と2値化のための閾値(2値化レベル2)とを比較することにより行われる。なお、この場合の2値化レベル2は、上記2値化レベル1と同様にCPU190から設定されるようになっており、2値化レベル2=200が設定される。
【0030】
2値化レベル2が200に設定されることから、例えば解像度変換部160から送られたきた画像データに中間色(例えば灰色)のデータが含まれる場合に、当該中間色のデータの階調値が256階調の中間の128前後の値であったならば、これらは2値化レベル2の値200よりも下回っているために、単純2値化処理部170で全て白画素に変換される。
【0031】
ここで、上述の新聞原稿の一部分が単純2値化処理部170において2値化処理された後の画像202を図3(b)に示す。
画像信号前処理部110から送られてくる新聞原稿の画像データは、まず解像度変換部160において低解像度画像データに変換されたために、文字の線幅が太くなり、その結果として線間に隙間がなくなって文字部分が黒ベタとなって連結した柱状形になっている。さらに地肌部分については、図3(a)のような黒点がほとんど形成されていない。これは、画像202における地肌部分が中間色であるためにデータの階調値が200よりも小さく、ほとんどの画素が単純2値化処理部170で白色画素に変換されたからである。
【0032】
このように、単純2値化処理部170で中間色のデータを排除しているのは、低解像度データが後述するように文字画像のサイズを検出する手段として用いられるヒストグラムの生成に使用されるためであり、文字画像以外のデータ(特に、中間色に相当するデータ)を極力除去しておくことが望ましいからである。
そのため、本実施の形態では、2値化レベル2の値を2値化レベル1(=64)よりもはるかに大きな値の200に設定して、文字画像以外の中間色画像を極力除去するようにしている。2値化レベル2をこのように設定することにより、より正確なヒストグラムを生成できるようになる。もちろん、2値化レベル2は、この値に限定されることはなく、文字画像以外の中間色画像を極力除去できる値であればよい。
【0033】
また、ヒストグラムからは文字画像の高さを検出できればよいので、必ずしも400DPIといった高解像度画像データから生成される必要はなく、本実施の形態では25DPIの低解像度にデータ変換してデータ量を削減し、処理の高速化を図っている。
低解像度認識用メモリ180は、2値化された低解像度画像データをページ毎に格納する。
【0034】
RAM191は、CPU190にてなされる後述するノイズ除去処理1あるいは2後の原稿画像データを記憶すると共に各種の制御変数などを一時記憶する。
ROM192は、原稿自動搬送装置10における原稿搬送動作や画像読取部30におけるスキャン動作やプリンタ部50における画像形成動作に関するプログラムおよび画像データを回転処理させるためのプログラムなどに加えて上述の2値化処理にて設定される2値化レベル1と2値化レベル2の値および後述の孤立点判定条件値が格納されている。
【0035】
CPU190は、ROM192から必要なプログラムを読み出して、2値化レベル1および2の値をそれぞれ設定し、あるいは後述する反転フラグを設定し、または低解像度認識用メモリ180に格納されている低解像度画像データを1ページ毎に読み出して後述するノイズ除去処理1あるいは2を行った後、ページ毎にRAM191に格納し、このデータからヒストグラムを生成し、これに基づいて文字の方向を認識して原稿方向を認識し、適切な方向で画像データが出力されるように回転処理部140に回転角信号を送出する原稿方向認識処理を行う。さらに、原稿自動搬送装置10、画像読取部30、プリンタ部50などの動作をタイミングを取りながら統一的に制御して円滑な複写動作を実行させる。
【0036】
以下、上記原稿方向認識処理の全体の動作を図4のフローチャートにおいて、説明する。
CPU190は、まずノイズ除去処理1として、低解像度認識用メモリ180に格納されている低解像度画像データ内の孤立点をノイズとみなしてノイズ除去フィルタ3×3を用いて除去し、RAM191に格納させる(ステップS1、S2)。そして、RAM191に格納された画像データから、原稿画像中の文字画像の濃度分布を示すヒストグラムを生成するヒストグラム生成処理(ステップS3)を行う。続いて生成されたヒストグラムから原稿の平均濃度を求め、これが所定の濃度を越える高濃度であるか否かを判断し(ステップS4)、所定濃度を越えると判断した場合は、反転フラグを「1」に設定し(ステップS5)、当該ヒストグラムを反転させてヒストグラムを生成し直すヒストグラム反転処理(ステップS6)を行う。
【0037】
次に、生成されたヒストグラムの形状を解析することにより、原稿の文字画像のサイズを検出する文字サイズ検出処理を行い(ステップS8)、その文字サイズが所定のサイズよりも大きい場合には、ノイズ除去処理2としてノイズ除去フィルタのサイズを3×3よりも大きな5×5に変更して低解像度認識用メモリ180に格納された画像データ内の孤立点を再度除去して、これをRAM191に格納させ(ステップS9、S10)、上記ステップS3のヒストグラム生成処理と同様の処理を行いヒストグラムを再生成する(ステップS11)。そして、反転フラグが「1」であるか否かを判断し(ステップS12)、「1」の場合には、上記ステップS6のヒストグラム反転処理と同様の処理を行い、ステップS11で生成されたヒストグラムを反転させる(ステップS13)。反転フラグが「0」の場合には、ステップS14に移る。なお、図示していないが、ステップS13でヒストグラムの反転が行われた後に、上記反転フラグは、「0」にリセットされる。
【0038】
一方、検出された文字サイズが所定サイズ以下の場合には(ステップS8で「N」)、ステップS9〜S13を行わずにステップS14に移る。これは、ノイズ除去フィルタのサイズを3×3にして孤立点を除去し、これに基づいてヒストグラムを生成するという処理がステップS1〜S6の中ですでに行なわれているからである。従って、文字サイズが所定サイズ以下の場合には、ステップS9〜S13がスキップされることにより、ステップS1〜S6と同じ処理が実質的に選択されて行なわれたことになる。
【0039】
そして、上記ステップS3もしくはS11で生成されたヒストグラム、あるいはステップS6もしくはS13で反転されたヒストグラムに基づいて、原稿方向を1ページ毎に認識し、この認識結果に基づいて原稿の回転角度を設定する(ステップS14、S15)。この認識処理と回転角度設定処理は、公知の技術、例えば特開平9−9040号公報に開示されている技術により行う。
【0040】
次に、上記の各処理について図5〜図8を用いてより具体的に説明する。
(ノイズ除去処理1)
図5(a)は、ノイズ除去処理1において用いられるノイズ除去フィルタ3×3(以下、「フィルタ3×3」という。)により、孤立点が除去される様子を示したものである。
【0041】
フィルタ3×3は、図に示すようにある1つの画素(注目画素)が黒色画素であって、かつその注目画素を取り囲む周辺画素が全て白色画素である場合に、その注目画素を白色画素に変更させることにより、孤立点を除去するものである。ノイズ除去処理1では、フィルタ3×3の中心部に各画素が位置するようにフィルタ3×3を順次移動させることにより、画像データ内の孤立点を除去する。
本実施の形態では、原稿画像が25DPIの解像度に画素分割されているので、1画素の大きさは、約1mm(縦)×約1mm(横)となる。従って、このフィルタ3×3を用いることにより、約1mm×約1mmの大きさの孤立点を除去できることになる。
【0042】
(ヒストグラム生成処理)
図7(a)は、ヒストグラム生成処理により得られたヒストグラムの一例を示す図である。
ヒストグラムは、ノイズ除去処理1において孤立点の除去された、原稿1枚分の画像データD1の文字部分の黒画素数を主走査方向および副走査方向のそれぞれについて計数することにより生成される。同図に示す通常原稿(地肌部が白色で文字画像が黒色のもの)についてヒストグラムを生成すると、ヒストグラムH1およびヒストグラムH2のような分布図となる。
【0043】
(文字サイズ検出処理)
生成されたヒストグラムH1およびH2から文字列の方向を検出する。これは、ヒストグラムH1の分布を見れば分かるように、ヒストグラムの谷の部分が行間を、山の部分が文字部をそれぞれ示しており、これにより文字列の方向を得ることができる。従って、ヒストグラムH1の山の部分の幅方向(副走査方向)を形成する画素数を計数すれば、容易に文字の高さを求めることができ、この文字の高さから文字サイズを検出することができる。
【0044】
(ノイズ除去処理2)
ノイズ除去処理2では、検出された文字サイズが所定のサイズ、本実施の形態では12ポイントよりも大きい場合に、ノイズ除去処理1で用いたフィルタ3×3よりも大きなサイズのノイズ除去フィルタ5×5(以下、「フィルタ5×5」という。)に変更して画像データ内の孤立点を再度除去する。
【0045】
図5(b)は、フィルタ5×5により孤立点が除去される様子を示した図である。フィルタ5×5は、縦5画素×横5画素の平方領域における中央の9画素内(太線内)に、孤立点判定条件として設定される値(本実施の形態では4)以下の数の黒画素が存在している場合に、これを孤立点として除去する処理を行う。
従って、フィルタ5×5では、フィルタ3×3では除去できなかった大きさの孤立点、例えば黒画素が2×2個連結しているものであっても除去できることになる。
【0046】
このように、本実施の形態では、原稿画像中に存在する孤立点を除去するのに際し、文字サイズが12ポイント以下の場合に、フィルタ3×3を用い、12ポイントを越える場合にフィルタ5×5を用いるようにしている。
これは、ノイズとみなせる孤立点の大きさと文字サイズの大きさとを相対的な関係として捉えたからである。すなわち、文字のサイズが大きくなれば、ノイズとみなせる孤立点の大きさもそれに合わせて大きいものになると考えられるからである。原稿画像内に存在するノイズは、大きさがまちまちであり、文字と同程度の大きさのものもあれば、1画素程度の微小なものもあるが、上述したようにここでのノイズ除去処理は、文字画像から正確なヒストグラムを生成するために行うものなので、上記従来技術のような複雑な処理を用いてまで全てのノイズを除去する必要はなく、文字画像から離間している孤立点を極力除去できれば足りる。
【0047】
しかし、大小の孤立点の内でどれが文字画像かノイズかを判断できなければ、文字画像から離間している孤立点を除去することができない。
そこで、文字サイズを検出することにより、その大きさに相当する画像が文字を構成する画像であると判断すると共に、文字サイズよりもある程度小さな孤立点については、文字画像の構成部分とは考えにくいことから、これをノイズとみなすようにした。具体的には、本実施の形態では文字画像が12ポイント(文字高さが約4.2mm)以下であれば、その1/4程度の大きさ(高さが約1mm)の孤立点を除去できるフィルタ3×3を使用し、12ポイントを越える文字画像の場合には、最大2mm×2mmまでの孤立点を除去できるフィルタ5×5を使用するというように、文字サイズに応じてフィルタを切り換えるようにしている。
【0048】
図6(a)、(b)は、8ポイント(文字高さ約2.8mm)の文字原稿と18ポイント(文字高さ約6.3mm)の文字原稿に同じ大きさの孤立点(ノイズ)が存在している様子を示す図である。なお、この孤立点は、縦2mm×横2mmの大きさである。
この文字原稿に対して本実施の形態の原稿方向認識処理を行うと、まず8ポイント文字原稿については、ノイズ除去処理1のフィルタ3×3により孤立点除去処理が行われる。ところが、1mm×1mmの大きさの孤立点を除去するフィルタ3×3では、このノイズを除去できない。上述したように、文字サイズの半分以上の大きさの孤立点をノイズとみなすことはできず、逆にこれを除去しようとして、フィルタサイズを大きくすれば、文字画像の一部も除去されることになり不都合が生じるからである。
【0049】
一方、18ポイント文字原稿については、最大2mm×2mmまでの大きさの孤立点を除去できるフィルタ5×5を用いたノイズ除去処理2が行われるので、このノイズは除去されることになる。
このように、ノイズとみなす孤立点を文字サイズに応じて設定し、これを除去するフィルタを文字サイズに応じて切り換えて用いることにより、一定サイズのフィルタを用いるだけでは除去できない孤立点が的確に除去されるようになり、これによりヒストグラムが正確に生成されてより正確な原稿方向認識を行うことができる。
【0050】
なお、文字サイズに応じたフィルタサイズの切り換えは、2段階(12ポイント以下の場合にはフィルタ3×3、12ポイントよりも大きな場合にはフィルタサイズ5×5)に限定されないことはいうまでもなく、文字サイズに応じてノイズとみなせる孤立点を除去できるフィルタサイズを設定すればよいので、例えばポイント毎に異なるサイズのフィルタを準備しておいてそれぞれを適宜切り換えるようにしてもよいし、ポイント毎に上記孤立点判定条件を異なる値(1〜9まで設定可能)に設定するようにしてもよい。このようにすれば、さらに孤立点除去を的確に行える。
【0051】
また、上記では低解像度(25DPI)の画像データに対して、フィルタサイズを3×3と5×5を用いているが、例えば画像データが高解像度(400DPI)であれば、1画素の大きさが約63μm×63μmと小さくなるので、フィルタ3×3や5×5で除去できる孤立点の大きさもそれに合わせて小さくなる。このように解像度が変われば1画素の大きさが変わり、除去する孤立点の大きさに対応する画素数(例えば1mm平方の大きさの孤立点を考える場合、25DPIでは約1画素分に相当するが、400DPIでは、縦16×横16画素の領域に相当する)も変わるので、フィルタサイズは、孤立点の大きさに対応する画素数に応じて設定される必要がある。
【0052】
また、上記においてはノイズとみなす孤立点を文字サイズの1/4程度の大きさのものとしているが、もちろんこの値に限定されることはなく、例えば文字サイズの1/6程度や1/3程度の値などに設定するようにしてもよい。但し、この値が小さすぎるとノイズ除去精度が低下するし、大きすぎると文字画像の一部をもノイズとみなされて除去されることが考えられるので、実験等により最適な値に設定されることが好ましい。
【0053】
(ヒストグラム反転処理)
ヒストグラム反転処理では、生成されたヒストグラムH1およびH2から平均濃度を算出し、これが高濃度であるか否かを判断することにより、原稿の文字が図7(a)に示す通常原稿か、図7(b)に示す反転原稿(文字部分が白色で、地肌部が黒色のもの)であるか否かを判断している。
【0054】
これは、行頭が同一方向の原稿であっても、通常原稿と反転原稿では、生成されるヒストグラムの形状が全く異なるものとなるからである。すなわち、通常原稿からヒストグラムを生成すると同図のH1およびH2のようになり、反転原稿から生成されるヒストグラムの形状は、H3およびH4のように、ヒストグラムH1およびH2がそれぞれ反転した状態となっている。
【0055】
本実施の形態における原稿方向の認識は、上述したように生成されたヒストグラムから行われる公知のものであり、例えば前述した特開平9−9040号公報に開示されている技術によると、図7(a)の主走査方向と副走査方向に黒画素を計数することで生成された各ヒストグラムH1、H2の内、一方のヒストグラムH1からまず行方向を求め、そして他方のヒストグラムH2から立ち上がりエッジの数(1個)と立ち下がりエッジの数(5個)をそれぞれカウントし、当該ヒストグラムH2のエッジを文頭側から見た場合に、立ち下がりエッジの数が多くなる傾向があることを利用して行頭を判断している。すなわち、同図の上側が、原稿の天となることが判断できる。
【0056】
ところが、図7(b)に示す反転原稿では、図7(a)の通常原稿と行頭が同一位置であるにもかかわらず、エッジを計数するためのヒストグラムH2とH4の形状が反転しているために、双方のエッジ数のカウント値が全く異なってしまう(立ち上がりエッジ数6個、立ち下がりエッジ数2個)。これでは、行頭が逆方向に認識されて、その結果として原稿の天地が逆方向に認識されてしまい問題となる。
【0057】
そこで、本実施の形態では、原稿画像の平均濃度から文字原稿が通常原稿か反転原稿のいずれであるかを判別し、反転原稿の場合には、生成されたヒストグラムを反転させるようにしている。
原稿画像の平均濃度を算出するのは、ヒストグラムで得られた図形の面積(黒画素の総数)を求め、これの原稿1ページ分に相当する面積(全画素数)における割合を求めることで行える。
【0058】
図8は、雑誌などでよくみかける高濃度背景白抜き文字原稿203と通常の文字原稿204に基づいてそれぞれ生成されたヒストグラムの一例を示す図である。
高濃度背景白抜き文字原稿203の場合には、原稿全体が高濃度化するので、生成されたヒストグラムH5の山の部分は、通常の文字原稿204から生成されたヒストグラムH6に比べて、ピークが高くなると共に面積が大変広くなる。従って、ヒストグラムで得られた図形の面積を求めることにより原稿画像の平均濃度が分かり、その結果から原稿が通常の文字原稿であるか、高濃度背景白抜き文字原稿であるかを判断できる。これは、図7(a)の通常原稿と図7(b)の反転原稿についても同様である。
【0059】
そして、平均濃度が所定の濃度を越える高濃度であると判断した場合は、文字原稿が高濃度背景白抜き文字(反転原稿)であると判断して、生成したヒストグラムを反転させる。
このヒストグラムを反転させるとは、具体的には、図8のヒストグラムH5をヒストグラムH6の形状に生成し直すことをいう。これは、ヒストグラムH5の最大カウント値Dmaxから副走査方向における各地点のカウント値を差し引いた値を算出し、これに基づいて図形を形成しなおせば容易に行える。同様に、図7(b)のヒストグラムH3、H4を反転させれば、それぞれ図7(a)のヒストグラムH1、H2になる。
【0060】
このように、原稿画像の平均濃度を検出して、これが高濃度であった場合にヒストグラムを反転させる処理を行うことにより、たとえ原稿が反転原稿(高濃度背景白抜き文字原稿)であっても、通常原稿の場合と同様のヒストグラムを生成できるようになり、原稿方向を誤認識することがなくなるという効果を奏する。もちろん、この効果は、ヒストグラムを用いた原稿方向認識方法であれば、上記公報の方法以外の方法であっても享受できる。
【0061】
また、原稿を反転原稿と判断した場合には、低解像度認識用メモリ180に格納されている2値化された画像データの値を画素毎に反転(黒から白色、白から黒色)させた後に上記のノイズ除去処理を行うようにしてもよい。
(3)変形例
なお、本発明は、上記実施の形態に限定されないのは言うまでもなく、以下のような変形例を考えることができる。
【0062】
(3−1)上記実施の形態では、モノクロのデジタル複写機に本発明に係る画像認識装置を適用した例を説明したが、本発明の画像認識装置は、フルカラーデジタル複写機にも適用可能である。その際、有彩色のカラーデータを予めキャンセルする回路を組み込んでおく必要がある。フルカラー原稿であっても文字画像は一般に黒色が大半であり、この黒色の文字画像に基づいてヒストグラムを生成し原稿方向の認識が行われるからである。なお、カラーデータキャンセル回路は公知であるので、ここでの説明は省略する。
【0063】
(3−2)上記実施の形態では、本発明に係る画像認識装置をデジタル複写機に適用した例を説明したが、その他の原稿の読取りが必要な装置、例えばファクシミリ装置やイメージリーダにおける画像認識装置としても適用される。
また、他のイメージリーダなどの画像入力装置から得られた原稿の画像データに基づいて原稿の方向を認識するようにしてもよい。
【0064】
【発明の効果】
以上説明してきたように本発明によれば、文字サイズ検出手段により文字画像のサイズを検出し、この検出された文字サイズに応じて孤立点除去フィルタのフィルタサイズが決定されるようにしたので、従来のように全文字画像を切り出して、当該文字画像毎に代表線幅を検出し、この線幅により形成される画像の外接矩形を求め、この外接矩形よりも外に位置する画像をノイズとして除去するという複雑な処理に比べて簡易な処理で済み、かつノイズとみなす孤立点の大きさを文字サイズに応じて設定するので、一定サイズのフィルタを用いるだけでは除去できない孤立点が的確に除去できるようになり、その結果としてより正確な原稿方向認識を行うことができるようになる。
【0065】
また、検出された文字サイズが所定のサイズ以下の場合には、フィルタサイズを第1のサイズに決定し、文字サイズが当該所定のサイズよりも大きな場合には、フィルタサイズを前記第1のサイズよりも大きな第2のサイズに決定するという2段階切り換えの簡易な処理でありながら、孤立点が的確に除去できるようになり、より正確な原稿方向認識を行うことができる。
【0066】
また、文字サイズの検出は、原稿の濃度分布を示すヒストグラムを生成することにより行われるので、簡易な処理で済ますことができる。
また、前記文字サイズ検出手段は、生成されたヒストグラムに基づいて原稿の文字の線分の濃度が地肌部の濃度よりも低い濃度で表現されている反転原稿であるか否かを検出する反転原稿検出手段を備え、当該反転原稿検出手段が前記原稿を前記反転原稿であると検出すると、生成されたヒストグラムを反転させて再生成し、これに基づいて文字サイズを検出するので、原稿が反転原稿であっても、正確に文字サイズを検出することができるようになる。
【0067】
また、原稿の濃度分布を示すヒストグラムを孤立点が除去された画像データから生成し、これに基づいて文字画像の方向を認識するようにしたので、文字画像を切り出して、その結果から文字画像の方向の認識を行う方法に比べて、簡易な処理で済ますことができる。
【図面の簡単な説明】
【図1】本発明の実施の形態に係るデジタル複写機の全体の構成を示す図である。
【図2】上記複写機に設置される制御部のブロック図である。
【図3】(a)は、中間色の地肌部分に文字画像が形成されている原稿の画像データが中間調処理部で2値化処理された場合の画像を示す図であり、(b)は、(a)と同一の原稿の画像データが単純2値化処理部において2値化処理された後の画像を示す図である。
【図4】原稿方向認識処理の全体の動作を示すフローチャートである。
【図5】(a)は、ノイズ除去フィルタ3×3により孤立点が除去される様子を示した図であり、(b)は、ノイズ除去フィルタ5×5により孤立点が除去される様子を示した図である。
【図6】(a)は、8ポイントの文字原稿の例を、(b)は、18ポイントの文字原稿の例をそれぞれ示す図であって、双方の文字原稿に同じ大きさの孤立点(ノイズ)が存在している様子を示した図である。
【図7】(a)は、通常原稿に基づいて生成されたヒストグラムの一例を示す図であり、(b)は、反転原稿に基づいて生成されたヒストグラムの一例を示す図である。
【図8】高濃度背景白抜き文字原稿と通常の文字原稿に基づいてそれぞれ生成されたヒストグラムの一例を示す図である。
【符号の説明】
10 原稿自動搬送装置
30 画像読取部
50 プリンタ部
100 制御部
110 画像信号前処理部
120 中間調処理部
130 高解像度画像メモリ
140 回転処理部
150 LD駆動部
160 解像度変換部
170 単純2値化処理部
180 低解像度認識用メモリ
190 CPU
191 RAM
192 ROM
203 高濃度背景白抜き文字原稿
204 通常原稿

Claims (5)

  1. 文字画像を含む原稿の方向を認識する装置であって、
    原稿を読み取って画像データを生成する画像読取手段と、
    前記画像データを記憶する画像データ記憶手段と、
    前記画像データから文字画像のサイズを検出する文字サイズ検出手段と、
    前記検出された文字サイズに応じて孤立点除去フィルタのフィルタサイズを決定するフィルタサイズ決定手段と、
    前記決定されたフィルタサイズの孤立点除去フィルタを用いて、前記画像データ記憶手段に記憶されている画像データ内の孤立点を除去する孤立点除去手段と、
    孤立点が除去された画像データに基づき前記原稿の方向を認識する画像方向認識手段と
    を備えることを特徴とする画像認識装置。
  2. 前記フィルタサイズ決定手段は、検出された文字サイズが所定のサイズ以下の場合には、フィルタサイズを第1のサイズに決定し、文字サイズが前記所定のサイズよりも大きな場合には、フィルタサイズを前記第1のサイズよりも大きな第2のサイズに決定することを特徴とする請求項1に記載の画像認識装置。
  3. 前記文字サイズ検出手段は、原稿の濃度分布を示すヒストグラムを前記画像データから生成し、これに基づいて文字サイズを検出することを特徴とする請求項1もしくは2に記載の画像認識装置。
  4. 前記文字サイズ検出手段は、生成されたヒストグラムに基づいて前記原稿の文字の線分の濃度が地肌部の濃度よりも低い濃度で表現されている反転原稿であるか否かを検出する反転原稿検出手段を備え、当該反転原稿検出手段が前記原稿を前記反転原稿であることを検出すると、生成されたヒストグラムを反転させて再生成し、これに基づいて文字サイズを検出することを特徴とする請求項3に記載の画像認識装置。
  5. 前記画像方向認識手段は、原稿の濃度分布を示すヒストグラムを孤立点が除去された画像データから生成し、これに基づいて文字画像の方向を認識することを特徴とする請求項1ないし4のいずれかに記載の画像認識装置。
JP19067298A 1998-07-06 1998-07-06 画像認識装置 Expired - Fee Related JP3629959B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP19067298A JP3629959B2 (ja) 1998-07-06 1998-07-06 画像認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP19067298A JP3629959B2 (ja) 1998-07-06 1998-07-06 画像認識装置

Publications (2)

Publication Number Publication Date
JP2000022899A JP2000022899A (ja) 2000-01-21
JP3629959B2 true JP3629959B2 (ja) 2005-03-16

Family

ID=16261981

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19067298A Expired - Fee Related JP3629959B2 (ja) 1998-07-06 1998-07-06 画像認識装置

Country Status (1)

Country Link
JP (1) JP3629959B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100367298C (zh) * 2004-03-04 2008-02-06 复旦大学 一种通用的用于符号识别的特征描述方法
JP5202263B2 (ja) * 2008-12-04 2013-06-05 キヤノン株式会社 画像処理装置、画像処理方法、及びコンピュータプログラム
JP5434265B2 (ja) * 2009-05-22 2014-03-05 三菱電機株式会社 領域分類装置、画質改善装置、映像表示装置、およびそれらの方法

Also Published As

Publication number Publication date
JP2000022899A (ja) 2000-01-21

Similar Documents

Publication Publication Date Title
JP3695163B2 (ja) 画像形成装置
US8009931B2 (en) Real-time processing of grayscale image data
US6266156B1 (en) Area judging apparatus
JPH0844827A (ja) デジタル複写機
JP3622994B2 (ja) バーコード記録装置
JP3671682B2 (ja) 画像認識装置
JP3629959B2 (ja) 画像認識装置
JPH06103410A (ja) 画像処理装置
JP4050371B2 (ja) 画像処理装置
JP3675181B2 (ja) 画像認識装置
JP3629969B2 (ja) 画像認識装置
JP3629962B2 (ja) 画像認識装置
JP3198267B2 (ja) 画像処理装置と画像形成装置
JP3974700B2 (ja) 画像形成装置および画像処理方法
EP0689166B1 (en) An automatic image quality controlling apparatus for use in an electronic copier
JP3135240B2 (ja) 画像処理装置
JPH09130516A (ja) 原稿画像の天地を認識できる画像処理装置
JPH0296885A (ja) 画像処理装置
JP3078421B2 (ja) デジタル画像形成装置及びデジタル画像形成装置のレーザ走査光補正方法
JP4132473B2 (ja) 画像処理装置及び画像形成装置
JPH05336341A (ja) 画像処理装置
JPH0554188A (ja) 画像処理装置
JPH10257325A (ja) 画像形成装置
JPH07334620A (ja) 画像処理装置
JP3320113B2 (ja) 画像形成装置

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041207

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071224

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081224

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081224

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091224

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101224

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101224

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111224

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111224

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121224

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131224

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees