JP3675181B2 - 画像認識装置 - Google Patents
画像認識装置 Download PDFInfo
- Publication number
- JP3675181B2 JP3675181B2 JP21669598A JP21669598A JP3675181B2 JP 3675181 B2 JP3675181 B2 JP 3675181B2 JP 21669598 A JP21669598 A JP 21669598A JP 21669598 A JP21669598 A JP 21669598A JP 3675181 B2 JP3675181 B2 JP 3675181B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- image
- histogram
- image data
- density
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
【発明の属する技術分野】
本発明は、複写機などの画像形成装置の原稿読取部に用いられ、読み取った原稿の方向を認識する画像認識装置に関する。
【0002】
【従来の技術】
原稿自動搬送装置(ADF)を用いて複数枚の原稿のコピーを行った場合、原稿セット台にセットした原稿の一部が他の原稿と逆方向なっていた場合でも、そのままコピーされ、当該一部の原稿は逆方向のまま記録紙上に再現され出力されるのが通常である。
【0003】
したがって、記録紙に再現される画像の方向を揃えたいのであれば、やはり、コピーしようとする原稿の方向を、複写機の利用者が一枚づつ確認し、揃えた上でコピーを行う必要がある。
しかし、このような確認作業は結構手間がかかるものであり、原稿枚数が多ければ、それだけ逆方向の原稿を見落とすおそれも大きくなる。この確認作業が不完全であると、出力された記録紙について、いちいち、その方向を変更するといった作業をしなければならない。さらに、複数部をソートしてコピーしたような場合にあっては、その部数回分上記した作業を繰り返さなければならず、その煩に耐えない。
【0004】
そこで、従来、読み取った原稿データから原稿の方向を認識し(このような原稿方向の認識を以下、「原稿方向認識」という。)、その画像出力が適切な方向になるように画像データを回転処理して出力する方法が種々提案されている。
原稿方向認識方法として、例えば、以下に記すような、原稿における文字画像の分布状況(文書のレイアウト情報)から原稿の方向を認識する方法がある。
【0005】
先ず、読み取った原稿の画像データに基づき、主走査方向と副走査方向について黒画素数を計数して得られるヒストグラムを作成する。
作成された二つのヒストグラムの内、度数0の領域とそうでない領域とが一定間隔で現れるような分布をしたヒストグラムが、その原稿の行方向を示していることになる。一般に、文字画像は行間が空白になっているからである。
【0006】
行方向が分かれば、他方のヒストグラムから、横書原稿の左右方向あるいは縦書原稿の上下方向を判別する。通常、各文は、横書であれば左側に、縦書であれば上側に(以下、当該左側、当該上側の両方を合わせて「行頭側」という。)詰めて書き始めるため、各文頭は行頭側で揃う一方、文末は区々になる。したがって、上記他方のヒストグラムにおいては、全体的に一方から他方向かって漸減するような分布、即ち、行頭側から行末側に向かって漸減するような分布状態となるので、その原稿の行頭側が判断できる。
【0007】
以上のようにして判断した行方向と行頭側とからその原稿における文書の先頭が判り、その結果、原稿方向の認識が可能となる。
【0008】
【発明が解決しようとする課題】
しかしながら、上記従来の方法は、文字が黒色で表現されることを前提としているため、雑誌等でよく見かける高濃度な背景画像に文字が白抜きで表現されているような原稿等にあっては、原稿方向の認識の精度が低下するといった事態が生じる。例えば、行頭側を認識するためのヒストグラムにあっては、上記した分布状態が、全く逆の傾向を示してしまうからである。
【0009】
上記の課題に鑑み、本発明は、原稿の種類にかかわらず、精度良く原稿方向の認識が行える画像認識装置を提供することを目的とする。
【0010】
【課題を解決するための手段】
上記の課題を解決するため、本発明に係る画像認識装置は、文字画像を含む原稿の画像データに基づいて、当該原稿の方向を画像方向認識手段によって認識する画像認識装置であって、前記画像データの濃度を反転させる濃度反転手段と、濃度反転手段による反転が行われると、前記画像方向認識手段は反転後の画像データに基づいて原稿の方向を認識することを特徴とする。
【0011】
また、前記濃度反転手段は、前記画像データの平均濃度が所定の基準濃度よりも高いか否かを判定する濃度判定部を含み、高いと判定した場合に、前記反転動作を実行することを特徴とする。
また、画像方向認識手段が反転前の画像データに基づいて原稿の方向が認識できなかったときに限り、濃度反転手段による反転動作を許可する反転許可手段を備えたことを特徴とする。
【0012】
上記の課題を解決するため、本発明に係る画像認識装置は、文字画像を含む原稿の方向を認識する画像認識装置であって、前記原稿の画像データから、当該原稿の濃度分布を示すヒストグラムを作成するヒストグラム作成手段と、作成されたヒストグラムを反転させるヒストグラム反転手段と、反転後のヒストグラムに基づいて、原稿方向を認識する原稿方向認識手段とを備えたことを特徴とする。
【0013】
また、前記ヒストグラム反転手段は、前記画像データの平均濃度が所定の基準濃度よりも高いか否かを判定する濃度判定部を含み、高いと判定した場合に、前記反転動作を実行することを特徴とする。
【0014】
【発明の実施の形態】
以下、本発明に係る画像認識装置の実施の形態を、デジタル複写機に適用した場合について説明する。
(1)デジタル複写機全体の構成
まず、デジタル複写機(以下、単に「複写機」という。)の全体の構成を図1により説明する。
【0015】
同図に示すように、この複写機は、原稿自動搬送装置10と、画像読取部30と、プリンタ部50と、給紙部70とからなる。
原稿自動搬送装置10は、原稿を自動的に画像読取部30に搬送する装置であって、原稿給紙トレイ11に載置された原稿は、給紙ローラ12、捌きローラ13により1枚ずつ分離されて下方に送られ、搬送ベルト14によって、プラテンガラス31上の原稿読取位置まで搬送される。
【0016】
原稿読取位置に搬送された原稿は、画像読取部30のスキャナ32によりスキャンされた後、再び、搬送ベルト14により図の右方向に送られ、排紙ローラ15を経て原稿排紙トレイ16上に排出される。
画像読取部30は、上記プラテンガラス31の原稿読取位置に搬送された原稿の画像を光学的に読み取るものであって、スキャナ32、CCDイメージセンサ(以下、単に「CCDセンサ」という。)38などから構成される。
【0017】
スキャナ32には、露光ランプ33とこの露光ランプ33の照射による原稿からの反射光をプラテンガラス31に平行な方向に光路変更するミラー34が設置され、図の矢印方向に移動することによりプラテンガラス31上の原稿をスキャンする。原稿からの反射光はミラー34に反射された後、さらにミラー35、36および集光レンズ37を介してCCDイメージセンサ38まで導かれ、ここで電気信号に変換されて画像データが生成される。なお、本実施の形態のCCDセンサ38の解像度は、400DPIとする。
【0018】
当該画像データは、制御部100内の画像信号前処理部110(図2参照)においてA/D変換されてデジタル信号となり、さらにシェーディング補正や濃度変換処理等を加えられた後、中間調処理部120へ送られ、公知の誤差拡散処理を加えられた後、高解像度画像メモリ130(同図2)に格納される。高解像度画像メモリ130に格納された画像データは、後述するようにCPU190でなされた原稿方向認識処理の結果に応じて回転処理され、プリンタ部50のレーザダイオード51の駆動信号となる。
【0019】
プリンタ部50は、公知の電子写真方式により記録シート上に画像を形成するものであって、上記駆動信号を受信するとレーザダイオード51を駆動してレーザ光を出射させる。レーザ光は、所定の角速度で回転するポリゴンミラー52側面のミラー面で反射され、fθレンズ53、ミラー54、55を介して、感光体ドラム56の表面を露光走査する。
【0020】
この感光体ドラム56は、上記露光を受ける前にクリーニング部57で感光体表面の残留トナーを除去され、さらにイレーサランプ(図示せず)の照射を受けて除電された後、帯電チャージャ58により一様に帯電されており、このように一様に帯電した状態で上記露光を受けると、感光体ドラム56表面に静電潜像が形成される。
【0021】
現像器59は、感光体ドラム56表面に形成された上記静電潜像を現像する。
一方、給紙部70には、2つの用紙カセット71、72が設けられており、上述の感光体ドラム56の露光および現像の動作と同期して、必要なサイズの記録シートが、用紙カセット71、72のいずれかから、給紙ローラ711もしくは721の駆動により給紙される。給紙された記録シートは、感光体ドラム56の下方で当該感光体ドラム56の表面に接触し、転写チャージャ60の静電力により、感光体ドラム56表面に形成されていたトナー像が当該記録シート表面に転写される。
【0022】
その後、記録シートは、分離チャージャ61の静電力によって感光体ドラム56の表面から剥され、搬送ベルト62により定着部63に搬送される。
記録シートに転写されたトナー像は、定着部63において内部にヒータを備えた定着ローラ64で加熱されながら押圧されることにより定着される。定着後の記録シートは、排出ローラ65により排紙トレイ66上に排出される。
【0023】
また、複写機前面の操作しやすい位置には、操作パネル90が設けられており、コピー枚数を入力するテンキーやコピー開始を指示するスタートキー、各種のコピーモードを設定するための設定キー、上記設定キーなどにより設定されたモードをメッセージで表示する表示部などが設けられている。
(2)制御部100の構成
次に、上記制御部100の構成を図2のブロック図を参照して説明する。
【0024】
同図に示すように、制御部100は、画像信号前処理部110、中間調処理部120、高解像度画像メモリ130、回転処理部140、LD駆動部150、解像度変換部160、単純2値化処理部170、低解像度認識用メモリ180、CPU190、RAM191及びROM192から成る。
画像信号前処理部110は、A/Dコンバータ、シェーディング補正部、MTF補正部、γ補正部などを備えており、400DPIの解像度で入力された原稿の画像データは、A/Dコンバータでデジタルの多値信号、例えば256(0〜255)階調のデータ値に変換され、シェーディング補正部でCCDセンサ38の感度ムラが補正された後、MTF補正部でエッジ強調などの画質改善のための処理を受け、γ補正部でγ補正処理を加えられた後に、中間調処理部120および解像度変換部160に送られる。
【0025】
中間調処理部120は、写真などのような濃淡(中間調)のある画像を含む原稿を忠実に再現するため、擬似中間調再現法によって、当該濃淡画像の階調再現処理を行うものであって、本実施の形態では公知の誤差拡散法が用いられる。画像信号前処理部110から送られてくる画像データは、当該誤差拡散処理において2値化される。なお、画像データが2値化される際の閾値(2値化レベル1)は、CPU190から設定されるようになっており、本実施の形態では2値化レベル1=64が設定されている。誤差拡散後のデータ値が64を越える画素については黒色(255)で、それ以下の画素については白色(0)で置き換えられる。このようにして2値化された画像データは、ページ単位で高解像度画像メモリ130に格納される。
【0026】
ここで、新聞を原稿とした画像データを中間調処理部120で2値化したものの一部を図3(a)に示す(画像201)。新聞などのように、中間調をした地肌に黒色の文字が表わされている原稿を中間調処理部120で2値化すると、本図に示すように、地肌領域は、黒点(黒画素)が散在した形で、文字領域は密集した形で表現される。目の積分効果により、人は、画像201の地肌領域を原稿(新聞)と同様な中間調であると感じ、文字領域は真っ黒であると感じるのである。
【0027】
原稿画像の濃淡部分は、その画像データが中間調処理部120で2値化されると、当該濃淡の程度に応じた間隔で黒画素が散在した形で表わされる。当該黒画素の間隔は、誤差拡散後の2値化処理における閾値(2値化レベル1)の大小によって決定される。即ち、閾値が小さいとより多くの画素を黒(255)に置き換えることとなり、閾値が大きいと黒に置き換わる画素の数は少なくなる。誤差拡散処理の目的は、原稿画像を忠実に再生することにあるため、当該閾値を極端に小さな値にすることはなく(濃淡部分が原稿画像よりも黒っぽく表現されてしまう)、また、極端に大きな値にすることもない(濃淡部分が原稿画像よりも白っぽく表現されてしまう)。この閾値の決定は、経験によるところが大きいが、256階調の真ん中よりも少し小さ目の値に設定されるのが通常であると思われる。
【0028】
図2に戻って、回転処理部140は、CPU190からの指示により高解像度画像メモリ130から目的のページの画像データを順次読み出して、後述する原稿方向認識処理の結果に基づき必要に応じて回転処理した後、LD駆動部150に転送する。なお、この回転処理は、画像データのメモリアドレスを変更する公知の技術(例えば、特開昭60−126769号公報)によってなされる。
【0029】
LD駆動部150は、転送されてくる画像データに基づいてレーザダイオード51の駆動信号を生成し、レーザダイオード51を駆動させる。
一方、解像度変換部160は、画像信号前処理部110から送られてくる画像データ(400DPI)を25DPIの低解像度画像データに変換する。この解像度変換処理は、公知の技術であって、400DPIの画像データの中から主走査方向と副走査方向にそれぞれ連続する16画素×16画素のマトリクスを1ブロックとして抽出し、この1ブロック中の256個の画素の中で最も階調データの値が高いものを取得して当該25DPIの1画素としての階調データ値とし、これを画像データ全体について行い、25DPIの画像データに変換するものである。
【0030】
このように画像データの解像度を低解像度に変換するのは、後述するヒストグラムによる原稿方向の認識のためには、原稿における文字の分布情報(文書のレイアウト情報)があれば足り、文字の形状がそのまま保存される高解像度である必要が無い一方、低解像度に変換することにより情報量が少なくなるため、その後の処理を高速化でき、また、当該情報を格納するためのメモリに安価なものが使用できることとなり、装置全体のコストダウンに寄与するからである。
【0031】
単純2値化処理部170は、解像度変換部160において25DPIに解像度変換された低解像度画像データを2値化して低解像度認識用メモリ180に格納する。単純2値化処理部170は、コンパレータを備えており、当該コンパレータで、低解像度画像データの各画素毎の階調データ値と2値化のための閾値(2値化レベル2)との大小比較をし、2値化レベル2よりも大きい画素は黒(255)に、2値化レベル2以下の画素は白(0)に、それぞれ置き換えら(2値化され)、低解像度認識用メモリ180に格納される。この場合の2値化レベル2は、上記2値化レベル1と同様にCPU190から設定されるようになっており、本例では、2値化レベル2=200が設定される。この2値化レベル2(=200)に前記した2値化レベル1(=64)よりも極端に大きな値を用いるのは、2値化レベル1の値が原稿画像を可能な限り忠実に再現する目的で設定される値であるのに対し、2値化レベル2は、原稿画像から可能な限り黒で表現される文字情報のみを抽出することを目的とするからである。即ち、2値化レベル2の値は、原稿画像データの内、通常は黒(255)又は黒に近い濃度で表現される文字のデータを抽出でき、かつ、それ以外のデータを可能な限り排除できるような値に設定する必要があるからである。なお、2値化レベル2は、この値200に限定されることはなく、文字以外の画像である中間調画像を極力除去できる値であればよい。
【0032】
ここで、上述した新聞の原稿を単純2値化処理部170において2値化処理させた後の一部を図3(b)に示す(画像202)。
画像信号前処理部110から送られてくる原稿の画像データの内、文字部分は、解像度変換部160において低解像度画像データに変換されたために、文字の線幅が太くなり、その結果として線間に隙間がなくなって文字部分が黒ベタとなって連結した柱状形になっている。一方、地肌部分は、解像度変換部160による処理直後には、所定の階調値としてその濃度情報は保存されているものの、その階調値のほとんどは200以下のため、2値化処理部170で白(0)画素に置き換えられている。即ち、低解像度認識用メモリ180には、文字の分布情報(文書のレイアウト情報)や文字サイズ(文字高さ)情報を含み、それ以外の情報は可能な限り排除された形の画像データが格納されることとなる。
【0033】
低解像度認識用メモリ180は、2値化された低解像度画像データをページ毎に格納する。
RAM191は、CPU190にてなされる後述するノイズ除去処理1あるいは2後の原稿画像データを記憶すると共に各種の制御変数などを一時記憶する。
ROM192は、原稿自動搬送装置10における原稿搬送動作や画像読取部30におけるスキャン動作やプリンタ部50における画像形成動作に関するプログラムおよび画像データを回転処理させるためのプログラムなどに加えて上述の2値化処理にて設定される2値化レベル1と2値化レベル2の値および後述の孤立点判定条件値が格納されている。
【0034】
CPU190は、ROM192から必要なプログラムを読み出して、2値化レベル1および2の値をそれぞれ設定し、あるいは後述する反転フラグを設定し、または低解像度認識用メモリ180に格納されている低解像度画像データを1ページ毎に読み出して後述するノイズ除去処理1あるいは2を行った後、ページ毎にRAM191に格納し、このデータからヒストグラムを生成し、これに基づいて文字の方向を認識して原稿方向を認識し、適切な方向で画像データが出力されるように回転処理部140に回転角信号を送出する原稿方向認識処理を行う。さらに、原稿自動搬送装置10、画像読取部30、プリンタ部50などの動作をタイミングを取りながら統一的に制御して円滑な複写動作を実行させる。
【0035】
上記したヒストグラムの作成及び作成されたヒストグラムに基づく原稿方向の認識は、例えば、特開平9ー9040号公報で開示されている公知の技術によって実現できるため、ここでは、その詳細な説明は省略し、概略を述べるにとどめる。
例えば、図7(a)に示す原稿D1を例にとって、説明する。原稿D1は、白地に黒色で文字が書かれている一般的な原稿(以下、「通常原稿」という。)である。CPU190は、原稿D1の、低解像度認識用メモリ180に格納されている画像データから、主走査方向について黒画素を計数してヒストグラムH1を、副走査方向について黒画素を計数してヒストグラムH2をそれぞれ作成する。これらヒストグラムH1,H2の内、低度数の領域と高度数の領域とが交互に現れるような分布を示すヒストグラムがその原稿の行方向を示すことになる。文字画像は一般的に行間が空白(度数0)になっているからである。本例では、ヒストグラムH1から、当該原稿D1の行の方向は、主走査方向にあることがわかる。
【0036】
行方向が分かれば、他方のヒストグラムH2から、その行頭側を判別する。当該行頭側は、「従来の技術」の項でも説明したように、ヒストグラムH2の分布の増減傾向から判断する。増減傾向は、ヒストグラムが急激に変化する部分(以下、「エッジ」という。)の数のカウント結果から判断する。ヒストグラムを度数軸(画素数を目盛った軸)と直交する軸方向(一方向)に見ていき、度数が増加するエッジ(以下、「立ち上がりエッジ」という。)と度数が減少するエッジ(以下、「立ち下がりエッジ」という。)の数をそれぞれ個別にカウントし、両カウント値の大小を比較する。その結果、立ち下がりエッジの数が立ち上がりエッジの数よりも多い場合には、そのヒストグラムは、前記一方向に漸減していると考えられ、その逆の場合には、前記一方向に漸増しているものと考えられる。例えば、ヒストグラムH2の場合、紙面左から右に向かう一方向に、両エッジの数をカウントすると、立ち上がりエッジは1個、立ち下がりエッジは5個となり、立ち下がりエッジの数が立ち上がりエッジの数よりも多いことが判る。よって、ヒストグラムH2は、紙面左から右に向かって、漸減していると考えられ、「従来の技術」の項でも説明したように、このことから、当該原稿の行頭側は、紙面に向かって左側であると判断できる。
【0037】
以上のようにして判断した行方向と行頭側とから原稿D1における文書の先頭は、紙面に向かって左上にあることが判り、その結果、原稿方向の認識が可能となる。
続いて、ヒストグラム作成の前処理を含めた原稿方向認識処理の手順を図4のフローチャートに基づいて説明する。
【0038】
CPU190は、まずノイズ除去処理1として、低解像度認識用メモリ180に格納されている低解像度画像データ内の孤立点をノイズとみなしてノイズ除去フィルタ3×3を用いて除去し、ノイズ除去後の画像データをRAM191に格納する(ステップS1、S2)。そして、RAM191に格納された画像データから、原稿画像中の文字画像の濃度分布を示すヒストグラムを生成する(ステップS3)。続いて生成されたヒストグラムから、原稿の平均濃度を求め、当該平均濃度が所定の基準濃度を越える高濃度であるか否かを判断し(ステップS4)、所定濃度を越えると判断した場合は、反転フラグを「1」に設定し(ステップS5)、当該ヒストグラムを反転させる(ステップS6)。
【0039】
次に、生成されたヒストグラムから、原稿の文字画像のサイズを検出し(ステップS8)、検出した文字サイズが所定のサイズよりも大きい場合には、ノイズ除去処理2としてノイズ除去フィルタのサイズを3×3よりも大きな5×5に変更して低解像度認識用メモリ180に格納された画像データ内の孤立点を除去して、これをRAM191に格納させ(ステップS9、S10)、上記ステップS3のヒストグラム生成処理と同様の処理を行いヒストグラムを再生成する(ステップS11)。そして、反転フラグが「1」であるか否かを判断し(ステップS12)、「1」の場合には、上記ステップS6のヒストグラム反転処理と同様の処理を行い、ステップS11で生成されたヒストグラムを反転させる(ステップS13)。反転フラグが「0」の場合には、ステップS14に移る。なお、図示していないが、ステップS13でヒストグラムの反転が行われた後に、上記反転フラグは、「0」にリセットされる。
【0040】
一方、検出された文字サイズが所定サイズ以下の場合には(ステップS8で「N」)、ステップS9〜S13を行わずにステップS14に移る。これは、ノイズ除去フィルタのサイズを3×3にして孤立点を除去し、これに基づいてヒストグラムを生成するという処理がステップS1〜S6の中ですでに行なわれているからである。従って、文字サイズが所定サイズ以下の場合には、ステップS9〜S13がスキップされることにより、ステップS1〜S6と同じ処理が実質的に選択されて行なわれたことになる。
【0041】
そして、上記ステップS3もしくはS11で生成されたヒストグラム、あるいはステップS6もしくはS13で反転されたヒストグラムに基づいて、原稿方向を1ページ毎に認識し、この認識結果に基づいて原稿の回転角度を設定する(ステップS14、S15)。この認識処理と回転角度設定処理は、公知の技術、例えば特開平9−9040号公報に開示されている技術により行う。
【0042】
次に、上記の各処理の主なものについて図5〜図8を用いてより具体的に説明する。
(ノイズ除去処理1)
図5(a)は、ノイズ除去処理1において用いられるノイズ除去フィルタ3×3(以下、「フィルタ3×3」という。)により、孤立点が除去される様子を示したものである。
【0043】
フィルタ3×3は、図に示すようにある1つの画素(注目画素)が黒色画素であって、かつその注目画素を取り囲む周辺画素が全て白色画素である場合に、その注目画素を白色画素に変更させることにより、孤立点を除去するものである。ノイズ除去処理1では、フィルタ3×3の中心部に各画素が位置するようにフィルタ3×3を順次移動させることにより、画像データ内の孤立点を除去する。
本実施の形態では、原稿画像が25DPIの解像度に画素分割されているので、1画素の大きさは、約1mm(縦)×約1mm(横)となる。従って、このフィルタ3×3を用いることにより、約1mm×約1mmの大きさの孤立点を除去できることになる。
【0044】
(文字サイズ検出処理)
生成される二つのヒストグラムの内、行方向を示すヒストグラムに基づいて、文字サイズを検出する。
例えば、図7(a)であれば、ヒストグラムH1から検出する。ヒストグラムH1の分布を見れば分かるように、ヒストグラムの谷の部分が行間を、山の部分が文字部をそれぞれ示している。従って、ヒストグラムH1の山の部分の幅方向(副走査方向)の画素数を計数すれば、文字の高さを求めることができ、この文字の高さから文字サイズを検出することができる。
【0045】
(ノイズ除去処理2)
ノイズ除去処理2では、検出された文字サイズが所定のサイズ、本実施の形態では12ポイントよりも大きい場合に、ノイズ除去処理1で用いたフィルタ3×3よりも大きなサイズのノイズ除去フィルタ5×5(以下、「フィルタ5×5」という。)に変更して画像データ内の孤立点を除去する。
【0046】
図5(b)は、フィルタ5×5により孤立点が除去される様子を示した図である。フィルタ5×5は、縦5画素×横5画素の平方領域における中央の9画素内(太線内)に、孤立点判定条件として設定される値(本実施の形態では4)以下の数の黒画素が存在している場合に、これを孤立点として除去する処理を行う。従って、フィルタ5×5では、フィルタ3×3では除去できない大きさの孤立点、例えば黒画素が2×2個連結しているものを除去できることになる。
【0047】
このように、本実施の形態では、原稿画像中に存在する孤立点を除去するのに際し、文字サイズが12ポイント以下の場合には、フィルタ3×3を用い、12ポイントを越える場合にフィルタ5×5を用い、といったように文字サイズに応じてフィルタを使い分けてノイズを除去している。
これは、ノイズとみなせる孤立点の大きさと文字サイズの大きさとを相対的な関係として捉えたからである。すなわち、文字のサイズが大きくなれば、ノイズとみなせる孤立点の大きさもそれに合わせて大きいものになると考えられるからである。原稿画像内に存在するノイズは、大きさがまちまちであり、文字と同程度の大きさのものもあれば、1画素程度の微小なものもあるが、上述したようにここでのノイズ除去処理は、可能な限り文字画像のみからヒストグラムを生成するために行うものなので、上記従来技術のような複雑な処理を用いてまで全てのノイズを除去する必要はなく、文字画像から離間している孤立点を極力除去できれば足りる。
【0048】
しかし、大小の孤立点の内でどれが文字画像かノイズかを判断できなければ、文字画像から離間している孤立点を除去することができない。
そこで、文字サイズを検出することにより、その大きさに相当する画像が文字を構成する画像であると判断すると共に、文字サイズよりもある程度小さな孤立点については、文字画像の構成部分とは考えにくいことから、これをノイズとみなすようにした。具体的には、本実施の形態では文字画像が12ポイント(文字高さが約4.2mm)以下であれば、その1/4程度の大きさ(高さが約1mm)の孤立点を除去できるフィルタ3×3を使用し、12ポイントを越える文字画像の場合には、最大2mm×2mmまでの孤立点を除去できるフィルタ5×5を使用するというように、文字サイズに応じてフィルタを切り換えるようにしている。
【0049】
図6(a)、(b)は、8ポイント(文字高さ約2.8mm)の文字原稿と18ポイント(文字高さ約6.3mm)の文字原稿に同じ大きさの孤立点(ノイズ)が存在している様子を示す図である。なお、この孤立点は、縦2mm×横2mmの大きさである。
この文字原稿に対して本実施の形態の原稿方向認識処理を行うと、まず8ポイント文字原稿については、ノイズ除去処理1のフィルタ3×3により孤立点除去処理が行われる。ところが、1mm×1mmの大きさの孤立点を除去するフィルタ3×3では、このノイズを除去できない。上述したように、文字サイズの半分以上の大きさの孤立点をノイズとみなすことはできず、逆にこれを除去しようとして、フィルタサイズを大きくすれば、文字画像の一部も除去されることになり不都合が生じるからである。
【0050】
一方、18ポイント文字原稿については、最大2mm×2mmまでの大きさの孤立点を除去できるフィルタ5×5を用いたノイズ除去処理2が行われるので、このノイズは除去されることになる。
このように、ノイズとみなす孤立点を文字サイズに応じて設定し、これを除去するフィルタを文字サイズに応じて切り換えて用いることにより、一定サイズのフィルタを用いるだけでは除去できない孤立点が的確に除去されるようになり、これによりノイズが可能な限り除去された画像データからヒストグラム生成されてより正確な原稿方向認識を行うことができる。
【0051】
なお、文字サイズに応じたフィルタサイズの切り換えは、2段階(12ポイント以下の場合にはフィルタ3×3、12ポイントよりも大きな場合にはフィルタサイズ5×5)に限定されないことはいうまでもなく、文字サイズに応じてノイズとみなせる孤立点を除去できるフィルタサイズを設定すればよいので、例えばポイント毎に異なるサイズのフィルタを準備しておいてそれぞれを適宜切り換えるようにしてもよいし、ポイント毎に上記孤立点判定条件を異なる値(1〜9まで設定可能)に設定するようにしてもよい。このようにすれば、さらに孤立点除去を的確に行える。
【0052】
また、上記では低解像度(25DPI)の画像データに対して、フィルタサイズを3×3と5×5を用いているが、例えば画像データが高解像度(400DPI)であれば、1画素の大きさが約63μm×63μmと小さくなるので、フィルタ3×3や5×5で除去できる孤立点の大きさもそれに合わせて小さくなる。このように解像度が変われば1画素の大きさが変わり、除去する孤立点の大きさに対応する画素数(例えば1mm平方の大きさの孤立点を考える場合、25DPIでは約1画素分に相当するが、400DPIでは、縦16×横16画素の領域に相当する)も変わるので、フィルタサイズは、孤立点の大きさに対応する画素数に応じて設定される必要がある。
【0053】
また、上記においてはノイズとみなす孤立点を文字サイズの1/4程度の大きさのものとしているが、もちろんこの値に限定されることはなく、例えば文字サイズの1/6程度や1/3程度の値などに設定するようにしてもよい。但し、この値が小さすぎるとより小さなノイズ除去精度が低下するし、大きすぎると文字画像の一部をもノイズとみなされて除去されることが考えられるので、実験等により最適な値に設定されることが好ましい。
【0054】
(ヒストグラム反転処理)
雑誌等でよく見かける高濃度の地肌に文字が白抜きで表現されているような原稿(以下、「反転原稿」という。)の場合、原稿方向の認識の精度が低下してしまうことがある。例えば、反転原稿の極端な例として、図7(b)に示す原稿D2を例にとって説明する。原稿D2は、内容は全く同じである原稿D1(同図(a))の白・黒を反転させたものである。即ち、原稿D2は、黒色の地肌に文字を白抜きで表現した原稿である。
【0055】
この原稿D2の画像データに基づいて主走査方向と副走査方向についてヒストグラムを作成するとそれぞれH3、H4のようになる。
ここで、副走査方向のヒストグラムH4について、原稿D1のヒストグラムH2のときと同様に、紙面左から右に向かう一方向に、立ち上がりエッジと立ち下がりエッジの数をカウントすると、立ち上がりエッジは6個、立ち下がりエッジは2個となり、立ち上がりエッジの数が立ち下がりエッジの数よりも多くなり、ヒストグラムH4は、紙面左から右にむかって漸増していると判断される。その結果、原稿D2の行頭側は、紙面に向かって右側にあると判定されるのであるが、この判定結果は、原稿D1の場合と逆であり、誤ったものとなっている。
【0056】
そこで、反転原稿の場合は、作成したヒストグラムを反転させることとする。ヒストグラムを反転させるとは、対象となるヒストグラムにおける度数の最大値をDmaxとした場合に、次式によって、反転後の度数を求めて、ヒストグラムを作成し直すことをいう。
(反転前の度数)+(反転後の度数)=Dmax … (1)
即ち、対象となるヒストグラムの各度数の当該ヒストグラムにおける最大度数に対する補数を反転後の度数としてヒストグラムを作成するのである。
【0057】
上記のようにして、原稿D2のヒストグラムH3、H4を反転させると、原稿D1のヒストグラムH1、H2と同様なものとなり、当該反転後のヒストグラムに基づいてなされる原稿方向の認識は正確なものとなる。
このように反転原稿の場合には、ヒストグラムを反転させ、反転後のヒストグラムに基づいて原稿方向の認識を行うことにより、その精度が向上する。
【0058】
原稿方向認識対象となっている原稿が反転原稿であるか否かは、当該原稿の平均濃度が所定の基準濃度を越えているか否かで判断する。平均濃度とは、当該原稿の全画素数に対する黒画素の総数の割合(%)をいう。図7に示す反転原稿D2は、通常原稿D1と比較して、原稿全体に占める黒画素の数が圧倒的に多い、即ち、平均濃度が圧倒的に高いため、平均濃度が所定の基準濃度を越えているものは、反転原稿とみなすこととしたのである。ここで、基準濃度は、経験的に求められるものであるが、よく見かける通常原稿の平均濃度は、10〜15%程度であるというデータが得られており、このことから、基準濃度は、40〜50%の範囲で定めれば、反転原稿の検出が可能になると思われる。
【0059】
なお、本実施の形態で平均濃度は、図4に示すフローチャートのステップS3で作成したヒストグラムH1とヒストグラムH2のどちらか一方の度数を合計すると、当該原稿の黒画素の総数が求まるので、これに基づいて算出することができる。
(3)変形例
なお、本発明は、上記実施の形態に限定されないのは言うまでもなく、以下のような変形例を考えることができる。
【0060】
(3−1)
上記実施の形態では、方向認識の対象となる原稿が反転原稿の場合には、ヒストグラムを反転させることとしたが、これに限らず、当該原稿の画像データを反転させ、反転後の画像データからヒストグラムを作成し、当該ヒストグラムに基づいて原稿方向の認識を行ってもよい。この場合のフローチャートを図8に示す。なお、当該フローチャートにおいては、ノイズ除去に関する処理は省略している。
【0061】
先ず、低解像度認識用メモリ180に格納されている画像データ1ページの平均濃度を算出する(ステップS21)。この場合には、当該1ページの黒画素数を計数し、当該計数結果を総画素数で除して求める。
続いて、平均濃度が所定の基準濃度を越えているか否かを判断し(ステップS22)、越えていれば、当該画像データの濃度を反転させてRAM191へ格納する。ここで、画像データの濃度を反転させるとは、当該画像データを表わすための階調値の最大値をKmax(本例では、Kmax=255)とした場合に、次式によって、当該画像データの各画素の階調値を変換することをいう。
【0062】
(反転前の階調値)+(反転後の階調値)=Kmax … (2)
即ち、画像データの各画素の階調値の最大階調値に対する補数を反転後の階調値として置き換えるのである。
なお、本例の場合、低解像度認識用メモリ180に格納されている画像データの階調値は0(白)と255(黒)の2通りしかないので、上記反転作業は、単に、黒画素を白画素に、白画素を黒画素に置き換える作業となる。
【0063】
一方、ステップS22で平均濃度が所定の基準濃度以下であると判断した場合は、ステップS23をスキップしてステップS24へ進む。
ステップS24〜S26で行う処理は、既に説明した図4のフローチャートのステップS3(S11)、S14、S15と同様なのでここでは、その説明を省略する。
【0064】
以上説明したように、本変形例においては、図7に示す原稿D1のような通常原稿の場合は、そのままの画像データに基づいてヒストグラムが作成され、原稿D2のような反転原稿の場合は、その画像データが反転され、反転後の画像データに基づいてヒストグラムが作成されることとなる。したがって、反転原稿の場合は、上記実施の形態でヒストグラムを反転させた場合と同様の効果が得られる。
【0065】
(3−2)上記の変形例では、ヒストグラムによって原稿の方向を認識する画像認識装置において、認識対象となる原稿が反転原稿であった場合に、先ず画像データを反転させることとしたが、この画像データの反転は、ヒストグラムによって原稿の方向を認識する画像認識装置に限らず、他の方法によるものに対しても有効である。
【0066】
他の方法として、例えば、特開平4−229763号公報や特開平6−103410号公報には、いわゆるパターンマッチングと呼ばれる方法が開示されている。
すなわち、予め所定の参照文字についてその線部分における複数の点(参照点)を抽出してパターンとして記憶しておき、原稿画像を読み取って得られた画像データから文字画像を切り出して、当該切り出された文字と参照点とを比較し、各参照点における文字の画像信号の有無を、切り出した文字画像を90゜ずつ回転させながら確認して各回転角における一致度を求める。その一致度が一番高い回転角を、当該文字の方向と認識し、これにより原稿方向の認識を行うようにしている。
【0067】
具体的には、例えば、図9(a)に示すように、参照文字「A」について6個の参照点A1〜A6を抽出して記憶しておき、切り出された文字画像が図9(b)に示すように「A」が90゜左方向に横向きになっている場合には、参照点A2、A5には文字の画像信号は存在しないので一致度は低く、この文字画像を90゜ずつ回転していき、参照点との一致度が最も高い回転角を求めてこれを文字の方向として認識するようにしている。
【0068】
しかしながら、上記の方法によっても、原稿方向が認識できないときがある。反転原稿が対象となった場合等である。なぜなら、反転原稿の場合、文字画像をいくら回転させても参照点にあたる箇所に画像信号が現れないからである。
このような場合に、画像データを反転させた上で、パターンマッチングすると、原稿方向の認識が可能となる場合がある。
【0069】
そこで、パターンマッチング等で原稿方向を認識する画像認識装置において、原稿の方向が認識できなかったときに限り、画像データの濃度反転を行い、反転後の画像データに基づいて、原稿の方向を認識することとしてもよい。
(3−3)上記実施の形態では、擬似中間調再現法として誤差拡散法を用いたが、これに限らず、例えば、ディザ法などを用いてもよい。
【0070】
(3−4)上記実施の形態では、モノクロのデジタル複写機に本発明に係る画像認識装置を適用した例を説明したが、本発明の画像認識装置は、フルカラーデジタル複写機にも適用可能である。その際、有彩色のカラーデータを予めキャンセルする回路を組み込んでおく必要がある。フルカラー原稿であっても文字画像は一般に黒色が大半であり、この黒色の文字画像に基づいてヒストグラムを生成し原稿方向の認識が行われるからである。なお、カラーデータキャンセル回路は公知であるので、ここでの説明は省略する。
【0071】
(3−5)上記実施の形態では、本発明に係る画像認識装置をデジタル複写機に適用した例を説明したが、その他の原稿の読取りが必要な装置、例えばファクシミリ装置やイメージリーダにおける画像認識装置としても適用される。
【0072】
【発明の効果】
以上説明したように、本発明に係る画像認識装置は、文字画像を含む原稿の画像データの濃度が反転され、反転後の画像データに基づいて原稿の認識がなされるので、例えば、高濃度背景に文字が白抜きで表わされているような原稿の方向認識の精度が高くなる。
【0073】
また、本発明に係る画像認識装置は、文字画像を含む原稿の画像データから作成されたヒストグラムが反転され、反転後のヒストグラムに基づいて原稿の認識がなされるので、例えば、高濃度背景に文字が白抜きで表わされているような原稿の方向認識の精度が高くなる。
【図面の簡単な説明】
【図1】本発明の実施の形態に係るデジタル複写機の全体の構成を示す図である。
【図2】上記複写機に設置される制御部のブロック図である。
【図3】(a)は、中間調の地肌部分に文字画像が形成されている原稿の画像データを中間調処理部で2値化処理した場合の画像を示す図であり、(b)は、(a)に示す画像データが単純2値化処理部において2値化処理された後の画像を示す図である。
【図4】原稿方向認識処理の全体の動作を示すフローチャートである。
【図5】(a)は、ノイズ除去フィルタ3×3により孤立点が除去される様子を示した図であり、(b)は、ノイズ除去フィルタ5×5により孤立点が除去される様子を示した図である。
【図6】(a)は、8ポイントの文字原稿の例を、(b)は、18ポイントの文字原稿の例をそれぞれ示す図であって、双方の文字原稿に同じ大きさの孤立点(ノイズ)が存在している様子を示した図である。
【図7】(a)は、通常原稿に基づいて生成されたヒストグラムの一例を示す図であり、(b)は、反転原稿に基づいて生成されたヒストグラムの一例を示す図である。
【図8】実施の形態の変形例における、原稿方向認識処理の全体の動作を示すフローチャートである。
【図9】いわゆるパターンマッチングによる原稿方向の認識方法を説明するための図である。
【符号の説明】
100 制御部
120 中間調処理部
170 単純2値化処理部
180 低解像度認識用メモリ
190 CPU
191 RAM
192 ROM
Claims (5)
- 文字画像を含む原稿の画像データに基づいて、当該原稿の方向を画像方向認識手段によって認識する画像認識装置であって、
前記画像データの濃度を反転させる濃度反転手段と、
濃度反転手段による反転が行われると、前記画像方向認識手段は反転後の画像データに基づいて原稿の方向を認識することを特徴とする画像認識装置。 - 前記濃度反転手段は、前記画像データの平均濃度が所定の基準濃度よりも高いか否かを判定する濃度判定部を含み、高いと判定した場合に、前記反転動作を実行することを特徴とする請求項1記載の画像認識装置。
- 画像方向認識手段が反転前の画像データに基づいて原稿の方向が認識できなかったときに限り、濃度反転手段による反転動作を許可する反転許可手段を備えたことを特徴とする請求項1記載の画像認識装置。
- 文字画像を含む原稿の方向を認識する画像認識装置であって、
前記原稿の画像データから、当該原稿の濃度分布を示すヒストグラムを作成するヒストグラム作成手段と、
作成されたヒストグラムを反転させるヒストグラム反転手段と、
反転後のヒストグラムに基づいて、原稿方向を認識する原稿方向認識手段とを備えたことを特徴とする画像認識装置。 - 前記ヒストグラム反転手段は、前記画像データの平均濃度が所定の基準濃度よりも高いか否かを判定する濃度判定部を含み、高いと判定した場合に、前記反転動作を実行することを特徴とする請求項4記載の画像認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP21669598A JP3675181B2 (ja) | 1998-07-31 | 1998-07-31 | 画像認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP21669598A JP3675181B2 (ja) | 1998-07-31 | 1998-07-31 | 画像認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000050051A JP2000050051A (ja) | 2000-02-18 |
JP3675181B2 true JP3675181B2 (ja) | 2005-07-27 |
Family
ID=16692481
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP21669598A Expired - Fee Related JP3675181B2 (ja) | 1998-07-31 | 1998-07-31 | 画像認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3675181B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4396450B2 (ja) | 2003-10-29 | 2010-01-13 | セイコーエプソン株式会社 | 視線誘導度算出システムおよび視線誘導度算出プログラム、並びに視線誘導度算出方法 |
-
1998
- 1998-07-31 JP JP21669598A patent/JP3675181B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2000050051A (ja) | 2000-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3695163B2 (ja) | 画像形成装置 | |
US6266156B1 (en) | Area judging apparatus | |
JPH0818777A (ja) | 画像処理装置 | |
JP3946038B2 (ja) | 画像処理装置および画像形成装置 | |
JP3622994B2 (ja) | バーコード記録装置 | |
JP4248633B2 (ja) | 画像読み取り装置およびディジタル複写機 | |
JP3492096B2 (ja) | 画像処理装置 | |
JP3671682B2 (ja) | 画像認識装置 | |
JP4031240B2 (ja) | 画像処理装置 | |
JP3675181B2 (ja) | 画像認識装置 | |
JP3629959B2 (ja) | 画像認識装置 | |
JP4050371B2 (ja) | 画像処理装置 | |
JP3423665B2 (ja) | 領域判別方法および装置 | |
JP3629969B2 (ja) | 画像認識装置 | |
JP2000287077A (ja) | 網点画像判別方法及び装置 | |
JP3135240B2 (ja) | 画像処理装置 | |
JP3629962B2 (ja) | 画像認識装置 | |
JP4984525B2 (ja) | 画像形成装置 | |
EP0689166B1 (en) | An automatic image quality controlling apparatus for use in an electronic copier | |
JP3688100B2 (ja) | 画像処理装置 | |
JPH0296885A (ja) | 画像処理装置 | |
JP2507927B2 (ja) | 画像処理装置 | |
JPH10257325A (ja) | 画像形成装置 | |
JP3857448B2 (ja) | 画像形成装置 | |
JPH07121063B2 (ja) | 画像処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041214 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20050121 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20050203 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050412 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050425 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090513 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090513 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100513 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110513 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120513 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130513 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140513 Year of fee payment: 9 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |