JP2000022897A - 画像認識装置 - Google Patents

画像認識装置

Info

Publication number
JP2000022897A
JP2000022897A JP10190670A JP19067098A JP2000022897A JP 2000022897 A JP2000022897 A JP 2000022897A JP 10190670 A JP10190670 A JP 10190670A JP 19067098 A JP19067098 A JP 19067098A JP 2000022897 A JP2000022897 A JP 2000022897A
Authority
JP
Japan
Prior art keywords
histogram
inclination
image data
document
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10190670A
Other languages
English (en)
Inventor
Kazuhiro Ueda
和弘 上田
Shoji Imaizumi
祥二 今泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Minolta Co Ltd
Original Assignee
Minolta Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Minolta Co Ltd filed Critical Minolta Co Ltd
Priority to JP10190670A priority Critical patent/JP2000022897A/ja
Publication of JP2000022897A publication Critical patent/JP2000022897A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)
  • Facsimile Scanning Arrangements (AREA)
  • Image Input (AREA)

Abstract

(57)【要約】 【課題】 原稿に記載された文書画像が傾いていたり、
画像入力装置に原稿が傾いて入力されたような場合でも
天地認識処理を行うことができる画像認識装置を提供す
ること。 【解決手段】 傾き量検出手段により検出された行の傾
き量に対応して、画像メモリからの読み出しアドレスを
生成することにより、傾き量を補正したヒストグラムを
作成し、作成されたヒストグラムを用いて天地認識を行
う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、イメージリーダや
複写機等において読み込まれる原稿の方向を認識する画
像認識装置に関する。
【0002】
【従来の技術】従来、例えば、自動原稿搬送装置(Auto
Document Feeder、以下、「ADF」という。)を備え
た複写機において、複数枚の原稿を連続して読み取って
コピーする場合、読み取られた原稿の向きに応じてコピ
ーが排出されるので、原稿をADFにセットする際に、
各原稿が一律に同じ方向を向いているか否かを確認する
必要があった。しかし、このような確認作業は結構手間
がかかるものであり、原稿枚数が多ければ、それだけ反
対方向の原稿を見落とすおそれも多くなる。
【0003】このような不都合を避けるため、読み取っ
た画像データからまず原稿の向きを判別し(このような
原稿方向の判別を、以下、「天地認識」という。)、そ
の画像出力が適切な方向になるように画像データを回転
処理して出力する方法が考えられている。天地認識の方
法は種々考案されており、例えば、特開平9−9040
号公報には、原稿の中で文書画像と認識される部分に関
し、主走査方向及び副走査方向についてのヒストグラム
を取得することにより、天地認識を行う技術が開示され
ている。
【0004】図16は、上記従来の天地認識の方法につ
いて説明するための図である。同図に示されるように、
画像入力装置に入力された文書画像データから、主走査
方法及び副走査方向に関して取得されたヒストグラムを
用いて、文字行の向きや、行の先頭の文字位置を認識す
ることにより、文書画像の天地認識を行うことができ
る。
【0005】より具体的には、取得されたヒストグラム
の立ち上がりエッジ及び立ち下がりエッジの数の和、及
び両者の差を、主走査方向のヒストグラム及び副走査方
向のヒストグラムについてそれぞれ算出する。図16に
示したような横書きの文書画像であれば、主走査方向の
ヒストグラム(a)の立ち上がりエッジの数と立ち下が
りエッジの数がほぼ等しくなる他、両者の和は、副走査
方向のヒストグラム(b)と比較して多くなる。主走査
方向のヒストグラム(a)には、行を表すピークと、行
間に相当するピークのない部分が交互に検出されるから
である。
【0006】また、図16の例における副走査方向のヒ
ストグラム(b)からは、行の先頭の文字位置を認識す
ることができる。即ち、行の先頭の文字位置は比較的一
定しているため、ヒストグラムの立ち上がりエッジが数
箇所に集中するのに対し、行の最後の文字位置は、文章
によってまちまちであり、従って行の最後の文字位置に
よるヒストグラムの立ち下がりエッジは、比較的分散し
て発生するので、その立ち上がりエッジ数と立ち下がり
エッジ数の差が大きければ当該原稿の上下を認識でき
る。
【0007】以上のような認識により、文字行の向き
と、行の先頭の文字位置を検出することができ、かかる
検出結果に基づいて天地認識を行うことができる。これ
らの認識は、縦書きの原稿についても適用することが可
能である。
【0008】
【発明が解決しようとする課題】しかしながら、上記従
来の技術では、例えば原稿がADFを介してセットされ
る際に傾いてしまった場合や、原稿自体がコピーされた
ものであり、当該元の原稿をコピーする際に傾いて印刷
されていた場合など、原稿に印刷された行自体が傾いて
いるような場合に、正確な天地認識ができないという問
題があった。
【0009】即ち、行が傾いている場合には、図17に
示すように行間や、先頭の文字位置を正確に認識するこ
とが可能なヒストグラムを取得することができず、取得
されたヒストグラムを用いて天地認識を行っても正確な
認識を行うことができないからである。本発明は、上記
の問題点に鑑み、原稿が傾いている場合や、原稿に記載
された行が傾いているような場合でも、天地認識を行う
ことができる画像認識装置を提供することを目的とす
る。
【0010】
【課題を解決するための手段】上記課題を解決するため
に、本発明の画像認識装置は、画像入力装置に入力され
た文書画像データを認識する画像認識装置であって、画
像入力装置に入力された文書画像データを格納する画像
メモリと、前記画像メモリに格納された文書画像データ
から、文書画像データにより表される行の傾き量を検出
する傾き量検出手段と、前記傾き量検出手段により検出
された傾き量に基づき、前記文書画像データから前記傾
き量を補正したヒストグラムを作成するために、前記画
像メモリにアクセスするサンプリングアドレスを生成す
るアドレス生成手段と、前記アドレス生成手段により生
成されたサンプリングアドレスに従って、前記画像メモ
リから文書画像データを読み出し、ヒストグラムを作成
するヒストグラム作成手段と、前記ヒストグラム作成手
段により作成されたヒストグラムから、文書画像データ
の原稿方向を認識する原稿方向認識手段とを備えたこと
を特徴とする。
【0011】ここで、前記画像メモリには、解像度変換
により、画像入力装置に入力された文書画像データより
も低解像度の画像データに変換されたデータが格納され
ることが好ましい。
【0012】
【発明の実施の形態】以下、本発明に係る画像認識装置
の一実施の形態を、図面を参照しながら説明する。 (1)デジタル複写機全体の構成 まず、本発明に係る画像認識装置が適用されるデジタル
複写機(以下、単に「複写機」という。)の全体の構成
を図1により説明する。
【0013】同図に示すように、この複写機は、ADF
10と、画像読取部30と、プリンタ部50と、給紙部
70とからなる。ADF10は、原稿を自動的に画像読
取部30に搬送する装置であって、原稿給紙トレイ11
に載置された原稿は、給紙ローラ12、捌きローラ13
により1枚ずつ分離されて下方に送られ、搬送ベルト1
4によって、プラテンガラス31上の原稿読取位置まで
搬送される。
【0014】原稿読取位置に搬送された原稿は、画像読
取部30のスキャナ32によりスキャンされた後、再
び、搬送ベルト14により図の右方向に送られ、排紙ロ
ーラ15を経て原稿排紙トレイ16上に排出される。画
像読取部30は、上記プラテンガラス31の原稿読取位
置に搬送された原稿の画像を光学的に読み取るものであ
って、スキャナ32、CCDカラーイメージセンサ38
などから構成される。
【0015】スキャナ32には、露光ランプ33とこの
露光ランプ33の照射による原稿からの反射光をプラテ
ンガラス31に平行な方向に光路変更するミラー34が
設置され、図の矢印方向に移動することによりプラテン
ガラス31上の原稿をスキャンする。原稿からの反射光
はミラー34に反射された後、さらにミラー35、36
および集光レンズ37を介してCCDカラーイメージセ
ンサ(以下、「CCDセンサ」という)38まで導か
れ、ここで電気信号に変換されて画像データが生成され
る。
【0016】当該画像データは、制御部100内の画像
信号処理部110(図2参照)においてA/D変換され
てデジタル信号となり、さらにシェーディング補正や濃
度変換処理等を加えられた後、さらに公知の誤差拡散処
理等を加えられた後、高解像度画像メモリ120(同図
2)に格納される。高解像度画像メモリ120に格納さ
れた画像データは、後述するようにCPU190でなさ
れた天地認識の結果に応じて回転処理され、プリンタ部
50のレーザダイオード(以下、「LD」とも表記す
る。)51の駆動信号となる。
【0017】プリンタ部50は、公知の電子写真方式に
より記録シート上に画像を形成するものであって、上記
駆動信号を受信するとレーザダイオード51を駆動して
レーザ光を出射させる。レーザ光は、所定の角速度で回
転するポリゴンミラー52側面のミラー面で反射され、
fθレンズ53、ミラー54、55を介して、感光体ド
ラム56の表面を露光走査する。
【0018】この感光体ドラム56は、上記露光を受け
る前にクリーニング部57で感光体表面の残留トナーを
除去され、さらにイレーサランプ(図示せず)の照射を
受けて除電された後、帯電チャージャ58により一様に
帯電されており、このように一様に帯電した状態で上記
露光を受けると、感光体ドラム56表面に静電潜像が形
成される。
【0019】現像器59は、感光体ドラム56表面に形
成された上記静電潜像を現像する。一方、給紙部70に
は、2つの用紙カセット71、72が設けられており、
上述の感光体ドラム56の露光および現像の動作と同期
して、必要なサイズの記録シートが、用紙カセット7
1、72のいずれかから、給紙ローラ711もしくは7
21の駆動により給紙される。給紙された記録シート
は、感光体ドラム56の下方で当該感光体ドラム56の
表面に接触し、転写チャージャ60の静電力により、感
光体ドラム56表面に形成されていたトナー像が当該記
録シート表面に転写される。
【0020】その後、記録シートは、分離チャージャ6
1の静電力によって感光体ドラム56の表面から引き剥
され、搬送ベルト62により定着部63に搬送される。
記録シートに転写されたトナー像は、定着部63におい
て内部にヒータを備えた定着ローラ64で加熱されなが
ら押圧されることにより定着される。定着後の記録シー
トは、排出ローラ65により排紙トレイ66上に排出さ
れる。
【0021】また、画像読取部30の前面の操作しやす
い位置には、操作パネル90が設けられており、コピー
枚数を入力するテンキーやコピー開始を指示するスター
トキー、各種のコピーモードを設定するための設定キ
ー、上記設定キーなどにより設定されたモードをメッセ
ージで表示する表示部などが設けられている。 (2)制御部100の構成 次に、本実施の形態において、上記複写機の内部に設置
される制御部100の構成を、図2のブロック図を参照
しながらより詳細に説明する。
【0022】同図に示すように制御部100は、画像信
号処理部110と、高解像度画像メモリ120と、回転
処理部130と、LD駆動部140と、解像度変換部1
60と、低解像度認識用メモリ180と、CPU190
等からなる。画像信号前処理部110は、A/Dコンバ
ータ、シェーディング補正部、MTF補正部や、変倍
部、γ補正部などを備えており、CCDセンサ38より
入力された原稿の画像データは、A/Dコンバータでデ
ジタルの多値信号に変換され、シェーディング補正部で
露光ランプ33の照度ムラやCCDセンサ38の感度ム
ラが補正された後、MTF補正部でエッジ強調などの画
質改善のための処理を受け、さらに変倍部やγ補正部で
それぞれ変倍処理、γ補正処理を加えられた後に、高解
像度画像メモリ120および解像度変換部160に送ら
れる。
【0023】回転処理部130は、高解像度画像メモリ
120から目的のページの画像データを読み出して、C
PU190からの回転角情報に基づき、必要に応じて画
像データを回転処理してから、LD駆動部140に転送
する。なお、この回転処理は、画像データのメモリアド
レスを変更する公知の技術(例えば、特開昭60ー12
6769号公報参照)によってなされる。
【0024】LD駆動部140は、高解像度画像メモリ
120から出力された画像データについて、内部のRO
Mに格納された制御プログラムに基づいてLD51へ送
り、記録シートへの画像形成を実行する。解像度変換処
理部160は、画像信号処理部110を経由した高解像
度画像データを低解像度の画像データに変換する。解像
度変換された画像データは低解像度認識用メモリ180
に書き込まれ、CPU190による、以後の傾き検出処
理等に利用される。本実施の形態では、CCDセンサ3
8で読み取られた400DPIまたは600DPIの画
像データを、25DPIまたは40DPIの低解像度に
変換する。解像度変換は、具体的には、例えば縦4画素
×横4画素の16画素を取り出し、取り出された16画
素の濃度の最大値を取得して、それを1画素の濃度とす
る処理を、所定の解像度となるまで繰り返し実行するこ
とにより行うことができる。 (3)制御部100の処理 制御部100は、CCDセンサ38により読み取られた
原稿の文書画像データに基づき、文書画像の傾きの検出
処理(以下、単に「傾き検出処理」という。)、前記傾
き検出処理で得られた文書画像の傾きに基づいて、当該
傾きを補正したヒストグラム(以下、「傾斜ヒストグラ
ム」という。)を取得する処理(以下、「傾斜ヒストグ
ラム取得処理」という。)、及び文書画像の行の方向を
判別して、適切な方向で文書画像データが出力されるよ
うに回転処理部130に回転角情報を出力する原稿方向
判別処理(すなわち天地認識処理)を行う。
【0025】なお、本実施の形態では、天地認識処理に
は、上記従来の技術として説明した特開平9−9040
号公報に開示されている方法を用いる。傾き検出処理、
傾斜ヒストグラム取得処理は、低解像度認識用メモリ1
80に格納された解像度変換処理後の文書画像データに
基づいてCPU190で実行される。以下、CPU19
0の処理内容について詳細に説明するが、これらの処理
を指示するプログラムはROM192に格納されてお
り、また必要に応じてRAM91が作業用のメモリ領域
として利用される。
【0026】図3は、本実施の形態における天地認識処
理全体の内容を示すフローチャートである。本実施の形
態のCPU190は、解像度変換され低解像度認識用メ
モリ180に格納された文書画像データを、メモリ上
で、原稿上の短冊状の領域に対応する部分に分割し、分
割されたそれぞれの領域についてのヒストグラム(以
下、「短冊状ヒストグラム」という。)を作成する。し
かし、例えば文書が縦書きか横書きか等により、主走査
方向に分割した方がよい場合と、副走査方向に分割した
方がよい場合とが有り得るため、まず、いずれの方向に
分割するかを決定する分割方向決定処理を行う(S3
1)。
【0027】ここで、分割方向の決定について説明する
に際し、まず、短冊状ヒストグラムについて説明する。
図4は、短冊状ヒストグラムについて説明するための図
である。まず、図4(a)に示すように、横書きの文書
画像データを副走査方向に短冊状に分割するとする。分
割された領域には、例えば同図に示されるように1から
4の領域番号が付される。なお、本実施の形態では、同
図(a)に示されるように原稿に記載された文字行が傾
きを有する場合について説明するが、文書画像データ自
体は傾いておらず、原稿が傾いて入力された場合も同様
に処理することができる。
【0028】短冊状に分割されたそれぞれの領域につい
てヒストグラムを取得することが可能である。図4
(b)に、得られた短冊状ヒストグラムの一例を模式的
に示す。本実施の形態の傾き量検出装置は、短冊状ヒス
トグラムに現れた各ピークの代表点を順次接続した線分
の傾きが、文書画像の行の傾きにほぼ一致するという前
提に基づくものである。即ち、同図の例では原稿に記載
された文書が横書きであるため、副走査方向に分割して
いるが、文書が縦書きである場合には、後述の処理によ
り傾き量を検出するためには主走査方向に分割した方が
よい。
【0029】かかる分割方向の決定について、以下に説
明する。図5は、分割方向決定処理の内容を示すフロー
チャートである。分割方向決定処理では、まず原稿の主
走査方向中央部から、副走査方向に平行に幅の狭い短冊
状領域を切り出し、当該部分から文書画像データのヒス
トグラムを取得する(S501)。例えばADF10を
用いた場合に発生しうる原稿の傾きは、大きくても3°
程度なので、原稿中央部のみのヒストグラムの立ち上が
りエッジ及び立ち下がりエッジの数を計測すると、ほぼ
文書画像の行の方向を識別するすることが可能である。
ここで、文書の行方向が主走査方向であると判断された
場合には(S502:Yes)、副走査方向に文書画像
データを分割し(S503)、行方向が副走査方向であ
ると判断されば場合には(S503:No)、主走査方
向に文書画像データを分割する(S504)。なお、ス
テップS501におけるヒストグラムの取得について
は、後述の短冊状ヒストグラムの作成と同様の方法が利
用できるので、ここでの詳細な説明は省略する。また、
分割方向の決定には、上述のように画像中央部について
のヒストグラムを取得する他、主走査方向及び副走査方
向の両方について、画像データ全体のヒストグラムを取
得して比較することにより決定する方法もある。
【0030】以上のような処理により、文書画像データ
の分割方向を決定した後で、短冊状ヒストグラム作成処
理を行う(S32)。図6は、短冊状ヒストグラム作成
処理の内容を示すフローチャートである。まず、文書画
像データをいくつの領域に、およびどの程度の幅に分割
するかを決定する必要があるため、分割数及び分割幅の
決定処理を行う(S601)。この分割数及び分割幅
は、予め固定しておいてもよいし、分割の際に一定の条
件を設定して動的に決定するようにしてもよい。例え
ば、画像データ全体のヒストグラムを作成し、作成され
たヒストグラムのピークの高さに応じて、分割するべき
領域の数を増減する方法等が考えられる。具体的には、
ピークが高い場合には、分割数を増やし、ピークが低い
場合には、傾きの決定に必要な高さのピークを得るため
分割数を少なくすることが可能である。
【0031】なお、本実施の形態では、同一の幅で四つ
の領域に分割するように予め決定されているものとして
説明を続ける。なお、領域の幅は、全ての領域について
同一としてもよいし、領域ごとに異なっていてもかまわ
ない。検出されるべき文書画像データの傾きは、分割さ
れた領域の幅により影響を受けないからである。次に、
初期設定として、領域番号を表す変数pの初期値として
1を設定し(S602)、副走査方向に第何行目に相当
するアドレスに存在する一連の画素値を読み出すかを表
す変数nに1を設定する(S603)。また、変数nで
設定された行について、主走査方向に第何番目のアドレ
スに存在する画素の画素値を読み出すかを表す変数mに
も1を設定する(S604)。
【0032】次に、変数n及び変数mの値に基づいて、
ヒストグラムを作成するための低解像度画像メモリの読
み出しアドレスの算出を行う(S605)。算出された
読み出しアドレスに基づいて、主走査方向に並ぶ画素の
うち、変数mで指定された画素の画素値を読み出す(S
606)。ここで、読み出された画素値が所定の閾値t
hld以上である場合に(S607:Yes)、ヒスト
グラムを得るためのカウンタを加算していく(S60
8)。
【0033】以上の処理を、変数nで指定された行に存
在する一連の画素について行うことにより、第n番目の
行についてのヒストグラムデータが求められる(S60
9〜S610)。なお、ステップS610において、m
_maxとは、短冊状領域の一つの行に存在する画素の
数を意味する。一つの行についてのヒストグラムデータ
を取得すると、取得されたヒストグラムデータを格納し
(S611)、さらに変数nの値を加算しながら、副走
査方向に並ぶ全ての行について上記の処理が終了するま
で処理を継続する(S612〜S613)。即ち、ステ
ップS613におけるn_maxは副走査方向の行数で
ある。
【0034】以上の処理を、変数pの値を加算しながら
分割された各々の領域について実行することにより、全
ての領域についての短冊状ヒストグラムを得ることがで
きる(S614〜S615)。本実施の形態では、文書
画像データを四つの領域に分割しているため、p_ma
xの値は4となる。短冊状ヒストグラムの作成を終了す
ると、図3のフローチャートに戻って、傾き検出処理を
行う(S33)。以下、傾き検出処理の詳細な内容につ
いて説明する。
【0035】図7は、傾き検出処理の詳細な内容を示す
フローチャートである。傾き検出処理では、まず、短冊
状ヒストグラムのピークの重心位置の座標を、分割され
た各領域ごとに検出してメモリ領域に格納する重心位置
検出処理を行う(S701)。ここで、「重心位置」と
は、具体的には、図8(a)に示すような一定幅以下の
ヒストグラムのピークが存在する場合において、その立
ち上がり位置と、立ち下がり位置の中点(ピーク底辺の
中点)を副走査方向の座標とし、ピーク底辺の中点か
ら、ピーク頂点方向への半直線と、各短冊領域の主走査
方向を二等分する直線とが交わる点を重心Gとする。な
お、本実施の形態では、重心位置は、各ピークの副走査
方向の位置を示す代表点としての意味を持つものである
から、例えば単にヒストグラムのピークの底辺の中点を
重心とすることも可能であるし、ピーク底辺の下端を代
表点とすることもできる。
【0036】図8(b)には、二つのヒストグラムのピ
ークの重心位置から、文書画像の傾きθを求めることが
できる様子を表す。上記図8(a)より、重心位置の座
標は、各々の領域ごとにヒストグラムの度数を順次検出
していくことにより求めることができる。ヒストグラム
の高さが0でなくなった位置と、再度0に戻った位置と
の中点がピークの副走査方向の位置となる。本実施の形
態では、領域ごとの主走査方向の座標は予め決定されて
いるため、重心位置の決定は容易であるが、分割数及び
分割幅が予め決定されていない場合でも、それらを決定
する際に、それぞれの領域の主走査方向の中点を求めて
おけば、同様に処理することができる。
【0037】図9は、重心位置検出処理の詳細な内容を
示すフローチャートである。重心位置検出処理では、ま
ず、領域番号を表す変数pにまず1を設定し(S90
1)、各々の領域内におけるピークの番号を表す変数q
にも1を設定する(S902)。その後、副走査方向
(または、分割の方向により主走査方向。以下同様)の
位置を表す変数nにも1を設定し(S903)、変数n
を加算しながら副走査方向に短冊状ヒストグラムを走査
していく。即ち、ヒストグラムの高さhが0でない位置
(立ち上がりエッジ)を検知すると、そのピークの開始
位置における変数nの値を一時的な記憶領域に格納す
る。具体的には、短冊状ヒストグラムの高さhが0でな
い場合に(S904:No)、当該0でなくなった位置
における変数nの値n1を一時的な記憶領域に格納し
(S905)、nの値を加算しつつ(S906)さらに
走査を続ける。
【0038】その後、再びヒストグラムの高さhが0と
なった場合(立ち下がりエッジ)には(S907:Ye
s)、ピークの幅wを検出し(S908)、例えば、検
出されたピークの幅wが所定の閾値thw以下である場
合に(S909:Yes)、ピークの重心位置を算出し
(S910)、RAM191に確保されたメモリ領域に
格納する(S911)。ここで、ピークの幅wが、所定
の閾値以下であるか否かを判定するのは、あまり幅の広
いピークが現れた場合に、当該行に図や写真等の情報が
含まれている可能性があり、かかる情報を傾き検出に用
いるのは適当でないという理由による。
【0039】重心位置がメモリ領域に格納された場合に
は、ピーク番号を表す変数qに1を加算し(S91
2)、さらに短冊状ヒストグラムの走査を継続する。な
お、ステップS904においてヒストグラムの高さhが
0のままである場合には(S904:Yes)、nの値
を加算し(S913)、nの値が最大値に達するまでヒ
ストグラムの走査を継続する。
【0040】最初の領域の走査を終了すると(S91
4:Yes)、領域番号を表す変数pに1を加算して
(S915)、次の領域に移動し同様の処理を行う。最
後の領域まで処理を終了すると(S916:Yes)、
重心位置検出処理は終了する。図10は、メモリ領域に
格納されたピークの重心位置の情報の一例を示す図であ
る。同図に示されるように、重心位置の情報としては、
領域番号と、各々の領域内におけるピーク番号に対応さ
せて重心位置の座標が格納される。本実施の形態では、
低解像度認識用メモリ180において、主走査方向のア
ドレスと、副走査方向のアドレスとを座標に変換した形
式で保持している。
【0041】以上のようにピークの重心位置の検出処理
が終了すると、図7のフローチャートに戻って、最初の
領域の第1ピークを基準ピークとして設定し(S70
2)、基準ピークを比較基準ピークとして設定する(S
703)。次に、比較基準ピークが存在する領域の隣の
領域において、比較基準ピークに最も近いピークを検出
する(S704)。図11は、この処理について説明す
るための図である。同図に示されるように、比較基準ピ
ークをAとすると、ピークAが存在する領域の隣の領域
に存在するピークの中で、ピークAの重心位置の副走査
方向の座標yaと、座標ybとの差が最も小さい位置に
重心を有するピークBが、傾き検出に用いるピークとし
て検出される。
【0042】さらに、検出されたピークと比較基準ピー
クとの重心位置の差(yb−ya)を算出し、メモリ領
域に格納する(S705)。図12は、重心位置の差と
してメモリ領域に格納される情報の内容の一例を示す図
である。同図に示されるように、重心位置の差の情報
は、図11の例であれば両者の副走査方向の座標の差
(yb−ya)が、基準ピークの情報(領域番号p及び
ピーク番号q)及び比較基準ピークの情報(領域番号p
及びピーク番号q)と対応づけられて格納されることと
なる。
【0043】以上のように重心位置の差の情報を格納し
た後、比較基準ピークの存在する領域が最後の領域の一
つ前の領域であるか否かを判定し(S706)、最後の
領域でなければ(S706:No)、ステップS704
で検出された隣の領域のピークを比較基準ピークに設定
して(S707)、ステップS704に戻る。ステップ
S706において、比較基準ピークの存在する領域が最
後の領域の一つ前であった場合には(S706:Ye
s)、基準ピークが当該領域における最後のピークであ
るか否かを判定し(S708)、最後のピークでない場
合には(S708:No)、基準ピークを同じ領域に存
在する次のピークに移動して(S709)、ステップS
703へと戻る。
【0044】ステップS708において、基準ピークの
領域が当該領域内での最後のピークであった場合には
(S708:Yes)、基準ピークが設定された領域
が、最後の領域の一つ前の領域であるか否かを判定する
(S710)。これは、最後の領域の一つ前の領域の最
後のピークであれば、それ以上傾きデータを取得する必
要がないことを意味するからである。
【0045】基準ピークが設定された領域が、最後の領
域の一つ前の領域でない場合には(S710:No)、
次の領域に存在するピークを基準ピークとして設定すべ
く、次の領域の最初のピークを基準ピークとして設定し
(S711)、ステップS703へと戻る。即ち、以上
の処理では、各々の基準ピークから、主走査方向に向け
て、傾き量の検出に用いるピークの重心位置の副走査方
向の座標の差分を順次検出していくことになる。
【0046】ステップS710において、基準ピークの
領域が最後から一つ前の領域であった場合には(S71
0:Yes)、文書画像の傾きの検出に必要な傾きデー
タが全て取得できたことを意味するので、実際の傾きを
検出するための処理を実行すべくステップS712へと
進む。ステップS712では、各基準ピークごとに取得
された傾きデータから、基準ピークごとの平均の傾きを
算出する。即ち、本実施の形態の傾き検出処理では、基
準ピークごとに複数の比較基準ピークが設定され、各々
の比較基準ピークから隣の領域に存在するピークの重心
位置への傾きを検出しているので、それぞれの基準ピー
クについて算出された傾きデータの平均値をメモリ領域
に格納していく。本実施の形態では、傾きデータは、傾
きをθとした場合のtanθの値として検出する。これ
は、傾き検出後に傾斜ヒストグラムを作成するにあた
り、必要な値がtanθだからである。tanθは、図
11に示したように、重心位置の座標の差(yb−y
a)、及び短冊状に分割された領域の幅xa(本実施の
形態では、全ての領域について分割幅が同一であるた
め、xaは領域の幅と同一と考えて問題ない。分割幅が
異なる場合には、二つの分割幅の1/2ずつの値を加算
する必要がある。)から、以下の数1にて表される。
【0047】
【数1】tanθ=(yb−ya)/xa 図13は算出された平均傾きの内容の一例を示す図であ
る。最後に、算出された各基準ピークごとの傾きデータ
をソートし、最大値側と最小値側の、所定の個数の傾き
データを除外し、残りの傾きデータの平均値を求めて文
書画像の行の傾き量とする(S713)。
【0048】以上に説明したような処理を行うことによ
り、例えば画像入力装置に読み取られた原稿が傾いてい
る場合や、原稿に記載された行自体が傾いているような
場合に、当該傾きを検出することができる。本実施の形
態の方法は、傾きの検出にヒストグラムを用いるため、
高解像度の画像データをそのまま用いる方法と比較して
処理負担が少ないという特徴を有する。
【0049】以上に説明したように傾き検出処理を終了
すると、図3のフローチャートに戻って、検出された傾
きを用いて傾斜ヒストグラム作成処理を行う(S3
4)。次に、傾斜ヒストグラム作成処理の詳細な内容に
ついて説明する。本実施の形態では、前記傾き検出処理
により文書画像の傾きが検出されたものについて、当該
傾きに基づいて補正を行いつつ、主走査方向及び副走査
方向についての傾斜ヒストグラムを取得する。
【0050】本実施の形態の傾斜ヒストグラム処理で
は、前記傾き検出処理により検出された傾きから、傾斜
ヒストグラムの作成に必要なサンプリングアドレスを算
出する。図14は、サンプリングアドレスの取得につい
て説明するための図である。傾き検出処理において検出
された傾きをθ(同図でのθは、理解しやすくするた
め、実際よりも若干大きな値としている。)、取得開始
地点の副走査方向のアドレスをAy1、取得開始地点の
主走査方向のアドレスをAx1、実際に副走査方向のア
ドレスを取得すべき主走査方向のアドレスをAxn(n
は1以上、低解像度認識用メモリの1行に存在する画素
の個数まで)とすると、実際に取得すべき画素の副走査
方向のアドレスAyn(nは上記と同様)は、下記の
(数2)に示す式に従って求められる。なお、ここで、
《a》は、aの値以上である最小の整数を表すものとす
る。
【0051】
【数2】 Ayn=Ay1+《(Axn−Ax1)*tanθ》 上記の式に従って、読み出しアドレスを算出し、順次ヒ
ストグラムを取得することにより傾斜ヒストグラムを作
成することができる。具体的に、図14の例で説明する
と、同図(a)に示すようなヒストグラムが取得されて
いる場合に、傾斜ヒストグラムの取得のために読み出す
べき画素のアドレスは、同図(b)に示す如くである。
【0052】一方、主走査方向の傾斜ヒストグラムにつ
いては、副走査方向と同様の考え方で、例えば、下記に
示す(数3)の式に従って読み出しアドレスを算出する
ことにより作成することができる。同式においては、取
得開始地点の主走査方向のアドレスをAx3、取得開始
地点の副走査方向のアドレスをAy1、実際に主走査方
向のアドレスを取得すべき副走査方向のアドレスをAy
nとして、実際に取得すべき画素の主走査方向のアドレ
スをAxn(nは上記(数2)と同様)としている。
【0053】
【数3】Axn=Ax3+《(Ayn−Ay1)*(−
tanθ)》 具体的に、読み出すべき画素のアドレスの一例を同図
(c)に示す。以上に説明したようなアドレス生成方法
に基づいて、各画素の画素値を取得することにより、傾
斜ヒストグラムを作成すれば、例えば、原稿に記載され
た文書画像が傾いていたり、原稿が傾いて入力されてし
まったような場合でも、図15に示すように、傾きを補
正したヒストグラムを取得することができ、ヒストグラ
ムを利用した効率の良い方法を用いて、正確な天地認識
処理を行うことができる。図3のフローチャートで天地
認識処理(S35)を行った後は、天地認識の結果に基
づいて、回転角情報を出力するが(S36)、これらの
処理の内容はいずれも公知の技術であるので、ここでの
詳細な説明は省略する。
【0054】なお、本実施の形態では、短冊状ヒストグ
ラムからピークを検出するにあたって、単にヒストグラ
ムの高さが0でない場合に検出するようにしたが、当該
高さに関して、検出するか否かの閾値を設けることも可
能である。そのようにすれば、例えば行間にノイズによ
るピークが発生したような場合に、かかるピークを傾き
の検出の対象から除外することができる。
【0055】また、本実施の形態では、モノクロ複写機
に適用される傾き量検出装置の場合について説明した
が、フルカラー複写機にも適用することは可能である。
ただし、この場合には、有彩色のカラーデータを予めキ
ャンセルする回路を組み込んでおく必要がある。カラー
データキャンセル回路については、公知の技術であるの
で、ここでの詳細な説明は省略する。
【0056】
【発明の効果】以上に説明したように、本発明の画像認
識装置によれば、文書画像の行の傾き量を検出し、検出
された傾き量に基づいて傾き量を補正したヒストグラム
を作成し、作成されたヒストグラムを用いて天地認識を
行うため、原稿が傾いている場合や、原稿に記載された
文書の行が傾いてるような場合でも天地認識を行うこと
ができるという効果を奏する。
【図面の簡単な説明】
【図1】本発明に係る画像認識装置が適用される複写機
の全体の構成を示す図である。
【図2】本発明に係る画像認識装置が適用される複写機
の制御部の構成を示すブロック図である。
【図3】本実施の形態の画像認識装置におけるCPUの
処理内容を示すフローチャートである。
【図4】本発明に係る画像認識装置における傾き検出の
方法について説明するための図である。
【図5】短冊状ヒストグラム作成処理の詳細な内容を示
すフローチャートである。
【図6】分割方向決定処理の詳細な内容を示すフローチ
ャートである。
【図7】傾き検出処理の詳細な内容を示すフローチャー
トである。
【図8】ヒストグラムの重心位置について説明するため
の図である。
【図9】重心位置検出処理の詳細な内容を示すフローチ
ャートである。
【図10】ヒストグラムのピークの重心位置の情報の内
容の一例を示す図である。
【図11】比較基準ピークの重心に最も近い重心を有す
るピークの検出処理について説明するための図である。
【図12】傾き検出処理に際して得られる、ピークの重
心間の距離に関する情報の内容の一例を示す図である。
【図13】傾き検出処理によって得られる、基準ピーク
毎の傾きデータの平均値に関する情報の内容の一例を示
す図である。
【図14】傾斜ヒストグラムの作成のための読み出しア
ドレスの算出について説明するための図である。
【図15】傾斜ヒストグラムの例を示す図である。
【図16】従来の天地認識処理について説明するための
図である。
【図17】従来の天地認識処理の問題点について説明す
るための図である。
【符号の説明】
38 CCDセンサ 100 制御部 110 画像信号処理部 120 高解像度画像メモリ 130 回転処理部 140 LD駆動部 160 解像度変換部 180 低解像度用認識メモリ 190 CPU 191 RAM 192 ROM
フロントページの続き Fターム(参考) 5B047 AA01 AB04 BA02 BB01 BC18 CA23 CB11 CB21 5B057 AA11 BA02 CA12 CA16 CB12 CB16 CD03 DA06 DB02 DC06 DC23 5C072 AA01 BA16 BA20 EA05 LA18 RA01 UA09 UA11 UA13 XA01

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 画像入力装置に入力された文書画像デー
    タを認識する画像認識装置であって、 画像入力装置に入力された文書画像データを格納する画
    像メモリと、 前記画像メモリに格納された文書画像データから、文書
    画像データにより表される行の傾き量を検出する傾き量
    検出手段と、 前記傾き量検出手段により検出された傾き量に基づき、
    前記文書画像データから前記傾き量を補正したヒストグ
    ラムを作成するために、前記画像メモリにアクセスする
    サンプリングアドレスを生成するアドレス生成手段と、 前記アドレス生成手段により生成されたサンプリングア
    ドレスに従って、前記画像メモリから文書画像データを
    読み出し、ヒストグラムを作成するヒストグラム作成手
    段と、 前記ヒストグラム作成手段により作成されたヒストグラ
    ムから、文書画像データの原稿方向を認識する原稿方向
    認識手段とを備えたことを特徴とする画像認識装置。
  2. 【請求項2】 前記画像メモリには、解像度変換によ
    り、画像入力装置に入力された文書画像データよりも低
    解像度の画像データに変換されたデータが格納される請
    求項1に記載の画像認識装置。
JP10190670A 1998-07-06 1998-07-06 画像認識装置 Pending JP2000022897A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10190670A JP2000022897A (ja) 1998-07-06 1998-07-06 画像認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10190670A JP2000022897A (ja) 1998-07-06 1998-07-06 画像認識装置

Publications (1)

Publication Number Publication Date
JP2000022897A true JP2000022897A (ja) 2000-01-21

Family

ID=16261949

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10190670A Pending JP2000022897A (ja) 1998-07-06 1998-07-06 画像認識装置

Country Status (1)

Country Link
JP (1) JP2000022897A (ja)

Similar Documents

Publication Publication Date Title
US6798905B1 (en) Document orientation recognizing device which recognizes orientation of document image
JP3050007B2 (ja) 画像読取装置およびこれを備えた画像形成装置
JP3695163B2 (ja) 画像形成装置
JP2002185767A (ja) 画像処理装置及び方法
JP3671682B2 (ja) 画像認識装置
JPH06103410A (ja) 画像処理装置
US20040109176A1 (en) Printing system and distributed image forming method
JPH07245682A (ja) 画像読取装置及びそれを組み込んだ複写機
JP3629962B2 (ja) 画像認識装置
JP2905655B2 (ja) 画像処理装置
JP2000022897A (ja) 画像認識装置
JP2000022898A (ja) 傾き量検出装置
JP3629969B2 (ja) 画像認識装置
JP3629959B2 (ja) 画像認識装置
JP3753684B2 (ja) 画像読み取り装置および画像形成装置
JPH1169096A (ja) 画像形成装置
JP3081083B2 (ja) 画像処理装置
JPH11177775A (ja) 原稿検出装置
JP6844522B2 (ja) 画像処理装置
JP3987850B2 (ja) 画像処理装置及び画像形成装置
JP3078421B2 (ja) デジタル画像形成装置及びデジタル画像形成装置のレーザ走査光補正方法
JPH07245680A (ja) 画像読取装置及びそれを組み込んだ複写機
JP3675181B2 (ja) 画像認識装置
JP4132473B2 (ja) 画像処理装置及び画像形成装置
JP3922990B2 (ja) 画像処理装置および画像形成装置

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20050614