JPH0991372A - 光学的文字読み取り装置および帳票の傾き角度検出方法 - Google Patents

光学的文字読み取り装置および帳票の傾き角度検出方法

Info

Publication number
JPH0991372A
JPH0991372A JP7243273A JP24327395A JPH0991372A JP H0991372 A JPH0991372 A JP H0991372A JP 7243273 A JP7243273 A JP 7243273A JP 24327395 A JP24327395 A JP 24327395A JP H0991372 A JPH0991372 A JP H0991372A
Authority
JP
Japan
Prior art keywords
character
density
image
coordinates
center coordinates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7243273A
Other languages
English (en)
Inventor
Masaaki Mizuno
昌昭 水野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP7243273A priority Critical patent/JPH0991372A/ja
Publication of JPH0991372A publication Critical patent/JPH0991372A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 帳票エッジを用いず、簡単な処理により帳票
の傾き角度を検出を行う。 【解決手段】 帳票から複数階調の帳票画像を得る画像
取り込み部11と、パンチ穴濃度が定義された背景濃度
定義部12と、帳票画像からパンチ穴濃度と近い濃度領
域の中心座標を求めるパンチ穴検出部13と、プレ印刷
文字濃度が定義されたプレ印刷文字濃度定義部14と、
帳票画像からプレ印刷文字濃度と近い濃度領域の中心座
標を求めるプレ印刷文字検出部15と、特定のパンチ穴
およびプレ印刷文字の中心座標を異なる帳票挿入方向つ
いて求めた座標テーブル16と、そのテーブルを基に帳
票画像における特定のパンチ穴およびプレ印刷文字の中
心座標および帳票挿入方向を求める帳票挿入方向判定部
17と、その求められた帳票画像における中心座標を結
ぶ測定線と挿入方向に関する座標テーブル16の中心座
標を結ぶ基準線とのなす角度を帳票の傾き角度とする帳
票傾き算出部18とを有する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、挿入された帳票を
光学的に走査して得られる帳票画像から文字イメージを
抽出し、これを解析し文字認識を行う光学的文字読み取
り装置(OCR:optical character reader)に関し、
特に、挿入された帳票の傾き角度に基づいて、文字認識
の際に帳票画像から抽出される文字イメージの位置を補
正する光学的文字読み取り装置に関する。さらには、挿
入された帳票の傾き角度を検出する帳票の傾き角度検出
方法に関する。
【0002】
【従来の技術】光学的文字読み取り装置は、帳票を供給
する系と光学系の組み合せで供給された帳票上の画像情
報を読み取り、これを記憶装置に格納し、この画像情報
を解析して文字認識を行うものである。この光学的文字
読み取り装置では、通常、帳票フォーマットが決められ
ている帳票から読み取られた画像情報が記憶装置に格納
され、この格納された画像情報からフォーマット上で指
定された位置の文字イメージを切り出して文字認識が行
われる。
【0003】上記光学的文字読み取り装置において、文
字認識を正しく行うためには、画像読み取り部に入力帳
票を傾きのない状態で正しく取り込む必要があり、入力
帳票が傾いた状態で画像読み取り部に取り込まれた場合
には、フォーマット上で指定された座標と記憶装置に格
納された画像情報の座標とにずれが生じ、文字イメージ
の切りだし位置にずれが生じてしまう。この文字イメー
ジの切りだし位置のずれは、文字認識に影響する。この
ため、帳票が傾いて入力された場合には、帳票の傾き角
度を検出して、フォーマット上で指定された座標と記憶
装置に格納された画像情報の座標とのずれを補正し、正
確に文字イメージの切りだしが行われるようにする必要
がある。
【0004】挿入された帳票の傾き角度を検出して、文
字イメージの切りだし位置のずれを補正する光学的文字
読み取り装置が特開平5-233874号公報により提案されて
いる。この公報によれば、2値で取り込んだ帳票画像か
らその帳票のエッジを検出して、エッジの方向により帳
票の傾きを検出し、検出された傾き角度に基づいて文字
イメージの切りだし位置のずれを補正している。
【0005】また、上記のような帳票のエッジによる傾
き角度の検出とは異なる方法として、特開平2-108177号
公報には、帳票画像中の文字列の並びを検出することに
より帳票の傾きを検出する光学的文字読み取り装置が提
案されている。この光学的文字読み取り装置では、印刷
文字は概ね一直線上にあることを利用し、文書画像は白
黒2値画像とし、文字は白い背景の上にある黒い画素の
集まりとして表現するものとして、次のように帳票の傾
き角度が推定される。文書画像全体に対してラベル付け
を基にした連結成分の抽出、あるいは輪郭線の抽出を行
い、抽出された連結成分(あるいは、輪郭線)毎に特徴
量とその位置座標を求め、多数の方向について特徴量を
積分する。積分した結果が最も尖鋭となる方向を求め、
この方向を帳票の傾き角度と推定する。
【0006】
【発明が解決しようとする課題】しかしながら、上述し
た従来の光学的文字読み取り装置には、以下のような問
題点がある。
【0007】特開平5-233874号公報に記載のものにおい
ては、帳票の傾き角度を検出できるものの、帳票の傾き
角度の推定精度が帳票のエッジの状態により左右される
ため、例えば、エッジが破損した帳票や切断誤差の大き
な帳票(例えば、端辺が斜めになったり、あるいは曲っ
たりしたもの)が用いられた場合には、帳票の傾き角度
の推定精度が低下してしまい、正確に帳票の傾き角度を
検出することができないという問題点がある。
【0008】特開平5-233874号公報に記載のものにおい
ては、文書画像全体に対してラベル付けを基にした連結
成分の抽出、あるいは輪郭線の抽出を行って、2値画像
から文字要素を抽出するといった複雑な処理が必要とさ
れるため、処理に時間がかかるという問題点がある。
【0009】本発明の目的は、上記各問題を解決し、帳
票のエッジの状態に関係なく、簡単な処理により帳票の
傾き角度の検出を行うことができる光学的文字読み取り
装置および帳票傾き角度検出方法を提供することにあ
る。
【0010】
【課題を解決するための手段】本発明の光学的文字読み
取り装置は、濃度による検出が可能な第1および第2の
領域を有する帳票を対象とし、挿入された帳票を光学的
に走査して得られる帳票画像から文字イメージを抽出
し、これを解析し文字認識を行う光学的文字読み取り装
置において、前記帳票を光学的に走査して、複数の階調
の帳票画像を格納する画像取り込み手段と、前記第1お
よび第2の領域に関する濃度が予め記憶された濃度定義
手段と、前記画像取り込み手段に格納された帳票画像中
から、前記濃度定義手段に記憶された第1および第2の
領域に関する濃度と近い濃度領域を全て検出し、それぞ
れの中心座標を求める検出手段と、前記第1および第2
の領域の中心座標を、複数の異なる帳票挿入方向ついて
予め求め、これをテーブル化した座標テーブルと、前記
検出手段にて検出された各中心座標と前記座標テーブル
とのマッチングをとり、座標テーブルのいずれかの方向
の座標と一致もしくは最も近いものとなった座標を前記
画像取り込み手段に格納された帳票画像における前記第
1および第2の領域の中心座標とし、その方向を前記帳
票が挿入された方向と判定する帳票挿入方向判定手段
と、前記帳票挿入方向判定手段にて第1および第2の領
域の中心座標とされた座標を結ぶ第1の線を求め、さら
に、前記帳票挿入方向判定手段にて判定された挿入方向
に関する前記座標テーブルの第1および第2の領域の中
心座標を結ぶ第2の線を求めて、該第1の線と該第2の
線とのなす角度を算出し、これを前記帳票の傾き角度と
する傾き角度算出手段と、前記傾き角度算出手段にて算
出された帳票の傾き角度に基づいて、前記文字認識の際
に帳票画像から抽出される文字イメージの位置を補正す
る手段と、を有することを特徴とする。
【0011】また、本発明の光学的文字読み取り装置
は、パンチ穴が1つ以上設けられ、少なくとも1箇所に
予め文字が印刷されたプレ印刷文字領域を有する帳票を
対象とし、挿入された帳票を光学的に走査して得られる
帳票画像から文字イメージを抽出し、これを解析し文字
認識を行う光学的文字読み取り装置において、前記帳票
を光学的に走査して、複数の階調の帳票画像を格納する
画像取り込み手段と、前記パンチ穴に関する濃度が予め
記憶されたパンチ穴濃度定義手段と、前記画像取り込み
手段に格納された帳票画像中から、前記パンチ穴濃度定
義手段に記憶された濃度と近い濃度領域を全て検出し、
それぞれの中心座標を求めるパンチ穴検出手段と、前記
プレ印刷文字領域に関する濃度が予め記憶されたプレ印
刷文字濃度定義手段と、前記画像取り込み手段に格納さ
れた帳票画像中から、前記プレ印刷文字濃度定義手段に
記憶された濃度と近い濃度領域を全て検出し、それぞれ
の中心座標を求めるプレ印刷文字検出手段と、前記帳票
の特定のパンチ穴およびプレ印刷文字領域に関する中心
座標を、複数の異なる帳票挿入方向ついて予め求め、こ
れをテーブル化した座標テーブルと、前記パンチ穴検出
手段およびプレ印刷文字検出手段にてそれぞれ検出され
たパンチ穴およびプレ印刷文字領域の中心座標と前記座
標テーブルとのマッチングをとり、座標テーブルのいず
れかの方向の座標と一致もしくは最も近いものとなった
座標を前記画像取り込み手段に格納された帳票画像にお
ける特定のパンチ穴およびプレ印刷文字領域の中心座標
とし、その方向を前記帳票が挿入された方向と判定する
帳票挿入方向判定手段と、前記帳票挿入方向判定手段に
て帳票画像における特定のパンチ穴およびプレ印刷文字
領域の中心座標とされた座標を結ぶ第1の線を求め、さ
らに、前記帳票挿入方向判定手段にて判定された挿入方
向に関する前記座標テーブルのパンチ穴およびプレ印刷
文字領域の中心座標を結ぶ第2の線を求めて、該第1の
線と該第2の線となす角度を算出し、これを前記帳票の
傾き角度とする傾き角度算出手段と、前記傾き角度算出
手段にて算出された帳票の傾き角度に基づいて、前記文
字認識の際に帳票画像から抽出される文字イメージの位
置を補正する手段と、を有することを特徴とする。
【0012】また、本発明の光学的文字読み取り装置
は、パンチ穴が1つ以上設けられ、少なくとも1箇所に
予め文字が印刷されたプレ印刷文字領域を有する帳票を
対象とし、挿入された帳票を光学的に走査して得られる
帳票画像から文字イメージを抽出し、これを解析し文字
認識を行う光学的文字読み取り装置において、前記帳票
を光学的に走査して、複数の階調の帳票画像を格納する
画像取り込み手段と、画像取り込み手段に格納された帳
票画像の各画素毎の濃度の頻度分布を求める濃度分布算
出手段と、濃度分布算出手段にて求められた濃度の頻度
分布を基に前記パンチ穴に関する濃度を求めるパンチ穴
濃度算出手段と、濃度分布算出手段にて求められた濃度
の頻度分布を基に前記プレ印刷文字領域に関する濃度を
求めるプレ印刷文字濃度算出手段と、前記画像取り込み
手段に格納された帳票画像中から、前記パンチ穴濃度算
出手段にて求められた濃度と近い濃度領域を全て検出
し、それぞれの中心座標を求めるパンチ穴検出手段と、
前記画像取り込み手段に格納された帳票画像中から、前
記プレ印刷文字濃度算出手段に記憶された濃度と近い濃
度領域を全て検出し、それぞれの中心座標を求めるプレ
印刷文字検出手段と、前記帳票の特定のパンチ穴および
プレ印刷文字領域に関する中心座標を、複数の異なる帳
票挿入方向ついて予め求め、これをテーブル化した座標
テーブルと、前記パンチ穴検出手段およびプレ印刷文字
検出手段にてそれぞれ検出されたパンチ穴およびプレ印
刷文字領域の中心座標と前記座標テーブルとのマッチン
グをとり、座標テーブルのいずれかの方向の座標と一致
もしくは最も近いものとなった座標を前記画像取り込み
手段に格納された帳票画像における特定のパンチ穴およ
びプレ印刷文字領域の中心座標とし、その方向を前記帳
票が挿入された方向と判定する帳票挿入方向判定手段
と、前記帳票挿入方向判定手段にて帳票画像における特
定のパンチ穴およびプレ印刷文字領域の中心座標とされ
た座標を結ぶ第1の線を求め、さらに、前記帳票挿入方
向判定手段にて判定された挿入方向に関する前記座標テ
ーブルのパンチ穴およびプレ印刷文字領域の中心座標を
結ぶ第2の線を求めて、該第1の線と該第2の線となす
角度を算出し、これを前記帳票の傾き角度とする傾き角
度算出手段と、前記傾き角度算出手段にて算出された帳
票の傾き角度に基づいて、前記文字認識の際に帳票画像
から抽出される文字イメージの位置を補正する手段と、
を有することを特徴とする。
【0013】本発明の帳票の傾き角度検出方法は、濃度
による検出が可能な第1および第2の領域を有する帳票
を対象とし、挿入された帳票を光学的に走査して得られ
る帳票画像から文字イメージを抽出し、これを解析し文
字認識を行う光学的文字読み取り装置において行われる
帳票の傾き角度検出方法であって、前記帳票を光学的に
走査して、複数の階調の帳票画像を得る第1のステップ
と、前記第1のステップにて得られた帳票画像中から、
予め設定された前記第1および第2の領域に関する濃度
と近い濃度領域を全て検出してそれぞれの中心座標を求
める第2のステップと、前記第2のステップにて検出さ
れた各中心座標と、前記第1および第2の領域の中心座
標を複数の異なる帳票挿入方向ついて予め求めた座標テ
ーブルとのマッチングをとり、座標テーブルのいずれか
の方向の座標と一致もしくは最も近いものとなった座標
を前記第1のステップにて得られた帳票画像における前
記第1および第2の領域の中心座標とし、その方向を前
記帳票が挿入された方向と判定する第3のステップと、
前記第3のステップにて第1および第2の領域の中心座
標とされた座標を結ぶ第1の線を求め、さらに、前記第
3のステップにて判定された挿入方向に関する前記座標
テーブルの第1および第2の領域の中心座標を結ぶ第2
の線を求めて、該第1の線と該第2の線とのなす角度を
算出し、これを前記帳票の傾き角度とする第4のステッ
プとを有することを特徴とする。
【0014】上記帳票の傾き角度検出方法において、第
1および第2の領域がパンチ穴および予め文字が印刷さ
れたプレ印刷文字領域であり、第3のステップにおいて
は、第2のステップにて検出された各中心座標と、帳票
の特定のパンチ穴およびプレ印刷文字領域に関する中心
座標を複数の異なる帳票挿入方向ついて予め求めた座標
テーブルとのマッチングをとり、座標テーブルのいずれ
かの方向の座標と一致もしくは最も近いものとなった座
標を前記第1のステップにて得られた帳票画像における
特定のパンチ穴およびプレ印刷文字領域の中心座標と
し、その方向を前記帳票が挿入された方向を判定するよ
うにしてもよい。
【0015】<作用>帳票画像を複数の階調の画像(多
値画像)として読み取り、この帳票画像(多値画像)に
関して各画素毎に検出された濃度の頻度分布をとると、
例えばパンチ穴やプレ印刷文字などの領域はそれぞれ異
なる頻度分布を示す。このことから、パンチ穴やプレ印
刷文字などの領域は、それぞれ該当する濃度に基づいて
検出することが可能である。本発明の光学的文字読み取
り装置では、例えばパンチ穴やプレ印刷文字領域など、
濃度による検出が可能な第1および第2の領域を有する
帳票を対象とし、帳票画像が複数の階調の画像として格
納されるので、パンチ穴やプレ印刷文字領域に関する濃
度を基に、格納された帳票画像中から第1および第2の
領域に関する座標を抽出することができる。ここで、第
1および第2の領域は、特定のパンチ穴およびプレ印刷
文字領域としてもよいし、特定の2つのプレ印刷文字領
域、あるいは2つのパンチ穴としてもよい。以下、第1
および第2の領域を特定のパンチ穴とプレ印刷文字領域
とした場合について説明する。
【0016】座標テーブルには、帳票の特定のパンチ穴
およびプレ印刷文字領域に関する中心座標を複数の異な
る帳票挿入方向について求めたものがテーブル化されて
いる。この座標テーブルのいずれかの方向の座標は、上
記帳票画像中から抽出されたパンチ穴およびプレ印刷文
字領域に関する座標のうちの1つと一致もしくは最も近
いものとなる。よって、座標テーブルと格納された帳票
画像中から抽出されたパンチ穴およびプレ印刷文字領域
に関する全座標とのマッチングをとることにより、格納
された帳票画像における特定のパンチ穴およびプレ印刷
文字領域の中心座標が得られ、その方向から帳票の挿入
方向を判定することができる。ここで、座標テーブルと
のマッチングの結果が一致となった状態は、帳票が正し
く挿入された状態(傾き角度のない状態)であり、結果
が最も近いものとなった状態は、帳票が傾いて挿入され
た状態(傾き角度を有する状態)である。
【0017】上記座標テーブルとのマッチングにより得
られた帳票画像における特定のパンチ穴およびプレ印刷
文字領域の中心座標と、判定された帳票の挿入方向に関
する座標テーブルのパンチ穴およびプレ印刷文字領域の
中心座標とのずれが、挿入された帳票の傾き角度である
ことから、座標テーブルとのマッチングにより得られた
帳票画像における特定のパンチ穴およびプレ印刷文字領
域の中心座標を結ぶ第1の線と、判定された帳票の挿入
方向に関する座標テーブルのパンチ穴およびプレ印刷文
字領域の中心座標を結ぶ第2の線とのなす角度を算出す
ることにより、帳票の傾き角度を得ることができる。
【0018】以上のように、本発明の光学的文字読み取
り装置では、パンチ穴やプレ印刷文字領域などの濃度に
よる検出が可能な2つの領域をそれぞれ該当する濃度に
基づいて検出し、その座標のずれを検出することにより
帳票の傾き角度を検出することができるので、従来のよ
うに帳票の傾き角度の推定精度が帳票のエッジの状態に
より左右されることはない。また、文書画像全体に対し
てラベル付けを基にした連結成分の抽出、あるいは輪郭
線の抽出など複雑な処理は必要ない。
【0019】また、本発明のうち、格納された帳票画像
の各画素毎の濃度の頻度分布を求め、求められた濃度の
頻度分布を基にパンチ穴およびプレ印刷文字領域に関す
る濃度を求めるものにおいては、格納された帳票画像か
ら求められたパンチ穴およびプレ印刷文字領域に関する
濃度を基に、パンチ穴およびプレ印刷文字領域の検出が
行われるので、帳票画像からのパンチ穴およびプレ印刷
文字領域に関する中心座標の抽出は、より正確なものと
なる。
【0020】
【発明の実施の形態】次に、本発明の実施例について図
面を参照して説明する。
【0021】本発明の光学的文字読み取り装置は、帳票
を供給する系と、供給された帳票上の画像情報を読み取
るための光学系と、読み取った画像情報が格納される記
憶部と、格納された画像情報を解析して文字認識を行う
部とからなる基本構成に加えて、帳票の傾き角度を検出
して文字イメージの切りだし位置のずれを補正する機能
を有するものとなっている。
【0022】図1は、本発明の第1の実施例の光学的文
字読み取り装置の概略構成を示すブロック図である。
【0023】11は、供給された帳票を光学的に走査
し、その帳票上の文字を含む画像情報を読み取って記憶
する画像取り込み部であって、その構成は、イメージス
キャナ(不図示)と記憶部(不図示)からなる。この画
像取り込み部11では、供給された帳票をイメージスキ
ャナで読み取り、その読み取られた帳票画像を複数の階
調の画像(以下、多値画像と称す)として記憶部に格納
する。
【0024】12は背景濃度定義部であり、予め使用者
により設定された背景濃度が記憶されている。この使用
者による背景濃度の設定は、以下のようにして行われ
る。
【0025】図4(a)は画像取り込み部11に格納さ
れた帳票画像の一例、図4(b)は(a)に示した帳票
画像(多値画像)に関してイメージスキャナの各画素毎
に検出された濃度の頻度を示したグラフで、縦軸に頻度
数、横軸に白黒濃度がとられている。図中、40は帳
票、41はパンチ穴、42はプレ印刷文字である。
【0026】図4から分かるように、パンチ穴やプレ印
刷文字などの領域は、それぞれ異なる濃度分布を有す
る。このことから、パンチ穴およびプレ印刷文字の領域
をそれぞれの濃度に基づいて抽出することが可能であ
る。通常、背景は最も黒くなる(帳票に予め印刷された
文字(プレ印刷文字)等に比べて濃度が高い)ことか
ら、ここでは、使用者による背景濃度の設定は図4
(b)に示す各やまのうちの濃度が最も高い(黒)もの
の濃度と近い値に設定される。
【0027】13はパンチ穴の座標を検出するパンチ穴
検出部であり、画像取り込み部11に格納された多値画
像中から背景濃度定義部12で定義された濃度と近い濃
度領域を検出し、その検出された領域の中心座標を求め
る。背景濃度定義部12で定義された濃度と近い濃度領
域が複数ある場合には、それぞれの領域の中心座標が求
められる。
【0028】14はプレ印刷文字濃度定義部であり、帳
票に予め印刷された文字(プレ印刷文字)に関して想定
される濃度が、予め使用者により設定されて記憶されて
いる。通常、プレ印刷文字は背景の次に高い濃度となる
ことから、ここでは、図4(b)に示す各濃度分布(や
ま)のうちの濃度が2番目に高いやまの濃度と近い値に
設定される。
【0029】15はプレ印刷文字の領域の座標を検出す
るプレ印刷文字検出部であり、画像取り込み部11に格
納された多値画像中からプレ印刷文字濃度定義部14で
定義された濃度と近い濃度領域を検出し、その検出され
た領域の中心座標を求める。プレ印刷文字濃度定義部1
4で定義された濃度と近い濃度領域が複数ある場合に
は、それぞれの領域の中心座標が求められる。
【0030】16は、所定の帳票フォーマットにおける
特定のパンチ穴およびプレ印刷文字の座標を0°,90
°,180°,270°のそれぞれの挿入方向について
予め求め、これをテーブル化した座標テーブルである。
図5(a)に帳票上のパンチ穴およびプレ印刷文字の座
標を示し、図5(b)に座標テーブル16のテーブル内
容の一例を示す。なお、パンチ穴は通常2つあり、プレ
印刷文字は複数存在するため、座標テーブル16を作成
する際のパンチ穴とプレ印刷文字の選択は、後述の帳票
挿入方向判定の際にこれらを特定できる位置関係にある
ものを選択することが望ましい。
【0031】17は帳票挿入方向判定部であり、帳票が
0°,90°,180°,270°のいずれの方向に挿
入されたかを判定する。この帳票挿入方向判定部では、
パンチ穴検出部13にて検出されたパンチ穴の座標およ
びプレ印刷文字検出部15にて検出されたプレ印刷文字
の座標と、座標テーブル16の各方向におけるパンチ穴
およびプレ印刷文字の座標との比較が行われる。本実施
例では、座標テーブル16は特定の位置関係にあるパン
チ穴およびプレ印刷文字に関するものとなっているの
で、パンチ穴検出部13およびプレ印刷文字検出部15
にて検出されたパンチ穴およびプレ印刷文字の座標のう
ちの1つは、座標テーブル16のいずれかの方向の座標
と一致、あるいは最も近いものとなる。したがって、こ
こでは、パンチ穴検出部13およびプレ印刷文字検出部
15にてそれぞれ検出されたパンチ穴およびプレ印刷文
字の座標に対して座標テーブル16とのマッチングをと
り、座標テーブルのいずれかの方向の座標と一致もしく
は最も近いものとなった座標を画像取り込み部11に格
納された帳票画像における特定のパンチ穴およびプレ印
刷文字領域の中心座標とし、その方向が帳票が挿入され
た方向と判定される。
【0032】18は、挿入された帳票の傾きを算出する
傾き角度算出部である。この傾き角度算出部18では、
パンチ穴検出部13およびプレ印刷文字検出部15によ
って検出されたパンチ穴およびプレ印刷文字の各中心座
標のうちの、帳票挿入方向判定部17にて帳票画像にお
ける特定のパンチ穴およびプレ印刷文字の中心座標とさ
れた座標を結ぶ測定線が求められる。さらに、帳票挿入
方向判定部17にて判定された挿入方向に関する座標テ
ーブル16のパンチ穴およびプレ印刷文字の中心座標を
結ぶ基準線が求められる。そして、基準線と測定線との
なす角度が算出され、これが挿入された帳票の傾き角度
とされる。図6に、帳票の傾き角度の算出の一例を示
す。
【0033】図6(a)は挿入方向を0°とし、傾き角
度rで挿入された帳票に関する測定線61、図6(b)
は座標テーブル16の挿入方向0°の場合の帳票に関す
る基準線62を示す図である。
【0034】帳票の挿入方向を0°の方向とし、傾き角
度rで挿入された場合には、まず、座標テーブル16の
挿入方向0°におけるパンチ穴およびプレ印刷文字の座
標から基準線62を求める(図6(a)参照)。続い
て、パンチ穴検出部13にて検出されたパンチ穴の座標
とプレ印刷文字検出部15にて検出されたプレ印刷文字
の座標を結ぶ測定線61を求める(図6(b)参照)。
そして、基準線62に対する測定線61の傾きを求める
ことにより傾き角度rを算出する。
【0035】次に、この光学的文字読み取り装置の動作
について説明する。
【0036】まず、光学的文字読み取り装置に所定のフ
ォーマットの帳票を挿入する。このとき、予め背景濃度
およびプレ印刷文字濃度を設定しておき、これを背景濃
度定義部12およびプレ印刷文字濃度定義部14に記憶
しておく。さらに、挿入される所定の帳票フォーマット
のパンチ穴およびプレ印刷文字(ただし、特定の位置関
係にあるもの)に関する中心座標を、0°,90°,1
80°,270°のそれぞれの挿入方向について予め求
め、これを基に座標テーブル16を作成しておく。
【0037】帳票が挿入されると、画像取り込み部11
によって帳票画像(多値画像)が読み取られて格納され
る。画像取り込み部11に帳票画像が格納されると、パ
ンチ穴検出部13により、その格納された帳票画像中か
ら背景濃度定義部12で定義された濃度と近い濃度領域
が全て検出され、検出された各領域の中心座標がそれぞ
れ求められる。さらに、プレ印刷文字検出部15によ
り、格納された多値画像中からプレ印刷文字濃度定義部
14で定義された濃度と近い濃度領域が全て検出され、
検出された領域の中心座標がそれぞれ求められる。
【0038】全てのパンチ穴およびプレ印刷文字に関す
る中心座標が求められると、続いて、帳票挿入方向判定
部17によって帳票の挿入方向が次のようにして判定さ
れる。まず、パンチ穴検出部13およびプレ印刷文字検
出部15によって求められたパンチ穴およびプレ印刷文
字に関する全ての中心座標と、座標テーブル16の各挿
入方向におけるパンチ穴およびプレ印刷文字の中心座標
とのマッチングをとり、座標テーブル16のいずれかの
方向の座標と一致もしくは最も近いものとなった座標を
画像取り込み部11に格納された帳票画像における特定
のパンチ穴およびプレ印刷文字領域の中心座標とし、そ
の方向を帳票が挿入された方向と判定する。
【0039】帳票挿入方向判定部17にて帳票の挿入方
向が判定されると、続いて、傾き角度検出部18によっ
て帳票の傾き角度の検出が以下のようにして行われる。
【0040】まず、パンチ穴検出部13およびプレ印刷
文字濃度定義部15によって求められたパンチ穴および
プレ印刷文字の各中心座標のうちの、帳票挿入方向判定
部17にて帳票画像における特定のパンチ穴およびプレ
印刷文字領域の中心座標とされた座標を結ぶ測定線を求
める。続いて、帳票挿入方向判定部17にて判定された
挿入方向に関する座標テーブル16のパンチ穴およびプ
レ印刷文字領域の中心座標を結ぶ基準線を求める。そし
て、基準線と測定線となす角度を算出し、この算出した
角度を挿入された帳票の傾き角度とする。
【0041】以上のようにして帳票の傾き角度が求めら
れると、光学的文字読み取り装置では、文字認識の際
に、求められた傾き角度に基づいて文字イメージの切り
だし位置のずれが補正される。
【0042】次に、本発明の第2の実施例の光学的文字
読み取り装置について説明する。
【0043】上述した第1の実施例の光学的文字読み取
り装置では、背景濃度定義部12およびプレ印刷文字濃
度定義部14に記憶される背景濃度およびプレ印刷文字
濃度の値は、予め使用者によって設定されているが、本
実施例ではこの背景濃度およびプレ印刷文字濃度の値が
挿入された帳票から算出されるようになっている。
【0044】図2は、本発明の第2の実施例の光学的文
字読み取り装置の概略構成を示すブロック図である。
【0045】本実施例の光学的文字読み取り装置は、背
景濃度定義部12およびプレ印刷文字濃度定義部14に
代えて、濃度分布算出部19と背景濃度算出部20およ
びプレ印刷文字濃度算出部21が設けられた以外は、上
述した第1の実施例の光学的文字読み取り装置の構成と
同じものとなっている。図中、同じ構成部については同
じ動作をするものとし、同じ符号を付してある。
【0046】濃度分布算出部19は、画像取り込み部1
1に格納された帳票画像(多値画像)に対して、各画素
毎に濃度を調べ、各濃度に対する頻度を濃度分布として
求める。図3に、各画素毎に検出された濃度の頻度分布
を示したグラフを示す。図中、縦軸は頻度数、横軸は白
黒濃度を表し、パンチ穴やプレ印刷文字などの領域に関
する濃度分布が、それぞれ特有の山の大きさ、形で表さ
れている。
【0047】背景濃度算出部20は、濃度分布算出部1
9にて求められた濃度分布における各山のうちから、山
の大きさ、形、濃度を基に背景領域に関する山を特定
し、その濃度を背景濃度とする。ここでは、図3に示す
濃度分布における各山のうち、濃度が最も高い(黒)も
のの濃度が背景濃度とされる。
【0048】プレ印刷文字濃度算出部21は、濃度分布
算出部19にて求められた濃度分布における各山のうち
から、山の大きさ、形、濃度を基にプレ印刷文字領域に
関する山を特定し、その濃度をプレ印刷文字濃度とす
る。ここでは、図3に示す濃度分布における各山のう
ち、背景濃度の次に濃度が高い山の濃度がプレ印刷文字
濃度とされる。
【0049】この光学的文字読み取り装置では、背景濃
度算出部20によって求められた背景濃度に基づいてパ
ンチ穴検出部13におけるパンチ穴の抽出が行われ、プ
レ印刷文字濃度算出部21によって求められたプレ印刷
文字濃度に基づいてプレ印刷文字濃度算出部21におけ
るプレ印刷文字の抽出が行われる。
【0050】以上説明した各実施例では、特定のパンチ
穴およびプレ印刷文字に基づいて帳票の傾き角度を検出
しているが、本発明はこれに限定されるものではなく、
濃度による検出が可能な2つの領域(場合によっては、
2つ以上とすることもできる)であればよい。例えば、
特定の2つのプレ印刷文字、あるいは2つのパンチ穴に
基づいて検出してもよい。
【0051】
【発明の効果】本発明は以上説明したように構成されて
いるので、以下に記載するような効果を奏する。
【0052】請求項1,2に記載のもの、および請求項
4,5に記載の方法においては、例えば帳票上のパンチ
穴やプレ印刷文字領域を基に帳票の傾き角度の検出が行
われるので、帳票の傾き角度の推定精度が帳票のエッジ
の状態により左右されない、安定した傾き検出処理を行
うことができるという効果がある。さらに、プレ印刷文
字領域等の抽出は濃淡特徴を利用した簡単な処理により
行われ、連結成分の抽出、あるいは輪郭線の抽出といっ
た複雑な処理は必要ないので、処理の高速化を図ること
ができるという効果がある。
【0053】請求項3に記載のものにおいては、上記各
効果に加えて、帳票画像から直接パンチ穴およびプレ印
刷文字領域に関する濃度が検出され、その濃度を基に帳
票画像からのパンチ穴およびプレ印刷文字領域に関する
中心座標の抽出が行われるので、帳票の傾き角度の検出
をより正確なものとすることができるという効果があ
る。
【図面の簡単な説明】
【図1】本発明の第1の実施例の光学的文字読み取り装
置の概略構成を示すブロック図である。
【図2】本発明の第2の実施例の光学的文字読み取り装
置の概略構成を示すブロック図である。
【図3】各画素毎に検出された濃度の頻度分布を示した
グラフである。
【図4】(a)は図1に示した像取り込み部11に格納
された帳票画像の一例、(b)は(a)に示した帳票画
像に関して各画素毎に検出された濃度の頻度分布を示し
たグラフである。
【図5】(a)は帳票上のパンチ穴およびプレ印刷文字
の座標を示した図、(b)は座標テーブルのテーブル内
容の一例を示した図である。
【図6】(a)は座標テーブルの挿入方向0°の場合の
帳票に関する基準線62、(b)は挿入方向を0°と
し、傾き角度rで挿入された帳票に関する測定線61を
示した図である。
【符号の説明】
11 画像取り込み部 12 背景濃度定義部 13 パンチ穴検出部 14 プレ印刷文字濃度定義部 15 プレ印刷文字検出部 16 座標テーブル 17 帳票挿入方向判定部 18 帳票傾き算出部 19 濃度分布算出部 20 背景濃度算出部 21 プレ印刷文字濃度算出部 40 帳票 41 パンチ穴 42 プレ印刷文字 61 測定線 62 基準線

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 濃度による検出が可能な第1および第2
    の領域を有する帳票を対象とし、挿入された帳票を光学
    的に走査して得られる帳票画像から文字イメージを抽出
    し、これを解析し文字認識を行う光学的文字読み取り装
    置において、 前記帳票を光学的に走査して、複数の階調の帳票画像を
    格納する画像取り込み手段と、 前記第1および第2の領域に関する濃度が予め記憶され
    た濃度定義手段と、 前記画像取り込み手段に格納された帳票画像中から、前
    記濃度定義手段に記憶された第1および第2の領域に関
    する濃度と近い濃度領域を全て検出し、それぞれの中心
    座標を求める検出手段と、 前記第1および第2の領域の中心座標を、複数の異なる
    帳票挿入方向ついて予め求め、これをテーブル化した座
    標テーブルと、 前記検出手段にて検出された各中心座標と前記座標テー
    ブルとのマッチングをとり、座標テーブルのいずれかの
    方向の座標と一致もしくは最も近いものとなった座標を
    前記画像取り込み手段に格納された帳票画像における前
    記第1および第2の領域の中心座標とし、その方向を前
    記帳票が挿入された方向と判定する帳票挿入方向判定手
    段と、 前記帳票挿入方向判定手段にて第1および第2の領域の
    中心座標とされた座標を結ぶ第1の線を求め、さらに、
    前記帳票挿入方向判定手段にて判定された挿入方向に関
    する前記座標テーブルの第1および第2の領域の中心座
    標を結ぶ第2の線を求めて、該第1の線と該第2の線と
    のなす角度を算出し、これを前記帳票の傾き角度とする
    傾き角度算出手段と、 前記傾き角度算出手段にて算出された帳票の傾き角度に
    基づいて、前記文字認識の際に帳票画像から抽出される
    文字イメージの位置を補正する手段と、を有することを
    特徴とする光学的文字読み取り装置。
  2. 【請求項2】 パンチ穴が1つ以上設けられ、少なくと
    も1箇所に予め文字が印刷されたプレ印刷文字領域を有
    する帳票を対象とし、挿入された帳票を光学的に走査し
    て得られる帳票画像から文字イメージを抽出し、これを
    解析し文字認識を行う光学的文字読み取り装置におい
    て、 前記帳票を光学的に走査して、複数の階調の帳票画像を
    格納する画像取り込み手段と、 前記パンチ穴に関する濃度が予め記憶されたパンチ穴濃
    度定義手段と、 前記画像取り込み手段に格納された帳票画像中から、前
    記パンチ穴濃度定義手段に記憶された濃度と近い濃度領
    域を全て検出し、それぞれの中心座標を求めるパンチ穴
    検出手段と、 前記プレ印刷文字領域に関する濃度が予め記憶されたプ
    レ印刷文字濃度定義手段と、 前記画像取り込み手段に格納された帳票画像中から、前
    記プレ印刷文字濃度定義手段に記憶された濃度と近い濃
    度領域を全て検出し、それぞれの中心座標を求めるプレ
    印刷文字検出手段と、 前記帳票の特定のパンチ穴およびプレ印刷文字領域に関
    する中心座標を、複数の異なる帳票挿入方向ついて予め
    求め、これをテーブル化した座標テーブルと、 前記パンチ穴検出手段およびプレ印刷文字検出手段にて
    それぞれ検出されたパンチ穴およびプレ印刷文字領域の
    中心座標と前記座標テーブルとのマッチングをとり、座
    標テーブルのいずれかの方向の座標と一致もしくは最も
    近いものとなった座標を前記画像取り込み手段に格納さ
    れた帳票画像における特定のパンチ穴およびプレ印刷文
    字領域の中心座標とし、その方向を前記帳票が挿入され
    た方向と判定する帳票挿入方向判定手段と、 前記帳票挿入方向判定手段にて帳票画像における特定の
    パンチ穴およびプレ印刷文字領域の中心座標とされた座
    標を結ぶ第1の線を求め、さらに、前記帳票挿入方向判
    定手段にて判定された挿入方向に関する前記座標テーブ
    ルのパンチ穴およびプレ印刷文字領域の中心座標を結ぶ
    第2の線を求めて、該第1の線と該第2の線となす角度
    を算出し、これを前記帳票の傾き角度とする傾き角度算
    出手段と、 前記傾き角度算出手段にて算出された帳票の傾き角度に
    基づいて、前記文字認識の際に帳票画像から抽出される
    文字イメージの位置を補正する手段と、を有することを
    特徴とする光学的文字読み取り装置。
  3. 【請求項3】 パンチ穴が1つ以上設けられ、少なくと
    も1箇所に予め文字が印刷されたプレ印刷文字領域を有
    する帳票を対象とし、挿入された帳票を光学的に走査し
    て得られる帳票画像から文字イメージを抽出し、これを
    解析し文字認識を行う光学的文字読み取り装置におい
    て、 前記帳票を光学的に走査して、複数の階調の帳票画像を
    格納する画像取り込み手段と、 画像取り込み手段に格納された帳票画像の各画素毎の濃
    度の頻度分布を求める濃度分布算出手段と、 濃度分布算出手段にて求められた濃度の頻度分布を基に
    前記パンチ穴に関する濃度を求めるパンチ穴濃度算出手
    段と、 濃度分布算出手段にて求められた濃度の頻度分布を基に
    前記プレ印刷文字領域に関する濃度を求めるプレ印刷文
    字濃度算出手段と、 前記画像取り込み手段に格納された帳票画像中から、前
    記パンチ穴濃度算出手段にて求められた濃度と近い濃度
    領域を全て検出し、それぞれの中心座標を求めるパンチ
    穴検出手段と、 前記画像取り込み手段に格納された帳票画像中から、前
    記プレ印刷文字濃度算出手段に記憶された濃度と近い濃
    度領域を全て検出し、それぞれの中心座標を求めるプレ
    印刷文字検出手段と、 前記帳票の特定のパンチ穴およびプレ印刷文字領域に関
    する中心座標を、複数の異なる帳票挿入方向ついて予め
    求め、これをテーブル化した座標テーブルと、 前記パンチ穴検出手段およびプレ印刷文字検出手段にて
    それぞれ検出されたパンチ穴およびプレ印刷文字領域の
    中心座標と前記座標テーブルとのマッチングをとり、座
    標テーブルのいずれかの方向の座標と一致もしくは最も
    近いものとなった座標を前記画像取り込み手段に格納さ
    れた帳票画像における特定のパンチ穴およびプレ印刷文
    字領域の中心座標とし、その方向を前記帳票が挿入され
    た方向と判定する帳票挿入方向判定手段と、 前記帳票挿入方向判定手段にて帳票画像における特定の
    パンチ穴およびプレ印刷文字領域の中心座標とされた座
    標を結ぶ第1の線を求め、さらに、前記帳票挿入方向判
    定手段にて判定された挿入方向に関する前記座標テーブ
    ルのパンチ穴およびプレ印刷文字領域の中心座標を結ぶ
    第2の線を求めて、該第1の線と該第2の線となす角度
    を算出し、これを前記帳票の傾き角度とする傾き角度算
    出手段と、 前記傾き角度算出手段にて算出された帳票の傾き角度に
    基づいて、前記文字認識の際に帳票画像から抽出される
    文字イメージの位置を補正する手段と、を有することを
    特徴とする光学的文字読み取り装置。
  4. 【請求項4】 濃度による検出が可能な第1および第2
    の領域を有する帳票を対象とし、挿入された帳票を光学
    的に走査して得られる帳票画像から文字イメージを抽出
    し、これを解析し文字認識を行う光学的文字読み取り装
    置において行われる帳票の傾き角度検出方法であって、 前記帳票を光学的に走査して、複数の階調の帳票画像を
    得る第1のステップと、 前記第1のステップにて得られた帳票画像中から、予め
    設定された前記第1および第2の領域に関する濃度と近
    い濃度領域を全て検出してそれぞれの中心座標を求める
    第2のステップと、 前記第2のステップにて検出された各中心座標と、前記
    第1および第2の領域の中心座標を複数の異なる帳票挿
    入方向ついて予め求めた座標テーブルとのマッチングを
    とり、座標テーブルのいずれかの方向の座標と一致もし
    くは最も近いものとなった座標を前記第1のステップに
    て得られた帳票画像における前記第1および第2の領域
    の中心座標とし、その方向を前記帳票が挿入された方向
    と判定する第3のステップと、 前記第3のステップにて第1および第2の領域の中心座
    標とされた座標を結ぶ第1の線を求め、さらに、前記第
    3のステップにて判定された挿入方向に関する前記座標
    テーブルの第1および第2の領域の中心座標を結ぶ第2
    の線を求めて、該第1の線と該第2の線とのなす角度を
    算出し、これを前記帳票の傾き角度とする第4のステッ
    プとを有することを特徴とする帳票の傾き角度検出方
    法。
  5. 【請求項5】 請求項4に記載の帳票の傾き角度検出方
    法において、 第1および第2の領域がパンチ穴および予め文字が印刷
    されたプレ印刷文字領域であり、 第3のステップにおいては、第2のステップにて検出さ
    れた各中心座標と、帳票の特定のパンチ穴およびプレ印
    刷文字領域に関する中心座標を複数の異なる帳票挿入方
    向ついて予め求めた座標テーブルとのマッチングをと
    り、座標テーブルのいずれかの方向の座標と一致もしく
    は最も近いものとなった座標を前記第1のステップにて
    得られた帳票画像における特定のパンチ穴およびプレ印
    刷文字領域の中心座標とし、その方向を前記帳票が挿入
    された方向と判定することを特徴とする帳票の傾き角度
    検出方法。
JP7243273A 1995-09-21 1995-09-21 光学的文字読み取り装置および帳票の傾き角度検出方法 Pending JPH0991372A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7243273A JPH0991372A (ja) 1995-09-21 1995-09-21 光学的文字読み取り装置および帳票の傾き角度検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7243273A JPH0991372A (ja) 1995-09-21 1995-09-21 光学的文字読み取り装置および帳票の傾き角度検出方法

Publications (1)

Publication Number Publication Date
JPH0991372A true JPH0991372A (ja) 1997-04-04

Family

ID=17101421

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7243273A Pending JPH0991372A (ja) 1995-09-21 1995-09-21 光学的文字読み取り装置および帳票の傾き角度検出方法

Country Status (1)

Country Link
JP (1) JPH0991372A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006091212A (ja) * 2004-09-22 2006-04-06 Fuji Xerox Co Ltd 印刷装置および印刷結果検査方法
CN112308056A (zh) * 2019-07-26 2021-02-02 深圳怡化电脑股份有限公司 票据特征区域的获取方法、装置、设备和存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006091212A (ja) * 2004-09-22 2006-04-06 Fuji Xerox Co Ltd 印刷装置および印刷結果検査方法
JP4525270B2 (ja) * 2004-09-22 2010-08-18 富士ゼロックス株式会社 印刷装置および印刷結果検査方法
CN112308056A (zh) * 2019-07-26 2021-02-02 深圳怡化电脑股份有限公司 票据特征区域的获取方法、装置、设备和存储介质

Similar Documents

Publication Publication Date Title
US7636483B2 (en) Code type determining method and code boundary detecting method
JP4911340B2 (ja) 二次元コード検出システムおよび二次元コード検出プログラム
US6959121B2 (en) Document image processing device, document image processing method, and memory medium
EP1033864B1 (en) Document-inclination detector
JPH0991372A (ja) 光学的文字読み取り装置および帳票の傾き角度検出方法
JP3640488B2 (ja) 画像処理方法
US7865130B2 (en) Material processing apparatus, material processing method, and material processing program product
JPH10207978A (ja) 文字等パターン照合方法及び装置
JP3223878B2 (ja) 文字列照合装置、方法及び記録媒体
JPH07230525A (ja) 罫線認識方法及び表処理方法
JP3022459B2 (ja) 帳票識別登録装置
JP2005182236A (ja) 車両ナンバー読み取り装置
JPH1196296A (ja) 帳票イメージ処理方法および装置
JPH04276888A (ja) 文字読取装置
JP3606218B2 (ja) 文書分類装置、文字読み取り装置及び真贋判定装置、並びにこれらの方法
JP3163235B2 (ja) 光学式文字読取装置
JPH11250179A (ja) 文字認識装置および文字認識方法
JP3356819B2 (ja) マーク認識装置
JP2998718B2 (ja) 光学式文字読取方法および装置
JP3919390B2 (ja) 文字認識装置
JP3381803B2 (ja) 傾き角検出装置
JPH0991376A (ja) イメージデータ入力処理方法およびその装置
JPH01234985A (ja) 文字読取装置の文字切出し装置
JP2003187249A (ja) 画像の傾き検出方法及び画像の傾き補正方法
JP2001101342A (ja) 文字認識装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19980922