JPH03161888A - 光学的文字読取装置 - Google Patents

光学的文字読取装置

Info

Publication number
JPH03161888A
JPH03161888A JP1301314A JP30131489A JPH03161888A JP H03161888 A JPH03161888 A JP H03161888A JP 1301314 A JP1301314 A JP 1301314A JP 30131489 A JP30131489 A JP 30131489A JP H03161888 A JPH03161888 A JP H03161888A
Authority
JP
Japan
Prior art keywords
document
data
characters
element data
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1301314A
Other languages
English (en)
Inventor
Hidenori Yamamoto
山本 秀範
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1301314A priority Critical patent/JPH03161888A/ja
Publication of JPH03161888A publication Critical patent/JPH03161888A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の目的〕 (産業上の利用分野) 本発明は光学的文字読取装置に係わり、特に帳票形状の
読み取りに関する。
(従来の技術) 従来の光学的文字読取装置では、帳票を読み取って得た
画像データから文字の切り出しを基準辺に基づいて行い
、こうして切り出した文字毎に文字の認識を行っていた
。従って、帳票周辺に破れや切り残し又は汚れがあった
場合、前記基準辺がずれて、文字の読取結果に桁ずれが
発生することがあった。
第3図(A)は帳票10の左辺が破れている場合を示し
たものである。文字切り出しの際の基準辺は、本来、帳
票lのA辺となっており、文字フィールドはこの基準辺
よりbだけ左側に行った位置に指定されている。しかし
、この例では、前記基準辺がaだけ右側に切り取られて
いるため、文字め切り出しはa+bの位置から行われて
しまい、第3図(B)で示す如く、読取結果に桁ずれが
発生してしまうという欠点があった。
(発明が解決しようとする課題〉 上記の如く、従来の光学的文字読取装置によれば、帳票
周辺に彼れや切り残し又は汚れがあると、文字の切り出
し時の基準辺がずれて文字の読み取り結果に桁ずれが発
生するという欠点があった。
そこで本発明は上記の欠点を除去するもので、帳票周辺
に破れや切り残し又は汚れがあった場合でも文字の読み
取り結果に桁ずれ等が生ぜず、常に正確な文字読み取り
を行うことができる光学的文字読取装置を提供すること
を目的としている。
〔発明の構成〕
(課題を解決するための手段) 本発明は帳票を光学的に走査することにより得た画像デ
ータを一旦メモリに記憶し、その後このメモリに記憶し
た画像データから基準辺に基づいて文字を切り出し、こ
の切り出した文字を認識する光学的文字読取装置におい
て、前記メモリ内の画像データから前記帳票周辺部の線
素データを抽出する線素データ抽出手段と、この線素デ
ータ抽出手段によって抽出された線素データから前記基
準辺を算出する基準辺算出手段とを具備した構或を有す
る。
{作用} 本発明の光学的文字読取装置において、線素データ抽出
手段は前記メモリ内の画像データから前記帳票周辺部の
線素データを抽出する。基準辺算出手段は前記線素デー
タ抽出手段によって抽出された線素データから前記基準
辺を算出する。
(実施例〉 以下、本発明の一実施例を図面を参照して説明する。第
1図は本発明の光学的文字読取装置の一実施例を示した
ブロック図である。1は帳票イメージを光電変換して画
像データを取り出す走査部、2は走査部1から得られた
画像データを記憶するイメージバッファ、3はイメージ
バッファ2から画像データを帳票識別部4のデータに基
づいてフィールド単位で切り出し、その後l文字単位で
文字を切り出す文字切出部、4はイメージバッファ2に
記憶されている画像データから帳票の形状に関するデー
タを抽出して前記帳票の形状を識別する帳票識別部、5
は文字切出部3によって切り出された文字を1文字毎認
識する文字認識部である。
次に本実施例の動作について説明する。走査部lは図示
されない帳票を光学的に走査して帳票上に記載してある
内容に対応した画像データを得、これをイメージバッフ
ァ2に送る。イメージバッファ2は送られてきた画像デ
ータを記憶する。一方、帳票識別部4には予め前記読み
取り対象の帳票のサイズを示すデータが設定されている
。この帳票識別部4は前記帳票のサイズデータによって
決まるイメージバッファ内の所定範囲をサーチする。イ
メージバッファ内において、帳票部分が白、背景が黒と
すると、帳票識別部4は、イメージバッファ上の例えば
左上画素を線素データ追跡開始点を探すための走査初期
点とする。走査を続け、最初の帳票の縁辺点を見付ける
と、この縁辺点を中心として8近傍を反時計回りに調べ
、次の帳票の縁辺点を見付け第2図(A>に示す8方向
の線素の一つを抽出する。帳票識別部4はこのようにし
て見付けた新しい縁辺点に注目して次々と帳票の縁辺点
を調べることで、帳票周辺部の線素デー夕を抽出し、例
えば、第2図(B)に示すような5 線素データを取り出すことができる。この第2図(B)
で示した線素データでは、上から、4、4、4が連続し
て得られる部分は下方の直線で、5で左下方に傾き、再
び、4、4で下方の直線となり、継ぎに、3、3、3で
右下方に傾いた直線が得られていることを示している。
以下、同様である。
ここで、帳票のサイズが100 mmX100 mmの
寸法で、走査密度が8ドット/mmとした場合に、前記
走査部1が前記帳票を5mm傾いて搬送帳票内容を光電
変換したとする。その結果、イメージバッファ2に蓄え
られた画像データに帳票識別部4がアクセスして、上記
線素データを抽出した場合、平均的には、第2図(A>
の4の線素データが19個連続して得られる毎に3又は
5の線素データが得られることになる。
次に帳票識別部4は上記の如くして得られた各辺の線素
データから同一の線素番号が連続している部分をサーチ
し、少なくとも3か所の連続部分を捜す。更に帳票識別
部4はこれら3か所の代表座標がy=axの直線を示す
式を満足するか否か6 を判定し、満足する場合は前記aを求めて3点の座標が
一直線上にあることを確認した後、予め定められた辺に
ついてのこれら3点の座標データを文字切り出し部3に
与える。
ここで、上記サーチ動作を第4図に示す帳票の場合につ
いて述べる。図中、(1)〜(4〉は同一の線素番号が
連続した部分(直線部分〉で、この部分が帳票識別部4
にてサーチされる。この場合、(1)、(2〉、〈4〉
の連続部分の各代表座標値はy=axを満足して一直線
上にあるため、このy=axが基準辺として算出される
ことになる。従って、(3)の連続部分くこれは帳票が
破れてできた直線部分〉は排除され、図中一点鎖線で示
した部分が基準辺(y=ax>となる。
文字切り出し部3は与えられた3点の座標データから基
準辺を算出し、この基準辺に基づいてイメージバッファ
2からフィールド単位で文字を切り出し、更にl文字単
位で切り出して、これら切り出した文字を文字認識部5
に送る。文デ認識部5は切り出された文字単位で文字の
認識を行う。
尚、前記3点の座標から算出された前記基準辺は、前記
帳票周辺の破れや切り残し又は汚れの影響によって正規
の位置から変動しない。
本実施例によれば、文字切り出し部3は帳票識別部4か
ら与えられる被読み取り帳票の形状データから算出した
基準辺に基づいてイメージバッファ2から文字の切り出
しを行うため、前記被読み取り帳票の周辺部に破れや切
り残し又は汚れがあっても、これにより前記基準辺が変
動しないため、常に正しい文字の切り出しを行うことが
でき、前記破れや切り残し等によって読み取り結果に桁
ずれが生じることを防止することができる。
尚、帳票識別部4にて線素データをサーチする際に、帳
票のいずれの辺からサーチされるかは、例えば、上辺、
左辺、下辺、右辺と決まっているため、文字切り出し部
3には前述した如く文字切り出しの際に基準辺となる辺
についての情報のみを与えれば良い。しかし、帳票識別
部4にて全ての辺についての線素データをサーチし、直
線が確定されないような辺が存在するような場合には、
完全な帳票イメージを読み込んでいないと判断して、帳
票イメージの読み込みそのものをリジェトするようにし
ても良い。
〔発明の効果〕
以上記述した如く本発明の光学的文字読取装置によれば
、帳票周辺に破れや切り残し又は汚れがあった場合でも
文字の読み取り結果に桁ずれ等が生ぜず、常に正確な文
字の読み取りを行うことができる。
【図面の簡単な説明】
第工図は本発明の光学的文字読取装置の一実施例を示し
たブロック図、第2図は第丁図に示した帳票識別部によ
る抽出線素の種類と抽出した線素例を示した図、第3図
は文字を切り出す際の基準辺の変動例と桁ずれを起こし
た文字読取り結果例を示した図、第4図は第1図で示し
たイメージバッファに記憶された帳票イメージの一例を
示した図である。 工・・・走査部 2・・・イメージバッファ 9 3・・・文字切り出し部 4・・・帳票識別部 5・・・文字認識部

Claims (1)

    【特許請求の範囲】
  1. 帳票を光学的に走査することにより得た画像データを一
    旦メモリに記憶し、その後このメモリに記憶した画像デ
    ータから基準辺に基づいて文字を切り出し、この切り出
    した文字を認識する光学的文字読取装置において、前記
    メモリ内の画像データから前記帳票周辺部の線素データ
    を抽出する線素データ抽出手段と、この線素データ抽出
    手段によって抽出された線素データから前記基準辺を算
    出する基準辺算出手段とを具備したことを特徴とする光
    学的文字読取装置。
JP1301314A 1989-11-20 1989-11-20 光学的文字読取装置 Pending JPH03161888A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1301314A JPH03161888A (ja) 1989-11-20 1989-11-20 光学的文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1301314A JPH03161888A (ja) 1989-11-20 1989-11-20 光学的文字読取装置

Publications (1)

Publication Number Publication Date
JPH03161888A true JPH03161888A (ja) 1991-07-11

Family

ID=17895362

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1301314A Pending JPH03161888A (ja) 1989-11-20 1989-11-20 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JPH03161888A (ja)

Similar Documents

Publication Publication Date Title
US5774580A (en) Document image processing method and system having function of determining body text region reading order
KR970017047A (ko) 문서 화상으로부터의 타이틀 추출 장치 및 방법
JPH08293001A (ja) 画像処理装置及び光学的文字認識装置及びそれらの方法
JPH0418351B2 (ja)
JPH03161888A (ja) 光学的文字読取装置
JP2796561B2 (ja) 表形式文書認識方式
JP3710164B2 (ja) 画像処理装置及び方法
JPH0728935A (ja) 文書画像処理装置
JP2003016385A (ja) 画像処理装置、方法、プログラム、及び記憶媒体
JP3133797B2 (ja) 文字認識方法及びその装置
JPH0373916B2 (ja)
JPH0388085A (ja) 光学的文字読取装置
JPS61190679A (ja) 文字デ−タ処理装置
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JPH09269970A (ja) 文字認識方法とその装置
JPH09114925A (ja) 光学式文字読取装置
JPH04311283A (ja) 行方向判定装置
JP2539026B2 (ja) 文字切り出し装置
JP3566738B2 (ja) 網掛け領域処理方法および網掛け領域処理装置
JPH0527908B2 (ja)
JPH0576674B2 (ja)
JPH01311388A (ja) 光学文字読取装置
JPH06333088A (ja) 光学文字読取装置
JPS62200490A (ja) 光学的文字読取装置
JPH0149995B2 (ja)