JPH0713996A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0713996A
JPH0713996A JP5154841A JP15484193A JPH0713996A JP H0713996 A JPH0713996 A JP H0713996A JP 5154841 A JP5154841 A JP 5154841A JP 15484193 A JP15484193 A JP 15484193A JP H0713996 A JPH0713996 A JP H0713996A
Authority
JP
Japan
Prior art keywords
character
read
characters
printing
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5154841A
Other languages
English (en)
Inventor
Takeyuki Sugimoto
建行 杉本
Shinichi Shima
真一 島
Kiyomichi Kurino
清道 栗野
Akizo Kadota
彰三 門田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP5154841A priority Critical patent/JPH0713996A/ja
Publication of JPH0713996A publication Critical patent/JPH0713996A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 文字認識装置に読み取らせることを意識せず
に作成された帳票に記入あるいは印字された文字を読み
取ることを可能とする。 【構成】文字認識装置10は、帳票等のイメージから1
文字ごとに文字パターンの切り出しを行い、文字認識す
る装置とされ、帳票イメージから行のイメージを抽出す
る行イメージ抽出部11、抽出された行イメージから1
文字パターンを抽出する1文字切り出し部12、読み取
り文字以外の文字あるいは図形等を除去するプレ印刷除
去部13、読み取り文字を認識する文字認識部14およ
びプレ印刷存在情報指定部15とによって構成され、読
み取り文字の近傍に読み取り文字以外の文字あるいは図
形等が存在する場合に、読み取り文字以外の文字あるい
は図形等の存在情報をあらかじめ指定し、指定された存
在情報に基づき読み取り文字以外の文字あるいは図形等
を除去し、読み取り対象の文字を読み取る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字認識装置に関し、
特に文字認識装置に読み取らせることを意識せずに、読
み取り文字の近傍に読み取り文字以外の文字あるいは図
形等が存在するように作成された帳票に、記入あるいは
印字された文字を読み取る技術に適用して有効な技術に
関する。
【0002】
【従来の技術】たとえば、文字認識装置により帳票等の
文字を読み取る場合、読み取り文字の近傍に、読み取り
文字以外の文字あるいは図形が存在してはならない領域
(クリアエリア)を設け、帳票を設計する必要があっ
た。また、読み取り文字の近傍に読み取り文字以外の文
字あるいは図形を印刷する場合は、文字認識装置に帳票
のイメージを取り込んだときには見えなくなる色のドロ
ップアウトカラーによって印刷する必要があった。
【0003】また、このような文字認識装置としては、
特開昭60−126777号公報に開示されている。
【0004】
【発明が解決しようとする課題】ところが、前記のよう
な従来技術においては、文字認識装置に読み取らせるこ
とを意識せずに作成された帳票は、文字認識装置によっ
て読み取りができず、帳票を再設計するか、文字認識装
置での読み取りを断念せざるを得ず、帳票の再設計など
のために文字認識装置の導入に際してコストがかかった
り、文字認識装置を導入しての省力化ができなかったり
する問題がある。
【0005】また、非ドロップアウトカラーによって印
刷された記入枠内の文字を読み取る方式があるが、記入
枠内に読み取り文字以外の文字あるいは図形等が存在す
る場合には考慮されていないという問題もある。
【0006】そこで、本発明の目的は、文字認識装置に
読み取らせることを意識せずに作成された帳票を、その
ままの状態において読み取りが可能な文字認識装置を提
供することにある。
【0007】本発明の前記ならびにその他の目的と新規
な特徴は、本明細書の記述および添付図面から明らかに
なるであろう。
【0008】
【課題を解決するための手段】本願において開示される
発明のうち、代表的なものの概要を簡単に説明すれば、
下記のとおりである。
【0009】すなわち、本発明の文字認識装置は、少な
くとも帳票のイメージから1文字ごとに文字パターンの
切り出しを行い、文字を認識する文字認識装置であっ
て、読み取り文字の近傍に、少なくとも読み取り文字以
外の文字あるいは図形が存在する場合に、読み取り文字
以外の文字あるいは図形の存在情報をあらかじめ指定す
る存在情報指定手段と、指定された存在情報に基づき、
読み取り文字以外の文字あるいは図形を除去する除去手
段とを備えるものである。
【0010】
【作用】前記した文字認識装置によれば、読み取り文字
の近傍に読み取り文字以外の文字あるいは図形等が存在
する場合に、存在情報指定手段および除去手段により、
読み取り文字以外の文字あるいは図形等を除去して、読
み取り文字のみ存在する状態として読み取り文字を読み
取ることができる。
【0011】また、読み取り文字以外の文字あるいは図
形等の存在情報の指定を、文字記入枠からの相対位置に
よって指定することにより、読み取り文字以外の文字あ
るいは図形等を除去し、読み取り文字のみを読み取るこ
とができる。
【0012】さらに、読み取り文字以外の文字あるいは
図形等の存在情報を指定する代わりに、読み取り文字の
存在情報を指定することにより、読み取り対象の文字の
みを読み取ることができる。
【0013】これにより、文字認識装置に読み取らせる
ことを意識せずに、作成された帳票等の文字を読み取る
場合に、読み取り文字とそれ以外の文字あるいは図形等
を区別することによって読み取り対象の文字のみを読み
取ることができる。
【0014】
【実施例】以下、本発明の実施例を詳細に説明する。
【0015】(実施例1)図1は本発明の実施例1であ
る文字認識装置の構成を示すブロック図、図2は実施例
1における文字記入枠内にプレ印刷のある記入枠の一例
を示す概略説明図、図3は実施例1におけるプレ印刷の
位置指定の一例を示す概略説明図、図4は実施例1にお
けるプレ印刷除去処理部の処理手順を示すフローチャー
ト、図5は実施例1における記入枠抽出とプレ印刷エリ
ア設定の一例を示す概略説明図、図6は実施例1におけ
るプレ印刷除去処理1の処理方法の一例を示す概略説明
図、図7は実施例1における記入文字とプレ印刷の接触
の一例を示す概略説明図、図8は実施例1におけるプレ
印刷除去処理2の処理方法の一例を示す概略説明図、図
9は実施例1におけるプレ印刷除去処理3の処理方法の
一例を示す概略説明図である。
【0016】まず、図1により本実施例の文字認識装置
の構成を説明する。
【0017】本実施例の文字認識装置10は、たとえば
帳票等のイメージから1文字ごとに文字パターンの切り
出しを行い、文字認識する装置とされ、帳票イメージか
ら行のイメージを抽出する行イメージ抽出部11、抽出
された行イメージから1文字パターンを抽出する1文字
切り出し部12、読み取り文字以外の文字あるいは図形
等(以下、プレ印刷という)を除去するプレ印刷除去部
(除去手段)13、読み取り文字を認識する文字認識部
14、およびプレ印刷存在情報指定部(存在情報指定手
段)15によって構成されている。
【0018】行イメージ抽出部11は、帳票イメージか
らあらかじめ指定された書式情報に基づき、行のイメー
ジを抽出するものであり、この抽出された行イメージは
1文字切り出し部12に送出される。1文字切り出し部
12は、行イメージ抽出部11より送られてきた行イメ
ージより、あらかじめ指定された文字記入枠のサイズに
基づき、1文字パターンを抽出するものであり、この抽
出された1文字パターンはプレ印刷除去部13に送られ
る。
【0019】プレ印刷除去部13は、1文字切り出し部
12より送られてきた1文字パターンの中から、プレ印
刷存在情報指定部15により指定されたプレ印刷の存在
情報に基づき、読み取り文字以外の文字あるいは図形を
除去するものであり、この除去後の読み取り文字のみが
文字認識部14へ送出され、文字認識部14はプレ印刷
除去部13から送られてきた文字を認識するものであ
る。
【0020】次に、本実施例の作用について、プレ印刷
除去部13とプレ印刷存在情報指定部15の動作につい
て詳細に説明する。
【0021】たとえば、図2に示すように文字記入枠内
にプレ印刷が存在している場合を考え、20は記入枠、
21〜26はプレ印刷、31〜35は記入文字である。
図3はプレ印刷の存在情報の指定方法を示しており、4
1と42はプレ印刷エリアの垂直方向のスタートとエン
ド、43と44はプレ印刷エリアの水平方向のスタート
とエンドを示している。本実施例において、プレ印刷存
在情報指定部15は、図3に示すプレ印刷の位置情報4
1〜44をあらかじめオペレータが入力し、保持してい
るものとする。
【0022】次に、プレ印刷除去部13の動作を図4の
フローを用いて説明する。
【0023】まず、ステップ401の記入枠抽出は、図
5に示すように1文字切り出し部12から送られてきた
パターン501から、あらかじめ指定された文字記入枠
サイズに基づき記入枠のパターンを抽出し、輪郭データ
からドットデータ502に変換する。
【0024】次に、ステップ402のプレ印刷エリア設
定において、記入枠パターンを縦方向に細め記入枠の縦
線503のみを残し、縦方向に投影を取り記入枠のX座
標505を抽出する。同様に記入枠パターンを横方向に
細め記入枠の横線504のみを残し、横方向に投影を取
り記入枠のY座標506を抽出する。抽出した記入枠の
座標とあらかじめプレ印刷存在情報指定部15に指定さ
れているプレ印刷の位置情報41〜44とにより、プレ
印刷エリア601を設定する(図6に示す)。
【0025】さらに、ステップ403のプレ印刷除去処
理1は、図6に示すように、文字あるいはプレ印刷パタ
ーンの左端座標XS1〜2,右端座標XE1,2,上端
座標YS1,2,下端座標YE1,2と、プレ印刷エリ
ア601の左端座標PXS,右端座標PXE,上端座標
PYS,下端座標PYEを比較し、プレ印刷エリア60
1内に入っているパターンをプレ印刷として除去する。
【0026】次に、文字認識装置10は、プレ印刷を除
去したパターンを認識し(ステップ404)、さらに記
入文字とプレ印刷の接触を判定する(ステップ40
5)。その場合に接触していないときは、処理を終了す
る。一方、接触しているときは、プレ印刷除去処理2を
実行する(ステップ406)。記入文字とプレ印刷の接
触の判定は、図7に示すように、パターンの輪郭上の点
701〜703をトレースし、プレ印刷エリア601に
入っていると記入文字とプレ印刷が接触していると判断
する。
【0027】次に、プレ印刷除去処理2(ステップ40
6)は、たとえば、図8(a)〜(e)に示すようにプ
レ印刷エリア601内において、一定量パターンを細め
プレ印刷を消去し、さらに細めたパターンを一定量太め
文字パターン部分を復元する。そして、復元したパター
ンによってプレ印刷エリア601内のパターンを置き換
える。この一連の処理により、プレ印刷を除去したパタ
ーンを作成する。
【0028】さらに、文字認識装置10は、プレ印刷を
除去したパターンを認識し(ステップ407)、認識結
果がアクセプトかを判定する(ステップ408)。アク
セプトの場合には処理を終了する。一方、認識結果が不
読ならプレ印刷除去処理3を実行する(ステップ40
9)。
【0029】そして、プレ印刷除去処理3(ステップ4
09)は、たとえば図9に示すように、プレ印刷エリア
内において、パターンを消去する。さらに、消去後認識
する(ステップ410)ことにより、3段階において文
字認識を可能とする。
【0030】以上の処理により、プレ印刷除去部13の
処理を終了する。
【0031】なお、記入枠の抽出は、従来の方法を用
い、また、プレ印刷除去処理2および3における処理
は、輪郭データをドットデータに変換して処理し、プレ
印刷を消去し、その後にドットデータを輪郭データに変
換することにより行うことができる。輪郭データとドッ
トデータの変換は既知の方法を用いることができる。
【0032】以上により、読み取り文字の近傍に読み取
り文字以外の文字あるいは図形等が存在しても、読み取
り文字のみを読み取ることができる。
【0033】(実施例2)図10は本発明の実施例2に
おけるプレ印刷除去方法の一例を示す概略説明図であ
る。
【0034】なお、本実施例2における文字認識装置の
構成は実施例1と同様であるので、以下に、本実施例の
作用を説明する。
【0035】実施例1においては、プレ印刷存在情報の
指定として、プレ印刷エリア601の水平方向と垂直方
向のスタートとエンド座標を指定したが、本実施例2で
は、図10に示すように、プレ印刷の概略の位置座標1
001,1002とプレ印刷の大きさ(高さa100
3,幅b1004)を指定する。
【0036】さらに、プレ印刷エリア601の設定は、
プレ印刷の概略の位置座標1001,1002の上下左
右に一定幅1005により設定する。
【0037】次に、プレ印刷の除去は、プレ印刷エリア
601に侵入しているパターンのうち、パターンの高さ
h1006,幅w1007が指定されたプレ印刷の大き
さ(高さa1003,幅b1004)より小さいパター
ンをプレ印刷として除去する。
【0038】以上により、プレ印刷の概略の位置座標1
001,1002とプレ印刷の大きさ(高さa100
3,幅b1004)を指定することによってプレ印刷の
除去を行うことができ、これにより読み取り対象の文字
のみを認識し、読み取ることができる。
【0039】従って、本実施例2の文字認識装置10に
よれば、プレ印刷除去部13と、プレ印刷存在情報指定
部15とにより、帳票上の読み取り文字以外の文字およ
び図形等を除去し、読み取り対象の文字のみを読み取る
ことができ、文字認識装置に読み取らせることを意識せ
ずに、作成された帳票等の文字の読み取りができる。
【0040】以上、本発明者によってなされた発明を実
施例に基づき具体的に説明したが、本発明は前記実施例
に限定されるものではなく、その要旨を逸脱しない範囲
において種々変更可能であることは言うまでもない。
【0041】たとえば、前記実施例1においては、プレ
印刷の存在情報を指定する場合について説明したが、本
発明は前記実施例に限定されるものでなく、読み取り文
字の位置情報を指定するようにしても、同様の効果が得
られる。
【0042】また、前記実施例1においては、文字個別
の記入枠の例について説明したが、図11に示すように
フィールド枠1101(プレ印刷1102〜1103)
の場合にも同様に実施できる。
【0043】さらに、実施例1のプレ印刷エリアの指定
方法と実施例2のプレ印刷エリアの指定方法を入れ替え
てもよい。
【0044】また、実施例1のプレ印刷除去処理1,
2,3と実施例2のプレ印刷除去処理は、それぞれ独立
した処理であり、1つの処理だけにすることもでき、ま
た複数の処理を任意の順に実行することもできる。
【0045】
【発明の効果】本願において開示される発明のうち、代
表的なものによって得られる効果を簡単に説明すれば、
下記のとおりである。
【0046】すなわち、本発明によれば、読み取り文字
の近傍に読み取り文字以外の文字あるいは図形等が存在
しても読み取り文字のみを読み取ることができ、文字認
識装置に読み取らせることを意識せずに、作成された帳
票をそのままの状態において読み取ることができる。
【0047】この結果、今までの文字認識装置において
文字の読み取りができなかった一般の帳票等に関して、
帳票の再設計などを行うことなく、読み取り対象の文字
を読み取ることができ、帳票の再設計などの文字認識装
置の導入に際してかかるコストを抑えることができ、さ
らに省力化が可能となる。
【図面の簡単な説明】
【図1】本発明の実施例1である文字認識装置の構成を
示すブロック図である。
【図2】実施例1における文字記入枠内にプレ印刷のあ
る記入枠の一例を示す概略説明図である。
【図3】実施例1におけるプレ印刷の位置指定の一例を
示す概略説明図である。
【図4】実施例1におけるプレ印刷除去処理部の処理手
順を示すフローチャートである。
【図5】実施例1における記入枠抽出とプレ印刷エリア
設定の一例を示す概略説明図である。
【図6】実施例1におけるプレ印刷除去処理1の処理方
法の一例を示す概略説明図である。
【図7】実施例1におけるプレ印刷と記入文字の接触の
一例を示す概略説明図である。
【図8】実施例1におけるプレ印刷除去処理2の処理方
法の一例を示す概略説明図である。
【図9】実施例1におけるプレ印刷除去処理3の処理方
法の一例を示す概略説明図である。
【図10】本発明の実施例2におけるプレ印刷除去方法
の一例を示す概略説明図である。
【図11】フィールド枠の一例を示す概略説明図であ
る。
【符号の説明】
10 文字認識装置 11 行イメージ抽出部 12 1文字切り出し部 13 プレ印刷除去部(除去手段) 14 文字認識部 15 プレ印刷存在情報指定部(存在情報指定手段) 20 記入枠 21〜26 プレ印刷 31〜35 記入文字 41〜44 プレ印刷の位置情報 501 パターン 502 ドツトデータ 503 記入枠の縦線 504 記入枠の横線 505 記入枠のX座標 506 記入枠のY座標 601 プレ印刷エリア 701〜703 パターンの輪郭上の点 1001,1002 プレ印刷の概略の位置座標 1003 プレ印刷の大きさ(高さa) 1004 プレ印刷の大きさ(幅b) 1005 一定幅 1006 パターンの高さh 1007 パターンの幅w 1101 フィールド枠 1102,1103 プレ印刷 XS1 文字パターンの左端座標 XS2 プレ印刷パターンの左端座標 XE1 文字パターンの右端座標 XE2 プレ印刷パターンの右端座標 YS1 文字パターンの上端座標 YS2 プレ印刷パターンの上端座標 YE1 文字パターンの下端座標 YE2 プレ印刷パターンの下端座標 PXS プレ印刷エリアの左端座標 PXE プレ印刷エリアの右端座標 PYS プレ印刷エリアの上端座標 PYE プレ印刷エリアの下端座標
フロントページの続き (72)発明者 門田 彰三 神奈川県小田原市国府津2880番地 株式会 社日立製作所ストレージシステム事業部内

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 少なくとも帳票のイメージから1文字ご
    とに文字パターンの切り出しを行い、文字を認識する文
    字認識装置であって、読み取り文字の近傍に、少なくと
    も読み取り文字以外の文字あるいは図形が存在する場合
    に、該読み取り文字以外の文字あるいは図形の存在情報
    をあらかじめ指定する存在情報指定手段と、該指定され
    た存在情報に基づき、該読み取り文字以外の文字あるい
    は図形を除去する除去手段とを備え、該読み取り文字以
    外の文字あるいは図形を除去し、前記読み取り文字を読
    み取ることを特徴とする文字認識装置。
JP5154841A 1993-06-25 1993-06-25 文字認識装置 Pending JPH0713996A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5154841A JPH0713996A (ja) 1993-06-25 1993-06-25 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5154841A JPH0713996A (ja) 1993-06-25 1993-06-25 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0713996A true JPH0713996A (ja) 1995-01-17

Family

ID=15593065

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5154841A Pending JPH0713996A (ja) 1993-06-25 1993-06-25 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0713996A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003030585A (ja) * 2001-07-12 2003-01-31 Canon Inc 画像処理装置、方法、プログラム及び記憶媒体
JP2008243016A (ja) * 2007-03-28 2008-10-09 Oki Electric Ind Co Ltd 文字認識方法、文字認識プログラムおよび文字認識装置
JP2009259291A (ja) * 2000-11-01 2009-11-05 Fujitsu Ltd 文字認識方法,プログラム及び記録媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009259291A (ja) * 2000-11-01 2009-11-05 Fujitsu Ltd 文字認識方法,プログラム及び記録媒体
JP2003030585A (ja) * 2001-07-12 2003-01-31 Canon Inc 画像処理装置、方法、プログラム及び記憶媒体
JP2008243016A (ja) * 2007-03-28 2008-10-09 Oki Electric Ind Co Ltd 文字認識方法、文字認識プログラムおよび文字認識装置

Similar Documents

Publication Publication Date Title
JP2812982B2 (ja) 表認識方法
JP2002007963A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP4049560B2 (ja) 網点除去方法及びシステム
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JPH0713996A (ja) 文字認識装置
JPH04270485A (ja) 印刷文字認識装置
US20040081371A1 (en) Image processing method, device and system
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JP4281236B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JPH06203204A (ja) 文字認識装置
JP3090070B2 (ja) 帳票識別方法及び装置
JP2558668B2 (ja) 文字パタ−ン抽出方法
JP2957729B2 (ja) 行方向判定装置
JP2909132B2 (ja) 光学的文字読取装置
JP3412441B2 (ja) 画像処理装置
JPS6327990A (ja) 文字認識方法
JPH1196296A (ja) 帳票イメージ処理方法および装置
JPH10171924A (ja) 文字認識装置
JP3196603B2 (ja) バーコード認識方法及びシステム
JPH0728933A (ja) 文字認識装置
JP4322999B2 (ja) 連結領域抽出装置及び記録媒体
JPH0728934A (ja) 文書画像処理装置
JPH08321942A (ja) 画像処理装置及び分割図面の画像接合方法
JP3033731B2 (ja) 罫線処理装置、罫線処理方法、およびプログラムを記録する記録媒体
JPH0343879A (ja) 文字認識装置およびその文字領域分離方法