JPH096903A - フォーマット情報生成方法 - Google Patents

フォーマット情報生成方法

Info

Publication number
JPH096903A
JPH096903A JP7147715A JP14771595A JPH096903A JP H096903 A JPH096903 A JP H096903A JP 7147715 A JP7147715 A JP 7147715A JP 14771595 A JP14771595 A JP 14771595A JP H096903 A JPH096903 A JP H096903A
Authority
JP
Japan
Prior art keywords
format information
image
format
displayed
screen
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7147715A
Other languages
English (en)
Inventor
Toshiyuki Ono
利幸 小野
Junichi Otsuki
純一 大槻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP7147715A priority Critical patent/JPH096903A/ja
Publication of JPH096903A publication Critical patent/JPH096903A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 フォーマット情報を自動的に作成してその作
成作業効率を向上させ、さらに、作成されたフォーマッ
ト情報の分類や、その後の確認・修正作業を簡単かつ的
確に行える、信頼性の高いフォーマット情報生成方法を
提供する。 【構成】 フォーマットの異なる複数の帳票イメージ1
1〜1nは、光電変換手段21で読み取られ、それらの
複数の帳票イメージがイメージ解析・文字認識手段31
へ送られる。手段31では、帳票イメージを解析すると
共に文字を認識する。フォーマット情報作成手段32で
は、手段31の解析・認識結果に基づき、フォーマット
生成規則36を参照してフォーマット情報を作成する。
分類手段33では、作成されたOKフォーマット情報群
とNGフォーマット情報群とを分類する。確認修正手段
34では、OKフォーマット情報についてはオペレータ
に確認処理をさせ、NGフォーマット情報についてはエ
ラー箇所を修正させてそれを確認させる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字、数字、記号、マ
ーク等(この明細書では、これらを総称して単に「文
字」という)の記入された読取フィールド(読取領域)
を有する帳票上の文字を光学的に読み取る光学式文字読
取装置(以下、OCRという)において、その読取の際
に参照用に用いられる読取情報であるフォーマット情報
を生成するためのフォーマット情報生成方法に関するも
のである。
【0002】
【従来の技術】従来のOCRでは、イメージスキャナ等
によって一定のフォーマット(書式)の帳票のイメージ
を取り込み、その帳票イメージのイメージデータをイメ
ージメモリ(イメージ記憶装置)に記憶させる。そし
て、帳票の読取フィールドを指定したフォーマット情報
(即ち、帳票の読取位置や文字種等を指定したフォーマ
ット情報)を用い、イメージメモリに記憶されたイメー
ジデータから文字切出手段によって読取フィールドを切
り出し、その切り出された読取フィールド内の文字の特
徴を文字認識手段によって抽出することにより、帳票上
の文字を認識する。即ち、帳票には、そのフォーマット
を識別するために、数字等で表された帳票IDが所定位
置(例えば、右上等)に記入又は印字されている。そこ
で、OCRでは、まず、帳票IDを認識し、その帳票I
Dに対応させて予め用意されたフォーマット情報を参照
し、帳票イメージから読取フィールドを切り出し、その
切り出された読取フィールド内の文字を認識辞書を用い
て認識するようになっている。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
フォーマット情報生成方法では、次の(a),(b)の
ような問題があり、それを解決することが困難であっ
た。 (a) 従来のOCRに用いられるフォーマット情報
は、オペレータが手作業によって帳票上の各読取フィー
ルドの位置や大きさ等を定規等で測定して作成してい
る。作成したフォーマット情報は、オペレータがパーソ
ナルコンピュータ等を用いてOCRの記憶装置に記憶
(登録)する。そのため、登録対象となる帳票の数が多
い場合、それらの各帳票毎の寸法測定に時間がかかった
り、測定ミスが発生するおそれがある。 (b) 前記のように手作業によって作成された帳票
は、それが正しく作成されているか否かを確認し、エラ
ー箇所のない正しいOKフォーマット情報については、
登録処理を行い、エラー箇所のある誤りのNGフォーマ
ット情報については、そのエラー箇所を修正して再度確
認した後に登録処理を行う。そのため、登録対象となる
帳票の数が多いと、OKフォーマット情報群とNGフォ
ーマット情報群との分類作業や、その後の確認・修正作
業にも手数を要し、作業効率が悪い。本発明は、前記従
来技術が持っていた課題を解決し、フォーマット情報を
自動的に作成して作成作業効率を向上させ、さらに、そ
の作成されたフォーマット情報の分類や、その後の確認
・修正作業が簡単かつ的確に行える、信頼性の高いフォ
ーマット情報生成方法を提供するものである。
【0004】
【課題を解決するための手段】第1の発明は、前記課題
を解決するために、文字の記入された読取フィールドを
有する帳票上の該文字を、OCRを用いて光学的に読み
取る際に用いる参照用のフォーマット情報を生成するフ
ォーマット情報生成方法において、イメージ取得処理
と、イメージ解析・文字認識処理と、フォーマット情報
作成処理と、分類処理とを、実行するようにしている。
ここで、イメージ取得処理では、フォーマットの異なる
複数の前記帳票のイメージをそれぞれ取得して複数の帳
票イメージを出力する。イメージ解析・文字認識処理で
は、前記各帳票イメージを解析してその帳票イメージ中
の線分の位置及び/又は文字の位置を検出すると共にそ
の文字を認識し、前記帳票イメージ毎の解析・認識結果
をそれぞれ出力する。フォーマット情報作成処理では、
前記帳票イメージ毎の解析・認識結果に基づき、前記読
取フィールドの位置及び/又はその中の文字の情報を検
出し、1つの前記帳票イメージについて全ての読取フィ
ールドが検出できたときにはOKフォーマット情報とし
て、検出できなかった読取フィールドが1つ以上あると
きにはNGフォーマット情報として、前記帳票毎に出力
する。そして、分類処理では、前記OKフォーマット情
報群と前記NGフォーマット情報群とを分類して画面に
表示する。
【0005】第2の発明では、第1の発明の分類処理後
に確認・修正処理を実行するようにしている。この確認
・修正処理では、前記OKフォーマット情報群中のOK
フォーマット情報については、該OKフォーマット情報
とそれに対応する前記帳票イメージとを前記画面上に重
ねて表示して両者の一致/不一致を確認させた後に確定
フォーマット情報とする。さらに、前記NGフォーマッ
ト情報群中のNGフォーマット情報については、該NG
フォーマット情報とそれに対応する前記帳票イメージと
を前記画面上に重ねて表示してエラー箇所を修正させ、
その修正後のフォーマット情報と前記帳票イメージとの
一致/不一致を確認させた後に前記確定フォーマット情
報とする。第3の発明では、第2の発明のフォーマット
情報生成方法において、前記NGフォーマット情報群中
のNGフォーマット情報については、該NGフォーマッ
ト情報とそれに対応する前記帳票イメージとを前記画面
上に重ねて表示すると共に、エラー箇所については標準
フィールド情報を該画面上に表示して該エラー箇所を修
正させるようにしている。
【0006】
【作用】第1の発明によれば、イメージ取得処理によ
り、フォーマットの異なる複数の帳票のイメージがそれ
ぞれ出力されてイメージ解析・文字認識処理へ送られ
る。イメージ解析・文字認識処理では、各帳票イメージ
を解析して線分の位置及び/又は文字の位置を検出する
と共にその文字を認識し、帳票イメージ毎の解析・認識
結果をそれぞれ出力してフォーマット情報作成処理へ送
る。フォーマット情報作成処理では、送られてきた帳票
イメージ毎の解析・認識結果に基づき、読取フィールド
の位置及び/又はその中の文字の情報を検出し、OKフ
ォーマット情報あるいはNGフォーマット情報を作成し
て分類処理へ送る。分類処理では、送られてきたOKフ
ォーマット情報群とNGフォーマット情報群とを分類し
て画面に表示する。
【0007】第2の発明によれば、第1の発明の分類処
理後に確認・修正処理が行われる。この確認・修正処理
において、OKフォーマット情報についてはそのOKフ
ォーマット情報とそれに対応する帳票イメージとを画面
上に重ねて表示し、両者の一致/不一致をオペレータに
確認させた後に確認フォーマット情報として出力する。
NGフォーマット情報については、そのNGフォーマッ
ト情報とそれに対応する帳票イメージとを画面上に重ね
て表示してオペレータにエラー箇所を修正させ、その修
正後のフォーマット情報をオペレータに確認させた後に
確定フォーマット情報として出力する。第3の発明によ
れば、第2の発明のNGフォーマット情報の確認・修正
処理において、NGフォーマット情報とそれに対応する
帳票イメージとを画面上に重ねて表示すると共に、エラ
ー箇所については標準フォーマット情報をその画面上に
表示して該エラー箇所をオペレータに修正させる。
【0008】
【実施例】本発明の実施例では、登録対象となる複数の
帳票をフォーマット情報生成装置によって読み取り、そ
の読取内容からフォーマット情報をそれぞれ生成する方
法を具体的に説明するため、まず読取対象となる帳票の
例を図2に示す。図2の帳票11には、そのフォーマッ
ト情報を識別するために帳票IDが所定位置、例えば右
上に記入あるいは印字されている。帳票IDは、同一種
類の帳票11の共通の位置に設けられており、通常、2
〜5桁の帳票固有の数字(図2では4桁の数字「000
1」)で表現されている。また、帳票11には、読取対
象となる文字が記入された読取フィールドが複数設けら
れている。これらの読取フィールドとして、例えば、上
方に請求月フィールドF1、その下に顧客番号フィール
ドF2、さらにその下にマーク(氏名)フィールドF
3、及び右下に合計フィールドF4が設けられている。
本実施例では、この4つの読取フィールドF1〜F4等
を光学的に読み取り、その位置と大きさを検出し、さら
にマークフィールドF3内の各記入欄の位置や大きさ、
さらにその文字種を検出し、帳票11等に対応するフォ
ーマット情報を生成する。
【0009】図3は、図2の読取フィールドF1〜F4
の位置の表現形式を説明するための図である。図2の各
読取フィールドF1〜F4の位置及び大きさは、帳票1
1の左上を原点0とするXY座標により、読取項目を囲
む矩形の左上位置p1(x1,y1)、X方向の幅w、
及びY方向の高さhを用いて表すものとする。図1は、
本発明の実施例を示すフォーマット情報生成装置の概略
の機能ブロック図である。このフォーマット情報生成装
置は、図2のような複数の帳票11〜1nを順次読み取
り、それらの読取結果に基づき該帳票11〜1nに対応
する各フォーマット情報を生成する装置であり、入力さ
れる各帳票11〜1nを読み取る光電変換手段21を有
し、その出力側にイメージ記憶手段22及び制御部30
が接続されている。光電変換手段21は、イメージスキ
ャナ等で構成され、入力される各帳票11〜1nを光学
的に読み取り、それら各帳票11〜1nのイメージ(帳
票イメージ)I1〜Inを取得すると共に、それら各帳
票11〜1n中の帳票IDをそれぞれ認識するイメージ
取得手段としての機能を有している。イメージ記憶手段
22は、光電変換手段21で読み取られた各帳票イメー
ジI1〜Inをイメージデータの形でそれぞれ記憶する
記憶手段(例えば、メモリ)である。
【0010】制御部30は、フォーマット情報生成装置
全体を制御すると共に、イメージ記憶手段22に記憶さ
れた複数のイメージデータに基づいてそれらの確定フォ
ーマット情報COD1〜CODnをそれぞれ生成する機
能を有し、1つ又は複数のパーソナルコンピュータ等で
構成されている。この制御部30内には、イメージ解析
・文字認識手段31、フォーマット情報作成手段32、
分類手段33、及び確認修正手段34等が設けられてい
る。イメージ解析・文字認識手段31は、イメージ記憶
手段22に記憶された各イメージデータに基づき、各帳
票イメージI1〜In中に含まれる線分の位置及び/又
は文字の位置を解析し、その解析結果の文字の位置から
その位置の文字を切り出し、メモリ等に記憶された認識
辞書35を用いて文字を認識し、それらの解析・認識結
果D1〜Dnを出力する機能を有し、その出力側にフォ
ーマット情報作成手段32が接続されている。フォーマ
ット情報作成手段32は、メモリ等に記憶されたフォー
マット生成規則36を参照して解析・認識結果D1〜D
nから各帳票イメージI1〜In中の読取フィールドF
1〜F4等の位置を検出すると共に、それらの読取フィ
ールドF1〜F4等の中の例えばマークフィールドF3
内に存在する記入欄の位置及びその中の文字の情報を検
出し、それらの読取フィールド位置情報、記入欄位置情
報、及びその記入欄中の文字情報等を有するフォーマッ
ト情報を出力する機能を有している。
【0011】このフォーマット情報には、全てのフィー
ルド情報が正常に検出できたOKフォーマット情報OK
F1〜OKFjと、正常に検出できなかったフィールド
情報が1箇所以上存在するNGフォーマット情報NGF
1〜NGFiとがある。このフォーマット情報作成手段
32の出力側には分類手段33が接続され、さらにその
分類手段33の出力側に確認修正手段34が接続されて
いる。制御部30外には入力操作手段37、表示手段3
8、及びフォーマット情報登録手段39が設けられ、そ
の入力操作手段37及び表示手段38が分類手段33及
び確認修正手段34に接続され、該確認修正手段34に
フォーマット情報登録手段39が接続されている。入力
操作手段37は、キーボード37a及びマウス37b等
で構成され、制御部30内の分類手段33及び確認修正
手段34等に対してデータの入力や作業内容の指示等を
行う機能を有している。表示手段38は、CRTや液晶
等のディスプレイで構成され、制御部30内の分類手段
33及び確認修正手段34等の出力データ等を画面上に
表示する機能を有している。
【0012】分類手段33は、フォーマット情報作成手
段32から出力されたOKフォーマット情報OKF1〜
OKFj群とNGフォーマット情報NGF1〜NGFi
群とを分類して表示手段38の画面に表示する機能を有
している。確認修正手段34は、光電変換手段21で読
み取られた各帳票イメージI1〜Inと、フォーマット
情報作成手段32で作成された各フォーマット情報との
一致/不一致をオペレータに確認され、不一致のときに
はそのフォーマット情報の不一致箇所をオペレータに修
正させる機能を有している。フォーマット情報登録手段
39は、確認修正手段34で確認され、あるいは修正さ
れた確定フォーマット情報COD1〜CODnを各帳票
IDと共に登録するものであり、磁気ドラム、磁気ディ
スク等の記憶装置で構成されている。
【0013】図4は、以上のようなフォーマット情報生
成装置を用いた、本実施例のフォーマット情報生成方法
におけるフォーマット情報生成処理のフローチャートで
ある。この図4のフォーマット情報生成処理では、処理
が開始されると、イメージ取得処理S1において、複数
の帳票11〜1nが所定の分解能を持った光電変換手段
21でそれぞれ読み取られ、それらの各帳票イメージI
1〜Inがイメージデータの形でそれぞれイメージ記憶
手段22に記憶され、イメージ解析・文字認識処理S2
へ進む。イメージ解析・文字認識処理S2では、イメー
ジ記憶手段22に記憶された各帳票イメージI1〜In
が読み出され、その各帳票イメージI1〜In中に含ま
れる線分の位置及び/又は文字の位置がイメージ解析・
文字認識手段31で解析される。さらに、イメージ解析
・文字認識手段31では、イメージ解析結果から、文字
位置における文字ブロックの検出(切り出し)を行い、
その検出した文字ブロックに対して認識辞書35を用い
て文字の認識を行い、それらの各解析・認識結果D1〜
Dnをフォーマット情報作成手段32へ出力し、フォー
マット情報作成処理S3へ進む。
【0014】フォーマット情報作成処理S3において、
フォーマット情報作成手段32では、フォーマット生成
規則36を参照して各解析・認識結果D1〜Dnからそ
れぞれ読取フィールドF1〜F4等の位置を検出する。
さらに、フォーマット情報作成手段32では、例えば、
マークフィールドF3内に存在する記入欄(男女欄、年
号欄、及び生年欄)の位置と、その各記入欄中の文字と
を検出し、それらの読取フィールド位置情報、記入欄位
置情報、及びその記入欄中の文字情報を有するフォーマ
ット情報を各帳票イメージI1〜In毎に出力する。こ
の際、フォーマット情報作成手段32では、全てのフィ
ールド情報が正常に検出できたときにはOKフォーマッ
ト情報OKF1〜OKFjを出力し、正常に検出できな
かったフィールド情報が1箇所以上あるものに対しては
NGフォーマット情報NGF1〜NGFiを出力し、そ
れらのフォーマット情報を分類手段33へ送り、分類処
理S4へ進む。分類処理S4において、分類手段33で
は、フォーマット情報作成手段32から受け取ったOK
フォーマット情報OKF1〜OKFjとNGフォーマッ
ト情報NGF1〜NGFiとを分類し、表示手段38の
画面に表示して次の確認・修正処理S5の作業効率を向
上させる。
【0015】確認・修正処理S5において、確認修正手
段34では、OKフォーマット情報OKF1〜OKFj
について、それらの各OKフォーマット情報OKF1〜
OKFjとそれに対応する各帳票イメージとを表示手段
38の画面上に重ねて表示し、それらの各OKフォーマ
ット情報OKF1〜OKFjが正しく作られているか否
かをオペレータに確認させる。これに対し、NGフォー
マット情報NGF1〜NGFiについては、それらの各
NGフォーマット情報NGF1〜NGFiとそれに対応
する各帳票イメージとを画面上に重ねて表示し、エラー
箇所をオペレータに修正させる。この修正処理におい
て、エラー箇所については予め登録しておいた標準フィ
ールド情報を画面上に表示して該エラー箇所を修正させ
るようにすれば、修正処理を効率良く行える。オペレー
タがマウス37b等を用いて修正操作を行うと、確認修
正手段34によってエラー箇所の修正が行われる。修正
後、そのフォーマット情報とそれに対応する帳票イメー
ジとを画面上に重ねて表示し、そのフォーマット情報が
正しく修正されているか否かをオペレータに確認させ
る。確認・修正処理S5で確認され、あるいは修正及び
確認された確定フォーマット情報COD1〜CODn
は、次の登録処理S6で、各帳票IDと共にフォーマッ
ト情報登録手段39に登録される。
【0016】次に、図5〜図12を参照しつつ、前記の
(1)イメージ取得処理S1と、(2)イメージ解析・
文字認識処理S2と、(3)フォーマット情報作成処理
S3と、(4)分類処理S4と、(5)確認・修正処理
S5及び登録処理S6とを、具体的に説明する。 (1) イメージ取得処理S1 入力操作手段37のキーボード37a等からの指令によ
ってフォーマット情報生成処理が開始されると、光電変
換手段21では、フォーマットの異なる複数の帳票11
〜1nの帳票イメージI1〜Inを光電変換し、イメー
ジデータとしてイメージ記憶手段22に記憶させる。例
えば、図2のような帳票11の帳票イメージI1が光電
変換手段21で光電変換され(例えば、ビット単位に白
紙の部分は“0”に、線分(罫線)や文字の部分は
“1”に変換され)、イメージデータとしてイメージ記
憶手段22に記憶される。この際、図2の帳票11の右
上に記載された帳票ID=0001の認識も行われる。
図5は、図4のイメージ取得処理S1で読み取られた帳
票イメージI1の例を示す図である。この帳票イメージ
I1は、例えば、その左上を原点(0,0)とするXY
座標によって表されている。X軸上の数字0〜24、及
びY軸上の数字0〜28は、説明の便宜上付したもので
ある。また、請求月フィールドF1を表す矩形の破線
は、説明の便宜上付したものであり、帳票イメージI1
上には現れない。例えば、読取対象となる4つの読取フ
ィールドF1〜F4が予め決められていると仮定する。
各矩形の読取フィールドF1〜F4の四隅には、説明の
便宜上座標位置p(x,y)が付されているが、これら
は帳票イメージI1上に現れない。このようなXY座標
で表される帳票イメージI1のイメージデータが、イメ
ージ記憶手段22に記憶される。
【0017】(2) イメージ解析・文字認識処理S2 イメージ解析・文字認識手段31では、イメージ記憶手
段22にそれぞれ記憶された各イメージデータを順次読
み出し、投影法等によって各帳票イメージI1〜In中
に含まれる全ての線分の位置又は文字の位置を検出(解
析)し、さらにそれらのイメージ解析結果に基づき、認
識辞書35を参照して記入欄内の文字を認識し、それら
の解析・認識結果D1〜Dnをフォーマット情報作成手
段32へ送る。即ち、イメージ解析・文字認識手段31
では、例えば図5の帳票イメージI1に対し、X軸方向
の投影処理によって該X軸に平行な線分を検出し、さら
に、Y軸方向の投影処理によって該Y軸に平行な線分を
検出する。検出されたX軸に平行な線分とY軸に平行な
線分とから、それらの交点の座標を求めることができ
る。例えば、図5中の顧客番号フィールドF2は、x=
17のY軸方向の線分と、x=23のY軸方向の線分
と、y=4のX軸方向の線分と、y=5のX軸方向の線
分とによって囲まれた矩形領域となる。この顧客番号フ
ィールドF2のフィールド情報は、左上の始点の座標位
置がp(17,4)、及び右下の終点の座標位置がp
(23,5)であるので、図3に示すように、始点の座
標位置p(17,4)、X方向の幅w=6、及びY方向
の高さh=1の座標位置によって表される。請求月フィ
ールドF1のような矩形の枠で囲まれていない文字ブロ
ックの位置を検出するには、X軸方向の投影結果とY軸
方向の投影結果とを比較することにより、「年」と「月
分」との間の「5」を囲む枠の位置を検出できる。
【0018】次に、イメージ解析・文字認識手段31で
は、イメージ解析結果に基づき、マークフィールドF3
のイメージを切り出す。この切出イメージの例を図6に
示す。実際のイメージ切出処理では、切出誤差等を考慮
し、マークフィールドF3の周囲数mm(例えば、3mm)
を含めて切り出すが、以下の説明を簡単にするために、
図6ではマークフィールドF3の外枠いっぱいに切り出
された例を示す。図6に示すように、マークフィールド
F3の切出イメージのY方向の高さはd1であり、その
切出イメージ内に、男女欄F3−1、年号欄F3−2、
及び生年欄F3−3が含まれている。XY座標におい
て、内枠原点(x0,y0)を基準にして男女欄F3−
1の左上端位置は(f1,g1)、X方向の幅はw1、
Y方向の高さはh1である。年号欄F3−2の左上端位
置は(f2,g2)、幅はw2、及び高さはh2であ
る。生年欄F3−3の左上端位置は(f3,g3)、X
方向の幅はw3、及びY方向の高さはh3である。イメ
ージ解析・文字認識手段31では、マークフィールドF
3の切出イメージを解析し、さらに認識辞書35を参照
して男女欄F3−1、年号欄F3−2、及び生年欄F3
−3内の文字を認識し、その解析・認識結果D1をフォ
ーマット情報作成手段32へ送る。
【0019】(3) フォーマット情報作成処理S3 フォーマット情報作成手段32では、イメージ解析・文
字認識手段31から送られてきた各解析・認識結果D1
〜Dnから、例えば、本願出願人が先に出願した特願平
7−142122号の明細書及び図面に記載されている
ように、フォーマット生成規則36を適用して各フォー
マット情報をそれぞれ作成する。即ち、フォーマット生
成規則36では、読取対象となる複数の帳票11〜1n
の読取フィールド数、読取フィールド名、及び各読取フ
ィールドF1〜F4等の特徴等が規定されている。例え
ば、図2のような読取フィールドF1〜F4の特徴とし
ては、フィールド枠や文字ブロックの大きさ(寸法)、
存在位置、及び検索方法等といったそれらの各読取フィ
ールドF1〜F4に適合する内容が規定されている。そ
こで、フォーマット情報作成手段32では、各解析・認
識結果D1〜Dnの線分又は文字と、フォーマット生成
規則36とをマッチング(照合)し、該フォーマット生
成規則36にマッチ(適合)する線分又は文字を検索
し、例えば図5の各読取フィールドF1〜F4のXY座
標軸上の位置を順次決定し、その位置情報からなるフォ
ーマット情報をそれぞれ作成する。
【0020】さらに、フォーマット情報作成手段32で
は、各解析・認識結果D1〜Dnから、例えば図6のよ
うなマークフィールドF3内の男女欄F3−1の位置、
年号欄F3−2の位置、生年欄F3−3の位置、及び各
欄の文字種のフォーマット情報を作成する。このように
して作成されたフォーマット情報の例を図7に示す。図
7のフォーマット情報では、読取対象となる帳票11の
帳票ID=0001、読取フィールド数=4、及び各読
取フィールドF1〜F4のフィールド位置及び属性等の
情報が含まれている。検索できなかった読取フィールド
がある時には、その読取フィールド欄が空欄になってい
るか、あるいはNGマーク等が付されている。このフォ
ーマット情報作成手段32では、1つの帳票イメージに
ついて全ての読取フィールドが検出できたときにはOK
フォーマット情報OKF1〜OKFjとして、検出でき
なかった読取フィールドが1つ以上あるときにはNGフ
ォーマット情報NGF1〜NGFiとして、帳票毎に出
力して分類手段33へ送る。
【0021】(4) 分類処理S4 分類手段33では、フォーマット情報作成手段32によ
って作成された複数のフォーマット情報のうち、全ての
読取フィールドについて検出できた確認作業待ちのOK
フォーマット情報OKF1〜OKFjと、検出できなか
った読取フィールドが1つ以上ある修正確認作業待ちの
NGフォーマット情報NGF1〜NGFiとを分類し、
OKフォーマットリストとNGフォーマットリストを作
成する。これらのOKフォーマットリストとNGフォー
マットリストの例を、図8及び図9に示す。図8は、表
示手段38の画面38aに表示されたOKフォーマット
リストの例を示す図、及び図9は該画面38aに表示さ
れたNGフォーマットリストの例を示す図である。オペ
レータが入力操作手段37を操作して分類結果の画面表
示を指示すると、表示手段38の画面38aに、図8に
示すようなOKフォーマットリストの表示ウインドウ4
0、あるいは図9に示すようなNGフォーマットリスト
の表示ウインドウ50が表示される。ウインドウとは、
リスト等を表示する大きめの四角のエリアである。OK
フォーマットリストの表示ウインドウ40では、作成さ
れた帳票ID毎のOKフォーマット情報OKF1〜OK
Fjの確認状況「済」又は「待ち」等が表示される。N
Gフォーマットリストの表示ウインドウ50には、作成
された帳票ID毎のNGフォーマット情報NGF1〜N
GFiの確認修正状況「済」あるいは「待ち」等が表示
される。
【0022】OKフォーマットリストあるいはNGフォ
ーマットリスト中のフォーマット情報の確認や修正を行
う場合、例えば、帳票ID上にマウスポインタ(マウス
37bの操作の対象としている位置を矢印等で表示した
ものであり、該マウス37bの動きにあわせて画面上を
移動する)をあわせ、クリック(マウス37bに設けら
れたボタンを押下してすぐ離す操作)することにより、
処理対象とする帳票IDのフォーマット情報を指定でき
る。図8及び図9の画面38aの右下には、確認修正ボ
タン61、登録ボタン62、及び中断ボタン63が表示
されている。ボタンとは、機能の選択や、切替えのため
にボタンの絵を画面上に表示したものである。このボタ
ン上にマウスポインタをあわせ、マウス37bをクリッ
クすることにより、このボタンに割り与えられた機能が
起動する。確認修正ボタン61は、指定された帳票ID
のフォーマット情報を処理対象として確認・修正画面に
移行するボタンである。登録ボタン62は、確認・修正
処理が終了した確定フォーマット情報を登録するための
ボタンである。また、中断ボタン63は、処理を中断す
る場合のボタンである。
【0023】(5) 確認・修正処理S5及び登録処理
S6 図10は、図4中の確認・修正処理S5のフローチャー
トである。このフローチャートを参照しつつ、確認・修
正処理S5を説明する。オペレータが入力操作手段37
によって確認・修正処理S5の開始を指示すると、ステ
ップS10において、分類手段33で分類されたフォー
マット情報群中にNGフォーマット情報NGF1〜NG
Fiがあるか否かが判断され、無しのときには、ステッ
プS11へ進んでOKフォーマット情報OKF1〜OK
Fjの修正処理が行われ、有りのときには、ステップS
21へ進んでNGフォーマット情報NGF1〜NGFi
の修正と確認処理が行われる。OKフォーマット情報O
KF1〜OKFjの確認処理を行う場合、ステップS1
1において、オペレータは入力操作手段37を操作して
図8のようなOKフォーマットリストの表示ウインドウ
40を画面38a上に表示させ、ステップS12へ進
む。ステップS12において、オペレータはOKフォー
マットリストの表示ウインドウ40を見て、確認すべき
OKフォーマット情報(例えば、帳票ID=0001)
を選択するために、その帳票ID=0001をマウス3
7bでクリックした後、確認修正ボタン61をクリック
する。すると、ステップS13において、確認修正手段
34の制御によって表示手段38の画面38a上に確認
画面が表示される。この確認画面の一例を図11に示
す。
【0024】図11は、表示手段38の画面38aに表
示された確認画面を示す図である。確認画面は、例えば
帳票11から読み取った帳票イメージI1と、作成した
OKフォーマット情報OKF1とを重ねて表示し、正し
くフォーマット情報が作成されているか否かを確認する
画面であり、イメージ及びフォーマット全体が表示され
る。この確認画面では、表示手段38の画面38aの左
側に、帳票11の全体イメージの表示ウインドウ70が
表示され、右側に、フィールドの拡大イメージの表示ウ
インドウ80が表示されている。帳票全体イメージの表
示ウインドウ70では、処理中の帳票11の全面イメー
ジが表示されている。図11では、確認対象となるフィ
ールド枠71が太線で表されている。このフィールド枠
71は、太線で表す以外に、確認中のフィールド枠とそ
の他のフィールド枠とを異なる色で表示するようにして
もよい。右側の拡大イメージの表示ウインドウ80で
は、処理対象となるフィールドのイメージが拡大表示さ
れている。この表示ウインドウ80の下側には、性別ボ
ックス91や元号ボックス92等のボックス90、氏名
フィールドボタン101や月分フィールドボタン102
等のフィールドボタン100、及び次の欄操作ボタン1
11やセーブ操作ボタン112等の操作ボタン110と
いった、各種のボックスやボタン等が表示されている。
ボックス90は、ボタン押下後、確認メッセージを表示
し、さらに詳細な機能を選択するためのボタンを表示す
るウインドウである。
【0025】確認を行う場合、オペレータは図11の左
側の全体イメージの表示ウインドウ70を見て、帳票イ
メージI1中の読取フィールドF1〜F4と、作成され
たOKフォーマット情報OKF1のフィールド枠71と
が、重なっているか否かを確認する。この際、例えば、
氏名フィールドボタン101をマウス37bでクリック
すれば、右側の表示ウインドウ80にマークフィールド
F3の拡大イメージが表示されるので、フィールド枠7
1の重なり状態をより詳細にチェックできる。さらに、
男女欄や年号欄等については、性別ボックス91に帳票
イメージI1中の性別文字種が表示され、元号ボックス
92に該帳票イメージI1中の元号文字種が表示される
ので、それらと作成されたフォーマット情報との一致/
不一致の確認が容易に行える。もし、不一致箇所があれ
ば、後述する修正処理によって不一致箇所を修正する。
このような確認処理が終わると、ステップS14におい
て、図8のOKフォーマットリスト中の確認状況欄に
「済」が記録される。他のOKフォーマット情報OKF
2〜OKFjについても前記と同様の確認処理が行わ
れ、ステップS15においてそれらが全て終了したと判
定されると、OKフォーマット情報OKF1〜OKFj
の確認処理が終了する。確認処理を終了した確定フォー
マット情報は、例えば、図8の登録ボタン62をマウス
37bでクリックすることにより、図4の登録処理S6
においてフォーマット情報登録手段39に登録される。
【0026】一方、図10のステップS21において、
NGフォーマット情報NGF1〜NGFiの確認・修正
処理を行う場合、オペレータは入力操作手段37を操作
し、図9に示すようなNGフォーマットリストを画面3
8a上に表示させ、ステップS22へ進む。ステップS
22において、オペレータはNGフォーマットリスト中
の修正すべき帳票IDのNGフォーマット情報を選択す
るために、その表示ウインドウ中の帳票ID(例えば、
0002)をマウス37bによってクリックする。そし
て、確認修正ボタン61をクリックすると、ステップS
23において、図11のような確認画面が画面38aに
表示される。この際、NGフォーマット情報のうちの検
出できなかった読取フィールド(エラーフィールド)に
ついては、予め登録された標準フィールド情報が画面上
に表示される。オペレータは、図11の左側の全体イメ
ージの表示ウインドウ70を見て、帳票イメージ中の読
取フィールドと、作成されたフォーマット情報(このフ
ォーマット情報ではエラー箇所が標準フォーマット情報
に置き換えられている)のフィールド枠71とが、重な
っているか否かを確認する。例えば、重なりの不一致箇
所があって修正を行う必要がある場合、その不一致箇所
を表示ウインドウ80上でダブルクリック(クリックを
2回連続して行う操作)すると、そのフィールドが拡大
表示された修正画面が表示され、修正できる状態にな
る。この修正画面の例を図12に示す。
【0027】図12の修正画面は、図11の確認画面で
フォーマット情報に誤りがあるときにそのフォーマット
情報を修正するための画面である。この修正画面では、
表示手段38の画面38aに、フィールドの拡大イメー
ジの表示ウインドウ120が表示され、さらにその下
に、性別ボックス131や元号ボックス132等のボッ
クス130、及び読取枠ボタン141、性別ボタン14
2、元号ボタン143、OKボタン144等のボタン1
40が表示されている。例えば、フィールド枠121を
正しい位置に修正する場合、読取枠ボタン141をクリ
ックすると、該フィールド枠121の修正可能状態とな
る。表示ウインドウ120上に、図示しない矢印のマウ
スポインタが表示されるので、マウス37bを操作して
表示ウインドウ120上のマウスポインタをフィールド
枠121箇所に移動させ、そのマウスポインタを上下左
右に動かすことにより、フィールド枠121を正しい位
置にあわせる。
【0028】性別文字種や元号文字種等を修正する場
合、図12の性別ボタン142や元号ボタン143等を
クリックすると、それらの修正可能状態となる。帳票イ
メージの表示内容と性別文字種や元号文字種が異なる場
合、性別ボックス131や元号ボックス132等の右側
のボタン131a,132a等をクリックすると、それ
らのボックス131,132内に文字種の候補が表示さ
れるので、該当する文字種の候補を選択すれば、性別文
字種や元号文字種の修正が行える。なお、この場合に、
オペレータがキーボード37aを用いて正しい文字種を
打ち込んで修正するようにしてもよい。修正処理対象フ
ィールド(フィールド枠、性別、元号、年号)の修正処
理後、例えば、図12のOKボタン144をクリックす
れば、図11の確認画面に戻る。この確認画面を見なが
ら、オペレータは修正箇所の確認等を行い、それが終わ
ると、ステップS24へ進む。ステップS24では、図
9のNGフォーマットリスト中の確認修正状況欄に
「済」が記録される。他のNGフォーマット情報NGF
2〜NGFiの修正と確認が終わると、それがステップ
S25で判断され、NGフォーマット情報NGF1〜N
GFiの修正と確認処理が終了する。このような修正と
確認が終わった確定フォーマット情報は、例えば図9の
登録ボタン62をクリックすることにより、図4の登録
処理S6において、フォーマット情報登録手段39に登
録される。
【0029】以上のように、本実施例では次の(a)〜
(c)のような利点がある。 (a) 図1のフォーマット情報生成装置を用いて自動
的にフォーマット情報を作成できるので、オペレータの
負担を軽減でき、さらに、高精度なフォーマット情報が
得られると共に、その作成作業効率を著しく向上でき
る。 (b) 自動的にフォーマット情報を作成した結果、分
類処理S4により、作成に成功したOKフォーマット情
報OKF1〜OKFjと、不成功となったNGフォーマ
ット情報NGF1〜NGFiとが分類され、OKフォー
マットリストとNGフォーマットリストが作成される。
そのため、オペレータに対し、成功したOKフォーマッ
ト情報OKF1〜OKFjは確認、不成功となったNG
フォーマット情報NGF1〜NGFiは修正と確認、と
いった確認及び修正作業内容の違いを促すことができ
る。その結果、オペレータによる確認及び修正作業を効
率良く行え、正しい確定フォーマット情報COD1〜C
ODnの登録が可能となる。 (c) NGフォーマット情報NGF1〜NGFiの修
正処理において、それらの各NGフォーマット情報NG
F1〜NGFiとそれに対応する各帳票イメージとを画
面38a上に重ねて表示すると共に、エラー箇所につい
ては予め登録した標準フィールド情報をその画面上に表
示してエラー箇所を修正させるようにしている。そのた
め、その標準フィールド箇所を確認してそれに誤りがな
ければそのまま登録し、それに誤りがあれば修正を行え
ばよい。従って、エラー箇所の確認と修正が簡単にな
る。
【0030】なお、本発明は図示の実施例に限定され
ず、種々の変形が可能である。その変形例としては、例
えば次の(i),(ii)のようなものがある。 (i) 図4のフォーマット情報生成処理において、帳
票11〜1n、作成されたフォーマット情報、分類結果
のOKフォーマットリストやNGフォーマットリスト、
あるいは確認・修正処理S5の各内容は、図示のものに
限定されず、種々の種類の帳票に適合するように任意に
変更可能である。 (ii) 上記実施例では、マウス37bを用いて認識・
修正処理S5を行ったが、これ以外の入力操作手段を用
いてもよい。また、図1のフォーマット情報生成装置に
おいて、制御部30内に機能向上のための他の機能ブロ
ックを追加する等、帳票11〜1nの種類と内容に応じ
て装置構成を任意に変更可能である。
【0031】
【発明の効果】以上詳細に説明したように、第1の発明
によれば、イメージ取得処理、イメージ解析・文字認識
処理、及びフォーマット情報作成処理を実行してフォー
マット情報を作成するようにしたので、入力された複数
の帳票から自動的にそれらのフォーマット情報を作成で
きる。そのため、オペレータの負担を軽減でき、フォー
マットの作成作業効率を著しく向上できる。さらに、フ
ォーマット情報作成処理後に分類処理を行うので、自動
的に作成されたフォーマット情報のうち、成功したOK
フォーマット情報群と不成功となったNGフォーマット
情報群とを、オペレータがいちいち仕分けする必要がな
くなる。そのため、その後のオペレータによる確認及び
修正作業において、成功したOKフォーマット群は確
認、不成功となったNGフォーマット群は修正と確認、
といった作業内容の違いを画面表示によってオペレータ
に促すことができる。
【0032】第2の発明によれば、分類処理後に、OK
フォーマット情報群についてはオペレータに確認させた
後に確定フォーマット情報とし、NGフォーマット情報
群についてはオペレータに修正させ、それを確認させた
後に確定フォーマット情報とする確認・修正処理を行
う。特に、これらの確認・修正処理において、帳票イメ
ージとフォーマット情報とが画面上に重ねて表示される
ので、オペレータはその画面を見ながら、作成されたフ
ォーマット情報の確認と修正を簡単に行える。第3の発
明によれば、NGフォーマット情報群に対する確認・修
正処理では、NGフォーマット情報とそれに対応する帳
票イメージとを画面上に重ねて表示すると共に、エラー
箇所については標準フォーマット情報をその画面上に表
示してエラー箇所を修正させるようにしている。そのた
め、オペレータは画面上に表示された標準フォーマット
情報に誤りがなければそのまま登録し、誤りがあれば修
正すればよいので、確認・修正作業が簡単になり、正し
い確定フォーマット情報を登録できる。
【図面の簡単な説明】
【図1】本発明の実施例を示すフォーマット情報生成装
置の概略の機能ブロック図である。
【図2】図1のフォーマット情報生成装置に入力される
帳票の例を示す図である。
【図3】図2のフィールド位置の表現形式を説明する図
である。
【図4】図1のフォーマット情報生成装置を用いたフォ
ーマット情報生成処理のフローチャートである。
【図5】図4における帳票イメージの例を示す図であ
る。
【図6】図5におけるマークフィールドの切出イメージ
の例を示す図である。
【図7】図4におけるフォーマット情報の例を示す図で
ある。
【図8】図4における分類処理結果のOKフォーマット
リストの例を示す図である。
【図9】図4における分類処理結果のNGフォーマット
リストの例を示す図である。
【図10】図4中の確認・修正処理のフローチャートで
ある。
【図11】図10における確認画面の例を示す図であ
る。
【図12】図10における修正画面の例を示す図であ
る。
【符号の説明】
11〜1n 帳票 21 光電変換手段 30 制御部 31 イメージ解析・文字認識手段 32 フォーマット情報作成手段 33 分類手段 34 確認修正手段 35 認識辞書 36 フォーマット生成規則 37 入力操作手段 37a キーボード 37b マウス 38 表示手段 39 フォーマット情報登録手段 S1 イメージ取得処理 S2 イメージ解析・文字認識処理 S3 フォーマット情報作成処理 S4 分類処理 S5 確認・修正処理 S6 登録処理

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 文字の記入された読取フィールドを有す
    る帳票上の該文字を、光学的に読み取る際に用いる参照
    用のフォーマット情報を生成するフォーマット情報生成
    方法において、 フォーマットの異なる複数の前記帳票のイメージをそれ
    ぞれ取得して複数の帳票イメージを出力するイメージ取
    得処理と、 前記各帳票イメージを解析してその帳票イメージ中の線
    分の位置及び/又は文字の位置を検出すると共にその文
    字を認識し、前記帳票イメージ毎の解析・認識結果をそ
    れぞれ出力するイメージ解析・文字認識処理と、 前記帳票イメージ毎の解析・認識結果に基づき、前記読
    取フィールドの位置及び/又はその中の文字の情報を検
    出し、1つの前記帳票イメージについて全ての読取フィ
    ールドが検出できたときにはOKフォーマット情報とし
    て、検出できなかった読取フィールドが1つ以上あると
    きにはNGフォーマット情報として、前記帳票毎に出力
    するフォーマット情報作成処理と、 前記OKフォーマット情報群と前記NGフォーマット情
    報群とを分類して画面に表示する分類処理とを、 実行することを特徴とするフォーマット情報生成方法。
  2. 【請求項2】 請求項1の分類処理後に、 前記OKフォーマット情報群中のOKフォーマット情報
    については、該OKフォーマット情報とそれに対応する
    前記帳票イメージとを前記画面上に重ねて表示して両者
    の一致/不一致を確認させた後に確定フォーマット情報
    とし、 前記NGフォーマット情報群中のNGフォーマット情報
    については、該NGフォーマット情報とそれに対応する
    前記帳票イメージとを前記画面上に重ねて表示してエラ
    ー箇所を修正させ、その修正後のフォーマット情報と前
    記帳票イメージとの一致/不一致を確認させた後に前記
    確定フォーマット情報とする確認・修正処理を、 実行することを特徴とするフォーマット情報生成方法。
  3. 【請求項3】 請求項2記載のフォーマット情報生成方
    法において、 前記NGフォーマット情報群中のNGフォーマット情報
    については、該NGフォーマット情報とそれに対応する
    前記帳票イメージとを前記画面上に重ねて表示すると共
    に、エラー箇所については標準フィールド情報を該画面
    上に表示して該エラー箇所を修正させるようにしたこと
    を特徴とするフォーマット情報生成方法。
JP7147715A 1995-06-14 1995-06-14 フォーマット情報生成方法 Pending JPH096903A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7147715A JPH096903A (ja) 1995-06-14 1995-06-14 フォーマット情報生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7147715A JPH096903A (ja) 1995-06-14 1995-06-14 フォーマット情報生成方法

Publications (1)

Publication Number Publication Date
JPH096903A true JPH096903A (ja) 1997-01-10

Family

ID=15436567

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7147715A Pending JPH096903A (ja) 1995-06-14 1995-06-14 フォーマット情報生成方法

Country Status (1)

Country Link
JP (1) JPH096903A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6445645B1 (ja) * 2017-09-21 2018-12-26 株式会社東芝 帳票情報認識装置および帳票情報認識方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6445645B1 (ja) * 2017-09-21 2018-12-26 株式会社東芝 帳票情報認識装置および帳票情報認識方法
JP2019057115A (ja) * 2017-09-21 2019-04-11 株式会社東芝 帳票情報認識装置および帳票情報認識方法

Similar Documents

Publication Publication Date Title
US11868717B2 (en) Multi-page document recognition in document capture
US11182604B1 (en) Computerized recognition and extraction of tables in digitized documents
KR100570224B1 (ko) 전표정의데이터 작성방법 및 전표처리장치
JPH08293001A (ja) 画像処理装置及び光学的文字認識装置及びそれらの方法
JP2835178B2 (ja) 文書読取装置
JP7444495B2 (ja) Ocrベース文書分析システム及び方法
CN113378839A (zh) 信息处理装置、信息处理方法及计算机可读介质
JP2006277001A (ja) 入力イメージ表示方法および入力イメージ表示プログラム
JP3394694B2 (ja) フォーマット情報登録方法及びocrシステム
JP2009031937A (ja) 帳票画像処理装置及び帳票画像処理プログラム
JPH096903A (ja) フォーマット情報生成方法
JP3732254B2 (ja) フォーマット情報生成方法及びフォーマット情報生成装置
JP2004504650A (ja) フォーム認識及びデジタル化画像処理のための方法及びシステム
JPH08329187A (ja) 文書読取装置
JP2003223610A (ja) 文字認識装置及び文字認識方法
JPH08339419A (ja) フォーマット情報生成方法及びフォーマット情報生成装置
JP3484446B2 (ja) 光学文字認識装置
JP2001101340A (ja) 文字読取装置および文字認識方法
JPH096902A (ja) フォーマット情報生成方法
JP2020013282A (ja) 情報処理装置及びプログラム
JPH09114918A (ja) 光学式文字読取装置
JPH08335247A (ja) フォーマット情報生成方法及びフォーマット情報生成装置
JP2005050094A (ja) 光学的文字読取装置
JPH08339420A (ja) フォーマット情報生成方法及びフォーマット情報生成装置
JP2024033315A (ja) 情報処理装置及び情報処理プログラム

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20010306