JP3163235B2 - 光学式文字読取装置 - Google Patents

光学式文字読取装置

Info

Publication number
JP3163235B2
JP3163235B2 JP21923795A JP21923795A JP3163235B2 JP 3163235 B2 JP3163235 B2 JP 3163235B2 JP 21923795 A JP21923795 A JP 21923795A JP 21923795 A JP21923795 A JP 21923795A JP 3163235 B2 JP3163235 B2 JP 3163235B2
Authority
JP
Japan
Prior art keywords
format
format information
unit
information
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP21923795A
Other languages
English (en)
Other versions
JPH0962781A (ja
Inventor
貴之 加藤
充 瀧口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP21923795A priority Critical patent/JP3163235B2/ja
Publication of JPH0962781A publication Critical patent/JPH0962781A/ja
Application granted granted Critical
Publication of JP3163235B2 publication Critical patent/JP3163235B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字、数字、記
号、マーク等(この明細書では、これらを総称して単に
「文字」という)の記入された帳票上の文字を光学的
に読取る光学式文字読取装置(以下「OCR」とい
)、特に帳票の読取りの際に参照用に用いられる読
取情報であるフォーマット情報(書式情報)を生成する
ためのフォーマット情報生成技術に関するものである。
【0002】
【従来の技術】図2は、従来のOCRの一構成例を示す
要部構成図である。このOCRでは、搬送機構によって
帳票1が図の矢印Aの方向へ搬送される。帳票1が読取
位置Bに達すると、光源2の照射光が帳票1を含む読取
視野C上で反射する。この反射光は、レンズ3を通して
イメージセンサ4の受光面上に結像される。イメージセ
ンサ4で光/電変換された電気信号は、増幅器(以
アンプ」という)5で増幅され、アナログ/ディジ
タル変換部(以下「A/D変換部」という)6でディ
ジタル信号に変換され、多値データからなるイメージデ
ータ(画像データ)としてメモリ7に格納される。メモ
リ7の出力側には文字枠検出部8が接続され、この文字
枠検出部8に2値化部9及びフォーマット記憶部10が
接続されている。フォーマット記憶部10には、文字枠
の有無を示すフォーマット情報が予め登録されている。
文字枠検出部8は、フォーマット記憶部10に登録され
たフォーマット情報を読出し、このフォーマット情報が
文字枠無しを示す場合、メモリ7に格納された多値デー
タからなるイメージデータを読出し、該イメージデータ
をそのまま2値化部9へ送る。フォーマット記憶部10
から読出したフォーマット情報が文字枠有りを示す場
合、文字枠検出部8では、メモリ7に格納された多値デ
ータからなるイメージデータを基に、文字枠の検出を行
い、この検出した文字枠部分について該文字枠内部のデ
ータを2値化部9へ送る。2値化部9では、送られてき
た多値データからなるイメージデータを所定の閾値でス
ライスして黒、白の2値データに変換する。この2値デ
ータは、フォーマット記憶部10に登録されているフォ
ーマット情報と共に、認識部11へ送られ、該認識部1
1で文字認識が行われる。前記フォーマット情報には、
帳票1の大きさ、行数、行中のフィールド(読取領域)
数、フィールド内の文字数、文字の大きさ、字種、枠の
有無、及び枠の型式等が規定されており、帳票1種類に
つき1つのフォーマット情報が必要である。このフォー
マット情報は、予めフォーマット記憶部10に登録され
ていて、オペレータ等による読取り時の指定、あるいは
帳票1上の特定の位置に記入された識別番号(以下「
D番号」という)をOCRが読取ることにより、該フ
ォーマット記憶部10から該当するフォーマット情報が
読出される。
【0003】次に、図3〜図5を参照しつつ、従来のフ
ォーマット情報登録方法について説明する。図3は、従
来の手入力のフォーマット情報登録方法を説明する図で
ある。このフォーマット情報登録方法は、記入済あるい
は未記入の帳票1を用いてフォーマット情報を手入力で
登録する方法である。即ち、帳票寸法測定処理21にお
いて、フォーマット情報登録対象となる帳票1を用い、
オペレータがこの帳票1の寸法等を測定し、該帳票1の
大きさ、行数、行中のフィールド数等といったフォーマ
ット情報作成に必要な情報を得る。次に、フォーマット
情報入力生成処理22において、オペレータは帳票寸法
測定処理21で得た情報を図2のOCR、あるいはこの
OCRの上位装置(これをワークステーションWS
という)に入力し、ディスプレイ(表示装置)の画面
上に表示する。オペレータは、画面上に表示されたフォ
ーマット情報が正しく作成されているか否かを確認し、
誤り(以下「NG」という)ならば修正をした後、正
しければ(以下「OK」という)そのまま、フォーマ
ット記憶部10で扱えるデータ形式に変換する。変換さ
れたフォーマット情報は、フォーマット記憶部10に登
録する。
【0004】図4は、従来の自動でフォーマット情報を
登録する方法を説明する図、及び図5は、図4における
帳票イメージの例を示す図である。図4に示すように、
未印字あるいは未記入の非ドロップアウトカラー(例え
ば、黒)の文字枠を有する帳票1の帳票イメージから、
自動でフォーマット情報を登録する場合、この帳票1を
イメージ入力部31によって光学的に読取り、イメージ
データの形で図示しないイメージメモリに格納する。こ
のイメージメモリに格納された帳票イメージの例が、図
5に示されている。イメージ解析部32では、図5の帳
票イメージを解析し、非ドロップアウトカラーの文字枠
1aの位置を次のようにして検出する。まず、図5の帳
票イメージにおけるx方向の射影41及びy方向の射影
42を求める。x方向の射影41の閾値hx と、y方向
の射影42の閾値hy を設定し、射影41,42が各閾
値hx ,hy をそれぞれ越える箇所(射影42上の位置
s ,xe 、及び射影41上の位置ys ,ye )を矩形
の枠として検出する。これらの検出結果は、フォーマッ
ト情報生成部33へ送られる。フォーマット情報生成部
33では、イメージ解析部32からの各種のデータに基
づき、イメージ解析部32で検出された枠位置よりフォ
ーマット情報、例えば文字枠1aの左上端位置(xs
s )及び右下端位置(xe ,ye )等を生成し、読取
フォーマットの形式に変換してフォーマット情報検証部
34へ送る。なお、イメージ解析部32において枠が検
出できない場合、当然のことながらフォーマット情報の
生成はできない。フォーマット情報検証部34では、生
成されたフォーマット情報が正しいか否かを確認し、N
Gであればフォーマット情報を修正した後、OKであれ
ばそのまま、フォーマット情報をフォーマット記憶部1
0に登録する。
【0005】
【発明が解決しようとする課題】しかしながら、従来の
OCRにおけるフォーマット情報の登録処理では、次の
(i),(ii)のような問題があり、これらを解決する
ことが困難であった。(i) 図3の登録処理では、フ
ォーマット情報の登録作業にオペレータが介入する部分
が多く、測定ミス、入力ミス、確認ミス、及び修正ミス
等が発生しやすい。そのため、検証作業に時間がかかっ
たり、あるいはオペレータによって生成されたフォーマ
ット情報の精度がばらつくという問題がある。(ii)
図4の登録処理では、図5の帳票イメージからフォーマ
ット情報を生成する場合、未印字あるいは未記入の非ド
ロップアウトカラーの文字枠1aを有する帳票1を用意
する必要がある。しかし、印字あるいは記入された帳票
しか入手できない場合が多く、この場合、フォーマット
情報を作成できないという問題がある。仮に、未印字あ
るいは未記入の帳票1が入手できたとしても、これに汚
れ等があったときにはフォーマット情報の生成ができ
ず、再び別の帳票のイメージを入力し直さなければなら
ない。また、文字枠1aがドロップアウトカラーである
帳票や、枠線の無い帳票等では、帳票イメージからフォ
ーマット情報の生成ができないという問題がある。本発
明は、前記従来技術が持っていた課題を解決し、印字済
あるいは記入済の有無を問わず、どのような帳票であっ
ても、これを用いて自動的に、短時間で精度良く、フォ
ーマット情報を生成して登録できるOCRを提供するも
のである。
【0006】
【課題を解決するための手段】前記課題を解決するため
に、第1の発明は、帳票を光学的に読取ってディジタル
なイメージデータを得る帳票読取手段と、フォーマット
情報生成モード時に、前記イメージデータに基づいてフ
ォーマット情報を生成するフォーマット生成手段と、前
記フォーマット情報を登録するフォーマット記憶手段
と、文字読取モード時に、前記フォーマット記憶手段に
登録されたフォーマット情報を参照して前記イメージデ
ータの文字認識を行う文字認識手段とを、備えたOCR
において、前記フォーマット生成手段を次のように構成
している
【0007】即ち、前記フォーマット生成手段は、前記
イメージデータに基づき、フォーマット情報生成対象と
なる同一種の複数の前記帳票の帳票イメージを入力する
入力部と、前記入力部によって入力された複数の帳票イ
メージの解析を行って複数の 解析結果を出力する解析部
と、前記複数の解析結果に基づいて複数のフォーマット
情報を生成する生成部と、選択部と、合成部とを備えて
いる。選択部は、前記生成部で生成された複数のフォー
マット情報を相互に比較してこれらの各フォーマット情
報毎に一致度を数値化し、この一致度の値が所定の閾値
以上であるものを有効フォーマット情報として複数選択
するものである。また、合成部は、前記複数の有効フォ
ーマット情報を合成して1つの登録フォーマット情報を
生成し、この登録フォーマット情報を前記フォーマット
記憶手段に登録させるものである。
【0008】第2の発明は、第1の発明とほぼ同様のO
CRにおいて、前記フォーマット生成手段はフォーマッ
ト候補生成部と、フォーマット決定部とを備えている。
フォーマット候補生成部は、前記イメージデータに基づ
き、フォーマット情報生成対象となる同一種の複数の前
記帳票の帳票イメージを入力し、これらの複数の帳票イ
メージに対し、順に生成した全フォーマット情報候補で
認識チェックを行い、認識できない帳票イメージに対し
ては解析を行ってフォーマット情報を生成し、このフォ
ーマット情報をフォーマット情報候補に追加することに
よって、グループ分けした複数のフォーマット情報候補
を生成するものである。また、フォーマット決定部は、
前記グループ分けした複数のフォーマット情報候補を相
互に比較し、一致度が最も高いものを選択して前記フォ
ーマット記憶手段に登録するための登録フォーマット情
報を決定するものである。
【0009】第3の発明は、第1の発明とほぼ同様のO
CRにおいて、前記フォーマット生成手段を次のように
構成している。 即ち、前記フォーマット生成手段は、前
記イメージデータに基づき、フォーマット情報生成対象
となる同一種の複数の前記帳票の帳票イメージを入力
し、これらの帳票イメージを解析して複数のフォーマッ
ト情報候補を生成するフォーマット候補生成部と、前記
複数のフォーマット情報候補に、前記フォーマット記憶
手段から読出したフォーマット情報を追加して出力する
フォーマット追加部と、前記フォーマット追加部から出
力される複数のフォーマット情報を相互に比較し、 一致
度が最も高いものを選択して前記フォーマット記憶手段
に登録するための登録フォーマット情報を決定するフォ
ーマット決定部とを、備えている。
【0010】第4の発明は、第3の発明において、フォ
ーマット記憶手段から読出したフォーマット情報に対
し、重い重み付けをする構成にしている。
【0011】以上のように、第1の発明によれば、入力
部によって複数の帳票イメージが入力され、この入力さ
れた帳票イメージが解析部によって解析される。この複
数の解析結果に基づき、生成部によって複数のフォーマ
ット情報が生成され、選択部へ送られる。選択部では、
送られてきた複数のフォーマット情報を相互に比較し、
一致度の値が所定の閾値以上であるものを有効フォーマ
ット情報として選択し、合成部へ送る。合成部では、送
られてきた複数の有効フォーマット情報を合成して1つ
の登録フォーマット情報を生成する。
【0012】第2の発明によれば、フォーマット候補生
成部により、複数の帳票イメージに対し、順に生成した
全フォーマット情報候補で認識チェックを行い、認識で
きない帳票イメージに対してはイメージ解析を行ってフ
ォーマット情報を生成し、このフォーマット情報をフォ
ーマット情報候補に追加することによって、グループ分
けした複数のフォーマット情報候補を生成し、フォーマ
ット決定部へ送る。フォーマット決定部では、グループ
分けした複数のフォーマット情報候補を相互に比較し、
一致度が最も高いものを選択して登録フォーマット情報
を決定する。
【0013】第の発明によれば、フォーマット候補生
成部において、同一種の複数の帳票イメージを入力し、
これらの帳票イメージを解析して複数のフォーマット情
報候補を生成し、フォーマット追加部へ送る。フォーマ
ット追加部では、送られてきた複数のフォーマット情報
候補に、フォーマット記憶手段から読出したフォーマッ
ト情報を追加して出力し、フォーマット決定部へ送る。
フォーマット決定部では、フォーマット追加部から送ら
れてきた複数のフォーマット情報を相互に比較し、一致
度が最も高いものを選択して登録フォーマット情報を決
定する。第の発明によれば、フォーマット記憶手段か
ら読出されたフォーマット情報に対し、重い重み付け
され、フォーマット追加部へ送られる。フォーマット決
定部では、例えば、フォーマット候補生成部から送られ
てくるフォーマット情報候補に比べ、重み付けされたフ
ォーマット情報を優先的に選択し、この選択されたフォ
ーマット情報をフォーマット記憶部に登録する。
【0014】
【発明の実施の形態】(第1の参考例) (1) 図及び図のOCRの構成 図は、本発明の第1の参考例を示すOCRの要部の構
成図である。このOCRは、従来の図2のOCRと同様
に、帳票51を光学的に読取る装置であるが、新たにフ
ォーマット生成手段(例えば、フォーマット生成部)6
2が設けられている点等が従来のものと異なっている。
即ち、この第1の参考例のOCRは、帳票51を矢印A
の方向へ読取位置Bまで搬送する図示しない搬送機構
と、該帳票51を照射する光源52と、該帳票51を含
む読取視野C上で反射した反射光をレンズ53を通して
受光して電気信号に変換するイメージセンサ54とを、
備えている。イメージセンサ54の出力側には、該イメ
ージセンサ54の出力電気信号を増幅するアンプ55の
入力側が接続され、該アンプ55の出力側がA/D変換
部56に接続されている。A/D変換部56は、アンプ
55の出力信号をディジタル信号に変換して多値データ
からなるイメージデータを出力するものである。これら
の光源52、レンズ53、イメージセンサ54、アンプ
55、及びA/D変換部56によって帳票読取手段が構
成されている。
【0015】A/D変換部56の出力側には、メモリ5
7の入力側が接続され、該メモリ57の出力側に、文字
枠検出部58の入力側及びフォーマット生成部62の入
力側が接続され、該フォーマット生成部62の出力側
が、フォーマット記憶部60を介して文字枠検出部58
の入力側に接続されている。文字枠検出部58は、フォ
ーマット記憶部60に登録されたフォーマット情報を参
照して文字枠の有無を検出し、文字枠有りのときには、
該文字枠内部のメモリ57の読出データを出力し、文字
枠無しのときには、該メモリ57の読出データをそのま
ま出力する機能を有している。フォーマット生成部62
は、メモリ57に格納されたイメージデータに基づき、
フォーマット情報生成対象となる同一種の複数の帳票イ
メージを入力し、該帳票イメージに基づき1つの登録フ
ォーマット情報を生成し、該登録フォーマット情報をフ
ォーマット記憶部60に登録する機能を有している。こ
のフォーマット生成部62は、フォーマット情報生成対
象となる同一種の複数の帳票イメージを入力し、これら
の帳票イメージを解析して複数のフォーマット情報候補
を生成するフォーマット候補生成部70と、生成された
複数のフォーマット情報候補から1つの登録フォーマッ
ト情報を決定するフォーマット決定部80とで、構成さ
れている。文字枠検出部58の出力側には、2値化部5
9の入力側が接続され、該2値化部59の出力側とフォ
ーマット記憶部60の出力側とが、認識部61に接続さ
れている。2値化部59は、文字枠検出部58から出力
された多値データを所定の閾値でスライスして黒、白の
2値データに変換するものである。認識部61は、2値
化部59から出力される2値データと、フォーマット記
憶部60に登録されているフォーマット情報とを入力
し、帳票イメージ上の文字認識を行うものである。これ
らの文字枠検出部58、2値化部59及び認識部61等
によって文字認識手段が構成されている。
【0016】図は、図中のフォーマット生成部62
を構成するフォーマット候補生成部70及びフォーマッ
ト決定部80の構成図である。フォーマット候補生成部
70は、メモリ57に格納されたイメージデータに基づ
き、フォーマット情報生成対象となる同一種の複数の帳
票イメージを入力する入力部71と、該入力部71から
入力された複数の帳票イメージの解析を行って複数の解
析結果を出力する解析部72と、前記複数の解析結果に
基づいて複数のフォーマット情報候補を生成する生成部
73とで、構成されている。フォーマット決定部80
は、生成部73で生成された複数のフォーマット情報候
補を相互に比較してこれらの各フォーマット情報候補毎
に一致度を数値化し、一致度の値が最も高いものを登録
フォーマット情報として選択する選択生成部81と、選
択された登録フォーマット情報が正しく生成されている
か否かの検証を行う検証部82とで、構成されている。
【0017】(2) 図及び図のOCRの動作 図において、読取対象となる帳票51は、搬送機構に
よって矢印Aの方向へ搬送される。帳票51が読取位置
Bに達すると、光源52からの照射光が、該帳票51を
含む読取視野C上で反射し、この反射光がレンズ53を
通してイメージセンサ54の受光面上に結像され、電気
信号に変換される。イメージセンサ54で変換された電
気信号は、アンプ55で増幅された後、A/D変換部5
6でディジタル信号に変換され、多値データからなるイ
メージデータがメモリ57に格納される。オペレータの
指示等により、文字読取モードまたはフォーマット生成
モードのいずれか1つのモードが設定される。文字読取
モードの場合、文字枠検出部58は、フォーマット記憶
部60に予め登録されている文字枠の有無を示すフォー
マット情報を読出す。このフォーマット情報が文字枠無
しを示す場合、文字枠検出部58は、メモリ57に格納
された多値データからなるイメージデータをそのまま2
値化部59へ送る。フォーマット情報が文字枠有りを示
す場合、文字枠検出部58は、メモリ57に格納された
多値データからなるイメージデータのうち、検出した文
字枠内部のイメージデータを2値化部59へ送る。2値
化部59では、文字枠検出部58から送られてきた多値
データからなるイメージデータを所定の閾値でスライス
して黒、白の2値データに変換する。この2値データ
は、フォーマット記憶部60に登録されているフォーマ
ット情報と共に、認識部61へ送られ、該認識部61で
文字認識が行われる。
【0018】これに対し、フォーマット生成モードの場
合、フォーマット生成部62が動作し、フォーマット候
補生成部70で複数のフォーマット情報候補が生成され
た後、フォーマット決定部80によって1つの登録フォ
ーマット情報が決定され、フォーマット記憶部60に登
録される。即ち、フォーマット生成モードの場合、同一
IDや同一種類の複数の帳票51がイメージセンサ54
で読取られ、複数のイメージデータがメモリ57に格納
されているので、図7の入力部71では、メモリ57に
格納されたイメージデータから、同一IDや同一種類の
複数の帳票イメージを入力する。このとき入力する帳票
イメージに対応する帳票は、記入済のもの、あるいは未
記入のいずれでもよい。解析部72では、入力部71か
ら入力された複数の帳票イメージに対し、それぞれイメ
ージ解析を行って解析結果を生成部73へ出力する。生
成部73は、複数の帳票イメージに対するフォーマット
情報を生成し、複数のフォーマット情報候補を選択生成
部81へ送る。選択生成部81は、同一IDや同一種類
の帳票に適した1つの登録フォーマット情報を決定す
る。その後、検証部82では、選択生成部81で生成さ
れた登録フォーマット情報が正しく作られているか否か
の検証を行い、検証NGのときには修正を行い、検証O
Kのときにはそのまま、この登録フォーマット情報をフ
ォーマット記憶部60に登録する。
【0019】(3) フォーマット情報生成登録の具体
的な動作(図〜図12) 図は、図に示すフォーマット生成部62の動作説明
図である。この図では、同一IDのn枚の帳票51−
1〜51−nの帳票イメージIG1〜IGnより、1つ
の登録すべきフォーマット情報FTを自動生成する例が
示されている。図の入力部71では、メモリ57の読
出データに基づき、n個の帳票イメージIG1〜IGn
の入力処理71−1〜71−nを行う。解析部72で
は、入力されたn個の帳票イメージIG1〜IGnの解
析処理72−1〜72−nを行い、これらの処理結果を
生成部73へ送る。生成部73では、n個の解析結果に
基づき、n個のフォーマット情報FT1〜FTnの生成
処理73−1〜73−nを行い、生成したフォーマット
情報FT1〜FTnをフォーマット決定部80へ送る。
フォーマット決定部80では、n個のフォーマット情報
FT1〜FTnから、登録すべき1つのフォーマット情
報FTを決定し、フォーマット記憶部60へ登録するよ
うになっている。
【0020】図(a)〜(c)は、図における複数
の帳票イメージIG1,IG2,…,IGn、解析によ
る生成フォーマット位置IGF1,IGF2,…,IG
Fn、及び生成されたフォーマット情報FT1,FT
2,…,FTnの例を示す図である。例えば、図
(a)において、図の入力処理71−1で帳票イメー
ジIG1を入力すると、この帳票イメージIG1が解析
処理72−1で解析され、生成フォーマット位置IGF
1が求められる。この生成フォーマット位置IGF1
は、帳票イメージIG1の左上位置をx,y座標位置の
原点(0,0)とし、斜線部の左上座標値を(xl#,y
t#)、右下座標値を(xr#,yd#)とする(但し、#は
帳票イメージ番号)。図の生成処理73−1では、生
成フォーマット位置IGF1に基づき、フォーマット情
報FT1;(xl1,yt1)−(xr1,yd1)を生成す
る。これらの処理を、n枚の帳票イメージIG1〜IG
n全てについて行う。
【0021】図10は、図の帳票イメージIG1の解
析処理72−1、及びフォーマット情報FT1の生成処
理73−1の動作例を示す図である。図の解析処理7
2−1では、入力処理71−1で入力された帳票イメー
ジIG1に対し、x方向の射影91とy方向の射影92
をとる。そして、それぞれの射影91,92の値に対
し、枠線検出用の所定の閾値Swx,Swyと比較し、この
閾値Swx,Swyより大きい箇所を枠線として検出する。
同時に、空白検出用の所定の閾値Ssx,Ssyと比較し、
射影91,92の値が該閾値Ssx,Ssy以下の部分があ
る値以上連続する箇所を検出する。即ち、解析処理72
−1では、x方向の射影91より、枠線の位置yu ,y
bを検出する。y方向の射影92では、枠線が検出でき
なかったので、次に、空白検出よりフィールド位置を特
定する。この空白検出により、空白部G1とG2を検出
する。そして、空白部G1とG2と該G1,G2間の部
分M2とを1つのフィールドとして判断する。これらの
解析結果に基づき、生成処理73−1では、斜線部93
の(xH ,yu )−(xM ,yb )をフォーマット情報
FT1として出力する。
【0022】なお、図10に示すイメージ解析手法は、
本発明の参考例の1つである。従って、本発明では、こ
の図10のイメージ解析手法に限定されず、他のイメー
ジ解析手法を採用することも可能である。図に示すフ
ォーマット決定部80内の選択生成部81では、生成処
理73−1〜73−nで生成したn個のフォーマット情
報FT1〜FTnの中から、登録すべき1つのフォーマ
ット情報FTを選択する。選択方法としては、例えば、
生成処理73−1〜73−nで生成したn個の各フォー
マット情報FT1〜FTnの各々を相互に比較し、一致
度が一番高いものを1つ選択する。図11は、図の選
択生成部81における一致度の求め方の例を示す図であ
る。各フォーマット情報FT1〜FTn同志の各パラメ
ータの差の絶対値が、同一のフォーマット情報とみなす
閾値(例えば、a,b,c,d)より小さければ、一致
しているとみなす。この場合、各パラメータ毎に定めた
ポイントm(例えば、m1,m2,m3,m4)を加算
する
【0023】して、各パラメータ毎のポイントを合計
したものを各フォーマット情報同志の一致度を示すポイ
ントとする。次に、次式に示すように、各フォーマット
情報FT1〜FTn毎に、このフォーマット情報と他の
フォーマット情報との全組合せでの一致度を示すポイン
トを合計して求める。
【0024】
【数1】 その後、これらのフォーマット情報FT1〜FTnの中
でポイントが最大のものをこのIDのフォーマット情報
FTとして選択し、図8の検証部82へ送る。図12
は、図8中の検証部82における処理フローの例を示す
図である。
【0025】図12の検証部82では、ステップS1に
おいて、選択生成部81で選択された登録すべき1つの
フォーマット情報FTに対し、これが正しく作成されて
いるか否かのフォーマット検証処理を行う。このフォー
マット検証処理S1では、例えば、作成されたフォーマ
ット情報FTをディスプレイの画面上に表示すると共
に、読取対象となる帳票51を読取ってこの帳票イメー
ジを該画面上に重ねて表示し、これらが一致しているか
否かをオペレータに画面上でチェックさせれば、該フォ
ーマット情報FTが正しく作成されているか否かを簡単
に検証できる。他の検証方法としては、作成されたフォ
ーマット情報FTと、読取対象となる帳票51を読込ん
だイメージデータとを、OCR内に設けた制御手段によ
って比較し、両者が一致しているか否かを判定すること
により、該フォーマット情報FTが正しく作成されてい
るか否かを検証するようにしてもよい。ステップS1の
フォーマット検証処理の後、ステップS2の判定処理へ
進み、異常がなくて検証OKであれば、作成されたフォ
ーマット情報FTがそのままフォーマット記憶部60に
登録される。ステップS2で異常があり、検証NGであ
れば、ステップS3へ進み、フォーマット情報FTの修
正が行われる。フォーマット情報FTの修正は、例え
ば、該フォーマット情報FTを画面上に表示し、オペレ
ータがその画面を見ながら該フォーマット情報の誤り箇
所を修正する。なお、この修正は、OCRに設けた制御
手段により、自動的に行うようにしてもよい。修正され
たフォーマット情報FTは、フォーマット記憶部60に
登録される。以上のように、この第1の参考例では、次
の(i)〜(iv)のような効果等がある。
【0026】(i) フォーマット情報FTの生成、登
録処理を自動化したので、オペレータが介入する処理を
大幅に減らすことができる。これにより、フォーマット
生成、登録処理時の測定ミス、入力ミス、確認ミス、及
び修正ミス等が少なくなる。 (ii) 複数枚の帳票イメージIG1〜IGnを用いて
登録すべき1つのフォーマット情報FTを生成し、これ
を登録するようにしているので、例えば、複数枚の帳票
51−1〜51−n中の1枚の帳票が汚れていてフォー
マット情報FTの生成ができない場合でも、他の帳票の
帳票イメージからフォーマット情報の生成が行える。こ
れにより、正しいフォーマット情報FTが生成される確
率が高くなり、フォーマット情報修正処理の減少や、フ
ォーマット情報修正処理時間の短縮化が図れる。 (iii) フォーマット候補生成部70内の解析部72に
おいて、枠の検出以外に、空白部分の検出等を行い、フ
ォーマット情報FT1〜FTnを生成するようにしてい
る。そのため、未印字や未記入の帳票51であっても、
あるいは印字、記入された帳票51であっても、フォー
マット情報FTを自動的に生成できる。同様に、文字枠
がドロップアウトカラーである帳票や、枠線のない帳票
等であっても、フォーマット情報FTを自動的に生成で
きる。 (iv) 図12の処理フローは、例えば図13のような
処理フローに変更してもよい。
【0027】図13は、図中のフォーマット決定部8
0の他の処理フローの例を示す図である。この図13
は、図あるいは図のフォーマット決定部80を、フ
ォーマット情報FT1〜FTnの降順選択決定部で構成
している。この降順選択決定部では、フォーマット情報
FT1〜FTnのうちの一致度の高いものから順にフォ
ーマット検証を行い、最初に検証OKとなったフォーマ
ット情報を選択する構成になっている。即ち、図13
処理フローで説明すると、ステップS11の選択生成処
理では、図の選択生成部81とほぼ同様に、複数のフ
ォーマット情報FT1〜FTnのうちの一致度の高いも
のを選択し、ステップS12のフォーマット検証処理へ
進む。ステップS12では、選択されたフォーマット情
報の検証を行い、ステップS13の判定処理へ進む。ス
テップS13では、検証OKか否かの判定を行い、検証
NGの場合、図12のように直ちにステップS3のフォ
ーマット情報修正処理へ進まず、ステップS14へ進
む。ステップS14では、フォーマット情報の一致度を
示すポイントが次に高いフォーマット情報があるか否か
を判定し、次に高いフォーマット情報があるときには、
ステップS12へ戻り、フォーマット検証処理を行う。
次に高いフォーマット情報がないときには、図12と同
様に、ステップS15でフォーマット情報の修正処理を
行った後、フォーマット記憶部60へ登録する。このよ
うな処理内容に変更すれば、ステップS15の修正処理
が必要となる場合が少なくなり、その結果、フォーマッ
ト情報の修正処理時間を短縮できる。
【0028】(第2の参考例)14は、本発明の第2の参考例を示すフォーマット生
成部の構成図であり、第1の参考例の図中の要素と共
通の要素には共通の符号が付されている。このフォーマ
ット生成部は、図と同一のフォーマット候補生成部7
0と、図とは異なる構成のフォーマット決定部80A
とを、備えている。フォーマット決定部80Aは、第1
の選択部である有効フォーマット情報選択部83と、第
2の選択部である登録フォーマット情報選択部84とで
構成されている。有効フォーマット情報選択部83は、
フォーマット候補生成部70内の生成部73で生成され
た複数のフォーマット情報FT1〜FTnを入力し、こ
れらの各フォーマット情報FT1〜FTn毎に一致度を
数値化し、この数値化した値が所定の閾値以上であるも
のを有効フォーマット情報AFT1〜AFTmとして選
択し、これを登録フォーマット情報選択部84へ与える
ものである。登録フォーマット情報選択部84は、有効
フォーマット情報選択部83から与えられた有効フォー
マット情報AFT1〜AFTmそれぞれに対し、認識チ
ェック(即ち、認識テスト)を行い、認識チェック結果
の良いフォーマット情報を登録フォーマット情報FTと
して選択し、フォーマット記憶部60へ登録するもので
ある。
【0029】図15は、図14中の有効フォーマット情
報選択部83の動作説明図である。図14のフォーマッ
ト情報生成部70では、図と同様に、複数の帳票イメ
ージIG1〜IGnからフォーマット情報FT1〜FT
nをそれぞれ生成し、有効フォーマット情報選択部83
へ送る。有効フォーマット情報選択部83では、第1の
参考例と同様に、各フォーマット情報FT1〜FTn毎
に一致度を示すポイントを求める。そして、各フォーマ
ット情報FT1〜FTnの一致度を示すポイントと、所
定の閾値h1とを比較する。各フォーマット情報FT1
〜FTnの一致度を示すポイントが所定の閾値h1より
大きければ、該フォーマット情報を有効フォーマット情
報AFT1〜AFTmとし、登録フォーマット情報選択
部84へ送る。なお、この第2の参考例では、所定の閾
値h1との大小を利用して有効フォーマット情報AFT
1〜AFTmを選ぶようにしているが、本発明はこの手
法に限定されず、他の選択手法を用いてもよい。
【0030】図16は、図14中の登録フォーマット情
報選択部84の処理フローの例を示す図である。登録フ
ォーマット情報選択部84では、ステップS21−1〜
S21−mにおいて、与えられた有効フォーマット情報
AFT1〜AFTmに対し、それぞれ認識テストを行
い、ステップS22の選択処理へ進む。ステップS22
の選択処理では、各認識テスト結果、及び先に求めた各
フォーマット情報の一致度を示すポイント等を使い、全
有効フォーマット情報AFT1〜AFTmの中から登録
すべき1つの登録フォーマット情報FTを選択し、フォ
ーマット記憶部60へ登録する。以上のように、この第
2の参考例では、第1の参考例の効果(i)〜(iii)を
有する他に、さらに次のような効果もある。 (v) 複数の帳票イメージIG1〜IGnから生成し
た全フォーマット情報FT1〜FTnから、一致度を数
値化した値の大きい有効フォーマット情報AFT1〜A
FTmを選択してフォーマット情報を絞込み、この絞込
んだ有効フォーマット情報AFT1〜AFTmから、1
つの登録フォーマット情報FTの選択を行うようにして
いるので、選択された登録フォーマット情報FTの信頼
性がより向上する。しかも、全フォーマット情報FT1
〜FTnから有効フォーマット情報AFT1〜AFTm
に数を絞込んでいるため、登録フォーマット情報FTの
選択処理時間が短くなる。
【0031】(第1の実施形態)は、本発明の第の実施形態を示すフォーマット生
成部の構成図であり、第2の参考例を示す図14中の要
素と共通の要素には共通の符号が付されている。このフ
ォーマット生成部は、図14と同一のフォーマット候補
生成部70と、図14と構成の異なるフォーマット決定
部80Bとを備えている。フォーマット決定部80B
は、図14と同一の有効フォーマット情報選択部83
と、図14とは異なる登録フォーマット合成部85と
で、構成されている。登録フォーマット合成部85は、
有効フォーマット情報選択部83で選択された複数の有
効フォーマット情報AFT1〜AFTmから1つの登録
フォーマット情報FTを合成し、これをフォーマット記
憶部60へ登録するものである。図17は、図中の登
録フォーマット合成部85の処理フローの例を示す図で
ある。登録フォーマット合成部85では、ステップS3
1で与えられた複数の有効フォーマット情報AFT1〜
AFTmに対し、ステップS32において、各有効フォ
ーマット情報AFT1〜AFTmの各パラメータ毎に合
成処理を行い、ステップS33において、最良と思われ
る合成フォーマット情報FTを生成する。
【0032】図18は、図17の合成処理例を示す図で
ある。ステップS31において、各有効フォーマット情
報AFT1〜AFTmにそれぞれパラメータが与えられ
ているので、ステップS32において、各有効フォーマ
ット情報AFT1〜AFTmの各パラメータ毎に合成す
る。合成は、各パラメータ毎に決めた条件(例えば、条
件A〜D)により行う。ステップS33では、合成され
た各パラメータで構成される合成フォーマット情報FT
を生成する。図19は図18のイメージ例を示す図、及
び図20(a),(b)は図19の説明図である。図1
9に示すように、生成したいフォーマット情報(即ち、
本来登録すべきフォーマット情報)に対し、ステップS
31の例では、図20に示すように、〇印の記入等によ
ってそれぞれ少し位置がずれている。そこで、図18の
ステップS32に記載された各条件A〜Dを図19のス
テップS32のように設定すると、図19のステップS
33において、合成フォーマット情報FTとしては生成
したいフォーマット情報と同一のものが得られる。な
お、図18及び図19で説明した各条件A〜Dは、図示
のように最大値と最小値に限定されるものではなく、演
算や範囲指定等の条件設定も可能である。以上のよう
に、この第の実施形態では、第1の参考例の効果
(i)〜(iii)を有する他に、さらに次のような効果も
ある。 (vi) 図19に示すマーク(例えは、〇印)や、印字
ずれ等のある帳票イメージからも、正しいフォーマット
情報を自動的に生成できる。さらに、フォーマット情報
合成の条件A〜Dを変えることにより、様々な種類の帳
票のフォーマット情報の自動生成が可能になる。
【0033】(第2の実施形態) 図21は、本発明の第の実施形態を示すフォーマット
生成部の構成図であり、第1の参考例を示す図中の要
素と共通の要素には共通の符号が付されている。このフ
ォーマット生成部は、図と異なる構成のフォーマット
候補生成部70Aと、図と同一のフォーマット決定部
80とを備えている。フォーマット候補生成部70A
は、グループフォーマット情報生成部74で構成されて
いる。グループフォーマット情報生成部74は、入力し
た複数の帳票イメージIG1〜IGnに対し、順に生成
した全フォーマット情報候補で認識チェックを行い、認
識できない帳票イメージはイメージ解析を行ってフォー
マット情報を生成し、このフォーマット情報を前記フォ
ーマット情報候補に追加することにより、複数の帳票イ
メージIG1〜IGnからグループフォーマット情報を
生成するものである。図22は、図21中のグループフ
ォーマット情報生成部74の処理フローの例を示す図で
ある。グループフォーマット情報生成部74では、ステ
ップS41において、複数の帳票イメージIG1〜IG
nを入力し、ステップS42へ進む。ステップS42で
は、入力した帳票イメージIG1〜IGnから、順に対
象イメージを決め(このステップS42では、イメージ
数でループ動作を行う)、ステップS43へ進む。ス
テップS43では、生成したフォーマット情報jでルー
プ(なお、まだ生成フォーマット情報がない場合はm=
0であり、ステップS48のイメージiの解析処理へ進
)動作を行い、ステップS44へ進む。ステップS
44では、イメージiをフォーマット情報jで読取りを
行い、ステップS45の読取りOKか否かの判定を行
う。読取りが正常に行えた場合はステップS47へ進
み、読取りが正常に行えない場合にはステップS46へ
進む。
【0034】ステップS43〜S46のループで、1つ
でも正常に読取りが行えない場合は、ステップS48で
イメージiの解析を行い、ステップS49でフォーマッ
ト情報iの生成を行った後、ステップS50の生成フォ
ーマット情報の追加処理を行う。ステップS50の生成
フォーマット情報の追加処理では、生成フォーマット情
報数mに+1加算し、ステップS49で生成したフォー
マット情報iをフォーマット情報mとする。そして、ス
テップS51でiによるループ処理、即ちステップS4
2へ戻り、iがnになるまで前記の処理を繰り返す。ま
た、ステップS45の判定処理において、読取りがOK
の場合、ステップS47へ進む。ステップS47におい
て、イメージiのフォーマット情報はフォーマット情報
jとしてリンクし(関連づけ)、ステップS51へ進
む。以上のように、この第の実施形態では、第1の
考例の効果(i)〜(iii)を有する他に、さらに次のよ
うな効果もある。 (vii) 全ての帳票イメージIG1〜IGnに対し、イ
メージ解析及びフォーマット情報の生成を行わないた
め、処理時間の短縮、生成フォーマット情報数の減少に
よる処理の減少、及び処理時間の短縮が行える。
【0035】(第3の実施形態) 図24は、本発明の第の実施形態を示すフォーマット
生成部の構成図であり、第1の参考例を示す図6中の要
素と共通の要素には共通の符号が付されている。このフ
ォーマット生成部62Aは、図のフォーマット生成部
62に代えてOCRに設けられるものである。このフォ
ーマット生成部62Aでは、図のフォーマット候補生
成部70とフォーマット決定部80との間に、新たにフ
ォーマット追加部100が設けられ、該フォーマット決
定部80の出力側がフォーマット記憶部60の入力側に
接続され、該フォーマット記憶部60の出力側が該フォ
ーマット追加部100の入力側に接続されている。フォ
ーマット追加部100は、フォーマット候補生成部70
で生成された複数のフォーマット情報候補と、フォーマ
ット記憶部60に登録された登録フォーマット情報とを
合わせ、これらの合わせた複数のフォーマット情報をフ
ォーマット決定部80へ与えるものである。図25
(a),(b)は、図24中のフォーマット記憶部60
の登録方法を説明する図である。フォーマット記憶部6
0に登録フォーマット情報を登録(記憶)する方法とし
ては、図25(a)に示すように、1登録フォーマット
情報につき1IDを付して登録する方法がある。しか
し、この第の実施形態では、図25(b)に示すよう
に、1登録フォーマット情報につき、複数のIDを登録
する方法を用いる。図26は、図24に示すフォーマッ
ト生成部62Aの動作説明図である。
【0036】図26のフォーマット追加部100は、フ
ォーマット候補生成部70で生成された複数(例えば、
1 個)のフォーマット情報FT1〜FTm1 と、フォ
ーマット記憶部60に登録されている複数(例えば、n
1 個)の全登録フォーマット情報RFT1〜RFTn1
を読出したものとを、加え合わせ、(m1 +n1 )個の
フォーマット情報をフォーマット決定部80へ送る。フ
ォーマット決定部80では、フォーマット追加部100
から送られてきた複数のフォーマット情報のうちの1つ
を選択するが、これが既にフォーマット記憶部60に登
録されている登録フォーマット情報の場合、図25
(b)に示すように、IDデータだけを追加する登録を
行う。以上のように、この第の実施形態では、第1の
参考例の効果(i)〜(iii)を有する他に、さらに次の
ような効果もある。 (ix) フォーマット追加部100では、フォーマット
候補生成部70で生成された複数のフォーマット情報
と、フォーマット記憶部60に登録された登録フォーマ
ット情報とを、合わせてフォーマット決定部80へ送
り、該フォーマット決定部80において登録すべき1つ
の登録フォーマット情報を選択する。この際、フォーマ
ット決定部80では、フォーマット記憶部60に既に登
録されているフォーマット情報を選択した場合、図25
(b)に示すように、フォーマット記憶部60に対して
IDデータを追加するだけの登録を行う。そのため、フ
ォーマット記憶部60の記憶データ量を減らすことがで
き、これによってフォーマット記憶部60の記憶容量を
小さくできる。
【0037】(第4の実施形態) 図27は、本発明の第の実施形態を示すフォーマット
生成部の構成図であり、第の実施形態を示す図24中
の要素と共通の要素には共通の符号が付されている。こ
のフォーマット生成部62Bは、図24に示す第の実
施形態のフォーマット生成部62Aに、新たに重み付け
部110を設けた構成になっている。重み付け部110
は、フォーマット記憶部60の出力側とフォーマット追
加部100の入力側との間に接続され、フォーマット記
憶部60から読出された登録フォーマット情報に重み付
けをし、フォーマット候補生成部70から与えられるフ
ォーマット情報よりも優先的に、フォーマット追加部1
00で選択されるように重い重み付けをするものであ
る。このような重み付け部110を設けると、フォーマ
ット記憶部60から読出された登録フォーマット情報が
重み付け部110で重み付けされるので、フォーマット
追加部100では、フォーマット候補生成部70から与
えられるフォーマット情報よりも重み付け部110から
のフォーマット情報を優先的に選択する。そのため、フ
ォーマット追加部100において、フォーマット記憶部
60に登録されている登録フォーマットが選択されやす
くなり、それがフォーマット決定部80で選択される確
率が高くなる。その結果、フォーマット記憶部60の記
憶容量を、第の実施形態よりもより削減できるという
効果が得られる。なお、この重み付け部110は、フォ
ーマット追加部100内や、あるいはフォーマット決定
部80内に組み込むようにしてもよい。
【0038】
【発明の効果】以上詳細に説明したように、第1の発明
によれば、選択部によって複数の有効フォーマット情報
を選択した後、合成部によってそれらの選択した有効フ
ォーマット情報を合成して1つの登録フォーマット情報
を生成するようにしているので、次のような効果があ
る。 (i) フォーマット情報の登録処理が自動化されてオ
ペレータが介入する処理が少なくなる。そのため、フォ
ーマット登録作業時の測定ミス、入力ミス、確認ミス、
修正ミス等が少なくなる。 (ii) 複数の帳票イメージを用いて登録すべきフォー
マット情報を決定しているので、ある1枚の帳票が汚れ
ていてフォーマット情報の生成ができない場合でも、他
の帳票イメージからフォーマット情報の生成が行える。
そのため、正しいフォーマット情報が生成される確率が
高くなり、フォーマット修正処理が少なくなり、さらに
このフォーマット修正処理時間を短縮できる。 (iii) 解析部において、枠の検出以外に空白部分の検
出等を行い、フォーマット情報を生成することにより、
未印字や未記入であっても、あるいは印字・記入された
帳票であっても、フォーマット情報を自動的に生成でき
る。同様に、文字枠がドロップアウトカラーである帳票
や、枠線のない帳票等であっても、フォーマット情報を
自動的に生成できる。 (iv) 帳票にマークや印字ずれ等があっても、正しい
フォーマット情報を自動的に生成できる。しかも、フォ
ーマット合成の条件を変えることにより、様々な種類の
帳票のフォーマット情報の自動生成が可能となる。
【0039】第2の発明によれば、フォーマット候補生
成部により、生成した全フォーマット情報候補で認識チ
ェックを行い、認識できない帳票イメージに対してイメ
ージ解析を行ってフォーマット情報を生成し、このフォ
ーマット情報をフォーマット情報候補に追加するように
したので、第1の発明の効果(i)〜(iii)を有する上
に、全ての帳票イメージに対してイメージ解析とフォー
マット生成を行わないので、処理時間を短縮でき、さら
に生成フォーマット情報数の減少によって処理量を少な
くできる。
【0040】第3の発明によれば、フォーマット追加部
を設けたので、第1の発明の効果(i)〜(iii)を有す
る上に、生成したフォーマット情報候補と、フォーマッ
ト記憶部に登録された登録フォーマット情報とが、加え
られてフォーマット決定部へ送られ、該フォーマット決
定部によって登録すべきフォーマット情報を決定するよ
うにしているので、既に登録されているフォーマット情
報が選択された場合、IDデータ等をフォーマット記憶
部に登録するだけでよく、その結果、フォーマット記憶
部の記憶容量を減らすことができる。 第4の発明によれ
ば、フォーマット記憶部から読出したフォーマット情報
に対して重い重み付けをするようにしたので、フォーマ
ット候補生成部で生成されるフォーマット情報よりも、
フォーマット記憶部に登録されたフォーマット情報が優
先的にフォーマット決定部で決定される。そのため、フ
ォーマット記憶部に登録されているフォーマット情報が
選択されやすくなり、その結果、フォーマット記憶部の
記憶容量を削減できる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態を示すフォーマット生
成部の構成図である。
【図2】従来のOCRの要部構成部である。
【図3】従来の手入力のフォーマット情報登録方法を説
明する図である。
【図4】従来の自動のフォーマット情報登録方法を説明
する図である。
【図5】帳票イメージの例を示す図である。
【図6】本発明の第1の参考例を示すOCRの要部構成
図である。
【図7】図6中のフォーマット生成部の構成図である。
【図8】図7の動作説明図である。
【図9】図8の帳票イメージ、フォーマット位置、及び
フォーマット情報の例を示す図である。
【図10】図8の帳票イメージIG1の解析処理72−
1及びフォーマット情報FT1の生成処理73−1の動
作例を示す図である。
【図11】図8の選択生成部81における一致度の求め
方の例を示す図である。
【図12】図8中の検証部82の処理フローの例を示す
図である。
【図13】図8中のフォーマット決定部80の他の処理
フローの例を示す図である。
【図14】本発明の第2の参考例を示すフォーマット生
成部の構成図である。
【図15】図14中の有効フォーマット情報選択部83
の動作説明図である。
【図16】図14中の登録フォーマット情報選択部84
の処理フローの例を示す図である。
【図17】図中の登録フォーマット合成部85の処理
フローの例を示す図である。
【図18】図17の合成処理例を示す図である。
【図19】図18のイメージ例を示す図である。
【図20】図19の動作説明図である。
【図21】本発明の第の実施形態を示すフォーマット
生成部の構成図である。
【図22】図21中のグループフォーマット情報生成部
74の処理フローの例を示す図である。
【図23】図22中のリンクの説明図である。
【図24】本発明の第の実施形態を示すフォーマット
生成部の構成図である。
【図25】図24中のフォーマット記憶部60の登録方
法を説明する図である。
【図26】図24の動作説明図である。
【図27】本発明の第の実施形態を示すフォーマット
生成部の構成図である。
【符号の説明】
54 イメージセンサ 57 メモリ 58 文字枠検出部 60 フォーマット記憶部 61 認識部 62,62A,62B フォーマット生成部 70,70A フォーマット候補生成部 71 入力部 72 解析部 73 生成部 74 グループフォーマット情報
生成部 80,80A,80B フォーマット決定部 81 選択生成部 82 検証部 83 有効フォーマット情報選択
部 84 登録フォーマット情報選択
部 85 登録フォーマット合成部 100 フォーマット追加部 110 重み付け部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平5−258098(JP,A) 特開 平2−178780(JP,A) 特開 昭63−149777(JP,A) 特開 平5−114043(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/20

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 帳票を光学的に読取ってディジタルなイ
    メージデータを得る帳票読取手段と、 フォーマット情報生成モード時に、前記イメージデータ
    に基づいてフォーマット情報を生成するフォーマット生
    成手段と、 前記フォーマット情報を登録するフォーマット記憶手段
    と、 文字読取モード時に、前記フォーマット記憶手段に登録
    されたフォーマット情報を参照して前記イメージデータ
    の文字認識を行う文字認識手段とを、備えた光学式文字
    読取装置において、 前記フォーマット生成手段は、 前記イメージデータに基づき、フォーマット情報生成対
    象となる同一種の複数の前記帳票の帳票イメージを入力
    する入力部と、 前記入力部によって入力された複数の帳票イメージの解
    析を行って複数の解析結果を出力する解析部と、 前記複数の解析結果に基づいて複数のフォーマット情報
    を生成する生成部と、 前記生成部で生成された複数のフォーマット情報を相互
    に比較してこれらの各フォーマット情報毎に一致度を数
    値化し、この一致度の値が所定の閾値以上であるものを
    有効フォーマット情報として複数選択する選択部と、 前記複数の有効フォーマット情報を合成して1つの登録
    フォーマット情報を生成し、この登録フォーマット情報
    を前記フォーマット記憶手段に登録させる合成部とを、 備えたことを特徴とする光学式文字読取装置。
  2. 【請求項2】 帳票を光学的に読取ってディジタルなイ
    メージデータを得る帳票読取手段と、 フォーマット情報生成モード時に、前記イメージデータ
    に基づいてフォーマット情報を生成するフォーマット生
    成手段と、 前記フォーマット情報を登録するフォーマット記憶手段
    と、 文字読取モード時に、前記フォーマット記憶手段に登録
    されたフォーマット情報を参照して前記イメージデータ
    の文字認識を行う文字認識手段とを、備えた光学式文字
    読取装置において、 前記フォーマット生成手段は、 前記イメージデータに基づき、フォーマット情報生成対
    象となる同一種の複数の前記帳票の帳票イメージを入力
    し、これらの複数の帳票イメージに対し、順に生成した
    全フォーマット情報候補で認識チェックを行い、認識で
    きない帳票イメージに対しては解析を行ってフォーマッ
    ト情報を生成し、このフォーマット情報をフォーマット
    情報候補に追加することによって、グループ分けした複
    数のフォーマット情報候補を生成するフォーマット候補
    生成部と、 前記グループ分けした複数のフォーマット情報候補を相
    互に比較し、一致度が最も高いものを選択して前記フォ
    ーマット記憶手段に登録するための登録フォーマット情
    報を決定するフォーマット決定部とを、 備えたことを特徴とする光学式文字読取装置。
  3. 【請求項3】 帳票を光学的に読取ってディジタルなイ
    メージデータを得る帳票読取手段と、 フォーマット情報生成モード時に、前記イメージデータ
    に基づいてフォーマット情報を生成するフォーマット生
    成手段と、 前記フォーマット情報を登録するフォーマット記憶手段
    と、 文字読取モード時に、前記フォーマット記憶手段に登録
    されたフォーマット情報を参照して前記イメージデータ
    の文字認識を行う文字認識手段とを、備えた光学式文字
    読取装置において、 前記フォーマット生成手段は、 前記イメージデータに基づき、フォーマット情報生成対
    象となる同一種の複数の前記帳票の帳票イメージを入力
    し、これらの帳票イメージを解析して複数のフォーマッ
    ト情報候補を生成するフォーマット候補生成部と、 前記複数のフォーマット情報候補に、前記フォーマット
    記憶手段から読出したフォーマット情報を追加して出力
    するフォーマット追加部と、 前記フォーマット追加部から出力される複数のフォーマ
    ット情報を相互に比較 し、一致度が最も高いものを選択
    して前記フォーマット記憶手段に登録するための登録フ
    ォーマット情報を決定するフォーマット決定部とを、 備えたことを特徴とする光学式文字読取装置。
  4. 【請求項4】 前記フォーマット記憶手段から読出した
    フォーマット情報に対し、重い重み付けをする構成にし
    たことを特徴とする請求項3記載の光学式文字読取装
    置。
JP21923795A 1995-08-28 1995-08-28 光学式文字読取装置 Expired - Fee Related JP3163235B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP21923795A JP3163235B2 (ja) 1995-08-28 1995-08-28 光学式文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21923795A JP3163235B2 (ja) 1995-08-28 1995-08-28 光学式文字読取装置

Publications (2)

Publication Number Publication Date
JPH0962781A JPH0962781A (ja) 1997-03-07
JP3163235B2 true JP3163235B2 (ja) 2001-05-08

Family

ID=16732368

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21923795A Expired - Fee Related JP3163235B2 (ja) 1995-08-28 1995-08-28 光学式文字読取装置

Country Status (1)

Country Link
JP (1) JP3163235B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6302317B2 (ja) * 2014-03-26 2018-03-28 グローリー株式会社 帳票フォーマット情報登録方法及びシステム並びにプログラム

Also Published As

Publication number Publication date
JPH0962781A (ja) 1997-03-07

Similar Documents

Publication Publication Date Title
JP4911340B2 (ja) 二次元コード検出システムおよび二次元コード検出プログラム
US6754369B1 (en) License plate reading apparatus and method
JP5591578B2 (ja) 文字列認識装置および文字列認識方法
US8724925B2 (en) Misalignment detecting apparatus, misalignment detecting method, and computer program product
JP4375523B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム、印刷物検査装置、印刷物検査方法、印刷物検査プログラム
US20060110009A1 (en) Systems and methods for detecting image quality defects
TW201419169A (zh) 物體識別裝置、物體識別方法及程式產品
JP5148375B2 (ja) 被対象認識装置および被対象認識方法
JP2003337941A (ja) 画像認識装置と画像認識方法とプログラム
JP3163235B2 (ja) 光学式文字読取装置
JP2003109007A (ja) 帳票様式分類装置、帳票様式分類方法、帳票様式分類プログラムおよび画像照合装置
WO1994010654A9 (en) A method and apparatus for verifying a container code
CA2036274A1 (en) Document processor including method and apparatus for identifying and correcting errors
US20050094861A1 (en) Positional synchronization in a multivoting character recognition environment
JPH0944676A (ja) 顔面検出装置
EP0446633A2 (en) Document processor including method and apparatus for identifying and correcting errors
JPH0554196A (ja) ナンバープレート認識装置
JPH08122267A (ja) マーク認識装置およびマーク認識方法
JPS6162983A (ja) 楽譜読取装置
JP3202402B2 (ja) イメージ入力されたバーコードの認識処理方法
CN111161247B (zh) 用于可变码识读字符质量验证的检测方法
JPH11184965A (ja) 帳票識別登録装置
US6738530B1 (en) Method of recognizing character in which correction of inclination of character is carried out and apparatus for carrying out this method
JPH0520459A (ja) パターン認識方法およびその装置
JPH0962789A (ja) 光学式文字読取装置のマーク認識方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010213

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090223

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090223

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100223

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees