JPH08339420A - フォーマット情報生成方法及びフォーマット情報生成装置 - Google Patents

フォーマット情報生成方法及びフォーマット情報生成装置

Info

Publication number
JPH08339420A
JPH08339420A JP7143569A JP14356995A JPH08339420A JP H08339420 A JPH08339420 A JP H08339420A JP 7143569 A JP7143569 A JP 7143569A JP 14356995 A JP14356995 A JP 14356995A JP H08339420 A JPH08339420 A JP H08339420A
Authority
JP
Japan
Prior art keywords
image
format information
information
format
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7143569A
Other languages
English (en)
Inventor
Junichi Otsuki
純一 大槻
Toshiyuki Ono
利幸 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP7143569A priority Critical patent/JPH08339420A/ja
Publication of JPH08339420A publication Critical patent/JPH08339420A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 自動的にフォーマット情報を作成してオペレ
ータの負担を軽減し、さらにフォーマット情報作成の処
理速度の向上と精度の向上を図る。 【構成】 帳票1が低分解能のイメージ取得手段11と
高分解能のイメージ取得手段21とで読み取られる。フ
ォーマット情報作成手段13では、読み取られた低分解
能の帳票イメージ中に含まれる線分の位置又は文字の位
置を解析し、フォーマット生成規則14とマッチングし
て大まかな全体のフォーマット情報COD1を作成す
る。このCOD1中の所定の読取フィールドのイメージ
が、イメージ切出手段23で切り出される。フォーマッ
ト情報作成手段24では、切り出された切出イメージを
解析すると共に文字を認識し、詳細で部分的なフォーマ
ット情報COD2を作成する。これらのフォーマット情
報COD1及びCOD2は融合手段31でマージされ、
登録手段32に登録される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字、数字、記号、マ
ーク等(この明細書では、これらを総称して単に「文
字」という)の記入された読取フィールド(読取領域)
を有する帳票上の文字を光学的に読み取る光学式文字読
取装置(以下、OCRという)において、その読取の際
に参照用に用いられる読取情報であるフォーマット情報
を生成するためのフォーマット情報生成方法とそのフォ
ーマット情報生成装置に関するものである。
【0002】
【従来の技術】従来のOCRでは、イメージスキャナ等
によって一定のフォーマット(書式)の帳票のイメージ
を取り込み、その帳票イメージのイメージデータをイメ
ージメモリ(イメージ記憶装置)に記憶させる。そし
て、帳票の読取フィールドを指定したフォーマット情報
(即ち、帳票の読取位置や文字種等を指定したフォーマ
ット情報)を用い、イメージメモリに記憶されたイメー
ジデータから文字切出手段によって読取フィールドを切
り出し、その切り出された読取フィールド内の文字の特
徴を文字認識手段によって抽出することにより、帳票上
の文字を認識する。即ち、帳票には、そのフォーマット
を識別するために、数字等で表された帳票IDが所定位
置(例えば、右上等)に記入又は印字されている。そこ
で、OCRでは、まず、帳票IDを認識し、その帳票I
Dに対応させて予め用意されたフォーマット情報を参照
し、帳票イメージから読取フィールドを切り出し、その
切り出された読取フィールド内の文字を認識辞書を用い
て認識するようになっている。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
OCRに用いられるフォーマット情報は、オペレータが
手作業によって帳票上の各読取フィールドの位置や大き
さ等を定規等で測定して作成している。作成したフォー
マット情報は、オペレータがパーソナルコンピュータ等
を用いてOCRの記憶装置に記憶(登録)する。そのた
め、帳票の読取フィールド数が多い場合、それらの各々
についての寸法測定に時間がかかったり、測定ミスが発
生するおそれがある。また、帳票IDが同一のままで帳
票の読取フィールドの位置や大きさが頻繁に変更される
場合や、異なる種類の帳票が頻繁に追加される場合等に
おいては、フォーマット情報の内容を変更したり、追加
したりしなければならず、それに伴う作業が煩わしい。
そこで、例えば、イメージスキャナを用い、登録対象と
なる帳票のイメージを全ての読取フィールドについて同
一分解能で取得し、その取得した帳票イメージを基にコ
ンピュータを用いてフォーマット情報を作成することが
考えられる。
【0004】しかし、帳票内に、高精度で読み取ること
が必要な読取フィールド情報と、低精度で読み取っても
よい読取フィールド情報とが存在する場合、分解能の高
い高精度なイメージスキャナで帳票イメージを読み取る
と、低精度の読み取りでもよい読取フィールドに対して
処理データ量が多くなり、処理時間が長くかかると共
に、それらのデータを記憶するために大容量の記憶装置
が必要になる。これに対し、低分解能のイメージスキャ
ナを用いて低精度で帳票イメージを読み取ると、高精度
な読み取りが必要な読取フィールドに対して精度の良い
読取フィールド情報を得ることができない。そのため、
未だ技術的に十分満足のゆくフォーマット情報生成方法
及びその装置を得ることが困難であった。本発明は、前
記従来技術が持っていた課題を解決し、処理速度が速
く、高精度にフォーマット情報を自動的に生成するフォ
ーマット情報生成方法とそのフォーマット情報生成装置
を提供することを目的とする。
【0005】
【課題を解決するための手段】第1の発明は、前記課題
を解決するために、文字の記入された読取フィールドを
有する帳票上の該文字を、OCRによって光学的に読み
取る際に用いる参照用のフォーマット情報を生成するフ
ォーマット情報生成方法において、第1のイメージ取得
処理と、第2のイメージ取得処理と、イメージ解析処理
と、照合検索処理と、イメージ切出処理と、第2のフォ
ーマット情報の作成処理と、融合処理とを、実行するよ
うにしている。ここで、第1のイメージ取得処理では、
前記帳票のイメージを第1の分解能(例えば、低分解
能)で取得して第1の帳票イメージを出力する。第2の
イメージ取得処理では、前記帳票のイメージを、前記第
1の分解能よりも高密度の1種類又は複数種類の第2の
分解能(例えば、高分解能)で取得して1種類又は複数
種類の第2の帳票イメージを出力する。イメージ解析処
理では、前記第1の帳票イメージ中に含まれる線分の位
置及び/又は文字の位置を解析して第1のイメージ解析
結果を出力する。照合検索処理では、前記第1のイメー
ジ解析結果とフォーマット生成規則とを照合(マッチン
グ)し、該フォーマット生成規則に合致(マッチ)する
該第1のイメージ解析結果を読取フィールド毎に検索し
てそれらの読取フィールドの位置を決定し、その読取フ
ィールドの位置情報からなる第1のフォーマット情報を
作成して出力する。イメージ切出処理では、前記第1の
フォーマット情報中の所定の読取フィールドの位置情報
に基づいて、前記1種類又は複数種類の第2の帳票イメ
ージから該読取フィールドのイメージを切り出し、1種
類又は複数種類の切出イメージを出力する。第2のフォ
ーマット情報の作成処理では、前記1種類又は複数種類
の切出イメージ中に含まれる線分の位置及び/又は文字
の位置を解析すると共にその文字を認識し、前記所定の
読取フィールド内に存在する記入欄の位置情報、及び文
字種等の属性情報からなる1種類又は複数種類の第2の
フォーマット情報を作成する。そして、融合処理では、
前記第1のフォーマット情報と前記第2のフォーマット
情報とをひとまとめにして融合(Merge、マージ)
し、前記フォーマット情報を生成する。
【0006】第2の発明では、文字の記入された読取フ
ィールドを有する帳票上の該文字を、OCRを用いて光
学的に読み取る際に用いる参照用のフォーマット情報を
生成するフォーマット情報生成方法において、第1のイ
メージ取得処理と、第2のイメージ取得処理と、イメー
ジ解析処理と、照合検索処理と、第2のフォーマット情
報の作成処理と、融合処理とを、実行するようにしてい
る。ここで、第1のイメージ取得処理では、前記帳票の
イメージを第1の分解能で取得して第1の帳票イメージ
を出力する。第2のイメージ取得処理では、前記帳票中
の所定部分のイメージを、前記第1の分解能よりも高密
度の1種類又は複数種類の第2の分解能で取得して1種
類又は複数種類の第2の帳票イメージを出力する。イメ
ージ解析処理では、前記第1の帳票イメージ中に含まれ
る線分の位置及び/又は文字の位置を解析して第1のイ
メージ解析結果を出力する。照合検索処理では、前記第
1のイメージ解析結果とフォーマット作成規則とをマッ
チングし、該フォーマット生成規則にマッチする該第1
のイメージ解析結果を読取フィールド毎に検索してそれ
らの読取フィールドの位置を決定し、その読取フィール
ドの位置情報からなる第1のフォーマット情報を作成し
て出力する。第2のフォーマット情報の作成処理では、
前記1種類又は複数種類の第2の帳票イメージ中に含ま
れる線分の位置及び/又は文字の位置を解析すると共に
その文字を認識し、前記所定部分内に存在する記入欄の
位置情報、及び文字種等の属性情報からなる1種類又は
複数種類の第2のフォーマット情報を作成する。そし
て、融合処理では、前記第1のフォーマット情報と前記
第2のフォーマット情報とをひとまとめにしてマージ
し、前記フォーマット情報を作成する。
【0007】第3の発明では、文字の記入された読取フ
ィールドを有する帳票上の該文字を、OCRを用いて光
学的に読み取る際に用いる参照用のフォーマット情報を
生成するフォーマット情報生成装置において、前記帳票
のイメージを第1の分解能で取得して第1の帳票イメー
ジを出力する第1のイメージ取得手段と、前記第1の帳
票イメージを第1のイメージデータとして記憶する第1
のイメージ記憶手段と、前記帳票のイメージを、前記第
1の分解能よりも高密度の1種類又は複数種類の第2の
分解能で取得して1種類又は複数種類の第2の帳票イメ
ージを出力する第2のイメージ取得手段と、前記1種類
又は複数種類の第2の帳票イメージを第2のイメージデ
ータとして記憶する第2のイメージ記憶手段と、前記第
1のイメージデータに基づき、前記第1の帳票イメージ
中に含まれる線分の位置及び/又は文字の位置を解析し
て第1のイメージ解析結果を出力するイメージ解析手段
とを、備えている。さらに、前記第1のイメージ解析結
果と予め作成されたフォーマット生成規則とをマッチン
グし、該フォーマット生成規則にマッチする該第1のイ
メージ解析結果を読取フィールド毎に検索してそれらの
読取フィールドの位置を決定し、その読取フィールドの
位置情報からなる第1のフォーマット情報を作成して出
力する照合検索手段と、前記第1のフォーマット情報中
の所定の読取フィールドの位置情報に基づき、前記1種
類又は複数種類の第2のイメージデータを用いて前記第
2の帳票イメージから該読取フィールドのイメージを切
り出し、1種類又は複数種類の切出イメージを出力する
イメージ切出手段と、フォーマット情報作成手段と、融
合手段と、フォーマット情報登録手段とが、設けられて
いる。ここで、フォーマット情報作成手段は、前記1種
類又は複数種類の切出イメージ中に含まれる線分の位置
及び/又は文字の位置を解析すると共に認識辞書を用い
てその文字を認識し、前記所定の読取フィールド内に存
在する記入欄の位置情報、及び文字種等の属性情報から
なる1種類又は複数種類の第2のフォーマット情報を作
成するものである。融合手段は、前記第1のフォーマッ
ト情報と前記第2のフォーマット情報とをひとまとめに
してマージし、前記フォーマット情報を生成するもので
ある。そして、フォーマット情報登録手段は、前記融合
手段で生成されたフォーマット情報を記憶する機能を有
している。
【0008】第4の発明では、文字の記入された読取フ
ィールドを有する帳票上の該文字を、OCRを用いて光
学的に読み取る際に用いる参照用のフォーマット情報を
生成するフォーマット情報生成装置において、前記帳票
のイメージを第1の分解能で取得して第1の帳票イメー
ジを出力する第1のイメージ取得手段と、前記第1の帳
票イメージを第1のイメージデータとして記憶する第1
のイメージ記憶手段と、前記帳票中の所定部分のイメー
ジを、前記第1の分解能よりも高密度の1種類又は複数
種類の第2の分解能で取得して1種類又は複数種類の第
2の帳票イメージを出力する第2のイメージ取得手段
と、前記1種類又は複数種類の第2の帳票イメージを第
2のイメージデータとして記憶する第2のイメージ記憶
手段と、前記第1のイメージデータに基づき、前記第1
の帳票イメージ中に含まれる線分の位置及び/又は文字
の位置を解析して第1のイメージ解析結果を出力するイ
メージ解析手段とを、備えている。さらに、前記第1の
イメージ解析結果と予め作成されたフォーマット生成規
則とをマッチングし、該フォーマット生成規則にマッチ
する該第1のイメージ解析結果を読取フィールド毎に検
索してそれらの読取フィールドの位置を決定し、その読
取フィールドの位置情報からなる第1のフォーマット情
報を作成して出力する照合検索手段と、フォーマット情
報作成手段と、融合手段と、フォーマット情報登録手段
とが、設けられている。ここで、フォーマット情報作成
手段は、前記1種類又は複数種類の第2のイメージデー
タに基づき、前記第2の帳票イメージ中に含まれる線分
の位置及び/又は文字の位置を解析すると共に認識辞書
を用いてその文字を認識し、前記所定部分内に存在する
記入欄の位置情報、及び文字種等の属性情報からなる1
種類又は複数種類の第2のフォーマット情報を作成する
ものである。融合手段は、前記第1のフォーマット情報
と前記第2のフォーマット情報とをひとまとめにしてマ
ージし、前記フォーマット情報を作成するものである。
そして、フォーマット情報登録手段は、前記融合手段で
作成されたフォーマット情報を記憶する機能を有してい
る。
【0009】
【作用】第1の発明によれば、第1のイメージ取得処理
により、帳票のイメージが第1の分解能(例えば、低分
解能)で取得され、さらに第2のイメージ取得処理によ
り、該帳票のイメージが第2の分解能(例えば、高分解
能)で取得される。イメージ解析処理では、第1の帳票
イメージ中に含まれる線分の位置及び/又は文字の位置
が解析され、その第1のイメージ解析結果が照合検索処
理へ送られる。照合検索処理では、第1のイメージ解析
結果に対してフォーマット生成規則が適用され、第1の
帳票イメージ中の各読取フィールドの位置情報からなる
第1のフォーマット情報が作成され、イメージ切出処理
及び融合処理へ送られる。イメージ切出処理では、照合
検索処理で作成されたフォーマット情報中の所定の読取
フィールド情報に基づき、第2のイメージ取得手段で取
得された第2の帳票イメージから該所定の読取フィール
ドのイメージが切り出され、その切出イメージが第2の
フォーマット情報作成処理へ送られる。第2のフォーマ
ット情報作成処理では、切出イメージ中に含まれる線分
の位置及び/又は文字の位置が解析されると共にその文
字が認識され、所定の読取フィールド内に存在する記入
欄の位置情報及び属性情報からなる第2のフォーマット
情報が作成され、融合処理へ送られる。融合処理では、
第1及び第2のフォーマット情報がひとまとめにしてマ
ージされ、入力された帳票に対するフォーマット情報が
作成される。
【0010】第2の発明によれば、第1のイメージ取得
処理により、帳票のイメージが第1の分解能で取得され
て第1の帳票イメージがイメージ解析処理へ送られる。
第2のイメージ取得処理では、前記帳票中の所定部分の
イメージが第2の分解能で取得されて第2の帳票イメー
ジがイメージ切出処理へ送られる。イメージ解析処理で
は、第1の帳票イメージ中に含まれる線分の位置及び/
又は文字の位置が解析されて第1のイメージ解析結果が
照合検索処理へ送られる。照合検索処理では、第1のイ
メージ解析結果とフォーマット生成規則とがマッチング
され、各読取フィールドの位置情報からなる第1のフォ
ーマット情報が作成されて融合処理へ送られる。第2の
フォーマット情報の作成処理では、第2の帳票イメージ
中に含まれる線分の位置及び/又は文字の位置が解析さ
れると共にその文字が認識され、所定部分内に存在する
記入欄の位置情報及び属性情報からなる第2のフォーマ
ット情報が作成されて融合処理へ送られる。融合処理で
は、第1及び第2のフォーマット情報がひとまとめにし
てマージされ、帳票に対するフォーマット情報が作成さ
れる。
【0011】第3の発明によれば、第1のイメージ取得
手段により、第1の分解能で帳票のイメージが取得され
て第1の帳票イメージが出力され、第1のイメージ記憶
手段に記憶される。さらに、第2のイメージ取得手段に
より、帳票のイメージが第2の分解能で取得されて第2
の帳票イメージが出力され、第2のイメージ記憶手段に
記憶される。イメージ解析手段により、第1の帳票イメ
ージ中に含まれる線分の位置及び/又は文字の位置が解
析され、その第1のイメージ解析結果が照合検索手段へ
送られる。第1のイメージ解析結果とフォーマット生成
規則とが照合検索手段でマッチングされ、各読取フィー
ルドの位置情報からなる第1のフォーマット情報が作成
されてイメージ切出手段及び融合手段へ送られる。イメ
ージ切出手段により、第1のフォーマット情報中の所定
の読取フィールドの位置情報に基づき、第2の帳票イメ
ージから該読取フィールドのイメージが切り出され、そ
の切出イメージがフォーマット情報作成手段へ送られ
る。フォーマット情報作成手段により、切出イメージ中
に含まれる線分の位置及び/又は文字の位置が解析され
ると共にその文字が認識され、所定の読取フィールド内
に存在する記入欄の位置情報及び属性情報からなる第2
のフォーマット情報が作成されて融合手段へ送られる。
第1及び第2のフォーマット情報が融合手段によってひ
とまとめにしてマージされ、帳票に対するフォーマット
情報が作成され、フォーマット情報登録手段に記憶され
る。
【0012】第4の発明によれば、第1のイメージ取得
手段により、帳票のイメージが第1の分解能で取得さ
れ、その第1の帳票イメージが第1のイメージ記憶手段
に記憶される。第2のイメージ取得手段により、帳票中
の所定部分のイメージが第2の分解能で取得されて第2
のイメージ記憶手段に記憶される。第1の帳票イメージ
中に含まれる線分の位置及び/又は文字の位置がイメー
ジ解析手段で解析され、その第1のイメージ解析結果が
照合検索手段へ送られる。照合検索手段により、第1の
イメージ解析結果とフォーマット生成規則とがマッチン
グされ、各読取フィールドの位置情報からなる第1のフ
ォーマット情報が作成されて融合手段へ送られる。フォ
ーマット情報作成手段により、イメージ切出手段によっ
て切り出された第2の帳票イメージ中に含まれる線分の
位置及び/又は文字の位置が解析されると共にその文字
が認識され、所定部分内に存在する記入欄の位置情報及
び属性情報からなる第2のフォーマット情報が作成され
て融合手段へ送られる。第1及び第2のフォーマット情
報が融合手段でひとまとめにしてマージされ、帳票に対
するフォーマット情報が作成されてフォーマット情報登
録手段に記憶される。
【0013】
【実施例】本発明の実施例では、フォーマット情報生成
装置によって帳票を読み取り、その読み取った内容から
フォーマット情報を生成する方法を具体的に説明するた
め、まず読取対象となる帳票の例を図2に示す。図2の
帳票1には、そのフォーマットを識別するために帳票I
D=1234が所定位置、例えば右上に記入あるいは印
字されている。帳票IDは、同一種類の帳票の共通の位
置に設けられており、通常、2〜5桁の帳票固有の数字
(図2では4桁の数字)で表現されている。また、帳票
1には、読取対象となる文字が記入された読取フィール
ド(読取項目)が複数設けられている。これらの読取フ
ィールドとして、例えば、上方に請求月フィールドF
1、その下に顧客番号フィールドF2とマーク(氏名)
フィールドF3、さらに右下に合計フィールドF4が設
けられている。本実施例では、この4つの読取フィール
ドF1〜F4を光学的に読み取り、その位置と大きさを
検出し、帳票1に対応するフォーマット情報を作成す
る。図3は、図2の読取フィールドF1〜F4の位置の
表現形式を説明するための図である。図2の各読取フィ
ールドF1〜F4の位置及び大きさは、帳票1の左上を
原点0とするXY座標により、読取項目を囲む矩形の左
上位置p1(x1,y1)、X方向の幅w、及びY方向
の高さhを用いて表すものとする。
【0014】図1は、本発明の実施例を示すフォーマッ
ト情報生成装置の概略の機能ブロック図である。このフ
ォーマット情報生成装置は、図2の帳票1を読み取り、
その読取結果に基づき該帳票1に対応するフォーマット
情報を生成する装置であり、入力された帳票1を読み取
る低分解能(例えば、170dpi)のイメージ取得手
段11と高分解能(例えば、340dpi)のイメージ
取得手段21とを有している。イメージ取得手段11
は、イメージスキャナ等で構成され、入力された帳票1
を光学的に読み取り、その帳票1のイメージ(170d
piの帳票イメージ)I1を取得すると共に、該帳票1
中の帳票IDを認識する機能を有している。イメージ取
得手段21は、イメージスキャナ等で構成され、入力さ
れた帳票1を光学的に読み取り、その帳票1のイメージ
(340dpiの帳票イメージ)I2を取得すると共
に、該帳票1中の帳票IDを認識する機能を有してい
る。イメージ取得手段11の出力側には、イメージ記憶
手段12及びフォーマット情報作成手段13が接続され
ている。イメージ記憶手段12は、イメージ取得手段1
1で読み取られた帳票イメージI1をイメージデータの
形で記憶するメモリである。
【0015】フォーマット情報作成手段13は、イメー
ジ記憶手段12に記憶されたイメージデータに基づいて
帳票1の全体の大まかなフォーマット情報COD1を作
成する機能を有し、イメージ解析手段13a、及び照合
検索手段13b等で構成されている。イメージ解析手段
13aは、イメージ記憶手段12に記憶されたイメージ
データに基づき、その帳票イメージI1中に含まれる線
分の位置又は文字の位置を解析してイメージ解析結果D
13aを出力する機能を有し、その出力側に照合検索手
段13bが接続されている。照合検索手段13bは、イ
メージ解析手段13aで解析されたイメージ解析結果D
13aと、メモリ等に予め記憶されたフォーマット生成
規則14とをマッチングし、該フォーマット生成規則1
4にマッチするイメージ解析結果を各読取フィールドF
1〜F4毎に検索してそれらの読取フィールドF1〜F
4の位置を決定し、帳票1の全体の大まかなフォーマッ
ト情報COD1を出力する機能を有している。
【0016】また、イメージ取得手段21の出力側に
は、イメージ記憶手段22及びイメージ切出手段23が
接続されている。イメージ記憶手段22は、イメージ取
得手段21で読み取られた帳票イメージI2をイメージ
データの形で記憶するメモリである。イメージ切出手段
23は、照合検索手段13bで作成されたフォーマット
情報COD1中の所定の読取フィールド(即ち、より詳
細なフォーマット情報を必要とする読取フィールド)の
位置情報に基づき、帳票イメージI2から該読取フィー
ルドのイメージを切り出し、その切出イメージI3を出
力する機能を有し、その出力側にフォーマット情報作成
手段24が接続されている。フォーマット情報作成手段
24は、切出イメージI3を解析して部分的により詳細
なフォーマット情報COD2を作成する機能を有し、イ
メージ解析手段24a、及び文字認識手段24b等で構
成されている。イメージ解析手段24aは、切出イメー
ジI3中に含まれる全ての線分の位置又は文字の位置を
解析してイメージ解析結果D24aを出力する機能を有
し、その出力側に文字認識手段24bが接続されてい
る。文字認識手段24bは、イメージ解析手段24aで
解析されたイメージ解析結果D24aの文字の位置から
その位置の文字を切り出し、メモリ等に記憶された認識
辞書25を用いて文字を認識し、より詳細なフィールド
情報を必要とする所定の読取フィールド内に存在する記
入枠の位置情報、及び文字種等の属性情報からなる部分
的なフォーマット情報COD2を出力する機能を有して
いる。
【0017】フォーマット情報作成手段13,24の出
力側には、融合手段31が接続され、さらにその融合手
段31の出力側にフォーマット情報登録手段32が接続
されている。融合手段31は、フォーマット情報作成手
段13及び24から出力される2つのフォーマット情報
COD1及びCOD2をひとまとめにしてマージし、帳
票1に対するフォーマット情報CODを生成する機能を
有している。フォーマット情報登録手段32は、生成さ
れたフォーマット情報CODを帳票IDと共に記憶する
ものであり、磁気ドラム、磁気ディスク等の記憶装置で
構成されている。フォーマット情報作成手段13,2
4、イメージ切出手段23、及び融合手段31等は、1
つ又は複数のパーソナルコンピュータ等で構成されてい
る。そして、その周辺装置として入力操作手段41、及
び表示手段42等が設けられている。入力操作手段41
は、キーボード及びマウス等で構成され、パーソナルコ
ンピュータ等に対してデータの入力や作業内容の指示等
を行う機能を有している。表示手段42は、CRTや液
晶等のディスプレイで構成され、パーソナルコンピュー
タ等の出力データ等を画面上に表示する機能を有してい
る。
【0018】図4は、以上のようなフォーマット情報生
成装置を用いた、本実施例のフォーマット情報生成方法
におけるフォーマット情報生成処理のフローチャートで
ある。この図4のフォーマット情報生成処理では、処理
が開始されると、低分解能のイメージ取得処理S1にお
いて、帳票1が例えば170dpiの分解能を持ったイ
メージ取得手段11で取得され、その低密度の帳票イメ
ージI1がイメージデータの形でイメージ記憶手段12
に記憶される。同時に、高分解能のイメージ取得処理S
11において、前記帳票1が例えば340dpiの分解
能を持ったイメージ取得手段21で取得され、その高密
度の帳票イメージI2がイメージデータの形でイメージ
記憶手段22に記憶される。イメージ解析処理S2及び
照合検索処理S3からなる第1のフォーマット情報生成
処理において、まずイメージ解析処理S2では、イメー
ジ記憶手段12に記憶された帳票イメージI1が読み出
され、その帳票イメージI1中に含まれる線分の位置又
は文字の位置がイメージ解析手段13aで解析され、そ
のイメージ解析結果D13aが照合検索処理S3へ送ら
れる。照合検索処理S3において、照合検索手段13b
では、イメージ解析結果D13aと予め作成されたフォ
ーマット生成規則14とをマッチングし、該フォーマッ
ト生成規則14にマッチする該イメージ解析結果D13
aを各読取フィールドF1〜F4毎に検索してそれらの
読取フィールドF1〜F4の位置を決定し、帳票1の全
体の大まかなフォーマット情報COD1を作成した後、
イメージ切出処理S12へ進む。
【0019】例えば、高密度の帳票イメージI2により
フォーマット情報生成を行う読取フィールドとして、図
示せぬ指定手段により予めマークフィールドF3が指定
されているとする。イメージ切出処理S12において、
イメージ切出手段23では、全体の大まかなフォーマッ
ト情報COD1中の、図示せぬ指定手段により予め指定
されたマークフィールドF3の位置情報に基づき、イメ
ージ記憶手段22に記憶された帳票イメージI2から、
マークフィールドイメージを切り出し、その切出イメー
ジI3を、イメージ解析処理S13及び文字認識処理S
14からなる第2のフォーマット情報作成処理へ送る。
第2のフォーマット情報作成処理におけるイメージ解析
処理S13において、イメージ解析手段24aでは、切
出イメージI3中に含まれる全ての線分の位置又は文字
の位置を解析し、そのイメージ解析結果D24aを文字
認識処理S14へ送る。文字認識処理S14において、
文字認識手段24bでは、認識辞書25を用いてイメー
ジ解析結果D24aから文字を認識し、マークフィール
ドF3内の男女欄位置、年号欄位置、生年欄位置、及び
文字種等の部分的なフォーマット情報COD2を作成し
た後、融合処理S15へ進む。融合処理S15におい
て、融合手段31では、フォーマット情報作成手段1
3,24から出力されたフォーマット情報COD1とC
OD2をひとまとめにしてマージし、帳票1に対するフ
ォーマット情報CODを出力する。その後、フォーマッ
ト情報の確認・修正処理S16において、フォーマット
情報CODが正しく作られているか否かの確認処理が行
われた後、登録処理S17でフォーマット情報登録手段
32に登録される。
【0020】次に、図5〜図8を参照しつつ、前記の
(1)イメージ取得処理S1,S11、(2)第1のフ
ォーマット情報作成処理S2,S3、(3)イメージ切
出処理S12、(4)第2のフォーマット情報作成処理
S13,S14、(5)融合処理S15、及び(6)フ
ォーマット情報の確認・修正・登録処理S16,S17
の具体例を説明する。 (1) イメージ取得処理S1,S11 入力操作手段41からの指令によってフォーマット情報
生成処理が開始されると、イメージ取得処理S1におい
て、低分解能(例えば、170dpi)のイメージ取得
手段11では、図2のような帳票1の帳票イメージI1
を光電変換し(例えば、ビット単位に白紙の部分は
“0”に、線分(罫線)や文字の部分は“1”に変換
し)、イメージデータとしてイメージ記憶手段12に記
憶させる。この処理S1では、図2の帳票1の右上に記
載された帳票ID=1234の認識も行われる。
【0021】図5は、図4のイメージ取得処理S1で取
得された帳票イメージI1の例を示す図である。この帳
票イメージI1は、例えば、その左上を原点(0,0)
とするXY座標によって表されている。X軸上の数字0
〜24、及びY軸上の数字0〜28は、説明の便宜上付
したものである。また、請求月フィールドF1を表す矩
形の破線は、説明の便宜上付したものであり、帳票イメ
ージI1上には現れない。例えば、読取対象となる4つ
の読取フィールドF1〜F4が予め決められていると仮
定する。各矩形の読取フィールドF1〜F4の4隅に
は、説明の便宜上座標位置p(x,y)が付されている
が、これらは帳票イメージI1上に現れない。このよう
なXY座標で表される帳票イメージI1のイメージデー
タが、イメージ記憶手段12に記憶される。低分解能の
イメージ取得処理S1と並行して、高分解能(例えば、
340dpi)のイメージ取得処理S11において、イ
メージ取得手段21では、図2の帳票1の帳票イメージ
I2を光電変換し、高密度のイメージデータとしてイメ
ージ記憶手段22に記憶させる。この処理S11におい
ても、図2の帳票1の右上に記載された帳票ID=12
34の認識が行われる。
【0022】(2) 第1のフォーマット情報作成処理
S2,S3 イメージ解析処理S2において、イメージ解析手段13
aでは、イメージ記憶手段12に記憶されたイメージデ
ータを読み出し、投影法等によって帳票イメージI1中
に含まれる全ての線分の位置又は文字の位置を検出(解
析)し、そのイメージ解析結果D13aを照合検索手段
13bへ送る。即ち、イメージ解析処理S2では、図5
の帳票イメージI1に対し、X軸方向の投影処理によっ
て該X軸に平行な線分を検出し、さらに、Y軸方向の投
影処理によって該Y軸に平行な線分を検出する。検出さ
れたX軸に平行な線分とY軸に平行な線分とから、それ
らの交点の座標を求めることができる。例えば、図5中
の顧客番号フィールドF2は、x=17のY軸方向の線
分と、x=23のY軸方向の線分と、y=4のX軸方向
の線分と、y=5のX軸方向の線分とによって囲まれた
矩形領域となる。この顧客番号フィールドF2のフィー
ルド情報は、左上の始点の座標位置がp(17,4)、
及び右下の終点の座標位置がp(23,5)であるの
で、図3に示すように、始点の座標位置p(17,
4)、X方向の幅w=6、及びY方向の高さh=1の座
標位置によって表される。請求月フィールドF1のよう
な矩形の枠で囲まれていない文字ブロックの位置を検出
するには、X軸方向の投影結果とY軸方向の投影結果と
を比較することにより、「年」と「月分」との間の
「5」を囲む枠の位置を検出できる。
【0023】次に、照合検索処理S3において、照合検
索手段13bでは、イメージ解析手段13aから出力さ
れたイメージ解析結果D13aに基づき、例えば、本願
出願人が先に出願した特願平7−142122号の明細
書及び図面に記載されているように、フォーマット生成
規則14を適用してフォーマット情報COD1を作成す
る。即ち、フォーマット生成規則14では、読取対象と
なる帳票1の読取フィールド数、読取フィールド名、及
び各読取フィールドF1〜F4の特徴等が規定されてい
る。各読取フィールドF1〜F4の特徴としては、フィ
ールド枠や文字ブロックの大きさ(寸法)、存在位置、
及び検索方法等といった各読取フィールドF1〜F4に
適合する内容が規定されている。そこで、照合検索手段
13bでは、イメージ解析結果D13aの線分又は文字
と、フォーマット生成規則14とをマッチングし、該フ
ォーマット生成規則14にマッチする線分又は文字を検
索し、各読取フィールドF1〜F4のXY座標軸上の位
置を順次決定し、その位置情報からなるフォーマット情
報COD1を作成する。この帳票全体のフォーマット情
報COD1の例を図6に示す。図6のフォーマット情報
COD1では、読取対象となる帳票1の帳票ID=12
34、読取フィールド数=4、及び各読取フィールドF
1〜F4のフィールド位置及び属性等の情報が含まれて
いる。
【0024】(3) イメージ切出処理S12 イメージ切出処理S12において、イメージ切出手段2
3では、照合検索手段13bで作成されたフォーマット
情報COD1中の例えばマークフィールドF3情報に基
づき、イメージ記憶手段22に記憶された高密度の帳票
イメージI2から、マークフィールドイメージを切り出
す。この切出イメージI3の例を図7に示す。実際のイ
メージ切出処理では、切出誤差等を考慮し、マークフィ
ールドF3の周囲数mm(例えば、3mm)を含めて切り出
すが、以下の説明を簡単にするために、図7ではマーク
フィールドF3の外枠いっぱいに切り出された例を示
す。図7に示すように、マークフィールドF3の切出イ
メージI3内には、男女欄F3−1、年号欄F3−2、
及び生年欄F3−3が含まれている。XY座標におい
て、内枠原点(x0,y0)を基準にして男女欄F3−
1の左上端位置は(0,g1)、X方向の幅はw1、Y
方向の高さはh1である。年号欄F3−2の左上端位置
は(f2,g2)、幅はw2、及び高さはh2である。
生年欄F3−3の左上端位置は(f3,g3)、X方向
の幅はw3、及びY方向の高さはh3である。
【0025】(4) 第2のフォーマット情報作成処理
S13,S14 イメージ解析処理S13において、イメージ解析手段2
4aでは、マークフィールドF3の切出イメージI3を
解析する。さらに、文字認識処理S14において、文字
認識手段24bでは、認識辞書25を参照して文字を認
識する。そして、マークフィールドF3内の男女欄F3
−1の位置、年号欄F3−2の位置、生年欄F3−3の
位置、及び各欄の文字種等のフォーマット情報COD2
を作成する。このマークフィールドF3のフォーマット
情報COD2の例を図8に示す。 (5) 融合処理S15 融合処理S15において、融合手段31では、図6に示
す帳票1の全体のフォーマット情報COD1と、図8に
示すマークフィールドF3のフォーマット情報COD2
とをひとまとめにしてマージし、当該帳票ID=123
4のフォーマット情報CODを作成する。 (6) フォーマット情報の確認・修正・登録処理S1
6,S17 確認・修正処理S16では、表示手段42の画面に、帳
票イメージI1,I2とフォーマット情報CODとを重
ねて表示し、オペレータの入力操作手段41のマウス操
作等と目視確認とにより、作成されたフォーマット情報
CODの確認や、エラー箇所の修正作業を行った後、登
録処理S17において該フォーマット情報CODの登録
手段32への登録を行う。
【0026】以上のように、本実施例では次のような利
点(a),(b)がある。 (a) 図1のフォーマット情報生成装置を用いて自動
的にフォーマット情報を作成できるので、オペレータの
負担を軽減でき、さらに、高精度なフォーマット情報C
ODが得られると共に、その作成作業効率を著しく向上
できる。 (b) 読取対象となる帳票1のイメージを低分解能の
イメージ取得手段11で取得すると共に、該帳票1のイ
メージを高分解能のイメージ取得手段21で取得し、そ
の低分解能の帳票イメージI1によって大まかな全体の
フォーマット情報COD1を作成し、そのフォーマット
情報COD1に基づき、高分解能の帳票イメージI2か
ら所定の読取フィールド箇所を切り出し、その切出イメ
ージI3から詳細なフォーマット情報COD2を作成し
ている。そのため、低分解能でもよい、大まかな全体の
フォーマット情報COD1を少ないデータ処理量で高速
に作成することができ、しかも、高分解能が必要なフォ
ーマット情報COD2については精度の高いフォーマッ
ト情報が得られる。
【0027】なお、本発明は図示の実施例に限定され
ず、種々の変形が可能である。その変形例としては、例
えば次の(i)〜(vi)のようなものがある。 (i) 図4のイメージ切出処理S12において、高密
度の帳票イメージI2によりフォーマット情報生成を行
う読取フィールドを、図示せぬ指定手段により決定する
ようにしたが、これに限らず、対象となる読取フィール
ドを特定する情報をフォーマット生成規則14内に記憶
しておき、マッチング処理において、対象となる読取フ
ィールドを特定する情報を得るようにしてもよい。 (ii) 図1のイメージ切出手段23及び図4のイメー
ジ切出処理S12を省略してもよい。この場合、図4の
イメージ取得処理S11において、イメージ取得手段2
1では、帳票1中の所定部分のイメージを高分解能で取
得し、その帳票イメージI2をイメージ解析手段24a
によってイメージ解析処理S13を行えばよい。このよ
うにすれば、イメージ切出手段23及びイメージ切出処
理S12を省略できるので、フォーマット情報生成処理
を簡略化できると共に、フォーマット情報生成装置の構
成を簡単化できる。 (iii) 図4のフローチャートでは、確認・修正処理S
16を行っているが、この処理S16を省略し、融合処
理S15で作成されたフォーマット情報CODを、その
まま登録処理S17で登録手段32に登録するようにし
てもよい。これにより、フォーマット情報生成処理をよ
り簡略化できる。
【0028】(iv) 図4のフローチャートにおいて、
帳票1、フォーマット生成規則14、及び作成されたフ
ォーマット情報COD1,COD2,CODの各内容
は、図示のものに限定されず、種々の種類の帳票に適合
するように任意に変更可能である。 (v) 図1のフォーマット情報生成装置において、3
つの記憶手段12,22,32を1つ又は2つの記憶手
段で構成してもよい。 (vi) 図1では、低分解能と高分解能の2つのイメー
ジ取得手段11,21によって帳票1のイメージを取得
するようにしたが、例えば、低分解能のイメージ取得手
段11よりも高分解能のイメージ取得手段21を2つ以
上設け、それら2つ以上のイメージ取得手段21,…で
取得した、分解能の異なる2つ以上の帳票イメージか
ら、部分的に詳細なフォーマット情報COD2,…を作
成するようにしてもよい。このようにすれば、読取項目
の多い帳票1に対しても柔軟に対応できる。また、図1
のフォーマット情報生成装置に、機能向上のための他の
機能ブロックを追加する等、帳票1の種類と内容に応じ
て装置構成を任意に変更可能である。
【0029】
【発明の効果】以上詳細に説明したように、第1及び第
3の発明によれば、分解能の異なる第1,第2のイメー
ジ取得処理、イメージ解析処理、照合検索処理、イメー
ジ切出処理、第2のフォーマット情報の作成処理、及び
融合処理を実行してフォーマット情報を生成するように
したので、入力された帳票からフォーマット生成規則を
用いて自動的にフォーマット情報を作成できる。そのた
め、オペレータの負担を軽減できるばかりか、フォーマ
ットの作成精度や作成作業効率を著しく向上できる。さ
らに、帳票のイメージを、分解能の異なる第1及び第2
のイメージ取得処理で取得し、大まかな全体のフォーマ
ット情報を作成し、そのフォーマット情報中の所定の読
取フィールド情報に基づき、高分解能の帳票イメージか
ら該所定の読取フィールドのイメージを切り出し、その
切出イメージから詳細で部分的なフォーマット情報を作
成するようにしたので、低分解能でもよい、大まかな全
体のフォーマット情報のデータ処理量を少なくして処理
速度を向上でき、しかも、高分解能が必要なフォーマッ
ト情報については、フォーマット情報作成精度を向上で
きる。第2及び第4の発明によれば、第2のイメージ取
得処理において帳票中の所定部分のイメージを高分解能
で取得するようにしたので、第1及び第3の発明のイメ
ージ切出処理及びイメージ切出手段を省略できる。その
ため、第1及び第3の発明とほぼ同様の効果が得られる
上に、それらの発明に比べ、処理の簡単化によって処理
速度をより向上できる。
【図面の簡単な説明】
【図1】本発明の実施例を示すフォーマット情報生成装
置の概略の機能ブロック図である。
【図2】図1のフォーマット情報生成装置に入力される
帳票の例を示す図である。
【図3】図2のフィールド位置の表現形式を説明する図
である。
【図4】図1のフォーマット情報生成装置を用いたフォ
ーマット情報生成方法を説明するためのフォーマット情
報生成処理のフローチャートである。
【図5】図4における帳票イメージの例を示す図であ
る。
【図6】図4における帳票全体のフォーマット情報の例
を示す図である。
【図7】図4におけるマークフィールドの切出イメージ
の例を示す図である。
【図8】図4におけるマークフィールドのフォーマット
情報の例を示す図である。
【符号の説明】
1 帳票 11,21 イメージ取得手段 12,22 イメージ記憶手段 13,24 フォーマット情報作成手段 13a,24a イメージ解析手段 13b 照合検索手段 14 フォーマット生成規則 23 イメージ切出手段 24b 文字認識手段 25 認識辞書 31 融合手段 32 登録手段 S1,S11 イメージ取得処理 S2,S13 イメージ解析処理 S3 照合検索処理 S12 イメージ切出処理 S14 文字認識処理 S15 融合処理 S16 確認・修正処理 S17 登録処理

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 文字の記入された読取フィールドを有す
    る帳票上の該文字を、光学的に読み取る際に用いる参照
    用のフォーマット情報を生成するフォーマット情報生成
    方法において、 前記帳票のイメージを第1の分解能で取得して第1の帳
    票イメージを出力する第1のイメージ取得処理と、 前記帳票のイメージを、前記第1の分解能よりも高密度
    の1種類又は複数種類の第2の分解能で取得して1種類
    又は複数種類の第2の帳票イメージを出力する第2のイ
    メージ取得処理と、 前記第1の帳票イメージ中に含まれる線分の位置及び/
    又は文字の位置を解析して第1のイメージ解析結果を出
    力するイメージ解析処理と、 前記第1のイメージ解析結果とフォーマット生成規則と
    を照合し、該フォーマット生成規則に合致する該第1の
    イメージ解析結果を読取フィールド毎に検索してそれら
    の読取フィールドの位置を決定し、その読取フィールド
    の位置情報からなる第1のフォーマット情報を作成して
    出力する照合検索処理と、 前記第1のフォーマット情報中の所定の読取フィールド
    の位置情報に基づいて、前記1種類又は複数種類の第2
    の帳票イメージから該読取フィールドのイメージを切り
    出し、1種類又は複数種類の切出イメージを出力するイ
    メージ切出処理と、 前記1種類又は複数種類の切出イメージ中に含まれる線
    分の位置及び/又は文字の位置を解析すると共にその文
    字を認識し、前記所定の読取フィールド内に存在する記
    入欄の位置情報及び属性情報からなる1種類又は複数種
    類の第2のフォーマット情報を作成する第2のフォーマ
    ット情報の作成処理と、 前記第1のフォーマット情報と前記第2のフォーマット
    情報とをひとまとめにして融合し、前記フォーマット情
    報を生成する融合処理とを、 実行することを特徴とするフォーマット情報生成方法。
  2. 【請求項2】 文字の記入された読取フィールドを有す
    る帳票上の該文字を、光学的に読み取る際に用いる参照
    用のフォーマット情報を生成するフォーマット情報生成
    方法において、 前記帳票のイメージを第1の分解能で取得して第1の帳
    票イメージを出力する第1のイメージ取得処理と、 前記帳票中の所定部分のイメージを、前記第1の分解能
    よりも高密度の1種類又は複数種類の第2の分解能で取
    得して1種類又は複数種類の第2の帳票イメージを出力
    する第2のイメージ取得処理と、 前記第1の帳票イメージ中に含まれる線分の位置及び/
    又は文字の位置を解析して第1のイメージ解析結果を出
    力するイメージ解析処理と、 前記第1のイメージ解析結果とフォーマット生成規則と
    を照合し、該フォーマット生成規則に合致する該第1の
    イメージ解析結果を読取フィールド毎に検索してそれら
    の読取フィールドの位置を決定し、その読取フィールド
    の位置情報からなる第1のフォーマット情報を作成して
    出力する照合検索処理と、 前記1種類又は複数種類の第2の帳票イメージ中に含ま
    れる線分の位置及び/又は文字の位置を解析すると共に
    その文字を認識し、前記所定部分内に存在する記入欄の
    位置情報及び属性情報からなる1種類又は複数種類の第
    2のフォーマット情報を作成する第2のフォーマット情
    報の作成処理と、 前記第1のフォーマット情報と前記第2のフォーマット
    情報とをひとまとめにして融合し、前記フォーマット情
    報を生成する融合処理とを、 実行することを特徴とするフォーマット情報生成方法。
  3. 【請求項3】 文字の記入された読取フィールドを有す
    る帳票上の該文字を、光学的に読み取る際に用いる参照
    用のフォーマット情報を生成するフォーマット情報生成
    装置において、 前記帳票のイメージを第1の分解能で取得して第1の帳
    票イメージを出力する第1のイメージ取得手段と、 前記第1の帳票イメージを第1のイメージデータとして
    記憶する第1のイメージ記憶手段と、 前記帳票のイメージを、前記第1の分解能よりも高密度
    の1種類又は複数種類の第2の分解能で取得して1種類
    又は複数種類の第2の帳票イメージを出力する第2のイ
    メージ取得手段と、 前記1種類又は複数種類の第2の帳票イメージを第2の
    イメージデータとして記憶する第2のイメージ記憶手段
    と、 前記第1のイメージデータに基づき、前記第1の帳票イ
    メージ中に含まれる線分の位置及び/又は文字の位置を
    解析して第1のイメージ解析結果を出力するイメージ解
    析手段と、 前記第1のイメージ解析結果と予め作成されたフォーマ
    ット生成規則とを照合し、該フォーマット生成規則に合
    致する該第1のイメージ解析結果を読取フィールド毎に
    検索してそれらの読取フィールドの位置を決定し、その
    読取フィールドの位置情報からなる第1のフォーマット
    情報を作成して出力する照合検索手段と、 前記第1のフォーマット情報中の所定の読取フィールド
    の位置情報に基づき、前記1種類又は複数種類の第2の
    イメージデータを用いて前記第2の帳票イメージから該
    読取フィールドのイメージを切り出し、1種類又は複数
    種類の切出イメージを出力するイメージ切出手段と、 前記1種類又は複数種類の切出イメージ中に含まれる線
    分の位置及び/又は文字の位置を解析すると共に認識辞
    書を用いてその文字を認識し、前記所定の読取フィール
    ド内に存在する記入欄の位置情報及び属性情報からなる
    1種類又は複数種類の第2のフォーマット情報を作成す
    るフォーマット情報作成手段と、 前記第1のフォーマット情報と前記第2のフォーマット
    情報とをひとまとめにして融合し、前記フォーマット情
    報を生成する融合手段と、 前記融合手段で生成されたフォーマット情報を記憶する
    フォーマット情報登録手段とを、 備えたことを特徴とするフォーマット情報生成装置。
  4. 【請求項4】 文字の記入された読取フィールドを有す
    る帳票上の該文字を、光学的に読み取る際に用いる参照
    用のフォーマット情報を生成するフォーマット情報生成
    装置において、 前記帳票のイメージを第1の分解能で取得して第1の帳
    票イメージを出力する第1のイメージ取得手段と、 前記第1の帳票イメージを第1のイメージデータとして
    記憶する第1のイメージ記憶手段と、 前記帳票中の所定部分のイメージを、前記第1の分解能
    よりも高密度の1種類又は複数種類の第2の分解能で取
    得して1種類又は複数種類の第2の帳票イメージを出力
    する第2のイメージ取得手段と、 前記1種類又は複数種類の第2の帳票イメージを第2の
    イメージデータとして記憶する第2のイメージ記憶手段
    と、 前記第1のイメージデータに基づき、前記第1の帳票イ
    メージ中に含まれる線分の位置及び/又は文字の位置を
    解析して第1のイメージ解析結果を出力するイメージ解
    析手段と、 前記第1のイメージ解析結果と予め作成されたフォーマ
    ット生成規則とを照合し、該フォーマット生成規則に合
    致する該第1のイメージ解析結果を読取フィールド毎に
    検索してそれらの読取フィールドの位置を決定し、その
    読取フィールドの位置情報からなる第1のフォーマット
    情報を作成して出力する照合検索手段と、 前記1種類又は複数種類の第2のイメージデータに基づ
    き、前記第2の帳票イメージ中に含まれる線分の位置及
    び/又は文字の位置を解析すると共に認識辞書を用いて
    その文字を認識し、前記所定部分内に存在する記入欄の
    位置情報及び属性情報からなる1種類又は複数種類の第
    2のフォーマット情報を作成するフォーマット情報作成
    手段と、 前記第1のフォーマット情報と前記第2のフォーマット
    情報とをひとまとめにして融合し、前記フォーマット情
    報を生成する融合手段と、 前記融合手段で生成されたフォーマット情報を記憶する
    フォーマット情報登録手段とを、 備えたことを特徴とするフォーマット情報生成装置。
JP7143569A 1995-06-09 1995-06-09 フォーマット情報生成方法及びフォーマット情報生成装置 Pending JPH08339420A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7143569A JPH08339420A (ja) 1995-06-09 1995-06-09 フォーマット情報生成方法及びフォーマット情報生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7143569A JPH08339420A (ja) 1995-06-09 1995-06-09 フォーマット情報生成方法及びフォーマット情報生成装置

Publications (1)

Publication Number Publication Date
JPH08339420A true JPH08339420A (ja) 1996-12-24

Family

ID=15341808

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7143569A Pending JPH08339420A (ja) 1995-06-09 1995-06-09 フォーマット情報生成方法及びフォーマット情報生成装置

Country Status (1)

Country Link
JP (1) JPH08339420A (ja)

Similar Documents

Publication Publication Date Title
JP3469345B2 (ja) 画像のファイリング装置及びファイリング方法
US7926732B2 (en) OCR sheet-inputting device, OCR sheet, program for inputting an OCR sheet and program for drawing an OCR sheet form
US20030042319A1 (en) Automatic and semi-automatic index generation for raster documents
JP3602596B2 (ja) ドキュメントファイリング装置および方法
JP2908204B2 (ja) 十指指紋カード入力装置
KR20040078046A (ko) 전표정의데이터 작성방법 및 전표처리장치
CN109726369A (zh) 一种基于标准文献的智能模板化题录技术实现方法
JPH09231291A (ja) 帳票読取方法及びその装置
JP3394694B2 (ja) フォーマット情報登録方法及びocrシステム
JP3711636B2 (ja) 情報検索装置および方法
JP3732254B2 (ja) フォーマット情報生成方法及びフォーマット情報生成装置
JP2000003403A (ja) 帳票入力支援方法
JPH08339420A (ja) フォーマット情報生成方法及びフォーマット情報生成装置
JPH07220023A (ja) 表認識方法及びその装置
JP4517822B2 (ja) 画像処理装置及びプログラム
JPH0516069B2 (ja)
JPH0689330A (ja) 画像ファイリングシステム
KR0183779B1 (ko) 전표 등록 방법 및 장치
JP2003132078A (ja) データベース構築装置、データベース構築方法、データベース構築プログラム、記録媒体
JP4405604B2 (ja) 情報処理装置及び定義方法
JP2019185140A (ja) 画像処理装置、画像処理方法およびプログラム
JPH08335247A (ja) フォーマット情報生成方法及びフォーマット情報生成装置
JP2924790B2 (ja) 簡易地図作成方式
JP2682873B2 (ja) 表形式文書の認識装置
JPH0668299A (ja) 読み取り結果表示方法、読み取り結果修正方法、およびデータ読み取り装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20010306