JP3394694B2 - フォーマット情報登録方法及びocrシステム - Google Patents

フォーマット情報登録方法及びocrシステム

Info

Publication number
JP3394694B2
JP3394694B2 JP24961497A JP24961497A JP3394694B2 JP 3394694 B2 JP3394694 B2 JP 3394694B2 JP 24961497 A JP24961497 A JP 24961497A JP 24961497 A JP24961497 A JP 24961497A JP 3394694 B2 JP3394694 B2 JP 3394694B2
Authority
JP
Japan
Prior art keywords
information
item
area
recognition
entered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP24961497A
Other languages
English (en)
Other versions
JPH1173472A (ja
Inventor
清志 石原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP24961497A priority Critical patent/JP3394694B2/ja
Publication of JPH1173472A publication Critical patent/JPH1173472A/ja
Application granted granted Critical
Publication of JP3394694B2 publication Critical patent/JP3394694B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、帳票上に記録され
た文字やマークを読み取る場合に、予め読み取り対象と
なる帳票のフォーマット情報を取得して登録するため
の、フォーマット情報登録方法及びOCRシステムに関
する。
【0002】
【従来の技術】各種の商取引や事務管理に使用される帳
票に記入された情報をコンピュータに入力して活用する
ために、OCRシステムが利用される。このシステムで
は、帳票のイメージを読み取り、指定された箇所に記入
された文字を切り出して認識し、文字コード化して情報
処理用のデータとする。こうしたシステムでは、読み取
り対象となる帳票上の文字や図形等の情報が記入される
べき位置を、予めフォーマット情報として登録しておく
必要がある。2種類以上の帳票を混在させ、それぞれ必
要な情報を読み取り、認識する場合には、各帳票毎にフ
ォーマット情報を登録しておく必要がある。このような
フォーマット情報の登録作業は、オペレータが専用のエ
ディタ等を用いて手作業でコンピュータに入力するよう
にしていた。
【0003】
【発明が解決しようとする課題】ところで、上記のよう
な従来の技術には次のような解決すべき課題があった。
読み取り対象となる帳票の種類が数多くなると、オペレ
ータによるフォーマット情報登録作業が煩雑になる。ま
た、帳票が複雑な構成をしているような場合にも、オペ
レータの登録作業に大きな負荷がかかる。また、同一の
項目を記入するための帳票であっても、その記入位置が
わずかに異なるような帳票が何種類かあると、これらの
帳票について全て所定の登録作業を行う必要があり、オ
ペレータの大きな負担になっていた。
【0004】
【課題を解決するための手段】本発明は以上の点を解決
するため次の構成を採用する。 〈構成1〉任意の情報を記入した帳票のイメージを読み
取る画像入力部と、上記情報を認識して文字コード化す
る認識部と、上記帳票に記入される項目名と、その項目
に関する情報が記入されて文字認識をするための認識領
域と項目名との位置関係と、認識領域位置の個数とを表
示したキー項目データベースと、上記画像入力部で読み
取った、帳票のイメージ中に含まれる罫線で囲まれた領
域の座標情報と、その領域に記入された文字の認識結果
を表示したレイアウト情報とを生成するレイアウト解析
部と、上記キー項目データベースとレイアウト情報とを
参照することにより、項目名毎に、対応する認識領域位
置の座標情報を表示したフォーマット情報を生成する項
目探索部を備えたことを特徴とするOCRシステム。
【0005】〈構成2〉任意の情報を記入した帳票のイ
メージを読み取って、上記情報を認識して文字コード化
するために、予め当該帳票の情報記入位置を表示するフ
ォーマット情報を生成する場合に、上記帳票に記入され
る項目名と、その項目に関する情報が記入されて文字認
識をするための認識領域と項目名との位置関係と、認識
領域位置の個数とを表示したキー項目データベースを予
め用意し、上記帳票のイメージを読み取って、その帳票
のイメージ中に含まれる罫線で囲まれた領域の座標情報
と、その領域に記入された文字の認識結果を表示したレ
イアウト情報とを生成し、上記キー項目データベースと
レイアウト情報とを参照することにより、項目名毎に、
対応する認識領域位置の座標情報を表示したフォーマッ
ト情報を生成することを特徴とするフォーマット情報登
録方法。
【0006】〈構成3〉任意の情報を記入した帳票のイ
メージを読み取って、上記情報を認識して文字コード化
するために、予め当該帳票の情報記入位置を表示するフ
ォーマット情報を生成する場合に、上記帳票に記入され
る階層構造の項目名と、階層構造から見て最下位の階層
にある項目に関する情報が記入されて文字認識をするた
めの認識領域と項目名との位置関係と、認識領域位置の
個数とを表示したキー項目データベースを予め用意し、
上記帳票のイメージを読み取って、その帳票のイメージ
中に含まれる罫線で囲まれた領域の座標情報と、その領
域に記入された文字の認識結果を表示したレイアウト情
報とを生成し、上記キー項目データベースとレイアウト
情報とを参照することにより、上記階層構造の項目名毎
に、対応する認識領域位置の座標情報を表示したフォー
マット情報を生成することを特徴とするフォーマット情
報登録方法。
【0007】〈構成4〉任意の情報を記入した帳票のイ
メージを読み取って、上記情報を認識して文字コード化
するために、予め当該帳票の情報記入位置を表示するフ
ォーマット情報を生成する場合に、上記帳票に記入され
る項目名と、その項目に関する情報が記入されて文字認
識をするための認識領域と項目名との位置関係と、認識
領域位置の個数と、認識領域に予め記入されている一定
のイメージ情報を表示したキー項目データベースを予め
用意し、上記帳票のイメージを読み取って、その帳票の
イメージ中に含まれる罫線で囲まれた領域の座標情報
と、その領域に記入された文字の認識結果を表示したレ
イアウト情報とを生成し、上記キー項目データベースと
レイアウト情報とを参照し、かつ、項目名に対応する認
識領域と判断した領域中に予め記入されているイメージ
と上記イメージ情報とを照合することにより、項目名毎
に、対応する認識領域位置の座標情報を表示したフォー
マット情報を生成することを特徴とするフォーマット情
報登録方法。
【0008】 〈構成5〉 任意の情報を記入した帳票のイメージを読み取って、上
記情報を認識して文字コード化するために、予め当該帳
票の情報記入位置を表示するフォーマット情報を生成す
る場合に、上記帳票に記入される項目名と、その項目に
関する情報が記入されて文字認識をするための認識領域
と項目名との位置関係と、認識領域位置の個数と、認識
領域に予め記入されている一定の文字情報を表示したキ
ー項目データベースを予め用意し、上記帳票のイメージ
を読み取って、その帳票のイメージ中に含まれる罫線で
囲まれた領域の座標情報と、その領域に記入された文字
の認識結果を表示したレイアウト情報とを生成し、上記
キー項目データベースとレイアウト情報とを参照し、か
つ、項目名に対応する認識領域と判断した領域中に予め
記入されている上記文字と上記文字情報との認識結果を
照合することにより、項目名毎に、対応する認識領域位
置の座標情報を表示したフォーマット情報を生成するこ
とを特徴とするフォーマット情報登録方法。
【0009】
【0010】〈構成6構成5 に記載の方法において、キー項目データベースに
は、領域中に予め記入されている文字を照合するための
認識辞書が格納されていることを特徴とするフォーマッ
ト情報登録方法。
【0011】〈構成7〉 任意の情報を記入した帳票のイメージを読み取って、上
記情報を認識して文字コード化するために、予め当該帳
票の情報記入位置を表示するフォーマット情報を生成す
る場合に、上記帳票に記入される項目名と、その項目に
関する情報が記入されて文字認識をするための認識領域
と項目名との位置関係と、認識領域位置の個数と、上記
項目に関する情報が記入されて文字認識をするための認
識領域に予め記入されている一定の情報を表示したキー
項目データベースを予め用意し、上記帳票のイメージを
読み取って、その帳票のイメージ中に含まれる罫線で囲
まれた領域の座標情報と、その領域に記入された文字の
認識結果を表示したレイアウト情報とを生成し、上記キ
ー項目データベースとレイアウト情報とを参照すること
により、項目名毎に、対応する認識領域位置の座標情報
を表示するとともに、上記認識領域中に予め記入されて
いる情報と上記キー項目データベース中の一定の情報と
が一致した場合に、その判定の確からしさを示す重みづ
け情報を表示したフォーマット情報を生成することを特
徴とするフォーマット情報登録方法。
【0012】
【0013】
【発明の実施の形態】以下、本発明の実施の形態を具体
例を用いて説明する。 〈具体例〉図1は、本発明によるフォーマット情報登録
方法の説明図である。本発明においては、図に示すよう
な帳票1のイメージを読み取って、OCRシステムで使
用するフォーマット情報6を自動的に生成する。この図
には、その手順を概略的に図示した。帳票1は、例えば
その左上隅にシートID2を記入した構成のものであ
る。このシートID2は、帳票1の種別を表す各帳票毎
に固有の記号である。
【0014】この帳票には、例えば住所や氏名等を記入
する欄が設けられている。こうした記入欄は図に示すよ
うに罫線3で囲まれている。一般のOCRシステムに
は、帳票1のイメージを読み取ったとき、その中に記入
された罫線で囲まれた領域を認識し、その領域の座標情
報を得る機能がある。その領域内部に記入された文字の
切出し処理を行うためである。フォーマット情報登録処
理の際にも、この機能を利用する。
【0015】即ち、この機能によって、図に示すような
レイアウト情報4を得る。このレイアウト情報4は、例
えば図に示す帳票1の住所を記入する欄の場合に、その
罫線3で囲まれた3つの枠の左上隅と右下隅の座標を求
める。ここでは3組の座標情報が求めてある。また、こ
うして罫線で囲まれた3つの領域を検出すると、続いて
各領域の内部に記入された文字の認識処理を行う。これ
も一般のOCR装置に設けられた機能である。
【0016】帳票1に実際にOCRで取り込むべき情報
が記入されていない状態では、ここには丁度項目名の部
分のみ必要な文字が記入されており、その他の欄は空白
になっている。従って、図に示すようなレイアウト情報
4が得られる。もちろん、このフォーマット情報生成処
理に支障がない限り、その他の欄に適当な文字が記入さ
れていても良い。
【0017】ここで、帳票1のフォーマット情報を自動
的に生成するために、予めキー項目DB(以下データベ
ースを全てDBと表示する)5を用意する。このキー項
目DB5は、図に示すように帳票1に記入されるべき項
目名と、その項目名に対応する情報が記入される領域即
ち認識領域の位置とその個数とを対応付けて記憶し、そ
の内容を表示した情報群である。例えば、図に示す帳票
1の場合、住所という項目が存在すると、その項目名の
下側に2個並んで情報を記入すべき欄が存在する。キー
項目DB5は、このような項目名と情報を記入するべき
欄の位置と個数等の情報を表示する。
【0018】なお、この場合の位置というのは、座標で
表示された位置情報とは異なる。項目名の欄からみてど
の方角に認識領域があるかということを示す項目名と認
識領域との位置関係を示す情報である。以下の説明では
これを単に位置として話を進める。このような情報は、
帳票毎に簡単に作成できる。コンピュータに入力するの
も容易である。本発明ではこの情報を利用して、項目毎
に正確な認識領域のイメージ切り出し位置座標を表示し
た、フォーマット情報を自動的に生成する。
【0019】ここでまず、このようなキー項目DB5と
レイアウト情報4とを利用して、住所という項目名を記
入した領域の座標情報をレイアウト情報4を参照して検
出する。そして、その領域の下側に位置する2個の領域
を住所に対応する情報が記入される領域と判断する。そ
の結果、図に示すように、フォーマット情報6には、シ
ートIDが110という帳票1について、その項目名が
住所の場合、位置情報はレイアウト情報4で求めた下の
2段の領域の座標が記録される。このような処理はOC
Rシステムの持つ既存の機能に所定の判断処理を付け加
えることによって実行できる。そして、これらの処理は
自動的に実行できるため、オペレータの負担が軽減され
る。なお、こうして得られたフォーマット情報は、その
後オペレータによって点検され、最終的な修正等が加え
られた形で登録されることになる。
【0020】以下、本発明の具体例をそれぞれブロック
図やフローチャート等を用いて順番に説明する。図2
は、本発明によるOCRシステムのブロック図である。
以下に説明する本発明の各具体例を実施するために、例
えばこの図に示すような構成のOCRシステムが採用さ
れる。図のシステムは、バスライン10に、画像入力部
11、画像メモリ12、認識部13、制御部14、項目
探索部15、レイアウト解析部16、レイアウト情報メ
モリ17、キー項目DB18、フォーマット情報DB1
9、フォーマット識別部20、認識結果DB21、入力
部22、表示部23を接続したものである。
【0021】画像入力部11はイメージスキャナ等によ
り構成され、帳票に記入された文字や図形等を2値デー
タに変換する処理を行う部分である。画像メモリ12
は、こうして得られた画像データをその後の処理のため
に記憶しておく装置である。レイアウト解析部16は、
画像メモリ12に格納された画像データから先に説明し
たように罫線で囲まれた領域を抽出し、切り出された領
域の座標情報をレイアウト情報メモリ17に格納する機
能を持つ部分である。
【0022】認識部13は、レイアウト情報メモリ17
やフォーマット情報DB19に格納された各領域の座標
情報を参照して、画像メモリ12に格納された画像デー
タの対応する領域に記入された文字列を認識し、文字コ
ードに変換する部分である。その認識結果は、レイアウ
ト情報メモリ17や認識結果DB21に格納される。
【0023】レイアウト情報メモリ17は、レイアウト
解析部16によって抽出された領域の座標情報と、認識
部13によって認識された文字列とを格納する部分であ
る。キー項目DB18は、既に説明したように、項目名
や認識領域位置、個数等の情報を格納しておく部分であ
る。項目探索部15は、レイアウト情報メモリ17に格
納された領域の座標情報と文字列とを、キー項目DB1
8に格納された情報で探索し、検索した結果をフォーマ
ット情報DB19に格納する機能を持つ。この部分が既
に説明したフォーマット情報自動生成を実行する部分で
ある。
【0024】フォーマット情報DB19は、既に説明し
たような構造を持ち、項目探索部15によって探索され
た結果をシートID、項目名、位置情報という形で表示
する部分である。フォーマット識別部20は、画像メモ
リ12に格納された画像データ上のシートIDを読み取
り、フォーマット情報DB19を、読み取ったIDで検
索し、画像データのフォーマットを識別する機能を持
つ。認識結果DB21は、認識部13が出力した文字デ
ータを格納する。これがその後コンピュータ等に取り込
まれ、各種の情報処理に利用されることになる。
【0025】制御部14は、このシステム全体を制御す
る機能を持つ。入力部22はオペレータからの入力を受
け付ける機能を持ち、キーボードやマウス等の機器から
構成される。表示部23はオペレータに対して情報を表
示するディスプレイ等の機器から構成される。
【0026】図3には、システムの主要動作フローチャ
ートを示す。システムは、この図に示すように、フォー
マット情報登録処理(ステップS1)と読取処理(ステ
ップS2)とを実行する。フォーマット情報登録処理
は、実際の帳票を読み取りする前に、読取対象となる無
記入の帳票を既に説明した要領で処理し、フォーマット
情報を登録する処理である。即ち、予め一定の形式で印
刷された各種の帳票のフォーマット情報をこの処理によ
ってシートIDに対応付けてフォーマット情報DB19
に登録する。既に説明したように、この帳票は情報を記
入済みのものであっても構わない。
【0027】読取処理は、実際の情報を記入した帳票を
読み取り、必要な情報を認識して、その認識結果を得る
処理である。この場合、帳票のシートIDを認識し、フ
ォーマット情報19から対応するフォーマット情報を取
り出し、フォーマット情報に登録された箇所の文字認識
を行って必要な情報を得る。こうして文字認識した結果
は文字コード化されて、認識結果DB21に格納され
る。
【0028】図4には、上記フォーマット情報登録処理
の動作フローチャートを示す。図のステップS1−1で
は、画像入力処理Aが行われる。これは、図1に示した
帳票のイメージを読み取る処理である。この帳票1には
必要な項目名等が印刷されているが、まだその他の情報
は無記入のままである。ステップS1−2において、図
1に示したようなレイアウト情報4を得るためのレイア
ウト解析処理が実行される。そして、ステップS1−3
において、認識した座標情報を元に各領域中に記入され
た文字の認識処理Aが行われる。ここでは、帳票1に既
に印刷されている項目名等の認識が行われる。そして、
ステップS1−4において、項目探索処理が実行され
る。これは、図1に示したキー項目DB5とレイアウト
情報4を利用してフォーマット情報6を自動的に得る処
理である。
【0029】その後、ステップS1−5において、探索
結果修正処理が実行される。即ち、自動的に得られたフ
ォーマット情報を図2に示した表示部23に表示してオ
ペレータによる修正や検査を受ける。これによって、完
成したフォーマット情報が図2に示したフォーマット情
報DB19に再登録される。この図4のステップS1−
2〜ステップS1−4に至る各処理が、以下にそれぞれ
の具体例として説明されている。
【0030】図5には、読取処理の動作フローチャート
を示す。この動作は、フォーマット情報が登録された
後、実際に各種の情報が記入された帳票のイメージを読
み取り、文字認識を行う処理である。この部分の動作は
従来の装置と全く同様であり、ここでその説明を行い、
以下の具体例においては、フォーマット情報の登録処理
ついてのみ言及することにする。
【0031】まず、図5のステップS2−1において、
各種の情報が記入された画像データを読み取る画像入力
処理Bが行われる。そして、ステップS2−2におい
て、フォーマット情報を参照し、シートIDに対応する
フォーマット情報を取り出して帳票の種類を識別する。
その後、ステップS2−3において、フォーマット情報
で指定された各領域の座標情報を参照し、その領域に記
入されあるいは印字された文字列を認識して文字コード
に変換する。その結果は、図2で説明した認識結果DB
21に格納される。
【0032】そして、ステップS2−4において、オペ
レータが認識結果を表示部23に表示し、内容の検査と
修正を行う。こうして修正等の処理が終了すると、その
後認識結果DB21が更新され、他の情報処理装置等に
その結果が転送される。
【0033】以下、上記フォーマット情報登録処理の様
々な実施態様を具体例により順に説明する。 〈具体例1〉図6には、この具体例を含む以下の全ての
具体例において生成するフォーマット情報DBの内容説
明図を示す。この図に示すように、フォーマット情報6
は、シートIDと項目名と位置情報により構成される。
シートIDは、帳票の種類を識別するための文字や記号
で、項目名は帳票上に記入されるべき項目を特定する名
称である。位置情報は、帳票のイメージ上の各罫線で囲
まれた領域の座標情報から構成される。これは、図1を
用いて既に説明した通りである。図の帳票1には、図1
を用いて説明したようなシートIDやその他の項目が表
示されている。各項目には、この図に示すように、項目
名を印刷した領域をK1,K2と表示し、その項目に対
応して情報が記入される領域をJ1,J2,J3と表示
した。
【0034】図7には、具体例1のキー項目DBの内容
説明図を示す。具体例1においては、例えばこの図に示
すような項目DBが使用される。この項目DB5は、既
に説明したように、項目名と認識領域位置とその個数に
よって構成される。図の右側に示すように、帳票上に記
入される項目が、例えば住所あるいは氏名であるとす
る。
【0035】この場合に、住所という項目名K1の下側
に2個の罫線に囲まれた領域J1,J2が存在する。こ
こに住所が記入される。そこで、図のキー項目DB5に
は、住所という項目名の認識領域位置は住所とある欄の
下側であって、その個数が“2”という内容となってい
る。また、氏名という項目K2については、その右側の
罫線に囲まれた領域J3に氏名が実際に記入される。従
って、キー項目DB5には、項目名を氏名とし、その認
識領域位置を右として、個数を“1”というように表現
している。
【0036】上記のように、キー項目DBとレイアウト
情報4を利用したフォーマット情報登録動作を図8を用
いて説明する。図8は、具体例1の動作フローチャート
である。まず、ステップS10において、カウンタ1に
“1”が代入され、RecNumにキー項目DBのレコード数
が代入される。なお、1レコードというのはキー項目D
Bの項目名1つに対応する認識領域位置や個数等の1組
の情報である。ステップS20は、全てのキー項目DB
のレコードについて処理が終了したかを判断する部分で
ある。
【0037】ステップS30では、最初にキー項目DB
の1番目のレコードを読み出す。即ち、図7に示した例
では、項目名が住所、認識領域位置が下、個数が“2”
というレコードが読み出される。そして、ステップS4
0において、項目名を用いてレイアウト情報メモリを検
索する。ステップS50で、対応する領域が得られた場
合、ステップS60に進み、位置情報でレイアウト情報
メモリを検索する。
【0038】即ち、図1に示したようなレイアウト情報
4がある場合、項目名でレイアウト情報メモリを検索す
ると、認識結果が住所という項目名が検索結果として得
られたとする。この場合、ステップS60において、こ
れに対応する座標情報を求める。そして、キー項目DB
の認識領域位置がその下側という表示になっているか
ら、その座標情報中からその下側の領域を求める。
【0039】ステップS70において、下側の領域があ
ると判断されると、ステップS80に進み、個数で表示
された数だけその領域の座標情報を得て、フォーマット
情報6を得る。このフォーマット情報は、図2に示した
フォーマット情報DB19に登録する。もし、必要個数
に満たない場合にはあるだけ登録する。不足している場
合には、後でオペレータの修正等によって追加される。
【0040】ステップS90では、カウンタがインクリ
メントされる。これによって、ステップS30〜ステッ
プS90の処理がキー項目DBのレコード数だけ繰り返
される。以上のようにして、フォーマット情報が生成さ
れる。
【0041】〈具体例1の効果〉帳票に記入される項目
名と認識領域位置とその個数とを表示したキー項目デー
タベースを予め用意し、帳票のイメージ中に含まれる罫
線で囲まれた領域の座標情報と、その領域に記入された
文字の認識結果を得て、キー項目DBを参照することに
より、自動的にフォーマット情報を得るので、記入項目
が同じでも、その記入位置がわずかに変更されたような
帳票については、極めて容易に自動的にフォーマット情
報の登録が可能となる。また、自動生成の結果が多少不
完全であっても、オペレータが簡単な修正作業をするだ
けで完全なものにすることができるから、オペレータの
負担軽減効果は高い。
【0042】〈具体例2〉図9には、具体例2のキー項
目DBの内容説明図を示す。この図のキー項目DBに
も、項目名と認識領域位置と個数とが表示される。ここ
で、図9の右側に示すように、氏名という項目名を印刷
した領域K3があるとする。このとき、氏名に関する情
報は姓と名という項目名を印刷した領域K4,K5の下
に区分して記入される。氏名に関する情報が記入される
領域を領域J4,J5としている。
【0043】こうしたケースでは、氏名と姓、氏名と名
が、それぞれいわゆる階層構造を持つことから、これら
を組み合わせたものをそれぞれ項目名リストに表示し
た。従って、氏名の姓という項目名の下側には名字を入
れる領域が存在するという情報がこのキー項目DBに表
示されることになる。この関係を階層関係と呼ぶ。その
他の領域についても全く同様の扱いがされる。この例の
場合には、項目名を階層の上位からカンマで区切って表
示している。従って、何段階かの階層がある場合には、
いくつかのカンマで区切られた項目名が連結され項目名
リストに表示されることになる。
【0044】図10には、具体例2の動作フローチャー
トを示す。この図に示すステップS10,S20,S3
0,S60,S70,S80,S90の処理は、既に具
体例1の図8を用いて説明した処理と同一である。従っ
て、具体例2の固有の部分についてのみ詳細に説明を行
うことにする。
【0045】ステップS30で、キー項目DBの1番目
のレコードが読み出されると、ステップS31では、パ
ラメータJを“1”に設定する。このパラメータJは項
目名リストが2以上の項目名を連結してできている場合
に、その先頭の項目名から順番にステップS32〜S3
6の処理を実行する制御を行うためのものである。
【0046】例えば、項目名が氏名,姓という内容のも
のの場合、J=1では、項目名が氏名という文字列がス
テップS32で読み出される。そして、ステップS33
では、Jというパラメータを監視し、全ての項目名につ
いて処理が終了したかどうかを判断する。氏名,姓とい
う項目名中の氏名を読み出した場合には、ステップS3
4に移り、その氏名という項目名を認識結果とするレイ
アウト情報を検索する。
【0047】そして、ステップS35で、対応する領域
があった場合にはステップS36に進み、今度は次の項
目名を処理対象とするためにJをインクリメントする。
そして、ステップS32に戻り、今度は姓という文字列
を読み出す。ステップS33の判断でJ番目の文字列が
存在するから、ステップS34に進み、項目名でレイア
ウト情報メモリを検索する。そして、対応する領域があ
れば再びステップS36からステップS32に戻る。
【0048】ここで、Jがインクリメントされ、再び3
番目の文字列を読み出そうとすると、この具体例では、
姓の他に3番目の文字列はない。従って、ステップS3
3からステップS60に進む。そして、ここで、キー項
目DBの認識領域位置に基づいてレイアウト情報メモリ
を検索する。これによって、図9の姓という項目K4の
下側にある情報J4を記入した領域の位置情報を得る。
【0049】こうして位置情報を得るとステップS80
に進み、個数で指定された分だけそのフォーマット情報
をデータベースに登録する。即ち、項目名が氏名の姓で
あって、その位置情報は図9に示す情報J4を表示した
領域となる。これらの処理が済むとステップS90に進
み、Iをインクリメントして次の項目名リストについて
の処理を実施する。
【0050】即ち、上記ステップS30〜ステップS3
6までの処理によって、階層構造の項目名を調べ、最後
の項目名が記入された領域を見つける。そして、その領
域に対し認識領域位置の情報で示された場所に、その項
目に対応する情報を記入する領域があると判断する。こ
の結果に従って、ステップS60〜ステップS90の処
理を実行し、レイアウト情報を生成する。こうして得ら
れたフォーマット情報も具体例1の場合と同様にオペレ
ータによって検査され、必要な修正が加えられて改めて
登録されることになる。
【0051】〈具体例2の効果〉以上のように、項目名
が階層構造になっていた場合に、階層の最下位にある項
目と認識領域位置及びその領域の個数を対応付けてキー
項目データベースに格納することによって、複雑な項目
表示が行われた場合にも対応することが可能となる。そ
の他の効果は具体例1と同様である。
【0052】〈具体例3〉図11には、具体例3の場合
のキー項目データベースの内容説明図を示す。この例で
は、これまでの具体例で説明したキー項目の項目名、認
識領域位置及び個数の他に、イメージ情報という情報が
設けられる。図の右側には、例えば住所という項目につ
いて、その右側の罫線で囲まれた領域に該当する情報が
記入される例を示している。通常、住所には郵便番号が
表示される。この例では、情報が記入されるべき領域J
1に含まれている、郵便番号記入用の枠に相当する情報
がイメージ情報としてキー項目データベースに含められ
る。従って、このキー項目DBのイメージ情報中には、
郵便番号を記入する領域J6のイメージデータがそのま
まの形で記憶される。
【0053】図12に、具体例3の動作フローチャート
を示す。このフローチャートのステップS71を除くス
テップS10〜ステップS90までの処理は、図8を用
いて説明した具体例1の動作と同一である。この具体例
では、図のステップS70の判断の次に、ステップS7
1の判断処理が付け加えられている。
【0054】ここでは、住所という項目K1を検出し、
その右側にある認識領域位置を検出したとき、その内部
にキー項目DBに登録されたイメージ情報が存在するか
どうかを判断する。ここでは郵便番号の領域J6が領域
J1の中に存在するかどうかを判断する。もし、存在す
れば、住所を記入する領域に間違いないから、ステップ
S80に進み、該当する個数分だけフォーマット情報へ
の登録が行われる。もし、このイメージ情報と一致する
情報が存在しない場合には、住所を記入する領域でない
と判断されるから、フォーマット情報の登録が行われな
い。
【0055】なお、この例では、住所について、郵便番
号を記入する枠をイメージ情報として例示したが、例え
ば金額を記入する場合の¥記号、その他その領域が所定
の事項を記入する領域であるかどうかを区別するために
重要なイメージが存在する場合、そのイメージ情報をキ
ー項目DBに記憶しておくことができる。
【0056】〈具体例3の効果〉上記のように、項目名
に対応する認識領域中に、その認識領域であることを裏
付けるイメージが存在する場合、そのイメージ情報をキ
ー項目DBに含めることによって、フォーマット情報登
録の信頼性を向上し、オペレータの登録作業負担を軽減
することができる。
【0057】なお、上記の場合、イメージ情報を住所に
対応する項目を記入する領域であるかどうかの確認のた
めに利用した。しかしながら、イメージ情報が存在する
領域は確実に住所を記入する領域であるという判定が可
能な場合には、例えばキー項目DBに認識領域位置や個
数に関する情報が含まれていなくても、住所という項目
名を記入した領域の隣接領域全てについて、このイメー
ジ情報が含まれているかどうかの判断を行って、該当す
る領域を見つけることもできる。
【0058】〈具体例4〉図13には、具体例4のキー
項目DBの内容説明図を示す。具体例3においては、キ
ー項目DBに項目名、認識領域位置、個数の他に、イメ
ージ情報を付加した。一方、この具体例4においては、
認識領域文字情報を付加する。即ち、認識領域中に含ま
れる予め印刷された文字に関する情報を文字コードとし
て記憶しておく。
【0059】例えば、氏名という項目K1の下側には氏
名に該当する情報が記入される。この領域をJ1とす
る。このとき、一般に氏名の最後には「様」といった文
字が印刷されている。即ち、情報記入前に印刷されてい
るこうした文字を認識し、文字コード化したものを図1
に示すレイアウト情報4に含めておく。これによって、
具体例3の場合と同様に、この領域には、例えば氏名が
記入されるということを確認できる。図13の右下には
銀行名という項目を印刷した領域K2のすぐ下の領域J
2に「銀行」という文字M2がある。そこで、キー項目
DBに対し銀行名という項目の認識領域文字情報として
「銀行」という文字が表示される。
【0060】図14には、具体例4の動作フローチャー
トを示す。この具体例4のステップS72を除くステッ
プS10〜ステップS90までの処理は、具体例3と全
く同一である。ステップS72では、ステップS3でイ
メージ情報との比較を行ったのに対し、ここでは認識領
域文字情報とのマッチングを行っている。そして、両者
が一致した場合には、該当個数分だけフォーマット情報
が生成される。一致しない場合にはフォーマット情報は
生成されない。
【0061】〈具体例4の効果〉具体例4は具体例3と
同様に、認識領域に記入された情報に基づいて、その認
識領域が該当する領域であるかどうかの信頼性を向上さ
せる。
【0062】〈具体例5〉図15は、具体例5のキー項
目DBの内容説明図である。この具体例では、キー項目
DBに項目名に対応する辞書を用意しておく。即ち、項
目名が氏名とすれば、その氏名を記入する欄やその周辺
の欄には、姓、名、フリガナ、様といった文字が記入さ
れる。これらの文字は、レイアウト情報生成の際に全て
認識される。しかしながら、場合によっては認識されな
いままあるいは認識誤りを生じたままフォーマット情報
生成動作に移ることがある。具体例5では、こういった
特定の文字情報をキー項目DBに認識辞書として格納し
ておく。
【0063】図16は、具体例5の動作フローチャート
である。この図のフローチャートの前後の処理は、これ
までの動作と同様であるから図示を省略している。具体
例4の例でいえば、ステップS70以前の部分について
は、具体例5もこれと同様の処理を行う。そして、ステ
ップS70〜ステップS77の処理を実行し、図14に
示す具体例4のステップS90に進むよう動作すること
になる。
【0064】まず、この図16のステップS70におい
て、認識領域位置に領域があるかどうかを判断する。こ
れは、キー項目DB5の位置情報を参照して行われる。
ここで、ステップS73に進み、領域中に文字等の記入
があるかどうかを判断する。文字等の記入があればステ
ップS74に進み、その認識結果がレイアウト情報に含
まれているかどうかを判断する。
【0065】含まれていれば通常通りの処理に進む。含
まれていなければステップS75に進み、この具体例に
おける認識辞書を取り出し、これらの文字の認識と照合
を実行する。対象が限定されているため、認識の精度が
上がり、通常の文字認識処理では認識できなかったもの
も認識が可能となる。また、変形した文字、飾り文字等
については、レイアウト情報生成の際に認識されないこ
ともあるが、ここではそのような認識も可能となる。こ
うした認識処理を実行し、レイアウト情報が整備されれ
ば、これまでの具体例と全く同様の処理が実行される。
【0066】ステップS76では、ここが認識領域かど
うかを判断し、例えば氏名のすぐ下側の欄であって、
「様」という項目が記入されていると判断されると、ス
テップS77に進み、フォーマット情報DBへの登録が
実行される。それ以外の場合は、フォーマット情報の生
成はパスし、次のレコードに関する処理に進む。
【0067】〈具体例5の効果〉予め項目名に対応する
認識辞書を用意したので、項目名固有の一般の処理では
認識が容易でない文字等についても確実に認識処理を行
い、該当する項目や該当する認識領域の照合と判定を確
実にすることができる。
【0068】〈具体例6〉図17には、フォーマット情
報DBの内容説明図を示す。これまで説明したように、
自動的に項目名に対応する文字認識領域の位置座標を求
めフォーマット情報として登録する場合には、その信頼
性が問題となる。自動的に生成されたフォーマット情報
に信頼性があれば、よりオペレータの負担が軽減され
る。
【0069】そこで、生成されたフォーマット情報の各
位置情報に信頼性を表示する重み付けを行う。この重み
付けは、例えば項目名を記入した領域に近接した位置に
ある領域は、その項目名に関する認識領域である可能性
が高い。こうした場合には、加点情報を高くし、距離が
遠いほど加点情報を低くする。また、欄の中に「様」と
いった文字が記入されていれば、氏名を記入するべき認
識領域である確率が高い。この場合、加点情報を付加す
ることによって重み付けをする。
【0070】こうして、このフォーマット情報は信頼性
が高いといった情報を加え、オペレータが修正処理をす
る際に役立てる。図17に示すフォーマット情報DB4
にはこのような目的で、シートID、項目名、位置情報
の他に、加点情報を書き込むようにしている。帳票1の
構成はこれまで説明したものと同様である。
【0071】図18には、帳票の変形例説明図を示す。
この図の場合には、項目K1の住所に対応する認識領域
J1に、「県」とか「市」とかいう言葉がある。これに
よって、加点情報が加えられる。
【0072】図19には、具体例6の動作フローチャー
トを示す。まず、このフローチャートに従って具体例6
を説明する。図19において、ステップS51〜54に
示す処理を除くステップS10〜ステップS90までの
処理は、これまでの具体例3あるいは具体例4等を用い
て説明した動作と全く同一である。
【0073】ここで、ステップS50において、該当す
る項目名の位置情報に基づき対応する領域を調べ、その
領域があると判断するとステップS51に進み、周囲の
領域を検索する。そして、近接した領域という判断で、
例えば“1”という加点情報を加算する(ステップS5
2)。次に、その領域内に含まれる文字情報を調べる。
ここに、例えば氏名の場合、「様」というような文字が
含まれていれば、加点情報に新たに“1”を加える。従
って、氏名という項目を記入した領域の隣に隣接してお
り、その中に「様」という文字が存在すれば加点情報は
“2”となる。このような処理の結果をステップS54
において、フォーマット情報DBに登録する。
【0074】オペレータは、図17に示すフォーマット
情報DBを眺めながら、例えば住所という項目名に対応
する位置情報とその加点情報を参考にし、これらの情報
が誤りなく自動的に生成されているかどうかを判断す
る。加点情報が高い情報については信頼性が高いものと
して、その他の情報の修正等に注力することも可能とな
る。
【0075】〈具体例6の効果〉以上のように、図18
に示すように、情報を記入するべき欄に文字等が存在す
れば、より信頼性が増すことになる。なお、加点の対象
となる情報としては、例えば既に説明したような郵便番
号を記入する領域、「様」や「銀行」等の文字が考えら
れる。
【0076】〈具体例7〉上記の例では、項目名に対応
する認識領域を判断するために、項目名の位置や領域内
に記入された文字等をその基準にした。この具体例で
は、フォーマット情報を生成するために、予め認識領域
中にガイドとなる情報を記入した特別の帳票を用意す
る。
【0077】図20には、具体例7のキー項目DBの内
容説明図を示す。この図に示すように、項目名が、住
所、氏名、銀行等とされた帳票の各認識領域には、図に
示すように、ADRESS1、ADRESS2、NAME1といった文字列
が記入されているものとする。これをこのキー項目DB
に表示しておく。
【0078】図21は、帳票の変形例説明図である。こ
の図に示すように、帳票1の各項目K1,K2,K3に
は、それぞれその認識領域にキー項目DBに表示したよ
うな文字が記入されている。こうしたフォーマット情報
生成用の帳票を予め用意しておくことによって正確に信
頼性のフォーマット情報を生成することができる。
【0079】図22には、具体例7の動作フローチャー
トを示す。ステップS10,S30,S50,S90
は、これまで説明してきた具体例と全く同一の処理であ
る。ここで、ステップS30で、キー項目DBの1番目
のレコードの読出しを行う際に、ステップS31におい
て、認識領域指定文字列を用いたレイアウト情報メモリ
の検索が行われる。この文字列は、予め図21に示すよ
うな帳票のレイアウト情報を収集する際に、図1に示す
ようなレイアウト情報4として蓄積格納されている。
【0080】従って、これを検索することによって、対
応する領域を見つける。対応する領域が存在すれば、ス
テップS54に進み、フォーマット情報DBに登録すれ
ばよい。これで登録処理が終了する。その後は、別の項
目についての登録処理に移る。このような方法によれ
ば、極めて信頼性の高い正確なフォーマット情報が容易
に生成できる。
【0081】このように、この具体例ではキー項目DB
の内容を極めて簡略化できる。なお、これまでの具体例
においても、各キー項目DBは、それぞれ一部の情報が
欠落していたとしても、その検索を省略し、フォーマッ
ト情報の生成を行ってよい。フォーマット情報が不完全
であれば、オペレータが修正をし完成させればよいから
である。また、具体例3,4,5等において、イメージ
情報、認識領域、文字情報、認識辞書等のデータを用意
したが、これらは必ずしもキー項目DBに含める必要は
ない。即ち、他の独立した辞書ファイルとして用意して
も差し支えない。もちろん、キー項目DB自体も一体の
データベースである必要はなく、いくつかに分割されて
いて良い。
【0082】また、上記の帳票のイメージデータは、ス
キャナ等から読み取る他、図示しない上位装置等から転
送されるものであってもよい。更に、シートID等によ
って帳票を識別する他、罫線情報等をマッチングするこ
とによってシートの種類を識別することも可能である。
【0083】〈具体例7の効果〉以上の具体例7によれ
ば、認識領域指定文字列を各項目名に対応する認識領域
に記入して、この識別情報を利用したフォーマット情報
生成を行うので、極めて信頼性の高いフォーマット情報
を速やかに生成することができる。
【図面の簡単な説明】
【図1】本発明によるフォーマット情報登録方法の説明
図である。
【図2】本発明によるOCRシステムのブロック図であ
る。
【図3】システムの主要動作フローチャートである。
【図4】フォーマット情報登録処理フローチャートであ
る。
【図5】読取処理の動作フローチャートである。
【図6】フォーマット情報DBの内容説明図である。
【図7】具体例1のキー項目DBの内容説明図である。
【図8】具体例1の動作フローチャートである。
【図9】具体例2のキー項目DBの内容説明図である。
【図10】具体例2の動作フローチャートである。
【図11】具体例3のキー項目DBの内容説明図であ
る。
【図12】具体例3の動作フローチャートである。
【図13】具体例4のキー項目DBの内容説明図であ
る。
【図14】具体例4の動作フローチャートである。
【図15】具体例5のキー項目DBの内容説明図であ
る。
【図16】具体例5の動作フローチャートである。
【図17】フォーマット情報DBの内容説明図である。
【図18】帳票の変形例説明図である。
【図19】具体例6の動作フローチャートである。
【図20】具体例7のキー項目DBの内容説明図であ
る。
【図21】帳票の変形例説明図である。
【図22】具体例7の動作フローチャートである。
【符号の説明】
1 帳票 2 シートID 3 罫線 4 レイアウト情報 5 キー項目DB 6 フォーマット情報

Claims (7)

    (57)【特許請求の範囲】
  1. 【請求項1】 任意の情報を記入した帳票のイメージを
    読み取る画像入力部と、 前記情報を認識して文字コード化する認識部と、 前記帳票に記入される項目名と、その項目に関する情報
    が記入されて文字認識をするための認識領域と項目名と
    の位置関係と、認識領域位置の個数とを表示したキー項
    目データベースと、 前記画像入力部で読み取った、帳票のイメージ中に含ま
    れる罫線で囲まれた領域の座標情報と、その領域に記入
    された文字の認識結果を表示したレイアウト情報とを生
    成するレイアウト解析部と、 前記キー項目データベースとレイアウト情報とを参照す
    ることにより、項目名毎に、対応する認識領域位置の座
    標情報を表示したフォーマット情報を生成する項目探索
    部を備えたことを特徴とするOCRシステム。
  2. 【請求項2】 任意の情報を記入した帳票のイメージを
    読み取って、前記情報を認識して文字コード化するため
    に、予め当該帳票の情報記入位置を表示するフォーマッ
    ト情報を生成する場合に、 前記帳票に記入される項目名と、その項目に関する情報
    が記入されて文字認識をするための認識領域と項目名と
    の位置関係と、認識領域位置の個数とを表示したキー項
    目データベースを予め用意し、 前記帳票のイメージを読み取って、その帳票のイメージ
    中に含まれる罫線で囲まれた領域の座標情報と、その領
    域に記入された文字の認識結果を表示したレイアウト情
    報とを生成し、 前記キー項目データベースとレイアウト情報とを参照す
    ることにより、項目名毎に、対応する認識領域位置の座
    標情報を表示したフォーマット情報を生成することを特
    徴とするフォーマット情報登録方法。
  3. 【請求項3】 任意の情報を記入した帳票のイメージを
    読み取って、前記情報を認識して文字コード化するため
    に、予め当該帳票の情報記入位置を表示するフォーマッ
    ト情報を生成する場合に、 前記帳票に記入される階層構造の項目名と、階層構造か
    ら見て最下位の階層にある項目に関する情報が記入され
    て文字認識をするための認識領域と項目名との位置関係
    と、認識領域位置の個数とを表示したキー項目データベ
    ースを予め用意し、 前記帳票のイメージを読み取って、その帳票のイメージ
    中に含まれる罫線で囲まれた領域の座標情報と、その領
    域に記入された文字の認識結果を表示したレイアウト情
    報とを生成し、 前記キー項目データベースとレイアウト情報とを参照す
    ることにより、前記階層構造の項目名毎に、対応する認
    識領域位置の座標情報を表示したフォーマット情報を生
    成することを特徴とするフォーマット情報登録方法。
  4. 【請求項4】 任意の情報を記入した帳票のイメージを
    読み取って、前記情報を認識して文字コード化するため
    に、予め当該帳票の情報記入位置を表示するフォーマッ
    ト情報を生成する場合に、 前記帳票に記入される項目名と、その項目に関する情報
    が記入されて文字認識をするための認識領域と項目名と
    の位置関係と、認識領域位置の個数と、認識領域に予め
    記入されている一定のイメージ情報を表示したキー項目
    データベースを予め用意し、 前記帳票のイメージを読み取って、その帳票のイメージ
    中に含まれる罫線で囲まれた領域の座標情報と、その領
    域に記入された文字の認識結果を表示したレイアウト情
    報とを生成し、 前記キー項目データベースとレイアウト情報とを参照
    し、かつ、項目名に対応する認識領域と判断した領域中
    に予め記入されているイメージと前記イメージ情報とを
    照合することにより、項目名毎に、対応する認識領域位
    置の座標情報を表示したフォーマット情報を生成するこ
    とを特徴とするフォーマット情報登録方法。
  5. 【請求項5】 任意の情報を記入した帳票のイメージを
    読み取って、前記情報を認識して文字コード化するため
    に、予め当該帳票の情報記入位置を表示するフォーマッ
    ト情報を生成する場合に、 前記帳票に記入される項目名と、その項目に関する情報
    が記入されて文字認識をするための認識領域と項目名と
    の位置関係と、認識領域位置の個数と、認識領域に予め
    記入されている一定の文字情報を表示したキー項目デー
    タベースを予め用意し、 前記帳票のイメージを読み取って、その帳票のイメージ
    中に含まれる罫線で囲まれた領域の座標情報と、その領
    域に記入された文字の認識結果を表示したレイアウト情
    報とを生成し、 前記キー項目データベースとレイアウト情報とを参照
    し、かつ、項目名に対応する認識領域と判断した領域中
    に予め記入されている前記文字と前記文字情報との認識
    結果を照合することにより、項目名毎に、対応する認識
    領域位置の座標情報を表示したフォーマット情報を生成
    することを特徴とするフォーマット情報登録方法。
  6. 【請求項6】 請求項5に記載の方法において、 キー項目データベースには、領域中に予め記入されてい
    る文字を照合するための認識辞書が格納されていること
    を特徴とするフォーマット情報登録方法。
  7. 【請求項7】 任意の情報を記入した帳票のイメージを
    読み取って、前記情報を認識して文字コード化するため
    に、予め当該帳票の情報記入位置を表示するフォーマッ
    ト情報を生成する場合に、 前記帳票に記入される項目名と、その項目に関する情報
    が記入されて文字認識をするための認識領域と項目名と
    の位置関係と、認識領域位置の個数と、前記項目に関す
    る情報が記入されて文字認識をするための認識領域に予
    め記入されている一定の情報を表示したキー項目データ
    ベースを予め用意し、 前記帳票のイメージを読み取って、その帳票のイメージ
    中に含まれる罫線で囲まれた領域の座標情報と、その領
    域に記入された文字の認識結果を表示したレイアウト情
    報とを生成し、 前記キー項目データベースとレイアウト情報とを参照す
    ることにより、項目名毎に、対応する認識領域位置の座
    標情報を表示するとともに、前記認識領域中に予め記入
    されている情報と前記キー項目データベース中の一定の
    情報とが一致した場合に、その判定の確からしさを示す
    重みづけ情報を表示したフォーマット情報を生成するこ
    とを特徴とするフォーマット情報登録方法。
JP24961497A 1997-08-29 1997-08-29 フォーマット情報登録方法及びocrシステム Expired - Fee Related JP3394694B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP24961497A JP3394694B2 (ja) 1997-08-29 1997-08-29 フォーマット情報登録方法及びocrシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24961497A JP3394694B2 (ja) 1997-08-29 1997-08-29 フォーマット情報登録方法及びocrシステム

Publications (2)

Publication Number Publication Date
JPH1173472A JPH1173472A (ja) 1999-03-16
JP3394694B2 true JP3394694B2 (ja) 2003-04-07

Family

ID=17195656

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24961497A Expired - Fee Related JP3394694B2 (ja) 1997-08-29 1997-08-29 フォーマット情報登録方法及びocrシステム

Country Status (1)

Country Link
JP (1) JP3394694B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4900005B2 (ja) * 2007-04-11 2012-03-21 富士ゼロックス株式会社 画像処理装置及びプログラム
JP4983464B2 (ja) * 2007-07-25 2012-07-25 富士ゼロックス株式会社 帳票画像処理装置及び帳票画像処理プログラム
JP5556524B2 (ja) * 2010-09-13 2014-07-23 株式会社リコー 帳票処理装置、帳票処理方法、帳票処理プログラム、及びそのプログラムを記録した記録媒体
JP5003837B2 (ja) * 2011-08-26 2012-08-15 富士ゼロックス株式会社 画像処理装置及びプログラム
JP6148193B2 (ja) * 2014-03-20 2017-06-14 株式会社Pfu 帳票定義作成装置、帳票定義作成方法、および、プログラム
JP6481204B2 (ja) * 2015-11-13 2019-03-13 キヤノンマーケティングジャパン株式会社 情報処理装置と、その処理方法及びプログラム
JP6536542B2 (ja) * 2016-11-17 2019-07-03 キヤノンマーケティングジャパン株式会社 情報処理装置、制御方法、プログラム
KR101959831B1 (ko) * 2017-09-26 2019-03-19 아주대학교산학협력단 이미지 인식 처리 장치 및 방법
WO2021117128A1 (ja) * 2019-12-10 2021-06-17 ネットスマイル株式会社 帳票画像処理システム

Also Published As

Publication number Publication date
JPH1173472A (ja) 1999-03-16

Similar Documents

Publication Publication Date Title
EP1818857B1 (en) Document processor and document processing method
US8270721B2 (en) Method and system for acquiring data from machine-readable documents
US5251273A (en) Data processing system and method for sequentially repairing character recognition errors for scanned images of document forms
US9317484B1 (en) Page-independent multi-field validation in document capture
EP0567834A2 (en) Advanced data capture architecture data processing system and method for scanned images of document forms
US20070168382A1 (en) Document analysis system for integration of paper records into a searchable electronic database
JP2749020B2 (ja) ダイアグラム認識システム
JP2004139484A (ja) 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
JPH0668298A (ja) 文書書式の文字認識及びデータ修復処理のためのデータ処理システム及び方法
JPH11282955A (ja) 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3394694B2 (ja) フォーマット情報登録方法及びocrシステム
CN109726369A (zh) 一种基于标准文献的智能模板化题录技术实现方法
JPH09231291A (ja) 帳票読取方法及びその装置
JP4501459B2 (ja) クロス表作成のためのプログラム及び方法及び装置
JP5134383B2 (ja) Ocr装置、証跡管理装置及び証跡管理システム
JP4160206B2 (ja) 文字認識装置を利用したデータベース登録方法
JP2009087378A (ja) 帳票処理装置
JP2922365B2 (ja) Ocr処理システムにおける漢字住所データ処理方法
JPH0689330A (ja) 画像ファイリングシステム
JP2006244526A (ja) 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
JP2000132635A (ja) 認識データ確認方法
JPH0434655A (ja) 図面読取装置
JPH10198761A (ja) 文字認識方法および文字認識装置
JPH04138583A (ja) 文字認識装置
JPH0612520A (ja) 文字認識装置の確認修正方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090131

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100131

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100131

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110131

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110131

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120131

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130131

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140131

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees