JP3929560B2 - 誤記自動修正方法、読取装置、および誤記自動修正プログラムを記録したコンピュータ読み取り可能な記憶媒体 - Google Patents

誤記自動修正方法、読取装置、および誤記自動修正プログラムを記録したコンピュータ読み取り可能な記憶媒体 Download PDF

Info

Publication number
JP3929560B2
JP3929560B2 JP21996297A JP21996297A JP3929560B2 JP 3929560 B2 JP3929560 B2 JP 3929560B2 JP 21996297 A JP21996297 A JP 21996297A JP 21996297 A JP21996297 A JP 21996297A JP 3929560 B2 JP3929560 B2 JP 3929560B2
Authority
JP
Japan
Prior art keywords
dictionary
character
recognition
information
correction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP21996297A
Other languages
English (en)
Other versions
JPH1153477A (ja
Inventor
秀樹 矢島
一明 竹田
Original Assignee
株式会社日本デジタル研究所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日本デジタル研究所 filed Critical 株式会社日本デジタル研究所
Priority to JP21996297A priority Critical patent/JP3929560B2/ja
Publication of JPH1153477A publication Critical patent/JPH1153477A/ja
Application granted granted Critical
Publication of JP3929560B2 publication Critical patent/JP3929560B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、原稿や帳票等(以下、原稿と記す)のデータ読取/修正技術に関し、特に、データの誤記自動修正方法およびこの方法を用いた読取装置に関する。
【0002】
【従来の技術】
文書や帳票類に記載された文字を読取るデータ読取り装置の一種として光学的文字読取装置(OCR)がある。光学的文字読取装置では、読取原稿(文書や帳票類)を光学的に走査して原稿に記入または印刷された文字等の反射光を得て、光電変換により電気信号を取り出しA/D変換を経てイメージデータを得る。このイメージデータに対し、例えば、パターン認識等による文字認識処理を行ない、記録媒体に認識結果(認識データ)を記録する。
【0003】
このような文字認識装置にあっては、文字の読取りミス、読取った文字の認識誤り(以下、誤認識文字)や不読文字の低減が技術的な課題とされ、様々な手法が開発されてきた。このために、文字の読取りミスおよび不読文字の低減については読取り精度向上のための読取り機構の改善が、誤認識文字の低減については認識率の向上のために認識方法の改善および認識辞書の改善等が計られてきた。
【0004】
しかしながら、読取り精度の改善や認識率の向上をおこなってもやはりある程度の文字の読取りミス、不読文字が生じるという事実と、記入者の誤記や無記入等もあって、完全な自動化は困難であることから、入力後、何等かの方法で読取り結果をチェックし誤りを人手により修正する方法が採用されている。
【0005】
その一例として、記録媒体に記録された認識データを再生して表示装置に表示し、オペレータのチェックを得て、誤認識文字や不読文字或いは誤記や無記入があった場合には正しい文字をキーボード等の入力装置から入力して修正し、記録媒体に記録された認識結果を書換える方式がある。
【0006】
上記方式のうち、個人の文字の特徴に注目して特定の個人の原稿の認識率を高めることを目的とした技術として、特開平2−53833号公報に開示の技術(特許1629229号)がある。この技術は、筆者別にその標準文字特徴(いわゆる、文字癖)をカテゴリ(文字)毎に記憶する個人辞書を改良して当該筆者の原稿読取りの際の認識率を向上させようとするものであり、この技術に基づく文字認識装置は当該筆者の原稿の認識結果を認識修正手段により修正し、認識修正手段により修正されたあとの全ての認識結果を用いて個人辞書を改良するように構成されている。なお、この場合の個人辞書の改良値はカテゴリ毎の文字特徴の増加が生じないよう、修正されたあとの全ての認識結果の平均値(平均文字特徴)を用いている。
【0007】
【発明が解決しようとする課題】
上記文字認識装置によれば、個人別の原稿の認識率を向上させることができるので、通常の標準辞書(汎用辞書)を用いる場合に比べて認識率を高くすることができ、癖のある文字を書く人の原稿も容易に認識できるという利点がある。しかしながら、上記技術によっても前述した問題点、すなわち、認識率をいくら高めても誤記や無記入を低減させることはできないという問題点が依然として残っている。
【0008】
具体的には、ある人の「水」という文字について様々な書き方を認識して個人辞書を改良しても、その人が「水」という文字のつもりで「木」という文字を書いた場合、認識時にはその文字を「木」と認識する。この場合は認識自体は正確に行なわれているので、認識上は誤認識ではなく正しい認識となる。しかし、本来は「水」と書くべきであることから、これは文字認識装置の性能とは掛離れた記入者自身の書き誤り(誤記)となる。誤記の発生はある確率で生じ得るものであり、現状では原稿記入様式の改善の他は記入者自身の注意および原稿記入後のチェックを慎重に行なう以外に誤記率の低減方法はないという問題点があり(要記入の箇所が無記入である場合についても同様である)、入力後の修正処理でオペレータが誤記と思わず見過ごす可能性が高いという問題点もあった。
【0009】
本発明は、原稿や帳票の読取装置において生ずる上記問題点を解消するためになされたものであり、読取った原稿や帳票に誤記があっても自動的に誤記を修正し得る誤記自動修正方法および読取装置の提供を目的とする。
【0010】
【課題を解決するための手段】
上記課題を解決するために、請求項1に記載の誤記自動修正方法は、認識辞書を備え、原稿を読み取って得たイメージデータを認識辞書を用いて認識する読取装置における誤記自動修正方法であって、読取装置は、更に、認識結果から誤記入された文字或いは記号を判定するための文字情報或いは記号情報を含む関連情報を登録した関連辞書と、誤記入と判定された文字或いは記号を修正するための文字情報或いは記号情報を含む誤記情報を登録した誤記修正辞書と、を備え、認識手段が、読取装置で得たイメージデータを認識辞書を用いて認識し、一致度が認識閾値δより大きい所定値φ以上の場合に認識結果に高認識情報を付加するステップ、誤記修正手段が、高認識情報を付加されている認識結果に対応する文字或いは記号からなる文字列に対応する関連情報と関連辞書に登録されている対応の関連情報を比較して上記文字或いは記号の誤記入文字を判別し、誤記入と判別した誤記入文字の特徴と 誤記修正辞書に登録された特徴を照合して一致度が最も高い特徴を有する文字コード或いは記号コードで認識結果を置換するステップ、辞書更新手段が、置換された認識結果がオペレータによる修正入力によって修正されているとき、修正対象の認識結果およびそれに対応するイメージデータの特徴情報で誤記修正辞書を更新すると共に、修正対象の認識結果に対応する文字或いは記号を含む文字列に対応する関連情報で関連辞書を更新するステップ、から構成される。
【0011】
また、請求項2に記載の発明は請求項1に記載の発明の誤記自動修正方法において、更に、辞書更新手段は、置換された認識結果がオペレータによる修正入力によって修正されているときに、修正対象の認識結果およびそれに対応するイメージデータの特徴情報で認識辞書を更新するステップを含む。
【0012】
請求項に記載の発明の読取装置は、原稿上の文字或いは記号を読取って認識辞書を用いて認識する読取装置であって、認識結果から誤記入された文字或いは記号を判定するための文字情報或いは記号情報を含む関連情報を登録した関連辞書と、誤記入と判定された文字或いは記号を修正するための文字情報或いは記号情報を含む誤記情報を登録した誤記修正辞書と、原稿を読取って文字或いは記号のイメージデータを得る読取手段と、認識辞書を用いてイメージデータの認識結果を得て、一致度が認識閾値δより大きい所定値φ以上の場合に認識結果に高認識情報を付加する認識手段と、高認識情報を付加された認識結果に対応する文字或いは記号を含む文字列に対応する関連情報と関連辞書に登録された対応の関連情報を比較して上記文字或いは記号の誤記入文字を判別し、上記誤記入文字の特徴と誤記修正辞書に登録された特徴を照合して一致度が最も高い特徴を有する文字コード或いは記号コードで認識結果を置換する誤記修正手段と、置換された認識結果がオペレータによる修正入力によって修正されているときに、修正対象の認識結果およびそれに対応するイメージデータの特徴情報で誤記修正辞書を更新すると共に、修正対象の認識結果に対応する文字或いは記号を含む文字列に対応する関連情報で関連辞書を更新する辞書更新手段と、を含むことを特徴とする。
また、請求項に記載の発明は請求項に記載の発明の読取装置において、辞書更新手段が、更に、置換された認識結果がオペレータによる修正入力によって修正されているとき、修正対象の認識結果およびそれに対応するイメージデータの特徴情報で認識辞書を更新する手段を含むことを特徴とする。
また、請求項に記載の発明は請求項またはに記載の発明の読取装置において、誤記修正辞書、関連辞書および認識辞書をそれぞれ原稿の発生元毎に自動設定することを特徴とする。
【0013】
請求項に記載の発明のコンピュータ読み取り可能な記録媒体は、原稿を読み取ってイメージデータを得る読取手段と、認識辞書と、認識結果から誤記入された文字或いは記号を判定するための文字情報或いは記号情報を含む関連情報を登録した関連辞書と、誤記入と判定された文字或いは記号を修正するための文字情報或いは記号情報を含む誤記情報を登録した誤記修正辞書と、を備えたコンピュータを、読取装置からのイメージデータを認識辞書を用いて認識し、一致度が認識閾値δより大きい所定値φ以上の場合に認識結果に高認識情報を付加する認識手段、高認識情報を付加されている認識結果に対応する文字或いは記号を含む文字列に対応する関連情報と関連辞書に登録された対応の関連情報を比較して上記文字或いは記号の誤記入文字を判別し、上記誤記入文字の特徴と誤記修正辞書に登録された特徴を照合して一致度が最も高い特徴を有する文字コード或いは記号コードで認識結果を置換する誤記修正手段、置換された認識結果がオペレータによる修正入力によって修正されているときに、修正対象の認識結果およびそれに対応するイメージデータの特徴情報で誤記修正辞書を更新すると共に、修正対象の認識結果に対応する文字或いは記号を含む文字列に対応する関連情報で関連辞書を更新する辞書更新手段、として機能する誤記自動修正プログラムを記録している。
また、請求項に記載の発明は請求項に記載の発明のコンピュータ読み取り可能な記録媒体において、辞書更新手段は、更に、置換された認識結果がオペレータによる修正入力によって修正されているとき、修正対象の認識結果およびそれに対応するイメージデータの特徴情報で認識辞書を更新する手段を含む。
【0014】
【発明の実施の形態】
<文字認識装置のハードウエア構成例>
図1(a)は本発明の誤記自動修正方法を適用し得る読取装置のハードウエア構成例を示すブロック図であり、読取装置100は装置全体の動作を制御すると共に、本発明の誤記自動修正処理等の各処理の実行制御を行なう制御部1と、原稿を光学的に読取って電気信号に変換してイメージデータを得る文字読取部2と、読取られたイメージデータを一時的に記憶する画像メモリー3と、イメージデータを解析して認識辞書を用いて文字認識を行なう認識部4と、認識結果等を記録媒体51に記録する記録装置5と、認識結果等を画面に表示する表示装置6と、修正データの入力や指示の入力を行なう入力装置7と、管理資料等を出力する印刷装置8および認識結果等を外部に送信する場合に用いるインターフェイス9を有している。なお、印刷装置8およびインターフェイス9は付加的装置(オプション)である。
【0015】
制御部1は図1(b)に示すように、CPU11、RAM12、及びROM13を有している。CPU11は、上述の各装置および図示しない電源切換えスイッチ等にバスラインを介して接続し、ROM13に格納されている制御プログラムにより読取装置100全体の制御を行なうと共に、入力装置6からの指示信号に対応して文字読取部の各機能の実行制御、例えば、ROM13内に記録された誤記自動修正手段120の実行による修正モード処理の制御、を行なう。RAM12はデータ或いは処理結果の一時記憶および中間作業領域等に用いられる。ROM13は上述の制御プログラムと誤記自動修正手段120および読取装置100のその他の各機能を実行させるためのプログラムを記録する記録媒体であり、PROM、FROM(フラッシュROM)等が用いられる。なお、これらプログラムをROM13以外のリムーバブルな記録媒体51(例えば、磁気ディスク、光ディスク、或いはフロッピーディスク)に記録するように構成することもできる。
【0016】
文字読取部2は、原稿を光学的に走査するための光学系およびその走査機構と、走査によって得られた反射光を電気信号に変換してデジタルデータ(イメージデータ)を得る信号変換系から構成されている。
【0017】
画像メモリー3はDRAM等の大容量メモリーが用いられ、文字読取部2の出力(イメージデータ)を記録する。記録単位は通常は原稿1枚分であるが複数枚を一時に記憶するように構成してもよい。なお、画像メモリー3の代りにRAM12を用いるように構成することもできる。
【0018】
認識部4は、文字(記号を含む、以下同じ)コードと文字種(カテゴリー)別の特徴抽出データを登録した認識辞書を備え、文字イメージデータを正規化してその特徴を抽出し、認識辞書に登録された特徴と抽出された特徴を照合して得た文字候補のなかから第1順位の文字候補を認識結果として出力する。認識辞書には標準的な文字特徴のほか、後述するようにデータ修正処理時に修正対象とした認識結果の特徴抽出データが登録されている。なお、認識部4は図1ではハードウエア回路として図示してあるが、プログラムで構成してもよい。
【0019】
記録装置5は、光ディスク装置、磁気ディスク装置、またはフロッピーディスク装置等の記録媒体書込/読み出し装置で構成され、光ディスク、磁気ディスク、フロッピーディスク等のリムーバブルな記録媒体51に、認識部4の認識結果、(文字推定手段110の推定結果)、或いは誤記修正手段121による修正結果からなるデータを原稿1枚分づつ格納手段130(図2)によって規定されるフォーマット(図4)で記録する。
【0020】
記録媒体51は上述のデータほか、後述の認識辞書31、誤記修正辞書125および関連辞書126を記録することができる(記録容量が十分であれば物理的に同一でもよく、また、別々でもよい)。
【0021】
表示装置6は表示用画面およびビデオメモリー(VRAM)を有し、文字認識装置100の操作に必要な操作情報(メッセージ)や処理選択用メニュー画面や、データ用入力画面や各種参照表や、編集された帳簿データ等を所定のフォーマットで画面に表示すると共に、記録媒体51から読み出した認識結果(或いは、RAM12に記憶されている認識結果)を表示手段140の規定するフォーマットで表示する。
【0022】
入力装置7はキーボード或いはキーボードおよびマウス等のポインティングデバイスからなり、オペレータによって修正モード時に修正データの入力や読取装置100の操作に必要な指示等が入力される。
【0023】
<処理ブロックの構成例>
図2は、本発明の誤記自動修正方法による読取装置の処理ブロックの構成例を示すブロック図であり、文字認識/修正処理は制御プログラムのほか、制御部1のROM13に記録されている誤記自動修正手段120(図3)等によって行なわれる。
【0024】
図2で、文字読取部2では原稿を光学的に走査し、走査によって得られた反射光を電気信号に変換してイメージデータを得てVRAM3に記憶させる。認識部4は、VRAM3のイメージデータを正規化してその特徴抽出データを得て、認識辞書31に登録された特徴抽出データと抽出した特徴抽出データを照合して認識結果を得て識別データとして、識別情報に「認識」を意味するコードを入れてRAM12に書込む。なお、一致率が認識閾値δより高い所定値φ以上である場合には識別情報(図5(a))に「高認識」を意味するコードを入れてRAM12に書込む。また、一致率が認識閾値δ未満である場合には不読情報(図4(a))および識別情報に不読を意味するコード(例えば’0’)を書込む。
【0025】
文字推定手段110は認識部4で認識不能な文字(不読文字(イメージデータ))について認識部4で抽出された特徴抽出データと類似する認識辞書31に登録された特徴抽出データの文字コード群を抽出し、当該文字コードに対応する文字を推定文字として表示装置6に表示手段140の規定するフォーマットで表示し、オペレータの確認のあったものについて識別データとして、識別情報に「推定」を意味するコードを入れてRAM12に書込む。但し、ここでいう「類似」とは認識部4での認識閾値をδとするとき、δ<ζ<0なるζを認識閾値として新たに設定し、認識不能文字の認識閾値αがδ<α≦ζ の場合をいう。なお、文字推定手段110は付加的構成であり、文字推定手段110による推定処理については本発明の出願人によって平成6年7月20日付けで出願された「帳票類読取装置」(特開平8−30719(特願平6−189829)に詳述されている。
【0026】
誤記修正手段121は誤記自動修正手段120の下部構造(セグメント(図3))であり、誤記データについて関連辞書126および修正規則により誤記と判定された文字について認識部4で抽出された特徴抽出データと誤記修正辞書125に登録された特徴抽出データを照合し、一致度の最も高い文字コードを抽出し、当該文字コードに対応する文字を正解文字とし、識別データの識別情報欄に「自動修正」を意味するコードを書込む(図5(a))。修正規則および誤記修正辞書については後述する(図3、図5、図6、図8)。
【0027】
格納手段130は認識部5の認識結果で誤記と判定されなかった文字、(不読文字のうち文字推定手段110で推定できた文字、)、および誤記修正手段121で認識部5の認識結果(或いは文字推定手段110の推定結果)で誤記と判定され、修正されたデータを所定のフォーマットで記録媒体51に記録する(図4)。
【0028】
表示手段140は、記録媒体51に記録された前回の読取り/認識(自動修正)結果であるデータを原稿1枚分ずつ読み出して修正用の所定のフォーマット(例えば、原稿が帳票ならその帳票様式)に編集して修正画面として表示装置6に表示する。また、表示手段140は読み出したデータをRAM12に一時的に記憶する。なお、表示手段140で修正画面に認識結果と元の入力イメージデータを並列的に表示してもよい。
【0029】
データ修正手段150は表示部6に表示された前回の読取り/認識(自動修正)結果であるデータをオペレータがチェックしながら、誤認識、認識不能文字、(誤推定)、誤記自動修正文字の誤りについて、正しい文字を入力装置7から再入力して修正する修正入力処理手段(図示せず)と、誤記自動修正手段120の下部構造(セグメント(図3))である辞書更新情報作成手段122および辞書更新手段123を含み、辞書更新情報作成手段122は誤記入文字情報(認識データおよび特徴抽出データ、関連文字列)を記録媒体51の誤記データファイルおよび関連文字列ファイル(図6)に、誤認識および誤認識文字情報(それぞれ認識データおよび特徴抽出データ)を誤認識データとして記録媒体51の誤認識データファイル(図6)に記録する(誤記入文字情報、認識文字情報および関連文字列をRAM12に記録するようにしてもよい)。
【0030】
また、辞書更新手段123は全てのデータの修正処理が終了した後(或いは、読取装置100の起動後、データ読取り開始前)に誤認識データ(ファイル)の内容で認識辞書31(図7)を更新し、誤記データ(ファイル)の内容で誤記修正辞書125(図8)を、また、関連文字列ファイルの内容で関連辞書126(図9)を更新する。
【0031】
<誤記自動修正手段の構成例>
図3は誤記自動修正手段120の構成例を示すブロック図であり、誤記自動修正手段120は誤記修正手段121、辞書更新情報作成手段122および辞書更新手段123を含んでいる。誤記修正手段121は、誤記データについて原稿の種類、原稿の発生元、原稿の様式およびコード体系、記入データの位置(すなわち個々の欄毎のデータの種類)、関連辞書126による記入データの前後関係、従来からの記入例等の修正規則により、個々の欄毎の文字列を検査し、誤記の有無を判定する誤記判定手段1211と、誤記と判定された文字列の中の文字の特徴抽出データと誤記修正辞書125に登録された特徴抽出データを照合して正解候補文字の一致度を出力する正解候補文字抽出手段1212と、正解候補文字のうちから一致度の最も高い正解候補文字を正解文字として誤記修正辞書を参照してその正解文字の文字コードを取り出して該当欄のデータ項目に修正後の文字コードとして書込む正解文字判定手段1213とを有している。修正規則の一例として、実施例では、関連辞書126に登録された文字コード列(原稿の項目欄毎に位置、文字数および文字コード列が登録されている)と原稿の該当位置の文字列を比較し、一致している場合には誤記自動修正辞書125を用いて該当の文字(文字コード)を修正するよう構成している。
【0032】
辞書更新情報作成手段122は、データ修正手段150の修正入力処理手段によって修正対象とされた原稿のデータ項目欄を判別してその識別入力した修正データに対応する識別文字が誤記入された文字か、誤認識された文字かを判定する修正原因判定手段1221と、修正データに対応する識別文字が誤記入された文字の場合に誤記データおよび関連文字列データを作成して、記録媒体51の誤記データファイルおよび関連文字列ファイルに書込む誤記データ生成手段1222と、修正データに対応する識別文字が誤認識された文字、(文字推定された文字)、或いは認識不能の文字の場合に誤認識データを作成して、記録媒体51の誤認識データファイルに書込む誤認識データ生成手段1223とを有している。なお、修正原因判定手段1221での修正データに対応する識別文字の誤記入された文字か誤認識された文字かの判定方法の例として、識別文字の認識情報が「高認識」を意味するコードの場合には当該文字を誤記入された文字と判定し、それ以外の識別情報の場合に誤認識された文字と判定するように構成できる。
【0033】
辞書更新手段123はデータ修正手段150によるデータ修正処理が終了した場合に、記録媒体51の誤記データファイルから誤記データを読み出して誤記修正辞書125を更新する誤記修正辞書更新手段1231と、関連データファイルから関連文字列データを読み出して関連辞書126を更新する関連辞書更新手段1232と、記録媒体51の誤認識データファイルから誤認識データを読み出して認識辞書31を更新する認識辞書更新手段1233を有している。また、前述したように、誤記修正辞書125、関連辞書126および認識辞書31の更新を読取装置100の起動後に行なうようにしてもよい。
【0034】
<データおよび辞書の構成例>
(1) 認識データ
図4は認識部4の認識結果(認識データ)の構成例を示す図であり、原稿1枚分を1レコードとして記録媒体51に記録される。図4(a)は認識文字データ書込領域を示し、認識データ410には原稿1枚分毎に原稿(帳票)の種類コード411と、文字の位置(座標)412−1,認識された文字コード413−1,および不読情報414−1からなる1文字分のレコード、・・・、文字の位置(座標)412−n,認識された文字コード413−n,および不読情報414−nからなる1文字分のレコードが格納される。ここで、不読情報414−1〜414−nには特定のコード(例えば、’0’)を与えるように構成する。不読情報414−1〜414−nのいずれかに’0’が書込まれている場合には該当の文字コード欄413−iには特定のコード(例えば、’?’)に該当するコード’0109’が書込まれる。また、図4(b)はイメージデータ領域を示し、認識文字データ書込領域から一定の間隔をおいて、それぞれの文字に対応するイメージデータ421−1〜421−nが格納される。
【0035】
(2) 変換済みデータ
図5は認識部4の認識結果、或いは認識結果に(文字推定処理や)誤記自動修正処理を加えた変換済みデータの構成例を示す図である。変換済みデータ510と同じフォーマットの変換前データが図4の認識データと同時に原稿1枚分ずつRAM12に生成され、(文字推定処理や)誤記自動修正処理のステップを経て変換済みデータ510として記録媒体51に記録される。
【0036】
図5(a)は変換済み文字データ書込領域を示し、原稿1枚分毎に原稿(帳票)の種類コード511と、文字の位置情報(座標)512−1,認識された文字コード513−1,および識別情報514−1からなる1文字分のレコード、・・・、文字の位置情報512−n,認識された文字コード513−n,および識別情報514−nからなる1文字分のレコードが格納される。ここで、識別情報514−1〜514−nに特定のコードを与えることにより文字コードにどのような処理が加えられたかが識別できる。例えば、’0’が書込まれている場合には認識できなかったこと(不読)であったことを意味し、’1’が書込まれている場合には文字コードは認識結果であることを意味し、’2’が書込まれている場合には文字コードは文字推定結果であることを意味し、’3’が書込まれている場合には文字コードは誤記自動修正結果であることを意味するように構成できる。また、図5(b)は認識(或いは推定、誤記自動修正)された文字イメージの特徴抽出データ領域を示し、変換文字データ書込領域から一定の間隔をおいて、それぞれの文字に対応する特徴抽出データ521−1〜521−nが格納される。
【0037】
(3) 辞書更新用データ
図6は認識辞書および誤記自動修正用辞書の更新用データの構成例を示す図であり、辞書更新情報作成手段122によって、図5の変換データにオペレータによって入力装置7から修正が加えられた場合に作成される。辞書更新用データ610には修正された原稿1枚分毎に原稿(帳票)の種類コード611、データ発生元(データ)作成元コード612、誤記データか誤認識データかを区分する区分コード613、修正前文字コード614−1〜614ーm(変換データの文字コード513−1〜513−nの内のm個の修正文字)、修正後文字コード615−1〜615−m(入力装置7からの文字コード)、修正前の特徴抽出データ616−1〜616−m(変換データの特徴抽出データ521−1〜nの内のm個の特徴抽出データ)が格納される。なお、原稿1枚分に誤記文字と誤認識文字がある場合には区分を異にする2種類の辞書更新データ(誤記データと誤認識データ)が作成される。また、作成された辞書更新データ610は修正処理終了後に認識辞書31および誤記修正辞書125を更新する構成の場合にはRAM12に一時的に記憶し、読取装置100の起動後に認識辞書31および誤記修正辞書125を更新する構成の場合には記録媒体51に記憶し、更新終了後にはクリアする。
【0038】
(4) 認識辞書
図7は認識辞書の構成例を示す図であり、認識辞書31はデータ発生元(例えば、会社、事業書所)毎に作成され、文字コード711とその文字コードに対応するイメージデータ(標準イメージデータおよび更新処理によって追加/更新されたイメージデータ)の特徴抽出データ713−1〜713−nからなる辞書レコードが認識文字の数だけ登録されている。認識部4による認識処理が行なわれると使用頻度の順に特徴データの順位が更新される。また、認識辞書31の更新処理が行なわれると辞書更新用データ(誤認識データ)610の修正後文字コード615ーiに一致する認識辞書の文字コード711を有する辞書レコードを辞書更新用データ(誤認識データ)610の特徴修正データ616−iで更新する。この場合、同じ特徴抽出データがある場合にはその使用頻度に1を加え、同じ特徴抽出データがない場合には特徴抽出データを追加する。特徴データを追加する場合、辞書レコードを可変長として逐次追加できるように構成してもよいが、辞書レコードに追加された認識辞書更新用データについてはその使用頻度を比較して使用頻度の低いものを新たな認識辞書更新用データで更新するようにして辞書レコードの増加を防止するように構成してもよい。
【0039】
(5) 誤記修正辞書
図8は誤記修正辞書の構成例を示す図であり、誤記修正辞書125はデータ発生元(例えば、会社、事業書所)毎に作成され、修正前文字コード811と修正後文字コード812および修正前文字コード813に対応するイメージデータの特徴抽出データ813−1〜813−kからなる辞書レコードが登録されている。誤記修正手段121による誤記自動修正処理が行なわれると使用頻度の順に特徴データの順位が更新される。また、誤記修正辞書125の更新処理が行なわれると辞書更新用データ(誤記データ)610の修正後文字コード615−jに一致する誤記修正辞書125の修正後文字コード812を有する辞書レコードを修正辞書更新用データ(誤記データ)610の特徴修正データ616−jで更新する。この場合、同じ特徴抽出データがある場合にはその使用頻度に1を加え、同じ特徴抽出データがない場合には特徴抽出データを追加する。特徴データを追加する場合、辞書レコードを可変長として逐次追加できるように構成してもよいが、辞書レコードに追加された誤記修正更新用データについてはその使用頻度を比較して使用頻度の低いものを新たな誤記自動修正更新用データで更新するようにして辞書レコードの増加を防止するように構成してもよい。
【0040】
(6) 関連文字列データおよび関連辞書
図9は関連文字列データの構成例を示す図であり、関連文字列データ910はオペレータにより誤記の修正入力が行なわれた場合に、修正前の文字を含む項目欄の文字列(文字コード)を登録する。関連文字列データ910には修正された原稿1枚分毎に原稿(帳票)の種類コード911、データ発生元(データ)作成元コード912、項目欄の先頭位置情報913−1、文字数914−1および文字数分の修正前文字コードからなる文字列915−1から先頭位置情報913−h、文字数914−hおよび文字列915−hが格納される。また、作成された関連文字列データ910は修正処理終了後に関連辞書126を更新する構成の場合にはRAM12に一時的に記憶し、読取装置100の起動後に関連辞書126を更新する構成の場合には記録媒体51に記憶し、更新終了後にはクリアする。なお、関連辞書126はデータ発生元(例えば、会社、事業書所)毎に作成され、実施例では関連辞書126の辞書レコードの構成は図9の関連文字列データ910の構成と同様としている。関連辞書126の更新時には、同じ項目欄に同じ文字列コードがある場合にはその使用頻度に1を加え、同じ文字列コードがない場合には関連文字列データを追加する。関連文字列データを追加する場合、実施例では関連辞書領域の容量の許す限り追加可能としたが、関連辞書126に追加された関連文字列データについてはその使用頻度を比較して使用頻度の低いものを新たな関連文字列データで更新するようにして関連辞書レコードの増加を防止するように構成してもよい。
【0041】
【実施例】
以下、本発明の一実施例として上述した読取装置100を用いた会計処理装置について説明する。ここで、会計処理装置200のハードウエア構成は図1に示した読取装置100の構成と同様とし、同じ記号を用いるものとする。なお、会計処理装置200を図1と同じ構成とした場合、文字読取部2として外部装置としての読取装置100を接続するように構成することもできる。
【0042】
図10は会計処理装置200の処理プロセスを示すプロセスフローチャートであり、図10のプロセスP1,P2およびP2’が前述した読取装置100の処理(図2)に相当する。先ず、入/出金伝票、振替え伝票等の入力帳票類は図2に示したように文字読取部2で光学的に読取られてイメージデータとされ、認識部4の認識処理,文字推定手段110による文字推定処理、誤記修正手段121による誤記自動修正処理を経て記録媒体51に記録される(P1)。
【0043】
次に、所望の時期に記録媒体51に記録されたデータを表示装置6に表示して修正処理を施す(P2)。修正処理の終了後か、会計処理装置200の起動時に認識辞書31(図7),誤記修正辞書125(図8)および関連辞書126(図9)が更新される(P2’)。上記P2で修正されたデータ(修正済みデータ)は仕訳データファイルに記録され、また、会計処理に必要な各マスターファイルの更新用データとして用いられる(P3)。所望の時期に上記P3で更新された各会計マスターファイルおよび仕訳データファイルを用いて会計資料を作成する(P4)。
【0044】
図11は本発明の読取装置を用いた会計処理装置(財務処理システム(図では”OCR財務システム”と記されている))の処理開始画面の例であり、メニュー’1’には会計処理装置200による会計入力帳票の一括入力処理が示され、メニュー’2’には一括入力後のデータ修正処理が示されている。
【0045】
図12は入力帳票の例であり、図13は認識処理及び誤記自動修正処理の結果として表示された入力帳票の例であり、図14は会計処理装置200のデータ入力およびデータ修正時の動作例を示すフローチャートである。以下、図1〜図14に基づいて会計処理装置200のデータ入力およびデータ修正時の動作例について説明する。
【0046】
<会計帳票の読取処理>
文字読取部2のスタッカーに読み込み対象の会計帳票をセットし、処理開始画面(図11)のメニュー’1’を選択する(S0)。文字読取部2により1枚単位に会計帳票が読み取られる。図12に示した入力帳票(出金伝票)の例では帳票300に予め印刷された帳票種別コード31と、手書きの、会社コード(相手先コード)32,年月日33,貸方科目コード34,補助欄35,伝票番号36,部門コード欄37,相手科目コード38,39および金額40,41ならびに合計金額42等の入力項目の文字(或いは数値)が光学的に走査され、光電変換により電気信号に変換され、これらの電気信号からイメージデータを得て画像メモリー3に記憶する(S1)。
【0047】
上記S1で得た帳票1枚分のイメージデータに対して認識部4で文字認識処理を行なう。文字認識処理はイメージデータを解析して特徴抽出をおこない、特徴抽出データを得て更新可能な認識辞書31を用いて登録された特徴データ照合を行ない、一致率の最も高いものを認識結果とし、認識閾値δ未満のものを不読文字とする。認識部4はまた、認識結果、特徴抽出データおよびイメージデータを図4に示すような認識データおよび図5に示す変換済みデータと同じフォーマットの変換前データを構成して記録媒体51(またはRAM12)に記録する。
【0048】
この場合、認識データ410の種類コード欄411には会社コード+帳票コードを格納し、文字コード欄413−iには認識結果の文字コードを入れる。なお、不読文字(j個目とする)については不読情報欄414−jに’0’を入れ、文字コード欄413−jには’?’に該当するコード’0109’を入れる。また、変換前データの種類コード欄511には同様に会社コード+帳票コードを格納し、文字位置情報欄512−iにはその文字の位置(座標)を入れ、文字コード欄513−iには認識結果の文字コードを入れる。なお、不読文字(j個目とする)については識別情報欄514−jに’0’を入れ、文字コード欄513−jには’?’に該当するコード’0109’を入れる。また、一致率が認識閾値δ以上の場合には「認識」を意味するコード’2’を入れるが、一致率が認識閾値δより高い所定値φ以上である場合には識別情報(図5(a))に「高認識」を意味するコード’2’を入れる(S2)。
【0049】
誤記修正手段121は入力帳票の各項目毎に項目に書かれた文字列を構成する各文字の認識結果である文字コードを文字列コードとして、関連辞書126に登録された該当項目欄の文字列と比較して一致する場合には誤記と看做し、誤記修正辞書126を用いて該当文字コードを修正する。具体的には、該当文字コードが誤記修正辞書125の修正前文字コード811に一致する場合に該当文字コードを修正後文字コード812で置き換える。この場合(修正された文字をh番目の文字とすると)変換前データの識別情報欄514ーhに「誤記自動修正」を意味するコード’4’を入れる(S3)。
【0050】
上記S3の修正を変換前データを変換後データ610として記録媒体51に記録する。また、関連辞書126に登録された該当項目欄の文字列と比較結果が一致しない場合にも誤記なしと看做し、変換後データ610として記録媒体51に記録する(S4)。
【0051】
上記S4の終了後、全ての帳票の読取処理が終了したか否かを調べ、終了するまでS1に戻って帳票の読取り以下S5までの処理を繰返し、終了した場合には表示装置6に図11に示したようなメニュー画面が表示される。ここで、オペレータがメニュー’2’を選択するとS6以下のデータ修正処理に移行する(S5)。
【0052】
<データ修正処理>
上記S5でオペレータがメニュー’2’を選択するか、所望の時期に新たに会計処理装置200を起動し、図11に示したようなメニュー画面でメニュー’2’を選択すると、表示手段140は記録媒体51に記録された認識データ410および変換済みデータを原稿1枚分ずつ読み出して、それらデータを基に修正用の所定のフォーマットに編集して修正画面として表示装置6に表示する。また、表示手段140は読み出したデータをRAM12に一時的に記憶する(S6)。図13は図12の入力帳票(出金伝票)の読取り結果を帳票形式のまま編集して修正画面として表示した例であり、修正画面には変換済みデータ510および認識データ410を基にした文字列および元の入力文字のイメージからなるイメージ文字列が各項目位置に並列的に表示される。図13の例では、表示項目に表示された文字のうち上欄は認識結果或いは誤記自動修正結果(または文字推定結果)に基づく文字列が表示される。なお、文字列に不読文字或いは誤記修正文字(推定または文字推定)が含まれている場合にはその表示項目或いは文字が強調表示(例えば、表示色の変更や反転表示)する。
【0053】
また、下欄はイメージ文字列である。この場合のイメージデータは認識データ410のイメージデータ421−1〜421−nのいずれかのデータ列が用いられる。
【0054】上記S6で表示された修正画面を見てオペレータがキーボード7から修正データを入力すると、入力結果が該当項目に表示され入力が正しく行なわれたことを確認した後、該当する変換済みデータ510が更新されると共に、認識辞書31および誤記修正辞書の更新用データ610が作成される。この場合、変換済みデータ510の識別情報の値が’2’(高認識)の場合には誤記データとして更新用データ610の区分コード欄613に’2’を入れ、その他の場合には誤認識データとして更新用データ610の区分コード欄613に’1’を入れる。また、変換済みデータ510の識別情報欄514の値が’2’の場合はその文字が属する項目の文字列コードを関連文字列データ910として記録媒体51に記録する(S7)。
【0055】
上記S7のデータ修正処理が全ての認識データ410および変換データ510について終了したか、途中で処理を終了させた場合にはS9に移行し、処理が終了していない場合には終了するまでS6に戻って、S6〜S7を繰返す(S8)。
【0056】
<辞書更新処理>
上記S8でデータ修正処理が終了した場合には、更新用データ610を用いて認識辞書31或いは誤記修正辞書125を更新し、関連文字列データ910を用いて関連辞書126を更新する。ここで、更新用データ610の区分コード欄613が’1’の場合には認識辞書31が更新され、’2’の場合には誤記修正辞書125が更新される。
【0057】
また、図7〜図9では図示されていないが、辞書31,125,126は会社(事務所、個人事業所も含む:以下同じ)毎に作成される。このために更新時或いは新規会社登録時、種類コード611の「会社コード」が用いられる。また、すでに同じデータが登録されている場合には更新頻度により検索優先順位を変更し、同じデータがない場合には辞書レコードとして登録し、全ての更新用データ610および関連文字列データ910による更新処理が終了するまでこの動作を繰返す(S9)。上述したように各辞書31,125,126を会社別に作成するように構成することにより、事業毎に異なる会計コード体系(例えば、勘定科目コード体系)やこれらコード体系に付加的に作成される会社独自のコード等体系間の差を明らかにでき、誤認識の生じやすい文字や誤記の生じやすい文字列について会社毎に決め細かく文字認識および誤記自動修正を行なうことができる。
【0058】
<文字推定処理の付加>
図2の説明で述べたように認識結果として「不読文字」が出力した場合にその文字を推定する文字推定処理を付加することができる。この場合、上記S2とS3の間に文字推定の段階をおいて、S2で認識ができた場合にはS3に移行し、不読文字がある場合には文字推定の段階で文字推定処理を行ない推定文字(i番目の文字とする)があった場合には変換前データ510の識別情報欄514−iに「文字推定」意味するコード’3’を入れるように構成する。
【0059】
以上、本発明の実施例として会計処理装置で会計帳票を読取る場合について説明したが、本発明の読取装置は会計帳票だけでなく、文字および他の帳票の読取りおよび入力データの作成に用いることができることはいうまでもない。
【0060】
【発明の効果】
上記説明したように本発明の誤記自動修正方法および読取装置によれば、データ修正の対象となった文字の修正前文字コードと修正後文字コードをデータ発生元別に誤記修正辞書に登録(更新)すると共に当該文字が含まれる項目の文字列の各文字コードをデータ発生元別に関連辞書に登録(更新)し、誤記自動修正時に、高認識率の文字についてその文字が含まれる項目の認識文字列と関連辞書に登録された文字列を比較し、一致する場合に誤記と判定して誤記修正辞書により修正するので、オペレータが見逃しやすい誤記を自動的に修正することができ、誤記の存在による誤りデータ発生率低減の壁を越して誤りデータ発生率を低減させることができる。また、誤記存在を自動的に判定できるのでオペレータの負荷を低減し得る。
【0061】
また、誤認識データがあった場合には修正対象の文字コードおよび特徴抽出データ等をデータ発生元別に認識辞書に登録(更新)するように構成しているので、認識率の一層の向上が実現するとともに、上記誤記自動修正の効果と相乗して誤りデータ発生率を低減でき、また、オペレータの負荷を一層低減できる。
【0062】
また、本発明を会計処理装置に適用する場合に、認識辞書、誤記修正辞書および関連辞書を会社別(事務所、個人事業所も含む)に作成し、登録(更新)できるように構成したことにより事業毎に異なる会計コード体系(例えば、勘定科目コード体系)やこれらコード体系に付加的に作成される会社独自のコード等体系間の差を明らかにできるので、誤認識の生じやすい文字や誤記の生じやすい文字列について会社毎に決め細かく認識および誤記自動修正を行なうことができる。
【図面の簡単な説明】
【図1】本発明の誤記自動修正方法を適用し得る読取装置のハードウエア構成例を示すブロック図である。
【図2】本発明の誤記自動修正方法による読取装置の処理ブロックの構成例を示すブロック図である。
【図3】誤記自動修正手段の構成例を示すブロック図である。
【図4】認識結果(認識データ)の構成例を示す図である。
【図5】認識結果、或いは認識結果に誤記自動修正処理を加えた変換済みデータの構成例を示す図である。
【図6】認識辞書および誤記修正辞書の更新用データの構成例を示す図である。
【図7】認識辞書の構成例を示す図である。
【図8】誤記修正辞書の構成例を示す図である。
【図9】関連文字列データの構成例を示す図である。
【図10】会計処理装置の処理プロセスを示すプロセスフローチャートである。
【図11】本発明の読取装置を用いた会計処理装置の処理開始画面の例を示す図である。
【図12】入力帳票の例である。
【図13】認識処理及び誤記自動修正処理の結果として表示された入力帳票の例である。
【図14】会計処理装置のデータ入力およびデータ修正時の動作例を示すフローチャートである。
【符号の説明】
2 文字読取部(読取手段)
4 認識部(認識手段)
31 認識辞書
120 誤記自動修正手段(誤記自動修正プログラム)
121 誤記修正手段
123 辞書更新手段
125 誤記修正辞書
126 関連辞書
915−1〜915−h 関連情報
1233 認識辞書更新手段(認識辞書を更新する手段)

Claims (7)

  1. 認識辞書を備え、原稿を読み取って得たイメージデータを認識辞書を用いて認識する読取装置における誤記自動修正方法であって、
    前記読取装置は、更に、認識結果から誤記入された文字或いは記号を判定するための文字情報或いは記号情報を含む関連情報を登録した関連辞書と、誤記入と判定された文字或いは記号を修正するための文字情報或いは記号情報を含む誤記情報を登録した誤記修正辞書と、を備え、
    認識手段が、前記読取装置で得たイメージデータを前記認識辞書を用いて認識し、一致度が認識閾値δより大きい所定値φ以上の場合に前記認識結果に高認識情報を付加するステップ、
    誤記修正手段が、高認識情報を付加されている認識結果に対応する文字或いは記号からなる文字列に対応する関連情報と前記関連辞書に登録されている対応の関連情報を比較し上記文字或いは記号の誤記入文字判別し、誤記入と判別した誤記入文字の特徴と前記 誤記修正辞書に登録された特徴を照合して一致度が最も高い特徴を有する文字コード或いは記号コードで前記認識結果を置換するステップ、
    辞書更新手段が、前記置換された認識結果がオペレータによる修正入力によって修正されているとき、修正対象の認識結果およびそれに対応するイメージデータの特徴情報で誤記修正辞書を更新すると共に、修正対象の認識結果に対応する文字或いは記号を含む文字列に対応する関連情報で関連辞書を更新するステップ、
    から構成される誤記自動修正方法。
  2. 請求項1記載の誤記自動修正方法において、更に、前記辞書更新手段は、前記置換された認識結果がオペレータによる修正入力によって修正されているときに、修正対象の認識結果およびそれに対応するイメージデータの特徴情報で認識辞書を更新するステップを含む誤記自動修正方法。
  3. 原稿上の文字或いは記号を読取って認識辞書を用いて認識する読取装置であって、
    認識結果から誤記入された文字或いは記号を判定するための文字情報或いは記号情報を含む関連情報を登録した関連辞書と、誤記入と判定された文字或いは記号を修正するための文字情報或いは記号情報を含む誤記情報を登録した誤記修正辞書と、
    原稿を読取って文字或いは記号のイメージデータを得る読取手段と、
    認識辞書を用いて前記イメージデータの認識結果を得て、一致度が認識閾値δより大きい所定値φ以上の場合に前記認識結果に高認識情報を付加する認識手段と、
    高認識情報を付加された認識結果に対応する文字或いは記号を含む文字列に対応する関連情報と関連辞書に登録された対応の関連情報を比較して上記文字或いは記号の誤記入文字を判別し、上記誤記入文字の特徴と誤記修正辞書に登録された特徴を照合して一致度が最も高い特徴を有する文字コード或いは記号コードで前記認識結果を置換する誤記修正手段と、
    前記置換された認識結果がオペレータによる修正入力によって修正されているときに、修正対象の認識結果およびそれに対応するイメージデータの特徴情報で誤記修正辞書を更新すると共に、修正対象の認識結果に対応する文字或いは記号を含む文字列に対応する関連情報で関連辞書を更新する辞書更新手段と、
    を含むことを特徴とする読取装置。
  4. 請求項3に記載の読取装置において、辞書更新手段が、更に、前記置換された認識結果がオペレータによる修正入力によって修正されているとき、修正対象の認識結果およびそれに対応するイメージデータの特徴情報で認識辞書を更新する手段を含むことを特徴とする読取装置。
  5. 請求項または4に記載の読取装置において、誤記修正辞書、関連辞書および認識辞書をそれぞれ原稿の発生元毎に自動設定することを特徴とする読取装置。
  6. 原稿を読み取ってイメージデータを得る読取手段と、認識辞書と、認識結果から誤記入された文字或いは記号を判定するための文字情報或いは記号情報を含む関連情報を登録した関連辞書と、誤記入と判定された文字或いは記号を修正するための文字情報或いは記号情報を含む誤記情報を登録した誤記修正辞書と、を備えたコンピュータを、
    前記読取装置からのイメージデータを前記認識辞書を用いて認識し、一致度が認識閾値δより大きい所定値φ以上の場合に前記認識結果に高認識情報を付加する認識手段、
    高認識情報を付加されている認識結果に対応する文字或いは記号を含む文字列に対応する関連情報と関連辞書に登録された対応の関連情報を比較して上記文字或いは記号の誤記入文字判別、上記誤記入文字の特徴と前記誤記修正辞書に登録された特徴を照合し一致度が最も高い特徴を有する文字コード或いは記号コードで前記認識結果を置換する誤記修正手段、
    前記置換された認識結果がオペレータによる修正入力によって修正されているときに、修正対象の認識結果およびそれに対応するイメージデータの特徴情報で誤記修正辞書を更新すると共に、修正対象の認識結果に対応する文字或いは記号を含む文字列に対応する関連情報で関連辞書を更新する辞書更新手段、
    として機能する誤記自動修正プログラムを記録したコンピュータ読み取り可能な記録媒体。
  7. 請求項6に記載のコンピュータ読み取り可能な記録媒体において、前記辞書更新手段は、更に、前記置換された認識結果がオペレータによる修正入力によって修正されているとき、修正対象の認識結果およびそれに対応するイメージデータの特徴情報で前記認識辞書を更新する手段を含む。
JP21996297A 1997-07-31 1997-07-31 誤記自動修正方法、読取装置、および誤記自動修正プログラムを記録したコンピュータ読み取り可能な記憶媒体 Expired - Lifetime JP3929560B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP21996297A JP3929560B2 (ja) 1997-07-31 1997-07-31 誤記自動修正方法、読取装置、および誤記自動修正プログラムを記録したコンピュータ読み取り可能な記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21996297A JP3929560B2 (ja) 1997-07-31 1997-07-31 誤記自動修正方法、読取装置、および誤記自動修正プログラムを記録したコンピュータ読み取り可能な記憶媒体

Publications (2)

Publication Number Publication Date
JPH1153477A JPH1153477A (ja) 1999-02-26
JP3929560B2 true JP3929560B2 (ja) 2007-06-13

Family

ID=16743771

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21996297A Expired - Lifetime JP3929560B2 (ja) 1997-07-31 1997-07-31 誤記自動修正方法、読取装置、および誤記自動修正プログラムを記録したコンピュータ読み取り可能な記憶媒体

Country Status (1)

Country Link
JP (1) JP3929560B2 (ja)

Also Published As

Publication number Publication date
JPH1153477A (ja) 1999-02-26

Similar Documents

Publication Publication Date Title
US6801658B2 (en) Business form handling method and system for carrying out the same
US5251273A (en) Data processing system and method for sequentially repairing character recognition errors for scanned images of document forms
JP3485020B2 (ja) 文字認識方法及び装置ならびに記憶媒体
CN113269101A (zh) 一种票据识别方法、装置和设备
JP5041775B2 (ja) 文字切出方法及び文字認識装置
JP3929560B2 (ja) 誤記自動修正方法、読取装置、および誤記自動修正プログラムを記録したコンピュータ読み取り可能な記憶媒体
Lund Ensemble Methods for Historical Machine-Printed Document Recognition
JP3435374B2 (ja) 文字読取装置および文字認識方法
US20200242387A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
JP2000113100A (ja) 媒体処理方法及び媒体処理装置
JPH10302025A (ja) 手書き文字認識装置およびそのプログラム記録媒体
JP3455643B2 (ja) 文字認識装置における学習辞書の更新方法及び文字認識装置
JPH10134141A (ja) 文書照合装置および方法
TWI807467B (zh) 要項偵測模型建立方法、業務導向要項鍵值辨識系統及方法
JP2000132635A (ja) 認識データ確認方法
JP3355289B2 (ja) 文字データの自動校正方法及び装置
JPH07296102A (ja) データ入力方式
JPH1185899A (ja) 文字読み取り装置、その読み取り方法および記録媒体
JP4261831B2 (ja) 文字認識処理方法、文字認識処理装置、文字認識プログラム
JPH1116020A (ja) 商品券識別方法及び装置
JPH08241314A (ja) 文書ファイリングシステム
JP3790575B2 (ja) 帳簿発行管理装置
JPS63282586A (ja) 文字認識装置
JP2022116983A (ja) 画像処理装置、画像処理方法及びプログラム
CN116630998A (zh) 用于票据格式ocr识别纠正方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20040608

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20040608

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040727

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070307

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130316

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130316

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160316

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term