JP2005266925A - 帳票読取装置、プログラム及び帳票読取装置による帳票読取方法 - Google Patents

帳票読取装置、プログラム及び帳票読取装置による帳票読取方法 Download PDF

Info

Publication number
JP2005266925A
JP2005266925A JP2004074691A JP2004074691A JP2005266925A JP 2005266925 A JP2005266925 A JP 2005266925A JP 2004074691 A JP2004074691 A JP 2004074691A JP 2004074691 A JP2004074691 A JP 2004074691A JP 2005266925 A JP2005266925 A JP 2005266925A
Authority
JP
Japan
Prior art keywords
character
image
recognition
key information
correction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004074691A
Other languages
English (en)
Inventor
Kazuhiko Bando
和彦 坂東
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Solutions Corp filed Critical Toshiba Solutions Corp
Priority to JP2004074691A priority Critical patent/JP2005266925A/ja
Publication of JP2005266925A publication Critical patent/JP2005266925A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

【課題】多くの人が手書きした帳票を高い認識率でかつ高速に処理する。
【解決手段】このOCRシステムのコンピュータ10は、標準的な文字パターンが文字コードに対応して格納された標準文字パターン辞書ファイル36と、帳票1の記入者を特定するキー情報にして、文字認識時に不読とされた文字イメージと補正した際の文字コードとを記憶した補正データ履歴保存ファイル37と、キー情報に対応付けて、文字認識時に誤読とされた文字イメージと修正した際の文字コードとを記憶した修正データ履歴保存ファイル38と、標準文字パターン辞書ファイル36を参照してイメージデータの中から手書き文字とを文字認識し、認識結果の不読あるいは誤読については、キー情報に基づき補正データ履歴保存ファイル37あるいは修正データ履歴保存ファイル38を参照して補正あるいは修正するイメージデータ文字認識部30とを備える。
【選択図】図1

Description

本発明は、例えば帳票を処理する業務に用いられる帳票読取装置、プログラム及び帳票読取方法に関する。
例えば振り込み伝票や申請書類などのさまざまな申請者が手書きした帳票をスキャナーなどのイメージ入力装置で順次スキャンしてコンピュータにイメージデータとして取り込み、コンピュータが、そのイメージデータに対して文字認識処理を行う場合、申請者それぞれの人の癖があるため、100%の文字認識率が得られず、人手による手直しを余儀なくされる。
そこで、文字認識辞書に新たな文字パターンを追加する学習機能を備えたOCR装置がいくつか提案されている(例えば特許文献1参照)。
特開平9−91385号公報
上記先行技術の場合、新たな文字パターンは、学習辞書に常に追加されることから、OCR装置が個人用の場合、特に問題はないものの、多くの人が記入した申請書などの帳票を処理するような業務で用いる場合は、追加しなければならない文字パターンが大量になり学習辞書が肥大化し、文字認識の際の辞書検索に時間がかかるようになるという問題があった。
本発明はこのような課題を解決するためになされたもので、多くの人が手書きした帳票を高い認識率でかつ高速に処理することのできる帳票読取装置、プログラム及び帳票読取装置による帳票読取方法を提供することを目的としている。
上記した課題を解決するために、本発明の帳票読取装置は、帳票に記入された情報のイメージデータを入力する手段と、文字認識用の標準的な文字パターンが文字コードに対応して格納された標準辞書と、前記キー情報に対応付けて、文字認識時に不読あるいは誤読とされた文字イメージを修正または訂正した際の文字コードと対応付けて記憶したユーザー毎の記憶手段と、前記標準辞書を参照し、入力された前記帳票のイメージデータの中の手書き文字を含む読み取り対象の所定の領域を文字認識する文字認識手段と、前記文字認識手段による所定の領域の文字認識で不読とされた文字イメージに対して、前記所定の領域から取得あるいは外部から入力された前記帳票の記入者を特定するキー情報に基づいて該当ユーザーの記憶手段を検索して文字コードを取得する不読文字補正手段と、前記文字認識手段による手書き文字領域の文字認識で文字コードとして認識された文字イメージについて、前記キー情報に基づいて該当ユーザーの記憶手段を検索して合致した文字イメージが存在した場合、当該文字イメージから認識した文字コードを前記記憶手段に記憶されている文字コードと置き換える誤読文字修正手段とを具備したことを特徴とする。
本発明の帳票読取装置は、帳票に記入された情報のイメージデータを入力する手段と、文字認識用の標準的な文字パターンが文字コードに対応して格納された標準辞書と、前記帳票の記入者を特定するキー情報に対応付けて、文字認識時に不読とされた文字イメージを補正した際の文字コードと対応付けて記憶したユーザー毎の補正データ記憶手段と、前記帳票の記入者を特定するキー情報に対応付けて、文字認識時に誤読とされた文字イメージを修正した際の文字コードと対応付けて記憶したユーザー毎の修正データ記憶手段と、前記標準辞書を参照し、入力された前記帳票のイメージデータの中のキー情報領域と手書き文字領域を文字認識する文字認識手段と、前記文字認識手段による手書き文字領域の文字認識で不読とされた文字イメージに対して、前記キー情報領域から得たキー情報に基づいて該当ユーザーの補正データ記憶手段を検索して文字コードを取得する不読文字補正手段と、前記文字認識手段による手書き文字領域の文字認識で文字コードとして認識された文字イメージについて、前記キー情報領域から得たキー情報に基づいて該当ユーザーの修正データ記憶手段を検索して合致した文字イメージが存在した場合、当該文字イメージから認識した文字コードを前記修正データ記憶手段に記憶されている文字コードと置き換える誤読文字修正手段とを具備したことを特徴とする。なお、キー情報は、帳票に記入あるいは印刷されていてもよく、また外部から入力されてもよい。
上記帳票読取装置において、不読文字補正手段により取得された文字コードと文字イメージあるいは誤読文字修正手段により置換された文字コードと文字イメージをキー情報に対応付けて該当ユーザーの記憶手段に記憶する学習手段をさらに備える。
本発明のプログラムは、帳票のイメージデータより帳票に記入された文字を読み取る帳票読取装置に処理を実行させるプログラムにおいて、前記帳票読取装置を、帳票のイメージデータを入力する手段と、文字認識用の標準的な文字パターンが文字コードに対応して格納された標準辞書と、前記キー情報に対応付けて、文字認識時に不読あるいは誤読とされた文字イメージを修正または訂正した際の文字コードと対応付けて記憶したユーザー毎の記憶手段と、前記標準辞書を参照し、入力された前記帳票のイメージデータの中の手書き文字を含む所定の領域を文字認識する文字認識手段と、前記文字認識手段による所定の領域の文字認識で不読とされた文字イメージに対して、前記所定の領域から取得あるいは外部から入力されたキー情報に基づいて該当ユーザーの記憶手段を検索して文字コードを取得する不読文字補正手段と、前記文字認識手段による手書き文字領域の文字認識で文字コードとして認識された文字イメージについて、前記キー情報に基づいて該当ユーザーの記憶手段を検索して合致した文字イメージが存在した場合、当該文字イメージから認識した文字コードを前記記憶手段に記憶されている文字コードと置き換える誤読文字修正手段として機能させることを特徴とする。
本発明の帳票読取方法は、帳票のイメージデータより帳票に記入された文字を認識する文字認識手段を備える帳票読取装置における帳票読取方法において、前記帳票のイメージデータ及びキー情報のうち少なくとも帳票のイメージデータを前記文字認識手段が得るステップと、文字認識用の標準的な文字パターンが文字コードに対応して格納された標準辞書を参照し、得られた前記帳票のイメージデータの中の手書き文字が記載されている所定の領域を前記文字認識手段が文字認識するステップと、所定の領域の文字認識で不読とされた文字イメージに対して、前記所定の領域から取得あるいは外部から入力された前記帳票の記入者を特定するキー情報に基づいて、前記キー情報に対応付けて、文字認識時に不読あるいは誤読とされた文字イメージを修正または訂正した際の文字コードと対応付けて記憶した該当ユーザーの記憶手段を前記文字認識手段が検索して文字コードを取得するステップと、前記文字認識で文字コードとして認識された文字イメージについて、前記キー情報に基づいて、前記文字認識手段が該当ユーザーの記憶手段を検索して合致した文字イメージが存在した場合、当該文字イメージから認識した文字コードを前記記憶手段に記憶されている文字コードと置き換えるステップとを有することを特徴とする。
本発明では、帳票のイメージデータの中の手書き文字を含む所定の領域を文字認識手段が文字認識する際に、所定の領域の文字認識で不読とされた文字イメージに対して、所定の領域から取得あるいは外部から入力された帳票の記入者を特定するキー情報に基づいて、ユーザー毎の記憶手段を検索して文字コードを取得する一方、文字認識で文字コードとして認識された文字イメージについては、キー情報に基づいて、記憶手段を検索して合致した文字イメージが存在した場合、当該文字イメージから認識した文字コードを記憶手段に記憶されている文字コードと置き換えるので、帳票記入者が手書きで記入した帳票より記入者の癖字を正しく認識することができる。この際、キー情報を基に該当ユーザーの記憶手段のみを検索するので、文字コードの読み出しを高速に行なうことができる。また、標準辞書には文字パターンが都度追加されないので、標準辞書が肥大化することがなく、初めの文字認識で辞書検索に時間がかかることがない。
以上説明したように本発明によれば、多くの人が手書きした帳票を高い認識率でかつ高速に処理することができる。
以下、本発明の実施の形態を図面を参照して詳細に説明する。
図1は本発明に係る一つの実施の形態のOCRシステムの構成を示す図である。
同図に示すように、このOCRシステムは、帳票としての帳票1の表面を例えばCCDなどで走査(スキャン)して画像情報(以下イメージデータと称す)を取得(生成)するイメージスキャナー2(以下スキャナー2と称す)と、このスキャナー2に接続され、帳票1から読み取ったイメージデータに対して文字認識処理を行う帳票読取装置としてのコンピュータ10とから構成されている。スキャナー2は、帳票1よりイメージデータを取得してコンピュータ10へ入力するイメージデータ入力手段として機能する。
コンピュータ10は、操作部11、通信I/F12、記憶手段としてのメモリ13、表示部14、ハードディスク装置15、CPU16とを備えている。操作部11は、キーボート、マウスなどのユーザーが操作を行う入力手段である。
メモリ13あるいはハードディスク装置15には、文字を認識するための標準文字パターンからなる標準辞書である標準文字パターン辞書ファイル36と、ユーザー毎に設けられた補正データ履歴保存ファイル37及び修正データ履歴保存ファイル37が記憶されている。補正データ履歴保存ファイル37は、帳票1の記入者を特定するキー情報に対応付けて、文字認識時に不読とされた文字イメージを補正した際の文字コードと文字イメージとを対応付けて記憶した補正データ記憶手段である。修正データ履歴保存ファイル37は、帳票1の記入者を特定するキー情報に対応付けて、文字認識時に誤読とされた文字イメージを修正した際の文字コードと文字イメージとを対応付けて記憶した修正データ記憶手段である。
通信I/F12は、スキャナー2により取得され、スキャナー2から出力されたイメージデータをコンピュータ10に入力するインターフェースであり、例えばSCSI I/FあるいはUSB I/Fなどである。スキャナー2は、帳票1に記入された情報のイメージデータを取得する手段であり、操作部11は、記入者を特定するキー情報の入力手段である。また、通信I/F12は、これらの情報の伝送を行う手段であるが、これら通信I/F12、スキャナー2、操作部11等は、広い意味で、帳票1に記入された情報(申請者が手書きで記入した手書き文字やキー情報)を入力する手段といえる。メモリ13あるいはハードディスク装置15もまた、スキャナー2から受信された帳票1のイメージデータを記憶しておき、それをCPU16(ソフトウェアとしてはイメージデータ文字認識処理部30)が読み出すため、これらに対してはイメージデータを入力する手段といえる。
表示部14は、文字認識処理のための画面、訂正及び修正を行う画面、帳票1の文字認識結果などを表示する。
ハードディスク装置15には、オペレーティングシステム(以下OSと称す)と、CPU16に各部の制御動作を行わせる制御ソフトウェアとがインストールされており、これらが協働して本システムの動作を実現する。動作説明ではコンピュータ起動後のCPU16の動作として説明する。
図2に示すように、帳票1は、例えば申請書などであり、申請書の記入者であるユーザーを特定するためのキー情報が印刷あるいは記入されたキー情報エリア21と、ユーザーが手書きで記入する欄が設けられた手書き文字認識エリア22とを有している。
手書き文字認識エリア22の該当欄には、ユーザーによって、読み取り対象の文字が手書きで記入される。
キー情報エリア21は、帳票1に設けなくてもよく、この場合、オペレータが帳票1の記入者を特定するキー情報をキーボードあるいは他の入力手段を利用して入力するか、あるいは外部のコンピュータより通信線、通信網などを通じて入力する。キー情報エリア21と手書き文字認識エリア22とを所定の領域という。なお、キー情報エリア21と手書き文字認識エリア22は別領域のため、キー情報エリア21を第1の領域、手書き文字認識エリア22を第2の領域といってもよい。
上記制御ソフトウェアとCPU16、メモリ13等により実現されるコンピュータ10の機能構成について説明する。
コンピュータ10は、図3に示すように、補正/訂正情報結果出力部31、イメージデータ文字認識処理部30、補正/訂正処理部34、認識データ記憶部35、標準文字パターン辞書ファイル36、補正データ履歴保存ファイル37、訂正データ履歴保存ファイル38などの機能構成を有している。
補正/訂正情報結果出力部31は、表示部14の画面に表示された文字認識処理の結果をユーザーへの補正/訂正対象データとして変更を促す画面を表示する機能を有しており、ユーザーへの注意喚起を行う。この画面にて確定操作がなされた場合、文字認識処理の結果が確定し、認識された文字コードが所望の出力先(プリンタ、メモリ等)へ出力(印字、記憶)される。
イメージデータ文字認識処理部30は、スキャナー2等のイメージデータ出力装置から通信I/F12を通じて入力されたイメージデータがメモリ13に記憶されると、メモリ13のイメージデータに対して所定の領域(キー情報エリア21、手書き文字認識エリア22:図2参照)のイメージデータを切り出し、切り出したイメージデータをさらに個々の文字パターンとして認識できるように文字単位に切り出して文字イメージとし、その文字イメージ毎に標準文字パターン辞書ファイル36を参照して文字認識処理を行い、文字コードを得る。すなわち、イメージデータ文字認識処理部30は、スキャナー2から入力された帳票1のイメージデータの中からキー情報エリア21と手書き文字認識エリア22とを、メモリ13の標準文字パターン辞書ファイル36を参照して文字認識する文字認識手段として機能する。
イメージデータ文字認識処理部30は、手書き文字認識エリア22の文字認識で「不読」とされた文字イメージに対して、キー情報エリア21から文字認識して得たキー情報に基づいて該当ユーザーの補正データ履歴保存ファイル37を検索して文字コードを取得する不読文字補正手段として機能する。キー情報エリア21のキー情報は、英数字記号などが印字されたものの場合、ほぼ100%の認識率で正して文字を認識できる。
イメージデータ文字認識処理部30は、手書き文字エリア22の文字認識で該当文字コードが検索(認識)された文字イメージについて、キー情報エリア21から取得したキー情報に基づいて修正データ履歴保存ファイル37を検索し、修正データ履歴保存ファイル37に合致した文字イメージが存在した場合、当該文字イメージから認識された認識結果の文字コードを修正データ履歴保存ファイル37に記憶されていた文字コードと置き換える誤読文字修正手段として機能する。
補正/訂正処理部34は、文字認識し表示した文字コードに対してユーザーからの補正/訂正を受け付ける処理部であり、補正/訂正結果を認識データ記憶部35に反映すると同時に、補正データ履歴保存ファイル37及び訂正データ履歴保存ファイル38に補正及び訂正した情報(ユーサーを特定するキー情報に対応させた文字イメージと文字コード)を記憶する。つまり、補正/訂正処理部34は、イメージデータ文字認識処理部30により取得あるいは置換された文字コードと文字イメージ、または、補正あるいは修正された文字コードと文字イメージを、キー情報に対応付けて該当ユーザーの記憶手段(補正データ履歴保存ファイル37、訂正データ履歴保存ファイル38、認識データ記憶部35等)に記憶する学習手段として機能する。
認識データ記憶部35は、イメージデータ文字認識処理部30で標準文字パターン辞書ファイル36及び補正データ履歴保存ファイル37、訂正データ履歴保存ファイル38を用いて認識された結果データを保存しておくメモリの一つの記憶エリアである。
標準文字パターン辞書ファイル36は、イメージデータ文字認識処理部30でイメージデータから文字を認識する場合に参照される辞書ファイルであり、メモリに記憶されている。
補正データ履歴保存ファイル37は、補正/訂正処理部34で認識データ記憶部35のデータに対する補正処理がされた場合に、その補正内容が保存されるメモリあるいはハードディスク装置の一領域である。この補正データ履歴保存ファイル37は、イメージデータ文字認識処理部30でのパターン認識で不読発生時の補完処理用として用いられる辞書であり、ユーザー毎(ユーザーを特定するキー情報毎)に設けられている。
訂正データ履歴保存ファイル38は、補正/訂正処理部34で認識データ記憶部35のデータに対する訂正処理がされた場合に、その訂正内容が保存されるメモリあるいはハードディスク装置の一領域である。この訂正データ履歴保存ファイル38は、ユーザーの癖字等で誤読された文字コードを正しい文字コードに置き換えるための辞書であり、ユーザー毎(ユーザーを特定するキー情報毎)に設けられている。訂正データ履歴保存ファイル38は、イメージデータ文字認識処理部30でのパターン認識で誤読発生時の補完処理用として用いられる。これら補正データ履歴保存ファイル37及び訂正データ履歴保存ファイル38は、キー情報に対応付けて、文字認識時に「不読」あるいは「誤読」とされた文字イメージを修正・訂正した際の文字コードと対応付けて記憶したユーザー毎の記憶手段である。
補正データ履歴保存ファイル37及び訂正データ履歴保存ファイル38は、図4に示すように、補正/訂正データ履歴管理テーブル39を有している。
補正/訂正データ履歴管理テーブル39は、補正データ履歴保存ファイル37及び訂正データ履歴保存ファイル38の内部に設けられているテーブルであり、キー情報、パターン認識データ、文字コード、イメージデータ、出現情報等からなる。
パターン認識データは、文字を認識する上でイメージデータから抽出されるイメージの特徴抽出パターン(文字パターン)であり、標準文字パターン辞書ファイル36で標準的に持つ形態と同じタイプのものである。この文字パターンは、入力されたイメージデータから、イメージデータ文字認識処理部30で抽出編集されたものであり、標準文字パターン辞書ファイル36でマッチングされないパターンの文字イメージに関しての情報のみが、補正処理の場合は補正データ履歴保存ファイル37に、訂正処理の場合は訂正データ履歴保存ファイル38にそれぞれ記憶される。出現情報は、例えば出現回数、出現日時等であり、補正データ履歴保存ファイル37及び訂正データ履歴保存ファイル38に記憶された補正データ/訂正データのメンテナンス用の付加情報として使用される。
図4の例では、帳票1の記入者を特定するキー情報として「001-00001」が登録されている。帳票1から読み取ったイメージデータ(文字イメージ)としては、「τ」という画像が取得されており、この画像からパターン認識した文字イメージがパターン認識データとして「て」という形であったものであり、本来、記入者は、「し」として記入したものであり、オペレータが訂正した文字コードとしては、「し」という文字が記憶されている。出現情報は、このような文字の出現頻度として過去2回あったことが示されている。
すなわち、コンピュータ10は、文字認識用の標準的な文字パターンが文字コードに対応して格納された標準文字パターン辞書ファイル36と、帳票1の記入者を特定するキー情報に対応付けて、文字認識時に不読とされた文字イメージを補正した際の文字コードと対応付けて記憶した補正データ履歴保存ファイル37と、帳票1の記入者を特定するキー情報に対応付けて、文字認識時に誤読とされた文字イメージを修正した際の文字コードと対応付けて記憶した修正データ履歴保存ファイル38と、標準文字パターン辞書ファイル36を参照してイメージデータの中からキー情報と手書き文字とを文字認識するイメージデータ文字認識部30とを備える。
イメージデータ文字認識部30は、文字認識で「不読」とされた手書き文字の文字イメージに対して、文字認識したキー情報に基づいて補正データ履歴保存ファイル37を検索して文字コードを取得する不読文字補正手段として機能する。
イメージデータ文字認識部30は、手書き文字の文字認識で文字コードとして認識(正読)された文字イメージについて、キー情報に基づいて修正データ履歴保存ファイル38を検索して合致した文字イメージが存在した場合、当該文字イメージから認識した文字コードを修正データ履歴保存ファイル38の文字コードと置き換える誤読文字修正手段として機能する。
以下、図5を参照してこのOCRシステムの動作を説明する。
このOCRシステムの場合、スキャナー2の読み取り台に少なくとも一枚の帳票1がセットされ、走査開始の操作が行われると、スキャナー2は、帳票1の表面を走査してイメージデータを生成しコンピュータ10へ送る。
コンピュータ10では、スキャナー2からの帳票1のイメージデータが通信I/F12を通じて受信されると、メモリ13に記憶される。イメージデータ文字認識処理部30は、スキャナー2から受信されメモリ13に記憶された帳票1のイメージデータを読み出し、その中の所定の領域を切り出して、予め用意されている辞書を参照して文字認識処理することで、帳票1のイメージデータをテキストデータに変換してメモリ13に記憶すると共に表示部14に表示する。その後、ユーザーにより操作部11が保存操作あるいは出力操作されると、イメージデータ文字認識処理部30は、メモリ13のテキストデータを該当保存場所である認識データ記憶部35へ保存あるいは該当出力先へ出力する。
ここで、図5のフローチャートを参照してこのOCRシステムの帳票読取処理を詳細に説明する。
帳票1のイメージデータが、スキャナー2から受信されると(S101)、イメージデータ文字認識処理部30は、まず、受信されたイメージデータからキー情報エリア21のイメージを切り出して、それをさらに文字単位のイメージ(以下文字イメージと称す)として切り出し、個々の文字イメージについて標準文字パターン辞書ファイル36を参照して文字認識を行う。このキー情報は、イメージデータとしてではなく、操作部11から外部から入力しても良い。
また、イメージデータ文字認識処理部30は、受信されたイメージデータから手書き文字認識エリア22のイメージを切り出して、それをさらに文字イメージとして切り出し、個々の文字イメージについて標準文字パターン辞書ファイル36を参照して文字認識を行う(S102)。つまり、イメージデータ文字認識処理部30は、帳票1のイメージデータの中の手書き文字が記載されている所定の領域を標準文字パターン辞書ファイル36を参照して文字認識する。
標準文字パターン辞書ファイル36には、文字認識用の標準的な文字パターンが文字コードに対応して格納されているので、イメージデータ文字認識処理部30は、この標準文字パターン辞書ファイル36の文字パターンと文字イメージとを比較してパターンがほぼ一致あるいは近似する文字パターンに対応する文字コードを文字認識結果として標準文字パターン辞書ファイル36から読み出す。
なお、イメージデータ文字認識処理部30は、文字認識を行った結果、標準文字パターン辞書ファイル36に格納されている文字パターンと相違する(近似しない)文字イメージについては「不読」とし(S103の不読)、例えば「?」などの文字コードを文字認識結果として読み出す。
手書き文字認識エリア22より切り出したすべての文字イメージについて文字認識を行った結果、「?」などの文字コードが読み出され、「不読」とされた文字イメージについて、イメージデータ文字認識処理部30は、キー情報をキーにして該当ユーザーの補正データ履歴保存ファイル37を検索し、上記文字認識処理と同様に文字パターンと比較してほぼ一致あるいは近似する文字パターンに対応する文字コードを読み出し、初めの文字認識で「?」などの文字コードとされたものを、補正データ履歴保存ファイル37から読み出した文字コードに置き換える(S104)。この処理を補完認識処理という。
続いて、イメージデータ文字認識処理部30は、初めの文字認識と第1補完処理で文字コードとして認識(正読)した文字イメージについて、キー情報エリア21から文字認識して得たキー情報あるいは入力されたキー情報に基づいて、該当ユーザーの修正データ履歴保存ファイル38を検索して、上記同様にパターン認識を行う(S105)。
このパターン認識の結果、合致する文字イメージが存在した場合(S106のYes)、イメージデータ文字認識処理部30は、今までに補完した文字コードを修正データ履歴保存ファイル38から読み出した文字コードに置き換える(S107)。
つまり、イメージデータ文字認識処理部30は、修正データ履歴保存ファイル38を検索して合致した文字イメージが存在した場合、当該文字イメージから認識した文字コードを修正データ履歴保存ファイル38に記憶されている文字コードと置き換える。
このようにして文字認識した文字コードの列は、表示部14に文字認識結果の画面として表示される。この画面には、訂正が必要かどうか、必要がなければ確定操作するようメッセージが表示され、ユーザー(この場合、オペレータ)に次の操作を促す。
ここで、オペレータにより、表示された認識結果の文字コードが訂正あるいは修正され、確定操作が行われた場合、補正/訂正処理部34は、訂正あるいは修正された文字コードを、補正/訂正データ履歴管理テーブル39にキー情報及び文字パターンと共に記憶すると共に、変更した文字コードを含む認識データ、つまりテキストデータを認識データ記憶部35に記憶する。
既に認識データ記憶部35に記憶した認識データに対しては、補正/訂正処理部34が補正/訂正処理を実施する。
この場合、補正/訂正処理部34は、補正/訂正画面を表示する。この補正/訂正画面で、変更対象の認識データ記憶部35を指定すると、画面に該当認識データが表示される。
ここで、操作部11より補正/訂正情報が入力されると、補正/訂正処理部34は、操作部11から入力された補正/訂正情報を基に認識データ記憶部35の認識データを修正する。この際、補正/訂正履歴管理テーブル39のレコードフォーマットに従い、補正情報は補正データ履歴保存ファイル37に記憶され、また訂正情報は訂正データ履歴保存ファイル38に記憶される。
また、補正データ履歴保存ファイル37及び訂正データ履歴保存ファイル38には、このとき処理した補正/訂正情報だけでなく、過去の履歴が記憶されている。
修正後、補正/訂正処理部34は、帳票1に文字を記入したユーザー(イメージデータの元となったデータを作成した記入者)に関する情報(キー情報と修正した文字コード、文字イメージなど)を補正/訂正情報結果出力部31に出力することで、補正/訂正情報結果出力部31は、入力されたユーザーに関する情報を印刷するので、印刷物をユーザーに見せることで、ユーザーへ注意喚起を促すことができる。
さらに、ユーザーに関する情報をまとめて取り出す機能を補正/訂正処理部34に持たせることで、標準文字パターン辞書ファイル36のメンテナンス用情報として活用することができる。
このようにこの実施形態のOCRシステムによれば、イメージデータから文字認識を行う場合、通常の標準文字パターン辞書ファイル36(標準辞書)だけではなく、そのイメージデータの元となった文字を帳票1に記入したユーザーのキー情報をキーにして、過去に認識処理し補正/訂正したユーザー毎の学習辞書(補正データ履歴保存ファイル37及び訂正データ履歴保存ファイル38)を使用して、標準辞書で認識した文字コードについて補完認識することで、文字認識率を向上することができる。つまり、イメージデータの文字認識を実施する場合、固定の文字パターン辞書のみを使用してパターン認識するのではなく、イメージデータを作成したユーザー毎の情報を持つことで、筆跡の特徴などにフレキシブルに対応することができ、認識性能を向上させることが可能となる。これにより帳票1の読取処理を行うオペレータの事務効率をアップ、つまり補正/訂正処理作業を軽減することができる。イメージデータの文字認識を実施する場合に、認識補完データとして補正データ履歴保存ファイル37と訂正データ履歴保存ファイル38を利用するが、このときキー情報を基に特定のユーザーのデータのみを検索の対象とすることで文字認識処理の時間を最小限にすることができる。
また、補正/訂正処理時に、補正/訂正した情報に加え、過去補正/訂正した情報を補正/訂正情報結果・出力部31より出力し、イメージデータの元となったデータを作成したユーザーへの注意喚起として渡し、次回以降のデータ入力(文字データ作成)時に留意させることで、補正データ履歴ファイル37及び訂正データ履歴ファイル38の使用を極力回避させ、処理速度の向上に寄与する等の貢献が期待できる。
さらに、これら補正データ履歴保存ファイル37及び訂正データ履歴保存ファイル38のデータを一括して出力することで、これらの情報を標準文字パターン辞書ファイル36をメンテナンスする場合の基礎情報として活用でき、標準文字パターン辞書ファイル36を作成するメーカーの認識率向上のための基礎データとして活用できる。
そして、補正データ履歴保存ファイル37及び訂正データ履歴保存ファイル38の管理情報としての補正/訂正データ履歴管理テーブル39に出現情報(出現回数/出現日時)を持たせ、該当ユーザーが記入した帳票1に対する文字認識処理を行なう際や大量の帳票1の一括処理を行なう際に、システム管理者が条件を設定することによって、使用していない情報を補正データ履歴保存ファイル37及び訂正データ履歴保存ファイル38から自動的に削除する機能を備えることで、これらの履歴保存ファイル(データ領域)が無尽蔵に拡張することを抑えることができ、これにより、システム資源の使用量を抑制できる。
補正/訂正処理時の情報に過去の補正/訂正データを加え、ユーザー単位に注意喚起情報として渡すことで、次回以降の認識率向上を促すことが可能となる。
補正/訂正情報を外部ハードディスク装置や書き込み型光ディスク等の記録媒体に保管することで、標準文字パターン辞書ファイル36をリメイクする場合の基礎情報とすることが可能となる。
なお、本発明は上記実施形態に限定されるものではない。
補正/訂正データ履歴管理テーブル39の情報を用いて統計を取る機能を備えることで、将来的なシステム拡張(容量拡張やCPU性能アップ等)のための情報を提供し、システム管理者へのシステム保全作業へも貢献することができる。具体的には、補正/訂正データ履歴管理ファイル39の各レコードに出現情報を持たせ、各レコードの保存対象条件を別途指定することで、そのレコードの自動メンテナンスを実施することができ、システム管理者へのシステム維持における作業負荷を軽減させ、システムメンテナンスの利便性に貢献できる。
また、上記出現情報を統計的にまとめて出力する機能を備えることで、システム資源の増減推移が把握でき、システム管理者へのシステム資源に対する予算確保等のシステム維持管理作業に対するサポートが可能となる。
OCRシステムの構成を示す図。 図1のOCRシステムに用いられる帳票を示す図。 コンピュータの機能構成を示す図。 補正/訂正データ履歴管理テーブルを示す図。 図1のOCRシステムの動作を示すフローチャート。
符号の説明
1…帳票、2…スキャナー、10…コンピュータ、11…操作部、12…通信I/F、14…表示部、15…ハードディスク装置、16…CPU、31…補正/訂正情報・結果出力部、34…補正/訂正処理部、35…認識データ記憶部、36…標準文字パターン辞書ファイル、37…補正データ履歴保存ファイル、38…訂正データ履歴保存ファイル、39…補正/訂正データ履歴管理テーブル。

Claims (5)

  1. 帳票に記入された情報のイメージデータを入力する手段と、
    文字認識用の標準的な文字パターンが文字コードに対応して格納された標準辞書と、
    前記キー情報に対応付けて、文字認識時に不読あるいは誤読とされた文字イメージを修正または訂正した際の文字コードと対応付けて記憶したユーザー毎の記憶手段と、
    前記標準辞書を参照し、入力された前記帳票のイメージデータの中の手書き文字を含む読み取り対象の所定の領域を文字認識する文字認識手段と、
    前記文字認識手段による所定の領域の文字認識で不読とされた文字イメージに対して、前記所定の領域から取得あるいは外部から入力された前記帳票の記入者を特定するキー情報に基づいて該当ユーザーの記憶手段を検索して文字コードを取得する不読文字補正手段と、
    前記文字認識手段による手書き文字領域の文字認識で文字コードとして認識された文字イメージについて、前記キー情報に基づいて該当ユーザーの記憶手段を検索して合致した文字イメージが存在した場合、当該文字イメージから認識した文字コードを前記記憶手段に記憶されている文字コードと置き換える誤読文字修正手段と
    を具備したことを特徴とする帳票読取装置。
  2. 帳票に記入された情報のイメージデータを入力する手段と、
    文字認識用の標準的な文字パターンが文字コードに対応して格納された標準辞書と、
    前記帳票の記入者を特定するキー情報に対応付けて、文字認識時に不読とされた文字イメージを補正した際の文字コードと対応付けて記憶したユーザー毎の補正データ記憶手段と、
    前記帳票の記入者を特定するキー情報に対応付けて、文字認識時に誤読とされた文字イメージを修正した際の文字コードと対応付けて記憶したユーザー毎の修正データ記憶手段と、
    前記標準辞書を参照し、入力された前記帳票のイメージデータの中のキー情報領域と手書き文字領域を文字認識する文字認識手段と、
    前記文字認識手段による手書き文字領域の文字認識で不読とされた文字イメージに対して、前記キー情報領域から得たキー情報に基づいて該当ユーザーの補正データ記憶手段を検索して文字コードを取得する不読文字補正手段と、
    前記文字認識手段による手書き文字領域の文字認識で文字コードとして認識された文字イメージについて、前記キー情報領域から得たキー情報に基づいて該当ユーザーの修正データ記憶手段を検索して合致した文字イメージが存在した場合、当該文字イメージから認識した文字コードを前記修正データ記憶手段に記憶されている文字コードと置き換える誤読文字修正手段と
    を具備したことを特徴とする帳票読取装置。
  3. 前記不読文字補正手段により取得された文字コードと文字イメージあるいは前記誤読文字修正手段により置換された文字コードと文字イメージをキー情報に対応付けて該当ユーザーの記憶手段に記憶する学習手段をさらに具備したことを特徴とする請求項1、2いずれか記載の帳票読取装置。
  4. 帳票のイメージデータより帳票に記入された文字を読み取る帳票読取装置に処理を実行させるプログラムにおいて、
    前記帳票読取装置を、
    帳票に記入された情報のイメージデータを入力する手段と、
    文字認識用の標準的な文字パターンが文字コードに対応して格納された標準辞書と、
    前記キー情報に対応付けて、文字認識時に不読あるいは誤読とされた文字イメージを修正または訂正した際の文字コードと対応付けて記憶したユーザー毎の記憶手段と、
    前記標準辞書を参照し、入力された前記帳票のイメージデータの中の手書き文字を含む読み取り対象の所定の領域を文字認識する文字認識手段と、
    前記文字認識手段による所定の領域の文字認識で不読とされた文字イメージに対して、前記所定の領域から取得あるいは外部から入力された前記帳票の記入者を特定するキー情報に基づいて前記記憶手段を検索して文字コードを取得する不読文字補正手段と、
    前記文字認識手段による手書き文字領域の文字認識で文字コードとして認識された文字イメージについて、前記キー情報に基づいて該当ユーザーの記憶手段を検索して合致した文字イメージが存在した場合、当該文字イメージから認識した文字コードを前記記憶手段に記憶されている文字コードと置き換える誤読文字修正手段
    として機能させることを特徴とするプログラム。
  5. 帳票のイメージデータより帳票に記入された文字を認識する文字認識手段を備える帳票読取装置における帳票読取方法において、
    前記帳票のイメージデータを前記文字認識手段が得るステップと、
    文字認識用の標準的な文字パターンが文字コードに対応して格納された標準辞書を参照し、得られた前記帳票のイメージデータの中の手書き文字を含む読み取り対象の所定の領域を前記文字認識手段が文字認識するステップと、
    所定の領域の文字認識で不読とされた文字イメージに対して、前記所定の領域から取得あるいは外部から入力された前記帳票の記入者を特定するキー情報に基づいて、前記キー情報に対応付けて、文字認識時に不読あるいは誤読とされた文字イメージを修正または訂正した際の文字コードと対応付けて記憶した該当ユーザーの記憶手段を前記文字認識手段が検索して文字コードを取得するステップと、
    前記文字認識で文字コードとして認識された文字イメージについて、前記キー情報に基づいて、前記文字認識手段が該当ユーザーの記憶手段を検索して合致した文字イメージが存在した場合、当該文字イメージから認識した文字コードを前記記憶手段に記憶されている文字コードと置き換えるステップと
    を有することを特徴とする帳票読取方法。
JP2004074691A 2004-03-16 2004-03-16 帳票読取装置、プログラム及び帳票読取装置による帳票読取方法 Withdrawn JP2005266925A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004074691A JP2005266925A (ja) 2004-03-16 2004-03-16 帳票読取装置、プログラム及び帳票読取装置による帳票読取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004074691A JP2005266925A (ja) 2004-03-16 2004-03-16 帳票読取装置、プログラム及び帳票読取装置による帳票読取方法

Publications (1)

Publication Number Publication Date
JP2005266925A true JP2005266925A (ja) 2005-09-29

Family

ID=35091447

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004074691A Withdrawn JP2005266925A (ja) 2004-03-16 2004-03-16 帳票読取装置、プログラム及び帳票読取装置による帳票読取方法

Country Status (1)

Country Link
JP (1) JP2005266925A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100742582B1 (ko) * 2005-12-28 2007-08-02 후지쯔 가부시끼가이샤 매체 처리 장치, 매체 처리 방법, 매체 처리 시스템 및매체 처리 프로그램을 기록한 컴퓨터 판독 가능한 기록매체
EP1973061A2 (en) 2007-03-15 2008-09-24 NEC Corporation Character recognition system, character recognition method and automated mail sorting system
JP2017162033A (ja) * 2016-03-07 2017-09-14 キヤノン株式会社 情報処理装置及びその制御方法及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100742582B1 (ko) * 2005-12-28 2007-08-02 후지쯔 가부시끼가이샤 매체 처리 장치, 매체 처리 방법, 매체 처리 시스템 및매체 처리 프로그램을 기록한 컴퓨터 판독 가능한 기록매체
EP1973061A2 (en) 2007-03-15 2008-09-24 NEC Corporation Character recognition system, character recognition method and automated mail sorting system
JP2017162033A (ja) * 2016-03-07 2017-09-14 キヤノン株式会社 情報処理装置及びその制御方法及びプログラム

Similar Documents

Publication Publication Date Title
EP1995686B1 (en) Document processing device and document processing method
JPH03161873A (ja) データベース構築機能を有する電子フアイリング装置
US20090002742A1 (en) Image input/output apparatus and image input/output method
TW201714124A (zh) 文件管理系統及其方法
JP2003209643A (ja) 画像処理装置
JP4020924B2 (ja) イメージ処理装置
JP7268389B2 (ja) 情報処理装置及びプログラム
JP7379876B2 (ja) 文字認識装置、文書ファイル生成方法、文書ファイル生成プログラム
JP2004013813A (ja) 情報管理システムおよび情報管理方法
US10638001B2 (en) Information processing apparatus for performing optical character recognition (OCR) processing on image data and converting image data to document data
JP2007306228A (ja) 電子文書の処理方法、電子文書処理装置、および電子文書を管理、印刷するためのプログラム
JP2005266925A (ja) 帳票読取装置、プログラム及び帳票読取装置による帳票読取方法
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JP4673542B2 (ja) 書類引継装置、書類引継システム及び書類引継方法
JP7271987B2 (ja) 情報処理装置及びプログラム
JP4589599B2 (ja) キーワード付与装置、キーワード付与システムおよびプログラム
JP6983673B2 (ja) 画像通信装置、制御方法、およびプログラム
JP2003154774A (ja) 名刺、名刺出力装置、名刺入力装置、名刺出力プログラムおよび名刺入力プログラム
JP3770812B2 (ja) 金融機関用の営業店端末装置
JP2005327151A (ja) 文書管理装置および文書管理プログラム
JP4130429B2 (ja) 文字読取装置
JP4645349B2 (ja) 情報処理装置およびプログラム
JP7364998B2 (ja) 文書分類システムおよび文書分類プログラム
JP4592447B2 (ja) 画像データファイリングシステム
JP2662404B2 (ja) 光学文字読取装置における辞書作成方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070605