JP2005284927A - 媒体処理装置,媒体処理方法,媒体画像処理装置,媒体画像処理プログラムおよび帳票 - Google Patents

媒体処理装置,媒体処理方法,媒体画像処理装置,媒体画像処理プログラムおよび帳票 Download PDF

Info

Publication number
JP2005284927A
JP2005284927A JP2004100449A JP2004100449A JP2005284927A JP 2005284927 A JP2005284927 A JP 2005284927A JP 2004100449 A JP2004100449 A JP 2004100449A JP 2004100449 A JP2004100449 A JP 2004100449A JP 2005284927 A JP2005284927 A JP 2005284927A
Authority
JP
Japan
Prior art keywords
character recognition
character
recognition position
unit
medium
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004100449A
Other languages
English (en)
Other versions
JP4594638B2 (ja
Inventor
Shinichi Eguchi
真一 江口
Katsutoshi Obara
勝利 小原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Fujitsu Frontech Ltd
Original Assignee
Fujitsu Ltd
Fujitsu Frontech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd, Fujitsu Frontech Ltd filed Critical Fujitsu Ltd
Priority to JP2004100449A priority Critical patent/JP4594638B2/ja
Publication of JP2005284927A publication Critical patent/JP2005284927A/ja
Application granted granted Critical
Publication of JP4594638B2 publication Critical patent/JP4594638B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

【課題】 媒体上に記載された文字の文字認識のための定義体やその認識結果の画面表示のための定義体等をインストールする必要がなく、且つ高精度に文字認識を行なう。
【解決手段】認識対象の文字を記載されるとともに文字認識位置情報と文字属性情報と文字認識位置補正情報と画面表示制御情報とを印刷された媒体から媒体画像を読み取る媒体画像読取部7と、文字認識位置情報抽出部8と、文字属性情報抽出部8と、文字認識位置補正情報抽出部9と、画面表示制御情報抽出部17と、文字認識位置仮決定部11と、文字認識位置決定部12と、文字認識部13と、文字認識結果を表示部15に表示する表示制御部14とをそなえて構成する。
【選択図】 図1

Description

本発明は、例えば金融機関における帳票処理に関し、OCR(Optical Character Recognition)装置等のイメージ読取装置による帳票に記載された文字の認識に用いて好適な、媒体処理装置,媒体処理方法,媒体画像処理装置,媒体画像処理プログラムおよび帳票に関する。
金融機関等においては、帳票に記載された文字情報をイメージデータとして読み取ってから文字認識する装置として、光学文字読取装置(OCR(Optical Character Recognition)装置)等のイメージ読取装置が用いられ、このOCR装置を用いることにより業務の効率化を図っている。
さて、OCR装置においては、例えば下記特許文献1に示すように、予め、読み取りを行なう帳票について、定義体作成ツール等を使用して帳票読取定義体を作成し、文字認識を行なうすべての装置に対して、作成した帳票読取定義体をインストールしている。この帳票読取定義体は、OCR装置によって読み取られる帳票のフォーマット等を定義するものであり、例えば、帳票のサイズ,読み取り行数,位置,字種,文字数等の帳票に記載された文字を文字認識するために用いられる情報によって構成される。
また、OCR装置においては、帳票の文字認識結果をその表示画面に表示させるために、表示画面上での位置や表示属性を定義する画面表示定義体が予め作成され、OCR装置にインストールされている。
さらに、OCR装置にそなえられたスキャナによって帳票を読み取って作成された帳票画像においては、伸縮や傾き等が生じることが多い。OCR装置においては、このような帳票画像における伸縮や傾きによる影響を無くすための補正処理を実行するための機能を、そのアプリケーションプログラムに実装している。
OCR装置においては、予めOCR装置にインストールされた帳票読取定義体や補正処理機能に従って、帳票の画像を読み取って取得した帳票画像から文字画像を抽出し、この抽出した文字画像に対して文字認識が行なわれるようになっている。このような文字認識の結果は、OCR装置のディスプレイに表示され、オペレータはこの表示装置に表示された文字認識結果を確認(検証)する。
また、OCR装置においては、このような文字認識結果をディスプレイに表示するために、ディスプレイ上に認識結果の文字を表示させる位置や表示属性等を定義する画面表示定義体が予め作成され、OCR装置毎にインストールされている。
さらに、OCR装置においては、文字認識結果を用いて金額プルーフチェックを行なったり、複数枚帳票を1ロットとして扱うための制御を行なったりすることもあり、これらの機能を予めOCR装置のアプリケーションに実装しておき、特定の帳票に対してこれらのデータ処理を実行する場合もある。
特開平08−171596号公報
しかしながら、従来のOCR装置においては、認識対象の帳票に対応させて上述の如き各種定義体や補正処理機能を作成・開発するとともに、文字認識を行なうOCR装置に、これらの各種定義体や補正処理機能をインストールする必要があり、これらの開発やインストール,テスト等の作業が繁雑であるという課題がある。
特に、文字認識を行なう(認識対象の)帳票種類が複数ある場合には、これらの帳票毎に前述した各種定義体や補正処理機能の作成・開発および各OCR装置へのインストール(実装)作業を行なう必要があり煩雑であり、OCR装置の数や帳票種類が多くなる程、各種定義体等のインストール作業に要する工数が多くなる。又、帳票が変更(改訂)されると、その度に、上述した各種定義体等を変更してOCR装置に再度インストールする必要がある。
また、このような帳票の改訂がある場合には、帳票の流通にタイミングを合わせてOCR装置毎に各種定義体等の入替えを行なう必要があったり、又、帳票の切り替え時には一時的に新旧の2種類の帳票が混在したりする等、業務が煩雑になる。
本発明は、このような課題に鑑み創案されたもので、媒体上に記載された文字の文字認識のための定義体やその認識結果の画面表示のための定義体等をインストールする必要がなく、且つ高精度に文字認識を行なうことができる、媒体処理装置,媒体処理方法,媒体画像処理装置,媒体画像処理プログラムおよび帳票を提供することを目的とする。
このため、本発明の媒体処理装置(請求項1)は、媒体上に記載された文字を文字認識し、その文字認識結果を表示部に表示する媒体処理装置であって、認識対象の文字を記載されるとともに文字認識位置情報と文字属性情報と文字認識位置補正情報と画面表示制御情報とを印刷された媒体から媒体画像を読み取る媒体画像読取部と、該媒体画像読取部によって読み取られた該媒体画像に基づいて該文字認識位置情報を抽出する文字認識位置情報抽出部と、該媒体画像読取部によって読み取られた該媒体画像に基づいて該文字属性情報を抽出する文字属性情報抽出部と、該媒体画像読取部によって読み取られた該媒体画像に基づいて該文字認識位置補正情報を抽出する文字認識位置補正情報抽出部と、該媒体画像読取部によって読み取られた該媒体画像に基づいて該画面表示制御情報を抽出する画面表示制御情報抽出部と、該書式情報抽出部によって抽出された該文字認識位置情報に基づいて、該媒体における該文字の認識位置を仮決定する文字認識位置仮決定部と、該文字認識位置補正情報抽出部によって抽出された該文字認識位置補正情報に基づいて、該文字認識位置仮決定部によって仮決定された前記文字の認識位置を補正して該文字認識位置を決定する文字認識位置決定部と、該媒体画像と、該文字位置決定部によって決定された該文字認識位置と、該文字属性情報抽出部によって抽出された該文字属性情報とに基づいて、該媒体画像における該文字認識位置の文字について文字認識を行なう文字認識部と、該画面表示制御情報抽出部によって抽出された該画面表示制御情報に基づいて、該文字認識部によって行なった文字認識結果を該表示部に表示する表示制御部とをそなえることを特徴としている。
また、本発明の媒体処理方法(請求項2)は、媒体上に記載された文字を文字認識し、その文字認識結果を表示部に表示する媒体処理方法であって、認識対象の文字を記載されるとともに文字認識位置情報と文字属性情報と文字認識位置補正情報と画面表示制御情報とを印刷された媒体から媒体画像を読み取る媒体画像読取ステップと、該媒体画像読取ステップにおいて読み取られた該媒体画像に基づいて該文字認識位置情報を抽出する文字認識位置情報抽出ステップと、該媒体画像読取ステップにおいて読み取られた該媒体画像に基づいて該文字属性情報を抽出する文字属性情報抽出ステップと、該媒体画像読取ステップにおいて読み取られた該媒体画像に基づいて該文字認識位置補正情報を抽出する文字認識位置補正情報抽出ステップと、該媒体画像読取ステップにおいて読み取られた該媒体画像に基づいて該画面表示制御情報を抽出する画面表示制御情報抽出ステップと、該書式情報抽出ステップにおいて抽出された該文字認識位置情報に基づいて、該媒体における該文字の認識位置を仮決定する文字認識位置仮決定ステップと、該文字認識位置補正情報抽出ステップにおいて抽出された該文字認識位置補正情報に基づいて、該文字認識位置仮決定ステップにおいて仮決定された前記文字の認識位置を補正して該文字認識位置を決定する文字認識位置決定ステップと、該媒体画像と、該文字位置決定ステップにおいて決定された該文字認識位置と、該文字属性情報抽出ステップにおいて抽出された該文字属性情報とに基づいて、該媒体画像における該文字認識位置の文字について文字認識を行なう文字認識ステップと、該画面表示制御情報抽出ステップにおいて抽出された該画面表示制御情報に基づいて、該文字認識ステップにおいて行なった文字認識結果を該表示部に表示する表示制御ステップとをそなえることを特徴としている。
さらに、本発明の媒体画像処理装置(請求項3)は、認識対象の文字を記載されるとともに文字認識位置情報と文字属性情報と文字認識位置補正情報と画面表示制御情報とを印刷された媒体から読み取った媒体画像に基づいて、該文字を文字認識し、その文字認識結果を表示部に表示する媒体画像処理装置であって、該媒体画像に基づいて該文字認識位置情報を抽出する文字認識位置情報抽出部と、該媒体画像に基づいて該文字属性情報を抽出する文字属性情報抽出部と、該媒体画像に基づいて該文字認識位置補正情報を抽出する文字認識位置補正情報抽出部と、該媒体画像に基づいて該画面表示制御情報を抽出する画面表示制御情報抽出部と、該書式情報抽出部によって抽出された該文字認識位置情報に基づいて、該媒体における該文字の認識位置を仮決定する文字認識位置仮決定部と、該文字認識位置補正情報抽出部によって抽出された該文字認識位置補正情報に基づいて、該文字認識位置仮決定部によって仮決定された前記文字の認識位置を補正して該文字認識位置を決定する文字認識位置決定部と、該媒体画像と、該文字位置決定部によって決定された該文字認識位置と、該文字属性情報抽出部によって抽出された該文字属性情報とに基づいて、該媒体画像における該文字認識位置の文字について文字認識を行なう文字認識部と、該画面表示制御情報抽出部によって抽出された該画面表示制御情報に基づいて、該文字認識部によって行なった文字認識結果を該表示部に表示する表示制御部とをそなえることを特徴としている。
また、本発明の媒体画像処理プログラム(請求項4)は、認識対象の文字を記載されるとともに文字認識位置情報と文字属性情報と文字認識位置補正情報と画面表示制御情報とを印刷された媒体から読み取った媒体画像に基づいて、該文字を文字認識し、その文字認識結果を表示部に表示する媒体処理機能をコンピュータに実行させるための媒体画像処理プログラムであって、該媒体画像に基づいて該文字認識位置情報を抽出する文字認識位置情報抽出部と、該媒体画像に基づいて該文字属性情報を抽出する文字属性情報抽出部と、該媒体画像に基づいて該文字認識位置補正情報を抽出する文字認識位置補正情報抽出部と、該媒体画像に基づいて該画面表示制御情報を抽出する画面表示制御情報抽出部と、該書式情報抽出部によって抽出された該文字認識位置情報に基づいて、該媒体における該文字の認識位置を仮決定する文字認識位置仮決定部と、該文字認識位置補正情報抽出部によって抽出された該文字認識位置補正情報に基づいて、該文字認識位置仮決定部によって仮決定された前記文字の認識位置を補正して該文字認識位置を決定する文字認識位置決定部と、該媒体画像と、該文字位置決定部によって決定された該文字認識位置と、該文字属性情報抽出部によって抽出された該文字属性情報とに基づいて、該媒体画像における該文字認識位置の文字について文字認識を行なう文字認識部と、該画面表示制御情報抽出部によって抽出された該画面表示制御情報に基づいて、該文字認識部によって行なった文字認識結果を該表示部に表示する表示制御部部として、該コンピュータを機能させることを特徴としている。
さらに、本発明の帳票(請求項5)は、文字を記入可能な文字記入領域をそなえる帳票であって、該文字記入領域の位置を示す文字認識位置情報と、該文字記入領域に記入される該文字の属性に関する属性情報を示す文字属性情報と、当該帳票を画像読取装置によって読み取って作成される帳票画像における、該文字記入領域の位置に関する補正情報を示す文字認識位置補正情報と、該帳票画像に基づいて該文字について文字認識した結果を表示装置に表示させるための制御情報を示す画面表示制御情報とをそなえることを特徴としている。
本発明の媒体処理装置,媒体処理方法,媒体画像処理装置,媒体画像処理プログラムおよび帳票によれば、以下の効果ないし利点が得られる。
(1)文字認識位置情報や文字属性情報,文字認識位置補正情報,エントリ制御情報を予め媒体処理装置もしくは媒体画像処理装置に設定(インストール)する必要がなく、これにより、媒体処理装置もしくは媒体画像処理装置が複数台ある場合や、帳票(媒体)種類が多数ある場合においても、個々の媒体処理装置もしくは媒体画像処理装置に対する作業を軽減することができ利便性が高い(請求項1〜請求項5)。
(2)帳票(媒体)の書式が変更される場合においても、帳票において文字認識位置情報や、文字属性情報,文字認識位置補正情報,画面表示制御情報,エントリ制御情報等を変更するだけでよく、媒体処理装置もしくは媒体画像処理装置において種々の定義体等のインストール作業を行なう必要がなく利便性が高い(請求項1〜請求項5)。
(3)表示制御部が、帳票上に印刷された画面表示制御情報に基づいて文字認識結果を表示部に表示させるので、媒体処理装置もしくは媒体画像処理装置において文字認識結果を表示部に表示させるための調整等を予め行なう必要がなく利便性が高い(請求項1〜請求項5)。
(4)帳票の作成時に、帳票上における各項目の配置位置の情報に合わせて画面表示制御情報を作成し帳票上に印刷することができるので、人的要因による定義誤差を無くすことができ、より正確な書式情報を作成することもできる。
(5)エントリ制御部が帳票上に印刷されたエントリ制御情報に基づいて、文字認識された文字に対して種々のデータ処理を行なうので、帳票毎にデータ処理を確実に行なうことができ利便性が高い。
以下、図面を参照して本発明の実施の形態を説明する。
図1は本発明の一実施形態としてのOCR装置の構成を模式的に示す図、図2はそのOCR装置によって読み取られる帳票の例を示す図である。
本発明の一実施形態としてのOCR装置(媒体処理装置,媒体画像処理装置)1は、例えば金融機関で用いられる帳票(媒体)を読み取り、その所定の項目に記載された文字を認識するものである。
本OCR装置1によって読み取られる帳票20は、図2に示すように、文字記入部21と書式情報印刷部22とをそなえて構成され、文字記入部21に形成された、帳票ID記入領域21a,名前記入領域21b,連絡先記入領域21cおよび帳票通番記入領域21dに任意の文字が記入されるようになっている。なお、以下、これらの帳票ID記入領域21a,名前記入領域21b,連絡先記入領域21cおよび帳票通番記入領域21dを文字記入領域もしくは項目という場合もある。
そして、これらの文字記入領域に記載された文字は本OCR装置1にそなえられたイメージリーダ7(後述)によって読み取られ、その文字画像に基づいて文字認識が行なわれるようになっている。なお、図2に示す例においては、顧客によって、その名前や連絡先の電話番号を名前記入領域21bや連絡先記入領域21cに記入された帳票20を示している。
ここで、帳票ID記入領域21aは、帳票の種別を特定するための帳票IDが記入される領域であり、例えば帳票毎に定められた4桁の数字が予め印刷されるようになっている。名前記入領域21bは顧客の名前を記入するための領域であり、連絡先記入領域21cは顧客の連絡先の電話番号を記入するための領域であり、これらの名前や連絡先電話番号は顧客等によって記入されるようになっている。帳票通番記入領域21dは、帳票の通番が記入される領域である。この通番は、その帳票が何枚綴り(帳票群)の何番目のものであるかを示す情報であり、図2に示す例においては、2枚からなる帳票群のうちの1枚目を示している。
また、この帳票20において、帳票ID記入領域21a,名前記入領域21b,連絡先記入領域21cおよび帳票通番記入領域21dの各位置は予め決められており、図2に示す例においては、帳票20の左上部分を基準とする場合に、帳票ID記入領域21aは、その左上角部が座標(20,20)に、又、その右下角部が座標(40,40)に位置するように配置されている。同様に、名前記入領域21bは、その左上角部が座標(100,50)に、又、その右下角部が座標(500,100)に位置するように配置され、連絡先記入領域21cは、その左上角部が座標(100,100)に、又、その右下角部が座標(500,150)に位置するように配置され、更に、帳票通番記入領域21dは、その左上角部が座標(480,20)に、又、その右下角部が座標(520,40)に位置するように配置されている。
書式情報印刷部22には、文字記入部21における各文字記入領域に記入された文字の文字認識を行なうためにOCR装置1が用いる種々の書式情報が予め印刷されている。本実施形態においては、これらの書式情報はJAN形式のバーコードによって印刷されており、図2に示すように、項目数バーコード221,項目番号バーコード222−1〜222−4,帳票ID左上認識座標バーコード223−1,名前左上認識座標バーコード223−2,連絡先左上認識座標バーコード223−3,帳票左上認識座標バーコード223−4,帳票ID右下認識座標バーコード224−1,名前右下認識座標バーコード224−2,連絡先右下認識座標バーコード224−3,帳票通番右下認識座標バーコード224−4,帳票IDカテゴリ/桁数バーコード225−1,名前カテゴリ/桁数バーコード225−2,連絡先カテゴリ/桁数バーコード225−3,帳票通番カテゴリ/桁数バーコード225−4,帳票ID画面表示情報バーコード226−1,名前画面表示情報バーコード226−2,連絡先画面表示情報バーコード226−3,帳票通番画面表示情報バーコード226−4,座標補正情報バーコード227およびエントリ制御情報バーコード228a,228bが印刷されている。
なお、図2に示す例においては、便宜上、各バーコードの上方にそのバーコードによって示される情報を文字で表わしているが、これに限定されるものではなく、帳票20上においてこれらのバーコードを説明するための文字はなくてもよい。
また、以下、便宜上、帳票ID左上認識座標バーコード223−1,名前左上認識座標バーコード223−2,連絡先左上認識座標バーコード223−3,帳票左上認識座標バーコード223−4をまとめて左上認識座標バーコード223と称する場合がある。同様に、以下、帳票ID右下認識座標バーコード224−1,名前右下認識座標バーコード224−2,連絡先右下認識座標バーコード224−3および帳票通番右下認識座標バーコード224−4をまとめて右下認識座標バーコード224と、又、帳票IDカテゴリ/桁数バーコード225−1,名前カテゴリ/桁数バーコード225−2,連絡先カテゴリ/桁数バーコード225−3および帳票通番カテゴリ/桁数バーコード225−4をまとめてカテゴリ/桁数バーコード225と、更に、帳票ID画面表示情報バーコード226−1,名前画面表示情報バーコード226−2,連絡先画面表示情報バーコード226−3および帳票通番画面表示情報バーコード226−4をまとめて画面表示情報バーコード226と、又、エントリ制御情報バーコード228aおよびエントリ制御情報バーコード228bをまとめてエントリ制御情報バーコード228と称する場合がある。
図3(a),(b),図4(a),(b),図5(a),(b),図6(a),(b),図7(a),(b),図8(a),(b),図9(a),(b),図10(a),(b)および図11(a),(b)はそれぞれ本発明の一実施形態としてのOCR装置1によって読み取られる帳票20に印刷されるバーコードの例を説明するための図である。
帳票20の書式情報印刷部22に印刷される各バーコードにおいては、それらの先頭桁によって当該バーコードの種類を示すようになっており、本実施形態においては、バーコードの先頭桁が“1”の場合には「項目数」を、“2”の場合には「項目番号」を、“3”の場合には「文字認識項目の左上角座標」を、“4”の場合には「文字認識項目の右下角座標」を、“5”の場合には「文字認識項目の認識カテゴリおよび認識桁数」を、“6”の場合には「画面表示位置」を、“8”の場合には「座標補正の処理方法」を、“9”の場合には「画面エントリの制御方法」を、それぞれ示すようになっている。
項目数バーコード221は、文字記入部21において文字認識を行なう箇所(項目)の数(項目数)を示すものであり、図3(a),(b)に示すように、項目数バーコードであることを示す情報((1)部参照),リザーブ((2)部参照),項目数を示す情報((3)部参照)およびチェックデジット((4)部参照)をそなえて構成されている。なお、図3(a)に示す例においては、(3)部において“0004”を設定することにより項目数が4であることを示している。
項目番号バーコード221−1〜222−4は、文字記入部21に形成された文字記入領域(項目)を特定するものであり、図4(a),(b)に示すように、項目番号バーコードであることを示す情報((1)部参照),項目番号を示す情報((2)部参照),リザーブ((3)部参照)およびチェックデジット((4)部参照)をそなえて構成されている。
本実施形態においては、予め、帳票ID記入領域21aに項目番号1が、名前記入領域21bに項目番号2が、連絡先記入領域21cに項目番号3が、帳票通番記入領域21dに項目番号4がそれぞれ設定されており、(2)部においてこれらの項目番号を設定することにより任意の項目を特定することができる。
左上認識座標バーコード223(223−1〜223−4)は、文字記入部21における各文字記入領域の左上角部の座標を示すことによりその位置を特定するものであり、図5(a),(b)に示すように、項目の左上座標バーコード(左上角座標バーコード)であることを示す情報((1)部参照),項目番号を示す情報((2)部参照),X座標を示す情報((3)部参照),Y座標を示す情報((4)部参照)およびチェックデジット((5)部参照)をそなえて構成されている。なお、図5(a)に示す例においては、項目番号1である帳票ID記入領域21aの左上角の座標が、(20,20)であることを示している。
右下認識座標バーコード224(224−1〜224−4)は、文字記入部21における各文字記入領域の右下角部の座標を示すことによりその位置を特定するものであり、図6(a),(b)に示すように、項目の右下座標バーコード(右下角座標バーコード)であることを示す情報((1)部参照),項目番号を示す情報((2)部参照),X座標を示す情報((3)部参照),Y座標を示す情報((4)部参照)およびチェックデジット((5)部参照)をそなえて構成されている。なお、図6(a)に示す例においては、項目番号1である帳票ID記入領域21aの右下角の座標が、(40,40)であることを示している。
そして、上述した左上認識座標バーコード223(223−1〜223−4)および右下認識座標バーコード224(224−1〜224−4)が、それぞれ文字記入領域の位置を示す文字認識位置情報として機能するようになっている。
カテゴリ/桁数バーコード225(225−1〜225−4)は、文字記入部21における各文字記入領域に記入される文字に記入される文字の属性に関する文字属性情報を示すものであり、図7(a),(b)に示すように、項目の認識カテゴリ/桁数バーコードであることを示す情報((1)部参照),項目番号を示す情報((2)部参照),認識カテゴリ/桁数を示す情報((3)部参照),認識桁数を示す情報((4)部参照)およびチェックデジット((5)部参照)をそなえて構成されている。
ここで、認識カテゴリとは、文字種類(カテゴリ)を示すものであり、例えば、図7(b)に示すように、(3)部分を構成する複数桁(本実施形態では5桁)にそれぞれ漢字,カナ,記号,英字,数字を予め対応付けておき、各桁において“1”が設定されている文字種類を有効とする。図7(a)に示す例においては、項目番号1である帳票ID記入領域21aには、4桁の「数字」が記入されることを示している。
画面表示情報バーコード226(226−1〜226−4)は、その帳票20をイメージリーダ7(後述)によって読み取って作成される帳票画像に基づいて文字認識を行なった結果をディスプレイ15(後述)に表示させるための制御情報である画面表示制御情報を示すものであり、図8(a),(b)に示すように、項目の画面表示情報バーコードであることを示す情報((1)部参照),項目番号を示す情報((2)部参照),画面表示情報を示す情報((3)部参照)およびチェックデジット((4)部参照)をそなえて構成されている。
ここで、画面表示情報とは、その項目にかかる文字認識結果をディスプレイ15にどのように表示するかを示すものであり、例えば、「帳票上の座標で画面に表示させる」等を指定することができる。図8(a)に示す例においては、項目番号1である帳票ID記入領域21aの文字認識結果をディスプレイ15上に帳票上の座標で表示させることを示している。
座標補正情報バーコード(文字認識位置補正情報)227は、その帳票をイメージリーダ7によって読み取って作成される帳票画像における、文字記入領域の位置に関する補正情報であり、図9(a),(b)に示すように、項目の座標補正情報バーコード(座標補正処理情報バーコード)であることを示す情報((1)部参照),項目番号を示す情報((2)部参照),原点位置を示す情報((3)部参照),斜行補正の有無を示す情報((4)部参照),伸縮補正の有無を示す情報((5)部参照),リザーブ((6)部参照)およびチェックデジット((7)部参照)をそなえて構成されている。
ここで、原点位置は補正の際の基準となる原点の位置を示すものであり、例えば、特定の項目番号を設定することにより、その項目の位置(左上座標や右下座標等)を原点として指定するようになっている。図9(a)に示す例においては、帳票ID記入領域21aの座標を原点としており、各項目についての認識項目位置(座標)を帳票ID記入領域21aの座標からの相対座標で表わすようになっている。又、斜行補正の有無や伸縮補正について、例えば“1”を設定することにより、これらの補正を行なうことを示す。
エントリ制御情報バーコード228a,228bは、それぞれ文字認識した結果に対するデータ処理に関する情報であって、図10(a),(b),図11(a),(b)に示すように、エントリ制御情報バーコードであることを示す情報((1)部参照),処理種別を示す情報((2)部参照),項目番号を示す情報((3)部参照),処理詳細を示す情報((4)部参照),リザーブ((5)部参照)およびチェックデジット((6)部参照)をそなえて構成されている。
例えば、図10(a),(b)に示すエントリ制御情報バーコード228aは、複数枚の帳票からなる連続帳票についての処理方法を指定するものであり、この図10(a)に示す例においては、OCR装置1はこの帳票20について、複数枚処理(処理種別“1”)を行ない、帳票通番記入領域21dに記載された帳票通番に基づいて、通番で括られた帳票群を連続処理する(処理詳細“1”)ことを示す。
また、図11(a),(b)に示すエントリ制御情報バーコード228bは、この帳票20にかかる文字認識結果についての確認処理(プルーフチェック)の方法を指定するものであり、この図11(a)に示す例においては、OCR装置1による文字認識の結果をパート社員が入力して社員がその確認を行なうフローを定義している。具体的には、処理種別“9”によってワークフローが選択されることを示すとともに、項目番号“1”により「入力」が、又、処理詳細“5”により「確認」がそれぞれ選択されることを示す。
本OCR装置(媒体処理装置,画像処理装置)1は、図1に示すように、イメージリーダ7,メモリ31,ハードディスク32,ディスプレイ15,キーボート34,マウス35およびCPU(Central Processing Unit)30をそなえたコンピュータシステム(情報処理装置)として構成され、CPU30が、メモリ31やハードディスク32に保存されたプログラム(媒体処理プログラム,媒体画像処理プログラム)を実行することにより機能するようになっている。
イメージリーダ(媒体画像読取部)7は帳票20の画像を帳票画像(媒体画像)として読み取るものであり、イメージ読取処理部3はこのイメージリーダ7の制御を行なうものであって、例えば、帳票画像の読み取りの実行指示等を行なうものである。
ハードディスク32は、イメージリーダ7によって読み取られた帳票20のイメージデータを保存したり、前述したプログラムを保存したりするものである。このハードディスク32には、書式情報抽出処理部8(後述)によって抽出された文字認識位置情報や文字属性情報を格納するための書式情報格納領域321や、文字認識処理部13(後述)によって文字認識された結果を格納するための認識結果格納領域322が形成されている。
また、このハードディスク32には、後述するエントリ制御処理部16によって実行されるアプリケーションプログラムであって、本OCR装置1で実行され得る複数のデータ処理のためのアプリケーションプログラムを、帳票20の種類(例えば帳票ID)等に対応させてライブラリやデータベース等の形式で予め保存されている。
メモリ31は、CPU30が種々の処理を行なう際に、データを展開したり一時的に格納したりするものであり、又、このメモリ31に前述したプログラムを保存してもよい。更に、このメモリ31には、書式情報抽出処理部8によって抽出された文字認識位置情報や文字属性情報を格納するための書式情報格納領域311や、文字認識処理部13によって文字認識された結果を格納するための認識結果格納領域312が形成されている。
ディスプレイ(表示部)15は、帳票の画像や文字認識の結果,オペレータが用いる操作画面等を表示するものであり、キーボード34やマウス35はオペレータが種々の操作・入力を行なうものである。
CPU30は種々の演算処理を行なうものであり、図1に示すように、制御部2,イメージ読取処理部3,情報抽出処理部4,文字認識制御部5,画面制御部6,書式情報抽出処理部(文字認識位置情報抽出部,文字属性情報抽出部)8,文字認識位置補正情報抽出処理部(文字認識位置補正情報抽出部)9,エントリ制御情報抽出処理部(エントリ制御情報抽出部)10,文字認識位置仮決定処理部(文字認識位置仮決定部)11,文字認識位置決定処理部(文字認識位置決定部)12,文字認識処理部(文字認識部)13,画面表示処理部(表示制御部)14,エントリ制御処理部16および画面表示制御情報抽出処理部(画面表示制御情報抽出)17として機能するようになっている。
制御部2は上述した、イメージ読取処理部3,情報抽出処理部4,文字認識制御部5,画面制御部6およびエントリ制御処理部16を制御することにより、全体の処理を管理するものである。
情報抽出処理部4は、書式情報抽出処理部8,文字認識位置補正情報抽出処理部9,エントリ制御情報抽出処理部10および画面表示制御情報抽出処理部17を制御して、イメージリーダ7によって読み取られた帳票画像から、帳票の書式情報印刷部22に印刷された書式情報を取得・抽出するものである。
書式情報抽出処理部(文字認識位置情報抽出部,文字属性情報抽出部)8は、イメージリーダ7によって読み取られた帳票画像における、書式情報印刷部22に印刷された左上認識座標バーコード223および右下認識座標バーコード224から文字記入部21における各文字記入領域の座標(文字認識位置情報)を抽出・取得するとともに、カテゴリ/桁数バーコード225から各文字記入領域に記入される文字に記入される文字の属性に関する属性情報(文字種類,桁数)を抽出・取得するものである。
すなわち、書式情報抽出処理部8は、イメージリーダ7によって読み取られた帳票画像に基づいて文字認識位置情報や文字属性情報を抽出するようになっている。なお、この書式情報抽出処理部8によって抽出された文字認識位置情報や文字属性情報は、ハードディスク32に形成された書式情報格納領域321や、メモリ31に形成された書式情報格納領域311に格納されるようになっている。
文字認識位置補正情報抽出処理部(文字認識位置補正情報抽出部)9は、イメージリーダ7によって読み取られた帳票画像における、書式情報印刷部22に印刷された座標補正情報バーコード227から、文字記入領域の位置に関する補正情報(原点,斜行補正の有無,伸縮補正の有無等)を抽出・取得するものである。すなわち、この文字認識位置補正情報抽出処理部9は、イメージリーダ7によって読み取られた帳票画像に基づいて文字認識位置補正情報を抽出するようになっている。
画面表示制御情報抽出処理部(画面表示制御情報抽出部)17は、イメージリーダ7によって読み取られた帳票画像における、書式情報印刷部22に印刷された画面表示情報バーコード226から、文字認識結果をディスプレイ15にどのように表示するかを示す画面表示制御情報を抽出・取得するものである。すなわち、画面表示制御情報抽出処理部17は、イメージリーダ7によって読み取られた帳票画像に基づいて画面表示制御情報を抽出するようになっている。
エントリ制御情報抽出処理部(エントリ制御情報抽出部)10は、イメージリーダ7によって読み取られた帳票画像における、書式情報印刷部22に印刷されたエントリ制御情報バーコード228a,228bから、文字認識制御部5(後述)による文字認識結果に対するデータ処理に関する情報(連続帳票についての処理方法やプルーフチェック方法等;以下、エントリ制御情報という場合がある)を抽出・取得するものである。すなわち、エントリ制御情報抽出処理部10は、イメージリーダ7によって読み取られた帳票画像に基づいてエントリ制御情報を抽出するようになっている。
文字認識制御部5は、文字認識位置仮決定処理部11,文字認識位置決定処理部12および文字認識処理部13を制御して、情報抽出処理部4によって取得された書式情報に基づいて、イメージリーダ7によって読み取られた帳票画像から、文字記入部21に記入された文字についての文字認識を行なうものである。
文字認識位置仮決定処理部(文字認識位置仮決定部)11は、書式情報抽出処理部8によって抽出された、文字記入部21における各文字記入領域の座標(文字認識位置情報)に基づいて、文字認識を行なう項目の位置を仮決定するものである。
文字認識位置決定処理部(文字認識位置決定部)12は、文字認識位置補正情報抽出部9によって抽出された補正情報(文字認識位置補正情報)に基づいて、文字認識位置仮決定処理部11によって仮決定された文字の認識位置に対して、斜行補正や伸縮補正を行なって文字認識位置を決定するものである。
文字認識処理部(文字認識部)13は、文字認識位置決定処理部12によって決定された文字認識位置と、書式情報抽出処理部8によって抽出された文字認識位置情報(座標)や文字属性情報(文字種類,桁数)に基づいて、帳票画像における文字認識位置の文字について文字認識を行なうものである。なお、この文字認識処理部13による文字認識は、公知の種々の手法を用いて実現することができる。
また、文字認識処理部13によって文字認識された結果は、ハードディスク32やメモリ31等に形成された認識結果格納領域322,312に、項目番号に対応させて格納されるようになっている。
エントリ制御処理部16は、エントリ制御情報抽出処理部10によって取得されたエントリ制御情報に基づいて、文字認識処理部13によって文字認識された文字に対して種々のデータ処理を行なうものであり、例えば、複数枚処理を行なう場合には、通番で括られた帳票群に対して連続処理を行なうように制御したり、データチェック処理を行なったり、所定のワークフローに従った処理を行なう。
これらのエントリ制御処理部16による処理は、これらの処理を実現するためのプログラムを予めハードディスク32等に格納しておき、エントリ制御情報バーコード228a,228bの内容に応じて、CPU30がこれらのプログラムを選択的に実行することにより実現することができる。
本OCR装置1においては、ハードディスク32に、本OCR装置1で実行され得る複数のデータ処理のためのアプリケーションプログラムが、ライブラリやデータベース等の形式で予め保存されており、エントリ制御処理部16は、これらの複数のアプリケーションプログラムの中から、特定のアプリケーションプログラムを選択して実行するようになっている。
例えば、エントリ制御処理部16は、文字認識処理部13による文字認識結果に基づいて、帳票IDを取得し、この帳票IDに対応して実行すべきアプリケーションプログラムをハードディスク32(ライブラリ,データベース)から取得して実行する。
画面制御部6は、画面表示処理部(表示制御部)14を制御することによりディスプレイ15に各種画面を表示させるものであって、画面表示処理部14は、ディスプレイ15の表示制御を行なうものである。又、画面表示処理部14は、画面表示制御情報抽出処理部17によって抽出された画面表示情報(画面表示制御情報)に基づいて、文字認識処理部13によって行なった文字認識結果をディスプレイ15に表示するようになっており、例えば、画面情報情報によって指定された位置に認識された文字を表示させる。
図12は本発明の一実施形態としてのOCR装置1のディスプレイ15に表示された文字認識結果の例を示す図であり、文字認識結果が正読の場合における表示例を示すものである。この図12に示すように、画面表示処理部14は、文字認識処理部13による文字認識結果をイメージリーダ7によって読み取られた帳票画像とともにディスプレイ15に表示させるようになっており、この図12に示す例においては、項目毎の文字認識結果を項目番号に対応させて帳票画像の下側に表示させている。
また、画面表示処理部14は、文字認識処理部13による文字認識の結果において認識不能文字がある場合には、その認識不能であった文字を、クエスチョンマーク(?)等の認識不能である旨を示す特定の文字(以下、認識不能文字という)で置換してディスプレイ15に表示させるようになっている。
図13は本発明の一実施形態としてのOCR装置1のディスプレイ15に表示された文字認識結果の例を示す図であり、文字認識結果において認識不能であった文字がある場合における表示例を示すものである。この図13に示す例においては、項目番号2の名前記入領域21bに記入された名前を構成する文字のうち「タ」が認識不能であり、認識不能文字としてクエスチョンマークを用いて表わしている。
上述の如く構成された本発明の一実施形態としてのOCR装置1における帳票20の読み取りおよびその文字認識にかかる処理を、図14に示すフローチャート(ステップA10〜A100)に従って説明する。
先ず、イメージリーダ7により帳票画像を読み取り(ステップA10)、その帳票画像に基づいて、書式情報抽出処理部8が、書式情報印刷部22に印刷された左上認識座標バーコード223および右下認識座標バーコード224から文字認識位置情報を抽出・取得するとともに、カテゴリ/桁数バーコード225から属性情報(文字種類,桁数)を抽出・取得する。又、文字認識位置補正情報抽出処理部9が、書式情報印刷部22に印刷された座標補正情報バーコード227から、文字記入領域の位置に関する補正情報(原点,斜行補正の有無,伸縮補正の有無等)を抽出・取得する。更に、画面表示制御情報抽出処理部17が、書式情報印刷部22に印刷された画面表示情報バーコード226から画面表示制御情報を抽出・取得する。又、エントリ制御情報抽出処理部10が、書式情報印刷部22に印刷されたエントリ制御情報バーコード228a,228bからエントリ制御情報を抽出・取得する(ステップA20)。又、ここで文字認識済項目数カウンタに0を設定して初期化を行なう。
帳票20の文字記入部21における全ての項目について文字認識位置情報や属性情報,補正情報およびエントリ制御情報の抽出を行なったか、すなわち、文字認識済み項目数カウンタの値が項目数バーコード221に設定された項目数と一致するか否かを判断して(ステップA30)、全項目について処理が完了していない場合、すなわち、文字認識済み項目数カウンタの値が項目数バーコード221に設定された項目数よりも小さい場合には(ステップA30のNOルート参照)、文字認識位置仮決定処理部11が、書式情報抽出処理部8によって抽出された文字認識位置情報に基づいて、文字認識を行なう項目の座標を仮決定する(ステップA40)。なお、本実施形態においては、各項目の座標を帳票ID記入領域21aの座標からの相対座標で仮決定するようになっている。
そして、文字認識位置決定処理部12が、文字認識位置補正情報抽出部9によって抽出された補正情報に基づいて、ステップA40において文字認識位置仮決定処理部11によって仮決定された文字の認識位置に対して、斜行補正や伸縮補正を行なって文字認識位置を決定する(ステップA50)。文字認識処理部13は、この文字認識位置決定処理部12によって決定された文字認識位置に基づいて、帳票画像から文字認識位置の画像を切り出し、書式情報抽出処理部8によって抽出された文字属性情報(文字種類,桁数)に従ってかかる画像(文字画像)に対して文字認識を行なう(ステップA60)。
文字認識処理部13によって文字認識された結果が、ハードディスク32やメモリ31等に形成された認識結果格納領域322,312に、項目番号に対応させて格納された後(ステップA70)、文字認識済項目数カウンタの値をインクリメントして(ステップA80)、ステップA30に戻る。
一方、全項目について処理が完了した場合、すなわち、文字認識済み項目数カウンタの値が項目数バーコード221に設定された項目数に一致した場合には(ステップA30のYESルート参照)、画面表示処理部14が、画面表示制御情報抽出処理部17によって抽出された画面表示情報に基づいて、認識結果格納領域311,321に格納された文字認識結果を、項目番号に対応させて帳票画像とともにディスプレイ15に表示させる。
また、エントリ制御処理部16が、エントリ制御情報抽出処理部10によって取得されたエントリ制御情報に基づいて、文字認識処理部13によって文字認識された文字に対して種々のデータ処理を行なう。例えば、エントリ制御処理部16は、エントリ制御情報に従って、認識結果を帳票通番順にディスプレイ15に表示させる(ステップA90)。又、この際、画面表示処理部14は、帳票通番の認識結果を用いて、検証中の帳票が何枚分の何枚目のものであるかをディスプレイ15上にメッセージとして表示することによりオペレータに注意を促す等の処理も行なう。更に、エントリ制御情報に基づいて、所定のワークフローに従ってデータチェック処理を行ない確認待ちの状態に移行して処理を終了する(ステップA100)。
このように、本発明の一実施形態としてのOCR装置1によれば、帳票20に、各文字記入領域に記入された文字の文字認識を行なうための書式情報がバーコードとして印刷されており、これらの書式情報から、書式情報抽出処理部8が文字認識位置情報や属性情報を抽出・取得し、文字認識位置補正情報抽出処理部9が、文字記入領域の位置に関する補正情報を抽出・取得し、画面表示制御情報抽出処理部17が、画面表示制御情報を抽出・取得し、エントリ制御情報抽出処理部10がエントリ制御情報を抽出・取得するとともに、文字認識位置仮決定処理部11が文字認識位置情報に基づいて文字認識を行なう項目の座標を仮決定し、文字認識位置決定処理部12が補正情報に基づいて文字認識位置を決定し、画面表示処理部14が画面表示情報に基づいて文字認識結果をディスプレイ15に表示させ、更に、エントリ制御処理部16がエントリ制御情報に基づいて、文字認識された文字に対して種々のデータ処理を行なうので、文字認識位置情報や文字属性情報,補正情報,エントリ制御情報を予めOCR装置1に設定(インストール)する必要がない。これにより、OCR装置1が複数台ある場合や、帳票種類が多数ある場合においても、個々のOCR装置1に対する作業が増えることがなく利便性が高い。
また、帳票20の書式が変更される場合においても、帳票20において書式情報を変更するだけでよく、OCR装置1側において種々の定義体等のインストール作業を行なう必要がない。
さらに、画面表示処理部14が帳票20上に印刷された画面表示情報に基づいて文字認識結果をディスプレイ15に表示させるので、OCR装置1において文字認識結果をディスプレイ15に表示させるための調整等を予め行なう必要がなく利便性が高い。又、帳票20の作成時に、帳票20上における各項目の配置位置の情報に合わせて書式情報を作成し帳票20上に印刷することができるので、人的要因による定義誤差を無くすことができ、より正確な書式情報を作成することもできる。
また、エントリ制御処理部16が帳票20上に印刷されたエントリ制御情報に基づいて、文字認識された文字に対して種々のデータ処理を行なうので、帳票毎にデータ処理を確実に行なうことができ利便性が高い。又、OCR装置1において、帳票20に対応して行なうデータ処理について、当該OCR装置1で実行され得る複数のデータ処理のためのアプリケーションプログラムをライブラリやデータベース等の形式で予め複数用意しておき、エントリ制御処理部16が、帳票種類に応じてこれらの複数のアプリケーションプログラムの中から特定のアプリケーションプログラムを選択して実行することにより、OCR装置1において複数種類の帳票20について文字認識を行なう場合においても、必要な処理を自動的に選択して実施することができ、利便性が高い。
なお、一般に帳票を作成・印刷する際には、その帳票上における文字記入領域(項目)の位置(座標値)を容易に取得することができる。従って、本OCR装置1において用いられる帳票の設計に際して、これらの文字記入領域の座標値を用いることにより、書式情報(左上認識座標バーコード223,左上認識座標バーコード224)を容易に作成することができるのである。
そして、本OCR装置1においては、情報処理装置のCPU(Central Processing Unit)が、媒体画像処理プログラムを実行することにより、上述した制御部2,イメージ読取処理部3,情報抽出処理部4,文字認識制御部5,画面制御部6,書式情報抽出処理部8,文字認識位置補正情報抽出処理部9,エントリ制御情報抽出処理部10,文字認識位置仮決定処理部11,文字認識位置決定処理部12,文字認識処理部13,画面表示処理部14,エントリ制御処理部16および画面表示制御情報抽出処理部17として機能するようになっている。
なお、これらの制御部2,イメージ読取処理部3,情報抽出処理部4,文字認識制御部5,画面制御部6,書式情報抽出処理部8,文字認識位置補正情報抽出処理部9,エントリ制御情報抽出処理部10,文字認識位置仮決定処理部11,文字認識位置決定処理部12,文字認識処理部13,画面表示処理部14,エントリ制御処理部16および画面表示制御情報抽出処理部17としての機能を実現するためのプログラム(媒体画像処理プログラム)は、例えばフレキシブルディスク,CD−ROM,CD−R,CD−R/W,DVD,DVD−R,DVD−R/W,磁気ディスク,光ディスク,光磁気ディスク等の、コンピュータ読取可能な記録媒体に記録された形態で提供される。そして、コンピュータはその記録媒体からプログラムを読み取って内部記憶装置または外部記憶装置に転送し格納して用いる。又、そのプログラムを、例えば磁気ディスク,光ディスク,光磁気ディスク等の記憶装置(記録媒体)に記録しておき、その記憶装置から通信経路を介してコンピュータに提供するようにしてもよい。
制御部2,イメージ読取処理部3,情報抽出処理部4,文字認識制御部5,画面制御部6,書式情報抽出処理部8,文字認識位置補正情報抽出処理部9,エントリ制御情報抽出処理部10,文字認識位置仮決定処理部11,文字認識位置決定処理部12,文字認識処理部13,画面表示処理部14,エントリ制御処理部16および画面表示制御情報抽出処理部17としての機能を実現する際には、内部記憶装置(本実施形態ではメモリ31やハードディスク32)に格納されたプログラムがコンピュータのマイクロプロセッサ(本実施形態ではCPU30)によって実行される。このとき、記録媒体に記録されたプログラムをコンピュータが読み取って実行するようにしてもよい。
なお、本実施形態において、コンピュータとは、ハードウェアとオペレーティングシステムとを含む概念であり、オペレーティングシステムの制御の下で動作するハードウェアを意味している。又、オペレーティングシステムが不要でアプリケーションプログラム単独でハードウェアを動作させるような場合には、そのハードウェア自体がコンピュータに相当する。ハードウェアは、少なくとも、CPU等のマイクロプロセッサと、記録媒体に記録されたコンピュータプログラムを読み取るための手段とをそなえており、本実施形態においては、OCR装置1がコンピュータとしての機能を有しているのである。
さらに、本実施形態における記録媒体としては、上述したフレキシブルディスク,CD−ROM,CD−R,CD−R/W,DVD,DVD−R,DVD−R/W,磁気ディスク,光ディスク,光磁気ディスクのほか、ICカード,ROMカートリッジ,磁気テープ,パンチカード,コンピュータの内部記憶装置(RAMやROMなどのメモリ),外部記憶装置等や、バーコードなどの符号が印刷された印刷物等のコンピュータ読取可能な種々の媒体を利用することができる。
そして、本発明は上述した実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で種々変形して実施することができる。
例えば、上記実施形態では、帳票20の書式情報印刷部22にJAN形式のバーコードによって書式情報が印刷されているが、それに限定されるものではなく、EAN形式やUPC形式,ITFコード形式、2次元バーコード等の他形式のバーコードを用いてもよく、更に、OCR−Bフォント等の数字や他の文字種の文字列によって印刷してもよい。
また、帳票20において、帳票種類を示す情報として帳票IDを用いているが、これに限定されるものではなく、帳票の種類を特定する文字列やマーク等を用いてもよい。
さらに、帳票20において、書式情報が目立たないように、この書式情報を地模様の一部として印刷してもよい。
また、エントリ制御処理部16によるデータ処理は、上述の如き、通番で括られた帳票群に対して連続処理を行なう制御や、データチェック処理,所定のワークフローに従った処理に限定されるものではなく、これら以外の処理を行なってもよい。
さらに、図2に示す帳票20の例においては、帳票20の上の方に文字記入領域21が形成されるとともに、その下側に書式情報記入領域22が形成されているが、これに限定されるものではなく、例えば、文字記入領域21を構成する各領域(帳票ID記入領域21a,名前記入領域21b,連絡先記入領域21cおよび帳票通番記入領域21d)のそれぞれに隣接するように書式情報の各バーコード222〜226をそれぞれ配置してもよい。
また、図2に示す帳票20の例においては、項目番号バーコード222に対して、対応する左上認識座標バーコード223,右下認識座標バーコード224,カテゴリ/桁数225および画面表示情報バーコード226をそれぞれ同じ列に並べて配置しているが、これに限定されるものではなく、これらの項目番号バーコード222,左上認識座標バーコード223,右下認識座標バーコード224,カテゴリ/桁数225および画面表示情報バーコード226を帳票20上の任意の位置に配置してもよい。
さらに、上述した実施形態においては、図13に示す例において、認識不能文字としてクエスチョンマークを用いているが、これに限定されるものではなく、例えば「○」や「×」等の他の文字や記号を用いてもよい。
なお、本発明の各実施形態が開示されていれば、本発明の媒体処理装置,媒体処理方法,媒体画像処理装置,媒体画像処理プログラムおよび帳票を当業者によって実施・製造することが可能である。
そして、本発明は、以下に示すように要約することができる。
(付記1) 媒体上に記載された文字を文字認識し、その文字認識結果を表示部に表示する媒体処理装置であって、
認識対象の文字を記載されるとともに文字認識位置情報と文字属性情報と文字認識位置補正情報と画面表示制御情報とを印刷された媒体から媒体画像を読み取る媒体画像読取部と、
該媒体画像読取部によって読み取られた該媒体画像に基づいて該文字認識位置情報を抽出する文字認識位置情報抽出部と、
該媒体画像読取部によって読み取られた該媒体画像に基づいて該文字属性情報を抽出する文字属性情報抽出部と、
該媒体画像読取部によって読み取られた該媒体画像に基づいて該文字認識位置補正情報を抽出する文字認識位置補正情報抽出部と、
該媒体画像読取部によって読み取られた該媒体画像に基づいて該画面表示制御情報を抽出する画面表示制御情報抽出部と、
該書式情報抽出部によって抽出された該文字認識位置情報に基づいて、該媒体における該文字の認識位置を仮決定する文字認識位置仮決定部と、
該文字認識位置補正情報抽出部によって抽出された該文字認識位置補正情報に基づいて、該文字認識位置仮決定部によって仮決定された前記文字の認識位置を補正して該文字認識位置を決定する文字認識位置決定部と、
該媒体画像と、該文字位置決定部によって決定された該文字認識位置と、該文字属性情報抽出部によって抽出された該文字属性情報とに基づいて、該媒体画像における該文字認識位置の文字について文字認識を行なう文字認識部と、
該画面表示制御情報抽出部によって抽出された該画面表示制御情報に基づいて、該文字認識部によって行なった文字認識結果を該表示部に表示する表示制御部とをそなえることを特徴とする、媒体処理装置。
(付記2) 該媒体がエントリ制御情報を印刷されるものであって、
該媒体画像読取部によって読み取られた該媒体画像に基づいて該エントリ制御情報を抽出するエントリ制御情報抽出部をそなえるとともに、
該エントリ制御情報抽出部によって抽出された該エントリ制御情報に基づいて、該文字認識部によって文字認識された該文字を用いてデータ処理を行なうエントリ制御部をそなえることを特徴とする、付記1記載の媒体処理装置。
(付記3) 該表示制御部が、該文字認識部による文字認識の結果において認識不能の文字がある場合に、当該認識不能文字を認識不能表示文字で該表示部に示すことを特徴とする、付記1又は付記2記載の媒体処理装置。
(付記4) 媒体上に記載された文字を文字認識し、その文字認識結果を表示部に表示する媒体処理方法であって、
認識対象の文字を記載されるとともに文字認識位置情報と文字属性情報と文字認識位置補正情報と画面表示制御情報とを印刷された媒体から媒体画像を読み取る媒体画像読取ステップと、
該媒体画像読取ステップにおいて読み取られた該媒体画像に基づいて該文字認識位置情報を抽出する文字認識位置情報抽出ステップと、
該媒体画像読取ステップにおいて読み取られた該媒体画像に基づいて該文字属性情報を抽出する文字属性情報抽出ステップと、
該媒体画像読取ステップにおいて読み取られた該媒体画像に基づいて該文字認識位置補正情報を抽出する文字認識位置補正情報抽出ステップと、
該媒体画像読取ステップにおいて読み取られた該媒体画像に基づいて該画面表示制御情報を抽出する画面表示制御情報抽出ステップと、
該書式情報抽出ステップにおいて抽出された該文字認識位置情報に基づいて、該媒体における該文字の認識位置を仮決定する文字認識位置仮決定ステップと、
該文字認識位置補正情報抽出ステップにおいて抽出された該文字認識位置補正情報に基づいて、該文字認識位置仮決定ステップにおいて仮決定された前記文字の認識位置を補正して該文字認識位置を決定する文字認識位置決定ステップと、
該媒体画像と、該文字位置決定ステップにおいて決定された該文字認識位置と、該文字属性情報抽出ステップにおいて抽出された該文字属性情報とに基づいて、該媒体画像における該文字認識位置の文字について文字認識を行なう文字認識ステップと、
該画面表示制御情報抽出ステップにおいて抽出された該画面表示制御情報に基づいて、該文字認識ステップにおいて行なった文字認識結果を該表示部に表示する表示制御ステップとをそなえることを特徴とする、媒体処理方法。
(付記5) 該媒体がエントリ制御情報を印刷されるものであって、
該媒体画像読取ステップにおいて読み取られた該媒体画像に基づいて該エントリ制御情報を抽出するエントリ制御情報抽出ステップをそなえるとともに、
該エントリ制御情報抽出ステップにおいて抽出された該エントリ制御情報に基づいて、該文字認識ステップにおいて文字認識された該文字を用いてデータ処理を行なうエントリ制御ステップをそなえることを特徴とする、付記4記載の媒体処理方法。
(付記6) 該表示制御ステップにおいて、該文字認識ステップにおける文字認識の結果において認識不能の文字がある場合に、当該認識不能文字を認識不能表示文字で該表示部に示すことを特徴とする、付記4又は付記5記載の媒体処理方法。
(付記7) 認識対象の文字を記載されるとともに文字認識位置情報と文字属性情報と文字認識位置補正情報と画面表示制御情報とを印刷された媒体から読み取った媒体画像に基づいて、該文字を文字認識し、その文字認識結果を表示部に表示する媒体画像処理装置であって、
該媒体画像に基づいて該文字認識位置情報を抽出する文字認識位置情報抽出部と、
該媒体画像に基づいて該文字属性情報を抽出する文字属性情報抽出部と、
該媒体画像に基づいて該文字認識位置補正情報を抽出する文字認識位置補正情報抽出部と、
該媒体画像に基づいて該画面表示制御情報を抽出する画面表示制御情報抽出部と、
該書式情報抽出部によって抽出された該文字認識位置情報に基づいて、該媒体における該文字の認識位置を仮決定する文字認識位置仮決定部と、
該文字認識位置補正情報抽出部によって抽出された該文字認識位置補正情報に基づいて、該文字認識位置仮決定部によって仮決定された前記文字の認識位置を補正して該文字認識位置を決定する文字認識位置決定部と、
該媒体画像と、該文字位置決定部によって決定された該文字認識位置と、該文字属性情報抽出部によって抽出された該文字属性情報とに基づいて、該媒体画像における該文字認識位置の文字について文字認識を行なう文字認識部と、
該画面表示制御情報抽出部によって抽出された該画面表示制御情報に基づいて、該文字認識部によって行なった文字認識結果を該表示部に表示する表示制御部とをそなえることを特徴とする、媒体画像処理装置。
(付記8) 該媒体がエントリ制御情報を印刷されるものであって、
該媒体画像に基づいて該エントリ制御情報を抽出するエントリ制御情報抽出部をそなえるとともに、
該エントリ制御情報抽出部によって抽出された該エントリ制御情報に基づいて、該文字認識部によって文字認識された該文字を用いてデータ処理を行なうエントリ制御部をそなえることを特徴とする、付記7記載の媒体画像処理装置。
(付記9) 該表示制御部が、該文字認識部による文字認識の結果において認識不能の文字がある場合に、当該認識不能文字を認識不能表示文字で該表示部に示すことを特徴とする、付記7又は付記8記載の媒体画像処理装置。
(付記10) 認識対象の文字を記載されるとともに文字認識位置情報と文字属性情報と文字認識位置補正情報と画面表示制御情報とを印刷された媒体から読み取った媒体画像に基づいて、該文字を文字認識し、その文字認識結果を表示部に表示する媒体画像処理方法であって、
該媒体画像に基づいて該文字認識位置情報を抽出する文字認識位置情報抽出ステップと、
該媒体画像に基づいて該文字属性情報を抽出する文字属性情報抽出ステップと、
該媒体画像に基づいて該文字認識位置補正情報を抽出する文字認識位置補正情報抽出ステップと、
該媒体画像に基づいて該画面表示制御情報を抽出する画面表示制御情報抽出ステップと、
該書式情報抽出ステップにおいて抽出された該文字認識位置情報に基づいて、該媒体における該文字の認識位置を仮決定する文字認識位置仮決定ステップと、
該文字認識位置補正情報抽出ステップにおいて抽出された該文字認識位置補正情報に基づいて、該文字認識位置仮決定ステップにおいて仮決定された前記文字の認識位置を補正して該文字認識位置を決定する文字認識位置決定ステップと、
該媒体画像と、該文字位置決定ステップにおいて決定された該文字認識位置と、該文字属性情報抽出ステップにおいて抽出された該文字属性情報とに基づいて、該媒体画像における該文字認識位置の文字について文字認識を行なう文字認識ステップと、
該画面表示制御情報抽出ステップにおいて抽出された該画面表示制御情報に基づいて、該文字認識ステップにおいて行なった文字認識結果を該表示部に表示する表示制御ステップとをそなえることを特徴とする、媒体画像処理方法。
(付記11) 該媒体がエントリ制御情報を印刷されるものであって、
該媒体画像に基づいて該エントリ制御情報を抽出するエントリ制御情報抽出ステップをそなえるとともに、
該エントリ制御情報抽出ステップにおいて抽出された該エントリ制御情報に基づいて、該文字認識ステップにおいて文字認識された該文字を用いてデータ処理を行なうエントリ制御ステップをそなえることを特徴とする、付記10記載の媒体画像処理方法。
(付記12) 該表示制御ステップにおいて、該文字認識ステップにおける文字認識の結果において認識不能の文字がある場合に、当該認識不能文字を認識不能表示文字で該表示部に示すことを特徴とする、付記10又は付記11記載の媒体画像処理方法。
(付記13) 認識対象の文字を記載されるとともに文字認識位置情報と文字属性情報と文字認識位置補正情報と画面表示制御情報とを印刷された媒体から読み取った媒体画像に基づいて、該文字を文字認識し、その文字認識結果を表示部に表示する媒体処理機能をコンピュータに実行させるための媒体画像処理プログラムであって、
該媒体画像に基づいて該文字認識位置情報を抽出する文字認識位置情報抽出部と、
該媒体画像に基づいて該文字属性情報を抽出する文字属性情報抽出部と、
該媒体画像に基づいて該文字認識位置補正情報を抽出する文字認識位置補正情報抽出部と、
該媒体画像に基づいて該画面表示制御情報を抽出する画面表示制御情報抽出部と、
該書式情報抽出部によって抽出された該文字認識位置情報に基づいて、該媒体における該文字の認識位置を仮決定する文字認識位置仮決定部と、
該文字認識位置補正情報抽出部によって抽出された該文字認識位置補正情報に基づいて、該文字認識位置仮決定部によって仮決定された前記文字の認識位置を補正して該文字認識位置を決定する文字認識位置決定部と、
該媒体画像と、該文字位置決定部によって決定された該文字認識位置と、該文字属性情報抽出部によって抽出された該文字属性情報とに基づいて、該媒体画像における該文字認識位置の文字について文字認識を行なう文字認識部と、
該画面表示制御情報抽出部によって抽出された該画面表示制御情報に基づいて、該文字認識部によって行なった文字認識結果を該表示部に表示する表示制御部部として、該コンピュータを機能させることを特徴とする、媒体画像処理プログラム。
(付記14) 該媒体がエントリ制御情報を印刷されるものであって、
該媒体画像に基づいて該エントリ制御情報を抽出するエントリ制御情報抽出部として該コンピュータを機能させるとともに、
該エントリ制御情報抽出部によって抽出された該エントリ制御情報に基づいて、該文字認識部によって文字認識された該文字を用いてデータ処理を行なうエントリ制御部として該コンピュータを機能させることを特徴とする、付記13記載の媒体画像処理プログラム。
(付記15) 該表示制御部として該コンピュータを機能させる際に、該文字認識部による文字認識の結果において認識不能の文字がある場合に、当該認識不能文字を認識不能表示文字で該表示部に示させるように、該コンピュータを機能させることを特徴とする、付記13又は付記14記載の媒体画像処理プログラム。
(付記16) 認識対象の文字を記載されるとともに文字認識位置情報と文字属性情報と文字認識位置補正情報と画面表示制御情報とを印刷された媒体から読み取った媒体画像に基づいて、該文字を文字認識し、その文字認識結果を表示部に表示する媒体処理機能をコンピュータに実行させるための媒体画像処理プログラムを記録したコンピュータ読取可能な記録媒体であって、
該媒体画像処理プログラムが、
該媒体画像に基づいて該文字認識位置情報を抽出する文字認識位置情報抽出部と、
該媒体画像に基づいて該文字属性情報を抽出する文字属性情報抽出部と、
該媒体画像に基づいて該文字認識位置補正情報を抽出する文字認識位置補正情報抽出部と、
該媒体画像に基づいて該画面表示制御情報を抽出する画面表示制御情報抽出部と、
該書式情報抽出部によって抽出された該文字認識位置情報に基づいて、該媒体における該文字の認識位置を仮決定する文字認識位置仮決定部と、
該文字認識位置補正情報抽出部によって抽出された該文字認識位置補正情報に基づいて、該文字認識位置仮決定部によって仮決定された前記文字の認識位置を補正して該文字認識位置を決定する文字認識位置決定部と、
該媒体画像と、該文字位置決定部によって決定された該文字認識位置と、該文字属性情報抽出部によって抽出された該文字属性情報とに基づいて、該媒体画像における該文字認識位置の文字について文字認識を行なう文字認識部と、
該画面表示制御情報抽出部によって抽出された該画面表示制御情報に基づいて、該文字認識部によって行なった文字認識結果を該表示部に表示する表示制御部部として、該コンピュータを機能させることを特徴とする、媒体画像処理プログラムを記録したコンピュータ読取可能な記録媒体。
(付記17) 該媒体がエントリ制御情報を印刷されるものであって、
該媒体画像処理プログラムが、
該媒体画像に基づいて該エントリ制御情報を抽出するエントリ制御情報抽出部として該コンピュータを機能させるとともに、
該エントリ制御情報抽出部によって抽出された該エントリ制御情報に基づいて、該文字認識部によって文字認識された該文字を用いてデータ処理を行なうエントリ制御部として該コンピュータを機能させることを特徴とする、付記16記載の媒体画像処理プログラムを記録したコンピュータ読取可能な記録媒体。
(付記18) 該媒体画像処理プログラムが、該表示制御部として該コンピュータを機能させる際に、該文字認識部による文字認識の結果において認識不能の文字がある場合に、当該認識不能文字を認識不能表示文字で該表示部に示させるように、該コンピュータを機能させることを特徴とする、付記16又は付記17記載の媒体画像処理プログラムを記録したコンピュータ読取可能な記録媒体。
(付記19) 文字を記入可能な文字記入領域をそなえる帳票であって、
該文字記入領域の位置を示す文字認識位置情報と、
該文字記入領域に記入される該文字の属性に関する属性情報を示す文字属性情報と、
当該帳票を画像読取装置によって読み取って作成される帳票画像における、該文字記入領域の位置に関する補正情報を示す文字認識位置補正情報と、
該帳票画像に基づいて該文字について文字認識した結果を表示装置に表示させるための画面表示制御情報を示す画面表示制御情報とをそなえることを特徴とする、帳票。
(付記20) 前記文字認識した結果に対するデータ処理に関する情報を示すエントリ制御情報をそなえることを特徴とする、付記19記載の帳票。
本発明の一実施形態としてのOCR装置の構成を模式的に示す図である。 本発明の一実施形態としてのOCR装置によって読み取られる帳票の例を示す図である。 (a),(b)は本発明の一実施形態としてのOCR装置によって読み取られる帳票に印刷されるバーコードの例を説明するための図である。 (a),(b)は本発明の一実施形態としてのOCR装置によって読み取られる帳票に印刷されるバーコードの例を説明するための図である。 (a),(b)は本発明の一実施形態としてのOCR装置によって読み取られる帳票に印刷されるバーコードの例を説明するための図である。 (a),(b)は本発明の一実施形態としてのOCR装置によって読み取られる帳票に印刷されるバーコードの例を説明するための図である。 (a),(b)は本発明の一実施形態としてのOCR装置によって読み取られる帳票に印刷されるバーコードの例を説明するための図である。 (a),(b)は本発明の一実施形態としてのOCR装置によって読み取られる帳票に印刷されるバーコードの例を説明するための図である。 (a),(b)は本発明の一実施形態としてのOCR装置によって読み取られる帳票に印刷されるバーコードの例を説明するための図である。 (a),(b)は本発明の一実施形態としてのOCR装置によって読み取られる帳票に印刷されるバーコードの例を説明するための図である。 (a),(b)は本発明の一実施形態としてのOCR装置によって読み取られる帳票に印刷されるバーコードの例を説明するための図である。 本発明の一実施形態としてのOCR装置のディスプレイに表示された文字認識結果の例を示す図である。 本発明の一実施形態としてのOCR装置のディスプレイに表示された文字認識結果の例を示す図である。 本発明の一実施形態としてのOCR装置における帳票の読み取りおよびその文字認識にかかる処理を説明するためのフローチャートである。
符号の説明
1 OCR装置(媒体処理装置,媒体画像処理装置)
2 制御部
3 イメージ読取処理部
4 情報抽出処理部
5 文字認識制御部
6 場面制御部
7 イメージリーダ(媒体画像読取部)
8 書式情報抽出処理部(文字認識位置情報抽出部,文字属性情報抽出部)
9 文字認識位置補正情報抽出処理部(文字認識位置補正情報抽出部)
10 エントリ制御情報抽出処理部(エントリ制御情報抽出部)
11 文字認識位置仮決定処理部(文字認識位置仮決定部)
12 文字認識位置決定処理部(文字認識位置決定部)
13 文字認識処理部(文字認識部)
14 画面表示処理部(表示制御部)
15 ディスプレイ(表示部)
16 エントリ制御処理部
17 画面表示制御情報抽出処理部(画面表示制御情報抽出)
20 帳票(媒体)
21 文字記入部
21a 帳票ID記入領域(文字記入領域)
21b 名前記入領域(文字記入領域)
21c 連絡先記入領域(文字記入領域)
21d 帳票通番記入領域(文字記入領域)
22 書式情報印刷部
30 CPU
31 メモリ
32 ハードディスク
34 キーボード
35 マウス
221 項目数バーコード
222−1,222−2,222−3,222−4 項目番号バーコード
223−1 帳票ID左上認識座標バーコード(文字認識位置情報)
223−2 名前左上認識座標バーコード(文字認識位置情報)
223−3 連絡先左上認識座標バーコード(文字認識位置情報)
223−4 帳票左上認識座標バーコード(文字認識位置情報)
224−1 帳票ID右下認識座標バーコード(文字認識位置情報)
224−2 名前右下認識座標バーコード(文字認識位置情報)
224−3 連絡先右下認識座標バーコード(文字認識位置情報)
224−4 帳票通番右下認識座標バーコード(文字認識位置情報)
225−1 帳票IDカテゴリ/桁数バーコード(文字属性情報)
225−2 名前カテゴリ/桁数バーコード(文字属性情報)
225−3 連絡先カテゴリ/桁数バーコード(文字属性情報)
225−4 帳票通番カテゴリ/桁数バーコード(文字属性情報)
226−1 帳票ID画面表示情報バーコード(画面表示制御情報)
226−2 名前画面表示情報バーコード(画面表示制御情報)
226−3 連絡先画面表示情報バーコード(画面表示制御情報)
226−4 帳票通番画面表示情報バーコード(画面表示制御情報)
227 座標補正情報バーコード(文字認識位置補正情報)
228a,228b エントリ制御情報バーコード(エントリ制御情報)
311,321 書式情報格納領域
312,322 認識結果格納領域

Claims (5)

  1. 媒体上に記載された文字を文字認識し、その文字認識結果を表示部に表示する媒体処理装置であって、
    認識対象の文字を記載されるとともに文字認識位置情報と文字属性情報と文字認識位置補正情報と画面表示制御情報とを印刷された媒体から媒体画像を読み取る媒体画像読取部と、
    該媒体画像読取部によって読み取られた該媒体画像に基づいて該文字認識位置情報を抽出する文字認識位置情報抽出部と、
    該媒体画像読取部によって読み取られた該媒体画像に基づいて該文字属性情報を抽出する文字属性情報抽出部と、
    該媒体画像読取部によって読み取られた該媒体画像に基づいて該文字認識位置補正情報を抽出する文字認識位置補正情報抽出部と、
    該媒体画像読取部によって読み取られた該媒体画像に基づいて該画面表示制御情報を抽出する画面表示制御情報抽出部と、
    該書式情報抽出部によって抽出された該文字認識位置情報に基づいて、該媒体における該文字の認識位置を仮決定する文字認識位置仮決定部と、
    該文字認識位置補正情報抽出部によって抽出された該文字認識位置補正情報に基づいて、該文字認識位置仮決定部によって仮決定された前記文字の認識位置を補正して該文字認識位置を決定する文字認識位置決定部と、
    該媒体画像と、該文字位置決定部によって決定された該文字認識位置と、該文字属性情報抽出部によって抽出された該文字属性情報とに基づいて、該媒体画像における該文字認識位置の文字について文字認識を行なう文字認識部と、
    該画面表示制御情報抽出部によって抽出された該画面表示制御情報に基づいて、該文字認識部によって行なった文字認識結果を該表示部に表示する表示制御部とをそなえることを特徴とする、媒体処理装置。
  2. 媒体上に記載された文字を文字認識し、その文字認識結果を表示部に表示する媒体処理方法であって、
    認識対象の文字を記載されるとともに文字認識位置情報と文字属性情報と文字認識位置補正情報と画面表示制御情報とを印刷された媒体から媒体画像を読み取る媒体画像読取ステップと、
    該媒体画像読取ステップにおいて読み取られた該媒体画像に基づいて該文字認識位置情報を抽出する文字認識位置情報抽出ステップと、
    該媒体画像読取ステップにおいて読み取られた該媒体画像に基づいて該文字属性情報を抽出する文字属性情報抽出ステップと、
    該媒体画像読取ステップにおいて読み取られた該媒体画像に基づいて該文字認識位置補正情報を抽出する文字認識位置補正情報抽出ステップと、
    該媒体画像読取ステップにおいて読み取られた該媒体画像に基づいて該画面表示制御情報を抽出する画面表示制御情報抽出ステップと、
    該書式情報抽出ステップにおいて抽出された該文字認識位置情報に基づいて、該媒体における該文字の認識位置を仮決定する文字認識位置仮決定ステップと、
    該文字認識位置補正情報抽出ステップにおいて抽出された該文字認識位置補正情報に基づいて、該文字認識位置仮決定ステップにおいて仮決定された前記文字の認識位置を補正して該文字認識位置を決定する文字認識位置決定ステップと、
    該媒体画像と、該文字位置決定ステップにおいて決定された該文字認識位置と、該文字属性情報抽出ステップにおいて抽出された該文字属性情報とに基づいて、該媒体画像における該文字認識位置の文字について文字認識を行なう文字認識ステップと、
    該画面表示制御情報抽出ステップにおいて抽出された該画面表示制御情報に基づいて、該文字認識ステップにおいて行なった文字認識結果を該表示部に表示する表示制御ステップとをそなえることを特徴とする、媒体処理方法。
  3. 認識対象の文字を記載されるとともに文字認識位置情報と文字属性情報と文字認識位置補正情報と画面表示制御情報とを印刷された媒体から読み取った媒体画像に基づいて、該文字を文字認識し、その文字認識結果を表示部に表示する媒体画像処理装置であって、
    該媒体画像に基づいて該文字認識位置情報を抽出する文字認識位置情報抽出部と、
    該媒体画像に基づいて該文字属性情報を抽出する文字属性情報抽出部と、
    該媒体画像に基づいて該文字認識位置補正情報を抽出する文字認識位置補正情報抽出部と、
    該媒体画像に基づいて該画面表示制御情報を抽出する画面表示制御情報抽出部と、
    該書式情報抽出部によって抽出された該文字認識位置情報に基づいて、該媒体における該文字の認識位置を仮決定する文字認識位置仮決定部と、
    該文字認識位置補正情報抽出部によって抽出された該文字認識位置補正情報に基づいて、該文字認識位置仮決定部によって仮決定された前記文字の認識位置を補正して該文字認識位置を決定する文字認識位置決定部と、
    該媒体画像と、該文字位置決定部によって決定された該文字認識位置と、該文字属性情報抽出部によって抽出された該文字属性情報とに基づいて、該媒体画像における該文字認識位置の文字について文字認識を行なう文字認識部と、
    該画面表示制御情報抽出部によって抽出された該画面表示制御情報に基づいて、該文字認識部によって行なった文字認識結果を該表示部に表示する表示制御部とをそなえることを特徴とする、媒体画像処理装置。
  4. 認識対象の文字を記載されるとともに文字認識位置情報と文字属性情報と文字認識位置補正情報と画面表示制御情報とを印刷された媒体から読み取った媒体画像に基づいて、該文字を文字認識し、その文字認識結果を表示部に表示する媒体処理機能をコンピュータに実行させるための媒体画像処理プログラムであって、
    該媒体画像に基づいて該文字認識位置情報を抽出する文字認識位置情報抽出部と、
    該媒体画像に基づいて該文字属性情報を抽出する文字属性情報抽出部と、
    該媒体画像に基づいて該文字認識位置補正情報を抽出する文字認識位置補正情報抽出部と、
    該媒体画像に基づいて該画面表示制御情報を抽出する画面表示制御情報抽出部と、
    該書式情報抽出部によって抽出された該文字認識位置情報に基づいて、該媒体における該文字の認識位置を仮決定する文字認識位置仮決定部と、
    該文字認識位置補正情報抽出部によって抽出された該文字認識位置補正情報に基づいて、該文字認識位置仮決定部によって仮決定された前記文字の認識位置を補正して該文字認識位置を決定する文字認識位置決定部と、
    該媒体画像と、該文字位置決定部によって決定された該文字認識位置と、該文字属性情報抽出部によって抽出された該文字属性情報とに基づいて、該媒体画像における該文字認識位置の文字について文字認識を行なう文字認識部と、
    該画面表示制御情報抽出部によって抽出された該画面表示制御情報に基づいて、該文字認識部によって行なった文字認識結果を該表示部に表示する表示制御部部として、該コンピュータを機能させることを特徴とする、媒体画像処理プログラム。
  5. 文字を記入可能な文字記入領域をそなえる帳票であって、
    該文字記入領域の位置を示す文字認識位置情報と、
    該文字記入領域に記入される該文字の属性に関する属性情報を示す文字属性情報と、
    当該帳票を画像読取装置によって読み取って作成される帳票画像における、該文字記入領域の位置に関する補正情報を示す文字認識位置補正情報と、
    該帳票画像に基づいて該文字について文字認識した結果を表示装置に表示させるための画面表示制御情報を示す画面表示制御情報とをそなえることを特徴とする、帳票。
JP2004100449A 2004-03-30 2004-03-30 媒体処理装置,媒体処理方法,媒体画像処理装置,媒体画像処理プログラムおよび帳票 Expired - Fee Related JP4594638B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004100449A JP4594638B2 (ja) 2004-03-30 2004-03-30 媒体処理装置,媒体処理方法,媒体画像処理装置,媒体画像処理プログラムおよび帳票

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004100449A JP4594638B2 (ja) 2004-03-30 2004-03-30 媒体処理装置,媒体処理方法,媒体画像処理装置,媒体画像処理プログラムおよび帳票

Publications (2)

Publication Number Publication Date
JP2005284927A true JP2005284927A (ja) 2005-10-13
JP4594638B2 JP4594638B2 (ja) 2010-12-08

Family

ID=35183217

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004100449A Expired - Fee Related JP4594638B2 (ja) 2004-03-30 2004-03-30 媒体処理装置,媒体処理方法,媒体画像処理装置,媒体画像処理プログラムおよび帳票

Country Status (1)

Country Link
JP (1) JP4594638B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7926732B2 (en) 2006-04-03 2011-04-19 Kabushiki Kaisha Toshiba OCR sheet-inputting device, OCR sheet, program for inputting an OCR sheet and program for drawing an OCR sheet form
JP2014026592A (ja) * 2012-07-30 2014-02-06 Fujitsu Frontech Ltd 文字認識装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63316163A (ja) * 1987-06-19 1988-12-23 Hitachi Ltd 伝票電子化処理方式
JPH1125209A (ja) * 1997-07-04 1999-01-29 Toshiba Corp 情報入力装置、情報入力方法、記憶媒体、及び二次元バーコード印刷装置
JP2002304597A (ja) * 2001-04-04 2002-10-18 Sakana Ryutsu Net:Kk 梱包箱に記入された手書き数値情報の認識方式
JP2003271942A (ja) * 2002-03-18 2003-09-26 Ricoh Co Ltd バーコード記録方法、画像補正方法および画像補正装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63316163A (ja) * 1987-06-19 1988-12-23 Hitachi Ltd 伝票電子化処理方式
JPH1125209A (ja) * 1997-07-04 1999-01-29 Toshiba Corp 情報入力装置、情報入力方法、記憶媒体、及び二次元バーコード印刷装置
JP2002304597A (ja) * 2001-04-04 2002-10-18 Sakana Ryutsu Net:Kk 梱包箱に記入された手書き数値情報の認識方式
JP2003271942A (ja) * 2002-03-18 2003-09-26 Ricoh Co Ltd バーコード記録方法、画像補正方法および画像補正装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7926732B2 (en) 2006-04-03 2011-04-19 Kabushiki Kaisha Toshiba OCR sheet-inputting device, OCR sheet, program for inputting an OCR sheet and program for drawing an OCR sheet form
JP2014026592A (ja) * 2012-07-30 2014-02-06 Fujitsu Frontech Ltd 文字認識装置

Also Published As

Publication number Publication date
JP4594638B2 (ja) 2010-12-08

Similar Documents

Publication Publication Date Title
KR100314637B1 (ko) 좌표검출태블릿을갖는필기데이터입력장치
JP4996940B2 (ja) 帳票認識装置およびそのプログラム
JP4347677B2 (ja) 帳票ocrプログラム、方法及び装置
JPH04343190A (ja) 文字データ入力方式
JP3422924B2 (ja) 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2008009586A (ja) バーコード印刷データ作成装置及びバーコード印刷データ作成プログラム
WO2019194051A1 (ja) 画像処理装置、画像処理方法、およびプログラムを記憶する記憶媒体
JP5661549B2 (ja) 帳票上の文字を認識する文字認識装置、マスク処理方法、および、マスク処理プログラム
JP2013164740A (ja) 会計情報読取りシステム、会計情報読取り方法、及びプログラム
JP2012190434A (ja) 帳票定義装置、帳票定義方法、プログラム及び記録媒体
JP4020924B2 (ja) イメージ処理装置
JP2016192223A (ja) 会計情報読取りシステム及びプログラム
JP4983464B2 (ja) 帳票画像処理装置及び帳票画像処理プログラム
JP4594638B2 (ja) 媒体処理装置,媒体処理方法,媒体画像処理装置,媒体画像処理プログラムおよび帳票
JP4935459B2 (ja) 文字認識方法、文字認識プログラムおよび文字認識装置
JP4518212B2 (ja) 画像処理装置及びプログラム
JP2008310531A (ja) 帳票識別方法及び帳票識別プログラム並びに該帳票識別方法を用いた光学文字読取システム
JP4517822B2 (ja) 画像処理装置及びプログラム
JP5724286B2 (ja) 帳票作成装置、帳票作成方法、プログラム
JP2001005804A (ja) 文字認識装置を利用したデータベース登録方法
CN113111881A (zh) 信息处理装置及记录媒体
JP2004220340A (ja) 帳票書式編集装置および帳票書式編集プログラム
JP6682827B2 (ja) 情報処理装置及び情報処理プログラム
JP3000349B2 (ja) キー入力編集方法及び編集装置
JP2010152464A (ja) 文字認識装置、文字認識装置の確認画面生成方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070208

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090903

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091013

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100525

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100726

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100907

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100917

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130924

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4594638

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees