JP4130429B2 - 文字読取装置 - Google Patents

文字読取装置 Download PDF

Info

Publication number
JP4130429B2
JP4130429B2 JP2004289372A JP2004289372A JP4130429B2 JP 4130429 B2 JP4130429 B2 JP 4130429B2 JP 2004289372 A JP2004289372 A JP 2004289372A JP 2004289372 A JP2004289372 A JP 2004289372A JP 4130429 B2 JP4130429 B2 JP 4130429B2
Authority
JP
Japan
Prior art keywords
character
file
character recognition
storage means
recognition result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004289372A
Other languages
English (en)
Other versions
JP2006106905A (ja
Inventor
将 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2004289372A priority Critical patent/JP4130429B2/ja
Publication of JP2006106905A publication Critical patent/JP2006106905A/ja
Application granted granted Critical
Publication of JP4130429B2 publication Critical patent/JP4130429B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

本発明は、例えば多数の帳票に対して帳票イメージの読み取り、文字認識、文字認識結果の保存という処理を次々に繰り返した後に、保存した多数の文字認識結果をバッチ処理で訂正する文字読取装置に関する。
近年、手書きされた帳票をイメージスキャナで読み取り文字認識を行う文字読取装置は、文字認識精度が向上したとは言え、文字認識率は100パーセントではなく、大量の帳票を扱う業務では、読取元の帳票や帳票イメージと文字認識結果のテキストデータとを一度保存しておいた後、これらのデータをバッチ処理で比較してデータを個々に訂正することが行われている。
手書き帳票を読み取って得た文字を訂正する際の先行技術としては、例えば文字認識結果を認識不能文字の位置と共に表示しその位置が表示される認識不能文字についての訂正文字を入力する手段を備えた文字読取装置が開示されている(例えば特許文献1参照)。
特開2001−76092号公報
しかしながら、上記先行技術の場合、大量の文字認識結果のファイルの中で、訂正対象のファイルの保存場所が予め判っているものについては訂正を容易に行えるものの、正しい文字認識結果とそうでないものとが混在する中から、訂正対象のファイルを見つけ出して訂正することは容易ではなく、労力がかかるという問題があった。
本発明はこのような課題を解決するためになされたもので、文字認識結果の大量のファイルの中から、訂正対象のファイルを容易に見つけ出して訂正することのできる文字読取装置を提供することを目的としている。
上記した目的を達成するために、本発明の文字読取装置は、帳票をイメージスキャンして得た帳票イメージとこの帳票イメージから文字認識して得た文字認識結果のファイルの保管場所を、帳票の種別毎に階層的に分類し保存した保存手段と、帳票、帳票イメージおよび文字認識結果のファイルを一意に特定する帳票番号と、文字認識が不可能であることを示す所定の文字コードの有無を示す情報と、帳票が前記保存手段の階層構造の中でどの場所に分類および保存されているかを示すバッチ番号とを対応付けて記憶する帳票情報記憶手段と、前記帳票情報記憶手段のバッチ番号と帳票番号を基に、文字認識結果のファイルの内容を訂正するための画面に、前記保存手段の階層構造をファイルおよびフォルダのツリー構造で示すウィンドウを表示すると共に、前記文字コードの有無を示す情報に基づいて、前記所定の文字コードが付与されたファイルとこのファイルの上位に位置する階層のフォルダに、前記所定の文字コードが付与されていないファイルおよびフォルダとは視覚的に異なる表示を行う訂正処理手段とを具備したことを特徴とする。
本発明の文字読取装置は、帳票をイメージスキャンして得た帳票イメージとこの帳票イメージから文字認識して得た文字認識結果のファイルの保管場所を、帳票の種別毎に階層的に分類し保存した保存手段と、帳票、帳票イメージおよび文字認識結果のファイルを一意に特定する帳票番号と、文字認識が不可能であることを示す所定の文字コードの有無を示す情報と、帳票が前記保存手段の階層構造の中でどの場所に分類および保存されているかを示すバッチ番号とを対応付けて記憶する帳票情報記憶手段と、前記帳票情報記憶手段のバッチ番号と帳票番号を基に、文字認識結果のファイルの内容を訂正するための画面に、前記保存手段に保存されているファイルを縮小表示するウィンドウを表示すると共に、前記文字コードの有無を示す情報に基づいて、前記所定の文字コードが付与されたファイルと、前記所定の文字コードが付与されていないファイルとで視覚的に異なる表示を行う訂正処理手段とを具備したことを特徴とする。
本発明の文字読取装置は、帳票をイメージスキャンして得た帳票イメージとこの帳票イメージから文字認識して得た文字認識結果のファイルの保管場所を、帳票の種別毎に階層的に分類し保存した保存手段と、帳票、帳票イメージおよび文字認識結果のファイルを一意に特定する帳票番号と、文字認識が不可能であることを示す所定の文字コードの有無を示す情報と、帳票が前記保存手段の階層構造の中でどの場所に分類および保存されているかを示すバッチ番号とを対応付けて記憶する帳票情報記憶手段と、前記帳票情報記憶手段のバッチ番号と帳票番号を基に、文字認識結果のファイルの内容を訂正するための訂正画面を表示する訂正画面表示手段と、前記訂正画面において、前記保存手段の階層構造をファイルおよびフォルダのツリー構造で示すウィンドウを表示すると共に、前記文字コードの有無を示す情報に基づいて、前記所定の文字コードが付与されたファイルとこのファイルの上位に位置する階層のフォルダに、前記所定の文字コードが付与されていないファイルおよびフォルダとは視覚的に異なる表示を行う第1の保存場所表示手段と、前記訂正画面において、前記文字コードの有無を示す情報に基づいて、前記所定の文字コードが付与されたファイルと、前記所定の文字コードが付与されていないファイルとを視覚的に異なる縮小表示を行うウィンドウを表示する第2の保存場所表示手段と、前記第1の保存場所表示手段によるウィンドウ表示と第2の保存場所表示手段によるウインドウ表示とを、ユーザの操作に応じて切り替える表示切替手段とを具備したことを特徴とする。
本発明では、帳票情報記憶手段のバッチ番号と帳票番号を基に、文字認識結果のファイルの内容を訂正するための画面に、前記保存手段の階層構造をファイルおよびフォルダのツリー構造で示すウィンドウ、あるいは保存手段に保存されているファイルを縮小表示するウインドウを表示すると共に、文字認識時に文字認識不可能のため所定の文字コードが付与されたファイルとこのファイルの上位に位置する階層のフォルダに、正常な文字認識結果のファイルおよびフォルダとは視覚的に異なる表示を行うので、文字認識結果として保存されている大量のファイルの中から、訂正すべきファイルを容易に見つけ出すことができる。
以上説明したように本発明によれば、文字認識結果の大量のファイルの中から、訂正対象のファイルを容易に見つけ出して訂正することができる。
以下、本発明の実施の形態を図面を参照して詳細に説明する。図1は本発明に係る一つの実施形態の文字読取装置の構成を示すブロック図である。
図1に示すように、この文字読取装置は、入力部1、メモリ2、文字領域処理部3、文字認識部4、辞書5、データベース6、印字部7、訂正処理部8、表示部9を備えている。入力部1は、例えばイメージスキャナとそのインターフェース等のハードウェアと、入力された画像データを取り込むためのソフトウェア等からなる帳票イメージ読取手段と、帳票に関するデータを入力するキーボード、マウス等のユーザ操作を受け付ける手段とを含むものである。
文字領域処理部3、文字認識部4、辞書5、データベース6、印字部7、訂正処理部8、制御部10等は、コンピュータのCPU、メモリ、ハードディスク装置等のハードウェア、オペレーティングシステム(以下OSと称す)および制御ソフトウェア等が協働して実現されるものである。
入力部1では、例えば読取台にセットされた、文字の記入された帳票の表面をイメージスキャナがイメージスキャン、つまり画像を読み取って帳票イメージを取得し、メモリ2に記憶する。
メモリ2は、入力部1より入力された帳票イメージを記憶し、文字領域の切り出し等の加工処理を行う作業エリアである。このメモリ2に記憶された帳票イメージは、制御部10により制御された文字領域処理部3がメモリ2上で加工処理を行う。
文字領域処理部3は、制御部10に制御されて、メモリ2に記憶された帳票イメージに対して予め自身に設定された文字レイアウト情報(印字定義)を基に、帳票イメージのどの位置にどのように文字データが配置されているかのレイアウト解析を行い、文字列が含まれる領域(以下文字領域と称す)を切り出す処理を行う。
辞書5には、文字認識結果として出力される文字コードとこの文字コードに対応する文字画像(文字イメージ)が対応して格納されている。
文字認識部4は、文字領域処理部3によって切り出された文字領域に対して辞書5を参照して文字認識処理を実行し、文字認識結果として文字コードを得る。
印字部7は、イメージスキャナで読み取った帳票に対して帳票1枚1枚を識別(特定)するための帳票通し番号(以下Seq番号という)を印字する。Seq番号は、制御部10が新規帳票読取の際にメモリ2上でカウントし印字部7に与える。この他、帳票には、帳票の種類を識別するための帳票IDが予め印刷されている。帳票IDは、レイアウト解析の際に文字領域処理部3によって利用される。
データベース6には、バッチ管理テーブル65、子バッチ管理テーブル66、帳票情報記憶手段としての帳票管理テーブル67、入力部1より入力された認識元の帳票イメージ61、文字認識結果のテキストデータ62が記憶されている。
データベース6には、バッチ単位あるいは帳票の種別毎に階層化されたフォルダ64とそのフォルダ64の下層に分類されたフォルダ63が設けられている。帳票イメージ61及び文字認識結果のテキストデータ62は、1帳票単位に作成されたフォルダ63にファイリングされている。
すなわち、データベース6は、帳票をイメージスキャンして得た帳票イメージとこの帳票イメージから文字認識して得た文字認識結果のファイルの保管場所を、帳票の種別毎に階層的に分類し保存した保存手段である。
具体的には、例えば金融機関等の場合の支店毎に集計センタに収集される各種伝票(振込、住所変更、解約等)の場合に、個々の支店の単位がバッチ単位にあたり、伝票の種別がフォルダの単位にあたり、1枚1枚の伝票がファイルの単位にあたる。
訂正処理部8は、文字認識結果のファイルの内容を訂正するための画面である訂正画面(図6、図7参照)を表示部9へ出力し、訂正画面の訂正欄に、入力部1よりキー入力された文字で、文字認識結果を訂正し、データベース6の内容を更新する。
訂正処理部8によって表示される訂正画面(図6、図7参照)には、文字認識結果の適すデータを訂正するための訂正ウィンドウとファイルやフォルダを表示するウィンドウ(「しおりウィンドウ」、「ページウィンドウ」)とが並べて表示される。ファイルやフォルダを表示するウィンドウの「しおりウィンドウ」と「ページウィンドウ」は、タブの選択操作によって切り替えて表示することができる。
タブの選択操作によって「しおりウィンドウ」が選択され場合、訂正処理部8は、データベース6の保存場所の階層構造をファイルおよびフォルダのツリー構造で示すウィンドウを表示すると共に、文字認識時に文字認識不可能のため所定の文字コード(?等)が付与されたファイルとこのファイルの上位に位置する階層のフォルダに、正常な文字認識結果のファイルおよびフォルダとは視覚的に異なる表示を行う第1の保存場所表示手段として機能する。
タブの選択操作によって「ページウィンドウ」が選択された場合、訂正処理部8は、文字認識時に文字認識不可能のため所定の文字コード「?」が付与されたファイルと正常な文字認識結果のファイルとを視覚的に異なる縮小表示を行うページウインドウを表示する第2の保存場所表示手段として機能する。
表示部9は、訂正処理部8から出力された訂正画面等を表示するモニタ等である。
図2に示すように、バッチ管理テーブル65には、帳票を支店毎および帳票種類毎に管理するためのバッチ番号、先頭帳票通番、最終帳票通番、子バッチ数、帳票枚数、リジェクト枚数、リジェクト文字数等が記憶されている。バッチ番号が例えば支店に相当し、子バッチ数が帳票の種類に相当し、帳票枚数が同じ種類の帳票数である。リジェクト枚数は帳票枚数のうち、一つでもリジェクト文字数がカウントされた帳票がカウントされる。リジェクト文字数は、一枚の帳票の帳票イメージから文字領域を切り出して文字認識したときに、文字領域内に文字認識不可能となった文字があったときに文字コードとして「?」が付与されてカウントされる。
図3に示すように、子バッチ管理テーブル66には、帳票を子バッチの単位で管理するためのバッチ番号、子バッチ番号、先頭帳票通番、最終帳票通番、帳票枚数、リジェクト枚数、リジェクト文字数等が記憶されている。各項目の内容は上記バッチ管理テーブル65とほぼ同じである。
図4に示すように、帳票管理テーブル67は、帳票、帳票イメージおよび文字認識結果のファイルを一意に特定する帳票番号であるSeq番号に対応付けて、バッチ番号、子バッチ番号、帳票ID、リジェクト文字数が記憶されている。
バッチ番号および子バッチ番号は、データベース6の階層化された記憶場所の中で帳票イメージ及び文字認識結果のファイルがどの場所に分類および保存されているかを示している。帳票IDは、帳票の種類を識別するための固有番号である。リジェクト文字数は、文字認識結果の文字コード変換状況を示す情報であり、リジェクト文字数に数値が入っていた場合は、文字認識時に文字認識不可能のため所定の文字コード、例えば「?」等が付与されていることを示している。
すなわち、この帳票管理テーブル67は、帳票、帳票イメージおよび文字認識結果のファイルを一意に特定するSeq番号に対応付けて、文字認識結果の文字コード変換状況を示す情報と、帳票が前記データベース6の階層構造の中でどの場所に分類および保存されているかを示すバッチ番号とを記憶する帳票情報記憶手段である。
訂正処理部8は、帳票管理テーブル67のバッチ番号と帳票番号を基に、訂正画面に、データベース6の階層構造をファイルおよびフォルダのツリー構造で示すしおりウィンドウ(図6)を表示すると共に、文字認識時に文字認識不可能のため所定の文字コード(?等)が付与されたファイルとこのファイルの上位に位置する階層のフォルダに、正常な文字認識結果のファイルおよびフォルダとは視覚的に異なる表示を行う訂正処理手段として機能する。
訂正処理部8は、帳票管理テーブル67のバッチ番号と帳票番号を基に、訂正画面に、データベース6に保存されているファイルを縮小表示するページウィンドウ(図7)を表示すると共に、文字認識時に文字認識不可能のため所定の文字コード「?」が付与されたファイルに、正常な文字認識結果のファイルとは視覚的に異なる表示を行う訂正処理手段として機能する。
視覚的に異なる表示とは、例えば?等が付与されたファイルとフォルダを赤色で表示する等である。
以下、図5乃至図7を参照してこの文字読取装置の動作を説明する。
図5はこの文字読取装置の動作を示すフローチャート、図6、図7は訂正画面のタブ毎のウィンドウの一例を示す図である。
この場合、読取台に帳票がセットされ、入力部1に帳票IDがキー入力され、読取スタートボタンが押されると、入力部1は、帳票の読み取りが始めてであれば、バッチ番号をメモリ2に設定し(S101)、続いて帳票通番であるSeq番号をメモリ2に設定し(S102)、CCDセンサ等を駆動して帳票の表面をイメージスキャンすることで、帳票の画像データである帳票イメージをメモリ2に取り込む(S103)。
帳票イメージがメモリ2に取り込まれると、文字領域処理部3は、メモリ2に記憶された帳票イメージに対して、帳票IDに該当する文字レイアウト情報を用いて帳票上の文字のレイアウトを解析し(S104)、初めの文字領域を切り出し(S105)、メモリ2に展開する。
文字認識部4は、メモリ2に展開されている文字領域について辞書5の文字イメージとのイメージマッチングによる文字認識を行い(S106)、一致あるいは類似する文字イメージに対応する文字コードを辞書5より読み出して文字認識結果とする。なお、入力部1から帳票IDがキー入力されない場合は、初めの文字領域は、帳票IDが記入された文字領域であり、文字認識部4は、初めの文字領域を文字認識して、帳票の種類を特定し、文字レイアウト情報を得る。
文字認識の結果、一致あるいは類似する文字イメージが辞書5に存在せず、文字認識が不可能であった場合、文字認識部4は、リジェクト文字として、「?」を付与し、リジェクト文字ありとし(S107のYes)、バッチ管理テーブル65、子バッチ管理テーブル66、帳票管理テーブル67のリジェクト文字数の欄にリジェクト文字を計数、つまりプラス1する(S108)。
そして、文字認識部4は、文字レイアウト情報に従ってメモリ2の帳票イメージから文字領域を順に切り出して文字認識を繰り返し(S105〜S109)、文字認識すべき文字領域がなくなると、バッチ管理テーブル65、子バッチ管理テーブル66の帳票枚数の欄に枚数を計数、つまりプラス1すると共に、1つの帳票イメージの中で、文字認識結果として「?」が付与された文字が1つでもあった場合にリジェクト枚数の欄にリジェクト枚数を計数、つまりプラス1する(S110)。なお、1つの帳票イメージの中で、「?」が付与された文字が1つもない場合は、リジェクト枚数は、加算されない。
1枚の帳票の文字読取処理が終了すると、制御部10は、メモリ2に記憶されている文字認識結果のテキストファイルと帳票イメージとを、バッチ番号および子バッチ番号に基づいてデータベース6に生成した保存場所であるフォルダへ保存する(S111)。なお、OS環境の違いにより保存場所をディレクトリという場合もある。
また、制御部10は、1枚の帳票の文字読取処理が終了すると、印字部7に対してSeq番号を与えて印字を指示し、印字部7は、帳票の一方の面にSeq番号を印字して(S112)、帳票を排出する。
そして、制御部10は、S102の処理に戻り、次の帳票について上記S102〜S113までの処理を繰り返し、同じバッチ番号の次の帳票があるかどうかを判定し(S113)、同じバッチ番号の次の帳票がなくなると(S113のNo)、制御部10は、S101の処理に戻り、次のバッチ番号の帳票処理を行う。
次に、読み取ったテキストデータの訂正処理について説明する。
データベース6に保存したテキストデータを訂正する場合、文字認識結果のテキストデータだけでなく、認識元の帳票の記載内容を見て比較する必要があるが、実際の帳票は別に処理が進められることがあるため、文字認識結果のテキストデータと認識元の帳票イメージとを表示させる訂正画面を表示することになる。
この場合、データがバッチ処理でデータベース6に保存されているため、訂正作業者は、大量に読取処理された中から、訂正が必要なテキストデータをデータベース6から見つけ出して訂正を行う必要がある。
そこで、この文字読取装置では、入力部1から訂正処理部8を起動する操作を行うことで、訂正処理部8は、図6に示すような訂正画面(図6,図7参照)を表示する。
訂正画面は、文字認識結果のファイルの内容を訂正するための画面であり、図6に示すように、しおりウィンドウと訂正ウィンドウとが並べられて表示される。訂正ウィンドウには文字認識結果を訂正するため欄が設けられており、しおりウィンドウで指定されたファイルの内容が表示されれ。
しおりウィンドウは、データベース6の文字認識結果のファイルが保存されているフォルダの階層構造をファイルおよびフォルダの親子関係を線で連結したツリー構造で示すウィンドウである。各ファイルおよびフォルダの中には、帳票IDが表示されている。
帳票IDは帳票の種類を識別するためのものであり、例えば帳票ID「100、200…」は、合計が記述された帳票、帳票ID「110、120…」は、小計が記述された帳票、帳票ID「111,112,113…」は、詳細が記述された帳票等というように階層が分けられている。階層化されているファイルおよびフォルダは、折りたたむことができる。つまり、上位のフォルダの中に下位のフォルダおよびファイルをしまうことができる。
しおりウィンドウに表示されるファイルおよびフォルダのうち、文字認識時に文字認識不可能のため所定の文字コード「?」が付与されたファイル43,44とこれらのファイル43,44の上位に位置する階層のフォルダ42,41は、例えば赤色で表示(図では斜線表示)され、正常な文字認識結果のファイルおよびフォルダは、通常、黄色(図では白抜き)で表示され、互いのファイルおよびフォルダは、視覚的に異なる表示が行われる。
しおりウィンドウに表示されたファイルおよびフォルダのうち、赤色のフォルダを開いて、その中の所望のファイル、例えばファイル43等の位置にポインタ45を移動させてマウスでクリック操作(選択操作)すると、訂正処理部8は、該当ファイル43の内容、つまり、データベース6の文字認識結果のテキストファイルの内容を訂正ウィンドウの該当欄に表示する。
この訂正ウィンドウの少なくとも1つの欄、例えば数量欄40等には「?」が挿入されているので、その数量欄40の「?」に対する読取元帳票の記入欄の該当箇所の文字を訂正作業者が目視で確かめ、その欄に正して文字(テキストコード)をキー入力することで、文字認識時に文字認識不可能だった文字を正しい文字に訂正することができる。
なお、読取元帳票としては、データベース6に、文字認識結果のテキストファイルに対応させて帳票イメージが保存されているので、紙の帳票自体を使わずに、データベース6の帳票イメージを指定して画面にホップアップ表示させる等して、確認してもよい。
しおりウィンドウには、タブ46,47が設けられている。これらのタブ46,47のうち、タブ47の位置にポインタ45を移動させてマウスでクリック操作(選択操作)すると、訂正処理部8は、訂正画面を切り替え、図7に示すように、ページウィンドウと訂正ウィンドウとを並べた訂正画面を表示する。
図7に示すように、この訂正画面のページウィンドウには、データベース6に保存されている文字認識結果のファイルのサムネイルが一覧表示される。この例の場合、サムネイルは、縦に一列に表示されている。各サムネイルの下部には、それぞれのSeq番号が表示される。Seq番号により読み取り元の帳票を特定できる。
上記同様に、文字認識結果のファイルの中には、文字認識時に文字認識不可能のため「?」が付与されたファイルと、すべて文字認識することができたファイルがある。「?」が付与されたファイルのサムネイル51は、赤色で表示され、すべて文字認識することができたファイルとは視覚的に異なる表示がなされる。
この訂正画面において、所望のサムネイル、例えばサムネイル51等の位置にポインタ45を移動させると、訂正処理部8は、そのファイルのSeq番号と帳票IDをホップアップ表示画面52に表示し、ポインタ45をサムネイル51の位置から外すと、ホップアップ表示画面52を非表示にする。なお、Seq番号と帳票IDだけでなく、支店コード等のキーワードを表示しても良い。
通常であれば、ホップアップ表示画面52等のサブ画面を表示するには、ポインタの移動、マウスボタンのクリック操作という最低2つの操作が必要であり、サブ画面を消す際にも消す操作が必要であったため、訂正作業の際の画面操作回数を少なくすることができる。これは、訂正だけを集中的に行う連続作業では作業時間の削減に大きな効果となる。
また、この訂正画面から、タブ46を選択操作することで、訂正処理部8は、図6の訂正画面へ画面を切り替えて表示する。
このようにこの実施形態の文字読取装置によれば、文字認識結果に応じて各帳票(ページ)を階層化して訂正画面にしおりウィンドウを表示すると共に、しおりウィンドウには、文字認識不能の文字があるファイルとその上位のフォルダを赤色で表示することで、目的帳票を視覚的に簡単に探し出すことができる。
また、訂正画面に、文字認識結果のファイルをサムネイルの形態で表示すると共に、文字認識不能の文字があるファイルを赤色で表示することで、目的帳票を視覚的に簡単に探し出すことができる。
さらに、訂正画面に表示するしおりウィンドウとページウィンドウとをタブ46,47で切り替え可能にしたことで、最上位から最下位のフォルダまでをしおりウィンドウでたどり、最下位のフォルダの中身については、ページウィンドウに切り替えてサムネイル一覧から選択する等といった操作ができ、このように両方のウィンドウを併用することで目的帳票に最短時間でたどり着くことができる。この文字読取装置は、章立てされたテキストデータの処理に適している。
なお、本発明は上記実施形態のみに限定されるものではない。上記実施形態では、「?」が付与されていたファイルおよびその上位のフォルダを赤色で表示したが、この他、ファイルおよびフォルダの枠線を太く表示しても良く、本発明は、他のファイルおよびフォルダと視覚的に区別できれば、表示形態に限定されるものではない。
また、上記実施形態では、サムネイルを縦に一列に表示したが、この他、横に一列に表示しても良く、縦横にまとめて表示しても良い。
本発明の一つの実施形態の文字読取装置の構成を示すブロック図。 図1の文字読取装置のバッチ管理テーブルの内容を示す図。 図1の文字読取装置の子バッチ管理テーブルの内容を示す図。 図1の文字読取装置の帳票管理テーブルの内容を示す図。 この文字読取装置の動作を示すフローチャート。 訂正画面の一例を示す図。 訂正画面の一例を示す図。
符号の説明
1…入力部、2…メモリ、3…文字領域処理部、4…文字認識部、5…辞書、6…データベース、7…印字部、8…訂正処理部、9…表示部、10…制御部、40…数量欄、42,41…フォルダ、43,44…ファイル、45…ポインタ、46,47…タブ、47…タブ、51…サムネイル、52…ホップアップ表示画面、61…帳票イメージ、62…テキストデータ、63,64…フォルダ、65…バッチ管理テーブル、65…バッチ管理テーブル、66…子バッチ管理テーブル、67…帳票管理テーブル。

Claims (3)

  1. 帳票をイメージスキャンして得た帳票イメージとこの帳票イメージから文字認識して得た文字認識結果のファイルの保管場所を、帳票の種別毎に階層的に分類し保存した保存手段と、
    帳票、帳票イメージおよび文字認識結果のファイルを一意に特定する帳票番号と、文字認識が不可能であることを示す所定の文字コードの有無を示す情報と、帳票が前記保存手段の階層構造の中でどの場所に分類および保存されているかを示すバッチ番号とを対応付けて記憶する帳票情報記憶手段と、
    前記帳票情報記憶手段のバッチ番号と帳票番号を基に、文字認識結果のファイルの内容を訂正するための画面に、前記保存手段の階層構造をファイルおよびフォルダのツリー構造で示すウィンドウを表示すると共に、前記文字コードの有無を示す情報に基づいて、前記所定の文字コードが付与されたファイルとこのファイルの上位に位置する階層のフォルダに、前記所定の文字コードが付与されていないファイルおよびフォルダとは視覚的に異なる表示を行う訂正処理手段と
    を具備したことを特徴とする文字読取装置。
  2. 帳票をイメージスキャンして得た帳票イメージとこの帳票イメージから文字認識して得た文字認識結果のファイルの保管場所を、帳票の種別毎に階層的に分類し保存した保存手段と、
    帳票、帳票イメージおよび文字認識結果のファイルを一意に特定する帳票番号と、文字認識が不可能であることを示す所定の文字コードの有無を示す情報と、帳票が前記保存手段の階層構造の中でどの場所に分類および保存されているかを示すバッチ番号とを対応付けて記憶する帳票情報記憶手段と、
    前記帳票情報記憶手段のバッチ番号と帳票番号を基に、文字認識結果のファイルの内容を訂正するための画面に、前記保存手段に保存されているファイルを縮小表示するウィンドウを表示すると共に、前記文字コードの有無を示す情報に基づいて、前記所定の文字コードが付与されたファイルと、前記所定の文字コードが付与されていないファイルとで視覚的に異なる表示を行う訂正処理手段と
    を具備したことを特徴とする文字読取装置。
  3. 帳票をイメージスキャンして得た帳票イメージとこの帳票イメージから文字認識して得た文字認識結果のファイルの保管場所を、帳票の種別毎に階層的に分類し保存した保存手段と、
    帳票、帳票イメージおよび文字認識結果のファイルを一意に特定する帳票番号と、文字認識が不可能であることを示す所定の文字コードの有無を示す情報と、帳票が前記保存手段の階層構造の中でどの場所に分類および保存されているかを示すバッチ番号とを対応付けて記憶する帳票情報記憶手段と、
    前記帳票情報記憶手段のバッチ番号と帳票番号を基に、文字認識結果のファイルの内容を訂正するための訂正画面を表示する訂正画面表示手段と、
    前記訂正画面において、前記保存手段の階層構造をファイルおよびフォルダのツリー構造で示すウィンドウを表示すると共に、前記文字コードの有無を示す情報に基づいて、前記所定の文字コードが付与されたファイルとこのファイルの上位に位置する階層のフォルダに、前記所定の文字コードが付与されていないファイルおよびフォルダとは視覚的に異なる表示を行う第1の保存場所表示手段と、
    前記訂正画面において、前記文字コードの有無を示す情報に基づいて、前記所定の文字コードが付与されたファイルと、前記所定の文字コードが付与されていないファイルとを視覚的に異なる縮小表示を行うウィンドウを表示する第2の保存場所表示手段と、
    前記第1の保存場所表示手段によるウィンドウ表示と第2の保存場所表示手段によるウインドウ表示とを、ユーザの操作に応じて切り替える表示切替手段と
    を具備したことを特徴とする文字読取装置。
JP2004289372A 2004-09-30 2004-09-30 文字読取装置 Expired - Fee Related JP4130429B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004289372A JP4130429B2 (ja) 2004-09-30 2004-09-30 文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004289372A JP4130429B2 (ja) 2004-09-30 2004-09-30 文字読取装置

Publications (2)

Publication Number Publication Date
JP2006106905A JP2006106905A (ja) 2006-04-20
JP4130429B2 true JP4130429B2 (ja) 2008-08-06

Family

ID=36376605

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004289372A Expired - Fee Related JP4130429B2 (ja) 2004-09-30 2004-09-30 文字読取装置

Country Status (1)

Country Link
JP (1) JP4130429B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009230658A (ja) * 2008-03-25 2009-10-08 Mitsubishi Electric Corp 文字検索システム
JP7464068B2 (ja) 2021-11-29 2024-04-09 株式会社リコー 取引管理システム、取引管理方法

Also Published As

Publication number Publication date
JP2006106905A (ja) 2006-04-20

Similar Documents

Publication Publication Date Title
US7610274B2 (en) Method, apparatus, and program for retrieving data
US6400845B1 (en) System and method for data extraction from digital images
US20080170786A1 (en) Image processing system, image processing method, and image processing program
JP7483384B2 (ja) 文書を電子化する画像処理システム、その制御方法及びプログラム
WO2004088970A1 (ja) 文書ファイルデータのパラメータを変更する画像形成装置
US11710329B2 (en) Image processing apparatus with automated registration of previously encountered business forms, image processing method and storage medium therefor
US8023735B2 (en) Image processing apparatus for extracting representative characteristic from image data and storing image data to be associated with representative characteristic
US20230206672A1 (en) Image processing apparatus, control method of image processing apparatus, and storage medium
JP4130429B2 (ja) 文字読取装置
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
EP0519713B1 (en) Character input method and apparatus
JP4964080B2 (ja) 画像処理システム、画像処理方法、画像処理プログラム
JP3979288B2 (ja) 文書検索装置および文書検索プログラム
JPH06103411A (ja) 文書読取装置
US20060206793A1 (en) Document file management apparatus, document file management method and document file management program
JPH10187751A (ja) 認識データ処理装置およびそのプログラム記録媒体
JP3296858B2 (ja) 画像ファイリング方法
JP4431318B2 (ja) 文書管理プログラム
US20060203258A1 (en) File management apparatus
US20230273952A1 (en) Image processing apparatus, image processing method, and storage medium
JPH0728801A (ja) イメージデータ処理方法及びその装置
JPH0816571A (ja) 漢字入力装置
JPH0997324A (ja) 名刺管理装置
US20060206792A1 (en) Document file management apparatus, document file management method and document file management program
JP2005266925A (ja) 帳票読取装置、プログラム及び帳票読取装置による帳票読取方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080418

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080520

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080521

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110530

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110530

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120530

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120530

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130530

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130530

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140530

Year of fee payment: 6

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees