JP2000105796A - 文字読み取りシステムおよび同システムにおける読み取り結果訂正処理方法 - Google Patents

文字読み取りシステムおよび同システムにおける読み取り結果訂正処理方法

Info

Publication number
JP2000105796A
JP2000105796A JP10273672A JP27367298A JP2000105796A JP 2000105796 A JP2000105796 A JP 2000105796A JP 10273672 A JP10273672 A JP 10273672A JP 27367298 A JP27367298 A JP 27367298A JP 2000105796 A JP2000105796 A JP 2000105796A
Authority
JP
Japan
Prior art keywords
reading
character
field
error
correction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10273672A
Other languages
English (en)
Inventor
Makoto Ueda
誠 上田
Takehiko Hanada
剛彦 花田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Software Engineering Corp
Original Assignee
Toshiba Corp
Toshiba Software Engineering Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Software Engineering Corp filed Critical Toshiba Corp
Priority to JP10273672A priority Critical patent/JP2000105796A/ja
Publication of JP2000105796A publication Critical patent/JP2000105796A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】訂正すべきフィールドに関する情報のみを呈示
できる訂正専用画面を作成できるようにし、訂正処理作
業の効率向上を図る。 【解決手段】OCR読み取りモジュール11は、帳票の
読み取り結果に従って、文字コード、読み取りエラーが
発生した文字位置を示すエラー情報、および帳票全体の
イメージ情報を含む中間ファイルを作成し、中間ファイ
ル記憶部22に格納する。リジェクトエラー訂正モジュ
ール12のリジェクトエラー訂正専用画面作成モジュー
ル31は、中間ファイルに含まれるエラー情報に基づい
て、エラー発生した文字位置が属するフィールドを検出
し、そのフィールドのイメージを帳票全体のイメージ情
報から切り出す。そして、訂正すべきフィールドの文字
読み取り結果とそのフィールドのイメージから構成され
るエラー訂正用画面が作成される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、読み取り制御情報
を用いて帳票からの文字読み取り処理およびその読み取
り結果の訂正処理を行う文字読み取りシステムおよび同
システムにおける読み取り結果訂正処理方法に関する。
【0002】
【従来の技術】従来より、帳票から文字を読み取る文字
読み取りシステム(OCRシステム)が知られている。
このOCRシステムは、帳票からの文字読み取り処理を
行う読み取り処理、その読み取り結果を訂正する訂正処
理、および読み取り結果(または訂正処理後の読み取り
結果)を所定の出力フォーマットに変換して出力する出
力変換処理から構成されている。これら読み取り処理、
訂正処理、出力変換処理処理では、フォーマット制御
(FC;Format Control)情報と称され
る読み取り制御情報(以下、FC情報と称する)が用い
られる。
【0003】また、従来より、訂正処理の効率化等のた
め、複数台のワークステーションやパーソナルコンピュ
ータをネットワーク接続し、1台(もしくは複数台)を
文字読み取り処理専用の読み取り用端末として使用し、
残りの複数台を訂正・出力変換専用の訂正用端末として
使用するマルチコレクションシステムが使用されてい
る。
【0004】このマルチコレクションシステムでは、複
数台の訂正用端末によって訂正・出力変換処理を並列的
に実行することができると共に、読み取り用端末によっ
て得られた読み取り結果をファイル(以下、中間ファイ
ルと称する)として生成することにより、複数台の訂正
用端末による訂正・出力変換処理と、読み取り用端末に
よる読み取り処理とを非同期に実行することができる。
【0005】このようなマルチコレクションシステムに
おいては、通常、読み取り用端末と訂正用端末は互いに
異なる場所に存在するので、訂正用端末では、読み取り
用端末で用いた帳票そのものを参照することは出来な
い。このため、読み取り結果の文字コードのみならず、
帳票イメージも中間ファイルとして読み取り用端末から
訂正用端末に送信される。訂正用端末には文字読み取り
結果と帳票イメージが画面表示され、訂正用端末の利用
者は、その画面上で帳票イメージを参照しながらリジェ
クトエラー訂正などの訂正処理作業を行う。
【0006】しかし、従来では、エラー発生の有無に関
わらず、帳票内に含まれる全フィールドについて、その
読み取り結果(認識文字)とイメージが表示される構成
であり、認識できずに捨て文字となったリジェクトエラ
ーがどのフィールドに発生しているかを調べるために
は、人間による目視によって、リジェクト位置を示す特
定の記号、例えば「?」を、画面から探すことが必要と
された。この作業は帳票内に含まれるフィールド数が比
較的少ない場合にはさほど問題とはならないが、最近で
は、100から200個ものフィールドを含む帳票が増
えており、目視によってエラー発生位置を見つける作業
は非常に困難となっている。
【0007】
【発明が解決しようとする課題】上述のように、従来で
は、エラー発生の有無に関わらず、帳票内に含まれる全
フィールドの文字読み取り結果とイメージが画面表示さ
れてしまい、リジェクトエラーがどのフィールドに発生
しているかを調べるための作業が困難であった。
【0008】本発明はこのような事情に鑑みてなされた
ものであり、訂正すべきフィールドに関する情報のみを
呈示できる訂正専用画面を作成できるようにし、訂正処
理作業の効率向上を図ることが可能な文字読み取りシス
テムおよび同システムにおける読み取り結果訂正処理方
法を提供することを目的とする。
【0009】
【課題を解決するための手段】上述の課題を解決するた
め、本発明は、読み取り制御情報を用いて帳票からの文
字読み取り処理およびその読み取り結果の訂正処理を行
う文字読み取りシステムにおいて、前記文字読み取り処
理の結果に基づいて生成された、文字コード、読み取り
エラーが発生した文字位置を示すエラー情報、および帳
票全体のイメージ情報を含む中間ファイルを用いて、前
記訂正処理のためのエラー訂正用画面を作成する画面作
成手段を具備し、前記画面作成手段は、前記エラー情報
に基づいて、エラー発生した文字位置が属するフィール
ドを検出する手段と、その検出したフィールドのイメー
ジを前記帳票全体のイメージ情報から切り出す手段とを
含み、エラー発生した文字位置が属するフィールドの文
字読み取り結果およびそのフィールドのイメージから構
成されるエラー訂正用画面を作成することを特徴とす
る。
【0010】この文字読み取りシステムにおいては、エ
ラー情報に基づいて、エラー発生した文字位置が属する
フィールドが検出され、そのフィールドのイメージが帳
票全体のイメージ情報から切り出される。そして、訂正
すべきフィールドの文字読み取り結果とそのフィールド
のイメージのみがエラー訂正用画面上に表示される。よ
って、訂正処理とは無関係のフィールドは表示されなく
なるので、従来に比し、リジェクトエラーがどのフィー
ルドに発生しているかを調べるための目視による作業が
軽減され、訂正処理の作業効率の向上を図ることが可能
となる。
【0011】また、前記読み取り制御情報には、前記帳
票上に配置された複数のフィールドの中で互いに関連す
るフィールド同士を関連づけるためのフィールドグルー
プ情報を定義しておき、前記画面作成手段には、エラー
発生した文字位置が属するフィールド毎にそのフィール
ドに関連する他のフィールドの文字コードを前記中間フ
ァイルから抽出する手段をさらに設け、エラー発生した
文字位置が属するフィールドの文字読み取り結果および
そのフィールドのイメージと、そのフィールドに関連す
る他のフィールドの文字読み取り結果とを対応付けて前
記エラー訂正用画面上に表示することが好ましい。これ
により、エラー発生したフィールドのみならず、そのフ
ィールドに密接に関係する他のフィールドの情報も表示
されるので、どのような訂正を行うべきかを他のフィー
ルドの内容から容易に推測することが可能となる。
【0012】また、前記読み取り制御情報には、前記帳
票上に配置された複数のフィールド毎にそれに対応する
前記帳票上の見出し語を示すタイトル情報を定義してお
き、前記画面作成手段には、エラー発生した文字位置が
属するフィールド毎にそのフィールドに対応する見出し
語を前記読み取り制御情報から抽出する手段をさらに設
け、エラー発生した文字位置が属するフィールドの文字
読み取り結果およびそのフィールドのイメージと、その
フィールドの見出し語とを対応付けて前記エラー訂正用
画面上に表示することが好ましい。これにより、フィー
ルド内の情報のみならず、そのフィールドに関する帳票
上の見出し語も一緒に訂正用画面に表示されるようにな
る。特に、エラー発生した文字位置が属するフィールド
毎にそのフィールドに対応する見出し語を読み取り制御
情報から抽出するという構成を採用しているため、実際
の帳票上では、見出し語が遠くに配置されているフィー
ルドであっても、その見出し語とフィールドとを対応付
けて表示することが可能となる。
【0013】また、帳票からの文字読み取り処理を実行
する読み取り用端末と、この読み取り用端末にネットワ
ーク接続され、前記文字読み取り処理によって得られた
読み取り結果を用いて、前記読み取り結果の訂正処理を
実行する複数の訂正用端末とを含み、帳票からの文字読
み取り処理、およびその読み取り結果の訂正処理を実行
する文字読み取りシステムにおいては、エラーフィール
ドのイメージ切り出しを、訂正用端末側ではなく、読み
取り用端末側で行うことも可能である。これにより、中
間ファイルとして読み取り用端末側から訂正用端末側に
送信すべきデータ量を低減でき、転送効率の向上を図る
ことができる。
【0014】
【発明の実施の形態】以下、図面を参照して本発明の実
施形態を説明する。図1には、本発明の一実施形態に係
る文字読み取りシステム(以下、OCRシステムと称す
る)の基本構成が示されている。このOCRシステムは
各種伝票などの帳票から文字を読み取り、その読み取り
結果のチェック・訂正を行った後に所定の出力ファイル
形式に変換してユーザアプリケーションに渡すためのも
のであり、図示のように、OCR読み取りモジュール1
1、リジェクトエラー訂正モジュール12、出力変換モ
ジュール13、FC情報記憶部21、中間ファイル記憶
部22、および出力ファイル記憶部23から構成されて
いる。OCR読み取りモジュール11、リジェクトエラ
ー訂正モジュール12、出力変換モジュール13はそれ
ぞれソフトウェアによって実現されている。リジェクト
エラー訂正モジュール12および出力変換モジュール1
3による訂正処理および出力変換処理では、OCR読み
取りモジュール11による読み取り処理で用いられたF
C情報と同一のFC情報が用いられる。
【0015】FC情報記憶部21には、FC情報が記憶
されている。FC情報は、前述したように、帳票読み取
り、訂正、出力変換のための定義情報であり、1)読み
取り対象帳票のフォーマット定義情報、2)読み取り性
能向上のための知識処理定義情報、3)読み取り結果の
チェック・訂正のための画面定義を含む訂正用情報、
4)読み取り結果の編集および出力ファイルのフォーマ
ット変換のための出力定義情報、等から構成されてい
る。さらに、本実施形態では、訂正専用画面を効率よく
作成するために、フィールド間のグループ定義情報や、
各フィールドの見出し語を示すタイトル定義情報なども
FC情報内に含まれている。これらグループ定義情報、
タイトル定義情報の詳細は、図8で後述する。
【0016】OCR読み取りモジュール11は、FC情
報記憶部21に記憶されているFC情報に従って帳票か
ら文字を読み取るためのソフトウェアモジュールであ
り、スキャナ等によって読み込まれた帳票イメージから
フィールドおよび文字の切り出しを行い、そして各文字
パターンを、良く知られたパターン解析、構造解析処
理、知識処理などを用いた文字認識処理を得て文字コー
ドに変換する。そして、OCR読み取りモジュール11
では、その読み取り結果データが、認識文字コード、認
識不能の捨て文字(リジェクト文字)の発生位置を示す
リジェクトパターンデータ、類似文字の候補を示す候補
文字情報、さらには帳票全体のイメージ情報などを含む
中間ファイルとして生成され、それが中間ファイル記憶
部22に記憶される。
【0017】リジェクトエラー訂正モジュール12は、
FC情報記憶部21に記憶されているFC情報で規定さ
れた画面定義などに従って中間ファイルからリジェクト
エラー訂正専用画面を作成し、そしてその訂正専用画面
上で行われるユーザからの入力操作に従ってリジェクト
エラー訂正などのエラー訂正処理を行う。リジェクトエ
ラー訂正専用画面は、リジェクトエラー訂正モジュール
12内に設けられたリジェクトエラー訂正専用画面作成
モジュール31によって作成される。この場合、リジェ
クトエラーが生じたフィールドのイメージが帳票全体の
イメージから切り出され、リジェクトエラー訂正専用画
面には、リジェクトエラーが生じたフィールドのイメー
ジと、そのフィールドの文字認識結果が表示される。フ
ィールド内のリジェクト文字に対応する位置には、文字
の代わりに「?」などの記号が表示され、ユーザによっ
て文字コードがキー入力されると、「?」の記号が入力
文字コードに置き換えられる。
【0018】また、リジェクトエラー訂正モジュール1
2では、帳票全体のイメージ情報と読み取り結果を合わ
せて画面表示して、読み取り結果とイメージとの読み合
わせなどの処理を行うこともできる。
【0019】出力変換モジュール13は、FC情報記憶
部21に記憶されているFC情報で規定された出力ファ
イル形式に従って、リジェクトエラー訂正モジュール1
2による訂正が反映された中間ファイル(エラー無しの
場合は、訂正処理が行われてない中間ファイル)上の読
み取り結果を出力ファイルに変換し、それをユーザアプ
リケーションに渡すために出力ファイル記憶部23に格
納する。
【0020】図2には、リジェクトエラー訂正専用画面
作成モジュール31による画面作成処理の手順が示され
ている。まず、中間ファイルに含まれるリジェクトパタ
ーンデータに基づいて、リジェクトエラーが発生した文
字を含むフィールドの検出が行われ、そのエラー発生フ
ィールドの文字コードおよびイメージが中間ファイルか
ら抽出される(ステップS101)。この場合、エラー
発生フィールドのイメージについては、中間ファイルに
含まれている帳票全体のイメージ情報から切り出され
る。
【0021】次に、FC情報に含まれる画面定義に従っ
て、エラー発生フィールドの文字読み取り結果(認識文
字)とそのフィールドのイメージが画面上に配置され
て、エラー訂正専用画面が作成される(ステップS10
2)。そして、その作成されたエラー訂正専用画面が訂
正処理用の端末に画面表示される(ステップS10
3)。
【0022】このように、エラー発生フィールドの情報
のみを抽出してエラー訂正専用画面を作成することによ
り、訂正処理とは無関係のフィールドは表示されなくな
る。よって、従来に比し、リジェクトエラーがどのフィ
ールドに発生しているかを調べるための目視による作業
が軽減され、訂正処理の作業効率の向上を図ることが可
能となる。
【0023】図3には、本OCRシステムを用いたマル
チコレクションシステムの構成例が示されている。この
マルチコレクションシステムは、前述したように、複数
台のワークステーションやパーソナルコンピュータをネ
ットワーク接続し、1台(もしくは複数台)を文字読み
取り処理専用の読み取り用端末として使用し、残りの複
数台を訂正・出力変換専用の訂正用端末として使用する
システムである。このマルチコレクションシステムに
は、読み取り用端末と訂正用端末とを営業所や事業所な
どの同一サイト内に配置するインハウス型のものと、読
み取り用端末と訂正用端末とを異なるサイトに配置し
て、その間を公衆網や専用回線を用いて接続する遠隔シ
ステム型のものとがあるが、ここでは、遠隔システム型
の構成について説明する。
【0024】読み取り処理を行うための読み取りサイト
においては、図示のように読み取り端末101と、帳票
読み取り用のスキャナおよび専用の文字認識装置から構
成されるOCR装置102と、FC情報記憶部103が
設けられる。読み取り端末101では、前述のOCR読
み取りモジュール11が実行される。このOCR読み取
りモジュール11によって認識処理を全てソフトウェア
で実行する場合には、OCR装置102の代わりに、帳
票読み取り用のスキャナのみを設ければよい。
【0025】読み取り端末101は、公衆網や専用回線
から構成されるネットワーク201を介して、各訂正・
出力サイトのサーバコンピュータ301に接続されてい
る。各訂正・出力サイトには、サーバコンピュータ30
1の他、FC情報記憶部302、中間ファイル記憶部3
03、サーバコンピュータ301にLAN経由で接続さ
れた複数台の訂正用端末(訂正クライアント)304が
配置されている。各訂正用端末(訂正クライアント)3
04では、前述のリジェクトエラー訂正モジュール12
および出力変換モジュール13が実行される。
【0026】このマルチコレクションシステムにおいて
は、読み取り端末101による読み取り処理にて、認識
文字コード、リジェクトパターンデータ、帳票全体のイ
メージ情報などを含む中間ファイルが生成され、それが
ネットワーク201を通じて訂正・出力サイトに送信さ
れ、中間ファイル記憶部303に記憶される。中間ファ
イル記憶部303に記憶された中間ファイルはサーバコ
ンピュータ301によって、各訂正クライアント304
に分配される。各訂正クライアント304では、前述し
たリジェクト訂正専用画面が作成され、その画面上で訂
正処理が行われる。
【0027】なお、読み取りサイトから訂正・出力サイ
トへの中間ファイルの送信は、読み取り端末101およ
びサーバコンピュータ301にネットワーク接続された
ホストコンピュータ401経由で実行するようにしても
よい。また、各訂正クライアント304では訂正処理の
みを行い、訂正処理された中間ファイルをホストコンピ
ュータ401に送信し、そのホストコンピュータ401
にて出力変換処理を行うこともできる。
【0028】次に、図4乃至図6を参照して、リジェク
トエラー訂正専用画面の構成例について説明する。図4
(A)は200個のフィールドを含む帳票の読み取り結
果であり、ここでは、フィールド2,5,10にリジェ
クトエラーが発生している。リジェクトエラー発生位置
は、記号「?」によって示される。この場合、リジェク
トエラー訂正専用画面上には、図4(B)に示すよう
に、リジェクトエラーが発生したフィールド2,5,1
0のそれぞれについてのみ、その文字認識結果とイメー
ジとが対応付けられて表示される。
【0029】また、図5(A)のようにリジェクトエラ
ーが発生したフィールドが1つだけの場合には、そのフ
ィールド(フィールド150)の文字認識結果とイメー
ジだけが図5(B)のように画面表示されることにな
る。
【0030】一枚のリジェクトエラー訂正専用画面に表
示可能なフィールド数は制限されており、リジェクトエ
ラーが発生したフィールドの数が制限値を越える場合に
は、複数のリジェクトエラー訂正専用画面が作成され
る。この様子を図6に示す。
【0031】図6は、フィールド2,5,100,11
1,120,130,147,148,150にエラー
が発生した場合のリジェクトエラー訂正専用画面例であ
り、1画面当たり3フィールド分の表示に制限されてい
る場合には、図示のように、3枚の画面が作成される。
これら各画面の右上には、「1/n」の形式で画面番号
情報が表示される。このように画面単位に分割してエラ
ー発生フィールドの文字認識結果とイメージを表示する
ことにより、画面スクロールなどの処理が不要となり、
訂正し忘れなどのミスを防止することができる。
【0032】次に、ある特定の帳票フォーマットを想定
して、リジェクトエラー訂正専用画面の具体例を説明す
る。ここでは、図7に示されているように、10個のフ
ィールドから構成される帳票を想定する。フィールド
1,2,3はそれぞれ「年」、「月」、「日」を記入す
るためのフィールドであり、これらフィールド1,2,
3の左上には見出し語「年」、「月」、「日」が印刷さ
れている。フィールド4,5,6はそれぞれある物品に
ついての「単価」、「個数」、「金額」を記入するため
のフィールド、同様に、フィールド4,5,6も他の物
品についての「単価」、「個数」、「金額」を記入する
ためのフィールドである。また、フィールド10は、フ
ィールド6と9の合計金額を記入するためのフィールド
である。
【0033】この帳票フォーマットに対応するFC情報
の一部を図8に示す。ここでは、読み取り定義(フォー
マット定義)と、エラー訂正画面作成用の画面作成用定
義についてのみ説明する。
【0034】読み取り定義(フォーマット定義)は、フ
ィールド1〜10それぞれのフォーマットを定義したも
のであり、各フィールド毎にそのフィールド桁数、文字
種、フィールド位置の他、画面作成用定義#2へのポイ
ンタ情報がなどが定義されている。画面作成用定義#2
は、図7の帳票で用いられている見出し語を示すタイト
ル定義用のガイダンス情報であり、各見出し語(フィー
ルドタイトル)の文字コード(「年」、「月」、
「日」、「単価」、「個数」、「金額」、「合計」)と
その見出し語を表示すべき訂正画面上の位置情報が定義
されている。
【0035】読み取り定義(フォーマット定義)内のフ
ィールド1に対応するポインタP1はタイトル「年」の
エントリを示しており、同様に、フィールド2のポイン
タP2はタイトル「月」、フィールド3のポインタP3
はタイトル「日」、フィールド4のポインタP4とフィ
ールド7のポインタP7はタイトル「単価」、フィール
ド5のポインタP5とフィールド8のポインタP8はタ
イトル「個数」、フィールド6のポインタP6とフィー
ルド9のポインタP9はタイトル「金額」、そしてフィ
ールド10のポインタP10はタイトル「合計」、のエ
ントリを示している。これらポインタによりエラー発生
したフィールドに対応する見出し語を検出することがで
き、リジェクトエラーが発生したフィールドの文字認識
結果と見出し語とを対応けて訂正画面上に表示すること
ができる。
【0036】また、読み取り定義(フォーマット定義)
には、関連するフィールド同士を関連づけるためのグル
ープ定義情報(G1,G2)も含まれている。図8の例
では、年月日を記入するためのフィールド1,2,3が
グループ定義情報G1によって関連づけられ、また金額
記入のためのフィールド6,9,10もグループ定義情
報G2によって関連づけられている。このようなグルー
プ定義情報を用いることにより、例えば、フィールド
1,2,3のいずれかにリジェクトエラーが発生した場
合には、そのエラー発生フィールドのみならず、フィー
ルド1,2,3の他のフィールドの文字認識結果も一緒
に画面表示される。この様子を図9に示す。
【0037】ここでは、図9(A)に示すように、フィ
ールド2とフィールド6にリジェクトエラーが発生した
場合を想定する。この場合、フィールド2の文字認識結
果およびイメージだけでなく、同一グループに属するフ
ィールド1,3の文字認識結果およびイメージも中間フ
ァイルから2抽出され、それらが図9(B)に示すよう
に訂正画面上に表示される。また、フィールド1,2,
3それぞれの見出し語「年」、「月」、「日」が画面作
成用定義#2から取得され、フィールド1,2,3の文
字認識結果の左側に表示される。なお、フィールド1,
2,3それぞれのイメージについては、カーソルが移動
された時にそのフィールドの文字読み取り結果の上方に
表示される。もちろん、文字読み取り結果と一緒に常に
表示しておくことも可能である。
【0038】また、エラー発生したフィールド6、およ
びそのフィールド6と同一グループに属するフィールド
9,10それぞれについての文字読み取り結果とイメー
ジが抽出され、訂正画面上に表示される。さらに、フィ
ールド6,9,10それぞれの見出し語「金額」、「金
額」、「合計」も画面作成用定義#2から取得され、フ
ィールド6,9,10それぞれの文字読み取り結果の左
側に表示される。
【0039】次に、図10のフローチャートを参照し
て、リジェクトエラー訂正専用画面作成処理の流れにつ
いて説明する。まず、訂正クライアント304上のリジ
ェクトエラー訂正モジュール12は、まず、訂正・出力
変換処理対象の中間ファイルを選択し、その中間ファイ
ルを中間ファイル記憶部303から取り込む(ステップ
S201)。ついで、リジェクトエラー訂正モジュール
12内のリジェクトエラー訂正専用画面作成モジュール
31は、中間ファイルに含まれているリジェクトパター
ンデータに基づいて、リジェクトエラーが発生したフィ
ールド(エラーフィールド)を検索する(ステップS2
02)。この後、リジェクトエラー訂正専用画面作成モ
ジュール31は、グループ定義情報を用いてエラーフィ
ールドと同一グループに属するフィールドを調べ(ステ
ップS203)、帳票全体のイメージからエラーフィー
ルドのイメージを切り出す(ステップS204)。この
切り出し処理では、エラーフィールドのみならず、その
エラーフィールドと同一グループに属するフィールドそ
れぞれのイメージ切り出しも行われる。また、これらフ
ィールドそれぞれの文字読み取り結果(文字コード)も
中間ファイルから取得される。
【0040】この後、リジェクトエラー訂正専用画面作
成モジュール31は、エラーフィールドおよびそのエラ
ーフィールドと同一グループに属するフィールドそれぞ
れのポインタを辿ることにより、画面作成用定義#2か
ら対応する見出し語(タイトル)を取得する(ステップ
S205)。次に、これら取得した文字読み取り結果、
イメージ、見出し語を画面上に配置して、1画面単位で
リジェクトエラー訂正専用画面を作成する(ステップS
206,S207)。そして、作成された各リジェクト
エラー訂正専用画面には、画面番号(1/n)が付与さ
れる(ステップS208)。
【0041】なお、以上の説明では、訂正クライアント
304側でエラーフィールドに対応するイメージの切り
出しを行う場合について説明したが、図11に示すよう
に、読み取り端末101側にエラーフィールド抽出モジ
ュール104を設け、これによって、読み取り端末10
1側でエラーフィールドに対応するイメージの切り出し
を行い、エラーフィールドのイメージと文字読み取り結
果のみを訂正クライアント304側に送信するようにし
ても良い。また、各訂正クライアント304では訂正処
理のみを行い、訂正処理された中間ファイルをホストコ
ンピュータ401に送信し、そのホストコンピュータ4
01にて出力変換処理を行う場合には、文字読み取り結
果についても、エラー発生したフィールドおよびそのフ
ィールドと同一グループのフィールドについての文字読
み取り結果のみを抽出して、それを読み取り端末101
側から訂正クライアント304側に送信してもよい。こ
れにより、読み取り端末101側から訂正クライアント
304側に送信するデータ量をより低減できる。
【0042】また、さらに、図12に示すように、前述
のリジェクトエラー訂正専用画面作成モジュール31を
読み取り端末101側に設け、読み取り端末101側で
リジェクトエラー訂正専用画面を作成した後に、そのリ
ジェクトエラー訂正専用画面を訂正クライアント304
側に送信することもできる。
【0043】また、本実施形態のリジェクトエラー訂正
専用画面作成モジュール31を初め、OCR読み取りモ
ジュール11、リジェクトエラー訂正モジュール12、
出力変換モジュール13は全てコンピュータプログラム
として実現できるので、これらを記録媒体を通じて通常
のコンピュータに導入したり、あるいはネットワーク接
続された複数のコンピュータにその役割に応じて選択的
に導入するだけで、本実施形態と同様の効果を得ること
が可能となる。
【0044】
【発明の効果】以上説明したように、本発明によれば、
訂正すべきフィールドに関する情報のみを呈示できる訂
正専用画面を作成することにより、訂正処理作業の効率
向上を図ることが可能となる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係るOCRシステムの基
本構成を示すブロック図。
【図2】同実施形態のシステムで用いられるリジェクト
エラー訂正専用画面作成モジュールによる画面作成処理
の原理を説明するための図。
【図3】同実施形態のシステムを適用したマルチコレク
ションシステムの構成例を示すブロック図。
【図4】同実施形態のシステムにおけるリジェクトエラ
ー訂正専用画面の例を示す図。
【図5】同実施形態のシステムにおけるリジェクトエラ
ー訂正専用画面の他の例を示す図。
【図6】同実施形態のシステムにおけるリジェクトエラ
ー訂正専用画面のさらに他の例を示す図。
【図7】同実施形態のシステムで用いられる帳票の一例
を示す図。
【図8】図7の帳票に対応するFC情報の一例を示す
図。
【図9】図7の帳票の読み取り結果とそれに対応するリ
ジェクトエラー訂正専用画面を説明するための図。
【図10】同実施形態のシステムで用いられるリジェク
トエラー訂正専用画面作成モジュールによる画面作成処
理の具体的な手順を示すフローチャート。
【図11】同実施形態のシステムの他の構成例を示す
図。
【図12】同実施形態のシステムのさらに他の構成例を
示す図。
【符号の説明】
11…OCR読み取りモジュール 12…リジェクトエラー訂正モジュール 13…出力変換モジュール 21…FC情報記憶部 22…中間ファイル記憶部 23…出力ファイル記憶部 31…リジェクトエラー訂正専用画面作成モジュール 101…読み取り端末 102…OCR装置 103…FC情報記憶部 201…ネットワーク 301…サーバコンピュータ 302…FC情報記憶部 303…中間ファイル記憶部 304…訂正クライアント 401…ホストコンピュータ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 花田 剛彦 東京都青梅市新町3丁目3番地の5 東芝 ソフトウェアエンジニアリング株式会社内 Fターム(参考) 5B064 AA01 BA01 EA01 EA05 EA10 FA01 FA05 FA07 FA08

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 読み取り制御情報を用いて帳票からの文
    字読み取り処理およびその読み取り結果の訂正処理を行
    う文字読み取りシステムにおいて、 前記文字読み取り処理の結果に基づいて生成された、文
    字コード、読み取りエラーが発生した文字位置を示すエ
    ラー情報、および帳票全体のイメージ情報を含む中間フ
    ァイルを用いて、前記訂正処理のためのエラー訂正用画
    面を作成する画面作成手段を具備し、 前記画面作成手段は、 前記エラー情報に基づいて、エラー発生した文字位置が
    属するフィールドを検出する手段と、 その検出したフィールドのイメージを前記帳票全体のイ
    メージ情報から切り出す手段とを含み、 エラー発生した文字位置が属するフィールドの文字読み
    取り結果およびそのフィールドのイメージから構成され
    るエラー訂正用画面を作成することを特徴とする文字読
    み取りシステム。
  2. 【請求項2】 前記読み取り制御情報には、前記帳票上
    に配置された複数のフィールドの中で互いに関連するフ
    ィールド同士を関連づけるためのフィールドグループ情
    報が定義されており、 前記画面作成手段は、 エラー発生した文字位置が属するフィールド毎にそのフ
    ィールドに関連する他のフィールドの文字コードを前記
    中間ファイルから抽出する手段をさらに含み、エラー発
    生した文字位置が属するフィールドの読み取り結果およ
    びそのフィールドのイメージと、そのフィールドに関連
    する他のフィールドの読み取り結果とを対応付けて前記
    エラー訂正用画面上に表示することを特徴とする請求項
    1記載の文字読み取りシステム。
  3. 【請求項3】 前記読み取り制御情報には、前記帳票上
    に配置された複数のフィールド毎にそれに対応する前記
    帳票上の見出し語を示すタイトル情報が定義されてお
    り、 前記画面作成手段は、エラー発生した文字位置が属する
    フィールド毎にそのフィールドに対応する見出し語を前
    記読み取り制御情報から抽出する手段をさらに含み、エ
    ラー発生した文字位置が属するフィールドの文字読み取
    り結果およびそのフィールドのイメージと、そのフィー
    ルドの見出し語とを対応付けて前記エラー訂正用画面上
    に表示することを特徴とする請求項1記載の文字読み取
    りシステム。
  4. 【請求項4】 帳票からの文字読み取り処理を実行する
    読み取り用端末と、この読み取り用端末にネットワーク
    接続され、前記文字読み取り処理によって得られた読み
    取り結果を用いて、前記読み取り結果の訂正処理を実行
    する複数の訂正用端末とを含み、帳票からの文字読み取
    り処理、およびその読み取り結果の訂正処理を実行する
    文字読み取りシステムにおいて、 前記文字読み取り処理の結果に基づいて、文字コード、
    読み取りエラーが発生した文字位置を示すエラー情報、
    および帳票全体のイメージ情報を含む中間ファイルを生
    成し、その中間ファイルを前記読み取り用端末から前記
    訂正用端末に送信する手段と、 前記中間ファイルを用いて前記訂正処理のために前記訂
    正用端末に表示するエラー訂正用画面を作成する画面作
    成手段であって、前記エラー情報に基づいて、エラー発
    生した文字位置が属するフィールドのイメージを前記帳
    票全体のイメージ情報から切り出す手段を含み、エラー
    発生した文字位置が属するフィールドの文字読み取り結
    果およびそのフィールドのイメージから構成されるエラ
    ー訂正用画面を作成する画面作成手段とを具備すること
    を特徴とする文字読み取りシステム。
  5. 【請求項5】 帳票からの文字読み取り処理を実行する
    読み取り用端末と、この読み取り用端末にネットワーク
    接続され、前記文字読み取り処理によって得られた読み
    取り結果を用いて、前記読み取り結果の訂正処理を実行
    する複数の訂正用端末とを含み、帳票からの文字読み取
    り処理、およびその読み取り結果の訂正処理を実行する
    文字読み取りシステムにおいて、 前記文字読み取り処理の結果に基づいて、帳票全体のイ
    メージ情報から読み取りエラーが発生した文字位置が属
    するフィールドのイメージを切り出し、その切り出した
    イメージと、読み取り処理によって得られた文字コード
    を含む中間ファイルを前記読み取り用端末から前記訂正
    用端末に送信する手段と、 前記中間ファイルに含まれる文字コードおよびイメージ
    を用いて、エラー発生した文字位置が属するフィールド
    の文字読み取り結果およびそのフィールドのイメージか
    ら構成されるエラー訂正用画面を作成し、そのエラー訂
    正用画面を前記訂正処理のために前記訂正用端末に表示
    する画面作成手段とを具備することを特徴とする文字読
    み取りシステム。
  6. 【請求項6】 読み取り制御情報を用いて帳票からの文
    字読み取り処理およびその読み取り結果の訂正処理を行
    う文字読み取りシステムに適用され、前記文字読み取り
    処理によって生成された文字コード、読み取りエラーが
    発生した文字位置を示すエラー情報、および帳票全体の
    イメージ情報を含む中間ファイルを用いて、前記読み取
    り処理の結果を訂正する読み取り結果訂正処理方法であ
    って、 前記エラー情報に基づいて、エラー発生した文字位置が
    属するフィールドを検出し、 その検出したフィールドのイメージを前記帳票全体のイ
    メージ情報から切り出し、 エラー発生した文字位置が属するフィールドの文字読み
    取り結果およびそのフィールドのイメージから構成され
    るエラー訂正用画面を作成することを特徴とする読み取
    り結果訂正処理方法。
  7. 【請求項7】 前記読み取り制御情報には、前記帳票上
    に配置された複数のフィールドの中で互いに関連するフ
    ィールド同士を関連づけるためのフィールドグループ情
    報が定義されており、 エラー発生した文字位置が属するフィールド毎にそのフ
    ィールドに関連する他のフィールドの文字コードを前記
    中間ファイルから抽出し、 エラー発生した文字位置が属するフィールドの文字読み
    取り結果およびそのフィールドのイメージと、そのフィ
    ールドに関連する他のフィールドの文字読み取り結果と
    を対応付けて前記エラー訂正用画面上に表示することを
    特徴とする請求項6記載の読み取り結果訂正処理方法。
  8. 【請求項8】 前記読み取り制御情報には、前記帳票上
    に配置された複数のフィールド毎にそれに対応する前記
    帳票上の見出し語を示すタイトル情報が定義されてお
    り、 エラー発生した文字位置が属するフィールド毎にそのフ
    ィールドに対応する見出し語を前記読み取り制御情報か
    ら抽出し、 エラー発生した文字位置が属するフィールドの文字読み
    取り結果およびそのフィールドのイメージと、そのフィ
    ールドの見出し語とを対応付けて前記エラー訂正用画面
    上に表示することを特徴とする請求項6記載の読み取り
    結果訂正処理方法。
  9. 【請求項9】 帳票からの文字読み取り処理を実行する
    読み取り用端末と、この読み取り用端末にネットワーク
    接続され、前記文字読み取り処理によって得られた読み
    取り結果を用いて、前記読み取り結果の訂正処理を実行
    する複数の訂正用端末とを含み、帳票からの文字読み取
    り処理、およびその読み取り結果の訂正処理を実行する
    文字読み取りシステムに適用される読み取り結果訂正処
    理方法であって、 前記文字読み取り処理の結果に基づいて、文字コード、
    読み取りエラーが発生した文字位置を示すエラー情報、
    および帳票全体のイメージ情報を含む中間ファイルを生
    成し、その中間ファイルを前記読み取り用端末から前記
    訂正用端末に送信し、 前記中間ファイルのエラー情報に基づいて、エラー発生
    した文字位置が属するフィールドのイメージを前記帳票
    全体のイメージ情報から切り出し、 エラー発生した文字位置が属するフィールドの文字読み
    取り結果およびそのフィールドのイメージから構成され
    るエラー訂正用画面を作成し、そのエラー訂正用画面を
    前記訂正処理のために前記訂正用端末に表示することを
    特徴とする読み取り結果訂正処理方法。
  10. 【請求項10】 帳票からの文字読み取り処理を実行す
    る読み取り用端末と、この読み取り用端末にネットワー
    ク接続され、前記文字読み取り処理によって得られた読
    み取り結果を用いて、前記読み取り結果の訂正処理を実
    行する複数の訂正用端末とを含み、帳票からの文字読み
    取り処理、およびその読み取り結果の訂正処理を実行す
    る文字読み取りシステムに適用される読み取り結果訂正
    処理方法であって、 前記文字読み取り処理の結果に基づいて、帳票全体のイ
    メージ情報から読み取りエラーが発生した文字位置が属
    するフィールドのイメージを切り出し、その切り出した
    イメージと、読み取り処理によって得られた文字コード
    を含む中間ファイルを前記読み取り用端末から前記訂正
    用端末に送信し、 前記中間ファイルに含まれる文字コードおよびイメージ
    を用いて、エラー発生した文字位置が属するフィールド
    の文字読み取り結果およびそのフィールドのイメージか
    ら構成されるエラー訂正用画面を作成し、そのエラー訂
    正用画面を前記訂正処理のために前記訂正用端末に表示
    することを特徴とする読み取り結果訂正処理方法。
JP10273672A 1998-09-28 1998-09-28 文字読み取りシステムおよび同システムにおける読み取り結果訂正処理方法 Pending JP2000105796A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10273672A JP2000105796A (ja) 1998-09-28 1998-09-28 文字読み取りシステムおよび同システムにおける読み取り結果訂正処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10273672A JP2000105796A (ja) 1998-09-28 1998-09-28 文字読み取りシステムおよび同システムにおける読み取り結果訂正処理方法

Publications (1)

Publication Number Publication Date
JP2000105796A true JP2000105796A (ja) 2000-04-11

Family

ID=17530945

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10273672A Pending JP2000105796A (ja) 1998-09-28 1998-09-28 文字読み取りシステムおよび同システムにおける読み取り結果訂正処理方法

Country Status (1)

Country Link
JP (1) JP2000105796A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008158988A (ja) * 2006-12-26 2008-07-10 Canon It Solutions Inc 情報処理装置及びその制御方法、プログラム、並びに、コンピュータ読み取り可能な記憶媒体
EP4095716A1 (en) 2021-05-26 2022-11-30 Fujifilm Business Innovation Corp. Information processing apparatus, program, and information processing method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008158988A (ja) * 2006-12-26 2008-07-10 Canon It Solutions Inc 情報処理装置及びその制御方法、プログラム、並びに、コンピュータ読み取り可能な記憶媒体
EP4095716A1 (en) 2021-05-26 2022-11-30 Fujifilm Business Innovation Corp. Information processing apparatus, program, and information processing method

Similar Documents

Publication Publication Date Title
US11868717B2 (en) Multi-page document recognition in document capture
US10120537B2 (en) Page-independent multi-field validation in document capture
US9042653B2 (en) Associating captured image data with a spreadsheet
US7607078B2 (en) Paper and electronic recognizable forms
US7751624B2 (en) System and method for automating document search and report generation
US7142326B2 (en) Method and apparatus for variable data document printing
JPH04350768A (ja) 名刺電子ファイリング装置
US20230196002A1 (en) Document processing method, and information processing device
JP2000105796A (ja) 文字読み取りシステムおよび同システムにおける読み取り結果訂正処理方法
WO2022097189A1 (ja) データ処理装置、データ処理方法及びプログラム
JP2000003403A (ja) 帳票入力支援方法
US8380690B2 (en) Automating form transcription
JP2001320571A (ja) 帳票筆跡データの処理システム及び処理方法
JPH10105654A (ja) 帳票用文字認識装置
JP2004318453A (ja) 帳票画像処理装置および課金方法
JPH08115330A (ja) 類似文書検索方法および装置
JPH1063813A (ja) イメージ文書管理方法及びその装置
JPH11167603A (ja) イメージエントリシステム、イメージ/文字表示方法および記録媒体
JPH0619884A (ja) 名称入力システム
CN113961781A (zh) 一种质量数据采集分析方法和装置
JP3419425B2 (ja) 認識文字補正装置
JPH09204473A (ja) 帳票管理装置
JPS63268080A (ja) 手書文字入力デ−タ修正方式
JP2002133357A (ja) データエントリーシステム及びデータエントリー方法
JPH04130973A (ja) 電子ファイリングのデータ登録方式

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040924

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070426

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070508

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070706

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070828