JP2008129792A

JP2008129792A - 文書処理システム

Info

Publication number: JP2008129792A
Application number: JP2006313146A
Authority: JP
Inventors: Takeshi Hayakawa; 武志早川
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2006-11-20
Filing date: 2006-11-20
Publication date: 2008-06-05

Abstract

【課題】バックエンドシステムで利用されるＯＣＲ処理を行うワークフローにおいて、帳票フォームを登録したり、既存の帳票フォームを修正したときにワークフローに影響を与えないのが理想である。従来は古い帳票フォームでＯＣＲしたデータは最初からやりなおすしかなく、一度オペレータにより修正した文字データもＯＣＲされてしまい、再度修正しなければならないため、上記のようなメンテナンスにより多くの工数が発生していた。
【解決手段】前記課題を解決する手段として、本発明では既存の帳票フォームに対し、修正／変更が行われる場合に、修正箇所のみの差分帳票フォームを作成し、データ内容に差異が生じた場合は必要となる差分フォームを用い再OCR処理を行う。
【選択図】図４

Description

本発明は画像データから文字情報を抽出するための技術に関する。

従来の文字認識装置及びOCR（Optical Character Reader）技術では、入力された画像データから特定の領域を参照し、その領域内に記載されている文字を読み取り、読み取った文字の特徴と、登録フォームに設定されている文字認識用の辞書から近似するものを比較し、画像に記述されている文字（または候補文字）を特定するパターン認識処理を行っている。これら特定された文字の一致精度は、画像データに記述されている筆記状態よって大きく変動する。そのため画像データの文字と認識した文字が、認識のたびに完全に一致させることは現在の技術では困難である。そこで、文字認識を行った結果を表示し、オペレータの手によって確認作業を行い誤認識している文字に関しては手作業で補完していた。

１日に数千枚を扱うような大規模なシステムにおいて上記のような帳票記入文字を認識させるOCRの需要は多い。もちろん正確なデータで運用するにはオペレータの介在が必須であるため規模に比例し作業量も増えてしまう。また大規模になればコンピュータのディスク領域やデータ管理方法への影響も無視できない。それでも電子化するメリットが大きいため現在までに負荷軽減する様々な手法（学習機能を設けた辞書や、特定領域に分割しての画像保存など）が考案されてきた（特許文献１〜特許文献３参照）。

このように小規模から大規模まで幅広く運用できるようになったことや、企業の電子データ化の動きに伴い、OCR技術は銀行や証券会社など様々な業種で使用されるようになってきた。これらの導入先は自社内でOCR技術を持たないため、既存の運用システムにOCRモジュールを付け加えるようなシステム構築を行うことが多い。そこで、それら（バックエンド側のシステム）に対しOCR機能を備えるワークフローシステムが提供されるようになった。

図１３はOCR機能を備えるワークフローのシステム構成図である。本発明は０００１の情報通信網によってネットワークが構築されている環境を実施例として想定する。ネットワークは近傍（ビル内やフロア内）のコンピュータをデータ転送能力を持つ方法で接続したＬＡＮ環境や、遠隔にある前記ＬＡＮを、公衆回線を使い接続したＷＡＮ、さらにＬＡＮ、ＷＡＮを専用線もしくは電話回線によって接続した巨大なネットワーク網であるインターネットのことである。０００２〜０００５はネットワーク通信機能をもつ情報処理装置である。一般的なパーソナルコンピュータが該当するため、以下ＰＣと表記する。図1.１に示す通り、本システムの実施例では複数のＰＣによりシステム構成が成される。各ＰＣの役割は、０００５をサーバとし、０００１〜０００４までをクライアントとする。（もちろん図１３に示す以上のＰＣ台数で構成されてもよい）０００５のサーバＰＣは特定のサービスを提供するシステムの位置付けでデータベースサービスをはじめ、ファイルサービスやプリントサービスなどの機能提供を行う。０００１〜０００４はそのサーバからのサービスを利用するクライアントＰＣである。０００６はネットワーク機能と画像を読み取り電子データを生成するスキャナ部と生成されたデータを保持する機能と生成されたデータを印刷する機能を有した画像形成装置で、以下Multi Function Printer：ＭＦＰと表記する。
特開平07-200731号公報特開2003-150906号公報特開平11-316802号公報

前記のOCR機能を備えるワークフローシステムでは、バックエンド側に送るデータが正確でなければならない。従来のようにオペレータが修正を行う部位に加え、データの正当性（バックエンドで要求されたデータかどうか）のチェックなども必要な機能となる。また、画像データの入力方法もバックエンドにより変化するため柔軟な構造を用意する必要がある。（例えば、Fax用紙のスキャン認識や、電子データのOCR、定期的に大量のスキャンを行う場合などである）さらに上記のデータの整合性に加え、帳票フォームのメンテナンスもOCR機能を備えるワークフローシステムで行う必要がある。

これらのOCR機能を備えるワークフローでは、常時ワークフローを滞らせないことが課題である。帳票フォームの登録や修正のたびに業務を停止させるのでは、効率が非常に悪く、また夜間バッチなど大量のデータを扱う状況でも、通常のワークが行われるような仕組みを提供する必要がある。また、帳票フォームの修正によってバックエンドへ送るデータに差異なく保つ必要がある。従来このようなワークフローでは帳票フォームが修正変更された場合、これまで行った結果も全てOCRし直さなければならなかった。例として、図１の帳票フォーマットを用いて説明する。１００１はスキャンされた帳票の全体である。１００２は利用者が記入する欄を表す。１００３は利用者が記入した中のOCR対象とする１番目の領域である。１００４は利用者が記入した中のOCR対象とする２番目の領域である。図２は帳票フォーム１００１に第３のOCR領域２００５を付け加えたものである。

２００１はスキャンされた帳票の全体で、２００２は利用者が記入する欄を表す。２００３は利用者が記入した中のOCR対象とする１番目の領域である。２００４は利用者が記入した中のOCR対象とする２番目の領域であることに変わりはない。

今、図１の１００２の利用者記入欄に手書き文字が記入されて送られてきたとする。このときワークフローのOCR機能部は、帳票フォーム１００１と特長を比較し対象イメージが帳票フォーム１００１に該当すると判断する。次に帳票フォーム１００１に設定されているOCR箇所１００３と１００４を確認しOCR処理を行う。次にこの帳票フォーム１００１が２００１のフォームに修正されたとする。以後利用者記入欄に手書き文字が記入されて送られてくるものは２００１のフォームと特長を比較し対象イメージが帳票フォーム２００１に該当すると判断する。この場合は２００３〜２００５の領域について文字認識を行う。

図３はOCR機能によって文字認識された結果保持部である。３００１は領域全体をあらわす。この領域は外部との通信機能を有する情報機器上のメモリに作成される。（例：ネットワーク通信機能を有するコンピュータのデータベースなど）３００２、３００３は格納されているデータをあらわす。特に３００２は前記１００１の帳票フォームでOCR処理を行ったもの、３００３は前記２００１の帳票フォームでOCR処理を行ったものとする。このとき文字認識結果領域３００４に差異があることがわかる。３００２の結果では帳票フォーム１００１の１００３、１００４の２個の領域分のデータしか格納することができない。それに対し３００３の結果では帳票フォーム２００１の２００３、２００４、２００５の３個の領域分のデータを格納することができる。このように帳票フォームが変更になることで、同様の形式の画像イメージをOCRしてもデータの内容に差異をもつことになってしまう。

バックエンドシステムに対し前記のような、同じ種類の画像の認識結果に差異を持つデータ（いわゆる整合性のないデータ）を送ってしまうことはワークフローとして重大な欠点となる。

従来、このような課題を解決する手法として、図３の結果保持部３００１を定期的に監視し、データ内容に差異が生じた場合、欠落しているデータをもつ画像イメージを再度新しい帳票フォームでOCRするというものがある。しかしながらこの方法であると既に、オペレータが修正し正しく確定させてしまったデータに対しても再度OCRを行うため、１回目と同様に誤認識して再度オペレータが修正しなければならなかった。（図３で表せば３００４のゾーン１とゾーン２に関しては再OCRする必要がない）

前記課題を解決する手段として、本発明では既存の帳票フォームに対し、修正／変更が行われる場合に、修正箇所のみの差分帳票フォームを作成し、データ内容に差異が生じた場合は必要となる差分フォームを用い再OCR処理を行う。

帳票フォーム修正によって発生する再OCR処理の高速化、及び作業軽減が行え、バックエンドに送るデ−タの整合性を保つことができる。

図４は本発明の実施例で考えられる、バックエンドにＯＣＲ機能を提供するワークフローシステムである。４００１はＯＣＲ対象の元となる紙帳票である。４００２はネットワーク機能と画像を読み取り電子データを生成するスキャナ部と生成されたデータを保持する機能と生成されたデータを印刷する機能を有した画像形成装置である。（以下Multi Function Printer：ＭＦＰと表記）４００３はOCR機能の一部である帳票認識機能をあらわす。この機能はネットワーク通信機能を持つ情報機器（以下パーソナルコンピュータ：ＰＣと表記）上で動作する。４００４はＰＣから抽出する文字領域に従いOCRを行い、その結果をオペレータが修正する部位である。この作業もＰＣを用いて行われる。ただし４００２を動作させるＰＣと同一のマシンである必要はない。４００５は４００４にて修正された文字データを４００６のバックエンド側に送ってよいかどうかの承認処理を行う部位である。４００３、４００４同様にＰＣ上で作業を行うが、これも同一のマシンである必要はない。４００６はワークフローの提供先であるバックエンドシステムである。本実施例ではどのようなバックエンドシステムかは明示しないが、銀行の自動申し込みシステムや、お中元自動発注登録システムなどが導入先として考えられる。もちろんその他のシステムでも前記ワークフローを有効に活用できることはいうまでもない。４００７は帳票投入者、４００８は文字修正者、４００９は承認者である。

今、４００７の帳票投入者によってＭＦＰに４００１の手書き入力がされている紙帳票がスキャン実行されたとする。スキャンされた内容に相当する電子データがＭＦＰ内で生成される。生成された電子データはＭＦＰとＰＣ間の通信経路を介し４００３の帳票認識部へと送られる。４００３は送られてきた電子データに対し、あらかじめ登録されている帳票フォーム郡から特徴の一致するものを探し出す。帳票フォームとは紙帳票の特徴（枠線座標など）を有するものである。一致する帳票フォームが見つかった場合は４００４へ進みＯＣＲ処理が行われる。ＯＣＲ処理とは１００１に示す、紙帳票からOCRを行う領域や文字認識時に使用する辞書情報をもつファイルを参照し、必要な情報を取得し文字認識を行う。文字認識が行われた結果は４００８の持つＰＣ上で閲覧することができる。４００８の文字修正者はＯＣＲで文字認識された文字と実際の紙帳票の文字が一致しているかを確認し、不一致な場合はＰＣを介し所定の情報を修正する。修正が終わった結果はＰＣ上に保持される。（結果を保持するＰＣは４００８の使用するＰＣでも良いが、一般的にはネットワークを介して使用できるデータベースに保持する）次に４００５の与信処理が４００９によって行われる。４００５は４００８が修正したデータの整合性をチェックし、４００６のバックエンドシステムに情報を流してよいかの判断を下す。承認された場合は４００６に送られる。

図５は図４のワークフローを帳票修正用に追記したものである。５００１〜５００６の部位は図４と同様であり５００１はＯＣＲ対象の元となる紙帳票である。５００２はＭＦＰである。５００３はＰＣ上で動作させるOCR機能の一部である帳票認識機能をあらわす。５００４はＰＣから抽出する文字領域に従いOCRを行い、その結果をオペレータが修正する部位である。５００５は５００４にて修正された文字データを５００６のバックエンド側に送ってよいかどうかの承認処理を行う部位である。５００６はワークフローの提供先であるバックエンドシステムである。追加された５００７は文字認識結果を保持しておくデータベースである。５００４の修正結果を保持しておき、５０１０の承認がおりた場合は５００６のバックエンドへとデータが送信される。図では与信処理内に組み込まれているが、ネットワークを介して使用できるデータベースであればどこにあってもよい。５００８は与信処理をさらに細分化したもので、特に帳票の登録／修正／管理を行う管理者である。５００９は５００４が修正した結果を５００７を介して参照し、整合性のチェックを行い承認を下すものである。５０１０は同様に最終承認をする者である。５０１１は修正された帳票をあらわし、５０１２は帳票フォームを保持しておくデータベースである。

今、５００９承認者が５００７のデータをみて、帳票の間違いに気づき、帳票フォームの修正が必要になったとする。まず帳票フォームを管理している５００８に通知を出し、該当フォームの修正を依頼する。５００８は依頼を受け修正した帳票フォーム５０１１を作成する。作成された５０１１はデータベース５０１２に保持され、以後ＭＦＰ５００２から帳票フォームを参照する際に使用される。

図６は本発明の帳票認識とOCR処理に関する処理フローチャートである。Ｓ６００１は前記４００２のＭＦＰにスキャン対象画像が投入されることを表す。Ｓ６００２は図５の５０１２の帳票フォームデータベースを参照し、フォーム情報を取得する。次にＳ６００３で取得した帳票フォームとスキャン画像と特徴が一致する物を探しだす。ここで一致するものがない場合は、Ｓ６００４で不明帳票フォームと判定されＯＣＲは不要となり処理を終了する。一致するものが見つかった場合はＳ６００５においてＯＣＲ処理を行い、文字認識を行う。このＯＣＲ処理は本発明の修正帳票フォーム、統合帳票フォームを使用する２種の形態があるので別フロー図１０で説明する。文字認識を行った結果はＳ６００６で前記５００７の認識結果データベースに保存されることとなる。次にＳ６００７において保持されている結果を図４、４００８の文字修正者が整合性のチェックを行い、誤認識の結果を手動で修正していく。修正結果はＳ６００８で与信が行われる。与信の結果正しいデータとみとめられた場合には、Ｓ６００９で図５の認識結果データベース５００７に保存し５００６のバックエンドに送信する。Ｓ６００８の判定処理で、与信結果が不正であると判断された場合Ｓ６０１０に進み、帳票フォームの修正が必要かどうかの判断をくだす。帳票フォームの修正が不要な場合は、Ｓ６０１１で図４、４００８の文字修正者に再度文字のチェックを行うよう通知しＳ５００８へ戻る。Ｓ６０１０にて帳票フォームの修正が必要だと判断した場合には、Ｓ６０１２の帳票フォーム修正フローへと進む。

図７は前記Ｓ６０１２の帳票フォーム修正フローの詳細である。帳票フォーム修正を行う場合は、Ｓ７００１で図５の帳票フォームデータベース５０１２から修正対象となるフォームの情報を取得する。それをもとにＳ７００２で修正処理を施し、Ｓ７００３で既存のものと差異が生じたかの判定を行う。ここで相違点がみつからない場合は、修正はおこなわれなかったとしてフローを終了する。相違点が検出された場合には、Ｓ７００４で帳票フォームの差分情報を抽出する。（すなわち修正が行われた箇所をピックアップする）次にＳ７００５で帳票フォームを識別する修正ＩＤを割り振り、図５の帳票フォームデータベース５０１２に登録する。修正ＩＤについては図８で説明する。Ｓ７００６では差分帳票フォームをもとに、それらを統合した帳票フォームを作成し、Ｓ７００７にて帳票フォームデータベース５０１２に登録し、フローを終了する。

図８は帳票フォームデータベース５０１２の登録内容をあらわしたものである。８００１はデータフィールドをあらわし、帳票ごとにユニークな値となる帳票ＩＤを記録する。８００２は修正された帳票に付加される修正ＩＤを記録する。この値もユニークである。８００３は帳票種別のデータフィールドをあらわし、原本、修正、統合の３種のステータスを持たせる。８００４は帳票ＩＤに対応する帳票フォームファイルを記録する。８００５〜８００７はＯＣＲ領域の情報を記録する。ＯＣＲ領域の情報とは、領域の座標や前処理の手法、使用辞書などである。図８では代表的な例として辞書名と座標を示す。８００８は登録されている帳票ＩＤである。１００１のＩＤを持つものが登録されている。（例として図１の帳票が登録されているわけである）８００９は他のＩＤ２００１をもつものである。（例として図２の帳票が登録されているわけである）８０１０は帳票フォーム８００８に修正を加えたフィーム１００１_１が登録されていることを表す。（１００１_１は図９で説明する）８０１１は８００８の帳票フォームの種別を表す。「原本」のステータスは最初に作成されたフォームであることを示す。８０１２は８０１０の帳票フォームの種別を表す。「修正」のステータスは８００８に修正を加え作成された修正帳票フォームであることを示す。８０１３は８００９の帳票フォームの種別を表す。「統合」のステータスは８００８とその修正フォーム８０１０のフォームを統合した包含帳票フォームであることを示す。８０１４には実際に帳票フォームファイル名が登録されている。図８ではファイル名に帳票名＋ＩＤ、ファイル拡張子に.pafを用いているが、実際の運用形態はこの限りではない。８０１５は帳票ＩＤ１００１、２００１及び修正ＩＤ１００１_１のＯＣＲ領域に設定されている値である。それぞれ辞書名とＯＣＲ領域の座標が登録されていうる例である。

図８は帳票フォームデータベースの一実施例であるが、このように帳票ＩＤと修正ＩＤを持つことで、フォームの対応付けがなされているのが望ましい。Ｓ６００５やＳ７００１およびＳ７００５での処理が効率よく行えるからである。また８００９の帳票ＩＤ２００１のフォームは図７、Ｓ７００６で作成される統合フォームである。８０１５のフィールド情報は、８００８、８０１０の帳票ＩＤ／修正ＩＤの情報を包含した形で設定される。これは本発明の１つの特徴である。この統合フォーム８００９を作成することで、再ＯＣＲの場合と、新規ＯＣＲの場合で使い分けることができ、ＯＣＲにかかる作業工程を減らすことができる。

図９は図８の帳票フォームデータベースに登録されているフォームの例である。帳票フォーム９００１は図８の８００８（帳票ＩＤ１００１）のフォームである。９００１は９００２と９００３の２つのＯＣＲ領域をもつ。それらの情報は８００５、８００６のフィールドで設定されている。帳票フォーム９００２は図８の８０１０（修正ＩＤ１００１_１）のフォームである。９００２は９００５のＯＣＲ領域をもつ。その情報は８００７のフィールドで設定されている。帳票フォーム９００６は図８の８００９（帳票ＩＤ２００１）のフォームである。９００６は９００７と９００８と９００９の３つのＯＣＲ領域をもつ。それらの情報は８００５、８００６、８００７のフィールドで設定されている。このように帳票フォーム９００６は９００１、９００４のフォーム情報を包含していることを特徴とする。

図１０は図６のＳ６００５のＯＣＲ処理の詳細フローチャートである。図８の帳票フォームデータベースの内容をもとにＯＣＲ処理のフローを表す。図６のＳ６００４で不明帳票の場合の処理が行われているので、図１０のフローチャートには不明帳票が混入されていることはない。まずＳ１０００１でＯＣＲ処理を依頼された帳票が新規帳票であるか、再ＯＣＲであるかを判定する。（依頼指定方法の実施例については後述する）新規ＯＣＲである場合は、Ｓ１０００２で図８、８００３の帳票種別が「統合」になっている物から一致するものを探す。ここでは帳票８００９が該当する。「統合」ステータスが複数ある場合でも、それらの帳票フォームに対しＯＣＲエンジンが帳票認識を行うことで、どの帳票と一致するかが明示される。次にＳ１０００３で取得したフォーム情報より各ゾーンにおいてＯＣＲを行い終了する。結果は図６のＳ６００６で認識結果データベースに保存される。（認識結果データベースは図１１で説明）Ｓ１０００１で再ＯＣＲ依頼であった場合にはＳ１０００４で認識結果データベースより帳票ＩＤを取得する。Ｓ１０００５で取得した帳票ＩＤと図８の帳票種別が「修正」になっているものの８００２データフィールドに保持されている修正ＩＤとを比較する。結果が一致した場合は現在最新の修正帳票結果なので、ＯＣＲを行わないで終了する。不一致であった場合は、再ＯＣＲの必要ありとみなされる。修正は修正帳票の回数行われる。Ｓ１０００６で最新の修正ＩＤかどうかの判定を行い満たさすまで繰り返す。Ｓ１０００７は文字認識のＯＣＲ処理で、該当する修正ＩＤをもつ帳票フォームから情報を取得しＯＣＲを行う。ＯＣＲが終わったら、Ｓ１０００８にて修正ＩＤを更新しＳ１０００６に戻る。最新の修正ＩＤになった場合はフローを終了し、図６のＳ６００６で示される認識結果データベースに保存される。

図１１は認識結果データベースの実施例である。１１００１はワークＩＤのデータフィールドをあらわす。本実施例では各認識結果にワークＩＤを割り振り、現在何件のＯＣＲが完了したかを示すＩＤとしている。ＩＤは連番で登録した順にユニークに割り当てられる。（ワークＩＤは本発明の特徴ではない）１１００２はワーク状態のデータフィールドをあらわす。この値は主に図４の４００８、４００９などによって参照され、どのようなジョブが保持されているかの目安となる。（未承認の他に、承認済み、修正待ちなどの状態が考えられるがワーク状態は本発明の特徴ではないため、詳細は記述しない）１１００３は帳票ＩＤのデータフィールドをあらわす。この帳票ＩＤは最後にＯＣＲをしたフォームのＩＤが割り振られる。１１００４は帳票フォーム名のデータフィールドをあらわす。図８の８００４に登録されているフォーム名から使用したものが登録される。１１００５、１１００６、１１００７はＯＣＲ処理後の認識文字データを格納するデータフィールドである。各帳票フォームの設定情報をもとにＯＣＲされた結果が格納される。該当ゾーンがないものに関しては「×」印などを格納し、データがないことを明示的にあらわす。１１００８〜１１０１１は格納されている帳票ＩＤである。１１０１２はワークごとに格納されているワーク状態である。１１０１３はワークごとに格納されている帳票フォーム名である。１１０１４はワークごとに格納されている文字認識結果である。これらの値からどのようにＯＣＲ処理を依頼するかを、次の図１２を使い説明する。

今、文字認識した結果が図１１に示す認識結果データベースに保持されていて、図５の帳票修正ワークフローの管理者５００８から図９の９００１帳票フォームについて、９００２のように修正処理が行われたとする。このとき前記の通り、統合帳票フォーム９００６は自動的に作成され、図８の帳票フォームデータベースに反映される。その後いくつかの帳票が入力されＯＣＲ処理を行い図１１の認識結果データベースが更新されたとする。

図１２は再ＯＣＲ通知処理のフローチャートである。Ｓ１２００１は定期的に図８の帳票フォームデータベースの内容を参照し確認する。Ｓ１２００２は帳票修正フォームが追加されたかを判定する。追加がない場合は引き続き監視にもどる。今、９００２帳票フォームが追加されたので、追加有りと判断しＳ１２００３に進む。Ｓ１２００３は図１１の認識結果データベースの帳票ＩＤフィールド１１００３に追加された９００２帳票フォーム以前のフォームでＯＣＲされた物がないかを探す。Ｓ１２００４で判定を行い、該当なしの場合は始めの監視処理に戻る。ここでは、図８帳票ＩＤ１１００８と１１００９が該当する。このように該当があった場合はＳ１２００５に進みＯＣＲ処理を行う。ＯＣＲ処理は図１０の手順で行われる。ＯＣＲで得られた文字認識結果をＳ１２００６で図１１の認識結果データベースに更新し、作業を終了する。

このように本実施例では、帳票フォームに修正用を識別するＩＤをもたせ、定期的に文字認識結果を監視することで、データに差異があった場合に自動的にＯＣＲを行わせ、常に最新の帳票フォームデータでのＯＣＲを結果として保持することができる。

［その他の実施形態］
また、本発明の目的は、以下のようにすることによって達成されることはいうまでもない。即ち、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記録媒体（または記憶媒体）を、システムあるいは装置に供給する。そして、そのシステムあるいは装置のコンピュータ（またはＣＰＵやＭＰＵ）が記録媒体に格納されたプログラムコードを読み出し実行する。この場合、記録媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記録した記録媒体は本発明を構成することになる。

また、コンピュータが読み出したプログラムコードを実行することにより、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム（ＯＳ）などが実際の処理の一部または全部を行う。その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。

さらに、記録媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれたとする。その後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるＣＰＵなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。

本発明を上記記録媒体に適用する場合、その記録媒体には、先に説明したフローチャートに対応するプログラムコードが格納されることになる。

一般的な帳票フォームを示すものである。図１の帳票フォームに修正を加えたものである。 OCR結果保持部示すものである。実施例の１つとしてのOCR機能を持つワークフローである。実施例の１つとしての帳票修正のワークフローである。実施例の１つとしての帳票認識とOCR処理のフローチャートである。実施例の１つとしての帳票フォーム修正フローチャートである。実施例の１つとしての帳票フォームデータベースの登録内容である。実施例の１つとしての帳票フォームである。図６に記載されているOCR処理の詳細フローチャートである。実施例の１つとしての認識結果データベースの登録内容である。実施例の１つとしての再OCR通知処理のフローチャートである。 OCR機能を備えるワークフローのシステム構成図である。

Claims

OCR機能を使用し、入力された文書画像データから、特徴を抽出する手段と、抽出された画像の情報と、OCR機能として予め登録されている複数の画像（複数の登録フォーム）との特徴情報を比較して、最も近似する結果を得られる登録フォームを識別するフォーム識別手段を有し、また、登録フォーム内に設定項目（OCR領域や辞書情報）のみが異なるフォームを、関連のあるフォームとし原本フォームと差分フォームの区分を設け認識する手段をもち、差分フォームまたは原本フォームと特徴の一致する文書画像データを識別した場合に、原本フォームおよび差分フォームに設定されている情報をもとにOCRを行い、フォームに設定されている領域に記述されている文字と最も特徴の近い文字を特定し、それぞれのフォームでの結果を合わせて、文書画像データの文字認識データとする手段を有することを特徴とする文書処理システム。
OCR機能として入力画像と比較し得る登録フォームを作成する機能を有し、その登録済みのフォームに修正／変更を加える場合に、修正前との差分のみを新規フォームとして登録し保持する機能を有することを特徴とする請求項１記載の文書処理システム。
請求項２で作成された新規フォームに対し、再度修正／変更を加えた場合には、連鎖的に同様の差分情報をもつ新規フォームを作成し、登録し保持する機能を有する請求項１記載の文書処理システム。
請求項２または請求項３で作成された新規フォームがどの登録済みフォームから生成されたものなのかを関連つけるための識別子を保持する機能を有することを特徴とする請求項１記載の文書処理システム。
請求項２または請求項３で作成された、関連付けされている複数のフォームを包含する１つの新規フォームを作成し、登録し保持する機能を有することを特徴とする請求項１記載の文書処理システム。
文書画像データの入力経路により、請求項２または請求項３の複数のフォームを用いる場合と、請求項５の１つのフォームを用いる場合を自動的に使い分ける機能を有することを特徴とする請求項１記載の文書処理システム。
請求項１の文書処理システムで特定した文字情報データを保持する機能を有し、保持されたデータの内容から、登録データの該当フォームが請求項３の機能により更新されている場合に、自動的に再OCRを行いデータを抽出し保持する機能をもつことを特徴とする請求項１記載の文書処理システム。