JP2006126942A

JP2006126942A - 文書処理システム、情報処理装置、文書処理方法、及び制御プログラム

Info

Publication number: JP2006126942A
Application number: JP2004311077A
Authority: JP
Inventors: Takeshi Hayakawa; 武志早川
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2004-10-26
Filing date: 2004-10-26
Publication date: 2006-05-18

Abstract

【課題】ハイパーテキストを利用した操作画面を実現することで、オペレータのユーザビリティを向上させた文書処理システムを提供する。
【解決手段】画像データから文字情報を認識するＷｅｂアプリケーションサーバ１０９と、前記認識した文字情報の編集を行うクライアントＰＣ１０１、１０２、１０６と、サーバ１０９から受け取った文字認識結果の文字列をクライアントＰＣの画面上に表示させるＨＴＴＰサーバ１０８とがネットワークを介して接続されている。サーバ１０８は、クライアントＰＣの画面上に表示される文字認識結果の文字列と、前記画像データにおける前記文字列に該当する部分が表示される画面（ハイパーテキスト参照先画面）とをハイパーテキストを用いて関連付ける。
【選択図】図１２

Description

本発明は、画像データから文字情報を取得することが可能な文書処理システム及び文書処理方法、前記文書処理システム内に備えられた情報処理装置、並びに前記情報処理装置を制御する制御プログラムに関する。

従来、ハードコピー文書をスキャニングし電子化を行うシステムには、電子化された文書に対して、光学的手法による文字認識（ＯＣＲ：ＯｐｔｉｃａｌＣｈａｒａｃｔｅｒＲｅａｄｅｒ）を行い、記述されている文字列を認識する機能（以下、ＯＣＲ機能と記す）を備えたものがある。

このＯＣＲ機能では、入力された画像データから特定の領域を参照し、その領域内に記載されている文字を読み取り、読み取った文字の特徴と文字認識用の辞書とを比較して、類似するものを、画像に記述されている文字（又は候補文字）として特定するパターン認識処理を行っている。

これら特定された文字の一致精度は、画像データに記述されている筆記状態によって大きく変動する。そのため、文字認識を行った結果である文字と元の画像データの文字とを完全一致させることは困難である。そこで、文字認識を行った結果をオペレータに表示し、オペレータによって確認作業を行わせ、誤認識している文字に関しては手作業で修正補完している。

近年では、ＯＣＲ機能を持たない企業などのシステム（バックエンド側のシステム）に対して、ネットワークを介して、ＯＣＲ機能を備えるワークフローシステムが提供されるようになってきている。

しかしながら、一日に大量の紙データを処理する場合では、大人数のオペレータや大規模な環境が必要となる。このような状況でワークフローシステム全体の作業効率を向上させるには、文字認識処理結果についてのオペレータによる確認作業と修正作業にかける時間を最小限にすることが課題となる。そのため、これまでにオペレータの出番を極力少なく、かつ正確に作業を持続して行える環境の構築がなされてきた。具体的には、オペレータが操作するインターフェースの向上であり、例えば視覚的に把握しやすいレイアウトやキー操作の少ないユーザインターフェース（ＧＵＩ）を有するシステムが種々提案されている（例えば、特許文献１、特許文献２、特許文献３）。
特開平０７−２００７３１号公報特開２００３−１５０９０６号公報特開平１１−３１６８０２号公報

しかしながら、従来のシステムのユーザインターフェースでは、オペレータのユーザビリティ向上の観点から、まだ改善される余地が多く残されていた。例えば、オペレータの操作画面に多くの操作ボタンを表示したり、参照先をオペレータに指定させたりすることは、オペレータの操作を煩雑にすることになるが、これらを容易に解決する方法は、未だ実現されていなかった。

また、従来のシステムは専用の装置や専用のアプリケーションを必要とするものであって、本発明のように汎用のアプリケーション（Ｗｅｂブラウザ等）を用いて、操作性の良い操作画面を実現することは考えられていなかった。

本発明は上記従来の問題点に鑑み、ハイパーテキストを利用した操作画面を実現することで、オペレータのユーザビリティを向上させた文書処理システム、情報処理装置、文書処理方法、及び制御プログラムを提供することを目的とする。

本発明は上記目的を達成するため、画像データから文字情報を含む第１の情報を取得する第１の装置と、前記第１の情報を含む情報の編集を行う第２の装置とを備え、前記第１の装置から受け取った前記第１の情報を前記第２の装置の画面上に表示させる文書処理システムにおいて、前記第２の装置の画面上に表示される前記第１の情報と、前記画像データにおける前記第１の情報に該当する部分を含む第２の情報とをハイパーテキストを用いて関連付けることを特徴とする。

また、本発明は、画像データから文字情報を含む第１の情報を取得する第１の装置と、前記第１の情報を含む情報の編集を行う第２の装置とにネットワークを介して接続され、前記第１の装置から受け取った前記第１の情報を前記第２の装置の画面上に表示させる情報処理装置において、前記第２の装置の画面上に表示される前記第１の情報と、前記画像データにおける前記第１の情報に該当する部分を含む第２の情報とをハイパーテキストを用いて関連付けることを特徴とする。

また、本発明は、画像データから文字情報を含む第１の情報を取得する第１の装置と、前記第１の情報を含む情報の編集を行う第２の装置とを用い、前記第１の装置から受け取った前記第１の情報を前記第２の装置の画面上に表示させる文書処理方法であって、前記第２の装置の画面上に表示される前記第１の情報と、前記画像データにおける前記第１の情報に該当する部分を含む第２の情報とをハイパーテキストを用いて関連付けることを特徴とする。

また、本発明は、画像データから文字情報を含む第１の情報を取得する第１の装置と、前記第１の情報を含む情報の編集を行う第２の装置とにネットワークを介して接続され、前記第１の装置から受け取った前記第１の情報を前記第２の装置の画面上に表示させる情報処理装置の制御方法を実行するための、コンピュータで読み取り可能な制御プログラムであって、前記第２の装置の画面上に表示される前記第１の情報と、前記画像データにおける前記第１の情報に該当する部分を含む第２の情報とをハイパーテキストを用いて関連付けるステップを備えたことを特徴とする。

本発明によれば、オペレータが扱う操作画面にハイパーテキスト化された情報を使用することができるので、操作画面の構成をシンプル化させつつ、オペレータに必要な情報を伝える仕組みを実現することが可能になる。これにより、オペレータのユーザビリティが向上する。

本発明の文書処理システム、情報処理装置、文書処理方法、及び制御プログラムの実施の形態について、図面を参照しながら説明する。

［第１の実施の形態］
＜システムの構成＞
図１は、本発明の実施の形態に係る画像処理システムの構成図である。

この画像処理システムは、ネットワーク上に、クライアントＰＣ１０１，１０２，１０６と、スキャナ１０３及びマルチファンクションデバイス１０４と、ＨＴＴＰサーバ（Ｗｅｂサーバ）１０８と、Ｗｅｂアプリケーションサーバ（ＷＡＳ）１０９とを備えている。

クライアントＰＣ１０１，１０２，１０６は、Ｗｅｂブラウザを使用しＨＴＴＰで通信するコンピュータであり、例えば、システム管理者が新規データファイルを登録したり、ユーザ管理情報の修正などのシステムメンテナンス処理を行ったり、あるいは登録作業者がＷｅｂアプリケーションサーバ１０９上に受信された帳票の電子文書を仕分けして確認したり、申請承認者が申請の承認作業を行うために使用されるパソコンである。

スキャナ１０３は、ネットワーク上で共有されている画像データを読み込むスキャナであり、ユーザから郵便で送付されてきた申請書や、支店へ持ち込まれた申込書などの帳票を読み込むために使用される。

マルチファンクションデバイス１０４は、ネットワーク上で共有されているマルチファンクションデバイスであり、スキャナ１０３と同様にスキャナとしても使用することができるほか、マルチファンクションデバイス１０４が受信したファックス画像をＷｅｂアプリケーションサーバ１０９などに、ＬＡＮ（ローカルエリアネットワーク）１０５、１１１及びインターネット１０７を経由して登録することもできる。

ＬＡＮ１０５に接続している機器１０１〜１０５は、このＬＡＮ１０５を介して他の機器とデータのやり取りを行う。クライアントＰＣ１０６は、インターネット１０７に直接に接続されている。

ＨＴＴＰサーバ（Ｗｅｂサーバ）１０８は、ネットワークを介してクライアントＰＣ１０１，１０２，１０６からＨＴＴＰプロトコルで送られてきたリクエストを受け取るサーバである。ＨＴＴＰサーバ１０８には、いくつかのＷｅｂアプリケーションサーバが登録されており、ＨＴＴＰサーバ１０８は、クライアントＰＣ１０１，１０２，１０６からのリクエスト内容に従って、処理を適切なＷｅｂアプリケーションサーバに割り振る。また、リクエストを受け取った例えばＷｅｂアプリケーションサーバ１０９は、処理を実行してその処理結果をクライアントＰＣ１０１，１０２，１０６へ返信する。

Ｗｅｂアプリケーションサーバ１０９には、データベース１１０が接続されている。このデータベース１１０には、受信した帳票画像データ、文字認識結果、及び申請処理ステータスなどの情報や、ユーザ／グループ情報、及び登録データファイルの処理情報などのシステム情報が記録される。ＨＴＴＰサーバ１０８、Ｗｅｂアプリケーションサーバ１０９、及びデータベース１１０が有機的に組み合わされて、Ｗｅｂデータベースシステムとして機能する。

そして、Ｗｅｂアプリケーションサーバ１０９は、例えばＬＡＮ１１１を介して企業などのバックエンドシステム（顧客管理システム）１２０に接続されており、このバックエンドシステム１２０の画像サーバに、スキャナ１０３等から入力されＷｅｂアプリケーションサーバ１０９で処理された帳票画像データが登録されるようになっている。

なお、バックエンドシステム１２０は、アプリケーションサーバ１０９にダイレクトに接続される構成であっても良い。

＜装置の構成＞
図２は、図１に示したクライアントＰＣ１０１，１０２，１０６、ＨＴＴＰサーバ１０８及びＷｅｂアプリケーションサーバ１０９の構成を示すブロック図である。

図中の１はシステム・バスであり、システムバス１には、ＣＰＵ（ＣｅｎｔｒｔａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）２、プログラム・メモリ（ＰＭＥＭ）３、通信制御部４、外部記憶装置制御部８、入力制御部１１、ビデオ・イメージ・メモリ（ＶＲＡＭ）１４、表示出力制御部１５、プリンタ制御部１７、外部機器制御部１９、及び画像読み取り機器制御部２０が接続されている。

通信制御部４は、通信ポート５に於ける入出力データの制御を行い、通信ポート５から出力された信号は、通信回線６を経由してネットワーク上の他の装置の通信ポートに伝えられる。外部記憶装置制御部８は、データファイル用のディスクとして、例えばフロッピー（登録商標）ディスク（ＦＤ）９やハード・ディスク（ＨＤ）１０に対するアクセスを制御する。

入力制御部１１には、キーボード１２やマウス１３等の入力装置が接続される。操作者は、この入力装置を操作することによりシステムの動作指令等を行う。ビデオ・イメージ・メモリ（ＶＲＡＭ）１４には、表示出力制御部１５を介してＣＲＴ１６が接続され、ＣＲＴ１６に表示されるデータはＶＲＡＭ１４上にビットマップデータとして展開されている。ＣＲＴ１６上で画像情報を加工指示するためのポインティング・デバイスであるマウス１３により、ＣＲＴ１６上のカーソルをＸ，Ｙ方向任意に移動してコマンドメニュー上のコマンド・アイコンを選択し、処理の指示を行うほか、編集対象の指示、描画位置の指示等も行うようになっている。

ＰＭＥＭ３は、本実施の形態に係る処理を実行するためのプログラムをハード・ディスク１０から適宜、選択して読み込み、ＣＰＵ２での実行に供する。また、キーボード１２から入力されたデータは、テキスト・メモリでもあるＰＭＥＭ３にコード情報として格納される。

プリンタ制御部１７は、接続されているプリンタ１８に対するデータの出力制御を行う。画像読み取り機器制御部２０は、画像読み取り機器２１に接続され、その接続機器の制御を行う。外部機器制御部１９は、プリンタやスキャナなどの外部機器を制御するためのものである。

なお、本実施の形態のクライアントＰＣ１０１，１０２，１０６では、クライアントＰＣに直接接続されたプリンタ１８とプリンタ制御部１７、画像読み取り機器制御部２０と画像読み取り機器２１といった構成要素は必ずしも必要ではなく、通信制御部４及び通信ポート５を介して、ネットワークに接続されたプリンタやスキャナを利用できるようにしてもよい。例えば、スキャナ１０３やマルチファンクションデバイス１０４などを使用することにより、画像を読み取ることができる。

なお、本実施の形態ではＬＡＮなどのネットワークに関して記述するが、この通信制御部４に接続される通信ポート５及び通信回線６が一般の公衆回線であっても本発明が適応されることは言うまでもない。

また、画像読み取り機器制御部２０と画像読み取り機器２１が物理的に別々のコンポーネントであっても、画像読み取り機器制御部２０が画像読み取り機器２１を含む１つのコンポーネントであっても、同様な機能を有することとする。

また、ＰＭＥＭ３に記憶されるプログラムは、装置に直接接続されているハードディスク（ＨＤ）やフロッピー（登録商標）ディスク（ＦＤ）などの記憶媒体に記憶されているほか、ネットワークで接続されている他の装置上に記憶されていても良い。

なお、クライアントＰＣ１０１，１０２，１０６では、汎用のＷｅｂブラウザ（例えば、ＭｉｃｒｏｓｏｆｔＩｎｔｅｒｎｅｔＥｘｐｌｏｒｅｒ（登録商標））が記憶媒体に格納されており、ＣＰＵ２が該Ｗｅｂブラウザプログラムを読み込んで実行し、該Ｗｅｂブラウザ上で本発明のユーザインターフェースが実現される。

＜モジュール構成＞
図３は、本実施の形態に係るモジュールの構成を示すブロック図である。

同図に示すように、クライアントＰＣ１０１，１０２，１０６は、カタログ情報や画像データなどのデータファイルをＷｅｂアプリケーションサーバ１０９にＨＴＴＰサーバを介して登録したり、商品データを出力するためのフォーム情報を登録したりするための情報登録モジュール３０２と、承認者が承認処理を行なうための登録承認モジュール３０３などを記憶している。但し、これらのモジュールは、Ｗｅｂアプリケーションサーバ１０９から必要に応じてＷｅｂブラウザのプラグイン（Ｐｌｕｇ−ｉｎ）形式などで自動的に配信されるので、クライアントＰＣ１０１，１０２，１０６上でインストール処理などを行う必要はない。

さらに、Ｗｅｂアプリケーションサーバ１０９には、ＨＴＴＰサーバ１０８から受け取った、クライアントＰＣ１０１，１０２，１０６からのリクエストを処理するためのモジュール３０７が記憶されている。

このモジュール３０７の機能としては、例えば、ユーザ認証機能、検索処理機能、ワークフロー制御機能、受信データ登録機能、ワークフロー登録機能、送付状登録機能、ユーザ管理機能、グループ管理機能、データメンテナンス機能、認識結果登録機能、認識帳票登録機能、及びデバイス設定登録機能がある。

ここで、ユーザ認証機能は、ユーザがシステムにログインした際にユーザの権限を確認する機能であり、検索処理機能は、ユーザが行うべき作業や、行った作業を検索する機能である。ワークフロー制御機能は、ワークフローの制御に関する機能であり、受信データ登録機能は、受信した帳票画像データの登録に関する機能である。ワークフロー登録機能は、ワークフローの定義、登録に関する機能であり、送付状登録機能は、送付状の定義、登録に関する機能である。ユーザ管理機能は、個人情報の登録、管理を行う機能であり、グループ管理機能は、ユーザが属するグループの登録、管理を行う機能である。データメンテナンス機能は、帳票を格納するフォルダなど内部で使用するデータを設定する機能であり、認識結果登録機能は文字認識結果の登録に関する機能であり、認識帳票登録機能は、認識された帳票画像データの定義、登録に関する機能である。デバイス設定登録機能は、メールサーバ、送付状を印刷するプリンタのＩＰアドレスなどの情報を設定する機能である。これらのモジュールは、クライアントＰＣ１０１，１０２，１０６からのリクエストに応じてＰＭＥＭ３上にロードされ、処理が実行される。

また、Ｗｅｂアプリケーションサーバ１０９には、これらのモジュール３０７とは別に、ワークフローエディタ部や送付状エディタ部などを備えた編集モジュール３０８がある。さらに、データベース１１０とのデータのやり取りを行うためのデータベース共通ライブラリ３０９や各種ユーティリティライブラリ３１０がある。

＜システムの処理フロー＞
次に、申請書などの帳票画像を受け取り、その帳票に対して帳票認識及び文字認識を実行し、申請の承認フローを起動し、企業のバックエンドシステムと連携をとり、そのバックエンドシステムの画像サーバへ自動的に格納させる、本実施の形態の画像処理システムに係る一連の処理フローについて、図４を参照して説明する。

図４は、本実施の形態に係る画像処理システムの処理フローを示すブロック図である。この処理フローの制御は、基本的にＷｅｂアプリケーションサーバ１０９で実行され、データの表示や編集、動作指示などはクライアントＰＣ１０１，１０２または１０６のブラウザにより処理される。なお、この処理フローを、以下、ワークフローと呼ぶことにする。

図４において、まずステップＳ１は、スキャナ１０３あるいはマルチファンクションデバイス１０４から、ＬＡＮ１０５，１１１及びインターネット１０７経由で帳票画像データ（図１１参照）をＷｅｂアプリケーションサーバ１０９に取り込む処理を示している。

続くステップＳ２では、受信した帳票画像データの帳票認識（ＦＲ）を行って帳票の種別を決定し、該帳票の種別に対応して設定されている処理フローを呼び出して、以降の各処理に関する設定などを行なう。ステップＳ３では、文字認識（ＣＲ）及びバーコード認識（ＢＲ）を行い、ステップＳ２で認識された帳票種別に基づいて帳票に記載されている文字やバーコード情報などを抽出・保存する。次のステップＳ４では、ポストエディット処理の担当オペレータが、ステップＳ３で認識・保存された文字と帳票画像データとを、該担当オペレータが使用しているクライアントＰＣ１０１、１０２又は１０６の画面に表示させ、該担当オペレータは該画面を見ながら前記文字認識処理で誤認識した個所（誤認識した文字など）を修正して、ＨＴＴＰサーバを介して該Ｗｅｂアプリケーションサーバに保存するポストエディタ（ＰＥ）処理を行う。

その後のステップＳ５では、申請書等の帳票画像データの受け取りを承認するかを決定するための申請承認フロー（ＰＡフロー）を実行する。この申請承認フロー（申請承認ルート）としては、例えば主任→課長→部長や、庶務→総務→経理部などが複数登録されており、帳票種別ごとに設定されている申請承認フローが適宜選択される。

次のステップＳ６においては、受信した帳票画像データや各種データ（認識・修正された文字データや、承認データなど）をイメージサーバ（ＩＳ：データベース１１０あるいはＬＡＮ１１１上の不図示のサーバ）に登録した後、さらにステップＳ７において、企業などのバックエンドシステム（ＢＥ）１２０の画像サーバに帳票画像データを登録する。

そして、ステップＳ８においては、申請書などの帳票（帳票画像データ）を送付したユーザに対して登録確認などの送付状を、ファックス、電子メール、あるいは郵送などで送付する。

このように、上記画像処理システムでは、文書画像データから、ＯＣＲ機能又は帳票認識によって画像の特徴を判別して文字情報や帳票種別を取得し、取得した文字情報や帳票種別などをクライアントＰＣ１０１、１０２又は１０６の操作画面上に表示させ、オペレータに確認、修正作業を行わせる。本実施の形態では、前記操作画面において、ハイパーテキストを利用した操作を可能にするものである。ハイパーテキストとは、コンピュータを利用して表示される文書や画面の任意の場所に他の文書の位置情報を埋め込み、相互関係をもたせる技術である。本実施形態では、汎用のＷｅｂブラウザでハイパーテキスト文書を表示することができ、ユーザがハイパーテキスト文書を操作することで、リンク対象となる画像やテキストを動作させることができる。このように汎用のＷｅｂブラウザを用いることができるので、ポストエディット処理専用の表示アプリケーションを作成する必要がなくなる。

以下、本実施の形態の処理について、具体的に説明する。

＜第１の実施の形態に係るクライアントＰＣの処理＞
図５は、図４のステップＳ４で実行されるポストエディット処理（ＰＥ）の詳細フローを示すフローチャートであり、このポストエディット処理（ＰＥ）は、クライアントＰＣ１０１、１０２又は１０６上でＷｅｂブラウザの画面を用いて行われる。

オペレータがＷｅｂブラウザを用いて表示するＨＴＭＬ文書は、ＨＴＴＰサーバ１０８に蓄積されているＨＴＭＬ文書や画像などの情報を、オペレータの要求に応じてインターネット１０７などのネットワークを通じて受信したものである。オペレータはポストエディット処理（ＰＥ）を行うとき、予め登録されているＵＲＬを入力し、Ｗｅｂブラウザに画面を表示させる。そして、図５のフローに従い処理を進める。

まずステップＳ５０１ではログイン処理を行う。オペレータは、自身がポストエディット処理（ＰＥ）の処理者であることを示すＩＤを知っており、これを入力して処理を開始する（ログイン画面の構成は図６に示す）。入力されたＩＤはステップＳ５０２で判定が行われる。このログイン処理は図３のモジュール３０７のユーザ認証機能である。なお、本実施の形態ではログイン処理を行うが、これは必須の処理ではない。

ステップＳ５０２の判定の結果、ＰＥ権限を持たない場合はステップＳ５０８へ進み終了する。ＰＥ権限があると認められた場合は、ステップＳ５０３でＰＥ処理者用のワークアイテム（ＷＩ）画面が表示される（ワークアイテム（ＷＩ）画面の構成例を図１１に示す）。

次にオペレータはステップＳ５０４において処理すべき事柄（これをワークアイテム（ＷＩ）と呼ぶ）があるかどうかを判断する。特に処理するワークアイテム（ＷＩ）がない場合はステップＳ５０８へ進み終了する。ワークアイテム（ＷＩ）がある場合はステップＳ５０５で、処理を行うワークアイテム（ＷＩ）を選択する。

そしてステップＳ５０６において文字修正作業を開始する。修正作業内容については図７を用いて後で説明する。修正作業が完了したらステップＳ５０７で、さらに処理するべきワークアイテム（ＷＩ）があるかを判断する。作業を続ける場合はステップＳ５０５に戻り、ステップＳ５０５からステップＳ５０７までの処理を繰り返す。作業を終える場合はステップＳ５０８へ進み終了する。

図６は、Ｗｅｂブラウザで表示されるログイン画面の一例を示す画面表示図である。このログイン画面は、上述した図５のログイン処理においてクライアントＰＣ１０１、１０２又は１０６上で表示され、本実施の形態ではＨＴＭＬ形式で記述されたものとする。

図６の９０１は、ログイン画面として表示されるＨＴＭＬ文書の全体を示す。このＨＴＭＬ文書は、ＨＴＴＰサーバ１０８で管理され、クライアントＰＣ１０１、１０２又は１０６からのリクエストに応じたものである。ログイン画面９０１は、図５のステップＳ５０１のログイン処理と連動して表示される。９０２はユーザＩＤ入力部であり、オペレータがキーボードなどのインターフェースを用いて入力する仕組みである。９０３は、オペレータを確認するためのパスワードを入力する欄である。なお、本実施の形態ではログイン処理を持たせているが、他の実施の形態においては必須ではない。

図７は、図５のステップＳ５０６（文字修正処理）の詳細処理フローを示すフローチャートである。この処理フローは、オペレータがクライアントＰＣのＷｅｂブラウザ上で文字修正を行う場合に実行される。

まずステップＳ６０２では、修正時に詳細閲覧を行う必要があるかどうかを判定する。すなわち、前記した図５のステップＳ５０５においてワークアイテム（ＷＩ）を選択すると、オペレータが閲覧しているワークアイテム一覧画面（図１１参照）からワークアイテム詳細画面（図１２参照）に切り替わる。図１２の画面構成の詳細については後述するが、認識対象の帳票画像全体とその帳票内の文字認識結果とが表示されるので、この画面の表示内容から、文字修正や確認作業等のために、更に詳細閲覧が必要であるかどうかをオペレータが判断する。

詳細閲覧が必要である場合には、次にステップＳ６０３において、オペレータの操作に基づき詳細閲覧が必要な文字情報のハイパーテキストを動作させる。この点が本実施形態の特徴の１つである。本実施形態では、図１２のワークアイテム詳細画面で表示する文字認識結果の文字列をハイパーテキスト化して当該文字認識対象部分の画像と関連付けた状態で表示させておく。図１２の１２０７、１２０８、１２０９に示す下線付き文字がハイパーテキスト化された文字であり、それぞれの文字認識対象となった帳票の部分画像と関連づけられている。ハイパーテキストの作動は、マウスにより、詳細閲覧を行ないたい文字列をクリックすれば良い。もちろん、マウスのほかに、キーボードなどＷｅｂブラウザ画面を操作することができるインターフェースを持ち合わせていればそれらを用いて詳細閲覧を行ないたい文字列を指示してもよい。

次にステップＳ６０４において、ハイパーテキストからリンクされている情報（ＵＲＬや画像ファイル情報など）を取得し、取得した情報をＷｅｂブラウザで表示させる（ハイパーテキスト参照先画面の構成は図１３に示す）。このとき表示される画面は、図１３の１３０３に示すような文字認識画面が強調された領域を持つ画面が好ましい。

オペレータは、このステップＳ６０４で表示された図１３のＨＴＭＬ文書から、表示されている画像イメージ１３０３内の文字画像と、表示されている文字認識結果の文字情報１３０４の整合性をチェックして一致するように修正を行う。ステップＳ６０５において文字情報の修正が必要であると判断すれば次のステップＳ６０６に進み、修正が不要であればステップＳ６０８に進む。

ステップＳ６０６では、キーボードのような文字情報を入力できる入力デバイスを用いて文字情報の修正を行う（図１３の１３０４）。続くステップＳ６０７で修正の完了を確認し、再度修正が必要な場合はステップＳ６０６に戻る。修正が終わったらステップＳ６０８において、そのまま次の修正を行うかどうかの判定をする。次の文字認識結果を修正するのであれば、次の文字列に対応するＨＴＭＬ情報に更新しステップＳ６０５に戻る。

全部の修正が完了したら、図１３の完了ボタン１３０５を押下してステップＳ６０９に進み、修正したデータをＨＴＴＰサーバ１０８に転送する。ここで転送されるデータは、例えば図１０の８０１で示すようなデータである。次のステップＳ６１０では、データ更新処理が行われる。データ更新処理が完了したらステップＳ６１１に進みフローの終了となる。

＜第１実施の形態に係るサーバ側の処理＞
図８は、図７のステップＳ６１０（データ更新処理）の詳細処理フローを示すフローチャートである。この処理フローは、ＨＴＴＰサーバ１０８及びＷｅｂアプリケーションサーバ１０９で実行される。

まずステップＳ７０１では、クライアントＰＣ１０１、１０２及び１０６から送信されてくる、図７のステップＳ６０６によって入力された修正データを受信する。このデータは例えば図１０の８０１で示すものである。

次のステップＳ７０２では、ステップＳ７０１で受信したデータが既存のデータと異なっているかのチェックを行う。チェックの結果、変更箇所がみつからなければステップＳ７０７に進み処理を終了する。なお、ステップＳ７０２のチェックは、本実施の形態として必須ではないが、無駄な更新処理を防ぐために行うことが好ましい。修正データがある場合はステップＳ７０３に進む。

ステップＳ７０３では、ハイパーテキストの修正が必要であるかどうかのチェックを行う。前記ステップＳ７０２との違いは、ステップＳ７０２ではステップＳ７０１からの受信データが画像や帳票種別など、ハイパーテキスト以外の修正も含むことである。すなわちステップＳ７０２では、画像、テキストを問わず修正の有無を確認し、ステップＳ７０３はその中からハイパーテキストに関わる修正を判別するわけである。ハイパーテキストの修正の有無は、ハイパーテキスト化されている文字列と、受信データの文字列とを比較し相違があれば修正が必要と判断してよい。修正が必要な場合はステップＳ７０４に、不要の場合はステップＳ７０５に進む。

次のステップＳ７０４では、ハイパーテキスト化されている文字の修正を行う。本実施の形態の場合では、クライアントＰＣ１０１、１０２又は１０６の図１３のような画面において修正されたハイパーテキスト文字列を含むＨＴＭＬ文書が修正対象となる。ＨＴＴＰサーバ１０８は、オペレータの要求に応じてプログラムを実行する動的ページ生成の機能を有するので、クライアントＰＣ１０１、１０２又は１０６が表示しているＨＴＭＬ文書が、その修正指示に応じてＨＴＴＰサーバ１０８に反映される。

続くステップＳ７０５においては、Ｗｅｂアプリケーションサーバ１０９に修正データを転送する。修正データを受け取ったＷｅｂアプリケーションサーバ１０９は、ステップＳ７０５においてＨＴＴＰサーバ１０８から受け取った修正データを処理するために、モジュール３０７の受信データ登録や文字認識結果登録、帳票メンテナンス機能などの処理を実行し、処理したデータをデータベース１１０に保存する。保存するデータは、文字認識結果文字列を含むＨＴＭＬ文書以外にも、画像データや帳票種別など、クライアントＰＣ１０１、１０２又は１０６から要求のあった項目である。なお、保存形態は、データベース１１０以外にもＷｅｂアプリケーションサーバ１０９上で動作するメモリ機能や外部メモリなどの利用も可能である。データを保存した後はステップＳ７０７へ進みフローを終了する。

以上が第１の実施の形態に係る処理フローである。

＜第１の実施の形態に係るハイパーテキストの更新の具体例（文字修正）＞
以下、スキャナ１０３あるいはマルチファンクションデバイス１０４から、例えば図９に示すような帳票画像データをＷｅｂアプリケーションサーバ１０９に取り込んだ際の、本実施の形態に係るハイパーテキストの更新処理の具体例について、図９〜図１５を参照しつつ説明する。

図９は、文字認識対象となるイメージ画像（帳票画像データ）の一例を示す画像図である。

図中の１１０１は画像イメージの全体を表し、この画像イメージはスキャナや外部装置から読み込んだ電子データである。１１０２、１１０４〜１１０６は記載内容を示す区分領域（帳票種別ごとに所定のプレプリント文字が予め印刷されている領域）であり、１１０３、１１０７、１１０８、１１０９の領域に記入者が記入を行う。画像イメージ１１０１では領域１１０３は未記入ということになる。１１０４はフリガナ領域であり、これに対応する記入領域は１１０７である。記入領域１１０７には「ヤマダ」という文字が記入されている。

１１０５は「お名前」領域であり、これに対応する記入領域は１１０８である。記入領域１１０８には「山田」という文字が記入されている。１１０６は「Ｔｅｌ」領域であり、これに対応する記入領域は１１０９である。記入領域１１０９には「００−１２３４−５６７８」という文字が記入されている。なお、これら記入領域（１１０３，１１０７〜１１０９）に記入される文字は活字印字、手書き文字のどちらでも良い。

このような帳票画像データが、前述した図４のステップＳ１でＷｅｂアプリケーションサーバ１０９に取り込まれると、この帳票画像データに対して、図４のステップＳ２及びステップＳ３において帳票認識（ＦＲ）や文字認識（ＣＲ）が行われた後、図１０に示すような構造の登録データとして、Ｗｅｂアプリケーションサーバ１０９のデータベース１１０に格納される。

図２４は、予め帳票種別ごとに登録されている登録帳票データであり、帳票認識時に用いられる帳票識別用データ、各文字認識対象フィールドとそのフィールド位置のデータなどが帳票種別に対応付けられてデータベース１１０に格納されている。帳票識別用データは帳票認識の手法によって格納されるデータは異なるが、例えば、プレプリントの文字や、帳票を識別するためのバーコードデータ、各種領域の位置情報などが格納され、帳票認識（ＦＲ）で使用されることにより、当該取り込んだ帳票画像データがどの帳票種別の画像なのか識別される。文字認識時は、各フィールド領域の位置を示すフィールド位置データに基づいて帳票画像データから該当領域を抽出して文字認識を行ない、対応するフィールドと関連付けて図１０の登録データを生成する。

図１０は、Ｗｅｂアプリケーションサーバ１０９で文字認識（ＣＲ）の認識結果として得られた登録データの一例を示すデータ構造図であり、データベース１１０に格納される。

図中の８０１はデータ構造の全体を表す。８０２から８０７まではデータフィールド並びに該当データを表し、フィールドの個数やフィールド名称は実施する態様によって異なる。ここでは７つのフィールドを用意している。

図中の８０２は読み込んだ帳票を一意に識別するためのＩＤを格納するワークＩＤフィールドであり、図１０の例では「０００００１」というＩＤが格納されている。図５のステップＳ５０４で使用するワークアイテム（ＷＩ）はこのＩＤを元にしている。また後述する図１１に示す画面のワークＩＤも同一のものである。８０３〜８０５は帳票ごとに設定されるフィールドであり、図９の帳票を文字認識した値を各記入領域に対応するフィールドに格納している様子を示している。なお、図７のステップＳ６０６でインターフェースを介してオペレータが値を変更した場合は、その変更入力された値が反映される。また、この文字列を基にＨＴＴＰサーバ１０８でハイパーテキスト化し、クライアントＰＣ１０１、１０２又は１０６のＷｅｂブラウザで表示する。

８０６は自由フィールドを表し、データの拡張性を表す例である。本実施の形態では図示を省略したが、帳票の種別を示すフィールド（帳票認識で識別された帳票種別データが格納され、図２４の帳票種別に対応づけられる）や、データを受信した日付を示すフィールドや、修正処理済かどうかを示すフィールドなどのその他のデータに関するフィールドが格納されているものとする。８０７は画像ファイル名を示すフィールドである。このようにワークＩＤ８０２と画像ファイル名８０７を関連付けて運用する。

図１１は、ワークアイテム画面を示す画面図である。

この画面は、図５のステップＳ５０４〜Ｓ５０５のワークアイテムに関わる処理などで呼び出されて、クライアントＰＣ１０１、１０２又は１０６のＷｅｂブラウザ上にワークアイテムが一覧表示される。

図中の１００１は表示されるワークアイテム画面全体を示す。１００２はワークＩＤ表示部である。このワークＩＤは、処理すべき帳票のタスクごとに割り振られ、図１０の８０２に示すワークＩＤと同様のものである。１００３は日付表示部であり、１００４は帳票種別表示部である。好適には、図１１で一覧表示されるワークアイテムデータは図１０の登録データのうち修正処理または承認処理が未処理のデータを表示するようにする。なお、１００２、１００３、１００４の各項目は実施の一例であり、各項目内容についてはどのようなものを用いても良い。

１００５はワークＩＤをオペレータが選択できるチェックボックスである。なお、チェックボックス以外でもワークアイテム（ＷＩ）を指定可能なＵＩであれば良い。例えば、ワークＩＤ番号に対して、ハイパーテキストを使って各ワークＩＤの帳票に関する詳細表示画面へのハイパーリンクを埋め込み、番号がクリックされると、直接そのワークアイテム詳細画面に遷移するようにしてもよい。１００６は、選択したワークアイテム（ＷＩ）の詳細表示を行う（ワークアイテム詳細画面への遷移を行う）ように指示するためのＰＥ処理ボタンである。ＰＥ処理ボタン１００６を押すことで、当該選択されたワークＩＤに関する詳細表示のＨＴＭＬ文書（図１２参照）を展開することができる。１００７は処理を終了する終了ボタンである。

図１２は、Ｗｅｂブラウザで表示されるワークアイテム詳細画面を示す画面図であり、この画面のソースはＨＴＭＬ文書で作成されており、クライアントＰＣ１０１、１０２又は１０６のＷｅｂブラウザ上で表示される。

同図中の１２０１は、表示されるワークアイテム詳細画面の全体を示し、１２１０は「ＰＥ処理の終了」ボタンであり、押下することで図１１の画面に戻ることができる。また、１２１１の「次へ」ボタンを押下すると、図１１で選択しておいた次のワークアイテムの詳細画面に変わり、次のワークアイテムがないときは図１１の一覧画面に戻る。なお、「ＰＥ処理終了」ボタンや「次へ」ボタン以外に、「キャンセル」ボタンを設け、該「キャンセル」ボタンが押下された場合は修正内容を反映させずに図１１に戻ることができるようにしてもよい。

１２０２は処理対象イメージ画像のプレビュー表示部であり、図９に示した文字認識対象となるイメージ画像がワークアイテム詳細画面のＨＴＭＬ文書に埋め込まれる。１２０３は、プレビュー表示部１２０２の文字認識対象部であり、図９のイメージ画像の記入者が書き込んだ領域を表示している。

１２０４は、現在、当該画面１２０１に表示されているワークアイテムのワークＩＤを示す。１２０５は図９のフィールド領域１１０４、１１０５、１１０６を指し、図１０の登録データのフィールド領域８０３、８０４、８０５などと関連性を持つ。

１２０７は、フリガナフィールド１１０４に対応する文字列１１０７を文字認識して得られた結果をハイパーテキスト化し表示する部分である。同様に、１２０８はお名前フィールド１１０５に対応する文字列１１０８を文字認識して得られた結果をハイパーテキスト化し表示する部分であり、１２０９は「Ｔｅｌ」フィールド１１０６に対応する文字列１１０９を文字認識して得られた結果をハイパーテキスト化し表示する部分である。図７のステップＳ６０３の処理のように、オペレータは、文字修正を行う場合（もしくは閲覧する場合）、このハイパーテキストを動作させ、当該指定した文字列に対応するハイパーテキスト参照先画面を表示することができる。

ここで、表示部１２０８の「山田」のハイパーテキストをクリックしたとすると、図１３に示すようなハイパーテキスト参照先画面が表示される。

図１３は、Ｗｅｂブラウザで表示されるハイパーテキスト参照先画面を示す画面図である。この画面は、図７のステップＳ６０３で実行されるハイパーテキストの操作に関わる処理で呼び出されて、クライアントＰＣ１０１、１０２又は１０６のＷｅｂブラウザ上で表示される。

同図中の１３０１は表示されるハイパーテキスト参照先画面を示し、１３０２は表示されているフィールド種別をしめす情報を示す。１３０３は図９に示した文字認識対象となるイメージ画像の領域１１０８を拡大表示したものである。なお、各フィールド領域画像１３０３には、図２４の登録帳票データに基づいて当該指定されたフィールドに対応する部分領域の画像が抽出されたものが、表示される。

１３０４はオペレータが内容修正を行うことができる部位であり、最初は文字認識結果の「山田」が表示されている。そしてその文字認識結果を修正する場合は、キーボードなどのインターフェースを用いることで修正入力が可能である。図１３では、「山田」を「山田太郎」に修正入力した際の画面を示している。この入力操作は、図７のステップＳ６０６の処理に相当する。すなわち、オペレータは表示されている画像１３０３を目視し、文字認識された文字と比較する。ＯＣＲの文字列になんらかの問題があり、修正したい場合はフィールド１３０４に入力を行う。

図１３の例では、フィールド１３０４の表示が「山田太郎」となっている。これは、本来、フィールド１３０４には、ハイパーテキスト化された文字「山田」（１２０８）と同じ文字列である「山田」が表示されるが、図１３の例では、それを「山田太郎」に入力し直したことを示している。

１３０５は「完了」ボタンであり、入力結果を反映し終了する。１３０６は「次へ」ボタンであり、このボタン押下することにより次のフィールドに移動することができる。

今、１３０４の内容修正部位１３０４に、オペレータが「山田太郎」という、領域イメージ画像１３０３から読み取れる文字と異なる文字列を入力し、「完了」ボタン１３０５を押下し処理を反映させたとする。これによって、図７のステップＳ６０９以降の処理が実行され、図１４の８５１に示すように、お名前フィールド８０４の「山田」を「山田太郎」に修正した更新データが生成される。

当該生成された更新データはＨＴＴＰサーバに送信され、この更新データを基に、図８のステップＳ７０４でＨＴＴＰサーバ１０８上でＨＴＭＬ文書が書き換えられ、ステップＳ７０５及びステップＳ７０６によって文字列「山田太郎」は、Ｗｅｂアプリケーションサーバ１０９のデータベース１１０に登録される。

そして、クライアントＰＣ１０１、１０２又は１０６のＷｅｂブラウザの画面に、図１１のワークアイテム画面のＨＴＭＬ文書が表示されたとき、再度、先ほど修正したワークアイテムを選択すると、ワークアイテム詳細画面の各フィールドの認識結果を示す部分は、図１５に示すような修正後の文字列が表示される。なお、図１５は、図１３の１３０４で「山田」を「山田太郎」に修正した場合に、Ｗｅｂブラウザで表示されるワークアイテム詳細画面を示す画面図である。

図１５の１４０１は図１２の１２０４〜１２０９の領域を拡大した部分であるが、文字列の修正及びハイパーテキスト化が更新された結果、お名前フィールドのハイパーテキスト化した文字列１４０２が「山田太郎」に変更されている。

このように、図１１の画面でワークアイテムを指定しＰＥ処理ボタン１００６を押下することで、クライアントＰＣ１０１、１０２又は１０６のＷｅｂブラウザで表示するＨＴＭＬ文書をＨＴＴＰサーバ１０８から取得して表示する際、ハイパーテキスト化された文字列が動的に更新される。

本実施の形態では、クライアントＰＣ１０１、１０２又は１０６の操作画面において、ハイパーテキストを利用した操作を可能にしたので、オペレータの操作画面に多くの詳細表示用のボタンを表示せずに済むし、また、参照先をオペレータに指定させるようなことも不要となる。

すなわち、（１）文字認識又は修正文字列をハイパーテキスト化したので、オペレータに詳細情報があることを知らせる効果がある。

（２）ハイパーテキストのリンク先を、文字認識又は修正文字列の画像情報を含む文書にし、ハイパーテキストを動作させることで、文字認識結果の修正作業を簡単に行うことができる。

（３）オペレータが閲覧するＷｅｂページ群の生成処理をＷｅｂサーバ上で実行することで、複数のオペレータに上記（１）及び（２）の効果を提供することができる。

（４）また、クライアントでは、汎用のＷｅｂブラウザを用いて修正処理等の各種処理を行うことができるので、専用のアプリケーションをインストールしなくて済むので、手間がかからないという効果がある。

［第２の実施の形態］
図９の文字認識対象となるイメージ画像において、領域１１０３、１１０７、１１０８、１１０９は記入者が記入を行う領域である。このとき、領域１１０３のように記入がなされていない領域に対して文字認識を行った場合や、文字が汚くて認識不能である場合、文字列を正しく取得することができない（このような文字列を不明文字と呼ぶ）。第２の実施の形態では、文字列のハイパーテキスト化を行う際に、不明文字については、オペレータに分かり易いように、予め指定されている予約語を当てはめるようにしたものである。

＜第２の実施形態のサーバ側に格納されているデータ例＞
図１６は、第２の実施の形態に係る文字認識（ＣＲ）の認識結果として、Ｗｅｂアプリケーションサーバ１０９を介したデータサーバ１１０に格納された登録データの一例を示すデータ構造図であり、不明文字を含んだ登録データを表したものである。

同図中の１５０１はデータ構造の全体を表し、１５０２は前記図１０の８０２と同様の役割を果たすワークＩＤフィールドで「０００１００」というＩＤが格納されている。このＩＤは文字認識の結果によらず生成される。１５０３は文字認識結果の格納フィールドである。図９の領域１１０３には何も記述されていないので、文字認識結果１５０３は空白のデータとなる。１５０４はその他のデータを表し、図１０の８０３から８０７までに相当するが、ここでの説明は割愛する。

＜第２の実施形態に係るハイパーテキストの更新例（不明文字）＞
図１７は、第２の実施の形態に係るワークアイテム詳細画面を示す画面図である。

同図中の１６０１は、図１２の１２０４〜１２０９の領域を拡大した部分であり、特に記述しないものは図１２と同じ画面構成である。

１６０２は、正常に認識された結果をハイパーテキスト化した文字列を示す（このハイパーテキスト文字列は図１３のようなハイパーテキスト参照先画面にハイパーリンクされており、クリックすると第１の実施形態と同様に該画面へ遷移する）。１６０３はフィールド１５０３の空白部分の認識結果を表し、本実施の形態では「（未記入）」の文字列をハイパーテキスト化している。本実施の形態では、フィールド１５０３のデータ上は「空白」の扱い（又は不明文字扱い）となる文字に対し、「（未記入）」などの文字を宛がう。１６０４は、対応するフィールド画像領域内に文字列らしきものをあったが文字認識できなかった場合を示す例であって、「（認識失敗）」の文字を使用している。

このように本実施の形態では、文字認識結果、空白や認識失敗であった場合に、「（未記入）」や「（認識失敗）」などの認識結果文字列以外の情報を示す所定の文字列をハイパーテキスト化することで、閲覧するオペレータに認識できた文字列以外の情報についても、未記入なのか、認識失敗なのか伝えることができ、更に、その所定の文字列をクリックすると対応する画像領域を確認することができるという効果がある。

本実施の形態は、未記入領域の文字認識結果を「空白」として扱った例であるが、未記入領域及び不明文字の認識結果はＯＣＲエンジンの特性によって決定される。未記入領域の認識結果が「スペース」や「ブランク」、「認識不能」などとして扱われることもあるが、その場合は、その認識結果がそのままフィールド１５０３に格納される。従って、このような不明文字の認識結果文字列についても、上記同様の効果を得ることができる。

［第３の実施の形態］
第３の実施の形態では、ＨＴＴＰサーバ１０８並びにＷｅｂアプリケーションサーバ１０９が保持する図１０に示す登録データの項目に、図１８のような各フィールド情報における備考となる各種データ欄を設け、その内容によりオペレータが閲覧するＨＴＭＬ文書（図１２）のハイパーテキスト化された文字列に装飾を加える。

図１８は、第３の実施の形態に係る文字認識（ＣＲ）の認識結果として、Ｗｅｂアプリケーションサーバ１０９を介したデータサーバ１１０に格納された登録データの一例を示すデータ構造図であり、各フィールド情報における備考データ欄領域（付加情報フィールド）を加えた登録データを表したものである。図１８の例では備考データは、文字認識処理時に得られたデータを用いることとする。

同図中の１７０１はデータ構造の全体を表す。１７０２は前記図１０と同様のフィールドである。１７０３はそのフィールドのデータを表し、８０２、８０３、８０４と同様の役割を果たす。１７０７はその他のデータを表す。１７０４は各フィールドの備考欄領域に相当し、フリガナフィールドの備考欄（付加情報フィールド）として「フリガナ認識率」、「お名前」フィールドの備考欄（付加情報フィールド）として「お名前文字候補」がある。１７０５は「フリガナ認識率」のデータであり、１７０６は「お名前文字候補」のデータである。

この登録データを基に、後述する図２０及び図２１の画面を表示するためのＨＴＭＬ文書を作成し、ＨＴＴＰサーバ１０８に蓄積しておくのである。以下、この点について詳細に説明する。

＜第３の実施の形態に係るサーバ側の処理＞
図１９は、第３の実施の形態に係る画面を表示するためのＨＴＭＬ文書作成処理を示すフローチャートであり、本処理は、ＨＴＴＰサーバ１０８及びＷｅｂアプリケーションサーバ１０９で行われる。

まず、ステップＳ１８０１では、データベース１１０から図１８の登録データを取得し、次のステップＳ１８０２においてＨＴＭＬ文書の作成を行う。このＨＴＭＬ文書は、ＨＴＴＰサーバ１０８に格納し保持しておくもので、第１及び第２の実施の形態においてオペレータが閲覧するＨＴＭＬ文書（図１２）に相当する。

次にステップＳ１８０３で図１８に示すデータの中に付加情報フィールドが存在するかの判定を行う。付加情報がない場合はステップＳ１８０８に進み、作成した文書をＨＴＴＰサーバ１０８に格納し処理を終了する。付加情報がある場合はステップＳ１８０４に進む。

ステップＳ１８０４では付加情報の内容によって処理を行う。付加情報が認識精度を示す認識率であった場合はステップＳ１８０５に進み、認識率に応じて該当するハイパーテキストの文字列（例えば認識率の低い文字列）に横線を付加する（図２０の１９０２）。

次にステップＳ１８０６に進み、付加情報が候補文字であるかの判定を行う。候補文字に該当する場合はステップＳ１８０７に進み、該当するハイパーテキストのフォントを変更する（図２０の１９０３）。なお、横線やフォントの変更は、実施の一形態であって、サイズや色等の描画文字に変化を与えるものであれば何でも良い。

次にステップＳ１８０８に進み、作成した文書をＨＴＴＰサーバ１０８に格納し処理を終了する。

＜第３の実施の形態に係るハイパーテキストの更新例（書式）＞
図２０は、第３の実施の形態に係るワークアイテム詳細画面を示す画面図であり、文字列以外の情報を加味し、ハイパーテキスト化された文字列の書式設定を変更した例を表している。

同図中の１９０１は、図１２の１２０４〜１２０９の領域を拡大した部分であり、特に記述しないものは図１２と同じ画面構成である。

１９０２は、ステップＳ１８０５で横線を入れた文字列データ１７０３を表し、「ヤマダ」の文字列をハイパーテキスト化したものである。１９０３はステップＳ１８０７でフォントスタイルをイタリック体に変更した文字列データ１７０６を表し、「山田」の文字列をハイパーテキスト化したものである。

図２１は、第３の実施の形態に係るハイパーテキスト参照先画面を示す画面図である。このハイパーテキスト参照先画面は、図１３のハイパーテキスト参照先画面に、文字の書式設定機能を追加したものである。

同図中の２００７は本実施の形態で追加された部位で、オペレータがフィールド１３０４より入力する文字に書式設定を追加できるインターフェースである。変更できる項目は２００７に示すように、スタイル、色、サイズの他に、フォント、位置など表示に関わる書式設定であれば何でも良い。このように変更し完了ボタン１３０５によって処理を完了した場合、図８のフローに従い修正内容が反映されるのは第１の実施の形態と同じである。

このように本実施の形態では、認識の精度や候補文字の有無に応じて、ハイパーテキスト化する文字列の字体や色に変化をつけることによって、オペレータに認識文字列以外の情報を意識付ける効果がある。また、オペレータが文字修正を行う場合に、ハイパーテキスト化対象の文字列に字体や色の変化を指定できるようにすることによって、認識文字列以外の情報を持たせる効果がある。

なお、本第３の実施の形態以外にもＯＣＲエンジンの特性によって様々な付加情報を取得することができ、このような付加情報の内容は本発明の範疇にあり、どのような付加情報を用いても上記した本実施の形態の効果を得ることができる。

［第４の実施の形態］
第４の実施の形態は、第１の実施の形態に、ユーザ権限によってハイパーテキスト化された文字列の参照先を変更する機能を加えたものである。すなわち、オペレータが閲覧するＨＴＭＬ文書（図１２）のハイパーテキスト化された文字の参照先情報をユーザのログイン権限によって変更するものである。本実施の形態では、ＨＴＴＰサーバ１０８が予め権限ごとにＨＴＭＬ文書を保持しており、それをユーザによって使い分ける。

図２２は、第４の実施の形態に係るユーザ権限によるハイパーテキスト参照先変更処理を示すフローチャートである。本処理は、クライアントＰＣ１０１、１０２又は１０６上で実行される。

まず、ステップＳ２１０１は図５のステップＳ５０１と同様のログイン処理であり、図６のログイン画面のＨＴＭＬ文書を表示させて行う。次にステップＳ２１０２においてそのオペレータの権限確認を行う。次にステップＳ２１０３において図１１のＨＴＭＬ文書を取得し表示させワークアイテム（ＷＩ）を選択し図１２のＨＴＭＬ文書を表示する。図５のステップＳ５０２ではＰＥ権限を有するオペレータに対して次に表示すべき画面（図１１や図１２の画面）を表示していたが、本実施の形態では権限によらず次に表示すべき画面（図１１や図１２の画面）を表示する。

次にステップＳ２１０４において、オペレータが必要なハイパーテキストを動作させる。ハイパーテキストの作動により、図７のステップＳ６０４のようにＨＴＴＰサーバ１０８から、操作画面上に表示する情報を取得するが、ステップＳ２１０５において、前記ステップＳ２１０２で確認した権限（ＰＥ又はＩＰ）に応じて、取得する情報を変化させる。

ここで、ＰＥ権限とは、オペレータが文字修正処理（ポストエディタ）を行う権限である。また、ＩＰ権限とは、ＰＥ権限者が修正した内容を確認し承認処理（イニシャル・プロポーザル：ＩｎｉｔｉａｌＰｒｏｐｏｓａｌ）を行う権限である。

前記ステップＳ２１０５の判定がＰＥ権限である場合は、ステップＳ２１０６に進んで図１３などの画面を表示し、前記第１の実施の形態と同様の修正作業をステップＳ２１０７で行い、ステップＳ２１１０で終了する。

一方、ＩＰ権限である場合は、ステップＳ２１０８に進んで、例えば後述する図２３に示すような個人情報を示すページを表示する。この図２３に示すＨＴＭＬ文書は、文字認識結果を表すものではなく、ポストエディット処理（ＰＥ）の結果から導ける情報である。この情報は、基幹システムのデータと連動するものであったり、付属する別の帳票の認識結果であったりするもので、イニシャル・プロポーザル（ＩＰ）の業務内容によって変更することができる。

そして、ＩＰ権限の場合は、次のステップＳ２１０９において、図２３の承認ボタン２２０３を押下することによる承認処理を行い、ステップＳ２１１０によって処理を終了する。

＜ＩＰ権限者用の画面の説明＞
図２３は、第４の実施の形態に係るＩＰ権限者用のハイパーテキスト参照先画面を示す画面図である。

同図中の２２０１は、クライアントＰＣ１０１、１０２又は１０６上に表示されるＨＴＭＬ文書の全体を示す。２２０２は、ポストエディット処理（ＰＥ）の結果とは異なる情報が表示されるフィールドであり、２２０３は承認決定ボタン、２２０４は、承認処理を行わずに前の画面に戻るためのボタンである。

このように本実施の形態では、使用するオペレータによって、ハイパーテキストのリンク先を異なるようにすることで、オペレータの作業に相違を持たせることができる。

なお、上記各実施の形態では、ＷｅｂページがＨＴＭＬで記述されているとしたが、Ｗｅｂページを記述できるマークアップ言語、及びそれに類する言語、例えばＸＭＬ準拠のＸＨＴＭＬなどを利用した場合にも本発明の実現は容易であり、本発明はＷｅｂページの記述言語に関わらず有効なものである。

本発明は、上述した実施形態の装置に限定されず、複数の機器から構成されるシステムに適用しても、１つの機器から成る装置に適用しても良い。前述した実施形態の機能を実現するソフトウェアのプログラムコードを記憶した記憶媒体をシステムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ（又はＣＰＵやＭＰＵ）が記憶媒体に格納されたプログラムコードを読み出し実行することによっても、完成されることは言うまでもない。

この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。プログラムコードを供給するための記憶媒体としては、例えば、フロッピー（登録商標）ディスク、ハードディスク、光ディスク、光磁気ディスク、ＣＤ−ＲＯＭ、ＣＤ−Ｒ、磁気テープ、不揮発性のメモリカード、不揮発性メモリを用いることができる。また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけではなく、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているＯＳなどが実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。

さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、次のプログラムコードの指示に基づき、その拡張機能を拡張ボードや拡張ユニットに備わるＣＰＵなどが処理を行って実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。

本発明の実施の形態に係る画像処理システムの構成図である。図１に示したクライアントＰＣ及びＷｅｂアプリケーションサーバの構成を示すブロック図である。本実施の形態に係るモジュールの構成を示すブロック図である。本実施の形態に係る画像処理システムの処理フローを示すブロック図である。図４のステップＳ４で実行されるポストエディット処理（ＰＥ）の詳細フローを示すフローチャートである。Ｗｅｂブラウザで表示されるログイン画面の一例を示す画面表示図である。図５のステップＳ５０６（文字修正処理）の詳細処理フローを示すフローチャートである。図７のステップＳ６１０（データ更新処理）の詳細処理フローを示すフローチャートである。文字認識対象となるイメージ画像（帳票画像データ）の一例を示す画像図である。第１の実施の形態に係る文字認識（ＣＲ）の認識結果として、データサーバに格納された登録データの一例を示すデータ構造図である。ワークアイテム画面を示す画面図である。Ｗｅｂブラウザで表示されるワークアイテム詳細画面を示す画面図である。Ｗｅｂブラウザで表示されるハイパーテキスト参照先画面を示す画面図である。第１の実施の形態に係る更新データの一例を示すデータ構造図である。Ｗｅｂブラウザで表示されるワークアイテム詳細画面を示す画面図である。第２の実施の形態に係る文字認識（ＣＲ）の認識結果として、Ｗｅｂアプリケーションサーバ１０９を介したデータサーバ１１０に格納された登録データの一例を示すデータ構造図である。第２の実施の形態に係るワークアイテム詳細画面を示す画面図である。第３の実施の形態に係る文字認識（ＣＲ）の認識結果として、データサーバに格納された登録データの一例を示すデータ構造図である。第３の実施の形態に係るＨＴＭＬ文書作成処理を示すフローチャートである。第３の実施の形態に係るワークアイテム詳細画面を示す画面図である。第３の実施の形態に係るハイパーテキスト参照先画面を示す画面図である。第４の実施の形態に係るユーザ権限によるハイパーテキスト参照先変更処理を示すフローチャートである。第４の実施の形態に係るＩＰ権限者用のハイパーテキスト参照先画面を示す画面図である。帳票種別ごとに登録されている登録帳票データを示す図である。

符号の説明

１０１，１０２，１０６クライアントＰＣ
１０３スキャナ
１０４マルチファンクションデバイス
１０８ＨＴＴＰサーバ
１０９Ｗｅｂアプリケーションサーバ
１０５，１０７，１１１ネットワーク
１１０データベース

Claims

画像データから文字情報を含む第１の情報を取得する第１の装置と、前記第１の情報を含む情報の編集を行う第２の装置とを備え、前記第１の装置から受け取った前記第１の情報を前記第２の装置の画面上に表示させる文書処理システムにおいて、
前記第２の装置の画面上に表示される前記第１の情報と、前記画像データにおける前記第１の情報に該当する部分を含む第２の情報とをハイパーテキストを用いて関連付けることを特徴とする文書処理システム。
前記第２の装置で前記ハイパーテキストを作動させたときに、前記第２の情報を前記第２の装置の画面上に表示することを特徴とする請求項１に記載の文書処理システム。
前記第１の装置により、前記ハイパーテキストの対象となっている情報を編集した場合に、その編集後の情報に対してハイパーテキスト化を行うことを特徴とする請求項１又は２記載の文書処理システム。
前記ハイパーテキストの対象となっている情報は、前記第１の情報のうちの所定の文字情報であることを特徴とする請求項３に記載の文書処理システム。
前記ハイパーテキストの対象となる所定の文字情報が、前記画像データから取得されなかった場合は、予め指定されている文字情報に対してハイパーテキスト化を行うことを特徴とする請求項４に記載の文書処理システム。
前記ハイパーテキストの対象となっている情報は、前記所定の文字情報に関連した文字情報であることを特徴とする請求項３に記載の文書処理システム。
前記ハイパーテキストの対象となっている情報の編集は、前記所定の文字情報又はこれに関連した文字情報に対する書式設定を含み、編集後の文字情報に前記書式設定を反映させてハイパーテキスト化を行うことを特徴とする請求項４乃至６のいずれかに記載の文書処理システム。
前記第１の装置が前記画像データから文字情報を取得する時に得られる情報を、前記ハイパーテキスト化の対象となる文字情報の書式設定に反映することを特徴とする請求項７に記載の文書処理システム。
ユーザを識別するユーザ識別手段を備え、
前記ユーザ識別手段で識別されたユーザに応じて、同一のハイパーテキストを作動させた場合に、異なる動作をすることを特徴とする請求項１乃至８のいずれかに記載の文書処理システム。
前記ハイパーテキストの対象となっている情報を編集した場合に、その編集後の情報に置き換えたハイパーテキストを含むＷｅｂページを作成又は更新することを特徴とする請求項１乃至９のいずれかに記載の文書処理システム。
前記Ｗｅｂページを作成又は更新する処理をＷｅｂサーバ上で実行することを特徴とする請求項１０に記載の文書処理システム。
画像データから文字情報を含む第１の情報を取得する第１の装置と、前記第１の情報を含む情報の編集を行う第２の装置とにネットワークを介して接続され、前記第１の装置から受け取った前記第１の情報を前記第２の装置の画面上に表示させる情報処理装置において、
前記第２の装置の画面上に表示される前記第１の情報と、前記画像データにおける前記第１の情報に該当する部分を含む第２の情報とをハイパーテキストを用いて関連付けることを特徴とする情報処理装置。
画像データから文字情報を含む第１の情報を取得する第１の装置と、前記第１の情報を含む情報の編集を行う第２の装置とを用い、前記第１の装置から受け取った前記第１の情報を前記第２の装置の画面上に表示させる文書処理方法であって、
前記第２の装置の画面上に表示される前記第１の情報と、前記画像データにおける前記第１の情報に該当する部分を含む第２の情報とをハイパーテキストを用いて関連付けることを特徴とする文書処理方法。
画像データから文字情報を含む第１の情報を取得する第１の装置と、前記第１の情報を含む情報の編集を行う第２の装置とにネットワークを介して接続され、前記第１の装置から受け取った前記第１の情報を前記第２の装置の画面上に表示させる情報処理装置の制御方法を実行するための、コンピュータで読み取り可能な制御プログラムであって、
前記第２の装置の画面上に表示される前記第１の情報と、前記画像データにおける前記第１の情報に該当する部分を含む第２の情報とをハイパーテキストを用いて関連付けるステップを備えたことを特徴とする制御プログラム。