JP2006126942A - 文書処理システム、情報処理装置、文書処理方法、及び制御プログラム - Google Patents

文書処理システム、情報処理装置、文書処理方法、及び制御プログラム Download PDF

Info

Publication number
JP2006126942A
JP2006126942A JP2004311077A JP2004311077A JP2006126942A JP 2006126942 A JP2006126942 A JP 2006126942A JP 2004311077 A JP2004311077 A JP 2004311077A JP 2004311077 A JP2004311077 A JP 2004311077A JP 2006126942 A JP2006126942 A JP 2006126942A
Authority
JP
Japan
Prior art keywords
information
hypertext
screen
character
document processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004311077A
Other languages
English (en)
Inventor
Takeshi Hayakawa
武志 早川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2004311077A priority Critical patent/JP2006126942A/ja
Publication of JP2006126942A publication Critical patent/JP2006126942A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

【課題】 ハイパーテキストを利用した操作画面を実現することで、オペレータのユーザビリティを向上させた文書処理システムを提供する。
【解決手段】 画像データから文字情報を認識するWebアプリケーションサーバ109と、前記認識した文字情報の編集を行うクライアントPC101、102、106と、サーバ109から受け取った文字認識結果の文字列をクライアントPCの画面上に表示させるHTTPサーバ108とがネットワークを介して接続されている。サーバ108は、クライアントPCの画面上に表示される文字認識結果の文字列と、前記画像データにおける前記文字列に該当する部分が表示される画面(ハイパーテキスト参照先画面)とをハイパーテキストを用いて関連付ける。
【選択図】 図12

Description

本発明は、画像データから文字情報を取得することが可能な文書処理システム及び文書処理方法、前記文書処理システム内に備えられた情報処理装置、並びに前記情報処理装置を制御する制御プログラムに関する。
従来、ハードコピー文書をスキャニングし電子化を行うシステムには、電子化された文書に対して、光学的手法による文字認識(OCR:Optical Character Reader)を行い、記述されている文字列を認識する機能(以下、OCR機能と記す)を備えたものがある。
このOCR機能では、入力された画像データから特定の領域を参照し、その領域内に記載されている文字を読み取り、読み取った文字の特徴と文字認識用の辞書とを比較して、類似するものを、画像に記述されている文字(又は候補文字)として特定するパターン認識処理を行っている。
これら特定された文字の一致精度は、画像データに記述されている筆記状態によって大きく変動する。そのため、文字認識を行った結果である文字と元の画像データの文字とを完全一致させることは困難である。そこで、文字認識を行った結果をオペレータに表示し、オペレータによって確認作業を行わせ、誤認識している文字に関しては手作業で修正補完している。
近年では、OCR機能を持たない企業などのシステム(バックエンド側のシステム)に対して、ネットワークを介して、OCR機能を備えるワークフローシステムが提供されるようになってきている。
しかしながら、一日に大量の紙データを処理する場合では、大人数のオペレータや大規模な環境が必要となる。このような状況でワークフローシステム全体の作業効率を向上させるには、文字認識処理結果についてのオペレータによる確認作業と修正作業にかける時間を最小限にすることが課題となる。そのため、これまでにオペレータの出番を極力少なく、かつ正確に作業を持続して行える環境の構築がなされてきた。具体的には、オペレータが操作するインターフェースの向上であり、例えば視覚的に把握しやすいレイアウトやキー操作の少ないユーザインターフェース(GUI)を有するシステムが種々提案されている(例えば、特許文献1、特許文献2、特許文献3)。
特開平07−200731号公報 特開2003−150906号公報 特開平11−316802号公報
しかしながら、従来のシステムのユーザインターフェースでは、オペレータのユーザビリティ向上の観点から、まだ改善される余地が多く残されていた。例えば、オペレータの操作画面に多くの操作ボタンを表示したり、参照先をオペレータに指定させたりすることは、オペレータの操作を煩雑にすることになるが、これらを容易に解決する方法は、未だ実現されていなかった。
また、従来のシステムは専用の装置や専用のアプリケーションを必要とするものであって、本発明のように汎用のアプリケーション(Webブラウザ等)を用いて、操作性の良い操作画面を実現することは考えられていなかった。
本発明は上記従来の問題点に鑑み、ハイパーテキストを利用した操作画面を実現することで、オペレータのユーザビリティを向上させた文書処理システム、情報処理装置、文書処理方法、及び制御プログラムを提供することを目的とする。
本発明は上記目的を達成するため、画像データから文字情報を含む第1の情報を取得する第1の装置と、前記第1の情報を含む情報の編集を行う第2の装置とを備え、前記第1の装置から受け取った前記第1の情報を前記第2の装置の画面上に表示させる文書処理システムにおいて、前記第2の装置の画面上に表示される前記第1の情報と、前記画像データにおける前記第1の情報に該当する部分を含む第2の情報とをハイパーテキストを用いて関連付けることを特徴とする。
また、本発明は、画像データから文字情報を含む第1の情報を取得する第1の装置と、前記第1の情報を含む情報の編集を行う第2の装置とにネットワークを介して接続され、前記第1の装置から受け取った前記第1の情報を前記第2の装置の画面上に表示させる情報処理装置において、前記第2の装置の画面上に表示される前記第1の情報と、前記画像データにおける前記第1の情報に該当する部分を含む第2の情報とをハイパーテキストを用いて関連付けることを特徴とする。
また、本発明は、画像データから文字情報を含む第1の情報を取得する第1の装置と、前記第1の情報を含む情報の編集を行う第2の装置とを用い、前記第1の装置から受け取った前記第1の情報を前記第2の装置の画面上に表示させる文書処理方法であって、前記第2の装置の画面上に表示される前記第1の情報と、前記画像データにおける前記第1の情報に該当する部分を含む第2の情報とをハイパーテキストを用いて関連付けることを特徴とする。
また、本発明は、画像データから文字情報を含む第1の情報を取得する第1の装置と、前記第1の情報を含む情報の編集を行う第2の装置とにネットワークを介して接続され、前記第1の装置から受け取った前記第1の情報を前記第2の装置の画面上に表示させる情報処理装置の制御方法を実行するための、コンピュータで読み取り可能な制御プログラムであって、前記第2の装置の画面上に表示される前記第1の情報と、前記画像データにおける前記第1の情報に該当する部分を含む第2の情報とをハイパーテキストを用いて関連付けるステップを備えたことを特徴とする。
本発明によれば、オペレータが扱う操作画面にハイパーテキスト化された情報を使用することができるので、操作画面の構成をシンプル化させつつ、オペレータに必要な情報を伝える仕組みを実現することが可能になる。これにより、オペレータのユーザビリティが向上する。
本発明の文書処理システム、情報処理装置、文書処理方法、及び制御プログラムの実施の形態について、図面を参照しながら説明する。
[第1の実施の形態]
<システムの構成>
図1は、本発明の実施の形態に係る画像処理システムの構成図である。
この画像処理システムは、ネットワーク上に、クライアントPC101,102,106と、スキャナ103及びマルチファンクションデバイス104と、HTTPサーバ(Webサーバ)108と、Webアプリケーションサーバ(WAS)109とを備えている。
クライアントPC101,102,106は、Webブラウザを使用しHTTPで通信するコンピュータであり、例えば、システム管理者が新規データファイルを登録したり、ユーザ管理情報の修正などのシステムメンテナンス処理を行ったり、あるいは登録作業者がWebアプリケーションサーバ109上に受信された帳票の電子文書を仕分けして確認したり、申請承認者が申請の承認作業を行うために使用されるパソコンである。
スキャナ103は、ネットワーク上で共有されている画像データを読み込むスキャナであり、ユーザから郵便で送付されてきた申請書や、支店へ持ち込まれた申込書などの帳票を読み込むために使用される。
マルチファンクションデバイス104は、ネットワーク上で共有されているマルチファンクションデバイスであり、スキャナ103と同様にスキャナとしても使用することができるほか、マルチファンクションデバイス104が受信したファックス画像をWebアプリケーションサーバ109などに、LAN(ローカルエリアネットワーク)105、111及びインターネット107を経由して登録することもできる。
LAN105に接続している機器101〜105は、このLAN105を介して他の機器とデータのやり取りを行う。クライアントPC106は、インターネット107に直接に接続されている。
HTTPサーバ(Webサーバ)108は、ネットワークを介してクライアントPC101,102,106からHTTPプロトコルで送られてきたリクエストを受け取るサーバである。HTTPサーバ108には、いくつかのWebアプリケーションサーバが登録されており、HTTPサーバ108は、クライアントPC101,102,106からのリクエスト内容に従って、処理を適切なWebアプリケーションサーバに割り振る。また、リクエストを受け取った例えばWebアプリケーションサーバ109は、処理を実行してその処理結果をクライアントPC101,102,106へ返信する。
Webアプリケーションサーバ109には、データベース110が接続されている。このデータベース110には、受信した帳票画像データ、文字認識結果、及び申請処理ステータスなどの情報や、ユーザ/グループ情報、及び登録データファイルの処理情報などのシステム情報が記録される。HTTPサーバ108、Webアプリケーションサーバ109、及びデータベース110が有機的に組み合わされて、Webデータベースシステムとして機能する。
そして、Webアプリケーションサーバ109は、例えばLAN111を介して企業などのバックエンドシステム(顧客管理システム)120に接続されており、このバックエンドシステム120の画像サーバに、スキャナ103等から入力されWebアプリケーションサーバ109で処理された帳票画像データが登録されるようになっている。
なお、バックエンドシステム120は、アプリケーションサーバ109にダイレクトに接続される構成であっても良い。
<装置の構成>
図2は、図1に示したクライアントPC101,102,106、HTTPサーバ108及びWebアプリケーションサーバ109の構成を示すブロック図である。
図中の1はシステム・バスであり、システムバス1には、CPU(Centrtal Processing Unit)2、プログラム・メモリ(PMEM)3、通信制御部4、外部記憶装置制御部8、入力制御部11、ビデオ・イメージ・メモリ(VRAM)14、表示出力制御部15、プリンタ制御部17、外部機器制御部19、及び画像読み取り機器制御部20が接続されている。
通信制御部4は、通信ポート5に於ける入出力データの制御を行い、通信ポート5から出力された信号は、通信回線6を経由してネットワーク上の他の装置の通信ポートに伝えられる。外部記憶装置制御部8は、データファイル用のディスクとして、例えばフロッピー(登録商標)ディスク(FD)9やハード・ディスク(HD)10に対するアクセスを制御する。
入力制御部11には、キーボード12やマウス13等の入力装置が接続される。操作者は、この入力装置を操作することによりシステムの動作指令等を行う。ビデオ・イメージ・メモリ(VRAM)14には、表示出力制御部15を介してCRT16が接続され、CRT16に表示されるデータはVRAM14上にビットマップデータとして展開されている。CRT16上で画像情報を加工指示するためのポインティング・デバイスであるマウス13により、CRT16上のカーソルをX,Y方向任意に移動してコマンドメニュー上のコマンド・アイコンを選択し、処理の指示を行うほか、編集対象の指示、描画位置の指示等も行うようになっている。
PMEM3は、本実施の形態に係る処理を実行するためのプログラムをハード・ディスク10から適宜、選択して読み込み、CPU2での実行に供する。また、キーボード12から入力されたデータは、テキスト・メモリでもあるPMEM3にコード情報として格納される。
プリンタ制御部17は、接続されているプリンタ18に対するデータの出力制御を行う。画像読み取り機器制御部20は、画像読み取り機器21に接続され、その接続機器の制御を行う。外部機器制御部19は、プリンタやスキャナなどの外部機器を制御するためのものである。
なお、本実施の形態のクライアントPC101,102,106では、クライアントPCに直接接続されたプリンタ18とプリンタ制御部17、画像読み取り機器制御部20と画像読み取り機器21といった構成要素は必ずしも必要ではなく、通信制御部4及び通信ポート5を介して、ネットワークに接続されたプリンタやスキャナを利用できるようにしてもよい。例えば、スキャナ103やマルチファンクションデバイス104などを使用することにより、画像を読み取ることができる。
なお、本実施の形態ではLANなどのネットワークに関して記述するが、この通信制御部4に接続される通信ポート5及び通信回線6が一般の公衆回線であっても本発明が適応されることは言うまでもない。
また、画像読み取り機器制御部20と画像読み取り機器21が物理的に別々のコンポーネントであっても、画像読み取り機器制御部20が画像読み取り機器21を含む1つのコンポーネントであっても、同様な機能を有することとする。
また、PMEM3に記憶されるプログラムは、装置に直接接続されているハードディスク(HD)やフロッピー(登録商標)ディスク(FD)などの記憶媒体に記憶されているほか、ネットワークで接続されている他の装置上に記憶されていても良い。
なお、クライアントPC101,102,106では、汎用のWebブラウザ(例えば、Microsoft Internet Explorer(登録商標))が記憶媒体に格納されており、CPU2が該Webブラウザプログラムを読み込んで実行し、該Webブラウザ上で本発明のユーザインターフェースが実現される。
<モジュール構成>
図3は、本実施の形態に係るモジュールの構成を示すブロック図である。
同図に示すように、クライアントPC101,102,106は、カタログ情報や画像データなどのデータファイルをWebアプリケーションサーバ109にHTTPサーバを介して登録したり、商品データを出力するためのフォーム情報を登録したりするための情報登録モジュール302と、承認者が承認処理を行なうための登録承認モジュール303などを記憶している。但し、これらのモジュールは、Webアプリケーションサーバ109から必要に応じてWebブラウザのプラグイン(Plug−in)形式などで自動的に配信されるので、クライアントPC101,102,106上でインストール処理などを行う必要はない。
さらに、Webアプリケーションサーバ109には、HTTPサーバ108から受け取った、クライアントPC101,102,106からのリクエストを処理するためのモジュール307が記憶されている。
このモジュール307の機能としては、例えば、ユーザ認証機能、検索処理機能、ワークフロー制御機能、受信データ登録機能、ワークフロー登録機能、送付状登録機能、ユーザ管理機能、グループ管理機能、データメンテナンス機能、認識結果登録機能、認識帳票登録機能、及びデバイス設定登録機能がある。
ここで、ユーザ認証機能は、ユーザがシステムにログインした際にユーザの権限を確認する機能であり、検索処理機能は、ユーザが行うべき作業や、行った作業を検索する機能である。ワークフロー制御機能は、ワークフローの制御に関する機能であり、受信データ登録機能は、受信した帳票画像データの登録に関する機能である。ワークフロー登録機能は、ワークフローの定義、登録に関する機能であり、送付状登録機能は、送付状の定義、登録に関する機能である。ユーザ管理機能は、個人情報の登録、管理を行う機能であり、グループ管理機能は、ユーザが属するグループの登録、管理を行う機能である。データメンテナンス機能は、帳票を格納するフォルダなど内部で使用するデータを設定する機能であり、認識結果登録機能は文字認識結果の登録に関する機能であり、認識帳票登録機能は、認識された帳票画像データの定義、登録に関する機能である。デバイス設定登録機能は、メールサーバ、送付状を印刷するプリンタのIPアドレスなどの情報を設定する機能である。これらのモジュールは、クライアントPC101,102,106からのリクエストに応じてPMEM3上にロードされ、処理が実行される。
また、Webアプリケーションサーバ109には、これらのモジュール307とは別に、ワークフローエディタ部や送付状エディタ部などを備えた編集モジュール308がある。さらに、データベース110とのデータのやり取りを行うためのデータベース共通ライブラリ309や各種ユーティリティライブラリ310がある。
<システムの処理フロー>
次に、申請書などの帳票画像を受け取り、その帳票に対して帳票認識及び文字認識を実行し、申請の承認フローを起動し、企業のバックエンドシステムと連携をとり、そのバックエンドシステムの画像サーバへ自動的に格納させる、本実施の形態の画像処理システムに係る一連の処理フローについて、図4を参照して説明する。
図4は、本実施の形態に係る画像処理システムの処理フローを示すブロック図である。この処理フローの制御は、基本的にWebアプリケーションサーバ109で実行され、データの表示や編集、動作指示などはクライアントPC101,102または106のブラウザにより処理される。なお、この処理フローを、以下、ワークフローと呼ぶことにする。
図4において、まずステップS1は、スキャナ103あるいはマルチファンクションデバイス104から、LAN105,111及びインターネット107経由で帳票画像データ(図11参照)をWebアプリケーションサーバ109に取り込む処理を示している。
続くステップS2では、受信した帳票画像データの帳票認識(FR)を行って帳票の種別を決定し、該帳票の種別に対応して設定されている処理フローを呼び出して、以降の各処理に関する設定などを行なう。ステップS3では、文字認識(CR)及びバーコード認識(BR)を行い、ステップS2で認識された帳票種別に基づいて帳票に記載されている文字やバーコード情報などを抽出・保存する。次のステップS4では、ポストエディット処理の担当オペレータが、ステップS3で認識・保存された文字と帳票画像データとを、該担当オペレータが使用しているクライアントPC101、102又は106の画面に表示させ、該担当オペレータは該画面を見ながら前記文字認識処理で誤認識した個所(誤認識した文字など)を修正して、HTTPサーバを介して該Webアプリケーションサーバに保存するポストエディタ(PE)処理を行う。
その後のステップS5では、申請書等の帳票画像データの受け取りを承認するかを決定するための申請承認フロー(PAフロー)を実行する。この申請承認フロー(申請承認ルート)としては、例えば主任→課長→部長や、庶務→総務→経理部などが複数登録されており、帳票種別ごとに設定されている申請承認フローが適宜選択される。
次のステップS6においては、受信した帳票画像データや各種データ(認識・修正された文字データや、承認データなど)をイメージサーバ(IS:データベース110あるいはLAN111上の不図示のサーバ)に登録した後、さらにステップS7において、企業などのバックエンドシステム(BE)120の画像サーバに帳票画像データを登録する。
そして、ステップS8においては、申請書などの帳票(帳票画像データ)を送付したユーザに対して登録確認などの送付状を、ファックス、電子メール、あるいは郵送などで送付する。
このように、上記画像処理システムでは、文書画像データから、OCR機能又は帳票認識によって画像の特徴を判別して文字情報や帳票種別を取得し、取得した文字情報や帳票種別などをクライアントPC101、102又は106の操作画面上に表示させ、オペレータに確認、修正作業を行わせる。本実施の形態では、前記操作画面において、ハイパーテキストを利用した操作を可能にするものである。ハイパーテキストとは、コンピュータを利用して表示される文書や画面の任意の場所に他の文書の位置情報を埋め込み、相互関係をもたせる技術である。本実施形態では、汎用のWebブラウザでハイパーテキスト文書を表示することができ、ユーザがハイパーテキスト文書を操作することで、リンク対象となる画像やテキストを動作させることができる。このように汎用のWebブラウザを用いることができるので、ポストエディット処理専用の表示アプリケーションを作成する必要がなくなる。
以下、本実施の形態の処理について、具体的に説明する。
<第1の実施の形態に係るクライアントPCの処理>
図5は、図4のステップS4で実行されるポストエディット処理(PE)の詳細フローを示すフローチャートであり、このポストエディット処理(PE)は、クライアントPC101、102又は106上でWebブラウザの画面を用いて行われる。
オペレータがWebブラウザを用いて表示するHTML文書は、HTTPサーバ108に蓄積されているHTML文書や画像などの情報を、オペレータの要求に応じてインターネット107などのネットワークを通じて受信したものである。オペレータはポストエディット処理(PE)を行うとき、予め登録されているURLを入力し、Webブラウザに画面を表示させる。そして、図5のフローに従い処理を進める。
まずステップS501ではログイン処理を行う。オペレータは、自身がポストエディット処理(PE)の処理者であることを示すIDを知っており、これを入力して処理を開始する(ログイン画面の構成は図6に示す)。入力されたIDはステップS502で判定が行われる。このログイン処理は図3のモジュール307のユーザ認証機能である。なお、本実施の形態ではログイン処理を行うが、これは必須の処理ではない。
ステップS502の判定の結果、PE権限を持たない場合はステップS508へ進み終了する。PE権限があると認められた場合は、ステップS503でPE処理者用のワークアイテム(WI)画面が表示される(ワークアイテム(WI)画面の構成例を図11に示す)。
次にオペレータはステップS504において処理すべき事柄(これをワークアイテム(WI)と呼ぶ)があるかどうかを判断する。特に処理するワークアイテム(WI)がない場合はステップS508へ進み終了する。ワークアイテム(WI)がある場合はステップS505で、処理を行うワークアイテム(WI)を選択する。
そしてステップS506において文字修正作業を開始する。修正作業内容については図7を用いて後で説明する。修正作業が完了したらステップS507で、さらに処理するべきワークアイテム(WI)があるかを判断する。作業を続ける場合はステップS505に戻り、ステップS505からステップS507までの処理を繰り返す。作業を終える場合はステップS508へ進み終了する。
図6は、Webブラウザで表示されるログイン画面の一例を示す画面表示図である。このログイン画面は、上述した図5のログイン処理においてクライアントPC101、102又は106上で表示され、本実施の形態ではHTML形式で記述されたものとする。
図6の901は、ログイン画面として表示されるHTML文書の全体を示す。このHTML文書は、HTTPサーバ108で管理され、クライアントPC101、102又は106からのリクエストに応じたものである。ログイン画面901は、図5のステップS501のログイン処理と連動して表示される。902はユーザID入力部であり、オペレータがキーボードなどのインターフェースを用いて入力する仕組みである。903は、オペレータを確認するためのパスワードを入力する欄である。なお、本実施の形態ではログイン処理を持たせているが、他の実施の形態においては必須ではない。
図7は、図5のステップS506(文字修正処理)の詳細処理フローを示すフローチャートである。この処理フローは、オペレータがクライアントPCのWebブラウザ上で文字修正を行う場合に実行される。
まずステップS602では、修正時に詳細閲覧を行う必要があるかどうかを判定する。すなわち、前記した図5のステップS505においてワークアイテム(WI)を選択すると、オペレータが閲覧しているワークアイテム一覧画面(図11参照)からワークアイテム詳細画面(図12参照)に切り替わる。図12の画面構成の詳細については後述するが、認識対象の帳票画像全体とその帳票内の文字認識結果とが表示されるので、この画面の表示内容から、文字修正や確認作業等のために、更に詳細閲覧が必要であるかどうかをオペレータが判断する。
詳細閲覧が必要である場合には、次にステップS603において、オペレータの操作に基づき詳細閲覧が必要な文字情報のハイパーテキストを動作させる。この点が本実施形態の特徴の1つである。本実施形態では、図12のワークアイテム詳細画面で表示する文字認識結果の文字列をハイパーテキスト化して当該文字認識対象部分の画像と関連付けた状態で表示させておく。図12の1207、1208、1209に示す下線付き文字がハイパーテキスト化された文字であり、それぞれの文字認識対象となった帳票の部分画像と関連づけられている。ハイパーテキストの作動は、マウスにより、詳細閲覧を行ないたい文字列をクリックすれば良い。もちろん、マウスのほかに、キーボードなどWebブラウザ画面を操作することができるインターフェースを持ち合わせていればそれらを用いて詳細閲覧を行ないたい文字列を指示してもよい。
次にステップS604において、ハイパーテキストからリンクされている情報(URLや画像ファイル情報など)を取得し、取得した情報をWebブラウザで表示させる(ハイパーテキスト参照先画面の構成は図13に示す)。このとき表示される画面は、図13の1303に示すような文字認識画面が強調された領域を持つ画面が好ましい。
オペレータは、このステップS604で表示された図13のHTML文書から、表示されている画像イメージ1303内の文字画像と、表示されている文字認識結果の文字情報1304の整合性をチェックして一致するように修正を行う。ステップS605において文字情報の修正が必要であると判断すれば次のステップS606に進み、修正が不要であればステップS608に進む。
ステップS606では、キーボードのような文字情報を入力できる入力デバイスを用いて文字情報の修正を行う(図13の1304)。続くステップS607で修正の完了を確認し、再度修正が必要な場合はステップS606に戻る。修正が終わったらステップS608において、そのまま次の修正を行うかどうかの判定をする。次の文字認識結果を修正するのであれば、次の文字列に対応するHTML情報に更新しステップS605に戻る。
全部の修正が完了したら、図13の完了ボタン1305を押下してステップS609に進み、修正したデータをHTTPサーバ108に転送する。ここで転送されるデータは、例えば図10の801で示すようなデータである。次のステップS610では、データ更新処理が行われる。データ更新処理が完了したらステップS611に進みフローの終了となる。
<第1実施の形態に係るサーバ側の処理>
図8は、図7のステップS610(データ更新処理)の詳細処理フローを示すフローチャートである。この処理フローは、HTTPサーバ108及びWebアプリケーションサーバ109で実行される。
まずステップS701では、クライアントPC101、102及び106から送信されてくる、図7のステップS606によって入力された修正データを受信する。このデータは例えば図10の801で示すものである。
次のステップS702では、ステップS701で受信したデータが既存のデータと異なっているかのチェックを行う。チェックの結果、変更箇所がみつからなければステップS707に進み処理を終了する。なお、ステップS702のチェックは、本実施の形態として必須ではないが、無駄な更新処理を防ぐために行うことが好ましい。修正データがある場合はステップS703に進む。
ステップS703では、ハイパーテキストの修正が必要であるかどうかのチェックを行う。前記ステップS702との違いは、ステップS702ではステップS701からの受信データが画像や帳票種別など、ハイパーテキスト以外の修正も含むことである。すなわちステップS702では、画像、テキストを問わず修正の有無を確認し、ステップS703はその中からハイパーテキストに関わる修正を判別するわけである。ハイパーテキストの修正の有無は、ハイパーテキスト化されている文字列と、受信データの文字列とを比較し相違があれば修正が必要と判断してよい。修正が必要な場合はステップS704に、不要の場合はステップS705に進む。
次のステップS704では、ハイパーテキスト化されている文字の修正を行う。本実施の形態の場合では、クライアントPC101、102又は106の図13のような画面において修正されたハイパーテキスト文字列を含むHTML文書が修正対象となる。HTTPサーバ108は、オペレータの要求に応じてプログラムを実行する動的ページ生成の機能を有するので、クライアントPC101、102又は106が表示しているHTML文書が、その修正指示に応じてHTTPサーバ108に反映される。
続くステップS705においては、Webアプリケーションサーバ109に修正データを転送する。修正データを受け取ったWebアプリケーションサーバ109は、ステップS705においてHTTPサーバ108から受け取った修正データを処理するために、モジュール307の受信データ登録や文字認識結果登録、帳票メンテナンス機能などの処理を実行し、処理したデータをデータベース110に保存する。保存するデータは、文字認識結果文字列を含むHTML文書以外にも、画像データや帳票種別など、クライアントPC101、102又は106から要求のあった項目である。なお、保存形態は、データベース110以外にもWebアプリケーションサーバ109上で動作するメモリ機能や外部メモリなどの利用も可能である。データを保存した後はステップS707へ進みフローを終了する。
以上が第1の実施の形態に係る処理フローである。
<第1の実施の形態に係るハイパーテキストの更新の具体例(文字修正)>
以下、スキャナ103あるいはマルチファンクションデバイス104から、例えば図9に示すような帳票画像データをWebアプリケーションサーバ109に取り込んだ際の、本実施の形態に係るハイパーテキストの更新処理の具体例について、図9〜図15を参照しつつ説明する。
図9は、文字認識対象となるイメージ画像(帳票画像データ)の一例を示す画像図である。
図中の1101は画像イメージの全体を表し、この画像イメージはスキャナや外部装置から読み込んだ電子データである。1102、1104〜1106は記載内容を示す区分領域(帳票種別ごとに所定のプレプリント文字が予め印刷されている領域)であり、1103、1107、1108、1109の領域に記入者が記入を行う。画像イメージ1101では領域1103は未記入ということになる。1104はフリガナ領域であり、これに対応する記入領域は1107である。記入領域1107には「ヤマダ」という文字が記入されている。
1105は「お名前」領域であり、これに対応する記入領域は1108である。記入領域1108には「山田」という文字が記入されている。1106は「Tel」領域であり、これに対応する記入領域は1109である。記入領域1109には「00−1234−5678」という文字が記入されている。なお、これら記入領域(1103,1107〜1109)に記入される文字は活字印字、手書き文字のどちらでも良い。
このような帳票画像データが、前述した図4のステップS1でWebアプリケーションサーバ109に取り込まれると、この帳票画像データに対して、図4のステップS2及びステップS3において帳票認識(FR)や文字認識(CR)が行われた後、図10に示すような構造の登録データとして、Webアプリケーションサーバ109のデータベース110に格納される。
図24は、予め帳票種別ごとに登録されている登録帳票データであり、帳票認識時に用いられる帳票識別用データ、各文字認識対象フィールドとそのフィールド位置のデータなどが帳票種別に対応付けられてデータベース110に格納されている。帳票識別用データは帳票認識の手法によって格納されるデータは異なるが、例えば、プレプリントの文字や、帳票を識別するためのバーコードデータ、各種領域の位置情報などが格納され、帳票認識(FR)で使用されることにより、当該取り込んだ帳票画像データがどの帳票種別の画像なのか識別される。文字認識時は、各フィールド領域の位置を示すフィールド位置データに基づいて帳票画像データから該当領域を抽出して文字認識を行ない、対応するフィールドと関連付けて図10の登録データを生成する。
図10は、Webアプリケーションサーバ109で文字認識(CR)の認識結果として得られた登録データの一例を示すデータ構造図であり、データベース110に格納される。
図中の801はデータ構造の全体を表す。802から807まではデータフィールド並びに該当データを表し、フィールドの個数やフィールド名称は実施する態様によって異なる。ここでは7つのフィールドを用意している。
図中の802は読み込んだ帳票を一意に識別するためのIDを格納するワークIDフィールドであり、図10の例では「000001」というIDが格納されている。図5のステップS504で使用するワークアイテム(WI)はこのIDを元にしている。また後述する図11に示す画面のワークIDも同一のものである。803〜805は帳票ごとに設定されるフィールドであり、図9の帳票を文字認識した値を各記入領域に対応するフィールドに格納している様子を示している。なお、図7のステップS606でインターフェースを介してオペレータが値を変更した場合は、その変更入力された値が反映される。また、この文字列を基にHTTPサーバ108でハイパーテキスト化し、クライアントPC101、102又は106のWebブラウザで表示する。
806は自由フィールドを表し、データの拡張性を表す例である。本実施の形態では図示を省略したが、帳票の種別を示すフィールド(帳票認識で識別された帳票種別データが格納され、図24の帳票種別に対応づけられる)や、データを受信した日付を示すフィールドや、修正処理済かどうかを示すフィールドなどのその他のデータに関するフィールドが格納されているものとする。807は画像ファイル名を示すフィールドである。このようにワークID802と画像ファイル名807を関連付けて運用する。
図11は、ワークアイテム画面を示す画面図である。
この画面は、図5のステップS504〜S505のワークアイテムに関わる処理などで呼び出されて、クライアントPC101、102又は106のWebブラウザ上にワークアイテムが一覧表示される。
図中の1001は表示されるワークアイテム画面全体を示す。1002はワークID表示部である。このワークIDは、処理すべき帳票のタスクごとに割り振られ、図10の802に示すワークIDと同様のものである。1003は日付表示部であり、1004は帳票種別表示部である。好適には、図11で一覧表示されるワークアイテムデータは図10の登録データのうち修正処理または承認処理が未処理のデータを表示するようにする。なお、1002、1003、1004の各項目は実施の一例であり、各項目内容についてはどのようなものを用いても良い。
1005はワークIDをオペレータが選択できるチェックボックスである。なお、チェックボックス以外でもワークアイテム(WI)を指定可能なUIであれば良い。例えば、ワークID番号に対して、ハイパーテキストを使って各ワークIDの帳票に関する詳細表示画面へのハイパーリンクを埋め込み、番号がクリックされると、直接そのワークアイテム詳細画面に遷移するようにしてもよい。1006は、選択したワークアイテム(WI)の詳細表示を行う(ワークアイテム詳細画面への遷移を行う)ように指示するためのPE処理ボタンである。PE処理ボタン1006を押すことで、当該選択されたワークIDに関する詳細表示のHTML文書(図12参照)を展開することができる。1007は処理を終了する終了ボタンである。
図12は、Webブラウザで表示されるワークアイテム詳細画面を示す画面図であり、この画面のソースはHTML文書で作成されており、クライアントPC101、102又は106のWebブラウザ上で表示される。
同図中の1201は、表示されるワークアイテム詳細画面の全体を示し、1210は「PE処理の終了」ボタンであり、押下することで図11の画面に戻ることができる。また、1211の「次へ」ボタンを押下すると、図11で選択しておいた次のワークアイテムの詳細画面に変わり、次のワークアイテムがないときは図11の一覧画面に戻る。なお、「PE処理終了」ボタンや「次へ」ボタン以外に、「キャンセル」ボタンを設け、該「キャンセル」ボタンが押下された場合は修正内容を反映させずに図11に戻ることができるようにしてもよい。
1202は処理対象イメージ画像のプレビュー表示部であり、図9に示した文字認識対象となるイメージ画像がワークアイテム詳細画面のHTML文書に埋め込まれる。1203は、プレビュー表示部1202の文字認識対象部であり、図9のイメージ画像の記入者が書き込んだ領域を表示している。
1204は、現在、当該画面1201に表示されているワークアイテムのワークIDを示す。1205は図9のフィールド領域1104、1105、1106を指し、図10の登録データのフィールド領域803、804、805などと関連性を持つ。
1207は、フリガナフィールド1104に対応する文字列1107を文字認識して得られた結果をハイパーテキスト化し表示する部分である。同様に、1208はお名前フィールド1105に対応する文字列1108を文字認識して得られた結果をハイパーテキスト化し表示する部分であり、1209は「Tel」フィールド1106に対応する文字列1109を文字認識して得られた結果をハイパーテキスト化し表示する部分である。図7のステップS603の処理のように、オペレータは、文字修正を行う場合(もしくは閲覧する場合)、このハイパーテキストを動作させ、当該指定した文字列に対応するハイパーテキスト参照先画面を表示することができる。
ここで、表示部1208の「山田」のハイパーテキストをクリックしたとすると、図13に示すようなハイパーテキスト参照先画面が表示される。
図13は、Webブラウザで表示されるハイパーテキスト参照先画面を示す画面図である。この画面は、図7のステップS603で実行されるハイパーテキストの操作に関わる処理で呼び出されて、クライアントPC101、102又は106のWebブラウザ上で表示される。
同図中の1301は表示されるハイパーテキスト参照先画面を示し、1302は表示されているフィールド種別をしめす情報を示す。1303は図9に示した文字認識対象となるイメージ画像の領域1108を拡大表示したものである。なお、各フィールド領域画像1303には、図24の登録帳票データに基づいて当該指定されたフィールドに対応する部分領域の画像が抽出されたものが、表示される。
1304はオペレータが内容修正を行うことができる部位であり、最初は文字認識結果の「山田」が表示されている。そしてその文字認識結果を修正する場合は、キーボードなどのインターフェースを用いることで修正入力が可能である。図13では、「山田」を「山田太郎」に修正入力した際の画面を示している。この入力操作は、図7のステップS606の処理に相当する。すなわち、オペレータは表示されている画像1303を目視し、文字認識された文字と比較する。OCRの文字列になんらかの問題があり、修正したい場合はフィールド1304に入力を行う。
図13の例では、フィールド1304の表示が「山田太郎」となっている。これは、本来、フィールド1304には、ハイパーテキスト化された文字「山田」(1208)と同じ文字列である「山田」が表示されるが、図13の例では、それを「山田太郎」に入力し直したことを示している。
1305は「完了」ボタンであり、入力結果を反映し終了する。1306は「次へ」ボタンであり、このボタン押下することにより次のフィールドに移動することができる。
今、1304の内容修正部位1304に、オペレータが「山田太郎」という、領域イメージ画像1303から読み取れる文字と異なる文字列を入力し、「完了」ボタン1305を押下し処理を反映させたとする。これによって、図7のステップS609以降の処理が実行され、図14の851に示すように、お名前フィールド804の「山田」を「山田太郎」に修正した更新データが生成される。
当該生成された更新データはHTTPサーバに送信され、この更新データを基に、図8のステップS704でHTTPサーバ108上でHTML文書が書き換えられ、ステップS705及びステップS706によって文字列「山田太郎」は、Webアプリケーションサーバ109のデータベース110に登録される。
そして、クライアントPC101、102又は106のWebブラウザの画面に、図11のワークアイテム画面のHTML文書が表示されたとき、再度、先ほど修正したワークアイテムを選択すると、ワークアイテム詳細画面の各フィールドの認識結果を示す部分は、図15に示すような修正後の文字列が表示される。なお、図15は、図13の1304で「山田」を「山田太郎」に修正した場合に、Webブラウザで表示されるワークアイテム詳細画面を示す画面図である。
図15の1401は図12の1204〜1209の領域を拡大した部分であるが、文字列の修正及びハイパーテキスト化が更新された結果、お名前フィールドのハイパーテキスト化した文字列1402が「山田太郎」に変更されている。
このように、図11の画面でワークアイテムを指定しPE処理ボタン1006を押下することで、クライアントPC101、102又は106のWebブラウザで表示するHTML文書をHTTPサーバ108から取得して表示する際、ハイパーテキスト化された文字列が動的に更新される。
本実施の形態では、クライアントPC101、102又は106の操作画面において、ハイパーテキストを利用した操作を可能にしたので、オペレータの操作画面に多くの詳細表示用のボタンを表示せずに済むし、また、参照先をオペレータに指定させるようなことも不要となる。
すなわち、(1)文字認識又は修正文字列をハイパーテキスト化したので、オペレータに詳細情報があることを知らせる効果がある。
(2)ハイパーテキストのリンク先を、文字認識又は修正文字列の画像情報を含む文書にし、ハイパーテキストを動作させることで、文字認識結果の修正作業を簡単に行うことができる。
(3)オペレータが閲覧するWebページ群の生成処理をWebサーバ上で実行することで、複数のオペレータに上記(1)及び(2)の効果を提供することができる。
(4)また、クライアントでは、汎用のWebブラウザを用いて修正処理等の各種処理を行うことができるので、専用のアプリケーションをインストールしなくて済むので、手間がかからないという効果がある。
[第2の実施の形態]
図9の文字認識対象となるイメージ画像において、領域1103、1107、1108、1109は記入者が記入を行う領域である。このとき、領域1103のように記入がなされていない領域に対して文字認識を行った場合や、文字が汚くて認識不能である場合、文字列を正しく取得することができない(このような文字列を不明文字と呼ぶ)。第2の実施の形態では、文字列のハイパーテキスト化を行う際に、不明文字については、オペレータに分かり易いように、予め指定されている予約語を当てはめるようにしたものである。
<第2の実施形態のサーバ側に格納されているデータ例>
図16は、第2の実施の形態に係る文字認識(CR)の認識結果として、Webアプリケーションサーバ109を介したデータサーバ110に格納された登録データの一例を示すデータ構造図であり、不明文字を含んだ登録データを表したものである。
同図中の1501はデータ構造の全体を表し、1502は前記図10の802と同様の役割を果たすワークIDフィールドで「000100」というIDが格納されている。このIDは文字認識の結果によらず生成される。1503は文字認識結果の格納フィールドである。図9の領域1103には何も記述されていないので、文字認識結果1503は空白のデータとなる。1504はその他のデータを表し、図10の803から807までに相当するが、ここでの説明は割愛する。
<第2の実施形態に係るハイパーテキストの更新例(不明文字)>
図17は、第2の実施の形態に係るワークアイテム詳細画面を示す画面図である。
同図中の1601は、図12の1204〜1209の領域を拡大した部分であり、特に記述しないものは図12と同じ画面構成である。
1602は、正常に認識された結果をハイパーテキスト化した文字列を示す(このハイパーテキスト文字列は図13のようなハイパーテキスト参照先画面にハイパーリンクされており、クリックすると第1の実施形態と同様に該画面へ遷移する)。1603はフィールド1503の空白部分の認識結果を表し、本実施の形態では「(未記入)」の文字列をハイパーテキスト化している。本実施の形態では、フィールド1503のデータ上は「空白」の扱い(又は不明文字扱い)となる文字に対し、「(未記入)」などの文字を宛がう。1604は、対応するフィールド画像領域内に文字列らしきものをあったが文字認識できなかった場合を示す例であって、「(認識失敗)」の文字を使用している。
このように本実施の形態では、文字認識結果、空白や認識失敗であった場合に、「(未記入)」や「(認識失敗)」などの認識結果文字列以外の情報を示す所定の文字列をハイパーテキスト化することで、閲覧するオペレータに認識できた文字列以外の情報についても、未記入なのか、認識失敗なのか伝えることができ、更に、その所定の文字列をクリックすると対応する画像領域を確認することができるという効果がある。
本実施の形態は、未記入領域の文字認識結果を「空白」として扱った例であるが、未記入領域及び不明文字の認識結果はOCRエンジンの特性によって決定される。未記入領域の認識結果が「スペース」や「ブランク」、「認識不能」などとして扱われることもあるが、その場合は、その認識結果がそのままフィールド1503に格納される。従って、このような不明文字の認識結果文字列についても、上記同様の効果を得ることができる。
[第3の実施の形態]
第3の実施の形態では、HTTPサーバ108並びにWebアプリケーションサーバ109が保持する図10に示す登録データの項目に、図18のような各フィールド情報における備考となる各種データ欄を設け、その内容によりオペレータが閲覧するHTML文書(図12)のハイパーテキスト化された文字列に装飾を加える。
図18は、第3の実施の形態に係る文字認識(CR)の認識結果として、Webアプリケーションサーバ109を介したデータサーバ110に格納された登録データの一例を示すデータ構造図であり、各フィールド情報における備考データ欄領域(付加情報フィールド)を加えた登録データを表したものである。図18の例では備考データは、文字認識処理時に得られたデータを用いることとする。
同図中の1701はデータ構造の全体を表す。1702は前記図10と同様のフィールドである。1703はそのフィールドのデータを表し、802、803、804と同様の役割を果たす。1707はその他のデータを表す。1704は各フィールドの備考欄領域に相当し、フリガナフィールドの備考欄(付加情報フィールド)として「フリガナ認識率」、「お名前」フィールドの備考欄(付加情報フィールド)として「お名前文字候補」がある。1705は「フリガナ認識率」のデータであり、1706は「お名前文字候補」のデータである。
この登録データを基に、後述する図20及び図21の画面を表示するためのHTML文書を作成し、HTTPサーバ108に蓄積しておくのである。以下、この点について詳細に説明する。
<第3の実施の形態に係るサーバ側の処理>
図19は、第3の実施の形態に係る画面を表示するためのHTML文書作成処理を示すフローチャートであり、本処理は、HTTPサーバ108及びWebアプリケーションサーバ109で行われる。
まず、ステップS1801では、データベース110から図18の登録データを取得し、次のステップS1802においてHTML文書の作成を行う。このHTML文書は、HTTPサーバ108に格納し保持しておくもので、第1及び第2の実施の形態においてオペレータが閲覧するHTML文書(図12)に相当する。
次にステップS1803で図18に示すデータの中に付加情報フィールドが存在するかの判定を行う。付加情報がない場合はステップS1808に進み、作成した文書をHTTPサーバ108に格納し処理を終了する。付加情報がある場合はステップS1804に進む。
ステップS1804では付加情報の内容によって処理を行う。付加情報が認識精度を示す認識率であった場合はステップS1805に進み、認識率に応じて該当するハイパーテキストの文字列(例えば認識率の低い文字列)に横線を付加する(図20の1902)。
次にステップS1806に進み、付加情報が候補文字であるかの判定を行う。候補文字に該当する場合はステップS1807に進み、該当するハイパーテキストのフォントを変更する(図20の1903)。なお、横線やフォントの変更は、実施の一形態であって、サイズや色等の描画文字に変化を与えるものであれば何でも良い。
次にステップS1808に進み、作成した文書をHTTPサーバ108に格納し処理を終了する。
<第3の実施の形態に係るハイパーテキストの更新例(書式)>
図20は、第3の実施の形態に係るワークアイテム詳細画面を示す画面図であり、文字列以外の情報を加味し、ハイパーテキスト化された文字列の書式設定を変更した例を表している。
同図中の1901は、図12の1204〜1209の領域を拡大した部分であり、特に記述しないものは図12と同じ画面構成である。
1902は、ステップS1805で横線を入れた文字列データ1703を表し、「ヤマダ」の文字列をハイパーテキスト化したものである。1903はステップS1807でフォントスタイルをイタリック体に変更した文字列データ1706を表し、「山田」の文字列をハイパーテキスト化したものである。
図21は、第3の実施の形態に係るハイパーテキスト参照先画面を示す画面図である。このハイパーテキスト参照先画面は、図13のハイパーテキスト参照先画面に、文字の書式設定機能を追加したものである。
同図中の2007は本実施の形態で追加された部位で、オペレータがフィールド1304より入力する文字に書式設定を追加できるインターフェースである。変更できる項目は2007に示すように、スタイル、色、サイズの他に、フォント、位置など表示に関わる書式設定であれば何でも良い。このように変更し完了ボタン1305によって処理を完了した場合、図8のフローに従い修正内容が反映されるのは第1の実施の形態と同じである。
このように本実施の形態では、認識の精度や候補文字の有無に応じて、ハイパーテキスト化する文字列の字体や色に変化をつけることによって、オペレータに認識文字列以外の情報を意識付ける効果がある。また、オペレータが文字修正を行う場合に、ハイパーテキスト化対象の文字列に字体や色の変化を指定できるようにすることによって、認識文字列以外の情報を持たせる効果がある。
なお、本第3の実施の形態以外にもOCRエンジンの特性によって様々な付加情報を取得することができ、このような付加情報の内容は本発明の範疇にあり、どのような付加情報を用いても上記した本実施の形態の効果を得ることができる。
[第4の実施の形態]
第4の実施の形態は、第1の実施の形態に、ユーザ権限によってハイパーテキスト化された文字列の参照先を変更する機能を加えたものである。すなわち、オペレータが閲覧するHTML文書(図12)のハイパーテキスト化された文字の参照先情報をユーザのログイン権限によって変更するものである。本実施の形態では、HTTPサーバ108が予め権限ごとにHTML文書を保持しており、それをユーザによって使い分ける。
図22は、第4の実施の形態に係るユーザ権限によるハイパーテキスト参照先変更処理を示すフローチャートである。本処理は、クライアントPC101、102又は106上で実行される。
まず、ステップS2101は図5のステップS501と同様のログイン処理であり、図6のログイン画面のHTML文書を表示させて行う。次にステップS2102においてそのオペレータの権限確認を行う。次にステップS2103において図11のHTML文書を取得し表示させワークアイテム(WI)を選択し図12のHTML文書を表示する。図5のステップS502ではPE権限を有するオペレータに対して次に表示すべき画面(図11や図12の画面)を表示していたが、本実施の形態では権限によらず次に表示すべき画面(図11や図12の画面)を表示する。
次にステップS2104において、オペレータが必要なハイパーテキストを動作させる。ハイパーテキストの作動により、図7のステップS604のようにHTTPサーバ108から、操作画面上に表示する情報を取得するが、ステップS2105において、前記ステップS2102で確認した権限(PE又はIP)に応じて、取得する情報を変化させる。
ここで、PE権限とは、オペレータが文字修正処理(ポストエディタ)を行う権限である。また、IP権限とは、PE権限者が修正した内容を確認し承認処理(イニシャル・プロポーザル:Initial Proposal)を行う権限である。
前記ステップS2105の判定がPE権限である場合は、ステップS2106に進んで図13などの画面を表示し、前記第1の実施の形態と同様の修正作業をステップS2107で行い、ステップS2110で終了する。
一方、IP権限である場合は、ステップS2108に進んで、例えば後述する図23に示すような個人情報を示すページを表示する。この図23に示すHTML文書は、文字認識結果を表すものではなく、ポストエディット処理(PE)の結果から導ける情報である。この情報は、基幹システムのデータと連動するものであったり、付属する別の帳票の認識結果であったりするもので、イニシャル・プロポーザル(IP)の業務内容によって変更することができる。
そして、IP権限の場合は、次のステップS2109において、図23の承認ボタン2203を押下することによる承認処理を行い、ステップS2110によって処理を終了する。
<IP権限者用の画面の説明>
図23は、第4の実施の形態に係るIP権限者用のハイパーテキスト参照先画面を示す画面図である。
同図中の2201は、クライアントPC101、102又は106上に表示されるHTML文書の全体を示す。2202は、ポストエディット処理(PE)の結果とは異なる情報が表示されるフィールドであり、2203は承認決定ボタン、2204は、承認処理を行わずに前の画面に戻るためのボタンである。
このように本実施の形態では、使用するオペレータによって、ハイパーテキストのリンク先を異なるようにすることで、オペレータの作業に相違を持たせることができる。
なお、上記各実施の形態では、WebページがHTMLで記述されているとしたが、Webページを記述できるマークアップ言語、及びそれに類する言語、例えばXML準拠のXHTMLなどを利用した場合にも本発明の実現は容易であり、本発明はWebページの記述言語に関わらず有効なものである。
本発明は、上述した実施形態の装置に限定されず、複数の機器から構成されるシステムに適用しても、1つの機器から成る装置に適用しても良い。前述した実施形態の機能を実現するソフトウェアのプログラムコードを記憶した記憶媒体をシステムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(又はCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても、完成されることは言うまでもない。
この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。プログラムコードを供給するための記憶媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、不揮発性メモリを用いることができる。また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけではなく、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOSなどが実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、次のプログラムコードの指示に基づき、その拡張機能を拡張ボードや拡張ユニットに備わるCPUなどが処理を行って実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
本発明の実施の形態に係る画像処理システムの構成図である。 図1に示したクライアントPC及びWebアプリケーションサーバの構成を示すブロック図である。 本実施の形態に係るモジュールの構成を示すブロック図である。 本実施の形態に係る画像処理システムの処理フローを示すブロック図である。 図4のステップS4で実行されるポストエディット処理(PE)の詳細フローを示すフローチャートである。 Webブラウザで表示されるログイン画面の一例を示す画面表示図である。 図5のステップS506(文字修正処理)の詳細処理フローを示すフローチャートである。 図7のステップS610(データ更新処理)の詳細処理フローを示すフローチャートである。 文字認識対象となるイメージ画像(帳票画像データ)の一例を示す画像図である。 第1の実施の形態に係る文字認識(CR)の認識結果として、データサーバに格納された登録データの一例を示すデータ構造図である。 ワークアイテム画面を示す画面図である。 Webブラウザで表示されるワークアイテム詳細画面を示す画面図である。 Webブラウザで表示されるハイパーテキスト参照先画面を示す画面図である。 第1の実施の形態に係る更新データの一例を示すデータ構造図である。 Webブラウザで表示されるワークアイテム詳細画面を示す画面図である。 第2の実施の形態に係る文字認識(CR)の認識結果として、Webアプリケーションサーバ109を介したデータサーバ110に格納された登録データの一例を示すデータ構造図である。 第2の実施の形態に係るワークアイテム詳細画面を示す画面図である。 第3の実施の形態に係る文字認識(CR)の認識結果として、データサーバに格納された登録データの一例を示すデータ構造図である。 第3の実施の形態に係るHTML文書作成処理を示すフローチャートである。 第3の実施の形態に係るワークアイテム詳細画面を示す画面図である。 第3の実施の形態に係るハイパーテキスト参照先画面を示す画面図である。 第4の実施の形態に係るユーザ権限によるハイパーテキスト参照先変更処理を示すフローチャートである。 第4の実施の形態に係るIP権限者用のハイパーテキスト参照先画面を示す画面図である。 帳票種別ごとに登録されている登録帳票データを示す図である。
符号の説明
101,102,106 クライアントPC
103 スキャナ
104 マルチファンクションデバイス
108 HTTPサーバ
109 Webアプリケーションサーバ
105,107,111 ネットワーク
110 データベース

Claims (14)

  1. 画像データから文字情報を含む第1の情報を取得する第1の装置と、前記第1の情報を含む情報の編集を行う第2の装置とを備え、前記第1の装置から受け取った前記第1の情報を前記第2の装置の画面上に表示させる文書処理システムにおいて、
    前記第2の装置の画面上に表示される前記第1の情報と、前記画像データにおける前記第1の情報に該当する部分を含む第2の情報とをハイパーテキストを用いて関連付けることを特徴とする文書処理システム。
  2. 前記第2の装置で前記ハイパーテキストを作動させたときに、前記第2の情報を前記第2の装置の画面上に表示することを特徴とする請求項1に記載の文書処理システム。
  3. 前記第1の装置により、前記ハイパーテキストの対象となっている情報を編集した場合に、その編集後の情報に対してハイパーテキスト化を行うことを特徴とする請求項1又は2記載の文書処理システム。
  4. 前記ハイパーテキストの対象となっている情報は、前記第1の情報のうちの所定の文字情報であることを特徴とする請求項3に記載の文書処理システム。
  5. 前記ハイパーテキストの対象となる所定の文字情報が、前記画像データから取得されなかった場合は、予め指定されている文字情報に対してハイパーテキスト化を行うことを特徴とする請求項4に記載の文書処理システム。
  6. 前記ハイパーテキストの対象となっている情報は、前記所定の文字情報に関連した文字情報であることを特徴とする請求項3に記載の文書処理システム。
  7. 前記ハイパーテキストの対象となっている情報の編集は、前記所定の文字情報又はこれに関連した文字情報に対する書式設定を含み、編集後の文字情報に前記書式設定を反映させてハイパーテキスト化を行うことを特徴とする請求項4乃至6のいずれかに記載の文書処理システム。
  8. 前記第1の装置が前記画像データから文字情報を取得する時に得られる情報を、前記ハイパーテキスト化の対象となる文字情報の書式設定に反映することを特徴とする請求項7に記載の文書処理システム。
  9. ユーザを識別するユーザ識別手段を備え、
    前記ユーザ識別手段で識別されたユーザに応じて、同一のハイパーテキストを作動させた場合に、異なる動作をすることを特徴とする請求項1乃至8のいずれかに記載の文書処理システム。
  10. 前記ハイパーテキストの対象となっている情報を編集した場合に、その編集後の情報に置き換えたハイパーテキストを含むWebページを作成又は更新することを特徴とする請求項1乃至9のいずれかに記載の文書処理システム。
  11. 前記Webページを作成又は更新する処理をWebサーバ上で実行することを特徴とする請求項10に記載の文書処理システム。
  12. 画像データから文字情報を含む第1の情報を取得する第1の装置と、前記第1の情報を含む情報の編集を行う第2の装置とにネットワークを介して接続され、前記第1の装置から受け取った前記第1の情報を前記第2の装置の画面上に表示させる情報処理装置において、
    前記第2の装置の画面上に表示される前記第1の情報と、前記画像データにおける前記第1の情報に該当する部分を含む第2の情報とをハイパーテキストを用いて関連付けることを特徴とする情報処理装置。
  13. 画像データから文字情報を含む第1の情報を取得する第1の装置と、前記第1の情報を含む情報の編集を行う第2の装置とを用い、前記第1の装置から受け取った前記第1の情報を前記第2の装置の画面上に表示させる文書処理方法であって、
    前記第2の装置の画面上に表示される前記第1の情報と、前記画像データにおける前記第1の情報に該当する部分を含む第2の情報とをハイパーテキストを用いて関連付けることを特徴とする文書処理方法。
  14. 画像データから文字情報を含む第1の情報を取得する第1の装置と、前記第1の情報を含む情報の編集を行う第2の装置とにネットワークを介して接続され、前記第1の装置から受け取った前記第1の情報を前記第2の装置の画面上に表示させる情報処理装置の制御方法を実行するための、コンピュータで読み取り可能な制御プログラムであって、
    前記第2の装置の画面上に表示される前記第1の情報と、前記画像データにおける前記第1の情報に該当する部分を含む第2の情報とをハイパーテキストを用いて関連付けるステップを備えたことを特徴とする制御プログラム。
JP2004311077A 2004-10-26 2004-10-26 文書処理システム、情報処理装置、文書処理方法、及び制御プログラム Pending JP2006126942A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004311077A JP2006126942A (ja) 2004-10-26 2004-10-26 文書処理システム、情報処理装置、文書処理方法、及び制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004311077A JP2006126942A (ja) 2004-10-26 2004-10-26 文書処理システム、情報処理装置、文書処理方法、及び制御プログラム

Publications (1)

Publication Number Publication Date
JP2006126942A true JP2006126942A (ja) 2006-05-18

Family

ID=36721672

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004311077A Pending JP2006126942A (ja) 2004-10-26 2004-10-26 文書処理システム、情報処理装置、文書処理方法、及び制御プログラム

Country Status (1)

Country Link
JP (1) JP2006126942A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011008506A (ja) * 2009-06-25 2011-01-13 Fuji Xerox Co Ltd 文書処理装置、文書処理プログラム、及び文書フローシステム
JP2012146147A (ja) * 2011-01-12 2012-08-02 Hitachi Solutions Ltd 文書処理装置、及び文書処理プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011008506A (ja) * 2009-06-25 2011-01-13 Fuji Xerox Co Ltd 文書処理装置、文書処理プログラム、及び文書フローシステム
JP2012146147A (ja) * 2011-01-12 2012-08-02 Hitachi Solutions Ltd 文書処理装置、及び文書処理プログラム

Similar Documents

Publication Publication Date Title
KR100897635B1 (ko) 문서 관리 시스템 및 그 방법과 정보 처리 장치 및 그 제어 방법
JP3277014B2 (ja) データ処理資源を操作するための方法
US8373878B2 (en) Cooperative job flow creating apparatus, cooperative job flow creating method, service processing apparatus, service processing method, management server, flow conversion method, job flow execution method, program, and storage medium
US8326090B2 (en) Search apparatus and search method
US7155670B2 (en) Document authoring system and authoring management program
US20060173904A1 (en) Information Processing Apparatus and Control Method Thereof
JP2005025736A (ja) ドキュメント管理方法、ドキュメント管理プログラム及びドキュメント管理システム
JP2008059157A (ja) 書類確認支援システム、書類確認支援装置およびプログラム
JP5207696B2 (ja) 情報処理装置及び情報処理装置の制御方法、並びにプログラム
US8854635B2 (en) Document processing device, method, and recording medium for creating and correcting formats for extracting characters strings
JP2005275849A (ja) 文書処理装置および文書処理方法
US8260051B2 (en) Image processing apparatus for generating and transmitting push-type data
US7934157B2 (en) Utilization of tree view for printing data
US7010587B1 (en) Data communication system, and server and client computer constructing said system
US8655863B2 (en) Search device, search system, search device control method, search device control program, and computer-readable recording medium
JP2006126941A (ja) 画像処理装置、画像処理方法、画像処理制御プログラム、及び記憶媒体
JP4172478B2 (ja) 文書管理装置及び文書管理方法
JP2021184190A (ja) 画像処理装置、画像処理方法、およびプログラム
CN115801963A (zh) 服务器、控制服务器的方法和存储介质
JP2006126942A (ja) 文書処理システム、情報処理装置、文書処理方法、及び制御プログラム
US20100188674A1 (en) Added image processing system, image processing apparatus, and added image getting-in method
JP7154982B2 (ja) 情報処理装置、制御方法、及びプログラム
JPH1125077A (ja) 文書管理装置及びシステム及び方法
JP2007052613A (ja) 翻訳装置、翻訳システムおよび翻訳方法
JP2022137608A (ja) 情報処理装置、情報処理方法およびプログラム

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20060419

RD05 Notification of revocation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7425

Effective date: 20070626