以下、本発明を実施するための形態について図面を参照しながら詳細に説明する。本実施形態では、イメージスキャナでの印刷文書のスキャン時に、スキャンデータに対する文字認識処理で得られた例えば文書件名(スキャンデータに関連付けて記憶する情報)の複数候補を手元のタッチパネル等にユーザが選択、編集等可能に表示させる。この表示に基づいてユーザにより付与された文書件名(情報)に対応付けて、スキャンデータが情報処理装置である管理サーバに送信される。本実施形態では、イメージスキャン時に、スキャンデータに含まれるテキストから、関連付けて記憶させる情報を選択し、記憶させることが可能となる。これにより、本実施形態は、例えば自治体等における電子化された印刷文書の収受処理において、文書件名等の、スキャンデータに関連付けて記憶する情報を登録するときの、事務手番の削減を可能とするものである。
図1は、イメージスキャンシステムの実施形態のシステム構成例を示す図である。イメージスキャンシステム100は、#1から#NのN台(Nは1以上)の複合機であるイメージスキャナ101が、ローカルエリアネットワーク(LAN:Local Area Network)104等を介して、マルチスキャンサーバ102及び管理サーバ103と接続される構成を有する。ここで、複合機とは、イメージスキャナであって、複写機、プリンタ、ファックス等の複数の機能が1台の機械に集約された装置をいう。マルチスキャンサーバ102は、LAN104を介して接続される#1から#Nの複数台のイメージスキャナ101によるイメージスキャン処理を制御する。管理サーバ103は、マルチスキャンサーバ102で集約されて送られてくる後述する分割データ、添付ファイル、及びOCR(Optical Character Recognition)データに対して文書登録処理(収受処理)を実行する。また、管理サーバ103は、収受された文書に対してユーザからの指示により検索処理を実行する。マルチスキャンサーバ102及び管理サーバ103は、例えば、サーバコンピュータの構成を備えてよい。
図2は、図1のイメージスキャナ101のブロック図の例(図2(a))とマルチスキャンサーバ102のブロック図の例(図2(b))を示す図である。
まず、図2(a)の例えば複合機であるイメージスキャナ101は、制御部200、記憶装置201、タッチパネル202、撮像装置203、及び通信インタフェース204を備える。制御部200は更に、スキャン部205、スキャンデータ送信部206、情報候補受信・表示部207、編集受付部208、及び情報送信部209の各機能を備える。
制御部200内のスキャン部205は、特には図示しないフィーダ装置等により撮像装置203に導かれた印刷文書に対してイメージスキャンを実施し、その結果得られるスキャンデータを例えばPDFファイル形式に変換して、記憶装置201に一時記憶させる。
次に、制御部200内のスキャンデータ送信部206は、記憶装置201に一時記憶されたスキャンデータを、通信インタフェース204から、図1のLAN104を介して、マルチスキャンサーバ102に送信する。
制御部200内の情報候補受信・表示部207は、上記スキャンデータの送信後、図1のマルチスキャンサーバ102からLAN104及び通信インタフェース204を介して、例えば文書件名の候補を受信しタッチパネル202のディスプレイに表示させる。情報候補受信・表示部207は、タッチパネル202のディスプレイに表示させた文書件名の候補に対して、ユーザがタッチパネル202にタッチ操作することによる文書件名の選択操作を受け付ける。
また、制御部200内の編集受付部208は、ユーザがタッチパネル202にタッチ操作することにより文書件名の編集を指示したときに、その編集操作を受け付ける。
制御部200内の情報送信部209は、ユーザが選択又は編集を完了した文書件名の情報を、通信インタフェース204から図1のLAN104を介して、マルチスキャンサーバ102に送信する。
次に、図2(b)に例示されるマルチスキャンサーバ102は、制御部210、記憶装置211、及び通信インタフェース212を備える。制御部210は更に、スキャンデータ受信部213、OCR処理部214、情報候補抽出・送信部215、情報受信部216、及び文書情報送信部217の各機能を備える。
制御部210内のスキャンデータ受信部213は、図2(a)のイメージスキャナ101から送信されたスキャンデータを、図1のLAN104及び通信インタフェース212を介して受信し、記憶装置211に一時記憶させる。
制御部210内のOCR処理部214は、記憶装置211に受信されたスキャンデータに対してOCR処理を実行して文字認識を行い、その結果得られるテキストデータであるOCRデータを、記憶装置211に記憶させる。
制御部210内の情報候補抽出・送信部215は、上記OCRデータから、スキャン対象の印刷文書の先頭から所定行数分の各行の文字列データを文書件名候補として抽出する。なお、以下では、先頭10行分(第1の行、第2の行)の文字列データを、10件の文書件名候補として抽出する場合を例示する。しかしながら、実施形態はこれに限定されるものではなく、5行、15行、1頁目、又は全文などその他の領域から文字列が抽出されてもよい。情報候補抽出・送信部215は、抽出した10件の文書件名候補を、通信インタフェース212から図1のLAN104、及び図2(a)の通信インタフェース204を介して、制御部200内の情報候補受信・表示部207に向けて送信する。
制御部210内の情報受信部216は、上記情報候補の送信の後、図2(a)の制御部200内の情報送信部209から、通信インタフェース204、図1のLAN104、及び通信インタフェース212を介して文書件名の情報を受信する。
制御部210内の文書情報送信部217は、上記文書件名の情報を含む文書データと、記憶装置211に受信されているスキャンデータを含む添付ファイルと、OCR処理部214でのOCR処理により記憶装置211に得られているOCRデータとを組み立てる。続いて、文書情報送信部217は、その組み立てた内容を文書情報として、通信インタフェース212から図1のLAN104を介して管理サーバ103に送信する。
上述の構成を有するイメージスキャンシステム100の動作例について、以下に説明する。図3は、イメージスキャンシステム100の動作例を示すシーケンス図である。
まず、複合機であるイメージスキャナ101(図2(a))において、ユーザは、撮像装置203に印刷文書の原稿をセットし、タッチパネル202からスキャン開始を指示する(図3のS1)。これにより、制御部200内のスキャン部205が、撮像装置203にセットされた印刷文書をスキャンし、その結果得られるスキャンデータを例えばPDFファイル形式に変換し、記憶装置201に一時記憶させる。
続いて、制御部200内のスキャンデータ送信部206が、記憶装置201に得られたスキャンデータを、通信インタフェース204から図1のLAN104を介して、マルチスキャンサーバ102に送信する。マルチスキャンサーバ102(図2(b))において、制御部210内のスキャンデータ受信部213は、図3のS2でイメージスキャナ101から送信されたスキャンデータを受信し、記憶装置211に一時記憶させる(以上、図3のS2)。
続いて、制御部210内のOCR処理部214は、記憶装置211に受信されたスキャンデータに対してOCR処理を実行して文字認識を行い、その結果得られるテキストデータであるOCRデータを、記憶装置211に記憶させる。更に、制御部210内の情報候補抽出・送信部215は、上記OCRデータから、スキャン対象の印刷文書の例えば先頭10行分の文字列を、10件の文書件名候補として抽出する(以上、図3のS3)。
制御部210内の情報候補抽出・送信部215は、抽出した10件の文書件名候補を、図3のS2でスキャンデータを送信したイメージスキャナ101に向けて送信する。この結果、イメージスキャナ101(図2(a))において、制御部200内の情報候補受信・表示部207が、上記10件の文書件名の候補を受信し、タッチパネル202のディスプレイに表示させる(図3のS4)。
情報候補受信・表示部207は、タッチパネル202のディスプレイに表示させた文書件名の候補に対して、ユーザがタッチパネル202にタッチ操作することによる文書件名の選択操作を受け付ける。また、制御部200内の編集受付部208は、ユーザがタッチパネル202にタッチ操作することにより文書件名の編集を指示したときに、その編集操作を受け付ける(以上、図3のS5)。
イメージスキャナ101(図2(a))において、制御部200内の情報送信部209は、ユーザが選択又は編集を完了した文書件名の情報を、マルチスキャンサーバ102に送信する。マルチスキャンサーバ102(図2(b))において、制御部210内の情報受信部216は、イメージスキャナ101から送られてきた上記文書件名の情報を受信する(以上、図3のS6)。
マルチスキャンサーバ102(図2(b))において、制御部210内の文書情報送信部217は、以下の処理を実行する。文書情報送信部217はまず、図3のS6で受信した文書件名の情報を含む文書データを生成する。次に、文書情報送信部217は、図3のS2でイメージスキャナ101から受信し記憶装置211に記憶させているスキャンデータを含む添付ファイルを生成する。更に、文書情報送信部217は、図3のS3でのOCR処理により記憶装置211に得られているOCRデータを取得する。そして、文書情報送信部217は、それらの生成、取得した文書データ、添付ファイル、及びOCRデータを、文書情報として、管理サーバ103に送信する。管理サーバ103は、受信した文書データ、添付ファイル、及びOCRデータを、それぞれに対応する格納フォルダに格納する(以上、図3のS7)。
管理サーバ103は、上記各格納フォルダに格納された文書データ及び添付ファイルをそれぞれ、文書テーブル及び添付文書テーブルの各データベースに自動登録し、また、OCRデータを検索エンジン等に自動登録する(図3のS8)。
図4は、スキャン対象となる印刷文書の例を示す図である。この例は、例えば自治体の庁内外から受信された印刷文書の例である。この文書を見てわかる通り、自治体等で授受される印刷文書は、その上部1/3程度のエリアに、文書番号や日付、宛先名、発信者情報、文書件名等が記載されている場合がほとんどである。そこで本実施形態では、イメージスキャナ101からマルチスキャンサーバ102に送られたスキャンデータに対してOCR処理によりOCRデータが抽出される。そして、OCRデータから印刷文書の先頭10行分の文字列が、複数(10件)の文書件名候補として抽出される(図3のS3)。この複数の文書件名候補は、イメージスキャナ101に送られ、タッチパネル202のディスプレイに表示される(図3のS4)。
図5は、タッチパネル202のディスプレイに表示される文書件名登録画面の例(図5(a))と文書件名編集画面の例(図5(b))を示す図である。ユーザは、図5(a)に例示されるようにタッチパネル202に表示される文書件名登録画面に表示される例えば10件の文書件名候補の中から、文書件名として採用したい候補の左端のラジオボタン500をタップすることにより、文書件名を選択できる。図5(a)では、「文書管理システムに関するアンケートのご依頼」という文字例が、文書件名として選択されている例が示されている。
図5(a)に例示される文書件名登録画面において、ユーザは、決定ボタン502をタップすることにより、文書件名を確定させることができる。また、ユーザは、キャンセルボタン501をタップすることにより、印刷文書の登録を中止することができる。
更に、現在選択している文書件名に文字化け等がある場合には、ユーザは、編集ボタン503をタップすることにより、図5(a)に例示される文書件名登録画面が図5(b)に例示される文書件名編集画面に切り替わる。ユーザは、この文書件名編集画面において、テキストボックス510に設定されている文書件名の文字列に、例えばソフトウェアキーボード511を用いることにより、削除、修正、追加等の編集作業を行うことができる。図5(b)に例示される文書件名編集画面において、ユーザは、決定ボタン513をタップすることにより、文書件名を確定させることができる。また、ユーザは、キャンセルボタン512をタップすることにより、編集作業をキャンセルして、図5(a)の文書件名登録画面に戻ることができる。
図5(a)の文書件名登録画面の決定ボタン502又は図5(b)の文書件名編集画面の決定ボタン513がタップされると、文書件名が確定し、その情報がイメージスキャナ101からマルチスキャンサーバ102に送信される。
図6は、上記文書件名が確定した後に実行されるマルチスキャンサーバ102と管理サーバ103の連携動作を説明するための説明図である。
前述したように、マルチスキャンサーバ102(図2(b))において、制御部210内の文書情報送信部217はまず、イメージスキャナ101から受信した文書件名の情報を含む文書データ601を生成する。この文書データ601に含まれる情報は、印刷文書の収受処理の基本となる情報であり、少なくとも上述の文書件名の情報を含む。この他、文書データ601には、例えば所属部署や担当者名等の属性情報が含まれてもよい。属性情報としては様々な情報を設定可能であり、これらの情報の取得方法の詳細については省略するが、例えばイメージスキャナ101にログインしたユーザの情報が自動的にマルチスキャンサーバ102に送られて文書データ601に設定されてもよい。或いは、イメージスキャナ101のタッチパネル202において、上述の文書件名の情報とともに、各種属性情報が選択又は入力され、それらの情報がマルチスキャンサーバ102に送られて文書データ601に設定されるようにしてもよい。
次に、文書情報送信部217は、イメージスキャナ101から受信し記憶装置211に記憶させているスキャンデータを含む添付ファイル602を生成する。この添付ファイル602は、例えばスキャンデータのPDFファイルである。
更に、文書情報送信部217は、スキャンデータに対するOCR処理により記憶装置211に得られているOCRデータ603を取得する。このOCRデータ603は、前述したOCR処理により得られる印刷文書の例えば先頭10行分のテキストデータであってもよいし、印刷文書の全体に渡るOCR処理によって得られた全テキストデータであってもよい。
文書情報送信部217は、上述の文書データ601、添付ファイル602、及びOCRデータ603を、図6の630として示されるように、管理サーバ103に送信する。管理サーバ103は、マルチスキャンサーバ102から文書データ601と添付ファイル602とOCRデータ603の組を受信すると、それぞれを、文書データ格納フォルダ611、添付ファイル格納フォルダ612、及びテキスト格納フォルダ613に格納する。各格納フォルダ611、612、及び613は、例えば管理サーバ103のハードディスク等の記憶装置のファイルシステムに設定されている。
管理サーバ103は、上記各格納フォルダの内容を定期的に監視している。管理サーバ103は、各格納フォルダ611、612、及び613に情報が登録されたことを検知すると、以下の文書登録動作640を実行する。
まず、管理サーバ103は、文書データ格納フォルダ611に格納されている文書データ601の内容を、所定のデータベースマネジメントシステムに設定されている文書テーブル621の一レコードとして自動登録する。
次に、管理サーバ103は、添付ファイル格納フォルダ612に格納されている添付ファイル602を、例えば管理サーバ103内の記憶装置のファイルシステムの所定の保存フォルダにアップロードする。そして、管理サーバ103は、その保存場所のファイルパス情報と、一意に付与した添付ファイル管理番号とを対応付けて、それらの情報を、所定のデータベースマネジメントシステムに設定されている添付文書テーブル622の一レコードとして自動登録する。
更に、管理サーバ103は、検索エンジン623の例えばインデックスファイルに、テキスト格納フォルダ613に格納されているOCRデータ603の各テキストと、その一意名(OCRデータ603のファイル名等)を自動追加する。検索エンジン623は、例えば全文検索を実行するプログラムである。また、管理サーバ103は、一意名と、OCRデータ603を生成した添付ファイル602の添付ファイル管理番号との対応関係を、所定のデータベースマネジメントシステムに設定されている添付ファイル紐付けテーブル624の一レコードとして自動登録する。
図7は、図6の文書テーブル621のデータ構成例(図7(a))と添付文書テーブル622のデータ構成例(図7(b))と添付ファイル紐付けテーブル624のデータ構成例(図7(c))を示す図である。文書テーブル621は、文書件名と添付ファイル管理番号の各フィールドのほかに、属性情報の例として、所属と担当者名の各フィールドを有する。添付文書テーブル622は、添付ファイル管理番号と添付ファイルパスの各フィールドを有する。添付ファイル紐付けテーブル624は、OCRデータ603の一意名と、そのOCRデータ603を生成した添付ファイル602に対応する添付ファイル管理番号の各フィールドを有する。
図8は、上述の文書テーブル621、添付文書テーブル622、及び添付ファイル紐付けテーブル624を用いた添付文書検索処理の画面例を示す図である。ユーザは、図1のLAN104を介して接続されている特には図示しない端末装置から管理サーバ103にアクセスする。この結果、ユーザの端末のディスプレイに、図8に例示されるような添付文書検索画面が表示される。ユーザは、この添付文書検索画面において、検索キーワードを指定する。この結果、この検索キーワードをキーとして、管理サーバ103上で検索が実行され、検索キーワードに対応する添付ファイル名(又は文書件名)、所属、担当者名などの一覧を、ユーザの端末装置のディスプレイに、図8に例示されるように表示することができる。ユーザは、その一覧中の所望の行を選択(マウスクリック等)することにより、例えばPDFファイルの添付ファイル602を端末装置のディスプレイに表示することができる。
図9は、例示的な収受処理と本実施形態に係る収受処理とを示す図である。
図9(a)に示されるように、例示的な収受処理では、印刷文書が到来すると(Step1)、ユーザは複合機でその印刷文書をスキャンし、スキャンデータがファイルサーバなどに登録され、或いはメールでユーザ自身等に送信されていた(Step2)。そして、例示的な収受処理では、このスキャンデータに対して収受処理を完了させるために、以下のStep3からStep6の処理が実行される。まず、ユーザは、ファイルサーバからスキャンデータのファイルをダウンロードする(Step3)。次に、ユーザは、そのファイルを適切なファイル名にリネームする(Step4)。更に、ユーザは、自身の端末装置からLANを介して文書管理システムを起動する(Step5)。そして、ユーザは、文書管理システム上で、収受文書の登録処理を実行する。具体的には、ユーザは、文書件名等の収受情報を登録し、リネームしたスキャンファイルをアップロードし、情報の更新処理を実行する(以上、Step6)。例示的な収受処理では、以上のStep6までの処理が実行されて初めて、組織内での収受供覧や収受起案処理を実行することが可能となる(Step7)。
一方、図9(b)に示されるように、本実施形態では、印刷文書が到来すると(Step1)、ユーザは複合機でその印刷文書をスキャンすると同時に、文書件名等の指定が可能となり、収受文書の管理サーバ103への登録が完了する(Step2)。この結果、Step2でのスキャンの直後に、Step7での組織内での収受供覧や収受起案処理を実行することが可能となる。このように本実施形態では、図6に示されるように定期的に自動実行される文書登録処理640により、収受処理のために、あらためて文書管理システムを起動しなくてもよく、図9(a)のStep3からStep6の事務手番が削減可能となる。これにより、例えばこれらのステップにかかった時間を5分とした場合、「5分×収受文書数」の時間短縮が実現される。
このように本実施形態では、イメージスキャン時に、スキャンデータに含まれるテキストから、関連付けて記憶させる情報(上記の例では文書件名)を複数候補抽出して表示装置(上記の例ではイメージスキャナ101のタッチパネル202)に表示できる。従って、ユーザは、イメージスキャンと同時に、情報の複数候補の表示に基づいて情報を簡単に選択又は編集することが可能となり、収受処理を完了させることが可能となる。
図10は、図1のイメージスキャナ101のハードウェア構成例を示す図である。図10において、図2(a)の場合と同じ参照番号が付された部分は、図2(a)の場合と同じ機能を実現するハードウェアである。ここで、記憶装置201は、例えばハードディスク記憶装置である。図10のハードウェア構成例では、プロセッサ1001が、ランダムアクセスメモリ(RAM:Random Access Memory)1002を作業用メモリとして使用しながら、記憶装置201から読み込んだイメージスキャン処理プログラムを実行する。これにより、図2(a)の制御部200内のスキャン部205、スキャンデータ送信部206、情報候補受信・表示部207、編集受付部208、及び情報送信部209の各機能部の動作が実行される。
図11は、図1のマルチスキャンサーバ102及び管理サーバ103の共通のハードウェア構成例を示す図である。図11の記憶装置211と通信インタフェース212は、図2(b)に示される同じ参照番号を有する機能を実現するハードウェアである。ここで、記憶装置211は、例えばハードディスク記憶装置である。図11のハードウェア構成例では、プロセッサ1101が、RAM1102を作業用メモリとして使用しながら、記憶装置211又は可搬記録媒体駆動装置1105を介して可搬記録媒体1107から読み込んだイメージスキャン処理プログラムを実行する。これにより、図2(b)の制御部210内のスキャンデータ受信部213、OCR処理部214、情報候補抽出・送信部215、情報受信部216、及び文書情報送信部217の各機能部の動作が実行される。図11ハードウェア構成において、入力装置1103は例えばキーボード又はマウス等であり、出力装置1104は例えばディスプレイ装置である。なお、これらの構成は一部が含まれていなくてもよく、更に別の構成が追加されていてもよい。例えば、図11ハードウェア構成において、入力装置1103及び出力装置1104は含まれていなくてもよい。
図11に示される構成は本実施形態におけるイメージスキャンシステム100を実現できるコンピュータの一例であり、そのようなコンピュータはこの構成に限定されるものではない。可搬記録媒体駆動装置1105は、SDカード、コンパクトフラッシュ(登録商標)や、CD−ROM、DVD、光ディスク等の可搬記録媒体1107を収容するもので、記憶装置211の補助の役割を有する。なお、CDは、Compact Discの略称である。ROMは、Read Only Memoryの略称である。DVDは、Digital Versatile Diskの略称である。本実施形態によるマルチスキャンサーバ102は、図2(b)の制御部210の機能を搭載したプログラムをプロセッサ1101が実行することで実現される。そのプログラムは、例えば記憶装置211や可搬記録媒体1107に記録して配布してもよく、或いは通信インタフェース212によりLAN104等から取得できるようにしてもよい。
図12は、図10のハードウェア構成例を有するイメージスキャナ101により実行されるイメージスキャン処理の例を示すフローチャートである。この処理は、図10のプロセッサ1001が、記憶装置201からRAM1002に読み込んだイメージスキャン処理プログラムを実行する動作である。
プロセッサ1001はまず、ユーザがタッチパネル202を操作することによりスキャン指示をするまで待機する(ステップS1201の判定がNOの繰返し)。
ステップS1201の判定がYESになると、プロセッサ1001は、特には図示しないフィーダ装置等により撮像装置203に導かれた印刷文書に対してイメージスキャンを実施する。プロセッサ1001は、その結果得られるスキャンデータを例えばPDFファイル形式に変換して、記憶装置201に一時記憶させる(以上、ステップS1202)。この処理は、図2(a)のスキャン部205の動作、及び図3のシーケンスS1に対応する。
次に、プロセッサ1001は、ステップS1202で記憶装置201に一時記憶されたスキャンデータを、通信インタフェース204から、図1のLAN104を介して、マルチスキャンサーバ102に送信する。送信完了後、プロセッサ1001は、例えば、記憶装置201に一時記憶されていたスキャンデータを削除する(以上、ステップS1203)。この送信処理は、例えばファイル転送プロトコル(FTP:File Transfer Protocol)に準じた処理であってよい。この場合、イメージスキャナ101がFTPクライアントとして動作し、マルチスキャンサーバ102がFTPサーバとして動作する。この処理は、図2(a)のスキャンデータ送信部206の動作、及び図3のシーケンスS2に対応する。
次にプロセッサ1001は、ステップS1203でのスキャンデータの送信後、図1のマルチスキャンサーバ102からLAN104及び通信インタフェース204を介して、文書件名の候補を受信するまで待機する(ステップS1204の判定がNOの繰返し)。ステップS1204の判定がYESになると、プロセッサ1001は、受信した文書件名候補を、タッチパネル202のディスプレイに、例えば図5(a)に例示した形態で表示させる(ステップS1205)。この受信処理は、例えばハイパーテキスト転送プロトコル(HTTP:Hypertext Transfer Protocol)に準じた処理であってよい。この場合、マルチスキャンサーバ102はWWW(World Wide Web、ワールドワイドウェブ)サーバとして動作し、イメージスキャナ101のタッチパネル202のディスプレイはWWWブラウザとして動作する。以上のステップS1204とS1205の処理は、図2(a)の情報候補受信・表示部207の動作、及び図3のシーケンスS4に対応する。
続いて、プロセッサ1001は、図5(a)に例示される文書件名登録画面で、ユーザがタッチパネル202を操作して、ラジオボタン500により文書件名候補の何れかの選択を変更したか否かを判定する(ステップS1206)。ステップS1206の判定がNOなら、プロセッサ1001は、図5(a)に例示される文書件名登録画面で、ユーザがタッチパネル202を操作して、キャンセルボタン501をタップしたか否かを判定する(ステップS1208)。ステップS1208の判定もNOなら、プロセッサ1001は、図5(a)に例示される文書件名登録画面で、ユーザがタッチパネル202を操作して、決定ボタン502をタップしたか否かを判定する(ステップS1209)。ステップS1209の判定もNOなら、プロセッサ1001は、図5(a)に例示される文書件名登録画面で、ユーザがタッチパネル202を操作して、編集ボタン503をタップしたか否かを判定する(ステップS1210)。ステップS1210の判定もNOならば、プロセッサ1001は、ステップS1206の処理に戻って上記ステップS1206、S1208、S1209、及びS1210の一連の判定処理を繰り返し実行する。
上記ステップS1206からS1210の一連の判定処理の繰返しで、図5(a)に例示される文書件名登録画面で、ユーザがラジオボタン500にて文書件名候補の何れかの選択を変更すると、ステップS1206の判定がYESとなる。この結果、プロセッサ1001は、図5(a)に例示される文書件名登録画面で、選択されるラジオボタン500の表示を変更することにより、文書件名候補の選択を変更する(ステップS1207)。その後、プロセッサ1001は、ステップS1206の処理に戻る。
上記ステップS1206からS1210の一連の判定処理の繰返しで、図5(a)に例示される文書件名登録画面で、ユーザがキャンセルボタン501をタップすると、ステップS1208の判定がYESとなる。この結果、プロセッサ1001は、図12のフローチャートで示される今回のイメージスキャン処理を中止する。なお、ステップS1203でマルチスキャンサーバ102に送信されたスキャンデータは、例えば、マルチスキャンサーバ102側でのタイムアウト処理等により破棄される。
上記ステップS1206からS1210の一連の判定処理の繰返しで、図5(a)に例示される文書件名登録画面で、ユーザが決定ボタン502をタップすると、ステップS1209の判定がYESとなる。この結果、プロセッサ1001は、ステップS1214の文書件名送信処理に移行する。この処理については後述する。
上記ステップS1206からS1210の一連の判定処理の繰返しで、図5(a)に例示される文書件名登録画面で、ユーザが編集ボタン503をタップすると、ステップS1210の判定がYESとなる。この結果、プロセッサ1001は、タッチパネル202のディスプレイに表示する画面を、図5(a)に例示される文書件名登録画面から図5(b)に例示される文書件名編集画面に切り替え、ユーザのタッチパネル202の操作による文書件名の編集を受け付ける。この結果、図5(b)の説明で前述したように、ユーザは、この文書件名編集画面で、テキストボックス510に設定されている文書件名の文字列を、例えばソフトウェアキーボード511を用いることにより、削除、修正、追加等の編集作業を行うことができる。
プロセッサ1001は、図5(b)に例示される文書件名編集画面で、ユーザがタッチパネル202を操作して、キャンセルボタン512をタップしたか否かを判定する(ステップS1212)。ステップS1212の判定がNOなら、プロセッサ1001は、図5(b)に例示される文書件名編集画面で、ユーザがタッチパネル202を操作して、決定ボタン513をタップしたか否かを判定する(ステップS1213)。ステップS1213の判定もNOなら、プロセッサ1001は、ステップS1211の処理に戻る。
上記ステップS1211からS1213の一連の処理の繰返しで、図5(b)に例示される文書件名編集画面で、ユーザがキャンセルボタン512をタップすると、ステップS1212の判定がYESとなる。この結果、プロセッサ1001は、タッチパネル202のディスプレイに表示する画面を、図5(b)に例示される文書件名編集画面から図5(a)に例示される文書件名登録画面に切り替え、ステップS1206の処理に戻る。
以上のステップS1206からS1213の一連の処理は、図2(a)の情報候補受信・表示部207と編集受付部208の動作、及び図3のシーケンスS5に対応する。
上記ステップS1211からS1213の一連の処理の繰返しで、図5(b)に例示される文書件名編集画面で、ユーザが決定ボタン513をタップすると、ステップS1213の判定がYESとなる。この結果、プロセッサ1001は、ステップS1214の文書件名送信処理に移行する。
ユーザが、タッチパネル202を操作して、図5(a)の文書件名登録画面の決定ボタン502又は図5(b)の文書件名編集画面の決定ボタン513をタップすると、前述したようにステップS1209又はS1213の判定がYESになる。この結果、プロセッサ1001は、現在選択又は編集されている文書件名を確定して、その情報を、通信インタフェース204から図1のLAN104を介してマルチスキャンサーバ102に送信する。この送信処理は、例えば前述したFTPのファイル転送プロトコルに準じた処理であってよい。この処理は、図2(a)の情報送信部209の動作、及び図3のシーケンスS6に対応する。その後、プロセッサ1001は、図12のフローチャートで示される今回のイメージスキャン処理を終了する。
図13は、図11のハードウェア構成例を有するマルチスキャンサーバ102により実行されるイメージスキャン処理の例を示すフローチャートである。この処理は、図11のプロセッサ1101が、記憶装置211又は可搬記録媒体1107からRAM1102に読み込んだイメージスキャン処理プログラムを実行する動作である。
プロセッサ1101はまず、スキャンデータを受信するまで待機する(ステップS1301の判定がNOの繰返し)。
ステップS1301の判定がYESになると、プロセッサ1101は、受信したスキャンデータを記憶装置211に記憶させる(ステップS1302)。
以上のステップS1301及びS1302の処理は、図2(b)のスキャンデータ受信部213の動作、及び図3のシーケンスS2に対応する。
次に、プロセッサ1101は、受信したスキャンデータに対して、OCR処理を実行して文字認識を行い、その結果得られるテキストデータであるOCRデータを、記憶装置211に記憶させる(ステップS1303)。この処理は、図2(b)のOCR処理部214の動作、及び図3のシーケンスS3に対応する。
次に、プロセッサ1101は、ステップS1303で取得したOCRデータから、スキャン対象の印刷文書の例えば先頭10行分の文字列データを、10件の文書件名候補として抽出する。プロセッサ1101は、抽出した10件の文書件名候補を、通信インタフェース212から図1のLAN104を介して、スキャンデータの送信元であるイメージスキャナ101に送信する(以上、ステップS1304)。この送信処理は、図12のステップS1205の説明で前述したように、例えば前述したHTTPの通信プロトコルに準じた処理であってよい。この場合、マルチスキャンサーバ102はWWWサーバとして動作し、イメージスキャナ101のタッチパネル202のディスプレイは、WWWブラウザとして動作する。この処理は、図2(b)の情報候補抽出・送信部215の動作、及び図3のシーケンスS3に対応する。
その後、プロセッサ1101は、図1のイメージスキャナ101からLAN104及び通信インタフェース204を介して、文書件名の情報を受信するまで待機する(ステップS1305の判定がNOの繰返し)。
ステップS1305の判定がYESになると、プロセッサ1101は、以下の処理を実行する(ステップS1306)。プロセッサ1101はまず、ステップS1305で受信した文書件名の情報を含む文書データを生成する。次に、プロセッサ1101は、ステップS1301とS1302でイメージスキャナ101から受信し記憶装置211に記憶させているスキャンデータを含む添付ファイルを生成する。更に、プロセッサ1101は、ステップS1303のOCR処理により記憶装置211に得ているOCRデータを取得する。そして、プロセッサ1101は、それらの生成、取得した文書データ、添付ファイル、及びOCRデータを、文書情報として、通信インタフェース212から図1のLAN104を介して、管理サーバ103に送信する。この送信処理は、例えば前述のFTPに準じた処理であってよい。この場合、マルチスキャンサーバ102はFTPクライアントとして動作し、管理サーバ103はFTPサーバとして動作する。送信完了後、プロセッサ1101は、例えば、記憶装置211に記憶されていたスキャンデータ及びOCRデータ603を削除する。以上の処理は、図2(b)の文書情報送信部217の動作、及び図3のシーケンスS7に対応する。
ステップS1306の処理の後、プロセッサ1101は、ステップS1301のスキャンデータの待機処理に戻る。
図14は、図11のハードウェア構成例を有する管理サーバ103により実行される文書登録処理の例を示すフローチャートである。この処理は、図11のプロセッサ1101が、記憶装置211又は可搬記録媒体1107からRAM1102に読み込んだ文書登録処理プログラムを実行する動作である。この文書登録処理は、図6で説明した管理サーバ103における処理である。
プロセッサ1101はまず、マルチスキャンサーバ102から文書データ601、添付ファイル602、及びOCRデータ603の組としての文書情報を受信するまで待機する(ステップS1401の判定がNOの繰返し)。
ステップS1401の判定がYESになると、プロセッサ1101は、以下の処理を実行する。プロセッサ1101は、受信した文書データ601、添付ファイル602、及びOCRデータ603をそれぞれ、文書データ格納フォルダ611、添付ファイル格納フォルダ612、及びテキスト格納フォルダ613に格納する(ステップS1402)。
次にプロセッサ1101は、文書データ登録処理を実行する(ステップS1403)。具体的には、プロセッサ1101は、文書データ格納フォルダ611に格納されている文書データ601の内容を、文書テーブル621の一レコードとして自動登録する。文書テーブル621の登録フォーマットは、図7(a)の説明で前述した通りである。
続いて、プロセッサ1101は、添付ファイル登録処理を実行する(ステップS1404)。具体的には、プロセッサ1101は、添付ファイル格納フォルダ612に格納されている添付ファイル602を、例えば管理サーバ103内の記憶装置のファイルシステムの所定の保存フォルダにアップロードする。そして、プロセッサ1101は、保存場所のファイルパス情報と、一意に付与した添付ファイル管理番号とを対応付けて、それらの情報を、添付文書テーブル622の一レコードとして自動登録する。添付文書テーブル622の登録フォーマットは、図7(b)の説明で前述した通りである。
更に、プロセッサ1101は、OCRデータ登録処理を実行する(ステップS1405)。具体的には、プロセッサ1101は、検索エンジン623の例えばインデックスファイルに、テキスト格納フォルダ613に格納されているOCRデータ603の各テキストと、その一意名(OCRデータ603のファイル名等)を自動追加する。また、プロセッサ1101は、一意名と、OCRデータ603を生成した添付ファイル602の添付ファイル管理番号との対応関係を、添付ファイル紐付けテーブル624の一レコードとして自動登録する。添付ファイル紐付けテーブル624の登録フォーマットは、図7(c)の説明で前述した通りである。
最後に、プロセッサ1101は、文書データ格納フォルダ611、添付ファイル格納フォルダ612、及びテキスト格納フォルダ613に格納されていた文書データ601、添付ファイル602、及びOCRデータ603を削除する(ステップS1406)。
その後、プロセッサ1101は、ステップS1401の受信待機処理に戻る。
図15は、図11のハードウェア構成例を有する管理サーバ103により実行される文書検索処理の例を示すフローチャートである。なお、図15の例では、検索エンジン623のインデックスファイルに登録されているOCRデータ603を対象に検索を行う例を説明する。しかしながら、別の実施形態では、例えば、文書テーブル621や添付文書テーブル622に登録されている文書件名、所属、担当者、添付ファイルパスなどを検索対象として検索が実行されてもよい。図15の処理は、図11のプロセッサ1101が、記憶装置211又は可搬記録媒体1107からRAM1102に読み込んだ文書検索処理プログラムを実行する動作である。この文書検索処理は、図8で説明した添付文書検索インタフェースをユーザの端末装置に提供する処理である。
まず、プロセッサ1101は、ユーザの端末装置からの要求に基づいて、図8の添付文書検索画面(但し、一覧画面はまだ非表示)を送信する。この送信処理は、例えば前述したHTTPの通信プロトコルに準じた処理であってよい。この場合、管理サーバ103はWWWサーバとして動作し、ユーザの端末装置はWWWブラウザとして動作する。その後、プロセッサ1101は、ユーザによる検索キーワード(図8参照)の入力を待機する(ステップS1501の判定がNOの繰返し)。
ステップS1501の判定がYESとなると、プロセッサ1101は、入力された検索キーワードをキーとして、図6の検索エンジン623による検索を実行する(ステップS1502)。
上記検索処理の結果、プロセッサ1101は、検索キーワードを含むOCRデータ603の一意名の一覧を取得する。次に、プロセッサ1101は、各一意名をキーとして図7(c)の添付ファイル紐付けテーブル624を検索することにより、各一意名に対応する添付ファイル管理番号の一覧を取得する。更に、プロセッサ1101は、各添付ファイル管理番号をキーとして図7(b)の添付文書テーブル622を検索することにより、各添付ファイル管理番号に対応する添付ファイル名の一覧を取得する。加えて、プロセッサ1101は、各添付ファイル管理番号をキーとして図7(a)の文書テーブル621を検索することにより、文書件名、所属、担当者名の一覧を取得する。プロセッサ1101は、このようにして取得した添付ファイル名又は文書件名、所属、担当者名の一覧を、図8に示されるような一覧形式で、ユーザの端末装置のディスプレイに表示する(以上、ステップS1503)。
次に、プロセッサ1101は、ユーザの端末装置から、図8の一覧表示中の一行に対する添付ファイル602の表示要求が送信されたか否かを判定する(ステップS1504)。ステップS1504の判定がNOならば、プロセッサ1101は、ユーザの端末装置から特には図示しない終了ボタンによる一覧表示の終了指示が送信されたか否かを判定する(ステップS1505)。ステップS1505の判定もNOならば、プロセッサ1101は、ステップS1504の判定処理に戻る。
上述のステップS1504とS1505の判定処理の繰返しにおいて、ユーザが添付ファイル602の表示要求を指示してステップS1504の判定がYESとなると、プロセッサ1101は、次の処理を実行する。プロセッサ1101は、図8の一覧表示中の指示された行に対応する一意名をキーとして、図7(c)の添付ファイル紐付けテーブル624を検索することにより、添付ファイル管理番号を取得する(ステップS1506)。
次に、プロセッサ1101は、ステップS1506で取得した添付ファイル管理番号をキーとして、図7(b)の添付文書テーブル622を検索することにより、添付ファイルパスを取得する(ステップS1507)。
そして、プロセッサ1101は、ステップS1507で取得した添付ファイルパスにアクセスして、添付ファイル602を取得し、その添付ファイル602を図8に示されるような形態で表示する(ステップS1508)。
その後、プロセッサ1101は、ステップS1504の判定処理に戻る。
上述のステップS1504とS1505の判定処理の繰返しにおいて、ユーザが一覧表示の終了を指示すると、ステップS1505の判定がYESとなる。この結果、プロセッサ1101は、ステップS1501の検索キーワードの待機処理に戻る。
以上説明した実施形態において、文書件名候補はイメージスキャナ101である複合機のタッチパネル202に表示されその中からユーザが文書件名を選択又は編集して確定される構成を有している。これに対して文書件名候補の表示編集部分は、必ずしもイメージスキャナ101と一体の構成でなくてもよく、例えばマルチスキャンサーバ102と通信可能なタブレット端末装置等であってもよい。これにより、イメージスキャナ101としての複合機は、スキャンデータをマルチスキャンサーバ102に送信できる機能さえあれば、汎用の複合機をイメージスキャンシステム100に組み込むことも可能となる。
本実施形態では、マルチスキャンサーバ102が、複数台のイメージスキャナ101からのスキャンデータの登録に対応できる構成となっている。そして、スキャンデータに対するOCR処理及び情報候補抽出・送信処理と、管理サーバ103への情報送信処理は、マルチスキャンサーバ102が実行する構成を有している。これに対して、図2(a)と(b)の全ての機能を、1台のイメージスキャナ101に集約させた構成が採用されてもよく、そのような構成によればマルチスキャンサーバ102を用いなくても、本実施形態を実施することが可能となる。
本実施形態は、OCRデータ603がマルチスキャンサーバ102から管理サーバ103に登録される構成を有しているが、OCRデータ603は登録されなくてもよい。また、管理サーバ103での情報検索は、本実施形態では、検索エンジン623を用いて行われる構成を有しているが、文書テーブル621のデータベースに対して直接キーワード検索が実行されるような構成であってもよい。
以上で述べた様に、本実施形態によれば、収受処理の際の手番を大幅に削減することができる。また、文書件名候補から選択した文字列が編集可能であるため、例えば、スキャンを行った者が、最終的に用いる件名を設定して管理サーバ103の文書テーブル621に登録することができる。そのため、管理サーバ103において修正等を行う手番を削減することができる。また、イメージスキャナ101のタッチパネル202の表示画面には、スキャン対象の印刷文書の先頭から所定行数分の各行の文字列データを文書件名候補として抽出して、タッチパネル202のディスプレイに表示させる。そのため、ユーザは複数の候補の中からより好ましい候補を選択して文書件名を決定することができる。
以上において、実施形態を例示したが、実施形態はこれに限定されるものではない。例えば、上述の動作フローは例示であり、実施形態はこれに限定されるものではない。可能な場合には、動作フローは、処理の順番を変更して実行されてもよく、別に更なる処理を含んでもよく、又は、一部の処理が省略されてもよい。