以下、本発明を図面に基づいて説明する。
図1〜図20は本発明に係るファイルシステムの一実施形態を示す図である。なお、本実施形態は、請求項1に記載の発明に対応する。
図1において、10はデータを有効利用するために構築されているデータ管理システムであり、このデータ管理システム10は、ユーザが取り扱うデータをバックアップするデータバックアップシステムとして機能するとともに、そのユーザの必要に応じてファイルシステムとしても機能してデータを再利用することができるように構築されており、ユーザの事業所内のイントラネット上に接続されている高機能デジタル複写機(MFP:Multi Function Printer)11と、サーバ装置12と、大容量記憶装置(IMS:Infinit Memory Server)13と、パーソナルコンピュータ(PC)14と、接続装置(MFB:Multi Function Box)15と共に、インターネット上の後述するサービスを提供するサービス提供会社の大容量記憶装置(WebIMS)16により構築されている。
複写機11は、図2に示すように、装置各部を統括制御する制御部21に、表示部22、操作部23、NCU部(網制御装置)24、通信制御部25、読取装置26、記録装置27、画像メモリ部28、および画像処理部29がバス30を介して接続されており、この制御部21は内蔵するCPU(Central Processing Unit:中央処理装置)がROM(Read Only Memory:記憶媒体)内から読み出した制御プログラムに従って装置各部の駆動条件や管理データ等の各種情報を記憶するとともに動作する上で必要なデータを記憶するRAM(Random Access Memory)を利用して後述する各種機能と共に本発明の各種処理を実行する。
表示部22および操作部23は、図3に示す装置本体の前部上面に設けられた操作表示パネル内に構成されており、駆動条件、装置状態、あるいは入力情報などの各種情報を表示してユーザによる設定や命令等の入力操作を行なうためのタッチパネル付き表示操作LCD(Liquid Crystal Display)22a、テンキー23b、ファンクションキー(Fキー)23c、スタートキー23d、およびストップキー23eなどが配設されていると共に、IDカードをセットして各種情報を読み書きする不図示のスロットが配設されている。
通信制御部25は、PSTN(Public Switched Telephone Network)を介して発着信を行なう際に所定の回線制御を実行して回線接続あるいはその切断を行なうNCU部(網制御装置)24が接続されており、画データや各種手順信号を内蔵するモデム装置により変復調しそのNCU部24を介してファクシミリ通信(送受信)を実行するとともに不図示のI/F(インターフェイス)によりイントラネットに接続されて画データや文字データなどの文書データの送受信(伝送)を実行する。
読取装置26は、図4および図5に示すように、大面積のコンタクトガラス26a上に原稿スケール26bの挟角により形成される原稿位置基準26cに角が一致するように原稿Pを位置決め載置した後に、そのコンタクトガラス26a上に接離可能に取り付けられた圧板26dによりその原稿Pを密着させた状態で、原稿Pから送信/複写する画データを読み取るようになっており、セットした原稿Pに副走査方向に移動する第1キャリッジ26eに取り付けた主走査方向に延在する露光ランプ26fから光を照射してその画像面からの反射光を第1ミラー26gにより偏向した後に、さらにその反射光を第1キャリッジ26eの1/2の速度で移動することにより反射光の光路長Lを一定に維持する第2キャリッジ26hに取り付けた第2、第3ミラー26i、26jにより反転させて結像レンズ26kによりCCD(Charge Coupled Device)26mに投影して光電変換することにより画データを読み取る。なお、この読取装置26は、複数枚の原稿Pを自動的に処理できるように、圧板に代えて原稿テーブルにセットした原稿Pをコンタクトガラス26a上に自動搬送して読取後に排紙テーブルに搬出する装置(ADF:Auto Document Feeder)を搭載させてもよいことは云うまでもない。
記録装置27は、読取/受信してハードディスク装置からなる画像メモリ部28にビットマップ展開して蓄積した画データを、例えば、公知の電子写真記録方式により400dpi、256階調で用紙に画像を記録するものであり、詳細には説明しないが、読取/受信した画データに基づいて回転駆動させつつ帯電させた感光体上に光書き込みすることにより静電潜像を形成した後にトナーを付着させてトナー現像し、記録する画像に適した、あるいは指定されたサイズの用紙を給紙カセットから搬送してそのトナー像を転写し定着させ装置外に排紙する。なお、記録装置27は、電子写真記録方式以外にも、例えば、インクジェット方式、サーマルヘッド方式、ドットインクパッド方式などであってもよいことは云うまでもない。
画像処理部29は、送信する画データをデータ圧縮して符号化する一方、受信した画像データを伸長して復号化するDCR(符号化復号化)として機能するとともに、ユーザがPC14などで作成した文書などの文字データ(コードデータ)を画像メモリ部28中にマップ展開して画データとする変換処理などを要求に応じて行なうようになっている。なお、この画像処理部29が行なう画データの圧縮は、データ容量を小さくするためであるので、公知のいずれの方式であっても複写機11およびサーバ装置12の双方が処理可能であればよく、例えば、画像メモリ28内の400dpi、各画素8ビットのビットマップデータをGBTC(Generalized Block Trancation Cording)方式で圧縮することが考えられる。
したがって、この複写機11は、画データを伝送するファクシミリ通信や文書データをPC14間などで伝送するデータ通信などを行なう伝送機能と、読取画データを記録出力する複写(コピー)機能と、受信文書データを記録出力する記録機能とを備える処理装置を構成しており、複写機としてだけではなく、ファクシミリ装置、プリンタ装置、スキャナ装置としても利用することができるようになっている。
なお、この複写機11の操作部23にセットされるIDカードには、ファクシミリ通信先の電話番号やPC14のアドレスまたは複写時の縮小率などの処理条件と共にユーザIDやユーザ名などが書き込まれている。
このため、複写機11は、操作部23のFキー23cの押下による機能選択の後に(複写の場合にはそのまま)スタートキー23dが押下されたときには、処理条件を読み出して容易に各種機能を利用できるとともに、同時にユーザIDをICカードから読み出して(PC14により利用される場合には文書データとともに受け取って)利用した処理機能や処理枚数などの管理情報をそのユーザID毎に制御部21のRAM内に格納して課金処理などに利用することができるようになっており、備える機能により処理する文書データをユーザによる処理命令(PC14からの処理命令や自機内で処理する受信文書データの記録出力命令などを含む)に従って所望のデータ処理を行なうのと同時に、後述するその文書データのサーバ装置12への送出の際にはそのユーザIDの入力を要求することなく流用して付加データ(特定情報)としその文書データに添付(付加)する。なお、このときに、複写機11がICカードをセットされることなく(ユーザIDを入力されることなく)動作される場合には課金処理時に共通費として使用する複写機11に予め割り振っておいた共有IDを不揮発RAM内から読み出してユーザIDとして使用しその文書データは共有文書データとして処理する。
そして、接続装置15は、複写機11、サーバ装置12、PC14などの端末装置のネットワークハブとして機能して相互間のデータ通信を中継することによりローカルエリアネットワーク(LAN)環境を構築するとともに、インターネットに接続して複写機11、サーバ装置12あるいはPC14からインタネット上のサービス提供会社にアクセスして各種情報を利用することができるように機能してイントラネット環境を構築する。
PC14は、CPU、メモリ(ROM、RAMなど)、およびI/O(Input/Output)回路等からなり、ディスプレイを見ながらキーボードやマウスなどを操作することにより不図示のハードディスク装置(記憶媒体)内から読み出したアプリケーションプログラムに従って演算処理などを行なうことにより文書や画像の作成などの各種処理を行なうシステムとして利用することができるようになっており、その文書データは複写機11にユーザIDと共に処理命令(指示)を送出することにより複写機11の各種機能を利用してプリントアウトしたり、入力した送信先にファクシミリ送信することができるとともに、複写機11がファクシミリ受信した画データを受け取ったり、複写機11に読み取らせた画データを受け取ったりすることができるようになっている。
また、大容量記憶装置16は、サービス提供会社の不図示の通信制御装置を介してインターネットに接続されており、その通信制御装置は、CPUが記録媒体内から読み出した制御プログラムに従って登録ユーザからのアクセスにより大容量記憶装置16を書込・読出可能にオープンして、バックアップするための蓄積命令があったときには続けて送られてくる後述する付加データ(特定情報)を対応付けられた文書データをそのまま蓄積する一方、アクセスに続けて蓄積する文書データの参照命令があったときにはその参照命令に従って、例えば、サーバ装置12による付加データ(ユーザID)の特定によりアドレスを指定された文書データの転送命令が送られてきたときにはそのアドレスの文書データを大容量記憶装置16から読み出して返送するようになっている。
サーバ装置12は、図6に示すように、CPU41、メモリ(ROM、RAMなど)42、ハードディスク装置(記憶媒体)43、ディスプレイ44、タッチパネル45、キーボード46、マウス47、I/O回路48、ネットワークI/F49、およびタイマ機能50を備えて、PC14と同様に使用可能なPCにより構成されており、CPU41がハードディスク装置43内から読み出したアプリケーションプログラムに従って図19に示すファイルドライバやディスプレイドライバなどの各種ドライバを公知の回路と共に構成することにより装置各部42〜49を統括制御して本発明の各種処理を実行する。このサーバ装置12は、I/O回路48を介して大容量記憶装置13が接続されるとともに、ネットワークI/F49にイントラネットを構築するイーサネット(登録商標)ケーブルなどが接続されており、サービス提供会社のバックアップサービスを受けるために、メモリ部42内の不揮発RAM内にそのサービス提供会社のアドレス、登録ID(サービスを受けるためのユーザIDであり、複写機11を使用するためのIDカード内のユーザIDと同一であってもよい)、およびパスワードなどのインターネットに接続してサービスを受けるのに必要なデータが格納されている。なお、イントラネットを介すことなく電話回線などを介してサービス提供会社などに接続する場合にはネットワークI/F49はモデムとして機能する。
そして、サーバ装置12は、複写機11で処理するデータをイントラネットを介して受け取って、記憶手段を構成する大容量記憶装置13に送ってそのまま蓄積させるようになっており、このときに、大容量記憶装置13の使用容量(蓄積容量)を確認して予め設定されている容量を超えているときには文書データの蓄積を実行する前あるいは後にメモリ部42内のサービス提供会社のアドレス、登録IDおよびパスワードなどによりインターネット上のサービス提供会社にアクセスして一定容量の文書データを古いものから順次読み出して転送し大容量記憶装置16に蓄積させる。また、このサーバ装置12は、ユーザによる要求に応じて大容量記憶装置13に蓄積させた文書データの一部(例えば、先頭ページのサムネイル画像)や付加データを読み出して選択可能にディスプレイ44に表示出力し、選択された文書データを大容量記憶装置13から読み出して複写機11に転送し例えば、記録出力などさせることにより、ファイル装置として機能してデータ管理システム10をファイルシステムとしても機能させるようになっており、大容量記憶装置13から大容量記憶装置16に転送して蓄積させた文書データを参照する必要がある場合にはメモリ部42内のサービス提供会社のアドレス、登録IDおよびパスワードなどによりインターネット上のサービス提供会社にアクセスして同様に処理する。すなわち、サーバ装置12は、蓄積管理手段および出力管理手段を構成している。
具体的には、複写機11は、図7のフローチャートに示すように、例えば、複写機11の操作部23を操作して複写を選択する場合にはそのままスタートキー23dを押下することにより(ステップP1、P2)、読取装置26にセットした原稿画像から文書データを読み取ってコピーするのと(ステップP3)並行して、操作部23にICカードがセットされている場合にはそのICカードから読み出したユーザIDにより操作者(複写機11を使用するユーザ)を認証設定する(ステップP4、P5)一方、ユーザIDを取得できないときには制御部21の不揮発RAM内から読み出した共有IDがユーザIDとされ操作者の認証は「無設定」とする(ステップP4、P5、P7)。
そして、複写機11は、選択された機能による処理と並行して、同一の文書データを画像処理部29により符号化して圧縮した後にイントラネット上の大容量記憶装置13に蓄積させるためにそのユーザIDと共に不図示のタイマ機能が計時する処理時の処理日時情報や処理時の条件(縮小率など)を付加データ(コードデータ)としてその文書データに付加してサーバ装置12に送出し蓄積(ファイル)させる(ステップP8)。このとき、文書データは画像メモリ部28内に一時記憶された後に画像エリアを示すFGATE信号に、付加データは情報エリアを示すCOMM信号に同期させてサーバ装置12に送出するようになっており、このときの付加データは、図8に示すように、原稿Pなどが複数ページにわたる場合でも先頭や最後の文書データのみに付随する形式で送出することにより一処理にまとめて処理条件を対応付けして蓄積させ大容量記憶装置13、16で占有(使用)する記憶容量を節約するようになっている。なお、複写処理などのようにページ毎に複写濃度などを調整するときに、より細かく処理条件を把握したい場合には、図9に示すように、ページ毎の文書データに付加データを付随させてサーバ装置12に送出するようにしてもよいことは云うまでもない。
したがって、複写機11で処理する同一の文書データは、その処理を実行する操作の他に特別な入力操作を要求することなく(蓄積命令の入力の有無に拘らずに)、該文書データを特定するための付加データが付加(対応付け)されて自動的に蓄積されバックアップが取られる。また、このときに、ユーザIDなしで処理する文書データであっても、ユーザIDの入力を要求することなく、そのまま共有IDを利用して同様に蓄積される。
次いで、ICカードの抜取りが行なわれたときには当該操作者による処理終了と判断して(ステップP9)、また読取装置26にセットした原稿の読取処理が終了してからの時間を不図示のタイマ機能により計時して予め設定されている一定時間が経過したことを検出したときにも操作者による一処理が終了したと判断するようになっており(ステップP11)、このいずれかの条件を満たすときに文書データの処理を行なった操作者を特定するユーザIDをクリアして、ユーザIDを取得できないときのためのデフォルトの共有IDを設定(認証)して操作者「無設定」とすることにより、異なるユーザであるにも拘らずに同一のユーザIDを使用してしまうことをなくすようになっている(ステップP12)。そして、このステップP9、P11においてICカードがセットされたままでタイマ機能により計時される一定時間が経過せずに他のキー入力、例えばFキー23cやスタートキー23dの押下により新たな処理の開始命令があったときには(ステップP10)、同一のユーザIDを保持したままステップP1に戻って同様な処理を繰り返す。
したがって、ユーザIDは、操作者の入れ替わりが確実に検出されて再度取得されることにより誤りなく文書データに付加される。
このとき、複写機11は、ステップP2〜P11の間に、蓄積回避命令を指示入力するための操作部(操作表示パネル)23に配設された不図示の「Un・Do」ボタン(図3中の「ジョブリコールボタン」23fとは異なる)を押下することにより(ステップP100)、制御プログラム中のバックアップ処理のステップをスキップして備える機能の処理のみを継続するようになっており、ステップP8の実行による文書データの蓄積が開始された後にその「Un・Do」ボタンが押下された場合には、次の処理命令を実行する前に蓄積中あるいは蓄積直後の蓄積データの付加データを消去してその文書データの読出を不能にして消去し、文書データの蓄積を取り消すようになっている。なお、複写処理する命令事態を取り消すために「ジョブリコールボタン」23fが押下された際にも、「Un・Do」ボタンの押下と同様に処理する。
したがって、ユーザが複写機11の機能を利用するための操作以外に入力操作を要求することなくバックアップされる文書データは、ステップP2〜P11の間に、操作部23の「Un・Do」ボタンを押下するだけでその蓄積が取り消され、例えば、秘密性の高い画像をコピーする場合等に、その文書データを再利用可能にファイルしてしまうことを回避することができる。
ここで、複写機11がサーバ装置12に送出する付加データとしては、送信処理する際の相手先の電話番号・アドレスなどの送信処理条件や、複写処理(記録処理)する際の原稿および用紙に関する原稿・用紙条件および画データの加工処理に関する画像加工条件の双方からなる処理条件を受け取って(取得して)、蓄積する文書データに付加する。この付加データは、処理を特定するための情報であればどの様な情報であってもよく、例えば、複写処理の場合、この複写機11では、複写処理の利便性を向上させるために複写濃度、画像モード(補正処理など)、変倍率、複写済み用紙をソートして排出したりステープルにより綴じるなどする用紙の後処理、画像の両面複写、画像の分割複写、画像の集約複写、日付・スタンプ・ページなどを付加する複写時印字、画像の編集複写などを選択することができるようになっているので、複写枚数、最大A3サイズから最小B6サイズまで自動的に識別する原稿サイズ・方向や設定に応じて選択する用紙サイズ・方向などの原稿・用紙条件と共にこれら画像加工条件を処理条件として受け取って(取得して)、蓄積する文書データに付加する。
なお、この複写機11は、複写処理する際にそのままスタートキー23dを押下するデフォルトの複写条件(自動用紙選択・変倍率100%・自動濃度など)で原稿をコピーするのではなく、Fキー23cを押下してコピー機能を選択したときには、図10に示す画面を表示操作LCD22aに表示してテンキー23bと共に操作することにより原稿・用紙条件や画像加工条件の数値や各種モード(図11におけるコマンド)を設定選択することができるようになっており、例えば、テンキー23bから入力される複写枚数(デフォルトでも設定可能なコピー部数)は図12に示すようにコマンド26Hに付随させる置数データを例えば、置数「1」の場合に「26」「00」「01」のようにコマンドに続けて付随させて付加データとする。また、表示操作LCD22aから入力される原稿・用紙条件や画像加工条件の付加データとしては、画像に応じた複写濃度にする自動複写濃度または7段階の任意複写濃度となるコマンド33Hの濃度設定データ、原稿画像の文字または写真などの画質の種類となるコマンド28Hに含まれる原稿種別データ、使用する用紙を給紙カセットのいずれかに指定することにより用紙サイズ・方向となるコマンド31Hの給紙位置データ、原稿サイズ・方向となる原稿サイズと変倍率に応じて給紙カセット(用紙)を自動選択するコマンド32Hの自動濃度選択モードの設定データ、原稿サイズと用紙サイズにより決定される定型変倍や任意の入力設定による1%刻のズームや原稿画像と複写画像の長さを入力設定することによる寸法変倍や縦と横とで別個の倍率を入力設定することによる独立変倍などの変倍率となる示すコマンド35Hの変倍モードの設定データ、両面・片面原稿や見開き原稿などの画像を用紙の両面に記録する両面複写となるコマンド27Hの両面モードの設定データ、両面原稿や見開き原稿などの画像を用紙の片面づつに記録する分割複写となるコマンド28Hの分割モードの設定データ、複数の原稿画像を一面側や両面側にまとめたりするコマンド29Hの集約モードの設定データ、複写画像に処理日付・「至急」やユーザのマークなどのスタンプ・ページ数などを自動的に付加する複写時印字となるコマンド2AHの印字モード、同一画像を一面側に並べるダブルコピー・ブック原稿の中心や周囲を余白にする余白作成・用紙の一辺側を余白にする綴じ白部作成・指定された色のみを消去する消去処理などの編集複写となるコマンド34Hの編集モード、を用いるようになっている。
一方、サーバ装置12は、大容量記憶装置13、16に蓄積する文書データを容易に検索できるようにするために、付加データを格納するデータベースがハードディスク装置43内にユーザID毎に区分けされて作成されており、図7のステップP8の実行により複写機11から文書データと共にユーザID、処理日時情報、処理条件、PC14から受け取った文書データに付されているタイトルなどの付記情報等を含む付加データをイントラネットを介して受け取ると、図13に示すように、まず、受け取った文書データを大容量記憶装置13に蓄積してバックアップを取るのと同時に、ファイル装置として容易に使用できるように文書データを特定する処理日時情報、処理条件、タイトル等の複写機11から送られてきた付加データをハードディスク装置43のデータベース内に種別毎に準備されている欄にユーザIDに対応付けして登録する(ステップP31)。
このサーバ装置12は、さらに文書データを特定するための付加データを取得するために、CPU41が文書データを補正・補完などする処理や、図20に示す原稿P内の文書領域p1〜p4や画像領域p5、p6などと領域を識別する処理などの文書解析処理を行なった後に(ステップP32)、その文書データにOCR(Optical Character Reader)処理を施して文字データをコード化し文中に繰り返し使われているキーワードをまずは取得して(ステップP34)、蓄積した文書データに対応付けするようにデータベース内に登録付加する(ステップP35)。したがって、大容量記憶装置13、16に蓄積した文書データは、これら付加データによっても容易に特定することができる。
このため、サーバ装置12は、ユーザがユーザIDを入力して文書データの参照を要求する場合には、CPU41がその参照命令に従ってユーザIDに対応付けする文書データを大容量記憶装置13、16から、付加データをハードディスク装置43から読み出してディスプレイ44に表示出力するようになっており、このときは、図14のフローチャートに示すように、CPU41は図15に示すスクロールボタン59により高速・低速にスクロール可能なカレンダビュー形式60の表示画面を作成すると共に文書データの先頭ページを縮小した図16に示すようなサムネイル画像61を作成して該当する処理日付(処理日時情報)毎に表示出力し(ステップP51)、後述する関連文書を関連付けして表示する命令があったときにはその処理を実行し(ステップP52、P53)、この後に、再利用する文書データを検索するための操作命令を入力されたときには(ステップP54)、各種処理を実行する(ステップP55)。例えば、文字などの文書内容を確認したいときにはそのサムネイル画像61をマウス47のクリックやタッチパネル45の表示箇所の押下で選択することによりディスプレイ44全面に選択された文書データをスクロール可能に表示出力(展開表示)することができる。
そして、サーバ装置12は、ディスプレイ44のカレンダビュー形式60表示画面中の検索ボタン64を選択することにより図17に示す一覧を左上から順次に表示させて文書データの処理を確認することができるようになっており、コピー処理した文書データの種類などの内容を確認する際にはコピーボタン65を選択すると、文書データのタイトルやキーワードなどの付加データの一覧66を表示出力して確認することができ、さらにその一覧中の処理条件を選択すると、コピー部数や原稿の種類などの付加データの一覧67を表示出力して確認することができる。なお、このときに、サーバ装置12は、ユーザが付加データとして任意の期間を日時情報の入力により指定してこの期間に含まれる文書データの参照を要求する場合には、その期間を表示するカレンダにより参照処理を実行する。
また、サーバ装置12は、ユーザがユーザIDを入力して文書データの参照を要求する場合に、図15に示す絞込ボタン65を選択することによりディスプレイ44に図18に示す一覧を左上から順次に表示させ処理時の記憶を辿って付加データの種類を選択することによりカレンダビュー60に不要な文書データを省いてサムネイル画像61を選択可能に表示出力させることができるようになっており、原稿に関する付加データから絞り込みを行なう場合には原稿ボタン68を選択して原稿サイズや方向などを右欄の「▽」をクリックなどすることによりモード設定可能な条件を指定することができ、例えば、両面モードの場合には片面→両面、両面→両面、左右ページ両面、表裏ページ両面を順次表示させ選択した後に同時に表示出力する実行ボタン70を選択することにより該当する付加データを対応付けられている文書データのカレンダビュー60中のサムネイル画像61を反転表示させ、該当文書データが複数あるときには、上述したのと同様に、図15、図17に示す検索ボタン64とコピーボタン65の選択により文書データのタイトルやキーワードなどの付加データの一覧66を表示出力して確認するなどしてからサムネイル画像61と呼出ボタン62を選択して所望の文書データをディスプレイ44全面に表示出力させることもできる。
したがって、サーバ装置12は、複写機11により処理した文書データの参照を要求するメニューをディスプレイ44上で選択して文書データを再利用する場合には、例えば、そのユーザIDの一致する文書データのサムネイル画像61を最新のものから、あるいは任意な時期のものからカレンダ表示することができ、またマウスなどによりそのサムネイル画像61から容易に文書データを選択して大容量記憶装置13から本読出(処理済みの全文書データを再入手)して複写機11に付加データと共に送出することにより、その複写機11は、文書データを画像処理部29により復号化して復元するとともに画像の加工に用いる付加データに従って記録出力することができ、処理条件の入力操作を行なうことなくバックアップ時に出力した文書データを再現して入手することができる。
この後に、サーバ装置12は、所望の文書データがあった場合には、そのサムネイル画像61をマウスやタッチパネルで選択した上でさらに呼出ボタン62を選択し出力先を指定することにより(ステップP56)、大容量記憶装置13から文書データを本読出(処理済みの全文書データを再入手)してディスプレイ44全面に表示出力させたり、複写機11に付加データと共に送出することにより画像処理部29により復号化して復元するとともに画像の加工に用いる付加データに従って記録出力することができ(ステップP57)、処理条件の入力操作を行なうことなくバックアップ時に出力した文書データを再現して入手することができる。そして、不図示の終了ボタンが選択されるまではステップP51に戻って同様な処理を繰り返し、終了ボタンが選択されたときにこの処理を終了する(ステップP58)。なお、画像の加工に用いる付加データは、参照したユーザが複写機11の操作部23から入力する構成としてもよい。また、サーバ装置12は、大容量記憶装置13に蓄積するものより古い文書データの参照が指示されたときには、内蔵する不揮発RAM内からサービス提供会社のアドレス、ユーザID毎の登録IDおよびパスワードなどを読み出してインターネット上のサービス提供会社にアクセスして文書データの参照指示を送出することにより、大容量記憶装置16をも同様に取り扱って蓄積する文書データの参照処理をすることができる。また、このサーバ装置12は、ユーザIDの入力なく処理した共有文書データについては、複写機11で使用するユーザIDが入力されることを条件に、その共有文書データの参照指示に応じて複写機11の共有IDを参照時に使用するユーザIDとすることにより、そのユーザID(共有ID)に対応付けられている文書データを同様に参照して処理することができる。
ここで、サーバ装置12のCPU41は、複写機11から送られてきた文書データについて、既にデータベース内の同一ユーザIDに対応付けして大容量記憶装置13、16に蓄積済みの文書データと何等かの関連があるかないかをチェックする図19に示す関連性判断手段を構成するようになっており、関連文書であることを確認した場合には双方にリンク情報を付加して(所謂、リレーションを張って)蓄積管理する。なお、CPU41を関連性判断手段として機能させるのは、本実施形態においては文書データを受け取った直後に行うが、夜間などのように複写機11が使用されない時間帯に行うようにしてもよい。
具体的には、図13に戻って、ステップP34、35で複写機11から受け取った文書データにOCR処理を施してキーワードを取得しデータベース内に登録した後に(ステップP34、P35)、新たな文書データ(新文書データ)が既に蓄積した文書データ(既文書データ)と関連性があるかないか、例えば、新文書データが既文書データと完全同一文書、新文書データが既文書データの一部を書き換え更新した更新文書、あるいは新文書データが既文書データの内容に何等かの関係がある関係文書であるなどの判定処理を行なう(ステップP36)。
その判定の結果、新文書データが既文書データと完全同一の場合には(ステップP37)、新文書データを大容量記憶装置13から消去(取消)することによりデータベースの作成(付加データの登録)のみを行なったこととして双方の付加データに同一リンク情報を対応付けすることにより(ステップP38)、図14のステップP53の実行時には、サムネイル画像61は共通に既文書データを使用してカレンダビュー60中に作成表示するとともに、その双方のサムネイル画像61は反転を同期させた点滅表示をすることにより同一文書であることを強調表示する。なお、同一文書データの付加データを確認の際には同一文書の存在を一覧中に表示していずれの文書が選択された場合にもその付加データを表示・確認して同様に再利用することができるようになっている(以下で説明する完全に同一でない場合にも同様)。
また、新文書データが既文書データの一部を書き換えた更新文書データの場合には(ステップP39)、更新された領域の文書データ(更新データ)以外を大容量記憶装置13から消去して(更新データのみを付加データに対応付けして大容量記憶装置13、16に蓄積し)、双方の付加データに更新リンク情報(所謂、版情報)を対応付けすることにより(ステップP40)、更新文書データのサムネイル画像61は既文書データの該当する領域を更新データと差し替えることにより作成表示するようになっており、図14のステップP53の実行時には、該当するサムネイル画像61は更新領域が小さい程同一文書データの場合よりも長い間隔で反転点滅させることにより関連性の度合いをカレンダビュー60中に強調表示する。
さらに、新文書データのキーワードが既文書データと予め設定されている個数以上で一致するなどと何等かの関係がある関係文書データの場合にも同様に(ステップP41)、双方の付加データに関係リンク情報を対応付けすることにより(ステップP42)、図14のステップP53の実行時には、該当するサムネイル画像61は一致するキーワード数などが少ない程同一文書データの場合よりも長い間隔で反転点滅させることにより関連性の度合いをカレンダビュー60中に強調表示する。
したがって、同一文書・更新文書のバックアップを取る際には大容量記憶装置13、16の記憶容量を無駄に使用することをなくすことができ、蓄積可能な文書データ数を向上させて見かけのファイル容量を拡大することができるとともに、関連性のある文書データは他の文書データから容易に区別して選択することができる。
この新文書データが既文書データと同一・更新のいずれかの関連性があるか否かは、CPU41が文書データをOCR処理して変換した文字コードデータと共に画像領域の画データを一定期間(例えば、1カ月)だけハードディスク装置43内に保持して新文書データと既文書データとをページ単位あるいはページ内のブロック毎に比較(画データはエッジを一致させるなどの補正・修正を施して比較し、ブロック毎には図20に示すように原稿P中に文書ブロックp1〜p4や画像ブロックp5、p6が表示されている場合にはそのブロック単位に比較)することにより、完全同一・一部更新であるかを確認するようになっており、例えば、一部のブロックp4が不一致である場合にはそのブロックp4を更新データとして蓄積管理する。なお、文書データのOCR処理が完全でない場合もあることから、文字のみの文書データである場合にはその文字数、句読点の位置、単語(例えば、英文などのスペース文字間)の数が完全に一致したときに完全同一と判断し、このときにフォントの大きさや文字の色指定が異なっていたり、文中に改訂記号(文中に修正したことを示す特殊記号)がある場合に更新文書データと判断するようにしてもよい。
また、上記の同一・更新文書データに該当しない場合でも、新文書データおよび既文書データのキーワードが一定個数以上共通したり、タイトルが一致する場合には関係文書データとして蓄積管理し、このときに文中から重要なセンテンスを抽出して(例えば、特開平9−34905号公報に記載する方法により抽出して)そのキーセンテンスが一致する場合には関係文書データとして蓄積管理する。このとき、新文書データに関連付けられた既文書データ以外の該既文書データに関連付けられている別の既文書データにも当該処理時に抽出したキーワードが共通するように含まれていなかったキーワードを追加登録して(所謂、マージ)、文書データ中に含まれないキーワードによっても検索できるように構成してもよく、この場合には追加したキーワードにより関連する文書データをイモ蔓式に引き出して確認することができ、検索効率を向上させることができる。
また、この文書データのリレーションは自動的に行なうだけでなく(自動化されていない場合にも)サーバ装置12のマウス47などを操作してカレンダビュー60中のサムネイル画像61を移動して重ねるなどして(所謂、ドラッグアンドドロップ)そのデータベース内にリンク情報を登録して関連付けてもよく、時間が経ってしまって関連性が不明となってしまった場合でも各文書データのキーワードやタイトルなどの付加データを指定して一覧表示(あるいは記録出力)させたり、文書データを並べて表示出力させて比較したり、OCR処理で異なる箇所のみを反転表示して確認した後にそのドラッグアンドドロップによりリンク情報を登録して関連付けることができるようにしてもよい。
このように本実施形態においては、複写機11が処理する新文書データは蓄積済みの既文書データと比較して、関連性があるときには双方にリンク情報により関連付けし大容量記憶装置13、16に蓄積する。同一であるときには新文書データ自体の蓄積は回避し、また更新されたものであるときには更新部分のみを蓄積するので、大容量記憶装置13、16の記憶容量を効率良く使用することができる。また、関連性のある文書データは、カレンダビュー60中のサムネイル画像61をその関連性の度合いを反転点滅表示により強調して表示出力するので、カレンダビュー60による日付(関連)とサムネイル画像61による表示形式とから、重複文書データ、類似文書データの有無や関連を容易に認識することができ、他の文書データから容易に区別して選択処理することができる。
したがって、ユーザがあらためてファイル作業を行なうことなく、処理する文書データをバックアップして無駄なく再利用できるように保管管理することができ、複写などした資料を保管管理することなく、容易に選択して再利用することができる。
また、複写機11が処理する新文書データの大容量記憶装置13、16への蓄積やその取消しは、同一のユーザIDの範囲内で行うので、複数のユーザにより共通使用される複写機11やイントラネット上の他の複写機により、会議等の資料を作成・配布したり、その配布資料を他のユーザが再度コピーした場合などにも、同一の文書データであるがユーザ毎には独立の必要な文書データであるにも拘わらずにその文書データの蓄積が回避されてしまうことがない。また、文書データのセキュリティを確保することもできる。
そして、本実施形態の第1の他の態様としては、図示は省略するが、関連性のある文書データのサムネイル画像61は、例えば、同一の文書データの場合に赤色表示したり、その関連性の度合いが高いほど薄く表示するなどしてもよい。また、同系色によりその関連性の度合いを強調表示するようにしてもよく、例えば、同一の文書データの場合には赤色表示するのに対して、その関連性のある場合には桃色、燈色などで表示するようにしてもよい。
また、本実施形態の第2の他の態様として、文書データを大容量記憶装置13、16に蓄積・管理するかしないか(取消の要否)、更新文書データとするかしないかを複写機11を使用するユーザに確認するように構成してもよい。このような構成を採用することによって、複写機11により処理した新文書データが蓄積済みの既文書データと同一であることや、更新文書データであることをユーザが確認・指示したときにのみ大容量記憶装置13、16への蓄積を取り消したり、更新文書データとして蓄積し保管管理することができ、意に反した処理を行ってしまうことをなくすことができる。
具体的には、新文書データと既文書データとの関連性の判断は、原稿Pの加筆や汚れにより完全に行うことは困難で、その判断基準を緩くすれば多くの文書データが関連性ありと抽出されてしまい、逆に厳しくすれば判定に時間が掛かるばかりでなく、同一文書であるにも拘わらず更新文書であると、また関連性があるにも拘わらずに関連性なしと誤判定されてしまう場合もある。
このことから、サーバ装置12は、複写機11による処理時に少なくともごみなどを拾うことのない閾値で新文書データに対して関連性ありと判断される既文書データの存在を確認した場合には、まずは、新文書データのサムネイル画像61を作成して該当する蓄積済みの既文書データと共にカレンダビュー60中に反転点滅表示する。そして、ユーザが、カレンダビュー60による日付とサムネイル画像61による表示形式とから推定し、また、紛らわしい場合には該当する既文書データのサムネイル画像61をダブルクリックしてディスプレイ44に展開表示させてその関連性や必要性を判断して、反転点滅している新文書データのサムネール画像61をクリック選択して不図示の消去ボタンをクリックされたときに、その新文書データの大容量記憶装置13、16への蓄積を取り消す一方、反転点滅しているそのサムネール画像61をクリック選択した後に不図示の登録ボタン(独立登録、領域指定更新登録、関係登録など)をクリックされたときには、上述の本実施形態と同様にその新文書データを大容量記憶装置13、16に蓄積して保管管理する。
したがって、文書データを誤って削除してしまったり、ごみなどにより更新文書データとして蓄積管理してしまうことをなくすことができ、新文書データを適正に蓄積管理することができる。なお、大容量記憶装置13、16への蓄積処理に先立って、ハードディスク装置43内に新文書データを一時記憶して上記の関連性判断処理を行うようにしてもよく、また、削除した文書データのサムネール画像61はカレンダビュー60中から消去するようにしてもよいことはいうまでもない。
なお、上述の実施形態では、ユーザIDの同一の範囲内で処理する場合を説明するが、これに限るものではなく、例えば、ユーザIDは複写機11の使用や文書データの処理を許可するためだけに使用し、すべての文書データを再利用できるようにしてもよいことはいうまでもない。
また、文書データの表示出力は、カレンダビュー60中のサムネイル画像61、一覧表示、または関連性が高い順からとして強調表示するリストアップなどのいずれかのみでもよく、またこれらのいずれかを組み合わせてもよいことはいうまでもない。