JP2009187376A - ファイル管理装置、ファイル管理方法、及びプログラム - Google Patents

ファイル管理装置、ファイル管理方法、及びプログラム Download PDF

Info

Publication number
JP2009187376A
JP2009187376A JP2008027802A JP2008027802A JP2009187376A JP 2009187376 A JP2009187376 A JP 2009187376A JP 2008027802 A JP2008027802 A JP 2008027802A JP 2008027802 A JP2008027802 A JP 2008027802A JP 2009187376 A JP2009187376 A JP 2009187376A
Authority
JP
Japan
Prior art keywords
file
registered
file management
management apparatus
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008027802A
Other languages
English (en)
Other versions
JP2009187376A5 (ja
Inventor
Tomoaki Osada
知明 長田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008027802A priority Critical patent/JP2009187376A/ja
Priority to US12/365,701 priority patent/US20090204606A1/en
Publication of JP2009187376A publication Critical patent/JP2009187376A/ja
Publication of JP2009187376A5 publication Critical patent/JP2009187376A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/172Caching, prefetching or hoarding of files

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ファイルサーバに登録されるファイルをその登録の初期の段階からキャッシングすることができるようにする。
【解決手段】ファイルサーバは、ファイルサーバにファイルを新規登録する際に、当該ファイルの特徴要素(キーワード等)を抽出し、その特徴要素とアクセスログに基づいて今回の登録要求に係るファイルと類似度の高い既存の登録ファイルを探索する。そして、ファイルサーバは、その類似度の高い既存の登録ファイルに対するアクセス数が閾値以上のドメインを探索し、そのドメインに属するキャッシュサーバにも今回の新規登録に係るファイルをコピー登録する。
【選択図】図12

Description

本発明は、複数のクライアント端末でファイルを共有するためのファイル管理システムのファイル管理装置に関し、特に、ファイルサーバに保管されている共有に係るファイルをキャッシングする技術に関する。
多くの分散ファイル管理システムでは、ファイルサーバ(ファイル管理装置)が保管する共有に係るファイルをクライアント端末にキャッシングすることで、ファイルアクセスを高速化している(特許文献1参照)。
また、構内ネットワークと広域ネットワークの間にキャッシュサーバと呼ばれるキャッシングを専門としたサーバを設置し、構内ネットワーク上のクライアント端末は、キャッシュサーバを通じてファイルサーバからのファイルを取得している(特許文献2参照)。
さらに、構内ネットワークと広域ネットワークを結ぶゲートウェイ装置内にファイルをキャッシングし、クライアント端末は、ゲートウェイ装置からファイルを取得している(特許文献3参照)。
このように、ファイルサーバが保管するファイルを所定の装置にキャッシュしておくことにより、クライアント端末は、当該ファイルの次回以降の取得時には、ファイルサーバにアクセスする必要はなく、高速に処理することができる。
特開平7−93205号公報 特開平11−24981号公報 特開平4−313126号公報
しかしながら、キャッシング用の記憶装置の容量には上限があり、ファイルサーバ上の全てのファイルをキャッシングすることができない。従って、従来のキャッシュ方式では、同一ファイルへのアクセスの頻度を集計し、所定の閾値を超えたファイルについてキャッシングを行なっている。
このように、キャッシング対象のファイルをアクセス頻度に基づいて選別した場合には、ファイルサーバにファイルを登録した初期の段階では、当該ファイルはキャッシング対象となることはない。従って、ファイルサーバに登録されたファイルをその登録の初期の段階でアクセスするクライアント端末は、迅速なアクセスの恩恵を受けることができず、不便を強いられてしまう。特に、バージョンアップが頻繁に行なわれる文書については、この問題は深刻なものとなる。
本発明は、このような背景の下になされたもので、その課題は、ファイルサーバに登録されたファイルをその登録の初期の段階からキャッシングすることができるようにすることにある。
上記課題を達成するため、本発明は、複数のクライアント端末により共有されるファイルを登録するファイル管理装置であって、当該ファイル管理装置に登録されたファイルに対する前記クライアント端末からのアクセス状況を当該ファイルの特徴要素と対応付けて記録する記録手段と、当該ファイル管理装置に新規に登録されるファイルの特徴要素を抽出する抽出手段と、前記抽出手段により抽出された特徴要素と前記記録手段により記録された特徴要素を用いて、新規登録に係るファイルとの類似度が所定の閾値以上の既登録に係るファイルを探索する探索手段と、前記探索手段により探索された既登録に係るファイルに対するアクセス頻度が所定の閾値以上のドメインに属する特定の機器に対して、新規登録に係るファイルの複製を配信して前記ファイルの複製を登録させる配信手段と、を有することを特徴とする。
本発明によれば、ファイルサーバに登録されるファイルをその登録の初期の段階からキャッシングすることが可能となる。よって、過去のファイルサーバへのアクセスの履歴によっては、ファイルサーバに新規に登録して間もないファイルをキャッシュサーバから取得することができ、クライアント端末などがより効率的にファイルを取得することが可能になる。
以下、本発明を実施するための最良の形態を、図面に基づいて説明する。図1は、本発明の実施の形態に係るファイル管理システムシステムの概略構成を示すシステム構成図である。
図1に示したように、このファイル管理システムシステムは、広域ネットワーク(以下、インターネットという)100を介して接続された複数のローカルエリアネットワーク(以下、ローカルネットワークという)110,120,130上に構築されている。ここでは、ローカルネットワーク110,120,130は、それぞれオフィスA,B,Cの構内に構築されているものとする。
ローカルネットワーク110,120,130には、それぞれファイルサーバ111、キャッシュサーバ121、キャッシュサーバ131が接続されている。また、ネットワーク110には、ファイルサーバ111の他に、MFP112、クライアントPC113,114,115が接続されている。ネットワーク120には、キャッシュサーバ121の他に、MFP122、クライアントPC123,124が接続されている。ネットワーク130には、キャッシュサーバ131の他に、MFP132、クライアントPC133,134が接続されている。
なお、以下の説明において、ローカルネットワーク110,120,130を総称する場合は、ローカルネットワーク110を代表としてローカルネットワーク110等と称する。また、複数のクライアントPC113,114,115,123,124,133,134を総称する場合は、クライアントPC113を代表としてクライアントPC113等と称する。同様に、キャッシュサーバ121,131を総称する場合は、キャッシュサーバ121を代表としてキャッシュサーバ121等と称する。同様に、MFP112,122,132を総称する場合は、MFP112を代表としてMFP112等と称する。
ファイル管理装置の一例であるファイルサーバ111は、クライアント端末の一例である複数のクライアントPC113等の間でファイルを共有するための装置であり、複数のファイルを登録して管理している。本実施形態において、ファイル管理装置が管理するファイルとしては、PCのアプリケーションなどで作成された文書データや、様々なフォーマットの形式の画像データなどが含まれる。このファイル共有により、複数のクライアントPC113等の間で、全体的なハードウェア資源を節約することができる。また、ファイルサーバ111と複数のクライアントPC113等は、ネットワークを介して互いに接続されている。従って、ファイルサーバ111とクライアントPC113等が物理的に離れていたとしても、クライアントPC113等は、ファイルサーバ111上のファイルにアクセスすることができる。
MFP112等は、コピー機能、印刷機能、FAX機能などを搭載したMFP(Multi Function Peripheral)である。MFP112等は、内部に格納装置を具備しており、各種のデータを格納することもできる。
キャッシュサーバ121等は、ファイルサーバ111で管理されている共有ファイル(以下、単に共有ファイルと称する)のコピーを保持するための装置、すなわちキャッシング専用の装置である。このキャッシュサーバ121等は、次のような存在意義がある。すなわち、クライアントPC123〜124は、自己と同一のローカルネットワーク120に接続されたキャッシュサーバ121に所望の共有ファイルが存在する場合は、ファイルサーバ111にアクセスすることなく、キャッシュサーバ121から共有ファイルを取得する。同様に、クライアントPC133〜134は、自己と同一のローカルネットワーク130に接続されたキャッシュサーバ131に所望の共有ファイルが存在する場合は、ファイルサーバ111にアクセスすることなく、キャッシュサーバ131から共有ファイルを取得する。これにより、クライアントPC123〜124,133〜134は、ファイルサーバ111から物理的に離れた場所に存在していたとしても、共有ファイルを迅速に取得することができる。
次に、ファイルサーバ111のハードウェアの構成例を図2に基づいて説明する。ファイルサーバ111は、コンピュータにより構成されている。すなわち、ファイルサーバ111は、CPU211、ROM212、RAM213、記憶装置214、マウス215、キーボード216、表示装置217、及びネットワークI/F218を有している。
これらのデバイスは、バス219を介して接続されている。また、ファイルサーバ111は、ネットワークI/F218を介してネットワーク101に接続されている。なお、キャッシュサーバ121,131もコンピュータにより構成され、ファイルサーバ111と機能が異なるだけで、ハードウェア構成は同様となっている。
ROM212には、基本入出力部(BIOS)等の基本プログラムが格納されている。CPU211は、ROM212に格納されたBIOSに基づいて、記憶装置214に格納されたアプリケーションプログラム、データをRAM213に展開し、アプリケーションプログラムを実行する。
表示装置217は、各種のデータを表示するだけでなく、対話形式で各種の指令を行なうUIとしても利用される。マウス215とキーボード216は、各種のデータや指令を入力するための入力デバイスとして利用される。
記憶装置214は、ハードディスク、磁気テープ、半導体メモリなど、大容量の記憶デバイスで構成されている。この記憶装置214には、後述する処理手順に係るプログラムを含む各種のアプリケーションプログラム、共有ファイル、その他の各種データが格納される。記憶装置214に格納される各種データとしては、アクセスログ、印刷ログ、DB302で管理される情報などがある。
なお、キャッシュサーバ121等、クライアントPC113等もファイルサーバ111と同様にコンピュータにより構成され、そのハードウェア構成は、図2のようになっている。
次に、ファイルサーバ111の機能を図3に基づいて説明する。この機能は、ファイルサーバ111の記憶装置214に格納されるアプリケーションプログラムにより実現されるものである。これらアプリケーションプログラムは、ファイルサーバ111のRAM213にロードされ、CPU211が実行する。
ファイル内容解析部301は、ファイルサーバ111の管理下にあるファイル、すなわち共有ファイルの内容を解析し、その共有ファイルの特徴を表す要素を抽出するためのプログラムである。ファイルの特徴を表す要素とは、例えば重要単語であるキーワード、共有ファイルに含まれる重要な画像の特徴事項、文章の概念を示す概念見出し、共有ファイルに付加されるメタデータ等である。
DB(データベース)部302は、共有ファイルを蓄積するためのプログラムである。このDB部302は、ファイル内容解析部301での解析結果であるファイルの特徴を表す要素と対応付けて共有ファイルを登録(蓄積)する。アクセスログ記録部303は、共有ファイル(DB)にクライアントPC113等がアクセスした場合に、そのアクセスログを記憶装置214に記録するためのプログラムである。このアクセスログのフォーマット等は、図4に基づいて後述する。
印刷ログ記録部304は、共有ファイルをクライアントPC113等からの要求に応じてMFP112等で印刷した場合に、その印刷ログを記憶装置214に記録するためのプログラムである。この印刷ログのフォーマット等は、図5に基づいて後述する。
ファイル選択部305は、キャッシュサーバ121,131にコピーすべきファイルを共有ファイルの中から選択するためのプログラムである。この選択処理は、後述するように、共有ファイルの特徴を表す要素、アクセスログ、印刷ログを用いて行なわれる。なお、アクセスログ、印刷ログは、ファイルサーバ111上の既登録に係るファイルに対するクライアントPC113等からのアクセス状況を記録するものである。すなわち、アクセス状況としては、単なる読み出し処理だけでなく、印刷要求に伴う読み出し処理の履歴も含まれる。
配信部306は、ファイル選択部305により選択されたファイルをキャッシュサーバ121,131に配信するためのプログラムである。
アクセスログは、図4のようなフォーマットで記録される。すなわち、図4(a)に示したように、アクセスログは、「アクセス日時」、「ファイル名」、「ユーザ名」、「ドメイン(名)」、「ファイルの特徴要素」の各データ項目を有している。
「アクセス日時」は、クライアントPC113等が共有ファイルにアクセスした日時を示すデータ項目である。「ファイル名」は、クライアントPC113等がアクセスした共有ファイルのファイル名を示すデータ項目である。「ユーザ名」は、当該共有ファイルにアクセスしたユーザのアカウント名を示すデータ項目である。
「ドメイン名」は、当該共有ファイルにアクセスしたクライアントPC113等が所属するグループの名称を示すデータ項目である。この「ドメイン名」は、特にオフィスやフロアなど物理的な区切りを識別する意味合いが強い。図1に示す例では、例えばオフィスAに配備されたクライアントPC113,114については、「オフィスA」という同一のドメイン名が割り当てられる。同様にオフィスBに配備されたクライアントPC123,124については、「オフィスB」という同一のドメイン名が割り当てられる。同様にオフィスCに配備されたクライアントPC133,134については、「オフィスC」という同一のドメイン名が割り当てられる。
「ドメイン名」の具体例としては、例えば、ネットワークドメインが挙げられる。すなわち、一般的に、ネットワークの設定では、グループ毎にサブネットマスクを設定し、ローカルエリアネットワークを構築することで通信の効率化およびセキュリティの向上を計っている。このサブネットマスクをアクセスログにおける「ドメイン名」として記録することができる。
また、「ドメイン名」は、クライアントPC113等に搭載されるOS(オペレーティングシステム)のワークグループなどの機能を利用してもよい。すなわち、OSでは、一般的に特定の意味を持ったグループを同一のワークグループに割り当てることが多いので、このワークグループ名をアクセスログにおける「ドメイン名」として記録することができる。
さらに、クライアントPC113等がファイルサーバ111にアクセスする際に、「ドメイン名」をパラメータとして渡してもよい。図1に示す例では、例えばオフィスCに所属するクライアントPC133がファイルサーバ111にアクセスする場合は、「オフィスC」という文字列を「ドメイン名」に係るパラメータとしてファイルサーバ111に渡す。そうすることで、ファイルサーバ111は、「オフィスC」をアクセスログにおける「ドメイン名」に係るデータとして記録することができる。
なお、本実施の形態では、「ドメイン名」に係るドメイン毎に、キャッシュサーバを有することを想定している。
「ファイルの特徴要素」は、アクセスに係る共有ファイルの特徴要素を示すデータ項目である。この「ファイルの特徴要素」は、ファイル内容解析部301での解析結果を示すものであり、具体的にはキーワード、共有ファイルに含まれる重要な画像の特徴事項、文章の概念を示す概念見出し、共有ファイルに付加されるメタデータ等がある(図4(b)参照)。
上記のアクセスログは、「アクセス日時」の順にリスト構造でファイルサーバ111の記憶装置214の中に保存されている。なお、アクセスログのフォーマットは、図4に示したもの以外のフォーマットとすることも可能である。
印刷ログは、図5のようなフォーマットで記録される。すなわち、図5に示したように、印刷ログは、「印刷日時」、「ファイル名」、「ユーザ名」、「ドメイン」、「ファイルの特徴要素」、及び「印刷レイアウト」の各データ項目を有している。これらデータ項目のうち、「ファイル名」、「ユーザ名」、「ドメイン」、「ファイルの特徴要素」は、記録する契機が「アクセス」、「印刷」とで相違するだけで、データ項目としてはアクセスログの場合と同様であるので、その説明は省略する。
「印刷日時」は、クライアントPC113等がファイルサーバ111上の共有ファイルを印刷した日時を示すデータ項目である。「印刷レイアウト」は、当該共有ファイルを印刷する際に設定された印刷のレイアウト情報を示すデータ項目である。
上記の印刷ログは、「印刷日時」の順にリスト構造でファイルサーバ111の記憶装置214の中に保存されている。なお、印刷ログのフォーマットは、図5に示したもの以外のフォーマットとすることも可能である。
次に、MFP112等の構成を図6、図7に基づいて説明する。図6は、MFP112等の概観図である。MFP112等は、スキャナ部にて読取った画像データをプリンタ部でプリントするコピー機能や、外部装置から出力された印刷データをプリント部でプリントするプリント機能等の複数の機能を持った画像形成装置である。図6に示したように、MFP112等は、ADF(オートドキュメントフィーダ)601、操作パネル602、マルチ手差しトレイ603、サイドペーパーデッキ604、カセットペーパーデッキ605、及びフィニッシャ606を有している。
ADF601は、原稿を原稿読取位置(原稿台ガラス上)に自動的に給送する。操作パネル602は、液晶タッチパネル等により構成され、各種設定や調整、機器状況の確認などを行うために利用される。マルチ手差しトレイ603は、特殊な用途を持った用紙などを手差しでセットするために利用される。サイドペーパーデッキ604には、大量の印刷用紙を保管することができる。カセットペーパーデッキ605は、様々なサイズの印刷用紙を各段に分けて保持することができる。画像形成処理時には、このカセットペーパーデッキ605から印刷用紙が自動的にピックアップされて転写部等に搬送されていく。フィニッシャ606は、ステイプル処理、パンチ処理、製本処理など様々なフィニッシング処理を行う。
図7は、MFP112等の内部構成を示すブロック図である。MFP112等は、基本的にはコンピュータにより構成されている。すなわち、MFP112は、複数のジョブのデータを記憶可能なハードディスク等のメモリ(図示省略)、CPU715、RAM(主記憶装置)717、及びROM718を有している。CPU715は、ROM718やハードディスクに格納されているプログラムをRAM717に読出して展開し、順次実行することで複写機能、コピー機能、FAX機能等の各種の機能を実現する。
MFP112等は、スキャナ部701、FAX部702、NIC(Network Interface Card)部703、専用I/F(インタフェース)部704、USB(Universal Serial Bus) I/F部705を有している。この他、MFP112等は、操作制御部706、RIP部707、出力画像処理部708、MFP制御部709、プリンタ部710、後処理部711、圧縮伸張部712、文書管理部713、及びリソース管理部714を有している。
スキャナ部701は、スキャナ(図示省略)にて原稿上の画像を光学的に読取って、電気的な画像データに変換してMFP制御部709に入力する。FAX部702は、MFP制御部709の制御の下に、電話回線を利用して画像データを送受信する。NIC部703は、MFP制御部709の制御の下に、ネットワークを利用してコンピュータ等の外部装置との間で画像データや装置情報を送受信する。専用I/F部704は、MFP制御部709の制御の下に、外部装置との間で画像データなどの情報を交換する。USB I/F部705は、MFP制御部709の制御の下に、USBメモリ(リムーバブルメディアの一種)に代表されるUSB機器との間で画像データ等を送受信する。
MFP制御部709は、当該MFP112等が実行しようとしている機能に応じて画像データを一時保存したり、伝送経路を決定したりするといった交通整理の役割を担っている。文書管理部713は、MFP制御部709の制御の下に、スキャナ部701、NIC部703等からの画像データを文書ファイルとしてハードディスク等に格納する。また、文書管理部713は、MFP制御部709の制御の下に、ハードディスクから画像データを読出して、プリンタ部710に転送して印刷させたり、コンピュータ、他の画像形成装置等の外部装置に転送させたりする。
圧縮伸張部712は、MFP制御部709の制御の下に、文書管理部713によりハードディスク等に格納される画像データを圧縮する。また、圧縮伸張部712は、MFP制御部709の制御の下に、文書管理部713によりハードディスク等から読出される画像データを伸張する。この場合、圧縮伸張部712は、JPEG、JBIG、ZIPなどの各種の圧縮方式で画像データを圧縮し、その圧縮データを伸張することができる。
リソース管理部714は、MFP制御部709の制御の下に、フォント、カラープロファイル、ガンマ補正値などの各画像データ間で共通に扱われる各種パラメータを登録したテーブルをハードディスク等に格納する。また、リソース管理部714は、MFP制御部709の制御の下に、上記の各種のパラメータを読出す。
MFP制御部709は、PDLデータが入力された場合には、RIP部707により、RIP(Raster Image Processor)処理を施し、ラスタ(走査線)イメージデータを生成する。また、MFP制御部709は、出力画像処理部708により、プリントする画像データに対して、必要に応じてプリントのための画像処理を行う。更に、MFP制御部709は、これらRIP処理、画像処理の際に作られる画像データの中間データやプリントレディデータ(ラスタイメージデータやその圧縮データ)を、必要に応じて、文書管理部713により再度ハードディスク等に格納する。
プリンタ部710は、MFP制御部709の制御の下に、RIP処理、画像処理が施された画像データに基づいて、例えば電子写真方式で印刷処理を行う。後処理部711は、プリンタ部710でプリントアウトされたシートについて、仕分け処理、ステイプル処理等の後処理を行う。
MFP制御部709は、画像データの入出力に係る一連の処理を円滑に遂行する役割を担っており、MFPの使い方に応じて、以下のようにパス切り替えを行う。但し、中間データとして画像データを必要に応じて保存することは一般に知られているが、ここでは文書管理部713が始点、終点になる以外のアクセスは表記しない。また、必要に応じて利用される圧縮伸張部712と後処理部711、或いは処理全体のコアとなるMFP制御部709などの処理は省略して、おおよそのフローがわかるように記載する。
A)複写機能:入力画像処理部→出力画像処理部→プリンタ部
B)FAX送信機能:入力画像処理部→FAX部
C)FAX受信機能:FAX部→出力画像処理部→プリンタ部
D)ネットワークスキャン:入力画像処理部→NIC部
E)ネットワークプリント:NIC部→RIP部→出力画像処理部→プリンタ部
F)外部装置へのスキャン:入力画像処理部→専用I/F部
G)外部装置からのプリント:専用I/F部→出力画像処理部→プリンタ部
H)外部メモリへのスキャン:入力画像処理部→USB I/F部
I)外部メモリからのプリント:USB I/F部→RIP部→出力画像処理部→プリンタ部
J)ボックススキャン機能:入力画像処理部→出力画像処理部→文書管理部
K)ボックスプリント機能:文書管理部→プリンタ部
L)ボックス受信機能:NIC部→RIP部→出力画像処理部→文書管理部
M)ボックス送信機能:文書管理部→NIC部
N)プレビュー機能:文書管理部→操作部
上記以外にも、E−mailサービスやWebサーバ機能を初めとして、様々な機能との組み合わせが考えられる。
なお、ボックススキャン、ボックスプリント、ボックス受信、或いはボックス送信は、いずれも、文書管理部713が、メモリ(ハードディスク)の記憶領域を分割してジョブ毎、又はユーザ毎に割当てて画像データを管理する機能である。
操作部706は、各種の入力キーの他に表示部を有し、上記のような処理や機能を選択したり各種の指令を指示したりするために利用される。操作部706の表示部には、文書管理部713で管理されている画像データを印刷等のために予め表示させることができる。
次に、ファイルサーバ111によるファイルの新規登録処理を、図8に基づいて説明する。なお、図8の処理は、ファイルサーバ111のCPU211により行なわれるものであるが、以下の説明では、動作主体がファイルサーバ111であるものとしている(後述する図9〜図18の各処理の場合も同様)。
ファイルサーバ111は、クライアントPC113等からのファイル登録要求を待っている(ステップS801)。ファイルサーバ111は、クライアントPC113等からファイル登録要求があると、ファイル内容解析部301を用いて、その登録要求と共に送信されたファイルの内容を解析し、当該ファイルの特徴要素を抽出する(ステップS802)。このファイルの特徴要素の抽出処理の具体例は、図9、図10、図11に基づいて後述する。
次に、ファイルサーバ111は、抽出したファイルの特徴要素をDB部302により登録する(ステップS803)。この場合、ファイル名をキーにしてファイルの特徴要素を登録する。これにより、ファイル名をキーにして特徴要素を検索することができる。
次に、ファイルサーバ111は、必要に応じて、登録要求に係るファイルをキャッシュサーバ121等にコピー登録、即ち、登録するファイルの複製をキャッシュサーバに送信し、登録させる(ステップS804)。このコピー登録処理は、図12のフローチャートに基づいて行われる。次に、ファイルサーバ111は、必要に応じて、登録要求に係るファイルを印刷装置としてのMFP112等にコピー登録する(ステップS805)。このコピー登録処理は、図14のフローチャートに基づいて、図7に示した文書管理部713により行なわれる。
次に、ファイルサーバ111は、登録要求に係るファイルを記憶装置214に保存(登録)して(ステップS806)、本新規登録処理を終了する。
次に、図8のステップS802のファイルの特徴要素の抽出処理の具体例を、図9、図10、図11に基づいて説明する。これら図9、図10、図11の例は、ファイルの特徴要素として、それぞれキーワード、概念見出し、重要画像の特徴を抽出するものである。
まず、図9に基づいて、ファイルの特徴要素としてキーワードを抽出する場合を説明する。ファイルサーバ111は、登録要求に係るファイル(文書データ)の文章を単語単位に区切る(ステップS901)。次に、ファイルサーバ111は、単語毎に出現回数をカウントする(ステップS902)。そして、ファイルサーバ111は、単語を出現回数順に並び替えてランク付けし、さらに当該文書に出現した単語の種類の総数で出現回数を正規化した値を各単語に付与する(ステップS903)。
次に、ファイルサーバ111は、各単語について、ランク付けされた当該単語の出現回数の順位と正規化値の差を求める(ステップS904)。そして、ファイルサーバ111は、ステップS904で求めた差が閾値以上であり、当該単語の出現頻度が誤差の範囲を越える程に高い場合には、当該単語をキーワードとして抽出し記録する(ステップS905、S906)。
次に、図10に基づいて、ファイルの特徴要素として、キーワードの上位概念である概念見出しを抽出する場合を説明する。ファイルサーバ111は、辞書作成用の文書から、形態素解析などによって予め単語を切り出す(ステップS1001)。次に、ファイルサーバ111は、切り出した各単語に基本となるベクトル(基本ベクトル)を付与する(ステップS1002)。
次に、ファイルサーバ111は、基本ベクトルに基づいて辞書機能をなすベクトル群(ステムベクトル)を生成する(ステップS1003)。次に、ファイルサーバ111は、ステップS1003で生成したステムベクトルに基づいて、登録要求に係るファイル(文書)全体のベクトルを決定する(ステップS1004)。そして、ファイルサーバ111は、登録要求に係るファイル(文書)から当該文書の文書ベクトルを生成し、この文書ベクトルを概念見出しとして記録する(ステップS1005)。
次に、図11に基づいて、ファイルの特徴要素として、重要画像の特徴を抽出する場合を説明する。ファイルサーバ111は、登録要求に係るファイル(文書)に含まれる画像の領域を読み込む(ステップS1101)。次に、ファイルサーバ111は、この画像を複数のブロックに分割する(ステップS1102)。
次に、ファイルサーバ111は、ステップS1102で得られた各ブロックの画像に対して、定められた画像特徴量計算処理を行い、多次元特徴量空間上のどのセルに属するかを求め、対応するラベルを求める(ステップS1103)。この処理を全てのブロックに対して行う。すなわち、ファイルサーバ111は、分割に係る画像ブロックに対して、それぞれ、全ての画素がどの色セルに属するかの計算処理を行い、最も頻度の多い色セルのラベルをその画像ブロックのパラメータラベル(カラーラベル)として決定する。
次に、ファイルサーバ111は、各画像ブロックのカラーラベルのヒストグラム情報を取得する(ステップS1104)。次に、ファイルサーバ111は、当該画像の識別情報とステップS1104で得られたヒストグラム情報等の属性を対応付けて記録する(ステップS1105)。
なお、ファイルの特徴要素としては、ファイルと一緒に保存されるメタデータを抽出してもよい。このメタデータは、ファイルの特性を示す情報、例えば作成者名や日付やファイルの内容を表す情報(キーワードなど)が該当し、ファイル作成の過程でXMLなどの形式でファイルに付与されるものである。このメタデータがファイルに付与されている場合は、図8のステップS802では、メタデータ中のファイルの内容を表す要素(キーワードなど)を抽出すればよい。
次に、図8のステップS804におけるコピー登録処理を、図12のフローチャートに基づいて詳細に説明する。
ファイルサーバ111は、記憶装置214に保存されているアクセスログを分析すべく、RAM209に展開する(ステップS1201)。このアクセスログは、図4に示すように、アクセス日時順にリスト状に記録されている。従って、ファイルサーバ111は、全てのアクセスログについて、リストの先頭から順番にループLS1−LE1に係るステップS1202〜S1207の処理を行う。
すなわち、ファイルサーバ111は、現在着目しているアクセスログ中のファイルの特徴要素と、図8のステップS802で抽出された登録要求に係るファイルの特徴要素を比較する(ステップS1202)。そして、ファイルサーバ111は、両者の特徴要素の類似度が閾値以上であるか否かを判別する(ステップS1203)。この判別処理では、ファイルの特徴要素がキーワードの場合は、現在着目しているアクセスログ中のキーワードと登録要求に係るファイルのキーワードを比較し、一致するキーワードが多いほど類似度が高いと判別される。
この類似度を求める手法は、最も単純な一例を示したものに過ぎず、他の各種の手法で類似度を求めることができる。例えば、キーワードを利用して類似度を求める手法としては、ベクトル空間法による類似度算出法なども広く知られており、その他にも様々な手法が存在する。
また、ファイルの特徴要素が概念見出しである場合は、概念検索による類似度の算出を行うことができる。例えば、図10に示す方法で抽出された文書ベクトル群を概念見出しとして記録した場合は、図13に示したような形態で類似度が判定される。すなわち、アクセスログ中のファイルの特徴要素(概念見出し:サーバ管理文書に係る文書ベクトル群)と、登録要求に係るファイル(文書)に係る文書ベクトル群との内積を演算し、内積値が高いほど類似度が高いと判定される。
また、ファイルの特徴要素がファイルに含まれる画像の特徴である場合は、画像の特徴を比較し類似度を算出する。例えば、図11に示す方法で画像の特徴要素としてヒストグラム情報を記録した場合は、この記録に係るヒストグラム情報とアクセスログ中のファイルの特徴要素(ヒストグラム情報)とを比較して類似度を算出する。また、ファイルの特徴要素がメタデータである場合は、メタデータに含まれる情報により類似度の算出方法が異なるが、例えばキーワードであった場合は、前述のキーワードによる類似度算出が行われる。
ファイルサーバ111は、ステップS1203にて、特徴要素の類似度が閾値以上であると判別した場合は、現在着目しているアクセスログからドメインを読み出す(ステップS1204)。次に、ファイルサーバ111は、読み出したドメインに対応するカウンタ(カウンタ変数)がRAM213内に存在するか否かを判別する(ステップS1205)。その結果、カウンタが存在しなければ、ファイルサーバ111は、当該ドメイン用のカウンタをRAM213内に新規に作成して(ステップS1206)、そのカウンタをインクリメントする(ステップS1207)。一方、読み出したドメインに対応するカウンタが存在する場合は、そのカウンタをインクリメント(プラス1)する(ステップS1207)。
以上のループLS1−LE1に係る処理により、ドメイン毎のカウンタ値により、登録要求に係るファイルと類似度の高いファイルに対して、各ドメインに属するクライアントPC113等からのアクセス回数を把握することができる。なお、ループLS1−LE1に係る処理は、新規登録に係るファイルとの類似度が高い既登録に係るファイルを探索していることを意味する。
次に、ファイルサーバ111は、全てのドメインについて、ループLS2−LE2に係るステップS1208〜S1209の処理を行う。
すなわち、ファイルサーバ111は、現在着目しているドメインに係るカウンタの値が閾値以上である場合は(ステップS1208)、当該ドメインに存在するキャッシュサーバ121又は131に、登録要求に係るファイルをコピー登録する(ステップS1209)。
以上のコピー登録処理により、今回の登録要求に係るファイルと類似度の高い既存の登録ファイルに対するアクセス回数が閾値以上のドメインが存在する場合は、そのドメインに属するキャッシュサーバにも今回の登録要求に係るファイルがコピー登録される。
次に、図8のステップS805におけるコピー登録処理を、図14のフローチャートに基づいて詳細に説明する。
ファイルサーバ111は、記憶装置214に保存されている印刷ログを分析すべく、RAM209に展開する(ステップS1401)。この印刷ログは、図5に示すように、印刷日時順にリスト状に記録されている。従って、ファイルサーバ111は、全ての印刷ログについて、リストの先頭から順番にループLS3−LE3に係るステップS1402〜S1407の処理を行う。
すなわち、ファイルサーバ111は、現在着目している印刷ログ中のファイルの特徴要素と、図8のステップS802で抽出された登録要求に係るファイルの特徴要素を比較する(ステップS1402)。そして、ファイルサーバ111は、両者の特徴要素の類似度が閾値以上であるか否かを判別する(ステップS1403)。この判別処理では、ファイルの特徴要素がキーワードの場合は、現在着目している印刷ログ中のキーワードと登録要求に係るファイルのキーワードを比較し、一致するキーワードが多いほど類似度が高いと判別される。この類似度を求める手法は、最も単純な一例を示したものに過ぎず、前述のような各種の手法で類似度を求めることができる。
ファイルサーバ111は、ステップS1403にて、特徴要素の類似度が閾値以上であると判別した場合は、現在着目している印刷ログからドメインを読み出す(ステップS1404)。次に、ファイルサーバ111は、読み出したドメインに対応するカウンタ(カウンタ変数)がRAM213内に存在するか否かを判別する(ステップS1405)。その結果、カウンタが存在しなければ、ファイルサーバ111は、当該ドメイン用のカウンタをRAM213内に新規に作成して(ステップS1406)、そのカウンタをインクリメントする(ステップS1407)。一方、読み出したドメインに対応するカウンタが存在する場合は、そのカウンタをインクリメント(プラス1)する(ステップS1407)。
以上のループLS3−LE3に係る処理により、ドメイン毎のカウンタ値により、登録要求に係るファイルと類似度の高いファイルに対して、各ドメインに属するクライアントPC113等からアクセス回数(ここでは、印刷回数)を把握することができる。
次に、ファイルサーバ111は、全てのドメインについて、ループLS4−LE4に係るステップS1408〜S1409の処理を行う。
すなわち、ファイルサーバ111は、現在着目しているドメインに係るカウンタの値が閾値以上である場合は(ステップS1408)、当該ドメインに存在するMFP122又は132に、登録要求に係るファイルをコピー登録する(ステップS1409)。MFP122や132が文書管理部713に記憶するファイルは、プリンタ部での印刷処理を高速で行うのに適した画像フォーマットで記憶されている。従って、ステップS1409では、ファイルサーバ111がMFP122や132に登録するのに適した画像フォーマットに変換したファイルをコピー登録するようにしても良い。もちろん、画像フォーマットの変換をMFP122や132で行っても構わない。
以上のコピー登録処理により、今回の登録要求に係るファイルと類似度の高い既存の登録ファイルに対するアクセス数が閾値以上のドメインが存在する場合は、そのドメインに属するキャッシュサーバにも今回の登録要求に係るファイルがコピー登録(キャッシング)される。これにより、用途として印刷出力される頻度、即ち印刷頻度が多いファイルはMFP122や132内に登録することによって、印刷出力をより効率的に行うことが可能になる。
次に、クライアントPC113等からアクセス要求(ファイル読み出し要求)を受けた場合のファイルサーバ111の処理を、図15のフローチャートに基づいて説明する。
ファイルサーバ111は、クライアントPC113からアクセス要求(ファイル読み出し要求)を受けると(ステップS1501)、図4に示すフォーマットでアクセスログを記録(更新)する(ステップS1502)。
この場合、アクセス日時については、クライアントPC113等がファイルサーバ111に対してアクセス要求を行なった日時を記録する。ファイル名については、クライアントPC113等がアクセス要求してきたファイルのファイル名を記録する。ユーザ名については、ファイルアクセスを行なったユーザのアカウント名を記録する。ドメインについては、ネットワークのサブネット情報、又はファイルアクセス時にパラメータとして渡ってくる情報などクライアントPC113等が属するドメインを表す情報を記録する。ファイルの特徴要素については、アクセス要求に係るファイルのファイル名をキーにしてDB部302を検索し、その検索したファイル名に対応付けられた特徴要素を記録する。
次に、ファイルサーバ111は、ステップS1502でのアクセスログの更新処理によって新規にキャッシュサーバ121等にコピー登録すべきファイルが発生したか否かを判別する(ステップS1503)。このステップS1503の処理の詳細は、図16に基づいて後述する。
次に、ファイルサーバ111は、今回のアクセス要求に係るファイルが、当該アクセス要求を行なったクライアントPCが属するドメインに存在するキャッシュサーバに存在するか否かを判別する(ステップS1504)。
その結果、キャッシュサーバに存在する場合は、ファイルサーバ111は、そのキャッシュサーバから今回のアクセス要求に係るファイルを取得するように当該アクセス要求を行なったクライアントPCに指示する(ステップS1505)。この場合、指示されたクライアントPCは、キャッシュサーバからファイルを取得することにより、物理的に離れた場所にあるファイルサーバ111からファイルを取得する場合よりも高速にファイルを取得することができる。
一方、キャッシュサーバに存在しない場合は、ファイルサーバ111は、そのファイルサーバ111上の記憶装置214から今回のアクセス要求に係るファイルを取得するように当該アクセス要求を行なったクライアントPCに指示する(ステップS1506)。
次に、図15のステップS1503の処理の詳細を、図16のフローチャートに基づいて説明する。
ファイルサーバ111は、今回のアクセス要求に係るクライアントPCが属するドメインを、RAM213上に準備した変数に記憶する(ステップS1601)。このドメインは、図15のステップS1502でアクセスログに記録したものと同一の情報である。
次に、ファイルサーバ111は、今回のアクセス要求に係るファイルが、当該アクセス要求を行なったクライアントPCが属するドメインに存在するキャッシュサーバ121又は131にコピー登録済みであるか否かを判別する(ステップS1602)。その結果、コピー登録済みであれば、ファイルサーバ111は、そのまま終了する。
一方、コピー登録済みでなければ、ファイルサーバ111は、全てのアクセスログについて、ループLS5−LE5に係るステップS1603〜S1605の処理を行う。すなわち、ファイルサーバ111は、現在着目しているアクセスログ中のドメインと今回のアクセス要求に係るクライアントPC113等が属するドメインが同一であるか否かを判別する(ステップS1603)。
その結果、ドメインが同一であれば、ファイルサーバ111は、現在着目しているアクセスログ中のファイルと今回のアクセス要求に係るファイルが同じであるか否かを判別する(ステップS1604)。その結果、ファイルが同一であれば、当該ファイルに係るアクセスカウンタをインクリメント(プラス1)する(ステップS1605)。
そして、ファイルサーバ111は、ループLS5−LE5の処理が終ると、上記のアクセスカウンタの値が閾値以上となったか否かを判別する(ステップS1606)。その結果、上記のアクセスカウンタの値が閾値以上となった場合は、ファイルサーバ111は、当該アクセスカウンタに係るファイルを、当該ドメインに存在するキャッシュサーバ121又は131にコピー登録する(ステップS1607)。一方、上記のアクセスカウンタの値が閾値未満の場合は、ファイルサーバ111は、上記のコピー登録、すなわちキャッシングを行なうことなく、終了する。
次に、クライアントPC113等からアクセス要求(ここでは、印刷要求)を受けた場合のファイルサーバ111の処理を、図17のフローチャートに基づいて説明する。
ファイルサーバ111は、クライアントPC113からアクセス要求(印刷要求)を受けると(ステップS1701)、図5に示すフォーマットで印刷ログを記録(更新)する(ステップS1702)。
この場合、印刷日時については、クライアントPC113等がファイルサーバ111に対して印刷要求を行なった日時を記録する。ファイル名については、クライアントPC113等が印刷要求してきたファイルのファイル名を記録する。ユーザ名については、印刷要求を行なったユーザのアカウント名を記録する。ドメインについては、ネットワークのサブネット情報、又は印刷要求時にパラメータとして渡ってくる情報などクライアントPC113等が属するドメインを表す情報を記録する。ファイルの特徴要素については、印刷要求に係るファイルのファイル名をキーにしてDB部302を検索し、その検索したファイル名に対応付けられた特徴要素を記録する。
次に、ファイルサーバ111は、ステップS1702での印刷ログの更新処理によって新規に印刷装置(MFP122又は132)にコピー登録すべきファイルが発生したか否かを判別する(ステップS1703)。このステップS1703の処理の詳細は、図18に基づいて後述する。
次に、ファイルサーバ111は、今回の印刷要求に係るファイルが、当該印刷要求を行なったクライアントPCが属するドメインに存在する印刷装置(MFP122又は132)に存在するか否かを判別する(ステップS1704)。その結果、今回の印刷要求に係るファイルが上記の印刷装置に存在する場合は、ファイルサーバ111は、その印刷装置から今回の印刷要求に係るファイルを取得して印刷するように当該印刷要求を行なったクライアントPCに指示する(ステップS1705)。
一方、今回の印刷要求に係るファイルが上記の印刷装置に存在しない場合は、ファイルサーバ111は、当該ファイルがキャッシュサーバに存在するか否かを判別する(ステップS1706)。その結果、今回の印刷要求に係るファイルがキャッシュサーバに存在する場合は、ファイルサーバ111は、そのキャッシュサーバから今回の印刷要求に係るファイルを取得して印刷するように当該印刷要求を行なったクライアントPCに指示する(ステップS1707)。
以上のように、印刷装置、又はキャッシュサーバから印刷要求に係るファイルを取得することにより、物理的に離れた場所にあるファイルサーバ111から印刷要求に係るファイルを取得する場合よりも高速に取得することができる。
一方、今回の印刷要求に係るファイルがキャッシュサーバに存在しない場合は、ファイルサーバ111は、そのファイルサーバ111上の記憶装置214から今回の印刷要求に係るファイルを取得するように当該アクセス要求を行なったクライアントPCに指示する(ステップS1708)。
次に、図17のステップS1703の処理の詳細を、図18のフローチャートに基づいて説明する。
ファイルサーバ111は、今回のアクセス要求(ここでは、印刷要求)に係るクライアントPCが属するドメインを、RAM213上に準備した変数に記憶する(ステップS1801)。このドメインは、図17のステップS1702で印刷ログに記録したものと同一の情報である。
次に、ファイルサーバ111は、今回の印刷要求に係るファイルが、当該印刷要求を行なったクライアントPCが属するドメインに存在するMFP122又は132にコピー登録済みであるか否かを判別する(ステップS1802)。その結果、コピー登録済(キャッシング済み)みであれば、ファイルサーバ111は、そのまま終了する。
一方、コピー登録済み(キャッシング済み)でなければ、ファイルサーバ111は、全ての印刷ログについて、ループLS6−LE6に係るステップS1803〜S1805の処理を行う。すなわち、ファイルサーバ111は、現在着目している印刷ログ中のドメインと今回の印刷要求に係るクライアントPC113等が属するドメインが同一であるか否かを判別する(ステップS1803)。
その結果、ドメインが同一であれば、ファイルサーバ111は、現在着目している印刷ログ中のファイルと今回の印刷要求に係るファイルが同一であるか否かを判別する(ステップS1804)。その結果、ファイルが同一であれば、当該ファイルに係る印刷カウンタをインクリメント(プラス1)する(ステップS1805)。
そして、ファイルサーバ111は、ループLS6−LE6の処理が終ると、上記の印刷ウンタの値が閾値以上となったか否かを判別する(ステップS1806)。その結果、上記の印刷カウンタの値が閾値以上となった場合は、ファイルサーバ111は、当該印刷カウンタに係るファイルを、当該ドメインに存在するMFP122又は132にコピー登録する(ステップS1807)。一方、上記の印刷カウンタの値が閾値未満の場合は、ファイルサーバ111は、上記のコピー登録、すなわちキャッシングを行なうことなく、終了する。
なお、本発明の目的は、上述した実施の形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体によっても達成される。すなわち、この記憶媒体を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)が記憶媒体に格納されたプログラムコードを読出して実行することによって達成される。
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施の形態の機能を実現することになり、そのプログラムコード及び該プログラムコードを記憶した記憶媒体は本発明を構成することになる。
また、プログラムコードを供給するための記憶媒体としては、次のものを用いることができる。例えば、フロッピー(登録商標)ディスク、ハードディスク、光磁気ディスク等を用いることができる。また、CD−ROM、CD−R、CD−RW、DVD−ROM、DVD−RAM、DVD−RW、DVD+RW等の光ディスク、磁気テープ、不揮発性のメモリカード、ROM等を用いることができる。または、プログラムコードをネットワークを介してダウンロードしてもよい。
また、本発明は、コンピュータが読出したプログラムコードを実行することにより、上記の実施の形態の機能が実現される場合だけに限定されるものではない。その他、例えば、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施の形態の機能が実現される場合も含まれる。
さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれることにより実施の形態の機能が実現される場合も含まれる。この場合、当該書込みの後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行うこととなる。
本発明の実施の形態に係るファイル管理システムシステムの概略構成を示すシステム構成図である。 ファイルサーバのハードウェアの構成例を示すブロック図である。 ファイルサーバの機能を示すブロック図である。 アクセスログのフォーマットを示す概念図である。 印刷ログのフォーマットを示す概念図である。 MFP(印刷装置)の外観図である。 MFPの内部構成を示すブロック図である。 ファイルの新規登録処理を示すフローチャートである。 図8のステップS802のファイルの特徴要素の抽出処理の具体例を示すフローチャートである。 図8のステップS802のファイルの特徴要素の抽出処理の他の具体例を示すフローチャートである。 図8のステップS802のファイルの特徴要素の抽出処理の更に他の具体例を示すフローチャートである。 図8のステップS804のコピー登録処理の詳細を示すフローチャートである。 概念検索処理を示す概念図である。 図8のステップS805のコピー登録処理の詳細を示すフローチャートである。 クライアントPCからアクセス要求を受けた場合のファイルサーバの処理を示すフローチャートである。 図15のステップS1503の処理の詳細を示すフローチャートである。 クライアントPCから印刷要求を受けた場合のファイルサーバの処理を示すフローチャートである。 図17のステップS1703の処理の詳細を示すフローチャートである。
符号の説明
100…広域インターネット
110,120,130…ローカルエリアネットワーク
111…ファイルサーバ
112,122,132…MFP(複合機)
113,114,115,123,124,133,134…クライアントPC
121,131…キャッシュサーバ
301…ファイル内容解析部
302…DB部
303…アクセスログ記録部
304…印刷ログ記録部

Claims (11)

  1. 複数のクライアント端末により共有されるファイルを登録するファイル管理装置であって、
    当該ファイル管理装置に登録されたファイルに対する前記クライアント端末からのアクセス状況を当該ファイルの特徴要素と対応付けて記録する記録手段と、
    当該ファイル管理装置に新規に登録されるファイルの特徴要素を抽出する抽出手段と、
    前記抽出手段により抽出された特徴要素と前記記録手段により記録された特徴要素を用いて、新規登録に係るファイルとの類似度が所定の閾値以上の既登録に係るファイルを探索する探索手段と、
    前記探索手段により探索された既登録に係るファイルに対するアクセス頻度が所定の閾値以上のドメインに属する特定の機器に対して、新規登録に係るファイルの複製を配信して前記ファイルの複製を登録させる配信手段と、
    を有することを特徴とするファイル管理装置。
  2. 前記記録手段は、前記アクセス状況として、前記ファイル管理装置に登録されたファイルに対する前記クライアント端末からの読出し処理の履歴を記録することを特徴とする請求項1に記載のファイル管理装置。
  3. 前記読出し処理の履歴には、前記ファイル管理装置に登録されたファイルに対する前記クライアント端末からの印刷要求に伴って実行される読出し処理の履歴を含むことを特徴とする請求項2に記載のファイル管理装置。
  4. 前記ファイルの特徴要素は、ファイルに含まれるキーワードであることを特徴とする請求項1に記載のファイル管理装置。
  5. 前記ファイルの特徴要素は、概念見出しであることを特徴とする請求項1に記載のファイル管理装置。
  6. 前記ファイルの特徴要素は、ファイルに含まれる画像の特徴であることを特徴とする請求項1に記載のファイル管理装置。
  7. 前記ファイルの特徴要素は、ファイルの内容を表すメタデータであることを特徴とする請求項1に記載のファイル管理装置。
  8. 前記配信手段は、前記ファイル管理装置に登録されたファイルの複製を登録するキャッシュサーバに対して前記ファイルの複製を配信することを特徴とする請求項1に記載のファイル管理装置。
  9. 前記配信手段は更に、前記探索手段により探索された既登録に係るファイルに対する印刷頻度が所定の閾値以上のドメインに属する画像形成装置に対して前記ファイルの複製を配信することを特徴とする請求項1に記載のファイル管理装置。
  10. 複数のクライアント端末により共有されるファイルを管理するファイル管理装置におけるファイル管理方法であって、
    当該ファイル管理装置に登録されたファイルに対する前記クライアント端末からのアクセス状況を当該ファイルの特徴要素と対応付けて記録する記録工程と、
    当該ファイル管理装置に新規に登録されるファイルの特徴要素を抽出する抽出工程と、
    前記抽出工程により抽出された特徴要素と前記記録工程により記録された特徴要素を用いて、新規登録に係るファイルとの類似度が所定の閾値以上の既登録に係るファイルを探索する探索工程と、
    前記探索工程により探索された既登録に係るファイルに対するアクセス頻度が所定の閾値以上のドメインに属する特定の機器に対して、新規登録に係るファイルの複製を配信して、前記ファイルの複製を登録させる配信工程、
    を有することを特徴とするファイル管理方法。
  11. 複数のクライアント端末により共有されるファイルを登録するファイル管理装置を、当該ファイル管理装置に登録されたファイルに対する前記クライアント端末からのアクセス状況を当該ファイルの特徴要素と対応付けて記録する記録手段と、
    当該ファイル管理装置に新規に登録されるファイルの特徴要素を抽出する抽出手段と、
    前記抽出手段により抽出された特徴要素と前記記録手段により記録された特徴要素を用いて、新規登録に係るファイルとの類似度が所定の閾値以上の既登録に係るファイルを探索する探索手段と、
    前記探索手段により探索された既登録に係るファイルに対するアクセス頻度が所定の閾値以上のドメインに属する特定の機器に対して、新規登録に係るファイルの複製を配信して前記ファイルの複製を登録させる配信手段と、
    して機能させるためのコンピュータが読み取り可能なプログラム。
JP2008027802A 2008-02-07 2008-02-07 ファイル管理装置、ファイル管理方法、及びプログラム Pending JP2009187376A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008027802A JP2009187376A (ja) 2008-02-07 2008-02-07 ファイル管理装置、ファイル管理方法、及びプログラム
US12/365,701 US20090204606A1 (en) 2008-02-07 2009-02-04 File management system, file management method, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008027802A JP2009187376A (ja) 2008-02-07 2008-02-07 ファイル管理装置、ファイル管理方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2009187376A true JP2009187376A (ja) 2009-08-20
JP2009187376A5 JP2009187376A5 (ja) 2011-03-24

Family

ID=40939775

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008027802A Pending JP2009187376A (ja) 2008-02-07 2008-02-07 ファイル管理装置、ファイル管理方法、及びプログラム

Country Status (2)

Country Link
US (1) US20090204606A1 (ja)
JP (1) JP2009187376A (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5284685B2 (ja) * 2008-05-16 2013-09-11 インターナショナル・ビジネス・マシーンズ・コーポレーション ファイルの再配置装置、再配置方法、及び再配置プログラム
CN101729442B (zh) * 2008-10-23 2013-03-20 华为技术有限公司 一种实现内容共享的方法和装置
EP2354975B1 (en) * 2010-02-09 2013-04-10 ExB Asset Management GmbH Automatic association of informational entities
EP2695047B1 (en) * 2011-04-04 2019-07-03 BlackBerry Limited Document management system using printer emulation
US8868839B1 (en) * 2011-04-07 2014-10-21 Symantec Corporation Systems and methods for caching data blocks associated with frequently accessed files
CN104133881B (zh) * 2014-07-25 2018-04-27 广东睿江云计算股份有限公司 一种调整文件缓存时间的方法与装置
CN104133880B (zh) * 2014-07-25 2018-04-20 广东睿江云计算股份有限公司 一种设置文件缓存时间的方法与装置
JP2018005509A (ja) * 2016-06-30 2018-01-11 キヤノン株式会社 情報処理装置、制御方法、及びプログラム
JP6890557B2 (ja) * 2018-01-17 2021-06-18 株式会社日立製作所 分析モデル作成システム、プログラミング装置および分析モデル作成方法

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07152778A (ja) * 1993-11-29 1995-06-16 Sanyo Electric Co Ltd 文書検索装置
JP2002041532A (ja) * 2000-07-25 2002-02-08 Ntt Docomo Inc 広告送信システム、通信システム、広告送信方法および通信料制御方法
JP2003030037A (ja) * 2001-07-19 2003-01-31 Nec Corp 事前予測処理システム及び方法
JP2003167907A (ja) * 2001-12-03 2003-06-13 Dainippon Printing Co Ltd 情報提供方法およびシステム
JP2004139366A (ja) * 2002-10-18 2004-05-13 Hitachi Ltd キャッシュ配置方法
JP2005316715A (ja) * 2004-04-28 2005-11-10 Fuji Xerox Co Ltd 文書管理システムおよび方法およびプログラム
JP2006081119A (ja) * 2004-09-13 2006-03-23 Canon Inc 画像処理装置、画像処理システムおよびその制御方法
JP2006113936A (ja) * 2004-10-18 2006-04-27 Media Fusion Co Ltd 特徴データ生成システムおよびその方法
JP2006168134A (ja) * 2004-12-15 2006-06-29 Canon Inc 印刷方法、印刷デバイス及び印刷システム
JP2006277097A (ja) * 2005-03-28 2006-10-12 Fuji Xerox Co Ltd 情報管理装置及び情報検索装置
JP2007128139A (ja) * 2005-11-01 2007-05-24 Fujifilm Corp データファイル送信システム及び画像管理サーバ並びにデータファイル複製プログラム
JP2007207049A (ja) * 2006-02-03 2007-08-16 Kyocera Mita Corp 文書管理装置
JP2007208340A (ja) * 2006-01-30 2007-08-16 Makani Networks Co Ltd コンテンツ管理システム、管理サーバ、コンテンツ管理方法、およびプログラム
JP2007293746A (ja) * 2006-04-27 2007-11-08 Hitachi Ltd ファイル管理システム、ファイル管理プログラム及びファイル管理方法
JP2008009729A (ja) * 2006-06-29 2008-01-17 Kddi Corp コンテンツ配信方法および装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS603056A (ja) * 1983-06-21 1985-01-09 Toshiba Corp 情報整理装置
JP3140621B2 (ja) * 1993-09-28 2001-03-05 株式会社日立製作所 分散ファイルシステム
JP2977476B2 (ja) * 1995-11-29 1999-11-15 株式会社日立製作所 機密保護方法
JP3113814B2 (ja) * 1996-04-17 2000-12-04 インターナショナル・ビジネス・マシーンズ・コーポレ−ション 情報検索方法及び情報検索装置
JPH10307846A (ja) * 1997-03-03 1998-11-17 Toshiba Corp ドキュメント情報管理システム、ドキュメント情報管理方法、及びドキュメント検索方法
US6400853B1 (en) * 1997-03-19 2002-06-04 Canon Kabushiki Kaisha Image retrieval apparatus and method
US7287214B1 (en) * 1999-12-10 2007-10-23 Books24X7.Com, Inc. System and method for providing a searchable library of electronic documents to a user
US6606659B1 (en) * 2000-01-28 2003-08-12 Websense, Inc. System and method for controlling access to internet sites
JP2002207632A (ja) * 2001-01-12 2002-07-26 Fujitsu Ltd 共有情報処理システムおよび記録媒体
US20030018621A1 (en) * 2001-06-29 2003-01-23 Donald Steiner Distributed information search in a networked environment
JP3948389B2 (ja) * 2002-10-24 2007-07-25 富士ゼロックス株式会社 通信分析装置
WO2005066837A1 (ja) * 2003-12-26 2005-07-21 Matsushita Electric Industrial Co., Ltd. 辞書作成装置および辞書作成方法
JP4700452B2 (ja) * 2005-09-16 2011-06-15 株式会社リコー 情報管理装置、情報管理方法、情報管理プログラムおよび記録媒体
US8479174B2 (en) * 2006-04-05 2013-07-02 Prevx Limited Method, computer program and computer for analyzing an executable computer file
JP4755556B2 (ja) * 2006-09-04 2011-08-24 クラリオン株式会社 車載装置
JP5029030B2 (ja) * 2007-01-22 2012-09-19 富士通株式会社 情報付与プログラム、情報付与装置、および情報付与方法
JP5305605B2 (ja) * 2007-03-16 2013-10-02 株式会社ソニー・コンピュータエンタテインメント データ処理装置、データ処理方法、及びデータ処理プログラム

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07152778A (ja) * 1993-11-29 1995-06-16 Sanyo Electric Co Ltd 文書検索装置
JP2002041532A (ja) * 2000-07-25 2002-02-08 Ntt Docomo Inc 広告送信システム、通信システム、広告送信方法および通信料制御方法
JP2003030037A (ja) * 2001-07-19 2003-01-31 Nec Corp 事前予測処理システム及び方法
JP2003167907A (ja) * 2001-12-03 2003-06-13 Dainippon Printing Co Ltd 情報提供方法およびシステム
JP2004139366A (ja) * 2002-10-18 2004-05-13 Hitachi Ltd キャッシュ配置方法
JP2005316715A (ja) * 2004-04-28 2005-11-10 Fuji Xerox Co Ltd 文書管理システムおよび方法およびプログラム
JP2006081119A (ja) * 2004-09-13 2006-03-23 Canon Inc 画像処理装置、画像処理システムおよびその制御方法
JP2006113936A (ja) * 2004-10-18 2006-04-27 Media Fusion Co Ltd 特徴データ生成システムおよびその方法
JP2006168134A (ja) * 2004-12-15 2006-06-29 Canon Inc 印刷方法、印刷デバイス及び印刷システム
JP2006277097A (ja) * 2005-03-28 2006-10-12 Fuji Xerox Co Ltd 情報管理装置及び情報検索装置
JP2007128139A (ja) * 2005-11-01 2007-05-24 Fujifilm Corp データファイル送信システム及び画像管理サーバ並びにデータファイル複製プログラム
JP2007208340A (ja) * 2006-01-30 2007-08-16 Makani Networks Co Ltd コンテンツ管理システム、管理サーバ、コンテンツ管理方法、およびプログラム
JP2007207049A (ja) * 2006-02-03 2007-08-16 Kyocera Mita Corp 文書管理装置
JP2007293746A (ja) * 2006-04-27 2007-11-08 Hitachi Ltd ファイル管理システム、ファイル管理プログラム及びファイル管理方法
JP2008009729A (ja) * 2006-06-29 2008-01-17 Kddi Corp コンテンツ配信方法および装置

Also Published As

Publication number Publication date
US20090204606A1 (en) 2009-08-13

Similar Documents

Publication Publication Date Title
JP2009187376A (ja) ファイル管理装置、ファイル管理方法、及びプログラム
US8326090B2 (en) Search apparatus and search method
US7475336B2 (en) Document information processing apparatus and document information processing program
KR101004906B1 (ko) 인쇄 시스템, 인쇄 시스템의 제어 방법, 및 기억 매체
CN101655870B (zh) 用于同步和跟踪内容的方法和设备
JP5057546B2 (ja) 文書検索装置および文書検索方法
US8310711B2 (en) Output device and its control method for managing and reusing a job history
JP2006120125A (ja) ドキュメント画像情報管理装置及びドキュメント画像情報管理プログラム
JP2002132547A (ja) 電子情報管理サーバ、電子情報管理クライアントおよび電子情報管理方法ならびに電子情報管理プログラムを記録したコンピュータ読み取り可能な記録媒体
US11137946B2 (en) Image processing apparatus, method for controlling the same and storage medium
US8150799B2 (en) Document management apparatus, document management method and computer readable storage medium
CN100570608C (zh) 文档检索系统、文档检索装置、文档检索方法、程序和存储介质
JP2008271534A (ja) 画像再生装置において実行されるコンテンツに基づくアカウンティング方法
JP4960796B2 (ja) 画像処理装置、画像処理方法ならびにそのプログラム及び記憶媒体
US8081335B2 (en) Image processing apparatus, image processing system, method for managing data in the image processing apparatus and computer program product
US11593386B2 (en) Information processing apparatus and non-transitory computer readable medium
US11223731B2 (en) Image processing apparatus, method for controlling the same and storage medium
US20140268220A1 (en) Pull Copying using Document-File Identifiers
US8712155B2 (en) Device for identifying types of document files
JP2008165386A (ja) 文書管理装置、文書管理方法、文書管理プログラム
JP2001256256A (ja) 電子文書検索装置および電子文書検索方法
JP2008020946A (ja) 画像ログ管理システム
JP2006285581A (ja) 文書管理装置
JP2006074123A (ja) 画像処理装置
JP2005352783A (ja) 画像処理システム、方法、プログラム及び記憶媒体

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110207

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110207

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130423

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130917