JP2013542475A - 情報処理装置 - Google Patents

情報処理装置 Download PDF

Info

Publication number
JP2013542475A
JP2013542475A JP2013520917A JP2013520917A JP2013542475A JP 2013542475 A JP2013542475 A JP 2013542475A JP 2013520917 A JP2013520917 A JP 2013520917A JP 2013520917 A JP2013520917 A JP 2013520917A JP 2013542475 A JP2013542475 A JP 2013542475A
Authority
JP
Japan
Prior art keywords
content
information
global identifier
server
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013520917A
Other languages
English (en)
Other versions
JP5548825B2 (ja
Inventor
恭男 渡辺
昇司 児玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JP2013542475A publication Critical patent/JP2013542475A/ja
Application granted granted Critical
Publication of JP5548825B2 publication Critical patent/JP5548825B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • G06F16/1824Distributed file systems implemented using Network-attached Storage [NAS] architecture
    • G06F16/1827Management specifically adapted to NAS
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/176Support for shared access to files; File sharing support

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

異なるフォーマットでコンテンツをファイルに格納する各アプリケーション・プログラムによりそれぞれ生成されたファイルに対して、変換プログラムを用いなくても統一的なアクセスを可能にする。
バックアップサーバが生成したバックアップカタログに基づき、コンテンツの識別子とコンテンツの格納位置との対応関係を保持するデータベースを生成し、このデータベースを用いてコンテンツへのアクセスを行う。コンテンツへのアクセスは、シングルネームスペースを介して、異なる複数のアプリケーション・プログラムのコンテンツに対して統一的に行う。

Description

本発明は、情報処理装置に関する。
今日、企業や官公庁、学校などの様々な事業体において、種々のアプリケーション・プログラムが活用されている。例えば、電子メールの授受をはじめ、ドキュメントの作成やワークフローの処理、プロジェクトの遂行など様々な業務がアプリケーション・プログラムを利用して進められている。
通常、アプリケーション・プログラムを利用することにより生成されたコンテンツは、アプリケーション・プログラム毎に異なるフォーマットでファイルに格納され、保存される。そのため、各アプリケーション・プログラムで作成したコンテンツの閲覧や編集等を行うためには、各アプリケーション・プログラムに対応した専用のクライアント・プログラムを端末にインストールする必要がある。
このため、各アプリケーション・プログラムによって作成されたそれぞれフォーマットの異なる複数のファイルへのアクセスを統一して行うことを可能にするために、様々な技術が開発されている(例えば特許文献1参照)。
特開2009−116414号公報
しかしながら、例えば特許文献1に開示されているように、情報処理システムで稼動する種々のアプリケーション・プログラムのファイルに対して統一的なアクセスを可能とするためには、それらのアプリケーション・プログラムに対応可能な変換プログラムを用いる必要がある。そして情報処理システムで稼動するアプリケーション・プログラムの数が増えるほど変換プログラムの規模も大きくなり、変換プログラムの開発や実装が煩雑になる。
本発明はこのような背景を鑑みてなされたもので、異なるフォーマットでコンテンツをファイルに格納する各アプリケーション・プログラムによりそれぞれ生成されたコンテンツに対して、変換プログラムを用いなくても統一的なアクセスを可能とする情報処理装置を提供することを一つの目的とする。
上記課題を解決するための手段の一つは、第1記録媒体を有する第1ストレージ装置と、第2記録媒体を有する第2ストレージ装置と、前記第1ストレージ装置と通信可能に接続され、第1フォーマットでコンテンツをファイルに格納し、前記ファイルを前記第1記録媒体に記憶する第1アプリケーションプログラムを実行する第1サーバと、前記第1ストレージ装置と通信可能に接続され、前記第1フォーマットとは異なる第2フォーマットでコンテンツをファイルに格納し、前記ファイルを前記第1記録媒体に記憶する第2アプリケーションプログラムを実行する第2サーバと、前記第1サーバ、前記第2サーバ及び前記第2ストレージ装置と通信可能に接続され、前記第1記録媒体に記憶されている各ファイル内のコンテンツの複製を取得し、前記第2記録媒体に記憶する情報処理装置と、前記情報処理装置と通信可能に接続され、前記情報処理装置に対してコンテンツの読み出し要求を送信し、前記情報処理装置から前記読み出し要求の対象であるコンテンツを受信するクライアントと、を備えて構成される情報処理システムにおける前記情報処理装置であって、前記第1サーバに対して、前記第1アプリケーションプログラムが生成したファイル内のコンテンツの送信要求を送信する第1要求送信部と、前記送信要求に応じて、前記第1アプリケーションプログラムが前記第1記録媒体から読み出したコンテンツを、前記第1サーバから受信する第1コンテンツ受信部と、前記第1コンテンツ受信部が受信したコンテンツを前記第2記録媒体に記憶する第1コンテンツ複製部と、前記第2サーバに対して、前記第2アプリケーションプログラムが生成したファイル内のコンテンツの送信要求を送信する第2要求送信部と、前記送信要求に応じて、前記第2アプリケーションプログラムが前記第1記録媒体から読み出したコンテンツを、前記第2サーバから受信する第2コンテンツ受信部と、前記第2コンテンツ受信部が受信したコンテンツを前記第2記録媒体に記憶する第2コンテンツ複製部と、前記クライアントが前記第2記録媒体に記憶されている各コンテンツを一意に識別するためのグローバル識別子を生成するグローバル識別子生成部と、前記第2記録媒体における前記各コンテンツの記憶位置を示す記憶位置情報と、前記各コンテンツのグローバル識別子とをそれぞれ対応付けてグローバル識別子管理テーブルに記憶するグローバル識別子記憶部と、前記クライアントからグローバル識別子を指定したコンテンツの前記読み出し要求を受信し、前記グローバル識別子と対応付けて前記グローバル識別子管理テーブルに記憶される記憶位置情報により特定される記憶位置からコンテンツを読み出して前記クライアントに送信する読み出し処理部と、を備える。
その他、本願が開示する課題、及びその解決方法は、発明を実施するための形態の欄の記載、及び図面の記載等により明らかにされる。
本発明によれば、異なるフォーマットでコンテンツをファイルに格納する各アプリケーション・プログラムによりそれぞれ生成されたファイルに対して、変換プログラムを用いなくても統一的なアクセスが可能になる。
実施形態に係る情報処理システムの全体構成を示す図である。 実施形態に係る情報処理システムの全体構成を示す図である。 実施形態に係るバックアップファイルを示す図である。 実施形態に係る更新データを示す図である。 実施形態に係るクライアントの構成を示す図である。 実施形態に係るコンテンツ集約サーバの構成を示す図である。 実施形態に係るバックアップサーバの構成を示す図である。 実施形態に係るメールサーバの構成を示す図である。 実施形態に係るコラボレーションサーバの構成を示す図である。 実施形態に係るストレージ装置の構成を示す図である。 実施形態に係る処理の概要を示す図である。 実施形態に係る処理の概要を示す図である。 実施形態に係るバックアップカタログ情報管理テーブルを示す図である。 実施形態に係るバックアップカタログ情報管理テーブルを示す図である。 実施形態に係るバックアップカタログ情報管理テーブルを示す図である。 実施形態に係る集約データ管理テーブルを示す図である。 実施形態に係る別名管理テーブルを示す図である。 実施形態に係るアプリケーション管理テーブルを示す図である。 実施形態に係るバックアップ処理の流れを示すフローチャートである。 実施形態に係るデータ読み出し変換処理の流れを示すフローチャートである。 実施形態に係るデータ書き出し処理の流れを示すフローチャートである。 実施形態に係る集約データ管理テーブル更新処理の流れを示すフローチャートである。 実施形態に係るリード処理の流れを示すフローチャートである。 実施形態に係るライト処理の流れを示すフローチャートである。 実施形態に係る削除処理の流れを示すフローチャートである。 実施形態に係る検索処理の流れを示すフローチャートである。 実施形態に係る情報処理システムの全体構成を示す図である。 実施形態に係るコンテンツ集約サーバの構成を示す図である。 実施形態に係るエンタープライズサーチサーバの構成を示す図である。 実施形態に係る処理の概要を示す図である。 実施形態に係る検索インデックス中間データ管理テーブルを示す図である。 実施形態に係る検索インデックス中間データ管理テーブルを示す図である。 実施形態に係る検索インデックス中間データ管理テーブルを示す図である。 実施形態に係る集約データ管理テーブル更新処理の流れを示すフローチャートである。
以下、本発明の実施の形態について、図面を参照しながら説明する。なお実施の形態を説明するための図面において、同一部には原則として同一符号を付し、その繰り返しの説明は省略する。また説明上プログラムまたは機能が主語となる場合、実際にはプログラムを実行するプロセッサや回路によって処理が実行される。
==第1実施形態==
図1〜図26を用いて第1実施形態の情報処理システムについて説明する。
図1は、第1実施形態における情報処理システム1を示している。
情報処理システム1は、クライアント装置2、クライアント装置2a、クライアント装置2b、コンテンツ集約サーバ3、バックアップサーバ5、メールサーバ6、コラボレーションサーバ7、ストレージ装置4s、ストレージ装置4tが、ネットワーク110を介して通信可能に接続されて構成される。なおバックアップサーバ5及びコンテンツ集約サーバ3は、特許請求の範囲に記載の情報処理装置に相当する。
クライアント装置2aは、情報処理システム1により提供される各種情報処理機能を利用しながら業務を行う企業Aの従業員等(以下、ユーザとも記す)が使用するコンピュータである。クライアント装置2bは、情報処理システム1により提供される各種情報処理機能を利用しながら業務を行う企業Bのユーザが使用するコンピュータである。
クライアント装置2a、2bは、電子メールの授受を制御するメールサーバ6や、ユーザ間でドキュメントやスケジュール情報などの共有を可能にするための制御を行うコラボレーションサーバ7と通信可能に接続されている。またクライアント装置2a、2bはストレージ装置4tとも通信可能に接続されている。クライアント装置2a、2bのユーザは、ストレージ装置4tにより提供される記憶資源を利用して、ファイルをストレージ装置4tに格納したり、読み出したりすることもできる。
なお、メールサーバ6やコラボレーションサーバ7、ストレージ装置4t、ネットワーク110は、企業Aのユーザと企業Bのユーザとで共用されるが、各企業のユーザの情報は互いに相手から隔離されるように制御が行われる。
メールサーバ6は、ユーザ間で行われる電子メールの授受を制御するためのコンピュータである。メールサーバ6には、メールサーバ・プログラム(特許請求の範囲に記載のアプリケーションプログラムに相当する)がインストールされている。メールサーバ6は、メールクライアント・プログラムがインストールされているクライアント装置2a、2bに対して、電子メール(E-Mail)の受信、送信、検索などの機能を提供する。
またメールサーバ6は、クライアント装置2a、2bに電子メール機能を提供するにあたり、ユーザ間で授受される各電子メールのコンテンツを格納したファイル(以下、メールデータとも記す)など様々なファイルを、メールサーバ・プログラムが準拠する規格に従ったフォーマットで、ストレージ装置4tに記憶する。
コラボレーションサーバ7は、ユーザ間での文書の共有やプロジェクトの管理、スケジュール情報の共有などを制御するためのコンピュータである。コラボレーションサーバ7には、コラボレーションサーバ・プログラム(特許請求の範囲に記載のアプリケーションプログラムに相当する)がインストールされている。コラボレーションサーバ7は、コラボレーションクライアント・プログラムがインストールされているクライアント装置2a、2bに対して、オフィスドキュメントなどのコラボレーションサーバ・プログラムが生成したコンテンツを格納したファイル(以下、コラボレーションデータとも記す)などの格納、共有などの機能を提供する。
またコラボレーションサーバ7は、クライアント装置2a、2bにドキュメント管理等の機能を提供するにあたり、ドキュメントやスケジュール情報等のコンテンツを格納したファイルなど様々なファイルを、コラボレーションサーバ・プログラムが準拠する規格に従ったフォーマットで、ストレージ装置4tに記憶する。
ストレージ装置4t、4sは、それぞれ、複数のハードディスクドライブ等の記録媒体を格納したディスクアレイ装置として構成される。
クライアント装置2は、ストレージ装置4tの記録媒体に記憶されるデータのバックアップや情報処理システム1の障害回復等、情報処理システム1の保守や運用管理、各種分析等を行うオペレータが使用するコンピュータである。
オペレータは、クライアント装置2を用いて例えばデータマイニングを行う。データマイニングを行う場合には、クライアント装置2は、情報処理システム1内に記憶されている、様々なアプリケーション・プログラムにより作成された種々のフォーマットのデータを収集する。
バックアップサーバ5は、ストレージ装置4tに記憶されているデータの複製をストレージ装置4sに記憶するバックアップ処理を行うコンピュータである。
詳細は後述するが、バックアップサーバ5は、例えばストレージ装置4tに記憶されている電子メールデータをストレージ装置4sにバックアップする場合には、メールサーバ6に対してメールサーバ・プログラムが生成したファイル内の各電子メールデータの送信要求を送信する。そしてバックアップサーバ5は、メールサーバ・プログラムがストレージ装置4tが有する記録媒体から読み出した各電子メールデータを、メールサーバ6から受信する。そしてバックアップサーバ5は、受信した電子メールデータをストレージ装置4sが有する記録媒体に記憶する。
同様に、例えばストレージ装置4tに記憶されているコラボレーションデータ内のコンテンツをストレージ装置4sにバックアップする場合には、バックアップサーバ5は、コラボレーションサーバ7に対してコラボレーションサーバ・プログラムが生成したコラボレーションデータ内の各コンテンツの送信要求を送信する。そしてバックアップサーバ5は、コラボレーションサーバ・プログラムがストレージ装置4tが有する記録媒体から読み出した各コンテンツを、コラボレーションサーバ7から受信する。そしてバックアップサーバ5は、受信したコンテンツをストレージ装置4sが有する記録媒体に記憶する。
コンテンツ集約サーバ3は、ストレージ装置4sに記憶される様々なアプリケーション・プログラムにより生成されたコンテンツを集約して、クライアント装置2に提供する機能を有するコンピュータである。
通常、各アプリケーション・プログラムにより生成されたコンテンツは、各アプリケーション・プログラムがそれぞれ準拠するフォーマットに従ってそれぞれファイルに格納されているため、そのままでは各ファイル内のコンテンツを統一的に読み出したり検索したりすることはできないが、本実施形態に係るバックアップサーバ5及びコンテンツ集約サーバ3が、ストレージ装置4sに記憶された各ファイル内のコンテンツを一意に識別可能となるような識別子(以下、グローバル識別子とも記す)を各コンテンツに付与し、クライアント装置2に対して、各アプリケーション・プログラムにより生成された各コンテンツへの統一的なアクセスを可能とする。
これにより、クライアント装置2は、個々のアプリケーション・プログラムに固有のプロトコルを理解する必要がなく、シングルネームスペースを実現するコンテンツ管理システムの実装が容易になる。
またクライアント装置2から各コンテンツへアクセスする際、アプリケーション・プログラムごとのプロトコル理解やフォーマットの変換等の処理が不要となり、データアクセス応答プログラムのみを介したアクセスとなるため、アクセスオーバヘッドが小さく、アクセス性能が高くなる。
コンテンツ集約サーバ3は、各コンテンツに付与した上記グローバル識別子と、各コンテンツのストレージ装置4sの記録媒体における記憶位置を示す記憶位置情報とを、詳しくは後述する集約データ管理テーブル(特許請求の範囲に記載のグローバル識別子管理テーブルに相当する)3500に記憶している。
コンテンツ集約サーバ3は、クライアント装置2からグローバル識別子を指定したコンテンツへのアクセス要求を受信した場合には、指定されたグローバル識別子と対応付けて集約データ管理テーブル3500に記憶されるアドレスからコンテンツを読み出してクライアント装置2に送信する。
ネットワーク110は、例えば各種のLAN(Local Area Network)やWAN(Wide Area Network)等により構成される通信路である。
なお、本実施形態で説明するメールサーバ・プログラム、コラボレーションサーバ・プログラムはアプリケーション・プログラムの一例であり、本実施形態はこれらのアプリケーション・プログラムに限定されるものではない。その他のアプリケーション・プログラムとしては、例えば、HTTP(HyperText Transfer Protocol)サーバ、リレーショナル・データベース管理システム(RDBMS)などが挙げられる。
またメールサーバ6とコラボレーションサーバ7(特許請求の範囲に記載の第1サーバ、第2サーバに相当する)をアプリケーションサーバ装置と総称することがある。また、コンテンツ集約サーバ3、バックアップサーバ5、メールサーバ6、コラボレーションサーバ7をサーバ装置と総称することがある。さらに、ストレージ装置4s、4tをストレージ装置4と総称することがある。
図2は、本実施形態に係る情報処理システム1に関連する一部のプログラムや処理、テーブル、データ等を示す図である。
ストレージ装置4tにはNAS(Network Attached Storage)データ10a、メールデータ10b、コラボレーションデータ10cといったアプリケーション・データ10が格納されている。
NASデータ10aはストレージ装置4tによって管理されているファイルの集合体である。NASデータ10aはNFS(Network File System)/CIFS(Common Interface File System)プロトコルといったファイル共有プロトコルを介して、クライアント装置2a、2bによってアクセスされる。
メールデータ10bはメールサーバ・プログラムによって管理されているメール(メッセージ)の集合体である。コラボレーションデータ10cはコラボレーション・プログラムによって管理されているドキュメントやデータの集合体である。
NASデータ10a、メールデータ10b、コラボレーションデータ10cに含まれるファイル、メール(メッセージ)、ドキュメント及びデータをコンテンツと総称する。コンテンツは各アプリケーションにおける管理対象である。
クライアント装置2は、集約データ・クライアント・プログラム2000を実行している。集約データ・クライアント・プログラム2000は、(1)コンテンツ集約サーバ3に対してリード要求を発行して、コンテンツ集約サーバ3が管理するコンテンツを読み出したり、(2)コンテンツ集約サーバ3に対してライト要求を発行して、コンテンツ集約サーバ3に対してコンテンツを書き込んだり、(3)コンテンツ集約サーバ3に対して削除要求を発行して、コンテンツ集約サーバ3が管理するコンテンツを削除したり、(4)コンテンツ集約サーバ3に対して検索要求を発行して、コンテンツ集約サーバ3が管理するコンテンツを検索したりする。
コンテンツ集約サーバ3は、リード処理3100などの処理を実行する各種プログラムを実行している。なお、ここでは代表的な処理としてリード処理3100を例示したが、コンテンツ集約サーバ3は、他にも各種処理(ライト処理、削除処理、検索処理など)を実行する。またコンテンツ集約サーバ3は、後述する集約データ管理テーブル3500を格納している。
ストレージ装置4sは、集約データ14や更新データ13を格納している。集約データ14は、バックアップファイル11の集合体である。
バックアップファイル11aは、ストレージ装置4tに記憶されているNASデータ10a内の各コンテンツの複製を含むファイルである。バックアップファイル11bは、ストレージ装置4tに記憶されているメールデータ10b内の各コンテンツの複製を含むファイルである。バックアップファイル11cは、ストレージ装置4tに記憶されているコラボレーションデータ10c内の各コンテンツの複製を含むファイルである。
更新データ13は、クライアント装置2から送信されたライト要求(更新要求)と共に送信されたコンテンツを含むファイルである。
バックアップサーバ5は、バックアップカタログ(特許請求の範囲に記載の複製管理テーブルに相当する)15を格納している。バックアップカタログ15は、バックアップカタログ12a、12b、12cの集合体である。
バックアップカタログ12aは、バックアップサーバ5が、ストレージ装置4tに記憶されているNASデータ10a内のコンテンツをストレージ装置4sにバックアップする際に、バックアップサーバ5により作成されるテーブルである。
バックアップカタログ12bは、バックアップサーバ5が、ストレージ装置4tに記憶されているメールデータ10b内のコンテンツをストレージ装置4sにバックアップする際に、バックアップサーバ5により作成されるテーブルである。
バックアップカタログ12cは、バックアップサーバ5が、ストレージ装置4tに記憶されているコラボレーションデータ10c内のコンテンツをストレージ装置4sにバックアップする際に、バックアップサーバ5により作成されるテーブルである。
図3は、バックアップファイル11のデータ構造の概念図を示している。バックアップファイル11は、アプリケーション・データ10に含まれるコンテンツの複製(単にコンテンツと呼ぶことがある)が格納されるファイルである。
バックアップファイル11はストレージ装置4s内のボリューム(1つまたは複数のHDD(Hard Disk Drive)等の記録媒体により提供される記憶領域から構成される論理的な記憶領域)上に作成されたファイルシステム内に格納することができる。
図3に示すように、バックアップファイル11には少なくともコンテンツのデータ1101を含む。また、バックアップファイル11には、コンテンツのデータ1101に加えて、コンテンツのメタデータ1102を含むようにすることもできる。コンテンツのメタデータ1102にはコンテンツの作成時刻、更新時刻、サイズなどを含むように構成することができる。
図4は、更新データ13のデータ構造の概念図を示している。更新データ13には、後述するライト処理3200において、クライアント装置2から受信したライトデータ(更新されたコンテンツ)が書き込まれる。更新データ13はストレージ装置4s内のボリューム上に作成されたファイルシステム内に格納することができる。
図4に示すように、更新データ13には少なくともコンテンツのデータ1301を含む。また、更新データ13には、コンテンツのデータ1301に加えて、コンテンツのメタデータ1302を含むようにすることもできる。コンテンツのメタデータ1302にはコンテンツの作成時刻、更新時刻、サイズなどを含むように構成することができる。
バックアップカタログ12には、バックアップファイル11に格納されたコンテンツのコンテンツ識別情報、格納位置情報(ストレージ装置4sの記録媒体上の記憶位置を示す記憶位置情報)、メタデータなどが格納される。バックアップカタログ12a、12b、12cはそれぞれ後述するNAS用/メール用/コラボレーション用のバックアップカタログ情報管理テーブル5400、5500、5600から構成される。
集約データ管理テーブル3500には、集約データ14に含まれる全てのバックアップファイル11のコンテンツを一意に識別できるグローバル・コンテンツ識別情報(グローバル識別子)とコンテンツの格納位置情報(ストレージ装置4sの記録媒体上の記憶位置を示す記憶位置情報)などが格納される。
集約データ管理テーブル3500を用いることで、コンテンツ集約サーバ3は、クライアント装置2により指定されたグローバル・コンテンツ識別情報に対応するコンテンツのデータの格納位置を特定し、特定したコンテンツのデータをクライアント装置2に送信することができる。
図5は、クライアント装置2のハードウェア構成図を示している。クライアント装置2は、CPU(Central Processing Unit)22、メモリ21、HDD(Hard Disk Drive)23、ネットワーク・インターフェース28を内部構成要素として有し、それらが内部バス24で接続されている。さらに、クライアント装置2には、ユーザ・インタフェースとして、ディスプレイ25、キーボード26及びマウス27が接続されている。
クライアント装置2は、ネットワーク・インターフェース28を介してネットワーク110に接続され、コンテンツ集約サーバ3と通信を行う。例えば、ネットワーク110は、イーサネット(登録商標)を使い、通信プロトコルとしてTCP/TP(Transmission Control Protocol/Internet Protocol)を利用することができる。
メモリ21には集約データ・クライアント・プログラム2000が記憶される。本プログラムはコンテンツ集約サーバ3に対して、コンテンツへのリード要求、ライト要求、削除要求、検索要求などといった各種処理要求を行う。メモリ21に格納されたプログラムはCPU22に読み込まれて実行される。
図6は、コンテンツ集約サーバ3のハードウェア構成図を示している。
コンテンツ集約サーバ3は、CPU(Central Processing Unit)32、メモリ31、HDD(Hard Disk Drive)33、ネットワーク・インターフェース38を内部構成要素として有し、それらが内部バス34で接続されている。さらに、コンテンツ集約サーバ3には、ユーザ・インタフェースとして、ディスプレイ35、キーボード36及びマウス37が接続されている。
コンテンツ集約サーバ3のメモリ31には、集約データ管理テーブル更新処理3000、リード処理3100、ライト処理3200、削除処理3300、検索処理3400といった処理を行う各種プログラムや、集約データ管理テーブル3500、検索インデックス3600、アプリケーション管理テーブルの複製3700、別名管理テーブル3800といった各種テーブルが記憶される。コンテンツ集約サーバ3のメモリ31に格納されたプログラムはCPU32に読み込まれて実行される。
検索インデックス3600は、ストレージ装置4sが有する記録媒体に記憶されている各コンテンツに記述されている単語を抽出し、抽出した単語と、抽出した単語が記述されているコンテンツのグローバル・コンテンツ識別情報と、を単語毎に対応付けて記憶したテーブルである。
アプリケーション管理テーブルの複製3700は、各アプリケーション・プログラムを実行するサーバ装置のIPアドレスと、アプリケーション・プログラムの識別情報とを対応付けて記憶したテーブルである。詳しくは後述する。
別名管理テーブル3800は、ストレージ装置4sに記憶されるコンテンツに対して世代ごとに一意に付与される識別情報(別名)を記録したテーブルである。
世代とは、ストレージ装置4tに記憶されるコンテンツの複製がストレージ装置4sにバックアップされた回数に応じて付与される情報である。
別名管理テーブル3800には、コンテンツのグローバル・コンテンツ識別情報と、そのコンテンツの世代情報と、その世代の当該コンテンツに付与される別名と、が対応付けて記憶されている。
コンテンツ集約サーバ3はネットワーク・インターフェース38を介してネットワーク110に接続され、クライアント装置2及びストレージ装置4sと通信を行う。
図7は、バックアップサーバ5のハードウェア構成を示している。
バックアップサーバ5はCPU52、メモリ51、HDD53、ネットワーク・インターフェース58を内部構成要素として有し、それらが内部バス54で接続されている。さらに、バックアップサーバ5には、ユーザ・インタフェースとして、ディスプレイ55、キーボード56及びマウス57が接続されている。
バックアップサーバ5のメモリ51はデータ読み出し・変換処理5000やデータ書き出し処理5100やバックアップ制御処理5200といった処理を行う各種プログラム、及び、NAS/メール/コラボレーション用のバックアップカタログ情報管理テーブル5400、5500、5600、及び、アプリケーション管理テーブル5300といったテーブルを記憶する。メモリ51に格納されたプログラムはCPU51に読み込まれて実行される。
バックアップサーバ5はネットワーク・インターフェース58を介してネットワーク110に接続され、ストレージ装置4s、メールサーバ6、コラボレーションサーバ7、ストレージ装置4tと通信を行う。
図8は、メールサーバ6のハードウェア構成を示している。
メールサーバ6はCPU62、メモリ61、HDD63、ネットワーク・インターフェース68を内部構成要素として有し、それらが内部バス64で接続されている。さらに、メールサーバ6には、ユーザ・インタフェースとして、ディスプレイ65、キーボード66及びマウス67が接続されている。
メールサーバ6のメモリ61はデータ読み出し・変換処理6000といった処理を行う各種プログラムを記憶する。メモリ61に格納されたプログラムはCPU62に読み込まれて実行される。
メールサーバ6はネットワーク・インターフェース68を介してネットワーク110に接続され、バックアップサーバ5及びストレージ装置4tと通信を行う。
図9は、コラボレーションサーバ7のハードウェア構成を示している。
コラボレーションサーバ7はCPU72、メモリ71、HDD73、ネットワーク・インターフェース78を内部構成要素として有し、それらが内部バス74で接続されている。さらに、コラボレーションサーバ7には、ユーザ・インタフェースとして、ディスプレイ75、キーボード76及びマウス77が接続されている。
コラボレーションサーバ7のメモリ71はデータ読み出し・変換処理7000といった処理を行う各種プログラムを記憶する。コラボレーションサーバ7のメモリ71に格納されたプログラムはコラボレーションサーバ7のCPU72に読み込まれて実行される。
コラボレーションサーバ7はネットワーク・インターフェース78を介してネットワーク110に接続され、バックアップサーバ5及びストレージ装置4tと通信を行う。
図10は、ストレージ装置4のハードウェア構成図を示している。ストレージ装置4はストレージ装置4s、4tの総称である。
ストレージ装置4は、ネットワーク・インターフェース46、コントローラ41、キャッシュメモリ42、ディスク・インターフェース43、HDD44から構成され、HDD44以外は内部バス45で接続されている。HDD44は、ディスク・インターフェース43に接続されている。
ストレージ装置4sは、ストレージ装置4sのネットワーク・インターフェース46を介してネットワーク110に接続され、コンテンツ集約サーバ3及びバックアップサーバ5と通信を行う。
ストレージ装置4tは、ストレージ装置4tのネットワーク・インターフェース46を介してネットワーク110に接続され、クライアント装置2a、2b、バックアップサーバ5、メールサーバ6及びコラボレーションサーバ7と通信を行う。
ストレージ装置4sのHDD44には、バックアップファイル11及び更新データ13が格納される。ストレージ装置4tのHDD44には、NASデータ10a、メールデータ10b、コラボレーションデータ10cが格納される。
コントローラ41の図示しないメモリはデータ・アクセス・プログラム4001及びストレージ制御プログラム4002を記憶する。コントローラ41の図示しないCPUはメモリに格納された各種プログラムを読み込んで実行する。
ストレージ装置4sはバックアップファイル11と更新データ13を図示しないボリュームに格納する。ストレージ装置4tはアプリケーション・データ10(NASデータ10a、メールデータ10b、コラボレーションデータ10cの総称)を図示しないボリュームに格納する。ここで、ボリュームとは1つまたは複数のHDD44の記憶領域から構成される論理的な記憶領域である。
ストレージ装置4は、データ・アクセスプログラム4001を実行し、ボリューム内のデータにアクセスするためにデータ・アクセス機能を提供する。例えば、ストレージ装置4は、SCSI(Small Computer System Interface)や、NFS(Network File System)などのデータ・アクセス用のプロトコルを使って、サーバ装置に対してデータへのアクセス手段を提供する。
また、ストレージ装置4は、ストレージ制御プログラム4002を実行し、当該ストレージ装置4の構成を変更したり、ボリュームのコピーを取得したりするためのストレージ制御機能をサーバ装置に提供する。サーバ装置は、図示しないストレージ制御プログラムを実行し、ストレージ装置4の構成情報参照や変更の要求、ボリュームのコピー作成要求などをストレージ装置4に要求する。ストレージ制御機能は、要求内容に基づいて処理を行う。
図11は、第1の実施形態における情報処理システム1の概念図を示している。
図11に示すように、情報処理システム1は、集約データ・クライアント・プログラム2000、リード処理3100、集約データ管理テーブル3500、集約データ14(バックアップファイル11の集合体)、アプリケーション・データ10(NASデータ10a、メールデータ10b、コラボレーションデータ10c)、バックアップカタログ群15(バックアップカタログ12a、12b、12cの集合体)を含む。
第1実施形態の情報処理システム1が行う処理を、以下の3つの部分に分けて説明する。即ち、(a)バックアップ、(b)集約データ管理テーブル更新、(c)コンテンツ・アクセスの3つの処理部分である。
<(a)バックアップ>
バックアップ処理は、バックアップサーバ5が、ストレージ装置4tが有する記録媒体に記録されている各ファイル内のコンテンツの複製をストレージ装置4sが有する記録媒体に記憶する処理である。
バックアップの処理部分においては、バックアップサーバ5は、アプリケーションデータ10(NASデータ10a、メールデータ10b、コラボレーションデータ10c)に含まれるコンテンツの複製をバックアップファイル11に格納し(図11の「(1)−aコンテンツの複製」に対応)、それに対応してバックアップカタログ12の内容を更新する(図11の「(1)−bバックアップカタログ更新」に対応)。
NASデータ10aに関する、バックアップの処理部分についての処理内容概略は以下のとおりである。まず、バックアップサーバ5はNASデータ10aのコンテンツのデータ(及びメタデータ)を読み出し、バックアップファイル11aに格納する。次に、バックアップサーバ5は格納されたコンテンツのコンテンツ識別情報、格納位置情報、メタデータをバックアップカタログ12aに追記する。
また、メールデータ10bに関する、バックアップの処理部分の処理内容概略は以下のとおりである。まず、メールサーバ6はメールデータ11bのコンテンツのデータ(及びメタデータ)を読み出し、バックアップサーバ5に送信する。次に、バックアップサーバ5は受信したコンテンツのデータ(及びメタデータ)をバックアップファイル10bに格納する。最後に、格納されたコンテンツのコンテンツ識別情報、格納位置情報、メタデータをバックアップカタログ12bに追記する。
コラボレーションデータ10cに関する、バックアップの処理部分の処理内容概略は以下のとおりである。まず、コラボレーションサーバ7はコラボレーションデータ10cのコンテンツのデータ(及びメタデータ)を読み出し、バックアップサーバ5に送信する。次に、バックアップサーバ5は受信したコンテンツのデータ(及びメタデータ)をバックアップファイル11cに格納する。最後に、格納されたコンテンツのコンテンツ識別情報、格納位置情報、メタデータをバックアップカタログ12cに追記する。
バックアップの処理部分で行われる処理は複数のコンテンツに対して実施される。複数のコンテンツの選び方の違いにより、フルバックアップと増分バックアップの2種類が存在する。フルバックアップ、増分バックアップは後述するバックアップ制御処理5200に相当する。
フルバックアップでは、アプリケーション・データ10に含まれる全てのコンテンツに対して、バックアップの処理部分で処理が実施される。
増分バックアップでは前回のフルバックアップ或いは増分バックアップ以降に追加・更新されたコンテンツのみに対してバックアップの処理部分で処理が実施される。
具体的には、バックアップサーバ5は、バックアップ処理を実行する毎に、バックアップ処理を実行した時刻をバックアップ管理テーブル(不図示)に記録しており、新たにバックアップ処理を実行する際には、前回バックアップを実行した時刻と、ストレージ装置4sが有する記録媒体に記憶されている各コンテンツに記録されているコンテンツの更新時刻と、を比較し、前回実行したバックアップ処理の後に更新されたコンテンツに対してのみバックアップ処理を行う。
このように増分バックアップを行うことにより、追加・更新されたコンテンツのみが複製されるため、バックアップ処理時間を短縮することができる。
なお、増分バックアップを行う場合には、削除されたコンテンツに関する情報もバックアップカタログに記録する。
<(b)集約データ管理テーブル更新>
集約データ管理テーブル更新の処理部分においては、コンテンツ集約サーバ3は、バックアップカタログ15内のバックアップカタログ12に含まれるエントリの情報に基づいて、集約データ管理テーブル3500に新しいエントリを追加する(これをエントリ追加処理と呼ぶ)。本処理は図11の(2)集約データ管理テーブル更新に対応する。
追加されるエントリにはグローバル・コンテンツ識別情報、コンテンツの格納位置情報、アクセス制御情報などが含まれる。各コンテンツのグローバル・コンテンツ識別情報は、当該エントリに対応するアプリケーション(NAS、メール、コラボレーション)の種類に応じたアプリケーション識別子、及び、バックアップカタログ12のエントリに含まれるコンテンツ識別情報を、コンテンツ毎に文字列として例えば連結することで生成する。
フルバックアップ方式でバックアップ処理が行われる場合は、バックアップカタログ15内のバックアップカタログ12に含まれる全てのエントリに対して前述のエントリ追加処理が行われる。
増分バックアップ方式でバックアップ処理が行われる場合は、バックアップカタログ群15内のバックアップカタログ12に含まれるエントリのうち、前回のフルバックアップ或いは増分バックアップ以降に追加されたエントリに対して前述のエントリ追加処理が行われる。増分バックアップの場合は、必要最小限のエントリに対してのみ処理が行われるため、処理時間を短縮することができる。
エントリ追加処理が完了すると、コンテンツ集約サーバ3は、集約データ管理テーブル3500の各エントリのグローバル・コンテンツ識別情報を用いて、集約データ14内のバックアップファイル11に含まれるすべてのコンテンツの格納位置情報を特定できるようになる。
集約データ管理テーブル更新の処理に関する更に詳細な説明は後述する。
<(c)コンテンツ・アクセス>
コンテンツ・アクセスの処理部分においては、まず集約データ・クライアント・プログラム2000を実行するクライアント装置2が、グローバル・コンテンツ識別情報を指定したコンテンツのアクセス要求をコンテンツ集約サーバ3に送信する。そしてコンテンツ集約サーバ3が、上記アクセス要求に応じて、グローバル・コンテンツ識別情報と対応付けて集約データ管理テーブル3500に記憶されている格納位置情報により特定される記憶位置に記憶されているコンテンツに対するアクセスを行う。
本処理は、図11における、(3)リード要求、(4)データ格納位置情報参照、(5)データ読み出し、(6)リード応答に対応する。
具体的には、まず、集約データ・クライアント・プログラム2000はグローバル・コンテンツ識別情報を指定して、コンテンツ集約サーバ3に対してリード要求を送信する((3)のリード要求)。
次に、リード要求に対して、リード処理3100のプログラムは集約データ管理テーブル3500を参照し、指定されたグローバル・コンテンツ識別情報に対応する格納位置情報を特定する((4)データ格納位置情報参照)。
次に、リード処理3100のプログラムは特定した格納位置情報に基づいてコンテンツのデータをバックアップファイル11から読み出す((5)データ読み出し)。
そして、リード処理3100のプログラムは読み出したデータを集約データ・クライアント・プログラム2000に送信する((6)リード応答)。
なお、図11の説明においては、リード処理を例にとって実施形態の概念を説明したが、リード処理以外の処理に関しては後述のフローチャートの説明において詳細に説明するものとする。また、前述の(6)リード応答の説明においては、集約データ・クライアント・プログラム2000が動作するクライアント装置2とリード処理3100のプログラムが動作するコンテンツ集約サーバ3との間の通信プロトコルを明示的に記載しなかったが、通信プロトコルとしてはファイル共有プロトコルのCIFS(Common Internet File Protocol)/NFS(Network File System)やHTTP(Hypertext Transfer Protocol)などを用いることができる。
図12は第1実施形態におけるアクセス制御の概念図を示している。
アクセス制御の概念図を説明する前にまず、アクセス制御情報について説明する。NASデータ10a、メールデータ10b、コラボレーションデータ10cといったアプリケーション・データ10に対するアクセスにおいては、通常、アクセス制御情報に基づいてアクセス制御が行われる。
アクセス制御により、許可されたユーザのみしか、アプリケーション・データ10内のコンテンツにアクセスできないようにすることができる。アクセス制御情報はコンテンツのメタデータに含まれ、また、前述の集約データ管理テーブル更新の処理において集約データ管理テーブル(特許請求の範囲に記載のアクセス管理テーブルに相当する)3500に登録される。
次にアクセス制御の概念図について説明する。図12の(3)、(4)’、(5)、(6)の処理は、それぞれ前述のコンテンツ・アクセスの処理部分 (3)、(4)、(5)、(6) の処理に対応する。処理(4)’においては、前述した(4)の処理に代えて以下のような処理を行う。即ち、データ格納位置情報を特定する処理に加えて、アクセス制御情報を参照して、アクセスを許可してよいかを判定する処理を行う。
具体例を以下に述べる。図12は、情報処理システム1に企業Aおよび企業Bのアプリケーション・データ10が存在し、それらアプリケーション・データ10から企業Aおよび企業Bの集約データ14が生成され、生成された集約データ14にあるユーザがリード・アクセスを行う場合を示している。
図12にはまた、アクセス制御情報の一例10001が示してある。この例では、企業Aの集約データ14に含まれるコンテンツA1にアクセスできるアクセス権A1と、企業Bの集約データ14に含まれるコンテンツB1にアクセスできるアクセス権B1が存在する。
(4)’の処理により、アクセス権A1を持つが、アクセス権B1を持たないユーザは、コンテンツA1に対するアクセスを許可され、コンテンツB1に対するアクセスを拒否される。
次に第1実施形態における各種テーブルについて説明する。
図13は、NAS用のバックアップカタログ情報管理テーブル5400の構成例を示している。
NAS用のバックアップカタログ情報管理テーブル5400は、NASデータ10a内に含まれるコンテンツの複製が格納されたバックアップファイルであるバックアップファイル11aに含まれるコンテンツに関する情報が格納されるテーブルである。
NAS用のバックアップカタログ情報管理テーブル5400は、コンテンツ識別情報5401、世代情報5402、前世代との関連5403、格納位置情報5404、メタデータ5405から構成される。
コンテンツ識別情報5401は共有名5401a、ファイルパス5401bから構成される。格納位置情報5404はオフセット5404a、データ長5404bから構成される。メタデータ5405は更新時刻5405a、アクセス制御情報5405bから構成される。
以下のバックアップカタログ情報管理テーブル5400の説明において、バックアップカタログ情報管理テーブル5400のあるエントリで管理されるコンテンツを当該コンテンツと呼ぶ。
コンテンツ識別情報5401は、NASデータ10aに対するバックアップファイル11a内に含まれるある世代のコンテンツを一意に識別するための情報である。共有名5401aはNASデータ10aの管理単位である。ある共有名には複数のコンテンツが含まれる。ファイルパス5401bは、ある共有名内でコンテンツを一意に識別するための識別子である。
世代情報5402は、何回目のバックアップ制御処理5200の実行によってバックアップされたコンテンツであるかを示す情報であり、「世代1」「世代2」「世代3」等というような識別子を持つ。バックアップ制御処理5200については後述する。
前世代との関連5403は、当該コンテンツと前世代との関連を示す情報である。例えば、世代情報5402が「世代2」のコンテンツに対しては、世代情報「世代1」との関連が示される。前世代との関連5403が持つ値は、例えば「追加」、「更新」、「削除」のいずれかである。
「追加」は、当該コンテンツが、前世代に対応するバックアップ制御処理5200の実行以降にNASデータ10aに追加されたコンテンツであることを示す。「更新」は、当該コンテンツが、前世代に対応するバックアップ制御処理5200の実行以降に更新されたコンテンツであることを示す。「削除」は、当該コンテンツが、前世代に対応するバックアップ制御処理5200の実行以降に削除されたコンテンツであることを示す。
格納位置情報5404は、当該コンテンツに関しての、バックアップファイル11a内での格納位置に関する情報である。オフセット5404aは当該コンテンツのバックアップファイル11a内でのオフセットを示す。削除されたコンテンツに対してはオフセット5404aに無効値である「N/A」が指定される。
データ長5404bは当該コンテンツのデータ長を示す。削除されたコンテンツに対してはデータ長5404bに無効値である「N/A」が指定される。
メタデータ5405は、当該コンテンツに関する情報である。メタデータ5405には更新時刻5405a、アクセス制御情報5405bが含まれる。
メタデータ5405には更新時刻5405aに加えて、生成時刻、最終アクセス時刻などが含まれていてもよい。更新時刻は当該コンテンツが更新された時刻を示す。生成時刻は当該コンテンツが生成された時刻を示す。最終アクセス時刻は当該コンテンツに対して直近にアクセスされた時刻を示す。削除されたコンテンツに対しては更新時刻5405aに無効値である「N/A」が指定される。
アクセス制御情報5405bには、当該コンテンツに対してアクセス許可を持つユーザのユーザ識別子、および、当該コンテンツに対してアクセス許可を持つグループのグループ識別子が含まれる。削除されたコンテンツに対してはアクセス情報5405bに無効値である「N/A」が指定される。
図13の例では、共有名5401a、ファイルパス5401b、世代情報5402の値としてそれぞれ「ShareA」、「/dirA/fileA」、「世代1」を持つコンテンツは、前世代との関連5403、オフセット5404a、データ長5404bの値としてそれぞれ「追加」、「0」、「4096」の値を持つことを示している。
また、当該コンテンツに対してアクセス許可を持つユーザのユーザ識別子は「UserA」であり、当該コンテンツに対してアクセス許可を持つグループのグループ識別子は「GroupA」である。図示していないが、更新時刻5405aは、「2010/10/10 19:30」のような値を持つ。
図14は、メール用のバックアップカタログ情報管理テーブル5500の構成例を示している。
メール用のバックアップカタログ情報管理テーブル5500は、メールデータ10b内に含まれるコンテンツの複製が格納されたバックアップファイルであるバックアップファイル11bに含まれるコンテンツに関する情報が格納されるテーブルである。
メール用のバックアップカタログ情報管理テーブル5500には、コンテンツ識別情報5501、世代情報5502、前世代との関連5503、格納位置情報5504、メタデータ5505から構成される。コンテンツ識別情報5501はアカウント情報5501a、メールID5501bから構成される。格納位置情報5504はオフセット5504a、データ長5504bから構成される。メタデータ5505は更新時刻5505a、アクセス制御情報5405bから構成される。
コンテンツ識別情報5501は、メールデータ10bに対するバックアップファイル11b内に含まれるある世代のコンテンツを一意に識別するための情報である。アカウントはメールデータ10bの管理単位である。あるアカウントには複数のメール(コンテンツ)が含まれる。メールID5501bはあるアカウントに含まれるコンテンツ内でコンテンツを一意に識別するための識別子である。
世代情報5502、前世代との関連5503、格納位置情報5504、メタデータ5505はそれぞれ世代情報5402、前世代との関連5403、格納位置情報5404、メタデータ5405と同様であるので説明を省略する。
図14の例では、アカウント情報5501a、メールID5501b、世代情報5502の値としてそれぞれ「UserA」、「Mail1」、「世代1」を持つコンテンツは、前世代との関連5503、オフセット5504a、データ長5504bの値としてそれぞれ「追加」、「0」、「4096」の値を持つことを示している。
また、当該コンテンツに対してアクセス許可を持つユーザのユーザ識別子は「UserA」であり、当該コンテンツに対してアクセス許可を持つグループのグループ識別子は「GroupA」である。
図15は、コラボレーション用のバックアップカタログ情報管理テーブル5600の構成例を示している。
コラボレーション用のバックアップカタログ情報管理テーブル5600は、コラボレーションデータ10c内に含まれるコンテンツの複製が格納されたバックアップファイルであるバックアップファイル11cに含まれるコンテンツに関する情報が格納されるテーブルである。
コラボレーション用のバックアップカタログ情報管理テーブル5600は、コンテンツ識別情報5601、世代情報5602、前世代との関連5603、格納位置情報5604、メタデータ5605から構成される。コンテンツ識別情報5601はプロジェクト情報5601a、ファイルパス5601bから構成される。格納位置情報5604はオフセット5604a、データ長5604bから構成される。メタデータ5605は更新時刻5605a、アクセス制御情報5605bから構成される。
コンテンツ識別情報5601は、コラボレーションデータ10cに対するバックアップファイル11c内に含まれある世代のコンテンツを一意に識別するための情報である。プロジェクトはコラボレーションデータ10cの管理単位である。あるプロジェクトには複数のコンテンツが含まれる。ファイルパス5601bはあるプロジェクトに含まれるコンテンツ内でコンテンツを一意に識別するための識別子である。
世代情報5602、前世代との関連5603、格納位置情報5604、メタデータ5605はそれぞれ世代情報5402、前世代との関連5403、格納位置情報5404、メタデータ5405と同様であるので説明を省略する。
図15の例では、プロジェクト情報5601a、ファイルパス5601b、世代情報5602の値としてそれぞれ「ProjectA」、「/dirA/fileA」、「世代1」を持つコンテンツは、前世代との関連5603、オフセット5604a、データ長5604bの値としてそれぞれ「追加」、「0」、「4096」の値を持つことを示している。
また、当該コンテンツに対してアクセス許可を持つユーザのユーザ識別子は「UserA」であり、当該コンテンツに対してアクセス許可を持つグループのグループ識別子は「GroupA」である。
図16は、集約データ管理テーブル3500の構成例を示している。
集約データ管理テーブル3500は、集約データ14内(バックアップファイル11a、11b、11c内)に含まれるコンテンツに関する情報が格納されるテーブルである。
集約データ管理テーブル3500は、グローバル・コンテンツ識別情報3501、世代情報3502、格納位置情報3503、メタデータ3504から構成される。
格納位置情報3503はファイル3503a、オフセット3503b、データ長3503cから構成される。メタデータ3504は更新時刻3504a、アクセス制御情報3504bから構成される。
以下の集約データ管理テーブル3500の説明において、集約データ管理テーブル3500のあるエントリに対応するコンテンツを当該コンテンツと呼ぶ。
グローバル・コンテンツ識別情報3501は、クライアント装置2が、集約データ14内(バックアップファイル11a、11b、11c内)に含まれるコンテンツを一意に識別するための識別子である。
世代情報3502は、何回目のバックアップ制御処理5200の実行によってバックアップされたコンテンツであるかを示す情報であり、「世代1」「世代2」「世代3」等というような識別子を持つ。バックアップ制御処理5200については後述する。
格納位置情報3503は、ストレージ装置4sの記録媒体上での当該コンテンツの記憶位置を示す情報であり、当該コンテンツに関しての集約データ14内あるいは更新データ13内での格納位置に関する情報である。
ファイル3503aはバックアップファイル11或いは更新データ13が格納されたファイルを指定する識別子である。オフセット3503bは当該コンテンツのバックアップファイル11或いは更新データ13内でのオフセットを示す。データ長3503cは当該コンテンツのデータ長を示す。
メタデータ3504の内容はNAS用のバックアップカタログ情報管理テーブル5400のメタデータ5405と同様であるため、説明を省略する。
図16の例では、グローバル・コンテンツ識別情報3501が「/NAS/ShareA/dirA/fileA」であり、世代情報3502が「世代1」であるエントリは、ファイル3503a、オフセット3503b、データ長3503cの値としてそれぞれ「File_a」、「0」、「4096」の値を持つことを示している。
また、当該エントリに対応するコンテンツに対してアクセス許可を持つユーザのユーザ識別子は「UserA」であり、当該コンテンツに対してアクセス許可を持つグループのグループ識別子は「GroupA」である。
図17は、別名管理テーブル3800の構成例を示している。
別名管理テーブル3800は、集約データ管理テーブル3500のグローバル・コンテンツ識別情報3501に対する別名を管理するテーブルである。
別名管理テーブル3800はグローバル・コンテンツ識別情報の別名(詳細グローバル識別子)3801、対応グローバル・コンテンツ識別情報3802、対応世代情報3803から構成される。
グローバル・コンテンツ識別情報の別名3801には、対応グローバル・コンテンツ識別情報3802及び対応世代情報3803によって一意に識別されるコンテンツの別名が保持される。
つまり、別名管理テーブル3800には、グローバル・コンテンツ識別情報と、グローバル・コンテンツ識別情報に対応付けられている世代情報と、別名と、が各グローバル・コンテンツ識別情報の世代情報毎に対応付けて記憶されている。
例えば、図17の例においては、対応グローバル・コンテンツ識別情報3802の値「/NAS/ShareA/dirA/fileA」および対応世代情報3803の値「世代1」によって一意に識別されるコンテンツには、「/.snap/2010−10−8/NAS/ShareA/dirA/fileA」という、フルバックアップ或いは増分バックアップを実行した日時を含むような別名が付与されていることを示している。このコンテンツは、図16に示す集約データ管理テーブル3500の第一エントリに記載されたコンテンツに対応する。
図18はアプリケーション管理テーブル5300の構成例を示している。
アプリケーション管理テーブル5300はバックアップ制御処理5200の処理対象となっているアプリケーションのリストを管理するテーブルであり、アドレス5301、アプリケーション種別5302、対応文字列5303の各欄から構成される。
アドレス5301はアプリケーション・プログラムを識別するための識別子であり、例えば、アプリケーション・プログラムを実行するサーバのIPアドレスから構成される。なお、アドレス5301にはポート番号が含まれていてもよい。
アプリケーション種別5302はアプリケーションの種類を示す。アプリケーション種別5302は例えば、「NAS」、「メール」、「コラボレーション」というような値を保持する。
対応文字列5303はアプリケーション種別5302に対応する文字列を示す。例えば、アプリケーション種別5302が「NAS」、「メール」、「コラボレーション」であれば、対応文字列5303はそれぞれ「NAS」「Mail」「Collaboration」である。この対応文字列は集約データ管理テーブル更新処理3000のS3006においてグローバル・コンテンツ識別情報を生成する際に使用される。
なお、アプリケーション管理テーブル5300の複製が、コンテンツ集約サーバ3に記憶されるが、アプリケーション管理テーブルの複製3700は、アプリケーション管理テーブル5300の複製であり、同一の構成を有するため、説明を省略する。
次に、第1実施形態における情報処理システム1が実行する各種処理の流れについて説明する。以下の説明で主体が省略されている場合、当該主体は前述のCPU、コントローラ等である。Sはステップを表す。
図19はバックアップ制御処理5200の処理フローの一例を示している。
バックアップ制御処理5200は、例えば事前に決められた時間(例えば、毎日24:00など)に、バックアップサーバ5上の図示しないバックアップ・スケジュール・プログラムにより起動され、アプリケーション・データ10(NASデータ10a、メールデータ10b、コラボレーションデータ10c)に含まれるコンテンツに対してフルバックアップ或いは増分バックアップを行う処理である。
フルバックアップを実行するか増分バックアップを実行するかは、事前にクライアント装置2のオペレータ等により設定されており、バックアップ処理が起動される際に、バックアップ・スケジュール・プログラムは設定内容に応じてバックアップ処理を実行する。
バックアップサーバ5は、S5201において、アプリケーション管理テーブル5300に含まれる全てのアプリケーションに対して以下の処理を実行する。
バックアップサーバ5は、S5202では、処理対象とするアプリケーション(当該アプリケーション)をひとつ選択する。
バックアップサーバ5は、S5203では、今回のバックアップ制御処理5200でフルバックアップを実行するのか、増分バックアップを実行するのかを判定する。
バックアップサーバ5は、フルバックアップを実行するのであれば(S5203「フル」)、S5204で、処理対象とするアプリケーションのアプリケーションプログラムを実行するサーバ装置に対して、そのアプリケーションプログラムが生成した全てのファイル内の全てのコンテンツの送信要求を送信する。
具体的には、バックアップサーバ5は、NASデータ10aに対するバックアップの場合はバックアップサーバ5、メールデータ10bに対するバックアップの場合はメールサーバ6、コラボレーションデータ10cに対するバックアップの場合はコラボレーションサーバ7に対して、コンテンツの送信要求を送信する。
バックアップサーバ5は、増分バックアップを実行するのであれば(S5203「増分」)、S5205で、処理対象とするアプリケーションのアプリケーションプログラムを実行するサーバ装置に対して、当該アプリケーションのアプリケーション・データ10に含まれるコンテンツのうち、前回のバックアップ制御処理5200の実行以降に、追加・更新・削除されたコンテンツ(増分コンテンツ)の送信要求を送信する。
そして、上記送信要求を受信したサーバ装置は、処理対象とするコンテンツ(当該コンテンツ)をひとつ選択する(S5206)。
サーバ装置は、S5207では、当該コンテンツを対象として処理を行うようデータ読み出し・変換処理5000、6000、7000(それぞれアプリケーションの種別がNAS、メール、コラボレーションの場合)のプログラムに指示する。データ読み出し・変換処理5000、6000、7000の具体的な処理内容については後述する。
そうするとバックアップサーバ5は、S5208では、当該コンテンツのコンテンツ識別情報及びメタデータをデータ読み出し・変換処理5000、6000、7000(それぞれアプリケーションの種別がNAS、メール、コラボレーションの場合)のプログラムから受信する。
バックアップサーバ5は、S5209では、当該コンテンツのデータに関する格納位置情報をデータ書き出し処理5100のプログラムから受信する。
バックアップサーバ5は、S5210では、コンテンツに関する各種情報をバックアップカタログに登録する。具体的には、処理対象のアプリケーションがNAS、メール、コラボレーションであれば、それぞれ、NAS用のバックアップカタログ情報管理テーブル5400、メール用のバックアップカタログ情報管理テーブル5500、コラボレーション用のバックアップカタログ情報管理テーブル5600にエントリを追加する。
追加エントリのコンテンツ識別情報5401、5501、5601には、受信したコンテンツ識別情報を設定する。追加エントリの世代情報5402、5502、5602には、今回のバックアップ制御処理5200の実行に対応する世代情報(「世代1」「世代2」など)を設定する。
具体的には、バックアップサーバ5は、受信したコンテンツ識別情報と同一のコンテンツ識別情報が既にバックアップカタログに記憶されている場合には、当該コンテンツ識別情報と対応付けられている世代情報のうちの最新の世代情報を1世代分繰り上げて新たな世代情報を生成し、世代情報5402、5502、5602に格納する。
追加エントリの前世代との関連5403、5503、5603には、当該コンテンツが前回のバックアップ制御処理5200以降に追加、更新、削除されたのであればそれぞれ「追加」、「更新」、「削除」を設定する。
バックアップサーバ5は、追加エントリの格納位置情報5404、5504、5604には受信した格納位置情報を設定する。バックアップサーバ5は、追加エントリのメタデータ5405、5505、5605には受信したメタデータを設定する。
バックアップサーバ5は、S5211では、サーバ装置に対して、未処理のコンテンツが存在するか否かを問い合わせる。サーバ装置は、S5211では、未処理のコンテンツが存在するかを判定し、存在するのであれば(S5211「Y」)、S5206に進み、存在しないのであれば(S5211「N」)、S5212に進む。
サーバ装置は、未処理のコンテンツが存在しないのであれば、バックアップサーバ5に対し、その旨の情報を送信する。
そうすると、バックアップサーバ5は、S5212では、未処理のアプリケーションが存在するかを判定し、存在するのであれば(S5212「Y」)、S5202に進み、存在しないのであれば(S5212「N」)、バックアップ制御処理5200を終了する。
図20は、図19に示したS5207のデータ読み出し・変換処理5000の処理フローの一例を示している。データ読み出し・変換処理6000、7000の処理フローもデータ読み出し・変換処理5000の処理フローと同様である。
サーバ装置は、S5001では、バックアップ制御処理5200から上記処理の指示を受理する。
サーバ装置は、S5002では、アプリケーション・データ10(NASデータ10a、メールデータ10b、コラボレーションデータ10c)に含まれるコンテンツ一件に関してデータとメタデータを読み出す。
サーバ装置は、S5003では、読み出したコンテンツのデータを書き出しフォーマットに変換する。この変換により読み出したコンテンツのフォーマットがアプリケーション固有のフォーマットから共通フォーマットに変換される。
サーバ装置は、S5004では、変換したコンテンツのデータ及び読み出したメタデータをデータ書き出し処理5100のプログラムに送信する。データ書き出し処理5100については、後述する。
バックアップサーバ5は、S5005では、処理対象のコンテンツのコンテンツ識別情報およびメタデータをバックアップ制御処理5200のプログラムに送信する。
図21は、図20で示したS5004のデータ書き出し処理5100の処理フローの一例を示している。
バックアップサーバ5は、S5101では、データ読み出し・変換処理5000、6000、7000からコンテンツのデータ及びメタデータを受領する。
バックアップサーバ5は、S5102では、バックアップファイルに受領したコンテンツのデータ及びメタデータを格納する。具体的には、コンテンツがNASデータ10a、メールデータ10b、コラボレーションデータ10cのコンテンツであれば、それぞれバックアップファイル11a、11b、11cに受領したコンテンツのデータ及びメタデータを格納する。
バックアップサーバ5は、S5103では、S5102におけるデータの格納位置情報(オフセット、データ長)を特定し、特定したデータの格納位置情報をバックアップ制御処理5200のプログラムに送信する。
以上のようにして、ストレージ装置4tが有する記録媒体に記憶されている各ファイル内のコンテンツの複製をストレージ装置4sが有する記録媒体に記憶するバックアップ処理が行われる。
図22は、コンテンツ集約サーバ3により実行される集約データ管理テーブル更新処理3000の処理フローの一例を示している。集約データ管理テーブル更新処理3000はバックアップ制御処理5200が完了した後に実行される。
コンテンツ集約サーバ3は、S3001では、ストレージ装置4sに記憶されているバックアップカタログ15(具体的には、バックアップカタログ12a、12b、12c)をコンテンツ集約サーバ3のHDD33にコピーする。
コンテンツ集約サーバ3は、S3002では、アプリケーション管理テーブルの複製3700に含まれるすべてのアプリケーションに対してS3003以降の処理を実施する。
コンテンツ集約サーバ3は、S3003では、アプリケーション管理テーブルの複製3700からアプリケーションをひとつ選択する。
コンテンツ集約サーバ3は、S3004では、選択したアプリケーションに対応するバックアップカタログ情報管理テーブルを特定し(バックアップカタログ情報管理テーブル5400、5500、5600のいずれか)、特定したバックアップカタログ情報管理テーブルに含まれるエントリのうち、世代情報(世代情報5402、5502、5602)が最新世代(世代“N”のNが最も大きい世代)であるエントリに対してS3005以降の処理を実施する。
コンテンツ集約サーバ3は、S3005では、特定したバックアップカタログ情報管理テーブル(5400、5500、5600のいずれか)のエントリをひとつ選択する(対象エントリと呼ぶ)。
コンテンツ集約サーバ3は、S3006では、アプリケーションの種別および対象エントリのコンテンツ識別情報からグローバル・コンテンツ識別情報を生成する。
具体的には、コンテンツ集約サーバ3は、まず、処理対象のアプリケーションのアプリケーション種別に基づき、アプリケーションに対応する文字列(対応文字列5303)を特定する。次に、コンテンツ集約サーバ3は、対象エントリのコンテンツ識別情報(コンテンツ識別情報5401、5501、5601)に含まれるエントリ(NASの場合は共有名5401a及びファイルパス5401b、メールの場合はアカウント情報5501aとメールID5501b、コラボレーションの場合はプロジェクト情報5601aとファイルパス5601b)を文字列として連結することによりコンテンツ識別情報に対応する文字列を得る。最後に、コンテンツ集約サーバ3は、アプリケーションに対応する文字列とコンテンツ識別情報に対応する文字列を連結することにより、グローバル・コンテンツ識別情報を得る。
グローバル・コンテンツ識別情報の生成に関して、NASの場合についての例を示す。NASの場合、アプリ−ケーションに対応する文字列は“NAS”である(アプリケーション管理テーブル5300の第一エントリより)。また、図13における、NAS用のバックアップカタログ情報管理テーブル5400の第一エントリから得られるコンテンツ識別情報に対応する文字列は、「ShareA」と「/dirA/fileA」を連結した「/ShareA/dirA/fileA」である。従って、NAS用のバックアップカタログ情報管理テーブル5400の第一エントリに対するグローバル・コンテンツ識別情報は「/NAS/ShareA/dirA/fileA」と生成される。
コンテンツ集約サーバ3は、S3007では、対象エントリのグローバル・コンテンツ識別情報、世代情報、前世代との関連、格納位置情報、メタデータに基づき、集約データ管理テーブル3500を更新する。
具体的には、コンテンツ集約サーバ3は、まず、集約データ管理テーブル3500に新規エントリを追加する。次に、コンテンツ集約サーバ3は、対象エントリにおける前世代との関連(5403、5503、5603)の値に基づいて、以下の処理を行う。
コンテンツ集約サーバ3は、前世代との関連の値が「追加」あるいは「更新」の場合は、新規エントリのグローバル・コンテンツ識別情報3501にS3506で生成したグローバル・コンテンツ識別情報を設定する。
そしてコンテンツ集約サーバ3は、新規エントリのファイル3503aの欄に対しては、アプリケーションの種別に応じたバックアップファイルの識別子(NAS、メール、コラボレーションの場合、それぞれ「File_a」、「File_b」、「File_c」)を設定する。
さらにまたコンテンツ集約サーバ3は、新規エントリの世代情報3502、オフセット3503b、データ長3503c、更新時刻3504a、アクセス制御情報3504bの各欄には、アプリケーションの種別がNASの場合は、NAS用のバックアップカタログ情報管理テーブル5400における対応情報を設定し、アプリケーションの種別がメールの場合は、メール用のバックアップカタログ情報管理テーブル5500における対応情報を設定し、アプリケーションの種別がコラボレーションの場合は、コラボレーション用のバックアップカタログ情報管理テーブル5600における対応情報を設定する。
次にコンテンツ集約サーバ3は、S3008では、未処理のエントリが存在するかを判定し、存在すればS3006に進み、存在しなければS3009に進む。
コンテンツ集約サーバ3は、S3009では、未処理のアプリケーションが存在するかを判定し、存在すればS3003に進み、存在しなければS3010に進む。
コンテンツ集約サーバ3は、S3010では、更新された集約データ管理テーブル3500に含まれるコンテンツの情報に基づき、検索インデックス3600を更新する。
検索インデックス3600の各エントリには、集約データ14内のコンテンツに含まれるキーワード(単語)の一覧と各キーワードにマッチするコンテンツに対応するグローバル・コンテンツ識別情報のリストが記録される。
コンテンツ集約サーバ3は、検索インデックス3600を作成しておくことで、クライアント装置2からキーワードを指定した検索要求を受信すると、指定したキーワードを含むコンテンツのグローバル・コンテンツ識別情報のリストを得てクライアント装置2に送信することができる。
図23はリード処理3100の処理フローの一例を示している。
コンテンツ集約サーバ3は、S3101では、クライアント装置2からのリード要求を受信する。リード要求には、アクセス対象のコンテンツのグローバル・コンテンツ識別情報(グローバル識別子又は詳細グローバル識別子)が指定されている。
コンテンツ集約サーバ3は、S3102では、アクセス対象のコンテンツのグローバル・コンテンツ識別情報(対象グローバル・コンテンツ識別情報と呼ぶ)及び世代情報(対象世代情報と呼ぶ)を特定する。対象グローバル・コンテンツ識別情報と対象世代情報は集約データ管理テーブル3500内でコンテンツを一意に特定するために必要である。
具体的には、コンテンツ集約サーバ3は、まず、別名管理テーブル3800を参照し、グローバル・コンテンツ識別情報の別名3801が、指定されたグローバル・コンテンツ識別情報に一致するエントリがあるかを調べる。
一致するエントリがある場合、コンテンツ集約サーバ3は、対象グローバル・コンテンツ識別情報としてそのエントリに含まれる対応グローバル・コンテンツ識別情報3802を用い、対象世代情報としてそのエントリに含まれる対応世代情報3803を用いる。
一致するエントリがない場合、コンテンツ集約サーバ3は、対象グローバル・コンテンツ識別情報として指定されたグローバル・コンテンツ識別情報を用い、対象世代情報として最新世代(世代“N”のNが最も大きい世代)を用いる。
コンテンツ集約サーバ3は、S3103では、集約データ管理テーブル3500を参照し、特定した対象グローバル・コンテンツ識別情報、及び、対象世代情報に対応するエントリを特定する。
具体的にはコンテンツ集約サーバ3は、グローバル・コンテンツ識別情報3501及び世代情報3502がそれぞれ、S3102で特定した対象グローバル・コンテンツ識別情報及び前記対象世代情報に一致するエントリ(対象エントリ呼ぶ)を探す。
一致するエントリが見つからなかった場合、コンテンツ集約サーバ3は、クライアント装置2にエラーを送信して処理を終了する。
一致するエントリが見つかった場合、コンテンツ集約サーバ3は、見つかったエントリを対象エントリとして、S3104以降の処理を行う。
コンテンツ集約サーバ3は、S3104では、リード要求を行ったユーザ(当該ユーザ)が対象エントリに対応するコンテンツ(対象コンテンツと呼ぶ)に対してアクセス権を保持しているかを判定する。
具体的には、コンテンツ集約サーバ3は、集約データ管理テーブル3500のアクセス制御情報3504bを参照し、当該ユーザが対象コンテンツに対してアクセス許可を持つユーザであるか、あるいは、当該ユーザが対象コンテンツに対してアクセス許可を持つグループに属しているかを判定する。
該当すれば、コンテンツ集約サーバ3は、当該ユーザは対象コンテンツに対してアクセス権を持つと判断し、該当しなければ、コンテンツ集約サーバ3は、当該ユーザは対象コンテンツに対してアクセス権を持たないと判断する。
コンテンツ集約サーバ3は、アクセス権を持つと判断した場合(S3104「Y」)、S3105に進み、アクセス権を許ないと判断した場合(S3104「N」)、S3108に進む。
コンテンツ集約サーバ3は、S3105では、対象エントリの格納位置情報3503を参照することにより、データの格納位置情報を特定する。
コンテンツ集約サーバ3は、S3106では、S3105で特定した格納位置情報に基づき、バックアップファイルから対象コンテンツのデータを読み出す。具体的にはコンテンツ集約サーバ3は、アプリケーションの種別に応じて、バックアップファイル11a、11b、11cのいずれかのバックアップファイルにおける、前記特定した格納位置情報に対応する位置から対象コンテンツのデータを読み出す。
コンテンツ集約サーバ3は、S3107では、読み出したデータをクライアント装置2に送信する。
コンテンツ集約サーバ3は、S3108では、クライアント装置2にエラーである旨を送信する。
図24は、ライト処理3200の処理フローの一例を示している。
コンテンツ集約サーバ3は、S3201では、クライアント装置2からのライト要求を受信する。ライト要求には、アクセス対象のコンテンツのグローバル・コンテンツ識別情報、及び、ライト対象のデータ(更新されたコンテンツ)及びメタデータが含まれている。
コンテンツ集約サーバ3は、S3202では、アクセス対象のコンテンツのグローバル・コンテンツ識別情報(対象グローバル・コンテンツ識別情報と呼ぶ)及び世代情報(対象世代情報と呼ぶ)を特定する。具体的な処理はリード処理3100のS3102と同様である。
コンテンツ集約サーバ3は、S3203では、集約データ管理テーブル3500を参照し、特定した対象グローバル・コンテンツ識別情報、及び、対象世代情報に対応するエントリを特定する。
具体的にはコンテンツ集約サーバ3は、グローバル・コンテンツ識別情報3501及び世代情報3502がそれぞれ前記対象グローバル・コンテンツ識別情報及び前記対象世代情報に一致するエントリ(対象エントリ呼ぶ)を探す。一致するエントリは見つかる場合と見つからない場合がある。一致するエントリが見つかる場合は、既存のエントリを更新する場合であり、見つからない場合は、新規のエントリを追加する場合である(エントリの更新・追加はS3206で実施する)。
コンテンツ集約サーバ3は、S3204では、エントリが見つかった場合、ライト要求を行ったユーザ(当該ユーザ)が対象エントリに対応するコンテンツ(対象コンテンツ)に対してアクセス権を保持しているかを判定する。
一方エントリが見つからなかった場合、コンテンツ集約サーバ3は、ライト要求を行ったユーザ(当該ユーザ)が対象ディレクトリ(ライト対象のデータが格納されるディレクトリ)に対してアクセス権を保持しているかを判定する。
エントリが見つかった場合の具体的な処理はリード処理3100のS3104と同様である。
エントリが見つからなかった場合の具体的な処理は以下の通りである。即ち、コンテンツ集約サーバ3は、集約データ管理テーブル3500のアクセス制御情報3504bを参照し、当該ユーザが、対象ディレクトリに対してアクセス許可を持つユーザであるか、あるいは、当該ユーザが、対象ディレクトリに対してアクセス許可を持つグループに属しているかを判定し、該当すれば、当該ユーザは対象ディレクトリに対してアクセス権を持つと判断し、該当しなければ、当該ユーザはアクセス対象ディレクトリ対してアクセス権を持たないと判断する。
コンテンツ集約サーバ3は、アクセス権(エントリが見つかった場合は対象コンテンツに対するアクセス権、エントリが見つからなかった場合は対象ディレクトリに対するアクセス権)を持つと判断した場合(S3204「Y」)、S3205に進み、アクセス権を許ないと判断した場合(S3204「N」)、S3208に進む。
コンテンツ集約サーバ3は、S3205では、ライト要求と共に送信されたデータを、集約データ14ではなく、更新データ13に書き込む。つまり、コンテンツ集約サーバ3は、ライト要求と共に送信された更新後のコンテンツを、更新前のコンテンツが記憶されていた記憶位置とは異なる記憶位置に書き込む。これにより、コンテンツが更新されたとしても、更新前のコンテンツの内容を保存しておくことが可能となる。
そしてコンテンツ集約サーバ3は、S3206では、集約データ管理テーブル(更新管理テーブル)3500を更新する。具体的には、エントリが見つかった場合、コンテンツ集約サーバ3は、S3205でライト対象のデータを書き込んだ格納位置情報を対象エントリの格納位置情報3503に設定する(ファイル3503aには更新データを格納するファイルを示す「FileUpdate」を指定する)。またコンテンツ集約サーバ3は、対象エントリのメタデータ3504に、ライト要求で指定されたメタデータを設定する。
また、エントリが見つからなかった場合、コンテンツ集約サーバ3は、集約データ管理テーブル3500に新規エントリを追加し、世代情報3502に最新世代の情報を設定する。またコンテンツ集約サーバ3は、新規エントリの格納位置情報3503にS3205でライト対象のデータを書き込んだ格納位置情報を設定する(ファイル3503aには更新データを格納するファイルを示す「FileUpdate」を指定する)。またコンテンツ集約サーバ3は、新規エントリのメタデータ3504に、ライト要求で指定されたメタデータを設定する。
これによりコンテンツ集約サーバ3は、次回、クライアント装置2からコンテンツのリード要求があった場合には、上記ライト対象のデータを読み出し、クライアント装置2に送信する。
コンテンツ集約サーバ3は、S3207では、クライアント装置2に完了報告を送信する。コンテンツ集約サーバ3は、S3208では、クライアント装置2にエラーを送信する。
図25は、削除処理3300の処理フローの一例を示している。
コンテンツ集約サーバ3は、S3301では、クライアント装置2からのコンテンツの削除要求を受信する。削除要求には、削除対象のコンテンツのグローバル・コンテンツ識別情報が指定されている。
コンテンツ集約サーバ3は、S3302では、削除対象のコンテンツのグローバル・コンテンツ識別情報(対象グローバル・コンテンツ識別情報と呼ぶ)及び世代情報(対象世代情報と呼ぶ)を特定する。具体的な処理はリード処理3100のS3102と同様である。
コンテンツ集約サーバ3は、S3303では、集約データ管理テーブル3500を参照し、特定した対象グローバル・コンテンツ識別情報、及び、対象世代情報に対応するエントリを特定する。
具体的にはコンテンツ集約サーバ3は、グローバル・コンテンツ識別情報3501及び世代情報3502がそれぞれ前記対象グローバル・コンテンツ識別情報及び前記対象世代情報に一致するエントリ(対象エントリ呼ぶ)を探す。一致するエントリは見つかる場合と見つからない場合がある。
一致するエントリが見つかる場合は、削除対象のエントリが存在する場合であり、コンテンツ集約サーバ3は、S3304に進む。見つからない場合は、削除対象のエントリが存在しない場合である。エントリが見つからない場合はコンテンツ集約サーバ3は、エラー終了する。
コンテンツ集約サーバ3は、S3304では、削除要求を行ったユーザ(当該ユーザ)が削除対象のエントリに対応するコンテンツ(対象コンテンツと呼ぶ)に対してアクセス権を保持しているかを判定する。具体的な判断処理はS3104と同様である。
コンテンツ集約サーバ3は、アクセス権を持つと判断した場合(S3304「Y」)、S3305に進み、アクセス権を持たないと判断した場合(S3304「N」)、S3309に進む。
コンテンツ集約サーバ3は、S3305では、削除対象のコンテンツが更新データ13に含まれるデータであるかを判定する。具体的には、コンテンツ集約サーバ3は、削除対象のエントリのファイル3503aを参照し、更新データ13に対応するファイルを表す「FileUpdate」であれば、削除対象のコンテンツが更新データ13に含まれるデータであると判定し(S3305「Y」)、S3306に進み、そうでなければ(S3305「N」)、S3307に進む。
コンテンツ集約サーバ3は、S3306では、更新データから削除対象のコンテンツを削除する。具体的にはコンテンツ集約サーバ3は、削除対象のエントリの格納位置情報3503を参照し、当該格納位置に格納されたデータを削除する。
コンテンツ集約サーバ3は、S3307では、集約データ管理テーブル3500を更新する。具体的には、コンテンツ集約サーバ3は、対象エントリの格納位置情報3503、メタデータ3504に無効値を示す「N/A」を設定する。
このように、クライアント装置2からコンテンツの削除要求が送信され、削除処理が実施されたとしても、集約データ14のコンテンツは削除されないので、元のコンテンツの内容を保存しておくことが可能となる。
コンテンツ集約サーバ3は、S3308では、クライアント装置に完了報告を送信する。コンテンツ集約サーバ3は、S3308では、クライアント装置にエラーを送信する。
図26は、検索処理3400の処理フローの一例を示している。
コンテンツ集約サーバ3は、S3401では、クライアント装置2から検索要求を受信する。検索要求には検索クエリー(単語)が含まれている。
コンテンツ集約サーバ3は、S3402では、検索要求を送信してきたユーザがアクセス権を持つ集約データ14内のコンテンツを対象に、検索インデックス3600からキーワード(検索クエリー)にマッチする単語を含むコンテンツに対応するグローバル・コンテンツ識別情報のリストを検索する。コンテンツ集約サーバ3は、ユーザがアクセス権を持つか否かを集約データ管理テーブル3500のアクセス制御情報3504bを参照することにより判定する。
コンテンツ集約サーバ3は、S3403では、検索結果として得られたグローバル・コンテンツ識別情報のリストをクライアント装置2に送信する。
以上のように本実施形態によれば、異なるフォーマットでコンテンツをファイルに格納する各アプリケーション・プログラムによりそれぞれ生成されたファイルに対して、変換プログラムを用いなくても統一的なアクセスが可能になる。
なお、本実施形態では、各種データを格納するストレージ装置として2台のストレージ装置4s、4tを用いたが、1台のストレージ装置に各種データを格納してもよい。また、本実施形態では、コンテンツ集約サーバ3とバックアップサーバ5を物理的に別々のサーバ装置として構成する例を示したが、1台のサーバ装置として構成してもよい。また、バックアップファイル11をストレージ装置4s以外に図示しないテープ装置にも作成してよい。
また、バックアップサーバ5に代えてアーカイブサーバを用いてもよい。バックアップサーバ5はストレージ装置4t内のコンテンツ(オリジナルコンテンツ)の複製をストレージ装置4t内に記録した後にオリジナルコンテンツを消去しないのに対して、アーカイブサーバはストレージ装置4t内のコンテンツ(オリジナルコンテンツ)の複製をストレージ装置4s内に記録した後に、オリジナルコンテンツを消去する。アーカイブサーバを用いることにより、例えば、コンテンツをビットコストの高い記憶媒体からビットコストの低い記録媒体にマイグレーションすることができる。
==第2実施形態==
次に、図27〜図34を参照しながら、第2実施形態の情報処理システム100について説明する。
図27は、第2実施形態における情報処理システム100の構成例を示している。以下の説明では、第1実施形態と相違する部分について説明する。
第2実施形態に係る情報処理システム100は、エンタープライズサーチサーバ8を備える。エンタープライズサーチサーバ8は、ストレージ装置4tが有する記録媒体に記録されている各ファイル内のコンテンツの複製をストレージ装置4sが有する記録媒体に記憶するコンテンツ収集処理を行い、そして、ストレージ装置4sが有する記録媒体に記憶した各コンテンツに記述されている単語を抽出し、抽出した単語と、抽出した単語が記述されているファイルの識別子と、を単語毎に対応付けて記憶した検索インデックス(ファイルインデックス)を生成する。そして、エンタープライズサーチサーバ8は、クライアント装置2a、2bから単語を指定したファイルの検索要求を受信し、その単語と対応付けてファイルインデックスに記憶されているファイルの識別子のリストをクライアント装置2a、2bに送信する。
より詳しくは、エンタープライズサーチサーバ8は、アプリケーション・データ10に含まれるコンテンツを収集し、収集したコンテンツに対して検索インデックス(ファイルインデックス)を作成し、クライアント装置2a、2bに対して、収集したコンテンツに対する検索結果を提供するサーバである。
エンタープライズサーチサーバ8のハードウェア構成は、バックアップサーバ5と同様である。
エンタープライズサーチサーバ8は、検索インデックス20、及び、検索インデックス中間データ16から構成される検索インデックス中間データ群17を記憶している。
また、第2実施形態では、ストレージ装置4sは、バックアップファイル11から構成される集約データ14ではなく、キャッシュファイル18から構成される集約データ19を記憶している。
図28は、第2実施形態におけるコンテンツ集約サーバ3のハードウェア構成図を示している。
第2実施形態に係るコンテンツ集約サーバ3は、第1実施形態に係るコンテンツ集約サーバ3とほぼ同様の構成であるが、メモリ31上に、集約データ管理テーブル更新処理3000ではなく、集約データ管理テーブル更新処理3900を記憶している。
図29は、第2実施形態におけるエンタープライズサーチサーバ8のハードウェア構成図を示している。エンタープライズサーチサーバ8の構成は、第1実施形態で説明したバックアップサーバ5の構成とほぼ同様であるが、メモリ51上に、クローラ処理8000、検索インデックス作成処理8100といった処理を行うプログラムや、アプリケーション管理テーブル5300、NAS用/メール用/コラボレーション用の検索インデックス中間データ管理テーブル8200、8300、8400といったテーブルを格納している。
クローラ処理8000は、ストレージ装置4tが有する記録媒体に記録されている各ファイル内のコンテンツの複製をストレージ装置4sが有する記録媒体に記憶するコンテンツ収集処理を実行するプログラムである。
検索インデックス作成処理8100は、ストレージ装置4sが有する記録媒体に記憶した各コンテンツに記述されている単語を抽出し、抽出した単語と、抽出した単語が記述されているファイルの識別子と、を単語毎に対応付けて記憶したファイルインデックスを生成するプログラムである。
図30は、第2実施形態における情報処理システム100の概念図を示している。
図30に示すように、第2実施形態に係る情報処理システム100には、集約データ・クライアント・プログラム2000、リード処理3100、集約データ管理テーブル3500、集約データ19(キャッシュファイル18の集合体)、アプリケーション・データ10(NASデータ10a、メールデータ10b、コラボレーションデータ10c)、検索インデックス中間データ群17(検索インデックス中間データ16の集合体)、検索インデックス20が含まれる。
検索インデックス20は、クライアント装置2a、2bから送信されるキーワードに基づき、キーワードを含むファイルを特定するためのインデックスであり、例えば、転置インデックスと呼ばれる公知のデータ構造を利用することができる。
検索インデックス中間データ16は検索インデックス20を生成するために使用するデータであり、ファイルの識別情報とファイルに含まれるキーワードのリストなどを記憶する。
検索インデックス中間データ16a、16b、16cは、後述するNAS用/メール用/コラボレーション用の検索インデックス中間データ管理テーブル8200、8300、8400に対応する。
第2実施形態の情報処理システム100が行う処理を、以下の3つの部分に分けて説明する。即ち、(a)クローリング・検索インデックス生成、(b)集約データ管理テーブル更新、(c)コンテンツ・アクセスの3つの処理部分である。
<(a)クローリング・検索インデックス生成>
クローリング・検索インデックス生成の処理部分(クローラ処理8000、検索インデックス作成処理8100に対応)においては、エンタープライズサーチサーバ8は、アプリケーション・データ10(NASデータ10a、メールデータ10b、コラボレーションデータ10c)に含まれるコンテンツの複製(キャッシュデータ)をキャッシュファイル18に格納し(図30の「(1)−aクローリング」に対応)、それに対応して検索インデックス中間データ16を生成する(図30の「(1)−b検索インデックス中間データ生成」に対応)。その後、エンタープライズサーチサーバ8は、検索インデックス中間データ16に基づいて、検索インデックス20を生成する(図30の「(1)−c検索インデックス生成」)。
NASデータ10aに基づいて、検索インデックス中間データ16aを生成するまでの処理内容の概略は以下のとおりである。
まず、エンタープライズサーチサーバ8は、NASデータ10aのコンテンツのデータ及びメタデータを読み出し、キャッシュファイル18aに格納する。次に、エンタープライズサーチサーバ8は、キャッシュファイル18aに格納したコンテンツのコンテンツ識別情報、格納位置情報、メタデータをNAS用の検索インデックス中間データ管理テーブル8200に追記する。
また、メールデータ10bに基づいて、検索インデックス中間データ16bを生成するまでの処理内容の概略は以下のとおりである。
まず、メールサーバ6は、メールデータ10bのコンテンツのデータ及びメタデータを読み出し、エンタープライズサーチサーバ8に送信する。次に、エンタープライズサーチサーバ8は受信したコンテンツのデータ(及びメタデータ)をキャッシュファイル18bに格納する。最後に、格納されたコンテンツのコンテンツ識別情報、格納位置情報、メタデータをメール用の検索インデックス中間データ管理テーブル8300に追記する。
コラボレーションデータ10cに基づいて、検索インデックス中間データ16cを生成するまでの処理内容は、メールデータ10bに関しての処理内容と同様であるので説明を省略する(キャッシュファイル18b、メール用の検索インデックス中間データ管理テーブル8300をそれぞれキャッシュファイル18c、コラボレーション用の検索インデックス中間データ管理テーブル8400に読み替える)。
<(b)集約データ管理テーブル更新>
集約データ管理テーブル更新の処理部分においては、検索インデックス中間データ群17内の検索インデックス中間データ16(検索インデックス中間データ16a、16b、16cはそれぞれ後述するNAS用/メール用/コラボレーション用の検索インデックス中間データ管理テーブル8200、8300、8400に対応する)に含まれるエントリの情報に基づいて、集約データ管理テーブル3500に新しいエントリが追加される(これをエントリ追加処理と呼ぶ)。本処理は図30の(2)集約データ管理テーブル更新に対応する。
追加されるエントリにはグローバル・コンテンツ識別情報、コンテンツの格納位置情報、アクセス制御情報などが含まれる。グローバル・コンテンツ識別情報は、当該エントリに対応するアプリケーション(NAS、メール、コラボレーション)の種類に応じたアプリケーション識別子、及び、検索インデックス中間データ16のエントリに含まれるコンテンツ識別情報を文字列として連結することで生成される。
エントリ追加処理は、検索インデックス中間データ群17内の検索インデックス中間データ16に含まれる全てのエントリに対して行われる。
エントリ追加処理が全て完了した後には、集約データ管理テーブル3500の情報を用いて、集約データ19内のキャッシュファイル18に含まれるすべてのコンテンツの格納位置情報を特定できるようになる。
集約データ管理テーブル更新の処理に関する更に詳細な説明は後述する。
<(c)コンテンツ・アクセス>
コンテンツ・アクセスの処理部分においては、集約データ・クライアント・プログラム2000がグローバル・コンテンツ識別情報を指定してコンテンツにアクセスを行う。本処理部分は、図30における、(3)リード要求、(4)データ格納位置情報参照、(5)データ読み出し、(6)リード応答に対応する。
図30の(3)(4)(5)(6)の処理は、それぞれ図11の(3)(4)(5)(6)の処理に対し、バックアップファイル11をキャッシュファイル18に読み替えることにより、対応する。
以下では第2実施形態におけるテーブルの構成例について説明する。
図31は、第2実施形態における、NAS用の検索インデックス中間データ管理テーブル8200の構成例を示している。
NAS用の検索インデックス中間データ管理テーブル8200は、NASデータ10a内に含まれるコンテンツの複製が格納されたキャッシュファイルであるキャッシュファイル18aに含まれるコンテンツに関する情報が格納されるテーブルである。
NAS用の検索インデックス中間データ管理テーブル8200は、コンテンツ識別情報8201、格納位置情報8202、メタデータ8203、キーワード8204から構成される。
コンテンツ識別情報8201は共有名8201a、ファイルパス8201bから構成される。格納位置情報8202はオフセット8202a、データ長8202bから構成される。メタデータ8203は更新時刻8203a、アクセス制御情報8203bから構成される。
コンテンツ識別情報8201は、NASデータ10aに対応するキャッシュファイル18a内に含まれるコンテンツを一意に識別するための情報である。コンテンツ識別情報8201の具体的な内容はNAS用のバックアップカタログ情報管理テーブル5400と同様である。
格納位置情報8202は、コンテンツのキャッシュファイル18a内での格納位置に関する情報である。格納位置情報8202の具体的な内容はNAS用のバックアップカタログ情報管理テーブル5400と同様である。
メタデータ8203は、コンテンツに関する情報である。メタデータ8203の具体的な内容はNAS用のバックアップカタログ情報管理テーブル5400と同様である。
キーワード8204には、コンテンツ識別情報8201に対応するコンテンツに含まれるキーワードのリストが格納される。
図32は、第2実施形態における、メール用の検索インデックス中間データ管理テーブル8300の構成例を示している。
メール用の検索インデックス中間データ管理テーブル8300は、メールデータ10b内に含まれるコンテンツの複製が格納されたキャッシュファイルであるキャッシュファイル18bに含まれるコンテンツに関する情報が格納されるテーブルである。
メール用の検索インデックス中間データ管理テーブル8300は、コンテンツ識別情報8301、格納位置情報8302、メタデータ8303、キーワード8304から構成される。
コンテンツ識別情報8301はアカウント情報8301a、メールID8301bから構成される。格納位置情報8302はオフセット8302a、データ長8302bから構成される。メタデータ8303は更新時刻8303a、アクセス制御情報8303bから構成される。
コンテンツ識別情報8301は、メールデータ10bに対応するキャッシュファイル18b内に含まれるコンテンツを一意に識別するための情報である。コンテンツ識別情報8301の具体的な内容はメール用のバックアップカタログ情報管理テーブル5500と同様である。
格納位置情報8302は、コンテンツのキャッシュファイル18b内での格納位置に関する情報である。格納位置情報8302の具体的な内容はメール用のバックアップカタログ情報管理テーブル5500と同様である。
メタデータ8303は、コンテンツに関する情報である。メタデータ8303の具体的な内容はメール用のバックアップカタログ情報管理テーブル5500と同様である。
キーワード8304には、コンテンツ識別情報8301に対応するコンテンツに含まれるキーワードのリストが格納される。
図33は、第2実施形態における、コラボレーション用の検索インデックス中間データ管理テーブル8400の構成例を示している。
コラボレーション用の検索インデックス中間データ管理テーブル8400は、コラボレーションデータ10c内に含まれるコンテンツの複製が格納されたキャッシュファイルであるキャッシュファイル18cに含まれるコンテンツに関する情報が格納されるテーブルである。
コラボレーション用の検索インデックス中間データ管理テーブル8400は、コンテンツ識別情報8401、格納位置情報8402、メタデータ8403、キーワード8404から構成される。
コンテンツ識別情報8401はプロジェクト情報8401a、ファイルパス8401bから構成される。格納位置情報8402はオフセット8402a、データ長8402bから構成される。メタデータ8403は更新時刻8403a、アクセス制御情報8403bから構成される。
コンテンツ識別情報8401は、コラボレーションデータ10cに対応するキャッシュファイル18c内に含まれるコンテンツを一意に識別するための情報である。コンテンツ識別情報8401の具体的な内容はコラボレーション用のバックアップカタログ情報管理テーブル5600と同様である。
格納位置情報8402は、コンテンツのキャッシュファイル18c内での格納位置に関する情報である。格納位置情報8402の具体的な内容はコラボレーション用のバックアップカタログ情報管理テーブル5600と同様である。
メタデータ8403は、コンテンツに関する情報である。メタデータ8403の具体的な内容はコラボレーション用のバックアップカタログ情報管理テーブル5600と同様である。
キーワード8404には、コンテンツ識別情報8401に対応するコンテンツに含まれるキーワード(単語)のリストが格納される。
以下では第2実施形態に関する処理プログラムについて説明する。
図34は、第2実施形態における集約データ管理テーブル更新処理3900の処理フローの一例を示している。
集約データ管理テーブル更新処理3900のプログラムは図示しないが、コンテンツ集約サーバ3のメモリ31上に格納されている。
コンテンツ集約サーバ3は、S3901では、検索インデックス中間データ群17(具体的には、検索インデックス中間データ16a、16b、16c)をコンテンツ集約サーバ3のHDD33にコピーする。
コンテンツ集約サーバ3は、S3902では、アプリケーション管理テーブルの複製3700に含まれるすべてのアプリケーションに対してS3903以降の処理を実施する。
コンテンツ集約サーバ3は、S3903では、アプリケーション管理テーブルの複製3700からアプリケーションをひとつ選択する。
コンテンツ集約サーバ3は、S3904では、選択したアプリケーションに対応する検索インデックス中間データ管理テーブルを特定し(検索インデックス中間データ管理テーブル8200、8300、8400のいずれか)、特定した検索インデックス中間データ管理テーブルに含まれるエントリに対してS3905以降の処理を実施する。
コンテンツ集約サーバ3は、S3905では、特定した検索インデックス中間データ管理テーブル(8200、8300、8400)のエントリをひとつ選択する。
コンテンツ集約サーバ3は、S3906では、アプリケーションの種別および対象エントリのコンテンツ識別情報からグローバル・コンテンツ識別情報を生成する。
具体的な処理手順はS3006と同様である(ただし、コンテンツ識別情報5401、5501、5601をそれぞれコンテンツ識別情報8201、8301、8401に読み替える。また、共有名5401a、ファイルパス5401b、アカウント情報5501a、メールID5501b、プロジェクト情報5601a、ファイルパス5601bをそれぞれ共有名8201a、ファイルパス8201b、アカウント情報8301a、メールID8301b、プロジェクト情報8401a、ファイルパス8401bに読み替える)。
コンテンツ集約サーバ3は、S3907では、対象エントリのグローバル・コンテンツ識別情報、格納位置情報、メタデータに基づき、集約データ管理テーブル3500を更新する。
具体的には、まず、コンテンツ集約サーバ3は、集約データ管理テーブル3500に新規エントリを追加する。次に、コンテンツ集約サーバ3は、新規エントリのグローバル・コンテンツ識別情報欄3501にS3906で生成したグローバル・コンテンツ識別情報を設定する。
またコンテンツ集約サーバ3は、新規エントリのファイル欄3503aには、アプリケーションの種別に応じたキャッシュファイルの識別子(NAS、メール、コラボレーションの場合、それぞれ「File_a」、「File_b」、「File_c」)を設定する。
さらにまた、コンテンツ集約サーバ3は、新規エントリのオフセット欄3503b、データ長欄3503c、更新時刻欄3504a、アクセス制御情報欄3504bには、アプリケーションの種別がNASの場合は、NAS用の検索インデックス中間データ管理テーブル8200における対応情報を設定し、アプリケーションの種別がメールの場合は、メール用の検索インデックス中間データ管理テーブル8300における対応情報を設定し、アプリケーションの種別がコラボレーションの場合は、コラボレーション用の検索インデックス中間データ管理テーブル8400における対応情報を設定する。
コンテンツ集約サーバ3は、S3908では、未処理のエントリが存在するかを判定し、存在すればS3906に進み、存在しなければS3909に進む。
コンテンツ集約サーバ3は、S3909では、未処理のアプリケーションが存在するかを判定し、存在すればS3903に進み、存在しなければS3910に進む。
コンテンツ集約サーバ3は、S3910では、更新された集約データ管理テーブル3500の情報に基づき、検索インデックス3600を更新する。検索インデックス3600の各エントリには、キーワードとキーワードにマッチするコンテンツに対応するグローバル・コンテンツ識別情報の組が記録される。
以上のように、本実施形態によれば、異なるフォーマットでコンテンツをファイルに格納する各アプリケーション・プログラムによりそれぞれ生成されたファイルに対して、変換プログラムを用いなくても統一的なアクセスが可能になる。
なお、本実施形態では、各種データを格納するストレージ装置として2台のストレージ装置4s、4tを用いたが、1台のストレージ装置に各種データを格納してもよい。また、本実施形態では、コンテンツ集約サーバ3とエンタープライズサーチサーバ8を物理的に別々のサーバ装置として構成する例を示したが、1台のサーバ装置(情報処理装置)として構成してもよい。
また、第1実施形態で説明したバックアップサーバ5と、第2実施形態で説明したエンタープライズサーチサーバ8と、を組み合わせて、ストレージ装置4tに記憶されているコンテンツの複製をストレージ装置4sに記憶するようにすることもできる。
この場合、例えば、エンタープライズサーチサーバ8は、ストレージ装置4tに記憶されているコンテンツの内、バックアップカタログ情報管理テーブル5400、5500、5600のいずれにも記載されていないコンテンツを抽出するようにする。そして、エンタープライズサーチサーバ8は、抽出したコンテンツの複製をストレージ装置4tから読み出して、ストレージ装置4sに記憶する。
このようにすることにより、例えば、バックアップサーバ5によるバックアップ処理の対象外のコンテンツがストレージ装置4tに記憶されていたとしても、そのようなコンテンツをも、エンタープライズサーチサーバ8がストレージ装置4sに複製してくることが可能になるので、ストレージ装置4tに記憶されているコンテンツの複製をもれなくストレージ装置4sに記憶するようにすることができる。
これにより、クライアント装置2は、より多くのファイルを網羅した、精度の高いデータマイニングを行うことが可能となる。
また、以下のような実施形態とすることも可能である。
第1記録媒体を有する第1ストレージ装置と、第2記録媒体を有する第2ストレージ装置と、前記第1ストレージ装置と通信可能に接続され、第1フォーマットでコンテンツをファイルに格納し、前記ファイルを前記第1記録媒体に記憶する第1アプリケーションプログラムを実行する第1サーバと、前記第1ストレージ装置と通信可能に接続され、前記第1フォーマットとは異なる第2フォーマットでコンテンツをファイルに格納し、前記ファイルを前記第1記録媒体に記憶する第2アプリケーションプログラムを実行する第2サーバと、前記第1サーバ、前記第2サーバ及び前記第2ストレージ装置と通信可能に接続され、前記第1記録媒体に記憶されている各ファイル内のコンテンツの複製を取得し、前記第2記録媒体に記憶する情報処理装置と、前記情報処理装置と通信可能に接続され、前記情報処理装置に対してコンテンツの読み出し要求を送信し、前記情報処理装置から前記読み出し要求の対象であるコンテンツを受信するクライアントと、を備えて構成される情報処理システムにおける前記情報処理装置の制御方法であって、前記情報処理装置は、前記第1サーバに対して、前記第1アプリケーションプログラムが生成したファイル内のコンテンツの送信要求を送信し、前記情報処理装置は、前記送信要求に応じて、前記第1アプリケーションプログラムが前記第1記録媒体から読み出したコンテンツを、前記第1サーバから受信し、前記情報処理装置は、前記第1コンテンツ受信部が受信したコンテンツを前記第2記録媒体に記憶し、前記情報処理装置は、前記第2サーバに対して、前記第2アプリケーションプログラムが生成したファイル内のコンテンツの送信要求を送信し、前記情報処理装置は、前記送信要求に応じて、前記第2アプリケーションプログラムが前記第1記録媒体から読み出したコンテンツを、前記第2サーバから受信し、前記情報処理装置は、前記第2コンテンツ受信部が受信したコンテンツを前記第2記録媒体に記憶し、前記情報処理装置は、前記クライアントが前記第2記録媒体に記憶されている各コンテンツを一意に識別するためのグローバル識別子を生成し、前記情報処理装置は、前記第2記録媒体における前記各コンテンツの記憶位置を示す記憶位置情報と、前記各コンテンツのグローバル識別子とをそれぞれ対応付けてグローバル識別子管理テーブルに記憶し、前記情報処理装置は、前記クライアントからグローバル識別子を指定したコンテンツの前記読み出し要求を受信し、前記グローバル識別子と対応付けて前記グローバル識別子管理テーブルに記憶される記憶位置情報により特定される記憶位置からコンテンツを読み出して前記クライアントに送信する。
以上、上記いずれの実施形態においても、異なるフォーマットでファイルを生成する各アプリケーション・プログラムによりそれぞれ生成されたファイルに対して、変換プログラムを用いなくても統一的なアクセスが可能になる。
またすべてのアプリケーション・プログラムに対応したプロトコル変換プログラムが不要となるため、全てのアプリケーション・プログラムのデータに対する統一的なアクセス手段の実装が容易にできる。
また、異なる複数のアプリケーション・プログラムが動作するサーバ装置(群)を含む情報処理システムにおいて、クライアント装置に対して全アプリケーション・プログラムのデータへの統一的なアクセス手段を提供することができる。
またバックアップサーバが生成したバックアップカタログに基づき、オブジェクトの識別子とオブジェクトの格納位置との対応関係を保持するデータベースを生成し、このデータベースを用いてオブジェクトへのアクセスを行い、またオブジェクトへのアクセスは、シングルネームスペースを介して、異なる複数のアプリケーション・プログラムのオブジェクトに対して統一的に行う。これにより、クライアントアプリの実装を容易化することができると共に、複数のプロトコルを理解する必要がなくなる。
以上の実施形態では、企業内に存在する種々のアプリケーション・プログラムが管理する個々のオブジェクトへのアクセスをバックアップサーバで行い、バックアップカタログの解釈、変換を行う。そのため、プログラム開発工数が大幅に削減可能である。
以上、本発明の好適な実施形態を説明したが、これらは本発明の説明のための例示であって、本発明の範囲を実施例にのみ限定する趣旨ではない。本発明は、他の種々の形態でも実施することが可能である。

Claims (15)

  1. 第1記録媒体を有する第1ストレージ装置と、
    第2記録媒体を有する第2ストレージ装置と、
    前記第1ストレージ装置と通信可能に接続され、第1フォーマットでコンテンツをファイルに格納し、前記ファイルを前記第1記録媒体に記憶する第1アプリケーションプログラムを実行する第1サーバと、
    前記第1ストレージ装置と通信可能に接続され、前記第1フォーマットとは異なる第2フォーマットでコンテンツをファイルに格納し、前記ファイルを前記第1記録媒体に記憶する第2アプリケーションプログラムを実行する第2サーバと、
    前記第1サーバ、前記第2サーバ及び前記第2ストレージ装置と通信可能に接続され、前記第1記録媒体に記憶されている各ファイル内のコンテンツの複製を取得し、前記第2記録媒体に記憶する情報処理装置と、
    前記情報処理装置と通信可能に接続され、前記情報処理装置に対してコンテンツの読み出し要求を送信し、前記情報処理装置から前記読み出し要求の対象であるコンテンツを受信するクライアントと、
    を備えて構成される情報処理システムにおける前記情報処理装置であって、
    前記第1サーバに対して、前記第1アプリケーションプログラムが生成したファイル内のコンテンツの送信要求を送信する第1要求送信部と、
    前記送信要求に応じて、前記第1アプリケーションプログラムが前記第1記録媒体から読み出したコンテンツを、前記第1サーバから受信する第1コンテンツ受信部と、
    前記第1コンテンツ受信部が受信したコンテンツを前記第2記録媒体に記憶する第1コンテンツ複製部と、
    前記第2サーバに対して、前記第2アプリケーションプログラムが生成したファイル内のコンテンツの送信要求を送信する第2要求送信部と、
    前記送信要求に応じて、前記第2アプリケーションプログラムが前記第1記録媒体から読み出したコンテンツを、前記第2サーバから受信する第2コンテンツ受信部と、
    前記第2コンテンツ受信部が受信したコンテンツを前記第2記録媒体に記憶する第2コンテンツ複製部と、
    前記クライアントが前記第2記録媒体に記憶されている各コンテンツを一意に識別するためのグローバル識別子を生成するグローバル識別子生成部と、
    前記第2記録媒体における前記各コンテンツの記憶位置を示す記憶位置情報と、前記各コンテンツのグローバル識別子とをそれぞれ対応付けてグローバル識別子管理テーブルに記憶するグローバル識別子記憶部と、
    前記クライアントからグローバル識別子を指定したコンテンツの前記読み出し要求を受信し、前記グローバル識別子と対応付けて前記グローバル識別子管理テーブルに記憶される記憶位置情報により特定される記憶位置からコンテンツを読み出して前記クライアントに送信する読み出し処理部と、
    を備えることを特徴とする情報処理装置。
  2. 請求項1に記載の情報処理装置であって、
    前記第1コンテンツ複製部は、前記第1サーバから送信されてきたコンテンツに記述されている当該コンテンツの識別情報を、その識別情報で当該コンテンツを識別する前記第1アプリケーションプログラムの識別情報と対応付けて複製管理テーブルに記憶し、
    前記第2コンテンツ複製部は、前記第2サーバから送信されてきたコンテンツに記述されている当該コンテンツの識別情報を、その識別情報で当該コンテンツを識別する前記第2アプリケーションプログラムの識別情報と対応付けて前記複製管理テーブルに記憶する
    ことを特徴とする情報処理装置。
  3. 請求項2に記載の情報処理装置であって、
    前記グローバル識別子生成部は、前記複製管理テーブルに記憶されている、コンテンツの識別情報と、前記識別情報に対応付けられているアプリケーションプログラムの識別情報と、をコンテンツ毎に組み合わせることにより、各コンテンツを一意に識別するグローバル識別子を生成する
    ことを特徴とする情報処理装置。
  4. 請求項1に記載の情報処理装置であって、
    前記クライアントから、グローバル識別子を指定したコンテンツの更新要求及び更新されたコンテンツを受信した場合には、更新された前記コンテンツを前記第2記録媒体に書き込むと共に、更新された前記コンテンツの前記第2記録媒体における記憶位置を示す記憶位置情報と、前記更新要求に記述されているグローバル識別子と、を対応付けて更新管理テーブルに記憶する更新処理部と、
    を備えることを特徴とする情報処理装置。
  5. 請求項4に記載の情報処理装置であって、
    更新された前記コンテンツが記憶される前記第2記録媒体における記憶位置は、当該コンテンツが更新される前に記憶されていた前記第2記録媒体における記憶位置とは異なる
    ことを特徴とする情報処理装置。
  6. 請求項5に記載の情報処理装置であって、
    前記読み出し処理部は、前記クライアントからコンテンツの読み出し要求を受信した場合に、前記読み出し要求に記述されているグローバル識別子と同一のグローバル識別子が前記更新管理テーブルに記憶されている場合には、当該グローバル識別子と対応付けて前記更新管理テーブルに記憶されている記憶位置情報により特定される記憶位置からコンテンツを読み出して、前記クライアントに送信する
    ことを特徴とする情報処理装置。
  7. 請求項1に記載の情報処理装置であって、
    前記クライアントからグローバル識別子を指定したコンテンツの削除要求を受信した場合には、当該グローバル識別子により特定されるコンテンツを前記第2記録媒体から削除せずに、前記グローバル識別子管理テーブルに記憶されている当該グローバル識別子を削除する削除処理部と、
    を備えることを特徴とする情報処理装置。
  8. 請求項1に記載の情報処理装置であって、
    前記第2記録媒体に記憶されている各コンテンツから、各コンテンツに記述されている単語を抽出し、抽出した単語と、抽出した単語が記述されているコンテンツのグローバル識別子と、を単語毎に対応付けて記憶した検索インデックスを生成する検索インデックス生成部と、
    前記クライアントから単語を指定したコンテンツの検索要求を受信し、前記単語と対応付けて前記検索インデックスに記憶されているグローバル識別子のリストを前記クライアントに送信する検索処理部と、
    を備えることを特徴とする情報処理装置。
  9. 請求項1に記載の情報処理装置であって、
    前記グローバル識別子生成部が生成したグローバル識別子と、前記グローバル識別子により特定されるコンテンツの読み出しが許可されているユーザを示す情報と、をグローバル識別子毎にそれぞれ対応付けてアクセス管理テーブルに記憶するアクセス管理部と、
    を備え、
    前記読み出し処理部は、グローバル識別子を指定したコンテンツの前記読み出し要求を受信した際に、前記読み出し要求に記述されている当該読み出し要求を送信したユーザを示す情報が、前記読み出し要求に記述されているグローバル識別子と対応付けて前記アクセス管理テーブルに記憶されている場合には、前記読み出し要求に記述されているグローバル識別子と対応付けて前記グローバル識別子管理テーブルに記憶される記憶位置情報により特定される記憶位置からコンテンツを読み出して前記クライアントに送信する
    ことを特徴とする情報処理装置。
  10. 請求項1に記載の情報処理装置であって、
    前記第1記録媒体に記録されている各ファイル内のコンテンツの複製を前記第2記録媒体に記憶するバックアップ処理を実行するバックアップ実行部と、
    を備え、
    前記バックアップ実行部が行う前記バックアップ処理として、
    前記第1要求送信部は、前記第1サーバに対して、前記第1アプリケーションプログラムが生成したファイル内のコンテンツの送信要求を送信し、
    前記第1コンテンツ受信部は、前記送信要求に応じて前記第1アプリケーションプログラムが前記第1記録媒体から読み出したコンテンツを前記第1サーバから受信し、
    前記第1コンテンツ複製部は、前記第1コンテンツ受信部が受信したコンテンツを前記第2記録媒体に記憶し、
    前記第2要求送信部は、前記第2サーバに対して、前記第2アプリケーションプログラムが生成したファイル内のコンテンツの送信要求を送信し、
    前記第2コンテンツ受信部は、前記送信要求に応じて前記第2アプリケーションプログラムが前記第1記録媒体から読み出したコンテンツを、前記第2サーバから受信し、
    前記第2コンテンツ複製部は、前記第2コンテンツ受信部が受信したコンテンツを前記第2記録媒体に記憶する
    処理をそれぞれ実行することを特徴とする情報処理装置。
  11. 請求項10に記載の情報処理装置であって、
    前記バックアップ実行部は、バックアップ処理を実行する毎に、バックアップ処理を実行した時刻をバックアップ管理テーブルに記録し、新たにバックアップ処理を実行する際には、前回バックアップを実行した時刻と、前記第1記録媒体に記憶されている各コンテンツに記録されているコンテンツの更新時刻と、を比較し、前回実行したバックアップ処理の後に更新されたコンテンツに対してのみバックアップ処理を行う
    ことを特徴とする情報処理装置。
  12. 請求項11に記載の情報処理装置であって、
    前記第1コンテンツ複製部は、前記第1サーバから送信されてきたコンテンツに記述されている当該コンテンツの識別情報と、その識別情報で当該コンテンツを識別する前記第1アプリケーションプログラムの識別情報と、当該コンテンツがバックアップされた回数を示す世代情報と、を対応付けて複製管理テーブルに記憶し、
    前記第2コンテンツ複製部は、前記第2サーバから送信されてきたコンテンツに記述されている当該コンテンツの識別情報と、その識別情報で当該コンテンツを識別する前記第2アプリケーションプログラムの識別情報と、当該コンテンツがバックアップされた回数を示す世代情報と、を対応付けて前記複製管理テーブルに記憶し、
    前記第1コンテンツ複製部は、前記第1サーバから送信されてきたコンテンツに記述されている当該コンテンツの識別情報と同一の識別情報が既に前記複製管理テーブルに記憶されている場合には、当該識別情報と対応付けられている世代情報のうちの最新の世代情報を1世代分繰り上げて新たな世代情報を生成し、生成した前記新たな世代情報と、前記識別情報と、その識別情報で当該コンテンツを識別する前記第1アプリケーションプログラムの識別情報とを対応付けて前記複製管理テーブルに記憶し、
    前記第2コンテンツ複製部は、前記第2サーバから送信されてきたコンテンツに記述されている当該コンテンツの識別情報と同一の識別情報が既に前記複製管理テーブルに記憶されている場合には、当該識別情報と対応付けられている世代情報のうちの最新の世代情報を1世代分繰り上げて新たな世代情報を生成し、生成した前記新たな世代情報と、前記識別情報と、その識別情報で当該コンテンツを識別する前記第2アプリケーションプログラムの識別情報とを対応付けて前記複製管理テーブルに記憶し、
    前記グローバル識別子生成部は、前記複製管理テーブルに記憶されているコンテンツの識別情報と、前記識別情報に対応付けられているアプリケーションプログラムの識別情報とを組み合わせることにより各コンテンツを一意に識別するグローバル識別子を生成し、
    前記グローバル識別子記憶部は、前記第2記録媒体におけるコンテンツの記憶位置を示す記憶位置情報と、前記記憶位置に記憶されているコンテンツの世代情報と、前記コンテンツのグローバル識別子と、それぞれ対応付けて前記グローバル識別子管理テーブルに記憶する
    ことを特徴とする情報処理装置。
  13. 請求項12に記載の情報処理装置であって、
    前記グローバル識別子管理テーブルに記憶されているグローバル識別子と、前記グローバル識別子に対応付けられている世代情報とを、各グローバル識別子の世代情報毎に組み合わせることにより、各コンテンツを一意に識別する詳細グローバル識別子を生成する別名生成部と、
    前記グローバル識別子管理テーブルに記憶されているグローバル識別子と、前記グローバル識別子に対応付けられている世代情報と、前記グローバル識別子及び前記世代情報により生成された詳細グローバル識別子と、を各グローバル識別子の世代情報毎に対応付けて別名管理テーブルに記憶する別名管理部と、
    を備え、
    前記読み出し処理部は、前記クライアントから詳細グローバル識別子を指定したコンテンツの読み出し要求を受信した場合には、前記詳細グローバル識別子と対応付けて前記別名管理テーブルに記憶されるグローバル識別子及び世代情報に基づいて、前記グローバル識別子管理テーブルから読み出し対象のコンテンツの記憶位置を特定し、前記記憶位置からコンテンツを読み出して前記クライアントに送信する
    ことを特徴とする情報処理装置。
  14. 請求項1に記載の情報処理装置であって、
    前記第1記録媒体に記録されている各ファイル内のコンテンツの複製を前記第2記録媒体に記憶するコンテンツ収集処理を実行するコンテンツ収集部と、
    前記第2記録媒体に記憶した各コンテンツに記述されている単語を抽出し、抽出した単語と、抽出した単語が記述されているファイルの識別子と、を単語毎に対応付けて記憶したファイルインデックスを生成するファイルインデックス生成部と、
    前記クライアントから単語を指定したファイルの検索要求を受信し、前記単語と対応付けて前記ファイルインデックスに記憶されているファイルの識別子のリストを前記クライアントに送信するエンタープライズサーチ実行部と、
    を備え、
    前記コンテンツ収集部が行う前記コンテンツ収集処理として、
    前記第1要求送信部は、前記第1サーバに対して、前記第1アプリケーションプログラムが生成したファイル内のコンテンツの送信要求を送信し、
    前記第1コンテンツ受信部は、前記送信要求に応じて前記第1アプリケーションプログラムが前記第1記録媒体から読み出したコンテンツを前記第1サーバから受信し、
    前記第1コンテンツ複製部は、前記第1コンテンツ受信部が受信したコンテンツを前記第2記録媒体に記憶し、
    前記第2要求送信部は、前記第2サーバに対して、前記第2アプリケーションプログラムが生成したファイル内のコンテンツの送信要求を送信し、
    前記第2コンテンツ受信部は、前記送信要求に応じて前記第2アプリケーションプログラムが前記第1記録媒体から読み出したコンテンツを、前記第2サーバから受信し、
    前記第2コンテンツ複製部は、前記第2コンテンツ受信部が受信したコンテンツを前記第2記録媒体に記憶する
    処理をそれぞれ実行することを特徴とする情報処理装置。
  15. 請求項1に記載の情報処理装置であって、
    前記第1コンテンツ複製部は、前記第1サーバから送信されてきたコンテンツに記述されている当該コンテンツの識別情報を、その識別情報で当該コンテンツを識別する前記第1アプリケーションプログラムの識別情報と対応付けて複製管理テーブルに記憶し、
    前記第2コンテンツ複製部は、前記第2サーバから送信されてきたコンテンツに記述されている当該コンテンツの識別情報を、その識別情報で当該コンテンツを識別する前記第2アプリケーションプログラムの識別情報と対応付けて前記複製管理テーブルに記憶し、
    前記グローバル識別子生成部は、前記複製管理テーブルに記憶されている、コンテンツの識別情報と、前記識別情報に対応付けられているアプリケーションプログラムの識別情報と、をコンテンツ毎に組み合わせることにより、各コンテンツを一意に識別するグローバル識別子を生成し、
    前記クライアントから、グローバル識別子を指定したコンテンツの更新要求及び更新されたコンテンツを受信した場合には、更新された前記コンテンツを、当該コンテンツが更新される前に記憶されていた前記第2記録媒体における記憶位置とは異なる記憶位置に書き込むと共に、更新された前記コンテンツの前記第2記録媒体における記憶位置を示す記憶位置情報と、前記更新要求に記述されているグローバル識別子と、を対応付けて更新管理テーブルに記憶する更新処理部と、
    を備え、
    前記読み出し処理部は、前記クライアントからコンテンツの読み出し要求を受信した場合に、前記読み出し要求に記述されているグローバル識別子と同一のグローバル識別子が前記更新管理テーブルに記憶されている場合には、当該グローバル識別子と対応付けて前記更新管理テーブルに記憶されている記憶位置情報により特定される記憶位置からコンテンツを読み出して、前記クライアントに送信し、
    前記クライアントからグローバル識別子を指定したコンテンツの削除要求を受信した場合には、当該グローバル識別子により特定されるコンテンツを前記第2記録媒体から削除せずに、前記グローバル識別子管理テーブルに記憶されている当該グローバル識別子を削除する削除処理部と、
    を備え、
    前記第2記録媒体に記憶されている各コンテンツから、各コンテンツに記述されている単語を抽出し、抽出した単語と、抽出した単語が記述されているコンテンツのグローバル識別子と、を単語毎に対応付けて記憶した検索インデックスを生成する検索インデックス生成部と、
    前記クライアントから単語を指定したコンテンツの検索要求を受信し、前記単語と対応付けて前記検索インデックスに記憶されているグローバル識別子のリストを前記クライアントに送信する検索処理部と、
    を備え、
    前記グローバル識別子生成部が生成したグローバル識別子と、前記グローバル識別子により特定されるコンテンツの読み出しが許可されているユーザを示す情報と、をグローバル識別子毎にそれぞれ対応付けてアクセス管理テーブルに記憶するアクセス管理部と、
    を備え、
    前記読み出し処理部は、グローバル識別子を指定したコンテンツの前記読み出し要求を受信した際に、前記読み出し要求に記述されている当該読み出し要求を送信したユーザを示す情報が、前記読み出し要求に記述されているグローバル識別子と対応付けて前記アクセス管理テーブルに記憶されている場合には、前記読み出し要求に記述されているグローバル識別子と対応付けて前記グローバル識別子管理テーブルに記憶される記憶位置情報により特定される記憶位置からコンテンツを読み出して前記クライアントに送信し、
    前記第1記録媒体に記録されている各ファイル内のコンテンツの複製を前記第2記録媒体に記憶するバックアップ処理を実行するバックアップ実行部と、
    を備え、
    前記バックアップ実行部が行う前記バックアップ処理として、
    前記第1要求送信部は、前記第1サーバに対して、前記第1アプリケーションプログラムが生成したファイル内のコンテンツの送信要求を送信し、
    前記第1コンテンツ受信部は、前記送信要求に応じて前記第1アプリケーションプログラムが前記第1記録媒体から読み出したコンテンツを前記第1サーバから受信し、
    前記第1コンテンツ複製部は、前記第1コンテンツ受信部が受信したコンテンツを前記第2記録媒体に記憶し、
    前記第2要求送信部は、前記第2サーバに対して、前記第2アプリケーションプログラムが生成したファイル内のコンテンツの送信要求を送信し、
    前記第2コンテンツ受信部は、前記送信要求に応じて前記第2アプリケーションプログラムが前記第1記録媒体から読み出したコンテンツを、前記第2サーバから受信し、
    前記第2コンテンツ複製部は、前記第2コンテンツ受信部が受信したコンテンツを前記第2記録媒体に記憶する
    処理をそれぞれ実行し、
    前記バックアップ実行部は、バックアップ処理を実行する毎に、バックアップ処理を実行した時刻をバックアップ管理テーブルに記録し、新たにバックアップ処理を実行する際には、前回バックアップを実行した時刻と、前記第1記録媒体に記憶されている各コンテンツに記録されているコンテンツの更新時刻と、を比較し、前回実行したバックアップ処理の後に更新されたコンテンツに対してのみバックアップ処理を行い、
    前記第1コンテンツ複製部は、前記第1サーバから送信されてきたコンテンツに記述されている当該コンテンツの識別情報と、その識別情報で当該コンテンツを識別する前記第1アプリケーションプログラムの識別情報と、当該コンテンツがバックアップされた回数を示す世代情報と、を対応付けて複製管理テーブルに記憶し、
    前記第2コンテンツ複製部は、前記第2サーバから送信されてきたコンテンツに記述されている当該コンテンツの識別情報と、その識別情報で当該コンテンツを識別する前記第2アプリケーションプログラムの識別情報と、当該コンテンツがバックアップされた回数を示す世代情報と、を対応付けて前記複製管理テーブルに記憶し、
    前記第1コンテンツ複製部は、前記第1サーバから送信されてきたコンテンツに記述されている当該コンテンツの識別情報と同一の識別情報が既に前記複製管理テーブルに記憶されている場合には、当該識別情報と対応付けられている世代情報のうちの最新の世代情報を1世代分繰り上げて新たな世代情報を生成し、生成した前記新たな世代情報と、前記識別情報と、その識別情報で当該コンテンツを識別する前記第1アプリケーションプログラムの識別情報とを対応付けて前記複製管理テーブルに記憶し、
    前記第2コンテンツ複製部は、前記第2サーバから送信されてきたコンテンツに記述されている当該コンテンツの識別情報と同一の識別情報が既に前記複製管理テーブルに記憶されている場合には、当該識別情報と対応付けられている世代情報のうちの最新の世代情報を1世代分繰り上げて新たな世代情報を生成し、生成した前記新たな世代情報と、前記識別情報と、その識別情報で当該コンテンツを識別する前記第2アプリケーションプログラムの識別情報とを対応付けて前記複製管理テーブルに記憶し、
    前記グローバル識別子生成部は、前記複製管理テーブルに記憶されているコンテンツの識別情報と、前記識別情報に対応付けられているアプリケーションプログラムの識別情報とを組み合わせることにより各コンテンツを一意に識別するグローバル識別子を生成し、
    前記グローバル識別子記憶部は、前記第2記録媒体におけるコンテンツの記憶位置を示す記憶位置情報と、前記記憶位置に記憶されているコンテンツの世代情報と、前記コンテンツのグローバル識別子と、それぞれ対応付けて前記グローバル識別子管理テーブルに記憶し、
    前記グローバル識別子管理テーブルに記憶されているグローバル識別子と、前記グローバル識別子に対応付けられている世代情報とを、各グローバル識別子の世代情報毎に組み合わせることにより、各コンテンツを一意に識別する詳細グローバル識別子を生成する別名生成部と、
    前記グローバル識別子管理テーブルに記憶されているグローバル識別子と、前記グローバル識別子に対応付けられている世代情報と、前記グローバル識別子及び前記世代情報により生成された詳細グローバル識別子と、を各グローバル識別子の世代情報毎に対応付けて別名管理テーブルに記憶する別名管理部と、
    を備え、
    前記読み出し処理部は、前記クライアントから詳細グローバル識別子を指定したコンテンツの読み出し要求を受信した場合には、前記詳細グローバル識別子と対応付けて前記別名管理テーブルに記憶されるグローバル識別子及び世代情報に基づいて、前記グローバル識別子管理テーブルから読み出し対象のコンテンツの記憶位置を特定し、前記記憶位置からコンテンツを読み出して前記クライアントに送信し、
    前記第1記録媒体に記録されている各ファイル内のコンテンツの複製を前記第2記録媒体に記憶するコンテンツ収集処理を実行するコンテンツ収集部と、
    前記第2記録媒体に記憶した各コンテンツに記述されている単語を抽出し、抽出した単語と、抽出した単語が記述されているファイルの識別子と、を単語毎に対応付けて記憶したファイルインデックスを生成するファイルインデックス生成部と、
    前記クライアントから単語を指定したファイルの検索要求を受信し、前記単語と対応付けて前記ファイルインデックスに記憶されているファイルの識別子のリストを前記クライアントに送信するエンタープライズサーチ実行部と、
    を備え、
    前記コンテンツ収集部が行う前記コンテンツ収集処理として、
    前記第1要求送信部は、前記第1サーバに対して、前記第1アプリケーションプログラムが生成したファイル内のコンテンツの送信要求を送信し、
    前記第1コンテンツ受信部は、前記送信要求に応じて前記第1アプリケーションプログラムが前記第1記録媒体から読み出したコンテンツを前記第1サーバから受信し、
    前記第1コンテンツ複製部は、前記第1コンテンツ受信部が受信したコンテンツを前記第2記録媒体に記憶し、
    前記第2要求送信部は、前記第2サーバに対して、前記第2アプリケーションプログラムが生成したファイル内のコンテンツの送信要求を送信し、
    前記第2コンテンツ受信部は、前記送信要求に応じて前記第2アプリケーションプログラムが前記第1記録媒体から読み出したコンテンツを、前記第2サーバから受信し、
    前記第2コンテンツ複製部は、前記第2コンテンツ受信部が受信したコンテンツを前記第2記録媒体に記憶する処理をそれぞれ実行する
    ことを特徴とする情報処理装置。
JP2013520917A 2011-02-28 2011-02-28 情報処理装置 Expired - Fee Related JP5548825B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2011/001141 WO2012117433A1 (en) 2011-02-28 2011-02-28 Information apparatus

Publications (2)

Publication Number Publication Date
JP2013542475A true JP2013542475A (ja) 2013-11-21
JP5548825B2 JP5548825B2 (ja) 2014-07-16

Family

ID=46719700

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013520917A Expired - Fee Related JP5548825B2 (ja) 2011-02-28 2011-02-28 情報処理装置

Country Status (3)

Country Link
US (1) US8700567B2 (ja)
JP (1) JP5548825B2 (ja)
WO (1) WO2012117433A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016148989A (ja) * 2015-02-12 2016-08-18 日本電信電話株式会社 情報システム及びメッセージ登録状況照会方法
JP2017503422A (ja) * 2013-12-31 2017-01-26 華為技術有限公司Huawei Technologies Co.,Ltd. ネットワーク要素データアクセス方法および装置、およびネットワーク管理システム

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140236902A1 (en) * 2011-09-29 2014-08-21 Beijing Qihoo Technology Company Limited User Data Backup Method and Apparatus
US8606892B2 (en) * 2011-11-28 2013-12-10 Wyse Technology Inc. Deployment and updating of applications and drivers on a client device using an extensible markup language (XML) configuration file
JP5853819B2 (ja) * 2012-03-29 2016-02-09 富士通株式会社 制御プログラム、制御方法、記憶制御装置および情報処理システム
US9426053B2 (en) * 2012-12-06 2016-08-23 International Business Machines Corporation Aliasing of named data objects and named graphs for named data networks
US10241870B1 (en) * 2013-02-22 2019-03-26 Veritas Technologies Llc Discovery operations using backup data
JP6191159B2 (ja) * 2013-02-25 2017-09-06 日本電気株式会社 サーバ、バックアップシステム、バックアップ方法、および、コンピュータ・プログラム
US9251008B2 (en) * 2013-03-14 2016-02-02 International Business Machines Corporation Client object replication between a first backup server and a second backup server
US10078556B2 (en) * 2015-08-31 2018-09-18 Paypal, Inc. Data replication between databases with heterogenious data platforms
US20170286471A1 (en) * 2016-03-31 2017-10-05 Mckesson Corporation Methods and apparatuses for enterprise revision-based auditing of database management systems
US11144536B2 (en) * 2019-06-26 2021-10-12 Nice Ltd. Systems and methods for real-time analytics detection for a transaction utilizing synchronously updated statistical aggregation data

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003150763A (ja) * 2001-11-12 2003-05-23 Imazaki Akira 会計処理方法、及びその方法を実施するためのプログラムを記憶した記録媒体
JP2005521946A (ja) * 2002-04-02 2005-07-21 ノキア コーポレイション 異なるデータ記憶部にデータを記憶する手法に関して同期を取るための方法および装置
JP2006505863A (ja) * 2002-11-07 2006-02-16 トムソン グローバル リソーシーズ アー.ゲー. 電子的ドキュメントレポジトリーマネジメントおよびアクセスシステム
JP2006072986A (ja) * 2004-08-31 2006-03-16 Microsoft Corp データストアに対して動的に生成されるオペレーションを検証すること
JP2007072524A (ja) * 2005-09-02 2007-03-22 Fuji Xerox Co Ltd データサーバ及びデータ管理方法及びプログラム
JP2009116414A (ja) * 2007-11-01 2009-05-28 Hitachi Ltd 情報処理システム及びデータ管理方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3183719B2 (ja) * 1992-08-26 2001-07-09 三菱電機株式会社 アレイ型記録装置
GB9506501D0 (en) * 1995-03-30 1995-05-17 Int Computers Ltd Incremental disk backup
US5941947A (en) * 1995-08-18 1999-08-24 Microsoft Corporation System and method for controlling access to data entities in a computer network
US7516133B2 (en) 2003-10-17 2009-04-07 Hitachi, Ltd. Method and apparatus for file replication with a common format
US20060047649A1 (en) * 2003-12-29 2006-03-02 Ping Liang Internet and computer information retrieval and mining with intelligent conceptual filtering, visualization and automation
WO2010064328A1 (en) 2008-12-03 2010-06-10 Hitachi, Ltd. Information processing system and method of acquiring backup in an information processing system

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003150763A (ja) * 2001-11-12 2003-05-23 Imazaki Akira 会計処理方法、及びその方法を実施するためのプログラムを記憶した記録媒体
JP2005521946A (ja) * 2002-04-02 2005-07-21 ノキア コーポレイション 異なるデータ記憶部にデータを記憶する手法に関して同期を取るための方法および装置
JP2006505863A (ja) * 2002-11-07 2006-02-16 トムソン グローバル リソーシーズ アー.ゲー. 電子的ドキュメントレポジトリーマネジメントおよびアクセスシステム
JP2006072986A (ja) * 2004-08-31 2006-03-16 Microsoft Corp データストアに対して動的に生成されるオペレーションを検証すること
JP2007072524A (ja) * 2005-09-02 2007-03-22 Fuji Xerox Co Ltd データサーバ及びデータ管理方法及びプログラム
JP2009116414A (ja) * 2007-11-01 2009-05-28 Hitachi Ltd 情報処理システム及びデータ管理方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017503422A (ja) * 2013-12-31 2017-01-26 華為技術有限公司Huawei Technologies Co.,Ltd. ネットワーク要素データアクセス方法および装置、およびネットワーク管理システム
JP2016148989A (ja) * 2015-02-12 2016-08-18 日本電信電話株式会社 情報システム及びメッセージ登録状況照会方法

Also Published As

Publication number Publication date
WO2012117433A1 (en) 2012-09-07
US8700567B2 (en) 2014-04-15
US20120221532A1 (en) 2012-08-30
JP5548825B2 (ja) 2014-07-16

Similar Documents

Publication Publication Date Title
JP5548825B2 (ja) 情報処理装置
US10547684B2 (en) Information management of data associated with multiple cloud services
US10318542B2 (en) Information management of mobile device data
US9959333B2 (en) Unified access to personal data
US9325709B2 (en) System and method for importing and merging content items from different sources
US20190036764A1 (en) Event notification in interconnected content-addressable storage systems
US8914856B1 (en) Synchronization of networked storage systems and third party systems
US9311326B2 (en) Virtual file system for automated data replication and review
US8819138B2 (en) Identifying content items for inclusion in a shared collection
KR102267132B1 (ko) 문서 관리와 액세스 제어가 있는 분산형 데이터 시스템
US20140195516A1 (en) Systems and methods for presenting content items in a collections view
US20140330776A1 (en) Importing content items
US20140379661A1 (en) Multi source unified search
TWI571754B (zh) 用來進行檔案同步控制之方法與裝置
GB2498047A (en) Managing updates at clients in a cloud-based collaboration service
JP6131648B2 (ja) データ管理システム、情報システム、データ管理方法及び情報システムの制御方法、並びに、それら方法のプログラム及びそのプログラムを記録した記録媒体
Perkins Coie LLP
US12099886B2 (en) Techniques for performing clipboard-to-file paste operations
US20230101774A1 (en) Techniques for performing clipboard-to-file paste operations
CN114238214A (zh) 一种智能化财务档案存储管理系统及系统

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140218

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140415

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140513

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140519

R150 Certificate of patent or registration of utility model

Ref document number: 5548825

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees