JP2005530280A - 関連アプリケーション相互参照対称的共有ファイル記憶システム - Google Patents

関連アプリケーション相互参照対称的共有ファイル記憶システム Download PDF

Info

Publication number
JP2005530280A
JP2005530280A JP2004522904A JP2004522904A JP2005530280A JP 2005530280 A JP2005530280 A JP 2005530280A JP 2004522904 A JP2004522904 A JP 2004522904A JP 2004522904 A JP2004522904 A JP 2004522904A JP 2005530280 A JP2005530280 A JP 2005530280A
Authority
JP
Japan
Prior art keywords
file
storage
service
metadata
client
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004522904A
Other languages
English (en)
Inventor
オラフ マンザック
カクパー ノウィッキー
ルイス ラモス
ジョージ フェインバーグ
ワヒード クレシ
Original Assignee
アガミ システムズ, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アガミ システムズ, インコーポレイテッド filed Critical アガミ システムズ, インコーポレイテッド
Priority claimed from PCT/US2002/018948 external-priority patent/WO2004010291A1/en
Publication of JP2005530280A publication Critical patent/JP2005530280A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 共有記憶を持つ対称的マルチコンピュータ・アーキテクチャにより容量及び性能の観点でファイル記憶(300)のスケーラビリテイを可能にするシステム及び方法を提供する。
【解決手段】 システム内に記憶されたデータの明瞭な移動及び/又は認識を必要とせずに記憶及びプロトコル処理資源をシステムへ追加できる(又は削除できる)。本発明は、クライアント(302、304、306、308)がいずれかの他の外部プロトコル処理ノードから検索される複数の外部プロトコル処理ノードに記憶されたファイルをアクセスすることを可能にする。アクセスはいずれかのゲートウェイ・サービス・ノード(312a、312b、312c)により配達される。

Description

本願は、本出願人に共通に所有された同時係属のデイビット・ラッカ氏等による2000年11月10日出願の発明の名称「スケーラブル記憶システム」の米国特許出願(Atty.Dkt.ZAM−0001)、2000年9月11日出願の発明の名称「区画化された移動可能なメタデータを持つ記憶システム」の米国特許出願シリアル番号09/659,107(Atty.Dkt.ZAM−0003)、及び、2000年9月19日出願の発明の名称「コンポーネントの分離を持つファイル記憶システム」の米国特許出願シリアル番号09/659,107(Atty.Dkt.ZAM−0004)に関連する。
本発明は、一般に、複数コンピュータ記憶アーキテクチャに関し、より詳細には、共有されたファイル記憶内の性能及び容量の高度のスケーラビリテイを支援するシステム及び方法に関する。
従来、あるファイル・サーバーに記憶されたファイルは、同じファイル・サーバーから検索されなければならない。大変大きな数のファイル・サーバーを持つ巨大にスケーラブルなシステムでは、あるファイル・サーバーがスペースを消費し又は処理資源を消費する時、ファイルデータ及びメタデータの一部は、別のファイル・サーバーへ明確に移動されなければならず、そして遠隔ノードはこの変化を認めるために明確に再構成されなければならない。
図1を最初に参照すると、従来のネットワーク付属記憶(NAS)100の構成が示されている。NAS100では、限定的ではなく、ネットワーク・ファイル・システム(NFS)クライアント102、共通インターネット・ファイル・システム(CIFS)クライアント104、ハイパーテキスト転送プロトコル(HTTP)クライアント106、及びファイル転送プロトコル(FTP)クライアント108などのネットワーク・プロトコルが、複数のファイル・サーバー112a、112b及び112cへアクセス・ネットワーク110を介して接続されている。各ファイル・サーバー112は、専用記憶アレイ114に接続されていて、各記憶アレイ114は専用のディスク116をサービスする。すなわち、ファイル・サーバー112aは、記憶アレイ114aに接続されていて、記憶アレイ114aはディスク116aに接続されている。代替的な実施の形態では、ネットワーク管理者は、ファイル・サーバー112aが記憶アレイ114bに接続され、ファイル・サーバー112bが記憶アレイ114cに接続され、そしてファイル・サーバー112cが記憶アレイ114aに接続されるようにネットワークを再構成する。このアーキテクチャの特性は、ネットワークの再構成がネットワーク管理者の介入を必要とすることである。
図2を参照すると、従来の記憶エリア・ネットワーク(SAN)200が示されている。SAN200では、限定的ではなく、ネットワーク・ファイル・システム(NFS)クライアント202、共通インターネット・ファイル・システム(CIFS)クライアント204、ハイパーテキスト転送プロトコル(HTTP)クライアント206、及びファイル転送プロトコル(FTP)クライアント208などのネットワーク・プロトコルが、複数のファイル・サーバー212a、212b及び212cへアクセス・ネットワーク210を介して接続されている。各ファイル・サーバー212は、ブロック・レベル・プロトコルを使用して記憶アレイと通信する。そして、各ファイル・サーバー212が1つ又は複数のディスク・ボリューム216へ割当てられる。例えば、限定することなく、ファイル・サーバー212aはディスク・ボリューム216a1に割当てられ、ファイル・サーバー212bはディスク・ボリューム216a2及び216c1に割当てられ、ファイル・サーバー212cは216bの全てに割当てられ、そして、ディスク・ボリューム216c2は、後の割当てに利用可能な割当てない予備ディスク・ボリュームである。SANのファイル・サーバーは全てのディスク・ボリュームへ完全に接続することができるが、すなわち、ファイル・サーバーは記憶エリア・ネットワーク上のどんなディスク・ボリュームにアクセスできるが、ファイル・サーバーはこのファイル・サーバーに割当てられたディスク・ボリュームを使用でき、他のファイル・サーバーに割当てられたディスク・ボリューム直接使用してはならない。このアーキテクチャの特性は、ディスク資源が物理的ではなく論理的にファイル・サーバーへ割当てられていることである。しかし、一旦、資源が割当てられると、別のファイル・サーバーはそれらの資源を公式な再割当てが発生するまで使用できない。従来の手法を、記憶エリア・ネットワーク(SAN)を利用した既存のクラスターに基づいたファイル記憶ソリューションと明確に異なる態様で、ファイル・サーバー、専用「ファイラー」、及び階層的大量記憶システムに拡張するための努力はなされていない。
複数のファイル・サーバーから構築されるファイル記憶システムへのこれらの従来の手法では、各ファイル・サーバーはグローバル・ファイル・システムの一部を「所有」する(すなわち、名前空間のこの部分に属する全てのファイルのメタデータ及びファイル・システムの名前空間の一部)。従って、あるファイル・サーバーに記憶されたファイルは後でこの特定のファイル・サーバーを介してのみアクセスできる。階層的記憶システムの場合、ファイル・サーバーは物理的ファイルデータ貯蔵(例えば、テープ又は光ディスク・ジュークボックス)を共有するが、ファイルはファイル・システム名前空間及びメタデータ(属性)中にファイルのエントリイを保持するファイル・サーバーを介してのみアクセスできる(読取・書込みモードで)。
一方、SANに基づいたクラスター・ファイル・システムは、クラスター・ノード間でブロック指向装置の共有を可能にする。しかし、この機能性は、SCSIロック等、記憶装置中に構築された特定のサポートに依存する。従って、SANに基づくクラスター・ファイル・システム・ソリューションは、記憶装置中に構築された追加の機能性に依存するため限定される。
本発明は、記憶サーバー上の外部プロトコル処理ノードの1つにより記憶されたファイル及び関連した記憶装置がどんな他のノードを通じても検索できる対称的共有記憶アーキテクチャである。従って、システムの性能をスケールするために新しい外部プロトコル処理ノードを追加するだけで十分である。又は、外部のクライアント・アプリケーションに透明な方法でシステムの容量をスケールするために空の記憶ノードを追加するだけで十分である。
また、この手法は、記憶アーキテクチャの透明で「垂直」なスケーラビリテイを可能にする。「古い」データに対する記憶容量を提供するために大量の安価な記憶(低性能、安価ファイル・サーバー、テープ・ロボット、光ディスクを持つジュークボックス等)をも持ち、データの「作業組」を保持する限定された数の高価で高性能のファイル・サーバーを使用できる。データの移動は完全に透明且つ自動的である(ファイルを書込む又は読出す要求に応じて、又は、ファイルが三次記憶へ移動される時には非同期的に)。また、あるビットファイル記憶サービス(BSS)ノード上に最初に記憶されたファイルデータは後でいずれの他のノードに移動できる。
本発明による対照的共有記憶アーキテクチャは、従来の記憶アレイ(ディスクの組)内のディスクの代わりに、ゲートウェイ又は記憶サーバーなどのシステム内のノードの冗長な組の構成を可能にする。従来の記憶アレイ(RAID)では、ディスクがクラッシュした時、データは利用可能なままであるが、記憶アレイに取り付けられているファイル・サーバーが停止した時は利用不可能である。対称的共有記憶アーキテクチャでは、どのコンポーネント(特に、いずれのプロトコル処理ノード又は記憶ノード)がクラッシュしてもデータの利用可能性に影響しない。
本発明のこれら及び他の観点と特徴は、添付図面を参照して本発明の特定の実施の形態を説明する以下の記述より当業者に明らかとなる。
〔本発明の好適な実施の形態の詳細な説明〕
本発明を、当業者が本発明を実施できるようにするため本発明の例を示す添付図面を参照して詳細に説明する。本発明のある要素の実現は、当業者に明らかなように、ソフトウェア、ハードウェア、又はそれらの組合わせを使用して達成できる。図面及び以下の例は本発明の範囲を限定するものではない。さらに、本発明のある要素は部分的に又は完全に既知のコンポーネントを使用して実現できる場合、本発明の理解のために必要なこのような既知のコンポーネントの部分のみが説明される。このような既知のコンポーネントの他の部分の詳細な説明は本発明を明確にするために省略される。さらに、本発明は、説明のためにここに言及される既知のコンポーネントの現在及び将来に知られる均等物を含む。
図3に、本発明の1つの実施の形態による対称的共有記憶システム300の例が示されている。図3に示すように、対称的共有記憶システム300のクライアントは、NFSクライアント302、CIFSクライアント304、HTTPクライアント306、又は、FTPクライアント308などのさまざまなアプリケーション・プログラムを介してファイラーのデータ・ネットワークにアクセスする。アプリケーションのこれらのタイプは説明目的のためにのみに与えられており、これに限定するものではない。クライアント・アプリケーションは、負荷平衡ノード(例えば、パブリック・ネットワーク309を経由して)を介してデータ・ネットワークに接続する。負荷平衡ノードは、性能の利用可能性、冗長性、及びスケーラビリテイのレベルの増加を提供するプライベート負荷平衡ネットワーク310から構成される1つ又は複数の負荷平衡ノードであることができる。例えば、2つの負荷平衡ノードは、1つの負荷平衡ノードよりも大きい性能の利用可能性、冗長性、及びスケーラビリテイを提供する。3つの負荷平衡ノードは2つよりも大きいものを提供できる。図3に示される単一の負荷平衡ノードは説明目的のためのみであり、これに限定されるものではない。
そして、負荷平衡ノード・ネットワーク310は、1つ又は複数のゲートウェイ・サービス・ノード312(例えば、ノード312a−c)に接続する。ゲートウェイ・サービス・ノード312は、内部ネットワーク314に接続されている。1つの実施の形態では、内部ネットワーク314は、スイッチド・インターネット・プロトコル(IP)に基づいたネットワークであるが、本発明はこれに限定されない。内部ネットワーク314は、1つ又は複数のビットファイル記憶サーバー324a−d、及び、記憶装置326a−dを構成する分散ビットファイル記憶サービス(BSS)324への接続を提供する1つ又は複数のネットワーク・サービスからなる。また、内部ネットワーク314は、1つ又は複数のメタデータ・サーバー316a−b及び記憶装置318a−bから構成される分散メタデータ・サービス(MDS)315、ビットファイル記憶サービス・マネージャ(BSSマネージャ)320、システム管理サービス(SMS)328、及び主331及びバックアップ・サーバー332から構成されるライフ支援サービス(LSS)330、及び、1つ又は複数のCDBサーバー325a−bから構成される構成データベース・サーバー(CDB)329、及びデータベース327a−bに接続されている。ファイラー300は、4つのビットファイル記憶サービス324a−dから構成される分散BSS324、2つのメタデータ・サーバー316a及び316bから構成される分散MDS315、主サーバー331及びバックアップ・サーバー332から構成されるLSS330、2つのCDBサーバー325a−bから構成されるCDBサーバー329、BSSマネージャ・サーバー320の1つのインスタンス、及び、SMS328の1つのインスタンスを含むものとして示されているが、当業者は、ここでの教示に基づいて、追加のビットファイル記憶サーバー324、メタデータ・サーバー316、BSSマネージャ・サーバー、SMSインスタンス328、及びLSSインスタンスがネットワークに追加でき、それでも、なお、本発明の範囲と精神の中に入ることが理解できる。大部分のサービスは冗長性を提供する。すなわち、それらは一対のサーバーを持つ。しかし、BSSマネージャ及びSMSなどのいくつかのサービスは、状態が無く、自動的に再スタートされる。この一対の構成及び状態無しの特徴により、システムは完全に冗長性を持ち、一点の故障も持たない。
ゲートウェイ・サービス(GS)ノード312a乃至312cは、外部のアクセスを全体システムへ与え、そしてユーザによりアクセスできる唯一のサービスである。GS312は、内部プライベート・ネットワーク314と外行き負荷平衡ネットワーク310の両方へ接続されている。しかし、GSは内部クライアント及び外部クライアントと通信するが、内部プライベート・ネットワーク314及び外行き負荷平衡ネットワーク310は単に例であり、物理的及び仮想ネットワーク・レイアウトはこれら又はいずれの特定のレイアウトに限定されないことが、当業者に認識される。このように、GSノード312の各々は、NFS、CIFS、HTTP、IMAP、POP等の標準ファイル・アクセス・プロトコルを使用してネットワークを介して通信する遠隔外行きノードと同様に、GSノード上で実行されているアプリケーションのためにシステム中に記憶されている全てのファイルへのアクセスを提供する。システム中に記憶されているファイルはGSノードのいずれかで実行されているアプリケーションから同一の方法でアクセスでき、そしてGSノードはネットワークがファイル貯蔵庫にアクセスすることを可能にする。従って、ファイル・アクセスのためのクライアント要求がいかなる性能ペナルティ無しにいずれのゲートウェイ・ノードによりサービスできるように、各ゲートウェイ・ノードはMDS315中に記憶されたメタデータ及びBSS中に記憶されたファイルデータへの均一なアクセスを持つ点で、システム300は「対称的」である。さらに、ファイル・アクセスについてのクライアント要求をサービスするために負荷バランサー310により指示される特定のゲートウェイ・ノードは、クライアントに対して透明である。
GSノードは、ファイルデータ又はメタデータのいずれも永続的に保持しないが、アプリケーション又は遠隔ネットワークと永続的なファイルデータ(BSS)及びメタデータ(MDS)を保持するサービスとの間の通信を仲介する。すなわち、GSは永続性(不揮発性)状態を保持する必要はないが、揮発性状態を維持できる。例えば、それはより良い性能を与えるためにファイルデータ及びメタデータの両方をキャッシュできる。
GSノード312a−cは、ファイルデータについてI/O操作を実行するためにBSSノード324a−dと直接に通信する。しかし、BSS324a−dと何を通信するかを決めるために、MDS315により与えられたファイルデータ位置を使用する。MDS315は、NFS、CIFS、HTTP、IMAP、POP等のファイル・アクセス・アプリケーションを実行するGSノードとの通信から、全てのファイル・システム名前空間及び属性操作(例えば、名前によるファイルのルックアップ、デイレクトリィ・エントリイの読出し、ファイル属性の獲得及び設定)を得る。メタデータ・サービス(MDS)315は、ファイル・システム名前空間及びファイル・メタデータ(属性)を保持する。
MDSにファイル・システム名前空間及びファイル・メタデータ(属性)を保持することにより、GSノードがファイル・システム名前空間及びファイル・メタデータ(属性)を保持する必要性を無くする。しかし、GSノードはより良い性能のためにこの情報をキャッシュできる。
ビットファイル記憶サービス(BSS)324は、システム内に記憶されたファイルデータについて永続的な記憶を提供する。ノード324a−dの各々は、それが直接に制御できる記憶装置326a−dへの共有ネットワーク・アクセスを提供する。
BSSマネージャ320は、図7及び図8を参照してより詳細に後で説明する態様で、BSS324中のクラッシュ回復、及び、異なるノード間でのファイルデータ移動と複製を管理する。BSSマネージャ320は、このプロセスをゲートウェイ・サービス312及びこれを介してシステムにアクセスするクライアントに対して透明にする。
ライフ・サポート・サービス(LSS)330は、システムを管理するための人的相互作用を最小にするために、資源の不足及び故障を監視し、そして予定された及び予定されない資源の停電を回避するためにルートする。これは専用の物理的資源を必要とせずに、むしろ、GS、MDS、及びBSSの物理的資源を使用する論理的サービスである。
システム管理サービス(SMS)328は、対称的共有記憶システムと関連した物理的及び論理的資源を構成し、監視し、そして制御する。このサービスの大部分は、専用の物理資源を必要とせず、むしろ、GS、MDS、及びBSSの物理的資源を使用する論理的サービスである。しかし、SMS328は記憶された情報のためにCDB329をアクセスする。CDB329は、別途にホストされなければならず、それ自身の物理的資源を必要とする。
一般に、各GSノード312a−cは他のGSノードを知る必要が無く、他のノードについてどんな状態も維持する必要が無い。そして、各BSSノード324は他のBSSノードを知る必要が無く、他のノードについてどんな状態も維持する必要が無い。しかし、GSノードの各々は他のノードと通信でき(例えば、キャッシュ一貫性を保証するために)、そして全BSSノードは互いに通信できる(例えば、ノード間でファイルデータを移動するために)。他のノードに関するいかなる状態も保持しない1つの利点は、GS312及びBSS324へ透明にノードを追加でき又は削除できることである。図4を参照してより詳細に説明されるように、GSノードを追加することは、ゲートウェイ・サービス処理資源を増加することにより、システムの性能を改善する。一方、BSSノードの追加はファイルデータ又はメタデータの明確な移動を必要とせずにシステムの容量を増大する。従来のファイル・サーバーの場合とは異なり、システム性能と容量は、たとえ全てのユーザがファイル・システムの同じ部分のデータをアクセス又は記憶することを試みても、どんな単一サーバーの性能又は容量により制限されない。
例えば、ネットワーク100(図1)では、記憶アレイ114とディスク116の組合わせは、そしてネットワーク200(図2)では、記憶アレイ214とディスク216の組合わせは、記憶されたデータとそのデータに関連したメタデータとを共に含む。しかし、本発明では、ビットファイル記憶サーバー324a−d及びそれらのそれぞれのディスク記憶は326a−dは記憶されたビットファイルを含む。一方、全てのビットファイル記憶サーバー324a−dからの記憶されたビットファイルと関連したメタデータはメタデータ・サーバー316a−d及びそれらの関連しディスク記憶318a−b内に記憶される。ビットファイル及びファイルデータの用語は等価であり、例えば、限定的ではなく、ファイルのファイル内容(データ)、ファイル・エクステント(ファイルの可変サイズ部分)、データのブロックの組(ブロック指向記憶では)等であることができる。ビットファイル及びファイルデータの用語は本発明を特定の意味に限定するものとして解すべきではない。
以下に、従来技術と比較した本発明でのデータのファイリング及び検索の例が示される。図1を参照すると、NFSクライアント102などのクライアント上で実行されるアプリケーション・プログラムを使用して、そしてNFSなどのネットワーク・プロトコルを使用することにより、アプリケーションがNAS100にアクセスする。アプリケーションからのデータを記憶するための命令は、アクセス・ネットワーク110を経由して選択されたファイル・サーバー112(例えば、ファイル・サーバー112a)に送られる。そして、データはそれぞれの記憶アレイ(例えば、記憶アレイ114a)により対応するディスク116(例えば、ディスク116a)上に記憶される。そのデータと関連したメタデータがこの記憶プロセスの一部として生成されて、また同じディスク(例えば、ディスク116a)上に記憶される。クライアントがデータの読出し又は修正のいずれかのためにデータにアクセスすることを望む時、クライアントは同じファイル・サーバー(例えば、ファイル・サーバー112a)を経由して同じ記憶アレイとディスク(例えば、記憶アレイ114aとディスク116a)にデータをアクセスしなければならない。もし、クライアントがファイル・サーバー112bにアクセスする場合、クライアントはデータにアクセスすることができないであろう。
図2を参照して、データの記憶及び検索の例が説明される。例えば、NFSクライアント202などのクライアント上で実行されるアプリケーションを使用して、そしてNFSなどのネットワーク・プロトコルを使用することにより、アプリケーションがSAN200にアクセスする。アプリケーションからのデータを記憶するための命令は、アクセス・ネットワーク210を経由して選択されたファイル・サーバー212(例えば、ファイル・サーバー212b)に送られる。そして、データは割当てられた記憶アレイ(例えば、記憶アレイ214a)により対応する割当てられたディスク・ボリューム216(例えば、ディスク・ボリューム216a1)上に記憶される。割当てられたディスク・ボリュームはネットワークのいずれでよい。そのデータと関連したメタデータがこの記憶プロセスの一部として生成されて、また同じディスク・ホリューム(例えば、ディスク・ボリューム216a1)上に記憶される。クライアントがデータの読出し又は修正のいずれかのためにデータにアクセスすることを望む時、クライアントは同じ記憶アレイに割当てられた同じファイル・サーバー(例えば、ファイル・サーバー212b)を経由して、ディスク・ボリューム(例えば、記憶アレイ214aとディスク・ボリューム216a1)にデータをアクセスしなければならない。もし、クライアントがファイル・サーバー212aにアクセスする場合、クライアントはデータにアクセスすることができないであろう。しかし、ネットワーク管理者は記憶アレイ214aとディスク・ボリューム216a1をサーバー212aに再割当てすることができる。
本発明(図3)では、例えば、限定するのでなく、NFSクライアント302上で実行されているアプリケーションを使用して、例えば、限定するのではなく、NFSなどのネットワーク・プロトコルを使用して、アプリケーションがデータ記憶ネットワーク300にアクセスする。そして、データを記憶するための命令が負荷平衡ノード310を介して送られる。そして、負荷平衡ノード310は、データを記憶するために、ゲートウェイ・サービス・ノード312の1つ(例えば、ゲートウェイ・サービス・ノード312a)に命令を送る。データは、ビットファイル記憶サービス・マネージャ320により指示されたポリシーに従い、財産的ファイル/ブロック指向プロトコルを用いて選択されたビットファイル記憶サーバー324及び対応するディスク326(例えば、ビットファイル記憶サーバー324a及びディスク326a)へ、内部ネットワーク314を経由して送られる。このポリシーは、例えば、限定的ではなく、最大の利用可能な記憶容量を持つディスク上にデータを記憶するものである。データがディスク326上に記憶される時、その記憶されたデータに対応する生成されたメタデータ(例えば、BSM320と通信するゲートウェイ・サービス・ノード312aにより)は、MDS315により記憶される。例えば、限定的ではなく、ディスク318の1つ(例えば、ディスク318a上)にメタデータ・サーバー316の1つ(例えば、メタデータ・サーバー316a)により記憶される。すなわち、ファイルデータ(ビットファイル記憶サーバー324及びディスク326上)及びファイルデータに関連したメタデータ(メタデータ・サーバー316及びディスク318上)は、2つの分離した位置に記憶される。データ記憶ネットワーク300中に記憶されたデータと関連した全てのメタデータは、例えば限定的ではなく、MDS315によりメタデータ・サーバー316及びディスク218上に記憶される。
元のクライアント、又は、別のクライアントが後でこの記憶されたデータをアクセスすることを試みる時、データをアクセスするための命令がクライアント・アプリケーション(例えば、NFS302又はCIFS304)から負荷平衡ノード310を経由してゲートウェイ・サービス・ノード312へ送られる。このゲートウェイ・サービス・ノードは、最初にデータを記憶するために使用された同じノードである必要が無い。そして、データをアクセスするための命令がゲートウェイ・サービス・ノード312(例えば、ゲートウェイ・サービス・ノード312b)から内部ネットワーク314を経由してメタデータ・サーバー316(例えば、サーバー316a)へ送られる。メタデータ・サーバー316は、ディスク318(例えば、サーバー318a)から要求されたデータについてのメタデータを得て、データに対する要求を適当なビットファイル記憶サーバー324及び対応するディスク326(例えば、ビットファイル記憶サーバー324a及びディスク326a)へ指示する。もし、データがアクセスの結果として修正される場合(例えば、より多くのデータが追加される)、メタデータは対応して更新される。
すなわち、本発明によると、クライアントはデータへのアクセス要求がなされた時、そのデータがどこに記憶されているか知る必要がなく、そのデータへのアクセス要求はゲートウェイ・サービス・ノード312a−cのいずれかを経由して送られることができる。
図6A乃至図6Dには、クライアントにより知られているファイル識別子とクライアントには透明なファイル位置との間の一致を維持して、この透明性と対称性を可能にするために使用される例示的なデータ構造が示されている。これらのデータ構造はサーバー316によりディスク318中にMDS315内に維持されて、本発明の1つの例ではメタデータの一部として使用される。当業者には、ここに開示された教示に基づいて、他のデータ構造が使用でき且つ本発明の範囲と精神の中にあることが理解できる。例えば、他のデータ構造が、システム300中のファイル位置を含まない他の情報及びファイル属性を維持するために使用できる。
図6Aに示すように、ビットファイル記憶ロケーター(BSL)602は、フィールド604中に特定されたファイル識別子(例えば、ファイル名及び/又はデイレクトリィ・パス)を持つ単一のファイルを、記憶サービス324中のファイルのビットファイル・データについての位置を与えるフィールド606中に特定された物理的識別子(例えば、記憶サーバー324a−d及び記憶装置326a−dの1つ)に対応させるメタデータ・エントリイである。ファイル及びBSS324内のその位置の対応は、例えば、BSM320との通信及びBSM320により実現されるあるポリシー(例えば、最大の空間を持つ装置中にファイルを記憶する)に従い、生成される。すなわち、ファイルへのアクセスを要求するクライアントは、ゲートウェイ・サービスへファイルの識別子を供給することだけが必要である。そして、受信したゲートウェイ・サービス・ノード312a−cは、与えられたファイル名に対応したファイルのBSS342中の位置を検索するためにMDS315と通信する。
図6Bは、MDS315により維持されるメタデータの部分を実現するために使用できるデータ構造の別の例を示す。この例では、物理的ファイル位置は、論理的(シンボリック)位置及び論理的から物理的位置へのマッピング(例えば、BSM320により設定されるような)として表すことができる。したがって、BSL612は、論理的記憶識別子(例えば、ボリューム識別子)を、フィールド616中に特定されたクライアントに知られたファイル識別子と対応させるフィールド614を含む。データ構造はさらに、論理的記憶識別子を、BSS324内の対応する論理的記憶の物理的位置を反映した物理的記憶識別子に対応させるテーブル623を含む。すなわち、ファイルへのアクセスを要求するクライアントは、ゲートウェイ・サービスへファイルの識別子を供給することだけが必要とされる。そして、受信したゲートウェイ・サービス・ノード312a−cは、与えられたファイル名に対応したファイルのBSS324中の位置を検索するためにMDS315と通信し、プロセス中で、MDS315は与えられたファイル名と関連する論理的識別子から物理的位置を調べる。
図6Cは、MDS315により維持されたメタデータの部分を実現するために使用されるデータ構造の別の例を示す。ここでは、ミラーリングが冗長性を与えるために使用される(例えば、BSM320により設定されるように)。データ構造は、BSL612及びテーブル632、633を含む。図6Cに示すように、テーブル632は、第1論理的識別子(例えば、vol.0)を、同じファイルの2つのコピーが記憶されている場所を識別するために第2論理的識別子(例えば、vol.1及びvol.2)と対応させるエントリイを含む。この例では、もし、サーバーの1つ又は記憶装置の1つがアクセス不可能になった場合、ミラーされたデータを使用してデータは利用可能のままに維持される。データをミラーリングする技術はデータの利用可能性を増加するために使用される。さらに、データ構造は、論理的記憶識別子を、BSS324内の対応する論理的記憶の物理的位置を反映する物理的記憶識別子と対応させるテーブル633を含む。すなわち、ファイルへのアクセスを要求するクライアントは、ゲートウェイ・サービスへファイルの識別子を供給することだけが必要とされる。そして、受信したゲートウェイ・サービス・ノード312a−cは、与えられたファイル名に対応したファイルのBSS324中の位置を検索するためにMDS315と通信する。位置情報を与えるプロセス中で、MDS315は、対応する論理的識別子のためにミラーが指定されているかどうかを決定するために、テーブル632中で与えられたファイル名に対応する論理的識別子を調べる。いずれの場合も、MDS315はテーブル633を調べて、与えられたファイル名に関連した論理的識別子から物理的位置をゲートウェイ・サービスへ戻す。
図6Dは、MDS315により維持されるメタデータの一部を実現するために使用されるデータ構造の別の例を示す。ここでは、単一ファイルが、物理的記憶装置(例えば、BSM320により設定されるような、独立ディスクの冗長性アレイ(RAID)、ディスク装置のクラスター等)のグループ中の1つ又は複数の記憶装置にわたって記憶できる。この例では、BSL642は、論理的識別子フィールド644、ファイル識別子フィールド648、及び、データの開始を記憶した記憶装置を識別するために使用されるインデックス・フィールド646を含む。「ストリッピング」を使用する実施の形態では、ディスク装置650のアレイが使用できる。図6Dに示される例では、4つの記憶装置651−654が示される。1つのファイルは装置のアレイ650にわたって記憶される。ファイルの開始が位置する記憶装置(651−654)は、インデックス・フィールド646中の値により識別される。そして、ファイル中のデータは、インデックス・フィールド646値により識別される開始記憶装置で始まり、順次の態様により記憶装置アレイにわたったブロックで記憶される。ブロックの大きさは普通、所定のあるブロック大きさを越えないように制限される。例えば、もし、ファイルの大きさが40KBで、インデックス・フィールド646が記憶装置651を指す場合、ファイル中のデータの最初の16KBが記憶装置651中に記憶され、ファイル中のデータの二番目の16KBが記憶装置652中に記憶され、そして、残りのデータ(8KB)が記憶装置653中に記憶される。より小さいファイル(ブロックの大きさよりも小さい)は、記憶装置651−654のいずれの1つに記憶することができる。より大きいファイルは、記憶装置アレイ650を横断して順次に回る。ストリッピング技術が、性能を改良するために複数の記憶サーバー及び記憶装置を並列にアクセスするのに使用できる。
図3に示される記憶システム・アーキテクチャ及び図6A−Dに示されるデータ構造により可能となる本発明の透明性と対称性の特徴が、ある長所のためにどのようにしてさまざまなファイル記憶スキームにより利用されるかを、以下に説明する。
図4は、本発明の実施の形態によるスケーラブル及び冗長性ファイル記憶システム400のブロック図である。スケーラブルは、いずれのシステム資源はノードをさらに追加することにより増大できることを意味する。冗長性は、いずれのシステム資源はたとえそのコンポーネントが故障しても利用可能のままであることを意味する。スケーラブル及び冗長性ファイル記憶システム400は、スケーラブル及び冗長性ゲートウェイ・サービス410と、ネットワーク480を介してゲートウェイ・サービス410に接続されたスケーラブル及び冗長性メタデータ・サービス420を含む。スケーラブル及び冗長性記憶サービス440は、ネットワーク480を介してゲートウェイ・サービス410に接続される。システム管理サービス(SMS)450、ライフ・サポート・サービス(LSS)460、及び記憶サービス・マネージャ470もネットワーク480に接続される。SMS450、LSS460、及び記憶サービス・マネージャ470は、専用のサーバーを持たずに、代りに、システム中の他のサーバー、例えば、限定的ではなく、メタデータ・サーバー421、上で実行される。SMS450及び記憶サービス・マネージャ470は、ネットワーク480を経由して構成データベース(CDB)429へのアクセスを仲介する。CDB429は、それ自身の物理的資源を必要とするSMS及び記憶サービス・マネージャとは分離されてホストされるサービスである。当業者には明らかなように、GS410、MDS420及び記憶サービス440が全てスケーラブルとして示されているが、それらのうちのある1つだけがスケーラブルであってよい。
CDB429は、GS410、MDS420及びBS440の各々の中の資源の現在の状態についての情報を提供する。SMSはこの情報をさまざまなサーバーを開始して可能化するために使用する。サーバーが動作のため準備ができると、それらはLSS460に登録される。LSS460は、資源が追加及び削除される時に互いに通信してそれが可能化されるように、さまざまなノードにサービス配送及び接続性情報を配達する責任を持つ。LSS460での登録及びサービス配送と接続情報のその後の配達は、本実施の形態のスケーラビリテイと冗長性を可能にする。スケーラブル及び冗長性ゲートウェイ・サービス410は、冗長性負荷平衡ネットワーク405に接続される複数の外部プロトコル処理ノード411−413を含む。スケーラブル及び冗長性記憶サービス440は、複数の記憶サーバー441−443及び記憶装置491−493を含む。1つの実施の形態のメタデータ・サービス420は、スケーラブルで且つ冗長性であり、メタデータ・サーバー421及び422、及びMDSデータベース431及び432を含む。1つの実施の形態では、SMS450はスケーラブルである。1つの実施の形態では、LSS460はスケーラブルであり、主サーバー461及びバックアップ・サーバー462を含む。CDBサービス429は1つの実施の形態ではスケーラブルで且つ冗長性であり、CDBサーバー425a−b及びCDBデータベース427a−bを含む。1つの実施の形態では、BSSマネージャ470はスケーラブルである。
図5は、本発明の1つの例によるスケーラブル且つ冗長性のファイル記憶システム中に階層的記憶管理(HSM)スキームを実現するメタデータ及びデータ記憶システム500を示す図。この例では、MDS520は1つ又は複数のメタデータ・ノードを含む。メタデータ・ノード520aは、記憶装置523に接続されたメタデータ・サーバー521を含む。同様に、メタデータ・ノード520bは、記憶装置524に接続されたメタデータ・サーバー522を含む。記憶装置523と524は、限定的ではなく、ディスク装置などのHSMスキーム中で使用される装置を含むどんなタイプの記憶装置である。メタデータ・サーバー521、522は、それぞれの記憶装置523、524へのアクセスの管理と制御のためのどんなタイプの制御論理である。このような制御論理は、どんなタイプのプロセッサ・ユニット中のソフトウェア、ファームウェア、ハードウェア、又はこれらの組合わせである。記憶装置523、524は、限定的ではなく、ディスク装置(磁気又は光学)、メモリ等を含むどんなタイプの媒体上に記憶するどんなタイプのデータ記憶装置である。構成データベース・サービス529は、構成データベース527aに接続されたCDBサーバー525a及び構成データベース527bに接続されたCDBサーバー525bを含む。構成データベース527aは、論理的/物理的マッピング541を含み、そして構成データベース527bは、論理的/物理的マッピング542を含む。論理的/物理的マッピング541と542は、図6A−Dに示されるようなデータ構造に関して説明されたマッピングと実質的に同様である。
BSS550は、1つ又は複数の記憶ノードを含む。記憶ノード550aは記憶装置552に接続された記憶サーバー551を含む。記憶ノード550bは記憶装置554に接続された記憶サーバー553を含む。記憶ノード550は記憶装置556に接続された記憶サーバー555を含む。同様にして、記憶ノード550dは記憶装置558に接続された記憶サーバー557を含む。記憶装置552、554、556及び558は、限定的ではなく、ディスク装置及びテープ・ドライブ・ユニットなどのHSMスキームで使用される装置を含む、どんなタイプの記憶装置である。頻繁にアクセスされるデータはディスク上に記憶され、頻繁にアクセスされないデータはテープ上に記憶されることを可能にする記憶装置の論理的階層を作るために、さまざまな記憶装置が使用できる。また、必要に応じてデータが記憶ノード間で移動できる。
記憶装置523及び524は、メタデータを記憶する。メタデータ・エントリイは、例えば、限定的ではなく、ファイル・システム名前空間、ファイル・メタデータ属性を保持して、スケーラブル記憶システム300内のファイルデータの論理的又は物理的(1つ又は複数)位置を識別する。記憶装置552、554、556及び558は、どんなタイプのフォーマット及びコンテントのファイルなど(例えば、テキスト、オーディオ、ビデオを表すデジタル・データ、又は、どんな他のタイプのマルチメディア・コンテント又は他の情報)のデータを記憶する。例えば、図5に示され、そして、図6A−Dを参照してより詳細に説明されたように、スケーラブル・ファイル記憶装置500では、メタデータ・エントリイ(メタデータ1)は記憶装置523内に記憶できる。「メタデータ1」は、記憶装置522内に「データ1」として記憶されたファイルの位置を識別する。「メタデータ2」は、記憶装置524内に記憶される。「メタデータ2」は、記憶装置528内に「データ2」として記憶されたファイルの位置を識別する。「メタデータ3」は、記憶装置523内に記憶される。「メタデータ3」は、記憶装置526内に「データ3」として記憶されたファイルの位置を識別する。また、「メタデータ1」は、第3記憶へ(すなわち、記憶装置554へ又は他のどんな記憶ノード又は装置へ)移動された「データ1」のコピーを識別できる。データ移動が、図7及び図8に関して、さらに詳細に説明される。
ファイルデータからファイル・メタデータを分離することは、BBS層内のノード間でファイルデータの透明な移動を可能にする。しかし、また、BSS内の1つの場所から別の場所への透明なデータ移動を達成するためには、MDS内のファイルデータ位置の絶え間のない更新及び外部のプロトコル処理ノード中にキャッシュされた古い位置の無効化を必要とする。データを透明に移動する能力はさらに、本発明による対称的共有ファイル記憶システムを階層記憶管理(HSM)システムとして使用することを可能にし、伝統的なHSMシステムの機能性と長所の全てを提供する。例えば、限定的ではなく、BSSサーバーは、異なる費用と性能特性により記憶装置を制御できる。BSSは、ファイル記憶システム内に記憶されたファイルデータについて永続的な記憶を提供する。一方、BSMは異なるノード間のファイルデータ移動を管理する。
図7は、本発明の1つの例によるファイル記憶システム内の変化する費用と性能特性により記憶装置を制御するフレキシブルBSS740を含むファイル・システム700の図である。BSS740は、スイッチド・ネットワーク780を介してシステム700に接続される。また、ファイル・システム700は、BSSマネージャ770、SMS750、LSS760、MDS720、及び全てがスイッチド・ネットワーク780により相互接続されたノード711−714を含むゲートウェイ・サービス710を含む。当業者には理解されるように、ここに開示された教示に基づいて、他の記憶装置及び組合わせも使用でき、本発明の範囲と精神の中に入る。
各記憶サーバーは、それが直接に制御できるいくつかの記憶について共有ネットワーク・アクセスを提供する。この例では、BSS740は、ディスク記憶装置、テープ記憶装置、及び、共有記憶装置を含む。記憶ノード741は、ディスク記憶装置751に接続されている。記憶ノード742は、テープ記憶装置752に接続される。記憶ノード743はディスク記憶装置753及びテープ記憶装置754に接続されている。記憶ノード744と745はそれぞれディスク記憶装置755と756に接続されて、そして共有テープ・ライブラリイ記憶装置765(例えば、テープ・ドライブ766a及び766b)に接続されている。BSS層内での異なる位置間のファイルデータ移動の動作プロセスが、高レベルで説明される。動作プロセスはしばしばフローチャートで表される。ここに表示されるフローチャートは説明目的のために提供されるもので、限定するものではない。実際には、当業者は、ここに開示された教示に基づいて、本発明をいくつかの方法により達成できることを理解できるであろう。さらに、また、フローチャートにより表された制御のフローは説明目的のために提供されるもので、限定するものではない。当業者は、他の操作制御フローが本発明の範囲及び精神の中にあることを理解できるであろう。
図8は、本発明の1つの実施の形態によるデータ移動800のルーチンのフローチャートである(ステップ810−840)。ステップ810で、ファイルはターゲット宛先にコピーされる。例えば、データ1は、記憶装置753から第3記憶754へコピーできる。このコピー操作は、例えば、頻繁にアクセスされないデータをテープ記憶など安価な記憶媒体へ移動することが望まれる階層的記憶管理の一部として実行できる。このコピー操作は、BSSマネージャ770によりどんな理由により手動又は自動的に開始できる。
ステップ820では、移動されたデータに対応するメタデータ・エントリイが、ステップ810において決定されたファイルデータの新しい位置を反映するために更新される。例えば、図6A−Dに示されたデータ構造中のBSLエントリイは、移動されたファイルに対応する各ファイル名に対する新しい位置を反映するために更新される。
ステップ830では、古い位置のデータが選択的に削除される。データが別の位置にコピーされると、MDSは例えばミラーにより古い位置のデータ及び新しい位置のデータの両方を指すエントリイを維持できる。しかし、古い位置からのデータはどんな理由により削除できる。古いデータの除去はユーザに透明になされる。
ステップ840では、外部プロトコル処理ノードが更新されたメタデータをアクセスして、その位置にかかわらずファイルデータに引き続きアクセスする。さらに、このデータ移動及び新しい位置へのアクセスは外部のクライアントには透明である。ゲートウェイ・サービス処理ノード間の対称性は、いずれのゲートウェイ・サービス処理ノード711−714(そして、スケーリング・タイル・システム700に追加されるどんな将来の外部プロトコル処理ノード)は、更新されたメタデータを使用することにより、移動されたデータをアクセスできる。
本発明は、その好適な実施の形態を参照して詳細に説明されたが、当業者には形式及び詳細中の変更と修正が本発明の精神と範囲から逸脱することなくできることが明らかである。請求項はこのような変更と修正を包含することを意図している。さらに、当業者にはさまざまな実施の形態が必ずしも排他的ではなく、いくつかの実施の形態の特徴は他の実施の形態の特徴と組合わせることができ、そして本発明の精神と範囲の中に留まることが理解できる。
ネットワークに取り付けられた記憶を使用する従来のファイル記憶システムを示す図。 記憶エリア・ネットワーク技術を使用する従来のファイル記憶システムを示す図。 本発明によるファイル記憶システムの例を示す図。 本発明の1つの実施の形態によるスケーラブルなファイル記憶システムのブロック図。 本発明の1つの例による階層的記憶マネージメントを含むメタデータ及びデータ記憶を示す図。 本発明のさまざまな例に使用されるデータ構造を示す図。 本発明のさまざまな例に使用されるデータ構造を示す図。 本発明のさまざまな例に使用されるデータ構造を示す図。 本発明のさまざまな例に使用されるデータ構造を示す図。 本発明の1つの実施の形態による可変のコスト及び性能特性を持つ記憶装置のブロック図。 本発明の1つの実施の形態によるデータ移動を示す単純化されたルーチンを示す図。

Claims (29)

  1. ファイル記憶システムであって、
    それぞれのファイル識別子を持つファイルへアクセスするためにクライアントからの要求をサービスするように構成されたゲートウェイ・サービスと、
    ファイルに対応したファイルデータの永続的記憶を与えるように構成された記憶サービスと、
    ファイルに対応したメタデータを維持するように構成されたメタデータ・サービスとを備え、メタデータの部分は記憶サービス中のファイルのそれぞれの位置をそれぞれのファイル識別子と相互に関係付け、
    ゲートウェイ・サービスは、ファイル識別子に従い記憶サービス中のビットファイル・データの位置を決定するためにメタデータ・サービスと通信し、そして決定された位置に従いクライアントへビットファイル・データへのアクセスを提供するために記憶サービスと通信し、これによりクライアントは決定された位置のファイルへアクセスするためにはファイル識別子を与えることだけが必要とされるファイル記憶システム。
  2. 記憶サービスは、複数の記憶装置を含み、ビットファイル・データの位置は複数の記憶装置と関連付けられている請求項1に記載のファイル記憶システム。
  3. 記憶サービスは、記憶装置の数がスケーラブルであるように構成されている請求項2に記載のファイル記憶システム。
  4. 記憶サービス及びメタデータ・サービスは、ある1つのファイルに対応するビットファイル・データの位置が複数の記憶装置の2以上と関連付けられように構成されている請求項2に記載のファイル記憶システム。
  5. 2以上の複数の記憶装置は冗長性スキームにより決定される請求項4に記載のファイル記憶システム。
  6. ゲートウェイ・サービスは、ある1つのファイルと関連したクライアント要求及びメタデータ・サービスから決定された位置に従い、2以上の複数の記憶装置の内の故障した装置からではなく2以上の複数の記憶装置の内の動作可能な装置へのアクセスを提供するように構成されている請求項5に記載のファイル記憶システム。
  7. 2以上の複数の記憶装置は、ストリッピング・スキームに従い決定される請求項4に記載のファイル記憶システム。
  8. ゲートウェイ・サービスは、複数のゲートウェイ・サービス・ノードを含み、ゲートウェイ・サービス・ノードはメタデータ・サービス、記憶サービス及びクライアントと均一に通信するように構成されている請求項1に記載のファイル記憶システム。
  9. クライアントからの要求を複数のゲートウェイ・サービス・ノードへ分配するように構成された負荷平衡をさらに含む請求項8に記載のファイル記憶システム。
  10. ゲートウェイ・サービス・ノードは、クライアント・ファイル要求に実質的に同じ性能を提供する請求項8に記載のファイル記憶システム。
  11. ゲートウェイ・サービスは、ゲートウェイ・サービス・ノードの数がスケーラブルであるように構成されている請求項8に記載のファイル記憶システム。
  12. メタデータ・サービスは、複数のメタデータ・ノードを含み、メタデータ・ノードは、メタデータを維持しそしてゲートウェイ・サービスと実質的に均一に通信するように構成された請求項1に記載のファイル記憶システム。
  13. メタデータ・サービスは、階層的記憶管理スキームを実現するように構成されている請求項1に記載のファイル記憶システム。
  14. メタデータ・サービスは階層的記憶管理スキームを実現するように構成されていて、複数の記憶装置の第1組は第1容量と性能特性を持ち、複数の記憶装置の第2組は第1容量と性能特性とは異なる第2容量と性能特性を持ち、メタデータ・サービスは記憶装置の第1組から第2組へのビットファイル・データの移動を管理するために記憶サービスと協力し、これによりクライアントが移動されたビットファイル・データに対応する移動されたファイルへのアクセスを要求する時に移動されたファイルに対応するファイル識別子を供給することのみが必要な請求項2に記載のファイル記憶システム。
  15. クライアントが、NFSクライアント、CIFSクライアント、HTTPクライアント、及びFTPクライアントの内の少なくとも1つを含み、ゲートウェイ・サービスはクライアントにより使用されるそれぞれのプロトコルに従いクライアント要求をサービスするようにさらに構成されている請求項1に記載のファイル記憶システム。
  16. ファイル記憶システムであって、
    ファイル識別子をそれぞれ持つファイルへアクセスするクライアントからの要求をサービスするように各々が構成されたスケーラブルな数のゲートウェイ・サーバーと、
    ファイルに対応したビットファイル・データの永続的な記憶を提供するように各々が構成されたスケーラブルな数の記憶サーバーと、
    ファイルに対応したメタデータを維持するように構成されたメタデータ・サービスとを備え、メタデータの部分は記憶サービス中のファイルのそれぞれの位置をそれぞれのファイル識別子と相互に関係付け、
    ゲートウェイ・サーバーの各々は、ファイル識別子に従い記憶サービス中のビットファイル・データの位置を決定するためにメタデータ・サービスと通信し、そして決定された位置に従いクライアントへビットファイル・データへのアクセスを提供するためにビットファイル記憶サーバーと通信し、これによりスケーラブルな数が第1の値を持つ時にファイルにアクセスしたクライアントはスケーラブルな数が第1の値と異なる第2の値を持つ時にファイルにアクセスするのに同じファイル識別子を与えることだけが必要とされるファイル記憶システム。
  17. 記憶されたファイルへの共有アクセスを提供する方法であって、
    それぞれのファイル識別子を持つファイルへアクセスするためにクライアントからの要求をサービスし、
    第1記憶装置中にファイルに対応したファイルデータの永続的記憶を与え、
    第1記憶装置と異なる第2記憶装置内にファイルに対応したメタデータを維持し、メタデータの部分は第1記憶装置中のファイルのそれぞれの位置をそれぞれのファイル識別子と相互に関係付け、
    第2記憶装置内に維持されているメタデータからのファイル識別子に従い第1記憶装置中のビットファイル・データの位置を決定し、そして
    決定された位置に従い第1記憶装置のビットファイル・データへのアクセスをクライアントに提供し、これによりクライアントは決定された位置のファイルへアクセスするためにファイル識別子を与えることのみが必要とされる方法。
  18. 第1記憶装置がいくつかの記憶装置を含み、ビットファイル・データの位置がいくつかの記憶装置に関連付けられている請求項17に記載の方法。
  19. 維持するステップが、いくつかの記憶装置のスケーリングを説明することを含む請求項18に記載の方法。
  20. 維持するステップが、関係するファイルのある1つに対応するビットファイル・データの位置をいくつかの記憶装置の内の複数に相互に関連付けることを含む請求項18に記載の方法。
  21. 冗長性スキームに従い、いくつかの記憶装置の内の複数を決定することをさらに含む請求項20に記載の方法。
  22. ある1つのファイルと関連したクライアント要求及び決定された位置に従い、いくつかの記憶装置の内の複数の中から故障した装置ではなくいくつかの記憶装置の内の複数の中から動作可能な装置へのアクセスを提供することをさらに含む請求項21に記載の方法。
  23. ストリッピング・スキームに従い、いくつかの記憶装置の内の複数を決定することをさらに含む請求項20に記載の方法。
  24. サービスするステップが、複数のゲートウェイ・サービス・ノードにより均一な態様で要求をサービスすることを含む請求項17に記載の方法。
  25. クライアントからの要求を複数のゲートウェイ・サービス・ノードに分配することをさらに含む請求項24に記載の方法。
  26. ゲートウェイ・サービス・ノードは、クライアントのファイル要求に実質的に同じ性能を与える請求項24に記載の方法。
  27. サービスするステップが、NFSプロトコル、CIFSプロトコル、HTTPプロトコル、及びFTPプロトコルの内の少なくとも1つに従い要求をサービスすることを含む請求項17に記載の方法。
  28. あるビットファイル・データを第1記憶装置から第1及び第2記憶装置と異なる第3記憶装置へ移動し、
    移動されたビットファイル・データの移動された位置を反映するために移動されたビットファイル・データに対応するメタデータを更新することをさらに含み、
    これにより、クライアントは移動された位置のファイルにアクセスするために移動されたビットファイルと関連したファイル識別子を与えることのみが必要とされる請求項17に記載の方法。
  29. 第1記憶装置内の古い位置からビットファイル・データを削除することをさらに含む請求項28に記載の方法。
JP2004522904A 2002-06-13 2002-06-13 関連アプリケーション相互参照対称的共有ファイル記憶システム Pending JP2005530280A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2002/018948 WO2004010291A1 (en) 2000-12-05 2002-06-13 Symmetric shared file storage system

Publications (1)

Publication Number Publication Date
JP2005530280A true JP2005530280A (ja) 2005-10-06

Family

ID=34271572

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004522904A Pending JP2005530280A (ja) 2002-06-13 2002-06-13 関連アプリケーション相互参照対称的共有ファイル記憶システム

Country Status (4)

Country Link
EP (1) EP1552384A4 (ja)
JP (1) JP2005530280A (ja)
AU (1) AU2002315155B2 (ja)
CA (1) CA2489190A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009116414A (ja) * 2007-11-01 2009-05-28 Hitachi Ltd 情報処理システム及びデータ管理方法
JP2009529295A (ja) * 2006-03-08 2009-08-13 オムニオン ビデオ ネットワークス スケーラブルなデータ記憶システムのためのネットワークトポロジ
JP2011528142A (ja) * 2008-07-09 2011-11-10 ザ・ボーイング・カンパニー 安全且つハイパフォーマンスの多重レベルセキュリティデータベースシステム及び方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6792424B1 (en) * 1999-04-23 2004-09-14 International Business Machines Corporation System and method for managing authentication and coherency in a storage area network
US7506034B2 (en) * 2000-03-03 2009-03-17 Intel Corporation Methods and apparatus for off loading content servers through direct file transfer from a storage center to an end-user
US6553378B1 (en) * 2000-03-31 2003-04-22 Network Associates, Inc. System and process for reporting network events with a plurality of hierarchically-structured databases in a distributed computing environment
US6970939B2 (en) * 2000-10-26 2005-11-29 Intel Corporation Method and apparatus for large payload distribution in a network

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009529295A (ja) * 2006-03-08 2009-08-13 オムニオン ビデオ ネットワークス スケーラブルなデータ記憶システムのためのネットワークトポロジ
JP4934790B2 (ja) * 2006-03-08 2012-05-16 ハーモニック インコーポレイテッド スケーラブルなデータ記憶システムのためのネットワークトポロジ
JP2009116414A (ja) * 2007-11-01 2009-05-28 Hitachi Ltd 情報処理システム及びデータ管理方法
US8473636B2 (en) 2007-11-01 2013-06-25 Hitachi, Ltd. Information processing system and data management method
US9609045B2 (en) 2007-11-01 2017-03-28 Hitachi, Ltd. Information processing system and data management method
JP2011528142A (ja) * 2008-07-09 2011-11-10 ザ・ボーイング・カンパニー 安全且つハイパフォーマンスの多重レベルセキュリティデータベースシステム及び方法

Also Published As

Publication number Publication date
AU2002315155B2 (en) 2008-08-07
AU2002315155A1 (en) 2004-02-09
EP1552384A1 (en) 2005-07-13
EP1552384A4 (en) 2007-01-03
CA2489190A1 (en) 2004-01-29

Similar Documents

Publication Publication Date Title
US6976060B2 (en) Symmetric shared file storage system
US7574443B2 (en) Scalable clustered storage system
US7904649B2 (en) System and method for restriping data across a plurality of volumes
US7676628B1 (en) Methods, systems, and computer program products for providing access to shared storage by computing grids and clusters with large numbers of nodes
US8041924B2 (en) Location-independent raid group virtual block management
US8694469B2 (en) Cloud synthetic backups
US7146389B2 (en) Method for rebalancing free disk space among network storages virtualized into a single file system view
US7721045B1 (en) System and method for efficiently guaranteeing data consistency to clients of a storage system cluster
JP4451293B2 (ja) 名前空間を共有するクラスタ構成のネットワークストレージシステム及びその制御方法
US20080155214A1 (en) Method and apparatus for file system virtualization
US7627699B1 (en) System and method for managing I/O access policies in a storage environment employing asymmetric distributed block virtualization
US7424497B1 (en) Technique for accelerating the creation of a point in time prepresentation of a virtual file system
US7529972B2 (en) Methods and apparatus for reconfiguring a storage system
US20050278383A1 (en) Method and apparatus for keeping a file system client in a read-only name space of the file system
JP2016505935A (ja) 分散オブジェクトストレージエコシステムにおけるコンテンツとメタデータの分離
EP1769396A1 (en) Methods, systems and programs for maintaining a namespace of filesets accessible to clients over a network
US20070157002A1 (en) Methods and apparatus for configuring a storage system
JP4278452B2 (ja) 計算機システム
US8332497B1 (en) Generic resynchronization between persistent management store and dynamic configuration
US9165003B1 (en) Technique for permitting multiple virtual file systems having the same identifier to be served by a single storage system
US7539838B1 (en) Methods and apparatus for increasing the storage capacity of a storage system
JP2007115140A (ja) ストレージシステム、及びストレージスシステムの制御方法
US7756832B1 (en) Apparatus and method for providing upgrade compatibility
AU2002315155B2 (en) Symmetric shared file storage system cross-reference to related applications
US7509329B1 (en) Technique for accelerating file deletion by preloading indirect blocks

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070524

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070604

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20070904

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20070911

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071204

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080908

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090309