JP2001051890A - 仮想分散ファイルサーバシステム - Google Patents

仮想分散ファイルサーバシステム

Info

Publication number
JP2001051890A
JP2001051890A JP11226494A JP22649499A JP2001051890A JP 2001051890 A JP2001051890 A JP 2001051890A JP 11226494 A JP11226494 A JP 11226494A JP 22649499 A JP22649499 A JP 22649499A JP 2001051890 A JP2001051890 A JP 2001051890A
Authority
JP
Japan
Prior art keywords
server
file
servers
information
request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11226494A
Other languages
English (en)
Inventor
Ikuo Uchibori
郁夫 内堀
Masayuki Takakuwa
正幸 高桑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP11226494A priority Critical patent/JP2001051890A/ja
Publication of JP2001051890A publication Critical patent/JP2001051890A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】ネットワーク上に分散した複数のファイルサー
バの台数やストレージ装置の接続状態をクライアントに
意識させないで済むようにする。 【解決手段】ネットワーク3上に分散したサーバ10-
1,10-2を備え、各サーバには、仮想分散ファイルシ
ステム11が分散して実装されている。このシステム1
1を構成する、サーバ10-1,10-2上のモジュール1
10-1,110-2は、クライアント2からマルチキャス
トされたファイル操作要求を受け取ると、仮想分散ファ
イルシステム11と全ローカルファイルシステム13-
1,13-2とのマッピングテーブル14-1,14-2また
は全サーバのサーバ情報を保持するサーバ情報保持部1
5-1,15-2をもとに、自サーバが上記要求を処理可能
な最適なサーバであるか否かを判断し、その判断結果に
基づいて要求されたファイル操作を対応するサーバのロ
ーカルファイルシステムにより行わせる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、コンピュータ・ネ
ットワークシステムにおけるファイルサーバシステムに
係り、特にネットワーク上に接続された複数のファイル
サーバを協調動作させて、クライアントからは単一のサ
ーバとして機能させる仮想分散ファイルサーバシステム
に関する。
【0002】
【従来の技術】今日のコンピュータ・ネットワークシス
テムにおいては、ネットワークに接続された異なるコン
ピュータ間でファイルを共有することが一般的に行われ
ている。こうした環境下では、特定のコンピュータに大
規模なストレージを接続して、ファイルサーバとして運
用したり、最近ではNAS(Network Attached Storag
e)と呼ばれる、ファイルサーバ専用機を接続する等の
システム構成をとることが多い。
【0003】ファイルサーバを使用する環境(ファイル
サーバシステム)では、サーバのストレージ容量が不足
した場合には、サーバ側に物理的・性能的に拡張性があ
れば、新たにディスク装置等(のストレージ装置)を増
設することで対処できる。このときクライアントから
は、新たなボリュームをマウントして使用するといった
形態になる。また、サーバの拡張性が限界に達していれ
ば、サーバ自体を増設することになる。このときクライ
アントからは、増設したサーバを意識した上で新たなボ
リュームをマウントして使用するといった形態になる。
【0004】
【発明が解決しようとする課題】上記したコンピュータ
・ネットワークシステムにおいてファイルサーバを利用
してファイル共有を行う場合、クライアント側からは、
ファイルサーバ側のボリューム構成がそのまま見えてし
まうのが一般的である。例えばサーバ側でディスク装置
を増設した場合には、クライアント側は新たなボリュー
ムを認識した上で、マウントしなければならない。或い
はサーバ自体を増設した場合には、増設したサーバの運
用ポリシーを決定、もしくはシステム設定・管理等の煩
雑な作業が発生する上、クライアント側でも、新たなサ
ーバを認識した上で、新たなボリュームをマウントしな
ければならない。
【0005】このように従来のファイルサーバを用いた
ファイル共有システム(ファイルサーバシステム)で
は、ディスク装置(ストレージ装置)の増設、或いはサ
ーバの増設が必要な場合、サーバ側、クライアント側の
いずれにも、新たな設定・管理のために多大なコストが
発生するという問題があった。更に、ストレージの利用
形態よっては、特定のファイルシステムをそのまま容量
だけ拡張したい場合もあり、単にストレージ装置やサー
バを増設するだけでは解決しないケースもあった。
【0006】本発明は上記事情を考慮してなされたもの
でその目的は、ネットワーク上に分散した複数のファイ
ルサーバを、クライアントからは単一のサーバとして扱
うことができ、サーバ台数やストレージ装置の接続状態
をクライアントに意識させない仮想分散ファイルサーバ
システムを提供することにある。
【0007】
【課題を解決するための手段】本発明は、マルチキャス
ト可能なネットワークに接続された複数のファイルサー
バに分散して実装され、全ファイルサーバのファイルを
統合的に管理する、実際のストレージ構成には非依存の
仮想分散ファイルシステムと、各ファイルサーバにそれ
ぞれ独立して実装され、各サーバに固有のストレージ構
成を管理するローカルファイルシステムと、前記各ファ
イルサーバにそれぞれ設けられ、上記各ファイルについ
て、仮想分散ファイルサーバシステムとそのファイルを
実際に管理するローカルファイルシステムとの間のマッ
ピングの情報(例えば、仮想分散ファイルサーバシステ
ムで管理され、クライアントから見える仮想的なパス
と、ローカルファイルシステムで管理され、クライアン
トから見えない物理的な所在とを対応付けた情報)を保
持するマッピングテーブルとを備えると共に、上記仮想
分散ファイルシステムを、各ファイルサーバにそれぞれ
設けられた管理モジュールであって、クライアントから
マルチキャストされたファイル操作要求を共通に受け取
り、当該要求に応じて自サーバのマッピングテーブルを
参照することで、自サーバが当該要求を処理可能な最適
なサーバであるか否かを判断し、最適なサーバであると
判断した場合だけ、要求されたファイル操作を対応する
サーバのローカルファイルシステムにより行わせる管理
モジュールにより構成することを特徴とする。
【0008】ここで、各ファイルサーバ上に、全ファイ
ルサーバについて、そのサーバのストレージ装置の空き
容量を示す情報、及びそのサーバの負荷状況を示す情報
の少なくとも一方を含むサーバ情報を保持するサーバ情
報保持手段を更に設け、上記各管理モジュールでは、ク
ライアントからマルチキャストされたファイル操作要求
を受け取った場合に、当該要求に応じて自サーバのマッ
ピングテーブルまたはサーバ情報保持手段を参照するこ
とで、自サーバが当該要求を処理可能な最適なサーバで
あるか否かを判断する構成としてもよい。
【0009】このような構成においては、クライアント
から特定のファイルサーバを意識することなくマルチキ
ャストされたファイル操作要求は、仮想分散ファイルサ
ーバシステムを構成する各ファイルサーバ上の管理モジ
ュールで共通に受け取られ、その要求に応じて対応する
サーバ(自サーバ)のマッピングテーブルまたはサーバ
情報保持手段が参照される。そして、この参照の結果、
自サーバが上記要求を処理可能な最適なサーバであるか
否かが判断され、最適なサーバであると判断した唯一の
サーバ(上の管理モジュール)だけが、要求されたファ
イル操作を自サーバのローカルファイルシステムにより
行わせる。
【0010】このように、要求元のクライアントから
は、ネットワーク上に分散した複数のファイルサーバを
単一のサーバとして扱うことができ、サーバ台数やスト
レージ装置の接続状態を意識する必要がない。
【0011】ここで、上記管理モジュールで、自サーバ
が最適なサーバであるか否かを判断するためのアルゴリ
ズムとして、以下の第1乃至第4のアルゴリズム(判断
手法)のいずれかを適用するとよい。
【0012】第1のアルゴリズムは、ファイル操作要求
がファイル読み出し要求またはファイル書き込み要求の
場合に適用されるもので、自サーバのマッピングテーブ
ルの情報に基づいて、該当するファイルが自サーバのロ
ーカルファイルシステムの管理下にあるか否かにより判
断する手法である。
【0013】第2のアルゴリズムは、ファイル操作要求
がファイルの新規作成要求の場合に適用されるもので、
自サーバのサーバ情報保持手段の情報に基づいて、全て
のサーバの各々について、そのサーバのストレージ装置
の空き容量(空き記憶容量)、またはそのサーバの負荷
状況を比較することで判断する(例えば、自サーバの空
き容量が最も大きい場合、或いは自サーバの負荷が最も
低い場合に上記最適サーバと判断する)手法である。
【0014】第3のアルゴリズムも、ファイル操作要求
がファイルの新規作成要求の場合に適用されるもので、
自サーバのマッピングテーブルの情報に基づいて、全て
のサーバの各々について対応するストレージ装置上に確
保可能な連続領域を求め、その連続領域のサイズを比較
することで判断する(例えば、自サーバのストレージ装
置上に確保可能な連続領域のサイズが最も大きい場合に
上記最適サーバと判断する)手法である。
【0015】第4のアルゴリズムも、ファイル操作要求
がファイルの新規作成要求の場合に適用されるもので、
全てのサーバの各々について、そのサーバのストレージ
装置の空き容量、そのサーバの負荷、及び当該ストレー
ジ装置上に確保可能な連続領域の少なくとも2つを求
め、その求めた少なくとも2つの情報を複合条件として
比較することで判断する手法である。
【0016】以上の第1乃至第4のアルゴリズムのいず
れか1つを適用することで、クライアントから特定のフ
ァイルサーバを意識することなくマルチキャストされた
ファイル操作要求を各サーバが共通に受け取っても、そ
の要求されたファイル操作を行うのに最適なサーバであ
るか否かを、その都度相互に通信を行うことなく、その
サーバ自身で自律的に判断することができる。
【0017】ここで、上記各管理モジュールに、全ての
ファイルサーバのマッピングテーブルの内容を一致化す
るために、自サーバのマッピングテーブルの情報と他サ
ーバのマッピングテーブルの情報とをサーバ間通信によ
り交換する機能(通信モジュール)を持たせるとよい。
また、マッピングテーブルに加えてサーバ情報保持手段
を各サーバ上に備えた構成では、各管理モジュール(内
の通信モジュール)に、全てのファイルサーバのサーバ
情報保持手段の内容を一致化するために、自サーバのサ
ーバ情報保持手段の情報と他のサーバのサーバ情報保持
手段の情報とをサーバ間通信により交換する機能を更に
持たせるとよい。
【0018】また、マッピングテーブルの一致化のため
には、自サーバのローカルファイルシステムで実際に管
理されるファイル構成が変更された場合に、その変更さ
れた情報(マッピング情報)をサーバ間通信により他の
全サーバに送信するのが効率的である。同様に、サーバ
情報保持手段の内容の一致化のためには、自サーバのサ
ーバ情報を定期的に更新し、その都度、その更新された
サーバ情報をサーバ間通信により他の全サーバに送信す
るのが効率的である。
【0019】また本発明は、上記仮想分散ファイルサー
バシステムにサーバが動的に増設された場合に、そのサ
ーバの管理モジュールで以下の第1乃至第4の処理を行
うようにしたことをも特徴とする。まず、第1の処理で
は、サーバ間通信により他の全てのサーバに対してマッ
ピングテーブル及びサーバ情報保持手段の更新を禁止す
るロック設定を行い、次の第2の処理では、サーバ間通
信により他の任意のサーバからマッピングテーブルサー
バ情報保持手段の内容を自サーバにコピーし、次の第3
の処理では、自サーバのサーバ情報保持手段に自サーバ
のサーバ情報を追加し、次の第4の処理では、サーバ間
通信により自サーバのーバ情報を他の全てのサーバのサ
ーバ情報保持手段に反映させて全サーバのサーバ情報保
持手段の一致化を図り、しかる後に上記ロック設定を解
除する。
【0020】このようなサーバ増設時の一連の動作によ
り、動的にサーバ台数を拡張できる。しかもクライアン
トは、サーバ台数の拡張を意識することなく、増設され
たサーバを利用することができる。
【0021】また本発明は、各ファイルサーバに、その
サーバの管理下にある各ファイル別の負荷状況を示す情
報を保持するファイル別負荷状況情報保持手段を付加
し、各サーバの管理モジュールにおいて、自サーバのフ
ァイル別負荷状況情報保持手段に保持されている情報か
ら第1の閾値を超えた負荷のファイルを検出して、他の
任意のファイルサーバに対してサーバ間通信により当該
ファイルのレプリケーションを行い、クライアントから
マルチキャストされた当該ファイルの読み出し要求があ
った場合、当該要求に対する処理をレプリケーション側
に任せるようにしたことをも特徴とする。
【0022】このような構成においては、自律的な負荷
分散が可能となる。ここで、上記検出したファイルがレ
プリケーションされたファイルである場合にも、他の任
意のファイルサーバに対してサーバ間通信により当該フ
ァイルのレプリケーションを行い、クライアントからマ
ルチキャストされた当該ファイルの読み出し要求があっ
た場合に、当該要求に対する処理を新たなレプリケーシ
ョン側に任せることにより、自律的な負荷分散がより広
範囲に効果的に行える。また、他サーバへのレプリケー
ションの対象となったファイルの負荷が前記第1の閾値
より低い第2の閾値以下となった場合に、そのレプリケ
ーションを行ったサーバ上の管理モジュールから当該他
サーバに対してサーバ間通信により対応するファイルの
消去を要求し、クライアントからマルチキャストされた
当該ファイルの読み出し要求があった場合、当該要求に
対する処理を自身が行うことにより、動的な負荷分散が
可能となる。
【0023】さて、上記一致化のためのサーバ間通信
(マッピング情報またはサーバ情報の通信)、更には上
記レプリケーションのためのサーバ間通信には、上記ネ
ットワークを用いることが可能である。しかし、各ファ
イルサーバを相互接続する専用の通信路(プライベート
通信路)を上記ネットワークから独立に設け、当該通信
路を用いてサーバ間通信を行う構成とするとよい。この
場合、サーバ間通信のためにネットワークのスループッ
トが悪化するのを防止できる。
【0024】また本発明は、各ファイルサーバ及び当該
サーバのストレージ装置を相互接続するマルチホストが
可能なインタフェースを更に備えると共に、上記各管理
モジュールによる上記サーバ間通信を当該インタフェー
スを介して行うようにしたことをも特徴とする。
【0025】このような構成においては、上記各ストレ
ージ装置を上記インタフェースによって各サーバ間で共
有し、上記一致化のためのサーバ間通信、更には動的な
ファイルのレプリケーションのためのサーバ間通信が上
記インタフェースを通して行われるため、自律的な負荷
分散が効果的に実現される。
【0026】なお、本発明は方法に係る発明としても成
立する。
【0027】
【発明の実施の形態】以下、本発明の実施の形態につき
図面を参照して説明する。
【0028】[第1の実施形態]図1は本発明の第1の
実施形態に係る仮想分散ファイルサーバシステムを適用
するコンピュータ・ネットワークシステムの構成を示す
ブロック図である。
【0029】同図において、1は仮想分散ファイルサー
バシステム、2は同ファイルサーバシステム1にファイ
ルサービスを要求するクライアント(クライアントコン
ピュータ)である。仮想分散ファイルサーバシステム1
は、ネットワーク3上に分散配置された複数、例えば2
台のファイルサーバ(サーバコンピュータ)10-1,1
0-2を用いて実現される。なお、図ではクライアント2
は便宜的に1台だけが示されているが、複数存在するの
が一般的である。
【0030】11は仮想分散ファイルサーバシステム1
の中心をなす仮想分散ファイルシステムであり、各ファ
イルサーバ10-1,10-2に分散して実装されている。
この仮想分散ファイルシステム11は、全ファイルサー
バ10-1,10-2のファイルを統合的に管理し、ファイ
ルサーバ10-1,10-2それぞれの実際のボリューム構
成(ストレージ構成)には依存しない、仮想的なファイ
ルシステムをクライアント2に対して提供するものであ
る。
【0031】仮想分散ファイルシステム11は、各ファ
イルサーバ10-1,10-2に分散して実装された仮想分
散ファイルモジュール110-1,110-2を有してい
る。仮想分散ファイルモジュール110-1,110-2
は、ファイルサーバ10-1,10-2上でクライアント2
からの要求を分散して処理しつつ、クライアント2に対
しては仮想的に1つのファイルシステムとして見せるた
めの管理モジュールである。仮想分散ファイルモジュー
ル110-1,110-2は、当該モジュール110-1,1
10-2の中心をなし、クライアント2からの要求を処理
する仮想分散ファイルインタフェース111-1,111
-2と、後述するローカルファイルシステム13-1,13
-2とのインタフェース(ローカルファイルインタフェー
ス)112-1,112-2と、当該モジュール110-1,
110-2間での通信(後述するマッピングテーブル14
-1,14-2の情報、及びサーバ情報の一致化のための通
信に代表されるサーバ間通信)を行う通信モジュール1
13-1,113-2とを持つ。
【0032】ファイルサーバ10-1,10-2はネットワ
ーク3を介してクライアント2と接続されている。ファ
イルサーバ10-1,10-2は、仮想分散ファイルシステ
ム11の他に、それぞれ当該サーバ10-1,10-2に接
続されたディスク装置などのストレージ装置12-1,1
2-2(実際のストレージ構成)を管理するローカルなフ
ァイルシステム(ローカルファイルシステム)13-1,
13-2を実装している。
【0033】ファイルサーバ10-1,10-2には、仮想
分散ファイルシステム11とローカルファイルシステム
13-1,13-2とを対応付ける同一内容のマッピングテ
ーブル14-1,14-2が設けられている。このテーブル
14-i(i=1,2)のデータ構造を図2に示す。
【0034】テーブル14-iの各エントリは、仮想分散
ファイルシステム1が管理するファイルのファイル名の
登録フィールド(ファイル名フィールド)141と、当
該ファイルの仮想分散ファイルシステム1上の論理的な
所在を表す(クライアント2から見える)パス(仮想パ
ス)の登録フィールド(仮想パスフィールド)142、
当該ファイルのストレージ上の物理的な所在位置を表す
(クライアント2から見えない)所在位置情報の登録フ
ィールド(所在位置情報フィールド)143、当該ファ
イルへのアクセス権(許可/禁止)を管理するためのパ
ーミッション情報の登録フィールド(パーミッション情
報フィールド)144、及びその他の各種属性の登録フ
ィールド145を有している。
【0035】仮想分散ファイルシステム11(上の仮想
分散ファイルモジュール110-i)は、このようなデー
タ構造のマッピングテーブル14-iを参照することによ
り、例えばあるファイルがファイルサーバ10-1,10
-2のいずれにあるか等の所在情報を得ることができる
他、パーミッション等、必要に応じてファイルの属性を
得ることができる。
【0036】ファイルサーバ10-1,10-2には更に、
同一内容のサーバ情報保持部15-1,15-2が設けられ
ている。サーバ情報保持部15-i(i=1,2)は、図
3に示すように、仮想分散ファイルサーバシステム1を
構成する全てのファイルサーバ10-1,10-2の(スト
レージ装置12-1,12-2の)空き記憶容量を示す情報
(リソース情報)、及び負荷状況を示す情報を含むサー
バ情報を保持するのに用いられる。
【0037】次に図1の構成の動作を説明する。本実施
形態では、クライアント2からは、各ファイルサーバ1
0-1,10-2のローカルファイルシステム13-1,13
-2ではなくて、仮想分散ファイルシステム11がマウン
トされているように見えている。そこでクライアント2
は、何らかのファイル操作要求が発生した場合、仮想分
散ファイルシステム11が実装されている全ファイルサ
ーバ10-1,10-2に対して同一の要求を発行する。こ
の場合、例えばIP(Internet Protocol)マルチキャス
トを使用する等の手法によれば、クライアント2側はフ
ァイルサーバの台数を意識することなく要求の発行が可
能である。
【0038】ファイルサーバ10-1,10-2は、クライ
アント2からの要求を受け取ると、当該要求を仮想分散
ファイルシステム11内の自サーバに対応した仮想分散
ファイルモジュール110-1,110-2に渡す。する
と、モジュール110-1,110-2(内の仮想分散ファ
イルインタフェース111-1,111-2)は、その要求
がファイルの読み出し要求もしくは書き込み(更新)要
求であるか、または新規ファイルの作成要求もしくはデ
ィレクトリの作成要求であるか、その要求種別を判別す
る。
【0039】ここで、クライアント2からのファイル操
作要求がファイルの読み出し要求もしくは書き込み要求
であるものとする。この要求には、要求の対象となるフ
ァイルのファイル名と、当該ファイルの仮想分散ファイ
ルシステム11上のパス(仮想パス)が付されている。
【0040】仮想分散ファイルモジュール110-1,1
10-2(内の仮想分散ファイルインタフェース111-
1,111-2)は、クライアント2からのファイル操作
要求がファイルの読み出し要求もしくは書き込み要求の
場合、要求されたファイルのファイル名及び仮想パスに
より自サーバ内のマッピングテーブル14-1,14-2を
参照し、当該ファイル名及び仮想パスを持つテーブル1
4-1,14-2内エントリ中の所在位置情報フィールド1
43の登録情報から、操作要求のあったファイルが自サ
ーバ内(自サーバに接続されたストレージ装置12-1,
12-2)に保持されているか否かを調べる。
【0041】もし、要求されたファイルが自サーバ内に
保持されている場合には、仮想分散ファイルモジュール
110-1,110-2(内の仮想分散ファイルインタフェ
ース111-1,111-2)は、ローカルファイルインタ
フェース112-1,112-2により自サーバ内のローカ
ルファイルシステム13-1,13-2を介して実際のファ
イルにアクセスし、クライアント2に応答を返す。一
方、操作要求のあったファイルが自サーバ内になかった
場合には、他のサーバが応答するものと見なして応答し
ない。
【0042】これに対し、クライアント2からの要求が
新規ファイルの作成、或いはディレクトリの作成であっ
た場合には、仮想分散ファイルモジュール110-1,1
10-2は、(マッピングテーブル14-1,14-2ではな
くて)サーバ情報保持部15-1,15-2を参照する。そ
して、サーバ情報保持部15-1,15-2に保持されてい
る全サーバのサーバ情報をもとに、所定のアルゴリズム
に従い、いずれか1つのサーバ10-i(iは1または
2)上の仮想分散ファイルモジュール110-iだけが、
仮想分散ファイルインタフェース111-iによりクライ
アント2からの要求を受け付ける。具体的には、サーバ
10-i上の仮想分散ファイルモジュール110-iは、全
サーバのサーバ情報の示す空き記憶容量を比較し、自サ
ーバ10-i(のストレージ装置12-i)の空き記憶容量
が最も大きいと判定できる場合に、クライアント2から
の要求を受け付けるものとする。この場合、必ずしもサ
ーバ情報中に負荷状況の情報を持たせる必要はない。
【0043】なお、全サーバのサーバ情報の示す負荷を
比較し、自サーバの負荷が最も低い場合にクライアント
2からの要求を受け付けるようにしてもよい。この場
合、必ずしもサーバ情報中に対応するサーバの空き記憶
容量の情報を持たせる必要はない。
【0044】この他に、マッピングテーブル14-iの各
ファイル毎のマッピング情報から(つまり各ストレージ
装置12-1,12-2の領域の使用状況から)、各ストレ
ージ装置12-1,12-2上に確保可能な連続領域を求
め、必要なサイズ以上の連続領域が確保でき、且つその
サイズが最も大きいストレージ装置が自サーバのストレ
ージ装置12-iの場合に、クライアント2からの要求を
受け付けるようにしてもよい。この場合、サーバ情報保
持部15-1,15-2は必ずしも必要でない。
【0045】更に、空き記憶容量と負荷状況と確保でき
る連続領域のサイズの少なくとも2つを条件(複合条
件)として評価値を求め、自サーバが要求を受け付ける
最適なサーバであるか否かを判断ようにしてもよい。
【0046】さて、ファイルサーバ10-i上の仮想分散
ファイルモジュール110-iでは、仮想分散ファイルイ
ンタフェース111-iによりクライアント2からの要求
を受け付けると、要求された新規ファイルの作成、或い
はディレクトリの作成を、ローカルファイルインタフェ
ース112-iを介してローカルファイルシステム13-i
により行い、マッピングテーブル14-1,14-2に該当
するエントリ情報を登録する。
【0047】新規ファイルの作成、或いはディレクトリ
の作成が完了した後は、ファイルサーバ10-i上の仮想
分散ファイルモジュール110-iでは、自サーバ上のマ
ッピングテーブル14-iに登録した新たなエントリ情報
を通信モジュール113-iによりネットワーク3を介し
て他の全てのサーバ10-j(jは1または2、但しj≠
i)上の仮想分散ファイルモジュール110-jに送
る。仮想分散ファイルモジュール110-j(内の仮想
分散ファイルインタフェース111-j)は、仮想分散フ
ァイルモジュール110-iから送られたマッピングテー
ブル14-iのエントリ情報を通信モジュール113-jを
介して受け取る。そしてモジュール110-j(内のイ
ンタフェース111-j)は、受け取った他サーバ10-i
のマッピングテーブル14-iのエントリ情報を自サーバ
内のマッピングテーブル14-jに登録する。このよう
に、ファイルサーバ10-1,110-2上の仮想分散ファ
イルモジュール110-1,110-2が相互にマッピング
テーブル14-1,14-2の新規登録されたエントリ情報
(更には更新されたエントリ情報)を交換し合うこと
で、当該マッピングテーブル14-1,14-2の内容の一
致化を図ることができる。
【0048】また、ファイルサーバ10-1,10-2上の
仮想分散ファイルモジュール110-1,110-2は、自
サーバ上のサーバ情報保持部15-1,15-2に保持され
ている各サーバのサーバ情報のうち、自サーバのサーバ
情報(空き記憶容量、及び負荷状況)を定期的に更新す
ると共に、その更新したサーバ情報を(通信モジュール
113-1,113-2により)ネットワーク3を介して他
の全てのサーバ(上の仮想分散ファイルモジュール11
0-2,110-1)に定期的に送ることで、各ファイルサ
ーバ10-1,10-2のサーバ情報保持部15-1,15-2
の内容の一致化を図る。つまり仮想分散ファイルモジュ
ール110-1,110-2は定期的にサーバ情報を交換し
合うことで一致化を図る。
【0049】以上の動作によって、ファイルサーバ10
-1,10-2を自律的に分散・協調動作させることがで
き、クライアント2には実際にはファイルサーバが2台
(複数台)あることを意識させずに、仮想的なファイル
サーバを提供することができる。
【0050】なお、図1のシステムの例ではサーバが2
台である場合について説明したが、サーバが3台以上で
あっても同様の仕組みによって、仮想的なファイルサー
バを提供することができる。
【0051】[第2の実施形態]図4は本発明の第2の
実施形態に係る仮想分散ファイルサーバシステムを適用
するコンピュータ・ネットワークシステムの構成を示す
ブロック図であり、図1と同一部分には同一符号を付し
てある。
【0052】図4において、仮想分散ファイルサーバシ
ステム4の中心をなす仮想分散ファイルシステム41
は、n台のファイルサーバ10-1〜10-nに分散して実
装されている。この仮想分散ファイルシステム41は、
図1中の仮想分散ファイルシステム11と同様に、全フ
ァイルサーバ10-1〜10-nのファイルを統合的に管理
し、各ファイルサーバ10-1〜10-nそれぞれの実際の
ボリューム構成には依存しない、仮想的なファイルシス
テムをクライアント2に対して提供している。仮想分散
ファイルシステム41は、各ファイルサーバ10-1〜1
0-n上でクライアント2からの要求を処理する仮想分散
ファイルモジュール410-1〜410-nを有している。
モジュール410-1〜410-nは、図1中のモジュール
110-1,110-2と同様の構成である、仮想分散ファ
イルインタフェース411-1〜411-nと、ローカルフ
ァイルインタフェース412-1〜412-nと、通信モジ
ュール413-1〜413-nとを持つ。但し、本実施形態
における通信モジュール413-1〜413-nは、図1中
の通信モジュール113-1,113-2と異なり、後述す
るプライベート通信路5を介して通信を行うように構成
されている。
【0053】ファイルサーバ10-1〜10-nはネットワ
ーク3を介してクライアント2と接続されている。ファ
イルサーバ10-1〜10-nは、仮想分散ファイルシステ
ム11の他に、それぞれ当該サーバ10-1〜10-nに接
続されたストレージ装置12-1〜12-2を管理するロー
カルなファイルシステム(ローカルファイルシステム)
13-1〜13-2を実装している。ファイルサーバ10-1
〜10-nには、マッピングテーブル14-1〜14-nと、
サーバ情報保持部15-1〜15-2とが設けられている。
【0054】図4の構成の仮想分散ファイルサーバシス
テム4の特徴は、図1の構成の仮想分散ファイルサーバ
システム1と異なって、システムを構成するファイルサ
ーバの台数がn台である点と、そのn台のファイルサー
バ10-1〜10-nがネットワーク3とは別のプライベー
トな通信路5によっても相互接続されている点である。
このプライベート通信路5は、例えばイーサネット、或
いはファイバチャネル(Fibre Channnel)等であるが、
物理層に関しては特定しない。またトポロジに関して
も、図4の例ではバス型を想定しているが、ループやス
イッチであってもよい。
【0055】図4の構成において、ファイルサーバ10
-1〜10-nが(仮想分散ファイルシステム41内の仮想
分散ファイルモジュール410-1〜410-nにより)分
散・協調動作を行うためには、前記第1の実施形態での
動作説明から類推されるように、マッピングテーブル1
4-1〜14-n、及びサーバ情報保持部15-1〜15-nの
内容を、各サーバ10-1〜10-n間で常に一致化させて
おく必要がある。しかし、サーバ10-1〜10-n間の情
報一致化を、前記第1の実施形態と同様にネットワーク
3を介して行うのでは、仮想分散ファイルサーバシステ
ム4を構成するファイルサーバの台数が増加した場合に
は、その情報一致化の(ためのサーバ間通信の)トラフ
ィックが増加し、ネットワーク3上のスループットを悪
化させることになる。
【0056】そこで本実施形態(第2の実施形態)で
は、図4の構成のように、各ファイルサーバ10-1〜1
0-n間にサーバ間の情報交換専用のプライベート通信路
5を設け、仮想分散ファイルシステム41内の仮想分散
ファイルモジュール410-1〜410-nで通信モジュー
ル413-1〜413-nにより行われるサーバ間通信に、
即ちマッピングテーブル14-1〜14-n、及びサーバ情
報保持部15-1〜15-nの内容を一致化するためのサー
バ間通信に、この通信路5を使用するようにしている。
【0057】このように本実施形態では、マッピングテ
ーブル14-1〜14-n、及びサーバ情報保持部15-1〜
15-nの内容の一致化のためのサーバ間通信に、ネット
ワーク3でなくてプライベート通信路5を用いることに
より、ネットワーク3の負荷の軽減を図ることができ
る。
【0058】[第3の実施形態]以上に述べた第1、第
2の実施形態では、複数のファイルサーバを分散・協調
動作させる仮想分散ファイルサーバシステムの構成例を
示した。この第1、第2の実施形態で参照した図1、図
4の構成は、特定のサーバ台数における静的な例であ
る。しかし、サーバ台数については、変更可能な構成と
することが好ましい。
【0059】そこで、仮想分散ファイルサーバシステム
を構成するサーバ台数を動的に拡張可能とした本発明の
第3の実施形態について図面を参照して説明する。図5
は本発明の第3の実施形態に係る仮想分散ファイルサー
バシステムを適用するコンピュータ・ネットワークシス
テムの構成を示すブロック図であり、図4と同一部分に
は同一符号を付してある。
【0060】まず、図4に示した仮想分散ファイルサー
バシステム4、即ちn台のファイルサーバ10-1〜10
-nで構成される仮想分散ファイルサーバシステム4に、
図5(a)に示すように、新たなファイルサーバ10-
(n+1)を追加するものとする。
【0061】この場合、追加されたファイルサーバ10
-(n+1)にも分散されている仮想分散ファイルシステム4
1上の仮想分散ファイルモジュール410-(n+1)は、既
に仮想分散ファイルサーバシステム4を構成しているフ
ァイルサーバ10-1〜10-nに対し、図5(a)におい
て符号A1で示すように、(例えば図示せぬプライベー
ト通信路を介しての)サーバ間通信により、マッピング
テーブル14-1〜14-nのエントリ情報及びサーバ情報
保持部15-1〜15-nのサーバ情報(各サーバのリソー
ス情報及び負荷状況を含む)の更新をロックする。
【0062】その上で、追加されたサーバ10-(n+1)上
のモジュール410-(n+1)は、他のファイルサーバ10
-1〜10-nのうちのいずれかのサーバ、例えばファイル
サーバ10-1から、図5(b)において符号A2で示す
ように、マッピングテーブル14-1及びサーバ情報保持
部15-1の全情報を、サーバ間通信により自サーバ内の
マッピングテーブル14-(n+1)及びサーバ情報保持部1
5-(n+1)にコピーする。
【0063】次に、追加されたファイルサーバ10-(n+
1)上のモジュール410-(n+1)は、コピー後のサーバ情
報保持部15-(n+1)に対し、図5(c)において符号A
3で示すように、自サーバのリソース及び負荷状況を示
すサーバ情報を追加する。
【0064】しかる後にファイルサーバ10-(n+1)上の
モジュール410-(n+1)は、図5(d)において符号A
4で示すように、サーバ間通信により他の全ファイルサ
ーバ10-1〜10-nに対してサーバ情報の一致化要求を
発行し、その後にロックを解除する。
【0065】以上の一連の動作により、既に構築されて
いる仮想分散ファイルサーバシステム4に対して、動的
に薪たなサーバ(ファイルサーバ10-(n+1))を追加す
ることができる。この場合、例えば現在の仮想分散ファ
イルサーバシステム4のボリューム構成に対し、新規リ
ソースをどのように振り分けるか、といった情報を付加
すれば、必要に応じてボリュームを選択的に拡張するこ
とも可能である。
【0066】[第4の実施形態]図6は本発明の第4の
実施形態に係る仮想分散ファイルサーバシステムを適用
するコンピュータ・ネットワークシステムの構成を示す
ブロック図であり、図4と同一部分には同一符号を付し
てある。
【0067】図6において、6は図4中の仮想分散ファ
イルサーバシステム4に相当する仮想分散ファイルサー
バシステムである。この仮想分散ファイルサーバシステ
ム6の特徴は、当該システム6を構成するファイルサー
バ10-1〜10-n内に、自サーバ(のストレージ装置1
2-1〜12-n)に保持されている各ファイルについての
負荷状況の情報(ファイル別負荷状況情報)を保持する
ファイル別負荷状況情報保持部16-1〜16-nを備えて
いる点にある。これに伴い、仮想分散ファイルサーバシ
ステム6の中心をなす仮想分散ファイルシステム61の
持つ機能も図4中の仮想分散ファイルシステム41とは
一部異なる。但し、仮想分散ファイルシステム61内の
各ファイルサーバ10-1〜10-n毎の仮想分散ファイル
モジュールには便宜的に図4と同一符号(410-1〜4
10-n)を用いている。なお、図6では、モジュール4
10-1〜410-n内の構成要素(仮想分散ファイルイン
タフェース、ローカルファイルインタフェース、通信モ
ジュール)、及びファイルサーバ10-1〜10-n上のマ
ッピングテーブル、サーバ情報保持部は省略されてい
る。
【0068】ファイル別負荷状況情報保持部16-i(i
=1〜n)は、図7(a)に示すデータ構造を持ち、自
サーバ内のファイル毎の負荷状況を示す情報と、そのフ
ァイルの属性を示す情報(ファイル属性)と、レプリケ
ーションフラグとを含むファイル別負荷状況情報を保持
する。ファイル属性は、対応するファイルがオリジナル
であるかレプリカ(複製)であるかを示す。また、レプ
リケーションフラグは、対応するフラグがオリジナルの
場合、そのレプリカを他サーバ側に生成済みであるか否
か、つまりレプリケーション済みであるか否かを示す。
【0069】図6には、ファイルサーバ10-nが持つス
トレージ装置12-n内に、ファイルサーバ10-1が持つ
ストレージ装置12-1内の任意のファイル611のレプ
リカ612がレプリケーションB1により保持されてい
る様子が示されている。
【0070】次に、図6の構成の動作を説明する。仮想
分散ファイルシステム61上の各仮想分散ファイルモジ
ュール410-1〜410-nは、ファイル別負荷状況情報
保持部16-1〜16-nを例えば定期的に参照する。そし
てモジュール410-1〜410-nは、保持部16-1〜1
6-nに保持されているファイル別の負荷状況情報から、
自サーバ(のストレージ装置12-1〜12-n)に保持さ
れているファイルの中に、第1の閾値を超えた負荷のフ
ァイルが存在することを検出した場合、他サーバの1つ
に対して対応するファイルのレプリカを非同期に生成す
るレプリケーション動作を、例えばプライベート通信路
5を介してのサーバ間通信により行う。ここでファイル
の負荷状況は、当該ファイルへの要求の待ち行列(キュ
ー)にある要求数、或いは当該ファイルの待ち状態にあ
る要求の示すサイズの総和であり、要求を受け付ける毎
と要求を処理し終える毎に更新される。また、レプリケ
ーションの対象サーバには、図示せぬサーバ情報保持部
に保持されているサーバ情報に基づいて、例えば負荷が
最も低いサーバを選択すればよい。
【0071】仮想分散ファイルモジュール410-1〜4
10-nはレプリケーション動作を行うと、自サーバのフ
ァイル別負荷状況情報保持部16-1〜16-nに保持され
ている対応するファイルの負荷状況情報中のレプリケー
ションフラグをレプリケーション済みの通知状態にセッ
トする。またレプリケーション動作の対象となったサー
バの仮想分散ファイルモジュールは、自サーバのファイ
ル別負荷状況情報保持部内に対応するレプリカの負荷状
況情報を追加する。
【0072】ここでは、図6に示すように、ファイルサ
ーバ10-1の保持するファイル611のレプリケーショ
ンB1がプライベート通信路5を介してファイルサーバ
10-nに対して行われて、そのレプリカ612が当該フ
ァイルサーバ10-nのストレージ装置12-nに保持され
たものとする。この場合、ファイルサーバ10-1のファ
イル別負荷状況情報保持部16-1に保持されているファ
イル611の負荷状況情報中のレプリケーションフラグ
がレプリケーション済みを示す状態にセットされる。ま
た、ファイルサーバ10-nのファイル別負荷状況情報保
持部16-nには、ファイル611のレプリカ612につ
いての新たな負荷状況情報が追加される。この負荷状況
情報中のファイル属性は、対応するファイルが(ファイ
ル611の)レプリカ(612)であることを示す。
【0073】以後、クライアント2からファイル611
の新たな読み出し要求があった場合、当該ファイル61
1を保持するファイルサーバ10-1(の仮想分散ファイ
ルモジュール410-1)は、当該ファイル611の負荷
が第2の閾値(但し、第2の閾値<第1の閾値)を超え
ているか否かを調べ、超えているならば、クライアント
2からの要求に応答しない。この場合、クライアント2
からの要求に対しては、レプリケーションを受けたファ
イルサーバ10-nが応答する。ここでファイルサーバ1
0-nは、ファイルサーバ10-1が応答するか否かを考慮
する必要はなく、要求されたファイル611のレプリカ
612を有する限り、クライアント2に応答すればよ
い。
【0074】このように、クライアント2からのファイ
ル611に対する新たな読み出し要求を、そのレプリカ
612を用いてファイルサーバ10-nが処理すること
で、そのファイル611を保持するファイルサーバ10
-1では、それ以前に受け付けた当該ファイル611に対
する読み出し要求の処理が進み、当該ファイル611の
負荷が上記第2の閾値以下となる。するとファイルサー
バ10-1上の仮想分散ファイルモジュール410-1は、
ファイルサーバ10-n上の仮想分散ファイルモジュール
410-nに対して、ファイル611のレプリカ612を
消去するための要求を例えばプライベート通信路5を介
したサーバ間通信により送る。
【0075】この要求を受けたファイルサーバ10-n上
の仮想分散ファイルモジュール410-nは、既に受け付
け済みの要求に対してのみレプリカ612を用いて処理
を行い、しかる後にレプリカ612と対応する負荷状況
情報を消去する。一方、ファイルサーバ10-1上の仮想
分散ファイルモジュール410-1は、クライアント2か
らのファイル611に対する新たな読み出し要求があれ
ば、それに対して応答する。
【0076】ところで、ファイルサーバ10-1からファ
イルサーバ10-nへのファイル611のレプリケーショ
ンにより、当該ファイル611に対する読み出し要求を
ファイルサーバ10-nで受け付けるようになった結果、
ファイルサーバ10-1におけるファイル611の負荷が
第2の閾値以下となる前に、ファイルサーバ10-nにお
ける当該ファイル611のレプリカ612の負荷が第1
の閾値を超えることがあり得る。
【0077】そこで、このような場合、今度はファイル
サーバ10-nがレプリカ612を用いて次の世代のレプ
リカを他の1つのサーバに生成し、即ちレプリケーショ
ンのレプリケーションを行い、そのサーバでファイル6
11に対する読み出し要求を処理させればよい。そのた
めには、ファイル別負荷状況情報保持部16-i(i=1
〜n)に保持されるファイル毎の負荷状況情報に、図7
(a)に示したような負荷状況とレプリケーションフラ
グに加えて、図7(b)に示すように、ファイルの世代
情報を持たせるとよい。
【0078】この場合、ある世代のレプリカの負荷が上
記第2の閾値以下に下がった時点で、当該レプリカを持
つサーバから、そのサーバによるレプリケーションの対
象となったサーバの持つ次世代のレプリカを消去する等
の制御を行うことができる。このとき、レプリカの消去
が要求されたサーバが、別のサーバに対して更に次世代
のレプリカを生成している場合、その更に次世代のレプ
リカを消去するとよい。この他に、少なくともレプリカ
に関連したファイルの負荷状況情報については、前記し
たサーバ情報と同様に、各サーバ間の一致化を図ること
により、同一ファイル(レプリカを含む)について、負
荷が最も低いファイルを持つサーバが、当該ファイルに
対する読み出し要求に応答するようにしてもよい。
【0079】最近では、ビデオ、オーディオ等のストリ
ーミングデータや、或いはWWW(World Wide Web)の
コンテンツ等、基本的には読み出しが主で、比較的サイ
ズが大きく、ある程度のレスポンス(場合によっては帯
域保証)が必要なデータが増加しつつある。しかもこう
したデータは、短期的に見て特定のデータ(ファイル)
にアクセスが集中するケースが想定されるため、レスポ
ンスを確保するのが困難な場合もある。以上に述べた図
6の構成は、こうした状況を想定したもので、特定のフ
ァイルにアクセスが集中した場合に、自動的に当該ファ
イルのレブリケーションを行うことで、当該ファイルヘ
のアクセスを分散させることができるようにしている。
この構成は、単に負荷分散だけでなく、例えば重要性の
高いファイルのバックアップに利用することも可能であ
る。
【0080】[第5の実施形態]図8は本発明の第5の
実施形態に係る仮想分散ファイルサーバシステムを適用
するコンピュータ・ネットワークシステムの構成を示す
ブロック図であり、図4と同一部分には同一符号を付し
てある。
【0081】図8において、8は図4中の仮想分散ファ
イルサーバシステム4に相当する仮想分散ファイルサー
バシステムである。この仮想分散ファイルサーバシステ
ム8の特徴は、ファイルサーバ10-1〜10-n、及びス
トレージ装置12-1〜12-nが、例えばFC−AL(Fi
bre Channnel Arbitrated Loop)80により相互接続さ
れ、(ホストとしての)各ファイルサーバ10-1〜10
-nから(ターゲットとしての)ストレージ装置12-1〜
12-nの共有が可能な(つまりマルチホスト可能な)ネ
ットワーク構成を適用している点にある。ここでは、図
4の構成と異なって、プライベート通信路5を持たない
点に注意されたい。
【0082】この図8の構成では、図4の構成において
(仮想分散ファイルモジュール410-1〜410-nの通
信モジュール413-1〜413-nにより)プライベート
通信路5を介して行われるサーバ間通信を、図1の構成
と同様にネットワーク3を介して行えばよい(図は、こ
の状態が示されている)。また、上記サーバ間通信を、
ファイルサーバ10-1〜10-nのストレージ接続用のイ
ンタフェースを介してFC−AL80上で行うようにし
てもよい。この場合、プライベート通信路5を用いたの
と同様に、ネットワーク3の負荷を軽減できる。
【0083】図8の構成によれば、ストレージ装置12
-1〜12-nが全てのファイルサーバ10-1〜10-nから
直接に見えるので、各サーバ10-1〜10-nに図6中の
ファイル別負荷状況情報保持部16-1〜16-nを持たせ
ることで、前記第4の実施形態で述べたようなレプリケ
ーション動作や負荷分散を容易に行うことができる。な
お、マルチホスト可能なネットワーク(インタフェー
ス)はFC−AL80に限るものではなく、SCSI
(Small Computer System Interface)バスであっても
構わない。
【0084】
【発明の効果】以上詳述したように本発明によれば、ネ
ットワーク上に分散した複数のファイルサーバを、クラ
イアントからは単一のサーバとして扱うことができ、サ
ーバ台数やストレージ装置の接続状態をクライアントに
意識させることがない。
【0085】また本発明によれば、サーバを増設した場
合、動的にボリュームを拡張することもできる。
【0086】更に本発明によれば、複数のサーバ間で自
律的な負荷分散が実現できる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係る仮想分散ファイ
ルサーバシステムを適用するコンピュータ・ネットワー
クシステムの構成を示すブロック図。
【図2】図1中のマッピングテーブルのデータ構造例を
示す図。
【図3】図1中のサーバ情報保持部のデータ構造例を示
す図。
【図4】本発明の第2の実施形態に係る仮想分散ファイ
ルサーバシステムを適用するコンピュータ・ネットワー
クシステムの構成を示すブロック図。
【図5】本発明の第3の実施形態に係る仮想分散ファイ
ルサーバシステムを適用するコンピュータ・ネットワー
クシステムの構成を示すブロック図。
【図6】本発明の第4の実施形態に係る仮想分散ファイ
ルサーバシステムを適用するコンピュータ・ネットワー
クシステムの構成を示すブロック図。
【図7】図6中のファイル別負荷状況情報保持部のデー
タ構造例を示す図。
【図8】同実施形態の動作を説明するタイミングチャー
ト。
【符号の説明】
1,4,6,8…仮想分散ファイルサーバシステム 2…クライアント 3…ネットワーク 5…プライベート通信路 10-1〜10-n…ファイルサーバ 11,41,61…仮想分散ファイルシステム 12-1〜12-n…ストレージ装置 13-1〜13-n…ローカルファイルシステム 14-1〜14-n…マッピングテーブル 15-1〜15-n…サーバ情報保持部 16-1〜6-n…ファイル別負荷状況情報保持部 80…FC−AL(マルチホスト可能なインタフェー
ス) 110-1〜110-n,410-1〜410-n…仮想分散フ
ァイルモジュール(管理モジュール) 111-1〜111-n…仮想分散ファイルインタフェース 112-1〜112-n…ローカルファイルインタフェース 113-1〜113-n…通信モジュール 611…ファイル 612…(ファイル611の)レプリカ
フロントページの続き Fターム(参考) 5B082 CA18 EA07 HA03 HA05 HA08 HA09 5B089 GA12 JA11 JB15 KA00 KC15 KC28 KE07

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 マルチキャスト可能なネットワーク上に
    分散した複数のファイルサーバを備えた仮想分散ファイ
    ルサーバシステムであって、 前記各ファイルサーバに分散して実装され、全ファイル
    サーバのファイルを統合的に管理する、実際のストレー
    ジ構成には非依存の仮想分散ファイルシステムと、 前記各ファイルサーバにそれぞれ独立して実装され、各
    サーバに固有のストレージ構成を管理するローカルファ
    イルシステムと、 前記各ファイルサーバにそれぞれ設けられ、前記仮想分
    散ファイルシステムで統合的に管理される各ファイルに
    ついて、当該仮想分散ファイルサーバシステムとそのフ
    ァイルを実際に管理する前記ローカルファイルシステム
    との間のマッピングの情報を保持するマッピングテーブ
    ルとを具備し、 前記仮想分散ファイルシステムは、前記各ファイルサー
    バにそれぞれ設けられた管理モジュールから構成され、
    前記各管理モジュールは、クライアントからマルチキャ
    ストされたファイル操作要求を共通に受け取り、当該要
    求に応じて自サーバの前記マッピングテーブルを参照す
    ることで、自サーバが当該要求を処理可能な最適なサー
    バであるか否かを判断し、最適なサーバであると判断し
    た場合だけ、要求されたファイル操作を対応するサーバ
    の前記ローカルファイルシステムにより行わせるように
    構成されていることを特徴とする仮想分散ファイルサー
    バシステム。
  2. 【請求項2】 マルチキャスト可能なネットワーク上に
    分散した複数のファイルサーバを備えた仮想分散ファイ
    ルサーバシステムであって、 前記各ファイルサーバに分散して実装され、全ファイル
    サーバのファイルを統合的に管理する、実際のストレー
    ジ構成には非依存の仮想分散ファイルシステムと、 前記各ファイルサーバにそれぞれ独立して実装され、各
    サーバに固有のストレージ構成を管理するローカルファ
    イルシステムと、 前記各ファイルサーバにそれぞれ設けられ、前記仮想分
    散ファイルシステムで統合的に管理される各ファイルに
    ついて、当該仮想分散ファイルサーバシステムとそのフ
    ァイルを実際に管理する前記ローカルファイルシステム
    との間のマッピングの情報を保持するマッピングテーブ
    ルと、 前記各ファイルサーバにそれぞれ設けられ、全ての前記
    ファイルサーバについて、そのサーバのストレージ装置
    の空き容量を示す情報、及びそのサーバの負荷状況を示
    す情報の少なくとも一方を含むサーバ情報を保持するサ
    ーバ情報保持手段とを具備し、 前記仮想分散ファイルシステムは、前記各ファイルサー
    バにそれぞれ設けられた管理モジュールから構成され、
    前記各管理モジュールは、クライアントからマルチキャ
    ストされたファイル操作要求を共通に受け取り、当該要
    求に応じて自サーバの前記マッピングテーブルまたは前
    記サーバ情報保持手段を参照することで、自サーバが当
    該要求を処理可能な最適なサーバであるか否かを判断
    し、最適なサーバであると判断した場合だけ、要求され
    たファイル操作を対応するサーバの前記ローカルファイ
    ルシステムにより行わせるように構成されていることを
    特徴とする仮想分散ファイルサーバシステム。
  3. 【請求項3】 前記管理モジュールは、前記ファイル操
    作要求がファイル読み出し要求またはファイル書き込み
    要求の場合には、自サーバの前記マッピングテーブルを
    参照し、該当するファイルが自サーバの前記ローカルフ
    ァイルシステムの管理下にあるか否かにより、自サーバ
    が前記要求を処理可能な最適なサーバであるか否かを判
    断することを特徴とする請求項1または請求項2記載の
    仮想分散ファイルサーバシステム。
  4. 【請求項4】 前記管理モジュールは、前記ファイル操
    作要求がファイルの新規作成要求の場合には、自サーバ
    の前記サーバ情報保持手段を参照し、全ての前記サーバ
    の各々について、そのサーバのストレージ装置の空き容
    量、またはそのサーバの負荷状況を比較することで、自
    サーバが前記要求を処理可能な最適なサーバであるか否
    かを判断することを特徴とする請求項2記載の仮想分散
    ファイルサーバシステム。
  5. 【請求項5】 前記管理モジュールは、全ての前記ファ
    イルサーバの前記マッピングテーブルの内容を一致化す
    るために、自サーバの前記マッピングテーブルの情報と
    他のサーバの前記マッピングテーブルの情報とをサーバ
    間通信により交換することを特徴とする請求項1記載の
    仮想分散ファイルサーバシステム。
  6. 【請求項6】 前記管理モジュールは、全ての前記ファ
    イルサーバの前記マッピングテーブルの内容を一致化す
    るために、自サーバの前記マッピングテーブルの情報と
    他のサーバの前記マッピングテーブルの情報とをサーバ
    間通信により交換する一方、全ての前記ファイルサーバ
    の前記サーバ情報保持手段の内容を一致化するために、
    自サーバの前記サーバ情報保持手段の情報と他のサーバ
    の前記サーバ情報保持手段の情報とをサーバ間通信によ
    り交換することを特徴とする請求項2記載の仮想分散フ
    ァイルサーバシステム。
  7. 【請求項7】 前記各ファイルサーバにそれぞれ設けら
    れ、そのサーバの管理下にある各ファイル別の負荷状況
    を示す情報を保持するファイル別負荷状況情報保持手段
    を更に具備し、 前記管理モジュールは、自サーバの前記ファイル別負荷
    状況情報保持手段に保持されている情報から第1の閾値
    を超えた負荷のファイルを検出して、他の任意のファイ
    ルサーバに対してサーバ間通信により当該ファイルのレ
    プリケーションを行い、クライアントからマルチキャス
    トされた当該ファイルの読み出し要求があった場合、当
    該要求に対する処理をレプリケーション側に任せるよう
    にしたことを特徴とする請求項1または請求項2記載の
    仮想分散ファイルサーバシステム。
JP11226494A 1999-08-10 1999-08-10 仮想分散ファイルサーバシステム Pending JP2001051890A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11226494A JP2001051890A (ja) 1999-08-10 1999-08-10 仮想分散ファイルサーバシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11226494A JP2001051890A (ja) 1999-08-10 1999-08-10 仮想分散ファイルサーバシステム

Publications (1)

Publication Number Publication Date
JP2001051890A true JP2001051890A (ja) 2001-02-23

Family

ID=16845996

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11226494A Pending JP2001051890A (ja) 1999-08-10 1999-08-10 仮想分散ファイルサーバシステム

Country Status (1)

Country Link
JP (1) JP2001051890A (ja)

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003075161A1 (fr) * 2002-03-07 2003-09-12 Fujitsu Limited Dispositif et procede de gestion de conversion de systeme de virtualisation de memoire
JP2006518887A (ja) * 2002-12-10 2006-08-17 インターナショナル・ビジネス・マシーンズ・コーポレーション トラフィック・パターン認識に基づくWebサイト・トラフィックのコロケーションおよびオフロードのための装置および方法
WO2006123420A1 (ja) * 2005-05-20 2006-11-23 Duaxes Corporation データ処理システム
US7188187B2 (en) 2002-04-23 2007-03-06 Hitachi, Ltd. File transfer method and system
CN1310152C (zh) * 2001-11-02 2007-04-11 日本电气株式会社 交换方法和交换设备
US7275064B2 (en) 2003-05-07 2007-09-25 Fujitsu Limited Apparatus for managing virtualized-information
JP2007299063A (ja) * 2006-04-27 2007-11-15 Canon Inc 情報処理装置、情報処理方法
JP2007305025A (ja) * 2006-05-15 2007-11-22 Nippon Telegr & Teleph Corp <Ntt> 生体の原理を用いたレプリカ制御法、およびそれを具備する装置、ならびにそのプログラム
JP2008518284A (ja) * 2004-07-29 2008-05-29 アーカイヴァス インコーポレイテッド 固定内容分散データ記憶のためのメタデータ管理
JP2008152807A (ja) * 2000-07-06 2008-07-03 Hitachi Ltd 計算機システム
US7412504B2 (en) 2002-08-01 2008-08-12 Hitachi, Ltd. Storage network system, managing apparatus managing method and program
JP2008186141A (ja) * 2007-01-29 2008-08-14 Hitachi Ltd データ管理方法、データ管理プログラム、データ管理システム、および、構成管理装置
US7415518B2 (en) 2001-11-21 2008-08-19 Fujitsu Limited File server program
JP2008234264A (ja) * 2007-03-20 2008-10-02 Nec Software Chubu Ltd ファイルサーバの負荷分散装置、負荷分散装置用プログラム、及び負荷分散方法
JP2009129164A (ja) * 2007-11-22 2009-06-11 Nec Corp 分散ストレージでのファイル配置およびアクセス方法、その装置及びそのプログラム
US7587471B2 (en) 2002-07-15 2009-09-08 Hitachi, Ltd. System and method for virtualizing network storages into a single file system view
WO2009136533A1 (ja) * 2008-05-08 2009-11-12 日本電気株式会社 分散データ格納システムの応答調停システム、分散データ格納システムの応答調停方法
US7644136B2 (en) 2001-11-28 2010-01-05 Interactive Content Engines, Llc. Virtual file system
US7680847B2 (en) 2002-08-30 2010-03-16 Hitachi, Ltd. Method for rebalancing free disk space among network storages virtualized into a single file system view
US7716304B2 (en) 2003-02-06 2010-05-11 Fujitsu Limited Access control system, gateway card, and access control method
WO2010073316A1 (ja) 2008-12-24 2010-07-01 富士通株式会社 構成管理システム、プロキシシステム、構成管理方法
JP2010176189A (ja) * 2009-01-27 2010-08-12 Fujitsu Ltd 割当制御プログラム、割当制御装置及び割当制御方法
US7788396B2 (en) 2001-11-28 2010-08-31 Interactive Content Engines, Llc Synchronized data transfer system
US8108354B2 (en) 2003-07-10 2012-01-31 Fujitsu Limited Archive device, method of managing archive device, and computer product
US8161133B2 (en) 2004-12-10 2012-04-17 Hitachi, Ltd. Network storage system with a clustered configuration sharing a namespace, and control method therefor
WO2012127988A1 (ja) * 2011-03-18 2012-09-27 日本電気株式会社 情報処理装置、分散ファイルシステム、クライアント装置、情報処理方法、および、コンピュータ・プログラム
WO2014122733A1 (ja) * 2013-02-06 2014-08-14 株式会社日立製作所 計算機、データアクセス管理方法及び記録媒体
CN104050199A (zh) * 2013-03-15 2014-09-17 联想(北京)有限公司 数据传输方法和电子设备
KR20170030422A (ko) * 2015-09-09 2017-03-17 주식회사 아이티엑스엠투엠 가상 카메라를 이용한 개인화된 쇼핑몰 시스템
US9967446B2 (en) 2015-09-09 2018-05-08 Itx-M2M Co., Ltd. Personalized shopping mall system using virtual camera
US10321167B1 (en) 2016-01-21 2019-06-11 GrayMeta, Inc. Method and system for determining media file identifiers and likelihood of media file relationships
JP2020021235A (ja) * 2018-07-31 2020-02-06 富士通株式会社 ストレージ管理装置、ストレージシステムおよびプログラム
US10719492B1 (en) 2016-12-07 2020-07-21 GrayMeta, Inc. Automatic reconciliation and consolidation of disparate repositories
JP2022100514A (ja) * 2020-12-24 2022-07-06 株式会社日立製作所 ストレージシステムおよびデータ管理方法

Cited By (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008152807A (ja) * 2000-07-06 2008-07-03 Hitachi Ltd 計算機システム
US7725588B2 (en) 2001-11-02 2010-05-25 Nec Corporation Switching method and switch device
CN1310152C (zh) * 2001-11-02 2007-04-11 日本电气株式会社 交换方法和交换设备
US7415518B2 (en) 2001-11-21 2008-08-19 Fujitsu Limited File server program
US7644136B2 (en) 2001-11-28 2010-01-05 Interactive Content Engines, Llc. Virtual file system
US7788396B2 (en) 2001-11-28 2010-08-31 Interactive Content Engines, Llc Synchronized data transfer system
WO2003075161A1 (fr) * 2002-03-07 2003-09-12 Fujitsu Limited Dispositif et procede de gestion de conversion de systeme de virtualisation de memoire
US7188187B2 (en) 2002-04-23 2007-03-06 Hitachi, Ltd. File transfer method and system
US7587471B2 (en) 2002-07-15 2009-09-08 Hitachi, Ltd. System and method for virtualizing network storages into a single file system view
US8171126B2 (en) 2002-08-01 2012-05-01 Hitachi, Ltd. Storage network system, managing apparatus, managing method and program
US7412504B2 (en) 2002-08-01 2008-08-12 Hitachi, Ltd. Storage network system, managing apparatus managing method and program
US7987256B2 (en) 2002-08-01 2011-07-26 Hitachi, Ltd. Storage network system, managing apparatus, managing method and program
US8082338B2 (en) 2002-08-01 2011-12-20 Hitachi, Ltd. Storage network system, managing apparatus, managing method and program
US8230057B1 (en) 2002-08-01 2012-07-24 Hitachi, Ltd. Storage network system, managing apparatus, managing method and program
US7610369B2 (en) 2002-08-01 2009-10-27 Hitachi, Ltd. Storage network system, managing apparatus managing method and program
US7680847B2 (en) 2002-08-30 2010-03-16 Hitachi, Ltd. Method for rebalancing free disk space among network storages virtualized into a single file system view
JP2006518887A (ja) * 2002-12-10 2006-08-17 インターナショナル・ビジネス・マシーンズ・コーポレーション トラフィック・パターン認識に基づくWebサイト・トラフィックのコロケーションおよびオフロードのための装置および方法
US7716304B2 (en) 2003-02-06 2010-05-11 Fujitsu Limited Access control system, gateway card, and access control method
US7275064B2 (en) 2003-05-07 2007-09-25 Fujitsu Limited Apparatus for managing virtualized-information
US8108354B2 (en) 2003-07-10 2012-01-31 Fujitsu Limited Archive device, method of managing archive device, and computer product
JP2008518284A (ja) * 2004-07-29 2008-05-29 アーカイヴァス インコーポレイテッド 固定内容分散データ記憶のためのメタデータ管理
US8161133B2 (en) 2004-12-10 2012-04-17 Hitachi, Ltd. Network storage system with a clustered configuration sharing a namespace, and control method therefor
US7865474B2 (en) 2005-05-20 2011-01-04 Duaxes Corporation Data processing system
CN101213528B (zh) * 2005-05-20 2010-04-07 Duaxes株式会社 数据处理系统
WO2006123420A1 (ja) * 2005-05-20 2006-11-23 Duaxes Corporation データ処理システム
WO2006123443A1 (ja) * 2005-05-20 2006-11-23 Duaxes Corporation データ処理システム
JP2007299063A (ja) * 2006-04-27 2007-11-15 Canon Inc 情報処理装置、情報処理方法
US8417742B2 (en) 2006-04-27 2013-04-09 Canon Kabushiki Kaisha Information processing apparatus and information processing method
JP4590651B2 (ja) * 2006-05-15 2010-12-01 日本電信電話株式会社 レプリケーション制御方法とシステムおよびプログラム
JP2007305025A (ja) * 2006-05-15 2007-11-22 Nippon Telegr & Teleph Corp <Ntt> 生体の原理を用いたレプリカ制御法、およびそれを具備する装置、ならびにそのプログラム
JP2008186141A (ja) * 2007-01-29 2008-08-14 Hitachi Ltd データ管理方法、データ管理プログラム、データ管理システム、および、構成管理装置
JP2008234264A (ja) * 2007-03-20 2008-10-02 Nec Software Chubu Ltd ファイルサーバの負荷分散装置、負荷分散装置用プログラム、及び負荷分散方法
JP2009129164A (ja) * 2007-11-22 2009-06-11 Nec Corp 分散ストレージでのファイル配置およびアクセス方法、その装置及びそのプログラム
WO2009136533A1 (ja) * 2008-05-08 2009-11-12 日本電気株式会社 分散データ格納システムの応答調停システム、分散データ格納システムの応答調停方法
US8843511B2 (en) 2008-12-24 2014-09-23 Fujitsu Limited Configuration management system, proxy system, and configuration management method
WO2010073316A1 (ja) 2008-12-24 2010-07-01 富士通株式会社 構成管理システム、プロキシシステム、構成管理方法
JP2010176189A (ja) * 2009-01-27 2010-08-12 Fujitsu Ltd 割当制御プログラム、割当制御装置及び割当制御方法
JP5850044B2 (ja) * 2011-03-18 2016-02-03 日本電気株式会社 情報処理装置、分散ファイルシステム、クライアント装置、情報処理方法、および、コンピュータ・プログラム
US9251156B2 (en) 2011-03-18 2016-02-02 Nec Corporation Information processing devices, method, and recording medium with regard to a distributed file system
WO2012127988A1 (ja) * 2011-03-18 2012-09-27 日本電気株式会社 情報処理装置、分散ファイルシステム、クライアント装置、情報処理方法、および、コンピュータ・プログラム
JPWO2014122733A1 (ja) * 2013-02-06 2017-01-26 株式会社日立製作所 計算機、データアクセス管理方法及び記録媒体
WO2014122733A1 (ja) * 2013-02-06 2014-08-14 株式会社日立製作所 計算機、データアクセス管理方法及び記録媒体
CN104050199B (zh) * 2013-03-15 2017-12-29 联想(北京)有限公司 数据传输方法和电子设备
CN104050199A (zh) * 2013-03-15 2014-09-17 联想(北京)有限公司 数据传输方法和电子设备
KR20170030422A (ko) * 2015-09-09 2017-03-17 주식회사 아이티엑스엠투엠 가상 카메라를 이용한 개인화된 쇼핑몰 시스템
US9967446B2 (en) 2015-09-09 2018-05-08 Itx-M2M Co., Ltd. Personalized shopping mall system using virtual camera
KR102191067B1 (ko) * 2015-09-09 2020-12-14 주식회사 아이티엑스에이아이 가상 카메라를 이용한 개인화된 쇼핑몰 시스템
US10321167B1 (en) 2016-01-21 2019-06-11 GrayMeta, Inc. Method and system for determining media file identifiers and likelihood of media file relationships
US10719492B1 (en) 2016-12-07 2020-07-21 GrayMeta, Inc. Automatic reconciliation and consolidation of disparate repositories
JP2020021235A (ja) * 2018-07-31 2020-02-06 富士通株式会社 ストレージ管理装置、ストレージシステムおよびプログラム
JP7111964B2 (ja) 2018-07-31 2022-08-03 富士通株式会社 ストレージ管理装置、ストレージシステムおよびプログラム
JP2022100514A (ja) * 2020-12-24 2022-07-06 株式会社日立製作所 ストレージシステムおよびデータ管理方法
JP7391826B2 (ja) 2020-12-24 2023-12-05 株式会社日立製作所 ストレージシステムおよびデータ管理方法

Similar Documents

Publication Publication Date Title
JP2001051890A (ja) 仮想分散ファイルサーバシステム
EP1330907B1 (en) Method and apparatus for real-time parallel delivery of segments of a large payload file
CN101535965B (zh) 用于提高存储管理系统的可伸缩性和可移植性的技术
US20210200641A1 (en) Parallel change file tracking in a distributed file server virtual machine (fsvm) architecture
US6782389B1 (en) Distributing files across multiple, permissibly heterogeneous, storage devices
JP5902716B2 (ja) 大規模記憶システム
CN112463366B (zh) 面向云原生的微服务自动扩缩容和自动熔断方法及系统
JP7270755B2 (ja) 分散システムでのメタデータルーティング
US11544226B2 (en) Metadata control in a load-balanced distributed storage system
US20060242283A1 (en) System and method for managing local storage resources to reduce I/O demand in a storage area network
CN105354076A (zh) 一种应用部署方法及装置
Fagg et al. Scalable networked information processing environment (SNIPE)
WO2017192174A1 (en) Splitting and moving ranges in a distributed system
JP2005502096A (ja) ファイルスイッチ及び交換ファイルシステム
US20100138540A1 (en) Method of managing organization of a computer system, computer system, and program for managing organization
JP2006510976A5 (ja)
JP2023532947A (ja) データ転送方法、プロキシサーバ、記憶媒体及び電子デバイス
US20020194182A1 (en) Computer system
US20230221897A1 (en) Implementing coherency and page cache support for a storage system spread across multiple data centers
US20130054930A1 (en) Method, system and program product for storing downloadable content on a plurality of enterprise storage system (ess) cells
CN111225003B (zh) 一种nfs节点配置方法和装置
US11755541B2 (en) Distributed file system and method for accessing a file in such a system
JP6823716B2 (ja) マルチサイト複製をサポートする一貫性ハッシュ構成
US10498804B1 (en) Load balancing Hadoop distributed file system operations in a non-native operating system
US10887429B1 (en) Processing multi-protocol redirection links

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040915

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071030

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080304