JP2912221B2 - 分散ネットワーク化ストライプド・ファイルシステム - Google Patents

分散ネットワーク化ストライプド・ファイルシステム

Info

Publication number
JP2912221B2
JP2912221B2 JP8071680A JP7168096A JP2912221B2 JP 2912221 B2 JP2912221 B2 JP 2912221B2 JP 8071680 A JP8071680 A JP 8071680A JP 7168096 A JP7168096 A JP 7168096A JP 2912221 B2 JP2912221 B2 JP 2912221B2
Authority
JP
Japan
Prior art keywords
file system
data
host computer
file
secondary storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP8071680A
Other languages
English (en)
Other versions
JPH09259089A (ja
Inventor
光義 小▲崎▼
清彦 ▲吉▼田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NIPPON DENKI TSUSHIN SHISUTEMU KK
NEC Corp
Original Assignee
NIPPON DENKI TSUSHIN SHISUTEMU KK
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NIPPON DENKI TSUSHIN SHISUTEMU KK, Nippon Electric Co Ltd filed Critical NIPPON DENKI TSUSHIN SHISUTEMU KK
Priority to JP8071680A priority Critical patent/JP2912221B2/ja
Publication of JPH09259089A publication Critical patent/JPH09259089A/ja
Application granted granted Critical
Publication of JP2912221B2 publication Critical patent/JP2912221B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Multi Processors (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は分散ネットワーク化
ストライプド・ファイルシステムに関し、特にホストコ
ンピュータに接続された複数の二次記憶装置上にそれぞ
れ構築された複数のファイルシステムを仮想的な1つの
ファイルシステムとし、この仮想的なファイルシステム
に対するデータの書き込み及び読み出し処理をソフトウ
ェアにより前記二次記憶装置単位に分割し並列分散化し
て行うストライプド・ファイルシステムに関する。
【0002】
【従来の技術】従来から、プロセス当たりのディスクに
対するデータの入出力を行う際の性能を向上させる為の
手段として、図17に示すように、1台のホストコンピ
ュータ80に接続された複数の磁気ディスク装置のよう
な二次記憶装置81,82,83,84上に構築したフ
ァイルシステムから、仮想的な1つのファイルシステム
85を構築し、この仮想的なファイルシステムを構成す
る各々の二次記憶装置の入出力制御装置に対してプロセ
スが並列にデータの入出力要求を行う、いわゆるストラ
イプド・ファイルシステムの手法が採用されている。従
来のストライプド・ファイルシステムの手法では、図1
8に示すように、1台のホストコンピュータ86の異な
る入出力制御装置87,88に接続された複数の磁気デ
ィスク装置のような二次記憶装置89,90上に構築さ
れたファイルシステムを基本単位としてストライプド・
ファイルシステム91を構築し、各二次記憶装置上に構
築されたファイルシステムに対する入出力処理を複数の
入出力制御装置87,88に分散させ並列に行うことに
より、プロセス当たりの二次記憶装置に対する入出力性
能の向上を実現していた。
【0003】
【発明が解決しようとする課題】この従来のストライプ
ド・ファイルシステムの手法では、単一プロセス当たり
の二次記憶装置に対するデータの入出力時の性能向上を
図ることは出来たが、システム全体で見た場合、統合的
なデータの入出力時の性能向上には至らなかった。すな
わち、従来技術では、1台のホストコンピュータ80に
接続された複数台の二次記憶装置81〜84上に構築さ
れたファイルシステムを構築単位としていた。従って、
ストライプド・ファイルシステム85を構成する複数台
の二次記憶装置81〜84上のファイルシステムに対す
るデータの入出力処理を全て1台のホストコンピュータ
80で処理しなければならなかったため、ストライプド
・ファイルシステムを構成する個々の二次記憶装置に対
するデータの入出力処理を並列に行っても、一つのプロ
セスがデータの入出力に要する時間は並列化により短縮
することは可能であるが、ホストコンピュータが処理し
なければならない入出力データの量は変わらないため、
二次記憶装置に対するデータの入出力時にホストコンピ
ュータにかかる負荷を減少させることはできず、ホスト
コンピュータ全体の性能を向上させることはできなかっ
た。
【0004】また、従来のストライプド・ファイルシス
テムの手法では、プロセス当たりの二次記憶装置に対す
るデータの入出力時の性能向上を図る為には、異なる入
出力制御装置に接続された二次記憶装置上に構築された
ファイルシステムを基本単位としてストライプド・ファ
イルシステムを構築しなければならないというハードウ
ェア上の制約があった。すなわち、図19に示すよう
に、複数台の二次記憶装置に対するデータの入出力を1
台の入出力制御装置93で行った場合は、ストライプド
・ファイルシステム96に対する入出力処理を並列化し
ても、実際の二次記憶装置94,95へのデータの入出
力処理は1台の入出力制御装置93によってシーケンシ
ャルに行われる為、単一プロセス当たりの二次記憶装置
に対する入出力時の性能向上を図ることができなかっ
た。従って、ホストコンピュータに搭載されている入出
力制御装置の数によっては、ストライプド・ファイルシ
ステムを構築してもプロセス当たりの二次記憶装置に対
する入出力時の性能が向上されないという問題点があっ
た。
【0005】さらに、従来のストライプド・ファイルシ
ステムの手法では、構築できるストライプド・ファイル
システムの大きさは、1台のホストコンピュータに接続
可能な二次記憶装置の数により制限されていた。その理
由は、1台のホストコンピュータに2台以上の磁気ディ
スク装置のような二次記憶装置を接続し、各々の二次記
憶装置上に構築したファイルシステムを、ソフトウェア
からの制御により仮想的に1つのファイルシステムに見
せかけて、その仮想的なファイルシステムに対してデー
タの入出力を行っていたためである。
【0006】したがって本発明の目的は、ホストコンピ
ュータを二次記憶装置ごとに設け、これらホストコンピ
ュータ間を相互接続してコンピュータネットワーク(分
散ネットワーク)を構築し、各二次記憶装置にまたがっ
た仮想的なファイルシステム(ストライプド・ファイル
システム)に対してネットワークを介していることを意
識しないで分散・並列化させてデータの入出力を行うこ
とにより、スループットの低下を招くこと無くストライ
プド・ファイルシステムに対するデータの入出力を実現
すると共に、プロセス当たりの二次記憶装置に対する性
能の向上だけでなく、システム全体を通じての二次記憶
装置に対する性能を向上させ、従来よりも大きな容量を
持つファイルシステムを実現することができるような分
散ネットワーク化ストライプド・ファイルシステムを提
供することにある。
【0007】
【課題を解決するための手段】本発明の分散ネットワー
ク化ストライプド・ファイルシステムは、ホストコンピ
ュ−タに接続された複数の二次記憶装置上にそれぞれ構
築された複数のファイルシステムを仮想的な1つのファ
イルシステムとし、この仮想的なファイルシステムに対
するデ−タの書き込み及び読み出し処理をソフウトウェ
アにより前記二次記憶装置単位に分割し並列分散化して
行うストライプド・ファイルシステムにおいて、ネット
ワークを介して互いに接続されるとともに前記複数の二
次記憶装置の各々を互いに重複することなく収容し、1
つのデータファイルから分割された各部分データをそれ
ぞれ独立したファイルシステムとして任意の二次記憶装
置に分散配置することにより広域ファイルシステムを構
築可能とした複数の前記ホストコンピュ−タを備え、こ
れらホストコンピュ−タのうち管理用ホストコンピュ−
タとしてあらかじめ指定された特定のホストコンピュー
タに、前記広域ファイルシステムの分割配置先の二次記
憶装置を収容するホストコンピュータとそのホストコン
ピュータ内でのファイルシステムとを示すファイルシス
テム識別情報を管理するためのファイルシステム管理テ
ーブルと、前記ホストコンピュ−タごとのネットワ−ク
上のアドレス情報を管理するためのアドレス管理テ−ブ
ルと、前記データファイルごとの前記ファイルシステム
識別情報によるデータ分割を管理するためのデータ管理
テーブルとを有し、前記ネットワークに接続された任意
のホストコンピュ−タが、前記広域ファイルシステムに
対するデータファイルの書き込みあるいは読み出しを行
う際、前記管理用ホストコンピュ−タの前記ファイルシ
ステム管理テーブル,前記アドレス管理テ−ブル,及び
前記データ管理テーブルを参照し、分割されたデータの
各々に対応するホストコンピュータとそのファイルシス
テムとを認識し、該当するホストコンピュータに対応す
るデータの書き込みあるいは読み出し要求を行い該当す
る二次記憶装置に対する書き込みあるいは読み出しを行
わせる構成を有する。
【0008】また、上記構成において、前記ホストコン
ピュ−タの障害により前記二次記憶装置に対する分割さ
れたデ−タの書き込みが失敗すると、前記管理用ホスト
コンピュ−タの前記ファイルシステム管理テーブル,前
記アドレス管理テ−ブル,及び前記データ管理テーブル
を参照して自動的に代替のホストコンピュ−タを選別
し、この代替のホストコンピュ−タに対応する前記二次
記憶装置に対して該当デ−タの書き込みを行う構成とす
ることができる。
【0009】
【0010】次に本発明の作用を説明する。複数台のホ
ストコンピュータを相互に接続して構築したコンピュー
タネットワークの環境(分散ネットワーキング環境)に
おいて、ホストコンピュータに接続されている磁気ディ
スク装置のような二次記憶装置に、ネットワークを介し
ていることを意識しないでデータの入出力を行うことが
できるようなファイルシステム(広域ファイルシステ
ム)を構築し、異なるホストコンピュータに接続された
二次記憶装置上に構築された広域ファイルシステムを構
成単位とするストライプド・ファイルシステムを構築す
る機能を提供することにより、ストライプド・ファイル
システムに対するデータの入出力時にホストコンピュー
タにかかる負荷を複数のホストコンピュータに搭載され
た入出力制御装置に分散させることで、スループットの
低下を招くこと無くストライプド・ファイルシステムに
対するデータの入出力を実現すると共に、ストライプド
・ファイルシステムに対するデータの入出力処理そのも
のを、ネットワーク内の他のホストコンピュータに分散
・並列化させて実行させることにより、プロセス当たり
の二次記憶装置に対する性能の向上だけでなく、システ
ム全体を通じての二次記憶装置に対する性能を向上さ
せ、更に、ネットワーク内の複数のホストコンピュータ
に接続された二次記憶装置にまたがった仮想的なファイ
ルシステムを構築することにより、従来よりも大きな容
量を持つファイルシステムを実現することができる。
【0011】また、プロセスがストライプド・ファイル
システムに対してデータの入出力を行うと、各ホストコ
ンピュータ上で動作しているソフトウェアが、広域ファ
イルシステムを管理するためのホストコンピュータに接
続されている二次記憶装置上の広域ファイルシステムを
管理する為の管理テーブル,広域ファイルシステムから
構成されるストライプド・ファイルシステムを管理する
為の管理テーブル,相互接続されたホストコンピュータ
を一意に識別する為のネットワークアドレス管理テーブ
ル,及びデータファイルを管理する為のデータ管理テー
ブルを参照し、プロセスによってデータの入出力が行わ
れたストライプド・ファイルシステムを構成しているコ
ンピュータネットワーク内のホストコンピュータに接続
された二次記憶装置上に構築されたファイルシステムを
識別し、データの分割及び分割されたデータの再構築、
ならびにデータの入出力制御の分散・並列化を自動的に
行う。このため、プロセスはストライプド・ファイルシ
ステムに対してデータの入出力を行うだけで、データの
断片化及び入出力処理の並列化、ならびにコンピュータ
ネットワークで相互に接続された遠隔のホストコンピュ
ータとの間でのデータの送受信を意識することなく、遠
隔のホストコンピュータに接続された二次記憶装置に対
するデータの入出力を実現することができる。
【0012】
【発明の実施の形態】本発明の実施の形態について図面
を参照して説明する。
【0013】図1は本発明の第1の実施形態例を示す概
略システム構成図である。図1において、本発明を適用
するファイルシステムは広域ファイルシステムを成し、
広域ファイルシステムを管理するためのホストコンピュ
ータ11と、その管理下の複数のホストコンピュータ1
2,13,14,…,1m、これら各ホストコンピュー
タ11〜1mにそれぞれ接続されている二次記憶装置2
1,22,23,24,…,2mと、各ホストコンピュ
ータ11〜1m間を相互接続しているネットワーク10
とから構成される。各ホストコンピュータ12〜1mに
接続されている二次記憶装置22〜2m上に構築された
ファイルシステムから仮想的なストライプド・ファイル
システム20が構築されている。ネットワーク10には
広域ファイルシステムを利用するホストコンピュータ
(図示せず)が接続される。広域ファイルシステムを管
理するためのホストコンピュータ11に接続されている
二次記憶装置21には、図2に示すように、広域ファイ
ルシステムを管理するための管理テーブル26と、スト
ライプド・ファイルシステムを管理するための管理テー
ブル27と、ホストコンピュータのホスト名とネットワ
ーク内でホストコンピュータを一意に識別するためのア
ドレス情報を管理するためのアドレス管理テーブル28
と、データを複数の二次記憶装置に分割して書き込む
際、及び複数の二次記憶装置に分割されて書き込まれて
いるデータを復元する際に使用するデータ管理テーブル
29とが設けられている。
【0014】広域ファイルシステムを管理するための管
理テーブル26は、図3に示すように、ネットワークを
構成するホストコンピュータに対して付けられたホスト
名(例えば、Host−1,…)を登録する領域261
と、そのホスト名のホストコンピュータに接続された二
次記憶装置上に構築されたファイルシステムのファイル
システム名(例えば、FS−1,…)を登録する領域2
62と、ホスト名及びファイルシステム名の組に対して
一意に与えられるファイルシステム識別子(例えば、F
S−ID−1,…)を登録する領域263と、そのファ
イルシステム名のファイルシステムの状態を表す状態フ
ラグを登録する領域264とから構成される。状態フラ
グは、BUSY状態(ファイルシステムに対する入出力
が行われている状態)及びIDLE状態(ファイルシス
テムに対する入出力が行われていない状態)の2つの状
態を有する。
【0015】ストライプド・ファイルシステム管理テー
ブル27は、図4に示すように、各ホストコンピュータ
が広域ファイルシステム上のファイルにアクセスする際
に参照する広域ファイルシステム名(例えば、WA−F
S−1n,…)を登録する領域271と、その広域ファ
イルシステム名に対応するファイルシステムを構成する
複数のファイルシステムのファイルシステム識別子(例
えば、FS−ID−11,…)を登録する領域272と
から構成される。
【0016】アドレス管理テーブル28は、図5に示す
ように、ホストコンピュータに対して付けられたホスト
名(例えば、Host−1,…)を登録する領域281
と、ネットワーク内でホストコンピュータを一意に識別
するためのネットワークアドレス情報(例えば、aa
a.aaa.aaa.aaa,…)を登録する領域28
2とから構成される。
【0017】データ管理テーブル29は、図6に示すよ
うに、ストライプド・ファイルシステムにデータを書き
込む際またはストライプド・ファイルシステムからデー
タを読み出す際にデータを指定する為のデータファイル
名(例えば、FILENAME1,…)を登録する領域
291と、そのデータファイル名のデータファイルを複
数(n)個の断片に分割した際に各データファイルの断
片に割り当てるシーケンス番号(例えば、1,…,n)
を登録する領域292、及び分割された各データファイ
ルの断片が格納されているファイルシステムのファイル
システム識別子(例えば、FS−ID−11,…,FS
−ID−1n)を登録する領域293とから構成され
る。
【0018】図7及び図10は、ネットワークを構成す
るホストコンピュータが、広域ファイルシステムを介し
てデータの入出力を行う際に参照する各種管理テーブル
の関係を示した図である。図8は、データの書き込み要
求,データの読み出し要求,またはデータの削除要求の
時に、ホストコンピュータの間でやり取りされるデータ
書き込み要求メッセージ,データ読み出し要求メッセー
ジ,及びデータ削除要求メッセージに含まれるデータの
概略を示した図である。データ書き込み要求メッセー
ジ,データ読み出し要求メッセージ,及びデータ削除要
求メッセージは、書き込み,読み出し,または削除を行
うデータのデータファイル名52と、データファイルを
書き込む,読み出す,または削除すべきデータファイル
が格納されているファイルシステム名53と、データフ
ァイルをn個に分割した際に各データファイルの断片に
割り当てられるシーケンス番号54とを含んで構成され
る。図9は、データ書き込み要求メッセージまたはデー
タ読み出し要求メッセージに応答して、ホストコンピュ
ータの間でやり取りされるデータ書き込み結果通知メッ
セージ及びデータの読み出し結果通知メッセージに含ま
れるデータの概略を示した図である。この結果通知メッ
セージは、書き込みまたは読み出し要求が行われたデー
タのデータファイル名52と、データファイルの書き込
み要求またはデータファイルの読み出し要求が行われた
ファイルシステム名53と、データファイルをn個に分
割した際に各データファイルの断片に割り当てられたシ
ーケンス番号54と、データファイルの書き込み要求ま
たはデータファイルの読み出し要求の結果を示す結果フ
ラグ58と、データ読み出し要求メッセージ受信時に読
み出したデータを送り返す為のデータ部59とを含んで
構成される。結果フラグ58は、成功フラグ(データの
書き込みまたはデータの読み出しが成功したことを示す
フラグ)及び失敗フラグ(データの書き込みまたはデー
タの読み出しが失敗したことを示すフラグ)の2つのフ
ラグのうちいずれかを取る。
【0019】図11は、図1のシステムの変形例を示す
概略システム構成図である。図11において、コンピュ
ータネットワーク99で相互に接続された2台のホスト
コンピュータ97,98の各々の2つの入出力制御装置
100,101,102,103に接続された二次記憶
装置104,105,106,107上に構築されたフ
ァイルシステムからストライプド・ファイルシステム1
08が構成されている。ストライプド・ファイルシステ
ム108に対するデータ処理は、複数台のホストコンピ
ュータ97,98の各々に接続された異る入出力制御装
置100〜103を介して接続された二次記憶装置10
4〜107に対し、分散・並列化させて行われる。
【0020】図12は、本発明の第2の実施形態例を示
す概略システム構成図である。図13は、図12のシス
テムの変形例を示す概略システム構成図である。
【0021】図14,15,16は本発明における処理
の流れを示したフローチャートである。図14は、ネッ
トワークを構成するホストコンピュータが、広域ファイ
ルシステムを介してデータの書き込みを行う際の処理の
流れを示す。図15は、ネットワークを構成するホスト
コンピュータ上で動作するプログラムが、遠隔のホスト
コンピュータからのデータ書き込み要求メッセージ,ま
たはデータ読み出し要求メッセージを受け取った時の処
理の流れを示す。図16はネットワークを構成するホス
トコンピュータが、広域ファイルシステムを介してデー
タの読み出しを行う際の処理の流れを示す。
【0022】次に,上記図面を参照して本発明の動作に
ついて詳細に説明する。最初に図1に示す第1の実施形
態例について説明するが、その前に本発明の特徴を分か
り易くするために、従来から用いられている技術を説明
する。
【0023】従来の広域ファイルシステムにおいては、
広域ファイルシステムを管理するための情報としてホス
ト名,ファイルシステム名,広域ファイルシステム名,
及びネットワーク内でホストコンピュータを一意に識別
するためのネットワークアドレス情報しか持っていなか
った。ストライプド・ファイルシステムを構成している
広域ファイルシステムに対する書き込みや読み出し、及
びストライプド・ファイルシステムの構成制御は、上記
の管理情報をネットワーク内の全てのホストコンピュー
タ(11〜15)で共有し、この管理情報を基にして各
ホストコンピュータ上のプログラムによってそれぞれ行
なわれる。この管理情報の更新は、ホストコンピュータ
(11)においてコマンドによりオペレータから構成変
更を指示された場合に行なわれる。一般に、広域ファイ
ルシステムでは、広域ファイルシステム名をネットワー
クを構成する全てのホストコンピュータで共有して、広
域ファイルシステム名からネットワーク内のホストコン
ピュータの名前とそのホストコンピュータに接続されて
いる二次記憶装置上に構築されているファイルシステム
名を参照して、そのホストコンピュータに接続されてい
る二次記憶装置上に構築されているファイルシステムの
ファイルに対して入出力を行う。
【0024】本発明において、広域ファイルシステムを
介して異なるホストコンピュータに接続された複数台の
二次記憶装置に対して並列にデータの書き込みを行う場
合は、図7に示すように、あるホストコンピュータ19
からネットワーク10を通して、ホストコンピュータ1
2〜1mのうちのn台のホストコンピュータ1x〜1z
に接続された二次記憶装置2x〜2z上に構築されたフ
ァイルシステムから構成された広域ファイルシステム3
0(例えば、広域ファイルシステム名31=WA−FS
−1n)に対してデータ(データファイル45)の書き
込み要求を出す(図14のステップS101)ことによ
って達成される。
【0025】ホストコンピュータ19上で動作するプロ
グラムは、広域ファイルシステム30に対するデータの
書き込み要求を検出すると,その広域ファイルシステム
名31(WA−FS−1n)をキーにして、広域ファイ
ルシステム管理用のホストコンピュータ11上に作成さ
れていてネットワーク内の全てのホストコンピュータで
共有されているストライプド・ファイルシステム管理テ
ーブル27を検索し、その広域ファイルシステム名31
(WA−FS−1n)の広域ファイルシステム30がn
個のファイルシステムから構成されていることを知り、
書き込もうとしているデータファイル45(例えば、デ
ータファイル名46=FILENAME1)を均等な大
きさにn等分して、それぞれ順番に、1からnまでのシ
ーケンス番号47と個別のファイルシステム識別子48
(例えば、FS−ID−1,…,FS−ID−n)とを
割り当てて、これらデータファイル名46,シーケンス
番号47,ファイルシステム識別子48をデータ管理テ
ーブル29に格納する。ホストコンピュータ19上で動
作するプログラムは、次に、ストライプド・ファイルシ
ステム管理テーブル27を参照して、指定された広域フ
ァイルシステム30(WA−FS−1n)に割り付けら
れているn個のファイルシステム識別子32,…,33
(例えば、FS−ID−1,…,FS−ID−n)の情
報を得る。ファイルシステム識別子32〜33の情報を
取り出したら、次に広域ファイルシステム管理テーブル
26を参照して、ファイルシステム識別子32,…,3
3に対応するホスト名35,…,36(例えば、Hos
t−1,…,Host−n)及びファイルシステム名3
7,…,38(例えば、FS−1,…,FS−n)を参
照する。ホスト名35,…,36の情報を得たら、アド
レス管理テーブル28を参照してn台のホストコンピュ
ータ1x,…,1zのネットワークアドレス42,…,
43(例えば、xxx.xxx.xxx.xxx,…,
zzz.zzz.zzz.zzz)を得る。このように
して取り出したネットワークアドレス42〜43の各ホ
ストコンピュータ1x〜1z上で動作しているプログラ
ムの各々に対して,n等分したデータファイル45の各
断片のデータ書き込み要求メッセージRw(図8)を送
り(図14のステップS101)、広域ファイルシステ
ム管理テーブル26において、データ書き込み要求メッ
セージRwを送ったホスト名35〜36及びファイルシ
ステム名37〜38の状態フラグ39〜40にBUSY
フラグを設定する。
【0026】ホストコンピュータ1x〜1z上で動作し
ている各プログラムは、それぞれ自分に接続されている
二次記憶装置2x〜2z上に構築されているファイルシ
ステム30x〜30z(ファイルシステム名37=(F
S−1)〜ファイルシステム名38=(FS−n))へ
のデータファイル45の断片の書き込み要求メッセージ
Rwを受け取ったら(図15のステップS201)、そ
れぞれ自分に接続されている二次記憶装置2x〜2zに
対するデータの書き込み処理を行う(図15のステップ
S202)。このとき、各プログラムは、それぞれホス
トコンピュータ19から受け取ったデータ書き込み要求
メッセージRwのデータファイル名52(FILENA
ME1)にシーケンス番号54(1〜n)を繋げた名前
をデータファイル名として選択し、ファイルシステム名
53(FS−1〜FS−n)で指定されたファイルシス
テム(30x〜30z)にデータの書き込みを行う。ホ
ストコンピュータ1x〜1z上で動作している各プログ
ラムは、データ書き込み要求メッセージRwを受け取っ
てから二次記憶装置2x〜2zへのデータの書き込みが
あらかじめ設定された一定時間内に完了した場合(図1
5のステップS203のY側)、データ書き込み結果通
知メッセージQw(図9)の結果フラグ58に成功フラ
グを設定し、さらにデータ書き込み要求メッセージRw
に設定されていたデータファイル名52,ファイルシス
テム名53及びシーケンス番号54を設定して、データ
の書き込み要求を行ったホストコンピュータ19に対し
て送る(図15のステップS204)。
【0027】ホストコンピュータ19上で動作している
プログラムは,広域ファイルシステム30に対するデー
タ書き込み要求を行ってから(図14のステップS10
1)、一定時間内にデータ書き込み要求を行った全ての
ホストコンピュータ1x〜1z上で動作している各プロ
グラムからデータ書き込み結果通知メッセージQwを受
け取り(図14のステップS102、Nの場合)、且つ
受け取った全てのデータ書き込み結果通知メッセージQ
wの結果フラグ58に成功フラグが設定されていた場合
(図14のステップS103、成功の場合)に、ホスト
コンピュータ1x〜1zに接続された二次記憶装置2x
〜2z上に構築されたファイルシステム30x〜30z
にデータが書き込まれたことを検出し(図14のステッ
プS104)、広域ファイルシステム管理テーブル26
においてデータの書き込みが成功したホスト名35〜3
6及びファイルシステム名37〜38の状態フラグ39
〜40をIDLE状態にする。
【0028】ストライプド・ファイルシステムを構成す
るn台のホストコンピュータ1x〜1z上で動作してい
る各プログラムは、ホストコンピュータ19からのデー
タ書き込み要求メッセージRwを受け取ってから(図1
5のステップS201)、二次記憶装置2x〜2zへの
データの書き込みが一定時間内に完了しなかった場合
(図15のステップS203、Nの場合)、データ書き
込み結果通知メッセージQwの結果フラグ58に失敗フ
ラグを設定し、更にデータ書き込み要求メッセージRw
に設定されていたデータファイル名52,ファイルシス
テム名53及びシーケンス番号54をそれぞれデータ書
き込み結果通知メッセージQwに設定して、データ書き
込み要求を行ったホストコンピュータ19に対して送る
(図15のステップS205)。
【0029】ホストコンピュータ19上で動作している
プログラムは、広域ファイルシステム30に対するデー
タの書き込み要求を行ってから、データ書き込み要求メ
ッセージRwを送った全てのホストコンピュータ1x〜
1z上で動作している各プログラムから一定時間内に返
されたデータ書き込み結果通知メッセージQwの結果フ
ラグ58に成功フラグが設定されているものが1つも無
かった場合、またはデータ書き込み要求メッセージを送
った全てのホストコンピュータ1x〜1z上で動作して
いる各プログラムから一定時間内にデータ書き込み結果
通知メッセージQwを受け取ることが出来なかった場合
は、ホストコンピュータ1x〜1zに接続された二次記
憶装置2x〜2z上に構築されたファイルシステム30
x〜30zに対するデータの書き込みが失敗したことを
検出し(図14のステップS107)、データ管理テー
ブル29から、書き込みが失敗したデータファイル名4
6,書き込みが失敗したデータファイル名46に対応す
るシーケンス番号47及びファイルシステム識別子48
のエントリを削除し、広域ファイルシステム管理テーブ
ル26において、データの書き込みに失敗したホスト名
35〜36及びファイルシステム名37〜38の状態フ
ラグをIDLE状態にし、データ管理テーブル29から
データファイル名46のエントリを削除する(図14の
ステップS108)。
【0030】次に、ホストコンピュータ19が、広域フ
ァイルシステム30に対するデータの書き込み要求を行
ってから(図14のステップS101)、一定時間内に
各ホストコンピュータ1x〜1z上で動作している各プ
ログラムから受け取ったデータ書き込み結果通知メッセ
ージQwの内,一部のデータ書き込み結果通知メッセー
ジQwの結果フラグ58に失敗フラグが設定されていた
場合(図14のステップS103、失敗の場合)の動作
を図10を共に参照して説明する。例えばi番目のシー
ケンス番号76に対して設定されたファイルシステム識
別子78(例えば、FS−ID−i)に対応するネット
ワークアドレス68(例えば、sss.sss.ss
s.sss)のホスト名61(例えば、Host−i)
のホストコンピュータ1sに接続された二次記憶装置2
sに構築されたファイルシステム30s(ファイルシス
テム名63=(FS−i))に対する、データファイル
45のi番目の断片のデータ書き込み結果通知メッセー
ジQwの結果フラグ58に失敗フラグが設定されていた
場合、またはホストコンピュータ1x〜1z上で動作し
ている各プログラムの中の一部から一定時間以内にデー
タ書き込み結果通知メッセージQwを受け取ることがで
きなかった場合(図14のステップS102,Yの場
合)、例えばi番目のシーケンス番号76に対して設定
されたファイルシステム識別子78に対応するネットワ
ークアドレス68のホスト名61のホストコンピュータ
1sに接続された二次記憶装置2sに構築されたファイ
ルシステム名63に対するデータファイル45のi番目
の断片のデータ書き込み結果通知メッセージQwを一定
時間内に受け取ることが出来なかった場合に、データの
書き込みが一部分だけ失敗したことを検出し、広域ファ
イルシステム管理テーブル26において、データの書き
込みに失敗したファイルシステム識別子78の状態フラ
グ65をIDLE状態にする。
【0031】次に、n個に分割されたデータファイル4
5のi番目のシーケンス番号76のデータ書き込み要求
が失敗した場合、ホストコンピュータ19は、図10の
データ管理テーブル29において、(i+1)番目のシ
ーケンス番号77に割り付けられているファイルシステ
ム識別子79(FS−ID−(i+1))をキーにして
広域ファイルシステム管理テーブル26を検索して、
(i+1)番目のシーケンス番号77に割り付けられて
いるファイルシステム識別子79の状態フラグ66を調
べる。(i+1)番目のシーケンス番号77に割り付け
られているファイルシステム識別子79の状態フラグ6
6がBUSY状態だった場合は、(i+2)番目のファ
イルシステム識別子の状態フラグをチェックする。この
手順を状態フラグがIDLE状態のファイルシステム識
別子が見つかるまで、n番目のファイルシステム識別子
まで繰り返し、n番目のファイルシステム識別子までチ
ェックしてもIDLE状態のファイルシステム識別子が
見つからなかった場合は、1番目のファイルシステム識
別子から(i−1)番目のファイルシステム識別子ま
で、IDLE状態のファイルシステム識別子が見つかる
まで繰り返す。このようにして、広域ファイルシステム
管理テーブル26の全てのファイルシステム識別子をチ
ェックしても、IDLE状態のファイルシステム識別子
が見つからなかった場合は(図14のステップS10
5、Yの場合)、データの書き込み要求を行ったホスト
コンピュータ19はデータファイル45の書き込みが失
敗したことを検出し(図14のステップS107)、n
等分されたデータファイルの断片を書き込んだ各ファイ
ルシステム識別子に対応するホストコンピュータに対し
て、それぞれ書き込んだn等分されたデータファイルの
断片の削除要求を出して、データ管理テーブル29から
データファイル45(データファイル名46=FILE
NAME1)のエントリを削除する(図14のステップ
S108)。
【0032】(i+1)番目のシーケンス番号77に割
り付けられているファイルシステム識別子79の状態フ
ラグ66がIDLE状態の場合は、データ管理テーブル
29において、i番目のシーケンス番号76に対するフ
ァイルシステム識別子78に、広域ファイルシステム管
理テーブル26においてIDLE状態だった(i+1番
目のシーケンス番号77のデータを書き込んだファイル
システム識別子79と同じ値(FS−ID−(i+
1))をi番目のシーケンス番号76に対するファイル
システム識別子78に設定して、n個に分割されたデー
タファイル45のi番目のシーケンス番号76のデータ
の断片を、ファイルシステム識別子78に対応するネッ
トワークアドレス69(例えば、ttt.ttt.tt
t.ttt)のホスト名62(Host−(i+1))
のホストコンピュータ1tに接続された二次記憶装置2
tに構築されたファイルシステム30t(ファイルシス
テム名64=(FS+(i+1))に書き込む為のデー
タ書き込み要求メッセージRwを出して、広域ファイル
システム管理テーブル26の(i+1)番目のファイル
システム識別子の状態フラグ66をBUSY状態にす
る。
【0033】n個に分割されたデータファイル45のi
番目のシーケンス番号76のデータの断片を(i+1)
番目のファイルシステム識別子に対応するホストコンピ
ュータ1tに送ったデータ書き込み要求メッセージRw
に対する、データ書き込み結果通知メッセージQwが、
一定時間内にホストコンピュータ1tからデータ書き込
み要求を行ったホストコンピュータ19に返されて、且
つそのデータ書き込み結果通知メッセージQwの結果フ
ラグ58に成功フラグがセットされていた場合は、デー
タ書き込み要求を行ったホストコンピュータ19はデー
タの書き込みが成功したことを検出し、(i+1)番目
のファイルシステム識別子の状態フラグ66をIDLE
状態にする。この場合、n等分されたデータファイル4
5のi番目のシーケンス番号76のデータの断片と、
(i+1)番目のシーケンス番号77のデータの断片と
は、(i+1)番目のファイルシステム識別子79に対
応する、ネットワークアドレス69のホスト名62のホ
ストコンピュータ1tに接続された二次記憶装置2tに
構築されたファイルシステム30tに、各々データファ
イル名46(FILENAME1)にシーケンス番号i
及び(i+1)が付与されたデータファイル名で書き込
まれる。
【0034】n個に分割されたデータファイル45のi
番目のシーケンス番号76のデータの断片を(i+1)
番目のファイルシステム識別子に対応するホストコンピ
ュータ1tに送ったデータ書き込み要求メッセージRw
に対するデータ書き込み結果通知メッセージQwが、一
定時間内にホストコンピュータ1tからデータ書き込み
要求を行ったホストコンピュータ19に返されて、且つ
そのデータ書き込み結果通知メッセージQwの結果フラ
グ58に失敗フラグがセットされていた場合、または、
(i+1)番目のファイルシステム識別子に対応するホ
ストコンピュータ1tに送ったデータ書き込み要求メッ
セージRwに対するデータ書き込み結果通知メッセージ
Qwが、一定時間内にホストコンピュータ1tからデー
タ書き込み要求を行ったホストコンピュータ19に返さ
れなかった場合は、ホストコンピュータ19は、前述の
シーケンスで(i+2)番目のファイルシステム識別子
に対応するホストコンピュータに接続された二次記憶装
置に構築されたファイルシステムに対して、n等分され
たデータファイル45のi番目のシーケンス番号76の
データの断片の書き込みを試みる。この手順を,データ
書き込みが成功するまで、n番目のファイルシステム識
別子まで繰り返し、n番目のファイルシステム識別子に
対する書き込みも失敗した場合は、1番目のファイルシ
ステム識別子から(i−1)番目のファイルシステム識
別子まで,データの書き込みが成功するまで繰り返す
(図14のステップS106)。このようにして,広域
ファイルシステム管理テーブル26の全てのファイルシ
ステム識別子に対応するホストコンピュータに接続され
た二次記憶装置に構築されたファイルシステムに対して
n等分されたデータファイル45の断片の書き込みを試
みても成功しなかった場合は(図14のステップS10
5、Yの場合)、データの書き込み要求を行ったホスト
コンピュータ19はデータファイル45の書き込みが失
敗したことを検出し(図14のステップS107)、n
等分されたデータファイルの断片を書き込んだ各ファイ
ルシステム識別子に対応するホストコンピュータに対し
て、書き込んだn等分されたデータファイルの断片の削
除要求を出して、データ管理テーブルからデータファイ
ル45のエントリを削除する(図14のステップS10
8)。
【0035】ホストコンピュータ19が広域ファイルシ
ステム30を介してデータファイル名46のデータファ
イルに格納されているデータの読み出しを行う場合、ホ
ストコンピュータ19上で動作するプログラムは、デー
タファイル名46(FILENAME1)のデータファ
イル45に格納されているデータの読み出し要求を検出
すると、データファイル名46をキーにして、広域ファ
イルシステム管理用のホストコンピュータ11上に作成
されていてネットワーク内の全てのホストコンピュータ
で共有されているデータ管理テーブル29を参照して、
データファイル名46のデータファイルが断片化されて
いる数をシーケンス番号47から知り、そして各断片化
されたデータファイルが格納されているファイルシステ
ムのファイルシステム識別子48(32〜33)を取り
出す。次に,各断片化されたデータファイルが格納され
ているファイルシステムのファイルシステム識別子48
(32〜33)をキーにして、広域ファイルシステム管
理テーブル26を検索し、各ファイルシステム識別子3
2〜33に対応するホスト名35〜36、及びファイル
システム名37〜38を取り出す。次に、ホスト名35
〜36をキーにしてアドレス管理テーブル28を参照し
て、データファイル名46の断片化されたデータファイ
ルが保存されている二次記憶装置2x〜2zが接続され
ているホスト名35〜36(ホストコンピュータ1x〜
1z)のネットワークアドレス42〜43を取り出す。
このようにして取り出したネットワークアドレス42〜
43の各ホストコンピュータ1x〜1z上で動作してい
るプログラムの各々に対して、データ読み出し要求メッ
セージRrを送り(図16のステップS301)、広域
ファイルシステム管理テーブル26において、データ読
み出し要求メッセージRrを送ったホスト名35〜36
及びファイルシステム名37〜38の状態フラグ39〜
40にBUSYフラグを設定する。
【0036】ホストコンピュータ1x〜1z上で動作し
ている各プログラムは、データ読み出し要求メッセージ
を受け取ったら(図15のステップS201)、自分に
接続されている二次記憶装置2x〜2zからのデータの
読み出し処理を行う(図15のステップS202))。
このとき、ホストコンピュータ1x〜1z上で動作して
いる各プログラムは、自分に接続されている二次記憶装
置2x〜2zからデータを読み出す際に、データファイ
ル名として、ホストコンピュータ19から受け取ったデ
ータ読み出し要求メッセージRrのデータファイル名5
2にシーケンス番号54を繋げた名前をデータファイル
名として選択し、ファイルシステム名53からデータの
読み出しを行う。ホストコンピュータ1x〜1z上で動
作している各プログラムは、データ読み出し要求メッセ
ージRrを受け取ってから、二次記憶装置2x〜2zか
らのデータの読み出しが一定時間内に完了した場合(図
15のステップS203、Yの場合)、データ読み出し
結果通知メッセージQrの結果フラグ58に成功フラグ
を設定し、更にデータ読み出し要求メッセージRrに設
定されていたデータファイル名52,ファイルシステム
名53及びシーケンス番号54を、各々データ読み出し
結果通知メッセージQrに設定して、二次記憶装置から
読み出したデータファイルの内容をデータ部59に書き
込んで、データの読み出し要求を行ったホストコンピュ
ータ19に対して送る(図15のステップS204)。
コンピュータ19上で動作しているプログラムは、広域
ファイルシステム30に対するデータ読み出し要求を行
ってから(図16のステップS301)、一定時間内に
データ読み出し要求メッセージRrを送った全てのホス
トコンピュータ1x〜1z上で動作している各プログラ
ムからデータ読み出し結果通知メッセージQrを受け取
り(図16のステップS302、Nの場合)、且つ受け
取った全てのデータ読み出し結果通知メッセージQrの
結果フラグ58に成功フラグが設定されていた場合(図
16のステップS303、成功の場合)に、ホストコン
ピュータ1x〜1zに接続された二次記憶装置2x〜2
z上に構築されたファイルシステム30x〜30z(フ
ァイルシステム名37〜38)からのデータの読み出し
が成功したことを検出し(図16のステップS30
4)、広域ファイルシステム管理テーブル26におい
て、データの読み出しが成功したホスト名35〜36及
びファイルシステム名37〜38の状態フラグ39〜4
0をIDLE状態にする。コンピュータ19上で動作し
ているプログラムは、データ読み出し要求メッセージR
rで指定したデータファイル45の読み出しが成功した
ことを検出すると、各ホストコンピュータから送られて
来たデータ読み出し結果通知メッセージQrからデータ
部59を取り出し、シーケンス番号57の順番に並べ換
えた上で、元の1つのファイルに組み立てる(図16の
ステップS305)。このようにして,ネットワーク内
の複数のホストコンピュータに接続された二次記憶装置
に分割して保存されていたデータファイル45にアクセ
スできるようになる。
【0037】ストライプド・ファイルシステムを構成す
るn台のホストコンピュータ1x〜1z上で動作してい
る各プログラムは、ホストコンピュータ19からのデー
タ読み出し要求メッセージRrを受け取ってから(図1
5のステップS201)、二次記憶装置2x〜2zから
のデータの読み出しが一定時間内に完了しなかった場合
(図15のステップS203、Nの場合)、データ読み
出し結果通知メッセージQrの結果フラグ58に失敗フ
ラグを設定し、更にデータ読み出し要求メッセージRr
に設定されていたデータファイル名52,ファイルシス
テム名53及びシーケンス番号54を、各々データ読み
出し結果通知メッセージQrに設定して、データ読み出
し要求を行ったホストコンピュータ19に対して送る
(図15のステップS205)。
【0038】ホストコンピュータ19上で動作している
プログラムは、広域ファイルシステム30からのデータ
の読み出し要求を行ってから、データ読み出し要求メッ
セージRrを送った全てのホストコンピュータ1x〜1
z上で動作している各プログラムから一定時間内に返さ
れたデータ読み出し結果通知メッセージQrの結果フラ
グ58に失敗フラグが設定されているものが1つでもあ
った場合(図16のステップS303、失敗の場合)、
またはデータ読み出し要求メッセージRrを送ったホス
トコンピュータ1x〜1z上で動作している各プログラ
ムのうち、一定時間内にデータ読み出し結果通知メッセ
ージQrを返さないものが1つでもあった場合(図16
のステップS302、Yの場合)は、ホストコンピュー
タ1x〜1zに接続された二次記憶装置2x〜2z上に
構築されたファイルシステム30x〜30zからのデー
タの読み出しが失敗したことを検出し(図16のステッ
プS306)、広域ファイルシステム管理テーブル26
において、データの読み出しに失敗したホスト名35〜
36及びファイルシステム名37〜38の状態フラグ3
9〜40をIDLE状態にして、ホストコンピュータ1
9における広域ファイルシステム30からのデータファ
イル45の読み出し要求を失敗とする。
【0039】次に、本発明の第2の実施の形態例につい
て図12を参照して説明する。図12において、2つの
ホストコンピュータ110,111は、コンピュータネ
ットワーク109によって相互に接続されていて、各ホ
ストコンピュータ110,111には、それぞれ2つの
入出力制御装置112〜113,114〜115が搭載
されている。各入出力制御装置112,113,11
4,115には、それぞれ二次記憶装置116,11
7,118,119が接続されている。第1のストライ
プド・ファイルシステム120は、ホストコンピュータ
110の入出力制御装置112に接続された二次記憶装
置116,及びホストコンピュータ111の入出力制御
装置114に接続された二次記憶装置118から構成さ
れ、第2のストライプド・ファイルシステム121は、
ホストコンピュータ110の入出力制御装置113に接
続された二次記憶装置117,及びホストコンピュータ
111の入出力制御装置115に接続された二次記憶装
置119から構成されている。広域ファイルシステムを
介したストライプド・ファイルシステム120,121
へのデータの入出力を行った場合の二次記憶装置116
〜119に対するデータの入出力処理は、前述の第1の
実施の形態例と同じ手順で行われる。第2の実施形態例
において、ホストコンピュータ110が障害により停止
した場合、ストライプド・ファイルシステム120,1
21に対して書き込んだデータは、自動的に、停止して
いないホストコンピュータ111に搭載されている入出
力制御装置114,115に接続された二次記憶装置1
18,119に保存される。また、第2の実施形態例に
おいてホストコンピュータ110に搭載されている入出
力制御装置112が障害により停止した場合、ストライ
プド・ファイルシステム120に対して書き込んだデー
タは、自動的に、ホストコンピュータ111に搭載され
ている停止していない入出力制御装置114に接続され
た二次記憶装置118に保存される。更に、第2の実施
形態例において、ホストコンピュータ110に搭載され
ている入出力制御装置112に接続されている二次記憶
装置116が障害により停止した場合も、ストライプド
・ファイルシステム120に対して書き込んだデータ
は、自動的に、ホストコンピュータ111に搭載されて
いる入出力制御装置114に接続された停止していない
二次記憶装置118に保存される。
【0040】更に、第2の実施形態例の変形例を図13
に示す。図13において、3つのホストコンピュータ1
23,124,125はコンピュータネットワーク12
2によって相互に接続されていて、各ホストコンピュー
タ123,124,125には、それぞれ2つの入出力
制御装置126〜127,128〜129,130〜1
31が搭載されている。ホストコンピュータ123〜1
25の各々の入出力制御装置126,127,128,
129,130,131には、それぞれ二次記憶装置1
32,133,134,135,136,137が接続
されている。第1のストライプド・ファイルシステム1
38は、ホストコンピュータ123の入出力制御装置1
26に接続された二次記憶装置132と、ホストコンピ
ュータ124の入出力制御装置128に接続された二次
記憶装置134と、ホストコンピュータ125の入出力
制御装置130に接続された二次記憶装置136とから
構成される。第2のストライプド・ファイルシステム1
39は、ホストコンピュータ123の入出力制御装置1
27に接続された二次記憶装置133と、ホストコンピ
ュータ124の入出力制御装置129に接続された二次
記憶装置135と、ホストコンピュータ125の入出力
制御装置131に接続された二次記憶装置137とから
構成される。広域ファイルシステムを介したストライプ
ド・ファイルシステム138,139へのデータの入出
力を行った場合の二次記憶装置132〜137に対する
データの入出力処理は、前述の第1の実施形態例と同じ
手順で行われる。この第2の実施形態例の変形例におい
て、ホストコンピュータ123が障害により停止した場
合、ストライプド・ファイルシステム138,139に
対してデータの書き込みを行ったプロセスの処理は、自
動的に、停止していないホストコンピュータ124,1
25に搭載されている入出力制御装置128〜131に
より分散・並列処理され、データはホストコンピュータ
124,125に搭載されている入出力制御装置12
8,130に接続された二次記憶装置134,136に
保存される。また、ホストコンピュータ123に搭載さ
れている入出力制御装置126が障害により停止した場
合、ストライプド・ファイルシステム138に対してデ
ータの書き込みを行ったプロセスの処理は、ホストコン
ピュータ124,125に搭載されている入出力制御装
置128,130により分散・並列処理され、データは
ホストコンピュータ124,125に搭載されている入
出力制御装置128,130に接続された二次記憶装置
134,136に保存される。さらにまた、ホストコン
ピュータ123に搭載されている入出力制御装置126
に接続されている二次記憶装置132が障害により停止
した場合も、ストライプド・ファイルシステム138に
対してデータの書き込みを行ったプロセスの処理は、ホ
ストコンピュータ124,125に搭載されている入出
力制御装置128,130により分散・並列処理され、
データはホストコンピュータ124,125に搭載され
ている入出力制御装置128,130に接続された二次
記憶装置134,136に保存される。
【0041】以上説明したように、本発明によれば、ス
トライプド・ファイルシステムに対する入出力処理を,
コンピュータネットワーク内の複数のホストコンピュー
タに分散・並列化させることができるようになるので、
従来の1台のホストコンピュータに接続された複数台の
二次記憶装置上に構築されたファイルシステムからスト
ライプド・ファイルシステムを構築した場合(図17参
照)に1台のホストコンピュータ80で全ての二次記憶
装置81〜84に対するデータの入出力を処理しなけれ
ばならなかったのに比べて、同じ量のデータの入出力を
複数台のホストコンピュータ(図1の12〜1m)で分
割して並行に処理することができるようになるため、各
ホストコンピュータが処理しなければならない入出力デ
ータの量が減少する。例えば、従来のストライプド・フ
ァイルシステムの手法では、1台のホストコンピュータ
が2つの入出力制御装置を搭載し、その各々の入出力制
御装置に二次記憶装置が接続されていた場合(図18参
照)、プロセスが二次記憶装置89,90に対するデー
タの入出力処理は2つの入出力制御装置87,88によ
って分散・並列処理されるに過ぎないが、本発明によれ
ば、コンピュータネットワークに接続され2つの入出力
制御装置を搭載し、その各々の入出力制御装置に二次記
憶装置が接続されているもう1台のホストコンピュータ
との間でストライプド・ファイルシステムを構築するこ
とにより(図11参照)、二次記憶装置に対するデータ
の入出力処理を2台のホストコンピュータに接続された
4つの入出力制御装置によって分散・並列化して処理す
ることが可能となり、二次記憶装置に対するデータの入
出力時に、各々のホストコンピュータが処理しなければ
ならない入出力データの量を減少させることができる。
このように、二次記憶装置に対する入出力処理そのもの
をコンピュータネットワーク内の複数のホストコンピュ
ータ上で動作する複数のプロセスに分散させ、各ホスト
コンピュータにより複数の入出力制御装置に分散・並列
化させることにより、二次記憶装置に対するデータの入
出力時に各ホストコンピュータにかかる負荷を軽減する
ことができるようになる。
【0042】また、従来のストライプド・ファイルシス
テムの手法では、複数台の二次記憶装置に対するデータ
の入出力を1台の入出力制御装置で行った場合は(図1
9参照)、ストライプド・ファイルシステム96に対す
る入出力処理を並列化しても、実際の二次記憶装置9
4,95へのデータの入出力処理は1台の入出力制御装
置93によってシーケンシャルに行われる為、単一プロ
セス当たりの二次記憶装置に対する入出力時の性能向上
を図ることができず、二次記憶装置に対するデータの入
出力時のプロセス当たりの性能向上を図るには(図18
参照)、異なる入出力制御装置87,88に接続された
二次記憶装置89,90上に構築されたファイルシステ
ムを基本単位としてストライプド・ファイルシステム9
1を構築しなければならないというハードウェア上の制
約があった。この為、ストライプド・ファイルシステム
を構築し二次記憶装置に対するデータの入出力処理を複
数の入出力制御装置に分散・並列化させることによりプ
ロセス当たりの性能向上を図った場合、性能向上を実現
することができるストライプド・ファイルシステムの大
きさは1台のホストコンピュータに搭載されている入出
力制御装置の数によって制限されていたが、本発明によ
れば、1台のホストコンピュータの複数の異なる入出力
制御装置に接続された二次記憶装置だけでなく、コンピ
ュータネットワークを構成する複数台のホストコンピュ
ータに搭載された複数の異なる入出力制御装置に接続さ
れた二次記憶装置からストライプド・ファイルシステム
を構築できるようになる。例えば、従来のストライプド
・ファイルシステムの手法では、1台のホストコンピュ
ータに2つの入出力制御装置が搭載され、その各々の入
出力制御装置に二次記憶装置が接続されていた場合(図
18)、二次記憶装置に対するデータの入出力処理を分
散・並列化することにより,二次記憶装置89,90に
対するデータの入出力時の性能向上を図ることができる
ストライプド・ファイルシステムの容量は、2つの入出
力制御装置87,88の各々に接続された二次記憶装置
89,90の容量の合計にしかならない。本発明によれ
ば、図11に示すようにコンピュータネットワーク99
により接続され、2つの入出力制御装置を搭載し、その
各々の入出力制御装置に二次記憶装置が接続されている
もう1台のホストコンピュータとの間でストライプド・
ファイルシステム108を構築することにより、2台の
ホストコンピュータ97,98の4つの入出力制御装1
00〜103の各々に接続された二次記憶装置104〜
107の容量の合計になり、二次記憶装置に対するデー
タの入出力処理を分散・並列化することによる性能向上
を犠牲にすることなく、1台のホストコンピュータだけ
でストライプド・ファイルシステムを構築して二次記憶
装置に対するデータの入出力処理を分散・並列化した場
合(図18)に比べて2倍の容量のストライプド・ファ
イルシステムを構築できるようになる。このように、コ
ンピュータネットワークを経由して複数台のホストコン
ピュータに接続された二次記憶装置上に構築された広域
ファイルシステムを構成単位としたストライプド・ファ
イルシステムを構築することにより、二次記憶装置に対
するデータの入出力時のプロセス当たりの性能向上を図
りつつ、大容量のストライプド・ファイルシステムを構
築できるようになる。
【0043】さらに本発明によれば、ストライプド・フ
ァイルシステムを介してプロセスが二次記憶装置にデー
タを書き込んだ場合、ストライプド・ファイルシステム
を構成しているファイルシステムが構築されている二次
記憶装置が接続されているホストコンピュータのうちの
1台が障害により停止しても、同じストライプド・ファ
イルシステムを構成しているファイルシステムが構築さ
れている二次記憶装置が接続されている別のホストコン
ピュータが動作していて、その二次記憶装置にデータを
保存するだけの容量がある限り、プロセスがストライプ
ド・ファイルシステムに書き込んだデータは自動的に正
常に動作しているホストコンピュータに接続されている
二次記憶装置に保存される。このように、ストライプド
・ファイルシステムに対してデータの入出力を行う際、
コンピュータネットワークを介して異なるホストコンピ
ュータに接続された二次記憶装置上に構築されたファイ
ルシステムに同時にアクセス可能とすることにより、コ
ンピュータネットワーク全体で考えた場合のシステムの
耐故障性を向上させることができるようになる。
【0044】
【発明の効果】以上説明したように、本発明によれば、
二次記憶装置に対する入出力処理そのものをコンピュー
タネットワーク内の複数のホストコンピュータ上で動作
する複数のプロセスに分散させ、各ホストコンピュータ
により複数の入出力制御装置に分散・並列化させること
により、二次記憶装置に対するデータの入出力時に各ホ
ストコンピュータにかかる負荷を軽減することができ
る。
【0045】また、コンピュータネットワークを経由し
て複数台のホストコンピュータに接続された二次記憶装
置上に構築された広域ファイルシステムを構成単位とし
たストライプド・ファイルシステムを構築することによ
り、二次記憶装置に対するデータの入出力時のプロセス
当たりの性能向上を図りつつ、大容量のストライプド・
ファイルシステムを構築できる。
【0046】さらに、ストライプド・ファイルシステム
に対してデータの入出力を行う際、コンピュータネット
ワークを介して異なるホストコンピュータに接続された
二次記憶装置上に構築されたファイルシステムに同時に
アクセスすることにより、コンピュータネットワーク全
体で考えた場合のシステムの耐故障性を向上させること
ができる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態例を示すシステムの
構成図である。
【図2】広域ファイルシステムを管理する為のホストコ
ンピュータに接続されている二次記憶装置上の各種管理
テーブルを示す図である。
【図3】広域ファイルシステム管理テーブルの構成例を
示す図である。
【図4】ストライプド・ファイルシステム管理テーブル
の構成例を示す図である。
【図5】アドレス管理テーブルの構成例を示す図であ
る。
【図6】データ管理テーブルの構成例を示す図である。
【図7】本発明においてデータの書き込み及び読み出し
を行う際に、参照する各種管理テーブルの関係を示した
図である。
【図8】データ書き込み要求メッセージ及びデータ読み
出し要求メッセージの構成例を示す図である。
【図9】データ書き込み結果通知メッセージ及びデータ
読み出し結果通知メッセージの構成例を示す図である。
【図10】データの書き込み要求が失敗した場合のリト
ライ処理の際に,参照する各種管理テーブルの関係を示
した図で、図7に対する補足図である。
【図11】図1に示す実施の形態の変形例を示す図であ
る。
【図12】本発明の第2の実施の形態例を示すシステム
の構成図である。
【図13】図12に示す実施の形態の変形例を示す図で
ある。
【図14】本発明において、ホストコンピュータが広域
ファイルシステムを介してデータの書き込みを行う際の
処理の流れを示したフローチャートである。
【図15】本発明において、ホストコンピュータ上で動
作するプログラムが遠隔のホストコンピュータからのデ
ータの書き込み要求,またはデータの読み出し要求を受
け取った時の処理の流れを示したフローチャートであ
る。
【図16】本発明において、ホストコンピュータが広域
ファイルシステムを介してデータの読み出しを行う際の
処理の流れを示したフローチャートである。
【図17】従来のストライプド・ファイルシステムを示
す構成図である。
【図18】従来のストライプド・ファイルシステムにお
いて、1台のホストコンピュータの異なる入出力制御装
置に接続された二次記憶装置に対するデータの入出力処
理を、分散・並列化させて行う場合のハードウェア構成
を示す図である。
【図19】従来のストライプド・ファイルシステムにお
いて、1台のホストコンピュータに接続された複数の二
次記憶装置に対するデータの入出力処理を1つの入出力
制御装置により行う場合のハードウェア構成を示す図
で、図18に対する足図である。
【符号の説明】
10,99,109,122 ホストコンピュータを
相互に接続するネットワーク 11 広域ファイルシステム管理用のホストコンピュ
ータ 12〜1m,97,98,110,111,123,1
24,125 ネットワークを構成するホストコンピ
ュータ 21〜2m,104〜107,116〜119,132
〜137 二次記憶装置 20,108,120,121,138,139 仮
想的なストライプド・ファイルシステム 26 広域ファイルシステム管理テーブル 27 ストライプド・ファイルシステム管理テーブル 28 アドレス管理テーブル 29 データ管理テーブル 30 広域ファイルシステム 30s〜30z ファイルシステム 45 データファイル 100〜103,112〜115,126〜131
入出力制御装置
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平7−219905(JP,A) 特開 平2−294749(JP,A) (58)調査した分野(Int.Cl.6,DB名) G06F 15/167 G06F 12/00 JICSTファイル(JOIS)

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 ホストコンピュ−タに接続された複数の
    二次記憶装置上にそれぞれ構築された複数のファイルシ
    ステムを仮想的な1つのファイルシステムとし、この仮
    想的なファイルシステムに対するデ−タの書き込み及び
    読み出し処理をソフウトウェアにより前記二次記憶装置
    単位に分割し並列分散化して行うストライプド・ファイ
    ルシステムにおいて、ネットワークを介して互いに接続されるとともに前記複
    数の二次記憶装置の各々を互いに重複することなく収容
    し、1つのデータファイルから分割された各部分データ
    をそれぞれ独立したファイルシステムとして任意の二次
    記憶装置に分散配置することにより広域ファイルシステ
    ムを構築可能とした複数の前記ホストコンピュ−タを備
    え、 これらホストコンピュ−タのうち管理用ホストコンピュ
    −タとしてあらかじめ指定された特定のホストコンピュ
    ータに、前記広域ファイルシステムの分割配置先の二次
    記憶装置を収容するホストコンピュータとそのホストコ
    ンピュータ内でのファイルシステムとを示すファイルシ
    ステム識別情報を管理するためのファイルシステム管理
    テーブルと、前記ホストコンピュ−タごとのネットワ−
    ク上のアドレス情報を管理するためのアドレス管理テ−
    ブルと、前記データファイルごとの前記ファイルシステ
    ム識別情報によるデータ分割を管理するためのデータ管
    理テーブルとを有し、 前記ネットワークに接続された任意のホストコンピュ−
    タが、前記広域ファイルシステムに対するデータファイ
    ルの書き込みあるいは読み出しを行う際、前記管理用ホ
    ストコンピュ−タの前記ファイルシステム管理テーブ
    ル,前記アドレス管理テ−ブル,及び前記データ管理テ
    ーブルを参照し、分割されたデータの各々に対応するホ
    ストコンピュータとそのファイルシステムとを認識し、
    該当するホストコンピュータに対応するデータの書き込
    みあるいは読み出し要求を行い該当する二次記憶装置に
    対する書き込みあるいは読み出しを行わせる ことを特徴
    とする分散ネットワ−ク化ストライプド・ファイルシス
    テム。
  2. 【請求項2】 前記ホストコンピュ−タの障害により前
    記二次記憶装置に対する分割されたデ−タの書き込みが
    失敗すると、前記管理用ホストコンピュ −タの前記ファ
    イルシステム管理テーブル,前記アドレス管理テ−ブ
    ル,及び前記データ管理テーブルを参照して自動的に
    替のホストコンピュ−タを選別し、この代替のホストコ
    ンピュ−タに対応する前記二次記憶装置に対して該当デ
    −タの書き込みを行うことを特徴とする請求項1記載の
    分散ネットワ−ク化ストライプド・ファイルシステム。
JP8071680A 1996-03-27 1996-03-27 分散ネットワーク化ストライプド・ファイルシステム Expired - Lifetime JP2912221B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8071680A JP2912221B2 (ja) 1996-03-27 1996-03-27 分散ネットワーク化ストライプド・ファイルシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8071680A JP2912221B2 (ja) 1996-03-27 1996-03-27 分散ネットワーク化ストライプド・ファイルシステム

Publications (2)

Publication Number Publication Date
JPH09259089A JPH09259089A (ja) 1997-10-03
JP2912221B2 true JP2912221B2 (ja) 1999-06-28

Family

ID=13467532

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8071680A Expired - Lifetime JP2912221B2 (ja) 1996-03-27 1996-03-27 分散ネットワーク化ストライプド・ファイルシステム

Country Status (1)

Country Link
JP (1) JP2912221B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3557994B2 (ja) * 2000-04-05 2004-08-25 日本電気株式会社 ファイルデータ格納装置及び方法並びに記録媒体
JP3992427B2 (ja) 2000-08-01 2007-10-17 株式会社日立製作所 ファイルシステム
US7366837B2 (en) * 2003-11-24 2008-04-29 Network Appliance, Inc. Data placement technique for striping data containers across volumes of a storage system cluster
WO2011123699A2 (en) * 2010-03-31 2011-10-06 Orsini Rick L Systems and methods for securing data in motion
US9542402B2 (en) 2013-04-24 2017-01-10 Empire Technology Development Llc Computing devices with multi-layer file systems

Also Published As

Publication number Publication date
JPH09259089A (ja) 1997-10-03

Similar Documents

Publication Publication Date Title
US6014730A (en) Dynamic adding system for memory files shared among hosts, dynamic adding method for memory files shared among hosts, and computer-readable medium recording dynamic adding program for memory files shared among hosts
US7146377B2 (en) Storage system having partitioned migratable metadata
JP5413948B2 (ja) ストレージシステム
US20050144178A1 (en) Distributing files across multiple, permissibly heterogeneous, storage devices
US8516070B2 (en) Computer program and method for balancing processing load in storage system, and apparatus for managing storage devices
US20090228658A1 (en) Management method for cache memory, storage apparatus, and computer system
CA2053526A1 (en) Database system having a plurality of nodes communicating with each other via a communication network
JP5391705B2 (ja) ストレージシステム
JP2766424B2 (ja) 論理ボリューム装置
JP2912221B2 (ja) 分散ネットワーク化ストライプド・ファイルシステム
US20170255393A1 (en) Storage device and storage method
JP2010539770A (ja) 動的アドレス追跡
JPH07244642A (ja) 並列処理計算機
US7260612B2 (en) Switching system duplicating file operation command according to quantity of file servers and sending writing and reading commands according to a switching order
US20220188316A1 (en) Storage device adapter to accelerate database temporary table processing
JP2002149352A (ja) データ記憶制御方法、データ記憶制御装置及びデータ記憶制御プログラムを格納した記録媒体
JP2004157644A (ja) ディスクサブシステム、計算機システム、それを管理するためのストレージ管理方法、および、管理プログラム
JP2944496B2 (ja) 画像データ格納制御装置
JP2001318905A (ja) ディスク共有型分散サーバシステム
JP2001125879A (ja) データ記憶システムおよびデータ記憶方法
JP2018173802A (ja) ストレージシステム、データソート方法及びプログラム
JP3559571B2 (ja) データ処理装置およびデータ処理方法
JP2994917B2 (ja) 記憶システム
JPH0727531B2 (ja) ファイル制御方式
CN118227048A (zh) 分布式数据存储方法、系统、存储装置及存储介质

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990316