JP3488500B2 - 分散ファイルシステム - Google Patents

分散ファイルシステム

Info

Publication number
JP3488500B2
JP3488500B2 JP01342094A JP1342094A JP3488500B2 JP 3488500 B2 JP3488500 B2 JP 3488500B2 JP 01342094 A JP01342094 A JP 01342094A JP 1342094 A JP1342094 A JP 1342094A JP 3488500 B2 JP3488500 B2 JP 3488500B2
Authority
JP
Japan
Prior art keywords
file
cell
access
information
distributed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP01342094A
Other languages
English (en)
Other versions
JPH07219905A (ja
Inventor
和一 大江
聡 稲野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP01342094A priority Critical patent/JP3488500B2/ja
Priority to US08/386,061 priority patent/US5761498A/en
Publication of JPH07219905A publication Critical patent/JPH07219905A/ja
Application granted granted Critical
Publication of JP3488500B2 publication Critical patent/JP3488500B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99932Access augmentation or optimizing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Multi Processors (AREA)
  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は,高並列計算機の利用形
態の1つであるSPMD(Single Program Multiple Da
ta) モデル等を対象にした分散ファイルシステムに関す
る。
【0002】高並列計算機環境で使用されるファイルシ
ステムでは,特に各セルおよびホスト計算機におけるフ
ァイルアクセスの効率化が,性能向上の重要な要素とな
る。ファイルアクセスの効率化のために,各セルおよび
ホスト計算機からそれぞれファイルの必要な部分だけ
を,特にアプリケーションプログラムに大きな負担を与
えることなく,柔軟にアクセスできるような技術が必要
とされる。
【0003】
【従来の技術】並列計算機に実装されるファイルシステ
ムとして,大きく分けてグローバルファイルシステムと
ローカルファイルシステムの2種類がある。
【0004】グローバルファイルシステムとは,全セル
(プロセッサエレメント)から同じファイルをアクセス
することができるものである。このグローバルファイル
システムは,自由度が高い反面,複数セルが同一ファイ
ルの同一アドレスをアクセスした場合でのファイルの一
貫性制御等のため,ファイルシステムが大きくかつ遅く
なりがちである。特に,SPMDタイプのタスクを実行
させるような場合には,複数のセルが同一ファイルの同
一アドレスをアクセスする可能性が低いため,ファイル
の一貫性等を保つ制御はほとんど無駄になっている。
【0005】一方,ローカルファイルシステムとは,各
セルがそれぞれ独立したファイルシステムを持つもので
あり,各セルがそれぞれ必要とするデータのみを自ファ
イルシステムに保持するようにしたものである。ローカ
ルファイルシステムでは,各セルに自セルのみが使用す
るファイルシステムが見えるように構成される。
【0006】図19は従来技術の説明図である。ローカ
ルファイルをホスト計算機からアクセスした場合,各セ
ルに分散されたデータが別々のファイルとして見えるこ
とになる。図19(A)および(B)は,セル側にファ
イルの実体があるローカルファイルシステムの例を示し
ており,ファイルA0,A1,A2は,それぞれセルce
ll-0, cell-1, cell-2にだけ見えるようになっている。
このファイルをホスト計算機または他の計算機システム
がアクセスする場合,各セルに分散されたファイルをそ
れぞれオープン(OPEN)し,別々にアクセスする必
要がある。
【0007】また,グローバルファイルを各セルがアク
セスした場合,ファイルのすべてが各セルのアクセス対
象となる。図19(C)および(D)は,ホスト計算機
側にファイルの実体がある場合の例を示しており,ファ
イルAは,ホスト計算機または他の計算機システムがオ
ープンした場合にも,各セルがオープンした場合にも,
まったく共通に全体が見えてしまう。
【0008】
【発明が解決しようとする課題】従来技術によれば,ホ
スト計算機からローカルファイルをアクセスする場合,
図19(A)に示すように,それぞれ別ファイルとして
アクセスする必要があり,各ローカルファイルへのデー
タの分散を意識して処理しなければならない。また,各
セルがホスト計算機上のファイルをアクセスする場合,
図19(D)に示すように,自セルでの処理に不要なデ
ータも見えることになるので,必要なデータを選択して
アクセスしなければならない。そのため,ホスト計算機
および各セルにおけるファイルのデータ処理に関する処
理負担が大きくなるという問題があった。
【0009】また,SPMD等の並列計算機におけるロ
ーカルファイルのデータ処理において,セル数を変えて
実行するとき,各セルで必要となる処理対象データが異
なるので,各ローカルファイルへのデータの分散をやり
直す必要があり,その処理のオーバヘッドが大きくなる
という問題があった。さらに,1つのデータに関して,
読み出し時と書き込み時とで異なった分散方法により,
各セルがアクセスしようとした場合,従来技術では,ア
プリケーション側で分散の変更を意識してファイルに書
き込む必要があり,その処理負担が大きいという問題が
あった。
【0010】本発明は上記問題点の解決を図り,1つの
ファイルに関してグローバルファイルおよびローカルフ
ァイルのそれぞれの好適な機能を有するファイルシステ
ムを提供することを目的とする。また,1つのファイル
に関して,各セルへのデータの分散等が自由に変更でき
るファイルシステムを提供することを目的とする。
【0011】
【課題を解決するための手段】図1および図2は本発明
の原理説明図である。本発明は,例えば図1(A)に示
すようなシステムに適用される。図中,10はそれぞれ
命令実行機能を有するセル(プロセッサエレメントと呼
ぶこともある),11は各セル10におけるファイルア
クセス機能を提供するセル側ファイルサーバ,12はネ
ットワーク,13はホスト計算機,14はホスト計算機
13におけるファイルアクセス機能を提供するホスト側
ファイルサーバ,15はファイルのデータ分散情報を記
憶する分散情報記憶手段,16は通信回線等を介してホ
スト計算機13に接続される他の計算機システムを表
す。
【0012】本発明は,ホスト側ファイルサーバ14お
よびセル側ファイルサーバ11によって,ホスト計算機
13または他の計算機システム16が,あるファイルA
をオープンすると,例えば図1(B)に示すように,全
体として1つのファイルに見えるようにアクセスする処
理手段と,その同じ実体のファイルAを各セル(cel-0,
cell-1,…)10がオープンすると,図1(C)に示す
ように,各セル10が必要とするデータだけが入ったロ
ーカルファイルA0,A1,…として見えるようにアク
セスする処理手段とを有する。
【0013】また,ホスト計算機13またはホスト側フ
ァイルサーバ14に実装されたファイルについて,各セ
ル10に分散する情報を持つ分散情報記憶手段15を持
ち,各セル10がそのファイルをオープンすると,オー
プンしたファイルに対するアクセス要求で指定された情
報と分散情報記憶手段15の情報に基づき,各セル1
0が必要とするデータだけが入ったローカルファイルと
してそのファイル中のデータの一部にアクセスする機能
を,ホスト側ファイルサーバ14およびセル側ファイル
サーバ11により提供する。
【0014】分散情報記憶手段15に記憶する分散情報
は,自動並列化コンパイラ(図示省略)において,ファ
イルの書式を与えることにより,そのファイルを扱うプ
ログラムのコンパイル時に自動生成する。
【0015】さらに,ホスト側ファイルサーバ14およ
びセル側ファイルサーバ11により,二次記憶にデータ
が1つのファイルとして保存されたファイルを,各セル
10がオープンするときに指定したオープンモードによ
って,それぞれのセル10が必要とするデータだけが入
ったローカルファイルとして見えるようにアクセスする
処理手段を有する。
【0016】また,例えば図2(A)に示すように,二
次記憶にデータが1つのファイルとして保存されたファ
イルAについて,各セル10が同時に複数のオープンモ
ードでファイルオープンをできるようにし,各オープン
モードに応じてそのファイルにおけるアクセス対象とな
るデータが異なるアクセスを行う手段を提供する。例え
ば,セルcell-0が,ファイルAをあるオープンモードで
オープンすると,ローカルファイルA0として見え,同
時に他のオープンモードでオープンすると,異なる部分
がローカルファイルA’0として見えるようなアクセス
機能を提供する。
【0017】また,例えば図2(B),(C)に示すよ
うに,二次記憶にデータが1つのファイルとして保存さ
れたファイルAについて,オープン後にオープンモード
を動的に変更し,自セルからアクセスできるデータの
分を変更する手段を提供する。
【0018】
【作用】本発明によれば,図1の(B),(C)に示す
ように,ホスト計算機13から各ローカルファイル上の
ファイルをアクセスすると,1つのファイルとしてアク
セスでき,セル10からホスト計算機13のファイルを
アクセスすると,各セル10ごとにデータが分散された
ローカルファイルとしてアクセスできるような機能が提
供される。したがって,ホスト計算機13から各ローカ
ルファイルに分散されたデータをアクセスするとき,分
散を意識せずにファイルのアクセスが可能になる。ま
た,各セル10からホスト計算機13上のファイルをア
クセスするとき,必要なデータだけをアクセスすること
ができるようになる。
【0019】特に,このような分散情報を自動並列化コ
ンパイラが自動生成することにより,効率的に利用可能
な分散ファイルシステムを,アプリケーション開発者に
大きな負担を与えることなく実現できるようになる。
【0020】また,本発明によれば,ファイルシステム
内では1つのファイルとしてファイルの実体のみを保存
し,各セル10がファイルをオープンするときに指定す
るオープンモードによって,自セル10が必要とする部
分のみが連続して見えるようなアクセス機能が提供され
る。したがって,例えば並列計算機システムでSPMD
モデルのプログラムを実行するケースで,かつ,セル数
を変えてプログラムを実行する場合,大部分はプログラ
ムを大きく変更することなくそのまま実行可能である。
最悪の場合でも,ファイルオープン時のオープンモード
を変更するだけで,それぞれ必要な部分だけに着目した
データ処理を遂行することができる。
【0021】また,1つのデータに関して読み出し時と
書き込み時とで異なった分散方法により各セル10がア
クセスする場合には,読み出し時の分散方法と書き込み
時の分散方法のそれぞれを反映したオープンモードでフ
ァイルを複数回オープンすることができるので,読み出
し時と書き込み時とでそれぞれのオープンモードでオー
プンされたファイルにアクセスするだけでよいことにな
る。すなわち,アプリケーション側のデータアクセス処
理において分散の変更を意識しなくてもよい。また,処
理途中において必要になった場合に,動的にオープンモ
ードを変更することにより,同様に分散を自由に変更で
きるようになる。
【0022】
【実施例】図3は本発明のシステム構成例を示す。図3
に示すシステムは,複数のセルがネットワークで結合さ
れた並列計算機システムである。
【0023】ホスト計算機13は,通常の汎用計算機で
あり,ファイルを格納する外部記憶装置としてディスク
装置22を持つ。また,セル10の一部には入出力用セ
ル20を介してファイルを格納するディスク装置21が
接続されている。これらのディスク装置21上に各セル
10ごとのローカルファイルが実装される。ディスク装
置21を持たないセル10は,ディスク装置21を持つ
セル10のディスク装置21上にローカルファイルを実
装する。
【0024】SPMDモデルでは,各セル10は同じプ
ログラムを,データが異なるケースについて実行してい
く。この場合,全体で必要なデータのうち,各セル10
で必要とするデータは,ある決められた一部分である。
ただし,この必要となるデータの部分は,実行するプロ
グラムのデータ分散方法によって異なる。また,同じプ
ログラムでもデータによって分散方法が異なる場合があ
り得る。
【0025】以上のような理由により,ホスト計算機1
3からアクセスした場合には,1つのファイルとして見
え,各セル10からアクセスした場合には,各々のセル
10が必要とする部分のみが見えるファイルシステムが
実現されれば,簡易で有効なファイルアクセスが可能に
なる。このとき,各セル10へのデータの分散方法は,
実行するプログラムのデータ分散方法に対応して,任意
に設定できる必要がある。
【0026】そのため,ホスト計算機13のファイルシ
ステム上に,通常のデータを格納するファイルとは別
に,ファイルの分散方法等の情報のみが書かれた分散情
報ファイル40を作る。分散情報ファイル40は,ホス
ト計算機13からセル10側に分散されているファイル
を1つのファイルとしてアクセスするとき,各セル10
がホスト計算機13側のファイルをそれぞれのローカル
ファイルとしてアクセスするとき,また,ホスト計算機
13とセル10間でファイル転送を行うときに,参照さ
れる。
【0027】セル10側にファイルの実体がある場合に
は,セル側ファイルサーバ11が起動され,ホスト計算
機13側にファイルの実体がある場合には,ホスト側フ
ァイルサーバ14が起動されて,分散情報ファイル40
に書かれた情報を基に,ファイルが合成または分散さ
れ,ファイルのアクセスまたは転送が実現される。
【0028】図4に示す本発明の実施例に従って,さら
に詳しく説明する。図4(A)では,ファイル(file)A
は,ホスト計算機13にファイル実体があり,ファイル
(file)Bは,セル10側にファイル実体がある。ファイ
ルAをセル側でアクセスするとき,まず,ホスト側ファ
イルサーバ14に要求を出し,ホスト側ファイルサーバ
14は,ファイルAの分散情報ファイル40Aを読み取
り,この情報から各セル10に必要な部分をそれぞれ転
送する。各セル10は,それを各々連続したファイルと
して利用する。
【0029】ファイルBをセル10側でアクセスする
と,ファイルBの場合,各セル10のローカルファイル
に各々が必要とする部分が入ったデータが格納されてい
るので,それをアクセスする。分散方法を変更してアク
セスする場合には,セル側ファイルサーバ11が,ホス
ト側ファイルサーバ14を経由して分散情報ファイル4
0Bを読み込み,セル側ファイルサーバ11間で各セル
10が持っているデータの交換を行い,データを指定さ
れた分散方法に並べ直してユーザタスクに見せる。セル
数が変化した場合にも同様な方法でデータ分散方法を変
更してユーザタスクに見せることができる。
【0030】ファイルBをホスト計算機13側でアクセ
スする場合,まずホスト側ファイルサーバ14に要求を
出す。ホスト側ファイルサーバ14は,セル側ファイル
サーバ11経由で各セル10のローカルファイルにアク
セスし,ファイルBに関する分散情報ファイル40Bの
情報を基にしてデータの合成/分散を行う。
【0031】分散情報ファイル40A,40Bが保持す
る情報は,例えば図4(B)に示すような情報である。 (a) セル10にファイル実体がある場合,各セル10上
に分散されているローカルファイルシステムでのファイ
ル名。
【0032】(a) ’ホスト計算機13にファイル実体が
ある場合,ホスト計算機13で管理するファイル名。 (b) 1ブロック(block)のサイズ。
【0033】(c) 分散方法。 (d) 分散の順序。 ・・・・・ 上記(c) の分散方法は,例えばラウンドロビン・オーダ
ー,ハッシュ,…というようなデータの割り当て方法を
示し,(d) の分散の順序は,分散して配置するセルの順
番などを示す。
【0034】この分散情報ファイル40A,40Bは,
ホスト側ファイルサーバ14が実データアクセス時にデ
ータの分散/合成のために用いるファイルである。ファ
イルをアクセスするユーザタスクは,分散情報ファイル
40A,40Bを意識する必要はない。ホスト側ファイ
ルサーバ14は,ユーザが指定してきたパス名からこの
分散情報ファイル名を例えば事前に設定された変換テー
ブルによって認識する。ファイルがセル10側に分散し
て配置されるファイルである場合には,この分散情報フ
ァイルの情報に基づいて,各セル10のローカルファイ
ルシステムに実体が格納される。
【0035】図5は,図4(A)に示すファイル環境に
おいてホスト側からセル側のファイルB(b0,b1,
b2,…)をリードする場合のファイルサーバの動作フ
ローを示す。
【0036】(1) ホスト側タスクが,実体がセル側にあ
るファイルBのリード要求を出したとする。サイズはn
バイト,読み込みアドレスはAである。 (2) ホスト側ファイルサーバ14は,ファイルBの分散
情報ファイル40Bを読み込む。
【0037】(3) 次に,ホスト側ファイルサーバ14
は,分散情報ファイル40Bから得た分散情報と,nバ
イトの読み込みサイズと,アドレスAとから,各セル側
ファイルサーバ11への要求バイト数,アドレスを算出
し,各セル側ファイルサーバ11へリード要求を出す。
【0038】(4) 各セル側ファイルサーバ11では,ホ
スト側からの要求に基づき,分散されているファイルB
における該当するデータをアクセスし,ホスト側ファイ
ルサーバ14へ送出する。
【0039】(5) ホスト側ファイルサーバ14では,要
求したデータが各セル側から全て送られてきたかを監視
し,送られてきたならば,次のステップ(6) へ進む。 (6) 各セル側ファイルサーバ11から送られてきたデー
タを分散情報に基づいて合成し,要求元のホスト側タス
クが指定したユーザバッファに転送する。
【0040】図6は,図4(A)に示すファイル環境に
おいてホスト側からセル側のファイルBへライトする場
合のファイルサーバの動作フローを示す。 (1) ホスト側タスクが,実体がセル側にあるファイルB
のライト要求を出したとする。サイズはnバイト,書き
込みアドレスはAである。
【0041】(2) ホスト側ファイルサーバ14は,ファ
イルBの分散情報ファイル40Bを読み込む。 (3) 次に,ホスト側ファイルサーバ14は,分散情報フ
ァイル40Bから得た分散情報と,nバイトの書き込み
サイズと,アドレスAとから,各セル側ファイルサーバ
11への書き込みバイト数,アドレスを算出し,分散デ
ータとともに各セル側ファイルサーバ11へライト要求
を送出する。
【0042】(4) 各セル側ファイルサーバ11では,ホ
スト側からの要求に基づき,受信したデータを指定され
たアドレスよりローカルファイルに書き込む。 (5) ホスト側ファイルサーバ14では,各セル側からの
応答を監視し,セル側からすべての書き込み完了応答を
もらったならば,次のステップ(6) へ進む。
【0043】(6) 要求元のユーザタスクに書き込み完了
応答を送り,書き込み処理を終了する。 次にセル側にファイル実体があるローカルファイルを,
セル10がアクセスする場合の例を説明する。分散方法
を変更しない場合には,従来のローカルファイルへのア
クセスと同様であり,各セル側ファイルサーバ11は非
同期にそれぞれ自分が管理するローカルファイルをアク
セスしに行くだけである。したがって,その詳しい説明
は省略し,分散方法を変更する場合の例について説明す
る。
【0044】図7は,図4(A)に示すファイル環境に
おいてセル側に実体があるファイルBを分散方法を変更
してリードアクセスする場合のファイルサーバの動作フ
ローを示す。
【0045】(1) セル側タスクは,実体がセル側にある
ファイルBのリード要求を出すとき,読み込みサイズn
バイトおよび読み込みアドレスAに加えて,再分散情報
を指定する。
【0046】(2) セル側ファイルサーバ11は,ホスト
側ファイルサーバ14にファイルBの分散情報ファイル
40Bを読み込むためのリード要求を出す。 (3) この要求に対し,ホスト側ファイルサーバ14は,
分散情報ファイル40Bの内容を読み込み,セル側ファ
イルサーバ11へ送出する。
【0047】(4) セル側ファイルサーバ11では,ホス
ト側ファイルサーバ14からの応答を監視し,ホスト側
ファイルサーバ14から分散情報を受信したならば,次
のステップへ進む。
【0048】(5) ホスト側ファイルサーバ14から受信
した分散情報,リード要求時に指定された再分散情報,
サイズ,読み込みアドレスから,以下の情報を算出す
る。 ・自ローカルファイルシステムでの読み込みアドレスお
よびサイズ。
【0049】・再分散のため,自ローカルファイルが持
つデータの転送先セルID。 ・再分散のため,自セルがデータを受信する相手の転送
元セルID。 (6) 次にセル側ファイルサーバ11は,自ローカルファ
イルから必要なデータを読み出す。
【0050】(7) 各セル10のセル側ファイルサーバ1
1間でデータの交換(再分散)を行う。 (8) 再分散によって得た読み込み対象データを,セル側
タスクのユーザバッファに転送し,リード要求に対する
処理を終了する。
【0051】図8は,図4(A)に示すファイル環境に
おいてセル側に実体があるファイルBを分散方法を変更
してライトアクセスする場合のファイルサーバの動作フ
ローを示す。
【0052】(1) セル側タスクは,実体がセル側にある
ファイルBのライト要求を出すとき,書き込みサイズn
バイトおよび書き込みアドレスAに加えて,再分散情報
を指定する。
【0053】(2) セル側ファイルサーバ11は,ホスト
側ファイルサーバ14にファイルBの分散情報ファイル
40Bを読み込むためのリード要求を出す。 (3) この要求に対し,ホスト側ファイルサーバ14は,
分散情報ファイル40Bの内容を読み込み,セル側ファ
イルサーバ11へ送出する。
【0054】(4) セル側ファイルサーバ11では,ホス
ト側ファイルサーバ14からの応答を監視し,ホスト側
ファイルサーバ14から分散情報を受信したならば,次
のステップへ進む。
【0055】(5) ホスト側ファイルサーバ14から受信
した分散情報,ライト要求時に指定された再分散情報,
サイズ,書き込みアドレスから,以下の情報を算出す
る。 ・自ローカルファイルシステムでの書き込みアドレスお
よびサイズ。
【0056】・再分散のため,自ローカルファイルが持
つデータの転送先セルID。 ・再分散のため,自セルがデータを受信する相手の転送
元セルID。 (6) 各セル10のセル側ファイルサーバ11間でデータ
の交換(再分散)を行う。
【0057】(7) 次にセル側ファイルサーバ11は,自
ローカルファイルへ必要なデータを書き込む。 (8) 書き込みが終了したならば,要求元のユーザタスク
へ書き込み完了応答を通知し,ライト要求に対する処理
を終了する。
【0058】図9は,図4(A)に示すファイル環境に
おいてホスト側に実体があるファイルAを,セル側から
リードアクセスする場合のファイルサーバの動作フロー
を示す。
【0059】(1) セル側タスクは,実体がホスト側にあ
るファイルAのリード要求を出すとき,読み込みサイズ
nバイトおよび読み込みアドレスAを指定する。 (2) そのリード要求を受けたセル側ファイルサーバ11
は,指定されたサイズおよびアドレス情報を付加して,
ホスト側ファイルサーバ14にファイルAのリード要求
を出す。
【0060】(3) セル側ファイルサーバ11は,リード
要求の後,ホスト側からのデータ受信を待つ。 (4) ホスト側ファイルサーバ14では,このリード要求
に対し,まずファイルAの分散情報ファイル40Aを読
み込む。
【0061】(5) そして,セル側からの読み込みサイズ
・アドレス情報,および分散情報ファイル40Aから得
た分散情報により,ファイルAからデータを読み込む。 (6) ホスト側ファイルサーバ14は,読み込みが終了し
たならば,分散情報に基づいてデータを分散し,各セル
10に転送する。
【0062】(7) セル側ファイルサーバ11では,ホス
ト側ファイルサーバ14から転送されたデータをセル側
タスクのユーザバッファに転送し,リード要求に対する
処理を終了する。
【0063】図10は,図4(A)に示すファイル環境
においてホスト側に実体があるファイルAを,セル側か
らライトアクセスする場合のファイルサーバの動作フロ
ーを示す。
【0064】(1) セル側タスクは,実体がホスト側にあ
るファイルAのライト要求を出すとき,読み込みサイズ
nバイトおよび書き込みアドレスAを指定する。 (2) そのライト要求を受けたセル側ファイルサーバ11
は,指定されたサイズおよびアドレス情報を付加して,
ホスト側ファイルサーバ14にファイルAのライト要求
を出す。
【0065】(3) セル側ファイルサーバ11は,ライト
要求の後,ホスト側からの完了応答の受信を待つ。 (4) ホスト側ファイルサーバ14では,このライト要求
に対し,まずファイルAの分散情報ファイル40Aを読
み込む。
【0066】(5) そして,セル側からの書き込みサイズ
・アドレス情報,および分散情報ファイル40Aから得
た分散情報により,各セル10からのデータを合成し
て,ファイルAに書き込む。
【0067】(6) ホスト側ファイルサーバ14は,書き
込みが終了したならば,各セル10に完了応答を送出す
る。 (7) セル側ファイルサーバ11では,ホスト側ファイル
サーバ14からの完了応答を受信したならば,要求元の
ユーザタスクに完了応答を返し,ライト要求に対する処
理を終了する。
【0068】図11は,分散情報ファイル40の作成方
法の例を示す図である。分散情報ファイル40を,アプ
リケーションプログラムとは別に作成してもよいが,例
えば図11に示すように,アプリケーションプログラム
のソースプログラム60において,コメント文の書式に
よりファイルの分散方法を指定させ,自動並列化のコン
パイラ61により,コンパイル時にそのコメント文の内
容に基づいて自動生成することもできる。すなわち,コ
ンパイラ61が,ソースプログラム60を翻訳してオブ
ジェクトプログラム62を生成するときに,ソースプロ
グラム60中のコメント文の中で指定された分散方法を
解析し,その解析結果を内容とする分散情報ファイル4
0を,システムで指定されたディレクトリに自動生成す
る。このようにすれば,分散情報ファイル40を作成す
る負担も大幅に軽減される。
【0069】図12は,本発明の他の実施例のシステム
構成例を示す。各セル10は,トーラスネットワーク
(T−Net)のネットワーク12に接続され,それぞ
れ1つまたは複数のユーザタスク70が動作できるよう
になっている。ディスク装置21は,ディスクオプショ
ンの入出力用セル20を介して,セル10のいくつかに
接続される。入出力用セル20にセル側ファイルサーバ
11が置かれる。ファイルの実体はホスト計算機13
(図示省略)の管理下にあるディスク装置に置くこと
も,セル側ファイルサーバ11の管理化にあるディスク
装置21に分散して置くことも可能である。システムに
は,1つないしは複数のディレクトリサーバ71が存在
する。このディレクトリサーバ71は,ファイルのパス
名を与えると,そのファイルのアクセス情報(どのディ
スク装置21にファイルの実体がどういう順序で分散さ
れているかなどの情報)を返すものである。各セル10
には,セル側ファイルサーバ11およびディレクトリサ
ーバ71を呼び出すためのライブラリが存在する。
【0070】ファイル実体が各セル10のディスク装置
21に分散されているときの動作の概要は以下のとおり
である。まず,各セル10は必要なファイルをオープン
する。ファイルをオープンする命令がユーザタスク70
で実行されると,そのパス名,アクセスモード,オープ
ンモード等の情報をディレクトリサーバ71へ送る。こ
こで,アクセスモードとは,通常用いられているアクセ
スモードと同じであり,ファイルをreadだけする,
writeする,updateするというようなアクセ
スの種類を指定するものである。オープンモードは,フ
ァイルの分散方法を指示するパラメータである。
【0071】ディレクトリサーバ71は,送られてきた
情報をもとにして,ファイルのオープンが可能と判断す
れば,クライアントである要求元にそのファイルのアク
セス情報(実体がどのディスク装置21にどのように分
散されているかなどの情報)を返す。なお,ユーザタス
ク70には,これらの情報が書かれたテーブルとしてア
クセス情報が返される。このテーブルをファイルディス
クリプタ(file-descriptor)と呼ぶ。
【0072】オープンの命令形式は,例えば次のとおり
である。 fd = open(path,acess-mode,open-mode) ユーザタスクは,この後,ファイルをアクセスする場合
にはこのファイルディスクリプタfdを用いる。ファイ
ルアクセス要求が発生すると,ユーザタスク側のライブ
ラリで,先ほど獲得したファイルのアクセス情報および
ファイルのオープンモードにより,該当するセル側ファ
イルサーバ11にアクセス要求を送出する。
【0073】図12に示すシステムにおいて,各セル1
0のユーザタスク70からアクセス要求を出したときの
アクセス手順のフローチャートを,図13に示す。な
お,この例では,図12に示すようにファイルAの実体
がすべてcell-1のセル配下にあるディスク装置21上に
存在している。
【0074】このアクセスでは,cell-0〜cell-2のセル
10が,以下のオープンモードでファイルAをオープン
し,それぞれデータを2048byte書き込むものと
する。
【0075】・size=2kbyte ・分散方法=round−robin order 以下,このオープンモードをモードM0として説明す
る。
【0076】なお,本システムはSPMDタイプの並列
計算機であり,各セル10(cell-0〜cell-2)は同じ内
容のプログラムを実行する。以下,図13に示す(1) 〜
(7) に従って,動作を説明する。
【0077】(1) セル10のユーザタスク70は,モー
ドM0のオープンモードで,ファイルAをオープンす
る。 (2) ディレクトリサーバ71は,パス名よりファイルA
のiノード(ファイルを管理する制御表)を検索し,フ
ァイルアクセスに必要な情報をユーザタスク70に返
す。また,ファイルAを保持するセル側ファイルサーバ
11にファイルAがオープンされたことを通知する。こ
の際に,アクセス対象ファイルを判別するためのアクセ
ス識別子を,ユーザタスク70およびセル側ファイルサ
ーバ11に通知する。
【0078】(3) ユーザタスク70は,ディレクトリサ
ーバ71から,アクセス識別子と,どのセル側ファイル
サーバ11に必要なファイルが格納されているか等の分
散情報を受け取る。
【0079】(4) また,セル側ファイルサーバ11は,
ファイルAのディスクブロックのアドレス表等が格納さ
れているサブiノードをキャッシュメモリに読み込み,
必要に応じて先行読み出し(pre-fetch) 等を行う。
【0080】(5) その後,ユーザタスク70は,アクセ
ス識別子とバッファアドレスとサイズを指定してライト
命令を発行する。 (6) このライト命令により,アクセス識別子,サイズ等
の情報と,書き込みデータとが,該当するセル側ファイ
ルサーバ11へ送出される。
【0081】(7) セル側ファイルサーバ11では,アク
セス識別子を基に,該当するファイルAの管理情報を取
り出し,その分散情報とオープンモードとにより,該当
領域にデータを書き込む。なお,図12に示す例では,
ファイルAは分散していないが,分散している場合には
分散情報に従って書き込みデータを転送し,該当領域に
書き込む。
【0082】図13に示す処理が実行されると,ファイ
ルシステムに格納されるデータは,図14に示すように
なる。すなわち,サイズが2kbyteで,分散方法が
ラウンドロビンであるため,セル(cell-0)10のユーザ
タスク70−0が書き込んだデータは,ファイルAの先
頭から2kbyteに書き込まれ,セル(cell-1)10の
ユーザタスク70−1が書き込んだデータは,ファイル
Aの次の2kbyteに書き込まれ,セル(cell-2)10
のユーザタスク70−2が書き込んだデータは,さらに
次の2kbyteに書き込まれる。換言すれば,モード
M0のオープンモードでは,ユーザタスク70−0に
は,ファイルAとしてA0−0とA0−1の部分だけが
見え,ユーザタスク70−1には,ファイルAとしてA
1−0とA1−1の部分だけが見え,ユーザタスク70
−2には,ファイルAとしてA2−0とA2−1の部分
だけが見える。
【0083】次に,cell-0〜cell-2のセル10が,以下
のオープンモードでファイルAをオープンし,それぞれ
データを2048バイト読み込むものとする。以下,こ
のオープンモードをモードM1として説明する。
【0084】・size=1kbyte ・分散方法=round−robin order 図15に示す(1) 〜(9) に従って,このモードM1のオ
ープンモードによるアクセス動作を説明する。
【0085】(1) セル10のユーザタスク70は,モー
ドM1のオープンモードで,ファイルAをオープンす
る。 (2) ディレクトリサーバ71は,パス名よりファイルA
のiノード(ファイルを管理する制御表)を検索し,フ
ァイルアクセスに必要な情報をユーザタスク70に返
す。また,ファイルAを保持するセル側ファイルサーバ
11にファイルAがオープンされたことを通知する。こ
の際に,アクセス対象ファイルを判別するためのアクセ
ス識別子を,ユーザタスク70およびセル側ファイルサ
ーバ11に通知する。
【0086】(3) ユーザタスク70は,ディレクトリサ
ーバ71から,アクセス識別子と,どのセル側ファイル
サーバ11に必要なファイルが格納されているか等の分
散情報を受け取る。
【0087】(4) また,セル側ファイルサーバ11は,
ファイルAのディスクブロックのアドレス表等が格納さ
れているサブiノードをキャッシュメモリに読み込み,
必要に応じて先行読み出し(pre-fetch) 等を行う。
【0088】(5) その後,ユーザタスク70は,アクセ
ス識別子とバッファアドレスとサイズを指定してリード
命令を発行する。なお,分散のブロックサイズは1kb
yteであるが,読み出しデータのサイズは,ここでは
2ブロック分の2kbyteであるとする。
【0089】(6) このリード命令により,要求の命令,
アクセス識別子,サイズ等の情報が,該当するセル側フ
ァイルサーバ11へ送出される。 (7) セル側ファイルサーバ11では,アクセス識別子を
基に,該当するファイルAの管理情報を取り出し,その
分散情報とオープンモードとにより,該当領域からデー
タを読み込む。なお,図12に示す例では,前述したよ
うにファイルAは分散していないが,分散している場合
には分散情報に従ってデータの読み込みを該当するセル
側ファイルサーバ11に要求する。
【0090】(8) 読み込みが終了したならば,読み込ん
だデータを分解して該当セル10のユーザタスク70に
送出する。 (9) ユーザタスク70では,受信したデータをユーザバ
ッファに書き込み,リード命令の処理を終了する。
【0091】図15に示す処理の実行により,ファイル
システムから各セル10のユーザタスク70−1〜70
−2に読み出されるデータは,図16に示すようにな
る。すなわち,分散のサイズが1kbyteで,分散方
法がラウンドロビンであり,かつ読み込みサイズが2k
byteであるため,セル(cell-0)10のユーザタスク
70−0には,ファイルAのA0−0とA1−1の部分
が読み込まれ,セル(cell-1)10のユーザタスク70−
1には,ファイルAのA0−1とA2−0の部分が読み
込まれ,セル(cell-2)10のユーザタスク70−2に
は,ファイルAのA1−0とA2−1の部分が読み込ま
れる。換言すれば,モードM1のオープンモードでは,
ユーザタスク70−0には,ファイルAとしてA0−0
とA1−1の部分だけが見え,ユーザタスク70−1に
は,ファイルAとしてA0−1とA2−0の部分だけが
見え,ユーザタスク70−2には,ファイルAとしてA
1−0とA2−1の部分だけが見える。
【0092】さらに,cell-0〜cell-2のセル10が,オ
ープンモードを以下のように変更して,それぞれ102
4byteのデータを書き込むものとする。以下,この
オープンモードをモードM2として説明する。
【0093】・size=1kbyte ・round−robin order 以下,図17に示す(1) 〜(6) に従って,モードM2の
オープンモードによるアクセス動作を説明する。
【0094】(1) セル10のユーザタスク70は,ファ
イルA(アクセス識別子=0)に対するモードM0のオ
ープンモードをモードM2に変更する命令(modif
yaccess mode命令)を出す。
【0095】(2) ディレクトリサーバ71は,自サーバ
で管理しているアクセス識別子=0のファイルAに関す
るオープンモード情報を指定されたモードに変更する。 (3) また,セル側ファイルサーバ11においても,自サ
ーバで管理しているアクセス識別子=0のファイルAに
関するオープンモード情報を修正する。
【0096】(4) その後,ユーザタスク70は,アクセ
ス識別子とバッファアドレスとサイズ(1024byt
e)を指定してライト命令を発行する。 (5) このライト命令により,アクセス識別子,サイズ等
の情報と,書き込みデータとが,該当するセル側ファイ
ルサーバ11へ送出される。
【0097】(6) セル側ファイルサーバ11では,アク
セス識別子を基に,該当するファイルAの管理情報を取
り出し,その分散情報とオープンモードとにより,該当
領域にデータを書き込む。
【0098】図17に示す処理が実行されると,ファイ
ルシステムに格納されるデータは,図18に示すように
なる。すなわち,モードM2のオープンモードでは,分
散のサイズおよび書き込みサイズが1kbyteで,分
散方法がラウンドロビンであるため,セル(cell-0)10
のユーザタスク70−0が書き込んだデータは,図18
に示すファイルAのA0−2の部分に書き込まれ,セル
(cell-1)10のユーザタスク70−1が書き込んだデー
タは,ファイルAのA1−2の部分に書き込まれ,セル
(cell-2)10のユーザタスク70−2が書き込んだデー
タは,さらに次のA2−2の部分に書き込まれる。
【0099】以上の例では,ブロック単位でデータを分
散しているが,例えば10ワード(word)等という
ようなもっと細かい単位で分散することも可能である。
また,アクセス手順の説明では,説明をわかりやすくす
るために,1つのセル側ファイルサーバ11の管理下に
実体が格納されている場合を例に挙げたが,実体が複数
のセル10に分散されている場合にも,分散情報に従っ
たデータ転送により,同様にアクセス可能である。
【0100】図13,図15,図17におけるアクセス
手順の説明で,アクセス識別子と呼んでいたものが,フ
ァイルディスクリプタに相当する。ファイルディスクリ
プタは,ユーザタスク側では次のような情報を持つ。
【0101】(a) どのファイルサーバ群にどのような順
序で実体が格納されているかの情報。 (b) サイズ・分散方法等のオープンモードに関する情
報。
【0102】(c) ファイルのどのアドレスまでリードま
たはライトしたかを示すカレント・アクセスポインタ。 また,セル側ファイルサーバ11側では,ファイルディ
スクリプタとして次のような情報を管理する。
【0103】(a) ユーザタスク側で保持している情報。 (b) ファイルの論理ブロックとディスク装置における実
ブロックとを対応づけるアドレス表。
【0104】本発明は,必ずしもSPMDモデルのプロ
グラムを実行する場合に限らず,一般のプログラミング
モデルの場合にも同様に適用することが可能であり,本
発明によれば柔軟なファイルシステムを実現することが
できる。
【0105】特に,SPMDモデルのプログラムを実行
する場合には,次のような効果がある。 (a) 各セルのユーザタスクは,特に何も意識することな
く,データファイルのうち,必要な部分のみを取り入れ
ることができる。
【0106】(b) 実行セル数,実行タスク,また同じタ
スクでも扱うファイルによってデータ分散方法が異なる
が,各ファイルの分散情報を記憶する分散情報ファイル
の設定によって,任意の分散が可能である。
【0107】(c) また,出力ファイルに関して,各セル
が任意に書き込んだデータファイルを,分散情報ファイ
ルの設定により任意に連続したファイルとして合成し
て,ホスト計算機からのアクセスを可能にすることがで
きる。
【0108】(d) 同時に複数のオープンモードでオープ
ンし,各オープンモードによってローカルファイルとし
てアクセス可能な領域を変えることにより,データ処理
の内容に応じた最適な分散処理を実現することができ
る。例えば,シミュレーション等の処理において,シミ
ュレーション結果のデータを書き込むタスクと,結果を
ディスプレイに表示して可視化するタスクとがある場
合,それぞれ実時間で扱うことのできるデータ量はタス
クによって異なるが,同時に最適なデータ量を単位とし
た分散処理が可能になる。
【0109】(e) また,オープンモードを動的に変える
ことにより,処理ロジックを変更することなく,または
処理ロジックのわずかな変更で,種々の形で分散された
データを各々のセルが柔軟に処理できるようになる。
【0110】
【発明の効果】以上説明したように,本発明によれば,
並列計算機システムにおける分散ファイルシステムにお
いて,各セルへのデータの分散等が自由に変更できるよ
うになる。また,同一のファイルに対して,グローバル
ファイルおよびローカルファイルのそれぞれの特長を活
かしたアクセスが可能になり,分散ファイルシステムに
おけるアプリケーションの処理負担を大幅に軽減するこ
とが可能になる。
【図面の簡単な説明】
【図1】本発明の原理説明図である。
【図2】本発明の原理説明図である。
【図3】本発明のシステム構成例を示す図である。
【図4】本発明の実施例説明図である。
【図5】ホスト側からセル側のファイルをリードする場
合のファイルサーバの動作フローを示す図である。
【図6】ホスト側からセル側のファイルへライトする場
合のファイルサーバの動作フローを示す図である。
【図7】セル側に実体があるファイルを分散方法を変更
してリードアクセスする場合のファイルサーバの動作フ
ローを示す図である。
【図8】セル側に実体があるファイルを分散方法を変更
してライトアクセスする場合のファイルサーバの動作フ
ローを示す図である。
【図9】ホスト側に実体があるファイルをセル側からリ
ードアクセスする場合のファイルサーバの動作フローを
示す図である。
【図10】ホスト側に実体があるファイルをセル側から
ライトアクセスする場合のファイルサーバの動作フロー
を示す図である。
【図11】分散情報ファイルの作成方法の例を示す図で
ある。
【図12】本発明の他の実施例のシステム構成例を示す
図である。
【図13】各セルのユーザタスクからアクセス要求を出
したときのアクセス手順のフローチャートである。
【図14】図13に示すアクセスによりファイルシステ
ムに格納されるデータの例を示す図である。
【図15】各セルのユーザタスクからアクセス要求を出
したときのアクセス手順のフローチャートである。
【図16】図15に示すアクセスによりファイルシステ
ムから読み出されるデータの例を示す図である。
【図17】各セルのユーザタスクからアクセス要求を出
したときのアクセス手順のフローチャートである。
【図18】図17に示すアクセスによりファイルシステ
ムに格納されるデータの例を示す図である。
【図19】従来技術の説明図である。
【符号の説明】
10 セル 11 セル側ファイルサーバ 12 ネットワーク 13 ホスト計算機 14 ホスト側ファイルサーバ 15 分散情報記憶手段 16 他の計算機システム
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 15/16 G06F 3/06 G06F 12/00 545

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】 ホスト計算機と,各々命令実行機能を有
    する複数のセルとがネットワークで結合された並列計算
    機システムにおける分散ファイルシステムにおいて,並列処理の対象となるファイル中のデータを複数の部分
    データに分割して,前記各セルに所定の分散方法および
    分散の順序に従って分散した部分データをそれぞれ格納
    する,前記複数のセルからアクセス可能な複数のセル側
    外部記憶装置と, 前記ホスト計算機に接続され,前記並列処理の対象とな
    るファイル中のデータの,少な くとも前記分散方法および分散の順序に関する分散情報
    を記憶するホスト側外部記憶装置と, 前記ホスト計算機に設けられ,当該ホスト計算機におけ
    るファイルのアクセス要求を処理するホスト側ファイル
    サーバと, 前記各セルに設けられ,当該セルにおけるファイルのア
    クセス要求を処理するセル側ファイルサーバとを備え, 前記ホスト側ファイルサーバは, 前記ホスト計算機においてオープンしたファイルのアク
    セス要求に対し,該アクセス要求で指定された情報と,
    前記ホスト側外部記憶装置に記憶された分散情報とに基
    づき,前記セル側ファイルサーバにアクセス要求を送出
    することにより,前記複数のセルに分散された部分デー
    タをリード時には合成,ライト時には分散して,前記
    ァイル中のデータの全体を1つのファイルとしてリード
    またはライトする処理手段を備え, 前記セル側ファイルサーバは, 前記ホスト計算機から受信したアクセス要求に基づき,
    自セルに分散して割り当てられた前記部分データを格納
    する前記セル側外部記憶装置中の部分データにアクセス
    し,アクセスした結果を前記ホスト計算機へ通知する手
    段と, 自セルにおいてオープンしたファイルのアクセス要求に
    対し,前記ホスト計算機から受信した前記ホスト側外部
    記憶装置に記憶された分散情報に基づき,自セルに分散
    して割り当てられた前記部分データを格納する前記セル
    側外部記憶装置中の部分データにのみアクセスする処理
    手段とを備えたことを特徴とする分散ファイルシステ
    ム。
  2. 【請求項2】 ホスト計算機と,各々命令実行機能を有
    する複数のセルとがネットワークで結合された並列計算
    機システムにおける分散ファイルシステムにおいて, 前記ホスト計算機または他の計算機システムに接続さ
    れ,前記複数のセルによる並列処理の対象となるファイ
    ル中のデータを記憶するファイル記憶装置と, 前記ホスト計算機に接続され,前記ファイル中のデータ
    を複数の部分データに分割して,前記各セルに所定の分
    散方法および分散の順序に従って分散するための少なく
    とも前記分散方法および分散の順序に関する分散情報を
    記憶する分散情報記憶装置と, 前記ホスト計算機に設けられ,当該ホスト計算機におけ
    るファイルのアクセス要求および前記各セルから受信し
    たファイルのアクセス要求を処理するホスト側ファイル
    サーバと, 前記各セルに設けられ,当該セルにおけるファイルのア
    クセス要求を処理するセル側ファイルサーバとを備え, 前記セル側ファイルサーバは, 自セルにおいてオープンした前記ファイルに対するアク
    セス要求を前記ホスト側ファイルサーバへ送出する処理
    手段を備え, 前記ホスト側ファイルサーバは, 前記セルからのファイルのアクセス要求に対し,該アク
    セス要求で指定された情報と,前記分散情報記憶装置
    記憶された分散情報とに基づき,前記アクセス要求元の
    セルに分散して割り当てられた前記ファイル中の部分デ
    ータのみを,アクセス要求の内容に応じてリードまたは
    ライトする処理手段を備えたことを特徴とする分散ファ
    イルシステム。
  3. 【請求項3】 請求項2記載の分散ファイルシステムに
    おいて, 前記分散情報記憶装置に記憶する分散情報を,そのファ
    イルを扱うプログラムのコンパイル時に自動生成する処
    理手段を備えたことを特徴とする分散ファイルシステ
    ム。
  4. 【請求項4】 ホスト計算機と,各々命令実行機能を有
    する複数のセルとがネットワークで結合された並列計算
    機システムにおける分散ファイルシステムにおいて,前記ホスト計算機に接続されるか,または,前記複数の
    セルのいずれかに入出力用のセルを介して接続され,並
    列処理の対象となる データを1つのファイルとして格納
    する1または複数の外部記憶装置と, 前記セル内のユーザタスクからの前記ファイルに対する
    アクセス要求に対して前記外部記憶装置に格納されたフ
    ァイルに対するリードまたはライトのアクセスを処理す
    るセル側ファイルサーバと, 前記ファイル中のデータがどの外部記憶装置にどのよう
    な順番で分散されて格納されているかを示す情報を含む
    ファイルのアクセス情報を保持し,前記セル内のユーザ
    タスクからファイルのオープン時にファイルの指定情報
    が与えられると,指定されたファイルの前記アクセス情
    報とそのファイルを判別するためのアクセス識別子とを
    前記ユーザタスクに返却し,前記アクセス識別子を前記
    セル側ファイルサーバへ通知するディレクトリサーバと
    を備え, 前記セル内のユーザタスクは, 前記ファイルをオープンするときに,ファイルの指定情
    報と,アクセスの種類を指定するアクセスモードと,少
    なくともアクセスするサイズと分散方法とを示すオープ
    ンモードとを指定し,前記オープンモードによって前記
    外部記憶装置に格納されたファイル中のデータの特定部
    分のみをアクセス対象として指定し,前記ディレクトリ
    サーバへファイルの指定情報を送信して前記ディレクト
    リサーバから前記ファイルのアクセス情報とアクセス識
    別子とを受信し,前記セル側ファイルサーバに対して前
    記アクセス識別子とアクセスするデータサイズの情報と
    を含むアクセス要求情報を送信し,前記指定した アクセ
    ス対象の範囲内で前記ファイルに対するアクセスを前記
    セル側ファイルサーバに実行させる処理手段を備えたこ
    とを特徴とする分散ファイルシステム。
  5. 【請求項5】 請求項4記載の分散ファイルシステムに
    おいて,前記複数のセル内の各ユーザタスクは, 前記外部記憶装置に格納された同一のファイルを同時に
    各セルごとに異なる オープンモードでオープンし,それ
    ぞれ自セルのオープンモードに応じて,前記ファイルに
    おけるアクセス対象となる部分データが他のセルと異な
    るアクセスを行う処理手段を備えたことを特徴とする分
    散ファイルシステム。
  6. 【請求項6】 請求項4記載の分散ファイルシステムに
    おいて,前記セル内のユーザタスクは, 前記外部記憶装置に格納された ファイルのオープン後に
    前記オープンモードを変更し,前記ディレクトリサーバ
    と前記セル側ファイルサーバへ変更したオープンモード
    情報を通知する処理手段と, 前記オープンモードの変更により,変更されたアクセス
    対象の範囲内で前記ファイルに対するアクセスを前記セ
    ル側ファイルサーバに実行させる処理手段とを備えた
    とを特徴とする分散ファイルシステム。
JP01342094A 1994-02-07 1994-02-07 分散ファイルシステム Expired - Fee Related JP3488500B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP01342094A JP3488500B2 (ja) 1994-02-07 1994-02-07 分散ファイルシステム
US08/386,061 US5761498A (en) 1994-02-07 1995-02-07 Distribution file system for accessing required portion of file

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP01342094A JP3488500B2 (ja) 1994-02-07 1994-02-07 分散ファイルシステム

Publications (2)

Publication Number Publication Date
JPH07219905A JPH07219905A (ja) 1995-08-18
JP3488500B2 true JP3488500B2 (ja) 2004-01-19

Family

ID=11832647

Family Applications (1)

Application Number Title Priority Date Filing Date
JP01342094A Expired - Fee Related JP3488500B2 (ja) 1994-02-07 1994-02-07 分散ファイルシステム

Country Status (2)

Country Link
US (1) US5761498A (ja)
JP (1) JP3488500B2 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6405255B1 (en) * 1996-07-01 2002-06-11 Sun Microsystems, Inc. Mixing and splitting multiple independent audio data streams in kernel space
US5946685A (en) * 1997-06-27 1999-08-31 Sun Microsystems, Inc. Global mount mechanism used in maintaining a global name space utilizing a distributed locking mechanism
US6047377A (en) * 1997-12-11 2000-04-04 Sun Microsystems, Inc. Typed, parameterized, and extensible access control permissions
US6449757B1 (en) * 1998-02-26 2002-09-10 Micron Technology, Inc. Hierarchical semiconductor design
US6922659B2 (en) * 1998-02-26 2005-07-26 Micron Technology, Inc. Parameter population of cells of a hierarchical semiconductor structure via file relation
US7634453B1 (en) * 1999-08-13 2009-12-15 Storage Technology Corporation Distributed file data location
US6658461B1 (en) * 2000-05-25 2003-12-02 International Business Machines Corporation Method of, system for, and computer program product for providing a user interface for configuring connections between a local workstation file system and a remote host file system
US8145724B1 (en) 2000-05-25 2012-03-27 International Business Machines Corporation Method of, system for, and computer program product for providing a data structure for configuring connections between a local workstation file system and a remote host file system
US8706760B2 (en) 2003-02-28 2014-04-22 Microsoft Corporation Method to delay locking of server files on edit
JP2004280283A (ja) * 2003-03-13 2004-10-07 Hitachi Ltd 分散ファイルシステム、分散ファイルシステムサーバ及び分散ファイルシステムへのアクセス方法
JP4320195B2 (ja) 2003-03-19 2009-08-26 株式会社日立製作所 ファイルストレージサービスシステム、ファイル管理装置、ファイル管理方法、id指定型nasサーバ、および、ファイル読出方法
US8363837B2 (en) * 2005-02-28 2013-01-29 HGST Netherlands B.V. Data storage device with data transformation capability
JP5439236B2 (ja) * 2010-03-12 2014-03-12 株式会社日立製作所 計算機システムおよびアプリケーションプログラムの実行方法
JP5589205B2 (ja) * 2011-02-23 2014-09-17 株式会社日立製作所 計算機システム及びデータ管理方法
CN106933646B (zh) * 2015-12-29 2020-04-14 杭州华为数字技术有限公司 一种创建虚拟机的方法及装置
WO2019082982A1 (ja) * 2017-10-26 2019-05-02 日本電気株式会社 分散処理管理装置、分散処理方法、及びコンピュータ読み取り可能な記録媒体

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4630196A (en) * 1983-04-13 1986-12-16 At&T Information Systems, Inc. Store and forward facility for use in multiprocessing environment
US4819159A (en) * 1986-08-29 1989-04-04 Tolerant Systems, Inc. Distributed multiprocess transaction processing system and method
WO1991017530A1 (en) * 1990-05-01 1991-11-14 Environmental Products Corporation A method of transferring display and print data
US5032979A (en) * 1990-06-22 1991-07-16 International Business Machines Corporation Distributed security auditing subsystem for an operating system
US5497463A (en) * 1992-09-25 1996-03-05 Bull Hn Information Systems Inc. Ally mechanism for interconnecting non-distributed computing environment (DCE) and DCE systems to operate in a network system
CA2110243C (en) * 1992-12-31 1998-08-11 Philip Steven Winterbottom Apparatus and methods for making a portion of a first name space available as a portion of a second name space
US5325530A (en) * 1993-01-29 1994-06-28 International Business Machines Corporation Controller for sequential programming tools executed in a parallel computing environment

Also Published As

Publication number Publication date
JPH07219905A (ja) 1995-08-18
US5761498A (en) 1998-06-02

Similar Documents

Publication Publication Date Title
JP3488500B2 (ja) 分散ファイルシステム
US5842226A (en) Virtual memory management for a microkernel system with multiple operating systems
US5239647A (en) Data storage hierarchy with shared storage level
US7380086B2 (en) Scalable runtime system for global address space languages on shared and distributed memory machines
US8656077B2 (en) Apparatus, method and system for aggregating computing resources
US5771383A (en) Shared memory support method and apparatus for a microkernel data processing system
US5276877A (en) Dynamic computer system performance modeling interface
US5649141A (en) Multiprocessor system for locally managing address translation table
US6505286B1 (en) User specifiable allocation of memory for processes in a multiprocessor computer having a non-uniform memory architecture
US8972695B2 (en) Automatic allocation of data replicas
US7376758B2 (en) I/O dependency graphs
KR20010085568A (ko) 데이터 처리 방법, 데이터 처리 시스템, 및 데이터 처리컴퓨터 프로그램 제품
JP2781092B2 (ja) システム間排他制御方式
Armand et al. Revolution 89 or ‘‘Distributing UNIX Brings it Back to its Original Virtues’’
JPH01144152A (ja) データ処理システムの制御方法
Argile et al. DIME: A shared memory environment for distributed simulation, monitoring and control of urban traffic
Dennis et al. On memory models and cache management for shared-memory multiprocessors
Brightwell et al. Optimizing multi-core MPI collectives with SMARTMAP
Jerger Modeling and Performance Prediction of HDF5 data on Objectstorage
US11455309B2 (en) Partition key adjustment based on query workload
US20230251918A1 (en) Systems and methods for fast and scalable data-intensive computation
JPH0452826A (ja) データ処理システム
McParland Data acquisition at the Bevalac, an example: The HISS facility
Sellappan Response Time Considerations in Realtime Software Design
JPH0926853A (ja) ファイルパーティション拡張方法および装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20031021

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071031

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081031

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081031

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091031

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees