JPH07234845A - 並列計算機における入出力用セルおよび並列計算機システム - Google Patents

並列計算機における入出力用セルおよび並列計算機システム

Info

Publication number
JPH07234845A
JPH07234845A JP6026488A JP2648894A JPH07234845A JP H07234845 A JPH07234845 A JP H07234845A JP 6026488 A JP6026488 A JP 6026488A JP 2648894 A JP2648894 A JP 2648894A JP H07234845 A JPH07234845 A JP H07234845A
Authority
JP
Japan
Prior art keywords
input
data
parallel computer
network
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP6026488A
Other languages
English (en)
Inventor
Kazuichi Oe
和一 大江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP6026488A priority Critical patent/JPH07234845A/ja
Priority to US08/381,396 priority patent/US5712975A/en
Publication of JPH07234845A publication Critical patent/JPH07234845A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/40Bus structure
    • G06F13/4004Coupling between buses
    • G06F13/4022Coupling between buses using switching circuits, e.g. switching matrix, connection or expansion network

Abstract

(57)【要約】 【目的】並列計算機における入出力用セルおよび並列計
算機システムに関し,効率よくI/O資源を利用するこ
とができるようにすることを目的とする。 【構成】複数のI/Oインタフェース17を有し,これら
をまとめて一つのインタフェースとして制御する並列ア
クセスモードと各I/Oインタフェース17を個別に扱う
個別アクセスモードとを切り替えることのできる入出力
制御手段11を設け,RAID的な機能をアクセス対象フ
ァイルによって選択できるようにする。また,データ分
散/合成手段16によってネットワークへデータを送信ま
たはネットワークからデータを受信するときに自動的に
データを分割/合成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は,並列計算機システムに
おいてディスク装置等の外部記憶装置へのアクセス手段
を持つセルに関し,特に,RAID(Redundant Arrays
of Inexpensive Disks) 機能とネットワークに対してデ
ータを送信/受信するときに,自動的にデータを分割/
合成する機能を持つ並列計算機における入出力用セルお
よびそれを用いた並列計算機システムに関するものであ
る。
【0002】
【従来の技術】高並列計算機(MPP)システムでは,
多数の処理装置(これらの一つの処理装置の単位をセル
という)がネットワークを介してデータを授受し,処理
を遂行する。このような高並列計算機で発生する入出力
アクセスパターンは,主に次の二つに分けることができ
る。第1のアクセスパターンは,少数の大きなファイル
に対するアクセスのパターンである。第2のアクセスパ
ターンは,多数の小さなファイルに対するランダムアク
セスのパターンである。
【0003】第1のアクセスパターンでは,I/Oバン
ド幅の大きさが性能上重要となる。一般の計算機システ
ムにおいて,このようなI/Oバンド幅等の問題を解決
する手段として,RAID方式が考案されている。RA
IDは,米カリフォルニア大学のDavid Patt
erson教授らが1987年に発表した方式であり,
ディスク装置を複数使い,データを書き込むときにはそ
れを分割して複数のディスク装置に書き込む。複数のデ
ィスク装置を並列に動作させるので装置全体の性能向上
を図ることができる。また,データ訂正用のパリティを
計算し格納することにより,信頼性を向上させることも
できる。
【0004】RAIDを実用化させた例としては,42
台のディスク装置を並列に並べ,データアクセス時には
これらのディスク装置を同時に動かし,(1台のディス
ク装置の転送レート)×(ディスク装置台数分のI/O
バンド幅)を得ることができるようにしたものがある。
【0005】一方,前記第2のアクセスパターンでは,
ファイルキャッシュヒット率,ディスク・シーク時間お
よびディスク回転待ち時間が性能を左右し,I/Oバン
ド幅はそれほど重要ではなくなる。特に,ファイルキャ
ッシュがヒットしなくなり,ディスク装置へのアクセス
が集中するような場合,かえってI/Oインタフェース
が複数あり,それぞれ独立にディスク装置へアクセスで
きたほうが短時間にデータをアクセスすることができる
と考えられる。しかし,今までのRAIDでは,データ
の合成/分散機能がディスク・コントローラ側にあり,
セル側からは大きな1つのディスク装置にしか見えない
ので,個々のディスク装置をばらばらにアクセスするこ
とはできなかった。
【0006】また,例えば高並列計算機上でSPMD(S
ingle Program Multiple Data)のアプリケーションを実
行する場合であって,特に大きな問題を解く場合などに
は,通常大きなファイルへのアクセスが発生する。この
とき,ディスクの機構としてRAIDが有効になるが,
各セルでは読み込まれたデータの全体が必要になるので
はなく,ある一部分のみが必要になる場合が多い。した
がって,このような場合には,読み込まれたデータを入
出力用セルで分散(ディスク装置へ書き込みを行う場合
には逆に合成)する必要が生じる。しかし,従来技術で
は,このような機能を持つハードウェアは存在せず,も
し実現するとすればマイクロプロセッサ等を用いて逐次
行わなければならないので,そのオーバヘッドが大変大
きかった。
【0007】ところで,一般にディスク装置や磁気テー
プ装置等へのアクセスのためのI/O処理は,時間が長
くかかるので,従来からタスクとI/Oとがオーバーラ
ップして動作するように,さまざまな工夫がなされてき
た。特に,メインフレームでは,IOPというI/O処
理専用のプロセッサを設けているものがある。このIO
Pを用いるシステムでは,CPUでI/O命令が発行さ
れると,CPUはI/O命令をIOPに転送し,その後
はIOPからのI/O命令終了割り込みが発生するま
で,CPUはIOPと独立に動作する。しかし,並列計
算機システムにおいては,多数の処理装置が存在するこ
とからメインフレームで用いられているようなIOPと
のインタフェースが複雑になると考えられ,IOPのよ
うなものは用いられていなかった。
【0008】
【発明が解決しようとする課題】本発明の第1の目的
は,並列計算機システムにおいて,ディスク装置等の外
部記憶装置を複数台並べておき,セルからのアクセス要
求に応じて,全ディスク装置またはいくつかのディスク
装置を並列に動作させてI/Oバンド幅を稼ぐことを可
能にするとともに,個々のディスク装置をばらばらに動
作させることも可能にすることである。
【0009】本発明の第2の目的は,ディスク装置から
データを読み込み,ネットワーク経由で複数のセルにデ
ータを送出する場合に,データを分割して複数のセルに
送出するためのパケットを生成するオーバーヘッドを削
減し,また,ネットワーク経由で複数のセルから受信さ
れたデータをディスク装置に書き込む場合に,データを
合成することにより,ディスク装置に書き込む際のオー
バーヘッドを削減可能にすることである。
【0010】さらに,本発明の第3の目的は,並列計算
機の入出力機構において,セルのユーザタスクとI/O
とがオーバーラップして動作するようにし,I/Oを伴
うユーザタスクの実行時間を短縮することである。
【0011】
【課題を解決するための手段】図1は本発明に係る入出
力用セルの構成例を示す図である。入出力用セル10
は,メモリ13に格納されたファイルサーバプログラム
21の命令をプロセッサ(MPU)12により実行し,
並列計算機における他のセル(図示省略)に対してファ
イルをアクセスする機能を提供する装置である。
【0012】本発明における入出力用セル10は,ディ
スク装置19−0〜19−3等の外部記憶装置に対する
アクセスを制御する入出力制御手段11を持つ。この入
出力制御手段11は,複数のI/Oインタフェース17
−0〜17−3を有し,これらをまとめて一つのインタ
フェースとして制御する並列アクセスモードと各I/O
インタフェース17−0〜17−3を個別に扱う個別ア
クセスモードとを切り替える手段を持ち,これらのI/
Oインタフェース17−0〜17−3に接続される外部
記憶装置へのアクセスを制御する。I/Oスイッチャー
18は,入出力制御手段11の各I/Oインタフェース
17−0〜17−3と,ディスク装置19−0〜19−
3との間の接続を動的に切り替える装置である。
【0013】メモリ13は,プロセッサ12により読み
書き可能なメモリであり,メモリコントローラ15はそ
のメモリ13へのアクセスを制御するコントローラであ
る。また,メモリコントローラ15は,パケットヘッダ
を解析し,パケットの受信/送信を制御する手段を持
つ。ドライバ14は,ネットワーク等を介して他の装置
との間でデータを送受信する回路である。
【0014】データ分散/合成手段16は,入出力制御
手段11を介して読み込んだデータをネットワークに送
出するときに,指定されたストライド数およびストライ
ド幅に応じてデータを分散してネットワークに送出する
手段と,ネットワークから受信したデータを入出力制御
手段11を介してディスク装置19−0〜19−3に書
き込むときに,データを合成して書き込む手段を持つ。
【0015】入出力用セル10は,ネットワークに接続
される通常のセルの配下に付加される。最大で全セルに
接続することが可能である。または,外部記憶装置への
直接的な入出力機能を持たない通常のセルとは独立し
て,通常のセルと同レベルでネットワークに接続され
る。
【0016】
【作用】入出力制御手段11は,複数のI/Oインタフ
ェース17−0〜17−3を利用して,これらをまとめ
て一つのインタフェースとして制御する並列アクセスモ
ードと各I/Oインタフェース17−0〜17−3を個
別に扱う個別アクセスモードとを切り替える手段を持つ
ので,このアクセスモードを設定することによって,複
数のディスク装置19−0〜19−3をRAID的に同
時に並列にアクセスすることも,各ディスク装置19−
0〜19−3に対して通常のディスクアクセスと同様に
個別にアクセスすることも可能である。
【0017】したがって,少数の大きなファイルをアク
セスする場合と,多数の小さなファイルをランダムにア
クセスする場合の両方に関して,効率よくI/O資源を
利用することができるようになる。
【0018】また,ディスク装置19−0〜19−3か
ら読み込んだデータを分割し,パケットヘッダを付加す
るなどして,他のセルへ送出でき,さらに複数のセルか
ら受信したデータを合成してディスク装置19−0〜1
9−3に書き込むことが可能なハードウェアとして,デ
ータ分散/合成手段16を有するので,例えばSPMD
(Single Program Multiple Data)タイプのアプリケーシ
ョンでのI/Oに関して, データを高速に各セルに転送
したり,ディスク装置19−0〜19−3に書き込んだ
りすることができるようになる。
【0019】入出力用セル10上にファイルサーバを構
築し,I/O処理を専用に行うように構成できるので,
通常のセルはI/O命令を発行することにより,入出力
用セル10に命令を転送し,その後は入出力用セル10
からの応答があるまで単独で動作可能である。したがっ
て,通常のセルのユーザタスクの動作とI/O動作とを
時間的にオーバーラップさせ,I/Oの無駄な待ち時間
を実質的に短縮することが可能になる。
【0020】
【実施例】図2は,本発明の実施例におけるRAID機
能説明図である。入出力制御手段11は,ディスク・ア
レイ方式の一つとして知られているRAID機能(RA
ID facility)を持つ。RAID機能では,データ1,
2,3,…の並びからなるファイルデータ30を,ディ
スク装置19−0〜19−3に各々ファイルデータ31
−0〜31−3として分散して書き込む。書き込み動作
および読み出し動作は,複数のディスク装置19−0〜
19−3について並列に行われる。なお,図示Pのデー
タは,エラー訂正用のパリティ・データである。
【0021】また,入出力制御手段11は,多数の小さ
なファイルをランダムにアクセスするようなケースでは
各ディスク装置19−0〜19−3を個別にアクセスで
きるように,各I/Oインタフェース17−0〜17−
3を個別に制御する機能を持つ。RAID機能を利用し
てアクセスするモードを,ここでは並列アクセスモード
といい,個別にディスク装置19−0〜19−3にアク
セスするモードを個別アクセスモードという。これらの
機能は,入出力制御手段11内の制御レジスタによって
切り替え可能になっている。
【0022】この例では,1台の入出力用セル10に4
台のディスク装置19−0〜19−3が接続されている
が,もちろん複数台であれば4台より少なくても多くて
もよい。
【0023】図3は入出力制御手段11の構成例を示
す。入出力制御手段11は,個別アクセスモード制御機
構40と,並列アクセスモード制御機構41とからな
る。I/Oプロトコルコントローラ46−0〜46−3
(IPC0〜IPC3)は,ディスク装置とのインタフ
ェースを制御するコントローラであって,図1に示すI
/Oインタフェース17−0〜17−3に対応するもの
である。制御レジスタ42−0〜42−3は,I/Oプ
ロトコルコントローラ46−0〜46−3に対するイン
タフェースレジスタであって,図1に示すプロセッサ1
2は,ここに制御情報を書き込むことによって,ディス
ク装置19−0〜19−3のインタフェースを個々に制
御する。制御レジスタ43−0〜43−3は,I/Oプ
ロトコルコントローラ46−0〜46−3に対するDM
Aインタフェースであって,プロセッサ12は,ここを
セットすることによってディスク装置19−0〜19−
3とのデータのDMA転送を制御する。
【0024】RAID制御回路44は,RAID機能を
実現する制御回路である。リングバッファ45−0〜4
5−3(RB0〜RB3)は,ディスク装置19−0〜
19−3を並列に使う場合にデータを一時的に蓄えるた
めのバッファである。ディスク装置19−0〜19−3
からリードする場合,RAID制御回路44は,ディス
ク装置19−0〜19−3から同時にリードされてリン
グバッファ45−0〜45−3に一時的に蓄えられたデ
ータを合成して,ローカルバス20へ送出する。また,
ディスク装置19−0〜19−3にライトする場合,R
AID制御回路44は,ローカルバス20から送られて
きたデータを分解して各リングバッファ45−0〜45
−3に蓄え,ディスク装置19−0〜19−3に並列に
書き込む。データのエラー訂正機能を持たせる場合に
は,RAID制御回路44内にECCのデコーダ/エン
コーダを設ける。
【0025】各ディスク装置19−0〜19−3をばら
ばらにアクセスする場合には,制御レジスタ42−0〜
42−3,43−0〜43−3を用いて,各々のディス
ク装置を制御する。各ディスク装置19−0〜19−3
を同時にアクセスする場合には,RAID制御回路44
を用いて一斉にアクセスする。
【0026】次に,データ分散/合成手段16につい
て,図4に示す実施例に従って説明する。データ分散/
合成手段16は,送信用リングバッファ50,受信用リ
ングバッファ51,ストライド送受信制御部52および
各種インタフェース・レジスタ53,54,55,56
を持つ。ストライド送受信制御部52は,内部にDMA
機構を持ち,以下のような動作を実現する。
【0027】入出力制御手段11を介してディスク装置
19−0〜19−3から読み込んだデータを,メモリ1
3またはネットワークに転送する場合,あらかじめ設定
された情報に従って,まずメモリ13または送信用リン
グバッファ50にデータを転送する。特に,送信用リン
グバッファ50に転送する場合には,あらかじめ指定さ
れたメモリ13上のアドレスPm1に書いてあるパケッ
トヘッダ(header0)を最初に転送した後,データを転送
する。次に,送信用リングバッファ50への転送が完了
した時点,または,ある程度転送が進んだ時点で,メモ
リコントローラ15を起動し,ドライバ14を介して順
番にデータをネットワークへ送出する。ここで,ある程
度転送が進んだ時点とは,ディスク装置からの転送が終
了する前に,メモリコントローラ15が送信用リングバ
ッファ50に蓄えられているデータをすべて転送し切っ
てしまわないほど十分なデータ量の転送が進んだ時点を
いう。送信用リングバッファ50は,ディスク装置の転
送速度とネットワークの転送速度との差を吸収すること
を目的としている。
【0028】一方,メモリ13上のデータまたはネット
ワークから受信用リングバッファ51に書き込まれたデ
ータを,ディスク装置へ書き込む場合には,ストライド
送受信制御部52は,あらかじめ設定された情報に従
い,指定されたパケット全てが受信された時点で,入出
力制御手段11のディスクインタフェースを起動し,起
動が完了すると,ストライドDMAを使って,メモリ1
3または受信用リングバッファ51に書き込まれている
データをディスク装置へ転送する。なお,受信したパケ
ットをメモリ13へ書き込むか受信用リングバッファ5
1に書き込むかは,メモリコントローラ15がパケット
ヘッダをデコードして判定する。
【0029】以上の機能をサポートするために,プロセ
ッサ12に対しインタフェース・レジスタ53〜56を
提供し,これらへの設定を基にストライド送受信制御部
52は動作する。
【0030】レジスタ53は,ストライド毎のサイズ設
定レジスタであって,各ストライドの幅(バイト数)が
設定される。レジスタ54は,カウンタレジスタであっ
て,転送する全データ量が設定される。レジスタ55
は,ポインタレジスタであり,データを読み込むまたは
書き込むポインタ,またはパケットヘッダを指すポイン
タが格納される。メモリ13にデータを書き込むかまた
はネットワークに送出するかは,状態設定レジスタ56
で判定する。また,ストライドする数も状態設定レジス
タ56で判定する。
【0031】状態設定レジスタ56には,以下の情報が
設定される。 ストライド数, 各々のストライドでメモリ13に書き込むか,また
はネットワークに送出するかを示す情報, ディスク装置へのストライドか,またはメモリ13
/ネットワークへのストライドかを示す情報。
【0032】ディスク装置へのストライドが指定される
と,pointer0のレジスタ55は,メモリ13またはネッ
トワークへのポインタを表し,pointer1〜pointer9のレ
ジスタ55は,ディスクブロックを表す。一方,状態設
定レジスタ56においてメモリ13/ネットワークへの
ストライドが指定されると,pointer0のレジスタ55
は,ディスクブロックを表し,pointer1〜pointer9のレ
ジスタ55は,メモリポインタとなる。
【0033】図5は,データ分散/合成手段16による
データ分散/合成の例を示す。ここでは,cell0,cell
16, cell32の3台のセルに割り当てられたローカルファ
イルを,入出力用セル10が扱う場合の例を示してい
る。ディスク装置(1台でも複数台でもよい)における
データの配置は,図5(A)に示すようになっている。
A0は,cell0のローカルファイル,A16は,cell16
のローカルファイル,A32は, cell32のローカルファ
イルとして管理されている。
【0034】各cell0,cell16, cell32からのデータの
書き込み要求があると,入出力用セル10のファイルサ
ーバは,データ分散/合成手段16を用いて,図5
(C)に示すように各セルから送られてきたデータを,
図5(B)に示すように入出力用セル10のメモリ13
または受信用リングバッファ51において合成し,ディ
スク装置にあたかも一つのファイルであるかのように格
納する。
【0035】また,各cell0,cell16, cell32からのデ
ータの読み出し要求があると,入出力用セル10のファ
イルサーバは,データ分散/合成手段16を用いて,図
5(B)に示すように,ディスク装置から入出力用セル
10のメモリ13または受信用リングバッファ51に読
み出したデータを,図5(C)に示すように各セル毎に
分散させて,各々のローカルファイル分をメモリコント
ローラ15およびドライバ14を介して転送する。
【0036】図6および図7は,本発明の実施例におけ
るファイルサーバの処理説明図である。各セルからのリ
ード要求に対して,ファイルサーバは図6に示すように
処理する。まず,ステップ61において,リード要求を
受け付ける。リード要求のパケットでは,ファイル名,
分散情報が指定される。分散情報として,ステート,1
回のデータサイズ,カウンタ(全バイト数)がある。ス
テートとしては,この例ではメモリまたはネットワーク
へのストライド,ポインタ毎のメモリとネットワーク,
先頭からの有効ポインタ数などの情報がある。これら
を,図4に示すレジスタ53〜56に設定し,データ分
散/合成手段16を起動する。ステップ62では,ディ
スクからデータサイズで指定されたバイト数を取り出
す。なお,ファイルの属性に応じて,RAID機能を用
いて並列アクセスモードでアクセスすることも,個別ア
クセスモードでアクセスすることもある。
【0037】ステップ63では,ステートを参照してメ
モリ13への読み出しかネットワークへの送出かを判定
する。メモリの場合にはステップ64を実行し,ネット
ワークの場合にはステップ65を実行する。ステップ6
4では,ポインタの指すメモリアドレスに読み出したデ
ータを書き込む。ステップ65では,パケットヘッダを
付加してパケットを作成し,ネットワークへ送出する。
ステップ66の判定により,以上のステップ62〜65
を全バイト数が終了するまで繰り返す。
【0038】各セルからのライト要求に対しては,ファ
イルサーバは図7に示すように処理する。まず,ステッ
プ71において,ライト要求を受け付ける。ライト要求
のパケットでは,ファイル名,分散情報が指定される。
分散情報として,ステート,1回のデータサイズ,カウ
ンタ(全バイト数)がある。ステートとしては,この例
ではメモリまたはネットワークへのストライド,ポイン
タ毎のメモリとネットワーク,先頭からの有効ポインタ
数などの情報がある。これらを,図4に示すレジスタ5
3〜56に設定し,データ分散/合成手段16を起動す
る。ステップ72では,ステートを参照してメモリ13
からの書き込みかネットワークからの書き込みかを判定
する。メモリの場合にはステップ73を実行し,ネット
ワークの場合にはステップ74を実行する。ステップ7
3では,ポインタの指すメモリアドレスからデータを取
り出して,ディスク装置への書き込みを行う。ステップ
74では,受信したパケットからデータを取り出して,
ディスク装置への書き込みを行う。ステップ75の判定
により,以上のステップ72〜74を全バイト数が終了
するまで繰り返す。
【0039】図6および図7はメモリまたはネットワー
クへのストライドの場合の例を示しているが,ディスク
装置へのストライドの場合も同様に処理可能である。図
8は,I/Oスイッチャー18の構成例を示す。
【0040】I/Oスイッチャー18は,上位側ポート
80−0〜80−3と,各ディスク装置19−0〜19
−3に接続される下位側ポート81−0〜80−3と,
これらの間を切り替えるスイッチ回路82とからなる。
上位側ポート80−0〜80−3は,それぞれ図1に示
すI/Oインタフェース17−0〜17−3に接続され
る。これによって,I/Oインタフェース17−0〜1
7−3と,ディスク装置19−0〜19−3との動的結
合が可能になっている。なお,ここでは4台のディスク
装置19−0〜19−3が接続可能なものを示している
が,もちろん4台に限られるわけではなく,何台でも同
様に構成することができる。
【0041】図9は,本発明の実施例によるシステム構
成例を示す。本発明による入出力用セル10を用いた並
列計算機システムの実現方式として,例えば図9(A)
に示す構成例と,図9(B)に示す構成例が考えられ
る。図中,10−0〜10−3は本発明に係る入出力用
セル(I/O cell),90はトーラスネットワーク等
のネットワーク,91−0〜91−n,92−0〜92
−nは通常のプロセッサを持つセル,19−0〜19−
7はディスク装置を表す。
【0042】図9(A)に示すシステムでは,入出力用
セル10−0,10−1は,通常のセル91−0,91
−1等にオプションとして付加され,ディスク装置19
−0〜19−7へのアクセスを行う。入出力用セル10
−0,10−1におけるネットワーク90へのドライバ
等は,入出力用セル10−0,10−1の各々が接続さ
れる通常のセル91−0,91−1と共有する。
【0043】図9(B)に示すシステムは,各入出力用
セル10−2,10−3を,通常のセル92−0〜92
−nとは独立して,ネットワーク90に接続したシステ
ムである。入出力用セル10−2,10−3におけるネ
ットワーク90へのドライバ等は,通常のセル91−
0,91−1と同様に専用で持つ。
【0044】
【発明の効果】以上説明したように,本発明によれば,
複数のI/OインタフェースをまとめてRAID的に使
うことも,またそれぞれのディスク装置に個別にアクセ
スすることも可能であるので,少数の大きなファイルを
アクセスする場合と,多数の小さなファイルをランダム
にアクセスする場合の両方について,効率よくI/O資
源を活用することができるようになる。また,SPMD
タイプのアプリケーションプログラム等において,I/
Oデータを高速に各セルに転送したり,ディスク装置に
書き込んだりすることができるようになる。さらに,入
出力用セル上にファイルサーバを構築することにより,
通常のセルで動作するユーザタスクの処理と,I/O処
理とをオーバーラップさせる機会を増やし,全体として
の性能を向上させることができるようになる。
【図面の簡単な説明】
【図1】本発明に係る入出力用セルの構成例を示す図で
ある。
【図2】本発明の実施例におけるRAID機能説明図で
ある。
【図3】本発明の実施例における入出力制御手段の構成
例を示す図である。
【図4】本発明の実施例におけるデータ分散/合成手段
の構成例を示す図である。
【図5】データ分散/合成手段によるデータ分散/合成
の例を示す図である。
【図6】ファイルサーバによる処理の例を説明する図で
ある。
【図7】ファイルサーバによる処理の例を説明する図で
ある。
【図8】本発明の実施例におけるI/Oスイッチャーの
構成例を示す図である。
【図9】本発明の実施例によるシステム構成例を示す図
である。
【符号の説明】
10 入出力用セル 11 入出力制御手段 12 プロセッサ 13 メモリ 14 ドライバ 15 メモリコントローラ 16 データ分散/合成手段 17−0〜17−3 I/Oインタフェース 18 I/Oスイッチャー 19−0〜19−3 ディスク装置 20 ローカルバス 21 ファイルサーバプログラム

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 それぞれ命令実行機能を有する複数のセ
    ルがネットワークで結合された並列計算機における入出
    力用セル(10)であって,複数のI/Oインタフェース(1
    7)を有し,これらをまとめて一つのインタフェースとし
    て制御する並列アクセスモードと各I/Oインタフェー
    ス(17)を個別に扱う個別アクセスモードとを切り替える
    手段を持ち,これらのI/Oインタフェース(17)に接続
    される外部記憶装置(19)へのアクセスを制御する入出力
    制御手段(11)と,少なくとも前記入出力制御手段(11)に
    よってアクセス制御される外部記憶装置(19)のファイル
    に対するアクセス機能を他のセルに対して提供するファ
    イルサーバが動作するプロセッサ(12)と,そのプロセッ
    サ(12)により読み書き可能なメモリ(13)と,そのメモリ
    (13)へのアクセスを制御するメモリコントローラ(15)
    と,他の装置との間でデータを送受信するドライバ(14)
    とを備えたことを特徴とする並列計算機における入出力
    用セル。
  2. 【請求項2】 請求項1記載の並列計算機における入出
    力用セル(10)において,前記入出力制御手段(11)を介し
    て読み込んだデータをネットワークに送出するときに,
    指定されたストライド数およびストライド幅に応じてデ
    ータを分散してネットワークに送出するデータ分散手段
    を備えたことを特徴とする並列計算機における入出力用
    セル。
  3. 【請求項3】 請求項1または請求項2記載の並列計算
    機における入出力用セル(10)において,前記ネットワー
    クから受信したデータを前記入出力制御手段(11)を介し
    て外部記憶装置(19)に書き込むときに,データを合成し
    て外部記憶装置(19)に書き込むデータ合成手段を備えた
    ことを特徴とする並列計算機における入出力用セル。
  4. 【請求項4】 請求項1,請求項2または請求項3記載
    の入出力用セル(10)を,ネットワークに接続される通常
    のセルの配下に付加したことを特徴とする並列計算機シ
    ステム。
  5. 【請求項5】 請求項1,請求項2または請求項3記載
    の入出力用セル(10)を,通常のセルとは独立して通常の
    セルと同レベルでネットワークに接続したことを特徴と
    する並列計算機システム。
JP6026488A 1994-02-24 1994-02-24 並列計算機における入出力用セルおよび並列計算機システム Withdrawn JPH07234845A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP6026488A JPH07234845A (ja) 1994-02-24 1994-02-24 並列計算機における入出力用セルおよび並列計算機システム
US08/381,396 US5712975A (en) 1994-02-24 1995-01-31 Input/output cell in parallel computer and parallel computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6026488A JPH07234845A (ja) 1994-02-24 1994-02-24 並列計算機における入出力用セルおよび並列計算機システム

Publications (1)

Publication Number Publication Date
JPH07234845A true JPH07234845A (ja) 1995-09-05

Family

ID=12194895

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6026488A Withdrawn JPH07234845A (ja) 1994-02-24 1994-02-24 並列計算機における入出力用セルおよび並列計算機システム

Country Status (2)

Country Link
US (1) US5712975A (ja)
JP (1) JPH07234845A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6697905B1 (en) * 2000-04-13 2004-02-24 International Business Machines Corporation Apparatus for providing I/O support to a computer system and method of use thereof
WO2002015018A1 (en) * 2000-08-11 2002-02-21 3Ware, Inc. Architecture for providing block-level storage access over a computer network
US20040019741A1 (en) * 2002-07-23 2004-01-29 Pratt Thomas L. Selectable internal RAID system

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5191651A (en) * 1987-11-03 1993-03-02 International Business Machines Corporation Apparatus and method for making of interconnected processors act like a single node in a multinode communication system
US5410650A (en) * 1990-09-28 1995-04-25 Fujitsu Limited Message control system for data communication system

Also Published As

Publication number Publication date
US5712975A (en) 1998-01-27

Similar Documents

Publication Publication Date Title
US20230185747A1 (en) Presentation of direct accessed storage under a logical drive model
US6401149B1 (en) Methods for context switching within a disk controller
EP0426184B1 (en) Bus master command protocol
US6385681B1 (en) Disk array control device with two different internal connection systems
US6330626B1 (en) Systems and methods for a disk controller memory architecture
US5978856A (en) System and method for reducing latency in layered device driver architectures
CN106021147B (zh) 在逻辑驱动器模型下呈现直接存取的存储设备
EP0797151B1 (en) Computer apparatus and bus control scheme
EP0795812B1 (en) Disk array controller and disk array device
WO1993013478A1 (en) Method for improving partial stripe write performance in disk array subsystems
JPH07282025A (ja) クロック回路
US6889266B1 (en) Method for delivering packet boundary or other metadata to and from a device using direct memory controller
WO1992015053A1 (en) Data transfer within a data storage subsystem
US6513098B2 (en) Method and apparatus for scalable error correction code generation performance
JPH07234845A (ja) 並列計算機における入出力用セルおよび並列計算機システム
EP1188106B1 (en) Systems and methods for a disk controller memory architecture
CA2126754A1 (en) Method for performing disk array operations using a nonuniform stripe size mapping scheme
JP2981711B2 (ja) ディスク記憶装置
US6145043A (en) Boolean and movement accelerator
JP3684902B2 (ja) ディスクアレイ制御装置
Chang et al. The designs of RAID with XOR engines on disks for mass storage systems
JP2994917B2 (ja) 記憶システム
JP2854471B2 (ja) ディスクアレイ装置
WO1992015058A1 (en) Data storage subsystem
JPH06250965A (ja) 入出力制御装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20010508