JP2004164586A - 疎結合計算機システム - Google Patents

疎結合計算機システム Download PDF

Info

Publication number
JP2004164586A
JP2004164586A JP2003206387A JP2003206387A JP2004164586A JP 2004164586 A JP2004164586 A JP 2004164586A JP 2003206387 A JP2003206387 A JP 2003206387A JP 2003206387 A JP2003206387 A JP 2003206387A JP 2004164586 A JP2004164586 A JP 2004164586A
Authority
JP
Japan
Prior art keywords
disk
shared data
computer
shared
request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003206387A
Other languages
English (en)
Inventor
Masahiko Yamauchi
雅彦 山内
Satoshi Yoshizawa
聡 吉沢
Hideki Murayama
秀樹 村山
Takehisa Hayashi
剛久 林
Akira Kito
昭 鬼頭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2003206387A priority Critical patent/JP2004164586A/ja
Publication of JP2004164586A publication Critical patent/JP2004164586A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Multi Processors (AREA)

Abstract

【課題】プロセッサが接続機構を介して共用ハードディスクを直接制御でき、高性能なハードディスク共有が可能な疎結合計算機システムを構成する。
【解決手段】疎結合計算機システムは、計算機100−1〜Nが、計算機結合機構140によって相互に結合されて構成される(Nは自然数とする以下同様)。計算機100−1〜Nは、プロセッサ101、メモリ102、I/O装置103、ディスク制御機構104、計算機結合網アダプタ130、ディスク要求処理部110がシステムバス105に結合し、ディスク106−1〜Nがディスク制御機構104に接続して構成される。ディスク要求処理部110は、必要に応じて計算機アダプタ105及び計算機結合機構140を介してディスク要求処理部110間の通信を行い、プロセッサ101からの処理要求を対応するディスク制御機構104に要求する。
【選択図】図1

Description

【0001】
【産業上の利用分野】
本発明は、計算機システムを相互に結合して構成された疎結合計算機システムに関する。
【0002】
【従来の技術】
疎結合計算機システムでは、データを共有するためにハードディスクを共有するシステムが提案されている。ハードディスクを共有するためには、複数のハードディスク制御装置と共有対象となるハードディスクを接続する接続機構が必要である。例えば、文献「ナンシー ピー.クローネンバーグ他、ザ バックスクラスター コンセプト:アン オーバービュー オブ ア ディストリビューテッド システム、7〜21頁、デジタル テクニカル ジャーナル、No.5、1987年9月、デジタル イクイップメント コーポレーション」(Nancy P. Kronenberg et.al, The VAXcluster Concept: An Overview of a Distributed System,pp7−21, Digital Technical Journal,No.5 September 1987 Digital Equipment Corporation)やANSIにて標準化が進んでいるFibre ChannelのSCSI(Small Computer System Interface)Profileによるハードディスク共有が文献「ロバート スニーブリー、インプリメンティング ア ファイバーチャネル スカジ トランスポート、78〜82頁、コンプコン、春 94」(Robert Snively, Implementing a Fibre Channel SCSI Transport, pp78−82,COMPCON, Sping 94)がある。
【0003】
また、疎結合計算機システムにおいて、RPC(Remote Procedure Call)によりファイル共用を実現する手段としてNFS(Network File System)「ジョージ エフ コーロリス他、分散システムコンセプトとデザイン、391〜407頁」(George F.Coulouris et. al, DISTRIBUTED SYSTEMS,pp391−407,1991)などがある。
【0004】
【発明が解決しようとする課題】
Fibre Channelでは、共有ハードディスクにアクセスする際には必ず接続機構を介する必要があるため、接続機構に対するアクセスが増加することにより性能低下を招くという問題があった。
【0005】
また、NFS(Network File System)は、他のプロセッサに処理を代行させる方式であり、処理の代行要求を行うためにRPCによるプロセッサ間の通信を行うためにソフトオーバヘッドが増加し、性能が低いという問題があった。
【0006】
本発明の目的は、プロセッサが接続機構を介して共用ハードディスクを直接制御でき、高性能なハードディスク共有が可能な疎結合計算機システムを構成することである。
【0007】
【課題を解決するための手段】
本発明では、ソフトウエアからの要求先となるハードディスクを判定する要求先判定部を持ち、対応するハードディスクに対する処理を要求するハードディスク要求処理部を持ち、ハードディスクの接続するバスとリモートアクセスのための接続機構の間の処理要求を必要に応じて転送する遠隔ディスク制御部を持ち、ハードディスクアクセス要求があるプロセッサがハードディスクを直接制御することができる構成とする。
【0008】
【作用】
本発明によれば、共有されるハードディスクへのアクセスであっても、特定の計算機からのアクセスについては、接続機構に対するアクセスが発生せず、要求の発生したプロセッサがハードディスクを直接制御できる。
【0009】
【実施例】
以下図を用いて本発明の実施例を説明する。
【0010】
図1に実施例の一つを示す。疎結合計算機システムは、計算機(100−1から100−N)が、計算機結合機構140によって相互に結合されて構成される(Nは自然数とする以下同様)。計算機(100−1から100−N)は、プロセッサ101、メモリ102、I/O装置103、ディスク制御機構104、計算機結合網アダプタ130、ディスク要求処理部110がシステムバス105に結合し、ディスク(106−1から106−N)がディスク制御機構104に接続して構成される。プロセッサ101は、例えばCPUによって構成できる。メモリ102は、例えばRAMによって構成できる。I/O装置103は、入出力をするための装置であり、例えばディスプレイ装置、キーボード、ハードディスク等の二次記憶によって構成される。I/O装置103は、計算機結合網アダプタ130による通信処理によって入出力機能を代替する構成の場合は、計算機(100−1から100−N)の要素として含まれない場合もある。
【0011】
ディスク制御機構104は、ディスク要求処理部110からの処理要求に対してディスク(106−1から106−N)を制御する機構であり、たとえば、TTL、CMOS等の論理によって構成できる。ディスク(106−1から106−N)は、ハードディスク等の二次記憶によって構成できる。
【0012】
計算機結合網アダプタ130は、計算機(100−1から100−N)と計算機結合機構140とを相互に結合し、プロセッサ101及びディスク要求処理部110の指示によりデータの送受信処理を行なう部分であり、たとえば、TTL、CMOS等の論理によって構成できる。
【0013】
計算機結合機構140は、計算機(100−1から100−N)を結合して相互通信をするための結合網であり、たとえば、TTL、CMOS等の論理によって構成できる。
【0014】
ディスク要求処理部110は、必要に応じて計算機アダプタ105及び計算機結合機構140を介してディスク要求処理部110間の通信を行い、プロセッサ101からの処理要求を対応するディスク制御機構104に要求する。ディスク要求処理部110がディスク制御機構104に対する処理要求を代行して要求することにより、プロセッサ101は、すべてのディスク(106−1から106−N)に対するアクセスを同一のアクセス制御手順にて制御可能となる。また、共有が必要な場合のみディスク(106−1から106−N)の共有ができるために、計算機結合機構140が性能ネックになることを避けることができる。
【0015】
次に、ディスク要求処理部110の詳細を説明する。ディスク要求処理部110は、同一計算機内のプロセッサ101による処理要求と、計算機結合機構140を介して接続されている計算機(100−1から100−N)からの遠隔処理要求との2種類の処理要求を受け、同一計算機内のディスク制御機構104に対する制御と、計算機結合機構140を介して接続されている計算機(100−1から100−N)に対する遠隔制御要求の発行の2種類の制御処理を行う。ディスク要求処理部110は、要求制御部111、要求許否判定部112、要求先判定部113、構成定義情報保持部114、ディスク制御機構共用制御部115、リモートディスク制御部120が内部バス116に接続して構成される。
【0016】
要求制御部111は、ディスク制御機構104に対する同一計算機内のプロセッサ101による処理要求と、計算機結合機構140を介して接続されている計算機からの遠隔処理要求を受け付けて、制御を行う部分であり、たとえば、TTL、CMOS等の論理によって構成できる。
【0017】
要求許否判定部112は、構成定義情報保持部114に保持された構成定義情報に基づいて、ディスク要求処理部110に対して要求された処理の許否を判定する処理を行う部分であり、たとえば、TTL、CMOS等の論理によって構成できる。
【0018】
要求先判定部113は、構成定義情報保持部114に保持された構成定義情報に基づいて、ディスク要求処理部110に対して要求された処理をどの計算機のどのディスクに対する処理であるかを判定する部分であり、たとえば、TTL、CMOS等の論理によって構成できる。
【0019】
構成定義情報保持部114は、ディスク要求処理部110に対して要求された処理がどの計算機のどのディスクに対応するか、処理の要求者が対応するディスクに対するアクセスの権利(アクセス権)を持っているか、セキュリティを向上させるためのパスワード等の構成定義情報を保持する部分であり、例えばRAMや電気的に書換可能なROM等によって構成できる。
【0020】
ディスク制御機構共用制御部115は、ディスク制御機構104に対する同一計算機内のプロセッサ101による処理要求と、計算機結合機構140を介して接続されている計算機からの遠隔処理要求との2種類の処理要求の間の調停を行う部分であり、たとえば、TTL、CMOS等の論理によって構成できる。
【0021】
遠隔ディスク制御部120は、計算機結合機構140を介して接続されている計算機からの遠隔処理要求に対するディスク制御機構104の制御と計算機結合機構140を介して接続されている計算機に対する遠隔制御要求の発行を行う部分である。
【0022】
遠隔ディスク制御部120は、遠隔要求処理部121、遠隔要求発行部122、計算機結合機構アダプタ制御部123が内部バス124に接続して構成される。遠隔要求処理部121は、計算機結合機構140を介して接続されている計算機からの遠隔処理要求に対する処理を行う部分であり、たとえば、TTL、CMOS等の論理によって構成できる。
【0023】
遠隔要求発行部122は、計算機結合機構140を介して接続されている計算機に対して遠隔制御要求を発行する部分であり、たとえば、TTL、CMOS等の論理によって構成できる。
【0024】
計算機結合機構アダプタ制御部123は、計算機結合機構140を介して接続されている計算機に対する通信を行うために、計算機結合機構アダプタ105を制御する部分であり、たとえば、TTL、CMOS等の論理によって構成できる。
【0025】
図2に疎結合計算機システム構成の他の例2を示す。図2は、三台の計算機とおのおのに接続されたディスクが部分的に共有された場合の例である。計算機−1(100−1)は、ディスク(106−1(ID=A,B,C):IDは、各計算機内部における識別子)を有し、ディスク(106−1(ID=A,B)は非共有ディスクであり、ディスク(106−1(ID=C)が計算機−1(100−1)と計算機−2(100−2)によって共有されるディスクである。
【0026】
計算機−2(100−2)は、ディスク(106−2(ID=A,B))を有し、ディスク(106−2(ID=A)は非共有ディスクであり、ディスク(106−2(ID=B)が計算機−2(100−2)と計算機−3(100−3)によって共有されるディスクである。
【0027】
計算機−3(100−2)は、ディスク(106−3(ID=A,B,C))を有し、ディスク(106−3(ID=A)は非共有ディスクであり、ディスク(106−3(ID=B,C)が計算機−1(100−1)、計算機−2(100−2)、計算機−3(100−3)によって共有されるディスクである。
【0028】
次に、表1に疎結合計算機システム構成例2に対応する構成定義情報の例を示す。構成定義情報は、ディスク要求処理部110に対して要求された処理がどの計算機のどのディスクに対応するか、処理の要求者が対応するディスクに対するアクセスの権利(アクセス権)を持っているか、セキュリティを向上させるためのパスワード等の構成定義を示す情報であり、テーブルとして構成される。仮想ディスクとは、プロセッサ101が発行する処理コマンドにおいて指定されるディスクの仮想的な名称である。この例では、疎結合計算機システム全体で8つのディスクがあり、VDISK−1〜VDISK−8までの識別子を用いて指定される。
【0029】
【表1】
Figure 2004164586
【0030】
実ディスク管理計算機とは、実際に処理コマンドが発行される対象となるディスク(106−1から106−3)を制御するディスク制御機構104が接続されている計算機(100−1から100−3)を示す。
【0031】
管理計算機内対応ディスクとは、仮想ディスクに対応する実ディスク管理計算機内のディスク(106−1から106−3)を示している。以下、これを実ディスクという。この例では、管理計算機がディスクを管理するための識別子(ID)の形式で格納されていることを示す。アクセス権情報は、各仮想ディスクに対して、どの計算機からのアクセスを許可するかを示す。この例では、アクセスを許可する計算機の識別子である。アクセス権情報は、データ読み込み、データ書き込み、状態読み出し等の各処理コマンドごとに保持されていてもよい。パスワードは、セキュリティを向上するために使用する。たとえば、信頼性を向上させるために、すべての要求に対してパスワードチェックを行うことができる。
【0032】
また、アクセス権の計算機からの要求であっても、特定のプロセス等からの要求に関してのみアクセスを許したい場合には、各要求毎にパスワードを付加し、チェックすることによりセキュリティを向上させることができる。
【0033】
図3に疎結合計算機システム構成例2の計算機−1に対応する構成定義情報の例を示す。構成定義情報として、各計算機がどの実ディスク管理計算機に対応するかを示す情報を持つことで、計算機結合機構を介することなくアクセスできる仮想ディスクを識別することが可能となる。
【0034】
表1及び図3の情報は、外部二次記憶装置に記録されていて初期化処理時に設定されることができる。また、ユーティリティツールにより、動作中に設定することもできる。
【0035】
図4に、プロセッサ101から発行されるディスク処理要求コマンドの例を示す。
【0036】
400は、ディスク処理要求コマンドである。仮想ディスクID401は、システム内のどのディスクを指定するかを示す識別子である。パスワード402は、図3にて示したパスワードチェックのために必要である。ディスク制御コマンド/データ403は、ディスク(106−1から106−N)を制御するためのコマンドとコマンドの実行に必要なデータであり、ディスク制御機構104を介して発行される。
【0037】
図5に、ディスク処理終了時にプロセッサ101に返されるディスク処理ステータスの例を示す。500は、ディスク処理ステータスである。仮想ディスクID401は、図4の仮想ディスクID401と同一である。パスワード502は、図4のパスワード502と同じであるが、返送時には使用しなくてもよい。ディスクステータス/データは、ディスク(106−1から106−N)からプロセッサ101に返送されるコマンド終了時のステータス情報およびデータである。
【0038】
図6に計算機結合機構アダプタパケットの例を示す。計算機結合機構では、パケットの配送を行う。送信側計算機ID601は送信側の計算機を示す識別子である。受信側計算機ID602は受信側の計算機を示す識別子である。データ603は転送されるデータである。パケットは、信頼性向上のために、パケットの前後に信頼性向上用冗長コードを付加することも好ましい。また、機密性を向上させるために、パケットを符号化することも好ましい。
【0039】
図7に遠隔ディスク処理要求コマンドの例を示す。700は、遠隔ディスク処理要求コマンドである。要求元計算機ID701はディスクに対する処理を要求する計算機を示す識別子である。実ディスク管理計算機ID702は処理対象となるディスクを直接管理するディスク制御機構104を保持する計算機を示す識別子である。実ディスクID703は、処理対象となるディスクを示す識別子である。パスワード402及びディスク制御コマンド/データ403は、図4に示したものと同一である。
【0040】
図8に遠隔ディスク処理ステータスの例を示す。800は、遠隔ディスク処理ステータスである。要求元計算機ID701はディスクに対する処理を要求した計算機を示す識別子であり、図7に示したものと同一である。実ディスク管理計算機ID702は処理対象となるディスクを直接管理するディスク制御機構104を保持する計算機を示す識別子であり、図7に示したものと同一である。実ディスクID703は、処理対象となるディスクを示す識別子であり、図7に示したものと同一である。パスワード502及びディスクステータス/データ503は、図5に示したものと同一である。
【0041】
図9に実ディスク処理要求コマンドの例を示す。900は、実ディスク処理要求コマンドである。実ディスクID703は、処理対象となるディスクを示す識別子であり、図7に示したものと同一である。ディスク制御コマンド/データ403は、ディスク(106−1から106−N)を制御するためのコマンドとコマンドの実行に必要なデータであり、図4に示したものと同一である。
【0042】
図10に実ディスク処理ステータスの例を示す。1000は、実ディスク処理ステータスである。実ディスクID703は、処理対象となるディスクを示す識別子であり、図7に示したものと同一である。ディスクステータス/データ503は、ディスク(106−1から106−N)からプロセッサ101に返送されるコマンド終了時のステータス情報およびデータであり、図5に示したものと同一である。
【0043】
図11にて、ディスク要求処理部動作のフローを説明する。まずステップ1110に示すようにプロセッサ101が発行したディスク処理要求コマンドを要求制御部111が受け付け、ステップ1120に進む。
【0044】
次に、ステップ1120に示すように要求先判定部113が構成定義情報保持部114に格納されている構成定義情報(表1を参照)を参照して、仮想ディスクID401に対応する実ディスク管理計算機(表1を参照)を判定し、ステップ1130に進む。
【0045】
次に、ステップ1130に示すように構成定義情報(表1及び図3を参照)を参照して仮想ディスクID401に対応する実ディスク管理計算機がディスク処理要求コマンドを発行したプロセッサ101と同一であるか否かを判定する。仮想ディスクID401に対応する実ディスク管理計算機がディスク処理要求コマンドを発行したプロセッサ101と同一でない場合には、ステップ1140に分岐し、仮想ディスクID401に対応する実ディスク管理計算機がディスク処理要求コマンドを発行したプロセッサ101と同一の場合には、ステップ1150に分岐する。
【0046】
仮想ディスクID401に対応する実ディスク管理計算機がディスク処理要求コマンドを発行したプロセッサ101と同一でない場合には、ステップ1140に示すように遠隔要求処理動作を実行する。
【0047】
図13と図14で遠隔要求処理動作について説明する。仮想ディスクID401に対応する実ディスク管理計算機がディスク処理要求コマンドを発行したプロセッサ101と同一の場合には、ステップ1150に示すように、要求許否判定部112がディスク処理要求コマンド400で示される処理対象となる仮想ディスクID401に対するアクセス権を構成定義情報情のアクセス権情報(表1を参照)を検索することでチェックし、ステップ1160に進む。図3Aに示した例では、アクセス権情報はアクセス権を持つ計算機を示している。
【0048】
次にステップ1160に示すようにアクセス権が無ければステップ1195に分岐し、アクセス権があればステップ1170に分岐する。
【0049】
アクセス権がなければ、ステップ1195に示すようにその要求を拒否して終了する。要求を拒否して終了する場合には、要求制御部111がディスク要求処理ステータス500を作成してプロセッサ101に返送する。ディスク処理ステータス500は、仮想ディスクID401とパスワード402はディスク要求処理コマンド400と同一であり、ディスクステータスとして、アクセス権がないことを通知するためのステータスコードを設定する。
【0050】
アクセス権があれば、ステップ1170に示すように要求許否判定部112が、ディスク処理要求コマンド400のパスワード402と構成定義情報保持部114に保持された構成定義情報のパスワード305とを比較することでパスワードチェックを行い、ステップ1180に進む。次にステップ1180では、パスワードが一致しなければステップ1195に分岐し、パスワードが一致すればステップ1190に分岐する。この例では、アクセス権がない場合とパスワードが不一致な場合を分けてステータス通知を行っていないが、障害検出機能を向上するために、ステータス通知を分けることも好ましい。
【0051】
パスワードが一致すれば、ステップ1190に示すように、非遠隔要求処理を実行し終了する。ディスク要求処理部動作は、ディスク要求処理部110にプロセッサを保持して、ソフトウエアによって実現されてもよい。非遠隔要求処理動作については図12にて説明する。
【0052】
図12にて、非遠隔要求処理動作のフローを説明する。まずステップ1210に示すように、要求制御部111がディスク処理要求コマンド400から、実ディスク処理要求コマンド900を作成する。構成定義情報(表1を参照)を参照して、ディスク処理要求コマンド400の仮想ディスクID401に対応する実ディスクID703に変換することで、ディスク処理要求コマンド400から実ディスク処理要求コマンド900を作成することができる。
【0053】
次にステップ1220に示すように、要求制御部111がディスク制御機構共有制御部115に対して実ディスク処理要求コマンド900を発行する。
【0054】
次にステップ1230に示すように、ディスク制御機構共有制御が、遠隔要求処理部121と要求制御部111とから発行された実ディスク処理要求コマンド900をシリアライズし、ディスク制御機構104に対して発行する。実ディスク処理要求コマンド900をシリアライズする処理は、図15にて説明する。
【0055】
次にステップ1240に示すように、ディスク制御機構104が実ディスク処理要求コマンド900を用いてディスク(106−1〜106−N)を制御する。
【0056】
次にステップ1250に示すように、実ディスク処理要求コマンド900によるディスク(106−1〜106−N)に対する制御の返り値として、ディスク制御機構104がディスク制御機構共有制御部115に実ディスク処理ステータス1000を返す。
【0057】
次にステップ1260に示すように、ディスク制御機構共有制御部115が実ディスク処理ステータス1000を要求制御部111に返す。
【0058】
次にステップ1270に示すように、要求制御部111は、構成定義情報(図3Aを参照)を参照して、実ディスク処理ステータス1000の実ディスクID703に対応する仮想ディスクID401を検索することで、ディスク処理ステータス500を作成する。
【0059】
次にステップ1280に示すように、要求制御部111は、ディスク処理ステータス500をプロセッサ101に返送し、非遠隔要求処理を終了する。非遠隔要求処理動作は、ディスク要求処理部110にプロセッサを保持して、ソフトウエアによって実現されてもよい。
【0060】
図13にて、遠隔要求処理動作のフローを説明する。まず、ステップ1310に示すように遠隔要求発行部122がディスク処理要求コマンド400と構成定義情報とから、遠隔ディスク処理要求コマンド700を作成する。構成定義情報(表1を参照)を参照して、ディスク処理要求コマンド400の仮想ディスクID401に対応する実ディスクID703に変換することで、ディスク処理要求コマンド400から実ディスク処理要求コマンド900を作成することができる。
【0061】
次にステップ1320に示すように遠隔要求発行部122が遠隔ディスク処理要求コマンド700の送信を計算機結合アダプタ制御部123に要求する。
【0062】
次にステップ1330に示すように計算機結合機構アダプタ制御部123は、計算機結合機構アダプタ130を介して、実ディスク管理計算機(表1を参照)の遠隔要求処理部121に対して遠隔ディスク処理要求込コマンド700を転送する。
【0063】
次にステップ1340に示すように遠隔要求処理部121は、要求許否判定部112に対して遠隔ディスク処理要求コマンド700のアクセス権のチェックを要求する。
【0064】
次にステップ1350に示すように要求許否判定部112は、遠隔ディスク処理要求コマンド700を受け取り、遠隔ディスク処理要求コマンド700で示される処理対象となる実ディスク管理計算機ID702及び実ディスクID703に対するアクセス権を構成定義情報情のアクセス権情報(表1を参照)を検索することでチェックし、ステップ1360に進む。
【0065】
次にステップ1360に示すように、アクセス権が無ければステップ1395に分岐し、アクセス権があればステップ1370に分岐する。
【0066】
アクセス権がなければ、ステップ1395に示すようにその要求を拒否して終了する。
【0067】
要求を拒否して終了する場合には、遠隔要求処理部121が遠隔ディスク処理ステータス800を作成し、遠隔要求発行部122に返送し、ディスク処理要求コマンドを発行したプロセッサ101にエラー通知を行う。この処理の詳細は、図16で説明する。
【0068】
アクセス権があれば、ステップ1370に示すように要求許否判定部112が、遠隔ディスク処理要求コマンド700のパスワード402と構成定義情報保持部114に保持された構成定義情報のパスワード305とを比較することでパスワードチェックを行い、ステップ1380に進む。次にステップ1380では、パスワードが一致しなければステップ1395に分岐し、パスワードが一致すればステップ1390に分岐する。この例では、アクセス権がない場合とパスワードが不一致な場合を分けてステータス通知を行っていないが、障害検出機能を向上するために、ステータス通知を分けることも好ましい。
【0069】
パスワードが一致すれば、ステップ1390に示すように、遠隔要求時実ディスク処理を実行し終了する。遠隔要求処理動作は、ディスク要求処理部110にプロセッサを保持して、ソフトウエアによって実現されてもよい。遠隔要求時実ディスク処理については図14にて説明する。
【0070】
図14にて遠隔要求時実ディスク処理のフローを説明する。まず、ステップ1410に示すように、遠隔要求処理部121が遠隔ディスク処理要求コマンド700から実ディスク処理要求コマンド900を作成し、ステップ1420に進む。実ディスク処理要求コマンドの実ディスクID703は、遠隔ディスク要求コマンド700の実ディスクID703と同一であり、実ディスク処理要求コマンドのディスク制御コマンド/データ403は、遠隔ディスク要求コマンド700のディスク制御コマンド/データ403と同一である。
【0071】
次にステップ1420に示すように、遠隔要求処理部121がディスク制御機構共有制御部115に実ディスク処理要求コマンド900を発行し、ステップ1430に進む。
【0072】
次にステップ1430に示すように、ディスク制御機構共有制御部115では、遠隔要求処理部121と要求制御部111とから発行された実ディスク処理コマンド900をシリアライズして、ディスク制御機構104に対して発行し、ステップ1440に進む。ディスク制御機構共有制御部115の動作については、図15にて説明する。
【0073】
次にステップ1440に示すようにディスク制御機構104が実ディスク処理要求コマンド900を用いてディスク(106−1〜106−N)を制御し、ステップ1450に進む。
【0074】
次にステップ1450に示すように、ディスク制御機構104は、実ディスク処理要求コマンド900によるディスク(106−1〜106−N)の制御の返り値として、ディスク制御機構共有制御部115に実ディスク処理ステータス1000を返し、ステップ1460に進む。
【0075】
次にステップ1460に示すように、ディスク制御機構共用部115が、実ディスク処理ステータス1000を遠隔要求処理部121に返し、ステップ1470に進む。
【0076】
次にステップ1470に示すように、遠隔要求処理部121は、構成定義情報に基づき、実ディスク処理ステータス1000から、遠隔ディスク処理ステータス800を作成し、ステップ1480に進む。
【0077】
次にステップ1480に示すように、遠隔要求処理部121が遠隔ディスク処理ステータス800の送信を計算機結合機構アダプタ123に要求し、ステップ1490に進む。
【0078】
次にステップ1490に示すように、計算機結合機構アダプタ123は、計算機結合機構アダプタ130を介して、要求元計算機の遠隔要求発行部122対して、遠隔ディスク処理ステータス800を転送し、ステップ1492に進む。
【0079】
次にステップ1492に示すように、遠隔要求発行部122は、構成定義情報(図3Aを参照)を参照して、遠隔ディスク処理ステータス800の実ディスク管理計算機ID702及実ディスクID703対応する仮想ディスクID401を検索することでディスク処理ステータス500を作成し、ステップ1495に進む。
【0080】
次にステップ1495に示すように、遠隔要求発行部122は、ディスク処理ステータス500をプロセッサ101に返送し、終了する。遠隔要求時実ディスク処理は、ディスク要求処理部110にプロセッサを保持して、ソフトウエアによって実現されてもよい。
【0081】
図15は、ディスク制御機構共有制御部115の実施例である。ディスク制御機構共有制御部115は、遠隔要求処理部対応要求保持部1510、要求制御部対応要求保持部1520、ディスク要求シリアライズ部1530、実ディスク制御部1540から構成されている。
【0082】
遠隔要求処理部対応要求保持部1510は、遠隔要求処理部121から発行された実ディスク要求コマンド900及び実ディスク処理ステータス1000を保持する部分であり、たとえば、TTL、CMOS等の論理によって構成できる。
【0083】
要求制御部対応要求保持部1520は、要求制御部111から発行された実ディスク要求コマンド900及び実ディスク処理ステータス1000を保持する部分であり、たとえば、TTL、CMOS等の論理によって構成できる。
【0084】
ディスク要求シリアライズ部1530は、遠隔要求処理部121及び要求制御部111から発行された実ディスク要求コマンド900をシリアライズして、実ディスク制御部1540に提供する部分であり、たとえば、TTL、CMOS等の論理によって構成できる。各要求のシリアライズの例として、ラウンドロビン方式を採用し、遠隔要求処理部対応要求保持部1510にある要求と要求制御部対応要求保持部1520にある要求を交互に取り出す方法がある。
【0085】
実ディスク制御部1540は、実ディスク要求コマンド900の発行及び実ディスク処理ステータス1000の受け取りを行う部分である。実ディスク要求コマンド900の発行は、ディスク要求シリアライズ部1530によって出力された順番にしたがって、ディスク制御機構104に対して発行する。また、実ディスク処理ステータス1000の受け取りは、ディスク制御機構104が発行した順番にしたがって受け取る。受け取った実ディスク処理ステータス1000は、ディスク要求シリアライズ部1530を介して、遠隔要求処理部対応要求保持部1510及び要求制御部対応要求保持部1520に転送される。遠隔要求処理部対応要求保持部1510からは、遠隔要求処理部121に実ディスク処理ステータス1000が返送される。要求制御部対応要求保持部1520からは、要求制御部111に実ディスク処理ステータス1000が返送される。ディスク制御
機構共有制御部は、ディスク要求処理部110にプロセッサを保持して、ソフトウエアによって実現されてもよい。
【0086】
図16にて、遠隔要求拒否処理のフローを説明する。まず、ステップ1610に示すように、遠隔要求処理部121は、アクセス権エラー及びパスワードエラーに対するステータスと遠隔ディスク処理要求コマンド700とから、遠隔ディスク処理ステータス800を作成し、ステップ1620に進む。遠隔ディスク処理要求コマンド700と遠隔ディスク処理ステータス800は、ディスク制御コマンド/データ403とディスクステータス/データ503以外は、同一である。次にステップ1620に示すように、遠隔要求処理部121が遠隔ディスク処理ステータス800の送信を計算機結合機構アダプタ制御部123に要求し、ステップ1630に進む。次にステップ1630に示すように、計算機結合機構アダプタ123は、計算機結合機構アダプタ130を介して、要求元計算機の遠隔要求発行部122対して、遠隔ディスク処理ステータス800を転送し、ステップ1640に進む。
【0087】
次にステップ1640に示すように、遠隔要求発行部122は、構成定義情報(図3Aを参照)を参照して、遠隔ディスク処理ステータス800の実ディスク管理計算機ID702及実ディスクID703対応する仮想ディスクID401を検索することでディスク処理ステータス500を作成し、ステップ1650に進む。
【0088】
次にステップ1650に示すように、遠隔要求発行部122は、ディスク処理ステータス500をプロセッサ101に返送し、終了する。遠隔要求拒否処理は、ディスク要求処理部110にプロセッサを保持して、ソフトウエアによって実現されてもよい。
【0089】
【発明の効果】
以上本発明によれば、共有対象のハードディスクの接続するバスとリモートアクセスのための接続機構の間の処理要求を必要に応じて転送することで、必要な場合にしか接続機構に対するアクセスが発生せず、要求の発生したプロセッサがハードディスクを直接制御できるため、高性能な共有ディスクを有する疎結合計算機システムを構築することが可能となる。
【図面の簡単な説明】
【図1】疎結合計算機システム構成の第1の例のブロック図。
【図2】疎結合計算機システム構成の第2の例のブロック図。
【図3】構成定義情報例概念図。
【図4】ディスク処理要求コマンド例概念図。
【図5】ディスク処理ステータス例概念図。
【図6】計算機結合機構アダプタパケット例概念図。
【図7】遠隔ディスク処理要求コマンド例概念図。
【図8】遠隔ディスク処理ステータス例概念図。
【図9】実ディスク処理要求コマンド例概念図。
【図10】実ディスク処理ステータス例概念合う。
【図11】ディスク要求処理部動作フロー図。
【図12】非遠隔要求処理フロー図。
【図13】遠隔要求処理フロー図。
【図14】遠隔要求時実ディスク処理フロー図。
【図15】ディスク制御機構共有制御部のブロック図。
【図16】遠隔要求拒否処理フロー図。
【符号の説明】
(100−1から100−N):計算機
101:プロセッサ、102:メモリ、103:I/O装置
104:ディスク制御機構、105:システムバス
(106−1から106−N):ディスク
110:ディスク要求処理部、111:要求制御部、112:要求拒否判定部
113:要求先判定部、114:構成定義情報保持部
115:ディスク制御機構共有制御部、116:内部バス
120:遠隔ディスク制御部、121:遠隔要求処理部、122:遠隔要求発行部
123:計算機結合機構アダプタ制御部、124:内部バス
140:計算機結合機構
301:仮想ディスク、302:実ディスク管理計算機
303:管理計算機内対応ディスク、304:アクセス権情報、305:パスワード
400:ディスク処理要求コマンド、401:仮想ディスクID
402:パスワード、403:ディスク制御コマンド/データ
500:ディスク処理ステータス、502:パスワード
601:送信側計算機ID、602:受信側計算機ID、603:データ
700:遠隔ディスク処理要求コマンド、701:要求元計算機ID
702:実ディスク管理計算機ID、703:実ディスクID
800:遠隔ディスク処理ステータス
900:実ディスク処理要求コマンド
1000は:実ディスク処理ステータス
1110〜1195:処理ステップ
1210〜1280:処理ステップ
1310〜1395:処理ステップ
1410〜1495:処理ステップ
1510:遠隔要求処理部対応要求保持部、1520:要求制御部対応要求保持部
1530:ディスク要求シリアライズ部、1540:実ディスク制御部
1610〜1650:処理ステップ

Claims (11)

  1. ネットワークを介して相互に接続する複数の計算機のメモリ上に分散したデータを共有して並行処理によって少なくとも1つのアプリケーションを実行する前記複数の計算機のうち、少なくともいずれか1つの計算機において、
    プロセッサと、メモリと、補助記憶装置と、前記プロセッサと前記メモリと前記補助記憶装置を接続するバスとを備え、
    前記複数の計算機のメモリ上に分散したデータのうち、前記アプリケーションが1次元配列への写像として指定し、前記1次元配列を共有単位とする共有データを対応付けて管理する共有データ管理テーブルが前記補助記憶装置に格納され、
    前記共有データの複製領域が前記メモリに格納されることを特徴とする計算機。
  2. 前記計算機のアプリケーションは、前記前記メモリに格納される前記共有データの複製に対して、Read/Writeを行うことを特徴とする請求項1記載の計算機。
  3. 前記アプリケーションが1次元配列への写像として指定し、前記1次元配列を共有単位とする共有データを前記複数の計算機との間で一貫性保証を行う請求項1記載の計算機。
  4. 前記共有データの複製領域は、前記アプリケーションによって前記1次元配列への写像として指定された際に、前記メモリ上に生成されることを特徴とする請求項1記載の計算機。
  5. 前記複数の計算機との間で共有する複数の共有単位について、共有単位間での階層関係を定義し、前記指定された1次元配列の共有単位に加え、その下位階層として定義された共有単位についても一貫性保証を一括して指定することを特徴とする請求項1記載の計算機。
  6. 前記一貫性保証を行う際に、指定された共有単位の下位階層として定義された共有単位から、任意の下位階層共有単位を選択して、一貫性保証を一括して行うことを特徴とする請求項5記載の計算機システム。
  7. ネットワークを介して接続される複数の計算機のメモリ上に分散したデータを共有し、並行処理によって少なくとも1つのアプリケーションを実行する前記複数の計算機のうち、少なくともいずれか1つの計算機において、
    前記複数の計算機のメモリ上に分散したデータのうち、前記アプリケーションが1次元配列への写像として指定し、前記1次元配列を共有単位とする共有データを管理する共有データ管理テーブルと、
    前記共有データ管理テーブルを共有データ領域管理手段と、
    ネットワークを介して、他の計算機とのパケットによる前記共有データを送受信するパケット送受信手段と、
    前記パケット送受信手段によって、送信するパケットを生成するために、共有データを格納するメモリ領域を調べ、そのメモリ領域に対して共有データの番号を付与する共有データ番号付与手段と、
    前記パケット送受信手段によって受信したパケット中の共有データの番号を識別し、共有データの番号に対応するメモリ領域に共有データを書き込む共有データ識別手段と、
    前記アプリケーションからRead/Writeを行うために、前記共有データの複製を格納する手段とを有することを特徴とする計算機。
  8. 前記共有データ管理テーブルは、共有データ番号を格納する共有データ番号エントリと、共有データを管理している計算機かどうかを示す管理ノードフラグエントリと、共有データの開始アドレスを示す共有データアドレスエントリと、共有データの複製の開始アドレスを示す共有データ複製アドレスエントリと、共有データの大きさを示す共有データサイズエントリと、共有データを保持している計算機システムを示す計算機リストエントリを有することを特徴とする請求項7記載の計算機。
  9. 前記共有データ管理テーブルは、アプリケーションが使用する共有データが連続領域か否かを示す分割フラグエントリと、幾つの分割されたデータから共有が構成されているかを示す共有データ要素数エントリと、分割されたデータがどのくらいの間隔で並んでいるかを示す共有データオフセットエントリを有することを特徴とする請求項8記載の計算機。
  10. 前記共有データ管理テーブルは、共有データが構造体である場合に、構造体の定義を格納する構造体定義エントリと、構造体のデータ長を格納する構造体サイズエントリと、複数の共有データに階層関係があることを示す階層要素フラグエントリと、階層要素の共有データ番号を格納する階層要素共有データ番号エントリを有することを特徴とする請求項9記載の計算機。
  11. 複数の計算機がネットワークで接続され、各計算機のメモリ上に分散したデータを各計算機にて共有する分散共有メモリ処理方法において、
    計算機のアプリケーションから、各計算機のメモリ上に分散したデータを任意のアドレス及びサイズよりなる共有単位で指定し、
    指定された共有単位にて共有データを対応付けて管理する管理計算機を決定し、前記管理計算機に対して共有データの使用を要求し、
    前記管理計算機では、指定された共有データが使用されているか否かを確認し、
    使用されていない場合には、指定された共有データに関する情報を前記管理計算機に新規に登録し、
    使用されている場合には、新規に共有データの使用を指定した計算機に関する情報を前記管理計算機に登録して、その情報を他の計算機に通知し、
    共有データの使用を指定した計算機では、各計算機のメモリ上に分散した共有データを獲得して、共有データの複製を作成することを特徴とする分散共有メモリ処理方法。
JP2003206387A 2003-08-07 2003-08-07 疎結合計算機システム Pending JP2004164586A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003206387A JP2004164586A (ja) 2003-08-07 2003-08-07 疎結合計算機システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003206387A JP2004164586A (ja) 2003-08-07 2003-08-07 疎結合計算機システム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP29630093A Division JP3489157B2 (ja) 1993-11-26 1993-11-26 分散共有メモリシステムおよび計算機

Publications (1)

Publication Number Publication Date
JP2004164586A true JP2004164586A (ja) 2004-06-10

Family

ID=32821713

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003206387A Pending JP2004164586A (ja) 2003-08-07 2003-08-07 疎結合計算機システム

Country Status (1)

Country Link
JP (1) JP2004164586A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007041974A (ja) * 2005-08-04 2007-02-15 Hitachi Ltd ストレージシステム、ストレージアクセス制限方法、及びコンピュータプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007041974A (ja) * 2005-08-04 2007-02-15 Hitachi Ltd ストレージシステム、ストレージアクセス制限方法、及びコンピュータプログラム

Similar Documents

Publication Publication Date Title
TW544589B (en) Loosely coupled-multi processor server
US6112263A (en) Method for multiple independent processes controlling access to I/O devices in a computer system
KR100952589B1 (ko) 공유 메모리 시스템 내의 메모리 운영
JPH096706A (ja) 疎結合計算機システム
US8332367B2 (en) Parallel data redundancy removal
US8700856B2 (en) Method for accessing mirrored shared memories and storage subsystem using method for accessing mirrored shared memories
US20130174224A1 (en) Information processing apparatus and unauthorized access prevention method
US7577957B1 (en) Multiple jobs per device that are linked via a device record for servicing by different adapters
WO2000000891A1 (en) Split directory-based cache coherency technique for a multi-processor computer system
JP2007510978A (ja) ストレージサーバーのボトムアップキャッシュ構造
JP2005519391A (ja) 共有ベクトルの増加を伴わないdsmマルチプロセッサシステムにおけるキャッシュコヒーレンスのための方法およびシステム
JP2004302713A (ja) 記憶システム及びその制御方法
KR20220056986A (ko) 메모리 확장기, 이종 컴퓨팅 장치, 및 이종 컴퓨팅 장치의 동작 방법
CN110119304B (zh) 一种中断处理方法、装置及服务器
US10872036B1 (en) Methods for facilitating efficient storage operations using host-managed solid-state disks and devices thereof
US5901328A (en) System for transferring data between main computer multiport memory and external device in parallel system utilizing memory protection scheme and changing memory protection area
CN114442916A (zh) 存储器设备、主机系统及操作存储器设备的方法
CN113900965A (zh) 净荷高速缓存
EP2845110A1 (en) Reflective memory bridge for external computing nodes
WO2018176397A1 (zh) 一种锁分配的方法、装置和计算设备
US9237057B1 (en) Reassignment of a virtual connection from a busiest virtual connection or locality domain to a least busy virtual connection or locality domain
JP4580693B2 (ja) 共有排他制御方法
CN114356839B (zh) 处理写操作的方法、设备、处理器及设备可读存储介质
EP1550035A1 (en) Data access control
US9509797B1 (en) Client communication over fibre channel using a block device access model

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040518

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050405

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060421