JP2716571B2 - 二重化データ保全装置 - Google Patents

二重化データ保全装置

Info

Publication number
JP2716571B2
JP2716571B2 JP2128324A JP12832490A JP2716571B2 JP 2716571 B2 JP2716571 B2 JP 2716571B2 JP 2128324 A JP2128324 A JP 2128324A JP 12832490 A JP12832490 A JP 12832490A JP 2716571 B2 JP2716571 B2 JP 2716571B2
Authority
JP
Japan
Prior art keywords
area
cluster
shared memory
access
clusters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2128324A
Other languages
English (en)
Other versions
JPH0423149A (ja
Inventor
仁志 杉山
壽徳 平石
剛 熊野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2128324A priority Critical patent/JP2716571B2/ja
Priority to EP91107879A priority patent/EP0457308B1/en
Priority to DE69124285T priority patent/DE69124285T2/de
Publication of JPH0423149A publication Critical patent/JPH0423149A/ja
Priority to US08/249,046 priority patent/US5548743A/en
Priority to US08/430,315 priority patent/US5568609A/en
Application granted granted Critical
Publication of JP2716571B2 publication Critical patent/JP2716571B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔概要〕 プロセッサを有する複数のクラスタと,入出力パスを
介して各クラスタに接続される二重化された共用メモリ
とを備えた複合計算機システムにおける二重化データ保
全装置に関し, 一方の共用メモリで障害が発生した場合に,高速かつ
確実に二重化運用状態から片肺運用状態に移行できるよ
うにすることを目的とし, 共用メモリとクラスタとを結ぶ入出力パスを物理的に
切断する入出力パス切断機構を備えるとともに,各クラ
スタは,二重化された共用メモリの各領域の有効/無効
を管理する制御情報部と,共用メモリ上の領域を切り離
すときに,制御情報部にその領域が無効であることを設
定し,その領域と各クラスタとを結ぶ全入出力パスを切
断する処理を行う入出力パス切断処理部と,入出力パス
の切断により,アクセスが異常終了した場合に,制御情
報部にその領域が無効であることを設定し,以後,その
領域に対するアクセスを禁止するアクセス禁止処理部と
を備えるように構成する。
〔産業上の利用分野〕
本発明は,二重化された共用メモリを持つ複合計算機
システムにおいて,障害発生または使用者からの指定に
より,一方のクラスタの切り離しを行うクラスタが,切
り離す側のメモリと全クラスタとの入出力パスを切断す
ることにより,二重化データの保全を行うようにした二
重化データ保全装置に関するものである。
近年のコンピュータシステムでは,単一プロセッサの
能力の伸びが鈍化していることや,信頼性向上の強いニ
ーズがあることなどの理由から,複数クラスタを共用メ
モリで接続した複合計算機システムを構築することが一
般的になりつつある。
共用メモリには,複数のクラスタで共用される重要な
データが置かれるため,信頼性を高める目的で,共用メ
モリの二重化を行うことが多い。
このような二重化された共用メモリの一方に障害が発
生した場合や,使用者からの切り離しの指示があった場
合には,全クラスタとの整合性を保ちながら,高速に他
の共用メモリのみを使用する片肺運転に移行する必要が
ある。
〔従来の技術〕
第5図は従来技術の例を示す。
従来,二重化された共用メモリ10−1,10−2の一方を
切り離す場合に,第5図(イ)または第5図(ロ)に示
すような方式が用いられている。
第5図(イ)に示す方式では,二重化された共用メモ
リ10−1,10−2へのアクセスを,共用メモリ内の制御表
50を用いて制御する。すなわち,制御表50内には,リー
ドするとき,どちらの共用メモリから読み込むのか,ま
たライトするときには,どちらの共用メモリに書き込む
かなどの情報が格納され管理されている。
一方の共用メモリ,例えば共用メモリ10−1の領域1
で障害が発生した場合,その障害を検出したクラスタ12
aは,その領域1が使用不可能状態である旨を,共用メ
モリ内の制御表50に書き込む。
残りのクラスタ12bは,共用メモリ10−1,10−2のア
クセスに先立ち,この制御表50を参照し,使用可能状態
であるかどうかを調べる。共用メモリ10−1の領域1
は,使用可能状態でないので,その領域1に対するアク
セスを禁止し,二重化された他方の領域2へのアクセス
のみを行う。
このように,共用メモリ内の制御表50を用いることに
より,全クラスタは,共用メモリ10−1へのアクセスを
禁止し,残った一方の共用メモリ10−2へのアクセスだ
けを行う。
第5図(ロ)に示す方式では,二重化された共用メモ
リ10−1,10−2へのアクセスを,各クラスタ12a,12bが
固有に持つ制御表50−1,50−2で制御し,障害発生時に
は,クラスタ間の通信を行うことにより,障害発生を通
知する。
各制御表50−1,50−2内には,リードするとき,どち
らの共用メモリから読み込むのか,またライトするとき
には,どちらの共用メモリに書き込むかなどの情報が格
納され管理されている。第5図(イ)に示す前述の方式
に比べて,クラスタ内のローカルメモリへのアクセスで
よいので,1回のアクセス時間が短くなる。
一方の共用メモリ,例えば共用メモリ10−1の領域1
で障害発生した場合,その障害を検出したクラスタ12a
は,自クラスタ内の制御表50−1に,その領域1は使用
不可能状態である旨を記録する。さらに,領域1上で障
害発生した旨を他クラスタ12bに通知する。通知を受け
たクラスタ12bは,クラスタ12aと同様に,領域1が使用
不可能状態である旨を制御表50−2に記録する。
このとき,全クラスタでの制御表の情報更新が完了す
るまで,全クラスタの通常の処理を停止する必要があ
る。
以上の処理により,全クラスタを通じ一方の共用メモ
リ10−1が使用不可能状態であることを認識し,全クラ
スタが残った他方の共用メモリ10−2をアクセスするよ
うに制御する。
〔発明が解決しようとする課題〕
第5図(イ)に示す方式には,以下の問題がある。
(a) 各クラスタ12a,12bから共用メモリ10−1,10−
2をアクセスする際に,一旦,共用メモリ内の制御表50
を参照し,アクセスが可能であるかを判断する処理が必
要になり,一回のアクセスに時間がかかる。
(b) 障害発生により使用不可能とした領域との入出
力パスが実際には存在するため,クラスタが誤動作した
場合に,その領域へアクセスする危険性がある。
(c) 共用メモリ内の制御表50の排他制御が煩雑であ
る。
(d) 共用メモリ内の制御表域で障害が発生した場
合,または設定されている情報に矛盾が生じた場合,シ
ステムが誤動作する可能性がある。
また,第5図(ロ)に示す方式には,以下の問題があ
る。
(a) 障害を検出したクラスタで,障害が発生した旨
を他のクラスタに通知する処理が必要であり,処理が複
雑となる。
(b) 障害発生により使用不可能とした領域との入出
力パスが実際には存在するため,クラスタが誤動作した
場合に,その領域へアクセスする危険性がある。
(c) 共用メモリ内の制御表域で障害が発生した場
合,または設定されている情報に矛盾が生じた場合,シ
ステムが誤動作する可能性がある。
本発明は,以上のような通常のメモリアクセス時間の
低下,クラスタ間の通信に伴う処理の複雑化,クラスタ
誤動作による共用メモリのデータ破壊といった従来技術
の問題点を解決し,一方の共用メモリで障害が発生した
場合に,高速かつ確実に二重化運用状態から片肺運用状
態に移行できるようにすることを目的としている。
〔課題を解決するための手段〕
第1図は本発明の原理説明図である。
第1図において,10−1,10−2は共用メモリであって
二重化されているもの,11−1,11−2は入出力パス切断
機構,12−1ないし12−3は各々プロセッサを備えたク
ラスタ,13は入出力パスの物理的な切断処理を行う入出
力パス切断処理部,14は切り離された共用メモリに対す
るアクセスを事前に禁止するアクセス禁止処理部,15は
二重化された共用メモリに対するアクセス管理情報を持
つ制御情報部,P11〜P32は各クラスタと共用メモリ間の
データ転送に用いられる入出力パスを表す。
本発明では,二重化された共用メモリ10−1,10−2
と,各クラスタ12−1〜12−3とを結ぶ入出力パスP11
〜P32について,物理的に切断するハードウェアによる
入出力パス切断機構11−1,11−2が設けられる。
入出力パス切断機構11−1または11−2によって切り
離された共用メモリにアクセスすると,入出力パス切断
機構11−1または11−2を含むハードウェアによる制御
部は,回復可能なエラーを発生させ,その事象をアクセ
ス元クラスタのソフトウェアに,プログラムチェック割
込みなどにより通知する。
各クラスタ12−1〜12−3は,自クラスタのローカル
メモリ内に,共用メモリのどちらの領域をアクセスする
かを決定するための制御情報を管理する制御情報部15を
持つ。
例えばクラスタ12−1が,共用メモリ10−1内の領域
1の障害発生検出により,または使用者からの切り離し
の指示により,共用メモリ10−1を切り離す場合,入出
力パス切断処理部13は,自クラスタ内の制御情報部15に
領域1について使用不可能状態を示す情報を設定し(第
1図),入出力パス切断機構11−1により,共用メモ
リ10−1と全クラスタとを結ぶ入出力パスP11,P21,P31
を物理的に切断する。
他のクラスタ12−2,12−3が,切断された入出力パス
P21,P31を使って,共用メモリ10−1内の領域1にアク
セスすると,物理的に切り離されているため,回復可能
なプログラムチェックが発生する。ここで,回復可能と
は,エラーの割込み処理などを行った後に,元の処理に
復帰できることを意味する。
クラスタ12−2および12−3のアクセス禁止処理部14
は,プログラムチェックを検出することにより,領域1
が使用不可能状態であることを認識し,以後,その領域
1へのアクセスを行わないようにするために,クラスタ
内に存在する制御情報部15に,領域1が使用不可能状態
であることを設定する(第1図,)。
結果的に,共用メモリ10−2上の領域2に対してだ
け,全クラスタがアクセスするようになり,二重化デー
タの保全が実現される。
〔作用〕
本発明では,切り離された領域1への入出力パスP11,
P21,P31が,全クラスタを通じて物理的に切断された状
態となる。
障害検出クラスタ12−1以外のクラスタ12−2,12−3
では,切り離された領域2に対してアクセスするが,そ
の領域1と自クラスタの入出力パスP21,P31が存在しな
いため,プログラムチェックが発生する。
プログラムチェックが発生することで,各クラスタ
は,クラスタ間通信などを用いずに,領域1が切り離さ
れていることを認識することができる。
このように物理的に切断することにより,各クラスタ
は,領域1に対してアクセスしようとしても,アクセス
が不可能な状態になり,接続されている側の領域2だけ
を各クラスタがアクセスするようになる。
クラスタが誤動作した場合にも,切り離された側の領
域1をアクセスすることがなく,二重化データの保全が
実現できる。また,各入出力パスの物理的切断により,
クラスタ間での通信を使用せずに,各クラスタに障害発
生メモリが使用不可能状態である旨を知らせることがで
きる。各クラスタごとに制御情報部15を設けているた
め,共用メモリの二重化データに対するアクセスを高速
に行うことができる。
高速化できる理由は,ローカルメモリのアクセスは共
用メモリのアクセスよりも高速であるので,制御情報を
共用メモリ内に設定した場合に比べて,制御情報を高速
に参照できること,制御情報に関する複雑な排他制御等
を行う必要がないことなどである。
〔実施例〕
第2図は本発明の一実施例による状態遷移の例,第3
図は本発明の一実施例処理フロー,第4図は本発明の一
実施例で用いる入出力パス切断機構の説明図を示す。
以下,説明を簡単にするために,クラスタが2つの場
合を例に説明するが,3以上の場合にも同様に適用でき
る。
第2図(イ)は,通常の二重化された共用メモリ10−
1,10−2を介した複数クラスタ12a,12bによるシステム
の運用状態を示している。領域1が主系であり,領域2
が従系である。主系はリード/ライトの対象となり,従
系はライト・アクセスのみ行われる。
第2図(ロ)に示すように,クラスタ12aが領域1に
アクセスし,障害を検出したとする。
クラスタ12aは,領域1の障害を検出すると,第2図
(ハ)に示すように,内部の制御情報中で,主系を領域
2に書き換え,領域1については使用不可能状態とす
る。それとともに,クラスタ12aから領域1への入出力
パスおよびクラスタ12bから領域1への入出力パスを切
断する。この状態では,クラスタ12b中の制御情報は,
元のままである。
クラスタ12bにおいて,二重化データに対するアクセ
ス要求のため,第2図(ニ)に示すように,領域1にア
クセスしたとする。
クラスタ12bが領域1にアクセスすると,領域1に対
する入出力パスが切断されているため,第2図(ホ)に
示すように,プログラムチェックが発生する。
クラスタ12bは,プログラムチェックが発生すると,
領域1が切り離されていることを認識し,内部の制御情
報中で,主系を領域2に書き換え,領域1については使
用不可能状態とする。
これにより,以後,領域1について全クラスタのアク
セスが行われないようになり,領域2だけによる片肺運
転が行われるようになる。
領域1を障害により切り離す場合の例について説明し
たが,オペレータ等の指示により,領域1を切り離す場
合も同様である。
処理の流れは,例えば第3図に示す〜のようにな
る。
例えばクラスタ12aが二重化された一方の領域で障
害発生を検出したとする。
領域1で障害が発生したか領域2で障害が発生した
かを判定する。
領域1で障害が発生した場合,内部制御表の更新を
行った後,領域1と全クラスタとの入出力パスを切断す
る。なお,領域2で障害が発生した場合には,領域2と
全クラスタとの入出力パスを切断する。
クラスタ12aが入出力パスの切断を行った後,障害
を知らない他のクラスタ12bが,領域アクセスを行った
とする。
一方の領域でプログラムチェックが発生する。
領域1のアクセスでプログラムチェックが発生した
か,領域2のアクセスでプログラムチェックが発生した
かを判定する。
領域1でプログラムチェックが発生した場合,内部
の制御表中で領域1を使用不可能状態にする。領域2で
プログラムチェックが発生した場合には,領域2に対し
て同様の処理を行う。
以上の処理により,一方の領域の切り離しが行われる
と,以後,他方の領域だけによる片肺運転が行われるこ
とになる。
第1図に示す入出力パス切断機構11−1,11−2は,ス
イッチその他により,各クラスタから共用メモリに対す
るアクセスを物理的に不可能にすることができるもので
あれば,どのようなものでもよい。
本実施例で用いている入出力パス切断機構等は,第4
図に示すような構造になっている。
共用メモリ10−1,10−2は,第4図に示すように,デ
ータを格納する記憶機構40と,共用メモリ全体の制御ま
たはクラスタ12との通信を司る制御機構41に分かれてい
る。
各クラスタ12との通信は,制御機構41にあるポート43
を介して行われる。各クラスタ12ごとに,1つのポート43
が固定的に割り当てられる。
ポート43には,有効と無効の2つの状態が存在し,そ
の状態制御のために,各ポート43と1対1に対応する1
ポートにつき1ビットの制御メモリ42が,制御機構41内
に存在する。この制御メモリ42は,記憶機構40内のメモ
リとは別のものである。
この制御メモリ42のビットが“1"のとき,対応するポ
ート43の状態は有効であり,そのポート43に割り当てら
れているクラスタ12は,共用メモリとの通信が可能であ
る。この状態では,クラスタ12が共用メモリとのデータ
転送を行なえるだけでなく,制御メモリ全体の内容の変
更も可能である。すなわち,有効状態のポート43につな
がっているクラスタ12は,他のポート43の状態を変更す
ることも可能である。
無効状態のポート43につながっているクラスタ12は,
データ転送を行えないばかりでなく,制御メモリの変更
も行えない。
以上の機構により,障害が発生した共用メモリに関す
る全クラスタ12のポート43を無効状態とすることで,各
クラスタ12からデータ転送を行うことを物理的に抑止す
ることができる。これにより,クラスタ12の誤動作によ
るデータの破壊を避けることも可能となる。
〔発明の効果〕
本発明による効果は以下のとおりである。
(a) データを保証した状態で,共用メモリの切り離
しを,高速かつ簡単に実現できる。クラスタ間の通信は
不要である。
(b) 切り離された共用メモリは,単にソフトウェア
によりアクセスを禁止するだけでなく,物理的にもアク
セスできない状態になるので,システムの誤動作の危険
がない。
(c) 共用メモリ内に使用可否を管理する情報を持つ
必要がないので,共用メモリの二重化データに対するア
クセスを高速に行うことができる。
(d) 共用メモリの切り離しに関する処理について,
クラスタごとの独立性が強いため,信頼性が高い。
【図面の簡単な説明】
第1図は本発明の原理説明図, 第2図は本発明の一実施例による状態遷移の例, 第3図は本発明の一実施例処理フロー, 第4図は本発明の一実施例で用いる入出力パス切断機構
の説明図, 第5図は従来技術の例を示す。 図中,10−1,10−2は共用メモリ,11−1,11−2は入出力
パス切断機構,12−1〜12−3はクラスタ,13は入出力パ
ス切断処理部,14はアクセス禁止処理部,15は制御情報
部,P11〜P32は入出力パスを表す。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭58−16362(JP,A) 特開 昭60−93566(JP,A) 特開 昭62−197858(JP,A)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】プロセッサを有する複数のクラスタ(12−
    1,12−2,…)と,入出力パス(P11,P12,…)を介して各
    クラスタに接続される二重化された共用メモリ(10−1,
    10−2)とを備えた複合計算機システムにおいて, 共用メモリとクラスタとを結ぶ入出力パスを物理的に切
    断する入出力パス切断機構(11−1,11−2)を備えると
    ともに, 前記各クラスタは, 二重化された共用メモリの各領域の有効/無効を管理す
    る制御情報部(15)と, 共用メモリ上の領域を,障害または外部からの指定によ
    り切り離すときに,前記制御情報部にその領域が無効で
    あることを設定し,前記入出力パス切断機構により,そ
    の領域と各クラスタとを結ぶ全入出力パスを切断する処
    理を行う入出力パス切断処理部(13)と, 切断された入出力パスを使用することにより,アクセス
    が異常終了した場合に,前記制御情報部にその領域が無
    効であることを設定し,以後,その領域に対するアクセ
    スを禁止するアクセス禁止処理部(14)とを備えたこと
    を特徴とする二重化データ保全装置。
JP2128324A 1990-05-18 1990-05-18 二重化データ保全装置 Expired - Fee Related JP2716571B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2128324A JP2716571B2 (ja) 1990-05-18 1990-05-18 二重化データ保全装置
EP91107879A EP0457308B1 (en) 1990-05-18 1991-05-15 Data processing system having an input/output path disconnecting mechanism and method for controlling the data processing system
DE69124285T DE69124285T2 (de) 1990-05-18 1991-05-15 Datenverarbeitungssystem mit einem Eingangs-/Ausgangswegetrennmechanismus und Verfahren zur Steuerung des Datenverarbeitungssystems
US08/249,046 US5548743A (en) 1990-05-18 1994-05-24 Data processing system with duplex common memory having physical and logical path disconnection upon failure
US08/430,315 US5568609A (en) 1990-05-18 1995-04-28 Data processing system with path disconnection and memory access failure recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2128324A JP2716571B2 (ja) 1990-05-18 1990-05-18 二重化データ保全装置

Publications (2)

Publication Number Publication Date
JPH0423149A JPH0423149A (ja) 1992-01-27
JP2716571B2 true JP2716571B2 (ja) 1998-02-18

Family

ID=14981964

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2128324A Expired - Fee Related JP2716571B2 (ja) 1990-05-18 1990-05-18 二重化データ保全装置

Country Status (1)

Country Link
JP (1) JP2716571B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011121666A1 (ja) 2010-03-31 2011-10-06 富士通株式会社 マルチクラスタシステム

Also Published As

Publication number Publication date
JPH0423149A (ja) 1992-01-27

Similar Documents

Publication Publication Date Title
US5548743A (en) Data processing system with duplex common memory having physical and logical path disconnection upon failure
EP1839156B1 (en) Managing multiprocessor operations
US6732231B1 (en) System and method for management of mirrored storage devices storing device serial numbers
JPH0420493B2 (ja)
JP3987241B2 (ja) 系間情報通信システム
JP2000181887A (ja) 情報処理装置における障害処理方法及び記憶制御装置
JP2000181887A5 (ja)
US6490662B1 (en) System and method for enhancing the reliability of a computer system by combining a cache sync-flush engine with a replicated memory module
JP2716571B2 (ja) 二重化データ保全装置
JPS6057091B2 (ja) 共通メモリの記憶保護方式
JPH0238969B2 (ja)
JP2862424B2 (ja) 情報処理装置
JPH06259274A (ja) 二重系システム
JPH07319637A (ja) ディスク装置の制御装置およびディスク装置の制御方 法
JPH08179994A (ja) コンピュータシステム
JPH08329027A (ja) 中央処理二重化システムにおけるクロスコールディスクアクセス方法とその方式
JPH0324634A (ja) 二重系システム装置
JPH0460750A (ja) クラスタ停止装置
JP2640139B2 (ja) メモリカード
JP2810265B2 (ja) データ蓄積装置及び情報処理システム
KR20030068663A (ko) 이중화 보드간의 비휘발성 메모리 정보 동기화 장치 및 방법
JP3214551B2 (ja) 競合検出故障診断方式、競合検出故障診断方法、バスコンバータ、および記録媒体
JPH0727468B2 (ja) 二重化情報処理装置
JPH10187355A (ja) ディスク制御システム
JPH05127935A (ja) 二重系計算機装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081107

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081107

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091107

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees