JPH11120154A - コンピュータシステムにおけるアクセス制御装置および方法 - Google Patents

コンピュータシステムにおけるアクセス制御装置および方法

Info

Publication number
JPH11120154A
JPH11120154A JP9286329A JP28632997A JPH11120154A JP H11120154 A JPH11120154 A JP H11120154A JP 9286329 A JP9286329 A JP 9286329A JP 28632997 A JP28632997 A JP 28632997A JP H11120154 A JPH11120154 A JP H11120154A
Authority
JP
Japan
Prior art keywords
access
error
shared memory
memory module
control device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9286329A
Other languages
English (en)
Inventor
Takashi Fujita
隆司 藤田
Atsushi Funaki
淳 船木
Wahei Yamada
和平 山田
Hideki Nakagawa
秀樹 中川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP9286329A priority Critical patent/JPH11120154A/ja
Publication of JPH11120154A publication Critical patent/JPH11120154A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 マルチプロセッサシステムにおいて、CPU
のソフトウェアに依存することなく、システムの信頼性
を維持することが課題である。 【解決手段】 プロセッサモジュール内の接続ユニット
制御部23は、メモリ25に格納されたマイクロプログ
ラムを実行して、CPU21から共有メモリモジュール
へのアクセスを監視する。そして、アクセスエラーが発
生すると、マイクロプログラム実行部24は、マイクロ
プログラムの指示に従ってリトライ等の救済処理を行
う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、複数のプロセッサ
モジュール(プロセッシングモジュール)と共有メモリ
がシステムバスを介して接続されたマルチプロセッサシ
ステムの高信頼性技術に関する。
【0002】
【従来の技術とその問題点】従来のマルチプロセッサシ
ステムにおいては、プロセッサモジュールから共有メモ
リモジュールへの同期アクセス時にエラーが発生した場
合、中央処理ユニット(CPU)に対して例外の発生が
通知される。ここで、同期アクセスとは、CPUが共有
メモリモジュールに対して直接アクセスすることを意味
し、例外の発生は、メモリコントローラなどのシステム
コントローラからCPUに通知される。このとき、CP
Uが例外処理を行って、ソフトウェアによりエラーの解
析およびリカバリが行われる。
【0003】このような例外処理は、システムバスの仕
様やシステムバスの接続ユニットにより処理方法が異な
り、システムバスが異なるとソフトウェアも変更する必
要がある。したがって、システムの性能を上げるために
システムバスの仕様を変更すると、それに伴って例外処
理のソフトウェアも変更する必要がある。また、このソ
フトウェアは、専用のオペレーティングシステムの下で
しか動作せず、汎用のオペレーティングシステム上で動
作させることができない。
【0004】また、近年、CPUを高速化するために、
回路を削減して、簡素化した回路構成が用いられるよう
になっている。このような簡素化に伴い、例外発生時の
動作保証を行うために必要な回路も削減され、同期アク
セスにおいてCPUに例外が発生すると、その後の動作
を保証することが困難になってきている。
【0005】例えば、最高300MHz程度の性能を持
つCPUを搭載したシステムでは、例外が発生したとき
に、プログラムカウンタの値を正しくセットできない場
合がある。したがって、従来の処理方法のままでは、高
速のCPUを使用して高信頼性コンピュータシステムを
構築することが非常に困難である。
【0006】本発明の課題は、マルチプロセッサシステ
ムにおいて、CPUのソフトウェアを変更することなく
システムの信頼性を維持し、例外処理後の動作が保証さ
れないようなCPUを用いた場合でもそれを維持するこ
とのできるアクセス制御装置およびその方法を提供する
ことである。
【0007】
【課題を解決するための手段】図1は、本発明のアクセ
ス制御装置の原理図である。図1のアクセス制御装置
は、複数のプロセッサモジュール1と、共有メモリモジ
ュール2とを有するマルチプロセッサシステムのための
アクセス制御を行い、格納手段3と実行手段4を備え
る。
【0008】格納手段3は、上記複数のプロセッサモジ
ュール1のうちの1つのプロセッサモジュールから上記
共有メモリモジュール2へのアクセスを制御するための
マイクロプログラムを格納する。実行手段4は、上記マ
イクロプログラムを実行して上記アクセスの結果を監視
し、そのアクセスにおいてエラーが発生した場合に、そ
のエラーを救済するための処理を行う。
【0009】このアクセス制御装置は、例えば、各プロ
セッサモジュール1内に設けられ、CPUのソフトウェ
アによる共有メモリモジュール2へのアクセスを監視す
る。実行手段4は、共有メモリモジュール2からの応答
をチェックして、アクセスエラーが発生したことを認識
すると、マイクロプログラムの記述に従って、アクセス
のリトライや故障モジュールの切り離し等の救済処理を
行う。
【0010】このように、アクセスエラーの監視と救済
の処理を、ソフトウェアに代わってマイクロプログラム
が実行することにより、CPUに依存することなく、エ
ラーを救済することが可能になる。したがって、システ
ムバスが変更されても、CPUのソフトウェアを変更す
ることなく、システムの信頼性を維持することができ
る。また、例外処理後の動作が保証されないようなCP
Uを用いた場合でも、システムの信頼性を維持すること
ができる。
【0011】例えば、図1の格納手段3は、後述する図
3のマイクロプログラムメモリ25に対応し、実行手段
4はマイクロプログラム実行部24に対応する。
【0012】
【発明の実施の形態】以下、図面を参照しながら、本発
明の実施の形態を詳細に説明する。図2は、実施形態の
マルチプロセッサシステムの構成図である。図2のマル
チプロセッサシステムでは、二重化されたシステムバス
11に複数のプロセッサモジュール(PM)12および
複数の共有メモリモジュール(SSM)13が接続され
ている。バスハンドラ(BH)14は、各システムバス
11に接続され、そのアービトレーション機能を有す
る。
【0013】各プロセッサモジュール12は、図3に示
すように、CPU21、メインメモリ22、システムバ
ス11に接続される接続ユニット(バスコントローラ)
26、接続ユニット26の制御を行う接続ユニット制御
部23、およびマイクロプログラムを格納するマイクロ
プログラムメモリ25を備える。また、接続ユニット制
御部23には、メモリ25に格納されたマイクロプログ
ラムを実行するマイクロプログラム実行部24が含まれ
ている。
【0014】ここでは、プロセッサモジュール12は4
つのCPU21を含んでいるが、一般に、CPU21の
個数は任意である。CPU21、メインメモリ22、お
よび接続ユニット制御部23は、内部バス27により互
いに接続されており、マイクロプログラムメモリ25お
よび各接続ユニット26も、接続ユニット制御部23に
接続されている。内部バス27は、データ系の信号を転
送するデータバスと制御系の信号を転送する制御バスと
を含む。
【0015】また、各共有メモリモジュール13は、図
4に示すように、複数のプロセッサモジュール12から
アクセスされる共有メモリ31と、システムバス11に
接続される接続ユニット32を備え、それらは内部バス
33により互いに接続されている。
【0016】本発明においては、各PMの接続ユニット
制御部23にマイクロプログラムを実行する機能を持た
せ、マイクロプログラム実行部24が接続ユニット26
を経由するPMからSSMへのアクセス内容を制御す
る。したがって、接続ユニット制御部23およびマイク
ロプログラムメモリ25がアクセス制御装置に対応す
る。
【0017】PMからSSMへのアクセス時にエラーが
発生した場合、マイクロプログラムに従ってマイクロプ
ログラム実行部24がエラー救済のための処理を行う。
これにより、PMのCPU21で走行するソフトウェア
には一切の変更を必要とせずに、PMからSSMへのア
クセスの信頼性を高めることができる。
【0018】また、PMからSSMへのシステムバスを
経由したアクセスにおいてアクセスエラーが発生した場
合、それを検出したPMの接続ユニット制御部23内の
マイクロプログラムの処理により、アクセスの無条件リ
トライを一定時間または一定回数繰り返す。これによ
り、PMからSSMへのアクセスの信頼性を高めること
ができる。
【0019】また、マイクロプログラムの処理により、
アクセスエラーの種類によって間隔を変更してリトライ
を行うことで、PMからSSMへのアクセスの信頼性を
高める。例えば、SSMがビジーであることを示すエラ
ーが発生した場合は、リトライ間隔を長くし、システム
バスのテンポラリの故障(間欠障害)の場合は、リトラ
イ間隔を短くすることにより、システムの性能を落とす
ことなく、アクセスの信頼性を高めることができる。
【0020】また、マイクロプログラムの処理により、
システムバスの経路を変更することで、PMからSSM
へのアクセスの信頼性を高める。また、マイクロプログ
ラムの処理により、アクセスエラーの解析を行い、シス
テムバスの固定障害と判断した場合は、システムバスを
使用不可にするようにBHに指示することで、以降のP
MからSSMへのアクセスの正常性を確保する。
【0021】また、マイクロプログラムの処理によっ
て、定期的にSSMおよびシステムバスの診断を行い、
アクセスエラーを監視する。そして、診断時に発生した
アクセスエラーの解析を行い、故障モジュールを特定し
て、それをCPU21に割込みにて通知したり、故障モ
ジュールを切り離したりする。これにより、CPU21
がSSMに対してアクセスする前に、故障モジュールを
特定して切り離し、以降のPMからSSMへのアクセス
の正常性を確保することができる。
【0022】また、マイクロプログラムの処理により、
PMからSSMへのライトアクセス時に複数のSSMに
同じデータを書き込む。そして、PMからSSMへのリ
ードアクセス時には、同一のデータを書き込まれた複数
のSSMのうちの1つからデータを読み出す。このよう
に、同一のメモリ内容を持つ複数のSSMを作り出すこ
とで、そのうちの1つのSSMが切り離されても、シス
テムの運用を継続することができる。
【0023】マイクロプログラムの処理により、システ
ム動作中に1つのSSMの全データを新たに挿入された
他のSSMに転送することで、挿入されたSSMを、動
的に他のSSMと同一のメモリ内容を持つSSMにする
ことができる。
【0024】上述の方法によりSSMが二重化されたマ
ルチプロセッサシステムにおいて、PMからSSMへの
リードアクセスでアクセスエラーが発生した場合、マイ
クロプログラムの処理により、各SSMの状態を調査す
る。そして、正常と判定されたSSMからデータを読み
出すことにより、リードアクセスを救済する。
【0025】また、PMからSSMへのアクセスでアク
セスエラーが発生した場合、マイクロプログラムの処理
により、SSMの状態を調査し、異常と判断されたSS
Mをシステムから切り離す。これにより、以降のPMか
らSSMへのアクセスの正常性を確保することができ
る。
【0026】また、マイクロプログラムの処理により、
アクセス救済に要する処理時間を認識し、その時間に応
じて救済内容を変更する。これにより、PMからSSM
へのアクセス時間を一定時間内に制限して、システム全
体の性能低下を防ぐことが可能になる。
【0027】また、1つのPM内に複数のCPU21を
搭載可能なマルチプロセッサシステムにおいて、システ
ムの起動時にCPU21の実装数を接続ユニット制御部
23に入力することで、CPU21の実装状況に応じて
各CPU毎にアクセス救済を行うことができる。
【0028】また、マイクロプログラムの処理によりア
クセスエラーの救済を行った場合、接続ユニット制御部
23がCPU21に対して割込みを発生し、CPU21
上で走行するソフトウェアに対してアクセスエラーの発
生を通知する。これにより、CPU21上で走行するソ
フトウェアが適切なエラー予防処置をとることが可能に
なる。
【0029】また、接続ユニット制御部23が故障モジ
ュールの切り離しを行った場合、割込みとともにアクセ
スエラーの救済内容を通知することにより、CPU上で
走行するソフトウェアにおいてアクセスエラーの発生箇
所の特定を容易にする。
【0030】また、接続ユニット制御部23に、他のP
Mの接続ユニット制御部23との通信機能を設けること
で、接続ユニット制御部23が各PMのアクセスエラー
発生状況を解析して、故障モジュールの特定を行うこと
ができる。
【0031】また、接続ユニット制御部23に他のPM
の接続ユニット制御部23からSSMアクセスエラー統
計情報を読み出す機能を設けることで、接続ユニット制
御部23が各PMのアクセスエラー発生状況を解析し
て、故障モジュールの特定を行うことができる。
【0032】また、マイクロプログラムを書き換え可能
なメモリ装置に格納しておけば、その内容をシステム運
用中に書き換えることが可能になる。上述のような接続
ユニット制御部23を備えることで、ソフトウェアの変
更を必要とせずに、PMからSSMへのアクセスの信頼
性を高めることができる。また、同期アクセスにおい
て、例外発生後の動作を保証しないCPUを使用した場
合でも、PMからSSMへのアクセスの信頼性を高める
ことができる。より具体的には、次の各点で信頼性が向
上する。 (1)システムバスの間欠障害が発生しても、アクセス
のリトライによりシステムの運用を継続できる。 (2)システムバスの固定障害が発生しても、システム
バスの経路変更によりシステムの運用を継続できる。 (3)システムバスの固定障害が発生した場合、システ
ムバスを使用不可にすることにより、性能低下を招くこ
となく、システムの運用を継続できる。 (4)バス診断を定期的に行うことにより、早期に故障
モジュールを発見できる。 (5)SSMを二重化することにより、1つのSSMが
故障してもシステムの運用を継続できる。 (6)故障SSMを切り離すことにより、性能低下を招
くことなく、システムの運用を継続できる。 (7)システム全体のアクセスエラーの統計情報を解析
することにより、故障モジュールの特定を正確に行うこ
とができる。
【0033】次に、図5から図47までを参照しなが
ら、図3の接続ユニット制御部23の各機能を詳細に説
明する。図5は、接続ユニット制御部の構成図である。
図5において、実線の矢印はデータ系の信号線を表し、
破線の矢印は制御系の信号線を表す。接続ユニット制御
部は、インタフェース部41、プログラム実行部24、
セレクタ49、接続ユニットデータ送信制御部50、コ
マンド生成部51、応答データ生成部52、接続ユニッ
トデータ受信制御部53、リトライ用タイマ54、およ
び処理時間監視用タイマ55を含む。
【0034】PMに複数のCPUが搭載されている場合
は、インタフェース部41はその搭載数と同じ数だけ必
要となる。このインタフェース部41は、CPU受信バ
ッファ42、CPUインタフェース制御部43、CPU
送信バッファ45、割込み制御部46、レジスタ制御部
47、およびシステムバスコマンド生成部48を含む。
【0035】CPU受信バッファ42は、CPUからの
SSMリード/ライトアクセスおよびレジスタリード/
ライトのコマンドを受け取るバッファである。CPUイ
ンタフェース制御部43は、CPUからのリード/ライ
トアクセスの起動信号(C.STT)を受信したとき、
CPUからのコマンドを受信バッファ42に格納する。
そして、プログラム実行部24に起動指示を行い、マイ
クロプログラムの指示により、CPUに対して完了応答
(C.END)を送信する。
【0036】また、CPUインタフェース制御部43内
のCPU完了コード通知部44は、CPUインタフェー
ス制御部43がCPUにC.ENDを出力したとき、プ
ログラム実行部24からの指示により、SSMアクセス
の結果を表す完了コードをCPUに通知する。
【0037】割込み制御部46は、バス診断にて故障モ
ジュールを特定した場合またはアクセスエラーを救済し
た場合に、それをCPUに通知するための割込みを発生
させる。CPU送信バッファ45は、SSMリードデー
タ、CPU実装情報、救済内容、システム構成情報等の
情報をCPUに通知する。
【0038】レジスタ制御部47は、CPUからのコマ
ンドを転送するシステムバスの経路を決定する機能、コ
マンドの発行元を表すSource−IDを設定する機
能、およびCPU実装情報やシステム構成情報を設定す
る機能を持つ。システムバスの経路は、2つのシステム
バスの一方に対応する識別子であるBUSNOを用いて
指定される。また、Source−ID、CPU実装情
報、およびシステム構成情報は、PMに設けられた外部
ピンまたはレジスタライトにより設定される。
【0039】システムバスコマンド生成部48は、プロ
グラム実行部24の指示により、CPUからのコマンド
を元に各種コマンドを作成して、接続ユニットデータ送
信制御部50に通知する。
【0040】接続ユニットデータ送信制御部50は、プ
ログラム実行部24の指示により、システムバスコマン
ド生成部48、コマンド生成部51、および応答データ
生成部52からのデータを接続ユニットに送信する。こ
のとき、セレクタ49は、プログラム実行部24の指示
により、システムバスコマンド生成部48、コマンド生
成部51、および応答データ生成部52のうちいずれか
からのデータを入力として選択する。
【0041】コマンド生成部51は、プログラム実行部
24の指示により、各種コマンドを生成する。応答デー
タ生成部52は、プログラム実行部24の指示により、
各種応答データを生成する。接続ユニットデータ受信制
御部53は、接続ユニットからの各種コマンド/応答を
受信し、プログラム実行部24に通知する。
【0042】リトライ用タイマ54は、アクセスエラー
の種類によりリトライの間隔を変える場合に使用され、
処理時間監視用タイマ55は、アクセスエラー救済に要
した処理時間をプログラム実行部24に通知する。
【0043】プログラム実行部24は、マイクロプログ
ラムメモリ25からマイクロプログラムを読み出し、そ
の命令を実行する。マイクロプログラムメモリ25は、
プログラム実行部24が実行する命令を格納するメモリ
であり、リードオンリメモリ(ROM)の場合とリード
/ライト共に可能なランダムアクセスメモリ(RAM)
の場合とがある。
【0044】CPUがSSMにアクセスする場合、接続
ユニット制御部に起動信号C.STTを出力するととも
に、コマンドを発行する。接続ユニット制御部では、信
号C.STTを受領したCPUインタフェース制御部4
3が動作し、図6に示すように、CPU受信バッファ4
2にCPUからのコマンドを格納する。
【0045】図6において、“Command”はSS
Mリード、SSMライト、レジスタリード、レジスタラ
イト等のアクセス種別を表し、“Address”はS
SM等の対象モジュールのアドレス(36ビット)を表
し、“Data”はライトデータ等を表す。そして、C
PUインタフェース制御部43は、コマンドを格納した
ことをレジスタ制御部47とプログラム実行部24に通
知する。
【0046】これを受けて、プログラム実行部24は、
システムバスコマンド生成部48にSSMアクセスコマ
ンドを生成するように指示する。これにより、システム
バスコマンド生成部48は、図7に示すように、CPU
受信バッファ42からの“Command”、“Add
ress”、および“Data”と、レジスタ制御部4
7からのBUSNO、SSM−ID、およびSourc
e−IDを用いて、SSMアクセスコマンドを生成す
る。生成されたSSMアクセスコマンドは、システムバ
スコマンド生成部48内のCPU受信コマンド保持バッ
ファ60に格納される。
【0047】レジスタ制御部47は、図8に示すよう
に、経路情報制御部61、SSM−ID制御部62、S
ource−IDレジスタ63、CPU実装情報レジス
タ64、およびシステム構成情報レジスタ65を含んで
いる。そして、CPUインタフェース制御部43からの
通知を受けて、BUSNO、SSM−ID、およびSo
urce−IDを決定する。
【0048】BUSNOは、次のようにして決定され
る。経路制御部61は、FPTHビットとPSELビッ
トを含むレジスタ66を有し、これらのビットの値はC
PU上で動作するソフトウェアにより制御される。経路
制御部61は、FPTH=1の場合、PSELの値をB
USNOとしてシステムバスコマンド生成部48に通知
する。また、FPTH=0の場合は、CPU受信コマン
ド保持バッファ60に保持されている36ビットの“A
ddress<35:0>”のうち“Address<
8>”の値を読み出し、それをBUSNOとしてシステ
ムバスコマンド生成部48に通知する。
【0049】また、SSM−IDは、次のようにして決
定される。SSMには複数のPMの共有データが格納さ
れているため、SSMに故障が発生するとシステムが停
止してしまう。そこで、1つのアドレスにマスタSSM
とスレーブSSMの2つを割り当て、同じデータをそれ
らの2つのSSMに保持させる。このように、SSMを
二重化することで、一方のSSMが故障しても他方のS
SMを使用することができ、システムの運用を継続する
ことができる。
【0050】SSM−ID制御部62は、ADDRES
S<35:32>、マスタSSM−ID、およびスレー
ブSSM−IDを保持するレジスタ67と、SLVビッ
トを保持するレジスタ68とを有し、これらのレジスタ
のデータはCPU上で動作するソフトウェアにより制御
される。
【0051】SSM−ID制御部62は、CPU受信コ
マンド保持バッファ60に保持されている“Addre
ss<35:0>”のうち“Address<35:3
2>”の値を読み出し、それをADDRESS<35:
32>の値と比較する。そして、“Address<3
5:32>”と一致するADDRESS<35:32>
があれば、それに対応するマスタSSM−IDまたはス
レーブSSM−IDを、システムバスコマンド生成部4
8に通知する。このとき、レジスタ68のSLVの値が
0であればマスタSSM−IDを送信し、SLVの値が
1であればスレーブSSM−IDを送信する。
【0052】また、Source−IDはレジスタ63
に保持され、その値はCPU上で動作するソフトウェア
により制御される。通常、Source−IDとして
は、レジスタ制御部47を含むPMのID(PM−I
D)が設定される。レジスタ制御部47は、レジスタ6
3の値をSource−IDとしてシステムバスコマン
ド生成部48に通知する。
【0053】また、プログラム実行部24は、セレクタ
49の入力をシステムバスコマンド生成部48からの信
号線に設定し、接続ユニットデータ送信制御部50にコ
マンドの送信を指示する。これにより、接続ユニットデ
ータ送信制御部50は、CPU受信コマンド保持バッフ
ァ60に保持されたコマンドを接続ユニットに送信す
る。
【0054】例えば、SSMからデータを読み出すSS
Mリードコマンドは、図9のような形式で発行され、S
SMにデータを書き込むSSMライトコマンドは、図1
0のような形式で発行される。
【0055】図11は、接続ユニット制御部の第1の動
作のフローチャートである。接続ユニット制御部は、ま
ず、CPUからSSMアクセスのためのコマンドを受け
取ると(ステップS1)、上述の動作を行って、転送ア
ドレスと転送データを接続ユニットへ転送する(ステッ
プS2)。そして、SSMからの応答を接続ユニットか
ら受け取ったかどうかを判定し(ステップS3)、それ
を受け取っていなければ、応答があるまで判定を繰り返
す。
【0056】接続ユニットは、SSMから完了コードを
含む応答を受け取ると、接続ユニットデータ受信制御部
53に対してコマンド応答を送信し、接続ユニットデー
タ受信制御部53は、それをプログラム実行部24に通
知する。例えば、図9のSSMリードコマンドに対する
応答は図12のような形式で送られ、図10のSSMラ
イトコマンドに対する応答は図13のような形式で送ら
れる。
【0057】図12、13において、SSM−IDは応
答を発信したSSMのIDを表し、PM−IDは応答を
受信したPMのIDを表し、完了コードは対応するSS
Mのアクセス結果を表す。完了コードが00−のとき
は、アクセスが正常に行われたことを示し、それが01
−のときは、ビジー系のアクセスエラーが発生したこと
を示す。ここで、完了コードに含まれる記号“−”は、
0または1のいずれかの値を表す。
【0058】また、完了コードが10−のときは、相手
先モジュールの故障のためアクセスエラーが発生したこ
とを示し、それが11−のときは、システムバスの故障
のためアクセスエラーが発生したことを示す。また、図
12の“Data”は、SSMから読み出されたデータ
を表す。
【0059】プログラム実行部24は、応答を受け取る
と、それに含まれる完了コードを確認し(ステップS
4)、完了コードがアクセスエラーを示しているかどう
かをチェックする(ステップS5)。そして、アクセス
エラーが発生したと認識した場合、エラーの救済のため
の処理を行って(ステップS6)、ステップS3以降の
動作を繰り返す。
【0060】エラーが救済されると、プログラム実行部
24は、アクセスが正常に完了したことを示す完了コー
ドをCPU完了コード通知部44に格納し、CPUに完
了通知を行うように、CPUインタフェース制御部43
に指示する(ステップS7)。これにより、CPUイン
タフェース制御部43は、完了信号C.ENDと正常完
了コードをCPUに送信し、動作が終了する。
【0061】ステップS6における救済処理としては、
システムに応じて様々な処理が考えられる。以下では、
この救済処理の具体例について説明する。図14は、接
続ユニット制御部の第2の動作のフローチャートであ
る。接続ユニット制御部は、まず、CPUからSSMア
クセスのためのコマンドを受け取ると(ステップS1
1)、転送アドレスと転送データをSSMアクセスコマ
ンドとしてCPU受信コマンド保持バッファ60に格納
し(ステップS12)、それを接続ユニットへ転送する
(ステップS13)。そして、SSMからの応答を接続
ユニットから受け取ったかどうかを判定し(ステップS
14)、それを受け取っていなければ、応答があるまで
判定を繰り返す。
【0062】プログラム実行部24は、応答を受け取る
と、それに含まれる完了コードを確認し(ステップS1
5)、完了コードがアクセスエラーを示しているかどう
かをチェックする(ステップS16)。そして、アクセ
スエラーが発生したと認識した場合、処理時間監視用タ
イマ55の値を参照して、処理時間があらかじめ決めら
れた一定時間を経過したかどうかを判定する(ステップ
S17)。一定時間を経過していなければ、CPU受信
コマンド保持バッファ60のSSMアクセスコマンドを
接続ユニットデータ送信制御部50に転送し、接続ユニ
ットデータ送信制御部50にSSMアクセスコマンドを
発行するように指示する(ステップS18)。このコマ
ンドの再発行はリトライと呼ばれ、完了コードが正常と
なるか、または、処理時間が一定時間を経過するまで繰
り返される。
【0063】ステップS16において完了コードが正常
となると、プログラム実行部24は、アクセスが正常に
完了したことを示す完了コードをCPU完了コード通知
部44に格納し、CPUに完了通知を行うように、CP
Uインタフェース制御部43に指示する(ステップS1
9)。これにより、CPUインタフェース制御部43
は、完了信号C.ENDと正常完了コードをCPUに送
信し、動作が終了する。
【0064】また、ステップS17において処理時間が
一定時間を経過した場合、リトライを打ち切る。そし
て、アクセスが異常終結したことを示す完了コードをC
PU完了コード通知部44に格納し、CPUに完了通知
を行うように、CPUインタフェース制御部43に指示
する(ステップS20)。これにより、CPUインタフ
ェース制御部43は、完了信号C.ENDと異常完了コ
ードをCPUに送信し、動作が終了する。
【0065】ステップS17において、処理時間が一定
時間を経過したときにリトライを打ち切る代わりに、リ
トライ回数が一定回数を越えたときにそれを打ち切るよ
うにしてもよい。
【0066】ところで、SSMアクセスエラーには、シ
ステムバスがビジー状態にある場合やSSMがビジー状
態にある場合のように、ある一定時間の間必ず発生する
ものと、システムバスパリティエラーのように非常に短
い時間しか発生しないものとがある。もし、エラーの種
類に無関係に即時リトライを行うと、リトライに起因す
るシステムバスのビジー期間が長くなり、バスのスルー
プットが低下する。また、エラーの種類に無関係に一定
時間待ってリトライを行うと、エラー救済の処理時間が
長くなり、CPUに対するレスポンスが低下する。
【0067】そこで、リトライ用タイマ54を用いて、
エラーの種類に応じてリトライ間隔を変更することによ
り、性能の低下を招くことなく、エラーの救済を行うこ
とが可能になる。
【0068】図15は、このようなリトライ方法に基づ
く、接続ユニット制御部の第3の動作のフローチャート
である。接続ユニット制御部は、まず、CPUからSS
Mアクセスのためのコマンドを受け取ると(ステップS
21)、転送アドレスと転送データをSSMアクセスコ
マンドとしてCPU受信コマンド保持バッファ60に格
納し(ステップS22)、それを接続ユニットへ転送す
る(ステップS23)。そして、SSMからの応答を接
続ユニットから受け取ったかどうかを判定し(ステップ
S24)、それを受け取っていなければ、応答があるま
で判定を繰り返す。
【0069】プログラム実行部24は、応答を受け取る
と、それに含まれる完了コードを確認し(ステップS2
5)、完了コードがアクセスエラーを示しているかどう
かをチェックする(ステップS26)。そして、アクセ
スエラーが発生したと認識した場合、エラーの種類がビ
ジー系かそれ以外かを判定する(ステップS27)。
【0070】ここで、完了コードが01−の場合はビジ
ー系のエラーと判定し、リトライ用タイマ54をスター
トさせて一定時間待機する(ステップS28)。そし
て、一定時間が経過すると、CPU受信コマンド保持バ
ッファ60のSSMアクセスコマンドを接続ユニットデ
ータ送信制御部50に転送し、接続ユニットデータ送信
制御部50にリトライを指示する(ステップS29)。
これにより、ステップS24以降の動作が繰り返され
る。
【0071】また、完了コードが10−または11−の
場合は、プログラム実行部24はビジー系以外のエラー
と判定し、直ちにステップS29以降の動作を行う。そ
して、ステップS26において完了コードが正常になる
と、接続ユニット制御部は、CPUに正常応答を行い
(ステップS30)、動作を終了する。
【0072】本実施形態では、図2に示したように、P
MとSSMは二重化されたシステムバスに接続されてい
るため、システムバス故障によるSSMアクセスエラー
が発生した場合、システムバスを切り替えて使用するこ
とで、エラーを救済することができる。図16は、シス
テムバスを切り替えてエラーを救済する、接続ユニット
制御部の第4の動作のフローチャートである。接続ユニ
ット制御部は、まず、CPUからSSMアクセスのため
のコマンドを受け取ると(ステップS31)、転送アド
レスと転送データとBUSNOをSSMアクセスコマン
ドとしてCPU受信コマンド保持バッファ60に格納し
(ステップS32)、それを接続ユニットへ転送する
(ステップS33)。そして、SSMからの応答を接続
ユニットから受け取ったかどうかを判定し(ステップS
34)、それを受け取っていなければ、応答があるまで
判定を繰り返す。
【0073】プログラム実行部24は、応答を受け取る
と、それに含まれる完了コードを確認し(ステップS3
5)、完了コードがアクセスエラーを示しているかどう
かをチェックする(ステップS36)。そして、アクセ
スエラーが発生したと認識した場合、そのときのBUS
NOをCPU受信コマンド保持バッファ60から読み出
す(ステップS37)。
【0074】ここで、BUSNOが0の場合はそれを1
に書き換えて(ステップS38)、CPU受信コマンド
保持バッファ60のSSMアクセスコマンドを接続ユニ
ットデータ送信制御部50に転送し、接続ユニットデー
タ送信制御部50にリトライを指示する(ステップS3
9)。また、BUSNOが1の場合はそれを0に書き換
えて(ステップS40)、ステップS39の動作を行
う。
【0075】これにより、CPUが指示したものとは異
なるシステムバスを使用してリトライが行われ、ステッ
プS34以降の動作が繰り返される。そして、ステップ
S36において完了コードが正常になると、接続ユニッ
ト制御部は、CPUに正常応答を行い(ステップS4
1)、動作を終了する。
【0076】ステップS37において、プログラム実行
部24は、完了コードの値を調べ、それが11である場
合、すなわち、システムバスの故障が発生したと認識し
た場合のみ、BUSNOを書き換える救済処理を行うよ
うにしてもよい。この場合、完了コードが他のアクセス
エラーを示していれば、異なる救済処理が行われる。
【0077】また、システムバスに固定的な障害が発生
すると、常にアクセスエラーの救済処理が行われて、性
能低下を招くことになる。このような場合には、障害の
発生したシステムバスを切り離すことが望ましい。
【0078】図17は、システムバスを切り離してエラ
ーを救済する、接続ユニット制御部の第5の動作のフロ
ーチャートである。接続ユニット制御部は、まず、CP
UからSSMアクセスのためのコマンドを受け取ると
(ステップS51)、転送アドレスと転送データとBU
SNOをSSMアクセスコマンドとしてCPU受信コマ
ンド保持バッファ60に格納し(ステップS52)、そ
れを接続ユニットへ転送する(ステップS53)。そし
て、SSMからの応答を接続ユニットから受け取ったか
どうかを判定し(ステップS54)、それを受け取って
いなければ、応答があるまで判定を繰り返す。
【0079】プログラム実行部24は、応答を受け取る
と、それに含まれる完了コードを確認し(ステップS5
5)、完了コードがアクセスエラーを示しているかどう
かをチェックする(ステップS56)。そして、アクセ
スエラーが発生したと認識した場合、エラーの種類を判
定する(ステップS57)。
【0080】ここで、エラーの種類は、例えば、エラー
の連続発生回数を元にして判定される。同じシステムバ
スを使用したアクセスを複数回繰り返し、エラーの連続
発生回数が一定数以上の場合は、固定障害に起因するエ
ラーと認識され、それが一定数未満の場合は、間欠障害
に起因するエラーと認識される。
【0081】エラーが間欠障害に起因していると認識し
た場合、CPU受信コマンド保持バッファ60のBUS
NOを書き換えて、システムバスの経路を変更し(ステ
ップS58)、SSMアクセスコマンドを接続ユニット
データ送信制御部50に転送して、接続ユニットデータ
送信制御部50にリトライを指示する(ステップS5
9)。これにより、ステップS54以降の動作が繰り返
される。
【0082】また、エラーが固定障害に起因していると
認識した場合、プログラム実行部24は、システムバス
を切り離すコマンドを生成するように、コマンド生成部
51に指示する(ステップS60)。これにより、コマ
ンド生成部51は、図18に示すようなバスハンドラ切
り離しコマンドを生成する。
【0083】また、プログラム実行部24は、セレクタ
49に対して、入力をコマンド生成部51からの信号線
に切り替えるように指示し、接続ユニットデータ送信制
御部50に対して、システムバスの管理を行うBHに、
バスハンドラ切り離しコマンドを、別のシステムバスを
経由して発行するように指示する。これにより、バスハ
ンドラ切り離しコマンドがBHに発行され、BHの制御
により、固定障害の発生したシステムバスが使用不可と
なる。そして、図19に示されるような応答が、BHか
ら接続ユニット制御部に返送される。
【0084】次に、プログラム実行部24は、ステップ
S58以降の動作を行って、別のシステムバスを用いた
リトライを実行する。そして、ステップS36において
完了コードが正常になると、接続ユニット制御部は、C
PUに正常応答を行い(ステップS61)、動作を終了
する。このようにしてシステムバスを切り離すことによ
り、システムバスの故障箇所の調査を行い、修理するこ
とが可能となる。
【0085】ステップS57において、プログラム実行
部24は、完了コードの値を調べ、システムバスの故障
が発生したと認識した場合のみ、経路を変更する救済処
理を行うようにしてもよい。この場合、完了コードが他
のアクセスエラーを示していれば、異なる救済処理が行
われる。
【0086】図20は、エラーの発生時に、SSM等の
モジュールからPMに返送される完了コードの種類を示
している。完了コードが01−、10−のときは、それ
ぞれ、ビジー系のエラー、相手先モジュールの故障を表
す。特に、完了コードが100のときは、マスタSSM
またはBHの故障を表し、それが101のときは、スレ
ーブSSMの故障を表す。したがって、完了コードの最
後のビットにより、マスタとスレーブを判別することが
できる。
【0087】また、完了コードが11−のときはシステ
ムバスの故障を表し、そのときのBUSNOに対応する
経路に障害が発生しているものと認識される。ここで
は、1つの経路上で完了コード11−のエラーが連続し
て4回以上発生すると固定障害と判定され、連続発生回
数が4回未満の場合は間欠障害と判定される。
【0088】また、CPUがSSMアクセスを行ってい
ない期間に、プログラム実行部24が一定間隔でSSM
リードアクセスを行って、SSMおよびシステムバスを
診断することも可能である。
【0089】図21は、SSMおよびシステムバスの診
断を行う、接続ユニット制御部の第6の動作のフローチ
ャートである。接続ユニット制御部は、まず、SSM/
BHに保持されている診断データの読み出しを接続ユニ
ットに指示する(ステップS71)。診断データは、適
当なダミーデータであり、SSM/BHの適当なアドレ
スに格納されている。
【0090】SSMの診断データを読み出す場合、プロ
グラム実行部24は、コマンド生成部51に、図9のよ
うなSSMリードコマンドを生成するように指示し、接
続ユニットデータ送信制御部50に、そのコマンドを接
続ユニットに転送するように指示する。BHの診断デー
タを読み出す場合も、コマンド生成部51により、同様
のリードコマンドが生成される。そして、SSM/BH
からの応答を接続ユニットから受け取ったかどうかを判
定し(ステップS72)、それを受け取っていなけれ
ば、応答があるまで判定を繰り返す。
【0091】プログラム実行部24は、応答を受け取る
と、それに含まれる完了コードを確認し(ステップS7
3)、完了コードがアクセスエラーを示しているかどう
かをチェックする(ステップS74)。そして、アクセ
スエラーが発生したと認識した場合、図17の場合と同
様にして、エラーの種類を判定する(ステップS7
5)。
【0092】エラーが間欠障害に起因していると認識し
た場合、エラーの統計情報を収集し(ステップS7
6)、それを解析して故障モジュールを特定する。そし
て、故障モジュールを割込みによりCPUに通知して
(ステップS77)、動作を終了する。
【0093】例えば、SSMリードアクセスのエラーの
場合は、プログラム実行部24は、BUSNO、相手先
のSSM−ID、完了コード、エラー発生回数等をレジ
スタに記録して、図22に示すようなSSMアクセス統
計情報を作成する。そして、それを解析して、エラー発
生回数の多いSSMを故障モジュールとみなし、そのS
SM−IDに対応するレジスタ制御部47のADDRE
SS<35:32>の情報を、CPU送信バッファ45
を介してCPUに送信する。CPU上で動作するソフト
ウェアは、受け取った情報を元にして、故障モジュール
へのアクセスを回避することができる。
【0094】また、エラーが固定障害に起因していると
認識した場合、プログラム実行部24は、システムバス
を管理するBHを故障モジュールとみなし、図17の場
合と同様にして、バスハンドラ切り離しコマンドをBH
に発行する(ステップS78)。これにより、BHがシ
ステムから機能的に切り離され、固定障害の発生したシ
ステムバスが使用不可となる。
【0095】そして、プログラム実行部24は、そのシ
ステムバスのBUSNOを割込みによりCPUに通知し
て(ステップS79)、動作を終了する。CPU上で動
作するソフトウェアは、通知されたBUSNOと異なる
BUSNOを指定して、SSMアクセスを行う。
【0096】ステップS77、S79においてCPUに
通知された故障モジュールやBUSNO等の情報は、図
3のメインメモリ22内に設けられた、そのCPUに対
応する領域に格納される。
【0097】また、ステップS74において完了コード
が正常の場合は、プログラム実行部24は、SSMおよ
びシステムバスが正常であると認識し、動作を終了す
る。このように、接続ユニット制御部がSSMおよびシ
ステムバスの診断を行い、アクセスエラーの発生を監視
することで、CPUによるSSMアクセスの際にエラー
が発生することを未然に防ぎ、性能低下を防止すること
ができる。
【0098】次に、SSMの二重化の動作と、それを利
用したエラー救済処理について説明する。プログラム実
行部24は、SSMアドレス空間の1つのSSMアドレ
スに対応する、図8のSSM−ID制御部62に、マス
タSSM−IDとスレーブSSM−IDをあらかじめ登
録しておく。このとき、SLVの値は0に設定される。
【0099】図23は、二重化されたSSMにデータを
書き込む、接続ユニット制御部の第7の動作のフローチ
ャートである。接続ユニット制御部は、まず、CPUか
らSSMライトアクセスのためのコマンドを受け取ると
(ステップS81)、転送アドレスと転送データとBU
SNOをSSMライトコマンドとしてCPU受信コマン
ド保持バッファ60に格納する(ステップS82)。
【0100】このとき、SSM−ID制御部62は、コ
マンドのアドレスから対応するマスタSSM−IDを決
定して、CPU受信コマンド保持バッファ60に格納す
る。次に、接続ユニット制御部は、SSMライトコマン
ドを発行し、マスタSSMに対してデータを書き込む
(ステップS83)。
【0101】マスタSSMへのライトアクセスが完了す
ると、プログラム実行部24は、SSM−ID制御部6
2のSLVの値を1に設定し、SSMライトコマンドの
再発行を指示する(ステップS84)。これにより、ス
レーブSSM−IDがCPU受信コマンド保持バッファ
60に格納され、マスタSSMと同じデータがスレーブ
SSMに書き込まれる(ステップS85)。そして、プ
ログラム実行部24は、SLVの値を0に設定し(ステ
ップS86)、動作を終了する。
【0102】また、図24は、二重化されたSSMから
データを読み出す、接続ユニット制御部の第8の動作の
フローチャートである。接続ユニット制御部は、まず、
CPUからSSMリードアクセスのためのコマンドを受
け取ると(ステップS91)、転送アドレスと転送デー
タとBUSNOをSSMリードコマンドとしてCPU受
信コマンド保持バッファ60に格納する(ステップS9
2)。
【0103】このとき、SSM−ID制御部62は、コ
マンドのアドレスから対応するマスタSSM−IDを決
定して、CPU受信コマンド保持バッファ60に格納す
る。次に、接続ユニット制御部は、SSMリードコマン
ドを発行し、マスタSSMからデータを読み出して(ス
テップS93)、動作を終了する。読み出されたデータ
は、図25に示すような形式でCPU送信バッファ45
に格納され、CPUに転送される。
【0104】このようなリード/ライト動作により、マ
スタSSMとスレーブSSMには常に同じデータが格納
され、2つのSSMはCPUからは1つのSSMのよう
に見える。この状態をSSM二重化状態と呼ぶことにす
る。
【0105】ところで、マスタSSMしか搭載されてい
ないシステムにおいて、システム運用中にスレーブSS
Mを搭載したい場合、スレーブSSMにマスタSSMと
同じデータをコピーする必要がある。この動作を再二重
化処理と呼ぶことにする。
【0106】図26は、SSMの再二重化処理を行う、
接続ユニット制御部の第9の動作のフローチャートであ
る。接続ユニット制御部は、まず、CPUから再二重化
処理の指示を受け取ると(ステップS101)、マスタ
SSMのデータを読み出し(ステップS102)、それ
を新たに搭載されたスレーブSSMに書き込む(ステッ
プS103)。
【0107】次に、マスタSSMのデータをすべてスレ
ーブSSMに転送したかどうかを判定し(ステップS1
04)、未転送のデータがあれば、ステップS102以
降の動作を繰り返す。そして、すべてのデータを転送し
終えると、動作を終了する。こうして、マスタSSMの
データと同じデータがスレーブSSMに格納される。転
送が完了した後、CPUがスレーブSSM−IDをSS
M−ID制御部62に登録することにより、SSM二重
化状態が構成される。
【0108】SSM二重化状態において、CPUからS
SMリードアクセスを行い、マスタSSMのリードアク
セスでエラーが発生した場合、接続ユニット制御部がス
レーブSSMへのリードアクセスを行うことにより、エ
ラーを救済することができる。
【0109】図27は、スレーブSSMを利用してエラ
ーを救済する、接続ユニット制御部の第10の動作のフ
ローチャートである。接続ユニット制御部は、まず、C
PUからSSMリードアクセスのためのコマンドを受け
取ると(ステップS111)、転送アドレスと転送デー
タとBUSNOとSSM−IDを、SSMリードコマン
ドとしてCPU受信コマンド保持バッファ60に格納し
(ステップS112)、それを接続ユニットへ転送する
(ステップS113)。そして、SSMからの応答を接
続ユニットから受け取ったかどうかを判定し(ステップ
S114)、それを受け取っていなければ、応答がある
まで判定を繰り返す。
【0110】応答を受け取ると、プログラム実行部24
は、それに含まれる完了コードを確認し(ステップS1
15)、完了コードがアクセスエラーを示しているかど
うかをチェックする(ステップS116)。そして、ア
クセスエラーが発生したと認識した場合、エラーの要因
を判定する(ステップS117)。ここでは、例えば、
完了コードが10−であれば、相手先のSSMが要因で
あるとみなされ、完了コードが01−または11−であ
れば、SSM以外が要因であるとみなされる。
【0111】エラーの要因がSSMであると認識した場
合、SSM−ID制御部62のSLVの値を1に設定し
て、CPU受信コマンド保持バッファ60にSSM−I
Dを再設定する(ステップS118)。これにより、ス
レーブSSM−IDがCPU受信コマンド保持バッファ
60に格納される。そして、接続ユニット制御部は、ス
レーブSSMに対するリードアクセスを行い(ステップ
S119)、ステップS114以降の動作を繰り返す。
【0112】そして、ステップS116において完了コ
ードが正常になると、CPUへ正常応答を行って(ステ
ップS120)、動作を終了する。また、エラーの要因
がSSM以外であると認識した場合、他の異常処理を行
って(ステップS121)、動作を終了する。
【0113】また、SSM二重化状態において、CPU
からSSMアクセスを行い、アクセスエラーが発生した
場合、接続ユニット制御部は、エラーの発生したSSM
の状態を読み出す。そして、SSMが異常であると判断
すると、それをシステムから切り離す。
【0114】図28は、異常なSSMを切り離してエラ
ーを救済する、接続ユニット制御部の第11の動作のフ
ローチャートである。接続ユニット制御部は、まず、C
PUからSSMアクセスのためのコマンドを受け取ると
(ステップS131)、転送アドレスと転送データとS
SM−IDを、SSMアクセスコマンドとしてCPU受
信コマンド保持バッファ60に格納し(ステップS13
2)、それを接続ユニットへ転送する(ステップS13
3)。そして、マスタSSMからの応答を接続ユニット
から受け取ったかどうかを判定し(ステップS13
4)、それを受け取っていなければ、応答があるまで判
定を繰り返す。
【0115】応答を受け取ると、プログラム実行部24
は、それに含まれる完了コードを確認し(ステップS1
35)、完了コードがアクセスエラーを示しているかど
うかをチェックする(ステップS136)。そして、ア
クセスエラーが発生したと認識した場合、相手先モジュ
ールの故障かどうかを判定する(ステップS137)。
【0116】相手先モジュールの故障であれば、プログ
ラム実行部24は、次に、それがマスタSSMかどうか
を判定する(ステップS138)。こうして、マスタS
SMの状態が異常であると認識した場合、プログラム実
行部24は、コマンド生成部51、セレクタ49、およ
び接続ユニットデータ送信制御部50を制御して、図2
9に示すようなSSM切り離しコマンドをマスタSSM
に発行する(ステップS139)。
【0117】これにより、マスタSSMの状態レジスタ
に、切り離された状態を表すデータDISCが設定さ
れ、マスタSSMはシステムから機能的に切り離され
る。そして、図30に示すような応答が、マスタSSM
から接続ユニット制御部に返送される。
【0118】次に、図31に示すようなSSM状態変更
コマンドをスレーブSSMに発行して、その状態レジス
タのデータをマスタを表すデータに書き換える。これに
より、スレーブSSMがマスタSSMに切り替えられ
(ステップS140)、マスタSSMに切り替えられた
SSMからは、図32に示すような応答が接続ユニット
制御部に返送される。
【0119】さらに、SSM−ID制御部62にスレー
ブSSM−IDとして登録されているSSM−IDを、
マスタSSM−IDとして再登録し、新たなマスタSS
M−IDへのアクセスコマンドを発行する(ステップS
141)。そして、ステップS134以降の動作を繰り
返す。
【0120】また、ステップS138においてスレーブ
SSMの状態が異常であると認識した場合、プログラム
実行部24は、SSM切り離しコマンドをスレーブSS
Mに発行する(ステップS144)。これにより、スレ
ーブSSMの状態レジスタにデータDISCが設定さ
れ、スレーブSSMはシステムから機能的に切り離され
る。
【0121】次に、SSM−ID制御部62にスレーブ
SSM−IDとして登録されているSSM−IDを削除
し(ステップS145)、ステップS134以降の動作
を繰り返す。
【0122】そして、ステップS136において完了コ
ードが正常になると、CPUへ正常応答を行って(ステ
ップS142)、動作を終了する。また、ステップS1
37において、相手先モジュールの故障ではないと判定
した場合は、他の異常処理を行って(ステップS14
3)、動作を終了する。
【0123】このように、マスタSSMが異常である場
合、スレーブSSMを新たにマスタSSMとして登録す
ることで、システム運用を継続することができる。ま
た、切り離されたSSMを交換し、図26の再二重化処
理を行うことにより、システム運用を停止することな
く、SSM二重化状態を再現することができる。
【0124】以上説明したようなエラーの救済を無限に
繰り返すと、CPUに対するレスポンスが非常に遅くな
り、システム性能の低下を招く。また、同じエラー救済
処理を繰り返すよりも、処理時間に応じて救済内容を変
更したほうが、アクセスが正常化する可能性が高くな
る。
【0125】図33は、処理時間に応じて救済内容を変
更する、接続ユニット制御部の第12の動作のフローチ
ャートである。エラー救済処理が開始されると、プログ
ラム実行部24は、処理時間監視用タイマ55の値を参
照して、処理時間があらかじめ決められた制限時間を越
えたかどうかを判定する(ステップS151)。処理時
間が制限時間を越えていなければ、次に、処理時間があ
らかじめ決められたしきい値を越えたかどうかを判定す
る(ステップS152)。このしきい値は制限時間より
短く設定され、例えば、制限時間が100msであれ
ば、しきい値は50msに設定される。
【0126】処理時間がしきい値を越えていなければ、
同じシステムバスを用いてリトライを行ったり、システ
ムバスの経路を変更してリトライを行ったりして(ステ
ップS153)、動作を終了する。また、処理時間がし
きい値を越えていれば、BHまたはSSMの切り離し処
理を行って(ステップS154)、動作を終了する。
【0127】また、ステップS151において、処理時
間が制限時間を越えていれば、エラー救済処理を終了し
て(ステップS155)、完了コードによりアクセスエ
ラーの発生をCPUに通知して(ステップS156)、
動作を終了する。
【0128】ところで、本実施形態では、PMの性能を
向上させるため、図3に示したように、1つの接続ユニ
ット制御部に複数のCPUを接続しており、接続ユニッ
ト制御部は、図5のインタフェース部41をCPUの搭
載数だけ備えている。これにより、複数のCPUからS
SMアクセスが行われた場合でも、接続ユニット制御部
は、各CPU毎にアクセスエラーを救済することができ
る。
【0129】また、接続ユニット制御部は、各インタフ
ェース部41のレジスタ制御部47のCPU実装情報レ
ジスタ64に、図34に示すようなCPU実装情報を保
持する。オペレータは、システム立ち上げ時に、PM上
に設けられた設定スイッチ(外部ピン)を操作するか、
またはレジスタライトを行うことにより、このCPU実
装情報を設定する。このとき、実装されているCPUに
対応するデータCPUi(i=0,1,2,3)には1
が設定され、実装されていないCPUに対応するデータ
CPUiには0が設定される。
【0130】そして、CPU送信バッファ45は、レジ
スタ制御部47からCPU実装情報を受け取り、それを
CPUに通知する。CPUは、受け取ったCPU実装情
報を参照して、PM内に実装されているCPUの数を認
識する。そして、例えば、接続ユニット制御部からエラ
ーの発生を通知されたときに、図3のメインメモリ22
内に格納された他のCPUのエラー情報を参照して、故
障箇所の特定等のエラー処理を行う。
【0131】このように、各CPUは、CPU実装情報
を利用することにより、他のCPUの持つ故障モジュー
ル等の情報を参照して、より正確に故障箇所を特定する
ことができる。
【0132】また、本実施形態では、CPUのソフトウ
ェアがアクセスエラーの処理を行わず、代わりに、接続
ユニット制御部がエラー救済を行うことを特徴としてい
る。しかし、ソフトウェアが割込み処理を行って、エラ
ー頻度の高いシステムバスやSSMの使用を行わないよ
うにしたり、予防的に故障モジュールの交換を指示した
方が、性能の低下を防ぐことができる。
【0133】そこで、プログラム実行部24は、アクセ
スエラーの救済を行った場合、CPUに対して割込みを
発生させ、ソフトウェアにアクセスエラーの発生を通知
する。これにより、CPUは、適切なエラー予防措置を
とることが可能になる。
【0134】図35は、CPUによるこのような割込み
処理のフローチャートである。処理が開始されると、C
PUは、まず、プログラム実行部24のSSMアクセス
エラー統計情報を読み出し(ステップS161)、いず
れかのSSMに対応する完了コード10−のエラー発生
回数がしきい値以上かどうかを判定する(ステップS1
62)。SSMアクセスエラー統計情報は、例えば、図
22のようなデータを含む。
【0135】そして、しきい値以上の数のエラーが発生
しているSSMがあれば、オペレータに対して予防交換
のメッセージを出力して(ステップS164)、処理を
終了する。ここで、予防交換のメッセージとは、エラー
の多発しているモジュールが故障する前にその交換を促
すメッセージであり、例えば、システムに備えられたデ
ィスプレイ装置の画面上に表示される。
【0136】しきい値以上の数のエラーが発生している
SSMがなければ、次に、いずれかのBHに対応する完
了コード11−のエラー発生回数がしきい値以上かどう
かを判定する(ステップS163)。そして、しきい値
以上の数のエラーが発生しているBHがあれば、オペレ
ータに対して予防交換のメッセージを出力して(ステッ
プS165)、処理を終了する。
【0137】また、接続ユニット制御部がシステムバス
またはSSMを切り離した等の情報をCPUに通知し、
ソフトウェアが、次のアクセスからそれらのシステムバ
ス等を使用しないようにしたり、マスタSSM−IDの
登録を変更したりする処理を行った方が、性能の低下を
防ぐことができる。また、接続ユニット制御部からの通
知を元に、オペレータに対して故障モジュールの交換を
指示し、迅速な修理を行わせることができる。
【0138】そこで、プログラム実行部24が、モジュ
ールを切り離してアクセスエラーを救済した場合、CP
Uに対して割込みを発生させ、ソフトウェアに救済処理
の内容を通知することにより、ソフトウェアによる故障
モジュールの特定を容易にする。
【0139】図36は、CPUによるこのような割込み
処理のフローチャートである。処理が開始されると、C
PUは、まず、接続ユニット制御部から、図37に示す
ような救済内容通知を受信する(ステップS171)。
この救済内容通知は、プログラム実行部24により作成
され、CPU送信バッファ45を介してCPUに送信さ
れる。そして、例えば、以下のようなコードで記述され
る。
【0140】XX00:エラーのリカバリ(救済)は実
行していない。 XX01:システムバスの切り替えによりリカバリが成
功した。 XX10:SSMの切り替えによりリカバリが成功し
た。
【0141】XX11:リカバリが失敗した。 YY00XX:モジュールの切り離しは行っていない。 YY01XX:BHの切り離しを行った。
【0142】YY10XX:SSMの切り離しを行っ
た。 ここで、YYの部分には、対応するSSM−IDやBU
SNO等が記述される。CPUは、受信した救済内容通
知を解析して、SSMの切り離しが行われたかどうかを
判定する(ステップS172)。SSMの切り離しが行
われていれば、SSM−ID制御部62の対応するマス
タSSM−IDを書き換えて、切り離されたSSMの使
用を禁止し(ステップS174)、処理を終了する。
【0143】SSMの切り離しが行われていなければ、
次に、BHの切り離しが行われたかどうかを判定する
(ステップS173)。BHの切り離しが行われていれ
ば、経路制御部61のFPTHの値を1に設定し、切り
離されたBHとは異なるBHに対応するBUSNOをP
SELに設定して(ステップS175)、処理を終了す
る。これにより、次のアクセスから、PSELの値が自
動的にBUSNOとして用いられ、切り離されたBHに
対応するシステムバスの使用が禁止される。
【0144】一般に、システムバスに多数のモジュール
が接続されているシステムにおいてアクセスエラーが発
生した場合、1つのPMが取得したアクセスエラー統計
情報だけでは、故障モジュールの特定が困難であること
が多い。
【0145】そこで、各PMがマスタPMに対して、定
期的に統計情報を含むメッセージコマンドを発行するこ
とにする。ここで、マスタPMとは、あらかじめ指定さ
れた代表モジュールであり、すべてのPMを統括管理す
る。マスタPMは、他のPMから受信したメッセージコ
マンドにより、システム全体のエラー情報を収集し、よ
り正確に故障モジュールを特定することができる。
【0146】図38は、マスタPM以外の各PMの接続
ユニット制御部による第13の動作のフローチャートで
ある。プログラム実行部24は、まず、SSMアクセス
においてエラーが発生したかどうかを判定する(ステッ
プS181)。そして、エラーが発生したと認識すれ
ば、コマンド生成部51、セレクタ49、および接続ユ
ニットデータ送信制御部50を制御して、図39に示す
ようなメッセージコマンドをマスタPMに発行し(ステ
ップS182)、動作を終了する。
【0147】このとき、送信メッセージとして、SSM
アクセスエラー統計情報が送られ、マスタPMからは、
図40に示すような応答が返送される。この応答は、マ
スタPMの応答データ生成部52により生成される。ま
た、ステップS181においてエラーが発生していない
と認識すれば、メッセージコマンドを発行せずに、動作
を終了する。
【0148】また、図41は、マスタPMの接続ユニッ
ト制御部による第14の動作のフローチャートである。
まず、接続ユニットデータ受信制御部53が、図42に
示すような、各PMからのメッセージコマンドを受信
し、SSMアクセスエラー統計情報をプログラム実行部
24に転送する(ステップS191)。次に、プログラ
ム実行部24は、それらを解析して故障箇所を推定し
(ステップS192)、故障モジュールの切り離し処理
を行って(ステップS193)、動作を終了する。
【0149】上述のようにメッセージコマンドを利用し
て統計情報を収集する代わりに、マスタPMが他のPM
の統計情報レジスタのデータを読み出すことにより、同
様の効果を得ることができる。
【0150】図43は、統計情報の読み出しを行う、接
続ユニット制御部の第15の動作のフローチャートであ
る。マスタPMのプログラム実行部24は、コマンド生
成部51、セレクタ49、および接続ユニットデータ送
信制御部50を制御して、図44に示すような統計情報
リードコマンドを、定期的に各PMに発行する(ステッ
プS201)。
【0151】これにより、相手先のPMの接続ユニット
データ受信制御部53は、図45に示すような統計情報
リードコマンドを受信し、応答データ生成部52は、図
46に示すような応答を生成する。そして、この応答が
マスタPMに返送される。
【0152】マスタPMのプログラム実行部24は、次
に、受信したSSMアクセスエラー統計情報を解析して
故障箇所を推定し(ステップS202)、故障モジュー
ルの切り離し処理を行って(ステップS203)、動作
を終了する。
【0153】さらに、マイクロプログラムメモリ25と
して書き換え可能なメモリシステムを採用することによ
って、システム構成によりマイクロプログラムを変更し
たり、エラーの発生状況によりプログラムを書き換えた
りすることが可能になる。システム構成とは、例えば、
SSMやシステムバスが二重化されているかどうかに対
応し、その情報は、図8のシステム構成情報レジスタ6
5に格納されている。このシステム構成情報は、プログ
ラム実行部24の制御によりCPUに通知される。
【0154】図47は、システム運用中にマイクロプロ
グラムを変更する、CPUの処理のフローチャートであ
る。ここでは、あらかじめメモリ25に、SSM/BH
の切り離し処理を含むマイクロプログラムが格納されて
いるものとする。
【0155】処理が開始されると、CPUは、まず、接
続ユニット制御部からのシステム構成情報を受信し(ス
テップS211)、SSMが一重化システムかどうかを
判定する(ステップS212)。ここで、一重化システ
ムとは、マスタSSMとスレーブSSMの区別がなく、
1つのアドレスに対して1つのSSMしか登録されてい
ないシステムを指す。
【0156】SSMが一重化システムであれば、エラー
救済処理としてSSMの切り離しを行わないようなマイ
クロプログラムをメモリ25にロードし(ステップS2
14)、処理を終了する。
【0157】SSMが一重化システムでなければ、次
に、システムバスが一重化システムかどうかを判定する
(ステップS213)。ここで、一重化システムとは、
経路が1つしかないシステムバスを指す。システムバス
が一重化システムであれば、エラー救済処理としてBH
の切り離しを行わないようなマイクロプログラムをメモ
リ25にロードし(ステップS215)、処理を終了す
る。また、システムバスが一重化システムでなければ、
そのまま処理を終了する。
【0158】また、システム構成情報として、システム
バスの転送速度やビット幅等を記録しておき、それらの
値に応じて、図17のステップS57で用いるエラー発
生回数のしきい値を変更するようにしてもよい。
【0159】
【発明の効果】本発明によれば、複数のプロセッサモジ
ュールと共有メモリを有するマルチプロセッサシステム
において、共有メモリに対するアクセスエラーが発生し
た場合、CPUの処理に依存することなく、エラーを救
済することができる。したがって、システムバスが変更
されても、CPUのソフトウェアを変更することなく、
システムの信頼性を維持することができる。また、例外
処理後の動作が保証されないようなCPUを用いた場合
でも、システムの信頼性を維持することができる。
【図面の簡単な説明】
【図1】本発明のアクセス制御装置の原理図である。
【図2】マルチプロセッサシステムの構成図である。
【図3】プロセッサモジュールの構成図である。
【図4】共有メモリモジュールの構成図である。
【図5】接続ユニット制御部の構成図である。
【図6】CPU受信バッファの構成図である。
【図7】システムバスコマンド生成部の構成図である。
【図8】レジスタ制御部の構成図である。
【図9】SSMリードコマンドを示す図である。
【図10】SSMライトコマンドを示す図である。
【図11】接続ユニット制御部の第1の動作のフローチ
ャートである。
【図12】SSMリードコマンド応答を示す図である。
【図13】SSMライトコマンド応答を示す図である。
【図14】接続ユニット制御部の第2の動作のフローチ
ャートである。
【図15】接続ユニット制御部の第3の動作のフローチ
ャートである。
【図16】接続ユニット制御部の第4の動作のフローチ
ャートである。
【図17】接続ユニット制御部の第5の動作のフローチ
ャートである。
【図18】バスハンドラ切り離しコマンドを示す図であ
る。
【図19】バスハンドラ切り離しコマンド応答を示す図
である。
【図20】エラー完了コードを示す図である。
【図21】接続ユニット制御部の第6の動作のフローチ
ャートである。
【図22】統計情報を示す図である。
【図23】接続ユニット制御部の第7の動作のフローチ
ャートである。
【図24】接続ユニット制御部の第8の動作のフローチ
ャートである。
【図25】SSMリードデータを示す図である。
【図26】接続ユニット制御部の第9の動作のフローチ
ャートである。
【図27】接続ユニット制御部の第10の動作のフロー
チャートである。
【図28】接続ユニット制御部の第11の動作のフロー
チャートである。
【図29】SSM切り離しコマンドを示す図である。
【図30】SSM切り離しコマンド応答を示す図であ
る。
【図31】SSM状態変更コマンドを示す図である。
【図32】SSM状態変更コマンド応答を示す図であ
る。
【図33】接続ユニット制御部の第12の動作のフロー
チャートである。
【図34】CPU実装情報を示す図である。
【図35】CPUの第1の処理のフローチャートであ
る。
【図36】CPUの第2の処理のフローチャートであ
る。
【図37】救済内容通知を示す図である。
【図38】接続ユニット制御部の第13の動作のフロー
チャートである。
【図39】第1のメッセージコマンドを示す図である。
【図40】メッセージコマンド応答を示す図である。
【図41】接続ユニット制御部の第14の動作のフロー
チャートである。
【図42】第2のメッセージコマンドを示す図である。
【図43】接続ユニット制御部の第15の動作のフロー
チャートである。
【図44】第1の統計情報リードコマンドを示す図であ
る。
【図45】第2の統計情報リードコマンドを示す図であ
る。
【図46】統計情報リードコマンド応答を示す図であ
る。
【図47】CPUの第3の処理のフローチャートであ
る。
【符号の説明】
1、12 プロセッサモジュール 2、13 共有メモリモジュール 3 格納手段 4 実行手段 11 システムバス 14 バスハンドラ 21 CPU 22 メインメモリ 23 接続ユニット制御部 24 マイクロプログラム実行部 25 マイクロプログラムメモリ 26、32 接続ユニット 27、33 内部バス 31 共有メモリ 41 インタフェース部 42 CPU受信バッファ 43 CPUインタフェース制御部 44 CPU完了コード通知部 45 CPU送信バッファ 46 割込み制御部 47 レジスタ制御部 48 システムバスコマンド生成部 49 セレクタ 50 接続ユニットデータ送信制御部 51 コマンド生成部 52 応答データ生成部 53 接続ユニットデータ受信制御部 54 リトライ用タイマ 55 処理時間監視用タイマ 60 CPU受信コマンド保持バッファ 61 経路制御部 62 SSM−ID制御部 63 Source−IDレジスタ 64 CPU実装情報レジスタ 65 システム構成情報レジスタ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 山田 和平 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社内 (72)発明者 中川 秀樹 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社内

Claims (33)

    【特許請求の範囲】
  1. 【請求項1】 複数のプロセッサモジュールと、共有メ
    モリモジュールとを有するマルチプロセッサシステムの
    ためのアクセス制御装置であって、 前記複数のプロセッサモジュールのうちの1つのプロセ
    ッサモジュールから前記共有メモリモジュールへのアク
    セスを制御するためのマイクロプログラムを格納する格
    納手段と、 前記マイクロプログラムを実行して前記共有メモリモジ
    ュールへのアクセスの結果を監視し、該アクセスにおい
    てエラーが発生した場合に、該エラーを救済するための
    処理を行う実行手段とを備えることを特徴とするアクセ
    ス制御装置。
  2. 【請求項2】 各プロセッサモジュールは、ソフトウェ
    アを動作させる1つ以上の中央処理ユニットを含み、前
    記アクセス制御装置は、該ソフトウェアによる前記共有
    メモリモジュールへのアクセスを制御することを特徴と
    する請求項1記載のアクセス制御装置。
  3. 【請求項3】 前記アクセスのためのコマンドを保持す
    るコマンド保持手段をさらに備え、前記実行手段は、前
    記エラーが発生した場合に、該コマンド保持手段に保持
    されたコマンドを用いて、アクセスのリトライを行うこ
    とを特徴とする請求項1記載のアクセス制御装置。
  4. 【請求項4】 前記実行手段は、前記エラーが発生した
    場合に、前記リトライを一定時間行うことを特徴とする
    請求項3記載のアクセス制御装置。
  5. 【請求項5】 前記実行手段は、前記エラーが発生した
    場合に、前記リトライを一定回数行うことを特徴とする
    請求項3記載のアクセス制御装置。
  6. 【請求項6】 前記実行手段は、前記エラーが発生した
    場合に、該エラーの種類に応じてリトライ間隔を変更し
    て、前記リトライを行うことを特徴とする請求項3記載
    のアクセス制御装置。
  7. 【請求項7】 前記マルチプロセッサシステムは、前記
    複数のプロセッサモジュールと共有メモリモジュールと
    を接続するシステムバスを含み、前記実行手段は、前記
    エラーが発生した場合に、該システムバスの経路を変更
    して、前記リトライを行うことを特徴とする請求項3記
    載のアクセス制御装置。
  8. 【請求項8】 前記マルチプロセッサシステムは、前記
    複数のプロセッサモジュールと共有メモリモジュールと
    を接続するシステムバスと、該システムバスのアービト
    レーションを行うバスハンドラを含み、前記実行手段
    は、前記エラーが発生した場合に、該エラーを解析し、
    該エラーが該システムバスの固定障害に起因すると判断
    したとき、該バスハンドラに対して該システムバスを使
    用禁止にする指示を送ることを特徴とする請求項1記載
    のアクセス制御装置。
  9. 【請求項9】 前記マルチプロセッサシステムは、前記
    複数のプロセッサモジュールと共有メモリモジュールと
    を接続するシステムバスを含み、前記実行手段は、前記
    マイクロプログラムを実行して、該共有メモリモジュー
    ルとシステムバスのうち少なくとも一方の診断を定期的
    に行い、アクセスエラーの発生を監視することを特徴と
    する請求項1記載のアクセス制御装置。
  10. 【請求項10】 各プロセッサモジュールは、ソフトウ
    ェアを動作させる1つ以上の中央処理ユニットを含み、
    前記アクセス制御装置は、該中央処理ユニットに割込み
    を発生させる割込み制御手段をさらに備え、前記実行手
    段は、前記診断時に、前記共有メモリモジュールにコマ
    ンドを発行し、該共有メモリモジュールからの応答を受
    け取り、発生したアクセスエラーの解析を行って、故障
    箇所を特定し、該割込み制御手段を用いて該故障箇所を
    該中央処理ユニットに通知することを特徴とする請求項
    9記載のアクセス制御装置。
  11. 【請求項11】 前記実行手段は、前記診断時に、前記
    共有メモリモジュールにコマンドを発行し、該共有メモ
    リモジュールからの応答を受け取り、発生したアクセス
    エラーの解析を行って、故障モジュールを特定し、該故
    障モジュールを機能的に切り離すことを特徴とする請求
    項9記載のアクセス制御装置。
  12. 【請求項12】 各プロセッサモジュールは、ソフトウ
    ェアを動作させる1つ以上の中央処理ユニットを含み、
    前記マルチプロセッサシステムは、該ソフトウェアが指
    定する1つのアドレスに対応付けられたマスタ共有メモ
    リモジュールとスレーブ共有メモリモジュールを含み、
    前記実行手段は、前記アクセスが該アドレスに対するラ
    イトアクセスであるとき、該マスタ共有メモリモジュー
    ルとスレーブ共有メモリモジュールに同じデータを書き
    込み、前記アクセスが該アドレスに対するリードアクセ
    スであるとき、該マスタ共有メモリモジュールからデー
    タを読み出すことを特徴とする請求項1記載のアクセス
    制御装置。
  13. 【請求項13】 前記実行手段は、前記マルチプロセッ
    サシステムの動作中における前記スレーブ共有メモリモ
    ジュールの挿入時に、前記マスタ共有メモリモジュール
    のデータを該スレーブ共有メモリモジュールに転送し
    て、該マスタ共有メモリモジュールを動的に二重化する
    ことを特徴とする請求項12記載のアクセス制御装置。
  14. 【請求項14】 前記実行手段は、前記リードアクセス
    において前記エラーが発生した場合に、前記スレーブ共
    有メモリモジュールからデータを読み出すことを特徴と
    する請求項12記載のアクセス制御装置。
  15. 【請求項15】 前記実行手段は、前記エラーが発生し
    た場合に、アクセス先の共有メモリモジュールの状態を
    調査し、該状態が異常であると判断したとき、該アクセ
    ス先の共有メモリモジュールを機能的に切り離すことを
    特徴とする請求項12記載のアクセス制御装置。
  16. 【請求項16】 前記エラーを救済するための処理に要
    する時間を計測するタイマ手段をさらに備え、前記実行
    手段は、救済処理の処理時間に応じて該救済処理の内容
    を変更して、制限時間内で該救済処理を終了することを
    特徴とする請求項1記載のアクセス制御装置。
  17. 【請求項17】 前記1つのプロセッサモジュールは、
    ソフトウェアを動作させる複数の中央処理ユニットを含
    み、前記アクセス制御装置は、各中央処理ユニットから
    前記共有メモリモジュールへの前記アクセスを制御し、
    該アクセスの結果を各中央処理ユニットに通知するイン
    タフェース手段をさらに備え、前記実行手段は、各中央
    処理ユニット毎に前記エラーを救済するための処理を行
    うことを特徴とする請求項1記載のアクセス制御装置。
  18. 【請求項18】 各プロセッサモジュールは、ソフトウ
    ェアを動作させる1つ以上の中央処理ユニットを含み、
    前記アクセス制御装置は、該中央処理ユニットに割込み
    を発生させる割込み制御手段をさらに備え、前記実行手
    段は、前記エラーを救済するための処理を行った場合
    に、該割込み制御手段を用いて該エラーの発生を該中央
    処理ユニットに通知することを特徴とする請求項1記載
    のアクセス制御装置。
  19. 【請求項19】 前記中央処理ユニットは、前記エラー
    の発生を通知されたとき、次のアクセスにおいてエラー
    の発生を予防するための処理を行うことを特徴とする請
    求項18記載のアクセス制御装置。
  20. 【請求項20】 前記実行手段は、前記エラーを救済す
    るための処理においてモジュールを機能的に切り離した
    場合、前記中央処理ユニットに救済内容を通知すること
    を特徴とする請求項18記載のアクセス制御装置。
  21. 【請求項21】 前記中央処理ユニットは、前記救済内
    容を通知されたとき、切り離されたモジュールを使用禁
    止にするための処理を行うことを特徴とする請求項20
    記載のアクセス制御装置。
  22. 【請求項22】 前記アクセス制御装置は、各プロセッ
    サモジュールからエラー統計情報を収集する通信手段を
    含み、該エラー統計情報を解析して、故障箇所を特定す
    ることを特徴とする請求項1記載のアクセス制御装置。
  23. 【請求項23】 前記通信手段は、前記エラー統計情報
    を読み出すためのコマンドを各プロセッサモジュールに
    発行するコマンド発行手段を含み、各プロセッサモジュ
    ールは、該コマンドに対する応答として該エラー統計情
    報を該通信手段に返送することを特徴とする請求項22
    記載のアクセス制御装置。
  24. 【請求項24】 各プロセッサモジュールは、ソフトウ
    ェアを動作させる1つ以上の中央処理ユニットを含み、
    前記格納手段は、前記マイクロプログラムを格納する書
    き換え可能なメモリ手段を含み、該中央処理ユニット
    は、前記マルチプロセッサシステムの動作中に、該メモ
    リ手段に格納された該マイクロプログラムの内容を書き
    換えることを特徴とする請求項1記載のアクセス制御装
    置。
  25. 【請求項25】 前記格納手段と実行手段は、前記1つ
    のプロセッサモジュールに含まれることを特徴とする請
    求項1記載のアクセス制御装置。
  26. 【請求項26】 共有メモリモジュールと、該共有メモ
    リモジュールにアクセスする少なくとも1つのプロセッ
    サモジュールを含む複数のアクセスモジュールとを有す
    るシステムのためのアクセス制御装置であって、 前記プロセッサモジュールから前記共有メモリモジュー
    ルへのアクセスを制御するためのマイクロプログラムを
    格納する格納手段と、 前記マイクロプログラムを実行して前記共有メモリモジ
    ュールへのアクセスの結果を監視し、該アクセスにおい
    てエラーが発生した場合に、該エラーを救済するための
    処理を行う実行手段とを備えることを特徴とするアクセ
    ス制御装置。
  27. 【請求項27】 前記格納手段と実行手段は、前記プロ
    セッサモジュールに含まれることを特徴とする請求項2
    6記載のアクセス制御装置。
  28. 【請求項28】 複数のプロセッサモジュールと、共有
    メモリモジュールとを有するマルチプロセッサシステム
    のためのアクセス制御装置であって、 前記複数のプロセッサモジュールのうちの1つのプロセ
    ッサモジュールから前記共有メモリモジュールへのアク
    セスを制御する制御手段と、 前記制御手段による前記共有メモリモジュールへのアク
    セスの結果を監視し、 該アクセスにおいてエラーが発生した場合に、該エラー
    を救済するための処理を行う実行手段とを備えることを
    特徴とするアクセス制御装置。
  29. 【請求項29】 前記制御手段と実行手段は、前記1つ
    のプロセッサモジュールに含まれることを特徴とする請
    求項28記載のアクセス制御装置。
  30. 【請求項30】 共有メモリモジュールと、該共有メモ
    リモジュールにアクセスする少なくとも1つのプロセッ
    サモジュールを含む複数のアクセスモジュールとを有す
    るシステムのためのアクセス制御装置であって、 前記プロセッサモジュールから前記共有メモリモジュー
    ルへのアクセスを制御する制御手段と、 前記制御手段による前記共有メモリモジュールへのアク
    セスの結果を監視し、該アクセスにおいてエラーが発生
    した場合に、該エラーを救済するための処理を行う実行
    手段とを備えることを特徴とするアクセス制御装置。
  31. 【請求項31】 前記制御手段と実行手段は、前記プロ
    セッサモジュールに含まれることを特徴とする請求項3
    0記載のアクセス制御装置。
  32. 【請求項32】 複数のプロセッサモジュールと、共有
    メモリモジュールとを有するマルチプロセッサシステム
    におけるアクセス制御を行うためのマイクロプログラム
    を記録した記録媒体であって、 前記複数のプロセッサモジュールのうちの1つのプロセ
    ッサモジュールから前記共有メモリモジュールへのアク
    セスの結果を監視する機能と、 前記アクセスにおいてエラーが発生した場合に、該エラ
    ーを救済するための処理を行う機能とをマイクロプログ
    ラム実行装置に実現させるためのマイクロプログラムを
    記録した読み取り可能な記録媒体。
  33. 【請求項33】 複数のプロセッサモジュールと、共有
    メモリモジュールとを有するマルチプロセッサシステム
    において用いられるアクセス制御方法であって、 前記複数のプロセッサモジュールのうちの1つのプロセ
    ッサモジュールから前記共有メモリモジュールへのアク
    セスを制御するためのマイクロプログラムを生成し、 前記マイクロプログラムを実行して前記共有メモリモジ
    ュールへのアクセスの結果を監視し、 前記アクセスにおいてエラーが発生した場合に、前記マ
    イクロプログラムを実行して該エラーを救済するための
    処理を行うことを特徴とするアクセス制御方法。
JP9286329A 1997-10-20 1997-10-20 コンピュータシステムにおけるアクセス制御装置および方法 Pending JPH11120154A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9286329A JPH11120154A (ja) 1997-10-20 1997-10-20 コンピュータシステムにおけるアクセス制御装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9286329A JPH11120154A (ja) 1997-10-20 1997-10-20 コンピュータシステムにおけるアクセス制御装置および方法

Publications (1)

Publication Number Publication Date
JPH11120154A true JPH11120154A (ja) 1999-04-30

Family

ID=17702988

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9286329A Pending JPH11120154A (ja) 1997-10-20 1997-10-20 コンピュータシステムにおけるアクセス制御装置および方法

Country Status (1)

Country Link
JP (1) JPH11120154A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6639845B2 (en) 1999-07-02 2003-10-28 Nec Corporation Data holding circuit having backup function
US7664921B2 (en) 2003-12-26 2010-02-16 Fujitsu Limited Method for accessing shared memories and multiprocessor system using the method
US8019951B2 (en) 2006-07-21 2011-09-13 Canon Kabushiki Kaisha Memory controller including multiple system bus interfaces
JP2014056396A (ja) * 2012-09-12 2014-03-27 Denso Corp 電子制御装置
CN114383346A (zh) * 2021-12-27 2022-04-22 北京世纪互联宽带数据中心有限公司 冷冻单元故障处理方法及装置、计算机可读存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6639845B2 (en) 1999-07-02 2003-10-28 Nec Corporation Data holding circuit having backup function
US7664921B2 (en) 2003-12-26 2010-02-16 Fujitsu Limited Method for accessing shared memories and multiprocessor system using the method
US8019951B2 (en) 2006-07-21 2011-09-13 Canon Kabushiki Kaisha Memory controller including multiple system bus interfaces
JP2014056396A (ja) * 2012-09-12 2014-03-27 Denso Corp 電子制御装置
CN114383346A (zh) * 2021-12-27 2022-04-22 北京世纪互联宽带数据中心有限公司 冷冻单元故障处理方法及装置、计算机可读存储介质
CN114383346B (zh) * 2021-12-27 2023-10-27 北京世纪互联宽带数据中心有限公司 冷冻单元故障处理方法及装置、计算机可读存储介质

Similar Documents

Publication Publication Date Title
JP6333410B2 (ja) 障害処理方法、関連装置、およびコンピュータ
WO2021169260A1 (zh) 一种系统板卡电源检测方法、装置、设备及存储介质
US6742139B1 (en) Service processor reset/reload
EP1204924B1 (en) Diagnostic caged mode for testing redundant system controllers
US6012148A (en) Programmable error detect/mask utilizing bus history stack
US6640203B2 (en) Process monitoring in a computer system
EP0167540A1 (en) CENTRAL UNIT TOLERATING LOSS OF ACCESS TO AN AUXILIARY MEMORY.
JPS6229827B2 (ja)
JP3481737B2 (ja) ダンプ採取装置およびダンプ採取方法
JP7125602B2 (ja) データ処理装置および診断方法
JPH11120154A (ja) コンピュータシステムにおけるアクセス制御装置および方法
JP2002543521A (ja) 自動的にモジュールをコンピュータシステムに再び組み込む方法および装置
JP2009237758A (ja) サーバシステム、サーバ管理方法、およびそのプログラム
JP4507875B2 (ja) 多重化装置及びレガシーデバイス多重化方法
JPH06325008A (ja) リセット機能を備えるコンピュータシステム
JP3127941B2 (ja) 二重化装置
TWI789983B (zh) 電源管理方法及電源管理裝置
JP3001818B2 (ja) マルチプロセッサ立ち上げ管理装置
US11232197B2 (en) Computer system and device management method
TWI715005B (zh) 用於監控基板管理控制器之常駐程序的方法
US10762026B2 (en) Information processing apparatus and control method for suppressing obstacle
US7962781B2 (en) Control method for information storage apparatus, information storage apparatus and computer readable information recording medium
JP2001175545A (ja) サーバシステムおよび障害診断方法ならびに記録媒体
JPH05224964A (ja) バス異常通知方式
JP2017151511A (ja) 情報処理装置、動作ログ取得方法および動作ログ取得プログラム

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030408