JPH04181438A - マルチプロセッサ制御方式 - Google Patents

マルチプロセッサ制御方式

Info

Publication number
JPH04181438A
JPH04181438A JP2310667A JP31066790A JPH04181438A JP H04181438 A JPH04181438 A JP H04181438A JP 2310667 A JP2310667 A JP 2310667A JP 31066790 A JP31066790 A JP 31066790A JP H04181438 A JPH04181438 A JP H04181438A
Authority
JP
Japan
Prior art keywords
processor
intermittent
fault
logging
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2310667A
Other languages
English (en)
Inventor
Masayoshi Takei
武居 正善
Toshihiro Sakai
酒井 利弘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2310667A priority Critical patent/JPH04181438A/ja
Publication of JPH04181438A publication Critical patent/JPH04181438A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概 要〕 本発明はマルチプロセッサ制御方式に関し、信顛性を低
下させずに縮退運転することを目的とし、 電源投入時にハードウェアを診断し、障害が発生してい
るプロセンサを切り離して縮退運転を行うマルチプロセ
・ノサシステムにおいて、不揮発性のロギングメモリと
、障害発生時に障害発生原因を該ロギングメモリに記録
するロギング手段と、電源投入時に該ロギングメモリを
検索し、所定の間欠障害発生が記録されているプロセッ
サを検出する間欠障害検出手段とを設け、障害発生原因
を該ロギングメモリに記録するとともに、電源投入時に
該ロギングメモリを検索し、間欠障害が発生したプロセ
ッサが検出された場合は、該プロセッサを切り離して縮
退運転を行うように構成する。
〔産業上の利用分野〕
本発明は、障害が発生したプロセッサを切り離して縮退
運転を行うマルチプロセフ・す制御方式の0良に関する
7 近年のマルチブロセ2・サソス斗ムでは1、障害が発生
した場合、障害フ゛ロセ、・すを切り離して運転する、
いわゆる縮退運転が行われている。
この切り離しが行われるのは、永続的な障害(ハードウ
ェア障害)であり、間欠的Qこ発生ずる障害(以下間欠
障害と称する)は除外されていたため、再立ち上げ後に
同し間欠障害が発生ずる確率は高く、信頼性が大幅に低
下する。
このような間欠障害の原因究明は時間がかかるため、原
因究明のために運転を停止すること:よ、緊急に運転再
開を必要とする用途に対しては問題となる。
このため、信頼性を低下させずに縮退運転を行うマルチ
プロセンサ制御方式が求められている。
[従来の技術] 第5閑は従来例のマルチブI〕セッサ制御方式説明図で
ある。
第5図は、3組のプロセッサ1.2.3か処理を分担す
るマルチブしフセノサンステム例を承したものである。
処理分担情報は、管理テーブル10に予め設定されてお
り、各フ゛ロセンサCP1.11,2.3でそれらの処
理要求が発生した場合、管理チーフル10を参照して要
求先CPUを認識し、処理要求内容を共通メモ1月に格
納した後、要求先CPUに割込みを発する。
割込みを受けたCPTJは所定の処理を遂行と5、た後
、共通メモリ4に処理結果を格納し、依頼元CPUに通
知する。
ここで、CP tJl、2.3のいずれかにエラーが発
生した場合、いまの場合エラー処理はCP(Jlが行う
ので、エラーの発生したC P TJはCP(Jl に
エラー割込みを行い、これを受は付けたcpc+はエラ
ー処理プログラム6を起動する。
そして、エラー処理プログラム6は、エラー表示、処理
を停止させる等のエラー処理を行う。
このようにしてCP tJl、2.3のいずれかにエラ
ーか発′士するとシステムダウンとなり、電源5を再投
入することにより再立ら上−げが行わη、る。
電源投入時には、各CP[川、2,3でハードウェア診
断プログラム7か走行し、CP 1.、J 1がこの結
果を管理する。そして、ハードウェア障害が発生してい
るCPUがあれば、管理テーブル10を更新して障害発
生CPUを無効とし、運転を開始する。
これにより、無効CPUに設定されている処理は行われ
ず、切離しが行われて縮退運転となる。
なお、第5図において、共通メモリ4にロードされた各
プログラムは、電源投入時に各CPUにロードされ、プ
ロセッサ間通信等でCPtJlに障害が発生しているこ
とが判明すれば、優先順位に基づき、例えばエラー処理
の場合はCPU2が行うようになっている。
マルチプロセッサシステムの構成には、上記の他に種々
のものがあり、例えばチャネル制御装置がマルチプロセ
ンサの一=一部を構成し、チャネル制御装置が入出力処
理、エラー処理等の処理を行うプロセッサを管理テーブ
ル10により認識し7、それぞれ該当プロセッサに処理
要求を発する構成もある。この場&は、切り離−された
プロセンサが通信処理を行うものであれば、以後通信処
理を除く縮退運転が行われることになる。また、切り離
し7されたプロセッサの処理を他のプロセッサが肩代わ
りする場合もあるが、いずれの場合も切り離し制御の対
象はハードウェア障害である。
〔発明が解決しようとする課題] 従来の縮退運転はハードウェア障害が発生したプロセン
サのみ切り離しの対象であり、間欠障害の場合は、シス
テムダウンとなっても、再立ち上げ時に切り離しが行わ
れていなかった。
このため、システムの信頼性が極端に低下するため、障
害原因の究明を行わなければならないが、この種の障害
原因究明には時間がかがり、即時運転を再開しなければ
ならないような用途に対しては問題が大きい。
本発明は、上記課題に鑑み、信頼性を低下させずに縮退
運転を行うマルチプロセッサ制御方式を提供することを
目的とする。
〔課題を解決するための手段〕
第1図本発明の原理図において、 9は不揮発性のロギングメモリで、障害情報が格納され
る。
21はロギング手段で、障害情報を該ロギングメモリ9
に記録する。
20は間欠障害検出手段で、電源投入時に該ロギングメ
モリ9を検索し、所定の間欠障害発生が記録されている
プロセンサを検出する。
〔作 用〕
障害が発生したとき、ロギング手段21は不揮発性のロ
ギングメモリ9に障害情報を記録する。
電源投入時には、各プロセンサにハードウェア診断プロ
グラムを走行させ、ハードウェア障害の有無を診断する
が、同時に間欠障害検出手段20は、ロギングメモリ9
を検索して間欠障害の有無を検索する。
そして間欠障害が発生したプロセッサがあれば、そのプ
ロセッサの切離し処理を行う。
以上により、ハードウェア障害が発生したプロセッサお
よび間欠障害が発生したプロセッサの両方の切離しが行
われるので、従来よりさらに縮退された運転となるが、
間欠障害が発生したプロセッサが切離しされるため、信
軌性は向上する。
〔実施例〕
本発明の実施例を図を用いて詳細に説明する。
第2図は一実施例の構成図、第3図はエラー発生時の処
理フローチャート図、第4図は再立ち上げ時の処理フロ
ーチャート図である。
第2図において、 6aはエラー処理プログラム(ロギング手段21を含む
)で、所定のエラー処理の他に障害情報のロギングを行
う。
10は管理テーブルで、CPLI対応で有効/無効情報
および処理内容が設定される。
7はハードウェア診断プログラムで、電源投入時に各プ
ロセッサCP Ul2,3で走行し、診断結果を切り離
し制御を行うCPU(以下CPUI とする)に通知す
る。
9はロギングメモリで、不揮発性のもの。
8は間欠障害検出プログラムで、電源投入時に本処理の
実行が設定されたCPtJlで走行し、ロギングメモリ
9を検索する。
そして間欠障害が発生したCPUが記録されていれば、
切り離し制御プログラム11に通知する。
11は切り離し制御プログラムで、ハードウェア障害お
よび間欠障害が発生したCPU番号の通知により、管理
テーブル10の該当CPU@に無効情報を設定する。
その他、全図を通じて同一符号は同一対象物を表す。
間欠障害は、例えば線間のクコストーク、断線のしかか
り等で間欠的に発生するもので、パリティチエツク等で
検出される。
このような間欠障害のうち、予め設定した種別の障害情
報に所定の符号を付与しておく。そしてそれらの障害情
報に発生元CPU番号を対応させて記録する。
以上の構成によって次のような処理が行われる。
(ロギング処理)第3図参照 (1)パリティエラー等の障害が発生したCPUはエラ
ー処理を行うCPUを認識し、そのCPU(CPUI)
に割込みを発する。
(2)割込みを受は付けたCPU1ではエラー処理プロ
グラム6aが起動され、従来例で示した所定のエラー処
理の他に、プロセンサ間通信で障害発生CPUから障害
情報を読出し、ロギングメモリ9に記録する。
(再立ち上げ時の処理) 電源投入時の初期設定時において、以下の処理が行われ
る。第4図参照 (1)各CP Ul、2.3は、ハードウェア診断プロ
グラム7を走行させ、ハードウェア各部の診断を行い、
診断結果を共通メモリ4を介して処理担当のCPUIに
通知する。
通知を受けたCPUIでは、切り離し制御プログラム1
1が診断結果からハードウェア障害発生CPUの有無を
検索し、障害発生CPUかあれば、管理テーブル10に
無効情報を設定5て、そのCPUを無効化する。この無
効化により、そのCPUの切り離しが行われる。
(2)続いて、CPtJlでは間欠障害検出ブロクラム
8が起動される。間欠障害検出ブロクラム8はロギング
メモリ9を検索し、所定の間欠障害が記録されていれば
、そのCPU番号を切り離し制御プログラム11に通知
し、切り離し制御プログラム11は、ハードウェア障害
発生Clの切り離し制御と同様に、管理テーブル10を
更新してそのCPUの切り離しを行う。
以後、運転が開始され、各c r t;は、管理テーブ
ル10を参照しつつ処理要求を行うか、無効CPUがあ
れば、その処理は行われない。
以」−のごとく、間欠障害をロギングしておき、再立ぢ
上げ時に間欠障害発生がそのロギングメモリ9より検出
されたとき、該当CP 1.Jの切り離しを行うため、
以後の縮退運転において、信顛性が低下することはない
なδ、縮退運転が行われたときは、業務路T後等で原因
が究明され、速やかに縮退運転が解除されることは勿論
である。
また、電源投入により再立ち上げを行う他に、初期設定
を行う操作でも、同様に切り離し制御かできることは勿
論である。
[発明の効果〕 以上説明したように、本発明は、ハードウェア障害が発
生したプロセッサと間欠障害か発生′−たプロセンサの
両方の切り離しを行うマルチプロセッサ制御方式を提供
するもので、即時運転再開を要するシステムにおいて、
信頼性を低下させることなく縮退運転を行うことができ
るという効果を奏する。
【図面の簡単な説明】
第1図は本発明の原理図、第2図は一実施例の構成図、
第3図はエラー発生時の処理フローチャー[−図、第1
1図・ユよ再立ちトげ時の処理フロー壬ヤー1−図、第
5図は従来例のマルチプロセンサ制御方式説明図である
。 図中、l 2.3はプロセッサCP t、J、4は共通
メモリ、5は電源、6,6aはエラー処理プログラム、
7はハードウェア診断プログラム、8は間欠障害検出プ
ログラム、9はロギングメモリ、10は管理テーブル、
IIは切り離し制御プログラム、2oは間欠障害検出手
段、21はロギング手段である。 5、 [−ニー一切り離し制御i1 本発明の原理図 第1図 第2図 再立ち上げ時の処理フローチャート図

Claims (1)

  1. 【特許請求の範囲】 電源投入時にハードウェアを診断し、障害が発生してい
    るプロセッサを切り離して縮退運転を行うマルチプロセ
    ッサシステムにおいて、 不揮発性のロギングメモリ(9)と、 障害情報を該ロギングメモリ(9)に記録するロギング
    手段(21)と、 電源投入時に該ロギングメモリ(9)を検索し、所定の
    間欠障害発生が記録されているプロセッサを検出する間
    欠障害検出手段(20)と を設け、障害情報を該ロギングメモリに記録するととも
    に、電源投入時に該ロギングメモリを検索し、間欠障害
    が発生したプロセッサが検出された場合は、該プロセッ
    サを切り離して縮退運転を行うことを特徴とするマルチ
    プロセッサ制御方式。
JP2310667A 1990-11-16 1990-11-16 マルチプロセッサ制御方式 Pending JPH04181438A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2310667A JPH04181438A (ja) 1990-11-16 1990-11-16 マルチプロセッサ制御方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2310667A JPH04181438A (ja) 1990-11-16 1990-11-16 マルチプロセッサ制御方式

Publications (1)

Publication Number Publication Date
JPH04181438A true JPH04181438A (ja) 1992-06-29

Family

ID=18008011

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2310667A Pending JPH04181438A (ja) 1990-11-16 1990-11-16 マルチプロセッサ制御方式

Country Status (1)

Country Link
JP (1) JPH04181438A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5951683A (en) * 1994-01-28 1999-09-14 Fujitsu Limited Multiprocessor system and its control method
JP2008158639A (ja) * 2006-12-21 2008-07-10 Hitachi Ltd プロセッサライセンスを管理するサーバ装置
JP2012173762A (ja) * 2011-02-17 2012-09-10 Mitsubishi Electric Corp マルチプロセッサシステム
EP3793180A1 (en) * 2019-09-10 2021-03-17 Toshiba TEC Kabushiki Kaisha Display control device and image forming apparatus

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5951683A (en) * 1994-01-28 1999-09-14 Fujitsu Limited Multiprocessor system and its control method
JP2008158639A (ja) * 2006-12-21 2008-07-10 Hitachi Ltd プロセッサライセンスを管理するサーバ装置
JP2012173762A (ja) * 2011-02-17 2012-09-10 Mitsubishi Electric Corp マルチプロセッサシステム
EP3793180A1 (en) * 2019-09-10 2021-03-17 Toshiba TEC Kabushiki Kaisha Display control device and image forming apparatus

Similar Documents

Publication Publication Date Title
US5226152A (en) Functional lockstep arrangement for redundant processors
US7751310B2 (en) Fault tolerant duplex computer system and its control method
JPH0950424A (ja) ダンプ採取装置およびダンプ採取方法
EP1380950A1 (en) Fault tolerant information processing apparatus
JPH04181438A (ja) マルチプロセッサ制御方式
JPS6048773B2 (ja) 複数計算機間の相互監視方式
JPH0320832A (ja) 情報処理システム
JPS62115555A (ja) 計算機システムの補助記憶装置2重化管理方法
JP2845616B2 (ja) マルチプロセッサシステム
CN116760835B (zh) 分布式存储方法、设备及介质
JPH04305746A (ja) キャッシュメモリ制御装置
JP3185446B2 (ja) 計算機システム
JPH064409A (ja) メモリ障害処理方式
JPH0430245A (ja) マルチプロセッサ制御方式
JPS6155748A (ja) 電子計算機システム
JP3316739B2 (ja) 装置間インタフェース制御方式
JPS62125448A (ja) フロントアドレスアレイ制御方式
JPS63175937A (ja) 障害回復方式
JPH03167635A (ja) 故障検出時の処理方式
JPH04102930A (ja) 中央処理装置
JPH05342025A (ja) 仮想計算機システムの障害処理方式
JPH0713792A (ja) ホットスタンバイシステムにおけるエラー制御方式
JPH04332047A (ja) 冗長計算機システムの同期外れ時の切替方式
JPH07244536A (ja) レジューム支援機構
JPH0756874A (ja) マルチプロセッサシステム及びその障害発生時の再起動方法