JP2001014290A - マルチプロセッサシステム - Google Patents

マルチプロセッサシステム

Info

Publication number
JP2001014290A
JP2001014290A JP11181668A JP18166899A JP2001014290A JP 2001014290 A JP2001014290 A JP 2001014290A JP 11181668 A JP11181668 A JP 11181668A JP 18166899 A JP18166899 A JP 18166899A JP 2001014290 A JP2001014290 A JP 2001014290A
Authority
JP
Japan
Prior art keywords
processor
notification
restart
failed
system control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11181668A
Other languages
English (en)
Other versions
JP3710649B2 (ja
Inventor
Kazumasa Takeda
和正 竹田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP18166899A priority Critical patent/JP3710649B2/ja
Priority to US09/476,733 priority patent/US6557099B1/en
Publication of JP2001014290A publication Critical patent/JP2001014290A/ja
Application granted granted Critical
Publication of JP3710649B2 publication Critical patent/JP3710649B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1417Boot up procedures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1441Resetting or repowering

Abstract

(57)【要約】 【課題】 プロセッサが故障した場合でも、サービス継
続性の良好なマルチプロセッサシステムを提供する。 【解決手段】 マルチプロセッサシステムにおいて、各
プロセッサシステムは、プロセッサの中で故障プロセッ
サ番号を記憶する第1記憶手段と、他プロセッサの故障
プロセッサ番号の通知を受付けて、故障プロセッサ番号
を前記第1記憶手段にライトする第1通知受付手段と、
他プロセッサシステムから初期設定の通知を受付けて、
初期設定をする第2通知受付手段と、全他プロセッサに
初期設定の第3通知をする通知手段を具備する。そし
て、故障していないプロセッサの中からシステム制御プ
ロセッサを決定するシステム制御プロセッサ分析手段と
システム再開をするか否かを決定して、自プロセッサが
システム制御プロセッサに一致する場合、初期設定する
システム再開制御手段とを具備して構成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、複数のプロセッサ
が互いに接続されたマルチプロセッサシステムに関し、
特に、プロセッサ故障時のシステム再開に関する。
【0002】
【従来の技術】機能分散や負荷分散などによる信頼性及
びサービス向上を図るために複数のプロセッサを接続す
るマルチプロセッサシステムが用いられる。例えば、交
換機においては、呼処理を複数のプロセッサが負荷分散
して担当することにより処理速度等を向上させている。
このようなマルチプロセッサシステムにおいて、複数の
プロセッサが故障したり、サービスを提供する上で不可
欠であるプロセッサが故障するとサービスに支障をきた
す。
【0003】そのために、1台のプロセッサからの指示
でシステム復旧させるために特定のプロセッサ(以下、
システム制御プロセッサと呼ぶ)による指示で全プロセ
ッサを初期設定(以下、全プロセッサを初期設定するこ
とをシステム再開と呼ぶ)している。
【0004】従来、システム再開へエスカレーションさ
せる機能は固定のプロセッサ(例えば、交換機において
は保守制御を行うMPR(Main PRocessor))のみに実装
されていた。即ち、従来、固定のプロセッサがシステム
再開へエスカレーションさせていたために、固定のプロ
セッサが故障になると、該当プロセッサを故障状態のま
ま放置させておくと、他プロセッサが故障したときに、
システム再開の制御を行うことができなくなるため、シ
ステム再開へ移行していた。これにより該当プロセッサ
の復旧とシステム全体の初期化を行っていた。
【0005】
【発明が解決しようとする課題】従来、システム制御プ
ロセッサの故障発生で直ちにシステム再開へエスカレー
トさせてシステム全体の初期設定を行うため、システム
制御プロセッサ以外の他プロセッサのみでサービス提供
を継続できたとしてもシステム制御プロセッサの故障が
発生するとシステム再開へエスカレートさせるためサー
ビスの継続性という点で問題があった。
【0006】また、従来技術としてマスタ計算機(シス
テム制御プロセッサ)を停止する場合に他計算機に対し
てマスタ計算機になるよう指示する技術(特開昭59−
62967)があるが、計算機を停止する前に該計算機
が他の計算機に対して指令を出してマスタ機能を移行さ
せるという手続きを行う必要あるため、システム運転の
継続性という点において問題がある。
【0007】本発明の目的は、サービスの継続性の良好
なマルチプロセッサシステムを提供することである。
【0008】
【課題を解決するための手段】本発明の側面によれば、
それぞれプロセッサ番号が一意的に付与されたプロセッ
サを含む複数のプロセッサシステムがプロセッサ接続機
構により互いに接続されたマルチプロセッサシステムで
あって、前記各プロセッサシステムは、前記プロセッサ
の中で故障プロセッサ番号を記憶する第1記憶手段と、
前記プロセッサ接続機構を通して、他プロセッサの故障
プロセッサ番号の第1通知を受付けて、該故障プロセッ
サ番号を前記第1記憶手段にライトする第1通知受付手
段と、前記プロセッサ接続機構を通して、他プロセッサ
システムから初期設定の第2通知を受付けて、自プロセ
ッサの初期設定をする第2通知受付手段と、前記プロセ
ッサ接続機構を通して、全ての他プロセッサシステムに
初期設定の第3通知をする通知手段と、前記第1記憶手
段に記憶された故障プロセッサ番号に基いて、故障して
いないプロセッサの中からシステム制御プロセッサを決
定するシステム制御プロセッサ分析手段と、前記第1記
憶手段に記憶された故障プロセッサ番号に基いて、シス
テム再開をするか否かを決定してシステム再開をすると
き、自プロセッサが前記システム制御プロセッサ分析手
段により決定されたシステム制御プロセッサに一致する
場合、前記通知手段に前記第3通知を指示すると共に、
自プロセッサを初期設定するシステム再開制御手段とを
具備したことを特徴とするマルチプロセッサシステムが
提供される。
【0009】
【発明の実施の形態】本発明の実施形態を説明する前
に、本発明の原理を説明する。図1は、本発明の原理図
である。図1に示すように、マルチプロセッサシステム
では、それぞれプロセッサ番号が一意的に付与されたプ
ロセッサ3#i(i=0〜n)を含む複数のプロセッサ
システム2#i(i=0〜n)がプロセッサ接続機構4
により互いに接続されている。
【0010】各プロセッサシステム2#iは、プロセッ
サ3#j(j=0〜n)の中で故障プロセッサ番号を記
憶する第1記憶手段6#iと、プロセッサ接続機構4を
通して、他プロセッサの故障プロセッサ番号の第1通知
を受付けて、該故障プロセッサ番号を第1記憶手段6#
iにライトする第1通知受付手段8#iと、プロセッサ
接続機構4を通して、他プロセッサシステムから初期設
定の第2通知を受付けて、自プロセッサ3#iの初期設
定をする第2通知受付手段10#iとを有する。
【0011】そして、プロセッサ接続機構4を通して、
全ての他プロセッサシステム2#j(j≠i)に初期設
定の第3通知をする通知手段12#iと、第1記憶手段
6#iに記憶された故障プロセッサ番号に基いて、故障
していないプロセッサの中からシステム制御プロセッサ
を決定するシステム制御プロセッサ分析手段14#i
と、第1記憶手段6#iに記憶された故障プロセッサ番
号に基いて、システム再開をするか否かを決定してシス
テム再開をするとき、自プロセッサ3#iがシステム制
御プロセッサ分析手段14#iにより決定されたシステ
ム制御プロセッサに一致する場合、通知手段12#iに
第3通知を指示すると共に、自プロセッサ3#iを初期
設定するシステム再開制御手段16#iとを有する。
【0012】以下、図1の動作説明をする。
【0013】プロセッサ3#jが実行するプログラムの
無限ループ等によりプロセッサ3#jが故障すると、プ
ロセッサ接続機構4を通して、プロセッサ3#jのプロ
セッサ番号=jが第1通知手段8#iに通知される。第
1通知手段8#iは、故障プロセッサ番号=jを第1記
憶手段6#iに記憶する。
【0014】システム制御プロセッサ分析手段14#i
は、第1記憶手段6#iに記憶された故障プロセッサ番
号に基いて故障していないプロセッサの中からシステム
制御プロセッサ(例えば、最若番号のプロセッサ)を決
定する。システム再開制御手段16#iは、第1記憶手
段6#iに記憶された故障プロセッサ番号に基いてシス
テム再開をするか否かを決定する。
【0015】例えば、m台以上のプロセッサが故障して
いるときにシステム再開を決定する。システム再開をす
るとき、自プロセッサ3#iがシステム制御プロセッサ
分析手段14#iにより決定されたシステム制御プロセ
ッサに一致する場合、通知手段12#iに第3通知を指
示すると共に、自プロセッサ3#iを初期設定する。こ
のように、特定のプロセッサ以外がシステム制御プロセ
ッサとなって、エスカレート条件を満足したときに、シ
ステム再開の指示を行うので、サービスの継続性が改善
される。
【0016】図2は、本発明の実施形態のマルチプロセ
ッサシステムの構成図であり、交換機に適用した例を示
したものである。図2に示すように、マルチプロセッサ
システムは、MPRシステム19#0、CPRシステム
19#i(i=1〜n)及びプロセッサ接続機構26か
ら構成される。
【0017】MPRシステム19#0は、保守・運用制
御をするシステムであり、MPR20#0、メインメモ
リ22#0、HDD#0、IF部25#0及び入出力装
置28を有する。MPR20#0は、プロセッサであ
る。メインメモリ22#0は、MPR20#0が実行す
るプログラム等がHDD24#0よりロードされるメモ
リである。
【0018】HDD24#0は、回線設定情報、保守・
運用制御プログラムや後述するプロセッサが故障したと
きシステムプロセッサ選択をしてシステム再開エスカレ
ートを制御するシステムプロセッサ選択機構プログラム
等を記憶するハードディスクである。IF部25#0
は、受信に際しては、プロセッサ接続機構26からデー
タを受信すると、プロセッサ20#0に出力して、割り
込みにより、通知受付部40#0を起動する。また、送
信に際しては、プロセッサ20#0からデータを受信し
て、プロセッサ接続機構26のインタフェースに従っ
て、データを送信する。
【0019】入出力装置28は、キーボードやマウス等
の入力装置及びディスプレイなどの出力装置であり、例
えば、保守者などにより後述する実装プロセッサ番号、
システム制御プロセッサ決定条件、システム再開エスカ
レート条件及び回線設定データなどが入力される。
【0020】CPRシステム19#i(i=1〜n)
は、呼処理をするシステムであり、CPR20#i、メ
インメモリ22#i、HDD24#i及びIF部25#
iを有する。CPR20#iは、プロセッサである。メ
インメモリ22#iは、CPR20#iが実行するプロ
グラム等がHDD24#iよりロードされるメモリであ
る。HDD24#iは、回線設定情報、呼処理プログラ
ムやシステムプロセッサ選択機構プログラム等を記憶す
るハードディスクである。
【0021】IF部25#iは、受信に際しては、プロ
セッサ接続機構26からデータを受信すると、プロセッ
サ20#iに出力すると共に、割り込みにより、通知受
付部40#iを起動する。また、送信に際しては、プロ
セッサ20#iからデータを受信して、プロセッサ接続
機構26のインタフェースに従って、データを送信す
る。
【0022】プロセッサ接続機構26は、プロセッサ2
0#i(i=0〜n)間を接続するものであり、例え
ば、全プロセッサ20#i(i=0〜n)を接続する共
通バスやATMスイッチなどであって良いし、各2つの
プロセッサを個別に接続するバス等であっても良い。
【0023】図3は、本発明の実施形態によるシステム
制御プロセッサ選択機構のブロック図である。図3に示
すように、システム制御プロセッサ選択機構は、故障プ
ロセッサリスト30#i、プロセッサ実装リスト32#
i、システム制御プロセッサ番号記憶部34#i、シス
テム制御プロセッサ決定条件表36#i、システム再開
エスカレート条件表38#i、通知受付部40#i、故
障プロセッサデータアクセス部42#i、故障通知部4
4#i、システム再開制御部46#i、システム制御プ
ロセッサ分析部48#i、システム再開起動分析部50
#i、初期化通知部52#i、システム再開起動部54
#i、条件データ受付部56#i及び条件変更制御部5
8#iから成り、図2中のHDD24#iにプログラム
やファイルとして記憶されている。
【0024】図4は、図3中の故障プロセッサリスト3
0#iを示す図である。図4に示すように、故障プロセ
ッサリスト30#iは、プロセッサ番号を格納する固定
長の複数の領域から構成され、メインメモリ22#i上
にデータ領域として確保される。各領域には、故障プロ
セッサ番号が格納される。プロセッサ実装リスト32#
iは、実装プロセッサ番号を格納する固定長の複数の領
域から成る。この各領域には、図2のマルチプロセッサ
システムに実装されているプロセッサ20#0〜20#
nのプロセッサ番号=0〜nが格納される。
【0025】図5は、図3中のシステム制御プロセッサ
番号記憶部34#iの構成図である。図5に示すよう
に、システム制御プロセッサ番号記憶部34#iには、
交換機における現在のシステム制御プロセッサ番号が記
憶され、メインメモリ22#i上にデータ領域として確
保される。
【0026】図6は、図3中のシステム制御プロセッサ
決定条件表36#iを示す図である。図6に示すよう
に、システム制御プロセッサ決定条件表36#iには、
0w目にシステム制御プロセッサ決定条件、1w目にプ
ロセッサ番号が記憶される。システム制御プロセッサ決
定条件表36#iは、HDD24#iにファイルとして
構成される。
【0027】システム制御プロセッサ決定条件は、シス
テム制御プロセッサの決定条件の種別を示す番号であ
り、全てのプロセッサシステム19#0〜19#nにお
いて、同一のプロセッサがシステム制御プロセッサとし
て選択されることが必要な条件である。この決定条件
は、例えば、1:固定(システム制御プロセッサが固
定),2:故障していない現用プロセッサの中で最若番
号のプロセッサ,3:故障していない現用プロセッサの
中で最老番号のプロセッサ,4:故障プロセッサの次番
号のプロセッサ等であり、運用形態に応じて設定され
る。
【0028】プロセッサ番号は、システム制御プロセッ
サ決定条件の種別が固定(=1)の時のそのプロセッサ
番号である。尚、この種別が固定の場合を含ませたの
は、運用に柔軟性を持たせることができること、後述す
るように運用中に適宜条件を変更することが可能なこと
からである。
【0029】図7は、システム再開エスカレート条件表
38#iを示す図である。図7に示すように、システム
再開エスカレート条件表38#iには、0w目にシステ
ム再開起動契機種別及び1w目にプロセッサ台数が記憶
される。システム再開起動契機種別は、システム再開起
動契機の条件を示す種別番号であり、サービス継続性及
び故障プロセッサのサービス中断によるサービス劣化の
防止の観点等から決定される。
【0030】例えば、1:システム制御プロセッサの故
障でシステム再開起動とする,2:プロセッサ故障がn
台以上でシステム再開起動とする。プロセッサ台数は、
システム再開起動契機種別が2の時にシステム再開起動
される故障プロセッサ台数である。システム再開エスカ
レート条件表38#iは、HDD24#iにファイルと
して格納されている。
【0031】通知受付部40#iは、IF部25#iに
より割り込みにより又は故障通知部44#iにより起動
されるプログラムであり、プロセッサの故障通知/故障
回復通知及び初期化通知を受けて、以下の処理を行う。
【0032】(a)故障/故障回復通知の場合は、故障
プロセッサデータアクセス部42#iをコールすること
により故障プロセッサリスト30#iに故障プロセッサ
番号の追加又は故障プロセッサリスト30#iから故障
回復プロセッサ番号の削除を行う。故障通知のとき、シ
ステム再開制御部46#iをコールすることによりシス
テム制御プロセッサの決定とシステム再開エスカレート
条件を満たす場合はシステム再開をする。
【0033】(b)初期化通知の場合は、システム再開
起動部54#iをコールすることによりシステム再開を
する。尚、初期化通知は、プロセッサ20#iが故障し
ている場合でも行われる。しかし、割り込みベクタアド
レスとして通知受付部40#iのメモリアドレスが登録
されているので、プロセッサ20#iが故障していて
も、IF部25#iからの割り込みによって、通知受付
部40#iが起動されて、故障プロセッサ20#iにお
いても、システム再開を行うことができる。
【0034】故障プロセッサデータアクセス部42#i
は、通知受付部40#iによりコールされるプログラム
であって、故障/故障回復の種別及び故障/故障回復プ
ロセッサ番号が入力される。故障であれば、故障プロセ
ッサリスト30#iに故障プロセッサ番号を追加して、
故障回復であれば、故障回復プロセッサ番号を故障プロ
セッサリスト30#iから削除する。
【0035】システム再開制御部46#iは、通知受付
部40#iによりコールされるプログラムであって、故
障プロセッサ番号が入力される。システム制御プロセッ
サ分析部48#iをコールすることにより新システム制
御プロセッサ番号を決定し、システム再開起動分析部5
0#iをコールすることによりシステム再開エスカレー
ト条件表38#iに記憶されているシステム再開起動契
機種別及びプロセッサ台数を収集して、以下の処理をす
る。
【0036】(a)システム制御プロセッサ決定条件=
1(固定)のときは、自プロセッサがシステム制御プロ
セッサならば、初期化通知部52#iをコールすること
によりプロセッサ接続機構26を介して他プロセッサ2
0#jにシステム再開を通知し、システム再開起動部5
4#iをコールすることによりシステム再開をする。
【0037】(b)システム制御プロセッサ決定条件=
2のときは、故障プロセッサ台数≧システム再開エスカ
レート表38#iの1w目のプロセッサ台数nを満たし
且つ自プロセッサが新システム制御プロセッサならば、
初期化通知部52#iをコールすることによりIF部2
5#i及びプロセッサ接続機構26を介して他プロセッ
サ20#jにシステム再開を通知する。システム再開起
動部54#iをコールすることによりシステム再開をす
る。
【0038】システム制御プロセッサ分析部48#i
は、システム再開制御部46#iによりコールされるプ
ログラムであって、現システム制御プロセッサ番号をシ
ステム再開制御部46#iに出力する。システム制御プ
ロセッサ条件表36#iに従って新システムプロセッサ
番号を決定して新システム制御プロセッサ番号をシステ
ム制御プロセッサ番号記憶部34#iに更新し、新シス
テムプロセッサ番号をシシステム再開制御部46#iに
出力する。
【0039】新システム制御プロセッサの決定は、故障
プロッサの通知を契機として行われるが、現システム制
御プロセッサの故障に関わらず故障プロセッサの通知を
受け付けると、常に決定を行う方法と、現システム制御
プロセッサが故障したときのみ決定を行う方法のいずれ
の方法であっても良いが、本実施形態では、前者の方法
により、決定をしている。
【0040】システム再開起動分析部50#iは、シス
テム再開制御部46#iによりコールされるプログラム
であって、システム再開エスカレート条件表38#iか
らエスカレート条件を収集して、システム再開起動契機
種別及びプロセッサ台数をシステム再開制御部46#i
に出力する。
【0041】初期化通知部52#iは、通知受付部40
#i又はシステム再開制御部46#iによりコールされ
るプログラムであって、IF部25#i及びプロセッサ
接続機構26を通して、他プロセッサ20#j(j≠
i)にシステム再開を通知する。システム再開起動部5
4#iは、通知受付部40#i又はシステム再開制御部
46#iによりコールされるプログラムであって、シス
テム再開(IPL)をする。
【0042】条件データ受付部56#iは、変更のシス
テム制御プロセッサ決定条件やシステム再開エスカレー
ト条件を受け付けて、条件表変更制御部58#iをコー
ルすることにより、システム制御プロセッサ決定条件表
36#iやシステム再開エスカレート条件表38#iに
更新登録を行うプログラムである。尚、システム制御プ
ロセッサ決定条件やシステム再開エスカレート条件は、
例えば、MPRシステム19#0において、入出力装置
28より入力され、CPRシステム19#i(i=1〜
n)においては、MPR20#0よりIF部15#0及
びプロセッサ接続機構26を通して入力される。
【0043】条件表変更制御部58#iは、条件表受付
部56#iよりコールされるプログラムであって、変更
種別及び変更データが入力され、変更種別に従って、変
更データをシステム制御プロセッサ条件表36#i又は
システム再開エスカレート条件表38#iに設定する。
【0044】以下、本発明によるシステム制御プロセッ
サ選択機構の動作説明をする。
【0045】(1) プロセッサ実装リスト32#0等
の設定 MPR20#0は、電源オンなどされることによって立
ち上がる。保守者等は、入出力装置28よりプロセッサ
実装リスト、システム制御プロセッサ決定条件及びシス
テム再開エスカレート条件を入力する。MPR20#0
は、入出力装置28より入力されたプロセッサ実装リス
ト等をHDD#0にプロセッサ実装リスト32#0、シ
ステム制御プロセッサ決定条件表36#0及びシステム
再開エスカレート条件表38#0のファイルに登録す
る。
【0046】(2) プロセッサ実装リスト32#i等
の設定 HDD24#iにスタンドアローンによりプロセッサ実
装リスト、自プロセッサ番号等をプロセッサ実装リスト
32#i等のファイルに登録する。あるいは、MPR2
0#0は、CPR20#i(i=1〜n)にIF部25
#0及びプロセッサ接続機構26を通して、プロセッサ
実装リスト等を送信する。CPR20#iは、プロセッ
サ接続機構26及びIF部25#iを通して、プロセッ
サ実装リスト等を受信して、HDD24#iにプロセッ
サ実装リスト32#i等のファイルに登録する。
【0047】(3) MPR20#0,CPR20#i
の立ち上げ MPR20#0,CPR20#iは電源オンなどにより
起動されると、デフォルトのプロセッサ、例えば、MP
R20#0がシステム制御プロセッサとなる。例えば、
MPR20#0,CPR20#i(i=1〜n)が立ち
上がったとき、システム制御プロセッサ記憶部34#i
にデフォルトのシステム制御プロセッサ番号(MPR2
0#0のプロセッサ番号=0)をライトする。
【0048】(4) プロセッサの故障監視 図示しないが専用の障害監視回路やプロセッサ20#i
が自律で、プロセッサ20#iの故障を監視している。
ここで、プロセッサ20#iの故障の要因としては、無
限ループ、命令例外等のプログラム割り込みが発生する
ことによるソフトウェアの障害が上げられる。
【0049】プロセッサ20#iの故障は、例えば、プ
ロセッサ20#iが一定周期で故障監視回路に通知し、
プロセッサ20#iの無限ループなどによって一定時間
以上通知が無くなると、故障監視回路がプロセッサ20
#iの故障であると判断する。また、プロセッサ20#
iが命令例外等のプログラム割り込みが発生したときに
OS(Operating System)が自身のプロセッサの故障であ
ると判断する。更に、特定のプロセッサ20#j、例え
ば、MPR20#0又は現在のシステム制御プロセッサ
が、プロセッサ20#iの故障を検出することも可能で
ある。
【0050】プロセッサ20#iの故障が検出される
と、故障通知部44#iは、故障監視回路からの割り込
みやOSなどにより起動される。故障通知部44#i
は、IF部25#iより、故障通知及び自プロセッサ番
号(故障プロセッサ番号)をプロセッサ接続機構26に
送信すると共に、初期化通知部52#iに故障通知及び
自プロセッサ番号を通知する。
【0051】また、プロセッサ20#iの故障が回復す
ると、故障通知部44#iは、IF部25#iより故障
回復通知及び自プロセッサ番号(故障回復プロセッサ番
号)をプロセッサ接続機構26に送信すると共に、初期
化通知部52#iに故障回復通知及び自プロセッサ番号
を通知する。
【0052】第1実施形態 図8は、本発明の第1実施形態によるシステム再開の移
行条件を示す図である。図8に示すように、このマルチ
プロセッサシステムでは、2台以上のプロセッサが故障
するとシステム再開へ移行するケースであり、例えば、
MPR20#0,CPR20#2が故障したときにシス
テム再開へ移行するケースを示している。尚、図8で
は、n=4の場合を示している。例えば、最初にシステ
ム制御プロセッサであるMPR20#0が故障して、そ
の後CPR20#3が故障し、故障プロセッサがトータ
ル2台ということで、システム再開へ移行するケースを
例に説明する。
【0053】図9は、本発明の第1実施形態によるシス
テム再開エスカレート条件表38#iを示す図である。
この例の場合は、図9に示すように、システム再開エス
カレート条件表38#iには、システム再開起動契機種
別=2、プロセッサ台数=2が設定されている。
【0054】図10は、本発明の第1実施形態によるシ
ステム制御プロセッサ決定条件表36#iを示す図であ
る。図10に示すように、システム制御プロセッサ決定
条件表36#iには、システム決定条件として、例え
ば、決定条件=2(現用プロセッサの最若番号とする)
が設定されている。
【0055】(1) システム制御プロセッサであるM
PR20#0が故障したとき 故障通知部44#0は、IF部25#0を通して、故障
プロセッサ番号=0及び故障通知情報をプロセッサ接続
機構26に送信する。IF部25#1〜25#nは、プ
ロセッサ接続機構26より故障プロセッサ番号=0及び
故障通知情報を受信して、プロセッサ20#1〜20#
nに出力すると共に、割り込みによって、通知受付部4
0#1〜40#nを起動する。また、故障通知部44#
0は、通知受付部40#0を起動する。
【0056】(a) 通知受付部40#iの動作 図11は、図3中の通知受付部40#iの動作フローチ
ャートである。通知受付部40#i(i=0〜n)は、
ステップS2において、MPR20#0の故障通知なの
で、通知種別が故障通知であると判断して、ステップS
4に進む。ステップS4において、故障通知/故障回復
通知に関する情報を取り出す。ステップS6において、
故障/故障回復及び故障プロセッサ番号=0を引数など
に設定して、故障プロセッサデータアクセス部42#i
をコールする。
【0057】(b) 故障プロセッサデータアクセス部
42#iの動作 図12は、図3中の故障プロセッサデータアクセス部4
2#iの動作フローチャートである。図12中のステッ
プS20において、故障通知なので、故障通知であると
判断して、ステップS22に進む。ステップS22にお
いて、故障プロセッサリスト30#iに故障プロセッサ
番号=0を追加して、リターンする。
【0058】尚、故障回復通知ならば、ステップS24
において、故障プロセッサリスト30#iから故障回復
プロセッサ番号が削除される。例えば、故障回復プロセ
ッサ番号が格納されていた領域に、それ以降の領域に格
納されている故障プロセッサ番号を順次移動する。図8
中のステップS10において、通知を受けた故障プロセ
ッサ番号を引数などに設定して、システム再開制御部4
6#iをコールする。
【0059】(c) システム再開制御部46#iの動
作 図13は、図3中のシステム再開制御部46#iの動作
フローチャートである。図13中のステップS30にお
いて、システム制御プロセッサ分析部48#iをコール
する。
【0060】(d) システム制御プロセッサ分析部4
8#iの動作 図14は、図3中のシステム制御プロセッサ分析部48
#iの動作フローチャートである。図14中のステップ
S60において、システム制御プロセッサ番号記憶部3
4#iより現システム制御プロセッサ番号=0を取得す
る。ステップS62において、システム制御プロセッサ
決定条件表36#iよりシステム制御プロセッサを決定
する条件=2を取得する。
【0061】ステップS64において、決定条件=2な
ので、ステップS70に進む。ステップS70におい
て、プロセッサ実装リスト32#iより実装プロセッサ
番号のリスト(実装プロセッサ番号=0,1,…,n)
を取得する。ステップS72において、故障プロセッサ
リスト30#iより故障プロセッサ番号のリストを収集
する。本例では、故障プロセッサ番号=0が収集され
る。ステップS74において、実装リスト、故障リス
ト、システム制御プロセッサの決定条件から新システム
プロセッサ番号を以下のように決定する。
【0062】決定条件=2なので、実装リスト32#i
の中で故障リスト30#iに登録されていない最若番の
プロセッサが決定される。本例では、故障リスト30#
iには、プロセッサ番号=0が登録されているので、最
若番のプロセッサ番号=1が決定される。
【0063】尚、決定条件=3のときは、実装リストの
中で故障プロセッサリスト32#iに登録されていない
最老番のプロセッサが決定される。決定条件=4のとき
は、故障リストに登録されている最老番、最若番又は最
後に登録されたプロセッサ番号の次の故障していないプ
ロセッサ番号が決定される。
【0064】ステップS76において、新システム制御
プロセッサ番号に選択されたプロセッサ番号を設定す
る。ステップS68において、新システムプロセッサ番
号=1をシステム制御プロセッサ記憶部34#iに更新
し、現システム制御プロセッサ番号及び新システムプロ
セッサ番号を引数などに設定して終了する。図10中の
ステップS32において、システム再開起動分析部50
#iをコールする。
【0065】(e) システム再開起動分析部50#i
の動作 図15は、図3中のシステム再開起動分析部50#iの
動作フローチャートである。図15中のステップS80
において、システム再開エスカレート条件表38#iを
収集する。ステップS82において、システム再開起動
契機種別及びプロセッサ台数を引数などに設定して、リ
ターンする。本例では、システム再開起動契機種別=
2、プロセッサ台数=2が設定される。
【0066】(c−1) MPR20#0のシステム再
開制御部46#0の動作 図13中のステップS34において、システム再開制御
部46#0は、HDD24#0等から自プロセッサ番号
=0を取得する。ステップS36において、故障プロセ
ッサ番号=0、自プロセッサ番号=0なので、故障プロ
セッサ番号と自プロセッサ番号が一致すると判断して、
ステップS38に進む。
【0067】ステップS38において、自プロセッサ番
号=0,現システムプロセッサ番号=0なので、自プロ
セッサ番号と現システムプロセッサ番号が一致すると判
断して、ステップS40に進む。ステップS40におい
て、自プロセッサ番号=0,新システムプロセッサ番号
=1なので、自プロセッサ番号と新システムプロセッサ
番号が一致しないと判断して、リターンする。
【0068】(c−2) CPR20#1のシステム再
開制御部46#1の動作 図13中のステップS34において、システム再開制御
部46#1は、HDD24#1等から自プロセッサ番号
=1を取得する。ステップS36において、故障プロセ
ッサ番号=0、自プロセッサ番号=1なので、故障プロ
セッサ番号と自プロセッサ番号が一致しないと判断し
て、ステップS46に進む。
【0069】ステップS46において、自プロセッサ番
号=1,新システムプロセッサ番号=1なので、自プロ
セッサ番号と新システムプロセッサ番号が一致すると判
断して、ステップS48に進む。ステップS48におい
て、システム再開起動契機種別=2であると判断して、
ステップS50に進む。ステップS50において、故障
プロセッサ台数=1でプロセッサ台数=2よりも小さい
と判断して、リターンする。
【0070】(c−3) CPR20#i(i≧2)の
システム再開制御部46#iの動作 図13中のステップS34において、システム再開制御
部46#iは、HDD24#i等から自プロセッサ番号
=i(i≧2)を取得する。ステップS36において、
故障プロセッサ番号=0、自分プロセッサ番号=i(i
≧2)なので、故障プロセッサ番号と自プロセッサ番号
とが一致しないと判断して、ステップS46に進む。ス
テップS46において、自プロセッサ番号=i,新シス
テムプロセッサ番号=1なので、自プロセッサ番号と新
システムプロセッサ番号が一致しないと判断して、リタ
ーンする。
【0071】このように、これまでシステムプロセッサ
であったMPR20#0のみが故障してもシステム再開
エスカレート条件を満足しないためシステム再開をしな
い。これは、MPR20#0のみが1台故障しても、C
PR20#iによるサービスの継続性に問題がないから
である。
【0072】通知受付部40#iは、図11中のステッ
プS10でのシステム再開制御部46#iでの処理が終
了してから、自身の処理を終了する。そして、CPR2
0#iにおいて、呼処理が再開される。これにより、M
PR20#0の故障によるシステム再開起動判定に要す
る僅かな時間だけ一時中断された後、CPR20#iに
おいて呼処理が再開されるため、サービス継続性に問題
が生じることがない。
【0073】(2) 次にCPR20#2が故障発生し
たとき 故障通知部44#2は、IF部25#2を通して、シス
テム制御プロセッサ番号=2及び故障通知情報を、プロ
セッサ接続機構26に出力する。IF部40#i(i≠
2)は、システム制御プロセッサ番号=2及び故障通知
情報を受信して、プロセッサ40#i(i≠2)に出力
すると共に、割り込みによって、通知受付部40#iを
起動する。
【0074】(a) 通知受付部40#iの動作 通知受付部40#2は、故障通知部44#2により起動
される。通知受付部40#i(i=0〜n)は、ステッ
プS2において、CPR20#2の故障通知なので、故
障通知であると判断して、ステップS4に進む。ステッ
プS4において、故障通知及び故障プロセッサ番号=2
を取り出す。ステップS6において、故障通知及び故障
プロセッサ番号=2を引数などに設定して、故障プロセ
ッサデータアクセス部42#iをコールする。
【0075】(b) 故障プロセッサデータアクセス部
42#iの動作 図12中のステップS20において、故障通知なので、
故障通知であると判断して、ステップS22に進む。ス
テップS22において、故障プロセッサリスト30#i
に故障プロセッサ番号=1を追加して、リターンする。
これにより故障プロセッサリスト30#iには、故障プ
ロセッサ番号=0,2が登録される。
【0076】(c) システム再開制御部46#iの動
作 図13中のステップS30において、システム制御プロ
セッサ分析部48#iをコールする。
【0077】(d) システム制御プロセッサ分析部4
8#iの動作 図14中のステップS60において、システム制御プロ
セッサ番号記憶部34#iより現システム制御プロセッ
サ番号=1を取得する。ステップS62において、シス
テム制御プロセッサ決定条件表36#iよりシステム制
御プロセッサを決定する条件=2を取得する。
【0078】ステップS64において、決定条件=2な
ので、ステップS70に進む。ステップS70におい
て、プロセッサ実装リスト32#iより実装プロセッサ
番号のリスト(実装プロセッサ番号=0,1,…,n)
を取得する。ステップS72において、故障プロセッサ
リスト30#iより故障プロセッサ番号のリストを収集
する。本例では、故障プロセッサ番号=0,2が収集さ
れる。ステップS74において、実装リスト、故障リス
ト、システム制御プロセッサの決定条件から新システム
プロセッサ番号を以下のように決定する。
【0079】決定条件=2なので、プロセッサ実装リス
ト32#iの中で故障プロセッサリスト30#iに登録
されていない最若番のプロセッサが決定される。本例で
は、故障プロセッサリスト30#iには、プロセッサ番
号=0,2が登録されているので、最若番のプロセッサ
番号=1が決定される。
【0080】ステップS76において、新システム制御
プロセッサ番号に選択されたプロセッサ番号=1を設定
する。ステップS68において、新システムプロセッサ
番号=1をシステム制御プロセッサ記憶部34#iに更
新して、現システム制御プロセッサ番号=1及び新シス
テムプロセッサ番号=1を引数などに設定して、リター
ンする。図13中のステップS32において、システム
再開起動分析部50#iをコールする。
【0081】(e) システム再開起動分析部50#i
の動作 図15中のステップS80において、システム再開エス
カレート条件表38#iを収集する。ステップS82に
おいて、システム再開起動契機種別及びプロセッサ台数
を引数などに設定して、リターンする。本例では、シス
テム再開起動契機種別=2、プロセッサ台数=2が設定
される。
【0082】(c−1) CPR20#2のシステム再
開制御部46#0の動作 図13中のステップS34において、システム再開制御
部46#2は、HDD24#0等から自プロセッサ番号
=2を取得する。ステップS36において、故障プロセ
ッサ番号=2、自プロセッサ番号=2なので、故障プロ
セッサ番号と自プロセッサ番号が一致すると判断して、
ステップS38に進む。
【0083】ステップS38において、自プロセッサ番
号=2,現システムプロセッサ番号=1なので、自プロ
セッサ番号と現システムプロセッサ番号が一致しないと
判断して、リターンする。
【0084】(c−2) CPR20#1のシステム再
開制御部46#1の動作 図13中のステップS34において、システム再開制御
部46#1は、HDD24#1等から自プロセッサ番号
=1を取得する。ステップS36において、故障プロセ
ッサ番号=2、自プロセッサ番号=1なので、故障プロ
セッサ番号と自プロセッサ番号が一致しないと判断し
て、ステップS46に進む。
【0085】ステップS46において、自プロセッサ番
号=1,新システムプロセッサ番号=1なので、自プロ
セッサ番号と新システムプロセッサ番号が一致すると判
断して、ステップS48に進む。ステップS48におい
て、システム再開起動契機種別=2であると判断して、
ステップS50に進む。
【0086】ステップS50において、故障プロセッサ
台数=2でシステム再開エスカレート条件表38#iに
設定されたプロセッサ台数=2と一致するので、ステッ
プS52に進む。ステップS52において、初期化通知
部52#1をコールする。初期化通知部52#1は、I
F部25#iを通して、プロセッサ接続機構26に初期
化通知情報を送信する。他のプロセッサシステム19#
i(i≠1)中のIF部25#iは、プロセッサ接続機
構26より初期化通知情報を受信して、プロセッサ20
#iに出力すると共に、割り込みによって、通知受付部
40#iを起動する。
【0087】通知受付部40#iは、図11中のステッ
プS2において、通知種別を判断し,ステップS12に
おいて、初期化通知を受け付ける。ステップS14にお
いて、システム再開起動部54#iをコールして、シス
テム再開起動をする。これにより、プロセッサ20#1
を除くプロセッサ20#iにおいて、システム再開され
る。一方、プロセッサ20#1において、システム再開
制御部46#1は、ステップS54において、システム
再開起動部54#1をコールしてシステム再開起動をす
る。
【0088】(c−3) CPR20#i(i≧3)の
システム再開制御部46#iの動作 図13中のステップS34において、システム再開制御
部46#iは、HDD24#i等から自プロセッサ番号
=i(i≧3)を取得する。ステップS36において、
故障プロセッサ番号=2、自プロセッサ番号=i(i≧
3)なので、故障プロセッサ番号と自プロセッサ番号が
一致しないと判断して、ステップS46に進む。ステッ
プS46において、自プロセッサ番号=i(i≧3),
新システムプロセッサ番号=1なので、自プロセッサ番
号と新システムプロセッサ番号が一致しないと判断し
て、終了する。
【0089】尚、本例では、MPR20#0が故障した
場合を例に説明したが、MPR20#0が故障しない場
合でも、2台以上のCPR20#iが故障すると、MP
R20#0がシステム再開を他の全てのCPR20#i
に通知する。
【0090】このように、MPR20#0が故障した場
合でも、システム再開エスカレート条件表38#iに設
定された条件を満足しない限り、システム再開が行われ
ることなくサービスが継続される。そして、故障台数が
システム再開エスカレート条件表38#iに設定された
条件を満足すると、システム制御プロセッサ条件表36
#iの決定条件よりCPR20#jがシステム制御プロ
セッサとなって、システム再開をする。
【0091】第2実施形態 図16は、本発明の第2実施形態によるシステム再開の
移行条件を示す図である。図16に示すように、このマ
ルチプロセッサシステムでは、システム制御プロセッサ
が固定でそのシステム制御プロセッサが故障したときに
システム再開に移行する場合である。尚、図16では、
n=4の場合を示している。
【0092】図17は、本発明の第2実施形態によるシ
ステム再開エスカレート条件表38#iを示す図であ
る。この例の場合は、図17に示すように、システム再
開エスカレート条件表38#iには、0w目にシステム
再開起動契機種別=1が設定される。
【0093】図18は、本発明の第2実施形態によるシ
ステム制御プロセッサ決定条件表36#iを示す図であ
る。図18に示すように、システム制御プロセッサ決定
条件表36#iには、0w目にシステム制御決定条件=
1、1w目にプロセッサ番号=MPR20#0のプロセ
ッサ番号=0が設定される。
【0094】このように、システム再開エスカレート条
件表38#i及びシステム制御プロセッサ決定条件表3
6#iに該当値を設定することにより、システム制御プ
ロセッサが固定でそのシステム制御プロセッサが故障し
たときにシステム再開に移行する場合にも適用可能とな
っており、システム運用に柔軟性を持たせることができ
るようになっている。
【0095】システム制御ブロセッサであるMPR20
#0が故障したとき、故障通知部44#0は、IF部2
5#0から、システム制御プロセッサ番号=0及び故障
通知情報を、プロセッサ接続機構26に出力する。IF
部40#i(i≠0)は、システム制御プロセッサ番号
=0及び故障通知情報を受信して、プロセッサ40#i
(i≠0)に出力すると共に、割り込みによって、通知
受付部40#iを起動する。
【0096】(a) 通知受付部40#iの動作 通知受付部40#0は、故障通知部44#0より起動さ
れる。通知受付部40#i(i=0〜n)は、図11中
のステップS2において、MPR20#0の故障通知な
ので、故障通知であると判断して、ステップS4に進
む。ステップS4において、故障通知及び故障プロセッ
サ番号=0を取り出す。ステップS6において、故障通
知及び故障プロセッサ番号=0を引数などに設定して、
故障プロセッサデータアクセス部42#iをコールす
る。
【0097】(b) 故障プロセッサデータアクセス部
42#iの動作 図12中のステップS20において、故障通知なので、
故障通知であると判断して、ステップS22に進む。ス
テップS22において、故障プロセッサリスト30#i
に故障プロセッサ番号=0を追加して、リターンする。
これにより故障プロセッサリスト30#iには、故障プ
ロセッサ番号=0が登録される。
【0098】(c) システム再開制御部46#iの動
作 図13中のステップS30において、システム制御プロ
セッサ分析部48#iをコールする。
【0099】(d) システム制御プロセッサ分析部4
8#iの動作 図14中のステップS60において、システム制御プロ
セッサ番号記憶部34#iより現システム制御プロセッ
サ番号=0を取得する。ステップS62において、シス
テム制御プロセッサ決定条件表36#iよりシステム制
御プロセッサを決定する条件=1を取得する。ステップ
S64において、決定条件=1なので、ステップS66
に進む。
【0100】ステップS66において、新システム制御
プロセッサ番号に条件表36#iの1w目の値(=0)
を設定する。ステップS68において、新システムプロ
セッサ番号=0をシステム制御プロセッサ記憶部34#
iに更新し、現システム制御プロセッサ番号=0及び新
システムプロセッサ番号=0を引数などに設定して、リ
ターンする。図13中のステップS32において、シス
テム再開起動分析部50#iをコールする。
【0101】(e) システム再開起動分析部50#i
の動作 図15中のステップS80において、システム再開エス
カレート条件表38#iを収集する。ステップS82に
おいて、システム再開起動契機種別及びプロセッサ台数
を引数などに設定して、リターンする。本例では、シス
テム再開起動契機種別=1が設定される。
【0102】(c−1) MPR20#0のシステム再
開制御部46#0の動作 図13中のステップS34において、システム再開制御
部46#0は、HDD24#0等から自プロセッサ番号
=0を取得する。ステップS36において、故障プロセ
ッサ番号=0、自プロセッサ番号=0なので、故障プロ
セッサ番号と自プロセッサ番号が一致すると判断して、
ステップS38に進む。
【0103】ステップS38において、自プロセッサ番
号=0,現システムプロセッサ番号=0なので、自プロ
セッサ番号と現システムプロセッサ番号が一致すると判
断して、ステップS40に進む。ステップS40におい
て、自プロセッサ番号=0,新システムプロセッサ番号
=0なので、新プロセッサ番号と現システムプロセッサ
番号が一致すると判断して、ステップS42に進む。ス
テップS42において、初期化通知部52#0をコール
する。ステップS44において、システム再開起動部5
4#0をコールする。これにより、全プロセッサ20#
i(i=0〜n)において、システム再開が行われる。
【0104】(c−2) CPR20#i(i≧1)の
システム再開制御部46#iの動作 図13中のステップS34において、システム再開制御
部46#iは、HDD24#i等から自プロセッサ番号
=i(i≧1)を取得する。ステップS36において、
故障プロセッサ番号=0、自プロセッサ番号=i(i≧
1)なので、故障プロセッサ番号と自プロセッサ番号が
一致しないと判断して、ステップS46に進む。ステッ
プS46において、自プロセッサ番号=i(i≧1),
新システムプロセッサ番号=0なので、自プロセッサ番
号と新システムプロセッサ番号が一致しないと判断し
て、リターンする。
【0105】第3実施形態 運用中にシステム制御プロセッサ決定表36#iやシス
テム再開エスカレート条件表38#i等を更新したい場
合がある。例えば、サービス向上等の観点からCPRが
増設されたことに伴い、プロセッサ台数を変更したい場
合がある。このような場合、保守者は、入出力装置28
から変更したいシステム制御プロセッサ決定表36#i
やシステム再開エスカレート条件表38#iなどの変更
種別(例えば、システム再開エスカレート条件表)及び
変更データ(例えば、プロセッサ台数=3)を入力す
る。
【0106】条件データ受付部56#0は、変更種別及
び変更データを受付けて、IF部25#0及びプロセッ
サ接続機構26を通して、条件データ受付部56#i
(i≧1)に送信すると共に、条件表変更制御部58#
0をコールする。一方、条件データ受付部56#i(i
≧1)は、変更種別及び変更データを受付けると、条件
表変更制御部58#iをコールする。
【0107】図19は、図3中の条件表変更部58#i
の動作フローチャートである。図19中のステップS9
0において、変更種別を判断して、システム制御プロセ
ッサ決定条件表36#iの変更ならば、ステップS92
に進み、システム再開エスカレート条件表38#iの変
更ならば、ステップS94に進む。ステップS92にお
いて、変更データをシステム制御プロセッサ決定条件表
36#iに設定する。
【0108】ステップS84において、変更データをシ
ステム再開エスカレート条件表38#iに設定する。こ
れにより、システム運用中であっても、サービスを停止
することなく、変更されたシステムプロセッサ決定条件
表36#iやシステム再開エスカレート条件表38#i
に従って、システム制御プロセッサの選択及びシステム
再開の制御が行われる。
【0109】
【発明の効果】以上説明したように本発明によれば、シ
ステム制御プロセッサを固定的に括り付ける必要が無
く、システム制御プロセッサは他プロセッサへ移行する
こととが可能となり、システム運用状態の継続性に効果
を発揮する。また、システム再開へのエスカレーション
条件とシステム制御プロセッサの決定条件を組み合わせ
ることにより、システム構成に応じたバリエーションに
富んだシステム再開へのエスカレーション条件を設定す
ることが可能となる。
【図面の簡単な説明】
【図1】本発明の原理図である。
【図2】本発明の実施形態によるマルチプロセッサシス
テムを示す図である。
【図3】本発明の実施形態によるシステム制御プロセッ
サ選択機構を示す図である。
【図4】図3中の故障プロセッサリストを示す図であ
る。
【図5】図3中のシステム制御プロセッサ番号記憶部を
示す図である。
【図6】図3中のシステム制御プロセッサ決定条件表を
示す図である。
【図7】図3中のシステム再開エスカレート条件表を示
す図である。
【図8】本発明の第1実施形態によるシステム再開の移
行条件を示す図である。
【図9】本発明の第1実施形態によるシステム再開エス
カレート条件表を示す図である。
【図10】本発明の第1実施形態によるシステム制御プ
ロセッサ決定条件表を示す図である。
【図11】図3中の通知受付部の動作フローチャートで
ある。
【図12】図3中の故障プロセッサデータアクセス部の
動作フローチャートである。
【図13】図3中のシステム再開制御部の動作フローチ
ャートである。
【図14】図3中のシステム制御プロセッサ分析部の動
作フローチャートである。
【図15】図3中のシステム再開起動分析部の動作フロ
ーチャートである。
【図16】本発明の第2実施形態によるシステム再開の
移行条件を示す図である。
【図17】本発明の第2実施形態によるシステム再開エ
スカレート条件表を示す図である。
【図18】本発明の第2実施形態によるシステム制御プ
ロセッサ決定条件表を示す図である。
【図19】図3中の条件表変更制御部58#iの動作フ
ローチャートである。
【符号の説明】
2#i(i=0〜n) プロセッサシステム 3#i(i=0〜n) プロセッサ 4 プロセッサ接続機構 6#i(i=0〜n) 第1記憶手段 8#i(i=0〜n) 第1通知受付手段 10#i(i=0〜n) 第2通知受付手段 12#i(i=0〜n) 通知手段 14#i(i=0〜n) システム制御プロセッサ分析
手段 16#i(i=0〜n) システム再開制御手段

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 それぞれプロセッサ番号が一意的に付与
    されたプロセッサを含む複数のプロセッサシステムがプ
    ロセッサ接続機構により互いに接続されたマルチプロセ
    ッサシステムであって、 前記各プロセッサシステムは、 前記プロセッサの中で故障プロセッサ番号を記憶する第
    1記憶手段と、 前記プロセッサ接続機構を通して、他プロセッサの故障
    プロセッサ番号の第1通知を受付けて、該故障プロセッ
    サ番号を前記第1記憶手段にライトする第1通知受付手
    段と、 前記プロセッサ接続機構を通して、他プロセッサシステ
    ムから初期設定の第2通知を受付けて、自プロセッサの
    初期設定をする第2通知受付手段と、 前記プロセッサ接続機構を通して、全ての他プロセッサ
    システムに初期設定の第3通知をする通知手段と、 前記第1記憶手段に記憶された故障プロセッサ番号に基
    いて、故障していないプロセッサの中からシステム制御
    プロセッサを決定するシステム制御プロセッサ分析手段
    と、 前記第1記憶手段に記憶された故障プロセッサ番号に基
    いて、システム再開をするか否かを決定してシステム再
    開をするとき、自プロセッサが前記システム制御プロセ
    ッサ分析手段により決定されたシステム制御プロセッサ
    に一致する場合、前記通知手段に前記第3通知を指示す
    ると共に、自プロセッサを初期設定するシステム再開制
    御手段と、 を具備したことを特徴とするマルチプロセッサシステ
    ム。
  2. 【請求項2】 前記各プロセッサシステムは、システム
    制御プロセッサを決定する決定条件を記憶する第2記憶
    手段を更に具備し、前記システム制御プロセッサ分析手
    段は、前記第1記憶手段に記憶された故障プロセッサ番
    号及び前記第2記憶手段に記憶された決定条件に基いて
    前記システム制御プロセッサを決定することを特徴とす
    る請求項1記載のマルチプロセッサシステム。
  3. 【請求項3】 前記各プロセッサシステムは、システム
    再開へのエスカレート条件を記憶する第3記憶手段を更
    に具備し、前記システム再開制御手段は、前記第1記憶
    手段に記憶された故障プロセッサ番号及び前記第3記憶
    手段に記憶されたエスカレート条件に基いてシステム再
    開をするか否かを決定する請求項1記載のマルチプロセ
    ッサシステム。
  4. 【請求項4】 前記決定条件をシステム運用中に変更す
    る第1条件変更手段を更に具備した請求項2記載のマル
    チプロセッサシステム。
  5. 【請求項5】 前記エスカレート条件をシステム運用中
    に変更する第2変更手段手段を更に具備した請求項3記
    載のマルチプロセッサシステム。
  6. 【請求項6】 前記決定条件は、前記第1記憶手段に記
    憶された故障プロセッサ番号を除くプロセッサ番号の中
    で番号の最も小さいプロセッサがシステム制御プロセッ
    サになる条件である請求項2記載のマルチプロセッサシ
    ステム。
  7. 【請求項7】 前記決定条件は、前記第1記憶手段に記
    憶された故障プロセッサ番号を除くプロセッサ番号の中
    で番号の最も大きなプロセッサがシステム制御プロセッ
    サになる条件である請求項2記載のマルチプロセッサシ
    ステム。
  8. 【請求項8】 前記決定条件は、前記第1記憶手段に記
    憶された故障プロセッサ番号の次番号のプロセッサがシ
    ステム制御プロセッサになる条件である請求項2記載の
    マルチプロセッサシステム。
  9. 【請求項9】 前記エスカレート条件は、プロセッサ故
    障がn(n≧1)台以上でシステム再開される条件であ
    ることを特徴とする請求項3記載のマルチプロセッサシ
    ステム。
JP18166899A 1999-06-28 1999-06-28 マルチプロセッサシステム Expired - Fee Related JP3710649B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP18166899A JP3710649B2 (ja) 1999-06-28 1999-06-28 マルチプロセッサシステム
US09/476,733 US6557099B1 (en) 1999-06-28 1999-12-30 Multiprocessor system for distributively determining the identity of a new control processor based upon the identity of the failing processor(s) stored therein

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP18166899A JP3710649B2 (ja) 1999-06-28 1999-06-28 マルチプロセッサシステム

Publications (2)

Publication Number Publication Date
JP2001014290A true JP2001014290A (ja) 2001-01-19
JP3710649B2 JP3710649B2 (ja) 2005-10-26

Family

ID=16104787

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18166899A Expired - Fee Related JP3710649B2 (ja) 1999-06-28 1999-06-28 マルチプロセッサシステム

Country Status (2)

Country Link
US (1) US6557099B1 (ja)
JP (1) JP3710649B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104412385A (zh) * 2013-07-04 2015-03-11 株式会社东芝 电子装置
JP7380403B2 (ja) 2020-04-27 2023-11-15 富士通株式会社 情報処理装置及び連携方法

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2001077844A1 (ja) * 2000-04-10 2004-04-30 富士通株式会社 情報処理システム及び方法並びにサーバ
US6839866B2 (en) * 2001-05-31 2005-01-04 Sycamore Networks, Inc. System and method for the use of reset logic in high availability systems
US20040030881A1 (en) * 2002-08-08 2004-02-12 International Business Machines Corp. Method, system, and computer program product for improved reboot capability
US7502957B2 (en) * 2005-09-09 2009-03-10 International Business Machines Corporation Method and system to execute recovery in non-homogeneous multi processor environments
JP2013225208A (ja) * 2012-04-20 2013-10-31 Toyota Motor Corp 情報処理装置、情報処理方法、及びプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0391841A (ja) * 1989-09-05 1991-04-17 Fujitsu Ltd 異常回復処理方式
JPH05216855A (ja) * 1992-02-04 1993-08-27 Fujitsu Ltd マルチcpu制御方式
JPH07219913A (ja) * 1994-01-28 1995-08-18 Fujitsu Ltd マルチプロセッサシステムの制御方法及び装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5640935A (en) 1979-09-11 1981-04-17 Fujitsu Ltd Initial set processing system for multiprocessor system
JPS5962967A (ja) 1982-10-01 1984-04-10 Hitachi Ltd マルチ計算機システムにおけるコントロ−ルステ−シヨン構成制御方式
US5919266A (en) * 1993-04-02 1999-07-06 Centigram Communications Corporation Apparatus and method for fault tolerant operation of a multiprocessor data processing system
KR100391727B1 (ko) * 1994-11-09 2003-11-01 소니 일렉트로닉스 인코포레이티드 메모리시스템및메모리억세싱방법
US6079033A (en) * 1997-12-11 2000-06-20 Intel Corporation Self-monitoring distributed hardware systems
US6178445B1 (en) * 1998-03-31 2001-01-23 International Business Machines Corporation System and method for determining which processor is the master processor in a symmetric multi-processor environment
US6360333B1 (en) * 1998-11-19 2002-03-19 Compaq Computer Corporation Method and apparatus for determining a processor failure in a multiprocessor computer

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0391841A (ja) * 1989-09-05 1991-04-17 Fujitsu Ltd 異常回復処理方式
JPH05216855A (ja) * 1992-02-04 1993-08-27 Fujitsu Ltd マルチcpu制御方式
JPH07219913A (ja) * 1994-01-28 1995-08-18 Fujitsu Ltd マルチプロセッサシステムの制御方法及び装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104412385A (zh) * 2013-07-04 2015-03-11 株式会社东芝 电子装置
JP7380403B2 (ja) 2020-04-27 2023-11-15 富士通株式会社 情報処理装置及び連携方法

Also Published As

Publication number Publication date
JP3710649B2 (ja) 2005-10-26
US6557099B1 (en) 2003-04-29

Similar Documents

Publication Publication Date Title
US6684396B1 (en) Method for upgrading running software processes without compromising fault-tolerance
EP0687975B1 (en) Method and system for downloading data to network nodes
EP0185704A1 (en) CONFIGURABLE DUAL PROCESSING SYSTEM AND METHOD FOR ITS OPERATION.
US20050193228A1 (en) Redundant path control apparatus and redundant path control method
US7089413B2 (en) Dynamic computer system reset architecture
JP4491482B2 (ja) 障害回復方法、計算機、クラスタシステム、管理計算機及び障害回復プログラム
JP3737810B2 (ja) 計算機システム及び故障計算機代替制御プログラム
EP1943593B1 (en) Methods and apparatus for automatically multi-booting a computer system
JP2001014290A (ja) マルチプロセッサシステム
JP5285045B2 (ja) 仮想環境における故障復旧方法及びサーバ及びプログラム
JPH11259326A (ja) ホットスタンバイシステムおよびホットスタンバイシステムにおける自動再実行方法およびその記録媒体
US5583986A (en) Apparatus for and method of duplex operation and management for signalling message exchange no. 1 system
CN108984602B (zh) 一种数据库控制方法和数据库系统
JPH117382A (ja) ファームウェアのバージョンアップ方法
JP2001290758A (ja) コンピュータシステム
JP3203935B2 (ja) ホットスタンバイシステム切り替えシステム
JP3394189B2 (ja) 任意プロセッサのプログラム・データ無中断更新システム
JPH05314075A (ja) オンラインコンピュータ装置
JPH10116261A (ja) 並列計算機システムのチェックポイントリスタート方法
JP4363739B2 (ja) 伝送装置
JPH09288590A (ja) 仮想計算機システム
JP2005157462A (ja) 系切り替え方法及び情報処理システム
WO2022044270A1 (ja) 更新装置、更新方法、および、プログラム
JP2003223338A (ja) 二重化システム
JP2795246B2 (ja) メモリ二重化システムにおける割り込み処理時の障害リカバリ装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040628

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040907

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041102

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050809

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050810

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090819

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090819

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100819

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110819

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120819

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120819

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130819

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees