JP2578908B2 - Restart method - Google Patents

Restart method

Info

Publication number
JP2578908B2
JP2578908B2 JP63119709A JP11970988A JP2578908B2 JP 2578908 B2 JP2578908 B2 JP 2578908B2 JP 63119709 A JP63119709 A JP 63119709A JP 11970988 A JP11970988 A JP 11970988A JP 2578908 B2 JP2578908 B2 JP 2578908B2
Authority
JP
Japan
Prior art keywords
processing system
information processing
restart
area
monitoring device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63119709A
Other languages
Japanese (ja)
Other versions
JPH01290059A (en
Inventor
徳行 岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP63119709A priority Critical patent/JP2578908B2/en
Publication of JPH01290059A publication Critical patent/JPH01290059A/en
Application granted granted Critical
Publication of JP2578908B2 publication Critical patent/JP2578908B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔概要〕 情報処理システムを監視する監視装置などの再立ち上
げを行う再立ち上げ方式に関し、 情報処理システム監視装置中に2つのプロセッサを少
なくとも設け、これらのプロセッサが相互に監視してい
ずれかに異常が発生した場合に他のプロセッサが再立ち
上げし、情報処理システム監視装置および情報処理シス
テムの稼動の続行を維持することを目的とし、 情報処理システムを監視する複数のプロセッサからな
る情報処理システム監視装置と、これら複数のプロセッ
サが共にアクセスし得る共有メモリ中に、自プロセッサ
の再立ち上げ、上記情報処理システム監視装置全体の再
立ち上げなどの再立ち上げ情報を格納する領域とを備
え、上記情報処理システム監視装置を構成するいずれか
のプロセッサに障害が発生した場合、自プロセッサの再
立ち上げなどを指示する情報を上記領域に格納した後、
他のプロセッサに通知し、この通知を受けた他のプロセ
ッサがこの領域に格納されている再立ち上げ情報に対応
する再立ち上げ処理を行うように構成する。
DETAILED DESCRIPTION OF THE INVENTION [Overview] Regarding a restarting method for restarting a monitoring device or the like for monitoring an information processing system, at least two processors are provided in the information processing system monitoring device, and these processors are connected to each other. In order to maintain the continuation of the operation of the information processing system monitoring device and the information processing system, a plurality of processors monitor the information processing system for the purpose of maintaining the operation of the information processing system monitoring device and the information processing system. An information processing system monitoring device comprising processors and a shared memory that can be accessed by the plurality of processors together with the restart information of the own processor and the entire information processing system monitoring device. Storage area, and a failure occurs in any of the processors constituting the information processing system monitoring apparatus. If it is generated, after storing information instructing restart of its own processor in the above area,
The other processors are notified so that the other processors that have received the notification perform the restart processing corresponding to the restart information stored in this area.

〔産業上の利用分野〕[Industrial applications]

本発明は、情報処理システムを監視する監視装置など
の再立ち上げを行う再立ち上げ方式に関するものであ
る。
The present invention relates to a restart method for restarting a monitoring device or the like that monitors an information processing system.

近年の情報処理システムの高信頼化の要求に伴い、情
報処理システムに多少の障害が発生しても、その運用に
影響を及ぼさないシステムが要求されている。
With the recent demand for higher reliability of information processing systems, there is a demand for a system that does not affect its operation even if some trouble occurs in the information processing system.

このため、情報処理システムを監視し、情報処理シス
テムが異常となったら、再立ち上げを行うような情報処
理システム監視装置を設ける必要がある。
Therefore, it is necessary to provide an information processing system monitoring device that monitors the information processing system and restarts the information processing system when the information processing system becomes abnormal.

〔従来の技術と発明が解決しようとする課題〕[Problems to be solved by conventional technology and invention]

従来の情報処理システム監視装置は、1つの処理部分
(1つのプロセッサ)より成っていたため、情報処理シ
ステムの異常に対しては、当該情報処理システムの再立
ち上げを行うことができる。しかし、情報処理システム
監視装置自体の異常に関しては、再立ち上げなどして復
旧をはかることができないという問題があった。
Since the conventional information processing system monitoring device includes one processing part (one processor), the information processing system can be restarted when the information processing system is abnormal. However, there is a problem that it is not possible to recover the abnormality of the information processing system monitoring apparatus by restarting the apparatus.

本発明は、情報処理システム監視装置中に2つのプロ
セッサを少なくとも設け、これらのプロセッサが相互に
監視していずれかに異常が発生した場合に他のプロセッ
サが再立ち上げし、情報処理システム監視装置および情
報処理システムの稼動の続行を維持することを目的とし
ている。
According to the present invention, at least two processors are provided in an information processing system monitoring apparatus, and these processors monitor each other, and when an abnormality occurs in one of the processors, another processor is restarted. And to maintain the continuation of the operation of the information processing system.

〔課題を解決する手段〕[Means to solve the problem]

第1図を参照して課題を解決する手段を説明する。 Means for solving the problem will be described with reference to FIG.

第1図において、情報処理システム管理装置2は、情
報処理システム1を監視するものであって、MP3、IP4、
共有メモリ5などから構成されている。
In FIG. 1, an information processing system management device 2 monitors the information processing system 1 and includes MP3, IP4,
It comprises a shared memory 5 and the like.

MP(メインプロセッサ)3は、情報処理システム監視
装置2の全体の制御などを行うものである。
The MP (main processor) 3 controls the information processing system monitoring apparatus 2 as a whole.

IP(インタフェースプロセッサ)4は、MP3からの指
示に対応して情報処理システム1のハードウェアに対す
るアクセスなどを行うものである。
The IP (interface processor) 4 accesses the hardware of the information processing system 1 in response to an instruction from the MP3.

共有メモリ5は、MP3およびIP4の両者がアクセスし得
るメモリであって、再立ち上げ情報を格納する領域11な
どを設けるためのものである。
The shared memory 5 is a memory that can be accessed by both the MP3 and the IP4, and is for providing an area 11 for storing restart information and the like.

ROM10、13は、読み出し専用のメモリであって、初期
プログラムを格納するものである。
The ROMs 10 and 13 are read-only memories and store an initial program.

〔作用〕[Action]

本発明は、第1図に示すように、MP3およびIP4の2つ
のプロセッサを用いて情報処理システム監視装置2を構
成し、いずれかのMP3あるいはIP4に異常が発生した場
合、この異常に対応して自プロセッサの再立ち上げ、情
報処理システム監視装置2全体の再立ち上げなどの再立
ち上げ情報を、共有メモリ5中に設けた領域11に書き込
み、通知を受けた他の正常なプロセッサがこの領域11に
書き込まれている再立ち上げ情報に対応した再立ち上げ
処理を行い、異常の発生したプロセッサなどを自動的に
再稼動させるようにしている。
The present invention, as shown in FIG. 1, configures the information processing system monitoring device 2 using two processors, MP3 and IP4, and copes with this abnormality when any of the MP3 or IP4 has an abnormality. The restart information such as the restart of its own processor and the restart of the entire information processing system monitoring device 2 is written in the area 11 provided in the shared memory 5 and the other normal processors notified of this write the restart information. A restart process corresponding to the restart information written in the area 11 is performed, and the processor in which an error has occurred is automatically restarted.

従って、情報処理システム監視装置2を構成するいず
れかのプロセッサに異常が発生しても、他の正常なプロ
セッサによって再立ち上げを行い、情報処理システム監
視装置および情報処理システム自体の稼動の続行を維持
することが可能となる。
Therefore, even if any of the processors constituting the information processing system monitoring apparatus 2 has an abnormality, the other normal processors restart the processing and continue the operation of the information processing system monitoring apparatus and the information processing system itself. It can be maintained.

〔実施例〕〔Example〕

次に、第1図から第3図を用いて本発明の1実施例の
構成および動作を順次詳細に説明する。
Next, the configuration and operation of one embodiment of the present invention will be sequentially described in detail with reference to FIGS.

第1図において、MP(メインプロセッサ)3は、MP制
御部9およびROM(MP初期プログラムなどを格納する読
み出し専用メモリ)10などから構成され、情報処理シス
テム監視装置2の全体の制御、および外部インタフェー
ス8、外部入出力装置7を介してオペレータとの間で会
話などを行うものである。
In FIG. 1, an MP (main processor) 3 includes an MP controller 9 and a ROM (read-only memory for storing an MP initial program) 10 and the like, and controls the entire information processing system monitoring apparatus 2 and externally. A conversation is performed with an operator via the interface 8 and the external input / output device 7.

IP(インタフェースプロセッサ)4は、IP制御部12お
よびROM(IP初期プログラムなどを格納する読み出し専
用メモリ)13などから構成され、MP3からの指示に対応
して、内部アクセスインタフェース6を介して情報処理
システム1内のハードウェア(情報処理システム監視装
置2以外のハードウェア)に対するアクセスなどを行う
ものである。情報処理システム1の全体の初期立ち上げ
は、MP3からの指示に基づいて、IP4が内部アクセスイン
タフェース6を介して行うようにしている。また、障害
発生情報の採取は、IP4が内部アクセスインタフェース
6より検出した情報処理システム1内のハードウェアか
らの割り込みを契機として採取した情報をMP3に渡し、
これをMP3が外部入出力装置7に転送あるいは格納する
ことにより、行うようにしている。
The IP (interface processor) 4 includes an IP control unit 12 and a ROM (read-only memory for storing an IP initial program) 13 and the like, and processes information via the internal access interface 6 in response to an instruction from the MP3. Access to hardware in the system 1 (hardware other than the information processing system monitoring device 2) is performed. Initial startup of the entire information processing system 1 is performed by the IP 4 via the internal access interface 6 based on an instruction from the MP3. Further, the failure occurrence information is collected by passing the information collected by an interrupt from hardware in the information processing system 1 detected by the IP 4 from the internal access interface 6 to the MP3,
This is performed by transferring or storing the MP3 to the external input / output device 7.

共有メモリ5は、領域(MP)および領域(IP)などか
ら構成され、MP3およびIP4が相互に通信するためのもの
である。第2図を用いて後述するような再立ち上げ情報
を領域(MP)および領域(IP)に書き込んだ後、相手の
プロセッサに対して割り込みによってこの再立ち上げ情
報を検知し、該当する処理を依頼するようにしている。
そして、同様にして割り込みによって、処理依頼元に応
答を返すようにしている。
The shared memory 5 includes an area (MP) and an area (IP), and is used for the MP3 and the IP4 to communicate with each other. After the restart information as described later with reference to FIG. 2 is written in the area (MP) and the area (IP), the restart information is detected by an interrupt to the partner processor, and the corresponding processing is performed. I have to ask.
Then, similarly, a response is returned to the processing request source by interruption.

第2図を用いて再立ち上げ情報を説明する。 The restart information will be described with reference to FIG.

第2図(イ)において、領域(MP)は、共有メモリ5
中に設けた領域であって、MP3が再立ち上げ情報を書き
込み、割り込みによってIP4に再立ち上げ依頼、また
は、MP3が自己リセット後、MP3自身が読み取り再立ち上
げ条件を認識するための領域である。この領域(MP)に
は、図示のように、“MP再立ち上げ要か否か”および
“情報処理システム監視装置2の再立ち上げ要か否か”
の情報を格納する。
In FIG. 2A, the area (MP) is the shared memory 5
In the area provided in the MP3, the MP3 writes the restart information, requests the IP4 to restart by an interrupt, or the MP3 reads itself after self-reset and recognizes the restart condition. is there. In this area (MP), as shown in the figure, “whether or not it is necessary to restart the MP” and “whether or not it is necessary to restart the information processing system monitoring device 2”
The information of is stored.

第2図(ロ)において、領域(IP)は、共有メモリ5
中に設けた領域であって、IP4が再立ち上げ情報を書き
込み、割り込みによってMP3に再立ち上げ依頼するため
の領域である。この領域(IP)には、図示のように、
“IP再立ち上げ要か否か”、“情報処理システム監視装
置2の再立ち上げ要か否か”、および“情報処理システ
ム1の全体の再立ち上げ要か否か”の情報を格納する。
In FIG. 2B, the area (IP) is the shared memory 5
This is an area provided therein, where the IP4 writes the restart information and requests the MP3 to restart by an interrupt. In this area (IP), as shown
Information on whether or not it is necessary to restart the IP, whether or not the information processing system monitoring device 2 needs to be restarted, and whether or not it is necessary to restart the information processing system 1 is stored. .

次に、第3図(イ)ないし(ホ)を用いて、第1図構
成の動作を順次詳細に説明する。
Next, the operation of the configuration of FIG. 1 will be sequentially described in detail with reference to FIGS.

第1に、第3図(イ)を用いてMP3が稼動不能になっ
た場合の動作を説明する。
First, the operation when the MP3 becomes inoperable will be described with reference to FIG.

は、MP3が自分自身で異常を検出し、ログ収集す
る。
The MP3 detects abnormalities by itself and collects logs.

は、MP3が領域(MP)のMP異常フラグをオンにす
る。これは、右側に示すように領域(MP)のMP再立ち上
げ要”のフラグ(MP異常フラグ、第2図(イ)参照)を
オンにすることを意味している。
Turns on the MP abnormality flag of the MP3 area (MP). This means that the flag (MP abnormal flag, see FIG. 2A) of the area (MP) needs to be restarted, as shown on the right side.

は、MP3がIP4に対して割り込みを発生させる。そし
て、でMP3が自己ブランチする。
Causes MP3 to interrupt IP4. Then, the MP3 self-branches.

は、でMP3が割り込みを発生させたことに対応し
て、IP4が割り込みを検出する。
In response to the fact that MP3 has generated an interrupt, IP4 detects the interrupt.

は、IP4が領域(MP)をREADし、MP異常を認識す
る。これは、領域(MP)から読み出した内容として、MP
異常フラグ“1"であるので、MP異常であることを認識す
ることを意味している。
The IP4 reads the area (MP) and recognizes the MP abnormality. This is the content read from the area (MP)
Since the abnormality flag is “1”, it means that the MP abnormality is recognized.

は、ROM13内のIP初期プログラムを起動し、MP3のみ
を再立ち上げする。これにより、でMPが立ち上げられ
る。
Starts the IP initial program in the ROM 13 and restarts only the MP3. As a result, the MP is started.

は、MP3が領域(MP)のMP異常フラグをOFFにする
(“0"を格納する)。そして、通常運用に戻る。
Turns off the MP abnormality flag of the area (MP) by MP3 ("0" is stored). Then, the operation returns to the normal operation.

以上のように、MP3自身のみの原因で情報処理システ
ム監視装置2の稼動が停止となる場合、MP3が領域(M
P)内のMP異常フラグをオンにセットしてIP4に割り込み
で通知することにより、正常に稼動しているIP4が指示
されたMP3のみの再立ち上げを行って、MP3を再稼動さ
せ、情報処理システム監視装置2の稼動を続行させるよ
うにしている。
As described above, when the operation of the information processing system monitoring device 2 is stopped due to only the MP3 itself, the MP3 becomes the area (M
By setting the MP error flag in P) to ON and notifying the IP4 by an interrupt, the normally operating IP4 restarts only the specified MP3, restarts the MP3, and outputs the information. The operation of the processing system monitoring device 2 is continued.

第2に、第3図(ロ)を用いてMP3が稼動不能になっ
た場合(IP4からMP3に処理依頼した後、所定時間経過し
て応答がない場合)の動作を説明する。
Second, the operation in the case where the MP3 becomes inoperable (the case where no response is made after a predetermined time has passed after the processing request from the IP4 to the MP3) will be described with reference to FIG.

は、MP3が稼動不能の状態を示す。 Indicates that the MP3 cannot be operated.

は、IP4がMP3にコマンドを送出する。 IP4 sends a command to MP3.

は、MP3からのレスポンスがないので、MP異常を認
識する。これは、IP4がでMP3にコマンドを送出してか
ら、所定時間経過してもレスポンスがなく、タイムオー
バーしたので、MP3を異常と認識することを意味してい
る。
Recognizes an MP error because there is no response from MP3. This means that there is no response even if a predetermined time has elapsed since the IP4 transmitted the command to the MP3, and the time was over, and the MP3 was recognized as abnormal.

は、情報処理システム監視装置2(MP+IP)の再立
ち上げのフラグを領域(IP)に立てる。これは、MP3が
稼動不能と認識されたので、MP3およびIP4の両者を再立
ち上げさせるために、領域(IP)の中央のフラグをオン
(第2図(ロ)中央のフラグをオン)にすることを意味
している。ここで、通常運用しているIP4まで再立ち上
げを行うのは、MP3が稼働不能となった場合、その配下
で稼働しているIP4もシステム全体の整合性を取る上でM
P3と同時に立ち上げし直したものである。
Sets a flag for restarting the information processing system monitoring device 2 (MP + IP) in the area (IP). This means that since the MP3 was recognized as inoperable, the center flag of the area (IP) was turned on (the center flag in FIG. 2 (b) was turned on) to restart both MP3 and IP4. It means to do. Here, restarting up to the normally operating IP4 is necessary if the MP3 becomes inoperable and the IP4 operating under it becomes consistent with the whole system.
It was restarted at the same time as P3.

は、MP3にリセット信号を送出する。 Sends a reset signal to MP3.

は、ROM10内の初期プログラムを起動する。これ
は、のリセット信号の送出に対応して、MP3がROM10に
格納されているMP初期プログラム10を起動することを意
味している。
Starts an initial program in the ROM 10. This means that the MP3 starts the MP initial program 10 stored in the ROM 10 in response to the transmission of the reset signal.

は、MP3がIP4を停止させる。これにより、でIP4
が停止状態となる。
Make mp3 stop IP4. This allows IP4
Is stopped.

は、領域(IP)をREADし、情報処理システム監視装
置2の再立ち上げを認識する。
Reads the area (IP) and recognizes the restart of the information processing system monitoring device 2.

は、MP3を再立ち上げする。 Will restart the MP3.

は、IP4を再立ち上げする。そして、でIP4を起動
する。
Will restart IP4. Then, start IP4.

は、MP3が領域(IP)のフラグを図示のようにオフ
にする。そして、MP3およびIP4が共に通常運用の状態に
なる。
Turns off the flag of the area (IP) as shown in the figure. Then, both the MP3 and the IP4 enter the normal operation state.

以上のように、IP4がMP3にコマンドを送出した後、所
定時間経過してもレスポンスがない場合、MP3を稼動不
能と認識し、IP4が領域(IP)内のフラグ(MP3およびIP
4の再立ち上げを指示するフラグ)をオンにセットおよ
びMP3をリセットすることにより、MP3およびIP4の両者
の再立ち上げを行って再稼動させ、情報処理システム監
視装置2の稼動を続行させるようにしている。
As described above, if there is no response within a predetermined time after IP4 sends a command to MP3, it recognizes that MP3 is inoperable, and IP4 sets the flag (MP3 and IP) in the area (IP).
4), the MP3 and the IP4 are restarted and restarted, and the operation of the information processing system monitoring device 2 is continued. I have to.

第3に、第3図(ハ)を用いてIP4が稼動不能になっ
た場合の動作を説明する。これは、第3図(イ)におけ
るMP3とIP4との動作を逆にしたものに対応するので、簡
単に説明する。
Third, an operation when the IP4 becomes inoperable will be described with reference to FIG. Since this corresponds to the reverse operation of MP3 and IP4 in FIG. 3 (a), it will be briefly described.

は、IP4が自分自身で異常を検出し、ログ収集す
る。
, IP4 detects abnormalities by itself and collects logs.

は、IP4が領域(IP)のIP異常フラグを図示のよう
にオンにする。
Turns on the IP abnormal flag of the area (IP) for IP4 as shown in the figure.

は、IP4がMP3に対して割り込みを発生させる。そし
て、でIP4が自己ブランチする。
Causes IP4 to interrupt MP3. Then, IP4 self-branches.

は、でIP4が割り込みを発生させたことに対応し
て、MP3が割り込みを検出する。
In response, MP3 detects the interrupt in response to IP4 generating the interrupt.

は、MP3が領域(IP)をREADし、IP4のみの再立ち上
げを認識する。
Recognizes that MP3 reads the area (IP) and restarts only IP4.

は、ROM10内のMP初期プログラムを起動し、IP4のみ
を再立ち上げする。これにより、でIP4が立ち上げら
れる。
Starts the MP initial program in ROM 10 and restarts only IP4. This launches IP4.

は、IP4が領域(IP)のIP異常フラグをOFFにする
(“0"を格納する)。そして、通常運用に戻る。
Turns off the IP abnormality flag of the area (IP) of IP4 (stores “0”). Then, the operation returns to the normal operation.

以上のように、IP4自身のみの原因で情報処理システ
ム監視装置2の稼動が停止となる場合、IP4が領域(I
P)内のIP異常フラグをオンにセットすることにより、
正常に稼動しているMP3が指示されたIP4のみの再立ち上
げを行って、IP4を再稼動させ、情報処理システム監視
装置2の稼動を続行させるようにしている。
As described above, when the operation of the information processing system monitoring device 2 is stopped due to only the IP4 itself, the IP4 is assigned to the area (I
By setting the IP abnormal flag in P) to ON,
The normally operating MP3 restarts only the instructed IP4, restarts the IP4, and continues the operation of the information processing system monitoring device 2.

第4に、第3図(ニ)を用いてIP4が稼動不能になっ
た場合(MP3からIP4に処理依頼した後、所定時間経過し
て応答がない場合)の動作を説明する。これは、第3図
(ロ)におけるMP3とIP4とにおける動作を逆にしたもの
に対応するので簡単に説明する。
Fourth, an operation when the IP4 becomes inoperable (when a predetermined time elapses after the processing request from the MP3 to the IP4 and there is no response) will be described with reference to FIG. Since this corresponds to the reverse operation of MP3 and IP4 in FIG. 3B, it will be briefly described.

は、IP4が稼動不能の状態を示す。 Indicates that IP4 is inoperable.

は、MP3がIP4にコマンドを送出する。 Sends an MP3 command to IP4.

は、IP4からのレスポンスがないので、IP異常を認
識する。
Recognizes an IP error because there is no response from IP4.

は、情報処理システム監視装置2(MP+IP)の再立
ち上げのフラグを領域(MP)に図示のように立てる。
Sets a flag for restarting the information processing system monitoring device 2 (MP + IP) in the area (MP) as shown in the figure.

は、MP3が自己リセットする。これは、でIP4が稼
働中に何らかの原因でMP3に通知できないまま停止や動
作不良を起こしていると判明したので、その関連して稼
働しているMP3もシステム全体の整合性を取る上でIP4と
同時に立ち上げし直したものである。
MP3 self-reset. This is because IP4 was found to have stopped or malfunctioned without being able to notify MP3 for some reason while it was running, so the MP3 running in connection with it was also required to maintain consistency of the entire system. At the same time, it was restarted.

は、ROM10内の初期プログラムを起動する。 Starts an initial program in the ROM 10.

は、MP3が領域(MP)をREADし、情報処理システム
監視装置2の再立ち上げを認識する。
The MP3 reads the area (MP) and recognizes that the information processing system monitoring device 2 has restarted.

は、MP3を再立ち上げする。 Will restart the MP3.

は、IP4を再立ち上げする。そして、でIP4を起動
する。
Will restart IP4. Then, start IP4.

は、MP3が領域(MP)のフラグを図示のようにオフ
する。そして、MP3およびIP4が共に通常運用の状態にな
る。
Turns off the flag of the area (MP) as shown in FIG. Then, both the MP3 and the IP4 enter the normal operation state.

以上のように、MP3がIP4にコマンドを送出した後、所
定時間経過してもレスポンスがない場合、IP4を稼動不
能と認識し、MP3が領域(MP)内のフラグ(MPおよびIP4
の再立ち上げを指示するフラグ)をオンにセットおよび
当該MP3自身をリセットすることにより、MP3およびIP4
の両者の再立ち上げを行って再稼動させ、情報処理シス
テム監視装置2の稼動を続行させるようにしている。
As described above, if there is no response after a lapse of a predetermined time after MP3 sends a command to IP4, it recognizes that IP4 is inoperable, and MP3 returns the flag (MP and IP4) in the area (MP).
By setting the flag that instructs restart of the MP3) to ON and resetting the MP3 itself, MP3 and IP4
Are restarted and restarted, and the operation of the information processing system monitoring device 2 is continued.

第5に、第3図(ホ)を用いてIP4が稼動不能になっ
た場合(情報処理システム1内のハードウェアの異常原
因により、IP4が稼動停止となる場合)の動作を説明す
る。
Fifth, the operation when the IP4 becomes inoperable (when the IP4 stops operating due to a hardware abnormality in the information processing system 1) will be described with reference to FIG.

は、IP4が対処不可を認識する。これは、情報処理
システム1内のハードウェアの異常原因に対して、IP4
が対処不可と認識することを意味している。
Recognizes that IP4 cannot cope. This is based on the IP4 for the cause of hardware abnormality in the information processing system 1.
Means that it is impossible to cope.

は、SYSTEM全体の再立ち上げのフラグを領域(IP)
に図示のように立てる。これは、第2図(ロ)のシステ
ム全体の再立ち上げ要のフラグをオン“1"にすることを
意味している。
Area flag for restart of the whole system (IP)
And stand as shown. This means that the flag indicating that the entire system needs to be restarted in FIG. 2 (b) is turned on "1".

は、IP4がMP3に対して割り込みで通知する。 Is notified by IP4 to MP3 by interruption.

は、MP3が割り込みを検出する。 MP3 detects an interrupt.

は、MP3が領域(IP)をREADし、SYSTEM全体の再立
ち上げを認識する。
Recognizes that the MP3 has read the area (IP) and restarted the entire system.

は、ROM10のMP初期プログラムを起動する。 Starts the MP initial program in the ROM 10.

は、MP3がIP4を立ち上げる。これにより、でIP4
が起動される。
MP3 launches IP4. This allows IP4
Is started.

は、MP3がSYSTEM立ち上げコマンドをIP4に送出す
る。
Sends the system startup command to IP4.

は、IP4がハードウェアの立ち上げを認識し、情報
処理システム1のハードウェアをSETUPする。そして、M
P3、IP4および情報処理システム1が通常運用を行う。
Recognizes that the IP4 has started up the hardware, and performs SETUP of the hardware of the information processing system 1. And M
P3, IP4 and the information processing system 1 operate normally.

以上のように、IP4が情報処理システム1のハードウ
ェアからの割り込みによって通知された内容に対して、
対処不可と認識した場合、システム全体の再立ち上げを
指示するフラグをセットしてMP3に割り込みで依頼する
ことにより、MP3、IP4の再立ち上げ、および情報処理シ
ステム1のハードウェアなどのセットアップを行って再
稼動させ、情報処理システム監視装置2および情報処理
システム1の稼動を続行させるようにしている。
As described above, the content of IP4 notified by the interrupt from the hardware of the information processing system 1
If it is determined that the response cannot be performed, a flag for instructing the restart of the entire system is set, and an interrupt is requested to MP3 to restart the MP3 and IP4 and to set up the hardware of the information processing system 1 and the like. The information processing system monitoring apparatus 2 and the information processing system 1 are operated again.

〔発明の効果〕〔The invention's effect〕

以上説明したように、本発明によれば、情報処理シス
テム監視装置2中に2つのプロセッサを少なくとも設
け、これらのプロセッサが相互に監視していずれかに異
常が発生した場合に他のプロセッサが再立ち上げする構
成を採用しているため、情報処理システム監視装置2お
よび情報処理システム1の稼動の続行を信頼性高く維持
することができる。
As described above, according to the present invention, at least two processors are provided in the information processing system monitoring apparatus 2, and these processors monitor each other, and when an abnormality occurs in one of the processors, the other processor is restarted. Since the startup configuration is employed, the continuation of the operations of the information processing system monitoring device 2 and the information processing system 1 can be maintained with high reliability.

【図面の簡単な説明】[Brief description of the drawings]

第1図は本発明の1実施例構成図、第2図は再立ち上げ
情報説明図、第3図は本発明の動作説明図を示す。 図中、1は情報処理システム、2は情報処理システム監
視装置、3はMP(メインプロセッサ)、4はIP(インタ
フェースプロセッサ)、5は共有メモリ、10はMP初期プ
ログラムを格納するROM、13はIP初期プログラムを格納
するROM、領域(MP)および領域(IP)は再立ち上げ情
報を格納する領域を表す。
FIG. 1 is a diagram showing the configuration of an embodiment of the present invention, FIG. 2 is a diagram for explaining restart information, and FIG. 3 is a diagram for explaining the operation of the present invention. In the figure, 1 is an information processing system, 2 is an information processing system monitoring device, 3 is an MP (main processor), 4 is an IP (interface processor), 5 is a shared memory, 10 is a ROM for storing an MP initial program, 13 is The ROM for storing the IP initial program, the area (MP) and the area (IP) represent the area for storing the restart information.

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】情報処理システムを監視する監視装置の再
立ち上げを行う再立ち上げ方式であって、 情報処理システムを監視する複数のプロセッサからなる
情報処理システム監視装置(2)と、 これら複数のプロセッサが共にアクセスし得る共有メモ
リ(5)中に、自プロセッサの再立ち上げ、上記情報処
理システム監視装置(2)の全体の再立ち上げの再立ち
上げ情報を格納する領域(11)とを備え、 上記情報処理システム監視装置(2)を構成するいずれ
かのプロセッサに障害が発生した場合、当該障害発生プ
ロセッサが自プロセッサの再立ち上げを指示する上記立
ち上げ情報を上記領域(11)に格納した後、他のプロセ
ッサに通知し、この通知を受けた他のプロセッサがこの
領域(11)に格納されている再立ち上げ情報に対応する
再立ち上げ処理を行うシステムにおいて、 上記情報処理システム監視装置(2)を構成するいずれ
かのプロセッサに障害が発生して稼働不能となったこと
を稼働中の他のプロセッサが認識した場合、稼働不能を
認識した稼働中の他のプロセッサが情報処理システム監
視装置(2)の全体の再立ち上げを指示する上記再立ち
上げ情報を上記領域(11)に格納した後、リセット処理
を行い、そのリセット処理により各プロセッサが領域
(11)に格納されている再立ち上げ情報に対応する再立
ち上げ処理を行う ように構成したことを特徴とする再立ち上げ方式。
An information processing system monitoring device (2) comprising a plurality of processors for monitoring an information processing system, the information processing system monitoring device comprising a plurality of processors for monitoring the information processing system. An area (11) for storing restart information of the restart of its own processor and the restart of the entire information processing system monitoring device (2) in the shared memory (5) which can be accessed by both processors. If any of the processors constituting the information processing system monitoring device (2) has a fault, the faulty processor instructs the area (11) to restart the own processor. Is stored in the area (11), and the other processor receiving the notification notifies the other processor of the restart corresponding to the restart information stored in this area (11). In a system that performs an interruption process, if another processor in operation recognizes that one of the processors constituting the information processing system monitoring device (2) has failed and has become inoperable, the inoperability is determined. After the recognized other operating processor stores the restart information instructing the restart of the entire information processing system monitoring device (2) in the area (11), a reset process is performed, and the reset process is performed. A restart method in which each processor performs a restart processing corresponding to the restart information stored in the area (11).
JP63119709A 1988-05-17 1988-05-17 Restart method Expired - Lifetime JP2578908B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63119709A JP2578908B2 (en) 1988-05-17 1988-05-17 Restart method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63119709A JP2578908B2 (en) 1988-05-17 1988-05-17 Restart method

Publications (2)

Publication Number Publication Date
JPH01290059A JPH01290059A (en) 1989-11-21
JP2578908B2 true JP2578908B2 (en) 1997-02-05

Family

ID=14768159

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63119709A Expired - Lifetime JP2578908B2 (en) 1988-05-17 1988-05-17 Restart method

Country Status (1)

Country Link
JP (1) JP2578908B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07200091A (en) * 1993-12-29 1995-08-04 Nec Corp Notifying system for automatic restart

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6020779B2 (en) * 1978-07-07 1985-05-23 株式会社東芝 Composite computer system
JPS5822469A (en) * 1981-08-04 1983-02-09 Taisei Corp Central monitoring controller

Also Published As

Publication number Publication date
JPH01290059A (en) 1989-11-21

Similar Documents

Publication Publication Date Title
US4377000A (en) Automatic fault detection and recovery system which provides stability and continuity of operation in an industrial multiprocessor control
JP2006277205A (en) Storage system and its control method and control program
JPH07334382A (en) Multicontroller system
JP2578908B2 (en) Restart method
JPH0534877B2 (en)
JPH0683657A (en) Service processor switching system
JP2998804B2 (en) Multi-microprocessor system
KR19990050460A (en) Disaster Recovery Method and Device of High Availability System
JP3183227B2 (en) Redundant startup method
JPH0424838A (en) Fault control system for multiprocessor
JP3363579B2 (en) Monitoring device and monitoring system
JPH0764930A (en) Mutual monitoring method between cpus
JP2785992B2 (en) Server program management processing method
JPH08287030A (en) Device and method for automatically restarting multiple computer system
JP2710668B2 (en) Computer system
JPS6363935B2 (en)
JPS6242252A (en) Switching system for communication controller
JPH04324569A (en) Multiprocessor system
JPS62212865A (en) Multiprocessor control system
JP3464768B2 (en) Processor device with file load
JPS5870670A (en) Failure information transfer system for exchange of duplex system
JPH0517743U (en) Redundant computer system
JPS62106564A (en) Using/spare processor switching control system for information processing system
KR19990050461A (en) Error Handling in High Availability Systems
JPS6077252A (en) Input/output control device