JPH09288603A - マルチプロセッサシステムの障害情報記録方式 - Google Patents

マルチプロセッサシステムの障害情報記録方式

Info

Publication number
JPH09288603A
JPH09288603A JP8102332A JP10233296A JPH09288603A JP H09288603 A JPH09288603 A JP H09288603A JP 8102332 A JP8102332 A JP 8102332A JP 10233296 A JP10233296 A JP 10233296A JP H09288603 A JPH09288603 A JP H09288603A
Authority
JP
Japan
Prior art keywords
fault information
individual
information
processor
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8102332A
Other languages
English (en)
Other versions
JP2821418B2 (ja
Inventor
Takahiro Kageyama
孝裕 影山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HOKKAIDO NIPPON DENKI SOFTWARE KK
NEC Solution Innovators Ltd
Original Assignee
HOKKAIDO NIPPON DENKI SOFTWARE KK
NEC Software Hokkaido Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HOKKAIDO NIPPON DENKI SOFTWARE KK, NEC Software Hokkaido Ltd filed Critical HOKKAIDO NIPPON DENKI SOFTWARE KK
Priority to JP8102332A priority Critical patent/JP2821418B2/ja
Publication of JPH09288603A publication Critical patent/JPH09288603A/ja
Application granted granted Critical
Publication of JP2821418B2 publication Critical patent/JP2821418B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】 【課題】外部バスの障害時においても、プロセッサが障
害を検出したときにはその障害データを収集保存でき保
守業務を格段に効率化する。 【解決手段】プロセッサパッケージ50−kはそれぞれ
1個のプロセッサ51−kと制御ルーチンを格納する不
揮発性メモリ52−kとを有し、障害時に個別障害情報
をプロセッサ51−kが収集して不揮発性メモリ52−
kに格納し立上げ時に障害情報整理ルーチン31により
個別障害情報を時系列的に格納する不揮発性のバックア
ップメモリ40に格納されている個別障害情報より新ら
しい個別障害情報を選択して前記バックアップメモリに
格納する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は障害情報記録方式、
特にマルチプロセッサ方式における障害情報記録方式に
関する。
【0002】
【従来の技術】従来、データ処理装置においては、後の
保守に役立たせるため、装置上で何らかの障害が発生し
た場合にはその障害にかかる各種のデータを採取して保
存しておく機構が設けられている。
【0003】そして、採取された障害データをI/O制
御アダプタ等を介して接続した磁気デイスク等の外部記
憶装置上にフアイルを設けこれに出力して保存する構成
となっていた。
【0004】しかし、このI/O装置系にハードウエア
障害等が発生した場合には障害データの保存が全くでき
ないという欠点があった。
【0005】この欠点を解消すべくバックアップメモリ
を設ける技術が特開平3−244047号公報等に開示
されている。
【0006】これは、図4に示すように、CPU110
とメインメモリ120とを含むとともに、バス140に
よりI/O制御アダプタ300を介して外部記憶装置4
00が接続された構成を有するデータ処理装置100に
おいて、CPU110から直接バス140を介してアク
セス可能なバックアップメモリ130とメインメモリ1
20上にバックアップメモリの読み込み書き込みルーチ
ン121とを備え、CPU110により採取された障害
データをバックアップメモリの読み込み書き込みルーチ
ン121のCPU110による実行によりバックアップ
メモリ130に書き込み、I/O装置系にハードウエア
障害等が発生した場合に備えている。
【0007】
【発明が解決しようとする課題】上述した従来の障害情
報記録方式は、いずれもバスに接続されたバックアップ
メモリに情報を記録させており、そのため、例えば障害
によりバスが正常に機能しない状況では、情報の記録は
保証されず、また記録されたとしても、データ化け等に
より記録された情報が不正となるという問題があった。
【0008】特にマルチプロセッサシステムにおいて
は、主記憶およびバックアップメモリは共有となり、外
部バスによりそれぞれ各プロセッサと接続されることは
必然であり、上記欠点は障害データ収集にとり致命的と
なる。
【0009】本発明の目的は、マルチプロセッサシステ
ムにおいて、外部バスの障害時においても、プロセッサ
が障害を検出したときにはその障害データを収集保存で
き保守業務を格段に効率化できる障害情報記録方式を提
供することにある。
【0010】
【課題を解決するための手段】第1の発明のマルチプロ
セッサシステムの障害情報記録方式は、それぞれが1個
のプロセッサと障害時に前記プロセッサが検出した障害
の障害情報である個別障害情報を前記プロセッサに収集
させる個別障害情報収集制御ルーチンと収集した前記個
別障害情報とを格納する不揮発性の個別障害情報格納手
段とを収容する複数のプロセッサパッケージと、前記個
別障害情報を時系列的に格納する不揮発性のバックアッ
プメモリと、前記個別障害情報発生手段に格納されてい
る個別障害情報から前記バックアップメモリに格納され
ている個別障害情報より新らしい個別障害情報を選択し
て前記バックアップメモリに格納する個別障害情報整理
ルーチンを格納する主記憶と、複数の前記プロセッサパ
ッケージのそれぞれと前記バックアップメモリと前記主
記憶とを接続する外部バスとを含んで構成されている。
【0011】第2の発明のマルチプロセッサシステムの
障害情報記録方式は、第1の発明のマルチプロセッサシ
ステムの障害情報記録方式において、個別障害情報整理
ルーチンは予め指定されたプロセッサによりシステム立
上げ時に実行され各プロセッサパッケージの個別障害情
報を読み出して主記憶に格納しバックアップメモリに格
納されている個別障害情報より新らしい個別障害情報を
選択して前記バックアップメモリに格納することを特徴
としている。
【0012】第3の発明のマルチプロセッサシステムの
障害情報記録方式は、第1の発明のマルチプロセッサシ
ステムの障害情報記録方式において、個別障害情報収集
制御ルーチンは障害時に個別障害情報の収集を行ないシ
ステム立上げ時に対応するプロセッサにより前記収集さ
れた個別障害情報を主記憶に書き込み、個別障害情報整
理ルーチンは予め指定されたプロセッサによりシステム
立上げ時に実行され前記主記憶に書き込まれた個別障害
情報からバックアップメモリに格納されている個別障害
情報より新らしい個別障害情報を選択して前記バックア
ップメモリに格納することを特徴としている。
【0013】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して説明する。
【0014】図1は本発明のマルチプロセッサシステム
の障害情報記録方式の一実施の形態を示すブロック図で
ある。
【0015】本実施の形態のマルチプロセッサシステム
の障害情報記録方式は、図1に示すように、複数のプロ
セッサパッケージ50−1〜50−nと、これらのプロ
セッサパッケージに共有のメインメモリ30と、障害デ
ータ保存用のバックアップメモリ40と、これらプロセ
ッサパッケージ50−1〜50−n、メインメモリ30
およびバックアップメモリ40を接続するバス10とか
ら構成されている。
【0016】プロセッサパッケージ50−1〜50−n
は少なくとも、以下に述べる構成については同一であ
る。プロセッサパッケージ50−1について述べれば、
データ処理を行なうプロセッサ51−1と障害時の障害
データを格納する障害データ領域53−1および障害時
にプロセッサ51−1に障害データを収集させる制御ル
ーチン54−1とを格納する不揮発性メモリ52−1と
を有している。
【0017】バックアップメモリ40は障害情報を時系
列的に格納しているメモリであり、データ保存のため不
揮発性メモリが使用される。
【0018】メインメモリ30はプロセッサパッケージ
50−1〜50−nに共用され、障害データを始めとし
て各種データおよびプログラム等の一時格納に使用され
るとともに、システム立上げ時に障害情報整理ルーチン
31が格納される。
【0019】次に本実施の形態のマルチプロセッサシス
テムの障害情報記録方式の動作について説明する。説明
は図2の流れ図に示す障害発生時の障害情報収集動作
と、図3の流れ図に示すシステム立上げ時の障害情報整
理動作に分けて説明する。
【0020】図1および図2を参照してプロセッサ51
−2が障害を検出した場合についての障害発生時の障害
情報収集動作について説明する。
【0021】プロセッサ51−2が障害を検出すると
(ステップ201)、プロセッサ51−2は不揮発性メ
モリ52−2に格納されている制御ルーチン54−2を
読み出し(ステップ202)、これに基づいて各種障害
データを収集し、収集した日付け、時刻とともに不揮発
性メモリ52−2の障害データ領域53−2に格納する
(ステップ203)。
【0022】この時の動作はプロセッサパッケージ50
−2の内部に閉じているため、障害によるバス10等が
正常に機能しない状態であってもプロセッサ51−2に
より不揮発性メモリ52−2に格納された障害データ領
域53−2の内容は保証されることとなる。
【0023】次に、図1および図3を参照してシステム
立上げ時の障害情報整理動作について説明する。この動
作は例えば予め指定された1つのプロセッサにより行な
われることとする。このプロセッサを例えば、プロセッ
サ51−1として以下説明する。
【0024】プロセッサ51−1はシステム立上げを行
ない(ステップ301)、次いで、障害情報整理ルーチ
ンを外部装置からメインメモリ30に障害情報整理ルー
チン31として格納して後、読み出し(ステップ30
2)、これに基づいて障害情報整理動作を行なう。
【0025】先ず、プロセッサパッケージ50−1〜5
0−nの障害データ領域53−1〜53−nに格納され
ている障害データを順に読み出し、メインメモリ30に
プロセッサパッケージ50−1情報〜50−n情報とし
て格納する(ステップ303、304〜306のN枝の
ループ、306のY枝)。
【0026】次いで、バックアップメモリ40の最新の
障害情報(これを障害情報mとする)の収集日時とメイ
ンメモリ30に格納されているプロセッサパッケージ5
0−1情報〜50−n情報のそれぞれの収集日時とを比
較し(ステップ308)、障害情報mの収集日時よりも
新しい収集日時の50−k情報をバックアップメモリ4
0に新たな障害情報(m+1)として格納する(ステッ
プ309のY枝、ステップ310)。
【0027】以上説明したように、本実施の形態のマル
チプロセッサシステムの障害情報記録方式は、障害情報
収集動作はプロセッサパッケージ内に閉じているため、
バス等の障害に影響されることなく保証された障害情報
が収集でき、これをシステム立上げ後にバックアップメ
モリに整理格納することにより障害解析、障害履歴の確
認ができ保守業務の効率化ができる。
【0028】また、システムに致命的な障害が発生し、
パックアップメモリへのアクセスができなくなった場合
でも最新の障害情報はプロセッサパッケージ内に確保さ
れているので、これを使用することにより障害解析、障
害履歴の確認ができ保守業務の効率化ができる。
【0029】以上の説明ではメインメモリ30へのプロ
セッサパッケージ50−1情報〜50−n情報の格納は
プロセッサパッケージ50−1が行なうとしたが、本発
明はこれに限定されるものではなく、各プロセッサパッ
ケージ内の制御ルーチンによりプロセッサ51−1〜5
1−nがそれぞれ自己の障害データをメインメモリ30
に格納できることは自明である。
【0030】
【発明の効果】以上説明したように、本発明のマルチプ
ロセッサシステムの障害情報記録方式は、障害情報収集
動作はプロセッサパッケージ内に閉じているため、バス
等の障害に影響されることなく保証された障害情報が収
集でき、これをシステム立上げ後にバッグアップメモリ
に整理格納することにより障害解析、障害履歴の確認が
でき保守業務の格段の効率化ができるという効果を有す
る。
【0031】また、システムに致命的な障害が発生し、
パックアップメモリへのアクセスができなくなった場合
でも最新の障害情報はプロセッサパッケージ内に確保さ
れているので、これを使用することにより障害解析、障
害履歴の確認ができ保守業務の格段の効率化ができると
いう効果を有する。
【図面の簡単な説明】
【図1】本発明のマルチプロセッサシステムの障害情報
記録方式の一実施の形態の構成を示すブロック図であ
る。
【図2】本実施の形態のマルチプロセッサシステムの障
害情報記録方式における障害情報収集動作の一例を示す
流れ図である。
【図3】本実施の形態のマルチプロセッサシステムの障
害情報記録方式における障害情報整理動作の一例を示す
流れ図である。
【図4】従来の障害情報記録方式の一例の構成を示すブ
ロック図である。
【符号の説明】
10、140 バス 30、120 メインメモリ 31 障害情報整理ルーチン 40、130 バックアップメモリ 50−1〜50−n プロセッサパッケージ 51−1〜51−n プロセッサ 52−1〜52−n 不揮発性メモリ 53−1〜53−n 障害データ領域 54−1〜54−n 制御ルーチン 100 データ処理装置 110 CPU 121 バックアップメモリの読み込み書き込みルー
チン 122 I/O制御ルーチン 200、300 I/O制御アダプタ 201〜203、301〜312 流れ図のステップ 400 外部記憶装置 410 フアイル 500 I/O装置

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 それぞれが1個のプロセッサと障害時に
    前記プロセッサが検出した障害の障害情報である個別障
    害情報を前記プロセッサに収集させる個別障害情報収集
    制御ルーチンと収集した前記個別障害情報とを格納する
    不揮発性の個別障害情報格納手段とを収容する複数のプ
    ロセッサパッケージと、前記個別障害情報を時系列的に
    格納する不揮発性のバックアップメモリと、前記個別障
    害情報発生手段に格納されている個別障害情報から前記
    バックアップメモリに格納されている個別障害情報より
    新らしい個別障害情報を選択して前記バックアップメモ
    リに格納する個別障害情報整理ルーチンを格納する主記
    憶と、複数の前記プロセッサパッケージのそれぞれと前
    記バックアップメモリと前記主記憶とを接続する外部バ
    スとを含むことを特徴とするマルチプロセッサシステム
    の障害情報記録方式。
  2. 【請求項2】 個別障害情報整理ルーチンは予め指定さ
    れたプロセッサによりシステム立上げ時に実行され各プ
    ロセッサパッケージの個別障害情報を読み出して主記憶
    に格納しバックアップメモリに格納されている個別障害
    情報より新らしい個別障害情報を選択して前記バックア
    ップメモリに格納することを特徴とする請求項1記載の
    マルチプロセッサシステムの障害情報記録方式。
  3. 【請求項3】 個別障害情報収集制御ルーチンは障害時
    に個別障害情報の収集を行ないシステム立上げ時に対応
    するプロセッサにより前記収集された個別障害情報を主
    記憶に書き込み、個別障害情報整理ルーチンは予め指定
    されたプロセッサによりシステム立上げ時に実行され前
    記主記憶に書き込まれた個別障害情報からバックアップ
    メモリに格納されている個別障害情報より新らしい個別
    障害情報を選択して前記バックアップメモリに格納する
    ことを特徴とする請求項1記載のマルチプロセッサシス
    テムの障害情報記録方式。
JP8102332A 1996-04-24 1996-04-24 マルチプロセッサシステムの障害情報記録方式 Expired - Fee Related JP2821418B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8102332A JP2821418B2 (ja) 1996-04-24 1996-04-24 マルチプロセッサシステムの障害情報記録方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8102332A JP2821418B2 (ja) 1996-04-24 1996-04-24 マルチプロセッサシステムの障害情報記録方式

Publications (2)

Publication Number Publication Date
JPH09288603A true JPH09288603A (ja) 1997-11-04
JP2821418B2 JP2821418B2 (ja) 1998-11-05

Family

ID=14324573

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8102332A Expired - Fee Related JP2821418B2 (ja) 1996-04-24 1996-04-24 マルチプロセッサシステムの障害情報記録方式

Country Status (1)

Country Link
JP (1) JP2821418B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6434679B1 (en) 1997-11-27 2002-08-13 Bull, S.A. Architecture for vital data management in a multi-module machine and process for implementing an architecture of this type
WO2013121502A1 (ja) * 2012-02-13 2013-08-22 三菱電機株式会社 プロセッサシステム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6434679B1 (en) 1997-11-27 2002-08-13 Bull, S.A. Architecture for vital data management in a multi-module machine and process for implementing an architecture of this type
WO2013121502A1 (ja) * 2012-02-13 2013-08-22 三菱電機株式会社 プロセッサシステム

Also Published As

Publication number Publication date
JP2821418B2 (ja) 1998-11-05

Similar Documents

Publication Publication Date Title
Li et al. Low-latency, concurrent checkpointing for parallel programs
US7774636B2 (en) Method and system for kernel panic recovery
JPH05197598A (ja) トランザクション処理方法及び装置
JP3481737B2 (ja) ダンプ採取装置およびダンプ採取方法
CN111736969A (zh) 分布式作业调度方法及装置
CN101231604B (zh) 用于集群服务器数据的卷级恢复的设备、系统及方法
JPH06222952A (ja) デバッグ支援装置
US20060168434A1 (en) Method and system of aligning execution point of duplicate copies of a user program by copying memory stores
US5412802A (en) Reasoning method and fault diagnosis method and system implementing the same
JP2007133544A (ja) 障害情報解析方法及びその実施装置
US8972794B2 (en) Method and apparatus for diagnostic recording using transactional memory
JP2821418B2 (ja) マルチプロセッサシステムの障害情報記録方式
US7114097B2 (en) Autonomic method to resume multi-threaded preload imaging process
Chaudhry et al. Getting more from out-of-core columnsort
JP2513060B2 (ja) 故障回復型計算機
JP2868114B2 (ja) 監視診断機能付計算機
JPH0217550A (ja) マルチプロセッサシステムの障害処理方式
JP3189804B2 (ja) データバックアップ方法および装置
JPH11134208A (ja) 計算機システム、計算機システムの障害情報収集方法、及び記録媒体
JP3822449B2 (ja) スタック保存方法、スタック保存プログラム及び高信頼計算機システム
JPS6383843A (ja) トレ−ス情報の収集方式
JP2631185B2 (ja) データベースバックアップ方法
CN115016993A (zh) 适用于异构冗余的错误清洗方法、装置和计算机设备
JPS63262737A (ja) デ−タベ−ス更新記録処理方法
JP3464768B2 (ja) ファイルロードを有するプロセッサ装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19980728

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070828

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080828

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080828

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090828

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090828

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100828

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110828

Year of fee payment: 13

LAPS Cancellation because of no payment of annual fees