JPH086909A - 並列計算機システム - Google Patents

並列計算機システム

Info

Publication number
JPH086909A
JPH086909A JP6139867A JP13986794A JPH086909A JP H086909 A JPH086909 A JP H086909A JP 6139867 A JP6139867 A JP 6139867A JP 13986794 A JP13986794 A JP 13986794A JP H086909 A JPH086909 A JP H086909A
Authority
JP
Japan
Prior art keywords
log data
processor
circuit
diagnostic path
error reporting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6139867A
Other languages
English (en)
Inventor
Katsuo Yoshida
勝男 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP6139867A priority Critical patent/JPH086909A/ja
Publication of JPH086909A publication Critical patent/JPH086909A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】 【目的】並列計算機において、複数のスレーブプロセッ
サ中、障害を発生したスレーブプロセッサのログデータ
をマスタプロセッサに一括収集する。 【構成】スレーブプロセッサにはログデータ採取手段と
記憶回路とエラー報告回路と診断パス制御回路を、サー
ビスプロセッサにはノード選択手段、ログデータ収集手
段、エラー報告手段、診断パス制御回路を、マスタプロ
セッサには割込み解析手段、ログデータ受取り手段、ロ
グデータ書込み手段、診断パス制御回路を具備し、夫々
の診断パス制御回路を診断パスにて接続する。 【効果】障害を発生したスレーブプロセッサはログデー
タ採取手段により、自プロセッサ内にログデータを格納
し、エラー報告回路に値を設定するだけでよく、かつロ
グデータ転送は正常に動作しているマスタプロセッサ、
サービスプロセッサにより実行されるので、重度又は致
命的なハードウェア、ソフトウェア障害でもログデータ
を確実にマスタプロセッサへロギングできる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は並列計算機システムに関
し、特に、ログファイルを特定プロセッサにのみ備え、
ログファイルを備えない複数のプロセッサのログデータ
を特定プロセッサのログファイルに一括管理するのに適
した並列計算機システムに関する。
【0002】
【従来の技術】複数プロセッサの障害ロギング方式は公
知例特開平5−54010号公報で記述の様に、障害プ
ロセッサから特定プロセッサへログデータ転送を行って
いる。
【0003】
【発明が解決しようとする課題】上記従来技術において
は、障害プロセッサのハードウェア及びソフトウェアの
正常性が保証されないと障害プロセッサから特定プロセ
ッサへのログデータ転送が出来なかった。
【0004】本発明の目的は、障害プロセッサがログデ
ータ転送に係わることなく、前記ログデータを特定プロ
セッサへ確実に転送することを実現することにある。
【0005】
【課題を解決するための手段】診断パスにより1台のサ
ービスプロセッサが複数のプロセッサを制御する並列計
算機システムにおいて、各プロセッサ毎プロセッサ内の
障害を検知し、ログデータを採取するログデータ採取手
段と、ログデータ採取手段により採取したログデータを
格納する記憶回路と、エラー内容(障害発生)を報告す
るエラー回復回路とを設け、又、各プロセッサ毎、及び
サービスプロセッサにサービスプロセッサと各プロセッ
サ間の診断パスを制御する診断パス制御回路を設け、サ
ービスプロセッサに、各プロセッサからの要求を特定し
てプロセッサを選択し、診断パスの選択路を決めるノー
ド選択手段と、選択したプロセッサのエラー報告回路の
内容を診断パスを介して読出し、エラー報告回路の設定
値に従いマスタプロセッサへ診断パスを介して外部割込
みを起すエラー報告手段と、障害プロセッサの記憶回路
から診断パスを介してログデータを読出し、マスタプロ
セッサのログデータ受取り手段へログデータを転送する
ログデータ収集手段とを設け、マスタプロセッサにサー
ビスプロセッサからの外部割込みに従い、エラー処理を
開始する割込み解析手段と、サービスプロセッサのログ
データ収集手段にアクセスし、障害プロセッサのログデ
ータを受取るログデータ受取り手段と、ログデータ受取
り手段からのログデータをログファイルに格納するログ
データ書込み手段とを設けることにより達成される。
【0006】
【作用】あるプロセッサで障害が発生すると、ログデー
タ採取手段が起動され、ログデータ採取手段はログデー
タを記憶回路に格納し、エラー報告回路に所定の値をセ
ットする。エラー報告回路に有効な値が設定されると、
エラー発生をサービスプロセッサに報告される。
【0007】サービスプロセッサはノード選択手段によ
り障害プロセッサのノード番号を求める。ノード選択手
段はエラー報告手段を起動し、エラー報告手段は障害プ
ロセッサのエラー報告回路の値を読出す。次に、エラー
報告手段はマスタプロセッサの割込み解析手段に外部割
込みを発生させる。マスタプロセッサの割込み解析手段
は障害プロセッサの障害情報を収集するため、ログデー
タ受取り手段を起動する。
【0008】ログデータ受取り手段はサービスプロセッ
サに起動をかけ、ログデータ収集手段は障害プロセッサ
の記憶回路からログデータを読出し、ログデータ受取り
手段に転送する。ログデータ受取り手段はログデータ書
込み手段を起動し、障害プロセッサのログデータをログ
ファイルへ書込む。
【0009】
【実施例】以下、本発明の実施例を図1により説明す
る。
【0010】図1は本発明の実施例を示すブロック図で
ある。
【0011】並列計算機システムはマスタプロセッサ1
台と、スレーブプロセッサA‥‥Nのn台とサービスプ
ロセッサ1台を具備する。
【0012】マスタプロセッサ、スレーブプロセッサA
〜N、サービスプロセッサ内に夫々診断パス制御回路6
を有し、診断パス9を介して接続されている。
【0013】スレーブプロセッサA〜Nは、夫々ログデ
ータ採取手段1を有し、記憶回路8とエラー報告回路7
に接続し、記憶回路8とエラー報告回路7は診断パス制
御回路6に接続している。
【0014】マスタープロセッサは前記のスレーブプロ
セッサで具備した手段、回路の他に診断パス制御回路6
に接続する割込み解析手段2とログデータ受取り手段3
がある。また、割込み解析手段2はログデータ受取り手
段3に、ログデータ受取り手段3はログデータ書込み手
段4に、ログデータ書込み手段4はログファイル5に接
続している。
【0015】サービスプロセッサは診断パス制御回路6
にノード選択手段11とログデータ収集手段12とエラ
ー報告手段13に接続する。また、ノード選択手段11
はログデータ収集手段12とエラー報告手段13に接続
している。
【0016】以下にスレーブプロセッサAにて障害が発
生したということで動作説明を行う。
【0017】但し、ログデータ採取手段1、記憶回路
8、エラー報告回路7、および、診断パス制御回路以外
の部分で、スレーブプロセッサAに障害が発生したもの
とする。ここで、スレーブプロセッサのログデータ採取
手段1、記憶回路8、エラー報告回路7、および、診断
パス制御回路は、スレーブプロセッサの他の部分に障害
が発生しても動作できる。
【0018】スレーブプロセッサAにて障害が発生する
と、スレーブプロセッサ内のログデータ採取手段1によ
り障害処理が実行され、ログデータが記憶回路8に格納
され、かつエラー報告回路7にエラー発生を示す値をセ
ットする。エラー報告回路7に値が設定されたことで、
診断パス制御回路6は診断パス9上で要求信号をオンに
する。該要求信号は、サービスプロセッサ10の診断パ
ス制御回路6で検出する。サービスプロセッサ10の診
断パス制御回路6はノード選択手段11を起動する。ノ
ード選択手段11は、サービスプロセッサ10とスレー
ブプロセッサAの診断パス制御回路6を駆動して、スレ
ーブプロセッサAからエラー報告回路7の値を診断パス
9経由で読出す。
【0019】ノード選択手段11はエラー報告手段13
を起動する。
【0020】エラー報告手段13はサービスプロセッサ
10とマスタプロセッサの診断制御回路6を駆動してマ
スタプロセッサの割込み解析手段2に起動をかける。
【0021】割込み解析手段2はログデータ受取り手段
3にスレーブプロセッサAのログデータ読出し指令を出
す。ログデータ受取り手段3はマスタプロセッサとサー
ビスプロセッサ10の診断パス制御回路6を駆動して、
ログデータ読出し指令をログデータ収集手段12に起動
をかける。
【0022】ログデータ収集手段12はサービスプロセ
ッサ10とスレーブプロセッサAの診断パス制御回路6
を駆動して、スレーブプロセッサAの記憶回路8上のロ
グデータを読出し、その後、サービスプロセッサ10と
マスタプロセッサの診断パス制御回路6を駆動して、ロ
グデータ受取り手段3にログデータを転送する。ログデ
ータを受けたログデータ受取り手段3はログデータ書込
み手段4を起動し、ログデータ書込み手段4によりログ
ファイル5に障害を発生したスレーブプロセッサAのロ
グデータを格納する。
【0023】
【発明の効果】以上、説明したように本発明では、障害
を発生したスレーブプロセッサのログデータは、スレー
ブプロセッサがログデータ転送に関与することなく、マ
スタプロセッサ、サービスプロセッサの制御によりログ
データ転送が可能となる。従って、重度又は致命的なハ
ードウェア、ソフトウェア障害でもログデータが確実に
マスタプロセッサへ収集することが出来る。
【図面の簡単な説明】
【図1】本発明の実施例を示すブロック図である。
【符号の説明】
1…ログデータ採取手段、 2…割込み解析手段、 3…ログデータ受取り手段、 4…ログデータ書込み手段、 5…ログファイル、 6…診断パス制御回路、 7…エラー報告回路、 8…記憶回路、 9…診断パス、 10…サービスプロセッサ、 11…ノード選択手段、 12…ログデータ収集手段、 13…エラー報告手段。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】診断パスにより1台のサービスプロセッサ
    が複数のプロセッサを制御する並列計算機システムにお
    いて、複数のプロセッサ各々には自プロセッサで障害が
    発生した場合にログデータを採取するログデータ採取手
    段とログデータ採取手段により採取したログデータを格
    納する記憶回路と障害発生を報告するエラー報告回路と
    診断パスを制御する診断パス制御回路とを有し、かつ特
    定プロセッサには障害報告を受け付ける割込み解析手段
    とサービスプロセッサからログデータを読出すログデー
    タ受取り手段とログデータ受取り手段からのログデータ
    をログファイルに格納するログデータ書込み手段とを有
    し、サービスプロセッサには診断パスを制御する診断パ
    ス制御回路と診断パスを介して要求のあったプロセッサ
    を選択するノード選択手段と選択したプロセッサのログ
    データを収集するログデータ収集手段とプロセッサから
    の要求をマスタプロセッサへ報告するエラー報告手段と
    を備えることを特徴とする並列計算機システム。
JP6139867A 1994-06-22 1994-06-22 並列計算機システム Pending JPH086909A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6139867A JPH086909A (ja) 1994-06-22 1994-06-22 並列計算機システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6139867A JPH086909A (ja) 1994-06-22 1994-06-22 並列計算機システム

Publications (1)

Publication Number Publication Date
JPH086909A true JPH086909A (ja) 1996-01-12

Family

ID=15255406

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6139867A Pending JPH086909A (ja) 1994-06-22 1994-06-22 並列計算機システム

Country Status (1)

Country Link
JP (1) JPH086909A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7430687B2 (en) 2003-12-09 2008-09-30 Nec Corporation Building-up of multi-processor of computer nodes

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7430687B2 (en) 2003-12-09 2008-09-30 Nec Corporation Building-up of multi-processor of computer nodes

Similar Documents

Publication Publication Date Title
JP4107083B2 (ja) 高可用ディスク制御装置とその障害処理方法及び高可用ディスクサブシステム
US7571356B2 (en) Storage control device, and error information management method for storage control device
JPH07117903B2 (ja) 障害回復方法
JPH02297228A (ja) 障害情報格納方式
JP3481737B2 (ja) ダンプ採取装置およびダンプ採取方法
JPS6363933B2 (ja)
JPH086909A (ja) 並列計算機システム
JPH1027115A (ja) コンピュータシステムの障害情報採取回路
JPH0255816B2 (ja)
JP3275492B2 (ja) 連動型ディスク装置
KR100604552B1 (ko) 클러스터 시스템에서 상태 정보 및 제어 명령의 공유를통한 시스템 장애 대응방법
JPH11119992A (ja) ファームウェアのトレース制御装置
JPS6259816B2 (ja)
JPH079636B2 (ja) バス診断装置
JP2510663B2 (ja) エラ―制御方式
JPS59132054A (ja) 障害内容通知方式
JPS6349805B2 (ja)
JP2002215471A (ja) メモリポート、記憶装置、情報処理システム
JPH05342076A (ja) 二重書構成のファイル装置
JPS59221723A (ja) 入出力制御装置の初期化終了報告方式
JPH0118460B2 (ja)
JPS63195725A (ja) フアイル処理装置
JPH1091543A (ja) 障害情報記録方法及び情報処理装置
JP2000112907A (ja) マルチプロセッサ装置および動作記録方法
JPH04253249A (ja) データ転送装置