JPH02226432A - クロック障害処理システム - Google Patents

クロック障害処理システム

Info

Publication number
JPH02226432A
JPH02226432A JP1047540A JP4754089A JPH02226432A JP H02226432 A JPH02226432 A JP H02226432A JP 1047540 A JP1047540 A JP 1047540A JP 4754089 A JP4754089 A JP 4754089A JP H02226432 A JPH02226432 A JP H02226432A
Authority
JP
Japan
Prior art keywords
clock
fault
failure
processing
interrupt
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1047540A
Other languages
English (en)
Inventor
Akihiko Nakamura
昭彦 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Computertechno Ltd
Original Assignee
NEC Computertechno Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Computertechno Ltd filed Critical NEC Computertechno Ltd
Priority to JP1047540A priority Critical patent/JPH02226432A/ja
Priority to EP19900103812 priority patent/EP0385404B1/en
Priority to DE1990627461 priority patent/DE69027461T2/de
Publication of JPH02226432A publication Critical patent/JPH02226432A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0721Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU]
    • G06F11/0724Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU] in a multiprocessor or a multi-core unit

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、情報処理システムにおける障害処理システム
に関し、特に、クロック障害の障害処理システムに関す
るものである。
〔従来の技術〕
従来、情報処理システムのクロック障害はクロック障害
として検知されずに、それに伴う論理部の障害として検
知されていた。したがって、クロック障害発生時にも、
クロック障害の影響を受けて障害が発生した論理部の障
害に対する障害処理が行なわれていた。
〔発明が解決しようとする課題〕
上述した従来のクロック障害処理方式は、クロ)り障害
をそれに伴う論理部の障害として検知し、論理部の障害
に対する障害処理と全く同じ障害処理を行なっているの
で、クロック障害が発生したのか、あるいは論理部の障
害が発生したのか区別が困難であり、また、特にクロッ
ク障害の大半を占める間欠クロック障害の場合には、再
現性がな(、その解析は非常に困難であるため、障害原
因究明に多大な時間を要するという欠点があった。
近年、スーパーコンピュータや汎用大型機は益々大規模
化し、それに伴いクロック回路を構成するハードウェア
量も増大してきているため、クロック障害の発生穎度が
高くなり、クロック障害処理の必要性が高まっている。
〔課題を解決するための手段〕
このような課題を解決するために本発明は、複数の処理
装置と、この処理装置について独立に障害処理を実行可
能な保守診断プロセッサとを含む情報処理システムにお
けるクロック障害処理システムにおいて、情報処理シス
テムで使用する1つ又は複数のクロック信号を発生して
処理装置に分配出力するクロック分配回路と、このクロ
ック分配回路から出力されるクロック信号を監視し、異
常があれば対応する処理装置ごとにエラー信号を発生す
るクロック障害検出回路と、エラー信号を保持するエラ
ー信号保持手段を有し、エラー信号の発生により保守診
断プロセッサに割込みを発生させる割込発生手段とを備
え、割込みにより起動される保守診断プロセッサの割込
処理プログラムの中で、クロック障害が発生した処理装
置を認識し、クロック障害発生事象およびクロック障害
状態をロギングする実行ステップを含む障害処理プログ
ラムの実行の起動を制御するようにしたものである。
〔作用〕
本発明によるクロック障害処理システムにおいては、ク
ロック障害が発生したのか又は論理部障害が発生したの
か判別可能である。
〔実施例〕
第1図は、本発明によるクロック障害処理システムの一
実施例が適用された情報処理システムを示す系統図であ
る。この情報処理システムは、処理装置1〜3と、クロ
ックオシレータ4と、クロック分配回路5と、クロック
障害検出回路61〜63と、割込発生手段としての割込
信号生成回路7と、保守診断プログラム8と、クロック
信号線101〜103,111〜113.121〜12
3.131〜133,171と、信号線141〜143
.151〜154,161とから構成される。
処理装置lは複数の実装単位1−1〜1−nから構成さ
れる。処理装置2,3も処理装置lと同様に複数の実装
単位から構成される。クロックオシレータ4は、クロッ
ク信号線171を介してクロック分配回路5にクロック
信号を供給する。クロック分配回路5は、処理装置1〜
3の各実装単位ごとにクロック信号線111〜113.
121〜123,131〜133を介して独立にクロッ
ク信号を分配する。
クロック障害検出回路61〜63は、クロック分配回路
5から処理装置1〜3の各実装単位に供給されるクロッ
ク信号をクロック信号線101〜103を介して監視し
、異常を検出したならば、信号線141〜143を介し
て割込信号生成回路7に通知する。
割込信号生成回路7は、クロック障害検出回路61〜6
3から異常を通知されたならば、割込信号を生成し、信
号′41A161を介して保守診断プロセッサ8に割込
信号を出力する。また、割込信号生成回路7はエラー信
号保持手段としてのステータスレジスタ71を有し、ス
テータス71には、どのクロック分配系に障害が発生し
たのかを示すデータが保持される。
保守診断プロセッサ8は、処理装置1〜3の保守診断を
行なうプロセッサであり、割込処理制御部81と障害処
理制御部82とを有する。割込処理制御部81は、信号
II 61を介して入力した割込信号がアクティブにな
ると、クロック異常割込みが発生したことを認識し、障
害処理制御部82に通知する。障害処理制御部82は処
理装置1〜3の障害処理制御を行ない、実装単位1−1
〜1−nのデイグレイドおよび処理装置lの本情報処理
システムからの切り離しが可能である。処理装置2,3
に関しても、処理装置1と同様の動作が可能である。ま
た、障害処理制御部82は、信号線154を介してステ
ータスレジスタ71の読出し及び障害情報のロギングも
可能である。
以上の構成から、クロック分配回路5からクロック信号
線111〜113,121〜123,131〜133を
介して処理装置1〜3に供給するクロックに異常が発生
した場合、クロック障害検出回路61〜63がそれを検
出し、信号線141〜143を介して割込信号生成回路
7に通知し、通知を受けた割込信号生成回路7が割込信
号を生成し、信号線161を介して保守診断プロセッサ
8に割込み、保守診断プロセッサ8の割込処理制御部8
1が、ステータスレジスタ71をリードすることにより
クロック障害が発生した処理装置を認識し、障害処理プ
ログラムの起動を障害処理制御部82に指示し、障害処
理制御部82が指示された障害処理プログラムを実行す
ることにより、クロック障害処理を行なうことができる
第2図〜第4図は障害処理プログラムの例を示すフロー
チャートである。
第2図の障害処理プログラム例(障害処理A)は、まず
ステップ90で、クロック障害が発生したことをロギン
グし、次にステップ91でステータスレジスタ71をリ
ードし、クロック障害が発生したクロック分配系を確認
し、ステップ92でステータスレジスタ71の内容をロ
ギングし、最後にステップ93で本情報処理システム全
体の障害処理を行なう。
第3図の障害処理プログラム例(障害処理B)は、同様
に、ステップ90.91.92を実行した後、ステップ
94で、クロック障害が発生した処理装置のみの障害処
理を行なう。
第4図の障害処理プログラム例(障害処理C)は、同様
に、ステップ90,91.92を実行した後、ステップ
95で、クロック障害が発生した処理装置からの前記割
込みを一定時間だけ禁止状態にする。
以上述べたように、本情報処理システムにおいてクロッ
ク障害が発生した場合には、クロック障害が発生したこ
とを正しく認識し、適切な障害処理を行ない、クロック
障害発生事象とその発生個所をロギングすることにより
、障害原因解析の際に有効なデータを提供できることに
なる。
〔発明の効果〕
以上説明したように本発明は、クロック障害検出回路に
よりクロック異常を検出し、障害処理プログラムにより
クロック障害発生事象およびクロック障害発生個所をを
ロギングすることにより、クロック障害が発生したのか
、論理部障害が発生したのかを判別可能とするので、障
害原因究明に要する時間を短縮できる効果がある。
【図面の簡単な説明】
第1図は本発明によるクロック障害処理システムの一実
施例が適用された情報処理システムを示す系統図、第2
図〜第4図は障害処理プログラムの例を示すフローチャ
ートである。 1〜3・・・処理装置、4・・・クロックオシレータ、
5・・・クロック分配回路、7・・・割込信号生成回路
、8・・・保守診断プロセッサ、61〜63・・・クロ
ック障害検出回路、1−1〜l−n・・・実装単位、7
1・・・ステータスレジスタ、81・・・割込処理制御
部、82・・・障害処理制御部、101〜103,11
1〜113,121−123,131〜133,171
・・・クロック信号線、141〜143,151〜15
4,161・・・信号線。

Claims (1)

    【特許請求の範囲】
  1. 複数の処理装置と、この処理装置について独立に障害処
    理を実行可能な保守診断プロセッサとを含む情報処理シ
    ステムにおけるクロック障害処理システムにおいて、前
    記情報処理システムで使用する1つ又は複数のクロック
    信号を発生して処理装置に分配出力するクロック分配回
    路と、このクロック分配回路から出力されるクロック信
    号を監視し、異常があれば対応する処理装置ごとにエラ
    ー信号を発生するクロック障害検出回路と、前記エラー
    信号を保持するエラー信号保持手段を有し、前記エラー
    信号の発生により前記保守診断プロセッサに割込みを発
    生させる割込発生手段とを備え、前記割込みにより起動
    される前記保守診断プロセッサの割込処理プログラムの
    中で、クロック障害が発生した処理装置を認識し、クロ
    ック障害発生事象およびクロック障害状態をロギングす
    る実行ステップを含む障害処理プログラムの実行を起動
    するように制御することを特徴とするクロック障害処理
    システム。
JP1047540A 1989-02-28 1989-02-28 クロック障害処理システム Pending JPH02226432A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP1047540A JPH02226432A (ja) 1989-02-28 1989-02-28 クロック障害処理システム
EP19900103812 EP0385404B1 (en) 1989-02-28 1990-02-27 Clock failure recovery system
DE1990627461 DE69027461T2 (de) 1989-02-28 1990-02-27 Taktausfallbeseitigungssystem

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1047540A JPH02226432A (ja) 1989-02-28 1989-02-28 クロック障害処理システム

Publications (1)

Publication Number Publication Date
JPH02226432A true JPH02226432A (ja) 1990-09-10

Family

ID=12777974

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1047540A Pending JPH02226432A (ja) 1989-02-28 1989-02-28 クロック障害処理システム

Country Status (3)

Country Link
EP (1) EP0385404B1 (ja)
JP (1) JPH02226432A (ja)
DE (1) DE69027461T2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7003696B1 (en) * 1999-06-08 2006-02-21 Nec Corporation Fault management system for switching equipment

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09319456A (ja) * 1996-06-03 1997-12-12 Mitsubishi Electric Corp 発振停止検出装置
JP2000122749A (ja) 1998-10-20 2000-04-28 Mitsubishi Electric Corp 発振停止検出装置
US6895525B1 (en) * 1999-08-20 2005-05-17 International Business Machines Corporation Method and system for detecting phase-locked loop (PLL) clock synthesis faults
US8909971B2 (en) 2007-09-03 2014-12-09 Nxp B.V. Clock supervision unit

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5966752A (ja) * 1982-10-08 1984-04-16 Nec Corp 割込み方式
JPS6260019A (ja) * 1985-09-10 1987-03-16 Nec Corp 情報処理装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4651277A (en) * 1983-09-16 1987-03-17 Sanyo Electric Co., Ltd. Control system for a magnetic disk drive unit
DE3335549A1 (de) * 1983-09-29 1985-04-18 Siemens AG, 1000 Berlin und 8000 München Ueberwachungseinrichtung fuer eine datenverarbeitungsanlage

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5966752A (ja) * 1982-10-08 1984-04-16 Nec Corp 割込み方式
JPS6260019A (ja) * 1985-09-10 1987-03-16 Nec Corp 情報処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7003696B1 (en) * 1999-06-08 2006-02-21 Nec Corporation Fault management system for switching equipment

Also Published As

Publication number Publication date
DE69027461T2 (de) 1996-10-31
EP0385404A2 (en) 1990-09-05
DE69027461D1 (de) 1996-07-25
EP0385404B1 (en) 1996-06-19
EP0385404A3 (en) 1992-06-17

Similar Documents

Publication Publication Date Title
US6728668B1 (en) Method and apparatus for simulated error injection for processor deconfiguration design verification
JP2003122599A (ja) 計算機システムおよび計算機システムにおけるプログラム実行監視方法
JPH0644244B2 (ja) 計算機の動作試験方法および動作試験装置
JPH02226432A (ja) クロック障害処理システム
Hecht et al. A Distributed Fault Tolerant Architecture for Nuclear Reactor Control and Safety Functions.
US20230134320A1 (en) Information processing device, vehicle, and information processing method
JPS6272038A (ja) プログラム暴走検出装置の試験方法
JPS6290068A (ja) 予備系監視方式
JP3055249B2 (ja) プロセッサのデバッグ方式
JPH05224998A (ja) アプリケーション・タスクの障害検出方式
JPH0232409A (ja) 異常監視部の診断装置
JPH01231153A (ja) 障害処理方式
JPH04222031A (ja) 障害部位切り分け方式
JPH04153840A (ja) 情報処理システム
JPS59165169A (ja) システム障害検出装置
JPH04293133A (ja) 疎結合マルチプロセッサシステムにおける故障監視方式
JPS61245069A (ja) 診断回路
JPS60195649A (ja) マイクロプログラム制御型デ−タ処理装置におけるエラ−報告方式
JPS6146535A (ja) 擬似エラ−設定制御方式
Liddell Simple design makes reliable computers
JPH01231152A (ja) 障害処理方式
JPS59206944A (ja) マイクロプログラム監視装置
JPH05204680A (ja) 情報処理装置の誤動作防止方式
JPH02110743A (ja) 故障診断処理方式
JPH0855040A (ja) システム運転方法