JPH05108397A - Hardware fault monitoring system - Google Patents

Hardware fault monitoring system

Info

Publication number
JPH05108397A
JPH05108397A JP3272779A JP27277991A JPH05108397A JP H05108397 A JPH05108397 A JP H05108397A JP 3272779 A JP3272779 A JP 3272779A JP 27277991 A JP27277991 A JP 27277991A JP H05108397 A JPH05108397 A JP H05108397A
Authority
JP
Japan
Prior art keywords
error log
distributed processor
host computer
control unit
monitoring system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3272779A
Other languages
Japanese (ja)
Inventor
Takayuki Ota
隆幸 太田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP3272779A priority Critical patent/JPH05108397A/en
Publication of JPH05108397A publication Critical patent/JPH05108397A/en
Pending legal-status Critical Current

Links

Landscapes

  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

PURPOSE:To detect a fault of the hardware before the system down of a distributed processor so as to eliminate the fault. CONSTITUTION:The large-scale network system consisting of a host computer 11 and a distributed processor 13 connected to the computer 11 through a communication path 12 is provided with a distributed processor error log transmission and reception control part 17 receiving a transmission request of error log and transmitting an error log when it comes to the distributed processor 13 and a distributed processor error log acquisition control part 18 transmitting the request to the control part 17 when performing the error log acquisition. When an error log request comes from thehost computer 11, the error log can be obtained from the distributed processor 13.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明はホスト計算機とこれに通
信路を介して接続された分散プロセッサとからなる大規
模ネットワークシステムのハード障害を監視するのに特
に有効なハード障害監視システムに係わり、特にホスト
計算機側から分散プロセッサのハード障害を監視するこ
とのできるハード障害監視システムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a hardware fault monitoring system particularly effective for monitoring a hardware fault in a large-scale network system including a host computer and a distributed processor connected to the host computer via a communication path. In particular, the present invention relates to a hardware fault monitoring system capable of monitoring a hardware fault of a distributed processor from the host computer side.

【0002】[0002]

【従来の技術】ホスト計算機とこれに通信路を介して接
続された分散プロセッサとからなる大規模ネットワーク
システムでは、分散プロセッサにハード障害が発生した
場合の検出は、このハード障害によって分散プロセッサ
が最終的にシステムダウンを生ずることによって間接的
に行われるようになっていた。
2. Description of the Related Art In a large-scale network system consisting of a host computer and a distributed processor connected to it via a communication path, when a hardware failure occurs in the distributed processor, the hardware failure causes the distributed processor to finally detect the failure. It was supposed to be done indirectly by causing a system down.

【0003】[0003]

【発明が解決しようとする課題】このように従来のハー
ド障害監視システムでは、分散プロセッサにハード障害
が発生しても分散プロセッサ自体がシステムダウンする
までの間、ハード障害を検知することができなかった。
As described above, in the conventional hardware fault monitoring system, even if a hard fault occurs in the distributed processor, the hard fault cannot be detected until the system of the distributed processor itself goes down. It was

【0004】そこで本発明の目的は、分散プロセッサの
システムダウン前にそのハード装置の障害を検知するこ
とのできるハード障害監視システムを提供することにあ
る。
Therefore, an object of the present invention is to provide a hardware fault monitoring system capable of detecting a fault in a hardware device of a distributed processor before the system goes down.

【0005】[0005]

【課題を解決するための手段】請求項1記載の発明で
は、外部からエラーログの送信要求があったときこれを
受信する受信手段と、装置内のエラーログを採取する採
取手段と、受信手段がエラーログの送信要求を受信した
とき採取手段によって採取されているエラーログを前記
した外部に対して送信する送信手段とを具備した分散プ
ロセッサをハード障害監視システムに備えさせる。
According to a first aspect of the invention, a receiving means for receiving an error log transmission request from the outside, a collecting means for collecting an error log in the apparatus, and a receiving means. And a transmission means for transmitting the error log collected by the collection means to the outside when the error log transmission request is received by the hardware fault monitoring system.

【0006】すなわち請求項1記載の発明では、分散プ
ロセッサにエラーログの送信要求を行うことで、エラー
ログを採取することができ、この採取をその都度行うこ
とで、システムダウン前にハード障害を除去することが
可能である。
That is, according to the first aspect of the invention, the error log can be collected by requesting the distributed processor to send the error log. By collecting the error log each time, a hardware failure is generated before the system goes down. It can be removed.

【0007】請求項2記載の発明では、エラーログの送
信要求は、分散プロセッサと通信路を介して接続された
ホスト計算機から送出されることにしている。請求項3
記載の発明では、このホスト計算機にコンソールを接続
することによってエラーログをこれに出力させその内容
の確認を可能にしている。
According to the second aspect of the invention, the error log transmission request is transmitted from the host computer connected to the distributed processor via the communication path. Claim 3
In the described invention, by connecting a console to this host computer, an error log is output to this and the contents can be confirmed.

【0008】[0008]

【実施例】以下実施例につき本発明を詳細に説明する。EXAMPLES The present invention will be described in detail below with reference to examples.

【0009】図1は、本発明の一実施例におけるハード
障害監視システムの構成の概要を表わしたものである。
ホスト計算機11は通信路12を介して分散プロセッサ
13と接続されている。ホスト計算機11はまたコンソ
ール14と接続されている。ホスト計算機11内にはエ
ラーログの送受信制御を行うためのホスト計算機エラー
ログ送受信制御部16が配置されている。分散プロセッ
サ13内には、エラーログの送受信制御を行うための分
散プロセッサエラーログ送受信制御部17と、エラーロ
グの採取を行う分散プロセッサエラーログ採取制御部1
8が配置されている。これら各制御部16〜18は、そ
れぞれ装置内の図示しないCPU(中央処理装置)が同
じく図示しない記憶媒体に格納されたプログラムを実行
することによって達成される部分である。
FIG. 1 shows the outline of the configuration of a hardware fault monitoring system according to an embodiment of the present invention.
The host computer 11 is connected to the distributed processor 13 via the communication path 12. The host computer 11 is also connected to the console 14. In the host computer 11, a host computer error log transmission / reception control unit 16 for controlling transmission / reception of error logs is arranged. In the distributed processor 13, a distributed processor error log transmission / reception control unit 17 for controlling transmission / reception of error logs, and a distributed processor error log collection control unit 1 for collecting error logs.
8 are arranged. Each of the control units 16 to 18 is a unit achieved by a CPU (central processing unit) (not shown) in the apparatus executing a program similarly stored in a storage medium (not shown).

【0010】図2は、このようなハード障害監視システ
ムでホスト計算機11にエラーログ送信要求が送られて
きた場合の制御内容を説明するためのものである。図1
のコンソール14からホスト計算機11を経由してエラ
ーログ送信要求が受信されると、ホスト計算機エラーロ
グ送受信制御部16はこれを受け付ける(ステップS1
01)。そして、このエラーログ送信要求を分散プロセ
ッサ13に送出する(ステップS102)。
FIG. 2 is a diagram for explaining the control contents when an error log transmission request is sent to the host computer 11 in such a hardware fault monitoring system. Figure 1
When an error log transmission request is received from the console 14 of the host computer 11 via the host computer 11, the host computer error log transmission / reception control unit 16 receives the request (step S1).
01). Then, this error log transmission request is sent to the distributed processor 13 (step S102).

【0011】図3は、ホスト計算機からエラーログ送信
要求が送られてきた場合の分散プロセッサエラーログ送
受信制御部の制御の様子を表わしたものである。分散プ
ロセッサエラーログ送受信制御部17は、ホスト計算機
11からエラーログ送信要求を受け付け(ステップS2
01)、分散プロセッサエラーログ採取制御部18にこ
のエラーログ送信要求を送出する(ステップS20
2)。
FIG. 3 shows how the distributed processor error log transmission / reception control unit controls when an error log transmission request is sent from the host computer. The distributed processor error log transmission / reception control unit 17 receives an error log transmission request from the host computer 11 (step S2).
01), and sends this error log transmission request to the distributed processor error log collection control unit 18 (step S20).
2).

【0012】ところで、分散プロセッサエラーログ採取
制御部18はシステムの立ち上げから常にこの分散プロ
セッサ13のハード装置のエラーログを採取している。
図4は、分散プロセッサエラーログ送受信制御部17か
らエラーログ送信要求が受信された場合の動作を表わし
たものである。すなわち、分散プロセッサエラーログ採
取制御部18はこのエラーログ送信要求を受け付け(ス
テップS301)、分散プロセッサエラーログ送受信制
御部17にエラーログを送出する(ステップS30
2)。
By the way, the distributed processor error log collection control unit 18 always collects the error log of the hardware device of the distributed processor 13 from the start-up of the system.
FIG. 4 shows an operation when an error log transmission request is received from the distributed processor error log transmission / reception control unit 17. That is, the distributed processor error log collection control unit 18 accepts this error log transmission request (step S301), and sends the error log to the distributed processor error log transmission / reception control unit 17 (step S30).
2).

【0013】図5は、このようにしてエラーログを受信
した分散プロセッサエラーログ送受信制御部の制御の様
子を表わしたものである。分散プロセッサエラーログ送
受信制御部17では分散プロセッサエラーログ採取制御
部18からエラーログを受信すると(ステップS40
1)、ホスト計算機11に対してこのエラーログを送出
する。
FIG. 5 shows how the distributed processor error log transmission / reception control unit receives the error log in this way. When the distributed processor error log transmission / reception control unit 17 receives the error log from the distributed processor error log collection control unit 18 (step S40).
1) The error log is sent to the host computer 11.

【0014】図6は、エラーログを受信したホスト計算
機エラーログ送受信制御部の制御の様子を表わしたもの
である。ホスト計算機エラーログ送受信制御部16では
分散プロセッサ13からエラーログを受信すると、これ
を受け付ける(ステップS501)。そして、コンソー
ル14に対してエラーログを出力することになる(ステ
ップS502)。
FIG. 6 shows a control state of the host computer error log transmission / reception control unit which has received the error log. Upon receiving the error log from the distributed processor 13, the host computer error log transmission / reception control unit 16 accepts this (step S501). Then, the error log is output to the console 14 (step S502).

【0015】このようにして、このハード障害監視シス
テムではコンソール14からエラーログ送信要求が行わ
れると、分散プロセッサ13内でハード装置のエラーロ
グの採取を行っている分散プロセッサエラーログ採取制
御部18がこれらのエラーログを返送するようにした。
したがって、コンソール14に表示されたエラーログの
内容を見て必要に応じて分散プロセッサ13のハード装
置を交換することができる。
In this way, in this hardware fault monitoring system, when an error log transmission request is issued from the console 14, the distributed processor error log collection control unit 18 which collects the error log of the hardware device in the distributed processor 13. Now sends back these error logs.
Therefore, the contents of the error log displayed on the console 14 can be checked and the hardware device of the distributed processor 13 can be replaced if necessary.

【0016】[0016]

【発明の効果】以上説明したように本発明によれば、分
散プロセッサ内で採取されたエラーログを送信要求に応
じて外部のコンソール等に出力するようにしたので、ハ
ード装置のエラー状況を逐一監視することができ、シス
テムダウンに至らないような障害であっても、これに対
する適切な対応をとることができるという効果がある。
As described above, according to the present invention, the error log collected in the distributed processor is output to an external console or the like in response to a transmission request. Even if there is a failure that can be monitored and the system does not go down, there is an effect that appropriate measures can be taken.

【図面の簡単な説明】[Brief description of drawings]

【図1】本実施例のハード障害監視システムの構成の概
要を表わしたブロック図である。
FIG. 1 is a block diagram showing an outline of a configuration of a hardware fault monitoring system of this embodiment.

【図2】本実施例でホスト計算機にエラーログ送信要求
が送られてきた場合のホスト計算機エラーログ送受信制
御部の制御の様子を表わしたブロック図である。
FIG. 2 is a block diagram showing a control state of a host computer error log transmission / reception control unit when an error log transmission request is sent to a host computer in this embodiment.

【図3】本実施例でホスト計算機からエラーログ送信要
求が送られてきた場合の分散プロセッサエラーログ送受
信制御部の制御の様子を表わした流れ図である。
FIG. 3 is a flowchart showing a control state of a distributed processor error log transmission / reception control unit when an error log transmission request is sent from a host computer in this embodiment.

【図4】本実施例でエラーログ送信要求が受信された場
合の分散プロセッサエラーログ採取制御部の動作を表わ
した流れ図である。
FIG. 4 is a flowchart showing the operation of the distributed processor error log collection control unit when an error log transmission request is received in this embodiment.

【図5】本実施例でエラーログを受信した分散プロセッ
サエラーログ送受信制御部の制御の様子を表わした流れ
図である。
FIG. 5 is a flowchart showing a control state of a distributed processor error log transmission / reception control unit that has received an error log in this embodiment.

【図6】本実施例でエラーログを受信したホスト計算機
エラーログ送受信制御部の制御の様子を表わした流れ図
である。
FIG. 6 is a flow chart showing a control state of a host computer error log transmission / reception control unit that has received an error log in this embodiment.

【符号の説明】[Explanation of symbols]

11 ホスト計算機 12 通信路 13 分散プロセッサ 14 コンソール 16 ホスト計算機エラーログ送受信制御部 17 分散プロセッサエラーログ送受信制御部 18 分散プロセッサエラーログ採取制御部 11 host computer 12 communication path 13 distributed processor 14 console 16 host computer error log transmission / reception control unit 17 distributed processor error log transmission / reception control unit 18 distributed processor error log collection control unit

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 外部からエラーログの送信要求があった
ときこれを受信する受信手段と、 装置内のエラーログを採取する採取手段と、 前記受信手段がエラーログの送信要求を受信したとき採
取手段によって採取されているエラーログを前記外部に
対して送信する送信手段とを分散プロセッサに具備させ
たことを特徴とするハード障害監視システム。
1. A receiving unit for receiving an error log transmission request from the outside, a collecting unit for collecting an error log in the apparatus, and a collecting unit for collecting the error log transmission request by the receiving unit. A hardware fault monitoring system characterized in that a distributed processor is provided with a transmission means for transmitting the error log collected by the means to the outside.
【請求項2】 エラーログの送信要求は、前記分散プロ
セッサと通信路を介して接続されたホスト計算機から送
出されることを特徴とする請求項1記載のハード障害監
視システム。
2. The hardware fault monitoring system according to claim 1, wherein the error log transmission request is transmitted from a host computer connected to the distributed processor via a communication path.
【請求項3】 エラーログを表示するコンソールを具備
することを特徴とする請求項1記載のハード障害監視シ
ステム。
3. The hardware fault monitoring system according to claim 1, further comprising a console for displaying an error log.
JP3272779A 1991-10-21 1991-10-21 Hardware fault monitoring system Pending JPH05108397A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3272779A JPH05108397A (en) 1991-10-21 1991-10-21 Hardware fault monitoring system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3272779A JPH05108397A (en) 1991-10-21 1991-10-21 Hardware fault monitoring system

Publications (1)

Publication Number Publication Date
JPH05108397A true JPH05108397A (en) 1993-04-30

Family

ID=17518634

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3272779A Pending JPH05108397A (en) 1991-10-21 1991-10-21 Hardware fault monitoring system

Country Status (1)

Country Link
JP (1) JPH05108397A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0738972A1 (en) * 1995-04-19 1996-10-23 Fuji Xerox Co., Ltd. Fault information notification system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0738972A1 (en) * 1995-04-19 1996-10-23 Fuji Xerox Co., Ltd. Fault information notification system

Similar Documents

Publication Publication Date Title
JP2004206634A (en) Monitoring method, operation monitoring device, monitoring system, and computer program
KR960006388A (en) Clients, Servers, Systems and Control Methods
JPH05108397A (en) Hardware fault monitoring system
KR102278931B1 (en) Facilities monitoring system and communication method for facilities monitoring system
JPH0530119A (en) Communication equipment
JPH0879248A (en) Network address management device
JP2751861B2 (en) Network system fault detection processing circuit
JP2531831B2 (en) Network network communication status monitoring device
JPH1031657A (en) Distributed controller
JPH03220661A (en) System for communication between processors
JP2010033509A (en) Failure analysis support method, and device
JP2836612B2 (en) Monitor system for network equipment
JP4121234B2 (en) Remote monitoring and control device
JPH087726B2 (en) Health check method
JPH05189342A (en) Communication processor operation monitoring system
JP2828044B2 (en) Communication apparatus, communication system, and failure notification method having failure notification function
JP2003050753A (en) OPERATION SYSTEM FOR AUTOMATIC RECOVERY Web SERVER
JPH10107792A (en) Server monitor
JP2004180096A (en) Information processor and method for detecting device abnormality
JPS62175836A (en) Health check system in data processing system
JPH0125459B2 (en)
JPS62105243A (en) Recovery device for system fault
JP2004318244A (en) Monitoring method and monitoring system of computer
JPH05113949A (en) Bus data collection system
JPH0564266A (en) System for detecting alarm information