JPH10116211A - System console fault informing system - Google Patents

System console fault informing system

Info

Publication number
JPH10116211A
JPH10116211A JP8269821A JP26982196A JPH10116211A JP H10116211 A JPH10116211 A JP H10116211A JP 8269821 A JP8269821 A JP 8269821A JP 26982196 A JP26982196 A JP 26982196A JP H10116211 A JPH10116211 A JP H10116211A
Authority
JP
Japan
Prior art keywords
message
response message
system console
health check
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8269821A
Other languages
Japanese (ja)
Inventor
Akira Sekiguchi
章 関口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP8269821A priority Critical patent/JPH10116211A/en
Publication of JPH10116211A publication Critical patent/JPH10116211A/en
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

PROBLEM TO BE SOLVED: To immediately inform a maintenance staff of a system console fault by monitoring the response of a system console to a health check message and performing alarming operation unless a response message is obtained within a specified time. SOLUTION: The health check message sent to the system console 2 is received by a health check message receiving function 13 and immediately returned to a server 1 by a response message returning function 12. The response message sent back to the server 1 is inputted to an input/output processor 5 and received by a response message receiving function 9. At this time, a timer means sends the time when the response message is received to a central processor 3, which calculates the time required from the transmission of the health check message to the reception of the response message from the difference between the reception time of the response message and the reception start time of the health check message. When this time is longer than a specified response wait time (t), it is judged that the system console 2 is abnormal and an alarm signal is outputted through a fault detecting function 10.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、コンピュータシス
テムの保守のため汎用コンピュータ本体装置に接続され
るシステムコンソール自身の故障を、保守要員に通知す
る方式に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a system for notifying a maintenance person of a failure of a system console connected to a general-purpose computer main unit for maintenance of a computer system.

【0002】[0002]

【従来の技術】従来、コンピュータシステムは汎用コン
ピュータ本体装置(以下、サーバという)に各種の周辺
制御装置を接続することによって構成されている。そし
て、通常、このサーバには1台以上のシステムコンソー
ルが接続され、OSのインストールや上記周辺制御装置
の故障チェックの際に保守要員によって使用されてい
る。ところが、これら従来のシステムコンソールには、
コンピュータシステムの故障を検出する機能は設けられ
ていたが、システムコンソール自身の故障の検出および
通知する機能は設けられていなかった。
2. Description of the Related Art Conventionally, a computer system is constructed by connecting various peripheral control devices to a general-purpose computer main unit (hereinafter referred to as a server). Usually, one or more system consoles are connected to this server, and are used by maintenance personnel when installing an OS or checking for a failure in the peripheral control device. However, these traditional system consoles
Although a function of detecting a failure of the computer system was provided, a function of detecting and notifying a failure of the system console itself was not provided.

【0003】[0003]

【発明が解決しようとする課題】そのため、保守要員は
コンピュータシステムに障害が発生してシステムコンソ
ールを使用しようとして初めてシステムコンソールの故
障に気がつき、緊急時にこれらシステムコンソールを使
用することができないという問題点があった。また、シ
ステムコンソールに故障が発生し、システムコンソール
の使用ができなくなった場合、その原因がサーバの故障
によるものなのかシステムコンソールの故障によるもの
なのか、保守要員には区別がつかないという問題点もあ
った。本発明はこのような課題を解決するためのもので
あり、システムコンソールの故障を検出し、早期に保守
要員に通知するシステムコンソール故障通知方式を提供
することを目的としている。
For this reason, the maintenance staff notices the failure of the system console only when a failure occurs in the computer system and tries to use the system console, and cannot use these system consoles in an emergency. was there. In addition, if a system console failure occurs and the system console cannot be used, maintenance personnel cannot distinguish whether the cause is a server failure or a system console failure. There was also. An object of the present invention is to solve such a problem, and an object of the present invention is to provide a system console failure notification system for detecting a failure of a system console and notifying maintenance personnel at an early stage.

【0004】[0004]

【課題を解決するための手段】このような目的を達成す
るために、本発明によるシステムコンソール故障通知方
式は、コンピュータ装置に設けられてヘルスチェック電
文を周期的に送信するヘルスチェック電文送信手段と、
システムコンソールに設けられてヘルスチェック電文を
受信するヘルスチェック電文受信手段と、システムコン
ソールに設けられてヘルスチェック電文受信手段がヘル
スチェック電文を受信すると応答電文を送信する応答電
文返送手段と、コンピュータ装置に設けられて応答電文
を受信する応答電文受信手段と、コンピュータ装置に設
けられて応答電文受信手段が応答電文を所定時間内に受
信しないと警報信号を送信する故障検出手段と、コンピ
ュータ装置に設けられて警報信号を受信すると所定の警
報を発する警報装置とを備えたものである。このように
構成することにより本発明は、システムコンソールから
返送される応答電文をサーバ側で監視することによって
システムコンソールの故障を検出することができ、また
警報装置を動作させることによって保守要員にその故障
を通知することができる。
In order to achieve the above object, a system console failure notification system according to the present invention comprises a health check message transmission means provided in a computer device for periodically transmitting a health check message. ,
A health check message receiving means provided on the system console for receiving a health check message, a response message returning means provided on the system console for sending a response message when the health check message receiving means receives the health check message, and a computer device A response message receiving unit provided in the computer device; a failure detection unit provided in the computer device for transmitting an alarm signal unless the response message receiving device receives the response message within a predetermined time; and a failure detection device provided in the computer device. And an alarm device for issuing a predetermined alarm upon receiving an alarm signal. With this configuration, the present invention can detect the failure of the system console by monitoring the response message returned from the system console on the server side, and can provide the maintenance staff with the alarm device by operating the alarm device. Failure can be notified.

【0005】[0005]

【発明の実施の形態】次に、本発明の詳細について図面
を参照して説明する。図1は本発明の一つの実施の形態
を示したブロック図である。同図において本発明に係る
コンピュータシステムは、サーバ1と、このサーバ1に
接続されたシステムコンソール2と、サーバ1に接続さ
れた複数の周辺制御装置(図示せず)とによって構成さ
れている。
Next, details of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing one embodiment of the present invention. Referring to FIG. 1, the computer system according to the present invention includes a server 1, a system console 2 connected to the server 1, and a plurality of peripheral controllers (not shown) connected to the server 1.

【0006】サーバ1は中央処理装置3と主記憶装置4
と入出力処理装置5と警報装置11とから構成されてい
る。そして、入出力処理装置5はヘルスチェック電文送
信機能8と応答電文受信機能9と故障検出機能10とを
備えている。システムコンソール2は、制御部7と、こ
の制御部7に接続されたキーボード14とディスプレイ
15とプリンタ16とから構成され、インタフェース6
を介してサーバ1に接続されている。制御部7は応答電
文返送機能12とヘルスチェック電文受信機能13とを
備えている。
The server 1 includes a central processing unit 3 and a main storage device 4
, An input / output processing device 5 and an alarm device 11. The input / output processing device 5 includes a health check message transmission function 8, a response message reception function 9, and a failure detection function 10. The system console 2 includes a control unit 7, a keyboard 14, a display 15, and a printer 16 connected to the control unit 7.
Is connected to the server 1 via the. The control unit 7 has a response message return function 12 and a health check message reception function 13.

【0007】このように構成された本発明の各機能の動
作について図面を用いて詳細に説明する。図2は図1の
各機能の動作を示すシーケンス図である。同図におい
て、サーバ1が具備するヘルスチェック電文送信機能8
は、所定の一定周期T毎にヘルスチェック電文をインタ
フェース6を介してシステムコンソール2の制御部7へ
送信する。このとき、図示しない計時手段はヘルスチェ
ック電文が送信された時刻を中央処理装置3へ送信し、
中央処理装置3はこの時刻を主記憶装置に記憶保持す
る。そして、システムコンソール2へ送信されたヘルス
チェック電文は、ヘルスチェック電文受信機能13によ
って受信され、直ちに応答電文返送機能12は応答電文
をインタフェース6を介してサーバ1に返送する。
The operation of each function of the present invention thus configured will be described in detail with reference to the drawings. FIG. 2 is a sequence diagram showing the operation of each function in FIG. In the figure, a health check message transmission function 8 provided in the server 1
Transmits a health check message to the control unit 7 of the system console 2 via the interface 6 at every predetermined fixed period T. At this time, a timer (not shown) transmits the time at which the health check message was transmitted to the central processing unit 3,
The central processing unit 3 stores this time in the main storage device. Then, the health check message transmitted to the system console 2 is received by the health check message receiving function 13, and the response message returning function 12 immediately returns the response message to the server 1 via the interface 6.

【0008】サーバ1に返送された応答電文は、入出力
処理装置5に入力され、応答電文受信機能9によって受
信される。このとき、上記図示しない計時手段は応答電
文を受信した時刻を中央処理装置3へ送信し、中央処理
装置3はこの応答電文の受信時刻と上記ヘルスチェック
電文の送信開始時刻との差から、ヘルスチェック電文の
送信から応答電文の受信までに要した時間を算出する。
そして、中央処理装置3はこの時間が予め設定しておい
た所定の応答待ち時間t未満であればシステムコンソー
ル2は正常に動作しているものと判断する。
[0008] The response message returned to the server 1 is input to the input / output processing device 5 and received by the response message receiving function 9. At this time, the timing means (not shown) transmits the time at which the response message was received to the central processing unit 3, and the central processing unit 3 calculates the health based on the difference between the reception time of the response message and the transmission start time of the health check message. The time required from transmission of the check message to reception of the response message is calculated.
If this time is shorter than the predetermined response waiting time t set in advance, the central processing unit 3 determines that the system console 2 is operating normally.

【0009】ところが、時間t以上であればシステムコ
ンソール2に異常が発生したものと判断し、中央処理装
置3は故障検出機能10を介して警報信号を出力させ
る。この警報信号は、ランプやブザー等によって構成さ
れた警報装置12に受信されると、この警報装置11は
直ちに発光または警告音を発する等してシステムの保守
要員に対してシステムコンソールの故障を通知する。
However, if the time is equal to or longer than the time t, it is determined that an abnormality has occurred in the system console 2, and the central processing unit 3 outputs an alarm signal via the failure detection function 10. When this alarm signal is received by an alarm device 12 constituted by a lamp, a buzzer, or the like, the alarm device 11 immediately emits a light or emits an audible alarm to notify maintenance personnel of the system of the failure of the system console. I do.

【0010】なお、時間tの値は、サーバ1がヘルスチ
ェック電文を送信し応答電文を受信するまでに要する時
間と、システムコンソール2内におけるヘルスチェック
電文の処理時間とを合計したもののうち、もっとも大き
な値を採用する。また、時間Tの値は、時間tよりも大
きな値を採用し、システムコンソールの使用頻度等を考
慮して経験的に求められる。
[0010] The value of the time t is the largest of the sum of the time required for the server 1 to transmit the health check message and receive the response message and the processing time of the health check message in the system console 2. Use a large value. The value of the time T is larger than the time t, and is empirically determined in consideration of the frequency of use of the system console.

【0011】次に、図3は本発明のその他の実施の形態
を示すブロック図である。同図において、図1に係る符
号と同一のものは、同一または同等の部品を示す。警報
装置11はインタフェース21を介して接続され、サー
バ1とは分離して設置されている。また、図1の入出力
装置5内の各機能は、図3においては主記憶装置に記憶
されているソフトウエア20によって実現されている。
FIG. 3 is a block diagram showing another embodiment of the present invention. In the figure, the same components as those in FIG. 1 indicate the same or equivalent components. The alarm device 11 is connected via an interface 21 and is installed separately from the server 1. Each function in the input / output device 5 in FIG. 1 is realized by software 20 stored in the main storage device in FIG.

【0012】さらに、システムコンソール2には、シス
テムコンソール2の故障を自立的に検出する故障検出通
知機能22が設けられている。すなわち、図3に係るシ
ステムコンソール故障通知方式においては、システムコ
ンソール2から返送される応答電文をサーバ側で監視す
るだけでなく、システムコンソール2の故障を故障検出
通知機能22によって自立的に検出している。このよう
に、故障チェックを2重化することにより、さらに厳重
な故障検出を実現することができる。
Further, the system console 2 is provided with a failure detection notification function 22 for independently detecting a failure of the system console 2. That is, in the system console failure notifying method according to FIG. 3, not only the server monitors the response message returned from the system console 2 but also the failure detection notification function 22 detects the failure of the system console 2 autonomously. ing. In this way, by doubling the failure check, more strict failure detection can be realized.

【0013】なお、故障検出通知機能22によって自立
的に故障を検出する方法にはいくつか考えられる。例え
ば、システムコンソールで使用されているCPU内部で
所定条件の下で全命令を1命令ずつ実行しその結果の良
否から故障を検出したり(CPU内部ヘルスチェッ
ク)、システムコンソールに接続されている主要な入出
力装置(磁気ドラム装置、磁気ディスク装置等)に対し
てこれら各装置の所定のエリアへの書き込み及び読み出
しを実行しデータの照合を行って故障を検出したり(I
/O巡回ヘルスチェック)、システムコンソール内の通
信制御装置に収容された所定の2回線(試験回線)を回
線側でループ状態にしてデータの送受を行って故障を検
出したり(送信制御装置ヘルスチェック)する方法等が
ある。
There are several methods for autonomously detecting a failure using the failure detection notification function 22. For example, the CPU used in the system console executes all the instructions one by one under predetermined conditions, detects a failure based on the quality of the result (a health check inside the CPU), or executes a main operation connected to the system console. Write / read to / from a predetermined area of various input / output devices (magnetic drum device, magnetic disk device, etc.) and collate data to detect a failure (I
/ O cyclical health check), a loop is established on two lines (test lines) accommodated in the communication control device in the system console on the line side, and data transmission and reception are performed to detect a failure (transmission control device health). Check) there is a method.

【0014】[0014]

【発明の効果】以上説明したように、本発明はヘルスチ
ェック電文に対するシステムコンソールの応答をコンピ
ュータ装置側で監視し、所定時間内に応答電文が得られ
ないとシステムコンソールの故障と判定し、コンピュー
タ装置に設けた警報装置を動作させるため、システムコ
ンソールの故障を保守要員に直ちに通知することができ
る。
As described above, according to the present invention, the response of the system console to the health check message is monitored on the computer side, and if no response message is obtained within a predetermined time, it is determined that the system console has failed. Since the alarm device provided in the device is operated, maintenance personnel can be immediately notified of the failure of the system console.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 本発明の一つの実施の形態を示すブロック図
である。
FIG. 1 is a block diagram showing one embodiment of the present invention.

【図2】 図1のヘルスチェック電文と応答電文との関
係を示すシーケンス図である。
FIG. 2 is a sequence diagram showing a relationship between a health check message and a response message in FIG. 1;

【図3】 本発明のその他の実施の形態を示すブロック
図である。
FIG. 3 is a block diagram showing another embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1…汎用コンピュータ本体装置(サーバ)、2…システ
ムコンソール、3…中央処理装置、4…主記憶装置、5
…入出力処理装置、6…インタフェース、7…制御部、
8…ヘルスチェック電文送信機能、9…応答電文受信機
能、10…故障検出機能、11…警報装置、12…応答
電文返送機能、13…ヘルスチェック電文受信機能、1
4…キーボード、15…ディスプレイ、16…プリン
タ。
DESCRIPTION OF SYMBOLS 1 ... General-purpose computer main unit (server), 2 ... System console, 3 ... Central processing unit, 4 ... Main storage device, 5
... I / O processing device, 6 ... Interface, 7 ... Control unit,
8: Health check message transmission function, 9: Response message reception function, 10: Failure detection function, 11: Alarm device, 12: Response message return function, 13: Health check message reception function, 1
4 ... keyboard, 15 ... display, 16 ... printer.

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 コンピュータ装置に接続されたシステム
コンソールの故障を保守要員に通知する方式において、 コンピュータ装置に設けられてヘルスチェック電文を周
期的に送信するヘルスチェック電文送信手段と、 システムコンソールに設けられてヘルスチェック電文を
受信するヘルスチェック電文受信手段と、 システムコンソールに設けられてヘルスチェック電文受
信手段がヘルスチェック電文を受信すると応答電文を送
信する応答電文返送手段と、 コンピュータ装置に設けられて応答電文を受信する応答
電文受信手段と、 コンピュータ装置に設けられて応答電文受信手段が応答
電文を所定時間内に受信しないと警報信号を送信する故
障検出手段と、 コンピュータ装置に設けられて警報信号を受信すると所
定の警報を発する警報装置とを備えたことを特徴とする
システムコンソール故障通知方式。
In a system for notifying maintenance personnel of a failure of a system console connected to a computer device, a health check message transmission means provided in the computer device for periodically transmitting a health check message, and provided in a system console. A health check message receiving means for receiving a health check message, a response message sending means for receiving a health check message provided on the system console, and a response message returning means for sending a response message when the health check message is received; and a computer device. Response message receiving means for receiving a response message; failure detection means provided in the computer device for transmitting an alarm signal when the response message receiving device does not receive the response message within a predetermined time; and alarm signal provided in the computer device. An alarm device that issues a predetermined alarm when receiving A system console failure notification system comprising:
【請求項2】 請求項1記載のシステムコンソール故障
通知方式において、 システムコンソールに設けられてシステムコンソールの
故障を検出すると故障通知電文を送信する故障検出通知
手段と、 コンピュータ装置に設けられて故障通知電文を受信する
故障通知電文受信手段とを備え、コンピュータ装置に設
けられた故障検出手段は故障通知電文受信手段が故障通
知電文を受信すると警報信号を送信し、警報装置はこの
警報信号を受信すると所定の警報を発することを特徴と
するシステムコンソール故障通知方式。
2. The system console failure notification system according to claim 1, wherein: a failure detection notification unit provided in the system console and transmitting a failure notification message when a failure of the system console is detected; Failure notification message receiving means for receiving the message, the failure detection means provided in the computer device sends an alarm signal when the failure notification message receiving means receives the failure notification message, and the alarm device receives the alarm signal A system console failure notification system that issues a predetermined alarm.
JP8269821A 1996-10-11 1996-10-11 System console fault informing system Pending JPH10116211A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8269821A JPH10116211A (en) 1996-10-11 1996-10-11 System console fault informing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8269821A JPH10116211A (en) 1996-10-11 1996-10-11 System console fault informing system

Publications (1)

Publication Number Publication Date
JPH10116211A true JPH10116211A (en) 1998-05-06

Family

ID=17477648

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8269821A Pending JPH10116211A (en) 1996-10-11 1996-10-11 System console fault informing system

Country Status (1)

Country Link
JP (1) JPH10116211A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001043157A (en) * 1999-07-28 2001-02-16 Oki Electric Ind Co Ltd Operation monitoring system for server
JP2011008418A (en) * 2009-06-24 2011-01-13 Nec Computertechno Ltd Fault notification device, fault notification method, fault notification circuit and program
CN108197032A (en) * 2018-01-23 2018-06-22 武汉斗鱼网络科技有限公司 Main thread interim card monitoring method, medium, equipment and the system of IOS applications
JP2020119302A (en) * 2019-01-24 2020-08-06 キヤノン株式会社 Image formation device, control method of image formation device, and program
CN114244747A (en) * 2021-11-12 2022-03-25 潍柴动力股份有限公司 Message health monitoring method and device and ECU (electronic control Unit)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001043157A (en) * 1999-07-28 2001-02-16 Oki Electric Ind Co Ltd Operation monitoring system for server
JP2011008418A (en) * 2009-06-24 2011-01-13 Nec Computertechno Ltd Fault notification device, fault notification method, fault notification circuit and program
CN108197032A (en) * 2018-01-23 2018-06-22 武汉斗鱼网络科技有限公司 Main thread interim card monitoring method, medium, equipment and the system of IOS applications
CN108197032B (en) * 2018-01-23 2021-04-27 武汉斗鱼网络科技有限公司 Main thread jamming monitoring method, medium, equipment and system for IOS application
JP2020119302A (en) * 2019-01-24 2020-08-06 キヤノン株式会社 Image formation device, control method of image formation device, and program
CN114244747A (en) * 2021-11-12 2022-03-25 潍柴动力股份有限公司 Message health monitoring method and device and ECU (electronic control Unit)
CN114244747B (en) * 2021-11-12 2023-11-17 潍柴动力股份有限公司 Message health monitoring method and device and ECU

Similar Documents

Publication Publication Date Title
JP4919443B2 (en) Electronic price labels
JPH10116211A (en) System console fault informing system
JP6504610B2 (en) Processing device, method and program
JP2004086520A (en) Monitoring control device and its method
JP2675645B2 (en) System failure monitoring device
JPH11338724A (en) Standby system, standby method and recording medium
JPS63300328A (en) Remote maintenance system
JP2917291B2 (en) Fault detection method for multiprocessor systems
JP4724951B2 (en) Control device, control method, and power line communication control system
JPH09218835A (en) Remote maintenance system
JPH0716190B2 (en) Communication error monitoring device for communication system
JPH02129736A (en) Remote supervisory system for information processor
JP2787856B2 (en) Elevator communication device
JPS6356755A (en) Abnormality supervising system for slave processor
JPH08185379A (en) Parallel processing system
JP2004341779A (en) System, method, and program for mutual monitoring of computers
JPH01251839A (en) Host monitor device
JP2000339558A (en) Disaster preventive monitor device
JP2699904B2 (en) Network system
JP3169022B2 (en) Data transmission equipment
JPH06139109A (en) Fault generation informing system
JPH0691565B2 (en) Operation monitoring device for partner processing device
JPH0241058A (en) Diagnostic device for data transmission system
JPH10207745A (en) Method for confirming inter-processor existence
JPH02144635A (en) Device fault diagnostic system