JP3147811B2 - Failure detection method in a system composed of many information processing devices - Google Patents

Failure detection method in a system composed of many information processing devices

Info

Publication number
JP3147811B2
JP3147811B2 JP09651397A JP9651397A JP3147811B2 JP 3147811 B2 JP3147811 B2 JP 3147811B2 JP 09651397 A JP09651397 A JP 09651397A JP 9651397 A JP9651397 A JP 9651397A JP 3147811 B2 JP3147811 B2 JP 3147811B2
Authority
JP
Japan
Prior art keywords
information processing
test diagnosis
test
diagnosis
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP09651397A
Other languages
Japanese (ja)
Other versions
JPH10283216A (en
Inventor
弘介 金光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP09651397A priority Critical patent/JP3147811B2/en
Publication of JPH10283216A publication Critical patent/JPH10283216A/en
Application granted granted Critical
Publication of JP3147811B2 publication Critical patent/JP3147811B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は多数の情報処理装置
からなるシステムにおける障害検出方式に関し、特に、
情報処理装置間を巡回して試験診断を実行する障害検出
方式に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a failure detection system in a system including a large number of information processing apparatuses,
The present invention relates to a failure detection method for circulating between information processing apparatuses and executing a test diagnosis.

【0002】[0002]

【従来の技術】多数の情報処理装置からなるシステムに
おける情報処理装置間の接続方法には従来、数多くの方
法が用いられている。
2. Description of the Related Art A number of methods have conventionally been used for connecting information processing apparatuses in a system including a large number of information processing apparatuses.

【0003】ところで、システムにおける情報処理装置
の台数が多くなると、全ての情報処理装置を相互に接続
した場合、コストが高くなってしまい、且つ、構造が複
雑になってしまうことから、通常、複数の情報処理装置
をグループに分け、各グループ内の情報処理装置につい
て全て相互接続する、という方式が用いられる。
By the way, when the number of information processing devices in the system increases, if all the information processing devices are connected to each other, the cost increases and the structure becomes complicated. Are divided into groups, and all information processing apparatuses in each group are interconnected.

【0004】このようなシステムにおける障害監視とし
ては、グループ内で一定時間毎に情報処理装置間の相互
監視を行い、障害を検出すると、隣のグループに障害を
報告する、という方法がとられている。
As a method of monitoring a failure in such a system, a method is employed in which mutual monitoring between information processing apparatuses is performed at regular intervals within a group, and when a failure is detected, a failure is reported to an adjacent group. I have.

【0005】[0005]

【発明が解決しようとする課題】しかしながら、複数の
情報処理装置を複数のグループに分け、各グループ内の
情報処理装置を相互接続する、という従来の接続方式で
は、グループ間を接続する手段に障害が発生すると、あ
るグループから他のグループへの障害の報告ができず、
障害が発生した情報処理装置のグループ以外のグループ
は、システム内で障害が発生したことを検出できないた
めに、システムとしての可用性が保証できない、ことに
なる。
However, in the conventional connection method in which a plurality of information processing apparatuses are divided into a plurality of groups and the information processing apparatuses in each group are interconnected, the means for connecting the groups has an obstacle. , You will not be able to report failures from one group to another,
Since a group other than the group of information processing apparatuses in which a failure has occurred cannot detect that a failure has occurred in the system, the availability as a system cannot be guaranteed.

【0006】この問題点を防ぐ方法として、全ての情報
処理装置を相互に接続するという方法もあるが、上述し
たように、多数の情報処理装置からなるシステムの場合
には、コストが非常に高くなってしまうことや、接続方
式が非常に複雑になってしまうという問題があり、現実
的な解ではなかった(すなわち実際上採用することは困
難である)。
As a method of preventing this problem, there is a method of interconnecting all information processing devices. However, as described above, in the case of a system including a large number of information processing devices, the cost is extremely high. However, this method is not a practical solution (that is, it is difficult to actually use it).

【0007】また、1つのグループ内の情報処理装置を
全て相互に接続する必要があるため、1グループあたり
の情報処理装置数の上限など、情報処理装置の接続方法
に制約があり、構成の変化に対して柔軟に対応できな
い、という別の問題点も有している。
Further, since it is necessary to connect all the information processing devices in one group to each other, the connection method of the information processing devices is restricted, such as the upper limit of the number of information processing devices per group, and the configuration changes. There is another problem that it is not possible to respond flexibly to

【0008】したがって、本発明は、上記問題点に鑑み
てなされたものであって、その目的は、上記問題点を解
消し、多数の情報処理装置からなる大規模なシステムに
おいて、全ての情報処理装置において必ず試験診断を実
行することにより速やかに障害の検出を行うと共に、障
害によりシステム内の情報処理装置が分断された場合で
あっても、分断されたそれぞれの情報処理装置の障害を
検出することができ、且つ性能低下を抑止し、高い可用
性をもったシステムを実現する障害検出方式を提供する
ことにある。
Accordingly, the present invention has been made in view of the above-mentioned problems, and an object of the present invention is to solve the above-mentioned problems and to provide a large-scale system including a large number of information processing apparatuses, in which all information processing is performed. A failure is quickly detected by always performing a test diagnosis in the device, and even when the information processing device in the system is disconnected due to the failure, the failure of each of the divided information processing devices is detected. It is an object of the present invention to provide a failure detection method capable of realizing a system having high availability, capable of suppressing performance degradation and realizing high availability.

【0009】本発明の他の目的は、隣接する情報処理装
置のみを接続する方式をとることにより、情報処理装置
の数などの構成の変化に柔軟なシステムを実現可能とし
た障害検出方式を提供することにある。
Another object of the present invention is to provide a failure detection method which can realize a system which is flexible to changes in the configuration such as the number of information processing devices by adopting a method of connecting only adjacent information processing devices. Is to do.

【0010】[0010]

【課題を解決するための手段】前記目的を達成するた
め、本発明の障害検出方式は、複数の情報処理装置を含
むシステムにおいて、各情報処理装置が、自情報処理装
置の試験診断を実行する手段と、前記自情報処理装置の
試験診断の実行結果を報告する手段と、他の情報処理装
置に試験診断の実行を指示する手段と、前記他情報処理
装置における試験診断の実行の結果を監視する手段と、
前記自情報処理装置における試験診断の実行の時間間隔
を監視する手段と、自装置において試験診断実行中
ときに、他の情報処理装置から試験診断の実行の指示
受けた場合、新たに他の情報処理装置に対する試験診断
の実行を指示することなく、現在実行中の前記試験診断
へ集約する手段と、を含むことを特徴とする。
In order to achieve the above object, according to the fault detection method of the present invention, in a system including a plurality of information processing apparatuses, each information processing apparatus executes a test diagnosis of its own information processing apparatus. Means, means for reporting the result of execution of the test diagnosis of the own information processing apparatus, means for instructing another information processing apparatus to execute the test diagnosis, and monitoring of the result of execution of the test diagnosis in the other information processing apparatus Means to
Means for monitoring the time interval of the execution of the test diagnosis in its own information processing apparatus, a running test diagnostic in its own device
Sometimes, an instruction to execute a test diagnosis from another information processing device is issued .
If received, without newly instructing execution of a test diagnostics for the other information processing apparatus, characterized by comprising means for aggregating the said test diagnosis currently running, a.

【0011】本発明の障害検出方式においては、複数の
情報処理装置を含むシステムの障害検出方式において、
ある情報処理装置から試験診断の実行の指示を受けた他
の情報処理装置は、自装置の試験診断を実行し試験診断
結果を前記試験診断の実行の指示を発行した前記情報処
理装置に返却し、前記試験診断の実行の指示を発行した
前記情報処理装置は、前記他の情報処理装置からの試験
診断結果の報告を受け、該報告の内容が異常である場
合、もしくは所定の監視時間内に前記他の情報処理装置
から試験診断結果の報告を受け取らない場合には、前記
他の情報処理装置は障害と判断し、障害と判断された前
記情報処理装置以外の他の情報処理装置に対して試験診
断の実行の指示を送出し、一方、前記他の情報処理装置
から前記監視時間内に受け取った試験診断結果の報告の
内容が正常である場合には、試験診断が正常に巡回して
いるものと判断して次の試験診断の実行の待ち状態とな
り、前記各情報処理装置は、自装置において一定時間試
験診断が実行されていないことを検出した場合に、自動
的に自装置の試験診断の実行を開始し、更に、前記各情
報処理装置は、自装置の試験診断の実行中に、更に別に
試験診断の実行指示を受けた場合、これら複数の試験診
断を、現在実行中の一つの試験診断に集約する、ことを
特徴とする。
In the fault detection method according to the present invention, the fault detection method for a system including a plurality of information processing devices includes:
The other information processing apparatus that has received the instruction to execute the test diagnosis from the information processing apparatus executes the test diagnosis of the own apparatus, and returns the test diagnosis result to the information processing apparatus that has issued the instruction to execute the test diagnosis. The information processing apparatus that has issued the instruction to execute the test diagnosis receives a report of the test diagnosis result from the other information processing apparatus, and when the content of the report is abnormal, or within a predetermined monitoring time. When not receiving the report of the test diagnosis result from the other information processing apparatus, the other information processing apparatus determines that the failure, and the other information processing apparatus other than the information processing apparatus determined to be a failure, When the instruction to execute the test diagnosis is sent, and the content of the report of the test diagnosis result received within the monitoring time from the other information processing device is normal, the test diagnosis has been normally performed. Judge It becomes a waiting state for the execution of the test diagnosis of, each of the information processing apparatuses, when detecting that the test diagnosis has not been performed for a certain period of time in its own device, automatically starts the execution of the test diagnosis of its own device, Further, each of the information processing devices, during the execution of the test diagnosis of the own device, when further receiving an instruction to execute a test diagnosis, collects these plurality of test diagnoses into one test diagnosis currently being executed, It is characterized by the following.

【0012】[発明の概要]本発明において、情報処理
装置は、他の情報処理装置から診断の実行を指示受ける
ことにより試験診断を行い、試験診断を行ったら指示を
受けた情報処理装置に試験診断実行結果を返し、試験診
断の実行指示を行った情報処理装置以外の他の情報処理
装置に対して、試験診断の実行を指示する。そして、他
の情報処理装置に対して、試験診断実行を指示した情報
処理装置は、上記他の情報処理装置の試験診断の実行結
果を監視する。
[Summary of the Invention] In the present invention, an information processing apparatus performs a test diagnosis by receiving an instruction to execute a diagnosis from another information processing apparatus, and performs a test diagnosis upon performing the test diagnosis. The diagnostic execution result is returned, and the information processing apparatus other than the information processing apparatus that instructed the execution of the test diagnosis is instructed to execute the test diagnosis. Then, the information processing apparatus that instructed the other information processing apparatus to execute the test diagnosis monitors the execution result of the test diagnosis of the other information processing apparatus.

【0013】また、情報処理装置は、一定時間試験診断
が実行されていないことを検出したら、自動的に自己の
試験診断の実行を開始する。
When the information processing apparatus detects that the test diagnosis has not been executed for a certain period of time, it automatically starts executing its own test diagnosis.

【0014】そして、情報処理装置が、自己の試験診断
の実行中に、試験診断の実行指示を受けた場合、すなわ
ち、一つの情報処理装置に対して、複数の試験診断の指
示が重なった場合、後から指示された試験診断に対して
は、連鎖的に他の情報処理装置に対する試験診断の開始
を指示することは行わず、これにより、複数の試験診断
を一つに集約する。
When the information processing apparatus receives a test diagnosis execution instruction while executing its own test diagnosis, that is, when a plurality of test diagnosis instructions are overlapped for one information processing apparatus. For the test diagnosis specified later, the start of the test diagnosis for another information processing apparatus is not instructed in a chain, whereby a plurality of test diagnoses are integrated into one.

【0015】[0015]

【発明の実施の形態】次に本発明の実施の形態について
図面を参照して詳細に説明する。
Embodiments of the present invention will now be described in detail with reference to the drawings.

【0016】図1は、本発明の実施の形態の構成を示す
ブロック図である。図1を参照すると、本発明の第1の
実施の形態は、複数(n台)の情報処理装置1−1、1
−2…、1−nから構成されている。
FIG. 1 is a block diagram showing a configuration of an embodiment of the present invention. Referring to FIG. 1, a first embodiment of the present invention includes a plurality of (n) information processing apparatuses 1-1, 1-1.
-2 ..., 1-n.

【0017】図1を参照して、各情報処理装置1−1、
…、1−nは、いずれも、他の情報処理装置との通信を
行う通信制御手段11と、自情報処理装置が正常に動作
することを確認する試験診断制御手段12と、自情報処
理装置において試験診断が実行された時間間隔を監視す
る試験診断実行間隔監視手段13と、を備えている。
Referring to FIG. 1, each information processing apparatus 1-1,
.., 1-n are communication control means 11 for communicating with another information processing apparatus, test diagnosis control means 12 for confirming that the information processing apparatus operates normally, and And a test diagnosis execution interval monitoring means 13 for monitoring a time interval at which the test diagnosis is executed.

【0018】図2は、図1に示した通信制御手段11の
構成を示すブロック図である。図2を参照すると、通信
制御手段11は、指示受信手段111と、試験起動手段
112と、終了報告送信手段113と、指示送信手段1
14と、終了報告監視手段115と、を備えている。
FIG. 2 is a block diagram showing the configuration of the communication control means 11 shown in FIG. Referring to FIG. 2, the communication control unit 11 includes an instruction receiving unit 111, a test activation unit 112, an end report transmitting unit 113, and an instruction transmitting unit 1.
14 and an end report monitoring means 115.

【0019】指示受信手段111は、他の情報処理装置
から送られてくる試験診断実行指示の受け付けを行う。
The instruction receiving unit 111 receives a test diagnosis execution instruction sent from another information processing apparatus.

【0020】試験診断起動手段112は、指示受信手段
111が試験診断実行指示を受け付けると、試験診断制
御手段12の起動を行う。
The test diagnosis starting means 112 starts the test diagnosis control means 12 when the instruction receiving means 111 receives a test diagnosis execution instruction.

【0021】終了報告手段113は、試験診断制御手段
12による試験診断の実行結果の報告を、試験診断の実
行指示を発した情報処理装置に対して行う。
The end report means 113 reports the execution result of the test diagnosis by the test diagnosis control means 12 to the information processing apparatus which has issued the test diagnosis execution instruction.

【0022】指示送信手段114は、自情報処理装置の
試験診断の実行が終了した後に、適切なアルゴリズムに
従って全情報処理装置に対して試験診断が実行されるよ
うに、試験診断の指示を受けた情報処理装置以外の情報
処理装置に対して、試験診断の実行を指示する。
After the execution of the test diagnosis of the own information processing apparatus, the instruction transmitting means 114 receives the instruction of the test diagnosis so that the test diagnosis is executed for all the information processing apparatuses according to an appropriate algorithm. An information processing apparatus other than the information processing apparatus is instructed to execute a test diagnosis.

【0023】終了報告監視手段115は、試験診断の実
行を指示した先の情報処理装置の報告を待ち合わせ、報
告の内容が正常終了であれば、試験診断が正常に巡回し
ているものと判断し、以後、指示受信手段111により
新たな試験診断の指示を待つ。一方、報告の内容が異常
終了あるいは一定時間内に報告がない場合には、試験実
行指示先の情報処理装置は障害状態であるものと判断
し、試験診断の巡回を継続させるために、別の情報処理
装置に対して、試験診断の実行の指示を新たに行う。
The end report monitoring means 115 waits for a report from the information processing apparatus to which the execution of the test diagnosis has been instructed. If the contents of the report are normally completed, it is determined that the test diagnosis is circulating normally. Thereafter, the instruction receiving means 111 waits for a new test diagnosis instruction. On the other hand, if the content of the report is abnormally terminated or is not reported within a certain period of time, the information processing apparatus of the test execution instruction destination is determined to be in a failure state, and another A new instruction to execute a test diagnosis is issued to the information processing apparatus.

【0024】図3は、図1に示した試験診断制御手段1
2の構成を示すブロック図である。図3を参照すると、
試験診断制御手段12は、現在自情報処理装置において
試験診断を行うか否かの判定を行う試験診断判定手段1
21と、現在自情報処理装置において試験が行われてい
るかどうかを記憶している診断実行中フラグ122と、
実際に自情報処理装置の試験診断を実行する試験診断実
行手段123と、を備えている。
FIG. 3 shows the test / diagnosis control means 1 shown in FIG.
2 is a block diagram showing a configuration of FIG. Referring to FIG.
The test diagnosis control unit 12 is a test diagnosis determination unit 1 that determines whether a test diagnosis is currently performed in the information processing apparatus itself.
21; a diagnostic execution flag 122 that stores whether a test is currently being performed in the information processing apparatus;
Test diagnosis execution means 123 for actually executing a test diagnosis of the information processing apparatus.

【0025】図4は、図1に示した試験診断実行間隔監
視手段13の構成を示すブロック図である。図4を参照
すると、試験診断実行間隔監視手段13は、最後に自情
報処理装置において試験診断が実行された時間(時刻)
を記憶している試験時間記憶手段131と、現在の時間
(時刻)と試験時間記憶手段131に記憶されている時
間(時刻)の差から、自情報処理装置において一定時間
試験診断が実行されていないことを検出する時間間隔監
視手段132と、を備えている。
FIG. 4 is a block diagram showing the configuration of the test diagnosis execution interval monitoring means 13 shown in FIG. Referring to FIG. 4, the test diagnosis execution interval monitoring unit 13 determines the time (time) when the test diagnosis was last executed in the information processing apparatus.
And the difference between the current time (time) and the time (time) stored in the test time storage means 131, the test diagnosis is executed in the information processing apparatus for a certain period of time. And a time interval monitoring means 132 for detecting the absence.

【0026】次に本発明の実施の形態の動作について説
明する。図5乃至図7は、本発明の実施の形態の動作を
説明するための流れ図である。
Next, the operation of the embodiment of the present invention will be described. 5 to 7 are flowcharts for explaining the operation of the embodiment of the present invention.

【0027】まず、図1乃至図5の流れ図を参照して、
一つの情報処理装置から他の情報処理装置への試験診断
の実行の指示について説明する。本発明の実施の形態の
障害検出方式においては、情報処理装置は、論理的に接
続されている情報処理装置間に通信制御手段11を用い
て、試験診断実行を指示し(ステップA1)、終了報告
監視手段115において、試験診断実行が指示された情
報処理装置からの終了報告が一定時間(監視時間)内に
受信されることを待ち合わせる(ステップA2およびス
テップA3)。
First, referring to the flowcharts of FIGS. 1 to 5,
An instruction for executing a test diagnosis from one information processing apparatus to another information processing apparatus will be described. In the fault detection method according to the embodiment of the present invention, the information processing apparatus instructs the execution of the test diagnosis using the communication control means 11 between the logically connected information processing apparatuses (step A1), and ends. The report monitoring means 115 waits for an end report from the information processing apparatus instructed to execute the test diagnosis to be received within a predetermined time (monitoring time) (steps A2 and A3).

【0028】そして、試験診断の終了報告を受信した場
合(ステップA2のNo分岐)、情報処理装置は、試験
診断の実行が指示された情報処理装置から異常終了の報
告が送信されているか否かを判定し(ステップA4)、
異常終了の場合(ステップA4のYes分岐)、または
一定時間(監視時間)内に終了報告が行われなかった場
合(ステップA3のNo分岐)には、試験診断が指示さ
れた情報処理装置が障害状態にあるものと判断し、障害
状態になった情報処理装置以外の情報処理装置に対し
て、試験診断の実行を指示する(ステップA6)。
When the test diagnosis end report is received (No branch of step A2), the information processing apparatus determines whether the information processing apparatus instructed to execute the test diagnosis has transmitted an abnormal end report. Is determined (step A4),
In the case of abnormal termination (Yes branch of step A4), or when no termination report has been made within a certain period of time (monitoring time) (No branch of step A3), the information processing apparatus for which test diagnosis has been instructed fails. It is determined that the information processing apparatus is in the state, and the information processing apparatus other than the information processing apparatus in the failure state is instructed to execute the test diagnosis (step A6).

【0029】試験診断が指示された情報処理装置から、
一定時間内に正常終了の終了報告が行われた場合(ステ
ップA4のNo分岐)には、情報処理装置(指示を出し
た情報処理装置)は、通信制御手段11の指示受信手段
111によって、次の試験診断実行の指示を待ち合わせ
る(ステップA5)。
From the information processing apparatus instructed for test diagnosis,
If the end report of the normal end is made within a certain period of time (No branch of step A4), the information processing apparatus (the information processing apparatus which has issued the instruction) transmits the next information by the instruction receiving means 111 of the communication control means 11. Wait for an instruction to execute the test diagnosis (step A5).

【0030】次に、図1乃至図4、及び図6を参照し
て、他の情報処理装置から試験診断の実行を指示された
情報処理装置の動作について説明する。
Next, with reference to FIGS. 1 to 4 and 6, the operation of the information processing apparatus instructed by another information processing apparatus to execute a test diagnosis will be described.

【0031】試験診断の実行を指示された情報処理装置
は、通信制御手段11の指示受信手段111により指示
を受信し(ステップB1)、診断起動手段112によ
り、試験診断制御手段12を起動する。
The information processing apparatus instructed to execute the test diagnosis receives the instruction by the instruction receiving means 111 of the communication control means 11 (step B1), and activates the test diagnosis control means 12 by the diagnosis activation means 112.

【0032】試験診断制御手段12が起動されると、試
験診断判定手段121は、診断実行中フラグ122を参
照し(ステップB2)、自情報処理装置において試験診
断が実行中状態であれば(ステップB2のYes分
岐)、その終了を待ち合わせ(ステップB10)、当該
試験診断の実行結果を、通信制御手段11を用いて、試
験診断の実行指示を行った情報処理装置に対して報告す
る(ステップB11)。
When the test diagnosis control means 12 is started, the test diagnosis determination means 121 refers to the diagnosis execution flag 122 (step B2), and if the test diagnosis is being executed in its own information processing apparatus (step B2). (Yes branch of B2), waits for the end (step B10), and reports the execution result of the test diagnosis to the information processing apparatus which has instructed the execution of the test diagnosis using the communication control unit 11 (step B11). ).

【0033】試験診断が実行中でなかった場合には(ス
テップB2のNo分岐)、診断実行中フラグ122を診
断実行中状態に変更し(ステップB3)、試験診断実行
手段123により自情報処理装置の試験診断の実行を開
始する(ステップB4)。
If the test diagnosis is not being executed (No branch of step B2), the diagnosis executing flag 122 is changed to the diagnosis executing state (step B3), Of the test diagnosis is started (step B4).

【0034】試験診断の実行が終了すると、試験診断が
終了した時間を、時間間隔監視手段13の試験時間記憶
手段131に記憶し(ステップB5)、試験診断実行手
段12の診断実行中フラグ122を、診断実行中でない
状態に変更し(ステップB6)、通信制御手段13の終
了報告送信手段113により、試験診断実行の指示を行
った情報処理装置に対して、試験診断の実行結果の報告
を行う(ステップB7)。
When the execution of the test diagnosis is completed, the time when the test diagnosis is completed is stored in the test time storage means 131 of the time interval monitoring means 13 (step B5), and the diagnosis execution flag 122 of the test diagnosis execution means 12 is set. Then, the state is changed to a state in which the diagnosis is not being executed (step B6), and the end report transmitting unit 113 of the communication control unit 13 reports the execution result of the test diagnosis to the information processing apparatus which has instructed the execution of the test diagnosis. (Step B7).

【0035】試験診断の実行結果が正常である場合は、
試験診断機能を、他の情報処理装置に巡回させるため
に、指示送信手段114を用いて、他の情報処理装置に
試験診断の実行を指示する(ステップB8およびステッ
プB9)。
If the result of the test diagnosis is normal,
In order to make the test diagnosis function circulate to another information processing apparatus, the instruction transmitting unit 114 is used to instruct another information processing apparatus to execute a test diagnosis (steps B8 and B9).

【0036】次に、図1乃至図4、及び図7を参照し
て、情報処理装置における試験診断実行処理間隔の監視
の動作について説明する。
Next, the operation of monitoring the test diagnosis execution processing interval in the information processing apparatus will be described with reference to FIGS.

【0037】各情報処理装置は、試験診断実行間隔監視
手段132を有し、試験時間記憶手段131の記録され
ている試験診断が最後に実行された時間と、現在時間と
の差から、自情報処理装置に一定時間内に、試験診断機
能が巡回してこなかったことを検出した場合(図7のス
テップC1のNo分岐)には、システム内の情報処理装
置間の接続が分断され、自情報処理装置を含む情報処理
装置群が孤立状態であるために、自情報処理装置に試験
診断機能が巡回して来ない可能性があるものと判断し、
自情報処理装置から隣合う情報処理装置に新たに試験診
断の実行を指示する(ステップC2)。
Each information processing apparatus has a test diagnosis execution interval monitoring means 132. The information processing apparatus uses its own information based on the difference between the time when the test diagnosis recorded in the test time storage means 131 was last executed and the current time. If it is detected that the test diagnosis function has not circulated to the processing device within a certain period of time (No branch of step C1 in FIG. 7), the connection between the information processing devices in the system is disconnected, and Since the information processing device group including the processing device is in an isolated state, it is determined that there is a possibility that the test diagnosis function may not be circulated to the own information processing device,
The own information processing apparatus instructs an adjacent information processing apparatus to newly execute a test diagnosis (step C2).

【0038】[0038]

【実施例】上記した本発明の実施の形態について具体例
を以て説明すべく、次に本発明の実施例について図面を
参照して詳細に説明する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS In order to explain the above-mentioned embodiment of the present invention with specific examples, embodiments of the present invention will be described in detail with reference to the drawings.

【0039】図8に示すように、図1の構成を持つ情報
処理装置が複数論理的に接続されており、ある情報処理
装置において試験診断が実行されている。なお、図8に
おいて、記号「○」は正常な情報処理装置、「J」は巡
回ジョブの存在する情報処理装置、網掛け部は巡回ジョ
ブの到達可能範囲を示し、また情報処理装置は隣接する
もの同士は接続されているものとする。
As shown in FIG. 8, a plurality of information processing apparatuses having the configuration of FIG. 1 are logically connected, and a test diagnosis is executed in a certain information processing apparatus. In FIG. 8, the symbol “は” indicates a normal information processing device, “J” indicates an information processing device in which a traveling job exists, a shaded portion indicates a reachable range of the traveling job, and the information processing devices are adjacent. The objects are assumed to be connected.

【0040】この試験診断が実行されている情報処理装
置に着目すると、この情報処理装置は自己の試験診断を
実行し、自身が正常であることを確認しており、自身が
正常であることを確認すると、論理的に隣合う情報処理
装置に試験診断の実行を指示し、実行を指示された情報
処理装置は自己の試験診断を実行し、正常であることを
確認すると、さらに論理的に隣合う情報処理装置に対し
て試験診断の実行を指示する。
Focusing on the information processing apparatus on which this test diagnosis is being executed, this information processing apparatus executes its own test diagnosis, confirms that it is normal, and confirms that it is normal. When confirmed, the logically adjacent information processing apparatus is instructed to execute the test diagnosis, and the information processing apparatus instructed to execute performs its own test diagnosis and confirms that it is normal. The execution of the test diagnosis is instructed to the matching information processing apparatus.

【0041】このようにして、図8に示すシステムにお
いては、全ての情報処理装置が全て正常に動作している
ために、情報処理装置間に連鎖的に試験診断が行われ、
全ての情報処理装置に対して試験診断を巡回させること
が可能である。なお、連鎖的に試験診断が行われる動作
を「巡回ジョブ」と呼ぶ。
As described above, in the system shown in FIG. 8, since all the information processing apparatuses are normally operating, test diagnosis is performed in a chain between the information processing apparatuses.
It is possible to make all information processing apparatuses repeat the test diagnosis. An operation in which test diagnosis is performed in a chain is called a “tour job”.

【0042】ある時点で、図9に示すように、いくつか
の情報処理装置において、例えば電源障害が発生し(記
号「X」で障害が発生し通信不可能な情報処理装置を表
している、図9では、5つ)、システム内の通信経路が
遮断され、巡回ジョブが到達可能な(巡回ジョブが動作
する)情報処理装置群201と、そうでない情報処理装
置群202とに分断されたとする。
At some point, as shown in FIG. 9, in some of the information processing apparatuses, for example, a power failure occurs (the symbol “X” indicates a failure occurs and the information processing apparatus cannot communicate. In FIG. 9, it is assumed that the communication path in the system is interrupted, and the information processing apparatus group 201 to which the traveling job can reach (the traveling job operates) is separated from the information processing apparatus group 202 which is not. .

【0043】情報処理装置群201内には巡回ジョブが
存在し(図中Jで示す情報処理装置)、情報処理装置群
201内のそれぞれの情報処理装置には巡回ジョブが巡
回してくるため、各情報処理装置はシステム内に障害が
発生したことを検出でき、かつ情報処理装置群201の
新たな障害が発生すれば、これを検出することができ
る。
A traveling job exists in the information processing device group 201 (the information processing device indicated by J in the figure), and the traveling job travels to each information processing device in the information processing device group 201. Each information processing device can detect that a failure has occurred in the system, and if a new failure has occurred in the information processing device group 201, it can detect this.

【0044】一方、情報処理装置群202内には巡回ジ
ョブが存在していないため、情報処理装置群202内の
情報処理装置は、システム内に障害が発生したことを検
出できず、且つ、情報処理装置群201内の新たな障害
が発生しても、これを検出することはできない状態にあ
る。
On the other hand, since there is no traveling job in the information processing device group 202, the information processing devices in the information processing device group 202 cannot detect that a failure has occurred in the system, and Even if a new fault occurs in the processing device group 201, it cannot be detected.

【0045】本実施例では、システムがこの状態に遷移
すると、情報処理装置群202内には巡回ジョブが巡回
してこないため、情報処理装置群202内の情報処理装
置内の時間間隔監視手段13の試験時間記憶手段131
の内容が更新されない。
In this embodiment, when the system transits to this state, the traveling job does not circulate in the information processing apparatus group 202, and therefore the time interval monitoring means 13 in the information processing apparatus in the information processing apparatus group 202 does not circulate. Test time storage means 131
Is not updated.

【0046】この状態で一定時間が経過すると、時間間
隔監視手段132が自情報処理装置において、試験診断
が実行されていないことを検出し、自情報処理装置にお
いて試験診断の実行を開始し、再び、図10に示すよう
に、情報処理装置群202の全ての情報処理装置に対し
巡回ジョブが巡回する状態に復旧する。
When a certain time has elapsed in this state, the time interval monitoring means 132 detects that the test diagnosis has not been executed in the own information processing apparatus, starts execution of the test diagnosis in the own information processing apparatus, and again As shown in FIG. 10, the state is restored to a state where the traveling job circulates through all the information processing apparatuses of the information processing apparatus group 202.

【0047】図10の状態において、何らかの要因によ
り情報処理装置の障害が取り除かれると、図11に示す
ように、障害解消後、システム内において、複数の巡回
ジョブ(記号Jで示す)が存在することになる。
In the state of FIG. 10, if the failure of the information processing apparatus is removed for some reason, as shown in FIG. 11, after the failure is resolved, a plurality of traveling jobs (indicated by the symbol J) exist in the system. Will be.

【0048】このように、システム内に複数の巡回ジョ
ブが存在することになるが、有限の時間内には、ある情
報処理装置で試験診断が実行されているときに、その情
報処理装置に対して、試験診断の指示が行われ、この指
示は、試験診断判定手段121により自情報処理装置に
おいて試験実行中であるものと判断され、先に実行され
ていた試験診断の実行が終了するまで待ち合わせを行
い、先に実行されていた試験診断の結果を返す。
As described above, there are a plurality of traveling jobs in the system. When a test diagnosis is executed by a certain information processing apparatus within a finite time, the information processing apparatus Then, a test diagnosis instruction is given, and this instruction is judged by the test diagnosis determination means 121 to be a test being executed in the information processing apparatus itself, and waits until the execution of the test diagnosis previously executed is completed. And returns the result of the previously executed test diagnosis.

【0049】このことにより、複数の巡回ジョブがシス
テム内に複数存在しても、同じ場所に到達し得る巡回ジ
ョブは一つずつ消えて行き、最終的に、システム内に存
在する巡回ジョブの数は1に収束する。すなわち、図1
2に示すように、障害解消後、有限時間経過後には、あ
る情報処理装置において巡回ジョブ実行中に巡回ジョブ
が到着すると、当該ジョブは消去され、結局、システム
内には、一つは巡回ジョブ(図中Jで示す)が存在する
ことになる。
As a result, even if a plurality of traveling jobs exist in the system, the traveling jobs that can reach the same place disappear one by one, and finally the number of traveling jobs existing in the system is reduced. Converges to 1. That is, FIG.
As shown in FIG. 2, after a failure has been resolved and a finite time has elapsed, when a traveling job arrives during execution of a traveling job in a certain information processing apparatus, the job is deleted, and eventually, one traveling job is stored in the system. (Indicated by J in the figure).

【0050】このように、本実施例においては、障害に
よりシステム内の複数の情報処理装置がいくつかの群に
分断され、試験診断機能の巡回が行われなくなった場合
には、情報処理装置は自動的に新たな試験診断機能の巡
回を開始するため、分断されたそれぞれの群の情報処理
装置の障害を検出することができる。
As described above, in this embodiment, when a plurality of information processing devices in the system are divided into several groups due to a failure and the tour of the test and diagnosis function is not performed, the information processing devices are Since the tour of the new test / diagnosis function is automatically started, it is possible to detect a failure in each of the divided groups of information processing apparatuses.

【0051】また、本実施例においては、ある情報処理
装置において試験診断の実行指示を重複して受けた場
合、その情報処理装置において試験診断を一つに集約す
るようにしたことにより、システム内において情報処理
装置が複数の試験診断機能を実行することによる性能の
低下を回避している。
In this embodiment, when an instruction for executing a test diagnosis is received in a certain information processing apparatus in a duplicate manner, the test diagnosis is integrated into one information processing apparatus. In the above, the information processing apparatus avoids a decrease in performance due to executing a plurality of test diagnosis functions.

【0052】さらに、本実施例においては、システム内
のすべての情報処理装置同士が任意の数の情報処理装置
を経由して接続されていれば、巡回ジョブが連鎖的にシ
ステム内を巡回してゆくことにより、すべての情報処理
装置において試験診断を実行することができる、という
利点を有する。
Further, in this embodiment, if all the information processing devices in the system are connected to each other via an arbitrary number of information processing devices, the traveling job traverses the system in a chain. By doing so, there is an advantage that test diagnosis can be executed in all information processing apparatuses.

【0053】[0053]

【発明の効果】以上説明したように、本発明によれば、
下記記載の効果を奏する。
As described above, according to the present invention,
The following effects are obtained.

【0054】(1)本発明の第1の効果は、障害により
システム内の情報処理装置が分断された場合でも、分断
されたそれぞれの情報処理装置の障害を検出することが
できる、ということである。
(1) The first effect of the present invention is that, even when an information processing device in a system is disconnected due to a failure, a failure of each of the divided information processing devices can be detected. is there.

【0055】その理由は、本発明においては、システム
内が障害により分断されたことにより試験診断機能の巡
回が行われなくなった場合には、自動的に新たな試験診
断機能の巡回が開始される、ためである。
The reason is that, in the present invention, when the tour of the test / diagnosis function is not performed due to the disconnection of the system due to the failure, the tour of the new test / diagnosis function is automatically started. That's why.

【0056】(2)本発明の第2の効果は、システム内
において複数の試験診断機能の実行による性能の低下を
抑えることができる、ということである。
(2) A second effect of the present invention is that a decrease in performance due to execution of a plurality of test / diagnosis functions in the system can be suppressed.

【0057】その理由は、本発明においては、ある情報
処理装置において試験診断の実行指示を重複して受けた
場合、その情報処理装置において試験診断を一つに集約
するように構成されている、ことによる。
The reason for this is that, in the present invention, when an instruction to execute a test diagnosis is received in a certain information processing apparatus, the test diagnosis is integrated into one information processing apparatus. It depends.

【0058】(3)本発明の第3の効果は、すべての情
報処理装置同士が任意の数の情報処理装置を経由して接
続されていれば、すべての情報処理装置において試験診
断を実行することができる、ということである。
(3) The third effect of the present invention is that if all the information processing apparatuses are connected via an arbitrary number of information processing apparatuses, the test diagnosis is executed in all the information processing apparatuses. That you can do it.

【0059】その理由は、本発明においては、試験診断
機能の巡回は、情報処理装置を経由して連鎖的に行われ
る、ためである。
The reason is that in the present invention, the tour of the test / diagnosis function is performed in a chain via the information processing device.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施の形態の情報処理装置の構成及び
接続の様子を示すブロック図である。
FIG. 1 is a block diagram illustrating a configuration and a connection state of an information processing apparatus according to an embodiment of the present invention.

【図2】本発明の実施の形態における情報処理装置の通
信制御手段の構成を示すブロック図である。
FIG. 2 is a block diagram illustrating a configuration of a communication control unit of the information processing apparatus according to the embodiment of the present invention.

【図3】本発明の実施の形態における情報処理装置の試
験診断制御手段の構成を示すブロック図である。
FIG. 3 is a block diagram illustrating a configuration of a test and diagnosis control unit of the information processing apparatus according to the embodiment of the present invention.

【図4】本発明の実施の形態における情報処理装置の時
間間隔監視手段の構成を示すブロック図である。
FIG. 4 is a block diagram illustrating a configuration of a time interval monitoring unit of the information processing apparatus according to the embodiment of the present invention.

【図5】本発明の実施の形態における試験診断実行処理
の動作を説明するための処理フローチャートである。
FIG. 5 is a processing flowchart for describing an operation of a test diagnosis execution processing according to the embodiment of the present invention.

【図6】本発明の実施の形態における試験診断実行処理
の動作を説明するための処理フローチャートである。
FIG. 6 is a processing flowchart for describing an operation of a test diagnosis execution processing according to the embodiment of the present invention.

【図7】本発明の実施の形態における試験診断実行処理
間隔監視の動作を説明するためのフローチャートであ
る。
FIG. 7 is a flowchart illustrating an operation of monitoring a test diagnosis execution processing interval according to the embodiment of the present invention.

【図8】本発明の一実施例を説明するための図であり、
障害発生前の多数の情報処理装置からなるシステムを模
式的に示す図である。
FIG. 8 is a diagram for explaining one embodiment of the present invention;
FIG. 1 is a diagram schematically illustrating a system including a large number of information processing apparatuses before a failure occurs.

【図9】本発明の一実施例を説明するための図であり、
障害発生後の多数の情報処理装置からなるシステムを模
式的に示す図である。
FIG. 9 is a diagram for explaining one embodiment of the present invention;
FIG. 1 is a diagram schematically illustrating a system including a number of information processing devices after a failure has occurred.

【図10】本発明の一実施例を説明するための図であ
り、障害発生後、一定時間経過後の多数の情報処理装置
からなるシステムを模式的に示す図である。
FIG. 10 is a diagram for explaining an embodiment of the present invention, and is a diagram schematically illustrating a system including a large number of information processing devices after a certain time has elapsed after a failure has occurred.

【図11】本発明の一実施例を説明するための図であ
り、障害解消直後の多数の情報処理装置からなるシステ
ムを模式的に示す図である。
FIG. 11 is a diagram for explaining an embodiment of the present invention, and is a diagram schematically illustrating a system including a large number of information processing apparatuses immediately after a failure is solved.

【図12】本発明の一実施例を説明するための図であ
り、障害解消後一定時間経過後の多数の情報処理装置か
らなるシステムを模式的に示す図である。
FIG. 12 is a diagram for explaining an embodiment of the present invention, and is a diagram schematically illustrating a system including a large number of information processing apparatuses after a lapse of a predetermined time after a failure is solved;

【符号の説明】[Explanation of symbols]

1−1〜1−n 情報処理装置(プロセッサ) 11 通信制御手段 12 試験診断制御手段 13 時間間隔監視手段 111 指示受信手段 112 診断起動手段 113 終了報告送信手段 114 指示送信手段 115 終了報告監視手段 121 試験診断判定手段 122 診断実行中フラグ 123 試験診断実行手段 131 試験時間記憶手段 132 時間間隔監視手段 J 巡回ジョブの存在する情報処理装置 X 障害が発生し通信不能な情報処理装置 1-1 to 1-n Information processing device (processor) 11 Communication control means 12 Test / diagnosis control means 13 Time interval monitoring means 111 Instruction receiving means 112 Diagnosis activation means 113 End report transmission means 114 Instruction transmission means 115 Termination report monitoring means 121 Test diagnosis determination means 122 Diagnosis execution flag 123 Test diagnosis execution means 131 Test time storage means 132 Time interval monitoring means J Information processing device in which traveling job exists X Information processing device in which failure has occurred and communication is disabled

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 11/22 - 11/34 G06F 15/16 - 15/177 ──────────────────────────────────────────────────続 き Continued on the front page (58) Field surveyed (Int.Cl. 7 , DB name) G06F 11/22-11/34 G06F 15/16-15/177

Claims (5)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】複数の情報処理装置を含むシステムにおい
て、 各情報処理装置が、 自情報処理装置の試験診断を実行する手段と、 前記自情報処理装置の試験診断の実行結果を報告する手
段と、 他の情報処理装置に試験診断の実行を指示する手段と、 前記他情報処理装置における試験診断の実行の結果を
監視する手段と、 前記自情報処理装置における試験診断の実行の時間間隔
を監視する手段と、自装置において 試験診断実行中のときに、他の情報処
理装置から試験診断の実行の指示を受けた場合、新たに
他の情報処理装置に対する試験診断の実行を指示するこ
となく、現在実行中の前記試験診断へ集約する手段と、 を含むことを特徴とする障害検出方式。
1. A system including a plurality of information processing apparatuses, wherein each information processing apparatus executes a test diagnosis of its own information processing apparatus, and a means for reporting an execution result of the test diagnosis of its own information processing apparatus. and means for instructing the execution of the test diagnostics to another information processing apparatus, and means for monitoring the results of the execution of the test diagnosis in the other information processing apparatus, the time interval of the execution of the test diagnosis in its own information processing apparatus Means for monitoring , and other information processing while the test diagnosis is being executed in the own device.
When an instruction to execute a test diagnosis is received from a management device , a new instruction to execute a test diagnosis for another information processing device may be issued .
And without fault detection system which comprises means for aggregating the said test diagnosis currently running, a.
【請求項2】複数の情報処理装置を含むシステムの障害
検出方式において、 ある情報処理装置から試験診断の実行の指示を受けた他
の情報処理装置は、自装置の試験診断を実行し試験診断
結果を前記試験診断の実行の指示を発行した前記情報処
理装置に返却し、 前記試験診断の実行の指示を発行した前記情報処理装置
は、前記他の情報処理装置からの試験診断結果の報告を
受け、該報告の内容が異常である場合、もしくは所定の
監視時間内に前記他の情報処理装置から試験診断結果の
報告を受け取らない場合には、前記他の情報処理装置は
障害と判断し、障害と判断された前記情報処理装置以外
の他の情報処理装置に対して試験診断の実行の指示を送
出し、一方、前記他の情報処理装置から前記監視時間内
に受け取った試験診断結果の報告の内容が正常である場
合には、試験診断が正常に巡回しているものと判断して
次の試験診断の実行の待ち状態となり、 前記各情報処理装置は、自装置において一定時間試験診
断が実行されていないことを検出した場合に、自動的に
自装置の試験診断の実行を開始し、 更に、 前記各情報処理装置は、自装置の試験診断の実行中に、
更に別に試験診断の実行指示を受けた場合、これら複数
の試験診断を、現在実行中の一つの試験診断に集約す
る、 ことを特徴とする障害検出方式。
2. A method for detecting a failure in a system including a plurality of information processing apparatuses, wherein another information processing apparatus which receives an instruction to execute a test diagnosis from a certain information processing apparatus executes the test diagnosis of its own apparatus and executes the test diagnosis. The result is returned to the information processing apparatus that has issued the instruction to execute the test diagnosis, and the information processing apparatus that has issued the instruction to execute the test diagnosis transmits a report of the test diagnosis result from the other information processing apparatus. Received, if the content of the report is abnormal, or if the report of the test diagnosis result is not received from the other information processing device within a predetermined monitoring time, the other information processing device determines that there is a failure, An instruction to execute a test diagnosis is sent to another information processing device other than the information processing device determined to be a failure, and a report of a test diagnosis result received within the monitoring time from the other information processing device is sent. If the contents are normal, it is determined that the test diagnosis is circulating normally, and the system enters a wait state for the execution of the next test diagnosis. If it is detected that it has not been performed, automatically starts the execution of the test diagnosis of its own device, further, each of the information processing devices, during the execution of the test diagnosis of its own device,
In addition, when a test diagnosis execution instruction is received, the plurality of test diagnoses are combined into one test diagnosis currently being executed.
【請求項3】前記試験診断の実行が指示された情報処理
装置は、前記試験診断の実行の指示を受け、自装置にお
いて現在試験診断が実行中であるか否かを判定し、実行
中でなければ、自装置の試験診断を実行後、試験診断結
果の報告を前記試験診断の実行の指示を送出した前記情
報処理装置に返却し、試験診断結果が正常の場合には、
前記試験診断の実行の指示を行った情報処理装置以外の
他の情報処理装置に試験診断の実行の指示を送出し、 一方、実行中であれば、実行中の試験診断の終了の後
に、試験診断結果の報告を前記試験診断の実行の指示を
送出した前記情報処理装置に返却し、且つ前記試験診断
実行中に到来した試験診断の指示は消去する、 ことを特徴とする請求項2記載の障害検出方式。
3. The information processing apparatus instructed to execute the test diagnosis receives the instruction to execute the test diagnosis, determines whether the test diagnosis is currently being executed in its own apparatus, If not, after performing the test diagnosis of the own device, return the report of the test diagnosis result to the information processing device that has sent the instruction to execute the test diagnosis, if the test diagnosis result is normal,
An instruction to execute the test diagnosis is sent to another information processing apparatus other than the information processing apparatus that has issued the instruction to execute the test diagnosis. On the other hand, if the test diagnosis is being executed, the test is performed after the end of the test diagnosis being executed. The method according to claim 2, wherein a report of the diagnosis result is returned to the information processing apparatus that has transmitted the instruction for executing the test diagnosis, and the instruction for the test diagnosis that has arrived during the execution of the test diagnosis is deleted. Failure detection method.
【請求項4】前記情報処理装置が前回の試験診断を実行
した時間と現在の時間とを定期的に照合し、あらかじめ
定めた一定時間以内に試験診断が行われていない場合に
は、自装置に対して試験診断の実行の指示を行う、こと
を特徴とする請求項2又は3記載の障害検出方式。
4. The apparatus according to claim 1, wherein a time at which the information processing apparatus performed the previous test diagnosis is periodically compared with a current time. 4. The fault detection method according to claim 2, wherein an instruction to execute a test diagnosis is issued to the system.
【請求項5】複数の情報処理装置を含むシステムの障害
検出方式において、 前記各情報処理装置が、自装置の試験診断を実行を制御
する試験診断制御手段と、 自装置の試験診断の実行結果を他の情報処理装置に報告
し、他の情報処理装置に試験診断の実行を指示し、更
に、他の情報処理装置における試験診断の実行の結果を
監視する通信制御手段と、 自装置における試験診断の実行の時間間隔を監視する時
間間隔監視手段と、 を備え、 前記試験診断制御手段は、自装置において現在試験診断
実行中における他の情報処理装置からの試験診断の実行
の指示に対しては、新たに他の情報処理装置に対する試
験診断の実行を指示することなく、前記現在実行中の試
験診断へ集約する、ことを特徴とする障害検出方式。
5. A failure detection method for a system including a plurality of information processing apparatuses, wherein each of the information processing apparatuses controls execution of a test diagnosis of the own apparatus, and an execution result of the test diagnosis of the own apparatus. To another information processing device, instruct the other information processing device to execute a test diagnosis, and further monitor the result of the test diagnosis execution in the other information processing device; A time interval monitoring unit that monitors a time interval of execution of the diagnosis, wherein the test diagnosis control unit responds to a test diagnosis execution instruction from another information processing apparatus that is currently executing the test diagnosis in the own device. Is a method for collecting the currently executed test diagnosis without instructing another information processing apparatus to execute the test diagnosis.
JP09651397A 1997-03-31 1997-03-31 Failure detection method in a system composed of many information processing devices Expired - Fee Related JP3147811B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP09651397A JP3147811B2 (en) 1997-03-31 1997-03-31 Failure detection method in a system composed of many information processing devices

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP09651397A JP3147811B2 (en) 1997-03-31 1997-03-31 Failure detection method in a system composed of many information processing devices

Publications (2)

Publication Number Publication Date
JPH10283216A JPH10283216A (en) 1998-10-23
JP3147811B2 true JP3147811B2 (en) 2001-03-19

Family

ID=14167224

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09651397A Expired - Fee Related JP3147811B2 (en) 1997-03-31 1997-03-31 Failure detection method in a system composed of many information processing devices

Country Status (1)

Country Link
JP (1) JP3147811B2 (en)

Also Published As

Publication number Publication date
JPH10283216A (en) 1998-10-23

Similar Documents

Publication Publication Date Title
US5287461A (en) Method and apparatus for remotely accessing a plurality of server consoles
US5774640A (en) Method and apparatus for providing a fault tolerant network interface controller
US7801984B2 (en) Diagnostic/remote monitoring by email
US20040001449A1 (en) System and method for supporting automatic protection switching between multiple node pairs using common agent architecture
WO2004031979A2 (en) Method of solving a split-brain condition
WO1999041889A1 (en) Method and apparatus for testing network, and recording medium
JP3147811B2 (en) Failure detection method in a system composed of many information processing devices
JP3779121B2 (en) Data transmission system
JPH0983516A (en) Network fault diagnostic device
Cisco Hardware Troubleshooting
Cisco Hardware Troubleshooting
Cisco Hardware Troubleshooting
Cisco Hardware Troubleshooting
Cisco Hardware Troubleshooting
Cisco Hardware Troubleshooting
JP3356809B2 (en) LAN fault monitoring apparatus, LAN fault monitoring system, and logging data collection method therefor
JP2501335B2 (en) Gateway backup method
JP3317278B2 (en) FDDI fault monitoring method, FDDI fault monitoring device, recording medium storing program, and network system
JP2555214B2 (en) Control method of device suspected of failure
JPH10105498A (en) Network system, communication server change-over method and storage medium storaging change-over program for communication server
JPH02310755A (en) Health check system
JP3082704B2 (en) Communication device management method
JP3740198B2 (en) Implementation method of operation command processing mechanism in distributed system
JP3012491B2 (en) Micro diagnostic method for duplexer
JP3084383B2 (en) Ring communication path failure processing method

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20001212

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080112

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090112

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100112

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees