JP2005275438A - Automated equipment failure recovery system - Google Patents

Automated equipment failure recovery system Download PDF

Info

Publication number
JP2005275438A
JP2005275438A JP2004083280A JP2004083280A JP2005275438A JP 2005275438 A JP2005275438 A JP 2005275438A JP 2004083280 A JP2004083280 A JP 2004083280A JP 2004083280 A JP2004083280 A JP 2004083280A JP 2005275438 A JP2005275438 A JP 2005275438A
Authority
JP
Japan
Prior art keywords
terminal
failure
command
automated
automated device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004083280A
Other languages
Japanese (ja)
Inventor
Hiroyuki Fukai
浩之 深井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solution Innovators Ltd
Original Assignee
NEC Software Chubu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Software Chubu Ltd filed Critical NEC Software Chubu Ltd
Priority to JP2004083280A priority Critical patent/JP2005275438A/en
Publication of JP2005275438A publication Critical patent/JP2005275438A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide the failure recovery system of automated equipment for realizing the efficiency of processing, and for improving reliability. <P>SOLUTION: This host computer 100 is connected through a network to a terminal 130, and provided with an on-line processing system 102, an operation management system for receiving a console message and an automated equipment failure recovery system 110 for controlling the failure recovery of automated equipment. The management system 103 which has received a message outputted when any failure is generated in the terminal notifies the restoration system 110 of the failure information of the terminal, and the restoration system 110 which has received notification decides whether or not the terminal where the failure has been generated is automated equipment, and when the terminal is the automated equipment, automatically generates a command for carrying out the recovery processing of the automated equipment, and issues the command to the terminal 130. When the recovery processing fails, the processing is repeated, and when the number of times of repetition reaches the predetermined number of times, a start command is registered in a table 150. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、障害自動復旧技術に関し、特に、ネットワーク上に存在する自動化機器に対してセッション障害発生時に自動でセッションを再接続させる制御を行うことを可能としたシステム及び方法並びにプログラムに関する。   The present invention relates to an automatic failure recovery technology, and more particularly, to a system, method, and program capable of performing control for automatically reconnecting a session when a session failure occurs to an automated device existing on a network.

図3に、自動化機器を制御する従来のシステムの処理の典型的な一例を示す。図3を参照して、従来のシステムの処理手順を説明する。   FIG. 3 shows a typical example of processing of a conventional system for controlling an automated device. With reference to FIG. 3, the processing procedure of the conventional system will be described.

端末のセッション障害メッセージがコンソール(操作卓)に出力されることを、オペレータが監視(目視)する。コンソールに、コンソールメッセージ(B11)(端末障害メッセージ)が表示され(例えば”VISC39 端末=XXXXのオープン処理が異常終了しました”)、オペレータは、端末障害メッセージが出力されていることを検出した場合、オペレータは、当該障害端末が自動化機器か否かを、端末情報リスト(ホストで接続管理する端末構成情報の一覧)から判断し、オペレータは、コンソール(操作卓)から手動にて、オンライン処理システムVIS(Versatile Online System)に対するセッション接続コマンド(”CV SA TRM=XXXXX”)を入力する(B12)。   The operator monitors (visually) that the terminal session failure message is output to the console. When a console message (B11) (terminal failure message) is displayed on the console (for example, “VISC39 terminal = XXXX open processing ended abnormally”) and the operator detects that a terminal failure message has been output The operator determines from the terminal information list (list of terminal configuration information to be connected and managed by the host) whether or not the faulty terminal is an automated device, and the operator manually operates the online processing system from the console (operation console). A session connection command (“CV SA TRM = XXXX”) for VIS (Versatile Online System) is input (B12).

このコマンド入力を受けて、VISは、端末にセッション接続開始を指示する端末活性処理を行う(B14)。端末でのセッション接続開始が成功した場合には、コンソールメッセージ(B15)(「端末復旧メッセージ」ともいう、例えば”VISC31 端末=XXXXのセッション開始要求を受け付けました”)が表示される。端末でのセッション接続開始が失敗した場合、VISにより、セッション障害メッセージ(B11)がコンソールに表示出力される。   Upon receiving this command input, the VIS performs terminal activation processing for instructing the terminal to start session connection (B14). When the session connection start at the terminal is successful, a console message (B15) (also referred to as “terminal recovery message”, for example, “VISC31 terminal = XXX session start request accepted”) is displayed. When the session connection start at the terminal fails, the session failure message (B11) is displayed and output on the console by VIS.

なお、自動預金支払機(ATM)に代表される自動化機器の運用において、センタのホストコンピュータと自動化機器を結ぶ回線の障害時やホストコンピュータの障害時における自動化機器の運用方法として、ホストコンピュータの2重化やホストコンピュータと自動化機器を結ぶ回線の2重化を行わなくても、顧客への対応、サービスを優れたものとするようにした方法が知られている(例えば特許文献1参照)。以下の説明からも明らかとされるように、この従来のシステムと相違して、本発明は、自動化機器の障害を判別し、自動化機器の障害復旧用のコマンドを自動生成するものである。   In the operation of an automated device represented by an automatic deposit payment machine (ATM), as a method of operating the automated device in the event of a failure of a line connecting the host computer of the center and the automated device or a failure of the host computer, 2 of the host computer is used. There is known a method in which the response to the customer and the service are excellent without duplication or duplication of the line connecting the host computer and the automation device (see, for example, Patent Document 1). As will be apparent from the following description, unlike the conventional system, the present invention discriminates a failure of an automated device and automatically generates a failure recovery command for the automated device.

また、障害情報を通知する従来技術として、例えばデジタル無線網において、自局で検出した障害の種別ごとに予め定められる時間間隔で相手局への再接続のための手順を繰り返して行うような通信方法も知られている(例えば特許文献2参照)。   In addition, as a conventional technique for notifying failure information, for example, in a digital wireless network, communication in which a procedure for reconnection to a partner station is repeatedly performed at a predetermined time interval for each type of failure detected by the own station. A method is also known (see, for example, Patent Document 2).

さらに、オンライン処理システム(VIS)に関しては、稼動系及び待機系の複数のオンライン処理システム(VIS)を有するホットスタンバイ対応疎結合マルチホットスタンバイコンピュータシステムにおいて、オペレータコマンド振分手段からの送信要求コマンドの送信先VISの状態が、ホットスタンバイ中の送信コマンドを、オペレータコマンド送信要求保持テーブルに格納し、その後、送信先VISのホットスタンバイ終了が通知されると、オペレータコマンド送信要求保持テーブルにスタックされていた送信要求コマンドが読み出され、オペレータコマンド振分手段に再び投入され、これにより、送信先VISがホットスタンバイ中の送信コマンドを、ロストをなくすようにしたシステムが知られている(例えば特許文献3参照)。   Further, regarding the online processing system (VIS), in the hot standby compatible loosely coupled multi-hot standby computer system having a plurality of active and standby online processing systems (VIS), a transmission request command from the operator command distribution means When the destination VIS status is stored in the operator command transmission request holding table, the transmission command in the hot standby state is stored in the operator command transmission request holding table. There is known a system in which the transmission request command is read out and re-entered into the operator command distribution means, thereby eliminating the lost transmission command when the transmission destination VIS is in the hot standby (for example, Patent Documents). 3 participation ).

特許第2944138号公報(第2−3頁、第1図)Japanese Patent No. 2944138 (page 2-3, FIG. 1) 特開平5−37434号公報(第2−3頁、第1図、第3図)JP-A-5-37434 (page 2-3, FIGS. 1 and 3) 特開平5−265986号公報(第3頁、第1図)JP-A-5-265986 (page 3, FIG. 1)

ところで、図3を参照して説明した従来のシステムは、オペレータの作業負担の軽減が困難であり及び見落とし等の発生の可能性がある、という問題点を有している。その理由は、オペレータが常にコンソールを監視し、出力されるメッセージを監視しなければならず、このため、オペレータはコンソールから離れられず、また、コンソールメッセージを目視して監視するため、障害の見落としが発生する可能性もある。   By the way, the conventional system described with reference to FIG. 3 has a problem that it is difficult to reduce the work burden on the operator and there is a possibility of oversight. The reason is that the operator must always monitor the console and monitor the messages that are output, so that the operator cannot leave the console and visually monitors the console messages, thus overlooking faults. May occur.

また、従来のシステムは、即時性に欠ける、という問題点を有している。すなわち、従来のシステムにおいては、仮にメッセージを確認したとしても、その後、オペレータが端末情報リストを参照して、自動化機器か否かを判断し、オペレータが手動にてVISに対するセッション接続コマンドを入力する、という一連の作業が必要とされる。このため、障害発生を通知するコンソールメッセージの出力から復旧処理の開始まで、最短でも、1分程度の時間を要する。   Further, the conventional system has a problem that it lacks immediacy. That is, in the conventional system, even if the message is confirmed, the operator then refers to the terminal information list to determine whether the device is an automated device, and the operator manually inputs a session connection command for the VIS. A series of operations are required. For this reason, it takes about 1 minute at the minimum from the output of the console message notifying the occurrence of the failure to the start of the recovery process.

さらに、従来のシステムは、手動操作固有の人的エラーの発生の可能性がある、という問題点を有している。すなわち、オペレータによるVISに対するセッション接続コマンドの誤入力によるシステムの誤動作を発生させる可能性がある。   Further, the conventional system has a problem that a human error inherent in manual operation may occur. That is, the system may malfunction due to an erroneous input of a session connection command to the VIS by the operator.

これらの欠点を克服するために、先願(特願2003−014304号)が発明されるに至った。先願の発明は、自動化機器よりなる少なくとも1つの端末とネットワーク接続し、オンライン処理システムと、コンソールメッセージを受け取るオペレーション管理システムと、自動化機器の障害復旧を制御する自動化機器障害復旧システムとを含むホストコンピュータにおいて、前記端末での障害発生時に出力されるコンソールメッセージを受けたオペレーション管理システムは、自動化機器障害復旧システムに対して、端末の障害情報を通知し、障害情報の通知を受けた自動化機器障害復旧システムは、前記障害が発生した端末が自動化機器であるか否か判定し、前記端末が自動化機器である場合、前記自動化機器の復旧処理を行うためのコマンドを自動生成し、前記復旧処理を行うためのコマンドを端末向けに発行する制御を行うものである。また、先願の発明は、自動化機器障害復旧システムより復旧処理を行うためのコマンドが発行された端末において障害が復旧しない場合、ホストコンピュータは、最大、予め定められた回数分だけ、復旧処理の再試行を行うようになっている。   In order to overcome these drawbacks, a prior application (Japanese Patent Application No. 2003-014304) has been invented. The invention of the prior application is a host including an online processing system, an operation management system that receives a console message, and an automated equipment failure recovery system that controls failure recovery of the automated equipment, connected to at least one terminal made of automated equipment. In the computer, the operation management system that has received the console message that is output when a failure occurs in the terminal notifies the automation device failure recovery system of the failure information of the terminal and receives the failure information notification. The recovery system determines whether or not the terminal in which the failure has occurred is an automated device. If the terminal is an automated device, the recovery system automatically generates a command for performing a recovery process of the automated device, and performs the recovery process. Control to issue commands for terminal to terminal A. Further, in the invention of the prior application, when the failure is not recovered in the terminal to which the command for performing the recovery process is issued from the automation device failure recovery system, the host computer performs the recovery process for the predetermined number of times at the maximum. Try to retry.

先願の発明によれば、端末でのセッション接続の失敗による障害メッセージが出力されてから当該端末でセッション接続処理が完了するまでに、例えば数秒程度の時間しか要さない。また、先願の発明によれば、人手による監視方式による監視もれ等がなくなると共に、監視にかかる負荷(オペレータの作業負担)を軽減することができる。すなわち、先願の発明によれば、監視・障害復旧処理を効率化する、ことができる。さらに、先願の本発明によれば、セッション接続コマンドを発行する際のオペレータの誤入力によるシステムの誤作動を防止し、システムの信頼性を向上することができる。   According to the invention of the prior application, it takes only a few seconds, for example, until the session connection process is completed at the terminal after the failure message due to the session connection failure at the terminal is output. In addition, according to the invention of the prior application, there is no loss of monitoring by the manual monitoring method, and the monitoring load (operator workload) can be reduced. That is, according to the invention of the prior application, the monitoring / failure recovery processing can be made more efficient. Furthermore, according to the present invention of the prior application, it is possible to prevent malfunction of the system due to erroneous input by the operator when issuing the session connection command, and to improve the reliability of the system.

しかしながら、先願の発明は、復旧処理の再試行において、予め定められた回数を超えた場合には、コンソールに障害メッセージを出力して自動障害復旧処理を中断してしまうために、復旧処理を継続することでシステムの信頼性をさらに向上するようにはなっていない。   However, in the invention of the prior application, in the case of retrying the recovery process, if the predetermined number of times is exceeded, a fault message is output to the console and the automatic fault recovery process is interrupted. Continuing is not designed to further improve system reliability.

したがって、本発明の目的は、障害復旧処理の効率化を図り、監視作業の負荷を軽減すると共に、信頼性をさらに向上するシステム及び方法並びにプログラムを提供することにある。   Accordingly, an object of the present invention is to provide a system, method, and program for improving efficiency of failure recovery processing, reducing the load of monitoring work, and further improving reliability.

前記目的を達成する本発明の1つのアスペクトに係る方法は、自動化機器よりなる少なくとも1つの端末とネットワーク接続し、コンソールメッセージを受け取るオペレーション管理システムと、自動化機器の障害復旧を制御する自動化機器障害復旧システムとを含むホストコンピュータによる、前記自動化機器の障害復旧方法であって、
(a)前記端末での障害発生時に出力されるコンソールメッセージを受けた前記オペレーション管理システムが、前記自動化機器障害復旧システムに対して、端末の障害情報を通知するステップと、
(b)前記障害情報の通知を受けた前記自動化機器障害復旧システムが、前記障害が発生した端末が自動化機器であるか否か判定し、前記端末が自動化機器である場合、前記自動化機器の復旧処理を行うためのコマンドを自動生成するステップと、
(c)前記自動化機器障害復旧システムが、前記復旧処理を行うためのコマンドを前記端末向けに発行するステップと、
を含む。
さらに、前記自動化機器障害復旧システムより前記復旧処理を行うためのコマンドが発行された前記端末において障害が復旧しない場合、前記ホストコンピュータは、最大、予め定められた回数分だけ、前記(a)、(b)、(c)のステップを繰り返し、
繰り返しの回数が前記予め定められた回数に達した場合、起動コマンドを所定のテーブルに登録するステップを含む。
A method according to one aspect of the present invention that achieves the above object is to provide an operation management system that receives a console message by connecting to at least one terminal including an automation device, and an automation device failure recovery that controls failure recovery of the automation device. A failure recovery method for the automated device by a host computer including the system,
(A) The operation management system that has received a console message output when a failure occurs in the terminal notifies the automation device failure recovery system of failure information of the terminal;
(B) The automation device failure recovery system that has received the notification of the failure information determines whether or not the terminal where the failure has occurred is an automation device, and when the terminal is an automation device, the automation device recovery A step of automatically generating a command for processing;
(C) the automated equipment failure recovery system issuing a command for performing the recovery process to the terminal;
including.
Further, when a failure is not recovered in the terminal for which the command for performing the recovery process is issued by the automated device failure recovery system, the host computer is the maximum number of times (a), Repeat steps (b) and (c)
When the number of repetitions reaches the predetermined number, a step of registering an activation command in a predetermined table is included.

本発明に係る方法においては、前記障害情報の通知を受けた前記自動化機器障害復旧システムが、端末の構成情報を記憶した記憶装置を参照して、前記端末が自動化機器であるか否かを判定するステップを含む、ようにしてもよい。   In the method according to the present invention, the automated device failure recovery system that has received the notification of the failure information determines whether or not the terminal is an automated device by referring to a storage device that stores the configuration information of the terminal. It may be made to include the step to do.

本発明に係る方法において、前記端末でセッション接続処理に失敗したときに、障害情報の通知を受けた前記自動化機器障害復旧システムは、前記端末にセッション接続処理の開始を指示するコマンドを自動生成して、前記端末に対して出力するように制御する、ようにしてもよい。   In the method according to the present invention, when the session connection process fails in the terminal, the automated device failure recovery system that has received the failure information automatically generates a command that instructs the terminal to start the session connection process. Then, it may be controlled to output to the terminal.

本発明の他のアスペクトに係るシステムは、自動化機器よりなる少なくとも1つの端末と、前記端末とネットワーク接続するホストコンピュータと、を含むシステムにおいて、前記ホストコンピュータは、自動化機器の障害復旧を制御する自動化機器障害復旧手段と、前記端末での障害発生時に出力されるコンソールメッセージを受け取り、前記自動化機器障害復旧手段に対して端末の障害情報を通知する手段と、を備え、前記自動化機器障害復旧手段は、障害情報の通知を受けた場合に、障害が発生した端末が自動化機器であるか否かを判定し、前記端末が自動化機器の場合、前記自動化機器の復旧処理を行うためのコマンドを自動生成し、前記生成した復旧処理を行うためのコマンドを前記端末向けに発行する制御を行う手段と、前記自動化機器障害復旧手段が、前記自動化機器の復旧処理を行うためのコマンドを前記端末向けに発行したのち、前記端末より復旧した旨の通知を受けない場合、前記ホストコンピュータは、最大、予め定められた回数分だけ、復旧処理の再試行を行うように制御する手段と、前記復旧処理の再試行の回数が前記予め定められた回数に達した場合、起動コマンドを所定のテーブルに登録する手段と、を備えている。   A system according to another aspect of the present invention is a system including at least one terminal made of an automation device and a host computer connected to the terminal through a network, wherein the host computer is an automation that controls failure recovery of the automation device. Equipment failure recovery means, and means for receiving a console message output when a failure occurs in the terminal, and notifying the automation equipment failure recovery means of terminal failure information, the automated equipment failure recovery means, When a failure information notification is received, it is determined whether or not the terminal in which the failure has occurred is an automated device. If the terminal is an automated device, a command for performing a recovery process of the automated device is automatically generated. And means for performing control to issue a command for performing the generated recovery process to the terminal; If the failure recovery means does not receive a notification from the terminal after issuing a command for performing the recovery processing of the automated device to the terminal, the host computer is determined in advance. Means for controlling the recovery process to be retried the same number of times, and means for registering an activation command in a predetermined table when the number of times of retry of the recovery process reaches the predetermined number of times, It is equipped with.

本発明に係るシステムにおいて、前記障害復旧手段は、予め記憶装置に記憶されている自動化機器情報テーブルを参照して、前記端末が自動化機器であるか否かを判定する、構成としてもよい。   The system which concerns on this invention WHEREIN: The said failure recovery means is good also as a structure which determines whether the said terminal is an automation apparatus with reference to the automation apparatus information table previously memorize | stored in the memory | storage device.

本発明に係るシステムにおいて、前記端末でセッション接続処理に失敗したときに、障害情報の通知を受けた前記自動化機器障害復旧手段は、前記端末にセッション接続処理の開始を指示するコマンドを自動生成し、前記コマンドを前記端末向けに出力する制御を行う、構成としてもよい。   In the system according to the present invention, when the session connection process fails in the terminal, the automated device failure recovery means that has received notification of failure information automatically generates a command that instructs the terminal to start the session connection process. The control for outputting the command to the terminal may be performed.

本発明のさらに他のアスペクトに係るコンピュータプログラムは、自動化機器よりなる少なくとも1つの端末とネットワーク接続するホストコンピュータに、
(a)前記端末での障害発生時に出力されるコンソールメッセージを受けとった場合に、自動化機器障害復旧処理に対して、端末の障害情報を通知する処理と、
(b)前記障害情報の通知を受けた前記自動化機器障害復旧処理において、前記障害が発生した端末が自動化機器であるか否か判定し、前記端末が自動化機器である場合、前記自動化機器の復旧処理を行うためのコマンドを自動生成する処理と、
(c)前記自動化機器障害復旧処理において、前記復旧処理を行うためのコマンドを前記端末向けに発行する処理と、
前記(a)、(b)、(c)の処理を繰り返し、繰り返しの回数が前記予め定められた回数に達した場合、起動コマンドを所定のテーブルに登録する処理とを、を実行させるプログラムよりなる。
A computer program according to still another aspect of the present invention provides a host computer connected to a network with at least one terminal made of an automation device.
(A) When receiving a console message output when a failure occurs in the terminal, a process of notifying the failure information of the terminal to the automated device failure recovery process;
(B) In the automated device failure recovery process that has received the notification of the failure information, it is determined whether or not the terminal where the failure has occurred is an automated device, and when the terminal is an automated device, the automated device is restored. A process for automatically generating a command for processing,
(C) In the automated device failure recovery process, a process for issuing a command for performing the recovery process to the terminal;
From the program that executes the processing of (a), (b), and (c), and when the number of repetitions reaches the predetermined number of times, the process of registering the activation command in a predetermined table Become.

本発明に係る上記プログラムにおいて、前記(b)の処理において、起動された前記障害復旧システムは、予め記憶装置に記憶されている自動化機器情報テーブルを参照して、前記端末が自動化機器であるか否かを判定する処理を前記ホストコンピュータに実行させるようにしてもよい。   In the program according to the present invention, in the process (b), the activated failure recovery system refers to an automated equipment information table stored in advance in a storage device, and whether the terminal is an automated equipment. You may make it make the said host computer perform the process which determines whether or not.

本発明に係る上記プログラムにおいて、前記端末でセッション接続処理に失敗したときに、障害情報の通知を受けた前記自動化機器障害復旧処理において、前記端末にセッション接続処理の開始を指示するコマンドを自動生成して前記端末向けに出力するように制御する処理を前記ホストコンピュータに実行させるようにしてもよい。   In the program according to the present invention, when session connection processing fails in the terminal, a command for instructing the terminal to start session connection processing is automatically generated in the automated device failure recovery processing that has received notification of failure information. Then, the host computer may be caused to execute a process of controlling to output to the terminal.

以上説明したように、本発明によれば、障害復旧処理の効率化を図り、監視作業の負荷を軽減すると共に、復旧処理の再試行において予め定められた回数を超えた場合には、起動コマンドを登録することで、オペレータによる復旧処理を継続することで信頼性を向上することができる。   As described above, according to the present invention, it is possible to improve the efficiency of the failure recovery process, reduce the load of monitoring work, and when the predetermined number of times is exceeded in the retry of the recovery process, the start command By registering, reliability can be improved by continuing the recovery process by the operator.

本発明の実施の形態について説明する。図1は、本発明の一実施の形態の構成を示す図である。図1を参照すると、この実施の形態に係るシステムは、自動化機器をなすATM端末130にネットワーク接続するコンピュータシステムよりなるホスト100は、オペレーティングシステム101と、オペレーティングシステム101と連携してオンライン制御を行うオンライン処理システムをなすVIS(Versatile Online System)102と、システムの運用管理を担い事象駆動型のシステムであるTOM/EDF(Total Operation Management System/Event Driven Facility)103と、自動化機器障害復旧システム110と、ホストのコンソール(操作卓)120と、自動化機器情報140を記憶した記憶装置と、起動コマンドテーブル150を記憶した記憶装置と、を備えている。   Embodiments of the present invention will be described. FIG. 1 is a diagram showing the configuration of an embodiment of the present invention. Referring to FIG. 1, in the system according to this embodiment, a host 100 including a computer system connected to an ATM terminal 130 that is an automated device performs online control in cooperation with an operating system 101 and the operating system 101. VIS (Versatile Online System) 102 that forms an online processing system, TOM / EDF (Total Operation Management System / Event Drive Facility) 103, and an automated equipment failure recovery system 110, which are event-driven systems responsible for system operation management. , A host console 120, a storage device storing the automation device information 140, and a startup command table 150. It has to a storage apparatus, a.

TOM/EDF103は、コンピュータシステムで生成するシステムコンソールメッセージの出力(例えば障害メッセージ表示)を受け、オペレータに代わって(すなわち、オペレータがコンソール120から入力するかわりに)、システムコンソールコマンドを自動生成して投入し、システム運用の省力化と自動化を支援するシステムである。   The TOM / EDF 103 receives a system console message output (for example, a failure message display) generated by the computer system, and automatically generates a system console command on behalf of the operator (that is, instead of the operator inputting from the console 120). It is a system that supports the labor saving and automation of system operation.

自動化機器障害復旧システム110は、TOM/EDF103からの障害情報の通知を受けた場合に、自動化機器情報140を参照し、端末が、自動化機器である場合、VIS102に対して接続コマンドを発行する制御を行うシステム(ホスト100上で実行されるプログラムシステム)である。   The automation device failure recovery system 110 refers to the automation device information 140 when it receives notification of failure information from the TOM / EDF 103, and controls to issue a connection command to the VIS 102 when the terminal is an automation device. (A program system executed on the host 100).

自動化機器情報140は、ホスト100で接続され、ホスト100で管理するすべてのATM機器の構成情報を格納したテーブルであり、ATM機器に変更がある場合、その都度、最新のものに更新される構成情報管理テーブルである。   The automated device information 140 is a table that stores the configuration information of all ATM devices that are connected by the host 100 and managed by the host 100. When there is a change in the ATM device, the configuration is updated to the latest one. It is an information management table.

起動コマンドテーブル150は、ホスト100で接続され、ホスト100において端末でのセッション接続の失敗が所定回数繰り替えされた場合に、識別コードを付加した起動コマンドを登録するテーブルである。   The activation command table 150 is a table for registering an activation command to which an identification code is added when the host 100 is connected and the session connection failure at the terminal in the host 100 is repeated a predetermined number of times.

なお、図1には、簡単のため、1台のATM端末のみが示されているが、ATM端末は1台に限定されるものでなく、複数台であってよいことは勿論である。   In FIG. 1, only one ATM terminal is shown for simplicity, but the number of ATM terminals is not limited to one, and may be plural.

以下に、本発明の一実施例として、図1に示した実施の形態の具体的な動作例について説明する。図2は、本実施例の動作を説明するための流れ図である。図1及び図2を参照して、本実施例の動作について説明する。   Hereinafter, a specific operation example of the embodiment shown in FIG. 1 will be described as an example of the present invention. FIG. 2 is a flowchart for explaining the operation of this embodiment. The operation of this embodiment will be described with reference to FIGS.

セッションの接続をATM端末130(以下、単に、「端末」ともいう)に対して行おうとしたが、セッション接続処理が何らかの原因で失敗した場合、ホスト100のVIS102は、セッション障害メッセージ(コンソールメッセージ)(“VISC39 端末=XXXXXのオープン処理が異常終了しました”)を発行する(A11)。なお、コンソールメッセージにおいて、”端末=XXXXX”の”XXXXX”は、ATM端末のVIS102における定義ID(識別コード)であり、例えば数字4桁と英字1桁からなる。セッション障害メッセージは、テキストコードとして、TOM/EDF103に受け渡される。   If an attempt is made to connect a session to the ATM terminal 130 (hereinafter also simply referred to as “terminal”), but the session connection process fails for some reason, the VIS 102 of the host 100 displays a session failure message (console message). (“VISC39 terminal = XXXX open processing has ended abnormally”) (A11). In the console message, “XXXX” of “terminal = XXXX” is a definition ID (identification code) in the VIS 102 of the ATM terminal, and is composed of, for example, four digits and one alphabetic character. The session failure message is delivered to the TOM / EDF 103 as a text code.

TOM/EDF103は、コンソールメッセージ(“VISC39 端末=XXXXXのオープン処理が異常終了しました”)を受け取って解析し、端末のセッション接続処理の障害を通知するメッセージであることを認識し、TOM/EDF103は、自動化機器障害復旧システム110に対し、障害情報を通知する。より詳細には、TOM/EDF103は、自動化機器障害復旧システム110に対して通知する障害情報として、障害が発生した端末(ID=XXXXX)に対する起動コマンド(例えば“/TC SA TRM=XXXXX”)(ダイレクトコマンド)を発行する(A12)。   The TOM / EDF 103 receives and analyzes the console message (“VISC39 terminal = XXXX open process ended abnormally”), recognizes that this is a message notifying the terminal session connection process failure, and the TOM / EDF 103 Notifies the failure information to the automated device failure recovery system 110. More specifically, the TOM / EDF 103 uses, as failure information to be notified to the automated device failure recovery system 110, an activation command (for example, “/ TC SA TRM = XXXX”) for the failed terminal (ID = XXXX) ( Direct command) is issued (A12).

自動化機器障害復旧システム110は、TOM/EDF103からの障害情報を通知するコマンド(“/TC SA TRM=XXXXX”)(A13)を受け、端末(ID=XXXXX)が自動化機器か否かを自動化機器情報テーブル(A14:図1の140に対応する)を参照して判定する。自動化機器情報テーブルには、少なくとも、ホスト100に接続する端末のIDと、該端末が自動化機器であるか否かを示す情報が含まれている。   The automated device failure recovery system 110 receives a command (“/ TC SA TRM = XXXX”) (A13) for notifying failure information from the TOM / EDF 103, and determines whether or not the terminal (ID = XXXX) is an automated device. The determination is made with reference to the information table (A14: corresponding to 140 in FIG. 1). The automated device information table includes at least an ID of a terminal connected to the host 100 and information indicating whether the terminal is an automated device.

自動化機器障害復旧システム110は、障害端末が、自動化機器(ATM端末)であると判定した場合、VIS102に対して、セッション接続コマンド(“CV SA TRM=XXXXX”)(A15)を自動生成して、端末向けに自動発行する。セッション接続コマンドにおいて、”TRM=XXXXX”の”XXXXX”は、ATM端末130のVIS102における定義ID(識別コード)であり、ATM端末130は、このコマンドをVIS102から受信すると、VIS102に対して、セッションの接続処理を行う。なお、本実施例では、ATM端末130とホスト100とは、ネットワークレベル(物理層乃至ネットワーク層等)での接続はなされているものとし、端末におけるセッションの接続処理の自動障害の復旧を行うものとする。   When it is determined that the failed terminal is an automated device (ATM terminal), the automated device failure recovery system 110 automatically generates a session connection command (“CV SA TRM = XXXX”) (A15) for the VIS 102. Automatic issue for terminals. In the session connection command, “XXXX” of “TRM = XXXX” is a definition ID (identification code) in the VIS 102 of the ATM terminal 130, and when the ATM terminal 130 receives this command from the VIS 102, Perform the connection process. In this embodiment, it is assumed that the ATM terminal 130 and the host 100 are connected at the network level (physical layer or network layer, etc.), and the session connection processing in the terminal is restored automatically. And

そして、同一端末に対しては、例えばリトライ処理として、最大3回まで連続してセッション接続処理を行う(A17)。リトライ処理のセッション接続処理の4回目の異常時、すなわち再試行が4回ともエラーとなった場合には、識別コードを付加した起動コマンドを起動コマンドテーブル150に登録する(A19)。   For the same terminal, for example, as a retry process, a session connection process is continuously performed up to three times (A17). At the time of the fourth abnormality in the session connection process of the retry process, that is, when the retries have failed four times, the activation command with the identification code added is registered in the activation command table 150 (A19).

再試行が4回ともエラーとなった場合、オペレータは、起動コマンドテーブル150に登録された起動コマンドをコンソール端末120から参照して障害内容を確認しながら、新たな起動コマンドを入力することができる。したがって、オペレータによる復旧処理を継続することで信頼性を向上することができる。   If all the retries fail four times, the operator can input a new start command while referring to the start command registered in the start command table 150 from the console terminal 120 and confirming the contents of the failure. . Therefore, the reliability can be improved by continuing the recovery process by the operator.

一方、VIS102は、セッション接続コマンド(A15)の発行を受け、端末活性処理(A17)を行う。すなわち、ATM端末130に対して、”CV SA TRM=XXXXX”を発行し、端末XXXXXに対し、セッション接続処理の開始の指示を行う(A17)。   On the other hand, the VIS 102 receives the issuance of the session connection command (A15) and performs terminal activation processing (A17). That is, “CV SA TRM = XXXX” is issued to the ATM terminal 130, and an instruction to start session connection processing is issued to the terminal XXXX (A17).

ATM端末130が、セッション接続処理の開始の指示を受け付け、セッション接続処理が成功した場合、VIS102は、成功した場合、端末復旧メッセージ(A18)を、コンソールメッセージとして表示する。   When the ATM terminal 130 receives an instruction to start the session connection process and the session connection process is successful, the VIS 102 displays a terminal recovery message (A18) as a console message when the session connection process is successful.

ATM端末130でのセッション接続処理の失敗による障害メッセージ(コンソールメッセージ)が出力されてから、当該障害ATM端末130でセッション接続処理が完了するまでの時間を測定したところ、再試行なしの場合、数秒程度の時間しか要さないことがわかった。   When a time from when a failure message (console message) due to failure of the session connection processing at the ATM terminal 130 is output to when the session connection processing is completed at the failure ATM terminal 130 is measured, when there is no retry, several seconds. It turns out that it only takes a certain amount of time.

以上本発明を上記実施例に即して説明したが、本発明は上記実施例の構成にのみ限定されるものでなく、特許請求の範囲の各請求項の範囲内で当業者であればなし得るであろう各種変形・修正を含むことは勿論である。   Although the present invention has been described with reference to the above-described embodiments, the present invention is not limited to the configurations of the above-described embodiments, and can be made by those skilled in the art within the scope of the claims. Of course, various modifications and corrections will be included.

本発明の一実施形態の構成を示す図である。It is a figure which shows the structure of one Embodiment of this invention. 本発明の一実施例の処理を説明するための図である。It is a figure for demonstrating the process of one Example of this invention. 従来システムの処理を説明するための図である。It is a figure for demonstrating the process of a conventional system.

符号の説明Explanation of symbols

100 ホスト
101 オペレーティングシステム
102 VIS
103 TOM/EDF
110 自動化機器障害復旧システム
120 コンソール
130 自動化機器(ATM端末)
140 自動化機器情報
150 起動コマンドテーブル
100 Host 101 Operating system 102 VIS
103 TOM / EDF
110 Automated equipment failure recovery system 120 Console 130 Automated equipment (ATM terminal)
140 Automated device information 150 Startup command table

Claims (9)

自動化機器よりなる少なくとも1つの端末とネットワーク接続し、コンソールメッセージを受け取るオペレーション管理システムと、自動化機器の障害復旧を制御する自動化機器障害復旧システムとを少なくとも含むホストコンピュータによる、前記自動化機器の障害復旧方法であって、
(a)前記端末での障害発生時に出力されるコンソールメッセージを受けた前記オペレーション管理システムが、前記自動化機器障害復旧システムに対して、端末の障害情報を通知するステップと、
(b)前記障害情報の通知を受けた前記自動化機器障害復旧システムが、前記障害が発生した端末が自動化機器であるか否か判定し、前記端末が自動化機器である場合、前記自動化機器の復旧処理を行うためのコマンドを自動生成するステップと、
(c)前記自動化機器障害復旧システムが、前記復旧処理を行うためのコマンドを前記端末向けに発行するステップと、
を含み、
前記自動化機器障害復旧システムより前記復旧処理を行うためのコマンドが発行された前記端末において障害が復旧しない場合、前記ホストコンピュータは、最大、予め定められた回数分だけ、前記(a)、(b)、(c)のステップを繰り返し、
繰り返しの回数が前記予め定められた回数に達した場合、起動コマンドを所定のテーブルに登録するステップを含むことを特徴とする、自動化機器の障害復旧方法。
A method of recovering a failure of an automated device by a host computer including at least an operation management system that connects to at least one terminal made of an automated device and receives a console message, and an automated device failure recovery system that controls failure recovery of the automated device Because
(A) The operation management system that has received a console message output when a failure occurs in the terminal notifies the automation device failure recovery system of failure information of the terminal;
(B) The automation device failure recovery system that has received the notification of the failure information determines whether or not the terminal where the failure has occurred is an automation device, and when the terminal is an automation device, the automation device recovery A step of automatically generating a command for processing;
(C) the automated equipment failure recovery system issuing a command for performing the recovery process to the terminal;
Including
When the failure is not recovered in the terminal to which the command for performing the recovery process is issued by the automated device failure recovery system, the host computer can perform the above (a), (b) at the maximum number of times. ) And (c) are repeated,
A method of recovering a failure of an automated device, comprising a step of registering an activation command in a predetermined table when the number of repetitions reaches the predetermined number.
前記障害情報の通知を受けた前記自動化機器障害復旧システムが、端末の構成情報を記憶した記憶装置を参照して、前記端末が自動化機器であるか否かを判定するステップを含む、ことを特徴とする請求項1記載の自動化機器の障害復旧方法。   The automated device failure recovery system which has received the notification of the failure information includes a step of determining whether or not the terminal is an automated device with reference to a storage device storing the configuration information of the terminal. The failure recovery method for an automated device according to claim 1. 前記端末でセッション接続処理に失敗したときに、障害情報の通知を受けた前記自動化機器障害復旧システムは、前記端末にセッション接続処理の開始を指示するコマンドを自動生成し、前記コマンドを前記端末に対して出力するように制御する、ことを特徴とする請求項1又は2記載の自動化機器の障害復旧方法。   The automated device failure recovery system that has received the notification of failure information when the session connection processing fails in the terminal automatically generates a command that instructs the terminal to start session connection processing, and sends the command to the terminal. 3. The failure recovery method for an automated device according to claim 1, wherein control is performed so that the output is output. 自動化機器よりなる少なくとも1つの端末と、
前記端末とネットワーク接続するホストコンピュータと、
を含むシステムにおいて、
前記ホストコンピュータは、
自動化機器の障害復旧を制御する自動化機器障害復旧手段と、
前記端末での障害発生時に出力されるコンソールメッセージを受け取り、前記自動化機器障害復旧手段に対して端末の障害情報を通知する手段と、
前記自動化機器障害復旧手段は、障害情報の通知を受けた場合に、障害が発生した端末が自動化機器であるか否かを判定し、前記端末が自動化機器の場合、前記自動化機器の復旧処理を行うためのコマンドを自動生成し、前記生成した復旧処理を行うためのコマンドを前記端末向けに発行する制御を行う手段と、
前記自動化機器障害復旧手段が、前記自動化機器の復旧処理を行うためのコマンドを前記端末向けに発行したのち、前記端末より復旧した旨の通知を受けない場合、前記ホストコンピュータは、最大、予め定められた回数分だけ、復旧処理の再試行を行うように制御する手段と、
前記復旧処理の再試行の回数が前記予め定められた回数に達した場合、起動コマンドを所定のテーブルに登録する手段と、
を備えている、ことを特徴とする自動化機器障害復旧システム。
At least one terminal of automated equipment;
A host computer connected to the terminal via a network;
In a system that includes
The host computer
Automated equipment failure recovery means for controlling the failure recovery of automated equipment,
Means for receiving a console message output when a failure occurs in the terminal, and notifying the failure information of the terminal to the automated equipment failure recovery means;
The automated device failure recovery means determines whether or not the failed terminal is an automated device upon receiving notification of failure information. If the terminal is an automated device, the automated device failure recovery means Means for automatically generating a command for performing, and issuing a command for performing the generated recovery processing for the terminal;
When the automated device failure recovery means does not receive a notification of recovery from the terminal after issuing a command for performing the recovery processing of the automated device to the terminal, the host computer is predetermined in advance. Means to control the recovery process to be retried as many times as specified,
Means for registering an activation command in a predetermined table when the number of retries of the recovery process reaches the predetermined number of times;
An automated equipment failure recovery system characterized by comprising:
前記ホストコンピュータは、接続する端末の構成情報として、少なくとも前記端末が自動化機器であるか否かに関する情報を格納する記憶装置を備え、
前記自動化機器障害復旧手段は、前記記憶装置を参照して、前記端末が自動化機器であるか否かを判定する、ことを特徴とする請求項4記載の自動化機器障害復旧システム。
The host computer includes a storage device that stores at least information regarding whether or not the terminal is an automated device as configuration information of a terminal to be connected;
5. The automated equipment failure recovery system according to claim 4, wherein the automated equipment failure recovery means determines whether or not the terminal is an automated equipment with reference to the storage device.
前記端末でセッション接続処理に失敗したときに、障害情報の通知を受けた前記自動化機器障害復旧手段は、前記端末にセッション接続処理の開始を指示するコマンドを自動生成し、前記コマンドを前記端末向けに出力する制御を行う、ことを特徴とする請求項4記載の自動化機器障害復旧システム。   When the terminal fails in session connection processing at the terminal, the automated device failure recovery means that has received notification of failure information automatically generates a command that instructs the terminal to start session connection processing, and sends the command to the terminal 5. The automated equipment failure recovery system according to claim 4, wherein control to output to the system is performed. 自動化機器よりなる少なくとも1つの端末とネットワーク接続するホストコンピュータに、
(a)前記端末での障害発生時に出力されるコンソールメッセージを受けとり、自動化機器障害復旧処理に対して、端末の障害情報を通知する処理と、
(b)前記障害情報の通知を受けた前記自動化機器障害復旧処理において、前記障害が発生した端末が自動化機器であるか否か判定し、前記端末が自動化機器である場合、前記自動化機器の復旧処理を行うためのコマンドを自動生成する処理と、
(c)前記自動化機器障害復旧処理において、前記復旧処理を行うためのコマンドを前記端末向けに発行する処理と、
前記(a)、(b)、(c)の処理を繰り返し、繰り返しの回数が前記予め定められた回数に達した場合、起動コマンドを所定のテーブルに登録する処理とを、
実行させるプログラム。
To a host computer connected to a network with at least one terminal made of automation equipment,
(A) receiving a console message that is output when a failure occurs in the terminal, and notifying the failure information of the terminal to the automated device failure recovery processing;
(B) In the automated device failure recovery process that has received the notification of the failure information, it is determined whether or not the terminal where the failure has occurred is an automated device, and when the terminal is an automated device, the automated device is restored. A process for automatically generating a command for processing,
(C) In the automated device failure recovery process, a process for issuing a command for performing the recovery process to the terminal;
(A), (b), and (c) are repeated, and when the number of repetitions reaches the predetermined number of times, a process of registering an activation command in a predetermined table,
The program to be executed.
請求項7記載のプログラムにおいて、
前記(b)の処理において、前記自動化機器障害復旧処理は、端末が自動化機器であるか否かに関する情報を記憶した記憶装置を参照して、前記端末が自動化機器であるか否かを判定する処理を、前記ホストコンピュータに実行させるプログラム。
The program according to claim 7, wherein
In the process (b), the automated device failure recovery process determines whether or not the terminal is an automated device by referring to a storage device that stores information on whether or not the terminal is an automated device. A program for causing the host computer to execute processing.
請求項7又は8記載のプログラムにおいて、
前記端末でセッション接続処理に失敗したときに、障害情報の通知を受けた前記自動化機器障害復旧処理において、前記端末にセッション接続処理の開始を指示するコマンドを自動生成して前記端末向けに出力するように制御する処理を、前記ホストコンピュータに実行させるプログラム。
The program according to claim 7 or 8,
When session connection processing fails at the terminal, in the automated device failure recovery processing that has received notification of failure information, a command for instructing the terminal to start session connection processing is automatically generated and output to the terminal A program for causing the host computer to execute a process for controlling as described above.
JP2004083280A 2004-03-22 2004-03-22 Automated equipment failure recovery system Pending JP2005275438A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004083280A JP2005275438A (en) 2004-03-22 2004-03-22 Automated equipment failure recovery system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004083280A JP2005275438A (en) 2004-03-22 2004-03-22 Automated equipment failure recovery system

Publications (1)

Publication Number Publication Date
JP2005275438A true JP2005275438A (en) 2005-10-06

Family

ID=35175099

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004083280A Pending JP2005275438A (en) 2004-03-22 2004-03-22 Automated equipment failure recovery system

Country Status (1)

Country Link
JP (1) JP2005275438A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009048403A (en) * 2007-08-20 2009-03-05 Hitachi Information Systems Ltd System failure recovery device, command generation method therefor, and program thereof

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009048403A (en) * 2007-08-20 2009-03-05 Hitachi Information Systems Ltd System failure recovery device, command generation method therefor, and program thereof

Similar Documents

Publication Publication Date Title
EP0474058A2 (en) Problem analysis of a node computer with assistance from a central site
US20050086544A1 (en) Method and apparatus for correlating system resources to a particular line cord
JP2008181572A (en) Plc system
JP2017054288A (en) Remote maintenance service system
JP5444739B2 (en) Management device, management system, and management program
CN110968456B (en) Method and device for processing fault disk in distributed storage system
CN104754562A (en) Method and device for repairing data replication abnormity
JP2005275438A (en) Automated equipment failure recovery system
JP2008140280A (en) Reliability enhancing method in operation management of server
JP6569247B2 (en) Fault verification apparatus, fault verification method, verification target apparatus, wireless communication system, computer program
JP2004227288A (en) Automated equipment failure restoring system, method, and program
JPS62169266A (en) Data transmission and reception terminal equipment
JP2010146363A (en) System switching system of duplex programmable controller
JPH07321799A (en) Input output equipment management method
US6480466B1 (en) Terminal switching apparatus and method
JP2013156963A (en) Control program, control method, information processing apparatus, and control system
CN110955210B (en) AGV scheduling method, device and system
JP5262492B2 (en) Cluster system and command conflict control method
JP4574105B2 (en) Information processing apparatus, communication system, and program thereof
JP6835763B2 (en) Message monitoring server, method, program
JP2001147909A (en) State monitoring system
JP2699291B2 (en) Power failure processing device
CN117579465A (en) Fault processing method, device, equipment and storage medium
JP2007004412A (en) Branch office system
CN112084074A (en) Remote connection control method

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080115

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080317

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080507

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080707

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080805