JP2004227288A - Automated equipment failure restoring system, method, and program - Google Patents

Automated equipment failure restoring system, method, and program Download PDF

Info

Publication number
JP2004227288A
JP2004227288A JP2003014304A JP2003014304A JP2004227288A JP 2004227288 A JP2004227288 A JP 2004227288A JP 2003014304 A JP2003014304 A JP 2003014304A JP 2003014304 A JP2003014304 A JP 2003014304A JP 2004227288 A JP2004227288 A JP 2004227288A
Authority
JP
Japan
Prior art keywords
terminal
failure
automated
automated equipment
recovery
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003014304A
Other languages
Japanese (ja)
Inventor
Toru Sasaki
徹 佐々木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solution Innovators Ltd
Original Assignee
NEC Software Chubu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Software Chubu Ltd filed Critical NEC Software Chubu Ltd
Priority to JP2003014304A priority Critical patent/JP2004227288A/en
Publication of JP2004227288A publication Critical patent/JP2004227288A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Retry When Errors Occur (AREA)
  • Computer And Data Communications (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a system, method, and a program for realizing the efficiency of processing and for improving reliability. <P>SOLUTION: A host computer 100 is connected through a network to at least one terminal 130 constituted of automated equipment and is provided with an on-line processing system 102, an operation management system 103 for receiving a console message, and an automated equipment failure restoring system 110 for controlling the failure restoration of the automated equipment. The operation management system 103 which has received the console message outputted when any failure occurs at the terminal informs the automated equipment failure restoring system 110 of the failure information of the terminal, and the automated equipment failure restoring system 110 which has received the notification of the failure information decides whether or not the terminal where the failure occurs is the automated equipment, and when the terminal is the automated equipment, it automatically generates a command for carrying out the restoration processing of the automated equipment, and issues a command for carrying out the restoration processing to the terminal 130. <P>COPYRIGHT: (C)2004,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、障害自動復旧技術に関し、特に、ネットワーク上に存在する自動化機器に対してセッション障害発生時に自動でセッションを再接続させる制御を行うことを可能としたシステム及び方法並びにプログラムに関する。
【0002】
【従来の技術】
図3に、自動化機器を制御する従来のシステムの処理の典型的な一例を示す。図3を参照して、従来のシステムの処理手順を説明する。
【0003】
端末のセッション障害メッセージがコンソール(操作卓)に出力されることを、オペレータが監視(目視)する。コンソールに、コンソールメッセージ(B11)(端末障害メッセージ)が表示され(例えば”VISC39 端末=XXXXのオープン処理が異常終了しました”)、オペレータは、端末障害メッセージが出力されていることを検出した場合、オペレータは、当該障害端末が自動化機器か否かを、端末情報リスト(ホストで接続管理する端末構成情報の一覧)から判断し、オペレータは、コンソール(操作卓)から手動にて、オンライン処理システムVIS(Versatile Online System)に対するセッション接続コマンド(”CV SA TRM=XXXXX”)を入力する(B12)。
【0004】
このコマンド入力を受けて、VISは、端末にセッション接続開始を指示する端末活性処理を行う(B14)。端末でのセッション接続開始が成功した場合には、コンソールメッセージ(B15)(「端末復旧メッセージ」ともいう、例えば”VISC31 端末=XXXXのセッション開始要求を受け付けました”)が表示される。端末でのセッション接続開始が失敗した場合、VISにより、セッション障害メッセージ(B11)がコンソールに表示出力される。
【0005】
なお、自動預金支払機(ATM)に代表される自動化機器の運用において、センタのホストコンピュータと自動化機器を結ぶ回線の障害時やホストコンピュータの障害時における自動化機器の運用方法として、ホストコンピュータの2重化やホストコンピュータと自動化機器を結ぶ回線の2重化を行わなくても、顧客への対応、サービスを優れたものとするようにした方法が知られている(例えば特許文献1参照)。以下の説明からも明らかとされるように、この従来のシステムと相違して、本発明は、自動化機器の障害を判別し、自動化機器の障害復旧用のコマンドを自動生成するものである。
【0006】
また、障害情報を通知する従来技術として、例えばデジタル無線網において、自局で検出した障害の種別ごとに予め定められる時間間隔で相手局への再接続のための手順を繰り返して行うような通信方法も知られている(例えば特許文献2参照)。
【0007】
さらに、オンライン処理システム(VIS)に関しては、稼動系及び待機系の複数のオンライン処理システム(VIS)を有するホットスタンバイ対応疎結合マルチホットスタンバイコンピュータシステムにおいて、オペレータコマンド振分手段からの送信要求コマンドの送信先VISの状態が、ホットスタンバイ中の送信コマンドを、オペレータコマンド送信要求保持テーブルに格納し、その後、送信先VISのホットスタンバイ終了が通知されると、オペレータコマンド送信要求保持テーブルにスタックされていた送信要求コマンドが読み出され、オペレータコマンド振分手段に再び投入され、これにより、送信先VISがホットスタンバイ中の送信コマンドを、ロストをなくすようにしたシステムが知られている(例えば特許文献3参照)。
【0008】
【特許文献1】
特許第2944138号公報(第2−3頁、第1図)
【特許文献2】
特開平5−37434号公報(第2−3頁、第1図、第3図)
【特許文献3】
特開平5−265986号公報(第3頁、第1図)
【0009】
【発明が解決しようとする課題】
ところで、図3を参照して説明した従来のシステムは、オペレータの作業負担の軽減が困難であり及び見落とし等の発生の可能性がある、という問題点を有している。その理由は、オペレータが常にコンソールを監視し、出力されるメッセージを監視しなければならず、このため、オペレータはコンソールから離れられず、また、コンソールメッセージを目視して監視するため、障害の見落としが発生する可能性もある。
【0010】
また、従来のシステムは、即時性に欠ける、という問題点を有している。すなわち、従来のシステムにおいては、仮にメッセージを確認したとしても、その後、オペレータが端末情報リストを参照して、自動化機器か否かを判断し、オペレータが手動にてVISに対するセッション接続コマンドを入力する、という一連の作業が必要とされる。このため、障害発生を通知するコンソールメッセージの出力から復旧処理の開始まで、最短でも、1分程度の時間を要する。
【0011】
さらに、従来のシステムは、手動操作固有の人的エラーの発生の可能性がある、という問題点を有している。すなわち、オペレータによるVISに対するセッション接続コマンドの誤入力によるシステムの誤動作を発生させる可能性がある。
【0012】
したがって、本発明の目的は、障害復旧処理の効率化を図るとともに、監視作業の負荷を軽減し、信頼性を向上するシステム及び方法並びにプログラムを提供することにある。
【0013】
【課題を解決するための手段】
前記目的を達成する本発明の1つのアスペクトに係る方法は、自動化機器よりなる少なくとも1つの端末とネットワーク接続し、コンソールメッセージを受け取るオペレーション管理システムと、自動化機器の障害復旧を制御する自動化機器障害復旧システムとを含むホストコンピュータによる、前記自動化機器の障害復旧方法であって、
前記端末での障害発生時に出力されるコンソールメッセージを受けた前記オペレーション管理システムが、前記自動化機器障害復旧システムに対して、端末の障害情報を通知するステップと、
前記障害情報の通知を受けた前記自動化機器障害復旧システムが、前記障害が発生した端末が自動化機器であるか否か判定し、前記端末が自動化機器である場合、前記自動化機器の復旧処理を行うためのコマンドを自動生成するステップと、
前記自動化機器障害復旧システムが、前記復旧処理を行うためのコマンドを前記端末向けに発行するステップと、
を含む。かかる本発明の方法によれば、障害発生の監視、復旧処理を自動化し、処理効率を向上する。
【0014】
本発明に係る方法においては、前記障害情報の通知を受けた前記自動化機器障害復旧システムが、端末の構成情報を記憶した記憶装置を参照して、前記端末が自動化機器であるか否かを判定するステップを含む、ようにしてもよい。
【0015】
本発明に係る方法において、前記自動化機器障害復旧システムより前記復旧処理を行うためのコマンドが発行された前記端末において障害が復旧しない場合、前記ホストコンピュータは、最大、予め定められた回数分だけ、再試行を行うようにしてもよい。
【0016】
本発明に係る方法において、前記端末でセッション接続処理に失敗したときに、障害情報の通知を受けた前記自動化機器障害復旧システムは、前記端末にセッション接続処理の開始を指示するコマンドを自動生成して、前記端末に対して出力するように制御する、ようにしてもよい。
【0017】
本発明の他のアスペクトに係るシステムは、自動化機器よりなる少なくとも1つの端末と、前記端末とネットワーク接続するホストコンピュータと、を含むシステムにおいて、前記ホストコンピュータは、自動化機器の障害復旧を制御する自動化機器障害復旧手段と、前記端末での障害発生時に出力されるコンソールメッセージを受け取り、前記自動化機器障害復旧手段に対して端末の障害情報を通知する手段と、を備え、前記自動化機器障害復旧手段は、障害情報の通知を受けた場合に、障害が発生した端末が自動化機器であるか否かを判定し、前記端末が自動化機器の場合、前記自動化機器の復旧処理を行うためのコマンドを自動生成し、前記生成した復旧処理を行うためのコマンドを前記端末向けに発行する制御を行う手段を備えている。
【0018】
本発明に係るシステムにおいて、前記障害復旧手段は、予め記憶装置に記憶されている自動化機器情報テーブルを参照して、前記端末が自動化機器であるか否かを判定する、構成としてもよい。
【0019】
本発明に係るシステムにおいて、前記障害復旧手段は、前記自動化機器の復旧処理を行うコマンドを前記端末向けに発行し、前記端末より復旧した旨の通知を受けない場合、前記ホストコンピュータは、予め定められた回数分、再試行を行う構成としてもよい。
【0020】
本発明のさらに他のアスペクトに係るコンピュータプログラムは、自動化機器よりなる少なくとも1つの端末とネットワーク接続するホストコンピュータに、
(a)前記端末での障害発生時に出力されるコンソールメッセージを受けとった場合に、自動化機器障害復旧処理に対して、端末の障害情報を通知する処理と、
(b)前記障害情報の通知を受けた前記自動化機器障害復旧処理において、前記障害が発生した端末が自動化機器であるか否か判定し、前記端末が自動化機器である場合、前記自動化機器の復旧処理を行うためのコマンドを自動生成する処理と、
(c)前記自動化機器障害復旧処理において、前記復旧処理を行うためのコマンドを前記端末向けに発行する処理と、を実行させるプログラムよりなる。
【0021】
本発明に係る上記プログラムにおいて、前記(b)の処理において、起動された前記障害復旧システムは、予め記憶装置に記憶されている自動化機器情報テーブルを参照して、前記端末が自動化機器であるか否かを判定する処理を前記ホストコンピュータに実行させるようにしてもよい。
【0022】
本発明に係る上記プログラムにおいて、前記自動化機器の復旧処理を行うコマンドを前記端末向けに発行し、前記端末より復旧した旨の通知を受けない場合、前記ホストコンピュータは、最大、予め定められた回数分だけ、復旧処理の再試行を行うように制御する処理を、前記ホストコンピュータに実行させるようにしてもよい。
【0023】
【発明の実施の形態】
本発明の実施の形態について説明する。図1は、本発明の一実施の形態の構成を示す図である。図1を参照すると、この実施の形態に係るシステムは、自動化機器をなすATM端末130にネットワーク接続するコンピュータシステムよりなるホスト100は、オペレーティングシステム101と、オペレーティングシステム101と連携してオンライン制御を行うオンライン処理システムをなすVIS(Versatile Online System)102と、システムの運用管理を担い事象駆動型のシステムであるTOM/EDF(Total Operation Management System/Event Driven Facility)103と、自動化機器障害復旧システム110と、ホストのコンソール(操作卓)120と、自動化機器情報140を記憶した記憶装置と、を備えている。
【0024】
TOM/EDF103は、コンピュータシステムで生成するシステムコンソールメッセージの出力(例えば障害メッセージ表示)を受け、オペレータに代わって(すなわち、オペレータがコンソール端末120から入力するかわりに)、システムコンソールコマンドを自動生成して投入し、システム運用の省力化と自動化を支援するシステムである。
【0025】
自動化機器障害復旧システム110は、TOM/EDF103からの障害情報の通知を受けた場合に、自動化機器情報140を参照し、端末が、自動化機器である場合、VIS102に対して接続コマンドを発行する制御を行うシステム(ホスト100上で実行されるプログラムシステム)である。
【0026】
自動化機器情報140は、ホスト100で接続され、ホスト100で管理するすべてのATM機器の構成情報を格納したテーブルであり、ATM機器に変更がある場合、その都度、最新のものに更新される構成情報管理テーブルである。なお、図1には、簡単のため、1台のATM端末のみが示されているが、ATM端末は1台に限定されるものでなく、複数台であってよいことは勿論である。
【0027】
以下に、本発明の一実施例として、図1に示した実施の形態の具体的な動作例について説明する。図2は、本実施例の動作を説明するための流れ図である。図1及び図2を参照して、本実施例の動作について説明する。
【0028】
セッションの接続をATM端末130(以下、単に、「端末」ともいう)に対して行おうとしたが、セッション接続処理が何らかの原因で失敗した場合、ホスト100のVIS102は、セッション障害メッセージ(コンソールメッセージ)(“VISC39 端末=XXXXXのオープン処理が異常終了しました”)を発行する(A11)。なお、コンソールメッセージにおいて、”端末=XXXXX”の”XXXXX”は、ATM端末のVIS102における定義ID(識別コード)であり、例えば数字4桁と英字1桁からなる。セッション障害メッセージは、テキストコードとして、TOM/EDF103に受け渡される。
【0029】
TOM/EDF103は、コンソールメッセージ(“VISC39 端末=XXXXXのオープン処理が異常終了しました”)を受け取って解析し、端末のセッション接続処理の障害を通知するメッセージであることを認識し、TOM/EDF103は、自動化機器障害復旧システム110に対し、障害情報を通知する。より詳細には、TOM/EDF103は、自動化機器障害復旧システム110に対して通知する障害情報として、障害が発生した端末(ID=XXXXX)に対する起動コマンド(例えば“/TC SA TRM=XXXXX”)(ダイレクトコマンド)を発行する(A12)。
【0030】
自動化機器障害復旧システム110は、TOM/EDF103からの障害情報を通知するコマンド(“/TC SA TRM=XXXXX”)(A13)を受け、端末(ID=XXXXX)が自動化機器か否かを自動化機器情報テーブル(A14:図1の140に対応する)を参照して判定する。自動化機器情報テーブルには、少なくとも、ホスト100に接続する端末のIDと、該端末が自動化機器であるか否かを示す情報が含まれている。
【0031】
自動化機器障害復旧システム110は、障害端末が、自動化機器(ATM機器)であると判定した場合、VIS102に対して、セッション接続コマンド(“CV SA TRM=XXXXX”)(A15)を自動生成して、端末向けに自動発行する。セッション接続コマンドにおいて、”TRM=XXXXX”の”XXXXX”は、ATM端末130のVIS102における定義ID(識別コード)であり、ATM端末130は、このコマンドをVIS102から受信すると、VIS102に対して、セッションの接続処理を行う。なお、本実施例では、ATM端末130とホスト100とは、ネットワークレベル(物理層乃至ネットワーク層等)での接続はなされているものとし、端末におけるセッションの接続処理の自動障害の復旧を行うものとする。
【0032】
そして、同一端末に対しては、例えばリトライ処理として、最大3回まで連続してセッション接続処理を行う。リトライ処理のセッション接続処理の4回目の異常時には、コンソールに障害メッセージを出力し、自動障害復旧処理を中断する。
【0033】
VIS102は、セッション接続コマンド(A15)の発行を受け、端末活性処理(A17)を行う。すなわち、ATM端末130に対して、”CV SA TRM=XXXXX”を発行し、端末XXXXXに対し、セッション接続処理の開始の指示を行う(A17)。
【0034】
ATM端末130が、セッション接続処理の開始の指示を受け付け、セッション接続処理が成功した場合、VIS102は、成功した場合、端末復旧メッセージ(A18)を、コンソールメッセージとして表示する。
【0035】
ATM端末130でのセッション接続処理の失敗による障害メッセージ(コンソールメッセージ)が出力されてから、当該障害ATM端末130でセッション接続処理が完了するまでの時間を測定したところ、再試行なしの場合、数秒程度の時間しか要さないことがわかった。
【0036】
以上本発明を上記実施例に即して説明したが、本発明は上記実施例の構成にのみ限定されるものでなく、特許請求の範囲の各請求項の範囲内で当業者であればなし得るであろう各種変形・修正を含むことは勿論である。
【0037】
【発明の効果】
以上説明したように、本発明によれば、端末でのセッション接続の失敗による障害メッセージが出力されてから当該端末でセッション接続処理が完了するまでに、例えば数秒程度の時間しか要さない。また、本発明によれば、人手による監視方式による監視もれ等がなくなると共に、監視にかかる負荷(オペレータの作業負担)を軽減することができる。すなわち、本発明によれば、監視・障害復旧処理を効率化する、ことができる。
【0038】
また本発明によれば、セッション接続コマンドを発行する際のオペレータの誤入力によるシステムの誤作動の防止し、システムの信頼性を向上することができる。
【図面の簡単な説明】
【図1】本発明の一実施形態の構成を示す図である。
【図2】本発明の一実施例の処理を説明するための図である。
【図3】従来システムの処理を説明するための図である。
【符号の説明】
100 ホストコンピュータ
101 OS
102 VIS
103 TOM/EDF
110 自動化機器障害復旧システム
120 コンソール
130 自動化機器(ATM端末)
140 自動化機器情報
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a failure automatic recovery technique, and more particularly, to a system, a method, and a program capable of performing control for automatically reconnecting a session to an automated device existing on a network when a session failure occurs.
[0002]
[Prior art]
FIG. 3 shows a typical example of the processing of a conventional system for controlling an automation device. The processing procedure of the conventional system will be described with reference to FIG.
[0003]
The operator monitors (visually) the output of the terminal session failure message to the console (operation console). When the console message (B11) (terminal failure message) is displayed on the console (for example, "VISC39 terminal = Open processing of XXXX terminated abnormally"), and the operator detects that a terminal failure message has been output The operator determines whether or not the faulty terminal is an automated device from a terminal information list (a list of terminal configuration information managed by the host), and the operator manually operates the online processing system from a console (operation console). A session connection command (“CV SA TRM = XXXXXX”) for VIS (Versatile Online System) is input (B12).
[0004]
Upon receiving this command input, the VIS performs terminal activation processing for instructing the terminal to start a session connection (B14). If the session connection on the terminal has been successfully started, a console message (B15) (also referred to as a "terminal recovery message, for example," VISC31 terminal = XXXX session start request accepted ") is displayed. If the session connection start at the terminal fails, the VIS outputs a session failure message (B11) to the console.
[0005]
In the operation of automated equipment typified by an automatic teller machine (ATM), a method of operating the automated computer in the event of a failure of a line connecting the host computer of the center and the automated equipment or a failure of the host computer is described below. There has been known a method of improving customer service and service without duplication or duplication of a line connecting a host computer and an automation device (for example, see Patent Document 1). As will be apparent from the following description, unlike the conventional system, the present invention determines a failure of an automated device and automatically generates a command for recovering the failure of the automated device.
[0006]
Further, as a conventional technique for notifying failure information, for example, in a digital wireless network, communication is performed by repeatedly performing a procedure for reconnecting to a partner station at predetermined time intervals for each type of failure detected by the own station. A method is also known (for example, see Patent Document 2).
[0007]
Further, with regard to the online processing system (VIS), in a hot standby compatible loosely coupled multi-hot standby computer system having a plurality of active and standby online processing systems (VIS), a transmission request command from the operator command distribution means is transmitted. The transmission command in which the state of the destination VIS is in the hot standby state is stored in the operator command transmission request holding table. After that, when the hot standby end of the destination VIS is notified, the transmission command is stacked in the operator command transmission request holding table. There is known a system in which a transmission request command is read out and re-input to an operator command distribution means so that a transmission command in which a transmission destination VIS is in a hot standby mode is not lost (for example, Patent Document 1). 3 participants ).
[0008]
[Patent Document 1]
Japanese Patent No. 2944138 (page 2-3, FIG. 1)
[Patent Document 2]
JP-A-5-37434 (pages 2-3, FIGS. 1 and 3)
[Patent Document 3]
Japanese Patent Application Laid-Open No. 5-265986 (page 3, FIG. 1)
[0009]
[Problems to be solved by the invention]
By the way, the conventional system described with reference to FIG. 3 has a problem that it is difficult to reduce the work load of the operator and there is a possibility that an oversight or the like may occur. The reason is that the operator must constantly monitor the console and monitor output messages, so that the operator cannot stay away from the console and visually monitor the console messages for oversight of failures. May occur.
[0010]
Further, the conventional system has a problem that it lacks immediacy. That is, in the conventional system, even if the message is confirmed, the operator thereafter refers to the terminal information list to determine whether or not the device is an automated device, and the operator manually inputs a session connection command for VIS. , A series of work is required. Therefore, it takes at least about one minute from the output of the console message for notifying the occurrence of the failure to the start of the recovery processing.
[0011]
Further, the conventional system has a problem that a human error inherent in the manual operation may occur. That is, there is a possibility that the system malfunctions due to an erroneous input of the session connection command to the VIS by the operator.
[0012]
Accordingly, it is an object of the present invention to provide a system, a method, and a program for improving the efficiency of a failure recovery process, reducing the load of monitoring work, and improving reliability.
[0013]
[Means for Solving the Problems]
According to one aspect of the present invention, there is provided an operation management system that is connected to at least one terminal including an automation device and receives a console message, and an automation device failure recovery device that controls a failure recovery of the automation device. By a host computer including a system, a failure recovery method for the automated equipment,
The operation management system receiving a console message output when a failure occurs in the terminal, the automated device failure recovery system, to notify the failure information of the terminal,
The automated equipment failure recovery system that has received the notification of the failure information determines whether the terminal in which the failure has occurred is an automated equipment, and performs the recovery processing of the automated equipment when the terminal is an automated equipment. Automatically generating a command for
The automated equipment failure recovery system, issuing a command for performing the recovery process for the terminal,
including. According to the method of the present invention, the monitoring and recovery processing of the occurrence of a failure is automated, and the processing efficiency is improved.
[0014]
In the method according to the present invention, the automated equipment failure recovery system receiving the notification of the failure information determines whether the terminal is an automated equipment by referring to a storage device storing configuration information of the terminal. May be included.
[0015]
In the method according to the present invention, if a failure is not recovered at the terminal where the command for performing the recovery process is issued from the automated equipment failure recovery system, the host computer is configured to operate at a maximum, a predetermined number of times. A retry may be performed.
[0016]
In the method according to the present invention, when the session connection processing has failed in the terminal, the automated equipment failure recovery system that has received the notification of the failure information automatically generates a command for instructing the terminal to start a session connection processing. Then, control may be performed so as to output to the terminal.
[0017]
According to another aspect of the present invention, there is provided a system including at least one terminal including an automation device and a host computer connected to the terminal via a network, wherein the host computer controls an automation for controlling a failure recovery of the automation device. Equipment failure recovery means, comprising: a console message that is output when a failure occurs in the terminal, and a means for notifying the automated equipment failure recovery means of failure information of the terminal, wherein the automated equipment failure recovery means In response to the notification of the failure information, it is determined whether or not the terminal in which the failure has occurred is an automated device. If the terminal is an automated device, a command for performing a recovery process of the automated device is automatically generated. Means for controlling the terminal to issue a command for performing the generated recovery process to the terminal. .
[0018]
In the system according to the present invention, the failure recovery unit may be configured to determine whether the terminal is an automated device with reference to an automated device information table stored in a storage device in advance.
[0019]
In the system according to the present invention, the failure recovery unit issues a command for performing a recovery process of the automated device to the terminal, and when not receiving a notification from the terminal that recovery has been performed, the host computer sets a predetermined value. The retry may be performed for the set number of times.
[0020]
A computer program according to still another aspect of the present invention includes: a host computer that connects to at least one terminal including an automation device via a network;
(A) when receiving a console message output when a failure occurs in the terminal, a process of notifying the failure information of the terminal to the automated device failure recovery process;
(B) In the automated equipment failure recovery processing receiving the notification of the failure information, it is determined whether or not the terminal in which the failure has occurred is an automated equipment, and if the terminal is an automated equipment, recovery of the automated equipment is performed. A process for automatically generating a command for performing the process,
(C) in the automated equipment failure recovery processing, a program for executing a command for performing the recovery processing to the terminal.
[0021]
In the program according to the present invention, in the process (b), the activated fault recovery system refers to an automated device information table stored in a storage device in advance, and determines whether the terminal is an automated device. The host computer may be made to execute a process of determining whether or not the determination is affirmative.
[0022]
In the above program according to the present invention, a command for performing a recovery process of the automated device is issued to the terminal, and if a notification of the recovery is not received from the terminal, the host computer performs a predetermined maximum number of times. The host computer may be configured to execute a process of controlling the retry of the recovery process by the amount.
[0023]
BEST MODE FOR CARRYING OUT THE INVENTION
An embodiment of the present invention will be described. FIG. 1 is a diagram showing a configuration of an embodiment of the present invention. Referring to FIG. 1, in the system according to the present embodiment, a host 100 including a computer system connected to an ATM terminal 130 serving as an automation device through a network performs online control in cooperation with an operating system 101 and the operating system 101. VIS (Versatile Online System) 102 which forms an online processing system, TOM / EDF (Total Operation Management System / Event Drive Facility) 103 which is an event-driven system which is responsible for the operation and management of the system, and an automated equipment failure recovery system 110 , A console (operation console) 120 of the host, and a storage device that stores the automation device information 140.
[0024]
The TOM / EDF 103 receives an output of a system console message (for example, a failure message display) generated by the computer system, and automatically generates a system console command on behalf of the operator (that is, instead of the operator inputting from the console terminal 120). This system supports labor saving and automation of system operation.
[0025]
The automated equipment failure recovery system 110 refers to the automated equipment information 140 when receiving the notification of the failure information from the TOM / EDF 103, and issues a connection command to the VIS 102 when the terminal is an automated equipment. (A program system executed on the host 100).
[0026]
The automated device information 140 is a table storing configuration information of all ATM devices connected by the host 100 and managed by the host 100. When there is a change in the ATM device, the configuration is updated to the latest one each time. It is an information management table. Although FIG. 1 shows only one ATM terminal for simplicity, the number of ATM terminals is not limited to one, but may be plural.
[0027]
Hereinafter, a specific operation example of the embodiment shown in FIG. 1 will be described as an example of the present invention. FIG. 2 is a flowchart for explaining the operation of the present embodiment. The operation of the present embodiment will be described with reference to FIGS.
[0028]
When an attempt is made to connect a session to the ATM terminal 130 (hereinafter, also simply referred to as a “terminal”), but the session connection process fails for some reason, the VIS 102 of the host 100 issues a session failure message (console message). (“VISC39 terminal = XXXXX open processing terminated abnormally”) is issued (A11). In the console message, “XXXXX” of “terminal = XXXXX” is a definition ID (identification code) in the VIS 102 of the ATM terminal, and is composed of, for example, four digits and one alphabetic character. The session failure message is passed to the TOM / EDF 103 as a text code.
[0029]
The TOM / EDF 103 receives and analyzes the console message (“VISC39 terminal = XXXXX open processing terminated abnormally”), recognizes that it is a message that notifies a failure in the session connection processing of the terminal, and recognizes the TOM / EDF 103 as a message. Notifies the automated equipment failure recovery system 110 of the failure information. More specifically, the TOM / EDF 103 uses the start command (for example, “/ TC SA TRM = XXXXXX”) for the failed terminal (ID = XXXXXX) as the failure information to be notified to the automated equipment failure recovery system 110 (for example, “/ TC SA TRM = XXXXXX”). Direct command) (A12).
[0030]
The automated equipment failure recovery system 110 receives a command (“/ TC SA TRM = XXXXXX”) (A13) for notifying failure information from the TOM / EDF 103, and determines whether the terminal (ID = XXXXXX) is an automated equipment. The determination is made with reference to the information table (A14: corresponding to 140 in FIG. 1). The automated device information table includes at least the ID of a terminal connected to the host 100 and information indicating whether the terminal is an automated device.
[0031]
If the automated equipment failure recovery system 110 determines that the failed terminal is an automated equipment (ATM equipment), it automatically generates a session connection command (“CV SA TRM = XXXXX”) (A15) for the VIS 102. , Automatically issued for devices. In the session connection command, “XXXXXX” of “TRM = XXXXX” is a definition ID (identification code) in the VIS 102 of the ATM terminal 130. When the ATM terminal 130 receives this command from the VIS 102, the ATM terminal 130 Perform connection processing. In this embodiment, it is assumed that the ATM terminal 130 and the host 100 are connected at a network level (physical layer or network layer, etc.), and the terminal performs an automatic failure recovery of session connection processing at the terminal. And
[0032]
Then, for the same terminal, session connection processing is continuously performed up to three times, for example, as retry processing. At the time of the fourth error in the session connection processing of the retry processing, a failure message is output to the console, and the automatic failure recovery processing is interrupted.
[0033]
Upon receiving the session connection command (A15), the VIS 102 performs a terminal activation process (A17). That is, "CV SA TRM = XXXXXX" is issued to the ATM terminal 130, and the terminal XXXXXX is instructed to start the session connection processing (A17).
[0034]
The ATM terminal 130 receives an instruction to start the session connection process, and if the session connection process is successful, the VIS 102 displays a terminal recovery message (A18) as a console message if the session connection process is successful.
[0035]
The time from when the failure message (console message) due to the failure of the session connection processing at the ATM terminal 130 was output to when the session connection processing at the failure ATM terminal 130 was completed was measured. It turns out that it only takes about a while.
[0036]
Although the present invention has been described with reference to the above embodiment, the present invention is not limited to the configuration of the above embodiment and can be made by those skilled in the art within the scope of the claims. Needless to say, various changes and modifications that may be included are included.
[0037]
【The invention's effect】
As described above, according to the present invention, it takes only a few seconds, for example, from the output of the failure message due to the failure of the session connection at the terminal to the completion of the session connection processing at the terminal. Further, according to the present invention, it is possible to eliminate leakage of monitoring by a manual monitoring method and the like, and to reduce a load on monitoring (work burden on an operator). That is, according to the present invention, the monitoring / fault recovery processing can be made more efficient.
[0038]
Further, according to the present invention, it is possible to prevent malfunction of the system due to erroneous input by an operator when issuing a session connection command, and to improve the reliability of the system.
[Brief description of the drawings]
FIG. 1 is a diagram showing a configuration of an embodiment of the present invention.
FIG. 2 is a diagram for explaining processing according to one embodiment of the present invention;
FIG. 3 is a diagram for explaining processing of a conventional system.
[Explanation of symbols]
100 Host computer 101 OS
102 VIS
103 TOM / EDF
110 automated equipment failure recovery system 120 console 130 automated equipment (ATM terminal)
140 Automated device information

Claims (12)

自動化機器よりなる少なくとも1つの端末とネットワーク接続し、コンソールメッセージを受け取るオペレーション管理システムと、自動化機器の障害復旧を制御する自動化機器障害復旧システムとを少なくとも含むホストコンピュータによる、前記自動化機器の障害復旧方法であって、
前記端末での障害発生時に出力されるコンソールメッセージを受けた前記オペレーション管理システムが、前記自動化機器障害復旧システムに対して、端末の障害情報を通知するステップと、
前記障害情報の通知を受けた前記自動化機器障害復旧システムが、前記障害が発生した端末が自動化機器であるか否か判定し、前記端末が自動化機器である場合、前記自動化機器の復旧処理を行うためのコマンドを自動生成するステップと、
前記自動化機器障害復旧システムが、前記復旧処理を行うためのコマンドを前記端末向けに発行するステップと、
を含む、ことを特徴とする、自動化機器の障害復旧方法。
A fault recovery method for an automated device by a host computer including at least an operation management system connected to at least one terminal including an automated device and receiving a console message, and an automated device fault recovery system for controlling a fault recovery of the automated device And
The operation management system receiving a console message output when a failure occurs in the terminal, the automated device failure recovery system, to notify the failure information of the terminal,
The automated equipment failure recovery system that has received the notification of the failure information determines whether the terminal in which the failure has occurred is an automated equipment, and performs the recovery processing of the automated equipment when the terminal is an automated equipment. Automatically generating a command for
The automated equipment failure recovery system, issuing a command for performing the recovery process for the terminal,
A method for recovering a failure of an automated device, comprising:
前記障害情報の通知を受けた前記自動化機器障害復旧システムが、端末の構成情報を記憶した記憶装置を参照して、前記端末が自動化機器であるか否かを判定するステップを含む、ことを特徴とする請求項1記載の自動化機器の障害復旧方法。The automated equipment failure recovery system having received the notification of the failure information includes a step of referring to a storage device storing configuration information of the terminal to determine whether the terminal is an automated equipment. 2. The method for recovering failure of an automated device according to claim 1. 前記自動化機器障害復旧システムより前記復旧処理を行うためのコマンドが発行された前記端末において障害が復旧しない場合、前記ホストコンピュータは、最大、予め定められた回数分だけ、前記復旧処理の再試行を行う、ことを特徴とする請求項1記載の自動化機器の障害復旧方法。If the failure has not been recovered at the terminal where the command for performing the recovery process has been issued from the automated equipment failure recovery system, the host computer will retry the recovery process a maximum of a predetermined number of times. 2. The method according to claim 1, wherein the method is performed. 前記端末でセッション接続処理に失敗したときに、障害情報の通知を受けた前記自動化機器障害復旧システムは、前記端末にセッション接続処理の開始を指示するコマンドを自動生成し、前記コマンドを前記端末に対して出力するように制御する、ことを特徴とする請求項1記載の自動化機器の障害復旧方法。When the session connection processing has failed at the terminal, the automated equipment failure recovery system that has received the notification of the failure information automatically generates a command instructing the terminal to start a session connection processing, and sends the command to the terminal. 2. The method according to claim 1, wherein the output is controlled so as to be output to the automatic equipment. 自動化機器よりなる少なくとも1つの端末と、
前記端末とネットワーク接続するホストコンピュータと、
を含むシステムにおいて、
前記ホストコンピュータは、
自動化機器の障害復旧を制御する自動化機器障害復旧手段と、
前記端末での障害発生時に出力されるコンソールメッセージを受け取り、前記自動化機器障害復旧手段に対して端末の障害情報を通知する手段と、
を備え、
前記自動化機器障害復旧手段は、障害情報の通知を受けた場合に、障害が発生した端末が自動化機器であるか否かを判定し、前記端末が自動化機器の場合、前記自動化機器の復旧処理を行うためのコマンドを自動生成し、前記生成した復旧処理を行うためのコマンドを前記端末向けに発行する制御を行う手段を備えている、ことを特徴とする自動化機器障害復旧システム。
At least one terminal comprising automated equipment;
A host computer for network connection with the terminal;
In a system that includes
The host computer,
Automated equipment failure recovery means for controlling automated equipment failure recovery;
Means for receiving a console message output when a failure occurs in the terminal, and notifying the automated equipment failure recovery means of terminal failure information,
With
The automated equipment failure recovery unit, when receiving the notification of the failure information, determines whether the terminal in which the failure has occurred is an automated equipment, and when the terminal is an automated equipment, performs a recovery process of the automated equipment. An automatic equipment failure recovery system, comprising: means for automatically generating a command for performing the processing, and performing control for issuing a command for performing the generated recovery processing to the terminal.
前記ホストコンピュータは、接続する端末の構成情報として、少なくとも前記端末が自動化機器であるか否かに関する情報を格納する記憶装置を備え、
前記自動化機器障害復旧手段は、前記記憶装置を参照して、前記端末が自動化機器であるか否かを判定する、ことを特徴とする請求項5記載の自動化機器障害復旧システム。
The host computer includes, as configuration information of a terminal to be connected, a storage device that stores at least information on whether the terminal is an automated device,
6. The automated equipment failure recovery system according to claim 5, wherein the automated equipment failure recovery unit refers to the storage device and determines whether the terminal is an automated equipment.
前記自動化機器障害復旧手段が、前記自動化機器の復旧処理を行うためのコマンドを前記端末向けに発行したのち、前記端末より復旧した旨の通知を受けない場合、前記ホストコンピュータは、最大、予め定められた回数分だけ、復旧処理の再試行を行うように制御する、ことを特徴とする請求項5記載の自動化機器障害復旧システム。After the automated device failure recovery unit issues a command for performing the automated device recovery process to the terminal, and does not receive a notification that the automated device has been recovered from the terminal, the host computer may perform a predetermined maximum. 6. The automated equipment failure recovery system according to claim 5, wherein control is performed so that the recovery processing is retried as many times as the number of times. 前記端末でセッション接続処理に失敗したときに、障害情報の通知を受けた前記自動化機器障害復旧手段は、前記端末にセッション接続処理の開始を指示するコマンドを自動生成し、前記コマンドを前記端末向けに出力する制御を行う、ことを特徴とする請求項5記載の自動化機器障害復旧システム。When the session connection processing has failed at the terminal, the automated equipment failure recovery unit that has received the notification of the failure information automatically generates a command for instructing the terminal to start a session connection processing, and transmits the command to the terminal. 6. The automatic equipment failure recovery system according to claim 5, wherein control is performed to output to the automatic equipment. 自動化機器よりなる少なくとも1つの端末とネットワーク接続するホストコンピュータに、
(a)前記端末での障害発生時に出力されるコンソールメッセージを受けとり、自動化機器障害復旧処理に対して、端末の障害情報を通知する処理と、
(b)前記障害情報の通知を受けた前記自動化機器障害復旧処理において、前記障害が発生した端末が自動化機器であるか否か判定し、前記端末が自動化機器である場合、前記自動化機器の復旧処理を行うためのコマンドを自動生成する処理と、
(c)前記自動化機器障害復旧処理において、前記復旧処理を行うためのコマンドを前記端末向けに発行する処理と、
を実行させるプログラム。
A host computer for network connection with at least one terminal comprising an automation device,
(A) receiving a console message output when a failure occurs in the terminal, and notifying the failure information of the terminal to the automated equipment failure recovery processing;
(B) In the automated equipment failure recovery processing receiving the notification of the failure information, it is determined whether or not the terminal in which the failure has occurred is an automated equipment, and if the terminal is an automated equipment, recovery of the automated equipment is performed. A process for automatically generating a command for performing the process,
(C) in the automated equipment failure recovery processing, processing for issuing a command for performing the recovery processing to the terminal;
A program that executes
請求項9記載のプログラムにおいて、
前記(b)の処理において、前記自動化機器障害復旧処理は、端末が自動化機器であるか否かに関する情報を記憶した記憶装置を参照して、前記端末が自動化機器であるか否かを判定する処理を、前記ホストコンピュータに実行させるプログラム。
The program according to claim 9,
In the process (b), the automated device failure recovery process determines whether the terminal is an automated device with reference to a storage device that stores information on whether the terminal is an automated device. A program for causing the host computer to execute processing.
請求項9記載のプログラムにおいて、
前記復旧処理を行うコマンドを前記端末向けに発行したのち、前記端末より復旧した旨の通知を受けない場合、前記ホストコンピュータは、最大、予め定められた回数分だけ、復旧処理の再試行を行うように制御する処理を、前記ホストコンピュータに実行させるプログラム。
The program according to claim 9,
After issuing a command for performing the recovery process to the terminal, if the recovery notification is not received from the terminal, the host computer retries the recovery process a maximum of a predetermined number of times. For causing the host computer to execute the process of controlling as described above.
請求項9記載のプログラムにおいて、
前記端末でセッション接続処理に失敗したときに、障害情報の通知を受けた前記自動化機器障害復旧処理において、前記端末にセッション接続処理の開始を指示するコマンドを自動生成して前記端末向けに出力するように制御する処理を、前記ホストコンピュータに実行させるプログラム。
The program according to claim 9,
When the terminal fails in the session connection process, in the automated device failure recovery process receiving the notification of the failure information, a command for instructing the terminal to start the session connection process is automatically generated and output to the terminal. For causing the host computer to execute the process of controlling as described above.
JP2003014304A 2003-01-23 2003-01-23 Automated equipment failure restoring system, method, and program Pending JP2004227288A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003014304A JP2004227288A (en) 2003-01-23 2003-01-23 Automated equipment failure restoring system, method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003014304A JP2004227288A (en) 2003-01-23 2003-01-23 Automated equipment failure restoring system, method, and program

Publications (1)

Publication Number Publication Date
JP2004227288A true JP2004227288A (en) 2004-08-12

Family

ID=32902391

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003014304A Pending JP2004227288A (en) 2003-01-23 2003-01-23 Automated equipment failure restoring system, method, and program

Country Status (1)

Country Link
JP (1) JP2004227288A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108429629A (en) * 2017-02-14 2018-08-21 腾讯科技(深圳)有限公司 Equipment fault restoration methods and device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108429629A (en) * 2017-02-14 2018-08-21 腾讯科技(深圳)有限公司 Equipment fault restoration methods and device

Similar Documents

Publication Publication Date Title
US7900087B2 (en) Method and apparatus for correlating an out-of-range condition to a particular power connection
JPH03164837A (en) Spare switching system for communication control processor
JP4806382B2 (en) Redundant system
JP2004227288A (en) Automated equipment failure restoring system, method, and program
JP2003345620A (en) Process monitoring method for multi-node cluster system
JP2008140280A (en) Reliability enhancing method in operation management of server
US11954509B2 (en) Service continuation system and service continuation method between active and standby virtual servers
JP2005275438A (en) Automated equipment failure recovery system
JP3420919B2 (en) Information processing device
JPS62169266A (en) Data transmission and reception terminal equipment
JP2000020336A (en) Duplex communication system
JP2513127B2 (en) Hot standby high-speed switching system
JPH07321799A (en) Input output equipment management method
US6480466B1 (en) Terminal switching apparatus and method
JPH11338724A (en) Standby system, standby method and recording medium
JP2000057108A (en) Switching test method for duplex computer system, monitoring device for it, and computer readable recording medium
JPH04242467A (en) Combined computer system
JPH02310755A (en) Health check system
CN117579465A (en) Fault processing method, device, equipment and storage medium
JP2699291B2 (en) Power failure processing device
JPH06290126A (en) Fault monitoring system for computer system
JPS58169623A (en) Program loading system of communication control processor
JP2008123071A (en) Automatic transaction system, automatic transaction device, and program placement method in automatic transaction system
JP2002157358A (en) Method for facilitating measures to failure and method for processing data and device for the same and electrical appliance and information storage medium
JP2007058679A (en) Process management system, process management method and redundant system

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070227

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070703