JP4358034B2 - Monitoring system - Google Patents

Monitoring system Download PDF

Info

Publication number
JP4358034B2
JP4358034B2 JP2004154738A JP2004154738A JP4358034B2 JP 4358034 B2 JP4358034 B2 JP 4358034B2 JP 2004154738 A JP2004154738 A JP 2004154738A JP 2004154738 A JP2004154738 A JP 2004154738A JP 4358034 B2 JP4358034 B2 JP 4358034B2
Authority
JP
Japan
Prior art keywords
recovery
execution
management
device control
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004154738A
Other languages
Japanese (ja)
Other versions
JP2005339015A (en
Inventor
真吾 加室
純一 宮川
和久 鈴木
郁紀 森谷
一朗 橋本
直宏 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2004154738A priority Critical patent/JP4358034B2/en
Publication of JP2005339015A publication Critical patent/JP2005339015A/en
Application granted granted Critical
Publication of JP4358034B2 publication Critical patent/JP4358034B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

本発明は、外部装置に対して装置制御要求を行うともに、装置制御要求に係わる監視システムのテーブルを更新する場合に、システムや外部装置において処理が異常終了となったときに、外部装置のテーブルと監視システムのテーブルのデータの整合性を取るための復旧を行う復旧システムに関する。   The present invention provides a device control request to an external device and updates the monitoring system table related to the device control request, and when the processing ends abnormally in the system or the external device, the external device table The present invention relates to a recovery system that performs recovery for ensuring consistency of data in a monitoring system table.

通信等の分野において、NE(Network Element)等の伝送装置及び伝送装置間を接続する伝送路により構成されるネットワークを管理するためにネットワークオペレーションシステムが設けられる。ネットワークオペレーションシステムは、複数のNEを経由する通信経路(以下、パス)を設定するためのパス設定、パス変更、パス解放、ルートの帯域制限等の帯域制御実行、帯域制御解除等の装置制御を実行する。   In the field of communication and the like, a network operation system is provided to manage a network constituted by transmission devices such as NE (Network Element) and transmission paths connecting the transmission devices. The network operation system performs device control such as path setting for path setting, path change, path release, route band limiting, etc., and band control cancellation for setting communication paths (hereinafter referred to as paths) through a plurality of NEs. Execute.

ネットワークオペレーションシステムは、例えば、パス設定について、パス設定に係わる情報をテーブルに管理しており、パス上に位置する複数のNEに対してパス設定要求を行うとともに、パス設定に係わる情報についてテーブルを更新する。一方、パス設定要求を受けた各NEは、パス設定に係わるテーブルを更新する。   The network operation system manages, for example, information related to path setting in a table for path setting, makes a path setting request to a plurality of NEs located on the path, and stores a table for information related to path setting. Update. On the other hand, each NE that has received a path setting request updates a table related to path setting.

このように、ネットワークオペレーションシステムは、複数のNEに対して複数の装置制御要求を行うとともに装置制御要求に係わる自システムのテーブルを更新する。複数のNEは、装置制御要求に基づいて自装置のテーブルを更新する。   In this way, the network operation system makes a plurality of device control requests to a plurality of NEs and updates the table of its own system related to the device control request. The plurality of NEs update their own table based on the device control request.

しかし、NEに対する装置制御要求についてのNEにおける処理が該NEの装置故障や伝送路障害等に起因して異常終了する場合がある。このとき、複数のNEに対する複数の装置制御要求について、ネットワークオペレーションシステムや一部のNEにおいて正常終了し、他のNEにおいて異常終了した場合には、ネットワークオペレーションシステムのテーブルとNEのテーブルの内容に整合性が取れなくなってしまう。   However, there is a case where the processing at the NE regarding the device control request to the NE ends abnormally due to the NE device failure, transmission line failure, or the like. At this time, when a plurality of device control requests to a plurality of NEs are normally terminated in the network operation system or some NEs and abnormally terminated in other NEs, the contents of the network operation system table and the NE table are changed. Consistency is lost.

例えば、パス設定要求について、正常終了したネットワークオペレーションシステムやNEではテーブルがパス設定された状態を意味し、異常終了したNEではテーブルがパス設定されていない状態を意味することから、ネットワークオペレーションシステム、正常終了したNE、異常終了したNEのテーブルの内容の整合性が取れない。そのため、ネットワークオペレーションシステムのテーブルとNEのテーブルの内容の整合性を取るための復旧を行う必要がある。   For example, for a path setting request, a network operation system or NE that has ended normally means that the table has been set for a path, and an NE that has ended abnormally means that the table has not been set for a path. The consistency of the table contents of NEs that have ended normally and NEs that ended abnormally cannot be obtained. Therefore, it is necessary to perform recovery to ensure consistency between the contents of the network operation system table and the NE table.

以下、ネットワークオペレーションシステムのように複数のNEに対して装置制御要求を行うとともに自システムのテーブルの更新を行うシステムを監視システムと呼び、NEのように監視システムの装置制御要求に基づいてテーブルの更新を行う外部装置を装置と略して呼ぶ。また、ネットワークオペレーションシステムが他のネットワークオペレーションシステムを介して他のNEに装置制御要求を行う場合の他のネットワークオペレーションシステムを他システムと呼ぶ。   Hereinafter, a system that makes a device control request to a plurality of NEs, such as a network operation system, and updates the table of its own system is called a monitoring system. An external device that performs updating is referred to as a device for short. In addition, another network operation system when the network operation system makes a device control request to another NE via another network operation system is referred to as another system.

従来の復旧方法として、監視システムが装置制御要求を行った装置に対して、装置状態を初期状態に初期化し、その後、監視システムのテーブルの内容を元に装置制御要求を行うことにより複数の外部装置のテーブルを復旧する方法があった。   As a conventional recovery method, a device that has made a device control request by the monitoring system is initialized to the initial state, and then a plurality of external devices are made by making a device control request based on the contents of the monitoring system table. There was a way to restore the device table.

先行技術文献として、下記の特許文献1がある。   There exists the following patent document 1 as a prior art document.

特許文献1は、監視システムがデータベースの更新内容を示す更新情報を更新履歴ファイルに格納し、更新情報の更新履歴ファイルへの記録の有無を管理する履歴管理マップを更新履歴ファイルとデータベースに対して設け、障害復旧時にはこの両者を対比して相違する更新情報を抽出して更新することにより、データベース更新操作中にシステムダウンの障害が発生してメモリ展開中に消失した更新情報を迅速に復旧することを開示している。
特開平9−204335号公報
In Patent Document 1, a monitoring system stores update information indicating update contents of a database in an update history file, and a history management map for managing whether or not update information is recorded in the update history file is provided for the update history file and the database. In the event of a failure recovery, the update information that is different from each other is extracted and updated, so that the update information lost during the memory expansion due to a system down failure during the database update operation can be recovered quickly. It is disclosed.
JP-A-9-204335

しかしながら、従来の復旧方法では以下の問題点があった。   However, the conventional recovery method has the following problems.

従来の復旧方法は、装置状態を初期化してから直前又は実行後の状態とするまでの処理に時間を要し、復旧までの時間がかかるという問題点があった。また、処理に関係する複数の装置が故障等の原因で初期化状態に戻せない場合に、復旧処理が終了できないため、システムが復旧処理以外の処理を行えず、システムが停止してしまうといった問題があった。   The conventional recovery method has a problem that it takes time to initialize the apparatus state to the state immediately before or after execution, and it takes time to recover. In addition, when multiple devices related to the process cannot be returned to the initialization state due to a failure or the like, the recovery process cannot be completed, so the system cannot perform a process other than the recovery process and the system stops. was there.

従来は、障害発生直前のテーブルの内容は管理できていたが、処理の過程、すなわち、各装置に複数の装置制御要求が行われる場合に、どの装置制御要求について処理済みであるか管理できていないために、処理済みの状態を元に復旧処理、例えば、外部装置を処理前の状態/処理済みの状態から以降の処理に復旧することができなかった。   Conventionally, the contents of the table immediately before the failure occurred can be managed. However, in the process, that is, when a plurality of device control requests are made to each device, it is possible to manage which device control request has been processed. Therefore, recovery processing based on the processed state, for example, the external device cannot be recovered from the state before processing / the state after processing to the subsequent processing.

例えば、パス設定の装置制御要求が端点生成、クロスコネト生成の二つの装置制御要求を行う必要がある場合に、端点生成で異常終了した場合とクロスコネクト生成で異常終了した場合では、復旧処理の手順が異なるために、どの装置制御要求で異常終了したかを管理できていないことから、処理前の状態/処理済みの状態から復旧することができない。尚、以降の説明において、処理実行前の状態に戻すことに限らず、処理実行後の状態に進めることも復旧処理と呼ぶ。   For example, when the path setting device control request needs to make two device control requests, endpoint generation and cross-connect generation, the procedure for recovery processing will occur if the endpoint generation ends abnormally and the cross-connect generation ends abnormally. Therefore, since it is not possible to manage which device control request causes abnormal termination, it is not possible to recover from the state before processing / the state after processing. In the following description, not only returning to the state before the process execution but also proceeding to the state after the process execution is called a recovery process.

また、特許文献1は監視システムのデータベースの復旧ができるが、装置のデータベースの復旧ができないという問題点があった。   Moreover, although patent document 1 can recover | restore the database of a monitoring system, there existed a problem that the database of an apparatus could not be recovered.

本発明の目的は、上記を鑑みてなされたものであり、外部装置に対して初期化処理行わずに、処理済みの状態を元に復旧処理を行うことにより、迅速に復旧ができること、装置故障が発生して復旧処理が実施できない場合でも、システムが停止することのない監視システムを提供することである。   The object of the present invention has been made in view of the above, and by performing a recovery process based on a processed state without performing an initialization process for an external apparatus, it is possible to quickly recover, and an apparatus failure It is to provide a monitoring system in which the system does not stop even when the recovery process cannot be performed due to the occurrence of the problem.

本発明の一側面によれば、装置制御要求に基づいて装置情報を格納する第1の情報テーブルを更新する複数の外部装置に対して前記装置制御要求を行うとともに該装置制御要求に係わる処理実行情報を格納する第2の情報テーブルを更新する装置制御処理部と、前記装置制御要求を前記外部装置に対して行うとき、該装置制御要求に係わる要求内容及び該装置制御要求対象の外部装置を特定する管理情報を第3の情報テーブルに格納する管理情報処理部と、該装置制御要求に係わる前記第2のテーブルに格納された該装置制御要求を行う前の処理実行前情報を第4の情報テーブルに格納する処理実行前情報格納部と、前記装置制御要求に対する処理が異常終了した場合に、前記第3の情報テーブルに格納された当該装置制御要求に係わる管理情報により特定される要求内容に基づいて、該処理実行前又は処理実行後の装置状態にするための装置制御要求を該外部装置に対して実施するよう制御する復旧制御部とを具備したことを特徴とする監視システムが提供される。   According to one aspect of the present invention, the device control request is made to a plurality of external devices that update the first information table that stores device information based on the device control request, and processing related to the device control request is executed. A device control processing unit that updates a second information table for storing information, and when the device control request is made to the external device, a request content related to the device control request and an external device that is the device control request target A management information processing unit that stores management information to be specified in a third information table, and information before processing execution before the device control request stored in the second table related to the device control request is stored in the fourth information table. A pre-processing information storage unit stored in the information table, and management related to the device control request stored in the third information table when the processing for the device control request ends abnormally A recovery control unit that controls the external device to execute a device control request for setting the device state before or after the execution of the processing based on the request content specified by the information. A characteristic monitoring system is provided.

請求項1記載の発明によれば、第3の情報テーブルに第2の情報テーブルに格納されていた処理実行前情報、処理内容及び制御対象の外部装置を特定する情報を格納するので、外部装置を初期設定して復旧することなく、装置制御要求前の状態から復旧することができ、迅速な復旧が可能となる。   According to the first aspect of the present invention, the pre-process execution information, the processing content, and the information for specifying the external device to be controlled stored in the second information table are stored in the third information table. It is possible to recover from the state before the device control request without initial setting and recovery, and quick recovery becomes possible.

本発明の実施形態の説明をする前に本発明の原理について説明する。図1は本発明の原理図である。図1に示すように、監視システム10は、第2,第3,第4の情報テーブル12,16,20、装置制御処理部14、管理情報処理部16、処理実行前情報格納部22及び復旧制御部24を具備する。複数の外部装置4#i(i=1〜n)は第1の情報テーブル2#i(i=1〜n)を具備する。   Before describing the embodiment of the present invention, the principle of the present invention will be described. FIG. 1 shows the principle of the present invention. As shown in FIG. 1, the monitoring system 10 includes second, third, and fourth information tables 12, 16, and 20, an apparatus control processing unit 14, a management information processing unit 16, a pre-processing information storage unit 22, and a recovery. A control unit 24 is provided. The plurality of external devices 4 # i (i = 1 to n) include a first information table 2 # i (i = 1 to n).

装置制御処理部14は、複数の外部装置4#i(i=1,…,)に対して装置制御要求を行うとともに該装置制御要求に係わる処理実行情報を格納する第2の情報テーブル12を更新する。外部装置4#i(i=1,…,)は装置制御要求に基づいて装置情報を格納する第1の情報テーブル2#iを更新する。   The device control processing unit 14 makes a second information table 12 that makes a device control request to a plurality of external devices 4 # i (i = 1,...) And stores processing execution information related to the device control request. Update. The external device 4 # i (i = 1,...) Updates the first information table 2 # i that stores device information based on the device control request.

管理情報処理部18は装置制御要求を外部装置4#i(i=1,…,)に対して行うとき、該装置制御要求に係わる要求内容及び該装置制御要求対象の外部装置4#i(i=1,…)を特定する管理情報を第3の情報テーブル16に格納する。処理実行前情報格納部22は、装置制御要求に係わる第2のテーブル12に格納された該装置制御要求を行う前の処理実行前情報を第4の情報テーブル20に格納する。   When the management information processing unit 18 makes a device control request to the external device 4 # i (i = 1,...), The request content related to the device control request and the external device 4 # i ( Management information specifying i = 1,... is stored in the third information table 16. The pre-process execution information storage unit 22 stores in the fourth information table 20 the pre-process execution information stored in the second table 12 related to the apparatus control request and before performing the apparatus control request.

復旧制御部24は、装置制御要求に対する処理が異常終了した場合に、第3の情報テーブル16に格納された当該装置制御要求に係わる管理情報により特定される要求内容に基づいて、処理実行前又は処理実行後の装置状態にするための装置制御要求を外部装置4#i(i=1,…,)に対して実施するよう制御する。これにより、外部装置4#i(i=1,…,)を初期設定して復旧するのではなく、装置制御要求前の状態から復旧することができて迅速な復旧が可能となる。   When the process for the device control request is abnormally terminated, the recovery control unit 24 performs the process before the process execution based on the request content specified by the management information related to the device control request stored in the third information table 16 or Control is performed so that an external device 4 # i (i = 1,...) Issues a device control request for setting the device state after execution of processing. As a result, the external device 4 # i (i = 1,...) Is not initially set and recovered, but can be recovered from the state before the device control request, thereby enabling quick recovery.

図2は本発明の実施形態による監視システムを含む全体構成図である。監視システムは、複数の装置や他の監視システムを介して同期をとって動作する複数処理を行うシステムに適用される。ここでは、本実施形態では複数のNEと複数の伝送路により構成されるネットワークシステムを監視するネットワークオペレーションシステムの場合を例に説明する。図2に示すように、複数の監視システム50,100、監視システム50により監視される複数の外部装置52#A〜52#D及び伝送路により構成される伝送ネットワーク54、中継システム又は中継ネットワーク60及び他監視システム100により監視される複数の102#A〜102#D及び伝送路により構成される伝送ネットワーク104からネットワークシステムが構成されている。   FIG. 2 is an overall configuration diagram including a monitoring system according to an embodiment of the present invention. The monitoring system is applied to a system that performs a plurality of processes that operate in synchronization through a plurality of devices and other monitoring systems. Here, in this embodiment, a case of a network operation system that monitors a network system constituted by a plurality of NEs and a plurality of transmission paths will be described as an example. As shown in FIG. 2, a plurality of monitoring systems 50, 100, a plurality of external devices 52 #A to 52 #D monitored by the monitoring system 50, and a transmission network 54, a relay system or a relay network 60 including transmission paths. And the network system is comprised from the transmission network 104 comprised by several 102 # A-102 # D and the transmission line monitored by the other monitoring system 100. FIG.

監視システム(システムと略す)50は、本発明によるシステムである。他監視システム(他システムと略す)100は、本発明によるシステム又は従来のシステムであり、システム50が、装置102#A〜102#Dに対して、他システム100を介して装置制御要求を行う。装置52#A〜52#D及び102#A〜102#DはNEである。中継システム又は中継ネットワーク60は伝送ネットワーク54,104間を接続するネットワークである。   A monitoring system (abbreviated as system) 50 is a system according to the present invention. The other monitoring system (abbreviated as another system) 100 is a system according to the present invention or a conventional system, and the system 50 makes a device control request to the devices 102 #A to 102 #D via the other system 100. . Devices 52 # A-52 # D and 102 # A-102 # D are NEs. The relay system or relay network 60 is a network that connects between the transmission networks 54 and 104.

図3は図2中のシステム50の構成図である。システム50は、入出力部150、オペレーション処理部152、複数の処理部154#A,154#B、復旧制御入出力部156、復旧制御部158、実行情報テーブル160、管理IDテーブル162、処理管理情報テーブル164、業務名管理情報テーブル165、処理実行前情報テーブル166、復旧シナリオファイル168及び環境情報テーブル170を具備する。入出力部150,復旧制御入出力部156はパソコン等のコンピュータ上で動作するプログラムや周辺装置により実現される。オペレーション処理部152、処理部154#A,154#B及び復旧制御部158は、コンピュータ上で動作するプログラムにより実現される。このプログラムがコンピュータ上で動作するときに、プロセスと呼ぶ。テーブル160,162,164,166は、メインメモリや磁気ディスク等の周辺装置に格納される。復旧シナリオファイル168は磁気ディスク等の周辺装置に格納される。   FIG. 3 is a block diagram of the system 50 in FIG. The system 50 includes an input / output unit 150, an operation processing unit 152, a plurality of processing units 154 # A and 154 # B, a recovery control input / output unit 156, a recovery control unit 158, an execution information table 160, a management ID table 162, and process management. An information table 164, a business name management information table 165, a pre-processing execution information table 166, a recovery scenario file 168, and an environment information table 170 are provided. The input / output unit 150 and the recovery control input / output unit 156 are realized by a program or a peripheral device operating on a computer such as a personal computer. The operation processing unit 152, the processing units 154 # A and 154 # B, and the recovery control unit 158 are realized by a program that operates on a computer. When this program runs on a computer, it is called a process. The tables 160, 162, 164, 166 are stored in a peripheral device such as a main memory or a magnetic disk. The recovery scenario file 168 is stored in a peripheral device such as a magnetic disk.

入出力部150は、オペレーション処理部152に対して、帯域制限実行、帯域制限解除、パス設定、パス解放、統計情報出力の制御要求を行い、オペレーション処理部152からの制御要求結果を表示する。オペレーション処理部152は、入出力部150より制御要求を受けると、以下の処理を行うプロセスである。   The input / output unit 150 makes a control request for bandwidth limitation execution, bandwidth limitation release, path setting, path release, and statistical information output to the operation processing unit 152, and displays the control request result from the operation processing unit 152. When receiving a control request from the input / output unit 150, the operation processing unit 152 is a process that performs the following processing.

(i) 制御要求に係わる処理を実行する際に、自プロセスが処理実行情報テーブル160を更新する場合、管理IDテーブル162を参照して、当該処理を特定するための一意的な管理IDを生成する。管理ID、プロセス番号、業務名IDより、処理管理情報テーブル164を検索し、一意的な処理管理番号を生成する。管理ID、プロセス番号、業務名ID、処理管理番号、実行結果=実行中、復旧実施可否=初期状態、処理管理情報テーブル164に書き込む。プロセス番号は当該プロセスを特定するための番号であり、例えば、制御要求を実行するプロセスの実行順にシリアルに付与された番号である。業務名IDは、当該制御要求の内容を特定するための番号であり、業務名としては、例えば、帯域制御実行、帯域制御解除、装置状態監視、エマージェンシー、パス設定、パス解放等があり、これらの業務名に対応して業務名IDが予め付与されており、業務名と業務名IDの関係が業務名テーブル165に格納されている。   (I) When executing a process related to a control request, when the own process updates the process execution information table 160, the management ID table 162 is referenced to generate a unique management ID for specifying the process. To do. The process management information table 164 is searched from the management ID, process number, and business name ID, and a unique process management number is generated. Management ID, process number, business name ID, process management number, execution result = execution in progress, recovery execution availability = initial state, and written in the process management information table 164. The process number is a number for specifying the process, and is, for example, a number given serially in the execution order of the process that executes the control request. The business name ID is a number for specifying the content of the control request. Examples of the business name include bandwidth control execution, bandwidth control release, device status monitoring, emergency, path setting, path release, etc. A business name ID is assigned in advance corresponding to the business name, and the relationship between the business name and the business name ID is stored in the business name table 165.

(ii) 処理実行情報テーブル160の更新を行う前に処理実行情報テーブル160より更新に係わる処理実行前情報を取得する。管理番号ID、処理管理番号、装置制御状態及び処理実行前情報を処理実行前情報テーブル162に書き込むとともに、必要に応じて装置制御に係わる処理実行情報テーブル160を更新する。   (Ii) Before updating the process execution information table 160, the process execution information related to the update is acquired from the process execution information table 160. The management number ID, process management number, device control state, and pre-process execution information are written to the pre-process execution information table 162, and the process execution information table 160 related to device control is updated as necessary.

(iii) 入出力部150より指示された制御要求について、当該要求に係わる処理を行う他プロセス、例えば、処理部154#A等のプロセスを起動する。尚、他プロセス154#Aを起動せずに、自プロセス152が他プロセスが行う装置制御を行っても良い。   (Iii) For a control request instructed by the input / output unit 150, another process that performs processing related to the request, for example, a process such as the processing unit 154 # A, is started. Note that the apparatus control performed by the other process may be performed by the own process 152 without starting the other process 154 # A.

(iv) 呼び出したプロセス154#Aの実行結果が正常終了であるとき、更に他のプロセスを呼び出す必要がある場合には、他のプロセス、例えば、処理部154#Bを起動する。   (Iv) When the execution result of the called process 154 # A is a normal end, if another process needs to be called, another process, for example, the processing unit 154 # B is activated.

(v) プロセス154#Bの実行結果が正常終了であり、入出力部150から指示された制御要求に係わる処理が正常終了したとき、自プロセス152,他のプロセス154#A,154#Bが生成した処理実行前情報、処理管理情報、管理IDをそれぞれ処理実行前情報テーブル166、処理管理情報テーブル164、管理IDテーブル162から削除する。   (V) When the execution result of the process 154 # B is normal termination and the processing related to the control request instructed from the input / output unit 150 is normally terminated, the own process 152 and the other processes 154 # A and 154 # B The generated pre-process execution information, process management information, and management ID are deleted from the pre-process execution information table 166, the process management information table 164, and the management ID table 162, respectively.

処理部154#A,154#Bは、(i)オペレーション処理部152より起動されると、オペレーション処理部152と同様にして、処理管理情報を生成して処理管理番号テーブル164に書き込み、処理実行前情報を処理実行前情報テーブル164に書き込む。ii)装置52#A,52#B、他システム100等に対して、帯域制限実行、帯域制限解除、パス設定等、装置制御要求を行う。(iii)装置52#A,52#B、他システム100より正常終了が通知されると装置制御要求に係わる処理実行情報テーブル164を更新するとともに処理実行前情報の実行結果を実行済みに設定する。尚、処理実行情報テーブル160の更新は装置制御要求を行うとともにしても良い。(iv)親プロセスのオペレーション処理部152に処理結果(正常終了/異常終了)を通知する。   When the processing units 154 # A and 154 # B are activated by the operation processing unit 152, the processing units 154 # A and 154 # B generate processing management information and write it in the processing management number table 164 in the same manner as the operation processing unit 152. The previous information is written in the pre-process execution information table 164. ii) A device control request is made to the devices 52 # A, 52 # B, the other system 100, etc., such as bandwidth limitation execution, bandwidth limitation cancellation, path setting, and the like. (Iii) When normal termination is notified from the devices 52 # A, 52 # B and the other systems 100, the processing execution information table 164 related to the device control request is updated and the execution result of the pre-processing information is set to executed. . The process execution information table 160 may be updated together with a device control request. (Iv) The processing result (normal end / abnormal end) is notified to the operation processing unit 152 of the parent process.

処理実行情報テーブル160は装置52#A〜52#D,102#A〜102#Dへの装置制御要求等による処理実行後の帯域制限実行情報やパス設定情報等、処理実行情報を格納するテーブルである。管理IDテーブル162は実行中の管理IDを格納するテーブルである。   The process execution information table 160 is a table for storing process execution information such as bandwidth limitation execution information and path setting information after execution of a process in response to a device control request to the devices 52 # A to 52 # D and 102 # A to 102 # D. It is. The management ID table 162 is a table that stores the management ID being executed.

図4は処理管理情報テーブル164を示す図である。図4に示すように、処理管理情報テーブル164は、管理ID、処理管理番号、プロセス番号、業務名ID、実行結果及び復旧実施可否のカラムから構成される。管理ID、処理管理番号、プロセス番号、業務名IDは上述の通りである。実行結果は、異常終了(−1),初期状態(0),実行中(1),実行済み(2)が処理状態に応じて更新される。復旧実施可否は処理が異常終了した場合に、当該異常終了処理及び当該処理に同期する他の一連の処理について、復旧実施が可能であるか否を示す情報であり、初期状態(0)、復旧実施可(1)が設定される。業務名管理情報テーブル165は、業務名IDと業務名の関係を示す情報を格納するテーブルである。   FIG. 4 shows the process management information table 164. As shown in FIG. 4, the process management information table 164 includes columns of a management ID, a process management number, a process number, a business name ID, an execution result, and whether recovery can be performed. The management ID, process management number, process number, and business name ID are as described above. As for the execution result, abnormal termination (-1), initial state (0), executing (1), executed (2) are updated according to the processing state. Whether or not recovery can be performed is information indicating whether or not recovery can be performed for the abnormal termination process and a series of other processes synchronized with the process when the process ends abnormally. Implementation possible (1) is set. The business name management information table 165 is a table that stores information indicating the relationship between the business name ID and the business name.

図5は処理実行前情報テーブル166を示す図である。図5に示すように、処理実行前情報テーブル166は、管理ID、処理管理番号、自システム状態、装置制御状態情報及び他システム制御状態より構成される。管理ID及び処理管理番号は上述の通りである。自システム状態は処理に係わるテーブルの更新対象を示すものであり、処理が自システムの処理実行情報のみを更新する場合(0)、自システムに係わる装置制御をする場合(1)、他システムに係わる装置制御のみをする場合(2)及び自システムに係わる装置制御と他システムに係わる装置制御とを行う場合(3)のいずれに該当するかを示す状態番号情報が格納される。   FIG. 5 is a diagram showing the pre-process execution information table 166. As shown in FIG. 5, the pre-process execution information table 166 includes a management ID, a process management number, its own system state, device control state information, and another system control state. The management ID and the process management number are as described above. The own system status indicates the update target of the table related to the process. When the process updates only the process execution information of the own system (0), when the device control related to the own system is performed (1), State number information indicating whether the relevant device control only (2) or the device control related to the own system or the device control related to another system (3) is applicable is stored.

装置制御状態は、自システム50が監視する装置52#A〜52#D毎に設けられ、装置制御に係わる情報を示すものであり、制御状態、装置番号、要求種別、及びルート番号、パケット数、図示しないパス設定などの処理実行情報、並びに制御シーケンス番号が格納される。制御状態は、未実行(0)、実行中(1)、実行済(2)などの処理実行状態を示す。装置番号はシステム50内のユニークな装置番号を示す。要求種別は、初期化、帯域制御実行、帯域制御解除等の装置制御要求の内容を示す。制御シーケンス番号は、初期化、閉塞設定、閉塞解除、帯域制限実行、帯域制御解除、パス設定についての端点生成、クロスコネクト生成などの要求種別単位の制御シーケンス番号を示す。   The device control status is provided for each of the devices 52 # A to 52 # D monitored by the own system 50, and indicates information related to device control. The control status, device number, request type, route number, number of packets In addition, processing execution information such as path setting (not shown) and a control sequence number are stored. The control state indicates a process execution state such as unexecuted (0), executing (1), or already executed (2). The device number indicates a unique device number in the system 50. The request type indicates the contents of a device control request such as initialization, bandwidth control execution, bandwidth control release, and the like. The control sequence number indicates a control sequence number in units of request types such as initialization, block setting, block release, bandwidth limitation execution, bandwidth control release, end point generation for path setting, and cross connect generation.

他システム制御状態は、他システム100が監視する装置102#A〜102#D毎に設けられ、装置制御に係わる情報を示すものであり、制御状態、システム番号、装置番号、要求種別、及びルート番号、パケット数、図示しないパス設定などの処理実行情報が格納される。制御状態は、上述と同様である。装置番号は他システム100内のユニークな装置番号を示す。要求種別は上述と同様である。ここでは、他システム100を介する制御要求を要求種別単位とし、制御シーケンス単位としていないことから、制御シーケンス番号は格納されない。尚、他システム100が複数存在する場合には、他システムを特定するための他システム番号が設定される。図15は後述する状態14の場合を例に記載したものである。   The other system control state is provided for each of the devices 102 # A to 102 # D monitored by the other system 100, and indicates information related to device control. The control state, system number, device number, request type, and route Stores processing execution information such as a number, the number of packets, and path setting (not shown). The control state is the same as described above. The device number indicates a unique device number in the other system 100. The request type is the same as described above. Here, since the control request via the other system 100 is a request type unit and not a control sequence unit, the control sequence number is not stored. When there are a plurality of other systems 100, other system numbers for specifying other systems are set. FIG. 15 shows an example of the state 14 described later.

図6は復旧シナリオの一例を示す図である。復旧シナリオは、処理が異常した場合に、後述の個別復旧シナリオの制御手順を制御するための復旧手順を示す全体復旧シナリオと、業務名ID、処理管理番号及び制御シーケンス番号で示される処理についての復旧手順を示す個別復旧シナリオからなる。復旧シナリオには、処理実行前状態に復旧させる処理実行前シナリオ、処理実行後状態に更新する処理実行シナリオがある。   FIG. 6 is a diagram illustrating an example of a recovery scenario. The recovery scenario consists of an overall recovery scenario that indicates the recovery procedure for controlling the control procedure of the individual recovery scenario described later when the process is abnormal, and the process indicated by the business name ID, process management number, and control sequence number. It consists of an individual recovery scenario showing the recovery procedure. The recovery scenario includes a pre-process execution scenario for restoring to a pre-process execution state and a process execution scenario for updating to a post-process execution state.

図6に示すように、例えば、帯域制御実行(業務名ID=10005)について、処理実行情報テーブル160を更新する処理である処理管理番号=1の時、装置制御前実行シナリオ、即ち、処理実行前情報テーブル166を元に処理実行情報テーブル160を処理実行前状態に復旧させる装置制御前実行シナリオ、自システム50の装置の帯域制御実行に係わる処理である処理管理番号=2のとき、帯域制御要求を行って処理実行後状態にする装置制御実行シナリオ、又は帯域解除要求を行うことにより装置及びテーブル160を処理実行前状態にする装置制御実行前シナリオ、他システム100の装置の帯域制御実行に係わる処理管理番号=3のとき、他システム100及びテーブル160を制御実行前状態にする他システム制御前実行シナリオ、他システムの装置及びテーブル160を制御実行状態にする装置制御実行シナリオ、又は他システムの装置及びテーブル160を制御実行前状態にする装置制御実行前状態シナリオが復旧シナリオファイル168に格納されている。復旧シナリオは、復旧プログラムを変更することなく、復旧シナリオファイル168を差し替えることにより復旧手順の変更が可能となる。尚、図示しないが、複数のサブシーケンスからなる装置制御については、サブシーケンスに対応する制御シーケンス番号毎に復旧手順が定義されている。   As shown in FIG. 6, for example, when bandwidth management execution (business name ID = 10005) is processing management number = 1, which is processing for updating the processing execution information table 160, an execution scenario before device control, that is, processing execution Based on the previous information table 166, when the processing management information is a process related to the bandwidth control execution of the device of the own system 50 when the processing execution information table 160 is restored to the state before the processing execution, the bandwidth control is performed. A device control execution scenario for making a request and a state after processing execution, or a device control pre-execution scenario for making the device and the table 160 a state before processing execution by making a bandwidth release request, or for performing bandwidth control of the device of the other system 100 When the related process management number = 3, the other system 100 and the table 160 are put into the pre-control execution state before the other system control. The recovery scenario file 168 stores a scenario for controlling the execution of the device and the table 160 of the other system in the control scenario, or a state scenario before executing the control of the device and the table 160 of the other system. Yes. The recovery scenario can be changed by replacing the recovery scenario file 168 without changing the recovery program. Although not shown, for device control including a plurality of subsequences, a recovery procedure is defined for each control sequence number corresponding to the subsequence.

環境情報テーブル170は復旧条件を格納するテーブルである。復旧条件は、復旧方式、リトライ上限、待ち時間等の復旧に係わる条件である。復旧方式は、自動/手動復旧のいずれかであるかを指定するものである。管理処理番号及び業務名ID単位に自動/手動のいずれであるか、又はシステム全体で自動/手動のいずれかであるかなど、必要に応じて自動/手動で復旧する範囲が指定される。リトライ上限とは、復旧が失敗した場合にリトライする回数の上限を指定するものであり、管理処理番号及び業務名ID単位、あるいはシステム単位のように、リトライ回数の上限が指定される。待ち時間とは、次にリトライするまでの待ち時間を指定するものであり、管理処理番号及び管理ID単位、あるいはシステム単位のように、待ち時間が指定される。   The environment information table 170 is a table for storing recovery conditions. The recovery conditions are conditions related to recovery, such as a recovery method, a retry upper limit, and a waiting time. The recovery method designates either automatic or manual recovery. A range for automatic / manual recovery is designated as necessary, such as whether the management process number and business name ID are automatic / manual or automatic / manual for the entire system. The retry upper limit specifies the upper limit of the number of retries when recovery fails, and the upper limit of the number of retries is specified like the management process number and business name ID unit or system unit. The waiting time designates a waiting time until the next retry, and the waiting time is designated like a management process number and a management ID unit or a system unit.

復旧制御入出力部156は、復旧制御のマンマシンインタフェースを司るものである。復旧制御部158は、環境情報テーブル170に格納されている復旧条件に基づき、手動復旧の場合は復旧制御入出力部156からの復旧指示に従って、自動復旧の場合は自動により、(i)処理管理情報テーブル164に格納されている業務名ID及び処理管理番号並びに処理実行前情報テーブル166に格納されている要求種別、制御シーケンス番号及び装置番号より復旧対象を特定し、(ii)復旧対象に該当する復旧シナリオ168に定義された復旧手順に従って、処理部152,154#A,154#Bを起動して、処理実行前情報テーブル166の内容を元に処理実行情報テーブル160の復旧(自システムの復旧)並びに装置制御前の状態に復旧/装置制御実行、他システム制御前に復旧、他システムの装置制御実行を行う。   The recovery control input / output unit 156 controls a man-machine interface for recovery control. Based on the recovery conditions stored in the environment information table 170, the recovery control unit 158 automatically performs (i) process management in accordance with a recovery instruction from the recovery control input / output unit 156 in the case of manual recovery and automatically in the case of automatic recovery. The recovery target is identified from the business name ID and processing management number stored in the information table 164 and the request type, control sequence number and device number stored in the pre-processing execution information table 166, and (ii) corresponds to the recovery target In accordance with the recovery procedure defined in the recovery scenario 168, the processing units 152, 154 # A, and 154 # B are activated, and the processing execution information table 160 is restored based on the contents of the pre-processing execution information table 166 (the own system Recovery), recovery to the state before device control / execution of device control, recovery before control of other systems, and execution of device control of other systems.

以下、図2のシステム50の動作説明をする。   Hereinafter, the operation of the system 50 of FIG. 2 will be described.

(a) 正常処理
図7〜図10はシステム50の正常処理の場合の動作説明図であり、図7は入出力部159、オペレーション処理部152(プロセスA)、装置52#A,他システム100の装置100#Aの呼び出し関係を示す処理シーケンスチャートである。図8は図7の状態番号に対応する管理IDテーブル162及び処理管理番号テーブル164の内容を示す図である。図9は図7の状態番号に対応する処理実行前情報テーブル166の内容を示す図である。図10は図7の状態番号に対応する装置52#A及び他システム100の装置102#Aの処理実行情報を示す図である。
(A) Normal Processing FIGS. 7 to 10 are operation explanatory diagrams in the case of normal processing of the system 50. FIG. 7 shows the input / output unit 159, the operation processing unit 152 (process A), the device 52 # A, and the other system 100. It is a process sequence chart which shows the calling relationship of the apparatus 100 # A. FIG. 8 is a diagram showing the contents of the management ID table 162 and the process management number table 164 corresponding to the state numbers of FIG. FIG. 9 is a diagram showing the contents of the pre-processing information table 166 corresponding to the state number of FIG. FIG. 10 is a diagram showing processing execution information of the device 52 # A and the device 102 # A of the other system 100 corresponding to the state number of FIG.

入出力部150は、オペレーション処理部(プロセスA)152に、制御要求、例えば、帯域制御実行を要求する(状態0)。プロセスAは制御要求を受け取る(状態1)。プロセスAは、図7及び図8に示すように、制御要求に係わる業務名に該当する業務名ID、例えば、「1005」より、管理IDテーブル162を検索して、一意的な管理ID(100)を生成するとともに、管理ID及び業務名IDを管理IDテーブル162に書き込む(状態2)。   The input / output unit 150 requests the operation processing unit (process A) 152 to execute a control request, for example, bandwidth control (state 0). Process A receives a control request (state 1). As shown in FIG. 7 and FIG. 8, the process A searches the management ID table 162 from the business name ID corresponding to the business name related to the control request, for example, “1005”, and has a unique management ID (100 ) And the management ID and the business name ID are written in the management ID table 162 (state 2).

プロセスAは、管理ID(100)、業務名ID(10005)、プロセスID(1001)を基づいて、処理管理情報テーブル164を検索して、一意的な処理管理番号(1)、例えば、「1」を生成するとともに、図8に示すように、処理管理情報テーブル164に、管理ID(100)、処理管理番号(1)、プロセス番号(1001)、業務名ID(10005)及び実行結果(実行中(1))を処理管理情報テーブル164に書き込む(状態3)。   The process A searches the processing management information table 164 on the basis of the management ID (100), the business name ID (10005), and the process ID (1001) to identify a unique processing management number (1), for example, “1”. As shown in FIG. 8, in the process management information table 164, a management ID (100), a process management number (1), a process number (1001), a business name ID (10005), and an execution result (execution) Medium (1)) is written into the process management information table 164 (state 3).

プロセスAは、図9に示すように、管理ID、処理管理番号、自プロセスA152の更新に係わる処理実行前情報を処理実行情報テーブル160より取得し、管理ID(100)、処理管理番号(1)、自システム状態(1)とともに処理実行前情報テーブル166に書き込む(状態4)。プロセスA152は、処理実行情報テーブル160を更新する。   As shown in FIG. 9, the process A acquires the management ID, the process management number, and the pre-process execution information related to the update of the own process A 152 from the process execution information table 160, and the management ID (100), the process management number (1) ), It is written in the pre-processing information table 166 together with its own system state (1) (state 4). The process A 152 updates the process execution information table 160.

プロセスAは、処理A(プロセスB)52#Aを起動し、管理ID(100)及び業務名ID(10005)をプロセスBに渡す(状態5)。プロセスBは、管理ID(100)、業務名ID(10005)、プロセスID(1001)を基づいて、処理管理情報テーブル164を検索して、一意的な処理管理番号(2)を生成する。   The process A activates the process A (process B) 52 # A, and passes the management ID (100) and the business name ID (10005) to the process B (state 5). The process B searches the processing management information table 164 based on the management ID (100), the business name ID (10005), and the process ID (1001), and generates a unique processing management number (2).

プロセスBは、図8に示すように、処理管理情報テーブル164に、管理ID(100)、処理管理番号(2)、プロセス番号(1002)、業務名ID(10005)及び実行結果(実行中(1))を処理管理情報テーブル164に書き込む(状態6)。プロセスBは、管理ID、処理管理番号、自プロセスBの更新に係わる装置52#Aの処理実行前情報(ルート番号=NULL,パケット数=NULL)を処理実行情報テーブル160より取得し、図9に示すように、管理ID(100)、処理管理番号(2)、自システム状態(装置制御状態=2)、制御状態(実行中=1)、装置52#Aの装置番号=1、要求種別(帯域制御実行=3)、制御シーケンス番号(帯域制御実行=3)とともに処理実行前情報テーブル166に書き込む(状態7)。その後、装置50#Aに係わる処理実行情報(ルート番号=18,パケット数=2000)に処理実行情報テーブル160を更新する。尚、帯域制御実行のシーケンスが複数に分かれている場合には、制御シーケンス番号はその該当シーケンス番号となる。   As shown in FIG. 8, the process B includes a management ID (100), a processing management number (2), a process number (1002), a business name ID (10005), and an execution result (in execution ( 1)) is written into the process management information table 164 (state 6). The process B acquires the management ID, the process management number, and the pre-process execution information (route number = NULL, the number of packets = NULL) of the device 52 # A related to the update of the own process B from the process execution information table 160, and FIG. , Management ID (100), process management number (2), own system state (device control state = 2), control state (running = 1), device number of device 52 # A = 1, request type (Band control execution = 3) and the control sequence number (Band control execution = 3) are written in the pre-processing execution information table 166 (state 7). Thereafter, the process execution information table 160 is updated to the process execution information (route number = 18, number of packets = 2000) related to the device 50 # A. Note that when the band control execution sequence is divided into a plurality, the control sequence number is the corresponding sequence number.

プロセスBは、装置52#Aに対して、帯域制御実行の装置制御要求を行う。装置52#Aは、図9に示すように、プロセスBからの帯域制御実行の要求に基づいて、帯域制御実行して、該当する処理実行情報のテーブルを更新する。例えば、ルート番号5,規制パケット数=2000、規制状態=規制パケット有り(1)に更新する。装置52#Aは、処理が正常終了すると、装置制御結果(正常終了)をプロセスBに応答する(状態8)。プロセスBは、装置52#Aより正常終了が応答されると、管理ID(100),処理管理番号(2)に該当する処理管理番号情報の実行結果を終了(2)にする(状態9)。状態5−9のプロセスBにおける処理2が正常に終了する。プロセスBはプロセスAに正常終了した旨を返す(状態10)。   Process B makes a device control request for bandwidth control execution to device 52 # A. As shown in FIG. 9, the device 52 # A executes bandwidth control based on the bandwidth control execution request from the process B, and updates the table of the corresponding process execution information. For example, the route number 5 is updated to the number of restricted packets = 2000, and the restricted state = restricted packet present (1). When the processing ends normally, the device 52 # A returns a device control result (normal end) to the process B (state 8). When the process B returns a normal end response from the device 52 # A, the process B ends the execution result of the process management number information corresponding to the management ID (100) and the process management number (2) (state 9). . Process 2 in process B in state 5-9 ends normally. The process B returns to the process A a normal end (state 10).

プロセスAは、処理A(プロセスB)52#Aを起動し、管理ID(100)及び業務名ID(10005)をプロセスBに渡す(状態11)。状態11−13は、状態5−7と同様である。   The process A activates the process A (process B) 52 # A, and passes the management ID (100) and the business name ID (10005) to the process B (state 11). State 11-13 is similar to state 5-7.

プロセスBは、他システム100に対して、他システム制御要求(帯域制御実行)を行う。他システム100は、図10に示すように、プロセスBからの帯域制御実行の要求に基づいて、装置102#Aに対して、帯域制御要求を行う。装置102#Aは、帯域制御実行の要求に従って、帯域制御実行して、該当する処理実行情報のテーブルを更新する。行の要求に基づいて、帯域制御実行して、該当する処理実行情報のテーブルを更新する。例えば、ルート番号18,規制パケット数=2000、規制状態=規制パケット有り(1)に更新する。   The process B issues another system control request (bandwidth control execution) to the other system 100. As shown in FIG. 10, the other system 100 makes a bandwidth control request to the device 102 # A based on the bandwidth control execution request from the process B. The device 102 # A executes bandwidth control in accordance with the bandwidth control execution request, and updates the corresponding process execution information table. Based on the row request, bandwidth control is executed, and the corresponding processing execution information table is updated. For example, the route number is updated, the number of restricted packets = 2000, and the restricted state = restricted packet present (1).

装置102#Aは、処理が正常終了すると、装置制御結果(正常終了)を他システム100に返す。他システム100は、装置102#Aより正常終了が応答されると、プロセスBに他システム制御要求結果(正常終了)をプロセスBに返す(状態14)。プロセスBは、他システム100より正常終了が応答されると、管理ID(100),処理管理番号(3)に該当する処理管理番号情報の実行結果を終了(2)にする(状態15)。プロセスBにおける状態11−15の処理3が正常に終了する。プロセスBはプロセスAに正常終了した旨を返す(状態16)。   When the process ends normally, the apparatus 102 # A returns an apparatus control result (normal end) to the other system 100. When the normal end is returned from the device 102 # A, the other system 100 returns the other system control request result (normal end) to the process B (state 14). When the process B returns a normal end response from the other system 100, the process B ends the execution result of the process management number information corresponding to the management ID (100) and the process management number (3) (state 15). The process 3 in the state 11-15 in the process B ends normally. The process B returns to the process A a normal end (state 16).

プロセスAは、プロセスBより処理2,3について正常終了の実行結果が返ってきたので、管理ID(100)、処理管理番号(1),(2),(3)の処理実行前情報を処理実行前情報テーブル166から削除する(状態17)。プロセスAは、管理ID(100),処理管理番号(1),(2),(3)の処理管理情報を処理管理情報テーブル164から削除する(状態18)。更に、プロセスAは、管理ID(100)、業務名ID(10005)の管理IDを管理IDテーブル162より削除する。   Process A returns the execution result of normal termination for process 2 and 3 from process B, so process pre-process information of management ID (100) and process management numbers (1), (2) and (3) is processed. Delete from the pre-execution information table 166 (state 17). The process A deletes the process management information of the management ID (100) and process management numbers (1), (2), and (3) from the process management information table 164 (state 18). Further, the process A deletes the management ID of the management ID (100) and the business name ID (10005) from the management ID table 162.

(b) 異常処理
図11〜図14はシステム50の異常処理の場合の動作説明図であり、図11は入出力部159、オペレーション処理部152(プロセスA)、装置52#A,他システム100の装置100#Aの呼び出し関係を示す処理シーケンスチャートである。図12は図11の状態番号に対応する管理IDテーブル162及び処理管理番号テーブル164の内容を示す図である。図13は図11の状態番号に対応する処理実行前情報テーブル166の内容を示す図である。図14は図11の状態番号に対応する装置52#A及び他システム100の装置102#Aの処理実行情報を示す図である。
(B) Abnormal Processing FIGS. 11 to 14 are operation explanatory diagrams in the case of abnormal processing of the system 50. FIG. 11 shows the input / output unit 159, the operation processing unit 152 (process A), the device 52 # A, and the other system 100. It is a process sequence chart which shows the calling relationship of the apparatus 100 # A. FIG. 12 is a diagram showing the contents of the management ID table 162 and the process management number table 164 corresponding to the state numbers of FIG. FIG. 13 is a diagram showing the contents of the pre-processing information table 166 corresponding to the state number of FIG. FIG. 14 is a diagram showing processing execution information of the device 52 # A and the device 102 # A of the other system 100 corresponding to the state number of FIG.

ここでは、プロセスBによる装置52#Aへの装置制御要求に対して装置52#Aにおいて正常終了したが、プロセスBによる他システム100への他システム制御要求に対して他システム100又は装置102#Aにおいて異常終了した場合を例に説明する。   Here, the device 52 # A has normally terminated in response to the device control request to the device 52 # A by the process B, but the other system 100 or the device 102 # has responded to the other system control request to the other system 100 by the process B. An example of the abnormal end in A will be described.

入出力部150は、オペレーション処理部(プロセスA)152に、制御指示、例えば、帯域制御要求する(状態0)。図11〜図14に示すように、状態1−13は、図7〜図10中の状態1−13と同様である。プロセスBは、他システム100に対して、他システム制御要求(帯域制御実行)を行う。他システム100は、図11に示すように、プロセスBからの帯域制御実行の要求に基づいて、装置102#Aに対して、帯域制御要求を行うが異常終了したものとする。   The input / output unit 150 issues a control instruction, for example, a bandwidth control request to the operation processing unit (process A) 152 (state 0). As shown in FIGS. 11 to 14, the state 1-13 is the same as the state 1-13 in FIGS. The process B issues another system control request (bandwidth control execution) to the other system 100. As shown in FIG. 11, it is assumed that the other system 100 issues a bandwidth control request to the device 102 # A based on the bandwidth control execution request from the process B, but terminates abnormally.

異常終了の原因は、他システム100と復旧システム50を接続する通信回線の異常、他システム100のシステム異常、装置102#Aにおける装置異常、他システム100と装置102#Aを接続する通信回線の異常等である。プロセスBは、他システム100から異常の通知がされない又は一定時間内に応答がされないことにより、他システム制御が異常終了したことが分かる(状態14)。   The cause of the abnormal termination is an abnormality in the communication line connecting the other system 100 and the recovery system 50, a system abnormality in the other system 100, an apparatus abnormality in the device 102 # A, or a communication line connecting the other system 100 and the device 102 # A. It is abnormal. The process B knows that the other system control has ended abnormally because the other system 100 is not notified of an abnormality or does not respond within a certain time (state 14).

他システム制御が正常終了した図10では、他システムの処理実行情報が更新されているが、異常終了した図14では、他システムの処理実行情報が更新されていない。装置102#Aについての処理実行情報は処理実行情報テーブル160において、ルート番号=18,パケット数=2000に更新されているが、処理実行前情報テーブル166において、処理実行前情報(ルート番号=NULL,パケット数=NULL)がセーブされている。   In FIG. 10 where the other system control is normally completed, the process execution information of the other system is updated. However, in FIG. 14 where the other system control is abnormally ended, the process execution information of the other system is not updated. The process execution information for the device 102 # A has been updated in the process execution information table 160 to route number = 18 and the number of packets = 2000, but in the pre-process execution information table 166, the pre-process execution information (route number = NULL). , Number of packets = NULL).

プロセスBは、管理ID(001)、プロセスID(1003)、業務名ID(10005)の処理管理情報の実行結果を実行済み(2)、復旧実施可否欄に復旧実施可(−1)に設定する(状態15)。プロセスBはプロセスAに処理3が異常終了した旨を返す(状態16)。プロセスAは、管理ID(001)、業務名ID(10005)の処理管理情報の中で実行結果が実行中(1)となっている、プロセスID(1001)の処理管理情報の復旧実施可否欄に復旧実施可(−1)に設定する(状態17)。   In process B, the execution result of the process management information of management ID (001), process ID (1003), and business name ID (10005) has been executed (2), and recovery execution possible column is set to recovery possible (-1) (State 15). Process B returns to process A that process 3 ended abnormally (state 16). Process A has a process ID (1001) process management information recovery execution propriety column in which the execution result is executing (1) in the process ID information of management ID (001) and business name ID (10005). Is set to recovery feasible (-1) (state 17).

(c) 復旧シナリオの変更
図15は復旧シナリオの変更手順を示す図である。復旧シナリオは、装置制御のシーケンスが変更になった場合に、シナリオを差し替えられる。復旧制御入出力部156は、入れ替え復旧シナリオを生成する。復旧シナリオは、例えば、入れ替えるべき業務内容(業務名ID)毎に作成する。復旧制御入出力部(制御クライアント)156は、復旧制御部158の入れ替えプロセスに対して、復旧シナリオの入れ替え要求をする。
(C) Change of Recovery Scenario FIG. 15 is a diagram showing a procedure for changing a recovery scenario. The restoration scenario can be replaced when the device control sequence is changed. The recovery control input / output unit 156 generates a replacement recovery scenario. The recovery scenario is created for each business content (business name ID) to be replaced, for example. The recovery control input / output unit (control client) 156 makes a replacement scenario replacement request to the replacement process of the recovery control unit 158.

入れ替えプロセスは要求受付終了を制御クライアントに通知する。制御クライアントは復旧シナリオを入れ替えプロセスにファイル転送する。入れ替えプロセスは入れ替えるべき復旧シナリオに関する業務名IDに対応する差し替えにより影響を受ける業務を閉塞するように、オペレーション処理部152に指示する。オペレーション処理部152の業務閉塞プロセスは業務名IDに対応した業務の閉塞、すなわち、入出力部150から当該業務名IDについての制御要求があった場合でも要求を拒否し、入れ替えプロセスに正常終了を通知する。入れ替えプロセスは、復旧シナリオファイル168の該当復旧シナリオを差し替え復旧シナリオファイルに差し替える。   The replacement process notifies the control client that the request has been received. The control client transfers the recovery scenario to the replacement process and transfers the file. The replacement process instructs the operation processing unit 152 to block the business affected by the replacement corresponding to the business name ID related to the recovery scenario to be replaced. The business block process of the operation processing unit 152 blocks the business corresponding to the business name ID, that is, rejects the request even when there is a control request for the business name ID from the input / output unit 150, and terminates the replacement process normally. Notice. In the replacement process, the corresponding recovery scenario in the recovery scenario file 168 is replaced with a replacement scenario file.

入れ替えプロセスは、業務閉塞プロセスに対して、業務名IDに対応した業務閉塞解除を指示する。業務閉塞プロセスは、業務名IDに対応した業務閉塞解除して、入れ替えプロセスに正常終了を通知する。入れ替えプロセスは制御クライアントに正常終了を応答する。このように、復旧シナリオファイル168に基づいて復旧することから、装置52#A〜52#Dの機能追加等によるシーケンスが変更した場合、復旧シナリオを差し替えるのみで復旧制御部158のプログラムを変更する必要がないので、容易に機能追加等に対応することができる。   The replacement process instructs the business shutdown process to release the business shutdown corresponding to the business name ID. The business blocking process releases the business blocking corresponding to the business name ID and notifies the replacement process of normal termination. The replacement process returns a normal end response to the control client. As described above, since the recovery is performed based on the recovery scenario file 168, when the sequence of the devices 52 # A to 52 # D is changed, the program of the recovery control unit 158 is changed only by replacing the recovery scenario. Since there is no need, it is possible to easily cope with addition of functions.

(d) 復旧処理(第1実施形態)
第1実施形態では、複数の処理について、その処理の呼び出し順と処理の終了順が同じである場合、すなわち、呼び出された処理が終了してから、次処理を呼び出す場合における、異常終了時の復旧方法を説明する。
(D) Recovery process (first embodiment)
In the first embodiment, for a plurality of processes, when the calling order of the processes and the end order of the processes are the same, that is, when the next process is called after the called process ends, Explain how to recover.

図16は、オペレーション処理部152(プロセスA)が装置52#Aに対して装置制御処理(処理A)を行い、処理が正常終了し、プロセスAは処理部A154#Aを起動し、処理Bが装置52#Bに対して装置制御(処理B−1)を行い、処理が正常終了し、更に装置52#Cに対して装置制御(処理B−2)を行い、処理が異常終了した場合を示している。   In FIG. 16, the operation processing unit 152 (process A) performs device control processing (processing A) on the device 52 # A, the processing ends normally, and the process A activates the processing unit A154 # A, and processing B Performs device control (Process B-1) on device 52 # B, completes processing normally, and performs device control (Process B-2) on device 52 # C, and processing ends abnormally Is shown.

図17は図16の処理シーケンスにおける処理管理情報テーブル164の内容を示している。尚、処理管理情報テーブル164は、処理開始時刻を設定するフィールドが上述のテーブルに追加されて、実行履歴が残されている。プロセスAが装置52#Aに対して装置制御処理(処理A)を行い、正常終了したとき(状態1)の処理管理情報が、図17(a)に示すように、実行結果が実行中(1)、復旧実施可否が初期状態(0)となっている。   FIG. 17 shows the contents of the process management information table 164 in the process sequence of FIG. In the process management information table 164, a field for setting the process start time is added to the above table, and the execution history is left. When process A performs apparatus control processing (process A) on apparatus 52 # A and completes normally (state 1), the process management information indicates that the execution result is being executed as shown in FIG. 1) Whether recovery can be performed is in the initial state (0).

プロセスBが装置52#Bに対して装置制御処理(処理B−1)を行い、正常終了したとき(状態2)の処理管理情報が、図17(b)に示すように、実行結果が実行済(2)、復旧実施可否が初期状態となっている。更に、プロセスBが装置52#Cに装置制御処理(B−2)を行い、異常終了したとき(状態3)の処理B−2に係わる処理管理情報が、図17(c)に示すように、実行結果が異常終了(−1)、復旧実施可否が復旧実施可(1)となっている。プロセスAは、処理B−2より異常復帰すると(状態4)、図17(d)に示すように、処理A,B−1の処理管理情報の復旧実施可否を実施可(1)に設定する。   When process B performs apparatus control processing (process B-1) on apparatus 52 # B and the process ends normally (state 2), the execution result is executed as shown in FIG. Completed (2), whether or not restoration is possible is in the initial state. Furthermore, the process management information related to the process B-2 when the process B performs the apparatus control process (B-2) on the apparatus 52 # C and ends abnormally (state 3) is as shown in FIG. The execution result is abnormal end (-1), and the recovery execution availability is recovery execution possible (1). If the process A returns abnormally from the process B-2 (state 4), as shown in FIG. 17D, the process management information recovery process propriety of the processes A and B-1 is set to be executable (1). .

図18は本発明の第1実施形態による復旧制御部158が実施する復旧処理のフローチャートである。ステップS2において、(2)に示すように、周期的に処理管理情報テーブル164の処理管理情報を監視しており、同一の管理IDについて、最後に生成された処理管理情報レコードの実行結果が異常終了(NG)「−1」となっているかをチェックする。同一の管理IDの処理管理情報については、入出力部150より制御要求がされた一纏まりの処理についての情報であり、これらの処理を復旧対象とするからである。処理がパラレルではなくシーケンシャルに行われることから、管理IDについての最終レコードにより処理全体が正常終了/異常終了のいずれかが判別される。   FIG. 18 is a flowchart of the recovery process performed by the recovery control unit 158 according to the first embodiment of the present invention. In step S2, as shown in (2), the process management information in the process management information table 164 is periodically monitored, and the execution result of the last generated process management information record is abnormal for the same management ID. It is checked whether the end (NG) is “−1”. This is because the process management information of the same management ID is information about a group of processes requested to be controlled by the input / output unit 150, and these processes are targeted for recovery. Since the processing is performed sequentially instead of in parallel, whether the entire processing is normal end / abnormal end is determined by the final record for the management ID.

ステップS4において、NGがあるか否かが判断される。NGがあれば、ステップS6に進み、NGがなければ、ステップS2に戻る。ステップS6において、(4)に示すように、その最終レコードの「業務名ID」、「プロセス番号」、「処理開始時刻」、「復旧実施可否」を取得する。ステップS8において、業務名管理情報テーブル165を参照して、ステップS6で取得した「業務名ID」に対応する「業務名」を取得する。図18に示すように、業務名管理情報テーブル165には、業務名IDと対応する業務名が記憶されている。例えば、「業務名ID」が(10005)の業務名は帯域制御実行である。   In step S4, it is determined whether or not there is NG. If there is NG, the process proceeds to step S6, and if there is no NG, the process returns to step S2. In step S6, as shown in (4), the "business name ID", "process number", "processing start time", and "recovery execution possibility" of the final record are acquired. In step S8, the “business name” corresponding to the “business name ID” acquired in step S6 is acquired with reference to the business name management information table 165. As shown in FIG. 18, the business name management information table 165 stores a business name corresponding to the business name ID. For example, a business name whose “business name ID” is (10005) is execution of bandwidth control.

図19は復旧対象一覧を示す図である。ステップS10において、(8)に示すように、復旧制御入出力部156に取得情報を表示し、(10)に示すように、処理対象項目名を選択させる。図は復旧対象表示画面の一例を示す図である。図19に示すように、復旧対象表示選択画面は、ステップS4で取得された全ての管理IDの最終処理管理情報レコードの業務名、プロセスID、処理開始時刻及び復旧可否が選択項目とともに復旧制御入出力部156に表示される。即ち、復旧対象となるものについては、現時点で復旧可能なもののみならず、復旧不可のものについても表示される。オペレータが復旧対象の業務名を選択する。例えば、オペレータは帯域制御実行の復旧を選択する。ステップS12において、選択された業務名について、復旧シナリオの実施要求を「処理管理番号」の降順に復旧実施プロセスに対して行う。   FIG. 19 is a diagram showing a list of recovery targets. In step S10, the acquisition information is displayed on the recovery control input / output unit 156 as shown in (8), and the processing target item name is selected as shown in (10). The figure shows an example of a recovery target display screen. As shown in FIG. 19, the recovery target display selection screen displays the recovery control input with the selection items including the business name, process ID, processing start time, and recovery availability of the final processing management information records of all management IDs acquired in step S4. It is displayed on the output unit 156. In other words, not only those that can be recovered at the present time but also those that cannot be recovered are displayed. The operator selects a business name to be restored. For example, the operator selects restoration of bandwidth control execution. In step S12, for the selected business name, a recovery scenario execution request is made to the recovery execution process in descending order of the “process management number”.

図20は復旧シナリオ実施の流れを示す図である。図21は、図16に示した処理B−2が異常終了、処理A,B−1が正常終了したときの図17中の3個の処理管理情報に基づく復旧シナリオ実施の場合を例としたものである。復旧シナリオは処理管理番号の降順に実施されることから、処理管理番号=3に該当する処理B−2について、最初に復旧実施が行われる。   FIG. 20 is a diagram showing the flow of executing the recovery scenario. FIG. 21 shows an example of a recovery scenario based on the three process management information in FIG. 17 when process B-2 shown in FIG. 16 ends abnormally and processes A and B-1 end normally. Is. Since the recovery scenario is executed in descending order of the process management number, the process B-2 corresponding to the process management number = 3 is firstly recovered.

復旧制御部158は、(2)に示すように、復旧対象となる処理管理情報のプロセスIDに該当する処理Bに処理B−2復旧シナリオ実施要求をする。プロセスBは、処理B−2についての処理管理情報の業務名ID(10005)、処理管理番号(3)より、復旧シナリオ168に定義された復旧シナリオを読み出す。例えば、復旧シナリオは、装置制御前の装置状態に復旧する制御手順を定義した装置制御前実行シナリオであるとする。   As shown in (2), the recovery control unit 158 issues a process B-2 recovery scenario execution request to the process B corresponding to the process ID of the process management information to be recovered. The process B reads the recovery scenario defined in the recovery scenario 168 from the business name ID (10005) and the process management number (3) of the process management information for the process B-2. For example, the recovery scenario is assumed to be a pre-device control execution scenario that defines a control procedure for recovering the device state before device control.

プロセスBは、(4)に示すように、処理B−2についての処理管理情報の管理ID、処理管理番号を元に処理実行前情報テーブル166を検索して該当する処理実行前情報を取得し、処理実行前情報から処理実行情報テーブル160を更新するとともに装置52#Cの状態を回復させる。例えば、復旧対象の業務名が「帯域制御実行」であり、処理実行前状態に復旧させる場合には、装置52#Cに対して「帯域制御解放」の装置制御要求を実行する。装置制御要求が複数制御シーケンスからなる場合は、復旧シナリオには、異常終了した各制御シーケンスからの復旧手順が定義されていることから、処理実行前情報テーブル166に格納されている制御シーケンスに該当する手順に従って装置52#Cの状態を回復させる。   As shown in (4), the process B retrieves the pre-process execution information table 166 based on the management ID and the process management number of the process management information for the process B-2, and acquires the corresponding pre-process execution information. The process execution information table 160 is updated from the pre-process execution information and the state of the device 52 # C is recovered. For example, when the restoration target business name is “Bandwidth control execution” and the state is restored to the state before processing execution, a device control request “bandwidth control release” is executed to the device 52 # C. If the device control request consists of multiple control sequences, the recovery scenario defines the recovery procedure from each abnormally terminated control sequence, and therefore corresponds to the control sequence stored in the pre-processing execution information table 166 The state of the device 52 # C is recovered according to the procedure.

復旧制御部156は、(6)に示すように、次の処理管理情報の実行結果が異常終了であるプロセスAに復旧シナリオ実施要求をする。プロセスAは、処理管理情報の処理管理番号の降順に従って、最降番の処理管理番号(3)の処理管理情報のプロセスIDに該当する処理Bの処理B−2について復旧実施済みであるので、(8)に示すように、回復処理の二重起動を行わずに復帰して、(10)に示すように、次の処理管理番号(2)の処理管理情報のプロセスIDに該当する処理Bの処理B−1について復旧シナリオ実施要求をする。   As shown in (6), the recovery control unit 156 issues a recovery scenario execution request to the process A whose execution result of the next processing management information is abnormally terminated. Since the process A has already been restored for the process B-2 of the process B corresponding to the process ID of the process management information of the lowest process management number (3) according to the descending order of the process management numbers of the process management information. As shown in (8), the recovery process is restored without double activation, and as shown in (10), the process B corresponding to the process ID of the process management information of the next process management number (2) A recovery scenario execution request is made for process B-1.

処理Bは、(12)に示すように、処理B−1の処理管理番号(2)についての処理管理情報及び処理実行前情報に元に、復旧シナリオに従って装置52#Bの装置状態を処理実行前に回復させる。処理B−1は正常終了していることから、処理B−1での装置制御要求とは逆のシーケンスに従って装置52#Bを復旧させるとともに処理実行前情報から処理実行情報テーブル160を更新する。これにより、装置52#Bの装置状態は処理実行前状態に復旧されるとともに、装置52#Bについての処理実行情報は処理実行情報テーブル160において処理実行前の状態に復旧される。処理Aは、(14)に示すように、処理Aについての処理管理番号(1)についての処理管理情報及び処理実行前情報に元に復旧シナリオに従って装置52#Aの装置状態を処理実行前に回復させるとともに処理実行前情報から処理実行情報テーブル160を更新する。   As shown in (12), process B executes the apparatus status of apparatus 52 # B according to the recovery scenario based on the process management information and process pre-execution information for process management number (2) of process B-1. Recover before. Since the process B-1 is normally completed, the apparatus 52 # B is restored according to the sequence reverse to the apparatus control request in the process B-1, and the process execution information table 160 is updated from the pre-process execution information. As a result, the device state of the device 52 # B is restored to the pre-process execution state, and the process execution information for the device 52 # B is restored to the pre-process execution state in the process execution information table 160. As shown in (14), the process A sets the apparatus status of the apparatus 52 # A before executing the process according to the recovery scenario based on the process management information and the process execution information for the process management number (1) for the process A. The process execution information table 160 is updated from the pre-process execution information.

復旧処理が終了すると、図17(e)に示すように、復旧に係わる管理ID、処理管理情報及び処理実行前情報をテーブル162,164,166より削除する。尚、処理実行後状態に復旧させる場合には、復旧シナリオ168に従って、処理実行前情報を元に処理実行情報テーブル160を更新するとともに、装置制御が異常終了した装置102#Aに対して失敗した装置制御要求を再度実行し、装置制御が正常終了した装置52#Aに対して復旧処理をスキップする。   When the recovery process is completed, as shown in FIG. 17E, the management ID, process management information, and pre-process execution information related to recovery are deleted from the tables 162, 164, and 166. In the case of recovery to the post-process execution state, the process execution information table 160 is updated based on the pre-process execution information according to the recovery scenario 168, and the apparatus 102 # A in which the apparatus control has ended abnormally has failed. The apparatus control request is executed again, and the recovery process is skipped for the apparatus 52 # A for which the apparatus control has been normally completed.

以上のように、初期設定を行うことなく、処理実行前情報を元に装置情報を処理実行前又は処理実行後に迅速に復旧することができる。復旧シナリオに基づいて復旧するので、復旧の手順が変更になっても、復旧シナリオを差し替えることにより容易に変更が可能となる。   As described above, the apparatus information can be quickly recovered before the execution of the process or after the execution of the process based on the information before the execution of the process without performing the initial setting. Since the recovery is performed based on the recovery scenario, even if the recovery procedure is changed, the recovery scenario can be easily changed by replacing the recovery scenario.

(e) 復旧処理(第2実施形態)
第2実施形態の復旧処理方法は、第2実施形態の方法と異なり、呼び出された処理が実行中に他の処理が呼び出されて、呼び出された処理の順序と処理の終了順序とが異なる場合におけるものである。
(E) Recovery process (second embodiment)
The recovery processing method of the second embodiment is different from the method of the second embodiment when another process is called while the called process is being executed, and the order of the called process is different from the process end order. It is in.

図22は、オペレーション処理部152(プロセスA)が装置52#Aに対して装置制御を行い、処理Aが正常終了し、プロセスBは、処理B−1,B−2を順次呼び出し、処理B−1,B−2について並行処理が行われて、処理B−2が処理B−1よりも先に異常終了し、その後、処理B−1が異常終了した場合を示している。図23は、図22の処理シーケンスにおける処理管理情報テーブル164の内容を示している。   In FIG. 22, the operation processing unit 152 (process A) performs device control on the device 52 #A, the processing A ends normally, and the process B sequentially calls the processing B- 1 and B- 2 and processing B -1 and B-2 are performed in parallel, and the process B-2 ends abnormally before the process B-1, and then the process B-1 ends abnormally. FIG. 23 shows the contents of the process management information table 164 in the process sequence of FIG.

プロセスAが装置52#Aに対して装置制御処理(処理A)を行い、正常終了したとき(状態1)の処理管理情報が、図23(a)に示すように、実行結果が実行中(1)、復旧実施可否が初期状態(0)となっている。処理Bが装置52#Bに対して装置制御処理(処理B−1)を行っているが、実行中(状態2)の処理管理情報が、図23(b)に示すように、実行結果が実行済(2)、復旧実施可否が初期状態(0)となっている。更に、処理Bが処理B−1の実行中に装置52#Cに装置制御処理(B−2)を行い、異常終了したとき(状態3)の処理B−2についての処理管理情報が、図23(c)に示すように、実行結果が異常終了(−1)、復旧実施可否が復旧実施可(1)となっている。   When process A performs apparatus control processing (process A) on apparatus 52 # A and the process ends normally (state 1), the execution result is being executed as shown in FIG. 1) Whether recovery can be performed is in the initial state (0). The process B is performing the apparatus control process (process B-1) for the apparatus 52 # B, but the process management information being executed (state 2) shows that the execution result is as shown in FIG. Execution completed (2) and restoration execution availability are in the initial state (0). Furthermore, when the process B performs the apparatus control process (B-2) on the apparatus 52 # C while the process B-1 is being executed, the process management information for the process B-2 when the process B ends abnormally (state 3) is shown in FIG. As shown in FIG. 23 (c), the execution result is abnormal termination (-1), and the recovery execution availability is recovery implementation possible (1).

プロセスAが処理B−2より異常終了が通知されたとき(状態4)、図23(d)に示すように、処理Aについての実行結果が異常終了(−1)、処理B−1についての処理管理情報の実行結果が実行中(1)であるため、復旧実施可否は初期状態(0)のままである。処理B−1が、装置52#Bに対する装置制御について、装置52#Bが装置52#Xに対して初期化処理中に異常発生により、異常終了したとき(状態2b)の処理B−1についての処理管理情報が、図23(e)に示すように、実行結果が異常終了(−1)、復旧実施可否が実施可能(1)となっている。プロセスAが処理B−1より異常終了が通知されたとき(状態5)、図23(f)に示すように、処理B−1についての処理管理情報の実行結果が異常終了(−1)となったため、処理Aについての復旧実施可否は実施可能(1)となる。   When process A is notified of abnormal termination from process B-2 (state 4), as shown in FIG. 23 (d), the execution result for process A is abnormal termination (-1), and process B-1 Since the execution result of the process management information is being executed (1), whether or not recovery can be performed remains in the initial state (0). Processing B-1 is about device control for the device 52 # B, and processing B-1 when the device 52 # B is abnormally terminated due to an abnormality during initialization processing for the device 52 # X (state 2b). As shown in FIG. 23 (e), the process management information in FIG. 23 indicates that the execution result is abnormal termination (-1), and whether recovery is feasible (1). When the process A is notified of the abnormal end from the process B-1 (state 5), as shown in FIG. 23F, the execution result of the process management information for the process B-1 is the abnormal end (-1). Therefore, whether or not the recovery for process A can be executed is executable (1).

図24は本発明の第2実施形態による復旧制御部158が実施する復旧処理のフローチャートである。ステップS20において、(2)に示すように、周期的に処理管理情報テーブル164の処理管理情報を監視しており、同一の管理IDについて、処理管理情報レコードの実行結果が異常終了(NG)「−1」となっているかをチェックする。同一の管理IDについて最終レコードに限らず全てのレコードについてチェックするのは、処理B−1,B−2が並列処理されるために、最後に起動された処理に対応する最終レコードが正常であっても、他の処理で異常となる場合があるからである。   FIG. 24 is a flowchart of the recovery process performed by the recovery control unit 158 according to the second embodiment of the present invention. In step S20, as shown in (2), the process management information in the process management information table 164 is periodically monitored, and the execution result of the process management information record for the same management ID is abnormal end (NG) “ -1 "is checked. The reason for checking not only the final record but also all records for the same management ID is that the final record corresponding to the last activated process is normal because the processes B-1 and B-2 are processed in parallel. However, it may be abnormal in other processes.

ステップS22において、NGがあるか否かを判断する。NGがあれば、ステップS24に進み、NGがなければ、ステップS20に戻る。ステップS24において、同一の「管理ID」について、実行結果が異常終了(−1)の処理管理情報の復旧実施可否が全て実施可能(1)であるか確認する。ステップS26において、全て実施可能(1)あるか否か判別する。全て実施可能(1)であれば、ステップS28に進む。例えば、処理B−1が終了後には、復旧実施可否が全て実施可(1)となるので、ステップS28に進む。実施不可となるものがあれば、ステップS24に戻って、全て実施可能(1)となるまでウェイトする。   In step S22, it is determined whether or not there is NG. If there is NG, the process proceeds to step S24, and if there is no NG, the process returns to step S20. In step S24, for the same “management ID”, it is confirmed whether or not recovery execution feasibility of the process management information whose execution result is abnormal termination (−1) is all feasible (1). In step S26, it is determined whether or not there is any implementation possible (1). If everything is feasible (1), the process proceeds to step S28. For example, after the process B-1 is completed, all the recovery execution availability is implementation possible (1), so the process proceeds to step S28. If there is something that cannot be performed, the process returns to step S24, and waits until it becomes all possible (1).

このように、処理B−1,B−2の呼び出し順序と終了順序とが異なることがある場合には、復旧対象となる業務の有無が、管理IDについての最終レコードではなく、全てのレコードについて実行結果が異常であるものの有無により判断され、復旧実施可能となるタイミングが、最終レコードが復旧実施可能となるタイミングでなく実行結果が異常である全てのレコードについて、復旧実施可能が設定されるタイミングである。ステップS28〜ステップS34の処理は、図18中のステップS6〜ステップS12までの処理と同じであるので説明を省略する。以上のように、第1実施形態と同様の効果がある。   As described above, when the calling order and the end order of the processes B-1 and B-2 may be different, the presence / absence of the business to be restored is not the last record for the management ID but all the records. Judgment is based on whether or not the execution result is abnormal, and the timing at which recovery can be performed is not the timing at which the final record can be recovered, but the timing at which recovery can be performed for all records where the execution result is abnormal It is. Since the process of step S28-step S34 is the same as the process of step S6-step S12 in FIG. 18, description is abbreviate | omitted. As described above, there are the same effects as in the first embodiment.

(f) 復旧処理(第3実施形態)
第1及び第2実施形態では、オペレータが復旧を指示(手動)することにより行ったが、第3実施形態では、各業務名ID及びプロセス番号について、手動及び自動のいずれの方式により復旧を行うかを示す復旧方式識別、復旧が失敗してもリトライする上限(リトライ上限)、リトライするまでの待ち時間を、例えば、復旧制御入出力部156より入力し、復旧制御部158が環境情報テーブル170に格納する。
(F) Recovery processing (third embodiment)
In the first and second embodiments, the operator instructs recovery (manually), but in the third embodiment, each business name ID and process number is recovered by either manual or automatic method. For example, the recovery method identification, the upper limit to retry even if recovery fails (retry upper limit), and the waiting time until retry are input from the recovery control input / output unit 156, and the recovery control unit 158 inputs the environment information table 170. To store.

図25は処理の呼び出し関係を示す図であり、図16と同様である。図26は処理管理情報テーブル160の内容を示す図である。状態1−4は、図16中の状態1−4と同じであるが、状態1−4における処理管理情報は、処理A,B−1,B−2が業務名ID及びプロセス番号を元に環境情報テーブル170を検索して業務名ID及びプロセス番号に対応する復旧方式識別、リトライ上限及び待ち時間を取得して、処理管理情報テーブル160に、管理ID、処理管理番号、プロセス番号等とともに書き込むことから、復旧方式識別、リトライ上限及び待ち時間が図17中の処理管理情報に追加されている。   FIG. 25 is a diagram showing a process call relationship, which is the same as FIG. FIG. 26 shows the contents of the process management information table 160. The state 1-4 is the same as the state 1-4 in FIG. 16, but the process management information in the state 1-4 is based on the business name ID and process number for the processes A, B-1, and B-2. Search the environment information table 170 to obtain the recovery method identification, retry upper limit and waiting time corresponding to the business name ID and process number, and write them together with the management ID, process management number, process number, etc. in the process management information table 160 Therefore, the recovery method identification, the retry upper limit, and the waiting time are added to the process management information in FIG.

図27は本発明の第3実施形態による復旧制御部158が実施する復旧処理のフローチャートである。ステップS50において、(2)に示すように、周期的に処理管理情報テーブル164の処理管理情報を監視しており、同一の管理IDについて、最終の処理管理情報レコードの実行結果が異常終了(NG)「−1」となっているかをチェックする。   FIG. 27 is a flowchart of the recovery process performed by the recovery control unit 158 according to the third embodiment of the present invention. In step S50, as shown in (2), the process management information in the process management information table 164 is periodically monitored, and the execution result of the final process management information record for the same management ID is abnormally terminated (NG ) Check whether it is “−1”.

ステップS52において、NGがあるか否かを判断する。NGがあれば、ステップS54に進み、NGがなければ、ステップS50に戻る。ステップS54において、(4)に示すように、同一の「管理ID」について、復旧方式識別が自動復旧(1)であるかチェックする。ステップS56において、自動復旧であれば、ステップS58に進む。手動復旧であれば、図18中のステップS6〜S12と同様の処理をする。尚、復旧失敗した場合には、リトライ上限及び待ち時間に応じて、復旧をリトライする。   In step S52, it is determined whether there is NG. If there is NG, the process proceeds to step S54, and if there is no NG, the process returns to step S50. In step S54, as shown in (4), it is checked whether or not the recovery method identification is automatic recovery (1) for the same “management ID”. If it is determined in step S56 that automatic recovery has been performed, the process proceeds to step S58. If it is manual recovery, the same processing as steps S6 to S12 in FIG. 18 is performed. When recovery fails, recovery is retried according to the retry upper limit and waiting time.

ステップS58において、(6)に示すように、自動復旧対象の処理について、復旧シナリオの実施要求を行う。要求は処理管理番号の降順で行う。ステップS60において、復旧成功したか否か判別する。復旧成功したならば、自動復旧対象について復旧が終了したならが処理を終了し、自動復旧が終了していないものがあれば、ステップS61に進む。ステップS62において、全ての復旧対象について復旧が終了した否かを判別する。全ての復旧対象について復旧が終了していなければ、ステップS58に戻る。復旧が終了していれば、処理を終了する。   In step S58, as shown in (6), a recovery scenario execution request is made for the automatic recovery target process. Requests are made in descending order of process management numbers. In step S60, it is determined whether the recovery is successful. If the recovery is successful, the process ends if the recovery is completed for the target of automatic recovery, and if there is an item for which automatic recovery is not completed, the process proceeds to step S61. In step S62, it is determined whether or not recovery has been completed for all recovery targets. If recovery has not been completed for all recovery targets, the process returns to step S58. If the recovery is finished, the process is finished.

例えば、図26及び図27に示すように、プロセス番号1003,1002,1001については復旧方式が自動方式なので、自動により復旧される。尚、プロセスID1001のプロセスAが最初に異常終了し、プロセスID1002,1003のプロセスが起動されていないような場合、即ち、プロセス番号1001が最新レコードとして登録された状態で「実行結果」が「−1」となっている場合には、プロセスID1001について、自動復旧が設定されていても手動のみ有効とすることも可能である。   For example, as shown in FIGS. 26 and 27, process numbers 1003, 1002, and 1001 are automatically restored because the restoration method is an automatic method. If the process A with the process ID 1001 is abnormally terminated first and the processes with the process IDs 1002 and 1003 are not activated, that is, the process number 1001 is registered as the latest record, the “execution result” is “−”. In the case of “1”, the process ID 1001 can be enabled only manually even if automatic recovery is set.

ステップS62において、リトライ上限が0になったか否かを判別する。リトライ上限が0になった場合は、処理を終了する。リトライ上限が0になっていなければ、ステップS70に進む。ステップS64において、(8)に示すように、処理管理情報テーブル164中の該当レコードのリトライ上限を1デクリメントする。ステップS72において、(10)に示すように、該当レコードの待ち時間の秒だけ待ってから、ステップS58に戻る。   In step S62, it is determined whether or not the retry upper limit has become zero. When the retry upper limit becomes 0, the process ends. If the retry upper limit is not 0, the process proceeds to step S70. In step S64, as shown in (8), the retry upper limit of the corresponding record in the process management information table 164 is decremented by one. In step S72, as shown in (10), after waiting for the waiting time of the corresponding record, the process returns to step S58.

以上のように、第1及び第2実施形態と同様の効果がある上に、自動で復旧すること及びリトライ上限を定めて復旧に失敗した場合には、リトライ上限までリトライすることにより、オペレータによる手動で復旧の指示を行う工数を省くことができるとともに、手動復旧と自動復旧を業務名IDやプロセスID毎に区別することができる。   As described above, in addition to the same effects as those of the first and second embodiments, when the recovery is automatically performed and the retry upper limit is set and the recovery fails, the operator tries by retrying to the retry upper limit. Man-hours for manually instructing recovery can be saved, and manual recovery and automatic recovery can be distinguished for each business name ID and process ID.

(g) 復旧処理(第4実施形態)
第4実施形態では、第1〜第3実施形態ではシステム50及び装置52#A〜52#D,102#A〜102#Dの復旧を同期を取って行っていたが、装置52#A〜52#D,102#A〜102#Dと切り離してシステムの状態のみを復旧することを可能としている。システム50及び装置52#A〜52#D,102#A〜102#Dの復旧の同期を取るとは、システム50と装置52#A〜52#D,102#A〜102#Dの双方を復旧することをいい、システム50や装置52#A〜52#D,102#A〜102#Dの復旧に失敗すると、復旧を中断することをいう。システム50の復旧とは、処理実行情報テーブル160の復旧をいう。
(G) Recovery processing (fourth embodiment)
In the fourth embodiment, the recovery of the system 50 and the devices 52 # A to 52 # D and 102 # A to 102 # D is performed in synchronization in the first to third embodiments. 52 # D and 102 # A to 102 # D can be disconnected to restore only the system state. Synchronizing the recovery of the system 50 and the devices 52 # A to 52 # D and 102 # A to 102 # D means that both the system 50 and the devices 52 # A to 52 # D and 102 # A to 102 # D are synchronized. It means that the system 50 and the devices 52 # A to 52 # D and 102 # A to 102 # D fail to be restored. The recovery of the system 50 refers to the recovery of the process execution information table 160.

図28に示すように、復旧制御入出力部156は、復旧対象一覧の中から復旧する業務名を選択することに加えて、当該選択した業務名について復旧種別フラグを選択することが可能となっている。復旧種別フラグは、装置と同期を取ってシステムの状態のみを復旧するモードと、装置と切り離してシステムの状態のみを復旧するモードがある。   As shown in FIG. 28, the recovery control input / output unit 156 can select a recovery type flag for the selected business name in addition to selecting a business name to be recovered from the recovery target list. ing. The recovery type flag includes a mode in which only the system state is recovered in synchronization with the apparatus, and a mode in which only the system state is recovered by disconnecting from the apparatus.

図29は本発明の第4実施形態による復旧制御入出力部156及び復旧制御部158が実施する復旧処理のフローチャートである。ステップS100において、復旧制御入出力部156は、図27に示すように、復旧対象一覧とともに復旧種別フラグを表示すると、オペレータは、復旧対象一覧から復旧する対象を選択するとともに、復旧種別フラグを選択して復旧要求をする。   FIG. 29 is a flowchart of the recovery process performed by the recovery control input / output unit 156 and the recovery control unit 158 according to the fourth embodiment of the present invention. In step S100, when the recovery control input / output unit 156 displays the recovery type flag together with the recovery target list as shown in FIG. 27, the operator selects the recovery target flag from the recovery target list and selects the recovery type flag. And request recovery.

ステップS102において、システム50内の復旧処理を行う。尚、ここでは、システム50内の最初に復旧処理を行うこととしているが、復旧対象の処理管理番号の降順による復旧処理を行った場合の該当の処理順においてシステム50内の復旧処理を行っても良い。ステップS104において、システム50内の応答は正常(システム50の復旧処理が成功)であるか否かを判別する。正常ならば、ステップS106に進む。異常ならば、ステップS114に進む。ステップS106において、処理管理番号の降順等の順序で装置や他システム(装置等)を上述した復旧シナリオに従って復旧処理を行う。ステップS108において、装置等からの応答は正常であるか否かを判別する。正常ならば、ステップS111に進む。異常ならば、ステップS110に進む。   In step S102, recovery processing in the system 50 is performed. Here, the recovery process is performed first in the system 50. However, the recovery process in the system 50 is performed in the corresponding processing order when the recovery process is performed in descending order of the process management numbers to be recovered. Also good. In step S104, it is determined whether or not the response in the system 50 is normal (the recovery process of the system 50 is successful). If normal, the process proceeds to step S106. If abnormal, the process proceeds to step S114. In step S106, recovery processing is performed on the devices and other systems (devices, etc.) in the order of descending processing management numbers according to the recovery scenario described above. In step S108, it is determined whether or not the response from the device or the like is normal. If normal, the process proceeds to step S111. If abnormal, the process proceeds to step S110.

ステップS110において、復旧種別フラグが「装置等と同期」が選択されているか否かを判別する。「装置等と同期」が選択されている場合には、ステップS114に進む。ステップS114において、処理を中断する。即ち、「装置等と同期」が選択されている場合には、復旧対象のシステム50又は装置等のどれか一つに復旧異常が発生した場合に、処理を中断する。「装置等と切り離してシステムの状態のみを復旧」が選択されている場合には、ステップS111に進む。一方、「装置等と切り離してシステムの状態のみを復旧」が選択されていない場合には、装置等のどれか一つの復旧異常が発生しても、他の装置等の復旧を行うことにより、一つの装置等が障害、システムと装置等を接続する通信回線に障害が発生していることにより、復旧異常が発生することも考えられることから、当該装置等を復旧対象から切り離して、復旧できる他の装置等を復旧するものである。   In step S110, it is determined whether or not “synchronization with device or the like” is selected as the recovery type flag. If “Synchronize with device etc.” is selected, the process proceeds to step S114. In step S114, the process is interrupted. In other words, when “synchronize with a device or the like” is selected, the processing is interrupted when a recovery abnormality occurs in any one of the system 50 or the device to be recovered. If “recover only the system state by disconnecting from the device” is selected, the process proceeds to step S111. On the other hand, if "Restore only system status by disconnecting from devices" is not selected, even if any one of the recovery errors occurs, the other devices can be recovered, Since a failure occurs in one device, etc., and a failure has occurred in the communication line that connects the system and the device, it is possible that a recovery abnormality will occur. It restores other devices.

これにより、復旧された他の装置等に対して、装置制御要求や通信が可能となるからである。ステップS112において、全ての処理管理番号について復旧完了したか否かを判定する。復旧が完了した場合は処理を終了する。復旧が完了していない場合には、ステップS102に戻って、復旧の完了していないシステム50や装置等の復旧処理を行う。   This is because device control requests and communication can be made to other restored devices. In step S112, it is determined whether or not recovery has been completed for all process management numbers. When the recovery is completed, the process ends. If the recovery has not been completed, the process returns to step S102 to perform a recovery process for the system 50 or the device that has not been recovered.

尚、復旧処理を処理管理番号の降順に行う場合には、「装置等と切り離してシステムの状態のみを復旧」が選択されているとき、装置等の復旧処理が異常終了しても、次の降順のシステムや装置等に対する復旧処理を行う。以上のように、復旧が異常終了した装置を切り離して、他の装置及びシステムを優先的に復旧するので、システム50や復旧が正常終了した装置等に装置制御要求を実施することができる。   If the recovery process is performed in descending order of the process management number, when "Restore only the system status by disconnecting from the device, etc." is selected, even if the recovery process of the device etc. ends abnormally, the following Perform recovery processing for systems and devices in descending order. As described above, the device whose recovery has ended abnormally is disconnected, and other devices and systems are preferentially recovered, so that the device control request can be made to the system 50, the device whose recovery has ended normally, or the like.

(h) 復旧処理(第5実施形態)
第5実施形態は、復旧種別フラグの「装置と切り離してシステムの状態のみを復旧する」の意義が第4実施形態と異なる。「装置と切り離してシステムの状態のみを復旧する」とは、装置等については復旧の対象外として、システム50のみを復旧対象とする復旧方式をいう。
(H) Recovery processing (fifth embodiment)
The fifth embodiment differs from the fourth embodiment in the significance of the recovery type flag “recover only the system state by disconnecting from the device”. “Restoring only the state of the system by disconnecting from the device” refers to a recovery method in which only the system 50 is a recovery target, excluding the device and the like.

図30は本発明の第5実施形態による復旧制御入出力部156及び復旧制御部158が実施する復旧処理のフローチャートである。ステップS150〜S154の処理は、ステップS100〜S104の処理と同様である。ステップS156において、復旧種別フラグは「装置等と同期」が選択されているか否かを判別する。「装置等と同期」が選択されていなければ、装置等は復旧対象外として、ステップS158に進む。「装置等と同期」が選択されていれば、ステップS160に進む。   FIG. 30 is a flowchart of the recovery process performed by the recovery control input / output unit 156 and the recovery control unit 158 according to the fifth embodiment of the present invention. The process of steps S150 to S154 is the same as the process of steps S100 to S104. In step S156, it is determined whether or not “synchronization with device or the like” is selected as the recovery type flag. If “synchronize with device, etc.” is not selected, the device is not subject to recovery, and the process proceeds to step S158. If “Synchronize with device” is selected, the process proceeds to step S160.

ステップS158において、全ての処理管理番号について復旧完了したか否かを判別する。復旧が完了すれば、終了する。復旧が完了していなければ、ステップS152に戻る。ステップS160において、装置等の復旧処理を実施する。ステップS162において、装置等からの応答が正常であるか否かを判別する、応答が正常であれば、ステップS158に進む。応答が正常でなければ、ステップS164に進む。ステップS164において、処理を中断する。このように、「装置等と同期」が選択されていない場合には、システム50のみの復旧処理を行うことによりシステム50を早く復旧して、システム50を復復旧処理以外の他の制御要求、例えば、装置状態監視等の業務を行うことができる。   In step S158, it is determined whether recovery has been completed for all process management numbers. When recovery is complete, the process ends. If the recovery is not completed, the process returns to step S152. In step S160, recovery processing of the device or the like is performed. In step S162, it is determined whether or not the response from the device or the like is normal. If the response is normal, the process proceeds to step S158. If the response is not normal, the process proceeds to step S164. In step S164, the process is interrupted. As described above, when “synchronization with devices and the like” is not selected, the system 50 is quickly recovered by performing the recovery process of only the system 50, and the control request other than the recovery process is performed. For example, operations such as device status monitoring can be performed.

(i) 復旧処理(第6実施形態)
第6実施形態は、復旧種別フラグは指定せずに、一定回数装置等と同期を取った復旧を試みても成功しない場合には、自動的に装置等と切り離してシステムの状態のみを復旧するものである。
(I) Recovery processing (sixth embodiment)
In the sixth embodiment, if the recovery type flag is not specified and recovery is attempted after a certain number of synchronizations with the device or the like, if the recovery is not successful, the system state is automatically disconnected and only the system state is recovered. Is.

図31は本発明の第6実施形態による復旧制御部158が実施する復旧処理のフローチャートである。ステップS200において、システム50内の復旧処理を行う。尚、ここでは、システム50の復旧処理を最初に行うようにしているが、上述したように、処理管理番号の降順に従って処理を行うようにしても良い。ステップS202において、システム50内の応答が正常であるか否かを判別する。システム50内の応答が正常であれば、ステップS204に進む。システム50内の応答が正常でなければ、ステップS210に進む。   FIG. 31 is a flowchart of the recovery process executed by the recovery control unit 158 according to the sixth embodiment of the present invention. In step S200, recovery processing in the system 50 is performed. Here, the recovery process of the system 50 is performed first, but as described above, the process may be performed according to the descending order of the process management numbers. In step S202, it is determined whether or not the response in the system 50 is normal. If the response in the system 50 is normal, the process proceeds to step S204. If the response in the system 50 is not normal, the process proceeds to step S210.

ステップS204において、装置等の復旧処理を行う。ステップS206において、装置等から応答が正常であるか否かを判別する。応答が正常ならば、ステップS207に進む。応答が正常でなければ、ステップS210に進む。ステップS207において、装置等の復旧処理を行う。ステップS208において、全ての処理管理番号について復旧が完了したか否かを判別する。復旧が完了していなければ、ステップS200に戻る。復旧が完了したならば、処理を終了する。   In step S204, recovery processing of the device or the like is performed. In step S206, it is determined whether or not the response from the device or the like is normal. If the response is normal, the process proceeds to step S207. If the response is not normal, the process proceeds to step S210. In step S207, recovery processing of the device or the like is performed. In step S208, it is determined whether or not recovery has been completed for all process management numbers. If the recovery is not completed, the process returns to step S200. When the recovery is completed, the process ends.

ステップS210において、当該復旧処理について復旧失敗回数をカウントアップする。ステップS212において、復旧失敗回数が指定回数以下であれば、ステップS200に戻って、復旧が失敗したシステム50又は装置等の復旧処理を行う。復旧失敗回数が指定回数に達した場合には、ステップS214において、復旧失敗した装置等を復旧対象外として、システム50又は他の装置等の復旧を行う。このように、装置復旧に失敗した場合は自動で上限回数までリトライすることにより装置の迅速な復旧が可能となること、リトライにより復旧しない装置については切り離して他の装置及び自システム50の復旧をすることから他の装置を自動で復旧することができる。   In step S210, the number of restoration failures is counted up for the restoration process. In step S212, if the number of recovery failures is equal to or less than the specified number, the process returns to step S200 to perform recovery processing of the system 50 or the device that has failed to recover. When the number of restoration failures reaches the specified number, in step S214, the system 50 or other devices are restored by excluding the failed restoration device from the restoration target. As described above, when the device restoration fails, it is possible to quickly restore the device by automatically retrying up to the upper limit number of times. For devices that are not restored by the retry, the other devices and the own system 50 are restored. Therefore, other devices can be automatically restored.

(j) 復旧処理(第7実施形態)
第7実施形態は、復旧種別要求フラグは復旧処理要求を行う操作毎(管理ID)ではなく、特定の装置等に関する復旧要求部分にのみ適用するものである。特定の装置等が長時間復旧不可能な事、例えば、装置制御要求に対して異常終了したことにより、異常終了に係わる装置等が故障により長時間復旧不可能である事が、復旧前に予め分かっており、その装置等については復旧対象外として、システム50と切り離して状態管理を行いたいが、その他の装置等に対してはシステム50と状態を同期して状態復旧したい場合等に本実施形態が適用されるものである。
(J) Recovery processing (seventh embodiment)
In the seventh embodiment, the recovery type request flag is applied only to a recovery request portion related to a specific device or the like, not for each operation (management ID) that makes a recovery processing request. The fact that a specific device cannot be recovered for a long time, for example, that a device related to the abnormal end cannot be recovered for a long time due to a failure due to an abnormal end in response to a device control request, in advance before recovery. This is known when the device is excluded from the recovery target and you want to manage the state separately from the system 50, but you want to recover the state of other devices etc. by synchronizing the state with the system 50. The form applies.

図32は本発明の第7実施形態による復旧処理を実施するための監視システム200のシステム構成図であり、図2中の構成要素と同一の構成要素には同一の符号を付している。図に示すように、復旧対象外テーブル210が設けられている。復旧対象外テーブル210には、復旧対象外の装置等の装置番号が格納されている。装置番号は処理実行前情報テーブル166に登録された装置番号に対応するものである。復旧制御入出力部202より復旧対象外の装置番号をオペレータが入力し、復旧制御部204が復旧対象外テーブル210に登録する。   FIG. 32 is a system configuration diagram of the monitoring system 200 for performing the recovery processing according to the seventh embodiment of the present invention, and the same components as those in FIG. 2 are denoted by the same reference numerals. As shown in the figure, a non-recovery table 210 is provided. The recovery target non-recovery table 210 stores device numbers of devices that are not recovery target. The device number corresponds to the device number registered in the pre-processing execution information table 166. The operator inputs a device number that is not a recovery target from the recovery control input / output unit 202, and the recovery control unit 204 registers it in the non-recovery target table 210.

図33は本発明の第7実施形態による復旧制御部204が実施する復旧処理のフローチャートである。ステップS250において、システム50内の復旧処理を行う。ステップS252において、システム50内の応答が正常であるか否かを判別する。システム50内の応答が正常であれば、ステップS253に進む。システム50内の応答が正常でなければ、ステップS260に進む。   FIG. 33 is a flowchart of the recovery process executed by the recovery control unit 204 according to the seventh embodiment of the present invention. In step S250, recovery processing in the system 50 is performed. In step S252, it is determined whether or not the response in the system 50 is normal. If the response in the system 50 is normal, the process proceeds to step S253. If the response in the system 50 is not normal, the process proceeds to step S260.

ステップS253において、装置等の復旧処理を行う。ステップS254において、装置等から応答が正常であるか否かを判別する。応答が正常ならば、ステップS256に進む。応答が正常でなければ、ステップS258に進む。ステップS256において、全ての処理管理番号について復旧が完了したか否かを判別する。復旧が完了していなければ、ステップS250に戻る。復旧が完了したならば、処理を終了する。   In step S253, recovery processing of the device or the like is performed. In step S254, it is determined whether or not the response from the device or the like is normal. If the response is normal, the process proceeds to step S256. If the response is not normal, the process proceeds to step S258. In step S256, it is determined whether recovery has been completed for all process management numbers. If the recovery is not completed, the process returns to step S250. When the recovery is completed, the process ends.

ステップS258において、当該異常終了した装置等が復旧対象外テーブル210に登録済みであるか否かを判定する。復旧対象外テーブル210に登録済みであれば、ステップS256に進む。復旧対象外テーブル210に登録済みでなければ、ステップS260に進む。ステップS260において、処理を中断する。このように、復旧対象外テーブル210に登録された装置等に対する復旧処理が異常終了しても、この装置等を無視して、他の装置等の復旧をシステム200と同期を取って行うことができる。尚、復旧対象外テーブル210に登録された装置等を復旧処理の対象外として処理することも可能である。このように、復旧ができないと予め分かっている装置については復旧の対象外として登録するので、復旧対象外の装置に無駄な復旧処理を行うことがないので、迅速且つ無駄の無い復旧が可能となる。   In step S258, it is determined whether the abnormally terminated device or the like has been registered in the non-recoverable table 210. If registered in the non-recovery target table 210, the process proceeds to step S256. If not registered in the non-recovery table 210, the process proceeds to step S260. In step S260, the process is interrupted. As described above, even if the recovery process for the device or the like registered in the non-recovery table 210 is abnormally terminated, the other device or the like can be recovered in synchronization with the system 200 by ignoring this device or the like. it can. It is also possible to process a device or the like registered in the non-recovery target table 210 as a non-recovery target. In this way, devices that are known to be unrecoverable are registered as non-recoverable devices, so there is no need to perform unnecessary recovery processing on non-recoverable devices, enabling quick and lean recovery. Become.

本発明は以下の付記を含む。   The present invention includes the following supplementary notes.

(付記1)
装置制御要求に基づいて装置情報を格納する第1の情報テーブルを更新する複数の外部装置に対して前記装置制御要求を行うとともに該装置制御要求に係わる処理実行情報を格納する第2の情報テーブルを更新する装置制御処理部と、
前記装置制御要求を前記外部装置に対して行うとき、該装置制御要求に係わる要求内容及び該装置制御要求対象の外部装置を特定する管理情報を第3の情報テーブルに格納する管理情報格納部と、
該装置制御要求に係わる前記第2のテーブルに格納された該装置制御要求を行う前の処理実行前情報を第4の情報テーブルに格納する処理実行前情報格納部と、
前記装置制御要求に対する処理が異常終了した場合に、前記第3の情報テーブルに格納された当該装置制御要求に係わる管理情報により特定される要求内容に基づいて、該処理実行前又は処理実行後の装置状態にするための装置制御要求を該外部装置に対して実施するよう制御する復旧制御部と、
を具備したことを特徴とする監視システム。
(Appendix 1)
A second information table that makes a device control request to a plurality of external devices that update a first information table that stores device information based on the device control request and stores processing execution information related to the device control request A device control processing unit for updating
A management information storage unit for storing, in a third information table, management information for specifying the content of the request related to the device control request and the external device targeted for the device control request when the device control request is made to the external device; ,
A pre-process execution information storage unit for storing pre-process execution information before performing the device control request stored in the second table related to the device control request in a fourth information table;
When processing for the device control request ends abnormally, based on the request content specified by the management information related to the device control request stored in the third information table, before or after the processing execution A recovery control unit that controls to execute the device control request for setting the device state to the external device;
A monitoring system comprising:

(付記2)
前記復旧制御部は、前記異常終了に係わる装置制御要求に対応する前記第4の情報テーブルに格納された処理実行前情報に基づいて、前記第2の情報テーブルを当該装置制御要求に係わる更新前の状態に自システムを復旧することを特徴とする付記1記載の監視システム。
(Appendix 2)
The restoration control unit is configured to update the second information table before the update related to the device control request based on the pre-process execution information stored in the fourth information table corresponding to the device control request related to the abnormal termination. The monitoring system according to appendix 1, wherein the system is restored to the state of

(付記3)
制御要求を入力する入力部を更に具備し、前記装置制御処理部は前記制御要求について複数の前記外部装置に対する複数の装置制御要求を行い、前記管理情報格納部は、当該制御要求について前記装置制御要求の順序を示す処理管理番号を前記管理情報に付加して前記第3の情報テーブルに格納し、前記復旧制御部は前記第3の情報テーブルに格納された処理管理番号に基づいて前記装置制御要求の順序とは逆の順序で復旧することを特徴とする付記2記載の監視システム。
(Appendix 3)
The device further includes an input unit for inputting a control request, the device control processing unit makes a plurality of device control requests to the plurality of external devices for the control request, and the management information storage unit performs the device control for the control request. A process management number indicating the order of requests is added to the management information and stored in the third information table, and the recovery control unit controls the apparatus based on the process management number stored in the third information table. The monitoring system according to appendix 2, wherein recovery is performed in the reverse order of the request order.

(付記4)
前記第3の情報テーブルに格納された管理情報に基づいて、前記装置制御要求が異常終了して復旧が完了していない制御要求の内容を表示する復旧出力部と、前記表示した制御要求の中で復旧の指示を入力する復旧入力部とを具備し、前記復旧制御部は前記復旧の指示された制御要求に係わる装置制御要求についての前記第3の情報テーブルに格納された管理情報及び前記第4の情報テーブルに格納された処理実行前情報に基づいて、外部装置の復旧を行うことを特徴とする付記2記載の監視システム。
(Appendix 4)
Based on the management information stored in the third information table, a recovery output unit that displays the content of the control request that has not been completely restored due to the abnormal termination of the device control request, And a recovery input unit that inputs a recovery instruction in the management information stored in the third information table for the device control request related to the control request instructed to recover and the The monitoring system according to appendix 2, wherein the external device is restored based on the pre-process execution information stored in the information table 4.

(付記5)
前記管理情報格納部は、処理実行状態を示す実行状態情報を実行中に設定した実行状態情報を前記管理情報に付加して前記第3の情報テーブルに格納し、前記実行状態情報を前記外部装置における異常終了及び正常終了のいずれであるかを示す実行結果に更新し、前記復旧制御部は、前記実行状態情報に基づいて、復旧処理が実施できるか否かを判断して、復旧処理が実施できると判断される場合には、前記復旧を実施することを特徴とする付記3記載の監視システム。
(Appendix 5)
The management information storage unit adds execution state information set during execution of execution state information indicating a process execution state to the management information, stores the management state information in the third information table, and stores the execution state information in the external device The execution result indicating whether the abnormal end or the normal end is updated, and the recovery control unit determines whether or not the recovery process can be executed based on the execution state information, and the recovery process is executed. 4. The monitoring system according to appendix 3, wherein the recovery is performed when it is determined that it can be performed.

(付記6)
前記管理情報格納部は、前記制御要求に係わる前記装置制御要求を一つの前記外部装置に対して複数回行う場合には、各装置制御要求の内容を特定する情報を前記管理情報に付加して前記第3の情報テーブルに格納し、前記復旧制御部は、前記装置制御要求の内容を特定する情報に基づいて前記装置制御要求の内容を特定して、該情報が前記第3の情報テーブルに格納された順とは逆の順序で該外部装置に対する復旧処理を実施することを特徴とする付記1記載の監視システム。
(Appendix 6)
The management information storage unit adds information specifying the content of each device control request to the management information when the device control request related to the control request is made multiple times to one external device. The restoration control unit specifies the content of the device control request based on the information specifying the content of the device control request, and stores the information in the third information table. The monitoring system according to supplementary note 1, wherein recovery processing for the external device is performed in an order reverse to the stored order.

(付記7)
前記各装置制御要求について復旧の手順を定義する復旧シナリオを格納する復旧シナリオファイルを更に具備し、前記復旧制御部は、前記第3の情報テーブルに格納された管理情報により特定される装置制御要求に対応する前記復旧シナリオファイルに格納された復旧シナリオに基づいて復旧処理を実施することを特徴とする付記1記載の監視システム。
(Appendix 7)
A recovery scenario file that stores a recovery scenario that defines a recovery procedure for each device control request is further provided, and the recovery control unit is configured to specify a device control request specified by management information stored in the third information table. The monitoring system according to appendix 1, wherein a recovery process is performed based on a recovery scenario stored in the recovery scenario file corresponding to.

(付記8)
前記装置制御要求について、自動及び手動でいずれにより復旧するかを示す復旧方式を格納する環境情報テーブルを更に具備し、前記復旧制御部は、前記装置制御要求についての前記復旧方式が自動により復旧することを示す場合には、自動復旧することを特徴とする付記1記載の監視システム。
(Appendix 8)
The device control request further includes an environment information table that stores a recovery method indicating whether to automatically or manually recover the device control request, and the recovery control unit automatically recovers the recovery method for the device control request. The monitoring system according to appendix 1, wherein the system is automatically restored when it is indicated.

(付記9)
前記復旧制御部は、前記自システムの前記第2の情報テーブルの復旧を優先的に行うことを特徴とする付記3記載の監視システム。
(Appendix 9)
The monitoring system according to appendix 3, wherein the restoration control unit preferentially restores the second information table of the own system.

(付記10)
前記復旧制御部は、前記復旧処理が前記外部装置に対する復旧処理が異常終了した場合に、当該外部装置の復旧を停止し、他の外部装置に対する復旧処理を行うことを特徴とする付記3記載の監視システム。
(Appendix 10)
The supplementary control unit according to claim 3, wherein the restoration control unit stops restoration of the external device and performs restoration processing for another external device when the restoration processing for the external device ends abnormally. Monitoring system.

(付記11)
復旧対象外の外部装置を登録する第5のテーブルを更に具備し、前記復旧制御部は、前記第5のテーブルに登録されている復旧対象外の外部装置に優先して、復旧対象の外部装置に対して復旧処理を実施する行うことを特徴とする付記3記載の監視システム。
(Appendix 11)
A fifth table for registering external devices not to be recovered; and the recovery control unit has priority over external devices not to be registered registered in the fifth table. The monitoring system according to appendix 3, wherein a recovery process is performed on the system.

本発明の原理図である。It is a principle diagram of the present invention. 本発明の実施形態による監視システムを含む全体構成図である。1 is an overall configuration diagram including a monitoring system according to an embodiment of the present invention. 図2中のシステム50の構成図である。It is a block diagram of the system 50 in FIG. 処理管理情報テーブル164を示す図である。It is a figure which shows the process management information table 164. FIG. 処理実行前情報テーブル166を示す図である。It is a figure which shows the pre-processing execution information table. 復旧シナリオの一例を示す図である。It is a figure which shows an example of a recovery scenario. 正常終了の場合のシステムの動作説明図である。It is operation | movement explanatory drawing of the system in the case of normal completion. 正常終了の場合のシステムの動作説明図である。It is operation | movement explanatory drawing of the system in the case of normal completion. 正常終了の場合のシステムの動作説明図である。It is operation | movement explanatory drawing of the system in the case of normal completion. 正常終了の場合のシステムの動作説明図である。It is operation | movement explanatory drawing of the system in the case of normal completion. 異常終了の場合のシステムの動作説明図である。It is operation | movement explanatory drawing of the system in the case of abnormal termination. 異常終了の場合のシステムの動作説明図である。It is operation | movement explanatory drawing of the system in the case of abnormal termination. 異常終了の場合のシステムの動作説明図である。It is operation | movement explanatory drawing of the system in the case of abnormal termination. 異常終了の場合のシステムの動作説明図である。It is operation | movement explanatory drawing of the system in the case of abnormal termination. 復旧シナリオの変更手順を示す図である。It is a figure which shows the change procedure of a recovery scenario. シリアル処理における異常の場合の処理の呼び出し関係を示す図である。It is a figure which shows the calling relationship of the process in the case of abnormality in a serial process. 図16の処理シーケンスにおける処理管理情報テーブルの内容を示す図である。It is a figure which shows the content of the process management information table in the process sequence of FIG. 本発明の第1実施形態による復旧処理のフローチャートである。It is a flowchart of the recovery process by 1st Embodiment of this invention. 復旧対象一覧を示す図である。It is a figure which shows a recovery object list. 復旧シナリオ実施の流れを示す図である。It is a figure which shows the flow of recovery scenario implementation. 復旧シナリオ実施の例を示す図である。It is a figure which shows the example of recovery scenario implementation. パラレル処理における異常の場合の処理の呼び出し関係を示す図である。It is a figure which shows the calling relationship of the process in the case of abnormality in a parallel process. 図22の処理シーケンスにおける処理管理情報テーブルの内容を示す図である。It is a figure which shows the content of the process management information table in the process sequence of FIG. 本発明の第2実施形態による復旧処理のフローチャートである。It is a flowchart of the recovery process by 2nd Embodiment of this invention. 処理の呼び出し関係を示す図である。It is a figure which shows the calling relationship of a process. 図25の処理シーケンスにおける処理管理情報テーブルの内容を示す図である。It is a figure which shows the content of the process management information table in the process sequence of FIG. 本発明の第3実施形態による復旧処理のフローチャートである。It is a flowchart of the recovery process by 3rd Embodiment of this invention. 本発明の第4実施形態による復旧処理のフローチャートである。It is a flowchart of the recovery process by 4th Embodiment of this invention. 復旧対象一覧を示す図である。It is a figure which shows a recovery object list. 本発明の第5実施形態による復旧処理のフローチャートである。It is a flowchart of the recovery process by 5th Embodiment of this invention. 本発明の第6実施形態による復旧処理のフローチャートである。It is a flowchart of the recovery process by 6th Embodiment of this invention. 本発明の第7実施形態による復旧処理を実施するための監視システムのシステム構成図である。It is a system configuration | structure figure of the monitoring system for implementing the recovery process by 7th Embodiment of this invention. 本発明の第7実施形態による復旧処理のフローチャートである。It is a flowchart of the recovery process by 7th Embodiment of this invention.

符号の説明Explanation of symbols

2#i(i=1〜n) 第1の情報テーブル
4#i(i=1〜n) 外部装置
10 復旧システム
12 第2の情報テーブル
14 装置制御処理部
16 第3の情報テーブル
18 管理情報処理部
20 第4の情報テーブル
22 処理実行前情報格納部
24 復旧制御部
2 # i (i = 1 to n) First information table 4 # i (i = 1 to n) External device 10 Recovery system 12 Second information table 14 Device control processing unit 16 Third information table 18 Management information Processing unit 20 Fourth information table 22 Pre-processing information storage unit 24 Recovery control unit

Claims (3)

装置制御要求に基づいて装置情報を格納する第1の情報テーブルを更新する複数の外部装置に対して前記装置制御要求を行うとともに該装置制御要求に係わる処理実行情報を格納する第2の情報テーブルを更新する装置制御処理部と、
前記装置制御要求を前記外部装置に対して行うとき、該装置制御要求に係わる要求内容及び該装置制御要求対象の外部装置を特定する管理情報を第3の情報テーブルに格納する管理情報格納部と、
該装置制御要求に係わる前記第2のテーブルに格納された該装置制御要求を行う前の処理実行前情報を第4の情報テーブルに格納する処理実行前情報格納部と、
前記装置制御要求に対する処理が異常終了した場合に、前記第3の情報テーブルに格納された当該装置制御要求に係わる管理情報により特定される要求内容に基づいて、該処理実行前又は処理実行後の装置状態にするための装置制御要求を該外部装置に対して実施するよう制御する復旧制御部と、
を具備したことを特徴とする監視システム。
A second information table that makes a device control request to a plurality of external devices that update a first information table that stores device information based on the device control request and stores processing execution information related to the device control request A device control processing unit for updating
A management information storage unit for storing, in a third information table, management information for specifying the content of the request related to the device control request and the external device targeted for the device control request when the device control request is made to the external device; ,
A pre-process execution information storage unit for storing pre-process execution information before performing the device control request stored in the second table related to the device control request in a fourth information table;
When processing for the device control request ends abnormally, based on the request content specified by the management information related to the device control request stored in the third information table, before or after the processing execution A recovery control unit that controls to execute the device control request for setting the device state to the external device;
A monitoring system comprising:
前記復旧制御部は、前記異常終了に係わる装置制御要求に対応する前記第4の情報テーブルに格納された処理実行前情報に基づいて、前記第2の情報テーブルを当該装置制御要求に係わる更新前の状態に自システムを復旧することを特徴とする請求項1記載の監視システム。   The restoration control unit is configured to update the second information table before the update related to the device control request based on the pre-process execution information stored in the fourth information table corresponding to the device control request related to the abnormal termination. The monitoring system according to claim 1, wherein the system is restored to the state. 制御要求を入力する入力部を更に具備し、前記装置制御処理部は前記制御要求について複数の前記外部装置に対する複数の装置制御要求を行い、前記管理情報格納部は、当該制御要求について前記装置制御要求の順序を示す処理管理番号を前記管理情報に付加して前記第3の情報テーブルに格納し、前記復旧制御部は前記第3の情報テーブルに格納された処理管理番号に基づいて前記装置制御要求の順序とは逆の順序で復旧することを特徴とする請求項2記載の監視システム。   The device further includes an input unit for inputting a control request, the device control processing unit makes a plurality of device control requests to the plurality of external devices for the control request, and the management information storage unit performs the device control for the control request. A process management number indicating the order of requests is added to the management information and stored in the third information table, and the recovery control unit controls the apparatus based on the process management number stored in the third information table. The monitoring system according to claim 2, wherein recovery is performed in an order reverse to the order of requests.
JP2004154738A 2004-05-25 2004-05-25 Monitoring system Expired - Fee Related JP4358034B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004154738A JP4358034B2 (en) 2004-05-25 2004-05-25 Monitoring system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004154738A JP4358034B2 (en) 2004-05-25 2004-05-25 Monitoring system

Publications (2)

Publication Number Publication Date
JP2005339015A JP2005339015A (en) 2005-12-08
JP4358034B2 true JP4358034B2 (en) 2009-11-04

Family

ID=35492542

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004154738A Expired - Fee Related JP4358034B2 (en) 2004-05-25 2004-05-25 Monitoring system

Country Status (1)

Country Link
JP (1) JP4358034B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5719974B2 (en) * 2012-09-03 2015-05-20 株式会社日立製作所 Management system for managing a computer system having a plurality of devices to be monitored
JP6221869B2 (en) * 2014-03-19 2017-11-01 富士通株式会社 Screen transition control method, screen transition control program, and screen transition control device
JP2024061405A (en) * 2022-10-21 2024-05-07 株式会社日立産機システム Monitoring device, management device, communication system, and recovery method

Also Published As

Publication number Publication date
JP2005339015A (en) 2005-12-08

Similar Documents

Publication Publication Date Title
JP3743336B2 (en) Configuration management device
US7958210B2 (en) Update management method and update management unit
US8117155B2 (en) Collection-based object replication
US8433947B2 (en) Computer program, method, and apparatus for controlling data allocation
US5247664A (en) Fault-tolerant distributed database system and method for the management of correctable subtransaction faults by the global transaction source node
JP5021929B2 (en) Computer system, storage system, management computer, and backup management method
JP6028850B2 (en) Data multiplexing system
US20120036394A1 (en) Data recovery method, data node, and distributed file system
CN108566291B (en) Event processing method, server and system
WO2021136422A1 (en) State management method, master and backup application server switching method, and electronic device
CN109753511B (en) Cross-region real-time synchronization method and system for big data platform
US20150082100A1 (en) System and method for synchronizing links and attachments between two computing devices
JP6231675B2 (en) Transaction processing method and apparatus
US20210256593A1 (en) Coordination process restart device and coordination process restart method
JP3916232B2 (en) Knowledge-type operation management system, method and program
JP4358034B2 (en) Monitoring system
JP5900094B2 (en) Data alignment system, data alignment method, and data alignment program
CN113590049B (en) Storage volume cross-node cloning method, device, equipment and readable medium
JP5480046B2 (en) Distributed transaction processing system, apparatus, method and program
CN110928532A (en) High-consistency micro-service architecture and data updating method thereof
JP2015103197A (en) Distributed processing system
CN113254159B (en) Migration method and device of stateful service, computer equipment and storage medium
JP5397076B2 (en) Job execution apparatus, job execution method, and job execution program
CN116166195A (en) Data processing method, system, equipment and storage medium
JP4464872B2 (en) Computer system and computer control method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070409

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090410

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090512

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090708

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090804

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090805

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120814

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4358034

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120814

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130814

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees