JPH10198574A - Backup device/method for duplex system - Google Patents

Backup device/method for duplex system

Info

Publication number
JPH10198574A
JPH10198574A JP9000263A JP26397A JPH10198574A JP H10198574 A JPH10198574 A JP H10198574A JP 9000263 A JP9000263 A JP 9000263A JP 26397 A JP26397 A JP 26397A JP H10198574 A JPH10198574 A JP H10198574A
Authority
JP
Japan
Prior art keywords
abnormality
error
designated
standby
active
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP9000263A
Other languages
Japanese (ja)
Inventor
Tomoyuki Ozawa
知之 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Engineering Corp
Original Assignee
Toshiba Engineering Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Engineering Corp filed Critical Toshiba Engineering Corp
Priority to JP9000263A priority Critical patent/JPH10198574A/en
Publication of JPH10198574A publication Critical patent/JPH10198574A/en
Withdrawn legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To suppress the frequency of the system switch of an operation system owing to the occurrence of abnormality, to suppress the stop time of a whole duplex system and to improve the job processing efficiency of the whole duplex system by dissolving simple abnormality occurred in the operation system and a designated system in a self-system. SOLUTION: When abnormality occurred in a process where the application program of a designated job is executed can be dissolved in the self-system 1a (1b) in the system 1a (1b) designated to be the operation system, the system of the operation system is not switched but an abnormality restoration processing is automatically executed in the self-system 1a (1b). In such a case, abnormality which can be dissolved in the self-system 1a (1b) is discriminated to be the partial abnormality of software, the abnormality of whole software and the local abnormality of hardware, and the optimum abnormality restoration processing corresponding to the type of abnormality van be executed. Thus, the type of abnormality that cannot be dissolved in the self-system can finally be reduced.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、稼働系に異常が生
じると待機系が稼働系へ移行するとともに異常が生じた
稼働系が待機系へ移行する二重化システムに係わり、特
に、異常が発生して稼働系が待機系へ移行するときの条
件を改良した二重化システムのバックアップ装置及び二
重化システムのバックアップ方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a redundant system in which, when an abnormality occurs in an operating system, a standby system shifts to an operating system and an operating system in which an abnormality occurs shifts to a standby system. The present invention relates to a backup device for a redundant system and a backup method for a redundant system in which the conditions when the operating system is shifted to the standby system are improved.

【0002】[0002]

【従来の技術】例えば、大規模工場における製造プラン
ト、金融機関におけるオンライン業務、交通機関におけ
る列車監視制御システム、流通業界におけるPOSシス
テム等の停止状態が一定時間以上継続することが許され
ないシステムにおいては、2系統のシステムを設置した
二重化システムが採用されている。
2. Description of the Related Art For example, in a system in which a stop state such as a manufacturing plant in a large-scale factory, an online operation in a financial institution, a train monitoring control system in a transportation system, a POS system in a distribution industry, etc. is not allowed to continue for a certain time or more, A duplex system having two systems is adopted.

【0003】周知のように、この二重化システムは、一
方が稼働系と指定され他方が待機系と指定された同一業
務を実行可能な一対のシステムで構成され、稼働系のシ
ステムに異常が生じると待機系のシステムが稼働系へ移
行するとともに異常が生じた稼働系のシステムが待機系
へ移行するようにしている。
As is well known, this duplex system is composed of a pair of systems capable of executing the same business, one of which is designated as the active system and the other of which is designated as the standby system. The standby system shifts to the active system, and the active system in which the abnormality has occurred shifts to the standby system.

【0004】この異常が生じた場合における稼働系の移
動を円滑に実行させるために、各システムのOS(オペ
レーティング・システム)には、業務の動作に対する監
視制御機能が組込まれている。
In order to smoothly move the operating system when this abnormality occurs, the OS (operating system) of each system has a built-in monitoring and control function for business operations.

【0005】すなわち、このOSに組込まれた監視制御
機能は、実行中の業務のアプリケーションプログラムの
動作監視し、プログラム動作に何等かの異常が発生する
と、その異常発生を即座に検出し、該当業務のアプリケ
ーションプログラムの動作を停止させ、待機系のシステ
ムに対して稼働系への移行通知を送出するとともに自己
システムの動作モードを待機系へ移行させる。その結
果、新たに稼働系に指定されたシステムが自己内に記憶
されている業務のアプリケーションプログラムを用いて
業務を開始する。
That is, the monitoring control function incorporated in the OS monitors the operation of the application program of the running business, and when any abnormality occurs in the operation of the program, immediately detects the occurrence of the abnormality, and Of the application program is stopped, a transition notification to the active system is sent to the standby system, and the operation mode of the own system is shifted to the standby system. As a result, the system newly designated as the active system starts the business using the business application program stored therein.

【0006】[0006]

【発明が解決しようとする課題】しかしながら、従来の
二重化システムにおいては、稼働系のシステムが与えら
れた業務を実行している期間において、たとえわずかな
異常が発生した場合であっても、稼働系のシステムが他
方のシステムに移動する。
However, in the conventional redundant system, even if a slight abnormality occurs during the period when the active system is executing a given task, the active system is not operated. System moves to the other system.

【0007】この異常発生に起因して稼働系のシスタム
が他方のシステムに移動する場合は、例えば、操作員が
新たに稼働系と指定されたシステムの初期状態を確認し
てから、実際に動作を開始させている。したがって、シ
ステム切替えに操作員が関与するので、システム切替に
要する時間が長くなる。当然、操作員の作業負担も増大
する。
[0007] When the system of the operating system moves to the other system due to the occurrence of the abnormality, for example, the operator confirms the initial state of the system newly designated as the operating system and then starts the actual operation. Has started. Therefore, since the operator is involved in the system switching, the time required for the system switching becomes longer. Naturally, the workload of the operator also increases.

【0008】また、たとえ自動的にシステム切替が実施
されたとしても、新たに稼働系と指定されたシステムの
状態を異常発生したシステムの異常発生直前の状態に一
致させる準備処理等が必要であり、やはり所定のシステ
ム切替時間が必要である。
Further, even if the system switching is automatically performed, a preparation process for matching the state of the system newly designated as the active system to the state immediately before the occurrence of the abnormality in the system in which the abnormality has occurred is required. Also, a predetermined system switching time is required.

【0009】このように、頻繁にシステム切替が実施さ
れると、二重化システム全体の業務処理能率が低下する
懸念がある。本発明はこのような事情に鑑みてなされた
ものであり、簡単な異常は自己システム内で解消するこ
とによって、異常発生に起因して、稼働系のシステム切
替の発生頻度を極力抑制し、システム切替に起因する二
重化システム全体の停止時間の発生を極力抑制し、二重
化システム全体の業務処理能率を向上できる二重化シス
テムのバックアップ装置及び二重化システムのバックア
ップ方法を提供することを目的とする。
As described above, if the system is frequently switched, there is a concern that the business processing efficiency of the entire redundant system is reduced. The present invention has been made in view of such circumstances, and a simple abnormality is eliminated in its own system, so that the frequency of system switching of an operating system is suppressed as much as possible due to the occurrence of an abnormality. An object of the present invention is to provide a backup device and a backup method for a redundant system that can minimize the occurrence of downtime of the entire redundant system due to switching and improve the business processing efficiency of the entire redundant system.

【0010】[0010]

【課題を解決するための手段】本発明は、一方が稼働系
と指定され他方が待機系と指定された同一業務を実行可
能な一対のシステムで構成され、稼働系に異常が生じる
と待機系が稼働系へ移行するとともに異常が生じた稼働
系が待機系へ移行する二重化システムに適用される。
The present invention comprises a pair of systems capable of executing the same job, one of which is designated as an active system and the other of which is designated as a standby system. Is applied to a redundant system in which an error occurs and the operating system in which an error occurs shifts to a standby system.

【0011】そして、請求項1の二重化システムのバッ
クアップ装置においては、稼働系と指定されたシステム
に対して、業務の異常を検出する異常検出手段と、この
異常検出手段で検出された異常が自己システム内で解消
可能な異常か解消不能な異常かを判定する異常種別判定
手段と、この異常種別判定手段が解消可能な異常と判定
したとき、所定の異常復旧処理を実行する異常復旧手段
と、異常種別判定段が解消不能な異常と判定したとき、
待機系のシステムに対して稼働系移行通知を送出すると
ともに自己システムを待機系へ移行させる稼働系移行手
段と備えている。
[0011] In the backup apparatus for a redundant system according to the first aspect, an abnormality detecting means for detecting an abnormality in the service with respect to the system designated as the active system, and the abnormality detected by the abnormality detecting means is self-contained. An abnormality type determination unit that determines whether the abnormality can be resolved or an unresolvable abnormality in the system, and an abnormality recovery unit that executes a predetermined abnormality recovery process when the abnormality type determination unit determines that the abnormality can be resolved, When the abnormality type determination stage determines that the abnormality cannot be resolved,
An operating system transfer unit that sends an operating system transfer notification to the standby system and transfers the own system to the standby system is provided.

【0012】また、請求項2の二重化システムのバック
アップ方法において、稼働系と指定されたシステムは、
業務の異常を検出し、この検出された異常が自己システ
ム内で解消不能な異常か解消可能な異常かを判定し、解
消可能な異常と判定したとき、所定の異常復旧処理を実
行し、解消不能な異常と判定したとき、待機系のシステ
ムに対して稼働系移行通知を送出するとともに自己シス
テムを待機系へ移行させるようにしている。
Further, in the backup method for a redundant system according to the second aspect, the system designated as the active system includes:
Detects a business abnormality and determines whether the detected abnormality is an irresolvable abnormality or a resolvable abnormality in its own system. When it is determined that the abnormality is not possible, an operating system shift notification is sent to the standby system and the own system is shifted to the standby system.

【0013】このように構成された二重化システムのバ
ックアップ装置及び二重化システムのバックアップ方法
においては、発生した異常が自己システム内で解消可能
な異常の場合は、システム切替を行わずに、自己システ
ム内で異常復旧処理が自動的に実施される。その結果、
システム切替発生頻度が低くなり、システム切替に起因
する二重化システム全体の停止時間が短縮される。な
お、異常復旧処理に要する時間は、当然、人間系が介在
するシステム切替所要時間より短い。
In the thus configured backup device for a redundant system and the backup method for a redundant system, if the generated error is an error that can be resolved in the own system, the system is not switched and the system is not switched. Error recovery processing is automatically performed. as a result,
The frequency of occurrence of system switching is reduced, and the downtime of the entire redundant system due to system switching is reduced. It should be noted that the time required for the abnormality recovery processing is naturally shorter than the time required for system switching involving a human system.

【0014】また、請求項3の二重化システムのバック
アップ方法において、稼働系と指定されたシステムは、
業務の異常を検出し、この検出された異常が該当業務の
局部的なソフトウェアの異常か、ソフトウェア全体の異
常か、局部的なハードウェアの異常か、自己システム内
で解消不能な異常か解消可能な異常かを判定する。
[0014] In the backup method of the redundant system according to the third aspect, the system designated as the active system includes:
Detects an error in the business and can resolve the detected error if it is a local software error for the relevant business, an entire software error, a local hardware error, or an error that cannot be resolved in its own system. Is determined to be abnormal.

【0015】次に、判定結果が局部的なソフトウェアの
異常のとき該当業務を再起動し、ソフトウェア全体の異
常のとき該当業務で使用するメモリ資源を初期化した
後、該当業務を再起動し、局部的なハードウェアの異常
のとき該当業務で使用するメモリ資源を初期化した後該
当業務を再起動し、再度同一異常が生じた場合、該当ハ
ードウェアを使用不可に初期設定して、再度該当業務を
起動する。
Next, when the determination result is a local software error, the relevant service is restarted. When the entire software is abnormal, the memory resources used by the relevant service are initialized, and then the relevant service is restarted. In the event of a local hardware error, initialize the memory resources used for the task, restart the task, and if the same error occurs again, initialize the hardware to unusable and apply again. Start the business.

【0016】そして、解消不能な異常のとき、待機系の
システムに対して稼働系移行通知を送出するとともに自
己システムを待機系へ移行させるようにしている。この
ような構成の二重化システムのバックアップ方法におい
ては、自己システム内で解消可能な異常を、局部的なソ
フトウェアの異常、ソフトウェア全体の異常、局部的な
ハードウェアの異常とに判別して、各異常の種別に対応
した最適な異常復旧処理を実施している。
In the event of an unresolvable abnormality, an operating system shift notification is sent to the standby system and the own system is shifted to the standby system. In the backup method of the redundant system having such a configuration, abnormalities that can be resolved in the self-system are determined as local software abnormalities, overall software abnormalities, and local hardware abnormalities. Optimum error recovery processing corresponding to the type of is performed.

【0017】したがって、最終的に自己システム内で解
消不能な異常の種別を減少でき、より一層異常に起因す
るシステム切替の発生確率を低減できる。請求項4の発
明は、一方が稼働系と指定され他方が待機系と指定され
た同一業務を実行可能な一対のシステムで構成された二
重化システムにおいて、稼働系に異常が生じると待機系
が稼働系へ移行するとともに異常が生じた稼働系が待機
系へ移行するための機械読取り可能なプログラムを記録
した記録媒体である。
Therefore, it is possible to reduce the types of abnormalities that cannot be eliminated in the self-system, and to further reduce the probability of system switching caused by the abnormalities. According to a fourth aspect of the present invention, in a duplex system configured with a pair of systems capable of executing the same task, one of which is designated as the active system and the other of which is designated as the standby system, the standby system is activated when an abnormality occurs in the active system. This is a recording medium that stores a machine-readable program for causing the operating system in which an abnormality has occurred to shift to the standby system while shifting to the standby system.

【0018】そして、このプログラムは、稼働系と指定
されたシステムに対して、業務の異常を検出させ、この
検出された異常が該当業務の局部的なソフトウェアの異
常か、ソフトウェア全体の異常か、局部的なハードウェ
アの異常か、自己システム内で解消不能な異常か解消可
能な異常かを判定させ、局部的なソフトウェアの異常の
とき、該当業務を再起動させ、ソフトウェア全体の異常
のとき、該当業務で使用するメモリ資源を初期化した
後、該当業務を再起動させ、局部的なハードウェアの異
常のとき、該当業務で使用するメモリ資源を初期化した
後該当業務を再起動し、再度同一異常が生じた場合、該
当ハードウェアを使用不可に初期設定して、再度該当業
務を再起動させ、解消不能な異常のとき、待機系のシス
テムに対して稼働系移行通知を送出するとともに自己シ
ステムを待機系へ移行させる。
The program causes a system designated as an active system to detect an abnormality in the business, and determines whether the detected abnormality is a local software abnormality of the business or an abnormality of the entire software. Determine whether the error is a local hardware error, an error that cannot be resolved in the own system, or an error that can be resolved.If a local software error occurs, restart the relevant task. After initializing the memory resources used by the relevant business, restart the relevant business.If there is a local hardware error, initialize the memory resources used by the relevant business, restart the relevant business, and then restart If the same error occurs, the relevant hardware is initialized to be unusable, the relevant service is restarted again, and if the error cannot be resolved, the standby system is Shifts the self-system to the standby system sends out a line notification.

【0019】このように構成されたプログラムを記録し
た記録媒体を用いることによって、上述した異常種別判
定機能や異常解消機能を有していない従来の二重化シス
テムに対しても、簡単に上述した機能を付加することが
できる。
By using a recording medium on which a program configured as described above is recorded, the above-described function can be easily provided even in a conventional duplex system having no abnormality type determining function and abnormality eliminating function. Can be added.

【0020】[0020]

【発明の実施の形態】以下、本発明の一実施形態を図面
を用いて説明する。図1は実施形態のバックアップ方法
が採用されたバックアップ装置が組込まれた二重化シス
テムの概略構成を示す模式図である。
DESCRIPTION OF THE PREFERRED EMBODIMENTS One embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a schematic diagram showing a schematic configuration of a duplex system in which a backup device adopting the backup method of the embodiment is incorporated.

【0021】この二重化システムは同一業務を実行過可
能なそれぞれコンピュータからなる一対のシステム1
a,1bと、この各システム1a,1bに対して共通に
接続された複数の操作端末2と、同じく各システム1
a,1bに対して共通に接続されたデータベース3とで
構成されている。
This duplex system is a pair of systems 1 each comprising a computer capable of executing the same business.
a, 1b, a plurality of operation terminals 2 commonly connected to the respective systems 1a, 1b,
a, 1b and a database 3 commonly connected to them.

【0022】この実施形態の二重化システムは例えば保
険会社や銀行等の金融システムに組込まれている。そし
て、各操作端末2が各支店や営業所の窓口に配設され、
係員が顧客と面談しながら、この操作端末2から各種情
報を入力したり、該当顧客の情報をデータベース3から
読出して表示出力する。データベース3内には、例えば
顧客毎の預金残高や契約内容が記憶保持されている。
The duplex system of this embodiment is incorporated in a financial system such as an insurance company or a bank. Then, each operation terminal 2 is arranged at the window of each branch or business office,
The clerk inputs various information from the operation terminal 2 while interviewing the customer, and reads out and displays the information of the customer from the database 3. The database 3 stores, for example, a deposit balance and contract contents for each customer.

【0023】各システム1a,1bは、各操作端末2か
らの操作指令に基づいて各種業務を実行する。この業務
には、当然データベース3に対するデータの読出、書込
み処理も含まれる。
Each of the systems 1a and 1b executes various tasks based on an operation command from each operation terminal 2. This operation naturally includes a process of reading and writing data to and from the database 3.

【0024】そして、一方のシステム1a(1b)が稼
働系と指定され、他方のシステム1b(1a)が待機系
と指定される。図2は同一構成の各システム1a,1b
の概略構成を示すブロック図である。システムバス4に
対して、各操作端末2から操作指令が入力されるととも
に各操作端末2へ処理結果を送出する入出力インタフェ
ース5、各種プログラムや演算に用いる係数や固定デー
タが記録された記録媒体としてのFD(フロッピーディ
スク)6が挿入されるFDD(フロッピーディスク・ド
ライブ)7、OSプログラムを記憶するプログラムメモ
リ8、各業務に対応した複数のアプリケーションプログ
ラム(AP)9を記憶するプログラムメモリ10、各業
務に共通するデータを記憶する共有メモリ7及び各業務
に対応する固有のデータを記憶する複数のローカルメモ
リ12が形成された主メモリ13等が接続されている。
Then, one system 1a (1b) is designated as the active system, and the other system 1b (1a) is designated as the standby system. FIG. 2 shows each system 1a, 1b having the same configuration.
FIG. 2 is a block diagram showing a schematic configuration of the embodiment. An input / output interface 5 that receives an operation command from each operation terminal 2 and sends a processing result to each operation terminal 2 to the system bus 4, a recording medium on which coefficients and fixed data used for various programs and calculations are recorded A floppy disk drive 7 into which an FD (floppy disk) 6 is inserted, a program memory 8 for storing an OS program, a program memory 10 for storing a plurality of application programs (AP) 9 corresponding to each task, A shared memory 7 for storing data common to each task, a main memory 13 having a plurality of local memories 12 for storing unique data corresponding to each task, and the like are connected.

【0025】さらに、前記システムバス4に対して、H
DD14、データベース3をアクセスするためのデータ
ベースインタフェース15、表示装置16、プリンタ1
7、他方のシステムに対して稼働系移動通知を送出する
ためのインタフェース18、各種処理を実行するCPU
19等が接続されている。
Further, the system bus 4
DD 14, database interface 15 for accessing database 3, display device 16, printer 1
7. Interface 18 for sending an active system movement notification to the other system, CPU for executing various processes
19 etc. are connected.

【0026】前記各プログラムメモリ8,10に記憶さ
れたOSプログラム及び各アプリケーションプログラム
9は、このシステム1a,1bが稼働する前に、FD6
から供給される。すなわち、このシステム1a,1bを
起動して、FDD7によって、FD6からOSプログラ
ムを読取ってプログラムメモリ8へ書込む。次にこのプ
ログラムメモリ8のOSプログラムを起動して、FD6
から各アプリケーションプログラム9を読取ってプログ
ラムメモリ10へ書込む。さらに、FD6から各業務に
必要な係数や固定データを読取って主メモリ13の各ロ
ーカルメモリ12へ書込む。
The OS program and the application programs 9 stored in the program memories 8 and 10 are stored in the FD 6 before the systems 1a and 1b operate.
Supplied from That is, the system 1a or 1b is started, and the OS program is read from the FD 6 by the FDD 7 and written into the program memory 8. Next, the OS program in the program memory 8 is started, and the FD 6
And reads each application program 9 and writes it to the program memory 10. Further, a coefficient and fixed data necessary for each task are read from the FD 6 and written into each local memory 12 of the main memory 13.

【0027】前記ブログラムメモリ10内に記憶された
各アプリケーションプログラム(AP)9が実行する各
教務とは、例えば、各操作端末2から入力された顧客を
指定した契約内容の照会の場合はデータベース3から該
当顧客の契約内容を読出して問合せ先の操作端末2へ送
信してこの操作端末2に表示出力させる。また、新規契
約の場合は操作入力された各顧客の契約内容をデータベ
ース3へ新規登録する。さらに、契約内容の変更の場合
はデータベース3に記憶された該当顧客の契約内容を変
更する。
Each educational task executed by each application program (AP) 9 stored in the program memory 10 is, for example, a database in the case of an inquiry of a contract designating a customer input from each operation terminal 2. 3 and reads out the contract contents of the customer concerned, transmits it to the operation terminal 2 of the inquiry destination, and causes this operation terminal 2 to display and output. In the case of a new contract, the contract contents of each customer input and operated are newly registered in the database 3. Further, in the case of a change in the contract contents, the contract contents of the corresponding customer stored in the database 3 are changed.

【0028】また、前記主メモリ13内には、上述した
共通メモリ11及び複数のローカルメモリ12の他に、
自己システムが現在稼働系に指定されているか待機系に
指定されているかを示す動作モードが記憶されている。
The main memory 13 includes, in addition to the common memory 11 and the plurality of local memories 12 described above,
An operation mode indicating whether the own system is currently designated as the active system or the standby system is stored.

【0029】このように構成された二重化システムにお
いて、一方のシステムを稼働系と指定し、他方を待機系
と指定して、この二重化システムを起動する。すると、
稼働系と指定されたシステム1a(1b)が稼働状態に
なる。そして、各操作端末2の操作指示に基づいて指定
された各種の業務のアプリケーションプログラム9が起
動して、所定の業務を実行する。
In the duplex system configured as described above, one of the systems is designated as the active system and the other is designated as the standby system, and the duplicate system is started. Then
The system 1a (1b) designated as the active system is activated. Then, the application program 9 for various tasks specified based on the operation instruction of each operation terminal 2 is activated to execute a predetermined task.

【0030】そして、稼働系のシステム1a(1b)の
CPU19は、プログラムメモリ8に記憶されたOSプ
ログラムに従って図3に示す実行中業務に対する監視制
御を実行する。すなわち、このOSプログラムは動作中
業務に異常が生じているか否かを常時監視しており、S
(ステップ)1において、実行中の業務に異常を検出す
ると、その異常の種別を判定する(S2)。
Then, the CPU 19 of the active system 1a (1b) performs monitoring control for the running task shown in FIG. 3 according to the OS program stored in the program memory 8. That is, the OS program constantly monitors whether or not an abnormality has occurred in the operation during operation.
In step (1), when an abnormality is detected in a running task, the type of the abnormality is determined (S2).

【0031】この異常を下記に示す(a)〜(d)の4
種類に判別する。 (a) 局所的なソフトウェアの異常 具体的には、該当アプリケーションプログラム9実行時
に、不適当な命令が実行さた場合や不適当なメモリアク
セスが発生した場合や主メモリ13における該当業務の
ローカルメモリ12の破壊等が相当する。すなわち、雑
音や実行環境によってプログラムの実行命令が一時的に
誤るという一過性のエラー発生に該当する。
This abnormality is shown in (a) to (d) below.
Determine the type. (A) Local software abnormality Specifically, when an inappropriate instruction is executed or an inappropriate memory access occurs when the application program 9 is executed, the local memory of the business in the main memory 13 is used. Twelve destructions and the like correspond. In other words, this corresponds to a temporary error occurrence in which a program execution instruction is temporarily erroneous due to noise or an execution environment.

【0032】この異常に対しては、ただ単に、再度該当
アプリケーションプログラム9をやり直すと、正常な命
令が実行され、前述した異常は解消される場合が多い。 (b) ソフトウェア全体の異常 具体的には、主メモリ13の共通メモリ11の容量不足
や共通メモリ11自体破壊や、それ以外の各種出力機器
の出力バッファの容量不足に相当する。この場合、共有
メモリ11に対する新規書込みやアクセス自体が不能に
なる。
To deal with this abnormality, simply re-executing the application program 9 again executes a normal instruction, and the abnormality described above is often resolved. (B) Abnormality of the entire software Specifically, this corresponds to insufficient capacity of the common memory 11 of the main memory 13, destruction of the common memory 11 itself, or insufficient capacity of the output buffers of various other output devices. In this case, new writing or access to the shared memory 11 becomes impossible.

【0033】この異常は、メモリ資源の不適当な使用領
域の割付に起因する場合が多いので、再度メモリに対す
る使用領域の割付をやり直す、すなわち、メモリの初期
化処理を実施して、再度該当アプリケーションプログラ
ム9をやり直すと、異常は解消される場合が多い。 (c) ハードウェアの一部異常・故障 主メモリ13に対するアクセス不良や、表示装置18,
プリンタ17,HDD14,FDD7等の周辺端末機の
一部不良等に相当する。
This abnormality is often caused by improper allocation of the used area of the memory resources. Therefore, the allocation of the used area to the memory is redone, that is, the memory is initialized and the corresponding application is executed again. When the program 9 is redone, the abnormality is often resolved. (C) Partial abnormality / failure of hardware Failure of access to the main memory 13, display device 18,
This corresponds to a partial failure of peripheral terminals such as the printer 17, the HDD 14, the FDD 7, and the like.

【0034】この異常は、とりあえず、主メモリ13に
対する前述した初期化処理を実行した後、該当アプリケ
ーションプログラム9を再起動する。そして、再び、同
様の異常・故障が発生した場合は、故障や異常を起こし
たメモリや各周辺端末を使用不可に初期設定して、再度
該当アプリケーションプログラム9をやり直すと、異常
は解消される場合が多い。 (e) その他のソフトウゥア異常やハードフェア異常 この場合、(c)の場合と同様に、主メモリ13に対す
る前述した初期化処理を実行した後、該当アプリケーシ
ョンプログラム9を再起動する。そして、再び、同様の
異常・故障が発生した場合は、該当アプリケーションプ
ログラム9での業務の実行を断念して、待機系のシステ
ムへ稼働系を切替える処理を実行する。
In the event of this abnormality, the application program 9 is restarted after executing the above-described initialization processing for the main memory 13 for the time being. If the same abnormality or failure occurs again, the memory or the peripheral terminal in which the failure or abnormality has occurred is initially set to be unusable, and the application program 9 is re-executed to resolve the abnormality. There are many. (E) Other software abnormalities and hardware abnormalities In this case, as in the case of (c), after executing the above-described initialization processing for the main memory 13, the corresponding application program 9 is restarted. Then, when a similar abnormality or failure occurs again, the execution of the task in the corresponding application program 9 is abandoned, and the process of switching the active system to the standby system is executed.

【0035】S3にて異常の種別が(a)に示す局所的
なソフトウェアの異常の場合、S4へ進み、動作中の該
当アプリケーションプログラム(AP)9の実行を停止
して、再度該当アプリケーションプログラム(AP)9
を起動する(S5)。
If the type of the abnormality is a local software abnormality shown in (a) in S3, the process proceeds to S4, where the execution of the corresponding application program (AP) 9 in operation is stopped, and the corresponding application program (AP) is again executed. AP) 9
Is started (S5).

【0036】S6にて、異常の種別が(b)に示すソフ
トウェア全体の異常の場合、S7へ進み、動作中の該当
アプリケーションプログラム(AP)9の実行を停止す
る。そして、主メモリ13の共通メモリ11を初期化し
た後(S8)、再度該当アプリケーションプログラム
(AP)9を起動する(S9)。
In S6, when the type of the abnormality is the abnormality of the entire software shown in (b), the process proceeds to S7, and the execution of the corresponding application program (AP) 9 in operation is stopped. Then, after initializing the common memory 11 of the main memory 13 (S8), the application program (AP) 9 is started again (S9).

【0037】S10にて、異常の種別が(c)に示すハ
ードウェアの一部異常・故障の場合、S11へ進み、該
当ハードウェアのハード異常フラグが1に設定されてい
ない場合は、該当ハードウェアの一部異常・故障は今回
が初めてであるので、S12へ進む。
In S10, if the type of abnormality is a partial abnormality or failure of the hardware shown in (c), the process proceeds to S11, and if the hardware abnormality flag of the hardware is not set to 1, the corresponding hardware Since this is the first time that the wear is partially abnormal or faulty, the process proceeds to S12.

【0038】S12において、動作中の該当アプリケー
ションプログラム(AP)9の実行を停止し、その後、
主メモリ13の共通メモリ11を初期化する。その後、
再度該当アプリケーションプログラム(AP)9を起動
する(S13)。そして、該当ハードウェアのハード異
常フラグを1に設定する(S14)。
In S12, the execution of the corresponding application program (AP) 9 in operation is stopped.
The common memory 11 of the main memory 13 is initialized. afterwards,
The application program (AP) 9 is started again (S13). Then, the hardware abnormality flag of the corresponding hardware is set to 1 (S14).

【0039】S11において、既に該当ハードウェアの
ハード異常フラグが1に設定されていた場合は、同一故
障・異常が再度発生したと判断する。そして、S15へ
進み、動作中の該当アプリケーションプログラム(A
P)9の実行を停止し、該当ハードウェアの使用禁止を
初期設定する。その後、再度該当アプリケーションプロ
グラム(AP)9を起動する(S16)。そして、該当
ハードウェアのハード異常フラグを0に解除する(S1
7)。
In S11, if the hardware abnormality flag of the corresponding hardware has already been set to 1, it is determined that the same failure / abnormality has occurred again. Then, the process proceeds to S15, in which the corresponding application program (A
P) Execution of 9 is stopped, and use inhibition of the corresponding hardware is initialized. Thereafter, the application program (AP) 9 is started again (S16). Then, the hardware abnormality flag of the hardware is reset to 0 (S1).
7).

【0040】図4のS18にて、異常の種別が(d)に
示すその他のソフトウゥア異常やハードフェア異常の場
合、S19へ進み、システム異常フラグが1に設定され
ていない場合は、自己システムで解消不能の異常が今回
初めて発生したと判断してS20へ進む。
In S18 of FIG. 4, if the type of abnormality is another software abnormality or hardware abnormality shown in (d), the process proceeds to S19, and if the system abnormality flag is not set to 1, the own system operates. It is determined that an unresolvable abnormality has occurred for the first time, and the process proceeds to S20.

【0041】S20において、動作中の該当アプリケー
ションプログラム(AP)9の実行を停止し、その後、
再度該当アプリケーションプログラム(AP)9を起動
する(S21)。そして、システム異常フラグを1に設
定する(S22)。
In S20, the execution of the corresponding application program (AP) 9 in operation is stopped.
The application program (AP) 9 is started again (S21). Then, the system abnormality flag is set to 1 (S22).

【0042】S19にて、システム異常フラグが既に1
に設定されていた場合は、自己システムで解消不能の異
常が2回連続して発生したと判断して、S23へ進み、
動作中の該当アプリケーションプログラム(AP)9の
実行を停止する。そして、システム異常フラグを0に解
除する(S24)。
At S19, the system abnormality flag is already 1
If it is set to, it is determined that an unresolvable abnormality has occurred twice consecutively in its own system, and the process proceeds to S23,
The execution of the corresponding application program (AP) 9 in operation is stopped. Then, the system abnormality flag is reset to 0 (S24).

【0043】そして、インタフェース18を介して、待
機系のシステム1b(1a)に対して稼働系移行通知を
送出する(S25)。そして、自己の動作モードを待機
系モードに設定し(S26)、所定のシステム停止処理
を実行する(S27)。そして、システムの電源が遮断
されるのを待つ。
Then, an active system transfer notification is sent to the standby system 1b (1a) via the interface 18 (S25). Then, its own operation mode is set to the standby system mode (S26), and a predetermined system stop process is executed (S27). Then, it waits until the power supply of the system is cut off.

【0044】このように構成された二重化システムのバ
ックアップ方法を採用されたバックアップ装置において
は、稼働系と指定されたシステム1(1b)において、
指定された業務のアプリケーションプログラム9を実行
している過程で発生した異常が自己システム1a(1
b)内で解消可能な異常の場合は、図3,図4の流れ図
に示すように、稼働系のシステム切替を行わずに、自己
システム内で異常復旧処理が自動的に実施される。
In the backup apparatus adopting the redundant system backup method configured as described above, in the system 1 (1b) designated as the active system,
An abnormality that occurs during the execution of the application program 9 for the designated business is determined by the self system 1a (1
In the case of an abnormality that can be resolved in b), as shown in the flowcharts of FIGS. 3 and 4, the abnormality recovery processing is automatically performed in the own system without switching the active system.

【0045】その結果、システム1a,1b相互間にお
けるシステム切替発生頻度が低くなり、システム切替に
起因する二重化システム全体における業務の停止時間が
短縮される。
As a result, the frequency of occurrence of system switching between the systems 1a and 1b is reduced, and the downtime of business operations in the entire redundant system due to system switching is reduced.

【0046】なお、OSプログラムにおける自己システ
ム1a(1b)内での該当アプリケーションプログラム
9の再起動やメモリの初期化処理や異常ハードフェアの
使用禁止初期設定処理等の異常復旧処理に要する時間
は、当然、人間系が介在するシステム切替所要時間より
短い。
The time required for the error recovery processing such as the restart of the corresponding application program 9 in the self-system 1a (1b), the memory initialization processing, and the abnormal hardware use prohibition initial setting processing in the OS program is as follows. Naturally, it is shorter than the time required for system switching that involves a human system.

【0047】さらに、実施形態においては、自己システ
ム内で解消可能な異常を、(a)局部的なソフトウェア
の異常、(b)ソフトウェア全体の異常、(c)局部的
なハードウェアの異常とに判別して、各異常の種別に対
応した前述した最適な異常復旧処理を実施している。
Further, in the embodiment, abnormalities that can be resolved in the own system are defined as (a) a local software abnormality, (b) an overall software abnormality, and (c) a local hardware abnormality. By making a determination, the above-described optimal abnormality recovery processing corresponding to each abnormality type is performed.

【0048】したがって、最終的に自己システム内で解
消不能な異常の種別を減少でき、より一層異常に起因す
るシステム切替の発生確率を低減できる。なお、実施形
態においては、保険や銀行等で使用される二重化システ
ムに適用したが、大規模工場における製造プラント、交
通機関における列車監視制御システム、流通業界におけ
るPOSシステム等に適用できる。
Therefore, the types of abnormalities that cannot be eliminated in the own system can be reduced finally, and the probability of system switching caused by the abnormalities can be further reduced. In the embodiment, the present invention is applied to a duplex system used in insurance, a bank, and the like, but can be applied to a manufacturing plant in a large-scale factory, a train monitoring control system in transportation, a POS system in the distribution industry, and the like.

【0049】なお、上述した実施形態においては、プロ
グラムを記録した記録媒体としてFD(フロッピーディ
スク)6を採用したが、このFD6に限定されるもので
はなく、例えば、ハードディスク、光ティスク(CD−
ROM,DVD等)、半導体メモリ等の記録媒体に書込
んで、各システム1a,1bに適用したり、また、通信
媒体によって伝送して各システム1a,1bに運用する
ことも可能である。
In the above-described embodiment, the FD (floppy disk) 6 is adopted as the recording medium on which the program is recorded. However, the present invention is not limited to this FD 6, and for example, a hard disk, an optical disk (CD-
ROM, DVD, etc.), a semiconductor memory, or the like, and can be applied to each system 1a, 1b, or transmitted by a communication medium and operated in each system 1a, 1b.

【0050】[0050]

【発明の効果】以上説明したように本発明の二重化シス
テムのバックアップ装置及びバックアップ方法において
は、稼働系と指定されたシステムで発生した簡単な異常
は自己システム内で解消するようにしている。
As described above, in the backup apparatus and the backup method of the redundant system according to the present invention, a simple abnormality occurring in the system designated as the active system is eliminated in the own system.

【0051】したがって、異常発生に起因して、稼働系
のシステム切替の発生頻度を極力抑制し、システム切替
に起因する二重化システム全体の停止時間の発生を極力
抑制し、二重化システム全体の業務処理能率を向上でき
る。
Therefore, the frequency of system switching of the operating system due to the occurrence of an abnormality is suppressed as much as possible, the occurrence of downtime of the entire redundant system due to the system switching is minimized, and the business processing efficiency of the entire redundant system is reduced. Can be improved.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 本発明の一実施形態に係るバックアップ方法
を採用したバックアップ装置が熊込まれた二重化システ
ムの概略構成図
FIG. 1 is a schematic configuration diagram of a duplex system in which a backup device adopting a backup method according to an embodiment of the present invention is embedded.

【図2】 同二重化システムにおける各システムの概略
構成を示すブロック図
FIG. 2 is a block diagram showing a schematic configuration of each system in the duplex system;

【図3】 稼働系と指定されたシステムの監視制御動作
を示す流れ図
FIG. 3 is a flowchart showing a monitoring control operation of a system designated as an active system;

【図4】 同じく稼働系と指定されたシステムの監視制
御動作を示す流れ図
FIG. 4 is a flowchart showing the monitoring control operation of a system also designated as an active system.

【符号の説明】[Explanation of symbols]

1a,1b…システム 2…操作端末 3…データベース 6…FD 7…FDD 8,10…プログラムメモリ 13…主メモリ 14…HDD 19…CPU 1a, 1b System 2 Operation terminal 3 Database 6 FD 7 FDD 8, 10 Program memory 13 Main memory 14 HDD 19 CPU

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 一方が稼働系と指定され他方が待機系と
指定された同一業務を実行可能な一対のシステムで構成
され、稼働系に異常が生じると待機系が稼働系へ移行す
るとともに異常が生じた稼働系が待機系へ移行する二重
化システムのバックアップ装置において、 稼働系と指定されたシステムは、 前記業務の異常を検出する異常検出手段と、 この異常検出手段で検出された異常が自己システム内で
解消可能な異常か解消不能な異常かを判定する異常種別
判定手段と、 この異常種別判定手段が解消可能な異常と判定したと
き、所定の異常復旧処理を実行する異常復旧手段と、 前記異常種別判定段が解消不能な異常と判定したとき、
待機系のシステムに対して稼働系移行通知を送出すると
ともに自己システムを待機系へ移行させる稼働系移行手
段とを備えた二重化システムのバックアップ装置。
1. A system comprising a pair of systems capable of executing the same business, one of which is designated as an active system and the other of which is designated as a standby system. In the backup device of the redundant system in which the active system in which the error occurs is shifted to the standby system, the system designated as the active system is provided with an abnormality detecting means for detecting the abnormality in the business, and an abnormality detected by the abnormality detecting means. An abnormality type determining unit that determines whether the abnormality can be resolved in the system or an unresolvable abnormality, and an abnormality recovery unit that executes a predetermined abnormality recovery process when the abnormality type determination unit determines that the abnormality can be resolved, When the abnormality type determination stage determines that the abnormality cannot be resolved,
A backup system for a duplex system, comprising: an active system transfer unit that sends an active system transfer notification to a standby system and transfers the own system to a standby system.
【請求項2】 一方が稼働系と指定され他方が待機系と
指定された同一業務を実行可能な一対のシステムで構成
され、稼働系に異常が生じると待機系が稼働系へ移行す
るとともに異常が生じた稼働系が待機系へ移行する二重
化システムのバックアップ方法において、 稼働系と指定されたシステムは、 前記業務の異常を検出し、 この検出された異常が自己システム内で解消不能な異常
か解消可能な異常かを判定し、 解消可能な異常と判定したとき、所定の異常復旧処理を
実行し、 解消不能な異常と判定したとき、待機系のシステムに対
して稼働系移行通知を送出するとともに自己システムを
待機系へ移行させる二重化システムのバックアップ方
法。
2. A system comprising a pair of systems capable of executing the same business, one of which is designated as the active system and the other of which is designated as the standby system. In the backup method for a redundant system in which the active system that has occurred is shifted to the standby system, the system designated as the active system detects the abnormality in the business, and determines whether the detected abnormality is an error that cannot be resolved in its own system. Judgment is made as to whether the error can be resolved, and when it is determined that the error can be resolved, a predetermined error recovery process is executed. When it is determined that the error cannot be resolved, an operating system transition notification is sent to the standby system. A backup method for a redundant system that shifts its own system to a standby system.
【請求項3】 一方が稼働系と指定され他方が待機系と
指定された同一業務を実行可能な一対のシステムで構成
され、稼働系に異常が生じると待機系が稼働系へ移行す
るとともに異常が生じた稼働系が待機系へ移行する二重
化システムのバックアップ方法において、 稼働系と指定されたシステムは、 前記業務の異常を検出し、 この検出された異常が該当業務の局部的なソフトウェア
の異常か、ソフトウェア全体の異常か、局部的なハード
ウェアの異常か、自己システム内で解消不能な異常か解
消可能な異常かを判定し、 局部的なソフトウェアの異常のとき、該当業務を再起動
し、 ソフトウェア全体の異常のとき、該当業務で使用するメ
モリ資源を初期化した後、該当業務を再起動し、 局部的なハードウェアの異常のとき、該当業務で使用す
るメモリ資源を初期化した後該当業務を再起動し、再度
同一異常が生じた場合、該当ハードウェアを使用不可に
初期設定して、再度該当業務を起動し、 解消不能な異常のとき、待機系のシステムに対して稼働
系移行通知を送出するとともに自己システムを待機系へ
移行させる二重化システムのバックアップ方法。
3. A system comprising a pair of systems capable of executing the same business, one of which is designated as an active system and the other of which is designated as a standby system. In the backup method for a redundant system in which the active system that has failed is transferred to the standby system, the system designated as the active system detects the abnormality of the business, and the detected abnormality detects the local software abnormality of the relevant business. The software, the entire software, a local hardware error, an error that cannot be resolved in the own system, or a resolvable error. In the event of an error in the entire software, initialize the memory resources used in the application, restart the application, and in the event of a local hardware error, use the application in the application. If the same error occurs again after initializing the memory resources to be used, if the same error occurs again, the relevant hardware is initialized to be unusable, the relevant job is started again, and if the error cannot be resolved, the system waits. A backup method for a redundant system in which an active system transfer notification is sent to a system and a self system is transferred to a standby system.
【請求項4】 一方が稼働系と指定され他方が待機系と
指定された同一業務を実行可能な一対のシステムで構成
された二重化システムにおいて、稼働系に異常が生じる
と待機系が稼働系へ移行するとともに異常が生じた稼働
系が待機系へ移行するための機械読取り可能なプログラ
ムを記録した記録媒体であって、 前記プログラムは、稼働系と指定されたシステムに対し
て、 前記業務の異常を検出させ、 この検出された異常が該当業務の局部的なソフトウェア
の異常か、ソフトウェア全体の異常か、局部的なハード
ウェアの異常か、自己システム内で解消不能な異常か解
消可能な異常かを判定させ、 局部的なソフトウェアの異常のとき、該当業務を再起動
させ、 ソフトウェア全体の異常のとき、該当業務で使用するメ
モリ資源を初期化した後、該当業務を再起動させ、 局部的なハードウェアの異常のとき、該当業務で使用す
るメモリ資源を初期化した後該当業務を再起動し、再度
同一異常が生じた場合、該当ハードウェアを使用不可に
初期設定して、再度該当業務を起動させ、 解消不能な異常のとき、待機系のシステムに対して稼働
系移行通知を送出するとともに自己システムを待機系へ
移行させることを特徴とするプログラムを記録した記録
媒体。
4. In a duplex system composed of a pair of systems capable of executing the same job, one of which is designated as the active system and the other of which is designated as the standby system, if an abnormality occurs in the active system, the standby system is switched to the active system. A recording medium that stores a machine-readable program for causing an active system to transition to a standby system while transitioning to a standby system, the program comprising: Is detected, whether the detected error is a local software error of the relevant business, an entire software error, a local hardware error, an error that cannot be resolved in the own system, or an error that can be resolved. After a local software error, restart the application, and in the case of a software error, initialize the memory resources used by the application. Restart the application, and in the event of a local hardware error, initialize the memory resources used by the application, restart the application, and if the same error occurs again, disable the hardware. The program is characterized by sending an active system transition notification to the standby system and transitioning its own system to the standby system in the event of an unresolvable abnormality. The recording medium on which it was recorded.
JP9000263A 1997-01-06 1997-01-06 Backup device/method for duplex system Withdrawn JPH10198574A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9000263A JPH10198574A (en) 1997-01-06 1997-01-06 Backup device/method for duplex system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9000263A JPH10198574A (en) 1997-01-06 1997-01-06 Backup device/method for duplex system

Publications (1)

Publication Number Publication Date
JPH10198574A true JPH10198574A (en) 1998-07-31

Family

ID=11469034

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9000263A Withdrawn JPH10198574A (en) 1997-01-06 1997-01-06 Backup device/method for duplex system

Country Status (1)

Country Link
JP (1) JPH10198574A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001237834A (en) * 2000-02-25 2001-08-31 Nippon Telegr & Teleph Corp <Ntt> Service management function configuration method for intelligent network
US7412621B2 (en) 2001-12-24 2008-08-12 Lg-Nortel Co., Ltd Processor duplexing apparatus based on RTOS in mobile communication system and method thereof
JP2009217358A (en) * 2008-03-07 2009-09-24 Mitsubishi Electric Corp Duplex programmable controller

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001237834A (en) * 2000-02-25 2001-08-31 Nippon Telegr & Teleph Corp <Ntt> Service management function configuration method for intelligent network
US7412621B2 (en) 2001-12-24 2008-08-12 Lg-Nortel Co., Ltd Processor duplexing apparatus based on RTOS in mobile communication system and method thereof
JP2009217358A (en) * 2008-03-07 2009-09-24 Mitsubishi Electric Corp Duplex programmable controller

Similar Documents

Publication Publication Date Title
US10853206B1 (en) Systems and methods for enabling failover support with multiple backup data storage structures
JPH11338648A (en) Disk array device, its error control method, and recording medium where control program thereof is recorded
US7751310B2 (en) Fault tolerant duplex computer system and its control method
JP2004303122A (en) Data transfer control system
US7587626B2 (en) Intelligent hotspare or “SmartSpare” drive with pre-emptive drive rebuild
JP5366184B2 (en) Data storage system and data storage method
JP5104479B2 (en) Information processing device
JPH10198574A (en) Backup device/method for duplex system
JP2007249652A (en) Data mirror type cluster system and its operation method
JP2009104369A (en) Disk sub-system
US7779293B2 (en) Technology to control input/output device bridges
JP2009230484A (en) Storage subsystem, storage system, firmware replacing method, and program
JPH07121315A (en) Disk array
JP2001154896A (en) Computer and method for updating file
JP5359234B2 (en) Job execution system and job flow takeover control program
JPH10133926A (en) Mirror disk restoring method and restoring system
JP3448197B2 (en) Information processing device
US6687852B1 (en) Ultra reliable disk memory for duplex processor platforms
JP4165423B2 (en) System board with core I / O card
JP3512627B2 (en) Load Volume I / O Control and Management Method by Alternative Path and Duplication in IPL
JP4876662B2 (en) Computer system having memory dump function, program, and memory dump method
JPH08179994A (en) Computer system
JP2000089994A (en) Method and device for managing data base
JPS59180897A (en) Double structure system of battery back-up memory
JPWO2007116467A1 (en) Volume management apparatus and volume management method

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20040406