JP2772068B2 - Data assurance processing method for inherited information - Google Patents
Data assurance processing method for inherited informationInfo
- Publication number
- JP2772068B2 JP2772068B2 JP1266425A JP26642589A JP2772068B2 JP 2772068 B2 JP2772068 B2 JP 2772068B2 JP 1266425 A JP1266425 A JP 1266425A JP 26642589 A JP26642589 A JP 26642589A JP 2772068 B2 JP2772068 B2 JP 2772068B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- area
- version
- new version
- current version
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Hardware Redundancy (AREA)
Description
【発明の詳細な説明】 〔概要〕 不揮発性共用メモリに設定された情報を,現用プロセ
スから待機プロセスへ引き継ぐことにより,現用プロセ
スの障害時に,待機プロセスが現用プロセスに代わり,
業務を継続して運用する計算機システムにおけるフォー
ルトトレラント化のための引き継ぎ情報のデータ保証処
理方法に関し, フォールトトレラント化のための動作環境の事前構築
を,効率よく,確実に行うことができるようにすること
を目的とし, 引き継ぎ情報が設定される不揮発性共用メモリの領域
を,現版と新版の二重構造とし,現版と新版のそれぞれ
に基情報域と差分域とを設け,現用プロセスは,現版に
書き込みを行い,待機プロセスは,新版から読み出しを
行い,現用プロセスは,所定時間の経過または所定量の
情報の蓄積により,現版の基情報域の内容を,新版の基
情報域に複写するとともに,現版と新版とを切り換え,
それを通知するように構成する。DETAILED DESCRIPTION OF THE INVENTION [Overview] By transferring the information set in the nonvolatile shared memory from the active process to the standby process, when the active process fails, the standby process replaces the active process.
A method for data assurance processing of handover information for fault-tolerant operation in a computer system that continues to operate in a business system, enabling efficient and reliable pre-construction of an operating environment for fault-tolerant operation For this purpose, the area of the non-volatile shared memory in which the handover information is set has a dual structure of the current version and the new version, and a base information area and a difference area are provided for each of the current version and the new version. The current process writes to the current version, the standby process reads from the new version, and the current process transfers the contents of the current version's basic information area to the new version's basic information area after the lapse of a predetermined time or the accumulation of a predetermined amount of information. Copy and switch between the current version and the new version,
It is configured to notify it.
本発明は,不揮発性共用メモリに設定された情報を,
現用プロセスから待機プロセスへ引き継ぐことにより,
現用プロセスの障害時に,待機プロセスが現用プロセス
に代わり,業務を継続して運用する計算機システムにお
けるフォールトトレラント化のための引き継ぎ情報のデ
ータ保証処理方法に関する。According to the present invention, the information set in the nonvolatile shared memory is
By taking over from the active process to the standby process,
The present invention relates to a data assurance processing method of takeover information for making a fault-tolerant computer system in which a standby process replaces an active process and continues to operate when a failure occurs in an active process.
計算機システムにおいて,フォールトトレラント化を
実現するためには,制御プロセスを二重化する方式が有
効である。1つは,通常運用のため動作する制御プロセ
スであり,もう1つは,通常運用の制御プロセスが何ら
かの障害で停止した場合に,業務を継続して運用するた
めに待機している制御プロセスである。In a computer system, a method of duplicating a control process is effective in realizing fault tolerance. One is a control process that operates for normal operation, and the other is a control process that is on standby to continue operations when the normal operation control process is stopped due to some failure. is there.
前者の制御プロセスを,現用プロセスといい,後者の
制御プロセスを,待機プロセスという。The former control process is called an active process, and the latter control process is called a standby process.
障害により,現用プロセスから待機プロセスへ処理主
体を切り換える場合には,各種の資源情報の引き継ぎが
必要である。この資源情報の引き継ぎを高速に,かつ確
実に行う手段が必要とされている。When switching the processing subject from the active process to the standby process due to a failure, it is necessary to take over various types of resource information. There is a need for a means for quickly and reliably transferring the resource information.
第5図は従来技術の例を示す。 FIG. 5 shows an example of the prior art.
第5図において,現用プロセス10が障害により停止し
た場合に,待機プロセス11が,現用プロセス10に代わっ
て,業務を継続するためには,現用プロセス10が扱って
いる動的に変化する動作環境を,待機プロセス11が引き
継ぐ必要がある。In FIG. 5, when the active process 10 is stopped due to a failure, the standby process 11 takes the place of the active process 10 to continue the business. Must be taken over by the standby process 11.
その動作環境を引き継ぐための情報を,現用プロセス
10のクラッシュ時に,すべて一括して引き継ぐようにす
ると,その引き継ぎ情報による動作環境の設定に時間が
かかるため,現用プロセス10から待機プロセス11への切
り換え性能が悪くなる。Information for inheriting the operating environment is transferred to the current process
If all 10 are taken over in the event of a crash, it takes a long time to set the operating environment based on the inherited information, and the performance of switching from the active process 10 to the standby process 11 deteriorates.
そこで,現用プロセス10の運用時に,第5図に示すよ
うに,逐次に動作環境等の資源情報を引き継ぐ方法が考
えられている。Therefore, a method of sequentially taking over resource information such as an operation environment when the active process 10 is operated has been considered as shown in FIG.
例えば,通信制御プログラムなどをホットスタンバイ
させるために,待機プロセス11において,事前にネット
ワーク資源を制御するための動作環境を構築する場合,
現用プロセス10が,変更のあった動作環境の情報を,不
揮発性共用メモリ12に書き込み,ある周期で,または変
更情報量が所定量になったときに,待機プロセス11に通
知する方式を採用した場合,次の要件を満たす必要があ
る。For example, when an operation environment for controlling network resources in advance in the standby process 11 for hot standby of a communication control program, etc.
The active process 10 writes the changed operating environment information to the non-volatile shared memory 12 and notifies the standby process 11 at a certain cycle or when the amount of changed information reaches a predetermined amount. Must meet the following requirements:
(1) 現用プロセス10における運用に対し,性能面
(処理ステップ)の支障がないこと。すなわち,待機プ
ロセス11において間欠的に行う動作環境の事前構築によ
り,現用プロセス10の処理に影響がないこと。(1) There is no problem in performance (processing steps) for operation in the active process 10. That is, there is no effect on the processing of the active process 10 due to the preliminary construction of the operating environment that is performed intermittently in the standby process 11.
(2) 現用プロセス10および待機プロセス11から時間
断面で見たデータの一意性が保証されること。(2) Uniqueness of data viewed from the current process 10 and the standby process 11 in a time section is guaranteed.
しかしながら,従来考えられている方法では,不揮発
性共用メモリ12の領域を,単に1つの構造として使用す
るため,上記2つの要件を同時に満たすことはできなか
った。すなわち,現用プロセス10が書き込んでいるとき
に,その箇所を,同時に待機プロセス11が読み出すと,
データの完結性が保証されないことがある。そのため,
ロック制御などにより,排他制御を行うと,現用プロセ
ス10の処理が待たされることがあり,通常の運用時で
も,レスポンス等が遅くなるという問題があった。However, in the conventional method, since the area of the nonvolatile shared memory 12 is simply used as one structure, the above two requirements cannot be satisfied at the same time. In other words, when the active process 10 is writing, and the standby process 11 simultaneously reads that location,
Data integrity may not be guaranteed. for that reason,
If exclusive control is performed by lock control or the like, the processing of the active process 10 may be delayed, and there is a problem that response and the like become slow even during normal operation.
本発明は上記問題点の解決を図り,フォールトトレラ
ント化のための動作環境の事前構築を,効率よく,確実
に行うことができるようにすることを目的としている。SUMMARY OF THE INVENTION It is an object of the present invention to solve the above-mentioned problems and to efficiently and surely pre-construct an operation environment for fault-tolerant operation.
第1図は本発明の原理説明図である。 FIG. 1 is a diagram illustrating the principle of the present invention.
第1図において,10は通常運用のために動作する現用
プロセス,11は現用プロセス10の障害時に業務を継続し
て運用するために待機している待機プロセス,12は不揮
発性共用メモリ,13A,13Bはそれぞれ現版,新版と呼ばれ
る引き継ぎ情報の格納のための領域,14A,14Bは差分域,1
5A,15Bは基情報域,16は不揮発性共用メモリ管理プロセ
スを表す。In FIG. 1, reference numeral 10 denotes an active process that operates for normal operation, 11 denotes a standby process that stands by to continue operation when the active process 10 fails, 12 denotes a non-volatile shared memory, 13A, 13B is an area for storing takeover information called current version and new version, respectively, 14A and 14B are difference areas, 1
5A and 15B denote a basic information area, and 16 denotes a nonvolatile shared memory management process.
不揮発性共用メモリ12は,現用プロセス10または待機
プロセス11のプログラムが停止しても,記憶内容が保証
される記憶装置である。例えば,別系統の電源が付いた
半導体記憶装置などにより構成される。The nonvolatile shared memory 12 is a storage device whose storage contents are guaranteed even when the program of the active process 10 or the standby process 11 is stopped. For example, it is configured by a semiconductor memory device with a separate power supply.
現用プロセス10が障害になったときに,待機プロセス
11が,その処理を代行することができるように,現用プ
ロセス10の動作環境などの資源引き継ぎ情報を,不揮発
性共用メモリ12に逐次設定し,待機プロセス11は,その
情報をもとに,動作環境の事前生成を行う。The standby process when the active process 10 fails
The resource transfer information such as the operating environment of the active process 10 is sequentially set in the nonvolatile shared memory 12 so that the standby process 11 can perform the processing on behalf of the active process 10. The standby process 11 operates based on the information. Create an environment in advance.
本発明では,この引き継ぎ情報が設定される不揮発性
共用メモリ12の領域を,現版13Aと新版13Bの二重構造と
している。In the present invention, the area of the nonvolatile shared memory 12 in which the handover information is set has a double structure of the current version 13A and the new version 13B.
現版13A,新版13Bには,それぞれ現用プロセス10から
待機プロセス11へ伝達すべき情報が格納される基情報域
15A,15Bと,変更分の情報を示す情報が格納される差分
域14A,14Bとを設ける。The current version 13A and the new version 13B contain basic information areas that store information to be transmitted from the active process 10 to the standby process 11, respectively.
15A and 15B, and difference areas 14A and 14B in which information indicating the information of the change is stored.
現用プロセス10は,動作環境などの引き継ぎ情報が発
生した場合,処理P1により,現版13Aの基情報域15Aの内
容を更新するとともに,その基情報域15Aにおけるどの
情報が変更されたかを示す情報を差分域14Aに設定す
る。When handover information such as the operating environment is generated, the active process 10 updates the contents of the basic information area 15A of the current version 13A by processing P1 and indicates which information in the basic information area 15A has been changed. Is set in the difference area 14A.
そして,ある時間の経過または変更量がある量以上に
なったときに,処理P2により,基情報域15Aの内容を基
情報域15Bに複写する。その後,現版13Aを新版に,新版
13Bを現版に切り換える処理を,不揮発性共用メモリ管
理プロセス16に依頼する。Then, when a certain time has elapsed or the amount of change has exceeded a certain amount, the contents of the basic information area 15A are copied to the basic information area 15B by the process P2. After that, the current version 13A becomes the new version and the new version
The non-volatile shared memory management process 16 is requested to switch the 13B to the current version.
次に,処理P3により,待機プロセス11に対し,引き継
ぎ情報の反映の依頼を意味する間欠同期通知を行う。Next, in process P3, an intermittent synchronization notification is sent to the standby process 11, which means a request to reflect the takeover information.
一方,待機プロセス11では,現用プロセス10が現版13
Aに書き込みを行っている間,新版13Bからの読み出しを
行い,待機プロセス11内に反映して,動作環境の事前生
成を行う。On the other hand, in the standby process 11, the current process 10
While writing to A, the reading from the new version 13B is performed, and the operating environment is pre-generated by reflecting it in the standby process 11.
なお,現用プロセス10が,現版13Aに書き込みを行っ
ている間に,待機プロセス11において新版13Bからの動
作環境の事前生成が完了するように,間欠同期処理の起
動要因である時間間隔値および情報の変更量を,システ
ム設計時に決定しておく。In addition, while the active process 10 is writing to the current version 13A, the standby process 11 completes the pre-generation of the operating environment from the new version 13B, so that the time interval value and The amount of information change is determined at the time of system design.
現用プロセス10から,間欠同期通知があると,新たな
引き継ぎ情報が通知されたため,待機プロセス11は,不
揮発性共用メモリ管理プロセス16に問い合わせることに
より,もと現版13Aが現新版であることを判断して,そ
の新版の領域を,新たな引き継ぎ情報の読み出し対象と
する。If there is an intermittent synchronization notification from the active process 10, new takeover information is notified. The standby process 11 queries the nonvolatile shared memory management process 16 to confirm that the current version 13A is the current new version. Judgment is made, and the area of the new version is set as a reading target of new takeover information.
不揮発性共用メモリ12の領域を,従来技術のように,
単に1つの構造として,現用プロセス10から待機プロセ
ス11への間欠的な情報の引き継ぎを行った場合,待機プ
ロセス11が読み出しを行っている間は,現用プロセス10
の処理が待たされるので,業務上の支障をもたらす。The area of the non-volatile shared memory 12 is changed as in the prior art.
As a simple structure, when intermittent information is transferred from the active process 10 to the standby process 11, while the standby process 11 is reading, the active process 10
Process is awaited, causing a problem in business.
本発明では,不揮発性共用メモリ12における引き継ぎ
用の領域を,現版13Aと新版13Bとに分け,この二重構造
域をサイクリックにスイッチして使用するので,現用プ
ロセス10の性能上の支障がなくなる。In the present invention, the takeover area in the nonvolatile shared memory 12 is divided into the current version 13A and the new version 13B, and this dual structure area is cyclically switched for use. Disappears.
また,単に現版と新版とを,切り換えたのでは,待機
プロセス11において,新版13Bからの読み出しを完了し
ていないときに,強制的に切り換えが実行される可能性
もある。この場合,まだ読み出していない部分につい
て,待機プロセス11側への反映が行われないことにな
る。ごく稀なケースと考えられるが,もし起きた場合に
は,正常な処理の続行ができなくなる。Further, if the current version and the new version are simply switched, there is a possibility that the standby process 11 may forcibly perform the switching when the reading from the new version 13B is not completed. In this case, the part that has not been read out is not reflected on the standby process 11 side. Although it is considered a rare case, if it happens, normal processing cannot be continued.
そこで,本発明では,特に,間欠同期処理が正常なサ
イクルで実施されているかどうか,待機プロセス11で判
断できるよう,間欠同期通知内に,現用プロセス10がシ
ーケンス番号(通知ごとに1ずつ加算)を付加する。Therefore, in the present invention, in particular, the active process 10 includes a sequence number (1 is added for each notification) in the intermittent synchronization notification so that the standby process 11 can determine whether or not the intermittent synchronization process is performed in a normal cycle. Is added.
これにより,待機プロセス11側で,間欠同期処理がシ
ーケンシャルでないときには,変更部分の引き継ぎ(差
分域)情報のみでは,正確な引き継ぎが実施できないと
判断し,基情報域からの引き継ぎ処理を実施する。な
お,基情報域は,常に引き継ぎ情報をすべて保持するよ
う,現版と新版との切り換えにあたって,基情報域15A
の情報を,次に新たに現版となる新版13Bの基情報域15B
に複写している。As a result, when the intermittent synchronization process is not sequential, the standby process 11 determines that accurate handover cannot be performed only with the handover (difference area) information of the changed portion, and executes the handover process from the base information area. When switching between the current version and the new version, the basic information area 15A should be used so that all inherited information is always retained.
Information in the base information area 15B of the new version 13B
It is copied to.
第2図は本発明の適用システムの例,第3図は本発明
の一実施例に係る不揮発性共用メモリ域のデータ構造,
第4図は本発明の一実施例による処理の例を示す。FIG. 2 is an example of an application system of the present invention, FIG. 3 is a data structure of a nonvolatile shared memory area according to an embodiment of the present invention,
FIG. 4 shows an example of processing according to an embodiment of the present invention.
本発明は,例えば第2図に示すような複合システムに
適用することができる。第2図において,第1図と同符
号のものは第1図に示すものに対応し,20−1,20−2は
それぞれCPUやメモリを専属に使用することができる物
理的な単位であるプロセッサモジュール(PM),21はPM
相互間およびPMと不揮発性共用メモリ12間を接続する転
送経路であるバス(SS−BUS)を表す。The present invention can be applied to, for example, a complex system as shown in FIG. In FIG. 2, those having the same reference numerals as those in FIG. 1 correspond to those shown in FIG. 1, and 20-1 and 20-2 are physical units which can exclusively use a CPU and a memory, respectively. Processor module (PM), 21 is PM
A bus (SS-BUS), which is a transfer path connecting between each other and between the PM and the nonvolatile shared memory 12, is shown.
第2図に示すシステムにおいて,資源情報の引き継ぎ
のために,以下の処理が行われる。In the system shown in FIG. 2, the following processing is performed to take over the resource information.
同一PM内の他プロセスまたは他PM内の他プロセスか
ら,現用プロセス10に対して,データ送受信等の外部事
象が入力される。An external event such as data transmission / reception is input to the active process 10 from another process in the same PM or another process in another PM.
外部事象を入力したことを,現用プロセス10は内部
制御表などに記憶し,かつこの情報を待機プロセス11に
引き継ぐために,不揮発性共用メモリ12の現版13Aに書
き込む。The active process 10 stores the input of the external event in an internal control table or the like, and writes the information in the current version 13A of the nonvolatile shared memory 12 in order to transfer the information to the standby process 11.
ある時間が経過するか,書き込み量がある量以上に
なると,必要な情報を新版13Bへコピーし,現版と新版
とをスイッチする。When a certain time elapses or the amount of writing exceeds a certain amount, necessary information is copied to the new version 13B, and the current version and the new version are switched.
待機プロセス11に対し,メッセージ送信により,引
き継ぎ情報の読み込み処理を指示する。Instruct the standby process 11 to read the takeover information by sending a message.
現用プロセス10に対して通知される外部事象は,継
続して発生するため,引き続いて,現用プロセス10は,
不揮発性共用メモリ12内のスイッチ後の現版(元の新版
13B)に,引き継ぎ情報を書き込む。Since external events notified to the active process 10 occur continuously, the active process 10
The current version after the switch in the nonvolatile shared memory 12 (the original new version
Write the handover information to 13B).
待機プロセス11では,の通知により,処理で現
用プロセス10により書き込まれた情報を読み出し,待機
プロセス11内に反映する。In response to the notification, the standby process 11 reads the information written by the active process 10 in the processing and reflects the information in the standby process 11.
処理の情報が,スイッチ後の現版(元の新版13
B)内に,ある量以上書き込まれるか,またはある時間
が経過したならば,再び現版と新版のスイッチを実施す
る。現版と新版の関係は,処理のスイッチ前の状態に
戻る。The processing information is the current version after the switch (the original new version 13
If a certain amount of data is written in B) or a certain time has elapsed, the current version and the new version are switched again. The relationship between the current version and the new version returns to the state before the processing switch.
上記と同様に,待機プロセス11に対し,メッセー
ジ送信により,引き継ぎ情報の読み込み指示を行った
後,現用プロセス10は引き続いて,不揮発性共用メモリ
12内のスイッチ後の現版13Aに,引き継ぎ情報を書き込
む。Similarly to the above, after instructing the standby process 11 to read the takeover information by sending a message, the active process 10 continues to execute the non-volatile shared memory.
Write the takeover information to the current version 13A after the switch in 12.
の通知により,処理で現用プロセス10により書
き込まれた情報を,待機プロセス11は,不揮発性共用メ
モリ12から読み出して反映する。The standby process 11 reads the information written by the active process 10 in the processing from the non-volatile shared memory 12 and reflects the information written in the process.
以上の処理を繰り返すことにより,不揮発性共用メモ
リ12内のデータの一意性を保証する。By repeating the above processing, the uniqueness of the data in the nonvolatile shared memory 12 is guaranteed.
第3図は,その不揮発性共用メモリ域の本実施例にお
けるデータ構造を示している。FIG. 3 shows the data structure of the nonvolatile shared memory area in this embodiment.
現用プロセスから待機プロセスへの引き継ぎ情報の伝
達を間欠的に実施するため,不揮発性共用メモリ域のデ
ータ構造を,第3図に示すように,現版13Aと新版13Bの
二重構造とする。この情報の引き継ぎは,ある時間の経
過またはある量の情報が蓄積された契機で行われるが,
伝達する情報として,不揮発性共用メモリ12域内のすべ
てを対象とするのではなく,更新分の情報のみを対象と
する。In order to intermittently transmit the handover information from the current process to the standby process, the data structure of the non-volatile shared memory area has a double structure of the current version 13A and the new version 13B as shown in FIG. This information is taken over after a certain period of time or when a certain amount of information has been accumulated.
As information to be transmitted, not all information in the area of the non-volatile shared memory 12 is targeted, but only information of an updated portion is targeted.
差分域14A,14Bは,変更分の情報を待機プロセスにお
いて限定可能とするためのものであり,これには,基情
報域15A,15B内へのポインタが格納されている。基情報
域15A,15Bには,実際の引き継ぎ情報が格納されてお
り,ここには,現用プロセスから待機プロセスへ伝達す
る全情報が格納されている。ただし,情報の中には,現
用プロセスの業務如何により,不要となるものがあり,
そのようなものは,途中で破棄されるので,基情報域15
A,15Bがオーバフローすることはない。The difference areas 14A and 14B are used to limit the information of the change in the standby process, and store the pointers into the basic information areas 15A and 15B. In the basic information areas 15A and 15B, actual handover information is stored, and here, all information transmitted from the active process to the standby process is stored. However, some information may become unnecessary depending on the work of the active process.
Such information is discarded halfway, so the basic information area 15
A and 15B do not overflow.
通信制御プロセスを例に説明すると,以下のとおりで
ある。The communication control process will be described as an example as follows.
通信制御プロセスでは,例えば回線やデータリンクな
どの通信資源を活性化した場合,どのような属性の通信
資源を活性化したかを情報として伝達する必要がある。
また,非活性化が行われた場合には,既に通知したどの
資源が非活性化されたかを情報として伝達する必要があ
る。この非活性化が通知された以降は,資源の属性等の
引き継ぎ情報が不要となり,基情報域15Aまたは15B内に
保持する必要がなくなる。In the communication control process, for example, when a communication resource such as a line or a data link is activated, it is necessary to transmit, as information, the attribute of the activated communication resource.
Further, when deactivation is performed, it is necessary to transmit, as information, which resource, which has been notified, has been deactivated. After the inactivation is notified, the inheritance information such as the attribute of the resource becomes unnecessary, and it is not necessary to hold the information in the basic information area 15A or 15B.
現版13Aは,現用プロセスが引き継ぎ情報を書き込む
領域であり,新版13Bは,待機プロセスが引き継ぎ情報
を読み出す領域である。したがって,差分域14A,14Bか
ら基情報域15A,15Bへのポインタ形式は,現版と新版と
では相違する。The current version 13A is an area where the active process writes the takeover information, and the new version 13B is an area where the standby process reads the takeover information. Therefore, the pointer format from the difference areas 14A, 14B to the basic information areas 15A, 15B is different between the current version and the new version.
通信資源である回線の活性化および非活性化の事象を
例に,第4図に従って現用プロセスおよび待機プロセス
の処理の流れを説明する。説明を簡易化するために,差
分域14A,14Bのエントリ数を2,基情報域15A,15B内情報量
を4とする。The process flow of the active process and the standby process will be described with reference to FIG. 4 by taking as an example the event of activation and deactivation of a line that is a communication resource. In order to simplify the explanation, the number of entries in the difference areas 14A and 14B is 2, and the information amount in the basic information areas 15A and 15B is 4.
現用プロセスは,回線L1の活性化要求がコマンド等
により指示された場合,現版の基情報域15Aから,未使
用領域を獲得し,回線L1の伝達すべき属性情報を設定す
るとともに,差分域14Aに,活性化要求コードおよび基
情報域15A内における回線L1の情報域へのポインタを設
定する。When the activation request of the line L1 is instructed by a command or the like, the active process acquires an unused area from the base information area 15A of the current version, sets attribute information to be transmitted on the line L1, and sets a difference area. In 14A, an activation request code and a pointer to the information area of the line L1 in the basic information area 15A are set.
回線L2に対する活性化要求があった場合,処理と
同様に,引き継ぎ情報の設定を行う。これにより,現版
の差分域14A,基情報域15Aは,第4図(a)に示すよう
な状態になる。When there is an activation request for the line L2, the takeover information is set as in the processing. As a result, the difference area 14A and the base information area 15A of the current version are in a state as shown in FIG.
現用プロセスは,差分域14Aが一杯になったため,
間欠同期処理を開始する。The active process, because the difference area 14A is full,
Start the intermittent synchronization process.
まず,現版における基情報域15A内の必要な情報
を,第4図(b)に示すように,すべて新版の基情報域
15Bへコピーする。First, as shown in Fig. 4 (b), all necessary information in the basic information area 15A in the current version is
Copy to 15B.
次に,第4図(c)に示すように,現版と新版とを
スイッチする。Next, as shown in FIG. 4C, the current version and the new version are switched.
その後,待機プロセスに対し,間欠同期通知を行
う。After that, an intermittent synchronization notification is sent to the standby process.
待機プロセスでは,この間欠同期通知により,新版
となった差分域14Aの情報から更新分の情報,すなわ
ち,回線L1と回線L2の活性化を知り,待機プロセス内に
反映する。反映した後の差分域14A内の情報は,クリア
または無効化する。In the standby process, based on the intermittent synchronization notification, the updated information, that is, the activation of the line L1 and the line L2, is known from the information of the new difference area 14A, and is reflected in the standby process. The information in the difference area 14A after the reflection is cleared or invalidated.
現用プロセスでは,待機プロセスにおける処理と
並行して,新たな現版の差分域14Bおよび基情報域15Bを
対象に,引き継ぎ情報の設定処理を行う。例えば,回線
L2の非活性化要求がコマンド等により指示されると,差
分域14Bに,非活性化要求コードを設定するとともに,
回線L2に関する情報が格納されている基情報域15B内へ
のポインタを設定する。In the active process, in parallel with the processing in the standby process, the setting process of the takeover information is performed for the new current version difference area 14B and the base information area 15B. For example, line
When an L2 deactivation request is instructed by a command or the like, a deactivation request code is set in the difference area 14B,
A pointer to the basic information area 15B in which information on the line L2 is stored is set.
さらに,回線L3に対する活性化要求があった場合,
処理と同様に,引き継ぎ情報の設定を行う。これによ
り,現版の差分域14A,基情報域15Bは,第4図(d)に
示すような状態になる。Further, when there is an activation request for the line L3,
As in the processing, the setting of the handover information is performed. As a result, the difference area 14A and the basic information area 15B of the current version are in a state as shown in FIG. 4 (d).
現用プロセスは,差分域14Bが一杯になったため,
間欠同期処理を開始する。Since the difference area 14B is full, the active process
Start the intermittent synchronization process.
まず,現版における基情報域15B内の必要な情報
を,すべて新版の基情報域15Aへコピーする。First, all necessary information in the basic information area 15B of the current version is copied to the new basic information area 15A.
このとき,回線L2で使用していた基情報域15A内の
領域は,非活性化により不要となるため,未使用領域と
して解放する。これにより,第4図(e)に示すような
状態になる。At this time, since the area in the basic information area 15A used by the line L2 becomes unnecessary by deactivation, it is released as an unused area. As a result, a state as shown in FIG.
次に,第4図(f)に示すように,現版と新版とを
スイッチする。Next, as shown in FIG. 4 (f), the current version and the new version are switched.
そして,待機プロセスに対し,間欠同期通知を行
う。Then, an intermittent synchronization notification is sent to the standby process.
待機プロセスでは,この間欠同期通知により,新版
となった差分域14Bの情報から,回線L2の非活性化と回
線L3の活性化を知り,待機プロセス内に反映する。In the standby process, based on the intermittent synchronization notification, the deactivation of the line L2 and the activation of the line L3 are known from the information of the new version of the difference area 14B, and reflected in the standby process.
現用プロセスでは,待機プロセスにおける処理と
並行して,新たな現版の差分域14Aおよび基情報域15Aを
対象に,引き継ぎ情報の設定処理を行う。以下,上記
以降の処理と同様な処理が,サイクリックに行われる。In the active process, in parallel with the processing in the standby process, the setting process of the handover information is performed for the new current version difference area 14A and base information area 15A. Hereinafter, processing similar to the above-described processing is cyclically performed.
なお,非活性化とは,結果的にその資源情報を破棄す
ることを意味する。Note that deactivation means that the resource information is eventually destroyed.
以上説明したように,本発明によれば,待機プロセス
において間欠的に行う動作環境の事前構築により,現用
プロセスの処理が待たされることはなく,また,待機プ
ロセスにおける処理の遅れによって,引き継ぐべきデー
タが喪失することを防ぐことが可能になる。したがっ
て,通信制御プログラム等のフォールトトレラント化
を,確実に実現できるようになる。As described above, according to the present invention, the process of the active process does not have to wait due to the pre-construction of the operating environment that is performed intermittently in the standby process, and the data to be inherited due to the delay of the process in the standby process. Can be prevented from being lost. Therefore, it is possible to reliably realize the fault-tolerant communication control program and the like.
第1図は本発明の原理説明図, 第2図は本発明の適用システムの例, 第3図は本発明の一実施例に係る不揮発性共用メモリ域
のデータ構造, 第4図は本発明の一実施例による処理の例, 第5図は従来技術の例を示す。 図中,10は現用プロセス,11は待機プロセス,12は不揮発
性共用メモリ,13Aは現版,13Bは新版,14A,14Bは差分域,1
5A,15Bは基情報域,16は不揮発性共用メモリ管理プロセ
ス,P1〜P4は処理過程を表す。FIG. 1 is a diagram illustrating the principle of the present invention, FIG. 2 is an example of a system to which the present invention is applied, FIG. 3 is a data structure of a nonvolatile shared memory area according to an embodiment of the present invention, and FIG. FIG. 5 shows an example of processing according to the prior art. In the figure, 10 is the active process, 11 is the standby process, 12 is the non-volatile shared memory, 13A is the current version, 13B is the new version, 14A and 14B are the difference areas, 1
5A and 15B are basic information areas, 16 is a nonvolatile shared memory management process, and P1 to P4 are processing steps.
フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06F 11/16 - 11/20,12/16,15/16 G05B 9/03 H04M 3/22 H04L 11/20Continued on the front page (58) Fields surveyed (Int.Cl. 6 , DB name) G06F 11/16-11 / 20,12 / 16,15 / 16 G05B 9/03 H04M 3/22 H04L 11/20
Claims (1)
とを有し,不揮発性共用メモリ(12)に設定された情報
を,現用プロセス(10)から待機プロセス(11)へ引き
継ぐことにより,現用プロセス(10)の障害時に,待機
プロセス(11)が現用プロセス(10)に代わり,業務を
継続して運用する計算機システムにおける引き継ぎ情報
のデータ保証処理方法において, 引き継ぎ情報が設定される不揮発性共用メモリ(12)の
領域を,現版(13A)と新版(13B)の二重構造とし, 現版(13A)と新版(13B)のそれぞれに,現用プロセス
(10)から待機プロセス(11)へ伝達すべき情報が格納
される基情報域(15A,15B)と,変更分の情報を示す情
報が格納される差分域(14A,14B)とを設け, 現用プロセス(10)は,現版(13A)に書き込みを行い
(P1), 待機プロセス(11)は,新版(13B)から読み出しを行
い(P4), 現用プロセス(10)は,所定時間の経過または所定量の
情報の蓄積により,現版(13A)の基情報域(15A)の内
容を,新版(13B)の基情報域(15B)に複写するととも
に,現版を新版に,新版を現版に切り換え(P2), 現版と新版の切り換えを,現用プロセス(10)から待機
プロセス(11)に通知する(P3) ことを特徴とする引き継ぎ情報のデータ保証処理方法。1. An active process (10) and a standby process (11)
By passing the information set in the non-volatile shared memory (12) from the active process (10) to the standby process (11), the standby process (11) is activated when the active process (10) fails. In the data assurance processing method of the takeover information in the computer system that continues the operation instead of the current process (10), the area of the nonvolatile shared memory (12) where the takeover information is set is the same as the current version (13A). The new version (13B) has a dual structure. The basic information areas (15A, 15A, 13B) store information to be transmitted from the active process (10) to the standby process (11) in the current version (13A) and the new version (13B) 15B) and a difference area (14A, 14B) for storing information indicating the changed information, the active process (10) writes to the current version (13A) (P1), and the standby process (11 ) Reads from the new version (13B) (P4) The working process (10) copies the contents of the basic information area (15A) of the current version (13A) into the basic information area (15B) of the new version (13B) after a predetermined time or a predetermined amount of information has been accumulated. At the same time, the current version is switched to the new version, the new version is switched to the current version (P2), and the switching between the current version and the new version is notified from the active process (10) to the standby process (11) (P3). Data assurance processing method.
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1266425A JP2772068B2 (en) | 1989-10-13 | 1989-10-13 | Data assurance processing method for inherited information |
DE69031965T DE69031965T2 (en) | 1989-08-17 | 1990-08-16 | System for the passage of aid information |
EP90309008A EP0413586B1 (en) | 1989-08-17 | 1990-08-16 | A system to pass through resource information |
AU61081/90A AU645757B2 (en) | 1989-08-17 | 1990-08-16 | A system to pass through resource information |
US08/181,368 US5446875A (en) | 1989-08-17 | 1994-01-14 | System to pass through resource information |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1266425A JP2772068B2 (en) | 1989-10-13 | 1989-10-13 | Data assurance processing method for inherited information |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH03127231A JPH03127231A (en) | 1991-05-30 |
JP2772068B2 true JP2772068B2 (en) | 1998-07-02 |
Family
ID=17430760
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1266425A Expired - Fee Related JP2772068B2 (en) | 1989-08-17 | 1989-10-13 | Data assurance processing method for inherited information |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2772068B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06309188A (en) * | 1993-04-23 | 1994-11-04 | Nec Corp | Method and device for statically assigning shared device in duplex system |
JP2513127B2 (en) * | 1993-05-31 | 1996-07-03 | 日本電気株式会社 | Hot standby high-speed switching system |
JP2021149133A (en) * | 2020-03-16 | 2021-09-27 | Necソリューションイノベータ株式会社 | Clustering system, operation method for clustering system, and program |
-
1989
- 1989-10-13 JP JP1266425A patent/JP2772068B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH03127231A (en) | 1991-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3156083B2 (en) | Fault-tolerant computer equipment | |
EP0444376B1 (en) | Mechanism for passing messages between several processors coupled through a shared intelligent memory | |
JP2505928B2 (en) | Checkpoint mechanism for fault tolerant systems | |
US5802267A (en) | Method for checkpointing in computer system under distributed processing environment | |
JP2514208B2 (en) | Hot stand-by memory-copy method | |
JP4481498B2 (en) | Protocol for replication server | |
JPS59133663A (en) | Message transmission between task execution means for systemof allowing fault in decentralized multiprocessor/computer | |
US6654880B1 (en) | Method and apparatus for reducing system down time by restarting system using a primary memory before dumping contents of a standby memory to external storage | |
EP0881569B1 (en) | File system and file management method which realize distributed replication in system having shared type raid | |
JP2772068B2 (en) | Data assurance processing method for inherited information | |
JPH07262034A (en) | Data succeeding system | |
JP4489500B2 (en) | Backup method, backup system, disk controller, and backup program | |
US5446875A (en) | System to pass through resource information | |
JP2772052B2 (en) | Resource information inheritance processing method | |
JP2001243209A (en) | Distributed shared memory system and distributed shared memory system control method | |
JP2693627B2 (en) | Redundant system of programmable controller | |
JPH11120017A (en) | Automatic numbering system, duplex system, and cluster system | |
JP4193754B2 (en) | Data duplication method and program | |
JP3697467B2 (en) | Switch object update system | |
JP2511542B2 (en) | Information processing system | |
JPH0474739B2 (en) | ||
JP2002505050A (en) | Asynchronous message processing system and method | |
JPH0375857A (en) | Multi-processor system | |
JP2004310163A (en) | Mirror disk system and mirror disk controller | |
JPH04369069A (en) | File sharing system in roughly connected multiprocessor type computer system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |