JP2526726B2 - Multiplexed file recovery method - Google Patents

Multiplexed file recovery method

Info

Publication number
JP2526726B2
JP2526726B2 JP2215589A JP21558990A JP2526726B2 JP 2526726 B2 JP2526726 B2 JP 2526726B2 JP 2215589 A JP2215589 A JP 2215589A JP 21558990 A JP21558990 A JP 21558990A JP 2526726 B2 JP2526726 B2 JP 2526726B2
Authority
JP
Japan
Prior art keywords
file
input
output
external storage
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2215589A
Other languages
Japanese (ja)
Other versions
JPH0497413A (en
Inventor
昌宏 山口
昌子 内沼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2215589A priority Critical patent/JP2526726B2/en
Publication of JPH0497413A publication Critical patent/JPH0497413A/en
Application granted granted Critical
Publication of JP2526726B2 publication Critical patent/JP2526726B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は多重化ファイル復旧方式に関し、特にホスト
コンピュータで使用する正系ファイルと1つまたは複数
の副系ファイルとに対する多重化ファイル復旧方式に関
する。
The present invention relates to a multiplexed file recovery system, and more particularly to a multiplexed file recovery system for a primary file and one or more secondary files used in a host computer. .

〔従来の技術〕[Conventional technology]

従来より、単一のホストコンピュータで使用するファ
イルについては、信頼性の向上を目的としてファイルの
多重化を行い、1つのファイルが障害となっても業務の
続行を可能としていた。
Conventionally, files used by a single host computer have been multiplexed for the purpose of improving reliability, and business can be continued even if one file becomes an obstacle.

従来の多重化ファイル復旧方式として、次の一例があ
る。
The following is an example of a conventional multiplexed file recovery method.

ファイルを多重化し、正系ファイルに同じ内容を持
つ副系ファイルを用意する。
Multiplex the files and prepare a sub-file with the same contents as the normal file.

ホストコンピュータ内のメモリ上に障害情報(正系
ファイルと副系ファイルとに対する正常に入出力が可能
な部分と何らかの障害が発生して入出力が不可能な部分
とについての情報)を持つ。
The memory in the host computer has failure information (information about a portion where input / output can be normally performed with respect to the primary system file and the secondary system file and a portion where input / output cannot be performed due to some failure).

入出力実行時には、この障害情報に基づいてアクセ
ス対象のファイルを決定する。そして、データの参照時
には正系ファイルまたは副系ファイルのうちで正常な一
つのファイルからデータを入力し、データの更新時には
正系ファイルおよび副系ファイルのうちで正常なすべて
のファイルにデータを出力する。
At the time of executing input / output, the file to be accessed is determined based on this failure information. Then, when referring to data, input data from one normal or subordinate file and output data to all normal or subordinate files when updating data. To do.

障害発生時には、メモリ上の障害情報を更新し、障
害内容を反映する。(以降では障害が発生した部分に対
する入出力は行われなくなる。)このときには、入出力
を障害が発生していない他のファイル(正系ファイルま
たは副系ファイル)に対して実行し、業務を続行する。
When a failure occurs, the failure information on the memory is updated to reflect the failure content. (After that, I / O is no longer performed for the part where the error occurred.) At this time, I / O is executed for other files (primary file or secondary file) where the error has not occurred, and the work is continued. To do.

そして、上記の障害がファイルの一部の障害の場合の
復旧方法としては、以下の2つの方法がある。
Then, there are the following two methods as a recovery method when the above-mentioned failure is a failure of a part of the file.

(1)業務を一旦停止して、該当ファイルへの入出力を
停止し、外部記憶装置中に代替領域を割当て、正常なフ
ァイルよりデータを複写後に、業務を再開する。
(1) The work is temporarily stopped, the input / output to / from the file is stopped, the alternative area is allocated in the external storage device, the data is copied from the normal file, and then the work is restarted.

(2)業務を継続させ、外部記憶装置中に代替領域を割
当て、正常なファイルよりデータを複写すると同時に複
写部分に関する障害情報を更新する。
(2) Continuing the work, allocating an alternative area in the external storage device, copying the data from the normal file, and at the same time updating the failure information about the copied portion.

〔発明が解決しようとする課題〕[Problems to be Solved by the Invention]

上述した従来の多重化ファイル復旧方式は、複数のホ
ストコンピュータで共有されるファイルに対して適用す
る場合に、以下の問題がある。
The conventional multiplexed file recovery method described above has the following problems when applied to a file shared by a plurality of host computers.

後者の(2)の復旧方法は、障害情報をメモリ上に保
持しているために、単一のホストコンピュータシステム
では実現可能であるが、複数のホストコンピュータで共
有するファイルに対しては、復旧動作時に障害情報の反
映にホストコンピュータ間でずれが生じ、データの矛盾
が発生する可能性があるという欠点を有している。(例
えば、あるホストコンピュータでは、正系ファイルが障
害と見做して副系ファイルにのみデータを書き込み、他
のホストコンピュータでは、復旧動作が完了したと見做
して、正系ファイルよりデータを読み込む。その為に、
正系ファイルが障害と見做したホストコンピュータのデ
ータ更新が他のホストコンピュータの業務に反映されな
い場合がある。) 一方、障害情報をホストコンピュータ間で共有可能な
外部記憶装置上に保持する従来の多重化ファイル復旧方
式は、データの矛盾が発生しないけれども、入出力を行
う度に外部記憶装置上の障害情報の参照が必要となり、
性能が極端に低下するという欠点を有している。(一般
に、メモリの参照に比べて外部記憶装置の参照には、数
千倍以上の時間を要する。) また、前者の(1)の復旧方法は、復旧が可能である
が業務を一度停止する必要性があり、24時間運転などを
行う業務には適用できないという欠点を有している。
The latter (2) restoration method can be realized by a single host computer system because the failure information is held in memory, but restoration is possible for files shared by multiple host computers. There is a drawback in that there is a possibility that the reflection of the failure information may differ between the host computers during operation, resulting in data inconsistency. (For example, in one host computer, the normal system file is considered to be a failure and data is written only to the secondary system file.In another host computer, the recovery operation is considered complete, and the data is written from the normal system file. Read, for that,
Data updates on a host computer that is regarded as an error in the primary file may not be reflected in the operations of other host computers. ) On the other hand, although the conventional multiplex file recovery method in which the failure information is held in the external storage device that can be shared between the host computers does not cause data inconsistency, the failure information in the external storage device is rewritten each time input / output is performed. Will be required,
It has a drawback that performance is extremely deteriorated. (Generally, it takes several thousand times more time to refer to an external storage device than to refer to a memory.) In the former method (1), recovery is possible, but work is suspended once. It has the disadvantage that it is necessary and cannot be applied to work such as 24-hour operation.

〔課題を解決するための手段〕[Means for solving the problem]

本発明の多重化ファイルの復旧方式は、複数のホスト
コンピュータと、複数の前記ホストコンピュータから共
有される外部記憶装置とを有する情報処理システムの多
重化ファイル復旧方式において、 前記外部記憶装置中には、 各種のデータを格納する正系ファイルと、 前記正系ファイルに同じ内容を持つ1つまたは複数の
副系ファイルとを有し、 前記ホストコンピュータ中には、 前記外部記憶装置に格納されたデータを利用して業務
処理を行う業務プログラムと、 前記業務プログラムにより起動され、前記正系ファイ
ル及び前記副系ファイルに対するアクセスを起動するフ
ァイルアクセス手段と、 前記ファイルアクセス手段により起動され、データの
参照時には前記正系ファイルまたは前記副系ファイルの
うちで正常な一つからデータを入力し、データの更新時
には前記正系ファイルおよび前記副系ファイルのうちで
正常なすべてにデータを出力する入出力手段と、 前記入出力手段により参照されたときに、前記正系フ
ァイルおよび前記副系ファイルについて、正常に入出力
が可能な部分か何らかの障害が発生して入出力が不可能
な部分かを示す情報を返却する障害情報記憶手段と、 前記ホストコンピュータ間で情報の送受信を行う通信
手段と、 前記外部記憶装置に対する入出力中に障害が発生した
時に、前記入出力手段により起動され、前記通信手段を
通して他の前記ホストコンピュータに対して、前記外部
記憶装置中のその障害発生部分に対する入出力を一時的
に停止することを要求する入出力部分停止要求手段と、 すべての前記ホストコンピュータによる前記外部記憶
装置中のその障害発生部分に対する入出力を停止後に、
前記入出力手段により起動され、前記通信手段を通して
他の前記ホストコンピュータに対して、各前記ホストコ
ンピュータの前記障害情報記憶手段に新たに障害となっ
た前記外部記憶装置の部分の情報を追加後に、入出力を
再開することを要求する入出力再開要求手段と、 前記通信手段を通して他の前記ホストコンピュータか
らの入出力停止要求に応じて、前記外部記憶装置の該当
部分への入出力を一時的に停止し、その後の入出力再開
要求に応じて、前記外部記憶装置の該当部分の情報を前
記障害情報記憶手段に追加し、入出力を再開する入出力
一時停止再開手段とを有するとともに、 複数の前記ホストコンピュータ間で共有される正系フ
ァイルおよび1つまたは複数の副系ファイルの多重化フ
ァイルについて障害時にも業務処理の継続を可能とする
ために、 何れかのファイルの一部で障害が発生した時に、前記
外部記憶装置の中から代替となる領域を割当てる代替領
域割当て手段と、 第1に、前記入出力部分停止手段を起動して他の前記
ホストコンピュータからの該当部分への入出力を一時的
に停止し、第2に、前記入出力手段を起動して前記代替
領域割当て手段が割当てた領域に正常な一つのファイル
よりのデータを複写し、第3に、前記障害情報記憶手段
が記憶する障害情報から当該部分に対する障害情報を削
除し、第4に、前記入出力再開要求手段を起動して他の
前記ホストコンピュータ上の前記障害情報記憶手段から
該当部分に対する障害情報を削除し、入出力を再開させ
るファイル部分復旧手段と、 何れかのファイルの全体障害が発生した場合に、該当
のファイルを幾つかの部分に分割し、分割した部分ごと
に前記代替領域割当て手段および前記ファイル部分復旧
手段を起動して、順次に該当のファイルを復旧するファ
イル全体復旧手段とを有し、 何れかのファイルの全体的な障害が発生した場合に
も、業務の継続を止めることなく、かつ、復旧中に業務
への影響を殆ど与えることなく、動的に障害のファイル
全体を復旧して正常運用に戻ることにより構成されてい
る。
A multiplexed file recovery method of the present invention is a multiplexed file recovery method of an information processing system having a plurality of host computers and an external storage device shared by the plurality of host computers, wherein A host system file that stores various data, and one or more subsystem files that have the same contents in the system file, and the host computer stores data stored in the external storage device. And a file access unit that is started by the business program and starts access to the primary file and the secondary file, and is started by the file access unit when data is referenced. Data from the normal one of the normal file or the secondary file Input / output means for inputting and outputting data to all normal files of the normal system file and the secondary system file when updating the data; and the normal system file and the secondary system file when referred to by the input / output device. Fault information storage means for returning information indicating whether a normal input / output is possible or an input / output is impossible due to some failure, and communication for transmitting / receiving information between the host computers Means and, when a failure occurs during input / output to / from the external storage device, is started by the input / output means, to the other host computer through the communication means, to the failure occurrence part in the external storage device. Input / output partial stop request means for requesting temporary stop of input / output, and the external storage by all the host computers After stopping the I / O to the faulty part of the device,
After being started by the input / output means, the information of the newly failed external storage device is added to the failure information storage means of each host computer with respect to the other host computers through the communication means, Input / output restart requesting means for requesting restart of input / output, and input / output to / from a corresponding part of the external storage device temporarily in response to an input / output stop request from the other host computer through the communication means. In addition to the input / output temporary stop / resume means for stopping and adding the information of the corresponding part of the external storage device to the failure information storage means in response to the subsequent input / output restart request, Continuation of business processing even in the event of a failure for the multiplexed file of the primary file and one or more secondary files shared between the host computers In order to make it possible, an alternative area allocation means for allocating an alternative area from the external storage device when a failure occurs in a part of one of the files, and first, the input / output partial stop means. It is started to temporarily stop the input / output to / from the other part from the host computer, and secondly, the input / output unit is started to activate one normal file in the area allocated by the alternative area allocation means. Data is copied, thirdly, the failure information for the relevant part is deleted from the failure information stored in the failure information storage means, and fourthly, the input / output resumption requesting means is activated to activate the other host computer. File partial recovery means for deleting the failure information for the corresponding part from the above failure information storage means and restarting input / output, and the corresponding file when an overall failure of any file occurs And a whole file restoring means for sequentially restoring the corresponding file by activating the alternative area allocation means and the file partial restoring means for each of the divided portions. Even if an overall file failure occurs, the entire failed file can be dynamically restored without interrupting the continuation of operations and with almost no impact on operations during recovery to ensure normal operation. It is composed by returning.

〔実施例〕〔Example〕

次に、本発明の実施例について図面を参照して説明す
る。
Next, embodiments of the present invention will be described with reference to the drawings.

第1図は本発明の多重化ファイル復旧方式の一実施例
を示すブロック図である。
FIG. 1 is a block diagram showing an embodiment of a multiplexed file restoration system of the present invention.

第1図を参照すると、本実施例は、ホストコンピュー
タ1,2、外部記憶装置3、正系ファイル4、副系ファイ
ル5、通信手段6、業務プログラム11,21、ファイルア
クセス手段12,22、障害情報記憶手段13,23、入出力手段
14,24、入出力部分停止要求手段15,25、入出力再開要求
手段16,26、入出力一時停止再開手段17,27、ファイル部
分復旧手段18,28、代替領域割当て手段19,28、ファイル
全体復旧手段20,30から構成されている。
Referring to FIG. 1, in this embodiment, the host computers 1 and 2, the external storage device 3, the primary file 4, the secondary file 5, the communication means 6, the business programs 11 and 21, the file access means 12 and 22, Fault information storage means 13, 23, input / output means
14, 24, input / output partial stop requesting means 15, 25, input / output restart requesting means 16, 26, input / output pause restarting means 17, 27, file partial restoring means 18, 28, alternative area allocating means 19, 28, file It is composed of total recovery means 20, 30.

次に、本実施例の動作について、図面を参照して説明
する。
Next, the operation of this embodiment will be described with reference to the drawings.

ホストコンピュータ1とホストコンピュータ2とは、
外部記憶装置3を共有しており、外部記憶装置3は、正
系ファイル4と副系ファイル5とに多重化されている。
The host computer 1 and the host computer 2 are
The external storage device 3 is shared, and the external storage device 3 is multiplexed with the primary file 4 and the secondary file 5.

また、ホストコンピュータ1とホストコンピュータ2
とは、通信手段6で結ばれている。
Also, the host computer 1 and the host computer 2
And are connected by the communication means 6.

なお、各ホストコンピュータ1,2の中の動作は、同様
であるので、以下にホストコンピュータ1の中の業務の
動作について記述する。
Since the operation in each host computer 1 and 2 is the same, the operation of the business in the host computer 1 will be described below.

A.正常時の動作: ファイルは、外部記憶装置3中の正系ファイル4と
副系ファイル5とに多重化されており、障害情報は、ホ
ストコンピュータ1中のメモリ上に保持している。
A. Normal operation: The file is multiplexed in the primary file 4 and the secondary file 5 in the external storage device 3, and the failure information is held in the memory in the host computer 1.

業務プログラム11は、ファイルアクセス手段12に対
して、ファイル中のレコードのアクセス(参照または更
新)を要求する。
The business program 11 requests the file access means 12 to access (reference or update) the record in the file.

ファイルアクセス手段12は、業務プログラム11から
要求されたレコードのファイル中の格納位置を判断し、
入出力手段14に対して要求レコードを含むブロックの参
照または更新を要求する。
The file access means 12 determines the storage position in the file of the record requested by the business program 11,
The input / output unit 14 is requested to refer to or update the block including the request record.

入出力手段14は、障害情報記憶手段13が記憶してい
る障害情報を参照し、ファイルアクセス手段12から要求
があったブロックが、正系ファイル4及び副系ファイル
5で、正常にアクセス可能か、障害発生でアクセス不可
能かを判断する。
The input / output unit 14 refers to the fault information stored in the fault information storage unit 13, and whether the block requested by the file access unit 12 can be normally accessed in the primary file 4 and the secondary file 5 , Judge whether the access is impossible due to a failure.

入出力手段14は、参照要求の場合には、正常なファ
イルの1つからブロックを読み込み(障害発生中のファ
イルからは読み込まない)、更新要求の場合には、正常
なファイルのすべてにブロックを書き込む(障害発生中
のファイルへは書き込まない)。
The input / output unit 14 reads a block from one of the normal files in the case of a reference request (does not read from the file in which a failure has occurred), and in the case of an update request, blocks in all of the normal files. Write (do not write to the failing file).

B.障害発生時の動作: 入出力手段14は、外部記憶装置3に対する入出力中
に障害が発生すると、障害情報記憶手段13に新たに障害
となった部分の情報を追加し、入出力部分停止要求手段
15を起動して、通信手段6を通して他のホストコンピュ
ータ2に対し、ファイル中の障害発生部分に対する入出
力を一時的に停止することを要求する。
B. Operation at the time of failure: When a failure occurs during input / output to / from the external storage device 3, the input / output unit 14 adds information on the newly failed part to the failure information storage unit 13, and Stop request means
15 is activated to request the other host computer 2 through the communication means 6 to temporarily stop the input / output to / from the faulty part in the file.

すべてのホストコンピュータ1,2からのファイル中
の障害発生部分に対する入出力が停止すると、入出力手
段14は、入出力再開要求手段16を起動して、通信手段6
を通して他のホストコンピュータ2に対して、障害情報
記憶手段23に新たに障害となった部分の情報を追加後
に、入出力を再開することを要求する。
When the input / output from all the host computers 1 and 2 to the faulty part in the file is stopped, the input / output means 14 activates the input / output restart requesting means 16 and the communication means 6
Through, requesting another host computer 2 to restart the input / output after adding the information of the newly failed portion to the failure information storage means 23.

入出力一時停止再開手段27は、通信手段6を通して
他のホストコンピュータ1からの入出力停止要求に応じ
て該当部分への入出力を一時的に停止し、入出力再開要
求に応じて該当部分の障害情報を障害情報記憶手段23に
追加し、入出力を再開する。
The input / output suspend / resume means 27 temporarily suspends the input / output to / from the corresponding portion in response to the input / output stop request from the other host computer 1 through the communication means 6, and responds to the input / output restart request to stop Fault information is added to the fault information storage means 23, and input / output is restarted.

以降は、正常時の動作に戻る。After that, the operation returns to normal.

C.ファイルの部分障害時の復旧動作: ファイルの一部で障害が発生した時に、代替領域割
当て手段19は、外部記憶装置3の中から代替となる領域
を割当てる。
C. Recovery Operation When File Partially Fails: When a part of the file fails, the alternative area allocating means 19 allocates an alternative area from the external storage device 3.

ファイル部分復旧手段18は、入出力部分停止手段15
を起動して、他のホストコンピュータ2からの該当部分
への入出力を一時的に停止させる。
The file partial recovery means 18 is an input / output partial stop means 15.
Is started to temporarily stop the input / output from the other host computer 2 to the relevant part.

次に、ファイル部分復旧手段18は、入出力手段14を
起動して、代替領域割当て手段19が割当てた領域に、正
常なファイルよりデータを複写する。
Next, the file partial restoration means 18 activates the input / output means 14 to copy the data from the normal file to the area allocated by the alternative area allocation means 19.

次に、ファイル部分復旧手段18は、障害情報記憶手
段13が記憶する障害情報から該当部分に対する障害情報
を削除する。
Next, the file partial restoration means 18 deletes the failure information for the relevant portion from the failure information stored in the failure information storage means 13.

次に、ファイル部分復旧手段18は、入出力再開要求
手段16を起動して、他のホストコンピュータ2上の障害
情報から該当部分に対する障害情報を削除し、入出力を
再開させる。
Next, the file partial recovery means 18 activates the input / output resumption requesting means 16, deletes the failure information for the relevant part from the failure information on the other host computer 2, and restarts the input / output.

以降は、正系ファイル/副系ファイルともに正常な
状態で業務を続行可能となる。
After that, it is possible to continue the work in a normal state for both the primary file and the secondary file.

D.ファイル全体障害時の復旧動作: ファイルの全体障害が発生した場合に、ファイル全
体復旧手段20は、ファイルの部分復旧に要する時間が業
務に影響を与えない程度に、該当ファイルを幾つかの部
分に分割する。
D. Recovery operation at the time of failure of the entire file: When the failure of the entire file occurs, the entire file recovery means 20 restores some of the files to such an extent that the time required for partial recovery of the file does not affect the business. Divide into parts.

次に、ファイル全体復旧手段20は、分割した部分ご
とに代替領域割当て手段19およびファイル部分復旧手段
18を起動して、順次にファイルを復旧する。
Next, the whole file restoring means 20 includes an alternative area allocating means 19 and a file partial restoring means for each of the divided parts.
Start 18 and recover files sequentially.

〔発明の効果〕〔The invention's effect〕

以上説明したように、本発明の多重化ファイル復旧方
式は、複数のホストコンピュータ間で共有されるファイ
ルを多重化して信頼性を向上させ、ファイルの全体的な
障害が発生した際に、ファイルの部分復旧に要する時間
が業務に影響を与えない程度に、該当ファイルを幾つか
の部分に分割して、順次に該当ファイルを復旧するの
で、業務を停止することなく、かつ、復旧中の業務への
影響を殆ど与えることなく、動的に障害のファイル全体
を復旧して正常運用に戻ることが可能となるという効果
を有している。
As described above, the multiplexed file recovery method of the present invention multiplexes files shared among a plurality of host computers to improve reliability, and when an overall file failure occurs, The relevant file is divided into several parts and the relevant files are restored in sequence so that the time required for partial restoration does not affect the work. It has an effect that it is possible to dynamically recover the entire failed file and return to normal operation with almost no influence of.

【図面の簡単な説明】[Brief description of drawings]

第1図は本発明の多重化ファイル復旧方式の一実施例を
示すブロック図である。 1,2…ホストコンピュータ、3…外部記憶装置、4…正
系ファイル、5…副系ファイル、6…通信手段、11…業
務処理プログラム、12…ファイルアクセス手段、13…障
害情報記憶手段、14…入出力手段、15…入出力部分停止
要求手段、16…入出力再開要求手段、17…入出力一時停
止再開手段、18…ファイル部分復旧手段、19…代替領域
割当て手段、20…ファイル全体復旧手段、21…業務処理
プログラム、22…ファイルアクセス手段、23…障害情報
記憶手段、24…入出力手段、25…入出力部分停止要求手
段、26…入出力再開要求手段、27…入出力一時停止再開
手段、28…ファイル部分復旧手段、29…代替領域割当て
手段、30…ファイル全体復旧手段。
FIG. 1 is a block diagram showing an embodiment of a multiplexed file restoration system of the present invention. 1, 2 ... Host computer, 3 ... External storage device, 4 ... Primary file, 5 ... Subsystem file, 6 ... Communication means, 11 ... Business processing program, 12 ... File access means, 13 ... Fault information storage means, 14 ... input / output means, 15 ... input / output partial stop request means, 16 ... input / output restart request means, 17 ... input / output temporary stop / resume means, 18 ... file partial recovery means, 19 ... alternative area allocation means, 20 ... whole file recovery Means 21 ... Business processing program 22 ... File access means 23 ... Failure information storage means 24 ... Input / output means 25 ... Input / output partial stop request means 26 ... Input / output restart request means 27 ... Input / output temporary stop Resuming means, 28 ... File partial restoring means, 29 ... Alternative area allocating means, 30 ... Whole file restoring means.

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】複数のホストコンピュータと、複数の前記
ホストコンピュータから共有される外部記憶装置とを有
する情報処理システムの多重化ファイル復旧方式におい
て、 前記外部記憶装置中には、 各種のデータを格納する正系ファイルと、 前記正系ファイルに同じ内容を持つ1つまたは複数の副
系ファイルとを有し、 前記ホストコンピュータ中には、 前記外部記憶装置に格納されたデータを利用して業務処
理を行う業務プログラムと、 前記業務プログラムにより起動され、前記正系ファイル
及び前記副系ファイルに対するアクセスを起動するファ
イルアクセス手段と、 前記ファイルアクセス手段により起動され、データの参
照時には前記正系ファイルまたは前記副系ファイルのう
ちで正常な一つからデータを入力し、データの更新時に
は前記正系ファイルおよび前記副系ファイルのうちで正
常なすべてにデータを出力する入出力手段と、 前記入出力手段により参照されたときに、前記正系ファ
イルおよび前記副系ファイルについて、正常に入出力が
可能な部分か何らかの障害が発生して入出力が不可能な
部分かを示す情報を返却する障害情報記憶手段と、 前記ホストコンピュータ間で情報の送受信を行う通信手
段と、 前記外部記憶装置に対する入出力中に障害が発生した時
に、前記入出力手段により起動され、前記通信手段を通
して他の前記ホストコンピュータに対して、前記外部記
憶装置中のその障害発生部分に対する入出力を一時的に
停止することを要求する入出力部分停止要求手段と、 すべての前記ホストコンピュータによる前記外部記憶装
置中のその障害発生部分に対する入出力を停止後に、前
記入出力手段により起動され、前記通信手段を通して他
の前記ホストコンピュータに対して、各前記ホストコン
ピュータの前記障害情報記憶手段に新たに障害となった
前記外部記憶装置の部分の情報を追加後に、入出力を再
開することを要求する入出力再開要求手段と、 前記通信手段を通して他の前記ホストコンピュータから
の入出力停止要求に応じて、前記外部記憶装置の該当部
分への入出力を一時的に停止し、その後の入出力再開要
求に応じて、前記外部記憶装置の該当部分の情報を前記
障害情報記憶手段に追加し、入出力を再開する入出力一
時停止再開手段とを有するとともに、 複数の前記ホストコンピュータ間で共有される正系ファ
イルおよび1つまたは複数の副系ファイルの多重化ファ
イルについて障害時にも業務処理の継続を可能とするた
めに、 何れかのファイルの一部で障害が発生した時に、前記外
部記憶装置の中から代替となる領域を割当てる代替領域
割当て手段と、 第1に、前記入出力部分停止手段を起動して他の前記ホ
ストコンピュータからの該当部分への入出力を一時的に
停止し、第2に、前記入出力手段を起動して前記代替領
域割当て手段が割当てた領域に正常な一つのファイルよ
りのデータを複写し、第3に、前記障害情報記憶手段が
記憶する障害情報から該当部分に対する障害情報を削除
し、第4に、前記入出力再開要求手段を起動して他の前
記ホストコンピュータ上の前記障害情報記憶手段から該
当部分に対する障害情報を削除し、入出力を再開させる
ファイル部分復旧手段と、 何れかのファイルの全体障害が発生した場合に、該当の
ファイルを幾つかの部分に分割し、分割した部分ごとに
前記代替領域割当て手段および前記ファイル部分復旧手
段を起動して、順次に該当のファイルを復旧するファイ
ル全体復旧手段とを有し、 何れかのファイルの全体的な障害が発生した場合にも、
業務の継続を止めることなく、かつ、復旧中に業務への
影響を殆ど与えることなく、動的に障害のファイル全体
を復旧して正常運用に戻ることを特徴とする多重化ファ
イル復旧方式。
1. A multiplexed file restoration method of an information processing system having a plurality of host computers and an external storage device shared by the plurality of host computers, wherein various data are stored in the external storage device. Normal file and one or more secondary files having the same contents as the normal file, and in the host computer, business processing is performed using data stored in the external storage device. And a file access unit that is started by the business program and starts access to the primary file and the secondary file; and a file access unit that is started by the file access unit and refers to the normal file or the Input data from one of the normal sub-files and update the data Is an input / output unit that outputs data to all normal files of the primary system file and the secondary system file, and normally refers to the primary system file and the secondary system file when referred to by the input / output system. Failure information storage means for returning information indicating whether the input / output is possible or the input / output is impossible due to some failure, communication means for transmitting / receiving information between the host computers, and the external storage When a failure occurs during input / output to / from a device, the input / output means is activated to temporarily input / output to / from another host computer through the communication means to the part in which the failure occurs in the external storage device. Input / output part stop requesting means for requesting stop, and a part where the failure occurs in the external storage device by all the host computers Of the external storage device newly activated in the fault information storage means of each host computer, which is activated by the input / output means after stopping input / output to / from After adding the information of the part, to the corresponding part of the external storage device in response to the input / output restart request means for requesting to restart the input / output, and the input / output stop request from the other host computer through the communication means. I / O temporary stop / resume means for temporarily stopping the input / output of the device, adding the information of the corresponding portion of the external storage device to the failure information storage means, and restarting the input / output in response to a subsequent input / output restart request. And a multiplexed file of one or more subsystem files and one or more subsystem files shared between the plurality of host computers. In order to enable the continuation of business processing even in the event of a failure, an alternative area allocation means for allocating an alternative area from the external storage device when a failure occurs in a part of any one of the files; , The input / output part stopping means is activated to temporarily stop the input / output to / from the other part from the host computer, and secondly, the input / output means is activated to allocate the alternative area allocating means. The data from one normal file is copied to the reserved area, thirdly, the failure information for the corresponding portion is deleted from the failure information stored in the failure information storage means, and fourthly, the input / output restart request means is provided. File partial recovery means for starting and deleting the failure information for the relevant part from the failure information storage means on the other host computer, and restarting input / output; In this case, the corresponding file is divided into several parts, and the alternate area allocation means and the file partial recovery means are activated for each of the divided parts, and an entire file recovery means for sequentially recovering the applicable file is provided. And if any file global failure occurs,
A multiplexed file recovery method that recovers the entire failed file and returns to normal operation without stopping the continuation of the operation and with little impact on the operation during recovery.
JP2215589A 1990-08-15 1990-08-15 Multiplexed file recovery method Expired - Lifetime JP2526726B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2215589A JP2526726B2 (en) 1990-08-15 1990-08-15 Multiplexed file recovery method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2215589A JP2526726B2 (en) 1990-08-15 1990-08-15 Multiplexed file recovery method

Publications (2)

Publication Number Publication Date
JPH0497413A JPH0497413A (en) 1992-03-30
JP2526726B2 true JP2526726B2 (en) 1996-08-21

Family

ID=16674936

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2215589A Expired - Lifetime JP2526726B2 (en) 1990-08-15 1990-08-15 Multiplexed file recovery method

Country Status (1)

Country Link
JP (1) JP2526726B2 (en)

Also Published As

Publication number Publication date
JPH0497413A (en) 1992-03-30

Similar Documents

Publication Publication Date Title
US8966315B2 (en) System-directed checkpointing implementation using a hypervisor layer
US7412578B2 (en) Snapshot creating method and apparatus
US5546534A (en) Method of operating a computer system
JP3197382B2 (en) Method and system for incremental time zero backup copy of data
US8732121B1 (en) Method and system for backup to a hidden backup storage
US7246211B1 (en) System and method for using file system snapshots for online data backup
US7318135B1 (en) System and method for using file system snapshots for online data backup
US7437603B2 (en) Method for restoring snapshot in a storage system
US7111137B2 (en) Data storage systems and processes, such as one-way data mirror using write mirroring
KR19980024086A (en) Computer system and file management methods
US20050149683A1 (en) Methods and systems for data backups
JP2006268503A (en) Computer system, disk unit and data update control method
KR950014175B1 (en) Method and means for time zero backup copying of data
EP0482853A2 (en) Method and apparatus for storage device management
JP2526726B2 (en) Multiplexed file recovery method
US20050223180A1 (en) Accelerating the execution of I/O operations in a storage system
JP2000293391A (en) Method and device for large-scale memory system management
US20050149554A1 (en) One-way data mirror using write logging
US20050149548A1 (en) One-way data mirror using copy-on-write
JPH1185594A (en) Information processing system for remote copy
JP2612385B2 (en) Transfer processing between multiple subsystems
JP2574532B2 (en) Resource management method in fault tolerant system
JPH04230542A (en) Multiplex system for file shared by host computers
JP3463696B2 (en) Online garbage collection processing method
WO1995019599A1 (en) File backup system

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080614

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090614

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100614

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100614

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110614

Year of fee payment: 15

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110614

Year of fee payment: 15