JPH07302217A - Fault recovery system for file in distributed processing system - Google Patents

Fault recovery system for file in distributed processing system

Info

Publication number
JPH07302217A
JPH07302217A JP6113544A JP11354494A JPH07302217A JP H07302217 A JPH07302217 A JP H07302217A JP 6113544 A JP6113544 A JP 6113544A JP 11354494 A JP11354494 A JP 11354494A JP H07302217 A JPH07302217 A JP H07302217A
Authority
JP
Japan
Prior art keywords
file
status
files
workstation
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6113544A
Other languages
Japanese (ja)
Other versions
JP2850756B2 (en
Inventor
Yoko Noda
洋子 野田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP6113544A priority Critical patent/JP2850756B2/en
Publication of JPH07302217A publication Critical patent/JPH07302217A/en
Application granted granted Critical
Publication of JP2850756B2 publication Critical patent/JP2850756B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

PURPOSE:To quickly recover a file by providing a means for updating information relating to the state of the file managed by a file state management means when a fault is generated in the file and when the file provided with the fault is recovered, retrieving the file provided with the fault and recovering it. CONSTITUTION:A file state updating means 14 updates the information relating to the state of the file 11 managed by a file state file 12 and a file management table 21 when the fault is generated in the file 11 and when the file 11 provided with the fault is recovered by a file recovery means 15. Thus, latest information relating to the state of the entire file 11 is stored in the file state file 12 and the file management table 21 at all times except the time when the fault is generated in the file state file 12 itself. Then, the file recovery means 15 recovers the file 11 provided with the fault in work stations 10 and 30 at a prescribed timing set beforehand.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、複数のワークステーシ
ョン間でファイルを重複させるデュプレクス形態の分散
処理システム環境において、障害が発生したファイルの
復旧を行なうファイルの障害復旧方式に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a file failure recovery system for recovering a failed file in a duplex type distributed processing system environment in which files are duplicated among a plurality of workstations.

【0002】[0002]

【従来の技術】複数のワークステーションによって分散
して処理を行なう分散処理システムにおいて、ファイル
を分散する方式として、複数のワークステーションに同
一ファイルが重複することを許すデュプレクス形態の分
散処理環境がある。この分散処理環境は、同一ファイル
が複数のワークステーションに重複して存在するため、
一ヶ所でファイルに障害が発生しても他のワークステー
ションの同一ファイルをコピーすることによって容易に
復旧することができるという利点がある。
2. Description of the Related Art In a distributed processing system in which a plurality of workstations perform distributed processing, as a method of distributing files, there is a duplex type distributed processing environment which allows the same file to be duplicated in a plurality of workstations. In this distributed processing environment, the same file is duplicated on multiple workstations,
Even if a file fails in one place, there is an advantage that it can be easily restored by copying the same file in another workstation.

【0003】従来、上記のような分散処理環境において
ファイルの障害を復旧するには、システムの終了の際等
に、障害の発生した当該ファイルを有するワークステー
ションごとに個別に、手作業で復旧処理を行なってい
た。
Conventionally, in order to recover a file failure in a distributed processing environment as described above, a recovery process is manually performed for each workstation having the file in which the failure has occurred, such as when the system is terminated. Was being done.

【0004】[0004]

【発明が解決しようとする課題】しかし、上述した従来
のファイルの障害復旧方式では、障害の発生した当該フ
ァイルを有するワークステーションごとに個別に、手作
業でファイルの復旧を行なうため、手間がかかるという
欠点があった。
However, in the above-described conventional file failure recovery method, it is troublesome to manually recover the file individually for each workstation having the file in which the failure has occurred. There was a drawback.

【0005】本発明は、上記従来の欠点を解消し、デュ
プレクス形態の分散処理システムを対象に、障害の発生
したファイルの復旧を速やかに行なうことができる障害
復旧方式を提供することを目的とする。
SUMMARY OF THE INVENTION It is an object of the present invention to solve the above-mentioned conventional drawbacks and to provide a failure recovery system capable of promptly recovering a file in which a failure has occurred, targeting a duplex type distributed processing system. .

【0006】[0006]

【課題を解決するための手段】上記の目的を達成するた
め、本発明は、複数のワークステーション間でファイル
を重複させて有する分散処理システムにおいて、ファイ
ルの状態に関する情報を格納して管理するファイル状態
管理手段と、前記ファイル状態管理手段が管理するファ
イルを対象として、該ファイルに障害が発生した場合及
び障害のあるファイルが復旧した場合に前記ファイル状
態管理手段に管理されたファイルの状態に関する情報を
更新するファイル状態更新手段と、前記ファイル状態管
理手段に管理されたファイルの状態に関する情報を参照
して障害のあるファイルを検索し、該ファイルを復旧す
るファイル復旧手段とを備える構成としている。
In order to achieve the above object, the present invention provides a file for storing and managing information regarding the state of a file in a distributed processing system having a plurality of workstations with overlapping files. Status management means and information about the status of the files managed by the file status management means for the files managed by the file status management means when a failure occurs in the file and when the failed file is restored And a file restoration means for searching for a faulty file and restoring the file by referring to information relating to the state of the file managed by the file status management means.

【0007】また他の態様では、前記ファイル状態管理
手段が、稼働中のアプリケーションプログラムによって
作成されるファイル管理テーブルと、各ワークステーシ
ョンに常設されたファイル状態ファイルとを備える構成
としている。
In another aspect, the file status management means comprises a file management table created by an operating application program and a file status file permanently installed in each workstation.

【0008】また他の態様では、前記ファイル復旧手段
が、稼働中のアプリケーションプログラムからファイル
復旧要求を受けた場合は、前記ファイル管理テーブルを
参照し、他のワークステーションに格納された正常な同
一のファイルからデータをコピーして障害のあるファイ
ルを復旧し、待機中のアプリケーションプログラムから
ファイル復旧要求を受けた場合は、少なくとも2つのフ
ァイル状態ファイルを比較し、最新のファイル状態ファ
イルを選択して参照し、他のワークステーションに格納
された正常な同一のファイルからデータをコピーして障
害のあるファイルを復旧する構成としている。
In another aspect, when the file recovery means receives a file recovery request from an operating application program, it refers to the file management table and stores the same normal file stored in another workstation. When data is copied from a file and the faulty file is restored, and when a file restoration request is received from a waiting application program, at least two file status files are compared and the latest file status file is selected and referenced. Then, data is copied from the same normal file stored in another workstation to recover the faulty file.

【0009】上記目的を達成する他のファイルの障害復
旧方式では、複数のワークステーション間でファイルを
重複させて有する分散処理システムにおいて、ファイル
の状態に関する情報を格納して管理するファイル状態管
理手段と、アプリケーションプログラムからのアクセス
要求を受けた場合に、前記ファイル状態管理手段位管理
されたファイルの状態に関する情報を参照して、重複し
た全てのファイルの状態が正常であるときは任意のファ
イルにアクセスし、重複したファイルの中に障害のある
ファイルがあるときは正常なファイルを選択してアクセ
スするファイルアクセス手段と、前記ファイル状態管理
手段が管理するファイルを対象として、該ファイルに障
害が発生した場合及び障害のあるファイルが復旧した場
合に前記ファイル状態管理手段に管理されたファイルの
状態に関する情報を更新するファイル状態更新手段と、
前記ファイル状態管理手段に管理されたファイルの状態
に関する情報を参照して障害のあるファイルを検索し、
該ファイルを復旧するファイル復旧手段とを備える構成
としている。
In another file failure recovery method for achieving the above object, in a distributed processing system in which files are duplicated among a plurality of workstations, a file status management means for storing and managing information on the status of files is provided. , When an access request is received from an application program, the file status management means refers to the information about the status of the managed file, and accesses any file when the status of all duplicated files is normal. However, when there is a faulty file among the duplicated files, a fault occurs in the file access means for selecting and accessing a normal file and the file managed by the file status management means. In case and when the file with the failure is restored, the above file A file status updating means for updating information about the status of the file managed by the state management means,
Search for a faulty file by referring to the information on the state of the file managed by the file status management means,
A file recovery means for recovering the file is provided.

【0010】また他の態様では、ファイル状態管理手段
が、稼働中のアプリケーションプログラムによって作成
されるファイル管理テーブルと、各ワークステーション
に常設されたファイル状態ファイルとを備え、前記ファ
イルアクセス手段が、前記ファイル管理テーブルを参照
して正常なファイルを検索する構成としている。
In another aspect, the file status management means comprises a file management table created by an operating application program, and a file status file permanently installed in each workstation, and the file access means comprises: The file management table is referenced to search for a normal file.

【0011】また他の態様では、前記ファイル復旧手段
が、稼働中のアプリケーションプログラムからファイル
復旧要求を受けた場合は、前記ファイル管理テーブルを
参照し、他のワークステーションに格納された正常な同
一のファイルからデータをコピーして障害のあるファイ
ルを復旧し、待機中のアプリケーションプログラムから
ファイル復旧要求を受けた場合は、少なくとも2つのフ
ァイル状態ファイルを比較し、最新のファイル状態ファ
イルを選択して参照し、他のワークステーションに格納
された正常な同一のファイルからデータをコピーして障
害のあるファイルを復旧する構成としている。
According to another aspect, when the file recovery means receives a file recovery request from an operating application program, it refers to the file management table and stores the same normal file stored in another workstation. When data is copied from a file and the faulty file is restored, and when a file restoration request is received from a waiting application program, at least two file status files are compared and the latest file status file is selected and referenced. Then, data is copied from the same normal file stored in another workstation to recover the faulty file.

【0012】[0012]

【作 用】本発明の分散処理システムにおけるファイル
の障害復旧方式によれば、アプリケーションプログラム
からの要求にしたがって、自動的に障害の発生したファ
イルを発見し、正常な状態に復旧させることができる。
[Operation] According to the file failure recovery method in the distributed processing system of the present invention, it is possible to automatically find a failed file and restore it to a normal state in accordance with a request from an application program.

【0013】[0013]

【実施例】以下、本発明の実施例について図面を参照し
て説明する。図1は、本発明の一実施例に係るファイル
の障害復旧方式を実現する分散処理システムの構成を示
すブロック図である。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing the configuration of a distributed processing system that realizes a file failure recovery system according to an embodiment of the present invention.

【0014】本実施例において、分散処理システムを構
成するワークステーションは、それぞれアプリケーショ
ンプログラムにしたがって所定の処理を行なうが、アプ
リケーションプログラムが稼働して処理を実行している
状態のワークステーションを稼働系ワークステーション
10、稼働系ワークステーション10で実際に稼働して
いるアプリケーションプログラムを稼働系アプリケーシ
ョン20と称する。また、アプリケーションプログラム
が稼働しておらず処理を実行していない状態のワークス
テーションを待機系ワークステーション30、待機系ワ
ークステーション30の待機中のアプリケーションプロ
グラムを待機系アプリケーション40と称する。稼働系
ワークステーション10と待機系ワークステーション3
0、及び稼働系アプリケーション20と待機系アプリケ
ーション40は、それぞれ構造的には同一であリ、任意
のワークステーション及びアプリケーションに着目した
場合に当該アプリケーションが稼働状態にあるか否かの
違いがあるにすぎない。したがって、稼働系と待機系と
を特に区別する必要がない場合はワークステーション1
0、30、アプリケーション20、40というように表
記する。
In the present embodiment, the workstations constituting the distributed processing system each perform a predetermined process according to an application program, but the workstation in a state in which the application program is operating and executing the process is a work system. An application program that is actually running on the station 10 and the working workstation 10 is called a working application 20. A workstation in a state where the application program is not running and processing is not executed is called a standby system workstation 30, and an application program in standby of the standby system workstation 30 is called a standby system application 40. Working workstation 10 and standby workstation 3
0, and the operating system application 20 and the standby system application 40 are structurally the same, and when focusing on an arbitrary workstation and application, there is a difference in whether or not the application is in the operating state. Only. Therefore, if it is not necessary to distinguish between the active system and the standby system, the workstation 1
It is expressed as 0, 30, and applications 20, 40.

【0015】本実施例の分散処理システムを構成するワ
ークステーション10、30は、所定のデータを格納す
るファイル11と、ファイル11の状態に関する情報を
格納するファイル状態ファイル12と、ファイル11に
アクセスするファイルアクセス手段13と、ファイル状
態ファイル12の情報を更新するファイル状態更新手段
14と、障害のあるファイル11を復旧するファイル復
旧手段15と、データ処理を行なうためのアプリケーシ
ョン20、40とを備える。また、本実施例の稼働系ア
プリケーション20は、ファイル11の状態に関する情
報を格納するファイル管理テーブル21を作成して稼働
系ワークステーション10のメモリ上に保有する。
The workstations 10 and 30 constituting the distributed processing system of this embodiment access the file 11 storing predetermined data, the file status file 12 storing information on the status of the file 11, and the file 11. It comprises a file access means 13, a file status updating means 14 for updating the information of the file status file 12, a file recovery means 15 for recovering the faulty file 11, and applications 20, 40 for performing data processing. In addition, the operating system application 20 of the present embodiment creates a file management table 21 that stores information regarding the state of the file 11 and retains it in the memory of the operating system workstation 10.

【0016】アプリケーション20、40は種々の目的
に応じてデータの演算処理を行なう。そして、必要に応
じてファイルアクセス手段13を介してファイル11に
アクセスし、必用なデータを読み込み、処理後のデータ
の保存を行なう。本実施例では、稼働系アプリケーショ
ン20は、ファイル管理テーブル21を作成する。図2
にファイル管理テーブル21の構成例を示す。ファイル
管理テーブル21には、図示のように、正系のファイル
11を格納するワークステーション10、30と副系の
ファイル11を格納するワークステーション10、30
とを識別するためのワークステーション名と、各ファイ
ル11ごとに正系と副系の別及びファイル11の状態が
正常かあるいは障害を有しているかを示す情報とを格納
する。ファイルの正系及び副系については後述する。
The applications 20 and 40 perform arithmetic processing of data according to various purposes. Then, if necessary, the file 11 is accessed through the file access unit 13, necessary data is read, and the processed data is stored. In this embodiment, the operating system application 20 creates the file management table 21. Figure 2
An example of the structure of the file management table 21 is shown in FIG. As shown in the figure, the file management table 21 includes workstations 10 and 30 for storing primary system files 11 and workstations 10 and 30 for storing secondary system files 11.
It stores a workstation name for identifying each of the files 11 and information indicating whether each file 11 is a primary system or a secondary system and the state of the file 11 is normal or faulty. The primary system and the secondary system of the file will be described later.

【0017】ファイル11は、本実施例の分散処理シス
テムにて処理を行なう種々のデータを格納する。本実施
例の分散処理システムは複数のワークステーション間で
ファイルが重複することを許しており、本実施例では、
同一のデータを格納した同一のファイル11が2つ作成
され(二重化)、2ヶ所のワークステーション10、3
0にて管理されている。
The file 11 stores various data to be processed by the distributed processing system of this embodiment. The distributed processing system of this embodiment allows files to be duplicated among a plurality of workstations.
Two identical files 11 storing the same data are created (duplication), two workstations 10, 3
It is managed at 0.

【0018】ファイル状態ファイル12は、ワークステ
ーション10、30にて管理される全てのファイル11
の状態に関する情報を格納する。図3にファイル情報フ
ァイル12のデータ構成例を示す。ファイル状態ファイ
ル12には、図示のように、バージョンを示すための当
該情報の記録日時の他、ファイル管理テーブル21と同
様に、正系ファイル11を格納するワークステーション
10、30及び副系ファイル11を格納するワークステ
ーション10、30のワークステーション名と、各ファ
イル11ごとに正系と副系の別及びファイル11の状態
が正常かあるいは障害を有しているかを示す情報とを格
納する。
The file status file 12 is all the files 11 managed by the workstations 10 and 30.
Stores information about the state of. FIG. 3 shows an example of the data structure of the file information file 12. As shown in the figure, the file status file 12 includes the recording date and time of the information for indicating the version, the workstations 10 and 30 for storing the primary file 11, and the secondary file 11 as with the file management table 21. It stores the workstation names of the workstations 10 and 30 that store the information, and the information indicating whether each file 11 is a primary system or a secondary system and the state of the file 11 is normal or faulty.

【0019】ここで、上述したファイル管理テーブル2
1及びファイル状態ファイル12におけるファイル11
の正系及び副系とは、ファイル11と当該ファイル11
が格納されているワークステーション10、30との関
係を示す。すなわち、当該ファイル11が当該ファイル
状態ファイル12と同じワークステーション10、30
に格納されているときは当該ファイル11を正系と称
し、異なるワークステーション10、30に格納されて
いるときは当該ファイル11を副系と称する。また、フ
ァイル管理テーブル21及びファイル状態ファイル12
には、ファイル状態ファイル12自体の状態についての
情報も格納されている。したがって、ファイル状態ファ
イル12は、特に明示しない限りファイル11に含まれ
る。なお、ファイル11に格納される記録日時はファイ
ル11のバージョンを示すものであり、必ずしも記録日
時でなくてもよく、バージョンナンバー等でもよい。ま
た、ワークステーション名もワークステーションの識別
が可能な適当な識別子で代用することもできる。
Here, the above-mentioned file management table 2
1 and the file 11 in the file status file 12
The primary system and the secondary system of the file 11 are the file 11 and the file 11
Shows the relationship with the workstations 10 and 30 in which is stored. That is, the file 11 is the same workstation 10 or 30 as the file status file 12.
The file 11 is referred to as the primary system when it is stored in the sub-system, and the file 11 is referred to as the secondary system when stored in different workstations 10 and 30. In addition, the file management table 21 and the file status file 12
Stores information about the status of the file status file 12 itself. Therefore, the file status file 12 is included in the file 11 unless otherwise specified. The recording date and time stored in the file 11 indicates the version of the file 11, and may not necessarily be the recording date and time, but may be a version number or the like. Also, the workstation name can be substituted by an appropriate identifier that can identify the workstation.

【0020】ファイルアクセス手段13は、稼働系アプ
リケーション20よりファイル11へのアクセス要求を
受けた場合に、メモリ上のファイル管理テーブル21を
検索し、該当するファイル11にアクセスを行う。この
ときアクセスするファイル11はアクセス要求に該当す
るファイル11の全てである。すなわち、アクセス要求
に該当するものであれば、稼働系ワークステーション1
0に格納されている正系ファイル11と待機系ワークス
テーション30に格納されている副系ファイル11の双
方にアクセスする。ただし、ファイル管理テーブル21
を参照した結果障害のあるファイル11を検索したとき
は、正常なファイル11にのみアクセスする。また、フ
ァイルアクセス手段13は、所定のファイル11にアク
セスしている際に当該ファイル11に障害が発生した場
合、ファイル状態更新手段14に当該ファイル11の状
態に関する情報の更新要求を出力する。
When the file access means 13 receives an access request to the file 11 from the operating system application 20, the file access means 13 searches the file management table 21 on the memory and accesses the corresponding file 11. The files 11 accessed at this time are all the files 11 corresponding to the access request. That is, if it corresponds to the access request, the working workstation 1
Both the primary file 11 stored in 0 and the secondary file 11 stored in the standby workstation 30 are accessed. However, the file management table 21
When a file 11 having a failure is searched as a result of referring to, only the normal file 11 is accessed. Further, the file access unit 13 outputs an update request of information regarding the state of the file 11 to the file state update unit 14 when a failure occurs in the file 11 while accessing the predetermined file 11.

【0021】ファイル状態更新手段14は、ファイル1
1に障害が発生した場合、及び障害のあったファイル1
1がファイル復旧手段15によって復旧した場合に、フ
ァイル状態ファイル12とファイル管理テーブル21に
それぞれ管理されている該当ファイル11の状態に関す
る情報を更新する。特に、ファイルアクセス手段13の
ファイル11へのアクセス中に当該ファイル11に障害
が発生したときは、ファイルアクセス手段13からのフ
ァイル更新要求を受け、この要求にしたがってファイル
状態ファイル12及びファイル管理テーブル21の情報
を更新する。これによって、ファイル状態ファイル12
及びファイル管理テーブル21には、当該ファイル状態
ファイル12自体に障害が発生している場合を除き、常
に全ファイル11の状態に関する最新の情報が格納され
る。
The file status updating means 14 uses the file 1
When a failure occurs in 1 and the failed file 1
When 1 is recovered by the file recovery means 15, the information on the status of the file status file 12 and the corresponding file 11 managed in the file management table 21 is updated. In particular, when a failure occurs in the file 11 while the file access unit 13 is accessing the file 11, a file update request is received from the file access unit 13, and the file status file 12 and the file management table 21 are received in accordance with this request. Update information on. This allows the file status file 12
The file management table 21 always stores the latest information regarding the status of all the files 11 except when a failure has occurred in the file status file 12 itself.

【0022】ファイル復旧手段15は、予め設定された
所定のタイミングで当該ワークステーション10、30
における障害のあるファイル11の復旧を行なう。ファ
イル11の復旧は、他のワークステーション10、30
において二重化された正常なファイル11をコピーする
ことによって行なう。ここで、ファイル復旧手段15が
障害のあるファイル11を検索するには、ファイル管理
テーブル21またはファイル状態ファイル12を参照す
ることが必要である。このため、当該ファイル復旧手段
15を備えるワークステーション10、30が、稼働系
ワークステーション10であるか待機系ワークステーシ
ョン30であるかによって、障害のあるファイル11の
検索方法が異なることとなる。
The file restoration means 15 is adapted to the workstations 10 and 30 at a predetermined timing set in advance.
Then, the file 11 having the fault in the above is restored. The recovery of the file 11 is performed by the other workstations 10 and 30.
In step 1), the duplicated normal file 11 is copied. Here, in order for the file restoration means 15 to search for the file 11 having a failure, it is necessary to refer to the file management table 21 or the file status file 12. Therefore, the method of searching for a faulty file 11 differs depending on whether the workstation 10, 30 including the file restoration means 15 is the active workstation 10 or the standby workstation 30.

【0023】まず、稼働系ワークステーション10のフ
ァイル復旧手段15の場合、稼働系ワークステーション
10のメモリ上には稼働系アプリケーション20によっ
て作成されたファイル管理テーブル21があるため、フ
ァイル復旧手段15はこのファイル管理テーブル21を
参照して障害のあるファイル11を検索する。一方、待
機系ワークステーション30のファイル復旧手段15の
場合、ファイル管理テーブル21は作成されていないた
め、ファイル復旧手段15はファイル状態ファイル12
を参照して障害のあるファイル11を検索する。しか
し、ファイル状態ファイル12自体に障害が発生してい
る場合、当該待機系ワークステーション30のファイル
状態ファイル12のみを参照しても正常な情報が得られ
ない。そこで、ファイル復旧手段15は、当該待機系ワ
ークステーション30のファイル状態ファイル12と他
のワークステーション10、30において二重化された
ファイル状態ファイル12とを比較し、最も新しいファ
イル状態ファイル12を参照して障害のあるファイル1
1を検索する。
First, in the case of the file recovery means 15 of the active workstation 10, since the file management table 21 created by the active application 20 is on the memory of the active workstation 10, the file recovery means 15 uses this. The file management table 21 is referred to search for the file 11 having a failure. On the other hand, in the case of the file recovery means 15 of the standby workstation 30, since the file management table 21 is not created, the file recovery means 15 uses the file status file 12
The file 11 having the fault is searched by referring to. However, when the file status file 12 itself has a failure, normal information cannot be obtained by referring to only the file status file 12 of the standby workstation 30. Therefore, the file restoring means 15 compares the file status file 12 of the standby system workstation 30 with the file status file 12 duplicated in the other workstations 10, 30 and refers to the newest file status file 12. Faulty file 1
Search for 1.

【0024】なお、ファイル復旧手段15が障害のある
ファイル11を復旧するタイミングは、ワークステーシ
ョン10、30の起動時または動作終了時、あるいはワ
ークステーション10、30の動作中に定期的に行うこ
とができるが、稼働系アプリケーション20によってフ
ァイル管理テーブル21が作成されること、ワークステ
ーション10、30の動作中は処理に応じてファイル1
1のデータが更新されること等を考慮すると、ワークス
テーション10、30の動作終了時に行なうのが好まし
い。
The file recovery means 15 can recover the faulty file 11 at the time of starting up or ending the operation of the workstations 10, 30 or periodically during the operation of the workstations 10, 30. However, the file management table 21 is created by the operating system application 20, and the file 1 is processed according to the processing while the workstations 10 and 30 are operating.
Considering that the data of No. 1 is updated, etc., it is preferable to do it at the end of the operation of the workstations 10, 30.

【0025】次に、図4を用いてファイル11へのアク
セス中にファイル11に障害が発生した時のファイル状
態更新動作について説明する。初期状態として、稼働系
ワークステーション10において稼働系アプリケーショ
ン20が稼働しているものとする(ステップ401)。
Next, the operation of updating the file status when a failure occurs in the file 11 while accessing the file 11 will be described with reference to FIG. As an initial state, it is assumed that the working application 20 is running in the working workstation 10 (step 401).

【0026】稼働系アプリケーション20が、ファイル
アクセス手段13に対してファイルァクセス要求を出す
と(ステップ402)、ファイルアクセス手段13は、
ファイル管理テーブル21を参照して、二重化された2
つの同一ファイル11のうち、ファイル状態が正常なフ
ァイル11にアクセスを行う。(ステップ403)。な
お、二重化された同一ファイル11のファイル状態が何
れも正常である場合には、正系ファイルを優先する等の
適当な手段でアクセスするファイル11を決定する。
When the operating system application 20 issues a file access request to the file access means 13 (step 402), the file access means 13
Refer to the file management table 21 and duplicate
Of the two identical files 11, the file 11 whose file status is normal is accessed. (Step 403). When the file states of the duplicated same file 11 are all normal, the file 11 to be accessed is determined by an appropriate means such as giving priority to the normal system file.

【0027】かかるファイルアクセス時に、アクセス中
のファイル11に障害が発生すると、ファイルアクセス
手段13は、ファイル状態更新手段14に対してファイ
ル更新要求を出す(ステップ404)。ファイル状態更
新手段14は、ファイル更新要求を受けると、メモリ上
のファイル管理テーブル21にアクセスし、障害の発生
したファイル11のファイル状態に関する情報を更新す
る(ステップ405)。また、これと同時に、二重化さ
れたファイル状態ファイル12のそれぞれにアクセス
し、ファイル管理テーブル21の内容及び記録日時を書
き込む。
If a failure occurs in the file 11 being accessed during the file access, the file access means 13 issues a file update request to the file status update means 14 (step 404). Upon receiving the file update request, the file status updating means 14 accesses the file management table 21 on the memory and updates the information on the file status of the file 11 in which the failure has occurred (step 405). At the same time, each of the duplicated file status files 12 is accessed to write the contents and recording date and time of the file management table 21.

【0028】次に、図5及び図6を用いて、ワークステ
ーション10、30の動作終了時における障害のあるフ
ァイル11の復旧動作について説明する。まず、図5を
参照して稼働系ワークステーション10におけるファイ
ル11の復旧動作について説明する。初期状態として、
稼働系ワークステーション10において稼働系アプリケ
ーション20が起動しているものとする(ステップ50
1)。
Next, the recovery operation of the faulty file 11 at the end of the operation of the workstations 10 and 30 will be described with reference to FIGS. First, the recovery operation of the file 11 in the working workstation 10 will be described with reference to FIG. As an initial state,
It is assumed that the operating system application 20 is running on the operating system workstation 10 (step 50).
1).

【0029】稼働系アプリケーション20は、稼働系ワ
ークステーション10の動作終了時に、ファイル復旧手
段15に対してファイル復旧要求を出す(ステップ50
2)。ファイル復旧手段15は、ファイル復旧要求を受
けると、メモリ上のファイル管理テーブル21の内容を
参照してファイル11の状態を検査し、当該稼働系ワー
クステーション10に障害の発生したファイルがある場
合、他の待機系ワークステーション30から二重化され
た正常な同一ファイル11をコピーする(ステップ50
3、504)。これにより、ファイル11の復旧が完了
する。
The operating system application 20 issues a file recovery request to the file recovering means 15 when the operation of the operating system workstation 10 is completed (step 50).
2). Upon receiving the file restoration request, the file restoration means 15 refers to the contents of the file management table 21 in the memory to check the state of the file 11, and if there is a faulty file in the working workstation 10, The normal duplicated identical file 11 is copied from the other standby workstation 30 (step 50).
3, 504). This completes the restoration of the file 11.

【0030】次に、図6を参照して待機系ワークステー
ション20におけるファイル11の復旧動作について説
明する。初期状態として、待機系ワークステーション3
0においては待機系アプリケーション40が動作命令の
入力待ちの状態となっている(ステップ601)。
Next, the recovery operation of the file 11 in the standby workstation 20 will be described with reference to FIG. In the initial state, the standby workstation 3
At 0, the standby application 40 is in a state of waiting for the input of an operation command (step 601).

【0031】待機系アプリケーション40は、待機系ワ
ークステーション30の動作終了時に、ファイル復旧手
段15に対してファイル復旧要求を出す(ステップ60
2)。ファイル復旧手段15は、ファイル復旧要求を受
けると、当該待機系ワークステーション30のファイル
状態ファイル12の記録日時と他のワークステーション
10、30の二重化されたファイル状態ファイル12の
記録日時とを比較し、記録日時の新しい方を正常なファ
イル状態ファイル12とみなし、そのファイル状態ファ
イル12を参照してファイル11の状態を検査する(ス
テップ603)。そして、当該待機系ワークステーショ
ン30に障害の発生したファイルがある場合、他のワー
クステーション10、30から二重化された正常な同一
ファイル11をコピーする(ステップ604、60
5)。これにより、ファイル11の復旧が完了する。
The standby system application 40 issues a file recovery request to the file recovery means 15 at the end of the operation of the standby system workstation 30 (step 60).
2). Upon receiving the file restoration request, the file restoration means 15 compares the recording date and time of the file status file 12 of the standby workstation 30 with the recording date and time of the duplicated file status file 12 of the other workstations 10 and 30. The file having the newest recording date and time is regarded as the normal file status file 12, and the status of the file 11 is checked by referring to the file status file 12 (step 603). If the standby workstation 30 has a failed file, the duplicate normal file 11 is copied from the other workstations 10 and 30 (steps 604 and 60).
5). This completes the restoration of the file 11.

【0032】以上好ましい実施例をあげて本発明を説明
したが、本発明は必ずしも上記実施例に限定されるもの
ではない。例えば、本実施例ではファイルを二重化し、
同一ファイルを2つ作成することとしたが、本発明によ
りファイルの復旧を行なうには分散処理システム中に同
一ファイルが重複していればよく、2つ以上のファイル
を作成して管理してもよい。この場合、ファイルの識別
は、正系ファイルと副系ファイルのみならず、第3のフ
ァイル以降のファイルも識別できるようにする必要があ
る。
Although the present invention has been described above with reference to the preferred embodiments, the present invention is not necessarily limited to the above embodiments. For example, in this embodiment, the files are duplicated,
Although it has been decided to create two identical files, in order to recover the files according to the present invention, it is sufficient that the same files are duplicated in the distributed processing system, and even if two or more files are created and managed. Good. In this case, it is necessary to identify the files so that not only the primary file and the secondary file but also the third and subsequent files can be identified.

【0033】また、本実施例では、稼働系アプリケーシ
ョンがファイル管理テーブルを作成し、稼働系ワークス
テーションにおける障害ファイルの復旧の際に利用する
こととしたが、必ずしもファイル管理テーブルを利用す
る必要はなく、待機系ワークステーションの場合と同様
に、ファイル状態ファイルを利用してファイルの復旧を
行なうようにしてもよい。
Further, in the present embodiment, the operating system application creates the file management table and uses it when recovering the faulty file in the operating system workstation, but it is not always necessary to use the file management table. As with the standby workstation, the file status file may be used to restore the file.

【0034】さらに、本実施例では稼働系アプリケーシ
ョンからのアクセス要求に対して、ファイルアクセス手
段は、二重化した該当ファイルの全てをアクセスの対象
としたが稼働系ワークステーションに格納されたファイ
ルのみをアクセス対象とするようにしてもよい。
Further, in this embodiment, in response to the access request from the operating system application, the file access means targets all the duplicated corresponding files, but accesses only the files stored in the operating system workstation. You may make it a target.

【0035】[0035]

【発明の効果】以上説明したように、本発明の分散処理
システムにおけるファイルの障害復旧方式によれば、ア
プリケーションプログラムからの要求にしたがって、自
動的に障害の発生したファイルを発見し、正常な状態に
復旧させることができるため、ファイルの復旧に要する
手間を削減し、速やかにファイルを復旧することができ
るという効果がある。
As described above, according to the file failure recovery method in the distributed processing system of the present invention, the file in which the failure has occurred is automatically detected in accordance with the request from the application program, and the normal state is obtained. Since there is no need to restore the file, it is possible to reduce the time and effort required to restore the file and to quickly restore the file.

【0036】また、アプリケーションプログラムが稼働
中にファイル管理テーブルを作成し、ファイル復旧手段
がファイルの復旧の際に該ファイル管理テーブルを参照
することにより、ファイルの復旧の処理を一層簡単化す
ることができるという効果がある。
Further, the file recovery table can be further simplified by creating a file management table while the application program is operating and referring to the file management table when the file recovery means recovers the file. The effect is that you can do it.

【0037】さらに、本発明は、ファイルアクセス手段
が、重複したファイルのうち、障害のない正常なファイ
ルを選択してアクセスすることにより、アクセス対象で
あるファイルに障害が発生している場合でも処理を継続
することができるという効果がある。
Further, according to the present invention, the file access means selects a normal file having no trouble from the duplicated files and accesses the file, thereby processing even if the file to be accessed has a trouble. There is an effect that can be continued.

【図面の簡単な説明】[Brief description of drawings]

【図1】 本発明の一実施例に係るファイルの障害復旧
方式を実現する分散処理システムの構成を示すブロック
図である。
FIG. 1 is a block diagram showing a configuration of a distributed processing system for realizing a file failure recovery system according to an embodiment of the present invention.

【図2】 図1のファイル管理テーブルの構成例を示す
図である。
FIG. 2 is a diagram showing a configuration example of a file management table in FIG.

【図3】 図1のファイル状態ファイルの構成例を示す
図である。
FIG. 3 is a diagram showing a configuration example of a file status file in FIG.

【図4】 図1のファイルアクセス手段及びファイル状
態更新手段による更新動作を示すフローチャートであ
る。
FIG. 4 is a flowchart showing an updating operation by the file access means and the file status updating means of FIG.

【図5】 図1の稼働系ワークステーションにおけるフ
ァイル復旧手段の動作を示すフローチャートである。
5 is a flowchart showing an operation of a file recovery means in the working workstation of FIG.

【図6】 図1の待機系ワークステーションにおけるフ
ァイル復旧手段の動作を示すフローチャートである。
FIG. 6 is a flowchart showing the operation of a file recovery means in the standby workstation of FIG.

【符号の説明】[Explanation of symbols]

10 稼働系ワークステーション 11 ファイル 12 ファイル状態ファイル 13 ファイルアクセス手段 14 ファイル状態更新手段 15 ファイル復旧手段 20 稼働系アプリケーション 21 ファイル管理テーブル 30 待機系ワークステーション 40 待機系アプリケーション 10 Working Workstations 11 Files 12 File Status Files 13 File Access Means 14 File Status Updating Means 15 File Restoring Means 20 Working Applications 21 File Management Tables 30 Standby Workstations 40 Standby Applications

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 複数のワークステーション間でファイル
を重複させて有する分散処理システムにおいて、 ファイルの状態に関する情報を格納して管理するファイ
ル状態管理手段と、 前記ファイル状態管理手段が管理するファイルを対象と
して、該ファイルに障害が発生した場合及び障害のある
ファイルが復旧した場合に前記ファイル状態管理手段に
管理されたファイルの状態に関する情報を更新するファ
イル状態更新手段と、 前記ファイル状態管理手段に管理されたファイルの状態
に関する情報を参照して障害のあるファイルを検索し、
該ファイルを復旧するファイル復旧手段とを備えること
を特徴とする分散処理システムにおけるファイルの障害
復旧方式。
1. In a distributed processing system in which files are duplicated among a plurality of workstations, a file status management unit that stores and manages information related to file status, and a file managed by the file status management unit are targets. As a file status update means for updating information on the status of a file managed by the file status management means when a failure occurs in the file and when the failed file is restored, and the file status management means manages the file status management means. Find the faulty file by looking at the information about the status of the deleted file,
A file failure recovery method in a distributed processing system, comprising: a file recovery means for recovering the file.
【請求項2】 前記ファイル状態管理手段が、稼働中の
アプリケーションプログラムによって作成されるファイ
ル管理テーブルと、各ワークステーションに常設された
ファイル状態ファイルとを備えることを特徴とする請求
項1に記載の分散処理システムにおけるファイルの障害
復旧方式。
2. The file status management means comprises a file management table created by an operating application program, and a file status file permanently installed in each workstation. A failure recovery method for files in a distributed processing system.
【請求項3】 前記ファイル復旧手段が、 稼働中のアプリケーションプログラムからファイル復旧
要求を受けた場合は、前記ファイル管理テーブルを参照
し、他のワークステーションに格納された正常な同一の
ファイルからデータをコピーして障害のあるファイルを
復旧し、 待機中のアプリケーションプログラムからファイル復旧
要求を受けた場合は、少なくとも2つのファイル状態フ
ァイルを比較し、最新のファイル状態ファイルを選択し
て参照し、他のワークステーションに格納された正常な
同一のファイルからデータをコピーして障害のあるファ
イルを復旧することを特徴とする請求項2に記載の分散
処理システムにおけるファイルの障害復旧方式。
3. When the file recovery means receives a file recovery request from an operating application program, it refers to the file management table and retrieves data from a normal identical file stored in another workstation. When a file with a failure is copied and restored, and a file recovery request is received from a waiting application program, at least two file status files are compared, the latest file status file is selected and referenced, and another file status file is selected. 3. The file failure recovery method in the distributed processing system according to claim 2, wherein data is copied from a normal identical file stored in the workstation to recover the failed file.
【請求項4】 複数のワークステーション間でファイル
を重複させて有する分散処理システムにおいて、 ファイルの状態に関する情報を格納して管理するファイ
ル状態管理手段と、 アプリケーションプログラムからのアクセス要求を受け
た場合に、前記ファイル状態管理手段位管理されたファ
イルの状態に関する情報を参照して、重複した全てのフ
ァイルの状態が正常であるときは任意のファイルにアク
セスし、重複したファイルの中に障害のあるファイルが
あるときは正常なファイルを選択してアクセスするファ
イルアクセス手段と、 前記ファイル状態管理手段が管理するファイルを対象と
して、該ファイルに障害が発生した場合及び障害のある
ファイルが復旧した場合に前記ファイル状態管理手段に
管理されたファイルの状態に関する情報を更新するファ
イル状態更新手段と、 前記ファイル状態管理手段に管理されたファイルの状態
に関する情報を参照して障害のあるファイルを検索し、
該ファイルを復旧するファイル復旧手段とを備えること
を特徴とする分散処理システムにおけるファイルの障害
復旧方式。
4. A distributed processing system in which files are duplicated among a plurality of workstations, and a file status management means for storing and managing information on the status of files and an access request from an application program are received. , The file status management means, referring to the information about the status of the managed files, when the status of all the duplicated files is normal, an arbitrary file is accessed, and the file having the failure in the duplicated files is accessed. If there is a file, the file access means for selecting and accessing a normal file, and the file managed by the file status management means are targeted when a failure occurs in the file and when the failed file is restored. Information on the status of files managed by the file status management means File status updating means for updating information, and searching for a file with a failure by referring to information relating to the status of files managed by the file status managing means,
A file failure recovery method in a distributed processing system, comprising: a file recovery means for recovering the file.
【請求項5】 前記ファイル状態管理手段が、稼働中の
アプリケーションプログラムによって作成されるファイ
ル管理テーブルと、各ワークステーションに常設された
ファイル状態ファイルとを備え、 前記ファイルアクセス手段が、前記ファイル管理テーブ
ルを参照して正常なファイルを検索することをを特徴と
する請求項4に記載の分散処理システムにおけるファイ
ルの障害復旧方式。
5. The file status management means comprises a file management table created by an operating application program, and a file status file permanently installed in each workstation, and the file access means comprises the file management table. 5. The file failure recovery method in the distributed processing system according to claim 4, wherein a normal file is searched by referring to.
【請求項6】 前記ファイル復旧手段が、 稼働中のアプリケーションプログラムからファイル復旧
要求を受けた場合は、前記ファイル管理テーブルを参照
し、他のワークステーションに格納された正常な同一の
ファイルからデータをコピーして障害のあるファイルを
復旧し、 待機中のアプリケーションプログラムからファイル復旧
要求を受けた場合は、少なくとも2つのファイル状態フ
ァイルを比較し、最新のファイル状態ファイルを選択し
て参照し、他のワークステーションに格納された正常な
同一のファイルからデータをコピーして障害のあるファ
イルを復旧することを特徴とする請求項5に記載の分散
処理システムにおけるファイルの障害復旧方式。
6. When the file recovery means receives a file recovery request from an operating application program, it refers to the file management table and retrieves data from the same normal file stored in another workstation. When a file with a failure is copied and restored, and a file recovery request is received from a waiting application program, at least two file status files are compared, the latest file status file is selected and referenced, and another file status file is selected. 6. The file failure recovery method for a distributed processing system according to claim 5, wherein data is copied from the same normal file stored in the workstation to recover the failed file.
JP6113544A 1994-04-30 1994-04-30 Failure recovery method for files in distributed processing system Expired - Lifetime JP2850756B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6113544A JP2850756B2 (en) 1994-04-30 1994-04-30 Failure recovery method for files in distributed processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6113544A JP2850756B2 (en) 1994-04-30 1994-04-30 Failure recovery method for files in distributed processing system

Publications (2)

Publication Number Publication Date
JPH07302217A true JPH07302217A (en) 1995-11-14
JP2850756B2 JP2850756B2 (en) 1999-01-27

Family

ID=14615009

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6113544A Expired - Lifetime JP2850756B2 (en) 1994-04-30 1994-04-30 Failure recovery method for files in distributed processing system

Country Status (1)

Country Link
JP (1) JP2850756B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09171479A (en) * 1995-12-19 1997-06-30 Nec Corp Data storage system

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63307558A (en) * 1987-06-10 1988-12-15 Hitachi Ltd Recovery control system for fault of multiplex volume
JPH03131943A (en) * 1989-10-18 1991-06-05 Nec Corp Fault managing system in file duplexing processing system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63307558A (en) * 1987-06-10 1988-12-15 Hitachi Ltd Recovery control system for fault of multiplex volume
JPH03131943A (en) * 1989-10-18 1991-06-05 Nec Corp Fault managing system in file duplexing processing system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09171479A (en) * 1995-12-19 1997-06-30 Nec Corp Data storage system

Also Published As

Publication number Publication date
JP2850756B2 (en) 1999-01-27

Similar Documents

Publication Publication Date Title
KR100983300B1 (en) Recovery from failures within data processing systems
US7107294B2 (en) Method and apparatus for interrupting updates to a database to provide read-only access
US7860836B1 (en) Method and apparatus to recover data in a continuous data protection environment using a journal
US7565572B2 (en) Method for rolling back from snapshot with log
JP5254611B2 (en) Metadata management for fixed content distributed data storage
RU2208834C2 (en) Method and system for recovery of database integrity in system of bitslice databases without resource sharing using shared virtual discs and automated data medium for them
US7882286B1 (en) Synchronizing volumes for replication
US7032089B1 (en) Replica synchronization using copy-on-read technique
US7779295B1 (en) Method and apparatus for creating and using persistent images of distributed shared memory segments and in-memory checkpoints
US6360330B1 (en) System and method for backing up data stored in multiple mirrors on a mass storage subsystem under control of a backup server
US5799323A (en) Remote duplicate databased facility with triple contingency protection
US9235606B1 (en) Simplified database/log backup and restore
US7840536B1 (en) Methods and apparatus for dynamic journal expansion
US7958372B1 (en) Method and apparatus to convert a logical unit from a first encryption state to a second encryption state using a journal in a continuous data protection environment
US7197632B2 (en) Storage system and cluster maintenance
CN100440155C (en) Method and apparatus for creating a virtual data copy
CN108416040B (en) Database repair method and device, terminal equipment and storage medium
US20120036394A1 (en) Data recovery method, data node, and distributed file system
US7761431B2 (en) Consolidating session information for a cluster of sessions in a coupled session environment
JP2005242403A (en) Computer system
US20060143510A1 (en) Fault management system in multistage copy configuration
JP3967499B2 (en) Restoring on a multicomputer system
JP2000099359A5 (en)
CN102708166A (en) Data replication method, data recovery method and data recovery device
JP2001344139A (en) Database management device