JP7164175B2 - DISTRIBUTED FILE DEVICE, FAILOVER METHOD, PROGRAM AND RECORDING MEDIUM - Google Patents

DISTRIBUTED FILE DEVICE, FAILOVER METHOD, PROGRAM AND RECORDING MEDIUM Download PDF

Info

Publication number
JP7164175B2
JP7164175B2 JP2018230768A JP2018230768A JP7164175B2 JP 7164175 B2 JP7164175 B2 JP 7164175B2 JP 2018230768 A JP2018230768 A JP 2018230768A JP 2018230768 A JP2018230768 A JP 2018230768A JP 7164175 B2 JP7164175 B2 JP 7164175B2
Authority
JP
Japan
Prior art keywords
data
control unit
storage unit
unreflected
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018230768A
Other languages
Japanese (ja)
Other versions
JP2020095322A (en
Inventor
平 竹本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solutions Innovators Ltd
Original Assignee
NEC Solutions Innovators Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Solutions Innovators Ltd filed Critical NEC Solutions Innovators Ltd
Priority to JP2018230768A priority Critical patent/JP7164175B2/en
Publication of JP2020095322A publication Critical patent/JP2020095322A/en
Application granted granted Critical
Publication of JP7164175B2 publication Critical patent/JP7164175B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Retry When Errors Occur (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、分散ファイル装置、フェイルオーバ方法、プログラム及び記録媒体に関する。 The present invention relates to a distributed file device, failover method, program and recording medium.

現用装置と待機装置(バックアップ装置)との分散ファイル装置におけるデータ管理には、同期コピーと非同期コピーの二つの方式がある。前記二つの方式のうち、同期コピーの方がバックアップとしては望ましい。しかしながら、同期コピーでは、同じ災害で現用装置及び待機装置の双方に影響が及ぶことのないように、両者が遠隔にある、例えば、地理的に離れた異なる都市にある場合には、処理に時間を要する。したがって、処理時間の短縮のためには、非同期コピーが好ましい(例えば、特許文献1参照)。 There are two methods of data management in a distributed file device between an active device and a standby device (backup device): synchronous copy and asynchronous copy. Of the two methods, synchronous copy is preferable as a backup. However, a synchronous copy takes time to process if both are remote, for example in different geographically separated cities, so that the same disaster does not affect both the working and standby devices. requires. Therefore, asynchronous copying is preferable for shortening the processing time (see, for example, Patent Document 1).

特開2018-136596号公報JP 2018-136596 A

しかしながら、非同期コピーには、障害発生によりアプリケーションの実行を現用装置から待機装置へと引き継ぐときに、現用装置から待機装置にコピーされたデータが、どの時点のものか明確でないという問題がある。 However, the asynchronous copy has a problem that when the execution of the application is handed over from the active device to the standby device due to the occurrence of a failure, it is not clear at what point in time the data copied from the active device to the standby device.

そこで、本発明は、現用装置から待機装置にコピーされたデータが、どの時点のものかが明確化された非同期コピーの分散ファイル装置及びそれを用いたフェイルオーバ方法を提供することを目的とする。 SUMMARY OF THE INVENTION Accordingly, it is an object of the present invention to provide an asynchronous copy distributed file device in which the point in time of data copied from an active device to a standby device is clarified, and a failover method using the distributed file device.

前記目的を達成するために、本発明の分散ファイル装置は、
アプリケーションを実行する第1装置と、
前記第1装置に障害が発生したときに前記アプリケーションの実行を引き継ぐ第2装置と、
を含み、
前記第1装置は、第1制御部、第1記憶部、及び、反映実行部、を含み、
前記第2装置は、第2制御部、未反映データ記憶部、及び、第2記憶部、を含み、
前記第1制御部及び前記第2制御部は、通信回線網を介して接続可能であり、
前記第1制御部は、前記アプリケーションの実行に関するデータに、前記第2装置に未反映であるとのフラグを立てて前記第1記憶部に登録し、かつ、前記データに送信時刻を付して前記第2制御部に送信し、
前記第2制御部は、前記送信時刻が付された前記データを、前記未反映データ記憶部に登録し、
前記反映実行部は、予め設定されたトリガー条件を満たしたとき、前記第2装置に未反映のデータの前記第2装置への反映を前記第2制御部に指示するように前記第1制御部に指示し、
前記指示を受けたとき、前記第1制御部は、前記未反映のデータの反映を、前記第2制御部に指示し、
前記指示を受けたとき、前記第2制御部は、前記未反映データ記憶部に登録された前記未反映のデータに付された前記送信時刻を、チェックポイント時刻に変更した後、前記データを前記第2記憶部に登録し、かつ、前記データの反映の完了信号を、前記第1制御部に送信し、
前記完了信号を受信したとき、前記第1制御部は、前記第2装置に未反映であるとのフラグを立てて前記第1記憶部に登録されたデータの前記フラグを倒す、装置である。
In order to achieve the above object, the distributed file device of the present invention
a first device executing an application;
a second device that takes over execution of the application when the first device fails;
including
The first device includes a first control unit, a first storage unit, and a reflection execution unit,
The second device includes a second control unit, an unreflected data storage unit, and a second storage unit,
The first control unit and the second control unit are connectable via a communication network,
The first control unit registers data related to execution of the application in the first storage unit with a flag indicating that the data has not been reflected in the second device, and adds a transmission time to the data. Send to the second control unit,
the second control unit registers the data to which the transmission time is attached in the unreflected data storage unit;
The reflection execution unit, when a preset trigger condition is satisfied, instructs the second control unit to reflect data that has not been reflected in the second device to the second device. to
When receiving the instruction, the first control unit instructs the second control unit to reflect the unreflected data;
Upon receiving the instruction, the second control unit changes the transmission time attached to the unreflected data registered in the unreflected data storage unit to the checkpoint time, and then transfers the data to the registering in the second storage unit, and transmitting a completion signal for reflecting the data to the first control unit;
The first control unit sets a flag indicating that the data has not been reflected in the second device and clears the flag of the data registered in the first storage unit when the completion signal is received.

本発明のフェイルオーバ方法は、
アプリケーションを実行する第1装置と、
前記第1装置に障害が発生したときに前記アプリケーションの実行を引き継ぐ第2装置と、
を含む分散ファイル装置を用い、
前記第1装置は、第1制御部、第1記憶部、及び、反映実行部、を含み、
前記第2装置は、第2制御部、未反映データ記憶部、及び、第2記憶部、を含み、
前記第1制御部及び前記第2制御部は、通信回線網を介して接続可能であり、
前記第1制御部が、前記アプリケーションの実行に関するデータに、前記第2装置に未反映であるとのフラグを立てて前記第1記憶部に登録し、かつ、前記データに送信時刻を付して前記第2制御部に送信する未反映データ処理工程と、
前記第2制御部が、前記送信時刻が付された前記データを、前記未反映データ記憶部に登録する未反映データ登録工程と、
前記反映実行部が、予め設定されたトリガー条件を満たしたとき、前記第2装置に未反映のデータの前記第2装置への反映を前記第2制御部に指示するように前記第1制御部に指示する第1反映指示工程と、
前記指示を受けたとき、前記第1制御部が、前記未反映のデータの反映を、前記第2制御部に指示する第2反映指示工程と、
前記指示を受けたとき、前記第2制御部が、前記未反映データ記憶部に登録された前記未反映のデータに付された前記送信時刻を、チェックポイント時刻に変更した後、前記データを前記第2記憶部に登録し、かつ、前記データの反映の完了信号を、前記第1制御部に送信する反映工程と、
前記完了信号を受信したとき、前記第1制御部が、前記第2装置に未反映であるとのフラグを立てて前記第1記憶部に登録されたデータの前記フラグを倒す登録工程と、
を含む、方法である。
The failover method of the present invention is
a first device executing an application;
a second device that takes over execution of the application when the first device fails;
using a distributed file device containing
The first device includes a first control unit, a first storage unit, and a reflection execution unit,
The second device includes a second control unit, an unreflected data storage unit, and a second storage unit,
The first control unit and the second control unit are connectable via a communication network,
The first control unit registers data related to execution of the application in the first storage unit with a flag indicating that the data has not been reflected in the second device, and adds a transmission time to the data. a non-reflected data processing step for transmitting to the second control unit;
an unreflected data registration step in which the second control unit registers the data to which the transmission time is attached in the unreflected data storage unit;
The first control unit, when the reflection execution unit satisfies a preset trigger condition, instructs the second control unit to reflect data that has not been reflected in the second device to the second device. a first reflection instruction step of instructing to
a second reflection instruction step in which, when receiving the instruction, the first control unit instructs the second control unit to reflect the unreflected data;
When receiving the instruction, the second control unit changes the transmission time attached to the unreflected data registered in the unreflected data storage unit to the checkpoint time, and then transfers the data to the a reflection step of registering the data in a second storage unit and transmitting a reflection completion signal of the data to the first control unit;
a registration step in which, when the completion signal is received, the first control unit raises a flag indicating that the data has not been reflected in the second device and clears the flag of the data registered in the first storage unit;
A method comprising:

本発明によれば、現用装置から待機装置にコピーされたデータが、どの時点のものかが明確化された非同期コピーの分散ファイル装置及びそれを用いたフェイルオーバ方法を提供可能となる。 According to the present invention, it is possible to provide an asynchronous copy distributed file device in which the point in time of data copied from an active device to a standby device is clarified, and a failover method using the distributed file device.

図1は、実施形態1の分散ファイル装置の一例の構成を示すブロック図である。FIG. 1 is a block diagram showing an example configuration of a distributed file device according to the first embodiment. 図2は、実施形態1の分散ファイル装置において、第1装置から第2装置へのデータの反映指示が出されていない定常状態におけるデータの流れの一例を示すブロック図である。FIG. 2 is a block diagram showing an example of data flow in a steady state in which the first device does not issue a data reflection instruction to the second device in the distributed file device of the first embodiment. 図3は、実施形態1の分散ファイル装置において、第1装置から第2装置へのデータの反映指示が出された状態におけるデータの流れの一例を示すブロック図である。FIG. 3 is a block diagram showing an example of data flow in the distributed file system according to the first embodiment in a state in which a data reflection instruction has been issued from the first device to the second device. 図4は、実施形態2の分散ファイル装置の一例の構成を示すブロック図である。FIG. 4 is a block diagram showing an example configuration of a distributed file device according to the second embodiment. 図5は、実施形態3の分散ファイル装置の一例の構成を示すブロック図である。FIG. 5 is a block diagram showing an example configuration of a distributed file device according to the third embodiment. 図6は、実施形態4の分散ファイル装置の一例の構成を示すブロック図である。FIG. 6 is a block diagram showing an example configuration of a distributed file device according to the fourth embodiment. 図7は、実施形態5の分散ファイル装置の一例の構成を示すブロック図である。FIG. 7 is a block diagram showing an example configuration of a distributed file device according to the fifth embodiment. 図8は、実施形態1の分散ファイル装置における第1装置のハードウエア構成の一例を示すブロック図である。8 is a block diagram showing an example of the hardware configuration of the first device in the distributed file system of the first embodiment; FIG. 図9は、実施形態1の分散ファイル装置における第2装置のハードウエア構成の一例を示すブロック図である。9 is a block diagram showing an example of a hardware configuration of a second device in the distributed file system of the first embodiment; FIG. 図10は、実施形態1から3の分散ファイル装置における処理の一例を示すフローチャートである。FIG. 10 is a flow chart showing an example of processing in the distributed file device according to the first to third embodiments. 図11は、実施形態4の分散ファイル装置における処理の一例を示すフローチャートである。FIG. 11 is a flow chart showing an example of processing in the distributed file system according to the fourth embodiment. 図12は、実施形態5の分散ファイル装置における処理の一例を示すフローチャートである。FIG. 12 is a flow chart showing an example of processing in the distributed file system according to the fifth embodiment. 図13は、実施形態5の分散ファイル装置における処理の別の例を示すフローチャートである。FIG. 13 is a flow chart showing another example of processing in the distributed file system of the fifth embodiment.

本発明において、例えば、第1装置が、現用装置であり、第2装置が、待機装置(バックアップ装置)であってもよい。 In the present invention, for example, the first device may be the active device and the second device may be the standby device (backup device).

本発明において、「フェイルオーバ」とは、例えば、障害が発生した第1装置(現用装置)でのアプリケーションの実行を、第2装置(待機装置)が引き継ぐことを言う。 In the present invention, "failover" means, for example, that the second device (standby device) takes over the execution of an application on the failed first device (active device).

本発明の分散ファイル装置及びフェイルオーバ方法は、前記予め設定されたトリガー条件が、所定時間の経過又は所定時刻の到来である、という態様であってもよい。 In the distributed file system and failover method of the present invention, the preset trigger condition may be elapse of a predetermined time or arrival of a predetermined time.

本発明の分散ファイル装置及びフェイルオーバ方法は、前記未反映データ記憶部が、データ量の閾値を有し、前記予め設定されたトリガー条件が、前記未反映データ記憶部に登録されたデータ量が前記閾値を超えたことである、という態様であってもよい。 In the distributed file system and the failover method of the present invention, the unreflected data storage unit has a data amount threshold, and the preset trigger condition is such that the amount of data registered in the unreflected data storage unit is It may be that the threshold value is exceeded.

本発明の分散ファイル装置及びフェイルオーバ方法は、前記予め設定されたトリガー条件が、前記アプリケーションから前記第1制御部にチェックポイント取得要求がされたことである、という態様であってもよい。 In the distributed file system and failover method of the present invention, the preset trigger condition may be that the application issues a checkpoint acquisition request to the first control unit.

本発明の分散ファイル装置は、前記未反映データ記憶部に登録された前記送信時刻が付された未反映のデータの一部又は全部をロストしたとき、前記第1制御部が、前記第2装置に未反映であるとのフラグを立てて前記第1記憶部に登録されたデータと、前記未反映データ記憶部に登録されたデータとの差分を、前記第2制御部に送信する、という態様であってもよい。本態様によれば、短時間で、前記未反映データ記憶部から前記未反映のデータがロストする前の状態に復旧することができる。 In the distributed file system of the present invention, when part or all of the unreflected data to which the transmission time is attached and which is registered in the unreflected data storage unit is lost, the first controller controls the second device and sending a difference between the data registered in the first storage unit and the data registered in the unreflected data storage unit to the second control unit. may be According to this aspect, it is possible to restore the state before the unreflected data is lost from the unreflected data storage unit in a short period of time.

本発明のフェイルオーバ方法は、前記未反映データ記憶部に登録された前記送信時刻が付された未反映のデータの一部又は全部をロストしたとき、前記第1制御部が、前記第2装置に未反映であるとのフラグを立てて前記第1記憶部に登録されたデータと、前記未反映データ記憶部に登録されたデータとの差分を、前記第2制御部に送信する差分送信工程を含んでもよい。 In the failover method of the present invention, when part or all of the unreflected data with the transmission time registered in the unreflected data storage unit is lost, the first control unit instructs the second device to a difference transmission step of transmitting to the second control unit the difference between the data registered in the first storage unit and the data registered in the unreflected data storage unit with a flag indicating that it is not reflected; may contain.

本発明の分散ファイル装置は、前記第1装置に障害が発生し、前記第2装置が前記アプリケーションの実行を引き継いだとき、前記第2制御部が、下記条件1及び下記条件2のいずれかを選択する、という態様であってもよい。
(条件1)
前記第2記憶部に登録された前記チェックポイント時刻が付された反映済みのデータのみを、前記アプリケーションの実行に使用する。
(条件2)
前記第2記憶部に登録された前記チェックポイント時刻が付された反映済みのデータと、前記未反映データ記憶部に登録された前記送信時刻が付された未反映のデータとを、前記アプリケーションの実行に使用する。
In the distributed file system of the present invention, when a failure occurs in the first device and the second device takes over the execution of the application, the second control unit satisfies either condition 1 or condition 2 below. It may be a mode of selecting.
(Condition 1)
Only the reflected data with the checkpoint time registered in the second storage unit is used for execution of the application.
(Condition 2)
The application stores the reflected data with the checkpoint time registered in the second storage unit and the unreflected data with the transmission time registered in the unreflected data storage unit. used for execution.

本発明のフェイルオーバ方法は、前記第1装置に障害が発生し、前記第2装置が前記アプリケーションの実行を引き継いだとき、前記第2制御部が、下記条件1及び下記条件2のいずれかを選択する選択工程を含んでもよい。
(条件1)
前記第2記憶部に登録された前記チェックポイント時刻が付された反映済みのデータのみを、前記アプリケーションの実行に使用する。
(条件2)
前記第2記憶部に登録された前記チェックポイント時刻が付された反映済みのデータと、前記未反映データ記憶部に登録された前記送信時刻が付された未反映のデータとを、前記アプリケーションの実行に使用する。
In the failover method of the present invention, when a failure occurs in the first device and the second device takes over execution of the application, the second control unit selects either condition 1 or condition 2 below. A selection step may be included.
(Condition 1)
Only the reflected data with the checkpoint time registered in the second storage unit is used for execution of the application.
(Condition 2)
The application stores the reflected data with the checkpoint time registered in the second storage unit and the unreflected data with the transmission time registered in the unreflected data storage unit. used for execution.

本発明の分散ファイル装置は、前記第2制御部が、前記条件1を選択したときに前記第2装置が前記アプリケーションを起動するまでに要する時間と、前記条件2を選択したときに前記第2装置が前記アプリケーションを起動するまでに要する時間とを予測する、という態様であってもよい。 In the distributed file system of the present invention, when the second control unit selects the condition 1, the time required for the second device to start the application, and when the condition 2 is selected, the second control unit It is also possible to predict the time required for the device to start the application.

本発明のフェイルオーバ方法は、前記第2制御部が、前記条件1を選択したときに前記第2装置が前記アプリケーションを起動するまでに要する時間と、前記条件2を選択したときに前記第2装置が前記アプリケーションを起動するまでに要する時間とを予測する予測工程を含んでもよい。 In the failover method of the present invention, the second control unit controls the time required for the second device to start the application when the condition 1 is selected, and the second device when the condition 2 is selected. to launch the application.

本発明のプログラムは、本発明のフェイルオーバ方法をコンピュータ上で実行可能なプログラムである。 A program of the present invention is a program capable of executing the failover method of the present invention on a computer.

本発明の記録媒体は、本発明のプログラムを記録しているコンピュータ読み取り可能な記録媒体である。 A recording medium of the present invention is a computer-readable recording medium recording the program of the present invention.

つぎに、本発明の実施形態について、図1から図13を用いて説明する。本発明は、下記の実施形態によって何ら限定及び制限されない。なお、図1から図13において、同一部分には、同一符号を付している。各実施形態における説明は、それぞれ、互いを援用できる。 Next, an embodiment of the present invention will be described with reference to FIGS. 1 to 13. FIG. The present invention is not limited or restricted by the following embodiments. In addition, in FIGS. 1 to 13, the same parts are denoted by the same reference numerals. The descriptions in each embodiment can be used with each other.

[実施形態1]
図1は、本実施形態の分散ファイル装置の一例の構成を示すブロック図である。図1に示すように、分散ファイル装置10は、アプリケーション20を実行する第1装置11と、第1装置11に障害が発生したときにアプリケーション20の実行を引き継ぐ第2装置12と、を含む。分散ファイル装置10において、例えば、第1装置11が、現用装置であり、第2装置12が、待機装置(バックアップ装置)であってもよい。第1装置11は、第1制御部11a、第1記憶部11b、及び、反映実行部11c、を含む。第2装置12は、第2制御部12a、未反映データ記憶部12b、及び、第2記憶部12c、を含む。第1制御部11a及び第2制御部12aは、通信回線網30を介して接続可能である。通信回線網30は、特に制限されず、公知のネットワークを使用でき、例えば、有線でも無線でもよい。通信回線網30は、例えば、インターネット回線、WWW(World Wide Web)、電話回線、LAN(Local Area Network)、WiFi(Wireless Fidelity)等が挙げられる。第1装置11及び第2装置12は、例えば、パーソナルコンピュータ(PC)であってもよい。
[Embodiment 1]
FIG. 1 is a block diagram showing the configuration of an example of a distributed file device according to this embodiment. As shown in FIG. 1, the distributed file system 10 includes a first device 11 that executes an application 20 and a second device 12 that takes over execution of the application 20 when the first device 11 fails. In the distributed file system 10, for example, the first device 11 may be the active device and the second device 12 may be the standby device (backup device). The first device 11 includes a first control unit 11a, a first storage unit 11b, and a reflection execution unit 11c. The second device 12 includes a second control section 12a, an unreflected data storage section 12b, and a second storage section 12c. The first control unit 11 a and the second control unit 12 a can be connected via a communication network 30 . The communication network 30 is not particularly limited, and a known network can be used. For example, it may be wired or wireless. The communication line network 30 includes, for example, the Internet line, WWW (World Wide Web), telephone line, LAN (Local Area Network), WiFi (Wireless Fidelity), and the like. The first device 11 and the second device 12 may be, for example, personal computers (PCs).

図8に、第1装置11のハードウエア構成のブロック図を例示する。第1装置11は、例えば、CPU(中央処理装置)111、メモリ112、記憶装置114、入力装置115、ディスプレイ116、通信デバイス117等を有する。第1装置11の各部は、バス113を介して、相互に接続されている。 FIG. 8 illustrates a block diagram of the hardware configuration of the first device 11. As shown in FIG. The first device 11 has, for example, a CPU (Central Processing Unit) 111, a memory 112, a storage device 114, an input device 115, a display 116, a communication device 117, and the like. Each unit of the first device 11 is interconnected via a bus 113 .

図9に、第2装置12のハードウエア構成のブロック図を例示する。第2装置12は、例えば、CPU(中央処理装置)121、メモリ122、記憶装置124、入力装置125、ディスプレイ126、通信デバイス127等を有する。第2装置12の各部は、バス123を介して、相互に接続されている。 FIG. 9 illustrates a block diagram of the hardware configuration of the second device 12. As shown in FIG. The second device 12 has, for example, a CPU (Central Processing Unit) 121, a memory 122, a storage device 124, an input device 125, a display 126, a communication device 127, and the like. Each part of the second device 12 is interconnected via a bus 123 .

CPU111は、第1装置11の全体の制御を担う。第1装置11において、CPU111により、例えば、本発明のプログラムやその他のプログラムが実行され、また、各種情報の読み込みや書き込みが行われる。具体的には、例えば、CPU111が、第1制御部11a、及び、反映実行部11cとして機能する。 The CPU 111 is responsible for overall control of the first device 11 . In the first device 11, the CPU 111 executes, for example, the program of the present invention and other programs, and reads and writes various information. Specifically, for example, the CPU 111 functions as the first control unit 11a and the reflection execution unit 11c.

CPU121は、第2装置12の全体の制御を担う。第2装置12において、CPU121により、例えば、本発明のプログラムやその他のプログラムが実行され、また、各種情報の読み込みや書き込みが行われる。具体的には、例えば、CPU121が、第2制御部12aとして機能する。 The CPU 121 is responsible for overall control of the second device 12 . In the second device 12, the CPU 121 executes, for example, the program of the present invention and other programs, and reads and writes various information. Specifically, for example, the CPU 121 functions as the second control unit 12a.

バス113は、例えば、外部機器とも接続できる。前記外部機器は、例えば、外部記憶装置(外部データベース等)、プリンター等が挙げられる。第1装置11は、例えば、バス113に接続された通信デバイス117により、通信回線網(図示せず)に接続でき、通信回線網を介して、前記外部機器と接続することもできる。同様に、バス123は、例えば、外部機器とも接続できる。前記外部機器は、例えば、外部記憶装置(外部データベース等)、プリンター等が挙げられる。第2装置12は、例えば、バス123に接続された通信デバイス127により、通信回線網(図示せず)に接続でき、通信回線網を介して、前記外部機器と接続することもできる。 The bus 113 can also be connected to external equipment, for example. Examples of the external device include an external storage device (external database, etc.), a printer, and the like. The first device 11 can be connected to a communication network (not shown), for example, by a communication device 117 connected to the bus 113, and can also be connected to the external device via the communication network. Similarly, the bus 123 can also be connected to external equipment, for example. Examples of the external device include an external storage device (external database, etc.), a printer, and the like. The second device 12 can be connected to a communication network (not shown), for example, by a communication device 127 connected to the bus 123, and can also be connected to the external device via the communication network.

メモリ112は、例えば、メインメモリを含み、前記メインメモリは、主記憶装置ともいう。CPU111が処理を行う際には、例えば、後述する記憶装置114に記憶されている本発明のプログラム等の種々の動作プログラムを、メモリ112が読み込み、CPU111は、メモリ112からデータを受け取って、プログラムを実行する。前記メインメモリは、例えば、RAM(ランダムアクセスメモリ)である。メモリ112は、例えば、さらに、ROM(読み出し専用メモリ)を含む。同様に、メモリ122は、例えば、メインメモリを含み、前記メインメモリは、主記憶装置ともいう。CPU121が処理を行う際には、例えば、後述する記憶装置124に記憶されている本発明のプログラム等の種々の動作プログラムを、メモリ122が読み込み、CPU121は、メモリ122からデータを受け取って、プログラムを実行する。前記メインメモリは、例えば、RAM(ランダムアクセスメモリ)である。メモリ122は、例えば、さらに、ROM(読み出し専用メモリ)を含む。 The memory 112 includes, for example, main memory, which is also referred to as main memory. When the CPU 111 performs processing, for example, the memory 112 reads various operating programs such as the program of the present invention stored in a storage device 114 to be described later, and the CPU 111 receives data from the memory 112 and processes the programs. to run. The main memory is, for example, RAM (random access memory). Memory 112, for example, further includes ROM (read only memory). Similarly, memory 122 includes, for example, main memory, which is also referred to as main memory. When the CPU 121 performs processing, for example, the memory 122 reads various operation programs such as the program of the present invention stored in a storage device 124 described later, and the CPU 121 receives data from the memory 122 and processes the programs. to run. The main memory is, for example, RAM (random access memory). Memory 122, for example, further includes ROM (read only memory).

記憶装置114は、例えば、前記メインメモリ(主記憶装置)に対して、いわゆる補助記憶装置ともいう。前述のように、記憶装置114には、本発明のプログラムを含む動作プログラムが格納されている。記憶装置114は、第1記憶部11bを含む。記憶装置114は、例えば、記憶媒体と、前記記憶媒体に読み書きするドライブとを含む。前記記憶媒体は、特に制限されず、例えば、内蔵型でも外付け型でもよく、HD(ハードディスク)、FD(フロッピー(登録商標)ディスク)、CD-ROM、CD-R、CD-RW、MO、DVD、フラッシュメモリー、メモリーカード等が挙げられ、前記ドライブは、特に制限されない。記憶装置114は、例えば、記憶媒体とドライブとが一体化されたハードディスクドライブ(HDD)であってもよい。 The storage device 114 is also called a so-called auxiliary storage device, for example, in contrast to the main memory (main storage device). As described above, the storage device 114 stores operating programs including the program of the present invention. The storage device 114 includes a first storage section 11b. Storage device 114 includes, for example, a storage medium and a drive that reads from and writes to the storage medium. The storage medium is not particularly limited, and may be, for example, a built-in type or an external type. Examples include DVD, flash memory, memory card, etc., and the drive is not particularly limited. The storage device 114 may be, for example, a hard disk drive (HDD) in which a storage medium and drive are integrated.

記憶装置124は、例えば、前記メインメモリ(主記憶装置)に対して、いわゆる補助記憶装置ともいう。前述のように、記憶装置124には、本発明のプログラムを含む動作プログラムが格納されている。記憶装置124は、未反映データ記憶部12b、及び、第2記憶部12cを含む。記憶装置124は、例えば、記憶媒体と、前記記憶媒体に読み書きするドライブとを含む。前記記憶媒体及び前記ドライブとしては、前述の記憶装置114におけるのと同様である。記憶装置124は、例えば、記憶媒体とドライブとが一体化されたハードディスクドライブ(HDD)であってもよい。 The storage device 124 is also called a so-called auxiliary storage device, for example, in contrast to the main memory (main storage device). As described above, the storage device 124 stores operating programs including the program of the present invention. The storage device 124 includes an unreflected data storage section 12b and a second storage section 12c. Storage device 124 includes, for example, a storage medium and a drive that reads from and writes to the storage medium. The storage medium and the drive are the same as in the storage device 114 described above. The storage device 124 may be, for example, a hard disk drive (HDD) in which a storage medium and drive are integrated.

第1装置11は、例えば、さらに、入力装置115、ディスプレイ116を有する。入力装置115は、例えば、タッチパネル、キーボード、マウス等である。ディスプレイ116は、例えば、LEDディスプレイ、液晶ディスプレイ等が挙げられる。同様に、第2装置12は、例えば、さらに、入力装置125、ディスプレイ126を有する。入力装置125は、例えば、タッチパネル、キーボード、マウス等である。ディスプレイ126は、例えば、LEDディスプレイ、液晶ディスプレイ等が挙げられる。 The first device 11 further has an input device 115 and a display 116, for example. The input device 115 is, for example, a touch panel, keyboard, mouse, or the like. Examples of the display 116 include an LED display and a liquid crystal display. Similarly, the second device 12 also has an input device 125 and a display 126, for example. The input device 125 is, for example, a touch panel, keyboard, mouse, or the like. The display 126 may be, for example, an LED display, a liquid crystal display, or the like.

第1装置11において、メモリ112及び記憶装置114は、ユーザーからのアクセス情報及びログ情報、並びに、外部データベース(図示せず)から取得した情報を記憶することも可能である。同様に、第2装置12において、メモリ122及び記憶装置124は、ユーザーからのアクセス情報及びログ情報、並びに、外部データベース(図示せず)から取得した情報を記憶することも可能である。 In the first device 11, the memory 112 and the storage device 114 can also store access information and log information from users, and information obtained from an external database (not shown). Similarly, in the second device 12, the memory 122 and storage device 124 can store access information and log information from users, as well as information obtained from an external database (not shown).

次に、分散ファイル装置10における処理の一例について説明する。 Next, an example of processing in the distributed file device 10 will be described.

まず、分散ファイル装置10において、第1装置11から第2装置12へのデータの反映指示が出されていない定常状態における処理の一例を、図2のブロック図及び図10のフローチャートに基づき説明する。 First, in the distributed file system 10, an example of processing in a steady state in which the first device 11 does not issue a data reflection instruction to the second device 12 will be described with reference to the block diagram of FIG. 2 and the flowchart of FIG. .

まず、第1制御部11aは、アプリケーション20の実行に関するデータを、第2装置12に未反映であるとのフラグを立てて(未反映データとして)第1記憶部11bに登録し、かつ、前記データに送信時刻を付して第2制御部12aに送信する(S1)。 First, the first control unit 11a registers data related to the execution of the application 20 in the first storage unit 11b with a flag indicating that it has not been reflected in the second device 12 (as unreflected data). The transmission time is attached to the data and transmitted to the second control unit 12a (S1).

次に、第2制御部12aは、前記送信時刻が付された前記データを、未反映データ記憶部12bに登録する(S2)。 Next, the second control unit 12a registers the data with the transmission time in the unreflected data storage unit 12b (S2).

次に、分散ファイル装置10において、第1装置11から第2装置12へのデータの反映指示が出された状態における処理の一例を、図3のブロック図及び図10のフローチャートに基づき説明する。 Next, in the distributed file system 10, an example of processing in a state in which the first device 11 issues a data reflection instruction to the second device 12 will be described with reference to the block diagram of FIG. 3 and the flowchart of FIG.

まず、反映実行部11cは、予め設定されたトリガー条件を満たしたとき、第2装置12に未反映のデータの第2装置12への反映を第2制御部12aに指示するように第1制御部11aに指示する(S3)。本実施形態によれば、予め設定されたトリガー条件を満たしたときに第2装置12へのデータの反映を指示する非同期コピーを採用しているため、例えば、第1装置11と第2装置12が遠隔にある場合でも、同期コピーよりも処理時間を短縮できる。本実施形態では、前記予め設定されたトリガー条件が、所定時間(例えば、12時間、24時間等)の経過であり、例えば、12時間毎、24時間毎等、定期的に、前記指示がなされる。また、本実施形態では、前記予め設定されたトリガー条件が、所定時刻(例えば、1:00、20:00)等であり、例えば、1:00、20:00等に、定期的に、前記指示がなされてもよい。 First, when a preset trigger condition is satisfied, the reflection execution unit 11c performs first control to instruct the second control unit 12a to reflect data that has not been reflected in the second device 12 to the second device 12. The part 11a is instructed (S3). According to the present embodiment, since asynchronous copying is employed in which an instruction to reflect data to the second device 12 is given when a preset trigger condition is satisfied, for example, the first device 11 and the second device 12 Even if the copy is remote, the processing time can be shortened compared to synchronous copy. In the present embodiment, the preset trigger condition is the elapse of a predetermined period of time (for example, 12 hours, 24 hours, etc.), and the instruction is given periodically, for example, every 12 hours, every 24 hours, etc. be. Further, in the present embodiment, the preset trigger condition is a predetermined time (for example, 1:00, 20:00), etc., for example, periodically at 1:00, 20:00, etc. Instructions may be given.

次に、前記指示を受けたとき、第1制御部11aは、前記未反映のデータの反映を、第2制御部12aに指示する(S4)。 Next, when receiving the instruction, the first control unit 11a instructs the second control unit 12a to reflect the unreflected data (S4).

次に、前記指示を受けたとき、第2制御部12aは、未反映データ記憶部12bに登録された前記未反映のデータに付された送信時刻を、チェックポイント時刻に変更した後、前記データを第2記憶部12cに登録し、かつ、前記データの反映の完了信号を、第1制御部11aに送信する(S5)。 Next, when receiving the instruction, the second control unit 12a changes the transmission time attached to the unreflected data registered in the unreflected data storage unit 12b to the checkpoint time, and then is registered in the second storage unit 12c, and a signal indicating completion of reflection of the data is transmitted to the first control unit 11a (S5).

次に、前記完了信号を受信したとき、第1制御部11aは、第2装置12に未反映であるとのフラグを立てて第1記憶部11bに登録されたデータの前記フラグを倒す(S6)。 Next, when the completion signal is received, the first control unit 11a raises a flag indicating that the data has not been reflected in the second device 12, and clears the flag of the data registered in the first storage unit 11b (S6). ).

本実施形態によれば、第2装置12に未反映のデータに送信時刻を付し、当該送信時刻を、第2装置12への反映時にチェックポイント時刻に変換した後、第2記憶部12cに登録することで、第1装置11から第2装置12にコピーされたデータが、どの時点のものかが明確化される。 According to this embodiment, the transmission time is added to the data that has not yet been reflected in the second device 12, and after the transmission time is converted to the checkpoint time when the data is reflected in the second device 12, the data is stored in the second storage unit 12c. By registering, it is clarified at what point in time the data copied from the first device 11 to the second device 12 is.

[実施形態2]
図4は、本実施形態の分散ファイル装置の一例の構成を示すブロック図である。図4に示すように、本実施形態の分散ファイル装置10は、未反映データ記憶部12bが、データ量の閾値を有し、前記予め設定されたトリガー条件が、未反映データ記憶部12bに登録されたデータ量が前記閾値を超えたことである点を除き、実施形態1の分散ファイル装置10と同様である。
[Embodiment 2]
FIG. 4 is a block diagram showing the configuration of an example of the distributed file device of this embodiment. As shown in FIG. 4, in the distributed file device 10 of the present embodiment, the unreflected data storage unit 12b has a data amount threshold, and the preset trigger condition is registered in the unreflected data storage unit 12b. This is the same as the distributed file device 10 of the first embodiment except that the amount of data processed exceeds the threshold.

次に、本実施形態の分散ファイル装置10における処理の一例を、図2から図4のブロック図及び図10のフローチャートに基づき説明する。 Next, an example of processing in the distributed file system 10 of this embodiment will be described with reference to the block diagrams of FIGS. 2 to 4 and the flowchart of FIG.

まず、実施形態1と同様にして、未反映データの処理及び登録を行う(S1及びS2)。 First, as in the first embodiment, processing and registration of unreflected data are performed (S1 and S2).

次に、反映実行部11cは、予め設定されたトリガー条件を満たしたとき、第2装置12に未反映のデータの第2装置12への反映を第2制御部12aに指示するように第1制御部11aに指示する(S3)。本実施形態では、未反映データ記憶部12bに登録された前記送信時刻が付されたデータの量が、前記閾値を超えたときに、反映実行部11cが、第2装置12に未反映のデータの第2装置12への反映を第2制御部12aに指示するように第1制御部11aに指示する。 Next, when a preset trigger condition is satisfied, the reflection execution unit 11c instructs the second control unit 12a to reflect the data that has not been reflected in the second device 12 to the second device 12. The controller 11a is instructed (S3). In this embodiment, when the amount of data with the transmission time registered in the unreflected data storage unit 12b exceeds the threshold value, the reflection executing unit 11c is instructed to the first control unit 11a to instruct the second control unit 12a to reflect to the second device 12.

次に、実施形態1と同様にして、第1制御部11aから第2制御部12aへの指示(S4)、反映(S5)、及び、登録(S6)を行う。 Next, as in the first embodiment, instructions (S4), reflection (S5), and registration (S6) are performed from the first control unit 11a to the second control unit 12a.

本実施形態によっても、実施形態1と同様に、同期コピーよりも処理時間を短縮できるとともに、第1装置11から第2装置12にコピーされたデータが、どの時点のものかが明確化される。 According to the present embodiment, as in the first embodiment, the processing time can be shortened compared to the synchronous copy, and the point in time of the data copied from the first device 11 to the second device 12 can be clarified. .

[実施形態3]
図5は、本実施形態の分散ファイル装置の一例の構成を示すブロック図である。図5に示すように、本実施形態の分散ファイル装置10は、前記予め設定されたトリガー条件が、アプリケーション20から第1制御部11aにチェックポイント取得要求がされたことである点を除き、実施形態1の分散ファイル装置10と同様である。
[Embodiment 3]
FIG. 5 is a block diagram showing the configuration of an example of the distributed file device of this embodiment. As shown in FIG. 5, the distributed file device 10 of the present embodiment is implemented except that the preset trigger condition is that the application 20 issues a checkpoint acquisition request to the first control unit 11a. It is the same as the distributed file device 10 of form 1.

次に、本実施形態の分散ファイル装置10における処理の一例を、図2、図3、図5のブロック図及び図10のフローチャートに基づき説明する。 Next, an example of processing in the distributed file system 10 of this embodiment will be described with reference to the block diagrams of FIGS. 2, 3 and 5 and the flowchart of FIG.

まず、実施形態1と同様にして、未反映データの処理及び登録を行う(S1及びS2)。 First, as in the first embodiment, processing and registration of unreflected data are performed (S1 and S2).

次に、反映実行部11cは、予め設定されたトリガー条件を満たしたとき、第2装置12に未反映のデータの第2装置12への反映を第2制御部12aに指示するように第1制御部11aに指示する(S3)。本実施形態では、アプリケーション20から第1制御部11aにチェックポイント取得要求がされたときに、反映実行部11cが、第2装置12に未反映のデータの第2装置12への反映を第2制御部12aに指示するように第1制御部11aに指示する。 Next, when a preset trigger condition is satisfied, the reflection execution unit 11c instructs the second control unit 12a to reflect the data that has not been reflected in the second device 12 to the second device 12. The controller 11a is instructed (S3). In this embodiment, when the application 20 issues a checkpoint acquisition request to the first control unit 11a, the reflection execution unit 11c causes the second device 12 to reflect the data that has not been reflected in the second device 12 to the second device 12. The first controller 11a is instructed to instruct the controller 12a.

次に、実施形態1と同様にして、第1制御部11aから第2制御部12aへの指示(S4)、反映(S5)、及び、登録(S6)を行う。 Next, as in the first embodiment, instructions (S4), reflection (S5), and registration (S6) are performed from the first control unit 11a to the second control unit 12a.

本実施形態によっても、実施形態1と同様に、同期コピーよりも処理時間を短縮できるとともに、第1装置11から第2装置12にコピーされたデータが、どの時点のものかが明確化される。 According to the present embodiment, as in the first embodiment, the processing time can be shortened compared to the synchronous copy, and the point in time of the data copied from the first device 11 to the second device 12 can be clarified. .

[実施形態4]
図6は、本実施形態の分散ファイル装置の一例の構成を示すブロック図である。図6に示すように、本実施形態の分散ファイル装置10は、未反映データ記憶部12bに登録された前記送信時刻が付された未反映のデータの一部又は全部をロストしたとき、第1制御部11aが、第2装置12に未反映であるとのフラグを立てて第1記憶部11bに登録されたデータと、未反映データ記憶部12bに登録されたデータとの差分を、第2制御部12aに送信する点を除き、実施形態1の分散ファイル装置10と同様である。
[Embodiment 4]
FIG. 6 is a block diagram showing the configuration of an example of the distributed file device of this embodiment. As shown in FIG. 6, the distributed file device 10 of the present embodiment loses part or all of the unreflected data to which the transmission time is attached, which is registered in the unreflected data storage unit 12b. The control unit 11a calculates the difference between the data registered in the first storage unit 11b with a flag indicating that it has not been reflected in the second device 12 and the data registered in the unreflected data storage unit 12b. It is the same as the distributed file device 10 of the first embodiment except that it is transmitted to the control unit 12a.

次に、本実施形態の分散ファイル装置10における処理の一例を、図2、図3、図6のブロック図及び図11のフローチャートに基づき説明する。 Next, an example of processing in the distributed file system 10 of this embodiment will be described with reference to the block diagrams of FIGS. 2, 3 and 6 and the flowchart of FIG.

まず、実施形態1と同様にして、未反映データの処理及び登録を行う(S1及びS2)。 First, as in the first embodiment, processing and registration of unreflected data are performed (S1 and S2).

次に、未反映データ記憶部12bに登録された前記送信時刻が付された未反映のデータの一部又は全部をロストしたとき、第1制御部11aが、第2装置12に未反映であるとのフラグを立てて第1記憶部11bに登録されたデータと、未反映データ記憶部12bに登録されたデータとの差分を、第2制御部12aに送信する(S7)。図11には、この差分送信工程(S7)を、未反映データの登録(S2)後に実施する例を示したが、前記差分の送信は、未反映データ記憶部12bに登録された前記送信時刻が付された未反映のデータの一部又は全部をロストしたときより後の任意のタイミングで実施してよい。 Next, when part or all of the unreflected data with the transmission time registered in the unreflected data storage unit 12b is lost, the first control unit 11a detects that the data has not been reflected in the second device 12. is set and the difference between the data registered in the first storage unit 11b and the data registered in the unreflected data storage unit 12b is transmitted to the second control unit 12a (S7). FIG. 11 shows an example in which this difference transmission step (S7) is performed after registration of unreflected data (S2). This may be performed at any timing after the loss of part or all of the unreflected data marked with .

次に、実施形態1と同様にして、反映実行部11cから第1制御部11aへの指示(S3)、第1制御部11aから第2制御部12aへの指示(S4)、反映(S5)、及び、登録(S6)を行う。本実施形態において、反映実行部11cから第1制御部11aへの指示(S3)は、実施形態2又は実施形態3と同様にして実施してもよい。 Next, in the same manner as in the first embodiment, an instruction from the reflection execution unit 11c to the first control unit 11a (S3), an instruction from the first control unit 11a to the second control unit 12a (S4), and a reflection (S5) , and registration (S6). In this embodiment, the instruction (S3) from the reflection execution unit 11c to the first control unit 11a may be performed in the same manner as in the second or third embodiment.

本実施形態によれば、短時間で、未反映データ記憶部12bから前記未反映のデータがロストする前の状態に復旧することができる。 According to this embodiment, it is possible to recover the state before the unreflected data is lost from the unreflected data storage unit 12b in a short time.

[実施形態5]
図7は、本実施形態の分散ファイル装置の一例の構成を示すブロック図である。図7に示すように、本実施形態の分散ファイル装置10は、第1装置11に障害が発生し、第2装置12がアプリケーション20の実行を引き継いだとき、第2制御部12aが、下記条件1及び下記条件2のいずれかを選択する点を除き、実施形態1の分散ファイル装置10と同様である。
(条件1)
第2記憶部12cに登録された前記チェックポイント時刻が付された反映済みのデータのみを、アプリケーション20の実行に使用する。
(条件2)
第2記憶部12cに登録された前記チェックポイント時刻が付された反映済みのデータと、未反映データ記憶部12bに登録された前記送信時刻が付された未反映のデータとを、アプリケーション20の実行に使用する。
[Embodiment 5]
FIG. 7 is a block diagram showing the configuration of an example of the distributed file device of this embodiment. As shown in FIG. 7, in the distributed file device 10 of this embodiment, when a failure occurs in the first device 11 and the second device 12 takes over the execution of the application 20, the second control unit 12a performs the following conditions: This is the same as the distributed file device 10 of the first embodiment except that either one of condition 1 and condition 2 below is selected.
(Condition 1)
Only the reflected data with the checkpoint time registered in the second storage unit 12c is used for the execution of the application 20. FIG.
(Condition 2)
The application 20 transfers the reflected data with the checkpoint time registered in the second storage unit 12c and the unreflected data with the transmission time registered in the unreflected data storage unit 12b. used for execution.

次に、本実施形態の分散ファイル装置10における処理の一例を、図2、図3、図7のブロック図及び図12のフローチャートに基づき説明する。 Next, an example of processing in the distributed file system 10 of this embodiment will be described with reference to the block diagrams of FIGS. 2, 3 and 7 and the flowchart of FIG.

まず、実施形態1と同様にして、未反映データの処理及び登録(S1及びS2)、反映実行部11cから第1制御部11aへの指示(S3)、第1制御部11aから第2制御部12aへの指示(S4)、反映(S5)、及び、登録(S6)を行う。本実施形態において、反映実行部11cから第1制御部11aへの指示(S3)は、実施形態2又は実施形態3と同様にして実施してもよい。また、本実施形態において、反映データ記憶部12bに登録された前記送信時刻が付された未反映のデータの一部又は全部をロストしたときは、それより後の任意のタイミングで、実施形態4の差分送信工程(S7)を実施してよい。 First, as in the first embodiment, processing and registration of unreflected data (S1 and S2), instructions from the reflection execution unit 11c to the first control unit 11a (S3), 12a (S4), reflected (S5), and registered (S6). In this embodiment, the instruction (S3) from the reflection execution unit 11c to the first control unit 11a may be performed in the same manner as in the second or third embodiment. Further, in this embodiment, when part or all of the unreflected data with the transmission time registered in the reflected data storage unit 12b is lost, at an arbitrary timing after that, in the fourth embodiment, , the difference transmission step (S7) may be carried out.

次に、第1装置11に障害が発生し、第2装置12がアプリケーション20の実行を引き継いだとき、第2制御部12aが、前記条件1及び前記条件2のいずれかを選択する(S8)。 Next, when a failure occurs in the first device 11 and the second device 12 takes over the execution of the application 20, the second control unit 12a selects either condition 1 or condition 2 (S8). .

本実施形態では、図13に例示するように、前記選択に先立ち、第2制御部12aが、前記条件1を選択したときに第2装置12がアプリケーション20を起動するまでに要する時間と、前記条件2を選択したときに第2装置12がアプリケーション20を起動するまでに要する時間とを予測してもよい(S9)。これにより、前記条件1及び前記条件2の両者の処理時間を参酌した上で、前記選択を行える。 In the present embodiment, as exemplified in FIG. 13, prior to the selection, the second control unit 12a controls the time required for the second device 12 to start the application 20 when the condition 1 is selected, The time required for the second device 12 to activate the application 20 when the condition 2 is selected may be predicted (S9). Thus, the selection can be made after considering the processing times for both the condition 1 and the condition 2.

以上、実施形態を参照して本発明を説明したが、本発明は、上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解しうる様々な変更をできる。 Although the present invention has been described with reference to the embodiments, the present invention is not limited to the above embodiments. Various changes can be made to the configuration and details of the present invention within the scope of the present invention that can be understood by those skilled in the art.

本発明によれば、例えば、現用装置から待機装置にコピーされたデータが、どの時点のものかが明確化された非同期コピーの分散ファイル装置及びそれを用いたフェイルオーバ方法を提供可能となる。 According to the present invention, for example, it is possible to provide an asynchronous copy distributed file device in which the point in time of data copied from the active device to the standby device is clarified, and a failover method using the distributed file device.

10 分散ファイル装置
11 第1装置
11a 第1制御部
11b 第1記憶部
11c 反映実行部
12 第2装置
12a 第2制御部
12b 未反映データ記憶部
12c 第2記憶部
20 アプリケーション
30 通信回線網
111、121 CPU
112、122 メモリ
113、123 バス
114、124 記憶装置
115、125 入力装置
116、126 ディスプレイ
117、127 通信デバイス

10 distributed file device 11 first device 11a first control unit 11b first storage unit 11c reflection execution unit 12 second device 12a second control unit 12b unreflected data storage unit 12c second storage unit 20 application 30 communication network 111, 121 CPUs
112, 122 memory 113, 123 bus 114, 124 storage device 115, 125 input device 116, 126 display 117, 127 communication device

Claims (16)

アプリケーションを実行する第1装置と、
前記第1装置に障害が発生したときに前記アプリケーションの実行を引き継ぐ第2装置と、
を含み、
前記第1装置は、第1制御部、第1記憶部、及び、反映実行部、を含み、
前記第2装置は、第2制御部、未反映データ記憶部、及び、第2記憶部、を含み、
前記第1制御部及び前記第2制御部は、通信回線網を介して接続可能であり、
前記第1制御部は、前記アプリケーションの実行に関するデータに、前記第2装置に未反映であるとのフラグを立てて前記第1記憶部に登録し、かつ、前記データに送信時刻を付して前記第2制御部に送信し、
前記第2制御部は、前記送信時刻が付された前記データを、前記未反映データ記憶部に登録し、
前記反映実行部は、予め設定されたトリガー条件を満たしたとき、前記第2装置に未反映のデータの前記第2装置への反映を前記第2制御部に指示するように前記第1制御部に指示し、
前記指示を受けたとき、前記第1制御部は、前記未反映のデータの反映を、前記第2制御部に指示し、
前記指示を受けたとき、前記第2制御部は、前記未反映データ記憶部に登録された前記未反映のデータに付された前記送信時刻を、チェックポイント時刻に変更した後、前記データを前記第2記憶部に登録し、かつ、前記データの反映の完了信号を、前記第1制御部に送信し、
前記完了信号を受信したとき、前記第1制御部は、前記第2装置に未反映であるとのフラグを立てて前記第1記憶部に登録されたデータの前記フラグを倒す、
分散ファイル装置。
a first device executing an application;
a second device that takes over execution of the application when the first device fails;
including
The first device includes a first control unit, a first storage unit, and a reflection execution unit,
The second device includes a second control unit, an unreflected data storage unit, and a second storage unit,
The first control unit and the second control unit are connectable via a communication network,
The first control unit registers data related to execution of the application in the first storage unit with a flag indicating that the data has not been reflected in the second device, and adds a transmission time to the data. Send to the second control unit,
the second control unit registers the data to which the transmission time is attached in the unreflected data storage unit;
The reflection execution unit, when a preset trigger condition is satisfied, instructs the second control unit to reflect data that has not been reflected in the second device to the second device. to
When receiving the instruction, the first control unit instructs the second control unit to reflect the unreflected data;
Upon receiving the instruction, the second control unit changes the transmission time attached to the unreflected data registered in the unreflected data storage unit to the checkpoint time, and then transfers the data to the registering in the second storage unit, and transmitting a completion signal for reflecting the data to the first control unit;
When the completion signal is received, the first control unit raises a flag indicating that the data has not been reflected in the second device, and clears the flag of the data registered in the first storage unit.
Distributed File Device.
前記予め設定されたトリガー条件が、所定時間の経過又は所定時刻の到来である、
請求項1記載の分散ファイル装置。
wherein the preset trigger condition is elapse of a predetermined time or arrival of a predetermined time;
2. The distributed file system according to claim 1.
前記未反映データ記憶部が、データ量の閾値を有し、
前記予め設定されたトリガー条件が、前記未反映データ記憶部に登録されたデータ量が前記閾値を超えたことである、
請求項1記載の分散ファイル装置。
the unreflected data storage unit has a data amount threshold,
wherein the preset trigger condition is that the amount of data registered in the unreflected data storage unit exceeds the threshold;
2. The distributed file system according to claim 1.
前記予め設定されたトリガー条件が、前記アプリケーションから前記第1制御部にチェックポイント取得要求がされたことである、
請求項1記載の分散ファイル装置。
The preset trigger condition is that the application requests the first control unit to acquire a checkpoint,
2. The distributed file system according to claim 1.
前記未反映データ記憶部に登録された前記送信時刻が付された未反映のデータの一部又は全部をロストしたとき、前記第1制御部が、前記第2装置に未反映であるとのフラグを立てて前記第1記憶部に登録されたデータと、前記未反映データ記憶部に登録されたデータとの差分を、前記第2制御部に送信する、
請求項1から4のいずれか一項に記載の分散ファイル装置。
When part or all of the unreflected data with the transmission time registered in the unreflected data storage unit is lost, the first control unit provides a flag indicating that the unreflected data has not been reflected in the second device. and transmitting the difference between the data registered in the first storage unit and the data registered in the unreflected data storage unit to the second control unit;
5. A distributed file device according to any one of claims 1 to 4.
前記第1装置に障害が発生し、前記第2装置が前記アプリケーションの実行を引き継いだとき、前記第2制御部が、下記条件1及び下記条件2のいずれかを選択する、
請求項1から5のいずれか一項に記載の分散ファイル装置。
(条件1)
前記第2記憶部に登録された前記チェックポイント時刻が付された反映済みのデータのみを、前記アプリケーションの実行に使用する。
(条件2)
前記第2記憶部に登録された前記チェックポイント時刻が付された反映済みのデータと、前記未反映データ記憶部に登録された前記送信時刻が付された未反映のデータとを、前記アプリケーションの実行に使用する。
When a failure occurs in the first device and the second device takes over execution of the application, the second control unit selects either condition 1 or condition 2 below.
A distributed file device according to any one of claims 1 to 5.
(Condition 1)
Only the reflected data with the checkpoint time registered in the second storage unit is used for execution of the application.
(Condition 2)
The application stores the reflected data with the checkpoint time registered in the second storage unit and the unreflected data with the transmission time registered in the unreflected data storage unit. used for execution.
前記第2制御部が、前記条件1を選択したときに前記第2装置が前記アプリケーションを起動するまでに要する時間と、前記条件2を選択したときに前記第2装置が前記アプリケーションを起動するまでに要する時間とを予測する、
請求項6記載の分散ファイル装置。
A time required for the second device to activate the application when the second control unit selects the condition 1, and a time required for the second device to activate the application when the condition 2 is selected. predict the time and
7. The distributed file system according to claim 6.
アプリケーションを実行する第1装置と、
前記第1装置に障害が発生したときに前記アプリケーションの実行を引き継ぐ第2装置と、
を含む分散ファイル装置を用い、
前記第1装置は、第1制御部、第1記憶部、及び、反映実行部、を含み、
前記第2装置は、第2制御部、未反映データ記憶部、及び、第2記憶部、を含み、
前記第1制御部及び前記第2制御部は、通信回線網を介して接続可能であり、
前記第1制御部が、前記アプリケーションの実行に関するデータに、前記第2装置に未反映であるとのフラグを立てて前記第1記憶部に登録し、かつ、前記データに送信時刻を付して前記第2制御部に送信する未反映データ処理工程と、
前記第2制御部が、前記送信時刻が付された前記データを、前記未反映データ記憶部に登録する未反映データ登録工程と、
前記反映実行部が、予め設定されたトリガー条件を満たしたとき、前記第2装置に未反映のデータの前記第2装置への反映を前記第2制御部に指示するように前記第1制御部に指示する第1反映指示工程と、
前記指示を受けたとき、前記第1制御部が、前記未反映のデータの反映を、前記第2制御部に指示する第2反映指示工程と、
前記指示を受けたとき、前記第2制御部が、前記未反映データ記憶部に登録された前記未反映のデータに付された前記送信時刻を、チェックポイント時刻に変更した後、前記データを前記第2記憶部に登録し、かつ、前記データの反映の完了信号を、前記第1制御部に送信する反映工程と、
前記完了信号を受信したとき、前記第1制御部が、前記第2装置に未反映であるとのフラグを立てて前記第1記憶部に登録されたデータの前記フラグを倒す登録工程と、
を含むフェイルオーバ方法。
a first device executing an application;
a second device that takes over execution of the application when the first device fails;
using a distributed file device containing
The first device includes a first control unit, a first storage unit, and a reflection execution unit,
The second device includes a second control unit, an unreflected data storage unit, and a second storage unit,
The first control unit and the second control unit are connectable via a communication network,
The first control unit registers data related to execution of the application in the first storage unit with a flag indicating that the data has not been reflected in the second device, and adds a transmission time to the data. a non-reflected data processing step for transmitting to the second control unit;
an unreflected data registration step in which the second control unit registers the data to which the transmission time is attached in the unreflected data storage unit;
The first control unit, when the reflection execution unit satisfies a preset trigger condition, instructs the second control unit to reflect data that has not been reflected in the second device to the second device. a first reflection instruction step of instructing to
a second reflection instruction step in which, when receiving the instruction, the first control unit instructs the second control unit to reflect the unreflected data;
When receiving the instruction, the second control unit changes the transmission time attached to the unreflected data registered in the unreflected data storage unit to the checkpoint time, and then transfers the data to the a reflection step of registering the data in a second storage unit and transmitting a reflection completion signal of the data to the first control unit;
a registration step in which, when the completion signal is received, the first control unit raises a flag indicating that the data has not been reflected in the second device and clears the flag of the data registered in the first storage unit;
failover methods, including
前記予め設定されたトリガー条件が、所定時間の経過又は所定時刻の到来である、
請求項8記載のフェイルオーバ方法。
wherein the preset trigger condition is elapse of a predetermined time or arrival of a predetermined time;
9. The failover method according to claim 8.
前記未反映データ記憶部が、データ量の閾値を有し、
前記予め設定されたトリガー条件が、前記未反映データ記憶部に登録されたデータ量が前記閾値を超えたことである、
請求項8記載のフェイルオーバ方法。
the unreflected data storage unit has a data amount threshold,
wherein the preset trigger condition is that the amount of data registered in the unreflected data storage unit exceeds the threshold;
9. The failover method according to claim 8.
前記予め設定されたトリガー条件が、前記アプリケーションから前記第1制御部にチェックポイント取得要求がされたことである、
請求項8記載のフェイルオーバ方法。
The preset trigger condition is that the application requests the first control unit to acquire a checkpoint,
9. The failover method according to claim 8.
前記未反映データ記憶部に登録された前記送信時刻が付された未反映のデータの一部又は全部をロストしたとき、前記第1制御部が、前記第2装置に未反映であるとのフラグを立てて前記第1記憶部に登録されたデータと、前記未反映データ記憶部に登録されたデータとの差分を、前記第2制御部に送信する差分送信工程を含む、
請求項8から11のいずれか一項に記載のフェイルオーバ方法。
When part or all of the unreflected data with the transmission time registered in the unreflected data storage unit is lost, the first control unit provides a flag indicating that the unreflected data has not been reflected in the second device. and transmitting the difference between the data registered in the first storage unit and the data registered in the unreflected data storage unit to the second control unit,
A failover method according to any one of claims 8 to 11.
前記第1装置に障害が発生し、前記第2装置が前記アプリケーションの実行を引き継いだとき、前記第2制御部が、下記条件1及び下記条件2のいずれかを選択する選択工程を含む、
請求項8から12のいずれか一項に記載のフェイルオーバ方法。
(条件1)
前記第2記憶部に登録された前記チェックポイント時刻が付された反映済みのデータのみを、前記アプリケーションの実行に使用する。
(条件2)
前記第2記憶部に登録された前記チェックポイント時刻が付された反映済みのデータと、前記未反映データ記憶部に登録された前記送信時刻が付された未反映のデータとを、前記アプリケーションの実行に使用する。
When a failure occurs in the first device and the second device takes over execution of the application, the second control unit selects either condition 1 or condition 2 below.
A failover method according to any one of claims 8 to 12.
(Condition 1)
Only the reflected data with the checkpoint time registered in the second storage unit is used for execution of the application.
(Condition 2)
The application stores the reflected data with the checkpoint time registered in the second storage unit and the unreflected data with the transmission time registered in the unreflected data storage unit. used for execution.
前記第2制御部が、前記条件1を選択したときに前記第2装置が前記アプリケーションを起動するまでに要する時間と、前記条件2を選択したときに前記第2装置が前記アプリケーションを起動するまでに要する時間とを予測する予測工程を含む、
請求項13記載のフェイルオーバ方法。
A time required for the second device to activate the application when the second control unit selects the condition 1, and a time required for the second device to activate the application when the condition 2 is selected. including a prediction step of predicting the time required for
14. The failover method according to claim 13.
請求項8から14のいずれか一項に記載の方法をコンピュータ上で実行可能なプログラム。 A program executable on a computer for the method according to any one of claims 8 to 14. 請求項15記載のプログラムを記録しているコンピュータ読み取り可能な記録媒体。

A computer-readable recording medium recording the program according to claim 15.

JP2018230768A 2018-12-10 2018-12-10 DISTRIBUTED FILE DEVICE, FAILOVER METHOD, PROGRAM AND RECORDING MEDIUM Active JP7164175B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018230768A JP7164175B2 (en) 2018-12-10 2018-12-10 DISTRIBUTED FILE DEVICE, FAILOVER METHOD, PROGRAM AND RECORDING MEDIUM

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018230768A JP7164175B2 (en) 2018-12-10 2018-12-10 DISTRIBUTED FILE DEVICE, FAILOVER METHOD, PROGRAM AND RECORDING MEDIUM

Publications (2)

Publication Number Publication Date
JP2020095322A JP2020095322A (en) 2020-06-18
JP7164175B2 true JP7164175B2 (en) 2022-11-01

Family

ID=71086195

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018230768A Active JP7164175B2 (en) 2018-12-10 2018-12-10 DISTRIBUTED FILE DEVICE, FAILOVER METHOD, PROGRAM AND RECORDING MEDIUM

Country Status (1)

Country Link
JP (1) JP7164175B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7516873B2 (en) 2020-06-01 2024-07-17 セイコーエプソン株式会社 3D object printing device

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001356945A (en) 2000-04-12 2001-12-26 Anetsukusu Syst Kk Data backup recovery system
JP2003050675A (en) 2002-07-15 2003-02-21 Hitachi Ltd Data multiplexing system
JP2005309598A (en) 2004-04-19 2005-11-04 Nec Corp Data transfer system and method
JP2006004031A (en) 2004-06-16 2006-01-05 Hitachi Ltd Data processing method, system, storage device method, and its processing program
JP2006004147A (en) 2004-06-17 2006-01-05 Hitachi Ltd Disaster recovery system, program and method for recovering database
JP2006323663A (en) 2005-05-19 2006-11-30 Nec Corp Information processing system, replication method, and difference information holding device and program
JP2008077264A (en) 2006-09-20 2008-04-03 Hitachi Ltd Recovery method using cdp
JP2011111131A (en) 2009-11-30 2011-06-09 Nhk Spring Co Ltd Seat cushion for vehicle, and vehicle seat

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001356945A (en) 2000-04-12 2001-12-26 Anetsukusu Syst Kk Data backup recovery system
JP2003050675A (en) 2002-07-15 2003-02-21 Hitachi Ltd Data multiplexing system
JP2005309598A (en) 2004-04-19 2005-11-04 Nec Corp Data transfer system and method
JP2006004031A (en) 2004-06-16 2006-01-05 Hitachi Ltd Data processing method, system, storage device method, and its processing program
JP2006004147A (en) 2004-06-17 2006-01-05 Hitachi Ltd Disaster recovery system, program and method for recovering database
JP2006323663A (en) 2005-05-19 2006-11-30 Nec Corp Information processing system, replication method, and difference information holding device and program
JP2008077264A (en) 2006-09-20 2008-04-03 Hitachi Ltd Recovery method using cdp
JP2011111131A (en) 2009-11-30 2011-06-09 Nhk Spring Co Ltd Seat cushion for vehicle, and vehicle seat

Also Published As

Publication number Publication date
JP2020095322A (en) 2020-06-18

Similar Documents

Publication Publication Date Title
JP4571576B2 (en) Remote copy storage system and remote copy method
JP5455069B2 (en) Information processing system and information processing method
US8862843B2 (en) Storage system, backup storage apparatus, and backup control method
US9052833B2 (en) Protection of former primary volumes in a synchronous replication relationship
US8255649B2 (en) Remote copy control method and system in storage cluster environment
JP2007200195A (en) Measure against data overflow from intermediate volume in differential remote copying
JP6123626B2 (en) Process resumption method, process resumption program, and information processing system
US9398094B2 (en) Data transfer device
WO2016033755A1 (en) Task handling apparatus and method, and electronic device
US7890715B2 (en) Suspension of an asynchronous remote copy pair system having a primary controller and a remote controller
JP7164175B2 (en) DISTRIBUTED FILE DEVICE, FAILOVER METHOD, PROGRAM AND RECORDING MEDIUM
EP2260379B1 (en) Method and system for storage replication
US20160103714A1 (en) System, method of controlling a system including a load balancer and a plurality of apparatuses, and apparatus
JP4291713B2 (en) Time adjustment method in logical computer system
JP2007264770A (en) Database access method and device
JP5240861B2 (en) Control device, data migration system, data migration method and program
US20180307564A1 (en) Non-transitory computer-readable storage medium and transmission control device
JP5703860B2 (en) Fault tolerant system, memory control method, and program
JP6112205B2 (en) Information processing system, apparatus, method, and program
JP7193713B2 (en) Transfer method control program, transfer method control device, and transfer method control method
WO2015166741A1 (en) In-memory management system and in-memory management program
US11269922B2 (en) Database server, database management method, and storage medium
JP5562454B1 (en) Redundant system server
JP2022152813A (en) Data processing program, information processing system, and data processing method
JP2016066286A (en) Information processing device, information processing method and program

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20191025

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211111

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220907

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220920

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221013

R151 Written notification of patent or utility model registration

Ref document number: 7164175

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151