JP2015194973A - Distributed file system, backup file acquisition method, control device, and management device - Google Patents

Distributed file system, backup file acquisition method, control device, and management device Download PDF

Info

Publication number
JP2015194973A
JP2015194973A JP2014073413A JP2014073413A JP2015194973A JP 2015194973 A JP2015194973 A JP 2015194973A JP 2014073413 A JP2014073413 A JP 2014073413A JP 2014073413 A JP2014073413 A JP 2014073413A JP 2015194973 A JP2015194973 A JP 2015194973A
Authority
JP
Japan
Prior art keywords
file
stored
backup
storage unit
file system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014073413A
Other languages
Japanese (ja)
Other versions
JP6291977B2 (en
Inventor
明芳 遠藤
Akiyoshi Endo
明芳 遠藤
和田 浩
Hiroshi Wada
浩 和田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2014073413A priority Critical patent/JP6291977B2/en
Publication of JP2015194973A publication Critical patent/JP2015194973A/en
Application granted granted Critical
Publication of JP6291977B2 publication Critical patent/JP6291977B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

PROBLEM TO BE SOLVED: To provide a distributed file system contributing to performance improvement during backup processing.SOLUTION: The distributed file system includes a control device for controlling access to a plurality of nodes and a management device for managing information required for backup. The control device transfers a file to the management device when storing the file in a node. The management device includes: a first storage unit in which metadata of the transferred file is stored; a second storage unit in which actual data meeting a prescribed condition is stored; and a file access unit which, in response to reception of a transmission request for metadata from a backup device, acquires the metadata stored in the first storage unit to transmit it to the backup device, and in response to reception of a transmission request for actual data of a file stored in a node, transmits one of actual data stored in the second storage unit and actual data stored in a node in which the file for which the transmission request is received from the backup device is stored, to the backup device.

Description

本発明は、分散ファイルシステム、バックアップファイル取得方法、制御装置及び管理装置に関する。   The present invention relates to a distributed file system, a backup file acquisition method, a control device, and a management device.

近年、サーバ等の情報処理装置が扱うデータ量の増大に伴い、ネットワークに接続された複数のノードにデータを分散し、各ノードにてデータを記憶する分散ファイルシステムの重要性が増大している。分散ファイルシステム又は分散NAS(Network Attached Storage)においては、例えば、図13に図示するように、多数のNASやNASに類するネットワークストレージを分散ノード62−1〜62−3としてネットワーク上に分散配置する。   In recent years, with the increase in the amount of data handled by information processing devices such as servers, the importance of a distributed file system that distributes data to a plurality of nodes connected to a network and stores the data at each node is increasing. . In a distributed file system or a distributed NAS (Network Attached Storage), for example, as shown in FIG. 13, a large number of NAS and NAS-like network storages are distributed on the network as distributed nodes 62-1 to 62-3. .

図13に示す分散ファイルシステムにおいて、クライアント60からの分散ノード62-1〜62-3へのアクセス要求を処理するのがファイルシステム統合装置61である。ファイルシステム統合装置61は、クライアント60やバックアップ装置63のインターフェイスとなるファイルアクセス部300と、ファイルを各分散ノード62−1〜62−3に分散して格納する分散格納部301と、を含む。分散ファイルシステムでは、ファイルを記憶するノードを分散して配置することで、ファイル(データ)の記憶に係る処理を並列して実行可能とすると共に、必要に応じて冗長性を付与することで、システム全体の容量、性能及び信頼性の向上を図っている。   In the distributed file system shown in FIG. 13, the file system integration device 61 processes an access request from the client 60 to the distributed nodes 62-1 to 62-3. The file system integration device 61 includes a file access unit 300 that serves as an interface for the client 60 and the backup device 63, and a distributed storage unit 301 that distributes and stores files in the respective distributed nodes 62-1 to 62-3. In the distributed file system, by distributing and arranging nodes that store files, it is possible to execute processes related to storage of files (data) in parallel, and by providing redundancy as necessary, The overall system capacity, performance and reliability are improved.

ここで、分散ファイルシステムに限らず、凡そファイルを記憶するシステムでは、記憶ファイルのバックアップが重要となる。しかし、分散ファイルシステムにおけるファイルのバックアップに関しては、取り扱うデータ量が膨大であることもあり、典型的なバックアップ手法が確立していない状況にある。   Here, not only in a distributed file system, but in a system that stores about a file, backup of the stored file is important. However, with regard to file backup in a distributed file system, the amount of data handled may be enormous, and a typical backup method has not been established.

特許文献1において、複数のファイルサーバにあるファイルを一元的に管理するインデックスサーバを設置し、インデックスサーバがファイルの複製先、移動先を決定するシステムが開示されている。   Patent Document 1 discloses a system in which an index server that centrally manages files in a plurality of file servers is installed, and the index server determines a file duplication destination and a movement destination.

特許文献2において、分散ファイルシステムの全体を複製(リプリケーション)しつつ、複製するファイルを一部に限定するファイルシステムが開示されている。   Patent Document 2 discloses a file system that duplicates (replicates) the entire distributed file system and limits the files to be copied to a part.

特開2010−218335号公報JP 2010-218335 A 特開2004−252957号公報JP 2004-252957 A

なお、上記先行技術文献の各開示を、本書に引用をもって繰り込むものとする。以下の分析は、本発明者らによってなされたものである。   Each disclosure of the above prior art document is incorporated herein by reference. The following analysis was made by the present inventors.

ファイルステムの典型的なバックアップ処理は以下のとおり実行される。第1に、ファイルシステム全体をスキャンし、バックアップの対象となるファイルに関するリストを作成する。その際、ファイルのパス名や更新時刻を確認するために、メタデータを参照することが多い。なお、メタデータは、ファイルの管理データであり、ファイルの更新日時、アクセス権限、サイズ等に関する情報(属性値)を含む。第2に、バックアップの対象ファイルの実データをファイルシステムから取得する。なお、実データとは、ファイルの内容そのものである。第3に、取得した実データをストレージ装置に格納する。   A typical file stem backup process is performed as follows. First, the entire file system is scanned to create a list of files to be backed up. At that time, the metadata is often referred to in order to confirm the path name and update time of the file. Note that the metadata is file management data, and includes information (attribute values) relating to the file update date, access authority, size, and the like. Second, the actual data of the backup target file is acquired from the file system. The actual data is the contents of the file itself. Third, the acquired actual data is stored in the storage device.

上記のバックアップ処理を、分散ファイルシステムにて実行すると以下の問題が生じる可能性がある。   When the above backup processing is executed in a distributed file system, the following problems may occur.

分散ファイルシステムでは、ファイルが各分散ノードに分散されて格納されているため、分散された単位ごとに、データを格納している分散ノードを特定する処理や、読み込み対象の分散ノードを切り替える処理が必要となる。このような処理は、各分散ノードと接続を開始する、接続を終了するといったオーバーヘッドを生じさせる。つまり、メタデータ及び実データいずれのデータを読み込む場合であっても、分散ファイルシステム特有のオーバーヘッドが生じる。   In the distributed file system, the file is distributed and stored in each distributed node. Therefore, for each distributed unit, the process of specifying the distributed node storing data and the process of switching the distributed node to be read are performed. Necessary. Such processing causes overhead such as starting connection with each distributed node and ending connection. That is, an overhead peculiar to the distributed file system occurs even when reading data of either metadata or actual data.

加えて、データの総量が同じであったとしても、実データにアクセスする際に、個々のファイルサイズが小さいほど、オーバーヘッドが大きくなる。多数のファイルを読み込むために、分散ノードを切り替え、データを取得する処理がより多く発生するためである。   In addition, even if the total amount of data is the same, when accessing actual data, the smaller the individual file size, the greater the overhead. This is because, in order to read a large number of files, switching of distributed nodes and more processing for acquiring data occur.

上記の問題を解決するために、例えば、特許文献1が開示するような手法(データの一元管理)を用いることが考えられる。具体的には、図14に示すように、ファイルシステム統合装置64のメタデータ管理部402からアクセス可能なメタデータ記憶装置65を設け、当該記憶装置にてメタデータを一元管理(集中管理)することが考えられる。このような手法は、ファイルシステム全体のある瞬間のイメージであるスナップショットの確定、静止点定義には有効な技術であり、主にNAS仮想化装置等にて用いられている。   In order to solve the above problem, for example, it is conceivable to use a technique (centralized data management) as disclosed in Patent Document 1. Specifically, as shown in FIG. 14, a metadata storage device 65 accessible from the metadata management unit 402 of the file system integration device 64 is provided, and the metadata is centrally managed (centralized management) in the storage device. It is possible. Such a technique is an effective technique for determining a snapshot that is an instantaneous image of the entire file system and defining a quiesce point, and is mainly used in a NAS virtualization apparatus or the like.

しかしながら、メタデータを集中管理することは、メタデータ記憶装置65が分散ファイルシステムにおける単一障害点(SPF;Single Point of Failure)となるだけでなく、性能上のボトルネックとなり得る。さらに、上記の手法は実データに対するアクセス性能の向上に寄与しない。   However, centralized management of metadata can be a bottleneck in performance as well as a single point of failure (SPF) in the distributed file system. Further, the above method does not contribute to improvement of access performance for real data.

以上のように、分散ファイルシステムにおいては、ファイルを分散して格納することにより生じるバックアップ処理時のオーバーヘッドの発生、即ち、分散ファイルシステムの性能低下が問題となる。   As described above, in the distributed file system, the occurrence of overhead during backup processing caused by distributing and storing files, that is, the performance degradation of the distributed file system becomes a problem.

本発明は、バックアップ処理時の性能向上に寄与する分散ファイルシステム、バックアップファイル取得方法、制御装置及び管理装置を提供することを目的とする。   It is an object of the present invention to provide a distributed file system, a backup file acquisition method, a control device, and a management device that contribute to performance improvement during backup processing.

本発明の第1の視点によれば、ファイルを記憶する複数のノードに対するアクセスを制御する制御装置と、バックアップ装置からの要求を処理する際に要する情報を管理する管理装置と、を含み、前記制御装置は、前記複数のノードのうち少なくとも1以上のノードにファイルを格納する際に、前記格納しようとするファイルを前記管理装置に転送する転送部を備え、前記管理装置は、前記転送されたファイルのメタデータを記憶する第1の記憶部と、前記転送されたファイルの実データのうち、所定の条件を満たす実データを記憶する第2の記憶部と、前記バックアップ装置から、前記ノードが記憶するファイルに関するメタデータの送信要求を受けた場合には、前記第1の記憶部が記憶するメタデータを取得して前記バックアップ装置に送信し、前記バックアップ装置から、前記ノードが記憶するファイルの実データの送信要求を受けた場合には、前記第2の記憶部が記憶する実データ及び前記バックアップ装置から送信要求を受けたファイルを記憶するノードが記憶する実データのいずれかを、前記バックアップ装置に送信する、ファイルアクセス部と、を備える、分散ファイルシステムが提供される。   According to a first aspect of the present invention, comprising: a control device that controls access to a plurality of nodes that store files; and a management device that manages information required when processing a request from a backup device, The control device includes a transfer unit that transfers the file to be stored to the management device when the file is stored in at least one of the plurality of nodes, and the management device receives the transfer A first storage unit that stores file metadata, a second storage unit that stores actual data satisfying a predetermined condition among the actual data of the transferred file, and the node from the backup device When a metadata transmission request regarding a file to be stored is received, the metadata stored in the first storage unit is acquired and stored in the backup device. And when receiving a request for transmission of actual data of the file stored in the node from the backup device, the actual data stored in the second storage unit and the file received from the backup device are transmitted. A distributed file system is provided, comprising: a file access unit that transmits any of the actual data stored in the storing node to the backup device.

本発明の第2の視点によれば、ファイルを記憶する複数のノードに対するアクセスを制御する制御装置と、バックアップ装置からの要求を処理する際に要する情報を管理する管理装置と、を含んで構成される分散ファイルシステムのバックアップファイル取得方法であって、前記複数のノードのうち少なくとも1以上のノードにファイルを格納する際に、前記格納しようとするファイルを前記管理装置に転送する工程と、前記転送されたファイルのメタデータを第1の記憶部に格納する工程と、前記転送されたファイルの実データのうち、所定の条件を満たす実データを第2の記憶部に格納する工程と、前記バックアップ装置から、前記ノードが記憶するファイルに関するメタデータの送信要求を受けた場合には、前記第1の記憶部が記憶するメタデータを取得して前記バックアップ装置に送信する工程と、前記バックアップ装置から、前記ノードが記憶するファイルの実データの送信要求を受けた場合には、前記第2の記憶部が記憶する実データ及び前記バックアップ装置から送信要求を受けたファイルを記憶するノードが記憶する実データのいずれかを、前記バックアップ装置に送信する工程と、を含む、バックアップファイル取得方法が提供される。
なお、本方法は、制御装置と管理装置という、特定の機械に結びつけられている。
According to a second aspect of the present invention, the control apparatus includes a control device that controls access to a plurality of nodes that store files, and a management device that manages information required when processing a request from a backup device. A method for acquiring a backup file of a distributed file system, the step of transferring the file to be stored to the management device when storing the file in at least one of the plurality of nodes; Storing metadata of the transferred file in a first storage unit; storing actual data satisfying a predetermined condition in the second storage unit among the actual data of the transferred file; When receiving a metadata transmission request regarding the file stored in the node from the backup device, the first storage unit stores the metadata. The step of acquiring metadata and transmitting it to the backup device, and the actual data stored in the second storage unit when receiving a request for transmitting the actual data of the file stored in the node from the backup device And a step of transmitting to the backup device any of actual data stored in a node that stores a file that has received a transmission request from the backup device.
Note that this method is linked to specific machines such as a control device and a management device.

本発明の第3の視点によれば、ファイルを記憶する複数のノードに対するアクセスを制御すると共に、前記複数のノードのうち少なくとも1以上のノードにファイルを格納する際に、前記格納しようとするファイルを、バックアップ装置からの要求を処理する際に要する情報を管理する管理装置に転送する、制御装置が提供される。   According to the third aspect of the present invention, the file to be stored is controlled when the access to the plurality of nodes storing the file is controlled and the file is stored in at least one of the plurality of nodes. Is transferred to a management device that manages information required for processing a request from the backup device.

本発明の第4の視点によれば、バックアップ装置からの要求を処理する際に要する情報を管理する管理装置であって、ファイルを記憶する複数のノードに対するアクセスを制御する制御装置から転送されるファイルのメタデータを記憶する第1の記憶部と、前記制御装置から転送されるファイルの実データのうち、所定の条件を満たす実データを記憶する第2の記憶部と、前記バックアップ装置から、前記ノードが記憶するファイルに関するメタデータの送信要求を受けた場合には、前記第1の記憶部が記憶するメタデータを取得して前記バックアップ装置に送信し、前記バックアップ装置から、前記ノードが記憶するファイルの実データの送信要求を受けた場合には、前記第2の記憶部が記憶する実データ及び前記バックアップ装置から送信要求を受けたファイルを記憶するノードが記憶する実データのいずれかを、前記バックアップ装置に送信する、ファイルアクセス部と、を備える、管理装置が提供される。   According to the fourth aspect of the present invention, the management device manages information required when processing a request from a backup device, and is transferred from a control device that controls access to a plurality of nodes storing files. From the first storage unit that stores the metadata of the file, the second storage unit that stores the actual data satisfying a predetermined condition among the actual data of the file transferred from the control device, and the backup device, When receiving a metadata transmission request regarding a file stored in the node, the metadata stored in the first storage unit is acquired and transmitted to the backup device, and the node stores the metadata from the backup device. When a request to send actual data of a file to be received is received, the actual data stored in the second storage unit and the backup data are sent from the backup device. Any node storing the actual data for storing requests received file is transmitted to the backup device, comprising: a file access unit, a management device is provided.

本発明の各視点によれば、バックアップ処理時の性能向上に寄与する分散ファイルシステム、バックアップファイル取得方法、制御装置及び管理装置が、提供される。   According to each aspect of the present invention, a distributed file system, a backup file acquisition method, a control device, and a management device that contribute to performance improvement during backup processing are provided.

一実施形態の概要を説明するための図である。It is a figure for demonstrating the outline | summary of one Embodiment. 第1の実施形態に係る分散ファイルシステムの構成の一例を示す図である。It is a figure which shows an example of a structure of the distributed file system which concerns on 1st Embodiment. クライアントからファイル書き込み要求があった場合の動作の一例を示すシーケンス図である。It is a sequence diagram which shows an example of an operation | movement when there exists a file write request from a client. 分散ファイルシステムのスナップショット生成に係る動作の一例を示すシーケンス図である。It is a sequence diagram which shows an example of the operation | movement which concerns on the snapshot production | generation of a distributed file system. ファイルシステム統合装置のスナップショット取得処理に係る動作の一例を示すフローチャートである。It is a flowchart which shows an example of the operation | movement which concerns on the snapshot acquisition process of a file system integration apparatus. 分散ファイルシステムのバックアップファイルの決定に係る動作の一例を示すシーケンス図である。It is a sequence diagram which shows an example of the operation | movement which concerns on determination of the backup file of a distributed file system. 分散ファイルシステムの実データのバックアップに係る動作の一例を示すシーケンス図である。It is a sequence diagram which shows an example of the operation | movement which concerns on the backup of the actual data of a distributed file system. 複製ファイルシステム管理装置のバックアップファイル送信要求を処理する際の動作の一例を示すフローチャートである。It is a flowchart which shows an example of the operation | movement at the time of processing the backup file transmission request of a replication file system management apparatus. 分散ファイルシステムの構成の一例を示す図である。It is a figure which shows an example of a structure of a distributed file system. 分散ファイルシステムの構成の一例を示す図である。It is a figure which shows an example of a structure of a distributed file system. バックアップ方式の一例を説明するための図である。It is a figure for demonstrating an example of a backup system. 第2の実施形態に係る分散ファイルシステムの構成の一例を示す図である。It is a figure which shows an example of a structure of the distributed file system which concerns on 2nd Embodiment. 分散ファイルシステムの構成の一例を示す図である。It is a figure which shows an example of a structure of a distributed file system. 分散ファイルシステムの構成の一例を示す図である。It is a figure which shows an example of a structure of a distributed file system.

初めに、図1を用いて一実施形態の概要について説明する。なお、この概要に付記した図面参照符号は、理解を助けるための一例として各要素に便宜上付記したものであり、この概要の記載はなんらの限定を意図するものではない。   First, an outline of an embodiment will be described with reference to FIG. Note that the reference numerals of the drawings attached to the outline are attached to the respective elements for convenience as an example for facilitating understanding, and the description of the outline is not intended to be any limitation.

上述のように、バックアップ処理時の性能向上に寄与する分散ファイルシステムが望まれる。   As described above, a distributed file system that contributes to performance improvement during backup processing is desired.

そこで、一例として図1に示す分散ファイルシステムを提供する。分散ファイルシステムは、ファイルを記憶する複数のノードに対するアクセスを制御する制御装置100と、バックアップ装置からの要求を処理する際に要する情報を管理する管理装置101と、を含む。制御装置100は、複数のノードのうち少なくとも1以上のノードにファイルを格納する際に、格納しようとするファイルを管理装置に転送する転送部102を備える。管理装置101は、転送されたファイルのメタデータを記憶する第1の記憶部103と、転送されたファイルの実データのうち、所定の条件を満たす実データを記憶する第2の記憶部104と、バックアップ装置から、ノードが記憶するファイルに関するメタデータの送信要求を受けた場合には、第1の記憶部103が記憶するメタデータを取得してバックアップ装置に送信し、バックアップ装置から、ノードが記憶するファイルの実データの送信要求を受けた場合には、第2の記憶部104が記憶する実データ及びバックアップ装置から送信要求を受けたファイルを記憶するノードが記憶する実データのいずれかを、バックアップ装置に送信する、ファイルアクセス部105と、を備える。   Therefore, the distributed file system shown in FIG. 1 is provided as an example. The distributed file system includes a control device 100 that controls access to a plurality of nodes that store files, and a management device 101 that manages information required when processing a request from a backup device. The control device 100 includes a transfer unit 102 that transfers a file to be stored to a management device when storing the file in at least one of a plurality of nodes. The management apparatus 101 includes a first storage unit 103 that stores metadata of the transferred file, and a second storage unit 104 that stores actual data that satisfies a predetermined condition among the actual data of the transferred file. When a transmission request for metadata relating to a file stored in the node is received from the backup device, the metadata stored in the first storage unit 103 is acquired and transmitted to the backup device. When a transmission request for the actual data of the file to be stored is received, either the actual data stored in the second storage unit 104 or the actual data stored in the node storing the file that has received the transmission request from the backup device is stored. And a file access unit 105 for transmitting to the backup device.

管理装置101は、制御装置100から転送されてくるファイルを用いて、複数の分散ノードからなる分散ファイルシステムの複製を内部に構築し、バックアップ装置からの各種要求を、内部に構築した仮想的なファイルシステムの複製を用いて処理する。また、管理装置101は、ファイルシステムの複製を構築する際に、基本的には全ファイルのメタデータを記憶するが、実データに関しては所定の条件(例えば、ファイルサイズが閾値以下)を満たす実データを記憶する。従って、管理装置101は、バックアップ装置からメタデータの取得や内部に記憶した実データの送信要求を受けた場合には、分散ノードからなる分散ファイルシステム本体にアクセスせずに、ファイルシステムの複製にアクセスすることで、対処できる。その結果、分散ファイルシステムのバックアップを行う際のオーバーヘッドが減少し、バックアップ処理時の性能向上が達成できる。   The management apparatus 101 uses a file transferred from the control apparatus 100 to construct a copy of a distributed file system composed of a plurality of distributed nodes, and to create various requests from the backup apparatus. Process using file system replication. The management apparatus 101 basically stores metadata of all files when constructing a replica of the file system, but the actual data satisfying a predetermined condition (for example, the file size is equal to or smaller than a threshold). Store the data. Therefore, the management apparatus 101, when receiving a metadata acquisition request or a transmission request of actual data stored therein from the backup apparatus, copies the file system without accessing the main body of the distributed file system including the distributed nodes. It can be dealt with by accessing. As a result, overhead when performing backup of the distributed file system is reduced, and performance improvement during backup processing can be achieved.

以下に具体的な実施の形態について、図面を参照してさらに詳しく説明する。   Hereinafter, specific embodiments will be described in more detail with reference to the drawings.

[第1の実施形態]
第1の実施形態について、図面を用いてより詳細に説明する。
[First Embodiment]
The first embodiment will be described in more detail with reference to the drawings.

図2は、第1の実施形態に係る分散ファイルシステムの構成の一例を示す図である。分散ファイルシステムは、クライアント1と、ファイルシステム統合装置2と、複数の分散ノード3−1〜3−n(nは正の整数、以下同じ)と、バックアップ装置4と、複製ファイルシステム管理装置5と、を含んで構成される。図2に示す分散ファイルシステムに含まれる各装置は、ネットワークを介して相互に接続されている。なお、以下の説明において、分散ノード3−1〜3−nを区別する特段の理由がない場合には、単に「分散ノード3」と表記する。   FIG. 2 is a diagram illustrating an example of the configuration of the distributed file system according to the first embodiment. The distributed file system includes a client 1, a file system integration device 2, a plurality of distributed nodes 3-1 to 3 -n (n is a positive integer, hereinafter the same), a backup device 4, and a duplicate file system management device 5. And comprising. Each device included in the distributed file system shown in FIG. 2 is connected to each other via a network. In the following description, when there is no particular reason for distinguishing the distributed nodes 3-1 to 3-n, they are simply expressed as “distributed node 3”.

クライアント1は、分散ファイルシステムを利用するユーザが、業務等で使用するコンピュータ等である。クライアント1から、ファイルシステム統合装置2に対して、ファイルの書き込み要求や読み出し要求がなされる。   The client 1 is a computer or the like used by a user who uses the distributed file system for business or the like. The client 1 makes a file write request or read request to the file system integration device 2.

ファイルシステム統合装置2は、クライアント1からのアクセス要求を処理する装置である。具体的には、ファイルシステム統合装置2は、ファイルを記憶する分散ノード3に対するアクセスを制御する装置である。ファイルシステム統合装置2は、上述の制御装置100に相当する。   The file system integration device 2 is a device that processes an access request from the client 1. Specifically, the file system integration device 2 is a device that controls access to the distributed nodes 3 that store files. The file system integration device 2 corresponds to the control device 100 described above.

ファイルシステム統合装置2は、分散ノード3に対するファイルの書き込みや更新要求を行う際には、同等の要求を複製ファイルシステム管理装置5にも行う。さらに、ファイルシステム統合装置2は、分散ノード3、複製ファイルシステム管理装置5に対して、任意のタイミングにてスナップショットを取得させる機能を有する。   When the file system integration device 2 makes a file write or update request to the distributed node 3, the file system integration device 2 also makes an equivalent request to the replication file system management device 5. Further, the file system integration device 2 has a function of causing the distributed node 3 and the replication file system management device 5 to acquire a snapshot at an arbitrary timing.

分散ノード3は、ファイルシステム統合装置2から書き込まれるファイルを記憶する装置である。なお、分散ノード3は、ファイルシステム統合装置2からの通知に応じて、特定のタイミングにおけるスナップショットを取得する機能を有する。   The distributed node 3 is a device that stores files written from the file system integration device 2. The distributed node 3 has a function of acquiring a snapshot at a specific timing in response to a notification from the file system integration device 2.

バックアップ装置4は、実際にバックアップデータを記憶する媒体(例えば、テープ装置、アーカイブ装置等)を備え、分散ファイルシステムのバックアップを管理、実施するソフトウェアがインストールされたコンピュータ等が該当する。   The backup device 4 includes a medium that actually stores backup data (for example, a tape device, an archive device, etc.), and corresponds to a computer in which software for managing and executing backup of a distributed file system is installed.

複製ファイルシステム管理装置5は、バックアップ装置4からの各種要求を処理する装置である。複製ファイルシステム管理装置5は、バックアップ装置4からの要求に応えるため、分散ファイルシステム全体が記憶するファイルのメタデータの複製と、分散ノード3が記憶するファイルのうち、所定の条件を満たすファイルに関する実データの複製と、を少なくとも記憶する。複製ファイルシステム管理装置5は、上述の管理装置101に相当する。   The duplicate file system management device 5 is a device that processes various requests from the backup device 4. The duplicate file system management device 5 relates to a file metadata copy stored in the entire distributed file system and a file satisfying a predetermined condition among the files stored in the distributed node 3 in order to respond to the request from the backup device 4. At least a copy of the actual data is stored. The duplicate file system management apparatus 5 corresponds to the management apparatus 101 described above.

図2を参照すると、ファイルシステム統合装置2は、ファイルアクセス部10と、分散格納部11と、ファイル転送部12と、スナップショット制御部13と、を含んで構成される。なお、ファイルアクセス部10等の各部は、ファイルシステム統合装置2に搭載されたコンピュータに、そのハードウェアを用いて、後に詳述する処理を実行させるコンピュータプログラムにより実現することもできる。   Referring to FIG. 2, the file system integration device 2 includes a file access unit 10, a distributed storage unit 11, a file transfer unit 12, and a snapshot control unit 13. Each unit such as the file access unit 10 can also be realized by a computer program that causes a computer mounted in the file system integration apparatus 2 to execute processing that will be described in detail later using the hardware thereof.

ファイルアクセス部10は、クライアント1とのインターフェイスを提供する手段である。ファイルアクセス部10は、クライアント1からのアクセス要求に従い、分散格納部11やファイル転送部12に、クライアント1から取得したファイルを引き渡し、ファイル書き込み要求、ファイル更新要求を発する。   The file access unit 10 is a means for providing an interface with the client 1. In accordance with the access request from the client 1, the file access unit 10 delivers the file acquired from the client 1 to the distributed storage unit 11 and the file transfer unit 12, and issues a file write request and a file update request.

分散格納部11は、ファイルアクセス部10からのファイル書き込み要求に応じて、分散ノード3にファイルを格納する手段である。具体的には、分散格納部11は、分散ノード3に対し、ファイルデータ又はその各断片の書き込み要求を送信する。分散格納部11は、予め定められた分散ファイルシステムの分散格納規則に基づき、書き込み要求を送信する分散ノード3を定める。   The distributed storage unit 11 is means for storing a file in the distributed node 3 in response to a file write request from the file access unit 10. Specifically, the distributed storage unit 11 transmits a write request for file data or each fragment thereof to the distributed node 3. The distributed storage unit 11 determines a distributed node 3 that transmits a write request based on a distributed storage rule of a predetermined distributed file system.

なお、ファイルシステム統合装置2が、分散ノード3が記憶するファイルを読み出す際には、図示しない読み出し手段を用いる。   When the file system integration device 2 reads a file stored in the distributed node 3, a reading unit (not shown) is used.

ファイル転送部12は、分散格納部11が、分散ノード3−1〜3−nのうち少なくとも1以上の分散ノード3にファイルを格納する際に、当該格納しようとするファイルを複製ファイルシステム管理装置5に転送する手段である。即ち、ファイル転送部12は、分散格納部11が分散ノード3に対して行うのと同等のファイル書き込み要求を、複製ファイルシステム管理装置5に対して行うと共に、当該ファイルが格納される(格納される予定の)分散ノード3を特定するノード番号等を複製ファイルシステム管理装置5に送信する。   When the distributed storage unit 11 stores a file in at least one or more distributed nodes 3 among the distributed nodes 3-1 to 3 -n, the file transfer unit 12 stores the file to be stored in a duplicate file system management apparatus. 5 is a means for transferring the data. That is, the file transfer unit 12 issues a file write request equivalent to that performed by the distributed storage unit 11 to the distributed node 3 to the duplicate file system management apparatus 5 and stores (stores) the file. A node number for specifying the distributed node 3 to be transmitted is transmitted to the replication file system management apparatus 5.

スナップショット制御部13は、分散ノード3、複製ファイルシステム管理装置5に対して、任意のタイミングにてスナップショットを取得させる手段である。スナップショット制御部13は、後述するスナップショット取得指示を受信した時点を境にファイルの世代を管理する機能を有する。   The snapshot control unit 13 is means for causing the distributed node 3 and the replication file system management apparatus 5 to acquire a snapshot at an arbitrary timing. The snapshot control unit 13 has a function of managing file generations at the time when a snapshot acquisition instruction (to be described later) is received.

分散ノード3は、データ記憶部20と、メタデータ記憶部21と、を含んで構成される。データ記憶部20は、ファイルの実データを記憶する手段である。メタデータ記憶部21は、ファイルのメタデータを記憶する手段である。   The distributed node 3 includes a data storage unit 20 and a metadata storage unit 21. The data storage unit 20 is means for storing the actual data of the file. The metadata storage unit 21 is a means for storing file metadata.

複製ファイルシステム管理装置5は、ファイルアクセス部30と、スナップショット部31と、複製ファイルシステム部32と、を含んで構成される。なお、ファイルアクセス部30等の各部は、複製ファイルシステム管理装置5に搭載されたコンピュータに、そのハードウェアを用いて、後に詳述する処理を実行させるコンピュータプログラムにより実現することもできる。   The duplicate file system management apparatus 5 includes a file access unit 30, a snapshot unit 31, and a duplicate file system unit 32. Each unit such as the file access unit 30 can also be realized by a computer program that causes a computer mounted in the duplicate file system management apparatus 5 to execute processing that will be described in detail later using the hardware thereof.

ファイルアクセス部30とスナップショット部31は共に、バックアップ装置4に対するインターフェイスとして機能する。具体的には、ファイルアクセス部30は、バックアップ装置4からのデータ送信要求を処理する手段である。   Both the file access unit 30 and the snapshot unit 31 function as an interface to the backup device 4. Specifically, the file access unit 30 is means for processing a data transmission request from the backup device 4.

スナップショット部31は、バックアップ装置4からのスナップショット生成に係る要求を処理する手段である。   The snapshot unit 31 is means for processing a request relating to snapshot generation from the backup device 4.

複製ファイルシステム部32は、分散ファイルシステムが記憶する全ファイルのメタデータの複製と、分散ファイルシステムが記憶する一部のファイルに関する実データの複製と、残りの実データを記憶する分散ノードを特定するための情報と、を管理する手段である。つまり、複製ファイルシステム管理装置5は、その内部に分散ノード3からなる分散ファイルシステム本体の複製を有することにより、ファイルシステム本体に対する仮想的なファイルシステムを構築し、管理する。   The duplicate file system unit 32 specifies a copy of the metadata of all files stored in the distributed file system, a copy of actual data regarding some files stored in the distributed file system, and a distributed node that stores the remaining actual data. It is a means to manage information to do. In other words, the duplicate file system management apparatus 5 constructs and manages a virtual file system for the file system main body by having a copy of the distributed file system main body composed of the distributed nodes 3 therein.

複製ファイルシステム管理装置5にて、分散ファイルシステムが対象とする全ファイルの実データを記憶することが考えられる。しかし、複製ファイルシステム管理装置5にて、分散ファイルシステム全体が記憶する全データを記憶しようとすると、分散ファイルシステム自身の容量と同じ容量(同じ容量の記憶媒体)が必要となる。そこで、第1の実施形態に係る複製ファイルシステム管理装置5では、所定の条件を満たすファイルを複製ファイルシステム管理装置5に記憶し、当該条件を満たさないファイルは分散ノード3での記憶に留める。   It can be considered that the duplicate file system management apparatus 5 stores the actual data of all files targeted by the distributed file system. However, if the replicated file system management device 5 tries to store all data stored in the entire distributed file system, the same capacity (storage medium having the same capacity) as the capacity of the distributed file system itself is required. Therefore, in the duplicate file system management apparatus 5 according to the first embodiment, a file that satisfies a predetermined condition is stored in the duplicate file system management apparatus 5, and a file that does not satisfy the condition is stored in the distributed node 3.

所定の条件には、例えば、ファイルのサイズを条件とすることができる。より具体的には、サイズの大きいファイルは分散ノード3に記憶し、サイズの小さいファイルは複製ファイルシステム管理装置5にも記憶するという条件である。実際には、予め閾値を設定し、当該閾値により複製ファイルシステム管理装置5に実データを記憶するか否かを定める。本実施形態では、サイズが閾値以下のファイルを複製ファイルシステム管理装置5に記憶(複製)するものとして、説明する。ただし、所定の条件をファイルのサイズに限定する趣旨ではない。例えば、ファイルの種別(例えば、テキストファイルやバイナリファイル)等を所定の条件としてもよい。   The predetermined condition can be, for example, a file size. More specifically, it is a condition that a large file is stored in the distributed node 3 and a small file is also stored in the duplicate file system management apparatus 5. Actually, a threshold value is set in advance, and whether or not actual data is stored in the duplicate file system management apparatus 5 is determined based on the threshold value. In the present embodiment, a description will be given assuming that a file having a size equal to or smaller than a threshold value is stored (replicated) in the replicated file system management apparatus 5. However, the predetermined condition is not limited to the file size. For example, the file type (for example, text file or binary file) or the like may be set as the predetermined condition.

複製ファイルシステム部32は、間接データ記憶部201と、間接データ参照部202と、転送実データ記憶部203と、実データ参照部204と、転送メタデータ記憶部205と、を含んで構成される。   The duplicate file system unit 32 includes an indirect data storage unit 201, an indirect data reference unit 202, a transfer actual data storage unit 203, an actual data reference unit 204, and a transfer metadata storage unit 205. .

間接データ記憶部201は、分散ファイルシステムを構成する複数の分散ノード3のなかから、ファイルが格納された分散ノード3を特定するために必要な情報(以下、間接データと表記する)を記憶する。なお、ファイルが格納される分散ノード3を特定するための間接データは、分散ファイルシステムのデータ格納方式に応じて適宜、選択される情報である。例えば、間接データ記憶部201は、ファイルの識別子と当該ファイルを記憶する分散ノード3のノード番号をペアとするような情報を記憶する。   The indirect data storage unit 201 stores information (hereinafter referred to as indirect data) necessary for specifying the distributed node 3 in which the file is stored among the plurality of distributed nodes 3 constituting the distributed file system. . The indirect data for specifying the distributed node 3 in which the file is stored is information that is appropriately selected according to the data storage method of the distributed file system. For example, the indirect data storage unit 201 stores information such that a file identifier and a node number of the distributed node 3 storing the file are paired.

間接データ参照部202は、間接データ記憶部201が記憶する情報に基づき、分散ノード3に格納されたファイルにアクセスする手段である。   The indirect data reference unit 202 is a means for accessing a file stored in the distributed node 3 based on information stored in the indirect data storage unit 201.

転送実データ記憶部203は、ファイルシステム統合装置2から転送されてくるファイルのうち、所定の条件を満たすファイルの実データを記憶する。本実施形態では、上述のように、サイズが閾値以下のファイルが、転送実データ記憶部203に記憶される。   The transfer actual data storage unit 203 stores the actual data of a file that satisfies a predetermined condition among the files transferred from the file system integration device 2. In the present embodiment, as described above, the file whose size is equal to or smaller than the threshold value is stored in the transfer actual data storage unit 203.

実データ参照部204は、転送実データ記憶部203が記憶するファイルにアクセスするための手段である。   The actual data reference unit 204 is a means for accessing a file stored in the transfer actual data storage unit 203.

転送メタデータ記憶部205は、ファイルシステム統合装置2から転送されてくる全ファイルのメタデータを記憶する。メタデータは、実データと比較すれば、そのサイズは極めて小さく、分散ノード3に記憶される全データのメタデータを記憶したとしても記憶に必要な容量は限定的である。   The transfer metadata storage unit 205 stores metadata of all files transferred from the file system integration device 2. Compared with actual data, the size of the metadata is extremely small, and even if metadata of all data stored in the distributed node 3 is stored, the capacity required for storage is limited.

次に、分散ファイルシステムの動作について説明する。分散ファイルシステムの動作に関する説明は、分散ノード3へのファイルの書き込み、分散ノード3からのバックアップの実施等、機能ごとに行う。   Next, the operation of the distributed file system will be described. The description of the operation of the distributed file system will be made for each function, such as writing a file to the distributed node 3 and performing a backup from the distributed node 3.

<クライアント1からのファイル書き込み要求への対応>
図3は、クライアント1からファイル書き込み要求があった場合の動作の一例を示すシーケンス図である。
<Response to file write request from client 1>
FIG. 3 is a sequence diagram illustrating an example of an operation when a file write request is issued from the client 1.

ステップS101において、クライアント1は、ファイルシステム統合装置2に対し、ファイル書き込み要求を送信する。   In step S <b> 101, the client 1 transmits a file write request to the file system integration apparatus 2.

ステップS102において、ファイルシステム統合装置2の分散格納部11は、当該要求に応じて、分散ノード3に対し、ファイルデータ又はその各断片の格納要求を行う。   In step S <b> 102, the distributed storage unit 11 of the file system integration device 2 requests the distributed node 3 to store file data or each fragment thereof in response to the request.

その際、ファイルシステム統合装置2のファイル転送部12は、分散ノード3に格納しようとするファイルを複製ファイルシステム管理装置5に転送する(ステップS103)。つまり、ファイル転送部12は、分散格納部11が行うのと同等のファイル書き込み要求を、複製ファイルシステム管理装置5に行う。   At that time, the file transfer unit 12 of the file system integration device 2 transfers the file to be stored in the distributed node 3 to the replication file system management device 5 (step S103). That is, the file transfer unit 12 sends a file write request equivalent to that performed by the distributed storage unit 11 to the duplicate file system management apparatus 5.

なお、図3において、ステップS102の後にステップS103を実行するように記載しているが、処理の実行順を限定する趣旨ではなく、これらの実行順が逆でもよいし、並列に(同時に)に実行されてもよい。   In FIG. 3, it is described that step S103 is executed after step S102. However, this is not intended to limit the execution order of the processes, and these execution orders may be reversed or in parallel (simultaneously). May be executed.

ステップS104において、分散ノード3は、受信した書き込み要求に基づき、データ記憶部20に実データを、メタデータ記憶部21に対応するメタデータを、それぞれ格納する。   In step S <b> 104, the distributed node 3 stores actual data in the data storage unit 20 and metadata corresponding to the metadata storage unit 21 based on the received write request.

ステップS105において、複製ファイルシステム部32は、ファイル転送部12から受信したファイル書き込み要求に対し、受信したファイルのメタデータを、転送メタデータ記憶部205に格納する。   In step S <b> 105, the duplicate file system unit 32 stores the received file metadata in the transfer metadata storage unit 205 in response to the file write request received from the file transfer unit 12.

ステップS106において、複製ファイルシステム部32は、転送ファイルのサイズが閾値より大きいか否かを判定し、判定結果に基づいて、間接データ記憶部201へのデータ格納、又は、転送実データ記憶部203への実データの格納のいずれかを行う(ステップS107、S108)。   In step S106, the duplicate file system unit 32 determines whether or not the size of the transfer file is larger than the threshold, and based on the determination result, stores the data in the indirect data storage unit 201 or the transfer actual data storage unit 203. One of the actual data is stored (steps S107 and S108).

転送ファイルのファイルサイズが閾値よりも大きい場合には、複製ファイルシステム部32は、当該ファイルが格納される分散ノード3を特定するための情報(間接データ)を間接データ記憶部201に格納する(ステップS107)。   When the file size of the transfer file is larger than the threshold, the duplicate file system unit 32 stores information (indirect data) for specifying the distributed node 3 in which the file is stored in the indirect data storage unit 201 ( Step S107).

一方、ファイルサイズが閾値以下である場合には、複製ファイルシステム部32は、当該所定の条件を満たす実データを、転送実データ記憶部203に格納する。   On the other hand, when the file size is equal to or smaller than the threshold value, the duplicate file system unit 32 stores the actual data satisfying the predetermined condition in the transfer actual data storage unit 203.

なお、図3を参照して説明した動作は、クライアント1からのファイル書き込み要求に応じたものである。クライアント1からファイル更新要求があった場合も、図3に準ずる動作を行う。   The operation described with reference to FIG. 3 is in response to a file write request from the client 1. Even when there is a file update request from the client 1, the operation according to FIG. 3 is performed.

ただし、その場合には、分散ノード3には既に対象とするファイルは存在するため、ステップS104における分散ノード3の動作は「ファイルの更新」となる。また、当該更新ファイルのメタデータも複製ファイルシステム管理装置5に存在するため、ステップS105における当該装置の動作は「メタデータの更新」となる。   However, in this case, since the target file already exists in the distributed node 3, the operation of the distributed node 3 in step S104 is “file update”. Further, since the metadata of the update file also exists in the duplicate file system management apparatus 5, the operation of the apparatus in step S105 is “metadata update”.

一方、更新ファイルのサイズは変更になることがあって、更新ファイルが所定の条件を満たすか否かは定かではない。そこで、複製ファイルシステム管理装置5は、更新ファイルに対し、ステップS106〜S108に係る動作を再び実行する。   On the other hand, the size of the update file may change, and it is not certain whether the update file satisfies a predetermined condition. Therefore, the duplicate file system management apparatus 5 executes again the operations according to steps S106 to S108 for the update file.

<スナップショットの取得>
バックアップ装置4は、分散ファイルシステムの管理者等により予め定められたスケジュールに従って、分散ファイルシステムのバックアップを実施する。バックアップの実施に先立って、バックアップ装置4は、スナップショットの生成指示を複製ファイルシステム管理装置5に対して行う。
<Get snapshot>
The backup device 4 performs backup of the distributed file system according to a schedule predetermined by a distributed file system administrator or the like. Prior to performing the backup, the backup device 4 instructs the replication file system management device 5 to generate a snapshot.

図4は、分散ファイルシステムのスナップショット生成に係る動作の一例を示すシーケンス図である。   FIG. 4 is a sequence diagram illustrating an example of operations related to snapshot generation of the distributed file system.

ステップS201において、バックアップ装置4は、複製ファイルシステム管理装置5に対して、スナップショット生成指示を送信する。   In step S <b> 201, the backup device 4 transmits a snapshot generation instruction to the duplicate file system management device 5.

ステップS202において、スナップショット部31は、ファイルシステム統合装置2に対して、スナップショット取得(採取)の指示を行う。   In step S <b> 202, the snapshot unit 31 instructs the file system integration apparatus 2 to acquire (collect) a snapshot.

ステップS203において、ファイルシステム統合装置2は、スナップショット取得に係る処理を実行する。   In step S203, the file system integration device 2 executes processing related to snapshot acquisition.

図5は、ファイルシステム統合装置2のスナップショット取得処理に係る動作の一例を示すフローチャートである。図5を参照しつつ、ファイルシステム統合装置2によるスナップショット取得に係る動作を説明する。   FIG. 5 is a flowchart illustrating an example of an operation related to the snapshot acquisition process of the file system integration apparatus 2. With reference to FIG. 5, an operation related to snapshot acquisition by the file system integration apparatus 2 will be described.

初めに、スナップショット制御部13は、スナップショット取得指示を受け付けた時点を境としてファイルの世代を管理する(ステップS301)。具体的には、スナップショット制御部13は、スナップショット取得指示を受領した時点で、世代Aを完了し、その後世代Bが開始されることを認識する。   First, the snapshot control unit 13 manages the generation of a file from the point in time when the snapshot acquisition instruction is received (step S301). Specifically, the snapshot control unit 13 recognizes that generation A is completed and generation B is started thereafter when a snapshot acquisition instruction is received.

スナップショット制御部13は、スナップショット取得指示の受信以降、分散ノード3や複製ファイルシステム管理装置5に送信しようとするファイルに世代Bを意味するタグを付与する(ステップS302)。なお、スナップショット取得指示の受信以前のファイル書き込み、ファイル更新要求時に送信されたファイルには、世代Aのタグが付与されている。   After receiving the snapshot acquisition instruction, the snapshot control unit 13 assigns a tag indicating generation B to the file to be transmitted to the distributed node 3 and the replication file system management apparatus 5 (step S302). Note that a generation A tag is assigned to a file transmitted at the time of a file write / file update request prior to reception of the snapshot acquisition instruction.

次に、スナップショット制御部13は、ファイル転送部12に、世代Bのタグが付与されたファイルに関する書き込み、更新要求を、複製ファイルシステム管理装置5に送信するのを中断させる(ステップS303)。世代Bのタグが付与されたファイルの送信を中断することで、世代Aのタグが付与されたファイルに対する書き込み処理、更新処理が複製ファイルシステム管理装置5にて完了するのを待機する(ステップS304)。   Next, the snapshot control unit 13 causes the file transfer unit 12 to interrupt transmission of a write / update request regarding a file with the generation B tag to the replication file system management apparatus 5 (step S303). By interrupting the transmission of the file with the generation B tag, the process waits for the replication file system management apparatus 5 to complete the write processing and update processing for the file with the generation A tag (step S304). ).

次に、スナップショット制御部13は、複製ファイルシステム管理装置5に対して、スナップショットの取得を指示する(ステップS305)。スナップショット取得指示を受け取った複製ファイルシステム管理装置5は、転送実データ記憶部203及び転送メタデータ記憶部205のスナップショットを取得する。   Next, the snapshot control unit 13 instructs the replication file system management apparatus 5 to acquire a snapshot (step S305). Upon receiving the snapshot acquisition instruction, the duplicate file system management apparatus 5 acquires snapshots of the transfer actual data storage unit 203 and the transfer metadata storage unit 205.

その後、スナップショット制御部13は、複製ファイルシステム管理装置5からスナップショット取得完了に関する応答を受信する(ステップS306)。なお、当該応答を受信した後は、ファイル転送部12は、世代Bのタグが付与されたファイルの書き込み、更新要求を複製ファイルシステム管理装置5に送信できるようになる。   Thereafter, the snapshot control unit 13 receives a response regarding the completion of snapshot acquisition from the replication file system management apparatus 5 (step S306). After receiving the response, the file transfer unit 12 can transmit a write / update request for the file with the generation B tag to the replication file system management apparatus 5.

スナップショット制御部13は、ステップS303〜S306の動作と並行して、分散ノード3に対するスナップショット取得に係る処理を行う(ステップS307)。つまり、スナップショット制御部13は、ステップS303〜S306と同様の処理を、分散ノード3に対して行う。   The snapshot control unit 13 performs processing related to snapshot acquisition for the distributed node 3 in parallel with the operations of steps S303 to S306 (step S307). That is, the snapshot control unit 13 performs the same processing as steps S303 to S306 on the distributed node 3.

具体的には、スナップショット制御部13は、分散格納部11に、世代Bのタグが付与されたファイルに関する書き込み、更新要求を、各分散ノード3に送信するのを中断させる。スナップショット制御部13は、世代Bのタグが付与されたファイルの転送を中断することで、世代Aのタグが付与されたファイルに対する書き込み処理、更新処理が各分散ノード3にて完了するのを待機する。   Specifically, the snapshot control unit 13 causes the distributed storage unit 11 to interrupt transmission of a write / update request regarding a file with a generation B tag to each distributed node 3. The snapshot control unit 13 interrupts the transfer of the file with the generation B tag so that the writing process and the update process for the file with the generation A tag are completed in each distributed node 3. stand by.

その後、スナップショット制御部13は、世代Aのタグが付与されたファイルの書き込み、更新要求に係る処理が完了した分散ノード3に対して、スナップショットの取得を指示する。スナップショット取得指示を受け取った分散ノード3は、データ記憶部20及びメタデータ記憶部21のスナップショットを取得する。   Thereafter, the snapshot control unit 13 instructs the distributed node 3 that has completed processing related to the writing and update request of the file with the generation A tag to acquire a snapshot. The distributed node 3 that has received the snapshot acquisition instruction acquires a snapshot of the data storage unit 20 and the metadata storage unit 21.

その後、スナップショット制御部13は、スナップショット取得完了に関する応答を分散ノード3から受信する。また、スナップショット取得完了に関する応答を受信した後は、分散格納部11は、当該応答を送信してきた分散ノード3に対し、世代Bのタグが付与されたファイルの書き込み、更新要求を送信する。   Thereafter, the snapshot control unit 13 receives a response regarding completion of snapshot acquisition from the distributed node 3. In addition, after receiving a response regarding the completion of snapshot acquisition, the distributed storage unit 11 transmits a write / update request for a file with a generation B tag to the distributed node 3 that has transmitted the response.

このように、スナップショット制御部13は、複製ファイルシステム管理装置5に転送されたファイルのうち、古い世代のファイルに関する処理が完了したことを確認し、その後、複製ファイルシステム管理装置5に対して、スナップショット取得指示を行う。スナップショット制御部13は、分散ノード3に対しても、同様のスナップショット取得指示を行う。   In this way, the snapshot control unit 13 confirms that the processing related to the old generation file among the files transferred to the replication file system management apparatus 5 has been completed, and then the replication file system management apparatus 5 Instruct the snapshot acquisition. The snapshot control unit 13 issues a similar snapshot acquisition instruction to the distributed node 3 as well.

図4における説明に戻ると、複製ファイルシステム管理装置5及び分散ノード3からスナップショット取得完了に関する応答を受信したファイルシステム統合装置2は、スナップショット取得完了通知を複製ファイルシステム管理装置5に対して送信する(ステップS204)。   Returning to the description of FIG. 4, the file system integration apparatus 2 that has received the response regarding the completion of snapshot acquisition from the replication file system management apparatus 5 and the distributed node 3 sends a snapshot acquisition completion notification to the replication file system management apparatus 5. Transmit (step S204).

当該通知を受信した複製ファイルシステム管理装置5は、バックアップ装置4に対して、スナップショットの生成が完了した旨を通知する(ステップS205)。   The duplicate file system management apparatus 5 that has received the notification notifies the backup apparatus 4 that the generation of the snapshot has been completed (step S205).

<バックアップ対象の決定>
スナップショットの作成が正常に終了すると、バックアップ装置4はバックアップするファイルを決定する。
<Determining backup target>
When the creation of the snapshot ends normally, the backup device 4 determines a file to be backed up.

図6は、分散ファイルシステムのバックアップファイルの決定に係る動作の一例を示すシーケンス図である。   FIG. 6 is a sequence diagram illustrating an example of an operation related to determination of a backup file in the distributed file system.

ステップS401において、バックアップ装置4は、複製ファイルシステム管理装置5に対して、分散ファイルシステムにて記憶されているファイルの属性情報を含む一覧を要求する。   In step S401, the backup device 4 requests the duplicate file system management device 5 for a list including attribute information of files stored in the distributed file system.

ステップS402において、複製ファイルシステム管理装置5のファイルアクセス部30は、複製ファイルシステム部32に、当該情報要求の処理を依頼する。複製ファイルシステム部32は、転送メタデータ記憶部205から各ファイルの属性情報(例えば、当該ファイルの更新日時等)を取得し、取得した情報をファイルアクセス部30に返信する。   In step S402, the file access unit 30 of the duplicate file system management apparatus 5 requests the duplicate file system unit 32 to process the information request. The duplicate file system unit 32 acquires attribute information (for example, update date / time of the file) of each file from the transfer metadata storage unit 205 and returns the acquired information to the file access unit 30.

ファイルアクセス部30は、受信したファイルの属性情報(一覧情報)を、バックアップ装置4に返信する。つまり、ファイルアクセス部30は、複製ファイルシステム部32の転送メタデータ記憶部205が記憶するメタデータを取得し、バックアップ装置4に応答する。   The file access unit 30 returns the received file attribute information (list information) to the backup device 4. That is, the file access unit 30 acquires the metadata stored in the transfer metadata storage unit 205 of the duplicate file system unit 32 and responds to the backup device 4.

バックアップ装置4は、取得したファイルの属性情報に基づき、バックアップするファイルを決定する(ステップS403)。例えば、バックアップ装置4は、前回バックアップを実施した時点以降に、更新されたファイルをバックアップの対象とする。   The backup device 4 determines a file to be backed up based on the acquired file attribute information (step S403). For example, the backup device 4 sets a file that has been updated since the time of the previous backup as a backup target.

<実データのバックアップ>
次に、バックアップ装置4は、バックアップファイルの実データに関する送信要求を、複製ファイルシステム管理装置5に対して行う。
<Actual data backup>
Next, the backup device 4 makes a transmission request regarding the actual data of the backup file to the duplicate file system management device 5.

図7は、分散ファイルシステムの実データのバックアップに係る動作の一例を示すシーケンス図である。   FIG. 7 is a sequence diagram illustrating an example of operations related to actual data backup in the distributed file system.

ステップS501において、バックアップ装置4は、複製ファイルシステム管理装置5に対して、バックアップファイルに係る実データの送信を要求する。当該要求を受けた、複製ファイルシステム管理装置5のファイルアクセス部30は、当該送信要求の処理を複製ファイルシステム部32に依頼する(ステップS502)。   In step S501, the backup device 4 requests the replication file system management device 5 to transmit actual data related to the backup file. Upon receiving the request, the file access unit 30 of the duplicate file system management apparatus 5 requests the duplicate file system unit 32 to process the transmission request (step S502).

図8は、複製ファイルシステム管理装置5のバックアップファイル送信要求を処理する際の動作の一例を示すフローチャートである。図8を参照しつつ、複製ファイルシステム管理装置5によるバックアップファイル送信要求を処理する動作を説明する。   FIG. 8 is a flowchart showing an example of the operation when the replication file system management apparatus 5 processes the backup file transmission request. The operation of processing a backup file transmission request by the duplicate file system management apparatus 5 will be described with reference to FIG.

ステップS601において、複製ファイルシステム部32は、要求されたバックアップファイルが所定の条件を満たすか否かを判定する。具体的には、複製ファイルシステム部32は、要求されたバックファイルのファイルサイズが予め定めた閾値以下であるか否かを判定する。   In step S601, the duplicate file system unit 32 determines whether the requested backup file satisfies a predetermined condition. Specifically, the duplicate file system unit 32 determines whether the requested file size of the back file is equal to or smaller than a predetermined threshold.

要求されたバックファイルのファイルサイズが予め定めた閾値より大きい場合(ステップS601、No分岐)には、複製ファイルシステム部32は、間接データ参照部202を動作させる。具体的には、ステップS602において、間接データ参照部202は、間接データ記憶部201が記憶する情報に基づいて、要求されたファイルを記憶している分散ノード3を特定し、当該分散ノード3に対して直近のスナップショット世代におけるファイルの実データの送信要求を行う。   When the file size of the requested back file is larger than a predetermined threshold (step S601, No branch), the duplicate file system unit 32 operates the indirect data reference unit 202. Specifically, in step S602, the indirect data reference unit 202 identifies the distributed node 3 storing the requested file based on the information stored in the indirect data storage unit 201, and the distributed node 3 On the other hand, a request for transmission of actual file data in the latest snapshot generation is made.

ステップS603において、間接データ参照部202は、分散ノード3から取得した実データを、ファイルアクセス部30に応答する。   In step S <b> 603, the indirect data reference unit 202 responds to the file access unit 30 with the actual data acquired from the distributed node 3.

一方、要求されたバックファイルのファイルサイズが予め定めた閾値以下の場合(ステップS601、Yes分岐)には、複製ファイルシステム部32は、実データ参照部204を動作させる。具体的には、ステップS604において、実データ参照部204は、転送実データ記憶部203が記憶する直近のスナップショット世代におけるファイルの実データを、ファイルアクセス部30に応答する。   On the other hand, when the file size of the requested back file is equal to or smaller than a predetermined threshold (step S601, Yes branch), the duplicate file system unit 32 operates the actual data reference unit 204. Specifically, in step S604, the actual data reference unit 204 responds to the file access unit 30 with the actual data of the file in the latest snapshot generation stored in the transfer actual data storage unit 203.

ステップS605において、ファイルアクセス部30は、間接データ参照部202又は実データ参照部204から取得した実データを、バックアップ装置4に送信する。   In step S <b> 605, the file access unit 30 transmits the actual data acquired from the indirect data reference unit 202 or the actual data reference unit 204 to the backup device 4.

このように、ファイルアクセス部30は、バックアップ装置4から、バックアップファイルの実データの送信に係る要求を受けた場合には、所定の条件に基づき、分散ノード3が記憶する実データ又は転送実データ記憶部203が記憶する実データのいずれかを、バックアップ装置4に送信する。   As described above, when the file access unit 30 receives a request for transmission of the actual data of the backup file from the backup device 4, the actual data or the transfer actual data stored in the distributed node 3 based on a predetermined condition. Any real data stored in the storage unit 203 is transmitted to the backup device 4.

図7に戻ると、ステップS503において、バックアップ装置4は、受信した実データのバックアップを行う。   Returning to FIG. 7, in step S503, the backup device 4 backs up the received actual data.

なお、第1の実施形態では、ファイルシステム統合装置2は、クライアント1から受信した全てのファイル書き込み要求に関し、当該ファイルを複製ファイルシステム管理装置5に転送する形態について説明した。しかし、全てのファイルを複製ファイルシステム管理装置5に転送することに限定する趣旨ではない。例えば、分散ノード3に格納されるファイルであってもバックアップする必要がないファイル等であれば、複製ファイルシステム管理装置5に転送する必要はない。   In the first embodiment, the file system integration apparatus 2 has been described with respect to all file write requests received from the client 1 and transfers the file to the duplicate file system management apparatus 5. However, the present invention is not limited to transferring all files to the duplicate file system management apparatus 5. For example, even if the file is stored in the distributed node 3 and is not required to be backed up, it is not necessary to transfer it to the duplicate file system management apparatus 5.

さらに、第1の実施形態では、複製ファイルシステム管理装置5の転送メタデータ記憶部205は、転送されてきた全てのファイルのメタデータを記憶する形態について説明した。しかし、転送メタデータ記憶部205にて、全ファイルのメタデータを記憶することに限定する趣旨ではない。例えば、バックアップの対象とならないことが予め判明しているファイルであれば、転送されてきたファイルのメタデータを記憶する必要はない。   Furthermore, in the first embodiment, the transfer metadata storage unit 205 of the duplicate file system management apparatus 5 has been described with respect to the form of storing the metadata of all transferred files. However, the transfer metadata storage unit 205 is not limited to storing the metadata of all files. For example, in the case of a file that is previously determined not to be a backup target, it is not necessary to store the metadata of the transferred file.

以上のように、第1の実施形態に係る分散ファイルシステムでは、メタデータやサイズの小さいファイルを単一のノード(複製ファイルシステム管理装置5)に集約している。そのため、これらの情報を取得する際に、分散ノード3へのアクセスを要しない。その結果、分散ファイルシステムのバックアップを行う際のオーバーヘッドが減少し、バックアップ処理時の性能向上(例えば、バックアップの高速化)が達成できる。   As described above, in the distributed file system according to the first embodiment, metadata and small-sized files are collected in a single node (replicated file system management apparatus 5). Therefore, access to the distributed node 3 is not required when acquiring such information. As a result, overhead when performing backup of the distributed file system is reduced, and performance improvement during backup processing (for example, faster backup) can be achieved.

また、必ずしも分散ファイルシステムに限ることではないが、バックアップの負荷が、分散ファイルシステムを使用する業務の性能に影響を与えることがある。このような影響を避けるための技術として、システムの冗長性を利用して、業務とバックアップの負荷を分離する技術が存在する。   Further, although not necessarily limited to a distributed file system, the backup load may affect the performance of a job that uses the distributed file system. As a technique for avoiding such an influence, there is a technique for separating work load and backup load by utilizing system redundancy.

例えば、図9に示すように、各分散ノード3a、3c、3eの複製を行い、分散ノード3b、3d、3fを生成する。ファイルシステム統合装置2aは、分散ノードに対して通常のアクセス(実線にて図示するアクセス)を行う場合には、複製元の分散ノードにアクセスする。一方、ファイルシステム統合装置2aは、分散ノードからバックアップデータを読み出すアクセス(点線にて図示するアクセス)を行う場合には、複製された分散ノードにアクセスする。   For example, as shown in FIG. 9, the distributed nodes 3a, 3c, and 3e are duplicated to generate distributed nodes 3b, 3d, and 3f. When the file system integration device 2a performs normal access to the distributed node (access shown by a solid line), the file system integration device 2a accesses the replication source distributed node. On the other hand, the file system integration apparatus 2a accesses the replicated distributed node when performing access (access indicated by a dotted line) for reading backup data from the distributed node.

あるいは、図10に示すように、分散ノード3g〜3iに含まれるデータ記憶部20bのそれぞれに同じファイルAを格納し、通常のアクセスとバックアップ用のアクセスを分離することが考えられる。具体的には、バックアップ用のアクセスと通常のアクセスのトラフィックを分離し、通常業務とバックアップでは、別ノードがデータ要求に応答するようにファイルシステム統合装置2bの処理をディスパッチすることも考えられる。   Alternatively, as shown in FIG. 10, it can be considered that the same file A is stored in each of the data storage units 20b included in the distributed nodes 3g to 3i to separate normal access and backup access. Specifically, backup access and normal access traffic are separated, and in normal business and backup, another node may dispatch the processing of the file system integration apparatus 2b so that it responds to a data request.

このように、システムの冗長性を利用して、分散ノードにおける負荷の競合を避けることで、バックアップの負荷による業務への影響を緩和することができる。しかし、このような方法であっても、ファイルシステム統合装置2a、2bにおける負荷の競合は解消されない。   In this way, by using the redundancy of the system and avoiding the load contention in the distributed nodes, it is possible to mitigate the influence on the business due to the backup load. However, even with such a method, load contention in the file system integration apparatuses 2a and 2b cannot be resolved.

一方、第1の実施形態に係る分散ファイルシステムでは、複製ファイルシステム管理装置5が、独立した転送メタデータ記憶部205と、ファイルアクセス部30を備えているため、バックアップ時のアクセスを完全に分離しつつ、バックアップ対象のファイルのリスト化や属性値を参照するなどの処理を、内蔵するメタデータを用いて行うことができる。つまり、ファイルシステム統合装置2や分散ノード3からなる分散ファイルシステム本体とは独立して、バックアップ装置4の要求に対応できるので、バックアップ時の業務への影響を軽減できる。   On the other hand, in the distributed file system according to the first embodiment, the duplicate file system management apparatus 5 includes the independent transfer metadata storage unit 205 and the file access unit 30, so that access at the time of backup is completely separated. However, processing such as listing of files to be backed up and referring to attribute values can be performed using the built-in metadata. That is, since it is possible to respond to the request of the backup device 4 independently of the distributed file system main body composed of the file system integration device 2 and the distributed node 3, the influence on the business at the time of backup can be reduced.

また、類似領域であるブロックレベルストレージでは、業務との競合の問題に対応するため、図11に示すように、ブロックストレージ制御部50の制御下にあるデータ記憶部51全体を、別のブロックストレージ制御部50aの制御下にあるデータ記憶部51aに複製することが考えられる。この場合、バックアップ装置4cからのアクセスを完全に分離し、通常業務とバックアップの負荷が分離できる。しかし、このような対応では、機器全体を2セット(又はそれ以上)用意する必要があり、経済的ではない。   Further, in the block level storage which is a similar area, in order to cope with the problem of competition with business, as shown in FIG. 11, the entire data storage unit 51 under the control of the block storage control unit 50 is transferred to another block storage. It is conceivable to replicate in the data storage unit 51a under the control of the control unit 50a. In this case, access from the backup device 4c can be completely separated, and the load of normal work and backup can be separated. However, in such a correspondence, it is necessary to prepare two sets (or more) of the entire device, which is not economical.

一方、第1の実施形態に係る分散ファイルシステムでは、機器全体を複製せず、且つ、バックアップと通常業務の分離を実現できている。   On the other hand, in the distributed file system according to the first embodiment, the entire device is not duplicated, and separation of backup and normal business can be realized.

また、特許文献2が開示するように、複製するファイルを一部のファイルに限定すれば、複製側で必要とされる容量、機材が抑制できる。しかし、特許文献2が開示する技術では、特定の基準により予めバックアップ対象を絞ることができない場合には適用できない。   Further, as disclosed in Patent Document 2, if the files to be replicated are limited to a part of the files, the capacity and equipment required on the replication side can be suppressed. However, the technique disclosed in Patent Document 2 cannot be applied when the backup target cannot be narrowed down in advance according to a specific standard.

一方、第1の実施形態に係る分散ファイルシステムでは、複製ファイルシステム管理装置5が所定の条件に基づき、ファイルの複製を絞り込み、絞り込みから漏れたファイルに関しては分散ノード3から取得するため、バックアップの対象に対する限定は存在しない。   On the other hand, in the distributed file system according to the first embodiment, the duplicate file system management apparatus 5 narrows down the file copy based on a predetermined condition, and the files that are leaked from the narrow down are obtained from the distributed node 3, so that the backup There is no limitation on the subject.

さらに、バックアップのデータはファイルシステムとして矛盾のないものである必要があるが、複数のノードから構成される分散ファイルシステムでは、全体として矛盾のないデータをバックアップするのが困難である。また、バックアップを、より意味のあるものとするため、バックアップ処理中は記憶データの内容が変化しないよう固定する必要がある。より具体的には、ファイルAはバックアップされているが、ファイルAより前に分散ファイルシステムに格納されたファイルBがバックアップされていないといった状況は避ける必要がある。   Further, the backup data needs to be consistent as a file system, but in a distributed file system composed of a plurality of nodes, it is difficult to back up consistent data as a whole. Further, in order to make backup more meaningful, it is necessary to fix the content of stored data so that it does not change during backup processing. More specifically, the situation where the file A is backed up but the file B stored in the distributed file system before the file A is not backed up must be avoided.

そのため、ファイルシステム全体のある瞬間のイメージであるスナップショットを取得し、そのスナップショットのデータをバックアップの対象とする。しかし、分散ファイルシステムは複数のノードから構成されるため、ノード間で共通の瞬間(タイミング)を定義できず、スナップショットの取得が困難である。   Therefore, a snapshot that is an image of the entire file system is acquired, and the data of the snapshot is used as a backup target. However, since the distributed file system is composed of a plurality of nodes, a common moment (timing) cannot be defined between the nodes, and it is difficult to obtain a snapshot.

第1の実施形態に係る分散ファイルシステムでは、複製ファイルシステム管理装置5が集中型NASの構成を採用しているため、「分散ファイルシステムが複製された仮想ファイルシステム側でのスナップショット取得時点」として静止点を定義できるので、分散ファイルシステムとしての静止点にてバックアップが可能となる。   In the distributed file system according to the first embodiment, since the replicated file system management apparatus 5 employs a centralized NAS configuration, the “snapshot acquisition time on the virtual file system side where the distributed file system is replicated” Since a quiesce point can be defined as, backup can be performed at the quiesce point as a distributed file system.

また、複製ファイルシステム管理装置5から分散ノード3へのアクセスを可能とすることで、分散ファイルシステムが記憶の対象とする全ファイルに関する実データを複製ファイルシステム管理装置5に記憶する必要がない。そのため、分散ファイルシステムの複製を集中型NASに取得するための高性能・高信頼性・大容量のNASを必要としない。   In addition, by enabling access from the duplicate file system management apparatus 5 to the distributed node 3, it is not necessary to store actual data relating to all files to be stored in the distributed file system in the duplicate file system management apparatus 5. Therefore, a high-performance, high-reliability, large-capacity NAS for acquiring a copy of the distributed file system in the centralized NAS is not required.

[第2の実施形態]
続いて、第2の実施形態について図面を参照して詳細に説明する。
[Second Embodiment]
Next, a second embodiment will be described in detail with reference to the drawings.

図12は、第2の実施形態に係る分散ファイルシステムの構成の一例を示す図である。図12において図2と同一構成要素には、同一の符号を付し、その説明を省略する。   FIG. 12 is a diagram illustrating an example of the configuration of the distributed file system according to the second embodiment. 12, the same components as those in FIG. 2 are denoted by the same reference numerals, and the description thereof is omitted.

図12に示すファイルシステム統合装置2cは、更新情報蓄積部14を備える点が、第1の実施形態に係るファイルシステム統合装置2と異なる。また、複製ファイルシステム管理装置5aは、ファイル更新履歴記憶部206を備える点が、第1の実施形態に係る複製ファイルシステム管理装置5と異なる。さらに、複製ファイルシステム管理装置5aでは、間接データ記憶部201が存在しない。   The file system integration device 2c shown in FIG. 12 is different from the file system integration device 2 according to the first embodiment in that an update information storage unit 14 is provided. The duplicate file system management apparatus 5a is different from the duplicate file system management apparatus 5 according to the first embodiment in that it includes a file update history storage unit 206. Further, in the duplicate file system management apparatus 5a, the indirect data storage unit 201 does not exist.

図12に示す更新情報蓄積部14は、複製ファイルシステム管理装置5aに転送されるファイルのバッファとして機能する。   The update information storage unit 14 shown in FIG. 12 functions as a buffer for files transferred to the duplicate file system management apparatus 5a.

ここで、クライアント1からのファイル書き込み、更新要求に対して、ファイル転送部12が、複製ファイルシステム管理装置5aにファイルを転送し、その応答を確認後、クライアント1に応答を返却する方法では、クライアント1への応答性能が悪化する可能性がある。そこで、第2の実施形態では、ファイルシステム統合装置2cの内部に複製ファイルシステム管理装置5aに転送するファイルのバッファを設け、複製ファイルシステム管理装置5aでの複製を非同期にて実行するようにしている。   Here, in response to a file write / update request from the client 1, the file transfer unit 12 transfers the file to the duplicate file system management apparatus 5a, confirms the response, and returns the response to the client 1. The response performance to the client 1 may be deteriorated. Therefore, in the second embodiment, a file buffer to be transferred to the replication file system management apparatus 5a is provided in the file system integration apparatus 2c, and replication in the replication file system management apparatus 5a is executed asynchronously. Yes.

更新情報蓄積部14のバッファサイズは、構成機器の性能や想定するクライアント1からのアクセス頻度に応じて決定されるが、バッファサイズを可変とすることも考えられる。更新情報蓄積部14のバッファが一杯になった場合には、複製ファイルシステム管理装置5aへの書き込みを同期モードに移行するか、管理者に通報して対処を促す、等の対応を実施する。   The buffer size of the update information storage unit 14 is determined according to the performance of the component devices and the assumed access frequency from the client 1, but it is also conceivable to make the buffer size variable. When the buffer of the update information storage unit 14 is full, the writing to the replication file system management device 5a is shifted to the synchronous mode, or the administrator is notified to prompt the countermeasure.

第2の実施形態では、間接データ記憶部201を削除している。これは、以下の2つのケースを想定したものである。   In the second embodiment, the indirect data storage unit 201 is deleted. This assumes the following two cases.

分散ファイルシステムでは、各ファイル(又はファイルの断片)の格納位置を決定する方法は、2つの種類に大別できる。第1の方法は、各ファイルのファイル名等の属性から一意にデータを格納するノードが定まる方式である。第2の方法は、既存のファイル属性等からはデータを格納するノードが一意に定まらない方式である。以降の説明では、第1の方法を決定的方式、第2の方法を非決定的方式と表記する。   In a distributed file system, methods for determining the storage location of each file (or file fragment) can be broadly classified into two types. The first method is a method in which a node for uniquely storing data is determined from attributes such as the file name of each file. The second method is a method in which a node for storing data is not uniquely determined from existing file attributes or the like. In the following description, the first method is referred to as a deterministic method, and the second method is referred to as a non-deterministic method.

第1の実施形態にて説明した分散ファイルシステムでは、非決定的方式を想定したものである。そのため、個々のファイルを格納する分散ノード3に関するノード情報を間接データ記憶部201に保存しておく必要がある。   The distributed file system described in the first embodiment assumes a nondeterministic method. Therefore, it is necessary to store node information related to the distributed node 3 that stores individual files in the indirect data storage unit 201.

決定的方式を採用する場合には、ファイル名等、通常のメタデータとして保存されている属性データから必要なデータが格納されている分散ノード3を計算できる。そのため、決定的方式を採用する場合には、間接データ記憶部201は不要となる。これが、第1のケースである。決定的方式を採用する場合には、間接データ参照部202は、転送メタデータ記憶部205が記憶している属性データから、当該実データが記憶されている分散ノード3を特定し、当該分散ノードから実データを取得することになる。   When the deterministic method is adopted, the distributed node 3 in which necessary data is stored can be calculated from attribute data stored as normal metadata such as a file name. Therefore, in the case of adopting a definitive method, the indirect data storage unit 201 is not necessary. This is the first case. When the deterministic method is adopted, the indirect data reference unit 202 identifies the distributed node 3 in which the actual data is stored from the attribute data stored in the transfer metadata storage unit 205, and the distributed node Actual data will be obtained from

一方、非決定的方式を採用する場合であっても、多少の性能劣化を容認すれば、間接データ参照部202が、クライアント1と同様の方法にて、ファイルシステム統合装置2cを経由して実データを取得することが可能である。ファイルシステム統合装置2cを経由して実データを取得することで、間接データ記憶部201に分散ノード3に関する情報を保存し、分散ファイルシステム本体と矛盾しないように維持するといった複雑な制御が不必要となる。これが、第2のケースである。   On the other hand, even if the non-deterministic method is adopted, if some performance degradation is permitted, the indirect data reference unit 202 performs actual data via the file system integration device 2c in the same manner as the client 1. Is possible to get. By acquiring actual data via the file system integration device 2c, complicated information such as storing information about the distributed node 3 in the indirect data storage unit 201 and maintaining it consistent with the distributed file system main body is unnecessary. It becomes. This is the second case.

第2のケースの場合、間接データ参照部202は、ファイルシステム統合装置2cに対し、該当ファイルの実データを要求し、ファイルシステム統合装置2cからデータを取得する。   In the second case, the indirect data reference unit 202 requests the file system integration device 2c for actual data of the corresponding file, and acquires data from the file system integration device 2c.

ここで、バックアップ装置4の機能を一部、複製ファイルシステム管理装置5aにて実現することが考えられる。例えば、バックアップ装置4がバックアップの対象を決定するのではなく、複製ファイルシステム管理装置5aが前回のバックアップ時からの差分ファイルの実体をバックアップ装置4に提供する形態も考えられる。このような形態での差分バックアップ時には、メタデータを全てチェックし、バックアップ対象ファイルを選別する必要がある。即ち、第1の実施形態にて図2を用いて説明したような構成では、転送メタデータ記憶部205が記憶するメタデータを一通りチェックする必要がある。   Here, a part of the functions of the backup device 4 may be realized by the duplicate file system management device 5a. For example, instead of the backup device 4 deciding the backup target, a configuration in which the duplicate file system management device 5a provides the backup device 4 with the substance of the difference file from the previous backup is also conceivable. When performing differential backup in such a form, it is necessary to check all metadata and select a backup target file. That is, in the configuration described with reference to FIG. 2 in the first embodiment, it is necessary to check all the metadata stored in the transfer metadata storage unit 205.

しかし、複製ファイルシステム管理装置5aは、ファイル更新履歴記憶部206に、ファイルシステム統合装置2cから転送されてくるファイルの更新履歴を記憶しておくことで、転送メタデータ記憶部205をチェックすることなく、前回のバックアップ取得時点以後、更新のあったファイル等を効率良く選別してバックアップ対象を決定できる。   However, the duplicate file system management device 5a checks the transfer metadata storage unit 205 by storing the update history of the files transferred from the file system integration device 2c in the file update history storage unit 206. In addition, it is possible to efficiently select files that have been updated since the last backup acquisition time and determine the backup target.

以上のように、第2の実施形態に係る分散ファイルシステムでは、更新情報蓄積部14を用いることにより、クライアント1への応答性能を向上させるとともに、複製ファイルシステム管理装置5aの一時的な停止や応答遅延に対する耐性を付加できる。また、複製ファイルシステム管理装置5aでは、ファイル更新履歴記憶部206にファイルの更新履歴を記憶することで、バックアップすべき差分ファイルを容易に特定できるようになり、バックアップ性能がより向上する。   As described above, in the distributed file system according to the second embodiment, by using the update information storage unit 14, the response performance to the client 1 is improved, and the replication file system management device 5a is temporarily stopped. Resilience against response delay can be added. Further, in the duplicate file system management apparatus 5a, by storing the file update history in the file update history storage unit 206, the differential file to be backed up can be easily identified, and the backup performance is further improved.

第1及び第2の実施形態にて説明した分散ファイルシステムは、通常業務への影響(性能低下、業務の一時停止)を可能な限り抑制しつつ、効率的にバックアップを取りたい環境下にて運用するのが好適である。   The distributed file system described in the first and second embodiments is effective in an environment where backup is efficiently performed while suppressing the influence on normal business (performance degradation, business suspension) as much as possible. It is preferable to operate.

なお、第1及び第2の実施形態にて説明した分散ファイルシステムの構成及び動作は例示であって、種々の変形が可能である。例えば、複製ファイルシステム管理装置5の全機能又は一部の機能が、ファイルシステム統合装置2に組み込まれていてもよい。一例として、図3に示すステップS106の判断処理をファイル転送部12に組み込み、所定の条件が満たされない場合には、ファイルシステム統合装置2から複製ファイルシステム管理装置5への該当ファイルの転送を省略することが考えられる。   The configuration and operation of the distributed file system described in the first and second embodiments are merely examples, and various modifications can be made. For example, all or some of the functions of the duplicate file system management apparatus 5 may be incorporated in the file system integration apparatus 2. As an example, if the determination process of step S106 shown in FIG. 3 is incorporated in the file transfer unit 12 and a predetermined condition is not satisfied, transfer of the corresponding file from the file system integration apparatus 2 to the duplicate file system management apparatus 5 is omitted. It is possible to do.

上記の実施形態の一部又は全部は、以下の付記のようにも記載され得るが、以下には限られない。   A part or all of the above embodiments can be described as in the following supplementary notes, but is not limited thereto.

[付記1]
ファイルを記憶する複数のノードに対するアクセスを制御する制御装置と、
バックアップ装置からの要求を処理する際に要する情報を管理する管理装置と、
を含み、
前記制御装置は、
前記複数のノードのうち少なくとも1以上のノードにファイルを格納する際に、前記格納しようとするファイルを前記管理装置に転送する転送部を備え、
前記管理装置は、
前記転送されたファイルのメタデータを記憶する第1の記憶部と、
前記転送されたファイルの実データのうち、所定の条件を満たす実データを記憶する第2の記憶部と、
前記バックアップ装置から、前記ノードが記憶するファイルに関するメタデータの送信要求を受けた場合には、前記第1の記憶部が記憶するメタデータを取得して前記バックアップ装置に送信し、前記バックアップ装置から、前記ノードが記憶するファイルの実データの送信要求を受けた場合には、前記第2の記憶部が記憶する実データ及び前記バックアップ装置から送信要求を受けたファイルを記憶するノードが記憶する実データのいずれかを、前記バックアップ装置に送信する、ファイルアクセス部と、
を備える、分散ファイルシステム。
[付記2]
前記管理装置は、
前記複数のノードのうち、前記転送されたファイルに対応するファイルを記憶するノードを特定する情報を記憶する第3の記憶部と、
前記バックアップ装置から送信要求を受けたファイルの実データが前記所定の条件を満たす場合には、前記第2の記憶部が記憶する実データを参照し、前記ファイルアクセス部に応答する第1の参照部と、
前記バックアップ装置から送信要求を受けたファイルの実データが前記所定の条件を満たさない場合には、前記第3の記憶部を参照して前記バックアップ装置から送信要求を受けたファイルを記憶するノードから実データを取得し、前記ファイルアクセス部に出力する第2の参照部と、
をさらに備える、付記1の分散ファイルシステム。
[付記3]
前記管理装置は、前記バックアップ装置からスナップショット生成指示を受けると、スナップショット取得指示を前記制御装置に送信し、
前記制御装置は、
前記送信されたスナップショット取得指示を受信した時点を境にファイルの世代を管理するスナップショット制御部を備え、
前記スナップショット制御部は、
前記管理装置に転送されたファイルのうち、古い世代のファイルに関する前記管理装置の処理が完了した後に、前記管理装置に対して、前記第1及び第2の記憶部のスナップショット取得の指示を行い、
前記ノードが古い世代のファイルに関する処理が完了した後に、古い世代のファイルの記憶が完了したノードに対して、スナップショットの取得の指示を行い、
前記管理装置及び前記ノードから、スナップショットの取得が完了した応答を得た後に、前記管理装置にスナップショットの取得が完了したことを通知する、付記2の分散ファイルシステム。
[付記4]
前記転送部は、前記スナップショット制御部が前記管理装置から、スナップショットの取得が完了した応答を得た後に、前記管理装置に新しい世代のファイルを転送する、付記3の分散ファイルシステム。
[付記5]
前記制御装置は、
前記管理装置に転送するファイルを一時的に蓄積する蓄積部をさらに備える、付記1乃至4のいずれか一に記載の分散ファイルシステム。
[付記6]
前記管理装置は、
前記制御装置から転送されてくるファイルの更新履歴を記憶する第4の記憶部をさらに備える付記1乃至5のいずれか一に記載の分散ファイルシステム。
[付記7]
前記所定の条件には、前記転送されたファイルのサイズに関する条件が少なくとも含まれる、付記1乃至6のいずれか一に記載の分散ファイルシステム。
[付記8]
ファイルを記憶する複数のノードに対するアクセスを制御する制御装置と、
バックアップ装置からの要求を処理する際に要する情報を管理する管理装置と、
を含んで構成される分散ファイルシステムのバックアップファイル取得方法であって、
前記複数のノードのうち少なくとも1以上のノードにファイルを格納する際に、前記格納しようとするファイルを前記管理装置に転送する工程と、
前記転送されたファイルのメタデータを第1の記憶部に格納する工程と、
前記転送されたファイルの実データのうち、所定の条件を満たす実データを第2の記憶部に格納する工程と、
前記バックアップ装置から、前記ノードが記憶するファイルに関するメタデータの送信要求を受けた場合には、前記第1の記憶部が記憶するメタデータを取得して前記バックアップ装置に送信する工程と、
前記バックアップ装置から、前記ノードが記憶するファイルの実データの送信要求を受けた場合には、前記第2の記憶部が記憶する実データ及び前記バックアップ装置から送信要求を受けたファイルを記憶するノードが記憶する実データのいずれかを、前記バックアップ装置に送信する工程と、
を含む、バックアップファイル取得方法。
[付記9]
ファイルを記憶する複数のノードに対するアクセスを制御すると共に、
前記複数のノードのうち少なくとも1以上のノードにファイルを格納する際に、前記格納しようとするファイルを、バックアップ装置からの要求を処理する際に要する情報を管理する管理装置に転送する、制御装置。
[付記10]
バックアップ装置からの要求を処理する際に要する情報を管理する管理装置であって、
ファイルを記憶する複数のノードに対するアクセスを制御する制御装置から転送されるファイルのメタデータを記憶する第1の記憶部と、
前記制御装置から転送されるファイルの実データのうち、所定の条件を満たす実データを記憶する第2の記憶部と、
前記バックアップ装置から、前記ノードが記憶するファイルに関するメタデータの送信要求を受けた場合には、前記第1の記憶部が記憶するメタデータを取得して前記バックアップ装置に送信し、前記バックアップ装置から、前記ノードが記憶するファイルの実データの送信要求を受けた場合には、前記第2の記憶部が記憶する実データ及び前記バックアップ装置から送信要求を受けたファイルを記憶するノードが記憶する実データのいずれかを、前記バックアップ装置に送信する、ファイルアクセス部と、
を備える、管理装置。
[付記11]
ファイルを記憶する複数のノードに対するアクセスを制御する制御装置を制御するコンピュータに実行させるプログラムであって、
前記複数のノードのうち少なくとも1以上のノードにファイルを格納する際に、前記格納しようとするファイルを、バックアップ装置からの要求を処理する際に要する情報を管理する管理装置に転送する処理を実行させるプログラム。
[付記12]
バックアップ装置からの要求を処理する際に要する情報を管理する管理装置を制御するコンピュータに実行させるプログラムであって、
ファイルを記憶する複数のノードに対するアクセスを制御する制御装置から転送されるファイルのメタデータを第1の記憶部に記憶する処理と、
前記制御装置から転送されるファイルの実データのうち、所定の条件を満たす実データを第2の記憶部に記憶する処理と、
前記バックアップ装置から、前記ノードが記憶するファイルに関するメタデータの送信要求を受けた場合には、前記第1の記憶部が記憶するメタデータを取得して前記バックアップ装置に送信する処理と、
前記バックアップ装置から、前記ノードが記憶するファイルの実データの送信要求を受けた場合には、前記第2の記憶部が記憶する実データ及び前記バックアップ装置から送信要求を受けたファイルを記憶するノードが記憶する実データのいずれかを、前記バックアップ装置に送信する処理と、
を実行させるプログラム。
なお、付記11及び付記12のプログラムは、コンピュータが読み取り可能な記憶媒体に記録することができる。記憶媒体は、半導体メモリ、ハードディスク、磁気記録媒体、光記録媒体等の非トランジェント(non-transient)なものとすることができる。
[Appendix 1]
A control device for controlling access to a plurality of nodes storing files;
A management device that manages information required to process a request from the backup device;
Including
The controller is
A transfer unit that transfers the file to be stored to the management device when storing the file in at least one of the plurality of nodes;
The management device
A first storage unit for storing metadata of the transferred file;
A second storage unit that stores actual data satisfying a predetermined condition among the actual data of the transferred file;
When receiving a transmission request for metadata relating to a file stored in the node from the backup device, the metadata stored in the first storage unit is acquired and transmitted to the backup device, and the backup device receives the metadata. When a transmission request for the actual data of the file stored by the node is received, the actual data stored by the second storage unit and the actual storage stored by the node storing the file received by the backup device are stored. A file access unit for transmitting any of the data to the backup device;
A distributed file system comprising:
[Appendix 2]
The management device
A third storage unit that stores information for specifying a node that stores a file corresponding to the transferred file among the plurality of nodes;
When the actual data of the file that has received the transmission request from the backup device satisfies the predetermined condition, the first reference that refers to the actual data stored in the second storage unit and responds to the file access unit And
When the actual data of the file that has received the transmission request from the backup device does not satisfy the predetermined condition, the node that stores the file that has received the transmission request from the backup device with reference to the third storage unit A second reference unit that acquires actual data and outputs the actual data to the file access unit;
The distributed file system according to appendix 1, further comprising:
[Appendix 3]
When receiving the snapshot generation instruction from the backup device, the management device transmits a snapshot acquisition instruction to the control device,
The controller is
A snapshot control unit for managing the generation of the file from the time when the received snapshot acquisition instruction is received,
The snapshot control unit
After the processing of the management device relating to the old generation file among the files transferred to the management device is completed, the management device is instructed to acquire snapshots of the first and second storage units. ,
After the node completes processing related to the old generation file, it instructs the node that has completed the storage of the old generation file to acquire a snapshot,
The distributed file system according to appendix 2, wherein the management apparatus and the node notify the management apparatus that the acquisition of the snapshot has been completed after obtaining a response indicating that the acquisition of the snapshot has been completed.
[Appendix 4]
The distributed file system according to appendix 3, wherein the transfer unit transfers a new generation file to the management device after the snapshot control unit obtains a response that the acquisition of the snapshot is completed from the management device.
[Appendix 5]
The controller is
The distributed file system according to any one of appendices 1 to 4, further comprising a storage unit that temporarily stores a file to be transferred to the management apparatus.
[Appendix 6]
The management device
The distributed file system according to any one of appendices 1 to 5, further comprising a fourth storage unit that stores an update history of a file transferred from the control device.
[Appendix 7]
The distributed file system according to any one of appendices 1 to 6, wherein the predetermined condition includes at least a condition relating to a size of the transferred file.
[Appendix 8]
A control device for controlling access to a plurality of nodes storing files;
A management device that manages information required to process a request from the backup device;
A backup file acquisition method for a distributed file system comprising:
Transferring the file to be stored to the management device when storing the file in at least one of the plurality of nodes;
Storing the metadata of the transferred file in a first storage unit;
Storing actual data satisfying a predetermined condition in the second storage unit among the actual data of the transferred file;
When receiving a transmission request for metadata relating to a file stored in the node from the backup device, obtaining metadata stored in the first storage unit and transmitting the metadata to the backup device;
A node that stores the actual data stored in the second storage unit and the file that has received the transmission request from the backup device when receiving a transmission request for the actual data of the file stored in the node from the backup device Transmitting any of the actual data stored in the backup device,
Including backup file acquisition method.
[Appendix 9]
Control access to multiple nodes that store files,
A control device that transfers a file to be stored to a management device that manages information required to process a request from a backup device when storing the file in at least one of the plurality of nodes. .
[Appendix 10]
A management device that manages information required to process a request from a backup device,
A first storage unit that stores metadata of a file transferred from a control device that controls access to a plurality of nodes that store the file;
A second storage unit that stores actual data satisfying a predetermined condition among the actual data of the file transferred from the control device;
When receiving a transmission request for metadata relating to a file stored in the node from the backup device, the metadata stored in the first storage unit is acquired and transmitted to the backup device, and the backup device receives the metadata. When a transmission request for the actual data of the file stored by the node is received, the actual data stored by the second storage unit and the actual storage stored by the node storing the file received by the backup device are stored. A file access unit for transmitting any of the data to the backup device;
A management device comprising:
[Appendix 11]
A program to be executed by a computer that controls a control device that controls access to a plurality of nodes that store files,
When a file is stored in at least one of the plurality of nodes, a process of transferring the file to be stored to a management device that manages information required for processing a request from a backup device is executed. Program to make.
[Appendix 12]
A program to be executed by a computer that controls a management device that manages information required when processing a request from a backup device,
Processing for storing, in the first storage unit, metadata of a file transferred from a control device that controls access to a plurality of nodes that store the file;
A process of storing actual data satisfying a predetermined condition among the actual data of the file transferred from the control device in the second storage unit;
When receiving a transmission request for metadata related to a file stored in the node from the backup device, a process of acquiring metadata stored in the first storage unit and transmitting the metadata to the backup device;
A node that stores the actual data stored in the second storage unit and the file that has received the transmission request from the backup device when receiving a transmission request for the actual data of the file stored in the node from the backup device Processing for transmitting any of the actual data stored in the backup device,
A program that executes
Note that the programs of Supplementary Note 11 and Supplementary Note 12 can be recorded on a computer-readable storage medium. The storage medium may be non-transient such as a semiconductor memory, a hard disk, a magnetic recording medium, an optical recording medium, or the like.

付記8〜付記12の各形態は、付記1と同様に、付記2〜付記7の形態に展開することができる。   Each form of appendix 8 to appendix 12 can be developed into the form of appendix 2 to appendix 7 in the same manner as appendix 1.

なお、引用した上記の特許文献等の各開示は、本書に引用をもって繰り込むものとする。本発明の全開示(請求の範囲を含む)の枠内において、さらにその基本的技術思想に基づいて、実施形態ないし実施例の変更・調整が可能である。また、本発明の全開示の枠内において種々の開示要素(各請求項の各要素、各実施形態ないし実施例の各要素、各図面の各要素等を含む)の多様な組み合わせ、ないし、選択が可能である。すなわち、本発明は、請求の範囲を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。特に、本書に記載した数値範囲については、当該範囲内に含まれる任意の数値ないし小範囲が、別段の記載のない場合でも具体的に記載されているものと解釈されるべきである。   Each disclosure of the cited patent documents and the like cited above is incorporated herein by reference. Within the scope of the entire disclosure (including claims) of the present invention, the embodiments and examples can be changed and adjusted based on the basic technical concept. In addition, various combinations or selections of various disclosed elements (including each element in each claim, each element in each embodiment or example, each element in each drawing, etc.) within the scope of the entire disclosure of the present invention. Is possible. That is, the present invention of course includes various variations and modifications that could be made by those skilled in the art according to the entire disclosure including the claims and the technical idea. In particular, with respect to the numerical ranges described in this document, any numerical value or small range included in the range should be construed as being specifically described even if there is no specific description.

1、60 クライアント
2、2a〜2c、61、64 ファイルシステム統合装置
3、3-1〜3-n、3a〜3i、62-1〜62-6 分散ノード
4、4a〜4c、63、64 バックアップ装置
5、5a 複製ファイルシステム管理装置
10、10a、10b、30、300、400 ファイルアクセス部
11、11a、11b、301、401 分散格納部
12 ファイル転送部
13 スナップショット制御部
14 更新情報蓄積部
20、20a、20b、51、51a、302 データ記憶部
21、21a、21b、303 メタデータ記憶部
31 スナップショット部
32、32a 複製ファイルシステム部
50、50a ブロックストレージ制御部
52 ファイル転送部
65 メタデータ記憶装置
100 制御装置
101 管理装置
102 転送部
103 第1の記憶部
104 第2の記憶部
105 ファイルアクセス部
201 間接データ記憶部
202 間接データ参照部
203 転送実データ記憶部
204 実データ参照部
205 転送メタデータ記憶部
206 ファイル更新履歴記憶部
402 メタデータ管理部
1, 60 Client 2, 2a-2c, 61, 64 File system integration device 3, 3-1 to 3-n, 3a to 3i, 62-1 to 62-6 Distributed node 4, 4a to 4c, 63, 64 Backup Apparatus 5, 5a Replicated file system management apparatus 10, 10a, 10b, 30, 300, 400 File access unit 11, 11a, 11b, 301, 401 Distributed storage unit 12 File transfer unit 13 Snapshot control unit 14 Update information storage unit 20 20a, 20b, 51, 51a, 302 Data storage unit 21, 21a, 21b, 303 Metadata storage unit 31 Snapshot unit 32, 32a Replicated file system unit 50, 50a Block storage control unit 52 File transfer unit 65 Metadata storage Device 100 control device 101 management device 102 transfer unit 103 first Storage unit 104 Second storage unit 105 File access unit 201 Indirect data storage unit 202 Indirect data reference unit 203 Transfer actual data storage unit 204 Actual data reference unit 205 Transfer metadata storage unit 206 File update history storage unit 402 Metadata management unit

Claims (10)

ファイルを記憶する複数のノードに対するアクセスを制御する制御装置と、
バックアップ装置からの要求を処理する際に要する情報を管理する管理装置と、
を含み、
前記制御装置は、
前記複数のノードのうち少なくとも1以上のノードにファイルを格納する際に、前記格納しようとするファイルを前記管理装置に転送する転送部を備え、
前記管理装置は、
前記転送されたファイルのメタデータを記憶する第1の記憶部と、
前記転送されたファイルの実データのうち、所定の条件を満たす実データを記憶する第2の記憶部と、
前記バックアップ装置から、前記ノードが記憶するファイルに関するメタデータの送信要求を受けた場合には、前記第1の記憶部が記憶するメタデータを取得して前記バックアップ装置に送信し、前記バックアップ装置から、前記ノードが記憶するファイルの実データの送信要求を受けた場合には、前記第2の記憶部が記憶する実データ及び前記バックアップ装置から送信要求を受けたファイルを記憶するノードが記憶する実データのいずれかを、前記バックアップ装置に送信する、ファイルアクセス部と、
を備える、分散ファイルシステム。
A control device for controlling access to a plurality of nodes storing files;
A management device that manages information required to process a request from the backup device;
Including
The controller is
A transfer unit that transfers the file to be stored to the management device when storing the file in at least one of the plurality of nodes;
The management device
A first storage unit for storing metadata of the transferred file;
A second storage unit that stores actual data satisfying a predetermined condition among the actual data of the transferred file;
When receiving a transmission request for metadata relating to a file stored in the node from the backup device, the metadata stored in the first storage unit is acquired and transmitted to the backup device, and the backup device receives the metadata. When a transmission request for the actual data of the file stored by the node is received, the actual data stored by the second storage unit and the actual storage stored by the node storing the file received by the backup device are stored. A file access unit for transmitting any of the data to the backup device;
A distributed file system comprising:
前記管理装置は、
前記複数のノードのうち、前記転送されたファイルに対応するファイルを記憶するノードを特定する情報を記憶する第3の記憶部と、
前記バックアップ装置から送信要求を受けたファイルの実データが前記所定の条件を満たす場合には、前記第2の記憶部が記憶する実データを参照し、前記ファイルアクセス部に応答する第1の参照部と、
前記バックアップ装置から送信要求を受けたファイルの実データが前記所定の条件を満たさない場合には、前記第3の記憶部を参照して前記バックアップ装置から送信要求を受けたファイルを記憶するノードから実データを取得し、前記ファイルアクセス部に出力する第2の参照部と、
をさらに備える、請求項1の分散ファイルシステム。
The management device
A third storage unit that stores information for specifying a node that stores a file corresponding to the transferred file among the plurality of nodes;
When the actual data of the file that has received the transmission request from the backup device satisfies the predetermined condition, the first reference that refers to the actual data stored in the second storage unit and responds to the file access unit And
When the actual data of the file that has received the transmission request from the backup device does not satisfy the predetermined condition, the node that stores the file that has received the transmission request from the backup device with reference to the third storage unit A second reference unit that acquires actual data and outputs the actual data to the file access unit;
The distributed file system of claim 1, further comprising:
前記管理装置は、前記バックアップ装置からスナップショット生成指示を受けると、スナップショット取得指示を前記制御装置に送信し、
前記制御装置は、
前記送信されたスナップショット取得指示を受信した時点を境にファイルの世代を管理するスナップショット制御部を備え、
前記スナップショット制御部は、
前記管理装置に転送されたファイルのうち、古い世代のファイルに関する前記管理装置の処理が完了した後に、前記管理装置に対して、前記第1及び第2の記憶部のスナップショット取得の指示を行い、
前記ノードが古い世代のファイルに関する処理が完了した後に、古い世代のファイルの記憶が完了したノードに対して、スナップショットの取得の指示を行い、
前記管理装置及び前記ノードから、スナップショットの取得が完了した応答を得た後に、前記管理装置にスナップショットの取得が完了したことを通知する、請求項2の分散ファイルシステム。
When receiving the snapshot generation instruction from the backup device, the management device transmits a snapshot acquisition instruction to the control device,
The controller is
A snapshot control unit for managing the generation of the file from the time when the received snapshot acquisition instruction is received,
The snapshot control unit
After the processing of the management device relating to the old generation file among the files transferred to the management device is completed, the management device is instructed to acquire snapshots of the first and second storage units. ,
After the node completes processing related to the old generation file, it instructs the node that has completed the storage of the old generation file to acquire a snapshot,
3. The distributed file system according to claim 2, wherein after obtaining a response indicating that snapshot acquisition has been completed from the management device and the node, the management device and the node are notified of the completion of snapshot acquisition.
前記転送部は、前記スナップショット制御部が前記管理装置から、スナップショットの取得が完了した応答を得た後に、前記管理装置に新しい世代のファイルを転送する、請求項3の分散ファイルシステム。   The distributed file system according to claim 3, wherein the transfer unit transfers a new generation file to the management device after the snapshot control unit obtains a response that the acquisition of the snapshot is completed from the management device. 前記制御装置は、
前記管理装置に転送するファイルを一時的に蓄積する蓄積部をさらに備える、請求項1乃至4のいずれか一項に記載の分散ファイルシステム。
The controller is
The distributed file system according to claim 1, further comprising a storage unit that temporarily stores files to be transferred to the management apparatus.
前記管理装置は、
前記制御装置から転送されてくるファイルの更新履歴を記憶する第4の記憶部をさらに備える請求項1乃至5のいずれか一項に記載の分散ファイルシステム。
The management device
The distributed file system according to claim 1, further comprising a fourth storage unit that stores an update history of a file transferred from the control device.
前記所定の条件には、前記転送されたファイルのサイズに関する条件が少なくとも含まれる、請求項1乃至6のいずれか一項に記載の分散ファイルシステム。   The distributed file system according to claim 1, wherein the predetermined condition includes at least a condition related to a size of the transferred file. ファイルを記憶する複数のノードに対するアクセスを制御する制御装置と、
バックアップ装置からの要求を処理する際に要する情報を管理する管理装置と、
を含んで構成される分散ファイルシステムのバックアップファイル取得方法であって、
前記複数のノードのうち少なくとも1以上のノードにファイルを格納する際に、前記格納しようとするファイルを前記管理装置に転送する工程と、
前記転送されたファイルのメタデータを第1の記憶部に格納する工程と、
前記転送されたファイルの実データのうち、所定の条件を満たす実データを第2の記憶部に格納する工程と、
前記バックアップ装置から、前記ノードが記憶するファイルに関するメタデータの送信要求を受けた場合には、前記第1の記憶部が記憶するメタデータを取得して前記バックアップ装置に送信する工程と、
前記バックアップ装置から、前記ノードが記憶するファイルの実データの送信要求を受けた場合には、前記第2の記憶部が記憶する実データ及び前記バックアップ装置から送信要求を受けたファイルを記憶するノードが記憶する実データのいずれかを、前記バックアップ装置に送信する工程と、
を含む、バックアップファイル取得方法。
A control device for controlling access to a plurality of nodes storing files;
A management device that manages information required to process a request from the backup device;
A backup file acquisition method for a distributed file system comprising:
Transferring the file to be stored to the management device when storing the file in at least one of the plurality of nodes;
Storing the metadata of the transferred file in a first storage unit;
Storing actual data satisfying a predetermined condition in the second storage unit among the actual data of the transferred file;
When receiving a transmission request for metadata relating to a file stored in the node from the backup device, obtaining metadata stored in the first storage unit and transmitting the metadata to the backup device;
A node that stores the actual data stored in the second storage unit and the file that has received the transmission request from the backup device when receiving a transmission request for the actual data of the file stored in the node from the backup device Transmitting any of the actual data stored in the backup device,
Including backup file acquisition method.
ファイルを記憶する複数のノードに対するアクセスを制御すると共に、
前記複数のノードのうち少なくとも1以上のノードにファイルを格納する際に、前記格納しようとするファイルを、バックアップ装置からの要求を処理する際に要する情報を管理する管理装置に転送する、制御装置。
Control access to multiple nodes that store files,
A control device that transfers a file to be stored to a management device that manages information required to process a request from a backup device when storing the file in at least one of the plurality of nodes. .
バックアップ装置からの要求を処理する際に要する情報を管理する管理装置であって、
ファイルを記憶する複数のノードに対するアクセスを制御する制御装置から転送されるファイルのメタデータを記憶する第1の記憶部と、
前記制御装置から転送されるファイルの実データのうち、所定の条件を満たす実データを記憶する第2の記憶部と、
前記バックアップ装置から、前記ノードが記憶するファイルに関するメタデータの送信要求を受けた場合には、前記第1の記憶部が記憶するメタデータを取得して前記バックアップ装置に送信し、前記バックアップ装置から、前記ノードが記憶するファイルの実データの送信要求を受けた場合には、前記第2の記憶部が記憶する実データ及び前記バックアップ装置から送信要求を受けたファイルを記憶するノードが記憶する実データのいずれかを、前記バックアップ装置に送信する、ファイルアクセス部と、
を備える、管理装置。
A management device that manages information required to process a request from a backup device,
A first storage unit that stores metadata of a file transferred from a control device that controls access to a plurality of nodes that store the file;
A second storage unit that stores actual data satisfying a predetermined condition among the actual data of the file transferred from the control device;
When receiving a transmission request for metadata relating to a file stored in the node from the backup device, the metadata stored in the first storage unit is acquired and transmitted to the backup device, and the backup device receives the metadata. When a transmission request for the actual data of the file stored by the node is received, the actual data stored by the second storage unit and the actual storage stored by the node storing the file received by the backup device are stored. A file access unit for transmitting any of the data to the backup device;
A management device comprising:
JP2014073413A 2014-03-31 2014-03-31 Distributed file system, backup file acquisition method, control device, and management device Active JP6291977B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014073413A JP6291977B2 (en) 2014-03-31 2014-03-31 Distributed file system, backup file acquisition method, control device, and management device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014073413A JP6291977B2 (en) 2014-03-31 2014-03-31 Distributed file system, backup file acquisition method, control device, and management device

Publications (2)

Publication Number Publication Date
JP2015194973A true JP2015194973A (en) 2015-11-05
JP6291977B2 JP6291977B2 (en) 2018-03-14

Family

ID=54433898

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014073413A Active JP6291977B2 (en) 2014-03-31 2014-03-31 Distributed file system, backup file acquisition method, control device, and management device

Country Status (1)

Country Link
JP (1) JP6291977B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023520564A (en) * 2020-05-06 2023-05-17 華為技術有限公司 Metadata storage methods and devices

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004252957A (en) * 2003-01-30 2004-09-09 Hitachi Ltd Method and device for file replication in distributed file system
JP2005202915A (en) * 2003-12-19 2005-07-28 Hitachi Ltd Snapshot acquisition method
JP2006107162A (en) * 2004-10-06 2006-04-20 Hitachi Ltd Storage system
JP2008117342A (en) * 2006-11-08 2008-05-22 Hitachi Ltd Storage system, and controller for controlling remote copying
US8082230B1 (en) * 2006-12-22 2011-12-20 Symantec Operating Corporation System and method for mounting a file system on multiple host computers

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004252957A (en) * 2003-01-30 2004-09-09 Hitachi Ltd Method and device for file replication in distributed file system
JP2005202915A (en) * 2003-12-19 2005-07-28 Hitachi Ltd Snapshot acquisition method
JP2006107162A (en) * 2004-10-06 2006-04-20 Hitachi Ltd Storage system
JP2008117342A (en) * 2006-11-08 2008-05-22 Hitachi Ltd Storage system, and controller for controlling remote copying
US8082230B1 (en) * 2006-12-22 2011-12-20 Symantec Operating Corporation System and method for mounting a file system on multiple host computers

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023520564A (en) * 2020-05-06 2023-05-17 華為技術有限公司 Metadata storage methods and devices
JP7462790B2 (en) 2020-05-06 2024-04-05 華為技術有限公司 METHOD AND DEVICE FOR STORING METADATA - Patent application

Also Published As

Publication number Publication date
JP6291977B2 (en) 2018-03-14

Similar Documents

Publication Publication Date Title
US10956286B2 (en) Deduplication replication in a distributed deduplication data storage system
US9906598B1 (en) Distributed data storage controller
US11016696B2 (en) Redundant distributed data storage system
US10437671B2 (en) Synchronizing replicated stored data
US8918392B1 (en) Data storage mapping and management
US11314444B1 (en) Environment-sensitive distributed data management
US8930364B1 (en) Intelligent data integration
WO2011027775A1 (en) Distributed storage system, distributed storage method, and program and storage nodes for distributed storage
US20140188957A1 (en) Hierarchical storage system and file management method
WO2012140957A1 (en) Information storage system and data replication method thereof
CN108604164A (en) Synchronous for the storage of storage area network agreement is replicated
US11321005B2 (en) Data backup system, relay site storage, data backup method, and control program for relay site storage
JP6291977B2 (en) Distributed file system, backup file acquisition method, control device, and management device
US9582384B2 (en) Method and system for data replication
US20140215153A1 (en) Storage system, disk array apparatus and control method for storage system
KR20150010242A (en) Method of data re-replication in asymmetric file system
JP2013161383A (en) Information processing device, information processing method, program and information processing system
KR101694308B1 (en) Data replication apparatus and method using hierarchical organization of data servers
JP5956364B2 (en) Cluster system
KR20160025994A (en) Cluster management method and data storage system for selecting gateway in distributed storage environment
US9952805B2 (en) Storage system and data write method using a logical volume to either store data successfully onto a first memory or send a failure response to a server computer if the storage attempt fails
KR20150061314A (en) Method and System for recovery of iSCSI storage system used network distributed file system
WO2016170619A1 (en) Computer system
WO2017037878A1 (en) Storage system and verification method
JP2017173979A (en) Data management device, method, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170206

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180116

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180129

R150 Certificate of patent or registration of utility model

Ref document number: 6291977

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150