JP2014503086A - ファイルシステム及びデータ処理方法 - Google Patents

ファイルシステム及びデータ処理方法 Download PDF

Info

Publication number
JP2014503086A
JP2014503086A JP2013532764A JP2013532764A JP2014503086A JP 2014503086 A JP2014503086 A JP 2014503086A JP 2013532764 A JP2013532764 A JP 2013532764A JP 2013532764 A JP2013532764 A JP 2013532764A JP 2014503086 A JP2014503086 A JP 2014503086A
Authority
JP
Japan
Prior art keywords
file
computer system
data
sub
site
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013532764A
Other languages
English (en)
Other versions
JP5661188B2 (ja
Inventor
昌忠 ▲高▼田
陽介 石井
智則 榎阪
敦之 須藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JP2014503086A publication Critical patent/JP2014503086A/ja
Application granted granted Critical
Publication of JP5661188B2 publication Critical patent/JP5661188B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0608Saving storage space on storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/178Techniques for file synchronisation in file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • G06F3/0611Improving I/O performance in relation to response time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/0647Migration mechanisms
    • G06F3/0649Lifecycle management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/065Replication mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0685Hybrid storage combining heterogeneous device types, e.g. hierarchical storage, hybrid arrays
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore

Abstract

レスポンス時間を削減可能な拠点間ファイル同期処理を実現する。第1のサブ計算機システムがデータセンタにアーカイブまたはバックアップしたファイル群の少なくとも1部分の一覧をCASデバイスが更新リストとして作成し、更新リストを第2のサブ計算機システムに転送することで、第2のサブ計算機システムは更新リストを用いてファイルの有効性の可否を判定する。(図2参照)

Description

本発明は、情報処理システム、及び当該システムにおけるデータ処理方法に関し、例えば、NAS及びCAS統合体においてデータを共有するための技術に関するものである。
デジタルデータ、特にファイルデータの量は急速に増大している。NAS(Network Attached Storage)は、ネットワークを介して多数のコンピュータがファイルデータを共有するのに相応しいストレージデバイスである。
ファイルデータ含めてデジタルデータは、例えば、各種の法令要求に対応する為に長期間に亘って保存する必要がある。CAS(Content Addressed Storage)はデータの不変性を保証して長期的なデータアーカイブの為のソリューションを提供する。一般的に、現用データはそれが使われている限りNASデバイスに保存され、続いて、アーカイブ目的でCASデバイスに移行される。移行されたデータは又、アーカイブデータとも呼ばれる。例えば、NASデバイス上のEメールデータは、法令遵守の為にCASデバイスにアーカイブすることもある。CASデバイスに格納されるデータはアーカイブデータに限らない。NASデバイスに格納されているデータをポリシーに従って、例えば一定期間アクセスされなかったデータなどを、CASデバイスに移動することで、NASデバイスの容量を低く抑えることが出来る。また、NASデバイスに格納されているデータをバックアップ目的でCASデバイスにコピーすることもできる。
データファイルがアーカイブされると、アーカイブされたファイルのパス名が変更される。例えば、ファイルAのパス名は、//NAS-A/share/fileAから//CAS-A/archive/fileAに変更される。このときNASデバイスは、変更後のファイルのパス名を含むスタブ情報(スタブ、或いはスタブデータとも言う)を生成することで、クライアントは変更前のファイルのパス名を用いてファイルにアクセスできる。NASデバイスは、アーカイブ済みファイルにアクセスがあると、スタブ情報を用いて、要求されたファイルのファイルデータをCASデバイスからリコール(「リストア」と言うこともできる)してNASデバイスに格納する。また、NASデバイスとCASデバイスは、GNS(Global Namespace)を使用して、名前空間を統合することが出来る。
特許文献1では、上記NAS及びCAS統合体で、NASクライアントからのアクセスが通常のNASアクセスかバックアップ目的の特殊なNASアクセスかを判定し、バックアップ目的の場合はCASデバイスにある実際のアーカイブデータはバックアップせず、スタブ情報のみをバックアップする技術を開示している。
データセンタにCASデバイスを配置し、各拠点(例えば、会社の各事業部)にNASデバイスを配置し、CASデバイスとNASデバイスをWAN(Wide Area Network)等の通信ネットワークで接続し、分散したNASデバイス上のデータを、CASデバイス上で集中管理するシステム(NASとCASの統合ストレージシステム)がある。NASデバイス上のデータはある契機でCASデバイスにアーカイブあるいはバックアップされる。クライアントからアクセスされたファイルがアーカイブされている場合は、NASデバイスにはファイルデータが格納されていないため(スタブ)、NASデバイスはCASデバイスからファイルデータのリコールが必要である。一方、クライアントからアクセスされたファイルがバックアップされている場合は、ファイルデータがNASデバイスに格納されており、NASデバイスはCASからのファイルデータのリコールが不要となる。
一般的に前述のシステムにおいては、各拠点が所有するファイルの中には、別拠点からは参照されたくないファイルもあるため、CASデバイスは特定の拠点からのアクセスのみ許可するTENANT(テナント)を作成するTENANT機能を有している。セキュリティを考慮して、拠点:TENANT=1:1とすることで、各拠点はTENANT上に自拠点専用のファイルシステムを構築する。
一方、他の拠点のファイルを参照したい場合がある。CASデバイスは、他の拠点からのファイルアクセスであっても、アクセスを許可することで他拠点のファイルを参照可能にでき、データセンタを経由した遠隔拠点間のファイル共有を実現できる。
ファイルシステム間の差分をコピーする技術として、特許文献2では、異なる2つのファイルシステムにおける木構造の階層関係を、ハッシュ値を用いて比較し、ハッシュ値が相違する更新対象ファイルの更新ファイルリストを作成し、更新されたファイル群を他方のファイルシステムにコピーする技術が開示されている。
特開2010−9573号公報 特開2008−25093号公報
特許文献1に記載のシステムにおいて、NASデバイス上のデータをCASデバイス(データセンタ)にアーカイブあるいはバックアップするシステムを第1のサブ計算機システムと呼ぶ。第1のサブ計算機システムは、NASデバイスと1または複数のクライアントを含む。第1のサブ計算機システムがCASデバイスにアーカイブあるいはバックアップしたデータを参照するシステムを第2のサブ計算機システムまたは拠点Bと呼ぶ。第2のサブ計算機システムは、NASデバイスと1または複数のクライアントを含む。
しかしながら、特許文献1に記載のシステムにおいて、拠点Bのクライアントが拠点Aのファイルにアクセス要求すると、拠点BのNASデバイスは、CASデバイス上の当該ファイルを拠点BのNASデバイス上のファイルシステムにコピーし、クライアントに応答する。その後、拠点BにコピーしたCASデバイスに格納されている元のファイルが、拠点Aのアーカイブあるいはバックアップ処理によって更新される場合がある。これによって、拠点BのNASデバイス上のファイルとCASデバイス上のファイルの内容が異なる可能性がある。
また、特許文献2のファイル更新方法を特許文献1のシステムに適用する場合、拠点Aのアーカイブあるいはバックアップ処理によってCASデバイス上の更新された全ファイルを拠点BのNASデバイスにコピーすることになる。この方法は、CASデバイス上のファイル群と拠点BのNASデバイス上のファイル群とを比較して更新されたファイル群を特定できるが、CASデバイス上の更新された全ファイルを拠点BのNASデバイスにコピーすることになるため、拠点BにおけるNASデバイスのファイルシステムの容量を消費する問題がある。また、拠点BのNASデバイスに格納されていた更新前のファイルを上書きしたくないケースでも、同じパス名を持つファイルは更新後のファイルで上書きしてしまう問題がある。
さらに、拠点Bのクライアントが拠点Aのファイルを参照する場合に、拠点BのNASデバイスが常にCASデバイスからファイルデータを取得する方法は、当該ファイルがNASデバイスに格納済みであるか否かによらず、NASデバイスはCASデバイスからファイルデータのリコールが必要であるために、アクセス性能の低下をもたらす可能性がある。
拠点Bのクライアントが拠点BのNASデバイス上に格納済みの拠点Aのファイルを参照する場合、拠点BのNASデバイスが、当該ファイルが有効か否かをCASデバイスに問い合わせ、有効ならば拠点BのNASデバイスに格納済みの当該ファイルをクライアントに返し、有効でないならばCASデバイスからファイルデータを取得して更新してクライアントに返す方法が考えられる。当該ファイルが有効か否かの判定には、例えばファイルの最終更新日時等の属性情報を用いる。この方法は、拠点Bのクライアントからの拠点Aのファイルのアクセスのたびに拠点BのNASデバイスとデータセンタのCASデバイスとの通信が発生し、レスポンス時間の低下をもたらす可能性がある。
本発明はこのような状況に鑑みてなされたものであり、NASデバイスの容量浪費を防止し、レスポンス時間を短縮し、さらには、ファイルのバージョン管理を可能にするファイル共有技術を提供するものである。
上記課題の少なくとも1つを解決するために、本発明は、第1のサブ計算機システムがデータセンタにアーカイブまたはバックアップしたファイル群の少なくとも1部分の一覧をCASデバイスが更新リストとして作成し、更新リストを第2のサブ計算機システムに転送することで、第2のサブ計算機システムは更新リストを用いてファイルの有効性の可否を判定する。
本発明の1つの様態は、第2のサブ計算機システムが前述の更新リストを更新テーブルとして保持し、第2のサブ計算機システムに格納済みのファイルにアクセスがあると、第2のサブ計算機システムは、更新テーブルを参照して有効性の可否を判断する。参照の結果、当該ファイルが有効である、つまり、データセンタのファイルと内容が同一である場合、第2のサブ計算機システムはデータセンタと通信することなくクライアントに応答できる。一方、当該ファイルが有効ではない、つまり、データセンタのファイルと内容が異なる場合、第2のサブ計算機システムは、CASデバイスからファイルデータを取得してファイルシステムの内容を更新してクライアントに返す。このとき、既存の格納済みファイルを上書きせず、同一のパス名ではあるが、別バージョンのファイルとして格納する。
本発明のほかの態様によれば、第2のサブ計算機システムは、CASデバイスから更新リストを取得後、第2のサブ計算機システムに格納済みのファイル群の有効性の可否を判断する。CASデバイス上で更新されたファイルに対して第2のサブ計算機システムは、格納済みのファイルを無効化(例えば、削除)もしくは更新する。
本発明の更なるほかの形態によれば、第1のサブ計算機システムが更新したファイルを即時にCASデバイスにアーカイブまたはバックアップし、CASデバイスは当該ファイルを第2のサブ計算機システムに転送し、第2のサブ計算機システムは即時に当該ファイルを更新する。このとき、既存の格納済みファイルを上書きせず、同一のパス名ではあるが、別バージョンのファイルとして格納する。
本発明に関連する更なる特徴は、以降に続く記述に一部は明記され一部は本記述から明らかになり、或は本発明の実施により学ぶことが出来る。本発明の態様は、要素及び多様な要素の組み合わせ及び以降の詳細な記述と添付されるクレームの様態により達成され実現される。
前述及び後述の記述は典型的で説明の為であり、本発明のクレーム又はアプリケーションを如何なる意味に於いても限定するものではないことを理解する必要がある。
本発明によれば、他拠点間でファイルを共有し、他拠点のファイルに対するアクセスのレスポンス時間を短縮すると共に、アクセス性能を向上することが可能となる。また、各拠点においてファイルのバージョンを管理することができるようになる。
本発明による情報処理システムの物理的概略構成を示す図である。 本発明による情報処理システムの論理的構成を示す図である。 本発明における、ファイルライト処理、マイグレーション処理、リード処理、データ同期処理のタイムチャートを模式的に示す模式図の一例である。 NASデバイスのハードウェア及びソフトウェア構成を示す図である。 CASデバイスのハードウェア及びソフトウェア構成を示す図である。 他拠点更新リストテーブルの構成例を示す図である。 自拠点更新リストテーブルの構成例を示す図である。 拠点別更新リストテーブルの構成例を示す図である。 本発明によるファイルリード処理を説明するためのフローチャートである。 本発明の第1の実施形態によるデータ同期処理の詳細を説明するためのフローチャートである。 本発明によるファイルライト処理を説明するためのフローチャートである。 本発明によるデータ削除処理を説明するためのフローチャートである。 本発明によるマイグレーション処理を説明するためのフローチャートである。 本発明の第2の実施形態による一括データ同期処理を説明するためのフローチャートである。 本発明の第3の実施形態によるオリジナルファイルライト処理を説明するためのフローチャートである。 本発明の第3の実施形態によるリアルタイム同期処理の詳細を説明するためのフローチャートである。 本発明の第1の実施形態における処理概要の特徴を説明するための図である。 本発明の第2の実施形態における処理概要の特徴を説明するための図である。
本発明は、一般的に、コンピュータでのストレージシステムにおいてデータを管理するための技術、より具体的には、NAS(Network Attached Storage)に保存されたデータをCAS(Content Addressed Storage)に転送し、NAS間でデータを共有するための技術に関するものである。
以下、添付図面を参照して本発明の実施形態について説明する。添付図面では、機能的に同じ要素は同じ番号で表示される場合もある。なお、添付図面は本発明の原理に則った具体的な実施形態と実装例を示しているが、これらは本発明の理解のためのものであり、決して本発明を限定的に解釈するために用いられるものではない。
本実施形態では、当業者が本発明を実施するのに十分詳細にその説明がなされているが、他の実装・形態も可能で、本発明の技術的思想の範囲と精神を逸脱することなく構成・構造の変更や多様な要素の置き換えが可能であることを理解する必要がある。従って、以降の記述をこれに限定して解釈してはならない。
更に、本発明の実施形態は、後述されるように、汎用コンピュータ上で稼動するソフトウェアで実装しても良いし専用ハードウェア又はソフトウェアとハードウェアの組み合わせで実装しても良い。
なお、本明細書の図では、テーブルやリストを例にして本発明で用いられる情報について説明しているが、テーブルやリストの構造で提供される情報に限られるものではなく、データ構造に依存しない情報であっても良い。
また、各情報の内容を説明する際に、「識別情報」、「識別子」、「名」、「名前」、「ID」という表現を用いるが、これらについてはお互いに置換が可能である。
本発明の実施形態では、NASとCASの通信ネットワークはWANの採用に限定されず、LAN(Local Area Network)等の通信ネットワークを採用することも可能である。本発明の態様は、NFS(Network File System)プロトコルの採用に限定されず、他のCIFS(Common Internet File System)、HTTP(Hypertext Transfer Protocol)等を含むファイル共有プロトコルを採用することも可能である。
以後の説明では「プログラム」を主語として各処理の説明を行うことがあるが、プログラムはプロセッサによって実行されることで定められた処理をメモリ及び通信ポート(通信制御装置)を用いながら行うため、プロセッサを主語とした説明としてもよい。また、プログラムを主語として開示された処理は管理サーバ等の計算機、情報処理装置が行う処理としてもよい。プログラムの一部または全ては専用ハードウェアで実現してもよく、また、モジュール化されていても良い。各種プログラムはプログラム配布サーバや記憶メディアによって各計算機にインストールされてもよい。
(1)第1の実施形態
<システムの物理的構成>
図1は、本発明の実施形態によるシステム(情報処理システム、統合ストレージシステム、或いは計算機システムともいう)の物理的構成の一例を示すブロック図である。なお、図1においては、拠点A及びBのみが示されているがより多くの拠点がシステムに含まれていても良く、各拠点の構成は同様とすることが可能である。また、実施形態では、拠点Aのファイルを拠点Bが参照・使用する場合について説明するが、各拠点に優劣(親と子の関係)はなく、拠点Aが拠点Bのファイルを参照・使用する場合も同じ動作となる。
当該計算機システム10は、各拠点に配置された1つまたは複数のサブ計算機システム100及び110と、CASデバイス121で構成されるデータセンタシステム120と、を有し、サブ計算機システム100及び110のそれぞれとデータセンタシステム120がネットワーク130及び140を介して接続されている。
サブ計算機システム100及び110は、クライアント101及び111と、NASデバイス102及び112を有し、これらはネットワーク105及び115で接続されている。クライアント101及び111は、NASデバイス102及び112が提供するファイル共有サービスを利用する一または複数の計算機である。クライアント101及び111は、NFS(Network File System)やCIFS(Common Internet File System)などのファイル共有プロトコルを利用して、ネットワーク105及び115を介して、NASデバイス102及び112が提供するファイル共有サービスを利用する。
NASデバイス102及び112は、NASコントローラ103及び113、記憶装置104及び114を有す。NASコントローラ103及び113はクライアント101及び111にファイル共有サービスを提供し、また、CASデバイス121との連携機能を有す。NASコントローラ103及び113は、クライアント101及び111が作成する各種ファイルやファイルシステム構成情報を記憶装置104及び114に格納する。
記憶装置104及び114は、NASコントローラ103及び113にボリュームを提供し、NASコントローラ103及び113が各種ファイルやファイルシステム構成情報を格納する場所である。
データセンタ120は、CASデバイス121と管理端末124とを有し、これらはネットワーク125で接続されている。CASデバイス121は、NASデバイス102及び112のアーカイブ及びバックアップ先のストレージデバイスである。管理端末124は、計算機システム10を管理する管理者が使用する計算機である。管理者は、管理端末124からネットワーク125を通してCASデバイス121、NASデバイス102及び112の管理を行う。これらの管理として、例えば、ファイルサーバの運用開始、ファイルサーバの停止、クライアント101及び111のアカウントの管理などがある。なお、管理端末124は入出力装置を有する。入出力装置の例としては、ディスプレイ、プリンタ、キーボード、ポインタデバイスが考えられるが、これ以外の装置(例えば、スピーカやマイク等)であってもよい。また、入出力装置の代替として、シリアルインタフェースを入出力装置とし、当該インタフェースにディスプレイ又はキーボード又はポインタデバイスを有する表示用計算機を接続する形態であってもよい。この場合、表示用情報を表示用計算機に送信したり、入力用情報を表示計算機から受信することで、表示用計算機で表示を行ったり、入力を受け付けることで入出力装置での入力及び表示を代替してもよい。
以後、計算機システムを管理し、本発明の表示用情報を表示する一つ以上の計算機の集合を管理システムと呼ぶことがある。管理端末124が表示用情報を表示する場合は、管理端末124が管理システムである。また、管理端末124と表示用計算機の組み合わせも管理システムである。また、管理処理の高速化や高信頼化のために複数の計算機で管理端末124と同等の処理を実現してもよく、この場合は当該複数の計算機を管理システムと呼ぶ。さらに、管理端末124は、本実施形態では、データセンタ120内に設けられているが、データセンタ120外に設けられ、独立した存在であっても良い。
ネットワーク105は拠点A100の拠点内LAN、ネットワーク115は拠点B110の拠点内LAN、ネットワーク125はデータセンタ120のデータセンタ内LANであり、ネットワーク130はWANで拠点A100とデータセンタ120間をネットワーク接続し、ネットワーク140はWANで拠点B110とデータセンタ120間をネットワーク接続する。ネットワークの種類は上記ネットワークに限定されず、種々のネットワークを利用可能である。
<システムの論理的構成>
図2は、本発明の実施形態による情報処理システムの論理的構成の一例を示すブロック図である。当該情報処理システム10において、拠点A100のクライアント101が読み書きするデータは、ファイルとしてNASデバイス102が作成するファイルシステムFS_A200に格納される。拠点B110も同様に、クライアント111が読み書きするデータは、ファイルとしてNASデバイス112が作成するファイルシステムFS_B211に格納される。
ファイルシステムFS_A200及びファイルシステムFS_B211に格納されたファイルは、ある契機(所定又は任意のタイミング:例えば、夜間のバッチ処理)でデータセンタ120にアーカイブまたはバックアップされる。CASデバイス121が作成するファイルシステムFS_A_CAS220は、拠点AのファイルシステムFS_A200と関連付けられたファイルシステムであり、ファイルシステムFS_A200のうち、アーカイブまたはバックアップされたファイル群はファイルシステムFS_A_CAS220に格納される。同様に、CASデバイス121が作成するファイルシステムFS_B_CAS221は、拠点BのファイルシステムFS_B211と関連付けられたファイルシステムであり、ファイルシステムFS_B211のうち、アーカイブまたはバックアップされたファイル群はファイルシステムFS_B_CAS221に格納される。
拠点B110のNASデバイス112が作成するファイルシステムFS_A_R210は、クライアント111が拠点A100のファイルを参照するためのファイルシステムである。ファイルシステムFS_A_R210は、ファイルシステムFS_A_CAS220と関連付けられており、ファイルシステムFS_A_CAS220の少なくとも一部がファイルシステムFS_A_R210に格納される。
<システムの処理概要>
図17は、本発明の第1の実施形態における処理概要の特徴を説明するための図である。図17において、例えば、拠点Bによって他拠点の格納済みファイルに対して参照要求された場合、拠点BのNASデバイスが他拠点更新リストを検索して当該ファイルの更新の有無を識別する。処理手順は、次のようになる(図17の(i)乃至(vi))。
まず、拠点AにおいてファイルFが更新されたとする(処理(i))。なお、ファイルFは拠点Aにおける更新処理の前に拠点Bにコピーされているものとする(拠点Bに保持される拠点Aのファイルを他拠点ファイルという)。そして、拠点AのNASデバイスは、マイグレーション処理によってデータセンタ(CASデバイス)のファイルFを更新する(処理(ii))。一方、データセンタは、アーカイブ処理後、ファイルFの更新情報を含む更新リスト(通知用更新管理情報)を作成し、これを拠点Bに転送する(処理(iii))。拠点BのNASデバイスは、更新リスト(他拠点更新リスト:他拠点更新管理情報)を保持しており、転送されてきた更新リストに含まれるファイルの更新情報を他拠点更新リストに追加する(処理(iv))。その後、格納済みファイルの参照要求時に、拠点BのNASデバイスは、他拠点更新リストを検索し、参照対象のファイルの更新の有無を確認する(処理(v))。該当ファイルが更新されていれば(現在保持するデータが有効でないため)、拠点BのNASデバイスは、データセンタ(CASデバイス)から対象ファイルを再度読み込んでデータを取得し、更新されていなければ再読み込み不要(保持するデータが有効)となり、既に保持しているファイルを読み込む(処理(vi))。
このように、第1の実施形態では、NASデバイス112が更新ファイルテーブル600を保持し、クライアント111からファイルデータにリード要求があったときに、更新ファイルテーブル600を用いて有効性の可否を判断することで、レスポンス時間の削減が可能である。更新ファイルテーブル600は、ハッシュテーブル、DB、ファイルシステムメタデータのいずれか、または、それらの組み合わせでもよい。
既存の格納済みファイルを上書きせず、同一のパス名ではあるが、別バージョンのファイルとして格納する。例えば、ファイル名にバージョン番号や更新日付等のサフィックスを付随してもよい。また、ファイルの属性情報にバージョン番号や最終更新者等を含めてもよい。これらによって、クライアント111が前の格納済みファイルを参照したい場合に参照可能となる。
図3は、本実施形態の情報処理システムにおけるマイグレーション処理、ファイルリード処理等のタイムチャートを模式的に示す図である。
拠点A100のクライアント101はファイルA及びファイルBをNASデバイス102に書き込む。これらのファイルは後述する、NASデバイス102のマイグレーション処理によってCASデバイス121に転送される。
CASデバイス121は、マイグレーション処理によってCASデバイス121のファイルシステムFS_A_CAS220に更新のあったファイル群を一覧にした更新リストを作成し、拠点B110のNASデバイス112に転送する。この更新リストはファイルA及びファイルBを含む。
拠点B110のNASデバイス112は、更新リストを受理し、更新リストテーブル600を作成する。その後、拠点B110のクライアント111がファイルA及びファイルBをリードする。NASデバイス112は、後述するファイルリード処理を行う。このとき、NASデバイス112は、ファイルA及びファイルBのファイルデータをファイルシステムFS_A_R210に格納していない状態なので、CASデバイス121から当該ファイルデータを取得し、ファイルシステムFS_A_R210に格納する。
その後、ファイルAがクライアント101によって更新され、NASデバイス102のマイグレーション処理によってCASデバイス121に更新ファイルが転送される。CASデバイス121におけるファイルの更新処理がなされた後、更新リストにはファイルAが含まれることになる。
この状態でクライアント111がファイルBにアクセスする場合、NASデバイス112は更新リストテーブル600を参照し、ファイルシステムFS_A_R210に格納しているファイルBのファイルデータが有効(拠点A100或いはデータセンタ120で管理されているファイルBと同一内容のデータであること)であるか否かを判定する。ファイルBは前回の参照から更新されていないため、NASデバイス112は、ファイルシステムFS_A_R210に格納しているファイルBをクライアント111に返す。
一方、ファイルAは前回の参照後に更新されているため、NASデバイス112は、ファイルAは有効ではないと判断し、当該ファイルデータをCASデバイス121から取得し、取得したファイルデータをファイルシステムFS_A_R210に格納し、クライアント111に返す。
これにより、ファイルの有効性の可否を拠点内で判定でき、更新がないファイルへのアクセスの場合は、拠点とデータセンタとの通信を削減し、レスポンス時間を短縮できる。
<NASデバイスの内部構成>
図4は、NASデバイス102の内部構成例を示すブロック図である。図4は、拠点A100のNASデバイス102の構成を示しているが、拠点B110のNASデバイス112も同様の構成である。
NASデバイス102は、NASコントローラ103と記憶装置104を有する。
NASコントローラ103は、メモリ401に格納されたプログラムを実行するCPU402、ネットワーク105を通してクライアント101との通信に使用するネットワークインタフェース403、ネットワーク130を通してデータセンタ120との通信に使用するネットワークインタフェース404、記憶装置104との接続に使用するインタフェース405、プログラムやデータを格納するメモリ401を搭載し、それらは内部的な通信路(例えば、バス)によって接続されている。
メモリ401は、ファイル共有サーバプログラム406と、ファイル共有クライアントプログラム407と、マイグレーションプログラム408と、ファイルシステムプログラム409と、オペレーティングシステム(OS)410と、自拠点更新リスト411と、他拠点更新リスト412と、を格納している。なお、メモリに格納されている各プログラム406乃至410や各更新リスト411及び412は、記憶装置104に格納され、CPU402によってメモリ401に読み出されて実行される態様でもよい。
ファイル共有サーバプログラム406は、クライアント101がNASデバイス102上のファイルにファイル操作を行う手段を提供するプログラムである。ファイル共有クライアントプログラム407は、NASデバイス102がCASデバイス121上のファイルにファイル操作を行う手段を提供するプログラムであり、ファイル共有クライアントプログラム407により、各拠点のNASデバイスはCASデバイス121上の自拠点及び他拠点のファイルに対して所定のファイル操作を実行することができるようになる。マイグレーションプログラム408は、NASデバイス102からCASデバイス121へのファイルのマイグレーションを実行する。ファイルシステムプログラム409は、ファイルシステムFS_A200を制御する。
自拠点更新リスト411は、NASデバイス102自身が管理するファイルの更新情報を管理するためのリストである。また、他拠点更新リスト412は、CASデバイス121から取得した、他拠点のNASデバイスが管理するファイルの更新情報を管理するためのリストである。自拠点更新リスト411及び他拠点更新リスト412の詳細については、図6及び7を参照して説明する。
記憶装置104は、NASコントローラ103との接続に使用するインタフェース423、NASコントローラ103からの命令を実行するCPU422、プログラムやデータを格納するメモリ421、1または複数のディスク424を搭載し、それらは内部的な通信路(例えば、バス)によって接続されている。記憶装置104はFC−SAN(Fibre Channel Storage Area Network)等のブロック形式のストレージ機能をNASコントローラ103に提供する。
<CASデバイスの内部構成>
図5は、CASデバイス121の内部構成例を示すブロック図である。CASデバイス121は、CASコントローラ122と記憶装置123を有する。
CASコントローラ122は、メモリ501に格納されたプログラムを実行するCPU502、ネットワーク130及び140を通してNASデバイス102及び112との通信に使用するネットワークインタフェース503、ネットワーク125を通し管理端末124との通信に使用するネットワークインタフェース504、記憶装置123との接続に使用するインタフェース505、プログラムやデータを格納するメモリ501を搭載し、それらは内部的な通信路(例えば、バス)によって接続されている。
メモリ501は、ファイル共有サーバプログラム506と、更新リスト転送プログラム507と、ファイルシステムプログラム508と、オペレーティングシステム509と、拠点別更新リスト510と、を格納している。なお、各プログラム506乃至509及び拠点別更新リスト510は、記憶装置123に格納され、CPU502によってメモリ501に読み出されて実行される態様でもよい。
ファイル共有サーバプログラム506は、NASデバイス102及び112がCASデバイス121上のファイルにファイル操作を行う手段を提供するプログラムである。更新リスト転送プログラム507は、更新リスト600をNASデバイス112に転送するプログラムである。ファイルシステムプログラム508は、ファイルシステムFS_A_CAS220及びFS_B_CAS221を制御する。
記憶装置123は、CASコントローラ122との接続に使用するインタフェース523、CASコントローラ122からの命令を実行するCPU522、プログラムやデータを格納するメモリ521、1または複数のディクス524を搭載しそれらは内部的な通信路(例えば、バス)によって接続されている。記憶装置123はFC−SAN(Fibre Channel Storage Area Network)等のブロック形式のストレージ機能をCASコントローラ122に提供する。
<他拠点更新リスト>
図6は、拠点BのNASデバイス112における他拠点更新リストテーブル(本実施形態では拠点Aの更新情報)の構成例を示す図である。なお、他拠点(拠点A)も同様の他の拠点(拠点Aからすると拠点B)に関する他拠点更新リストテーブルを有している。
他拠点更新リストテーブル600(図4では、他拠点更新リスト412と記されている)は、拠点名601と、ファイル名602と、更新日時603と、最終更新者604と、更新内容605と、を構成項目として有している。
拠点名601は、どの拠点のデータやファイルに関する更新情報であるかを示す情報であり、自拠点(拠点B)以外の拠点名や識別情報が記入される。ファイル名602は、更新に関するファイルを識別するための情報(パス等、ファイルを識別する識別情報)である。更新日時603は、対応するファイルが更新された日時を示す情報である。最終更新者604は、対応するファイルを最後に更新したユーザ識別を示す情報である(名前に限られず、識別コード等でも良い)。更新内容605は、更新された内容がデータかメタデータか示す情報である。ここで、メタデータとは、ユーザID、アクセス権の有無、ファイルサイズ、ファイルの属性、オーナの変更情報等を含む。
このような他拠点更新リストテーブルにより、他の拠点におけるファイルの更新状況を知ることが可能となる。
<自拠点更新リスト>
図7は、拠点BのNASデバイス112における自拠点更新リストテーブル(本実施形態では拠点B自身の更新情報)の構成例を示す図である。なお、他拠点(拠点A)も同様の自身の拠点(拠点A自身)に関する自拠点更新リストテーブルを有している。
自拠点更新リストテーブル700(図4では、自拠点更新リスト411と記されている)は、拠点名701と、ファイル名702と、更新日時703と、最終更新者704と、更新内容705と、を構成項目として有している。
拠点名701は、どの拠点における更新であるかを示す情報であり、自拠点名又は識別情報が記入される。ファイル名702は、更新に関するファイルを識別するための情報(パス等、ファイルを識別する識別情報)である。更新日時703は、対応するファイルが更新された日時を示す情報である。最終更新者704は、対応するファイルを最後に更新したユーザ識別を示す情報である(名前に限られず、識別コード等でも良い)。更新内容705は、更新された内容がデータかメタデータか示す情報である。ここで、メタデータとは、ユーザID、アクセス権の有無、ファイルサイズ、ファイルの属性、オーナの変更情報等を含む。
自拠点更新リストテーブル700は、マイグレーション処理ごとに、NASデバイス112によって作成・更新される。つまり、自拠点更新リストテーブル700は、N回目のマイグレーション処理からN+1回目のマイグレーション処理の間に更新されたファイルのパス名の一覧である。パス名の他に所有者や最終更新者や最終更新日時などの当該ファイルのメタデータをパス名と組み合わせて記録してもよい。
このような自拠点更新リストテーブルにより、自身の拠点におけるファイルの更新状況を管理することができ、当該ファイル更新状況の情報をCASデバイス121や他拠点のNASデバイスに通知することが可能となる。
<拠点別更新リスト>
図8は、CASデバイス121が有する拠点別更新リストの構成例を示す情報である。図8の例では、全ての拠点の更新情報を1つのテーブルで管理するようにしているが、拠点別に複数のテーブルを用いてそれぞれの更新情報を管理するようにしても良い。
拠点別更新リストテーブル800(図5では、拠点別更新リスト510と記されている)は、他の更新リストと同様、拠点名801と、ファイル名802と、更新日時803と、最終更新者804と、更新内容805と、を構成項目として有している。
拠点名801は、どの拠点におけるデータやファイルに関する更新情報であるかを示す情報である。ファイル名802は、更新に関するファイルを識別するための情報(パス等、ファイルを識別する識別情報)である。更新日時803は、対応するファイルが更新された日時を示す情報である。最終更新者804は、対応するファイルを最後に更新したユーザ識別を示す情報である(名前に限られず、識別コード等でも良い)。更新内容805は、更新された内容がデータかメタデータか示す情報である。ここで、メタデータとは、ユーザID、アクセス権の有無、ファイルサイズ、ファイルの属性、オーナの変更情報等を含む。
このような拠点別更新リストテーブルにより、各拠点におけるデータやファイルの更新状況を管理することが可能となる。
なお、図6乃至8で示されるように、更新内容はテーブル形式で保持されるが、他の形式でもよい。例えば、検索の高速化のためにハッシュテーブルやDBの形式でもよい。ファイルごとに、更新されたことを示すフラグを設け、ファイルシステムFS_A_R210内にメタデータとして保持してもよい。
<ファイルリード処理>
図9は、本発明による、拠点B110でのファイルシステムFS_A_R210に対するファイルリード処理を説明するためのフローチャートである。ファイルリード処理は、クライアント111からのファイルリード要求時に呼び出される。以下、図9に示す処理をステップ番号に沿って説明する。
ステップS901:NASデバイス112のファイルシステムプログラム409は、ファイル共有サーバプログラム406を経由してクライアント111からのファイルリード要求を受理する。
ステップS902:NASデバイス112のファイルシステムプログラム409は、リード要求のあったファイルがスタブか否かを判定する。リード要求のあったファイルがスタブではない場合(ステップS902でNOの場合)、処理はステップS903に移る。一方、リード要求のあったファイルがスタブの場合(ステップS902でYESの場合)、処理はステップS906に移る。一定期間経過すると、データが削除され、ファイルがスタブ情報に置き換わることがあるからである。つまり、自拠点のファイルではなく他拠点のファイルであっても、一定期間使用されないとスタブ情報に置き換わる。
ステップS903:NASデバイス112のファイルシステムプログラム409は、他拠点更新リストテーブル600を検索し、当該ファイルの有効性の可否を判定する。つまり、NASデバイス112が保持している他拠点のファイルに更新がなされたか否か判断される。更新がある(他拠点更新リストにある)と、更新後の該当ファイルの内容が、NASデバイス112が有している他拠点のファイルの内容と異なるため、内容の同期を取る必要があるからである。
ステップS904:該当ファイルのエントリが他拠点更新リストテーブル600にない場合(ステップS904でNOの場合)、処理は、ステップS908に移る。この場合、自拠点にあるファイルが最新であるため、通常通り該当ファイルが読み込まれることになる。
ステップS905:一方、当該ファイルのエントリが他拠点更新リストテーブル600にある場合(ステップS904でYESの場合)、図10で後述するデータ同期処理が実行される。
ステップS906:リード要求のあったファイルがスタブである場合(ステップS902でNOの場合)、NASデバイス112のファイル共有クライアントプログラム407は、CASデバイス121に当該ファイルのデータを要求する。
ステップS907:NASデバイス112のファイル共有クライアントプログラム407は、CASデバイス121からデータを受信し、当該ファイルにデータを格納する。
ステップS908:NASデバイス112のファイルシステムプログラム409は、ファイルリードの応答を、ファイル共有サーバプログラム406を経由してクライアント111に返す。
図9では、ステップS904において、当該ファイルのエントリが他拠点更新リストテーブル600にあるか否かで当該ファイルの有効性を判断している。この態様の他に、当該ファイルのエントリが他拠点更新リストテーブル600にあっても、例えば当該エントリの更新日時603とファイルシステムFS_A_R210に格納済みファイルの最終更新日時等の属性情報を用いて有効性を判断してもよい。
<データ同期処理の詳細>
図10は、データ同期処理の詳細を説明するためのフローチャートである。データ同期処理は、図9のステップS905の処理であり、NASデバイス112とCASデバイス121でデータの同期を実行する。以下、図10に示す処理をステップ番号に沿って説明する。
ステップS1001:NASデバイス112のファイル共有クライアントプログラム407は、CASデバイス121に当該ファイルのデータ同期要求を送付する。
ステップS1002:CASデバイス121のファイルシステムプログラム508は、ファイル共有サーバプログラム506を経由して、NASデバイス112からデータ同期要求を受け取り、当該ファイルのデータをNASデバイス112に転送する。転送されるデータは、ファイルの全データであっても良いし、更新前のファイルと更新後のファイルとの差分データであっても良い。差分データの転送を可能にするには、CASデバイス121が有する更新リストにおいて、ファイルのどの部分のデータが更新されたかを示す情報が管理されることが望ましい。また、CASデバイス121は、拠点Bが有している他拠点Aのデータが、拠点Bに何時読み込まれたか管理する必要がある。このため、拠点BのNASデバイス112は、自身が管理している更新日時情報をCASデバイス121に送信することにより、CASデバイス121は、どの時点で更新されたファイルとの差分データを拠点Bに転送すれば良いか判断できるようになる。
ステップS1003:NASデバイス112ファイル共有クライアントプログラム407は、CASデバイス121から当該ファイルのデータを受理し、ファイルシステムプログラム409と協働して、受理したデータを自身のファイルシステムFS_A_R210に格納する。
ステップS1004:NASデバイス112ファイルシステムプログラム409は、他拠点更新リストテーブル600から当該ファイルのエントリを削除する。
なお、ステップS1003の処理において、NASデバイス112は、既存の格納済みファイルを上書きせず、同一のパス名ではあるが、別バージョンのファイルとして格納する。例えば、ファイル名にバージョン番号や更新日付等のサフィックスを付随してもよい。また、ファイルの属性情報にバージョン番号や最終更新者等を含めてもよい。これらによって、クライアント111が前の格納済みファイルを参照したい場合に参照可能とする。
<ファイルライト処理>
図11は、拠点B110でのファイルシステムFS_A_R210に対するファイルライト処理を説明するためのフローチャートである。本実施形態では、別拠点のファイルを参照するファイルシステムFS_A_R210は、拠点Bクライアント111からのファイルの更新を禁止するため、自身の更新可能なファイルシステムFS_B211に当該ファイルをコピーし、その後ファイルに対してライトすることでファイルライトを実現する。以下、図11に示す処理をステップ番号に沿って説明する。
ステップS1101:NASデバイス112のファイルシステムプログラム409は、ファイル共有サーバプログラム406を経由してクライアント111からのファイルライト要求を受理する。
ステップS1102:NASデバイス112のファイルシステムプログラム409は、当該ファイルがスタブか否かを判定する。当該ファイルがスタブではない場合(ステップS1102でNOの場合)、処理は、ステップS1205に移る。
ステップS1103:一方、当該ファイルがスタブである場合(ステップS1102でYESの場合)、NASデバイス112のファイル共有クライアントプログラム407は、CASデバイス121にデータを要求する。
ステップS1104:NASデバイス112のファイルシステムプログラム409は、CASデバイス121から要求したデータを、ファイル共有クライアントプログラム407を経由して受理し、ファイルシステムFS_A_R210に格納する。
ステップS1105:NASデバイス112のファイルシステムプログラム409は、当該ファイルをファイルシステムFS_A_R210からファイルシステムFS_B211にコピーする。拠点Bのユーザが、本来拠点Aのファイルについて更新しようとしているため、複製されたファイルに対して更新処理ができるようにし、オリジナルはそのまま保持されるようにしている。
ステップS1106:NASデバイス112のファイルシステムプログラム409は、コピーしたファイルシステムFS_B211上のファイルに対してデータを更新する。
ステップS1107:NASデバイス112のファイルシステムプログラム409は、ファイルライトの応答を、ファイル共有サーバプログラム406を経由してクライアント111に返す。
<データ削除処理>
図12は、データ削除処理を説明するためのフローチャートである。データ削除処理は、定期的にNASデバイス102のOS410によって呼び出され、ファイルシステムFS_A200上の最終アクセス時間が閾値より古いファイルのデータブロックを解放する処理である。図12は拠点A100を説明しているが、拠点B110のファイルシステムFS_A_R210及びFS_B211でも同様である。以下、図12に示す処理をステップ番号に沿って説明する。
ステップS1201:NASデバイス102のファイルシステムプログラム409は、ファイルシステムFS_A200の空き容量が閾値以上か否かを判定する。ファイルシステムFS_A200の空き容量が閾値以上ならば(ステップS1201でYESの場合)、データ削除処理は終了する。閾値は、システム管理者が管理端末124から、或いはクライアント101のユーザが適宜設定できるようになっている。
ステップS1202:一方、ファイルシステムFS_A200の空き容量が閾値以上ではないならば(ステップS1201でNOの場合)、NASデバイス102のファイルシステムプログラム409は、最終アクセス時間が閾値より古いファイルをファイルシステムFS_A200から検索する。この閾値もまた、システム管理者がリモートから適宜設定、または、クライアント101のユーザが適宜設定できるようになっている。
ステップS1203:ステップS1202の結果、最終アクセス時間が閾値より古いファイルが発見できない場合(ステップS1203でNOの場合)、データ削除処理は終了する。
ステップS1204:一方、最終アクセス時間が閾値より古いファイルが発見できた場合(ステップS1203でYESの場合)、NASデバイス102のファイルシステムプログラム409は、当該ファイルのデータブロックの解放を行う。そして、処理は、ステップS1201に移る。
なお、図12では、最終アクセス時間をデータ削除処理の条件としているが、最終更新日時やサイズなどの属性情報やそれらの組み合わせを用いてもよい。
また、ステップS1203で管理端末124やクライアント101のユーザに、NASデバイス102の容量(空き容量)に関して警告を表示してもよい。自動的に閾値を下げて(条件を緩めて)再検索し、データ削除処理を続行してもよい。
さらに、ステップS1204で、NASデバイス102が当該ファイルのデータブロックを解放、つまり、当該ファイルをスタブに変更しているが、スタブ情報も含めて当該ファイルを削除してもよい。
<マイグレーション処理>
図13は、拠点A100でのNASデバイス102によるマイグレーション処理を説明するためのフローチャートである。マイグレーション処理は、管理者によって設定されたマイグレーションの周期・タイミングでOS410から呼び出され、NASデバイス102に格納されているファイルの内、後述する、管理者が設定したマイグレーション条件を満たすファイルをCASデバイス121に転送(アーカイブまたはバックアップ)する処理である。図13は、拠点A100におけるマイグレーション処理について説明しているが、拠点B110のファイルシステムFS_B211でも同様である。また、図13では、S1306でスタブ情報に変更する処理が含まれているため、CAS121にアーカイブする場合について説明している。バックアップ処理の場合には、ファイルが拠点に残るため、バックアップ処理後所定時間経過後に削除処理が実行されるようにしても良い。以下、図13に示す処理をステップ番号に沿って説明する。
ステップS1301:NASデバイス102のマイグレーションプログラム408は、ファイルシステムFS_A200に格納されているファイルを検索し、マイグレーションリストを作成する。マイグレーションリストは、管理者が設定したマイグレーション条件を満たすファイルのエントリを含む。
ステップS1302:NASデバイス102のマイグレーションプログラム408は、マイグレーションリストが空(NULL)か否かを判定する。マイグレーションリストが空の場合(ステップS1302でYESの場合)、NASデバイス102は、CASデバイス121にマイグレーション処理完了通知を送信し、処理をステップS1308に移行させる。
ステップS1303:一方、マイグレーションリストが空ではない場合(ステップS1302でNOの場合)、NASデバイス102のマイグレーションプログラム408は、ファイル共有クライアントプログラム407を経由して、マイグレーションリストの先頭エントリのファイルをCASデバイス121にコピーする。
ステップS1304:CASデバイス121のファイルシステムプログラム508は、ファイル共有サーバプログラム506を経由して、NASデバイス102から受理したファイルをファイルシステムFS_A_CAS220に格納する。
ステップS1305:CASデバイス121のファイルシステムプログラム508は、ファイル共有サーバプログラム506を経由して、格納したファイルのパスをNASデバイス102に返却する。
ステップS1306:NASデバイス102のマイグレーションプログラム408は、当該ファイルをスタブに変更する。このとき、ステップS1305でCASデバイス121から返却されたファイルパスをスタブに含める。上述のように、ファイルがスタブ情報に置き換えられるのは、マイグレーション処理におけるアーカイブ処理の場合のみである。マイグレーション処理におけるバックアップ処理の場合には、ファイルはスタブ情報に置き換えられることはなく、該当ファイルはそのままNASデバイス102上に保持される。
ステップS1307:NASデバイス102のマイグレーションプログラム408は、マイグレーションリストの先頭エントリを削除する。そして、処理は、ステップS1302に移る。
ステップS1308:CASデバイス121のファイルシステムプログラム508は、NASデバイス102からのマイグレーション処理完了通知を受理し、マイグレーション処理によって更新されたファイル群の一覧として更新リストを作成する。
ステップS1309:CASデバイス121のファイルシステムプログラム508は、ステップS1308で作成した更新リストを拠点B110のNASデバイス112に転送する。
本実施形態では、マイグレーション処理は、管理者が設定したマイグレーションの周期・タイミングでOS410から呼び出されるが、マイグレーション条件を満たすファイルを発見したタイミングでそのファイルのマイグレーション処理を行っても良い。
また、図13では、ステップS1301でNASデバイス102がマイグレーションリストを作成するが、マイグレーションリスト作成のタイミングはこれに限定されない。つまり、図13では、マイグレーション処理が呼び出されたときに、マイグレーションリストを作成するようになっているが、ファイル更新があったら適宜マイグレーションリストにファイル名を追加していくようにしても良い。
管理者が設定するマイグレーション条件として、例えば、ファイルの所有者、ファイルの作成日時、ファイルの最終更新日時、ファイルの最終アクセス日時、ファイルサイズ、ファイルタイプ、WORM(Write Once Read Many)設定の有無、リテンション設定の有無とその期間などのANDやOR条件が設定される。マイグレーション条件は、ファイルシステムFS_A200全体、もしくは特定のディレクトリやファイルに個別に設定しても良い。
なお、一度アーカイブしたファイルをリコール(リストア)してファイルシステムFS_A200に格納されたファイルは、当該ファイルデータに更新が発生した場合、再度マイグレーション処理の対象となる。この場合、NASデバイス102がリコールされたファイルに対する更新の有無を判定する方法として、以下のような方法が挙げられる。例えば、ファイルの属性情報に「リコール後のライト有無」を格納するフラグを用いて管理する方法としてもよい。また、ファイルの属性情報に「リコール日時」を格納するフィールドを設け、ファイルの最終更新日時と比較することによって判定する方法としてもよい。また、リコールされたファイルに対してライト要求があった場合、ライト要求に対する応答の終了したタイミングでマイグレーション処理を行う方法としてもよい。
また、図13では、マイグレーション処理においてマイグレーションリストの先頭エントリのファイルからマイグレーションを実行する例を示しているが、マイグレーションリストの末端エントリのファイルからマイグレーションを実行する場合でも同様のことが実現可能である。
本発明の実施形態で、ステップS1301でNASデバイス102が作成するマイグレーションリストを更新リストとしてもよい。また、ステップS1301でNASデバイス102が作成するマイグレーションリストのうち、マイグレーション処理が成功したファイル群を更新リストとしてもよい。これらの場合、NASデバイス102が、更新リストをCASデバイス121に転送し、さらにCASデバイス121がその更新リストをNASデバイス112に転送することで更新リストの転送を実現してもよい。
さらに、図13では、ステップS1309において、CASデバイス121がNASデバイス112に更新リストを転送しているが、更新リストの転送のタイミングはこれに限らない。例えば、CASデバイス121がNASデバイス112に、マイグレーション処理完了の通知を行い、その後NASデバイス112が更新リストの転送をCASデバイス121に要求してもよい。
本発明の実施形態で、マイグレーション処理によって更新されたファイル群の一覧を自拠点及び他拠点の更新リストとしているが、更新リストに格納されるファイルはこれに限らない。例えば、NASデバイス112が、自身に格納済みの他拠点のファイルの一覧をCASデバイス121に通知し、CASデバイス121が、マイグレーション処理によって更新されたファイル群の中で、NASデバイス112に格納済みの他拠点のファイルを抽出し、これを、他拠点更新リストを構成する更新情報としてもよい。これによって他拠点更新リストを構成する更新情報のサイズを小さくでき、転送量を削減できる。また、NASデバイス112は、更新されたファイルを他拠点更新リストテーブル600に格納するときに、NASデバイス112に格納済みの他拠点のファイルのみ他拠点更新リストテーブル600に当該ファイルのエントリを追加してもよい。これによって、他拠点更新リストテーブル600のサイズを小さくできる。
以上に説明したように、第1の実施形態では、NASデバイス112が他拠点更新リストテーブル600を保持し、クライアント111からファイルデータにリード要求があったときに、他拠点更新リストテーブル600を用いてファイルの有効性(自拠点に保持している他拠点のファイルと他拠点に保持されているファイルの同一性)の可否を判断する。このようにすることで、ファイルの同期処理の要否を判断することができ、レスポンス時間の短縮化が可能である。
(2)第2の実施形態
以下、本発明の第2の実施形態について説明する。なお、以下の説明では、第1の実施形態との相違点を主に説明し、第1の実施形態との共通点については説明を省略、或いは簡略する。
本発明の第1の実施形態では、NASデバイス112は、CASデバイス121から通知される他拠点(拠点A)における更新リストを受理後(他拠点のNASデバイスから直接更新情報を取得するようにしても良い)、自拠点に保持される他拠点のファイル(群)のエントリを他拠点更新リストテーブル600に追加する。また、データ同期処理のタイミングは、クライアント111から当該ファイルデータにリード要求があったときとなっている。
一方、本発明の第2の実施形態では、NASデバイス112が他拠点の更新リストを受理後、更新リストに含まれ、自拠点に保持されている他拠点のファイル(群)のデータ同期処理を一括して行うようにする。
図18は、本発明の第2の実施形態における処理概要の特徴を説明するための図である。第2の実施形態では、拠点Bにおいてデータセンタから更新リストを受信した後、当該ファイルの同期処理が行われる。処理手順は、第1の実施形態の処理(i)乃至(iii)が実行された後、処理(vii)が実行される。つまり、拠点BのNASデバイスは、拠点Bが既に保持している格納済みファイルのうち、CASデバイスから転送されてきた更新リストに該当するファイルの最新データを事前にCASデバイスから読み込むか、又はパージする(処理(vii))。
このように、第2の実施形態では、NASデバイス112が更新リストを受理後、更新リストに登録されているファイル群のデータ同期処理を一括して行う。第2の実施形態と第1の実施形態とを組み合わせてもよい。例えば、一部のファイルは更新リストテーブル600に格納し、第1の実施形態のデータ同期処理を行い、1部のファイルは更新リスト受理時に第2の実施形態の一括データ同期処理を実施してもよい。事前に更新済みデータをNASデバイス112に格納することで、レスポンス時間の削減が可能である。
<一括データ同期処理>
図14は、第2の実施形態による、一括データ同期処理を説明するためのフローチャートである。一括データ同期処理は、NASデバイス112がCASデバイス121から更新リストを受理後に呼び出される。以下、図14に示す処理をステップ番号に沿って説明する。
ステップS1401:拠点BのNASデバイス112のファイルシステムプログラム409は、更新リストの全ファイルに対して同期処理を完了したか否かチェックする。更新リストの全ファイルに対して同期処理を完了した場合(ステップS1401でYESの場合)、NASデバイス112のファイルシステムプログラム409は一括データ同期処理を完了する。
ステップS1402:一方、更新リストの全ファイルに対して同期処理を完了していない場合(ステップS1401でNOの場合)、NASデバイス112のファイルシステムプログラム407は、当該ファイルの同期が必要か否かを判定する。同期不要の場合(ステップS1402でNOの場合)、処理はステップS1401に移る。なお、同期不要の場合には、当該ファイルがNASデバイス112上でスタブの状態、または存在しない状態が含まれる。スタブであれば、ファイルの実体はCASデバイス121上にあり、そこから常に更新後のファイル内容が取得されるため、逐一同期処理をする必要がないからである。
ステップS1403:一方、当該ファイルが同期要の場合(ステップS1402でYESの場合)、NASデバイス112のファイルシステムプログラム409は、ファイル共有クライアントプログラム407を経由して、CASデバイス121に当該ファイルのデータ同期を要求する。
ステップS1404:CASデバイス121のファイルシステムプログラム508は、ファイル共有サーバプログラム506を経由して、NASデバイス112からのデータ同期要求を受理し、当該ファイルデータをNASデバイス112に転送する。
ステップS1405:NASデバイス112のファイルシステムプログラム409は、ファイル共有クライアントプログラム407を経由して、CASデバイス121から要求したデータを受理し、ファイルシステムFS_A_R210に格納する。
なお、図14のステップS1405の処理において、NASデバイス112は、既存の格納済みファイルを上書きせず、同一のパス名ではあるが、別バージョンのファイルとして格納するようにしても良い。例えば、ファイル名にバージョン番号や更新日付等のサフィックスを付随してもよい。また、ファイルの属性情報にバージョン番号や最終更新者等を含めてもよい。これらによって、クライアント111が前の格納済みファイルを参照したい場合に参照可能とする。
また、ステップS1403の処理において、NASデバイス112は、CASデバイス121に当該ファイルのデータ同期を要求しているが、格納済みのファイルデータを削除し、スタブに変更してもよい。
図14は、更新リストに登録されている全ファイルに対して一括データ同期処理を実施するが、第1の実施形態と組み合わせてもよい。例えば、一部のファイルは他拠点更新リストテーブル600に格納し、第1の実施形態のデータ同期処理を行い、1部のファイルは図14に示した一括データ同期処理を実施してもよい。一括データ同期処理の対象となるデータサイズが大きい場合には時間が掛かるため、分割して同期を取ることにより、処理の効率化を図ることができる。
以上に説明したように、第2の実施形態では、NASデバイス112がクライアント111からのデータ要求の前にデータ同期処理を行い、事前に更新済みデータをNASデバイス112に格納することで、レスポンス時間の削減が可能である。
(3)第3の実施形態
以下、本発明の第3の実施形態について説明する。なお、以下の説明では、第1の実施形態及び第2の実施形態との相違点を主に説明し、第1及び第2の実施形態との共通点については説明を省略、或いは簡略する。
本発明の第3の実施形態では、NASデバイス102が更新したファイルを即時にCASデバイス121にアーカイブまたはバックアップし、CASデバイス121は当該ファイルをNASデバイス112に転送し、NASデバイス112は即時に当該ファイルを更新する。
第3の実施形態では、拠点Bにおいて拠点Aの当該ファイルの全バージョンを参照可能にする。これを可能にするのが、後述のリアルタイム同期処理である。以下、第3の実施形態による処理手順について説明する。拠点AでファイルFが更新されるごとにデータセンタにリアルタイムに更新データが転送される。そして、データセンタはファイルFが更新されるごとに拠点Bに更新を通知する。一方、拠点BのNASデバイスは、ファイルFの更新が通知されるごとに最新データをデータセンタから取得する。データセンタがファイルのバージョンを管理しているならば、あるタイミングで未取得バージョンを一括取得してもよい。また、ユーザが指定したファイルのみサポート(基本は夜間の一括マイグレーション処理を想定しているため)するように動作しても良い。
このように、第3の実施形態では、NASデバイス102が更新したファイルを即時にCASデバイス121にアーカイブまたはバックアップし、CASデバイス121は当該ファイルをNASデバイス112に転送し、NASデバイス112は即時に当該ファイルを更新することで、拠点間でのリアルタイムのファイル共有を実現する。
<オリジナルファイルライト処理>
図15は、第3の実施形態による、オリジナルファイルライト処理を説明するためのフローチャートである。オリジナルファイルライト処理は、例えば、拠点A100のクライアント101が拠点A100のNASデバイス102に格納されているファイルに対してライト要求を発行し、NASデバイス102が当該ファイルを更新する処理である。第3の実施形態では、リアルタイムに同期処理を行う対象のファイルに対するオリジナルファイルライト処理で、リアルタイム同期処理を実行する。以下、図15に示す処理をステップ番号に沿って説明する。以下の説明では、ライト要求は拠点AのNASデバイス102で処理され、リアルタイム同期処理は拠点BのNASデバイス112で実行されるように説明されているが、これは理解を容易にするため便宜上そのようにしているのであって、各拠点で同様の処理が実行されるものである。
ステップS1501:拠点AのNASデバイス102のファイルシステムプログラム409は、ファイル共有サーバプログラム406を経由して、クライアント101からのライト要求を受理する。
ステップS1502:NASデバイス102のファイルシステムプログラム409は、受理したデータを当該ファイルに格納する。
ステップS1503:NASデバイス102のファイルシステムプログラム409は、ファイルライトの応答を、ファイル共有サーバプログラム406を経由してクライアント101に返す。
ステップS1504:NASデバイス102のファイルシステムプログラム409は、当該ファイルのリアルタイム同期処理が必要か不要かを判定する。リアルタイム同期処理不要ならば(ステップS1504でNOの場合)、オリジナルファイルライト処理を終了する。
ステップS1505:リアルタイム同期処理要ならば(ステップS1504でYESの場合)、NASデバイス102は後述するリアルタイム同期処理を行う。
図15のステップS1504においてNASデバイス102は、当該ファイルがリアルタイム同期処理要か不要か判定しているが、リアルタイム同期処理が必要なファイルか否かは、システム管理者が管理端末124から適宜設定、または、クライアント101のユーザが適宜設定できるようになっている。
なお、第1及び第2の実施形態では、他拠点(拠点A)で定期的に行われるバッチ処理によってマイグレーションされた更新ファイルのみ、自拠点(拠点B)では閲覧することができるようになっている。つまり、それぞれのバッチ処理間に複数回ファイルが更新された場合には全てのバージョンのファイルを拠点Bでは閲覧できないことになる。一方、第3の実施形態では、リアルタイムにファイル同期処理が実行されるため、自拠点(拠点B)では他拠点(拠点A)で更新された全バージョンのファイルを閲覧することが可能となる。
<リアルタイム同期処理の詳細>
図16は、リアルタイム同期処理の詳細を説明するためのフローチャートである。リアルタイム同期処理は、図15のステップS1505の処理である。以下、図16に示す処理をステップ番号に沿って説明する。
ステップS1601:NASデバイス102のファイル共有クライアントプログラム407は、同期処理をCASデバイス121に要求する。
ステップS1602:CASデバイス121のファイルシステムプログラム508は、同期処理要求を、ファイル共有サーバプログラム506を経由してNASデバイス102から受理し、ファイルシステムFS_A_CAS220に格納されている当該ファイルを、受理したデータで更新する。
ステップS1603:CASデバイス121のファイルシステムプログラム508は、当該データを、ファイル共有サーバプログラム506を経由してNASデバイス112に転送する。
ステップS1604:NASデバイス112のファイル共有クライアントプログラム407は、CASデバイス121からのデータを受理し、ファイルシステムプログラム409と協働して、受理したデータを自身のファイルシステムFS_A_R210に格納する。
図16のステップS1604の処理において、NASデバイス112は、既存の格納済みファイルを上書きせず、同一のパス名ではあるが、別バージョンのファイルとして格納する。例えば、ファイル名にバージョン番号や更新日付等のサフィックスを付随してもよい。また、ファイルの属性情報にバージョン番号や最終更新者等を含めてもよい。これらによって、クライアント111が前の格納済みファイルを参照したい場合に参照可能とする。
以上に説明したように、第3の実施形態では、NASデバイス102が更新したファイルを即時にCASデバイス121にアーカイブまたはバックアップし、CASデバイス121は当該ファイルをNASデバイス112に転送し、NASデバイス112は即時に当該ファイルを更新することで、拠点間でのリアルタイムのファイル共有を実現する。
(4)まとめ
本発明は、従来技術に対してソフトウェアによる機能追加により実現できるため、インフラの追加が不要である。本発明は拠点間の通信は不要であるため、データ共有を行うための拠点間の通信インフラの追加は不要である。また、利用するバックアップデータは拠点の災害/障害時のリカバリのために取得しているバックアップデータが流用できるため、データセンタにもストレージの追加は不要である。
また、本発明は、実施形態の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をシステム或は装置に提供し、そのシステム或は装置のコンピュータ(又はCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、CD−ROM、DVD−ROM、ハードディスク、光ディスク、光磁気ディスク、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどが用いられる。
また、プログラムコードの指示に基づき、コンピュータ上で稼動しているOS(オペレーティングシステム)などが実際の処理の一部又は全部を行い、その処理によって前述した実施の形態の機能が実現されるようにしてもよい。さらに、記憶媒体から読み出されたプログラムコードが、コンピュータ上のメモリに書きこまれた後、そのプログラムコードの指示に基づき、コンピュータのCPUなどが実際の処理の一部又は全部を行い、その処理によって前述した実施の形態の機能が実現されるようにしてもよい。
また、実施の形態の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することにより、それをシステム又は装置のハードディスクやメモリ等の記憶手段又はCD−RW、CD−R等の記憶媒体に格納し、使用時にそのシステム又は装置のコンピュータ(又はCPUやMPU)が当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしても良い。
最後に、ここで述べたプロセス及び技術は本質的に如何なる特定の装置に関連することはなく、コンポーネントの如何なる相応しい組み合わせによってでも実装できることを理解する必要がある。更に、汎用目的の多様なタイプのデバイスがここで記述した教授に従って使用可能である。ここで述べた方法のステップを実行するのに、専用の装置を構築するのが有益であることが判るかもしれない。また、実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。本発明は、具体例に関連して記述したが、これらは、すべての観点に於いて限定の為ではなく説明の為である。本分野にスキルのある人には、本発明を実施するのに相応しいハードウェア、ソフトウェア、及びファームウエアの多数の組み合わせがあることが解るであろう。例えば、記述したソフトウェアは、アセンブラ、C/C++、perl、Shell、PHP、Java(登録商標)等の広範囲のプログラム又はスクリプト言語で実装できる。
さらに、上述の実施形態において、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていても良い。
加えて、本技術分野の通常の知識を有する者には、本発明のその他の実装がここに開示された本発明の明細書及び実施形態の考察から明らかになるはずである。記述された実施形態の多様な態様及び/又はコンポーネントは、データを管理する機能を有するコンピュータ化ストレージシステムに於いて、単独又は如何なる組み合わせでも使用することが出来る。明細書と具体例は典型的なものに過ぎず、本発明の範囲と精神は後続する請求範囲で示される。
100 拠点A(第1のサブ計算機システム)
110 拠点B(第2のサブ計算機システム)
120 データセンタ
101及び111 クライアント
102及び112 NASデバイス(NAS)
121 CASデバイス(CAS)
124 管理端末
200 ファイルシステムFS_A
210 ファイルシステムFS_A_R
211 ファイルシステムFS_B
220 ファイルシステムFS_A_CAS
221 ファイルシステムFS_B_CAS

Claims (15)

  1. 第1のサブ計算機システム及び第2のサブ計算機システムを含む複数のサブ計算機システムと、当該複数のサブ計算機システムに接続されるデータ管理計算機システムと、を有し、
    前記複数のサブ計算機システムはそれぞれ、ストレージサブシステムに格納されたデータをクライアントコンピュータに提供するシステムであり、
    前記データ管理計算機システムは、各サブ計算機システムから移行されたデータを管理するシステムであり、
    前記データ管理計算機システムは、前記第1のサブ計算機システム用のバックアップデータを管理し、当該バックアップデータの少なくとも一部のデータを、少なくとも、前記第1のサブ計算機システムとは別の前記第2のサブ計算機システムに転送し、
    少なくとも前記第2のサブ計算機システムは、前記データ管理計算機システムから転送されたデータを前記第2のサブ計算機システム内のストレージサブシステムに格納して共有ファイルシステムを生成し、
    前記データ管理計算機システムは、前記第1のサブ計算機システムからバックアップされた前記データが更新された場合に、更新データの情報を含む通知用更新管理情報を取得し、前記第2のサブ計算機システムに前記通知用更新管理情報を転送し、
    前記第2のサブ計算機システムは、自身が既に保持する前記第1のサブ計算機システムのファイルである他拠点ファイルについて、前記通知用更新管理情報を用いて、前記第1のサブ計算機システムにおける、前記他拠点ファイルに対応する更新後ファイルとの同一性を判定することを特徴とする情報処理システム。
  2. 請求項1において、
    前記第2のサブ計算機システムは、前記他拠点ファイルに関する更新状況を管理するための他拠点ファイル更新管理情報を有し、前記通知用更新管理情報を前記データ管理計算機システムから受信した場合に、前記他拠点ファイル更新管理情報を更新することを特徴とする情報処理システム。
  3. 請求項1において、
    前記第2のサブ計算機システムは、前記他拠点ファイルが前記更新後ファイルと異なると判定した場合、前記他拠点ファイルが前記更新後ファイルと同一となるように、前記データ管理計算機システムからデータを取得してデータの同期を取るデータ同期処理を実行することを特徴とする情報処理システム。
  4. 請求項3において、
    前記第2のサブ計算機システムは、前記クライアントから前記他拠点ファイルにアクセスがなされた契機で、前記データ同期処理を実行することを特徴とする情報処理システム。
  5. 請求項3において、
    前記第2のサブ計算機システムは、前記通知用更新管理情報を前記データ管理計算機システムから受信した契機で、前記データ同期処理を実行することを特徴とする情報処理システム。
  6. 請求項3において、
    前記第2のサブ計算機システムは、前記第1のサブ計算機システムにおいて、前記他拠点ファイルに対応するオリジナルのファイルが更新された契機で、前記データ同期処理を実行することを特徴とする情報処理システム。
  7. 請求項1において、
    前記第2のサブ計算機システムは、前記他拠点ファイルそのものを削除する場合、前記他拠点ファイルのスタブ情報を生成し、当該スタブ情報を前記ストレージサブシステム内で管理することを特徴とする情報処理システム。
  8. 請求項1において、
    前記第2のサブ計算機システムは、
    前記他拠点ファイルに関する更新状況を管理するための他拠点ファイル更新管理情報を有し、前記通知用更新管理情報を前記データ管理計算機システムから受信した場合に、前記他拠点ファイル更新管理情報を更新し、
    前記他拠点ファイルが前記更新後ファイルと異なると判定した場合、前記クライアントから前記他拠点ファイルにアクセスがなされた契機で、前記他拠点ファイルが前記更新後ファイルと同一となるように、前記データ管理計算機システムからデータを取得してデータの同期を取るデータ同期処理を実行し、
    前記他拠点ファイルに対するアクセスが所定期間なされなかった場合に、前記他拠点ファイルを前記ストレージサブシステムから削除すると共に、当該削除対象の他拠点ファイルのスタブ情報を生成し、当該スタブ情報を前記ストレージサブシステム内で管理することを特徴とする情報処理システム。
  9. 第1のサブ計算機システム及び第2のサブ計算機システムを含む複数のサブ計算機システムと、当該複数のサブ計算機システムに接続されるデータ管理計算機システムと、を有する情報処理システムにおけるデータ処理方法であって、
    前記複数のサブ計算機システムはそれぞれ、ストレージサブシステムに格納されたデータをクライアントコンピュータに提供するシステムであり、
    前記データ管理計算機システムは、各サブ計算機システムから移行されたデータを管理するシステムであり、
    前記データ処理方法は、
    前記データ管理計算機システムが、前記第1のサブ計算機システム用のバックアップデータを管理し、当該バックアップデータの少なくとも一部のデータを、少なくとも、前記第1のサブ計算機システムとは別の前記第2のサブ計算機システムに転送するステップと、
    少なくとも前記第2のサブ計算機システムが、前記データ管理計算機システムから転送されたデータを前記第2のサブ計算機システム内のストレージサブシステムに格納して共有ファイルシステムを生成するステップと、
    前記第1のサブ計算機システムが、前記データ管理計算機システムにバックアップしたデータを更新するステップと、
    前記データ管理計算機システムが、前記第1のサブ計算機システムからバックアップされた前記データが更新された場合に、更新データの情報を含む通知用更新管理情報を取得し、前記第2のサブ計算機システムに前記通知用更新管理情報を転送するステップと、
    前記第2のサブ計算機システムが、自身が既に保持する前記第1のサブ計算機システムのファイルである他拠点ファイルについて、前記通知用更新管理情報を用いて、前記第1のサブ計算機システムにおける、前記他拠点ファイルに対応する更新後ファイルとの同一性を判定するステップと、
    を有することを特徴とするデータ処理方法。
  10. 請求項9において、
    前記第2のサブ計算機システムは、前記他拠点ファイルに関する更新状況を管理するための他拠点ファイル更新管理情報を有し、
    さらに、前記第2のサブ計算機システムが、前記通知用更新管理情報を前記データ管理計算機システムから受信した場合に、前記他拠点ファイル更新管理情報を更新するステップを有することを特徴とするデータ処理方法。
  11. 請求項9において、
    さらに、前記第2のサブ計算機システムが、前記他拠点ファイルが前記更新後ファイルと異なると判定した場合、前記他拠点ファイルが前記更新後ファイルと同一となるように、前記データ管理計算機システムからデータを取得してデータの同期を取るデータ同期処理を実行するステップを有することを特徴とするデータ処理方法。
  12. 請求項11において、
    前記データ同期処理を実行するステップにおいて、前記第2のサブ計算機システムは、前記クライアントから前記他拠点ファイルにアクセスがなされた契機で、前記データ同期処理を実行することを特徴とするデータ処理方法。
  13. 請求項11において、
    前記データ同期処理を実行するステップにおいて、前記第2のサブ計算機システムは、前記通知用更新管理情報を前記データ管理計算機システムから受信した契機で、前記データ同期処理を実行することを特徴とするデータ処理方法。
  14. 請求項11において、
    前記データ同期処理を実行するステップにおいて、前記第2のサブ計算機システムは、前記第1のサブ計算機システムにおいて、前記他拠点ファイルに対応するオリジナルのファイルが更新された契機で、前記データ同期処理を実行することを特徴とするデータ処理方法。
  15. 請求項9において、
    さらに、前記第2のサブ計算機システムが、前記他拠点ファイルそのものを削除する場合、前記他拠点ファイルのスタブ情報を生成し、当該スタブ情報を前記ストレージサブシステム内で管理するステップを有することを特徴とするデータ処理方法。
JP2013532764A 2011-04-08 2011-04-08 ファイルシステム及びデータ処理方法 Active JP5661188B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2011/002101 WO2012137262A1 (en) 2011-04-08 2011-04-08 Information processing system and data processing method

Publications (2)

Publication Number Publication Date
JP2014503086A true JP2014503086A (ja) 2014-02-06
JP5661188B2 JP5661188B2 (ja) 2015-01-28

Family

ID=46966883

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013532764A Active JP5661188B2 (ja) 2011-04-08 2011-04-08 ファイルシステム及びデータ処理方法

Country Status (5)

Country Link
US (1) US20120259813A1 (ja)
EP (1) EP2652588A1 (ja)
JP (1) JP5661188B2 (ja)
CN (1) CN103384876B (ja)
WO (1) WO2012137262A1 (ja)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016016998A1 (ja) * 2014-07-31 2016-02-04 三菱電機株式会社 コントローラ、および、ホームシステム
WO2016110936A1 (ja) * 2015-01-05 2016-07-14 株式会社日立製作所 計算機システム、及び、データ管理方法
WO2016121093A1 (ja) * 2015-01-30 2016-08-04 株式会社日立製作所 ファイルサーバ装置
WO2017109862A1 (ja) * 2015-12-22 2017-06-29 株式会社日立製作所 データファイル管理方法、データファイル管理システム、およびアーカイブサーバ
JP2018041454A (ja) * 2015-01-30 2018-03-15 ドロップボックス, インコーポレイテッド 共有コンテンツアイテムのストレージ制約付きの同期
US10248705B2 (en) 2015-01-30 2019-04-02 Dropbox, Inc. Storage constrained synchronization of shared content items
US10552449B2 (en) 2015-01-30 2020-02-04 Dropbox, Inc. Storage constrained synchronization of shared content items
US10691478B2 (en) 2016-08-15 2020-06-23 Fujitsu Limited Migrating virtual machine across datacenters by transferring data chunks and metadata
US10831715B2 (en) 2015-01-30 2020-11-10 Dropbox, Inc. Selective downloading of shared content items in a constrained synchronization system
US10846303B2 (en) 2016-04-25 2020-11-24 Dropbox, Inc. Storage constrained synchronization engine
JP2020197782A (ja) * 2019-05-31 2020-12-10 株式会社バッファロー 記憶装置、記憶方法、及び記憶プログラム
US11106635B2 (en) 2015-01-30 2021-08-31 Hitachi, Ltd. Computer system, file storage controller, and data sharing method
US11562000B2 (en) 2016-04-25 2023-01-24 Dropbox, Inc. Storage constrained synchronization engine
JP7465301B2 (ja) 2022-05-20 2024-04-10 株式会社日立製作所 データ管理システム、データ管理方法、およびプログラム

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120278738A1 (en) * 2011-04-26 2012-11-01 Infocus Corporation Interactive and Collaborative Computing Device
US9607006B2 (en) * 2011-10-06 2017-03-28 General Electric Company Temporary distributed file persistence
US10152492B1 (en) * 2012-03-30 2018-12-11 EMC IP Holding Company LLC Extended recycle bin for versioning
TW201416873A (zh) * 2012-10-19 2014-05-01 Apacer Technology Inc 網路儲存系統的檔案分享方法
WO2014128819A1 (ja) * 2013-02-19 2014-08-28 株式会社 日立製作所 情報処理システム及びそのデータ同期制御方式
WO2016121082A1 (ja) * 2015-01-30 2016-08-04 株式会社日立製作所 計算機システム、ファイルストレージ装置、およびストレージ制御方法
US20170154066A1 (en) * 2015-11-30 2017-06-01 International Business Machines Corporation Subscription service for monitoring changes in remote content
JP2019204278A (ja) 2018-05-23 2019-11-28 富士通株式会社 情報処理システム、情報処理装置およびプログラム
CN108831531A (zh) * 2018-06-07 2018-11-16 滨州学院 一种基于云计算的自适应医学图像远程处理方法及应用系统
CN109376141B (zh) * 2018-08-31 2021-09-14 创新先进技术有限公司 一种数据迁移方法和装置
JP7102455B2 (ja) * 2020-03-26 2022-07-19 株式会社日立製作所 ファイルストレージシステム及びファイルストレージシステムの管理方法
US11561777B2 (en) 2021-06-11 2023-01-24 EMC IP Holding Company LLC System and method for intelligent update flow across inter and intra update dependencies
US11330078B1 (en) * 2021-06-11 2022-05-10 EMC IP Holding Company LLC Method and system for managing updates of a data manager
US11599352B2 (en) 2021-06-11 2023-03-07 EMC IP Holding Company LLC Method of creating an intelligent upgrade flow for a heterogeneous data center
US11531592B1 (en) 2021-06-11 2022-12-20 EMC IP Holding Company LLC Method and system for determining favorability of upgrade window

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7017A (en) * 1850-01-15 Brick-pbess
JPH07262074A (ja) * 1994-03-07 1995-10-13 Internatl Business Mach Corp <Ibm> キャッシュ管理方法、コンピュータ・ファイル・システム及びキャッシュ装置
JP2009289252A (ja) * 2008-05-30 2009-12-10 Hitachi Ltd 階層ストレージシステムでのリモート複製

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7406484B1 (en) * 2000-09-12 2008-07-29 Tbrix, Inc. Storage allocation in a distributed segmented file system
JP4349871B2 (ja) * 2003-09-09 2009-10-21 株式会社日立製作所 ファイル共有装置及びファイル共有装置間のデータ移行方法
US7353242B2 (en) * 2004-07-09 2008-04-01 Hitachi, Ltd. File server for long term data archive
JPWO2006057337A1 (ja) * 2004-11-25 2008-06-05 日本電気株式会社 セキュリティ検証用のデータを生成する方法及びシステム
US20070083482A1 (en) * 2005-10-08 2007-04-12 Unmesh Rathi Multiple quality of service file system
US8170985B2 (en) * 2006-01-31 2012-05-01 Emc Corporation Primary stub file retention and secondary retention coordination in a hierarchical storage system
JP4939152B2 (ja) * 2006-09-13 2012-05-23 株式会社日立製作所 データ管理システム及びデータ管理方法
JP2008146212A (ja) * 2006-12-07 2008-06-26 Hitachi Ltd 共有ディレクトリの設定情報を変更する方法、及びファイルサーバ装置
JP2008250903A (ja) 2007-03-30 2008-10-16 Toshiba Corp ファイル更新装置、プログラム及び方法
JP2009211132A (ja) * 2008-02-29 2009-09-17 Hitachi Ltd 記憶システム及びデータ移行方法
JP5183300B2 (ja) * 2008-05-28 2013-04-17 株式会社日立製作所 ファイルシステムの移行方法、移行計算機及びプログラム
US20090319736A1 (en) 2008-06-24 2009-12-24 Hitachi, Ltd. Method and apparatus for integrated nas and cas data backup
US20100042719A1 (en) * 2008-08-12 2010-02-18 Junji Kinoshita Content access to virtual machine resource

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7017A (en) * 1850-01-15 Brick-pbess
JPH07262074A (ja) * 1994-03-07 1995-10-13 Internatl Business Mach Corp <Ibm> キャッシュ管理方法、コンピュータ・ファイル・システム及びキャッシュ装置
JP2009289252A (ja) * 2008-05-30 2009-12-10 Hitachi Ltd 階層ストレージシステムでのリモート複製

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNB200400042001; GEORGE COULOURIS: 分散システム 第2版, 19971031, p.408-437, 株式会社電気書院 *
JPN6014033261; GEORGE COULOURIS: 分散システム 第2版, 19971031, p.408-437, 株式会社電気書院 *

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016016998A1 (ja) * 2014-07-31 2016-02-04 三菱電機株式会社 コントローラ、および、ホームシステム
JPWO2016016998A1 (ja) * 2014-07-31 2017-04-27 三菱電機株式会社 コントローラ、ホームシステム、同期制御方法、および、プログラム
US10489353B2 (en) 2015-01-05 2019-11-26 Hitachi, Ltd. Computer system and data management method
WO2016110936A1 (ja) * 2015-01-05 2016-07-14 株式会社日立製作所 計算機システム、及び、データ管理方法
US11106635B2 (en) 2015-01-30 2021-08-31 Hitachi, Ltd. Computer system, file storage controller, and data sharing method
WO2016121093A1 (ja) * 2015-01-30 2016-08-04 株式会社日立製作所 ファイルサーバ装置
JP2018041454A (ja) * 2015-01-30 2018-03-15 ドロップボックス, インコーポレイテッド 共有コンテンツアイテムのストレージ制約付きの同期
US10248705B2 (en) 2015-01-30 2019-04-02 Dropbox, Inc. Storage constrained synchronization of shared content items
US10552449B2 (en) 2015-01-30 2020-02-04 Dropbox, Inc. Storage constrained synchronization of shared content items
US11675811B2 (en) 2015-01-30 2023-06-13 Dropbox, Inc. Storage constrained synchronization of shared content items
US10805394B2 (en) 2015-01-30 2020-10-13 Hitachi, Ltd. File server apparatus having shared file system with file and directory operation processing
US10831715B2 (en) 2015-01-30 2020-11-10 Dropbox, Inc. Selective downloading of shared content items in a constrained synchronization system
JPWO2016121093A1 (ja) * 2015-01-30 2017-10-19 株式会社日立製作所 ファイルサーバ装置
US11275763B2 (en) 2015-01-30 2022-03-15 Dropbox, Inc. Storage constrained synchronization of shared content items
WO2017109862A1 (ja) * 2015-12-22 2017-06-29 株式会社日立製作所 データファイル管理方法、データファイル管理システム、およびアーカイブサーバ
US10846303B2 (en) 2016-04-25 2020-11-24 Dropbox, Inc. Storage constrained synchronization engine
US11562000B2 (en) 2016-04-25 2023-01-24 Dropbox, Inc. Storage constrained synchronization engine
US10691478B2 (en) 2016-08-15 2020-06-23 Fujitsu Limited Migrating virtual machine across datacenters by transferring data chunks and metadata
JP2020197782A (ja) * 2019-05-31 2020-12-10 株式会社バッファロー 記憶装置、記憶方法、及び記憶プログラム
JP7223231B2 (ja) 2019-05-31 2023-02-16 株式会社バッファロー 記憶装置、記憶方法、及び記憶プログラム
JP7465301B2 (ja) 2022-05-20 2024-04-10 株式会社日立製作所 データ管理システム、データ管理方法、およびプログラム

Also Published As

Publication number Publication date
WO2012137262A1 (en) 2012-10-11
US20120259813A1 (en) 2012-10-11
EP2652588A1 (en) 2013-10-23
JP5661188B2 (ja) 2015-01-28
CN103384876A (zh) 2013-11-06
CN103384876B (zh) 2016-04-13

Similar Documents

Publication Publication Date Title
JP5661188B2 (ja) ファイルシステム及びデータ処理方法
US8762344B2 (en) Method for managing information processing system and data management computer system
JP6725742B2 (ja) ファイルストレージ、オブジェクトストレージ、およびストレージシステム
US10148730B2 (en) Network folder synchronization
JP5433074B2 (ja) ストレージクラスタを指定可能な複製されたコンテンツのための非同期的分散オブジェクトアップロード
US9946716B2 (en) Distributed file system snapshot
JP5775177B2 (ja) クローンファイル作成方法と、それを用いたファイルシステム
JP5427533B2 (ja) 階層ストレージ管理システムにおける重複ファイルの転送方法及びシステム
US8380673B2 (en) Storage system
JP4919851B2 (ja) ファイルレベルの仮想化を行う中間装置
JP5485866B2 (ja) 情報管理方法、及び情報提供用計算機
CN112236758A (zh) 云存储分布式文件系统
US20190361850A1 (en) Information processing system and information processing apparatus
US9031906B2 (en) Method of managing data in asymmetric cluster file system
JP7355964B2 (ja) 外部ロケーションの同期
JP2015035020A (ja) ストレージシステム、ストレージ制御装置及び制御プログラム
US8332351B2 (en) Method and system for preserving files with multiple links during shadow migration
US20140122661A1 (en) Computer system and file server migration method
WO2015145632A1 (ja) 計算機システム
JP2020502605A (ja) プレースホルダーを介したコンテンツ管理システムの履歴コンテンツアイテムへのアクセス
US10657105B2 (en) Method and computer system for sharing objects
JP2023107766A (ja) 外部ロケーションの同期
CN111562936A (zh) 基于Openstack-Swift的对象历史版本管理方法和装置

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130719

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130719

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140812

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141010

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141104

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141202

R151 Written notification of patent or utility model registration

Ref document number: 5661188

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151