JP4704161B2 - ファイルシステムの構築方法 - Google Patents

ファイルシステムの構築方法 Download PDF

Info

Publication number
JP4704161B2
JP4704161B2 JP2005265093A JP2005265093A JP4704161B2 JP 4704161 B2 JP4704161 B2 JP 4704161B2 JP 2005265093 A JP2005265093 A JP 2005265093A JP 2005265093 A JP2005265093 A JP 2005265093A JP 4704161 B2 JP4704161 B2 JP 4704161B2
Authority
JP
Japan
Prior art keywords
file
type
data
storage medium
storage area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005265093A
Other languages
English (en)
Other versions
JP2007079774A5 (ja
JP2007079774A (ja
Inventor
裕介 野中
山本  彰
直人 松並
浩二 薗田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2005265093A priority Critical patent/JP4704161B2/ja
Priority to US11/266,206 priority patent/US7849282B2/en
Publication of JP2007079774A publication Critical patent/JP2007079774A/ja
Publication of JP2007079774A5 publication Critical patent/JP2007079774A5/ja
Priority to US12/960,982 priority patent/US8078819B2/en
Application granted granted Critical
Publication of JP4704161B2 publication Critical patent/JP4704161B2/ja
Priority to US13/316,883 priority patent/US8392685B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/0643Management of files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • G06F3/0607Improving or facilitating administration, e.g. storage management by facilitating the process of upgrading existing storage systems, e.g. for improving compatibility between host and storage device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/0647Migration mechanisms
    • G06F3/0649Lifecycle management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0685Hybrid storage combining heterogeneous device types, e.g. hierarchical storage, hybrid arrays

Description

本発明は、ストレージシステムの技術に関する。
NAS(Network Attached Storage)と呼ばれるネットワークに直接接続する形式のストレージシステムが多く利用されている。このストレージシステムを利用すれば、ネットワークを介して、複数のクライアント間でファイルシステムを共有可能であり、複数のクライアントは同じファイルにアクセス可能である。
近年、データを、重要度などに基づくデータの価値に応じて、最適なコストのストレージ媒体に格納することによって、効果的なデータの活用と、効率的なストレージの投資と、の実現を図ることが試みられている。このような考え方は、情報ライフサイクル管理(ILM(information lifecycle management))と呼ばれている。例えば、価値の比較的高いデータは、高価なFC(Fibre Channel)対応のハードディスクに格納され、価値の比較的低いデータは、安価なATA対応のハードディスクに格納される。なお、FC対応のハードディスクは、ATA対応のハードディスクよりも、信頼性が高いと共に、アクセスが速いという特徴を有している。
FC対応のハードディスクやATA対応のハードディスクなどの複数種のストレージ媒体を用いてILMを実現する場合には、通常、ストレージ媒体の種類毎に論理ユニットが設定され、論理ユニット毎にファイルシステムが構築される。すなわち、従来では、ILMを実現する場合には、ストレージ媒体の種類毎に複数のファイルシステムが構築されていた。
米国特許出願公開第2004/0133540号公報 特表2005−512171号公報
既存の技術を適用すれば、複数種のストレージ媒体に1つの論理ユニットを設定し、該論理ユニット上に1つのファイルシステムを構築することも可能である。しかしながら、この場合には、ILMの適切な運用を図ること、すなわち、複数種のストレージ媒体を効率よく利用することが困難となってしまう。
この発明は、従来技術における上述の課題を解決するためになされたものであり、複数種のストレージ媒体上に1つのファイルシステムを構築する場合にも、複数種のストレージ媒体を効率よく利用することのできる技術を提供することを目的とする。
上述の課題の少なくとも一部を解決するため、本発明の第1の装置は、第1種のストレージ媒体と第2種のストレージ媒体とを管理するための管理装置であって、
前記第1種のストレージ媒体の少なくとも一部で構成された第1の記憶領域と、前記第2種のストレージ媒体の少なくとも一部で構成された第2の記憶領域と、を含む統合記憶領域内のファイルを管理するためのファイル管理部を備え、
前記ファイル管理部は、
前記第1の記憶領域の範囲と前記第2の記憶領域の範囲とを考慮して、前記統合記憶領域上に1つのファイルシステムを構築することを特徴とする。
第1の記憶領域の範囲と第2の記憶領域の範囲とを考慮せずに、統合記憶領域上にファイルシステムが構築される場合には、ファイルが第1の記憶領域と第2の記憶領域とに跨って格納されてしまう恐れがある。しかしながら、この装置では、第1の記憶領域の範囲と第2の記憶領域の範囲とを考慮して、統合記憶領域上にファイルシステムが構築される。このため、ファイルが第1の記憶領域と第2の記憶領域とに跨って格納されずに済むと共に、1つのファイルシステム内で第1の記憶領域と第2の記憶領域とにファイル単位でファイルが格納されるため、第1種のストレージ媒体と第2種のストレージ媒体とを効率よく利用することが可能となる。
上記の装置において、
前記ファイル管理部は、
前記統合記憶領域内に、前記第1の記憶領域と前記第2の記憶領域とに跨らない複数のグループ領域を設定することが好ましい。
このように、第1の記憶領域と前記第2の記憶領域とに跨らないグループ領域を予め設定しておけば、ファイルが第1の記憶領域と第2の記憶領域とに跨って格納されずに済む。
上記の装置において、
前記ファイル管理部は、
前記統合記憶領域内の前記第1の記憶領域に、メタデータが格納される第1種のグループ領域を設定し、
前記統合記憶領域内の前記第2の記憶領域に、メタデータが格納されない第2種のグループ領域を設定するようにしてもよい。
ファイルにアクセスする際には、メタデータが検索される。上記のようにすれば、メタデータを検索する際に、第1の記憶領域のみを検索すれば済み、この結果、目的のファイルに迅速にアクセスすることが可能となる。
なお、この効果は、第1種のストレージ媒体が第2種のストレージ媒体よりも高速にアクセス可能な場合に顕著となる。
上記の装置において、
前記ファイル管理部は、
第1のファイルを前記統合記憶領域内の前記第1の記憶領域に格納する場合には、前記第1のファイルの実データを前記第1の記憶領域に書き込むと共に、前記第1のファイルに関するメタデータを前記第1の記憶領域に作成し、
第2のファイルを前記統合記憶領域内の前記第2の記憶領域に格納する場合には、前記第2のファイルの実データを前記第2の記憶領域に書き込むと共に、前記第2のファイルに関するメタデータを前記第1の記憶領域に作成するようにしてもよい。
上記の装置において、
前記ファイル管理部は、
第1のファイルを前記統合記憶領域内の前記第1の記憶領域から前記第2の記憶領域に移動させる場合には、前記第1のファイルの実データを前記第2の記憶領域に書き込むと共に、前記第1の記憶領域に既に格納されている前記第1のファイルに関するメタデータを、前記第2の記憶領域に書き込まれた前記第1のファイルの実データの位置を示すように、変更し、
第2のファイルを前記統合記憶領域内の前記第2の記憶領域から前記第1の記憶領域に移動させる場合には、前記第2のファイルの実データを前記第1の記憶領域に書き込むと共に、前記第1の記憶領域に既に格納されている前記第2のファイルに関するメタデータを、前記第1の記憶領域に書き込まれた前記第2のファイルの実データの位置を示すように、変更するようにしてもよい。
このように、第1の記憶領域のみにメタデータが格納される場合には、ファイルを移動させる際に、該ファイルに関するメタデータを新たに作成せずに変更するだけで済む。
上記の装置において、
前記ファイル管理部は、
前記統合記憶領域内の前記第1の記憶領域と前記第2の記憶領域とのそれぞれに、メタデータが格納されるグループ領域を設定するようにしてもよい。
こうすれば、第1種のストレージ媒体が第2種のストレージ媒体よりも高価であり、かつ、第1の記憶領域のみにメタデータが格納される場合と比較して、メタデータの格納に要するビット当たりのコストを低減させることができる。
上記の装置において、
前記ファイル管理部は、
第1のファイルを前記統合記憶領域内の前記第1の記憶領域に格納する場合には、前記第1のファイルの実データを前記第1の記憶領域に書き込むと共に、前記第1のファイルに関するメタデータを前記第1の記憶領域に作成し、
第2のファイルを前記統合記憶領域内の前記第2の記憶領域に格納する場合には、前記第2のファイルの実データを前記第2の記憶領域に書き込むと共に、前記第2のファイルに関するメタデータを前記第2の記憶領域に作成することが好ましい。
上記の装置において、
前記ファイル管理部は、
第1のファイルを前記統合記憶領域内の前記第1の記憶領域から前記第2の記憶領域に移動させる場合には、前記第1のファイルの実データを前記第2の記憶領域に書き込むと共に、前記第1のファイルに関するメタデータを前記第2の記憶領域に作成し、
第2のファイルを前記統合記憶領域内の前記第2の記憶領域から前記第1の記憶領域に移動させる場合には、前記第2のファイルの実データを前記第1の記憶領域に書き込むと共に、前記第2のファイルに関するメタデータを前記第1の記憶領域に作成するようにしてもよい。
上記の装置において、
前記ファイル管理部は、
前記統合記憶領域内に、前記第1の記憶領域と前記第2の記憶領域とに跨るグループ領域を設定し、
前記ファイル管理部は、
前記第1の記憶領域の範囲と前記第2の記憶領域の範囲とを示す領域情報に基づいて、前記第1の記憶領域または前記第2の記憶領域にファイルの実データが格納されるように、前記ファイルシステムを構築することが好ましい。
こうすれば、第1の記憶領域と前記第2の記憶領域とに跨るグループ領域が設定される場合にも、ファイルが第1の記憶領域と第2の記憶領域とに跨って格納されずに済む。
上記の装置において、
前記ファイル管理部は、さらに、
前記領域情報に基づいて、前記第1の記憶領域にメタデータが格納され、前記第2の記憶領域にメタデータが格納されないように、前記ファイルシステムを構築することが好ましい。
こうすれば、メタデータを検索する際に、第1の記憶領域のみを検索すれば済み、この結果、目的のファイルに迅速にアクセスすることが可能となる。
上記の装置において、
前記ファイル管理部は、
第1のファイルを前記統合記憶領域内の前記第1の記憶領域に格納する場合には、前記領域情報に基づいて、前記第1のファイルの実データを前記第1の記憶領域に書き込むと共に、前記第1のファイルに関するメタデータを前記第1の記憶領域に作成し、
第2のファイルを前記統合記憶領域内の前記第2の記憶領域に格納する場合には、前記領域情報に基づいて、前記第2のファイルの実データを前記第2の記憶領域に書き込むと共に、前記第2のファイルに関するメタデータを前記第1の記憶領域に作成することが好ましい。
上記の装置において、
前記ファイル管理部は、
第1のファイルを前記統合記憶領域内の前記第1の記憶領域から前記第2の記憶領域に移動させる場合には、前記領域情報に基づいて、前記第1のファイルの実データを前記第2の記憶領域に書き込むと共に、前記第1の記憶領域に既に格納されている前記第1のファイルに関するメタデータを、前記第2の記憶領域に書き込まれた前記第1のファイルの実データの位置を示すように、変更し、
第2のファイルを前記統合記憶領域内の前記第2の記憶領域から前記第1の記憶領域に移動させる場合には、前記領域情報に基づいて、前記第2のファイルの実データを前記第1の記憶領域に書き込むと共に、前記第1の記憶領域に既に格納されている前記第2のファイルに関するメタデータを、前記第1の記憶領域に書き込まれた前記第2のファイルの実データの位置を示すように、変更することが好ましい。
このように、第1の記憶領域のみにメタデータが格納される場合には、ファイルを移動させる際に、該ファイルに関するメタデータを新たに作成せずに変更するだけで済む。
本発明の第2の装置は、ストレージシステムであって、
前記第1種のストレージ媒体と、
前記第2種のストレージ媒体と、
上記のいずれかに記載の前記管理装置と、
を備えることを特徴とする。
この発明は、種々の形態で実現することが可能であり、例えば、異種ストレージ媒体を管理するための管理装置、該管理装置を備えるストレージシステム、該ストレージシステムを備えるネットワークシステム、これらの装置における異種ストレージ媒体の管理方法、これらの方法または装置の機能を実現するためのコンピュータプログラム、そのコンピュータプログラムを記録した記録媒体、そのコンピュータプログラムを含み搬送波内に具現化されたデータ信号、等の形態で実現することができる。
次に、本発明の実施の形態を実施例に基づき以下の順序で説明する。
A.第1実施例:
A−1.ネットワークシステムの構成:
A−1−1.ストレージシステムの内部構成:
A−1−2.管理サーバの内部構成:
A−2.ファイルシステムの作成:
A−3.統合記憶領域上のファイルシステムの構造:
A−4.ファイルの新規作成:
A−5.ファイルの移動:
B.第2実施例:
C.第3実施例:
A.第1実施例:
A−1.ネットワークシステムの構成:
図1は、ネットワークシステムの概略構成を示す説明図である。ネットワークシステムは、ストレージシステム(NAS)100と、管理サーバ200と、管理端末300と、複数のクライアント400と、を備えている。各デバイスは、IPベースのネットワークNWに接続されており、各デバイス間の通信は、TCP/IPに従って実行される。
ストレージシステム100は、ファイルサーバ(NASヘッドとも呼ばれる)110と、ストレージ装置130と、を備えている。本実施例では、ファイルサーバ110とストレージ装置130とは、異なる筐体に収納されているが、共通の筐体に収納されていてもよい。
A−1−1.ストレージシステムの内部構成:
図2は、ストレージシステム100の内部構成を示す説明図である。上記のように、ストレージシステム100は、ファイルサーバ110とストレージ装置130とを備えている。そして、ストレージ装置130は、ディスクアレイコントローラ140と、ディスクアレイ装置160と、を備えている。なお、ファイルサーバ110とディスクアレイコントローラ140とが同一の装置(例えば同一のプロセッサ)でも良い。
ファイルサーバ110は、CPU112と、ROMやRAMなどのメモリ114と、ネットワークインタフェース(IF)部116と、ストレージインタフェース(IF)部118と、を備えている。なお、ネットワークIF部116は、ネットワークNWを介して、外部のデバイスと通信を行うためのインタフェースであり、ストレージIF部118は、ストレージ装置130と通信を行うためのインタフェースである。
メモリ114には、プロトコル制御部122として機能するコンピュータプログラムと、第1構成管理部124として機能するコンピュータプログラムと、ファイルシステム制御部126として機能するコンピュータプログラムと、が格納されている。また、メモリ114には、伝送されるデータを一時的に格納するためのキャッシュ領域128が設けられている。
プロトコル制御部122は、ネットワークNWを介して、外部のデバイスとの通信を実現するために、プロトコルに従った種々の処理を実行する際にCPU112で実行されるプログラムである。
第1構成管理部124は、ディスクアレイ装置160に設定された1以上の論理ユニット上にファイルシステムを作成し、論理ユニットとファイルシステムとの対応関係を管理する際にCPU112で実行されるプログラムである。
ファイルシステム制御部126は、ファイルの新規作成や移動などの種々の処理を制御する際にCPU112で実行されるプログラムである。例えば、ファイルシステム制御部126は、ファイルの新規作成や移動などに伴って、ファイルシステムの内容を変更する。
ディスクアレイコントローラ140は、CPU142と、ROMやRAMなどのメモリ144と、ホストインタフェース(IF)部146と、ドライブインタフェース(IF)部148と、を備えている。なお、ホストIF部146は、ストレージ装置130のホストとして機能するファイルサーバ110と通信を行うためのインタフェースであり、ドライブIF部148は、ディスクアレイ装置160を駆動してデータを入出力するためのインタフェースである。
メモリ144には、入出力処理部152として機能するコンピュータプログラムと、第2構成管理部154として機能するコンピュータプログラムと、が格納されている。また、メモリ144には、伝送されるデータを一時的に格納するためのキャッシュ領域156が設けられている。
入出力処理部152は、ホストIF部146を介してファイルサーバ110から与えられるI/Oコマンドを処理する。例えば、入出力処理部152は、読み出しコマンドや書き込みコマンドなどに従って、ディスクアレイ装置160に対するデータの読み出しや書き込み処理を実行する。
第2構成管理部154は、ディスクアレイ装置160に対して論理ユニットを設定し、論理ユニットと実際のディスク(ストレージ媒体)との対応関係を管理する際にCPU142で実行されるプログラムである。なお、第2構成管理部154は、ディスクアレイ装置160内に上記の対応関係を示すボリューム管理テーブルTB(後述する)を作成する。
ディスクアレイ装置160は、複数のストレージ媒体(例えば複数のハードディスクドライブ)で構成されたディスクアレイを備えている。なお、ディスクアレイは、RAID構成であっても良い。本実施例では、高価なFC対応のハードディスクと、廉価なATA対応のハードティスクと、の2種類のハードディスクが利用されている。なお、以下では、FC対応のハードディスクを「第1種の媒体」とも呼び、ATA対応のハードディスクを「第2種の媒体」とも呼ぶ。
ディスクアレイ装置160は、通常、論理ユニット(LU)に区分されて利用される。図2では、システム用のLUと、3つのデータ用のLUと、が準備されている。データ用の第1LUは、第1種の媒体(FC)の一部で構成された記憶領域と、第2種の媒体(ATA)の一部で構成された記憶領域と、を含む統合記憶領域(統合LU)であり、論理ユニット番号(LUN)「0」が割り当てられている。第2LUは、第1種の媒体(FC)の一部で構成された記憶領域(LU)であり、LUN「1」が割り当てられている。第3LUは、第2種の媒体(ATA)の一部で構成された記憶領域(LU)であり、LUN「2」が割り当てられている。システム用LUは、本実施例では、第1種の媒体(FC)の一部で構成された記憶領域(LU)である。図示するように、システム用LUには、ボリューム管理テーブルTBが格納される。なお、各記憶領域は、それぞれ、対応する種類の1つのディスクの一部または全部で構成されていてもよいし、対応する種類の複数のディスクで構成されていてもよい。
ボリューム管理テーブルTBは、ネットワークシステムの管理者が管理端末300を操作することによって予め作成される。具体的には、管理者からの指示に従って、ストレージ装置130内の第2構成管理部154がボリューム管理テーブルTBを作成する。
図3は、予め準備されたボリューム管理テーブルTBの内容を示す説明図である。なお、このボリューム管理テーブルTBは、データ用の各LU上にファイルシステムが作成される前に、作成される。図示するように、ボリューム管理テーブルTBには、データ用の各LUの情報が含まれている。具体的には、ボリューム管理テーブルTBには、記憶領域を構成する媒体の種類毎に、該記憶領域を構成する媒体の種類と、該記憶領域の開示番地および終了番地と、が設定されている。
例えば、第1LU(LUN=0)は、図2で説明したように、第1種の媒体(FC)で構成された記憶領域と、第2種の媒体(ATA)で構成された記憶領域と、を含んでいる。このため、ボリューム管理テーブルTBでは、第1LUに関して、第1の記憶領域の媒体の種類として「FC」が登録されていると共に、第1の記憶領域の開始番地「0」および終了番地「999」が登録されている。また、第2の記憶領域の媒体の種類として「ATA」が登録されていると共に、第2の記憶領域の開始番地「1000」および終了番地「1999」が登録されている。
同様に、第2LU(LUN=1)は、第1種の媒体(FC)で構成された記憶領域のみを含んでいる。このため、ボリューム管理テーブルTBでは、第2LUに関して、第1の記憶領域の媒体の種類として「FC」が登録されていると共に、第1の記憶領域の開始番地「0」および終了番地「3000」が登録されている。また、第3LU(LUN=2)は、第2種の媒体(ATA)で構成された記憶領域のみを含んでいる。このため、ボリューム管理テーブルTBでは、第3LUに関して、第1の記憶領域の媒体の種類として「ATA」が登録されていると共に、第1の記憶領域の開始番地「0」および終了番地「5000」が登録されている。
なお、本実施例におけるファイルサーバ110が本発明における管理装置に相当し、第1構成管理部124とファイルシステム制御部126とが本発明におけるファイル管理部に相当する。
A−1−2.管理サーバの内部構成:
図4は、管理サーバ200の内部構成を示す説明図である。管理サーバ200は、CPU202と、ROMやRAMなどのメモリ204と、ネットワークインタフェース(IF)部206と、を備えている。なお、ネットワークIF部206は、ネットワークNWを介して、外部のデバイスと通信を行うためのインタフェースである。
メモリ204には、プロトコル制御部212として機能するコンピュータプログラムと、ファイル分配制御部214として機能するコンピュータプログラムと、が格納されている。
プロトコル制御部212は、図2のプロトコル制御部122と同様に、ネットワークNWを介して、外部のデバイスとの通信を実現するために、プロトコルに従った種々の処理を実行する際にCPU202で実行されるプログラムである。
ファイル分配制御部214は、ストレージシステム100内の統合記憶領域(統合LU)に格納されるファイルが、いずれの種類の媒体に格納されるべきかを決定する際にCPU202で実行されるプログラムである。具体的には、ファイル分配制御部214は、ファイルサーバ110から問い合わせがあった場合に、予め管理者によって設定された分配ルールに従って、統合LU内におけるファイルの格納先の媒体を決定する。分配ルールは、例えば、ファイル名や、ファイルの最終更新日時、ファイルのサイズ、ファイルの作成者名などのファイルに付属する種々の情報(属性)を利用して、設定される。分配ルールに従えば、ファイルの価値に応じて格納先の媒体の種類を決定することができる。なお、分配ルールの情報は、管理サーバ200のメモリに格納される。
例えば、ファイル分配制御部214は、ファイル名に所定の文字列が含まれる場合や、ファイルの最終更新日時が所定の日時以降である場合、ファイルのサイズが所定のサイズ以上である場合、ファイルの作成者名がリストに登録された名前と一致する場合などに、ファイルの価値が高いとみなし、ファイルの格納先を第1種の媒体(FC)と決定する。
なお、分配ルールとしては、ファイルに付属する種々の情報(属性)だけでなく、ファイルに付属しない他の情報を利用することも可能である。例えば、ファイルがストレージシステム100に格納される時間帯が利用されてもよい。この場合には、例えば、多数のファイルが格納される時間帯(平日の就業時間)には、ファイルの格納先は、書き込みに要する時間が比較的短い第1種の媒体(FC)と決定され、少数のファイルが格納される時間帯(平日の就業時間以外)には、ファイルの格納先は、書き込みに要する時間が比較的長い第2種の媒体(ATA)と決定されればよい。
A−2.ファイルシステムの作成:
図5は、ファイルシステムの作成手順を示すフローチャートである。ステップS102では、管理者は、管理端末300を操作して、ファイルサーバ110に、対象LU上へのファイルシステムの作成を指示する。なお、この際、管理者は、管理端末300を介して、ファイルサーバ110に、記憶領域へのメタデータの格納の可否を指定する情報を送信する。ここで、メタデータの格納の可否については、管理者は、例えば、高速・高コストなFCと低速・低コストなATAとを統合する場合、「高いコストを払っても、メタデータはFCだけに格納して高速にアクセスしたい」ときは、FCのみにメタデータを格納し、「メタデータをFCとATAとの両方に格納し、性能は優れていなくても低コストにしたい」ときは、FCとATAとにメタデータを格納するといった情報に基づいて、判断する。そして、管理者は、この判断に基づいて、上述のメタデータの格納の可否を指定する情報を作成する。
ステップS104では、指示を受けたファイルサーバ110内の第1構成管理部124は、ストレージ装置130内の第2構成管理部154に、対象LUを構成する媒体の種類を問い合わせる。このとき、第2構成管理部154は、ボリューム管理テーブルTBを参照して、対象LUを構成する媒体の種類を、第1構成管理部124に通知する。
ステップS106では、第1構成管理部124は、第2構成管理部154からの通知に基づいて、対象LUが複数種の媒体で構成されるか否かを判断する。対象LUが複数種の媒体で構成される場合(例えば対象LUが第1LU(LUN=0)である場合)には、ステップS108に進む。一方、対象LUが複数種の媒体で構成されず1種類の媒体で構成される場合(例えば対象LUが第2LU(LUN=1)または第3LU(LUN=2)である場合)には、ステップS112に進む。
ステップS108では、第1構成管理部124は、管理端末300から、媒体の種類毎の用法(設定)の指定が有るか否かを判断する。本実施例では、第1種の媒体にはメタデータを格納し、第2種の媒体にはメタデータを格納しない、という用法が指定されている。なお、メタデータは、ディレクトリ情報と、ファイルの実データの格納位置を示すデータポインタを含むinodeと、を含んでいる。メタデータについては、さらに、後述する。
用法の指定が有る場合には、ステップS110に進む。一方、用法の指定が無い場合には、ステップS112に進む。
ステップS110では、第1構成管理部124は、対象LU(統合LU)内に、指定された用法に基づいて、ブロックグループを作成する。この際、第1構成管理部124は、ボリューム管理テーブルTB(図3)を参照し、各記憶領域のアドレス範囲を考慮して、ブロックグループを作成する。これにより、対象LU内にファイルシステムが作成される。なお、ブロックグループが、本発明におけるグループ領域に相当する。
図6は、ステップS110(図5)で第1LU(LUN=0)上に作成されるファイルシステムの構造を示す説明図である。
LU上にファイルシステムが作成される場合には、通常、LUが複数種の媒体で構成されているか否かに拘わらず、LUに対して1以上のブロックグループが作成される。このため、LUが複数種の媒体で構成されている場合には、ブロックグループが2種類以上の媒体に跨って作成される恐れがある。
しかしながら、本実施例では、各ブロックグループは、各記憶領域のアドレス範囲を考慮して、記憶領域毎に、換言すれば媒体の種類毎に、作成される。このため、各ブロックグループは、2種類以上の媒体を跨ることなく、1つの媒体内に作成される。
具体的には、本実施例では、図6に示すように、第1種の媒体(FC)で構成された第1の記憶領域には、3つのブロックグループが作成され、第2種の媒体(ATA)で構成された第2の記憶領域にも、3つのブロックグループが作成される。そして、各ブロックグループは、第1種の媒体と第2種の媒体とを跨ることなく、換言すれば、第1の記憶領域と第2の記憶領域とを跨ることなく、作成される。なお、ブロックグループは、例えば、所定のサイズ(容量)毎に作成されてもよいし、所定の個数だけ作成されてもよい。
ところで、図6に示すように、第1の記憶領域に作成される各ブロックグループ(以下「第1種のブロックグループ」とも呼ぶ)の構成と、第2の記憶領域に作成される各ブロックグループ(以下「第2種のブロックグループ」とも呼ぶ)の構成とは、異なっている。
具体的には、第1種のブロックグループは、通常の構成を有しており、ブロックグループ配置情報と、inode(iノード)カウンタと、inodeリストと、フリーデータブロックカウンタと、フリーデータブロックリストと、データブロックと、を含んでいる。第2種のブロックグループは、第1種のブロックグループとほぼ同様の構成を有しているが、inodeカウンタと、inodeリストと、を含んでいない。また、第1種のブロックグループ内のデータブロックには、メタデータが格納されるが、第2種のブロックグループ内のデータブロックには、メタデータは格納されない。なお、ブロックグループに含まれる上記の各要素については、後述する。
このように、第1の記憶領域に作成されるブロックグループの構成と、第2の記憶領域に作成されるブロックグループの構成と、が異なるのは、用法の相違に起因している。すなわち、本実施例では、ステップS108において、第1種の媒体にはメタデータを格納し、第2種の媒体にはメタデータを格納しない、という用法が指定されている。このため、本実施例では、第1種の媒体で構成される第1の記憶領域には、inodeカウンタとinodeリストとを含み、メタデータを格納可能な第1種のブロックグループが作成される。また、第2種の媒体で構成される第2の記憶領域には、inodeカウンタとinodeリストとを含まず、メタデータの格納が考慮されない第2種のブロックグループが作成される。
図5の説明に戻る。ステップS112(図5)では、第1構成管理部124は、対象LU内に、通常の方法で、換言すれば、媒体の種類を意識せずに、ブロックグループを作成する。本実施例では、第2LU(LUN=1)と第3LU(LUN=2)とのそれぞれに、1以上のブロックグループが作成される。なお、各ブロックグループは、inodeカウンタとinodeリストとを含み、メタデータを格納可能な第1種のブロックグループである。
ステップS114では、第1構成管理部124は、第2構成管理部154にボリューム管理テーブルTBを更新させる。
図7は、図5の処理が完了したときに得られるボリューム管理テーブルTBの内容を示す説明図である。図7は、図3とほぼ同じであるが、記憶領域を構成する媒体の種類毎に、メタデータの格納の可否が追加されている。
図7では、メタデータを格納可に設定された記憶領域には「○」印が付与されており、メタデータを格納不可に設定された記憶領域には「×」印が付与されている。
例えば、第1LU(LUN=0)は、第1種の媒体(FC)と第2種の媒体(ATA)とで構成されている。このため、ステップS108の用法の指定に基づいて、第1LU内の第1種の媒体(FC)で構成された第1の記憶領域は、メタデータを格納可に設定されており、第2種の媒体(ATA)で構成された第2の記憶領域は、メタデータを格納不可に設定されている。また、第2LU(LUN=1)と第3LU(LUN=2)とは、1種類の媒体で構成されている。このため、第2LU内の記憶領域と第3LU内の記憶領域とは、それぞれメタデータを格納可に設定されている。
A−3.統合記憶領域上のファイルシステムの構造:
図8は、第1LU(LUN=0)上のファイルシステムの構造を示す説明図である。図8は、図6とほぼ同じであるが、図8では、データブロック内部のデータの図示が追加されている。なお、図8では、既にファイルが格納されている。
前述したように、第1種および第2種のブロックグループは、ブロックグループ配置情報と、フリーデータブロックカウンタと、フリーデータブロックリストと、データブロックと、を含んでいる。そして、第1種のブロックグループは、さらに、inodeカウンタと、inodeリストと、を含んでいる。
また、第1種および第2種のブロックグループは、共に、データブロックを含んでいるが、第1種のブロックグループ内のデータブロックと第2種のブロックグループ内のデータブロックとは、異なる情報を含んでいる。具体的には、第1種のブロックグループ内のデータブロックには、ディレクトリ情報およびinodeで構成されるメタデータと、ファイルの実データが格納されるデータ領域と、が含まれているが、第2種のブロックグループ内のデータブロックには、データ領域のみが含まれている。
ディレクトリ情報は、ファイル名とinode番号との対応関係が登録された情報である。なお、図8では、1つのディレクトリが作成されているが、複数のディレクトリが作成され得る。
各inodeは、ファイルのサイズや、最終更新日時、データポインタなどの種々の情報を含んでいる。データポインタは、ファイルの実データが格納されるデータ領域の位置(アドレス)を示す。
例えば、図8では、第1の記憶領域内の「ブロックグループ1」において、「ファイルA」には「inode1」が対応付けられており、「inode1」のデータポインタは、「ファイルA」を構成するデータブロック(以下、「実データ」と称する)が格納されたデータ領域の位置を特定する。同様に、「ブロックグループ1」において、「ファイルB」には「inode2」が対応付けられており、「inode2」のデータポインタは、「ファイルB」の実データが格納されたデータ領域の位置を示す。ただし、図8では、「ファイルA」の実データは、第1の記憶領域内の「ブロックグループ1」内に格納されており、「ファイルB」の実データは、第2の記憶領域内の「ブロックグループ4」内に格納されている。
このように、本実施例では、ディレクトリ情報とinodeとで構成されるメタデータは、第1の記憶領域のみに格納され、ファイルの実データは、データの価値に応じて、2つの記憶領域のうちのいずれか一方に格納される。
ブロックグループ配置情報は、自己のブロックグループの範囲(アドレス)を示す情報である。
フリーデータブロックカウンタは、inodeやファイルの実データをデータブロック内の空き領域に格納する際に、各領域に番号を順次割り当てるためのカウンタである。フリーデータブロックリストは、データブロック内の空き領域の範囲(アドレス)を示す情報を含んでいる。
inodeカウンタは、各inodeに番号を順次割り当てるためのカウンタである。inodeリストは、データブロック内の各inodeの位置(アドレス)を示す情報を含んでいる。
なお、図8では、既にファイルが格納されているため、第1種のブロックグループ内のデータブロックには、メタデータが格納されているが、図5の処理の完了直後には、メタデータは格納されていない。図5の処理では、第1種のブロックグループ内のデータブロックには、ルートディレクトリのみが作成される。
また、図5でブロックグループが作成される際には、各ブロックグループの初期設定も同時に行われる。例えば、ブロックグループ配置情報に自己のブロックグループのアドレス範囲が登録され、inodeカウンタおよびフリーデータブロックカウンタの値が初期値に設定される。
A−4.ファイルの新規作成:
図9は、LU内にファイルを新規に作成する際の手順を示すフローチャートである。
ステップS202では、ファイルサーバ110は、クライアント400から格納対象ファイルを受信する。具体的には、クライアント400のユーザは、コンピュータ(クライアント400)の表示画面を確認しつつ、ネットワークに接続された対象ディスクへの対象ファイルの格納を指示する。このとき、クライアント400は、該対象ディスクを示すディスク情報と、対象ファイルと、をファイルサーバ110に送信する。そして、ファイルサーバ110内のファイルシステム制御部126は、受信したディスク情報に基づいて、受信した対象ファイルを格納すべきLU(格納先LU)を特定する。
ステップS203では、ファイルシステム制御部126は、ボリューム管理テーブルTBを参照して、格納先LUが複数種の媒体で構成されているか否かを判断する。格納先LUが複数種の媒体で構成されている場合(例えば格納先LUが第1LU(LUN=0)である場合)には、ステップS204に進み、格納先LUが複数種の媒体で構成されていない場合(例えば格納先LUが第2LU(LUN=1)または第2LU(LUN=2)である場合)には、ステップS208に進む。
ステップS204では、ファイルシステム制御部126は、管理サーバ200に対象ファイルを格納すべき媒体(格納先媒体)の種類を問い合わせる。この際、ファイルシステム制御部126は、対象ファイルについての情報も併せて管理サーバ200に送信する。このとき、管理サーバ200内のファイル分配制御部210は、受信した対象ファイルのファイル名や最終更新日時などの情報に基づいて、分配ルールに従って格納先媒体の種類を決定し、ファイルシステム制御部126に通知する。
ステップS206では、ファイルシステム制御部126は、ステップS204で指定された格納先媒体の種類に対応する格納先記憶領域にメタデータを格納可能か否かを判断する。この判断は、ボリューム管理テーブルTB(図7)を参照することによって行われる。格納先記憶領域にメタデータを格納可である場合(例えば格納先記憶領域が第1種の媒体(FC)で構成された第1の記憶領域である場合)には、ステップS208に進む。一方、格納先記憶領域にメタデータを格納不可である場合(例えば格納先記憶領域が第2種の媒体(ATA)で構成された第2の記憶領域である場合)には、ステップS210に進む。
ステップS208では、ファイルシステム制御部126は、格納先記憶領域(例えば図8の第1の記憶領域)に、inodeを作成すると共にファイルの実データを書き込む。なお、格納先記憶領域のアドレス範囲は、ボリューム管理テーブルTBを参照することによって特定される。
具体的には、まず、格納先記憶領域に作成された1以上のブロックグループのうちの1つのブロックグループ(例えば図8の「ブロックグループ1」)が対象ブロックグループとして選択される。なお、ブロックグループが2以上存在する場合には、対象ブロックグループは、例えば、ファイルシステム制御部126によって2以上のブロックグループの中から循環的に順次選択される。
そして、格納先記憶領域の対象ブロックグループにおいて、フリーデータブロックリストから新規inode領域が取得され、inodeリストに該新規inode領域のアドレスが登録される。なお、新規inode領域の取得の際には、inodeカウンタによって新規inode番号が決定され、inodeカウンタの値が1だけインクリメントされる。また、新規inode領域の取得の際には、フリーデータブロックカウンタの値が1だけインクリメントされる。
次に、格納先記憶領域の対象ブロックグループにおいて、フリーデータブロックリストから新規データ領域が取得され、inodeのデータポインタに該新規データ領域のアドレスが登録される。なお、新規データ領域の取得の際には、フリーデータブロックカウンタの値が1だけインクリメントされる。そして、新規データ領域にファイルの実データが書き込まれる。
例えば、ステップS208において、「ファイルA」が第1LU(LUN=0)の第1種の媒体(FC)で構成された第1の記憶領域に格納される場合には、図8に示すように、第1の記憶領域に「inode1」が作成されると共に「ファイルA」の実データが格納される。なお、図8では、「ファイルA」が格納される際に、「ブロックグループ1」が対象ブロックグループとして選択されている。
一方、ステップS210では、ファイルシステム制御部126は、格納先記憶領域(例えば図8の第2の記憶領域)と異なるメタデータを格納可能な他の記憶領域(例えば図8の第1の記憶領域)にinodeを作成すると共に、格納先記憶領域にファイルの実データを書き込む。なお、格納先記憶領域のアドレス範囲と他の記憶領域のアドレス範囲は、ボリューム管理テーブルTBを参照することによって特定される。
具体的には、まず、他の記憶領域(例えば図8の第1の記憶領域)に作成された1以上のブロックグループのうちの1つのブロックグループ(例えば「ブロックグループ1」)が第1対象ブロックグループとして選択される。また、格納先記憶領域(例えば図8の第2の記憶領域)に作成された1つのブロックグループ(例えば「ブロックグループ4」)が第2対象ブロックグループとして選択される。
そして、他の記憶領域の第1対象ブロックグループにおいて、フリーデータブロックリストから新規inode領域が取得され、inodeリストに該新規inode領域のアドレスが登録される。
次に、格納先記憶領域の第2対象ブロックグループにおいて、フリーデータブロックリストから新規データ領域が取得され、inodeのデータポインタに該新規データ領域のアドレスが登録される。そして、新規データ領域にファイルの実データが書き込まれる。
例えば、ステップS210において、「ファイルB」が第1LU(LUN=0)の第2種の媒体(ATA)で構成された第2の記憶領域に格納される場合には、図8に示すように、第1の記憶領域に「inode2」が作成され、第2の記憶領域に「ファイルB」の実データが格納される。なお、図8では、「ファイルB」が格納される際に、「ブロックグループ1」が第1対象ブロックグループとして選択されており、「ブロックグループ4」が第2対象ブロックグループとして選択されている。
ステップS212では、ファイルシステム制御部126は、対象ファイルが作成されたディレクトリのディレクトリ情報に、ファイル名とinode番号との対応関係を登録する。
例えば、ステップS208で「ファイルA」が第1LU(LUN=0)の第1種の媒体(FC)で構成された第1の記憶領域に格納される場合には、図8に示すように、第1の記憶領域内のディレクトリ情報に「ファイルA」と「inode1」との対応関係が登録される。また、ステップS210で「ファイルB」が第1LU(LUN=0)の第2種の媒体(ATA)で構成された第2の記憶領域に格納される場合には、第1の記憶領域内のディレクトリ情報に「ファイルB」と「inode2」との対応関係が登録される。
ステップS214では、ファイルシステム制御部126は、クライアント400に対して、ファイルの新規作成が正常に終了したことを通知する。これにより、ファイルの新規作成処理が完了する。
なお、格納先LUが1種類の媒体で構成される場合(例えば格納先LUが第2LU(LUN=1)または第3LU(LUN=2)である場合)には、ステップS208の処理が実行され、格納先記憶領域にinodeが作成されると共にファイルの実データが書き込まれる。
A−5.ファイルの移動:
図10は、統合LU内でファイルを移動させる際の手順を示すフローチャートである。統合LU内でファイルを移動させるのは、ファイルの価値は変化するためである。例えば、ファイルが格納された時にはファイルの価値が高くても、現在ではファイルの価値が低くなっている可能性がある。逆に、ファイルが格納された時にはファイルの価値が低くても、現在ではファイルの価値が高くなっている可能性がある。また、管理サーバ200内のファイル分配制御部214が有する分配ルールが、ファイルが格納された時と現在とで、異なる場合もある。
ステップS302では、ファイルサーバ110は、管理サーバ200から、移動対象ファイルと、移動元媒体の種類と、移動先媒体の種類と、を受信する。なお、移動元媒体の種類は、移動対象ファイルが格納されていた媒体の種類であり、移動先媒体の種類は、移動対象ファイルが格納されるべき媒体の種類である。なお、管理サーバ200が移動対象ファイル等の情報を送信する契機(管理サーバ200がファイルシステムを調べる契機)は、例えば、負荷の低い夜間や休日等といった契機が考えられる。
具体的には、管理サーバ200内のファイル分配制御部210は、ボリューム管理テーブルTBを参照しつつ、ストレージシステム100内のファイルシステムを調べ、複数種の媒体で構成される統合LU内の各ファイルが分配ルールに従って格納されているか否かを調査する。そして、ファイル分配制御部210は、分配ルールと整合しないファイルを移動対象ファイルとして決定すると共に、該ファイルの移動元媒体の種類を特定する。また、ファイル分配制御部210は、分配ルールに従って、移動先媒体の種類を決定する。
例えば、図8の第1LU(LUN=0)内の第1種の媒体(FC)で構成される第1の記憶領域に格納されている価値の低くなったファイルは、分配ルールと整合せず、移動対象ファイルとして決定され、第1種の媒体(FC)が移動元媒体であると特定される。そして、分配ルールに従って、第2種の媒体(ATA)が移動先媒体に決定される。
ステップS304では、ファイルシステム制御部126は、移動先記憶領域に移動対象ファイルの実データを書き込むと共に、移動対象ファイルに対応するinodeの内容を変更する。なお、移動先記憶領域のアドレス範囲は、ボリューム管理テーブルTBを参照することによって特定される。
具体的には、まず、移動先記憶領域に作成された1以上のブロックグループのうちの1つのブロックグループが対象ブロックグループとして選択される。
次に、移動先記憶領域の対象ブロックグループにおいて、フリーデータブロックリストから新規データ領域が取得される。また、対象ファイルに対応するinodeのデータポインタが示すアドレスが、旧データ領域のアドレスから該新規データ領域のアドレスに変更される。なお、対象ファイルに対応するinodeは、移動先記憶領域が図8の第1の記憶領域である場合には移動先記憶領域に含まれているが、移動先記憶領域が図8の第2の記憶領域である場合には移動元記憶領域(すなわち図8の第1の記憶領域)に含まれている。
そして、移動対象ファイルの実データが移動元記憶領域内の旧データ領域から読み出され、移動先記憶領域の新規データ領域に書き込まれる。なお、移動対象ファイルの実データが格納された旧データ領域のアドレスは、移動処理前のファイル名に対応するinodeのデータポインタを参照することによって特定される。
ステップS310では、ファイルシステム制御部126は、移動元記憶領域内の移動対象ファイルの実データが依然として格納されている旧データ領域を開放する。具体的には、旧データ領域が含まれるブロックグループにおいて、フリーデータブロックリストに旧データ領域を空き領域として追加する。これにより、旧データ領域に他のデータを書き込むことが可能となる。
ステップS312では、ファイルシステム制御部126は、ファイルの移動が正常に終了したことを管理サーバ200内のファイル分配制御部210に通知する。これにより、ファイルの移動処理が完了する。
なお、ステップS302における移動元媒体の種類の受信は、省略可能である。また、統合LU内が2種類の媒体で構成される場合には、さらに移動先媒体の種類の受信も、省略可能である。この場合には、ファイルシステム制御部126は、管理サーバ200内のファイル分配制御部210から移動対象ファイルの情報のみを受け取って、移動対象ファイルを異なる種類の媒体に移動させればよい。
図11は、ファイルの移動処理の前後のファイルシステムの構造を示す説明図である。図11は、図8とほぼ同じであるが、移動処理後のデータブロック内部の図示が追加されている。
図11では、「ファイルA」が第1種の媒体(FC)で構成された第1の記憶領域から第2種の媒体(ATA)で構成された第2の記憶領域に移動している。移動処理後には、第2の記憶領域内に「ファイルA」の実データを格納する新規データ領域が設けられていると共に、第1の記憶領域から「ファイルA」の実データが格納されていた旧データ領域が開放されている。また、「inode1」のデータポインタが示すアドレスが、旧データ領域のアドレスから新規データ領域のアドレスに変更されている。なお、ディレクトリ情報は、変更されていない。
同様に、「ファイルB」を第2種の媒体(ATA)で構成された第2の記憶領域から第1種の媒体(FC)で構成された第1の記憶領域に移動させる場合には、移動処理後には、第1の記憶領域内に「ファイルB」の実データを格納する新規データ領域が設けられると共に、第2の記憶領域から「ファイルB」の実データが格納されていた旧データ領域が開放される。また、「inode2」のデータポインタが示すアドレスが、旧データ領域のアドレスから新規データ領域のアドレスに変更される。なお、ディレクトリ情報は、変更されない。
「ファイルB」の実データを格納する新規データ領域は、「inode2」が格納された「ブロックグループ1」に設けられることが好ましい。こうすれば、「ファイルB」に対応する「inode2」と「ファイルB」の実データを格納する新規データ領域とが、物理的に比較的近い位置に配置される可能性が高いため、「ファイルB」を比較的迅速に読み出すことができる。ただし、「ファイルB」の実データを格納する新規データ領域は、「inode2」が格納されていない他のブロックグループ(例えば「ブロックグループ2」または「ブロックグループ3」)に設けられていてもよい。この場合には、「inode2」のデータポインタが示すアドレスが、他のブロックグループ内に設けられた新規データ領域のアドレスに変更されればよい。
上記のように、本実施例では、第1種の媒体(FC)で構成された第1の記憶領域のみにメタデータが格納されるため、ファイルを移動させる際に、該ファイルに関するメタデータを新たに作成せずに変更するだけで済む。
以上説明したように、本実施例では、第1種の媒体(FC)の一部で構成された第1の記憶領域と、第2種の媒体(FC)の一部で構成された第2の記憶領域と、を含む統合LU上に、1つのファイルシステムが構築される。具体的には、統合LU内には、複数のブロックグループが設定されるが、各ブロックグループは、第1の記憶領域と第2の記憶領域とに跨らないように設定される。すなわち、本実施例では、第1の記憶領域の範囲と第2の記憶領域の範囲とを考慮して、ブロックグループが設定される。このため、ファイルの新規作成や移動(マイグレーション)の際に、ファイルの実データが、第1の記憶領域と第2の記憶領域とに跨って(換言すれば第1種の媒体と第2種の媒体とに跨って)格納されずに済むと共に、1つのファイルシステム内で第1の記憶領域と第2の記憶領域とにファイル単位でファイルが分配される。したがって、ファイルを価値に応じた適切な種類の媒体に確実に格納することができ、この結果、複数種の媒体を効率よく利用することが可能となる。
また、本実施例では、2つの記憶領域に統合LUが設定されて該統合LU上に1つのファイルシステムが構築されるため、2つの記憶領域に2つのLUが設定されて該2つのLU上に2つのファイルシステムが構築される場合と比較して、容量管理を容易に行うことができる。これは、1つのファイルシステムが構築される場合には、該1つのファイルシステムのみを対象として容量を調べれば済むが、2つのファイルシステムが構築される場合には、該2つのファイルシステムの双方を対象として容量を調べる必要があるためである。
任意のファイルにアクセスする際には、メタデータが検索される。本実施例では、メタデータは、第1の記憶領域のみに格納されている。このため、本実施例では、メタデータを検索する際に、第1の記憶領域のみを検索すれば済み、この結果、目的のファイルに迅速にアクセスすることが可能となる。
特に、本実施例では、メタデータは、第2種の媒体(ATA)よりも高速にアクセスが可能な第1種の媒体(FC)で構成される第1の記憶領域のみに格納されている。このため、本実施例では、メタデータが第1種の媒体で構成される第1の記憶領域と第2種の媒体で構成される第2の記憶領域との双方に格納される場合と比較して、ファイルの実データの位置を迅速に特定することができるという利点がある。
ところで、一方の記憶領域のみにメタデータが格納され、かつ、双方の記憶領域に個別にファイルシステムが構築される場合には、ファイルシステム単位でデータを他のLUへ複製(リモートコピー)することが困難となる。しかしながら、本実施例では、統合LU上に1つのファイルシステムが構築されるため、以下に説明するように、ファイルシステム単位のデータの複製を容易に行うことができる。
図12は、第1実施例におけるファイルシステムと比較例におけるファイルシステムとを模式的に示す説明図である。
本実施例では、図12(A)に示すように、第1種の媒体(FC)で構成された第1の記憶領域と第2種の媒体(ATA)で構成された第2の記憶領域とに統合LUが設定されており、該統合LU上に1つのファイルシステムが構築されている。そして、メタデータは、第1の記憶領域のみに格納されている。
一方、比較例では、図12(B)に示すように、第1種の媒体(FC)で構成された第1の記憶領域に第1LUが設定されており、第2種の媒体(ATA)で構成された第2の記憶領域に第2LUが設定されている。また、2つのLU上に2つのファイルシステムが構築されている。そして、メタデータは、第1の記憶領域(第1LU)のみに格納されている。したがって、比較例では、ファイルの実データが第2の記憶領域(第2LU)内に格納される場合には、メタデータ内のinodeのデータポインタは、第2LUのLUNを含む必要がある。
このため、仮に、ファイルシステム単位でデータの複製を行う場合には、例えば第2LU内のデータのみを他のLUにコピーする場合には、inodeのデータポインタに含まれるLUNを変更する必要がある。このため、データの複製が困難となる。この問題は、第1LU内のデータのみを他のLUに複製する場合、第1および第2LU内のデータを他の2つのLUに複製する場合にも同様に生じる。
一方、本実施例では、2つの記憶領域に統合LUが設定されているため、ファイルの実データが第2の記憶領域内に格納される場合にも、メタデータ内のinodeのデータポインタにはLUNが含まれていない。このため、本実施例では、統合LU内のデータを他のLUに容易に複製することができる。すなわち、本実施例では、比較例と比べ、ファイルシステム単位のデータの複製を容易に行うことができる。
また、本実施例では、2つの記憶領域に統合LUが設定されて該統合LU上に1つのファイルシステムが構築されるため、2つの記憶領域に2つのLUが設定されて該2つのLU上に2つのファイルシステムが構築される場合と比較して、ファイルシステムのイメージを作成するスナップショット機能を容易に適用することができる。
B.第2実施例:
図13は、第2実施例における第1LU(LUN=0)上のファイルシステムの構造を示す説明図であり、図8に対応する。図13では、図8と比較して、第2の記憶領域に作成されるブロックグループが変更されている。具体的には、第2の記憶領域には、第1の記憶領域に設定されるブロックグループと同様に、inodeカウンタとinodeリストとを含み、メタデータを格納可能な第1種のブロックグループが作成されている。
本実施例では、ファイルシステムの作成は、第1実施例と同様に、図5に示す手順に従って実行可能である。ただし、本実施例では、第1種の媒体(FC)および第2種の媒体(ATA)の双方にメタデータを格納する、という用法が指定されている。この結果、本実施例では、第1LU(LUN=0)内に図13に示すファイルシステムが作成される。また、本実施例では、ステップS114で得られるボリューム管理テーブルの内容が、第1実施例(図7)と異なっている。具体的には、第1LU(LUN=0)に関し、第1種の媒体(FC)で構成される第1の記憶領域と第2種の媒体(ATA)で構成される第2の記憶領域との双方が、メタデータを格納可に設定される。
また、本実施例では、ファイルの新規作成は、第1実施例と同様に、図9に示す手順に従って実行可能である。ただし、本実施例では、統合LU内に作成されるブロックグループは、すべてメタデータを格納可能な第1種のブロックグループであるため、ステップS203,S204,S206,S210の処理は省略可能である。
図13では、「ファイルA」は、図8と同様に格納されている。一方、「ファイルB」の実データは、図8と同様に、第2の記憶領域内の「ブロックグループ4」内に格納されているが、「ファイルB」に関するメタデータ(ディレクトリ情報とinode)は、図8と異なり、第2の記憶領域内の「ブロックグループ4」内に格納されている。
図14は、第2実施例における統合LU内でファイルを移動させる際の手順を示すフローチャートであり、図10に対応する。なお、図14のステップS302,S310,S312は、図10と同じである。
ステップS306では、ファイルシステム制御部126は、移動先記憶領域に、inodeを作成すると共に移動対象ファイルの実データを書き込む。なお、ステップS306の処理は、図9のステップS208の処理とほぼ同様である。
具体的には、まず、移動先記憶領域に作成された1以上のブロックグループのうちの1つのブロックグループが対象ブロックグループとして選択される。
そして、移動先記憶領域の対象ブロックグループにおいて、フリーデータブロックリストから新規inode領域が取得され、inodeリストに該新規inode領域のアドレスが登録される。
次に、移動先記憶領域の対象ブロックグループにおいて、フリーデータブロックリストから新規データ領域が取得され、inodeのデータポインタに該新規データ領域のアドレスが登録される。そして、移動対象ファイルの実データが移動元記憶領域内の旧データ領域から読み出され、移動先記憶領域の新規データ領域に書き込まれる。
ステップS308では、ファイルシステム制御部126は、移動元記憶領域内のディレクトリ情報からファイル名と旧inodeとの対応関係を削除する。具体的には、移動元記憶領域内の移動対象ファイルが依然として格納されているブロックグループにおいて、ディレクトリ情報から上記の対応関係を削除する。
また、ステップS308では、ファイルシステム制御部126は、移動元記憶領域内の移動対象ファイルのinodeが依然として格納されている旧inode領域を開放する。具体的には、旧inode領域が含まれるブロックグループにおいて、フリーデータブロックリストに旧inode領域を空き領域として追加する。これにより、旧inode領域に他のデータを書き込むことが可能となる。
なお、ステップS310では、図10で説明したように、移動元記憶領域内の移動対象ファイルの実データが依然として格納されている旧データ領域が開放される。
図15は、第2実施例におけるファイルの移動処理の前後のファイルシステムの構造を示す説明図である。図15は、図13とほぼ同じであるが、移動処理後のデータブロック内部の図示が追加されている。
図15では、「ファイルA」が第1種の媒体(FC)で構成された第1の記憶領域から第2種の媒体(ATA)で構成された第2の記憶領域に移動している。移動処理後には、第2の記憶領域内のディレクトリ情報に「ファイルA」と「inode2」との対応関係が追加されていると共に、第1の記憶領域内のディレクトリ情報から「ファイルA」と「inode1」との対応関係が削除されている。また、第2の記憶領域内に「ファイルA」の新規inode領域が設けられていると共に、第1の記憶領域から「ファイルA」の旧inode領域が開放されている。さらに、第2の記憶領域内に「ファイルA」の新規データ領域が設けられていると共に、第1の記憶領域から「ファイルA」の旧データ領域が開放されている。
同様に、「ファイルB」を第2種の媒体(ATA)で構成された第2の記憶領域から第1種の媒体(FC)で構成された第1の記憶領域に移動させる場合には、移動処理後には、第1の記憶領域内のディレクトリ情報に「ファイルB」と新規inodeとの対応関係が追加されると共に、第2の記憶領域内のディレクトリ情報から「ファイルB」と旧inodeとの対応関係が削除される。また、第1の記憶領域内に「ファイルB」の新規inode領域が設けられると共に、第2の記憶領域から「ファイルB」の旧inode領域が開放される。さらに、第1の記憶領域内に「ファイルB」の新規データ領域が設けられると共に、第2の記憶領域から「ファイルB」の旧データ領域が開放される。
以上説明したように、本実施例でも、第1実施例と同様に、統合LU上に1つのファイルシステムが構築される。そして、統合LU内には、複数のブロックグループが設定されるが、各ブロックグループは、第1の記憶領域と第2の記憶領域とに跨らないように設定される。このため、ファイルの新規作成や移動の際に、ファイルの実データが、第1の記憶領域と第2の記憶領域とに跨って(換言すれば第1種の媒体と第2種の媒体とに跨って)格納されずに済むと共に、1つのファイルシステム内で第1の記憶領域と第2の記憶領域とにファイル単位でファイルが分配される。したがって、ファイルを価値に応じた適切な種類の媒体に確実に格納することができ、この結果、複数種の媒体を効率よく利用することが可能となる。
また、本実施例では、第1実施例と同様に、容量管理や、ファイルシステム単位でのデータの複製、スナップショット機能の適用を容易に行うことができる。
特に、本実施例では、比較的高価な第1の媒体(FC)で構成された第1の記憶領域と比較的安価な第2種の媒体(ATA)で構成された第2の記憶領域との双方に、メタデータを格納可能な第1種のブロックグループが設定される。一方、第1実施例では、比較的高価な第1種の媒体(FC)で構成された第1の記憶領域のみにメタデータを格納可能な第1種のブロックグループが設定される。このため、本実施例では、第1実施例と比較して、メタデータの格納に要するビット当たりのコストを低減させることができる。
C.第3実施例:
図16は、第3実施例における第1LU(LUN=0)上のファイルシステムの構造を示す説明図であり、図8に対応する。図16は、図8と比較して、第1LU内に作成されるブロックグループが変更されている。具体的には、第1LUには、1つのブロックグループ(第1種のブロックグループ)のみが作成される。すなわち、本実施例では、ブロックグループは、2つの記憶領域に跨って設定されている。
ただし、本実施例では、後述するように、ブロックグループ配置情報等のデータブロック以外の情報(以下「非データブロック情報」)は、第1の記憶領域のみに格納される。また、データブロックは、2つの記憶領域に跨っているが、メタデータは、第1の記憶領域のみに格納される。
本実施例では、ファイルシステムの作成は、第1実施例と同様に、図5に示す手順に従って実行可能である。本実施例では、第1実施例と同様に、第1種の媒体(FC)にはメタデータを格納し、第2種の媒体(ATA)にはメタデータを格納しない、という用法が指定されている。さらに、本実施例では、1つのブロックグループのみが作成され、第1種の媒体(FC)には非データブロック情報を格納し、第2の媒体(ATA)には非データブロック情報を格納しない、という用法が指定されている。この結果、本実施例では、第1LU(LUN=0)内に図16に示すファイルシステムが作成される。なお、本実施例では、ステップS114で得られるボリューム管理テーブルの内容は、第1実施例(図7)と同じである。
ところで、第1および第2実施例では、各ブロックグループは、2種類の媒体に跨らないように設けられている。そして、各ブロックグループのフリーデータブロックリストは、自己のブロックグループのアドレス範囲内の空き領域のみをinode領域やデータ領域として割り当て可能である。すなわち、第1および第2実施例では、格納すべき媒体の種類に応じてブロックグループが選択され、対応するフリーデータブロックリストからinode領域やデータ領域が取得されれば、該領域は、目的の種類の媒体で構成される領域である。しかしながら、本実施例では、唯一のブロックグループは、2種類の媒体に跨るように設けられている。このため、本実施例では、唯一のブロックグループのフリーデータブロックリストからinode領域やデータ領域が取得されても、該領域は、いずれの種類の媒体で構成される領域であるか不明である。そこで、本実施例では、以下に説明するように、ファイルの新規作成処理やファイルの移動処理が変更されている。具体的には、本実施例では、ボリューム管理テーブルの「第1の記憶領域の媒体の種類」(メタデータ格納可能な記憶領域)の開始番地と終了番地と、「第2の記憶領域の媒体の種類」(メタデータが格納されない記憶領域)の開始番地と終了番地をファイルサーバが意識して見分ける。これにより、2種類の媒体に跨ってブロックグループが設定されても、ファイルサーバはファイルを特定の領域に格納することができる。
図17は、第3実施例におけるLU内にファイルを新規に作成する際の手順を示すフローチャートである。図17は、図9とほぼ同じであるが、ステップS208C,S210Cが変更されている。また、ステップS203で否定判断がなされた場合には、図9と同じステップS208に進む。
ステップS208Cは、格納先LUが複数種の媒体で構成された統合LUであり、かつ、格納先記憶領域がメタデータを格納可である場合(例えば格納先LUが図16の第1LU(LUN=0)であり、格納先記憶領域が第1種の媒体(FC)で構成された第1の記憶領域である場合)に実行される。
ステップS208Cでは、ファイルシステム制御部126は、格納先記憶領域(例えば図16の第1の記憶領域)に、inodeを作成すると共にファイルの実データを書き込む。
具体的には、まず、統合LUの唯一のブロックグループにおいて、フリーデータブロックリストから新規inode領域が取得され、inodeリストに該新規inode領域のアドレスが登録される。ただし、新規inode領域は、メタデータを格納可能な記憶領域内に確保される必要がある。このため、ファイルシステム制御部126は、ボリューム管理テーブルTBを参照し、メタデータを格納可能な格納先記憶領域のアドレス範囲内に含まれる領域を新規inode領域として取得する。
次に、統合LU内の唯一のブロックグループにおいて、フリーデータブロックリストから新規データ領域が取得され、inodeのデータポインタに該新規データ領域のアドレスが登録される。この際、ファイルシステム制御部126は、ボリューム管理テーブルTBを参照し、格納先記憶領域のアドレス範囲内に含まれる領域を新規データ領域として取得する。そして、該新規データ領域にファイルの実データが書き込まれる。
一方、ステップS210Cは、格納先LUが複数種の媒体で構成された統合LUであり、かつ、格納先記憶領域がメタデータを格納不可である場合(例えば格納先LUが図16の第1LU(LUN=0)であり、格納先記憶領域が第2種の媒体(ATA)で構成された第1の記憶領域である場合)に実行される。
ステップS210Cでは、ファイルシステム制御部126は、格納先記憶領域(例えば図16の第2の記憶領域)と異なるメタデータを格納可能な他の記憶領域(例えば図16の第1の記憶領域)にinodeを作成すると共に、格納先記憶領域にファイルの実データを書き込む。
具体的には、まず、統合LU内の唯一のブロックグループにおいて、フリーデータブロックリストから新規inode領域が取得され、inodeリストに該新規inode領域のアドレスが登録される。この際、ファイルシステム制御部126は、ボリューム管理テーブルTBを参照し、メタデータを格納可能な他の記憶領域のアドレス範囲内に含まれる領域を新規inode領域として取得する。
次に、統合LU内の唯一のブロックグループにおいて、フリーデータブロックリストから新規データ領域が取得され、inodeのデータポインタに該新規データ領域のアドレスが登録される。この際、ファイルシステム制御部126は、ボリューム管理テーブルTBを参照し、格納先記憶領域のアドレス範囲内に含まれる領域を新規データ領域として取得する。そして、該新規データ領域にファイルの実データが書き込まれる。
図16では、「ファイルA」の実データとメタデータとは、図8と同様に、第1の記憶領域に格納されている。また、「ファイルB」の実データとメタデータとは、図8と同様に、第2の記憶領域に格納されている。しかしながら、「ファイルB」の実データとメタデータとは、図8では異なるブロックグループ内に格納されているが、図16では唯一のブロックグループ内に格納されている。
図18は、第3実施例における統合LU内でファイルを移動させる際の手順を示すフローチャートであり、図10に対応する。図18は、図10とほぼ同じであるが、ステップS304Cが変更されている。
ステップS304Cでは、ファイルシステム制御部126は、移動先記憶領域に移動対象ファイルの実データを書き込むと共に、移動対象ファイルに対応するinodeの内容を変更する。
具体的には、統合LU内の唯一のブロックグループにおいて、フリーデータブロックリストから新規データ領域が取得される。この際、ファイルシステム制御部126は、ボリューム管理テーブルTBを参照し、移動先記憶領域のアドレス範囲内に含まれる領域を新規データ領域として取得する。また、対象ファイルに対応するinodeのデータポインタが示すアドレスが、旧データ領域のアドレスから新規データ領域のアドレスに変更される。
そして、移動対象ファイルの実データが移動元記憶領域内の旧データ領域から読み出され、移動先記憶領域の新規データ領域に書き込まれる。
なお、ステップS310では、図10で説明したように、移動元記憶領域内の移動対象ファイルの実データが依然として格納されている旧データ領域が開放される。
図19は、第3実施例におけるファイルの移動処理の前後のファイルシステムの構造を示す説明図である。図19は、図16とほぼ同じであるが、移動処理後のデータブロック内部の図示が追加されている。
図19では、「ファイルA」が第1種の媒体(FC)で構成された第1の記憶領域から第2種の媒体(ATA)で構成された第2の記憶領域に移動している。移動処理後には、第2の記憶領域内に「ファイルA」の実データを格納する新規データ領域が設けられていると共に、第1の記憶領域から「ファイルA」の実データが格納されていた旧データ領域が開放されている。また、「inode1」のデータポインタが示すアドレスが、旧データ領域のアドレスから新規データ領域のアドレスに変更されている。なお、ディレクトリ情報は、変更されていない。
同様に、「ファイルB」を第2種の媒体(ATA)で構成された第2の記憶領域から第1種の媒体(FC)で構成された第1の記憶領域に移動させる場合には、移動処理後には、第1の記憶領域内に「ファイルB」の実データを格納する新規データ領域が設けられると共に、第2の記憶領域から「ファイルB」の実データが格納されていた旧データ領域が開放される。また、「inode2」のデータポインタが示すアドレスが、旧データ領域のアドレスから新規データ領域のアドレスに変更される。なお、ディレクトリ情報は、変更されない。
上記のように、本実施例では、第1実施例と同様に、第1種の媒体(FC)で構成された第1の記憶領域のみにメタデータが格納されるため、ファイルを移動させる際に、該ファイルに関するメタデータを新たに作成せずに変更するだけで済む。
以上説明したように、本実施例でも、第1実施例と同様に、統合LU上に1つのファイルシステムが構築される。ただし、本実施例では、統合LU内には、1つのブロックグループのみが設定され、該ブロックグループは、第1の記憶領域と第2の記憶領域とに跨るように設定される。そこで、本実施例では、ボリューム管理テーブルTBを参照することによって、ファイルに関するメタデータが第1の記憶領域のみに格納され、ファイルの実データが適切な一方の記憶領域のみに格納される。このため、本実施例でも、ファイルの新規作成や移動の際に、ファイルの実データが、第1の記憶領域と第2の記憶領域とに跨って(換言すれば第1種の媒体と第2種の媒体とに跨って)格納されずに済むと共に、1つのファイルシステム内で第1の記憶領域と第2の記憶領域とにファイル単位でファイルが分配される。したがって、ファイルを価値に応じた適切な種類の媒体に確実に格納することができ、この結果、複数種の媒体を効率よく利用することが可能となる。
また、本実施例では、第1実施例と同様に、容量管理や、メタデータの迅速な検索、ファイルシステム単位でのデータの複製、スナップショット機能の適用を容易に行うことができる。
特に、本実施例では、汎用のファイルシステムと同様の構造を有するファイルシステムが統合LU上に構築されるため、クライアント400は、ファイルサーバ110を介さずに直接的にストレージ装置130内の構築されたファイルシステムを参照することができるという利点もある。
なお、この発明は上記の実施例や実施形態に限られるものではなく、その要旨を逸脱しない範囲において種々の態様で実施することが可能であり、例えば次のような変形も可能である。
(1)上記実施例では、複数種の媒体で構成される複数の記憶領域をストレージ装置130(より具体的には第2構成管理部154)の機能を利用して統合し、得られた統合記憶領域(統合LU)上にファイルシステムを構築している。しかしながら、これに代えて、他の手法を採用してもよい。例えば、ファイルサーバ110に論理ボリュームマネージャ(コンピュータプログラム)が備えられている場合には、複数種の媒体で構成される複数の記憶領域を論理ボリュームマネージャの機能を利用して統合し、得られた統合記憶領域上にファイルシステムを構築するようにしてもよい。また、バーチャリゼーションスイッチが利用される場合には、複数台の記憶装置内の複数種の媒体で構成される複数の記憶領域をバーチャリゼーションスイッチの機能を利用して統合し、得られた統合記憶領域上にファイルシステムを構築するようにしてもよい。
また、上記実施例では、媒体としてFC対応のハードディスクとATA対応のハードディスクが利用されているが、他の媒体が利用されてもよい。例えば、光ディスクや、光磁気ディスク、磁気テープなどが利用されてもよい。
一般には、第1種のストレージ媒体の少なくとも一部で構成された第1の記憶領域と、第2種のストレージ媒体の少なくとも一部で構成された第2の記憶領域と、を少なくとも含む統合記憶領域上に1つのファイルシステムが構築されればよい。
(2)上記実施例では、ファイル分配制御部214は、管理サーバ200に設けられているが、これに代えて、ファイルサーバ110に設けられていてもよい。こうすれば、ファイルサーバ110が、ファイルの新規作成処理(またはファイルの移動処理)の際に、ファイルの格納先媒体の種類(または移動対象ファイルおよび移動先媒体の種類)を決定することができる。
また、上記実施例では、管理サーバ200がファイル分配制御部214を備えており、ファイルサーバ110は、ファイルの新規作成処理またはファイルの移動処理の際(より具体的にはステップS204,S302)に、管理サーバ200からファイルの格納先媒体の種類または移動対象ファイル等を受け取っているが、これに代えて、管理サーバから分配ルールを受け取るようにしてもよい。
さらに、上記実施例では、ファイルの新規作成処理の際には、ファイル分配制御部214によってファイルの格納先媒体の種類が決定されているが、これに代えて、クライアント400からファイルが送信される際に、クライアント400から格納先媒体の種類が指示されるようにしてもよい。
また、上記実施例では、ファイルの移動処理の際には、ファイル分配制御部214によって移動対象ファイル等が決定されているが、これに代えて、クライアント400によって移動対象ファイル等が指示されるようにしてもよい。
なお、上記実施例では、管理サーバ200と管理端末300とは異なる装置であるが、これに代えて、管理サーバと管理端末とは同一の装置であっても良い。
ネットワークシステムの概略構成を示す説明図である。 ストレージシステム100の内部構成を示す説明図である。 予め準備されたボリューム管理テーブルTBの内容を示す説明図である。 管理サーバ200の内部構成を示す説明図である。 ファイルシステムの作成手順を示すフローチャートである。 ステップS110(図5)で第1LU(LUN=0)上に作成されるファイルシステムの構造を示す説明図である。 図5の処理が完了したときに得られるボリューム管理テーブルTBの内容を示す説明図である。 第1LU(LUN=0)上のファイルシステムの構造を示す説明図である。 LU内にファイルを新規に作成する際の手順を示すフローチャートである。 統合LU内でファイルを移動させる際の手順を示すフローチャートである。 ファイルの移動処理の前後のファイルシステムの構造を示す説明図である。 第1実施例におけるファイルシステムと比較例におけるファイルシステムとを模式的に示す説明図である。 第2実施例における第1LU(LUN=0)上のファイルシステムの構造を示す説明図である。 第2実施例における統合LU内でファイルを移動させる際の手順を示すフローチャートである。 第2実施例におけるファイルの移動処理の前後のファイルシステムの構造を示す説明図である。 第3実施例における第1LU(LUN=0)上のファイルシステムの構造を示す説明図である。 第3実施例におけるLU内にファイルを新規に作成する際の手順を示すフローチャートである。 第3実施例における統合LU内でファイルを移動させる際の手順を示すフローチャートである。 第3実施例におけるファイルの移動処理の前後のファイルシステムの構造を示す説明図である。
符号の説明
100…ストレージシステム
110…ファイルサーバ
112…CPU
114…メモリ
116…ネットワークIF部
118…ストレージIF部
122…プロトコル制御部
124…第1構成管理部
126…ファイルシステム制御部
128…キャッシュ領域
130…ストレージ装置
140…ディスクアレイコントローラ
142…CPU
144…メモリ
146…ホストIF部
148…ドライブIF部
152…入出力処理部
154…第2構成管理部
156…キャッシュ領域
160…ディスクアレイ装置
200…管理サーバ
202…CPU
204…メモリ
206…ネットワークIF部
212…プロトコル制御部
214…ファイル分配制御部
300…管理端末
400…クライアント
TB…ボリューム管理テーブル

Claims (14)

  1. 少なくとも1つの第1種のストレージ媒体と少なくとも1つの第2種のストレージ媒体とを備える記憶装置に接続されたファイルサーバであって、
    クライアントコンピュータと通信するためのネットワークインターフェースと、
    前記記憶装置に格納されたファイルを管理するためのファイル管理部と、
    を備え、
    前記ファイルサーバは、前記少なくとも1つの第1種のストレージ媒体と前記少なくとも1つの第2種のストレージ媒体とによって構成された論理装置内にファイルシステムを構成し、
    前記ネットワークインターフェースは、前記ファイルシステムのファイルの書き込み要求を前記クライアントコンピュータから受信し、前記ファイルは、データとメタデータとを含み、
    前記記憶装置は、ストレージ媒体の種類に応じて前記論理装置内のアドレスレンジを管理するテーブルを備え、
    前記ファイル管理部は、ファイルの書き込み要求を前記クライアントコンピュータから受信した時に、前記テーブルによって管理されている前記アドレスレンジを考慮して、データ格納のためにストレージ媒体の種類を選択し、前記ファイルの前記メタデータおよび前記データを前記少なくとも1つの第1種のストレージ媒体または前記少なくとも1つの第2種のストレージ媒体の内の1つに書き込むことで、前記メタデータおよびデータが、前記少なくとも1つの第1種のストレージ媒体と前記少なくとも1つの第2種のストレージ媒体とに跨って格納されないように、前記論理装置に前記メタデータおよびデータを格納する、ファイルサーバ。
  2. 請求項1に記載のファイルサーバであって、前記ファイルサーバが、ファイルの書き込み要求を前記クライアントコンピュータから受信した時に、前記ファイル管理部は、データ格納のためにストレージ媒体の種類を選択し、第1種が選択された場合、前記メタデータおよび前記データの両方が、前記少なくとも1つの第1種のストレージ媒体に格納される、ファイルサーバ。
  3. 請求項1に記載のファイルサーバであって、データ格納のために前記少なくとも1つの第2種のストレージ媒体を選択した場合、前記メタデータおよび前記データは、それぞれ、前記少なくとも1つの第1種のストレージ媒体および前記少なくとも1つの第2種のストレージ媒体に格納される、ファイルサーバ。
  4. 請求項3に記載のファイルサーバであって、前記ファイル管理部は、前記少なくとも1つの第1種のストレージ媒体から前記少なくとも1つの第2種のストレージ媒体に前記データを移動し、前記少なくも1つの第1種のストレージ媒体にすでに格納されているメタデータを、前記少なくとも1つの第2種のストレージ媒体の実データの位置を示すように変更する、ファイルサーバ。
  5. 少なくとも1つの第1種のストレージ媒体によって構成された第1の記憶領域と、少なくとも1つの第2種のストレージ媒体によって構成された第2の記憶領域とを備える記憶装置に接続されたファイルサーバであって、
    クライアントコンピュータと通信するためのネットワークインターフェースと、
    前記記憶装置に格納されたファイルを管理するためのファイル管理部と、
    を備え、
    前記ファイルサーバは、前記第1の記憶領域と前記第2の記憶領域とによって構成された論理装置内にファイルシステムを構成し、
    前記ネットワークインターフェースは、前記ファイルシステムのファイルの書き込み要求を前記クライアントコンピュータから受信し、前記ファイルは、データとメタデータとを含み、
    前記記憶装置は、ストレージ媒体の種類に応じて、前記論理装置内で、前記第1の記憶領域によって占められた第1のアドレスレンジと、前記第2の記憶領域によって占められた第2のアドレスレンジとを管理するテーブルを備え、
    前記ファイル管理部は、前記ファイルサーバが、ファイルの書き込み要求を前記クライアントコンピュータから受信した時に、前記テーブルによって管理されている前記アドレスレンジを考慮して、データ格納のためにストレージ媒体の種類を選択し、前記ファイルの前記データを格納するために、前記少なくとも1つの第1の記憶領域または前記第2の記憶領域の内の1つにおける格納位置を選択し、前記選択された格納位置に前記ファイルの前記データおよび前記メタデータを格納することで、前記メタデータおよび前記データが、前記少なくとも1つの第1種のストレージ媒体と前記少なくとも1つの第2種のストレージ媒体とに跨らないように、前記論理装置に前記メタデータおよび前記データを格納する、ファイルサーバ。
  6. 請求項に記載のファイルサーバであって、前記ファイルサーバが、ファイルの前記書き込み要求を前記クライアントコンピュータから受信した時に、前記ファイル管理部は、データ格納のためにストレージ媒体の種類を選択し、第1種が選択された場合、メタデータおよびデータの両方が、前記少なくとも1つの第1種のストレージ媒体に格納される、ファイルサーバ。
  7. 請求項に記載のファイルサーバであって、前記ファイル管理部は、前記少なくとも1つの第1種のストレージ媒体から前記少なくとも1つの第2種のストレージ媒体に前記データを移動する時に、前記少なくとも1つの第2種の記憶領域にメタデータを作成する、ファイルサーバ。
  8. 少なくとも1つの第1種のストレージ媒体と少なくとも1つの第2種のストレージ媒体とを備える記憶装置に接続されたファイルサーバにおける方法であって、
    ネットワークインターフェースを介してクライアントコンピュータと通信する工程と、
    前記記憶装置に格納されたファイルをファイル管理部によって管理する工程と、
    前記少なくとも1つの第1種のストレージ媒体と前記少なくとも1つの第2種のストレージ媒体とによって構成された論理装置内にファイルシステムを構成する工程と、
    前記ファイルシステムのファイルの書き込み要求を前記クライアントコンピュータから受信する工程であって、前記ファイルは、データとメタデータとを含む、工程と、
    ストレージ媒体の種類に応じて前記論理装置内のアドレスレンジを管理するテーブルを保持する工程と、
    ファイルの書き込み要求を前記クライアントコンピュータから受信した時に、前記テーブルによって管理されている前記アドレスレンジを考慮してデータ格納のためにストレージ媒体の種類を選択し、前記ファイルの前記メタデータおよび前記データを前記ファイルの前記データを前記少なくとも1つの第1種のストレージ媒体または前記少なくとも1つの第2種のストレージ媒体の内の1つに書き込むことで、前記メタデータおよびデータが、前記少なくとも1つの第1種のストレージ媒体と前記少なくとも1つの第2種のストレージ媒体とに跨って格納されないように、前記論理装置に前記メタデータおよびデータを格納する工程と、
    を備える、方法。
  9. 請求項に記載の方法であって、前記ファイルサーバが、ファイルの書き込み要求を前記クライアントコンピュータから受信した時に、前記ファイル管理部は、データ格納のためにストレージ媒体の種類を選択し、第1種が選択された場合、前記メタデータおよび前記データの両方が、前記少なくとも1つの第1種のストレージ媒体に格納される、方法。
  10. 請求項に記載の方法であって、データ格納のために前記少なくとも1つの第2種のストレージ媒体を選択した場合、前記メタデータおよび前記データは、それぞれ、前記少なくとも1つの第1種のストレージ媒体および前記少なくとも1つの第2種のストレージ媒体に格納される、方法。
  11. 請求項に記載の方法であって、前記少なくとも1つの第1種のストレージ媒体から前記少なくとも1つの第2種のストレージ媒体に前記データを移動する時に、前記少なくも1つの第1種のストレージ媒体にすでに格納されているメタデータを、前記少なくとも1つの第2種のストレージ媒体の実データの位置を示すように変更する工程を備える、方法。
  12. 少なくとも1つの第1種のストレージ媒体によって構成された第1の記憶領域と、少なくとも1つの第2種のストレージ媒体によって構成された第2の記憶領域とを備える記憶装置に接続されたファイルサーバにおける方法であって、
    ネットワークインターフェースを介してクライアントコンピュータと通信する工程と、
    前記記憶装置に格納されたファイルをファイル管理部によって管理する工程と、
    前記第1の記憶領域と前記第2の記憶領域とによって構成された論理装置内にファイルシステムを構成する工程と、
    前記ファイルシステムのファイルの書き込み要求を前記クライアントコンピュータから受信する工程であって、前記ファイルは、データとメタデータとを含む、工程と、
    ストレージ媒体の種類に応じて、前記論理装置内で、前記第1の記憶領域によって占められた第1のアドレスレンジと、前記第2の記憶領域によって占められた第2のアドレスレンジとを管理するテーブルを保持する工程と、
    ファイルの書き込み要求を前記クライアントコンピュータから受信した時に、前記テーブルによって管理されている前記アドレスレンジを考慮してデータ格納のためにストレージ媒体の種類を選択し、前記ファイルの前記データを格納するために、前記少なくとも1つの第1の記憶領域または前記第2の記憶領域の内の1つにおける格納位置を選択し、前記選択された格納位置に前記ファイルの前記データおよび前記メタデータを格納することで、前記メタデータおよびデータが、前記少なくとも1つの第1種のストレージ媒体と前記少なくとも1つの第2種のストレージ媒体とに跨って格納されないように、前記論理装置に前記メタデータおよびデータを格納する工程と、
    を備える、方法。
  13. 請求項12に記載の方法であって、ファイルの前記書き込み要求を前記クライアントコンピュータから受信した時に、データ格納のためにストレージ媒体の種類を選択する工程を備え、第1種が選択された場合、メタデータおよびデータの両方が、前記少なくとも1つの第1種のストレージ媒体に格納される、方法。
  14. 請求項12に記載の方法であって、前記少なくとも1つの第1種のストレージ媒体から前記少なくとも1つの第2種のストレージ媒体に前記データを移動する時に、前記少なくとも1つの第2種の記憶領域にメタデータを作成する工程を備える、方法。
JP2005265093A 2005-09-13 2005-09-13 ファイルシステムの構築方法 Expired - Fee Related JP4704161B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2005265093A JP4704161B2 (ja) 2005-09-13 2005-09-13 ファイルシステムの構築方法
US11/266,206 US7849282B2 (en) 2005-09-13 2005-11-04 Filesystem building method
US12/960,982 US8078819B2 (en) 2005-09-13 2010-12-06 Arrangements for managing metadata of an integrated logical unit including differing types of storage media
US13/316,883 US8392685B2 (en) 2005-09-13 2011-12-12 Arrangements for managing metadata of an integrated logical unit including differing types of storage media

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005265093A JP4704161B2 (ja) 2005-09-13 2005-09-13 ファイルシステムの構築方法

Publications (3)

Publication Number Publication Date
JP2007079774A JP2007079774A (ja) 2007-03-29
JP2007079774A5 JP2007079774A5 (ja) 2008-06-19
JP4704161B2 true JP4704161B2 (ja) 2011-06-15

Family

ID=37856658

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005265093A Expired - Fee Related JP4704161B2 (ja) 2005-09-13 2005-09-13 ファイルシステムの構築方法

Country Status (2)

Country Link
US (3) US7849282B2 (ja)
JP (1) JP4704161B2 (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8346729B2 (en) * 2006-11-18 2013-01-01 International Business Machines Corporation Business-semantic-aware information lifecycle management
JP2009026091A (ja) * 2007-07-20 2009-02-05 Fujitsu Ltd 接続管理プログラム、接続管理方法および情報処理装置
US8055864B2 (en) * 2007-08-06 2011-11-08 International Business Machines Corporation Efficient hierarchical storage management of a file system with snapshots
US7899850B2 (en) 2008-02-22 2011-03-01 Bycast, Inc. Relational objects for the optimized management of fixed-content storage systems
US8245124B1 (en) * 2008-03-20 2012-08-14 Adobe Systems Incorporated Content modification and metadata
JP5248912B2 (ja) * 2008-05-12 2013-07-31 株式会社日立製作所 サーバ計算機、計算機システムおよびファイル管理方法
US8898267B2 (en) * 2009-01-19 2014-11-25 Netapp, Inc. Modifying information lifecycle management rules in a distributed system
US8195878B2 (en) * 2009-02-19 2012-06-05 Pmc-Sierra, Inc. Hard disk drive with attached solid state drive cache
JP5331555B2 (ja) * 2009-04-23 2013-10-30 株式会社日立製作所 データ移行システムおよびデータ移行方法
US8396832B2 (en) * 2010-12-08 2013-03-12 International Business Machines Corporation Independent fileset generations in a clustered redirect-on-write filesystem
US8904006B2 (en) 2010-12-08 2014-12-02 International Business Machines Corporation In-flight block map for a clustered redirect-on-write filesystem
US8458181B2 (en) 2010-12-08 2013-06-04 International Business Machines Corporation Distributed free block map for a clustered redirect-on-write file system
US8825724B2 (en) * 2012-03-29 2014-09-02 Lsi Corporation File system hinting
US11347443B2 (en) * 2012-04-13 2022-05-31 Veritas Technologies Llc Multi-tier storage using multiple file sets
US10073851B2 (en) * 2013-01-08 2018-09-11 Apple Inc. Fast new file creation cache
US9335949B1 (en) * 2013-02-25 2016-05-10 Netapp, Inc. System and method for deferring invalidation of inodes of a volume during volume invalidation
US9348532B1 (en) * 2013-02-25 2016-05-24 Netapp, Inc. System and method for invalidation walk-through of inodes
WO2014203397A1 (ja) * 2013-06-21 2014-12-24 株式会社日立製作所 計算機システム、メタデータ管理方法及びプログラム
US20160006829A1 (en) * 2013-10-02 2016-01-07 Hitachi, Ltd. Data management system and data management method
JP6231700B2 (ja) * 2014-11-06 2017-11-15 株式会社日立製作所 サーバストレージシステムと管理システムを有する計算機システム
JP6037469B2 (ja) * 2014-11-19 2016-12-07 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報管理システム、情報管理方法およびプログラム
JP6604115B2 (ja) 2015-09-25 2019-11-13 富士通株式会社 ストレージ装置およびストレージ制御プログラム
US10362146B1 (en) * 2015-09-30 2019-07-23 Open Text Corporation Method and system for enforcing governance across multiple content repositories using a content broker
US10942844B2 (en) 2016-06-10 2021-03-09 Apple Inc. Reserved memory in memory management system
CA3080203A1 (en) * 2017-10-26 2019-05-02 Urflash Llc Media storage device including multiple partitions
JP7433843B2 (ja) * 2019-11-05 2024-02-20 株式会社ソニー・インタラクティブエンタテインメント 情報処理装置およびファイル生成方法
JP7348815B2 (ja) 2019-11-14 2023-09-21 株式会社ソニー・インタラクティブエンタテインメント 情報処理装置およびファイル記録方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001075858A (ja) * 1999-07-06 2001-03-23 Matsushita Electric Ind Co Ltd リアルタイム分散型ファイルシステム
JP2002082775A (ja) * 2000-07-06 2002-03-22 Hitachi Ltd 計算機システム
JP2003516582A (ja) * 1999-12-07 2003-05-13 データ ファウンデイション、インコーポレイテッド スケーラブルな記憶アーキテクチャ
JP2003256144A (ja) * 2002-02-28 2003-09-10 Hitachi Ltd 記憶装置
JP2004145901A (ja) * 1998-12-22 2004-05-20 Hitachi Ltd 記憶装置システム
JP2004178289A (ja) * 2002-11-27 2004-06-24 Hitachi Ltd スナップショット取得方法、ディスク装置及びストレージシステム
JP2004234558A (ja) * 2003-01-31 2004-08-19 Hitachi Ltd 記憶デバイス制御装置、及びプログラム
JP2005050024A (ja) * 2003-07-31 2005-02-24 Toshiba Corp 計算機システムおよびプログラム
JP2005228170A (ja) * 2004-02-16 2005-08-25 Hitachi Ltd 記憶装置システム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6438642B1 (en) * 1999-05-18 2002-08-20 Kom Networks Inc. File-based virtual storage file system, method and computer program product for automated file management on multiple file system storage devices
US6895418B1 (en) * 1999-04-28 2005-05-17 Emc Corporation Versatile indirection in an extent based file system
US6556998B1 (en) * 2000-05-04 2003-04-29 Matsushita Electric Industrial Co., Ltd. Real-time distributed file system
AU2002312508B2 (en) * 2000-09-11 2008-01-17 Agami Systems, Inc. Storage system having partitioned migratable metadata
US8442957B2 (en) 2001-09-26 2013-05-14 Emc Corporation Efficient management of large files
US20040122917A1 (en) * 2002-12-18 2004-06-24 Menon Jaishankar Moothedath Distributed storage system for data-sharing among client computers running defferent operating system types
JP2004265110A (ja) * 2003-02-28 2004-09-24 Hitachi Ltd メタデータ配置方法、プログラムおよびディスク装置
US20040225659A1 (en) * 2003-05-09 2004-11-11 O'brien John Storage foundry
US7243089B2 (en) * 2003-11-25 2007-07-10 International Business Machines Corporation System, method, and service for federating and optionally migrating a local file system into a distributed file system while preserving local access to existing data
US7454406B2 (en) * 2005-04-29 2008-11-18 Adaptec, Inc. System and method of handling file metadata

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004145901A (ja) * 1998-12-22 2004-05-20 Hitachi Ltd 記憶装置システム
JP2001075858A (ja) * 1999-07-06 2001-03-23 Matsushita Electric Ind Co Ltd リアルタイム分散型ファイルシステム
JP2003516582A (ja) * 1999-12-07 2003-05-13 データ ファウンデイション、インコーポレイテッド スケーラブルな記憶アーキテクチャ
JP2002082775A (ja) * 2000-07-06 2002-03-22 Hitachi Ltd 計算機システム
JP2003256144A (ja) * 2002-02-28 2003-09-10 Hitachi Ltd 記憶装置
JP2004178289A (ja) * 2002-11-27 2004-06-24 Hitachi Ltd スナップショット取得方法、ディスク装置及びストレージシステム
JP2004234558A (ja) * 2003-01-31 2004-08-19 Hitachi Ltd 記憶デバイス制御装置、及びプログラム
JP2005050024A (ja) * 2003-07-31 2005-02-24 Toshiba Corp 計算機システムおよびプログラム
JP2005228170A (ja) * 2004-02-16 2005-08-25 Hitachi Ltd 記憶装置システム

Also Published As

Publication number Publication date
US20120084529A1 (en) 2012-04-05
US8078819B2 (en) 2011-12-13
US20110078220A1 (en) 2011-03-31
US20070061539A1 (en) 2007-03-15
JP2007079774A (ja) 2007-03-29
US7849282B2 (en) 2010-12-07
US8392685B2 (en) 2013-03-05

Similar Documents

Publication Publication Date Title
JP4704161B2 (ja) ファイルシステムの構築方法
US9747036B2 (en) Tiered storage device providing for migration of prioritized application specific data responsive to frequently referenced data
JP4824374B2 (ja) ディスクの回転を制御するシステム
US6883073B2 (en) Virtualized volume snapshot formation method
JP4799936B2 (ja) 条件別スナップショット取得方法及びシステム
JP4943081B2 (ja) ファイル格納制御装置及び方法
JP5775177B2 (ja) クローンファイル作成方法と、それを用いたファイルシステム
JP4949088B2 (ja) 階層型ストレージシステム間でのリモートミラー方式
US20060047926A1 (en) Managing multiple snapshot copies of data
JP4464378B2 (ja) 同一データを纏める事で格納領域を節約する計算機システム、ストレージシステム及びそれらの制御方法
US9122415B2 (en) Storage system using real data storage area dynamic allocation method
US20060174075A1 (en) Method for creating and preserving snapshots in a storage system
US8135918B1 (en) Data de-duplication for iSCSI
US20080320258A1 (en) Snapshot reset method and apparatus
US20050216532A1 (en) System and method for file migration
JP2006146904A (ja) ストレージシステムでオブジェクトレベルのスナップショットを生成するシステムと方法
EP1637987A2 (en) Operation environment associating data migration method
JP2008269374A (ja) ストレージシステムおよびその制御方法
JP4779012B2 (ja) 瞬時ボリューム復元のためのオン・デマンドでデータを復元するシステム、および方法
JP2009064160A (ja) 計算機システム、管理計算機及びデータ管理方法
JP2009064159A (ja) 計算機システム、管理計算機及びデータ管理方法
JP4394467B2 (ja) ストレージシステム、サーバ装置及び先行コピーデータ生成方法
KR101099130B1 (ko) 가상볼륨 저장관리 시스템
US20050289318A1 (en) Information processing system and control method thereof
WO2011158280A1 (en) Storage apparatus, storage system

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080425

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080425

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110105

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110221

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110308

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110309

LAPS Cancellation because of no payment of annual fees